KR101606635B1 - 에포틸론 발현 카세트 및 이의 용도 - Google Patents

에포틸론 발현 카세트 및 이의 용도 Download PDF

Info

Publication number
KR101606635B1
KR101606635B1 KR1020140067238A KR20140067238A KR101606635B1 KR 101606635 B1 KR101606635 B1 KR 101606635B1 KR 1020140067238 A KR1020140067238 A KR 1020140067238A KR 20140067238 A KR20140067238 A KR 20140067238A KR 101606635 B1 KR101606635 B1 KR 101606635B1
Authority
KR
South Korea
Prior art keywords
seq
epothilone
vector
expression cassette
genes
Prior art date
Application number
KR1020140067238A
Other languages
English (en)
Other versions
KR20150139149A (ko
Inventor
윤여준
박한오
정소선
송재경
김응수
김은지
나지혜
Original Assignee
이화여자대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이화여자대학교 산학협력단 filed Critical 이화여자대학교 산학협력단
Priority to KR1020140067238A priority Critical patent/KR101606635B1/ko
Publication of KR20150139149A publication Critical patent/KR20150139149A/ko
Application granted granted Critical
Publication of KR101606635B1 publication Critical patent/KR101606635B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/76Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Actinomyces; for Streptomyces
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/16Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing two or more hetero rings
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/33Heterocyclic compounds
    • A61K31/395Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins
    • A61K31/41Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins having five-membered rings with two or more ring hetero atoms, at least one of which being nitrogen, e.g. tetrazole
    • A61K31/425Thiazoles
    • A61K31/427Thiazoles not condensed and containing further heterocyclic rings
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D417/00Heterocyclic compounds containing two or more hetero rings, at least one ring having nitrogen and sulfur atoms as the only ring hetero atoms, not provided for by group C07D415/00
    • C07D417/02Heterocyclic compounds containing two or more hetero rings, at least one ring having nitrogen and sulfur atoms as the only ring hetero atoms, not provided for by group C07D415/00 containing two hetero rings
    • C07D417/06Heterocyclic compounds containing two or more hetero rings, at least one ring having nitrogen and sulfur atoms as the only ring hetero atoms, not provided for by group C07D415/00 containing two hetero rings linked by a carbon chain containing only aliphatic carbon atoms

Abstract

본 발명은 스트렙토마이시스 베네주엘래(Streptomyces venezuelae)에 코돈 최적화된 에포틸론 생합성 유전자와 유전자간 영역(intergenic region)을 포함하는 에포틸론 발현 카세트, 이를 포함하는 에포틸론 발현용 벡터, 및 이를 이용한 에포틸론의 제조방법에 관한 것으로, 본 발명에 따른 에포틸론 발현 카세트 및 발현용 벡터는 생장속도가 빠르고, 유전자 조작이 용이한 이종숙주 스트렙토마이시스 베네주엘래에 도입할 수 있어, 단시간 동안 높은 수율로 에포틸론을 생산할 수 있으며, 본 발명에 따른 에포틸론의 생산방법에 의하여 생산된 에포틸론은 항암물질으로 유용하게 사용할 수 있다.

Description

에포틸론 발현 카세트 및 이의 용도 {EXPRESSION CASSETTES AND THEIR USE}
본 발명은 스트렙토마이시스 베네주엘래(Streptomyces venezuelae)에 코돈 최적화된 에포틸론 생합성 유전자와 유전자간 영역(intergenic region)을 포함하는 에포틸론 발현 카세트, 이를 포함하는 에포틸론 발현용 벡터, 및 이를 이용한 에포틸론의 제조방법에 관한 것이다.
식물 및 미생물 등에서 생산되는 폴리케타이드(polyketide) 계열의 화합물은 복잡한 구조의 천연 화합물(natural product)로서, 현재까지 약 10,000 가지 이상의 화합물이 알려져 있다. 그 중 에포틸론은 16환계 폴리케타이드 매크로락톤(16-membered polyketide macrolactone)의 일종으로 항암 화학요법제인 탁솔(Taxol)과 유사하게 튜불린(tubulin)에 결합하여 미세소관(microtubule)의 분해를 억제하는 강력한 항암제이다.
에포틸론 B로부터 반합성 되는 익사베필론(성분명: Ixabepilone, 상품명: Ixampra, Bristol-Myers Squibb)은 2007년 하반기에 유방암의 치료제로 FDA의 승인을 얻었다. 특히 안트라사이클린계(anthracycline)와 탁산계(taxane) 치료에 내성이 생겼거나, 또는 탁산계에 내성이 있고 더 이상의 안트라사이클린계 치료가 금기인 전이성 유방암 또는 국소 진행성 유방암의 치료에 사용이 가능하다. 또한 익사베필론은 탁솔과 다르게 부작용을 유발하는 가용화제(solubilizing agent) 없이 제형화할 수 있으며, 통상적인 화학 치료법(chemotherapy)에 내성이 있는 암세포에 강한 항암 작용을 보이는 장점이 있어 차세대 항암제로 대두되고 있다.
에포틸론의 생산은 믹소박테리움(myxobacterium)인 소란지움 셀룰로섬(Sorangium cellulosum)에 의해 생산되는 이차대사산물로써 분리되었으나, 16시간에 이르는 긴 생장시간(doubling time)과 유전자 조작의 어려움으로 인하여 그 산업적 생산을 위한 유용성이 떨어지는 문제점이 있다.
한편, 경제적산업적 가치가 매우 높으나 목적하는 이차대사산물의 대량생산에 기술적 어려움이 있는 경우, 현재의 화학합성을 대체할 수 있는 효율적 방안 중 하나로 대량 생산하고자 하는 이차대사산물의 생합성 유전자집단을 자연생산 생물체로부터 확보하고, 이를 최적화된 이종숙주에서 발현하는 이중숙주 생산시스템(heterologous expression system)이 연구되고 있다. 미국 및 독일의 연구팀에서 이중숙주 생산시스템을 이용하여 스트렙토마이시스 실리칼라(Streptomyces coelicolor), 믹소코쿠스 잔서스(Myxococcus xanthus), 에스케리치아 콜라이(Escherichia coli), 그리고 스트렙토마이시스 베네주엘래에서 에포틸론의 생합성을 시도하여 왔다. 독일 Rolf Mller 연구팀에서는 에포틸론 생합성 유전자를 최적화하여 합성한 후 믹소코쿠스 잔서스에서 발현하는 기술(Oβwald C et al., ACS Synth Biol., 2012. 10)을 보고한 바 있다.
또한, 본 발명자들은 방선균 중 스트렙토마이시스 베네주엘래(Streptomyces venezuelae)에서의 에포틸론 생산방법에 대하여 출원한 바 있다(한국 특허등록 제 10-0949313호). 그러나 상기 발명들은 에포틸론 B의 경우 약 0.1㎍/L, 에포틸론 D의 경우 약 0.4㎍/L의 수율을 나타내어, 에포틸론을 산업 수요에 맞추어 생산할 만큼 수율이 높지 않다는 문제가 있었는바, 에포틸론의 생산 효율을 높이기 위한 기술이 여전히 요구되고 있다.
이러한 배경 하에, 본 발명자들은 유용한 항암물질인 에포틸론의 수율을 높이는 방법을 개발하고자 예의 연구 노력한 결과, 에포틸론 생합성 유전자집단을 이종숙주 스트렙토마이시스 베네주엘래(Streptomyces venezuelae)에 적합하도록 최적화하여 합성하고, 상기 합성된 유전자 사이에 소란지움 셀룰로섬 유래, 또는 스트렙토마이시스 베네주엘래의 피크로마이신(pikromycin) 또는 데소사민(desosamin) 생합성 유전자 집단 유래의 유전자간 영역(intergenic region)을 삽입한 발현 카세트를 포함하는 벡터를 스트렙토마이시스 베네주엘래에 도입할 경우 에포틸론의 수율을 현저히 향상시킴을 확인하고 본 발명을 완성하였다.
본 발명의 하나의 목적은 스트렙토마이시스 베네주엘래(Streptomyces venezuelae)에 코돈 최적화된 에포틸론 생합성 유전자인 epoA(서열번호 1), epoP(서열번호 2), epoB(서열번호 3), 및 epoC(서열번호 4)와, 소란지움 셀룰로섬(Sorangium cellulosum)에서 유래한 유전자간 영역(intergenic region)을 포함하는 에포틸론 발현 카세트를 제공하는 것이다.
본 발명의 하나의 목적은 스트렙토마이시스 베네주엘래에 코돈 최적화된 에포틸론 생합성 유전자인 epoD(서열번호 5), epoE(서열번호 6), epoF(서열번호 7), orf6(서열번호 8), orf3(서열번호 9), 및 orf14(서열번호 10)와, 소란지움 셀룰로섬에서 유래한 유전자간 영역을 포함하는 에포틸론 발현 카세트를 제공하는 것이다.
본 발명의 하나의 목적은 스트렙토마이시스 베네주엘래에 코돈 최적화된 에포틸론 생합성 유전자인 epoA, epoP, epoB, 및 epoC와, 스트렙토마이시스 베네주엘래의 피크로마이신(pikromycin) 또는 데소사민(desosamin) 생합성 유전자 집단에서 유래한 유전자간 영역을 포함하는 에포틸론 발현 카세트를 제공하는 것이다.
본 발명의 하나의 목적은 스트렙토마이시스 베네주엘래에 코돈 최적화된 에포틸론 생합성 유전자인 epoD, epoE, epoF, orf6, orf3, 및 orf14와, 스트렙토마이시스 베네주엘래의 피크로마이신 또는 데소사민 생합성 유전자 집단에서 유래한 유전자간 영역을 포함하는 에포틸론 발현 카세트를 제공하는 것이다.
본 발명의 하나의 목적은 스트렙토마이시스 베네주엘래에 코돈 최적화된 에포틸론 생합성 유전자인 epoA(서열번호 1), epoP(서열번호 2), epoB(서열번호 3), epoC(서열번호 4), epoD(서열번호 5), epoE(서열번호 6), epoF(서열번호 7), orf6(서열번호 8), orf3(서열번호 9), 및 orf14(서열번호 10)와, 스트렙토마이시스 베네주엘래의 피크로마이신 또는 데소사민 생합성 유전자 집단에서 유래한 유전자간 영역을 포함하는 에포틸론 발현 카세트를 제공하는 것이다.
본 발명의 다른 목적은 상기 에포틸론 발현 카세트를 포함하는, 에포틸론 발현용 벡터를 제공하는 것이다.
본 발명의 또 다른 목적은 상기 에포틸론 발현용 벡터가 하나 이상 도입된 스트렙토마이시스 베네주엘래를 배양하는 단계를 포함하는, 에포틸론 A, B, C, 및 D을 포함하는 군에서 선택되는 어느 하나 이상의 에포틸론의 제조방법을 제공하는 것이다.
상기의 목적을 달성하기 위한 하나의 양태로서, 본 발명은 스트렙토마이시스 베네주엘래(Streptomyces venezuelae)에 코돈 최적화된 에포틸론 생합성 유전자와, 하나 이상의 유전자간 영역(intergenic region)을 포함하는 에포틸론 발현 카세트를 제공한다.
본 발명에서 용어, "에포틸론"은 메틸티아졸(methylthiazole)기가 올레핀 결합(olefinic bond)에 의하여 결합된 16환계 폴리케타이드 매크로락톤(polyketide macrolactone)의 일종으로, 저성장(low-growing) 믹소박테리움(myxobacterium)인 소란지움 셀룰로섬에 의해 생산되는 이차 대사산물로써 최초 분리되었다. 상기 에포틸론은 하기 화학식 1로 표시되며 R이 H인 에포틸론 A, 하기 화학식 1로 표시되며 R이 CH3인 에포틸론 B, 하기 화학식 2로 표시되며 R이 H인 에포틸론 C, 하기 화학식 2로 표시되며 R이 CH3인 에포틸론 D를 포함할 수 있다. 에포틸론 C와 D는 에포틸론 A와 B의 생합성 초기단계의 중간물질이다.
Figure 112014052317142-pat00001
Figure 112014052317142-pat00002
본 발명의 에포틸론은, 에포틸론의 유사체, 유도체, 익사베필론을 포함하는 의미로 사용될 수 있다.
상기 에포틸론은 튜불린 중합 에세이에서 항종양 활성을 가지는 것으로 보고되었으며(Bollag, D. et al., Cancer Res., 55:2325, 1995), 탁솔이나 탁소텔 등의 항암제처럼 미세소관(microtubule)을 안정화시키고 세포 분열을 억제함으로써 암 세포의 증식을 막는 것으로 알려져 있는 유용한 의약품의 원료이다.
본 발명에서 용어, "발현 카세트"란, 에포틸론 생합성 유전자를 포함하고 있어서 에포틸론을 발현시킬 수 있는 단위 카세트를 의미한다. 또한, 본 발명에서 발현 카세트는 발현구조체와 혼용될 수 있다. 본 발명에 따른 발현 카세트는 본 발명의 목적 상, 스트렙토마이시스 베네주엘래에 도입되어 에포틸론을 생산할 수 있다.
본 발명에서 용어, "코돈 최적화(codon optimization)"는 코돈의 숙주에서의 에포틸론 생합성 유전자의 발현을 보다 효율적으로 하기 위하여 유전자의 코돈을 상기 숙주 유전자에서 높은 빈도로 사용되는 코돈으로 치환하는 것을 의미한다.
상기 숙주는 본 발명의 벡터가 도입되어 에포틸론을 제조할 수 있는 세포는 제한 없이 포함되나, 바람직하게는 방선균, 스트렙토마이시스 속이며, 더욱 바람직하게는 스트렙토마이시스 베네주엘래(Streptomyces venezuelae) 또는 스트렙토마이시스 실리칼라(Streptomyces coelicolor)이다. 스트렙토마이시스 베네주엘래와 스트렙토마이시스 실리칼라는 방선균의 일종으로, 스트렙토마이시스 속에 속하는 토양 미생물이며 그람 양성균이다.
상기 에포틸론 생합성 유전자는 바람직하게는 소란지움 셀룰로섬에서 유래한 유전자일 수 있다.
소란지움 셀룰로섬은 기존에 에포틸론을 생산하는 점액 세균으로 이용되어 왔다. 그러나 소란지움 셀룰로섬은 에포틸론의 수율이 낮을 뿐만 아니라 생장시간(더블링 타임)이 길며 유전자 조작의 곤란으로 인하여 유용성이 떨어진다는 단점이 있었다. 또한 에포틸론의 유기합성방법이 보고된바 있지만, 합성방법이 복잡하다는 단점이 있다. 최근, 에포틸론 생합성 유전자 클러스터의 규명으로 인하여 대장균(E. coli)에서의 에포틸론의 이종생산이 연구되고 있으나, 생산되는 에포틸론의 양이 채 1㎍/L도 되지 않으며, 낮은 온도에서(15℃) 장기간 배양(6일)이 요구되는 단점이 있었다.
이에 본 발명자들은 에포틸론의 생산수율을 향상시키기 위하여 이종숙주로 스트렙토마이시스 베네주엘래를 사용하고 이종숙주에 코돈 최적화된 에포틸론 생합성 유전자를 포함하는 벡터를 완성하였다.
본 발명의 에포틸론 생합성 유전자는 에포틸론의 생합성에 필요한 epoA , epoP , epoB , epoC , epoD, epoE, epoF, orf6 , orf3 ,orf14으로 이루어진 군에서 선택되는 어느 하나 이상의 유전자를 의미한다. 상기 유전자는 본 발명의 목적 상, 스트렙토마이시스 베네주엘래에 코돈 최적화된 서열로서 서열번호 1로 표시되는 염기서열을 갖는 epoA, 서열번호 2로 표시되는 염기서열을 갖는 epoP, 서열번호 3으로 표시되는 염기서열을 갖는 epoB , 서열번호 4로 표시되는 염기서열을 갖는 epoC , 서열번호 5로 표시되는 염기서열을 갖는 epoD, 서열번호 6로 표시되는 염기서열을 갖는 epoE, 서열번호 7으로 표시되는 염기서열을 갖는 epoF, 서열번호 8로 표시되는 염기서열을 갖는 orf6 , 서열번호 9으로 표시되는 염기서열을 갖는 orf3 , 및 서열번호 10로 표시되는 염기서열을 갖는 orf14이다.
본 발명에서 용어, "유전자간 영역(intergenic region)"은 유전자와 유전자 사이에 위치하는 DNA서열로, 비해독성(noncoding) 부분을 의미한다(Tropp, Burton E. (2008). Molecular Biology: Genes to Proteins). 이는 인트라제닉 영역(intragenic region)인 인트론(intron)과는 차이가 있다. 유전자간 영역은 기능이 없는 것으로 알려져 있을 뿐, 발현 유전자의 특이적인 발현 증대를 위한 유전자간 영역이 어느 부분인지는 전혀 보고된 바 없다.
본 발명자들은 상기 유전자간 영역으로 소란지움 셀룰로섬의 유전자간 영역, 또는 이종숙주로 사용되는 스트렙토마이시스 베네주엘래의 피크로마이신 또는 데소사민 유전자 집단의 유전자간 영역을 사용하여 벡터를 제조한 결과, 에포틸론 유전자의 발현이 매우 향상되어 에포틸론의 수율이 향상됨을 확인하였다.
하나의 구체예로서, 본 발명의 에포틸론 발현 카세트는 스트렙토마이시스 베네주엘래에 코돈 최적화된 에포틸론 생합성 유전자인 epoA(서열번호 1), epoP(서열번호 2), epoB(서열번호 3), 및 epoC(서열번호 4)와, 소란지움 셀룰로섬에서 유래한 유전자간 영역을 포함하는 것일 수 있다.
상기 유전자간 영역은 epoA 유전자의 업스트림에 위치하는 영역(서열번호 11), epoP와 epoB 유전자 사이에 위치하는 영역(서열번호 12), 및 epoC 유전자의 다운스트림에 위치하는 영역(서열번호 13)을 포함하는 군에서 이루어진 어느 하나일 수 있다. 바람직하게는 상기 3개의 모든 영역을 포함할 수 있다.
상기 유전자간 영역을 포함하는 본 발명의 에포틸론 발현 카세트가 pDHS702 벡터에 합성된 벡터 pDHS702-optSoC_APBC_Sv의 개열지도를 도 1a에 도시하였으며, 본 발명의 에포틸론 발현 카세트가 pSBAC벡터에 합성된 벡터 pSBAC-optSoC_APBC_Sv의 개열지도를 도 3a에 도시하였다.
또 하나의 구체예로서, 본 발명의 에포틸론 발현 카세트는 스트렙토마이시스 베네주엘래에 코돈 최적화된 에포틸론 생합성 유전자인 epoD(서열번호 5), epoE(서열번호 6), epoF(서열번호 7), orf6(서열번호 8), orf3(서열번호 9), 및 orf14(서열번호 10)와, 소란지움 셀룰로섬에서 유래한 유전자간 영역을 포함하는 것일 수 있다.
상기 유전자간 영역은 epoD 유전자의 업스트림에 위치하는 영역(서열번호 14), epoD와 epoE 유전자 사이에 위치하는 영역(서열번호 15), epoE와 epoF 유전자 사이에 위치하는 영역(서열번호 16), epoF와 orf6 유전자 사이에 위치하는 영역(서열번호 17), orf6과 orf3 유전자 사이에 위치는 영역(서열번호 18), orf3과 orf14 유전자 사이에 위치하는 영역(서열번호 19), 및 epoC 유전자의 다운스트림에 위치하는 영역(서열번호 20)을 포함하는 군에서 이루어진 어느 하나일 수 있다. 바람직하게는 상기 7개의 모든 영역을 포함할 수 있다.
상기 유전자간 영역을 포함하는 본 발명의 에포틸론 발현 카세트가, pDHS618 벡터에 합성된 벡터 pDHS618-optSoC_DEF_Sv의 개열지도는 도 1b에 도시하였으며, pSBAC 벡터에 합성된 벡터 pSBAC-optSoC_DEF_Sv의 개열지도는 도 3b에 도시하였고, pSET152 벡터에 합성된 벡터 pSET152-optSoC_DEF_Sv의 개열지도는 도 4a에 도시하였다.
또 하나의 구체예로서, 본 발명의 에포틸론 발현 카세트는 스트렙토마이시스 베네주엘래에 코돈 최적화된 에포틸론 생합성 유전자인 epoA(서열번호 1), epoP(서열번호 2), epoB(서열번호 3), 및 epoC(서열번호 4)와, 스트렙토마이시스 베네주엘래의 피크로마이신 또는 데소사민 생합성 유전자 집단에서 유래한 유전자간 영역을 포함하는 것일 수 있다. 스트렙토마이시스 베네주엘래는 PKS 유전자 클러스터로부터 항생제로 사용되는 피크로마이신을 생산하며 PKS는 6개의 모듈로 구성되어 있다. 본 발명자들은 유전자간 영역을 이종숙주인 스트렙토마이시스 베네주엘래가 본래 보유하고 있는 것으로서, 피크로마이신 또는 데소사민 생합성 유전자 집단에서 유래한 유전자간 영역을 벡터에 도입한 결과, 에포틸론의 생합성 수율이 향상됨을 확인하였다. 바람직하게 상기 유전자간 영역은 epoP와 epoB 유전자 사이에 위치하는 영역(서열번호 21), 및 epoC 유전자의 다운스트림에 위치하는 영역(서열번호 22)을 포함하는 군에서 이루어진 어느 하나일 수 있다. 바람직하게는 상기 2개의 모든 영역을 포함할 수 있다.
상기 유전자간 영역을 포함하는 본 발명의 에포틸론 발현 카세트가, pDHS702 벡터에 합성된 벡터 pDHS702-optPD_APBC_Sv의 개열지도는 도 2a에 도시하였다.
또 하나의 구체예로서, 본 발명의 에포틸론 발현 카세트는 스트렙토마이시스 베네주엘래에 코돈 최적화된 에포틸론 생합성 유전자인 epoD(서열번호 5), epoE(서열번호 6), epoF(서열번호 7), orf6(서열번호 8), orf3(서열번호 9), 및 orf14(서열번호 10)와, 스트렙토마이시스 베네주엘래의 피크로마이신 또는 데소사민 생합성 유전자 집단에서 유래한 유전자간 영역을 포함하는 것일 수 있다.
상기 유전자간 영역은 epoD와 epoE 유전자 사이에 위치하는 영역(서열번호 23), epoE와 epoF 유전자 사이에 위치하는 영역(서열번호 24), epoF와 orf6 유전자 사이에 위치하는 영역(서열번호 25), orf6과 orf3 유전자 사이에 위치하는 영역(서열번호 26), orf3과 orf14 유전자 사이에 위치하는 영역(서열번호 27), 및 orf14 유전자의 다운스트림에 위치하는 영역(서열번호 28)을 포함하는 군에서 이루어진 어느 하나일 수 있다. 바람직하게는 상기 6개의 모든 영역을 포함할 수 있다.
상기 유전자간 영역을 포함하는 본 발명의 에포틸론 발현 카세트가, pDHS618 벡터에 합성된 벡터 pDHS618-optPD_DEF_Sv의 개열지도는 도 2b에 도시하였고, 본 발명의 에포틸론 발현 카세트가, pSET152 벡터에 합성된 벡터 pSET152-optPD_DEF_Sv의 개열지도는 도 4b에 도시하였다.
또 하나의 구체예로서, 본 발명의 에포틸론 발현 카세트는 스트렙토마이시스 베네주엘래에 코돈 최적화된 에포틸론 생합성 유전자인 epoA(서열번호 1), epoP(서열번호 2), epoB(서열번호 3), epoC(서열번호 4), epoD(서열번호 5), epoE(서열번호 6), epoF(서열번호 7), orf6(서열번호 8), orf3(서열번호 9), 및 orf14(서열번호 10)와, 스트렙토마이시스 베네주엘래의 피크로마이신 또는 데소사민 생합성 유전자 집단에서 유래한 유전자간 영역을 포함하는 것일 수 있다.
상기 유전자간 영역은 epoP와 epoB 유전자 사이에 위치하는 영역(서열번호 21), epoC 유전자의 다운스트림에 위치하는 영역(서열번호 22), epoD와 epoE 유전자 사이에 위치하는 영역(서열번호 23), epoE와 epoF 유전자 사이에 위치하는 영역(서열번호 24), epoF와 orf6 유전자 사이에 위치하는 영역(서열번호 25), orf6과 orf3 유전자 사이에 위치하는 영역(서열번호 26), orf3과 orf14 유전자 사이에 위치하는 영역(서열번호 27), 및 orf14 유전자의 다운스트림에 위치하는 영역(서열번호 28)을 포함할 수 있다.
상기 유전자간 영역을 포함하는 본 발명의 에포틸론 발현 카세트가, pSBAC 벡터에 합성된 벡터 pSBAC-optPD_APBCDEF_Sv의 개열지도는 도 3c에 도시하였다.
또 하나의 양태로서, 본 발명은 상기 에포틸론 발현 카세트를 포함하는, 에포틸론 발현용 벡터를 제공한다.
본 발명에서 용어, "벡터"는 숙주세포에 DNA를 도입하여 에포틸론을 미생물에서 효율적으로 발현시키기 위한 수단으로서, 상기 벡터의 제작 시에는 에포틸론 생합성 유전자뿐만 아니라, 에포틸론을 생산하고자 하는 숙주세포의 종류에 따라 프로모터(promoter), 종결자(terminator), 인핸서(inhancer) 등과 같은 발현 조절 서열, 막 표적화 또는 분비를 위한 서열 등을 적절히 선택하고 목적에 따라 다양하게 조합할 수 있다.
상기 에포틸론 발현 카세트가 벡터에 포함되는 방법은 특별히 제한되지 아니하며 당해 기술 분야에서 통상적으로 사용되는 방법이라면 어느 것이든 사용할 수 있다.
상기 벡터는 pDHS702, pDHS618, pSBAC, 및 pSET152로 이루어지는 군에서 선택되는 어느 하나의 벡터에 합성된 것일 수 있다.
상기 pDHS702 벡터에 합성되는 벡터는 pDHS702-optSoC_APBC_Sv 또는 pDHS702-optPD_APBC_Sv일 수 있다. 또 다른 구체예로서, 상기 pDHS618 벡터에 합성되는 벡터는 pDHS618-optSoC_DEF_Sv 또는 pDHS618-optPD_DEF_Sv일 수 있다. 상기 벡터 pSBAC에 합성되는 벡터는 pSBAC-optSoC_APBC_Sv, pSBAC-optSoC_DEF_Sv, 또는 pSBAC-optPD_APBCDEF_Sv일 수 있다. 상기 pSET152 벡터에 합성되는 벡터는 pSET152-optSoC_DEF_Sv 또는 pSET152-optPD_DEF_Sv 일 수 있다.
하나의 구체예로서, 본 발명의 벡터는 pDHS702-optSoC_APBC_Sv일 수 있다. 상기 벡터 pDHS702-optSoC_APBC_Sv는 pikA Ⅰ 프로모터를 사용하는 pDHS702 벡터에 합성할 수 있다. 상기 벡터는 코돈 최적화된 에포틸론 생합성 유전자를 포함하며, 상기 유전자는 바람직하게는 서열번호 1로 표시되는 염기서열을 갖는 epoA, 서열번호 2로 표시되는 염기서열을 갖는 epoP, 서열번호 3으로 표시되는 염기서열을 갖는 epoB, 및 서열번호 4로 표시되는 염기서열을 갖는 epoC를 포함한다. 상기 벡터는 유전자간 영역을 하나 이상 포함하며, 상기 유전자간 영역은 epoA 유전자의 업스트림, 즉 프로모터와 epoA 유전자 사이에 위치하는 영역(서열번호 11), epoP와 epoB 유전자 사이에 위치하는 영역(서열번호 12), 및 epoC 유전자의 다운스트림에 위치하는 영역(서열번호 13) 중 어느 하나 이상을 포함할 수 있다. 바람직하게는 상기 3개의 영역을 모두 포함할 수 있다. 상기 벡터 pDHS702-optSoC_APBC_Sv의 개열지도를 도 1a에 도시하였다. 본 발명자들은 상기 벡터 pDHS702-optSoC_APBC_Sv를 스트렙토마이시스 베네주엘래에 도입하여 배양한 결과, 에포틸론 A, B, C, D의 발현이 향상됨을 확인하였다.
다른 구체예로서, 본 발명의 벡터는 pDHS618-optSoC_DEF_Sv일 수 있다. 상기 벡터 pDHS618-optSoC_DEF_Sv는 pikA Ⅰ 프로모터를 사용하는 pDHS618 벡터에 합성할 수 있다. 상기 벡터는 코돈 최적화된 에포틸론 생합성 유전자를 포함하며, 상기 유전자는 바람직하게는 epoD(서열번호 5), epoE(서열번호 6), epoF(서열번호 7), orf6(서열번호 8), orf3(서열번호 9), 및 orf14(서열번호 10)를 포함한다. 상기 벡터는 유전자간 영역을 하나 이상 포함하며, 상기 유전자간 영역은 epoD 유전자의 업스트림에 위치하는 영역(서열번호 14), epoD와 epoE 유전자 사이에 위치하는 영역(서열번호 15), epoE와 epoF 유전자 사이에 위치하는 영역(서열번호 16), epoF와 orf6 유전자 사이에 위치하는 영역(서열번호 17), orf6과 orf3 유전자 사이에 위치는 영역(서열번호 18), orf3과 orf14 유전자 사이에 위치하는 영역(서열번호 19), 및 epoC 유전자의 다운스트림에 위치하는 영역(서열번호 20) 중 어느 하나 이상을 포함할 수 있다. 바람직하게는 상기 7개의 영역을 모두 포함할 수 있다. 상기 벡터 pDHS618-optSoC_DEF_Sv의 개열지도를 도 1b에 도시하였다. 본 발명자들은 상기 벡터 pDHS618-optSoC_DEF_Sv를 스트렙토마이시스 베네주엘래에 도입하여 배양한 결과, 에포틸론 A, B, C, D의 발현이 향상됨을 확인하였다.
또 다른 구체예로서, 본 발명의 벡터는 pDHS702-optPD_APBC_Sv일 수 있다. 상기 벡터 pDHS702-optPD_APBC_Sv는 pikA Ⅰ 프로모터를 사용하는 pDHS702 벡터에 합성할 수 있다. 상기 벡터는 코돈 최적화된 에포틸론 생합성 유전자를 포함하며, 상기 유전자는 바람직하게는 서열번호 1로 표시되는 염기서열을 갖는 epoA, 서열번호 2로 표시되는 염기서열을 갖는 epoP, 서열번호 3으로 표시되는 염기서열을 갖는 epoB , 및 서열번호 4로 표시되는 염기서열을 갖는 epoC를 포함한다. 상기 벡터는 유전자간 영역을 하나 이상 포함하며, 상기 유전자간 영역은 epoP와 epoB 유전자 사이에 위치하는 영역(서열번호 21), 및 epoC 유전자의 다운스트림에 위치하는 영역(서열번호 22) 중 어느 하나 이상을 포함할 수 있다. 바람직하게는 상기 3개의 영역을 모두 포함할 수 있다. 상기 벡터 pDHS702-optPD_APBC_Sv의 개열지도를 도 2a에 도시하였다. 본 발명자들은 상기 벡터 pDHS702-optPD_APBC_Sv를 스트렙토마이시스 베네주엘래에 도입하여 배양한 결과, 에포틸론 A, B, C, D의 발현이 향상됨을 확인하였다.
또 다른 구체예로서, 본 발명의 벡터는 pDHS618-optPD_DEF_Sv일 수 있다. 상기 벡터 pDHS618-optPD_DEF_Sv는 pikA Ⅰ 프로모터를 사용하는 pDHS618 벡터에 합성할 수 있다. 상기 벡터는 코돈 최적화된 에포틸론 생합성 유전자를 포함하며, 상기 유전자는 바람직하게는 epoD(서열번호 5), epoE(서열번호 6), epoF(서열번호 7), orf6(서열번호 8), orf3(서열번호 9), 및 orf14(서열번호 10)를 포함한다. 상기 벡터는 유전자간 영역을 하나 이상 포함하며, 상기 유전자간 영역은 epoD와 epoE 유전자 사이에 위치하는 영역(서열번호 23), epoE와 epoF 유전자 사이에 위치하는 영역(서열번호 24), epoF와 orf6 유전자 사이에 위치하는 영역(서열번호 25), orf6과 orf3 유전자 사이에 위치하는 영역(서열번호 26), orf3과 orf14 유전자 사이에 위치하는 영역(서열번호 27), 및 orf14 유전자의 다운스트림에 위치하는 영역(서열번호 28) 중 어느 하나 이상을 포함할 수 있다. 바람직하게는 상기 3개의 영역을 모두 포함할 수 있다. 상기 벡터 pDHS618-optPD_DEF_Sv의 개열지도를 도 2b에 도시하였다. 본 발명자들은 상기 벡터 pDHS618-optPD_DEF_Sv를 스트렙토마이시스 베네주엘래에 도입하여 배양한 결과, 에포틸론 A, B, C, D의 발현이 향상됨을 확인하였다.
또 다른 구체예로서, 본 발명의 벡터는 pSBAC-optSoC_APBC_Sv일 수 있다. 상기 벡터 pSBAC-optSoC_APBC_Sv는 pikA Ⅰ 프로모터를 사용하는 pSBAC 벡터에 합성할 수 있다. 상기 벡터는 코돈 최적화된 에포틸론 생합성 유전자를 포함하며, 상기 유전자는 바람직하게는 서열번호 1로 표시되는 염기서열을 갖는 epoA, 서열번호 2로 표시되는 염기서열을 갖는 epoP, 서열번호 3으로 표시되는 염기서열을 갖는 epoB , 및 서열번호 4로 표시되는 염기서열을 갖는 epoC를 포함한다. 상기 벡터는 유전자간 영역을 하나 이상 포함하며, 상기 유전자간 영역은 epoA 유전자의 업스트림, 즉 프로모터와 epoA 유전자 사이에 위치하는 영역(서열번호 11), epoP와 epoB 유전자 사이에 위치하는 영역(서열번호 12), 및 epoC 유전자의 다운스트림에 위치하는 영역(서열번호 13) 중 어느 하나 이상을 포함할 수 있다. 바람직하게는 상기 3개의 영역을 모두 포함할 수 있다. 상기 벡터 pSBAC-optSoC_APBC_Sv의 개열지도를 도 3a에 도시하였다. 본 발명자들은 상기 벡터 pSBAC-optSoC_APBC_Sv를 스트렙토마이시스 베네주엘래에 도입하여 배양한 결과, 에포틸론 A, B, C, D의 발현이 향상됨을 확인하였다.
또 다른 구체예로서, 본 발명의 벡터는 pSBAC-optSoC_DEF_Sv일 수 있다. 상기 벡터 pSBAC-optSoC_DEF_Sv는 pikA Ⅰ 프로모터를 사용하는 pSBAC 벡터에 합성할 수 있다. 상기 벡터는 코돈 최적화된 에포틸론 생합성 유전자를 포함하며, 상기 유전자는 바람직하게는 epoD(서열번호 5), epoE(서열번호 6), epoF(서열번호 7), orf6(서열번호 8), orf3(서열번호 9), 및 orf14(서열번호 10)를 포함한다. 상기 벡터는 유전자간 영역을 하나 이상 포함하며, 상기 유전자간 영역은 epoD 유전자의 업스트림에 위치하는 영역(서열번호 14), epoD와 epoE 유전자 사이에 위치하는 영역(서열번호 15), epoE와 epoF 유전자 사이에 위치하는 영역(서열번호 16), epoF와 orf6 유전자 사이에 위치하는 영역(서열번호 17), orf6과 orf3 유전자 사이에 위치는 영역(서열번호 18), orf3과 orf14 유전자 사이에 위치하는 영역(서열번호 19), 및 epoC 유전자의 다운스트림에 위치하는 영역(서열번호 20) 중 어느 하나 이상을 포함할 수 있다. 바람직하게는 상기 3개의 영역을 모두 포함할 수 있다. 상기 벡터 pSBAC-optSoC_DEF_Sv의 개열지도를 도 3b에 도시하였다. 본 발명자들은 상기 벡터 pSBAC-optSoC_DEF_Sv를 스트렙토마이시스 베네주엘래에 도입하여 배양한 결과, 에포틸론 A, B, C, D의 발현이 향상됨을 확인하였다.
또 다른 구체예로서, 본 발명의 벡터는 pSBAC-optPD_APBCDEF_Sv일 수 있다. 상기 벡터 pSBAC-optPD_APBCDEF_Sv는 pikA Ⅰ 프로모터를 사용하는 pSBAC 벡터에 합성할 수 있다. 상기 벡터는 코돈 최적화된 에포틸론 생합성 유전자를 포함하며, 상기 유전자는 바람직하게는 서열번호 1로 표시되는 염기서열을 갖는 epoA, 서열번호 2로 표시되는 염기서열을 갖는 epoP, 서열번호 3으로 표시되는 염기서열을 갖는 epoB, 서열번호 4로 표시되는 염기서열을 갖는 epoC , epoD(서열번호 5), epoE(서열번호 6), epoF(서열번호 7), orf6(서열번호 8), orf3(서열번호 9), 및 orf14(서열번호 10)를 포함한다. 상기 벡터는 유전자간 영역을 하나 이상 포함하며, 상기 유전자간 영역은 epoP와 epoB 유전자 사이에 위치하는 영역(서열번호 21), epoC 유전자의 다운스트림에 위치하는 영역(서열번호 22), epoD와 epoE 유전자 사이에 위치하는 영역(서열번호 23), epoE와 epoF 유전자 사이에 위치하는 영역(서열번호 24), epoF와 orf6 유전자 사이에 위치하는 영역(서열번호 25), orf6과 orf3 유전자 사이에 위치하는 영역(서열번호 26), orf3과 orf14 유전자 사이에 위치하는 영역(서열번호 27), 및 orf14 유전자의 다운스트림에 위치하는 영역(서열번호 28) 중 어느 하나 이상을 포함할 수 있다. 바람직하게는 상기 3개의 영역을 모두 포함할 수 있다. 상기 벡터 pSBAC-optPD_APBCDEF_Sv의 개열지도를 도 3c에 도시하였다. 본 발명자들은 상기 벡터 pSBAC-optPD_APBCDEF_Sv를 스트렙토마이시스 베네주엘래에 도입하여 배양한 결과, 에포틸론 A, B, C, D의 발현이 향상됨을 확인하였다.
또 다른 구체예로서, 본 발명의 벡터는 pSET152-optSoC_DEF_Sv일 수 있다. 상기 벡터 pSET152-optSoC_DEF_Sv는 ermE* 프로모터를 사용하는 pSET152 벡터에 합성할 수 있다. 상기 벡터는 코돈 최적화된 에포틸론 생합성 유전자를 포함하며, 상기 유전자는 바람직하게는 epoD(서열번호 5), epoE(서열번호 6), epoF(서열번호 7), orf6(서열번호 8), orf3(서열번호 9), 및 orf14(서열번호 10)를 포함한다. 상기 벡터는 유전자간 영역을 하나 이상 포함하며, 상기 유전자간 영역은 epoD 유전자의 업스트림에 위치하는 영역(서열번호 14), epoD와 epoE 유전자 사이에 위치하는 영역(서열번호 15), epoE와 epoF 유전자 사이에 위치하는 영역(서열번호 16), epoF와 orf6 유전자 사이에 위치하는 영역(서열번호 17), orf6과 orf3 유전자 사이에 위치는 영역(서열번호 18), orf3과 orf14 유전자 사이에 위치하는 영역(서열번호 19), 및 epoC 유전자의 다운스트림에 위치하는 영역(서열번호 20) 중 어느 하나 이상을 포함할 수 있다. 바람직하게는 상기 3개의 영역을 모두 포함할 수 있다. 상기 벡터 pSET152-optSoC_DEF_Sv의 개열지도를 도 4a에 도시하였다. 본 발명자들은 상기 벡터 pSET152-optSoC_DEF_Sv를 스트렙토마이시스 베네주엘래에 도입하여 배양한 결과, 에포틸론 A, B, C, D의 발현이 향상됨을 확인하였다.
또 다른 구체예로서, 본 발명의 벡터는 pSET152-optPD_DEF_Sv일 수 있다. 상기 벡터 pSET152-optPD_DEF_Sv는 ermE* 프로모터를 사용하는 pSET152 벡터에 합성할 수 있다. 상기 벡터는 코돈 최적화된 에포틸론 생합성 유전자를 포함하며, 상기 유전자는 바람직하게는 epoD(서열번호 5), epoE(서열번호 6), epoF(서열번호 7), orf6(서열번호 8), orf3(서열번호 9), 및 orf14(서열번호 10)를 포함한다. 상기 벡터는 유전자간 영역을 하나 이상 포함하며, 상기 유전자간 영역은 epoD와 epoE 유전자 사이에 위치하는 영역(서열번호 23), epoE와 epoF 유전자 사이에 위치하는 영역(서열번호 24), epoF와 orf6 유전자 사이에 위치하는 영역(서열번호 25), orf6과 orf3 유전자 사이에 위치하는 영역(서열번호 26), orf3과 orf14 유전자 사이에 위치하는 영역(서열번호 27), 및 orf14 유전자의 다운스트림에 위치하는 영역(서열번호 28) 중 어느 하나 이상을 포함할 수 있다. 바람직하게는 상기 3개의 영역을 모두 포함할 수 있다. 상기 벡터 pSET152-optPD_DEF_Sv의 개열지도를 도 4b에 도시하였다. 본 발명자들은 상기 벡터 pSET152-optPD_DEF_Sv를 스트렙토마이시스 베네주엘래에 도입하여 배양한 결과, 에포틸론 A, B, C, D의 발현이 향상됨을 확인하였다.
또 하나의 양태로서, 본 발명은 상기 에포틸론 발현용 벡터가 도입된 스트렙토마이시스 베네주엘래를 배양하는 단계를 포함하는, 에포틸론의 제조방법을 제공한다.
상기 에포틸론은 에포틸론 A, B, C, 및 D을 포함하는 군에서 선택되는 어느 하나 이상일 수 있다.
상기 벡터가 스트렙토마이시스 베네주엘래에 도입되고, 배양하는 방법은 특별히 제한되지 아니하며 당해 기술 분야에서 스트렙토마이시스 베네주엘래에 대하여 통상적으로 사용되는 방법이라면 어느 것이든 사용할 수 있다.
하나의 구체예로서, 본 발명의 에포틸론의 제조방법은 epoA(서열번호 1), epoP(서열번호 2), epoB(서열번호 3), 및 epoC(서열번호 4)를 포함하는 제1 발현 카세트, 및 epoD(서열번호 5), epoE(서열번호 6), epoF(서열번호 7), orf6(서열번호 8), orf3(서열번호 9), 및 orf14(서열번호 10)를 포함하는 제2 발현 카세트를 포함하는 군에서 선택되는 어느 하나 이상을 포함할 수 있다.
상기 제1 발현 카세트 및 제2 발현 카세트는 1개의 벡터에 합성되어 1개의 벡터로 합성될 수 있다. 상기 발현 카세트를 이용하여 벡터를 합성하는 방법은 특별히 제한되지 아니하며 당해 기술 분야에서 통상적으로 사용되는 방법이라면 어느 것이든 사용할 수 있다. 합성된 벡터는 바람직하게는 상기 제1 발현 카세트의 다운스트림에 제2 발현 카세트가 합성된 것일 수 있다.
상기 제1 발현 카세트 및 제2 발현 카세트는 각각 별개의 벡터에 합성될 수 있다. 별개의 벡터에 합성될 경우에는, 제1 발현 카세트를 포함하는 제1 벡터, 및 제2 발현 카세트를 포함하는 제2 벡터가 스트렙토마이시스 베네주엘래에 도입될 수 있다. 도입되는 방법은 특별히 제한되지 아니하며 당해 기술 분야에서 스트렙토마이시스 베네주엘래에 대하여 통상적으로 사용되는 방법이라면 어느 것이든 사용할 수 있다.
다른 구체예로서, 본 발명의 에포틸론의 제조방법에 사용되는 발현 카세트는 pDHS702, pDHS618, pSBAC, 및 pSET152로 이루어지는 군에서 선택되는 어느 하나의 벡터에 합성된 것일 수 있다.
또 다른 구체예로서, 본 발명의 에포틸론의 제조방법에 사용되는 벡터는 상기한 pDHS702-optSoC_APBC_Sv, pDHS618-optSoC_DEF_Sv, pDHS702-optPD_APBC_Sv, pDHS618-optPD_DEF_Sv, pSBAC-optSoC_APBC_Sv, pSBAC-optSoC_DEF_Sv, pSBAC-optPD_APBCDEF_Sv, pSET152-optSoC_DEF_Sv, 또는 pSET152-optPD_DEF_Sv일 수 있으나 이에 제한되지 않는다. 상기 각 벡터에 대한 설명은 상기한 것과 같으므로 생략한다. 상기 발현 카세트는 먼저 제작한 후 벡터로 합성하여 스트렙토마이시스 베네주엘래에 도입할 수도 있고, 한 번에 벡터를 합성하여 도입할 수도 있다.
또 다른 구체예로서, 본 발명의 에포틸론의 제조방법은 상기 2개의 벡터 pDHS702-optSoC_APBC_Sv 및 pDHS618-optSoC_DEF_Sv가 도입된 스트렙토마이시스 베네주엘래를 배양하여 에포틸론 A, B, C, D를 합성할 수 있다. 본 발명자들은 pDHS702-optSoC_APBC_Sv 및 pDHS618-optSoC_DEF_Sv를 스트렙토마이시스 베네주엘래에 도입하여 배양한 결과, 에포틸론 A의 수율은 약 10㎍/L, 에포틸론 B의 수율은 약 5 ㎍/l으로 나타났으며, 에포틸론 C와 D는 각각 에포틸론 A와 B의 수율의 1/10 정도의 수율로 나타나, 에포틸론 생산 수율이 현저히 증가함을 확인하였다(도 6).
또 다른 구체예로서, 본 발명의 에포틸론의 제조방법은 상기 2개의 벡터 pDHS618-optPD_APBC_Sv 및 pDHS702-optPD_DEF_Sv가 도입된 스트렙토마이시스 베네주엘래를 배양하여 에포틸론 A, B, C, D를 합성할 수 있다. 본 발명자들은 pDHS618-optPD_APBC_Sv 및 pDHS702-optPD_DEF_Sv를 스트렙토마이시스 베네주엘래에 도입하여 배양한 결과, 에포틸론 A, B, C, D의 생산 수율이 현저히 증가함을 확인하였다.
또 다른 구체예로서, 본 발명의 에포틸론의 제조방법은 상기 2개의 벡터 pSBAC-optSoC_APBC_Sv 및 pSBAC-optSoC_DEF_Sv가 도입된 스트렙토마이시스 베네주엘래를 배양하여 에포틸론 A, B, C, D를 합성할 수 있다. 본 발명자들은 pSBAC-optSoC_APBC_Sv 및 pSBAC-optSoC_DEF_Sv를 스트렙토마이시스 베네주엘래에 도입하여 배양한 결과, 에포틸론 A, B, C, D의 생산 수율이 현저히 증가함을 확인하였다.
또 다른 구체예로서, 본 발명의 에포틸론의 제조방법은 1개의 벡터 pSBAC-optSoC_APBCDEF_Sv가 도입된 스트렙토마이시스 베네주엘래를 배양하여 에포틸론 A, B, C, D를 합성할 수 있다. 본 발명자들은 pSBAC-optSoC_APBCDEF_Sv를 스트렙토마이시스 베네주엘래에 도입하여 배양한 결과, 에포틸론 A, B, C, D의 생산 수율이 현저히 증가함을 확인하였다.
또 다른 구체예로서, 상기 벡터 pDHS702-optSoC_APBC_Sv, pDHS702-optPD_APBC_Sv, 및 pSBAC-optSoC_APBC_Sv를 포함하는 군에서 선택되는 어느 하나의 제1 발현 벡터, 및 pDHS618-optSoC_DEF_Sv, pDHS618-optPD_DEF_Sv, pSBAC-optSoC_DEF_Sv, pSET152-optSoC_DEF_Sv, 및 pSET152-optPD_DEF_Sv를 포함하는 군에서 선택되는 어느 하나의 제2 발현 벡터가 도입된 스트렙토마이시스 베네주엘래를 배양하여 높은 수율로 에포틸론 A, B, C, D를 합성할 수 있다.
바람직하게는 pDHS702-optSoC_APBC_Sv, pDHS702-optPD_APBC_Sv, 또는 pSBAC-optSoC_APBC_Sv 중 어느 하나의 벡터와 벡터 pDHS618-optSoC_DEF_Sv를 도입하는 방법, pDHS702-optSoC_APBC_Sv, pDHS702-optPD_APBC_Sv, 또는 pSBAC-optSoC_APBC_Sv 중 어느 하나의 벡터와 벡터 pDHS618-optPD_DEF_Sv를 도입하는 방법, pDHS702-optSoC_APBC_Sv, pDHS702-optPD_APBC_Sv, 또는 pSBAC-optSoC_APBC_Sv 중 어느 하나의 벡터와 벡터 pSBAC-optSoC_DEF_Sv를 도입하는 방법, pDHS702-optSoC_APBC_Sv, pDHS702-optPD_APBC_Sv, 또는 pSBAC-optSoC_APBC_Sv 중 어느 하나의 벡터와 벡터 pSET152-optSoC_DEF_Sv를 도입하는 방법, 및 pDHS702-optSoC_APBC_Sv, pDHS702-optPD_APBC_Sv, 또는 pSBAC-optSoC_APBC_Sv 중 어느 하나의 벡터와 벡터 pSET152-optPD_DEF_Sv를 도입하는 방법으로 에포틸론을 생산할 수 있다.
본 발명에 따른 에포틸론 발현 카세트 및 발현용 벡터는 생장속도가 빠르고, 유전자 조작이 용이한 이종숙주 스트렙토마이시스 베네주엘래에 도입할 수 있어, 단시간 동안 높은 수율로 에포틸론을 생산할 수 있다.
또한 본 발명에 따른 에포틸론의 제조방법에 의하여 생산된 에포틸론은 항암물질으로 유용하게 사용할 수 있다.
도 1a는 본 발명에 따른 에포틸론 발현용 벡터 pDHS702-optSoC_APBC_Sv의 개열지도를, 도 1b는 pDHS618-optSoC_DEF_Sv의 개열지도를 도시한 것이다.
도 2a는 본 발명에 따른 에포틸론 발현용 벡터 pDHS702-optPD_APBC_Sv의 개열지도를, 도 2b는 pDHS618-optPD_DEF_Sv의 개열지도를 도시한 것이다.
도 3a는 본 발명에 따른 에포틸론 발현용 벡터 pSBAC-optSoC_APBC_Sv의 개열지도를, 도 3b는 pSBAC-optSoC_DEF_Sv의 개열지도를, 도 3c는 pSBAC-optPD_APBCDEF_Sv의 개열지도를 도시한 것이다.
도 4a는 본 발명에 따른 에포틸론 발현용 벡터 pSET152-optSoC_DEF_Sv의 개열지도를, 도 4b는 pSET152-optPD_DEF_Sv의 개열지도를 도시한 것이다.
도 5는 본 발명에 따른 벡터에 포함되는 에포틸론 생합성 유전자 및 그의 제한효소를 나타낸 것이다.
도 6은 본 발명에 따른 벡터 pDHS702-optSoC_APBC_Sv와 pDHS618-optSoC_DEF_Sv를 도입한 스트렙토마이시스 베네주엘래 균주에서의 LC-ESI-MS/MS 분석 결과를 나타낸 것이다.
이하 본 발명을 하기 예에 의해 상세히 설명한다. 다만, 하기 예는 본 발명을 예시하기 위한 것일 뿐, 하기 예에 의해 본 발명의 범위가 제한되는 것은 아니다.
균주, 플라스미드, 배양조건
본 발명에서 서브-클로닝 (subcloning)을 위하여 대장균(E.coli) DH5(Invitrogen), 플라스미드 pLitmus28 (New England Biolabs)을 사용하였다. 본 발명에 사용된 대장균 DH5는 서브클로닝에 널리 이용되는 가장 잘 알려진 균주 중에 하나이다. 이 균주는 redAI 과 endA1 유전자의 변이로 인하여 클로닝된 내부 유전자(insert)의 안정성과 플라스미드의 획득 수율을 높여주는 장점이 있다. 한편, 플라스미드 pLitmus28은 3kb 이하의 크기를 가지며, 암피실린(ampicillin)에 저항성을 가지고 다양한 개열지도(cleavage map)를 가지고 있어서 서브클로닝에 널리 이용되는 플라스미드이다.
에포틸론을 스트렙토마이세스 베네주엘래에에서 발현시키기 위한 대장균-스트렙토마이시스 셔틀(shuttle) 벡터로 pDHS702, pDHS618 또는 pSBAC를 사용하였다. 상기 벡터들은 pikA Ⅰ 프로모터와 각각 티오스트렙톤 (thiostrepton) 및 아프라마이신(apramycin) 내성 유전자를 포함하고 있다. 상기 셔틀벡터 pDHS702와 pDHS618은 미국 미시간 대학교 미생물학과 데이비드 셔먼 (David H. Sherman) 교수로부터 확보하였다.
조작된 돌연변이 균주인 스트렙토마이시스 베네주엘래 DHS2001은 한국 등록특허 제10-0949313호에 언급된 균주를 사용하였다.
대장균은 플라스미드의 선별을 위하여 암피실린 (ampicillin, 50 ㎍/mL) 또는 아프라마이신 (apramycin, 25 ㎍/mL)이 첨가된 LB배지에서 배양하였다.
실시예 1: 에포틸론 생합성 유전자 합성 및 발현벡터 제조
에포틸론 생합성 유전자는 소란지움 셀룰로섬의 유전자 정보를 바탕으로 이종숙주 스트렙토마이시스 베네주엘래의 코돈 선호도에 맞추어 바이오니아에서 ~2kb의 사이즈로 합성하였다. 합성된 에포틸론 생합성 유전자는 epoA(서열번호 1), epoP(서열번호 2), epoB(서열번호 3), epoC(서열번호 4), epoD(서열번호 5), epoE(서열번호 6), epoF(서열번호 7), orf6(서열번호 8), orf3(서열번호 9), 및 orf14(서열번호 10)이다.
상기 합성된 유전자 단편들은 각각의 제한효소를 이용하여 서브클로닝 단계를 거쳐 결합시켜 pDHS702, pDHS618 및 pSBAC에 도입하였다. 서브클로닝 및 도입 방법은 한국 등록특허 제10-0949313호에 기재된 방법을 일부 변형하여 사용하였다.
이를 통하여 하기 표 1과 같이 벡터 pDHS702-optSoC_APBC_Sv, pDHS618-optSoC_DEF_Sv, pDHS702-optPD_APBC_Sv, pDHS618-optPD_DEF_Sv, pSBAC-optSoC_APBC_Sv, pSBAC-optSoC_DEF_Sv, pSBAC-optPD_APBCDEF_Sv, pSET152-optSoC_DEF_Sv, pSET152-optPD_DEF_Sv를 완성하였다. 각 벡터의 개열지도는 도 1a 내지 도 4b에 도시하였다. 코돈 최적화된 에포틸론 생합성 유전자 단편과 각각의 제한효소를 도 5에 나타내었다.
실시예 1에 따른 벡터의 특징
벡터 프로모터 벡터 에포틸론 생합성 유전자 및
유전자간 영역(IGR)
pDHS702-optSoC_APBC_Sv pikA pDHS702 IGR-epoA - epoP -IGR-epoB - epoC -IGR
pDHS618-optSoC_DEF_Sv pikA pDHS618 IGR-epoD-IGR-epoE-IGR-epoF-IGR-orf6-IGR-orf3 -IGR-orf14 -IGR
pDHS702-optPD_APBC_Sv pikA pDHS702 epoA - epoP -IGR-epoB - epoC -IGR
pDHS618-optPD_DEF_Sv pikA pDHS618 epoD-IGR-epoE-IGR-epoF-IGR-orf6-IGR-orf3 -IGR-orf14 -IGR
pSBAC-optSoC_APBC_Sv pikA pSBAC IGR-epoA - epoP -IGR-epoB - epoC -IGR
pSBAC-optSoC_DEF_Sv pikA pSBAC IGR-epoD-IGR-epoE-IGR-epoF-IGR-orf6-IGR-orf3 -IGR-orf14 -IGR
pSBAC-optSoC_APBCDEF_Sv pikA pSBAC epoA - epoP -IGR-epoB - epoC -IGR-epoD-IGR-epoE-IGR-epoF-IGR-orf6-IGR-orf3 -IGR-orf14 -IGR
pSET152-optSoC_DEF_Sv ermE * pSET152 IGR-epoD-IGR-epoE-IGR-epoF-IGR-orf6-IGR-orf3 -IGR-orf14 -IGR
pSET152-optPD_DEF_Sv ermE * pSET152 epoD-IGR-epoE-IGR-epoF-IGR-orf6-IGR-orf3 -IGR-orf14 -IGR
실시예 2: 이종숙주에서 에포틸론의 발현
(1) 스트렙토마이시스 베네주엘래에의 형질전환
실시예 1에서 제조한 pDHS702-optSoC_APBC_Sv와 pDHS618-optSoC_DEF_Sv를 스트렙토마이시스 베네주엘래 DHS2001로 도입하고, 상기 균주를 아프라마이신 (25㎍/mL), 티오스트렙톤 (50㎍/mL) 및 카나마이신 (50㎍/mL)를 함유한 R2YE 배지를 이용하여 30℃에서 4일간 배양하였다. R2YE 조성은 103g 수크로오스 (sigma), 0.25g K2SO4 (sigma), 10.12g MgCl26H2O (sigma), 10g 글루코스 (sigma), 0.1g 카사미노 애시드(casamino acids, Difco), 5g 이스트 추출물(yeast extract, Difco), 5.73g TES 버퍼 (sigma), 2ml 미량원소용액(trace element solution), 22g agar (1L 기준)이며, 고온 멸균(autoclave) 후에 10ml 0.5% KH2PO4 (sigma), 4ml 5M CaCl22H2O (sigma), 15ml L-프롤린(L-proline, sigma), 7mL 1N NaOH(sigma) (1L 기준)을 첨가하여 제조하였다.
또한 pDHS702-optPD_APBC_Sv 및 pDHS618-optPD_DEF_Sv의 두 벡터를 스트렙토마이시스 베네주엘래 DHS2001 균주로 도입하고, pSBAC-optSoC_APBC_Sv 및 pSBAC-optSoC_DEF_Sv의 두 벡터를 스트렙토마이시스 베네주엘래 DHS2001 균주로 도입하고, pSBAC-optPD_APBCDEF_Sv 벡터를 스트렙토마이시스 베네주엘래 DHS2001 균주로 도입하여 형질전환하고, 상기와 동일한 방법으로 배양하였다.
(2) 에포틸론의 생산여부 확인
상기 배양 용액을 동량의 에틸아세테이트 (ethyl acetate)와 혼합하고, 분별깔때기로 층 분리를 2회 반복하고, 유기층을 진공회전농축기(rotary evaporator)로 농축하였다. 얻어진 용출물을 100㎕의 메탄올(methanol)로 다시 녹이고 상기 용액을 Phenomenex Synergi Polar-RP 컬럼(1504.6mm, 4㎛)을 장착한 LC-ESI-MS/MS (액체크로마토그래피/전자스프레이 이온화-질량분석기; Waters/Micromass Quattromicro/MS)로 분석하였다.
분석조건으로는 250㎕/min의 유속으로 용출시켰고, 0.1%(v/v) 포름산 (formic acid) 이 첨가된 증류수 용액(A)과 0.1%(v/v)의 포름산이 첨가된 80%(v/v) 아세토니트릴 (acetonitrile) 용액(B)를 이용하여 수행하였다. 상기 용액 B를 30%에서 50%로 5분간, 50%에서 90%로 3분간 적용하고, 90%에서 4분간 유지시킨 후 30%로 15분간의 구배로 컬럼의 재평형을 위하여 용출시켰다.
분석 결과, 먼저, pDHS702-optSoC_APBC_Sv와 pDHS618-optSoC_DEF_Sv를 도입한 스트렙토마이시스 베네주엘래 균주에서 도 6 좌측에 도시된 것과 같이 에포틸론 A, B, C, D를 모두 생산하는 것을 확인하였다. 다른 스트렙토마이시스 베네주엘래 균주에서도 에포틸론 A, B, C, D를 모두 생산하는 것을 확인하였다.
(3) 에포틸론 생산량 정량분석
다중 반응 모니터링 모드(mutiple reactions monitoring mode)로 ESI-MS/MS(전자스프레이 이온화-질량분석기/질량분석기)로 정량분석하였다. 이는 양성자화된 분자 이온(parents)이 에포틸론 A, B, C, D에 특이적인 단편으로 전이되는 것을 탐지하기 위해 셋팅된 2개의 질량 이온(mass ion)을 선별하는 방식으로 수행되었다. 에포틸론 표준물질 A, B는 시그마 (Sigma)에서 구입하였고, 에포틸론 C, D는 소란지움 셀룰로섬에서 분리하였다. 에포틸론의 생산량은 배양액 세 군데에서 채취하여 추출한 추출물의 평균으로 계산하였다.
도 6 우측 그래프는 pDHS702-optSoC_APBC_Sv와 pDHS618-optSoC_DEF_Sv를 도입한 스트렙토마이시스 베네주엘래 균주를 ESI-MS/MS로 분석한 결과를 나타낸 것이다. 도시된 것과 같이 27.12분의 용출물은 전형적인 단편 부분인 m/z 306.2, 406.2 및 494.1을 보여 에포틸론 A임을 확인하였으며, 27.95분의 용출물은 320.2, 420.3 및 508.5를 보여 에포틸론 B임을 확인하였다. 또한, 35.10분의 용출물은 290.3, 289.9 및 477.5를 보여 에포틸론 C임을 확인하였고, 36.77분의 용출물은 304.8, 404.5 및 491.1을 보여 에포틸론 D임을 확인하였다. 에포틸론 표준물질로 동일하게 실험한 결과 용출시간 및 분획 형태가 동일하였다.
에포틸론 A의 수율은 약 10㎍/L, 에포틸론 B의 수율은 약 5 ㎍/l으로 나타났으며, 에포틸론 C와 D는 각각 에포틸론 A와 B의 수율의 1/10 정도, 즉 약 1㎍/l의 수율로 생산하였다. 이는 본 발명에 따른 발현 카세트 및 이를 포함하는 에포틸론 발현용 벡터에 의하여 에포틸론 생산 수율이 현저히 증가함을 확인한 것이다.
이와 같이, 본 발명에 따른 에포틸론 발현용 벡터는 생장속도가 빠르고, 유전자 조작이 용이한 이종숙주 스트렙토마이시스 베네주엘래에 도입할 수 있어, 단시간 동안 높은 수율로 에포틸론 A, B, C, D를 모두 생산할 수 있으며, 본 발명에 따른 에포틸론의 생산방법에 의하여 생산된 에포틸론은 항암물질으로 유용하게 사용할 수 있다.
이상의 설명으로부터, 본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 이와 관련하여, 이상에서 기술한 실시 예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허 청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
<110> EWHA UNIVERSITY - INDUSTRY COLLABORATION FOUNDATION <120> EXPRESSION CASSETTES AND THEIR USE <130> KPA140462-KR <160> 28 <170> KopatentIn 2.0 <210> 1 <211> 4266 <212> DNA <213> Artificial Sequence <220> <223> Codon Optimized DNA of Sorangium cellulosum for Expression in Streptomyces venezuelae <400> 1 atggccgacc gcccgatcga gcgcgccgcc gaggacccga tcgccatcgt cggagcctcc 60 tgccgcctcc cgggcggcgt catcgacctc tccggcttct ggaccctcct cgaaggttcc 120 cgcgacaccg tcggccgcgt cccggccgaa cgctgggacg ccgctgcctg gttcgacccg 180 gaccccgacg ccccgggcaa gaccccggtc acccgcgcct ctttcctcag tgacgtcgcc 240 tgcttcgacg catccttctt cggtatctcc ccgcgcgagg cgctccgcat ggacccggcc 300 caccgtctcc tcctcgaggt ctgctgggag gccctcgaga acgccgccat cgccccgtcc 360 gccctcgtcg gcacggagac cggcgtcttc atcggaatcg gcccgagcga gtacgaggcc 420 gccctcccgc aggccaccgc ctccgccgag atcgacgccc acggcggtct cggcaccatg 480 ccctccgtcg gcgccggccg catcagctac gccctcggcc tccgcggccc gtgcgtcgcc 540 gtcgataccg cctactcctc ctccctcgtc gccgtgcacc tcgcctgcca gtccctccgt 600 tccggcgagt gctccaccgc cctcgccggc ggcgtctccc tcatgctctc cccgtccacc 660 ctcgtctggc tctccaagac ccgcgccctc gcccgcgacg gccgctgcaa ggccttctcc 720 gccgaagccg acggcttcgg tcgcggtgag ggctgcgccg tcgtcgtcct gaagcgcctc 780 tccggcgccc gggccgacgg cgaccgcatc ctcgccgtca tccgcggctc cgccatcaac 840 cacgacggag ccagctccgg gctcaccgtc ccgaacggct cctcccagga gatcgtcctc 900 aagcgcgccc tcgccgacgc cggctgcgcc gcctcctcgg tcggctacgt cgaggcgcac 960 ggcaccggga cgaccctcgg cgacccgatc gagatccagg ccctcaacgc cgtctacggc 1020 ctcggtcgcg acgtcgccac cccgctcctc atcggctccg tcaagaccaa cctcggccac 1080 ccggaatacg cctccggcat caccggcctc ctcaaggtcg tactctccct ccagcacggc 1140 cagatcccgg cccacctcca cgcccaggcc ctcaaccccc gcatctcctg gggcgacctc 1200 cgcctcaccg tcacccgcgc ccgcaccccg tggccggact ggaacacgcc gcgccgcgcc 1260 ggtgtctcct ccttcggcat gtccggaacg aacgcccacg tcgtcctcga ggaggccccg 1320 gccgccacct gcaccccgcc ggcccctgag cgtccggccg agctcctcgt cctctccgcg 1380 cggaccgcct ccgccctcga tgcccaggcc gcccgcctcc gcgaccacct cgagacctac 1440 ccgtcccagt gcctcggcga cgtcgctttc tccctcgcca ctacgcgctc cgccatggag 1500 caccgcctcg ccgtcgccgc cacatcccgt gagggcctcc gcgctgccct cgacgctgcc 1560 gcccagggtc agacctcccc gggcgccgtc aggtccatcg ccgactcctc caggggcaag 1620 cttgccttcc tcttcaccgg ccagggtgcc cagacgctcg gcatgggccg cggcctctac 1680 gacgtctggt ccgccttccg cgaggccttc gacctctgcg tccgcctctt caaccaggag 1740 ctcgaccgcc cgctccgcga ggtcatgtgg gccgagccgg cctccgtcga cgccgccctc 1800 ctcgaccaga ccgccttcac ccagccggcc ctgttcacct tcgagtacgc gctcgcggcc 1860 ctctggcgct cctggggggt cgagccggag ctcgtcgccg ggcactccat cggcgagctc 1920 gtcgccgcct gcgtcgccgg cgtcttctcc ctcgaggacg ccgtcttcct cgtcgccgcc 1980 cgcggtcgtc tcatgcaggc cctcccggcc ggcggcgcga tggtctccat cgaggccccg 2040 gaggccgacg tcgccgccgc cgtcgcgccg cacgccgcgt ccgtctccat cgccgccgtc 2100 aacgccccgg accaggtcgt catcgccggc gccggccagc cggtccacgc aatcgccgcc 2160 gccatggccg cccgcggggc ccgcaccaag gccctccacg tcagccacgc cttccactcc 2220 ccgctcatgg ccccgatgct cgaggccttc ggccgcgtcg ccgagtccgt ctcctaccgc 2280 cgcccgagca tcgtcctcgt ctccaacctc tccgggaagg cctgtaccga cgaggtctcc 2340 tccccgggat actgggtccg ccacgcccgc gaggtcgtac gcttcgccga tggagtcaag 2400 gccctccacg ccgcaggcgc cggcaccttc gtcgaggtcg gcccgaagtc caccctcctc 2460 ggtctcgtcc cggcctgcat gcccgacgcc cgtccggccc tcctcgcctc ctcccgcgcc 2520 ggccgcgacg aaccggccac cgtcctcgag gcccttggcg gcctctgggc cgtcggcggc 2580 ctcgtctcct gggccggtct cttcccgtcc ggcggccgcc gcgtcccgct cccgacctac 2640 ccgtggcagc gcgagcgcta ctggatcgac accaaggcgg acgacgccgc ccgcggcgac 2700 cgccgcgccc cgggcgccgg ccacgacgag gtcgaggagg gcggcgccgt ccgtggcggc 2760 gaccgccgct ccgcccgcct cgaccacccg ccgccggaat ccggccgccg cgagaaggtc 2820 gaggccgccg gcgacaggcc gttccgactc gagatcgacg agccgggcgt cctcgaccac 2880 ctcgtcctcc gcgtcaccga acgccgcgcc ccgggcctcg gcgaggttga gatcgccgtc 2940 gacgccgcgg gcctctcctt caacgacgtg cagctcgccc tcggcatggt cccggacgac 3000 ctcccgggca agccgaaccc gccgctcctc ctcggcgggg agtgcgccgg ccgcatcgtc 3060 gccgtcggcg agggcgtcaa cggcctcgtc gtcggccagc cggtcatcgc actctccgcc 3120 ggcgcgttcg ccacccacgt caccaccagc gccgcactcg tcctcccgcg accgcaggcc 3180 ctctccgcca tcgaggccgc cgccatgccg gtcgcctacc tcaccgcgtg gtacgccctc 3240 gaccgcatcg cccgcctcca gccgggcgaa cgcgtcctca tccacgccgc caccggcggc 3300 gtcggcctcg ccgccgtgca gtgggcccag cacgtcggcg ccgaggtaca cgccaccgcc 3360 ggcacgccgg agaagcgagc ctacctcgag tccctcggcg tgcgctacgt ctccgactcc 3420 cgctccgacc gcttcgtggc cgacgtccgc gcctggaccg gcggggaggg cgtcgacgtc 3480 gtcctcaact ccctctccgg cgagctcatc gacaagtcct tcaacctcct ccgctcccac 3540 ggccgcttcg tcgagctcgg caagcgcgac tgctacgccg acaaccagct cggcctccgc 3600 ccgttcctcc gcaacctctc cttctccctc gtcgacctcc gcggcatgat gctcgagcgc 3660 ccggcccgtg tccgcgccct cctcgaggag ctcctcggcc tcatcgccgc cggtgtcttc 3720 accccgccgc cgatcgccac gctccccatc gcccgcgtgg ccgacgcctt ccgctccatg 3780 gcccaggccc agcacctcgg caagctcgtc ttgaccctcg gagacccgga ggtccagatc 3840 cgcatcccga cccatgccgg cgccggcccg tccaccggcg accgcgacct cctcgaccgc 3900 ctcgcctccg ccgcccccgc cgcccgcgcc gccgccctcg aggccttcct ccgcacccag 3960 gtctcccagg tcctccgcac cccggaaatc aaggtcggag ccgaggccct cttcacccgc 4020 ctcggcatgg actccctcat ggccgtcgag ctccgcaacc gcatcgaagc ctccctcaag 4080 ctcaagctct ccaccacctt cctctccacc tccccgaaca tcgccctcct cgcccagaac 4140 ctcctcgacg ccctggccac cgccctctcc ctcgagcgcg tggctgccga gaacctccgc 4200 gccggcgtcc agaacgactt cgtctcctcc ggagccgacc aggactggga gatcatcgcg 4260 ctgtga 4266 <210> 2 <211> 4233 <212> DNA <213> Artificial Sequence <220> <223> Codon Optimized DNA of Sorangium cellulosum for Expression in Streptomyces venezuelae <400> 2 gtgaccatca accagctcct caacgagctc gagcaccagg gtatcaagct cgcggccgac 60 ggcgagcgcc tccagatcca ggccccgaag aacgccctca acccgaacct cctcgcccgc 120 atctccgagc acaagagcac catcctcacg atgctccgcc agcgcctccc ggcggagtcc 180 atcgtcccgg ccccggccga gaggcacgcc ccgttcccgc tcaccgacat ccaggagtcc 240 tactggctcg gccgcaccgg ggccttcacg gtcccctccg gcatccacgc ctaccgcgag 300 tacgactgca cggacctcga cgtcccgcgc ctctcccgcg ccttccgcaa ggtcgtcgcc 360 cgccacgaca tgctccgcgc ccacaccctc ccggacatga tgcaggtcat cgagccgaag 420 gtcgacgccg acatcgagat catcgacctg cggggcctcg accgctccac ccgcgaggcc 480 cgcctcgtct cgctccgcga cgcgatgtcc caccgcatct acgacaccga gcgcccgccg 540 ctctaccacg tagtcgccgt ccgcctcgac gagcgccaga cccgcctcgt cctcagcatc 600 gacctcatca acgtcgacct cggcagcctc agcatcatct tcaaggactg gctctcgttc 660 tacgaggacc cggagacgtc cctcccggtc ctcgagctgt cctaccgcga ctacgtcctc 720 gccctcgaat cccgcaagaa gtccgaggcg caccagaggt ccatggacta ctggaagcgc 780 cgcatcgccg agctcccgcc gccgccgacc ctcccgatga aggccgaccc gtccaccctc 840 aaggagatcc gcttccgcca caccgagcag tggctcccgt cggactcctg gggccggctc 900 aagcgccgcg ttggcgagcg cggccttacc ccgacgggcg tcatcctcgc cgccttctcc 960 gaggtcatcg gccgctggtc cgcgtccccg cgcttcaccc tcaacatcac cctcttcaac 1020 cgcctcccgg tccacccccg cgtcaacgac ataaccggcg acttcacctc catggtcctg 1080 ctggacatcg acacaacccg cgacaagtcc ttcgagcagc gcgccaagcg catccaggag 1140 cagctctggg aggccatgga ccactgcgac gtctccggca tcgaggtgca gcgcgaagcc 1200 gcccgcgtcc tcggcatcca gcgcggcgcc ctcttcccgg tcgtcctcac ctccgccctc 1260 aaccagcagg tcgtgggcgt caccagcctc cagcgcctcg gcaccccggt ctacacctcc 1320 acccagacgc cgcagctcct cctcgaccac cagctctacg aacacgacgg cgacctcgtg 1380 ctcgcctggg acatcgtcga cggcgtcttc ccgccggacc tcctcgacga catgctcgag 1440 gcctacgtcg tcttcctccg ccgcctcacc gaggagccct ggggggagca ggtccgctgc 1500 tccctcccgc ccgcccagct cgaggcccgc gcctccgcca acgccacgaa cgccctcctc 1560 tccgagcaca cgctccacgg cctcttcgcc gcccgcgtcg agcagctccc gatgcagctc 1620 gcggtcgtct ccgcccgcaa gaccctcacc tacgaggagc tcagccgccg ctcccgccgg 1680 ctcggggccc gcctccgcga gcagggcgcc cgcccgaaca ccctcgtcgc ggtcgtcatg 1740 gagaagggct gggagcaggt cgtcgccgtc ctcgcggtcc tcgagtccgg cgccgcctac 1800 gtcccgatcg acgcggacct gccggccgag cgcatccact acctcctcga ccacggcgag 1860 gtcaagctcg tcctcaccca gccgtggctc gacggcaagc tctcctggcc gccgggcatc 1920 cagcgcctcc tcgtctccga ggccggcgtc gagggcgacg gcgaccagcc gcccatgatg 1980 ccgatccaga ccccgtccga cctcgcctac gtcatctata cctcgggctc caccggcctc 2040 ccgaagggcg tcatgatcga ccaccgcggc gccgtcaaca ccatcctcga catcaacgag 2100 cgcttcgaga tcggcccggg cgaccgcgtc ctcgccctct cctccctcag cttcgacctc 2160 tccgtgtacg acgtcttcgg gatcctcgcc gccggcggca ccatcgtcgt cccggatgcc 2220 agcaagctcc gcgacccggc ccattgggcc gagctcatcg agcgcgagaa ggtaaccgtc 2280 tggaactccg tgccggccct catgcgcatg ctcgtcgagc atttcgaggg ccgcccggac 2340 tccctcgccc gctccctgcg gctctccctc ctctccggcg actggatccc ggtgggcctc 2400 ccgggcgagc tccaggccat ccgcccgggc gtctccgtca tctccctcgg cggcgccacc 2460 gaggcctcca tctggtccat cgggtacccg gtccgcaacg tcgacctcag ctgggcctcc 2520 atcccgtacg ggcgcccgct ccgcaaccag acgttccacg tcctcgacga agccctcgaa 2580 ccgcgcccgg tctgggtccc gggccagctc tacatcggcg gcgtggggct cgccctcggc 2640 tactggcgcg acgaggagaa gacgcgcaag tccttcctcg tgcacccgga gaccggcgag 2700 cgcctctaca agaccggcga cctcggccgc tacctcccgg acggcaacat cgaattcatg 2760 ggccgcgagg acaaccagat caagctccgc gggtaccgcg tcgagctcgg cgagattgag 2820 gagaccctca agtcccaccc gaacgtccgc gacgccgtga tcgtcccggt cggcaacgac 2880 gctgcgaaca agctcctcct cgcctacgtc gtgccggagg ggacccgccg ccgcgccgcc 2940 gagcaggatg cctccctcaa gaccgagcgc atcgacgccc gcgcccacgc cgccgaagcc 3000 gacggcctct ccgacggcga gcgcgtccag ttcaagctgg cccggcacgg cctccgccgc 3060 gacctcgacg gcaagccggt cgtcgatctc accggccagg acccgcgcga agccggcctc 3120 gacgtctacg cccgccgccg ctccgtccgc acgttcctgg aggccccgat cccgttcgtc 3180 gagttcgggc gcttcctctc ctgcctctcc tccgtggaac cggacggcgc caccctcccc 3240 aagttccgct acccgtccgc gggctccacc tacccggtcc agacctacgc ctacgtgaag 3300 tccggccgca tcgagggcgt cgacgaaggc ttctactact accacccgtt cgagcaccgt 3360 ctgctgaagc tctccgacca cggcatcgag cgcggcgccc acgtgcgcca aaacttcgac 3420 gtcttcgacg aggcggcgtt caacctcctc ttcgtcggcc gcatcgacgc catcgagtcc 3480 ttgtacggct ccagctcccg cgagttctgc ctgctcgagg ccggctacat ggcccagctg 3540 ctcatggagc aggccccttc ctgcaacatc ggcgtctgcc cggtcggcca gttcaacttc 3600 gagcaggtcc gcccggtcct cgacctccga cactccgacg tctacgtcca cggcatgctc 3660 ggcggccgcg tcgacccgcg gcagttccag gtctgcaccc tcggccagga ctcctccccg 3720 cgccgcgcca ccacccgcgg cgccccgccg ggccgcgagc agcacttcgc cgacatgctc 3780 cgcgacttcc tccgcaccaa gctcccggag tacatggtcc cgaccgtctt cgtcgagctc 3840 gacgccctcc cgctcacgtc caacggcaag gtcgaccgca aggccctccg cgagcgcaag 3900 gacacctcct ccccgcgcca ctccggccac accgccccgc gcgacgcgct cgaggagatc 3960 ctcgtcgccg tcgtccgcga ggtactcggc ctcgaggtcg tcgggctgca gcagtccttc 4020 gtcgacctcg gcgcgacctc catccacatc gtccgcatgc gctccctcct ccagaaacgc 4080 ctcgaccgcg agatcgccat caccgagctc ttccagtacc cgaacctggg ctcgctcgcc 4140 tccggcctcc gccgcgactc gcgcgatctc gaccagcgcc cgaacatgca ggaccgcgtc 4200 gaggtccgcc gcaagggccg ccgccgctcc tga 4233 <210> 3 <211> 5499 <212> DNA <213> Artificial Sequence <220> <223> Codon Optimized DNA of Sorangium cellulosum for Expression in Streptomyces venezuelae <400> 3 atggaagagc aggagtcctc cgccatcgcc gtcatcggga tgtccggccg cttcccgggc 60 gcccgcgacc tcgacgagtt ctggcgcaac ctccgcgacg gcaccgaggc cgtccagcgc 120 ttctccgagc aggagctcgc cgcctccggt gtcgacccgg ccctcgtcct cgacccgtcc 180 tacgtccgcg ccggcagcgt ccttgaggac gtcgatcgct tcgacgccgc cttcttcggc 240 atctccccgc gcgaggccga gcttatggac ccgcagcacc gcatcttcat ggagtgcgcc 300 tgggaggccc tcgagaacgc cggatacgac ccgaccgcct acgagggctc catcggcgtc 360 tacgccggcg ccaacatgtc ctcctacctg accagcaacc tccacgagca cccggccatg 420 atgcgctggc cgggctggtt ccagaccctc atcggcaacg acaaggacta cctcgccacc 480 cacgtctcct accgcctgaa cctccgcggc ccgtccatct ccgtccagac ggcctgttcc 540 acctccctcg tcgccgtcca cctcgcatgc atgtccctcc tcgaccgtga gtgcgacatg 600 gctctcgccg gcggcatcac cgtccgcatc ccgcaccgcg ccggctacgt ctacgccgag 660 ggcggcatct tctccccgga cggccactgc cgcgccttcg acgccaaggc caacggcacc 720 atcatgggca acggatgcgg cgtcgtgctc ctcaagccgc tcgaccgcgc cctctccgac 780 ggtgacccgg tccgcgccgt catcctcggc tccgccacca acaacgacgg cgcccgcaag 840 atcggcttca ccgccccgtc tgaggtcggc caggcccagg ccatcatgga ggccctcgcc 900 ctcgcgggcg tcgaagcccg ctccatccag tacatcgaga cccacggcac cggcaccctc 960 ctcggcgacg ccatcgaaac cgccgccctc cgccgcgtct tcggcaggga cgcctccgcc 1020 cgcaggtcct gcgccatcgg ctccgtcaag accggaatcg gccacctcga gtccgccgcc 1080 ggcatcgccg gcctcatcaa gaccgtcctc gccctcgaac accgccagct ccccccgtcc 1140 ctcaacttcg agtccccgaa cccgtccatc gacttcgcct cctccccgtt ctacgtcaac 1200 acctccctca aggactggaa caccggctcc accccgcgcc gcgccggcgt ctcctccttc 1260 ggcatcggcg gcaccaacgc ccacgtggtc ctcgaggagg cccccgccgc caagctcccg 1320 gccgccgccc ccgcccgctc cgccgagctc ttcgtcgtct ccgccaagtc cgccgccgcc 1380 ctcgacgctg ccgccgcccg cctccgcgac cacctgcagg cccaccaggg gatctccctc 1440 ggcgacgtcg ccttctccct cgcgaccacc cgctccccga tggagcaccg cctcgccatg 1500 gccgccccga gccgcgaggc cctccgcgaa ggcctcgacg ccgccgcccg cggccagacc 1560 ccgccgggtg ccgtccgcgg ccgctgctcc ccgggcaacg tcccgaaggt cgtcttcgtc 1620 ttcccggggc agggttccca gtgggtcggc atgggtcgcc agctcctcgc cgaggagccg 1680 gtgttccacg ccgccctctc cgcctgcgac cgcgccatcc aggccgaggc cggctggtcc 1740 ctcctcgccg aactcgccgc cgacgaaggc tcctcccagc tcgagcgcat cgacgtcgtc 1800 cagccggtcc tcttcgccct cgccgtcgcc ttcgccgccc tctggcgcag ctggggcgtc 1860 gccccggacg tcgtcattgg acactccatg ggcgaggtcg ccgccgccca cgtcgccggc 1920 gccctctcct tggaggacgc agtcgccatc atctgccgcc gctcccgcct cctccgccgc 1980 atctccggcc agggcgagat ggccgtcacc gagctgtccc tggccgaggc cgaggccgcc 2040 ctccgcggct acgaggaccg cgtctccgtc gccgtcagca actccccgcg ctccaccgtc 2100 ctctccggcg agccggccgc catcggcgag gtcctctcct ccctcaacgc caagggggtc 2160 ttctgccgcc gcgtaaaggt cgacgtcgcc tcccactccc cgcaggtcga cccgctccgc 2220 gaggacctcc tcgccgccct cggcggcctc cgcccggggg ccgccgccgt cccgatgcgc 2280 tccaccgtca ccggcgctat ggtcgccggc ccggaactcg gcgccaacta ctggatgaac 2340 aacctccgcc agccggtccg cttcgccgag gtcgtccagg cccaactcca gggcggccac 2400 ggcctcttcg tcgagatgtc gccgcacccc atcctcacca cctccgtcga ggagatgcgc 2460 cgcgccgccc agcgagccgg tgccgcagta ggctccctcc gccggggcca ggacgaacgc 2520 ccggccatgc tcgaggccct cggcaccctc tgggcccagg gttacccggt cccgtggggc 2580 cgcctcttcc cggccggcgg ccgccgcgta ccgctcccga cctacccgtg gcagcgcgag 2640 cgctactgga tcgaggcgcc ggccaagtcc gccgcgggcg accgccgtgg cgtccgcgcc 2700 ggcggccacc cgctcctcgg cgagatgcag accctctcca cccagacctc cacccgcctc 2760 tgggaaacca ccctcgacct caagcgcctc ccgtggctcg gagatcaccg cgtccagggc 2820 gccgtcgtct tcccgggcgc cgcctacctc gagatggcca tctcctcggg cgccgaggcc 2880 ctcggggacg gcccgctcca gatcaccgac gtcgtcctcg ccgaggccct cgccttcgcc 2940 ggtgacgccg ccgtcctcgt ccaggtcgtc actaccgagc agccgtcagg ccgcctccag 3000 ttccagatcg ccagccgggc cccgggcgcc ggccatgcct ccttccgcgt ccacgcccgc 3060 ggagctctcc tcagggtcga gcgcaccgag gtcccggccg gtctcaccct ctccgccgtc 3120 cgcgcccgcc tccaggcctc catcccggcc gccgccacct acgccgagct caccgagatg 3180 ggcctccagt acggcccggc cttccagggt atcgccgagc tctggcgcgg cgagggagag 3240 gccctcggcc gcgtccgcct cccggacgcc gccggatccg ccgccgagta ccgcctccac 3300 cccgccctcc tcgacgcctg cttccagatc gtcggctccc tcttcgcccg ctccggcgag 3360 gccacgccgt gggtcccggt cgagctcggc tccctccgcc tgctccagcg cccttccggc 3420 gaactctggt gccacgcccg cgtcgtcaac cacggccacc agaccccgga ccgccagggc 3480 gccgacttct gggtcgtcga ctcctccggc gccgtcgtcg ccgaggtctg cggcctcgtg 3540 gcccagcgcc tcccgggcgg cgtccgccgc cgcgaggagg acgactggtt cctcgagctc 3600 gagtgggagc cggccgccgt cggcaccgcc aaggtcaacg ccggacgctg gctcctcctc 3660 ggcggtgggg gcggcctcgg agccgccctc cgcgccatgc tcgaagccgg cggccacgca 3720 gtcgtccacg ccgccgagaa caacacctcc gccgccggcg tccgcgcact cctcgccaag 3780 gccttcgacg ggcaggcccc gaccgccgtg gtccacctcg gctccctcga cggcggcggc 3840 gagctcgacc cgggactcgg cgcccaggga gccctcgacg ccccgcgctc cgccgacgtc 3900 tccccggacg ccctcgaccc ggccctcgtc cgcggctgcg actcggtcct ctggaccgtc 3960 caggcgctcg ccggcatggg cttccgcgac gccccgcgcc tctggctctt gacccgcggc 4020 gcccaggccg tcggtgccgg cgacgtctcc gtcacccagg ccccgctcct cggcctcggc 4080 cgcgtcatcg ccatggagca tgccgacctc cgttgcgccc gcgtcgacct cgacccggcc 4140 cgcccggaag gcgagctcgc cgccctcctc gcagagctcc tcgctgacga cgccgaggcc 4200 gaggtcgccc tcaggggcgg cgagcgctgc gtcgcgcgca tcgtccgccg ccagccggag 4260 acccgcccgc gaggtcgcat cgagtcctgc gtcccgaccg acgtcaccat ccgcgccgac 4320 tccacctacc tcgtcaccgg cggcctcggc ggcctcggtc tctccgtcgc aggctggctc 4380 gccgagcgcg gcgccggtca cctcgtcctc gtcggccgat ccggcgccgc ttccgtcgag 4440 cagcgcgccg ccgtcgccgc cctcgaggcc cgcggcgccc gcgtcaccgt cgccaaggcc 4500 gacgtcgccg accgagccca gctcgagcgc atcctccgcg aggtcaccac cagcggcatg 4560 ccgctccgcg gcgtcgtcca cgcggccggc atcctcgacg acggcctcct catgcagcag 4620 accccggccc gcttccgcaa ggtcatggcc ccgaaggtcc agggcgccct ccacctccac 4680 gccctcaccc gcgaggcccc gctctccttc ttcgtcctct acgcctccgg cgtgggcctc 4740 ctcggctccc cgggacaggg caactacgcc gccgccaaca cattcctcga cgccctcgcc 4800 caccaccgcc gcgcccaggg tctcccggcc ctctccgtcg actggggcct cttcgccgag 4860 gtcggcatgg ccgccgccca ggaggaccgt ggcgctcgcc tcgtctcccg cggtatgcgc 4920 tccctcaccc cggacgaggg cctctccgcc ctcgcccgcc tccttgagtc cggccgcgcc 4980 caggtcggcg tcatgccggt caacccccgc ctctgggtcg aactctaccc ggccgccgcc 5040 agttcccgca tgctctcccg cctcgtcacc gcccaccgcg cctcggccgg cggcccggcc 5100 ggcgacggcg acctcctccg ccgcctcgcc gccgccgagc cgtccgcccg ctccgccctc 5160 ctcgagccgc tcctccgcgc ccagatctcc caggtcctcc gcctcccgga gggcaagatc 5220 gaggtggacg ccccgctcac ctccctcggc atgaactccc tcatgggtct cgagctccgc 5280 aaccgcatcg aggccatgct cggcatcacc gttccggcca ccctcctctg gacctacccg 5340 accgtcgccg ccctctccgg ccacctcgcc cgcgaggcct gcgaggccgc cccggtcgag 5400 tccccgcaca ccaccgccga ttcggccgta gagatcgagg aaatgtccca ggacgacctc 5460 acccagctca tcgccgccaa gttcaaggcc ctcacgtga 5499 <210> 4 <211> 21774 <212> DNA <213> Artificial Sequence <220> <223> Codon Optimized DNA of Sorangium cellulosum for Expression in Streptomyces venezuelae <400> 4 gtgaccaccc gtggcccgac cgcccagcag aacccgctca agcaggccgc catcatcatc 60 cagcgcctcg aggagcgcct cgccggcctc gcccaggccg agctcgagcg caccgagccg 120 atcgccatcg tcggcatcgg ctgccgcttc ccgggcggcg ccgacgcccc ggaggccttc 180 tgggagctcc tcgacgccga gcgcgacgcc gtccagccgc tcgacatgcg ctgggccctc 240 gtcggcgtcg ccccggtcga ggccgtcccg cactgggccg gcctcctcac cgagccgatc 300 gactgcttcg acgccgcctt cttcggcatc tccccgcgcg aggcccgctc cctcgacccg 360 cagcaccgcc tcctcctcga agtcgcctgg gagggcctcg aggacgcggg catcccgccg 420 cgctccatcg acggctcccg caccggcgtc ttcgtcggcg ccttcaccgc cgactacgcc 480 cgcaccgtcg cccgcctccc gcgcgaggag cgcgacgcct actccgccac cggcaacatg 540 ctctccatcg ccgccggccg cctcagctac accctcggcc tccagggccc gtgcctcacc 600 gtcgacaccg cctgctcctc ctccctcgtc gccatccacc tcgcctgccg ctccctccgc 660 gccggtgagt ccgacctcgc cctcgccggc ggcgtctccg ccctcctctc cccggacatg 720 atggaggccg ccgcccgcac ccaggccctc tccccggacg gccgctgccg caccttcgac 780 gcctccgcca acggcttcgt ccgcggcgag ggctgcggcc tcgtcgtcct caagcgcctc 840 tccgatgccc agcgcgacgg cgaccggatc tgggccttga tccgcggctc cgccatcaac 900 cacgacggtc gctccaccgg cctcaccgcc ccgaacgtcc tcgcccagga gaccgtcctc 960 cgcgaggccc tccgctccgc ccacgtcgag gccggcgccg tcgactacgt cgagacccac 1020 ggcaccggca cctccctcgg cgaccctatc gaggtcgagg ccctccgcgc caccgtcggc 1080 ccggcccgct ccgacggcac ccgctgcgtc ctcggcgccg tcaagaccaa catcggccac 1140 ctcgaggccg ccgccggcgt cgccggcctc atcaaggccg ccctctccct cacccacgag 1200 cgcatcccgc gcaacctcaa cttccgcact ctcaacccgc gcatccgcct cgagggctcc 1260 gccctcgccc tcgccaccga gccggtcccg tggccgcgca ccgaccgccc gcgcttcgcc 1320 ggcgtctcct ccttcggcat gtccggcacc aacgcccacg tcgtcctcga ggaggccccg 1380 gccgtcgaac tctggccggc cgccccggag cgctccgccg agctcctcgt cctctccgga 1440 aagtccgagg gcgccctcga cgcccaggcc gcccgcctcc gcgagcacct cgacatgcac 1500 ccggaactcg gcctcggcga cgtcgccttc tcccttgcca ccacccgctc cgccatgtcc 1560 caccgcctcg ccgtcgccgt cacctcccgc gagggcctcc tcgccgccct ctccgccgtc 1620 gcccagggcc agaccccggc cggcgccgcc cgctgcatcg cctcctcctc ccgcggcaag 1680 ctcgccttcc tcttcaccgg ccagggcgcc cagaccccgg gcatgggccg cggcctgtgc 1740 gccgcctggc cggccttccg cgaggctttc gaccgctgcg tcgccctctt cgaccgcgag 1800 ctcgaccgcc cgctccgcga ggtcatgtgg gccgaggccg gctccgccga gtccctcctc 1860 ctcgaccaga ccgccttcac ccaaccggcc ctcttcgccg tcgagtacgc cctcaccgcc 1920 ctctggcgct cctggggggt cgagccggag ctcctcgtcg gccattccat cggcgagctc 1980 gtcgctgcct gcgtcgccgg cgtcttctcc cttgaggacg gcgtccgcct cgtcgccgcc 2040 cgcggccgcc tcatgcaggg cctcagtgcc ggcggcgcca tggtatccct cggcgccccg 2100 gaggcggaag tcgccgccgc cgtcgccccg cacgccgcct ccgtttctat cgccgccgtc 2160 aacggcccgg agcaggtcgt catcgccggc gtcgagcagg ccgtccaggc catcgccgca 2220 ggcttcgccg cccgcggcgc ccgcaccaag cgcctccacg tctcccacgc cttccactcc 2280 ccgctcatgg agccgatgct cgaggagttc ggccgcgtcg ccgcctccgt cacctatcgc 2340 cgcccgtccg tctccctcgt ctccaacctc tccggcaagg tcgtcaccga cgagctctcc 2400 gccccgggct actgggtccg ccacgtccgc gaggccgtcc gcttcgccga cggcgtcaag 2460 gccctccacg aggccggcgc cggcaccttc gttgaggtcg gcccgaagcc gaccctcctc 2520 ggcctcctcc ccgcctgcct cccggaggcc gagccgaccc tcctcgcctc cctccgcgcc 2580 ggccgcgagg aggccgccgg cgtcctcgag gccctcggcc gcctctgggc cgccggcggc 2640 tccgtctcct ggccgggcgt cttcccgacc gccggccgcc gcgtcccgct cccgacctac 2700 ccgtggcagc gccagcgcta ctggatcgag gccccggccg agggcctcgg cgccaccgcc 2760 gccgacgccc tcgcccagtg gttctaccgc gtcgactggc cggagatgcc gcgctcctcc 2820 gtcgactccc gccgcgcccg ctccggcggc tggctcgttc tcgccgaccg cggcggcgtc 2880 ggtgaggccg ccgccgccgc cctctcctcc cagggctgct cctgcgccgt cctccacgcc 2940 ccggccgagg cctccgccgt cgccgagcag gtcacccagg ccctcggcgg ccgcaacgac 3000 tggcagggcg tcctctacct ctggggcctc gacgccgtcg tcgaggcagg cgcctccgcc 3060 gaggaggtcg ccaaggtcac ccacctcgcc gccgccccgg tcctcgccct catccaggcc 3120 ctcggcaccg gcccgcgctc cccgcgcctc tggatcgtca cccgcggcgc ctgcaccgtc 3180 ggcggcgagc cggacgccgc cccgtgccag gccgccctct ggggcatggg ccgcgtcgcc 3240 gccctcgagc acccgggctc ctggggcggc ctggtcgacc tcgacccgga ggagtccccg 3300 accgaggtcg aggccctcgt cgccgagctc ctctccccgg acgccgagga ccagctcgcc 3360 ttccgccagg gccgccgccg cgccgcccgc ctcgtcgccg ccccgccgga gggcaacgcc 3420 gccccggtct ccctctccgc cgagggctcc tacctcgtca ccggcggcct cggcgccctc 3480 ggcctcctcg tcgcccgctg gctcgtcgag cgcggcgccg gccacctcgt cctcatctcc 3540 cgccacggcc tcccggaccg cgaggagtgg ggccgcgacc agccgccgga ggtccgcgcc 3600 cgcatcgccg ccatcgaggc cctcgaggcc cagggcgccc gcgtcaccgt cgccgccgtc 3660 gacgtcgccg acgccgaggg catggccgcc ctcctcgccg ccgtcgagcc gccgctccga 3720 ggcgtcgtcc acgccgccgg cctcctcgac gacggcctcc tcgcccacca ggacgccggc 3780 agactcgccc gggtcctccg cccgaaggtc gagggcgcct gggtcctcca caccctcacc 3840 cgcgagcagc cgctcgacct cttcgtcctt ttctcctccg cctccggcgt cttcggctcc 3900 atcggccagg gctcctacgc cgccggcaac gccttcctcg acgccctcgc cgacctcagg 3960 cgcacccagg gcctcgccgc cctctccatc gcctggggcc tctgggccga gggcggcatg 4020 ggctcccagg cccagcgcag ggagcacgag gcctccggca tctgggccat gccgacctcc 4080 cgcgccctgg ccgccatgga gtggctcctc ggcacccgcg ccacccagcg cgtcgtcatc 4140 cagatggact gggcccacgc cggcgccgcc ccgcgcgacg cctcccgcgg ccgcttctgg 4200 gaccgcctcg tcaccgccac caaggaggcc tcctcctccg ccgtcccggc cgtcgagcgc 4260 tggcgcaacg cctccgtcgt cgagacccgc tccgccctct acgagctcgt ccgcggcgtc 4320 gtcgccggcg tcatgggctt caccgaccag ggcactctcg acgtccgccg cggcttcgcc 4380 gagcagggcc tcgactccct catggccgtc gagatccgca agcgcctcca gggcgagctc 4440 ggcatgccgc tctccgccac cctcgccttc gaccacccga ccgtcgagcg cctcgtcgag 4500 tacctcctct cccaggccct cgagctccag gaccgcaccg acgtccgctc cgtccgcctc 4560 ccggccaccg aagacccgat cgccatcgtc ggcgccgcct gccgcttccc gggcggcgtc 4620 gaggacctcg agtcctactg gcagctcctc accgagggcg tcgtcgtctc caccgaggtc 4680 ccggccgacc gctggaacgg cgccgacggc cgcgtcccgg gctccggcga ggcccagcgc 4740 cagacctacg tcccgcgcgg cggcttcctc cgcgaggtcg agaccttcga cgccgccttc 4800 ttccacatct ccccgcgcga ggccatgtcc ctcgacccgc agcagcgcct cctcctcgag 4860 gtctcctggg aggccatcga gcgcgccggc caggacccgt ccgccctccg cgagtccccg 4920 accggcgtct tcgtcggcgc cggcccgaac gagtacgccg agcgcgtcca ggagctcgcc 4980 gacgaggccg caggcctcta ctccggcacc ggcaacatgc tctccgtcgc cgccggccgc 5040 ctctccttct tcctcggcct ccatggcccg accctcgccg tcgataccgc ctgctcctcc 5100 tccctcgtcg ccctccacct cggctgtcag tccctccgcc gcggcgagtg cgaccaggcc 5160 ctcgtcggcg gcgtcaacat gctcctctcc ccgaagacct tcgccctcct ctcccgcatg 5220 cacgccctct ccccgggcgg ccgctgcaag accttctccg ccgacgccga cggctacgcc 5280 cgcgccgagg gctgcgccgt cgtcgtcctc aagcgcctct ccgacgccca gcgcgaccgc 5340 gacccgatcc tcgccgtcat ccgcggcacc gccatcaacc acgacggccc gtcctccggc 5400 ctcaccgtcc cgtcgggccc ggcccaggag gccctcctcc gccaggccct cgcccacgcc 5460 ggcgtcgtcc cggccgacgt cgacttcgtc gagtgccacg gcaccggcac cgccctcggc 5520 gacccgatcg aggtccgcgc cctctccgac gtctacggcc aggcccgccc ggccgaccgc 5580 ccgctcatcc tcggcgccgc caaagccaac ctcggccaca tggagcccgc cgccggcctc 5640 gccggcctcc tcaaggccgt cctcgccctc ggccaggagc agatcccggc ccagccggag 5700 ctcggcgagc tcaacccgct cctcccgtgg gaggccctcc cggtcgccgt cgcccgcgcc 5760 gccgtcccgt ggccgcgcac cgaccgcccg cgcttcgccg gcgtctcctc cttcggcatg 5820 tccggcacca acgcccacgt cgtcctcgag gaggccccag ccgtcgagct ctggccggcc 5880 gccccggagc gatccgccga gctcctcgtc ctctccggca agtccgaggg cgccctcgac 5940 gcccaggccg cccgcctccg cgagcacctc gacatgcacc cggagctcgg cctcggcgac 6000 gtcgccttct ccctcgccac cacacgctcc gccatgaacc accgcctcgc cgtcgccgtc 6060 acctcccgcg agggcctcct cgccgccctc tccgccgtcg cccagggcca gaccccgccg 6120 ggcgccgccc gctgcatcgc ctcctcctcc cgcggcaagc tcgccttcct cttcaccggc 6180 cagggcgccc agaccccggg catgggccgc ggcctctgcg ccgcctggcc cgccttccgc 6240 gaggccttcg accgctgcgt cgccctcttc gatcgcgagt tggaccgccc gctccgcgag 6300 gtcatgtggg ccgagccggg ctctgccgag tccctcctcc tcgaccagac cgccttcacc 6360 cagccggccc tcttcacggt cgagtacgcc ctcaccgccc tctggcgctc ctggggcgtc 6420 gagccggagc tcgtcgccgg ccattccgcc ggcgaactcg tcgccgcctg cgtcgccggc 6480 gtcttctccc tcgaggacgg cgttcgcctc gtcgccgccc gcggccgact catgcagggc 6540 ctctccgccg gcggcgccat ggtctccctc ggcgccccgg aggccgaggt cgccgccgcc 6600 gtcgccccgc acgccgcctc cgtctccatc gccgccgtca acggcccgga gcaggtcgtc 6660 atcgccggcg tcgagcaggc cgtccaggcc atcgccgccg gcttcgccgc ccgcggcgcc 6720 cgcaccaaac gcctccacgt ctcccacgcc tcccactccc cgctcatgga gccgatgctc 6780 gaggagttcg gccgcgtcgc cgcctccgtc acctaccgcc gcccgtccgt ctccctcgtc 6840 tccaacctct ccggcaaggt cgtcgccgac gagctctccg ccccgggcta ctgggtccgc 6900 cacgtccgcg aggccgtccg cttcgccgac ggcgtcaagg ccctccacga ggccggcgcc 6960 ggcaccttcg tcgaggtcgg cccgaagccg accctcctcg gcctcctccc ggcctgcctc 7020 ccggaggccg aaccgaccct cctcgcctcc ctccgcgccg gccgcgagga ggccgccggc 7080 gtcctcgagg ccctcggccg cctctgggcc gccggcggct ccgtctcctg gcctggcgtc 7140 ttcccgaccg ccggccgccg cgtcccgctc ccgacctacc cgtggcagcg tcagcgctac 7200 tggccggaca tcgagccgga ttcccgccgc cacgccgccg ccgacccgac ccagggctgg 7260 ttctaccgcg tcgactggcc ggagatcccg cgcagtctcc agaagtccga ggaggcctcc 7320 cgcggctcct ggctcgtcct cgctgacaag ggcggcgtcg gcgaggccgt cgccgccgcc 7380 ctctccaccc gcggcttgcc gtgcgtcgtc ctccacgccc cggcagagac ctccgccacc 7440 gccgagctcg tcaccgaggc cgccggcggc cgctccgact ggcaggtcgt cctctacctc 7500 tggggcctcg acgccgtcgt cggcgccgag gcctccatcg acgagatcgg cgacgccacc 7560 cgccgcgcca ccgccccggt cctcggcctc gcccgcttcc tctccaccgt ctcctgctcc 7620 ccgcgcctct gggtcgtcac ccgcggcgcc tgcatcgtcg gcgacgagcc ggcaatcgcc 7680 ccctgccagg ccgccctctg gggcatgggc cgcgtcgccg ccctcgagca cccgggcgca 7740 tggggcggcc tcgtcgacct cgacccgcgc gcctccccgc cgcaggcctc cccgattgac 7800 ggcgagatgc tcgtcaccga gctcctctcc caggagaccg aggaccagct cgccttccgc 7860 cacggccgcc gccacgccgc ccgcctcgtc gccgccccgc cgcagggcca ggccgccccg 7920 gtctccctct ccgccgaggc ctcctacctc gtcaccggcg gcctcggcgg cctcggcctc 7980 atcgtcgccc agtggctcgt cgagctcggc gcccgccacc tcgtcctcac ctcccgccgc 8040 ggcctcccgg accgccaggc ctggtgcgag cagcagccgc cggagatccg cgcccgcatc 8100 gccgccgtcg aggccctcga ggcccgcggc gcccgcgtca ccgtcgccgc cgtcgacgtc 8160 gccgacgtcg agccgatgac cgccctcgtc tcctccgtgg agccgccgct ccgcggcgtc 8220 gtccacgccg ccggcgtctc cgtcatgcgc ccgctcgccg agaccgacga gaccctcctc 8280 gagtccgtcc tccgcccgaa ggtcgccggc tcctggctcc tccaccgcct cctccacggc 8340 cgcccgctcg acctcttcgt cctcttctcc tccggcgccg ccgtctgggg ctcccactcc 8400 cagggcgcct acgccgccgc caacgccttc ctcgacggcc tcgcccacct ccgccgctcc 8460 cagtccctcc cggccctctc cgtcgcctgg ggcctctggg ccgagggcgg catggccgac 8520 gccgaggccc acgcccgctt gtccgacatc ggcgtcctcc cgatgtccac ctccgccgcc 8580 ctctccgccc tccagcgcct cgtcgagacc ggcgctgccc agcgcaccgt cacccgcatg 8640 gactgggccc gtttcgcccc ggtctacacc gcccgcggcc gccgcaacct cctctccgcc 8700 ctcgtcgccg gccgcgacat catcgccccg tccccgccgg ccgccgccac ccgcaactgg 8760 cgcggcctct ccgtcgccga ggcccgcgtc gccctccacg agatcgtcca cggtgccgtc 8820 gcccgcgtcc tcggcttcct cgacccgtcc gccctcgacc cgggcatggg cttcaacgag 8880 cagggcctcg actccttgat ggccgtcgag atccgcaacc tcctccaggc cgagctcgat 8940 gtccgcctct ccaccaccct cgccttcgac cacccgaccg tccagcgcct cgtcgagcac 9000 ctcctcgtcg acgtcctcaa gctcgaggac cgctccgaca cccagcacgt ccgctccctc 9060 gcctccgacg agccgatcgc catcgtcggc gccgcctgcc gcttcccggg cggcgtcgag 9120 gacctcgagt cctactggca gctcctcgcc gagggcgtcg tcgtatccgc cgaggtcccg 9180 gccgaccgct gggacgccgc cgactggtac gacccggacc cggagatccc gggccgcacc 9240 tacgtcacca agggcgcctt cctccgcgac ctccagcgcc tcgacgccac cttcttccgc 9300 atctccccgc gcgaggccat gtccctcgac ccgcagcagc gcctcctcct cgaggtctcc 9360 tgggaggccc tcgagtccgc cggcatcgcc ccggacacac tccgcgactc cccgaccggc 9420 gtcttcgtcg gcgccggccc gaacgagtac tacacccagc gcctccgtgg cttcaccgac 9480 ggcgccgccg gcctctacgg cggcaccggc aacatgctct ccgtcaccgc cggacgcctc 9540 tccttcttcc tcggcctcca cggcccgacc ctcgccatgg acaccgcctg ctcctcctcc 9600 ctcgtcgcac tccacctcgc ctgccagagt ctccgcctcg gcgagtgcga ccaggccctc 9660 gtcggcggcg tcaacgtcct cctcgccccg gagaccttcg tcctcctctc ccgcatgcgc 9720 gccctctccc cggacggccg ctgcaagacc ttctccgccg acgccgacgg ctacgcccgc 9780 ggcgagggct gcgccgtcgt cgtcctcaag cgcctccgcg acgcccagcg cgccggcgac 9840 tccatcctcg ccctcatccg cggctccgcc gtcaaccacg acggcccgtc ctccggtctc 9900 accgtcccga acggcccggc ccagcaggcc ctcctccgcc aggccctctc ccaggccggc 9960 gtctccccgg tcgacgtcga cttcgtcgag tgccacggca ccggcaccgc cctcggcgac 10020 ccgatcgagg tccaggccct ctccgaggtc tacggcccgg gccgctccgg cgaccgcccg 10080 ctcgtcctcg gcgccgccaa ggccaacgtc gcccacctcg aggccgcctc cggcctcgcc 10140 tccctcctca aggccgtcct cgccctccgc cacgagcaga tcccggccca gccggagctc 10200 ggcgagctca acccgcacct cccgtggaac accctcccgg tcgccgtccc gcgcaaggcc 10260 gtcccgtggg gccgcggcgc ccgcccgcgc cgcgccggcg tctccgcctt cggcctctcc 10320 ggcaccaacg tccacgtcgt cctcgaggag gccccggagg tcgagccggc cccggccgcc 10380 ccggcccgcc cggtcgagct cgtcgtcctc tccgccaagt ccgccgccgc cctcgacgcc 10440 gccgccgccc gcctctccgc ccacctctcc gcccacccgg agctctccct cggcgacgtc 10500 gccttctccc tcgccaccac ccgctccccg atggagcacc gcctcgccat cgccaccacc 10560 tcccgcgagg ccctccgcgg cgccctcgac gccgccgccc agcaaaagac cccgcagggc 10620 gccgtccgcg gcaaggccgt ctcctcccgc ggcaagctcg ccttcctctt caccggccag 10680 ggcgcacaga tgccgggcat gggccgcggc ctctacgaga cctggccggc cttccgcgag 10740 gccttcgacc gctgcgtcgc cctcttcgac cgcgaaatcg accagccgct ccgcgaggtc 10800 atgtgggccg caccgggcct cgcccaggct gcccgcctcg accagaccgc ctacgcccag 10860 ccggccctct tcgccctcga gtacgccctc gccgccctct ggcgctcctg gggcgtcgag 10920 ccgcacgtcc tcctcggcca ttcaatcggc gagctcgtcg ccgcctgtgt cgccggcgtc 10980 ttctccctcg aggacgccgt ccgcctcgtc gccgcccgcg gccgcctcat gcaggccctc 11040 ccggccggcg gcgccatggt cgccatcgcc gcctccgagg ccgaggtcgc cgcctccgtc 11100 gccccgcacg ccgccaccgt ctccatcgcc gccgtcaacg gcccggacgc cgtcgtcatc 11160 gccggcgccg aggtccaggt cttggccctc ggcgccacct tcgccgcccg cggcatccgc 11220 accaagagac ttgccgtctc ccacgccttc cactccccgc tcatggaccc gatgctcgag 11280 gacttccagc gcgtcgccgc caccatcgcc taccgcgccc cggaccgccc ggtcgtctcc 11340 aacgtcaccg gccacgtcgc tggtccggag atcgccaccc cggagtactg ggtccgccac 11400 gtccgctccg ccgtccgctt cggcgacggc gccaaggccc tccacgccgc cggcgccgcc 11460 acattcgtcg aggtcggccc gaagccggtc ctcctcggcc tcctcccggc ctgcctcggc 11520 gaggccgacg ccgtcctcgt cccgtccctc cgcgccgacc gctccgagtg tgaagtcgtc 11580 ctcgccgccc tcggcgcctg gtacgcctgg ggcggcgccc tcgactggaa gggcgtcttc 11640 cctgacggcg cccgccgcgt cgccctcccg atgtaccctt ggcagcgcga gcgccactgg 11700 atggacctca ccccgcgctc cgccgccccg gccggcatcg ccggccgctg gccgctcgcc 11760 ggagtcggcc tctgcatgcc gggcgccgtc ctccaccacg tcctctccat cggcccgcgc 11820 caccagccgt tcctcggcga tcacctcgtc ttcggcaagg tcgtcgtccc gggcgccttc 11880 cacgtcgccg tcatcctctc catcgccgcc gagcgctggc cggagcgcgc catcgagctc 11940 accggcgtcg agttcctcaa ggccatagcc atggagccgg accaggaggt cgagctccac 12000 gccgtcctca ccccggaggc cgccggcgac ggctacctct tcgagctcgc caccctcgcc 12060 gccccggaga ccgagcgccg ctggaccacc cacgcccgcg gccgcgtcca gccgaccgac 12120 ggcgccccgg gcgccctccc gcgcctcgag gtcctcgagg accgcgccat ccagccgctt 12180 gacttcgccg gcttcctcga ccgcctctcc gccgtccgca tcggctgggg cccgctctgg 12240 cgctggctcc aggacggccg cgtcggcgac gaggcctccc tcgccacctt agtcccgacc 12300 tacccgaacg cccacgacgt cgccccgctc cacccgatcc tcctcgacaa cggcttcgcc 12360 gtctccctcc tctccacccg ctccgagccg gaggacgacg gcaccccgcc gctcccgttc 12420 gccgtcgagc gcgtccgctg gtggcgcgcc ccggtcggcc gcgtccgctg cggcggcgtc 12480 ccgcgctccc aggccttcgg cgtctcctcc ttcgtcctcg tcgacgagac cggcgaggtc 12540 gtcgccgagg tcgagggctt cgtctgccgc cgcgctccgc gcgaggtctt cctccgccag 12600 gagtccggcg cctccaccgc cgccctctat cgcctcgact ggccggaggc cccgctcccg 12660 gacgccccgg ccgagcgcat cgaggagtcc tgggtcgtcg tcgccgcccc gggctccgag 12720 atggccgccg ccctcgccac ccgcctcaac cgctgcgtcc tcgccgagcc gaagggcctc 12780 gaggccgccc tcgccggcgt ctccccggcc ggcgtcatct gcctctggga ggccggcgcc 12840 cacgaggagg ccccggccgc cgcccagcgc gtcgcaaccg agggcctctc cgtcgtccag 12900 gccctccgcg accgcgccgt ccgcctctgg tgggtcacca tgggcgccgt cgccgtcgag 12960 gccggcgagc gcgtccaggt cgccaccgcc cctgtctggg gcctcggccg caccgtcatg 13020 caggagcgcc cggagctctc ctgcaccctc gtcgacctcg agccggaggc cgacgccgcc 13080 cgctccgccg acgtcctcct ccgcgagctc ggccgcgccg acgacgaaac ccaggtagcc 13140 ttccgctccg gcaagcgccg cgtcgcccgc ctcgtcaagg ccaccactcc ggagggcctc 13200 ctcgtcccgg acgccgagtc ctaccgcctc gaggccggcc agaagggcac cctcgaccag 13260 ctccgcctcg ccccggccca gcgccgcgcc cccggcccgg gcgaggtcga gatcaaggtc 13320 accgcctccg gcctcaactt ccgaaccgtc ctcgccgtcc tcggcatgta cccgggcgac 13380 gccggcccga tgggcggcga ctgcgccggc gtcgccaccg ccgtcggcca gggcgtccgc 13440 catgttgccg tcggcgacgc cgtcatgact ctcggcaccc tccaccgctt cgtcaccgtc 13500 gacgcccgcc tcgtcgtccg ccagccggcc ggcctcaccc cggcccaggc cgccaccgtc 13560 ccggtcgcct tcctcaccgc ctggctcgcc ctccacgacc tcggaaacct ccgccgcggc 13620 gagcgcgtcc tcatccacgc cgccgccggc ggcgtcggca tggcagccgt ccagatcgcc 13680 cgctggatcg gcgccgaggt cttcgccacc gcttccccgt ccaagtgggc agccgtccag 13740 gccatgggcg tcccgcgcac ccacatcgcc tcctcccgca ccctcgagtt cgccgagacc 13800 ttccgccaag tcaccggcgg ccgcggcgtc gacgtcgtcc tcaacgccct cgccggcgag 13860 ttcgtcgacg cctccctctc cctcctctcc accggcggac gcttcctcga gatgggcaag 13920 accgacatcc gcgaccgcgc cgccgtcgcc gccgcccacc cgggcgtccg ctaccgcgtc 13980 ttcgacatcc tcgagctcgc cccggaccgc acccgcgaga tcctcgagcg cgtggtcgag 14040 ggcttcgccg ccggccatct ccgtgccctc ccggtccacg ccttcgccat caccaaggcc 14100 gaggccgcct tccgcttcat ggcccaggcc cgccaccagg gcaaggtcgt cctcctcccg 14160 gccccgtccg ccgccccgct cgccccgacc ggcaccgtcc tcctcaccgg cggcctcggc 14220 gccctcggcc tccacgtcgc ccgctggctc gcccagcagg gcgtcccgca catggtcctc 14280 acaggccgcc gcggcctcga cactccgggc gccgccaagg ccgtcgccga gatcgaggca 14340 ctcggcgccc gcgtcaccat cgccgcctcc gacgtcgccg accgcaacgc cctcgaggcc 14400 gtcctccagg ccatcccggc cgaatggccg ctccagggcg tcatccacgc cgcaggcgcc 14460 ctcgacgacg gcgtcctcga cgagcagacc accgaccgct tctcccgcgt cctcgccccg 14520 aaggtcaccg gcgcctggaa cctccacgag ctcaccgccg gcaacgacct cgccttcttc 14580 gtactcttct cctccatgtc cggcctcctc ggctccgccg gccagtccaa ctacgccgcc 14640 gcaaacacct tcctcgacgc cctcgccgcc caccgccgcg ccgagggcct cgccgcacag 14700 tccctcgcct ggggcccgtg gtccgacggc ggcatggccg ccggcctctc tgccgccctc 14760 caggcccgcc tcgcccgcca cggcatgggc gccctctccc cagcccaggg caccgccctc 14820 cttggccagg ccctcgcccg cccggagacc cagctcggcg ccatgtccct cgacgtccgc 14880 gccgcctccc aggcctccgg cgccgccgtc ccgccggtct ggcgcgccct cgtccgcgcc 14940 gaggcccgcc acaccgccgc cggcgcccag ggcgccctcg ccgcccgcct cggcgccctc 15000 ccggaggccc gacgcgccga cgaggtccgc aaggtcgtcc aggccgagat cgcccgcgtc 15060 ctctcctggt ccgccgcctc cgccgtcccg gtcgaccgcc cgctctccga tctcggccta 15120 gactccctca ccgccgtcga gctccgcaac gtcctcggcc agcgcgtcgg cgccaccctc 15180 ccggccaccc tcgccttcga ccacccgacc gtcgacgccc tcacccgctg gctcctcgac 15240 aaggtcctcg ccgtcgccga gccgtccgtc tcctccgcca agtcctcccc gcaggtcgcc 15300 ctcgacgagc cgatcgccat catcggcatc ggctgtcgct tcccgggcgg cgtcgccgac 15360 ccggagtcct tctggcgcct cctcgaggag ggctccgacg ccgtcgtcga ggtcccgcac 15420 gagcgctggg acatcgatgc cttctacgac ccggacccgg acgtccgcgg caagatgacc 15480 acccgcttcg gcggcttcct ctccgacatc gaccgcttcg acccggcctt cttcggcatc 15540 tccccgcgcg aggccaccac catggacccg cagcagcgcc tcctcctcga gacctcctgg 15600 gaggccttcg agcgcgccgg catcctcccg gagcgtctca tgggctccga caccggcgtc 15660 ttcgtcggac tcttctacca ggagtacgcc gccctcgccg gcggcatcga ggccttcgac 15720 ggctacctcg gcaccggcac caccgcctcc gtcgcctccg gccgcatctc ctacgtcctc 15780 ggcctcaagg gcccgtccct caccgtcgac accgcctgct cctcctccct cgtcgccgtc 15840 cacctcgcct gccaggccct ccgccgcggc gagtgctccg tcgccctcgc cggcggcgta 15900 gccctcatgc tcaccccggc caccttcgtc gagttctccc gcctccgcgg cctcgccccg 15960 gacggccgct gcaagtcctt ctccgccgcc gccgacggcg tcggctggtc cgagggctgc 16020 gccatgctcc tcctcaagcc gctccgcgac gcccagcgcg acggcgaccc gatcctcgcc 16080 gtcatccgcg gcaccgccgt caaccaggac ggccgctcca atggcctcac cgccccgaac 16140 ggctcctccc agcaggaggt catccgccgc gccctcgagc aggccggcct cgccccggcc 16200 gacgtctcct acgtcgagtg ccacggcacc ggcaccaccc tcggcgaccc gatcgaggtc 16260 caggccctcg gcgccgtcct cgcccagggc cgcccgtccg accgcccgct cgtcataggc 16320 tctgtcaagt ccaacatcgg ccatacccag gccgccgccg gcgtcgccgg cgtcatcaag 16380 gtagccctcg ccctcgagcg cggcctcatc ccgcgctccc tccacttcga cgccccgaac 16440 ccgcacattc cgtggtccga gctcgccgtc caggtcgccg ccaagccggt cgagtggacc 16500 cgcaacggcg tcccgcgccg cgccggcgtc tcctccttcg gcgtctccgg caccaacgcc 16560 cacgtcgtcc tcgaggaggc cccggccgcc gccttcgccc cggccgccgc ccgctccgcc 16620 gagctcttcg tcctctccgc caagtccgcc gccgccctcg acgcacaggc ggcccgcctc 16680 tccgcccatg tcgtcgccca cccggagctc ggcctcggcg acctcgcctt ctccctcgcc 16740 accacccgct ccccgatgac ctaccgcctc gccgttgccg ccacctcccg cgaggccctc 16800 tccgccgccc tcgacaccgc cgcccagggg caggccccgc cggccgcggc ccgcggccac 16860 gcctccaccg gctccgcccc gaaggtcgtc ttcgtcttcc cgggccaggg ctcccagtgg 16920 ctcggcatgg gccagaagct cctctccgag gagccggtct tccgcgacgc cctctccgcc 16980 tgcgaccgcg ccatccaggc cgaggccggc tggtccttgc tcgccgagct cgccgccgac 17040 gagaccacat cccaactcgg ccgcatcgac gtcgtccagc cggccctctt cgccatcgag 17100 gtcgccctct ccgccctctg gcgctcctgg ggcgtcgagc cggacgccgt cgtcggccac 17160 tccatgggcg aggtcgccgc cgcccacgtc gccggcgccc tctccctcga agacgccgtc 17220 gccatcatct gccgccgctc cctcctcctt cgccgcatct ccggccaggg tgagatggcc 17280 gtcgtcgagc tctccctcgc cgaggctgaa gccgccctcc tcggctacga ggaccgcctc 17340 tccgtagccg tctccaactc cccgcgctcc accgtcctcg ccggcgagcc ggccgccctc 17400 gccgaggtcc tcgccatcct cgccgccaag ggcgtcttct gccgccgcgt caaggtcgac 17460 gtcgcctccc actccccgca gatcgacccg ctccgcgacg agctcctcgc cgccctcggc 17520 gagctcgaac cgcgccaggc caccgtctcc atgcgctcca ccgtcacctc caccatcatg 17580 gccggcccgg agctcgtcgc ctcctactgg gccgacaacg tccgccagcc ggtccgcttc 17640 gccgaggccg tccagtccct catggaggac ggccacggcc tcttcgtcga gatgtcccca 17700 cacccgatcc tcaccacctc cgtcgaggag atccgccgcg ccaccaagcg cgagggcgtc 17760 gccgtcgggt ccctccgccg cggccaagac gagcgcctct ccatgctcga ggccctcggc 17820 gccctctggg tccacggcca ggccgtcggc tgggagcgcc tcttctccgc cggcggcgcc 17880 ggcctccgcc gcgtcccgct cccgacctac ccgtggcagc gcgagcgcta ctgggtcgac 17940 gccccgaccg gcggcgccgc cggcggctcc cgcttcgccc acgccggctc ccacccgctc 18000 ctcggcgaaa tgcagaccct ctccacccag cgctccaccc gcgtctggga gaccaccctc 18060 gacctcaagc gcctcccgtg gctcggcgac caccgcgtcc agggcgccgt cgtcttcccg 18120 ggcgccgcct acctcgagat ggccctctcc tccggcgccg aagccctcgg cgatggcccg 18180 ctccaggtct ccgacgtcgt cctcgccgag gccctcgcct tcgccgacga caccccggcc 18240 gctgtccagg tcatggccac cgaggagcga ccgggccgcc tccagttcca cgtcgcctcc 18300 agagtcccgg gccacggcgg cgccgccttc cgctcccacg cccgcggcgt cctccgccag 18360 atcgagcgcg ccgaggtccc ggcccgcctc gacctcgcag ccctccgcgc ccgcctccag 18420 gcctccgccc cggccgccgc cacctacgcc gccctcgccg agatgggcct cgagtacggc 18480 ccggccttcc agggcctcgt cgagctctgg cgcggcgagg gggaggcgct tggccgcgtg 18540 cgcctcccgg aagccgccgg ctccccggcc gcctgccgcc tccacccggc cctcctcgac 18600 gcctgcttcc acgtctcctc cgccttcgcc gaccgcggcg aggccacccc gtgggtcccg 18660 gtcgagatcg gctccctccg ctggttccag cgcccgtccg gcgagctctg gtgtcacgcc 18720 cgctccgtct cccacggcaa gccgaccccg gaccgccgct ccaccgactt ctgggtcgtc 18780 gactccaccg gcgccatcgt cgccgagatc tccggcctcg tcgcccagcg cctcgccggc 18840 ggcgtccgcc gccgcgagga ggacgactgg ttcatggagc cggcctggga gccgaccgcc 18900 gtcccgggct ccgaggtcat ggccggccgc tggctcctca tcggctccgg cggcggcctc 18960 ggcgccgccc tccactccgc cctcaccgag gccggccact ccgtagtcca cgcgaccggc 19020 cgcggcacca gcgccgccgg cctccaggcc ctcctcaccg cctccttcga cggccaggcc 19080 ccgacgtccg tcgtccacct cggctccctc gacgagcgcg gcgtcctcga cgccgacgcc 19140 ccgttcgatg ccgatgccct cgaggagtcc ctcgtccgcg gctgcgactc cgtcctctgg 19200 accgtccagg ccgtcgccgg cgccggcttc cgcgacccgc cgcgcctctg gctcgtcacc 19260 cgcggcgccc aggccatcgg cgccggcgac gtctccgtcg cccaggcccc cctcctcggc 19320 ctcggccgcg tcatcgccct cgagcacgcc gagctccgct gcgcccgcat cgacctcgac 19380 ccggcccgcc gcgacggcga ggtcgacgag ctcctcgccg agctcctcgc cgacgacgcc 19440 gaggaggagg tcgccttccg cggcggcgag cgccgcgtcg cccgcctcgt ccgccgcctc 19500 ccagagaccg actgccgcga gaagatcgag ccggccgagg gccgcccgtt ccgcctcgag 19560 atcgacggct ccggcgtcct cgacgacctc gtcctccgcg ccaccgagcg ccgcccgccg 19620 ggcccgggcg aggtcgagat tgccgtcgag gccgccggcc tcaacttcct cgacgtcatg 19680 cgcgccatgg gcatctaccc tgggccgggc gacggcccgg tcgccctcgg cgccgagtgc 19740 tccggccgca tcgtcgccat gggcgagggc gtcgagtccc tccgcatcgg ccaggacgtc 19800 gtcgccgtcg ccccgttctc cttcggcacc cacgtcacca tcgatgcccg catgctcgcc 19860 ccgcgcccgg ccgcactcac cgccgcccag gccgccgccc tcccggtcgc cttcatgacc 19920 gcctggtacg gcctcgtcca cctcggccgc ctccgcgccg gcgagcgcgt cctcatccac 19980 tcagccaccg gcggcaccgg cctcgccgcc gtccagatcg cccgccacct cggcgccgag 20040 atcttcgcca ccgccggtac cccggagaag cgcgcctggc tccgcgagca gggcatcgcc 20100 cacgtcatgg actcccgctc cctcgacttc gccgagcagg tcctcgccgc caccaagggc 20160 gagggcgtcg acgtcgtcct caactccctc tccggcgccg ccatcgacgc ctccctctcc 20220 accctcgtcc cggacggccg cttcatcgaa ctcggcaaga ccgacatcta cgccgatcgc 20280 tccttgggcc ttgcacactt ccgcaagtcc ctctcctact ccgccgtcga cctcgccggc 20340 ctcgccgtcc gccgcccgga gcgcgtcgcc gccctcctcg ccgaggtcgt cgatctcctc 20400 gcccgcggcg ccctccagcc gctcccggtc gagatcttcc cgctctcccg cgccgccgac 20460 gccttccgca agatggccca ggcccagcac ctcggcaagc tcgtcctcgc cctcgaggac 20520 ccggacgtcc gcatccgcgt cccgggcgag tccggcgtcg ccatccgcgc cgacggcgcc 20580 tacctcgtca ccggcggcct cggcggcctc ggcctctcag tcgccggctg gctcgccgag 20640 cagggcgccg gccacctcgt cctcgtcggc cgctccggcg ccgtctccgc cgagcagcag 20700 accgccgtcg ccgccctcga ggcccacggc gcccgcgtca ccgtcgcccg cgccgacgtc 20760 gccgaccgcg cccagatgga gcgcatcctc cgcgaggtca ccgcctccgg catgcccctc 20820 cgcggcgtcg tccacgccgc cggcatcctc gacgacggac tcctcatgca gcagaccccg 20880 gcccgcttcc gcgccgtcat ggccccgaag gtccgcggcg ccctccacct ccacgccctc 20940 acccgcgaag ccccgctctc cttcttcgtc ctctacgcgt ccggcgccgg cctcctcggc 21000 tccccgggcc agggcaacta cgccgccgcc aacaccttcc tcgacgccct cgcccaccac 21060 cgccgcgccc agggcctccc ggccctctcc atcgactggg gcctcttcgc cgacgtcggc 21120 ctcgccgccg gccagcagaa ccgcggcgcc cgcctcgtca cccgcggcac ccgctccctc 21180 accccggacg agggcctctg ggccctcgag cgcctcctcg acggcgaccg cacccaggcc 21240 ggcgtcatgc cgttcgacgt ccgccaatgg gtcgagttct acccggccgc cgcctcctcc 21300 cgccgcctct cccgcctcat gaccgcgcgc cgcgtcgcct ccggccgcct cgccggcgac 21360 cgcgacttgc tcgagcgcct cgccaccgcc gaggccggcg cccgagccgg catgctccag 21420 gaggtcgtcc gcgcccaggt ctcccaggtc ctccgcctct ccgagggcaa gctcgacgtc 21480 gacgccccgc tcacctccct cggcatggac tccctcatgg gcctcgagct ccgcaaccgc 21540 atcgaggccg tcctcggcat caccatgccg gccaccctcc tctggaccta cccgaccgtc 21600 gccgccctct ccgcccacct cgcctcccac gtcgtctcca ccggcgacgg cgagtccgcc 21660 cgcccgccgg acaccggctc cgtcgccccg accacccacg aggtcgcctc cctcgacgag 21720 gacggcctct tcgccctcat cgacgagtcc ctcgcccgcg ccggcaagcg ctga 21774 <210> 5 <211> 11394 <212> DNA <213> Artificial Sequence <220> <223> Codon Optimized DNA of Sorangium cellulosum for Expression in Streptomyces venezuelae <400> 5 atgaccgacc gcgagggtca gctcctcgag cgtctccgcg aggtcaccct cgccctccgc 60 aagaccctca acgagcgcga caccctcgag ctcgagaaga ccgagccgat cgccatcgtg 120 ggcatcggtt gccgcttccc gggcggcgcc ggcaccccgg aggccttctg ggagctcctc 180 gacgacggcc gcgacgccat ccgcccgctc gaagagcgct gggccctcgt aggcgtcgac 240 ccgggcgacg acgtcccgcg ctgggccggc ctcctcaccg aggccatcga tggcttcgac 300 gccgccttct tcggcatcgc cccgcgcgag gcccgctccc tcgacccgca gcaccgcctc 360 ctcctcgagg tcgcctggga gggcttcgaa gacgccggca tcccgccgcg ctccctcgtc 420 ggctcccgca ccggcgtctt cgtcggcgtc tgcgccaccg agtacctcca cgccgccgtc 480 gcccaccagc cgcgcgagga acgcgacgcc tactccacca ccggcaacat gctttccatc 540 gccgccggac gcctctccta caccctcggc ctccagggcc cgtgccttac cgtcgatacc 600 gcctgctcct cctccctcgt cgccatccac ctcgcctgcc gttccctccg cgcccgcgaa 660 tccgacctcg ccctcgccgg cggcgtcaac atgctcctct ccccggacac catgcgcgcc 720 ctcgcccgca cccaggccct ctccccgaac ggccgctgcc agaccttcga cgcctccgcc 780 aacggcttcg tccgcggcga gggctgcggc ctcatcgtcc tcaagcgcct ctccgacgcc 840 cgccgcgacg gcgaccgcat ctgggccctc atccgcggct ccgccatcaa ccaggatggc 900 cgctccaccg gcctcaccgc accgaacgtc ctcgcccagg gcgccctcct ccgcgaggcc 960 ctccgcaacg ccggcgtcga ggccgaggcc atcggctaca tcgagacgca cggcgccgcg 1020 acctccctcg gcgacccgat cgagatcgag gccctccgcg ccgtcgtcgg cccggcccgc 1080 gccgacggcg cccgctgcgt cctcggcgct gtcaagacca acctcggcca tctcgagggc 1140 gccgccggcg tcgccggcct catcaaggcc accctctccc tccaccacga gcgtatcccg 1200 cgcaacctca acttccgcac cctcaacccg cgcatccgca tcgagggcac cgccctcgcc 1260 ctcgccaccg agccggtccc gtggccgcgc accggccgca cccgcttcgc cggcgtctcc 1320 tccttcggca tgtccggcac caacgcccac gtcgtcctcg aggaagcccc ggccgtcgaa 1380 ccggaggcgg ccgcaccgga gcgcgccgcc gagctcttcg tcctctccgc caagtccgcc 1440 gccgccctcg acgctcaggc cgcccgcctc cgcgaccacc tcgagaagca cgtcgagctc 1500 ggcctcggcg acgtcgcctt ctccctcgcc accacccgct ccgccatgga gcaccgcctc 1560 gccgtcgccg cctcctcccg cgaggccctc cgcggcgccc tctccgccgc cgcccagggc 1620 cacaccccgc cgggcgccgt ccgcggccgc gcctccggcg gctccgcccc gaaggtcgtc 1680 ttcgtcttcc cgggccaggg ctcccagtgg gtcggaatgg gccgcaagct catggccgag 1740 gaaccggtct tccgcgccgc cctcgaaggc tgcgaccgcg ccatcgaggc agaggccggt 1800 tggtccctcc tcggcgagct ctccgccgac gaggccgcct cccagctcgg ccgcatcgac 1860 gtcgtccagc cggtcctctt cgccatggag gtcgccctct ccgccctctg gcgctcctgg 1920 ggcgtcgagc cggaggccgt cgtcggccac tccatgggcg aggtagccgc cgcccacgtc 1980 gccggcgcgc tctccctcga ggacgccgtc gccatcatct gccgccgctc ccgcctcctc 2040 cgccgcatct ccggccaggg cgagatggcc ctcgtcgagc tctccctcga ggaggccgag 2100 gccgccctca gaggtcacga gggccgcctc tcggtcgccg tctccaactc cccgcgctcc 2160 actgtcctcg ccggcgagcc ggccgccctc tcagaggtcc tcgccgccct caccgccaag 2220 ggcgtcttct ggcgccaggt caaggtcgac gtcgcatccc actccccgca ggtcgacccg 2280 ctccgcgagg agctcatcgc cgccctcggc gccatccgcc cgcgcgccgc cgccgtcccg 2340 atgcgctcca ctgtcaccgg cggcgtcatc gccggcccgg agctcggcgc ctcctactgg 2400 gccgacaacc tccgccagcc ggtccgcttc gccgccgccg cccaggccct cctcgagggc 2460 ggcccggccc tcttcatcga aatgtccccg cacccgatcc tcgtcccgcc gctcgacgag 2520 attcagaccg ccgccgagca gggaggcgcc gcagtcggct ccctccgccg cggccaggac 2580 gaacgcgcca ccctcctcga ggccctcggc accctctggg cctccggcta cccggtctcc 2640 tgggcccgcc tcttcccggc cggcggtcgc cgcgtcccgc tcccgacgta cccgtggcag 2700 cacgagcgct gctggatcga ggtcgagccg gacgcccgcc gcctcgccgc cgccgacccg 2760 accaaggact ggttctaccg caccgactgg ccggaggtcc cgcgcgccgc ccctaagtcc 2820 gagaccgccc atggctcctg gctcctcctc gccgaccgcg gcggcgtcgg agaggccgtc 2880 gccgccgccc tctccacccg cggcctctcc tgcaccgtcc tccacgcctc cgctgacgcc 2940 tccaccgtcg ccgagcaggt ctccgaggcc gcctcccgcc gcaacgactg gcagggcgtc 3000 ctctacctct ggggcctcga cgccgtcgtc gacgccggcg cctccgccga cgaggtctcc 3060 gaggccaccc gccgcgccac cgccccggtc ctcggcctcg tacgcttcct ctccgccgcc 3120 ccgcacccgc cgcgcttctg ggtcgtcacc cgcggcgcct gcaccgtcgg cggcgagccg 3180 gaggcctccc tctgccaggc cgccctctgg ggcctcgccc gagtcgccgc tctcgagcac 3240 ccggccgcct ggggcggcct cgtcgacctc gaccctcaga agtccccgac cgagatcgaa 3300 ccgctcgtcg ccgagctcct cagccctgac gccgaggacc agctcgcctt ccgctccggc 3360 cgccgccacg ccgcccgcct cgtcgccgcc ccgccggagg gcgacgtcgc cccgatctcc 3420 ctctccgccg agggctccta cctcgtcacc ggcggcctcg gcggcctcgg cctcctcgtc 3480 gcccgctggc tcgtcgagcg cggcgcccgc cacctcgtcc tcacctcccg ccacggactc 3540 ccggagcgcc aggcctccgg cggcgagcag ccgccggagg cccgcgcccg catcgccgcc 3600 gtcgagggcc tcgaggccca gggcgcccgc gtcaccgtcg ccgccgtcga cgtcgcggag 3660 gccgatccga tgaccgccct cctcgccgcc atcgagccgc cgctccgagg cgtcgtccac 3720 gccgccggcg tcttcccggt ccgccacctc gccgagaccg acgaggccct cctcgaatct 3780 gtcctccgac cgaaggtcgc cggcagttgg ctcctccacc gtctcctccg cgaccgaccg 3840 ctcgacctct tcgtcctctt ctcctccggc gccgccgtct ggggcggcaa gggccagggc 3900 gcctacgccg ccgccaacgc cttcctcgac ggcctcgccc accaccgccg cgcccactcg 3960 ctcccggccc tctccctcgc ctggggcctc tgggccgagg gcggcatggt cgacgccaag 4020 gcccacgccc gactctccga catcggcgtc ctcccgatgg ccaccggccc ggccctctcc 4080 gccctcgagc gcctcgtcaa cacctccgcc gtccagcgct ccgtcacccg catggactgg 4140 gcccgcttcg ccccggtcta cgccgcccgc ggccgccgca acctcctctc cgccctcgtc 4200 gctgaggacg agcgcgccgc ctccccgccg gtcccgaccg ccaaccgcat ctggcgcggc 4260 ctcagcgtcg ccgagtcccg ctccgccttg tacgagctcg tccgcggcgt cgcccgcgtc 4320 ctcggcttct ccgacccggg cgcactcgac gtcggccgag gcttcgccga gcagggcctc 4380 gactccctca tggccctcga gatccgcaac cgcctccagc gcgagctcgg cgagcgcctc 4440 tccgccaccc tcgccttcga ccacccgacc gtcgagcgcc tcgtcgccca cctgctcacc 4500 gacgtcttga agctcgagga ccgctccgac acccgccaca tccgctccgt cgccgccgac 4560 gacgacatcg ccatcgtcgg cgccgcatgc cgcttcccgg gcggagacga aggcctcgag 4620 acctactggc gccacctcgc cgagggcatg gtcgtctcca ccgaggtccc ggccgaccgc 4680 tggcgcgccg ccgactggta cgacccggac ccggaggtcc cgggccgcac ctacgtcgcc 4740 aagggcgcct tcctccgcga cgtccgctcc ctcgacgccg ccttcttcgc catctccccg 4800 cgcgaggcca tgtccctcga cccgcagcag cgcctcctcc tcgaagtctc ctgggaggcc 4860 atcgagcgcg ccggccagga cccgatggcc cttcgcgagt ccgccaccgg cgtcttcgtc 4920 ggcatgatcg gctccgagca cgccgaacgc gtccagggcc tcgacgacga cgccgccctc 4980 ctctacggca ccaccggcaa cctcctctca gtcgccgccg gccgcctctc cttcttcctc 5040 ggcctccacg gcccgaccat gaccgtcgat accgcctgtt cctcctccct cgtcgccctc 5100 catctcgcct gtcagtccct ccgcctcgga gagtgcgacc aggccctcgc cggcggctcc 5160 tccgtcctcc tctccccgcg ctccttcgtc gccgcatccc gcatgcgcct cctctccccg 5220 gacggccgct gcaagacctt ctccgccgcc gccgacggat tcgcccgcgc cgagggctgc 5280 gccgtcgtcg tcctcaagcg tctccgcgac gcccagcgcg accgcgaccc gatcctcgcc 5340 gtcgtccgct ccaccgccat caaccacgac ggcccgtcct ccggcctcac cgtcccgtcc 5400 ggcccggccc agcaggccct cctccgccag gccctcgccc aggccggcgt cgccccggcc 5460 gaggtcgact tcgtcgagtg ccacggcacc ggcaccgccc tcggcgaccc gatcgaggtc 5520 caggccctcg gcgccgtcta cggccgcggc cgcccggccg agcgcccgct ctggctcggt 5580 gctgtaaagg ccaacctcgg ccacctcgag gccgccgccg gcctcgccgg cgtcctcaag 5640 gtcctcctcg ccctcgagca cgagcagatc ccggctcaac cggagctcga cgagctcaac 5700 ccgcacatcc cgtgggccga gctcccggtc gccgtcgtcc gccgcgccgt gccgtggccg 5760 cgcggcgccc gcccgcgccg cgccggcgtc tccgccttcg gcctcagtgg caccaacgcc 5820 cacgtcgtcc tcgaggaggc cccggccgtc gagccggtcg ccgccgctcc ggagcgcgcc 5880 gccgagctct tcgtcctctc cgccaagtcc gccgccgccc tcgacgccca ggccgcccgc 5940 ctccgcgacc acctcgagaa gcacgtcgag ctcggcctcg gcgacgtcgc cttctccctc 6000 gccaccaccc gctccgccat ggagcaccga ctcgccgtcg ccgcctcctc ccgcgaggcc 6060 ttgcgcggcg ccctctccgc cgccgcccag ggccacaccc cgccgggcgc cgtccgcggc 6120 cgcgcctccg gcggctccgc cccgaaggtc gtcttcgtct tcccgggcca gggctcccag 6180 tgggtcggca tgggccgcaa gctcatggcc gaggagccgg tcttccgcgc cgccctcgag 6240 ggctgcgacc gcgccatcga ggccgaagcg ggctggtccc tcctcggcga gctctccgcc 6300 gacgaggccg cctcccagct cggacgcatc gacgtcgtcc agccggtcct cttcgccatg 6360 gaagtcgccc tctccgccct ctggcgctcc tggggcgtcg aaccagaggc cgtcgtcggc 6420 cactccatgg gcgaggtcgc cgccgcccac gtcgccggcg ccctctccct cgaggacgcc 6480 gtcgccatca tctgccgccg ctcccgcctc ctccgccgca tctccggaca gggagagatg 6540 gccctcgtcg agctctccct cgaggaggcc gaggccgctc tccgcggcca cgagggccgc 6600 ctctccgtcg ccgtctccaa ctccccgcgc tccaccgtcc tcgccggcga gccggccgcc 6660 ctctccgagg tcctcgccgc cctcaccgcc aagggcgtct tctggcgcca ggtcaaggtc 6720 gacgtcgcct cccactcccc gcaggtcgac ccgctccgcg aggagctcat cgccgccctt 6780 ggcgccatcc gcccgcgcgc cgccgccgtc ccgatgcgct ccaccgtcac cggcggcgtc 6840 atcgctggcc cggagctcgg cgcctcctac tgggccgaca acctccgcca gccggtccgc 6900 ttcgccgccg ccgcccaggc cctcctcgag ggcggcccgg ccctcttcat cgagatgtcc 6960 ccgcacccga tcctcgtccc gccgctcgac gagatccaga cggccgccga gcagggcgga 7020 gccgccgtcg gctccctccg gcgcggccag gacgaacgcg ccaccctcct cgaagccctc 7080 ggcaccctgt gggcctccgg ctacccggtc tcctgggccc gcctcttccc ggccggcggc 7140 cgccgcgtcc cgctccccac ctacccgtgg cagcacgagc gctactggat cgaggactcc 7200 gtccacggct ctaagccgtc cctccgcctc cgccagctcc gcaacggcgc caccgaccac 7260 ccgctcctcg gcgccccgct cctcgtctcc gcccgcccgg gcgcccacct ctgggaacag 7320 gccctcagcg acgagcgtct ctcctacctc tccgagcacc gcgtccacgg cgaggccgtc 7380 ctcccgtccg ccgcctacgt cgagatggcc ctcgccgccg gcgtcgacct ctacggcacc 7440 gccaccctcg tgctcgagca gctcgccctc gagcgcgcct tggccgtccc gtccgagggc 7500 ggtcgcatcg tccaggtcgc cctctccgag gagggcccgg gccgcgcctc cttccaggtc 7560 tcctcccgcg aagaggcagg ccgctcctgg gttcgccacg ccaccggcca cgtctgctcc 7620 ggccagtcct ccgccgtcgg cgccctcaag gaggccccgt gggagatcca gcgccgctgc 7680 ccgtccgtcc tctcctccga ggccctctac ccgctcctca acgagcacgc cctcgactac 7740 ggcccgtgct tccagggcgt cgaacaggtc tggctcggca ccggcgaggt cctcggccgc 7800 gtccggctcc caggcgacat ggcctcctcc tccggcgcgt accgcatcca cccggccctc 7860 ctcgacgcct gcttccaggt cctcaccgcc ctcctcacca cccccgaatc catcgagatc 7920 cgccgccgcc tcaccgacct ccacgagccg gacctcccgc gctcccgcgc cccggtcaac 7980 caggccgtct ccgacacctg gctctgggac gccgccctgg acggcggccg ccgccaatcc 8040 gcctccgtcc cggtcgacct cgtcctcggc tccttccacg ccaagtggga ggttatggag 8100 cgcctcgccc aggcctacat catcggcacc ctccgcatct ggaacgtctt ctgcgccgcc 8160 ggcgagcgcc acaccatcga cgagctcctc gtccggctcc agatctccgt cgtctaccgc 8220 aaggtcatca agcgctggat ggagcacctc gtcgccattg gcatcctcgt cggcgacggc 8280 gagcacttcg tctcctccca gccgctcccg gagccggacc tcgccgccgt cctcgaggag 8340 gccggccgcg tcttcgccga cctcccggtc ctcttcgagt ggtgcaagtt cgccggcgag 8400 cgcctcgccg acgtcctcac cggcaagacc ctcgccctcg agatcctctt cccgggcggc 8460 tccttcgata tggccgagcg catctaccgc gattccccga tcgcccgcta ctccaacggc 8520 atcgtacgcg gcgtcgtcga gtccgcagcc cgcgtcgtcg ccccgagcgg catgttctcc 8580 atcctcgaga tcggcgccgg caccggcgcc accaccgccg ccgtcctccc ggtcctcctc 8640 ccggaccgca ccgagtacca cttcaccgac gtctccccgc tcttcctcgc ccgcgcagag 8700 cagcgcttcc gcgactaccc gttcctcaaa tacggcatcc tcgacgtcga ccaggaaccg 8760 gccggacagg gctacgcaca ccagcgcttc gacgtcatcg tagccgccaa cgtcatccac 8820 gccacccgcg acatccgcgc caccgccaag cgcctgctct ccctcctcgc cccgggcggc 8880 ctcctcgtcc tcgtcgaggg caccggccac ccgatctggt tcgacatcac caccggcctc 8940 atcgagggct ggcagaagta cgaggacgac cttcgcatcg accacccgct cctcccggcc 9000 cgcacctggt gcgacgtcct ccgccgcgtc ggcttcgccg acgccgtctc cctcccgggc 9060 gacggctccc cggccggcat cctcggccag cacgtcatcc tctcccgcgc cccgggcatc 9120 gccggcgccg cctgcgactc ctccggcgag tccgccaccg agagcccggc cgcccgcgcc 9180 gtccgacagg agtgggccga cggctccgcc gacgtcgtgc accgcatggc cctcgagcgc 9240 atgtacttcc atcgccgtcc gggccgccag gtctgggtcc acggccgcct ccgcaccggt 9300 ggcggcgcct tcaccaaggc cctcgccggc gacctcctcc tcttcgagga caccggacag 9360 gtcgtcgccg aggtccaggg cctccgcctc ccgcagctcg aggcctccgc cttcgccccg 9420 cgcgacccgc gcgaggagtg gctctacgca ctcgagtggc agcgcaagga cccgatcccg 9480 gaggccccgg ccgccgcctc gtcctcctcc gccggcgcct ggctcgtcct catggaccag 9540 ggcggcaccg gcgccgccct cgtatccctc ctcgagggcc gcggcgaggc ctgcgtccgc 9600 gtcatcgccg gcaccgccta cgcctgcctc gccccgggcc tctaccaggt cgacccggcc 9660 cagccggacg gcttccacac cctcctcaga gacgccttcg gcgaagaccg catctgccgc 9720 gccgtcgtcc acatgtggtc cctcgacgcc accgccgccg gcgagcgcgc caccgccgag 9780 tccctccagg ccgaccagct cctcggctcc ctctccgccc tctccctcgt ccaggccctc 9840 gtccgccgcc gctggcgcaa catgccgcgc ctctggctcc tcacccgcgc cgtccacgcc 9900 gtcggcgccg aagacgccgc cgcctccgtc gcccaggccc cggtctgggg cctcggccgc 9960 accctcgccc tcgagcaccc ggagctccgc tgcacactcg tcgacgtcaa cccggccccg 10020 tccccggagg acgccgccgc cctcgccgtc gagctcggcg cctccgaccg cgaagatcag 10080 gtcgccctcc gctccgacgg ccgctacgtc gcccgcctcg tccgctcctc cttctccggc 10140 aagccggcta cagactgcgg catccgcgcc gacggctcct acgtcatcac cgacggcatg 10200 ggccgtgtcg gcctctccgt cgcccagtgg atggtcatgc agggcgcccg ccacgtcgtc 10260 ctcgtcgacc gcggcggcgc ctccgaggcc tcccgcgacg ccctccgcag tatggccgag 10320 gccggagccg aagtccagat agtcgaagcc gacgtcgccc gccgcgacga cgtggcccgc 10380 ctcctctcca agatcgaacc gtccatgccg ccgctccgcg gcatcgtcta cgtcgacggc 10440 accttccagg gcgactcctc catgctcgag ctcgacgccc gccgcttcaa ggagtggatg 10500 tatccgaagg tcctcggcgc ctggaacctc cacgccctca cccgcgaccg ttccctcgac 10560 ttcttcgtcc tctactcctc cggcacctcc ctcctcggcc tcccgggcca gggctcccgc 10620 gccgccggcg acgctttcct cgacgccatc gcccaccacc gctgcaaggt cggcctcacc 10680 gccatgtcca tcaactgggg cctcctctcc gaggcctcct ccccggccac cccgaacgac 10740 ggcggcgccc gcctcgagta ccgcggcatg gagggcctca ccctcgagca gggcgccgcc 10800 gccctcggac gcctcctcgc ccgcccgcgc gcacaggtcg gcgtcatgcg cctcaatttg 10860 cgtcagtggc tcgagttcta cccgaacgct gcccgcctcg ccctctgggc cgagctcctc 10920 aaggaacgcg accgcgccga ccgcggcgcc tccaacgcct ccaacctccg cgaggccctc 10980 cagtccgccc gcccggagga ccgccaactc atcctcgaga agcacctctc cgagctcctc 11040 ggccgcggcc tccgcctccc gccggagcgc atcgagcgtc acgtcccgtt ctccaacctc 11100 ggcatggact ccctcatcgg cctcgagctc cgcaaccgca tcgaggccgc tctcggcatc 11160 accgtcccgg ccaccctcct ttggacctac cctaacgtcg ccgccctctc cggctccctc 11220 ctcgacatcc tcttcccgaa cgccggcgcc acccacgccc cggccaccga gcgcgagaag 11280 tccttcgaaa acgacgccgc cgacctcgaa gccctccgcg gcatgaccga cgagcagaag 11340 gacgccctcc tcgccgagaa gctcgcccag ctcgcccaga tcgtcgggga gtga 11394 <210> 6 <211> 7320 <212> DNA <213> Artificial Sequence <220> <223> Codon Optimized DNA of Sorangium cellulosum for Expression in Streptomyces venezuelae <400> 6 atggccacca ccaacgccgg caagctcgag cacgccctcc tcctcatgga caagctcgcc 60 aagaagaacg cgtccctcga gcaggaaagg accgagccga tcgcaatcgt cggcatcggc 120 tgccgcttcc cgggaggcgc cgacaccccg gaggccttct gggagctcct cgactccggc 180 cgcgacgccg tccagccgct cgaccgccgc tgggccctcg tcggcgtcca cccgtccgag 240 gaggtaccgc gctgggccgg cctcctcacc gaggccgtgg acggattcga cgccgccttc 300 ttcggcacct ccccgcgcga ggcccgctcc ctcgacccgc agcagcgcct cctcctcgag 360 gtcacctggg agggcctcga ggacgccggc atcgccccgc agagtctcga cggatcccgc 420 accggcgtct tcctcggcgc ctgctcctcc gactactccc acaccgtcgc ccagcagcgc 480 cgcgaggagc aggacgccta cgacatcacc ggcaacaccc tctccgtcgc cgccggccgt 540 ctctcctaca ccctcggtct ccagggcccg tgcctcaccg tcgacaccgc ctgctcctcc 600 tccctcgtcg ccatccacct cgcctgccgg tccctccgcg cccgcgagtc cgacctcgcc 660 ctcgcgggag gcgtcaacat gctcctctcc tccaagacca tgatcatgct cggcaggatc 720 caggccctct ccccggacgg ccactgccga accttcgacg cctccgccaa cggcttcgtc 780 cgcggcgagg gctgcggcat ggtcgtcctg aagcgcctct ccgacgccca gcgccacggc 840 gaccgcatct gggccctcat ccgcggctcc gccatgaacc aggacggccg ctccaccggc 900 ctcatggccc cgaacgtcct cgcccaggag gccctcctcc gcgaggccct ccagtccgcc 960 cgcgtcgacg ccggcgccat cggctacgtc gagacccacg gcactggcac ttcgctcggc 1020 gacccgatcg aggtcgaggc cctccgcgcc gtcctcggcc cggcccgcgc cgatggctcc 1080 cgctgcgtcc tcggcgccgt gaagaccaac ctcggccacc tcgagggcgc cgccggcgtc 1140 gcgggcctca tcaaggccgc cctcgccctc caccacgaac tcatcccgcg caacctccac 1200 ttccacaccc tcaacccgcg catccgcatc gagggcaccg ccctcgccct cgccaccgag 1260 ccggtcccgt ggccgcgcgc cggccgcccg cgcttcgccg gcgtctccgc attcggcctc 1320 tccggcacca acgtccacgt cgtcctcgag gaggccccgg ccaccgtcct cgccccggcc 1380 accccgggcc gctccgccga gctcctcgtc ctctccgcca agtccgccgc cgccctcgac 1440 gcccaggccg cacgcctctc cgcacacatc gccgcctacc cggagcaggg cctcggcgac 1500 gtcgccttct ccttggtctc cacccgctcc ccgatggaac atcgcctcgc cgtcgccgcc 1560 accagccgcg aggccctccg ctccgccctc gaggtcgcgg cccagggcca gaccccggcc 1620 ggtgccgccc gcggccgcgc cgcctcctcc ccgggcaagc tcgccttcct cttcgccgga 1680 cagggggccc aagtcccggg catgggccgc ggcctctggg aggcctggcc ggccttccgc 1740 gaaaccttcg accgctgcgt caccctcttc gaccgcgagc tccaccagcc gctctgcgag 1800 gtcatgtggg ccgaaccggg ctcctcccgc tcctccctcc tcgaccagac cgccttcacc 1860 cagccggccc tcttcgccct cgagtacgcc ctcgccgccc tcttccgctc ctggggcgtc 1920 gagccggagc tcgtcgccgg ccactccctt ggagaactcg tcgccgcctg cgtcgccggc 1980 gtcttctccc tcgaggatgc cgtccgcctc gtcgtcgccc gcggccgcct catgcaggcc 2040 ctcccggccg gcggcgccat ggtctccata gcggcgccgg aagctgacgt agccgcggcc 2100 gtcgccccgc acgccgcctt ggtctccatc gccgccgtca acggcccgga gcaggtcgtc 2160 atcgccggcg ccgagaagtt cgtccagcag atcgccgccg ccttcgccgc ccgcggcgcc 2220 cgcaccaagc cgctccacgt gtcccacgcc ttccactccc cgctcatgga cccgatgctc 2280 gaggccttca gacgcgtcac cgaatccgta acctaccgcc gaccgtccat cgcgctcgtc 2340 tccaacctct ccggcaagcc gtgcaccgat gaggtctccg cccccggcta ctgggtccgc 2400 cacgcccgcg aggccgtccg cttcgccgac ggcgtcaagg ccctccacgc cgccggcgcc 2460 ggcctcttcg tcgaggtcgg cccgaagccg accctcctcg gcctcgtccc ggcctgcctc 2520 ccggacgccc gcccggtcct cctcccggcc tcccgcgccg gccgcgacga ggccgcctcc 2580 gccctcgaag ccctcggcgg attctgggtc gtcggcggct cggtcacctg gagcggagtc 2640 ttcccctccg gcggccgccg cgtcccgctc ccgacctacc cgtggcaacg cgagcgctac 2700 tggatcgagg ccccggtcga ccgcgaggcc gacggcaccg gccgcgcccg cgccggcggc 2760 cacccgctcc tcggcgaggt cttctccgtc tccacccacg ccggcctccg cctctgggag 2820 acgaccctcg accgcaagcg cctcccgtgg ctcggcgagc accgcgccca gggtgaggtt 2880 gtcttcccgg gcgccggcta cctcgagatg gccctcagct ccggcgccga gatcctcggc 2940 gacggcccga tccaggtcac cgacgtcgtc ctcatcgaga ccctcacctt cgccggcgac 3000 acagccgtcc cggtccaggt cgtcaccacc gaggagcgcc cgggccgact ccgcttccag 3060 gtcgcctccc gcgagccggg cgagcgccgc gccccgttcc gcatccacgc ccgcggcgtc 3120 ctccgccgca tcggccgcgt tgagaccccg gcccgctcca acctcgccgc cctccgcgcc 3180 cgcctccacg ccgccgtccc ggccgccgcc atctacggcg ccctcgccga gatgggcctc 3240 cagtacggcc cggcccttcg cggcctcgcc gagctctggc gcggcgaggg cgaggccctc 3300 ggccgcgtcc gtctcccgga ggcagccggc tccgccaccg cctaccagct ccacccggtc 3360 ctcctcgacg cctgcgtcca gatgatcgtc ggcgccttcg ccgaccgcga cgaggccacc 3420 ccttgggccc cggtggaggt cggctccgtc cgcctcttcc agcgcagccc gggcgagctc 3480 tggtgccacg cccgcgtcgt ctccgacggc cagcaggcct cctccaggtg gtccgccgac 3540 ttcgagctca tggacggaac cggcgccgtc gtcgccgaga tctcccgcct cgtcgtcgag 3600 cgcctcgcct caggagtccg ccgccgcgac gccgacgact ggttcctcga actcgactgg 3660 gagccggccg ccctcggcgg cccgaagatc accgccggtc gctggctcct cctcggcgag 3720 ggcggcggcc tcgggcgctc cctctgctcc gccctcaagg ccgccggcca tgtcgtcgtc 3780 cacgccgccg gcgacgacac ctccaccgcc ggcatgcgcg ccctcctcgc caacgccttc 3840 gacggacagg ccccgaccgc agtcgtccac ctctcctccc tcgacggcgg cggacagctc 3900 ggcccgggcc tcggcgccca gggcgccctc gacgccccga ggtccccgga cgtcgacgcc 3960 gacgctctcg agtccgccct catgaggggc tgcgactccg tcctctctct cgtccaggcg 4020 ctcgtcggca tggacctccg caacgccccg cgcctctggc tcctcacccg cggcgcccag 4080 gccgccgccg ccggcgacgt ctccgtcgtc caggccccgc tcctcggcct cggccgcacg 4140 atcgccctcg agcacgccga actcaggtgt atctccgtcg acctcgaccc ggccgagccg 4200 gagggcgaag ccgacgcgct cctcgccgag ctcctcgccg acgacgctga agaggaggtc 4260 gccctccgcg gcggcgaccg cctcgtcgcc cgcctcgtcc accgcctccc ggacgcccag 4320 cgccgcgaga aggtcgagcc ggccggcgac cgcccgttcc gcctcgagat cgacgagccg 4380 ggcgccctcg accagctcgt cctccgcgcc acgggccgcc gagccccggg cccgggcgag 4440 gtcgagatct ccgtcgaggc cgccggcctc gactccatcg acatccagct cgccctcggc 4500 gtcgccccga acgacctccc gggcgaggag atcgagccgc tcgtcttggg ctccgagtgc 4560 gccggccgca tcgtcgccgt cggcgagggc gtcaacggcc tcgtcgtcgg ccagcctgtc 4620 atcgccctcg ccgccggcgt cttcgctacc cacgtcacca cctccgccac cctcgtcctc 4680 ccgcgcccgc tcggcctctc cgccacggag gccgccgcca tgccgctcgc ctacctcacc 4740 gcctggtacg ccctcgacaa ggtcgcccac ctccaggccg gcgagcgcgt cctcatccac 4800 gctgaggccg gcggcgtcgg cctctgcgcc gtccgctggg cccagcgcgt cggcgccgag 4860 gtctacgcca ccgccgacac ccccgaaaac cgcgcctacc tcgagtccct cggcgtccgc 4920 tacgtctccg actcccgctc cgggcgcttc gtcaccgacg tccacgcctg gaccgacggc 4980 gagggcgtcg acgtcgtcct cgactccctc tccggtgagc gcatcgacaa gtccctcatg 5040 gtcctccgcg cctgcggccg cctcgtcaag ctcggccgcc gcgacgactg cgccgacacc 5100 cagccgggac tcccgccgct cctccgcaac ttctccttct cccaggtcga cctccgcggc 5160 atgatgctcg accagccggc ccgcatccgc gccctcctcg acgagctctt cggcctcgtc 5220 gccgccggcg ccatctcccc gctcggctcc ggcctccgcg tcgggggctc cctcaccccg 5280 ccgccggtcg agaccttccc gatttcccgc gccgcagagg ccttccgccg catggcccag 5340 ggccagcacc tcggcaagct cgtcctcacc ctcgacgacc cggaggtccg catccgcgcc 5400 ccggccgagt cctcggtcgc cgtccgcgcc gacggcacgt acctcgtcac cggcgggctc 5460 ggcggcctcg gcctccgggt cgccggctgg ctcgccgagc gcggcgccgg ccagctcgtc 5520 ctcgtgggcc gctccggcgc cgcctccgcc gagcagcgcg ccgccgtcgc cgccctcgag 5580 gcccacggcg cccgcgtcac cgtcgccaag gccgacgtcg ccgaccgctc ccagatcgag 5640 cgcgtcctcc gcgaggtcac cgcctccggc atgccgctcc gcggcgtcgt ccacgccgcc 5700 ggcctcgtcg acgacggcct cctcatgcag cagaccccgg cccgcttccg caccgtaatg 5760 ggcccgaagg tccagggcgc cctccacctc cacaccctca cccgcgaggc cccgctctcc 5820 ttcttcgtcc tctacgcctc cgccgctggc cttttcggtt ccccgggcca gggaaactac 5880 gccgccgcca acgccttcct cgacgccctc agtcaccacc gccgcgccca gggcctcccg 5940 gccctctcca tcgactgggg catgttcacg gaggtcggca tggccgtcgc ccaggaaaac 6000 cgcggtgccc gccagatctc ccgcggcatg cgcggcatca cgccggatga aggcctctcc 6060 gccctcgccc gcctcctcga gggcgaccgc gtccagaccg gcgtaatccc gatcaccccg 6120 cgccagtggg tcgagttcta cccggccacc gccgccagcc gccgcctctc ccgcctcgtc 6180 acgacgcagc gcgccgtcgc cgaccggacc gccggcgacc gcgacctcct cgagcagctc 6240 gcttccgccg agccgtccgc ccgcgccggc ctcctccagg acgtcgtccg cgtccaggtc 6300 tcccacgtcc tccgcctccc ggaggacaag atcgaagtcg acgccccgct ctcctccatg 6360 ggcatggact cccttatgtc cctcgagctc cgcaaccgca tcgaggccgc cctcggcgtc 6420 gccgcaccgg cagccctcgg ctggacctac ccgaccgtcg ccgccatcac ccgctggctc 6480 ctcgacgacg ccctcgtcgt ccgtctcggc ggcggctccg acaccgacga gtccaccgcc 6540 tccgccggct ccttcgtcca cgtcctccgc ttccgtcccg tcgtcaagcc gcgcgcccgg 6600 ctcttctgct tccatggctc cggcggctcc ccggagggct tccgctcctg gtccgagaag 6660 tccgagtggt ccgacctcga gatcgtcgcc atgtggcacg accgctccct cgcctccgag 6720 gacgccccgg gcaagaagta cgtccaggaa gccgcctccc tcatccagca ctacgccgac 6780 gccccgttcg ccctcgtcgg cttctccctc ggcgtccgct tcgtcatggg caccgccgtc 6840 gagctcgcct cccgcagcgg cgccccggcc ccgctcgccg tcttcaccct cggcggttcg 6900 ctcatctcct cctccgagat caccccggag atggaaaccg atatcatcgc caagctcttc 6960 ttccgcaacg ccgccggttt cgtccgatcc acccagcagg tccaggccga cgcccgcgcc 7020 gacaaggtca tcaccgacac catggtcgcc ccggccccgg gcgactccaa ggaaccgccg 7080 gtcaagatcg ccgtcccaat cgtcgccatc gccggctccg acgacgtcat cgtcccgccg 7140 tccgacgtcc aggacctcca gtcccgcacc accgagcgct tctacatgca cctcctcccg 7200 ggcgaccacg agttcctcgt cgaccgtggc cgcgagatca tgcacatcgt cgactcccac 7260 ctcaacccgc tcctcgccgc ccgcaccacc tcctccggcc ccgctttcga ggccaagtga 7320 7320 <210> 7 <211> 1260 <212> DNA <213> Artificial Sequence <220> <223> Codon Optimized DNA of Sorangium cellulosum for Expression in Streptomyces venezuelae <400> 7 atgacccagg agcaggcgaa ccagtccgag acgaagccgg ccttcgactt caagcccttc 60 gccccggggt acgccgagga ccccttcccc gccatcgagc ggctccgcga ggccaccccg 120 atcttctact gggacgaggg ccggagctgg gtgctcaccc gctaccacga cgtctccgcc 180 gtgttcaggg acgagcgctt cgccgtctcc cgggaggagt gggaatcctc ggccgagtac 240 agctccgcca tcccggagct ctccgacatg aagaagtacg ggctcttcgg cctgcccccc 300 gaggaccacg cccgcgtccg caagctcgtg aacccgtcct tcacctcgcg ggccatcgac 360 ctcctccgcg cggaaatcca gcgcaccgtc gaccagctcc tcgacgcccg gtccggccag 420 gaggagttcg acgtcgtccg cgactacgcg gaaggcatcc cgatgcgggc gatctccgcg 480 ctcctcaagg tcccggccga gtgcgacgag aagttccgcc gcttcggctc cgccacggcc 540 cgcgcactcg gcgtcggcct cgtcccgcag gtcgacgagg agaccaagac cctcgtcgcc 600 tcggtcaccg agggcctcgc cctcctgcac gacgtcctgg acgaacgccg ccgcaacccg 660 ctggagaacg acgtcctcac gatgctcctc caggccgagg cggacggctc gcgcctctcc 720 accaaggagc tggtcgctct cgtcggcgcc atcatcgccg ccggcaccga caccaccatc 780 tacctcatcg ccttcgccgt cctcaacctc ctccgctcgc ccgaggccct cgagctcgtc 840 aaggcggagc ccggcctcat gcggaacgcc ctcgacgagg tgctccgctt cgacaacatc 900 ctccgcatcg gcacggtgcg gttcgcccgc caggatctgg agtactgcgg cgcgtcgatc 960 aagaagggcg agatggtctt cctcctcatc ccgagcgccc tccgcgacgg aaccgtcttc 1020 tcccgcccgg acgtcttcga cgtgcgtcga gacacggggg cgtccctcgc gtacggccgg 1080 ggcccgcacg tctgcccggg cgtctccctc gcccgcctcg aggccgagat cgccgtcggc 1140 accatcttcc gccgcttccc ggagatgaag ctgaaggaaa cgccggtgtt cgggtaccac 1200 cccgccttcc ggaacatcga gtccctgaac gtcatcctga agccgtccaa ggcgggctga 1260 1260 <210> 8 <211> 555 <212> DNA <213> Artificial Sequence <220> <223> Codon Optimized DNA of Sorangium cellulosum for Expression in Streptomyces venezuelae <400> 8 atgacgtccg aggaggtccc cggcgccgcc ctgggcgccc agtcgtccct cgtccgggcc 60 cagcacgccg cgcgccacgt ccgcccgtgc acccgcgcgg aggagccgcc cgcgctcatg 120 cacggactca ccgagcgcca ggtcctcctc tcgctcgtgg ccctggccct cgtgctgctc 180 accgcccgtg cgttcggcga actcgcccgg cgcctccgcc agcccgaggt cctcggcgag 240 ctcttcggcg gcgtcgtcct gggtcccagc gtggtcgggg cgctcgcgcc gggcttccac 300 cgggtcctct tccaggaccc cgcggtcggc gtcgtcctct ccggcatctc ctggatcggg 360 gccctcgtgc tgctcctcat ggcgggcatc gaggtggacg tctccatcct ccgcaaggag 420 gcccggccgg gcgccctctc ggccctcggc gccatcgccc cgccgctccg caccccgggc 480 cccctcgtcc agcgcatgca gggggccttc acgtgggacc tggacgtcag cccgcgccgc 540 agcgcgcagg cctga 555 <210> 9 <211> 2142 <212> DNA <213> Artificial Sequence <220> <223> Codon Optimized DNA of Sorangium cellulosum for Expression in Streptomyces venezuelae <400> 9 atgcacgggc tgacggagcg ccaggtcctc ctctcgctcg tcacgctcgc cctcatcctc 60 gtcaccgccc gcgcgtccgg cgagctcgcc cgccgcctcc gccagccgga agtcctcggc 120 gagctcttcg gcggcgtcgt cctcggcccg agcgtcgtcg gagccctcgc cccgggcttc 180 caccgcgccc tcttccagga acccgctgtc ggcgtcgtcc tctccggcat ctcctggatc 240 ggcgccctcc tcctcctcct catggccggc atcgaggtcg acgtcggcat cctccgcaag 300 gaggcgcgcc cgggcgccct ctccgccctc ggcgccatcg cccccccgct cgccgcgggc 360 gcagcgttct cggccctcgt cctcgaccgc cccctcccgt ccggcctctt cctcgggatc 420 gtactctccg tcaccgccgt ctccgtcatc gccaaggtcc tcatcgagcg cgagtccatg 480 cgccgctcct acgcccaggt gaccctcgcc gcgggcgtcg tctccgaggt cgccgcctgg 540 gtcctcgtcg ccatgacctc cagctcctac ggggcctccc cggccctcgc cgtcgcccgc 600 tccgccctcc tcgcctccgg cttcctcctc ttcatggtcc tcgtcggtcg ccgcctcacg 660 cacctggcca tgcgctgggt cgccgacgcc acccgcgtct ccaagggcca ggtctccctc 720 gtcctcgtcc tcacgttcct cgccgccgcc ctcacccagc gcctcggtct ccacccgctg 780 ctcggggcct tcgccctcgg ggtcctcctc aactccgcac cgcgcaccaa ccgcccgctc 840 ctcgacggcg tccagaccct cgtggccggt ctcttcgccc ccgtcttctt cgtgctcgcc 900 ggaatgaggg tcgacgtcag ccagctccgc acgccggccg cctggggcac cgtcgccctc 960 ctcctcgcca ccgccaccgc cgccaaggtc gtcccggccg ccctcggcgc ccgtctcggc 1020 ggcctccgcg gctcggaggc cgccctcgtg gccgtcggtc tcaacatgaa gggcggcacc 1080 gacctcatcg tcgcgatcgt cggagtcgag ctcggcctcc tctccaacga ggcctacacc 1140 atgtacgccg tcgtcgccct cgtcaccgtc accgcctccc ccgcccttct catctggctc 1200 gagaagcgcg ccccgcccac ccaggaagag tccgcccgcc tcgagcgcga ggaggccgcc 1260 cggcgcgctt acatcccggg cgtcgagcgc atcctcgtcc ccatcgtcgc ccacgccctc 1320 ccggggttcg ccacggacat cgtcgagtcc atcgtcgcct ccaagcggaa gctcggggag 1380 accgtcgaca tcaccgagct ctccgtcgag cagcaggccc cgggcccgtc ccgcgccgcc 1440 ggcgaggcct cccgcggcct cgccaggctc ggcgcccggc tccgcgtcgg catctggcgc 1500 cagcgccgcg agctccgtgg ctccatccag gccatcctcc gtgcgtcccg cgaccacgac 1560 ctcctcgtca tcggcgcccg ctccccggcc cgcgcccgtg gcatgtcctt cggccgcctg 1620 caggacgcca tcgtccagcg cgccgaaagc aacgtcctcg tcgtcgtcgg cgacccgccg 1680 gccgccgagc gcgcgtccgc ccgccgcatc ctcgtcccga tcatcggcct cgagtacagc 1740 ttcgccgccg ccgacctcgc cgcccacgtc gccctcgcct gggacgcgga gctcgtcctc 1800 ctctcctccg cccagacgga cccgggcgcc gtcgtctggc gcgaccggga gccgtcgcgc 1860 gtccgcgccg tggcgcgttc cgtcgtcgac gaggccgtct tccgcggtcg ccgcctcggc 1920 gtccgcgtct ccagccgagt ccacgtcggc gcccacccgt ccgacgagat cacccgcgag 1980 ctcgcccgcg cgccctacga cttgctcgtc ctcggctgct acgaccacgg ccccctcggc 2040 cgcctctacc tcggatccac cgtcgaatcc gtagtcgtcc gctcccgcgt cccggtggcc 2100 ctcctcgtgg cccacggtgg cacccgcgag caggtccgct ga 2142 <210> 10 <211> 918 <212> DNA <213> Artificial Sequence <220> <223> Codon Optimized DNA of Sorangium cellulosum for Expression in Streptomyces venezuelae <400> 10 atggagaagg agtcgcgcat cgccatctac ggcgccatcg ccgccaacgt cgccatcgcc 60 gccgtcaagt tcatcgccgc ggccgtcacg ggctcgtcgg cgatgctcag cgagggcgtc 120 cactccctcg tggacaccgc cgacggcctc ctcctcctcc tcggcaagca ccgcagcgcg 180 cgcccgccgg acgccgagca ccccttcggc cacggcaagg agctctactt ctggaccctc 240 atcgtggcca tcatgatctt cgcggccggc ggcggcgtct ccatctacga gggcatcctc 300 cacctcctcc acccccggca gatcgaggac ccgacctgga actacgtcgt cctcggggcc 360 gcagcggtgt tcgaaggcac ctccctgatc atctccatcc acgagttcaa gaagaaggac 420 gggcagggct acctcgcggc catgcgctcc agcaaggacc ccaccacctt cacgatcgtc 480 ctcgaggaca gcgccgcgct ggccggcctc acgatcgcgt tcctcggcgt ctggctcgga 540 caccgcctcg gcaacccgta cctggacggc gccgcgtcca tcggcatcgg gctcgtcctc 600 gccgcggtgg ccgtcttcct cgcctcccag tcccgcggcc tgctcgtcgg cgagtccgcc 660 gaccgggagc tcctcgccgc catccgcgcc ctggcctccg cggacccggg cgtgtccgcc 720 gtggggcgcc cgctcaccat gcacttcggc ccgcacgagg tcctcgtcgt gctccggatc 780 gagttcgacg cggcgctcac cgcctccggc gtggccgagg ccatcgagcg tatcgagacc 840 cgcatccggt ccgagcgccc cgacgtcaag cacatctacg tcgaggcgcg ctccctccac 900 cagcgcgccc gcgcgtga 918 <210> 11 <211> 207 <212> DNA <213> Sorangium cellulosum <400> 11 actttcaatt tttccgaggg gggcttggtc tctggttcct caggaagcct gatcgggacg 60 agctaattcc catccatttt tttgaggctc tgctcaaagg gattagatcg agtgagacag 120 ttcttttgca gtgcgcgaag aacctgggcc tcgaccggag gacgatcgac gtccgcgagc 180 gggtcagccg ctgaggatgt gcccgtc 207 <210> 12 <211> 146 <212> DNA <213> Sorangium cellulosum <400> 12 gagcgccgaa caaaaccagg ccgagcgggc cgatgagccg caagcccgcc tgcgtcaccc 60 tgggactcat ctgatctgat cgcgggtacg cgtcgcgggt gtgcgcgttg agccgtgttg 120 ttcgaacgct gaggaacggt gagctc 146 <210> 13 <211> 4 <212> DNA <213> Sorangium cellulosum <400> 13 ttgc 4 <210> 14 <211> 183 <212> DNA <213> Sorangium cellulosum <400> 14 cggtggcagc gctgagtgcg catctggctt ctcatgtcgt ctctacgggg gatggggaat 60 ccgcgcgccc gccggataca gggagcgtgg ctccaacgac ccacgaagtc gcttcgctcg 120 acgaagacgg gttgttcgcg ttgattgatg agtcactcgc gcgcgcggga aagaggtgat 180 tgc 183 <210> 15 <211> 83 <212> DNA <213> Sorangium cellulosum <400> 15 cctgcccgac accaccggca ccaccggcac caccagcccc cctcacacac ggaacacgga 60 acggacaggc gagaacggga gcc 83 <210> 16 <211> 102 <212> DNA <213> Sorangium cellulosum <400> 16 cccgaccgcg gtcctgcccc acgcgccgca ccccgcgcat cccgcgcacc acccgccccc 60 acacgcccac aaccccatcc acgagcggaa gaccacaccc ag 102 <210> 17 <211> 68 <212> DNA <213> Sorangium cellulosum <400> 17 gcgccggccg tcgccgaggc cgtcctctcc tggctcgacg ccatcgaggg catcgagggg 60 gcgggcaa 68 <210> 18 <211> 147 <212> DNA <213> Sorangium cellulosum <400> 18 gacaccgggg ccccggtccg cccggccccc cttcggacgg accggacggc tcggaccacg 60 gggacggctc agaccgtccc gtgtgtcccc gtccggctcc cgtccgcccc atcccgcccc 120 tccaccggca aggaaggaca cgacgcc 147 <210> 19 <211> 66 <212> DNA <213> Sorangium cellulosum <400> 19 gcaccgccca agaccccccg gggcgggacg tcccgggtgc accaagcaaa gagagagaaa 60 cgaacc 66 <210> 20 <211> 75 <212> DNA <213> Sorangium cellulosum <400> 20 aagcggcggt gcccgccacc cgggagggtg gcgggcaccg ctttttcggc ctgctgggtc 60 taccggacca cctga 75 <210> 21 <211> 104 <212> DNA <213> Streptomyces venezuelae <400> 21 tccctgccgc acggtcgcct cccgccccgg accccgtccc gggcacctcg actcgaatca 60 cttcatgcgc gcctcgggcg cctccaggaa ctcaagggga cagc 104 <210> 22 <211> 108 <212> DNA <213> Streptomyces venezuelae <400> 22 cgtgacgccg tgaaagcggc ggtgcccgcc acccgggagg gtggcgggca ccgctttttc 60 ggcctgctgg gtctaccgga ccacctgacc tgcaggaaac ttaagaaa 108 <210> 23 <211> 83 <212> DNA <213> Streptomyces venezuelae <400> 23 cctgcccgac accaccggca ccaccggcac caccagcccc cctcacacac ggaacacgga 60 acggacaggc gagaacggga gcc 83 <210> 24 <211> 102 <212> DNA <213> Streptomyces venezuelae <400> 24 cccgaccgcg gtcctgcccc acgcgccgca ccccgcgcat cccgcgcacc acccgccccc 60 acacgcccac aaccccatcc acgagcggaa gaccacaccc ag 102 <210> 25 <211> 68 <212> DNA <213> Streptomyces venezuelae <400> 25 gcgccggccg tcgccgaggc cgtcctctcc tggctcgacg ccatcgaggg catcgagggg 60 gcgggcaa 68 <210> 26 <211> 147 <212> DNA <213> Streptomyces venezuelae <400> 26 gacaccgggg ccccggtccg cccggccccc cttcggacgg accggacggc tcggaccacg 60 gggacggctc agaccgtccc gtgtgtcccc gtccggctcc cgtccgcccc atcccgcccc 120 tccaccggca aggaaggaca cgacgcc 147 <210> 27 <211> 66 <212> DNA <213> Streptomyces venezuelae <400> 27 gcaccgccca agaccccccg gggcgggacg tcccgggtgc accaagcaaa gagagagaaa 60 cgaacc 66 <210> 28 <211> 101 <212> DNA <213> Streptomyces venezuelae <400> 28 cgccgtgaaa gcggcggtgc ccgccacccg ggagggtggc gggcaccgct ttttcggcct 60 gctgggtcta ccggaccacc tgagctagca aatctagaaa a 101

Claims (20)

  1. 스트렙토마이시스 베네주엘래(Streptomyces venezuelae)에 코돈 최적화된 에포틸론 생합성 유전자인 epoA(서열번호 1), epoP(서열번호 2), epoB(서열번호 3), 및 epoC(서열번호 4)와, 소란지움 셀룰로섬(Sorangium cellulosum)에서 유래한 유전자간 영역(intergenic region)을 포함하는 에포틸론 발현 카세트로서, 상기 유전자간 영역은 epoA 유전자의 업스트림에 위치하는 영역(서열번호 11), epoP와 epoB 유전자 사이에 위치하는 영역(서열번호 12), 및 epoC 유전자의 다운스트림에 위치하는 영역(서열번호 13)을 포함하는 군에서 이루어진 어느 하나 이상인, 에포틸론 발현 카세트.
  2. 삭제
  3. 스트렙토마이시스 베네주엘래(Streptomyces venezuelae)에 코돈 최적화된 에포틸론 생합성 유전자인 epoD(서열번호 5), epoE(서열번호 6), epoF(서열번호 7), orf6(서열번호 8), orf3(서열번호 9), 및 orf14(서열번호 10)와, 소란지움 셀룰로섬(Sorangium cellulosum)에서 유래한 유전자간 영역(intergenic region)을 포함하는 에포틸론 발현 카세트로서, 상기 유전자간 영역은 epoD 유전자의 업스트림에 위치하는 영역(서열번호 14), epoD와 epoE 유전자 사이에 위치하는 영역(서열번호 15), epoE와 epoF 유전자 사이에 위치하는 영역(서열번호 16), epoF와 orf6 유전자 사이에 위치하는 영역(서열번호 17), orf6과 orf3 유전자 사이에 위치는 영역(서열번호 18), orf3과 orf14 유전자 사이에 위치하는 영역(서열번호 19), 및 epoC 유전자의 다운스트림에 위치하는 영역(서열번호 20)을 포함하는 군에서 이루어진 어느 하나 이상인, 에포틸론 발현 카세트.
  4. 삭제
  5. 스트렙토마이시스 베네주엘래(Streptomyces venezuelae)에 코돈 최적화된 에포틸론 생합성 유전자인 epoA(서열번호 1), epoP(서열번호 2), epoB(서열번호 3), 및 epoC(서열번호 4)와, 스트렙토마이시스 베네주엘래의 피크로마이신(pikromycin) 또는 데소사민(desosamin) 생합성 유전자 집단에서 유래한 유전자간 영역(intergenic region)을 포함하는 에포틸론 발현 카세트로서, 상기 유전자간 영역은 epoP와 epoB 유전자 사이에 위치하는 영역(서열번호 21), 및 epoC 유전자의 다운스트림에 위치하는 영역(서열번호 22)을 포함하는 군에서 이루어진 어느 하나 이상인, 에포틸론 발현 카세트.
  6. 삭제
  7. 스트렙토마이시스 베네주엘래(Streptomyces venezuelae)에 코돈 최적화된 에포틸론 생합성 유전자인 epoD(서열번호 5), epoE(서열번호 6), epoF(서열번호 7), orf6(서열번호 8), orf3(서열번호 9), 및 orf14(서열번호 10)와, 스트렙토마이시스 베네주엘래의 피크로마이신(pikromycin) 또는 데소사민(desosamin) 생합성 유전자 집단에서 유래한 유전자간 영역(intergenic region)을 포함하는 에포틸론 발현 카세트로서, 상기 유전자간 영역은 epoD와 epoE 유전자 사이에 위치하는 영역(서열번호 23), epoE와 epoF 유전자 사이에 위치하는 영역(서열번호 24), epoF와 orf6 유전자 사이에 위치하는 영역(서열번호 25), orf6과 orf3 유전자 사이에 위치하는 영역(서열번호 26), orf3과 orf14 유전자 사이에 위치하는 영역(서열번호 27), 및 orf14 유전자의 다운스트림에 위치하는 영역(서열번호 28)을 포함하는 군에서 이루어진 어느 하나 이상인, 에포틸론 발현 카세트.
  8. 삭제
  9. 스트렙토마이시스 베네주엘래(Streptomyces venezuelae)에 코돈 최적화된 에포틸론 생합성 유전자인 epoA(서열번호 1), epoP(서열번호 2), epoB(서열번호 3), epoC(서열번호 4), epoD(서열번호 5), epoE(서열번호 6), epoF(서열번호 7), orf6(서열번호 8), orf3(서열번호 9), 및 orf14(서열번호 10)와, 스트렙토마이시스 베네주엘래의 피크로마이신(pikromycin) 또는 데소사민(desosamin) 생합성 유전자 집단에서 유래한 유전자간 영역(intergenic region)을 포함하는 에포틸론 발현 카세트로서, 상기 유전자간 영역은 epoP와 epoB 유전자 사이에 위치하는 영역(서열번호 21), epoC 유전자의 다운스트림에 위치하는 영역(서열번호 22), epoD와 epoE 유전자 사이에 위치하는 영역(서열번호 23), epoE와 epoF 유전자 사이에 위치하는 영역(서열번호 24), epoF와 orf6 유전자 사이에 위치하는 영역(서열번호 25), orf6과 orf3 유전자 사이에 위치하는 영역(서열번호 26), orf3과 orf14 유전자 사이에 위치하는 영역(서열번호 27), 및 orf14 유전자의 다운스트림에 위치하는 영역(서열번호 28)을 포함하는 군에서 이루어진 어느 하나 이상인, 에포틸론 발현 카세트.
  10. 삭제
  11. 제1항, 제3항, 제5항, 제7항, 및 제9항 중 어느 한 항에 따른 에포틸론 발현 카세트를 포함하는, 에포틸론 발현용 벡터.
  12. pDHS702, pDHS618, pSBAC, 및 pSET152로 이루어지는 군에서 선택되는 어느 하나의 벡터에 제1항, 제3항, 제5항, 제7항, 및 제9항 중 어느 한 항에 따른 에포틸론 발현 카세트를 포함하는, 에포틸론 발현용 벡터.
  13. 제11항에 따른 에포틸론 발현용 벡터가 하나 이상 도입된 스트렙토마이시스 베네주엘래를 배양하는 단계를 포함하는, 에포틸론 A, B, C, 및 D을 포함하는 군에서 선택되는 어느 하나 이상의 에포틸론의 제조방법.
  14. epoA(서열번호 1), epoP(서열번호 2), epoB(서열번호 3), 및 epoC(서열번호 4)를 포함하는 제1항, 및 제5항 중 어느 한 항에 따른 제1 발현 카세트, 및 epoD(서열번호 5), epoE(서열번호 6), epoF(서열번호 7), orf6(서열번호 8), orf3(서열번호 9), 및 orf14(서열번호 10)를 포함하는 제3항, 제7항, 및 제9항 중 어느 한 항에 따른 제2 발현 카세트를 포함하는 군에서 선택되는 어느 하나 이상의 발현 카세트를 포함하는 에포틸론 발현용 벡터가 도입된 스트렙토마이시스 베네주엘래를 배양하는 단계를 포함하는, 에포틸론 A, B, C, 및 D을 포함하는 군에서 선택되는 어느 하나 이상의 에포틸론의 제조방법.
  15. 제14항에 있어서,
    상기 발현 카세트는 pDHS702, pDHS618, pSBAC, 및 pSET152로 이루어지는 군에서 선택되는 어느 하나의 벡터에 합성된 것인, 에포틸론의 제조방법.
  16. (a) pDHS702 벡터에 제1항에 따른 에포틸론 발현 카세트를 포함하는 pDHS702-optSoC_APBC_Sv;
    (b) pDHS618 벡터에 제3항에 따른 에포틸론 발현 카세트를 포함하는 pDHS618-optSoC_DEF_Sv;
    (c) pDHS702 벡터에 제5항에 따른 에포틸론 발현 카세트를 포함하는 pDHS702-optPD_APBC_Sv;
    (d) pDHS618 벡터에 제7항에 따른 에포틸론 발현 카세트를 포함하는 pDHS618-optPD_DEF_Sv;
    (e) pSBAC 벡터에 제1항에 따른 에포틸론 발현 카세트를 포함하는 pSBAC-optSoC_APBC_Sv;
    (f) pSBAC 벡터에 제3항에 따른 에포틸론 발현 카세트를 포함하는 pSBAC-optSoC_DEF_Sv;
    (g) pSBAC 벡터에 제5항 및 제7항에 따른 에포틸론 발현 카세트를 포함하는 pSBAC-optPD_APBCDEF_Sv;
    (h) pSET152 벡터에 제3항에 따른 에포틸론 발현 카세트를 포함하는 pSET152-optSoC_DEF_Sv; 및
    (i) pSET152 벡터에 제7항에 따른 에포틸론 발현 카세트를 포함하는 pSET152-optPD_DEF_Sv를 포함하는 군에서 선택되는 어느 하나 이상의 벡터가 도입된 스트렙토마이시스 베네주엘래를 배양하는 단계를 포함하는, 에포틸론 A, B, C, 및 D을 포함하는 군에서 선택되는 어느 하나 이상의 에포틸론의 제조방법.
  17. 제16항에 있어서,
    상기 벡터 pDHS702-optSoC_APBC_Sv 및 pDHS618-optSoC_DEF_Sv가 도입된 스트렙토마이시스 베네주엘래를 배양하는 단계를 포함하는, 에포틸론의 제조방법.
  18. 제16항에 있어서,
    상기 벡터 pDHS702-optPD_APBC_Sv 및 pDHS618-optPD_DEF_Sv가 도입된 스트렙토마이시스 베네주엘래를 배양하는 단계를 포함하는, 에포틸론의 제조방법.
  19. 제16항에 있어서,
    상기 벡터 pSBAC-optSoC_APBC_Sv 및 pSBAC-optSoC_DEF_Sv가 도입된 스트렙토마이시스 베네주엘래를 배양하는 단계를 포함하는, 에포틸론의 제조방법.
  20. 제16항에 있어서,
    상기 벡터 pSBAC-optSoC_APBCDEF_Sv가 도입된 스트렙토마이시스 베네주엘래를 배양하는 단계를 포함하는, 에포틸론의 제조방법.
KR1020140067238A 2014-06-02 2014-06-02 에포틸론 발현 카세트 및 이의 용도 KR101606635B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020140067238A KR101606635B1 (ko) 2014-06-02 2014-06-02 에포틸론 발현 카세트 및 이의 용도

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140067238A KR101606635B1 (ko) 2014-06-02 2014-06-02 에포틸론 발현 카세트 및 이의 용도

Publications (2)

Publication Number Publication Date
KR20150139149A KR20150139149A (ko) 2015-12-11
KR101606635B1 true KR101606635B1 (ko) 2016-03-28

Family

ID=55020367

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140067238A KR101606635B1 (ko) 2014-06-02 2014-06-02 에포틸론 발현 카세트 및 이의 용도

Country Status (1)

Country Link
KR (1) KR101606635B1 (ko)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1135470A2 (en) * 1998-11-20 2001-09-26 Kosan Biosciences, Inc. Recombinant methods and materials for producing epothilone and epothilone derivatives
KR100949313B1 (ko) * 2008-02-21 2010-03-23 이화여자대학교 산학협력단 에포틸론 발현용 재조합벡터 및 이를 이용한스트렙토마이세스 베네주엘라에에서의 에포틸론 생산방법

Also Published As

Publication number Publication date
KR20150139149A (ko) 2015-12-11

Similar Documents

Publication Publication Date Title
DK2271666T3 (da) Nrps-pks-gengruppe og dens manipulation og anvendelighed
CA2506669A1 (en) Borrelidin-producing polyketide synthase and its uses
KR20180093083A (ko) 켈리마이신 생합성 유전자 클러스터
KR20100039443A (ko) 답토마이신 생합성 유전자 클러스터에 관련된 조성물 및 방법
KR20040099138A (ko) 항생물질의 생합성을 위한 스트렙토마이세스시아네오그리세우스 아종 논시아노게누스 유래의 유전자클로닝 및 사용 방법
CN107794286B (zh) 一种环脂肽类化合物生物合成基因簇及其激活方法与应用
CN108048472B (zh) 一株高效异源表达Disorazole Z的工程菌株和构建该菌株的基因簇及其应用
CN107540682B (zh) 曲张链丝菌素衍生物及其制备方法和应用
KR101833984B1 (ko) 밀베마이신을 생산하는 재조합 미생물 및 이를 이용한 밀베마이신 생산 방법
CN111607603B (zh) Hangtaimycin生物合成基因簇及其应用
CN111378008B (zh) 脂肽类化合物Totopotensamides及其制备方法和应用
CN110857447B (zh) 提高米尔贝霉素a3/a4或其衍生物产量的方法
KR101606635B1 (ko) 에포틸론 발현 카세트 및 이의 용도
US20040247620A1 (en) Transformation system based on the integrase gene and attachment site for Myxococcus xanthus bacteriophage Mx9
KR101601424B1 (ko) 에포틸론 발현용 벡터 및 이의 용도
KR102159415B1 (ko) Uk-2 생합성 유전자 및 그것을 사용한 uk-2 생산성을 향상시키기 위한 방법
KR101736540B1 (ko) 방선균에서 에포틸론 생산을 증대시키기 위한 에포틸론의 전구체, 및 이를 이용한 에포틸론의 생산 방법
US20030171562A1 (en) Genes and proteins for the biosynthesis of polyketides
KR100882692B1 (ko) 부테닐-스피노신 살충제 생산을 위한 생합성 유전자
CN107164394B (zh) 一种非典型角环素类化合物nenestatin A的生物合成基因簇及其应用
CN107541523B (zh) 曲张链丝菌素生物合成基因簇及其应用
KR102017788B1 (ko) 밀베마이신 d를 생산하는 재조합 미생물 및 밀베마이신 d 생산 방법
CN110129244B (zh) 链霉菌底盘菌株及其构建方法、在异源表达研究中的应用
KR101610970B1 (ko) 갈보놀라이드 생합성에 관여하는 유전자
KR100549690B1 (ko) 에프알-008 폴리케타이드 합성에 관여하는 유전자

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20200102

Year of fee payment: 5