KR101606635B1 - 에포틸론 발현 카세트 및 이의 용도 - Google Patents
에포틸론 발현 카세트 및 이의 용도 Download PDFInfo
- Publication number
- KR101606635B1 KR101606635B1 KR1020140067238A KR20140067238A KR101606635B1 KR 101606635 B1 KR101606635 B1 KR 101606635B1 KR 1020140067238 A KR1020140067238 A KR 1020140067238A KR 20140067238 A KR20140067238 A KR 20140067238A KR 101606635 B1 KR101606635 B1 KR 101606635B1
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- epothilone
- vector
- expression cassette
- genes
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/76—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Actinomyces; for Streptomyces
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P17/00—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
- C12P17/16—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing two or more hetero rings
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/33—Heterocyclic compounds
- A61K31/395—Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins
- A61K31/41—Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins having five-membered rings with two or more ring hetero atoms, at least one of which being nitrogen, e.g. tetrazole
- A61K31/425—Thiazoles
- A61K31/427—Thiazoles not condensed and containing further heterocyclic rings
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07D—HETEROCYCLIC COMPOUNDS
- C07D417/00—Heterocyclic compounds containing two or more hetero rings, at least one ring having nitrogen and sulfur atoms as the only ring hetero atoms, not provided for by group C07D415/00
- C07D417/02—Heterocyclic compounds containing two or more hetero rings, at least one ring having nitrogen and sulfur atoms as the only ring hetero atoms, not provided for by group C07D415/00 containing two hetero rings
- C07D417/06—Heterocyclic compounds containing two or more hetero rings, at least one ring having nitrogen and sulfur atoms as the only ring hetero atoms, not provided for by group C07D415/00 containing two hetero rings linked by a carbon chain containing only aliphatic carbon atoms
Abstract
본 발명은 스트렙토마이시스 베네주엘래(Streptomyces venezuelae)에 코돈 최적화된 에포틸론 생합성 유전자와 유전자간 영역(intergenic region)을 포함하는 에포틸론 발현 카세트, 이를 포함하는 에포틸론 발현용 벡터, 및 이를 이용한 에포틸론의 제조방법에 관한 것으로, 본 발명에 따른 에포틸론 발현 카세트 및 발현용 벡터는 생장속도가 빠르고, 유전자 조작이 용이한 이종숙주 스트렙토마이시스 베네주엘래에 도입할 수 있어, 단시간 동안 높은 수율로 에포틸론을 생산할 수 있으며, 본 발명에 따른 에포틸론의 생산방법에 의하여 생산된 에포틸론은 항암물질으로 유용하게 사용할 수 있다.
Description
본 발명은 스트렙토마이시스 베네주엘래(Streptomyces venezuelae)에 코돈 최적화된 에포틸론 생합성 유전자와 유전자간 영역(intergenic region)을 포함하는 에포틸론 발현 카세트, 이를 포함하는 에포틸론 발현용 벡터, 및 이를 이용한 에포틸론의 제조방법에 관한 것이다.
식물 및 미생물 등에서 생산되는 폴리케타이드(polyketide) 계열의 화합물은 복잡한 구조의 천연 화합물(natural product)로서, 현재까지 약 10,000 가지 이상의 화합물이 알려져 있다. 그 중 에포틸론은 16환계 폴리케타이드 매크로락톤(16-membered polyketide macrolactone)의 일종으로 항암 화학요법제인 탁솔(Taxol)과 유사하게 튜불린(tubulin)에 결합하여 미세소관(microtubule)의 분해를 억제하는 강력한 항암제이다.
에포틸론 B로부터 반합성 되는 익사베필론(성분명: Ixabepilone, 상품명: Ixampra, Bristol-Myers Squibb)은 2007년 하반기에 유방암의 치료제로 FDA의 승인을 얻었다. 특히 안트라사이클린계(anthracycline)와 탁산계(taxane) 치료에 내성이 생겼거나, 또는 탁산계에 내성이 있고 더 이상의 안트라사이클린계 치료가 금기인 전이성 유방암 또는 국소 진행성 유방암의 치료에 사용이 가능하다. 또한 익사베필론은 탁솔과 다르게 부작용을 유발하는 가용화제(solubilizing agent) 없이 제형화할 수 있으며, 통상적인 화학 치료법(chemotherapy)에 내성이 있는 암세포에 강한 항암 작용을 보이는 장점이 있어 차세대 항암제로 대두되고 있다.
에포틸론의 생산은 믹소박테리움(myxobacterium)인 소란지움 셀룰로섬(Sorangium cellulosum)에 의해 생산되는 이차대사산물로써 분리되었으나, 16시간에 이르는 긴 생장시간(doubling time)과 유전자 조작의 어려움으로 인하여 그 산업적 생산을 위한 유용성이 떨어지는 문제점이 있다.
한편, 경제적산업적 가치가 매우 높으나 목적하는 이차대사산물의 대량생산에 기술적 어려움이 있는 경우, 현재의 화학합성을 대체할 수 있는 효율적 방안 중 하나로 대량 생산하고자 하는 이차대사산물의 생합성 유전자집단을 자연생산 생물체로부터 확보하고, 이를 최적화된 이종숙주에서 발현하는 이중숙주 생산시스템(heterologous expression system)이 연구되고 있다. 미국 및 독일의 연구팀에서 이중숙주 생산시스템을 이용하여 스트렙토마이시스 실리칼라(Streptomyces coelicolor), 믹소코쿠스 잔서스(Myxococcus xanthus), 에스케리치아 콜라이(Escherichia coli), 그리고 스트렙토마이시스 베네주엘래에서 에포틸론의 생합성을 시도하여 왔다. 독일 Rolf Mller 연구팀에서는 에포틸론 생합성 유전자를 최적화하여 합성한 후 믹소코쿠스 잔서스에서 발현하는 기술(Oβwald C et al., ACS Synth Biol., 2012. 10)을 보고한 바 있다.
또한, 본 발명자들은 방선균 중 스트렙토마이시스 베네주엘래(Streptomyces venezuelae)에서의 에포틸론 생산방법에 대하여 출원한 바 있다(한국 특허등록 제 10-0949313호). 그러나 상기 발명들은 에포틸론 B의 경우 약 0.1㎍/L, 에포틸론 D의 경우 약 0.4㎍/L의 수율을 나타내어, 에포틸론을 산업 수요에 맞추어 생산할 만큼 수율이 높지 않다는 문제가 있었는바, 에포틸론의 생산 효율을 높이기 위한 기술이 여전히 요구되고 있다.
이러한 배경 하에, 본 발명자들은 유용한 항암물질인 에포틸론의 수율을 높이는 방법을 개발하고자 예의 연구 노력한 결과, 에포틸론 생합성 유전자집단을 이종숙주 스트렙토마이시스 베네주엘래(Streptomyces venezuelae)에 적합하도록 최적화하여 합성하고, 상기 합성된 유전자 사이에 소란지움 셀룰로섬 유래, 또는 스트렙토마이시스 베네주엘래의 피크로마이신(pikromycin) 또는 데소사민(desosamin) 생합성 유전자 집단 유래의 유전자간 영역(intergenic region)을 삽입한 발현 카세트를 포함하는 벡터를 스트렙토마이시스 베네주엘래에 도입할 경우 에포틸론의 수율을 현저히 향상시킴을 확인하고 본 발명을 완성하였다.
본 발명의 하나의 목적은 스트렙토마이시스 베네주엘래(Streptomyces venezuelae)에 코돈 최적화된 에포틸론 생합성 유전자인 epoA(서열번호 1), epoP(서열번호 2), epoB(서열번호 3), 및 epoC(서열번호 4)와, 소란지움 셀룰로섬(Sorangium cellulosum)에서 유래한 유전자간 영역(intergenic region)을 포함하는 에포틸론 발현 카세트를 제공하는 것이다.
본 발명의 하나의 목적은 스트렙토마이시스 베네주엘래에 코돈 최적화된 에포틸론 생합성 유전자인 epoD(서열번호 5), epoE(서열번호 6), epoF(서열번호 7), orf6(서열번호 8), orf3(서열번호 9), 및 orf14(서열번호 10)와, 소란지움 셀룰로섬에서 유래한 유전자간 영역을 포함하는 에포틸론 발현 카세트를 제공하는 것이다.
본 발명의 하나의 목적은 스트렙토마이시스 베네주엘래에 코돈 최적화된 에포틸론 생합성 유전자인 epoA, epoP, epoB, 및 epoC와, 스트렙토마이시스 베네주엘래의 피크로마이신(pikromycin) 또는 데소사민(desosamin) 생합성 유전자 집단에서 유래한 유전자간 영역을 포함하는 에포틸론 발현 카세트를 제공하는 것이다.
본 발명의 하나의 목적은 스트렙토마이시스 베네주엘래에 코돈 최적화된 에포틸론 생합성 유전자인 epoD, epoE, epoF, orf6, orf3, 및 orf14와, 스트렙토마이시스 베네주엘래의 피크로마이신 또는 데소사민 생합성 유전자 집단에서 유래한 유전자간 영역을 포함하는 에포틸론 발현 카세트를 제공하는 것이다.
본 발명의 하나의 목적은 스트렙토마이시스 베네주엘래에 코돈 최적화된 에포틸론 생합성 유전자인 epoA(서열번호 1), epoP(서열번호 2), epoB(서열번호 3), epoC(서열번호 4), epoD(서열번호 5), epoE(서열번호 6), epoF(서열번호 7), orf6(서열번호 8), orf3(서열번호 9), 및 orf14(서열번호 10)와, 스트렙토마이시스 베네주엘래의 피크로마이신 또는 데소사민 생합성 유전자 집단에서 유래한 유전자간 영역을 포함하는 에포틸론 발현 카세트를 제공하는 것이다.
본 발명의 다른 목적은 상기 에포틸론 발현 카세트를 포함하는, 에포틸론 발현용 벡터를 제공하는 것이다.
본 발명의 또 다른 목적은 상기 에포틸론 발현용 벡터가 하나 이상 도입된 스트렙토마이시스 베네주엘래를 배양하는 단계를 포함하는, 에포틸론 A, B, C, 및 D을 포함하는 군에서 선택되는 어느 하나 이상의 에포틸론의 제조방법을 제공하는 것이다.
상기의 목적을 달성하기 위한 하나의 양태로서, 본 발명은 스트렙토마이시스 베네주엘래(Streptomyces venezuelae)에 코돈 최적화된 에포틸론 생합성 유전자와, 하나 이상의 유전자간 영역(intergenic region)을 포함하는 에포틸론 발현 카세트를 제공한다.
본 발명에서 용어, "에포틸론"은 메틸티아졸(methylthiazole)기가 올레핀 결합(olefinic bond)에 의하여 결합된 16환계 폴리케타이드 매크로락톤(polyketide macrolactone)의 일종으로, 저성장(low-growing) 믹소박테리움(myxobacterium)인 소란지움 셀룰로섬에 의해 생산되는 이차 대사산물로써 최초 분리되었다. 상기 에포틸론은 하기 화학식 1로 표시되며 R이 H인 에포틸론 A, 하기 화학식 1로 표시되며 R이 CH3인 에포틸론 B, 하기 화학식 2로 표시되며 R이 H인 에포틸론 C, 하기 화학식 2로 표시되며 R이 CH3인 에포틸론 D를 포함할 수 있다. 에포틸론 C와 D는 에포틸론 A와 B의 생합성 초기단계의 중간물질이다.
본 발명의 에포틸론은, 에포틸론의 유사체, 유도체, 익사베필론을 포함하는 의미로 사용될 수 있다.
상기 에포틸론은 튜불린 중합 에세이에서 항종양 활성을 가지는 것으로 보고되었으며(Bollag, D. et al., Cancer Res., 55:2325, 1995), 탁솔이나 탁소텔 등의 항암제처럼 미세소관(microtubule)을 안정화시키고 세포 분열을 억제함으로써 암 세포의 증식을 막는 것으로 알려져 있는 유용한 의약품의 원료이다.
본 발명에서 용어, "발현 카세트"란, 에포틸론 생합성 유전자를 포함하고 있어서 에포틸론을 발현시킬 수 있는 단위 카세트를 의미한다. 또한, 본 발명에서 발현 카세트는 발현구조체와 혼용될 수 있다. 본 발명에 따른 발현 카세트는 본 발명의 목적 상, 스트렙토마이시스 베네주엘래에 도입되어 에포틸론을 생산할 수 있다.
본 발명에서 용어, "코돈 최적화(codon optimization)"는 코돈의 숙주에서의 에포틸론 생합성 유전자의 발현을 보다 효율적으로 하기 위하여 유전자의 코돈을 상기 숙주 유전자에서 높은 빈도로 사용되는 코돈으로 치환하는 것을 의미한다.
상기 숙주는 본 발명의 벡터가 도입되어 에포틸론을 제조할 수 있는 세포는 제한 없이 포함되나, 바람직하게는 방선균, 스트렙토마이시스 속이며, 더욱 바람직하게는 스트렙토마이시스 베네주엘래(Streptomyces venezuelae) 또는 스트렙토마이시스 실리칼라(Streptomyces coelicolor)이다. 스트렙토마이시스 베네주엘래와 스트렙토마이시스 실리칼라는 방선균의 일종으로, 스트렙토마이시스 속에 속하는 토양 미생물이며 그람 양성균이다.
상기 에포틸론 생합성 유전자는 바람직하게는 소란지움 셀룰로섬에서 유래한 유전자일 수 있다.
소란지움 셀룰로섬은 기존에 에포틸론을 생산하는 점액 세균으로 이용되어 왔다. 그러나 소란지움 셀룰로섬은 에포틸론의 수율이 낮을 뿐만 아니라 생장시간(더블링 타임)이 길며 유전자 조작의 곤란으로 인하여 유용성이 떨어진다는 단점이 있었다. 또한 에포틸론의 유기합성방법이 보고된바 있지만, 합성방법이 복잡하다는 단점이 있다. 최근, 에포틸론 생합성 유전자 클러스터의 규명으로 인하여 대장균(E. coli)에서의 에포틸론의 이종생산이 연구되고 있으나, 생산되는 에포틸론의 양이 채 1㎍/L도 되지 않으며, 낮은 온도에서(15℃) 장기간 배양(6일)이 요구되는 단점이 있었다.
이에 본 발명자들은 에포틸론의 생산수율을 향상시키기 위하여 이종숙주로 스트렙토마이시스 베네주엘래를 사용하고 이종숙주에 코돈 최적화된 에포틸론 생합성 유전자를 포함하는 벡터를 완성하였다.
본 발명의 에포틸론 생합성 유전자는 에포틸론의 생합성에 필요한 epoA , epoP , epoB , epoC , epoD, epoE, epoF, orf6 , orf3 , 및 orf14으로 이루어진 군에서 선택되는 어느 하나 이상의 유전자를 의미한다. 상기 유전자는 본 발명의 목적 상, 스트렙토마이시스 베네주엘래에 코돈 최적화된 서열로서 서열번호 1로 표시되는 염기서열을 갖는 epoA, 서열번호 2로 표시되는 염기서열을 갖는 epoP, 서열번호 3으로 표시되는 염기서열을 갖는 epoB , 서열번호 4로 표시되는 염기서열을 갖는 epoC , 서열번호 5로 표시되는 염기서열을 갖는 epoD, 서열번호 6로 표시되는 염기서열을 갖는 epoE, 서열번호 7으로 표시되는 염기서열을 갖는 epoF, 서열번호 8로 표시되는 염기서열을 갖는 orf6 , 서열번호 9으로 표시되는 염기서열을 갖는 orf3 , 및 서열번호 10로 표시되는 염기서열을 갖는 orf14이다.
본 발명에서 용어, "유전자간 영역(intergenic region)"은 유전자와 유전자 사이에 위치하는 DNA서열로, 비해독성(noncoding) 부분을 의미한다(Tropp, Burton E. (2008). Molecular Biology: Genes to Proteins). 이는 인트라제닉 영역(intragenic region)인 인트론(intron)과는 차이가 있다. 유전자간 영역은 기능이 없는 것으로 알려져 있을 뿐, 발현 유전자의 특이적인 발현 증대를 위한 유전자간 영역이 어느 부분인지는 전혀 보고된 바 없다.
본 발명자들은 상기 유전자간 영역으로 소란지움 셀룰로섬의 유전자간 영역, 또는 이종숙주로 사용되는 스트렙토마이시스 베네주엘래의 피크로마이신 또는 데소사민 유전자 집단의 유전자간 영역을 사용하여 벡터를 제조한 결과, 에포틸론 유전자의 발현이 매우 향상되어 에포틸론의 수율이 향상됨을 확인하였다.
하나의 구체예로서, 본 발명의 에포틸론 발현 카세트는 스트렙토마이시스 베네주엘래에 코돈 최적화된 에포틸론 생합성 유전자인 epoA(서열번호 1), epoP(서열번호 2), epoB(서열번호 3), 및 epoC(서열번호 4)와, 소란지움 셀룰로섬에서 유래한 유전자간 영역을 포함하는 것일 수 있다.
상기 유전자간 영역은 epoA 유전자의 업스트림에 위치하는 영역(서열번호 11), epoP와 epoB 유전자 사이에 위치하는 영역(서열번호 12), 및 epoC 유전자의 다운스트림에 위치하는 영역(서열번호 13)을 포함하는 군에서 이루어진 어느 하나일 수 있다. 바람직하게는 상기 3개의 모든 영역을 포함할 수 있다.
상기 유전자간 영역을 포함하는 본 발명의 에포틸론 발현 카세트가 pDHS702 벡터에 합성된 벡터 pDHS702-optSoC_APBC_Sv의 개열지도를 도 1a에 도시하였으며, 본 발명의 에포틸론 발현 카세트가 pSBAC벡터에 합성된 벡터 pSBAC-optSoC_APBC_Sv의 개열지도를 도 3a에 도시하였다.
또 하나의 구체예로서, 본 발명의 에포틸론 발현 카세트는 스트렙토마이시스 베네주엘래에 코돈 최적화된 에포틸론 생합성 유전자인 epoD(서열번호 5), epoE(서열번호 6), epoF(서열번호 7), orf6(서열번호 8), orf3(서열번호 9), 및 orf14(서열번호 10)와, 소란지움 셀룰로섬에서 유래한 유전자간 영역을 포함하는 것일 수 있다.
상기 유전자간 영역은 epoD 유전자의 업스트림에 위치하는 영역(서열번호 14), epoD와 epoE 유전자 사이에 위치하는 영역(서열번호 15), epoE와 epoF 유전자 사이에 위치하는 영역(서열번호 16), epoF와 orf6 유전자 사이에 위치하는 영역(서열번호 17), orf6과 orf3 유전자 사이에 위치는 영역(서열번호 18), orf3과 orf14 유전자 사이에 위치하는 영역(서열번호 19), 및 epoC 유전자의 다운스트림에 위치하는 영역(서열번호 20)을 포함하는 군에서 이루어진 어느 하나일 수 있다. 바람직하게는 상기 7개의 모든 영역을 포함할 수 있다.
상기 유전자간 영역을 포함하는 본 발명의 에포틸론 발현 카세트가, pDHS618 벡터에 합성된 벡터 pDHS618-optSoC_DEF_Sv의 개열지도는 도 1b에 도시하였으며, pSBAC 벡터에 합성된 벡터 pSBAC-optSoC_DEF_Sv의 개열지도는 도 3b에 도시하였고, pSET152 벡터에 합성된 벡터 pSET152-optSoC_DEF_Sv의 개열지도는 도 4a에 도시하였다.
또 하나의 구체예로서, 본 발명의 에포틸론 발현 카세트는 스트렙토마이시스 베네주엘래에 코돈 최적화된 에포틸론 생합성 유전자인 epoA(서열번호 1), epoP(서열번호 2), epoB(서열번호 3), 및 epoC(서열번호 4)와, 스트렙토마이시스 베네주엘래의 피크로마이신 또는 데소사민 생합성 유전자 집단에서 유래한 유전자간 영역을 포함하는 것일 수 있다. 스트렙토마이시스 베네주엘래는 PKS 유전자 클러스터로부터 항생제로 사용되는 피크로마이신을 생산하며 PKS는 6개의 모듈로 구성되어 있다. 본 발명자들은 유전자간 영역을 이종숙주인 스트렙토마이시스 베네주엘래가 본래 보유하고 있는 것으로서, 피크로마이신 또는 데소사민 생합성 유전자 집단에서 유래한 유전자간 영역을 벡터에 도입한 결과, 에포틸론의 생합성 수율이 향상됨을 확인하였다. 바람직하게 상기 유전자간 영역은 epoP와 epoB 유전자 사이에 위치하는 영역(서열번호 21), 및 epoC 유전자의 다운스트림에 위치하는 영역(서열번호 22)을 포함하는 군에서 이루어진 어느 하나일 수 있다. 바람직하게는 상기 2개의 모든 영역을 포함할 수 있다.
상기 유전자간 영역을 포함하는 본 발명의 에포틸론 발현 카세트가, pDHS702 벡터에 합성된 벡터 pDHS702-optPD_APBC_Sv의 개열지도는 도 2a에 도시하였다.
또 하나의 구체예로서, 본 발명의 에포틸론 발현 카세트는 스트렙토마이시스 베네주엘래에 코돈 최적화된 에포틸론 생합성 유전자인 epoD(서열번호 5), epoE(서열번호 6), epoF(서열번호 7), orf6(서열번호 8), orf3(서열번호 9), 및 orf14(서열번호 10)와, 스트렙토마이시스 베네주엘래의 피크로마이신 또는 데소사민 생합성 유전자 집단에서 유래한 유전자간 영역을 포함하는 것일 수 있다.
상기 유전자간 영역은 epoD와 epoE 유전자 사이에 위치하는 영역(서열번호 23), epoE와 epoF 유전자 사이에 위치하는 영역(서열번호 24), epoF와 orf6 유전자 사이에 위치하는 영역(서열번호 25), orf6과 orf3 유전자 사이에 위치하는 영역(서열번호 26), orf3과 orf14 유전자 사이에 위치하는 영역(서열번호 27), 및 orf14 유전자의 다운스트림에 위치하는 영역(서열번호 28)을 포함하는 군에서 이루어진 어느 하나일 수 있다. 바람직하게는 상기 6개의 모든 영역을 포함할 수 있다.
상기 유전자간 영역을 포함하는 본 발명의 에포틸론 발현 카세트가, pDHS618 벡터에 합성된 벡터 pDHS618-optPD_DEF_Sv의 개열지도는 도 2b에 도시하였고, 본 발명의 에포틸론 발현 카세트가, pSET152 벡터에 합성된 벡터 pSET152-optPD_DEF_Sv의 개열지도는 도 4b에 도시하였다.
또 하나의 구체예로서, 본 발명의 에포틸론 발현 카세트는 스트렙토마이시스 베네주엘래에 코돈 최적화된 에포틸론 생합성 유전자인 epoA(서열번호 1), epoP(서열번호 2), epoB(서열번호 3), epoC(서열번호 4), epoD(서열번호 5), epoE(서열번호 6), epoF(서열번호 7), orf6(서열번호 8), orf3(서열번호 9), 및 orf14(서열번호 10)와, 스트렙토마이시스 베네주엘래의 피크로마이신 또는 데소사민 생합성 유전자 집단에서 유래한 유전자간 영역을 포함하는 것일 수 있다.
상기 유전자간 영역은 epoP와 epoB 유전자 사이에 위치하는 영역(서열번호 21), epoC 유전자의 다운스트림에 위치하는 영역(서열번호 22), epoD와 epoE 유전자 사이에 위치하는 영역(서열번호 23), epoE와 epoF 유전자 사이에 위치하는 영역(서열번호 24), epoF와 orf6 유전자 사이에 위치하는 영역(서열번호 25), orf6과 orf3 유전자 사이에 위치하는 영역(서열번호 26), orf3과 orf14 유전자 사이에 위치하는 영역(서열번호 27), 및 orf14 유전자의 다운스트림에 위치하는 영역(서열번호 28)을 포함할 수 있다.
상기 유전자간 영역을 포함하는 본 발명의 에포틸론 발현 카세트가, pSBAC 벡터에 합성된 벡터 pSBAC-optPD_APBCDEF_Sv의 개열지도는 도 3c에 도시하였다.
또 하나의 양태로서, 본 발명은 상기 에포틸론 발현 카세트를 포함하는, 에포틸론 발현용 벡터를 제공한다.
본 발명에서 용어, "벡터"는 숙주세포에 DNA를 도입하여 에포틸론을 미생물에서 효율적으로 발현시키기 위한 수단으로서, 상기 벡터의 제작 시에는 에포틸론 생합성 유전자뿐만 아니라, 에포틸론을 생산하고자 하는 숙주세포의 종류에 따라 프로모터(promoter), 종결자(terminator), 인핸서(inhancer) 등과 같은 발현 조절 서열, 막 표적화 또는 분비를 위한 서열 등을 적절히 선택하고 목적에 따라 다양하게 조합할 수 있다.
상기 에포틸론 발현 카세트가 벡터에 포함되는 방법은 특별히 제한되지 아니하며 당해 기술 분야에서 통상적으로 사용되는 방법이라면 어느 것이든 사용할 수 있다.
상기 벡터는 pDHS702, pDHS618, pSBAC, 및 pSET152로 이루어지는 군에서 선택되는 어느 하나의 벡터에 합성된 것일 수 있다.
상기 pDHS702 벡터에 합성되는 벡터는 pDHS702-optSoC_APBC_Sv 또는 pDHS702-optPD_APBC_Sv일 수 있다. 또 다른 구체예로서, 상기 pDHS618 벡터에 합성되는 벡터는 pDHS618-optSoC_DEF_Sv 또는 pDHS618-optPD_DEF_Sv일 수 있다. 상기 벡터 pSBAC에 합성되는 벡터는 pSBAC-optSoC_APBC_Sv, pSBAC-optSoC_DEF_Sv, 또는 pSBAC-optPD_APBCDEF_Sv일 수 있다. 상기 pSET152 벡터에 합성되는 벡터는 pSET152-optSoC_DEF_Sv 또는 pSET152-optPD_DEF_Sv 일 수 있다.
하나의 구체예로서, 본 발명의 벡터는 pDHS702-optSoC_APBC_Sv일 수 있다. 상기 벡터 pDHS702-optSoC_APBC_Sv는 pikA Ⅰ 프로모터를 사용하는 pDHS702 벡터에 합성할 수 있다. 상기 벡터는 코돈 최적화된 에포틸론 생합성 유전자를 포함하며, 상기 유전자는 바람직하게는 서열번호 1로 표시되는 염기서열을 갖는 epoA, 서열번호 2로 표시되는 염기서열을 갖는 epoP, 서열번호 3으로 표시되는 염기서열을 갖는 epoB, 및 서열번호 4로 표시되는 염기서열을 갖는 epoC를 포함한다. 상기 벡터는 유전자간 영역을 하나 이상 포함하며, 상기 유전자간 영역은 epoA 유전자의 업스트림, 즉 프로모터와 epoA 유전자 사이에 위치하는 영역(서열번호 11), epoP와 epoB 유전자 사이에 위치하는 영역(서열번호 12), 및 epoC 유전자의 다운스트림에 위치하는 영역(서열번호 13) 중 어느 하나 이상을 포함할 수 있다. 바람직하게는 상기 3개의 영역을 모두 포함할 수 있다. 상기 벡터 pDHS702-optSoC_APBC_Sv의 개열지도를 도 1a에 도시하였다. 본 발명자들은 상기 벡터 pDHS702-optSoC_APBC_Sv를 스트렙토마이시스 베네주엘래에 도입하여 배양한 결과, 에포틸론 A, B, C, D의 발현이 향상됨을 확인하였다.
다른 구체예로서, 본 발명의 벡터는 pDHS618-optSoC_DEF_Sv일 수 있다. 상기 벡터 pDHS618-optSoC_DEF_Sv는 pikA Ⅰ 프로모터를 사용하는 pDHS618 벡터에 합성할 수 있다. 상기 벡터는 코돈 최적화된 에포틸론 생합성 유전자를 포함하며, 상기 유전자는 바람직하게는 epoD(서열번호 5), epoE(서열번호 6), epoF(서열번호 7), orf6(서열번호 8), orf3(서열번호 9), 및 orf14(서열번호 10)를 포함한다. 상기 벡터는 유전자간 영역을 하나 이상 포함하며, 상기 유전자간 영역은 epoD 유전자의 업스트림에 위치하는 영역(서열번호 14), epoD와 epoE 유전자 사이에 위치하는 영역(서열번호 15), epoE와 epoF 유전자 사이에 위치하는 영역(서열번호 16), epoF와 orf6 유전자 사이에 위치하는 영역(서열번호 17), orf6과 orf3 유전자 사이에 위치는 영역(서열번호 18), orf3과 orf14 유전자 사이에 위치하는 영역(서열번호 19), 및 epoC 유전자의 다운스트림에 위치하는 영역(서열번호 20) 중 어느 하나 이상을 포함할 수 있다. 바람직하게는 상기 7개의 영역을 모두 포함할 수 있다. 상기 벡터 pDHS618-optSoC_DEF_Sv의 개열지도를 도 1b에 도시하였다. 본 발명자들은 상기 벡터 pDHS618-optSoC_DEF_Sv를 스트렙토마이시스 베네주엘래에 도입하여 배양한 결과, 에포틸론 A, B, C, D의 발현이 향상됨을 확인하였다.
또 다른 구체예로서, 본 발명의 벡터는 pDHS702-optPD_APBC_Sv일 수 있다. 상기 벡터 pDHS702-optPD_APBC_Sv는 pikA Ⅰ 프로모터를 사용하는 pDHS702 벡터에 합성할 수 있다. 상기 벡터는 코돈 최적화된 에포틸론 생합성 유전자를 포함하며, 상기 유전자는 바람직하게는 서열번호 1로 표시되는 염기서열을 갖는 epoA, 서열번호 2로 표시되는 염기서열을 갖는 epoP, 서열번호 3으로 표시되는 염기서열을 갖는 epoB , 및 서열번호 4로 표시되는 염기서열을 갖는 epoC를 포함한다. 상기 벡터는 유전자간 영역을 하나 이상 포함하며, 상기 유전자간 영역은 epoP와 epoB 유전자 사이에 위치하는 영역(서열번호 21), 및 epoC 유전자의 다운스트림에 위치하는 영역(서열번호 22) 중 어느 하나 이상을 포함할 수 있다. 바람직하게는 상기 3개의 영역을 모두 포함할 수 있다. 상기 벡터 pDHS702-optPD_APBC_Sv의 개열지도를 도 2a에 도시하였다. 본 발명자들은 상기 벡터 pDHS702-optPD_APBC_Sv를 스트렙토마이시스 베네주엘래에 도입하여 배양한 결과, 에포틸론 A, B, C, D의 발현이 향상됨을 확인하였다.
또 다른 구체예로서, 본 발명의 벡터는 pDHS618-optPD_DEF_Sv일 수 있다. 상기 벡터 pDHS618-optPD_DEF_Sv는 pikA Ⅰ 프로모터를 사용하는 pDHS618 벡터에 합성할 수 있다. 상기 벡터는 코돈 최적화된 에포틸론 생합성 유전자를 포함하며, 상기 유전자는 바람직하게는 epoD(서열번호 5), epoE(서열번호 6), epoF(서열번호 7), orf6(서열번호 8), orf3(서열번호 9), 및 orf14(서열번호 10)를 포함한다. 상기 벡터는 유전자간 영역을 하나 이상 포함하며, 상기 유전자간 영역은 epoD와 epoE 유전자 사이에 위치하는 영역(서열번호 23), epoE와 epoF 유전자 사이에 위치하는 영역(서열번호 24), epoF와 orf6 유전자 사이에 위치하는 영역(서열번호 25), orf6과 orf3 유전자 사이에 위치하는 영역(서열번호 26), orf3과 orf14 유전자 사이에 위치하는 영역(서열번호 27), 및 orf14 유전자의 다운스트림에 위치하는 영역(서열번호 28) 중 어느 하나 이상을 포함할 수 있다. 바람직하게는 상기 3개의 영역을 모두 포함할 수 있다. 상기 벡터 pDHS618-optPD_DEF_Sv의 개열지도를 도 2b에 도시하였다. 본 발명자들은 상기 벡터 pDHS618-optPD_DEF_Sv를 스트렙토마이시스 베네주엘래에 도입하여 배양한 결과, 에포틸론 A, B, C, D의 발현이 향상됨을 확인하였다.
또 다른 구체예로서, 본 발명의 벡터는 pSBAC-optSoC_APBC_Sv일 수 있다. 상기 벡터 pSBAC-optSoC_APBC_Sv는 pikA Ⅰ 프로모터를 사용하는 pSBAC 벡터에 합성할 수 있다. 상기 벡터는 코돈 최적화된 에포틸론 생합성 유전자를 포함하며, 상기 유전자는 바람직하게는 서열번호 1로 표시되는 염기서열을 갖는 epoA, 서열번호 2로 표시되는 염기서열을 갖는 epoP, 서열번호 3으로 표시되는 염기서열을 갖는 epoB , 및 서열번호 4로 표시되는 염기서열을 갖는 epoC를 포함한다. 상기 벡터는 유전자간 영역을 하나 이상 포함하며, 상기 유전자간 영역은 epoA 유전자의 업스트림, 즉 프로모터와 epoA 유전자 사이에 위치하는 영역(서열번호 11), epoP와 epoB 유전자 사이에 위치하는 영역(서열번호 12), 및 epoC 유전자의 다운스트림에 위치하는 영역(서열번호 13) 중 어느 하나 이상을 포함할 수 있다. 바람직하게는 상기 3개의 영역을 모두 포함할 수 있다. 상기 벡터 pSBAC-optSoC_APBC_Sv의 개열지도를 도 3a에 도시하였다. 본 발명자들은 상기 벡터 pSBAC-optSoC_APBC_Sv를 스트렙토마이시스 베네주엘래에 도입하여 배양한 결과, 에포틸론 A, B, C, D의 발현이 향상됨을 확인하였다.
또 다른 구체예로서, 본 발명의 벡터는 pSBAC-optSoC_DEF_Sv일 수 있다. 상기 벡터 pSBAC-optSoC_DEF_Sv는 pikA Ⅰ 프로모터를 사용하는 pSBAC 벡터에 합성할 수 있다. 상기 벡터는 코돈 최적화된 에포틸론 생합성 유전자를 포함하며, 상기 유전자는 바람직하게는 epoD(서열번호 5), epoE(서열번호 6), epoF(서열번호 7), orf6(서열번호 8), orf3(서열번호 9), 및 orf14(서열번호 10)를 포함한다. 상기 벡터는 유전자간 영역을 하나 이상 포함하며, 상기 유전자간 영역은 epoD 유전자의 업스트림에 위치하는 영역(서열번호 14), epoD와 epoE 유전자 사이에 위치하는 영역(서열번호 15), epoE와 epoF 유전자 사이에 위치하는 영역(서열번호 16), epoF와 orf6 유전자 사이에 위치하는 영역(서열번호 17), orf6과 orf3 유전자 사이에 위치는 영역(서열번호 18), orf3과 orf14 유전자 사이에 위치하는 영역(서열번호 19), 및 epoC 유전자의 다운스트림에 위치하는 영역(서열번호 20) 중 어느 하나 이상을 포함할 수 있다. 바람직하게는 상기 3개의 영역을 모두 포함할 수 있다. 상기 벡터 pSBAC-optSoC_DEF_Sv의 개열지도를 도 3b에 도시하였다. 본 발명자들은 상기 벡터 pSBAC-optSoC_DEF_Sv를 스트렙토마이시스 베네주엘래에 도입하여 배양한 결과, 에포틸론 A, B, C, D의 발현이 향상됨을 확인하였다.
또 다른 구체예로서, 본 발명의 벡터는 pSBAC-optPD_APBCDEF_Sv일 수 있다. 상기 벡터 pSBAC-optPD_APBCDEF_Sv는 pikA Ⅰ 프로모터를 사용하는 pSBAC 벡터에 합성할 수 있다. 상기 벡터는 코돈 최적화된 에포틸론 생합성 유전자를 포함하며, 상기 유전자는 바람직하게는 서열번호 1로 표시되는 염기서열을 갖는 epoA, 서열번호 2로 표시되는 염기서열을 갖는 epoP, 서열번호 3으로 표시되는 염기서열을 갖는 epoB, 서열번호 4로 표시되는 염기서열을 갖는 epoC , epoD(서열번호 5), epoE(서열번호 6), epoF(서열번호 7), orf6(서열번호 8), orf3(서열번호 9), 및 orf14(서열번호 10)를 포함한다. 상기 벡터는 유전자간 영역을 하나 이상 포함하며, 상기 유전자간 영역은 epoP와 epoB 유전자 사이에 위치하는 영역(서열번호 21), epoC 유전자의 다운스트림에 위치하는 영역(서열번호 22), epoD와 epoE 유전자 사이에 위치하는 영역(서열번호 23), epoE와 epoF 유전자 사이에 위치하는 영역(서열번호 24), epoF와 orf6 유전자 사이에 위치하는 영역(서열번호 25), orf6과 orf3 유전자 사이에 위치하는 영역(서열번호 26), orf3과 orf14 유전자 사이에 위치하는 영역(서열번호 27), 및 orf14 유전자의 다운스트림에 위치하는 영역(서열번호 28) 중 어느 하나 이상을 포함할 수 있다. 바람직하게는 상기 3개의 영역을 모두 포함할 수 있다. 상기 벡터 pSBAC-optPD_APBCDEF_Sv의 개열지도를 도 3c에 도시하였다. 본 발명자들은 상기 벡터 pSBAC-optPD_APBCDEF_Sv를 스트렙토마이시스 베네주엘래에 도입하여 배양한 결과, 에포틸론 A, B, C, D의 발현이 향상됨을 확인하였다.
또 다른 구체예로서, 본 발명의 벡터는 pSET152-optSoC_DEF_Sv일 수 있다. 상기 벡터 pSET152-optSoC_DEF_Sv는 ermE* 프로모터를 사용하는 pSET152 벡터에 합성할 수 있다. 상기 벡터는 코돈 최적화된 에포틸론 생합성 유전자를 포함하며, 상기 유전자는 바람직하게는 epoD(서열번호 5), epoE(서열번호 6), epoF(서열번호 7), orf6(서열번호 8), orf3(서열번호 9), 및 orf14(서열번호 10)를 포함한다. 상기 벡터는 유전자간 영역을 하나 이상 포함하며, 상기 유전자간 영역은 epoD 유전자의 업스트림에 위치하는 영역(서열번호 14), epoD와 epoE 유전자 사이에 위치하는 영역(서열번호 15), epoE와 epoF 유전자 사이에 위치하는 영역(서열번호 16), epoF와 orf6 유전자 사이에 위치하는 영역(서열번호 17), orf6과 orf3 유전자 사이에 위치는 영역(서열번호 18), orf3과 orf14 유전자 사이에 위치하는 영역(서열번호 19), 및 epoC 유전자의 다운스트림에 위치하는 영역(서열번호 20) 중 어느 하나 이상을 포함할 수 있다. 바람직하게는 상기 3개의 영역을 모두 포함할 수 있다. 상기 벡터 pSET152-optSoC_DEF_Sv의 개열지도를 도 4a에 도시하였다. 본 발명자들은 상기 벡터 pSET152-optSoC_DEF_Sv를 스트렙토마이시스 베네주엘래에 도입하여 배양한 결과, 에포틸론 A, B, C, D의 발현이 향상됨을 확인하였다.
또 다른 구체예로서, 본 발명의 벡터는 pSET152-optPD_DEF_Sv일 수 있다. 상기 벡터 pSET152-optPD_DEF_Sv는 ermE* 프로모터를 사용하는 pSET152 벡터에 합성할 수 있다. 상기 벡터는 코돈 최적화된 에포틸론 생합성 유전자를 포함하며, 상기 유전자는 바람직하게는 epoD(서열번호 5), epoE(서열번호 6), epoF(서열번호 7), orf6(서열번호 8), orf3(서열번호 9), 및 orf14(서열번호 10)를 포함한다. 상기 벡터는 유전자간 영역을 하나 이상 포함하며, 상기 유전자간 영역은 epoD와 epoE 유전자 사이에 위치하는 영역(서열번호 23), epoE와 epoF 유전자 사이에 위치하는 영역(서열번호 24), epoF와 orf6 유전자 사이에 위치하는 영역(서열번호 25), orf6과 orf3 유전자 사이에 위치하는 영역(서열번호 26), orf3과 orf14 유전자 사이에 위치하는 영역(서열번호 27), 및 orf14 유전자의 다운스트림에 위치하는 영역(서열번호 28) 중 어느 하나 이상을 포함할 수 있다. 바람직하게는 상기 3개의 영역을 모두 포함할 수 있다. 상기 벡터 pSET152-optPD_DEF_Sv의 개열지도를 도 4b에 도시하였다. 본 발명자들은 상기 벡터 pSET152-optPD_DEF_Sv를 스트렙토마이시스 베네주엘래에 도입하여 배양한 결과, 에포틸론 A, B, C, D의 발현이 향상됨을 확인하였다.
또 하나의 양태로서, 본 발명은 상기 에포틸론 발현용 벡터가 도입된 스트렙토마이시스 베네주엘래를 배양하는 단계를 포함하는, 에포틸론의 제조방법을 제공한다.
상기 에포틸론은 에포틸론 A, B, C, 및 D을 포함하는 군에서 선택되는 어느 하나 이상일 수 있다.
상기 벡터가 스트렙토마이시스 베네주엘래에 도입되고, 배양하는 방법은 특별히 제한되지 아니하며 당해 기술 분야에서 스트렙토마이시스 베네주엘래에 대하여 통상적으로 사용되는 방법이라면 어느 것이든 사용할 수 있다.
하나의 구체예로서, 본 발명의 에포틸론의 제조방법은 epoA(서열번호 1), epoP(서열번호 2), epoB(서열번호 3), 및 epoC(서열번호 4)를 포함하는 제1 발현 카세트, 및 epoD(서열번호 5), epoE(서열번호 6), epoF(서열번호 7), orf6(서열번호 8), orf3(서열번호 9), 및 orf14(서열번호 10)를 포함하는 제2 발현 카세트를 포함하는 군에서 선택되는 어느 하나 이상을 포함할 수 있다.
상기 제1 발현 카세트 및 제2 발현 카세트는 1개의 벡터에 합성되어 1개의 벡터로 합성될 수 있다. 상기 발현 카세트를 이용하여 벡터를 합성하는 방법은 특별히 제한되지 아니하며 당해 기술 분야에서 통상적으로 사용되는 방법이라면 어느 것이든 사용할 수 있다. 합성된 벡터는 바람직하게는 상기 제1 발현 카세트의 다운스트림에 제2 발현 카세트가 합성된 것일 수 있다.
상기 제1 발현 카세트 및 제2 발현 카세트는 각각 별개의 벡터에 합성될 수 있다. 별개의 벡터에 합성될 경우에는, 제1 발현 카세트를 포함하는 제1 벡터, 및 제2 발현 카세트를 포함하는 제2 벡터가 스트렙토마이시스 베네주엘래에 도입될 수 있다. 도입되는 방법은 특별히 제한되지 아니하며 당해 기술 분야에서 스트렙토마이시스 베네주엘래에 대하여 통상적으로 사용되는 방법이라면 어느 것이든 사용할 수 있다.
다른 구체예로서, 본 발명의 에포틸론의 제조방법에 사용되는 발현 카세트는 pDHS702, pDHS618, pSBAC, 및 pSET152로 이루어지는 군에서 선택되는 어느 하나의 벡터에 합성된 것일 수 있다.
또 다른 구체예로서, 본 발명의 에포틸론의 제조방법에 사용되는 벡터는 상기한 pDHS702-optSoC_APBC_Sv, pDHS618-optSoC_DEF_Sv, pDHS702-optPD_APBC_Sv, pDHS618-optPD_DEF_Sv, pSBAC-optSoC_APBC_Sv, pSBAC-optSoC_DEF_Sv, pSBAC-optPD_APBCDEF_Sv, pSET152-optSoC_DEF_Sv, 또는 pSET152-optPD_DEF_Sv일 수 있으나 이에 제한되지 않는다. 상기 각 벡터에 대한 설명은 상기한 것과 같으므로 생략한다. 상기 발현 카세트는 먼저 제작한 후 벡터로 합성하여 스트렙토마이시스 베네주엘래에 도입할 수도 있고, 한 번에 벡터를 합성하여 도입할 수도 있다.
또 다른 구체예로서, 본 발명의 에포틸론의 제조방법은 상기 2개의 벡터 pDHS702-optSoC_APBC_Sv 및 pDHS618-optSoC_DEF_Sv가 도입된 스트렙토마이시스 베네주엘래를 배양하여 에포틸론 A, B, C, D를 합성할 수 있다. 본 발명자들은 pDHS702-optSoC_APBC_Sv 및 pDHS618-optSoC_DEF_Sv를 스트렙토마이시스 베네주엘래에 도입하여 배양한 결과, 에포틸론 A의 수율은 약 10㎍/L, 에포틸론 B의 수율은 약 5 ㎍/l으로 나타났으며, 에포틸론 C와 D는 각각 에포틸론 A와 B의 수율의 1/10 정도의 수율로 나타나, 에포틸론 생산 수율이 현저히 증가함을 확인하였다(도 6).
또 다른 구체예로서, 본 발명의 에포틸론의 제조방법은 상기 2개의 벡터 pDHS618-optPD_APBC_Sv 및 pDHS702-optPD_DEF_Sv가 도입된 스트렙토마이시스 베네주엘래를 배양하여 에포틸론 A, B, C, D를 합성할 수 있다. 본 발명자들은 pDHS618-optPD_APBC_Sv 및 pDHS702-optPD_DEF_Sv를 스트렙토마이시스 베네주엘래에 도입하여 배양한 결과, 에포틸론 A, B, C, D의 생산 수율이 현저히 증가함을 확인하였다.
또 다른 구체예로서, 본 발명의 에포틸론의 제조방법은 상기 2개의 벡터 pSBAC-optSoC_APBC_Sv 및 pSBAC-optSoC_DEF_Sv가 도입된 스트렙토마이시스 베네주엘래를 배양하여 에포틸론 A, B, C, D를 합성할 수 있다. 본 발명자들은 pSBAC-optSoC_APBC_Sv 및 pSBAC-optSoC_DEF_Sv를 스트렙토마이시스 베네주엘래에 도입하여 배양한 결과, 에포틸론 A, B, C, D의 생산 수율이 현저히 증가함을 확인하였다.
또 다른 구체예로서, 본 발명의 에포틸론의 제조방법은 1개의 벡터 pSBAC-optSoC_APBCDEF_Sv가 도입된 스트렙토마이시스 베네주엘래를 배양하여 에포틸론 A, B, C, D를 합성할 수 있다. 본 발명자들은 pSBAC-optSoC_APBCDEF_Sv를 스트렙토마이시스 베네주엘래에 도입하여 배양한 결과, 에포틸론 A, B, C, D의 생산 수율이 현저히 증가함을 확인하였다.
또 다른 구체예로서, 상기 벡터 pDHS702-optSoC_APBC_Sv, pDHS702-optPD_APBC_Sv, 및 pSBAC-optSoC_APBC_Sv를 포함하는 군에서 선택되는 어느 하나의 제1 발현 벡터, 및 pDHS618-optSoC_DEF_Sv, pDHS618-optPD_DEF_Sv, pSBAC-optSoC_DEF_Sv, pSET152-optSoC_DEF_Sv, 및 pSET152-optPD_DEF_Sv를 포함하는 군에서 선택되는 어느 하나의 제2 발현 벡터가 도입된 스트렙토마이시스 베네주엘래를 배양하여 높은 수율로 에포틸론 A, B, C, D를 합성할 수 있다.
바람직하게는 pDHS702-optSoC_APBC_Sv, pDHS702-optPD_APBC_Sv, 또는 pSBAC-optSoC_APBC_Sv 중 어느 하나의 벡터와 벡터 pDHS618-optSoC_DEF_Sv를 도입하는 방법, pDHS702-optSoC_APBC_Sv, pDHS702-optPD_APBC_Sv, 또는 pSBAC-optSoC_APBC_Sv 중 어느 하나의 벡터와 벡터 pDHS618-optPD_DEF_Sv를 도입하는 방법, pDHS702-optSoC_APBC_Sv, pDHS702-optPD_APBC_Sv, 또는 pSBAC-optSoC_APBC_Sv 중 어느 하나의 벡터와 벡터 pSBAC-optSoC_DEF_Sv를 도입하는 방법, pDHS702-optSoC_APBC_Sv, pDHS702-optPD_APBC_Sv, 또는 pSBAC-optSoC_APBC_Sv 중 어느 하나의 벡터와 벡터 pSET152-optSoC_DEF_Sv를 도입하는 방법, 및 pDHS702-optSoC_APBC_Sv, pDHS702-optPD_APBC_Sv, 또는 pSBAC-optSoC_APBC_Sv 중 어느 하나의 벡터와 벡터 pSET152-optPD_DEF_Sv를 도입하는 방법으로 에포틸론을 생산할 수 있다.
본 발명에 따른 에포틸론 발현 카세트 및 발현용 벡터는 생장속도가 빠르고, 유전자 조작이 용이한 이종숙주 스트렙토마이시스 베네주엘래에 도입할 수 있어, 단시간 동안 높은 수율로 에포틸론을 생산할 수 있다.
또한 본 발명에 따른 에포틸론의 제조방법에 의하여 생산된 에포틸론은 항암물질으로 유용하게 사용할 수 있다.
도 1a는 본 발명에 따른 에포틸론 발현용 벡터 pDHS702-optSoC_APBC_Sv의 개열지도를, 도 1b는 pDHS618-optSoC_DEF_Sv의 개열지도를 도시한 것이다.
도 2a는 본 발명에 따른 에포틸론 발현용 벡터 pDHS702-optPD_APBC_Sv의 개열지도를, 도 2b는 pDHS618-optPD_DEF_Sv의 개열지도를 도시한 것이다.
도 3a는 본 발명에 따른 에포틸론 발현용 벡터 pSBAC-optSoC_APBC_Sv의 개열지도를, 도 3b는 pSBAC-optSoC_DEF_Sv의 개열지도를, 도 3c는 pSBAC-optPD_APBCDEF_Sv의 개열지도를 도시한 것이다.
도 4a는 본 발명에 따른 에포틸론 발현용 벡터 pSET152-optSoC_DEF_Sv의 개열지도를, 도 4b는 pSET152-optPD_DEF_Sv의 개열지도를 도시한 것이다.
도 5는 본 발명에 따른 벡터에 포함되는 에포틸론 생합성 유전자 및 그의 제한효소를 나타낸 것이다.
도 6은 본 발명에 따른 벡터 pDHS702-optSoC_APBC_Sv와 pDHS618-optSoC_DEF_Sv를 도입한 스트렙토마이시스 베네주엘래 균주에서의 LC-ESI-MS/MS 분석 결과를 나타낸 것이다.
도 2a는 본 발명에 따른 에포틸론 발현용 벡터 pDHS702-optPD_APBC_Sv의 개열지도를, 도 2b는 pDHS618-optPD_DEF_Sv의 개열지도를 도시한 것이다.
도 3a는 본 발명에 따른 에포틸론 발현용 벡터 pSBAC-optSoC_APBC_Sv의 개열지도를, 도 3b는 pSBAC-optSoC_DEF_Sv의 개열지도를, 도 3c는 pSBAC-optPD_APBCDEF_Sv의 개열지도를 도시한 것이다.
도 4a는 본 발명에 따른 에포틸론 발현용 벡터 pSET152-optSoC_DEF_Sv의 개열지도를, 도 4b는 pSET152-optPD_DEF_Sv의 개열지도를 도시한 것이다.
도 5는 본 발명에 따른 벡터에 포함되는 에포틸론 생합성 유전자 및 그의 제한효소를 나타낸 것이다.
도 6은 본 발명에 따른 벡터 pDHS702-optSoC_APBC_Sv와 pDHS618-optSoC_DEF_Sv를 도입한 스트렙토마이시스 베네주엘래 균주에서의 LC-ESI-MS/MS 분석 결과를 나타낸 것이다.
이하 본 발명을 하기 예에 의해 상세히 설명한다. 다만, 하기 예는 본 발명을 예시하기 위한 것일 뿐, 하기 예에 의해 본 발명의 범위가 제한되는 것은 아니다.
균주, 플라스미드, 배양조건
본 발명에서 서브-클로닝 (subcloning)을 위하여 대장균(E.coli) DH5(Invitrogen), 플라스미드 pLitmus28 (New England Biolabs)을 사용하였다. 본 발명에 사용된 대장균 DH5는 서브클로닝에 널리 이용되는 가장 잘 알려진 균주 중에 하나이다. 이 균주는 redAI 과 endA1 유전자의 변이로 인하여 클로닝된 내부 유전자(insert)의 안정성과 플라스미드의 획득 수율을 높여주는 장점이 있다. 한편, 플라스미드 pLitmus28은 3kb 이하의 크기를 가지며, 암피실린(ampicillin)에 저항성을 가지고 다양한 개열지도(cleavage map)를 가지고 있어서 서브클로닝에 널리 이용되는 플라스미드이다.
에포틸론을 스트렙토마이세스 베네주엘래에에서 발현시키기 위한 대장균-스트렙토마이시스 셔틀(shuttle) 벡터로 pDHS702, pDHS618 또는 pSBAC를 사용하였다. 상기 벡터들은 pikA Ⅰ 프로모터와 각각 티오스트렙톤 (thiostrepton) 및 아프라마이신(apramycin) 내성 유전자를 포함하고 있다. 상기 셔틀벡터 pDHS702와 pDHS618은 미국 미시간 대학교 미생물학과 데이비드 셔먼 (David H. Sherman) 교수로부터 확보하였다.
조작된 돌연변이 균주인 스트렙토마이시스 베네주엘래 DHS2001은 한국 등록특허 제10-0949313호에 언급된 균주를 사용하였다.
대장균은 플라스미드의 선별을 위하여 암피실린 (ampicillin, 50 ㎍/mL) 또는 아프라마이신 (apramycin, 25 ㎍/mL)이 첨가된 LB배지에서 배양하였다.
실시예 1: 에포틸론 생합성 유전자 합성 및 발현벡터 제조
에포틸론 생합성 유전자는 소란지움 셀룰로섬의 유전자 정보를 바탕으로 이종숙주 스트렙토마이시스 베네주엘래의 코돈 선호도에 맞추어 바이오니아에서 ~2kb의 사이즈로 합성하였다. 합성된 에포틸론 생합성 유전자는 epoA(서열번호 1), epoP(서열번호 2), epoB(서열번호 3), epoC(서열번호 4), epoD(서열번호 5), epoE(서열번호 6), epoF(서열번호 7), orf6(서열번호 8), orf3(서열번호 9), 및 orf14(서열번호 10)이다.
상기 합성된 유전자 단편들은 각각의 제한효소를 이용하여 서브클로닝 단계를 거쳐 결합시켜 pDHS702, pDHS618 및 pSBAC에 도입하였다. 서브클로닝 및 도입 방법은 한국 등록특허 제10-0949313호에 기재된 방법을 일부 변형하여 사용하였다.
이를 통하여 하기 표 1과 같이 벡터 pDHS702-optSoC_APBC_Sv, pDHS618-optSoC_DEF_Sv, pDHS702-optPD_APBC_Sv, pDHS618-optPD_DEF_Sv, pSBAC-optSoC_APBC_Sv, pSBAC-optSoC_DEF_Sv, pSBAC-optPD_APBCDEF_Sv, pSET152-optSoC_DEF_Sv, pSET152-optPD_DEF_Sv를 완성하였다. 각 벡터의 개열지도는 도 1a 내지 도 4b에 도시하였다. 코돈 최적화된 에포틸론 생합성 유전자 단편과 각각의 제한효소를 도 5에 나타내었다.
벡터 | 프로모터 | 벡터 | 에포틸론 생합성 유전자 및 유전자간 영역(IGR) |
pDHS702-optSoC_APBC_Sv | pikA Ⅰ | pDHS702 | IGR-epoA - epoP -IGR-epoB - epoC -IGR |
pDHS618-optSoC_DEF_Sv | pikA Ⅰ | pDHS618 | IGR-epoD-IGR-epoE-IGR-epoF-IGR-orf6-IGR-orf3 -IGR-orf14 -IGR |
pDHS702-optPD_APBC_Sv | pikA Ⅰ | pDHS702 | epoA - epoP -IGR-epoB - epoC -IGR |
pDHS618-optPD_DEF_Sv | pikA Ⅰ | pDHS618 | epoD-IGR-epoE-IGR-epoF-IGR-orf6-IGR-orf3 -IGR-orf14 -IGR |
pSBAC-optSoC_APBC_Sv | pikA Ⅰ | pSBAC | IGR-epoA - epoP -IGR-epoB - epoC -IGR |
pSBAC-optSoC_DEF_Sv | pikA Ⅰ | pSBAC | IGR-epoD-IGR-epoE-IGR-epoF-IGR-orf6-IGR-orf3 -IGR-orf14 -IGR |
pSBAC-optSoC_APBCDEF_Sv | pikA Ⅰ | pSBAC | epoA - epoP -IGR-epoB - epoC -IGR-epoD-IGR-epoE-IGR-epoF-IGR-orf6-IGR-orf3 -IGR-orf14 -IGR |
pSET152-optSoC_DEF_Sv | ermE * | pSET152 | IGR-epoD-IGR-epoE-IGR-epoF-IGR-orf6-IGR-orf3 -IGR-orf14 -IGR |
pSET152-optPD_DEF_Sv | ermE * | pSET152 | epoD-IGR-epoE-IGR-epoF-IGR-orf6-IGR-orf3 -IGR-orf14 -IGR |
실시예 2: 이종숙주에서 에포틸론의 발현
(1) 스트렙토마이시스 베네주엘래에의 형질전환
실시예 1에서 제조한 pDHS702-optSoC_APBC_Sv와 pDHS618-optSoC_DEF_Sv를 스트렙토마이시스 베네주엘래 DHS2001로 도입하고, 상기 균주를 아프라마이신 (25㎍/mL), 티오스트렙톤 (50㎍/mL) 및 카나마이신 (50㎍/mL)를 함유한 R2YE 배지를 이용하여 30℃에서 4일간 배양하였다. R2YE 조성은 103g 수크로오스 (sigma), 0.25g K2SO4 (sigma), 10.12g MgCl26H2O (sigma), 10g 글루코스 (sigma), 0.1g 카사미노 애시드(casamino acids, Difco), 5g 이스트 추출물(yeast extract, Difco), 5.73g TES 버퍼 (sigma), 2ml 미량원소용액(trace element solution), 22g agar (1L 기준)이며, 고온 멸균(autoclave) 후에 10ml 0.5% KH2PO4 (sigma), 4ml 5M CaCl22H2O (sigma), 15ml L-프롤린(L-proline, sigma), 7mL 1N NaOH(sigma) (1L 기준)을 첨가하여 제조하였다.
또한 pDHS702-optPD_APBC_Sv 및 pDHS618-optPD_DEF_Sv의 두 벡터를 스트렙토마이시스 베네주엘래 DHS2001 균주로 도입하고, pSBAC-optSoC_APBC_Sv 및 pSBAC-optSoC_DEF_Sv의 두 벡터를 스트렙토마이시스 베네주엘래 DHS2001 균주로 도입하고, pSBAC-optPD_APBCDEF_Sv 벡터를 스트렙토마이시스 베네주엘래 DHS2001 균주로 도입하여 형질전환하고, 상기와 동일한 방법으로 배양하였다.
(2) 에포틸론의 생산여부 확인
상기 배양 용액을 동량의 에틸아세테이트 (ethyl acetate)와 혼합하고, 분별깔때기로 층 분리를 2회 반복하고, 유기층을 진공회전농축기(rotary evaporator)로 농축하였다. 얻어진 용출물을 100㎕의 메탄올(methanol)로 다시 녹이고 상기 용액을 Phenomenex Synergi Polar-RP 컬럼(1504.6mm, 4㎛)을 장착한 LC-ESI-MS/MS (액체크로마토그래피/전자스프레이 이온화-질량분석기; Waters/Micromass Quattromicro/MS)로 분석하였다.
분석조건으로는 250㎕/min의 유속으로 용출시켰고, 0.1%(v/v) 포름산 (formic acid) 이 첨가된 증류수 용액(A)과 0.1%(v/v)의 포름산이 첨가된 80%(v/v) 아세토니트릴 (acetonitrile) 용액(B)를 이용하여 수행하였다. 상기 용액 B를 30%에서 50%로 5분간, 50%에서 90%로 3분간 적용하고, 90%에서 4분간 유지시킨 후 30%로 15분간의 구배로 컬럼의 재평형을 위하여 용출시켰다.
분석 결과, 먼저, pDHS702-optSoC_APBC_Sv와 pDHS618-optSoC_DEF_Sv를 도입한 스트렙토마이시스 베네주엘래 균주에서 도 6 좌측에 도시된 것과 같이 에포틸론 A, B, C, D를 모두 생산하는 것을 확인하였다. 다른 스트렙토마이시스 베네주엘래 균주에서도 에포틸론 A, B, C, D를 모두 생산하는 것을 확인하였다.
(3) 에포틸론 생산량 정량분석
다중 반응 모니터링 모드(mutiple reactions monitoring mode)로 ESI-MS/MS(전자스프레이 이온화-질량분석기/질량분석기)로 정량분석하였다. 이는 양성자화된 분자 이온(parents)이 에포틸론 A, B, C, D에 특이적인 단편으로 전이되는 것을 탐지하기 위해 셋팅된 2개의 질량 이온(mass ion)을 선별하는 방식으로 수행되었다. 에포틸론 표준물질 A, B는 시그마 (Sigma)에서 구입하였고, 에포틸론 C, D는 소란지움 셀룰로섬에서 분리하였다. 에포틸론의 생산량은 배양액 세 군데에서 채취하여 추출한 추출물의 평균으로 계산하였다.
도 6 우측 그래프는 pDHS702-optSoC_APBC_Sv와 pDHS618-optSoC_DEF_Sv를 도입한 스트렙토마이시스 베네주엘래 균주를 ESI-MS/MS로 분석한 결과를 나타낸 것이다. 도시된 것과 같이 27.12분의 용출물은 전형적인 단편 부분인 m/z 306.2, 406.2 및 494.1을 보여 에포틸론 A임을 확인하였으며, 27.95분의 용출물은 320.2, 420.3 및 508.5를 보여 에포틸론 B임을 확인하였다. 또한, 35.10분의 용출물은 290.3, 289.9 및 477.5를 보여 에포틸론 C임을 확인하였고, 36.77분의 용출물은 304.8, 404.5 및 491.1을 보여 에포틸론 D임을 확인하였다. 에포틸론 표준물질로 동일하게 실험한 결과 용출시간 및 분획 형태가 동일하였다.
에포틸론 A의 수율은 약 10㎍/L, 에포틸론 B의 수율은 약 5 ㎍/l으로 나타났으며, 에포틸론 C와 D는 각각 에포틸론 A와 B의 수율의 1/10 정도, 즉 약 1㎍/l의 수율로 생산하였다. 이는 본 발명에 따른 발현 카세트 및 이를 포함하는 에포틸론 발현용 벡터에 의하여 에포틸론 생산 수율이 현저히 증가함을 확인한 것이다.
이와 같이, 본 발명에 따른 에포틸론 발현용 벡터는 생장속도가 빠르고, 유전자 조작이 용이한 이종숙주 스트렙토마이시스 베네주엘래에 도입할 수 있어, 단시간 동안 높은 수율로 에포틸론 A, B, C, D를 모두 생산할 수 있으며, 본 발명에 따른 에포틸론의 생산방법에 의하여 생산된 에포틸론은 항암물질으로 유용하게 사용할 수 있다.
이상의 설명으로부터, 본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 이와 관련하여, 이상에서 기술한 실시 예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허 청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
<110> EWHA UNIVERSITY - INDUSTRY COLLABORATION FOUNDATION
<120> EXPRESSION CASSETTES AND THEIR USE
<130> KPA140462-KR
<160> 28
<170> KopatentIn 2.0
<210> 1
<211> 4266
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon Optimized DNA of Sorangium cellulosum for Expression in
Streptomyces venezuelae
<400> 1
atggccgacc gcccgatcga gcgcgccgcc gaggacccga tcgccatcgt cggagcctcc 60
tgccgcctcc cgggcggcgt catcgacctc tccggcttct ggaccctcct cgaaggttcc 120
cgcgacaccg tcggccgcgt cccggccgaa cgctgggacg ccgctgcctg gttcgacccg 180
gaccccgacg ccccgggcaa gaccccggtc acccgcgcct ctttcctcag tgacgtcgcc 240
tgcttcgacg catccttctt cggtatctcc ccgcgcgagg cgctccgcat ggacccggcc 300
caccgtctcc tcctcgaggt ctgctgggag gccctcgaga acgccgccat cgccccgtcc 360
gccctcgtcg gcacggagac cggcgtcttc atcggaatcg gcccgagcga gtacgaggcc 420
gccctcccgc aggccaccgc ctccgccgag atcgacgccc acggcggtct cggcaccatg 480
ccctccgtcg gcgccggccg catcagctac gccctcggcc tccgcggccc gtgcgtcgcc 540
gtcgataccg cctactcctc ctccctcgtc gccgtgcacc tcgcctgcca gtccctccgt 600
tccggcgagt gctccaccgc cctcgccggc ggcgtctccc tcatgctctc cccgtccacc 660
ctcgtctggc tctccaagac ccgcgccctc gcccgcgacg gccgctgcaa ggccttctcc 720
gccgaagccg acggcttcgg tcgcggtgag ggctgcgccg tcgtcgtcct gaagcgcctc 780
tccggcgccc gggccgacgg cgaccgcatc ctcgccgtca tccgcggctc cgccatcaac 840
cacgacggag ccagctccgg gctcaccgtc ccgaacggct cctcccagga gatcgtcctc 900
aagcgcgccc tcgccgacgc cggctgcgcc gcctcctcgg tcggctacgt cgaggcgcac 960
ggcaccggga cgaccctcgg cgacccgatc gagatccagg ccctcaacgc cgtctacggc 1020
ctcggtcgcg acgtcgccac cccgctcctc atcggctccg tcaagaccaa cctcggccac 1080
ccggaatacg cctccggcat caccggcctc ctcaaggtcg tactctccct ccagcacggc 1140
cagatcccgg cccacctcca cgcccaggcc ctcaaccccc gcatctcctg gggcgacctc 1200
cgcctcaccg tcacccgcgc ccgcaccccg tggccggact ggaacacgcc gcgccgcgcc 1260
ggtgtctcct ccttcggcat gtccggaacg aacgcccacg tcgtcctcga ggaggccccg 1320
gccgccacct gcaccccgcc ggcccctgag cgtccggccg agctcctcgt cctctccgcg 1380
cggaccgcct ccgccctcga tgcccaggcc gcccgcctcc gcgaccacct cgagacctac 1440
ccgtcccagt gcctcggcga cgtcgctttc tccctcgcca ctacgcgctc cgccatggag 1500
caccgcctcg ccgtcgccgc cacatcccgt gagggcctcc gcgctgccct cgacgctgcc 1560
gcccagggtc agacctcccc gggcgccgtc aggtccatcg ccgactcctc caggggcaag 1620
cttgccttcc tcttcaccgg ccagggtgcc cagacgctcg gcatgggccg cggcctctac 1680
gacgtctggt ccgccttccg cgaggccttc gacctctgcg tccgcctctt caaccaggag 1740
ctcgaccgcc cgctccgcga ggtcatgtgg gccgagccgg cctccgtcga cgccgccctc 1800
ctcgaccaga ccgccttcac ccagccggcc ctgttcacct tcgagtacgc gctcgcggcc 1860
ctctggcgct cctggggggt cgagccggag ctcgtcgccg ggcactccat cggcgagctc 1920
gtcgccgcct gcgtcgccgg cgtcttctcc ctcgaggacg ccgtcttcct cgtcgccgcc 1980
cgcggtcgtc tcatgcaggc cctcccggcc ggcggcgcga tggtctccat cgaggccccg 2040
gaggccgacg tcgccgccgc cgtcgcgccg cacgccgcgt ccgtctccat cgccgccgtc 2100
aacgccccgg accaggtcgt catcgccggc gccggccagc cggtccacgc aatcgccgcc 2160
gccatggccg cccgcggggc ccgcaccaag gccctccacg tcagccacgc cttccactcc 2220
ccgctcatgg ccccgatgct cgaggccttc ggccgcgtcg ccgagtccgt ctcctaccgc 2280
cgcccgagca tcgtcctcgt ctccaacctc tccgggaagg cctgtaccga cgaggtctcc 2340
tccccgggat actgggtccg ccacgcccgc gaggtcgtac gcttcgccga tggagtcaag 2400
gccctccacg ccgcaggcgc cggcaccttc gtcgaggtcg gcccgaagtc caccctcctc 2460
ggtctcgtcc cggcctgcat gcccgacgcc cgtccggccc tcctcgcctc ctcccgcgcc 2520
ggccgcgacg aaccggccac cgtcctcgag gcccttggcg gcctctgggc cgtcggcggc 2580
ctcgtctcct gggccggtct cttcccgtcc ggcggccgcc gcgtcccgct cccgacctac 2640
ccgtggcagc gcgagcgcta ctggatcgac accaaggcgg acgacgccgc ccgcggcgac 2700
cgccgcgccc cgggcgccgg ccacgacgag gtcgaggagg gcggcgccgt ccgtggcggc 2760
gaccgccgct ccgcccgcct cgaccacccg ccgccggaat ccggccgccg cgagaaggtc 2820
gaggccgccg gcgacaggcc gttccgactc gagatcgacg agccgggcgt cctcgaccac 2880
ctcgtcctcc gcgtcaccga acgccgcgcc ccgggcctcg gcgaggttga gatcgccgtc 2940
gacgccgcgg gcctctcctt caacgacgtg cagctcgccc tcggcatggt cccggacgac 3000
ctcccgggca agccgaaccc gccgctcctc ctcggcgggg agtgcgccgg ccgcatcgtc 3060
gccgtcggcg agggcgtcaa cggcctcgtc gtcggccagc cggtcatcgc actctccgcc 3120
ggcgcgttcg ccacccacgt caccaccagc gccgcactcg tcctcccgcg accgcaggcc 3180
ctctccgcca tcgaggccgc cgccatgccg gtcgcctacc tcaccgcgtg gtacgccctc 3240
gaccgcatcg cccgcctcca gccgggcgaa cgcgtcctca tccacgccgc caccggcggc 3300
gtcggcctcg ccgccgtgca gtgggcccag cacgtcggcg ccgaggtaca cgccaccgcc 3360
ggcacgccgg agaagcgagc ctacctcgag tccctcggcg tgcgctacgt ctccgactcc 3420
cgctccgacc gcttcgtggc cgacgtccgc gcctggaccg gcggggaggg cgtcgacgtc 3480
gtcctcaact ccctctccgg cgagctcatc gacaagtcct tcaacctcct ccgctcccac 3540
ggccgcttcg tcgagctcgg caagcgcgac tgctacgccg acaaccagct cggcctccgc 3600
ccgttcctcc gcaacctctc cttctccctc gtcgacctcc gcggcatgat gctcgagcgc 3660
ccggcccgtg tccgcgccct cctcgaggag ctcctcggcc tcatcgccgc cggtgtcttc 3720
accccgccgc cgatcgccac gctccccatc gcccgcgtgg ccgacgcctt ccgctccatg 3780
gcccaggccc agcacctcgg caagctcgtc ttgaccctcg gagacccgga ggtccagatc 3840
cgcatcccga cccatgccgg cgccggcccg tccaccggcg accgcgacct cctcgaccgc 3900
ctcgcctccg ccgcccccgc cgcccgcgcc gccgccctcg aggccttcct ccgcacccag 3960
gtctcccagg tcctccgcac cccggaaatc aaggtcggag ccgaggccct cttcacccgc 4020
ctcggcatgg actccctcat ggccgtcgag ctccgcaacc gcatcgaagc ctccctcaag 4080
ctcaagctct ccaccacctt cctctccacc tccccgaaca tcgccctcct cgcccagaac 4140
ctcctcgacg ccctggccac cgccctctcc ctcgagcgcg tggctgccga gaacctccgc 4200
gccggcgtcc agaacgactt cgtctcctcc ggagccgacc aggactggga gatcatcgcg 4260
ctgtga 4266
<210> 2
<211> 4233
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon Optimized DNA of Sorangium cellulosum for Expression in
Streptomyces venezuelae
<400> 2
gtgaccatca accagctcct caacgagctc gagcaccagg gtatcaagct cgcggccgac 60
ggcgagcgcc tccagatcca ggccccgaag aacgccctca acccgaacct cctcgcccgc 120
atctccgagc acaagagcac catcctcacg atgctccgcc agcgcctccc ggcggagtcc 180
atcgtcccgg ccccggccga gaggcacgcc ccgttcccgc tcaccgacat ccaggagtcc 240
tactggctcg gccgcaccgg ggccttcacg gtcccctccg gcatccacgc ctaccgcgag 300
tacgactgca cggacctcga cgtcccgcgc ctctcccgcg ccttccgcaa ggtcgtcgcc 360
cgccacgaca tgctccgcgc ccacaccctc ccggacatga tgcaggtcat cgagccgaag 420
gtcgacgccg acatcgagat catcgacctg cggggcctcg accgctccac ccgcgaggcc 480
cgcctcgtct cgctccgcga cgcgatgtcc caccgcatct acgacaccga gcgcccgccg 540
ctctaccacg tagtcgccgt ccgcctcgac gagcgccaga cccgcctcgt cctcagcatc 600
gacctcatca acgtcgacct cggcagcctc agcatcatct tcaaggactg gctctcgttc 660
tacgaggacc cggagacgtc cctcccggtc ctcgagctgt cctaccgcga ctacgtcctc 720
gccctcgaat cccgcaagaa gtccgaggcg caccagaggt ccatggacta ctggaagcgc 780
cgcatcgccg agctcccgcc gccgccgacc ctcccgatga aggccgaccc gtccaccctc 840
aaggagatcc gcttccgcca caccgagcag tggctcccgt cggactcctg gggccggctc 900
aagcgccgcg ttggcgagcg cggccttacc ccgacgggcg tcatcctcgc cgccttctcc 960
gaggtcatcg gccgctggtc cgcgtccccg cgcttcaccc tcaacatcac cctcttcaac 1020
cgcctcccgg tccacccccg cgtcaacgac ataaccggcg acttcacctc catggtcctg 1080
ctggacatcg acacaacccg cgacaagtcc ttcgagcagc gcgccaagcg catccaggag 1140
cagctctggg aggccatgga ccactgcgac gtctccggca tcgaggtgca gcgcgaagcc 1200
gcccgcgtcc tcggcatcca gcgcggcgcc ctcttcccgg tcgtcctcac ctccgccctc 1260
aaccagcagg tcgtgggcgt caccagcctc cagcgcctcg gcaccccggt ctacacctcc 1320
acccagacgc cgcagctcct cctcgaccac cagctctacg aacacgacgg cgacctcgtg 1380
ctcgcctggg acatcgtcga cggcgtcttc ccgccggacc tcctcgacga catgctcgag 1440
gcctacgtcg tcttcctccg ccgcctcacc gaggagccct ggggggagca ggtccgctgc 1500
tccctcccgc ccgcccagct cgaggcccgc gcctccgcca acgccacgaa cgccctcctc 1560
tccgagcaca cgctccacgg cctcttcgcc gcccgcgtcg agcagctccc gatgcagctc 1620
gcggtcgtct ccgcccgcaa gaccctcacc tacgaggagc tcagccgccg ctcccgccgg 1680
ctcggggccc gcctccgcga gcagggcgcc cgcccgaaca ccctcgtcgc ggtcgtcatg 1740
gagaagggct gggagcaggt cgtcgccgtc ctcgcggtcc tcgagtccgg cgccgcctac 1800
gtcccgatcg acgcggacct gccggccgag cgcatccact acctcctcga ccacggcgag 1860
gtcaagctcg tcctcaccca gccgtggctc gacggcaagc tctcctggcc gccgggcatc 1920
cagcgcctcc tcgtctccga ggccggcgtc gagggcgacg gcgaccagcc gcccatgatg 1980
ccgatccaga ccccgtccga cctcgcctac gtcatctata cctcgggctc caccggcctc 2040
ccgaagggcg tcatgatcga ccaccgcggc gccgtcaaca ccatcctcga catcaacgag 2100
cgcttcgaga tcggcccggg cgaccgcgtc ctcgccctct cctccctcag cttcgacctc 2160
tccgtgtacg acgtcttcgg gatcctcgcc gccggcggca ccatcgtcgt cccggatgcc 2220
agcaagctcc gcgacccggc ccattgggcc gagctcatcg agcgcgagaa ggtaaccgtc 2280
tggaactccg tgccggccct catgcgcatg ctcgtcgagc atttcgaggg ccgcccggac 2340
tccctcgccc gctccctgcg gctctccctc ctctccggcg actggatccc ggtgggcctc 2400
ccgggcgagc tccaggccat ccgcccgggc gtctccgtca tctccctcgg cggcgccacc 2460
gaggcctcca tctggtccat cgggtacccg gtccgcaacg tcgacctcag ctgggcctcc 2520
atcccgtacg ggcgcccgct ccgcaaccag acgttccacg tcctcgacga agccctcgaa 2580
ccgcgcccgg tctgggtccc gggccagctc tacatcggcg gcgtggggct cgccctcggc 2640
tactggcgcg acgaggagaa gacgcgcaag tccttcctcg tgcacccgga gaccggcgag 2700
cgcctctaca agaccggcga cctcggccgc tacctcccgg acggcaacat cgaattcatg 2760
ggccgcgagg acaaccagat caagctccgc gggtaccgcg tcgagctcgg cgagattgag 2820
gagaccctca agtcccaccc gaacgtccgc gacgccgtga tcgtcccggt cggcaacgac 2880
gctgcgaaca agctcctcct cgcctacgtc gtgccggagg ggacccgccg ccgcgccgcc 2940
gagcaggatg cctccctcaa gaccgagcgc atcgacgccc gcgcccacgc cgccgaagcc 3000
gacggcctct ccgacggcga gcgcgtccag ttcaagctgg cccggcacgg cctccgccgc 3060
gacctcgacg gcaagccggt cgtcgatctc accggccagg acccgcgcga agccggcctc 3120
gacgtctacg cccgccgccg ctccgtccgc acgttcctgg aggccccgat cccgttcgtc 3180
gagttcgggc gcttcctctc ctgcctctcc tccgtggaac cggacggcgc caccctcccc 3240
aagttccgct acccgtccgc gggctccacc tacccggtcc agacctacgc ctacgtgaag 3300
tccggccgca tcgagggcgt cgacgaaggc ttctactact accacccgtt cgagcaccgt 3360
ctgctgaagc tctccgacca cggcatcgag cgcggcgccc acgtgcgcca aaacttcgac 3420
gtcttcgacg aggcggcgtt caacctcctc ttcgtcggcc gcatcgacgc catcgagtcc 3480
ttgtacggct ccagctcccg cgagttctgc ctgctcgagg ccggctacat ggcccagctg 3540
ctcatggagc aggccccttc ctgcaacatc ggcgtctgcc cggtcggcca gttcaacttc 3600
gagcaggtcc gcccggtcct cgacctccga cactccgacg tctacgtcca cggcatgctc 3660
ggcggccgcg tcgacccgcg gcagttccag gtctgcaccc tcggccagga ctcctccccg 3720
cgccgcgcca ccacccgcgg cgccccgccg ggccgcgagc agcacttcgc cgacatgctc 3780
cgcgacttcc tccgcaccaa gctcccggag tacatggtcc cgaccgtctt cgtcgagctc 3840
gacgccctcc cgctcacgtc caacggcaag gtcgaccgca aggccctccg cgagcgcaag 3900
gacacctcct ccccgcgcca ctccggccac accgccccgc gcgacgcgct cgaggagatc 3960
ctcgtcgccg tcgtccgcga ggtactcggc ctcgaggtcg tcgggctgca gcagtccttc 4020
gtcgacctcg gcgcgacctc catccacatc gtccgcatgc gctccctcct ccagaaacgc 4080
ctcgaccgcg agatcgccat caccgagctc ttccagtacc cgaacctggg ctcgctcgcc 4140
tccggcctcc gccgcgactc gcgcgatctc gaccagcgcc cgaacatgca ggaccgcgtc 4200
gaggtccgcc gcaagggccg ccgccgctcc tga 4233
<210> 3
<211> 5499
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon Optimized DNA of Sorangium cellulosum for Expression in
Streptomyces venezuelae
<400> 3
atggaagagc aggagtcctc cgccatcgcc gtcatcggga tgtccggccg cttcccgggc 60
gcccgcgacc tcgacgagtt ctggcgcaac ctccgcgacg gcaccgaggc cgtccagcgc 120
ttctccgagc aggagctcgc cgcctccggt gtcgacccgg ccctcgtcct cgacccgtcc 180
tacgtccgcg ccggcagcgt ccttgaggac gtcgatcgct tcgacgccgc cttcttcggc 240
atctccccgc gcgaggccga gcttatggac ccgcagcacc gcatcttcat ggagtgcgcc 300
tgggaggccc tcgagaacgc cggatacgac ccgaccgcct acgagggctc catcggcgtc 360
tacgccggcg ccaacatgtc ctcctacctg accagcaacc tccacgagca cccggccatg 420
atgcgctggc cgggctggtt ccagaccctc atcggcaacg acaaggacta cctcgccacc 480
cacgtctcct accgcctgaa cctccgcggc ccgtccatct ccgtccagac ggcctgttcc 540
acctccctcg tcgccgtcca cctcgcatgc atgtccctcc tcgaccgtga gtgcgacatg 600
gctctcgccg gcggcatcac cgtccgcatc ccgcaccgcg ccggctacgt ctacgccgag 660
ggcggcatct tctccccgga cggccactgc cgcgccttcg acgccaaggc caacggcacc 720
atcatgggca acggatgcgg cgtcgtgctc ctcaagccgc tcgaccgcgc cctctccgac 780
ggtgacccgg tccgcgccgt catcctcggc tccgccacca acaacgacgg cgcccgcaag 840
atcggcttca ccgccccgtc tgaggtcggc caggcccagg ccatcatgga ggccctcgcc 900
ctcgcgggcg tcgaagcccg ctccatccag tacatcgaga cccacggcac cggcaccctc 960
ctcggcgacg ccatcgaaac cgccgccctc cgccgcgtct tcggcaggga cgcctccgcc 1020
cgcaggtcct gcgccatcgg ctccgtcaag accggaatcg gccacctcga gtccgccgcc 1080
ggcatcgccg gcctcatcaa gaccgtcctc gccctcgaac accgccagct ccccccgtcc 1140
ctcaacttcg agtccccgaa cccgtccatc gacttcgcct cctccccgtt ctacgtcaac 1200
acctccctca aggactggaa caccggctcc accccgcgcc gcgccggcgt ctcctccttc 1260
ggcatcggcg gcaccaacgc ccacgtggtc ctcgaggagg cccccgccgc caagctcccg 1320
gccgccgccc ccgcccgctc cgccgagctc ttcgtcgtct ccgccaagtc cgccgccgcc 1380
ctcgacgctg ccgccgcccg cctccgcgac cacctgcagg cccaccaggg gatctccctc 1440
ggcgacgtcg ccttctccct cgcgaccacc cgctccccga tggagcaccg cctcgccatg 1500
gccgccccga gccgcgaggc cctccgcgaa ggcctcgacg ccgccgcccg cggccagacc 1560
ccgccgggtg ccgtccgcgg ccgctgctcc ccgggcaacg tcccgaaggt cgtcttcgtc 1620
ttcccggggc agggttccca gtgggtcggc atgggtcgcc agctcctcgc cgaggagccg 1680
gtgttccacg ccgccctctc cgcctgcgac cgcgccatcc aggccgaggc cggctggtcc 1740
ctcctcgccg aactcgccgc cgacgaaggc tcctcccagc tcgagcgcat cgacgtcgtc 1800
cagccggtcc tcttcgccct cgccgtcgcc ttcgccgccc tctggcgcag ctggggcgtc 1860
gccccggacg tcgtcattgg acactccatg ggcgaggtcg ccgccgccca cgtcgccggc 1920
gccctctcct tggaggacgc agtcgccatc atctgccgcc gctcccgcct cctccgccgc 1980
atctccggcc agggcgagat ggccgtcacc gagctgtccc tggccgaggc cgaggccgcc 2040
ctccgcggct acgaggaccg cgtctccgtc gccgtcagca actccccgcg ctccaccgtc 2100
ctctccggcg agccggccgc catcggcgag gtcctctcct ccctcaacgc caagggggtc 2160
ttctgccgcc gcgtaaaggt cgacgtcgcc tcccactccc cgcaggtcga cccgctccgc 2220
gaggacctcc tcgccgccct cggcggcctc cgcccggggg ccgccgccgt cccgatgcgc 2280
tccaccgtca ccggcgctat ggtcgccggc ccggaactcg gcgccaacta ctggatgaac 2340
aacctccgcc agccggtccg cttcgccgag gtcgtccagg cccaactcca gggcggccac 2400
ggcctcttcg tcgagatgtc gccgcacccc atcctcacca cctccgtcga ggagatgcgc 2460
cgcgccgccc agcgagccgg tgccgcagta ggctccctcc gccggggcca ggacgaacgc 2520
ccggccatgc tcgaggccct cggcaccctc tgggcccagg gttacccggt cccgtggggc 2580
cgcctcttcc cggccggcgg ccgccgcgta ccgctcccga cctacccgtg gcagcgcgag 2640
cgctactgga tcgaggcgcc ggccaagtcc gccgcgggcg accgccgtgg cgtccgcgcc 2700
ggcggccacc cgctcctcgg cgagatgcag accctctcca cccagacctc cacccgcctc 2760
tgggaaacca ccctcgacct caagcgcctc ccgtggctcg gagatcaccg cgtccagggc 2820
gccgtcgtct tcccgggcgc cgcctacctc gagatggcca tctcctcggg cgccgaggcc 2880
ctcggggacg gcccgctcca gatcaccgac gtcgtcctcg ccgaggccct cgccttcgcc 2940
ggtgacgccg ccgtcctcgt ccaggtcgtc actaccgagc agccgtcagg ccgcctccag 3000
ttccagatcg ccagccgggc cccgggcgcc ggccatgcct ccttccgcgt ccacgcccgc 3060
ggagctctcc tcagggtcga gcgcaccgag gtcccggccg gtctcaccct ctccgccgtc 3120
cgcgcccgcc tccaggcctc catcccggcc gccgccacct acgccgagct caccgagatg 3180
ggcctccagt acggcccggc cttccagggt atcgccgagc tctggcgcgg cgagggagag 3240
gccctcggcc gcgtccgcct cccggacgcc gccggatccg ccgccgagta ccgcctccac 3300
cccgccctcc tcgacgcctg cttccagatc gtcggctccc tcttcgcccg ctccggcgag 3360
gccacgccgt gggtcccggt cgagctcggc tccctccgcc tgctccagcg cccttccggc 3420
gaactctggt gccacgcccg cgtcgtcaac cacggccacc agaccccgga ccgccagggc 3480
gccgacttct gggtcgtcga ctcctccggc gccgtcgtcg ccgaggtctg cggcctcgtg 3540
gcccagcgcc tcccgggcgg cgtccgccgc cgcgaggagg acgactggtt cctcgagctc 3600
gagtgggagc cggccgccgt cggcaccgcc aaggtcaacg ccggacgctg gctcctcctc 3660
ggcggtgggg gcggcctcgg agccgccctc cgcgccatgc tcgaagccgg cggccacgca 3720
gtcgtccacg ccgccgagaa caacacctcc gccgccggcg tccgcgcact cctcgccaag 3780
gccttcgacg ggcaggcccc gaccgccgtg gtccacctcg gctccctcga cggcggcggc 3840
gagctcgacc cgggactcgg cgcccaggga gccctcgacg ccccgcgctc cgccgacgtc 3900
tccccggacg ccctcgaccc ggccctcgtc cgcggctgcg actcggtcct ctggaccgtc 3960
caggcgctcg ccggcatggg cttccgcgac gccccgcgcc tctggctctt gacccgcggc 4020
gcccaggccg tcggtgccgg cgacgtctcc gtcacccagg ccccgctcct cggcctcggc 4080
cgcgtcatcg ccatggagca tgccgacctc cgttgcgccc gcgtcgacct cgacccggcc 4140
cgcccggaag gcgagctcgc cgccctcctc gcagagctcc tcgctgacga cgccgaggcc 4200
gaggtcgccc tcaggggcgg cgagcgctgc gtcgcgcgca tcgtccgccg ccagccggag 4260
acccgcccgc gaggtcgcat cgagtcctgc gtcccgaccg acgtcaccat ccgcgccgac 4320
tccacctacc tcgtcaccgg cggcctcggc ggcctcggtc tctccgtcgc aggctggctc 4380
gccgagcgcg gcgccggtca cctcgtcctc gtcggccgat ccggcgccgc ttccgtcgag 4440
cagcgcgccg ccgtcgccgc cctcgaggcc cgcggcgccc gcgtcaccgt cgccaaggcc 4500
gacgtcgccg accgagccca gctcgagcgc atcctccgcg aggtcaccac cagcggcatg 4560
ccgctccgcg gcgtcgtcca cgcggccggc atcctcgacg acggcctcct catgcagcag 4620
accccggccc gcttccgcaa ggtcatggcc ccgaaggtcc agggcgccct ccacctccac 4680
gccctcaccc gcgaggcccc gctctccttc ttcgtcctct acgcctccgg cgtgggcctc 4740
ctcggctccc cgggacaggg caactacgcc gccgccaaca cattcctcga cgccctcgcc 4800
caccaccgcc gcgcccaggg tctcccggcc ctctccgtcg actggggcct cttcgccgag 4860
gtcggcatgg ccgccgccca ggaggaccgt ggcgctcgcc tcgtctcccg cggtatgcgc 4920
tccctcaccc cggacgaggg cctctccgcc ctcgcccgcc tccttgagtc cggccgcgcc 4980
caggtcggcg tcatgccggt caacccccgc ctctgggtcg aactctaccc ggccgccgcc 5040
agttcccgca tgctctcccg cctcgtcacc gcccaccgcg cctcggccgg cggcccggcc 5100
ggcgacggcg acctcctccg ccgcctcgcc gccgccgagc cgtccgcccg ctccgccctc 5160
ctcgagccgc tcctccgcgc ccagatctcc caggtcctcc gcctcccgga gggcaagatc 5220
gaggtggacg ccccgctcac ctccctcggc atgaactccc tcatgggtct cgagctccgc 5280
aaccgcatcg aggccatgct cggcatcacc gttccggcca ccctcctctg gacctacccg 5340
accgtcgccg ccctctccgg ccacctcgcc cgcgaggcct gcgaggccgc cccggtcgag 5400
tccccgcaca ccaccgccga ttcggccgta gagatcgagg aaatgtccca ggacgacctc 5460
acccagctca tcgccgccaa gttcaaggcc ctcacgtga 5499
<210> 4
<211> 21774
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon Optimized DNA of Sorangium cellulosum for Expression in
Streptomyces venezuelae
<400> 4
gtgaccaccc gtggcccgac cgcccagcag aacccgctca agcaggccgc catcatcatc 60
cagcgcctcg aggagcgcct cgccggcctc gcccaggccg agctcgagcg caccgagccg 120
atcgccatcg tcggcatcgg ctgccgcttc ccgggcggcg ccgacgcccc ggaggccttc 180
tgggagctcc tcgacgccga gcgcgacgcc gtccagccgc tcgacatgcg ctgggccctc 240
gtcggcgtcg ccccggtcga ggccgtcccg cactgggccg gcctcctcac cgagccgatc 300
gactgcttcg acgccgcctt cttcggcatc tccccgcgcg aggcccgctc cctcgacccg 360
cagcaccgcc tcctcctcga agtcgcctgg gagggcctcg aggacgcggg catcccgccg 420
cgctccatcg acggctcccg caccggcgtc ttcgtcggcg ccttcaccgc cgactacgcc 480
cgcaccgtcg cccgcctccc gcgcgaggag cgcgacgcct actccgccac cggcaacatg 540
ctctccatcg ccgccggccg cctcagctac accctcggcc tccagggccc gtgcctcacc 600
gtcgacaccg cctgctcctc ctccctcgtc gccatccacc tcgcctgccg ctccctccgc 660
gccggtgagt ccgacctcgc cctcgccggc ggcgtctccg ccctcctctc cccggacatg 720
atggaggccg ccgcccgcac ccaggccctc tccccggacg gccgctgccg caccttcgac 780
gcctccgcca acggcttcgt ccgcggcgag ggctgcggcc tcgtcgtcct caagcgcctc 840
tccgatgccc agcgcgacgg cgaccggatc tgggccttga tccgcggctc cgccatcaac 900
cacgacggtc gctccaccgg cctcaccgcc ccgaacgtcc tcgcccagga gaccgtcctc 960
cgcgaggccc tccgctccgc ccacgtcgag gccggcgccg tcgactacgt cgagacccac 1020
ggcaccggca cctccctcgg cgaccctatc gaggtcgagg ccctccgcgc caccgtcggc 1080
ccggcccgct ccgacggcac ccgctgcgtc ctcggcgccg tcaagaccaa catcggccac 1140
ctcgaggccg ccgccggcgt cgccggcctc atcaaggccg ccctctccct cacccacgag 1200
cgcatcccgc gcaacctcaa cttccgcact ctcaacccgc gcatccgcct cgagggctcc 1260
gccctcgccc tcgccaccga gccggtcccg tggccgcgca ccgaccgccc gcgcttcgcc 1320
ggcgtctcct ccttcggcat gtccggcacc aacgcccacg tcgtcctcga ggaggccccg 1380
gccgtcgaac tctggccggc cgccccggag cgctccgccg agctcctcgt cctctccgga 1440
aagtccgagg gcgccctcga cgcccaggcc gcccgcctcc gcgagcacct cgacatgcac 1500
ccggaactcg gcctcggcga cgtcgccttc tcccttgcca ccacccgctc cgccatgtcc 1560
caccgcctcg ccgtcgccgt cacctcccgc gagggcctcc tcgccgccct ctccgccgtc 1620
gcccagggcc agaccccggc cggcgccgcc cgctgcatcg cctcctcctc ccgcggcaag 1680
ctcgccttcc tcttcaccgg ccagggcgcc cagaccccgg gcatgggccg cggcctgtgc 1740
gccgcctggc cggccttccg cgaggctttc gaccgctgcg tcgccctctt cgaccgcgag 1800
ctcgaccgcc cgctccgcga ggtcatgtgg gccgaggccg gctccgccga gtccctcctc 1860
ctcgaccaga ccgccttcac ccaaccggcc ctcttcgccg tcgagtacgc cctcaccgcc 1920
ctctggcgct cctggggggt cgagccggag ctcctcgtcg gccattccat cggcgagctc 1980
gtcgctgcct gcgtcgccgg cgtcttctcc cttgaggacg gcgtccgcct cgtcgccgcc 2040
cgcggccgcc tcatgcaggg cctcagtgcc ggcggcgcca tggtatccct cggcgccccg 2100
gaggcggaag tcgccgccgc cgtcgccccg cacgccgcct ccgtttctat cgccgccgtc 2160
aacggcccgg agcaggtcgt catcgccggc gtcgagcagg ccgtccaggc catcgccgca 2220
ggcttcgccg cccgcggcgc ccgcaccaag cgcctccacg tctcccacgc cttccactcc 2280
ccgctcatgg agccgatgct cgaggagttc ggccgcgtcg ccgcctccgt cacctatcgc 2340
cgcccgtccg tctccctcgt ctccaacctc tccggcaagg tcgtcaccga cgagctctcc 2400
gccccgggct actgggtccg ccacgtccgc gaggccgtcc gcttcgccga cggcgtcaag 2460
gccctccacg aggccggcgc cggcaccttc gttgaggtcg gcccgaagcc gaccctcctc 2520
ggcctcctcc ccgcctgcct cccggaggcc gagccgaccc tcctcgcctc cctccgcgcc 2580
ggccgcgagg aggccgccgg cgtcctcgag gccctcggcc gcctctgggc cgccggcggc 2640
tccgtctcct ggccgggcgt cttcccgacc gccggccgcc gcgtcccgct cccgacctac 2700
ccgtggcagc gccagcgcta ctggatcgag gccccggccg agggcctcgg cgccaccgcc 2760
gccgacgccc tcgcccagtg gttctaccgc gtcgactggc cggagatgcc gcgctcctcc 2820
gtcgactccc gccgcgcccg ctccggcggc tggctcgttc tcgccgaccg cggcggcgtc 2880
ggtgaggccg ccgccgccgc cctctcctcc cagggctgct cctgcgccgt cctccacgcc 2940
ccggccgagg cctccgccgt cgccgagcag gtcacccagg ccctcggcgg ccgcaacgac 3000
tggcagggcg tcctctacct ctggggcctc gacgccgtcg tcgaggcagg cgcctccgcc 3060
gaggaggtcg ccaaggtcac ccacctcgcc gccgccccgg tcctcgccct catccaggcc 3120
ctcggcaccg gcccgcgctc cccgcgcctc tggatcgtca cccgcggcgc ctgcaccgtc 3180
ggcggcgagc cggacgccgc cccgtgccag gccgccctct ggggcatggg ccgcgtcgcc 3240
gccctcgagc acccgggctc ctggggcggc ctggtcgacc tcgacccgga ggagtccccg 3300
accgaggtcg aggccctcgt cgccgagctc ctctccccgg acgccgagga ccagctcgcc 3360
ttccgccagg gccgccgccg cgccgcccgc ctcgtcgccg ccccgccgga gggcaacgcc 3420
gccccggtct ccctctccgc cgagggctcc tacctcgtca ccggcggcct cggcgccctc 3480
ggcctcctcg tcgcccgctg gctcgtcgag cgcggcgccg gccacctcgt cctcatctcc 3540
cgccacggcc tcccggaccg cgaggagtgg ggccgcgacc agccgccgga ggtccgcgcc 3600
cgcatcgccg ccatcgaggc cctcgaggcc cagggcgccc gcgtcaccgt cgccgccgtc 3660
gacgtcgccg acgccgaggg catggccgcc ctcctcgccg ccgtcgagcc gccgctccga 3720
ggcgtcgtcc acgccgccgg cctcctcgac gacggcctcc tcgcccacca ggacgccggc 3780
agactcgccc gggtcctccg cccgaaggtc gagggcgcct gggtcctcca caccctcacc 3840
cgcgagcagc cgctcgacct cttcgtcctt ttctcctccg cctccggcgt cttcggctcc 3900
atcggccagg gctcctacgc cgccggcaac gccttcctcg acgccctcgc cgacctcagg 3960
cgcacccagg gcctcgccgc cctctccatc gcctggggcc tctgggccga gggcggcatg 4020
ggctcccagg cccagcgcag ggagcacgag gcctccggca tctgggccat gccgacctcc 4080
cgcgccctgg ccgccatgga gtggctcctc ggcacccgcg ccacccagcg cgtcgtcatc 4140
cagatggact gggcccacgc cggcgccgcc ccgcgcgacg cctcccgcgg ccgcttctgg 4200
gaccgcctcg tcaccgccac caaggaggcc tcctcctccg ccgtcccggc cgtcgagcgc 4260
tggcgcaacg cctccgtcgt cgagacccgc tccgccctct acgagctcgt ccgcggcgtc 4320
gtcgccggcg tcatgggctt caccgaccag ggcactctcg acgtccgccg cggcttcgcc 4380
gagcagggcc tcgactccct catggccgtc gagatccgca agcgcctcca gggcgagctc 4440
ggcatgccgc tctccgccac cctcgccttc gaccacccga ccgtcgagcg cctcgtcgag 4500
tacctcctct cccaggccct cgagctccag gaccgcaccg acgtccgctc cgtccgcctc 4560
ccggccaccg aagacccgat cgccatcgtc ggcgccgcct gccgcttccc gggcggcgtc 4620
gaggacctcg agtcctactg gcagctcctc accgagggcg tcgtcgtctc caccgaggtc 4680
ccggccgacc gctggaacgg cgccgacggc cgcgtcccgg gctccggcga ggcccagcgc 4740
cagacctacg tcccgcgcgg cggcttcctc cgcgaggtcg agaccttcga cgccgccttc 4800
ttccacatct ccccgcgcga ggccatgtcc ctcgacccgc agcagcgcct cctcctcgag 4860
gtctcctggg aggccatcga gcgcgccggc caggacccgt ccgccctccg cgagtccccg 4920
accggcgtct tcgtcggcgc cggcccgaac gagtacgccg agcgcgtcca ggagctcgcc 4980
gacgaggccg caggcctcta ctccggcacc ggcaacatgc tctccgtcgc cgccggccgc 5040
ctctccttct tcctcggcct ccatggcccg accctcgccg tcgataccgc ctgctcctcc 5100
tccctcgtcg ccctccacct cggctgtcag tccctccgcc gcggcgagtg cgaccaggcc 5160
ctcgtcggcg gcgtcaacat gctcctctcc ccgaagacct tcgccctcct ctcccgcatg 5220
cacgccctct ccccgggcgg ccgctgcaag accttctccg ccgacgccga cggctacgcc 5280
cgcgccgagg gctgcgccgt cgtcgtcctc aagcgcctct ccgacgccca gcgcgaccgc 5340
gacccgatcc tcgccgtcat ccgcggcacc gccatcaacc acgacggccc gtcctccggc 5400
ctcaccgtcc cgtcgggccc ggcccaggag gccctcctcc gccaggccct cgcccacgcc 5460
ggcgtcgtcc cggccgacgt cgacttcgtc gagtgccacg gcaccggcac cgccctcggc 5520
gacccgatcg aggtccgcgc cctctccgac gtctacggcc aggcccgccc ggccgaccgc 5580
ccgctcatcc tcggcgccgc caaagccaac ctcggccaca tggagcccgc cgccggcctc 5640
gccggcctcc tcaaggccgt cctcgccctc ggccaggagc agatcccggc ccagccggag 5700
ctcggcgagc tcaacccgct cctcccgtgg gaggccctcc cggtcgccgt cgcccgcgcc 5760
gccgtcccgt ggccgcgcac cgaccgcccg cgcttcgccg gcgtctcctc cttcggcatg 5820
tccggcacca acgcccacgt cgtcctcgag gaggccccag ccgtcgagct ctggccggcc 5880
gccccggagc gatccgccga gctcctcgtc ctctccggca agtccgaggg cgccctcgac 5940
gcccaggccg cccgcctccg cgagcacctc gacatgcacc cggagctcgg cctcggcgac 6000
gtcgccttct ccctcgccac cacacgctcc gccatgaacc accgcctcgc cgtcgccgtc 6060
acctcccgcg agggcctcct cgccgccctc tccgccgtcg cccagggcca gaccccgccg 6120
ggcgccgccc gctgcatcgc ctcctcctcc cgcggcaagc tcgccttcct cttcaccggc 6180
cagggcgccc agaccccggg catgggccgc ggcctctgcg ccgcctggcc cgccttccgc 6240
gaggccttcg accgctgcgt cgccctcttc gatcgcgagt tggaccgccc gctccgcgag 6300
gtcatgtggg ccgagccggg ctctgccgag tccctcctcc tcgaccagac cgccttcacc 6360
cagccggccc tcttcacggt cgagtacgcc ctcaccgccc tctggcgctc ctggggcgtc 6420
gagccggagc tcgtcgccgg ccattccgcc ggcgaactcg tcgccgcctg cgtcgccggc 6480
gtcttctccc tcgaggacgg cgttcgcctc gtcgccgccc gcggccgact catgcagggc 6540
ctctccgccg gcggcgccat ggtctccctc ggcgccccgg aggccgaggt cgccgccgcc 6600
gtcgccccgc acgccgcctc cgtctccatc gccgccgtca acggcccgga gcaggtcgtc 6660
atcgccggcg tcgagcaggc cgtccaggcc atcgccgccg gcttcgccgc ccgcggcgcc 6720
cgcaccaaac gcctccacgt ctcccacgcc tcccactccc cgctcatgga gccgatgctc 6780
gaggagttcg gccgcgtcgc cgcctccgtc acctaccgcc gcccgtccgt ctccctcgtc 6840
tccaacctct ccggcaaggt cgtcgccgac gagctctccg ccccgggcta ctgggtccgc 6900
cacgtccgcg aggccgtccg cttcgccgac ggcgtcaagg ccctccacga ggccggcgcc 6960
ggcaccttcg tcgaggtcgg cccgaagccg accctcctcg gcctcctccc ggcctgcctc 7020
ccggaggccg aaccgaccct cctcgcctcc ctccgcgccg gccgcgagga ggccgccggc 7080
gtcctcgagg ccctcggccg cctctgggcc gccggcggct ccgtctcctg gcctggcgtc 7140
ttcccgaccg ccggccgccg cgtcccgctc ccgacctacc cgtggcagcg tcagcgctac 7200
tggccggaca tcgagccgga ttcccgccgc cacgccgccg ccgacccgac ccagggctgg 7260
ttctaccgcg tcgactggcc ggagatcccg cgcagtctcc agaagtccga ggaggcctcc 7320
cgcggctcct ggctcgtcct cgctgacaag ggcggcgtcg gcgaggccgt cgccgccgcc 7380
ctctccaccc gcggcttgcc gtgcgtcgtc ctccacgccc cggcagagac ctccgccacc 7440
gccgagctcg tcaccgaggc cgccggcggc cgctccgact ggcaggtcgt cctctacctc 7500
tggggcctcg acgccgtcgt cggcgccgag gcctccatcg acgagatcgg cgacgccacc 7560
cgccgcgcca ccgccccggt cctcggcctc gcccgcttcc tctccaccgt ctcctgctcc 7620
ccgcgcctct gggtcgtcac ccgcggcgcc tgcatcgtcg gcgacgagcc ggcaatcgcc 7680
ccctgccagg ccgccctctg gggcatgggc cgcgtcgccg ccctcgagca cccgggcgca 7740
tggggcggcc tcgtcgacct cgacccgcgc gcctccccgc cgcaggcctc cccgattgac 7800
ggcgagatgc tcgtcaccga gctcctctcc caggagaccg aggaccagct cgccttccgc 7860
cacggccgcc gccacgccgc ccgcctcgtc gccgccccgc cgcagggcca ggccgccccg 7920
gtctccctct ccgccgaggc ctcctacctc gtcaccggcg gcctcggcgg cctcggcctc 7980
atcgtcgccc agtggctcgt cgagctcggc gcccgccacc tcgtcctcac ctcccgccgc 8040
ggcctcccgg accgccaggc ctggtgcgag cagcagccgc cggagatccg cgcccgcatc 8100
gccgccgtcg aggccctcga ggcccgcggc gcccgcgtca ccgtcgccgc cgtcgacgtc 8160
gccgacgtcg agccgatgac cgccctcgtc tcctccgtgg agccgccgct ccgcggcgtc 8220
gtccacgccg ccggcgtctc cgtcatgcgc ccgctcgccg agaccgacga gaccctcctc 8280
gagtccgtcc tccgcccgaa ggtcgccggc tcctggctcc tccaccgcct cctccacggc 8340
cgcccgctcg acctcttcgt cctcttctcc tccggcgccg ccgtctgggg ctcccactcc 8400
cagggcgcct acgccgccgc caacgccttc ctcgacggcc tcgcccacct ccgccgctcc 8460
cagtccctcc cggccctctc cgtcgcctgg ggcctctggg ccgagggcgg catggccgac 8520
gccgaggccc acgcccgctt gtccgacatc ggcgtcctcc cgatgtccac ctccgccgcc 8580
ctctccgccc tccagcgcct cgtcgagacc ggcgctgccc agcgcaccgt cacccgcatg 8640
gactgggccc gtttcgcccc ggtctacacc gcccgcggcc gccgcaacct cctctccgcc 8700
ctcgtcgccg gccgcgacat catcgccccg tccccgccgg ccgccgccac ccgcaactgg 8760
cgcggcctct ccgtcgccga ggcccgcgtc gccctccacg agatcgtcca cggtgccgtc 8820
gcccgcgtcc tcggcttcct cgacccgtcc gccctcgacc cgggcatggg cttcaacgag 8880
cagggcctcg actccttgat ggccgtcgag atccgcaacc tcctccaggc cgagctcgat 8940
gtccgcctct ccaccaccct cgccttcgac cacccgaccg tccagcgcct cgtcgagcac 9000
ctcctcgtcg acgtcctcaa gctcgaggac cgctccgaca cccagcacgt ccgctccctc 9060
gcctccgacg agccgatcgc catcgtcggc gccgcctgcc gcttcccggg cggcgtcgag 9120
gacctcgagt cctactggca gctcctcgcc gagggcgtcg tcgtatccgc cgaggtcccg 9180
gccgaccgct gggacgccgc cgactggtac gacccggacc cggagatccc gggccgcacc 9240
tacgtcacca agggcgcctt cctccgcgac ctccagcgcc tcgacgccac cttcttccgc 9300
atctccccgc gcgaggccat gtccctcgac ccgcagcagc gcctcctcct cgaggtctcc 9360
tgggaggccc tcgagtccgc cggcatcgcc ccggacacac tccgcgactc cccgaccggc 9420
gtcttcgtcg gcgccggccc gaacgagtac tacacccagc gcctccgtgg cttcaccgac 9480
ggcgccgccg gcctctacgg cggcaccggc aacatgctct ccgtcaccgc cggacgcctc 9540
tccttcttcc tcggcctcca cggcccgacc ctcgccatgg acaccgcctg ctcctcctcc 9600
ctcgtcgcac tccacctcgc ctgccagagt ctccgcctcg gcgagtgcga ccaggccctc 9660
gtcggcggcg tcaacgtcct cctcgccccg gagaccttcg tcctcctctc ccgcatgcgc 9720
gccctctccc cggacggccg ctgcaagacc ttctccgccg acgccgacgg ctacgcccgc 9780
ggcgagggct gcgccgtcgt cgtcctcaag cgcctccgcg acgcccagcg cgccggcgac 9840
tccatcctcg ccctcatccg cggctccgcc gtcaaccacg acggcccgtc ctccggtctc 9900
accgtcccga acggcccggc ccagcaggcc ctcctccgcc aggccctctc ccaggccggc 9960
gtctccccgg tcgacgtcga cttcgtcgag tgccacggca ccggcaccgc cctcggcgac 10020
ccgatcgagg tccaggccct ctccgaggtc tacggcccgg gccgctccgg cgaccgcccg 10080
ctcgtcctcg gcgccgccaa ggccaacgtc gcccacctcg aggccgcctc cggcctcgcc 10140
tccctcctca aggccgtcct cgccctccgc cacgagcaga tcccggccca gccggagctc 10200
ggcgagctca acccgcacct cccgtggaac accctcccgg tcgccgtccc gcgcaaggcc 10260
gtcccgtggg gccgcggcgc ccgcccgcgc cgcgccggcg tctccgcctt cggcctctcc 10320
ggcaccaacg tccacgtcgt cctcgaggag gccccggagg tcgagccggc cccggccgcc 10380
ccggcccgcc cggtcgagct cgtcgtcctc tccgccaagt ccgccgccgc cctcgacgcc 10440
gccgccgccc gcctctccgc ccacctctcc gcccacccgg agctctccct cggcgacgtc 10500
gccttctccc tcgccaccac ccgctccccg atggagcacc gcctcgccat cgccaccacc 10560
tcccgcgagg ccctccgcgg cgccctcgac gccgccgccc agcaaaagac cccgcagggc 10620
gccgtccgcg gcaaggccgt ctcctcccgc ggcaagctcg ccttcctctt caccggccag 10680
ggcgcacaga tgccgggcat gggccgcggc ctctacgaga cctggccggc cttccgcgag 10740
gccttcgacc gctgcgtcgc cctcttcgac cgcgaaatcg accagccgct ccgcgaggtc 10800
atgtgggccg caccgggcct cgcccaggct gcccgcctcg accagaccgc ctacgcccag 10860
ccggccctct tcgccctcga gtacgccctc gccgccctct ggcgctcctg gggcgtcgag 10920
ccgcacgtcc tcctcggcca ttcaatcggc gagctcgtcg ccgcctgtgt cgccggcgtc 10980
ttctccctcg aggacgccgt ccgcctcgtc gccgcccgcg gccgcctcat gcaggccctc 11040
ccggccggcg gcgccatggt cgccatcgcc gcctccgagg ccgaggtcgc cgcctccgtc 11100
gccccgcacg ccgccaccgt ctccatcgcc gccgtcaacg gcccggacgc cgtcgtcatc 11160
gccggcgccg aggtccaggt cttggccctc ggcgccacct tcgccgcccg cggcatccgc 11220
accaagagac ttgccgtctc ccacgccttc cactccccgc tcatggaccc gatgctcgag 11280
gacttccagc gcgtcgccgc caccatcgcc taccgcgccc cggaccgccc ggtcgtctcc 11340
aacgtcaccg gccacgtcgc tggtccggag atcgccaccc cggagtactg ggtccgccac 11400
gtccgctccg ccgtccgctt cggcgacggc gccaaggccc tccacgccgc cggcgccgcc 11460
acattcgtcg aggtcggccc gaagccggtc ctcctcggcc tcctcccggc ctgcctcggc 11520
gaggccgacg ccgtcctcgt cccgtccctc cgcgccgacc gctccgagtg tgaagtcgtc 11580
ctcgccgccc tcggcgcctg gtacgcctgg ggcggcgccc tcgactggaa gggcgtcttc 11640
cctgacggcg cccgccgcgt cgccctcccg atgtaccctt ggcagcgcga gcgccactgg 11700
atggacctca ccccgcgctc cgccgccccg gccggcatcg ccggccgctg gccgctcgcc 11760
ggagtcggcc tctgcatgcc gggcgccgtc ctccaccacg tcctctccat cggcccgcgc 11820
caccagccgt tcctcggcga tcacctcgtc ttcggcaagg tcgtcgtccc gggcgccttc 11880
cacgtcgccg tcatcctctc catcgccgcc gagcgctggc cggagcgcgc catcgagctc 11940
accggcgtcg agttcctcaa ggccatagcc atggagccgg accaggaggt cgagctccac 12000
gccgtcctca ccccggaggc cgccggcgac ggctacctct tcgagctcgc caccctcgcc 12060
gccccggaga ccgagcgccg ctggaccacc cacgcccgcg gccgcgtcca gccgaccgac 12120
ggcgccccgg gcgccctccc gcgcctcgag gtcctcgagg accgcgccat ccagccgctt 12180
gacttcgccg gcttcctcga ccgcctctcc gccgtccgca tcggctgggg cccgctctgg 12240
cgctggctcc aggacggccg cgtcggcgac gaggcctccc tcgccacctt agtcccgacc 12300
tacccgaacg cccacgacgt cgccccgctc cacccgatcc tcctcgacaa cggcttcgcc 12360
gtctccctcc tctccacccg ctccgagccg gaggacgacg gcaccccgcc gctcccgttc 12420
gccgtcgagc gcgtccgctg gtggcgcgcc ccggtcggcc gcgtccgctg cggcggcgtc 12480
ccgcgctccc aggccttcgg cgtctcctcc ttcgtcctcg tcgacgagac cggcgaggtc 12540
gtcgccgagg tcgagggctt cgtctgccgc cgcgctccgc gcgaggtctt cctccgccag 12600
gagtccggcg cctccaccgc cgccctctat cgcctcgact ggccggaggc cccgctcccg 12660
gacgccccgg ccgagcgcat cgaggagtcc tgggtcgtcg tcgccgcccc gggctccgag 12720
atggccgccg ccctcgccac ccgcctcaac cgctgcgtcc tcgccgagcc gaagggcctc 12780
gaggccgccc tcgccggcgt ctccccggcc ggcgtcatct gcctctggga ggccggcgcc 12840
cacgaggagg ccccggccgc cgcccagcgc gtcgcaaccg agggcctctc cgtcgtccag 12900
gccctccgcg accgcgccgt ccgcctctgg tgggtcacca tgggcgccgt cgccgtcgag 12960
gccggcgagc gcgtccaggt cgccaccgcc cctgtctggg gcctcggccg caccgtcatg 13020
caggagcgcc cggagctctc ctgcaccctc gtcgacctcg agccggaggc cgacgccgcc 13080
cgctccgccg acgtcctcct ccgcgagctc ggccgcgccg acgacgaaac ccaggtagcc 13140
ttccgctccg gcaagcgccg cgtcgcccgc ctcgtcaagg ccaccactcc ggagggcctc 13200
ctcgtcccgg acgccgagtc ctaccgcctc gaggccggcc agaagggcac cctcgaccag 13260
ctccgcctcg ccccggccca gcgccgcgcc cccggcccgg gcgaggtcga gatcaaggtc 13320
accgcctccg gcctcaactt ccgaaccgtc ctcgccgtcc tcggcatgta cccgggcgac 13380
gccggcccga tgggcggcga ctgcgccggc gtcgccaccg ccgtcggcca gggcgtccgc 13440
catgttgccg tcggcgacgc cgtcatgact ctcggcaccc tccaccgctt cgtcaccgtc 13500
gacgcccgcc tcgtcgtccg ccagccggcc ggcctcaccc cggcccaggc cgccaccgtc 13560
ccggtcgcct tcctcaccgc ctggctcgcc ctccacgacc tcggaaacct ccgccgcggc 13620
gagcgcgtcc tcatccacgc cgccgccggc ggcgtcggca tggcagccgt ccagatcgcc 13680
cgctggatcg gcgccgaggt cttcgccacc gcttccccgt ccaagtgggc agccgtccag 13740
gccatgggcg tcccgcgcac ccacatcgcc tcctcccgca ccctcgagtt cgccgagacc 13800
ttccgccaag tcaccggcgg ccgcggcgtc gacgtcgtcc tcaacgccct cgccggcgag 13860
ttcgtcgacg cctccctctc cctcctctcc accggcggac gcttcctcga gatgggcaag 13920
accgacatcc gcgaccgcgc cgccgtcgcc gccgcccacc cgggcgtccg ctaccgcgtc 13980
ttcgacatcc tcgagctcgc cccggaccgc acccgcgaga tcctcgagcg cgtggtcgag 14040
ggcttcgccg ccggccatct ccgtgccctc ccggtccacg ccttcgccat caccaaggcc 14100
gaggccgcct tccgcttcat ggcccaggcc cgccaccagg gcaaggtcgt cctcctcccg 14160
gccccgtccg ccgccccgct cgccccgacc ggcaccgtcc tcctcaccgg cggcctcggc 14220
gccctcggcc tccacgtcgc ccgctggctc gcccagcagg gcgtcccgca catggtcctc 14280
acaggccgcc gcggcctcga cactccgggc gccgccaagg ccgtcgccga gatcgaggca 14340
ctcggcgccc gcgtcaccat cgccgcctcc gacgtcgccg accgcaacgc cctcgaggcc 14400
gtcctccagg ccatcccggc cgaatggccg ctccagggcg tcatccacgc cgcaggcgcc 14460
ctcgacgacg gcgtcctcga cgagcagacc accgaccgct tctcccgcgt cctcgccccg 14520
aaggtcaccg gcgcctggaa cctccacgag ctcaccgccg gcaacgacct cgccttcttc 14580
gtactcttct cctccatgtc cggcctcctc ggctccgccg gccagtccaa ctacgccgcc 14640
gcaaacacct tcctcgacgc cctcgccgcc caccgccgcg ccgagggcct cgccgcacag 14700
tccctcgcct ggggcccgtg gtccgacggc ggcatggccg ccggcctctc tgccgccctc 14760
caggcccgcc tcgcccgcca cggcatgggc gccctctccc cagcccaggg caccgccctc 14820
cttggccagg ccctcgcccg cccggagacc cagctcggcg ccatgtccct cgacgtccgc 14880
gccgcctccc aggcctccgg cgccgccgtc ccgccggtct ggcgcgccct cgtccgcgcc 14940
gaggcccgcc acaccgccgc cggcgcccag ggcgccctcg ccgcccgcct cggcgccctc 15000
ccggaggccc gacgcgccga cgaggtccgc aaggtcgtcc aggccgagat cgcccgcgtc 15060
ctctcctggt ccgccgcctc cgccgtcccg gtcgaccgcc cgctctccga tctcggccta 15120
gactccctca ccgccgtcga gctccgcaac gtcctcggcc agcgcgtcgg cgccaccctc 15180
ccggccaccc tcgccttcga ccacccgacc gtcgacgccc tcacccgctg gctcctcgac 15240
aaggtcctcg ccgtcgccga gccgtccgtc tcctccgcca agtcctcccc gcaggtcgcc 15300
ctcgacgagc cgatcgccat catcggcatc ggctgtcgct tcccgggcgg cgtcgccgac 15360
ccggagtcct tctggcgcct cctcgaggag ggctccgacg ccgtcgtcga ggtcccgcac 15420
gagcgctggg acatcgatgc cttctacgac ccggacccgg acgtccgcgg caagatgacc 15480
acccgcttcg gcggcttcct ctccgacatc gaccgcttcg acccggcctt cttcggcatc 15540
tccccgcgcg aggccaccac catggacccg cagcagcgcc tcctcctcga gacctcctgg 15600
gaggccttcg agcgcgccgg catcctcccg gagcgtctca tgggctccga caccggcgtc 15660
ttcgtcggac tcttctacca ggagtacgcc gccctcgccg gcggcatcga ggccttcgac 15720
ggctacctcg gcaccggcac caccgcctcc gtcgcctccg gccgcatctc ctacgtcctc 15780
ggcctcaagg gcccgtccct caccgtcgac accgcctgct cctcctccct cgtcgccgtc 15840
cacctcgcct gccaggccct ccgccgcggc gagtgctccg tcgccctcgc cggcggcgta 15900
gccctcatgc tcaccccggc caccttcgtc gagttctccc gcctccgcgg cctcgccccg 15960
gacggccgct gcaagtcctt ctccgccgcc gccgacggcg tcggctggtc cgagggctgc 16020
gccatgctcc tcctcaagcc gctccgcgac gcccagcgcg acggcgaccc gatcctcgcc 16080
gtcatccgcg gcaccgccgt caaccaggac ggccgctcca atggcctcac cgccccgaac 16140
ggctcctccc agcaggaggt catccgccgc gccctcgagc aggccggcct cgccccggcc 16200
gacgtctcct acgtcgagtg ccacggcacc ggcaccaccc tcggcgaccc gatcgaggtc 16260
caggccctcg gcgccgtcct cgcccagggc cgcccgtccg accgcccgct cgtcataggc 16320
tctgtcaagt ccaacatcgg ccatacccag gccgccgccg gcgtcgccgg cgtcatcaag 16380
gtagccctcg ccctcgagcg cggcctcatc ccgcgctccc tccacttcga cgccccgaac 16440
ccgcacattc cgtggtccga gctcgccgtc caggtcgccg ccaagccggt cgagtggacc 16500
cgcaacggcg tcccgcgccg cgccggcgtc tcctccttcg gcgtctccgg caccaacgcc 16560
cacgtcgtcc tcgaggaggc cccggccgcc gccttcgccc cggccgccgc ccgctccgcc 16620
gagctcttcg tcctctccgc caagtccgcc gccgccctcg acgcacaggc ggcccgcctc 16680
tccgcccatg tcgtcgccca cccggagctc ggcctcggcg acctcgcctt ctccctcgcc 16740
accacccgct ccccgatgac ctaccgcctc gccgttgccg ccacctcccg cgaggccctc 16800
tccgccgccc tcgacaccgc cgcccagggg caggccccgc cggccgcggc ccgcggccac 16860
gcctccaccg gctccgcccc gaaggtcgtc ttcgtcttcc cgggccaggg ctcccagtgg 16920
ctcggcatgg gccagaagct cctctccgag gagccggtct tccgcgacgc cctctccgcc 16980
tgcgaccgcg ccatccaggc cgaggccggc tggtccttgc tcgccgagct cgccgccgac 17040
gagaccacat cccaactcgg ccgcatcgac gtcgtccagc cggccctctt cgccatcgag 17100
gtcgccctct ccgccctctg gcgctcctgg ggcgtcgagc cggacgccgt cgtcggccac 17160
tccatgggcg aggtcgccgc cgcccacgtc gccggcgccc tctccctcga agacgccgtc 17220
gccatcatct gccgccgctc cctcctcctt cgccgcatct ccggccaggg tgagatggcc 17280
gtcgtcgagc tctccctcgc cgaggctgaa gccgccctcc tcggctacga ggaccgcctc 17340
tccgtagccg tctccaactc cccgcgctcc accgtcctcg ccggcgagcc ggccgccctc 17400
gccgaggtcc tcgccatcct cgccgccaag ggcgtcttct gccgccgcgt caaggtcgac 17460
gtcgcctccc actccccgca gatcgacccg ctccgcgacg agctcctcgc cgccctcggc 17520
gagctcgaac cgcgccaggc caccgtctcc atgcgctcca ccgtcacctc caccatcatg 17580
gccggcccgg agctcgtcgc ctcctactgg gccgacaacg tccgccagcc ggtccgcttc 17640
gccgaggccg tccagtccct catggaggac ggccacggcc tcttcgtcga gatgtcccca 17700
cacccgatcc tcaccacctc cgtcgaggag atccgccgcg ccaccaagcg cgagggcgtc 17760
gccgtcgggt ccctccgccg cggccaagac gagcgcctct ccatgctcga ggccctcggc 17820
gccctctggg tccacggcca ggccgtcggc tgggagcgcc tcttctccgc cggcggcgcc 17880
ggcctccgcc gcgtcccgct cccgacctac ccgtggcagc gcgagcgcta ctgggtcgac 17940
gccccgaccg gcggcgccgc cggcggctcc cgcttcgccc acgccggctc ccacccgctc 18000
ctcggcgaaa tgcagaccct ctccacccag cgctccaccc gcgtctggga gaccaccctc 18060
gacctcaagc gcctcccgtg gctcggcgac caccgcgtcc agggcgccgt cgtcttcccg 18120
ggcgccgcct acctcgagat ggccctctcc tccggcgccg aagccctcgg cgatggcccg 18180
ctccaggtct ccgacgtcgt cctcgccgag gccctcgcct tcgccgacga caccccggcc 18240
gctgtccagg tcatggccac cgaggagcga ccgggccgcc tccagttcca cgtcgcctcc 18300
agagtcccgg gccacggcgg cgccgccttc cgctcccacg cccgcggcgt cctccgccag 18360
atcgagcgcg ccgaggtccc ggcccgcctc gacctcgcag ccctccgcgc ccgcctccag 18420
gcctccgccc cggccgccgc cacctacgcc gccctcgccg agatgggcct cgagtacggc 18480
ccggccttcc agggcctcgt cgagctctgg cgcggcgagg gggaggcgct tggccgcgtg 18540
cgcctcccgg aagccgccgg ctccccggcc gcctgccgcc tccacccggc cctcctcgac 18600
gcctgcttcc acgtctcctc cgccttcgcc gaccgcggcg aggccacccc gtgggtcccg 18660
gtcgagatcg gctccctccg ctggttccag cgcccgtccg gcgagctctg gtgtcacgcc 18720
cgctccgtct cccacggcaa gccgaccccg gaccgccgct ccaccgactt ctgggtcgtc 18780
gactccaccg gcgccatcgt cgccgagatc tccggcctcg tcgcccagcg cctcgccggc 18840
ggcgtccgcc gccgcgagga ggacgactgg ttcatggagc cggcctggga gccgaccgcc 18900
gtcccgggct ccgaggtcat ggccggccgc tggctcctca tcggctccgg cggcggcctc 18960
ggcgccgccc tccactccgc cctcaccgag gccggccact ccgtagtcca cgcgaccggc 19020
cgcggcacca gcgccgccgg cctccaggcc ctcctcaccg cctccttcga cggccaggcc 19080
ccgacgtccg tcgtccacct cggctccctc gacgagcgcg gcgtcctcga cgccgacgcc 19140
ccgttcgatg ccgatgccct cgaggagtcc ctcgtccgcg gctgcgactc cgtcctctgg 19200
accgtccagg ccgtcgccgg cgccggcttc cgcgacccgc cgcgcctctg gctcgtcacc 19260
cgcggcgccc aggccatcgg cgccggcgac gtctccgtcg cccaggcccc cctcctcggc 19320
ctcggccgcg tcatcgccct cgagcacgcc gagctccgct gcgcccgcat cgacctcgac 19380
ccggcccgcc gcgacggcga ggtcgacgag ctcctcgccg agctcctcgc cgacgacgcc 19440
gaggaggagg tcgccttccg cggcggcgag cgccgcgtcg cccgcctcgt ccgccgcctc 19500
ccagagaccg actgccgcga gaagatcgag ccggccgagg gccgcccgtt ccgcctcgag 19560
atcgacggct ccggcgtcct cgacgacctc gtcctccgcg ccaccgagcg ccgcccgccg 19620
ggcccgggcg aggtcgagat tgccgtcgag gccgccggcc tcaacttcct cgacgtcatg 19680
cgcgccatgg gcatctaccc tgggccgggc gacggcccgg tcgccctcgg cgccgagtgc 19740
tccggccgca tcgtcgccat gggcgagggc gtcgagtccc tccgcatcgg ccaggacgtc 19800
gtcgccgtcg ccccgttctc cttcggcacc cacgtcacca tcgatgcccg catgctcgcc 19860
ccgcgcccgg ccgcactcac cgccgcccag gccgccgccc tcccggtcgc cttcatgacc 19920
gcctggtacg gcctcgtcca cctcggccgc ctccgcgccg gcgagcgcgt cctcatccac 19980
tcagccaccg gcggcaccgg cctcgccgcc gtccagatcg cccgccacct cggcgccgag 20040
atcttcgcca ccgccggtac cccggagaag cgcgcctggc tccgcgagca gggcatcgcc 20100
cacgtcatgg actcccgctc cctcgacttc gccgagcagg tcctcgccgc caccaagggc 20160
gagggcgtcg acgtcgtcct caactccctc tccggcgccg ccatcgacgc ctccctctcc 20220
accctcgtcc cggacggccg cttcatcgaa ctcggcaaga ccgacatcta cgccgatcgc 20280
tccttgggcc ttgcacactt ccgcaagtcc ctctcctact ccgccgtcga cctcgccggc 20340
ctcgccgtcc gccgcccgga gcgcgtcgcc gccctcctcg ccgaggtcgt cgatctcctc 20400
gcccgcggcg ccctccagcc gctcccggtc gagatcttcc cgctctcccg cgccgccgac 20460
gccttccgca agatggccca ggcccagcac ctcggcaagc tcgtcctcgc cctcgaggac 20520
ccggacgtcc gcatccgcgt cccgggcgag tccggcgtcg ccatccgcgc cgacggcgcc 20580
tacctcgtca ccggcggcct cggcggcctc ggcctctcag tcgccggctg gctcgccgag 20640
cagggcgccg gccacctcgt cctcgtcggc cgctccggcg ccgtctccgc cgagcagcag 20700
accgccgtcg ccgccctcga ggcccacggc gcccgcgtca ccgtcgcccg cgccgacgtc 20760
gccgaccgcg cccagatgga gcgcatcctc cgcgaggtca ccgcctccgg catgcccctc 20820
cgcggcgtcg tccacgccgc cggcatcctc gacgacggac tcctcatgca gcagaccccg 20880
gcccgcttcc gcgccgtcat ggccccgaag gtccgcggcg ccctccacct ccacgccctc 20940
acccgcgaag ccccgctctc cttcttcgtc ctctacgcgt ccggcgccgg cctcctcggc 21000
tccccgggcc agggcaacta cgccgccgcc aacaccttcc tcgacgccct cgcccaccac 21060
cgccgcgccc agggcctccc ggccctctcc atcgactggg gcctcttcgc cgacgtcggc 21120
ctcgccgccg gccagcagaa ccgcggcgcc cgcctcgtca cccgcggcac ccgctccctc 21180
accccggacg agggcctctg ggccctcgag cgcctcctcg acggcgaccg cacccaggcc 21240
ggcgtcatgc cgttcgacgt ccgccaatgg gtcgagttct acccggccgc cgcctcctcc 21300
cgccgcctct cccgcctcat gaccgcgcgc cgcgtcgcct ccggccgcct cgccggcgac 21360
cgcgacttgc tcgagcgcct cgccaccgcc gaggccggcg cccgagccgg catgctccag 21420
gaggtcgtcc gcgcccaggt ctcccaggtc ctccgcctct ccgagggcaa gctcgacgtc 21480
gacgccccgc tcacctccct cggcatggac tccctcatgg gcctcgagct ccgcaaccgc 21540
atcgaggccg tcctcggcat caccatgccg gccaccctcc tctggaccta cccgaccgtc 21600
gccgccctct ccgcccacct cgcctcccac gtcgtctcca ccggcgacgg cgagtccgcc 21660
cgcccgccgg acaccggctc cgtcgccccg accacccacg aggtcgcctc cctcgacgag 21720
gacggcctct tcgccctcat cgacgagtcc ctcgcccgcg ccggcaagcg ctga 21774
<210> 5
<211> 11394
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon Optimized DNA of Sorangium cellulosum for Expression in
Streptomyces venezuelae
<400> 5
atgaccgacc gcgagggtca gctcctcgag cgtctccgcg aggtcaccct cgccctccgc 60
aagaccctca acgagcgcga caccctcgag ctcgagaaga ccgagccgat cgccatcgtg 120
ggcatcggtt gccgcttccc gggcggcgcc ggcaccccgg aggccttctg ggagctcctc 180
gacgacggcc gcgacgccat ccgcccgctc gaagagcgct gggccctcgt aggcgtcgac 240
ccgggcgacg acgtcccgcg ctgggccggc ctcctcaccg aggccatcga tggcttcgac 300
gccgccttct tcggcatcgc cccgcgcgag gcccgctccc tcgacccgca gcaccgcctc 360
ctcctcgagg tcgcctggga gggcttcgaa gacgccggca tcccgccgcg ctccctcgtc 420
ggctcccgca ccggcgtctt cgtcggcgtc tgcgccaccg agtacctcca cgccgccgtc 480
gcccaccagc cgcgcgagga acgcgacgcc tactccacca ccggcaacat gctttccatc 540
gccgccggac gcctctccta caccctcggc ctccagggcc cgtgccttac cgtcgatacc 600
gcctgctcct cctccctcgt cgccatccac ctcgcctgcc gttccctccg cgcccgcgaa 660
tccgacctcg ccctcgccgg cggcgtcaac atgctcctct ccccggacac catgcgcgcc 720
ctcgcccgca cccaggccct ctccccgaac ggccgctgcc agaccttcga cgcctccgcc 780
aacggcttcg tccgcggcga gggctgcggc ctcatcgtcc tcaagcgcct ctccgacgcc 840
cgccgcgacg gcgaccgcat ctgggccctc atccgcggct ccgccatcaa ccaggatggc 900
cgctccaccg gcctcaccgc accgaacgtc ctcgcccagg gcgccctcct ccgcgaggcc 960
ctccgcaacg ccggcgtcga ggccgaggcc atcggctaca tcgagacgca cggcgccgcg 1020
acctccctcg gcgacccgat cgagatcgag gccctccgcg ccgtcgtcgg cccggcccgc 1080
gccgacggcg cccgctgcgt cctcggcgct gtcaagacca acctcggcca tctcgagggc 1140
gccgccggcg tcgccggcct catcaaggcc accctctccc tccaccacga gcgtatcccg 1200
cgcaacctca acttccgcac cctcaacccg cgcatccgca tcgagggcac cgccctcgcc 1260
ctcgccaccg agccggtccc gtggccgcgc accggccgca cccgcttcgc cggcgtctcc 1320
tccttcggca tgtccggcac caacgcccac gtcgtcctcg aggaagcccc ggccgtcgaa 1380
ccggaggcgg ccgcaccgga gcgcgccgcc gagctcttcg tcctctccgc caagtccgcc 1440
gccgccctcg acgctcaggc cgcccgcctc cgcgaccacc tcgagaagca cgtcgagctc 1500
ggcctcggcg acgtcgcctt ctccctcgcc accacccgct ccgccatgga gcaccgcctc 1560
gccgtcgccg cctcctcccg cgaggccctc cgcggcgccc tctccgccgc cgcccagggc 1620
cacaccccgc cgggcgccgt ccgcggccgc gcctccggcg gctccgcccc gaaggtcgtc 1680
ttcgtcttcc cgggccaggg ctcccagtgg gtcggaatgg gccgcaagct catggccgag 1740
gaaccggtct tccgcgccgc cctcgaaggc tgcgaccgcg ccatcgaggc agaggccggt 1800
tggtccctcc tcggcgagct ctccgccgac gaggccgcct cccagctcgg ccgcatcgac 1860
gtcgtccagc cggtcctctt cgccatggag gtcgccctct ccgccctctg gcgctcctgg 1920
ggcgtcgagc cggaggccgt cgtcggccac tccatgggcg aggtagccgc cgcccacgtc 1980
gccggcgcgc tctccctcga ggacgccgtc gccatcatct gccgccgctc ccgcctcctc 2040
cgccgcatct ccggccaggg cgagatggcc ctcgtcgagc tctccctcga ggaggccgag 2100
gccgccctca gaggtcacga gggccgcctc tcggtcgccg tctccaactc cccgcgctcc 2160
actgtcctcg ccggcgagcc ggccgccctc tcagaggtcc tcgccgccct caccgccaag 2220
ggcgtcttct ggcgccaggt caaggtcgac gtcgcatccc actccccgca ggtcgacccg 2280
ctccgcgagg agctcatcgc cgccctcggc gccatccgcc cgcgcgccgc cgccgtcccg 2340
atgcgctcca ctgtcaccgg cggcgtcatc gccggcccgg agctcggcgc ctcctactgg 2400
gccgacaacc tccgccagcc ggtccgcttc gccgccgccg cccaggccct cctcgagggc 2460
ggcccggccc tcttcatcga aatgtccccg cacccgatcc tcgtcccgcc gctcgacgag 2520
attcagaccg ccgccgagca gggaggcgcc gcagtcggct ccctccgccg cggccaggac 2580
gaacgcgcca ccctcctcga ggccctcggc accctctggg cctccggcta cccggtctcc 2640
tgggcccgcc tcttcccggc cggcggtcgc cgcgtcccgc tcccgacgta cccgtggcag 2700
cacgagcgct gctggatcga ggtcgagccg gacgcccgcc gcctcgccgc cgccgacccg 2760
accaaggact ggttctaccg caccgactgg ccggaggtcc cgcgcgccgc ccctaagtcc 2820
gagaccgccc atggctcctg gctcctcctc gccgaccgcg gcggcgtcgg agaggccgtc 2880
gccgccgccc tctccacccg cggcctctcc tgcaccgtcc tccacgcctc cgctgacgcc 2940
tccaccgtcg ccgagcaggt ctccgaggcc gcctcccgcc gcaacgactg gcagggcgtc 3000
ctctacctct ggggcctcga cgccgtcgtc gacgccggcg cctccgccga cgaggtctcc 3060
gaggccaccc gccgcgccac cgccccggtc ctcggcctcg tacgcttcct ctccgccgcc 3120
ccgcacccgc cgcgcttctg ggtcgtcacc cgcggcgcct gcaccgtcgg cggcgagccg 3180
gaggcctccc tctgccaggc cgccctctgg ggcctcgccc gagtcgccgc tctcgagcac 3240
ccggccgcct ggggcggcct cgtcgacctc gaccctcaga agtccccgac cgagatcgaa 3300
ccgctcgtcg ccgagctcct cagccctgac gccgaggacc agctcgcctt ccgctccggc 3360
cgccgccacg ccgcccgcct cgtcgccgcc ccgccggagg gcgacgtcgc cccgatctcc 3420
ctctccgccg agggctccta cctcgtcacc ggcggcctcg gcggcctcgg cctcctcgtc 3480
gcccgctggc tcgtcgagcg cggcgcccgc cacctcgtcc tcacctcccg ccacggactc 3540
ccggagcgcc aggcctccgg cggcgagcag ccgccggagg cccgcgcccg catcgccgcc 3600
gtcgagggcc tcgaggccca gggcgcccgc gtcaccgtcg ccgccgtcga cgtcgcggag 3660
gccgatccga tgaccgccct cctcgccgcc atcgagccgc cgctccgagg cgtcgtccac 3720
gccgccggcg tcttcccggt ccgccacctc gccgagaccg acgaggccct cctcgaatct 3780
gtcctccgac cgaaggtcgc cggcagttgg ctcctccacc gtctcctccg cgaccgaccg 3840
ctcgacctct tcgtcctctt ctcctccggc gccgccgtct ggggcggcaa gggccagggc 3900
gcctacgccg ccgccaacgc cttcctcgac ggcctcgccc accaccgccg cgcccactcg 3960
ctcccggccc tctccctcgc ctggggcctc tgggccgagg gcggcatggt cgacgccaag 4020
gcccacgccc gactctccga catcggcgtc ctcccgatgg ccaccggccc ggccctctcc 4080
gccctcgagc gcctcgtcaa cacctccgcc gtccagcgct ccgtcacccg catggactgg 4140
gcccgcttcg ccccggtcta cgccgcccgc ggccgccgca acctcctctc cgccctcgtc 4200
gctgaggacg agcgcgccgc ctccccgccg gtcccgaccg ccaaccgcat ctggcgcggc 4260
ctcagcgtcg ccgagtcccg ctccgccttg tacgagctcg tccgcggcgt cgcccgcgtc 4320
ctcggcttct ccgacccggg cgcactcgac gtcggccgag gcttcgccga gcagggcctc 4380
gactccctca tggccctcga gatccgcaac cgcctccagc gcgagctcgg cgagcgcctc 4440
tccgccaccc tcgccttcga ccacccgacc gtcgagcgcc tcgtcgccca cctgctcacc 4500
gacgtcttga agctcgagga ccgctccgac acccgccaca tccgctccgt cgccgccgac 4560
gacgacatcg ccatcgtcgg cgccgcatgc cgcttcccgg gcggagacga aggcctcgag 4620
acctactggc gccacctcgc cgagggcatg gtcgtctcca ccgaggtccc ggccgaccgc 4680
tggcgcgccg ccgactggta cgacccggac ccggaggtcc cgggccgcac ctacgtcgcc 4740
aagggcgcct tcctccgcga cgtccgctcc ctcgacgccg ccttcttcgc catctccccg 4800
cgcgaggcca tgtccctcga cccgcagcag cgcctcctcc tcgaagtctc ctgggaggcc 4860
atcgagcgcg ccggccagga cccgatggcc cttcgcgagt ccgccaccgg cgtcttcgtc 4920
ggcatgatcg gctccgagca cgccgaacgc gtccagggcc tcgacgacga cgccgccctc 4980
ctctacggca ccaccggcaa cctcctctca gtcgccgccg gccgcctctc cttcttcctc 5040
ggcctccacg gcccgaccat gaccgtcgat accgcctgtt cctcctccct cgtcgccctc 5100
catctcgcct gtcagtccct ccgcctcgga gagtgcgacc aggccctcgc cggcggctcc 5160
tccgtcctcc tctccccgcg ctccttcgtc gccgcatccc gcatgcgcct cctctccccg 5220
gacggccgct gcaagacctt ctccgccgcc gccgacggat tcgcccgcgc cgagggctgc 5280
gccgtcgtcg tcctcaagcg tctccgcgac gcccagcgcg accgcgaccc gatcctcgcc 5340
gtcgtccgct ccaccgccat caaccacgac ggcccgtcct ccggcctcac cgtcccgtcc 5400
ggcccggccc agcaggccct cctccgccag gccctcgccc aggccggcgt cgccccggcc 5460
gaggtcgact tcgtcgagtg ccacggcacc ggcaccgccc tcggcgaccc gatcgaggtc 5520
caggccctcg gcgccgtcta cggccgcggc cgcccggccg agcgcccgct ctggctcggt 5580
gctgtaaagg ccaacctcgg ccacctcgag gccgccgccg gcctcgccgg cgtcctcaag 5640
gtcctcctcg ccctcgagca cgagcagatc ccggctcaac cggagctcga cgagctcaac 5700
ccgcacatcc cgtgggccga gctcccggtc gccgtcgtcc gccgcgccgt gccgtggccg 5760
cgcggcgccc gcccgcgccg cgccggcgtc tccgccttcg gcctcagtgg caccaacgcc 5820
cacgtcgtcc tcgaggaggc cccggccgtc gagccggtcg ccgccgctcc ggagcgcgcc 5880
gccgagctct tcgtcctctc cgccaagtcc gccgccgccc tcgacgccca ggccgcccgc 5940
ctccgcgacc acctcgagaa gcacgtcgag ctcggcctcg gcgacgtcgc cttctccctc 6000
gccaccaccc gctccgccat ggagcaccga ctcgccgtcg ccgcctcctc ccgcgaggcc 6060
ttgcgcggcg ccctctccgc cgccgcccag ggccacaccc cgccgggcgc cgtccgcggc 6120
cgcgcctccg gcggctccgc cccgaaggtc gtcttcgtct tcccgggcca gggctcccag 6180
tgggtcggca tgggccgcaa gctcatggcc gaggagccgg tcttccgcgc cgccctcgag 6240
ggctgcgacc gcgccatcga ggccgaagcg ggctggtccc tcctcggcga gctctccgcc 6300
gacgaggccg cctcccagct cggacgcatc gacgtcgtcc agccggtcct cttcgccatg 6360
gaagtcgccc tctccgccct ctggcgctcc tggggcgtcg aaccagaggc cgtcgtcggc 6420
cactccatgg gcgaggtcgc cgccgcccac gtcgccggcg ccctctccct cgaggacgcc 6480
gtcgccatca tctgccgccg ctcccgcctc ctccgccgca tctccggaca gggagagatg 6540
gccctcgtcg agctctccct cgaggaggcc gaggccgctc tccgcggcca cgagggccgc 6600
ctctccgtcg ccgtctccaa ctccccgcgc tccaccgtcc tcgccggcga gccggccgcc 6660
ctctccgagg tcctcgccgc cctcaccgcc aagggcgtct tctggcgcca ggtcaaggtc 6720
gacgtcgcct cccactcccc gcaggtcgac ccgctccgcg aggagctcat cgccgccctt 6780
ggcgccatcc gcccgcgcgc cgccgccgtc ccgatgcgct ccaccgtcac cggcggcgtc 6840
atcgctggcc cggagctcgg cgcctcctac tgggccgaca acctccgcca gccggtccgc 6900
ttcgccgccg ccgcccaggc cctcctcgag ggcggcccgg ccctcttcat cgagatgtcc 6960
ccgcacccga tcctcgtccc gccgctcgac gagatccaga cggccgccga gcagggcgga 7020
gccgccgtcg gctccctccg gcgcggccag gacgaacgcg ccaccctcct cgaagccctc 7080
ggcaccctgt gggcctccgg ctacccggtc tcctgggccc gcctcttccc ggccggcggc 7140
cgccgcgtcc cgctccccac ctacccgtgg cagcacgagc gctactggat cgaggactcc 7200
gtccacggct ctaagccgtc cctccgcctc cgccagctcc gcaacggcgc caccgaccac 7260
ccgctcctcg gcgccccgct cctcgtctcc gcccgcccgg gcgcccacct ctgggaacag 7320
gccctcagcg acgagcgtct ctcctacctc tccgagcacc gcgtccacgg cgaggccgtc 7380
ctcccgtccg ccgcctacgt cgagatggcc ctcgccgccg gcgtcgacct ctacggcacc 7440
gccaccctcg tgctcgagca gctcgccctc gagcgcgcct tggccgtccc gtccgagggc 7500
ggtcgcatcg tccaggtcgc cctctccgag gagggcccgg gccgcgcctc cttccaggtc 7560
tcctcccgcg aagaggcagg ccgctcctgg gttcgccacg ccaccggcca cgtctgctcc 7620
ggccagtcct ccgccgtcgg cgccctcaag gaggccccgt gggagatcca gcgccgctgc 7680
ccgtccgtcc tctcctccga ggccctctac ccgctcctca acgagcacgc cctcgactac 7740
ggcccgtgct tccagggcgt cgaacaggtc tggctcggca ccggcgaggt cctcggccgc 7800
gtccggctcc caggcgacat ggcctcctcc tccggcgcgt accgcatcca cccggccctc 7860
ctcgacgcct gcttccaggt cctcaccgcc ctcctcacca cccccgaatc catcgagatc 7920
cgccgccgcc tcaccgacct ccacgagccg gacctcccgc gctcccgcgc cccggtcaac 7980
caggccgtct ccgacacctg gctctgggac gccgccctgg acggcggccg ccgccaatcc 8040
gcctccgtcc cggtcgacct cgtcctcggc tccttccacg ccaagtggga ggttatggag 8100
cgcctcgccc aggcctacat catcggcacc ctccgcatct ggaacgtctt ctgcgccgcc 8160
ggcgagcgcc acaccatcga cgagctcctc gtccggctcc agatctccgt cgtctaccgc 8220
aaggtcatca agcgctggat ggagcacctc gtcgccattg gcatcctcgt cggcgacggc 8280
gagcacttcg tctcctccca gccgctcccg gagccggacc tcgccgccgt cctcgaggag 8340
gccggccgcg tcttcgccga cctcccggtc ctcttcgagt ggtgcaagtt cgccggcgag 8400
cgcctcgccg acgtcctcac cggcaagacc ctcgccctcg agatcctctt cccgggcggc 8460
tccttcgata tggccgagcg catctaccgc gattccccga tcgcccgcta ctccaacggc 8520
atcgtacgcg gcgtcgtcga gtccgcagcc cgcgtcgtcg ccccgagcgg catgttctcc 8580
atcctcgaga tcggcgccgg caccggcgcc accaccgccg ccgtcctccc ggtcctcctc 8640
ccggaccgca ccgagtacca cttcaccgac gtctccccgc tcttcctcgc ccgcgcagag 8700
cagcgcttcc gcgactaccc gttcctcaaa tacggcatcc tcgacgtcga ccaggaaccg 8760
gccggacagg gctacgcaca ccagcgcttc gacgtcatcg tagccgccaa cgtcatccac 8820
gccacccgcg acatccgcgc caccgccaag cgcctgctct ccctcctcgc cccgggcggc 8880
ctcctcgtcc tcgtcgaggg caccggccac ccgatctggt tcgacatcac caccggcctc 8940
atcgagggct ggcagaagta cgaggacgac cttcgcatcg accacccgct cctcccggcc 9000
cgcacctggt gcgacgtcct ccgccgcgtc ggcttcgccg acgccgtctc cctcccgggc 9060
gacggctccc cggccggcat cctcggccag cacgtcatcc tctcccgcgc cccgggcatc 9120
gccggcgccg cctgcgactc ctccggcgag tccgccaccg agagcccggc cgcccgcgcc 9180
gtccgacagg agtgggccga cggctccgcc gacgtcgtgc accgcatggc cctcgagcgc 9240
atgtacttcc atcgccgtcc gggccgccag gtctgggtcc acggccgcct ccgcaccggt 9300
ggcggcgcct tcaccaaggc cctcgccggc gacctcctcc tcttcgagga caccggacag 9360
gtcgtcgccg aggtccaggg cctccgcctc ccgcagctcg aggcctccgc cttcgccccg 9420
cgcgacccgc gcgaggagtg gctctacgca ctcgagtggc agcgcaagga cccgatcccg 9480
gaggccccgg ccgccgcctc gtcctcctcc gccggcgcct ggctcgtcct catggaccag 9540
ggcggcaccg gcgccgccct cgtatccctc ctcgagggcc gcggcgaggc ctgcgtccgc 9600
gtcatcgccg gcaccgccta cgcctgcctc gccccgggcc tctaccaggt cgacccggcc 9660
cagccggacg gcttccacac cctcctcaga gacgccttcg gcgaagaccg catctgccgc 9720
gccgtcgtcc acatgtggtc cctcgacgcc accgccgccg gcgagcgcgc caccgccgag 9780
tccctccagg ccgaccagct cctcggctcc ctctccgccc tctccctcgt ccaggccctc 9840
gtccgccgcc gctggcgcaa catgccgcgc ctctggctcc tcacccgcgc cgtccacgcc 9900
gtcggcgccg aagacgccgc cgcctccgtc gcccaggccc cggtctgggg cctcggccgc 9960
accctcgccc tcgagcaccc ggagctccgc tgcacactcg tcgacgtcaa cccggccccg 10020
tccccggagg acgccgccgc cctcgccgtc gagctcggcg cctccgaccg cgaagatcag 10080
gtcgccctcc gctccgacgg ccgctacgtc gcccgcctcg tccgctcctc cttctccggc 10140
aagccggcta cagactgcgg catccgcgcc gacggctcct acgtcatcac cgacggcatg 10200
ggccgtgtcg gcctctccgt cgcccagtgg atggtcatgc agggcgcccg ccacgtcgtc 10260
ctcgtcgacc gcggcggcgc ctccgaggcc tcccgcgacg ccctccgcag tatggccgag 10320
gccggagccg aagtccagat agtcgaagcc gacgtcgccc gccgcgacga cgtggcccgc 10380
ctcctctcca agatcgaacc gtccatgccg ccgctccgcg gcatcgtcta cgtcgacggc 10440
accttccagg gcgactcctc catgctcgag ctcgacgccc gccgcttcaa ggagtggatg 10500
tatccgaagg tcctcggcgc ctggaacctc cacgccctca cccgcgaccg ttccctcgac 10560
ttcttcgtcc tctactcctc cggcacctcc ctcctcggcc tcccgggcca gggctcccgc 10620
gccgccggcg acgctttcct cgacgccatc gcccaccacc gctgcaaggt cggcctcacc 10680
gccatgtcca tcaactgggg cctcctctcc gaggcctcct ccccggccac cccgaacgac 10740
ggcggcgccc gcctcgagta ccgcggcatg gagggcctca ccctcgagca gggcgccgcc 10800
gccctcggac gcctcctcgc ccgcccgcgc gcacaggtcg gcgtcatgcg cctcaatttg 10860
cgtcagtggc tcgagttcta cccgaacgct gcccgcctcg ccctctgggc cgagctcctc 10920
aaggaacgcg accgcgccga ccgcggcgcc tccaacgcct ccaacctccg cgaggccctc 10980
cagtccgccc gcccggagga ccgccaactc atcctcgaga agcacctctc cgagctcctc 11040
ggccgcggcc tccgcctccc gccggagcgc atcgagcgtc acgtcccgtt ctccaacctc 11100
ggcatggact ccctcatcgg cctcgagctc cgcaaccgca tcgaggccgc tctcggcatc 11160
accgtcccgg ccaccctcct ttggacctac cctaacgtcg ccgccctctc cggctccctc 11220
ctcgacatcc tcttcccgaa cgccggcgcc acccacgccc cggccaccga gcgcgagaag 11280
tccttcgaaa acgacgccgc cgacctcgaa gccctccgcg gcatgaccga cgagcagaag 11340
gacgccctcc tcgccgagaa gctcgcccag ctcgcccaga tcgtcgggga gtga 11394
<210> 6
<211> 7320
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon Optimized DNA of Sorangium cellulosum for Expression in
Streptomyces venezuelae
<400> 6
atggccacca ccaacgccgg caagctcgag cacgccctcc tcctcatgga caagctcgcc 60
aagaagaacg cgtccctcga gcaggaaagg accgagccga tcgcaatcgt cggcatcggc 120
tgccgcttcc cgggaggcgc cgacaccccg gaggccttct gggagctcct cgactccggc 180
cgcgacgccg tccagccgct cgaccgccgc tgggccctcg tcggcgtcca cccgtccgag 240
gaggtaccgc gctgggccgg cctcctcacc gaggccgtgg acggattcga cgccgccttc 300
ttcggcacct ccccgcgcga ggcccgctcc ctcgacccgc agcagcgcct cctcctcgag 360
gtcacctggg agggcctcga ggacgccggc atcgccccgc agagtctcga cggatcccgc 420
accggcgtct tcctcggcgc ctgctcctcc gactactccc acaccgtcgc ccagcagcgc 480
cgcgaggagc aggacgccta cgacatcacc ggcaacaccc tctccgtcgc cgccggccgt 540
ctctcctaca ccctcggtct ccagggcccg tgcctcaccg tcgacaccgc ctgctcctcc 600
tccctcgtcg ccatccacct cgcctgccgg tccctccgcg cccgcgagtc cgacctcgcc 660
ctcgcgggag gcgtcaacat gctcctctcc tccaagacca tgatcatgct cggcaggatc 720
caggccctct ccccggacgg ccactgccga accttcgacg cctccgccaa cggcttcgtc 780
cgcggcgagg gctgcggcat ggtcgtcctg aagcgcctct ccgacgccca gcgccacggc 840
gaccgcatct gggccctcat ccgcggctcc gccatgaacc aggacggccg ctccaccggc 900
ctcatggccc cgaacgtcct cgcccaggag gccctcctcc gcgaggccct ccagtccgcc 960
cgcgtcgacg ccggcgccat cggctacgtc gagacccacg gcactggcac ttcgctcggc 1020
gacccgatcg aggtcgaggc cctccgcgcc gtcctcggcc cggcccgcgc cgatggctcc 1080
cgctgcgtcc tcggcgccgt gaagaccaac ctcggccacc tcgagggcgc cgccggcgtc 1140
gcgggcctca tcaaggccgc cctcgccctc caccacgaac tcatcccgcg caacctccac 1200
ttccacaccc tcaacccgcg catccgcatc gagggcaccg ccctcgccct cgccaccgag 1260
ccggtcccgt ggccgcgcgc cggccgcccg cgcttcgccg gcgtctccgc attcggcctc 1320
tccggcacca acgtccacgt cgtcctcgag gaggccccgg ccaccgtcct cgccccggcc 1380
accccgggcc gctccgccga gctcctcgtc ctctccgcca agtccgccgc cgccctcgac 1440
gcccaggccg cacgcctctc cgcacacatc gccgcctacc cggagcaggg cctcggcgac 1500
gtcgccttct ccttggtctc cacccgctcc ccgatggaac atcgcctcgc cgtcgccgcc 1560
accagccgcg aggccctccg ctccgccctc gaggtcgcgg cccagggcca gaccccggcc 1620
ggtgccgccc gcggccgcgc cgcctcctcc ccgggcaagc tcgccttcct cttcgccgga 1680
cagggggccc aagtcccggg catgggccgc ggcctctggg aggcctggcc ggccttccgc 1740
gaaaccttcg accgctgcgt caccctcttc gaccgcgagc tccaccagcc gctctgcgag 1800
gtcatgtggg ccgaaccggg ctcctcccgc tcctccctcc tcgaccagac cgccttcacc 1860
cagccggccc tcttcgccct cgagtacgcc ctcgccgccc tcttccgctc ctggggcgtc 1920
gagccggagc tcgtcgccgg ccactccctt ggagaactcg tcgccgcctg cgtcgccggc 1980
gtcttctccc tcgaggatgc cgtccgcctc gtcgtcgccc gcggccgcct catgcaggcc 2040
ctcccggccg gcggcgccat ggtctccata gcggcgccgg aagctgacgt agccgcggcc 2100
gtcgccccgc acgccgcctt ggtctccatc gccgccgtca acggcccgga gcaggtcgtc 2160
atcgccggcg ccgagaagtt cgtccagcag atcgccgccg ccttcgccgc ccgcggcgcc 2220
cgcaccaagc cgctccacgt gtcccacgcc ttccactccc cgctcatgga cccgatgctc 2280
gaggccttca gacgcgtcac cgaatccgta acctaccgcc gaccgtccat cgcgctcgtc 2340
tccaacctct ccggcaagcc gtgcaccgat gaggtctccg cccccggcta ctgggtccgc 2400
cacgcccgcg aggccgtccg cttcgccgac ggcgtcaagg ccctccacgc cgccggcgcc 2460
ggcctcttcg tcgaggtcgg cccgaagccg accctcctcg gcctcgtccc ggcctgcctc 2520
ccggacgccc gcccggtcct cctcccggcc tcccgcgccg gccgcgacga ggccgcctcc 2580
gccctcgaag ccctcggcgg attctgggtc gtcggcggct cggtcacctg gagcggagtc 2640
ttcccctccg gcggccgccg cgtcccgctc ccgacctacc cgtggcaacg cgagcgctac 2700
tggatcgagg ccccggtcga ccgcgaggcc gacggcaccg gccgcgcccg cgccggcggc 2760
cacccgctcc tcggcgaggt cttctccgtc tccacccacg ccggcctccg cctctgggag 2820
acgaccctcg accgcaagcg cctcccgtgg ctcggcgagc accgcgccca gggtgaggtt 2880
gtcttcccgg gcgccggcta cctcgagatg gccctcagct ccggcgccga gatcctcggc 2940
gacggcccga tccaggtcac cgacgtcgtc ctcatcgaga ccctcacctt cgccggcgac 3000
acagccgtcc cggtccaggt cgtcaccacc gaggagcgcc cgggccgact ccgcttccag 3060
gtcgcctccc gcgagccggg cgagcgccgc gccccgttcc gcatccacgc ccgcggcgtc 3120
ctccgccgca tcggccgcgt tgagaccccg gcccgctcca acctcgccgc cctccgcgcc 3180
cgcctccacg ccgccgtccc ggccgccgcc atctacggcg ccctcgccga gatgggcctc 3240
cagtacggcc cggcccttcg cggcctcgcc gagctctggc gcggcgaggg cgaggccctc 3300
ggccgcgtcc gtctcccgga ggcagccggc tccgccaccg cctaccagct ccacccggtc 3360
ctcctcgacg cctgcgtcca gatgatcgtc ggcgccttcg ccgaccgcga cgaggccacc 3420
ccttgggccc cggtggaggt cggctccgtc cgcctcttcc agcgcagccc gggcgagctc 3480
tggtgccacg cccgcgtcgt ctccgacggc cagcaggcct cctccaggtg gtccgccgac 3540
ttcgagctca tggacggaac cggcgccgtc gtcgccgaga tctcccgcct cgtcgtcgag 3600
cgcctcgcct caggagtccg ccgccgcgac gccgacgact ggttcctcga actcgactgg 3660
gagccggccg ccctcggcgg cccgaagatc accgccggtc gctggctcct cctcggcgag 3720
ggcggcggcc tcgggcgctc cctctgctcc gccctcaagg ccgccggcca tgtcgtcgtc 3780
cacgccgccg gcgacgacac ctccaccgcc ggcatgcgcg ccctcctcgc caacgccttc 3840
gacggacagg ccccgaccgc agtcgtccac ctctcctccc tcgacggcgg cggacagctc 3900
ggcccgggcc tcggcgccca gggcgccctc gacgccccga ggtccccgga cgtcgacgcc 3960
gacgctctcg agtccgccct catgaggggc tgcgactccg tcctctctct cgtccaggcg 4020
ctcgtcggca tggacctccg caacgccccg cgcctctggc tcctcacccg cggcgcccag 4080
gccgccgccg ccggcgacgt ctccgtcgtc caggccccgc tcctcggcct cggccgcacg 4140
atcgccctcg agcacgccga actcaggtgt atctccgtcg acctcgaccc ggccgagccg 4200
gagggcgaag ccgacgcgct cctcgccgag ctcctcgccg acgacgctga agaggaggtc 4260
gccctccgcg gcggcgaccg cctcgtcgcc cgcctcgtcc accgcctccc ggacgcccag 4320
cgccgcgaga aggtcgagcc ggccggcgac cgcccgttcc gcctcgagat cgacgagccg 4380
ggcgccctcg accagctcgt cctccgcgcc acgggccgcc gagccccggg cccgggcgag 4440
gtcgagatct ccgtcgaggc cgccggcctc gactccatcg acatccagct cgccctcggc 4500
gtcgccccga acgacctccc gggcgaggag atcgagccgc tcgtcttggg ctccgagtgc 4560
gccggccgca tcgtcgccgt cggcgagggc gtcaacggcc tcgtcgtcgg ccagcctgtc 4620
atcgccctcg ccgccggcgt cttcgctacc cacgtcacca cctccgccac cctcgtcctc 4680
ccgcgcccgc tcggcctctc cgccacggag gccgccgcca tgccgctcgc ctacctcacc 4740
gcctggtacg ccctcgacaa ggtcgcccac ctccaggccg gcgagcgcgt cctcatccac 4800
gctgaggccg gcggcgtcgg cctctgcgcc gtccgctggg cccagcgcgt cggcgccgag 4860
gtctacgcca ccgccgacac ccccgaaaac cgcgcctacc tcgagtccct cggcgtccgc 4920
tacgtctccg actcccgctc cgggcgcttc gtcaccgacg tccacgcctg gaccgacggc 4980
gagggcgtcg acgtcgtcct cgactccctc tccggtgagc gcatcgacaa gtccctcatg 5040
gtcctccgcg cctgcggccg cctcgtcaag ctcggccgcc gcgacgactg cgccgacacc 5100
cagccgggac tcccgccgct cctccgcaac ttctccttct cccaggtcga cctccgcggc 5160
atgatgctcg accagccggc ccgcatccgc gccctcctcg acgagctctt cggcctcgtc 5220
gccgccggcg ccatctcccc gctcggctcc ggcctccgcg tcgggggctc cctcaccccg 5280
ccgccggtcg agaccttccc gatttcccgc gccgcagagg ccttccgccg catggcccag 5340
ggccagcacc tcggcaagct cgtcctcacc ctcgacgacc cggaggtccg catccgcgcc 5400
ccggccgagt cctcggtcgc cgtccgcgcc gacggcacgt acctcgtcac cggcgggctc 5460
ggcggcctcg gcctccgggt cgccggctgg ctcgccgagc gcggcgccgg ccagctcgtc 5520
ctcgtgggcc gctccggcgc cgcctccgcc gagcagcgcg ccgccgtcgc cgccctcgag 5580
gcccacggcg cccgcgtcac cgtcgccaag gccgacgtcg ccgaccgctc ccagatcgag 5640
cgcgtcctcc gcgaggtcac cgcctccggc atgccgctcc gcggcgtcgt ccacgccgcc 5700
ggcctcgtcg acgacggcct cctcatgcag cagaccccgg cccgcttccg caccgtaatg 5760
ggcccgaagg tccagggcgc cctccacctc cacaccctca cccgcgaggc cccgctctcc 5820
ttcttcgtcc tctacgcctc cgccgctggc cttttcggtt ccccgggcca gggaaactac 5880
gccgccgcca acgccttcct cgacgccctc agtcaccacc gccgcgccca gggcctcccg 5940
gccctctcca tcgactgggg catgttcacg gaggtcggca tggccgtcgc ccaggaaaac 6000
cgcggtgccc gccagatctc ccgcggcatg cgcggcatca cgccggatga aggcctctcc 6060
gccctcgccc gcctcctcga gggcgaccgc gtccagaccg gcgtaatccc gatcaccccg 6120
cgccagtggg tcgagttcta cccggccacc gccgccagcc gccgcctctc ccgcctcgtc 6180
acgacgcagc gcgccgtcgc cgaccggacc gccggcgacc gcgacctcct cgagcagctc 6240
gcttccgccg agccgtccgc ccgcgccggc ctcctccagg acgtcgtccg cgtccaggtc 6300
tcccacgtcc tccgcctccc ggaggacaag atcgaagtcg acgccccgct ctcctccatg 6360
ggcatggact cccttatgtc cctcgagctc cgcaaccgca tcgaggccgc cctcggcgtc 6420
gccgcaccgg cagccctcgg ctggacctac ccgaccgtcg ccgccatcac ccgctggctc 6480
ctcgacgacg ccctcgtcgt ccgtctcggc ggcggctccg acaccgacga gtccaccgcc 6540
tccgccggct ccttcgtcca cgtcctccgc ttccgtcccg tcgtcaagcc gcgcgcccgg 6600
ctcttctgct tccatggctc cggcggctcc ccggagggct tccgctcctg gtccgagaag 6660
tccgagtggt ccgacctcga gatcgtcgcc atgtggcacg accgctccct cgcctccgag 6720
gacgccccgg gcaagaagta cgtccaggaa gccgcctccc tcatccagca ctacgccgac 6780
gccccgttcg ccctcgtcgg cttctccctc ggcgtccgct tcgtcatggg caccgccgtc 6840
gagctcgcct cccgcagcgg cgccccggcc ccgctcgccg tcttcaccct cggcggttcg 6900
ctcatctcct cctccgagat caccccggag atggaaaccg atatcatcgc caagctcttc 6960
ttccgcaacg ccgccggttt cgtccgatcc acccagcagg tccaggccga cgcccgcgcc 7020
gacaaggtca tcaccgacac catggtcgcc ccggccccgg gcgactccaa ggaaccgccg 7080
gtcaagatcg ccgtcccaat cgtcgccatc gccggctccg acgacgtcat cgtcccgccg 7140
tccgacgtcc aggacctcca gtcccgcacc accgagcgct tctacatgca cctcctcccg 7200
ggcgaccacg agttcctcgt cgaccgtggc cgcgagatca tgcacatcgt cgactcccac 7260
ctcaacccgc tcctcgccgc ccgcaccacc tcctccggcc ccgctttcga ggccaagtga 7320
7320
<210> 7
<211> 1260
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon Optimized DNA of Sorangium cellulosum for Expression in
Streptomyces venezuelae
<400> 7
atgacccagg agcaggcgaa ccagtccgag acgaagccgg ccttcgactt caagcccttc 60
gccccggggt acgccgagga ccccttcccc gccatcgagc ggctccgcga ggccaccccg 120
atcttctact gggacgaggg ccggagctgg gtgctcaccc gctaccacga cgtctccgcc 180
gtgttcaggg acgagcgctt cgccgtctcc cgggaggagt gggaatcctc ggccgagtac 240
agctccgcca tcccggagct ctccgacatg aagaagtacg ggctcttcgg cctgcccccc 300
gaggaccacg cccgcgtccg caagctcgtg aacccgtcct tcacctcgcg ggccatcgac 360
ctcctccgcg cggaaatcca gcgcaccgtc gaccagctcc tcgacgcccg gtccggccag 420
gaggagttcg acgtcgtccg cgactacgcg gaaggcatcc cgatgcgggc gatctccgcg 480
ctcctcaagg tcccggccga gtgcgacgag aagttccgcc gcttcggctc cgccacggcc 540
cgcgcactcg gcgtcggcct cgtcccgcag gtcgacgagg agaccaagac cctcgtcgcc 600
tcggtcaccg agggcctcgc cctcctgcac gacgtcctgg acgaacgccg ccgcaacccg 660
ctggagaacg acgtcctcac gatgctcctc caggccgagg cggacggctc gcgcctctcc 720
accaaggagc tggtcgctct cgtcggcgcc atcatcgccg ccggcaccga caccaccatc 780
tacctcatcg ccttcgccgt cctcaacctc ctccgctcgc ccgaggccct cgagctcgtc 840
aaggcggagc ccggcctcat gcggaacgcc ctcgacgagg tgctccgctt cgacaacatc 900
ctccgcatcg gcacggtgcg gttcgcccgc caggatctgg agtactgcgg cgcgtcgatc 960
aagaagggcg agatggtctt cctcctcatc ccgagcgccc tccgcgacgg aaccgtcttc 1020
tcccgcccgg acgtcttcga cgtgcgtcga gacacggggg cgtccctcgc gtacggccgg 1080
ggcccgcacg tctgcccggg cgtctccctc gcccgcctcg aggccgagat cgccgtcggc 1140
accatcttcc gccgcttccc ggagatgaag ctgaaggaaa cgccggtgtt cgggtaccac 1200
cccgccttcc ggaacatcga gtccctgaac gtcatcctga agccgtccaa ggcgggctga 1260
1260
<210> 8
<211> 555
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon Optimized DNA of Sorangium cellulosum for Expression in
Streptomyces venezuelae
<400> 8
atgacgtccg aggaggtccc cggcgccgcc ctgggcgccc agtcgtccct cgtccgggcc 60
cagcacgccg cgcgccacgt ccgcccgtgc acccgcgcgg aggagccgcc cgcgctcatg 120
cacggactca ccgagcgcca ggtcctcctc tcgctcgtgg ccctggccct cgtgctgctc 180
accgcccgtg cgttcggcga actcgcccgg cgcctccgcc agcccgaggt cctcggcgag 240
ctcttcggcg gcgtcgtcct gggtcccagc gtggtcgggg cgctcgcgcc gggcttccac 300
cgggtcctct tccaggaccc cgcggtcggc gtcgtcctct ccggcatctc ctggatcggg 360
gccctcgtgc tgctcctcat ggcgggcatc gaggtggacg tctccatcct ccgcaaggag 420
gcccggccgg gcgccctctc ggccctcggc gccatcgccc cgccgctccg caccccgggc 480
cccctcgtcc agcgcatgca gggggccttc acgtgggacc tggacgtcag cccgcgccgc 540
agcgcgcagg cctga 555
<210> 9
<211> 2142
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon Optimized DNA of Sorangium cellulosum for Expression in
Streptomyces venezuelae
<400> 9
atgcacgggc tgacggagcg ccaggtcctc ctctcgctcg tcacgctcgc cctcatcctc 60
gtcaccgccc gcgcgtccgg cgagctcgcc cgccgcctcc gccagccgga agtcctcggc 120
gagctcttcg gcggcgtcgt cctcggcccg agcgtcgtcg gagccctcgc cccgggcttc 180
caccgcgccc tcttccagga acccgctgtc ggcgtcgtcc tctccggcat ctcctggatc 240
ggcgccctcc tcctcctcct catggccggc atcgaggtcg acgtcggcat cctccgcaag 300
gaggcgcgcc cgggcgccct ctccgccctc ggcgccatcg cccccccgct cgccgcgggc 360
gcagcgttct cggccctcgt cctcgaccgc cccctcccgt ccggcctctt cctcgggatc 420
gtactctccg tcaccgccgt ctccgtcatc gccaaggtcc tcatcgagcg cgagtccatg 480
cgccgctcct acgcccaggt gaccctcgcc gcgggcgtcg tctccgaggt cgccgcctgg 540
gtcctcgtcg ccatgacctc cagctcctac ggggcctccc cggccctcgc cgtcgcccgc 600
tccgccctcc tcgcctccgg cttcctcctc ttcatggtcc tcgtcggtcg ccgcctcacg 660
cacctggcca tgcgctgggt cgccgacgcc acccgcgtct ccaagggcca ggtctccctc 720
gtcctcgtcc tcacgttcct cgccgccgcc ctcacccagc gcctcggtct ccacccgctg 780
ctcggggcct tcgccctcgg ggtcctcctc aactccgcac cgcgcaccaa ccgcccgctc 840
ctcgacggcg tccagaccct cgtggccggt ctcttcgccc ccgtcttctt cgtgctcgcc 900
ggaatgaggg tcgacgtcag ccagctccgc acgccggccg cctggggcac cgtcgccctc 960
ctcctcgcca ccgccaccgc cgccaaggtc gtcccggccg ccctcggcgc ccgtctcggc 1020
ggcctccgcg gctcggaggc cgccctcgtg gccgtcggtc tcaacatgaa gggcggcacc 1080
gacctcatcg tcgcgatcgt cggagtcgag ctcggcctcc tctccaacga ggcctacacc 1140
atgtacgccg tcgtcgccct cgtcaccgtc accgcctccc ccgcccttct catctggctc 1200
gagaagcgcg ccccgcccac ccaggaagag tccgcccgcc tcgagcgcga ggaggccgcc 1260
cggcgcgctt acatcccggg cgtcgagcgc atcctcgtcc ccatcgtcgc ccacgccctc 1320
ccggggttcg ccacggacat cgtcgagtcc atcgtcgcct ccaagcggaa gctcggggag 1380
accgtcgaca tcaccgagct ctccgtcgag cagcaggccc cgggcccgtc ccgcgccgcc 1440
ggcgaggcct cccgcggcct cgccaggctc ggcgcccggc tccgcgtcgg catctggcgc 1500
cagcgccgcg agctccgtgg ctccatccag gccatcctcc gtgcgtcccg cgaccacgac 1560
ctcctcgtca tcggcgcccg ctccccggcc cgcgcccgtg gcatgtcctt cggccgcctg 1620
caggacgcca tcgtccagcg cgccgaaagc aacgtcctcg tcgtcgtcgg cgacccgccg 1680
gccgccgagc gcgcgtccgc ccgccgcatc ctcgtcccga tcatcggcct cgagtacagc 1740
ttcgccgccg ccgacctcgc cgcccacgtc gccctcgcct gggacgcgga gctcgtcctc 1800
ctctcctccg cccagacgga cccgggcgcc gtcgtctggc gcgaccggga gccgtcgcgc 1860
gtccgcgccg tggcgcgttc cgtcgtcgac gaggccgtct tccgcggtcg ccgcctcggc 1920
gtccgcgtct ccagccgagt ccacgtcggc gcccacccgt ccgacgagat cacccgcgag 1980
ctcgcccgcg cgccctacga cttgctcgtc ctcggctgct acgaccacgg ccccctcggc 2040
cgcctctacc tcggatccac cgtcgaatcc gtagtcgtcc gctcccgcgt cccggtggcc 2100
ctcctcgtgg cccacggtgg cacccgcgag caggtccgct ga 2142
<210> 10
<211> 918
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon Optimized DNA of Sorangium cellulosum for Expression in
Streptomyces venezuelae
<400> 10
atggagaagg agtcgcgcat cgccatctac ggcgccatcg ccgccaacgt cgccatcgcc 60
gccgtcaagt tcatcgccgc ggccgtcacg ggctcgtcgg cgatgctcag cgagggcgtc 120
cactccctcg tggacaccgc cgacggcctc ctcctcctcc tcggcaagca ccgcagcgcg 180
cgcccgccgg acgccgagca ccccttcggc cacggcaagg agctctactt ctggaccctc 240
atcgtggcca tcatgatctt cgcggccggc ggcggcgtct ccatctacga gggcatcctc 300
cacctcctcc acccccggca gatcgaggac ccgacctgga actacgtcgt cctcggggcc 360
gcagcggtgt tcgaaggcac ctccctgatc atctccatcc acgagttcaa gaagaaggac 420
gggcagggct acctcgcggc catgcgctcc agcaaggacc ccaccacctt cacgatcgtc 480
ctcgaggaca gcgccgcgct ggccggcctc acgatcgcgt tcctcggcgt ctggctcgga 540
caccgcctcg gcaacccgta cctggacggc gccgcgtcca tcggcatcgg gctcgtcctc 600
gccgcggtgg ccgtcttcct cgcctcccag tcccgcggcc tgctcgtcgg cgagtccgcc 660
gaccgggagc tcctcgccgc catccgcgcc ctggcctccg cggacccggg cgtgtccgcc 720
gtggggcgcc cgctcaccat gcacttcggc ccgcacgagg tcctcgtcgt gctccggatc 780
gagttcgacg cggcgctcac cgcctccggc gtggccgagg ccatcgagcg tatcgagacc 840
cgcatccggt ccgagcgccc cgacgtcaag cacatctacg tcgaggcgcg ctccctccac 900
cagcgcgccc gcgcgtga 918
<210> 11
<211> 207
<212> DNA
<213> Sorangium cellulosum
<400> 11
actttcaatt tttccgaggg gggcttggtc tctggttcct caggaagcct gatcgggacg 60
agctaattcc catccatttt tttgaggctc tgctcaaagg gattagatcg agtgagacag 120
ttcttttgca gtgcgcgaag aacctgggcc tcgaccggag gacgatcgac gtccgcgagc 180
gggtcagccg ctgaggatgt gcccgtc 207
<210> 12
<211> 146
<212> DNA
<213> Sorangium cellulosum
<400> 12
gagcgccgaa caaaaccagg ccgagcgggc cgatgagccg caagcccgcc tgcgtcaccc 60
tgggactcat ctgatctgat cgcgggtacg cgtcgcgggt gtgcgcgttg agccgtgttg 120
ttcgaacgct gaggaacggt gagctc 146
<210> 13
<211> 4
<212> DNA
<213> Sorangium cellulosum
<400> 13
ttgc 4
<210> 14
<211> 183
<212> DNA
<213> Sorangium cellulosum
<400> 14
cggtggcagc gctgagtgcg catctggctt ctcatgtcgt ctctacgggg gatggggaat 60
ccgcgcgccc gccggataca gggagcgtgg ctccaacgac ccacgaagtc gcttcgctcg 120
acgaagacgg gttgttcgcg ttgattgatg agtcactcgc gcgcgcggga aagaggtgat 180
tgc 183
<210> 15
<211> 83
<212> DNA
<213> Sorangium cellulosum
<400> 15
cctgcccgac accaccggca ccaccggcac caccagcccc cctcacacac ggaacacgga 60
acggacaggc gagaacggga gcc 83
<210> 16
<211> 102
<212> DNA
<213> Sorangium cellulosum
<400> 16
cccgaccgcg gtcctgcccc acgcgccgca ccccgcgcat cccgcgcacc acccgccccc 60
acacgcccac aaccccatcc acgagcggaa gaccacaccc ag 102
<210> 17
<211> 68
<212> DNA
<213> Sorangium cellulosum
<400> 17
gcgccggccg tcgccgaggc cgtcctctcc tggctcgacg ccatcgaggg catcgagggg 60
gcgggcaa 68
<210> 18
<211> 147
<212> DNA
<213> Sorangium cellulosum
<400> 18
gacaccgggg ccccggtccg cccggccccc cttcggacgg accggacggc tcggaccacg 60
gggacggctc agaccgtccc gtgtgtcccc gtccggctcc cgtccgcccc atcccgcccc 120
tccaccggca aggaaggaca cgacgcc 147
<210> 19
<211> 66
<212> DNA
<213> Sorangium cellulosum
<400> 19
gcaccgccca agaccccccg gggcgggacg tcccgggtgc accaagcaaa gagagagaaa 60
cgaacc 66
<210> 20
<211> 75
<212> DNA
<213> Sorangium cellulosum
<400> 20
aagcggcggt gcccgccacc cgggagggtg gcgggcaccg ctttttcggc ctgctgggtc 60
taccggacca cctga 75
<210> 21
<211> 104
<212> DNA
<213> Streptomyces venezuelae
<400> 21
tccctgccgc acggtcgcct cccgccccgg accccgtccc gggcacctcg actcgaatca 60
cttcatgcgc gcctcgggcg cctccaggaa ctcaagggga cagc 104
<210> 22
<211> 108
<212> DNA
<213> Streptomyces venezuelae
<400> 22
cgtgacgccg tgaaagcggc ggtgcccgcc acccgggagg gtggcgggca ccgctttttc 60
ggcctgctgg gtctaccgga ccacctgacc tgcaggaaac ttaagaaa 108
<210> 23
<211> 83
<212> DNA
<213> Streptomyces venezuelae
<400> 23
cctgcccgac accaccggca ccaccggcac caccagcccc cctcacacac ggaacacgga 60
acggacaggc gagaacggga gcc 83
<210> 24
<211> 102
<212> DNA
<213> Streptomyces venezuelae
<400> 24
cccgaccgcg gtcctgcccc acgcgccgca ccccgcgcat cccgcgcacc acccgccccc 60
acacgcccac aaccccatcc acgagcggaa gaccacaccc ag 102
<210> 25
<211> 68
<212> DNA
<213> Streptomyces venezuelae
<400> 25
gcgccggccg tcgccgaggc cgtcctctcc tggctcgacg ccatcgaggg catcgagggg 60
gcgggcaa 68
<210> 26
<211> 147
<212> DNA
<213> Streptomyces venezuelae
<400> 26
gacaccgggg ccccggtccg cccggccccc cttcggacgg accggacggc tcggaccacg 60
gggacggctc agaccgtccc gtgtgtcccc gtccggctcc cgtccgcccc atcccgcccc 120
tccaccggca aggaaggaca cgacgcc 147
<210> 27
<211> 66
<212> DNA
<213> Streptomyces venezuelae
<400> 27
gcaccgccca agaccccccg gggcgggacg tcccgggtgc accaagcaaa gagagagaaa 60
cgaacc 66
<210> 28
<211> 101
<212> DNA
<213> Streptomyces venezuelae
<400> 28
cgccgtgaaa gcggcggtgc ccgccacccg ggagggtggc gggcaccgct ttttcggcct 60
gctgggtcta ccggaccacc tgagctagca aatctagaaa a 101
Claims (20)
- 스트렙토마이시스 베네주엘래(Streptomyces venezuelae)에 코돈 최적화된 에포틸론 생합성 유전자인 epoA(서열번호 1), epoP(서열번호 2), epoB(서열번호 3), 및 epoC(서열번호 4)와, 소란지움 셀룰로섬(Sorangium cellulosum)에서 유래한 유전자간 영역(intergenic region)을 포함하는 에포틸론 발현 카세트로서, 상기 유전자간 영역은 epoA 유전자의 업스트림에 위치하는 영역(서열번호 11), epoP와 epoB 유전자 사이에 위치하는 영역(서열번호 12), 및 epoC 유전자의 다운스트림에 위치하는 영역(서열번호 13)을 포함하는 군에서 이루어진 어느 하나 이상인, 에포틸론 발현 카세트.
- 삭제
- 스트렙토마이시스 베네주엘래(Streptomyces venezuelae)에 코돈 최적화된 에포틸론 생합성 유전자인 epoD(서열번호 5), epoE(서열번호 6), epoF(서열번호 7), orf6(서열번호 8), orf3(서열번호 9), 및 orf14(서열번호 10)와, 소란지움 셀룰로섬(Sorangium cellulosum)에서 유래한 유전자간 영역(intergenic region)을 포함하는 에포틸론 발현 카세트로서, 상기 유전자간 영역은 epoD 유전자의 업스트림에 위치하는 영역(서열번호 14), epoD와 epoE 유전자 사이에 위치하는 영역(서열번호 15), epoE와 epoF 유전자 사이에 위치하는 영역(서열번호 16), epoF와 orf6 유전자 사이에 위치하는 영역(서열번호 17), orf6과 orf3 유전자 사이에 위치는 영역(서열번호 18), orf3과 orf14 유전자 사이에 위치하는 영역(서열번호 19), 및 epoC 유전자의 다운스트림에 위치하는 영역(서열번호 20)을 포함하는 군에서 이루어진 어느 하나 이상인, 에포틸론 발현 카세트.
- 삭제
- 스트렙토마이시스 베네주엘래(Streptomyces venezuelae)에 코돈 최적화된 에포틸론 생합성 유전자인 epoA(서열번호 1), epoP(서열번호 2), epoB(서열번호 3), 및 epoC(서열번호 4)와, 스트렙토마이시스 베네주엘래의 피크로마이신(pikromycin) 또는 데소사민(desosamin) 생합성 유전자 집단에서 유래한 유전자간 영역(intergenic region)을 포함하는 에포틸론 발현 카세트로서, 상기 유전자간 영역은 epoP와 epoB 유전자 사이에 위치하는 영역(서열번호 21), 및 epoC 유전자의 다운스트림에 위치하는 영역(서열번호 22)을 포함하는 군에서 이루어진 어느 하나 이상인, 에포틸론 발현 카세트.
- 삭제
- 스트렙토마이시스 베네주엘래(Streptomyces venezuelae)에 코돈 최적화된 에포틸론 생합성 유전자인 epoD(서열번호 5), epoE(서열번호 6), epoF(서열번호 7), orf6(서열번호 8), orf3(서열번호 9), 및 orf14(서열번호 10)와, 스트렙토마이시스 베네주엘래의 피크로마이신(pikromycin) 또는 데소사민(desosamin) 생합성 유전자 집단에서 유래한 유전자간 영역(intergenic region)을 포함하는 에포틸론 발현 카세트로서, 상기 유전자간 영역은 epoD와 epoE 유전자 사이에 위치하는 영역(서열번호 23), epoE와 epoF 유전자 사이에 위치하는 영역(서열번호 24), epoF와 orf6 유전자 사이에 위치하는 영역(서열번호 25), orf6과 orf3 유전자 사이에 위치하는 영역(서열번호 26), orf3과 orf14 유전자 사이에 위치하는 영역(서열번호 27), 및 orf14 유전자의 다운스트림에 위치하는 영역(서열번호 28)을 포함하는 군에서 이루어진 어느 하나 이상인, 에포틸론 발현 카세트.
- 삭제
- 스트렙토마이시스 베네주엘래(Streptomyces venezuelae)에 코돈 최적화된 에포틸론 생합성 유전자인 epoA(서열번호 1), epoP(서열번호 2), epoB(서열번호 3), epoC(서열번호 4), epoD(서열번호 5), epoE(서열번호 6), epoF(서열번호 7), orf6(서열번호 8), orf3(서열번호 9), 및 orf14(서열번호 10)와, 스트렙토마이시스 베네주엘래의 피크로마이신(pikromycin) 또는 데소사민(desosamin) 생합성 유전자 집단에서 유래한 유전자간 영역(intergenic region)을 포함하는 에포틸론 발현 카세트로서, 상기 유전자간 영역은 epoP와 epoB 유전자 사이에 위치하는 영역(서열번호 21), epoC 유전자의 다운스트림에 위치하는 영역(서열번호 22), epoD와 epoE 유전자 사이에 위치하는 영역(서열번호 23), epoE와 epoF 유전자 사이에 위치하는 영역(서열번호 24), epoF와 orf6 유전자 사이에 위치하는 영역(서열번호 25), orf6과 orf3 유전자 사이에 위치하는 영역(서열번호 26), orf3과 orf14 유전자 사이에 위치하는 영역(서열번호 27), 및 orf14 유전자의 다운스트림에 위치하는 영역(서열번호 28)을 포함하는 군에서 이루어진 어느 하나 이상인, 에포틸론 발현 카세트.
- 삭제
- 제1항, 제3항, 제5항, 제7항, 및 제9항 중 어느 한 항에 따른 에포틸론 발현 카세트를 포함하는, 에포틸론 발현용 벡터.
- pDHS702, pDHS618, pSBAC, 및 pSET152로 이루어지는 군에서 선택되는 어느 하나의 벡터에 제1항, 제3항, 제5항, 제7항, 및 제9항 중 어느 한 항에 따른 에포틸론 발현 카세트를 포함하는, 에포틸론 발현용 벡터.
- 제11항에 따른 에포틸론 발현용 벡터가 하나 이상 도입된 스트렙토마이시스 베네주엘래를 배양하는 단계를 포함하는, 에포틸론 A, B, C, 및 D을 포함하는 군에서 선택되는 어느 하나 이상의 에포틸론의 제조방법.
- epoA(서열번호 1), epoP(서열번호 2), epoB(서열번호 3), 및 epoC(서열번호 4)를 포함하는 제1항, 및 제5항 중 어느 한 항에 따른 제1 발현 카세트, 및 epoD(서열번호 5), epoE(서열번호 6), epoF(서열번호 7), orf6(서열번호 8), orf3(서열번호 9), 및 orf14(서열번호 10)를 포함하는 제3항, 제7항, 및 제9항 중 어느 한 항에 따른 제2 발현 카세트를 포함하는 군에서 선택되는 어느 하나 이상의 발현 카세트를 포함하는 에포틸론 발현용 벡터가 도입된 스트렙토마이시스 베네주엘래를 배양하는 단계를 포함하는, 에포틸론 A, B, C, 및 D을 포함하는 군에서 선택되는 어느 하나 이상의 에포틸론의 제조방법.
- 제14항에 있어서,
상기 발현 카세트는 pDHS702, pDHS618, pSBAC, 및 pSET152로 이루어지는 군에서 선택되는 어느 하나의 벡터에 합성된 것인, 에포틸론의 제조방법.
- (a) pDHS702 벡터에 제1항에 따른 에포틸론 발현 카세트를 포함하는 pDHS702-optSoC_APBC_Sv;
(b) pDHS618 벡터에 제3항에 따른 에포틸론 발현 카세트를 포함하는 pDHS618-optSoC_DEF_Sv;
(c) pDHS702 벡터에 제5항에 따른 에포틸론 발현 카세트를 포함하는 pDHS702-optPD_APBC_Sv;
(d) pDHS618 벡터에 제7항에 따른 에포틸론 발현 카세트를 포함하는 pDHS618-optPD_DEF_Sv;
(e) pSBAC 벡터에 제1항에 따른 에포틸론 발현 카세트를 포함하는 pSBAC-optSoC_APBC_Sv;
(f) pSBAC 벡터에 제3항에 따른 에포틸론 발현 카세트를 포함하는 pSBAC-optSoC_DEF_Sv;
(g) pSBAC 벡터에 제5항 및 제7항에 따른 에포틸론 발현 카세트를 포함하는 pSBAC-optPD_APBCDEF_Sv;
(h) pSET152 벡터에 제3항에 따른 에포틸론 발현 카세트를 포함하는 pSET152-optSoC_DEF_Sv; 및
(i) pSET152 벡터에 제7항에 따른 에포틸론 발현 카세트를 포함하는 pSET152-optPD_DEF_Sv를 포함하는 군에서 선택되는 어느 하나 이상의 벡터가 도입된 스트렙토마이시스 베네주엘래를 배양하는 단계를 포함하는, 에포틸론 A, B, C, 및 D을 포함하는 군에서 선택되는 어느 하나 이상의 에포틸론의 제조방법.
- 제16항에 있어서,
상기 벡터 pDHS702-optSoC_APBC_Sv 및 pDHS618-optSoC_DEF_Sv가 도입된 스트렙토마이시스 베네주엘래를 배양하는 단계를 포함하는, 에포틸론의 제조방법.
- 제16항에 있어서,
상기 벡터 pDHS702-optPD_APBC_Sv 및 pDHS618-optPD_DEF_Sv가 도입된 스트렙토마이시스 베네주엘래를 배양하는 단계를 포함하는, 에포틸론의 제조방법.
- 제16항에 있어서,
상기 벡터 pSBAC-optSoC_APBC_Sv 및 pSBAC-optSoC_DEF_Sv가 도입된 스트렙토마이시스 베네주엘래를 배양하는 단계를 포함하는, 에포틸론의 제조방법.
- 제16항에 있어서,
상기 벡터 pSBAC-optSoC_APBCDEF_Sv가 도입된 스트렙토마이시스 베네주엘래를 배양하는 단계를 포함하는, 에포틸론의 제조방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020140067238A KR101606635B1 (ko) | 2014-06-02 | 2014-06-02 | 에포틸론 발현 카세트 및 이의 용도 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020140067238A KR101606635B1 (ko) | 2014-06-02 | 2014-06-02 | 에포틸론 발현 카세트 및 이의 용도 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20150139149A KR20150139149A (ko) | 2015-12-11 |
KR101606635B1 true KR101606635B1 (ko) | 2016-03-28 |
Family
ID=55020367
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020140067238A KR101606635B1 (ko) | 2014-06-02 | 2014-06-02 | 에포틸론 발현 카세트 및 이의 용도 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101606635B1 (ko) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1135470A2 (en) * | 1998-11-20 | 2001-09-26 | Kosan Biosciences, Inc. | Recombinant methods and materials for producing epothilone and epothilone derivatives |
KR100949313B1 (ko) * | 2008-02-21 | 2010-03-23 | 이화여자대학교 산학협력단 | 에포틸론 발현용 재조합벡터 및 이를 이용한스트렙토마이세스 베네주엘라에에서의 에포틸론 생산방법 |
-
2014
- 2014-06-02 KR KR1020140067238A patent/KR101606635B1/ko active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
KR20150139149A (ko) | 2015-12-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DK2271666T3 (da) | Nrps-pks-gengruppe og dens manipulation og anvendelighed | |
CA2506669A1 (en) | Borrelidin-producing polyketide synthase and its uses | |
KR20180093083A (ko) | 켈리마이신 생합성 유전자 클러스터 | |
KR20100039443A (ko) | 답토마이신 생합성 유전자 클러스터에 관련된 조성물 및 방법 | |
KR20040099138A (ko) | 항생물질의 생합성을 위한 스트렙토마이세스시아네오그리세우스 아종 논시아노게누스 유래의 유전자클로닝 및 사용 방법 | |
CN107794286B (zh) | 一种环脂肽类化合物生物合成基因簇及其激活方法与应用 | |
CN108048472B (zh) | 一株高效异源表达Disorazole Z的工程菌株和构建该菌株的基因簇及其应用 | |
CN107540682B (zh) | 曲张链丝菌素衍生物及其制备方法和应用 | |
KR101833984B1 (ko) | 밀베마이신을 생산하는 재조합 미생물 및 이를 이용한 밀베마이신 생산 방법 | |
CN111607603B (zh) | Hangtaimycin生物合成基因簇及其应用 | |
CN111378008B (zh) | 脂肽类化合物Totopotensamides及其制备方法和应用 | |
CN110857447B (zh) | 提高米尔贝霉素a3/a4或其衍生物产量的方法 | |
KR101606635B1 (ko) | 에포틸론 발현 카세트 및 이의 용도 | |
US20040247620A1 (en) | Transformation system based on the integrase gene and attachment site for Myxococcus xanthus bacteriophage Mx9 | |
KR101601424B1 (ko) | 에포틸론 발현용 벡터 및 이의 용도 | |
KR102159415B1 (ko) | Uk-2 생합성 유전자 및 그것을 사용한 uk-2 생산성을 향상시키기 위한 방법 | |
KR101736540B1 (ko) | 방선균에서 에포틸론 생산을 증대시키기 위한 에포틸론의 전구체, 및 이를 이용한 에포틸론의 생산 방법 | |
US20030171562A1 (en) | Genes and proteins for the biosynthesis of polyketides | |
KR100882692B1 (ko) | 부테닐-스피노신 살충제 생산을 위한 생합성 유전자 | |
CN107164394B (zh) | 一种非典型角环素类化合物nenestatin A的生物合成基因簇及其应用 | |
CN107541523B (zh) | 曲张链丝菌素生物合成基因簇及其应用 | |
KR102017788B1 (ko) | 밀베마이신 d를 생산하는 재조합 미생물 및 밀베마이신 d 생산 방법 | |
CN110129244B (zh) | 链霉菌底盘菌株及其构建方法、在异源表达研究中的应用 | |
KR101610970B1 (ko) | 갈보놀라이드 생합성에 관여하는 유전자 | |
KR100549690B1 (ko) | 에프알-008 폴리케타이드 합성에 관여하는 유전자 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20200102 Year of fee payment: 5 |