KR100955756B1 - 개량된 유전자 발현 - Google Patents

개량된 유전자 발현 Download PDF

Info

Publication number
KR100955756B1
KR100955756B1 KR1020037012782A KR20037012782A KR100955756B1 KR 100955756 B1 KR100955756 B1 KR 100955756B1 KR 1020037012782 A KR1020037012782 A KR 1020037012782A KR 20037012782 A KR20037012782 A KR 20037012782A KR 100955756 B1 KR100955756 B1 KR 100955756B1
Authority
KR
South Korea
Prior art keywords
vector
gene
delete delete
nucleic acid
cet
Prior art date
Application number
KR1020037012782A
Other languages
English (en)
Other versions
KR20040016848A (ko
Inventor
스테펜 제라인트 윌리암스
로버트 라츠란 크롬비
Original Assignee
밀리포어 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GB0108605A external-priority patent/GB0108605D0/en
Priority claimed from GB0109335A external-priority patent/GB0109335D0/en
Application filed by 밀리포어 코포레이션 filed Critical 밀리포어 코포레이션
Priority claimed from PCT/GB2002/001479 external-priority patent/WO2002081677A2/en
Publication of KR20040016848A publication Critical patent/KR20040016848A/ko
Application granted granted Critical
Publication of KR100955756B1 publication Critical patent/KR100955756B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • C07H21/04Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids with deoxyribosyl as saccharide radical
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

5' 확장된 메틸화-결여 CpG 아일랜드 및 3' 선별가능한 마커 성분의 측면에 위치되어 있는 발현가능한 핵산을 포함하는 폴리뉴클레오티드 및 벡터가 개시된다. 이러한 폴리뉴클레오티드 및 벡터는 측면의 발현가능한 핵산 발현의 높은 수준을 얻기 위한 방법을 제공한다. 바람직한 구현예는 5' 확장된 메틸화-결여 CpG 아일랜드 및 3' 항생물질 내성 유전자의 조합을 포함한다.

Description

개량된 유전자 발현{Improved Gene Expression}
본 발명은 선별가능한 마커(marker) 성분과 함께 도처에 있는 염색질 개방성분(ubiquitous chromatin opening element; UCOE)을 포함하는 폴리뉴클레오티드에 관한 것이다. 측면의 발현가능한 핵산 서열에 작동가능하게 연결된 때, 성분의 결합은 유전자 발현의 고도의 그리고 재현성의 수준을 제공한다. 본 발명은 또한 상기 폴리뉴클레오티드 서열을 포함하는 벡터, 상기 벡터를 포함하는 숙주세포, 및 치료요법 또는 세포 배양에서 단백질 발현을 포함하는 응용을 위한 상기 폴리뉴클레오티드, 벡터 또는 숙주세포의 용도에 관한 것이다.
고등 진핵생물의 염색질 구조에 대한 최근 모델은 유전자가 “도메인(domain)”으로 조직화되어(organized) 있다고 가정한다(Dillon, N. & Grosveld, F. Chromatin domains as potential units of eukaryotic gene function. Curr. Opin. Genet. Dev. 4, 260-264 (1994); Higgs, D.R. Do LCRs open chromatin domains? Cell 95, 299-302 (1998)). 염색질 도메인은, 응축되고 "폐쇄된" 전사적 침묵상태, 또는 탈응축되고 "개방된" 전사적 수용성(competent) 배치(configuration) 중 하나로 존재하는 것으로 관찰되었다. 증가된 DNAaseⅠ 민감성, DNA 저메틸화(hypomethylation), 및 히스톤 과아세틸화(hyperacetylation)로 특징되는 개방된 염색질 구조의 구축은 유전자 발현개시의 선행-요건으로 간주된다.
염색질 영역의 개방 및 폐쇄 성질은 숙주세포 게놈에 통합되는(integrated) 트랜스유전자(transgene)의 행위를 반영한다. 동일한 구성물이 마우스 게놈에서 다른 위치로 통합될 때, 조직-특이적 및 발생단계-특이적 발현의 다른 양상을 부여한다(Palmiter, R.D. & Brinster, R.L. Ann. Ref. Genet. 20, 465-499 (1986); Allen, N.D. et al. Nature 333, 852-855 (1988); Bonnerot, C., Grimber, G., Briand, P. & Nicolas, J.F. Proc. Natl. Acad. Sci. USA 87:6331-6335 (1990)).
위치효과 다양성(position effect variegation; PEV)라고 알려진, 주어진 트랜스제닉(transgenic) 마우스 조직 내의 다양화된 발현 양상이 또한 자주 관찰된다(Kioussis, D. & Festenstein, R. Curr. Opin. Genet. Dev. 7, 614-619 (1997)). 외인성 유전자들이 생체외 포유동물 세포 배양물의 염색체로 통합될 때, 많은 통합들이 트랜스유전자의 빠른 침묵을 초래하고, 나머지는 발현 수준에 큰 다양도(variability)를 가져온다(Pikaat, M.J. Recillas-Targa, F. & Felsenfield, G. Genes Dev. 12, 2852-2862 (1998); Fussenegger, M., Bailey, J.E., Hauser, H. & Mueller, P.P Trends Biotech. 17, 35-42 (1999)). 이러한 위치효과는 기초적 연구 및 생물공학적 응용 둘 다에 관련하여, 트랜스유전자 발현을 비효율적으로 만든다.
유전자 조직화의 염색질 도메인 모델은, 전사적으로 수용성 개방 염색질 구조를 구축하고 유지할 수 있는 유전자 조절 성분이 게놈의 활성 부위와 연관되어 있는 것임을 암시한다.
유전자좌 조절 영역(locus control region; LCRs)은 긴-범위의 염색질 리모델링 능력을 가진 전사적 조절 성분의 한 부류이다. LCRs는 cis로 연결된 유전자 상에, 특히 단일 카피 트랜스유전자에 통합 부위-독립적, 트랜스유전자 카피수-의존적인, 생리적 수준의 발현을 부여하는 그들의 능력에 의하여 형질전환 마우스에서, 기능적으로 정의된다(Fraser, P. & Grosveld, F. Curr. Opin. Cell Biol. 10, 361-365 (1998); Li, Q., Harju, S. & Peterson, K.R. Trends Genet. 15: 403-408 (1999)). 결정적으로 그러한 발현은 조직특이적이다. LCRs는 이형염색질(hetrochromatin)의 확산을 막고, PEV(Kioussis, D. & Festenstein, R. Curr. Opin. Genet. Dev. 7, 614-619 (1997))를 방해하며, 그들이 조절하는 유전자의 5' 또는 3' 중 어느 한 쪽에 위치한 일련의 DNAseⅠ과민감성(HS) 부위로 이루어진다(Li, Q., Harju, S. & Peterson, K.R. Trends Genet. 15: 403-408 (1999)).
LCRs는 두개의 분리된, 필수적이지는 않지만, 독립된 성분들로 구성된 것으로 보인다. 첫 번째는 '개방 염색질 도메인'의 구축, 그리고 두 번째는 트랜스유전자 카피수 의존적 발현을 부여하는 우세한 전사적 활성화 능력(Fraser, P. & Grosveld, F. Curr. Opin. Cell Biol. 10, 361-365 (1998)). LCRs가 그들의 기능을 발휘하는 분자적 기작은 논쟁 중으로 남아있다(Higgs, D.R. Cell 95, 2999-302 (1998); Bulger, M. & Groudine, M. Genes Dev. 13, 2465-2477 (1999); Grosveld, F. Curr. Opin. Genet. Dev. 9 152-157 (1999); Bender, M.A., Bulger, M., Close, J. & Groudine, M., Mol. Cell 5, 387-393 (2000).
치료학적 단백질 생성물을 높은 수준으로 생산하는 배양된 포유류 세포주의 생성은 주요한 발전적인 산업이다. 염색질 위치효과가 이것을 어렵고 시간소모적이며 비용이 많이 드는 과정이 되게 한다. 그러한 포유류 “세포 공장”의 생산의 가장 통상적으로 사용되는 접근은, 약물 내성 유전자(예를 들면, DHFR, 글루타민 신테타제(Kaufman RJ. Methods Enzymol 185, 536-566 (1990)) 및 스트린전트 선별적 압력의 유지의 조합에 의하여 유도된 유전자 증폭에 의존적이다. 적당한 조직으로부터 유래된 세포를 사용하는, 고도로 발현된 유전자 도메인으로부터 유래된 LCRs을 포함하는 벡터의 사용은, 안정하고 높은 수준의 발현을 나타내는 클로날 세포주의 많은 비율을 주면서, 그 과정을 매우 단순화시킨다(Needham M. Gooding C, Hudson K, Antoniou M, Grosfeld F and Hollis M. Evans S, Popplewell M, Cerillo G, McPheat J, Monk A, Jack A, Johnstone D and Hollis M. Protein Expr Purif 6, 124-131 (1995)).
그러나, 일부 환경에서 유용함에도 불구하고, LCRs의 조직특이성 또한, 이를테면, 발현이 필요한 조직에 LCR이 알려지지 않거나, 또는 모든 조직 또는 많은 조직에서 발현이 요구되는 경우에는, 많은 응용에 대한 주요한 제한이다.
본 발명자들의 함께 계류중인 특허출원 PCT/GB99/02357 (WO 2000/05393), US 09/358082, GB 0022995.5 및 US 60/252,048은, 본 발명의 참조에 나와있는데, 도처에서 발현되는, 하우스키핑 유전자(housekeeping gene)만으로 이루어진 유전자좌에 걸쳐서 개방 염색질 구조를, 그것들의 자연 염색체 구조에서, 구축할 수 있는 성분을 기재한다. 이들 성분은 LCR 유래가 아니다. 본 발명은 염색질을 개방하거나, 개 방 상태로 염색질을 유지하며, 적어도 두개의 다른 조직형 세포에서 작동가능하게 연결된 유전자의 재현성의(reproducible) 발현을 촉진시키는 염색질 개방 성분(UCOE)을 포함하는 폴리뉴클레오티드를 제공한다.
포유류의 DNA에서, 디뉴클레오티드(dinucleotide) CPG는 사이토신을 5-메틸사이토신으로 메틸화하는 DNA 메틸트랜스퍼라제 효소에 의하여 인식된다. 하지만, 5-메틸사이토신은 불안정하고 티민으로 변환된다. 그 결과로, CpG 디뉴클레오티드는 우연히 기대되는 것보다 자주 인식되지는 않는다. 그럼에도 불구하고 게놈 DNA 의 어떤 영역은 기대한 것에 가까운 CpG의 빈도를 갖고, 이들 서열은 "CpG 아일랜드"로 알려져 있다. 여기서 사용된 "CpG 아일랜드"는 50%이상의 GC 함량 및 0.6이상의 관찰된/기대된 CpG 정도 비율을 갖는 200bp이상의 DNA 서열로 정의된다( 즉, 우연히 기대되는 그것의 60%이상의 CpG 디뉴클레오티드 함량)(Gardiner-Green M and Frommer M. J Mol Biol 196, 261-282 (1987); Rice P, Longden I and Bleasby A Trends Genet 16, 276-277 (2000)).
메틸화-결여(free) CpG 아일랜드는 당업계에 잘 알려져 있고(Bird et al(1985) Cell 40: 91-99, Tazi and Bird (1990) Cell 60:909-920), CpG 아일랜드는 시토신 잔기의 실질적인 비율이 메틸화가 결여되어 있는 것으로 정의될 수 있으며, 두 개의 가깝게 위치한(0.1-3kb) 분기적으로(divergently) 전사된 유전자들의 5' 말단에 걸쳐 확장한다. 이들 DNA 영역은 발생단계 전체에 걸쳐서 모든 조직에서 저메틸화된 상태로 잔류된다고 보고되고 있다(Wise and Pravtcheva (1999) Genomics 60: 258-271). 이들은 조직-제한적 발현 양상을 보이는 유전자의 약 40% 뿐만 아니라 모든 도처에 존재하여 발현하는 유전자의 5'말단에 연관되며(Antequera, F. & Bird, A. Proc. Natl. Acad. Sci. USA 90, 1195-1199(1993); Cross, S.H. & Bird, A.P Curr. Opin, Genet. Dev. 5, 309-14 (1995)), 활성 염색질 영역에 국한된 것으로 알려져 있다(Tazi, J. & Bird,A. Cell 60, 909-920 (1990)).
'확장된(extended)' 메틸화-결여 CpG 아일랜드는, 1 이상의 전사개시 부위를 포함하는 영역에 걸쳐 확장하고, 그리고/또는 300bp이상, 바람직하기는 500bp이상 확장된 메틸화-결여 CpG 아일랜드이다. 확장된 메틸화-결여 CpG 아이랜드의 경계는, 어떤 CpG 잔기의 메틸화 상태에도 민감한 인식 서열에서의 DNA를 소화(절단)하는 능력이 존재하는 엔도뉴클레아제 제한효소와 조합하여 그 영역에 대한 PCR의 사용을 통하여 기능적으로 정의된다. 그 효소 중 하나는 HpaⅡ로, CpG 아일랜드 내에서 통상적으로 발견되는 CCGG 부위를 중앙의 CG 잔기가 메틸화-결여 경우만 인식하여 소화한다. 따라서 HpaⅡ-소화된 DNA 및 HpaⅡ 부위를 포함하는 영역에 대해 행해진 PCR은 만약 DNA가 메틸화되지 않는다면, HpaⅡ 소화때문에 증폭산물을 생산하지 않는다. PCR은 단지 DNA가 메틸화된 때만 증폭 산물을 생산할 것이다. 따라서, 메틸화-결여 부위를 넘어서는, HpaⅡ가 DNA를 소화하지 않을 것이고, PCR 증폭 산물이 관찰될 것이고 이에 의해 "확장된 메틸화-결여 CpG 아일랜드"의 경계를 정의할 것이다.
본 발명자들은, 인간 TATA 결합 단백질(TBP)/프로테오좀 구성요소-B1 (PSMBI)으로부터 유래된 이중의, 분기적으로 전사되는 프로모터들 및 이종 핵 리보뉴클레오프로테인 A2/B1(hnRNP A2)/이형염색질 프로테인 1Hsγ(HP1Hsγ) 유전자좌를 포함하는 메틸화-결여 CpG 아일랜드가 겹쳐 있는 영역들은, 재현성의 생리적 수준의 유전자 발현을 제공하며, 그들은 다양화된 발현 양상 및 중심절의 이형염색질 내에서 트랜스유전자의 통합과 함께 통상 일어나는 전사적 침묵(Silencing)을 방해한다는 것을 입증하였다(WO 00/05393).
본 발명에서 사용될 때, "재현성의 발현"이란 용어는 본 발명의 폴리뉴클레오티드가 그것의 염색질의 환경에 관계없이, 그리고 바람직하게는 본 발명의 폴리뉴클레오티드가 존재하는 세포 유형 또는 조직 유형에 관계없이 발현의 실질적으로 동일한 수준에서 발현가능한 유전자의 발현을 이끄는 것을 의미한다. 당업계에서의 이러한 기술은 작동가능하게 연결된 발현가능한 유전자의 발현의 실질적으로 동일한 수준은, 세포가 활성 유전자 발현을 할 수 있다는 가정하여, 폴리뉴클레오티드의 염색질 환경, 그리고 바람직하게는 세포 유형에 관계없이 이루어진다는 것을 이해할 것이다.
본 발명자들은 활성적으로 전사하는 프로모터와 연관된 메틸화-결여 CpG 아일랜드는, 염색질을 리모델링하는 능력을 가지며, 따라서 하우스키핑 유전자좌에서 개방 도메인을 구축하고 유지하는 주요한 결정자(determinant)인 것으로 생각된다는 것을 보여주었다.
UCOE's는 트랜스유전자 발현의 안정성 및 수준을 개선시키면서, 증가된 비율의 생산적 유전자 전달을 부여한다. 이것은 트랜스제닉 동물 및 배양된 세포에서 재조합 단백질 생성물의 생산을 포함하는, 중요한 연구 및 생물공학적 응용을 가진다. 본 발명자들은 CMV-EGFP 리포터 구성물의 발현 및 분비되는 약학적으로 가치있는 단백질 에리트로포에틴(erythropoietin)에의 UCOE의 유리한 효과를 보였다(WO 00/05393). 또한 UCOEs의 성질은 유전자 치료에서의 유용성, 낮은 빈도의 생산적 유전자 전달, 및 부적당한 수준의 발현과 그 발현의 지속에 의하여 제한되는 그의 효율성을 암시한다(Verma, I.M. & Somia, N. Nature 389: 239-242 (1997)).
이들 중요한 관계 및 넓은 범위의 응용이 주어지면, 트랜스유전자 발현 수준을 더 최적화한다. 특히 생체내 유전자 요법 분야에서 그리고 재조합 단백질의 생체외 생산을 위해, UCOE를 단독으로 사용하여 얻을 수 있는 발현의 수준을 더욱 증가시킬 필요가 있다.
5' UCOE에 작동가능하게 연결된 핵산의 발현은 놀랍게도 발현된 핵산에 대하여 선별가능한 성분 3'의 존재에 의해 더욱 증가될 수 있으므로, 발현가능한 핵산 서열은 5' UCOE 및 3' 선별가능한 마커의 측면에 위치하게 된다.
선별가능한 마커를 제공하는 것뿐만 아니라 작동가능하게 연결된 유전자의 발현을 증가시키는 것과 같은, 벡터에서 하나 이상의 기능을 수행하는 선별가능한 성분은 더욱 밀집하고 효율적인 벡터의 구성을 가능하게 한다.
Mei, Kothary 및 Wall(Mei, Q, Kothary R and Wall L. Exp Cell Research 260, 304, 312 (2000))은 LCR 및 pgk/퓨로마이신 내성 성분에 작동가능하게 연결된 발현가능한 유전자(β-글로빈)를 포함하는 구성물을 개시한다. 하지만, 이 연구는 그것이 음성적인 대조군으로 사용되는 pgk/퓨로마이신 내성 성분과 함께, 발현가능한 유전자 및 LCR 및 유전자 발현에서 위치효과를 부과하는 데에서 중요한 tk/네오마이신 내성 성분의 조합이라는 것을 나타낸다. 상기 논문은 pgk/퓨로마이신 내성 성분의 사용으로부터 얻어지는 유익한 영향을 나타내지 않는다. 상기 논문은 확장된 메틸화-결여 CpG 아일랜드(또는 UCOE), 발현가능한 유전자 및 pgk/퓨로마이신 내성 성분을 포함하는 구성물을 나타내지 않는데, 이 구성물이 LCRs를 포함하기 때문이다. 유사하게, 상기 논문은 자연적으로는 연결되지 않는 프로모터에 작동가능하게 연결된 발현가능한 유전자를 개시하지 않을 뿐만 아니라, pgk/퓨로마이신 내성 성분에 작동가능하게 연결된 발현가능한 유전자를 개시하지 않는데, 각각의 경우에서 β-글로빈 유전자는 그것의 내인성 프로모터의 조절하에서 발현되지 않기 때문이다.
Artelt 등은 진핵생물의 발현 벡터에서 cis-연결된 유전자에서의 네오마이신 및 퓨로마이신 내성 유전자의 영향력을 비교하였다(Artelt P, Grannemann R, Stocking C, Friel J, Bartsch J and Hauser H Gene 99, 249-254 (1991). 그들은 네오마이신 내성 유전자가 연결된 유전자에 침묵효과(silencing effect)를 가질 수 있지만, "Streptomyces alboniger로부터 퓨로마이신에 대한 내성을 주는 유전자는 인접한 프로모터에 영향력이 미치지 않는다"고 결론지었다. 따라서, 상기 논문에서 본 출원에 개시한 바와 같은 내성 유전자의 위치 또는 공간 사용의 중요성을 개시하거나 제안하지 않는다.
본 발명자들의 함께 계류중인 특허출원 PCT/GB99/02357(WO 2000/05393), US 09/358082, GB 0022995.5 및 US 60/252,048은 항생물질 내성 유전자와 함께 발현가능한 핵산에 작동가능하게 연결된, 확장되고 메틸화-결여 CpG 아일랜드를 포함하는 폴리뉴클레오티드 및 벡터를 개시한다. 하지만, 개시된 실시예에서, 항생물질 유전자는 인접하지 않고, 발현가능한 핵산에 3'에 있지 않다. 이러한 인접한 선별가능한 마커의 놀라운 기여는 더욱이 개시되지 않거나 암시하지 않는다.
본 발명은, 상기 선별가능한 마커가 발현가능한 핵산 서열의 3' 및 그 인접부근에 위치되는 것을 제공하는 선별가능한 원소의 존재 하에서, 작동가능하게 연결된 핵산 서열의 발현을 상향조절하기 위하여 확장되고 메틸화-결여 CpG 아일랜드(UCOEs)의 영향력이 더욱 증가될 수 있다는 것을 개시한다.
5' 및 3'이란 용어는 발현가능한 핵산 서열의 센스(sense) 스트랜드(strand)에 대하여 사용된다. 그러므로 상기 서열의 5' 말단은 3' 방향에서 나아가는, 전사의 출발점에 상응한다.
본 발명에서 사용될 때, "작동가능하게 연결된"이란 용어는, 본 발명의 폴리뉴클레오티드에서의 성분들 사이에서 사용가능성의 관계를 말한다. 당업자들에게 잘 알려진, "작동가능하게 연결된"이란 용어는 cis-작용 DNA 서열사이의 기능적인 관계를 기재하는 용어이다. 정확한 구조적 관계가 다른 종류의 요소들과 관련이 있거나 없을 수 있으며, 다르거나 다르지 않을 수 있다. 프로모터의 경우, 그것이 진행하는 개방 리딩 프레임에 대해 본질적으로 인접한(일반적으로 100bp이하인) 5' 위치를 의미한다. 확장된 메틸화가 되지 않는 CpG 아일랜드의 경우에는, 염색질 구조에서의 지역적인 영향이 유전자 발현의 수준과 일관성을 초래한다는 것을 나타낸다. 예로써, 확장된 메틸화-결여 CpG 아일랜드를 포함하는 성분은 발현가능한 유전자의 5'에 직접적으로 위치된다. 하지만, "작동가능하게 연결된"은 명백한 기능적인 효과가 예증될 수 있는 한, 어는 곳에서든지 위치될 수 있는 가능성을 포함한다.
특히, 5' 말단에서 UCOE로 발현가능한 유전자 및 다른 것에서의 선별가능한 성분의 측면위치화는 대략 2배로 발현이 증가하는 것을 나타낸다. 다른 경우에는, 증가는 단일 UCOE 단독으로 얻어진 것보다 5배 이상이다.
본 발명에 따라서, 작동가능하게 연결된 UCOE 또는 확장된 메틸화-결여 CpG 아일랜드 단독을 사용하여 얻을 수 있는 것들과 비교하여 얻어지는, 작동가능하게 연결된 유전자의 발현의 증가된 수준을 가능하게 하는 단리된 폴리뉴클레오티드를 제공한다.
단리된 폴리뉴클레오티드는, 상기 확장된 메틸화-결여 CpG 아일랜드, 폴리아데닐화 시그날 및 프로모터에 사용가능하게 연결된 선별 가능한 마커에 의해 종결된 발현가능한 핵산을 포함하고, 여기서, CpG 아일랜드와 선별가능한 마커 둘 다는 상기 발현가능한 핵산에 작동가능하게 연결되어 있고, 상기 구성요소들은, 상기 발현가능한 핵산의 센스 스트랜드에 대하여 5'에서 3'의 배향으로, 확장된 메틸화-결여 CpG 아일랜드, 발현가능한 핵산, 선별가능한 마커의 순서로 배치되고, 그리고 발현가능한 핵산의 3'말단에 폴리아데닐화 시그날이 선별가능한 마커의 인접 말단의 2000bp이내에 있다.
여기서 사용할 때, "인접 말단"은 그것의 폴리아데닐화 시그날에 의해 표시되는 것처럼, 발현가능한 핵산의 3'말단에 가장 가까운 선별가능한 마커 유전자(그것의 프로모터를 포함하는)의 말단을 의미한다. 선별가능한 마커는 어느 한 배향일 것이므로, 발현가능한 핵산에 관련이 있는 인접 말단은 선별가능한 마커의 5' 프로모터 또는 선별가능한 센스 스트랜드에 따른 것과 같이 5' 및 3'을 갖는, 3', 전사 말단의 종결 중 하나에 있는 것이 고찰된다.
바람직하게는, 선별가능한 마커의 전사 출발점은 후자의 폴리아데닐화의 시그날에 의해 표시된 것처럼, 발현가능한 핵산 서열의 3'말단의 1500bp이내에 있다. 더욱 바람직하게는, 1000bp이내에 있다, 가장 바람직하게는, 500bp이내에 있다.
본 발명은 한 관점에서, 상기 선별가능한 성분은 항생물질 내성 유전자이다. 바람직하게는 Streptomyces종에서 얻어진 항생물질 내성 유전자이다. 더욱, 바람직하게는, 상기 항생물질 내성 유전자는 포스포글리세라이트 키나아제(pgk) 유전자의 프로모터에 작동가능하게 연결된다. 가장 바람직하게는, 뮤린(murine: 쥣과) pgk 유전자의 프로모터이다(Adra, CN, Boer PH and McBurney, MW. Gene 60, 65-74 (1987)). 대체 가능하게는 다른 포유동물 pgk 프로모터일 수 있다.
바람직한 구현예에서, 항생물질 내성 유전자는 Streptomyces종으로부터 유래된 퓨로마이신 내성 유전자이다. 가장 바람직하게는, Streptomyces alboniger로부터 유래된 퓨로마이신 N-아세틸 트랜스퍼라제 유전자이다(Vara JA, Portela A, Ortin J. Jimenez A. Nucleic Acids Res 14, 4617-4624 (1986))(SEQ ID NO:5).
대체 가능하게는, 항생물질 내성 유전자는 Streptomyces alboniger으로부터 유래된 퓨로마이신 N-아세틸 트랜스퍼라제 유전자의 변형된 형태이다. 바람직하게는, 이 유전자는 포유동물 숙주세포에서 발현을 위한 박테리아 유전자를 적응하게 하는 일반적인 방법에서, 그것의 코든 사용법의 조작에 의해 변형되고 있다. 이러한 코돈 변형은 발현된 효소가 야생형 퓨로마이신 N-아세틸 트랜스퍼라제로부터 변화되지 않는다는 결과와 함께, 코드화된 아미노산 서열을 변화되지 않게 한다. 가장 바람직하게는, 변형된 유전자는 도 14(SEQ ID NO:3)에서 나타낸 서열을 갖는다.
대체 가능하게는, 항생물질 내성 유전자는 Streptomyces종에서 유도된 네오마이신 내성 유전자이다. 바람직하게는, Streptomyces fradiae으로부터 유래된 아미노글리코사이드 포스포트랜스퍼라제 유전자이다(Thompson CJ and Gray GS. Proc Natl Acad Sci USA 80, 5190-5194 (1983))(SEQ ID NO:4).
대체 가능한 구현예에서, 항생물질 내성 유전자는 하이그로마이신 내성 유전자이다. 바람직하게는, Streptomyces hygroscopicus으로부터 유래된 하이그로마이신 포스포트랜스퍼라제 유전자이다(SEQ ID NO:6).
추가의 대체 가능한 구현예에서, 항생물질 내성 유전자는 블레오마이신 내성 유전자이다. 바람직하게는, Streptomyces verticillus으로부터 유래된 블레오마이신 결합 단백질이다.
다른 구현예에서, 항생물질 내성 유전자는 블라스티시딘 내성 유전자이다. 바람직하게는, Streptomyces verticillum으로부터 유래된 블라스티시딘 S-아세틸트랜스퍼라제이다.
발명의 또 다른 관점에서, 항생물질 내성 유전자는 Streptomyces종에서 얻어지는 것이 아니다. 한 바람직한 구현예에서, Escherichia coli으로부터 유래된 아미노사이클리톨 포스포트랜스퍼라제를 코드화하는 하이그로마이신 내성 유전자이다(SEQ ID NO:7).
다른 바람직한 구현예에서, 원래는 Klebsiella pneumoniae로부터 유도된, 트랜스포솜 Tn5으로부터 유래된 네오마이신 포스포트랜스퍼라제 유전자이다(SEQ ID NO:8).
본 발명의 대체 가능한 관점에서, 선별가능한 마커는 항생물질 내성 유전자가 아니다. 대체 가능한 선별법 메카니즘은 티미딜레이트 신타제, 티미딘 키나아제 또는 디히드로폴레이트 리덕타제를 코드화하는 유전자를 사용하는 것을 포함한다. 이러한 선별법 메카니즘은 당업자들에게 잘 알려져 있다. 메티오닌이 결여된 배지에서, 글루타민 신테타제를 코드화하는 유전자는 내성적인 글루타민 신테타제가 결여된 세포 또는 메티오닌 술폭사민과 같은, 억제제의 사용이 그것을 비활성화하는 곳 중 하나에서 선별법의 수단으로서 사용될 수 있다(Kaufman RJ. Section and coamplificationof heterologous genes in mammalin cells. Methods Enzymol 185, 537-56 (1990))
또 다른 관점에서, 선별가능한 마커가 사용될 수 있다. 예를 들면, Aequoria victoria 녹색 형광 단백질(GFP), 또는 그것의 증폭된 이형(EGFP)과 같은 형광 단백질은 선별가능한 마커로서 사용될 수 있다. 본 발명에 따른 폴리뉴클레오티드를 함유하는 트랜스펙턴트(transfectant)는 당업자들에게 잘 알려진 방법으로, FACS에서 형광의 선명함에 의해 구분될 수 있고, 여기서 선별가능한 마커는 GFP를 코드화한다. 본 발명의 폴리뉴클레오티드를 사용하고, 그리고 UCOE에 대해 5', 또는 트랜스유전자(발현가능한 핵산)에서 멀리 있는 3' 중 하나에 위치한 선별가능한 마커와 함께 발현가능한 구성물을 비교하는 것으로, 트랜스유전자의 발현의 더욱 고도한 수준은 선명함의 필적하는 수준에서 발견될 것이다. 그러므로, 가장 선명한 세포의 선별법은 트랜스유전자 발현의 가장 높은 수준에서 세포의 선별법을 가능하게 한다.
본 발명의 한 관점에서, 확장된 메틸화-결여 CpG 아일랜드는 5kb 5' 및 1.5kb 3'측면서열을 갖고 인간 hnRNP A2 유전자를 걸쳐 있는 16kb DNA 단편을 포함한다. 바람직하게는, 확장된 메틸화-결여 CpG 아일랜드는 인간 hnRNP A2 유전자를 걸쳐 있는 8kb DNA 단편을 포함한다(WO 00/05393).
대체 가능하게는, 상기 개시된 폴리뉴클레오티드의 확장된 메틸화-결여 CpG 아일랜드는 인간 β-액틴 CpG 아일랜드/프로모터 영역 또는 그것의 단편을 포함하는, 본 발명자들의 동시에 계류중인 출원 GB 0022995.5 및 US 60/252,048에 개시되어 있는 바와 같은 '인공적인 UCOE'이다. 바람직하게는, 이 단편은 100bp 내지 3.0kb의 크기 범위내이고, 인간 β-액틴 CpG 아일랜드/프로모터 영역 또는 그것의 단편을 걸친다. 더욱 바람직하게는, 인간 PDCD2 CpG 아일랜드/프로모터 영역은 100bp 내지 3.0kb의 크기 범위내의 단편을 포함한다. 더욱 더 바람직하게는, 확장된 메틸화-결여 CpG 아일랜드는 인간 β-액틴 CpG 아일랜드/프로모터 영역을 걸쳐 있는 100bp 내지 3.0kb의 크기 범위내에서의 DNA 단편 및 인간 PDCD2 CpG 아일랜드/프로모터 영역을 걸쳐 있는 100bp 내지 3.0kb의 크기 범위내에서의 DNA 단편을 포함한다.
가장 바람직하게는, 본 발명의 구현예의 청구된 폴리뉴클레오티드는 인간 β-액틴 CpG 아일랜드/프로모터 영역을 걸쳐 있는 2.0kb의 DNA 단편 및 인간 PDCD2 CpG 아일랜드/프로모터 영역을 걸쳐 있는 1.8kb의 DNA 단편을 포함한다.
또한, 상기 구현예에서의 어느 하나의 폴리뉴클레오티드를 포함하는 벡터를 제공한다. 상기 벡터는 대체 가능하게는 에피솜의 또는 통합성 벡터 중 하나일 수 잇다. 의도된 용도에 의존하여, 에피솜성 벡터는 그들이 자기복제하고, 통합할 필요없이 되풀이하기 때문에 바람직할 것이다. 이러한 유형의 에피솜성 벡터는 WO98/07876에 기재되어 있다. 또한, 비-복제성, 비-통합성 벡터도 바람직하다.
또한, 본 발명은 선형화되어 염색체로 통합될 때, 확장된 메틸화-결여 CpG 아일랜드, 폴리아데닐화 시그날에 의하여 종결된 발현가능한 핵산, 및 프로모터에 작동가능하게 연결된 선별가능한 마커를 포함하는 폴리뉴클레오티드를 전달하도록 구성된 벡터를 제공하는 것으로, 여기서 CpG 아일랜드와 선별가능한 마커 모두가 상기 발현가능한 핵산에 작동가능하게 연결되고, 상기 구성요소들은, 발현가능한 핵산의 센스 스트랜드에 관하여 5'에서 3'의 배향으로, 확장된 메틸화-결여 CpG 아일랜드, 발현가능한 핵산, 선별가능한 마커의 순서로 배치되고, 그리고 발현가능한 핵산의 3'말단에 폴리아데닐화 시그날이 선별가능한 마커의 인접 말단의 2000bp이내에 있다.
바람직하게는, 상기 벡터는 플라스미드이다. 대체 가능하게는, 상기 벡터는 아데노바이러스, 아데노-관련 바이러스, 헤르페스바이러스, 백시나 바이러스 (vaccina virus), 렌티바이러스(lentivirus), 또는 다른 레트로바이러스와 같은 바이러스일 수 있다.
바람직하게는, 상기 벡터는 진핵세포 유전자 발현에 적응된 발현 벡터이다. 전형적으로 상기 적응은 예를 들어, 이것에 제한되지는 않지만, 세포/조직 특이 발 현을 중재하는, 전사 조정 서열(프로모터 서열)의 공급을 포함한다. 프로모터 및 증폭제는 당업자에게 잘 알려진 용어이고, 하기의 특징을 포함하지만, 여기서 예로써 제공될 뿐이고, 한정하지는 않는다. 프로모터는 전사의 개시에 직접적으로 연결된 5', cis-활동(acting) 조절 서열이다. 프로모터 성분은 전사 개시의 부위를 선별하기 위해 기능화하는, 소위 TATA 박스 및 RNA 폴리머라제 개시 선별법(RIS) 서열을 포함한다. 또한 이들 서열은 특히, RNA 폴리머라제에 의해 전사 개시 선별법을 촉진하는 것을 기능화하는 폴리펩티드를 결합한다.
증폭제 성분은 유전자의 전사 개시부위에 대해 5'에서 종종 발견되는 cis 활동 핵산 서열이다(증폭제는 또한 유전자 서열에 대해 3'에서 발견될 수 있거나 또는 인트론 서열에 위치할 수도 있으므로 위치에 의존하지 않는다). 증폭제는 상기 증폭제가 연결된 유전자의 전사 속도를 증가시키는 기능을 한다. 증폭제 활성은 증폭제 성분에 특별히 결합하는 것을 보여주는 trans 활동 전사 인자(폴리펩티드)에 민감하다. 전사 인자의 결합/활성은, 예로써 제공되지만 이에 한정되지 않는, 중재 대사산물(예를 들어, 글루코스), 환경 영향자(예를 들어, 열)를 포함하는 많은 환경의 자극에 민감하다(참조: Eukaryotic Transcription Factors, by David S Latchman, Academic Press Ltd, San Diego).
또한 적응은 선별가능한 마커의 공급 및 자율 증식 서열을 포함하고, 상기 두 가지 모두는 진핵 세포 또는 원핵 세포 중 하나에서 상기 벡터의 보전을 촉진한다. 진핵세포에서 자율적으로 보전하는 벡터는 에피솜성 벡터로 간주된다. 유전자를 코드화하는 벡터의 발현을 촉진하는 다른 적응은 전사 종결/폴리아데닐화 서열 의 공급을 포함한다. 또한, 이것은 이중시스트론(bicistronic) 또는 다중시스트론(multi-cistronic) 발현 카세트에 준비된 유전자를 코드화하는 벡터의 발현을 최대화하는 기능을 하는 내부 리보솜 도입 부위(IRES)의 공급을 포함한다. 이 적응은 당업자에게는 잘 알려져 있다. 일반적으로 발현 벡터 구성 및 재조합 DNA 기술에 관해서는 상당한 양의 발행된 문헌이 있다. 참조: Sambrook et al (1989) Molecular Cloning: A Laboratory Manual, Cold Spring Harbour Laboratory, Cold Spring Harbour, NY 및 그 외 참고문헌: Marston, F (1987) DNA Cloning Techniques: F M Ausubel et al, Current Protocols in Molecular Biology, John Wiley & Sons, Inc. (1994).
본 발명의 바람직한 구현예에서, 상기 벡터는 상기 폴리펩티드의 정제를 촉진하는 분비 시그날을 코드화하고, 그러므로 상기 폴리펩티드가 제공된다.
대체 가능하게는, 다른 바람직한 구현예는 친화성 태그 또는 에피토프와 같은 발현된 재조합 단백질 또는 효소 균열 부위의 정제를 촉진하는 추가 정화를 포함할 수 있다.
바람직하게는, 발현가능한 핵산은 치료용 핵산이다.
대체 가능하게는, 발현가능한 핵산은 생체외 세포 배양 시스템에서 발현을 위한 재조합 단백질을 코드화한다.
대체 가능하게는, 발현가능한 유전자는 RNA와 같은, 비-폴리펩티드 생성물을 코드화한다. 이러한 RNA는 전사 후(post-transcriptional) 수준에서 특정 유전자의 발현을 억제할 수 있는 안티센스일 수 있거나 또는, 리보솜 RNA와 같이, 효소 또는 다른 기능을 가질 수 있다.
하나의 바람직한 구현예는, 상기 확장된 메틸화-결여 CpG 아일랜드, 폴리아데닐화 시그날 및 프로모터에 작동가능하게 연결된 선별가능한 마커에 의해 종결된 발현가능한 핵산을 포함하는 벡터이고, 여기서, CpG 아일랜드와 선별가능한 마커 둘 다는 상기 발현가능한 핵산에 작동가능하게 연결되어 있고, 그리고 상기 구성요소들은, 상기 발현가능한 핵산의 센스 스트랜드에 관하여 5'에서 3'의 배향으로, 확장된 메틸화-결여 CpG 아일랜드, 발현가능한 핵산, 선별가능한 마커의 순서대로 위치되어 있고, 그리고 발현가능한 핵산의 3'말단에 상기 폴리아데닐화 시그날이 상기 선별가능한 마커의 인접 말단의 2000bp이내에 있다. 바람직하게는, 상기 발현가능한 핵산의 3'말단에 상기 폴리아데닐화 시그날이 상기 선별가능한 마커의 인접 말단의 1500bp이내에 있다. 더욱 바람직하게는, 1000bp이내에 있고, 가장 바람직하게는, 500bp이내에 있다.
바람직한 구현예는, 상기 확장된 메틸화-결여 CpG 아일랜드, 다중 클로닝 부위, Streptomyces종에서 얻은 항생물질 내성 유전자를 포함하는 벡터이고, 여기서 CpG 아일랜드와 선별가능한 마커 둘 다는 상기 다중 클로닝 부위에 작동가능하게 연결되고, 그리고 상기 구성요소들은, 발현가능한 핵산의 센스 스트랜드에 관하여 5'에서 3'의 배향으로, 확장된 메틸화-결여 CpG 아일랜드, 다중 클로닝 부위, 선별가능한 마커의 순서대로 위치되어 있고, 그리고 상기 다중 클로닝 부위는 상기 선별가능한 마커의 인접 말단의 2000bp이내에 있다.
더욱 바람직하게는, 상기 다중 클로닝 부위는 추가로 프로모터에 작동가능하게 연결된다. 더욱 더 바람직하게는 상기 프로모터는 CMV, EF-1α, RSV LTR 또는 HIV2 LTR 또는 그것들로부터 유도된 서열의 조합에서 선택된다. 더욱 바람직하게는, 상기 프로모터는 CMV 직접/초기 프로모터이다. 가장 바람직하게는, 마우스 CMV 즉시/초기 프로모터이다. 바람직한 구현예에서, 상기 벡터는 CMV 프로모터, 다중 클로닝 부위, 폴리아데닐화 서열 및 적합한 대조군 성분하에서 선별가능한 마커를 코드화하는 유전자를 포함한다.
상기 벡터의 바람직한 구현예는 도 10(SEQ ID NO:1)의 서열의 뉴클레오티드 1-10551을 포함한다. 가장 바람직한 구현예는 벡터 CET 710이다. 대체 가능하게는, 상기 벡터는 도 10의 서열의 뉴클레오티드 1-13545를 포함하고, 바람직하게는, 벡터 CET 720이다(SEQ ID NO:2).
벡터의 추가 바람직한 구현예는 하기와 같다:
CET 740은 CET 720의 퓨로마이신 내성 유전자가 Streptomyces fradiae로부터 유래된 아미노글리코사이드 포스포트랜스퍼라제 유전자로 대체된 것이다(도 15(SEQ ID NO:4)에서와 같은). 또한, CET 741과 같이, CET 740의 다중 클로닝 부위로 삽입된 발현가능한 핵산 서열을 갖는 벡터가 바람직하다.
CET 760은 CET 720의 퓨로마이신 내성 유전자가 Escherichia coli로부터 유래된 아미노사이클리톨 포스포트랜스퍼라제 유전자로 대체된 것이다(도 17(SEQ ID NO:7)에서와 같은). 또한, CET 761과 같이, CET 760의 다중 클로닝 부위로 삽입된 발현가능한 핵산 서열을 갖는 벡터가 바람직하다.
CET 780은 CET 720의 퓨로마이신 내성 유전자가 Streptomyces alboniger로부터 유래된 N-아세틸 트랜스퍼라제 유전자의 변형된 형태로 대체된 것이다(도 14(SEQ ID NO:3)에서와 같은). 또한, CET 781과 같이, CET 780의 다중 클로닝 부위로 삽입된 발현가능한 핵산 서열을 갖는 벡터가 바람직하다.
CET 820은 그곳에 삽입된 발현가능한 핵산 서열의 발현을 진행하기 위해 다중 클로닝 부위에 작동가능하게 연결된, 인간 IE CMV 프로모터는 뮤린 IE CMV 프로모터로 대체된 것이다. 또한, CET 821과 같이, CET 820의 다중 클로닝 부위로 삽입된 발현가능한 핵산 서열을 갖는 벡터가 바람직하다.
CET 823은 인간 hnRNP A2 유전자를 걸쳐 있는 8kb DNA 단편을 포함하는 확장된 메틸화-결여 CpG 아일랜드는 뮤린 hnRNP A2 유전자에 걸쳐 있는 8kb 단편을 포함하는 확장된 메틸화-결여 CpG 아일랜드로 대체된 것이다(도 19(SEQ ID NO:15)에서와 같은). 또한, CET 824와 같이, CET 823의 다중 클로닝 부위로 삽입된 발현가능한 핵산 서열을 갖는 벡터가 바람직하다.
또한, 상기 개시된 벡터의 한 구현예와 트랜스펙션된 숙주세포가 제공된다.
대체 가능하게는, 상기 폴리뉴클레오티드, 벡터 또는 숙주세포는 원하는 유전자 생성물의 발현을 얻기 위해 세포 배양 시스템에서 사용될 수 있다. 적합한 세포 배양 시스템은 당업자들에게 잘 알려져 있고, 문헌 전체가 완전히 개시되어 있다. 하기를 포함하는 본 발명에 따른 폴리펩티드의 생산 방법을 제공한다:
ⅰ) 세포를 본 발명에 따른 핵산 분자로 형질도입/트랜스펙션하는 단계;
ⅱ) 상기 폴리펩티드의 제조에 알맞은 조건에서 상기 세포를 성장시키는 단계;
ⅲ) 상기 세포 또는 그것의 성장 환경으로부터 상기 폴리펩티드를 정제하는 단계.
본 발명의 바람직한 구현예에서, 상기 핵산 분자는 본 발명에 따른 벡터이다.
또한, 본 발명은 치료요법에서 사용하기 위해 상기 폴리뉴클레오티드, 벡터 또는 숙주세포를 제공한다.
또한, 본 발명은 유전자 치료요법에서 사용하기 위해 조성물의 제조에서 상기 폴리뉴클레오티드, 벡터 또는 숙주세포의 용도를 제공한다.
또한, 본 발명은 상기 폴리뉴클레오티드, 벡터 또는 숙주세포의 약제학적으로 효과적인 양을 이러한 치료를 필요로 하는 환자에게 투여하는 것을 포함하는, 치료 방법을 제공한다. 바람직하게는, 상기 환자는 유전자 치료요법에 의해 치료가능한 질병의 환자이다.
본 발명은 또한 질병을 치료하거나 또는 유익한 단백질 또는 기능을 특정 조직의 세포에 제공하기 위한 치료 용도를 위하여, 임의로 약학적으로 허용되는 담체 또는 희석제와 혼합하여, 폴리뉴클레오티드 및/또는 벡터 및/또는 숙주세포를 포함하는 약학적 조성물을 제공한다.
본 발명의 폴리뉴클레오티드, 벡터 또는 숙주세포 또는 약제학적인 조성물은 전신 근육내의, 정맥주사의, 에어로졸(aerosol), 경구(고체 또는 액체 형태), 국소적으로(topical), 눈의, 직장의, 복강내의, 및/또는 척수강내의 및 국부적 직접 주사를 포함하는 경로를 통하여 투여될 수 있다.
물론, 정확한 투여량 섭생은 개별적 환자를 위한 개별적 의료진에 의하여 결정되어질 필요가 있을 것이고, 이것은 교대로 흥미있는 유전자에 의하여 발현되는 단백질의 정확한 성질 및 치료 표적이 되는 조직 형태에 의하여 조절될 것이다.
투여량은 또한 질병 징후 및 투여 경로에 대하여 의존적일 것이다. 투여의 횟수는 질병 및 임상 치료로부터 나온 효능 데이터에 의존할 것이다.
본 발명에 의한 효과적인 유전자 치료를 위하여 전달되는 폴리뉴클레오티드 또는 벡터 DNA의 용량은, 체중 ㎏당 벡터 DNA 50ng ~ 1000㎍ 사이의 범위인 것이 바람직하고, ㎏당 벡터 DNA 1 ~ 100㎍ 사이의 범위인 것이 더욱 바람직할 것이다.
생체내 세포 흡수(uptake)를 위하여 포유 동물에 폴리뉴클레오티드, 벡터 또는 숙주세포를 투여하는 것이 본 발명에 의하여 바람직하지만, 엑스 비보(ex vivo) 접근도 세포를 동물로부터 추출하여 폴리뉴클레오티드 또는 벡터로 형질도입하고 그리고 나서 동물로 다시 재이식함에 의해 사용될 수 있다. 예를 들면, 간의 경우 동물로부터 간세포를 추출하여, 생체외에서 간세포를 형질도입 시키고, 동물에 간 세포를 재이식함으로서 엑스 비보 접근에 의하여 접근할 수 있다(토끼에 대하여 Crowdhury et al., Science 254: 1802~1805, 1991, 또는 인간에 대하여 Wilson, Hum. Gene Ther. 3:179~222, 1992에 명시된 바와 같이). 그러한 방법은 또한 적혈구, T세포, B 세포 및 조혈 골수세포와 같은 순환계 또는 림프계의 다양한 세대의 세포로의 전달을 위하여 효과적일 수 있다.
본 발명의 또 다른 관점은 자연적으로는 작동가능하게 연결되지 않는, 발현가능한 유전자에 작동가능하게 연결된 첫 번째 프로모터를 포함하는 단리된 폴리뉴 클레오티드 및 pgk 프로모터 및 퓨로마이신 내성 유전자를 포함하는, 발현가능한 유전자에 대해 3'에 작동가능하게 연결된 선별가능한 성분을 제공한다. 또한, 두 가지 이상의 조직 또는 세포조직에서 상기 발현가능한 유전자의 재현성의 발현을 얻기 위한 이러한 폴리뉴클레오티드의 용도가 제공된다.
본 발명의 또 다른 구현예에서는, 인공적으로 도입되는 확장된 메틸화-결여 CpG 아일랜드 요소 및 인공적으로 도입되는 선별가능한 마커 성분을 포함하는 비-인간 트랜스제닉 동물을 제공하고, 여기서 두 성분 모두는 그들 사이에 위치한 발현가능한 유전자에 작동가능하게 연결되고, 여기서 상기 발현가능한 유전자의 재현성의 발현은 두 가지 이상의 조직 또는 세포 유형에서 발생한다. 트랜스제닉 마우스를 제조하는 방법(Gordon et al., Proc. Natl. Acad. Sci. USA 77:7380(1980); Harbers et al., Nature 293:540(1981); Wagner et al., Proc. Natl. Acad. Sci. USA 78:5016(1981); 및 Wagner et al., Proc. Natl. Acad. Sci. USA 78:6376(1981), 트랜스제닉 양, 돼지, 닭을 제조하는 방법(Hammer et al., Nature 315: 680(1985)을 참고하라) 등은 당업계에 잘 알려져 있고, 본 발명에 따른 사용을 위하여 고려된다.
본 발명의 폴리뉴클레오티드를 함유하는 이러한 트랜스제닉 동물은 또한 중요한 단백질의 장기간 생산을 위하여 사용될 수 있다.
또한, 본 발명의 폴리뉴클레오티드, 벡터 또는 숙주세포를 사용하여 유전자 치료요법의 효율을 측정하기 위한 포유동물 모형을 제공한다. 상기 포유동물 모형은 트랜스제닉 동물을 포함하고, 그의 세포는 본 발명의 벡터를 함유한다. 이러한 동물은 인간의 임상 단계 이전의 시험을 허용한다.
본 발명은 또한 트랜스제닉 식물의 제조를 위한 본 발명의 폴리뉴클레오티드의 용도를 제공한다.
수율 또는 질병, 전염병, 가뭄 또는 염에 대한 내성 등이 증가한 트랜스제닉 식물의 생산은 당업자들에게 잘 알려져 있다. 본 발명은 또한 본 발명의 폴리뉴클레오티드를 함유하는 세포를 함유하는 트랜스제닉 식물을 제공한다. 인공적 UCOE를 포함하는 세포의 일부 또는 전부는 식물로부터 기원될 수 있다.
본 발명은 또한 기능 유전체학 응용(functional genomics application)에서의 본 발명의 폴리뉴클레오티드의 용도에 관한 것이다. 기능 유전체학은 원칙적으로 특정한 세포형, 또는 질병 상태에서 특이적으로 발현되는 유전자들의 동정화에 관한 것이고, 지금은 신약 개발 또는 유전자 치료 목적을 위하여 잠재적으로 흥미있는 수천개의 신규 유전자 서열을 제공한다. 신규한 치료법의 개발을 위하여 이 정보를 사용함에 있어서 주요한 문제점은 이들 유전자의 기능을 어떻게 결정하느냐에 있다. 본 발명의 폴리펩티드는 유전자 서열의 기능을 결정하기 위하여, 수많은 기능 유전체학 응용을 위하여 사용될 수 있다. 본 발명에 대한 기능유전체학 응용은, 제한되지는 않으나 다음의 것들을 포함한다:
(1) 유전자 서열의 안티센스 버젼 또는 리보자임 녹다운(knockdown) 라이브러리의 지속된 발현을 성취하여, 세포 표현형에서의 유전자 불활성화 효과를 결정하기 위하여 본 발명의 폴리뉴클레오티드를 사용하는 것,
(2) 세포로의 그 전달이 유전자 서열의 믿을만하고, 재현성의, 지속된 발현 을 가져오도록, 유전자 서열을 위한 발현 라이브러리를 제조하기 위해 본 발명의 폴리뉴클레오티드를 사용하는 것. 유전자 서열을 발현하는, 결과적으로 생성된 세포는 기능 결정 및 신약 개발에 대한 다양한 접근에 사용될 수 있다. 예를 들면, 유전자 생성물에 대한 중화 항체의 유발; 구조적인, 기능적인, 또는 신약 선별 연구에서, 또는 세포계 신약 선별에서 사용하기 위한 유전자 자체의 단백질 생성물의 신속한 정제 등이 있다.
(3) 마우스 줄기 세포(ES 세포) 및 트랜스제닉 마우스와 관계되는 연구에서 본 발명의 폴리뉴클레오티드의 사용하는 것. 가장 강력한 기능유전체학 접근 중 하나는, 발현된 유전자로의 삽입 후에만 약물 선별을 가능하게 하며 서열화를 위하여 쉽게 구제할 수 있는 구성물을, 마우스 ES 세포의 유전자 내로 무작위적으로 삽입하는 것에 관한 것이다(G.Hiks et al., Nature Genetics, 16, 338~334). 그리고 나서, 신규한 서열을 가진 유전자에 녹아웃(knockout) 돌연변이를 가진 트랜스제닉 마우스는 쉽게 그들의 기능을 탐지되도록 만들어질 수 있다. 현재 이들 기술은 마우스 ES 세포에서 잘 발현되는 마우스 유전자의 10%에서 잘 이용된다. 통합화 구조체로의 본 발명의 폴리뉴클레오티드의 삽입은, 이 기술이 마우스에서 발현된 모든 유전자를 동정하는데까지 확장되게 할 것이다.
본 발명은 이제 하기의 수반된 도면을 참조하여 예시의 목적으로 설명될 것이다.
도 1은 '빈(empty)' 벡터 CET 200.1, 210, 710 및 720의 지도를 나타낸 도이 다. 다중클로닝 부위로의 증폭된 녹색 형광 단백질(EGFP) 유전자의 삽입은 개별적으로 CET 230, 711 및 721을 가져온다. 모든 벡터는 삽입된 유전자가 발현되는 CMV 프로모터를 함유한다. 하지만, CET 210(및 그것의 EGFP-발현 유도체, CET230)의 경우에는, 이러한 삽입된 유전자가 플라스미드에서 UCOE 및 pgk/퓨로마이신 내성 성분에 의해 측면에 위치될지라도, 후자는 즉시에 인접하지 않는다. 더욱 중요하게는, 트랜스펙션 전에 플라스미드를 선형화하기 위해 사용된 PvuⅠ 부위에 의해 분리된다. 숙주세포 염색체로 통합된 후, 이것은 UCOE 및 pgk/퓨로마이신 내성 성분 모두가 상기 유전자의 같은 쪽에서 통합되기 때문에, 유전자가 더 이상 측면에 위치하지 않는 것을 보여준다. CET 710(및 그것의 EGFP-발현 유도체, CET 711) 및 CET 720(및 그것의 EGFP-발현 유도체, CET 721)의 경우에는, PvuⅠ의 선형화는 한 쪽에서는 UCOE 그리고 다른 한 쪽에서는 pgk/퓨로마이신 내성 성분에 의해 밀접하게 측면에 위치되어 있는 유전자의 통합을 보여준다. CET 710(및 CET 711)이 '인공적인' β-액틴/PDCD2-유도된 UCOE를 수행하는 반면에, CET 210(및 CET 230) 및 CET 720(및 CET 721)은 hnRNP-유도된 UCOEs를 수행한다.
도 2는 트랜스펙션 후 지정된 날에 측정된 FACS 분석에서 중심 형광에 의해 측정함으로써, CHO-K1 세포로 트랜스펙션된 여러가지 벡터로부터의 EGFP의 발현을 나타낸 도이다. 'EGFP'는 대조군(pEGFP) 비-UCOE 함유 플라스미드로 트랜스펙션된 세포를 표현한다. CET 220은 상기 EGFP 발현 유니트가 pgk/퓨로마이신 내성 성분이 아니라 hnRNP-유도된 UCOE에 작동가능하게 연결된 플라스미드로 트랜스펙션된 세포를 나타낸다. 그 대신에 SV40/네오마이신 내성 성분이 사용된다. 남은 세포는 CET 230, 711 또는 721로 트랜스펙션되고, 그 구조는 도 1에서 나타내었다.
도 3은 감염 후 지정된 날에 발현에 양성이라고 판단된, 도 2에서 나타낸 세포의 개체군의 비율을 나타낸 도이다.
도 4는 FACScan의 탐지 능력을 초과하지 않고 대조하게 하도록 조정된 중심 형광에 의해 측정함으로써, 벡터 CET 200, 230, 721 및 711로 트랜스펙션된 CHO-K1 세포에서 EGFP의 발현을 나타낸 도이다. 이것은 발현가능한 트랜스유전자(EGFP)에 대해 5'(CET 230) 또는 3'(CET 721) 중 하나에 선별가능한 마커(puro')을 대체하는 비교 효과를 명백하게 나타낸다.
도 5는 FACScan의 탐지 능력을 초과하지 않고 대조하게 하도록 조정된 중심 형광에 의해 측정함으로써, 벡터 CET 701, 721, 704, 741, 705, 751, 706, 761, 708 및 781로 트랜스펙션된 CHO-K1 세포에서 EGFP의 발현을 나타낸 도이다.
도 6은 3' 퓨로마이신 내성 유전자와 함께 5' 인간 및 뮤린 hnRNP UCOEs를 비교하는 벡터로 트랜스펙션된 CHO-K1 세포에서 EGFP의 발현 수준을 나타낸다.
도 7은 EGFP 발현에서 Streptomyces 네오마이신 내성 유전자의 위치효과를 나타낸 도이다. CET 741은 트랜스유전자의 3'에 선별가능한 마커를 갖고, CET 745는 트랜스유전자 및 UCOE의 5'에 마커를 가진다. UCOE는 두 가지 모든 경우에서는 인간 RNP UCOE이다.
도 8은 플라스미드 CET 700의 지도를 나타낸 도이다.
도 9는 플라스미드 CET 710의 지도를 나타낸 도이다.
도 10은 CET 710의 뉴클레오티드 서열을 나타낸 도이다(SEQ ID NO:1).
도 11은 플라스미드 CET 720의 지도를 나타낸 도이다.
도 12는 CET 720의 뉴클레오티드 서열을 나타낸 도이다(SEQ ID NO:2).
도 13은 야생형 S. alboniger 퓨로마이신 N-아세틸 트랜스퍼라제 유전자의 뉴클레오티드 서열을 나타낸 도이다(SEQ ID NO:5).
도 14는 변형된 S. alboniger 퓨로마이신 N-아세틸 트랜스퍼라제 유전자의 뉴클레오티드 서열을 나타낸 도이다(SEQ ID NO:3).
도 15는 S. fradiae 아미노글리코사이드 포스포트랜스퍼라제 유전자의 뉴클레오티드 서열을 나타낸 도이다(SEQ ID NO:4).
도 16은 S. hygroscopicus 하이그로마이신 포스포트랜스퍼라제 유전자의 뉴클레오티드 서열을 나타낸 도이다(SEQ ID NO:6).
도 17은 E. coli 아미노사이클리톨 포스포트랜스퍼라제(hygro') 유전자의 뉴클레오티드 서열을 나타낸 도이다(SEQ ID NO:7).
도 18은 트랜스포솜 Tn5(Klebsiella pneumoniae)네오마이신 포스포트랜스퍼라제 유전자의 뉴클레오티드 서열을 나타낸 도이다(SEQ ID NO:8).
도 19는 마우스 hnRNP A2 HindⅢ 단편의 뉴클레오티드 서열을 나타낸 도이다(SEQ ID NO:15).
도 20은 플라스미드 CET 1010의 지도를 나타낸 도이다.
도 21은 CET 1010의 뉴클레오티드 서열을 나타낸 도이다(SEQ ID NO:9).
도 22는 플라스미드 CET 1020의 지도를 나타낸 도이다.
도 23은 CET 1020의 뉴클레오티드 서열을 나타낸 도이다(SEQ ID NO:10).
도 24는 플라스미드 CET 1030의 지도를 나타낸 도이다.
도 25는 CET 1030의 뉴클레오티드 서열을 나타낸 도이다(SEQ ID NO:11).
도 26은 플라스미드 CET 1110의 지도를 나타낸 도이다.
도 27은 CET 1110의 뉴클레오티드 서열을 나타낸 도이다(SEQ ID NO:12).
도 28은 플라스미드 CET 1120의 지도를 나타낸 도이다.
도 29는 CET 1120의 뉴클레오티드 서열을 나타낸 도이다(SEQ ID NO:13).
도 30은 플라스미드 CET 1130의 지도를 나타낸 도이다.
도 31은 CET 1130의 뉴클레오티드 서열을 나타낸 도이다(SEQ ID NO:14).
실시예 1 UCOEs 및 선별가능한 성분으로 발현가능한 유전자의 측면위치화
재료 및 방법
PGK-Puro CET 발현 벡터의 구성
CET 700
CMV-MCS-SV40pA 카세트를 AseⅠ/AflⅡ 단편으로 CET 31(A CMV MCS pA SV40Neo 기저 플라스미드)에서 제거하고, T4 DNA 폴리머라제로 필링화(filling)하여 블런트(blunt) 말단이도록 하고, EcoRV로 소화된 pPGK-Puro(pBluescript에서 mPGK 프로모터, 퓨로마이신 내성 유전자, bGHpA)로 결찰하였다.
CET 720
CET 20(pBluescript에서의 8.3kb hnRNPA2 단편)을 HindⅢ로 소화하여 8kb RNP UCOE를 얻은 다음, 이것을 HindⅢ로 잘린 CET 700으로 결찰하였다.
CET 710
인공적인 UCOE를 XbaⅠ/ClaⅠ 단편으로서 CET 21(pBluescript에서의 인공적인 UCOE)에서 제거하고, T4 DNA 폴리머라제로 필링화(filling)하여 블런트(blunt) 말단이도록 하고, HindⅢ로 소화된 CET 700으로 결찰하고 다시 T4 DNA 폴리머라제로 필링화(filling)하여 블런트(blunt) 말단이도록 하였다.
CET 230
이 벡터는 NarⅠ 및 EcoRⅠ으로 pUC19를 소화하여 대략 160bp를 제거한 다음, 블런팅하고 재결찰하는 것으로 구성된다. 이것은 벡터 백본(backbone)에서 PvuⅠ 및 PvuⅡ부위 중 한 곳을 제거하였다. CMV-EGFP-SV40pA 카세트(그것의 MCS 결손된)를 AseⅠ/AflⅡ 소화물(digest)로 pEGFPN-1(Clontech)에서 절개한 다음, 필링화(filling)하여 블런트(blunt) 말단이도록 하고, NdeⅠ 및 Eco109Ⅰ로 소화되어진 pUC19 벡터 백본 속으로 삽입하고 필링화(filling)하여 블런트(blunt) 말단이도록 하였다.
그런 다음, 필링화된 EcoRⅠ/XhoⅠ블런트 말단의 단편으로, PGK-Puro-bGpA 카세트를 pPGK-Puro에서 제거한 다음, 상기 벡터의 유일한 PvuⅡ 부위로 삽입하였다. 마지막으로 8.3kb hnRNP A2 단편은 CET 20에서 유도된 HindⅢ 단편으로서 이 벡터의 유일한 HindⅢ 단편으로 삽입되었다.
분명하게 하기 위해서:
CET 230은 '빈' 벡터 CET 210의 EGFP-발현형이다.
CET 711은 '빈' 벡터 CET 710의 EGFP-발현형이다.
CET 721은 '빈' 벡터 CET 720의 EGFP-발현형이다.
다른 항생물질 내성 유전자를 갖고 대체 가능한 프로모터 또는 UCOEs를 갖는 CET 720에 기저한 벡터는 하기 방법으로 구성될 수 있다. PGK 프로모터(bp 11384-11894) 및 bghpA(bp 12567-12893)는 제한 소화로 CET 720에서 제거될 수 있다. 이들 성분은 pBluescript 백본으로 삽입될 수 있고, 이러한 제한 부위는 그 유전자를 발현하기 위한 방법에서, PGK 프로모터 및 bghpA 사이에서 어느 내성 유전자 서열(PCR 또는 제한 소화에 의해 유도된)의 삽입에 유용하다. 또한, CMV-MCS-SV40pA 발현 카세트는 CET 720(bp 10533-11380)에서 제거될 수 있고, 상기 벡터에서 PGK 프로모터에 대해 5'으로 삽입될 수 있다; 대체 가능하게는 mCMV-MCS-SV40pA 발현 카세트는 상기 위치(CET 801, 821,824-EGFP 발현형)에서 위치될 수 있다. hnRNPA2 UCOE는 제한 효소에 의해 CET 720(bp 2240-10525)에서 제거될 수 있고, 상기 벡터에서 CMV 발현 카세트에 대해 5'에 삽입될 수 있고, 대체 가능하게는 다른 UCOEs(예를 들면, 뮤린 hnRNPA2)는 동일한 위치(CET 824-EGFP 발현 벡터)로 삽입될 수 있다.
분명하게 하기 위해서:
CET 741은 '빈' 벡터 CET 740의 EGFP-발현형이고, 5' 인간 RNP UCOE 및 3' S fradiae neo' 유전자를 포함한다.
CET 761은 '빈' 벡터 CET 760의 EGFP-발현형이고, 5' 인간 RNP UCOE 및 3' E. coli 아미노사이클리톨 포스포트랜스퍼라제(hygro') 유전자를 포함한다.
CET 781은 '빈' 벡터 CET 780의 EGFP-발현형이고, 5' 인간 RNP UCOE 및 3' 변형 S. alboniger 퓨로마이신 N-아세틸 트랜스퍼라제 유전자를 포함한다.
CET 821은 '빈' 벡터 CET 820의 EGFP-발현형이고, 5' 인간 RNP UCOE 및 3' 야생형 S. alboniger 퓨로마이신 N-아세틸 트랜스퍼라제 유전자를 포함한다. EGFP 트랜스유전자의 발현은 뮤린(인간보다는) CMV IE 프로모터에 의해 진행된다.
CET 824는 '빈' 벡터 CET 823의 EGFP-발현형이고, 5' 뮤린(인간보다는) RNP UCOE 및 3' 야생형 S. alboniger 퓨로마이신 N-아세틸 트랜스퍼라제 유전자를 포함한다.
pCIA 벡터
이것은 염색체로 통합된 경우에, 최종적으로 최상의 배치를 갖는 UCOE 발현 벡터(UCOE-발현 카세트-내성 카세트)의 구성을 쉽게 가능하게 하는 벡터시리즈이다.
CET 900은 드문 제한 부위의 쌍이 MCS를 측면에 위치된 빈 클로닝 벡터이다. CET 901 및 CET 902는 hCMV 및 mCMV 프로모터를, 개별적으로, MCS 및 SV40pA를 포함한다, 또한, 드문 제한 부위의 동일한 쌍은 이들 카세트를 측면에서 고정화한다.
벡터의 CET 1000 시리즈는 UCOEs 및 내성 발현 카세트의 다양한 조합을 함유한다. 또한, 그것들은 UCOE에 대하여 3' 및 내성 카세트에 대하여 5' 위치에서의 CET 900시리즈와 같이 동일한 드문 제한 부위를 함유한다. 또한, 상기 벡터는 UCOE에 대하여 5' 및 내성 카세트에 대하여 3' 선형화 부위를 함유한다.
그러므로, 어느 트랜스유전자에 대한 발현 카세트는 CET 900시리즈에서 구성될 수 있고, 그런 다음 CET 1000시리즈로 쉽게 전달될 수 있으므로 염색체로 통합 되는 경우에 최종 배치가 원하는 UCOE-발현 카세트-내성 카세트이다.
상기 항생물질 유전자는 제한 소화 또는 PCR에 의해 CET 1000시리즈에서 교환될 수 있다.
트랜스펙션
CHO K1 세포를 트랜스펙션하고, 표준적인 방법에 따라서 선별하고, 참고문헌으로 사용되는 동시에 계류중인 출원에서 기재하였다.
결과
도 2를 특히 참조로 하여, CET 721 및 CET 230으로 트랜스펙션된 세포의 비교는 CET 721로 얻어진 발현의 일관되게 높은 수준을 나타낸다. 이들 두 벡터는 두 가지 모두가 CMV 프로모터로 진행된 EGFP 유전자에 작동가능하게 연결된 8kb hnRNP-유도된 UCOE을 갖고, 모두는 pgk/퓨로마이신 내성 유전자 성분을 운반한다. 하지만, PvuⅠ로의 선형화에 이어서, 숙주세포 염색체 속의 CET 230의 통합은 pgk/Puro, hnRNP UCOE, EGFP 유전자의 순서대로 위치된다. CET 721과 동일한 방법은 UCOE 및 pgk/Puro에 의해 측면에 위치되어 있는 EGFP 유전자를 나타낸다. CET 230을 이용하여 얻어진 발현의 수준은 CET 220을 이용하여 얻어진 것들보다 현저하게 더 높지는 않고, 이 벡터는 어떠한 pgk/Puro 성분도 갖지 않는 반면에, 동일한 UCOE 및 EGFP 발현을 유도하는 프로모터를 갖는다. 벡터를 갖는 모든 UCOE는 기본 EGFP 발현 플라스미드와 비교하여 대단히 증가된 발현을 나타낸다.
또한, 도 3은 중심 형광에 의하여 발현된 바와 같이 증가된 발현은, 발현에 관점에서, 트랜스펙션 후에 모든 시간 지점에서 양성이라고 판단되는 트랜스펙션된 개체군 안에서의 세포의 증가된 개체군에 반영된다. 구성물의 무작위 통합이 일반적으로 트랜스펙션된 세포의 (비-클로날)개체군에서의 발현 수준 범위에 나타나므로, 이것은 위치효과의 결핍의 측정이다. 이것은 5' UCOE 및 3' 선별가능한 성분의 조합으로 극복되고, 균일하고, 고도로 발현하는 개체군으로 나타낸다.
도 2에서 세포의 풀(pool) 중 일부의 발현 수준은 생산된 형광이 탐지기의 용량을 초과할 정도로 높다.
도 4에서, 측정은 구성물 사이의 비교를 가능하도록 탐지기 반응의 선형 영역에 대하여 교정된 것이다. 이것은 UCOE 및 CET 721에서 사용된 3' 측면의 사용가능한 성분의 조합이, UCOE 단독으로 사용하여 얻어진 것(CET220) 또는 UCOE에 대해 5' 위치된 선별가능한 성분(puro')을 이용하여 얻어진 것과 비교한 바와 같이, EGFP의 발현 수준에서 대략 7배로 증가되어 생산된다는 것을 보여준다. 이것은 UCOE 및 선별가능한 마커로 상기 발현된 트랜스유전자를 측면에 위치하는 것이 발현에서의 상승을 얻는 데 필요하다는 것이 명백하다.
이 효과는 특정 선별가능한 마커에 제한되지 않는다. 도 7은 5' 인간 RNP UCOE에 작동가능하게 연결된 EGFP의 발현 및 5'(CET 745) 또는 3'(CET 741) 위치된 S. fradiae 네오마이신 내성 유전자 중 하나를 비교한다. 기존의 높은 발현 수준의 거의 2배이다.
실시예 2 . 다른 3' 측면의 선별가능한 마커의 효율성
결과
도 5는 5' 인간 RNP UCOE 및 다양한 3' 측면의 항생물질 내성 유전자를 이용 한 EGFP 트랜스유전자의 측면에의 위치효과를 나타냈다. CET 701은 어떤 UCOE도 함유하지 않지만, 야생형 S alboniger puro'를 함유하는 대조군이다. CET 721은 5' UCOE 및 3' puro' 모두를 갖는다. CET 704는 S fradiae neo'를 함유하지만 UCOE를 함유하지 않고, CET 741은 모두를 함유한다. CET 708은 코돈변형된 puro'를 갖지만 UCOE를 갖지 않고, CET 781은 모두를 갖는다. 모든 경우에서 3'측면의 내성 유전자의 상승 효과는 명백하다.
실시예 3 다른 UCOEs 및 Puro 선별가능한 성분의 조합
결과
도 2 및 3에서 나타낸 바와 같이, 인공적으로 구성된 UCOE(CET711)를 갖는 비교가능한 플라스미드로부터의 발현은 중심 형광 및 양성 세포의 비율의 관점 모두에서 RNP UCOE를 이용하여 얻어진 것과 비교될 수 있다. 이것은 두 번째 측면의 CpG-풍부한 성분에 의한 UCOE 영향의 증폭 현상은 일반적인 것이고, RNP UCOE 및 pgk/Puro 성분의 특정한 조합에 한정되지는 않는다. 도 4에서 CET 711 및 CET 721 발현의 비교는 발현의 약간 낮은 수준의 CET 711을 사용하여 얻지만, 이것은 아직도 UCOE 단독으로 사용하여 얻어진 것보다 적어도 6배 더 높다.
도 6은 발현(CET 821)을 진행하기 위해서 뮤린 CMV 프로모터를 사용하는 인간 hnRNP UCOE 및 뮤린 등가물(CET 824) 중 하나를 사용하여 얻어진 비교가능한 효과를 나타낸다. CET 721은 인간 hnRNP UCOE을 포함하고, 인간 CMV 프로모터를 사용한다.
SEQUENCE LISTING <110> Cobra Therapeutics Limited Crombie, Robert Lachlan Williams, Steven Geraint <120> Improved Gene Expression <130> P21363WO <140> PCT/GB02/01479 <141> 2002-04-05 <150> 60/298,675 <151> 2001-06-15 <150> 60/281,605 <151> 2001-04-05 <150> 0109335.0 <151> 2001-04-17 <160> 15 <170> PatentIn version 3.1 <210> 1 <211> 10551 <212> DNA <213> Artificial Sequence <220> <223> Plasmid <400> 1 ggtggcactt ttcggggaaa tgtgcgcgga acccctattt gtttattttt ctaaatacat 60 tcaaatatgt atccgctcat gagacaataa ccctgataaa tgcttcaata atattgaaaa 120 aggaagagta tgagtattca acatttccgt gtcgccctta ttcccttttt tgcggcattt 180 tgccttcctg tttttgctca cccagaaacg ctggtgaaag taaaagatgc tgaagatcag 240 ttgggtgcac gagtgggtta catcgaactg gatctcaaca gcggtaagat ccttgagagt 300 tttcgccccg aagaacgttt tccaatgatg agcactttta aagttctgct atgtggcgcg 360 gtattatccc gtattgacgc cgggcaagag caactcggtc gccgcataca ctattctcag 420 aatgacttgg ttgagtactc accagtcaca gaaaagcatc ttacggatgg catgacagta 480 agagaattat gcagtgctgc cataaccatg agtgataaca ctgcggccaa cttacttctg 540 acaacgatcg gaggaccgaa ggagctaacc gcttttttgc acaacatggg ggatcatgta 600 actcgccttg atcgttggga accggagctg aatgaagcca taccaaacga cgagcgtgac 660 accacgatgc ctgtagcaat ggcaacaacg ttgcgcaaac tattaactgg cgaactactt 720 actctagctt cccggcaaca attaatagac tggatggagg cggataaagt tgcaggacca 780 cttctgcgct cggcccttcc ggctggctgg tttattgctg ataaatctgg agccggtgag 840 cgtgggtctc gcggtatcat tgcagcactg gggccagatg gtaagccctc ccgtatcgta 900 gttatctaca cgacggggag tcaggcaact atggatgaac gaaatagaca gatcgctgag 960 ataggtgcct cactgattaa gcattggtaa ctgtcagacc aagtttactc atatatactt 1020 tagattgatt taaaacttca tttttaattt aaaaggatct aggtgaagat cctttttgat 1080 aatctcatga ccaaaatccc ttaacgtgag ttttcgttcc actgagcgtc agaccccgta 1140 gaaaagatca aaggatcttc ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa 1200 acaaaaaaac caccgctacc agcggtggtt tgtttgccgg atcaagagct accaactctt 1260 tttccgaagg taactggctt cagcagagcg cagataccaa atactgtcct tctagtgtag 1320 ccgtagttag gccaccactt caagaactct gtagcaccgc ctacatacct cgctctgcta 1380 atcctgttac cagtggctgc tgccagtggc gataagtcgt gtcttaccgg gttggactca 1440 agacgatagt taccggataa ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag 1500 cccagcttgg agcgaacgac ctacaccgaa ctgagatacc tacagcgtga gctatgagaa 1560 agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga 1620 acaggagagc gcacgaggga gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc 1680 gggtttcgcc acctctgact tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc 1740 ctatggaaaa acgccagcaa cgcggccttt ttacggttcc tggccttttg ctggcctttt 1800 gctcacatgt tctttcctgc gttatcccct gattctgtgg ataaccgtat taccgccttt 1860 gagtgagctg ataccgctcg ccgcagccga acgaccgagc gcagcgagtc agtgagcgag 1920 gaagcggaag agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa 1980 tgcagctggc acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat 2040 gtgagttagc tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg 2100 ttgtgtggaa ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac 2160 gccaagcgcg caattaaccc tcactaaagg gaacaaaagc tgggtaccgg gccccccctc 2220 gaggtcgacg gtatcgataa gctcgataag ctcatggcac ctgtattgta ctcttatcag 2280 tcattatatg gactttaact tccccagata ttatttgggc tcctccataa gactgtgagc 2340 atctgaccac tggagtgttg cttcccatta tatccctgtt atcaagcaca aggtcaggca 2400 cagagtaaga ctcaaaacat gttttggaat gtatgactgg tatgaactac aaaccagtaa 2460 gctgatgttt tcattttgag tctataaatc taattttgtg gtggttttgt gtatggctca 2520 aggctcaaat tgtaaaattt aatattatgt gaccaaagaa agttataccc agaacctcaa 2580 tttcctcacc ttcaaaatgg ggcagtttct cactcattgg tctgctgtca cgattttaat 2640 gagctcatgc acaaacagcc ctttatataa ggtaagtgct ggataaatgt tggctactat 2700 aataaaataa gcctctaaga tacttggtca gcacaagtac tacccaagag tatgcactgt 2760 aagtaaactg acaaaattgt gtatctaaaa ctggccagat gaaagagaaa cttttaaggg 2820 gcccttctgc gtgcccgaca ctgtgctagg cactcacact atcccgaccc gagaaaccga 2880 tctgcgaccc agaggaactt accaagcctc cagcatcttg tgcagcccta ctcatgggac 2940 catctggata cccacccttg tctttacagg gagcagaaca cacctcttat gtgtcagaaa 3000 acaaagtcca ggaagtatat ttttacctga ggcaatatct gaaaattgta tgctacagcc 3060 tccaaagtga gtcttcctct cagtacctct cttctaggca catggagccc tttcttccaa 3120 gtattatgtt taaccactta atgaatgaag tcctgaaact gcttacccat gctccctata 3180 atctctgagt aatcttcctt ttccacaacc tcaggcataa tctcatcttc tgtttctatt 3240 acaatttcaa attctggaaa aaggaagttg tggtctggaa ttatatggtc cagatgatct 3300 gaaacaaaaa ggacagcact attagtaatc atttagtttt gaagacagtc taataatttg 3360 ctgtctctaa agtactatat tccctatagt tctggcattt tagataaagg gtcataaatt 3420 aaatgcctat atggtgacat tattcagtga ttcagacttc acagcctttt tttttttttt 3480 acaaaggtgt tccaggcatg aaaaatttta aagtactata cctttcctaa ttttaccttt 3540 aaagttgtcc tggaaatatc tgggttgaca aaggcgatga aactgaactg agacttaaaa 3600 aaaagattac ccacctggtt gtgcacaagc ctgcttatgt cccaatctcc agtctagggt 3660 ctgatgctcc ttgctgcagt aatatgcttt gtggcatctg gagcacgttt tggggcctaa 3720 acagccacaa accctgcaga gatgagcacc agacttaagc tggagacaca ctgattctcc 3780 tgtttctggg ggaggattct cagaaggtgg ctcatatgag taaaaatcgt ttttcctggg 3840 tagttgattc ctaaaaacta aaaaagaata cagagaaaag ttttatcttc aaacaaaaca 3900 gcaattcaca tattttatcc tctgcacgta aaactgaaaa taacaacaac aaaaaagaaa 3960 tgaaagtttt tgctttcagg aataagcttt taaaatccag aaactagatt tcgtccggta 4020 cacgcaactg agttgcctcc tagaggtggt ttgagttaat caaattaata agactgatcg 4080 ttaagaacga ctgccaaaaa tacgaaaaag ctactgggat ccatctttcc aagacaattt 4140 ctattatctg aattaacacc atacctggta cccactgatt aaaagctggg ggttaccaat 4200 gcgcgtgggc acagttagaa gcttatgtag caaaaatgag cacatcctgg aagggcccgg 4260 gagaaggtgc tcctggggca gcgcggagag ggagctctga ggctggggcg gcagcggtgc 4320 ttgccgccgt ccccctggtc gctcccggaa ttaacgccgc gcacgcgtcg gaggcatggc 4380 cccgtcccga ccccgtttgg cggctcacct cgcaggccgg cacagcacgg ctgctcgcgg 4440 cagcagaaga ggaagatgca gcggtggaag gcgtccgggc ggccaggcag cggcgcatac 4500 acctgcagca ggaaggagag cgggcggccg cacagctcgc aggccagggc ctggggcccc 4560 ggcagcccgg ccgcgcccag ccatgccggc cgcccgccca ccttgctggg gaactgctcg 4620 ctgcgcagtc gccacgccgg cgccgactcg gcgaagccca gctccacagg cctggccccg 4680 gcggcagcca tgcggggcgc gggctggcgt ggggcgcagc ccacagctgg gtcggaaggc 4740 ggaaatcggg cgccgggccg gaaggcaaga ggcgggcacc tttccggagg acaggaggcg 4800 gaaacgcgtc tgacgggagc ggttgcagga ccaatgcgag ggaacggggc agaggaaacc 4860 tctcggcatc agccccgccc ctggcgcctc tgcctccgag ccgctttcct ggtgcctccg 4920 ggtgctctgg gatggttctg gtctttggga gagtggcagc tggtgacggc gctccgctca 4980 cctctgcaca tgtcttgctg tgggcctgcg ggtggccgcc agggaggcag agccctcccg 5040 caaaccttcc ctgctggtgt ccacctcagg gtgtgggaaa cctgtgcgct ggccgagtgc 5100 taaccaagag taggcagtga aagacaaatg aaggttgaac aggtaaagtg aggaccctac 5160 agcggaaacc aagaatcctg tgtgcctgag agtaatgaag aagcctctgc agaagagtct 5220 tttctgtcag tcttaaggtc tctgttttaa tgttagtgct ggcttgctgt acctgaattc 5280 caagggagga gtgtataatg aggcatggcc aacccccact tcccatcatt gcctgaacta 5340 gtttttcagg ttaacttcag aatgcccttg gtaccgcggg ccccctctgt ggtcccacgc 5400 cactgatcgc tgcatgccca ccacctgggt acacacagtc tgtgattccc ggagcagaac 5460 ggaccctgcc cacccggtct tgtgtgctac tcagtggaca gacccaaggc aagaaagggt 5520 gacaaggaca gggtcttccc aggctggctt tgagttccta gcaccgcccc gcccccaatc 5580 ctctgtggca catggagtct tggtccccag agtcccccag cggcctccag atggtctggg 5640 agggcagttc agctgtggct gcgcatagca gacatacaac ggacggtggg cccagaccca 5700 ggctgtgtag acccagcccc cccgccccgc agtgcctagg tcacccacta acgccccagg 5760 cctggtcttg gctgggcgtg actgttaccc tcaaaagcag gcagctccag ggtaaaaggt 5820 gccctgccct gtagagccca cttccttccc agggctgcgg ctgggtaggt ttgtagcctt 5880 catcacgggc cacctccagc cactggaccg ctggcccctg ccctgtcctg gggagtgtgg 5940 tcctgcgact ctaatggccg caagccacct gactccccca acaccacact ctacctctca 6000 agcccaggtc tctccctagt gacccaccca gcacatttag ctagctgagc cccacagcca 6060 gaggtcctca ggccctgctt tcagggcagt tgctctgaag tcggcaaggg ggagtgactg 6120 cctggccact ccatgccctc caagagctcc ttctgcagga gcgtacagaa cccagggccc 6180 tggcacccgt gcagaccctg gcccacccca cctgggcgct cagtgcccaa gagatgtcca 6240 cacctaggat gtcccgcggt gggtgggggg cccgagagac gggcaggccg ggggcaggcc 6300 tggccatgcg gggccgaacc gggcactgcc cagcgtgggg cgcgggggcc acggcgcgcg 6360 cccccagccc ccgggcccag caccccaagg cggccaacgc caaaactctc cctcctcctc 6420 ttcctcaatc tcgctctcgc tctttttttt tttcgcaaaa ggaggggaga gggggtaaaa 6480 aaatgctgca ctgtgcggcg aagccggtga gtgagcggcg cggggccaat cagcgtgcgc 6540 cgttccgaaa gttgcctttt atggctcgag cggccgcggc ggcgccctat aaaacccagc 6600 ggcgcgacgc gccaccaccg ccgagaccgc gtccgcccgc gagcacagag cctcgccttt 6660 gccgatccgc cgcccgtcca cacccgccgc caggtaagcc cggccagccg accggggcat 6720 gcggccgcgg cccttcgccc gtgcagagcc gccgtctggg ccgcagcggg gggcgcatgg 6780 ggcggaaccg gaccgccgtg gggggcgcgg gagaagcccc tgggcctccg gagatggggg 6840 acaccccacg ccagttcgca ggcgcgaggc cgcgctcggg cgggcgcgct ccgggggtgc 6900 cgctctcggg gcgggggcaa ccggcggggt ctttgtctga gccgggctct tgccaatggg 6960 gatcgcacgg tgggcgcggc gtagcccccg tcaggcccgg tgggggctgg ggcgccatgc 7020 gcgtgcgcgc tggtcctttg ggcgctaact gcgtgcgcgc tgggaattgg cgctaattgc 7080 gcgtgcgcgc tgggactcaa tggcgctaat cgcgcgtgcg ttctggggcc cgggcgcttg 7140 cgccacttcc tgcccgagcc gctggcgccc gagggtgtgg ccgctgcgtg cgcgcgcgcg 7200 acccggtcgc tgtttgaacc gggcggaggc ggggctggcg cccggttggg agggggttgg 7260 ggcctggctt cctgccgcgc gccgcgggga cgcctccgac cagtgtttgc cttttatggt 7320 aataacgcgg ccggcccggc ttcctttgtc cccaatctgg gcgcgcgccg gcgccccctg 7380 gcggcctaag gactcggcgc gccggaagtg gccagggcgg gggcgacttc ggctcacagc 7440 gcgcccggct attctcgcag ctcaccatgc cggtcgccac catgagcttg atatcgaatt 7500 cctgcagccc gggggatcca ctagttctag agcttgatta atagtaatca attacggggt 7560 cattagttca tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc 7620 ctggctgacc gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag 7680 taacgccaat agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc 7740 acttggcagt acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg 7800 gtaaatggcc cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc 7860 agtacatcta cgtattagtc atcgctatta ccatggtgat gcggttttgg cagtacatca 7920 atgggcgtgg atagcggttt gactcacggg gatttccaag tctccacccc attgacgtca 7980 atgggagttt gttttggcac caaaatcaac gggactttcc aaaatgtcgt aacaactccg 8040 ccccattgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata agcagagctg 8100 gtttagtgaa ccgtcagatc cgctagcgtt cgaagtttaa acgcggccgc gactctagat 8160 cataatcagc cataccacat ttgtagaggt tttacttgct ttaaaaaacc tcccacacct 8220 ccccctgaac ctgaaacata aaatgaatgc aattgttgtt gttaacttgt ttattgcagc 8280 ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc 8340 actgcattct agttgtggtt tgtccaaact catcaatgta tcttaaatcg aattctaccg 8400 ggtaggggag gcgcttttcc caaggcagtc tggagcatgc gctttagcag ccccgctggg 8460 cacttggcgc tacacaagtg gcctctggcc tcgcacacat tccacatcca ccggtaggcg 8520 ccaaccggct ccgttctttg gtggcccctt cgcgccacct tctactcctc ccctagtcag 8580 gaagttcccc cccgccccgc agctcgcgtc gtgcaggacg tgacaaatgg aagtagcacg 8640 tctcactagt ctcgtgcaga tggacagcac cgctgagcaa tggaagcggg taggcctttg 8700 gggcagcggc caatagcagc tttgctcctt cgctttctgg gctcagaggc tgggaagggg 8760 tgggtccggg ggcgggctca ggggcgggct caggggcggg gcgggcgccc gaaggtcctc 8820 cggaggcccg gcattctgca cgcttcaaaa gcgcacgtct gccgcgctgt tctcctcttc 8880 ctcatctccg ggcctttcga ccagcttacc atgaccgagt acaagcccac ggtgcgcctc 8940 gccacccgcg acgacgtccc cagggccgta cgcaccctcg ccgccgcgtt cgccgactac 9000 cccgccacgc gccacaccgt cgatccggac cgccacatcg agcgggtcac cgagctgcaa 9060 gaactcttcc tcacgcgcgt cgggctcgac atcggcaagg tgtgggtcgc ggacgacggc 9120 gccgcggtgg cggtctggac cacgccggag agcgtcgaag cgggggcggt gttcgccgag 9180 atcggcccgc gcatggccga gttgagcggt tcccggctgg ccgcgcagaa cagatggaag 9240 gcctcctggc gccgcaccgg cccaaggagc ccgcgtggtt cctggccacc gtcgcgtctc 9300 gcccgaccac cagggcaagg gtctgggcag cgccgtcgtg ctccccggag tggaggcggc 9360 cgagcgcgcc ggggtgcccg ccttcctgga gacctccgcg ccccgcaacc tccccttcta 9420 cgagcggctc ggcttcaccg tcaccgccga cgtcgaggtg cccgaaggac cgcgcacctg 9480 gtgcatgacc cgcaagcccg gtgcctgacg cccgccccac gacccgcagc gcccgaccga 9540 aaggagcgca cgaccccatg catcgtagag ctcgctgatc agcctcgact gtgccttcta 9600 gttgccagcc atctgttgtt tgcccctccc ccgtgccttc cttgaccctg gaaggtgcca 9660 ctcccactgt cctttcctaa taaaatgagg aaattgcatc gcattgtctg agtaggtgtc 9720 attctattct ggggggtggg gtggggcagg acagcaaggg gggggattgg gragacaata 9780 gcaggcatgc tgggggggcg gtgggggcta tggcttctga ggcggaaaga accagctggg 9840 gctcgagatc cactagttct agcctcgagg ctagagcggc cgccaccgcg gtggagctcc 9900 aattcgccct atagtgagtc gtattacgcg cgctcactgg ccgtcgtttt acaacgtcgt 9960 gactgggaaa accctggcgt tacccaactt aatcgccttg cagcacatcc ccctttcgcc 10020 agctggcgta atagcgaaga ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg 10080 aatggcgaat ggaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt 10140 aaatcagctc attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag 10200 aatagaccga gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga 10260 acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg 10320 aaccatcacc ctaatcaagt tttttggggt cgaggtgccg taaagcacta aatcggaacc 10380 ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg 10440 aagggaagaa agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg gtcacgctgc 10500 gcgtaaccac cacacccgcc gcgcttaatg cgccgctaca gggcgcgtca g 10551 <210> 2 <211> 13547 <212> DNA <213> Artificial Sequence <220> <223> Plasmid <400> 2 ggtggcactt ttcggggaaa tgtgcgcgga acccctattt gtttattttt ctaaatacat 60 tcaaatatgt atccgctcat gagacaataa ccctgataaa tgcttcaata atattgaaaa 120 aggaagagta tgagtattca acatttccgt gtcgccctta ttcccttttt tgcggcattt 180 tgccttcctg tttttgctca cccagaaacg ctggtgaaag taaaagatgc tgaagatcag 240 ttgggtgcac gagtgggtta catcgaactg gatctcaaca gcggtaagat ccttgagagt 300 tttcgccccg aagaacgttt tccaatgatg agcactttta aagttctgct atgtggcgcg 360 gtattatccc gtattgacgc cgggcaagag caactcggtc gccgcataca ctattctcag 420 aatgacttgg ttgagtactc accagtcaca gaaaagcatc ttacggatgg catgacagta 480 agagaattat gcagtgctgc cataaccatg agtgataaca ctgcggccaa cttacttctg 540 acaacgatcg gaggaccgaa ggagctaacc gcttttttgc acaacatggg ggatcatgta 600 actcgccttg atcgttggga accggagctg aatgaagcca taccaaacga cgagcgtgac 660 accacgatgc ctgtagcaat ggcaacaacg ttgcgcaaac tattaactgg cgaactactt 720 actctagctt cccggcaaca attaatagac tggatggagg cggataaagt tgcaggacca 780 cttctgcgct cggcccttcc ggctggctgg tttattgctg ataaatctgg agccggtgag 840 cgtgggtctc gcggtatcat tgcagcactg gggccagatg gtaagccctc ccgtatcgta 900 gttatctaca cgacggggag tcaggcaact atggatgaac gaaatagaca gatcgctgag 960 ataggtgcct cactgattaa gcattggtaa ctgtcagacc aagtttactc atatatactt 1020 tagattgatt taaaacttca tttttaattt aaaaggatct aggtgaagat cctttttgat 1080 aatctcatga ccaaaatccc ttaacgtgag ttttcgttcc actgagcgtc agaccccgta 1140 gaaaagatca aaggatcttc ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa 1200 acaaaaaaac caccgctacc agcggtggtt tgtttgccgg atcaagagct accaactctt 1260 tttccgaagg taactggctt cagcagagcg cagataccaa atactgtcct tctagtgtag 1320 ccgtagttag gccaccactt caagaactct gtagcaccgc ctacatacct cgctctgcta 1380 atcctgttac cagtggctgc tgccagtggc gataagtcgt gtcttaccgg gttggactca 1440 agacgatagt taccggataa ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag 1500 cccagcttgg agcgaacgac ctacaccgaa ctgagatacc tacagcgtga gctatgagaa 1560 agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga 1620 acaggagagc gcacgaggga gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc 1680 gggtttcgcc acctctgact tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc 1740 ctatggaaaa acgccagcaa cgcggccttt ttacggttcc tggccttttg ctggcctttt 1800 gctcacatgt tctttcctgc gttatcccct gattctgtgg ataaccgtat taccgccttt 1860 gagtgagctg ataccgctcg ccgcagccga acgaccgagc gcagcgagtc agtgagcgag 1920 gaagcggaag agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa 1980 tgcagctggc acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat 2040 gtgagttagc tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg 2100 ttgtgtggaa ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac 2160 gccaagcgcg caattaaccc tcactaaagg gaacaaaagc tgggtaccgg gccccccctc 2220 gaggtcgacg gtatcgataa gcttcaatgt ttttagcacc ctctgtgtgg aggaaaataa 2280 tgcagattat tctaattagt gtaatatcta accacattaa aatatattac atagtaaact 2340 acactccata attttataaa tttgactccc cagggtaata aactagtctc tagtctgctc 2400 accttcaact gtacaataaa gtcttggttc ttttgaaata gacctcaaat gagacaccta 2460 aaattcaaag tgtctttaca tttaaagaca cctacaggaa agcaggtaaa agagccaggt 2520 taaaaacaaa ttctaaaacc acttagctgc agttaaacat atagtaaaga tgcactaaag 2580 tttcttactc tgtaaatccc ttccacttca ggaaatattc cactttccca ttcactacac 2640 gtcgatctag tactttttcc acgacaaatt cttcaggctc tgcctcttca acttttttac 2700 tctttccatt ctgttttttt cccatttttt gctaaaataa aacaaaagag aaattaagaa 2760 atattcctct tgaattttga gcacattttc aaggctcaat tgcttatatt attatcacat 2820 tcgacataaa tttttacttc tatatcccag ggcagacacc ttctggaaag attaaaagtc 2880 aacagacaat aaaataaaag aatgctttat cttgttcatt tagttcaaac ttacaaccca 2940 ccaccaaaat aatacaataa aaaaacacta tctggaaaca gttatttttt tccagtcttt 3000 ttttttgaga cagggtctca cactcttgtc gcccaggctg gagtgcagtg gcgtgatctc 3060 agctcactgc aacctccgcc tccccaggtt caagcagttc tcatgcctca gcctccagag 3120 tagctgggat tataggcgga tgccaccatg ccgggctaat tttttttgtg tttttattag 3180 aaacagggtt tcaccatgtt gaccaggctg gtctcaaact cctgacctga agtgattcac 3240 cagcctgggc ctcccaaagt gctggcatta caggcgtgag ccactgcgcc cggccctgta 3300 gtcttaaaag accaagttta ctaattttca ctcattttaa caacactgca acaaacaact 3360 atgcaggaag tacctaaagg gtgatccaga gaagcaagta gtagtgacag gtcttaggtg 3420 aacctatgac agaccttgta tccaccccca gatggtaaaa gccccagccc ccttctcaat 3480 tcaaatatta atgtcaaaag catcaatgat acagagaaaa gataaatgca gaatgaaaac 3540 atggttcaaa atcctgatac caactgcagg gtcaactata gagaccacta ggaggttcaa 3600 ttaaaggaca agattatttt tccataatct ctgtagataa tatttcctac cacttagaac 3660 aaaactataa agctatcact tcaagagacc aacattacaa atttatttta attccctaag 3720 gtgaaaaaaa tccttccttc ctggtttctc aagagaaagt ctatactggt aaccaaattc 3780 actttaaaca ggcattttct ttggtatgac actatttaag agaagcagga aaccaacgtg 3840 aaccagctct ttccaatggc tcaagatttc ctatgagagg actaaaaatg gggaaaattt 3900 ttatgagagg attaaaaatg ggggaaaaaa aaccctgaaa tggttaatca gaagatccta 3960 tgggctgaga aggaatccat cttaacattt catcttaaag caaatgctat tgccgggggc 4020 agtggctcat gcctgtaatc ccagcacttt gggaggccga ggtgggcaga tcatctgagg 4080 tcaggagttt gagaccagcc tgaccaacat ggagaaaccc cgtttctact aaaaatacaa 4140 aattagccag gcatagtggt gcatgcctgt aatcccagct acttgggagg ctgaggcagg 4200 agaactgctt gaacccagga ggcttaagtt gcggtgagcc aagatcacgc cattgcactc 4260 tagcctggac aacaagagaa aaactctgtc tcaaaaaaac acaaaaacaa aaaacccaaa 4320 tactatttaa aaaagataaa ccttaattgc tcaatcatta aagccatccc acaagtaaag 4380 cagcaagcag aaaaaagtta agaacacctc aaggctacag aaggacattt caagctatgc 4440 aggcatatga agtgtgcaga cagatatgta agaaaggcct caagactgca aaagggcatt 4500 tcaagctatg caagcatata ggtaacacat acacacacac aaaataaaat cccctgaaat 4560 acaaaaacat gcagcaaaca cctgacgttt ttggatacca tttctaagtc aggtgttatg 4620 attctcatta gtcaagatac ttgagtactg ggcccaaaca gctttctgcc actgtacagt 4680 acaagaaggt aggaataatg gtgggaggag caaagacaaa ctgtaataga cagaagtgta 4740 tcagatacct atactacatg aaaaacaaaa cagctactgc cacaaaggga gaaggctaac 4800 aaaataaagt caacaataaa tacagaaaat gaaaaggata cacactaagg tttacaaaaa 4860 aaaaaaggca gacaaaatgc catacagtat tcattcacta ctatggcatt cataagctag 4920 tttcaaatgc tcactatttt cttttatagt atatatttgc cttaacccag cacttttttc 4980 caaaagtgga tgagtcaaaa taaatttccc attatttaag tgaaattaac agcacacata 5040 tctcacaaca ctaatgaatt tttaaaatgg aaagttaaga acttttaaag tggccaacct 5100 gtgatccttc acaaaataaa ctaaatacaa taacagaccc caaaggctat caattgcgtg 5160 caaaaacaac ttctgttttc cagggtaaac agaatctaat gcagaatcta atgcagggta 5220 aacagactta atgcagaatc taatgatggc acaaattaaa aatcactaac gtgccctttt 5280 tagtgtgaaa cccagagaga gcacatacaa gccaaaaaca aatgctttat tttacctagg 5340 agacattaac attcaccttt acgtgtttaa gattaatgca atgttaaata ttgtgaaaac 5400 tgtaactttg aatttcatga tttttatgtg aatattccag ggtttaaaaa aacttgtaac 5460 atgacatggc tgaataagat aaaaaaaaaa tctagccttt tctcccttct ggctcatatt 5520 tgcgatttcg atcattttgt ttaaaaaaca aaacactgca atgaattaaa cttaatattc 5580 ttctatgttt tagagtaagt taaaacaaga taaagtgacc aaagtaattt gaaagattca 5640 atgacttttg ctccaaccta ggtgcacaag gtaccttgtt ctttaaattg ggctttaatg 5700 aaaatacttc tccagaattc tggggattta agaaaaatta tgccaaccaa caagggcttt 5760 accattttat gtaacatttt tcaacgctgc aaaaatgtgt gtatttctat ttgaagataa 5820 aaatcctcag caaaatccac attgcactgt ccttcaaaga ttagccttct ttgaactagt 5880 taagacacta ttaagccaag ccagtatctc cctgtaatga attcgttttt ctcttaattt 5940 tcccctgtaa tttacactgg gagagctggg aaatatgtgg atgtaaattt ctcagccaca 6000 gagatgcaaa gttatactgt ggggaaaaaa aacttgagtt aaatccttac atattttagg 6060 ttttcattaa cttaccaatg tagttttgtt ggaggccatt ttttttattg cagacttgaa 6120 gagctattac tagaaaaatg catgacagtt aaggtaagtt tgcatgacac aaaaaaggta 6180 actaaataca aattctgttt ggattccaac ccccaagtag agagcgcaca ctttcaaacg 6240 tgaatacaaa tccagagtag atctgcgctc ctacctacat tgcttatgat gtacttaagt 6300 acgtgtccta accatgtgag tctagaaaga ctttactggg gatcctggta cctaaaacag 6360 cttcacatgg cttaaaatag gggaccaatg tcttttccaa tctaagtccc atttataata 6420 aagtccatgt tccattttta aaggacaatc ctttcggttt aaaaccaggc acgattaccc 6480 aaacaactca caacggtaaa gcactgtgaa tcttctctgt tctgcaatcc caacttggtt 6540 tctgctcaga aaccctccct ctttccaatc ggtaattaaa taacaaaagg aaaaaactta 6600 agatgcttca accccgtttc gtgacacttt gaaaaaagaa tcacctcttg caaacacccg 6660 ctcccgaccc ccgccgctga agcccggcgt ccagaggcct aagcgcgggt gcccgccccc 6720 acccgggagc gcgggcctcg tggtcagcgc atccgcgggg agaaacaaag gccgcggcac 6780 gggggctcaa gggcactgcg ccacaccgca cgcgcctacc cccgcgcggc cacgttaact 6840 ggcggtcgcc gcagcctcgg gacagccggc cgcgcgccgc caggctcgcg gacgcgggac 6900 cacgcgccgc cctccgggag gcccaagtct cgacccagcc ccgcgtggcg ctgggggagg 6960 gggcgcctcc gccggaacgc gggtggggga ggggaggggg aaatgcgctt tgtctcgaaa 7020 tggggcaacc gtcgccacag ctccctaccc cctcgagggc agagcagtcc ccccactaac 7080 taccgggctg gccgcgcgcc aggccagccg cgaggccacc gcccgaccct ccactccttc 7140 ccgcagctcc cggcgcgggg tccggcgaga aggggagggg aggggagcgg agaaccgggc 7200 ccccgggacg cgtgtggcat ctgaagcacc accagcgagc gagagctaga gagaaggaaa 7260 gccaccgact tcaccgcctc cgagctgctc cgggtcgcgg gtctgcagcg tctccggccc 7320 tccgcgccta cagctcaagc cacatccgaa gggggaggga gccgggagct gcgcgcgggg 7380 ccgccggggg gaggggtggc accgcccacg ccgggcggcc acgaagggcg gggcagcggg 7440 cgcgcgcgcg gcggggggag gggccggcgc cgcgcccgct gggaattggg gccctagggg 7500 gagggcggag gcgccgacga ccgcggcact taccgttcgc ggcgtggcgc ccggtggtcc 7560 ccaaggggag ggaaggggga ggcggggcga ggacagtgac cggagtctcc tcagcggtgg 7620 cttttctgct tggcagcctc agcggctggc gccaaaaccg gactccgccc acttcctcgc 7680 ccgccggtgc gagggtgtgg aatcctccag acgctggggg agggggagtt gggagcttaa 7740 aaactagtac ccctttggga ccactttcag cagcgaactc tcctgtacac caggggtcag 7800 ttccacagac gcgggccagg ggtgggtcat tgcggcgtga acaataattt gactagaagt 7860 tgattcgggt gtttccggaa ggggccgagt caatccgccg agttggggca cggaaaacaa 7920 aaagggaagg ctactaagat ttttctggcg ggggttatca ttggcgtaac tgcagggacc 7980 acctcccggg ttgagggggc tggatctcca ggctgcggat taagcccctc ccgtcggcgt 8040 taatttcaaa ctgcgcgacg tttctcacct gccttcgcca aggcaggggc cgggacccta 8100 ttccaagagg tagtaactag caggactcta gccttccgca attcattgag cgcatttacg 8160 gaagtaacgt cgggtactgt ctctggccgc aagggtggga ggagtacgca tttggcgtaa 8220 ggtggggcgt agagccttcc cgccattggc ggcggatagg gcgtttacgc gacggcctga 8280 cgtagcggaa gacgcgttag tgggggggaa ggttctagaa aagcggcggc agcggctcta 8340 gcggcagtag cagcagcgcc gggtcccgtg cggaggtgct cctcgcagag ttgtttctcg 8400 agcagcggca gttctcacta cagcgccagg acgagtccgg ttcgtgttcg tccgcggaga 8460 tctctctcat ctcgctcggc tgcgggaaat cgggctgaag cgactgagtc cgcgatggag 8520 gtaacgggtt tgaaatcaat gagttattga aaagggcatg gcgaggccgt tggcgcctca 8580 gtggaagtcg gccagccgcc tccgtgggag agaggcagga aatcggacca attcagtagc 8640 agtggggctt aaggtttatg aacggggtct tgagcggagg cctgagcgta caaacagctt 8700 ccccaccctc agcctcccgg cgccatttcc cttcactggg ggtgggggat ggggagcttt 8760 cacatggcgg acgctgcccc gctggggtga aagtggggcg cggaggcggg aattcttatt 8820 ccctttctaa agcacgctgc ttcgggggcc acggcgtctc ctcggcgagc gtttcggcgg 8880 gcagcaggtc ctcgtgagcg aggctgcgga gcttcccctc cccctctctc ccgggaaccg 8940 atttggcggc cgccattttc atggctcgcc ttcctctcag cgttttcctt ataactcttt 9000 tattttctta gtgtgctttc tctatcaaga agtagaagtg gttaactatt ttttttttct 9060 tctcgggctg ttttcatatc gtttcgaggt ggatttggag tgttttgtga gcttggatct 9120 ttagagtcct gcgcacctca ttaaaggcgc tcagccttcc cctcgatgaa atggcgccat 9180 tgcgttcgga agccacaccg aagagcgggg agggggggtg ctccgggttt gcgggcccgg 9240 tttcagagaa gatatcacca cccagggcgt cgggccgggt tcaatgcgag ccgtaggaca 9300 aagaaaccat tttatgtttt tcctgtcttt tttttccttt gagtaacggt tttatctggg 9360 tctgcagtca gtaaaacgac agatgaaccg cggcaaaata aacataaatt ggaagccatc 9420 ggccacgagg ggcagggacg aaggtggttt tctgggcggg ggagggatat tcgcgtcaga 9480 atcctttact gttcttaagg attccgttta agttgtagag ctgactcatt ttaagtaatg 9540 ttgttactga gaagtttaac ccttacggga cagatccatg gacctttata gatgattacg 9600 aggaaagtga aataacgatt ttgtccttag ttatacttcg attaaaacat ggcttcagag 9660 gctccttcct gtaatgcgta tggattgatg tgcaaaactg ttttgggcct gggccgctct 9720 gtatttgaac tttgttactt ttctcatttt gtttgcaatc ttggttgaac attacattga 9780 taagcataag gtctcaagcg aagggggtct acctggttat ttttctttga ccctaagcac 9840 gtttataaaa taacattgtt taaaatcgat agtggacatc gggtaagttt ggataaattg 9900 tgaggtaagt aatgagtttt tgctttttgt tagtgatttg taaaacttgt tataaatgta 9960 cattatccgt aatttcagtt tagagataac ctatgtgctg acgacaatta agaataaaaa 10020 ctagctgaaa aaatgaaaat aactatcgtg acaagtaacc atttcaaaag actgctttgt 10080 gtctcatagg agctagtttg atcatttcag ttaatttttt ctttaatttt tacgagtcat 10140 gaaaactaca ggaaaaaaaa tctgaactgg gttttaccac tactttttag gagttgggag 10200 catgcgaatg gagggagagc tccgtagaac tgggatgaga gcagcaatta atgctgcttg 10260 ctaggaacaa aaaataattg attgaaaatt acgtgtgact ttttagtttg cattatgcgt 10320 ttgtagcagt tggtcctgga tatcactttc tctcgtttga ggttttttaa cctagttaac 10380 ttttaagaca ggtttcctta acattcataa gtgcccagaa tacagctgtg tagtacagca 10440 tataaagatt tcagctctga ggtttttcct attgacttgg aaaattgttt tgtgcctgtc 10500 gcttgccaca tggccaatca agtaagcttg attaatagta atcaattacg gggtcattag 10560 ttcatagccc atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct 10620 gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc 10680 caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg 10740 cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat 10800 ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca 10860 tctacgtatt agtcatcgct attaccatgg tgatgcggtt ttggcagtac atcaatgggc 10920 gtggatagcg gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga 10980 gtttgttttg gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tccgccccat 11040 tgacgcaaat gggcggtagg cgtgtacggt gggaggtcta tataagcaga gctggtttag 11100 tgaaccgtca gatccgctag cgttcgaagt ttaaacgcgg ccgcgactct agatcataat 11160 cagccatacc acatttgtag aggttttact tgctttaaaa aacctcccac acctccccct 11220 gaacctgaaa cataaaatga atgcaattgt tgttgttaac ttgtttattg cagcttataa 11280 tggttacaaa taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca 11340 ttctagttgt ggtttgtcca aactcatcaa tgtatcttaa atcgaattct accgggtagg 11400 ggaggcgctt ttcccaaggc agtctggagc atgcgcttta gcagccccgc tgggcacttg 11460 gcgctacaca agtggcctct ggcctcgcac acattccaca tccaccggta ggcgccaacc 11520 ggctccgttc tttggtggcc ccttcgcgcc accttctact cctcccctag tcaggaagtt 11580 cccccccgcc ccgcagctcg cgtcgtgcag gacgtgacaa atggaagtag cacgtctcac 11640 tagtctcgtg cagatggaca gcaccgctga gcaatggaag cgggtaggcc tttggggcag 11700 cggccaatag cagctttgct ccttcgcttt ctgggctcag aggctgggaa ggggtgggtc 11760 cgggggcggg ctcaggggcg ggctcagggg cggggcgggc gcccgaaggt cctccggagg 11820 cccggcattc tgcacgcttc aaaagcgcac gtctgccgcg ctgttctcct cttcctcatc 11880 tccgggcctt tcgaccagct taccatgacc gagtacaagc ccacggtgcg cctcgccacc 11940 cgcgacgacg tccccagggc cgtacgcacc ctcgccgccg cgttcgccga ctaccccgcc 12000 acgcgccaca ccgtcgatcc ggaccgccac atcgagcggg tcaccgagct gcaagaactc 12060 ttcctcacgc gcgtcgggct cgacatcggc aaggtgtggg tcgcggacga cggcgccgcg 12120 gtggcggtct ggaccacgcc ggagagcgtc gaagcggggg cggtgttcgc cgagatcggc 12180 ccgcgcatgg ccgagttgag cggttcccgg ctggccgcgc agcaacagat ggaaggcctc 12240 ctggcgccgc accggcccaa ggagcccgcg tggttcctgg ccaccgtcgg cgtctcgccc 12300 gaccaccagg gcaagggtct gggcagcgcc gtcgtgctcc ccggagtgga ggcggccgag 12360 cgcgccgggg tgcccgcctt cctggagacc tccgcgcccc gcaacctccc cttctacgag 12420 cggctcggct tcaccgtcac cgccgacgtc gaggtgcccg aaggaccgcg cacctggtgc 12480 atgacccgca agcccggtgc ctgacgcccg ccccacgacc cgcagcgccc gaccgaaagg 12540 agcgcacgac cccatgcatc gtagagctcg ctgatcagcc tcgactgtgc cttctagttg 12600 ccagccatct gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc 12660 cactgtcctt tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc 12720 tattctgggg ggtggggtgg ggcaggacag caaggggggg gattgggrag acaatagcag 12780 gcatgctggg ggggcggtgg gggctatggc ttctgaggcg gaaagaacca gctggggctc 12840 gagatccact agttctagcc tcgaggctag agcggccgcc accgcggtgg agctccaatt 12900 cgccctatag tgagtcgtat tacgcgcgct cactggccgt cgttttacaa cgtcgtgact 12960 gggaaaaccc tggcgttacc caacttaatc gccttgcagc acatccccct ttcgccagct 13020 ggcgtaatag cgaagaggcc cgcaccgatc gcccttccca acagttgcgc agcctgaatg 13080 gcgaatggaa attgtaagcg ttaatatttt gttaaaattc gcgttaaatt tttgttaaat 13140 cagctcattt tttaaccaat aggccgaaat cggcaaaatc ccttataaat caaaagaata 13200 gaccgagata gggttgagtg ttgttccagt ttggaacaag agtccactat taaagaacgt 13260 ggactccaac gtcaaagggc gaaaaaccgt ctatcagggc gatggcccac tacgtgaacc 13320 atcaccctaa tcaagttttt tggggtcgag gtgccgtaaa gcactaaatc ggaaccctaa 13380 agggagcccc cgatttagag cttgacgggg aaagccggcg aacgtggcga gaaaggaagg 13440 gaagaaagcg aaaggagcgg gcgctagggc gctggcaagt gtagcggtca cgctgcgcgt 13500 aaccaccaca cccgccgcgc ttaatgcgcc gctacagggc gcgtcag 13547 <210> 3 <211> 600 <212> DNA <213> Artificial Sequence <220> <223> Modified S. alboniger puro <400> 3 atgactgaat acaaaccaac tgttcgcctg gcaactcgtg atgatgttcc acgtgcagtt 60 cgcaccctgg ctgctgcatt tgctgactac cctgcaaccc gtcacactgt ggacccagac 120 cgccacattg aacgtgtgac tgaactgcag gagctgttcc tgacccgtgt gggcctggac 180 attggcaaag tgtgggtggc agatgatggt gctgctgtgg cagtgtggac cacccctgaa 240 tctgttgaag ctggtgcagt gtttgctgag attggcccac gcatggcaga actgtctggc 300 agccgcctgg cagcacaaca gcagatggaa ggtctgctgg caccacaccg cccaaaagaa 360 cctgcttggt tcctggcaac tgtgggtgtg agccctgacc accagggtaa gggcctgggc 420 tctgcagtgg tgctgcctgg tgtggaagca gctgaacgtg caggtgtgcc tgctttcctg 480 gagacctcag ctccacgcaa cctgcctttc tatgaacgcc tgggcttcac tgtgactgct 540 gatgtggaag tgccagaagg cccacgcact tggtgcatga ctcgcaaacc aggtgcttaa 600 <210> 4 <211> 807 <212> DNA <213> Streptomyces fradiae <220> <223> S. fradiae Neo <400> 4 atggacgaca gcacgttgcg ccggaagtac ccgcaccacg agtggcacgc agtgaacgaa 60 ggagactcgg gcgccttcgt ctaccagctc accggcggcc ccgagcccca gcccgagctc 120 tacgcgaaga tcgccccccg cgcccccgag aactccgcct tcgacctgtc cggcgaggcc 180 gaccggctgg agtggctcca ccgccacggg atccccgtcc cccgcgtcgt cgagcgcggt 240 gccgacgaca ccgccgcgtg gctcgtcacg gaggccgtcc ccggcgtcgc ggcggccgag 300 gagtggcccg agcaccagcg gttcgccgtg gtcgaggcga tggcggagct ggcccgcgcc 360 ctccacgagc tgcccgtgga ggactgcccc tccgaccggc gcctcgacgc ggcggtcgcc 420 gaggcccggc ggaacgtcgc cgagggcttg gtggacctcg acgacctgca ggaggagcgg 480 gccgggtgga ccggcgacca gctcctggcg gagctcgacc gcacccgtcc cgagaaggag 540 gacctggtcg tctgccatgg cgacctgtgc cccaacaacg tcctgctcga ccccgggacc 600 tgccgggtca ccggcgtgat cgacgtcggc cgcctcgggg tcgccgaccg ccacgccgac 660 atcgccttgg ccgcccgcga gctggagatc gacgaggacc cctggttcgg ccccgcctac 720 gccgagcggt tcctggagcg gtacggcgcc caccgcgtcg acaaggagaa gctggccttc 780 taccagcttc tcgacgagtt cttctag 807 <210> 5 <211> 600 <212> DNA <213> Streptomyces alboniger <220> <223> S. alboniger puro <400> 5 atgaccgagt acaagcccac ggtgcgcctc gccacccgcg acgacgtccc cagggccgta 60 cgcaccctcg ccgccgcgtt cgccgactac cccgccacgc gccacaccgt cgatccggac 120 cgccacatcg agcgggtcac cgagctgcaa gaactcttcc tcacgcgcgt cgggctcgac 180 atcggcaagg tgtgggtcgc ggacgacggc gccgcggtgg cggtctggac cacgccggag 240 agcgtcgaag cgggggcggt gttcgccgag atcggcccgc gcatggccga gttgagcggt 300 tcccggctgg ccgcgcagca acagatggaa ggcctcctgg cgccgcaccg gcccaaggag 360 cccgcgtggt tcctggccac cgtcggcgtc tcgcccgacc accagggcaa gggtctgggc 420 agcgccgtcg tgctccccgg agtggaggcg gccgagcgcg ccggggtgcc cgccttcctg 480 gagacctccg cgccccgcaa cctccccttc tacgagcggc tcggcttcac cgtcaccgcc 540 gacgtcgagg tgcccgaagg accgcgcacc tggtgcatga cccgcaagcc cggtgcctga 600 <210> 6 <211> 999 <212> DNA <213> Streptomyces hygroscopicus <220> <223> S. hygroscopicus hygro <400> 6 atgacacaag aatccctgtt acttctcgac cgtattgatt cggatgattc ctacgcgagc 60 ctgcggaacg accaggaatt ctgggagccg ctggcccgcc gagccctgga ggagctcggg 120 ctgccggtgc cgccggtgct gcgggtgccc ggcgagagca ccaaccccgt actggtcggc 180 gagcccgacc cggtgatcaa gctgttcggc gagcactggt gcggtccgga gagcctcgcg 240 tcggagtcgg aggcgtacgc ggtcctggcg gacgccccgg tgccggtgcc ccgcctcctc 300 ggccgcggcg agctgcggcc cggcaccgga gcctggccgt ggccctacct ggtgatgagc 360 cggatgaccg gcaccacctg gcggtccgcg atggacggca cgaccgaccg gaacgcgctg 420 ctcgccctgg cccgcgaact cggccgggtg ctcggccggc tgcacagggt gccgctgacc 480 gggaacaccg tgctcacccc ccattccgag gtcttcccgg aactgctgcg ggaacgccgc 540 gcggcgaccg tcgaggacca ccgcgggtgg ggctacctct cgccccggct gctggaccgc 600 ctggaggact ggctgccgga cgtggacacg ctgctggccg gccgcgaacc ccggttcgtc 660 cacggcgacc tgcacgggac caacatcttc gtggacctgg ccgcgaccga ggtcaccggg 720 atcgtcgact tcaccgacgt ctatgcggga gactcccgct acagcctggt gcaactgcat 780 ctcaacgcct tccggggcga ccgcgagatc ctggccgcgc tgctcgacgg ggcgcagtgg 840 aagcggaccg aggacttcgc ccgcgaactg ctcgccttca ccttcctgca cgacttcgag 900 gtgttcgagg agaccccgct ggatctctcc ggcttcaccg atccggagga actggcgcag 960 ttcctctggg ggccgccgga caccgccccc ggcgcctga 999 <210> 7 <211> 1026 <212> DNA <213> Escherichia coli <220> <223> E. coli hygro <400> 7 atgaaaaagc ctgaactcac cgcgacgtct gtcgcgaagt ttctgatcga aaagttcgac 60 agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt cagcttcgat 120 gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt ctacaaagat 180 cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt gcttgacatt 240 ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg tgtcacgttg 300 caagacctgc ctgaaaccga actgcccgct gttctgcaac ccgtcgcgga gctcatggat 360 gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg accgcaagga 420 atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc ccatgtgtat 480 cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc tctcgatgag 540 ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc ggatttcggc 600 tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg gagcgaggcg 660 atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc gtggttggct 720 tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc aggatcgccg 780 cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag cttggttgac 840 ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt ccgatccgga 900 gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg gaccgatggc 960 tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc gagggcaaag 1020 gaatga 1026 <210> 8 <211> 795 <212> DNA <213> Klebsiella pneumoniae <220> <223> Tn5 Neo <400> 8 atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 60 ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca 120 gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 180 caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 240 ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 300 gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 360 cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 420 atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 480 gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac 540 ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat 600 ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac 660 atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 720 ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 780 gacgagttct tctga 795 <210> 9 <211> 12041 <212> DNA <213> Artificial Sequence <220> <223> Plasmid <400> 9 cgttgtaaaa cgacggccag tgaattgtaa tacgactcac tatagggcga attgggtacc 60 gggccccccc tcgaagttta aacatttaaa tctagaagct tcaatgtttt tagcaccctc 120 tgtgtggagg aaaataatgc agattattct aattagtgta atatctaacc acattaaaat 180 atattacata gtaaactaca ctccataatt ttataaattt gactccccag ggtaataaac 240 tagtctctag tctgctcacc ttcaactgta caataaagtc ttggttcttt tgaaatagac 300 ctcaaatgag acacctaaaa ttcaaagtgt ctttacattt aaagacacct acaggaaagc 360 aggtaaaaga gccaggttaa aaacaaattc taaaaccact tagctgcagt taaacatata 420 gtaaagatgc actaaagttt cttactctgt aaatcccttc cacttcagga aatattccac 480 tttcccattc actacacgtc gatctagtac tttttccacg acaaattctt caggctctgc 540 ctcttcaact tttttactct ttccattctg tttttttccc attttttgct aaaataaaac 600 aaaagagaaa ttaagaaata ttcctcttga attttgagca cattttcaag gctcaattgc 660 ttatattatt atcacattcg acataaattt ttacttctat atcccagggc agacaccttc 720 tggaaagatt aaaagtcaac agacaataaa ataaaagaat gctttatctt gttcatttag 780 ttcaaactta caacccacca ccaaaataat acaataaaaa aacactatct ggaaacagtt 840 atttttttcc agtctttttt tttgagacag ggtctcacac tcttgtcgcc caggctggag 900 tgcagtggcg tgatctcagc tcactgcaac ctccgcctcc ccaggttcaa gcagttctca 960 tgcctcagcc tccagagtag ctgggattat aggcggatgc caccatgccg ggctaatttt 1020 ttttgtgttt ttattagaaa cagggtttca ccatgttgac caggctggtc tcaaactcct 1080 gacctgaagt gattcaccag cctgggcctc ccaaagtgct ggcattacag gcgtgagcca 1140 ctgcgcccgg ccctgtagtc ttaaaagacc aagtttacta attttcactc attttaacaa 1200 cactgcaaca aacaactatg caggaagtac ctaaagggtg atccagagaa gcaagtagta 1260 gtgacaggtc ttaggtgaac ctatgacaga ccttgtatcc acccccagat ggtaaaagcc 1320 ccagccccct tctcaattca aatattaatg tcaaaagcat caatgataca gagaaaagat 1380 aaatgcagaa tgaaaacatg gttcaaaatc ctgataccaa ctgcagggtc aactatagag 1440 accactagga ggttcaatta aaggacaaga ttatttttcc ataatctctg tagataatat 1500 ttcctaccac ttagaacaaa actataaagc tatcacttca agagaccaac attacaaatt 1560 tattttaatt ccctaaggtg aaaaaaatcc ttccttcctg gtttctcaag agaaagtcta 1620 tactggtaac caaattcact ttaaacaggc attttctttg gtatgacact atttaagaga 1680 agcaggaaac caacgtgaac cagctctttc caatggctca agatttccta tgagaggact 1740 aaaaatgggg aaaattttta tgagaggatt aaaaatgggg gaaaaaaaac cctgaaatgg 1800 ttaatcagaa gatcctatgg gctgagaagg aatccatctt aacatttcat cttaaagcaa 1860 atgctattgc cgggggcagt ggctcatgcc tgtaatccca gcactttggg aggccgaggt 1920 gggcagatca tctgaggtca ggagtttgag accagcctga ccaacatgga gaaaccccgt 1980 ttctactaaa aatacaaaat tagccaggca tagtggtgca tgcctgtaat cccagctact 2040 tgggaggctg aggcaggaga actgcttgaa cccaggaggc ttaagttgcg gtgagccaag 2100 atcacgccat tgcactctag cctggacaac aagagaaaaa ctctgtctca aaaaaacaca 2160 aaaacaaaaa acccaaatac tatttaaaaa agataaacct taattgctca atcattaaag 2220 ccatcccaca agtaaagcag caagcagaaa aaagttaaga acacctcaag gctacagaag 2280 gacatttcaa gctatgcagg catatgaagt gtgcagacag atatgtaaga aaggcctcaa 2340 gactgcaaaa gggcatttca agctatgcaa gcatataggt aacacataca cacacacaaa 2400 ataaaatccc ctgaaataca aaaacatgca gcaaacacct gacgtttttg gataccattt 2460 ctaagtcagg tgttatgatt ctcattagtc aagatacttg agtactgggc ccaaacagct 2520 ttctgccact gtacagtaca agaaggtagg aataatggtg ggaggagcaa agacaaactg 2580 taatagacag aagtgtatca gatacctata ctacatgaaa aacaaaacag ctactgccac 2640 aaagggagaa ggctaacaaa ataaagtcaa caataaatac agaaaatgaa aaggatacac 2700 actaaggttt acaaaaaaaa aaaggcagac aaaatgccat acagtattca ttcactacta 2760 tggcattcat aagctagttt caaatgctca ctattttctt ttatagtata tatttgcctt 2820 aacccagcac ttttttccaa aagtggatga gtcaaaataa atttcccatt atttaagtga 2880 aattaacagc acacatatct cacaacacta atgaattttt aaaatggaaa gttaagaact 2940 tttaaagtgg ccaacctgtg atccttcaca aaataaacta aatacaataa cagaccccaa 3000 aggctatcaa ttgcgtgcaa aaacaacttc tgttttccag ggtaaacaga atctaatgca 3060 gaatctaatg cagggtaaac agacttaatg cagaatctaa tgatggcaca aattaaaaat 3120 cactaacgtg ccctttttag tgtgaaaccc agagagagca catacaagcc aaaaacaaat 3180 gctttatttt acctaggaga cattaacatt cacctttacg tgtttaagat taatgcaatg 3240 ttaaatattg tgaaaactgt aactttgaat ttcatgattt ttatgtgaat attccagggt 3300 ttaaaaaaac ttgtaacatg acatggctga ataagataaa aaaaaaatct agccttttct 3360 cccttctggc tcatatttgc gatttcgatc attttgttta aaaaacaaaa cactgcaatg 3420 aattaaactt aatattcttc tatgttttag agtaagttaa aacaagataa agtgaccaaa 3480 gtaatttgaa agattcaatg acttttgctc caacctaggt gcacaaggta ccttgttctt 3540 taaattgggc tttaatgaaa atacttctcc agaattctgg ggatttaaga aaaattatgc 3600 caaccaacaa gggctttacc attttatgta acatttttca acgctgcaaa aatgtgtgta 3660 tttctatttg aagataaaaa tcctcagcaa aatccacatt gcactgtcct tcaaagatta 3720 gccttctttg aactagttaa gacactatta agccaagcca gtatctccct gtaatgaatt 3780 cgtttttctc ttaattttcc cctgtaattt acactgggag agctgggaaa tatgtggatg 3840 taaatttctc agccacagag atgcaaagtt atactgtggg gaaaaaaaac ttgagttaaa 3900 tccttacata ttttaggttt tcattaactt accaatgtag ttttgttgga ggccattttt 3960 tttattgcag acttgaagag ctattactag aaaaatgcat gacagttaag gtaagtttgc 4020 atgacacaaa aaaggtaact aaatacaaat tctgtttgga ttccaacccc caagtagaga 4080 gcgcacactt tcaaacgtga atacaaatcc agagtagatc tgcgctccta cctacattgc 4140 ttatgatgta cttaagtacg tgtcctaacc atgtgagtct agaaagactt tactggggat 4200 cctggtacct aaaacagctt cacatggctt aaaatagggg accaatgtct tttccaatct 4260 aagtcccatt tataataaag tccatgttcc atttttaaag gacaatcctt tcggtttaaa 4320 accaggcacg attacccaaa caactcacaa cggtaaagca ctgtgaatct tctctgttct 4380 gcaatcccaa cttggtttct gctcagaaac cctccctctt tccaatcggt aattaaataa 4440 caaaaggaaa aaacttaaga tgcttcaacc ccgtttcgtg acactttgaa aaaagaatca 4500 cctcttgcaa acacccgctc ccgacccccg ccgctgaagc ccggcgtcca gaggcctaag 4560 cgcgggtgcc cgcccccacc cgggagcgcg ggcctcgtgg tcagcgcatc cgcggggaga 4620 aacaaaggcc gcggcacggg ggctcaaggg cactgcgcca caccgcacgc gcctaccccc 4680 gcgcggccac gttaactggc ggtcgccgca gcctcgggac agccggccgc gcgccgccag 4740 gctcgcggac gcgggaccac gcgccgccct ccgggaggcc caagtctcga cccagccccg 4800 cgtggcgctg ggggaggggg cgcctccgcc ggaacgcggg tgggggaggg gagggggaaa 4860 tgcgctttgt ctcgaaatgg ggcaaccgtc gccacagctc cctaccccct cgagggcaga 4920 gcagtccccc cactaactac cgggctggcc gcgcgccagg ccagccgcga ggccaccgcc 4980 cgaccctcca ctccttcccg cagctcccgg cgcggggtcc ggcgagaagg ggaggggagg 5040 ggagcggaga accgggcccc cgggacgcgt gtggcatctg aagcaccacc agcgagcgag 5100 agctagagag aaggaaagcc accgacttca ccgcctccga gctgctccgg gtcgcgggtc 5160 tgcagcgtct ccggccctcc gcgcctacag ctcaagccac atccgaaggg ggagggagcc 5220 gggagctgcg cgcggggccg ccggggggag gggtggcacc gcccacgccg ggcggccacg 5280 aagggcgggg cagcgggcgc gcgcgcggcg gggggagggg ccggcgccgc gcccgctggg 5340 aattggggcc ctagggggag ggcggaggcg ccgacgaccg cggcacttac cgttcgcggc 5400 gtggcgcccg gtggtcccca aggggaggga agggggaggc ggggcgagga cagtgaccgg 5460 agtctcctca gcggtggctt ttctgcttgg cagcctcagc ggctggcgcc aaaaccggac 5520 tccgcccact tcctcgcccg ccggtgcgag ggtgtggaat cctccagacg ctgggggagg 5580 gggagttggg agcttaaaaa ctagtacccc tttgggacca ctttcagcag cgaactctcc 5640 tgtacaccag gggtcagttc cacagacgcg ggccaggggt gggtcattgc ggcgtgaaca 5700 ataatttgac tagaagttga ttcgggtgtt tccggaaggg gccgagtcaa tccgccgagt 5760 tggggcacgg aaaacaaaaa gggaaggcta ctaagatttt tctggcgggg gttatcattg 5820 gcgtaactgc agggaccacc tcccgggttg agggggctgg atctccaggc tgcggattaa 5880 gcccctcccg tcggcgttaa tttcaaactg cgcgacgttt ctcacctgcc ttcgccaagg 5940 caggggccgg gaccctattc caagaggtag taactagcag gactctagcc ttccgcaatt 6000 cattgagcgc atttacggaa gtaacgtcgg gtactgtctc tggccgcaag ggtgggagga 6060 gtacgcattt ggcgtaaggt ggggcgtaga gccttcccgc cattggcggc ggatagggcg 6120 tttacgcgac ggcctgacgt agcggaagac gcgttagtgg gggggaaggt tctagaaaag 6180 cggcggcagc ggctctagcg gcagtagcag cagcgccggg tcccgtgcgg aggtgctcct 6240 cgcagagttg tttctcgagc agcggcagtt ctcactacag cgccaggacg agtccggttc 6300 gtgttcgtcc gcggagatct ctctcatctc gctcggctgc gggaaatcgg gctgaagcga 6360 ctgagtccgc gatggaggta acgggtttga aatcaatgag ttattgaaaa gggcatggcg 6420 aggccgttgg cgcctcagtg gaagtcggcc agccgcctcc gtgggagaga ggcaggaaat 6480 cggaccaatt cagtagcagt ggggcttaag gtttatgaac ggggtcttga gcggaggcct 6540 gagcgtacaa acagcttccc caccctcagc ctcccggcgc catttccctt cactgggggt 6600 gggggatggg gagctttcac atggcggacg ctgccccgct ggggtgaaag tggggcgcgg 6660 aggcgggaat tcttattccc tttctaaagc acgctgcttc gggggccacg gcgtctcctc 6720 ggcgagcgtt tcggcgggca gcaggtcctc gtgagcgagg ctgcggagct tcccctcccc 6780 ctctctcccg ggaaccgatt tggcggccgc cattttcatg gctcgccttc ctctcagcgt 6840 tttccttata actcttttat tttcttagtg tgctttctct atcaagaagt agaagtggtt 6900 aactattttt tttttcttct cgggctgttt tcatatcgtt tcgaggtgga tttggagtgt 6960 tttgtgagct tggatcttta gagtcctgcg cacctcatta aaggcgctca gccttcccct 7020 cgatgaaatg gcgccattgc gttcggaagc cacaccgaag agcggggagg gggggtgctc 7080 cgggtttgcg ggcccggttt cagagaagat atcaccaccc agggcgtcgg gccgggttca 7140 atgcgagccg taggacaaag aaaccatttt atgtttttcc tgtctttttt ttcctttgag 7200 taacggtttt atctgggtct gcagtcagta aaacgacaga tgaaccgcgg caaaataaac 7260 ataaattgga agccatcggc cacgaggggc agggacgaag gtggttttct gggcggggga 7320 gggatattcg cgtcagaatc ctttactgtt cttaaggatt ccgtttaagt tgtagagctg 7380 actcatttta agtaatgttg ttactgagaa gtttaaccct tacgggacag atccatggac 7440 ctttatagat gattacgagg aaagtgaaat aacgattttg tccttagtta tacttcgatt 7500 aaaacatggc ttcagaggct ccttcctgta atgcgtatgg attgatgtgc aaaactgttt 7560 tgggcctggg ccgctctgta tttgaacttt gttacttttc tcattttgtt tgcaatcttg 7620 gttgaacatt acattgataa gcataaggtc tcaagcgaag ggggtctacc tggttatttt 7680 tctttgaccc taagcacgtt tataaaataa cattgtttaa aatcgatagt ggacatcggg 7740 taagtttgga taaattgtga ggtaagtaat gagtttttgc tttttgttag tgatttgtaa 7800 aacttgttat aaatgtacat tatccgtaat ttcagtttag agataaccta tgtgctgacg 7860 acaattaaga ataaaaacta gctgaaaaaa tgaaaataac tatcgtgaca agtaaccatt 7920 tcaaaagact gctttgtgtc tcataggagc tagtttgatc atttcagtta attttttctt 7980 taatttttac gagtcatgaa aactacagga aaaaaaatct gaactgggtt ttaccactac 8040 tttttaggag ttgggagcat gcgaatggag ggagagctcc gtagaactgg gatgagagca 8100 gcaattaatg ctgcttgcta ggaacaaaaa ataattgatt gaaaattacg tgtgactttt 8160 tagtttgcat tatgcgtttg tagcagttgg tcctggatat cactttctct cgtttgaggt 8220 tttttaacct agttaacttt taagacaggt ttccttaaca ttcataagtg cccagaatac 8280 agctgtgtag tacagcatat aaagatttca gctctgaggt ttttcctatt gacttggaaa 8340 attgttttgt gcctgtcgct tgccacatgg ccaatcaagt aagcttatcg ataccggtgg 8400 cgcgccaatt gttaattaag atctggccca atgggccgta cgaattcctt aggctaccgg 8460 gtaggggagg cgcttttccc aaggcagtct ggagcatgcg ctttagcagc cccgctgggc 8520 acttggcgct acacaagtgg cctctggcct cgcacacatt ccacatccac cggccggtag 8580 gcgccaaccg gctccgttct ttggtggccc cttcgcgcca ccttctactc ctcccctagt 8640 caggaagttc ccccccgccc cgcagctcgc gtcgtgcagg acgtgacaaa tggaagtagc 8700 acgtctcact agtctcgtgc agatggacag caccgctgag caatggaagc gggtaggcct 8760 ttggggcagc ggccaatagc agctttgctc cttcgctttc tgggctcaga ggctgggaag 8820 gggtgggtcc gggggcgggc tcaggggcgg gctcaggggc ggggcgggcg cccgaaggtc 8880 ctccggaggc ccggcattct gcacgcttca aaagcgcacg tctgccgcgc tgttctcctc 8940 ttcctcatct ccgggccttt cgaccagctt accatgaccg agtacaagcc cacggtgcgc 9000 ctcgccaccc gcgacgacgt ccccagggcc gtacgcaccc tcgccgccgc gttcgccgac 9060 taccccgcca cgcgccacac cgtcgatccg gaccgccaca tcgagcgggt caccgagctg 9120 caagaactct tcctcacgcg cgtcgggctc gacatcggca aggtgtgggt cgcggacgac 9180 ggcgccgcgg tggcggtctg gaccacgccg gagagcgtcg aagcgggggc ggtgttcgcc 9240 gagatcggcc cgcgcatggc cgagttgagc ggttcccggc tggccgcgca gcaacagatg 9300 gaaggcctcc tggcgccgca ccggcccaag gagcccgcgt ggttcctggc caccgtcggc 9360 gtctcgcccg accaccaggg caagggtctg ggcagcgccg tcgtgctccc cggagtggag 9420 gcggccgagc gcgccggggt gcccgccttc ctggagacct ccgcgccccg caacctcccc 9480 ttctacgagc ggctcggctt caccgtcacc gccgacgtcg aggtgcccga aggaccgcgc 9540 acctggtgca tgacccgcaa gcccggtgcc tgacgcccgc cccacgaccc gcagcgcccg 9600 accgaaagga gcgcacgacc ccatgcatcg tagagctcgc tgatcagcct cgactgtgcc 9660 ttctagttgc cagccatctg ttgtttgccc ctcccccgtg ccttccttga ccctggaagg 9720 tgccactccc actgtccttt cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag 9780 gtgtcattct attctggggg gtggggtggg gcaggacagc aagggggggg attgggraga 9840 caatagcagg catgctgggg gggcggtggg ggctatggct tctgaggcgg aaagaaccag 9900 ctggggctcg agggccgcca ccgcggtgga gctccagctt ttgttccctt tagtgagggt 9960 taatttcgag cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc 10020 tcacaattcc acacaacata cgagccggaa gcataaagtg taaagcctgg ggtgcctaat 10080 gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc 10140 tgtcgtgcca gcatcgcgag cacttttcgg ggaaatgtgc gcggaacccc tatttgttta 10200 tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 10260 caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 10320 ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 10380 gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 10440 aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 10500 ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 10560 atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 10620 gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 10680 gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 10740 atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 10800 aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 10860 actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 10920 aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa 10980 tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 11040 ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 11100 agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agactcgcga 11160 cactgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt 11220 ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 11280 ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 11340 tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 11400 tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 11460 gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 11520 ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 11580 tggcgctttc tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 11640 agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 11700 atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 11760 acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 11820 actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 11880 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 11940 tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 12000 tcttttctac ggggtctgac gctcagtgga acgaaaactc a 12041 <210> 10 <211> 11646 <212> DNA <213> Artificial Sequence <220> <223> Plasmid <400> 10 cgttgtaaaa cgacggccag tgaattgtaa tacgactcac tatagggcga attgggtacc 60 gggccccccc tcgaagttta aacatttaaa tctagaagct tttaaccctc tatcccttta 120 aacttccttg atccagtgta agcacctcct agaaagtcag tagacaataa aacaaaagtt 180 ctgcttcacc gatttacatt tataaccaaa tacccttcac caatacaata aaaaaacaaa 240 acaacaaaaa accccaacca tctgagaaat aatcttctcc tttcccagct ttattcccag 300 gattctacat gaccaaatta ccagagtcac cactcatttt aatcacaaca tagtgtcaaa 360 taactagaaa acatgagaca acaatggaga gctgagtaac tattagtagt agtactttac 420 cagagaatgg cctctatagg ctcacatgta ggaatggttg gtccccaggt ggtaggtaga 480 gctgtttgag gattacgtgg ccttcttgga tggggggtgg gggtggggtg ggagggttgg 540 gtggtgggta cttaagaggt ttcaaaagtc aatattgttt gcatttagct cttccttgta 600 cttgtggatc aaacacaacc tgtcagctac tgcttcaaat gtcatgcctg ctgccatctt 660 ctcagcagga tggtcatggc ctcaccctct tcaactgtaa atctttcttt cttttcttct 720 ttttcttttg gtttcgagac agggtttctc tgtatagtcc tggctgtcct ggaactcact 780 ttgtagacca ggctggcctt gaactcagaa atccgcctgc ctctgcctcc ctagcactgg 840 gattaaaggc gtgcgccacc acgcccagct ttcaactgga aatcttaata aactttccta 900 gaagtggcct tggttatggg agcttatcac agcaatagaa cagcaattat gactggagta 960 tgatagttaa aaacaagcaa gcaagcaagc aaacacacac accaaaacaa caaaacccca 1020 agacagagtc acatgtagcc caggctagcc tccaaattca ctatataact gaagaagacc 1080 cctaattccc attcctctag aatctatacc tcaagtactg aatggcttgg ttcacaatac 1140 cccactaaat gattggtctt actaagtgca acaaggtaaa cctaaaactt cagccctcag 1200 acatcccttt tccagtatca atttataaaa ttagatccca aggataaaaa ttaattgtaa 1260 agtaaaatca gagttctagc atcaactaca ggctcaacca tggggaccac aaataaacta 1320 aaagggataa gactggcttc cccataatta ttacatttag ataattttcc tgactactca 1380 acaaagctaa aatatcacca ctggtttatt ttctccttct agggtttaag ctcactctga 1440 ggaggggcat gcggcacaca ctcatagcat ccaggaaata gaaatatggt gactatcatg 1500 ggttcagggc caacctaggc tttagagaaa aaccttgtcc cacaaaccaa aaatgtctct 1560 tttttattct atcaggggtg gatggatttg ttaaagaagt gcttttaaaa accttgagat 1620 ggttatttag aagtccccat gggataccaa aataacccac tatttatatg cccaagcatt 1680 tcacctccac aacagtgcta tgcacccttt aacatttttg agacagtagc ccagtctagt 1740 ctttaacttg cagtgatttt tcctgattca gcttctccca gtgctggaat tataggtatg 1800 caccaccatg tgtaactaca gatgctactt aaaaattttt taaaggaatc acaaaaataa 1860 ccccctatca aatgcctagt ccctctaacc atcaccaagt gaaggatcac gcaggaaaaa 1920 aaaaatcacc agcagcacct cagaaccagg atactcagtc catcagcatc cagggccata 1980 cccacactca cagcatctcc acagtttacc agatgattca tgcttatcac tgtattgggt 2040 catctaagag tgaccatcag ggcttctgat cacagaatct agtccacttt gcagaccagt 2100 tgaagtcatg cactatatga gatagaaata ccctcttgct cattttggtc agaaattcaa 2160 ggataaaaac ccatgttttg ttaatgcaca cctccatatg attgagatca atgtgtccta 2220 attaatgtag aaaccacaac tgtaaatttc actcttttga catgaatctt tttctagaca 2280 gggtcttgga tgcagccccg actacccaga attttggaat ccaggctagc ctcaaactca 2340 aggcaatctg cttgcttcag cttctcacag gctggatcac aaacatacac cttcagaccc 2400 attttttttt cctccctccg tttttggttt ctctgtgtag ccctgggtgt ccgtggactc 2460 gctgtgtaga tctatctacc agcctctgtc ttggagtact gggattaaag ttgtgggcta 2520 ccactgcctg gctgacccag ttttatttat tttaaatata acttgacaaa aataaatttg 2580 tctaacttac tagaaatccc aagaaaacta acactggatt tagcaacagt cagaaatcgc 2640 tgaaaagaaa cagaattgat ctaacagtct tagatcactc ctagacagtt tgtaattctt 2700 gctcatggca acgtgagctc tatctaactc actctctgtg cactaatgaa tgctcagtgt 2760 ctccagaaca gcacagcttc cagggtaatc atgccaaccc acaagacttt tatagagctg 2820 tccacgactc ttcccccatt cagctcatta acaatatgat ggagctcctg tgtggaaatc 2880 aaggcacact ctggtagaaa cttgtttttt ctttccactt ttccttgggc tctgaagatt 2940 gagctgtttt ataacccaca aacatgcatt ttttacctca aaagcatcca gcaaaaactg 3000 tacaacgctt tttcaaaaaa atgtattgtg atcctcctta agaaaagcct tacttagtgt 3060 taattccttt ttctttagaa tgctggtaaa tacaaggact taggtaggct ggcttctaac 3120 agcaattcac ccacttatga tgggattaaa ggaaggcaca accatgtcca ccacaggttc 3180 tagctccccc acccacacgc ccagagaggg tttttctgtg tagctctgac tattctggaa 3240 ttcacactgc agaccaggct ggtctcgaac tcagagatcc accaccacat ggtttcttaa 3300 ttgtaatttt aaagaaaaaa aaaaatcctt cagttaagat tcttatgttc taggttttca 3360 caaacttacc aatgtagttt tattggaggc cattttttaa atttaatcgg agacttgaag 3420 agctattgca agaaaaaaaa tgtaggacag ttaaaatttc atgacacaca aaaggcagct 3480 acaagttttg tgtggatttc aacatgtaaa tttcgggtaa aaatgcagga aaacagttga 3540 gttcccgtgt tattagtatg ttactaataa tttcagtatg ttagtgaaaa taatcttact 3600 aaaacactgg tacctcagac aactttacat ggtgaggatt gttactttcc caatccatat 3660 agaattttaa caattttagt gtttattttg gatgaaagga aatgactatc ttttgttagc 3720 aaattaccat aagatctttt tctttagatt tctgaatact ccaaggagct catataattc 3780 catccttatt ttttcagagg ccctccctgt tcaatcacgg tataaaaaaa ggaacacatt 3840 aagatgtccc agtcctattt tctggctttt tttttccggg ggtggtggtg cggtaatcac 3900 tctctatagt ccagtctggg cttcaacgcc tggcaatccc cagcctcaag ctcccaagta 3960 ctgtcctgat aaggatagaa ggagtcgacc tccttcacgc tcccctccga ggagggctcc 4020 ttcccagctc cattccccgg tcgggagccc gtcccccacc cgagagcgcg ggcctcgtgg 4080 tcagcgcctc cgcggggaga aacaaaggcg gcggcggggg ctcaagggca ctgcgccacg 4140 ggcccgcgcc tcccccatcc ggcggcggcc acgtagccgg gagcgcgccg cagcccggag 4200 cctcgggcct cgcagctgca gagcctgaac cgctctctcc ctgcgggcct gcgacgaggc 4260 tgggggaggg gaggcccgcg ctttgtctgg agtctcggta gctgtcatcc ggctcccacc 4320 ctcatgcaca attgtcccat ctcccccacg caccggcgcg gcgcccgcct cagcgaggcc 4380 ccagccggtt tcccgcagcc cgcggcccac ggggctcgca gcctccccgc aagctcggac 4440 gcacggagca tcctaaaccc caccacacgc aagatcgaaa aaaagcaaag gcacgaactt 4500 caccgctccg atgctcaggg ccgcggatcc tgcagagtct cccgcctgcg cgcttcggtt 4560 cagccacatc cgaggggagg gggcgcgggc agctccgccg ggggggaggg ggagcaccgc 4620 ccacgccctg gccgcgcggg gcccgccggg aacgcgtcct gcggggggcg gcgcgcgcaa 4680 tgctcaccgt ccgcggcgtg gcgcccaggg ggtctcctgg ctggggggag gggggggaag 4740 gcgggcagga aggaccgcgg aggcctctct gcgtctcgga gcgcgccaaa gcggggctcc 4800 acccacctcc ttgcccggat cttgaaggcc ggggagataa acagcggggt tctttaagca 4860 ccacctctca ctaggcgcgg gatcccaagg cttgtggcat ccggggtggt acttggacta 4920 aaagtccttc tgggagggac cgagtgagaa cccctttggg acgtgtagaa atatttgtgt 4980 ggttcgagaa tatttgtgcg gacgggcttg gcaaaggcgt agctgcagag agcacgcttg 5040 ggtggagagg gccgcacgcc ccagcgccgg cctaagcccc tcccgacggc gttatttcaa 5100 actgcgcgac cgtttctccg ctccctacgc ggaggtgggg gccggaccta gttccggacg 5160 tagtaacacg ccgagcgcga gccttccgca attcacggaa cacagttgcg caagtgatgt 5220 aaagcagtcc cgctgtacct aaagggggag tgtcacgtac ttggcgtaag gagagtgtag 5280 gcccttcccg ccattggcgg cggttagggc gtttacgtaa cggcgtgacg taagcggaga 5340 cgcgttagtg gggggaaggt tctagaaaag cggcggtctc ggctccagcg gcagtagcag 5400 cggcgccggt cccgtgtgca ggagctcctt tgcggcccag tttcttggcc atcgcctgct 5460 ctccccacag cgccaggacg agtcccgtgc gcgtccgtcc gcggaggtct ttctcatctc 5520 gctcggctgc gggaaatcgg gctgaagcga ctgagtccgc gatggaggta acgggtttga 5580 aatcaatgag ttattaaaaa tggcatggcg aggccgtagg caccgcaatg gaaaccggcc 5640 acccgcctcc gtggtccggc ggaggggatg cggccactcg agtggcggtt ggccttggcg 5700 agtttctgag gggtcgttgg aggaggcctc tgattgtccg accgccttcc ccgccctcag 5760 ccgcccggcg ccatttccct cagttggggt gggggatggg aagtgcccgc cgcgaccggg 5820 ctggaccgct aaagtagcgc gtgagcgggc catcgctggc ctttcgatgt gcgcgggcct 5880 aggggctcgg ttgtgttcgc ggcggaacgt ttctggggcc cccccggctt cccggagcga 5940 gtctgcgaag ctagcttccc ctcccccctc tcccgggaac cggatttggc ggccgccatt 6000 ttcccgtctc cttcctcgcc acgattttgc tttcaacgct ttaggtttac tagtttggtt 6060 ttcttttttc accactgcgt agacgtgttt agcgattttc ctttcttttg gaagtcttca 6120 taccgtttcg aggtggattt agcgttttga gcttgggtct tcagcgtcct gcgcacctcg 6180 ctaaaggctc tctgccttcc cctcgacgaa atggcgccat tgctttctga agccaccgag 6240 gcgcggggtg ggggcggggt ggcggcgctc cacgagcttt actggaacag gcagagagaa 6300 cgtagtacaa ccgaggcctg ggcgggtggc tgaaggcagc gtcgctgcaa agagaccgtt 6360 ttatttttca taatacgtaa gattacgggt gctgtagtaa agcacttgag cattagtata 6420 gtaggaggaa gtcaaagtgg aaaaaatggg agcgctcatc aggaagctag ggaggctatg 6480 ttgagtgcag ggttactttc cttttattgc agaactttta tctgcttaaa ggatcctcgg 6540 atcgaaataa ttcaaattat aagcattttt aagggaatct tcgaatttgt tggtaaagtc 6600 aacggatcct tagcacgtgg tgttcacttt aaggaagtga aatagctgac ttttcatagt 6660 tagccttcgc ttaaagcctg gttcagtgga cgaaaatcca cgtcctggct atataaaaac 6720 ttagtttggg gtcacagtgt ttgagcgtgg tcattcggtt tttttatttt ttatttgttt 6780 gaaattatga tgcatcatta cactgataag cattagcttt cgaattgaaa ggggtctcct 6840 tggttatttt ctttgactct aagcacactt ataaataaaa taaccttgtt tataatcgat 6900 agtggacgtc tggtaagttt ggaaaaaacc cgaggtaagt aaagagcttt tgctttcgtt 6960 agtgatatga aaaaacaagg tgtatttaat acttgcaact tagtttaagg aaagccaatt 7020 tactgacatt ttagtagagc taccagaaac actatttgga gtcctgatta aggcttttgt 7080 aactattttg actatttaaa acaattttgg tcgtttttat taaacatttc aaaacctaaa 7140 aattgtaaac attggctttt tgagcacatt ttggagaaac ttacaaattt aggctataca 7200 gtaaaataac ggatttgttt tataattttg ctttttcatt tcgttgtgca gtcataggtc 7260 ctggatagta tgacctaatt tatgaacatc ttgataagtt tttgtactta gctattggaa 7320 agccagtatt aagtgcctga caaaaccaga tttaaggtga tatctggagt ttcagcattc 7380 ttcatggagc ttgtttcaga gttgcaggat tttttttttt catcttgaga tacttacaat 7440 taacaccaga gggggcagct cagggaaaag caaatatgcc acttttcaga aactgaatct 7500 tggaagtggt gaatttggaa acaggttttt taaatttttt ttaaatctaa aaagtagtaa 7560 attttggact tgggttgtag aatttaatga attacaaaag aattctttaa taccctttaa 7620 atgacctaag agctgggtat ggtttttctg aatttttttg aagaaaatct aagaaagttt 7680 acgtgaatta gaagttagat cgaatattag tgactttgaa acttgtatag ctcaggcaat 7740 ttttggtgta acacaactaa tatgcagttt aacatatggt ttaaatttga tgtaagtttt 7800 ttttctcccc cccagaaaac tttagaaact gttcctttgg agaggaaaaa ggtactctac 7860 cagcaggtca cctcatattt aagaatttaa tttcctgcat acaaagaaag tgtaaataaa 7920 aattgaaatg gtatttccct ttgcagagag aaaaggaaca gttccgaaag ctctttattg 7980 gtggcttaag cttatcgata ccggtggcgc gccaattgtt aattaagatc tggcccaatg 8040 ggccgtacga attccttagg ctaccgggta ggggaggcgc ttttcccaag gcagtctgga 8100 gcatgcgctt tagcagcccc gctgggcact tggcgctaca caagtggcct ctggcctcgc 8160 acacattcca catccaccgg ccggtaggcg ccaaccggct ccgttctttg gtggcccctt 8220 cgcgccacct tctactcctc ccctagtcag gaagttcccc cccgccccgc agctcgcgtc 8280 gtgcaggacg tgacaaatgg aagtagcacg tctcactagt ctcgtgcaga tggacagcac 8340 cgctgagcaa tggaagcggg taggcctttg gggcagcggc caatagcagc tttgctcctt 8400 cgctttctgg gctcagaggc tgggaagggg tgggtccggg ggcgggctca ggggcgggct 8460 caggggcggg gcgggcgccc gaaggtcctc cggaggcccg gcattctgca cgcttcaaaa 8520 gcgcacgtct gccgcgctgt tctcctcttc ctcatctccg ggcctttcga ccagcttacc 8580 atgaccgagt acaagcccac ggtgcgcctc gccacccgcg acgacgtccc cagggccgta 8640 cgcaccctcg ccgccgcgtt cgccgactac cccgccacgc gccacaccgt cgatccggac 8700 cgccacatcg agcgggtcac cgagctgcaa gaactcttcc tcacgcgcgt cgggctcgac 8760 atcggcaagg tgtgggtcgc ggacgacggc gccgcggtgg cggtctggac cacgccggag 8820 agcgtcgaag cgggggcggt gttcgccgag atcggcccgc gcatggccga gttgagcggt 8880 tcccggctgg ccgcgcagaa cagatggaag gcctcctggc gccgcaccgg cccaaggagc 8940 ccgcgtggtt cctggccacc gtcgcgtctc gcccgaccac cagggcaagg gtctgggcag 9000 cgccgtcgtg ctccccggag tggaggcggc cgagcgcgcc ggggtgcccg ccttcctgga 9060 gacctccgcg ccccgcaacc tccccttcta cgagcggctc ggcttcaccg tcaccgccga 9120 cgtcgaggtg cccgaaggac cgcgcacctg gtgcatgacc cgcaagcccg gtgcctgacg 9180 cccgccccac gacccgcagc gcccgaccga aaggagcgca cgaccccatg catcgtagag 9240 ctcgctgatc agcctcgact gtgccttcta gttgccagcc atctgttgtt tgcccctccc 9300 ccgtgccttc cttgaccctg gaaggtgcca ctcccactgt cctttcctaa taaaatgagg 9360 aaattgcatc gcattgtctg agtaggtgtc attctattct ggggggtggg gtggggcagg 9420 acagcaaggg gggggattgg gragacaata gcaggcatgc tgggggggcg gtgggggcta 9480 tggcttctga ggcggaaaga accagctggg gctcgagggc cgccaccgcg gtggagctcc 9540 agcttttgtt ccctttagtg agggttaatt tcgagcttgg cgtaatcatg gtcatagctg 9600 tttcctgtgt gaaattgtta tccgctcaca attccacaca acatacgagc cggaagcata 9660 aagtgtaaag cctggggtgc ctaatgagtg agctaactca cattaattgc gttgcgctca 9720 ctgcccgctt tccagtcggg aaacctgtcg tgccagcatc gcgagcactt ttcggggaaa 9780 tgtgcgcgga acccctattt gtttattttt ctaaatacat tcaaatatgt atccgctcat 9840 gagacaataa ccctgataaa tgcttcaata atattgaaaa aggaagagta tgagtattca 9900 acatttccgt gtcgccctta ttcccttttt tgcggcattt tgccttcctg tttttgctca 9960 cccagaaacg ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac gagtgggtta 10020 catcgaactg gatctcaaca gcggtaagat ccttgagagt tttcgccccg aagaacgttt 10080 tccaatgatg agcactttta aagttctgct atgtggcgcg gtattatccc gtattgacgc 10140 cgggcaagag caactcggtc gccgcataca ctattctcag aatgacttgg ttgagtactc 10200 accagtcaca gaaaagcatc ttacggatgg catgacagta agagaattat gcagtgctgc 10260 cataaccatg agtgataaca ctgcggccaa cttacttctg acaacgatcg gaggaccgaa 10320 ggagctaacc gcttttttgc acaacatggg ggatcatgta actcgccttg atcgttggga 10380 accggagctg aatgaagcca taccaaacga cgagcgtgac accacgatgc ctgtagcaat 10440 ggcaacaacg ttgcgcaaac tattaactgg cgaactactt actctagctt cccggcaaca 10500 attaatagac tggatggagg cggataaagt tgcaggacca cttctgcgct cggcccttcc 10560 ggctggctgg tttattgctg ataaatctgg agccggtgag cgtgggtctc gcggtatcat 10620 tgcagcactg gggccagatg gtaagccctc ccgtatcgta gttatctaca cgacggggag 10680 tcaggcaact atggatgaac gaaatagaca gatcgctgag ataggtgcct cactgattaa 10740 gcattggtaa ctgtcagact cgcgacactg cattaatgaa tcggccaacg cgcggggaga 10800 ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc 10860 gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa 10920 tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 10980 aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 11040 aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 11100 ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 11160 tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc 11220 agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 11280 gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 11340 tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 11400 acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc 11460 tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 11520 caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 11580 aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 11640 aactca 11646 <210> 11 <211> 9027 <212> DNA <213> Artificial Sequence <220> <223> Plasmid <400> 11 cgttgtaaaa cgacggccag tgaattgtaa tacgactcac tatagggcga attgggtacc 60 gggccccccc tcgaagttta aacatttaaa tctagaacta gtggatcccc cgggctgcag 120 gaattcgata tcaagctcat ggcacctgta ttgtactctt atcagtcatt atatggactt 180 taacttcccc agatattatt tgggctcctc cataagactg tgagcatctg accactggag 240 tgttgcttcc cattatatcc ctgttatcaa gcacaaggtc aggcacagag taagactcaa 300 aacatgtttt ggaatgtatg actggtatga actacaaacc agtaagctga tgttttcatt 360 ttgagtctat aaatctaatt ttgtggtggt tttgtgtatg gctcaaggct caaattgtaa 420 aatttaatat tatgtgacca aagaaagtta tacccagaac ctcaatttcc tcaccttcaa 480 aatggggcag tttctcactc attggtctgc tgtcacgatt ttaatgagct catgcacaaa 540 cagcccttta tataaggtaa gtgctggata aatgttggct actataataa aataagcctc 600 taagatactt ggtcagcaca agtactaccc aagagtatgc actgtaagta aactgacaaa 660 attgtgtatc taaaactggc cagatgaaag agaaactttt aaggggccct tctgcgtgcc 720 cgacactgtg ctaggcactc acactatccc gacccgagaa accgatctgc gacccagagg 780 aacttaccaa gcctccagca tcttgtgcag ccctactcat gggaccatct ggatacccac 840 ccttgtcttt acagggagca gaacacacct cttatgtgtc agaaaacaaa gtccaggaag 900 tatattttta cctgaggcaa tatctgaaaa ttgtatgcta cagcctccaa agtgagtctt 960 cctctcagta cctctcttct aggcacatgg agccctttct tccaagtatt atgtttaacc 1020 acttaatgaa tgaagtcctg aaactgctta cccatgctcc ctataatctc tgagtaatct 1080 tccttttcca caacctcagg cataatctca tcttctgttt ctattacaat ttcaaattct 1140 ggaaaaagga agttgtggtc tggaattata tggtccagat gatctgaaac aaaaaggaca 1200 gcactattag taatcattta gttttgaaga cagtctaata atttgctgtc tctaaagtac 1260 tatattccct atagttctgg cattttagat aaagggtcat aaattaaatg cctatatggt 1320 gacattattc agtgattcag acttcacagc cttttttttt tttttacaaa ggtgttccag 1380 gcatgaaaaa ttttaaagta ctataccttt cctaatttta cctttaaagt tgtcctggaa 1440 atatctgggt tgacaaaggc gatgaaactg aactgagact taaaaaaaag attacccacc 1500 tggttgtgca caagcctgct tatgtcccaa tctccagtct agggtctgat gctccttgct 1560 gcagtaatat gctttgtggc atctggagca cgttttgggg cctaaacagc cacaaaccct 1620 gcagagatga gcaccagact taagctggag acacactgat tctcctgttt ctgggggagg 1680 attctcagaa ggtggctcat atgagtaaaa atcgtttttc ctgggtagtt gattcctaaa 1740 aactaaaaaa gaatacagag aaaagtttta tcttcaaaca aaacagcaat tcacatattt 1800 tatcctctgc acgtaaaact gaaaataaca acaacaaaaa agaaatgaaa gtttttgctt 1860 tcaggaataa gcttttaaaa tccagaaact agatttcgtc cggtacacgc aactgagttg 1920 cctcctagag gtggtttgag ttaatcaaat taataagact gatcgttaag aacgactgcc 1980 aaaaatacga aaaagctact gggatccatc tttccaagac aatttctatt atctgaatta 2040 acaccatacc tggtacccac tgattaaaag ctgggggtta ccaatgcgcg tgggcacagt 2100 tagaagctta tgtagcaaaa atgagcacat cctggaaggg cccgggagaa ggtgctcctg 2160 gggcagcgcg gagagggagc tctgaggctg gggcggcagc ggtgcttgcc gccgtccccc 2220 tggtcgctcc cggaattaac gccgcgcacg cgtcggaggc atggccccgt cccgaccccg 2280 tttggcggct cacctcgcag gccggcacag cacggctgct cgcggcagca gaagaggaag 2340 atgcagcggt ggaaggcgtc cgggcggcca ggcagcggcg catacacctg cagcaggaag 2400 gagagcgggc ggccgcacag ctcgcaggcc agggcctggg gccccggcag cccggccgcg 2460 cccagccatg ccggccgccc gcccaccttg ctggggaact gctcgctgcg cagtcgccac 2520 gccggcgccg actcggcgaa gcccagctcc acaggcctgg ccccggcggc agccatgcgg 2580 ggcgcgggct ggcgtggggc gcagcccaca gctgggtcgg aaggcggaaa tcgggcgccg 2640 ggccggaagg caagaggcgg gcacctttcc ggaggacagg aggcggaaac gcgtctgacg 2700 ggagcggttg caggaccaat gcgagggaac ggggcagagg aaacctctcg gcatcagccc 2760 cgcccctggc gcctctgcct ccgagccgct ttcctggtgc ctccgggtgc tctgggatgg 2820 ttctggtctt tgggagagtg gcagctggtg acggcgctcc gctcacctct gcacatgtct 2880 tgctgtgggc ctgcgggtgg ccgccaggga ggcagagccc tcccgcaaac cttccctgct 2940 ggtgtccacc tcagggtgtg ggaaacctgt gcgctggccg agtgctaacc aagagtaggc 3000 agtgaaagac aaatgaaggt tgaacaggta aagtgaggac cctacagcgg aaaccaagaa 3060 tcctgtgtgc ctgagagtaa tgaagaagcc tctgcagaag agtcttttct gtcagtctta 3120 aggtctctgt tttaatgtta gtgctggctt gctgtacctg aattccaagg gaggagtgta 3180 taatgaggca tggccaaccc ccacttccca tcattgcctg aactagtttt tcaggttaac 3240 ttcagaatgc ccttggtacc gcgggccccc tctgtggtcc cacgccactg atcgctgcat 3300 gcccaccacc tgggtacaca cagtctgtga ttcccggagc agaacggacc ctgcccaccc 3360 ggtcttgtgt gctactcagt ggacagaccc aaggcaagaa agggtgacaa ggacagggtc 3420 ttcccaggct ggctttgagt tcctagcacc gccccgcccc caatcctctg tggcacatgg 3480 agtcttggtc cccagagtcc cccagcggcc tccagatggt ctgggagggc agttcagctg 3540 tggctgcgca tagcagacat acaacggacg gtgggcccag acccaggctg tgtagaccca 3600 gcccccccgc cccgcagtgc ctaggtcacc cactaacgcc ccaggcctgg tcttggctgg 3660 gcgtgactgt taccctcaaa agcaggcagc tccagggtaa aaggtgccct gccctgtaga 3720 gcccacttcc ttcccagggc tgcggctggg taggtttgta gccttcatca cgggccacct 3780 ccagccactg gaccgctggc ccctgccctg tcctggggag tgtggtcctg cgactctaat 3840 ggccgcaagc cacctgactc ccccaacacc acactctacc tctcaagccc aggtctctcc 3900 ctagtgaccc acccagcaca tttagctagc tgagccccac agccagaggt cctcaggccc 3960 tgctttcagg gcagttgctc tgaagtcggc aagggggagt gactgcctgg ccactccatg 4020 ccctccaaga gctccttctg caggagcgta cagaacccag ggccctggca cccgtgcaga 4080 ccctggccca ccccacctgg gcgctcagtg cccaagagat gtccacacct aggatgtccc 4140 gcggtgggtg gggggcccga gagacgggca ggccgggggc aggcctggcc atgcggggcc 4200 gaaccgggca ctgcccagcg tggggcgcgg gggccacggc gcgcgccccc agcccccggg 4260 cccagcaccc caaggcggcc aacgccaaaa ctctccctcc tcctcttcct caatctcgct 4320 ctcgctcttt ttttttttcg caaaaggagg ggagaggggg taaaaaaatg ctgcactgtg 4380 cggcgaagcc ggtgagtgag cggcgcgggg ccaatcagcg tgcgccgttc cgaaagttgc 4440 cttttatggc tcgagcggcc gcggcggcgc cctataaaac ccagcggcgc gacgcgccac 4500 caccgccgag accgcgtccg cccgcgagca cagagcctcg cctttgccga tccgccgccc 4560 gtccacaccc gccgccaggt aagcccggcc agccgaccgg ggcatgcggc cgcggccctt 4620 cgcccgtgca gagccgccgt ctgggccgca gcggggggcg catggggcgg aaccggaccg 4680 ccgtgggggg cgcgggagaa gcccctgggc ctccggagat gggggacacc ccacgccagt 4740 tcgcaggcgc gaggccgcgc tcgggcgggc gcgctccggg ggtgccgctc tcggggcggg 4800 ggcaaccggc ggggtctttg tctgagccgg gctcttgcca atggggatcg cacggtgggc 4860 gcggcgtagc ccccgtcagg cccggtgggg gctggggcgc catgcgcgtg cgcgctggtc 4920 ctttgggcgc taactgcgtg cgcgctggga attggcgcta attgcgcgtg cgcgctggga 4980 ctcaatggcg ctaatcgcgc gtgcgttctg gggcccgggc gcttgcgcca cttcctgccc 5040 gagccgctgg cgcccgaggg tgtggccgct gcgtgcgcgc gcgcgacccg gtcgctgttt 5100 gaaccgggcg gaggcggggc tggcgcccgg ttgggagggg gttggggcct ggcttcctgc 5160 cgcgcgccgc ggggacgcct ccgaccagtg tttgcctttt atggtaataa cgcggccggc 5220 ccggcttcct ttgtccccaa tctgggcgcg cgccggcgcc ccctggcggc ctaaggactc 5280 ggcgcgccgg aagtggccag ggcgggggcg acttcggctc acagcgcgcc cggctattct 5340 cgcagctcac catgccggtc gccaccatga gcttatcgat accggtggcg cgccaattgt 5400 taattaagat ctggcccaat gggccgtacg aattccttag gctaccgggt aggggaggcg 5460 cttttcccaa ggcagtctgg agcatgcgct ttagcagccc cgctgggcac ttggcgctac 5520 acaagtggcc tctggcctcg cacacattcc acatccaccg gccggtaggc gccaaccggc 5580 tccgttcttt ggtggcccct tcgcgccacc ttctactcct cccctagtca ggaagttccc 5640 ccccgccccg cagctcgcgt cgtgcaggac gtgacaaatg gaagtagcac gtctcactag 5700 tctcgtgcag atggacagca ccgctgagca atggaagcgg gtaggccttt ggggcagcgg 5760 ccaatagcag ctttgctcct tcgctttctg ggctcagagg ctgggaaggg gtgggtccgg 5820 gggcgggctc aggggcgggc tcaggggcgg ggcgggcgcc cgaaggtcct ccggaggccc 5880 ggcattctgc acgcttcaaa agcgcacgtc tgccgcgctg ttctcctctt cctcatctcc 5940 gggcctttcg accagcttac catgaccgag tacaagccca cggtgcgcct cgccacccgc 6000 gacgacgtcc ccagggccgt acgcaccctc gccgccgcgt tcgccgacta ccccgccacg 6060 cgccacaccg tcgatccgga ccgccacatc gagcgggtca ccgagctgca agaactcttc 6120 ctcacgcgcg tcgggctcga catcggcaag gtgtgggtcg cggacgacgg cgccgcggtg 6180 gcggtctgga ccacgccgga gagcgtcgaa gcgggggcgg tgttcgccga gatcggcccg 6240 cgcatggccg agttgagcgg ttcccggctg gccgcgcaga acagatggaa ggcctcctgg 6300 cgccgcaccg gcccaaggag cccgcgtggt tcctggccac cgtcgcgtct cgcccgacca 6360 ccagggcaag ggtctgggca gcgccgtcgt gctccccgga gtggaggcgg ccgagcgcgc 6420 cggggtgccc gccttcctgg agacctccgc gccccgcaac ctccccttct acgagcggct 6480 cggcttcacc gtcaccgccg acgtcgaggt gcccgaagga ccgcgcacct ggtgcatgac 6540 ccgcaagccc ggtgcctgac gcccgcccca cgacccgcag cgcccgaccg aaaggagcgc 6600 acgaccccat gcatcgtaga gctcgctgat cagcctcgac tgtgccttct agttgccagc 6660 catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc actcccactg 6720 tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt cattctattc 6780 tggggggtgg ggtggggcag gacagcaagg ggggggattg ggragacaat agcaggcatg 6840 ctgggggggc ggtgggggct atggcttctg aggcggaaag aaccagctgg ggctcgaggg 6900 ccgccaccgc ggtggagctc cagcttttgt tccctttagt gagggttaat ttcgagcttg 6960 gcgtaatcat ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac 7020 aacatacgag ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc 7080 acattaattg cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagcat 7140 cgcgagcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca 7200 ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 7260 aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt 7320 ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca 7380 gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag 7440 ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc 7500 ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac actattctca 7560 gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt 7620 aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct 7680 gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg gggatcatgt 7740 aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga 7800 caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact 7860 tactctagct tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc 7920 acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg gagccggtga 7980 gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt 8040 agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac agatcgctga 8100 gataggtgcc tcactgatta agcattggta actgtcagac tcgcgacact gcattaatga 8160 atcggccaac gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc 8220 actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg 8280 gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc 8340 cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc 8400 ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga 8460 ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc 8520 ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat 8580 agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 8640 cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 8700 aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 8760 gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 8820 agaaggacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 8880 ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 8940 cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 9000 tctgacgctc agtggaacga aaactca 9027 <210> 12 <211> 12221 <212> DNA <213> Artificial Sequence <220> <223> Plasmid <400> 12 cgttgtaaaa cgacggccag tgaattgtaa tacgactcac tatagggcga attgggtacc 60 gggccccccc tcgaagttta aacatttaaa tctagaagct tcaatgtttt tagcaccctc 120 tgtgtggagg aaaataatgc agattattct aattagtgta atatctaacc acattaaaat 180 atattacata gtaaactaca ctccataatt ttataaattt gactccccag ggtaataaac 240 tagtctctag tctgctcacc ttcaactgta caataaagtc ttggttcttt tgaaatagac 300 ctcaaatgag acacctaaaa ttcaaagtgt ctttacattt aaagacacct acaggaaagc 360 aggtaaaaga gccaggttaa aaacaaattc taaaaccact tagctgcagt taaacatata 420 gtaaagatgc actaaagttt cttactctgt aaatcccttc cacttcagga aatattccac 480 tttcccattc actacacgtc gatctagtac tttttccacg acaaattctt caggctctgc 540 ctcttcaact tttttactct ttccattctg tttttttccc attttttgct aaaataaaac 600 aaaagagaaa ttaagaaata ttcctcttga attttgagca cattttcaag gctcaattgc 660 ttatattatt atcacattcg acataaattt ttacttctat atcccagggc agacaccttc 720 tggaaagatt aaaagtcaac agacaataaa ataaaagaat gctttatctt gttcatttag 780 ttcaaactta caacccacca ccaaaataat acaataaaaa aacactatct ggaaacagtt 840 atttttttcc agtctttttt tttgagacag ggtctcacac tcttgtcgcc caggctggag 900 tgcagtggcg tgatctcagc tcactgcaac ctccgcctcc ccaggttcaa gcagttctca 960 tgcctcagcc tccagagtag ctgggattat aggcggatgc caccatgccg ggctaatttt 1020 ttttgtgttt ttattagaaa cagggtttca ccatgttgac caggctggtc tcaaactcct 1080 gacctgaagt gattcaccag cctgggcctc ccaaagtgct ggcattacag gcgtgagcca 1140 ctgcgcccgg ccctgtagtc ttaaaagacc aagtttacta attttcactc attttaacaa 1200 cactgcaaca aacaactatg caggaagtac ctaaagggtg atccagagaa gcaagtagta 1260 gtgacaggtc ttaggtgaac ctatgacaga ccttgtatcc acccccagat ggtaaaagcc 1320 ccagccccct tctcaattca aatattaatg tcaaaagcat caatgataca gagaaaagat 1380 aaatgcagaa tgaaaacatg gttcaaaatc ctgataccaa ctgcagggtc aactatagag 1440 accactagga ggttcaatta aaggacaaga ttatttttcc ataatctctg tagataatat 1500 ttcctaccac ttagaacaaa actataaagc tatcacttca agagaccaac attacaaatt 1560 tattttaatt ccctaaggtg aaaaaaatcc ttccttcctg gtttctcaag agaaagtcta 1620 tactggtaac caaattcact ttaaacaggc attttctttg gtatgacact atttaagaga 1680 agcaggaaac caacgtgaac cagctctttc caatggctca agatttccta tgagaggact 1740 aaaaatgggg aaaattttta tgagaggatt aaaaatgggg gaaaaaaaac cctgaaatgg 1800 ttaatcagaa gatcctatgg gctgagaagg aatccatctt aacatttcat cttaaagcaa 1860 atgctattgc cgggggcagt ggctcatgcc tgtaatccca gcactttggg aggccgaggt 1920 gggcagatca tctgaggtca ggagtttgag accagcctga ccaacatgga gaaaccccgt 1980 ttctactaaa aatacaaaat tagccaggca tagtggtgca tgcctgtaat cccagctact 2040 tgggaggctg aggcaggaga actgcttgaa cccaggaggc ttaagttgcg gtgagccaag 2100 atcacgccat tgcactctag cctggacaac aagagaaaaa ctctgtctca aaaaaacaca 2160 aaaacaaaaa acccaaatac tatttaaaaa agataaacct taattgctca atcattaaag 2220 ccatcccaca agtaaagcag caagcagaaa aaagttaaga acacctcaag gctacagaag 2280 gacatttcaa gctatgcagg catatgaagt gtgcagacag atatgtaaga aaggcctcaa 2340 gactgcaaaa gggcatttca agctatgcaa gcatataggt aacacataca cacacacaaa 2400 ataaaatccc ctgaaataca aaaacatgca gcaaacacct gacgtttttg gataccattt 2460 ctaagtcagg tgttatgatt ctcattagtc aagatacttg agtactgggc ccaaacagct 2520 ttctgccact gtacagtaca agaaggtagg aataatggtg ggaggagcaa agacaaactg 2580 taatagacag aagtgtatca gatacctata ctacatgaaa aacaaaacag ctactgccac 2640 aaagggagaa ggctaacaaa ataaagtcaa caataaatac agaaaatgaa aaggatacac 2700 actaaggttt acaaaaaaaa aaaggcagac aaaatgccat acagtattca ttcactacta 2760 tggcattcat aagctagttt caaatgctca ctattttctt ttatagtata tatttgcctt 2820 aacccagcac ttttttccaa aagtggatga gtcaaaataa atttcccatt atttaagtga 2880 aattaacagc acacatatct cacaacacta atgaattttt aaaatggaaa gttaagaact 2940 tttaaagtgg ccaacctgtg atccttcaca aaataaacta aatacaataa cagaccccaa 3000 aggctatcaa ttgcgtgcaa aaacaacttc tgttttccag ggtaaacaga atctaatgca 3060 gaatctaatg cagggtaaac agacttaatg cagaatctaa tgatggcaca aattaaaaat 3120 cactaacgtg ccctttttag tgtgaaaccc agagagagca catacaagcc aaaaacaaat 3180 gctttatttt acctaggaga cattaacatt cacctttacg tgtttaagat taatgcaatg 3240 ttaaatattg tgaaaactgt aactttgaat ttcatgattt ttatgtgaat attccagggt 3300 ttaaaaaaac ttgtaacatg acatggctga ataagataaa aaaaaaatct agccttttct 3360 cccttctggc tcatatttgc gatttcgatc attttgttta aaaaacaaaa cactgcaatg 3420 aattaaactt aatattcttc tatgttttag agtaagttaa aacaagataa agtgaccaaa 3480 gtaatttgaa agattcaatg acttttgctc caacctaggt gcacaaggta ccttgttctt 3540 taaattgggc tttaatgaaa atacttctcc agaattctgg ggatttaaga aaaattatgc 3600 caaccaacaa gggctttacc attttatgta acatttttca acgctgcaaa aatgtgtgta 3660 tttctatttg aagataaaaa tcctcagcaa aatccacatt gcactgtcct tcaaagatta 3720 gccttctttg aactagttaa gacactatta agccaagcca gtatctccct gtaatgaatt 3780 cgtttttctc ttaattttcc cctgtaattt acactgggag agctgggaaa tatgtggatg 3840 taaatttctc agccacagag atgcaaagtt atactgtggg gaaaaaaaac ttgagttaaa 3900 tccttacata ttttaggttt tcattaactt accaatgtag ttttgttgga ggccattttt 3960 tttattgcag acttgaagag ctattactag aaaaatgcat gacagttaag gtaagtttgc 4020 atgacacaaa aaaggtaact aaatacaaat tctgtttgga ttccaacccc caagtagaga 4080 gcgcacactt tcaaacgtga atacaaatcc agagtagatc tgcgctccta cctacattgc 4140 ttatgatgta cttaagtacg tgtcctaacc atgtgagtct agaaagactt tactggggat 4200 cctggtacct aaaacagctt cacatggctt aaaatagggg accaatgtct tttccaatct 4260 aagtcccatt tataataaag tccatgttcc atttttaaag gacaatcctt tcggtttaaa 4320 accaggcacg attacccaaa caactcacaa cggtaaagca ctgtgaatct tctctgttct 4380 gcaatcccaa cttggtttct gctcagaaac cctccctctt tccaatcggt aattaaataa 4440 caaaaggaaa aaacttaaga tgcttcaacc ccgtttcgtg acactttgaa aaaagaatca 4500 cctcttgcaa acacccgctc ccgacccccg ccgctgaagc ccggcgtcca gaggcctaag 4560 cgcgggtgcc cgcccccacc cgggagcgcg ggcctcgtgg tcagcgcatc cgcggggaga 4620 aacaaaggcc gcggcacggg ggctcaaggg cactgcgcca caccgcacgc gcctaccccc 4680 gcgcggccac gttaactggc ggtcgccgca gcctcgggac agccggccgc gcgccgccag 4740 gctcgcggac gcgggaccac gcgccgccct ccgggaggcc caagtctcga cccagccccg 4800 cgtggcgctg ggggaggggg cgcctccgcc ggaacgcggg tgggggaggg gagggggaaa 4860 tgcgctttgt ctcgaaatgg ggcaaccgtc gccacagctc cctaccccct cgagggcaga 4920 gcagtccccc cactaactac cgggctggcc gcgcgccagg ccagccgcga ggccaccgcc 4980 cgaccctcca ctccttcccg cagctcccgg cgcggggtcc ggcgagaagg ggaggggagg 5040 ggagcggaga accgggcccc cgggacgcgt gtggcatctg aagcaccacc agcgagcgag 5100 agctagagag aaggaaagcc accgacttca ccgcctccga gctgctccgg gtcgcgggtc 5160 tgcagcgtct ccggccctcc gcgcctacag ctcaagccac atccgaaggg ggagggagcc 5220 gggagctgcg cgcggggccg ccggggggag gggtggcacc gcccacgccg ggcggccacg 5280 aagggcgggg cagcgggcgc gcgcgcggcg gggggagggg ccggcgccgc gcccgctggg 5340 aattggggcc ctagggggag ggcggaggcg ccgacgaccg cggcacttac cgttcgcggc 5400 gtggcgcccg gtggtcccca aggggaggga agggggaggc ggggcgagga cagtgaccgg 5460 agtctcctca gcggtggctt ttctgcttgg cagcctcagc ggctggcgcc aaaaccggac 5520 tccgcccact tcctcgcccg ccggtgcgag ggtgtggaat cctccagacg ctgggggagg 5580 gggagttggg agcttaaaaa ctagtacccc tttgggacca ctttcagcag cgaactctcc 5640 tgtacaccag gggtcagttc cacagacgcg ggccaggggt gggtcattgc ggcgtgaaca 5700 ataatttgac tagaagttga ttcgggtgtt tccggaaggg gccgagtcaa tccgccgagt 5760 tggggcacgg aaaacaaaaa gggaaggcta ctaagatttt tctggcgggg gttatcattg 5820 gcgtaactgc agggaccacc tcccgggttg agggggctgg atctccaggc tgcggattaa 5880 gcccctcccg tcggcgttaa tttcaaactg cgcgacgttt ctcacctgcc ttcgccaagg 5940 caggggccgg gaccctattc caagaggtag taactagcag gactctagcc ttccgcaatt 6000 cattgagcgc atttacggaa gtaacgtcgg gtactgtctc tggccgcaag ggtgggagga 6060 gtacgcattt ggcgtaaggt ggggcgtaga gccttcccgc cattggcggc ggatagggcg 6120 tttacgcgac ggcctgacgt agcggaagac gcgttagtgg gggggaaggt tctagaaaag 6180 cggcggcagc ggctctagcg gcagtagcag cagcgccggg tcccgtgcgg aggtgctcct 6240 cgcagagttg tttctcgagc agcggcagtt ctcactacag cgccaggacg agtccggttc 6300 gtgttcgtcc gcggagatct ctctcatctc gctcggctgc gggaaatcgg gctgaagcga 6360 ctgagtccgc gatggaggta acgggtttga aatcaatgag ttattgaaaa gggcatggcg 6420 aggccgttgg cgcctcagtg gaagtcggcc agccgcctcc gtgggagaga ggcaggaaat 6480 cggaccaatt cagtagcagt ggggcttaag gtttatgaac ggggtcttga gcggaggcct 6540 gagcgtacaa acagcttccc caccctcagc ctcccggcgc catttccctt cactgggggt 6600 gggggatggg gagctttcac atggcggacg ctgccccgct ggggtgaaag tggggcgcgg 6660 aggcgggaat tcttattccc tttctaaagc acgctgcttc gggggccacg gcgtctcctc 6720 ggcgagcgtt tcggcgggca gcaggtcctc gtgagcgagg ctgcggagct tcccctcccc 6780 ctctctcccg ggaaccgatt tggcggccgc cattttcatg gctcgccttc ctctcagcgt 6840 tttccttata actcttttat tttcttagtg tgctttctct atcaagaagt agaagtggtt 6900 aactattttt tttttcttct cgggctgttt tcatatcgtt tcgaggtgga tttggagtgt 6960 tttgtgagct tggatcttta gagtcctgcg cacctcatta aaggcgctca gccttcccct 7020 cgatgaaatg gcgccattgc gttcggaagc cacaccgaag agcggggagg gggggtgctc 7080 cgggtttgcg ggcccggttt cagagaagat atcaccaccc agggcgtcgg gccgggttca 7140 atgcgagccg taggacaaag aaaccatttt atgtttttcc tgtctttttt ttcctttgag 7200 taacggtttt atctgggtct gcagtcagta aaacgacaga tgaaccgcgg caaaataaac 7260 ataaattgga agccatcggc cacgaggggc agggacgaag gtggttttct gggcggggga 7320 gggatattcg cgtcagaatc ctttactgtt cttaaggatt ccgtttaagt tgtagagctg 7380 actcatttta agtaatgttg ttactgagaa gtttaaccct tacgggacag atccatggac 7440 ctttatagat gattacgagg aaagtgaaat aacgattttg tccttagtta tacttcgatt 7500 aaaacatggc ttcagaggct ccttcctgta atgcgtatgg attgatgtgc aaaactgttt 7560 tgggcctggg ccgctctgta tttgaacttt gttacttttc tcattttgtt tgcaatcttg 7620 gttgaacatt acattgataa gcataaggtc tcaagcgaag ggggtctacc tggttatttt 7680 tctttgaccc taagcacgtt tataaaataa cattgtttaa aatcgatagt ggacatcggg 7740 taagtttgga taaattgtga ggtaagtaat gagtttttgc tttttgttag tgatttgtaa 7800 aacttgttat aaatgtacat tatccgtaat ttcagtttag agataaccta tgtgctgacg 7860 acaattaaga ataaaaacta gctgaaaaaa tgaaaataac tatcgtgaca agtaaccatt 7920 tcaaaagact gctttgtgtc tcataggagc tagtttgatc atttcagtta attttttctt 7980 taatttttac gagtcatgaa aactacagga aaaaaaatct gaactgggtt ttaccactac 8040 tttttaggag ttgggagcat gcgaatggag ggagagctcc gtagaactgg gatgagagca 8100 gcaattaatg ctgcttgcta ggaacaaaaa ataattgatt gaaaattacg tgtgactttt 8160 tagtttgcat tatgcgtttg tagcagttgg tcctggatat cactttctct cgtttgaggt 8220 tttttaacct agttaacttt taagacaggt ttccttaaca ttcataagtg cccagaatac 8280 agctgtgtag tacagcatat aaagatttca gctctgaggt ttttcctatt gacttggaaa 8340 attgttttgt gcctgtcgct tgccacatgg ccaatcaagt aagcttatcg ataccggtgg 8400 cgcgccaatt gttaattaag atctggccca atgggccgta cgaatttgag gcggaaagaa 8460 ccagctgtgg aatgtgtgtc agttagggtg tggaaagtcc ccaggctccc cagcaggcag 8520 aagtatgcaa agcatgcatc tcaattagtc agcaaccagg tgtggaaagt ccccaggctc 8580 cccagcaggc agaagtatgc aaagcatgca tctcaattag tcagcaacca tagtcccgcc 8640 cctaactccg cccatcccgc ccctaactcc gcccagttcc gcccattctc cgccccatgg 8700 ctgactaatt ttttttattt atgcagaggc cgaggccgcc tcggcctctg agctattcca 8760 gaagtagtga ggaggctttt ttggaggcct aggcttttgc aaagatcgat caagagacag 8820 gatgaggatc gtttcgcatg attgaacaag atggattgca cgcaggttct ccggccgctt 8880 gggtggagag gctattcggc tatgactggg cacaacagac aatcggctgc tctgatgccg 8940 ccgtgttccg gctgtcagcg caggggcgcc cggttctttt tgtcaagacc gacctgtccg 9000 gtgccctgaa tgaactgcaa gacgaggcag cgcggctatc gtggctggcc acgacgggcg 9060 ttccttgcgc agctgtgctc gacgttgtca ctgaagcggg aagggactgg ctgctattgg 9120 gcgaagtgcc ggggcaggat ctcctgtcat ctcaccttgc tcctgccgag aaagtatcca 9180 tcatggctga tgcaatgcgg cggctgcata cgcttgatcc ggctacctgc ccattcgacc 9240 accaagcgaa acatcgcatc gagcgagcac gtactcggat ggaagccggt cttgtcgatc 9300 aggatgatca agagcatcag gggctcgcgc cagccgaact gttcgccagg ctcaaggcga 9360 gcatgcccga cggcgaggat ctcgtcgtga cccatggcga tgcctgcttg ccgaatatca 9420 tggtggaaaa tggccgcttt tctggattca tcgactgtgg ccggctgggt gtggcggacc 9480 gctatcagga catagcgttg gctacccgtg atattgctga agagcttggc ggcgaatggg 9540 ctgaccgctt cctcgtgctt tacggtatcg ccgctcccga ttcgcagcgc atcgccttct 9600 atcgccttct tgacgagttc ttctgagcgg gactctgggg ttcgaaatga ccgaccaagc 9660 gacgcccaac ctgccatcac gagatttcga ttccaccgcc gccttctatg aaaggttggg 9720 cttcggaatc gttttccggg acgccggctg gatgatcctc cagcgcgggg atctcatgct 9780 ggagttcttc gcccacccta gggggaggct aactgaaaca cggaaggaga caataccgga 9840 aggaacccgc gctatgacgg caataaaaag acagaataaa acgcacggtg ttgggtcgtt 9900 tgttcataaa cgcggggttc ggtcccaggg ctggcactct gtcgataccc caccgagacc 9960 ccattggggc caatacgccc gcgtttcttc cttttcccca ccccaccccc caagttcggg 10020 tgaaggccca gggctcgcag ccaacgtcgg ggcggcaggc cctgccatag cctcaaattc 10080 cttaggctcg agggccgcca ccgcggtgga gctccagctt ttgttccctt tagtgagggt 10140 taatttcgag cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc 10200 tcacaattcc acacaacata cgagccggaa gcataaagtg taaagcctgg ggtgcctaat 10260 gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc 10320 tgtcgtgcca gcatcgcgag cacttttcgg ggaaatgtgc gcggaacccc tatttgttta 10380 tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 10440 caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 10500 ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 10560 gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 10620 aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 10680 ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 10740 atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 10800 gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 10860 gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 10920 atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 10980 aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 11040 actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 11100 aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa 11160 tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 11220 ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 11280 agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agactcgcga 11340 cactgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt 11400 ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 11460 ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 11520 tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 11580 tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 11640 gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 11700 ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 11760 tggcgctttc tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 11820 agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 11880 atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 11940 acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 12000 actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 12060 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 12120 tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 12180 tcttttctac ggggtctgac gctcagtgga acgaaaactc a 12221 <210> 13 <211> 11828 <212> DNA <213> Artificial Sequence <220> <223> Plasmid <400> 13 cgttgtaaaa cgacggccag tgaattgtaa tacgactcac tatagggcga attgggtacc 60 gggccccccc tcgaagttta aacatttaaa tctagaagct tttaaccctc tatcccttta 120 aacttccttg atccagtgta agcacctcct agaaagtcag tagacaataa aacaaaagtt 180 ctgcttcacc gatttacatt tataaccaaa tacccttcac caatacaata aaaaaacaaa 240 acaacaaaaa accccaacca tctgagaaat aatcttctcc tttcccagct ttattcccag 300 gattctacat gaccaaatta ccagagtcac cactcatttt aatcacaaca tagtgtcaaa 360 taactagaaa acatgagaca acaatggaga gctgagtaac tattagtagt agtactttac 420 cagagaatgg cctctatagg ctcacatgta ggaatggttg gtccccaggt ggtaggtaga 480 gctgtttgag gattacgtgg ccttcttgga tggggggtgg gggtggggtg ggagggttgg 540 gtggtgggta cttaagaggt ttcaaaagtc aatattgttt gcatttagct cttccttgta 600 cttgtggatc aaacacaacc tgtcagctac tgcttcaaat gtcatgcctg ctgccatctt 660 ctcagcagga tggtcatggc ctcaccctct tcaactgtaa atctttcttt cttttcttct 720 ttttcttttg gtttcgagac agggtttctc tgtatagtcc tggctgtcct ggaactcact 780 ttgtagacca ggctggcctt gaactcagaa atccgcctgc ctctgcctcc ctagcactgg 840 gattaaaggc gtgcgccacc acgcccagct ttcaactgga aatcttaata aactttccta 900 gaagtggcct tggttatggg agcttatcac agcaatagaa cagcaattat gactggagta 960 tgatagttaa aaacaagcaa gcaagcaagc aaacacacac accaaaacaa caaaacccca 1020 agacagagtc acatgtagcc caggctagcc tccaaattca ctatataact gaagaagacc 1080 cctaattccc attcctctag aatctatacc tcaagtactg aatggcttgg ttcacaatac 1140 cccactaaat gattggtctt actaagtgca acaaggtaaa cctaaaactt cagccctcag 1200 acatcccttt tccagtatca atttataaaa ttagatccca aggataaaaa ttaattgtaa 1260 agtaaaatca gagttctagc atcaactaca ggctcaacca tggggaccac aaataaacta 1320 aaagggataa gactggcttc cccataatta ttacatttag ataattttcc tgactactca 1380 acaaagctaa aatatcacca ctggtttatt ttctccttct agggtttaag ctcactctga 1440 ggaggggcat gcggcacaca ctcatagcat ccaggaaata gaaatatggt gactatcatg 1500 ggttcagggc caacctaggc tttagagaaa aaccttgtcc cacaaaccaa aaatgtctct 1560 tttttattct atcaggggtg gatggatttg ttaaagaagt gcttttaaaa accttgagat 1620 ggttatttag aagtccccat gggataccaa aataacccac tatttatatg cccaagcatt 1680 tcacctccac aacagtgcta tgcacccttt aacatttttg agacagtagc ccagtctagt 1740 ctttaacttg cagtgatttt tcctgattca gcttctccca gtgctggaat tataggtatg 1800 caccaccatg tgtaactaca gatgctactt aaaaattttt taaaggaatc acaaaaataa 1860 ccccctatca aatgcctagt ccctctaacc atcaccaagt gaaggatcac gcaggaaaaa 1920 aaaaatcacc agcagcacct cagaaccagg atactcagtc catcagcatc cagggccata 1980 cccacactca cagcatctcc acagtttacc agatgattca tgcttatcac tgtattgggt 2040 catctaagag tgaccatcag ggcttctgat cacagaatct agtccacttt gcagaccagt 2100 tgaagtcatg cactatatga gatagaaata ccctcttgct cattttggtc agaaattcaa 2160 ggataaaaac ccatgttttg ttaatgcaca cctccatatg attgagatca atgtgtccta 2220 attaatgtag aaaccacaac tgtaaatttc actcttttga catgaatctt tttctagaca 2280 gggtcttgga tgcagccccg actacccaga attttggaat ccaggctagc ctcaaactca 2340 aggcaatctg cttgcttcag cttctcacag gctggatcac aaacatacac cttcagaccc 2400 attttttttt cctccctccg tttttggttt ctctgtgtag ccctgggtgt ccgtggactc 2460 gctgtgtaga tctatctacc agcctctgtc ttggagtact gggattaaag ttgtgggcta 2520 ccactgcctg gctgacccag ttttatttat tttaaatata acttgacaaa aataaatttg 2580 tctaacttac tagaaatccc aagaaaacta acactggatt tagcaacagt cagaaatcgc 2640 tgaaaagaaa cagaattgat ctaacagtct tagatcactc ctagacagtt tgtaattctt 2700 gctcatggca acgtgagctc tatctaactc actctctgtg cactaatgaa tgctcagtgt 2760 ctccagaaca gcacagcttc cagggtaatc atgccaaccc acaagacttt tatagagctg 2820 tccacgactc ttcccccatt cagctcatta acaatatgat ggagctcctg tgtggaaatc 2880 aaggcacact ctggtagaaa cttgtttttt ctttccactt ttccttgggc tctgaagatt 2940 gagctgtttt ataacccaca aacatgcatt ttttacctca aaagcatcca gcaaaaactg 3000 tacaacgctt tttcaaaaaa atgtattgtg atcctcctta agaaaagcct tacttagtgt 3060 taattccttt ttctttagaa tgctggtaaa tacaaggact taggtaggct ggcttctaac 3120 agcaattcac ccacttatga tgggattaaa ggaaggcaca accatgtcca ccacaggttc 3180 tagctccccc acccacacgc ccagagaggg tttttctgtg tagctctgac tattctggaa 3240 ttcacactgc agaccaggct ggtctcgaac tcagagatcc accaccacat ggtttcttaa 3300 ttgtaatttt aaagaaaaaa aaaaatcctt cagttaagat tcttatgttc taggttttca 3360 caaacttacc aatgtagttt tattggaggc cattttttaa atttaatcgg agacttgaag 3420 agctattgca agaaaaaaaa tgtaggacag ttaaaatttc atgacacaca aaaggcagct 3480 acaagttttg tgtggatttc aacatgtaaa tttcgggtaa aaatgcagga aaacagttga 3540 gttcccgtgt tattagtatg ttactaataa tttcagtatg ttagtgaaaa taatcttact 3600 aaaacactgg tacctcagac aactttacat ggtgaggatt gttactttcc caatccatat 3660 agaattttaa caattttagt gtttattttg gatgaaagga aatgactatc ttttgttagc 3720 aaattaccat aagatctttt tctttagatt tctgaatact ccaaggagct catataattc 3780 catccttatt ttttcagagg ccctccctgt tcaatcacgg tataaaaaaa ggaacacatt 3840 aagatgtccc agtcctattt tctggctttt tttttccggg ggtggtggtg cggtaatcac 3900 tctctatagt ccagtctggg cttcaacgcc tggcaatccc cagcctcaag ctcccaagta 3960 ctgtcctgat aaggatagaa ggagtcgacc tccttcacgc tcccctccga ggagggctcc 4020 ttcccagctc cattccccgg tcgggagccc gtcccccacc cgagagcgcg ggcctcgtgg 4080 tcagcgcctc cgcggggaga aacaaaggcg gcggcggggg ctcaagggca ctgcgccacg 4140 ggcccgcgcc tcccccatcc ggcggcggcc acgtagccgg gagcgcgccg cagcccggag 4200 cctcgggcct cgcagctgca gagcctgaac cgctctctcc ctgcgggcct gcgacgaggc 4260 tgggggaggg gaggcccgcg ctttgtctgg agtctcggta gctgtcatcc ggctcccacc 4320 ctcatgcaca attgtcccat ctcccccacg caccggcgcg gcgcccgcct cagcgaggcc 4380 ccagccggtt tcccgcagcc cgcggcccac ggggctcgca gcctccccgc aagctcggac 4440 gcacggagca tcctaaaccc caccacacgc aagatcgaaa aaaagcaaag gcacgaactt 4500 caccgctccg atgctcaggg ccgcggatcc tgcagagtct cccgcctgcg cgcttcggtt 4560 cagccacatc cgaggggagg gggcgcgggc agctccgccg ggggggaggg ggagcaccgc 4620 ccacgccctg gccgcgcggg gcccgccggg aacgcgtcct gcggggggcg gcgcgcgcaa 4680 tgctcaccgt ccgcggcgtg gcgcccaggg ggtctcctgg ctggggggag gggggggaag 4740 gcgggcagga aggaccgcgg aggcctctct gcgtctcgga gcgcgccaaa gcggggctcc 4800 acccacctcc ttgcccggat cttgaaggcc ggggagataa acagcggggt tctttaagca 4860 ccacctctca ctaggcgcgg gatcccaagg cttgtggcat ccggggtggt acttggacta 4920 aaagtccttc tgggagggac cgagtgagaa cccctttggg acgtgtagaa atatttgtgt 4980 ggttcgagaa tatttgtgcg gacgggcttg gcaaaggcgt agctgcagag agcacgcttg 5040 ggtggagagg gccgcacgcc ccagcgccgg cctaagcccc tcccgacggc gttatttcaa 5100 actgcgcgac cgtttctccg ctccctacgc ggaggtgggg gccggaccta gttccggacg 5160 tagtaacacg ccgagcgcga gccttccgca attcacggaa cacagttgcg caagtgatgt 5220 aaagcagtcc cgctgtacct aaagggggag tgtcacgtac ttggcgtaag gagagtgtag 5280 gcccttcccg ccattggcgg cggttagggc gtttacgtaa cggcgtgacg taagcggaga 5340 cgcgttagtg gggggaaggt tctagaaaag cggcggtctc ggctccagcg gcagtagcag 5400 cggcgccggt cccgtgtgca ggagctcctt tgcggcccag tttcttggcc atcgcctgct 5460 ctccccacag cgccaggacg agtcccgtgc gcgtccgtcc gcggaggtct ttctcatctc 5520 gctcggctgc gggaaatcgg gctgaagcga ctgagtccgc gatggaggta acgggtttga 5580 aatcaatgag ttattaaaaa tggcatggcg aggccgtagg caccgcaatg gaaaccggcc 5640 acccgcctcc gtggtccggc ggaggggatg cggccactcg agtggcggtt ggccttggcg 5700 agtttctgag gggtcgttgg aggaggcctc tgattgtccg accgccttcc ccgccctcag 5760 ccgcccggcg ccatttccct cagttggggt gggggatggg aagtgcccgc cgcgaccggg 5820 ctggaccgct aaagtagcgc gtgagcgggc catcgctggc ctttcgatgt gcgcgggcct 5880 aggggctcgg ttgtgttcgc ggcggaacgt ttctggggcc cccccggctt cccggagcga 5940 gtctgcgaag ctagcttccc ctcccccctc tcccgggaac cggatttggc ggccgccatt 6000 ttcccgtctc cttcctcgcc acgattttgc tttcaacgct ttaggtttac tagtttggtt 6060 ttcttttttc accactgcgt agacgtgttt agcgattttc ctttcttttg gaagtcttca 6120 taccgtttcg aggtggattt agcgttttga gcttgggtct tcagcgtcct gcgcacctcg 6180 ctaaaggctc tctgccttcc cctcgacgaa atggcgccat tgctttctga agccaccgag 6240 gcgcggggtg ggggcggggt ggcggcgctc cacgagcttt actggaacag gcagagagaa 6300 cgtagtacaa ccgaggcctg ggcgggtggc tgaaggcagc gtcgctgcaa agagaccgtt 6360 ttatttttca taatacgtaa gattacgggt gctgtagtaa agcacttgag cattagtata 6420 gtaggaggaa gtcaaagtgg aaaaaatggg agcgctcatc aggaagctag ggaggctatg 6480 ttgagtgcag ggttactttc cttttattgc agaactttta tctgcttaaa ggatcctcgg 6540 atcgaaataa ttcaaattat aagcattttt aagggaatct tcgaatttgt tggtaaagtc 6600 aacggatcct tagcacgtgg tgttcacttt aaggaagtga aatagctgac ttttcatagt 6660 tagccttcgc ttaaagcctg gttcagtgga cgaaaatcca cgtcctggct atataaaaac 6720 ttagtttggg gtcacagtgt ttgagcgtgg tcattcggtt tttttatttt ttatttgttt 6780 gaaattatga tgcatcatta cactgataag cattagcttt cgaattgaaa ggggtctcct 6840 tggttatttt ctttgactct aagcacactt ataaataaaa taaccttgtt tataatcgat 6900 agtggacgtc tggtaagttt ggaaaaaacc cgaggtaagt aaagagcttt tgctttcgtt 6960 agtgatatga aaaaacaagg tgtatttaat acttgcaact tagtttaagg aaagccaatt 7020 tactgacatt ttagtagagc taccagaaac actatttgga gtcctgatta aggcttttgt 7080 aactattttg actatttaaa acaattttgg tcgtttttat taaacatttc aaaacctaaa 7140 aattgtaaac attggctttt tgagcacatt ttggagaaac ttacaaattt aggctataca 7200 gtaaaataac ggatttgttt tataattttg ctttttcatt tcgttgtgca gtcataggtc 7260 ctggatagta tgacctaatt tatgaacatc ttgataagtt tttgtactta gctattggaa 7320 agccagtatt aagtgcctga caaaaccaga tttaaggtga tatctggagt ttcagcattc 7380 ttcatggagc ttgtttcaga gttgcaggat tttttttttt catcttgaga tacttacaat 7440 taacaccaga gggggcagct cagggaaaag caaatatgcc acttttcaga aactgaatct 7500 tggaagtggt gaatttggaa acaggttttt taaatttttt ttaaatctaa aaagtagtaa 7560 attttggact tgggttgtag aatttaatga attacaaaag aattctttaa taccctttaa 7620 atgacctaag agctgggtat ggtttttctg aatttttttg aagaaaatct aagaaagttt 7680 acgtgaatta gaagttagat cgaatattag tgactttgaa acttgtatag ctcaggcaat 7740 ttttggtgta acacaactaa tatgcagttt aacatatggt ttaaatttga tgtaagtttt 7800 ttttctcccc cccagaaaac tttagaaact gttcctttgg agaggaaaaa ggtactctac 7860 cagcaggtca cctcatattt aagaatttaa tttcctgcat acaaagaaag tgtaaataaa 7920 aattgaaatg gtatttccct ttgcagagag aaaaggaaca gttccgaaag ctctttattg 7980 gtggcttaag cttatcgata ccggtggcgc gccaattgtt aattaagatc tggcccaatg 8040 ggccgtacga atttgaggcg gaaagaacca gctgtggaat gtgtgtcagt tagggtgtgg 8100 aaagtcccca ggctccccag caggcagaag tatgcaaagc atgcatctca attagtcagc 8160 aaccaggtgt ggaaagtccc caggctcccc agcaggcaga agtatgcaaa gcatgcatct 8220 caattagtca gcaaccatag tcccgcccct aactccgccc atcccgcccc taactccgcc 8280 cagttccgcc cattctccgc cccatggctg actaattttt tttatttatg cagaggccga 8340 ggccgcctcg gcctctgagc tattccagaa gtagtgagga ggcttttttg gaggcctagg 8400 cttttgcaaa gatcgatcaa gagacaggat gaggatcgtt tcgcatgatt gaacaagatg 8460 gattgcacgc aggttctccg gccgcttggg tggagaggct attcggctat gactgggcac 8520 aacagacaat cggctgctct gatgccgccg tgttccggct gtcagcgcag gggcgcccgg 8580 ttctttttgt caagaccgac ctgtccggtg ccctgaatga actgcaagac gaggcagcgc 8640 ggctatcgtg gctggccacg acgggcgttc cttgcgcagc tgtgctcgac gttgtcactg 8700 aagcgggaag ggactggctg ctattgggcg aagtgccggg gcaggatctc ctgtcatctc 8760 accttgctcc tgccgagaaa gtatccatca tggctgatgc aatgcggcgg ctgcatacgc 8820 ttgatccggc tacctgccca ttcgaccacc aagcgaaaca tcgcatcgag cgagcacgta 8880 ctcggatgga agccggtctt gtcgatcagg atgatcaaga gcatcagggg ctcgcgccag 8940 ccgaactgtt cgccaggctc aaggcgagca tgcccgacgg cgaggatctc gtcgtgaccc 9000 atggcgatgc ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg 9060 actgtggccg gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata 9120 ttgctgaaga gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg 9180 ctcccgattc gcagcgcatc gccttctatc gccttcttga cgagttcttc tgagcgggac 9240 tctggggttc gaaatgaccg accaagcgac gcccaacctg ccatcacgag atttcgattc 9300 caccgccgcc ttctatgaaa ggttgggctt cggaatcgtt ttccgggacg ccggctggat 9360 gatcctccag cgcggggatc tcatgctgga gttcttcgcc caccctaggg ggaggctaac 9420 tgaaacacgg aaggagacaa taccggaagg aacccgcgct atgacggcaa taaaaagaca 9480 gaataaaacg cacggtgttg ggtcgtttgt tcataaacgc ggggttcggt cccagggctg 9540 gcactctgtc gataccccac cgagacccca ttggggccaa tacgcccgcg tttcttcctt 9600 ttccccaccc caccccccaa gttcgggtga aggcccaggg ctcgcagcca acgtcggggc 9660 ggcaggccct gccatagcct caaattcctt aggctcgagg gccgccaccg cggtggagct 9720 ccagcttttg ttccctttag tgagggttaa tttcgagctt ggcgtaatca tggtcatagc 9780 tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca 9840 taaagtgtaa agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct 9900 cactgcccgc tttccagtcg ggaaacctgt cgtgccagca tcgcgagcac ttttcgggga 9960 aatgtgcgcg gaacccctat ttgtttattt ttctaaatac attcaaatat gtatccgctc 10020 atgagacaat aaccctgata aatgcttcaa taatattgaa aaaggaagag tatgagtatt 10080 caacatttcc gtgtcgccct tattcccttt tttgcggcat tttgccttcc tgtttttgct 10140 cacccagaaa cgctggtgaa agtaaaagat gctgaagatc agttgggtgc acgagtgggt 10200 tacatcgaac tggatctcaa cagcggtaag atccttgaga gttttcgccc cgaagaacgt 10260 tttccaatga tgagcacttt taaagttctg ctatgtggcg cggtattatc ccgtattgac 10320 gccgggcaag agcaactcgg tcgccgcata cactattctc agaatgactt ggttgagtac 10380 tcaccagtca cagaaaagca tcttacggat ggcatgacag taagagaatt atgcagtgct 10440 gccataacca tgagtgataa cactgcggcc aacttacttc tgacaacgat cggaggaccg 10500 aaggagctaa ccgctttttt gcacaacatg ggggatcatg taactcgcct tgatcgttgg 10560 gaaccggagc tgaatgaagc cataccaaac gacgagcgtg acaccacgat gcctgtagca 10620 atggcaacaa cgttgcgcaa actattaact ggcgaactac ttactctagc ttcccggcaa 10680 caattaatag actggatgga ggcggataaa gttgcaggac cacttctgcg ctcggccctt 10740 ccggctggct ggtttattgc tgataaatct ggagccggtg agcgtgggtc tcgcggtatc 10800 attgcagcac tggggccaga tggtaagccc tcccgtatcg tagttatcta cacgacgggg 10860 agtcaggcaa ctatggatga acgaaataga cagatcgctg agataggtgc ctcactgatt 10920 aagcattggt aactgtcaga ctcgcgacac tgcattaatg aatcggccaa cgcgcgggga 10980 gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 11040 tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 11100 aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 11160 gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 11220 aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 11280 ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 11340 tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 11400 tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 11460 ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 11520 tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 11580 ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca gtatttggta 11640 tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 11700 aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 11760 aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 11820 aaaactca 11828 <210> 14 <211> 9209 <212> DNA <213> Artificial Sequence <220> <223> Plasmid <400> 14 cgttgtaaaa cgacggccag tgaattgtaa tacgactcac tatagggcga attgggtacc 60 gggccccccc tcgaagttta aacatttaaa tctagaacta gtggatcccc cgggctgcag 120 gaattcgata tcaagctcat ggcacctgta ttgtactctt atcagtcatt atatggactt 180 taacttcccc agatattatt tgggctcctc cataagactg tgagcatctg accactggag 240 tgttgcttcc cattatatcc ctgttatcaa gcacaaggtc aggcacagag taagactcaa 300 aacatgtttt ggaatgtatg actggtatga actacaaacc agtaagctga tgttttcatt 360 ttgagtctat aaatctaatt ttgtggtggt tttgtgtatg gctcaaggct caaattgtaa 420 aatttaatat tatgtgacca aagaaagtta tacccagaac ctcaatttcc tcaccttcaa 480 aatggggcag tttctcactc attggtctgc tgtcacgatt ttaatgagct catgcacaaa 540 cagcccttta tataaggtaa gtgctggata aatgttggct actataataa aataagcctc 600 taagatactt ggtcagcaca agtactaccc aagagtatgc actgtaagta aactgacaaa 660 attgtgtatc taaaactggc cagatgaaag agaaactttt aaggggccct tctgcgtgcc 720 cgacactgtg ctaggcactc acactatccc gacccgagaa accgatctgc gacccagagg 780 aacttaccaa gcctccagca tcttgtgcag ccctactcat gggaccatct ggatacccac 840 ccttgtcttt acagggagca gaacacacct cttatgtgtc agaaaacaaa gtccaggaag 900 tatattttta cctgaggcaa tatctgaaaa ttgtatgcta cagcctccaa agtgagtctt 960 cctctcagta cctctcttct aggcacatgg agccctttct tccaagtatt atgtttaacc 1020 acttaatgaa tgaagtcctg aaactgctta cccatgctcc ctataatctc tgagtaatct 1080 tccttttcca caacctcagg cataatctca tcttctgttt ctattacaat ttcaaattct 1140 ggaaaaagga agttgtggtc tggaattata tggtccagat gatctgaaac aaaaaggaca 1200 gcactattag taatcattta gttttgaaga cagtctaata atttgctgtc tctaaagtac 1260 tatattccct atagttctgg cattttagat aaagggtcat aaattaaatg cctatatggt 1320 gacattattc agtgattcag acttcacagc cttttttttt tttttacaaa ggtgttccag 1380 gcatgaaaaa ttttaaagta ctataccttt cctaatttta cctttaaagt tgtcctggaa 1440 atatctgggt tgacaaaggc gatgaaactg aactgagact taaaaaaaag attacccacc 1500 tggttgtgca caagcctgct tatgtcccaa tctccagtct agggtctgat gctccttgct 1560 gcagtaatat gctttgtggc atctggagca cgttttgggg cctaaacagc cacaaaccct 1620 gcagagatga gcaccagact taagctggag acacactgat tctcctgttt ctgggggagg 1680 attctcagaa ggtggctcat atgagtaaaa atcgtttttc ctgggtagtt gattcctaaa 1740 aactaaaaaa gaatacagag aaaagtttta tcttcaaaca aaacagcaat tcacatattt 1800 tatcctctgc acgtaaaact gaaaataaca acaacaaaaa agaaatgaaa gtttttgctt 1860 tcaggaataa gcttttaaaa tccagaaact agatttcgtc cggtacacgc aactgagttg 1920 cctcctagag gtggtttgag ttaatcaaat taataagact gatcgttaag aacgactgcc 1980 aaaaatacga aaaagctact gggatccatc tttccaagac aatttctatt atctgaatta 2040 acaccatacc tggtacccac tgattaaaag ctgggggtta ccaatgcgcg tgggcacagt 2100 tagaagctta tgtagcaaaa atgagcacat cctggaaggg cccgggagaa ggtgctcctg 2160 gggcagcgcg gagagggagc tctgaggctg gggcggcagc ggtgcttgcc gccgtccccc 2220 tggtcgctcc cggaattaac gccgcgcacg cgtcggaggc atggccccgt cccgaccccg 2280 tttggcggct cacctcgcag gccggcacag cacggctgct cgcggcagca gaagaggaag 2340 atgcagcggt ggaaggcgtc cgggcggcca ggcagcggcg catacacctg cagcaggaag 2400 gagagcgggc ggccgcacag ctcgcaggcc agggcctggg gccccggcag cccggccgcg 2460 cccagccatg ccggccgccc gcccaccttg ctggggaact gctcgctgcg cagtcgccac 2520 gccggcgccg actcggcgaa gcccagctcc acaggcctgg ccccggcggc agccatgcgg 2580 ggcgcgggct ggcgtggggc gcagcccaca gctgggtcgg aaggcggaaa tcgggcgccg 2640 ggccggaagg caagaggcgg gcacctttcc ggaggacagg aggcggaaac gcgtctgacg 2700 ggagcggttg caggaccaat gcgagggaac ggggcagagg aaacctctcg gcatcagccc 2760 cgcccctggc gcctctgcct ccgagccgct ttcctggtgc ctccgggtgc tctgggatgg 2820 ttctggtctt tgggagagtg gcagctggtg acggcgctcc gctcacctct gcacatgtct 2880 tgctgtgggc ctgcgggtgg ccgccaggga ggcagagccc tcccgcaaac cttccctgct 2940 ggtgtccacc tcagggtgtg ggaaacctgt gcgctggccg agtgctaacc aagagtaggc 3000 agtgaaagac aaatgaaggt tgaacaggta aagtgaggac cctacagcgg aaaccaagaa 3060 tcctgtgtgc ctgagagtaa tgaagaagcc tctgcagaag agtcttttct gtcagtctta 3120 aggtctctgt tttaatgtta gtgctggctt gctgtacctg aattccaagg gaggagtgta 3180 taatgaggca tggccaaccc ccacttccca tcattgcctg aactagtttt tcaggttaac 3240 ttcagaatgc ccttggtacc gcgggccccc tctgtggtcc cacgccactg atcgctgcat 3300 gcccaccacc tgggtacaca cagtctgtga ttcccggagc agaacggacc ctgcccaccc 3360 ggtcttgtgt gctactcagt ggacagaccc aaggcaagaa agggtgacaa ggacagggtc 3420 ttcccaggct ggctttgagt tcctagcacc gccccgcccc caatcctctg tggcacatgg 3480 agtcttggtc cccagagtcc cccagcggcc tccagatggt ctgggagggc agttcagctg 3540 tggctgcgca tagcagacat acaacggacg gtgggcccag acccaggctg tgtagaccca 3600 gcccccccgc cccgcagtgc ctaggtcacc cactaacgcc ccaggcctgg tcttggctgg 3660 gcgtgactgt taccctcaaa agcaggcagc tccagggtaa aaggtgccct gccctgtaga 3720 gcccacttcc ttcccagggc tgcggctggg taggtttgta gccttcatca cgggccacct 3780 ccagccactg gaccgctggc ccctgccctg tcctggggag tgtggtcctg cgactctaat 3840 ggccgcaagc cacctgactc ccccaacacc acactctacc tctcaagccc aggtctctcc 3900 ctagtgaccc acccagcaca tttagctagc tgagccccac agccagaggt cctcaggccc 3960 tgctttcagg gcagttgctc tgaagtcggc aagggggagt gactgcctgg ccactccatg 4020 ccctccaaga gctccttctg caggagcgta cagaacccag ggccctggca cccgtgcaga 4080 ccctggccca ccccacctgg gcgctcagtg cccaagagat gtccacacct aggatgtccc 4140 gcggtgggtg gggggcccga gagacgggca ggccgggggc aggcctggcc atgcggggcc 4200 gaaccgggca ctgcccagcg tggggcgcgg gggccacggc gcgcgccccc agcccccggg 4260 cccagcaccc caaggcggcc aacgccaaaa ctctccctcc tcctcttcct caatctcgct 4320 ctcgctcttt ttttttttcg caaaaggagg ggagaggggg taaaaaaatg ctgcactgtg 4380 cggcgaagcc ggtgagtgag cggcgcgggg ccaatcagcg tgcgccgttc cgaaagttgc 4440 cttttatggc tcgagcggcc gcggcggcgc cctataaaac ccagcggcgc gacgcgccac 4500 caccgccgag accgcgtccg cccgcgagca cagagcctcg cctttgccga tccgccgccc 4560 gtccacaccc gccgccaggt aagcccggcc agccgaccgg ggcatgcggc cgcggccctt 4620 cgcccgtgca gagccgccgt ctgggccgca gcggggggcg catggggcgg aaccggaccg 4680 ccgtgggggg cgcgggagaa gcccctgggc ctccggagat gggggacacc ccacgccagt 4740 tcgcaggcgc gaggccgcgc tcgggcgggc gcgctccggg ggtgccgctc tcggggcggg 4800 ggcaaccggc ggggtctttg tctgagccgg gctcttgcca atggggatcg cacggtgggc 4860 gcggcgtagc ccccgtcagg cccggtgggg gctggggcgc catgcgcgtg cgcgctggtc 4920 ctttgggcgc taactgcgtg cgcgctggga attggcgcta attgcgcgtg cgcgctggga 4980 ctcaatggcg ctaatcgcgc gtgcgttctg gggcccgggc gcttgcgcca cttcctgccc 5040 gagccgctgg cgcccgaggg tgtggccgct gcgtgcgcgc gcgcgacccg gtcgctgttt 5100 gaaccgggcg gaggcggggc tggcgcccgg ttgggagggg gttggggcct ggcttcctgc 5160 cgcgcgccgc ggggacgcct ccgaccagtg tttgcctttt atggtaataa cgcggccggc 5220 ccggcttcct ttgtccccaa tctgggcgcg cgccggcgcc ccctggcggc ctaaggactc 5280 ggcgcgccgg aagtggccag ggcgggggcg acttcggctc acagcgcgcc cggctattct 5340 cgcagctcac catgccggtc gccaccatga gcttatcgat accggtggcg cgccaattgt 5400 taattaagat ctggcccaat gggccgtacg aatttgaggc ggaaagaacc agctgtggaa 5460 tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca gcaggcagaa gtatgcaaag 5520 catgcatctc aattagtcag caaccaggtg tggaaagtcc ccaggctccc cagcaggcag 5580 aagtatgcaa agcatgcatc tcaattagtc agcaaccata gtcccgcccc taactccgcc 5640 catcccgccc ctaactccgc ccagttccgc ccattctccg ccccatggct gactaatttt 5700 ttttatttat gcagaggccg aggccgcctc ggcctctgag ctattccaga agtagtgagg 5760 aggctttttt ggaggcctag gcttttgcaa agatcgatca agagacagga tgaggatcgt 5820 ttcgcatgat tgaacaagat ggattgcacg caggttctcc ggccgcttgg gtggagaggc 5880 tattcggcta tgactgggca caacagacaa tcggctgctc tgatgccgcc gtgttccggc 5940 tgtcagcgca ggggcgcccg gttctttttg tcaagaccga cctgtccggt gccctgaatg 6000 aactgcaaga cgaggcagcg cggctatcgt ggctggccac gacgggcgtt ccttgcgcag 6060 ctgtgctcga cgttgtcact gaagcgggaa gggactggct gctattgggc gaagtgccgg 6120 ggcaggatct cctgtcatct caccttgctc ctgccgagaa agtatccatc atggctgatg 6180 caatgcggcg gctgcatacg cttgatccgg ctacctgccc attcgaccac caagcgaaac 6240 atcgcatcga gcgagcacgt actcggatgg aagccggtct tgtcgatcag gatgatcaag 6300 agcatcaggg gctcgcgcca gccgaactgt tcgccaggct caaggcgagc atgcccgacg 6360 gcgaggatct cgtcgtgacc catggcgatg cctgcttgcc gaatatcatg gtggaaaatg 6420 gccgcttttc tggattcatc gactgtggcc ggctgggtgt ggcggaccgc tatcaggaca 6480 tagcgttggc tacccgtgat attgctgaag agcttggcgg cgaatgggct gaccgcttcc 6540 tcgtgcttta cggtatcgcc gctcccgatt cgcagcgcat cgccttctat cgccttcttg 6600 acgagttctt ctgagcggga ctctggggtt cgaaatgacc gaccaagcga cgcccaacct 6660 gccatcacga gatttcgatt ccaccgccgc cttctatgaa aggttgggct tcggaatcgt 6720 tttccgggac gccggctgga tgatcctcca gcgcggggat ctcatgctgg agttcttcgc 6780 ccaccctagg gggaggctaa ctgaaacacg gaaggagaca ataccggaag gaacccgcgc 6840 tatgacggca ataaaaagac agaataaaac gcacggtgtt gggtcgtttg ttcataaacg 6900 cggggttcgg tcccagggct ggcactctgt cgatacccca ccgagacccc attggggcca 6960 atacgcccgc gtttcttcct tttccccacc ccacccccca agttcgggtg aaggcccagg 7020 gctcgcagcc aacgtcgggg cggcaggccc tgccatagcc tcaaattcct taggctcgag 7080 ggccgccacc gcggtggagc tccagctttt gttcccttta gtgagggtta atttcgagct 7140 tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg ttatccgctc acaattccac 7200 acaacatacg agccggaagc ataaagtgta aagcctgggg tgcctaatga gtgagctaac 7260 tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc 7320 atcgcgagca cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt tttctaaata 7380 cattcaaata tgtatccgct catgagacaa taaccctgat aaatgcttca ataatattga 7440 aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc ttattccctt ttttgcggca 7500 ttttgccttc ctgtttttgc tcacccagaa acgctggtga aagtaaaaga tgctgaagat 7560 cagttgggtg cacgagtggg ttacatcgaa ctggatctca acagcggtaa gatccttgag 7620 agttttcgcc ccgaagaacg ttttccaatg atgagcactt ttaaagttct gctatgtggc 7680 gcggtattat cccgtattga cgccgggcaa gagcaactcg gtcgccgcat acactattct 7740 cagaatgact tggttgagta ctcaccagtc acagaaaagc atcttacgga tggcatgaca 7800 gtaagagaat tatgcagtgc tgccataacc atgagtgata acactgcggc caacttactt 7860 ctgacaacga tcggaggacc gaaggagcta accgcttttt tgcacaacat gggggatcat 7920 gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa cgacgagcgt 7980 gacaccacga tgcctgtagc aatggcaaca acgttgcgca aactattaac tggcgaacta 8040 cttactctag cttcccggca acaattaata gactggatgg aggcggataa agttgcagga 8100 ccacttctgc gctcggccct tccggctggc tggtttattg ctgataaatc tggagccggt 8160 gagcgtgggt ctcgcggtat cattgcagca ctggggccag atggtaagcc ctcccgtatc 8220 gtagttatct acacgacggg gagtcaggca actatggatg aacgaaatag acagatcgct 8280 gagataggtg cctcactgat taagcattgg taactgtcag actcgcgaca ctgcattaat 8340 gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc 8400 tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg 8460 cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag 8520 gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 8580 gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 8640 gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 8700 ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc 8760 atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg 8820 tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt 8880 ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca 8940 gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca 9000 ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag 9060 ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca 9120 agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg 9180 ggtctgacgc tcagtggaac gaaaactca 9209 <210> 15 <211> 7898 <212> DNA <213> Mus musculus <220> <223> Mouse hnRNP A2 HIndIII fragment <400> 15 aagcttttaa ccctctatcc ctttaaactt ccttgatcca gtgtaagcac ctcctagaaa 60 gtcagtagac aataaaacaa aagttctgct tcaccgattt acatttataa ccaaataccc 120 ttcaccaata caataaaaaa acaaaacaac aaaaaacccc aaccatctga gaaataatct 180 tctcctttcc cagctttatt cccaggattc tacatgacca aattaccaga gtcaccactc 240 attttaatca caacatagtg tcaaataact agaaaacatg agacaacaat ggagagctga 300 gtaactatta gtagtagtac tttaccagag aatggcctct ataggctcac atgtaggaat 360 ggttggtccc caggtggtag gtagagctgt ttgaggatta cgtggccttc ttggatgggg 420 ggtgggggtg gggtgggagg gttgggtggt gggtacttaa gaggtttcaa aagtcaatat 480 tgtttgcatt tagctcttcc ttgtacttgt ggatcaaaca caacctgtca gctactgctt 540 caaatgtcat gcctgctgcc atcttctcag caggatggtc atggcctcac cctcttcaac 600 tgtaaatctt tctttctttt cttctttttc ttttggtttc gagacagggt ttctctgtat 660 agtcctggct gtcctggaac tcactttgta gaccaggctg gccttgaact cagaaatccg 720 cctgcctctg cctccctagc actgggatta aaggcgtgcg ccaccacgcc cagctttcaa 780 ctggaaatct taataaactt tcctagaagt ggccttggtt atgggagctt atcacagcaa 840 tagaacagca attatgactg gagtatgata gttaaaaaca agcaagcaag caagcaaaca 900 cacacaccaa aacaacaaaa ccccaagaca gagtcacatg tagcccaggc tagcctccaa 960 attcactata taactgaaga agacccctaa ttcccattcc tctagaatct atacctcaag 1020 tactgaatgg cttggttcac aataccccac taaatgattg gtcttactaa gtgcaacaag 1080 gtaaacctaa aacttcagcc ctcagacatc ccttttccag tatcaattta taaaattaga 1140 tcccaaggat aaaaattaat tgtaaagtaa aatcagagtt ctagcatcaa ctacaggctc 1200 aaccatgggg accacaaata aactaaaagg gataagactg gcttccccat aattattaca 1260 tttagataat tttcctgact actcaacaaa gctaaaatat caccactggt ttattttctc 1320 cttctagggt ttaagctcac tctgaggagg ggcatgcggc acacactcat agcatccagg 1380 aaatagaaat atggtgacta tcatgggttc agggccaacc taggctttag agaaaaacct 1440 tgtcccacaa accaaaaatg tctctttttt attctatcag gggtggatgg atttgttaaa 1500 gaagtgcttt taaaaacctt gagatggtta tttagaagtc cccatgggat accaaaataa 1560 cccactattt atatgcccaa gcatttcacc tccacaacag tgctatgcac cctttaacat 1620 ttttgagaca gtagcccagt ctagtcttta acttgcagtg atttttcctg attcagcttc 1680 tcccagtgct ggaattatag gtatgcacca ccatgtgtaa ctacagatgc tacttaaaaa 1740 ttttttaaag gaatcacaaa aataaccccc tatcaaatgc ctagtccctc taaccatcac 1800 caagtgaagg atcacgcagg aaaaaaaaaa tcaccagcag cacctcagaa ccaggatact 1860 cagtccatca gcatccaggg ccatacccac actcacagca tctccacagt ttaccagatg 1920 attcatgctt atcactgtat tgggtcatct aagagtgacc atcagggctt ctgatcacag 1980 aatctagtcc actttgcaga ccagttgaag tcatgcacta tatgagatag aaataccctc 2040 ttgctcattt tggtcagaaa ttcaaggata aaaacccatg ttttgttaat gcacacctcc 2100 atatgattga gatcaatgtg tcctaattaa tgtagaaacc acaactgtaa atttcactct 2160 tttgacatga atctttttct agacagggtc ttggatgcag ccccgactac ccagaatttt 2220 ggaatccagg ctagcctcaa actcaaggca atctgcttgc ttcagcttct cacaggctgg 2280 atcacaaaca tacaccttca gacccatttt tttttcctcc ctccgttttt ggtttctctg 2340 tgtagccctg ggtgtccgtg gactcgctgt gtagatctat ctaccagcct ctgtcttgga 2400 gtactgggat taaagttgtg ggctaccact gcctggctga cccagtttta tttattttaa 2460 atataacttg acaaaaataa atttgtctaa cttactagaa atcccaagaa aactaacact 2520 ggatttagca acagtcagaa atcgctgaaa agaaacagaa ttgatctaac agtcttagat 2580 cactcctaga cagtttgtaa ttcttgctca tggcaacgtg agctctatct aactcactct 2640 ctgtgcacta atgaatgctc agtgtctcca gaacagcaca gcttccaggg taatcatgcc 2700 aacccacaag acttttatag agctgtccac gactcttccc ccattcagct cattaacaat 2760 atgatggagc tcctgtgtgg aaatcaaggc acactctggt agaaacttgt tttttctttc 2820 cacttttcct tgggctctga agattgagct gttttataac ccacaaacat gcatttttta 2880 cctcaaaagc atccagcaaa aactgtacaa cgctttttca aaaaaatgta ttgtgatcct 2940 ccttaagaaa agccttactt agtgttaatt cctttttctt tagaatgctg gtaaatacaa 3000 ggacttaggt aggctggctt ctaacagcaa ttcacccact tatgatggga ttaaaggaag 3060 gcacaaccat gtccaccaca ggttctagct cccccaccca cacgcccaga gagggttttt 3120 ctgtgtagct ctgactattc tggaattcac actgcagacc aggctggtct cgaactcaga 3180 gatccaccac cacatggttt cttaattgta attttaaaga aaaaaaaaaa tccttcagtt 3240 aagattctta tgttctaggt tttcacaaac ttaccaatgt agttttattg gaggccattt 3300 tttaaattta atcggagact tgaagagcta ttgcaagaaa aaaaatgtag gacagttaaa 3360 atttcatgac acacaaaagg cagctacaag ttttgtgtgg atttcaacat gtaaatttcg 3420 ggtaaaaatg caggaaaaca gttgagttcc cgtgttatta gtatgttact aataatttca 3480 gtatgttagt gaaaataatc ttactaaaac actggtacct cagacaactt tacatggtga 3540 ggattgttac tttcccaatc catatagaat tttaacaatt ttagtgttta ttttggatga 3600 aaggaaatga ctatcttttg ttagcaaatt accataagat ctttttcttt agatttctga 3660 atactccaag gagctcatat aattccatcc ttattttttc agaggccctc cctgttcaat 3720 cacggtataa aaaaaggaac acattaagat gtcccagtcc tattttctgg cttttttttt 3780 ccgggggtgg tggtgcggta atcactctct atagtccagt ctgggcttca acgcctggca 3840 atccccagcc tcaagctccc aagtactgtc ctgataagga tagaaggagt cgacctcctt 3900 cacgctcccc tccgaggagg gctccttccc agctccattc cccggtcggg agcccgtccc 3960 ccacccgaga gcgcgggcct cgtggtcagc gcctccgcgg ggagaaacaa aggcggcggc 4020 gggggctcaa gggcactgcg ccacgggccc gcgcctcccc catccggcgg cggccacgta 4080 gccgggagcg cgccgcagcc cggagcctcg ggcctcgcag ctgcagagcc tgaaccgctc 4140 tctccctgcg ggcctgcgac gaggctgggg gaggggaggc ccgcgctttg tctggagtct 4200 cggtagctgt catccggctc ccaccctcat gcacaattgt cccatctccc ccacgcaccg 4260 gcgcggcgcc cgcctcagcg aggccccagc cggtttcccg cagcccgcgg cccacggggc 4320 tcgcagcctc cccgcaagct cggacgcacg gagcatccta aaccccacca cacgcaagat 4380 cgaaaaaaag caaaggcacg aacttcaccg ctccgatgct cagggccgcg gatcctgcag 4440 agtctcccgc ctgcgcgctt cggttcagcc acatccgagg ggagggggcg cgggcagctc 4500 cgccgggggg gagggggagc accgcccacg ccctggccgc gcggggcccg ccgggaacgc 4560 gtcctgcggg gggcggcgcg cgcaatgctc accgtccgcg gcgtggcgcc cagggggtct 4620 cctggctggg gggagggggg ggaaggcggg caggaaggac cgcggaggcc tctctgcgtc 4680 tcggagcgcg ccaaagcggg gctccaccca cctccttgcc cggatcttga aggccgggga 4740 gataaacagc ggggttcttt aagcaccacc tctcactagg cgcgggatcc caaggcttgt 4800 ggcatccggg gtggtacttg gactaaaagt ccttctggga gggaccgagt gagaacccct 4860 ttgggacgtg tagaaatatt tgtgtggttc gagaatattt gtgcggacgg gcttggcaaa 4920 ggcgtagctg cagagagcac gcttgggtgg agagggccgc acgccccagc gccggcctaa 4980 gcccctcccg acggcgttat ttcaaactgc gcgaccgttt ctccgctccc tacgcggagg 5040 tgggggccgg acctagttcc ggacgtagta acacgccgag cgcgagcctt ccgcaattca 5100 cggaacacag ttgcgcaagt gatgtaaagc agtcccgctg tacctaaagg gggagtgtca 5160 cgtacttggc gtaaggagag tgtaggccct tcccgccatt ggcggcggtt agggcgttta 5220 cgtaacggcg tgacgtaagc ggagacgcgt tagtgggggg aaggttctag aaaagcggcg 5280 gtctcggctc cagcggcagt agcagcggcg ccggtcccgt gtgcaggagc tcctttgcgg 5340 cccagtttct tggccatcgc ctgctctccc cacagcgcca ggacgagtcc cgtgcgcgtc 5400 cgtccgcgga ggtctttctc atctcgctcg gctgcgggaa atcgggctga agcgactgag 5460 tccgcgatgg aggtaacggg tttgaaatca atgagttatt aaaaatggca tggcgaggcc 5520 gtaggcaccg caatggaaac cggccacccg cctccgtggt ccggcggagg ggatgcggcc 5580 actcgagtgg cggttggcct tggcgagttt ctgaggggtc gttggaggag gcctctgatt 5640 gtccgaccgc cttccccgcc ctcagccgcc cggcgccatt tccctcagtt ggggtggggg 5700 atgggaagtg cccgccgcga ccgggctgga ccgctaaagt agcgcgtgag cgggccatcg 5760 ctggcctttc gatgtgcgcg ggcctagggg ctcggttgtg ttcgcggcgg aacgtttctg 5820 gggccccccc ggcttcccgg agcgagtctg cgaagctagc ttcccctccc ccctctcccg 5880 ggaaccggat ttggcggccg ccattttccc gtctccttcc tcgccacgat tttgctttca 5940 acgctttagg tttactagtt tggttttctt ttttcaccac tgcgtagacg tgtttagcga 6000 ttttcctttc ttttggaagt cttcataccg tttcgaggtg gatttagcgt tttgagcttg 6060 ggtcttcagc gtcctgcgca cctcgctaaa ggctctctgc cttcccctcg acgaaatggc 6120 gccattgctt tctgaagcca ccgaggcgcg gggtgggggc ggggtggcgg cgctccacga 6180 gctttactgg aacaggcaga gagaacgtag tacaaccgag gcctgggcgg gtggctgaag 6240 gcagcgtcgc tgcaaagaga ccgttttatt tttcataata cgtaagatta cgggtgctgt 6300 agtaaagcac ttgagcatta gtatagtagg aggaagtcaa agtggaaaaa atgggagcgc 6360 tcatcaggaa gctagggagg ctatgttgag tgcagggtta ctttcctttt attgcagaac 6420 ttttatctgc ttaaaggatc ctcggatcga aataattcaa attataagca tttttaaggg 6480 aatcttcgaa tttgttggta aagtcaacgg atccttagca cgtggtgttc actttaagga 6540 agtgaaatag ctgacttttc atagttagcc ttcgcttaaa gcctggttca gtggacgaaa 6600 atccacgtcc tggctatata aaaacttagt ttggggtcac agtgtttgag cgtggtcatt 6660 cggttttttt attttttatt tgtttgaaat tatgatgcat cattacactg ataagcatta 6720 gctttcgaat tgaaaggggt ctccttggtt attttctttg actctaagca cacttataaa 6780 taaaataacc ttgtttataa tcgatagtgg acgtctggta agtttggaaa aaacccgagg 6840 taagtaaaga gcttttgctt tcgttagtga tatgaaaaaa caaggtgtat ttaatacttg 6900 caacttagtt taaggaaagc caatttactg acattttagt agagctacca gaaacactat 6960 ttggagtcct gattaaggct tttgtaacta ttttgactat ttaaaacaat tttggtcgtt 7020 tttattaaac atttcaaaac ctaaaaattg taaacattgg ctttttgagc acattttgga 7080 gaaacttaca aatttaggct atacagtaaa ataacggatt tgttttataa ttttgctttt 7140 tcatttcgtt gtgcagtcat aggtcctgga tagtatgacc taatttatga acatcttgat 7200 aagtttttgt acttagctat tggaaagcca gtattaagtg cctgacaaaa ccagatttaa 7260 ggtgatatct ggagtttcag cattcttcat ggagcttgtt tcagagttgc aggatttttt 7320 tttttcatct tgagatactt acaattaaca ccagaggggg cagctcaggg aaaagcaaat 7380 atgccacttt tcagaaactg aatcttggaa gtggtgaatt tggaaacagg ttttttaaat 7440 tttttttaaa tctaaaaagt agtaaatttt ggacttgggt tgtagaattt aatgaattac 7500 aaaagaattc tttaataccc tttaaatgac ctaagagctg ggtatggttt ttctgaattt 7560 ttttgaagaa aatctaagaa agtttacgtg aattagaagt tagatcgaat attagtgact 7620 ttgaaacttg tatagctcag gcaatttttg gtgtaacaca actaatatgc agtttaacat 7680 atggtttaaa tttgatgtaa gttttttttc tcccccccag aaaactttag aaactgttcc 7740 tttggagagg aaaaaggtac tctaccagca ggtcacctca tatttaagaa tttaatttcc 7800 tgcatacaaa gaaagtgtaa ataaaaattg aaatggtatt tccctttgca gagagaaaag 7860 gaacagttcc gaaagctctt tattggtggc ttaagctt 7898 19

Claims (64)

  1. 하기 구성요소들을 포함하는 단리된 폴리뉴클레오티드를 포함하는 벡터:
    a. 이중의, 분기적으로 전사되는 프로모터를 포함하는 확장된 메틸화-결여 CpG 아일랜드;
    b. 폴리아데닐화 시그날에 의해 종결된 발현가능한 핵산;
    c. 프로모터에 작동가능하게 연결된 선별가능한 마커 유전자;
    여기서, CpG 아일랜드와 선별가능한 마커 모두 상기 발현가능한 핵산에 작동가능하게 연결되어 있고, 상기 구성요소들은, 상기 발현가능한 핵산의 센스 스트랜드에 대하여 5'에서 3'의 배향으로, 확장된 메틸화-결여 CpG 아일랜드, 발현가능한 핵산, 선별가능한 마커 유전자의 순서로 배치되고, 그리고 상기 발현가능한 핵산의 3'말단에 폴리아데닐화 시그날이 상기 선별가능한 마커의 인접 말단의 2000bp 이내에 있도록 상기 벡터가 선형화 및 염색체로 통합될 수 있는 것을 특징으로 하는 벡터.
  2. 제 1항에 있어서, 상기 발현가능한 핵산의 3'말단에 폴리아데닐화 시그날이 상기 선별가능한 마커의 인접 말단의 1500bp 이내에 있는 벡터.
  3. 제 2항에 있어서, 상기 발현가능한 핵산의 3'말단에 폴리아데닐화 시그날이 상기 선별가능한 마커의 인접 말단의 1000bp 이내에 있는 벡터.
  4. 제 3항에 있어서, 상기 발현가능한 핵산의 3'말단에 폴리아데닐화 시그날이 상기 선별가능한 마커의 인접 말단의 500bp 이내에 있는 벡터.
  5. 제 1항에 있어서, 상기 선별가능한 마커는 항생물질 내성 유전자인 벡터.
  6. 제 5항에 있어서, 상기 항생물질 내성 유전자는 스트렙토미세스(Streptomyces) 종에서 얻어지는 것인 벡터.
  7. 제 5항에 있어서, 상기 항생물질 내성 유전자는 퓨로마이신 내성 유전자; 네오마이신 내성 유전자; 하이그로마이신 내성 유전자; 블레오마이신 내성 유전자; 및 블라스티시딘 내성 유전자로 이루어진 군으로부터 선택되는 것인 벡터.
  8. 제 7항에 있어서, 상기 퓨로마이신 내성 유전자는 스트렙토미세스 알보나이저(Streptomyces alboniger)로부터 유래된 변형 퓨로마이신 N-아세틸 트랜스퍼라제 유전자인 벡터.
  9. 제 7항에 있어서, 상기 네오마이신 내성 유전자는 스트렙토미세스 프라디애(Streptomyces fradiae)로부터 유래된 아미노글리코시드 포스포트랜스퍼라제 유전자인 벡터.
  10. 제 7항에 있어서, 상기 하이그로마이신 내성 유전자는 스트렙토미세스 하이그로스코피쿠스(Streptomyces hygroscopicus)로부터 유래된 하이그로마이신 포스포트랜스퍼라제 유전자인 벡터.
  11. 제 7항에 있어서, 상기 블레오마이신 내성 유전자는 스트렙토미세스 베르티실루스(Streptomyces verticillus)로부터 유래된 블레오마이신 N-아세틸트랜스퍼라제인 벡터.
  12. 제 7항에 있어서, 상기 블라스티시딘 내성 유전자는 스트렙토미세스 베르티실룸(Streptomyces verticillum)으로부터 유래된 블라스티시딘 S-아세틸트란스퍼라제 유전자인 벡터.
  13. 제 1항 내지 제 5항 중 어느 하나의 항에 있어서, 상기 선별가능한 마커는 대장균(Escherichia coli)으로부터 유래된 항생물질 내성 유전자 아미노시클리톨 포스포트랜스퍼라제인 벡터.
  14. 제 1항 내지 제 5항 중 어느 하나의 항에 있어서, 상기 선별가능한 마커는 트란스포손 Tn5로부터 유래된 항생물질 내성 유전자 네오마이신 포스포트랜스퍼라제인 벡터.
  15. 제 1항 내지 제 12항 중 어느 하나의 항에 있어서, 상기 확장된 메틸화-결여 CpG 아일랜드는 인간 hnRNP(heterogeneous nuclear ribonucleoprotein) A2/B1 유전자에 걸쳐 있는 8kb DNA 단편을 포함하는 벡터.
  16. 제 1항 내지 제 12항 중 어느 하나의 항에 있어서, 상기 확장된 메틸화-결여 CpG 아일랜드는 뮤린(쥣과) hnRNP A2/B1 유전자에 걸쳐 있는 8kb DNA 단편을 포함하는 벡터.
  17. 제 16항에 있어서, 상기 확장된 메틸화-결여 CpG 아일랜드는 도 19에 기재된 서열의 뉴클레오티드 1-7898을 포함하는 벡터.
  18. 제 1항 내지 제 12항 중 어느 하나의 항에 있어서, 상기 확장된 메틸화-결여 CpG 아일랜드는 인간 β-액틴 CpG 아일랜드/프로모터 영역에 걸쳐 있는 2.0kb DNA 단편 및 인간 PDCD2 CpG 아일랜드/프로모터 영역에 걸쳐 있는 1.8kb DNA 단편을 포함하는 벡터.
  19. 제 1항 내지 제 12항 중 어느 하나의 항에 있어서, 상기 발현가능한 핵산은 치료 핵산인 벡터.
  20. 제 1항 내지 제 12항 중 어느 하나의 항에 있어서, 상기 발현가능한 핵산은 다중 클로닝 부위 내에 함유되고, 상기 다중 클로닝 부위는 추가로 프로모터에 작동가능하게 연결되어 있는 벡터.
  21. 제 20항에 있어서, 상기 프로모터는 사이토메갈로바이러스 즉시/초기 프로모터인 벡터.
  22. 제 1항에 있어서, 도 10에 기재된 서열의 뉴클레오티드 1-10551을 포함하는 벡터.
  23. 제 1항 내지 제 12항 중 어느 하나의 항에 있어서, 상기 발현가능한 핵산은 인 비트로 세포 배양 시스템에서 발현하기 위한 재조합 단백질을 코드화하는 것인 벡터.
  24. 삭제
  25. 제 1항에 있어서, 도 12의 서열의 뉴클레오티드 1-13545를 포함하는 벡터.
  26. 제 25항에 있어서, 퓨로마이신 내성 유전자가 도 15의 서열을 갖는 스트렙토미세스 프라디애(Streptomyces fradiae)로부터 유래된 아미노글리코시드 포스포트랜스퍼라제 유전자로 대체된 벡터.
  27. 제 25항에 있어서, 퓨로마이신 내성 유전자가 도 17의 서열을 갖는 대장균(Escherichia coli)으로부터 유래된 아미노시클리톨 포스포트랜스퍼라제 유전자로 대체된 벡터.
  28. 제 25항에 있어서, 퓨로마이신 내성 유전자가 도 14의 서열을 갖는 스트렙토미세스 알보나이저(Streptomyces alboniger)로부터 유래된 퓨로마이신 N-아세틸 트랜스퍼라제 유전자의 변형된 형태로 대체된 벡터.
  29. 제 25항에 있어서, 인간 IE CMV 프로모터가 뮤린 IE CMV 프로모터로 대체된 벡터.
  30. 제 25항에 있어서, 인간 hnRNP A2/B1 유전자에 걸쳐 있는 8kb DNA 단편을 포함하는 확장된 메틸화-결여 CpG 아일랜드가 도 19의 서열을 갖는 뮤린 hnRNP A2/B1 유전자에 걸쳐 있는 8kb DNA 단편을 포함하는 확장된 메틸화-결여 CpG 아일랜드로 대체된 벡터.
  31. 제 1항에 있어서, 도 21에 기재된 서열의 뉴클레오티드 1-12039를 포함하는 벡터.
  32. 제 1항에 있어서, 도 23에 기재된 서열의 뉴클레오티드 1-11646을 포함하는 벡터.
  33. 제 1항에 있어서, 도 25에 기재된 서열의 뉴클레오티드 1-9027을 포함하는 벡터.
  34. 제 1항에 있어서, 도 27에 기재된 서열의 뉴클레오티드 1-12221을 포함하는 벡터.
  35. 제 1항에 있어서, 도 29에 기재된 서열의 뉴클레오티드 1-11828을 포함하는 벡터.
  36. 제 1항에 있어서, 도 31에 기재된 서열의 뉴클레오티드 1-9209를 포함하는 벡터.
  37. 제 1항 내지 제 12항 중 어느 한 항에 따른 벡터로 트랜스펙션된 숙주세포.
  38. 제 1항 내지 제 12항 중 어느 한 항에 따른 벡터, 또는 상기 벡터로 트랜스펙션된 숙주세포를 사용하여 발현가능한 핵산의 발현을 얻는 방법.
  39. 세포 배양 시스템에서 제 1항 내지 제 12항 중 어느 한 항에 따른 벡터, 또는 상기 벡터로 트랜스펙션된 숙주세포를 사용하여 원하는 유전자 생성물의 발현을 얻는 방법.
  40. 제 1항 내지 제 12항 중 어느 한 항에 따른 벡터, 또는 상기 벡터로 트랜스펙션된 숙주세포를 포함하는 약제.
  41. 제 1항 내지 제 12항 중 어느 한 항에 따른 벡터, 또는 상기 벡터로 트랜스펙션된 숙주세포를 이용한 유전자 요법으로서, 인간 이외의 대상을 치료하기 위한 것인 유전자 요법.
  42. 제 1항 내지 제 12항 중 어느 한 항에 따른 벡터, 또는 상기 벡터로 트랜스펙션된 숙주세포를 포함하는 유전자 요법으로 치료될 수 있는 질병 치료용 약제.
  43. 약제학적으로 허용가능한 부형제와 함께 제 1항 내지 제 12항 중 어느 한 항에 따른 벡터, 또는 상기 벡터로 트랜스펙션된 숙주세포를 포함하는 약제학적 조성물.
  44. 삭제
  45. 삭제
  46. 삭제
  47. 삭제
  48. 삭제
  49. 삭제
  50. 삭제
  51. 삭제
  52. 삭제
  53. 삭제
  54. 삭제
  55. 삭제
  56. 삭제
  57. 삭제
  58. 삭제
  59. 삭제
  60. 삭제
  61. 삭제
  62. 삭제
  63. 삭제
  64. 삭제
KR1020037012782A 2001-04-05 2002-04-05 개량된 유전자 발현 KR100955756B1 (ko)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US28160501P 2001-04-05 2001-04-05
GB0108605.7 2001-04-05
US60/281,605 2001-04-05
GB0108605A GB0108605D0 (en) 2001-04-05 2001-04-05 Improved gene expression
GB0109335A GB0109335D0 (en) 2001-04-17 2001-04-17 Improved gene expression
GB0109335.0 2001-04-17
US29867501P 2001-06-15 2001-06-15
US60/298,675 2001-06-15
PCT/GB2002/001479 WO2002081677A2 (en) 2001-04-05 2002-04-05 Improved gene expression

Publications (2)

Publication Number Publication Date
KR20040016848A KR20040016848A (ko) 2004-02-25
KR100955756B1 true KR100955756B1 (ko) 2010-04-30

Family

ID=44695696

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020037012782A KR100955756B1 (ko) 2001-04-05 2002-04-05 개량된 유전자 발현

Country Status (3)

Country Link
KR (1) KR100955756B1 (ko)
CN (1) CN102206633A (ko)
ES (1) ES2387951T3 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112575031B (zh) * 2019-09-29 2023-04-07 新乡医学院 一种遍在染色质开放表达元件、重组表达载体、表达系统及其制备方法、应用

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000005393A2 (en) * 1998-07-21 2000-02-03 Cobra Therapeutics Limited A polynucleotide comprising a ubiquitous chromatin opening element (ucoe)

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000005393A2 (en) * 1998-07-21 2000-02-03 Cobra Therapeutics Limited A polynucleotide comprising a ubiquitous chromatin opening element (ucoe)

Also Published As

Publication number Publication date
ES2387951T3 (es) 2012-10-04
KR20040016848A (ko) 2004-02-25
CN102206633A (zh) 2011-10-05

Similar Documents

Publication Publication Date Title
AU2020260485B2 (en) Gene therapies for lysosomal disorders
AU2023214366B2 (en) Gene therapies for lysosomal disorders
DK2194137T3 (en) Cells comprising codon-optimized lentivirus particles
AU2015263150B2 (en) Lentiviral vectors
RU2758489C2 (ru) Композиции и способы для экспрессии нескольких биологически активных полипептидов с одного вектора для лечения заболеваний сердца и других патологий
US20030119104A1 (en) Chromosome-based platforms
US20040219516A1 (en) Viral vectors containing recombination sites
US20040161817A1 (en) Compositions and methods for high-level, large-scale production of recombinant proteins
KR20210143897A (ko) 오리지아스로부터의 트랜스포사제를 이용한 핵산 작제물의 진핵세포로의 통합
CN101208435A (zh) 改进的表达元件
KR20210144861A (ko) 아마이엘로이스로부터의 트랜스포사제를 이용한 핵산 작제물의 진핵세포 게놈으로의 전위
KR20210150486A (ko) 리소좀 장애에 대한 유전자 요법
CN111094569A (zh) 光控性病毒蛋白质、其基因及包含该基因的病毒载体
AU2020344628A1 (en) Compositions and methods for TCR reprogramming using fusion proteins
CN113584083A (zh) 用于逆转录病毒载体的生产细胞和包装细胞及其制备方法
US20030166890A1 (en) Gene expression
KR100955756B1 (ko) 개량된 유전자 발현
KR20240037192A (ko) 게놈 통합을 위한 방법 및 조성물
CN116323955A (zh) 通过crispr/cas介导的体内末端解析拯救重组腺病毒
KR20150021839A (ko) 암특이적 유전자를 표적하는 트랜스-스플라이싱 라이보자임의 조절 유도체를 포함하는 재조합 아데노바이러스 및 이의 용도
RU2817770C2 (ru) Интеграция конструкций нуклеиновой кислоты в эукариотические клетки с транспозазой из oryzias
RU2814721C2 (ru) Транспозиция конструкций нуклеиновой кислоты в эукариотические геномы с транспозазой из amyelois
CA2522166C (en) Lambda integrase mutein for use in recombination
TW202233830A (zh) 使用下一代工程化t細胞療法治療癌症之組合物及方法
KR20210150487A (ko) 리소좀 장애를 위한 유전자 요법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
N231 Notification of change of applicant
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130328

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee