KR100955756B1 - 개량된 유전자 발현 - Google Patents
개량된 유전자 발현 Download PDFInfo
- Publication number
- KR100955756B1 KR100955756B1 KR1020037012782A KR20037012782A KR100955756B1 KR 100955756 B1 KR100955756 B1 KR 100955756B1 KR 1020037012782 A KR1020037012782 A KR 1020037012782A KR 20037012782 A KR20037012782 A KR 20037012782A KR 100955756 B1 KR100955756 B1 KR 100955756B1
- Authority
- KR
- South Korea
- Prior art keywords
- vector
- gene
- delete delete
- nucleic acid
- cet
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H21/00—Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
- C07H21/04—Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids with deoxyribosyl as saccharide radical
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Plant Pathology (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
5' 확장된 메틸화-결여 CpG 아일랜드 및 3' 선별가능한 마커 성분의 측면에 위치되어 있는 발현가능한 핵산을 포함하는 폴리뉴클레오티드 및 벡터가 개시된다. 이러한 폴리뉴클레오티드 및 벡터는 측면의 발현가능한 핵산 발현의 높은 수준을 얻기 위한 방법을 제공한다. 바람직한 구현예는 5' 확장된 메틸화-결여 CpG 아일랜드 및 3' 항생물질 내성 유전자의 조합을 포함한다.
Description
본 발명은 선별가능한 마커(marker) 성분과 함께 도처에 있는 염색질 개방성분(ubiquitous chromatin opening element; UCOE)을 포함하는 폴리뉴클레오티드에 관한 것이다. 측면의 발현가능한 핵산 서열에 작동가능하게 연결된 때, 성분의 결합은 유전자 발현의 고도의 그리고 재현성의 수준을 제공한다. 본 발명은 또한 상기 폴리뉴클레오티드 서열을 포함하는 벡터, 상기 벡터를 포함하는 숙주세포, 및 치료요법 또는 세포 배양에서 단백질 발현을 포함하는 응용을 위한 상기 폴리뉴클레오티드, 벡터 또는 숙주세포의 용도에 관한 것이다.
고등 진핵생물의 염색질 구조에 대한 최근 모델은 유전자가 “도메인(domain)”으로 조직화되어(organized) 있다고 가정한다(Dillon, N. & Grosveld, F. Chromatin domains as potential units of eukaryotic gene function. Curr. Opin. Genet. Dev. 4, 260-264 (1994); Higgs, D.R. Do LCRs open chromatin domains? Cell 95, 299-302 (1998)). 염색질 도메인은, 응축되고 "폐쇄된" 전사적 침묵상태, 또는 탈응축되고 "개방된" 전사적 수용성(competent) 배치(configuration) 중 하나로 존재하는 것으로 관찰되었다. 증가된 DNAaseⅠ 민감성, DNA 저메틸화(hypomethylation), 및 히스톤 과아세틸화(hyperacetylation)로 특징되는 개방된 염색질 구조의 구축은 유전자 발현개시의 선행-요건으로 간주된다.
염색질 영역의 개방 및 폐쇄 성질은 숙주세포 게놈에 통합되는(integrated) 트랜스유전자(transgene)의 행위를 반영한다. 동일한 구성물이 마우스 게놈에서 다른 위치로 통합될 때, 조직-특이적 및 발생단계-특이적 발현의 다른 양상을 부여한다(Palmiter, R.D. & Brinster, R.L. Ann. Ref. Genet. 20, 465-499 (1986); Allen, N.D. et al. Nature 333, 852-855 (1988); Bonnerot, C., Grimber, G., Briand, P. & Nicolas, J.F. Proc. Natl. Acad. Sci. USA 87:6331-6335 (1990)).
위치효과 다양성(position effect variegation; PEV)라고 알려진, 주어진 트랜스제닉(transgenic) 마우스 조직 내의 다양화된 발현 양상이 또한 자주 관찰된다(Kioussis, D. & Festenstein, R. Curr. Opin. Genet. Dev. 7, 614-619 (1997)). 외인성 유전자들이 생체외 포유동물 세포 배양물의 염색체로 통합될 때, 많은 통합들이 트랜스유전자의 빠른 침묵을 초래하고, 나머지는 발현 수준에 큰 다양도(variability)를 가져온다(Pikaat, M.J. Recillas-Targa, F. & Felsenfield, G. Genes Dev. 12, 2852-2862 (1998); Fussenegger, M., Bailey, J.E., Hauser, H. & Mueller, P.P Trends Biotech. 17, 35-42 (1999)). 이러한 위치효과는 기초적 연구 및 생물공학적 응용 둘 다에 관련하여, 트랜스유전자 발현을 비효율적으로 만든다.
유전자 조직화의 염색질 도메인 모델은, 전사적으로 수용성 개방 염색질 구조를 구축하고 유지할 수 있는 유전자 조절 성분이 게놈의 활성 부위와 연관되어 있는 것임을 암시한다.
유전자좌 조절 영역(locus control region; LCRs)은 긴-범위의 염색질 리모델링 능력을 가진 전사적 조절 성분의 한 부류이다. LCRs는 cis로 연결된 유전자 상에, 특히 단일 카피 트랜스유전자에 통합 부위-독립적, 트랜스유전자 카피수-의존적인, 생리적 수준의 발현을 부여하는 그들의 능력에 의하여 형질전환 마우스에서, 기능적으로 정의된다(Fraser, P. & Grosveld, F. Curr. Opin. Cell Biol. 10, 361-365 (1998); Li, Q., Harju, S. & Peterson, K.R. Trends Genet. 15: 403-408 (1999)). 결정적으로 그러한 발현은 조직특이적이다. LCRs는 이형염색질(hetrochromatin)의 확산을 막고, PEV(Kioussis, D. & Festenstein, R. Curr. Opin. Genet. Dev. 7, 614-619 (1997))를 방해하며, 그들이 조절하는 유전자의 5' 또는 3' 중 어느 한 쪽에 위치한 일련의 DNAseⅠ과민감성(HS) 부위로 이루어진다(Li, Q., Harju, S. & Peterson, K.R. Trends Genet. 15: 403-408 (1999)).
LCRs는 두개의 분리된, 필수적이지는 않지만, 독립된 성분들로 구성된 것으로 보인다. 첫 번째는 '개방 염색질 도메인'의 구축, 그리고 두 번째는 트랜스유전자 카피수 의존적 발현을 부여하는 우세한 전사적 활성화 능력(Fraser, P. & Grosveld, F. Curr. Opin. Cell Biol. 10, 361-365 (1998)). LCRs가 그들의 기능을 발휘하는 분자적 기작은 논쟁 중으로 남아있다(Higgs, D.R. Cell 95, 2999-302 (1998); Bulger, M. & Groudine, M. Genes Dev. 13, 2465-2477 (1999); Grosveld, F. Curr. Opin. Genet. Dev. 9 152-157 (1999); Bender, M.A., Bulger, M., Close, J. & Groudine, M., Mol. Cell 5, 387-393 (2000).
치료학적 단백질 생성물을 높은 수준으로 생산하는 배양된 포유류 세포주의 생성은 주요한 발전적인 산업이다. 염색질 위치효과가 이것을 어렵고 시간소모적이며 비용이 많이 드는 과정이 되게 한다. 그러한 포유류 “세포 공장”의 생산의 가장 통상적으로 사용되는 접근은, 약물 내성 유전자(예를 들면, DHFR, 글루타민 신테타제(Kaufman RJ. Methods Enzymol 185, 536-566 (1990)) 및 스트린전트 선별적 압력의 유지의 조합에 의하여 유도된 유전자 증폭에 의존적이다. 적당한 조직으로부터 유래된 세포를 사용하는, 고도로 발현된 유전자 도메인으로부터 유래된 LCRs을 포함하는 벡터의 사용은, 안정하고 높은 수준의 발현을 나타내는 클로날 세포주의 많은 비율을 주면서, 그 과정을 매우 단순화시킨다(Needham M. Gooding C, Hudson K, Antoniou M, Grosfeld F and Hollis M. Evans S, Popplewell M, Cerillo G, McPheat J, Monk A, Jack A, Johnstone D and Hollis M. Protein Expr Purif 6, 124-131 (1995)).
그러나, 일부 환경에서 유용함에도 불구하고, LCRs의 조직특이성 또한, 이를테면, 발현이 필요한 조직에 LCR이 알려지지 않거나, 또는 모든 조직 또는 많은 조직에서 발현이 요구되는 경우에는, 많은 응용에 대한 주요한 제한이다.
본 발명자들의 함께 계류중인 특허출원 PCT/GB99/02357 (WO 2000/05393), US 09/358082, GB 0022995.5 및 US 60/252,048은, 본 발명의 참조에 나와있는데, 도처에서 발현되는, 하우스키핑 유전자(housekeeping gene)만으로 이루어진 유전자좌에 걸쳐서 개방 염색질 구조를, 그것들의 자연 염색체 구조에서, 구축할 수 있는 성분을 기재한다. 이들 성분은 LCR 유래가 아니다. 본 발명은 염색질을 개방하거나, 개 방 상태로 염색질을 유지하며, 적어도 두개의 다른 조직형 세포에서 작동가능하게 연결된 유전자의 재현성의(reproducible) 발현을 촉진시키는 염색질 개방 성분(UCOE)을 포함하는 폴리뉴클레오티드를 제공한다.
포유류의 DNA에서, 디뉴클레오티드(dinucleotide) CPG는 사이토신을 5-메틸사이토신으로 메틸화하는 DNA 메틸트랜스퍼라제 효소에 의하여 인식된다. 하지만, 5-메틸사이토신은 불안정하고 티민으로 변환된다. 그 결과로, CpG 디뉴클레오티드는 우연히 기대되는 것보다 자주 인식되지는 않는다. 그럼에도 불구하고 게놈 DNA 의 어떤 영역은 기대한 것에 가까운 CpG의 빈도를 갖고, 이들 서열은 "CpG 아일랜드"로 알려져 있다. 여기서 사용된 "CpG 아일랜드"는 50%이상의 GC 함량 및 0.6이상의 관찰된/기대된 CpG 정도 비율을 갖는 200bp이상의 DNA 서열로 정의된다( 즉, 우연히 기대되는 그것의 60%이상의 CpG 디뉴클레오티드 함량)(Gardiner-Green M and Frommer M. J Mol Biol 196, 261-282 (1987); Rice P, Longden I and Bleasby A Trends Genet 16, 276-277 (2000)).
메틸화-결여(free) CpG 아일랜드는 당업계에 잘 알려져 있고(Bird et al(1985) Cell 40: 91-99, Tazi and Bird (1990) Cell 60:909-920), CpG 아일랜드는 시토신 잔기의 실질적인 비율이 메틸화가 결여되어 있는 것으로 정의될 수 있으며, 두 개의 가깝게 위치한(0.1-3kb) 분기적으로(divergently) 전사된 유전자들의 5' 말단에 걸쳐 확장한다. 이들 DNA 영역은 발생단계 전체에 걸쳐서 모든 조직에서 저메틸화된 상태로 잔류된다고 보고되고 있다(Wise and Pravtcheva (1999) Genomics 60: 258-271). 이들은 조직-제한적 발현 양상을 보이는 유전자의 약 40% 뿐만 아니라 모든 도처에 존재하여 발현하는 유전자의 5'말단에 연관되며(Antequera, F. & Bird, A. Proc. Natl. Acad. Sci. USA 90, 1195-1199(1993); Cross, S.H. & Bird, A.P Curr. Opin, Genet. Dev. 5, 309-14 (1995)), 활성 염색질 영역에 국한된 것으로 알려져 있다(Tazi, J. & Bird,A. Cell 60, 909-920 (1990)).
'확장된(extended)' 메틸화-결여 CpG 아일랜드는, 1 이상의 전사개시 부위를 포함하는 영역에 걸쳐 확장하고, 그리고/또는 300bp이상, 바람직하기는 500bp이상 확장된 메틸화-결여 CpG 아일랜드이다. 확장된 메틸화-결여 CpG 아이랜드의 경계는, 어떤 CpG 잔기의 메틸화 상태에도 민감한 인식 서열에서의 DNA를 소화(절단)하는 능력이 존재하는 엔도뉴클레아제 제한효소와 조합하여 그 영역에 대한 PCR의 사용을 통하여 기능적으로 정의된다. 그 효소 중 하나는 HpaⅡ로, CpG 아일랜드 내에서 통상적으로 발견되는 CCGG 부위를 중앙의 CG 잔기가 메틸화-결여 경우만 인식하여 소화한다. 따라서 HpaⅡ-소화된 DNA 및 HpaⅡ 부위를 포함하는 영역에 대해 행해진 PCR은 만약 DNA가 메틸화되지 않는다면, HpaⅡ 소화때문에 증폭산물을 생산하지 않는다. PCR은 단지 DNA가 메틸화된 때만 증폭 산물을 생산할 것이다. 따라서, 메틸화-결여 부위를 넘어서는, HpaⅡ가 DNA를 소화하지 않을 것이고, PCR 증폭 산물이 관찰될 것이고 이에 의해 "확장된 메틸화-결여 CpG 아일랜드"의 경계를 정의할 것이다.
본 발명자들은, 인간 TATA 결합 단백질(TBP)/프로테오좀 구성요소-B1 (PSMBI)으로부터 유래된 이중의, 분기적으로 전사되는 프로모터들 및 이종 핵 리보뉴클레오프로테인 A2/B1(hnRNP A2)/이형염색질 프로테인 1Hsγ(HP1Hsγ) 유전자좌를 포함하는 메틸화-결여 CpG 아일랜드가 겹쳐 있는 영역들은, 재현성의 생리적 수준의 유전자 발현을 제공하며, 그들은 다양화된 발현 양상 및 중심절의 이형염색질 내에서 트랜스유전자의 통합과 함께 통상 일어나는 전사적 침묵(Silencing)을 방해한다는 것을 입증하였다(WO 00/05393).
본 발명에서 사용될 때, "재현성의 발현"이란 용어는 본 발명의 폴리뉴클레오티드가 그것의 염색질의 환경에 관계없이, 그리고 바람직하게는 본 발명의 폴리뉴클레오티드가 존재하는 세포 유형 또는 조직 유형에 관계없이 발현의 실질적으로 동일한 수준에서 발현가능한 유전자의 발현을 이끄는 것을 의미한다. 당업계에서의 이러한 기술은 작동가능하게 연결된 발현가능한 유전자의 발현의 실질적으로 동일한 수준은, 세포가 활성 유전자 발현을 할 수 있다는 가정하여, 폴리뉴클레오티드의 염색질 환경, 그리고 바람직하게는 세포 유형에 관계없이 이루어진다는 것을 이해할 것이다.
본 발명자들은 활성적으로 전사하는 프로모터와 연관된 메틸화-결여 CpG 아일랜드는, 염색질을 리모델링하는 능력을 가지며, 따라서 하우스키핑 유전자좌에서 개방 도메인을 구축하고 유지하는 주요한 결정자(determinant)인 것으로 생각된다는 것을 보여주었다.
UCOE's는 트랜스유전자 발현의 안정성 및 수준을 개선시키면서, 증가된 비율의 생산적 유전자 전달을 부여한다. 이것은 트랜스제닉 동물 및 배양된 세포에서 재조합 단백질 생성물의 생산을 포함하는, 중요한 연구 및 생물공학적 응용을 가진다. 본 발명자들은 CMV-EGFP 리포터 구성물의 발현 및 분비되는 약학적으로 가치있는 단백질 에리트로포에틴(erythropoietin)에의 UCOE의 유리한 효과를 보였다(WO 00/05393). 또한 UCOEs의 성질은 유전자 치료에서의 유용성, 낮은 빈도의 생산적 유전자 전달, 및 부적당한 수준의 발현과 그 발현의 지속에 의하여 제한되는 그의 효율성을 암시한다(Verma, I.M. & Somia, N. Nature 389: 239-242 (1997)).
이들 중요한 관계 및 넓은 범위의 응용이 주어지면, 트랜스유전자 발현 수준을 더 최적화한다. 특히 생체내 유전자 요법 분야에서 그리고 재조합 단백질의 생체외 생산을 위해, UCOE를 단독으로 사용하여 얻을 수 있는 발현의 수준을 더욱 증가시킬 필요가 있다.
5' UCOE에 작동가능하게 연결된 핵산의 발현은 놀랍게도 발현된 핵산에 대하여 선별가능한 성분 3'의 존재에 의해 더욱 증가될 수 있으므로, 발현가능한 핵산 서열은 5' UCOE 및 3' 선별가능한 마커의 측면에 위치하게 된다.
선별가능한 마커를 제공하는 것뿐만 아니라 작동가능하게 연결된 유전자의 발현을 증가시키는 것과 같은, 벡터에서 하나 이상의 기능을 수행하는 선별가능한 성분은 더욱 밀집하고 효율적인 벡터의 구성을 가능하게 한다.
Mei, Kothary 및 Wall(Mei, Q, Kothary R and Wall L. Exp Cell Research 260, 304, 312 (2000))은 LCR 및 pgk/퓨로마이신 내성 성분에 작동가능하게 연결된 발현가능한 유전자(β-글로빈)를 포함하는 구성물을 개시한다. 하지만, 이 연구는 그것이 음성적인 대조군으로 사용되는 pgk/퓨로마이신 내성 성분과 함께, 발현가능한 유전자 및 LCR 및 유전자 발현에서 위치효과를 부과하는 데에서 중요한 tk/네오마이신 내성 성분의 조합이라는 것을 나타낸다. 상기 논문은 pgk/퓨로마이신 내성 성분의 사용으로부터 얻어지는 유익한 영향을 나타내지 않는다. 상기 논문은 확장된 메틸화-결여 CpG 아일랜드(또는 UCOE), 발현가능한 유전자 및 pgk/퓨로마이신 내성 성분을 포함하는 구성물을 나타내지 않는데, 이 구성물이 LCRs를 포함하기 때문이다. 유사하게, 상기 논문은 자연적으로는 연결되지 않는 프로모터에 작동가능하게 연결된 발현가능한 유전자를 개시하지 않을 뿐만 아니라, pgk/퓨로마이신 내성 성분에 작동가능하게 연결된 발현가능한 유전자를 개시하지 않는데, 각각의 경우에서 β-글로빈 유전자는 그것의 내인성 프로모터의 조절하에서 발현되지 않기 때문이다.
Artelt 등은 진핵생물의 발현 벡터에서 cis-연결된 유전자에서의 네오마이신 및 퓨로마이신 내성 유전자의 영향력을 비교하였다(Artelt P, Grannemann R, Stocking C, Friel J, Bartsch J and Hauser H Gene 99, 249-254 (1991). 그들은 네오마이신 내성 유전자가 연결된 유전자에 침묵효과(silencing effect)를 가질 수 있지만, "Streptomyces alboniger로부터 퓨로마이신에 대한 내성을 주는 유전자는 인접한 프로모터에 영향력이 미치지 않는다"고 결론지었다. 따라서, 상기 논문에서 본 출원에 개시한 바와 같은 내성 유전자의 위치 또는 공간 사용의 중요성을 개시하거나 제안하지 않는다.
본 발명자들의 함께 계류중인 특허출원 PCT/GB99/02357(WO 2000/05393), US 09/358082, GB 0022995.5 및 US 60/252,048은 항생물질 내성 유전자와 함께 발현가능한 핵산에 작동가능하게 연결된, 확장되고 메틸화-결여 CpG 아일랜드를 포함하는 폴리뉴클레오티드 및 벡터를 개시한다. 하지만, 개시된 실시예에서, 항생물질 유전자는 인접하지 않고, 발현가능한 핵산에 3'에 있지 않다. 이러한 인접한 선별가능한 마커의 놀라운 기여는 더욱이 개시되지 않거나 암시하지 않는다.
본 발명은, 상기 선별가능한 마커가 발현가능한 핵산 서열의 3' 및 그 인접부근에 위치되는 것을 제공하는 선별가능한 원소의 존재 하에서, 작동가능하게 연결된 핵산 서열의 발현을 상향조절하기 위하여 확장되고 메틸화-결여 CpG 아일랜드(UCOEs)의 영향력이 더욱 증가될 수 있다는 것을 개시한다.
5' 및 3'이란 용어는 발현가능한 핵산 서열의 센스(sense) 스트랜드(strand)에 대하여 사용된다. 그러므로 상기 서열의 5' 말단은 3' 방향에서 나아가는, 전사의 출발점에 상응한다.
본 발명에서 사용될 때, "작동가능하게 연결된"이란 용어는, 본 발명의 폴리뉴클레오티드에서의 성분들 사이에서 사용가능성의 관계를 말한다. 당업자들에게 잘 알려진, "작동가능하게 연결된"이란 용어는 cis-작용 DNA 서열사이의 기능적인 관계를 기재하는 용어이다. 정확한 구조적 관계가 다른 종류의 요소들과 관련이 있거나 없을 수 있으며, 다르거나 다르지 않을 수 있다. 프로모터의 경우, 그것이 진행하는 개방 리딩 프레임에 대해 본질적으로 인접한(일반적으로 100bp이하인) 5' 위치를 의미한다. 확장된 메틸화가 되지 않는 CpG 아일랜드의 경우에는, 염색질 구조에서의 지역적인 영향이 유전자 발현의 수준과 일관성을 초래한다는 것을 나타낸다. 예로써, 확장된 메틸화-결여 CpG 아일랜드를 포함하는 성분은 발현가능한 유전자의 5'에 직접적으로 위치된다. 하지만, "작동가능하게 연결된"은 명백한 기능적인 효과가 예증될 수 있는 한, 어는 곳에서든지 위치될 수 있는 가능성을 포함한다.
특히, 5' 말단에서 UCOE로 발현가능한 유전자 및 다른 것에서의 선별가능한 성분의 측면위치화는 대략 2배로 발현이 증가하는 것을 나타낸다. 다른 경우에는, 증가는 단일 UCOE 단독으로 얻어진 것보다 5배 이상이다.
본 발명에 따라서, 작동가능하게 연결된 UCOE 또는 확장된 메틸화-결여 CpG 아일랜드 단독을 사용하여 얻을 수 있는 것들과 비교하여 얻어지는, 작동가능하게 연결된 유전자의 발현의 증가된 수준을 가능하게 하는 단리된 폴리뉴클레오티드를 제공한다.
단리된 폴리뉴클레오티드는, 상기 확장된 메틸화-결여 CpG 아일랜드, 폴리아데닐화 시그날 및 프로모터에 사용가능하게 연결된 선별 가능한 마커에 의해 종결된 발현가능한 핵산을 포함하고, 여기서, CpG 아일랜드와 선별가능한 마커 둘 다는 상기 발현가능한 핵산에 작동가능하게 연결되어 있고, 상기 구성요소들은, 상기 발현가능한 핵산의 센스 스트랜드에 대하여 5'에서 3'의 배향으로, 확장된 메틸화-결여 CpG 아일랜드, 발현가능한 핵산, 선별가능한 마커의 순서로 배치되고, 그리고 발현가능한 핵산의 3'말단에 폴리아데닐화 시그날이 선별가능한 마커의 인접 말단의 2000bp이내에 있다.
여기서 사용할 때, "인접 말단"은 그것의 폴리아데닐화 시그날에 의해 표시되는 것처럼, 발현가능한 핵산의 3'말단에 가장 가까운 선별가능한 마커 유전자(그것의 프로모터를 포함하는)의 말단을 의미한다. 선별가능한 마커는 어느 한 배향일 것이므로, 발현가능한 핵산에 관련이 있는 인접 말단은 선별가능한 마커의 5' 프로모터 또는 선별가능한 센스 스트랜드에 따른 것과 같이 5' 및 3'을 갖는, 3', 전사 말단의 종결 중 하나에 있는 것이 고찰된다.
바람직하게는, 선별가능한 마커의 전사 출발점은 후자의 폴리아데닐화의 시그날에 의해 표시된 것처럼, 발현가능한 핵산 서열의 3'말단의 1500bp이내에 있다. 더욱 바람직하게는, 1000bp이내에 있다, 가장 바람직하게는, 500bp이내에 있다.
본 발명은 한 관점에서, 상기 선별가능한 성분은 항생물질 내성 유전자이다. 바람직하게는 Streptomyces종에서 얻어진 항생물질 내성 유전자이다. 더욱, 바람직하게는, 상기 항생물질 내성 유전자는 포스포글리세라이트 키나아제(pgk) 유전자의 프로모터에 작동가능하게 연결된다. 가장 바람직하게는, 뮤린(murine: 쥣과) pgk 유전자의 프로모터이다(Adra, CN, Boer PH and McBurney, MW. Gene 60, 65-74 (1987)). 대체 가능하게는 다른 포유동물 pgk 프로모터일 수 있다.
바람직한 구현예에서, 항생물질 내성 유전자는 Streptomyces종으로부터 유래된 퓨로마이신 내성 유전자이다. 가장 바람직하게는, Streptomyces alboniger로부터 유래된 퓨로마이신 N-아세틸 트랜스퍼라제 유전자이다(Vara JA, Portela A, Ortin J. Jimenez A. Nucleic Acids Res 14, 4617-4624 (1986))(SEQ ID NO:5).
대체 가능하게는, 항생물질 내성 유전자는 Streptomyces alboniger으로부터 유래된 퓨로마이신 N-아세틸 트랜스퍼라제 유전자의 변형된 형태이다. 바람직하게는, 이 유전자는 포유동물 숙주세포에서 발현을 위한 박테리아 유전자를 적응하게 하는 일반적인 방법에서, 그것의 코든 사용법의 조작에 의해 변형되고 있다. 이러한 코돈 변형은 발현된 효소가 야생형 퓨로마이신 N-아세틸 트랜스퍼라제로부터 변화되지 않는다는 결과와 함께, 코드화된 아미노산 서열을 변화되지 않게 한다. 가장 바람직하게는, 변형된 유전자는 도 14(SEQ ID NO:3)에서 나타낸 서열을 갖는다.
대체 가능하게는, 항생물질 내성 유전자는 Streptomyces종에서 유도된 네오마이신 내성 유전자이다. 바람직하게는, Streptomyces fradiae으로부터 유래된 아미노글리코사이드 포스포트랜스퍼라제 유전자이다(Thompson CJ and Gray GS. Proc Natl Acad Sci USA 80, 5190-5194 (1983))(SEQ ID NO:4).
대체 가능한 구현예에서, 항생물질 내성 유전자는 하이그로마이신 내성 유전자이다. 바람직하게는, Streptomyces hygroscopicus으로부터 유래된 하이그로마이신 포스포트랜스퍼라제 유전자이다(SEQ ID NO:6).
추가의 대체 가능한 구현예에서, 항생물질 내성 유전자는 블레오마이신 내성 유전자이다. 바람직하게는, Streptomyces verticillus으로부터 유래된 블레오마이신 결합 단백질이다.
다른 구현예에서, 항생물질 내성 유전자는 블라스티시딘 내성 유전자이다. 바람직하게는, Streptomyces verticillum으로부터 유래된 블라스티시딘 S-아세틸트랜스퍼라제이다.
발명의 또 다른 관점에서, 항생물질 내성 유전자는 Streptomyces종에서 얻어지는 것이 아니다. 한 바람직한 구현예에서, Escherichia coli으로부터 유래된 아미노사이클리톨 포스포트랜스퍼라제를 코드화하는 하이그로마이신 내성 유전자이다(SEQ ID NO:7).
다른 바람직한 구현예에서, 원래는 Klebsiella pneumoniae로부터 유도된, 트랜스포솜 Tn5으로부터 유래된 네오마이신 포스포트랜스퍼라제 유전자이다(SEQ ID NO:8).
본 발명의 대체 가능한 관점에서, 선별가능한 마커는 항생물질 내성 유전자가 아니다. 대체 가능한 선별법 메카니즘은 티미딜레이트 신타제, 티미딘 키나아제 또는 디히드로폴레이트 리덕타제를 코드화하는 유전자를 사용하는 것을 포함한다. 이러한 선별법 메카니즘은 당업자들에게 잘 알려져 있다. 메티오닌이 결여된 배지에서, 글루타민 신테타제를 코드화하는 유전자는 내성적인 글루타민 신테타제가 결여된 세포 또는 메티오닌 술폭사민과 같은, 억제제의 사용이 그것을 비활성화하는 곳 중 하나에서 선별법의 수단으로서 사용될 수 있다(Kaufman RJ. Section and coamplificationof heterologous genes in mammalin cells. Methods Enzymol 185, 537-56 (1990))
또 다른 관점에서, 선별가능한 마커가 사용될 수 있다. 예를 들면, Aequoria victoria 녹색 형광 단백질(GFP), 또는 그것의 증폭된 이형(EGFP)과 같은 형광 단백질은 선별가능한 마커로서 사용될 수 있다. 본 발명에 따른 폴리뉴클레오티드를 함유하는 트랜스펙턴트(transfectant)는 당업자들에게 잘 알려진 방법으로, FACS에서 형광의 선명함에 의해 구분될 수 있고, 여기서 선별가능한 마커는 GFP를 코드화한다. 본 발명의 폴리뉴클레오티드를 사용하고, 그리고 UCOE에 대해 5', 또는 트랜스유전자(발현가능한 핵산)에서 멀리 있는 3' 중 하나에 위치한 선별가능한 마커와 함께 발현가능한 구성물을 비교하는 것으로, 트랜스유전자의 발현의 더욱 고도한 수준은 선명함의 필적하는 수준에서 발견될 것이다. 그러므로, 가장 선명한 세포의 선별법은 트랜스유전자 발현의 가장 높은 수준에서 세포의 선별법을 가능하게 한다.
본 발명의 한 관점에서, 확장된 메틸화-결여 CpG 아일랜드는 5kb 5' 및 1.5kb 3'측면서열을 갖고 인간 hnRNP A2 유전자를 걸쳐 있는 16kb DNA 단편을 포함한다. 바람직하게는, 확장된 메틸화-결여 CpG 아일랜드는 인간 hnRNP A2 유전자를 걸쳐 있는 8kb DNA 단편을 포함한다(WO 00/05393).
대체 가능하게는, 상기 개시된 폴리뉴클레오티드의 확장된 메틸화-결여 CpG 아일랜드는 인간 β-액틴 CpG 아일랜드/프로모터 영역 또는 그것의 단편을 포함하는, 본 발명자들의 동시에 계류중인 출원 GB 0022995.5 및 US 60/252,048에 개시되어 있는 바와 같은 '인공적인 UCOE'이다. 바람직하게는, 이 단편은 100bp 내지 3.0kb의 크기 범위내이고, 인간 β-액틴 CpG 아일랜드/프로모터 영역 또는 그것의 단편을 걸친다. 더욱 바람직하게는, 인간 PDCD2 CpG 아일랜드/프로모터 영역은 100bp 내지 3.0kb의 크기 범위내의 단편을 포함한다. 더욱 더 바람직하게는, 확장된 메틸화-결여 CpG 아일랜드는 인간 β-액틴 CpG 아일랜드/프로모터 영역을 걸쳐 있는 100bp 내지 3.0kb의 크기 범위내에서의 DNA 단편 및 인간 PDCD2 CpG 아일랜드/프로모터 영역을 걸쳐 있는 100bp 내지 3.0kb의 크기 범위내에서의 DNA 단편을 포함한다.
가장 바람직하게는, 본 발명의 구현예의 청구된 폴리뉴클레오티드는 인간 β-액틴 CpG 아일랜드/프로모터 영역을 걸쳐 있는 2.0kb의 DNA 단편 및 인간 PDCD2 CpG 아일랜드/프로모터 영역을 걸쳐 있는 1.8kb의 DNA 단편을 포함한다.
또한, 상기 구현예에서의 어느 하나의 폴리뉴클레오티드를 포함하는 벡터를 제공한다. 상기 벡터는 대체 가능하게는 에피솜의 또는 통합성 벡터 중 하나일 수 잇다. 의도된 용도에 의존하여, 에피솜성 벡터는 그들이 자기복제하고, 통합할 필요없이 되풀이하기 때문에 바람직할 것이다. 이러한 유형의 에피솜성 벡터는 WO98/07876에 기재되어 있다. 또한, 비-복제성, 비-통합성 벡터도 바람직하다.
또한, 본 발명은 선형화되어 염색체로 통합될 때, 확장된 메틸화-결여 CpG 아일랜드, 폴리아데닐화 시그날에 의하여 종결된 발현가능한 핵산, 및 프로모터에 작동가능하게 연결된 선별가능한 마커를 포함하는 폴리뉴클레오티드를 전달하도록 구성된 벡터를 제공하는 것으로, 여기서 CpG 아일랜드와 선별가능한 마커 모두가 상기 발현가능한 핵산에 작동가능하게 연결되고, 상기 구성요소들은, 발현가능한 핵산의 센스 스트랜드에 관하여 5'에서 3'의 배향으로, 확장된 메틸화-결여 CpG 아일랜드, 발현가능한 핵산, 선별가능한 마커의 순서로 배치되고, 그리고 발현가능한 핵산의 3'말단에 폴리아데닐화 시그날이 선별가능한 마커의 인접 말단의 2000bp이내에 있다.
바람직하게는, 상기 벡터는 플라스미드이다. 대체 가능하게는, 상기 벡터는 아데노바이러스, 아데노-관련 바이러스, 헤르페스바이러스, 백시나 바이러스 (vaccina virus), 렌티바이러스(lentivirus), 또는 다른 레트로바이러스와 같은 바이러스일 수 있다.
바람직하게는, 상기 벡터는 진핵세포 유전자 발현에 적응된 발현 벡터이다. 전형적으로 상기 적응은 예를 들어, 이것에 제한되지는 않지만, 세포/조직 특이 발 현을 중재하는, 전사 조정 서열(프로모터 서열)의 공급을 포함한다. 프로모터 및 증폭제는 당업자에게 잘 알려진 용어이고, 하기의 특징을 포함하지만, 여기서 예로써 제공될 뿐이고, 한정하지는 않는다. 프로모터는 전사의 개시에 직접적으로 연결된 5', cis-활동(acting) 조절 서열이다. 프로모터 성분은 전사 개시의 부위를 선별하기 위해 기능화하는, 소위 TATA 박스 및 RNA 폴리머라제 개시 선별법(RIS) 서열을 포함한다. 또한 이들 서열은 특히, RNA 폴리머라제에 의해 전사 개시 선별법을 촉진하는 것을 기능화하는 폴리펩티드를 결합한다.
증폭제 성분은 유전자의 전사 개시부위에 대해 5'에서 종종 발견되는 cis 활동 핵산 서열이다(증폭제는 또한 유전자 서열에 대해 3'에서 발견될 수 있거나 또는 인트론 서열에 위치할 수도 있으므로 위치에 의존하지 않는다). 증폭제는 상기 증폭제가 연결된 유전자의 전사 속도를 증가시키는 기능을 한다. 증폭제 활성은 증폭제 성분에 특별히 결합하는 것을 보여주는 trans 활동 전사 인자(폴리펩티드)에 민감하다. 전사 인자의 결합/활성은, 예로써 제공되지만 이에 한정되지 않는, 중재 대사산물(예를 들어, 글루코스), 환경 영향자(예를 들어, 열)를 포함하는 많은 환경의 자극에 민감하다(참조: Eukaryotic Transcription Factors, by David S Latchman, Academic Press Ltd, San Diego).
또한 적응은 선별가능한 마커의 공급 및 자율 증식 서열을 포함하고, 상기 두 가지 모두는 진핵 세포 또는 원핵 세포 중 하나에서 상기 벡터의 보전을 촉진한다. 진핵세포에서 자율적으로 보전하는 벡터는 에피솜성 벡터로 간주된다. 유전자를 코드화하는 벡터의 발현을 촉진하는 다른 적응은 전사 종결/폴리아데닐화 서열 의 공급을 포함한다. 또한, 이것은 이중시스트론(bicistronic) 또는 다중시스트론(multi-cistronic) 발현 카세트에 준비된 유전자를 코드화하는 벡터의 발현을 최대화하는 기능을 하는 내부 리보솜 도입 부위(IRES)의 공급을 포함한다. 이 적응은 당업자에게는 잘 알려져 있다. 일반적으로 발현 벡터 구성 및 재조합 DNA 기술에 관해서는 상당한 양의 발행된 문헌이 있다. 참조: Sambrook et al (1989) Molecular Cloning: A Laboratory Manual, Cold Spring Harbour Laboratory, Cold Spring Harbour, NY 및 그 외 참고문헌: Marston, F (1987) DNA Cloning Techniques: F M Ausubel et al, Current Protocols in Molecular Biology, John Wiley & Sons, Inc. (1994).
본 발명의 바람직한 구현예에서, 상기 벡터는 상기 폴리펩티드의 정제를 촉진하는 분비 시그날을 코드화하고, 그러므로 상기 폴리펩티드가 제공된다.
대체 가능하게는, 다른 바람직한 구현예는 친화성 태그 또는 에피토프와 같은 발현된 재조합 단백질 또는 효소 균열 부위의 정제를 촉진하는 추가 정화를 포함할 수 있다.
바람직하게는, 발현가능한 핵산은 치료용 핵산이다.
대체 가능하게는, 발현가능한 핵산은 생체외 세포 배양 시스템에서 발현을 위한 재조합 단백질을 코드화한다.
대체 가능하게는, 발현가능한 유전자는 RNA와 같은, 비-폴리펩티드 생성물을 코드화한다. 이러한 RNA는 전사 후(post-transcriptional) 수준에서 특정 유전자의 발현을 억제할 수 있는 안티센스일 수 있거나 또는, 리보솜 RNA와 같이, 효소 또는 다른 기능을 가질 수 있다.
하나의 바람직한 구현예는, 상기 확장된 메틸화-결여 CpG 아일랜드, 폴리아데닐화 시그날 및 프로모터에 작동가능하게 연결된 선별가능한 마커에 의해 종결된 발현가능한 핵산을 포함하는 벡터이고, 여기서, CpG 아일랜드와 선별가능한 마커 둘 다는 상기 발현가능한 핵산에 작동가능하게 연결되어 있고, 그리고 상기 구성요소들은, 상기 발현가능한 핵산의 센스 스트랜드에 관하여 5'에서 3'의 배향으로, 확장된 메틸화-결여 CpG 아일랜드, 발현가능한 핵산, 선별가능한 마커의 순서대로 위치되어 있고, 그리고 발현가능한 핵산의 3'말단에 상기 폴리아데닐화 시그날이 상기 선별가능한 마커의 인접 말단의 2000bp이내에 있다. 바람직하게는, 상기 발현가능한 핵산의 3'말단에 상기 폴리아데닐화 시그날이 상기 선별가능한 마커의 인접 말단의 1500bp이내에 있다. 더욱 바람직하게는, 1000bp이내에 있고, 가장 바람직하게는, 500bp이내에 있다.
바람직한 구현예는, 상기 확장된 메틸화-결여 CpG 아일랜드, 다중 클로닝 부위, Streptomyces종에서 얻은 항생물질 내성 유전자를 포함하는 벡터이고, 여기서 CpG 아일랜드와 선별가능한 마커 둘 다는 상기 다중 클로닝 부위에 작동가능하게 연결되고, 그리고 상기 구성요소들은, 발현가능한 핵산의 센스 스트랜드에 관하여 5'에서 3'의 배향으로, 확장된 메틸화-결여 CpG 아일랜드, 다중 클로닝 부위, 선별가능한 마커의 순서대로 위치되어 있고, 그리고 상기 다중 클로닝 부위는 상기 선별가능한 마커의 인접 말단의 2000bp이내에 있다.
더욱 바람직하게는, 상기 다중 클로닝 부위는 추가로 프로모터에 작동가능하게 연결된다. 더욱 더 바람직하게는 상기 프로모터는 CMV, EF-1α, RSV LTR 또는 HIV2 LTR 또는 그것들로부터 유도된 서열의 조합에서 선택된다. 더욱 바람직하게는, 상기 프로모터는 CMV 직접/초기 프로모터이다. 가장 바람직하게는, 마우스 CMV 즉시/초기 프로모터이다. 바람직한 구현예에서, 상기 벡터는 CMV 프로모터, 다중 클로닝 부위, 폴리아데닐화 서열 및 적합한 대조군 성분하에서 선별가능한 마커를 코드화하는 유전자를 포함한다.
상기 벡터의 바람직한 구현예는 도 10(SEQ ID NO:1)의 서열의 뉴클레오티드 1-10551을 포함한다. 가장 바람직한 구현예는 벡터 CET 710이다. 대체 가능하게는, 상기 벡터는 도 10의 서열의 뉴클레오티드 1-13545를 포함하고, 바람직하게는, 벡터 CET 720이다(SEQ ID NO:2).
벡터의 추가 바람직한 구현예는 하기와 같다:
CET 740은 CET 720의 퓨로마이신 내성 유전자가 Streptomyces fradiae로부터 유래된 아미노글리코사이드 포스포트랜스퍼라제 유전자로 대체된 것이다(도 15(SEQ ID NO:4)에서와 같은). 또한, CET 741과 같이, CET 740의 다중 클로닝 부위로 삽입된 발현가능한 핵산 서열을 갖는 벡터가 바람직하다.
CET 760은 CET 720의 퓨로마이신 내성 유전자가 Escherichia coli로부터 유래된 아미노사이클리톨 포스포트랜스퍼라제 유전자로 대체된 것이다(도 17(SEQ ID NO:7)에서와 같은). 또한, CET 761과 같이, CET 760의 다중 클로닝 부위로 삽입된 발현가능한 핵산 서열을 갖는 벡터가 바람직하다.
CET 780은 CET 720의 퓨로마이신 내성 유전자가 Streptomyces alboniger로부터 유래된 N-아세틸 트랜스퍼라제 유전자의 변형된 형태로 대체된 것이다(도 14(SEQ ID NO:3)에서와 같은). 또한, CET 781과 같이, CET 780의 다중 클로닝 부위로 삽입된 발현가능한 핵산 서열을 갖는 벡터가 바람직하다.
CET 820은 그곳에 삽입된 발현가능한 핵산 서열의 발현을 진행하기 위해 다중 클로닝 부위에 작동가능하게 연결된, 인간 IE CMV 프로모터는 뮤린 IE CMV 프로모터로 대체된 것이다. 또한, CET 821과 같이, CET 820의 다중 클로닝 부위로 삽입된 발현가능한 핵산 서열을 갖는 벡터가 바람직하다.
CET 823은 인간 hnRNP A2 유전자를 걸쳐 있는 8kb DNA 단편을 포함하는 확장된 메틸화-결여 CpG 아일랜드는 뮤린 hnRNP A2 유전자에 걸쳐 있는 8kb 단편을 포함하는 확장된 메틸화-결여 CpG 아일랜드로 대체된 것이다(도 19(SEQ ID NO:15)에서와 같은). 또한, CET 824와 같이, CET 823의 다중 클로닝 부위로 삽입된 발현가능한 핵산 서열을 갖는 벡터가 바람직하다.
또한, 상기 개시된 벡터의 한 구현예와 트랜스펙션된 숙주세포가 제공된다.
대체 가능하게는, 상기 폴리뉴클레오티드, 벡터 또는 숙주세포는 원하는 유전자 생성물의 발현을 얻기 위해 세포 배양 시스템에서 사용될 수 있다. 적합한 세포 배양 시스템은 당업자들에게 잘 알려져 있고, 문헌 전체가 완전히 개시되어 있다. 하기를 포함하는 본 발명에 따른 폴리펩티드의 생산 방법을 제공한다:
ⅰ) 세포를 본 발명에 따른 핵산 분자로 형질도입/트랜스펙션하는 단계;
ⅱ) 상기 폴리펩티드의 제조에 알맞은 조건에서 상기 세포를 성장시키는 단계;
ⅲ) 상기 세포 또는 그것의 성장 환경으로부터 상기 폴리펩티드를 정제하는 단계.
본 발명의 바람직한 구현예에서, 상기 핵산 분자는 본 발명에 따른 벡터이다.
또한, 본 발명은 치료요법에서 사용하기 위해 상기 폴리뉴클레오티드, 벡터 또는 숙주세포를 제공한다.
또한, 본 발명은 유전자 치료요법에서 사용하기 위해 조성물의 제조에서 상기 폴리뉴클레오티드, 벡터 또는 숙주세포의 용도를 제공한다.
또한, 본 발명은 상기 폴리뉴클레오티드, 벡터 또는 숙주세포의 약제학적으로 효과적인 양을 이러한 치료를 필요로 하는 환자에게 투여하는 것을 포함하는, 치료 방법을 제공한다. 바람직하게는, 상기 환자는 유전자 치료요법에 의해 치료가능한 질병의 환자이다.
본 발명은 또한 질병을 치료하거나 또는 유익한 단백질 또는 기능을 특정 조직의 세포에 제공하기 위한 치료 용도를 위하여, 임의로 약학적으로 허용되는 담체 또는 희석제와 혼합하여, 폴리뉴클레오티드 및/또는 벡터 및/또는 숙주세포를 포함하는 약학적 조성물을 제공한다.
본 발명의 폴리뉴클레오티드, 벡터 또는 숙주세포 또는 약제학적인 조성물은 전신 근육내의, 정맥주사의, 에어로졸(aerosol), 경구(고체 또는 액체 형태), 국소적으로(topical), 눈의, 직장의, 복강내의, 및/또는 척수강내의 및 국부적 직접 주사를 포함하는 경로를 통하여 투여될 수 있다.
물론, 정확한 투여량 섭생은 개별적 환자를 위한 개별적 의료진에 의하여 결정되어질 필요가 있을 것이고, 이것은 교대로 흥미있는 유전자에 의하여 발현되는 단백질의 정확한 성질 및 치료 표적이 되는 조직 형태에 의하여 조절될 것이다.
투여량은 또한 질병 징후 및 투여 경로에 대하여 의존적일 것이다. 투여의 횟수는 질병 및 임상 치료로부터 나온 효능 데이터에 의존할 것이다.
본 발명에 의한 효과적인 유전자 치료를 위하여 전달되는 폴리뉴클레오티드 또는 벡터 DNA의 용량은, 체중 ㎏당 벡터 DNA 50ng ~ 1000㎍ 사이의 범위인 것이 바람직하고, ㎏당 벡터 DNA 1 ~ 100㎍ 사이의 범위인 것이 더욱 바람직할 것이다.
생체내 세포 흡수(uptake)를 위하여 포유 동물에 폴리뉴클레오티드, 벡터 또는 숙주세포를 투여하는 것이 본 발명에 의하여 바람직하지만, 엑스 비보(ex vivo) 접근도 세포를 동물로부터 추출하여 폴리뉴클레오티드 또는 벡터로 형질도입하고 그리고 나서 동물로 다시 재이식함에 의해 사용될 수 있다. 예를 들면, 간의 경우 동물로부터 간세포를 추출하여, 생체외에서 간세포를 형질도입 시키고, 동물에 간 세포를 재이식함으로서 엑스 비보 접근에 의하여 접근할 수 있다(토끼에 대하여 Crowdhury et al., Science 254: 1802~1805, 1991, 또는 인간에 대하여 Wilson, Hum. Gene Ther. 3:179~222, 1992에 명시된 바와 같이). 그러한 방법은 또한 적혈구, T세포, B 세포 및 조혈 골수세포와 같은 순환계 또는 림프계의 다양한 세대의 세포로의 전달을 위하여 효과적일 수 있다.
본 발명의 또 다른 관점은 자연적으로는 작동가능하게 연결되지 않는, 발현가능한 유전자에 작동가능하게 연결된 첫 번째 프로모터를 포함하는 단리된 폴리뉴 클레오티드 및 pgk 프로모터 및 퓨로마이신 내성 유전자를 포함하는, 발현가능한 유전자에 대해 3'에 작동가능하게 연결된 선별가능한 성분을 제공한다. 또한, 두 가지 이상의 조직 또는 세포조직에서 상기 발현가능한 유전자의 재현성의 발현을 얻기 위한 이러한 폴리뉴클레오티드의 용도가 제공된다.
본 발명의 또 다른 구현예에서는, 인공적으로 도입되는 확장된 메틸화-결여 CpG 아일랜드 요소 및 인공적으로 도입되는 선별가능한 마커 성분을 포함하는 비-인간 트랜스제닉 동물을 제공하고, 여기서 두 성분 모두는 그들 사이에 위치한 발현가능한 유전자에 작동가능하게 연결되고, 여기서 상기 발현가능한 유전자의 재현성의 발현은 두 가지 이상의 조직 또는 세포 유형에서 발생한다. 트랜스제닉 마우스를 제조하는 방법(Gordon et al., Proc. Natl. Acad. Sci. USA 77:7380(1980); Harbers et al., Nature 293:540(1981); Wagner et al., Proc. Natl. Acad. Sci. USA 78:5016(1981); 및 Wagner et al., Proc. Natl. Acad. Sci. USA 78:6376(1981), 트랜스제닉 양, 돼지, 닭을 제조하는 방법(Hammer et al., Nature 315: 680(1985)을 참고하라) 등은 당업계에 잘 알려져 있고, 본 발명에 따른 사용을 위하여 고려된다.
본 발명의 폴리뉴클레오티드를 함유하는 이러한 트랜스제닉 동물은 또한 중요한 단백질의 장기간 생산을 위하여 사용될 수 있다.
또한, 본 발명의 폴리뉴클레오티드, 벡터 또는 숙주세포를 사용하여 유전자 치료요법의 효율을 측정하기 위한 포유동물 모형을 제공한다. 상기 포유동물 모형은 트랜스제닉 동물을 포함하고, 그의 세포는 본 발명의 벡터를 함유한다. 이러한 동물은 인간의 임상 단계 이전의 시험을 허용한다.
본 발명은 또한 트랜스제닉 식물의 제조를 위한 본 발명의 폴리뉴클레오티드의 용도를 제공한다.
수율 또는 질병, 전염병, 가뭄 또는 염에 대한 내성 등이 증가한 트랜스제닉 식물의 생산은 당업자들에게 잘 알려져 있다. 본 발명은 또한 본 발명의 폴리뉴클레오티드를 함유하는 세포를 함유하는 트랜스제닉 식물을 제공한다. 인공적 UCOE를 포함하는 세포의 일부 또는 전부는 식물로부터 기원될 수 있다.
본 발명은 또한 기능 유전체학 응용(functional genomics application)에서의 본 발명의 폴리뉴클레오티드의 용도에 관한 것이다. 기능 유전체학은 원칙적으로 특정한 세포형, 또는 질병 상태에서 특이적으로 발현되는 유전자들의 동정화에 관한 것이고, 지금은 신약 개발 또는 유전자 치료 목적을 위하여 잠재적으로 흥미있는 수천개의 신규 유전자 서열을 제공한다. 신규한 치료법의 개발을 위하여 이 정보를 사용함에 있어서 주요한 문제점은 이들 유전자의 기능을 어떻게 결정하느냐에 있다. 본 발명의 폴리펩티드는 유전자 서열의 기능을 결정하기 위하여, 수많은 기능 유전체학 응용을 위하여 사용될 수 있다. 본 발명에 대한 기능유전체학 응용은, 제한되지는 않으나 다음의 것들을 포함한다:
(1) 유전자 서열의 안티센스 버젼 또는 리보자임 녹다운(knockdown) 라이브러리의 지속된 발현을 성취하여, 세포 표현형에서의 유전자 불활성화 효과를 결정하기 위하여 본 발명의 폴리뉴클레오티드를 사용하는 것,
(2) 세포로의 그 전달이 유전자 서열의 믿을만하고, 재현성의, 지속된 발현 을 가져오도록, 유전자 서열을 위한 발현 라이브러리를 제조하기 위해 본 발명의 폴리뉴클레오티드를 사용하는 것. 유전자 서열을 발현하는, 결과적으로 생성된 세포는 기능 결정 및 신약 개발에 대한 다양한 접근에 사용될 수 있다. 예를 들면, 유전자 생성물에 대한 중화 항체의 유발; 구조적인, 기능적인, 또는 신약 선별 연구에서, 또는 세포계 신약 선별에서 사용하기 위한 유전자 자체의 단백질 생성물의 신속한 정제 등이 있다.
(3) 마우스 줄기 세포(ES 세포) 및 트랜스제닉 마우스와 관계되는 연구에서 본 발명의 폴리뉴클레오티드의 사용하는 것. 가장 강력한 기능유전체학 접근 중 하나는, 발현된 유전자로의 삽입 후에만 약물 선별을 가능하게 하며 서열화를 위하여 쉽게 구제할 수 있는 구성물을, 마우스 ES 세포의 유전자 내로 무작위적으로 삽입하는 것에 관한 것이다(G.Hiks et al., Nature Genetics, 16, 338~334). 그리고 나서, 신규한 서열을 가진 유전자에 녹아웃(knockout) 돌연변이를 가진 트랜스제닉 마우스는 쉽게 그들의 기능을 탐지되도록 만들어질 수 있다. 현재 이들 기술은 마우스 ES 세포에서 잘 발현되는 마우스 유전자의 10%에서 잘 이용된다. 통합화 구조체로의 본 발명의 폴리뉴클레오티드의 삽입은, 이 기술이 마우스에서 발현된 모든 유전자를 동정하는데까지 확장되게 할 것이다.
본 발명은 이제 하기의 수반된 도면을 참조하여 예시의 목적으로 설명될 것이다.
도 1은 '빈(empty)' 벡터 CET 200.1, 210, 710 및 720의 지도를 나타낸 도이 다. 다중클로닝 부위로의 증폭된 녹색 형광 단백질(EGFP) 유전자의 삽입은 개별적으로 CET 230, 711 및 721을 가져온다. 모든 벡터는 삽입된 유전자가 발현되는 CMV 프로모터를 함유한다. 하지만, CET 210(및 그것의 EGFP-발현 유도체, CET230)의 경우에는, 이러한 삽입된 유전자가 플라스미드에서 UCOE 및 pgk/퓨로마이신 내성 성분에 의해 측면에 위치될지라도, 후자는 즉시에 인접하지 않는다. 더욱 중요하게는, 트랜스펙션 전에 플라스미드를 선형화하기 위해 사용된 PvuⅠ 부위에 의해 분리된다. 숙주세포 염색체로 통합된 후, 이것은 UCOE 및 pgk/퓨로마이신 내성 성분 모두가 상기 유전자의 같은 쪽에서 통합되기 때문에, 유전자가 더 이상 측면에 위치하지 않는 것을 보여준다. CET 710(및 그것의 EGFP-발현 유도체, CET 711) 및 CET 720(및 그것의 EGFP-발현 유도체, CET 721)의 경우에는, PvuⅠ의 선형화는 한 쪽에서는 UCOE 그리고 다른 한 쪽에서는 pgk/퓨로마이신 내성 성분에 의해 밀접하게 측면에 위치되어 있는 유전자의 통합을 보여준다. CET 710(및 CET 711)이 '인공적인' β-액틴/PDCD2-유도된 UCOE를 수행하는 반면에, CET 210(및 CET 230) 및 CET 720(및 CET 721)은 hnRNP-유도된 UCOEs를 수행한다.
도 2는 트랜스펙션 후 지정된 날에 측정된 FACS 분석에서 중심 형광에 의해 측정함으로써, CHO-K1 세포로 트랜스펙션된 여러가지 벡터로부터의 EGFP의 발현을 나타낸 도이다. 'EGFP'는 대조군(pEGFP) 비-UCOE 함유 플라스미드로 트랜스펙션된 세포를 표현한다. CET 220은 상기 EGFP 발현 유니트가 pgk/퓨로마이신 내성 성분이 아니라 hnRNP-유도된 UCOE에 작동가능하게 연결된 플라스미드로 트랜스펙션된 세포를 나타낸다. 그 대신에 SV40/네오마이신 내성 성분이 사용된다. 남은 세포는 CET 230, 711 또는 721로 트랜스펙션되고, 그 구조는 도 1에서 나타내었다.
도 3은 감염 후 지정된 날에 발현에 양성이라고 판단된, 도 2에서 나타낸 세포의 개체군의 비율을 나타낸 도이다.
도 4는 FACScan의 탐지 능력을 초과하지 않고 대조하게 하도록 조정된 중심 형광에 의해 측정함으로써, 벡터 CET 200, 230, 721 및 711로 트랜스펙션된 CHO-K1 세포에서 EGFP의 발현을 나타낸 도이다. 이것은 발현가능한 트랜스유전자(EGFP)에 대해 5'(CET 230) 또는 3'(CET 721) 중 하나에 선별가능한 마커(puro')을 대체하는 비교 효과를 명백하게 나타낸다.
도 5는 FACScan의 탐지 능력을 초과하지 않고 대조하게 하도록 조정된 중심 형광에 의해 측정함으로써, 벡터 CET 701, 721, 704, 741, 705, 751, 706, 761, 708 및 781로 트랜스펙션된 CHO-K1 세포에서 EGFP의 발현을 나타낸 도이다.
도 6은 3' 퓨로마이신 내성 유전자와 함께 5' 인간 및 뮤린 hnRNP UCOEs를 비교하는 벡터로 트랜스펙션된 CHO-K1 세포에서 EGFP의 발현 수준을 나타낸다.
도 7은 EGFP 발현에서 Streptomyces 네오마이신 내성 유전자의 위치효과를 나타낸 도이다. CET 741은 트랜스유전자의 3'에 선별가능한 마커를 갖고, CET 745는 트랜스유전자 및 UCOE의 5'에 마커를 가진다. UCOE는 두 가지 모든 경우에서는 인간 RNP UCOE이다.
도 8은 플라스미드 CET 700의 지도를 나타낸 도이다.
도 9는 플라스미드 CET 710의 지도를 나타낸 도이다.
도 10은 CET 710의 뉴클레오티드 서열을 나타낸 도이다(SEQ ID NO:1).
도 11은 플라스미드 CET 720의 지도를 나타낸 도이다.
도 12는 CET 720의 뉴클레오티드 서열을 나타낸 도이다(SEQ ID NO:2).
도 13은 야생형 S. alboniger 퓨로마이신 N-아세틸 트랜스퍼라제 유전자의 뉴클레오티드 서열을 나타낸 도이다(SEQ ID NO:5).
도 14는 변형된 S. alboniger 퓨로마이신 N-아세틸 트랜스퍼라제 유전자의 뉴클레오티드 서열을 나타낸 도이다(SEQ ID NO:3).
도 15는 S. fradiae 아미노글리코사이드 포스포트랜스퍼라제 유전자의 뉴클레오티드 서열을 나타낸 도이다(SEQ ID NO:4).
도 16은 S. hygroscopicus 하이그로마이신 포스포트랜스퍼라제 유전자의 뉴클레오티드 서열을 나타낸 도이다(SEQ ID NO:6).
도 17은 E. coli 아미노사이클리톨 포스포트랜스퍼라제(hygro') 유전자의 뉴클레오티드 서열을 나타낸 도이다(SEQ ID NO:7).
도 18은 트랜스포솜 Tn5(Klebsiella pneumoniae)네오마이신 포스포트랜스퍼라제 유전자의 뉴클레오티드 서열을 나타낸 도이다(SEQ ID NO:8).
도 19는 마우스 hnRNP A2 HindⅢ 단편의 뉴클레오티드 서열을 나타낸 도이다(SEQ ID NO:15).
도 20은 플라스미드 CET 1010의 지도를 나타낸 도이다.
도 21은 CET 1010의 뉴클레오티드 서열을 나타낸 도이다(SEQ ID NO:9).
도 22는 플라스미드 CET 1020의 지도를 나타낸 도이다.
도 23은 CET 1020의 뉴클레오티드 서열을 나타낸 도이다(SEQ ID NO:10).
도 24는 플라스미드 CET 1030의 지도를 나타낸 도이다.
도 25는 CET 1030의 뉴클레오티드 서열을 나타낸 도이다(SEQ ID NO:11).
도 26은 플라스미드 CET 1110의 지도를 나타낸 도이다.
도 27은 CET 1110의 뉴클레오티드 서열을 나타낸 도이다(SEQ ID NO:12).
도 28은 플라스미드 CET 1120의 지도를 나타낸 도이다.
도 29는 CET 1120의 뉴클레오티드 서열을 나타낸 도이다(SEQ ID NO:13).
도 30은 플라스미드 CET 1130의 지도를 나타낸 도이다.
도 31은 CET 1130의 뉴클레오티드 서열을 나타낸 도이다(SEQ ID NO:14).
실시예 1 UCOEs 및 선별가능한 성분으로 발현가능한 유전자의 측면위치화
재료 및 방법
PGK-Puro CET 발현 벡터의 구성
CET 700
CMV-MCS-SV40pA 카세트를 AseⅠ/AflⅡ 단편으로 CET 31(A CMV MCS pA SV40Neo 기저 플라스미드)에서 제거하고, T4 DNA 폴리머라제로 필링화(filling)하여 블런트(blunt) 말단이도록 하고, EcoRV로 소화된 pPGK-Puro(pBluescript에서 mPGK 프로모터, 퓨로마이신 내성 유전자, bGHpA)로 결찰하였다.
CET 720
CET 20(pBluescript에서의 8.3kb hnRNPA2 단편)을 HindⅢ로 소화하여 8kb RNP UCOE를 얻은 다음, 이것을 HindⅢ로 잘린 CET 700으로 결찰하였다.
CET 710
인공적인 UCOE를 XbaⅠ/ClaⅠ 단편으로서 CET 21(pBluescript에서의 인공적인 UCOE)에서 제거하고, T4 DNA 폴리머라제로 필링화(filling)하여 블런트(blunt) 말단이도록 하고, HindⅢ로 소화된 CET 700으로 결찰하고 다시 T4 DNA 폴리머라제로 필링화(filling)하여 블런트(blunt) 말단이도록 하였다.
CET 230
이 벡터는 NarⅠ 및 EcoRⅠ으로 pUC19를 소화하여 대략 160bp를 제거한 다음, 블런팅하고 재결찰하는 것으로 구성된다. 이것은 벡터 백본(backbone)에서 PvuⅠ 및 PvuⅡ부위 중 한 곳을 제거하였다. CMV-EGFP-SV40pA 카세트(그것의 MCS 결손된)를 AseⅠ/AflⅡ 소화물(digest)로 pEGFPN-1(Clontech)에서 절개한 다음, 필링화(filling)하여 블런트(blunt) 말단이도록 하고, NdeⅠ 및 Eco109Ⅰ로 소화되어진 pUC19 벡터 백본 속으로 삽입하고 필링화(filling)하여 블런트(blunt) 말단이도록 하였다.
그런 다음, 필링화된 EcoRⅠ/XhoⅠ블런트 말단의 단편으로, PGK-Puro-bGpA 카세트를 pPGK-Puro에서 제거한 다음, 상기 벡터의 유일한 PvuⅡ 부위로 삽입하였다. 마지막으로 8.3kb hnRNP A2 단편은 CET 20에서 유도된 HindⅢ 단편으로서 이 벡터의 유일한 HindⅢ 단편으로 삽입되었다.
분명하게 하기 위해서:
CET 230은 '빈' 벡터 CET 210의 EGFP-발현형이다.
CET 711은 '빈' 벡터 CET 710의 EGFP-발현형이다.
CET 721은 '빈' 벡터 CET 720의 EGFP-발현형이다.
다른 항생물질 내성 유전자를 갖고 대체 가능한 프로모터 또는 UCOEs를 갖는 CET 720에 기저한 벡터는 하기 방법으로 구성될 수 있다. PGK 프로모터(bp 11384-11894) 및 bghpA(bp 12567-12893)는 제한 소화로 CET 720에서 제거될 수 있다. 이들 성분은 pBluescript 백본으로 삽입될 수 있고, 이러한 제한 부위는 그 유전자를 발현하기 위한 방법에서, PGK 프로모터 및 bghpA 사이에서 어느 내성 유전자 서열(PCR 또는 제한 소화에 의해 유도된)의 삽입에 유용하다. 또한, CMV-MCS-SV40pA 발현 카세트는 CET 720(bp 10533-11380)에서 제거될 수 있고, 상기 벡터에서 PGK 프로모터에 대해 5'으로 삽입될 수 있다; 대체 가능하게는 mCMV-MCS-SV40pA 발현 카세트는 상기 위치(CET 801, 821,824-EGFP 발현형)에서 위치될 수 있다. hnRNPA2 UCOE는 제한 효소에 의해 CET 720(bp 2240-10525)에서 제거될 수 있고, 상기 벡터에서 CMV 발현 카세트에 대해 5'에 삽입될 수 있고, 대체 가능하게는 다른 UCOEs(예를 들면, 뮤린 hnRNPA2)는 동일한 위치(CET 824-EGFP 발현 벡터)로 삽입될 수 있다.
분명하게 하기 위해서:
CET 741은 '빈' 벡터 CET 740의 EGFP-발현형이고, 5' 인간 RNP UCOE 및 3' S fradiae neo' 유전자를 포함한다.
CET 761은 '빈' 벡터 CET 760의 EGFP-발현형이고, 5' 인간 RNP UCOE 및 3' E. coli 아미노사이클리톨 포스포트랜스퍼라제(hygro') 유전자를 포함한다.
CET 781은 '빈' 벡터 CET 780의 EGFP-발현형이고, 5' 인간 RNP UCOE 및 3' 변형 S. alboniger 퓨로마이신 N-아세틸 트랜스퍼라제 유전자를 포함한다.
CET 821은 '빈' 벡터 CET 820의 EGFP-발현형이고, 5' 인간 RNP UCOE 및 3' 야생형 S. alboniger 퓨로마이신 N-아세틸 트랜스퍼라제 유전자를 포함한다. EGFP 트랜스유전자의 발현은 뮤린(인간보다는) CMV IE 프로모터에 의해 진행된다.
CET 824는 '빈' 벡터 CET 823의 EGFP-발현형이고, 5' 뮤린(인간보다는) RNP UCOE 및 3' 야생형 S. alboniger 퓨로마이신 N-아세틸 트랜스퍼라제 유전자를 포함한다.
pCIA 벡터
이것은 염색체로 통합된 경우에, 최종적으로 최상의 배치를 갖는 UCOE 발현 벡터(UCOE-발현 카세트-내성 카세트)의 구성을 쉽게 가능하게 하는 벡터시리즈이다.
CET 900은 드문 제한 부위의 쌍이 MCS를 측면에 위치된 빈 클로닝 벡터이다. CET 901 및 CET 902는 hCMV 및 mCMV 프로모터를, 개별적으로, MCS 및 SV40pA를 포함한다, 또한, 드문 제한 부위의 동일한 쌍은 이들 카세트를 측면에서 고정화한다.
벡터의 CET 1000 시리즈는 UCOEs 및 내성 발현 카세트의 다양한 조합을 함유한다. 또한, 그것들은 UCOE에 대하여 3' 및 내성 카세트에 대하여 5' 위치에서의 CET 900시리즈와 같이 동일한 드문 제한 부위를 함유한다. 또한, 상기 벡터는 UCOE에 대하여 5' 및 내성 카세트에 대하여 3' 선형화 부위를 함유한다.
그러므로, 어느 트랜스유전자에 대한 발현 카세트는 CET 900시리즈에서 구성될 수 있고, 그런 다음 CET 1000시리즈로 쉽게 전달될 수 있으므로 염색체로 통합 되는 경우에 최종 배치가 원하는 UCOE-발현 카세트-내성 카세트이다.
상기 항생물질 유전자는 제한 소화 또는 PCR에 의해 CET 1000시리즈에서 교환될 수 있다.
트랜스펙션
CHO K1 세포를 트랜스펙션하고, 표준적인 방법에 따라서 선별하고, 참고문헌으로 사용되는 동시에 계류중인 출원에서 기재하였다.
결과
도 2를 특히 참조로 하여, CET 721 및 CET 230으로 트랜스펙션된 세포의 비교는 CET 721로 얻어진 발현의 일관되게 높은 수준을 나타낸다. 이들 두 벡터는 두 가지 모두가 CMV 프로모터로 진행된 EGFP 유전자에 작동가능하게 연결된 8kb hnRNP-유도된 UCOE을 갖고, 모두는 pgk/퓨로마이신 내성 유전자 성분을 운반한다. 하지만, PvuⅠ로의 선형화에 이어서, 숙주세포 염색체 속의 CET 230의 통합은 pgk/Puro, hnRNP UCOE, EGFP 유전자의 순서대로 위치된다. CET 721과 동일한 방법은 UCOE 및 pgk/Puro에 의해 측면에 위치되어 있는 EGFP 유전자를 나타낸다. CET 230을 이용하여 얻어진 발현의 수준은 CET 220을 이용하여 얻어진 것들보다 현저하게 더 높지는 않고, 이 벡터는 어떠한 pgk/Puro 성분도 갖지 않는 반면에, 동일한 UCOE 및 EGFP 발현을 유도하는 프로모터를 갖는다. 벡터를 갖는 모든 UCOE는 기본 EGFP 발현 플라스미드와 비교하여 대단히 증가된 발현을 나타낸다.
또한, 도 3은 중심 형광에 의하여 발현된 바와 같이 증가된 발현은, 발현에 관점에서, 트랜스펙션 후에 모든 시간 지점에서 양성이라고 판단되는 트랜스펙션된 개체군 안에서의 세포의 증가된 개체군에 반영된다. 구성물의 무작위 통합이 일반적으로 트랜스펙션된 세포의 (비-클로날)개체군에서의 발현 수준 범위에 나타나므로, 이것은 위치효과의 결핍의 측정이다. 이것은 5' UCOE 및 3' 선별가능한 성분의 조합으로 극복되고, 균일하고, 고도로 발현하는 개체군으로 나타낸다.
도 2에서 세포의 풀(pool) 중 일부의 발현 수준은 생산된 형광이 탐지기의 용량을 초과할 정도로 높다.
도 4에서, 측정은 구성물 사이의 비교를 가능하도록 탐지기 반응의 선형 영역에 대하여 교정된 것이다. 이것은 UCOE 및 CET 721에서 사용된 3' 측면의 사용가능한 성분의 조합이, UCOE 단독으로 사용하여 얻어진 것(CET220) 또는 UCOE에 대해 5' 위치된 선별가능한 성분(puro')을 이용하여 얻어진 것과 비교한 바와 같이, EGFP의 발현 수준에서 대략 7배로 증가되어 생산된다는 것을 보여준다. 이것은 UCOE 및 선별가능한 마커로 상기 발현된 트랜스유전자를 측면에 위치하는 것이 발현에서의 상승을 얻는 데 필요하다는 것이 명백하다.
이 효과는 특정 선별가능한 마커에 제한되지 않는다. 도 7은 5' 인간 RNP UCOE에 작동가능하게 연결된 EGFP의 발현 및 5'(CET 745) 또는 3'(CET 741) 위치된 S. fradiae 네오마이신 내성 유전자 중 하나를 비교한다. 기존의 높은 발현 수준의 거의 2배이다.
실시예 2
. 다른 3' 측면의 선별가능한 마커의 효율성
결과
도 5는 5' 인간 RNP UCOE 및 다양한 3' 측면의 항생물질 내성 유전자를 이용 한 EGFP 트랜스유전자의 측면에의 위치효과를 나타냈다. CET 701은 어떤 UCOE도 함유하지 않지만, 야생형 S alboniger puro'를 함유하는 대조군이다. CET 721은 5' UCOE 및 3' puro' 모두를 갖는다. CET 704는 S fradiae neo'를 함유하지만 UCOE를 함유하지 않고, CET 741은 모두를 함유한다. CET 708은 코돈변형된 puro'를 갖지만 UCOE를 갖지 않고, CET 781은 모두를 갖는다. 모든 경우에서 3'측면의 내성 유전자의 상승 효과는 명백하다.
실시예 3
다른 UCOEs 및 Puro 선별가능한 성분의 조합
결과
도 2 및 3에서 나타낸 바와 같이, 인공적으로 구성된 UCOE(CET711)를 갖는 비교가능한 플라스미드로부터의 발현은 중심 형광 및 양성 세포의 비율의 관점 모두에서 RNP UCOE를 이용하여 얻어진 것과 비교될 수 있다. 이것은 두 번째 측면의 CpG-풍부한 성분에 의한 UCOE 영향의 증폭 현상은 일반적인 것이고, RNP UCOE 및 pgk/Puro 성분의 특정한 조합에 한정되지는 않는다. 도 4에서 CET 711 및 CET 721 발현의 비교는 발현의 약간 낮은 수준의 CET 711을 사용하여 얻지만, 이것은 아직도 UCOE 단독으로 사용하여 얻어진 것보다 적어도 6배 더 높다.
도 6은 발현(CET 821)을 진행하기 위해서 뮤린 CMV 프로모터를 사용하는 인간 hnRNP UCOE 및 뮤린 등가물(CET 824) 중 하나를 사용하여 얻어진 비교가능한 효과를 나타낸다. CET 721은 인간 hnRNP UCOE을 포함하고, 인간 CMV 프로모터를 사용한다.
SEQUENCE LISTING
<110> Cobra Therapeutics Limited Crombie, Robert Lachlan Williams, Steven Geraint
<120> Improved Gene Expression
<130> P21363WO
<140> PCT/GB02/01479
<141> 2002-04-05
<150> 60/298,675
<151> 2001-06-15
<150> 60/281,605
<151> 2001-04-05
<150> 0109335.0
<151> 2001-04-17
<160> 15
<170> PatentIn version 3.1
<210> 1
<211> 10551
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid
<400> 1
ggtggcactt ttcggggaaa tgtgcgcgga acccctattt gtttattttt ctaaatacat 60
tcaaatatgt atccgctcat gagacaataa ccctgataaa tgcttcaata atattgaaaa 120
aggaagagta tgagtattca acatttccgt gtcgccctta ttcccttttt tgcggcattt 180
tgccttcctg tttttgctca cccagaaacg ctggtgaaag taaaagatgc tgaagatcag 240
ttgggtgcac gagtgggtta catcgaactg gatctcaaca gcggtaagat ccttgagagt 300
tttcgccccg aagaacgttt tccaatgatg agcactttta aagttctgct atgtggcgcg 360
gtattatccc gtattgacgc cgggcaagag caactcggtc gccgcataca ctattctcag 420
aatgacttgg ttgagtactc accagtcaca gaaaagcatc ttacggatgg catgacagta 480
agagaattat gcagtgctgc cataaccatg agtgataaca ctgcggccaa cttacttctg 540
acaacgatcg gaggaccgaa ggagctaacc gcttttttgc acaacatggg ggatcatgta 600
actcgccttg atcgttggga accggagctg aatgaagcca taccaaacga cgagcgtgac 660
accacgatgc ctgtagcaat ggcaacaacg ttgcgcaaac tattaactgg cgaactactt 720
actctagctt cccggcaaca attaatagac tggatggagg cggataaagt tgcaggacca 780
cttctgcgct cggcccttcc ggctggctgg tttattgctg ataaatctgg agccggtgag 840
cgtgggtctc gcggtatcat tgcagcactg gggccagatg gtaagccctc ccgtatcgta 900
gttatctaca cgacggggag tcaggcaact atggatgaac gaaatagaca gatcgctgag 960
ataggtgcct cactgattaa gcattggtaa ctgtcagacc aagtttactc atatatactt 1020
tagattgatt taaaacttca tttttaattt aaaaggatct aggtgaagat cctttttgat 1080
aatctcatga ccaaaatccc ttaacgtgag ttttcgttcc actgagcgtc agaccccgta 1140
gaaaagatca aaggatcttc ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa 1200
acaaaaaaac caccgctacc agcggtggtt tgtttgccgg atcaagagct accaactctt 1260
tttccgaagg taactggctt cagcagagcg cagataccaa atactgtcct tctagtgtag 1320
ccgtagttag gccaccactt caagaactct gtagcaccgc ctacatacct cgctctgcta 1380
atcctgttac cagtggctgc tgccagtggc gataagtcgt gtcttaccgg gttggactca 1440
agacgatagt taccggataa ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag 1500
cccagcttgg agcgaacgac ctacaccgaa ctgagatacc tacagcgtga gctatgagaa 1560
agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga 1620
acaggagagc gcacgaggga gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc 1680
gggtttcgcc acctctgact tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc 1740
ctatggaaaa acgccagcaa cgcggccttt ttacggttcc tggccttttg ctggcctttt 1800
gctcacatgt tctttcctgc gttatcccct gattctgtgg ataaccgtat taccgccttt 1860
gagtgagctg ataccgctcg ccgcagccga acgaccgagc gcagcgagtc agtgagcgag 1920
gaagcggaag agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa 1980
tgcagctggc acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat 2040
gtgagttagc tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg 2100
ttgtgtggaa ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac 2160
gccaagcgcg caattaaccc tcactaaagg gaacaaaagc tgggtaccgg gccccccctc 2220
gaggtcgacg gtatcgataa gctcgataag ctcatggcac ctgtattgta ctcttatcag 2280
tcattatatg gactttaact tccccagata ttatttgggc tcctccataa gactgtgagc 2340
atctgaccac tggagtgttg cttcccatta tatccctgtt atcaagcaca aggtcaggca 2400
cagagtaaga ctcaaaacat gttttggaat gtatgactgg tatgaactac aaaccagtaa 2460
gctgatgttt tcattttgag tctataaatc taattttgtg gtggttttgt gtatggctca 2520
aggctcaaat tgtaaaattt aatattatgt gaccaaagaa agttataccc agaacctcaa 2580
tttcctcacc ttcaaaatgg ggcagtttct cactcattgg tctgctgtca cgattttaat 2640
gagctcatgc acaaacagcc ctttatataa ggtaagtgct ggataaatgt tggctactat 2700
aataaaataa gcctctaaga tacttggtca gcacaagtac tacccaagag tatgcactgt 2760
aagtaaactg acaaaattgt gtatctaaaa ctggccagat gaaagagaaa cttttaaggg 2820
gcccttctgc gtgcccgaca ctgtgctagg cactcacact atcccgaccc gagaaaccga 2880
tctgcgaccc agaggaactt accaagcctc cagcatcttg tgcagcccta ctcatgggac 2940
catctggata cccacccttg tctttacagg gagcagaaca cacctcttat gtgtcagaaa 3000
acaaagtcca ggaagtatat ttttacctga ggcaatatct gaaaattgta tgctacagcc 3060
tccaaagtga gtcttcctct cagtacctct cttctaggca catggagccc tttcttccaa 3120
gtattatgtt taaccactta atgaatgaag tcctgaaact gcttacccat gctccctata 3180
atctctgagt aatcttcctt ttccacaacc tcaggcataa tctcatcttc tgtttctatt 3240
acaatttcaa attctggaaa aaggaagttg tggtctggaa ttatatggtc cagatgatct 3300
gaaacaaaaa ggacagcact attagtaatc atttagtttt gaagacagtc taataatttg 3360
ctgtctctaa agtactatat tccctatagt tctggcattt tagataaagg gtcataaatt 3420
aaatgcctat atggtgacat tattcagtga ttcagacttc acagcctttt tttttttttt 3480
acaaaggtgt tccaggcatg aaaaatttta aagtactata cctttcctaa ttttaccttt 3540
aaagttgtcc tggaaatatc tgggttgaca aaggcgatga aactgaactg agacttaaaa 3600
aaaagattac ccacctggtt gtgcacaagc ctgcttatgt cccaatctcc agtctagggt 3660
ctgatgctcc ttgctgcagt aatatgcttt gtggcatctg gagcacgttt tggggcctaa 3720
acagccacaa accctgcaga gatgagcacc agacttaagc tggagacaca ctgattctcc 3780
tgtttctggg ggaggattct cagaaggtgg ctcatatgag taaaaatcgt ttttcctggg 3840
tagttgattc ctaaaaacta aaaaagaata cagagaaaag ttttatcttc aaacaaaaca 3900
gcaattcaca tattttatcc tctgcacgta aaactgaaaa taacaacaac aaaaaagaaa 3960
tgaaagtttt tgctttcagg aataagcttt taaaatccag aaactagatt tcgtccggta 4020
cacgcaactg agttgcctcc tagaggtggt ttgagttaat caaattaata agactgatcg 4080
ttaagaacga ctgccaaaaa tacgaaaaag ctactgggat ccatctttcc aagacaattt 4140
ctattatctg aattaacacc atacctggta cccactgatt aaaagctggg ggttaccaat 4200
gcgcgtgggc acagttagaa gcttatgtag caaaaatgag cacatcctgg aagggcccgg 4260
gagaaggtgc tcctggggca gcgcggagag ggagctctga ggctggggcg gcagcggtgc 4320
ttgccgccgt ccccctggtc gctcccggaa ttaacgccgc gcacgcgtcg gaggcatggc 4380
cccgtcccga ccccgtttgg cggctcacct cgcaggccgg cacagcacgg ctgctcgcgg 4440
cagcagaaga ggaagatgca gcggtggaag gcgtccgggc ggccaggcag cggcgcatac 4500
acctgcagca ggaaggagag cgggcggccg cacagctcgc aggccagggc ctggggcccc 4560
ggcagcccgg ccgcgcccag ccatgccggc cgcccgccca ccttgctggg gaactgctcg 4620
ctgcgcagtc gccacgccgg cgccgactcg gcgaagccca gctccacagg cctggccccg 4680
gcggcagcca tgcggggcgc gggctggcgt ggggcgcagc ccacagctgg gtcggaaggc 4740
ggaaatcggg cgccgggccg gaaggcaaga ggcgggcacc tttccggagg acaggaggcg 4800
gaaacgcgtc tgacgggagc ggttgcagga ccaatgcgag ggaacggggc agaggaaacc 4860
tctcggcatc agccccgccc ctggcgcctc tgcctccgag ccgctttcct ggtgcctccg 4920
ggtgctctgg gatggttctg gtctttggga gagtggcagc tggtgacggc gctccgctca 4980
cctctgcaca tgtcttgctg tgggcctgcg ggtggccgcc agggaggcag agccctcccg 5040
caaaccttcc ctgctggtgt ccacctcagg gtgtgggaaa cctgtgcgct ggccgagtgc 5100
taaccaagag taggcagtga aagacaaatg aaggttgaac aggtaaagtg aggaccctac 5160
agcggaaacc aagaatcctg tgtgcctgag agtaatgaag aagcctctgc agaagagtct 5220
tttctgtcag tcttaaggtc tctgttttaa tgttagtgct ggcttgctgt acctgaattc 5280
caagggagga gtgtataatg aggcatggcc aacccccact tcccatcatt gcctgaacta 5340
gtttttcagg ttaacttcag aatgcccttg gtaccgcggg ccccctctgt ggtcccacgc 5400
cactgatcgc tgcatgccca ccacctgggt acacacagtc tgtgattccc ggagcagaac 5460
ggaccctgcc cacccggtct tgtgtgctac tcagtggaca gacccaaggc aagaaagggt 5520
gacaaggaca gggtcttccc aggctggctt tgagttccta gcaccgcccc gcccccaatc 5580
ctctgtggca catggagtct tggtccccag agtcccccag cggcctccag atggtctggg 5640
agggcagttc agctgtggct gcgcatagca gacatacaac ggacggtggg cccagaccca 5700
ggctgtgtag acccagcccc cccgccccgc agtgcctagg tcacccacta acgccccagg 5760
cctggtcttg gctgggcgtg actgttaccc tcaaaagcag gcagctccag ggtaaaaggt 5820
gccctgccct gtagagccca cttccttccc agggctgcgg ctgggtaggt ttgtagcctt 5880
catcacgggc cacctccagc cactggaccg ctggcccctg ccctgtcctg gggagtgtgg 5940
tcctgcgact ctaatggccg caagccacct gactccccca acaccacact ctacctctca 6000
agcccaggtc tctccctagt gacccaccca gcacatttag ctagctgagc cccacagcca 6060
gaggtcctca ggccctgctt tcagggcagt tgctctgaag tcggcaaggg ggagtgactg 6120
cctggccact ccatgccctc caagagctcc ttctgcagga gcgtacagaa cccagggccc 6180
tggcacccgt gcagaccctg gcccacccca cctgggcgct cagtgcccaa gagatgtcca 6240
cacctaggat gtcccgcggt gggtgggggg cccgagagac gggcaggccg ggggcaggcc 6300
tggccatgcg gggccgaacc gggcactgcc cagcgtgggg cgcgggggcc acggcgcgcg 6360
cccccagccc ccgggcccag caccccaagg cggccaacgc caaaactctc cctcctcctc 6420
ttcctcaatc tcgctctcgc tctttttttt tttcgcaaaa ggaggggaga gggggtaaaa 6480
aaatgctgca ctgtgcggcg aagccggtga gtgagcggcg cggggccaat cagcgtgcgc 6540
cgttccgaaa gttgcctttt atggctcgag cggccgcggc ggcgccctat aaaacccagc 6600
ggcgcgacgc gccaccaccg ccgagaccgc gtccgcccgc gagcacagag cctcgccttt 6660
gccgatccgc cgcccgtcca cacccgccgc caggtaagcc cggccagccg accggggcat 6720
gcggccgcgg cccttcgccc gtgcagagcc gccgtctggg ccgcagcggg gggcgcatgg 6780
ggcggaaccg gaccgccgtg gggggcgcgg gagaagcccc tgggcctccg gagatggggg 6840
acaccccacg ccagttcgca ggcgcgaggc cgcgctcggg cgggcgcgct ccgggggtgc 6900
cgctctcggg gcgggggcaa ccggcggggt ctttgtctga gccgggctct tgccaatggg 6960
gatcgcacgg tgggcgcggc gtagcccccg tcaggcccgg tgggggctgg ggcgccatgc 7020
gcgtgcgcgc tggtcctttg ggcgctaact gcgtgcgcgc tgggaattgg cgctaattgc 7080
gcgtgcgcgc tgggactcaa tggcgctaat cgcgcgtgcg ttctggggcc cgggcgcttg 7140
cgccacttcc tgcccgagcc gctggcgccc gagggtgtgg ccgctgcgtg cgcgcgcgcg 7200
acccggtcgc tgtttgaacc gggcggaggc ggggctggcg cccggttggg agggggttgg 7260
ggcctggctt cctgccgcgc gccgcgggga cgcctccgac cagtgtttgc cttttatggt 7320
aataacgcgg ccggcccggc ttcctttgtc cccaatctgg gcgcgcgccg gcgccccctg 7380
gcggcctaag gactcggcgc gccggaagtg gccagggcgg gggcgacttc ggctcacagc 7440
gcgcccggct attctcgcag ctcaccatgc cggtcgccac catgagcttg atatcgaatt 7500
cctgcagccc gggggatcca ctagttctag agcttgatta atagtaatca attacggggt 7560
cattagttca tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc 7620
ctggctgacc gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag 7680
taacgccaat agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc 7740
acttggcagt acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg 7800
gtaaatggcc cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc 7860
agtacatcta cgtattagtc atcgctatta ccatggtgat gcggttttgg cagtacatca 7920
atgggcgtgg atagcggttt gactcacggg gatttccaag tctccacccc attgacgtca 7980
atgggagttt gttttggcac caaaatcaac gggactttcc aaaatgtcgt aacaactccg 8040
ccccattgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata agcagagctg 8100
gtttagtgaa ccgtcagatc cgctagcgtt cgaagtttaa acgcggccgc gactctagat 8160
cataatcagc cataccacat ttgtagaggt tttacttgct ttaaaaaacc tcccacacct 8220
ccccctgaac ctgaaacata aaatgaatgc aattgttgtt gttaacttgt ttattgcagc 8280
ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc 8340
actgcattct agttgtggtt tgtccaaact catcaatgta tcttaaatcg aattctaccg 8400
ggtaggggag gcgcttttcc caaggcagtc tggagcatgc gctttagcag ccccgctggg 8460
cacttggcgc tacacaagtg gcctctggcc tcgcacacat tccacatcca ccggtaggcg 8520
ccaaccggct ccgttctttg gtggcccctt cgcgccacct tctactcctc ccctagtcag 8580
gaagttcccc cccgccccgc agctcgcgtc gtgcaggacg tgacaaatgg aagtagcacg 8640
tctcactagt ctcgtgcaga tggacagcac cgctgagcaa tggaagcggg taggcctttg 8700
gggcagcggc caatagcagc tttgctcctt cgctttctgg gctcagaggc tgggaagggg 8760
tgggtccggg ggcgggctca ggggcgggct caggggcggg gcgggcgccc gaaggtcctc 8820
cggaggcccg gcattctgca cgcttcaaaa gcgcacgtct gccgcgctgt tctcctcttc 8880
ctcatctccg ggcctttcga ccagcttacc atgaccgagt acaagcccac ggtgcgcctc 8940
gccacccgcg acgacgtccc cagggccgta cgcaccctcg ccgccgcgtt cgccgactac 9000
cccgccacgc gccacaccgt cgatccggac cgccacatcg agcgggtcac cgagctgcaa 9060
gaactcttcc tcacgcgcgt cgggctcgac atcggcaagg tgtgggtcgc ggacgacggc 9120
gccgcggtgg cggtctggac cacgccggag agcgtcgaag cgggggcggt gttcgccgag 9180
atcggcccgc gcatggccga gttgagcggt tcccggctgg ccgcgcagaa cagatggaag 9240
gcctcctggc gccgcaccgg cccaaggagc ccgcgtggtt cctggccacc gtcgcgtctc 9300
gcccgaccac cagggcaagg gtctgggcag cgccgtcgtg ctccccggag tggaggcggc 9360
cgagcgcgcc ggggtgcccg ccttcctgga gacctccgcg ccccgcaacc tccccttcta 9420
cgagcggctc ggcttcaccg tcaccgccga cgtcgaggtg cccgaaggac cgcgcacctg 9480
gtgcatgacc cgcaagcccg gtgcctgacg cccgccccac gacccgcagc gcccgaccga 9540
aaggagcgca cgaccccatg catcgtagag ctcgctgatc agcctcgact gtgccttcta 9600
gttgccagcc atctgttgtt tgcccctccc ccgtgccttc cttgaccctg gaaggtgcca 9660
ctcccactgt cctttcctaa taaaatgagg aaattgcatc gcattgtctg agtaggtgtc 9720
attctattct ggggggtggg gtggggcagg acagcaaggg gggggattgg gragacaata 9780
gcaggcatgc tgggggggcg gtgggggcta tggcttctga ggcggaaaga accagctggg 9840
gctcgagatc cactagttct agcctcgagg ctagagcggc cgccaccgcg gtggagctcc 9900
aattcgccct atagtgagtc gtattacgcg cgctcactgg ccgtcgtttt acaacgtcgt 9960
gactgggaaa accctggcgt tacccaactt aatcgccttg cagcacatcc ccctttcgcc 10020
agctggcgta atagcgaaga ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg 10080
aatggcgaat ggaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt 10140
aaatcagctc attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag 10200
aatagaccga gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga 10260
acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg 10320
aaccatcacc ctaatcaagt tttttggggt cgaggtgccg taaagcacta aatcggaacc 10380
ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg 10440
aagggaagaa agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg gtcacgctgc 10500
gcgtaaccac cacacccgcc gcgcttaatg cgccgctaca gggcgcgtca g 10551
<210> 2
<211> 13547
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid
<400> 2
ggtggcactt ttcggggaaa tgtgcgcgga acccctattt gtttattttt ctaaatacat 60
tcaaatatgt atccgctcat gagacaataa ccctgataaa tgcttcaata atattgaaaa 120
aggaagagta tgagtattca acatttccgt gtcgccctta ttcccttttt tgcggcattt 180
tgccttcctg tttttgctca cccagaaacg ctggtgaaag taaaagatgc tgaagatcag 240
ttgggtgcac gagtgggtta catcgaactg gatctcaaca gcggtaagat ccttgagagt 300
tttcgccccg aagaacgttt tccaatgatg agcactttta aagttctgct atgtggcgcg 360
gtattatccc gtattgacgc cgggcaagag caactcggtc gccgcataca ctattctcag 420
aatgacttgg ttgagtactc accagtcaca gaaaagcatc ttacggatgg catgacagta 480
agagaattat gcagtgctgc cataaccatg agtgataaca ctgcggccaa cttacttctg 540
acaacgatcg gaggaccgaa ggagctaacc gcttttttgc acaacatggg ggatcatgta 600
actcgccttg atcgttggga accggagctg aatgaagcca taccaaacga cgagcgtgac 660
accacgatgc ctgtagcaat ggcaacaacg ttgcgcaaac tattaactgg cgaactactt 720
actctagctt cccggcaaca attaatagac tggatggagg cggataaagt tgcaggacca 780
cttctgcgct cggcccttcc ggctggctgg tttattgctg ataaatctgg agccggtgag 840
cgtgggtctc gcggtatcat tgcagcactg gggccagatg gtaagccctc ccgtatcgta 900
gttatctaca cgacggggag tcaggcaact atggatgaac gaaatagaca gatcgctgag 960
ataggtgcct cactgattaa gcattggtaa ctgtcagacc aagtttactc atatatactt 1020
tagattgatt taaaacttca tttttaattt aaaaggatct aggtgaagat cctttttgat 1080
aatctcatga ccaaaatccc ttaacgtgag ttttcgttcc actgagcgtc agaccccgta 1140
gaaaagatca aaggatcttc ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa 1200
acaaaaaaac caccgctacc agcggtggtt tgtttgccgg atcaagagct accaactctt 1260
tttccgaagg taactggctt cagcagagcg cagataccaa atactgtcct tctagtgtag 1320
ccgtagttag gccaccactt caagaactct gtagcaccgc ctacatacct cgctctgcta 1380
atcctgttac cagtggctgc tgccagtggc gataagtcgt gtcttaccgg gttggactca 1440
agacgatagt taccggataa ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag 1500
cccagcttgg agcgaacgac ctacaccgaa ctgagatacc tacagcgtga gctatgagaa 1560
agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga 1620
acaggagagc gcacgaggga gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc 1680
gggtttcgcc acctctgact tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc 1740
ctatggaaaa acgccagcaa cgcggccttt ttacggttcc tggccttttg ctggcctttt 1800
gctcacatgt tctttcctgc gttatcccct gattctgtgg ataaccgtat taccgccttt 1860
gagtgagctg ataccgctcg ccgcagccga acgaccgagc gcagcgagtc agtgagcgag 1920
gaagcggaag agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa 1980
tgcagctggc acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat 2040
gtgagttagc tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg 2100
ttgtgtggaa ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac 2160
gccaagcgcg caattaaccc tcactaaagg gaacaaaagc tgggtaccgg gccccccctc 2220
gaggtcgacg gtatcgataa gcttcaatgt ttttagcacc ctctgtgtgg aggaaaataa 2280
tgcagattat tctaattagt gtaatatcta accacattaa aatatattac atagtaaact 2340
acactccata attttataaa tttgactccc cagggtaata aactagtctc tagtctgctc 2400
accttcaact gtacaataaa gtcttggttc ttttgaaata gacctcaaat gagacaccta 2460
aaattcaaag tgtctttaca tttaaagaca cctacaggaa agcaggtaaa agagccaggt 2520
taaaaacaaa ttctaaaacc acttagctgc agttaaacat atagtaaaga tgcactaaag 2580
tttcttactc tgtaaatccc ttccacttca ggaaatattc cactttccca ttcactacac 2640
gtcgatctag tactttttcc acgacaaatt cttcaggctc tgcctcttca acttttttac 2700
tctttccatt ctgttttttt cccatttttt gctaaaataa aacaaaagag aaattaagaa 2760
atattcctct tgaattttga gcacattttc aaggctcaat tgcttatatt attatcacat 2820
tcgacataaa tttttacttc tatatcccag ggcagacacc ttctggaaag attaaaagtc 2880
aacagacaat aaaataaaag aatgctttat cttgttcatt tagttcaaac ttacaaccca 2940
ccaccaaaat aatacaataa aaaaacacta tctggaaaca gttatttttt tccagtcttt 3000
ttttttgaga cagggtctca cactcttgtc gcccaggctg gagtgcagtg gcgtgatctc 3060
agctcactgc aacctccgcc tccccaggtt caagcagttc tcatgcctca gcctccagag 3120
tagctgggat tataggcgga tgccaccatg ccgggctaat tttttttgtg tttttattag 3180
aaacagggtt tcaccatgtt gaccaggctg gtctcaaact cctgacctga agtgattcac 3240
cagcctgggc ctcccaaagt gctggcatta caggcgtgag ccactgcgcc cggccctgta 3300
gtcttaaaag accaagttta ctaattttca ctcattttaa caacactgca acaaacaact 3360
atgcaggaag tacctaaagg gtgatccaga gaagcaagta gtagtgacag gtcttaggtg 3420
aacctatgac agaccttgta tccaccccca gatggtaaaa gccccagccc ccttctcaat 3480
tcaaatatta atgtcaaaag catcaatgat acagagaaaa gataaatgca gaatgaaaac 3540
atggttcaaa atcctgatac caactgcagg gtcaactata gagaccacta ggaggttcaa 3600
ttaaaggaca agattatttt tccataatct ctgtagataa tatttcctac cacttagaac 3660
aaaactataa agctatcact tcaagagacc aacattacaa atttatttta attccctaag 3720
gtgaaaaaaa tccttccttc ctggtttctc aagagaaagt ctatactggt aaccaaattc 3780
actttaaaca ggcattttct ttggtatgac actatttaag agaagcagga aaccaacgtg 3840
aaccagctct ttccaatggc tcaagatttc ctatgagagg actaaaaatg gggaaaattt 3900
ttatgagagg attaaaaatg ggggaaaaaa aaccctgaaa tggttaatca gaagatccta 3960
tgggctgaga aggaatccat cttaacattt catcttaaag caaatgctat tgccgggggc 4020
agtggctcat gcctgtaatc ccagcacttt gggaggccga ggtgggcaga tcatctgagg 4080
tcaggagttt gagaccagcc tgaccaacat ggagaaaccc cgtttctact aaaaatacaa 4140
aattagccag gcatagtggt gcatgcctgt aatcccagct acttgggagg ctgaggcagg 4200
agaactgctt gaacccagga ggcttaagtt gcggtgagcc aagatcacgc cattgcactc 4260
tagcctggac aacaagagaa aaactctgtc tcaaaaaaac acaaaaacaa aaaacccaaa 4320
tactatttaa aaaagataaa ccttaattgc tcaatcatta aagccatccc acaagtaaag 4380
cagcaagcag aaaaaagtta agaacacctc aaggctacag aaggacattt caagctatgc 4440
aggcatatga agtgtgcaga cagatatgta agaaaggcct caagactgca aaagggcatt 4500
tcaagctatg caagcatata ggtaacacat acacacacac aaaataaaat cccctgaaat 4560
acaaaaacat gcagcaaaca cctgacgttt ttggatacca tttctaagtc aggtgttatg 4620
attctcatta gtcaagatac ttgagtactg ggcccaaaca gctttctgcc actgtacagt 4680
acaagaaggt aggaataatg gtgggaggag caaagacaaa ctgtaataga cagaagtgta 4740
tcagatacct atactacatg aaaaacaaaa cagctactgc cacaaaggga gaaggctaac 4800
aaaataaagt caacaataaa tacagaaaat gaaaaggata cacactaagg tttacaaaaa 4860
aaaaaaggca gacaaaatgc catacagtat tcattcacta ctatggcatt cataagctag 4920
tttcaaatgc tcactatttt cttttatagt atatatttgc cttaacccag cacttttttc 4980
caaaagtgga tgagtcaaaa taaatttccc attatttaag tgaaattaac agcacacata 5040
tctcacaaca ctaatgaatt tttaaaatgg aaagttaaga acttttaaag tggccaacct 5100
gtgatccttc acaaaataaa ctaaatacaa taacagaccc caaaggctat caattgcgtg 5160
caaaaacaac ttctgttttc cagggtaaac agaatctaat gcagaatcta atgcagggta 5220
aacagactta atgcagaatc taatgatggc acaaattaaa aatcactaac gtgccctttt 5280
tagtgtgaaa cccagagaga gcacatacaa gccaaaaaca aatgctttat tttacctagg 5340
agacattaac attcaccttt acgtgtttaa gattaatgca atgttaaata ttgtgaaaac 5400
tgtaactttg aatttcatga tttttatgtg aatattccag ggtttaaaaa aacttgtaac 5460
atgacatggc tgaataagat aaaaaaaaaa tctagccttt tctcccttct ggctcatatt 5520
tgcgatttcg atcattttgt ttaaaaaaca aaacactgca atgaattaaa cttaatattc 5580
ttctatgttt tagagtaagt taaaacaaga taaagtgacc aaagtaattt gaaagattca 5640
atgacttttg ctccaaccta ggtgcacaag gtaccttgtt ctttaaattg ggctttaatg 5700
aaaatacttc tccagaattc tggggattta agaaaaatta tgccaaccaa caagggcttt 5760
accattttat gtaacatttt tcaacgctgc aaaaatgtgt gtatttctat ttgaagataa 5820
aaatcctcag caaaatccac attgcactgt ccttcaaaga ttagccttct ttgaactagt 5880
taagacacta ttaagccaag ccagtatctc cctgtaatga attcgttttt ctcttaattt 5940
tcccctgtaa tttacactgg gagagctggg aaatatgtgg atgtaaattt ctcagccaca 6000
gagatgcaaa gttatactgt ggggaaaaaa aacttgagtt aaatccttac atattttagg 6060
ttttcattaa cttaccaatg tagttttgtt ggaggccatt ttttttattg cagacttgaa 6120
gagctattac tagaaaaatg catgacagtt aaggtaagtt tgcatgacac aaaaaaggta 6180
actaaataca aattctgttt ggattccaac ccccaagtag agagcgcaca ctttcaaacg 6240
tgaatacaaa tccagagtag atctgcgctc ctacctacat tgcttatgat gtacttaagt 6300
acgtgtccta accatgtgag tctagaaaga ctttactggg gatcctggta cctaaaacag 6360
cttcacatgg cttaaaatag gggaccaatg tcttttccaa tctaagtccc atttataata 6420
aagtccatgt tccattttta aaggacaatc ctttcggttt aaaaccaggc acgattaccc 6480
aaacaactca caacggtaaa gcactgtgaa tcttctctgt tctgcaatcc caacttggtt 6540
tctgctcaga aaccctccct ctttccaatc ggtaattaaa taacaaaagg aaaaaactta 6600
agatgcttca accccgtttc gtgacacttt gaaaaaagaa tcacctcttg caaacacccg 6660
ctcccgaccc ccgccgctga agcccggcgt ccagaggcct aagcgcgggt gcccgccccc 6720
acccgggagc gcgggcctcg tggtcagcgc atccgcgggg agaaacaaag gccgcggcac 6780
gggggctcaa gggcactgcg ccacaccgca cgcgcctacc cccgcgcggc cacgttaact 6840
ggcggtcgcc gcagcctcgg gacagccggc cgcgcgccgc caggctcgcg gacgcgggac 6900
cacgcgccgc cctccgggag gcccaagtct cgacccagcc ccgcgtggcg ctgggggagg 6960
gggcgcctcc gccggaacgc gggtggggga ggggaggggg aaatgcgctt tgtctcgaaa 7020
tggggcaacc gtcgccacag ctccctaccc cctcgagggc agagcagtcc ccccactaac 7080
taccgggctg gccgcgcgcc aggccagccg cgaggccacc gcccgaccct ccactccttc 7140
ccgcagctcc cggcgcgggg tccggcgaga aggggagggg aggggagcgg agaaccgggc 7200
ccccgggacg cgtgtggcat ctgaagcacc accagcgagc gagagctaga gagaaggaaa 7260
gccaccgact tcaccgcctc cgagctgctc cgggtcgcgg gtctgcagcg tctccggccc 7320
tccgcgccta cagctcaagc cacatccgaa gggggaggga gccgggagct gcgcgcgggg 7380
ccgccggggg gaggggtggc accgcccacg ccgggcggcc acgaagggcg gggcagcggg 7440
cgcgcgcgcg gcggggggag gggccggcgc cgcgcccgct gggaattggg gccctagggg 7500
gagggcggag gcgccgacga ccgcggcact taccgttcgc ggcgtggcgc ccggtggtcc 7560
ccaaggggag ggaaggggga ggcggggcga ggacagtgac cggagtctcc tcagcggtgg 7620
cttttctgct tggcagcctc agcggctggc gccaaaaccg gactccgccc acttcctcgc 7680
ccgccggtgc gagggtgtgg aatcctccag acgctggggg agggggagtt gggagcttaa 7740
aaactagtac ccctttggga ccactttcag cagcgaactc tcctgtacac caggggtcag 7800
ttccacagac gcgggccagg ggtgggtcat tgcggcgtga acaataattt gactagaagt 7860
tgattcgggt gtttccggaa ggggccgagt caatccgccg agttggggca cggaaaacaa 7920
aaagggaagg ctactaagat ttttctggcg ggggttatca ttggcgtaac tgcagggacc 7980
acctcccggg ttgagggggc tggatctcca ggctgcggat taagcccctc ccgtcggcgt 8040
taatttcaaa ctgcgcgacg tttctcacct gccttcgcca aggcaggggc cgggacccta 8100
ttccaagagg tagtaactag caggactcta gccttccgca attcattgag cgcatttacg 8160
gaagtaacgt cgggtactgt ctctggccgc aagggtggga ggagtacgca tttggcgtaa 8220
ggtggggcgt agagccttcc cgccattggc ggcggatagg gcgtttacgc gacggcctga 8280
cgtagcggaa gacgcgttag tgggggggaa ggttctagaa aagcggcggc agcggctcta 8340
gcggcagtag cagcagcgcc gggtcccgtg cggaggtgct cctcgcagag ttgtttctcg 8400
agcagcggca gttctcacta cagcgccagg acgagtccgg ttcgtgttcg tccgcggaga 8460
tctctctcat ctcgctcggc tgcgggaaat cgggctgaag cgactgagtc cgcgatggag 8520
gtaacgggtt tgaaatcaat gagttattga aaagggcatg gcgaggccgt tggcgcctca 8580
gtggaagtcg gccagccgcc tccgtgggag agaggcagga aatcggacca attcagtagc 8640
agtggggctt aaggtttatg aacggggtct tgagcggagg cctgagcgta caaacagctt 8700
ccccaccctc agcctcccgg cgccatttcc cttcactggg ggtgggggat ggggagcttt 8760
cacatggcgg acgctgcccc gctggggtga aagtggggcg cggaggcggg aattcttatt 8820
ccctttctaa agcacgctgc ttcgggggcc acggcgtctc ctcggcgagc gtttcggcgg 8880
gcagcaggtc ctcgtgagcg aggctgcgga gcttcccctc cccctctctc ccgggaaccg 8940
atttggcggc cgccattttc atggctcgcc ttcctctcag cgttttcctt ataactcttt 9000
tattttctta gtgtgctttc tctatcaaga agtagaagtg gttaactatt ttttttttct 9060
tctcgggctg ttttcatatc gtttcgaggt ggatttggag tgttttgtga gcttggatct 9120
ttagagtcct gcgcacctca ttaaaggcgc tcagccttcc cctcgatgaa atggcgccat 9180
tgcgttcgga agccacaccg aagagcgggg agggggggtg ctccgggttt gcgggcccgg 9240
tttcagagaa gatatcacca cccagggcgt cgggccgggt tcaatgcgag ccgtaggaca 9300
aagaaaccat tttatgtttt tcctgtcttt tttttccttt gagtaacggt tttatctggg 9360
tctgcagtca gtaaaacgac agatgaaccg cggcaaaata aacataaatt ggaagccatc 9420
ggccacgagg ggcagggacg aaggtggttt tctgggcggg ggagggatat tcgcgtcaga 9480
atcctttact gttcttaagg attccgttta agttgtagag ctgactcatt ttaagtaatg 9540
ttgttactga gaagtttaac ccttacggga cagatccatg gacctttata gatgattacg 9600
aggaaagtga aataacgatt ttgtccttag ttatacttcg attaaaacat ggcttcagag 9660
gctccttcct gtaatgcgta tggattgatg tgcaaaactg ttttgggcct gggccgctct 9720
gtatttgaac tttgttactt ttctcatttt gtttgcaatc ttggttgaac attacattga 9780
taagcataag gtctcaagcg aagggggtct acctggttat ttttctttga ccctaagcac 9840
gtttataaaa taacattgtt taaaatcgat agtggacatc gggtaagttt ggataaattg 9900
tgaggtaagt aatgagtttt tgctttttgt tagtgatttg taaaacttgt tataaatgta 9960
cattatccgt aatttcagtt tagagataac ctatgtgctg acgacaatta agaataaaaa 10020
ctagctgaaa aaatgaaaat aactatcgtg acaagtaacc atttcaaaag actgctttgt 10080
gtctcatagg agctagtttg atcatttcag ttaatttttt ctttaatttt tacgagtcat 10140
gaaaactaca ggaaaaaaaa tctgaactgg gttttaccac tactttttag gagttgggag 10200
catgcgaatg gagggagagc tccgtagaac tgggatgaga gcagcaatta atgctgcttg 10260
ctaggaacaa aaaataattg attgaaaatt acgtgtgact ttttagtttg cattatgcgt 10320
ttgtagcagt tggtcctgga tatcactttc tctcgtttga ggttttttaa cctagttaac 10380
ttttaagaca ggtttcctta acattcataa gtgcccagaa tacagctgtg tagtacagca 10440
tataaagatt tcagctctga ggtttttcct attgacttgg aaaattgttt tgtgcctgtc 10500
gcttgccaca tggccaatca agtaagcttg attaatagta atcaattacg gggtcattag 10560
ttcatagccc atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct 10620
gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc 10680
caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg 10740
cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat 10800
ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca 10860
tctacgtatt agtcatcgct attaccatgg tgatgcggtt ttggcagtac atcaatgggc 10920
gtggatagcg gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga 10980
gtttgttttg gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tccgccccat 11040
tgacgcaaat gggcggtagg cgtgtacggt gggaggtcta tataagcaga gctggtttag 11100
tgaaccgtca gatccgctag cgttcgaagt ttaaacgcgg ccgcgactct agatcataat 11160
cagccatacc acatttgtag aggttttact tgctttaaaa aacctcccac acctccccct 11220
gaacctgaaa cataaaatga atgcaattgt tgttgttaac ttgtttattg cagcttataa 11280
tggttacaaa taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca 11340
ttctagttgt ggtttgtcca aactcatcaa tgtatcttaa atcgaattct accgggtagg 11400
ggaggcgctt ttcccaaggc agtctggagc atgcgcttta gcagccccgc tgggcacttg 11460
gcgctacaca agtggcctct ggcctcgcac acattccaca tccaccggta ggcgccaacc 11520
ggctccgttc tttggtggcc ccttcgcgcc accttctact cctcccctag tcaggaagtt 11580
cccccccgcc ccgcagctcg cgtcgtgcag gacgtgacaa atggaagtag cacgtctcac 11640
tagtctcgtg cagatggaca gcaccgctga gcaatggaag cgggtaggcc tttggggcag 11700
cggccaatag cagctttgct ccttcgcttt ctgggctcag aggctgggaa ggggtgggtc 11760
cgggggcggg ctcaggggcg ggctcagggg cggggcgggc gcccgaaggt cctccggagg 11820
cccggcattc tgcacgcttc aaaagcgcac gtctgccgcg ctgttctcct cttcctcatc 11880
tccgggcctt tcgaccagct taccatgacc gagtacaagc ccacggtgcg cctcgccacc 11940
cgcgacgacg tccccagggc cgtacgcacc ctcgccgccg cgttcgccga ctaccccgcc 12000
acgcgccaca ccgtcgatcc ggaccgccac atcgagcggg tcaccgagct gcaagaactc 12060
ttcctcacgc gcgtcgggct cgacatcggc aaggtgtggg tcgcggacga cggcgccgcg 12120
gtggcggtct ggaccacgcc ggagagcgtc gaagcggggg cggtgttcgc cgagatcggc 12180
ccgcgcatgg ccgagttgag cggttcccgg ctggccgcgc agcaacagat ggaaggcctc 12240
ctggcgccgc accggcccaa ggagcccgcg tggttcctgg ccaccgtcgg cgtctcgccc 12300
gaccaccagg gcaagggtct gggcagcgcc gtcgtgctcc ccggagtgga ggcggccgag 12360
cgcgccgggg tgcccgcctt cctggagacc tccgcgcccc gcaacctccc cttctacgag 12420
cggctcggct tcaccgtcac cgccgacgtc gaggtgcccg aaggaccgcg cacctggtgc 12480
atgacccgca agcccggtgc ctgacgcccg ccccacgacc cgcagcgccc gaccgaaagg 12540
agcgcacgac cccatgcatc gtagagctcg ctgatcagcc tcgactgtgc cttctagttg 12600
ccagccatct gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc 12660
cactgtcctt tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc 12720
tattctgggg ggtggggtgg ggcaggacag caaggggggg gattgggrag acaatagcag 12780
gcatgctggg ggggcggtgg gggctatggc ttctgaggcg gaaagaacca gctggggctc 12840
gagatccact agttctagcc tcgaggctag agcggccgcc accgcggtgg agctccaatt 12900
cgccctatag tgagtcgtat tacgcgcgct cactggccgt cgttttacaa cgtcgtgact 12960
gggaaaaccc tggcgttacc caacttaatc gccttgcagc acatccccct ttcgccagct 13020
ggcgtaatag cgaagaggcc cgcaccgatc gcccttccca acagttgcgc agcctgaatg 13080
gcgaatggaa attgtaagcg ttaatatttt gttaaaattc gcgttaaatt tttgttaaat 13140
cagctcattt tttaaccaat aggccgaaat cggcaaaatc ccttataaat caaaagaata 13200
gaccgagata gggttgagtg ttgttccagt ttggaacaag agtccactat taaagaacgt 13260
ggactccaac gtcaaagggc gaaaaaccgt ctatcagggc gatggcccac tacgtgaacc 13320
atcaccctaa tcaagttttt tggggtcgag gtgccgtaaa gcactaaatc ggaaccctaa 13380
agggagcccc cgatttagag cttgacgggg aaagccggcg aacgtggcga gaaaggaagg 13440
gaagaaagcg aaaggagcgg gcgctagggc gctggcaagt gtagcggtca cgctgcgcgt 13500
aaccaccaca cccgccgcgc ttaatgcgcc gctacagggc gcgtcag 13547
<210> 3
<211> 600
<212> DNA
<213> Artificial Sequence
<220>
<223> Modified S. alboniger puro
<400> 3
atgactgaat acaaaccaac tgttcgcctg gcaactcgtg atgatgttcc acgtgcagtt 60
cgcaccctgg ctgctgcatt tgctgactac cctgcaaccc gtcacactgt ggacccagac 120
cgccacattg aacgtgtgac tgaactgcag gagctgttcc tgacccgtgt gggcctggac 180
attggcaaag tgtgggtggc agatgatggt gctgctgtgg cagtgtggac cacccctgaa 240
tctgttgaag ctggtgcagt gtttgctgag attggcccac gcatggcaga actgtctggc 300
agccgcctgg cagcacaaca gcagatggaa ggtctgctgg caccacaccg cccaaaagaa 360
cctgcttggt tcctggcaac tgtgggtgtg agccctgacc accagggtaa gggcctgggc 420
tctgcagtgg tgctgcctgg tgtggaagca gctgaacgtg caggtgtgcc tgctttcctg 480
gagacctcag ctccacgcaa cctgcctttc tatgaacgcc tgggcttcac tgtgactgct 540
gatgtggaag tgccagaagg cccacgcact tggtgcatga ctcgcaaacc aggtgcttaa 600
<210> 4
<211> 807
<212> DNA
<213> Streptomyces fradiae
<220>
<223> S. fradiae Neo
<400> 4
atggacgaca gcacgttgcg ccggaagtac ccgcaccacg agtggcacgc agtgaacgaa 60
ggagactcgg gcgccttcgt ctaccagctc accggcggcc ccgagcccca gcccgagctc 120
tacgcgaaga tcgccccccg cgcccccgag aactccgcct tcgacctgtc cggcgaggcc 180
gaccggctgg agtggctcca ccgccacggg atccccgtcc cccgcgtcgt cgagcgcggt 240
gccgacgaca ccgccgcgtg gctcgtcacg gaggccgtcc ccggcgtcgc ggcggccgag 300
gagtggcccg agcaccagcg gttcgccgtg gtcgaggcga tggcggagct ggcccgcgcc 360
ctccacgagc tgcccgtgga ggactgcccc tccgaccggc gcctcgacgc ggcggtcgcc 420
gaggcccggc ggaacgtcgc cgagggcttg gtggacctcg acgacctgca ggaggagcgg 480
gccgggtgga ccggcgacca gctcctggcg gagctcgacc gcacccgtcc cgagaaggag 540
gacctggtcg tctgccatgg cgacctgtgc cccaacaacg tcctgctcga ccccgggacc 600
tgccgggtca ccggcgtgat cgacgtcggc cgcctcgggg tcgccgaccg ccacgccgac 660
atcgccttgg ccgcccgcga gctggagatc gacgaggacc cctggttcgg ccccgcctac 720
gccgagcggt tcctggagcg gtacggcgcc caccgcgtcg acaaggagaa gctggccttc 780
taccagcttc tcgacgagtt cttctag 807
<210> 5
<211> 600
<212> DNA
<213> Streptomyces alboniger
<220>
<223> S. alboniger puro
<400> 5
atgaccgagt acaagcccac ggtgcgcctc gccacccgcg acgacgtccc cagggccgta 60
cgcaccctcg ccgccgcgtt cgccgactac cccgccacgc gccacaccgt cgatccggac 120
cgccacatcg agcgggtcac cgagctgcaa gaactcttcc tcacgcgcgt cgggctcgac 180
atcggcaagg tgtgggtcgc ggacgacggc gccgcggtgg cggtctggac cacgccggag 240
agcgtcgaag cgggggcggt gttcgccgag atcggcccgc gcatggccga gttgagcggt 300
tcccggctgg ccgcgcagca acagatggaa ggcctcctgg cgccgcaccg gcccaaggag 360
cccgcgtggt tcctggccac cgtcggcgtc tcgcccgacc accagggcaa gggtctgggc 420
agcgccgtcg tgctccccgg agtggaggcg gccgagcgcg ccggggtgcc cgccttcctg 480
gagacctccg cgccccgcaa cctccccttc tacgagcggc tcggcttcac cgtcaccgcc 540
gacgtcgagg tgcccgaagg accgcgcacc tggtgcatga cccgcaagcc cggtgcctga 600
<210> 6
<211> 999
<212> DNA
<213> Streptomyces hygroscopicus
<220>
<223> S. hygroscopicus hygro
<400> 6
atgacacaag aatccctgtt acttctcgac cgtattgatt cggatgattc ctacgcgagc 60
ctgcggaacg accaggaatt ctgggagccg ctggcccgcc gagccctgga ggagctcggg 120
ctgccggtgc cgccggtgct gcgggtgccc ggcgagagca ccaaccccgt actggtcggc 180
gagcccgacc cggtgatcaa gctgttcggc gagcactggt gcggtccgga gagcctcgcg 240
tcggagtcgg aggcgtacgc ggtcctggcg gacgccccgg tgccggtgcc ccgcctcctc 300
ggccgcggcg agctgcggcc cggcaccgga gcctggccgt ggccctacct ggtgatgagc 360
cggatgaccg gcaccacctg gcggtccgcg atggacggca cgaccgaccg gaacgcgctg 420
ctcgccctgg cccgcgaact cggccgggtg ctcggccggc tgcacagggt gccgctgacc 480
gggaacaccg tgctcacccc ccattccgag gtcttcccgg aactgctgcg ggaacgccgc 540
gcggcgaccg tcgaggacca ccgcgggtgg ggctacctct cgccccggct gctggaccgc 600
ctggaggact ggctgccgga cgtggacacg ctgctggccg gccgcgaacc ccggttcgtc 660
cacggcgacc tgcacgggac caacatcttc gtggacctgg ccgcgaccga ggtcaccggg 720
atcgtcgact tcaccgacgt ctatgcggga gactcccgct acagcctggt gcaactgcat 780
ctcaacgcct tccggggcga ccgcgagatc ctggccgcgc tgctcgacgg ggcgcagtgg 840
aagcggaccg aggacttcgc ccgcgaactg ctcgccttca ccttcctgca cgacttcgag 900
gtgttcgagg agaccccgct ggatctctcc ggcttcaccg atccggagga actggcgcag 960
ttcctctggg ggccgccgga caccgccccc ggcgcctga 999
<210> 7
<211> 1026
<212> DNA
<213> Escherichia coli
<220>
<223> E. coli hygro
<400> 7
atgaaaaagc ctgaactcac cgcgacgtct gtcgcgaagt ttctgatcga aaagttcgac 60
agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt cagcttcgat 120
gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt ctacaaagat 180
cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt gcttgacatt 240
ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg tgtcacgttg 300
caagacctgc ctgaaaccga actgcccgct gttctgcaac ccgtcgcgga gctcatggat 360
gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg accgcaagga 420
atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc ccatgtgtat 480
cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc tctcgatgag 540
ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc ggatttcggc 600
tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg gagcgaggcg 660
atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc gtggttggct 720
tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc aggatcgccg 780
cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag cttggttgac 840
ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt ccgatccgga 900
gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg gaccgatggc 960
tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc gagggcaaag 1020
gaatga 1026
<210> 8
<211> 795
<212> DNA
<213> Klebsiella pneumoniae
<220>
<223> Tn5 Neo
<400> 8
atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 60
ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca 120
gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 180
caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 240
ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 300
gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 360
cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 420
atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 480
gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac 540
ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat 600
ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac 660
atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 720
ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 780
gacgagttct tctga 795
<210> 9
<211> 12041
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid
<400> 9
cgttgtaaaa cgacggccag tgaattgtaa tacgactcac tatagggcga attgggtacc 60
gggccccccc tcgaagttta aacatttaaa tctagaagct tcaatgtttt tagcaccctc 120
tgtgtggagg aaaataatgc agattattct aattagtgta atatctaacc acattaaaat 180
atattacata gtaaactaca ctccataatt ttataaattt gactccccag ggtaataaac 240
tagtctctag tctgctcacc ttcaactgta caataaagtc ttggttcttt tgaaatagac 300
ctcaaatgag acacctaaaa ttcaaagtgt ctttacattt aaagacacct acaggaaagc 360
aggtaaaaga gccaggttaa aaacaaattc taaaaccact tagctgcagt taaacatata 420
gtaaagatgc actaaagttt cttactctgt aaatcccttc cacttcagga aatattccac 480
tttcccattc actacacgtc gatctagtac tttttccacg acaaattctt caggctctgc 540
ctcttcaact tttttactct ttccattctg tttttttccc attttttgct aaaataaaac 600
aaaagagaaa ttaagaaata ttcctcttga attttgagca cattttcaag gctcaattgc 660
ttatattatt atcacattcg acataaattt ttacttctat atcccagggc agacaccttc 720
tggaaagatt aaaagtcaac agacaataaa ataaaagaat gctttatctt gttcatttag 780
ttcaaactta caacccacca ccaaaataat acaataaaaa aacactatct ggaaacagtt 840
atttttttcc agtctttttt tttgagacag ggtctcacac tcttgtcgcc caggctggag 900
tgcagtggcg tgatctcagc tcactgcaac ctccgcctcc ccaggttcaa gcagttctca 960
tgcctcagcc tccagagtag ctgggattat aggcggatgc caccatgccg ggctaatttt 1020
ttttgtgttt ttattagaaa cagggtttca ccatgttgac caggctggtc tcaaactcct 1080
gacctgaagt gattcaccag cctgggcctc ccaaagtgct ggcattacag gcgtgagcca 1140
ctgcgcccgg ccctgtagtc ttaaaagacc aagtttacta attttcactc attttaacaa 1200
cactgcaaca aacaactatg caggaagtac ctaaagggtg atccagagaa gcaagtagta 1260
gtgacaggtc ttaggtgaac ctatgacaga ccttgtatcc acccccagat ggtaaaagcc 1320
ccagccccct tctcaattca aatattaatg tcaaaagcat caatgataca gagaaaagat 1380
aaatgcagaa tgaaaacatg gttcaaaatc ctgataccaa ctgcagggtc aactatagag 1440
accactagga ggttcaatta aaggacaaga ttatttttcc ataatctctg tagataatat 1500
ttcctaccac ttagaacaaa actataaagc tatcacttca agagaccaac attacaaatt 1560
tattttaatt ccctaaggtg aaaaaaatcc ttccttcctg gtttctcaag agaaagtcta 1620
tactggtaac caaattcact ttaaacaggc attttctttg gtatgacact atttaagaga 1680
agcaggaaac caacgtgaac cagctctttc caatggctca agatttccta tgagaggact 1740
aaaaatgggg aaaattttta tgagaggatt aaaaatgggg gaaaaaaaac cctgaaatgg 1800
ttaatcagaa gatcctatgg gctgagaagg aatccatctt aacatttcat cttaaagcaa 1860
atgctattgc cgggggcagt ggctcatgcc tgtaatccca gcactttggg aggccgaggt 1920
gggcagatca tctgaggtca ggagtttgag accagcctga ccaacatgga gaaaccccgt 1980
ttctactaaa aatacaaaat tagccaggca tagtggtgca tgcctgtaat cccagctact 2040
tgggaggctg aggcaggaga actgcttgaa cccaggaggc ttaagttgcg gtgagccaag 2100
atcacgccat tgcactctag cctggacaac aagagaaaaa ctctgtctca aaaaaacaca 2160
aaaacaaaaa acccaaatac tatttaaaaa agataaacct taattgctca atcattaaag 2220
ccatcccaca agtaaagcag caagcagaaa aaagttaaga acacctcaag gctacagaag 2280
gacatttcaa gctatgcagg catatgaagt gtgcagacag atatgtaaga aaggcctcaa 2340
gactgcaaaa gggcatttca agctatgcaa gcatataggt aacacataca cacacacaaa 2400
ataaaatccc ctgaaataca aaaacatgca gcaaacacct gacgtttttg gataccattt 2460
ctaagtcagg tgttatgatt ctcattagtc aagatacttg agtactgggc ccaaacagct 2520
ttctgccact gtacagtaca agaaggtagg aataatggtg ggaggagcaa agacaaactg 2580
taatagacag aagtgtatca gatacctata ctacatgaaa aacaaaacag ctactgccac 2640
aaagggagaa ggctaacaaa ataaagtcaa caataaatac agaaaatgaa aaggatacac 2700
actaaggttt acaaaaaaaa aaaggcagac aaaatgccat acagtattca ttcactacta 2760
tggcattcat aagctagttt caaatgctca ctattttctt ttatagtata tatttgcctt 2820
aacccagcac ttttttccaa aagtggatga gtcaaaataa atttcccatt atttaagtga 2880
aattaacagc acacatatct cacaacacta atgaattttt aaaatggaaa gttaagaact 2940
tttaaagtgg ccaacctgtg atccttcaca aaataaacta aatacaataa cagaccccaa 3000
aggctatcaa ttgcgtgcaa aaacaacttc tgttttccag ggtaaacaga atctaatgca 3060
gaatctaatg cagggtaaac agacttaatg cagaatctaa tgatggcaca aattaaaaat 3120
cactaacgtg ccctttttag tgtgaaaccc agagagagca catacaagcc aaaaacaaat 3180
gctttatttt acctaggaga cattaacatt cacctttacg tgtttaagat taatgcaatg 3240
ttaaatattg tgaaaactgt aactttgaat ttcatgattt ttatgtgaat attccagggt 3300
ttaaaaaaac ttgtaacatg acatggctga ataagataaa aaaaaaatct agccttttct 3360
cccttctggc tcatatttgc gatttcgatc attttgttta aaaaacaaaa cactgcaatg 3420
aattaaactt aatattcttc tatgttttag agtaagttaa aacaagataa agtgaccaaa 3480
gtaatttgaa agattcaatg acttttgctc caacctaggt gcacaaggta ccttgttctt 3540
taaattgggc tttaatgaaa atacttctcc agaattctgg ggatttaaga aaaattatgc 3600
caaccaacaa gggctttacc attttatgta acatttttca acgctgcaaa aatgtgtgta 3660
tttctatttg aagataaaaa tcctcagcaa aatccacatt gcactgtcct tcaaagatta 3720
gccttctttg aactagttaa gacactatta agccaagcca gtatctccct gtaatgaatt 3780
cgtttttctc ttaattttcc cctgtaattt acactgggag agctgggaaa tatgtggatg 3840
taaatttctc agccacagag atgcaaagtt atactgtggg gaaaaaaaac ttgagttaaa 3900
tccttacata ttttaggttt tcattaactt accaatgtag ttttgttgga ggccattttt 3960
tttattgcag acttgaagag ctattactag aaaaatgcat gacagttaag gtaagtttgc 4020
atgacacaaa aaaggtaact aaatacaaat tctgtttgga ttccaacccc caagtagaga 4080
gcgcacactt tcaaacgtga atacaaatcc agagtagatc tgcgctccta cctacattgc 4140
ttatgatgta cttaagtacg tgtcctaacc atgtgagtct agaaagactt tactggggat 4200
cctggtacct aaaacagctt cacatggctt aaaatagggg accaatgtct tttccaatct 4260
aagtcccatt tataataaag tccatgttcc atttttaaag gacaatcctt tcggtttaaa 4320
accaggcacg attacccaaa caactcacaa cggtaaagca ctgtgaatct tctctgttct 4380
gcaatcccaa cttggtttct gctcagaaac cctccctctt tccaatcggt aattaaataa 4440
caaaaggaaa aaacttaaga tgcttcaacc ccgtttcgtg acactttgaa aaaagaatca 4500
cctcttgcaa acacccgctc ccgacccccg ccgctgaagc ccggcgtcca gaggcctaag 4560
cgcgggtgcc cgcccccacc cgggagcgcg ggcctcgtgg tcagcgcatc cgcggggaga 4620
aacaaaggcc gcggcacggg ggctcaaggg cactgcgcca caccgcacgc gcctaccccc 4680
gcgcggccac gttaactggc ggtcgccgca gcctcgggac agccggccgc gcgccgccag 4740
gctcgcggac gcgggaccac gcgccgccct ccgggaggcc caagtctcga cccagccccg 4800
cgtggcgctg ggggaggggg cgcctccgcc ggaacgcggg tgggggaggg gagggggaaa 4860
tgcgctttgt ctcgaaatgg ggcaaccgtc gccacagctc cctaccccct cgagggcaga 4920
gcagtccccc cactaactac cgggctggcc gcgcgccagg ccagccgcga ggccaccgcc 4980
cgaccctcca ctccttcccg cagctcccgg cgcggggtcc ggcgagaagg ggaggggagg 5040
ggagcggaga accgggcccc cgggacgcgt gtggcatctg aagcaccacc agcgagcgag 5100
agctagagag aaggaaagcc accgacttca ccgcctccga gctgctccgg gtcgcgggtc 5160
tgcagcgtct ccggccctcc gcgcctacag ctcaagccac atccgaaggg ggagggagcc 5220
gggagctgcg cgcggggccg ccggggggag gggtggcacc gcccacgccg ggcggccacg 5280
aagggcgggg cagcgggcgc gcgcgcggcg gggggagggg ccggcgccgc gcccgctggg 5340
aattggggcc ctagggggag ggcggaggcg ccgacgaccg cggcacttac cgttcgcggc 5400
gtggcgcccg gtggtcccca aggggaggga agggggaggc ggggcgagga cagtgaccgg 5460
agtctcctca gcggtggctt ttctgcttgg cagcctcagc ggctggcgcc aaaaccggac 5520
tccgcccact tcctcgcccg ccggtgcgag ggtgtggaat cctccagacg ctgggggagg 5580
gggagttggg agcttaaaaa ctagtacccc tttgggacca ctttcagcag cgaactctcc 5640
tgtacaccag gggtcagttc cacagacgcg ggccaggggt gggtcattgc ggcgtgaaca 5700
ataatttgac tagaagttga ttcgggtgtt tccggaaggg gccgagtcaa tccgccgagt 5760
tggggcacgg aaaacaaaaa gggaaggcta ctaagatttt tctggcgggg gttatcattg 5820
gcgtaactgc agggaccacc tcccgggttg agggggctgg atctccaggc tgcggattaa 5880
gcccctcccg tcggcgttaa tttcaaactg cgcgacgttt ctcacctgcc ttcgccaagg 5940
caggggccgg gaccctattc caagaggtag taactagcag gactctagcc ttccgcaatt 6000
cattgagcgc atttacggaa gtaacgtcgg gtactgtctc tggccgcaag ggtgggagga 6060
gtacgcattt ggcgtaaggt ggggcgtaga gccttcccgc cattggcggc ggatagggcg 6120
tttacgcgac ggcctgacgt agcggaagac gcgttagtgg gggggaaggt tctagaaaag 6180
cggcggcagc ggctctagcg gcagtagcag cagcgccggg tcccgtgcgg aggtgctcct 6240
cgcagagttg tttctcgagc agcggcagtt ctcactacag cgccaggacg agtccggttc 6300
gtgttcgtcc gcggagatct ctctcatctc gctcggctgc gggaaatcgg gctgaagcga 6360
ctgagtccgc gatggaggta acgggtttga aatcaatgag ttattgaaaa gggcatggcg 6420
aggccgttgg cgcctcagtg gaagtcggcc agccgcctcc gtgggagaga ggcaggaaat 6480
cggaccaatt cagtagcagt ggggcttaag gtttatgaac ggggtcttga gcggaggcct 6540
gagcgtacaa acagcttccc caccctcagc ctcccggcgc catttccctt cactgggggt 6600
gggggatggg gagctttcac atggcggacg ctgccccgct ggggtgaaag tggggcgcgg 6660
aggcgggaat tcttattccc tttctaaagc acgctgcttc gggggccacg gcgtctcctc 6720
ggcgagcgtt tcggcgggca gcaggtcctc gtgagcgagg ctgcggagct tcccctcccc 6780
ctctctcccg ggaaccgatt tggcggccgc cattttcatg gctcgccttc ctctcagcgt 6840
tttccttata actcttttat tttcttagtg tgctttctct atcaagaagt agaagtggtt 6900
aactattttt tttttcttct cgggctgttt tcatatcgtt tcgaggtgga tttggagtgt 6960
tttgtgagct tggatcttta gagtcctgcg cacctcatta aaggcgctca gccttcccct 7020
cgatgaaatg gcgccattgc gttcggaagc cacaccgaag agcggggagg gggggtgctc 7080
cgggtttgcg ggcccggttt cagagaagat atcaccaccc agggcgtcgg gccgggttca 7140
atgcgagccg taggacaaag aaaccatttt atgtttttcc tgtctttttt ttcctttgag 7200
taacggtttt atctgggtct gcagtcagta aaacgacaga tgaaccgcgg caaaataaac 7260
ataaattgga agccatcggc cacgaggggc agggacgaag gtggttttct gggcggggga 7320
gggatattcg cgtcagaatc ctttactgtt cttaaggatt ccgtttaagt tgtagagctg 7380
actcatttta agtaatgttg ttactgagaa gtttaaccct tacgggacag atccatggac 7440
ctttatagat gattacgagg aaagtgaaat aacgattttg tccttagtta tacttcgatt 7500
aaaacatggc ttcagaggct ccttcctgta atgcgtatgg attgatgtgc aaaactgttt 7560
tgggcctggg ccgctctgta tttgaacttt gttacttttc tcattttgtt tgcaatcttg 7620
gttgaacatt acattgataa gcataaggtc tcaagcgaag ggggtctacc tggttatttt 7680
tctttgaccc taagcacgtt tataaaataa cattgtttaa aatcgatagt ggacatcggg 7740
taagtttgga taaattgtga ggtaagtaat gagtttttgc tttttgttag tgatttgtaa 7800
aacttgttat aaatgtacat tatccgtaat ttcagtttag agataaccta tgtgctgacg 7860
acaattaaga ataaaaacta gctgaaaaaa tgaaaataac tatcgtgaca agtaaccatt 7920
tcaaaagact gctttgtgtc tcataggagc tagtttgatc atttcagtta attttttctt 7980
taatttttac gagtcatgaa aactacagga aaaaaaatct gaactgggtt ttaccactac 8040
tttttaggag ttgggagcat gcgaatggag ggagagctcc gtagaactgg gatgagagca 8100
gcaattaatg ctgcttgcta ggaacaaaaa ataattgatt gaaaattacg tgtgactttt 8160
tagtttgcat tatgcgtttg tagcagttgg tcctggatat cactttctct cgtttgaggt 8220
tttttaacct agttaacttt taagacaggt ttccttaaca ttcataagtg cccagaatac 8280
agctgtgtag tacagcatat aaagatttca gctctgaggt ttttcctatt gacttggaaa 8340
attgttttgt gcctgtcgct tgccacatgg ccaatcaagt aagcttatcg ataccggtgg 8400
cgcgccaatt gttaattaag atctggccca atgggccgta cgaattcctt aggctaccgg 8460
gtaggggagg cgcttttccc aaggcagtct ggagcatgcg ctttagcagc cccgctgggc 8520
acttggcgct acacaagtgg cctctggcct cgcacacatt ccacatccac cggccggtag 8580
gcgccaaccg gctccgttct ttggtggccc cttcgcgcca ccttctactc ctcccctagt 8640
caggaagttc ccccccgccc cgcagctcgc gtcgtgcagg acgtgacaaa tggaagtagc 8700
acgtctcact agtctcgtgc agatggacag caccgctgag caatggaagc gggtaggcct 8760
ttggggcagc ggccaatagc agctttgctc cttcgctttc tgggctcaga ggctgggaag 8820
gggtgggtcc gggggcgggc tcaggggcgg gctcaggggc ggggcgggcg cccgaaggtc 8880
ctccggaggc ccggcattct gcacgcttca aaagcgcacg tctgccgcgc tgttctcctc 8940
ttcctcatct ccgggccttt cgaccagctt accatgaccg agtacaagcc cacggtgcgc 9000
ctcgccaccc gcgacgacgt ccccagggcc gtacgcaccc tcgccgccgc gttcgccgac 9060
taccccgcca cgcgccacac cgtcgatccg gaccgccaca tcgagcgggt caccgagctg 9120
caagaactct tcctcacgcg cgtcgggctc gacatcggca aggtgtgggt cgcggacgac 9180
ggcgccgcgg tggcggtctg gaccacgccg gagagcgtcg aagcgggggc ggtgttcgcc 9240
gagatcggcc cgcgcatggc cgagttgagc ggttcccggc tggccgcgca gcaacagatg 9300
gaaggcctcc tggcgccgca ccggcccaag gagcccgcgt ggttcctggc caccgtcggc 9360
gtctcgcccg accaccaggg caagggtctg ggcagcgccg tcgtgctccc cggagtggag 9420
gcggccgagc gcgccggggt gcccgccttc ctggagacct ccgcgccccg caacctcccc 9480
ttctacgagc ggctcggctt caccgtcacc gccgacgtcg aggtgcccga aggaccgcgc 9540
acctggtgca tgacccgcaa gcccggtgcc tgacgcccgc cccacgaccc gcagcgcccg 9600
accgaaagga gcgcacgacc ccatgcatcg tagagctcgc tgatcagcct cgactgtgcc 9660
ttctagttgc cagccatctg ttgtttgccc ctcccccgtg ccttccttga ccctggaagg 9720
tgccactccc actgtccttt cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag 9780
gtgtcattct attctggggg gtggggtggg gcaggacagc aagggggggg attgggraga 9840
caatagcagg catgctgggg gggcggtggg ggctatggct tctgaggcgg aaagaaccag 9900
ctggggctcg agggccgcca ccgcggtgga gctccagctt ttgttccctt tagtgagggt 9960
taatttcgag cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc 10020
tcacaattcc acacaacata cgagccggaa gcataaagtg taaagcctgg ggtgcctaat 10080
gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc 10140
tgtcgtgcca gcatcgcgag cacttttcgg ggaaatgtgc gcggaacccc tatttgttta 10200
tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 10260
caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 10320
ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 10380
gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 10440
aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 10500
ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 10560
atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 10620
gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 10680
gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 10740
atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 10800
aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 10860
actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 10920
aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa 10980
tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 11040
ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 11100
agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agactcgcga 11160
cactgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt 11220
ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 11280
ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 11340
tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 11400
tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 11460
gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 11520
ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 11580
tggcgctttc tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 11640
agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 11700
atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 11760
acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 11820
actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 11880
tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 11940
tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 12000
tcttttctac ggggtctgac gctcagtgga acgaaaactc a 12041
<210> 10
<211> 11646
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid
<400> 10
cgttgtaaaa cgacggccag tgaattgtaa tacgactcac tatagggcga attgggtacc 60
gggccccccc tcgaagttta aacatttaaa tctagaagct tttaaccctc tatcccttta 120
aacttccttg atccagtgta agcacctcct agaaagtcag tagacaataa aacaaaagtt 180
ctgcttcacc gatttacatt tataaccaaa tacccttcac caatacaata aaaaaacaaa 240
acaacaaaaa accccaacca tctgagaaat aatcttctcc tttcccagct ttattcccag 300
gattctacat gaccaaatta ccagagtcac cactcatttt aatcacaaca tagtgtcaaa 360
taactagaaa acatgagaca acaatggaga gctgagtaac tattagtagt agtactttac 420
cagagaatgg cctctatagg ctcacatgta ggaatggttg gtccccaggt ggtaggtaga 480
gctgtttgag gattacgtgg ccttcttgga tggggggtgg gggtggggtg ggagggttgg 540
gtggtgggta cttaagaggt ttcaaaagtc aatattgttt gcatttagct cttccttgta 600
cttgtggatc aaacacaacc tgtcagctac tgcttcaaat gtcatgcctg ctgccatctt 660
ctcagcagga tggtcatggc ctcaccctct tcaactgtaa atctttcttt cttttcttct 720
ttttcttttg gtttcgagac agggtttctc tgtatagtcc tggctgtcct ggaactcact 780
ttgtagacca ggctggcctt gaactcagaa atccgcctgc ctctgcctcc ctagcactgg 840
gattaaaggc gtgcgccacc acgcccagct ttcaactgga aatcttaata aactttccta 900
gaagtggcct tggttatggg agcttatcac agcaatagaa cagcaattat gactggagta 960
tgatagttaa aaacaagcaa gcaagcaagc aaacacacac accaaaacaa caaaacccca 1020
agacagagtc acatgtagcc caggctagcc tccaaattca ctatataact gaagaagacc 1080
cctaattccc attcctctag aatctatacc tcaagtactg aatggcttgg ttcacaatac 1140
cccactaaat gattggtctt actaagtgca acaaggtaaa cctaaaactt cagccctcag 1200
acatcccttt tccagtatca atttataaaa ttagatccca aggataaaaa ttaattgtaa 1260
agtaaaatca gagttctagc atcaactaca ggctcaacca tggggaccac aaataaacta 1320
aaagggataa gactggcttc cccataatta ttacatttag ataattttcc tgactactca 1380
acaaagctaa aatatcacca ctggtttatt ttctccttct agggtttaag ctcactctga 1440
ggaggggcat gcggcacaca ctcatagcat ccaggaaata gaaatatggt gactatcatg 1500
ggttcagggc caacctaggc tttagagaaa aaccttgtcc cacaaaccaa aaatgtctct 1560
tttttattct atcaggggtg gatggatttg ttaaagaagt gcttttaaaa accttgagat 1620
ggttatttag aagtccccat gggataccaa aataacccac tatttatatg cccaagcatt 1680
tcacctccac aacagtgcta tgcacccttt aacatttttg agacagtagc ccagtctagt 1740
ctttaacttg cagtgatttt tcctgattca gcttctccca gtgctggaat tataggtatg 1800
caccaccatg tgtaactaca gatgctactt aaaaattttt taaaggaatc acaaaaataa 1860
ccccctatca aatgcctagt ccctctaacc atcaccaagt gaaggatcac gcaggaaaaa 1920
aaaaatcacc agcagcacct cagaaccagg atactcagtc catcagcatc cagggccata 1980
cccacactca cagcatctcc acagtttacc agatgattca tgcttatcac tgtattgggt 2040
catctaagag tgaccatcag ggcttctgat cacagaatct agtccacttt gcagaccagt 2100
tgaagtcatg cactatatga gatagaaata ccctcttgct cattttggtc agaaattcaa 2160
ggataaaaac ccatgttttg ttaatgcaca cctccatatg attgagatca atgtgtccta 2220
attaatgtag aaaccacaac tgtaaatttc actcttttga catgaatctt tttctagaca 2280
gggtcttgga tgcagccccg actacccaga attttggaat ccaggctagc ctcaaactca 2340
aggcaatctg cttgcttcag cttctcacag gctggatcac aaacatacac cttcagaccc 2400
attttttttt cctccctccg tttttggttt ctctgtgtag ccctgggtgt ccgtggactc 2460
gctgtgtaga tctatctacc agcctctgtc ttggagtact gggattaaag ttgtgggcta 2520
ccactgcctg gctgacccag ttttatttat tttaaatata acttgacaaa aataaatttg 2580
tctaacttac tagaaatccc aagaaaacta acactggatt tagcaacagt cagaaatcgc 2640
tgaaaagaaa cagaattgat ctaacagtct tagatcactc ctagacagtt tgtaattctt 2700
gctcatggca acgtgagctc tatctaactc actctctgtg cactaatgaa tgctcagtgt 2760
ctccagaaca gcacagcttc cagggtaatc atgccaaccc acaagacttt tatagagctg 2820
tccacgactc ttcccccatt cagctcatta acaatatgat ggagctcctg tgtggaaatc 2880
aaggcacact ctggtagaaa cttgtttttt ctttccactt ttccttgggc tctgaagatt 2940
gagctgtttt ataacccaca aacatgcatt ttttacctca aaagcatcca gcaaaaactg 3000
tacaacgctt tttcaaaaaa atgtattgtg atcctcctta agaaaagcct tacttagtgt 3060
taattccttt ttctttagaa tgctggtaaa tacaaggact taggtaggct ggcttctaac 3120
agcaattcac ccacttatga tgggattaaa ggaaggcaca accatgtcca ccacaggttc 3180
tagctccccc acccacacgc ccagagaggg tttttctgtg tagctctgac tattctggaa 3240
ttcacactgc agaccaggct ggtctcgaac tcagagatcc accaccacat ggtttcttaa 3300
ttgtaatttt aaagaaaaaa aaaaatcctt cagttaagat tcttatgttc taggttttca 3360
caaacttacc aatgtagttt tattggaggc cattttttaa atttaatcgg agacttgaag 3420
agctattgca agaaaaaaaa tgtaggacag ttaaaatttc atgacacaca aaaggcagct 3480
acaagttttg tgtggatttc aacatgtaaa tttcgggtaa aaatgcagga aaacagttga 3540
gttcccgtgt tattagtatg ttactaataa tttcagtatg ttagtgaaaa taatcttact 3600
aaaacactgg tacctcagac aactttacat ggtgaggatt gttactttcc caatccatat 3660
agaattttaa caattttagt gtttattttg gatgaaagga aatgactatc ttttgttagc 3720
aaattaccat aagatctttt tctttagatt tctgaatact ccaaggagct catataattc 3780
catccttatt ttttcagagg ccctccctgt tcaatcacgg tataaaaaaa ggaacacatt 3840
aagatgtccc agtcctattt tctggctttt tttttccggg ggtggtggtg cggtaatcac 3900
tctctatagt ccagtctggg cttcaacgcc tggcaatccc cagcctcaag ctcccaagta 3960
ctgtcctgat aaggatagaa ggagtcgacc tccttcacgc tcccctccga ggagggctcc 4020
ttcccagctc cattccccgg tcgggagccc gtcccccacc cgagagcgcg ggcctcgtgg 4080
tcagcgcctc cgcggggaga aacaaaggcg gcggcggggg ctcaagggca ctgcgccacg 4140
ggcccgcgcc tcccccatcc ggcggcggcc acgtagccgg gagcgcgccg cagcccggag 4200
cctcgggcct cgcagctgca gagcctgaac cgctctctcc ctgcgggcct gcgacgaggc 4260
tgggggaggg gaggcccgcg ctttgtctgg agtctcggta gctgtcatcc ggctcccacc 4320
ctcatgcaca attgtcccat ctcccccacg caccggcgcg gcgcccgcct cagcgaggcc 4380
ccagccggtt tcccgcagcc cgcggcccac ggggctcgca gcctccccgc aagctcggac 4440
gcacggagca tcctaaaccc caccacacgc aagatcgaaa aaaagcaaag gcacgaactt 4500
caccgctccg atgctcaggg ccgcggatcc tgcagagtct cccgcctgcg cgcttcggtt 4560
cagccacatc cgaggggagg gggcgcgggc agctccgccg ggggggaggg ggagcaccgc 4620
ccacgccctg gccgcgcggg gcccgccggg aacgcgtcct gcggggggcg gcgcgcgcaa 4680
tgctcaccgt ccgcggcgtg gcgcccaggg ggtctcctgg ctggggggag gggggggaag 4740
gcgggcagga aggaccgcgg aggcctctct gcgtctcgga gcgcgccaaa gcggggctcc 4800
acccacctcc ttgcccggat cttgaaggcc ggggagataa acagcggggt tctttaagca 4860
ccacctctca ctaggcgcgg gatcccaagg cttgtggcat ccggggtggt acttggacta 4920
aaagtccttc tgggagggac cgagtgagaa cccctttggg acgtgtagaa atatttgtgt 4980
ggttcgagaa tatttgtgcg gacgggcttg gcaaaggcgt agctgcagag agcacgcttg 5040
ggtggagagg gccgcacgcc ccagcgccgg cctaagcccc tcccgacggc gttatttcaa 5100
actgcgcgac cgtttctccg ctccctacgc ggaggtgggg gccggaccta gttccggacg 5160
tagtaacacg ccgagcgcga gccttccgca attcacggaa cacagttgcg caagtgatgt 5220
aaagcagtcc cgctgtacct aaagggggag tgtcacgtac ttggcgtaag gagagtgtag 5280
gcccttcccg ccattggcgg cggttagggc gtttacgtaa cggcgtgacg taagcggaga 5340
cgcgttagtg gggggaaggt tctagaaaag cggcggtctc ggctccagcg gcagtagcag 5400
cggcgccggt cccgtgtgca ggagctcctt tgcggcccag tttcttggcc atcgcctgct 5460
ctccccacag cgccaggacg agtcccgtgc gcgtccgtcc gcggaggtct ttctcatctc 5520
gctcggctgc gggaaatcgg gctgaagcga ctgagtccgc gatggaggta acgggtttga 5580
aatcaatgag ttattaaaaa tggcatggcg aggccgtagg caccgcaatg gaaaccggcc 5640
acccgcctcc gtggtccggc ggaggggatg cggccactcg agtggcggtt ggccttggcg 5700
agtttctgag gggtcgttgg aggaggcctc tgattgtccg accgccttcc ccgccctcag 5760
ccgcccggcg ccatttccct cagttggggt gggggatggg aagtgcccgc cgcgaccggg 5820
ctggaccgct aaagtagcgc gtgagcgggc catcgctggc ctttcgatgt gcgcgggcct 5880
aggggctcgg ttgtgttcgc ggcggaacgt ttctggggcc cccccggctt cccggagcga 5940
gtctgcgaag ctagcttccc ctcccccctc tcccgggaac cggatttggc ggccgccatt 6000
ttcccgtctc cttcctcgcc acgattttgc tttcaacgct ttaggtttac tagtttggtt 6060
ttcttttttc accactgcgt agacgtgttt agcgattttc ctttcttttg gaagtcttca 6120
taccgtttcg aggtggattt agcgttttga gcttgggtct tcagcgtcct gcgcacctcg 6180
ctaaaggctc tctgccttcc cctcgacgaa atggcgccat tgctttctga agccaccgag 6240
gcgcggggtg ggggcggggt ggcggcgctc cacgagcttt actggaacag gcagagagaa 6300
cgtagtacaa ccgaggcctg ggcgggtggc tgaaggcagc gtcgctgcaa agagaccgtt 6360
ttatttttca taatacgtaa gattacgggt gctgtagtaa agcacttgag cattagtata 6420
gtaggaggaa gtcaaagtgg aaaaaatggg agcgctcatc aggaagctag ggaggctatg 6480
ttgagtgcag ggttactttc cttttattgc agaactttta tctgcttaaa ggatcctcgg 6540
atcgaaataa ttcaaattat aagcattttt aagggaatct tcgaatttgt tggtaaagtc 6600
aacggatcct tagcacgtgg tgttcacttt aaggaagtga aatagctgac ttttcatagt 6660
tagccttcgc ttaaagcctg gttcagtgga cgaaaatcca cgtcctggct atataaaaac 6720
ttagtttggg gtcacagtgt ttgagcgtgg tcattcggtt tttttatttt ttatttgttt 6780
gaaattatga tgcatcatta cactgataag cattagcttt cgaattgaaa ggggtctcct 6840
tggttatttt ctttgactct aagcacactt ataaataaaa taaccttgtt tataatcgat 6900
agtggacgtc tggtaagttt ggaaaaaacc cgaggtaagt aaagagcttt tgctttcgtt 6960
agtgatatga aaaaacaagg tgtatttaat acttgcaact tagtttaagg aaagccaatt 7020
tactgacatt ttagtagagc taccagaaac actatttgga gtcctgatta aggcttttgt 7080
aactattttg actatttaaa acaattttgg tcgtttttat taaacatttc aaaacctaaa 7140
aattgtaaac attggctttt tgagcacatt ttggagaaac ttacaaattt aggctataca 7200
gtaaaataac ggatttgttt tataattttg ctttttcatt tcgttgtgca gtcataggtc 7260
ctggatagta tgacctaatt tatgaacatc ttgataagtt tttgtactta gctattggaa 7320
agccagtatt aagtgcctga caaaaccaga tttaaggtga tatctggagt ttcagcattc 7380
ttcatggagc ttgtttcaga gttgcaggat tttttttttt catcttgaga tacttacaat 7440
taacaccaga gggggcagct cagggaaaag caaatatgcc acttttcaga aactgaatct 7500
tggaagtggt gaatttggaa acaggttttt taaatttttt ttaaatctaa aaagtagtaa 7560
attttggact tgggttgtag aatttaatga attacaaaag aattctttaa taccctttaa 7620
atgacctaag agctgggtat ggtttttctg aatttttttg aagaaaatct aagaaagttt 7680
acgtgaatta gaagttagat cgaatattag tgactttgaa acttgtatag ctcaggcaat 7740
ttttggtgta acacaactaa tatgcagttt aacatatggt ttaaatttga tgtaagtttt 7800
ttttctcccc cccagaaaac tttagaaact gttcctttgg agaggaaaaa ggtactctac 7860
cagcaggtca cctcatattt aagaatttaa tttcctgcat acaaagaaag tgtaaataaa 7920
aattgaaatg gtatttccct ttgcagagag aaaaggaaca gttccgaaag ctctttattg 7980
gtggcttaag cttatcgata ccggtggcgc gccaattgtt aattaagatc tggcccaatg 8040
ggccgtacga attccttagg ctaccgggta ggggaggcgc ttttcccaag gcagtctgga 8100
gcatgcgctt tagcagcccc gctgggcact tggcgctaca caagtggcct ctggcctcgc 8160
acacattcca catccaccgg ccggtaggcg ccaaccggct ccgttctttg gtggcccctt 8220
cgcgccacct tctactcctc ccctagtcag gaagttcccc cccgccccgc agctcgcgtc 8280
gtgcaggacg tgacaaatgg aagtagcacg tctcactagt ctcgtgcaga tggacagcac 8340
cgctgagcaa tggaagcggg taggcctttg gggcagcggc caatagcagc tttgctcctt 8400
cgctttctgg gctcagaggc tgggaagggg tgggtccggg ggcgggctca ggggcgggct 8460
caggggcggg gcgggcgccc gaaggtcctc cggaggcccg gcattctgca cgcttcaaaa 8520
gcgcacgtct gccgcgctgt tctcctcttc ctcatctccg ggcctttcga ccagcttacc 8580
atgaccgagt acaagcccac ggtgcgcctc gccacccgcg acgacgtccc cagggccgta 8640
cgcaccctcg ccgccgcgtt cgccgactac cccgccacgc gccacaccgt cgatccggac 8700
cgccacatcg agcgggtcac cgagctgcaa gaactcttcc tcacgcgcgt cgggctcgac 8760
atcggcaagg tgtgggtcgc ggacgacggc gccgcggtgg cggtctggac cacgccggag 8820
agcgtcgaag cgggggcggt gttcgccgag atcggcccgc gcatggccga gttgagcggt 8880
tcccggctgg ccgcgcagaa cagatggaag gcctcctggc gccgcaccgg cccaaggagc 8940
ccgcgtggtt cctggccacc gtcgcgtctc gcccgaccac cagggcaagg gtctgggcag 9000
cgccgtcgtg ctccccggag tggaggcggc cgagcgcgcc ggggtgcccg ccttcctgga 9060
gacctccgcg ccccgcaacc tccccttcta cgagcggctc ggcttcaccg tcaccgccga 9120
cgtcgaggtg cccgaaggac cgcgcacctg gtgcatgacc cgcaagcccg gtgcctgacg 9180
cccgccccac gacccgcagc gcccgaccga aaggagcgca cgaccccatg catcgtagag 9240
ctcgctgatc agcctcgact gtgccttcta gttgccagcc atctgttgtt tgcccctccc 9300
ccgtgccttc cttgaccctg gaaggtgcca ctcccactgt cctttcctaa taaaatgagg 9360
aaattgcatc gcattgtctg agtaggtgtc attctattct ggggggtggg gtggggcagg 9420
acagcaaggg gggggattgg gragacaata gcaggcatgc tgggggggcg gtgggggcta 9480
tggcttctga ggcggaaaga accagctggg gctcgagggc cgccaccgcg gtggagctcc 9540
agcttttgtt ccctttagtg agggttaatt tcgagcttgg cgtaatcatg gtcatagctg 9600
tttcctgtgt gaaattgtta tccgctcaca attccacaca acatacgagc cggaagcata 9660
aagtgtaaag cctggggtgc ctaatgagtg agctaactca cattaattgc gttgcgctca 9720
ctgcccgctt tccagtcggg aaacctgtcg tgccagcatc gcgagcactt ttcggggaaa 9780
tgtgcgcgga acccctattt gtttattttt ctaaatacat tcaaatatgt atccgctcat 9840
gagacaataa ccctgataaa tgcttcaata atattgaaaa aggaagagta tgagtattca 9900
acatttccgt gtcgccctta ttcccttttt tgcggcattt tgccttcctg tttttgctca 9960
cccagaaacg ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac gagtgggtta 10020
catcgaactg gatctcaaca gcggtaagat ccttgagagt tttcgccccg aagaacgttt 10080
tccaatgatg agcactttta aagttctgct atgtggcgcg gtattatccc gtattgacgc 10140
cgggcaagag caactcggtc gccgcataca ctattctcag aatgacttgg ttgagtactc 10200
accagtcaca gaaaagcatc ttacggatgg catgacagta agagaattat gcagtgctgc 10260
cataaccatg agtgataaca ctgcggccaa cttacttctg acaacgatcg gaggaccgaa 10320
ggagctaacc gcttttttgc acaacatggg ggatcatgta actcgccttg atcgttggga 10380
accggagctg aatgaagcca taccaaacga cgagcgtgac accacgatgc ctgtagcaat 10440
ggcaacaacg ttgcgcaaac tattaactgg cgaactactt actctagctt cccggcaaca 10500
attaatagac tggatggagg cggataaagt tgcaggacca cttctgcgct cggcccttcc 10560
ggctggctgg tttattgctg ataaatctgg agccggtgag cgtgggtctc gcggtatcat 10620
tgcagcactg gggccagatg gtaagccctc ccgtatcgta gttatctaca cgacggggag 10680
tcaggcaact atggatgaac gaaatagaca gatcgctgag ataggtgcct cactgattaa 10740
gcattggtaa ctgtcagact cgcgacactg cattaatgaa tcggccaacg cgcggggaga 10800
ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc 10860
gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa 10920
tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 10980
aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 11040
aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 11100
ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 11160
tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc 11220
agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 11280
gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 11340
tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 11400
acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc 11460
tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 11520
caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 11580
aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 11640
aactca 11646
<210> 11
<211> 9027
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid
<400> 11
cgttgtaaaa cgacggccag tgaattgtaa tacgactcac tatagggcga attgggtacc 60
gggccccccc tcgaagttta aacatttaaa tctagaacta gtggatcccc cgggctgcag 120
gaattcgata tcaagctcat ggcacctgta ttgtactctt atcagtcatt atatggactt 180
taacttcccc agatattatt tgggctcctc cataagactg tgagcatctg accactggag 240
tgttgcttcc cattatatcc ctgttatcaa gcacaaggtc aggcacagag taagactcaa 300
aacatgtttt ggaatgtatg actggtatga actacaaacc agtaagctga tgttttcatt 360
ttgagtctat aaatctaatt ttgtggtggt tttgtgtatg gctcaaggct caaattgtaa 420
aatttaatat tatgtgacca aagaaagtta tacccagaac ctcaatttcc tcaccttcaa 480
aatggggcag tttctcactc attggtctgc tgtcacgatt ttaatgagct catgcacaaa 540
cagcccttta tataaggtaa gtgctggata aatgttggct actataataa aataagcctc 600
taagatactt ggtcagcaca agtactaccc aagagtatgc actgtaagta aactgacaaa 660
attgtgtatc taaaactggc cagatgaaag agaaactttt aaggggccct tctgcgtgcc 720
cgacactgtg ctaggcactc acactatccc gacccgagaa accgatctgc gacccagagg 780
aacttaccaa gcctccagca tcttgtgcag ccctactcat gggaccatct ggatacccac 840
ccttgtcttt acagggagca gaacacacct cttatgtgtc agaaaacaaa gtccaggaag 900
tatattttta cctgaggcaa tatctgaaaa ttgtatgcta cagcctccaa agtgagtctt 960
cctctcagta cctctcttct aggcacatgg agccctttct tccaagtatt atgtttaacc 1020
acttaatgaa tgaagtcctg aaactgctta cccatgctcc ctataatctc tgagtaatct 1080
tccttttcca caacctcagg cataatctca tcttctgttt ctattacaat ttcaaattct 1140
ggaaaaagga agttgtggtc tggaattata tggtccagat gatctgaaac aaaaaggaca 1200
gcactattag taatcattta gttttgaaga cagtctaata atttgctgtc tctaaagtac 1260
tatattccct atagttctgg cattttagat aaagggtcat aaattaaatg cctatatggt 1320
gacattattc agtgattcag acttcacagc cttttttttt tttttacaaa ggtgttccag 1380
gcatgaaaaa ttttaaagta ctataccttt cctaatttta cctttaaagt tgtcctggaa 1440
atatctgggt tgacaaaggc gatgaaactg aactgagact taaaaaaaag attacccacc 1500
tggttgtgca caagcctgct tatgtcccaa tctccagtct agggtctgat gctccttgct 1560
gcagtaatat gctttgtggc atctggagca cgttttgggg cctaaacagc cacaaaccct 1620
gcagagatga gcaccagact taagctggag acacactgat tctcctgttt ctgggggagg 1680
attctcagaa ggtggctcat atgagtaaaa atcgtttttc ctgggtagtt gattcctaaa 1740
aactaaaaaa gaatacagag aaaagtttta tcttcaaaca aaacagcaat tcacatattt 1800
tatcctctgc acgtaaaact gaaaataaca acaacaaaaa agaaatgaaa gtttttgctt 1860
tcaggaataa gcttttaaaa tccagaaact agatttcgtc cggtacacgc aactgagttg 1920
cctcctagag gtggtttgag ttaatcaaat taataagact gatcgttaag aacgactgcc 1980
aaaaatacga aaaagctact gggatccatc tttccaagac aatttctatt atctgaatta 2040
acaccatacc tggtacccac tgattaaaag ctgggggtta ccaatgcgcg tgggcacagt 2100
tagaagctta tgtagcaaaa atgagcacat cctggaaggg cccgggagaa ggtgctcctg 2160
gggcagcgcg gagagggagc tctgaggctg gggcggcagc ggtgcttgcc gccgtccccc 2220
tggtcgctcc cggaattaac gccgcgcacg cgtcggaggc atggccccgt cccgaccccg 2280
tttggcggct cacctcgcag gccggcacag cacggctgct cgcggcagca gaagaggaag 2340
atgcagcggt ggaaggcgtc cgggcggcca ggcagcggcg catacacctg cagcaggaag 2400
gagagcgggc ggccgcacag ctcgcaggcc agggcctggg gccccggcag cccggccgcg 2460
cccagccatg ccggccgccc gcccaccttg ctggggaact gctcgctgcg cagtcgccac 2520
gccggcgccg actcggcgaa gcccagctcc acaggcctgg ccccggcggc agccatgcgg 2580
ggcgcgggct ggcgtggggc gcagcccaca gctgggtcgg aaggcggaaa tcgggcgccg 2640
ggccggaagg caagaggcgg gcacctttcc ggaggacagg aggcggaaac gcgtctgacg 2700
ggagcggttg caggaccaat gcgagggaac ggggcagagg aaacctctcg gcatcagccc 2760
cgcccctggc gcctctgcct ccgagccgct ttcctggtgc ctccgggtgc tctgggatgg 2820
ttctggtctt tgggagagtg gcagctggtg acggcgctcc gctcacctct gcacatgtct 2880
tgctgtgggc ctgcgggtgg ccgccaggga ggcagagccc tcccgcaaac cttccctgct 2940
ggtgtccacc tcagggtgtg ggaaacctgt gcgctggccg agtgctaacc aagagtaggc 3000
agtgaaagac aaatgaaggt tgaacaggta aagtgaggac cctacagcgg aaaccaagaa 3060
tcctgtgtgc ctgagagtaa tgaagaagcc tctgcagaag agtcttttct gtcagtctta 3120
aggtctctgt tttaatgtta gtgctggctt gctgtacctg aattccaagg gaggagtgta 3180
taatgaggca tggccaaccc ccacttccca tcattgcctg aactagtttt tcaggttaac 3240
ttcagaatgc ccttggtacc gcgggccccc tctgtggtcc cacgccactg atcgctgcat 3300
gcccaccacc tgggtacaca cagtctgtga ttcccggagc agaacggacc ctgcccaccc 3360
ggtcttgtgt gctactcagt ggacagaccc aaggcaagaa agggtgacaa ggacagggtc 3420
ttcccaggct ggctttgagt tcctagcacc gccccgcccc caatcctctg tggcacatgg 3480
agtcttggtc cccagagtcc cccagcggcc tccagatggt ctgggagggc agttcagctg 3540
tggctgcgca tagcagacat acaacggacg gtgggcccag acccaggctg tgtagaccca 3600
gcccccccgc cccgcagtgc ctaggtcacc cactaacgcc ccaggcctgg tcttggctgg 3660
gcgtgactgt taccctcaaa agcaggcagc tccagggtaa aaggtgccct gccctgtaga 3720
gcccacttcc ttcccagggc tgcggctggg taggtttgta gccttcatca cgggccacct 3780
ccagccactg gaccgctggc ccctgccctg tcctggggag tgtggtcctg cgactctaat 3840
ggccgcaagc cacctgactc ccccaacacc acactctacc tctcaagccc aggtctctcc 3900
ctagtgaccc acccagcaca tttagctagc tgagccccac agccagaggt cctcaggccc 3960
tgctttcagg gcagttgctc tgaagtcggc aagggggagt gactgcctgg ccactccatg 4020
ccctccaaga gctccttctg caggagcgta cagaacccag ggccctggca cccgtgcaga 4080
ccctggccca ccccacctgg gcgctcagtg cccaagagat gtccacacct aggatgtccc 4140
gcggtgggtg gggggcccga gagacgggca ggccgggggc aggcctggcc atgcggggcc 4200
gaaccgggca ctgcccagcg tggggcgcgg gggccacggc gcgcgccccc agcccccggg 4260
cccagcaccc caaggcggcc aacgccaaaa ctctccctcc tcctcttcct caatctcgct 4320
ctcgctcttt ttttttttcg caaaaggagg ggagaggggg taaaaaaatg ctgcactgtg 4380
cggcgaagcc ggtgagtgag cggcgcgggg ccaatcagcg tgcgccgttc cgaaagttgc 4440
cttttatggc tcgagcggcc gcggcggcgc cctataaaac ccagcggcgc gacgcgccac 4500
caccgccgag accgcgtccg cccgcgagca cagagcctcg cctttgccga tccgccgccc 4560
gtccacaccc gccgccaggt aagcccggcc agccgaccgg ggcatgcggc cgcggccctt 4620
cgcccgtgca gagccgccgt ctgggccgca gcggggggcg catggggcgg aaccggaccg 4680
ccgtgggggg cgcgggagaa gcccctgggc ctccggagat gggggacacc ccacgccagt 4740
tcgcaggcgc gaggccgcgc tcgggcgggc gcgctccggg ggtgccgctc tcggggcggg 4800
ggcaaccggc ggggtctttg tctgagccgg gctcttgcca atggggatcg cacggtgggc 4860
gcggcgtagc ccccgtcagg cccggtgggg gctggggcgc catgcgcgtg cgcgctggtc 4920
ctttgggcgc taactgcgtg cgcgctggga attggcgcta attgcgcgtg cgcgctggga 4980
ctcaatggcg ctaatcgcgc gtgcgttctg gggcccgggc gcttgcgcca cttcctgccc 5040
gagccgctgg cgcccgaggg tgtggccgct gcgtgcgcgc gcgcgacccg gtcgctgttt 5100
gaaccgggcg gaggcggggc tggcgcccgg ttgggagggg gttggggcct ggcttcctgc 5160
cgcgcgccgc ggggacgcct ccgaccagtg tttgcctttt atggtaataa cgcggccggc 5220
ccggcttcct ttgtccccaa tctgggcgcg cgccggcgcc ccctggcggc ctaaggactc 5280
ggcgcgccgg aagtggccag ggcgggggcg acttcggctc acagcgcgcc cggctattct 5340
cgcagctcac catgccggtc gccaccatga gcttatcgat accggtggcg cgccaattgt 5400
taattaagat ctggcccaat gggccgtacg aattccttag gctaccgggt aggggaggcg 5460
cttttcccaa ggcagtctgg agcatgcgct ttagcagccc cgctgggcac ttggcgctac 5520
acaagtggcc tctggcctcg cacacattcc acatccaccg gccggtaggc gccaaccggc 5580
tccgttcttt ggtggcccct tcgcgccacc ttctactcct cccctagtca ggaagttccc 5640
ccccgccccg cagctcgcgt cgtgcaggac gtgacaaatg gaagtagcac gtctcactag 5700
tctcgtgcag atggacagca ccgctgagca atggaagcgg gtaggccttt ggggcagcgg 5760
ccaatagcag ctttgctcct tcgctttctg ggctcagagg ctgggaaggg gtgggtccgg 5820
gggcgggctc aggggcgggc tcaggggcgg ggcgggcgcc cgaaggtcct ccggaggccc 5880
ggcattctgc acgcttcaaa agcgcacgtc tgccgcgctg ttctcctctt cctcatctcc 5940
gggcctttcg accagcttac catgaccgag tacaagccca cggtgcgcct cgccacccgc 6000
gacgacgtcc ccagggccgt acgcaccctc gccgccgcgt tcgccgacta ccccgccacg 6060
cgccacaccg tcgatccgga ccgccacatc gagcgggtca ccgagctgca agaactcttc 6120
ctcacgcgcg tcgggctcga catcggcaag gtgtgggtcg cggacgacgg cgccgcggtg 6180
gcggtctgga ccacgccgga gagcgtcgaa gcgggggcgg tgttcgccga gatcggcccg 6240
cgcatggccg agttgagcgg ttcccggctg gccgcgcaga acagatggaa ggcctcctgg 6300
cgccgcaccg gcccaaggag cccgcgtggt tcctggccac cgtcgcgtct cgcccgacca 6360
ccagggcaag ggtctgggca gcgccgtcgt gctccccgga gtggaggcgg ccgagcgcgc 6420
cggggtgccc gccttcctgg agacctccgc gccccgcaac ctccccttct acgagcggct 6480
cggcttcacc gtcaccgccg acgtcgaggt gcccgaagga ccgcgcacct ggtgcatgac 6540
ccgcaagccc ggtgcctgac gcccgcccca cgacccgcag cgcccgaccg aaaggagcgc 6600
acgaccccat gcatcgtaga gctcgctgat cagcctcgac tgtgccttct agttgccagc 6660
catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc actcccactg 6720
tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt cattctattc 6780
tggggggtgg ggtggggcag gacagcaagg ggggggattg ggragacaat agcaggcatg 6840
ctgggggggc ggtgggggct atggcttctg aggcggaaag aaccagctgg ggctcgaggg 6900
ccgccaccgc ggtggagctc cagcttttgt tccctttagt gagggttaat ttcgagcttg 6960
gcgtaatcat ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac 7020
aacatacgag ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc 7080
acattaattg cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagcat 7140
cgcgagcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca 7200
ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 7260
aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt 7320
ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca 7380
gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag 7440
ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc 7500
ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac actattctca 7560
gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt 7620
aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct 7680
gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg gggatcatgt 7740
aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga 7800
caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact 7860
tactctagct tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc 7920
acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg gagccggtga 7980
gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt 8040
agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac agatcgctga 8100
gataggtgcc tcactgatta agcattggta actgtcagac tcgcgacact gcattaatga 8160
atcggccaac gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc 8220
actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg 8280
gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc 8340
cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc 8400
ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga 8460
ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc 8520
ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat 8580
agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 8640
cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 8700
aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 8760
gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 8820
agaaggacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 8880
ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 8940
cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 9000
tctgacgctc agtggaacga aaactca 9027
<210> 12
<211> 12221
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid
<400> 12
cgttgtaaaa cgacggccag tgaattgtaa tacgactcac tatagggcga attgggtacc 60
gggccccccc tcgaagttta aacatttaaa tctagaagct tcaatgtttt tagcaccctc 120
tgtgtggagg aaaataatgc agattattct aattagtgta atatctaacc acattaaaat 180
atattacata gtaaactaca ctccataatt ttataaattt gactccccag ggtaataaac 240
tagtctctag tctgctcacc ttcaactgta caataaagtc ttggttcttt tgaaatagac 300
ctcaaatgag acacctaaaa ttcaaagtgt ctttacattt aaagacacct acaggaaagc 360
aggtaaaaga gccaggttaa aaacaaattc taaaaccact tagctgcagt taaacatata 420
gtaaagatgc actaaagttt cttactctgt aaatcccttc cacttcagga aatattccac 480
tttcccattc actacacgtc gatctagtac tttttccacg acaaattctt caggctctgc 540
ctcttcaact tttttactct ttccattctg tttttttccc attttttgct aaaataaaac 600
aaaagagaaa ttaagaaata ttcctcttga attttgagca cattttcaag gctcaattgc 660
ttatattatt atcacattcg acataaattt ttacttctat atcccagggc agacaccttc 720
tggaaagatt aaaagtcaac agacaataaa ataaaagaat gctttatctt gttcatttag 780
ttcaaactta caacccacca ccaaaataat acaataaaaa aacactatct ggaaacagtt 840
atttttttcc agtctttttt tttgagacag ggtctcacac tcttgtcgcc caggctggag 900
tgcagtggcg tgatctcagc tcactgcaac ctccgcctcc ccaggttcaa gcagttctca 960
tgcctcagcc tccagagtag ctgggattat aggcggatgc caccatgccg ggctaatttt 1020
ttttgtgttt ttattagaaa cagggtttca ccatgttgac caggctggtc tcaaactcct 1080
gacctgaagt gattcaccag cctgggcctc ccaaagtgct ggcattacag gcgtgagcca 1140
ctgcgcccgg ccctgtagtc ttaaaagacc aagtttacta attttcactc attttaacaa 1200
cactgcaaca aacaactatg caggaagtac ctaaagggtg atccagagaa gcaagtagta 1260
gtgacaggtc ttaggtgaac ctatgacaga ccttgtatcc acccccagat ggtaaaagcc 1320
ccagccccct tctcaattca aatattaatg tcaaaagcat caatgataca gagaaaagat 1380
aaatgcagaa tgaaaacatg gttcaaaatc ctgataccaa ctgcagggtc aactatagag 1440
accactagga ggttcaatta aaggacaaga ttatttttcc ataatctctg tagataatat 1500
ttcctaccac ttagaacaaa actataaagc tatcacttca agagaccaac attacaaatt 1560
tattttaatt ccctaaggtg aaaaaaatcc ttccttcctg gtttctcaag agaaagtcta 1620
tactggtaac caaattcact ttaaacaggc attttctttg gtatgacact atttaagaga 1680
agcaggaaac caacgtgaac cagctctttc caatggctca agatttccta tgagaggact 1740
aaaaatgggg aaaattttta tgagaggatt aaaaatgggg gaaaaaaaac cctgaaatgg 1800
ttaatcagaa gatcctatgg gctgagaagg aatccatctt aacatttcat cttaaagcaa 1860
atgctattgc cgggggcagt ggctcatgcc tgtaatccca gcactttggg aggccgaggt 1920
gggcagatca tctgaggtca ggagtttgag accagcctga ccaacatgga gaaaccccgt 1980
ttctactaaa aatacaaaat tagccaggca tagtggtgca tgcctgtaat cccagctact 2040
tgggaggctg aggcaggaga actgcttgaa cccaggaggc ttaagttgcg gtgagccaag 2100
atcacgccat tgcactctag cctggacaac aagagaaaaa ctctgtctca aaaaaacaca 2160
aaaacaaaaa acccaaatac tatttaaaaa agataaacct taattgctca atcattaaag 2220
ccatcccaca agtaaagcag caagcagaaa aaagttaaga acacctcaag gctacagaag 2280
gacatttcaa gctatgcagg catatgaagt gtgcagacag atatgtaaga aaggcctcaa 2340
gactgcaaaa gggcatttca agctatgcaa gcatataggt aacacataca cacacacaaa 2400
ataaaatccc ctgaaataca aaaacatgca gcaaacacct gacgtttttg gataccattt 2460
ctaagtcagg tgttatgatt ctcattagtc aagatacttg agtactgggc ccaaacagct 2520
ttctgccact gtacagtaca agaaggtagg aataatggtg ggaggagcaa agacaaactg 2580
taatagacag aagtgtatca gatacctata ctacatgaaa aacaaaacag ctactgccac 2640
aaagggagaa ggctaacaaa ataaagtcaa caataaatac agaaaatgaa aaggatacac 2700
actaaggttt acaaaaaaaa aaaggcagac aaaatgccat acagtattca ttcactacta 2760
tggcattcat aagctagttt caaatgctca ctattttctt ttatagtata tatttgcctt 2820
aacccagcac ttttttccaa aagtggatga gtcaaaataa atttcccatt atttaagtga 2880
aattaacagc acacatatct cacaacacta atgaattttt aaaatggaaa gttaagaact 2940
tttaaagtgg ccaacctgtg atccttcaca aaataaacta aatacaataa cagaccccaa 3000
aggctatcaa ttgcgtgcaa aaacaacttc tgttttccag ggtaaacaga atctaatgca 3060
gaatctaatg cagggtaaac agacttaatg cagaatctaa tgatggcaca aattaaaaat 3120
cactaacgtg ccctttttag tgtgaaaccc agagagagca catacaagcc aaaaacaaat 3180
gctttatttt acctaggaga cattaacatt cacctttacg tgtttaagat taatgcaatg 3240
ttaaatattg tgaaaactgt aactttgaat ttcatgattt ttatgtgaat attccagggt 3300
ttaaaaaaac ttgtaacatg acatggctga ataagataaa aaaaaaatct agccttttct 3360
cccttctggc tcatatttgc gatttcgatc attttgttta aaaaacaaaa cactgcaatg 3420
aattaaactt aatattcttc tatgttttag agtaagttaa aacaagataa agtgaccaaa 3480
gtaatttgaa agattcaatg acttttgctc caacctaggt gcacaaggta ccttgttctt 3540
taaattgggc tttaatgaaa atacttctcc agaattctgg ggatttaaga aaaattatgc 3600
caaccaacaa gggctttacc attttatgta acatttttca acgctgcaaa aatgtgtgta 3660
tttctatttg aagataaaaa tcctcagcaa aatccacatt gcactgtcct tcaaagatta 3720
gccttctttg aactagttaa gacactatta agccaagcca gtatctccct gtaatgaatt 3780
cgtttttctc ttaattttcc cctgtaattt acactgggag agctgggaaa tatgtggatg 3840
taaatttctc agccacagag atgcaaagtt atactgtggg gaaaaaaaac ttgagttaaa 3900
tccttacata ttttaggttt tcattaactt accaatgtag ttttgttgga ggccattttt 3960
tttattgcag acttgaagag ctattactag aaaaatgcat gacagttaag gtaagtttgc 4020
atgacacaaa aaaggtaact aaatacaaat tctgtttgga ttccaacccc caagtagaga 4080
gcgcacactt tcaaacgtga atacaaatcc agagtagatc tgcgctccta cctacattgc 4140
ttatgatgta cttaagtacg tgtcctaacc atgtgagtct agaaagactt tactggggat 4200
cctggtacct aaaacagctt cacatggctt aaaatagggg accaatgtct tttccaatct 4260
aagtcccatt tataataaag tccatgttcc atttttaaag gacaatcctt tcggtttaaa 4320
accaggcacg attacccaaa caactcacaa cggtaaagca ctgtgaatct tctctgttct 4380
gcaatcccaa cttggtttct gctcagaaac cctccctctt tccaatcggt aattaaataa 4440
caaaaggaaa aaacttaaga tgcttcaacc ccgtttcgtg acactttgaa aaaagaatca 4500
cctcttgcaa acacccgctc ccgacccccg ccgctgaagc ccggcgtcca gaggcctaag 4560
cgcgggtgcc cgcccccacc cgggagcgcg ggcctcgtgg tcagcgcatc cgcggggaga 4620
aacaaaggcc gcggcacggg ggctcaaggg cactgcgcca caccgcacgc gcctaccccc 4680
gcgcggccac gttaactggc ggtcgccgca gcctcgggac agccggccgc gcgccgccag 4740
gctcgcggac gcgggaccac gcgccgccct ccgggaggcc caagtctcga cccagccccg 4800
cgtggcgctg ggggaggggg cgcctccgcc ggaacgcggg tgggggaggg gagggggaaa 4860
tgcgctttgt ctcgaaatgg ggcaaccgtc gccacagctc cctaccccct cgagggcaga 4920
gcagtccccc cactaactac cgggctggcc gcgcgccagg ccagccgcga ggccaccgcc 4980
cgaccctcca ctccttcccg cagctcccgg cgcggggtcc ggcgagaagg ggaggggagg 5040
ggagcggaga accgggcccc cgggacgcgt gtggcatctg aagcaccacc agcgagcgag 5100
agctagagag aaggaaagcc accgacttca ccgcctccga gctgctccgg gtcgcgggtc 5160
tgcagcgtct ccggccctcc gcgcctacag ctcaagccac atccgaaggg ggagggagcc 5220
gggagctgcg cgcggggccg ccggggggag gggtggcacc gcccacgccg ggcggccacg 5280
aagggcgggg cagcgggcgc gcgcgcggcg gggggagggg ccggcgccgc gcccgctggg 5340
aattggggcc ctagggggag ggcggaggcg ccgacgaccg cggcacttac cgttcgcggc 5400
gtggcgcccg gtggtcccca aggggaggga agggggaggc ggggcgagga cagtgaccgg 5460
agtctcctca gcggtggctt ttctgcttgg cagcctcagc ggctggcgcc aaaaccggac 5520
tccgcccact tcctcgcccg ccggtgcgag ggtgtggaat cctccagacg ctgggggagg 5580
gggagttggg agcttaaaaa ctagtacccc tttgggacca ctttcagcag cgaactctcc 5640
tgtacaccag gggtcagttc cacagacgcg ggccaggggt gggtcattgc ggcgtgaaca 5700
ataatttgac tagaagttga ttcgggtgtt tccggaaggg gccgagtcaa tccgccgagt 5760
tggggcacgg aaaacaaaaa gggaaggcta ctaagatttt tctggcgggg gttatcattg 5820
gcgtaactgc agggaccacc tcccgggttg agggggctgg atctccaggc tgcggattaa 5880
gcccctcccg tcggcgttaa tttcaaactg cgcgacgttt ctcacctgcc ttcgccaagg 5940
caggggccgg gaccctattc caagaggtag taactagcag gactctagcc ttccgcaatt 6000
cattgagcgc atttacggaa gtaacgtcgg gtactgtctc tggccgcaag ggtgggagga 6060
gtacgcattt ggcgtaaggt ggggcgtaga gccttcccgc cattggcggc ggatagggcg 6120
tttacgcgac ggcctgacgt agcggaagac gcgttagtgg gggggaaggt tctagaaaag 6180
cggcggcagc ggctctagcg gcagtagcag cagcgccggg tcccgtgcgg aggtgctcct 6240
cgcagagttg tttctcgagc agcggcagtt ctcactacag cgccaggacg agtccggttc 6300
gtgttcgtcc gcggagatct ctctcatctc gctcggctgc gggaaatcgg gctgaagcga 6360
ctgagtccgc gatggaggta acgggtttga aatcaatgag ttattgaaaa gggcatggcg 6420
aggccgttgg cgcctcagtg gaagtcggcc agccgcctcc gtgggagaga ggcaggaaat 6480
cggaccaatt cagtagcagt ggggcttaag gtttatgaac ggggtcttga gcggaggcct 6540
gagcgtacaa acagcttccc caccctcagc ctcccggcgc catttccctt cactgggggt 6600
gggggatggg gagctttcac atggcggacg ctgccccgct ggggtgaaag tggggcgcgg 6660
aggcgggaat tcttattccc tttctaaagc acgctgcttc gggggccacg gcgtctcctc 6720
ggcgagcgtt tcggcgggca gcaggtcctc gtgagcgagg ctgcggagct tcccctcccc 6780
ctctctcccg ggaaccgatt tggcggccgc cattttcatg gctcgccttc ctctcagcgt 6840
tttccttata actcttttat tttcttagtg tgctttctct atcaagaagt agaagtggtt 6900
aactattttt tttttcttct cgggctgttt tcatatcgtt tcgaggtgga tttggagtgt 6960
tttgtgagct tggatcttta gagtcctgcg cacctcatta aaggcgctca gccttcccct 7020
cgatgaaatg gcgccattgc gttcggaagc cacaccgaag agcggggagg gggggtgctc 7080
cgggtttgcg ggcccggttt cagagaagat atcaccaccc agggcgtcgg gccgggttca 7140
atgcgagccg taggacaaag aaaccatttt atgtttttcc tgtctttttt ttcctttgag 7200
taacggtttt atctgggtct gcagtcagta aaacgacaga tgaaccgcgg caaaataaac 7260
ataaattgga agccatcggc cacgaggggc agggacgaag gtggttttct gggcggggga 7320
gggatattcg cgtcagaatc ctttactgtt cttaaggatt ccgtttaagt tgtagagctg 7380
actcatttta agtaatgttg ttactgagaa gtttaaccct tacgggacag atccatggac 7440
ctttatagat gattacgagg aaagtgaaat aacgattttg tccttagtta tacttcgatt 7500
aaaacatggc ttcagaggct ccttcctgta atgcgtatgg attgatgtgc aaaactgttt 7560
tgggcctggg ccgctctgta tttgaacttt gttacttttc tcattttgtt tgcaatcttg 7620
gttgaacatt acattgataa gcataaggtc tcaagcgaag ggggtctacc tggttatttt 7680
tctttgaccc taagcacgtt tataaaataa cattgtttaa aatcgatagt ggacatcggg 7740
taagtttgga taaattgtga ggtaagtaat gagtttttgc tttttgttag tgatttgtaa 7800
aacttgttat aaatgtacat tatccgtaat ttcagtttag agataaccta tgtgctgacg 7860
acaattaaga ataaaaacta gctgaaaaaa tgaaaataac tatcgtgaca agtaaccatt 7920
tcaaaagact gctttgtgtc tcataggagc tagtttgatc atttcagtta attttttctt 7980
taatttttac gagtcatgaa aactacagga aaaaaaatct gaactgggtt ttaccactac 8040
tttttaggag ttgggagcat gcgaatggag ggagagctcc gtagaactgg gatgagagca 8100
gcaattaatg ctgcttgcta ggaacaaaaa ataattgatt gaaaattacg tgtgactttt 8160
tagtttgcat tatgcgtttg tagcagttgg tcctggatat cactttctct cgtttgaggt 8220
tttttaacct agttaacttt taagacaggt ttccttaaca ttcataagtg cccagaatac 8280
agctgtgtag tacagcatat aaagatttca gctctgaggt ttttcctatt gacttggaaa 8340
attgttttgt gcctgtcgct tgccacatgg ccaatcaagt aagcttatcg ataccggtgg 8400
cgcgccaatt gttaattaag atctggccca atgggccgta cgaatttgag gcggaaagaa 8460
ccagctgtgg aatgtgtgtc agttagggtg tggaaagtcc ccaggctccc cagcaggcag 8520
aagtatgcaa agcatgcatc tcaattagtc agcaaccagg tgtggaaagt ccccaggctc 8580
cccagcaggc agaagtatgc aaagcatgca tctcaattag tcagcaacca tagtcccgcc 8640
cctaactccg cccatcccgc ccctaactcc gcccagttcc gcccattctc cgccccatgg 8700
ctgactaatt ttttttattt atgcagaggc cgaggccgcc tcggcctctg agctattcca 8760
gaagtagtga ggaggctttt ttggaggcct aggcttttgc aaagatcgat caagagacag 8820
gatgaggatc gtttcgcatg attgaacaag atggattgca cgcaggttct ccggccgctt 8880
gggtggagag gctattcggc tatgactggg cacaacagac aatcggctgc tctgatgccg 8940
ccgtgttccg gctgtcagcg caggggcgcc cggttctttt tgtcaagacc gacctgtccg 9000
gtgccctgaa tgaactgcaa gacgaggcag cgcggctatc gtggctggcc acgacgggcg 9060
ttccttgcgc agctgtgctc gacgttgtca ctgaagcggg aagggactgg ctgctattgg 9120
gcgaagtgcc ggggcaggat ctcctgtcat ctcaccttgc tcctgccgag aaagtatcca 9180
tcatggctga tgcaatgcgg cggctgcata cgcttgatcc ggctacctgc ccattcgacc 9240
accaagcgaa acatcgcatc gagcgagcac gtactcggat ggaagccggt cttgtcgatc 9300
aggatgatca agagcatcag gggctcgcgc cagccgaact gttcgccagg ctcaaggcga 9360
gcatgcccga cggcgaggat ctcgtcgtga cccatggcga tgcctgcttg ccgaatatca 9420
tggtggaaaa tggccgcttt tctggattca tcgactgtgg ccggctgggt gtggcggacc 9480
gctatcagga catagcgttg gctacccgtg atattgctga agagcttggc ggcgaatggg 9540
ctgaccgctt cctcgtgctt tacggtatcg ccgctcccga ttcgcagcgc atcgccttct 9600
atcgccttct tgacgagttc ttctgagcgg gactctgggg ttcgaaatga ccgaccaagc 9660
gacgcccaac ctgccatcac gagatttcga ttccaccgcc gccttctatg aaaggttggg 9720
cttcggaatc gttttccggg acgccggctg gatgatcctc cagcgcgggg atctcatgct 9780
ggagttcttc gcccacccta gggggaggct aactgaaaca cggaaggaga caataccgga 9840
aggaacccgc gctatgacgg caataaaaag acagaataaa acgcacggtg ttgggtcgtt 9900
tgttcataaa cgcggggttc ggtcccaggg ctggcactct gtcgataccc caccgagacc 9960
ccattggggc caatacgccc gcgtttcttc cttttcccca ccccaccccc caagttcggg 10020
tgaaggccca gggctcgcag ccaacgtcgg ggcggcaggc cctgccatag cctcaaattc 10080
cttaggctcg agggccgcca ccgcggtgga gctccagctt ttgttccctt tagtgagggt 10140
taatttcgag cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc 10200
tcacaattcc acacaacata cgagccggaa gcataaagtg taaagcctgg ggtgcctaat 10260
gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc 10320
tgtcgtgcca gcatcgcgag cacttttcgg ggaaatgtgc gcggaacccc tatttgttta 10380
tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 10440
caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 10500
ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 10560
gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 10620
aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 10680
ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 10740
atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 10800
gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 10860
gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 10920
atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 10980
aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 11040
actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 11100
aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa 11160
tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 11220
ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 11280
agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agactcgcga 11340
cactgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt 11400
ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 11460
ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 11520
tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 11580
tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 11640
gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 11700
ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 11760
tggcgctttc tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 11820
agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 11880
atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 11940
acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 12000
actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 12060
tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 12120
tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 12180
tcttttctac ggggtctgac gctcagtgga acgaaaactc a 12221
<210> 13
<211> 11828
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid
<400> 13
cgttgtaaaa cgacggccag tgaattgtaa tacgactcac tatagggcga attgggtacc 60
gggccccccc tcgaagttta aacatttaaa tctagaagct tttaaccctc tatcccttta 120
aacttccttg atccagtgta agcacctcct agaaagtcag tagacaataa aacaaaagtt 180
ctgcttcacc gatttacatt tataaccaaa tacccttcac caatacaata aaaaaacaaa 240
acaacaaaaa accccaacca tctgagaaat aatcttctcc tttcccagct ttattcccag 300
gattctacat gaccaaatta ccagagtcac cactcatttt aatcacaaca tagtgtcaaa 360
taactagaaa acatgagaca acaatggaga gctgagtaac tattagtagt agtactttac 420
cagagaatgg cctctatagg ctcacatgta ggaatggttg gtccccaggt ggtaggtaga 480
gctgtttgag gattacgtgg ccttcttgga tggggggtgg gggtggggtg ggagggttgg 540
gtggtgggta cttaagaggt ttcaaaagtc aatattgttt gcatttagct cttccttgta 600
cttgtggatc aaacacaacc tgtcagctac tgcttcaaat gtcatgcctg ctgccatctt 660
ctcagcagga tggtcatggc ctcaccctct tcaactgtaa atctttcttt cttttcttct 720
ttttcttttg gtttcgagac agggtttctc tgtatagtcc tggctgtcct ggaactcact 780
ttgtagacca ggctggcctt gaactcagaa atccgcctgc ctctgcctcc ctagcactgg 840
gattaaaggc gtgcgccacc acgcccagct ttcaactgga aatcttaata aactttccta 900
gaagtggcct tggttatggg agcttatcac agcaatagaa cagcaattat gactggagta 960
tgatagttaa aaacaagcaa gcaagcaagc aaacacacac accaaaacaa caaaacccca 1020
agacagagtc acatgtagcc caggctagcc tccaaattca ctatataact gaagaagacc 1080
cctaattccc attcctctag aatctatacc tcaagtactg aatggcttgg ttcacaatac 1140
cccactaaat gattggtctt actaagtgca acaaggtaaa cctaaaactt cagccctcag 1200
acatcccttt tccagtatca atttataaaa ttagatccca aggataaaaa ttaattgtaa 1260
agtaaaatca gagttctagc atcaactaca ggctcaacca tggggaccac aaataaacta 1320
aaagggataa gactggcttc cccataatta ttacatttag ataattttcc tgactactca 1380
acaaagctaa aatatcacca ctggtttatt ttctccttct agggtttaag ctcactctga 1440
ggaggggcat gcggcacaca ctcatagcat ccaggaaata gaaatatggt gactatcatg 1500
ggttcagggc caacctaggc tttagagaaa aaccttgtcc cacaaaccaa aaatgtctct 1560
tttttattct atcaggggtg gatggatttg ttaaagaagt gcttttaaaa accttgagat 1620
ggttatttag aagtccccat gggataccaa aataacccac tatttatatg cccaagcatt 1680
tcacctccac aacagtgcta tgcacccttt aacatttttg agacagtagc ccagtctagt 1740
ctttaacttg cagtgatttt tcctgattca gcttctccca gtgctggaat tataggtatg 1800
caccaccatg tgtaactaca gatgctactt aaaaattttt taaaggaatc acaaaaataa 1860
ccccctatca aatgcctagt ccctctaacc atcaccaagt gaaggatcac gcaggaaaaa 1920
aaaaatcacc agcagcacct cagaaccagg atactcagtc catcagcatc cagggccata 1980
cccacactca cagcatctcc acagtttacc agatgattca tgcttatcac tgtattgggt 2040
catctaagag tgaccatcag ggcttctgat cacagaatct agtccacttt gcagaccagt 2100
tgaagtcatg cactatatga gatagaaata ccctcttgct cattttggtc agaaattcaa 2160
ggataaaaac ccatgttttg ttaatgcaca cctccatatg attgagatca atgtgtccta 2220
attaatgtag aaaccacaac tgtaaatttc actcttttga catgaatctt tttctagaca 2280
gggtcttgga tgcagccccg actacccaga attttggaat ccaggctagc ctcaaactca 2340
aggcaatctg cttgcttcag cttctcacag gctggatcac aaacatacac cttcagaccc 2400
attttttttt cctccctccg tttttggttt ctctgtgtag ccctgggtgt ccgtggactc 2460
gctgtgtaga tctatctacc agcctctgtc ttggagtact gggattaaag ttgtgggcta 2520
ccactgcctg gctgacccag ttttatttat tttaaatata acttgacaaa aataaatttg 2580
tctaacttac tagaaatccc aagaaaacta acactggatt tagcaacagt cagaaatcgc 2640
tgaaaagaaa cagaattgat ctaacagtct tagatcactc ctagacagtt tgtaattctt 2700
gctcatggca acgtgagctc tatctaactc actctctgtg cactaatgaa tgctcagtgt 2760
ctccagaaca gcacagcttc cagggtaatc atgccaaccc acaagacttt tatagagctg 2820
tccacgactc ttcccccatt cagctcatta acaatatgat ggagctcctg tgtggaaatc 2880
aaggcacact ctggtagaaa cttgtttttt ctttccactt ttccttgggc tctgaagatt 2940
gagctgtttt ataacccaca aacatgcatt ttttacctca aaagcatcca gcaaaaactg 3000
tacaacgctt tttcaaaaaa atgtattgtg atcctcctta agaaaagcct tacttagtgt 3060
taattccttt ttctttagaa tgctggtaaa tacaaggact taggtaggct ggcttctaac 3120
agcaattcac ccacttatga tgggattaaa ggaaggcaca accatgtcca ccacaggttc 3180
tagctccccc acccacacgc ccagagaggg tttttctgtg tagctctgac tattctggaa 3240
ttcacactgc agaccaggct ggtctcgaac tcagagatcc accaccacat ggtttcttaa 3300
ttgtaatttt aaagaaaaaa aaaaatcctt cagttaagat tcttatgttc taggttttca 3360
caaacttacc aatgtagttt tattggaggc cattttttaa atttaatcgg agacttgaag 3420
agctattgca agaaaaaaaa tgtaggacag ttaaaatttc atgacacaca aaaggcagct 3480
acaagttttg tgtggatttc aacatgtaaa tttcgggtaa aaatgcagga aaacagttga 3540
gttcccgtgt tattagtatg ttactaataa tttcagtatg ttagtgaaaa taatcttact 3600
aaaacactgg tacctcagac aactttacat ggtgaggatt gttactttcc caatccatat 3660
agaattttaa caattttagt gtttattttg gatgaaagga aatgactatc ttttgttagc 3720
aaattaccat aagatctttt tctttagatt tctgaatact ccaaggagct catataattc 3780
catccttatt ttttcagagg ccctccctgt tcaatcacgg tataaaaaaa ggaacacatt 3840
aagatgtccc agtcctattt tctggctttt tttttccggg ggtggtggtg cggtaatcac 3900
tctctatagt ccagtctggg cttcaacgcc tggcaatccc cagcctcaag ctcccaagta 3960
ctgtcctgat aaggatagaa ggagtcgacc tccttcacgc tcccctccga ggagggctcc 4020
ttcccagctc cattccccgg tcgggagccc gtcccccacc cgagagcgcg ggcctcgtgg 4080
tcagcgcctc cgcggggaga aacaaaggcg gcggcggggg ctcaagggca ctgcgccacg 4140
ggcccgcgcc tcccccatcc ggcggcggcc acgtagccgg gagcgcgccg cagcccggag 4200
cctcgggcct cgcagctgca gagcctgaac cgctctctcc ctgcgggcct gcgacgaggc 4260
tgggggaggg gaggcccgcg ctttgtctgg agtctcggta gctgtcatcc ggctcccacc 4320
ctcatgcaca attgtcccat ctcccccacg caccggcgcg gcgcccgcct cagcgaggcc 4380
ccagccggtt tcccgcagcc cgcggcccac ggggctcgca gcctccccgc aagctcggac 4440
gcacggagca tcctaaaccc caccacacgc aagatcgaaa aaaagcaaag gcacgaactt 4500
caccgctccg atgctcaggg ccgcggatcc tgcagagtct cccgcctgcg cgcttcggtt 4560
cagccacatc cgaggggagg gggcgcgggc agctccgccg ggggggaggg ggagcaccgc 4620
ccacgccctg gccgcgcggg gcccgccggg aacgcgtcct gcggggggcg gcgcgcgcaa 4680
tgctcaccgt ccgcggcgtg gcgcccaggg ggtctcctgg ctggggggag gggggggaag 4740
gcgggcagga aggaccgcgg aggcctctct gcgtctcgga gcgcgccaaa gcggggctcc 4800
acccacctcc ttgcccggat cttgaaggcc ggggagataa acagcggggt tctttaagca 4860
ccacctctca ctaggcgcgg gatcccaagg cttgtggcat ccggggtggt acttggacta 4920
aaagtccttc tgggagggac cgagtgagaa cccctttggg acgtgtagaa atatttgtgt 4980
ggttcgagaa tatttgtgcg gacgggcttg gcaaaggcgt agctgcagag agcacgcttg 5040
ggtggagagg gccgcacgcc ccagcgccgg cctaagcccc tcccgacggc gttatttcaa 5100
actgcgcgac cgtttctccg ctccctacgc ggaggtgggg gccggaccta gttccggacg 5160
tagtaacacg ccgagcgcga gccttccgca attcacggaa cacagttgcg caagtgatgt 5220
aaagcagtcc cgctgtacct aaagggggag tgtcacgtac ttggcgtaag gagagtgtag 5280
gcccttcccg ccattggcgg cggttagggc gtttacgtaa cggcgtgacg taagcggaga 5340
cgcgttagtg gggggaaggt tctagaaaag cggcggtctc ggctccagcg gcagtagcag 5400
cggcgccggt cccgtgtgca ggagctcctt tgcggcccag tttcttggcc atcgcctgct 5460
ctccccacag cgccaggacg agtcccgtgc gcgtccgtcc gcggaggtct ttctcatctc 5520
gctcggctgc gggaaatcgg gctgaagcga ctgagtccgc gatggaggta acgggtttga 5580
aatcaatgag ttattaaaaa tggcatggcg aggccgtagg caccgcaatg gaaaccggcc 5640
acccgcctcc gtggtccggc ggaggggatg cggccactcg agtggcggtt ggccttggcg 5700
agtttctgag gggtcgttgg aggaggcctc tgattgtccg accgccttcc ccgccctcag 5760
ccgcccggcg ccatttccct cagttggggt gggggatggg aagtgcccgc cgcgaccggg 5820
ctggaccgct aaagtagcgc gtgagcgggc catcgctggc ctttcgatgt gcgcgggcct 5880
aggggctcgg ttgtgttcgc ggcggaacgt ttctggggcc cccccggctt cccggagcga 5940
gtctgcgaag ctagcttccc ctcccccctc tcccgggaac cggatttggc ggccgccatt 6000
ttcccgtctc cttcctcgcc acgattttgc tttcaacgct ttaggtttac tagtttggtt 6060
ttcttttttc accactgcgt agacgtgttt agcgattttc ctttcttttg gaagtcttca 6120
taccgtttcg aggtggattt agcgttttga gcttgggtct tcagcgtcct gcgcacctcg 6180
ctaaaggctc tctgccttcc cctcgacgaa atggcgccat tgctttctga agccaccgag 6240
gcgcggggtg ggggcggggt ggcggcgctc cacgagcttt actggaacag gcagagagaa 6300
cgtagtacaa ccgaggcctg ggcgggtggc tgaaggcagc gtcgctgcaa agagaccgtt 6360
ttatttttca taatacgtaa gattacgggt gctgtagtaa agcacttgag cattagtata 6420
gtaggaggaa gtcaaagtgg aaaaaatggg agcgctcatc aggaagctag ggaggctatg 6480
ttgagtgcag ggttactttc cttttattgc agaactttta tctgcttaaa ggatcctcgg 6540
atcgaaataa ttcaaattat aagcattttt aagggaatct tcgaatttgt tggtaaagtc 6600
aacggatcct tagcacgtgg tgttcacttt aaggaagtga aatagctgac ttttcatagt 6660
tagccttcgc ttaaagcctg gttcagtgga cgaaaatcca cgtcctggct atataaaaac 6720
ttagtttggg gtcacagtgt ttgagcgtgg tcattcggtt tttttatttt ttatttgttt 6780
gaaattatga tgcatcatta cactgataag cattagcttt cgaattgaaa ggggtctcct 6840
tggttatttt ctttgactct aagcacactt ataaataaaa taaccttgtt tataatcgat 6900
agtggacgtc tggtaagttt ggaaaaaacc cgaggtaagt aaagagcttt tgctttcgtt 6960
agtgatatga aaaaacaagg tgtatttaat acttgcaact tagtttaagg aaagccaatt 7020
tactgacatt ttagtagagc taccagaaac actatttgga gtcctgatta aggcttttgt 7080
aactattttg actatttaaa acaattttgg tcgtttttat taaacatttc aaaacctaaa 7140
aattgtaaac attggctttt tgagcacatt ttggagaaac ttacaaattt aggctataca 7200
gtaaaataac ggatttgttt tataattttg ctttttcatt tcgttgtgca gtcataggtc 7260
ctggatagta tgacctaatt tatgaacatc ttgataagtt tttgtactta gctattggaa 7320
agccagtatt aagtgcctga caaaaccaga tttaaggtga tatctggagt ttcagcattc 7380
ttcatggagc ttgtttcaga gttgcaggat tttttttttt catcttgaga tacttacaat 7440
taacaccaga gggggcagct cagggaaaag caaatatgcc acttttcaga aactgaatct 7500
tggaagtggt gaatttggaa acaggttttt taaatttttt ttaaatctaa aaagtagtaa 7560
attttggact tgggttgtag aatttaatga attacaaaag aattctttaa taccctttaa 7620
atgacctaag agctgggtat ggtttttctg aatttttttg aagaaaatct aagaaagttt 7680
acgtgaatta gaagttagat cgaatattag tgactttgaa acttgtatag ctcaggcaat 7740
ttttggtgta acacaactaa tatgcagttt aacatatggt ttaaatttga tgtaagtttt 7800
ttttctcccc cccagaaaac tttagaaact gttcctttgg agaggaaaaa ggtactctac 7860
cagcaggtca cctcatattt aagaatttaa tttcctgcat acaaagaaag tgtaaataaa 7920
aattgaaatg gtatttccct ttgcagagag aaaaggaaca gttccgaaag ctctttattg 7980
gtggcttaag cttatcgata ccggtggcgc gccaattgtt aattaagatc tggcccaatg 8040
ggccgtacga atttgaggcg gaaagaacca gctgtggaat gtgtgtcagt tagggtgtgg 8100
aaagtcccca ggctccccag caggcagaag tatgcaaagc atgcatctca attagtcagc 8160
aaccaggtgt ggaaagtccc caggctcccc agcaggcaga agtatgcaaa gcatgcatct 8220
caattagtca gcaaccatag tcccgcccct aactccgccc atcccgcccc taactccgcc 8280
cagttccgcc cattctccgc cccatggctg actaattttt tttatttatg cagaggccga 8340
ggccgcctcg gcctctgagc tattccagaa gtagtgagga ggcttttttg gaggcctagg 8400
cttttgcaaa gatcgatcaa gagacaggat gaggatcgtt tcgcatgatt gaacaagatg 8460
gattgcacgc aggttctccg gccgcttggg tggagaggct attcggctat gactgggcac 8520
aacagacaat cggctgctct gatgccgccg tgttccggct gtcagcgcag gggcgcccgg 8580
ttctttttgt caagaccgac ctgtccggtg ccctgaatga actgcaagac gaggcagcgc 8640
ggctatcgtg gctggccacg acgggcgttc cttgcgcagc tgtgctcgac gttgtcactg 8700
aagcgggaag ggactggctg ctattgggcg aagtgccggg gcaggatctc ctgtcatctc 8760
accttgctcc tgccgagaaa gtatccatca tggctgatgc aatgcggcgg ctgcatacgc 8820
ttgatccggc tacctgccca ttcgaccacc aagcgaaaca tcgcatcgag cgagcacgta 8880
ctcggatgga agccggtctt gtcgatcagg atgatcaaga gcatcagggg ctcgcgccag 8940
ccgaactgtt cgccaggctc aaggcgagca tgcccgacgg cgaggatctc gtcgtgaccc 9000
atggcgatgc ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg 9060
actgtggccg gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata 9120
ttgctgaaga gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg 9180
ctcccgattc gcagcgcatc gccttctatc gccttcttga cgagttcttc tgagcgggac 9240
tctggggttc gaaatgaccg accaagcgac gcccaacctg ccatcacgag atttcgattc 9300
caccgccgcc ttctatgaaa ggttgggctt cggaatcgtt ttccgggacg ccggctggat 9360
gatcctccag cgcggggatc tcatgctgga gttcttcgcc caccctaggg ggaggctaac 9420
tgaaacacgg aaggagacaa taccggaagg aacccgcgct atgacggcaa taaaaagaca 9480
gaataaaacg cacggtgttg ggtcgtttgt tcataaacgc ggggttcggt cccagggctg 9540
gcactctgtc gataccccac cgagacccca ttggggccaa tacgcccgcg tttcttcctt 9600
ttccccaccc caccccccaa gttcgggtga aggcccaggg ctcgcagcca acgtcggggc 9660
ggcaggccct gccatagcct caaattcctt aggctcgagg gccgccaccg cggtggagct 9720
ccagcttttg ttccctttag tgagggttaa tttcgagctt ggcgtaatca tggtcatagc 9780
tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca 9840
taaagtgtaa agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct 9900
cactgcccgc tttccagtcg ggaaacctgt cgtgccagca tcgcgagcac ttttcgggga 9960
aatgtgcgcg gaacccctat ttgtttattt ttctaaatac attcaaatat gtatccgctc 10020
atgagacaat aaccctgata aatgcttcaa taatattgaa aaaggaagag tatgagtatt 10080
caacatttcc gtgtcgccct tattcccttt tttgcggcat tttgccttcc tgtttttgct 10140
cacccagaaa cgctggtgaa agtaaaagat gctgaagatc agttgggtgc acgagtgggt 10200
tacatcgaac tggatctcaa cagcggtaag atccttgaga gttttcgccc cgaagaacgt 10260
tttccaatga tgagcacttt taaagttctg ctatgtggcg cggtattatc ccgtattgac 10320
gccgggcaag agcaactcgg tcgccgcata cactattctc agaatgactt ggttgagtac 10380
tcaccagtca cagaaaagca tcttacggat ggcatgacag taagagaatt atgcagtgct 10440
gccataacca tgagtgataa cactgcggcc aacttacttc tgacaacgat cggaggaccg 10500
aaggagctaa ccgctttttt gcacaacatg ggggatcatg taactcgcct tgatcgttgg 10560
gaaccggagc tgaatgaagc cataccaaac gacgagcgtg acaccacgat gcctgtagca 10620
atggcaacaa cgttgcgcaa actattaact ggcgaactac ttactctagc ttcccggcaa 10680
caattaatag actggatgga ggcggataaa gttgcaggac cacttctgcg ctcggccctt 10740
ccggctggct ggtttattgc tgataaatct ggagccggtg agcgtgggtc tcgcggtatc 10800
attgcagcac tggggccaga tggtaagccc tcccgtatcg tagttatcta cacgacgggg 10860
agtcaggcaa ctatggatga acgaaataga cagatcgctg agataggtgc ctcactgatt 10920
aagcattggt aactgtcaga ctcgcgacac tgcattaatg aatcggccaa cgcgcgggga 10980
gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 11040
tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 11100
aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 11160
gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 11220
aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 11280
ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 11340
tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 11400
tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 11460
ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 11520
tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 11580
ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca gtatttggta 11640
tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 11700
aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 11760
aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 11820
aaaactca 11828
<210> 14
<211> 9209
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid
<400> 14
cgttgtaaaa cgacggccag tgaattgtaa tacgactcac tatagggcga attgggtacc 60
gggccccccc tcgaagttta aacatttaaa tctagaacta gtggatcccc cgggctgcag 120
gaattcgata tcaagctcat ggcacctgta ttgtactctt atcagtcatt atatggactt 180
taacttcccc agatattatt tgggctcctc cataagactg tgagcatctg accactggag 240
tgttgcttcc cattatatcc ctgttatcaa gcacaaggtc aggcacagag taagactcaa 300
aacatgtttt ggaatgtatg actggtatga actacaaacc agtaagctga tgttttcatt 360
ttgagtctat aaatctaatt ttgtggtggt tttgtgtatg gctcaaggct caaattgtaa 420
aatttaatat tatgtgacca aagaaagtta tacccagaac ctcaatttcc tcaccttcaa 480
aatggggcag tttctcactc attggtctgc tgtcacgatt ttaatgagct catgcacaaa 540
cagcccttta tataaggtaa gtgctggata aatgttggct actataataa aataagcctc 600
taagatactt ggtcagcaca agtactaccc aagagtatgc actgtaagta aactgacaaa 660
attgtgtatc taaaactggc cagatgaaag agaaactttt aaggggccct tctgcgtgcc 720
cgacactgtg ctaggcactc acactatccc gacccgagaa accgatctgc gacccagagg 780
aacttaccaa gcctccagca tcttgtgcag ccctactcat gggaccatct ggatacccac 840
ccttgtcttt acagggagca gaacacacct cttatgtgtc agaaaacaaa gtccaggaag 900
tatattttta cctgaggcaa tatctgaaaa ttgtatgcta cagcctccaa agtgagtctt 960
cctctcagta cctctcttct aggcacatgg agccctttct tccaagtatt atgtttaacc 1020
acttaatgaa tgaagtcctg aaactgctta cccatgctcc ctataatctc tgagtaatct 1080
tccttttcca caacctcagg cataatctca tcttctgttt ctattacaat ttcaaattct 1140
ggaaaaagga agttgtggtc tggaattata tggtccagat gatctgaaac aaaaaggaca 1200
gcactattag taatcattta gttttgaaga cagtctaata atttgctgtc tctaaagtac 1260
tatattccct atagttctgg cattttagat aaagggtcat aaattaaatg cctatatggt 1320
gacattattc agtgattcag acttcacagc cttttttttt tttttacaaa ggtgttccag 1380
gcatgaaaaa ttttaaagta ctataccttt cctaatttta cctttaaagt tgtcctggaa 1440
atatctgggt tgacaaaggc gatgaaactg aactgagact taaaaaaaag attacccacc 1500
tggttgtgca caagcctgct tatgtcccaa tctccagtct agggtctgat gctccttgct 1560
gcagtaatat gctttgtggc atctggagca cgttttgggg cctaaacagc cacaaaccct 1620
gcagagatga gcaccagact taagctggag acacactgat tctcctgttt ctgggggagg 1680
attctcagaa ggtggctcat atgagtaaaa atcgtttttc ctgggtagtt gattcctaaa 1740
aactaaaaaa gaatacagag aaaagtttta tcttcaaaca aaacagcaat tcacatattt 1800
tatcctctgc acgtaaaact gaaaataaca acaacaaaaa agaaatgaaa gtttttgctt 1860
tcaggaataa gcttttaaaa tccagaaact agatttcgtc cggtacacgc aactgagttg 1920
cctcctagag gtggtttgag ttaatcaaat taataagact gatcgttaag aacgactgcc 1980
aaaaatacga aaaagctact gggatccatc tttccaagac aatttctatt atctgaatta 2040
acaccatacc tggtacccac tgattaaaag ctgggggtta ccaatgcgcg tgggcacagt 2100
tagaagctta tgtagcaaaa atgagcacat cctggaaggg cccgggagaa ggtgctcctg 2160
gggcagcgcg gagagggagc tctgaggctg gggcggcagc ggtgcttgcc gccgtccccc 2220
tggtcgctcc cggaattaac gccgcgcacg cgtcggaggc atggccccgt cccgaccccg 2280
tttggcggct cacctcgcag gccggcacag cacggctgct cgcggcagca gaagaggaag 2340
atgcagcggt ggaaggcgtc cgggcggcca ggcagcggcg catacacctg cagcaggaag 2400
gagagcgggc ggccgcacag ctcgcaggcc agggcctggg gccccggcag cccggccgcg 2460
cccagccatg ccggccgccc gcccaccttg ctggggaact gctcgctgcg cagtcgccac 2520
gccggcgccg actcggcgaa gcccagctcc acaggcctgg ccccggcggc agccatgcgg 2580
ggcgcgggct ggcgtggggc gcagcccaca gctgggtcgg aaggcggaaa tcgggcgccg 2640
ggccggaagg caagaggcgg gcacctttcc ggaggacagg aggcggaaac gcgtctgacg 2700
ggagcggttg caggaccaat gcgagggaac ggggcagagg aaacctctcg gcatcagccc 2760
cgcccctggc gcctctgcct ccgagccgct ttcctggtgc ctccgggtgc tctgggatgg 2820
ttctggtctt tgggagagtg gcagctggtg acggcgctcc gctcacctct gcacatgtct 2880
tgctgtgggc ctgcgggtgg ccgccaggga ggcagagccc tcccgcaaac cttccctgct 2940
ggtgtccacc tcagggtgtg ggaaacctgt gcgctggccg agtgctaacc aagagtaggc 3000
agtgaaagac aaatgaaggt tgaacaggta aagtgaggac cctacagcgg aaaccaagaa 3060
tcctgtgtgc ctgagagtaa tgaagaagcc tctgcagaag agtcttttct gtcagtctta 3120
aggtctctgt tttaatgtta gtgctggctt gctgtacctg aattccaagg gaggagtgta 3180
taatgaggca tggccaaccc ccacttccca tcattgcctg aactagtttt tcaggttaac 3240
ttcagaatgc ccttggtacc gcgggccccc tctgtggtcc cacgccactg atcgctgcat 3300
gcccaccacc tgggtacaca cagtctgtga ttcccggagc agaacggacc ctgcccaccc 3360
ggtcttgtgt gctactcagt ggacagaccc aaggcaagaa agggtgacaa ggacagggtc 3420
ttcccaggct ggctttgagt tcctagcacc gccccgcccc caatcctctg tggcacatgg 3480
agtcttggtc cccagagtcc cccagcggcc tccagatggt ctgggagggc agttcagctg 3540
tggctgcgca tagcagacat acaacggacg gtgggcccag acccaggctg tgtagaccca 3600
gcccccccgc cccgcagtgc ctaggtcacc cactaacgcc ccaggcctgg tcttggctgg 3660
gcgtgactgt taccctcaaa agcaggcagc tccagggtaa aaggtgccct gccctgtaga 3720
gcccacttcc ttcccagggc tgcggctggg taggtttgta gccttcatca cgggccacct 3780
ccagccactg gaccgctggc ccctgccctg tcctggggag tgtggtcctg cgactctaat 3840
ggccgcaagc cacctgactc ccccaacacc acactctacc tctcaagccc aggtctctcc 3900
ctagtgaccc acccagcaca tttagctagc tgagccccac agccagaggt cctcaggccc 3960
tgctttcagg gcagttgctc tgaagtcggc aagggggagt gactgcctgg ccactccatg 4020
ccctccaaga gctccttctg caggagcgta cagaacccag ggccctggca cccgtgcaga 4080
ccctggccca ccccacctgg gcgctcagtg cccaagagat gtccacacct aggatgtccc 4140
gcggtgggtg gggggcccga gagacgggca ggccgggggc aggcctggcc atgcggggcc 4200
gaaccgggca ctgcccagcg tggggcgcgg gggccacggc gcgcgccccc agcccccggg 4260
cccagcaccc caaggcggcc aacgccaaaa ctctccctcc tcctcttcct caatctcgct 4320
ctcgctcttt ttttttttcg caaaaggagg ggagaggggg taaaaaaatg ctgcactgtg 4380
cggcgaagcc ggtgagtgag cggcgcgggg ccaatcagcg tgcgccgttc cgaaagttgc 4440
cttttatggc tcgagcggcc gcggcggcgc cctataaaac ccagcggcgc gacgcgccac 4500
caccgccgag accgcgtccg cccgcgagca cagagcctcg cctttgccga tccgccgccc 4560
gtccacaccc gccgccaggt aagcccggcc agccgaccgg ggcatgcggc cgcggccctt 4620
cgcccgtgca gagccgccgt ctgggccgca gcggggggcg catggggcgg aaccggaccg 4680
ccgtgggggg cgcgggagaa gcccctgggc ctccggagat gggggacacc ccacgccagt 4740
tcgcaggcgc gaggccgcgc tcgggcgggc gcgctccggg ggtgccgctc tcggggcggg 4800
ggcaaccggc ggggtctttg tctgagccgg gctcttgcca atggggatcg cacggtgggc 4860
gcggcgtagc ccccgtcagg cccggtgggg gctggggcgc catgcgcgtg cgcgctggtc 4920
ctttgggcgc taactgcgtg cgcgctggga attggcgcta attgcgcgtg cgcgctggga 4980
ctcaatggcg ctaatcgcgc gtgcgttctg gggcccgggc gcttgcgcca cttcctgccc 5040
gagccgctgg cgcccgaggg tgtggccgct gcgtgcgcgc gcgcgacccg gtcgctgttt 5100
gaaccgggcg gaggcggggc tggcgcccgg ttgggagggg gttggggcct ggcttcctgc 5160
cgcgcgccgc ggggacgcct ccgaccagtg tttgcctttt atggtaataa cgcggccggc 5220
ccggcttcct ttgtccccaa tctgggcgcg cgccggcgcc ccctggcggc ctaaggactc 5280
ggcgcgccgg aagtggccag ggcgggggcg acttcggctc acagcgcgcc cggctattct 5340
cgcagctcac catgccggtc gccaccatga gcttatcgat accggtggcg cgccaattgt 5400
taattaagat ctggcccaat gggccgtacg aatttgaggc ggaaagaacc agctgtggaa 5460
tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca gcaggcagaa gtatgcaaag 5520
catgcatctc aattagtcag caaccaggtg tggaaagtcc ccaggctccc cagcaggcag 5580
aagtatgcaa agcatgcatc tcaattagtc agcaaccata gtcccgcccc taactccgcc 5640
catcccgccc ctaactccgc ccagttccgc ccattctccg ccccatggct gactaatttt 5700
ttttatttat gcagaggccg aggccgcctc ggcctctgag ctattccaga agtagtgagg 5760
aggctttttt ggaggcctag gcttttgcaa agatcgatca agagacagga tgaggatcgt 5820
ttcgcatgat tgaacaagat ggattgcacg caggttctcc ggccgcttgg gtggagaggc 5880
tattcggcta tgactgggca caacagacaa tcggctgctc tgatgccgcc gtgttccggc 5940
tgtcagcgca ggggcgcccg gttctttttg tcaagaccga cctgtccggt gccctgaatg 6000
aactgcaaga cgaggcagcg cggctatcgt ggctggccac gacgggcgtt ccttgcgcag 6060
ctgtgctcga cgttgtcact gaagcgggaa gggactggct gctattgggc gaagtgccgg 6120
ggcaggatct cctgtcatct caccttgctc ctgccgagaa agtatccatc atggctgatg 6180
caatgcggcg gctgcatacg cttgatccgg ctacctgccc attcgaccac caagcgaaac 6240
atcgcatcga gcgagcacgt actcggatgg aagccggtct tgtcgatcag gatgatcaag 6300
agcatcaggg gctcgcgcca gccgaactgt tcgccaggct caaggcgagc atgcccgacg 6360
gcgaggatct cgtcgtgacc catggcgatg cctgcttgcc gaatatcatg gtggaaaatg 6420
gccgcttttc tggattcatc gactgtggcc ggctgggtgt ggcggaccgc tatcaggaca 6480
tagcgttggc tacccgtgat attgctgaag agcttggcgg cgaatgggct gaccgcttcc 6540
tcgtgcttta cggtatcgcc gctcccgatt cgcagcgcat cgccttctat cgccttcttg 6600
acgagttctt ctgagcggga ctctggggtt cgaaatgacc gaccaagcga cgcccaacct 6660
gccatcacga gatttcgatt ccaccgccgc cttctatgaa aggttgggct tcggaatcgt 6720
tttccgggac gccggctgga tgatcctcca gcgcggggat ctcatgctgg agttcttcgc 6780
ccaccctagg gggaggctaa ctgaaacacg gaaggagaca ataccggaag gaacccgcgc 6840
tatgacggca ataaaaagac agaataaaac gcacggtgtt gggtcgtttg ttcataaacg 6900
cggggttcgg tcccagggct ggcactctgt cgatacccca ccgagacccc attggggcca 6960
atacgcccgc gtttcttcct tttccccacc ccacccccca agttcgggtg aaggcccagg 7020
gctcgcagcc aacgtcgggg cggcaggccc tgccatagcc tcaaattcct taggctcgag 7080
ggccgccacc gcggtggagc tccagctttt gttcccttta gtgagggtta atttcgagct 7140
tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg ttatccgctc acaattccac 7200
acaacatacg agccggaagc ataaagtgta aagcctgggg tgcctaatga gtgagctaac 7260
tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc 7320
atcgcgagca cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt tttctaaata 7380
cattcaaata tgtatccgct catgagacaa taaccctgat aaatgcttca ataatattga 7440
aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc ttattccctt ttttgcggca 7500
ttttgccttc ctgtttttgc tcacccagaa acgctggtga aagtaaaaga tgctgaagat 7560
cagttgggtg cacgagtggg ttacatcgaa ctggatctca acagcggtaa gatccttgag 7620
agttttcgcc ccgaagaacg ttttccaatg atgagcactt ttaaagttct gctatgtggc 7680
gcggtattat cccgtattga cgccgggcaa gagcaactcg gtcgccgcat acactattct 7740
cagaatgact tggttgagta ctcaccagtc acagaaaagc atcttacgga tggcatgaca 7800
gtaagagaat tatgcagtgc tgccataacc atgagtgata acactgcggc caacttactt 7860
ctgacaacga tcggaggacc gaaggagcta accgcttttt tgcacaacat gggggatcat 7920
gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa cgacgagcgt 7980
gacaccacga tgcctgtagc aatggcaaca acgttgcgca aactattaac tggcgaacta 8040
cttactctag cttcccggca acaattaata gactggatgg aggcggataa agttgcagga 8100
ccacttctgc gctcggccct tccggctggc tggtttattg ctgataaatc tggagccggt 8160
gagcgtgggt ctcgcggtat cattgcagca ctggggccag atggtaagcc ctcccgtatc 8220
gtagttatct acacgacggg gagtcaggca actatggatg aacgaaatag acagatcgct 8280
gagataggtg cctcactgat taagcattgg taactgtcag actcgcgaca ctgcattaat 8340
gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc 8400
tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg 8460
cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag 8520
gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 8580
gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 8640
gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 8700
ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc 8760
atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg 8820
tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt 8880
ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca 8940
gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca 9000
ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag 9060
ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca 9120
agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg 9180
ggtctgacgc tcagtggaac gaaaactca 9209
<210> 15
<211> 7898
<212> DNA
<213> Mus musculus
<220>
<223> Mouse hnRNP A2 HIndIII fragment
<400> 15
aagcttttaa ccctctatcc ctttaaactt ccttgatcca gtgtaagcac ctcctagaaa 60
gtcagtagac aataaaacaa aagttctgct tcaccgattt acatttataa ccaaataccc 120
ttcaccaata caataaaaaa acaaaacaac aaaaaacccc aaccatctga gaaataatct 180
tctcctttcc cagctttatt cccaggattc tacatgacca aattaccaga gtcaccactc 240
attttaatca caacatagtg tcaaataact agaaaacatg agacaacaat ggagagctga 300
gtaactatta gtagtagtac tttaccagag aatggcctct ataggctcac atgtaggaat 360
ggttggtccc caggtggtag gtagagctgt ttgaggatta cgtggccttc ttggatgggg 420
ggtgggggtg gggtgggagg gttgggtggt gggtacttaa gaggtttcaa aagtcaatat 480
tgtttgcatt tagctcttcc ttgtacttgt ggatcaaaca caacctgtca gctactgctt 540
caaatgtcat gcctgctgcc atcttctcag caggatggtc atggcctcac cctcttcaac 600
tgtaaatctt tctttctttt cttctttttc ttttggtttc gagacagggt ttctctgtat 660
agtcctggct gtcctggaac tcactttgta gaccaggctg gccttgaact cagaaatccg 720
cctgcctctg cctccctagc actgggatta aaggcgtgcg ccaccacgcc cagctttcaa 780
ctggaaatct taataaactt tcctagaagt ggccttggtt atgggagctt atcacagcaa 840
tagaacagca attatgactg gagtatgata gttaaaaaca agcaagcaag caagcaaaca 900
cacacaccaa aacaacaaaa ccccaagaca gagtcacatg tagcccaggc tagcctccaa 960
attcactata taactgaaga agacccctaa ttcccattcc tctagaatct atacctcaag 1020
tactgaatgg cttggttcac aataccccac taaatgattg gtcttactaa gtgcaacaag 1080
gtaaacctaa aacttcagcc ctcagacatc ccttttccag tatcaattta taaaattaga 1140
tcccaaggat aaaaattaat tgtaaagtaa aatcagagtt ctagcatcaa ctacaggctc 1200
aaccatgggg accacaaata aactaaaagg gataagactg gcttccccat aattattaca 1260
tttagataat tttcctgact actcaacaaa gctaaaatat caccactggt ttattttctc 1320
cttctagggt ttaagctcac tctgaggagg ggcatgcggc acacactcat agcatccagg 1380
aaatagaaat atggtgacta tcatgggttc agggccaacc taggctttag agaaaaacct 1440
tgtcccacaa accaaaaatg tctctttttt attctatcag gggtggatgg atttgttaaa 1500
gaagtgcttt taaaaacctt gagatggtta tttagaagtc cccatgggat accaaaataa 1560
cccactattt atatgcccaa gcatttcacc tccacaacag tgctatgcac cctttaacat 1620
ttttgagaca gtagcccagt ctagtcttta acttgcagtg atttttcctg attcagcttc 1680
tcccagtgct ggaattatag gtatgcacca ccatgtgtaa ctacagatgc tacttaaaaa 1740
ttttttaaag gaatcacaaa aataaccccc tatcaaatgc ctagtccctc taaccatcac 1800
caagtgaagg atcacgcagg aaaaaaaaaa tcaccagcag cacctcagaa ccaggatact 1860
cagtccatca gcatccaggg ccatacccac actcacagca tctccacagt ttaccagatg 1920
attcatgctt atcactgtat tgggtcatct aagagtgacc atcagggctt ctgatcacag 1980
aatctagtcc actttgcaga ccagttgaag tcatgcacta tatgagatag aaataccctc 2040
ttgctcattt tggtcagaaa ttcaaggata aaaacccatg ttttgttaat gcacacctcc 2100
atatgattga gatcaatgtg tcctaattaa tgtagaaacc acaactgtaa atttcactct 2160
tttgacatga atctttttct agacagggtc ttggatgcag ccccgactac ccagaatttt 2220
ggaatccagg ctagcctcaa actcaaggca atctgcttgc ttcagcttct cacaggctgg 2280
atcacaaaca tacaccttca gacccatttt tttttcctcc ctccgttttt ggtttctctg 2340
tgtagccctg ggtgtccgtg gactcgctgt gtagatctat ctaccagcct ctgtcttgga 2400
gtactgggat taaagttgtg ggctaccact gcctggctga cccagtttta tttattttaa 2460
atataacttg acaaaaataa atttgtctaa cttactagaa atcccaagaa aactaacact 2520
ggatttagca acagtcagaa atcgctgaaa agaaacagaa ttgatctaac agtcttagat 2580
cactcctaga cagtttgtaa ttcttgctca tggcaacgtg agctctatct aactcactct 2640
ctgtgcacta atgaatgctc agtgtctcca gaacagcaca gcttccaggg taatcatgcc 2700
aacccacaag acttttatag agctgtccac gactcttccc ccattcagct cattaacaat 2760
atgatggagc tcctgtgtgg aaatcaaggc acactctggt agaaacttgt tttttctttc 2820
cacttttcct tgggctctga agattgagct gttttataac ccacaaacat gcatttttta 2880
cctcaaaagc atccagcaaa aactgtacaa cgctttttca aaaaaatgta ttgtgatcct 2940
ccttaagaaa agccttactt agtgttaatt cctttttctt tagaatgctg gtaaatacaa 3000
ggacttaggt aggctggctt ctaacagcaa ttcacccact tatgatggga ttaaaggaag 3060
gcacaaccat gtccaccaca ggttctagct cccccaccca cacgcccaga gagggttttt 3120
ctgtgtagct ctgactattc tggaattcac actgcagacc aggctggtct cgaactcaga 3180
gatccaccac cacatggttt cttaattgta attttaaaga aaaaaaaaaa tccttcagtt 3240
aagattctta tgttctaggt tttcacaaac ttaccaatgt agttttattg gaggccattt 3300
tttaaattta atcggagact tgaagagcta ttgcaagaaa aaaaatgtag gacagttaaa 3360
atttcatgac acacaaaagg cagctacaag ttttgtgtgg atttcaacat gtaaatttcg 3420
ggtaaaaatg caggaaaaca gttgagttcc cgtgttatta gtatgttact aataatttca 3480
gtatgttagt gaaaataatc ttactaaaac actggtacct cagacaactt tacatggtga 3540
ggattgttac tttcccaatc catatagaat tttaacaatt ttagtgttta ttttggatga 3600
aaggaaatga ctatcttttg ttagcaaatt accataagat ctttttcttt agatttctga 3660
atactccaag gagctcatat aattccatcc ttattttttc agaggccctc cctgttcaat 3720
cacggtataa aaaaaggaac acattaagat gtcccagtcc tattttctgg cttttttttt 3780
ccgggggtgg tggtgcggta atcactctct atagtccagt ctgggcttca acgcctggca 3840
atccccagcc tcaagctccc aagtactgtc ctgataagga tagaaggagt cgacctcctt 3900
cacgctcccc tccgaggagg gctccttccc agctccattc cccggtcggg agcccgtccc 3960
ccacccgaga gcgcgggcct cgtggtcagc gcctccgcgg ggagaaacaa aggcggcggc 4020
gggggctcaa gggcactgcg ccacgggccc gcgcctcccc catccggcgg cggccacgta 4080
gccgggagcg cgccgcagcc cggagcctcg ggcctcgcag ctgcagagcc tgaaccgctc 4140
tctccctgcg ggcctgcgac gaggctgggg gaggggaggc ccgcgctttg tctggagtct 4200
cggtagctgt catccggctc ccaccctcat gcacaattgt cccatctccc ccacgcaccg 4260
gcgcggcgcc cgcctcagcg aggccccagc cggtttcccg cagcccgcgg cccacggggc 4320
tcgcagcctc cccgcaagct cggacgcacg gagcatccta aaccccacca cacgcaagat 4380
cgaaaaaaag caaaggcacg aacttcaccg ctccgatgct cagggccgcg gatcctgcag 4440
agtctcccgc ctgcgcgctt cggttcagcc acatccgagg ggagggggcg cgggcagctc 4500
cgccgggggg gagggggagc accgcccacg ccctggccgc gcggggcccg ccgggaacgc 4560
gtcctgcggg gggcggcgcg cgcaatgctc accgtccgcg gcgtggcgcc cagggggtct 4620
cctggctggg gggagggggg ggaaggcggg caggaaggac cgcggaggcc tctctgcgtc 4680
tcggagcgcg ccaaagcggg gctccaccca cctccttgcc cggatcttga aggccgggga 4740
gataaacagc ggggttcttt aagcaccacc tctcactagg cgcgggatcc caaggcttgt 4800
ggcatccggg gtggtacttg gactaaaagt ccttctggga gggaccgagt gagaacccct 4860
ttgggacgtg tagaaatatt tgtgtggttc gagaatattt gtgcggacgg gcttggcaaa 4920
ggcgtagctg cagagagcac gcttgggtgg agagggccgc acgccccagc gccggcctaa 4980
gcccctcccg acggcgttat ttcaaactgc gcgaccgttt ctccgctccc tacgcggagg 5040
tgggggccgg acctagttcc ggacgtagta acacgccgag cgcgagcctt ccgcaattca 5100
cggaacacag ttgcgcaagt gatgtaaagc agtcccgctg tacctaaagg gggagtgtca 5160
cgtacttggc gtaaggagag tgtaggccct tcccgccatt ggcggcggtt agggcgttta 5220
cgtaacggcg tgacgtaagc ggagacgcgt tagtgggggg aaggttctag aaaagcggcg 5280
gtctcggctc cagcggcagt agcagcggcg ccggtcccgt gtgcaggagc tcctttgcgg 5340
cccagtttct tggccatcgc ctgctctccc cacagcgcca ggacgagtcc cgtgcgcgtc 5400
cgtccgcgga ggtctttctc atctcgctcg gctgcgggaa atcgggctga agcgactgag 5460
tccgcgatgg aggtaacggg tttgaaatca atgagttatt aaaaatggca tggcgaggcc 5520
gtaggcaccg caatggaaac cggccacccg cctccgtggt ccggcggagg ggatgcggcc 5580
actcgagtgg cggttggcct tggcgagttt ctgaggggtc gttggaggag gcctctgatt 5640
gtccgaccgc cttccccgcc ctcagccgcc cggcgccatt tccctcagtt ggggtggggg 5700
atgggaagtg cccgccgcga ccgggctgga ccgctaaagt agcgcgtgag cgggccatcg 5760
ctggcctttc gatgtgcgcg ggcctagggg ctcggttgtg ttcgcggcgg aacgtttctg 5820
gggccccccc ggcttcccgg agcgagtctg cgaagctagc ttcccctccc ccctctcccg 5880
ggaaccggat ttggcggccg ccattttccc gtctccttcc tcgccacgat tttgctttca 5940
acgctttagg tttactagtt tggttttctt ttttcaccac tgcgtagacg tgtttagcga 6000
ttttcctttc ttttggaagt cttcataccg tttcgaggtg gatttagcgt tttgagcttg 6060
ggtcttcagc gtcctgcgca cctcgctaaa ggctctctgc cttcccctcg acgaaatggc 6120
gccattgctt tctgaagcca ccgaggcgcg gggtgggggc ggggtggcgg cgctccacga 6180
gctttactgg aacaggcaga gagaacgtag tacaaccgag gcctgggcgg gtggctgaag 6240
gcagcgtcgc tgcaaagaga ccgttttatt tttcataata cgtaagatta cgggtgctgt 6300
agtaaagcac ttgagcatta gtatagtagg aggaagtcaa agtggaaaaa atgggagcgc 6360
tcatcaggaa gctagggagg ctatgttgag tgcagggtta ctttcctttt attgcagaac 6420
ttttatctgc ttaaaggatc ctcggatcga aataattcaa attataagca tttttaaggg 6480
aatcttcgaa tttgttggta aagtcaacgg atccttagca cgtggtgttc actttaagga 6540
agtgaaatag ctgacttttc atagttagcc ttcgcttaaa gcctggttca gtggacgaaa 6600
atccacgtcc tggctatata aaaacttagt ttggggtcac agtgtttgag cgtggtcatt 6660
cggttttttt attttttatt tgtttgaaat tatgatgcat cattacactg ataagcatta 6720
gctttcgaat tgaaaggggt ctccttggtt attttctttg actctaagca cacttataaa 6780
taaaataacc ttgtttataa tcgatagtgg acgtctggta agtttggaaa aaacccgagg 6840
taagtaaaga gcttttgctt tcgttagtga tatgaaaaaa caaggtgtat ttaatacttg 6900
caacttagtt taaggaaagc caatttactg acattttagt agagctacca gaaacactat 6960
ttggagtcct gattaaggct tttgtaacta ttttgactat ttaaaacaat tttggtcgtt 7020
tttattaaac atttcaaaac ctaaaaattg taaacattgg ctttttgagc acattttgga 7080
gaaacttaca aatttaggct atacagtaaa ataacggatt tgttttataa ttttgctttt 7140
tcatttcgtt gtgcagtcat aggtcctgga tagtatgacc taatttatga acatcttgat 7200
aagtttttgt acttagctat tggaaagcca gtattaagtg cctgacaaaa ccagatttaa 7260
ggtgatatct ggagtttcag cattcttcat ggagcttgtt tcagagttgc aggatttttt 7320
tttttcatct tgagatactt acaattaaca ccagaggggg cagctcaggg aaaagcaaat 7380
atgccacttt tcagaaactg aatcttggaa gtggtgaatt tggaaacagg ttttttaaat 7440
tttttttaaa tctaaaaagt agtaaatttt ggacttgggt tgtagaattt aatgaattac 7500
aaaagaattc tttaataccc tttaaatgac ctaagagctg ggtatggttt ttctgaattt 7560
ttttgaagaa aatctaagaa agtttacgtg aattagaagt tagatcgaat attagtgact 7620
ttgaaacttg tatagctcag gcaatttttg gtgtaacaca actaatatgc agtttaacat 7680
atggtttaaa tttgatgtaa gttttttttc tcccccccag aaaactttag aaactgttcc 7740
tttggagagg aaaaaggtac tctaccagca ggtcacctca tatttaagaa tttaatttcc 7800
tgcatacaaa gaaagtgtaa ataaaaattg aaatggtatt tccctttgca gagagaaaag 7860
gaacagttcc gaaagctctt tattggtggc ttaagctt 7898
19
Claims (64)
- 하기 구성요소들을 포함하는 단리된 폴리뉴클레오티드를 포함하는 벡터:a. 이중의, 분기적으로 전사되는 프로모터를 포함하는 확장된 메틸화-결여 CpG 아일랜드;b. 폴리아데닐화 시그날에 의해 종결된 발현가능한 핵산;c. 프로모터에 작동가능하게 연결된 선별가능한 마커 유전자;여기서, CpG 아일랜드와 선별가능한 마커 모두 상기 발현가능한 핵산에 작동가능하게 연결되어 있고, 상기 구성요소들은, 상기 발현가능한 핵산의 센스 스트랜드에 대하여 5'에서 3'의 배향으로, 확장된 메틸화-결여 CpG 아일랜드, 발현가능한 핵산, 선별가능한 마커 유전자의 순서로 배치되고, 그리고 상기 발현가능한 핵산의 3'말단에 폴리아데닐화 시그날이 상기 선별가능한 마커의 인접 말단의 2000bp 이내에 있도록 상기 벡터가 선형화 및 염색체로 통합될 수 있는 것을 특징으로 하는 벡터.
- 제 1항에 있어서, 상기 발현가능한 핵산의 3'말단에 폴리아데닐화 시그날이 상기 선별가능한 마커의 인접 말단의 1500bp 이내에 있는 벡터.
- 제 2항에 있어서, 상기 발현가능한 핵산의 3'말단에 폴리아데닐화 시그날이 상기 선별가능한 마커의 인접 말단의 1000bp 이내에 있는 벡터.
- 제 3항에 있어서, 상기 발현가능한 핵산의 3'말단에 폴리아데닐화 시그날이 상기 선별가능한 마커의 인접 말단의 500bp 이내에 있는 벡터.
- 제 1항에 있어서, 상기 선별가능한 마커는 항생물질 내성 유전자인 벡터.
- 제 5항에 있어서, 상기 항생물질 내성 유전자는 스트렙토미세스(Streptomyces) 종에서 얻어지는 것인 벡터.
- 제 5항에 있어서, 상기 항생물질 내성 유전자는 퓨로마이신 내성 유전자; 네오마이신 내성 유전자; 하이그로마이신 내성 유전자; 블레오마이신 내성 유전자; 및 블라스티시딘 내성 유전자로 이루어진 군으로부터 선택되는 것인 벡터.
- 제 7항에 있어서, 상기 퓨로마이신 내성 유전자는 스트렙토미세스 알보나이저(Streptomyces alboniger)로부터 유래된 변형 퓨로마이신 N-아세틸 트랜스퍼라제 유전자인 벡터.
- 제 7항에 있어서, 상기 네오마이신 내성 유전자는 스트렙토미세스 프라디애(Streptomyces fradiae)로부터 유래된 아미노글리코시드 포스포트랜스퍼라제 유전자인 벡터.
- 제 7항에 있어서, 상기 하이그로마이신 내성 유전자는 스트렙토미세스 하이그로스코피쿠스(Streptomyces hygroscopicus)로부터 유래된 하이그로마이신 포스포트랜스퍼라제 유전자인 벡터.
- 제 7항에 있어서, 상기 블레오마이신 내성 유전자는 스트렙토미세스 베르티실루스(Streptomyces verticillus)로부터 유래된 블레오마이신 N-아세틸트랜스퍼라제인 벡터.
- 제 7항에 있어서, 상기 블라스티시딘 내성 유전자는 스트렙토미세스 베르티실룸(Streptomyces verticillum)으로부터 유래된 블라스티시딘 S-아세틸트란스퍼라제 유전자인 벡터.
- 제 1항 내지 제 5항 중 어느 하나의 항에 있어서, 상기 선별가능한 마커는 대장균(Escherichia coli)으로부터 유래된 항생물질 내성 유전자 아미노시클리톨 포스포트랜스퍼라제인 벡터.
- 제 1항 내지 제 5항 중 어느 하나의 항에 있어서, 상기 선별가능한 마커는 트란스포손 Tn5로부터 유래된 항생물질 내성 유전자 네오마이신 포스포트랜스퍼라제인 벡터.
- 제 1항 내지 제 12항 중 어느 하나의 항에 있어서, 상기 확장된 메틸화-결여 CpG 아일랜드는 인간 hnRNP(heterogeneous nuclear ribonucleoprotein) A2/B1 유전자에 걸쳐 있는 8kb DNA 단편을 포함하는 벡터.
- 제 1항 내지 제 12항 중 어느 하나의 항에 있어서, 상기 확장된 메틸화-결여 CpG 아일랜드는 뮤린(쥣과) hnRNP A2/B1 유전자에 걸쳐 있는 8kb DNA 단편을 포함하는 벡터.
- 제 16항에 있어서, 상기 확장된 메틸화-결여 CpG 아일랜드는 도 19에 기재된 서열의 뉴클레오티드 1-7898을 포함하는 벡터.
- 제 1항 내지 제 12항 중 어느 하나의 항에 있어서, 상기 확장된 메틸화-결여 CpG 아일랜드는 인간 β-액틴 CpG 아일랜드/프로모터 영역에 걸쳐 있는 2.0kb DNA 단편 및 인간 PDCD2 CpG 아일랜드/프로모터 영역에 걸쳐 있는 1.8kb DNA 단편을 포함하는 벡터.
- 제 1항 내지 제 12항 중 어느 하나의 항에 있어서, 상기 발현가능한 핵산은 치료 핵산인 벡터.
- 제 1항 내지 제 12항 중 어느 하나의 항에 있어서, 상기 발현가능한 핵산은 다중 클로닝 부위 내에 함유되고, 상기 다중 클로닝 부위는 추가로 프로모터에 작동가능하게 연결되어 있는 벡터.
- 제 20항에 있어서, 상기 프로모터는 사이토메갈로바이러스 즉시/초기 프로모터인 벡터.
- 제 1항에 있어서, 도 10에 기재된 서열의 뉴클레오티드 1-10551을 포함하는 벡터.
- 제 1항 내지 제 12항 중 어느 하나의 항에 있어서, 상기 발현가능한 핵산은 인 비트로 세포 배양 시스템에서 발현하기 위한 재조합 단백질을 코드화하는 것인 벡터.
- 삭제
- 제 1항에 있어서, 도 12의 서열의 뉴클레오티드 1-13545를 포함하는 벡터.
- 제 25항에 있어서, 퓨로마이신 내성 유전자가 도 15의 서열을 갖는 스트렙토미세스 프라디애(Streptomyces fradiae)로부터 유래된 아미노글리코시드 포스포트랜스퍼라제 유전자로 대체된 벡터.
- 제 25항에 있어서, 퓨로마이신 내성 유전자가 도 17의 서열을 갖는 대장균(Escherichia coli)으로부터 유래된 아미노시클리톨 포스포트랜스퍼라제 유전자로 대체된 벡터.
- 제 25항에 있어서, 퓨로마이신 내성 유전자가 도 14의 서열을 갖는 스트렙토미세스 알보나이저(Streptomyces alboniger)로부터 유래된 퓨로마이신 N-아세틸 트랜스퍼라제 유전자의 변형된 형태로 대체된 벡터.
- 제 25항에 있어서, 인간 IE CMV 프로모터가 뮤린 IE CMV 프로모터로 대체된 벡터.
- 제 25항에 있어서, 인간 hnRNP A2/B1 유전자에 걸쳐 있는 8kb DNA 단편을 포함하는 확장된 메틸화-결여 CpG 아일랜드가 도 19의 서열을 갖는 뮤린 hnRNP A2/B1 유전자에 걸쳐 있는 8kb DNA 단편을 포함하는 확장된 메틸화-결여 CpG 아일랜드로 대체된 벡터.
- 제 1항에 있어서, 도 21에 기재된 서열의 뉴클레오티드 1-12039를 포함하는 벡터.
- 제 1항에 있어서, 도 23에 기재된 서열의 뉴클레오티드 1-11646을 포함하는 벡터.
- 제 1항에 있어서, 도 25에 기재된 서열의 뉴클레오티드 1-9027을 포함하는 벡터.
- 제 1항에 있어서, 도 27에 기재된 서열의 뉴클레오티드 1-12221을 포함하는 벡터.
- 제 1항에 있어서, 도 29에 기재된 서열의 뉴클레오티드 1-11828을 포함하는 벡터.
- 제 1항에 있어서, 도 31에 기재된 서열의 뉴클레오티드 1-9209를 포함하는 벡터.
- 제 1항 내지 제 12항 중 어느 한 항에 따른 벡터로 트랜스펙션된 숙주세포.
- 제 1항 내지 제 12항 중 어느 한 항에 따른 벡터, 또는 상기 벡터로 트랜스펙션된 숙주세포를 사용하여 발현가능한 핵산의 발현을 얻는 방법.
- 세포 배양 시스템에서 제 1항 내지 제 12항 중 어느 한 항에 따른 벡터, 또는 상기 벡터로 트랜스펙션된 숙주세포를 사용하여 원하는 유전자 생성물의 발현을 얻는 방법.
- 제 1항 내지 제 12항 중 어느 한 항에 따른 벡터, 또는 상기 벡터로 트랜스펙션된 숙주세포를 포함하는 약제.
- 제 1항 내지 제 12항 중 어느 한 항에 따른 벡터, 또는 상기 벡터로 트랜스펙션된 숙주세포를 이용한 유전자 요법으로서, 인간 이외의 대상을 치료하기 위한 것인 유전자 요법.
- 제 1항 내지 제 12항 중 어느 한 항에 따른 벡터, 또는 상기 벡터로 트랜스펙션된 숙주세포를 포함하는 유전자 요법으로 치료될 수 있는 질병 치료용 약제.
- 약제학적으로 허용가능한 부형제와 함께 제 1항 내지 제 12항 중 어느 한 항에 따른 벡터, 또는 상기 벡터로 트랜스펙션된 숙주세포를 포함하는 약제학적 조성물.
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US28160501P | 2001-04-05 | 2001-04-05 | |
GB0108605.7 | 2001-04-05 | ||
US60/281,605 | 2001-04-05 | ||
GB0108605A GB0108605D0 (en) | 2001-04-05 | 2001-04-05 | Improved gene expression |
GB0109335A GB0109335D0 (en) | 2001-04-17 | 2001-04-17 | Improved gene expression |
GB0109335.0 | 2001-04-17 | ||
US29867501P | 2001-06-15 | 2001-06-15 | |
US60/298,675 | 2001-06-15 | ||
PCT/GB2002/001479 WO2002081677A2 (en) | 2001-04-05 | 2002-04-05 | Improved gene expression |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20040016848A KR20040016848A (ko) | 2004-02-25 |
KR100955756B1 true KR100955756B1 (ko) | 2010-04-30 |
Family
ID=44695696
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020037012782A KR100955756B1 (ko) | 2001-04-05 | 2002-04-05 | 개량된 유전자 발현 |
Country Status (3)
Country | Link |
---|---|
KR (1) | KR100955756B1 (ko) |
CN (1) | CN102206633A (ko) |
ES (1) | ES2387951T3 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112575031B (zh) * | 2019-09-29 | 2023-04-07 | 新乡医学院 | 一种遍在染色质开放表达元件、重组表达载体、表达系统及其制备方法、应用 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000005393A2 (en) * | 1998-07-21 | 2000-02-03 | Cobra Therapeutics Limited | A polynucleotide comprising a ubiquitous chromatin opening element (ucoe) |
-
2002
- 2002-04-05 KR KR1020037012782A patent/KR100955756B1/ko not_active IP Right Cessation
- 2002-04-05 CN CN2011100636973A patent/CN102206633A/zh active Pending
- 2002-04-05 ES ES10155532T patent/ES2387951T3/es not_active Expired - Lifetime
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000005393A2 (en) * | 1998-07-21 | 2000-02-03 | Cobra Therapeutics Limited | A polynucleotide comprising a ubiquitous chromatin opening element (ucoe) |
Also Published As
Publication number | Publication date |
---|---|
ES2387951T3 (es) | 2012-10-04 |
KR20040016848A (ko) | 2004-02-25 |
CN102206633A (zh) | 2011-10-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2020260485B2 (en) | Gene therapies for lysosomal disorders | |
AU2023214366B2 (en) | Gene therapies for lysosomal disorders | |
DK2194137T3 (en) | Cells comprising codon-optimized lentivirus particles | |
AU2015263150B2 (en) | Lentiviral vectors | |
RU2758489C2 (ru) | Композиции и способы для экспрессии нескольких биологически активных полипептидов с одного вектора для лечения заболеваний сердца и других патологий | |
US20030119104A1 (en) | Chromosome-based platforms | |
US20040219516A1 (en) | Viral vectors containing recombination sites | |
US20040161817A1 (en) | Compositions and methods for high-level, large-scale production of recombinant proteins | |
KR20210143897A (ko) | 오리지아스로부터의 트랜스포사제를 이용한 핵산 작제물의 진핵세포로의 통합 | |
CN101208435A (zh) | 改进的表达元件 | |
KR20210144861A (ko) | 아마이엘로이스로부터의 트랜스포사제를 이용한 핵산 작제물의 진핵세포 게놈으로의 전위 | |
KR20210150486A (ko) | 리소좀 장애에 대한 유전자 요법 | |
CN111094569A (zh) | 光控性病毒蛋白质、其基因及包含该基因的病毒载体 | |
AU2020344628A1 (en) | Compositions and methods for TCR reprogramming using fusion proteins | |
CN113584083A (zh) | 用于逆转录病毒载体的生产细胞和包装细胞及其制备方法 | |
US20030166890A1 (en) | Gene expression | |
KR100955756B1 (ko) | 개량된 유전자 발현 | |
KR20240037192A (ko) | 게놈 통합을 위한 방법 및 조성물 | |
CN116323955A (zh) | 通过crispr/cas介导的体内末端解析拯救重组腺病毒 | |
KR20150021839A (ko) | 암특이적 유전자를 표적하는 트랜스-스플라이싱 라이보자임의 조절 유도체를 포함하는 재조합 아데노바이러스 및 이의 용도 | |
RU2817770C2 (ru) | Интеграция конструкций нуклеиновой кислоты в эукариотические клетки с транспозазой из oryzias | |
RU2814721C2 (ru) | Транспозиция конструкций нуклеиновой кислоты в эукариотические геномы с транспозазой из amyelois | |
CA2522166C (en) | Lambda integrase mutein for use in recombination | |
TW202233830A (zh) | 使用下一代工程化t細胞療法治療癌症之組合物及方法 | |
KR20210150487A (ko) | 리소좀 장애를 위한 유전자 요법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
N231 | Notification of change of applicant | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130328 Year of fee payment: 4 |
|
LAPS | Lapse due to unpaid annual fee |