KR102240180B1 - 다중 벡터 시스템 및 이의 용도 - Google Patents

다중 벡터 시스템 및 이의 용도 Download PDF

Info

Publication number
KR102240180B1
KR102240180B1 KR1020177027977A KR20177027977A KR102240180B1 KR 102240180 B1 KR102240180 B1 KR 102240180B1 KR 1020177027977 A KR1020177027977 A KR 1020177027977A KR 20177027977 A KR20177027977 A KR 20177027977A KR 102240180 B1 KR102240180 B1 KR 102240180B1
Authority
KR
South Korea
Prior art keywords
sequence
vector
aav
seq
nucleotide sequence
Prior art date
Application number
KR1020177027977A
Other languages
English (en)
Other versions
KR20170140185A (ko
Inventor
파스콰리나 코렐라
알베르토 아우리키오
이반나 트라파니
Original Assignee
폰다지오네 텔레톤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 폰다지오네 텔레톤 filed Critical 폰다지오네 텔레톤
Publication of KR20170140185A publication Critical patent/KR20170140185A/ko
Application granted granted Critical
Publication of KR102240180B1 publication Critical patent/KR102240180B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P21/00Drugs for disorders of the muscular or neuromuscular system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P21/00Drugs for disorders of the muscular or neuromuscular system
    • A61P21/04Drugs for disorders of the muscular or neuromuscular system for myasthenia gravis
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • A61P7/04Antihaemorrhagics; Procoagulants; Haemostatic agents; Antifibrinolytic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P9/00Drugs for disorders of the cardiovascular system
    • A61P9/10Drugs for disorders of the cardiovascular system for treating ischaemic or atherosclerotic diseases, e.g. antianginal drugs, coronary vasodilators, drugs for myocardial infarction, retinopathy, cerebrovascula insufficiency, renal arteriosclerosis
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/40Systems of functionally co-operating vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/20Vectors comprising a special translation-regulating system translation of more than one cistron
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/44Vectors comprising a special translation-regulating system being a specific part of the splice mechanism, e.g. donor, acceptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/44Vectors comprising a special translation-regulating system being a specific part of the splice mechanism, e.g. donor, acceptor
    • C12N2840/445Vectors comprising a special translation-regulating system being a specific part of the splice mechanism, e.g. donor, acceptor for trans-splicing, e.g. polypyrimidine tract, branch point splicing

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Virology (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Cell Biology (AREA)
  • Toxicology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Neurology (AREA)
  • Orthopedic Medicine & Surgery (AREA)
  • Physical Education & Sports Medicine (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Vascular Medicine (AREA)
  • Cardiology (AREA)

Abstract

본 발명은 효과적인 유전자 치료법을 가능하게 하는, 상세하게는 5 Kb 초과의 유전자로 된 구축물, 벡터, 관련 숙주 세포 및 약제학적 조성물에 관한 것이다.

Description

다중 벡터 시스템 및 이의 용도
본 발명은 효과적인 유전자 치료법을 가능하게 하는, 상세하게는 5 Kb 초과의 유전자로 된 구축물, 벡터, 관련 숙주 세포 및 약제학적 조성물에 관한 것이다.
많은 유전성 망막 변성(IRD; inherited retinal degeneration)에 대한 시력-회복 치료법(sight-restoring therapy)은 여전히, 충족되지 못한 주요 의료 요구이다. 아데노-연관 바이러스(AAV; adeno-associated viral) 벡터를 이용한 유전자 치료법은 현재까지, 많은 IRD의 치료를 위한 가장 유망한 접근법을 나타낸다. 사실상, 상이한 IRD들에 대한 수년간의 예비-임상 연구 및 다수의 임상 시험들은, 치료 유전자를 질병에 걸린 망막 층[광수용기(PR; photoreceptor) 및 망막 색소 상피(RPE; retinal pigment epithelium)]에 효율적으로 전달하는 AAV의 능력을 확인하였고1, 2, 인간에서 이들의 우수한 안전성 및 효능 프로파일을 분명히 보여주었다3 -7. 이러한 상항에도 불구하고, 이러한 성공을 다른 시력 상실 질환(blinding condition)까지 확장시키는 데 있어서 주요 장애들 중 하나는 AAV 벡터(~5 kb)의 패키징 용량(packaging capacity)이다. 이는 5 kb보다 더 큰 코딩 서열을 가진 유전자(본원에서는 큰 유전자로도 지칭됨)에서의 돌연변이로 인해, 보편적인 IRD에 대한 유전자 대체 치료법의 개발에 있어서 제한 인자가 되었다.
따라서, 최근 수년간 AAV의 운반 용량을 증가시키기 위한 전략의 규명에 상당한 관심이 있어 왔다. 분자간 재조합을 통해 콘카테머화(concatemerization)하는 AAV 게놈의 능력을 기반으로 한 이중 AAV 벡터는 이러한 문제를 해결하기 위해 성공적으로 이용되어 왔다14-16. 이중 AAV 벡터는 큰 이식유전자(transgene) 발현 카세트를 2개의 개별 절반들로 분할함으로써 생성되며, 이러한 절반은 각각 단일 정상 크기(NS; < 5 kb) AAV 벡터에 패키징된다. 전장(full-length) 발현 카세트의 재구축은, 동일한 세포를 이중 AAV 벡터 둘 다에 의해 공동-감염 시, i) 2개의 벡터 게놈의 반전 말단 반복부(ITR; inverted terminal repeat)-매개 꼬리-대-머리(tail-to-head) 콘카테머화, 및 후속해서 스플라이싱(이중 AAV 트랜스-스플라이싱, TS)15, ii) 2개의 벡터 게놈에 함유된 오버래핑 영역들 사이에서의 상동성 재조합(이중 AAV 오버래핑, OV)15, iii) 둘 다의 조합(이중 AAV 하이브리드)16에 의해 달성된다. 그 외 및 발명자들은 최근, 망막에서 이중 AAv 벡터의 잠재성을 보여주었다14 , 17-19. 이중 AAV 하이브리드 벡터의 맥락에서 사용되는 가장 많이 사용되는 재조합유전성(recombinogenic) 영역은, 높은 수준의 이중 AAV 하이브리드 벡터 재구축을 부여하는 것으로 나타난 인간 알칼리 포스파타제 cDNA의 중간 1/3의 872 bp 서열로부터 유래한다16. 발명자들은, AK 서열을 포함하는 이중 AAV 하이브리드 벡터가, 발명자들이 Ghosh 등22에서 제공된 설명을 기반으로 생성한 센스 알칼리 포스파타제 머리 영역 서열14을 포함하는 벡터를 능가함을 보여주었다. 부가적인 연구는, 이러한 알칼리 포스파타제 영역의 머리 또는 꼬리가, 알칼리 포스파타제 cDNA22의 전장 중간 1/3을 이용하여 달성된 것과 유사한 이식유전자 재구축 수준을 부여함을 보여주었다. 발명자들은, 이중 AAV 트랜스-스플라이싱 및 하이브리드 AK 벡터(F1 파지 유래의 짧은 AK 재조합유전성 서열을 함유함)가 마우스 및 돼지 망막에 효율적으로 형질도입되고, 스타르가르트 질병(STGD; Stargardt disease) 및 어셔 1B(USH1B; Usher 1B)의 마우스 모델을 구제함을 발견하였다14 ,19. 이중 AAV TS 및 하이브리드 AK 벡터를 이용하여 달성된 PR 형질도입의 수준은 IRD의 마우스 모델의 망막 표현형의 유의미한 개선을 가져왔고, 유전성 시력 상실 질환을 치료하는 데 효과적일 수 있다. 더욱이, 고도로 분기하는(divergent)(상동성 23의 58%) 혈청형 2 및 5 유래의 이종성 ITR(각각 ITR2 및 ITR5)을 가진 벡터는 상동성 ITR24을 가진 벡터보다 감소된 환형 단량체 형성 능력 및 증가된 방향성 꼬리-대-머리 콘카테머화를 보여준다. 이를 기반으로, Yan 등은, 이종성 ITR2 및 ITR5를 가진 이중 AAV 벡터가 상동성 ITR을 가진 이중 AAV 벡터보다 이식유전자 발현을 보다 효율적으로 재구축함을 보여주었다24, 25.
이들 연구가 망막과 같은 관심 조직에서의 큰 유전자 재구축을 위한 이중 AAV 벡터의 잠재성을 강조하긴 하였지만, 이들 연구는 또한, 이러한 전략의 추가적인 임상적 번역을 고려하기 전에 해결될 필요가 있는 중요한 문제점을 강조하고 있다.
프로모터 서열을 함유하는 5'-하프(half) 벡터로부터의 및/또는 3'-하프 벡터로부터의 절단된(truncated) 단백질 생성물의 생성은 ITR14 , 17, 20, 21의 낮은 프로모터 활성으로 인해, 이중 벡터의 사용과 연관된 주요 문제점이 여전히 남아 있다. 이들 절단된 생성물의 잠재적인 유해 효과를 생체내에서 평가하기 위한 형식적인 독성 연구가 지금까지도 수행된 적이 없으며, 따라서, 안전성 염려가 증가하고 있다. 따라서, 이들 절단된 생성물의 생성의 감소 또는 제거가 매우 바람직하다. 따라서, 본 발명은 이중 벡터 시스템의 사용과 연관된 이러한 주요 문제점을 해결하는 것을 목표로 한다.
Trapani, I, et al (2014). Progress in retinal and eye research 43: 108-128. Boye, SE, Boye, SL, Lewin, AS, and Hauswirth, WW (2013). Molecular therapy : the journal of the American Society of Gene Therapy 21: 509-519. Bainbridge, JW, et al. (2008). The New England journal of medicine 358: 2231-2239. Maguire, AM, et al. (2009). Lancet 374: 1597-1605. Maguire, AM, et al. (2008). The New England journal of medicine 358: 2240-2248. Cideciyan, AV, et al. (2009). Human gene therapy 20: 999-1004. Simonelli, F, et al. (2010). Molecular therapy : the journal of the American Society of Gene Therapy 18: 643-650. Allikmets, R, et al. (1997). Nature genetics 15: 236-246. Molday, RS, and Zhang, K (2010). Progress in lipid research 49: 476-492. Millan, JM, et al. (2011). Journal of ophthalmology 2011: 417217. Hasson, T, et al. (1995). PNAS 92: 9815-9819. Liu, X, Ondek, B, and Williams, DS (1998). Nature genetics 19: 117-118. Gibbs, D, et al. (2010). Investigative ophthalmology & visual science 51: 1130-1135. Trapani, I, Colella, P, Sommella, A, Iodice, C, Cesi, G, de Simone, S, et al.(2014). Effective delivery of large genes to the retina by dual AAV vectors. EMBO molecular medicine 6: 194-211. Duan, D, Yue, Y, and Engelhardt, JF (2001). Molecular therapy : the journal of the American Society of Gene Therapy 4: 383-391. Ghosh, A, Yue, Y, Lai, Y, and Duan, D (2008). Molecular therapy : the journal of the American Society of Gene Therapy 16: 124-130. Dyka, FM, et al., (2014). Human gene therapy methods 25: 166-177. Lopes, VS, et al. (2013). Gene Ther. Colella, P, et al. (2014). Gene Ther 21: 450-456. Lostal, W, Kodippili, K, Yue, Y, and Duan, D (2014). Human gene therapy 25: 552-562. Flotte, TR, et al. (1993). The Journal of biological chemistry 268: 3781-3790. Ghosh, A, Yue, Y, and Duan, D (2011). Human gene therapy 22: 77-83. Chiorini, JA, et al., (1999). Journal of virology 73: 1309-1319. Yan, Z, Zak, R, Zhang, Y, and Engelhardt, JF (2005). Journal of virology 79: 364-379. Yan, Z, et al. (2007). Human gene therapy 18: 81-87. Karali, et al. (2010). BMC genomics 11: 715. Kutty, RK, et al. (2010). Molecular vision 16: 1475-1486. Ragusa, M, et al.(2013). Molecular vision 19: 430-440. Sundermeier, TR, and Palczewski, K (2012). Cellular and molecular life sciences : CMLS 69: 2739-2750. Karali, M, et al. (2011). PloS one 6: e22166. Gilon, T, Chomsky, O, and Kulka, RG (1998). The EMBO journal 17: 2759-2766. Bence, NF, Sampat, RM, and Kopito, RR (2001). Science 292: 1552-1555. Bachmair, A, Finley, D, and Varshavsky, A (1986). Science 234: 179-186. Johnson, ES, et al., (1992). The EMBO journal 11: 497-505. Sadis, S, et al., (1995). Molecular and cellular biology 15: 4086-4094. Chiorini, JA, Afione, S, and Kotin, RM (1999). Journal of virology 73: 4293-4298. Tian, W, et al. (2012). PloS one 7: e29551. Wang, Z (2011). Methods in molecular biology 676: 211-223. Mussolino, C, et al. (2011). Gene Ther 18: 637-645. Hendrickson, A, and Hicks, D (2002). Experimental eye research 74: 435-444. Reich, SJ, et al. (2003). Human gene therapy 14: 37-44. Koo, T, et al., (2014). Human gene therapy 25: 98-108. Walters, RW, Bradrick, SS, and Gromeier, M (2010). Rna 16: 239-250. Ricci, EP, et al.(2011). Nucleic acids research 39: 5215-5231. Auricchio, et al. (2001). Human molecular genetics 10: 3075-3081. Gao, G, et al. (2000). Human gene therapy 11: 2079-2091. Young, JE, et al., (2003). Investigative ophthalmology & visual science 44: 4076-4085. Doria, M, et al., (2013). Human gene therapy methods 24: 392-398. Zhang, Y, et al., (2000). Journal of virology 74: 8003-8010. Drittanti, L, et al., (2000). Gene Ther 7: 924-929. Gargiulo, S, et al.(2012). ILAR journal / National Research Council, Institute of Laboratory Animal Resources 53: E70-81. Liang, FQ, et al., (2001). Methods in molecular medicine 47: 125-139. Beltran, et al. (2012) Proc. Natl. Acad. Sci. U. S. A., 109, 2132-2137. Boye, S.E., et al.(2012) Hum. Gene Ther., 23, 1101-1115. Khani, S.C., et al., (2007) Invest. Ophthalmol. Vis. Sci., 48, 3954-3961. Chandler, M.J., et al., (1999) Vet. Ophthalmol., 2, 179-184. Li, A., Zhu, X. and Craft, C.M. (2002) Invest. Ophthalmol. Vis. Sci., 43, 1375-1383. Allocca, M., et al. (2008) J. Clin. Invest., 118, 1955-1964. Parish, C.A., et al., (1998) Proc. Natl. Acad. Sci. U. S. A., 95, 14609-14613. Ben-Shabat, S., et al., (2002) J. Biol. Chem., 277, 7183-7190. Gargiulo, S., et al., (2012) ILAR J, 53, E70-81. Liang, F.Q., et al., (2001) Methods Mol. Med., 47, 125-139. Gargiulo, A., et al. (2009) Mol. Ther., 17, 1347-1354. Manfredi, A., et al.(2013) Hum. Gene Ther., 24, 982-992. Venables VN and Ripley BD. (2002) Modern Applied Statistics with S. Springer Science+Business Media, New York, USA. Li, A., Zhu, X., Brown, B. and Craft, C.M. (2003) Adv. Exp. Med. Biol., 533, 361-368. Li, A., et al. (2003) Invest. Ophthalmol. Vis. Sci., 44, 996-1007. Allocca, M., et al. (2011) Invest. Ophthalmol. Vis. Sci., 52, 5713-5719. Testa, F., et al.(2011) Invest. Ophthalmol. Vis. Sci., 52, 5618-5624. Molday, L.L., Rabin, A.R. and Molday, R.S. (2000) Nat. Genet., 25, 257-258. Sparrow, J.R., Wu, Y., Nagasaki, T., Yoon, K.D., Yamamoto, K. and Zhou, J. (2010) Photochem Photobiol Sci, 9, 1480-1489. Sparrow, J.R. and Duncker, T. (2014) J Clin Med, 3, 1302-1321. Finnemann, S.C., Leung, L.W. and Rodriguez-Boulan, E. (2002) Proc. Natl. Acad. Sci. U. S. A., 99, 3842-3847. Secondi, R., Kong, J., Blonska, A.M., Staurenghi, G. and Sparrow, J.R. (2012) Invest. Ophthalmol. Vis. Sci., 53, 5190-5197. Delori, F.C., Dorey, C.K., Staurenghi, G., Arend, O., Goger, D.G. and Weiter, J.J. (1995) Invest. Ophthalmol. Vis. Sci., 36, 718-729.
본 발명은 효과적인 유전자 치료법을 가능하게 하는, 상세하게는 5 Kb 초과의 유전자로 된 구축물, 벡터, 관련 숙주 세포 및 약제학적 조성물에 관한 것이다.
큰 유전자들은 특히 하기의 유전자들을 포함한다:
Figure 112017095877839-pct00001
스타르가르트 질병(STGD1; MIM#248200)은 광수용기-특이적인 모든-트랜스 망막 전달체를 인코딩하는 ABCA4(CDS: 6822 bp)에서의 돌연변이에 의해 유발되는 유전성 황반 변성의 가장 흔한 형태이다8, 9. 추상체-간상체 이영양증(cone-rod dystrophy) 타입 3, 노란점 안저(fundus flavimaculatus), 연령-관련 황반 변성 타입 2, 조기 발병 중증 망막 이영양증(early-onset severe retinal dystrophy) 및 색소성 망막염(retinitis pigmentosa) 타입 19 또한, ABCA4 돌연변이(ABCA4-연관 질병)와 연관이 있다. 어셔 증후군 타입 IB(USH1B; MIM#276900)는 MYO7A(CDS: 6648 bp)에서의 돌연변이에 의해 유발되는 색소성 망막염과 난청의 가장 중증의 조합된 형태이며10, 이 MYO7A는 망막 내의 PR 및 RPE 둘 다에서 발현되는 액틴-기반 모터(actin-based motor)를 인코딩한다11-13.
더욱이, 망막 증상을 필연적으로 유발하지 않는 많은 다른 유전성 질병들은 큰 유전자에서의 돌연변이로 인한 것이다. 이들은 특히, DMD에서의 돌연변이로 인한 뒤시엔느 근이영양증(Duchenne muscular dystrophy), CFTR에서의 돌연변이로 인한 낭포성 섬유증, F8에서의 돌연변이로 인한 혈우병 A, 및 DYSF 유전자에서의 돌연변이로 인한 디스페린병증(dysferlinopathy)을 포함한다.
특히, 본 발명은 다중 벡터 시스템, 바람직하게는 다중 바이러스 벡터 시스템과 연관된 절단된 단백질 생성물의 발현을, 상기 단백질의 분해를 매개하거나 이의 번역을 방지하는 신호(이하, 분해 신호)를 사용함으로써 감소시키는 것을 목적으로 한다. 분해 신호는 다중 바이러스 벡터의 맥락에서는 전혀 사용된 적이 없다. 본 발명에서 놀랍게도, 분해 신호가 다중 벡터 시스템의 적어도 하나의 벡터에 존재하는 경우, 절단된 형태의 단백질의 발현이 상당히 감소하여, 전장 단백질의 수율이 더 높아짐을 발견하였다.
따라서, 제1 양태에서, 본 발명은 세포 내에서 관심 유전자의 코딩 서열을 발현하는 벡터 시스템을 제공하며,
상기 코딩 서열은 제1 부분 및 제2 부분을 포함하고,
상기 벡터 시스템은
a) - 상기 코딩 서열의 상기 제1 부분(CDS1), 및
- 제1 재구축 서열(reconstitution sequence)
을 포함하는 제1 벡터; 및
b) - 상기 코딩 서열의 상기 제2 부분(CDS2), 및
- 제2 재구축 서열
을 포함하는 제2 벡터
를 포함하며,
상기 제1 재구축 서열 및 상기 제2 재구축 서열은
i] 제1 재구축 서열은 코딩 서열의 상기 제1 부분의 3' 말단으로 구성되고, 제2 재구축 서열은 코딩 서열의 상기 제2 부분의 5' 말단으로 구성되며, 상기 제1 재구축 서열 및 상기 제2 재구축 서열은 오버래핑 서열임; 또는
ii] 제1 재구축 서열은 스플라이싱 공여자 신호(SD; donor signal)를 포함하고, 제2 재구축 서열은 스플라이싱 수여자 신호(SA; acceptor signal)를 포함하며, 선택적으로 제1 재구축 서열 및 제2 재구축 서열 중 각각의 하나는 재조합유전성(recombinogenic) 서열을 더 포함함
으로 이루어진 군으로부터 선택되고,
제1 벡터 및 제2 벡터 중 하나 또는 둘 다는 분해 신호의 뉴클레오타이드 서열을 더 포함하며, 상기 서열은 i)의 경우, CDS1의 3' 말단 및/또는 CDS2의 5' 말단에 위치하고, ii)의 경우, SD에 대하여 3' 위치 및/또는 SA에 대하여 5' 위치에 위치한다는 사실을 특징으로 한다.
바람직하게는, 제1 벡터 및 제2 벡터는 둘 다 분해 신호의 상기 뉴클레오타이드 서열을 더 포함하며, 여기서, 제1 벡터 내 분해 신호의 뉴클레오타이드 서열은 제2 벡터 내 분해 신호의 뉴클레오타이드 서열과 동일하거나 상이하다.
바람직하게는, 제1 재구축 서열은 스플라이싱 공여자 신호(SD) 및 상기 SD에 대하여 3' 위치에 재조합유전성 영역을 포함하며, 제2 재구축 서열은 스플라이싱 수여자 신호(SA), 및 상기 SA에 대하여 5' 위치에 재조합유전성 서열을 포함하고; 분해 신호의 상기 뉴클레오타이드 서열은 제1 벡터 및 제2 벡터 중 하나 또는 둘 다의 재조합유전성 영역의 뉴클레오타이드 서열의 5' 말단 및/또는 3' 말단에 위치한다.
바람직하게는, 분해 신호의 뉴클레오타이드 서열은 하나 이상의 단백질 유비퀴틴화 신호, 하나 이상의 마이크로RNA 표적 서열 및/또는 하나 이상의 인공 정지 코돈으로부터 선택된다.
바람직하게는, 분해 신호의 뉴클레오타이드 서열은 CL1 서열 번호 1, CL2 서열 번호 2, CL6 서열 번호 3, CL9 서열 번호 4, CL10 서열 번호 5, CL11 서열 번호 6, CL12 서열 번호 7, CL15 서열 번호 8, CL16 서열 번호 9, SL17 서열 번호 10 또는 PB29(서열 번호 14 또는 서열 번호 15)로부터 선택되는 서열을 인코딩하는 서열을 포함하거나 이로 구성되거나; 또는 여기서, 분해 신호의 뉴클레오타이드 서열은 miR-204 서열 번호 11, miR-124 서열 번호 12 또는 miR-26a 서열 번호 13으로부터 선택되는 서열을 포함하거나 이로 구성된다.
바람직하게는, 제1 벡터의 분해 신호의 뉴클레오타이드 서열은 CL1 서열 번호 1을 인코딩하는 서열을 포함하거나 이로 구성되거나, 또는 서열 번호 16을 포함하거나 이로 구성되거나, 또는 miR-204 서열 번호 11 및 miR-124 서열 번호 12를 포함하거나 이로 구성되며, 바람직하게는 miR 204 서열 번호 11의 3개 복사체 및 miR 124 서열 번호 12의 3개 복사체를 포함하거나, 또는 miR-26a 서열 번호 13을 포함하거나 이로 구성되며, 바람직하게는 miR-26a 서열 번호 13의 4개 복사체를 포함한다.
바람직하게는, 제2 벡터의 분해 신호의 뉴클레오타이드 서열은 PB29를 인코딩하는 서열(서열 번호 14 또는 서열 번호 15)을 포함하거나 이로 구성되거나, 또는 서열 번호 19 또는 서열 번호 20을 포함하거나 이로 구성되며, 바람직하게는, 제2 벡터의 분해 신호는 서열 번호 14 또는 서열 번호 15의 PB29의 3개 복사체를 인코딩하는 서열을 포함하거나 이로 구성된다.
바람직하게는, 제1 벡터는 코딩 서열의 상기 제1 부분(CDS1)의 5' 말단 부분에 작동적으로 연결된 프로모터 서열을 더 포함한다.
바람직하게는 제1 벡터 및 제2 벡터는 둘 다 5'-말단 반복부(5'-TR) 뉴클레오타이드 서열 및 3'-말단 반복부(3'-TR) 뉴클레오타이드 서열을 더 포함하며, 바람직하게는 5'-TR은 5'-반전 말단 반복부(5'-ITR) 뉴클레오타이드 서열이고 3'-TR은 3'-반전 말단 반복부(3'-ITR) 뉴클레오타이드 서열이며, 바람직하게는 ITR은 동일한 바이러스 혈청형 또는 상이한 바이러스 혈청형으로부터 유래되며, 바람직하게는 바이러스는 AAV이다.
바람직하게는, 재조합유전성 서열은: AK GGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAAT(서열 번호 22) 또는 GGGATTTTTCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAAT(서열 번호 23), AP1(서열 번호 24), AP2(서열 번호 25) 및 AP(서열 번호 26)로 이루어진 군으로부터 선택된다.
바람직하게는, 코딩 서열은 천연 엑손-엑손 연접(junction)에서 제1 부분 및 제2 부분으로 분할된다.
바람직하게는, 스플라이싱 공여자 신호는 GTAAGTATCAAGGTTACAAGACAGGTTTAAGGAGACCAATAGAAACTGGGCTTGTCGAGACAGAGAAGACTCTTGCGTTTCT(서열 번호 27)와 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 100% 동일한 서열을 포함하거나 본질적으로 구성된다.
바람직하게는, 스플라이싱 수여자 신호는 GATAGGCACCTATTGGTCTTACTGACATCCACTTTGCCTTTCTCTCCACAG(서열 번호 28)와 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 100% 동일한 서열을 포함하거나 본질적으로 구성된다.
바람직하게는, 제1 벡터는 코딩 서열에 작동적으로 연결된 적어도 하나의 인핸서 뉴클레오타이드 서열을 더 포함한다.
바람직하게는, 코딩 서열은 망막 변성을 교정(correct)할 수 있는 단백질을 인코딩한다.
바람직하게는, 코딩 서열은 뒤시엔느 근이영양증, 낭포성 섬유증, 혈우병 A 및 디스페린병증을 교정할 수 있는 단백질을 인코딩한다.
망막 분해의 경우, 바람직하게는, 코딩 서열은 ABCA4, MYO7A, CEP290, CDH23, EYS, PCDH15, CACNA1, SNRNP200, RP1, PRPF8, RP1L1, ALMS1, USH2A, GPR98, HMCN1로 이루어진 군으로부터 선택되는 유전자의 코딩 서열이다.
뒤시엔느 근이영양증, 낭포성 섬유증, 혈우병 A 및 디스페린병증의 경우, 바람직하게는, 코딩 서열은 DMD, CFTR, F8 및 DYSF로 이루어진 군으로부터 선택되는 유전자의 코딩 서열이다.
바람직하게는, 제1 벡터는 폴리아데닐화 신호 뉴클레오타이드 서열을 포함하지 않는다.
바람직하게는, 벡터 시스템은
a) 5'-3' 방향으로:
- 5'-반전 말단 반복부(5'-ITR) 서열;
- 프로모터 서열;
- 관심 유전자의 코딩 서열의 5' 말단 부분(CDS1)으로서, 상기 5' 말단 부분은 상기 프로모터에 작동적으로 연결되어 있고 이의 조절 하에 있음;
- 스플라이싱 공여자 신호의 뉴클레오타이드 서열;
- 재조합유전성 영역의 뉴클레오타이드 서열; 및
- 3'-반전 말단 반복부(3'-ITR) 서열
을 포함하는 제1 벡터; 및
b) 5'-3' 방향으로:
- 5'-반전 말단 반복부(5'-ITR) 서열;
- 재조합유전성 영역의 뉴클레오타이드 서열;
- 스플라이싱 수여자 신호의 뉴클레오타이드 서열;
- 코딩 서열의 3' 말단(CDS2);
- 폴리아데닐화 신호 뉴클레오타이드 서열; 및
- 3'-반전 말단 반복부(3'-ITR) 서열
을 포함하는 제2 벡터
를 포함하고,
분해 신호의 뉴클레오타이드 서열을 더 포함하며, 상기 서열은 제1 벡터 및 제2 벡터 중 하나 또는 둘 다의 재조합유전성 영역의 뉴클레오타이드 서열의 5' 말단 또는 3' 말단에 위치하는 것을 특징으로 한다.
바람직하게는 본 발명의 벡터에서, 상기 제1 벡터 및 제2 벡터는 독립적으로 바이러스 벡터, 바람직하게는 아데노 바이러스 벡터 또는 아데노-연관 바이러스(AAV) 벡터이며, 바람직하게는 상기 제1 및 제2 아데노-연관 바이러스(AAV) 벡터는 동일하거나 상이한 AAV 혈청형으로부터 선택되고, 바람직하게는 아데노-연관 바이러스는 혈청형 2, 혈청형 8, 혈청형 5, 혈청형 7 또는 혈청형 9로부터 선택된다.
바람직하게는, 본 발명의 벡터 시스템은 상기 코딩 서열의 제3 부분(CDS3) 및 재구축 서열을 포함하는 제3 벡터를 더 포함하며, 여기서, 제2 벡터는 2개의 재구축 서열을 포함하고, 각각의 재구축 서열은 CDS2의 각각의 말단에 위치한다.
바람직하게는, 제1 벡터의 재구축 서열은 CDS1의 3' 말단으로 구성되며, 제2 벡터의 2개의 재구축 서열은 각각 CDS2의 5' 말단 및 3' 말단으로 제각기 구성되고, 제3 벡터의 재구축 서열은 CDS3의 5' 말단으로 구성되며;
제1 벡터의 상기 재구축 서열, 및 CDS2의 5' 말단으로 구성된 제2 벡터의 상기 재구축 서열은 오버래핑 서열이며;,
CDS2의 3' 말단으로 구성된 제2 벡터의 상기 재구축 서열 및 상기 제3 벡터의 상기 재구축 서열은 오버래핑 서열이고;
상기 제2 벡터는 분해 신호를 더 포함하며, 상기 분해 신호는 CDS2의 5' 말단 및/또는 CDS2의 3' 말단에 위치한다.
바람직하게는, 제3 벡터는 분해 신호의 적어도 하나의 뉴클레오타이드 서열을 더 포함한다.
바람직하게는, 제2 벡터는 상기 코딩 서열(CDS2)의 3' 말단 부분에 연결된 폴리아데닐화 신호 뉴클레오타이드 서열을 더 포함한다.
본 발명은 상기 정의된 바와 같은 벡터 시스템에 의해 형질변환된 숙주 세포를 제공한다.
바람직하게는, 본 발명의 벡터 시스템 또는 숙주 세포는 의료용이다. 바람직하게는 유전자 치료법에 사용하기 위한 것이다. 바람직하게는, 망막 변성을 특징으로 하는 병태 또는 질병의 치료 및/또는 예방에 사용하거나, 뒤시엔느 근이영양증, 낭포성 섬유증, 혈우병 A 및 디스페린병증의 예방 및/또는 치료에 사용하기 위한 것이다.
바람직하게는, 망막 변성은 유전성이다.
바람직하게는, 병태 또는 질병은 색소성 망막염(RP), 레베르 선천성 흑암시(LCA; Leber congenital amaurosis), 스타르가르트 질병(STGD), 어셔 질병(USH), 알스트롬 증후군(Alstrom syndrome), 선천성 비진행 야맹증(CSNB; congenital stationary night blindness), 황반 이영양증(macular dystrophy), 잠복 황반 이영양증(occult macular dystrophy), ABCA4 유전자에서의 돌연변이에 의해 유발된 질병으로 이루어진 군으로부터 선택된다.
본 발명은 상기 정의된 바와 같은 벡터 시스템 또는 숙주 세포 및 약제학적으로 허용가능한 비히클을 포함하는 약제학적 조성물을 제공한다.
본 발명은 유효량의 상기 정의된 바와 같은 벡터 시스템, 숙주 세포 또는 약제학적 조성물을 이를 필요로 하는 대상에게 투여하는 단계를 포함하는, 망막 변성을 특징으로 하는 병태 또는 질병의 치료 및/또는 예방 방법을 제공한다.
본 발명은 유효량의 상기 정의된 바와 같은 벡터 시스템, 숙주 세포 또는 약제학적 조성물을 이를 필요로 하는 대상에게 투여하는 단계를 포함하는, 뒤시엔느 근이영양증, 낭포성 섬유증, 혈우병 A 또는 디스페린병증의 치료 및/또는 예방 방법을 제공한다.
본 발명은 절단된 형태의 단백질의 발현을 감소시키기 위한, 벡터 시스템에서의 분해 신호의 뉴클레오타이드 서열의 용도를 제공한다.
본 발명은 벡터 시스템의 하나 이상의 벡터에 분해 신호의 뉴클레오타이드 서열을 삽입하는 단계를 포함하는, 절단된 형태의 단백질의 발현을 감소시키는 방법을 제공한다.
본 발명의 바람직한 실시형태에 따르면, 세포 내에서 관심 유전자의 코딩 서열을 발현하는 벡터 시스템은 2개의 벡터를 포함하고, 각각의 벡터는 상기 코딩 서열의 상이한 부분 및 재구축 서열을 포함하며; 바람직하게는, 제1 벡터의 재구축 서열은 스플라이싱 공여자를 포함하는 서열이며, 한편 제2 벡터의 재구축 서열은 스플라이싱 수여자를 포함하는 서열이다.
본 발명의 다른 바람직한 실시형태에 따르면, 세포 내에서 관심 유전자의 코딩 서열을 발현하는 벡터 시스템은 3개의 벡터를 포함하고, 각각의 벡터는 상기 코딩 서열의 상이한 부분 및 적어도 하나의 재구축 서열을 포함하며; 바람직하게는, 제1 벡터는 코딩 서열의 제1 부분에 대하여 3' 위치에 스플라이싱 공여자를 포함하는 재구축 서열을 포함하며, 제2 벡터는 제2 부분 코딩 서열에 대하여 5' 위치에 스플라이싱 수여자를 포함하는 재구축 서열 및 코딩 서열의 제2 부분에 대하여 3' 위치에 스플라이싱 수여자를 포함하는 재구축 서열을 포함하고, 제3 벡터는 제3 부분 코딩 서열에 대하여 5' 위치에 스플라이싱 수여자를 포함하는 재구축 서열을 포함한다.
바람직하게는, 제1 벡터 및 제2 벡터의 재구축 서열 또는 제1 벡터, 제2 벡터 및 제3 벡터의 재구축 서열은 재조합유전성 영역, 바람직하게는 스플라이싱 공여자에 대하여 3' 위치 및 스플라이싱 수여자에 대하여 5' 위치에 위치한 재조합유전성 영역을 더 포함한다.
본 발명의 벡터 시스템 중 어느 하나의 벡터, 2개의 벡터 또는 모든 벡터는 분해 신호의 뉴클레오타이드 서열을 더 포함한다.
바람직하게는, 제1 벡터는 분해 신호를 포함한다. 바람직하게는, 제2 벡터는 분해 신호를 포함한다.
벡터가 재조합유전성 영역을 포함하는 재구축 서열을 포함하는 본 발명의 바람직한 실시형태에 따르면, 분해 신호는 상기 재조합유전성 영역의 서열의 5' 말단 또는 3' 말단에 위치한다.
본 발명의 바람직한 실시형태에 따르면, 세포 내에서 관심 유전자의 코딩 서열을 발현하는 벡터 시스템은 2개의 벡터를 포함하고; 벡터 시스템의 제1 벡터는 5'-3' 방향으로:
- 관심 유전자의 코딩 서열의 5' 말단 부분,
- 스플라이싱 공여자 신호의 핵산 서열,
- 재조합유전성 영역의 핵산 서열, 및
- 분해 신호의 핵산 서열
을 포함한다.
본 발명의 바람직한 실시형태에 따르면, 세포 내에서 관심 유전자의 코딩 서열을 발현하는 벡터 시스템은 2개의 벡터를 포함하고; 벡터 시스템의 제2 벡터는 5'-3' 방향으로:
- 재조합유전성 영역의 핵산 서열,
- 분해 신호의 핵산 서열,
- 스플라이싱 수여자 신호의 핵산 서열, 및
- 관심 유전자의 코딩 서열의 3' 말단 부분
을 포함한다.
바람직하게는, 본 발명에 따른 벡터 시스템의 제1 벡터는 프로모터 서열을 더 포함하며, 보다 바람직하게는 상기 프로모터 서열은 관심 유전자의 코딩 서열의 제1 부분의 5' 말단에 작동적으로 연결된다.
바람직하게는, 2개의 벡터로 구성된 벡터 시스템의 제2 벡터는 폴리아데닐화 신호 핵산 서열을 더 포함하며, 보다 바람직하게는 상기 폴리아데닐화 신호 핵산 서열은 관심 유전자의 코딩 서열의 제2 부분의 3' 말단에 연결된다. 바람직하게는 본 발명에 따른 벡터 시스템의 제1 벡터는 폴리아데닐화 신호 핵산 서열을 포함하지 않는다.
바람직하게는, 3개의 벡터로 구성된 벡터 시스템의 제3 벡터는 폴리아데닐화 신호 핵산 서열을 더 포함하며, 보다 바람직하게는 상기 폴리아데닐화 신호 핵산 서열은 관심 유전자의 코딩 서열의 제3 부분의 3' 말단에 연결된다.
바람직하게는, 본 발명의 벡터 시스템의 벡터 중 적어도 하나, 보다 바람직하게는 본 발명의 벡터 시스템의 제1 벡터는 CL1 서열 번호 1을 인코딩하는 서열을 포함하거나 이로 구성된 서열의 분해 신호를 포함하며; 바람직하게는, CL1 서열 번호 1을 인코딩하는 상기 서열은 서열 번호 16을 포함하거나 이로 구성된다.
바람직하게는, 본 발명의 벡터 시스템의 벡터 중 적어도 하나, 보다 바람직하게는 본 발명의 벡터 시스템의 제1 벡터는 miR-204 서열 번호 11 및 miR-124 서열 번호 12, 보다 바람직하게는 miR 204 서열 번호 11의 3개의 복사체 및 miR 124 서열 번호 12의 3개의 복사체를 포함하는 서열의 분해 신호를 포함하며; 바람직하게는 miR 204 서열 및 miR 124 서열 및/또는 miR 204 서열의 복사체 및 miR 124 서열의 복사체 각각은 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개의 뉴클레오타이드로 된 링커 서열에 의해 연결된다.
바람직하게는, 본 발명의 벡터 시스템의 벡터 중 적어도 하나, 보다 바람직하게는 본 발명의 벡터 시스템의 제1 벡터는 miR-26a 서열 번호 13을 포함하거나 이로 구성된 서열, 보다 바람직하게는 miR-26a 서열 번호 13의 4개의 복사체를 포함하는 서열의 분해 신호를 포함한다.
바람직하게는, 본 발명의 벡터 시스템의 벡터 중 적어도 하나, 보다 바람직하게는 본 발명의 벡터 시스템의 제2 벡터는 PB29를 인코딩하는 서열(서열 번호 14 또는 서열 번호 15)을 포함하거나 이로 구성된 서열의 분해 신호를 포함하며; 바람직하게는 PB29를 인코딩하는 상기 서열은 서열 번호 19 또는 서열 번호 20을 포함하거나 이로 구성되고; 보다 바람직하게는, 서열의 상기 분해 신호는 서열 번호 14 또는 서열 번호 15의 PB29의 3개의 복사체를 인코딩하는 서열을 포함하거나 이로 구성된다.
본 발명의 바람직한 실시형태에 따르면, 벡터 시스템은
a) 5'-3' 방향으로:
- 5'-반전 말단 반복부(5'-ITR) 서열;
- 프로모터 서열;
- 관심 유전자의 코딩 서열의 제1 부분으로서, 바람직하게는 상기 코딩 서열의 5' 말단 부분인 제1 부분이며, 바람직하게는 상기 제1 부분은 상기 프로모터에 작동적으로 연결되고 이의 조절 하에 있는, 제1 부분;
- 스플라이싱 공여자 신호의 핵산 서열;
- 재조합유전성 영역의 핵산 서열; 및
- 3'-반전 말단 반복부(3'-ITR) 서열
을 포함하는 제1 벡터; 및
b) 5'-3' 방향으로:
- 5'-반전 말단 반복부(5'-ITR) 서열;
- 재조합유전성 영역의 핵산 서열;
- 스플라이싱 수여자 신호의 핵산 서열;
- 관심 유전자의 코딩 서열의 제2 부분으로서, 바람직하게는 상기 코딩 서열의 3' 말단 부분인, 제2 부분;
- 폴리아데닐화 신호 핵산 서열; 및
- 3'-반전 말단 반복부(3'-ITR) 서열
을 포함하는 제2 벡터
를 포함하고,
상기 제1 벡터 및/또는 제2 벡터는 분해 신호의 핵산 서열을 더 포함하며, 상기 서열은 재조합유전성 영역의 핵산 서열의 5' 말단 또는 3' 말단에 위치한다.
본 발명의 다른 바람직한 실시형태에 따르면, 벡터 시스템은
a) 5'-3' 방향으로:
- 5'-반전 말단 반복부(5'-ITR) 서열;
- 프로모터 서열;
- 관심 유전자의 코딩 서열의 제1 부분으로서, 바람직하게는 상기 프로모터에 작동적으로 연결되고 이의 조절 하에 있는 제1 부분;
- 스플라이싱 공여자 신호의 핵산 서열;
- 재조합유전성 영역의 핵산 서열; 및
- 3'-반전 말단 반복부(3'-ITR) 서열
을 포함하는 제1 벡터;
b) 5'-3' 방향으로:
- 5'-반전 말단 반복부(5'-ITR) 서열;
- 재조합유전성 영역의 핵산 서열;
- 스플라이싱 수여자 신호의 핵산 서열;
- 관심 유전자의 코딩 서열의 제2 부분;
- 스플라이싱 공여자 신호의 핵산 서열;
- 재조합유전성 영역의 핵산 서열; 및
- 3'-반전 말단 반복부(3'-ITR) 서열
을 포함하는 제2 벡터; 및
c) 5'-3' 방향으로:
- 5'-반전 말단 반복부(5'-ITR) 서열;
- 재조합유전성 영역의 핵산 서열;
- 스플라이싱 수여자 신호의 핵산 서열;
- 관심 유전자의 코딩 서열의 제3 부분;
- 폴리아데닐화 신호 핵산 서열; 및
- 3'-반전 말단 반복부(3'-ITR) 서열
을 포함하는 제3 벡터
를 포함하고,
상기 제1 벡터 및/또는 제2 벡터 및/또는 제3 벡터는 분해 신호의 핵산 서열을 더 포함하며, 상기 서열은 재조합유전성 영역(들)의 핵산 서열의 5' 말단 또는 3' 말단에 위치한다.
바람직하게는, 병태 또는 질병은 어셔 타입 1F(USH1F), 선천성 비진행 야맹증(CSNB2), 상염색체 우성(ad; autosomal dominant) 및/또는 상염색체 열성(ar; autosomal recessive) 색소성 망막염(RP), USH1B, STGD1, 레베르 선천성 흑암시 타입 10(LCA10), RP, 어셔 타입 1D(USH1D), 어셔 타입 2A(USH2A), 상염색체 우성 황반 이영양증, 어셔 타입 2C(USH2C), 잠복 황반 이영양증, 알스트롬 증후군으로부터 선택된다.
본 발명에서, 벡터 시스템은 구축물 시스템, 플라스미드 시스템 및 또한 바이러스 입자를 의미한다.
본 발명에서, 구축물 또는 벡터 시스템은 2개 초과의 벡터를 포함할 수 있다.
특히, 구축물 시스템은 관심 서열의 제3 부분을 포함하는 제3 벡터를 포함할 수 있다.
본 발명에서, 다양한(2개, 3개 또는 그 이상의) 벡터가 세포에 도입될 때, 전장 코딩 서열이 재구축되거나 수득된다.
코딩 서열은 2개로 분할될 수 있다. 부분들은 길이가 동일하거나 상이할 수 있다. 전장 코딩 서열은 벡터 시스템의 벡터가 세포 내에 도입될 때 수득된다. 제1 부분은 코딩 서열의 5' 말단 부분일 수 있다. 제2 부분은 코딩 서열의 3' 말단일 수 있다. 나아가, 코딩 서열은 3개의 부분으로 분할될 수 있다. 부분들은 길이가 동일하거나 상이할 수 있다. 전장 코딩 서열은 벡터 시스템의 벡터가 세포 내에 도입될 때 수득된다. 제1 부분은 코딩 서열의 5' 부분이며, 제2 부분은 코딩 서열의 중간 부분이고, 제3 부분은 코딩 서열의 3' 부분이다.
본 발명에서, 세포는 바람직하게는 포유류 세포, 바람직하게는 인간 세포이다.
본 발명에서, 벡터들 중 임의의 벡터에 하나의 분해 신호가 존재하는 것으로도, 절단된 형태의 단백질의 생성을 감소시키기에 충분하다.
용어 분해 신호는 (뉴클레오타이드(nucleotidic) 또는 아미노산(amminoacidic)) 서열을 의미하며, 이러한 서열은 그것이 포함된 mRNA/단백질의 분해를 매개할 수 있다.
용어 "절단된 형태의 단백질" 또는 "절단된 단백질"은, 단일 아미노산 내지 많은 아미노산(예를 들어 1개 내지 10개, 1개 내지 20개, 1개 내지 50개, 100개, 200개 등) 범위의 결실을 제시하기 때문에, 이의 전장 형태에서는 생성되지 않는 단백질이다.
본 발명에서, "재구축 서열"은 교정 프레임(correct frame)을 이용한 전장 코딩 서열의 재구축을 가능하게 하여, 따라서 기능성 단백질의 발현을 가능하게 하는 서열이다.
용어 "스플라이싱 공여자/수여자 신호"는 mRNA의 스플라이싱에 관여하는 뉴클레오타이드 서열을 의미한다.
본 발명에서, 임의의 인트론으로부터의 임의의 스플라이싱 공여자 또는 수여자 신호 서열이 사용될 수 있다. 당업자는, 일상적인 실험에 의해 적절한 스플라이싱 공여자 또는 수여자 신호 서열을 인지하고 선택하는 방법을 알고 있다.
본 발명에서, 2개의 서열들은 상기 각각의 서열의 적어도 일부가 서로 상동성인 경우 오버래핑되고 있다. 서열은 적어도 1개, 적어도 2개, 적어도 5개, 적어도 10개, 적어도 20개, 적어도 50개, 적어도 100개, 적어도 200개 뉴클레오타이드에 대해 오버래핑될 수 있다.
용어 "재조합유전성 영역 또는 서열"은 2개의 상이한 서열들 사이에서 재조합을 매개하는 서열을 의미한다. "재조합유전성 영역 또는 서열" 및 "상동성 영역"은 본원에서 상호호환적으로 사용된다.
용어 "말단 반복부"는 뉴클레오타이드 서열의 양쪽 말단에서 반복되는 서열을 의미한다.
용어 "반전 말단 반복부"는 반대되는 배향에서(역 상보적인) 뉴클레오타이드 서열의 양쪽 말단에서 반복되는 서열을 의미한다.
단백질 유비퀴틴화 신호는 프로테아좀에 의한 단백질 분해를 매개하는 신호이다.
본 발명에서, 분해 신호가 반복된 서열을 포함하며 이러한 반복된 서열이 동일한 서열 또는 상이한 서열인 경우, 상기 반복된 서열들은 바람직하게는 적어도 1개의 뉴클레오타이드로 된 링커에 의해 연결된다.
인공 정지 코돈은 단백질 번역의 조기 종료를 유도하기 위해 전사체에 의도적으로 포함되는 뉴클레오타이드 서열이다.
인핸서 서열은 유전자 전사를 증가시키는 서열이다.
본 발명에 따르면, 적합한 분해 신호는: (i) 짧은 데그론(degron) CL1로서, 잘못 접혀진(misfolded) 단백질과 구조적 유사성을 공유하며 따라서 유비퀴틴화 시스템에 의해 인지되는 C-말단 불안정화 펩타이드인, 짧은 데그론 CL131, 32, (ii) 유비퀴틴으로서, 공여자 단백질의 N-말단에서의 이의 융합이 직접 단백질 분해 또는 N-말단 규칙 경로를 통한 분해를 둘 다 매개하는, 유비퀴틴33 , 34 및 (iii) N-말단 PB29 데그론으로서, 9개 아미노산 길이의 펩타이드이며, CL1 데그론과 유사하게 유비퀴틴화 경로의 효소에 의해 인지되는 구조로 접히는 것으로 예측되는, N-말단 PB29 데그론35을 포함한다. 본 발명자들은, 다중 벡터 시스템에 분해 서열 또는 신호를 포함시키면 절단된 단백질의 발현을 경감시킴을 발견하였다. 일 경우에서, 본 발명자들은, CL1 분해 신호의 포함이, 시험관내 및 큰 돼지 망막 둘 다에서 전장 단백질 생성에 영향을 미치지 않으면서도 절단된 단백질을 5'-하프로부터 선택적으로 분해시킴을 발견하였다.
부가적으로는, 인공 정지 코돈이 삽입되어, mRNA의 조기 종료를 유발할 수 있다.
마이크로RNA(miR) 표적 서열, 인공 정지 코돈 또는 단백질 유비퀴틴화 신호는 절단된 단백질 생성물의 분해를 매개하기 위해 이용될 수 있다. 본 발명에서, 분해 신호 서열은 반복된 서열, 예컨대 1개 초과의 마이크로RNA(miR) 표적 서열, 인공 정지 코돈 또는 단백질 유비퀴틴화 신호를 포함할 수 있으며, 상기 반복된 서열은 동일한 서열 또는 상이한 서열로서 적어도 2회 반복되고; 바람직하게는, 반복된 서열들은 적어도 1개의 뉴클레오타이드로 된 링커에 의해 연결된다.
망막에서 발현되는 miR 중에서, miR-let7b 또는 miR-26a는 높은 수준으로 발현되는 한편26 -29, miR-204 및 miR-124는 AAV-매개 이식유전자 발현을 RPE 또는 광수용기로 제한하는 것으로 나타났다30. Karali 등30은, 특정 세포 타입에서 단일 AAV 벡터에 포함된 유전자의 발현을 조정하는 데 있어서 miR 표적 부위의 효능을 시험하였다. Karali 등에서, miR 표적 부위를 표준(canonical) 발현 카세트(전체 리포터 유전자를 코딩함)에서, 코딩 서열의 다운스트림 및 폴리아데닐화 신호(polyA) 앞에 포함시켰다. Karali 등은 miR-204 또는 miR-124에 대한 miR 표적 부위를 사용하였고, 각각의 miR의 4개의 탠덤(tandem) 복사체를 사용하였다.
본 발명에서, miR은 또한 miR 모방체일 수 있다(문헌[Xiao, et al. J Cell Physiol 212:285-292, 2007]; [Wang Z Methods Mol Biol 676:211-223, 2011]). 처음에, 발명자들은 이들 전략을 다중 벡터 구축물에 적용하였고, 이러한 벡터로부터 생성된 절단된 단백질의 발현을 침묵시킬 수 있었다.
지난 10년 동안, 유전자 치료법은 수백 가지의 임상 시험에서 질병의 치료에 적용되어 왔다. 유전자를 인간 세포 내에 전달하기 위해 다양한 툴들이 개발되어 왔다. 본 발명에서, 전달 비히클이 환자에게 투여될 수 있다. 당업자는 적절한 투여 범위를 결정할 수 있을 것이다. 용어 "투여되는"은 바이러스 또는 비-바이러스 기술에 의한 전달을 포함한다. 비-바이러스 전달 메커니즘으로는, 지질 매개 형질감염, 리포좀, 면역리포좀, 리포펙신, 양이온성 면상 양친매성 물질(CFA; cationic facial amphiphile) 및 이들의 조합 등이 있으나, 이들로 한정되는 것은 아니다. 바이러스 전달 중에서, 아데노-연관 바이러스를 포함한 유전자 조작된 바이러스가 현재 유전자 전달에 있어서 가장 인기있는 툴 중의 하나이다. 바이러스-기반 유전자 전달의 개념은, 바이러스가 관심 유전자(들) 또는 프로모터 및 인트론과 같은 조절 서열을 발현시킬 수 있도록 이러한 바이러스를 조작하는 것이다. 바이러스의 특정 적용 및 타입에 따라, 대부분의 바이러스 벡터들은, 숙주에서 야생형 바이러스로서 자유롭게 복제하는 이들의 능력을 방해하는 돌연변이를 함유한다. 몇몇 상이한 과(family) 유래의 바이러스들은 유전자 전달용 바이러스 벡터를 생성하기 위해 변형되어 왔다. 이들 바이러스로는, 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스, 헤르페스 바이러스, 바큘로바이러스, 피코르나바이러스 및 알파바이러스 등이 있다. 본 발명은 바람직하게는 아데노-연관 바이러스를 이용한다. 대부분의 시스템은, 관심 유전자를 수용할 수 있는 벡터, 및 벡터-함유 감염성 바이러스 입자의 생성을 허용하기 위해 바이러스 구조 단백질 및 효소를 제공할 수 있는 헬퍼 세포를 함유한다. 아데노-연관 바이러스는, 뉴클레오타이드 및 아미노산 서열, 게놈 구조, 병원성(pathogenicity) 및 숙주 범위가 상이한 바이러스 과이다. 이러한 다양성은 상이한 치료적 적용을 개발하기 위해, 상이한 생물학적 특징을 가진 바이러스를 사용하는 기회를 제공한다. 임의의 전달 툴을 이용하는 데 있어서, 효율, 소정의 조직 또는 세포 타입을 표적화하는 능력, 관심 유전자의 발현, 및 아데노-연관 바이러스-기반 시스템의 안전성이 유전자 치료법의 성공적인 적용에 중요하다. 최근 수년간 이들 연구 영역에 상당한 노력이 쏟아져 왔다. 유전자 발현을 변경하며, 전달을 표적화하며, 바이러스 역가를 향상시키고, 안전성을 높이기 위해 아데노-연관 바이러스-기반 벡터 및 헬퍼 세포에 다양한 변형들이 이루어져 왔다. 본 발명은 관심 유전자를 이러한 바이러스 벡터 내에 효율적으로 전달하는 작용을 한다는 점에서 이러한 디자인 공정의 향상을 나타낸다.
유전자 전달에 이상적인 아데노-연관 바이러스-기반 벡터는 효율적이며, 세포-특이적이며, 조절되고, 안전해야 한다. 전달 효율은 치료법의 효능을 결정할 수 있기 때문에 중요하다. 현재의 노력은 아데노-연관 바이러스 벡터를 이용하여 세포-타입-특이적인 감염 및 유전자 발현을 달성하는 것을 목적으로 한다. 또한, 아데노-연관 바이러스 벡터는, 이러한 치료법이 장기-지속적인 발현 또는 조절된 발현을 필요로 할 수 있기 때문에, 관심 유전자의 발현을 조절하도록 개발되고 있다. 안전성은, 대부분의 바이러스가 병원체이거나 병원성 잠재성을 가지기 때문에, 바이러스 유전자 전달을 위한 주요 쟁점이다. 유전자 전달 동안, 완전한 복제 잠재성을 가진 병원성 바이러스가 또한 환자에게 부주의하게 수여되지 않도록 하는 것이 중요하다.
아데노 -연관 바이러스( AAV )는 인간 및 일부 다른 영장류 종을 감염시키는 작은 바이러스이다. 현재로서는 AAV는 질병을 유발하는 것으로 알려져 있지 않고, 결과적으로 상기 바이러스는 매우 약한 면역 반응을 야기한다. AAV를 사용한 유전자 치료 벡터는 분열중인 세포 및 휴지기 세포를 둘 다 감염시키고, 숙주 세포의 게놈 내에 통합되지 않은 채 염색체외 상태로 지속될 수 있다. 이러한 특징 덕분에, AAV는 유전자 치료용 바이러스 벡터의 제작 및 동종동계(isogenic) 인간 질병 모델의 제작을 위한 매우 매력적인 후보물질이 된다.
야생형 AAV는 다수의 특징들로 인해 유전자 치료법 연구자들로부터 상당한 관심을 끌었다. 이들 중 주된 특징은 상기 바이러스가 명백하게 병원성을 갖지 않는다는 점이다. 상기 바이러스는 또한, 비-분열중인 세포를 감염시킬 수 있고, 인간 염색체 19 내의 특정 부위(AAVS1로 지정됨)에서 숙주 세포 게놈 내로 안정하게 통합되는 능력을 가진다. 이러한 특징은 상기 바이러스를 레트로바이러스보다 다소 더 예측 가능하게 만들며, 상기 레트로바이러스는 무작위 삽입 및 돌연변이생성 위험을 나타내며 이로 인해 가끔은 암 발병이 후속된다. AAV 게놈은 언급된 부위 내로 가장 빈번하게 통합되며, 한편 게놈 내로의 무작위 혼입은 무시할 만한 빈도로 발생한다. 그러나, 유전자 치료 벡터로서의 AAV의 개발은 이 벡터의 DNA로부터 repcap를 제거함으로써 이러한 통합 능력을 없앴다. 단일-가닥 벡터 DNA를 숙주 세포 DNA 폴리머라제 복합체에 의해 이중-가닥 DNA로 전환한 후, 요망되는 유전자와 이러한 유전자의 전사를 유도하기 위한 프로모터가 함께, 핵에서 콘카타머(concatamer) 형성에 일조하는 ITR들 사이에 삽입된다. AAV-기반 유전자 치료 벡터는 숙주 세포 핵에서 에피솜(episomal) 콘카타머를 형성한다. 비-분열중인 세포에서, 이들 콘카타머는 숙주 세포의 일생 동안 온전한 채 유지된다. 분열중인 세포에서, AAV DNA는, 에피솜 DNA가 숙주 세포 DNA를 따라 복제되지 않기 때문에 세포 분열 동안 상실된다. 숙주 게놈 내로의 AAV DNA의 무작위 통합은 검출 가능하지만, 매우 낮은 빈도로 발생한다. AAV는 또한, 외견상 중화 항체의 생성으로 제한된 매우 낮은 면역원성을 나타내는 한편, 이들 AAV는 명확하게 정의된 세포독성 반응을 유도하지 않는다. 휴지기 세포를 감염시키는 능력과 함께 이러한 특징은 인간 유전자 치료용 벡터로서 아데노바이러스를 능가하는 우세를 보여준다.
AAV 게놈, 전사체 및 프로테옴( proteome )
AAV 게놈은 포지티브-센스 또는 네거티브-센스인 단일-가닥 데옥시리보핵산(ssDNA)으로 제작되며, 길이가 약 4.7 킬로베이스이다. 상기 게놈은 DNA 가닥의 양쪽 말단에 반전 말단 반복부(ITR) 및 2개의 개방형 해독틀(ORF; open reading frame): repcap를 포함한다. rep는 AAV 생활 주기에 필요한 Rep 단백질을 인코딩하는 4개의 오버래핑 유전자로 구성되고, cap는 캡시드 단백질: VP1, VP2 및 VP3의 오버래핑 뉴클레오타이드 서열을 함유하고, 이러한 캡시드 단백질들은 함께 상호작용하여 정20면체 대칭의 캡시드를 형성한다.
ITR 서열
반전 말단 반복부(ITR) 서열들은 이들의 대칭성 때문에 이러한 명칭이 부여되었으며, 상기 서열은 AAV 게놈의 효율적인 증식에 필요한 것으로 나타났다. 이들 서열의 또 다른 특성은 헤어핀(hairpin)을 형성하는 능력으로서, 이러한 헤어핀은 제2 DNA 가닥의 프리마제(primase)-독립적인 합성을 허용하는 소위 자가-프라이밍에 기여한다. ITR은 또한, 숙주 세포 게놈(인간에서는 19번째 염색체) 내로의 AAV DNA의 통합 및 이로부터의 구출, 뿐만 아니라 완전히 어셈블리된 데옥시리보뉴클레아제-내성 AAV 입자의 생성과 조합된 AAV DNA의 효율적인 캡시드화(encapsidation) 둘 다에 필요한 것으로 나타났다.
유전자 치료법과 관련하여, ITR은 치료 유전자의 옆에서 인 시스(in cis)로 필요한 유일한 서열인 것으로 보이며: 구조 유전자(cap) 및 패키징 유전자(rep)는 인 트랜스(in trans)로 전달될 수 있다. 이러한 가정 하에, 리포터 또는 치료 유전자를 함유하는 재조합 AAV(rAAV) 벡터의 효율적인 생성을 위해 많은 방법들이 구축되었다. 그러나, ITR이 효과적인 복제 및 캡시드화를 위해 인 시스로 필요한 유일한 요소가 아니라는 것 또한 공개되었다. 몇몇 연구 그룹들은, rep 유전자의 코딩 서열 내에서 시스-작용 Rep-의존적 요소(CARE; cis-acting Rep-dependent element)로 지정된 서열을 동정하였다. CARE는 인 시스로 존재 시, 복제 및 캡시드화를 증가시키는 것으로 나타났다.
2006년에, 11개의 AAV 혈청형이 보고된 바 있으며, 11번째는 2004년에 보고되었다. 공지된 혈청형들은 모두 다수의 다양한 조직 타입들 유래의 세포를 감염시킬 수 있다. 조직 특이성은 캡시드 혈청형에 의해 결정되고, 향성(tropism) 범위를 변경하기 위한 AAV 벡터의 슈도타이핑(pseudotyping)은 치료법에서 이러한 벡터를 사용하는 데 있어서 중요할 것으로 예상된다.
본 발명의 AAV 벡터 시스템에 사용되는 반전 말단 반복부(ITR) 서열은 임의의 AAV ITR일 수 있다. AAV 벡터에 사용되는 ITR은 동일하거나 상이할 수 있다. 예를 들어, 벡터는 AAV 혈청형 2의 ITR 및 AAV 혈청형 5의 ITR을 포함할 수 있다. 본 발명의 벡터의 일 실시형태에서, ITR은 AAV 혈청형 2, 4, 5 또는 8로부터 유래한다. 본 발명에서, AVV 혈청형 2 및 AVV 혈청형 5의 ITR이 바람직하다. AAV ITR 서열은 당업계에 잘 알려져 있다(예를 들어, ITR2에 대해서는, GenBank 수탁 번호 AF043303.1; NC_001401.2; J01901.1; JN898962.1을 참조하고; ITR5에 대해서는, GenBank 수탁 번호 NC_006152.1을 참조함).
혈청형 2
혈청형 2(AAV2)는 현재까지 가장 광범위하게 연구되어 왔다. AAV2는 골격근, 뉴런, 혈관의 평활근 세포 및 간세포에 대한 자연적인 향성을 제시한다.
AAV2에 대해 3개의 세포 수용체: 헤파란 설페이트 프로테오글리칸(HSPG), aVβ5 인테그린 및 섬유아세포 성장 인자 수용체 1(FGFR-1)이 보고되어 있다. HSPG는 1차 수용체로서 작용을 하는 한편, 후자의 2개는 공동-수용체 활성을 가지고 수용체-매개 엔도사이토시스(endocytosis)에 의해 AAV가 세포 안으로 들어가게 할 수 있다. 이들 연구 결과에 대해 Qiu, Handa 등이 반박을 하였다. HSPG가 1차 수용체로서 작용을 하지만, 세포외 기질에서의 이의 풍부도(abundance)는 AAV 입자를 스캐빈지(scavenge)하고 감염 효율을 약화시킬 수 있다.
혈청형 2 및 암
연구들에서, 혈청형 2 바이러스(AAV-2)가 건강한 세포에 해를 주지 않으면서 암세포를 명백하게 살해한다고 나타났다. 펜실베니아 펜 스테이트(Penn State) 의과 대학의 면역학 및 미생물학 교수인 크레이그 마이어(Craig Meyers)는 "우리의 연구 결과는, 대부분의 집단을 감염시키지만 공지된 유해 효과(ill effect)는 없는 아데노-연관 바이러스 타입 2가 다수의 타입의 암세포를 살해하지만 건강한 세포에는 아무런 영향이 없음을 제시한다"고 언급하였다.
다른 혈청형들
AAV2가 다양한 AAV-기반 연구에서 가장 인기있는 혈청형이긴 하지만, 다른 혈청형이 유전자 전달 벡터로서 더 효과적일 수 있는 것으로 나타났다. 예를 들어, AAV6은 기도 상피 세포를 감염시키는 데 있어 훨씬 더 양호한 것으로 보이며, AAV7은 (AAV1 및 AAV5와 유사하게) 뮤린 골격근 세포의 매우 높은 형질도입 속도를 제시하며, AAV8은 간세포 및 광수용기에 형질도입하는 데 우수하고, AAV1 및 AAV5는 혈관 내피 세포로의 유전자 전달에 매우 효율적인 것으로 나타났다. 뇌에서, 대부분의 AAV 혈청형이 뉴런 향성을 보이는 한편, AAV5는 성상세포에도 형질도입된다. AAV1과 AAV2의 하이브리드인 AAV6은 또한, AAV2보다 더 낮은 면역원성을 나타낸다.
혈청형은 이들이 결합하는 수용체에 따라 상이할 수 있다. 예를 들어 AAV4 및 AAV5 형질도입은 (이들 각각의 혈청형에 대한 상이한 형태의) 용해성 시알산에 의해 저해될 수 있고, AAV5는 혈소판-유래 성장 인자 수용체를 통해 세포 안으로 들어가는 것으로 나타났다.
본 발명은 또한, 본 발명의 폴리뉴클레오타이드, 발현 구축물 또는 벡터 구축물을 포함하는 바이러스 벡터 시스템에 관한 것이다. 일 실시형태에서, 바이러스 벡터 시스템은 AAV 시스템이다. 이종성 폴리뉴클레오타이드 또는 구축물을 포함하는 바이러스 및 비리온의 제조 방법은 당업계에 알려져 있다. AAV의 경우, 세포는 AAV 헬퍼 기능에 적합한 아데노바이러스, 또는 아데노바이러스 유전자를 포함하는 폴리뉴클레오타이드 구축물을 이용하여 공동감염되거나 형질감염될 수 있다. 물질 및 방법의 예는 예를 들어, 미국 특허 8,137,962 및 6,967,018에 기재되어 있다. 본 발명의 AAV 바이러스 또는 AAV 벡터는 비제한적으로 혈청형 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10 및 AAV11을 포함한 임의의 AAV 혈청형일 수 있다. 구체적인 실시형태에서, AAV2, AAV5, AAV7, AAV8 또는 AAV9 혈청형이 이용된다. 일 실시형태에서, AAV 혈청형은 캡시드 표면 상에서 하나 이상의 티로신에서 페닐알라닌(Y-F) 돌연변이를 제공한다. 구체적인 실시형태에서, AAV는 위치 733에서 티로신에서 페닐알라닌 돌연변이(Y733F)를 가진 AAV8 혈청형이다.
본 발명에 따른 벡터 시스템에 의한 하나 이상의 치료 유전자 또는 조절 서열, 예컨대 프로모터 또는 인트론의 전달은 단독으로 사용되거나, 다른 치료 또는 치료의 구성성분과 조합하여 사용될 수 있다.
본 발명은 또한, 본 발명의 구축물 시스템 또는 바이러스 벡터 시스템을 포함하는 숙주 세포에 관한 것이다. 숙주 세포는 배양된 세포 또는 원발성 세포, 즉 유기체, 예를 들어 인간으로부터 직접 단리된 세포일 수 있다. 숙주 세포는 부착성 세포 또는 현탁성 세포, 즉 현탁액 내에서 성장하는 세포일 수 있다. 적합한 숙주 세포는 당업계에 알려져 있으며, 그 예로는 DH5α, 이. 콜라이(E. coli) 세포, 차이니즈 햄스터 난소 세포, 원숭이 VERO 세포, COS 세포, HEK293 세포 등이 있다. 세포는 인간 세포 또는 또 다른 동물 유래일 수 있다. 일 실시형태에서, 세포는 광수용기 세포 또는 RPE 세포이다. 구체적인 실시형태에서, 세포는 추상 세포이다. 세포는 또한, 근육 세포, 특히 골격근 세포, 폐 세포, 췌장 세포, 간 세포, 신장 세포, 장 세포, 혈액 세포일 수 있다. 구체적인 실시형태에서, 세포는 인간 추상 세포 또는 간상 세포이다. 적절한 숙주의 선택은 본원 교시로부터 당업자의 재량 내에 있는 것으로 생각된다. 바람직하게는, 상기 숙주 세포는 동물 세포, 가장 바람직하게는 인간 세포이다. 세포는 본 발명의 바이러스 벡터 시스템에 제공된 뉴클레오타이드 서열을 발현할 수 있다.
당업자는 폴리뉴클레오타이드 또는 벡터를 숙주 세포 내에 혼입시키는 표준 방법, 예를 들어 형질감염, 리포펙션, 전기천공, 현미주사, 바이러스 감염, 열 충격, 막의 화학적 투과 후 형질변환, 또는 세포 융합에 대해 잘 알고 있다. 본 발명의 구축물 또는 벡터 시스템은 또한, 생체내에서 당업계에 알려진 방법, 예컨대 형질감염, 현미주사, 전기천공, 칼슘 포스페이트 석출의 사용 및 볼리스틱 방법(biolistic method)에 의해 네이키드(naked) DNA로서 도입될 수 있다.
본원에 사용된 바와 같이, 용어 "숙주 세포 또는 유전자 조작된 숙주 세포"는, 본 발명의 구축물 시스템 또는 바이러스 벡터 시스템을 이용하여 형질도입, 형질변환 또는 형질감염된 숙주 세포를 지칭한다.
본원에 사용된 바와 같이, 용어 "핵산", "폴리뉴클레오타이드 서열" 및 "구축물"은 단일-가닥 또는 이중-가닥 형태의 데옥시리보뉴클레오타이드 중합체 또는 리보뉴클레오타이드 중합체를 지칭하고, 다르게 제한되지 않는 한, 천연-발생 뉴클레오타이드와 유사한 방식으로 작용할 수 있는 공지된 천연 뉴클레오타이드 유사체를 포함할 것이다. 폴리뉴클레오타이드 서열은 전장 서열뿐만 아니라 해당 전장 서열 유래의 더 짧은 서열을 둘 다 포함한다. 특정 폴리뉴클레오타이드 서열은 본래의 서열, 또는 특정 숙주 세포에서 코돈 선호도(codon preference)를 제공하기 위해 도입될 수 있는 서열의 축퇴 코돈(degenerate codon)을 포함하는 것으로 이해된다. 본 발명의 범위 내에 속하는 폴리뉴클레오타이드 서열은, 본 발명의 펩타이드를 코딩하는 서열과 특이적으로 혼성화하는 서열을 더 포함한다. 폴리뉴클레오타이드는 개별 가닥으로서 또는 듀플렉스 내에서 센스 가닥 및 안티센스 가닥을 둘 다 포함한다.
본 발명은 또한, 표준의 엄격한 조건 및 표준 방법 하에 본 발명의 폴리뉴클레오타이드 서열과의 혼성화를 허용하기 위해 해당 폴리뉴클레오타이드 서열과 충분히 상동성인 서열을 가진 폴리뉴클레오타이드 분자를 고려한다(문헌[Maniatis, T. et al, 1982]).
본 발명은 또한, 구축물이 발현되는 것으로 의도된 숙주 세포 내에서 기능성 조절 요소를 포함할 수 있는 구축물 시스템에 관한 것이다. 당해 기술분야의 당업자는 적절한 숙주 세포, 예를 들어 포유류 또는 인간 숙주 세포에 사용하기 위한 조절 요소를 선택할 수 있다. 조절 요소로는 예를 들어, 프로모터, 전사 종결 서열, 번역 종결 서열, 인핸서, 신호 펩타이드, 분해 신호 및 폴리아데닐화 요소 등이 있다. 본 발명의 구축물은 요망되는 폴리펩타이드를 인코딩하는 뉴클레오타이드 서열에 작동적으로 연결된 프로모터 서열을 포함할 수 있다.
본 발명에 사용하는 것으로 고려되는 프로모터로는, 본래의(native) 유전자 프로모터, 사이토메갈로바이러스(CMV) 프로모터(KF853603.1, bp 149-735), 키메라 CMV/닭 베타-액틴 프로모터(CBA) 및 절단된 형태의 CBA(smCBA) 프로모터(US8298818, 및 AAVGC1로 처리된 생후 구아닐레이트 사이클라제-1 녹아웃 마우스 망막의 추상체에서 광-구동 추상체 어레스틴 전좌(Light-Driven Cone Arrestin Translocation in Cones of Postnatal Guanylate Cyclase-1 Knockout Mouse Retina Treated with AAVGC1)), 로돕신 프로모터(NG_009115, bp 4205-5010), 광수용기간 레티노이드 결합 단백질 프로모터(interphotorecetpor retinoid binding protein promoter; NG_029718.1, bp 4777-5011), 난황상(vitelliform) 황반 이영양증 2 프로모터(NG_009033.1, bp 4870-5470), PR-특이적인 인간 G 단백질-커플링된 수용체 키나제 1(hGRK1; PR-specific human G protein-coupled receptor kinase 1; AY327580.1 bp1793-2087 또는 bp 1793-1991)(문헌[Haire et al. 2006]; 미국 특허 8,298,818) 등이 있으나, 이들로 한정되는 것은 아니다. 그렇지만, 당업계에 알려진 임의의 적합한 프로모터가 사용될 수 있다. 구체적인 실시형태에서, 프로모터는 CMV 프로모터 또는 hGRK1 프로모터이다. 일 실시형태에서 프로모터는, 하나의 조직 또는 한 그룹의 조직에서는 선택적인 활성을 보이지만 다른 조직에서는 활성이 더 낮거나 활성이지 않은, 조직-특이적인 프로모터이다. 일 실시형태에서, 프로모터는 수용기-특이적인 프로모터이다. 다른 실시형태에서, 프로모터는 추상 세포-특이적인 및/또는 간상 세포-특이적인 프로모터이다.
바람직한 프로모터는 CMV, GRK1, CBA 및 IRBP 프로모터이다. 보다 바람직한 프로모터는 하이브리드 프로모터로서, 이는 다양한 프로모터들 유래의 조절 요소들을 조합한 것이다(예로서, CMV 프로모터 유래의 인핸서, CBA 프로모터 및 Sv40 키메라 인트론을 조합한 키메라 CBA 프로모터로서, 본원에서 CBA 하이브리드 프로모터로 지칭됨).
프로모터는 당업계에 알려진 표준 기술을 사용하여 구축물 내에 혼입될 수 있다. 프로모터의 다중 복사체 또는 다중 프로모터가 본 발명의 벡터에 사용될 수 있다. 일 실시형태에서, 프로모터는, 이의 천연 유전적 환경에서 전사 시작 부위로부터 유래한 것이므로, 전사 시작 부위로부터 대략 동일한 거리에 위치할 수 있다. 이러한 거리에 대한 약간의 변화는 프로모터 활성의 실질적인 감소가 없을 시 허용된다. 본 발명의 시스템에서, 전사 시작 부위는 전형적으로, 3' 구축물이 아닌 5' 구축물에 포함된다. 다른 실시형태에서, 전사 시작 부위는 분해 신호의 업스트림에 있는 3' 구축물에 포함될 수 있다.
본 발명의 구축물은 선택적으로, 전사 종결 서열, 번역 종결 서열, 신호 펩타이드 서열, 내부 리보솜 도입 부위(IRES; internal ribosome entry site), 인핸서 요소 및/또는 전사-후 조절 요소, 예컨대 마멋 간염 바이러스(WHV; Woodchuck hepatitis virus) 전사후 조절 요소(WPRE)를 함유할 수 있다. 전사 종결 영역은 전형적으로, 진핵 또는 바이러스 유전자 서열의 3' 비번역된 영역으로부터 수득될 수 있다. 전사 종결 서열은 효율적인 종결을 제공하기 위해 코딩 서열의 다운스트림에 위치할 수 있다. 본 발명의 시스템에서, 전사 종결 부위는 전형적으로, 5' 구축물이 아닌 3' 구축물에 포함된다.
신호 펩타이드 서열은, 작동적으로 연결된 폴리펩타이드를 특정 세포소기관 구획으로부터 단백질 작용 부위 및 세포외 환경에 이르기까지 광범위한 번역-후 세포 도착지로 재배치시키는 책임이 있는 정보를 인코딩하는 아미노 말단 서열이다. 인핸서는 유전자 전사를 증가시키는 시스-작용 요소로서, 이 또한 벡터 내에 포함될 수 있다. 인핸서 요소는 당업계에 알려져 있으며, 이러한 요소로는 CaMV 35S 인핸서 요소, 사이토메갈로바이러스(CMV) 조기 프로모터 인핸서 요소 및 SV40 인핸서 요소 등이 있으나, 이들로 한정되는 것은 아니다. 구조 유전자에 의해 인코딩되는 mRNA의 폴리아데닐화를 지시하는(direct) DNA 서열 또한, 벡터에 포함될 수 있다.
바람직하게는 본 발명에서, 코딩 서열은 천연 엑손-엑손 연접에서 제1 및 제2 단편 또는 부분(5' 말단 부분 및 3' 말단 부분)으로 분할된다. 바람직하게는 코딩 서열의 각각의 단편 또는 부분은 그 크기가 60 kb를 초과하지 않아야 하며, 바람직하게는 코딩 서열의 각각의 단편 또는 부분은 그 크기가 50 Kb, 40 Kb, 30 Kb, 20 Kb, 10 Kb를 초과하지 않아야 한다. 바람직하게는, 코딩 서열의 각각의 단편 또는 부분은 그 크기가 약 2 Kb, 2.5 Kb, 3 Kb, 3.5 Kb, 4 Kb, 4.5 Kb, 5 Kb, 5.5 Kb, 6 Kb, 6.5 Kb, 7 kb, 7.5 Kb, 8 Kb, 8.5 Kb, 9 Kb, 9.5 Kb일 수 있거나 그보다 더 작은 크기일 수 있다.
스플라이스오솜(spliceosomal) 인트론은 종종 진핵 단백질-코딩 유전자의 서열 내에 체류한다. 상기 인트론 내에서, 공여자 부위(인트론의 5' 말단), 분지(branch) 부위(인트론의 3' 말단 부근) 및 수여자 부위(인트론의 3' 말단)가 스플라이싱에 필요하다. 스플라이스 공여자 부위는, 크기가 더 크며 더 적게 고도로 보존된 영역 내에서 인트론의 5' 말단에 대체로 변하지 않는(invariant) 서열 GU를 포함한다. 인트론의 3' 말단에서 스플라이스 수여자 부위는 대체로 변하지 않는 AG 서열을 가진 인트론으로 종결된다. AG로부터 업스트림(5'-방향)에, 피리미딘(C 및 U)이 풍부한 영역, 또는 폴리피리미딘 트랙이 존재한다. 폴리피리미딘 트랙으로부터 업스트림에 분지점이 존재하고, 이러한 분지점은 아데닌 뉴클레오타이드를 포함한다. 스플라이싱 수여자 신호 및 스플라이싱 공여자 신호는 또한 당업자에 의해, 당업계에 알려진 서열들 중에서 선택될 수 있다.
단백질의 분해를 매개하며, 다중 바이러스 시스템의 맥락에서 이전에는 전혀 사용된 적이 없는 신호로는, 잘못 접혀진 단백질과 구조적 유사성을 공유하며 따라서 유비퀴틴화 시스템에 의해 인지되는 C-말단 불안정화 펩타이드인 CL1, CL2, CL6, CL9, CL10, CL11, CL12, CL15, CL16, SL17과 같은 짧은 데그론, 공여자 단백질의 N-말단에서의 융합이 직접 단백질 분해 또는 N-말단 규칙 경로를 통한 분해를 둘 다 매개하는 유비퀴틴, 9개 아미노산 길이의 펩타이드이며 CL1 데그론과 유사하게 유비퀴틴화 경로의 효소에 의해 인지되는 구조로 접히는 것으로 예측되는 N-말단 PB29 데그론, mRNA의 조기 종결을 유발하는 인공 정지 코돈, 마이크로RNA(miR) 표적 서열 등이 있으나, 이들로 한정되는 것은 아니다.
당업자가 쉽게 이해할 수 있는 바와 같이, 실험실에서 당업자에 의해 인공적으로 제작될 수 있는 변이체 서열들 외에도 자연적으로 발견되는 단백질의 다수의 변이체 서열들이 존재할 수 있다. 본 발명의 폴리뉴클레오타이드 및 폴리펩타이드는 본원에서 구체적으로 예시된 것들, 뿐만 아니라 변이체들이 요망되는 기능적 활성을 보유하는 한 이들의 임의의 천연 변이체뿐만 아니라 인공적으로 제작될 수 있는 임의의 변이체를 포함한다. 또한, 폴리펩타이드 서열 내에서의 아미노산 치환, 첨가 또는 결실을 제외하고는 본원에 예시된 폴리펩타이드와 동일한 아미노산 서열을 가진 폴리펩타이드는, 이들 변이체 폴리펩타이드가 본원에서 구체적으로 예시된 폴리펩타이드와 실질적으로 동일한 관련된 기능적 활성을 보유하는 한 본 발명의 범위 내에 포함된다. 예를 들어, 폴리펩타이드의 기능에 영향을 미치지 않는, 폴리펩타이드 내에서의 보존적 아미노산 치환이 본 발명의 범위 내에 포함될 것이다. 따라서, 본원에 개시된 폴리펩타이드는 상기 고찰된 바와 같이 구체적으로 예시된 서열의 변이체 및 단편을 포함하는 것으로 이해되어야 한다. 본 발명은 본원에 개시된 폴리펩타이드를 인코딩하는 뉴클레오타이드 서열을 더 포함한다. 이들 뉴클레오타이드 서열은 본원에 제시된 단백질 및 아미노산 서열에 대한 지식을 갖고 있는 당업자에 의해 쉽게 구축될 수 있다. 당업자가 이해하게 될 바와 같이, 유전자 코드의 축퇴성은 당업자로 하여금, 특정 폴리펩타이드 또는 단백질을 인코딩하는 여러 가지 뉴클레오타이드 서열들을 구축할 수 있게 한다. 특정 뉴클레오타이드 서열에 대한 선택은 예를 들어, 특정 발현 시스템 또는 숙주 세포의 코돈 사용빈도(codon usage)에 따라 다를 수 있었다. 구체적으로 예시된 것 이외의 아미노산 치환을 본 발명의 폴리펩타이드에 가진 폴리펩타이드 또한, 본 발명의 범위 내에 포함되는 것으로 고려된다. 예를 들어, 본 발명의 폴리펩타이드의 아미노산은, 치환된 아미노산을 가진 폴리펩타이드가 아미노산이 치환되지 않은 폴리펩타이드와 실질적으로 동일한 활성을 보유하는 한, 비-천연 아미노산으로 치환될 수 있다. 비-천연 아미노산의 예로는, 오르니틴, 시트룰린, 하이드록시프롤린, 호모세린, 페닐글리신, 타우린, 요오도티로신, 2,4-다이아미노부티르산, a-아미노 이소부티르산, 4-아미노부티르산, 2-아미노 부티르산, γ-아미노 부티르산, ε-아미노 헥산산, 6-아미노 헥산산, 2-아미노 이소부티르산(isobutyiic acid), 3-아미노 프로피온산, 노르류신(norleucine), 노르발린(norvaline), 사르코신(sarcosine), 호모시트룰린, 시스테산(cysteic acid), τ-부틸글리신, τ-부틸알라닌, 페닐글리신, 사이클로헥실알라닌, β-알라닌, 플루오로-아미노산, 디자이너 아미노산, 예컨대 β-메틸 아미노산, C-메틸 아미노산, N-메틸 아미노산, 및 일반적인 아미노산 유사체 등이 있으나, 이들로 한정되는 것은 아니다. 비-천연 아미노산은 또한, 유도체화된 측기(derivatized side group)를 가진 아미노산을 포함한다. 더욱이, 단백질 내 임의의 아미노산은 D(우선성(dextrorotary)) 형태 또는 L(좌선성(levorotary)) 형태일 수 있다. 아미노산은 일반적으로 하기 부류들: 비극성, 비전하성 극성, 염기성 및 산성으로 분류될 수 있다. 하나의 부류의 아미노산을 가진 폴리펩타이드가 동일한 부류의 또 다른 아미노산으로 대체되는 보존적 치환은, 상기 치환을 가진 폴리펩타이드가 상기 치환을 갖지 않은 폴리펩타이드와 동일한 생물학적 활성을 여전히 실질적으로 보유하는 한, 본 발명의 범위 내에 포함된다. 표 1은 각각의 부류에 속하는 아미노산의 예들의 목록을 제공한다.
Figure 112017095877839-pct00002
또한, 폴리뉴클레오타이드 서열 내에서의 뉴클레오타이드 치환, 첨가 또는 결실을 제외하고는 본원에 예시된 폴리뉴클레오타이드와 동일한 뉴클레오타이드 서열을 가진 폴리뉴클레오타이드는, 이들 변이체 폴리뉴클레오타이드가 본원에 구체적으로 예시된 폴리뉴클레오타이드와 실질적으로 동일한 관련된 기능적 활성을 보유하는 한, 본 발명의 범위 내에 포함된다(예를 들어, 이들은 예시된 폴리뉴클레오타이드에 의해 인코딩되는 것과 동일한 아미노산 서열 또는 동일한 기능적 활성을 가진 단백질을 인코딩함). 따라서, 본원에 개시된 폴리뉴클레오타이드는 상기 고찰된 바와 같이 구체적으로 예시된 서열의 변이체 및 단편을 포함하는 것으로 이해되어야 한다.
본 발명은 또한, 표준의 엄격한 조건 및 표준 방법 하에 본 발명의 폴리뉴클레오타이드 서열과의 혼성화를 허용하기 위해 해당 서열과 충분히 상동성인 서열을 가진 폴리뉴클레오타이드 분자를 고려한다(문헌[Maniatis, T. et al, 1982]). 본원에 기재된 폴리뉴클레오타이드는 또한, 본원에 예시된 폴리뉴클레오타이드와 보다 특정한 동일성 및/또는 유사성 범위 측면에서 정의될 수 있다. 서열 동일성은 전형적으로 60% 초과, 바람직하게는 75% 초과, 보다 바람직하게는 80% 초과, 보다 더 바람직하게는 90% 초과일 수 있고, 95% 초과일 수 있다. 서열의 동일성 및/또는 유사성은 본원에 예시된 서열과 비교하여 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그보다 클 수 있다. 다르게 명시되지 않는 한 본원에 사용된 바와 같이, 2개의 서열들의 서열 동일성% 및/또는 유사성%는 Karlin 및 Altschul(1993)에서 변형된 Karlin 및 Altschul(1990)의 알고리즘을 사용하여 확인될 수 있다. 이러한 알고리즘은 Altschul 등(1990)의 NBLAST 및 XBLAST 프로그램 내로 통합된다. 요망되는 서열 동일성%를 가진 서열을 수득하기 위해 BLAST 검색은 NBLAST 프로그램을 이용하여 수행될 수 있으며, 여기서 점수 = 100, 단어길이 = 12이다. 비교용의 갭핑된 정렬(gapped alignment)을 수득하기 위해, 갭핑된 BLAST가 Altschul 등(1997)에 기재된 바와 같이 사용될 수 있다. BLAST 및 갭핑된 BLAST 프로그램을 이용할 때, 각각의 프로그램(NBLAST 및 XBLAST)의 디폴트 파라미터가 사용될 수 있다. NCBI/NIH 웹사이트를 참조한다.
본 발명은 또한, 본 발명의 벡터 시스템, 바이러스 벡터 시스템 또는 숙주 세포를 약제학적으로 허용가능한 담체, 희석제, 부형제 또는 보조제와 선택적으로 조합하여 포함하는 약제학적 조성물에 관한 것이다. 약제학적 담체, 부형제 또는 희석제의 선택은 의도된 투여 경로 및 표준 약제학적 실시의 측면에서 선택될 수 있다. 약제학적 조성물은 담체, 부형제 또는 희석제로서 - 또는 이것들 외에도 - 임의의 적합한 결합제(들), 윤활제(들), 현탁제(들), 코팅제(들), 가용화제(들), 및 표적 부위 내로의 바이러스 도입을 돕거나 증가시킬 수 있는 다른 담체 제제(예를 들어, 지질 전달 시스템)를 포함할 수 있다. 구축물 또는 벡터는 생체내 또는 생체외로 투여될 수 있다.
소정량의 화합물을 포함하며 국소 또는 비경구 투여용으로 맞춰진 약제학적 조성물은 본 발명의 바람직한 실시형태를 구성한다. 비경구 투여에 있어서, 조성물은 멸균 수용액 형태에서 최상으로 사용될 수 있으며, 이러한 수용액은 다른 성분들, 예를 들어 용액을 혈액과 등장성으로 만들기에 충분한 염 또는 단당류를 함유할 수 있다. 본 발명의 약제학적 조성물은 선호할만하게는 망막하 주사를 통해 망막에 전달될 수 있거나, 또는 상기 조성물은 또한, 비-침습적인 절차를 통해 망막에 전달될 수 있는 주사용 현탁액, 안약(eye lotion) 또는 안 연고 형태로 제조될 수 있다.
본 발명의 맥락에서 환자, 특히 인간에게 투여되는 용량은 치사 독성 없이, 바람직하게는 부작용 또는 사망률(morbidity)을 허용 가능한 수준 이하로 유발하면서, 환자에서 합리적인 시간 프레임에 걸쳐 치료 반응을 달성하기에 충분해야 한다. 당업자는, 투여량이 대상의 (건강) 상태, 대상의 체중, 동시 수행되는(concurrent) 치료가 있다면 그 종류, 치료 빈도, 치료비(therapeutic ratio), 뿐만 아니라 병리학적 질환의 중증도 및 단계를 포함한 여러 가지 인자들에 따라 다를 것임을 인지할 것이다.
본 발명의 방법은 인간 및 다른 동물에게 사용될 수 있다. 본원에 사용된 바와 같이, 용어 "환자" 및 "대상"는 상호호환적으로 사용되고, 이러한 인간 및 비-인간 종을 포함하고자 한다. 마찬가지로, 본 발명의 시험관내 방법은 이러한 인간 및 비-인간 종의 세포 상에서 수행될 수 있다.
본 발명은 또한, 본 발명의 구축물 시스템, 바이러스 벡터 시스템 또는 숙주 세포를 하나 이상의 용기에 포함하는 키트에 관한 것이다. 본 발명의 키트는 약제학적으로 허용가능한 담체 및/또는 희석제를 선택적으로 포함할 수 있다. 일 실시형태에서, 본 발명의 키트는 본원에 기재된 바와 같은 하나 이상의 다른 구성성분, 부가물 또는 보조제를 포함한다. 일 실시형태에서, 본 발명의 키트는 상기 키트의 벡터 시스템을 투여하는 방법을 기재하고 있는 지침서 또는 패키징 물질을 포함한다. 키트의 용기는 임의의 적합한 물질, 예를 들어 유리, 플라스틱, 금속 등으로 제작된 것이며 임의의 적합한 크기, 모양 또는 배치로 제작된 것일 수 있다. 일 실시형태에서, 본 발명의 구축물 시스템, 바이러스 벡터 시스템 또는 숙주 세포는 키트에서 고형으로서 제공된다. 또 다른 실시형태에서, 본 발명의 구축물 시스템, 바이러스 벡터 시스템 또는 숙주 세포는 키트에서 액체 또는 용액으로서 제공된다. 일 실시형태에서, 키트는 본 발명의 구축물 시스템, 바이러스 벡터 시스템 또는 숙주 세포를 액체 또는 용액 형태로 함유하는 앰플 또는 주사기를 포함한다.
본 발명은 또한, 유전자 치료법에 의해 개체를 치료하기 위한 약제학적 조성물을 제공하며, 여기서, 본 조성물은 본 발명의 벡터 시스템, 바이러스 벡터 시스템 또는 숙주 세포에 의해 생성되거나 이로부터 수득되는 하나 이상의 전달 가능한 치료적 및/또는 진단적 이식유전자(들) 또는 바이러스 입자를 포함하는 상기 벡터 시스템, 바이러스 벡터 시스템 또는 숙주 세포를 치료적 유효량으로 포함한다. 약제학적 조성물은 인간 또는 동물에게 사용하기 위한 것일 수 있다. 전형적으로, 일반적으로 숙련된 임상의는, 개별 대상에게 가장 적합할 뿐만 아니라 특정 개체의 연령, 체중 및 반응성 및 투여 경로에 따라 달라질 실제 투여량을 결정할 것이다. 투약 범위는 각각의 벡터의 1x10e10개 내지 1x10e15개 게놈 복사체/kg이며, 선호할만하게는 각각의 벡터의 1x10e11개 내지 1x10e13개 게놈 복사체/kg가 인간에서 효과적인 것으로 예상된다. 투약 범위는 각각의 벡터의 1x10e10개 내지 1x10e15개 게놈 복사체/눈(eye)이며, 선호할만하게는 1x10e10개 내지 1x10e13개가 안내(ocular) 투여에 효과적인 것으로 예상된다.
투여량 섭생 및 투여되어야 하는 유효량은 일반적으로 숙련된 임상의에 의해 결정될 수 있다. 투여는 단일 투약 또는 다중 투약 형태일 수 있다. 폴리뉴클레오타이드, 발현 구축물 및 벡터를 사용하여 유전자 치료법을 수행하는 일반적인 방법은 당업계에 알려져 있다(예를 들어 문헌[Gene Therapy: Principles and Applications, Springer Verlag 1999]; 및 미국 특허 6,461,606, 6,204,251 및 6,106,826 참조). 본 발명은 또한, 선택된 폴리펩타이드를 세포에서 발현시키는 방법에 관한 것이다. 일 실시형태에서, 본 방법은 선택된 폴리펩타이드를 인코딩하는 폴리뉴클레오타이드 서열을 포함하는 본 발명의 벡터 시스템을 세포에 혼입시키는 단계, 및 상기 폴리뉴클레오타이드 서열을 상기 세포에서 발현시키는 단계를 포함한다. 선택된 폴리펩타이드는 세포에 대해 이종성인 폴리펩타이드일 수 있다. 일 실시형태에서, 세포는 포유류 세포이다. 일 실시형태에서, 세포는 인간 세포이다. 일 실시형태에서, 세포는 광수용기 세포 또는 RPE 세포이다. 세포는 또한, 근육 세포, 특히 골격근 세포, 폐 세포, 췌장 세포, 간 세포, 신장 세포, 장(intestine) 세포, 혈액 세포일 수 있다. 구체적인 실시형태에서, 세포는 추상 세포 또는 간상 세포이다. 구체적인 실시형태에서, 세포는 인간 추상 세포 또는 간상 세포이다.
서열
AP1 (서열 번호 24)
AP2 (서열 번호 25)
AK seqA (서열 번호 22)
AK seqB (서열 번호 23)
AP(서열 번호 26)
좌측 ITR2 (서열 번호 29)
우측 ITR2 (서열 번호 30)
좌측 ITR5 (서열 번호 31)
우측 ITR5 (서열 번호 32)
CMV
CMV 인핸서 (서열 번호 33)
CMV 프로모터 (서열 번호 34)
키메라 인트론 (SV40 인트론 ) (서열 번호 35)
hGRK1 프로모터 (서열 번호 36)
CBA 하이브리드 프로모터
CMV 인핸서 (서열 번호 37)
CBA 프로모터 (서열 번호 38)
IRBP (서열 번호 39)
스플라이싱 공여자 신호 (서열 번호 27)
miR-let 7b 분해 신호 (서열 번호 40)
4xmiR-let 7b 분해 신호 (서열 번호 41)
miR-26a 분해 신호 (서열 번호 13)
4xmiR-26a 분해 신호 (서열 번호 18)
miR-204 분해 신호 (서열 번호 11)
miR-124 분해 신호 (서열 번호 12)
3xmiR-204+3xmiR-124 분해 신호 (서열 번호 17)
CL1 분해 신호 (데그론)
뉴클레오타이드 서열: (서열 번호 16)
아미노산 서열: (서열 번호 1)
CL2 분해 신호 (데그론)
뉴클레오타이드 서열: (서열 번호 42)
아미노산 서열: (서열 번호 2)
CL6 분해 신호 (데그론)
뉴클레오타이드 서열: (서열 번호 43)
아미노산 서열: (서열 번호 3)
CL9 분해 신호 (데그론)
뉴클레오타이드 서열: (서열 번호 44)
아미노산 서열: (서열 번호 4)
CL10 분해 신호 (데그론)
뉴클레오타이드 서열: (서열 번호 45)
아미노산 서열: (서열 번호 5)
CL11 분해 신호 (데그론)
뉴클레오타이드 서열: (서열 번호 46)
아미노산 서열: (서열 번호 6)
CL12 분해 신호 (데그론)
뉴클레오타이드 서열: (서열 번호 47)
아미노산 서열: (서열 번호 7)
CL15 분해 신호 (데그론)
뉴클레오타이드 서열: (서열 번호 48)
아미노산 서열: (서열 번호 8)
CL16 분해 신호 (데그론)
뉴클레오타이드 서열: (서열 번호 49)
아미노산 서열: (서열 번호 9)
SL17 분해 신호 (데그론)
뉴클레오타이드 서열: (서열 번호 50)
아미노산 서열: (서열 번호 10)
PB29 분해 신호 (데그론)
뉴클레오타이드 서열: (서열 번호 19)
아미노산 서열: (서열 번호 15)
짧은 PB29 분해 신호 (데그론)
뉴클레오타이드 서열: (서열 번호 20)
아미노산 서열: (서열 번호 14)
3x PB29 분해 신호 (데그론) (서열 번호 21)
인공 정지 코돈 (서열 번호 51)
스플라이싱 수여자 신호 (서열 번호 28)
SV40 폴리 A (서열 번호 52)
ABCA4 5' (서열 번호 53)
hGRK1-5' ABCA4+AK+CL1 전장 서열 (서열 번호 54)
Figure 112017095877839-pct00003
Figure 112017095877839-pct00004
Figure 112017095877839-pct00005
범례:
ITR: 대문자 볼드체
hGRK 프로모터: 소문자 볼드 이탤릭체
ABCA4 5': 소문자 밑줄
SDS: 소문자 볼드체
AK: 대문자
CL1: 소문자 이탤릭체 밑줄
Figure 112017095877839-pct00006
Figure 112017095877839-pct00007
범례:
ITR: 대문자 볼드체 밑줄
AK: 대문자
SAS: 소문자 볼드체
ABCA4 3': 소문자 밑줄
SV40 polyA: 소문자 볼드 이탤릭체
CMV 5' ABCA4 -SD-AK 전장 서열 (서열 번호 57)
AK-SA-3' ABCA4-3XFLAG-SV40 전장 서열 (서열 번호 58).
CMV 5' ABCA4-SD-AP1 전장 서열 (서열 번호 59)
AP1-SA-3' ABCA4-3XFLAG-SV40 전장 서열 (서열 번호 60)
CMV 5' ABCA4-SD-AP2 전장 서열 (서열 번호 61)
AP2-SA-3' ABCA4-3XFLAG-SV40 전장 서열 (서열 번호 62)
CMV 5' ABCA4-SD-AP 전장 서열 (서열 번호 63)
AP-SA-3' ABCA4-3XFLAG-SV40 전장 서열 (서열 번호 64)
hGRK1 5' ABCA4-SD-AP1 전장 서열 (서열 번호 65)
GRK1 5' ABCA4-SD-AP2 전장 서열 (서열 번호 66)
ITR5-CMV 5' ABCA4-SD-AK-ITR2 전장 서열 (서열 번호 67)
ITR2-AK-SA-3' ABCA4-SV40-ITR5 전장 서열 (서열 번호 68)
ITR5-CBA 5' MYO7A-SD-AK-ITR2 전장 서열 (서열 번호 69)
ITR2-AK-SA-3' MYO7A-HA-BGH-ITR5 전장 서열 (서열 번호 70)
CMV 5' ABCA4-3XFLAG-SD-AK-4xmiR26a 전장 서열 (서열 번호 71)
CMV 5' ABCA4-3XFLAG-SD-AK-3xmiR204+3xmir124 전장 서열 (서열 번호72)
CMV 5' ABCA4-3XFLAG-SD-AK-CL1 전장 서열 (서열 번호 73)
AK-STOP-SA-3' ABCA4-3XFLAG-SV40 전장 서열 (서열 번호 74)
AK-PB29-SA-3' ABCA4-3XFLAG-SV40 전장 서열 (서열 번호 75)
AK-3XPB29-SA-3' ABCA4-3XFLAG-SV40 전장 서열 (서열 번호 76)
AK-유비퀴틴-SA-3' ABCA4-3XFLAG-SV40 전장 서열 (서열 번호 77).
본 발명은 이제 하기 도면을 참조로 하여 비제한적인 실시예에 의해 예시될 것이다.
도 1. 본 발명의 실시예의 다중-벡터 전략의 모식도이다. ITR: 반전 말단 반복부; Prom: 프로모터; CDS, 코딩 서열; SD, 스플라이싱 공여자 신호; RR: 재조합유전성 영역, AK 또는 알칼리 포스파타제(AP1, AP2 및 AP); Deg Sig; 분해 신호(표 2 참조); SA, 스플라이싱 수여자 신호; pA, 폴리아데닐화 신호. 도 1A 및 도 1C: 트랜스스플라이싱 및 재조합유전성 영역을 포함하는 (이중 또는 삼중) 하이브리드 벡터 전략이며, 본 발명의 바람직한 실시형태에 따르면 도 1B 및 도 1D: (이중 또는 삼중) 벡터 오버래핑 벡터 전략이다. 부가적인 예들에 대해서는, 도 12 내지 도 14를 참조한다.
도 2. 상동성의 AK, AP1 및 AP2 영역을 사용한 효율적인 ABCA4 단백질 발현
(도 2a, 도 2c)는 ABCA4를 인코딩하는 (도 2a) 이중 AAV2/2(AAV 혈청형 2로서, AAV2 유래의 상동성 ITR을 가짐) 벡터로 감염된 HEK293 세포(50 ㎍/레인), 또는 (도 2c) 이중 AAV2/8(AAV 혈청형 8로서, AAV2 유래의 상동성 ITR을 가짐) 벡터로 주사된 C57BL/6 망막(전체 망막 용해물)의 대표적인 웨스턴 블롯 분석이다. 화살표는 전장 단백질을 가리키며, 분자량 사다리는 좌측에 도시되어 있다. (도 2b)는 (도 2a)의 웨스턴 블롯 분석으로부터의 ABCA4 단백질 밴드의 정량화이다. (도 2a)에서의 ABCA4 밴드의 강도를 필라민(Filamin) A 밴드의 강도로 나누었다. 막대 그래프는 단백질의 발현을 이중 AAV 하이브리드 AK 벡터에 대한 퍼센트로서 보여주며, 평균값은 상응하는 막대의 상부에 표시되어 있다. 값은 평균 ± s.e.m.(평균의 표준 오차)으로 나타낸다. *pANOVA < 0.05; 별표는 AK, AP1 및 AP2의 유의한 차이를 가리킨다. (도 2a 내지 도 2c) AK: 이중 AAV 하이브리드 AK 벡터에 의해 감염된 세포 또는 주사된 눈; AP1: 이중 AAV 하이브리드 AP1 벡터에 의해 감염된 세포 또는 주사된 눈; AP2: 이중 AAV 하이브리드 AP2 벡터에 의해 감염된 세포 또는 주사된 눈; AP: 이중 AAV 하이브리드 AP 벡터에 의해 감염된 세포; neg: 음성 대조군으로서, 3'-하프 벡터 또는 EGFP 발현 벡터에 의해 감염된 세포 또는 주사된 눈. α-3xflag: 항-3xflag 항체를 이용한 웨스턴 블롯; α-필라민 A, 로딩 대조군으로서 사용되는 항-필라민 A 항체를 이용한 웨스턴 블롯; α-디스페린(α-Dysferlin), 로딩 대조군으로서 사용되는 항-디스페린 항체를 이용한 웨스턴 블롯.
도 3. 이종성 ITR2 및 ITR5를 가진 벡터의 게놈 및 형질도입 효율
(도 3a)는 상동성(2:2) 또는 이종성(5:2 또는 2:5) ITR을 가진 3 x 1010 GC의 5'-ABCA4-하프 벡터 및 3'-ABCA4-하프 벡터 둘 다로부터 추출한 DNA, 및 상동성 ITR2를 가진 대조군 AAV 조제물(CTRL)의 알칼리 서던 블롯 분석이다. 각각의 게놈의 예상된 크기는 각각의 레인 아래에 표시되어 있다. 분자량 마커(kb)는 좌측 5': 5'-하프 벡터; 3': 3'-하프 벡터 상에 표시되어 있다. (도 3b 내지 도 3d)는 ITR2 역가(도 3b 및 도 3c) 또는 이식유전자 역가(도 3b 및 도 3d)를 기반으로 한 m.o.i.에서 이종성 ITR2 및 ITR5, 또는 상동성 ITR2를 가진 이중 AAV2/2 하이브리드 ABCA4 벡터에 의해 감염된 HEK293 세포의 대표적인 웨스턴 블롯 분석 및 정량화이다. 웨스턴 블롯 이미지(도 3b)는 n = 3개의 독립적인 실험을 대표하며; 정량화(도 3c 및 도 3d)는 n = 3개의 독립적인 실험으로부터 유래된 것이다. (도 3b)에서, 상부 화살표는 전장 ABCA4 단백질을 가리키고, 하부 화살표는 절단된 단백질을 가리키며; 분자량 사다리는 좌측 상에 표시되어 있다. 로딩된 단백질의 ㎍은 이미지 아래에 표시되어 있다. α-3xflag: 항-3xflag 항체를 이용한 웨스턴 블롯이며; α-필라민 A: 로딩 대조군으로서 사용된 항-필라민 A 항체를 이용한 웨스턴 블롯이다. (도 3c 및 도 3d)는 ITR2 역가(도 3c) 또는 이식유전자 역가(도 3d)를 기반으로 한 용량의 벡터에 의해 감염된 세포의 웨스턴 블롯으로부터, 전장 ABCA4 단백질 및 절단된 ABCA4 단백질의 밴드를 정량화한 것이다. 막대 그래프는, 필라민 A 밴드의 강도로 나눈 전장 단백질 및 절단된 단백질 밴드의 강도, 또는 절단된 단백질 밴드의 강도로 나눈 전장 단백질 밴드의 강도를 상응하는 레인에 보여준다. MYO7A를 인코딩하는 이종성 ITR2 및 ITR5, 또는 상동성 ITR2를 가진 이중 AAV2(AAV 혈청형 2) 하이브리드 벡터에 의해 감염된 HEK293 세포의 대표적인 웨스턴 블롯 분석 및 정량화가 도시되어 있다(도 3e, 도 3f). 웨스턴 블롯 이미지(도 3e)는 대표적인 것이고, 정량화(도 3f)는 n = 3개의 독립적인 실험으로부터 유래된 것이다. (도 3e)에서, 상부 화살표는 전장 단백질을 가리키며, 하부 화살표는 절단된 단백질을 가리키고, 분자량 사다리는 좌측 상에 표시되어 있다. 로딩된 단백질의 ㎍은 이미지의 아래에 표시되어 있다. (도 3f)는 웨스턴 블롯 분석으로부터의 MYO7A 단백질 밴드의 정량화이다.
평균값은 상응하는 막대 위에 표시되어 있다. 값은 평균 ± s.e.m.으로서 나타나 있다. *p 스튜던츠 t 테스트 ≤ 0.05.
2:2 2:2: AAV2 유래의 상동성 ITR을 가진 이중 AAV 하이브리드 벡터에 의해 감염된 세포; 5:2 2:5: AAV2 및 AAV5 유래의 이종성 ITR을 가진 이중 AAV 하이브리드 벡터에 의해 감염된 세포; neg: 음성 대조군으로서, EGFP-발현 벡터에 의해 감염된 세포이다.
도 4. 5'-하프 벡터에 miR 표적 부위를 포함시키는 것은 절단된 단백질 생성물을 유의하게 감소시키지 않는다
miR-let7b(좌측 패널), miR-204+124(중앙 패널) 또는 miR-26a(우측 패널)에 대한 miR 표적 부위를 함유하는, ABCA4를 인코딩하는 이중 AAV2/2(AAV 혈청형 2) 하이브리드 벡터에 의해 감염된 HEK293 세포의 대표적인 웨스턴 블롯 분석이 도시되어 있다. 상부 화살표는 전장 ABCA4 단백질을 가리키며, 하부 화살표는 절단된 단백질을 가리키고; 분자량 사다리는 좌측 상에 표시되어 있다. 로딩된 단백질의 ㎍은 이미지의 아래에 표시되어 있다. 5'+3': miR 표적 부위가 없는 5'-하프 벡터, 및 3'-하프 벡터에 의해 공동-감염된 세포; 5'+3'+스크램블: 스크램블(scramble) miR 모방체의 존재 하에, miR 표적 부위가 없는 5'-하프 벡터, 및 3'-하프 벡터에 의해 공동-감염된 세포; 5'mir+3': miR 표적 부위를 함유하는 5'-하프 벡터, 및 3'-하프 벡터에 의해 공동-감염된 세포; 5'mir+3'+스크램블: 스크램블 miR 모방체의 존재 하에, miR 표적 부위를 함유하는 5'-하프 벡터, 및 3'-하프 벡터에 의해 공동-감염된 세포; 5'mir+3'+모방체 let7b: mir-let7b 모방체의 존재 하에, miR 표적 부위를 함유하는 5'-하프 벡터, 및 3'-하프 벡터에 의해 공동-감염된 세포; 5': miR 표적 부위가 없는 5'-하프 벡터에 의해 감염된 세포; 5'mir: 스크램블 miR 모방체의 존재 하에, miR 표적 부위를 함유하는 5'-하프 벡터에 의해 감염된 세포; 5'mir+모방체 let7b: mir-let7b 모방체의 존재 하에, miR 표적 부위를 함유하는 5'-하프 벡터에 의해 감염된 세포; neg: 3'-하프 벡터 또는 EGFP-발현 벡터에 의해 감염된 대조군 세포; 5'mir+3'+모방체 204+124: mir-204 및 124 모방체의 존재 하에, miR 표적 부위를 함유하는 5'-하프 벡터, 및 3'-하프 벡터에 의해 공동-감염된 세포; 5'mir+모방체 204+124: mir-204 및 124 모방체의 존재 하에, miR 표적 부위를 함유하는 5'-하프 벡터에 의해 감염된 세포; 5'mir+3'+모방체 26a: mir-26a 모방체의 존재 하에, miR 표적 부위를 함유하는 5'-하프 벡터, 및 3'-하프 벡터에 의해 공동-감염된 세포; 5'mir+모방체 26a: mir-26a 모방체의 존재 하에, miR 표적 부위를 함유하는 5'-하프 벡터에 의해 감염된 세포이다. α-3xflag: 항-3xflag 항체를 이용한 웨스턴 블롯이며; α-필라민 A는 로딩 대조군으로서 항-필라민 A 항체를 이용한 웨스턴 블롯이다.
스크램블 서열은 상이한 miRNA의 서열에 상응하며, 예를 들어 mir-let7b 모방체를 이용한 실험에서 스크램블 서열은 miR26a의 서열이었다.
도 5. 5'-하프 벡터에 CL1 분해 신호를 포함시키는 것은 절단된 단백질 생성물을 유의하게 감소시킨다
ABCA4를 인코딩하고 CL1 분해 신호를 함유하거나 또는 함유하지 않는 (도 5a) 이중 AAV2/2(AAV 혈청형 2로서, AAV2 유래의 상동성 ITR을 가짐) 하이브리드 벡터에 의해 감염된 HEK293 세포, 또는 (도 5b) 이중 AAV2/8(AAV 혈청형 8로서, AAV2 유래의 상동성 ITR을 가짐) 하이브리드 벡터를 주사한 후 1개월째의 돼지 눈(RPE+망막)에 대한 대표적인 웨스턴 블롯 분석이 도시되어 있다. 상부 화살표는 전장 ABCA4 단백질을 가리키며, 하부 화살표는 5'-하프 벡터로부터 절단된 단백질을 가리키고; 분자량 사다리는 좌측 상에 표시되어 있다. 로딩된 단백질의 ㎍은 각각의 이미지 아래에 표시되어 있다. 5'+3': CL1이 없는 5'-하프 벡터 및 3'-하프 벡터에 의해 공동-감염된 세포 또는 공동-주사된 눈; 5'-CL1+3': CL1을 함유하는 5'-하프 벡터, 및 3'-하프 벡터에 의해 공동-감염된 세포 또는 공동-주사된 눈; 5': CL1이 없는 5'-하프 벡터에 의해 감염된 세포; 5'-CL1: CL1을 함유하는 5'-하프 벡터에 의해 감염된 세포; neg: 음성 대조군으로서, 3'-하프 벡터 또는 EGFP-발현 벡터에 의해 감염된 대조군 세포 또는 주사된 대조군 눈; α-3xflag: 항-3xflag 항체를 이용한 웨스턴 블롯이며; α-필라민 A: 로딩 대조군으로서 사용된 항-필라민 A 항체를 이용한 웨스턴 블롯이고; α-디스페린: 로딩 대조군으로서 사용된 항-디스페린 항체를 이용한 웨스턴 블롯이다. (도 5a)에서, 웨스턴 블롯 이미지는 n = 3개의 독립적인 실험을 대표한다. (도 5b)에서, 웨스턴 블롯 이미지는 5'+3' 벡터가 주사된 n = 5개의 눈, 5'-CL1+3' 벡터가 주사된 n = 2개의 눈, 및 음성 대조군으로서 3'-하프 벡터 또는 EGFP-발현 벡터가 주사된 n = 5개의 눈을 대표한다.
도 6. 3'-하프 벡터에 분해 신호를 포함시키는 것은 절단된 단백질 생성물을 약간 감소시킨다
ABCA4를 인코딩하고 상이한 분해 신호를 함유하는 이중 AAV2/2 하이브리드 벡터에 의해 감염된 HEK293 세포에 대한 대표적인 웨스턴 블롯 분석이 도시되어 있다. 상부 화살표는 전장 ABCA4 단백질을 가리키며, 하부 화살표는 절단된 단백질 생성물을 가리키고; 분자량 사다리는 좌측 상에 표시되어 있다. 로딩된 단백질의 ㎍은 각각의 이미지 아래에 표시되어 있다. 5'+3': 분해 신호 없이, 5'-하프 벡터 및 3'-하프 벡터에 의해 공동-감염된 세포; 5': 5'-하프 벡터에 의해 감염된 세포; 3'(표지 없음): 분해 신호 없이 3'-하프 벡터에 의해 감염된 세포; 정지(STOP): 정지 코돈을 함유하는 3'-하프 벡터에 의해 감염된 세포; PB29: PB29 분해 신호를 함유하는 3'-하프 벡터에 의해 감염된 세포; 3xPB29: PB29 분해 신호의 3개의 탠덤 복사체를 함유하는 3'-하프 벡터에 의해 감염된 세포; 유비퀴틴: 유비퀴틴 분해 신호를 함유하는 3'-하프 벡터에 의해 감염된 세포이다. α-3xflag: 항-3xflag 항체를 이용한 웨스턴 블롯이며; α-필라민 A: 로딩 대조군으로서 항-필라민 A 항체를 이용한 웨스턴 블롯이다.
7: 본 발명의 바람직한 실시형태에 사용된 ALPP(태반 알칼리 포스파타제) 유래의 상동성의 AP, AP1 및 AP2 영역의 모식도이다. CDS: 코딩 서열이다.
도 8: 개선된 이중 AAV 벡터의 망막하 전달은 마우스 광수용기에서 ABCA4 발현, 및 Abca4 -/- 마우스 망막에서 리포푸신 ( lipofuscin ) 축적의 유의한 감소를 초래한다. (도a)는 이중 AAV2/8 하이브리드 ABCA4 벡터(5' + 3') 또는 음성 대조군(neg)이 주사된 C57BL/6 망막(전체 망막 용해물)의 대표적인 웨스턴 블롯 분석이다. 화살표는 전장 단백질을 가리키고, 분자량 사다리는 좌측 상에 표시되어 있다. α-3xflag: 항-3xflag 항체를 이용한 웨스턴 블롯이며; α-디스페린: 로딩 대조군으로서 사용된 항-디스페린 항체를 이용한 웨스턴 블롯이다. (도 8b 및 도 8c)는, 대조군으로서 주사되지 않거나 또는 AAV가 주사된 유색(pigmented) Abca4+/- 마우스(Abca4+/-), 또는 주사되지 않거나(Abca4-/-) 또는 이중 AAV 하이브리드 ABCA4 벡터가 주사된 유색 Abca4-/- 마우스(Abca4-/- AAV5'+3')의 망막(RPE 또는 RPE + OS)에서 리포푸신 자가형광(적색 신호)에 대한 대표적인 도면(도 8b) 및 정량화(도 8c)이다. (도 8b)에서, 축척 막대(75 ㎛)가 도면에 표시되어 있다. RPE: 망막 색소 상피; ONL: 외과립층(outer nuclear layer); INL: 내과립층(inner nuclear layer); GCL: 신경절 세포층. 화살표는 리포푸신 신호를 가리킨다. (도 8c)는 각각의 시료에 대한 3개의 박편들의 측두측(temporal side)에서의 평균 리포푸신 자가형광이다. 각각의 박편에서의 평균 자가형광을 기저 RPE의 길이에 대하여 정규화하였다. 평균값은 상응하는 막대 위에 표시되어 있다. 값은 평균 ± s.e.m.으로서 나타나 있다. ***p ANOVA < 0.0001. 각각의 그룹에 대해 n = 4개의 눈. (도 8d)는, 주사되지 않거나(Abca4+/+ not inj) 또는 PBS가 주사된 알비노 Abca4+/+ 마우스(Abca4+/+ PBS), 및 PBS가 주사되거나(Abca4-/- PBS) 또는 이중 AAV 하이브리드 ABCA4 벡터가 주사된 알비노 Abca4-/- 마우스(Abca4-/- AAV5'+3')의 1개 망막 당 적어도 40개의 필드(25 ㎛2)에서 계수된 RPE 리포푸신 과립의 평균 수이다. 평균값은 상응하는 막대 위에 표시되어 있다. 값은 평균 ± s.e.m.으로서 나타나 있다. *pANOVA ≤ 0.05; **pANOVA ≤0.01. Abca4+/+ not inj로부터 n = 4개의 눈; Abca4+/+ PBS로부터 n = 4개의 눈; Abca4-/- PBS로부터 n = 3개의 눈; Abca4-/- AAV5'+ 3'로부터 n = 3개의 눈.
도 9: 마우스 및 돼지의 음성 대조군 또는 개선된 이중 AAV -처리된 눈 사이의 유사한 전기적 활성이다. (도 9a)는 이중 AAV 하이브리드 ABCA4 벡터(AAV5'+ 3') 또는 음성 대조군(즉, 음성 대조군 AAV 벡터 또는 PBS; neg)을 주사한 후 1개월째에, C57BL/6 마우스의 평균 a-파(좌측 패널) 및 b-파(우측 패널)의 진폭이다. 데이터는 평균 ± s.e.m.으로 제시되어 있으며; n은 분석된 눈의 갯수를 가리킨다.
(도 9b)는 이중 AAV 하이브리드 ABCA4 벡터(AAV5'+ 3') 또는 PBS를 주사한 후 1개월째에, 돼지에서 암순응(scotopic), 최대 반응, 명순응(photopic) 및 깜박거림 ERG 시험에서의 평균 b-파 진폭(μV)이다. 이중 AAV 하이브리드 ABCA4 벡터가 주사된 n = 5개의 눈; PBS가 주사된 n = 4개의 눈; *: n = 2.
도 10: 돼지의 간상체 광수용기 및 추상체 광수용기에서 IRBP 프로모터 및 GRK1 프로모터로부터의 EGFP 단백질 발현이다. 3월령의 라지 화이트종(Large White) 돼지 마우스에, AAV2/8-IRBP-EGFP 벡터 또는 AAV2/8-GRK1-EGFP 벡터를 각각 1x1011 GC/눈(eye)으로 망막하 주사하였다. 주사 후 4주째에 망막 냉동박편(cryosection)을 수득하고, 형광 현미경을 사용하여 EGFP를 분석하였다. (도 10a 내지 도 10b)는 PR 층에서의 형광 강도의 대표적인 이미지(도 10a) 및 정량화(도 10b)이다. 각각의 동물 그룹에 대해, 냉동박편 상에서의 형광 강도를 정량화하였다(6개의 상이한 필드/눈; 20x 배율). (도 10c 내지 도 10d)는 추상체 형질도입 효율에 대한 대표적인 이미지(도 10c) 및 정량화(도 10d)이다. 추상체 형질도입 효율을, 항-LUMIf-hCAR 항체를 이용하여 면역염색한 냉동박편(6개의 상이한 필드/눈; 63x 배율) 상에서 평가하였으며, 각각의 필드에서 추상체(CAR+)의 총 수를 기준으로 하여 EGFP를 발현하는 추상체(EGFP+/CAR+)의 수로서 표현한다. (도 10a, 도 10c)에서, 축척 막대가 도면에 표시되어 있다. (도 10b 내지 도 10d)에서, AAV2/8-IRBP-EGFP 벡터가 주사된 n = 3개의 눈; AAV2/8-GRK1-EGFP 벡터가 주사된 n = 3개의 눈이 있다. 값은 평균 ± s.e.m.으로서 나타나 있다. 스튜던츠 t-테스트를 사용하여 확인 시, 유의한 차이가 발견되지 않았다. OS: 외부 분절(outer segment); ONL: 외과립층; EGFP: 본래의(native) EGFP 형광; CAR: 항-추상체 어레스틴 염색(anti-cone arrestin staining); DAPI: 4',6'-다이아미디노-2-페닐인돌 염색. 화살표는 형질도입된 추상체를 가리킨다.
도 11: 개선된 이중 AAV 벡터의 망막하 전달은 Abca4 -/- 마우스 망막에서 리포푸신 축적을 유의하게 감소시킨다. 대조군으로서 주사되지 않거나 또는 AAV가 주사된 유색 Abca4+/- 마우스(Abca4+/-), 또는 주사되지 않거나(Abca4-/-) 또는 이중 AAV 하이브리드 ABCA4 벡터가 주사된 유색 Abca4-/- 마우스(Abca4-/- AAV5'+3')의 망막(RPE 또는 RPE+OS)에서 리포푸신 자가형광(적색 신호)을 보여주는 망막 단면의 측두측(주사된 면)의 이미지에 대한 몽타주가 도시되어 있다. 각각의 그룹에 대해 n = 4개의 눈. T: 측두측; N: 비측(nasal side)이다.
도 12: 마우스 및 돼지의 음성 대조군 또는 개선된 이중 AAV -처리된 눈 사이의 유사한 전기적 활성이다. (도 12a)는 이중 AAV 하이브리드 ABCA4 벡터(AAV5'+ 3') 또는 음성 대조군(즉, 음성 대조군 AAV 벡터 또는 PBS; neg)을 주사한 후 1개월째에, C57BL/6 마우스로부터의 대표적인 EFG 트레이스(trace)이다. (도 12b)는 이중 AAV 하이브리드 ABCA4 벡터(AAV5'+ 3') 또는 PBS를 주사한 후 1개월째에, 돼지에서의 암순응, 최대 반응, 명순응 및 깜박거림 ERG 시험 시, 대표적인 트레이스이다.
도 13. 본 발명의 실시예에 따른 벡터 시스템 전략의 모식도이다. (도 13a)는 본 발명의 바람직한 실시형태에 따라 2개의 벡터로 구성된 벡터 시스템의 모식도이다: 제1 벡터는 코딩 서열의 제1 부분(CDS1 부분)을 포함하며, 제2 벡터는 코딩 서열의 제2 부분(CDS2 부분)을 포함한다. (도 13A1)에서, 벡터 시스템의 재구축 서열은 코딩 서열 부분의 오버래핑 말단으로 구성된다. (도 13A2)에서, 제1 벡터 및 제2 벡터의 재구축 서열들은 각각 스플라이싱 공여자 및 스플라이싱 수여자 서열로 구성된다. (도 13A3)에서, 각각의 재구축 서열은 도 13A2에서와 같이 배열된 스플라이싱 공여자/수여자를 포함하고, 이는 재조합유전성 영역을 더 포함한다. 분해 신호가 적어도 하나의 벡터에 포함된다. 도면은 본 발명의 바람직한 비제한적인 실시형태에 따라 벡터 시스템의 하나 이상의 분해 신호의 모든 잠재적인 위치를 각각의 벡터에 대해 나타낸다.
(도 13b)는 본 발명의 바람직한 실시형태에 따라 3개의 벡터로 구성된 벡터 시스템의 모식도이다: 제1 벡터는 코딩 서열의 제1 부분(CDS1 부분)을 포함하며, 제2 벡터는 코딩 서열의 제2 부분(CDS2 부분)을 포함하고, 제3 벡터는 코딩 서열의 제3 부분(CDS3 부분)을 포함한다. (도 13B1)에서, 벡터 시스템의 재구축 서열은 코딩 서열 부분의 오버래핑 말단(CDS1의 3' 말단은 CDS2의 5' 말단과 오버래핑되고; CDS2의 3' 말단 오버래핑은 CDS3의 5' 말단과 오버래핑됨)으로 구성된다. (도 13B2)에서, 제1 벡터의 재구축 서열은 스플라이싱 공여자로 구성되며, 제1 벡터의 재구축 서열은 스플라이싱 공여자로 구성되며; 제2 벡터는 CDS2의 5' 말단에 제1 재구축 서열 및 CDS2의 3' 말단에 제2 재구축 서열을 포함하고, 제1 재구축 서열은 스플라이싱 수여자이고 제2 재구축 서열은 스플라이싱 공여자이며; 제3 벡터의 재구축 서열은 스플라이싱 수여자로 구성된다. (도 13B3)에서, 각각의 재구축 서열은 도 13B2에서와 같이 배열된 스플라이싱 공여자/수여자를 포함하고, 재조합유전성 영역을 더 포함한다. 분해 신호가 적어도 하나의 벡터에 포함된다. 도면은 본 발명의 바람직한 비제한적인 실시형태에 따라 벡터 시스템의 하나 이상의 분해 신호의 모든 잠재적인 위치를 각각의 벡터에 대해 나타낸다.
CDS, 코딩 서열; SD, 스플라이싱 공여자 신호; RR: 재조합유전성 영역; Deg Sig; 분해 신호 (표 2 참조); SA, 스플라이싱 수여자 신호.
도 14. 큰 유전자 형질도입을 위한 선행 기술의 다중 벡터-기반 전략의 모식도이다. CDS: 코딩 서열; pA: 폴리아데닐화 신호; SD: 스플라이싱 공여자 신호; SA: 스플라이싱 수여자 신호; AP: 알칼리 포스파타제 재조합유전성 영역; AK: F1 파지 재조합유전성 영역이다. 점선은 SD와 SA 사이에서 발생하는 스플라이싱을 보여주며, 포인트선(pointed line)은 상동성 재조합에 이용 가능한 오버래핑 영역들을 보여준다. 정상 크기 및 오버사이즈 AAV 벡터 플라스미드는 프로모터, 전장 이식유전자 CDS 및 폴리아데닐화 신호(pA)를 포함하는 전장 발현 카세트를 함유하였다. 이중 AAV 벡터를 생성하는 데 필요한 2개의 개별 AAV 벡터 플라스미드(5' 및 3')는 이식유전자 CDS의 N-말단 부분 앞에 프로모터(5' 플라스미드), 또는 이식유전자 CDS의 C-말단 부분 다음에 pA 신호(3' 플라스미드)를 함유하였다.
재료 및 방법
플라스미드의 생성
AAV 벡터 생성에 사용된 플라스미드는 모두, AAV 혈청형 214의 반전 말단 반복부(ITR)를 함유하는 인간 ABCA4 , 인간 MYO7A 또는 EGFP 리포터 단백질을 인코딩하는 이중 하이브리드 AK 벡터 플라스미드로부터 유래되었다.
ABCA4를 인코딩하는 벡터 플라스미드에 함유된 AK 재조합유전성 서열14을 알칼리 포스파타제 유전자로부터 유래된 3개의 상이한 재조합유전성 서열: AP(NM_001632, bp 823-110014); AP1(XM_005246439.2, bp1802-151620); AP2(XM_005246439.2, bp 1225-93820)로 대체하였다.
AAV 혈청형 2 유래의 이종성 ITR(ITR2) 및 AAV 혈청형 5 유래의 ITR(ITR5)을 5:2-2:5 배치로 갖는 이중 AAV 벡터 플라스미드는, 5'-하프 벡터 플라스미드 내의 좌측 ITR2 및 3'-하프 벡터 플라스미드 내의 우측 ITR2를 각각 ITR5(NC_006152.1, bp 1-175)로 대체함으로써 생성하였다. 이종성 ITR2 및 ITR5를 2:5 또는 5:2 배치로 갖는 이중 AAV 벡터 플라스미드는, 우측 또는 좌측 ITR2를 각각 ITR5로 대체함으로써 생성하였다. Rep5(NC_006152.1, bp 171-2206) 및 AAV2 Cap(AF043303 bp2203-2208) 유전자를 함유하는 pAAV5/2 패키징 플라스미드(Rep5Cap2)는, AAV2 유래의 Rep(AF043303 bp321-1993) 및 Cap(AF043303 bp2203-2208) 유전자를 함유하는 pAAV2/2 패키징 플라스미드(Rep2Cap2)로부터 상기 Rep2 유전자를 AAV5 유래의 Rep5 개방형 해독틀(NC_006152.1, bp 171-2206)로 대체함으로써 수득하였다.
ITR5를 가진 EGFP 발현 카세트를 함유하는 pZac5:5-CMV-EGFP 플라스미드는, EGFP 발현 카세트45 측면에 ITR2를 함유하는 pAAV2.1-CMV-EGFP 플라스미드로부터 생성하였다.
분해 신호를, ABCA4를 인코딩하는 이중 AAV 하이브리드 AK 벡터에서 하기와 같이 클로닝하였다: AK 서열과 우측 ITR2 사이에 5'-하프 벡터 플라스미드; AK 서열과 스플라이스 수여자 신호 사이에 3'-하프 벡터 플라스미드. 분해 신호 서열에 대한 상세한 사항은 표 2에서 확인할 수 있다.
표 2. 본 연구에서 사용된 분해 신호
Figure 112017095877839-pct00008
밑줄 표시된 서열은 분해 신호에 상응하며; 반복된 서열을 포함하는 분해 신호의 경우, 클로닝을 목적으로 반복된 서열들 사이에 포함된 뉴클레오타이드는 밑줄 표시가 되어 있지 않다.
이중 AAV 벡터로부터 발현된 ABCA4 단백질에, 도 3, 도 4 및 도 6에 나타낸 실험의 경우 N-말단(아미노산 위치 590) 및 C-말단 모두에서 3xflag를 태깅(tagging)하고, 도 2 및 도 8a의 실험의 경우 C-말단에서만 태깅한다.
본 연구에서 사용된 ABCA4를 인코딩하는 이중 AAV 하이브리드 벡터 세트는 유비쿼터스(ubiquitous) CMV46 프로모터 또는 PR-특이적인 인간 G 단백질-커플링된 수용체 키나제 1(GRK1)47 프로모터를 포함하였으며, 한편 MYO7A를 인코딩하는 이중 AAV 하이브리드 벡터는 유비쿼터스 CBA 프로모터39를 포함하였다.
AAV 벡터 생성 및 특성 확인
AAV 벡터 대용량 조제물을, HEK293 세포의 삼중 형질감염 및 후속해서 2회의 CsCl2 정제에 의해 TIGEM AAV 벡터 코어에 의해 제조하였다. 상동성 ITR2를 갖는 AAV 벡터를 이전에 보고된 바와 같이 수득하였다48.
이종성 ITR2 및 ITR5를 갖는 AAV 벡터를 수득하기 위해, 1.1x109개의 저-계대배양(low-passage) HEK293 세포의 현탁액을, Ad 헬퍼 유전자49를 함유하는 500 ㎍의 pDeltaF6 헬퍼 플라스미드, 260 ㎍의 pAAV cis-플라스미드 및 상이한 양의 Rep2Cap2 및 Rep5 패키징 구축물을 이용하여 칼슘 포스페이트에 의해 사중-형질감염시켰다. Rep2Cap2 및 Rep5 패키징 구축물의 양은 하기와 같았다:
(i) 프로토콜 A: 130 ㎍의 Rep5 및 130 ㎍의 Rep2Cap2 (비율 1:1)
(ii) 프로토콜 B: 90 ㎍의 Rep5 및 260 ㎍의 Rep2Cap2 (비율 1:3)
(iii) 프로토콜 C: 26 ㎍의 Rep5 및 260 ㎍의 Rep2Cap2 (비율 1:10)
그런 다음, 각각의 AAV 조제물을 공개된 프로토콜48에 따라 정제하였다.
하기 기재된 프로토콜을 Rep 경쟁 실험에 사용하였다:
1- ITR2를 가진 AAV 벡터의 제조에 있어서 Rep2와의 Rep5의 경쟁을 평가하기 위해, HEK293 세포를, pDeltaF6, pAAV2.1-CMV-EGFP cis, Rep2Cap2 및 Rep5Cap2 구축물을 2:1:1.5:1.5의 중량비로 이용하여 칼슘 포스페이트에 의해 사중-형질감염시키거나, 또는 대조군으로서 pDeltaF6, pAAV2.1-CMV-EGFP, Rep2Cap2 패키징 구축물 및 대조군 무관련(irrelevant) 플라스미드를 2:1:1.5:1.5의 중량비로 이용하여 사중-형질감염시켰으며;
2- ITR5를 가진 AAV 벡터의 제조에 있어서 Rep5와의 Rep2의 경쟁을 평가하기 위해, HEK293 세포를, pDeltaF6, pZac5:5-CMV-EGFP, Rep5Cap2 및 Rep2Cap2 구축물을 2:1:1.5:1.5의 중량비로 이용하여 칼슘 포스페이트에 의해 사중-형질감염시키거나, 또는 대조군으로서 pDeltaF6, pZac5:5-CMV-EGFP, Rep5 구축물 및 대조군 무관련 플라스미드를 2:1:1.5:1.5의 중량비로 이용하여 사중-형질감염시켰다.
대규모 AAV 벡터 조제물에 있어서, ITR2 상에 어닐링하고 있는 프로브와 함께 TaqMan(Applied Biosystem, Carlsbad, CA, USA)48을 사용한 PCR 정량화에 의해 달성된 역가, 및 ITR2로부터 1 kb 내에서 어닐링하고 있는 프로브를 이용한 도트-블롯 분석50에 의해 수득된 역가의 평균을 냄으로써, 물리적 역가[게놈 복사체(GC)/mL]를 확인하였다. 상이한 Rep5:Rep2Cap2 중량비로 제조된 대규모 AAV 벡터 조제물에 있어서, ITR2 상에 어닐링하고 있는 프로브와 함께 TaqMan을 사용한 PCR 정량화에 의해 물리적 역가[게놈 복사체(GC)/mL]를 확인하였다. 경쟁 실험에 사용된 AAV 벡터 조제물에 있어서, AAV 벡터에 패키징된 EGFP-발현 카세트에 포함된 소 성장 호르몬(BGH) 폴리아데닐화 신호 상에 어닐링하고 있는 프로브와 함께 TaqMan을 사용한 PCR 정량화에 의해 물리적 역가[게놈 복사체(GC)/mL]를 확인하였다.
HEK293 세포의 AAV 감염
HEK293 세포의 AAV 감염을 이전에 보고된 바와 같이 수행하였다14. 이종성 ITR2 및 ITR5를 가지며 프로토콜 C에 따라 제조된 AAV2 벡터를 사용하여 HEK293 세포를 감염시키되, 각각의 바이러스 조제물에 대해 달성된 최저 역가를 고려하여 계산된, 각각의 벡터 당 1x104 GC/세포의 감염 다중도(m.o.i; multiplicity of infection)(발명자들이 1:1 비율의 이중 AAV 벡터를 사용한 경우, 총 2x104 GC/세포)로 상기 세포를 감염시켰다. 재조합유전성 영역 및 분해 신호를 갖는 AAV2/2에 의한 감염을, TaqMan과 도트-블롯 사이의 평균 역가를 고려하여 계산된, 각각의 벡터 당 5x104 GC/세포의 m.o.i(1:1 비율의 이중 AAV 벡터의 경우 총 1x105 GC/세포)로 수행하였다.
miR 표적 부위를 함유하는 5'-하프 벡터를 사용한 실험의 경우, 세포를 칼슘 포스페이트를 사용하여 4시간 동안 형질감염시킨 후, 상응하는 miR 모방체(50 nM; miRIDIAN 마이크로RNA 모방체 hsa-let-7b-5p, hsa-miR-204-5p, hsa-miR-124-3p 및 hsa-miR-26a-5p; Dharmacon, Lafayette, CO, USA)를 사용하여 감염시켰다.
마우스 및 돼지에서 AAV 벡터의 망막하 주사
마우스를, 유전학 및 생물리학 동물 하우스 기관(Naples, Italy)에서 12시간 명/암 사이클(광기(light phase) 동안 10 lux 내지 50 lux에 노출됨) 하에 유지시키면서 사육하였다. C57BL/6 마우스를 Harlan Italy SRL(Udine, Italy)사로부터 구입하였다. 유색 Abca4 -/- 마우스를 알비노 Abca4-/- 마우스14와 Sv129 마우스의 연속 이종 교배를 통해 발생시키고, 동종 번식시켜 유지시켰으며; 이종성 마우스와 동종성 마우스를 이종 교배시켜 번식시켰다. 알비노 Abca4 -/- 마우스를 BALB/c 마우스(Rpe65 Leu450에 대해 동종성임)와 연속적인 이종 교배 및 역교배를 통해 발생시켰으며, 동종 번식시켜 유지시켰고; 이종성 마우스와 동종성 마우스를 이종 교배시켜 번식시켰다. C57BL/6(5주령), 유색 Abca4 -/-(5.5월령) 및 알비노 Abca4 -/-(2.5월령 내지 3월령) 마우스를 이전에 보고된 바와 같이 마취시킨 다음61, 1 ㎕의 PBS 또는 AAV2/8 벡터를 Liang 등62에 의해 보고된 바와 같이 경공막 경맥락막(trans-scleral trans-choroidal) 접근법을 통해 망막의 측두측에 망막하로 전달하였다. AAV2/5-VMD2-인간 티로시나제63(용량: 2x108 GC/눈)를, 알비노 Abca4 -/- 마우스에 망막하로 전달되는 AAV2/8 벡터 용액에 첨가하였다(도 8d). 이로써, 본 발명자들은 아이컵(eyecup)의 형질도입된 부분 내에서 RPE를 마킹할 수 있었으며, 후속해서 상기 아이컵을 해부 및 분석하였다.
이 연구에 사용된 라지 화이트종 암컷 돼지를 이탈리아 돼지 사육 협회의 LW 허드 북(LW Herd Book)에 순혈종으로서 등록시켰다. 돼지를 카르다렐리(Cardarelli) 병원 동물 하우스(Naples, Italy)에서 12시간 명/암 사이클(광기 동안 10 lux 내지 50 lux에 노출됨) 하에 유지시키면서 사육하였다. 이 연구를 안과 및 시력 연구에서의 동물의 사용에 대한 시력 및 안과학 성명에서의 연구 협회(Association for Research in Vision and Ophthalmology Statement for the Use of Animals in Ophthalmic and Vision Research), 및 동물 시술에 대한 이탈리아 보건성(Italian Ministry of Health) 법규에 따라 수행하였다. 모든 시술들을 이탈리아 보건성; 공공보건국, 동물 건강, 영양 및 식품 안전성(Italian Ministry of Health; Department of Public Health, Animal Health, Nutrition and Food Safety)에 제출하였다. 수술은 마취 하에 수행하였고, 고통을 최소화하기 위해 모든 노력을 다하였다. 동물을 이전에 보고된 바와 같이 안락사시켰다39. 3월령 돼지에 대한 AAV 벡터의 망막하 전달을 이전에 보고된 바와 같이 수행하였다39. 모든 눈에 100 ㎕의 PBS 또는 AAV2/8 벡터 용액을 처리하였다. AAV2/8 용량은 각각의 벡터 당 1x1011 GC/눈이었으며, 따라서 1:1 비율의 이중 AAV 벡터의 공동-주사에는 총 2x1011 GC/눈의 용량이 필요하였다.
도 2c, 도 5b, 도 8, 도 9, 도 10, 도 11 및 도 12에 포함된 동물 연구의 경우, 우측 눈 및 좌측 눈을 다양한 실험군들에 무작위로 할당하였으며, 이 실험을 수행하고 정량화하는 연구원들은 동물이 받는 치료에 대해 맹검이었다.
웨스턴 블롯 분석
웨스턴 블롯 분석을 위해, HEK293 세포, 마우스 및 돼지 망막을 RIPA 완충제(50 mM Tris-HCl pH 8.0, 150 mM NaCl, 1% NP40, 0.5% Na-데옥시콜레이트, 1 mM EDTA pH 8.0, 0.1% SDS)에서 용해시켰다. 용해 완충제에 프로테아제 저해제(완전 프로테아제 저해제 칵테일 정제; Roche) 및 1 mM 페닐메틸설포닐을 보충하였다. 용해 후, MYO7A를 함유하는 세포의 시료를 1X Laemli 시료 완충제 내에서 99℃에서 5분 동안 변성시켰으며; ABCA4를 함유하는 시료를 4 M 우레아가 보충된 1X Laemli 시료 완충제 내에서 37℃에서 15분 동안 변성시켰다. 용해물을 6% 내지 7%(각각 ABCA4 시료 및 MYO7A 시료) 또는 8%(도 5b에서 WB) SDS-폴리아크릴아마이드 겔 전기영동에 의해 분리하였으며, 면역-블로팅에 사용한 항체는 하기와 같다: 항-3xflag(1:1000, A8592; Sigma-Aldrich); 인간 MYO7A 단백질의 아미노산 941-1070에 상응하는 펩타이드를 사용하여 생성된 항-MYO7A(1:500, 폴리클로날; Primm Srl, Milan, Italy); 항-필라민 A(1:1000, 카탈로그 #4762; Cell Signaling Technology, Danvers, MA, USA); 항-디스페린(1:500, 디스페린, 클론 Ham1/7B6, MONX10795; Tebu-bio, Le Perray-en-Yveline, France). 웨스턴 블롯에 의해 검출된 ABCA4 밴드 및 MYO7A 밴드의 정량화를 ImageJ 소프트웨어(http://rsbweb.nih.gov/ij/에서 이용 가능한 프리 다운로드)를 사용하여 수행하였다. 이종성 ITR2 및 ITR5를 가진 AAV를 이용하여 수행된 시험관내 실험의 경우, 전장 ABCA4 및 MYO7A 밴드의 강도를, 상응하는 레인의 절단된 단백질 생성물의 강도 또는 필라민 A 밴드의 강도에 대해 정규화하였으며, 한편 더 짧은 ABCA4 및 MYO7A 단백질 밴드의 강도를 필라민 A 밴드의 강도에 대해 정규화하였다. 분해 신호 또는 상동성 영역을 갖는 AAV 벡터를 이용하여 달성된 ABCA4 밴드의 강도를 시험관내 실험의 경우 필라민 A 밴드의 강도 또는 생체내 실험의 경우 디스페린 밴드의 강도에 대해 정규화하였다.
웨스턴 블롯 실험의 정량화를 하기와 같이 수행하였다:
- 도 2a 내지 도 2b: ABCA4 밴드의 강도를 상응하는 레인에서 필라민 A 밴드의 강도에 대해 정규화하였다. 그런 다음, 정규화된 ABCA4 발현을 이중 AAV 하이브리드 AK 벡터에 대한 퍼센트로서 표현하였다;
- 도 2c: ABCA4 밴드의 강도(a.u.)를 각각의 겔의 음성 대조군 레인에서 동일한 수준에서 측정된 평균 강도에 대한 증가의 배수로서 계산하였다(하부 좌측 패널의 레인 7에서의 음성 대조군 시료의 측정은 이례적으로 높은 백그라운드 신호로 인해 분석으로부터 배제하였음). 각각의 그룹에 대한 값을 평균 ± 평균의 표준 오차(s.e.m.)로서 나타낸다;
- 도 3b 내지 도 3d: 전장 ABCA4 및 절단된 단백질 밴드 강도를 필라민 A 밴드의 강도로 나누거나, 또는 전장 ABCA4 단백질 밴드의 강도를 상응하는 레인에서의 절단된 단백질 밴드의 강도로 나누었다. 값은 평균 ± s.e.m.으로서 나타나 있다;
- 표 5: 전장 ABCA4 및 절단된 단백질 밴드 강도를 5'-하프 벡터 및 3'-하프 벡터에 의해 공동-감염된 세포에서 측정하였다. 전장 ABCA4 및 절단된 단백질 밴드의 강도들 사이의 비율을 상응하는 모방체 또는 스크램블 모방체의 존재 하에 계산하였다. 값은 3개의 독립적인 실험들로부터의 비율의 평균 ± s.e.m.을 나타낸다;
- 표 6: 전장 ABCA4 및 절단된 단백질 밴드 강도를 5'-하프 벡터 및 3'-하프 벡터에 의해 공동-감염된 세포에서 측정하였다. 분해 신호를 갖거나 또는 갖지 않는 벡터로부터의 전장 ABCA4 및 절단된 밴드의 강도들 사이의 비율을 계산하였다. 값은 3개의 독립적인 실험들로부터의 비율의 평균 ± s.e.m.을 나타낸다.
- 도 8a: ABCA4 밴드의 강도(a.u.)를 상응하는 겔의 음성 대조군 레인에서 측정된 평균 백그라운드 강도에 대한 증가 배수로서 계산하였다. 값은 평균 ± s.e.m.으로서 표현된다.
서던 블롯 분석
3 x 1010 GC의 바이러스 DNA를 AAV 입자로부터 추출하였다. 패키징되지 않은 게놈을 분해하기 위해, 벡터 용액을 240 ㎕의 PBS pH 7.4 19(GIBCO; Invitrogen S.R.L., Milan, Italy)에 재현탁시킨 다음, 40 mM TRIS-HCl, 10 mM NaCl, 6 mM MgCl2, 1 mM CaCl2 pH 7.9를 함유하는 총 300 ㎕ 부피 중 1 U/㎕의 DNase I (Roche)와 함께 37℃에서 2시간 동안 인큐베이션하였다. 그런 다음, DNase I을 50 mM EDTA를 이용하여 불활성화시키고, 후속해서 프로테이나제 K 및 2.5% N-라우로일-사르코실 용액과 함께 50℃에서 45분 동안 인큐베이션하여, 캡시드를 용해시켰다. DNA를 페놀-클로로포름을 이용하여 2회 추출하고, 2 부피의 에탄올 100 및 10% 소듐 아세테이트(3 M, pH 7)를 이용하여 침전시켰다. 알칼리 아가로스 겔 전기영동 및 블로팅을 이전에 보고된 바와 같이 수행하였다(문헌[Sambrook & Russell, 2001 Molecular Cloning]). 10 ㎕의 1 kb DNA 사다리(N3232L; New England Biolabs, Ipswich, MA, USA)를 분자량 마커로서 로딩하였다. 2개의 상이한 이중 가닥 DNA 단편을 DIG 하이 프라임 DNA 표지화 및 검출 스타터 키트(Roche)를 사용하여 다이곡시게닌-dUTP를 이용하여 표지하였으며, 프로브로서 사용하였다. 5' 프로브(768 bp)는, pZac2.1-CMV-ABCA4_5' 플라스미드를 SpeI 및 NotI를 이용하여 이중 분해시켜 제조하였으며; 3' 프로브(974 bp)는, pZac2.1-ABCA4_3'_3xflag_SV40 플라스미드를 ClaI 및 MfeI를 이용하여 이중 분해시켜 제조하였다. 예비혼성화 및 혼성화를 65℃에서 Church 완충제(문헌[Sambrook & Russel, 2001 Molecular cloning])에서 각각 1시간 및 밤새 수행하였다. 그런 다음, 막(Whatman Nytran N, 하전된 나일론 막; Sigma-Aldrich, Milan, Italy)을 우선 SSC 29-0.1% SDS에서 30분 동안 세척하고, 그런 다음 65℃에서 SSC 0.59-0.1% SDS에서 30분 동안 세척한 다음, 37℃에서 SSC 0.19-0.1% SDS에서 30분 동안 세척하였다. 그런 다음, 상기 막을 DIG DNA 표지화 및 검출 키트(Roche)를 사용한 효소 면역검정법에 의한 화학발광 검출에 의해 분석하였다.
조직학적 분석
마우스를 안락사시키고, 이의 안구를 수집한 다음, 4% 파라포름알데하이드(PFA)에 침지시켜 밤새 고정시켰다. 안구를 수집하기 전에, 공막의 측두측(temporal aspect)을 소작술에 의해 마킹하여, 포함시키는 순간, 주사 부위에 대하여 눈을 배향시켰다. 아이컵을 온전하게 유지시키면서 수정체 및 유리체를 제거할 수 있도록 안구를 절단하였다. 냉동보존을 위해 마우스 아이컵에 30% 수크로스를 침윤시키고, 조직-동결 배지(O.C.T. 매트릭스; Kaltek, Padua, Italy)에서 포매시켰다. 각각의 눈에 대해, 150개 내지 200개의 연속 박편(10 ㎛ 두께)들을 수평면을 따라 절단하였고, 상기 박편들을 10개의 슬라이드 상에 점진적으로 분포시킴으로써, 각각의 슬라이드는, 상이한 수준에서 전체 눈을 각각 대표하는 15개 내지 20개의 박편들을 함유하게 되었다. 박편을 4',6'-다이아미디노-2-페닐인돌(Vectashield; Vector Lab, Peterborough, United Kingdom)을 사용하여 염색시키고, 상이한 배율에서 Zeiss Axiocam(Carl Zeiss, Oberkochen, Germany)를 이용하여 모니터링하였다.
돼지를 안락사시키고, 이의 안구를 수집한 다음, 4% PFA에 침지시켜 밤새 고정시켰다. 아이컵을 온전하게 유지시키면서 수정체 및 유리체를 제거할 수 있도록 안구를 절단하였다. 아이컵에 10%, 20% 및 30% 수크로스를 점진적으로 침윤시킴으로써 상기 아이컵을 점차 탈수시켰다. 조직-동결 배지(O.C.T. 매트릭스; Kaltek) 포매를 수행하였다. 포매 전에, 돼지의 아이컵을 형광 입체현미경(Leica Microsystem GmbH, Wetzlar, Germany)을 이용하여 분석하여, EGFP-인코딩 벡터를 투여할 때마다 형질도입된 영역을 위치화시켰다. 각각의 눈에 대해, 200개 내지 300개의 연속 박편(12 ㎛ 두께)들을 수평선을 따라 절단하였고, 상기 박편들을 유리 슬라이드 상에 점진적으로 분포시킴으로써, 각각의 슬라이드는 6개 내지 10개의 박편들을 함유하게 되었다. 박편 염색 및 이미지 획득을 마우스에 대해 보고된 바와 같이 수행하였다.
추상체 면역형광 염색
동결된 망막 박편을 PBS로 1회 세척한 다음, 0.1% Triton X-100을 함유하는 PBS에서 1시간 동안 침투시켰다. 10% 정상 염소 혈청(Sigma-Aldrich)을 함유하는 블록킹 용액을 1시간 동안 적용시켰다. 1차 항체[항-인간 CAR66 ,67로서, 돼지 CAR을 인지하기도 함("Luminaire founders"―hCAR, 1:10,000; Dr. Cheryl M. Craft가 친절하게 제공함, Doheny Eye Institute, Los Angeles, CA)]를 PBS로 희석하고, 4℃에서 밤새 인큐베이션하였다. 2차 항체(Alexa Fluor 594, 항-토끼, 1:1,000; 분자 프로브, Invitrogen, Carlsbad, CA)를 45분 동안 인큐베이션하였다. 항-CAR 항체를 이용하여 염색된 박편을 이전에 보고된 바와 같이64 레이카 레이저 공촛점 현미경 시스템(Leica Microsystem GmbH)을 사용하여 63x 배율에서 분석하였다. 간략하게는, 각각의 눈에 대해, 6개의 상이한 형질도입된 영역으로부터의 6개의 상이한 z-스택을 취하였다. 각각의 z-스택에 대해, 단일 플랜으로부터의 이미지를 사용하여, CAR+ /EGFP+ 세포를 계수하였다. 이를 수행할 때, 발명자들은 하나의 세포를 또 다른 세포와 구별하고 따라서 동일한 세포를 중복 계수하는 것을 피하기 위해, Z-축을 따라 조심스럽게 이동시켰다. 각각의 망막에 대해, 발명자들은 총 CAR+ 세포를 기준으로 CAR-양성(CAR+)/EGFP-양성(EGFP+) 세포를 계수하였다. 그런 다음, 발명자들은 각각의 실험군의 3개의 눈의 CAR+/EGFP+ 세포의 평균 수를 계산하였다.
EGFP 정량화
PR에서 형광 강도를 이전에 보고된 바와 같이64 비편향된 방식으로 철저하고 재현 가능하게 정량화하였다. 개별 색상 채널 이미지를 레이카 현미경(Leica Microsystem GmbH)을 사용하여 취하였다. TIFF 이미지를 이미지 분석 소프트웨어(LAS AF lite; Leica Microsystem GmbH)에 의해 그레이-스케일링(gray-scale)하였다. 각각의 눈의 6개 이미지를 맹검 관찰자에 의해 20x 배율에서 분석하였다. PR(외과립층 + OS)을 모든 이미지에서 선택적으로 도시하였으며, 밀폐된 영역에 대한 총 형광을 이미지 분석 소프트웨어를 사용하여 비편향된 방식으로 계산하였다. 그런 다음, PR에서의 형광을, 각각의 눈 유래의 개별 망막 박편으로부터 수집된 6개의 이미지로부터 평균을 내었다. 그런 다음, 발명자들은 각각의 실험군 당 3개의 눈에서의 평균 형광을 계산하였다.
리포푸신 자가형광의 정량화
리포푸신 형광 분석을 위해, AAV 주사 후 3개월째에 유색 Abca4 +/- Abca4-/- 마우스로부터 눈을 수집하였다. 마우스를 밤새 암순응시켰으며, 희미한 적색광 하에 안락사시켰다. 각각의 눈에 대해, 눈의 상이한 영역으로부터 유래한 3개의 박편의 측두측으로부터 4개의 오버래핑 사진을, TX2 필터(여기: 560±40 nm; 방출: 645±75)71 -75가 장착된 레이카 DM5000B 현미경을 사용하여 20X 대물렌즈 하에 촬영하였다. 그런 다음, 각각의 박편에 대한 4개의 이미지를 추가의 형광 분석에 사용된 단일 몽타주에서 조합하였다. 각각의 박편에서의 리포푸신 형광(적색 신호)의 강도를 ImageJ 소프트웨어를 사용하여 자동적으로 계산하였으며, 그런 다음 형광 영역의 기저를 이루는 RPE의 길이에 대해 정규화하였다.
투과 전자 현미경
전자 현미경 분석을 위해, AAV 주사 후 3개월째에 알비노 Abca4 -/-Abca4+/+ 마우스로부터 눈을 수집하였다. 눈을 0.1 M PHEM 완충제 pH 6.9(240 mM PIPES, 100 mM HEPES, 8 mM MgCl2, 40 mM EGTA) 중 0.2% 글루타르알데하이드-2% 파라포름알데하이드에서 밤새 고정한 다음, 0.1 M PHEM 완충제에서 헹구었다. 그런 다음, 눈을 광학 현미경 하에 해부하여, 아이컵의 티로시나제-양성 부분을 선택하였다. 후속해서, 아이컵의 형질도입된 부분을 12% 젤라틴에 포매시키고, 2.3 M 수크로스를 주입한 다음, 액체 질소에서 동결시켰다. 냉동박편(50 nm)을 레이카 울트라마이크로톰 EM FC7(Leica Microsystem)을 사용하여 절단하고, 섬모(cilia)를 연결하는 PR을 세로방향으로 정렬하는 데 있어서 극도의 주의를 기울였다. 형태학적 데이터를 다양한 실험군들에 귀속시키는 것과 관련하여 편견을 피하기 위해, 리포푸신 과립의 계수를 맹검 작업자(Dr. Roman Polishchuk)가 iTEM 소프트웨어(Olympus SYS, Hamburg, Germany)를 사용하여 수행하였다. iTEM 소프트웨어의 '터치 카운트' 모듈을 사용하여, RPE 층을 가로질러 무작위로 분포된 25 ㎛2 영역 내 리포푸신 과립의 수(적어도 40)를 계수하였다. 과립 밀도를 25 ㎛2 당 과립의 수로서 표현하였다.
망막 전위도 기록
마우스 및 돼지에서 전기생리학적 기록을 각각 (68) 및 (69)에서 보고된 바와 같이 수행하였다.
통계학적 분석
0.05 이하의 p-값은 통계학적으로 유의한 것으로 간주하였다. 사후 다중 비교 절차를 이용하는 원-웨이 ANOVA(R 통계학적 소프트웨어)를 사용하여, 도 2b(pANOVA= 1.2 x 10-6), 도 2c(pANOVA= 0.326), 도 8c(pANOVA= 1.5 x 10-10), 도 8d(pANOVA= 0.034) 및 도 9a(pANOVA a-파: 0.5; pANOVA b-파: 0.8) 및 표 6(pANOVA= 0.0135)에 도시된 데이터를 비교하였다. 리포푸신 과립(도 8d)의 계수가 이산형 수(discrete number)로서 표현되기 때문에, 이들을 음수 이항 일반화된 선형 모델(Negative Binomial generalized linear model)65로부터의 편차값에 의해 분석하였다. 사후 다중 비교 절차(post-hoc Multiple Comparison Procedure)를 이용하여 확인된 그룹들 사이에서의 통계학적으로 유의한 차이는 하기와 같다: 도 2b: AP vs AK: 1.08 x 10-5; AP1 vs AK: 0.05; AP2 vs AK: 0.17; AP1 vs AP: 1.8 x 10-6; AP2 vs AP: 2.8 x 10-6; AP2 vs AP1: 0.82. 도 8c: Abca4 +/- not inj vs Abca4 -/- not inj: 0.00; Abca4 -/- not inj vs Abca4 -/- AAV5'+3': 9.3 x 10-5; Abca4 +/- not inj vs Abca4 -/- AAV5'+3': 4 x 10-6. 도 8d: Abca4-/- PBS vs Abca4 -/- AAV5'+3': 0.01; Abca4 +/+ PBS vs Abca4 -/- AAV5'+3': 0.37; Abca4 +/+ not inj vs Abca4 -/- AAV5'+3': 0.53; Abca4 +/+ PBS vs Abca4 -/- PBS: 0.05; Abca4 +/+ not inj vs Abca4 -/- PBS: 0.03; Abca4 +/+ not inj vs Abca4+/+ PBS: 0.76. 표 6: 3xSTOP vs 분해 신호 없음: 0.97; 3xSTOP vs PB29: 1.0; 3xSTOP vs 3xPB29: 0.15; 3xSTOP vs 유비퀴틴: 0.10; PB29 vs 분해 신호 없음: 1.0; PB29 vs 3xPB29: 0.1; PB29 vs 유비퀴틴: 0.07; 3xPB29 vs 분해 신호 없음: 0.06; 3xPB29 vs 유비퀴틴: 1.0; 유비퀴틴 vs 분해 신호 없음: 0.04.
스튜던츠 t-테스트를 사용하여, 도 3c, 도 3d 및 도 3f에 도시된 데이터를 비교하였다.
결과
AP1, AP2 또는 AK 재조합유전성 영역을 포함하는 이중 AAV 하이브리드 벡터는 효율적인 형질도입을 보여준다
본 발명자들은 몇몇 다중 벡터 전략들을 도 1 및 도 13에 도시된 바와 같이 평가하였다.
특히, 발명자들은 상이한 상동성 영역들을 가진 이중 AAV 하이브리드 벡터의 형질도입 효능을 동시에 평가하였다. 이를 위해, 본 발명자들은, 유비쿼터스 CMV 프로모터 및 상동성의 AK14, AP14, AP1 또는 AP220 영역의 조절 하에 ABCA4-3xflag 코딩 서열을 포함하는 이중 AAV2/2 하이브리드 벡터를 생성하였다(도 7). 본 발명자들은 HEK293 세포를 감염시키는 데 이들 벡터를 사용하였다[감염 다중도, m.o.i.: 각각의 벡터 당 5x104 게놈 복사체(GC)/세포]. 세포 용해물을 항-3xflag 항체를 이용한 웨스턴 블롯에 의해 분석하여, ABCA4-3xflag를 검출하였다(도 2). 각각의 이중 AAV 하이브리드 벡터 세트는 음성 대조군이 로딩된 레인에서는 검출되지 않은 예상된 크기의 전장 단백질을 발현시켰다(도 2a). ABCA4 발현의 정량화(도 2b)는, 이중 AAV 하이브리드 AP1 및 AP2 벡터에 의한 감염이 이중 AAV 하이브리드 AK 벡터를 이용할 때보다 이식유전자 발현의 수준을 약간 더 높였으며, 모두 이중 AAV 하이브리드 AP 벡터14를 상당히 능가하였음을 보여주었다. 본 발명자들은 이전에, 상동성 재조합에 의존하는 이중 AAV 벡터의 효율이 세포 배양물에서보다 PR로서 종결-분화된 세포에서 더 낮음을 발견하였다14. 따라서, 본 발명자들은, PR-특이적인 인간 G 단백질-커플링된 수용체 키나제 1(GRK1) 프로모터를 포함하는 이중 AAV AK, AP1 및 AP2 벡터(각각의 벡터의 용량/눈: 1.9x109 GC; 도 2c)의 망막하 투여 후, C57BL/6 마우스에서 PR-특이적인 형질도입 수준을 평가하였다. 벡터 투여 후 1개월째에, 본 발명자들은 AP1 또는 AP2 벡터보다 이중 AAV 하이브리드 AK로 처리한 망막에서 ABCA4 단백질 발현을 보다 일관되게 검출하였다(도 2c).
AAV 벡터에 이종성 ITR을 포함시키는 것은 이의 생성 수율에 영향을 미치고, 절단된 단백질 생성물의 수준을 감소시키지 않는다.
이종성 ITR의 사용이 이중 AAV 벡터의 생산성 방향성 콘카테머화를 향상시키는지 시험하기 위해, 본 발명자들은 이종성 ITR2 및 ITR5를 5:2(AAV5로부터 좌측 ITR 및 AAV2로부터 우측 ITR) 또는 2:5(AAV2로부터 좌측 ITR 및 AAV5로부터 우측 ITR) 배치로 갖는 ABCA4-3xflag 또는 MYO7A-HA 코딩 서열을 포함하는 이중 AAV2/2 하이브리드 AK 벡터를 생성하였다(도 1). 이종성 ITR2 및 ITR5를 갖는 이중 AAV 벡터의 생성은, 바이러스 복제23를 교차-보완(cross-complement)할 수 없는 AAV 혈청형 2 및 AAV 혈청형 5로부터의 Rep 단백질의 동시적인 발현을 필요로 한다. 사실상, Rep2 및 Rep5는 상동성 ITR에 결합하는 것보다는 덜 효율적이긴 하지만 ITR2 또는 ITR5에 상호호환적으로 결합할 수 있으며, 그러나 이들은 다른 혈청형36 유래의 ITR의 말단 분해 부위(resolution site)를 절단할 수 없는 것으로 나타났다. 따라서, 이종성 ITR2 및 ITR5를 가진 이중 AAV 하이브리드 AK 벡터를 생성하기 전에, 본 발명자들은 (i) AAV2/2-CMV-EGFP 벡터(즉 상동성 ITR2를 가진 벡터)의 생성에 있어서 Rep2와의 Rep5의 잠재적인 경쟁, 및 (ii) AAV5/2-CMV-EGFP 벡터(즉 상동성 ITR5를 가진 벡터)의 생성에 있어서 Rep5와의 Rep2의 잠재적인 경쟁을, 동일한 양의 Rep5Cap2 및 Rep2Cap2 패키징 구축물(비율 1:1)을 사용하여 평가하였다. 사실상, Rep2Cap2 외에도 Rep5Cap2 패키징 구축물이 제공되는 경우, AAV2/2-CMV-EGFP 벡터의 총 수율은, Rep2Cap2만이 패키징 구축물로서 제공되는 경우 수득되는 대조군 조제물의 총 수율의 42%까지 감소된다(각각의 타입의 4개의 독립적인 조제물의 평균, p 스튜던츠 t-테스트 < 0.05). 역으로, Rep2Cap2가 Rep5Cap2에 첨가되었을 때 수득된 AAV5/2-CMV-EGFP 조제물의 총 수율에 있어서는 유의한 차이가 발견되지 않았으며, 이때의 수율은 Rep5Cap2가 형질감염된 유일한 패키징 구축물이었을 때 수득된 수율의 83%이었다(각각의 타입의 4개의 독립적인 조제물의 평균, 스튜던츠 t-테스트를 사용하여 확인 시 유의한 차이가 발견되지 않았음). ITR2를 가진 벡터의 생성에 있어서 Rep5가 Rep2와 경쟁한다면, 본 발명자들은 이종성 ITR2 및 ITR5를 가진 AAV의 생성에 있어서 Rep5 및 Rep2Cap2 패키징 구축물 사이에서 3개의 상이한 비율(프로토콜 A에서는 1:1, 프로토콜 B에서는 1:3 및 프로토콜 C에서는 1:10의 Rep5/Rep2Cap2 비율)을 시험하였다. 표 3에 나타낸 바와 같이, ITR2에 어닐링하는 프로브를 사용한 PCR 정량화에 의해 확인된 바이러스 역가는 Rep5의 양이 감소되었을 때 점진적으로 증가하였으며, 프로토콜 C에서 최상의 역가가 수득되었다.
표 3. 다양한 비율의 Rep5 Rep2 패키징 구축물의 존재 시 AAV5:2/2 벡터의 수율
Figure 112017095877839-pct00009
ID: AAV5:2/2 벡터의 식별 번호; GC: 게놈 복사체.
이들 결과는, ITR2를 가진 벡터의 생성 동안 Rep2와의 Rep5의 경쟁을 확인시켜 주었으며, 본 발명자들이 이종성 ITR2 및 ITR5를 가진 AAV 벡터의 생성을 위해 프로토콜 C를 따르도록 하였다. 그러나, 이 전략으로 수득된 몇몇 AAV 조제물은: (i) ITR들 사이에서의 이식유전자 서열 상에서 확인된 역가보다 ITR2 상에서 확인된 역가가 최대 6배 더 낮으며(표 4), 이는 ITR2의 온전성이 손상됨(compromise)을 제시할 수 있었다는 점, 및 (ii) 상동성 ITR2를 함유하는 것과 비교하여 이종성 ITR2 및 ITR5를 갖는 AAV 벡터의 총 수율이 평균 약 6배 감소한다는 점(표 4)을 드러내었다.
표 4. ITR2와 이종성 ITR2 ITR5를 가진 AAV2의 이식유전자 역가의 낮은 수율 및 차이
Figure 112017095877839-pct00010
ID: AAV 벡터의 식별 번호; GC: 게놈 복사체. a 값은 평균±SEM을 나타낸다.
그러나, 이종성 ITR을 가진 AAV 조제물의 서던 블롯 분석은 게놈 온전성의 명백한 변경을 드러내지 않았다(도 3a).
이중 AAV 하이브리드 AK 벡터에 이종성 ITR을 포함시키는 것이, 절단된 단백질의 생성을 감소시키면서도 꼬리-대-머리 생산성 콘카테머의 형성 및 전장 단백질 형질도입을 증강시켰는지 시험하기 위해, 본 발명자들은 이종성 ITR2 및 ITR5 (in the 5:2/2:5 배치) 또는 상동성 ITR2를 가진, ABCA4 또는 MYO7A를 인코딩하는 이중 AAV 하이브리드 벡터를 이용하여 HEK293 세포를 감염시켰다(도 3b, 3e).
상동성 ITR에서가 아니라 이종성 ITR을 가진 벡터에 대해 ITR2와 이식유전자 역가 사이에 차이가 있으면(표 4), 본 발명자들은 ITR2 또는 이식유전자 역가를 기반으로 하여 각각의 벡터 당 104 게놈 복사체 (GC)/세포로 세포를 감염시켰다. ITR2 역가를 기반으로 이중 AAV 벡터에 의해 감염된 HEK293 세포의, 항-3xflag(ABCA4-3xflag를 검출하기 위함, 도 3b) 또는 항-Myo7a(도 3e) 항체를 사용한 웨스턴 블롯 분석은, 이종성 ITR2 및 ITR5를 포함시키는 것이 상동성 ITR2보다 전장 및 절단된 단백질 둘 다의 수준을 더 높였음을 보여주었다(도 3b, 도 3c, 도 3d, 도 3f). 그러나, 이는 HEK293 세포를, 이식유전자 역가를 기반으로 한 동일한 이중 AAV 벡터 조제물에 의해 감염시켰을 때는 관찰되지 않았다(도 3b, 도 3d). 결론적으로, 전장 및 절단된 단백질 발현 사이의 비율은 벡터에 포함된 ITR(도 3 c, 도 3d, 도 3f) 및 세포의 투약에 사용된 벡터 역가(도 3b, 도 3c, 도 3d)와는 상관없이 유사하였다.
5'-하프 벡터 내의 CL1 데그론은 절단된 단백질 생성물의 생성을 감소시킨다
이중 AAV 하이브리드 벡터14의 각각의 5'-하프 및 3'-하프에 의해 제조된 절단된 단백질 생성물의 수준을 선택적으로 감소시키기 위해, 본 발명자들은 추정상 분해 서열을, 5'-하프 벡터에서 AK와 우측 ITR 사이에서 스플라이싱 공여자 신호 다음에 두고, 3'-하프 벡터에서는 AK와 스플라이싱 수여자 신호 사이에 두었다(도 1). 따라서, 분해 신호는 스플라이싱된 mRNA로부터 비롯되는 전장 단백질에서가 아니라 절단된 단백질에 포함될 것이다. 5'-하프 벡터에 분해 신호로서, 본 발명자들은: (i) CL1 데그론(CL1), (ii) miR-let7b 표적 부위의 4개의 복사체(4xLet7b), (iii) miR-26a 표적 부위의 4개의 복사체(4x26a) 또는 (iv) miR-204 표적 부위와 miR-124 표적 부위 각각의 3개의 복사체들의 조합(3x204+3x124)(표 2)을 포함시켰다. 3'-하프 벡터에 분해 신호로서, 본 발명자들은: (i) 3 정지 코돈(정지), (ii) 단일(PB29) 또는 3개의 탠덤 복사체(3xPB29)에 PB29, 또는 (iii) 유비퀴틴(표 2)을 포함시켰다. 본 발명자들은 다양한 분해 신호를 포함하는 ABCA4를 인코딩하는 이중 AAV2/2 하이브리드 AK 벡터를 생성하였으며, HEK293 세포를 감염시킨 후[m.o.i.: 각각의 벡터 당 5 x 104 게놈 복사체(GC)/세포] 이들 벡터의 효능을 평가하였다. miR-let7b, miR-26a, miR-204 및 miR-124가 HEK293 세포(Ambion miRNA Research Guide37)에서 불량하게 발현되거나 완전히 부재하기 때문에, 이들 miR의 표적 부위를 함유하는 구축물의 침묵화를 시험하기 위해, 본 발명자들은 상기 세포를 miR 모방체(즉, 내인성 miR38을 모방하는 작고 화학적으로 변형된 이중 가닥 RNA)로 형질감염시킨 후, 상응하는 표적 부위를 함유하는 AAV2/2 벡터로 감염시켰다. 상응하는 miR 표적 부위를 함유하는 유전자의 침묵화를 달성하는 데 필요한 miR 모방체의 농도를 확인하기 위해, 본 발명자들은 리포터 EGFP 단백질을 인코딩하고 폴리아데닐화 신호 앞에 miR 표적 부위를 함유하는 플라스미드를 사용하였다(데이터는 도시되지 않음). 동일한 실험 설정을 이중 AAV 하이브리드 AK 벡터의 맥락에서의 miR 표적 부위에 대한 추가적인 평가에 사용하였다. 본 발명자들은, 이중 AAV 하이브리드 AK 벡터의 5'-하프에 miR-204+124 및 26a 표적 서열을 포함시키는 것이 전장 단백질 발현에 영향을 미치지 않으면서도 절단된 단백질 생성물의 발현을 완전히 없애지는 못하더라도 감소시켰음을 발견하였다(도 4). 상이하게는, miR-let7b 표적 부위를 포함시키는 것은 절단된 단백질 발현을 감소시키는 데 효과적이지 않았다(도 4).
주목할만하게는, 도 5a에 나타낸 바와 같이, 본 발명자들은, 5'-하프 벡터에 CL1 분해 신호를 포함시키는 것이 전장 단백질 발현에 영향을 미치지 않으면서도 검출할 수 없는 수준으로 절단된 단백질 생성물의 발현을 감소시켰음을 발견하였다(도 5a). CL1 분해31를 매개하는 유비퀴틴화 경로의 효소의 조직-특이적인 발현에서의 차이가 CL1 효능의 변화를 설명할 수 있기 때문에, 본 발명자들은 돼지 망막에서 CL1 데그론의 효능을 평가하였으며, 돼지는 인간19 , 30, 39, 40과 유사한 크기 및 구조를 갖고 있어서 벡터의 안전성 및 효율을 평가하기 위한 우수한 예비-임상 대형 동물 모델이다. 이를 위해, 본 발명자들은 라지 화이트종 돼지에서, ABCA4를 인코딩하는 AAV2/8 이중 AAV 하이브리드 AK 벡터(이 중에서 5'-하프 벡터는 CL1 서열을 포함하거나 포함하지 않았음)를 망막하로 주사하였다(각각의 벡터의 용량/눈: 1 x 1011 GC). 주목할만하게는, 본 발명자들은, 5'-하프 벡터에 CL1 분해 신호를 포함시키는 것이 전장 단백질 발현에 영향을 미치지 않으면서도 절단된 단백질의 발현을 웨스턴 블롯 분석의 검출 한계 미만까지 상당히 감소시켰음을 발견하였다(도 5b). 3'-하프 벡터에서 시험된 분해 신호 중에서, 본 발명자들은 정지 코돈이 절단된 단백질 생성에 영향을 미치지 않았음을 발견하였다. 상이하게는, PB29(단일 또는 3개의 탠덤 복사체에서) 및 유비퀴틴 모두, 절단된 단백질 발현을 감소시키는 데 효과적이었다. 그러나, 유비퀴틴은 전장 단백질의 발현도 없앤 반면, PB29는 전장 단백질 생성에 대해 더 적은 범위로 영향을 미쳤다(도 6).
3'-하프 벡터에서 시험된 분해 신호 중에서, 본 발명자들은 절단된 단백질 생성물 및 전장 단백질의 수준을 둘 다 감소시킨 3가지(PB29, 3xPB29 및 유비퀴틴)를 동정하였다(도 6 및 표 5 및 표 6).
표 5. 5'-하프 벡터에 miR 표적 부위를 포함하는 이중 AAV 하이브리드 벡터에 의해 감염된 HEK293 세포의 웨스턴 블롯 분석으로부터의, 절단된 단백질 발현에 대한 전장 ABCA4의 정량화
Figure 112017095877839-pct00011
값은 상응하는 모방체 또는 스크램블 모방체의 존재 하에 전장 ABCA4 및 절단된 단백질 밴드의 강도 사이의 비율의 (3개의 독립적인 실험으로부터) 평균 ± s.e.m.을 나타낸다. 스크램블 또는 상응하는 모방체의 존재 하에 각각의 쌍의 벡터에 대한 비율을 스튜던츠 t-테스트를 사용하여 비교하였으며, 유의한 차이가 발견되지 않았다.
6: 3 '-하프 벡터에 분해 신호를 포함하는 이중 AAV 하이브리드 벡터에 의해 감염된 HEK293 세포의 웨스턴 블롯 분석으로부터의, 절단된 단백질 발현에 대한 전장 ABCA4의 정량화.
Figure 112017095877839-pct00012
값은 분해 신호를 가진 벡터 또는 갖지 않은 벡터로부터 전장 ABCA4 및 절단된 단백질 밴드의 강도 사이의 비율의 (3개의 독립적인 실험으로부터) 평균 ± s.e.m.을 나타낸다. 특정 통계학적 값을 포함한 통계학적 분석에 대한 보다 상세한 사항은 재료 및 방법 섹션의 통계학적 분석 단락에서 확인할 수 있다.
개선된 이중 AAV 벡터의 망막하 투여는 Abca4 -/- 망막에서의 리포푸신 축적을 감소시킨다
본 발명자들의 발견을 기반으로, 개선된 이중 AAV 하이브리드-ABCA4 벡터는 상동성 ITR2, 상동성 AK 영역 및 CL1을 포함해야 한다. ABCA4가 인간에서 간상체 및 추상체 광수용기 둘 다에서 발현되기 때문에70, 본 발명자들은 인간 GRK1(G 단백질-커플링된 수용체 키나제 1) 프로모터 또는 IRBP(광수용기간 레티노이드 결합 단백질) 프로모터 유래의 EGFP를 인코딩하는 단일 AAV2/8 벡터의 PR 형질도입 특성을 비교함으로써 ABCA4 전달에 적합한 프로모터를 동정하였으며, 상기 프로모터들은 둘 다 다양한 종들에서 조합된 간상체 및 추상체 PR 형질도입을 높은 수준으로 유도하는 것으로 보고되어 있다53 -55. 인간의 망막 황반(macula)과 유사한 추상체:간상체 = 1:356을 가진 스트리크(streak)-유사 영역을 포함하는 돼지 망막 구조물을 이용하여, 본 발명자들은 3월령 라지 화이트종 돼지에서 AAV2/8-GRK1- 또는 IRBP-EGFP 벡터를 1x1011 GC/눈으로 망막하로 주사하였다. 주사 후 4주째에, 본 발명자들은 형광 현미경 하에 상응하는 망막 냉동박편을 분석하였다. PR 세포 층에서의 EGFP 형광 정량화(도 10a 내지 도 10b)는, 2개 프로모터 모두 유사한 수준의 PR 형질도입(이 영역에서는 주로 간상체)을 제공함을 보여주었다. 그러나, 본 발명자들이 마찬가지로 EGFP 양성인 추상체 어레스틴(CAR)57에 대한 항체로 표지된 추상체의 수를 계수하였을 때, 이들은 GRK1 프로모터를 이용한 추상체 PR 형질도입을 통계학적으로 유의한 수준은 아니지만 더 높은 것을 발견하였다(물질, 도 10c 내지 도 10d). 이를 기반으로, 본 발명자들은 이들의 개선된 이중 AAV 하이브리드 ABCA4 벡터에 GRK1 프로모터를 포함시켰으며, ABCA4를 발현하고, Abca4 -/- 마우스의 RPE에서 A2E-함유 자가형광 리포푸신 물질의 비정상적인 함량을 감소시키는 능력에 대해 조사하였다. 본 발명자들은 처음에, 1월령의 C57/BL6 마우스에게 개선된 이중 AAV 벡터(각각의 벡터의 용량/눈: 2x109 GC)를 망막하 주사하였으며, 주사한 24개의 눈 중 12개(50%)가 웨스턴 블롯에 의해 확인 시 전장 ABCA4 단백질을 다양한 수준이긴 하지만 검출 가능한 수준으로 가졌음을 발견하였다[도 8a; ABCA4-양성 눈에서 ABCA4 단백질 수준: 2.8 ± 0.7 a.u.(평균 ± 평균의 표준 오차)]. 이는, 상이한 버전의 이중 AAV 플랫폼이 50% ABCA4-발현 눈14에서 초래되었다는 본 발명자들의 이전의 발견과 유사하다. 그런 다음, 본 발명자들은 5.5월령 유색 Abca4 -/- 마우스에게, 개선된 이중 AAV 벡터를 눈의 측두측 영역에 망막하 주사하였다(각각의 벡터의 용량/눈: 1.8x109 GC). 3개월 후, 본 발명자들은 눈을 수집하고, 상기 눈의 측두측 영역에서 망막 냉동박편[RPE 단독 또는 RPE +외부 분절(OS)] 상에서의 리포푸신 형광 (여기: 560±40 nm; 방출: 645±75)의 수준을 측정하였다(도 8b 내지 도 8c 및 도 11). 본 발명자들은, 눈의 이 영역에서의 리포푸신 형광 강도가 치료용 이중 AAV 하이브리드 ABCA4 벡터를 주사한 Abca4 +/- 마우스 및 Abca4 -/- 마우스 둘 다에서보다 비처리된 Abca4-/- 마우스에서 상당히 더 높았음을 발견하였다(도 8b, 도 8c 및 도 11). 그런 다음, 투과 전자 현미경을 사용하여, 본 발명자들은 RPE 리포푸신 과립의 수를 계수하였다. 이들은 연령-매칭된 Abca4 +/+ 대조군과 비교하여 PBS를 주사한 5.5월령 내지 6-월령의 알비노 Abca4 -/- 마우스에서 증가하였으며(도 8d), 이와 유사한 수준에서 본 발명자들은 주사하지 않거나 또는 대조군 AAV 벡터를 주사한 Abca4-/- 마우스에서 독립적으로 측정하였다(데이터는 도시되지 않음). Abca4-/- RPE에서의 리포푸신 과립의 수를, 개선된 이중 AAV 하이브리드 ABCA4 벡터의 망막하 주사 후 3개월째에 정규화하였다(각각의 벡터의 용량/눈: 1x109 GC, 도 8d).
개선된 이중 AAV 벡터는 마우스 및 돼지 망막에의 망막하 투여 시 안전하다
개선된 이중 AAV2/8 하이브리드 ABCA4 벡터의 안전성을 조사하기 위해, 본 발명자들은 상기 벡터를 야생형 C57BL/6 마우스 및 라지 화이트종 돼지 둘 다에게 망막하 주사하였다(각각의 벡터의 용량/눈: 각각 3x109 및 1x1011 GC). 주사 후 1개월째에, 본 발명자들은 망막 전기적 활성을 간츠펠트(Ganzfeld) 망막 전위도(ERG)에 의해 측정하였으며, 이중 AAV 하이브리드 ABCA4 벡터를 주사한 마우스 눈과, 음성 대조군 AAV 벡터 또는 PBS를 주사한 눈 사이에서 a-파 및 b-파 진폭이 둘 다 유의하게 상이하지 않았음을 발견하였다(도 9a 및 재료, 도 12a). 유사하게는, 암순응, 명순응, 최대 반응 및 깜박거림 ERG 시험 둘 다에서 b-파 진폭은, PBS를 주사한 대조군 눈에 이중 AAV 하이브리드 ABCA4 벡터를 주사한 돼지 눈에서와 유사하였다(도 9b 및 재료, 도 12b).
고찰
AAV 제한된 패키징 용량은 IRD의 유전자 치료법에 대한 AAV의 광범위한 적용에 있어 주요 걸림돌들 중 하나를 나타낸다. 그러나, 최근 몇몇 그룹들이 독립적으로, 이중 AAV 벡터가 마우스 및 돼지 망막 둘 다에서 AAV 카고 용량(cargo capacity)을 효과적으로 확장시키며14 , 17, 19, 41, 따라서 단일 표준(canonical) AAV 벡터에서는 맞춰지지 않을 유전자에서의 돌연변이로 인해 IRD에의 AAV 이용 가능성을 확장시킨다고 보고하였다. 따라서, 본 발명자들은 이중 AAV 벡터의 사용과 연관된 일부 한계들, 즉 단일 벡터와 비교 시 상기 이중 AAV 벡터의 상대적으로 낮은 효율, 및 안전성 문제를 유발할 수 있는 절단된 단백질의 생성을 극복하기 위해 설정한다.
이중 AAV 게놈 꼬리-대-머리 콘카테머화를 증가시키기 위한 전략은 이론적으로, 자유 단일 하프-벡터로부터 전장 단백질의 수준을 증가시키고 절단된 단백질의 수준을 감소시켜야 한다. 본 발명자들은 상동성 또는 이종성 ITR의 최적 영역을 포함시킴으로써 꼬리-대-머리 이중 AAV 하이브리드 게놈 콘카테머화를 향상시키려고 설정한다. 이전에 보고된 상동성 영역에 대한 나란한(side-by-side) 평가에서, 본 발명자들은, Lostal 등20에 의해 최근 공개된 AP1 및 AP2 서열 및 F1 파지 14 유래의 AK 서열이 마우스 망막에서 보다 일관적인 ABCA4 발현을 유도하는 이중 AAV 하이브리드 AK 벡터를 이용하여 시험관내에서 단백질 발현을 전반적으로 유사한 수준으로 유도함을 발견하였다. 독립적으로, 상이한 상동성 영역의 이용 가능성은 AAV 카고 용량20, 42을 더 확장시키기 위해 삼중 AAV 벡터의 적절한 콘카테머화를 지시하는 데 유용하다. 이종성 ITR2 및 ITR5는 이중24 , 25 및 삼중42 AAV 벡터에 성공적으로 포함되었다. 본 발명자들은, 이종성 ITR2 및 ITR5를 가진 AAV 벡터의 수율이 상동성 ITR2를 가진 벡터의 수율보다 더 낮음을 발견하였다. 본 발명자들은 또한, 본 발명자들이 이들의 게놈의 상이한 영역들을 프로브할 때보다 본 발명자들이 이들의 ITR2를 프로브할 때, 이종성 ITR을 가진 벡터 게놈을 더 적게 검출하였다. 본 발명자들이, Rep5가 ITR2를 갖는 벡터의 생성을 방해한다고 보여주기 때문에, 이는 Rep2의 존재 시에만 생성되는 상동성 ITR2를 가진 AAV 벡터에서가 아니라 Rep5의 존재 시 생성되는 이종성 ITR을 가진 AAV 벡터에 포함된 ITR2의 수준의 비정상을 제시하고, 본 발명자들이 게놈의 ITR2 또는 상이한 영역을 프로브하는지 여부에 관계없이 유사한 역가를 보였다. 이들 결과는 부분적으로는, 이종성 ITR2 및 ITR5를 가진 이중 AAV 벡터가 상동성 ITR을 가진 벡터보다 더 높은 형질도입 효율을 가졌으며 생성 문제를 명확하게 갖지 않았다는 이전의 보고들과는 상이하다24 , 25. 상이한 패키징 구축물 및 생성 프로토콜 외에도, 이 연구에서 본 발명자들은, 콘카테머화24 , 25를 위해 단순히 ITR에 의존하는 이전의 보고들에서 사용된 트랜스-스플라이싱 시스템과는 대조적으로, 2개의 하프-벡터들 사이에 상동성 영역을 포함시킨 이중 AAV 하이브리드 벡터를 사용하였다. 이중 AAV 하이브리드 벡터에서는 전장 유전자의 재구축이 콘카테머 형성을 지시하는 상기 벡터16에 포함된 상동성 영역에 의해 주로 매개되므로, 이는 트랜스-스플라이싱 벡터24 , 25를 사용한 이전의 연구들과 비교하여 이종성 ITR을 가진 벡터를 이용하여 본 발명자들이 관찰한 이식유전자 발현에서의 더 작은 감소를 설명할 수 있다. 또한, 본 발명자들이 각각 MYO7A-발현 벡터 및 ABCA4-발현 벡터에 대한 이식유전자 서열을 기반으로 계산된 것보다 3배 내지 6배 더 낮은 ITR을 기반으로 계산된 역가를 기준으로 사용하였기 때문에, 본 발명자들은 이종성 ITR을 가진 벡터의 효율을 과대평가했을 수 있다. ITR2 및 이식유전자 서열을 기반으로 계산된 역가들 둘 다 상동성 ITR2를 가진 상응하는 이중 AAV 벡터들 사이에서 유사하기 때문에, 본 발명자들은 상기 벡터들을 이종성 ITR2 및 ITR5를 가진 벡터들보다 3배 내지 6배 더 낮은 부피로 사용하였다. 이는, 상동성 ITR을 가진 이중 AAV 벡터보다 이종성 ITR을 가진 이중 AAV 벡터로부터의 전장 및 절단된 단백질 생성물의 명확하게 더 높은 수준을 설명할 수 있다.
본 발명자들의 이전의 연구에서, 본 발명자들은 이중 AAV 벡터14의 망막하 투여 후 8개월째까지 국소 독성의 징후를 관찰하지 않았으나, 이중 AAV의 단일 하프-벡터로부터의 절단된 단백질 생성물의 생성은 안전성 문제를 유발할 것이다. 유전자 전사체에 miR 표적 부위를 포함시키는 것은 망막30을 포함한 다양한 조직에서 이식유전자 발현을 제한하기 위한 효과적인 전략인 것으로 나타났다. 그러나, 시험관내에서, 본 발명자들이 miR-204+124 및 26a에 대한 표적 부위를 포함시켰을 때에만 본 발명자들은 절단된 단백질 생성의 부분적인 감소를 달성하였다. 사실상, miR 표적 부위에 대해 외부에 놓인 mRNA의 특징은 침묵화의 효율에 영향을 미칠 수 있다43, 44. 이와 더불어, 5'-하프로부터 유래되는 절단된 단백질 생성물이 표준 폴리아데닐화 신호가 부여되지 않은 벡터로부터 생성되기 때문에, 생성되는 mRNA가 효율적인 miR-매개 침묵화를 수행할 수 없는 것이 가능할 수 있다. 중요하게는, 본 발명자들은 CL1 데그론을 포함시킴으로써, 5'-하프 벡터로부터 절단된 단백질 생성물을 완전히 분해시켰다. 본 발명자들은, 이러한 신호가 시험관내 및 돼지 망막 둘 다에서 효과적임을 보여주었으며, 이는 CL1 활성에 필요한 분해 경로의 효소가 다양한 세포 타입들에서 발현됨을 가리킨다. 3'-하프 벡터로부터의 절단된 단백질 생성물의 풍부도가 5'-하프 벡터에 의해 생성된 것보다 더 낮기 때문에(도 6), 이의 존재는 안전성 문제를 더 적게 유발해야 한다. 본원에서 마우스 및 돼지 망막에서 제시된 데이터는 개선된 이중 AAV 벡터의 안전성을 뒷받침한다.
주목할만하게는, 본 발명자들은, 조합된 간상체 및 추상체 형질도입을 높은 수준으로 제공하는 GRK1 프로모터의 조절 하에 개선된 이중 AAV 벡터를 망막하 투여하면, 마우스에서 변동적인 수준이긴 하지만 효과적인 ABCA4 전달을 초래함을 발견하였다. 이는, 작은 뮤린 눈에서 망막하 주사의 타고난 가변성, 및 단일 AAV 벡터14와 비교하여 이중 AAV 시스템의 전반적으로 더 낮은 효능 때문일 수 있었다. 이러한 가변성에도 불구하고, 본 발명자들은, 이중 AAV에 의해 매개된 ABCA4 전달이 Abca4-/- 망막에서 상당한 리포푸신 감소를 초래하며, 이는 광범위한 이식유전자 발현 수준이 치료 효능에 유사하게 기여할 수 있음을 발견하였다. 이는 2개의 독립적인 기술을 사용하여 관찰되었으나, 본 발명자들이, 사실상 리포푸신 과립의 수의 정규화를 보여준 망막의 AAV 형질도입된 영역을 해부하고 분석하였을 때 표현형의 보다 두드러진 향상이 관찰되었다. 결론적으로, 본 발명은 임상 적용, 특히 망막 질병의 치료에 적합한 개선된 특징을 가진 다중 벡터를 제공한다. 또한, 본 발명은 다중 벡터의 안전성 및 효능을 개선하며 이는 카고 용량20 , 42을 더 확장시킨다.
SEQUENCE LISTING <110> Fondazione Telethon <120> Multiple vector system and uses thereof <130> PCT 129062 <150> US62/127,463 <151> 2015-03-03 <160> 78 <170> PatentIn version 3.5 <210> 1 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 1 Ala Cys Lys Asn Trp Phe Ser Ser Leu Ser His Phe Val Ile His Leu 1 5 10 15 <210> 2 <211> 35 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 2 Ser Leu Ile Ser Leu Pro Leu Pro Thr Arg Val Lys Phe Ser Ser Leu 1 5 10 15 Leu Leu Ile Arg Ile Met Lys Ile Ile Thr Met Thr Phe Pro Lys Lys 20 25 30 Leu Arg Ser 35 <210> 3 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 3 Phe Tyr Tyr Pro Ile Trp Phe Ala Arg Val Leu Leu Val His Tyr Gln 1 5 10 15 <210> 4 <211> 46 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 4 Ser Asn Pro Phe Ser Ser Leu Phe Gly Ala Ser Leu Leu Ile Asp Ser 1 5 10 15 Val Ser Leu Lys Ser Asn Trp Asp Thr Ser Ser Ser Ser Cys Leu Ile 20 25 30 Ser Phe Phe Ser Ser Val Met Phe Ser Ser Thr Thr Arg Ser 35 40 45 <210> 5 <211> 39 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 5 Cys Arg Gln Arg Phe Ser Cys His Leu Thr Ala Ser Tyr Pro Gln Ser 1 5 10 15 Thr Val Thr Pro Phe Leu Ala Phe Leu Arg Arg Asp Phe Phe Phe Leu 20 25 30 Arg His Asn Ser Ser Ala Asp 35 <210> 6 <211> 46 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 6 Gly Ala Pro His Val Val Leu Phe Asp Phe Glu Leu Arg Ile Thr Asn 1 5 10 15 Pro Leu Ser His Ile Gln Ser Val Ser Leu Gln Ile Thr Leu Ile Phe 20 25 30 Cys Ser Leu Pro Ser Leu Ile Leu Ser Lys Phe Leu Gln Val 35 40 45 <210> 7 <211> 39 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 7 Asn Thr Pro Leu Phe Ser Lys Ser Phe Ser Thr Thr Cys Gly Val Ala 1 5 10 15 Lys Lys Thr Leu Leu Leu Ala Gln Ile Ser Ser Leu Phe Phe Leu Leu 20 25 30 Leu Ser Ser Asn Ile Ala Val 35 <210> 8 <211> 45 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 8 Pro Thr Val Lys Asn Ser Pro Lys Ile Phe Cys Leu Ser Ser Ser Pro 1 5 10 15 Tyr Leu Ala Phe Asn Leu Glu Tyr Leu Ser Leu Arg Ile Phe Ser Thr 20 25 30 Leu Ser Lys Cys Ser Asn Thr Leu Leu Thr Ser Leu Ser 35 40 45 <210> 9 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 9 Ser Asn Gln Leu Lys Arg Leu Trp Leu Trp Leu Leu Glu Val Arg Ser 1 5 10 15 Phe Asp Arg Thr Leu Arg Arg Pro Trp Ile His Leu Pro Ser 20 25 30 <210> 10 <211> 50 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 10 Ser Ile Ser Phe Val Ile Arg Ser His Ala Ser Ile Arg Met Gly Ala 1 5 10 15 Ser Asn Asp Phe Phe His Lys Leu Tyr Phe Thr Lys Cys Leu Thr Ser 20 25 30 Val Ile Leu Ser Lys Phe Leu Ile His Leu Leu Leu Arg Ser Thr Pro 35 40 45 Arg Val 50 <210> 11 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 11 aggcatagga tgacaaaggg aa 22 <210> 12 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 12 ggcattcacc gcgtgcctta 20 <210> 13 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 13 agcctatcct ggattacttg aa 22 <210> 14 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 14 Ser Trp Asn Phe Lys Leu Tyr Val Met 1 5 <210> 15 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 15 Met His Ser Trp Asn Phe Lys Leu Tyr Val Met Gly Ser Gly 1 5 10 <210> 16 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 16 gcctgcaaga actggttcag cagcctgagc cacttcgtga tccacctg 48 <210> 17 <211> 158 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 17 aggcatagga tgacaaaggg aacgataggc ataggatgac aaagggaaaa gcttaggcat 60 aggatgacaa agggaaggta ccagatctgg cattcaccgc gtgccttacg atggcattca 120 ccgcgtgcct taaagcttgg cattcaccgc gtgcctta 158 <210> 18 <211> 102 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 18 agcctatcct ggattacttg aacgatagcc tatcctggat tacttgaaaa gcttagccta 60 tcctggatta cttgaatcac agcctatcct ggattacttg aa 102 <210> 19 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 19 atgcacagct ggaacttcaa gctgtacgtc atgggcagcg gc 42 <210> 20 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 20 agctggaact tcaagctgta cgtcatg 27 <210> 21 <211> 136 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 21 atgcacagct ggaacttcaa gctgtacgtc atgggcagcg gcggggtacc atgcacagct 60 ggaacttcaa gctgtacgtc atgggcagcg gcggatgcac agctggaact tcaagctgta 120 cgtcatgggc agcggc 136 <210> 22 <211> 77 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 22 gggatttttc cgatttcggc ctattggtta aaaaatgagc tgatttaaca aaaatttaac 60 gcgaatttta acaaaat 77 <210> 23 <211> 77 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 23 gggattttgc cgatttcggc ctattggtta aaaaatgagc tgatttaaca aaaatttaac 60 gcgaatttta acaaaat 77 <210> 24 <211> 287 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 24 ccccgggtgc gcggcgtcgg tggtgccggc ggggggcgcc aggtcgcagg cggtgtaggg 60 ctccaggcag gcggcgaagg ccatgacgtg cgctatgaag gtctgctcct gcacgccgtg 120 aaccaggtgc gcctgcgggc cgcgcgcgaa caccgccacg tcctcgcctg cgtgggtctc 180 ttcgtccagg ggcactgctg actgctgccg atactcgggg ctcccgctct cgctctcggt 240 aacatccggc cgggcgccgt ccttgagcac atagcctgga ccgtttc 287 <210> 25 <211> 288 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 25 cgcagggcag cctctgtcat ctccatcagg gaggggtcca gtgtggagtc tcggtggatc 60 tcgtatttca tgtctccagg ctcaaagaga cccatgagat gggtcacaga cgggtccagg 120 gaagcctgca tgagctcagt gcggttccac acataccggg caccctggcg cttcgccagc 180 cattcctgca ccagattctt cccgtccagc ctggtcccac cttggctgta gtcatctggg 240 tactcagggt ctggggttcc catgcgaaac atgtactttc ggcctcca 288 <210> 26 <211> 278 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 26 gtgatcctag gtggaggccg aaagtacatg tttcgcatgg gaaccccaga ccctgagtac 60 ccagatgact acagccaagg tgggaccagg ctggacggga agaatctggt gcaggaatgg 120 ctggcgaagc gccagggtgc ccggtacgtg tggaaccgca ctgagctcat gcaggcttcc 180 ctggacccgt ctgtgaccca tctcatgggt ctctttgagc ctggagacat gaaatacgag 240 atccaccgag actccacact ggacccctcc ctgatgga 278 <210> 27 <211> 82 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 27 gtaagtatca aggttacaag acaggtttaa ggagaccaat agaaactggg cttgtcgaga 60 cagagaagac tcttgcgttt ct 82 <210> 28 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 28 gataggcacc tattggtctt actgacatcc actttgcctt tctctccaca g 51 <210> 29 <211> 130 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 29 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct 130 <210> 30 <211> 130 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 30 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120 gagcgcgcag 130 <210> 31 <211> 175 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 31 ctctcccccc tgtcgcgttc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60 agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120 cgcgacaggg gggagagtgc cacactctca agcaaggggg ttttgtaagc agtga 175 <210> 32 <211> 175 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 32 tcactgctta caaaaccccc ttgcttgaga gtgtggcact ctcccccctg tcgcgttcgc 60 tcgctcgctg gctcgtttgg gggggcgacg gccagagggc cgtcgtctgg cagctctttg 120 agctgccacc cccccaaacg agccagcgag cgagcgaacg cgacaggggg gagag 175 <210> 33 <211> 153 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 33 tcaatattgg ccattagcca tattattcat tggttatata gcataaatca atattggcta 60 ttggccattg catacgttgt atctatatca taatatgtac atttatattg gctcatgtcc 120 aatatgaccg ccatgttggc attgattatt gac 153 <210> 34 <211> 583 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 34 tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60 cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120 gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180 atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240 aagtccgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300 catgacctta cgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360 catggtgatg cggttttggc agtacaccaa tgggcgtgga tagcggtttg actcacgggg 420 atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480 ggactttcca aaatgtcgta ataaccccgc cccgttgacg caaatgggcg gtaggcgtgt 540 acggtgggag gtctatataa gcagagctcg tttagtgaac cgt 583 <210> 35 <211> 133 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 35 gtaagtatca aggttacaag acaggtttaa ggagaccaat agaaactggg cttgtcgaga 60 cagagaagac tcttgcgttt ctgataggca cctattggtc ttactgacat ccactttgcc 120 tttctctcca cag 133 <210> 36 <211> 299 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 36 ctagtgggcc ccagaagcct ggtggttgtt tgtccttctc aggggaaaag tgaggcggcc 60 ccttggagga aggggccggg cagaatgatc taatcggatt ccaagcagct caggggattg 120 tctttttcta gcaccttctt gccactccta agcgtcctcc gtgaccccgg ctgggattta 180 gcctggtgct gtgtcagccc cgggctccca ggggcttccc agtggtcccc aggaaccctc 240 gacagggcca gggcgtctct ctcgtccagc aagggcaggg acgggccaca ggcaagggc 299 <210> 37 <211> 365 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 37 ctagttatta atagtaatca attacggggt cattagttca tagcccatat atggagttcc 60 gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat 120 tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc 180 aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 240 caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt 300 acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 360 ccatg 365 <210> 38 <211> 229 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 38 tcgaggtgag ccccacgttc tgcttcactc tccccatctc ccccccctcc ccacccccaa 60 ttttgtattt atttattttt taattatttt gtgcagcgat gggggcgggg cggggcgagg 120 cggagaggtg cggcggcagc caatcggagc ggcgcgctcc gaaagtttcc ttttatggcg 180 aggcggcggc ggcggcggct ctataaaaag cgaagcgcgc ggcgggcgg 229 <210> 39 <211> 235 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 39 agcacagtgt ctggcatgta gcaggaacta aaataatggc agtgattaat gttatgatat 60 gcagacacaa cacagcaaga taagatgcaa tgtaccttct gggtcaaacc accctggcca 120 ctcctccccg atacccaggg ttgatgtgct tgaattagac aggattaaag gcttactgga 180 gctggaagcc ttgccccaac tcaggagttt agccccagac cttctgtcca ccagc 235 <210> 40 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 40 aaccacacaa cctactacct ca 22 <210> 41 <211> 102 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 41 aaccacacaa cctactacct cacgataacc acacaaccta ctacctcaaa gcttaaccac 60 acaacctact acctcatcac aaccacacaa cctactacct ca 102 <210> 42 <211> 105 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 42 agcctgatca gcctgcccct gcccacccgg gtgaagttca gcagcctgct gctgatccgg 60 atcatgaaga tcatcaccat gaccttcccc aagaagctgc ggagc 105 <210> 43 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 43 ttctactacc ccatctggtt cgcccgggtg ctgctggtgc actaccag 48 <210> 44 <211> 138 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 44 agcaacccct tcagcagcct gttcggcgcc agcctgctga tcgacagcgt gagcctgaag 60 agcaactggg acaccagcag cagcagctgc ctgatcagct tcttcagcag cgtgatgttc 120 agcagcacca cccggagc 138 <210> 45 <211> 117 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 45 tgccggcagc ggttcagctg ccacctgacc gccagctacc cccagagcac cgtgaccccc 60 ttcctggcct tcctgcggcg ggacttcttc ttcctgcggc acaacagcag cgccgac 117 <210> 46 <211> 138 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 46 ggcgcccccc acgtggtgct gttcgacttc gagctgcgga tcaccaaccc cctgagccac 60 atccagagcg tgagcctgca gatcaccctg atcttctgca gcctgcccag cctgatcctg 120 agcaagttcc tgcaggtg 138 <210> 47 <211> 117 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 47 aacacccccc tgttcagcaa gagcttcagc accacctgcg gcgtggccaa gaagaccctg 60 ctgctggccc agatcagcag cctgttcttc ctgctgctga gcagcaacat cgccgtg 117 <210> 48 <211> 135 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 48 cccaccgtga agaacagccc caagatcttc tgcctgagca gcagccccta cctggccttc 60 aacctggagt acctgagcct gcggatcttc agcaccctga gcaagtgcag caacaccctg 120 ctgaccagcc tgagc 135 <210> 49 <211> 90 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 49 agcaaccagc tgaagcggct gtggctgtgg ctgctggagg tgcggagctt cgaccggacc 60 ctgcggcggc cctggatcca cctgcccagc 90 <210> 50 <211> 150 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 50 agcatcagct tcgtgatccg gagccacgcc agcatccgga tgggcgccag caacgacttc 60 ttccacaagc tgtacttcac caagtgcctg accagcgtga tcctgagcaa gttcctgatc 120 cacctgctgc tgcggagcac cccccgggtg 150 <210> 51 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 51 tgaatgaatg a 11 <210> 52 <211> 243 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 52 ttcgagcaga catgataaga tacattgatg agtttggaca aaccacaact agaatgcagt 60 gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc tttatttgta accattataa 120 gctgcaataa acaagttaac aacaacaatt gcattcattt tatgtttcag gttcaggggg 180 agatgtggga ggttttttaa agcaagtaaa acctctacaa atgtggtaaa atcgataagg 240 atc 243 <210> 53 <211> 2918 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 53 atgggcttcg tgagacagat acagcttttg ctctggaaga actggaccct gcggaaaagg 60 caaaagattc gctttgtggt ggaactcgtg tggcctttat ctttatttct ggtcttgatc 120 tggttaagga atgccaaccc gctctacagc catcatgaat gccatttccc caacaaggcg 180 atgccctcag caggaatgct gccgtggctc caggggatct tctgcaatgt gaacaatccc 240 tgttttcaaa gccccacccc aggagaatct cctggaattg tgtcaaacta taacaactcc 300 atcttggcaa gggtatatcg agattttcaa gaactcctca tgaatgcacc agagagccag 360 caccttggcc gtatttggac agagctacac atcttgtccc aattcatgga caccctccgg 420 actcacccgg agagaattgc aggaagagga attcgaataa gggatatctt gaaagatgaa 480 gaaacactga cactatttct cattaaaaac atcggcctgt ctgactcagt ggtctacctt 540 ctgatcaact ctcaagtccg tccagagcag ttcgctcatg gagtcccgga cctggcgctg 600 aaggacatcg cctgcagcga ggccctcctg gagcgcttca tcatcttcag ccagagacgc 660 ggggcaaaga cggtgcgcta tgccctgtgc tccctctccc agggcaccct acagtggata 720 gaagacactc tgtatgccaa cgtggacttc ttcaagctct tccgtgtgct tcccacactc 780 ctagacagcc gttctcaagg tatcaatctg agatcttggg gaggaatatt atctgatatg 840 tcaccaagaa ttcaagagtt tatccatcgg ccgagtatgc aggacttgct gtgggtgacc 900 aggcccctca tgcagaatgg tggtccagag acctttacaa agctgatggg catcctgtct 960 gacctcctgt gtggctaccc cgagggaggt ggctctcggg tgctctcctt caactggtat 1020 gaagacaata actataaggc ctttctgggg attgactcca caaggaagga tcctatctat 1080 tcttatgaca gaagaacaac atccttttgt aatgcattga tccagagcct ggagtcaaat 1140 cctttaacca aaatcgcttg gagggcggca aagcctttgc tgatgggaaa aatcctgtac 1200 actcctgatt cacctgcagc acgaaggata ctgaagaatg ccaactcaac ttttgaagaa 1260 ctggaacacg ttaggaagtt ggtcaaagcc tgggaagaag tagggcccca gatctggtac 1320 ttctttgaca acagcacaca gatgaacatg atcagagata ccctggggaa cccaacagta 1380 aaagactttt tgaataggca gcttggtgaa gaaggtatta ctgctgaagc catcctaaac 1440 ttcctctaca agggccctcg ggaaagccag gctgacgaca tggccaactt cgactggagg 1500 gacatattta acatcactga tcgcaccctc cgccttgtca atcaatacct ggagtgcttg 1560 gtcctggata agtttgaaag ctacaatgat gaaactcagc tcacccaacg tgccctctct 1620 ctactggagg aaaacatgtt ctgggccgga gtggtattcc ctgacatgta tccctggacc 1680 agctctctac caccccacgt gaagtataag atccgaatgg acatagacgt ggtggagaaa 1740 accaataaga ttaaagacag gtattgggat tctggtccca gagctgatcc cgtggaagat 1800 ttccggtaca tctggggcgg gtttgcctat ctgcaggaca tggttgaaca ggggatcaca 1860 aggagccagg tgcaggcgga ggctccagtt ggaatctacc tccagcagat gccctacccc 1920 tgcttcgtgg acgattcttt catgatcatc ctgaaccgct gtttccctat cttcatggtg 1980 ctggcatgga tctactctgt ctccatgact gtgaagagca tcgtcttgga gaaggagttg 2040 cgactgaagg agaccttgaa aaatcagggt gtctccaatg cagtgatttg gtgtacctgg 2100 ttcctggaca gcttctccat catgtcgatg agcatcttcc tcctgacgat attcatcatg 2160 catggaagaa tcctacatta cagcgaccca ttcatcctct tcctgttctt gttggctttc 2220 tccactgcca ccatcatgct gtgctttctg ctcagcacct tcttctccaa ggccagtctg 2280 gcagcagcct gtagtggtgt catctatttc accctctacc tgccacacat cctgtgcttc 2340 gcctggcagg accgcatgac cgctgagctg aagaaggctg tgagcttact gtctccggtg 2400 gcatttggat ttggcactga gtacctggtt cgctttgaag agcaaggcct ggggctgcag 2460 tggagcaaca tcgggaacag tcccacggaa ggggacgaat tcagcttcct gctgtccatg 2520 cagatgatgc tccttgatgc tgctgtctat ggcttactcg cttggtacct tgatcaggtg 2580 tttccaggag actatggaac cccacttcct tggtactttc ttctacaaga gtcgtattgg 2640 cttggcggtg aagggtgttc aaccagagaa gaaagagccc tggaaaagac cgagccccta 2700 acagaggaaa cggaggatcc agagcaccca gaaggaatac acgactcctt ctttgaacgt 2760 gagcatccag ggtgggttcc tggggtatgc gtgaagaatc tggtaaagat ttttgagccc 2820 tgtggccggc cagctgtgga ccgtctgaac atcaccttct acgagaacca gatcaccgca 2880 ttcctgggcc acaatggagc tgggaaaacc accacctt 2918 <210> 54 <211> 3945 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 54 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240 atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300 gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagtggg ccccagaagc 360 ctggtggttg tttgtccttc tcaggggaaa agtgaggcgg ccccttggag gaaggggccg 420 ggcagaatga tctaatcgga ttccaagcag ctcaggggat tgtctttttc tagcaccttc 480 ttgccactcc taagcgtcct ccgtgacccc ggctgggatt tagcctggtg ctgtgtcagc 540 cccgggctcc caggggcttc ccagtggtcc ccaggaaccc tcgacagggc cagggcgtct 600 ctctcgtcca gcaagggcag ggacgggcca caggcaaggg cgcggccgcc atgggcttcg 660 tgagacagat acagcttttg ctctggaaga actggaccct gcggaaaagg caaaagattc 720 gctttgtggt ggaactcgtg tggcctttat ctttatttct ggtcttgatc tggttaagga 780 atgccaaccc gctctacagc catcatgaat gccatttccc caacaaggcg atgccctcag 840 caggaatgct gccgtggctc caggggatct tctgcaatgt gaacaatccc tgttttcaaa 900 gccccacccc aggagaatct cctggaattg tgtcaaacta taacaactcc atcttggcaa 960 gggtatatcg agattttcaa gaactcctca tgaatgcacc agagagccag caccttggcc 1020 gtatttggac agagctacac atcttgtccc aattcatgga caccctccgg actcacccgg 1080 agagaattgc aggaagagga attcgaataa gggatatctt gaaagatgaa gaaacactga 1140 cactatttct cattaaaaac atcggcctgt ctgactcagt ggtctacctt ctgatcaact 1200 ctcaagtccg tccagagcag ttcgctcatg gagtcccgga cctggcgctg aaggacatcg 1260 cctgcagcga ggccctcctg gagcgcttca tcatcttcag ccagagacgc ggggcaaaga 1320 cggtgcgcta tgccctgtgc tccctctccc agggcaccct acagtggata gaagacactc 1380 tgtatgccaa cgtggacttc ttcaagctct tccgtgtgct tcccacactc ctagacagcc 1440 gttctcaagg tatcaatctg agatcttggg gaggaatatt atctgatatg tcaccaagaa 1500 ttcaagagtt tatccatcgg ccgagtatgc aggacttgct gtgggtgacc aggcccctca 1560 tgcagaatgg tggtccagag acctttacaa agctgatggg catcctgtct gacctcctgt 1620 gtggctaccc cgagggaggt ggctctcggg tgctctcctt caactggtat gaagacaata 1680 actataaggc ctttctgggg attgactcca caaggaagga tcctatctat tcttatgaca 1740 gaagaacaac atccttttgt aatgcattga tccagagcct ggagtcaaat cctttaacca 1800 aaatcgcttg gagggcggca aagcctttgc tgatgggaaa aatcctgtac actcctgatt 1860 cacctgcagc acgaaggata ctgaagaatg ccaactcaac ttttgaagaa ctggaacacg 1920 ttaggaagtt ggtcaaagcc tgggaagaag tagggcccca gatctggtac ttctttgaca 1980 acagcacaca gatgaacatg atcagagata ccctggggaa cccaacagta aaagactttt 2040 tgaataggca gcttggtgaa gaaggtatta ctgctgaagc catcctaaac ttcctctaca 2100 agggccctcg ggaaagccag gctgacgaca tggccaactt cgactggagg gacatattta 2160 acatcactga tcgcaccctc cgccttgtca atcaatacct ggagtgcttg gtcctggata 2220 agtttgaaag ctacaatgat gaaactcagc tcacccaacg tgccctctct ctactggagg 2280 aaaacatgtt ctgggccgga gtggtattcc ctgacatgta tccctggacc agctctctac 2340 caccccacgt gaagtataag atccgaatgg acatagacgt ggtggagaaa accaataaga 2400 ttaaagacag gtattgggat tctggtccca gagctgatcc cgtggaagat ttccggtaca 2460 tctggggcgg gtttgcctat ctgcaggaca tggttgaaca ggggatcaca aggagccagg 2520 tgcaggcgga ggctccagtt ggaatctacc tccagcagat gccctacccc tgcttcgtgg 2580 acgattcttt catgatcatc ctgaaccgct gtttccctat cttcatggtg ctggcatgga 2640 tctactctgt ctccatgact gtgaagagca tcgtcttgga gaaggagttg cgactgaagg 2700 agaccttgaa aaatcagggt gtctccaatg cagtgatttg gtgtacctgg ttcctggaca 2760 gcttctccat catgtcgatg agcatcttcc tcctgacgat attcatcatg catggaagaa 2820 tcctacatta cagcgaccca ttcatcctct tcctgttctt gttggctttc tccactgcca 2880 ccatcatgct gtgctttctg ctcagcacct tcttctccaa ggccagtctg gcagcagcct 2940 gtagtggtgt catctatttc accctctacc tgccacacat cctgtgcttc gcctggcagg 3000 accgcatgac cgctgagctg aagaaggctg tgagcttact gtctccggtg gcatttggat 3060 ttggcactga gtacctggtt cgctttgaag agcaaggcct ggggctgcag tggagcaaca 3120 tcgggaacag tcccacggaa ggggacgaat tcagcttcct gctgtccatg cagatgatgc 3180 tccttgatgc tgctgtctat ggcttactcg cttggtacct tgatcaggtg tttccaggag 3240 actatggaac cccacttcct tggtactttc ttctacaaga gtcgtattgg cttggcggtg 3300 aagggtgttc aaccagagaa gaaagagccc tggaaaagac cgagccccta acagaggaaa 3360 cggaggatcc agagcaccca gaaggaatac acgactcctt ctttgaacgt gagcatccag 3420 ggtgggttcc tggggtatgc gtgaagaatc tggtaaagat ttttgagccc tgtggccggc 3480 cagctgtgga ccgtctgaac atcaccttct acgagaacca gatcaccgca ttcctgggcc 3540 acaatggagc tgggaaaacc accaccttgt aagtatcaag gttacaagac aggtttaagg 3600 agaccaatag aaactgggct tgtcgagaca gagaagactc ttgcgtttct gggatttttc 3660 cgatttcggc ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta 3720 acaaaatatt aacgtttata atttcaggtg gcatctttcc cgcctgcaag aactggttca 3780 gcagcctgag ccacttcgtg atccacctgc aattgaggaa cccctagtga tggagttggc 3840 cactccctct ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg 3900 cccgggcttt gcccgggcgg cctcagtgag cgagcgagcg cgcag 3945 <210> 55 <211> 3904 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 55 gtccatcctg acgggtctgt tgccaccaac ctctgggact gtgctcgttg ggggaaggga 60 cattgaaacc agcctggatg cagtccggca gagccttggc atgtgtccac agcacaacat 120 cctgttccac cacctcacgg tggctgagca catgctgttc tatgcccagc tgaaaggaaa 180 gtcccaggag gaggcccagc tggagatgga agccatgttg gaggacacag gcctccacca 240 caagcggaat gaagaggctc aggacctatc aggtggcatg cagagaaagc tgtcggttgc 300 cattgccttt gtgggagatg ccaaggtggt gattctggac gaacccacct ctggggtgga 360 cccttactcg agacgctcaa tctgggatct gctcctgaag tatcgctcag gcagaaccat 420 catcatgtcc actcaccaca tggacgaggc cgacctcctt ggggaccgca ttgccatcat 480 tgcccaggga aggctctact gctcaggcac cccactcttc ctgaagaact gctttggcac 540 aggcttgtac ttaaccttgg tgcgcaagat gaaaaacatc cagagccaaa ggaaaggcag 600 tgaggggacc tgcagctgct cgtctaaggg tttctccacc acgtgtccag cccacgtcga 660 tgacctaact ccagaacaag tcctggatgg ggatgtaaat gagctgatgg atgtagttct 720 ccaccatgtt ccagaggcaa agctggtgga gtgcattggt caagaactta tcttccttct 780 tccaaataag aacttcaagc acagagcata tgccagcctt ttcagagagc tggaggagac 840 gctggctgac cttggtctca gcagttttgg aatttctgac actcccctgg aagagatttt 900 tctgaaggtc acggaggatt ctgattcagg acctctgttt gcgggtggcg ctcagcagaa 960 aagagaaaac gtcaaccccc gacacccctg cttgggtccc agagagaagg ctggacagac 1020 accccaggac tccaatgtct gctccccagg ggcgccggct gctcacccag agggccagcc 1080 tcccccagag ccagagtgcc caggcccgca gctcaacacg gggacacagc tggtcctcca 1140 gcatgtgcag gcgctgctgg tcaagagatt ccaacacacc atccgcagcc acaaggactt 1200 cctggcgcag atcgtgctcc cggctacctt tgtgtttttg gctctgatgc tttctattgt 1260 tatccctcct tttggcgaat accccgcttt gacccttcac ccctggatat atgggcagca 1320 gtacaccttc ttcagcatgg atgaaccagg cagtgagcag ttcacggtac ttgcagacgt 1380 cctcctgaat aagccaggct ttggcaaccg ctgcctgaag gaagggtggc ttccggagta 1440 cccctgtggc aactcaacac cctggaagac tccttctgtg tccccaaaca tcacccagct 1500 gttccagaag cagaaatgga cacaggtcaa cccttcacca tcctgcaggt gcagcaccag 1560 ggagaagctc accatgctgc cagagtgccc cgagggtgcc gggggcctcc cgccccccca 1620 gagaacacag cgcagcacgg aaattctaca agacctgacg gacaggaaca tctccgactt 1680 cttggtaaaa acgtatcctg ctcttataag aagcagctta aagagcaaat tctgggtcaa 1740 tgaacagagg tatggaggaa tttccattgg aggaaagctc ccagtcgtcc ccatcacggg 1800 ggaagcactt gttgggtttt taagcgacct tggccggatc atgaatgtga gcgggggccc 1860 tatcactaga gaggcctcta aagaaatacc tgatttcctt aaacatctag aaactgaaga 1920 caacattaag gtgtggttta ataacaaagg ctggcatgcc ctggtcagct ttctcaatgt 1980 ggcccacaac gccatcttac gggccagcct gcctaaggac agaagccccg aggagtatgg 2040 aatcaccgtc attagccaac ccctgaacct gaccaaggag cagctctcag agattacagt 2100 gctgaccact tcagtggatg ctgtggttgc catctgcgtg attttctcca tgtccttcgt 2160 cccagccagc tttgtccttt atttgatcca ggagcgggtg aacaaatcca agcacctcca 2220 gtttatcagt ggagtgagcc ccaccaccta ctgggtaacc aacttcctct gggacatcat 2280 gaattattcc gtgagtgctg ggctggtggt gggcatcttc atcgggtttc agaagaaagc 2340 ctacacttct ccagaaaacc ttcctgccct tgtggcactg ctcctgctgt atggatgggc 2400 ggtcattccc atgatgtacc cagcatcctt cctgtttgat gtccccagca cagcctatgt 2460 ggctttatct tgtgctaatc tgttcatcgg catcaacagc agtgctatta ccttcatctt 2520 ggaattattt gagaataacc ggacgctgct caggttcaac gccgtgctga ggaagctgct 2580 cattgtcttc ccccacttct gcctgggccg gggcctcatt gaccttgcac tgagccaggc 2640 tgtgacagat gtctatgccc ggtttggtga ggagcactct gcaaatccgt tccactggga 2700 cctgattggg aagaacctgt ttgccatggt ggtggaaggg gtggtgtact tcctcctgac 2760 cctgctggtc cagcgccact tcttcctctc ccaatggatt gccgagccca ctaaggagcc 2820 cattgttgat gaagatgatg atgtggctga agaaagacaa agaattatta ctggtggaaa 2880 taaaactgac atcttaaggc tacatgaact aaccaagatt tatccaggca cctccagccc 2940 agcagtggac aggctgtgtg tcggagttcg ccctggagag tgctttggcc tcctgggagt 3000 gaatggtgcc ggcaaaacaa ccacattcaa gatgctcact ggggacacca cagtgacctc 3060 aggggatgcc accgtagcag gcaagagtat tttaaccaat atttctgaag tccatcaaaa 3120 tatgggctac tgtcctcagt ttgatgcaat cgatgagctg ctcacaggac gagaacatct 3180 ttacctttat gcccggcttc gaggtgtacc agcagaagaa atcgaaaagg ttgcaaactg 3240 gagtattaag agcctgggcc tgactgtcta cgccgactgc ctggctggca cgtacagtgg 3300 gggcaacaag cggaaactct ccacagccat cgcactcatt ggctgcccac cgctggtgct 3360 gctggatgag cccaccacag ggatggaccc ccaggcacgc cgcatgctgt ggaacgtcat 3420 cgtgagcatc atcagagaag ggagggctgt ggtcctcaca tcccacagca tggaagaatg 3480 tgaggcactg tgtacccggc tggccatcat ggtaaagggc gcctttcgat gtatgggcac 3540 cattcagcat ctcaagtcca aatttggaga tggctatatc gtcacaatga agatcaaatc 3600 cccgaaggac gacctgcttc ctgacctgaa ccctgtggag cagttcttcc aggggaactt 3660 cccaggcagt gtgcagaggg agaggcacta caacatgctc cagttccagg tctcctcctc 3720 ctccctggcg aggatcttcc agctcctcct ctcccacaag gacagcctgc tcatcgagga 3780 gtactcagtc acacagacca cactggacca ggtgtttgta aattttgcta aacagcagac 3840 tgaaagtcat gacctccctc tgcaccctcg agctgctgga gccagtcgac aagcccagga 3900 ctga 3904 <210> 56 <211> 4636 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 56 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct ggatccggga tttttccgat ttcggcctat tggttaaaaa atgagctgat 180 ttaacaaaaa tttaacgcga attttaacaa aatattaacg tttataattt caggtggcat 240 ctttcgatag gcacctattg gtcttactga catccacttt gcctttctct ccacaggtcc 300 atcctgacgg gtctgttgcc accaacctct gggactgtgc tcgttggggg aagggacatt 360 gaaaccagcc tggatgcagt ccggcagagc cttggcatgt gtccacagca caacatcctg 420 ttccaccacc tcacggtggc tgagcacatg ctgttctatg cccagctgaa aggaaagtcc 480 caggaggagg cccagctgga gatggaagcc atgttggagg acacaggcct ccaccacaag 540 cggaatgaag aggctcagga cctatcaggt ggcatgcaga gaaagctgtc ggttgccatt 600 gcctttgtgg gagatgccaa ggtggtgatt ctggacgaac ccacctctgg ggtggaccct 660 tactcgagac gctcaatctg ggatctgctc ctgaagtatc gctcaggcag aaccatcatc 720 atgtccactc accacatgga cgaggccgac ctccttgggg accgcattgc catcattgcc 780 cagggaaggc tctactgctc aggcacccca ctcttcctga agaactgctt tggcacaggc 840 ttgtacttaa ccttggtgcg caagatgaaa aacatccaga gccaaaggaa aggcagtgag 900 gggacctgca gctgctcgtc taagggtttc tccaccacgt gtccagccca cgtcgatgac 960 ctaactccag aacaagtcct ggatggggat gtaaatgagc tgatggatgt agttctccac 1020 catgttccag aggcaaagct ggtggagtgc attggtcaag aacttatctt ccttcttcca 1080 aataagaact tcaagcacag agcatatgcc agccttttca gagagctgga ggagacgctg 1140 gctgaccttg gtctcagcag ttttggaatt tctgacactc ccctggaaga gatttttctg 1200 aaggtcacgg aggattctga ttcaggacct ctgtttgcgg gtggcgctca gcagaaaaga 1260 gaaaacgtca acccccgaca cccctgcttg ggtcccagag agaaggctgg acagacaccc 1320 caggactcca atgtctgctc cccaggggcg ccggctgctc acccagaggg ccagcctccc 1380 ccagagccag agtgcccagg cccgcagctc aacacgggga cacagctggt cctccagcat 1440 gtgcaggcgc tgctggtcaa gagattccaa cacaccatcc gcagccacaa ggacttcctg 1500 gcgcagatcg tgctcccggc tacctttgtg tttttggctc tgatgctttc tattgttatc 1560 cctccttttg gcgaataccc cgctttgacc cttcacccct ggatatatgg gcagcagtac 1620 accttcttca gcatggatga accaggcagt gagcagttca cggtacttgc agacgtcctc 1680 ctgaataagc caggctttgg caaccgctgc ctgaaggaag ggtggcttcc ggagtacccc 1740 tgtggcaact caacaccctg gaagactcct tctgtgtccc caaacatcac ccagctgttc 1800 cagaagcaga aatggacaca ggtcaaccct tcaccatcct gcaggtgcag caccagggag 1860 aagctcacca tgctgccaga gtgccccgag ggtgccgggg gcctcccgcc cccccagaga 1920 acacagcgca gcacggaaat tctacaagac ctgacggaca ggaacatctc cgacttcttg 1980 gtaaaaacgt atcctgctct tataagaagc agcttaaaga gcaaattctg ggtcaatgaa 2040 cagaggtatg gaggaatttc cattggagga aagctcccag tcgtccccat cacgggggaa 2100 gcacttgttg ggtttttaag cgaccttggc cggatcatga atgtgagcgg gggccctatc 2160 actagagagg cctctaaaga aatacctgat ttccttaaac atctagaaac tgaagacaac 2220 attaaggtgt ggtttaataa caaaggctgg catgccctgg tcagctttct caatgtggcc 2280 cacaacgcca tcttacgggc cagcctgcct aaggacagaa gccccgagga gtatggaatc 2340 accgtcatta gccaacccct gaacctgacc aaggagcagc tctcagagat tacagtgctg 2400 accacttcag tggatgctgt ggttgccatc tgcgtgattt tctccatgtc cttcgtccca 2460 gccagctttg tcctttattt gatccaggag cgggtgaaca aatccaagca cctccagttt 2520 atcagtggag tgagccccac cacctactgg gtaaccaact tcctctggga catcatgaat 2580 tattccgtga gtgctgggct ggtggtgggc atcttcatcg ggtttcagaa gaaagcctac 2640 acttctccag aaaaccttcc tgcccttgtg gcactgctcc tgctgtatgg atgggcggtc 2700 attcccatga tgtacccagc atccttcctg tttgatgtcc ccagcacagc ctatgtggct 2760 ttatcttgtg ctaatctgtt catcggcatc aacagcagtg ctattacctt catcttggaa 2820 ttatttgaga ataaccggac gctgctcagg ttcaacgccg tgctgaggaa gctgctcatt 2880 gtcttccccc acttctgcct gggccggggc ctcattgacc ttgcactgag ccaggctgtg 2940 acagatgtct atgcccggtt tggtgaggag cactctgcaa atccgttcca ctgggacctg 3000 attgggaaga acctgtttgc catggtggtg gaaggggtgg tgtacttcct cctgaccctg 3060 ctggtccagc gccacttctt cctctcccaa tggattgccg agcccactaa ggagcccatt 3120 gttgatgaag atgatgatgt ggctgaagaa agacaaagaa ttattactgg tggaaataaa 3180 actgacatct taaggctaca tgaactaacc aagatttatc caggcacctc cagcccagca 3240 gtggacaggc tgtgtgtcgg agttcgccct ggagagtgct ttggcctcct gggagtgaat 3300 ggtgccggca aaacaaccac attcaagatg ctcactgggg acaccacagt gacctcaggg 3360 gatgccaccg tagcaggcaa gagtatttta accaatattt ctgaagtcca tcaaaatatg 3420 ggctactgtc ctcagtttga tgcaatcgat gagctgctca caggacgaga acatctttac 3480 ctttatgccc ggcttcgagg tgtaccagca gaagaaatcg aaaaggttgc aaactggagt 3540 attaagagcc tgggcctgac tgtctacgcc gactgcctgg ctggcacgta cagtgggggc 3600 aacaagcgga aactctccac agccatcgca ctcattggct gcccaccgct ggtgctgctg 3660 gatgagccca ccacagggat ggacccccag gcacgccgca tgctgtggaa cgtcatcgtg 3720 agcatcatca gagaagggag ggctgtggtc ctcacatccc acagcatgga agaatgtgag 3780 gcactgtgta cccggctggc catcatggta aagggcgcct ttcgatgtat gggcaccatt 3840 cagcatctca agtccaaatt tggagatggc tatatcgtca caatgaagat caaatccccg 3900 aaggacgacc tgcttcctga cctgaaccct gtggagcagt tcttccaggg gaacttccca 3960 ggcagtgtgc agagggagag gcactacaac atgctccagt tccaggtctc ctcctcctcc 4020 ctggcgagga tcttccagct cctcctctcc cacaaggaca gcctgctcat cgaggagtac 4080 tcagtcacac agaccacact ggaccaggtg tttgtaaatt ttgctaaaca gcagactgaa 4140 agtcatgacc tccctctgca ccctcgagct gctggagcca gtcgacaagc ccaggactga 4200 gcggccgctt cgagcagaca tgataagata cattgatgag tttggacaaa ccacaactag 4260 aatgcagtga aaaaaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac 4320 cattataagc tgcaataaac aagttaacaa caacaattgc attcatttta tgtttcaggt 4380 tcagggggag atgtgggagg ttttttaaag caagtaaaac ctctacaaat gtggtaaaat 4440 cgataaggat cttcctagag catggctacg tagataagta gcatggcggg ttaatcatta 4500 actacaagga acccctagtg atggagttgg ccactccctc tctgcgcgct cgctcgctca 4560 ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga 4620 gcgagcgagc gcgcag 4636 <210> 57 <211> 4540 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 57 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240 atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300 gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat 360 caattacggg gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg 420 taaatggccc gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt 480 atgttcccat agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac 540 ggtaaactgc ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg 600 acgtcaatga cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact 660 ttcctacttg gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt 720 ggcagtacac caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc 780 ccattgacgt caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc 840 gtaataaccc cgccccgttg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata 900 taagcagagc tcgtttagtg aaccgtcaga tcactagaag ctttattgcg gtagtttatc 960 acagttaaat tgctaacgca gtcagtgctt ctgacacaac agtctcgaac ttaagctgca 1020 gaagttggtc gtgaggcact gggcaggtaa gtatcaaggt tacaagacag gtttaaggag 1080 accaatagaa actgggcttg tcgagacaga gaagactctt gcgtttctga taggcaccta 1140 ttggtcttac tgacatccac tttgcctttc tctccacagg tgtccactcc cagttcaatt 1200 acagctctta aggctagagt acttaatacg actcactata ggctagcctc gagaattcac 1260 gcgtggtacc tctagagtcg acccgggcgg ccgccatggg cttcgtgaga cagatacagc 1320 ttttgctctg gaagaactgg accctgcgga aaaggcaaaa gattcgcttt gtggtggaac 1380 tcgtgtggcc tttatcttta tttctggtct tgatctggtt aaggaatgcc aacccgctct 1440 acagccatca tgaatgccat ttccccaaca aggcgatgcc ctcagcagga atgctgccgt 1500 ggctccaggg gatcttctgc aatgtgaaca atccctgttt tcaaagcccc accccaggag 1560 aatctcctgg aattgtgtca aactataaca actccatctt ggcaagggta tatcgagatt 1620 ttcaagaact cctcatgaat gcaccagaga gccagcacct tggccgtatt tggacagagc 1680 tacacatctt gtcccaattc atggacaccc tccggactca cccggagaga attgcaggaa 1740 gaggaattcg aataagggat atcttgaaag atgaagaaac actgacacta tttctcatta 1800 aaaacatcgg cctgtctgac tcagtggtct accttctgat caactctcaa gtccgtccag 1860 agcagttcgc tcatggagtc ccggacctgg cgctgaagga catcgcctgc agcgaggccc 1920 tcctggagcg cttcatcatc ttcagccaga gacgcggggc aaagacggtg cgctatgccc 1980 tgtgctccct ctcccagggc accctacagt ggatagaaga cactctgtat gccaacgtgg 2040 acttcttcaa gctcttccgt gtgcttccca cactcctaga cagccgttct caaggtatca 2100 atctgagatc ttggggagga atattatctg atatgtcacc aagaattcaa gagtttatcc 2160 atcggccgag tatgcaggac ttgctgtggg tgaccaggcc cctcatgcag aatggtggtc 2220 cagagacctt tacaaagctg atgggcatcc tgtctgacct cctgtgtggc taccccgagg 2280 gaggtggctc tcgggtgctc tccttcaact ggtatgaaga caataactat aaggcctttc 2340 tggggattga ctccacaagg aaggatccta tctattctta tgacagaaga acaacatcct 2400 tttgtaatgc attgatccag agcctggagt caaatccttt aaccaaaatc gcttggaggg 2460 cggcaaagcc tttgctgatg ggaaaaatcc tgtacactcc tgattcacct gcagcacgaa 2520 ggatactgaa gaatgccaac tcaacttttg aagaactgga acacgttagg aagttggtca 2580 aagcctggga agaagtaggg ccccagatct ggtacttctt tgacaacagc acacagatga 2640 acatgatcag agataccctg gggaacccaa cagtaaaaga ctttttgaat aggcagcttg 2700 gtgaagaagg tattactgct gaagccatcc taaacttcct ctacaagggc cctcgggaaa 2760 gccaggctga cgacatggcc aacttcgact ggagggacat atttaacatc actgatcgca 2820 ccctccgcct tgtcaatcaa tacctggagt gcttggtcct ggataagttt gaaagctaca 2880 atgatgaaac tcagctcacc caacgtgccc tctctctact ggaggaaaac atgttctggg 2940 ccggagtggt attccctgac atgtatccct ggaccagctc tctaccaccc cacgtgaagt 3000 ataagatccg aatggacata gacgtggtgg agaaaaccaa taagattaaa gacaggtatt 3060 gggattctgg tcccagagct gatcccgtgg aagatttccg gtacatctgg ggcgggtttg 3120 cctatctgca ggacatggtt gaacagggga tcacaaggag ccaggtgcag gcggaggctc 3180 cagttggaat ctacctccag cagatgccct acccctgctt cgtggacgat tctttcatga 3240 tcatcctgaa ccgctgtttc cctatcttca tggtgctggc atggatctac tctgtctcca 3300 tgactgtgaa gagcatcgtc ttggagaagg agttgcgact gaaggagacc ttgaaaaatc 3360 agggtgtctc caatgcagtg atttggtgta cctggttcct ggacagcttc tccatcatgt 3420 cgatgagcat cttcctcctg acgatattca tcatgcatgg aagaatccta cattacagcg 3480 acccattcat cctcttcctg ttcttgttgg ctttctccac tgccaccatc atgctgtgct 3540 ttctgctcag caccttcttc tccaaggcca gtctggcagc agcctgtagt ggtgtcatct 3600 atttcaccct ctacctgcca cacatcctgt gcttcgcctg gcaggaccgc atgaccgctg 3660 agctgaagaa ggctgtgagc ttactgtctc cggtggcatt tggatttggc actgagtacc 3720 tggttcgctt tgaagagcaa ggcctggggc tgcagtggag caacatcggg aacagtccca 3780 cggaagggga cgaattcagc ttcctgctgt ccatgcagat gatgctcctt gatgctgctg 3840 tctatggctt actcgcttgg taccttgatc aggtgtttcc aggagactat ggaaccccac 3900 ttccttggta ctttcttcta caagagtcgt attggcttgg cggtgaaggg tgttcaacca 3960 gagaagaaag agccctggaa aagaccgagc ccctaacaga ggaaacggag gatccagagc 4020 acccagaagg aatacacgac tccttctttg aacgtgagca tccagggtgg gttcctgggg 4080 tatgcgtgaa gaatctggta aagatttttg agccctgtgg ccggccagct gtggaccgtc 4140 tgaacatcac cttctacgag aaccagatca ccgcattcct gggccacaat ggagctggga 4200 aaaccaccac cttgtaagta tcaaggttac aagacaggtt taaggagacc aatagaaact 4260 gggcttgtcg agacagagaa gactcttgcg tttctgggat ttttccgatt tcggcctatt 4320 ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgt 4380 ttataatttc aggtggcatc tttccaattg aggaacccct agtgatggag ttggccactc 4440 cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg 4500 gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag 4540 <210> 58 <211> 4702 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 58 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct ggatccggga tttttccgat ttcggcctat tggttaaaaa atgagctgat 180 ttaacaaaaa tttaacgcga attttaacaa aatattaacg tttataattt caggtggcat 240 ctttcgatag gcacctattg gtcttactga catccacttt gcctttctct ccacaggtcc 300 atcctgacgg gtctgttgcc accaacctct gggactgtgc tcgttggggg aagggacatt 360 gaaaccagcc tggatgcagt ccggcagagc cttggcatgt gtccacagca caacatcctg 420 ttccaccacc tcacggtggc tgagcacatg ctgttctatg cccagctgaa aggaaagtcc 480 caggaggagg cccagctgga gatggaagcc atgttggagg acacaggcct ccaccacaag 540 cggaatgaag aggctcagga cctatcaggt ggcatgcaga gaaagctgtc ggttgccatt 600 gcctttgtgg gagatgccaa ggtggtgatt ctggacgaac ccacctctgg ggtggaccct 660 tactcgagac gctcaatctg ggatctgctc ctgaagtatc gctcaggcag aaccatcatc 720 atgtccactc accacatgga cgaggccgac ctccttgggg accgcattgc catcattgcc 780 cagggaaggc tctactgctc aggcacccca ctcttcctga agaactgctt tggcacaggc 840 ttgtacttaa ccttggtgcg caagatgaaa aacatccaga gccaaaggaa aggcagtgag 900 gggacctgca gctgctcgtc taagggtttc tccaccacgt gtccagccca cgtcgatgac 960 ctaactccag aacaagtcct ggatggggat gtaaatgagc tgatggatgt agttctccac 1020 catgttccag aggcaaagct ggtggagtgc attggtcaag aacttatctt ccttcttcca 1080 aataagaact tcaagcacag agcatatgcc agccttttca gagagctgga ggagacgctg 1140 gctgaccttg gtctcagcag ttttggaatt tctgacactc ccctggaaga gatttttctg 1200 aaggtcacgg aggattctga ttcaggacct ctgtttgcgg gtggcgctca gcagaaaaga 1260 gaaaacgtca acccccgaca cccctgcttg ggtcccagag agaaggctgg acagacaccc 1320 caggactcca atgtctgctc cccaggggcg ccggctgctc acccagaggg ccagcctccc 1380 ccagagccag agtgcccagg cccgcagctc aacacgggga cacagctggt cctccagcat 1440 gtgcaggcgc tgctggtcaa gagattccaa cacaccatcc gcagccacaa ggacttcctg 1500 gcgcagatcg tgctcccggc tacctttgtg tttttggctc tgatgctttc tattgttatc 1560 cctccttttg gcgaataccc cgctttgacc cttcacccct ggatatatgg gcagcagtac 1620 accttcttca gcatggatga accaggcagt gagcagttca cggtacttgc agacgtcctc 1680 ctgaataagc caggctttgg caaccgctgc ctgaaggaag ggtggcttcc ggagtacccc 1740 tgtggcaact caacaccctg gaagactcct tctgtgtccc caaacatcac ccagctgttc 1800 cagaagcaga aatggacaca ggtcaaccct tcaccatcct gcaggtgcag caccagggag 1860 aagctcacca tgctgccaga gtgccccgag ggtgccgggg gcctcccgcc cccccagaga 1920 acacagcgca gcacggaaat tctacaagac ctgacggaca ggaacatctc cgacttcttg 1980 gtaaaaacgt atcctgctct tataagaagc agcttaaaga gcaaattctg ggtcaatgaa 2040 cagaggtatg gaggaatttc cattggagga aagctcccag tcgtccccat cacgggggaa 2100 gcacttgttg ggtttttaag cgaccttggc cggatcatga atgtgagcgg gggccctatc 2160 actagagagg cctctaaaga aatacctgat ttccttaaac atctagaaac tgaagacaac 2220 attaaggtgt ggtttaataa caaaggctgg catgccctgg tcagctttct caatgtggcc 2280 cacaacgcca tcttacgggc cagcctgcct aaggacagaa gccccgagga gtatggaatc 2340 accgtcatta gccaacccct gaacctgacc aaggagcagc tctcagagat tacagtgctg 2400 accacttcag tggatgctgt ggttgccatc tgcgtgattt tctccatgtc cttcgtccca 2460 gccagctttg tcctttattt gatccaggag cgggtgaaca aatccaagca cctccagttt 2520 atcagtggag tgagccccac cacctactgg gtaaccaact tcctctggga catcatgaat 2580 tattccgtga gtgctgggct ggtggtgggc atcttcatcg ggtttcagaa gaaagcctac 2640 acttctccag aaaaccttcc tgcccttgtg gcactgctcc tgctgtatgg atgggcggtc 2700 attcccatga tgtacccagc atccttcctg tttgatgtcc ccagcacagc ctatgtggct 2760 ttatcttgtg ctaatctgtt catcggcatc aacagcagtg ctattacctt catcttggaa 2820 ttatttgaga ataaccggac gctgctcagg ttcaacgccg tgctgaggaa gctgctcatt 2880 gtcttccccc acttctgcct gggccggggc ctcattgacc ttgcactgag ccaggctgtg 2940 acagatgtct atgcccggtt tggtgaggag cactctgcaa atccgttcca ctgggacctg 3000 attgggaaga acctgtttgc catggtggtg gaaggggtgg tgtacttcct cctgaccctg 3060 ctggtccagc gccacttctt cctctcccaa tggattgccg agcccactaa ggagcccatt 3120 gttgatgaag atgatgatgt ggctgaagaa agacaaagaa ttattactgg tggaaataaa 3180 actgacatct taaggctaca tgaactaacc aagatttatc caggcacctc cagcccagca 3240 gtggacaggc tgtgtgtcgg agttcgccct ggagagtgct ttggcctcct gggagtgaat 3300 ggtgccggca aaacaaccac attcaagatg ctcactgggg acaccacagt gacctcaggg 3360 gatgccaccg tagcaggcaa gagtatttta accaatattt ctgaagtcca tcaaaatatg 3420 ggctactgtc ctcagtttga tgcaatcgat gagctgctca caggacgaga acatctttac 3480 ctttatgccc ggcttcgagg tgtaccagca gaagaaatcg aaaaggttgc aaactggagt 3540 attaagagcc tgggcctgac tgtctacgcc gactgcctgg ctggcacgta cagtgggggc 3600 aacaagcgga aactctccac agccatcgca ctcattggct gcccaccgct ggtgctgctg 3660 gatgagccca ccacagggat ggacccccag gcacgccgca tgctgtggaa cgtcatcgtg 3720 agcatcatca gagaagggag ggctgtggtc ctcacatccc acagcatgga agaatgtgag 3780 gcactgtgta cccggctggc catcatggta aagggcgcct ttcgatgtat gggcaccatt 3840 cagcatctca agtccaaatt tggagatggc tatatcgtca caatgaagat caaatccccg 3900 aaggacgacc tgcttcctga cctgaaccct gtggagcagt tcttccaggg gaacttccca 3960 ggcagtgtgc agagggagag gcactacaac atgctccagt tccaggtctc ctcctcctcc 4020 ctggcgagga tcttccagct cctcctctcc cacaaggaca gcctgctcat cgaggagtac 4080 tcagtcacac agaccacact ggaccaggtg tttgtaaatt ttgctaaaca gcagactgaa 4140 agtcatgacc tccctctgca ccctcgagct gctggagcca gtcgacaagc ccaggacgac 4200 tacaaagacc atgacggtga ttataaagat catgacatcg actacaagga tgacgatgac 4260 aagtgagcgg ccgcttcgag cagacatgat aagatacatt gatgagtttg gacaaaccac 4320 aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt 4380 tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc attttatgtt 4440 tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct acaaatgtgg 4500 taaaatcgat aaggatcttc ctagagcatg gctacgtaga taagtagcat ggcgggttaa 4560 tcattaacta caaggaaccc ctagtgatgg agttggccac tccctctctg cgcgctcgct 4620 cgctcactga ggccgggcga ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct 4680 cagtgagcga gcgagcgcgc ag 4702 <210> 59 <211> 4718 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 59 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240 atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300 gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat 360 caattacggg gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg 420 taaatggccc gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt 480 atgttcccat agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac 540 ggtaaactgc ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg 600 acgtcaatga cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact 660 ttcctacttg gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt 720 ggcagtacac caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc 780 ccattgacgt caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc 840 gtaataaccc cgccccgttg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata 900 taagcagagc tcgtttagtg aaccgtcaga tcactagaag ctttattgcg gtagtttatc 960 acagttaaat tgctaacgca gtcagtgctt ctgacacaac agtctcgaac ttaagctgca 1020 gaagttggtc gtgaggcact gggcaggtaa gtatcaaggt tacaagacag gtttaaggag 1080 accaatagaa actgggcttg tcgagacaga gaagactctt gcgtttctga taggcaccta 1140 ttggtcttac tgacatccac tttgcctttc tctccacagg tgtccactcc cagttcaatt 1200 acagctctta aggctagagt acttaatacg actcactata ggctagcctc gagaattcac 1260 gcgtggtacc tctagagtcg acccgggcgg ccgccatggg cttcgtgaga cagatacagc 1320 ttttgctctg gaagaactgg accctgcgga aaaggcaaaa gattcgcttt gtggtggaac 1380 tcgtgtggcc tttatcttta tttctggtct tgatctggtt aaggaatgcc aacccgctct 1440 acagccatca tgaatgccat ttccccaaca aggcgatgcc ctcagcagga atgctgccgt 1500 ggctccaggg gatcttctgc aatgtgaaca atccctgttt tcaaagcccc accccaggag 1560 aatctcctgg aattgtgtca aactataaca actccatctt ggcaagggta tatcgagatt 1620 ttcaagaact cctcatgaat gcaccagaga gccagcacct tggccgtatt tggacagagc 1680 tacacatctt gtcccaattc atggacaccc tccggactca cccggagaga attgcaggaa 1740 gaggaattcg aataagggat atcttgaaag atgaagaaac actgacacta tttctcatta 1800 aaaacatcgg cctgtctgac tcagtggtct accttctgat caactctcaa gtccgtccag 1860 agcagttcgc tcatggagtc ccggacctgg cgctgaagga catcgcctgc agcgaggccc 1920 tcctggagcg cttcatcatc ttcagccaga gacgcggggc aaagacggtg cgctatgccc 1980 tgtgctccct ctcccagggc accctacagt ggatagaaga cactctgtat gccaacgtgg 2040 acttcttcaa gctcttccgt gtgcttccca cactcctaga cagccgttct caaggtatca 2100 atctgagatc ttggggagga atattatctg atatgtcacc aagaattcaa gagtttatcc 2160 atcggccgag tatgcaggac ttgctgtggg tgaccaggcc cctcatgcag aatggtggtc 2220 cagagacctt tacaaagctg atgggcatcc tgtctgacct cctgtgtggc taccccgagg 2280 gaggtggctc tcgggtgctc tccttcaact ggtatgaaga caataactat aaggcctttc 2340 tggggattga ctccacaagg aaggatccta tctattctta tgacagaaga acaacatcct 2400 tttgtaatgc attgatccag agcctggagt caaatccttt aaccaaaatc gcttggaggg 2460 cggcaaagcc tttgctgatg ggaaaaatcc tgtacactcc tgattcacct gcagcacgaa 2520 ggatactgaa gaatgccaac tcaacttttg aagaactgga acacgttagg aagttggtca 2580 aagcctggga agaagtaggg ccccagatct ggtacttctt tgacaacagc acacagatga 2640 acatgatcag agataccctg gggaacccaa cagtaaaaga ctttttgaat aggcagcttg 2700 gtgaagaagg tattactgct gaagccatcc taaacttcct ctacaagggc cctcgggaaa 2760 gccaggctga cgacatggcc aacttcgact ggagggacat atttaacatc actgatcgca 2820 ccctccgcct tgtcaatcaa tacctggagt gcttggtcct ggataagttt gaaagctaca 2880 atgatgaaac tcagctcacc caacgtgccc tctctctact ggaggaaaac atgttctggg 2940 ccggagtggt attccctgac atgtatccct ggaccagctc tctaccaccc cacgtgaagt 3000 ataagatccg aatggacata gacgtggtgg agaaaaccaa taagattaaa gacaggtatt 3060 gggattctgg tcccagagct gatcccgtgg aagatttccg gtacatctgg ggcgggtttg 3120 cctatctgca ggacatggtt gaacagggga tcacaaggag ccaggtgcag gcggaggctc 3180 cagttggaat ctacctccag cagatgccct acccctgctt cgtggacgat tctttcatga 3240 tcatcctgaa ccgctgtttc cctatcttca tggtgctggc atggatctac tctgtctcca 3300 tgactgtgaa gagcatcgtc ttggagaagg agttgcgact gaaggagacc ttgaaaaatc 3360 agggtgtctc caatgcagtg atttggtgta cctggttcct ggacagcttc tccatcatgt 3420 cgatgagcat cttcctcctg acgatattca tcatgcatgg aagaatccta cattacagcg 3480 acccattcat cctcttcctg ttcttgttgg ctttctccac tgccaccatc atgctgtgct 3540 ttctgctcag caccttcttc tccaaggcca gtctggcagc agcctgtagt ggtgtcatct 3600 atttcaccct ctacctgcca cacatcctgt gcttcgcctg gcaggaccgc atgaccgctg 3660 agctgaagaa ggctgtgagc ttactgtctc cggtggcatt tggatttggc actgagtacc 3720 tggttcgctt tgaagagcaa ggcctggggc tgcagtggag caacatcggg aacagtccca 3780 cggaagggga cgaattcagc ttcctgctgt ccatgcagat gatgctcctt gatgctgctg 3840 tctatggctt actcgcttgg taccttgatc aggtgtttcc aggagactat ggaaccccac 3900 ttccttggta ctttcttcta caagagtcgt attggcttgg cggtgaaggg tgttcaacca 3960 gagaagaaag agccctggaa aagaccgagc ccctaacaga ggaaacggag gatccagagc 4020 acccagaagg aatacacgac tccttctttg aacgtgagca tccagggtgg gttcctgggg 4080 tatgcgtgaa gaatctggta aagatttttg agccctgtgg ccggccagct gtggaccgtc 4140 tgaacatcac cttctacgag aaccagatca ccgcattcct gggccacaat ggagctggga 4200 aaaccaccac cttgtaagta tcaaggttac aagacaggtt taaggagacc aatagaaact 4260 gggcttgtcg agacagagaa gactcttgcg tttctccccg ggtgcgcggc gtcggtggtg 4320 ccggcggggg gcgccaggtc gcaggcggtg tagggctcca ggcaggcggc gaaggccatg 4380 acgtgcgcta tgaaggtctg ctcctgcacg ccgtgaacca ggtgcgcctg cgggccgcgc 4440 gcgaacaccg ccacgtcctc gcctgcgtgg gtctcttcgt ccaggggcac tgctgactgc 4500 tgccgatact cggggctccc gctctcgctc tcggtaacat ccggccgggc gccgtccttg 4560 agcacatagc ctggaccgtt tccaattgag gaacccctag tgatggagtt ggccactccc 4620 tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc 4680 tttgcccggg cggcctcagt gagcgagcga gcgcgcag 4718 <210> 60 <211> 4880 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 60 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct ggatcccccc gggtgcgcgg cgtcggtggt gccggcgggg ggcgccaggt 180 cgcaggcggt gtagggctcc aggcaggcgg cgaaggccat gacgtgcgct atgaaggtct 240 gctcctgcac gccgtgaacc aggtgcgcct gcgggccgcg cgcgaacacc gccacgtcct 300 cgcctgcgtg ggtctcttcg tccaggggca ctgctgactg ctgccgatac tcggggctcc 360 cgctctcgct ctcggtaaca tccggccggg cgccgtcctt gagcacatag cctggaccgt 420 ttcgataggc acctattggt cttactgaca tccactttgc ctttctctcc acaggtccat 480 cctgacgggt ctgttgccac caacctctgg gactgtgctc gttgggggaa gggacattga 540 aaccagcctg gatgcagtcc ggcagagcct tggcatgtgt ccacagcaca acatcctgtt 600 ccaccacctc acggtggctg agcacatgct gttctatgcc cagctgaaag gaaagtccca 660 ggaggaggcc cagctggaga tggaagccat gttggaggac acaggcctcc accacaagcg 720 gaatgaagag gctcaggacc tatcaggtgg catgcagaga aagctgtcgg ttgccattgc 780 ctttgtggga gatgccaagg tggtgattct ggacgaaccc acctctgggg tggaccctta 840 ctcgagacgc tcaatctggg atctgctcct gaagtatcgc tcaggcagaa ccatcatcat 900 gtccactcac cacatggacg aggccgacct ccttggggac cgcattgcca tcattgccca 960 gggaaggctc tactgctcag gcaccccact cttcctgaag aactgctttg gcacaggctt 1020 gtacttaacc ttggtgcgca agatgaaaaa catccagagc caaaggaaag gcagtgaggg 1080 gacctgcagc tgctcgtcta agggtttctc caccacgtgt ccagcccacg tcgatgacct 1140 aactccagaa caagtcctgg atggggatgt aaatgagctg atggatgtag ttctccacca 1200 tgttccagag gcaaagctgg tggagtgcat tggtcaagaa cttatcttcc ttcttccaaa 1260 taagaacttc aagcacagag catatgccag ccttttcaga gagctggagg agacgctggc 1320 tgaccttggt ctcagcagtt ttggaatttc tgacactccc ctggaagaga tttttctgaa 1380 ggtcacggag gattctgatt caggacctct gtttgcgggt ggcgctcagc agaaaagaga 1440 aaacgtcaac ccccgacacc cctgcttggg tcccagagag aaggctggac agacacccca 1500 ggactccaat gtctgctccc caggggcgcc ggctgctcac ccagagggcc agcctccccc 1560 agagccagag tgcccaggcc cgcagctcaa cacggggaca cagctggtcc tccagcatgt 1620 gcaggcgctg ctggtcaaga gattccaaca caccatccgc agccacaagg acttcctggc 1680 gcagatcgtg ctcccggcta cctttgtgtt tttggctctg atgctttcta ttgttatccc 1740 tccttttggc gaataccccg ctttgaccct tcacccctgg atatatgggc agcagtacac 1800 cttcttcagc atggatgaac caggcagtga gcagttcacg gtacttgcag acgtcctcct 1860 gaataagcca ggctttggca accgctgcct gaaggaaggg tggcttccgg agtacccctg 1920 tggcaactca acaccctgga agactccttc tgtgtcccca aacatcaccc agctgttcca 1980 gaagcagaaa tggacacagg tcaacccttc accatcctgc aggtgcagca ccagggagaa 2040 gctcaccatg ctgccagagt gccccgaggg tgccgggggc ctcccgcccc cccagagaac 2100 acagcgcagc acggaaattc tacaagacct gacggacagg aacatctccg acttcttggt 2160 aaaaacgtat cctgctctta taagaagcag cttaaagagc aaattctggg tcaatgaaca 2220 gaggtatgga ggaatttcca ttggaggaaa gctcccagtc gtccccatca cgggggaagc 2280 acttgttggg tttttaagcg accttggccg gatcatgaat gtgagcgggg gccctatcac 2340 tagagaggcc tctaaagaaa tacctgattt ccttaaacat ctagaaactg aagacaacat 2400 taaggtgtgg tttaataaca aaggctggca tgccctggtc agctttctca atgtggccca 2460 caacgccatc ttacgggcca gcctgcctaa ggacagaagc cccgaggagt atggaatcac 2520 cgtcattagc caacccctga acctgaccaa ggagcagctc tcagagatta cagtgctgac 2580 cacttcagtg gatgctgtgg ttgccatctg cgtgattttc tccatgtcct tcgtcccagc 2640 cagctttgtc ctttatttga tccaggagcg ggtgaacaaa tccaagcacc tccagtttat 2700 cagtggagtg agccccacca cctactgggt aaccaacttc ctctgggaca tcatgaatta 2760 ttccgtgagt gctgggctgg tggtgggcat cttcatcggg tttcagaaga aagcctacac 2820 ttctccagaa aaccttcctg cccttgtggc actgctcctg ctgtatggat gggcggtcat 2880 tcccatgatg tacccagcat ccttcctgtt tgatgtcccc agcacagcct atgtggcttt 2940 atcttgtgct aatctgttca tcggcatcaa cagcagtgct attaccttca tcttggaatt 3000 atttgagaat aaccggacgc tgctcaggtt caacgccgtg ctgaggaagc tgctcattgt 3060 cttcccccac ttctgcctgg gccggggcct cattgacctt gcactgagcc aggctgtgac 3120 agatgtctat gcccggtttg gtgaggagca ctctgcaaat ccgttccact gggacctgat 3180 tgggaagaac ctgtttgcca tggtggtgga aggggtggtg tacttcctcc tgaccctgct 3240 ggtccagcgc cacttcttcc tctcccaatg gattgccgag cccactaagg agcccattgt 3300 tgatgaagat gatgatgtgg ctgaagaaag acaaagaatt attactggtg gaaataaaac 3360 tgacatctta aggctacatg aactaaccaa gatttatcca ggcacctcca gcccagcagt 3420 ggacaggctg tgtgtcggag ttcgccctgg agagtgcttt ggcctcctgg gagtgaatgg 3480 tgccggcaaa acaaccacat tcaagatgct cactggggac accacagtga cctcagggga 3540 tgccaccgta gcaggcaaga gtattttaac caatatttct gaagtccatc aaaatatggg 3600 ctactgtcct cagtttgatg caatcgatga gctgctcaca ggacgagaac atctttacct 3660 ttatgcccgg cttcgaggtg taccagcaga agaaatcgaa aaggttgcaa actggagtat 3720 taagagcctg ggcctgactg tctacgccga ctgcctggct ggcacgtaca gtgggggcaa 3780 caagcggaaa ctctccacag ccatcgcact cattggctgc ccaccgctgg tgctgctgga 3840 tgagcccacc acagggatgg acccccaggc acgccgcatg ctgtggaacg tcatcgtgag 3900 catcatcaga gaagggaggg ctgtggtcct cacatcccac agcatggaag aatgtgaggc 3960 actgtgtacc cggctggcca tcatggtaaa gggcgccttt cgatgtatgg gcaccattca 4020 gcatctcaag tccaaatttg gagatggcta tatcgtcaca atgaagatca aatccccgaa 4080 ggacgacctg cttcctgacc tgaaccctgt ggagcagttc ttccagggga acttcccagg 4140 cagtgtgcag agggagaggc actacaacat gctccagttc caggtctcct cctcctccct 4200 ggcgaggatc ttccagctcc tcctctccca caaggacagc ctgctcatcg aggagtactc 4260 agtcacacag accacactgg accaggtgtt tgtaaatttt gctaaacagc agactgaaag 4320 tcatgacctc cctctgcacc ctcgagctgc tggagccagt cgacaagccc aggacgacta 4380 caaagaccat gacggtgatt ataaagatca tgacatcgac tacaaggatg acgatgacaa 4440 gtgagcggcc gcttcgagca gacatgataa gatacattga tgagtttgga caaaccacaa 4500 ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg tgatgctatt gctttatttg 4560 taaccattat aagctgcaat aaacaagtta acaacaacaa ttgcattcat tttatgtttc 4620 aggttcaggg ggagatgtgg gaggtttttt aaagcaagta aaacctctac aaatgtggta 4680 aaatcgataa ggatcttcct agagcatggc tacgtagata agtagcatgg cgggttaatc 4740 attaactaca aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg 4800 ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca 4860 gtgagcgagc gagcgcgcag 4880 <210> 61 <211> 4719 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 61 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240 atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300 gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat 360 caattacggg gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg 420 taaatggccc gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt 480 atgttcccat agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac 540 ggtaaactgc ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg 600 acgtcaatga cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact 660 ttcctacttg gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt 720 ggcagtacac caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc 780 ccattgacgt caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc 840 gtaataaccc cgccccgttg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata 900 taagcagagc tcgtttagtg aaccgtcaga tcactagaag ctttattgcg gtagtttatc 960 acagttaaat tgctaacgca gtcagtgctt ctgacacaac agtctcgaac ttaagctgca 1020 gaagttggtc gtgaggcact gggcaggtaa gtatcaaggt tacaagacag gtttaaggag 1080 accaatagaa actgggcttg tcgagacaga gaagactctt gcgtttctga taggcaccta 1140 ttggtcttac tgacatccac tttgcctttc tctccacagg tgtccactcc cagttcaatt 1200 acagctctta aggctagagt acttaatacg actcactata ggctagcctc gagaattcac 1260 gcgtggtacc tctagagtcg acccgggcgg ccgccatggg cttcgtgaga cagatacagc 1320 ttttgctctg gaagaactgg accctgcgga aaaggcaaaa gattcgcttt gtggtggaac 1380 tcgtgtggcc tttatcttta tttctggtct tgatctggtt aaggaatgcc aacccgctct 1440 acagccatca tgaatgccat ttccccaaca aggcgatgcc ctcagcagga atgctgccgt 1500 ggctccaggg gatcttctgc aatgtgaaca atccctgttt tcaaagcccc accccaggag 1560 aatctcctgg aattgtgtca aactataaca actccatctt ggcaagggta tatcgagatt 1620 ttcaagaact cctcatgaat gcaccagaga gccagcacct tggccgtatt tggacagagc 1680 tacacatctt gtcccaattc atggacaccc tccggactca cccggagaga attgcaggaa 1740 gaggaattcg aataagggat atcttgaaag atgaagaaac actgacacta tttctcatta 1800 aaaacatcgg cctgtctgac tcagtggtct accttctgat caactctcaa gtccgtccag 1860 agcagttcgc tcatggagtc ccggacctgg cgctgaagga catcgcctgc agcgaggccc 1920 tcctggagcg cttcatcatc ttcagccaga gacgcggggc aaagacggtg cgctatgccc 1980 tgtgctccct ctcccagggc accctacagt ggatagaaga cactctgtat gccaacgtgg 2040 acttcttcaa gctcttccgt gtgcttccca cactcctaga cagccgttct caaggtatca 2100 atctgagatc ttggggagga atattatctg atatgtcacc aagaattcaa gagtttatcc 2160 atcggccgag tatgcaggac ttgctgtggg tgaccaggcc cctcatgcag aatggtggtc 2220 cagagacctt tacaaagctg atgggcatcc tgtctgacct cctgtgtggc taccccgagg 2280 gaggtggctc tcgggtgctc tccttcaact ggtatgaaga caataactat aaggcctttc 2340 tggggattga ctccacaagg aaggatccta tctattctta tgacagaaga acaacatcct 2400 tttgtaatgc attgatccag agcctggagt caaatccttt aaccaaaatc gcttggaggg 2460 cggcaaagcc tttgctgatg ggaaaaatcc tgtacactcc tgattcacct gcagcacgaa 2520 ggatactgaa gaatgccaac tcaacttttg aagaactgga acacgttagg aagttggtca 2580 aagcctggga agaagtaggg ccccagatct ggtacttctt tgacaacagc acacagatga 2640 acatgatcag agataccctg gggaacccaa cagtaaaaga ctttttgaat aggcagcttg 2700 gtgaagaagg tattactgct gaagccatcc taaacttcct ctacaagggc cctcgggaaa 2760 gccaggctga cgacatggcc aacttcgact ggagggacat atttaacatc actgatcgca 2820 ccctccgcct tgtcaatcaa tacctggagt gcttggtcct ggataagttt gaaagctaca 2880 atgatgaaac tcagctcacc caacgtgccc tctctctact ggaggaaaac atgttctggg 2940 ccggagtggt attccctgac atgtatccct ggaccagctc tctaccaccc cacgtgaagt 3000 ataagatccg aatggacata gacgtggtgg agaaaaccaa taagattaaa gacaggtatt 3060 gggattctgg tcccagagct gatcccgtgg aagatttccg gtacatctgg ggcgggtttg 3120 cctatctgca ggacatggtt gaacagggga tcacaaggag ccaggtgcag gcggaggctc 3180 cagttggaat ctacctccag cagatgccct acccctgctt cgtggacgat tctttcatga 3240 tcatcctgaa ccgctgtttc cctatcttca tggtgctggc atggatctac tctgtctcca 3300 tgactgtgaa gagcatcgtc ttggagaagg agttgcgact gaaggagacc ttgaaaaatc 3360 agggtgtctc caatgcagtg atttggtgta cctggttcct ggacagcttc tccatcatgt 3420 cgatgagcat cttcctcctg acgatattca tcatgcatgg aagaatccta cattacagcg 3480 acccattcat cctcttcctg ttcttgttgg ctttctccac tgccaccatc atgctgtgct 3540 ttctgctcag caccttcttc tccaaggcca gtctggcagc agcctgtagt ggtgtcatct 3600 atttcaccct ctacctgcca cacatcctgt gcttcgcctg gcaggaccgc atgaccgctg 3660 agctgaagaa ggctgtgagc ttactgtctc cggtggcatt tggatttggc actgagtacc 3720 tggttcgctt tgaagagcaa ggcctggggc tgcagtggag caacatcggg aacagtccca 3780 cggaagggga cgaattcagc ttcctgctgt ccatgcagat gatgctcctt gatgctgctg 3840 tctatggctt actcgcttgg taccttgatc aggtgtttcc aggagactat ggaaccccac 3900 ttccttggta ctttcttcta caagagtcgt attggcttgg cggtgaaggg tgttcaacca 3960 gagaagaaag agccctggaa aagaccgagc ccctaacaga ggaaacggag gatccagagc 4020 acccagaagg aatacacgac tccttctttg aacgtgagca tccagggtgg gttcctgggg 4080 tatgcgtgaa gaatctggta aagatttttg agccctgtgg ccggccagct gtggaccgtc 4140 tgaacatcac cttctacgag aaccagatca ccgcattcct gggccacaat ggagctggga 4200 aaaccaccac cttgtaagta tcaaggttac aagacaggtt taaggagacc aatagaaact 4260 gggcttgtcg agacagagaa gactcttgcg tttctcgcag ggcagcctct gtcatctcca 4320 tcagggaggg gtccagtgtg gagtctcggt ggatctcgta tttcatgtct ccaggctcaa 4380 agagacccat gagatgggtc acagacgggt ccagggaagc ctgcatgagc tcagtgcggt 4440 tccacacata ccgggcaccc tggcgcttcg ccagccattc ctgcaccaga ttcttcccgt 4500 ccagcctggt cccaccttgg ctgtagtcat ctgggtactc agggtctggg gttcccatgc 4560 gaaacatgta ctttcggcct ccacaattga ggaaccccta gtgatggagt tggccactcc 4620 ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg 4680 ctttgcccgg gcggcctcag tgagcgagcg agcgcgcag 4719 <210> 62 <211> 4881 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 62 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct ggatcccgca gggcagcctc tgtcatctcc atcagggagg ggtccagtgt 180 ggagtctcgg tggatctcgt atttcatgtc tccaggctca aagagaccca tgagatgggt 240 cacagacggg tccagggaag cctgcatgag ctcagtgcgg ttccacacat accgggcacc 300 ctggcgcttc gccagccatt cctgcaccag attcttcccg tccagcctgg tcccaccttg 360 gctgtagtca tctgggtact cagggtctgg ggttcccatg cgaaacatgt actttcggcc 420 tccagatagg cacctattgg tcttactgac atccactttg cctttctctc cacaggtcca 480 tcctgacggg tctgttgcca ccaacctctg ggactgtgct cgttggggga agggacattg 540 aaaccagcct ggatgcagtc cggcagagcc ttggcatgtg tccacagcac aacatcctgt 600 tccaccacct cacggtggct gagcacatgc tgttctatgc ccagctgaaa ggaaagtccc 660 aggaggaggc ccagctggag atggaagcca tgttggagga cacaggcctc caccacaagc 720 ggaatgaaga ggctcaggac ctatcaggtg gcatgcagag aaagctgtcg gttgccattg 780 cctttgtggg agatgccaag gtggtgattc tggacgaacc cacctctggg gtggaccctt 840 actcgagacg ctcaatctgg gatctgctcc tgaagtatcg ctcaggcaga accatcatca 900 tgtccactca ccacatggac gaggccgacc tccttgggga ccgcattgcc atcattgccc 960 agggaaggct ctactgctca ggcaccccac tcttcctgaa gaactgcttt ggcacaggct 1020 tgtacttaac cttggtgcgc aagatgaaaa acatccagag ccaaaggaaa ggcagtgagg 1080 ggacctgcag ctgctcgtct aagggtttct ccaccacgtg tccagcccac gtcgatgacc 1140 taactccaga acaagtcctg gatggggatg taaatgagct gatggatgta gttctccacc 1200 atgttccaga ggcaaagctg gtggagtgca ttggtcaaga acttatcttc cttcttccaa 1260 ataagaactt caagcacaga gcatatgcca gccttttcag agagctggag gagacgctgg 1320 ctgaccttgg tctcagcagt tttggaattt ctgacactcc cctggaagag atttttctga 1380 aggtcacgga ggattctgat tcaggacctc tgtttgcggg tggcgctcag cagaaaagag 1440 aaaacgtcaa cccccgacac ccctgcttgg gtcccagaga gaaggctgga cagacacccc 1500 aggactccaa tgtctgctcc ccaggggcgc cggctgctca cccagagggc cagcctcccc 1560 cagagccaga gtgcccaggc ccgcagctca acacggggac acagctggtc ctccagcatg 1620 tgcaggcgct gctggtcaag agattccaac acaccatccg cagccacaag gacttcctgg 1680 cgcagatcgt gctcccggct acctttgtgt ttttggctct gatgctttct attgttatcc 1740 ctccttttgg cgaatacccc gctttgaccc ttcacccctg gatatatggg cagcagtaca 1800 ccttcttcag catggatgaa ccaggcagtg agcagttcac ggtacttgca gacgtcctcc 1860 tgaataagcc aggctttggc aaccgctgcc tgaaggaagg gtggcttccg gagtacccct 1920 gtggcaactc aacaccctgg aagactcctt ctgtgtcccc aaacatcacc cagctgttcc 1980 agaagcagaa atggacacag gtcaaccctt caccatcctg caggtgcagc accagggaga 2040 agctcaccat gctgccagag tgccccgagg gtgccggggg cctcccgccc ccccagagaa 2100 cacagcgcag cacggaaatt ctacaagacc tgacggacag gaacatctcc gacttcttgg 2160 taaaaacgta tcctgctctt ataagaagca gcttaaagag caaattctgg gtcaatgaac 2220 agaggtatgg aggaatttcc attggaggaa agctcccagt cgtccccatc acgggggaag 2280 cacttgttgg gtttttaagc gaccttggcc ggatcatgaa tgtgagcggg ggccctatca 2340 ctagagaggc ctctaaagaa atacctgatt tccttaaaca tctagaaact gaagacaaca 2400 ttaaggtgtg gtttaataac aaaggctggc atgccctggt cagctttctc aatgtggccc 2460 acaacgccat cttacgggcc agcctgccta aggacagaag ccccgaggag tatggaatca 2520 ccgtcattag ccaacccctg aacctgacca aggagcagct ctcagagatt acagtgctga 2580 ccacttcagt ggatgctgtg gttgccatct gcgtgatttt ctccatgtcc ttcgtcccag 2640 ccagctttgt cctttatttg atccaggagc gggtgaacaa atccaagcac ctccagttta 2700 tcagtggagt gagccccacc acctactggg taaccaactt cctctgggac atcatgaatt 2760 attccgtgag tgctgggctg gtggtgggca tcttcatcgg gtttcagaag aaagcctaca 2820 cttctccaga aaaccttcct gcccttgtgg cactgctcct gctgtatgga tgggcggtca 2880 ttcccatgat gtacccagca tccttcctgt ttgatgtccc cagcacagcc tatgtggctt 2940 tatcttgtgc taatctgttc atcggcatca acagcagtgc tattaccttc atcttggaat 3000 tatttgagaa taaccggacg ctgctcaggt tcaacgccgt gctgaggaag ctgctcattg 3060 tcttccccca cttctgcctg ggccggggcc tcattgacct tgcactgagc caggctgtga 3120 cagatgtcta tgcccggttt ggtgaggagc actctgcaaa tccgttccac tgggacctga 3180 ttgggaagaa cctgtttgcc atggtggtgg aaggggtggt gtacttcctc ctgaccctgc 3240 tggtccagcg ccacttcttc ctctcccaat ggattgccga gcccactaag gagcccattg 3300 ttgatgaaga tgatgatgtg gctgaagaaa gacaaagaat tattactggt ggaaataaaa 3360 ctgacatctt aaggctacat gaactaacca agatttatcc aggcacctcc agcccagcag 3420 tggacaggct gtgtgtcgga gttcgccctg gagagtgctt tggcctcctg ggagtgaatg 3480 gtgccggcaa aacaaccaca ttcaagatgc tcactgggga caccacagtg acctcagggg 3540 atgccaccgt agcaggcaag agtattttaa ccaatatttc tgaagtccat caaaatatgg 3600 gctactgtcc tcagtttgat gcaatcgatg agctgctcac aggacgagaa catctttacc 3660 tttatgcccg gcttcgaggt gtaccagcag aagaaatcga aaaggttgca aactggagta 3720 ttaagagcct gggcctgact gtctacgccg actgcctggc tggcacgtac agtgggggca 3780 acaagcggaa actctccaca gccatcgcac tcattggctg cccaccgctg gtgctgctgg 3840 atgagcccac cacagggatg gacccccagg cacgccgcat gctgtggaac gtcatcgtga 3900 gcatcatcag agaagggagg gctgtggtcc tcacatccca cagcatggaa gaatgtgagg 3960 cactgtgtac ccggctggcc atcatggtaa agggcgcctt tcgatgtatg ggcaccattc 4020 agcatctcaa gtccaaattt ggagatggct atatcgtcac aatgaagatc aaatccccga 4080 aggacgacct gcttcctgac ctgaaccctg tggagcagtt cttccagggg aacttcccag 4140 gcagtgtgca gagggagagg cactacaaca tgctccagtt ccaggtctcc tcctcctccc 4200 tggcgaggat cttccagctc ctcctctccc acaaggacag cctgctcatc gaggagtact 4260 cagtcacaca gaccacactg gaccaggtgt ttgtaaattt tgctaaacag cagactgaaa 4320 gtcatgacct ccctctgcac cctcgagctg ctggagccag tcgacaagcc caggacgact 4380 acaaagacca tgacggtgat tataaagatc atgacatcga ctacaaggat gacgatgaca 4440 agtgagcggc cgcttcgagc agacatgata agatacattg atgagtttgg acaaaccaca 4500 actagaatgc agtgaaaaaa atgctttatt tgtgaaattt gtgatgctat tgctttattt 4560 gtaaccatta taagctgcaa taaacaagtt aacaacaaca attgcattca ttttatgttt 4620 caggttcagg gggagatgtg ggaggttttt taaagcaagt aaaacctcta caaatgtggt 4680 aaaatcgata aggatcttcc tagagcatgg ctacgtagat aagtagcatg gcgggttaat 4740 cattaactac aaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc 4800 gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc 4860 agtgagcgag cgagcgcgca g 4881 <210> 63 <211> 4709 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 63 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240 atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300 gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat 360 caattacggg gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg 420 taaatggccc gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt 480 atgttcccat agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac 540 ggtaaactgc ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg 600 acgtcaatga cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact 660 ttcctacttg gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt 720 ggcagtacac caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc 780 ccattgacgt caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc 840 gtaataaccc cgccccgttg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata 900 taagcagagc tcgtttagtg aaccgtcaga tcactagaag ctttattgcg gtagtttatc 960 acagttaaat tgctaacgca gtcagtgctt ctgacacaac agtctcgaac ttaagctgca 1020 gaagttggtc gtgaggcact gggcaggtaa gtatcaaggt tacaagacag gtttaaggag 1080 accaatagaa actgggcttg tcgagacaga gaagactctt gcgtttctga taggcaccta 1140 ttggtcttac tgacatccac tttgcctttc tctccacagg tgtccactcc cagttcaatt 1200 acagctctta aggctagagt acttaatacg actcactata ggctagcctc gagaattcac 1260 gcgtggtacc tctagagtcg acccgggcgg ccgccatggg cttcgtgaga cagatacagc 1320 ttttgctctg gaagaactgg accctgcgga aaaggcaaaa gattcgcttt gtggtggaac 1380 tcgtgtggcc tttatcttta tttctggtct tgatctggtt aaggaatgcc aacccgctct 1440 acagccatca tgaatgccat ttccccaaca aggcgatgcc ctcagcagga atgctgccgt 1500 ggctccaggg gatcttctgc aatgtgaaca atccctgttt tcaaagcccc accccaggag 1560 aatctcctgg aattgtgtca aactataaca actccatctt ggcaagggta tatcgagatt 1620 ttcaagaact cctcatgaat gcaccagaga gccagcacct tggccgtatt tggacagagc 1680 tacacatctt gtcccaattc atggacaccc tccggactca cccggagaga attgcaggaa 1740 gaggaattcg aataagggat atcttgaaag atgaagaaac actgacacta tttctcatta 1800 aaaacatcgg cctgtctgac tcagtggtct accttctgat caactctcaa gtccgtccag 1860 agcagttcgc tcatggagtc ccggacctgg cgctgaagga catcgcctgc agcgaggccc 1920 tcctggagcg cttcatcatc ttcagccaga gacgcggggc aaagacggtg cgctatgccc 1980 tgtgctccct ctcccagggc accctacagt ggatagaaga cactctgtat gccaacgtgg 2040 acttcttcaa gctcttccgt gtgcttccca cactcctaga cagccgttct caaggtatca 2100 atctgagatc ttggggagga atattatctg atatgtcacc aagaattcaa gagtttatcc 2160 atcggccgag tatgcaggac ttgctgtggg tgaccaggcc cctcatgcag aatggtggtc 2220 cagagacctt tacaaagctg atgggcatcc tgtctgacct cctgtgtggc taccccgagg 2280 gaggtggctc tcgggtgctc tccttcaact ggtatgaaga caataactat aaggcctttc 2340 tggggattga ctccacaagg aaggatccta tctattctta tgacagaaga acaacatcct 2400 tttgtaatgc attgatccag agcctggagt caaatccttt aaccaaaatc gcttggaggg 2460 cggcaaagcc tttgctgatg ggaaaaatcc tgtacactcc tgattcacct gcagcacgaa 2520 ggatactgaa gaatgccaac tcaacttttg aagaactgga acacgttagg aagttggtca 2580 aagcctggga agaagtaggg ccccagatct ggtacttctt tgacaacagc acacagatga 2640 acatgatcag agataccctg gggaacccaa cagtaaaaga ctttttgaat aggcagcttg 2700 gtgaagaagg tattactgct gaagccatcc taaacttcct ctacaagggc cctcgggaaa 2760 gccaggctga cgacatggcc aacttcgact ggagggacat atttaacatc actgatcgca 2820 ccctccgcct tgtcaatcaa tacctggagt gcttggtcct ggataagttt gaaagctaca 2880 atgatgaaac tcagctcacc caacgtgccc tctctctact ggaggaaaac atgttctggg 2940 ccggagtggt attccctgac atgtatccct ggaccagctc tctaccaccc cacgtgaagt 3000 ataagatccg aatggacata gacgtggtgg agaaaaccaa taagattaaa gacaggtatt 3060 gggattctgg tcccagagct gatcccgtgg aagatttccg gtacatctgg ggcgggtttg 3120 cctatctgca ggacatggtt gaacagggga tcacaaggag ccaggtgcag gcggaggctc 3180 cagttggaat ctacctccag cagatgccct acccctgctt cgtggacgat tctttcatga 3240 tcatcctgaa ccgctgtttc cctatcttca tggtgctggc atggatctac tctgtctcca 3300 tgactgtgaa gagcatcgtc ttggagaagg agttgcgact gaaggagacc ttgaaaaatc 3360 agggtgtctc caatgcagtg atttggtgta cctggttcct ggacagcttc tccatcatgt 3420 cgatgagcat cttcctcctg acgatattca tcatgcatgg aagaatccta cattacagcg 3480 acccattcat cctcttcctg ttcttgttgg ctttctccac tgccaccatc atgctgtgct 3540 ttctgctcag caccttcttc tccaaggcca gtctggcagc agcctgtagt ggtgtcatct 3600 atttcaccct ctacctgcca cacatcctgt gcttcgcctg gcaggaccgc atgaccgctg 3660 agctgaagaa ggctgtgagc ttactgtctc cggtggcatt tggatttggc actgagtacc 3720 tggttcgctt tgaagagcaa ggcctggggc tgcagtggag caacatcggg aacagtccca 3780 cggaagggga cgaattcagc ttcctgctgt ccatgcagat gatgctcctt gatgctgctg 3840 tctatggctt actcgcttgg taccttgatc aggtgtttcc aggagactat ggaaccccac 3900 ttccttggta ctttcttcta caagagtcgt attggcttgg cggtgaaggg tgttcaacca 3960 gagaagaaag agccctggaa aagaccgagc ccctaacaga ggaaacggag gatccagagc 4020 acccagaagg aatacacgac tccttctttg aacgtgagca tccagggtgg gttcctgggg 4080 tatgcgtgaa gaatctggta aagatttttg agccctgtgg ccggccagct gtggaccgtc 4140 tgaacatcac cttctacgag aaccagatca ccgcattcct gggccacaat ggagctggga 4200 aaaccaccac cttgtaagta tcaaggttac aagacaggtt taaggagacc aatagaaact 4260 gggcttgtcg agacagagaa gactcttgcg tttctgtgat cctaggtgga ggccgaaagt 4320 acatgtttcg catgggaacc ccagaccctg agtacccaga tgactacagc caaggtggga 4380 ccaggctgga cgggaagaat ctggtgcagg aatggctggc gaagcgccag ggtgcccggt 4440 acgtgtggaa ccgcactgag ctcatgcagg cttccctgga cccgtctgtg acccatctca 4500 tgggtctctt tgagcctgga gacatgaaat acgagatcca ccgagactcc acactggacc 4560 cctccctgat ggacaattga ggaaccccta gtgatggagt tggccactcc ctctctgcgc 4620 gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg ctttgcccgg 4680 gcggcctcag tgagcgagcg agcgcgcag 4709 <210> 64 <211> 4871 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 64 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct ggatccgtga tcctaggtgg aggccgaaag tacatgtttc gcatgggaac 180 cccagaccct gagtacccag atgactacag ccaaggtggg accaggctgg acgggaagaa 240 tctggtgcag gaatggctgg cgaagcgcca gggtgcccgg tacgtgtgga accgcactga 300 gctcatgcag gcttccctgg acccgtctgt gacccatctc atgggtctct ttgagcctgg 360 agacatgaaa tacgagatcc accgagactc cacactggac ccctccctga tggagatagg 420 cacctattgg tcttactgac atccactttg cctttctctc cacaggtcca tcctgacggg 480 tctgttgcca ccaacctctg ggactgtgct cgttggggga agggacattg aaaccagcct 540 ggatgcagtc cggcagagcc ttggcatgtg tccacagcac aacatcctgt tccaccacct 600 cacggtggct gagcacatgc tgttctatgc ccagctgaaa ggaaagtccc aggaggaggc 660 ccagctggag atggaagcca tgttggagga cacaggcctc caccacaagc ggaatgaaga 720 ggctcaggac ctatcaggtg gcatgcagag aaagctgtcg gttgccattg cctttgtggg 780 agatgccaag gtggtgattc tggacgaacc cacctctggg gtggaccctt actcgagacg 840 ctcaatctgg gatctgctcc tgaagtatcg ctcaggcaga accatcatca tgtccactca 900 ccacatggac gaggccgacc tccttgggga ccgcattgcc atcattgccc agggaaggct 960 ctactgctca ggcaccccac tcttcctgaa gaactgcttt ggcacaggct tgtacttaac 1020 cttggtgcgc aagatgaaaa acatccagag ccaaaggaaa ggcagtgagg ggacctgcag 1080 ctgctcgtct aagggtttct ccaccacgtg tccagcccac gtcgatgacc taactccaga 1140 acaagtcctg gatggggatg taaatgagct gatggatgta gttctccacc atgttccaga 1200 ggcaaagctg gtggagtgca ttggtcaaga acttatcttc cttcttccaa ataagaactt 1260 caagcacaga gcatatgcca gccttttcag agagctggag gagacgctgg ctgaccttgg 1320 tctcagcagt tttggaattt ctgacactcc cctggaagag atttttctga aggtcacgga 1380 ggattctgat tcaggacctc tgtttgcggg tggcgctcag cagaaaagag aaaacgtcaa 1440 cccccgacac ccctgcttgg gtcccagaga gaaggctgga cagacacccc aggactccaa 1500 tgtctgctcc ccaggggcgc cggctgctca cccagagggc cagcctcccc cagagccaga 1560 gtgcccaggc ccgcagctca acacggggac acagctggtc ctccagcatg tgcaggcgct 1620 gctggtcaag agattccaac acaccatccg cagccacaag gacttcctgg cgcagatcgt 1680 gctcccggct acctttgtgt ttttggctct gatgctttct attgttatcc ctccttttgg 1740 cgaatacccc gctttgaccc ttcacccctg gatatatggg cagcagtaca ccttcttcag 1800 catggatgaa ccaggcagtg agcagttcac ggtacttgca gacgtcctcc tgaataagcc 1860 aggctttggc aaccgctgcc tgaaggaagg gtggcttccg gagtacccct gtggcaactc 1920 aacaccctgg aagactcctt ctgtgtcccc aaacatcacc cagctgttcc agaagcagaa 1980 atggacacag gtcaaccctt caccatcctg caggtgcagc accagggaga agctcaccat 2040 gctgccagag tgccccgagg gtgccggggg cctcccgccc ccccagagaa cacagcgcag 2100 cacggaaatt ctacaagacc tgacggacag gaacatctcc gacttcttgg taaaaacgta 2160 tcctgctctt ataagaagca gcttaaagag caaattctgg gtcaatgaac agaggtatgg 2220 aggaatttcc attggaggaa agctcccagt cgtccccatc acgggggaag cacttgttgg 2280 gtttttaagc gaccttggcc ggatcatgaa tgtgagcggg ggccctatca ctagagaggc 2340 ctctaaagaa atacctgatt tccttaaaca tctagaaact gaagacaaca ttaaggtgtg 2400 gtttaataac aaaggctggc atgccctggt cagctttctc aatgtggccc acaacgccat 2460 cttacgggcc agcctgccta aggacagaag ccccgaggag tatggaatca ccgtcattag 2520 ccaacccctg aacctgacca aggagcagct ctcagagatt acagtgctga ccacttcagt 2580 ggatgctgtg gttgccatct gcgtgatttt ctccatgtcc ttcgtcccag ccagctttgt 2640 cctttatttg atccaggagc gggtgaacaa atccaagcac ctccagttta tcagtggagt 2700 gagccccacc acctactggg taaccaactt cctctgggac atcatgaatt attccgtgag 2760 tgctgggctg gtggtgggca tcttcatcgg gtttcagaag aaagcctaca cttctccaga 2820 aaaccttcct gcccttgtgg cactgctcct gctgtatgga tgggcggtca ttcccatgat 2880 gtacccagca tccttcctgt ttgatgtccc cagcacagcc tatgtggctt tatcttgtgc 2940 taatctgttc atcggcatca acagcagtgc tattaccttc atcttggaat tatttgagaa 3000 taaccggacg ctgctcaggt tcaacgccgt gctgaggaag ctgctcattg tcttccccca 3060 cttctgcctg ggccggggcc tcattgacct tgcactgagc caggctgtga cagatgtcta 3120 tgcccggttt ggtgaggagc actctgcaaa tccgttccac tgggacctga ttgggaagaa 3180 cctgtttgcc atggtggtgg aaggggtggt gtacttcctc ctgaccctgc tggtccagcg 3240 ccacttcttc ctctcccaat ggattgccga gcccactaag gagcccattg ttgatgaaga 3300 tgatgatgtg gctgaagaaa gacaaagaat tattactggt ggaaataaaa ctgacatctt 3360 aaggctacat gaactaacca agatttatcc aggcacctcc agcccagcag tggacaggct 3420 gtgtgtcgga gttcgccctg gagagtgctt tggcctcctg ggagtgaatg gtgccggcaa 3480 aacaaccaca ttcaagatgc tcactgggga caccacagtg acctcagggg atgccaccgt 3540 agcaggcaag agtattttaa ccaatatttc tgaagtccat caaaatatgg gctactgtcc 3600 tcagtttgat gcaatcgatg agctgctcac aggacgagaa catctttacc tttatgcccg 3660 gcttcgaggt gtaccagcag aagaaatcga aaaggttgca aactggagta ttaagagcct 3720 gggcctgact gtctacgccg actgcctggc tggcacgtac agtgggggca acaagcggaa 3780 actctccaca gccatcgcac tcattggctg cccaccgctg gtgctgctgg atgagcccac 3840 cacagggatg gacccccagg cacgccgcat gctgtggaac gtcatcgtga gcatcatcag 3900 agaagggagg gctgtggtcc tcacatccca cagcatggaa gaatgtgagg cactgtgtac 3960 ccggctggcc atcatggtaa agggcgcctt tcgatgtatg ggcaccattc agcatctcaa 4020 gtccaaattt ggagatggct atatcgtcac aatgaagatc aaatccccga aggacgacct 4080 gcttcctgac ctgaaccctg tggagcagtt cttccagggg aacttcccag gcagtgtgca 4140 gagggagagg cactacaaca tgctccagtt ccaggtctcc tcctcctccc tggcgaggat 4200 cttccagctc ctcctctccc acaaggacag cctgctcatc gaggagtact cagtcacaca 4260 gaccacactg gaccaggtgt ttgtaaattt tgctaaacag cagactgaaa gtcatgacct 4320 ccctctgcac cctcgagctg ctggagccag tcgacaagcc caggacgact acaaagacca 4380 tgacggtgat tataaagatc atgacatcga ctacaaggat gacgatgaca agtgagcggc 4440 cgcttcgagc agacatgata agatacattg atgagtttgg acaaaccaca actagaatgc 4500 agtgaaaaaa atgctttatt tgtgaaattt gtgatgctat tgctttattt gtaaccatta 4560 taagctgcaa taaacaagtt aacaacaaca attgcattca ttttatgttt caggttcagg 4620 gggagatgtg ggaggttttt taaagcaagt aaaacctcta caaatgtggt aaaatcgata 4680 aggatcttcc tagagcatgg ctacgtagat aagtagcatg gcgggttaat cattaactac 4740 aaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag 4800 gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc agtgagcgag 4860 cgagcgcgca g 4871 <210> 65 <211> 4073 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 65 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240 atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300 gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagtggg ccccagaagc 360 ctggtggttg tttgtccttc tcaggggaaa agtgaggcgg ccccttggag gaaggggccg 420 ggcagaatga tctaatcgga ttccaagcag ctcaggggat tgtctttttc tagcaccttc 480 ttgccactcc taagcgtcct ccgtgacccc ggctgggatt tagcctggtg ctgtgtcagc 540 cccgggctcc caggggcttc ccagtggtcc ccaggaaccc tcgacagggc cagggcgtct 600 ctctcgtcca gcaagggcag ggacgggcca caggcaaggg cgcggccgcc atgggcttcg 660 tgagacagat acagcttttg ctctggaaga actggaccct gcggaaaagg caaaagattc 720 gctttgtggt ggaactcgtg tggcctttat ctttatttct ggtcttgatc tggttaagga 780 atgccaaccc gctctacagc catcatgaat gccatttccc caacaaggcg atgccctcag 840 caggaatgct gccgtggctc caggggatct tctgcaatgt gaacaatccc tgttttcaaa 900 gccccacccc aggagaatct cctggaattg tgtcaaacta taacaactcc atcttggcaa 960 gggtatatcg agattttcaa gaactcctca tgaatgcacc agagagccag caccttggcc 1020 gtatttggac agagctacac atcttgtccc aattcatgga caccctccgg actcacccgg 1080 agagaattgc aggaagagga attcgaataa gggatatctt gaaagatgaa gaaacactga 1140 cactatttct cattaaaaac atcggcctgt ctgactcagt ggtctacctt ctgatcaact 1200 ctcaagtccg tccagagcag ttcgctcatg gagtcccgga cctggcgctg aaggacatcg 1260 cctgcagcga ggccctcctg gagcgcttca tcatcttcag ccagagacgc ggggcaaaga 1320 cggtgcgcta tgccctgtgc tccctctccc agggcaccct acagtggata gaagacactc 1380 tgtatgccaa cgtggacttc ttcaagctct tccgtgtgct tcccacactc ctagacagcc 1440 gttctcaagg tatcaatctg agatcttggg gaggaatatt atctgatatg tcaccaagaa 1500 ttcaagagtt tatccatcgg ccgagtatgc aggacttgct gtgggtgacc aggcccctca 1560 tgcagaatgg tggtccagag acctttacaa agctgatggg catcctgtct gacctcctgt 1620 gtggctaccc cgagggaggt ggctctcggg tgctctcctt caactggtat gaagacaata 1680 actataaggc ctttctgggg attgactcca caaggaagga tcctatctat tcttatgaca 1740 gaagaacaac atccttttgt aatgcattga tccagagcct ggagtcaaat cctttaacca 1800 aaatcgcttg gagggcggca aagcctttgc tgatgggaaa aatcctgtac actcctgatt 1860 cacctgcagc acgaaggata ctgaagaatg ccaactcaac ttttgaagaa ctggaacacg 1920 ttaggaagtt ggtcaaagcc tgggaagaag tagggcccca gatctggtac ttctttgaca 1980 acagcacaca gatgaacatg atcagagata ccctggggaa cccaacagta aaagactttt 2040 tgaataggca gcttggtgaa gaaggtatta ctgctgaagc catcctaaac ttcctctaca 2100 agggccctcg ggaaagccag gctgacgaca tggccaactt cgactggagg gacatattta 2160 acatcactga tcgcaccctc cgccttgtca atcaatacct ggagtgcttg gtcctggata 2220 agtttgaaag ctacaatgat gaaactcagc tcacccaacg tgccctctct ctactggagg 2280 aaaacatgtt ctgggccgga gtggtattcc ctgacatgta tccctggacc agctctctac 2340 caccccacgt gaagtataag atccgaatgg acatagacgt ggtggagaaa accaataaga 2400 ttaaagacag gtattgggat tctggtccca gagctgatcc cgtggaagat ttccggtaca 2460 tctggggcgg gtttgcctat ctgcaggaca tggttgaaca ggggatcaca aggagccagg 2520 tgcaggcgga ggctccagtt ggaatctacc tccagcagat gccctacccc tgcttcgtgg 2580 acgattcttt catgatcatc ctgaaccgct gtttccctat cttcatggtg ctggcatgga 2640 tctactctgt ctccatgact gtgaagagca tcgtcttgga gaaggagttg cgactgaagg 2700 agaccttgaa aaatcagggt gtctccaatg cagtgatttg gtgtacctgg ttcctggaca 2760 gcttctccat catgtcgatg agcatcttcc tcctgacgat attcatcatg catggaagaa 2820 tcctacatta cagcgaccca ttcatcctct tcctgttctt gttggctttc tccactgcca 2880 ccatcatgct gtgctttctg ctcagcacct tcttctccaa ggccagtctg gcagcagcct 2940 gtagtggtgt catctatttc accctctacc tgccacacat cctgtgcttc gcctggcagg 3000 accgcatgac cgctgagctg aagaaggctg tgagcttact gtctccggtg gcatttggat 3060 ttggcactga gtacctggtt cgctttgaag agcaaggcct ggggctgcag tggagcaaca 3120 tcgggaacag tcccacggaa ggggacgaat tcagcttcct gctgtccatg cagatgatgc 3180 tccttgatgc tgctgtctat ggcttactcg cttggtacct tgatcaggtg tttccaggag 3240 actatggaac cccacttcct tggtactttc ttctacaaga gtcgtattgg cttggcggtg 3300 aagggtgttc aaccagagaa gaaagagccc tggaaaagac cgagccccta acagaggaaa 3360 cggaggatcc agagcaccca gaaggaatac acgactcctt ctttgaacgt gagcatccag 3420 ggtgggttcc tggggtatgc gtgaagaatc tggtaaagat ttttgagccc tgtggccggc 3480 cagctgtgga ccgtctgaac atcaccttct acgagaacca gatcaccgca ttcctgggcc 3540 acaatggagc tgggaaaacc accaccttgt aagtatcaag gttacaagac aggtttaagg 3600 agaccaatag aaactgggct tgtcgagaca gagaagactc ttgcgtttct ccccgggtgc 3660 gcggcgtcgg tggtgccggc ggggggcgcc aggtcgcagg cggtgtaggg ctccaggcag 3720 gcggcgaagg ccatgacgtg cgctatgaag gtctgctcct gcacgccgtg aaccaggtgc 3780 gcctgcgggc cgcgcgcgaa caccgccacg tcctcgcctg cgtgggtctc ttcgtccagg 3840 ggcactgctg actgctgccg atactcgggg ctcccgctct cgctctcggt aacatccggc 3900 cgggcgccgt ccttgagcac atagcctgga ccgtttccaa ttgaggaacc cctagtgatg 3960 gagttggcca ctccctctct gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc 4020 gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg agcgagcgcg cag 4073 <210> 66 <211> 4074 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 66 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240 atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300 gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagtggg ccccagaagc 360 ctggtggttg tttgtccttc tcaggggaaa agtgaggcgg ccccttggag gaaggggccg 420 ggcagaatga tctaatcgga ttccaagcag ctcaggggat tgtctttttc tagcaccttc 480 ttgccactcc taagcgtcct ccgtgacccc ggctgggatt tagcctggtg ctgtgtcagc 540 cccgggctcc caggggcttc ccagtggtcc ccaggaaccc tcgacagggc cagggcgtct 600 ctctcgtcca gcaagggcag ggacgggcca caggcaaggg cgcggccgcc atgggcttcg 660 tgagacagat acagcttttg ctctggaaga actggaccct gcggaaaagg caaaagattc 720 gctttgtggt ggaactcgtg tggcctttat ctttatttct ggtcttgatc tggttaagga 780 atgccaaccc gctctacagc catcatgaat gccatttccc caacaaggcg atgccctcag 840 caggaatgct gccgtggctc caggggatct tctgcaatgt gaacaatccc tgttttcaaa 900 gccccacccc aggagaatct cctggaattg tgtcaaacta taacaactcc atcttggcaa 960 gggtatatcg agattttcaa gaactcctca tgaatgcacc agagagccag caccttggcc 1020 gtatttggac agagctacac atcttgtccc aattcatgga caccctccgg actcacccgg 1080 agagaattgc aggaagagga attcgaataa gggatatctt gaaagatgaa gaaacactga 1140 cactatttct cattaaaaac atcggcctgt ctgactcagt ggtctacctt ctgatcaact 1200 ctcaagtccg tccagagcag ttcgctcatg gagtcccgga cctggcgctg aaggacatcg 1260 cctgcagcga ggccctcctg gagcgcttca tcatcttcag ccagagacgc ggggcaaaga 1320 cggtgcgcta tgccctgtgc tccctctccc agggcaccct acagtggata gaagacactc 1380 tgtatgccaa cgtggacttc ttcaagctct tccgtgtgct tcccacactc ctagacagcc 1440 gttctcaagg tatcaatctg agatcttggg gaggaatatt atctgatatg tcaccaagaa 1500 ttcaagagtt tatccatcgg ccgagtatgc aggacttgct gtgggtgacc aggcccctca 1560 tgcagaatgg tggtccagag acctttacaa agctgatggg catcctgtct gacctcctgt 1620 gtggctaccc cgagggaggt ggctctcggg tgctctcctt caactggtat gaagacaata 1680 actataaggc ctttctgggg attgactcca caaggaagga tcctatctat tcttatgaca 1740 gaagaacaac atccttttgt aatgcattga tccagagcct ggagtcaaat cctttaacca 1800 aaatcgcttg gagggcggca aagcctttgc tgatgggaaa aatcctgtac actcctgatt 1860 cacctgcagc acgaaggata ctgaagaatg ccaactcaac ttttgaagaa ctggaacacg 1920 ttaggaagtt ggtcaaagcc tgggaagaag tagggcccca gatctggtac ttctttgaca 1980 acagcacaca gatgaacatg atcagagata ccctggggaa cccaacagta aaagactttt 2040 tgaataggca gcttggtgaa gaaggtatta ctgctgaagc catcctaaac ttcctctaca 2100 agggccctcg ggaaagccag gctgacgaca tggccaactt cgactggagg gacatattta 2160 acatcactga tcgcaccctc cgccttgtca atcaatacct ggagtgcttg gtcctggata 2220 agtttgaaag ctacaatgat gaaactcagc tcacccaacg tgccctctct ctactggagg 2280 aaaacatgtt ctgggccgga gtggtattcc ctgacatgta tccctggacc agctctctac 2340 caccccacgt gaagtataag atccgaatgg acatagacgt ggtggagaaa accaataaga 2400 ttaaagacag gtattgggat tctggtccca gagctgatcc cgtggaagat ttccggtaca 2460 tctggggcgg gtttgcctat ctgcaggaca tggttgaaca ggggatcaca aggagccagg 2520 tgcaggcgga ggctccagtt ggaatctacc tccagcagat gccctacccc tgcttcgtgg 2580 acgattcttt catgatcatc ctgaaccgct gtttccctat cttcatggtg ctggcatgga 2640 tctactctgt ctccatgact gtgaagagca tcgtcttgga gaaggagttg cgactgaagg 2700 agaccttgaa aaatcagggt gtctccaatg cagtgatttg gtgtacctgg ttcctggaca 2760 gcttctccat catgtcgatg agcatcttcc tcctgacgat attcatcatg catggaagaa 2820 tcctacatta cagcgaccca ttcatcctct tcctgttctt gttggctttc tccactgcca 2880 ccatcatgct gtgctttctg ctcagcacct tcttctccaa ggccagtctg gcagcagcct 2940 gtagtggtgt catctatttc accctctacc tgccacacat cctgtgcttc gcctggcagg 3000 accgcatgac cgctgagctg aagaaggctg tgagcttact gtctccggtg gcatttggat 3060 ttggcactga gtacctggtt cgctttgaag agcaaggcct ggggctgcag tggagcaaca 3120 tcgggaacag tcccacggaa ggggacgaat tcagcttcct gctgtccatg cagatgatgc 3180 tccttgatgc tgctgtctat ggcttactcg cttggtacct tgatcaggtg tttccaggag 3240 actatggaac cccacttcct tggtactttc ttctacaaga gtcgtattgg cttggcggtg 3300 aagggtgttc aaccagagaa gaaagagccc tggaaaagac cgagccccta acagaggaaa 3360 cggaggatcc agagcaccca gaaggaatac acgactcctt ctttgaacgt gagcatccag 3420 ggtgggttcc tggggtatgc gtgaagaatc tggtaaagat ttttgagccc tgtggccggc 3480 cagctgtgga ccgtctgaac atcaccttct acgagaacca gatcaccgca ttcctgggcc 3540 acaatggagc tgggaaaacc accaccttgt aagtatcaag gttacaagac aggtttaagg 3600 agaccaatag aaactgggct tgtcgagaca gagaagactc ttgcgtttct cgcagggcag 3660 cctctgtcat ctccatcagg gaggggtcca gtgtggagtc tcggtggatc tcgtatttca 3720 tgtctccagg ctcaaagaga cccatgagat gggtcacaga cgggtccagg gaagcctgca 3780 tgagctcagt gcggttccac acataccggg caccctggcg cttcgccagc cattcctgca 3840 ccagattctt cccgtccagc ctggtcccac cttggctgta gtcatctggg tactcagggt 3900 ctggggttcc catgcgaaac atgtactttc ggcctccaca attgaggaac ccctagtgat 3960 ggagttggcc actccctctc tgcgcgctcg ctcgctcact gaggccgggc gaccaaaggt 4020 cgcccgacgc ccgggctttg cccgggcggc ctcagtgagc gagcgagcgc gcag 4074 <210> 67 <211> 4636 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 67 ctctcccccc tgtcgcgttc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60 agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120 cgcgacaggg gggagagtgc cacactctca agcaaggggg ttttgtaagc agtgagctag 180 cctgaattcc agcacactgg cggccgttac tagtggatct tcaatattgg ccattagcca 240 tattattcat tggttatata gcataaatca atattggcta ttggccattg catacgttgt 300 atctatatca taatatgtac atttatattg gctcatgtcc aatatgaccg ccatgttggc 360 attgattatt gactagttat taatagtaat caattacggg gtcattagtt catagcccat 420 atatggagtt ccgcgttaca taacttacgg taaatggccc gcctggctga ccgcccaacg 480 acccccgccc attgacgtca ataatgacgt atgttcccat agtaacgcca atagggactt 540 tccattgacg tcaatgggtg gagtatttac ggtaaactgc ccacttggca gtacatcaag 600 tgtatcatat gccaagtccg ccccctattg acgtcaatga cggtaaatgg cccgcctggc 660 attatgccca gtacatgacc ttacgggact ttcctacttg gcagtacatc tacgtattag 720 tcatcgctat taccatggtg atgcggtttt ggcagtacac caatgggcgt ggatagcggt 780 ttgactcacg gggatttcca agtctccacc ccattgacgt caatgggagt ttgttttggc 840 accaaaatca acgggacttt ccaaaatgtc gtaataaccc cgccccgttg acgcaaatgg 900 gcggtaggcg tgtacggtgg gaggtctata taagcagagc tcgtttagtg aaccgtcaga 960 tcactagaag ctttattgcg gtagtttatc acagttaaat tgctaacgca gtcagtgctt 1020 ctgacacaac agtctcgaac ttaagctgca gaagttggtc gtgaggcact gggcaggtaa 1080 gtatcaaggt tacaagacag gtttaaggag accaatagaa actgggcttg tcgagacaga 1140 gaagactctt gcgtttctga taggcaccta ttggtcttac tgacatccac tttgcctttc 1200 tctccacagg tgtccactcc cagttcaatt acagctctta aggctagagt acttaatacg 1260 actcactata ggctagcctc gagaattcac gcgtggtacc tctagagtcg acccgggcgg 1320 ccgccatggg cttcgtgaga cagatacagc ttttgctctg gaagaactgg accctgcgga 1380 aaaggcaaaa gattcgcttt gtggtggaac tcgtgtggcc tttatcttta tttctggtct 1440 tgatctggtt aaggaatgcc aacccgctct acagccatca tgaatgccat ttccccaaca 1500 aggcgatgcc ctcagcagga atgctgccgt ggctccaggg gatcttctgc aatgtgaaca 1560 atccctgttt tcaaagcccc accccaggag aatctcctgg aattgtgtca aactataaca 1620 actccatctt ggcaagggta tatcgagatt ttcaagaact cctcatgaat gcaccagaga 1680 gccagcacct tggccgtatt tggacagagc tacacatctt gtcccaattc atggacaccc 1740 tccggactca cccggagaga attgcaggaa gaggaattcg aataagggat atcttgaaag 1800 atgaagaaac actgacacta tttctcatta aaaacatcgg cctgtctgac tcagtggtct 1860 accttctgat caactctcaa gtccgtccag agcagttcgc tcatggagtc ccggacctgg 1920 cgctgaagga catcgcctgc agcgaggccc tcctggagcg cttcatcatc ttcagccaga 1980 gacgcggggc aaagacggtg cgctatgccc tgtgctccct ctcccagggc accctacagt 2040 ggatagaaga cactctgtat gccaacgtgg acttcttcaa gctcttccgt gtgcttccca 2100 cactcctaga cagccgttct caaggtatca atctgagatc ttggggagga atattatctg 2160 atatgtcacc aagaattcaa gagtttatcc atcggccgag tatgcaggac ttgctgtggg 2220 tgaccaggcc cctcatgcag aatggtggtc cagagacctt tacaaagctg atgggcatcc 2280 tgtctgacct cctgtgtggc taccccgagg gaggtggctc tcgggtgctc tccttcaact 2340 ggtatgaaga caataactat aaggcctttc tggggattga ctccacaagg aaggatccta 2400 tctattctta tgacagaaga acaacatcct tttgtaatgc attgatccag agcctggagt 2460 caaatccttt aaccaaaatc gcttggaggg cggcaaagcc tttgctgatg ggaaaaatcc 2520 tgtacactcc tgattcacct gcagcacgaa ggatactgaa gaatgccaac tcaacttttg 2580 aagaactgga acacgttagg aagttggtca aagcctggga agaagtaggg ccccagatct 2640 ggtacttctt tgacaacagc acacagatga acatgatcag agataccctg gggaacccaa 2700 cagtaaaaga ctttttgaat aggcagcttg gtgaagaagg tattactgct gaagccatcc 2760 taaacttcct ctacaagggc cctcgggaaa gccaggctga cgacatggcc aacttcgact 2820 ggagggacat atttaacatc actgatcgca ccctccgcct tgtcaatcaa tacctggagt 2880 gcttggtcct ggataagttt gaaagctaca atgatgaaac tcagctcacc caacgtgccc 2940 tctctctact ggaggaaaac atgttctggg ccggagtggt attccctgac atgtatccct 3000 ggaccagctc tctaccaccc cacgtgaagt ataagatccg aatggacata gacgtggtgg 3060 agaaaaccaa taagattaaa gacaggtatt gggactacaa agaccatgac ggtgattata 3120 aagatcatga catcgactac aaggatgacg atgacaagga ttctggtccc agagctgatc 3180 ccgtggaaga tttccggtac atctggggcg ggtttgccta tctgcaggac atggttgaac 3240 aggggatcac aaggagccag gtgcaggcgg aggctccagt tggaatctac ctccagcaga 3300 tgccctaccc ctgcttcgtg gacgattctt tcatgatcat cctgaaccgc tgtttcccta 3360 tcttcatggt gctggcatgg atctactctg tctccatgac tgtgaagagc atcgtcttgg 3420 agaaggagtt gcgactgaag gagaccttga aaaatcaggg tgtctccaat gcagtgattt 3480 ggtgtacctg gttcctggac agcttctcca tcatgtcgat gagcatcttc ctcctgacga 3540 tattcatcat gcatggaaga atcctacatt acagcgaccc attcatcctc ttcctgttct 3600 tgttggcttt ctccactgcc accatcatgc tgtgctttct gctcagcacc ttcttctcca 3660 aggccagtct ggcagcagcc tgtagtggtg tcatctattt caccctctac ctgccacaca 3720 tcctgtgctt cgcctggcag gaccgcatga ccgctgagct gaagaaggct gtgagcttac 3780 tgtctccggt ggcatttgga tttggcactg agtacctggt tcgctttgaa gagcaaggcc 3840 tggggctgca gtggagcaac atcgggaaca gtcccacgga aggggacgaa ttcagcttcc 3900 tgctgtccat gcagatgatg ctccttgatg ctgctgtcta tggcttactc gcttggtacc 3960 ttgatcaggt gtttccagga gactatggaa ccccacttcc ttggtacttt cttctacaag 4020 agtcgtattg gcttggcggt gaagggtgtt caaccagaga agaaagagcc ctggaaaaga 4080 ccgagcccct aacagaggaa acggaggatc cagagcaccc agaaggaata cacgactcct 4140 tctttgaacg tgagcatcca gggtgggttc ctggggtatg cgtgaagaat ctggtaaaga 4200 tttttgagcc ctgtggccgg ccagctgtgg accgtctgaa catcaccttc tacgagaacc 4260 agatcaccgc attcctgggc cacaatggag ctgggaaaac caccaccttg taagtatcaa 4320 ggttacaaga caggtttaag gagaccaata gaaactgggc ttgtcgagac agagaagact 4380 cttgcgtttc tgggattttt ccgatttcgg cctattggtt aaaaaatgag ctgatttaac 4440 aaaaatttaa cgcgaatttt aacaaaatat taacgtttat aatttcaggt ggcatctttc 4500 caattgagga acccctagtg atggagttgg ccactccctc tctgcgcgct cgctcgctca 4560 ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga 4620 gcgagcgagc gcgcag 4636 <210> 68 <211> 4731 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 68 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct ggatccggga tttttccgat ttcggcctat tggttaaaaa atgagctgat 180 ttaacaaaaa tttaacgcga attttaacaa aatattaacg tttataattt caggtggcat 240 ctttcgatag gcacctattg gtcttactga catccacttt gcctttctct ccacaggtcc 300 atcctgacgg gtctgttgcc accaacctct gggactgtgc tcgttggggg aagggacatt 360 gaaaccagcc tggatgcagt ccggcagagc cttggcatgt gtccacagca caacatcctg 420 ttccaccacc tcacggtggc tgagcacatg ctgttctatg cccagctgaa aggaaagtcc 480 caggaggagg cccagctgga gatggaagcc atgttggagg acacaggcct ccaccacaag 540 cggaatgaag aggctcagga cctatcaggt ggcatgcaga gaaagctgtc ggttgccatt 600 gcctttgtgg gagatgccaa ggtggtgatt ctggacgaac ccacctctgg ggtggaccct 660 tactcgagac gctcaatctg ggatctgctc ctgaagtatc gctcaggcag aaccatcatc 720 atgtccactc accacatgga cgaggccgac ctccttgggg accgcattgc catcattgcc 780 cagggaaggc tctactgctc aggcacccca ctcttcctga agaactgctt tggcacaggc 840 ttgtacttaa ccttggtgcg caagatgaaa aacatccaga gccaaaggaa aggcagtgag 900 gggacctgca gctgctcgtc taagggtttc tccaccacgt gtccagccca cgtcgatgac 960 ctaactccag aacaagtcct ggatggggat gtaaatgagc tgatggatgt agttctccac 1020 catgttccag aggcaaagct ggtggagtgc attggtcaag aacttatctt ccttcttcca 1080 aataagaact tcaagcacag agcatatgcc agccttttca gagagctgga ggagacgctg 1140 gctgaccttg gtctcagcag ttttggaatt tctgacactc ccctggaaga gatttttctg 1200 aaggtcacgg aggattctga ttcaggacct ctgtttgcgg gtggcgctca gcagaaaaga 1260 gaaaacgtca acccccgaca cccctgcttg ggtcccagag agaaggctgg acagacaccc 1320 caggactcca atgtctgctc cccaggggcg ccggctgctc acccagaggg ccagcctccc 1380 ccagagccag agtgcccagg cccgcagctc aacacgggga cacagctggt cctccagcat 1440 gtgcaggcgc tgctggtcaa gagattccaa cacaccatcc gcagccacaa ggacttcctg 1500 gcgcagatcg tgctcccggc tacctttgtg tttttggctc tgatgctttc tattgttatc 1560 cctccttttg gcgaataccc cgctttgacc cttcacccct ggatatatgg gcagcagtac 1620 accttcttca gcatggatga accaggcagt gagcagttca cggtacttgc agacgtcctc 1680 ctgaataagc caggctttgg caaccgctgc ctgaaggaag ggtggcttcc ggagtacccc 1740 tgtggcaact caacaccctg gaagactcct tctgtgtccc caaacatcac ccagctgttc 1800 cagaagcaga aatggacaca ggtcaaccct tcaccatcct gcaggtgcag caccagggag 1860 aagctcacca tgctgccaga gtgccccgag ggtgccgggg gcctcccgcc cccccagaga 1920 acacagcgca gcacggaaat tctacaagac ctgacggaca ggaacatctc cgacttcttg 1980 gtaaaaacgt atcctgctct tataagaagc agcttaaaga gcaaattctg ggtcaatgaa 2040 cagaggtatg gaggaatttc cattggagga aagctcccag tcgtccccat cacgggggaa 2100 gcacttgttg ggtttttaag cgaccttggc cggatcatga atgtgagcgg gggccctatc 2160 actagagagg cctctaaaga aatacctgat ttccttaaac atctagaaac tgaagacaac 2220 attaaggtgt ggtttaataa caaaggctgg catgccctgg tcagctttct caatgtggcc 2280 cacaacgcca tcttacgggc cagcctgcct aaggacagaa gccccgagga gtatggaatc 2340 accgtcatta gccaacccct gaacctgacc aaggagcagc tctcagagat tacagtgctg 2400 accacttcag tggatgctgt ggttgccatc tgcgtgattt tctccatgtc cttcgtccca 2460 gccagctttg tcctttattt gatccaggag cgggtgaaca aatccaagca cctccagttt 2520 atcagtggag tgagccccac cacctactgg gtaaccaact tcctctggga catcatgaat 2580 tattccgtga gtgctgggct ggtggtgggc atcttcatcg ggtttcagaa gaaagcctac 2640 acttctccag aaaaccttcc tgcccttgtg gcactgctcc tgctgtatgg atgggcggtc 2700 attcccatga tgtacccagc atccttcctg tttgatgtcc ccagcacagc ctatgtggct 2760 ttatcttgtg ctaatctgtt catcggcatc aacagcagtg ctattacctt catcttggaa 2820 ttatttgaga ataaccggac gctgctcagg ttcaacgccg tgctgaggaa gctgctcatt 2880 gtcttccccc acttctgcct gggccggggc ctcattgacc ttgcactgag ccaggctgtg 2940 acagatgtct atgcccggtt tggtgaggag cactctgcaa atccgttcca ctgggacctg 3000 attgggaaga acctgtttgc catggtggtg gaaggggtgg tgtacttcct cctgaccctg 3060 ctggtccagc gccacttctt cctctcccaa tggattgccg agcccactaa ggagcccatt 3120 gttgatgaag atgatgatgt ggctgaagaa agacaaagaa ttattactgg tggaaataaa 3180 actgacatct taaggctaca tgaactaacc aagatttatc caggcacctc cagcccagca 3240 gtggacaggc tgtgtgtcgg agttcgccct ggagagtgct ttggcctcct gggagtgaat 3300 ggtgccggca aaacaaccac attcaagatg ctcactgggg acaccacagt gacctcaggg 3360 gatgccaccg tagcaggcaa gagtatttta accaatattt ctgaagtcca tcaaaatatg 3420 ggctactgtc ctcagtttga tgcaatcgat gagctgctca caggacgaga acatctttac 3480 ctttatgccc ggcttcgagg tgtaccagca gaagaaatcg aaaaggttgc aaactggagt 3540 attaagagcc tgggcctgac tgtctacgcc gactgcctgg ctggcacgta cagtgggggc 3600 aacaagcgga aactctccac agccatcgca ctcattggct gcccaccgct ggtgctgctg 3660 gatgagccca ccacagggat ggacccccag gcacgccgca tgctgtggaa cgtcatcgtg 3720 agcatcatca gagaagggag ggctgtggtc ctcacatccc acagcatgga agaatgtgag 3780 gcactgtgta cccggctggc catcatggta aagggcgcct ttcgatgtat gggcaccatt 3840 cagcatctca agtccaaatt tggagatggc tatatcgtca caatgaagat caaatccccg 3900 aaggacgacc tgcttcctga cctgaaccct gtggagcagt tcttccaggg gaacttccca 3960 ggcagtgtgc agagggagag gcactacaac atgctccagt tccaggtctc ctcctcctcc 4020 ctggcgagga tcttccagct cctcctctcc cacaaggaca gcctgctcat cgaggagtac 4080 tcagtcacac agaccacact ggaccaggtg tttgtaaatt ttgctaaaca gcagactgaa 4140 agtcatgacc tccctctgca ccctcgagct gctggagcca gtcgacaagc ccaggacgac 4200 tacaaagacc atgacggtga ttataaagat catgacatcg actacaagga tgacgatgac 4260 aagtgagcgg ccgcttcgag cagacatgat aagatacatt gatgagtttg gacaaaccac 4320 aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt 4380 tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc attttatgtt 4440 tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct acaaatgtgg 4500 taaaatcgat aaggatcttc ctagagcatg gctacatctg cagaattcag gctagctcac 4560 tgcttacaaa acccccttgc ttgagagtgt ggcactctcc cccctgtcgc gttcgctcgc 4620 tcgctggctc gtttgggggg gcgacggcca gagggccgtc gtctggcagc tctttgagct 4680 gccacccccc caaacgagcc agcgagcgag cgaacgcgac aggggggaga g 4731 <210> 69 <211> 4420 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 69 ctctcccccc tgtcgcgttc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60 agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120 cgcgacaggg gggagagtgc cacactctca agcaaggggg ttttgtaagc agtgagctag 180 cgtgccacct ggtcgacatt gattattgac tagttattaa tagtaatcaa ttacggggtc 240 attagttcat agcccatata tggagttccg cgttacataa cttacggtaa atggcccgcc 300 tggctgaccg cccaacgacc cccgcccatt gacgtcaata atgacgtatg ttcccatagt 360 aacgccaata gggactttcc attgacgtca atgggtggag tatttacggt aaactgccca 420 cttggcagta catcaagtgt atcatatgcc aagtacgccc cctattgacg tcaatgacgg 480 taaatggccc gcctggcatt atgcccagta catgacctta tgggactttc ctacttggca 540 gtacatctac gtattagtca tcgctattac catggtcgag gtgagcccca cgttctgctt 600 cactctcccc atctcccccc cctccccacc cccaattttg tatttattta ttttttaatt 660 attttgtgca gcgatggggg cggggcgggg cgaggcggag aggtgcggcg gcagccaatc 720 ggagcggcgc gctccgaaag tttcctttta tggcgaggcg gcggcggcgg cggctctata 780 aaaagcgaag cgcgcggcgg gcggctgcag aagttggtcg tgaggcactg ggcaggtaag 840 tatcaaggtt acaagacagg tttaaggaga ccaatagaaa ctgggcttgt cgagacagag 900 aagactcttg cgtttctgat aggcacctat tggtcttact gacatccact ttgcctttct 960 ctccacaggt gtccaggcgg ccgccatggt gattcttcag cagggggacc atgtgtggat 1020 ggacctgaga ttggggcagg agttcgacgt gcccatcggg gcggtggtga agctctgcga 1080 ctctgggcag gtccaggtgg tggatgatga agacaatgaa cactggatct ctccgcagaa 1140 cgcaacgcac atcaagccta tgcaccccac gtcggtccac ggcgtggagg acatgatccg 1200 cctgggggac ctcaacgagg cgggcatctt gcgcaacctg cttatccgct accgggacca 1260 cctcatctac acgtatacgg gctccatcct ggtggctgtg aacccctacc agctgctctc 1320 catctactcg ccagagcaca tccgccagta taccaacaag aagattgggg agatgccccc 1380 ccacatcttt gccattgctg acaactgcta cttcaacatg aaacgcaaca gccgagacca 1440 gtgctgcatc atcagtgggg aatctggggc cgggaagacg gagagcacaa agctgatcct 1500 gcagttcctg gcagccatca gtgggcagca ctcgtggatt gagcagcagg tcttggaggc 1560 cacccccatt ctggaagcat ttgggaatgc caagaccatc cgcaatgaca actcaagccg 1620 tttcggaaag tacatcgaca tccacttcaa caagcggggc gccatcgagg gcgcgaagat 1680 tgagcagtac ctgctggaaa agtcacgtgt ctgtcgccag gccctggatg aaaggaacta 1740 ccacgtgttc tactgcatgc tggagggcat gagtgaggat cagaagaaga agctgggctt 1800 gggccaggcc tctgactaca actacttggc catgggtaac tgcataacct gtgagggccg 1860 ggtggacagc caggagtacg ccaacatccg ctccgccatg aaggtgctca tgttcactga 1920 caccgagaac tgggagatct cgaagctcct ggctgccatc ctgcacctgg gcaacctgca 1980 gtatgaggca cgcacatttg aaaacctgga tgcctgtgag gttctcttct ccccatcgct 2040 ggccacagct gcatccctgc ttgaggtgaa ccccccagac ctgatgagct gcctgactag 2100 ccgcaccctc atcacccgcg gggagacggt gtccacccca ctgagcaggg aacaggcact 2160 ggacgtgcgc gacgccttcg taaaggggat ctacgggcgg ctgttcgtgt ggattgtgga 2220 caagatcaac gcagcaattt acaagcctcc ctcccaggat gtgaagaact ctcgcaggtc 2280 catcggcctc ctggacatct ttgggtttga gaactttgct gtgaacagct ttgagcagct 2340 ctgcatcaac ttcgccaatg agcacctgca gcagttcttt gtgcggcacg tgttcaagct 2400 ggagcaggag gaatatgacc tggagagcat tgactggctg cacatcgagt tcactgacaa 2460 ccaggatgcc ctggacatga ttgccaacaa gcccatgaac atcatctccc tcatcgatga 2520 ggagagcaag ttccccaagg gcacagacac caccatgtta cacaagctga actcccagca 2580 caagctcaac gccaactaca tcccccccaa gaacaaccat gagacccagt ttggcatcaa 2640 ccattttgca ggcatcgtct actatgagac ccaaggcttc ctggagaaga accgagacac 2700 cctgcatggg gacattatcc agctggtcca ctcctccagg aacaagttca tcaagcagat 2760 cttccaggcc gatgtcgcca tgggcgccga gaccaggaag cgctcgccca cacttagcag 2820 ccagttcaag cggtcactgg agctgctgat gcgcacgctg ggtgcctgcc agcccttctt 2880 tgtgcgatgc atcaagccca atgagttcaa gaagcccatg ctgttcgacc ggcacctgtg 2940 cgtgcgccag ctgcggtact caggaatgat ggagaccatc cgaatccgcc gagctggcta 3000 ccccatccgc tacagcttcg tagagtttgt ggagcggtac cgtgtgctgc tgccaggtgt 3060 gaagccggcc tacaagcagg gcgacctccg cgggacttgc cagcgcatgg ctgaggctgt 3120 gctgggcacc cacgatgact ggcagatagg caaaaccaag atctttctga aggaccacca 3180 tgacatgctg ctggaagtgg agcgggacaa agccatcacc gacagagtca tcctccttca 3240 gaaagtcatc cggggattca aagacaggtc taactttctg aagctgaaga acgctgccac 3300 actgatccag aggcactggc ggggtcacaa ctgtaggaag aactacgggc tgatgcgtct 3360 gggcttcctg cggctgcagg ccctgcaccg ctcccggaag ctgcaccagc agtaccgcct 3420 ggcccgccag cgcatcatcc agttccaggc ccgctgccgc gcctatctgg tgcgcaaggc 3480 cttccgccac cgcctctggg ctgtgctcac cgtgcaggcc tatgcccggg gcatgatcgc 3540 ccgcaggctg caccaacgcc tcagggctga gtatctgtgg cgcctcgagg ctgagaaaat 3600 gcggctggcg gaggaagaga agcttcggaa ggagatgagc gccaagaagg ccaaggagga 3660 ggccgagcgc aagcatcagg agcgcctggc ccagctggct cgtgaggacg ctgagcggga 3720 gctgaaggag aaggaggccg ctcggcggaa gaaggagctc ctggagcaga tggaaagggc 3780 ccgccatgag cctgtcaatc actcagacat ggtggacaag atgtttggct tcctggggac 3840 ttcaggtggc ctgccaggcc aggagggcca ggcacctagt ggctttgagg acctggagcg 3900 agggcggagg gagatggtgg aggaggacct ggatgcagcc ctgcccctgc ctgacgagga 3960 tgaggaggac ctctctgagt ataaatttgc caagttcgcg gccacctact tccaggggac 4020 aactacgcac tcctacaccc ggcggccact caaacagcca ctgctctacc atgacgacga 4080 gggtgaccag ctggtaagta tcaaggttac aagacaggtt taaggagacc aatagaaact 4140 gggcttgtcg agacagagaa gactcttgcg tttctgggat ttttccgatt tcggcctatt 4200 ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgt 4260 ttataatttc aggtggcatc tttccaattg aggaacccct agtgatggag ttggccactc 4320 cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg 4380 gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag 4420 <210> 70 <211> 4367 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 70 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct ggatccggga ttttgccgat ttcggcctat tggttaaaaa atgagctgat 180 ttaacaaaaa tttaacgcga attttaacaa aatattaacg tttataattt caggtggcat 240 ctttcgatag gcacctattg gtcttactga catccacttt gcctttctct ccacaggcag 300 ccctggcggt ctggatcacc atcctccgct tcatggggga cctccctgag cccaagtacc 360 acacagccat gagtgatggc agtgagaaga tccctgtgat gaccaagatt tatgagaccc 420 tgggcaagaa gacgtacaag agggagctgc aggccctgca gggcgagggc gaggcccagc 480 tccccgaggg ccagaagaag agcagtgtga ggcacaagct ggtgcatttg actctgaaaa 540 agaagtccaa gctcacagag gaggtgacca agaggctgca tgacggggag tccacagtgc 600 agggcaacag catgctggag gaccggccca cctccaacct ggagaagctg cacttcatca 660 tcggcaatgg catcctgcgg ccagcactcc gggacgagat ctactgccag atcagcaagc 720 agctgaccca caacccctcc aagagcagct atgcccgggg ctggattctc gtgtctctct 780 gcgtgggctg tttcgccccc tccgagaagt ttgtcaagta cctgcggaac ttcatccacg 840 ggggcccgcc cggctacgcc ccgtactgtg aggagcgcct gagaaggacc tttgtcaatg 900 ggacacggac acagccgccc agctggctgg agctgcaggc caccaagtcc aagaagccaa 960 tcatgttgcc cgtgacattc atggatggga ccaccaagac cctgctgacg gactcggcaa 1020 ccacggccaa ggagctctgc aacgcgctgg ccgacaagat ctctctcaag gaccggttcg 1080 ggttctccct ctacattgcc ctgtttgaca aggtgtcctc cctgggcagc ggcagtgacc 1140 acgtcatgga cgccatctcc cagtgcgagc agtacgccaa ggagcagggc gcccaggagc 1200 gcaacgcccc ctggaggctc ttcttccgca aagaggtctt cacgccctgg cacagcccct 1260 ccgaggacaa cgtggccacc aacctcatct accagcaggt ggtgcgagga gtcaagtttg 1320 gggagtacag gtgtgagaag gaggacgacc tggctgagct ggcctcccag cagtactttg 1380 tagactatgg ctctgagatg atcctggagc gcctcctgaa cctcgtgccc acctacatcc 1440 ccgaccgcga gatcacgccc ctgaagacgc tggagaagtg ggcccagctg gccatcgccg 1500 cccacaagaa ggggatttat gcccagagga gaactgatgc ccagaaggtc aaagaggatg 1560 tggtcagtta tgcccgcttc aagtggccct tgctcttctc caggttttat gaagcctaca 1620 aattctcagg ccccagtctc cccaagaacg acgtcatcgt ggccgtcaac tggacgggtg 1680 tgtactttgt ggatgagcag gagcaggtac ttctggagct gtccttccca gagatcatgg 1740 ccgtgtccag cagcagggag tgccgtgtct ggctctcact gggctgctct gatcttggct 1800 gtgctgcgcc tcactcaggc tgggcaggac tgaccccggc ggggccctgt tctccgtgtt 1860 ggtcctgcag gggagcgaaa acgacggccc ccagcttcac gctggccacc atcaaggggg 1920 acgaatacac cttcacctcc agtaatgctg aggacattcg tgacctggtg gtcaccttcc 1980 tagaggggct ccggaagaga tctaagtatg ttgtggccct gcaggataac cccaaccccg 2040 caggcgagga gtcaggcttc ctcagctttg ccaagggaga cctcatcatc ctggaccatg 2100 acacgggcga gcaggtcatg aactcgggct gggccaacgg catcaatgag aggaccaagc 2160 agcgtgggga cttccccacc gactgtgtgt acgtcatgcc cactgtcacc atgccacctc 2220 gtgagattgt ggccctggtc accatgactc ccgatcagag gcaggacgtt gtccggctct 2280 tgcagctgcg aacggcggag cccgaggtgc gtgccaagcc ctacacgctg gaggagtttt 2340 cctatgacta cttcaggccc ccacccaagc acacgctgag ccgtgtcatg gtgtccaagg 2400 cccgaggcaa ggaccggctg tggagccaca cgcgggaacc gctcaagcag gcgctgctca 2460 agaagctcct gggcagtgag gagctctcgc aggaggcctg cctggccttc attgctgtgc 2520 tcaagtacat gggcgactac ccgtccaaga ggacacgctc cgtcaatgag ctcaccgacc 2580 agatctttga gggtcccctg aaagccgagc ccctgaagga cgaggcatat gtgcagatcc 2640 tgaagcagct gaccgacaac cacatcaggt acagcgagga gcggggttgg gagctgctct 2700 ggctgtgcac gggccttttc ccacccagca acatcctcct gccccacgtg cagcgcttcc 2760 tgcagtcccg aaagcactgc ccactcgcca tcgactgcct gcaacggctc cagaaagccc 2820 tgagaaacgg gtcccggaag taccctccgc acctggtgga ggtggaggcc atccagcaca 2880 agaccaccca gattttccac aaggtctact tccctgatga cactgacgag gccttcgaag 2940 tggagtccag caccaaggcc aaggacttct gccagaacat cgccaccagg ctgctcctca 3000 agtcctcaga gggattcagc ctctttgtca aaattgcaga caaggtcatc agcgttcctg 3060 agaatgactt cttctttgac tttgttcgac acttgacaga ctggataaag aaagctcggc 3120 ccatcaagga cggaattgtg ccctcactca cctaccaggt gttcttcatg aagaagctgt 3180 ggaccaccac ggtgccaggg aaggatccca tggccgattc catcttccac tattaccagg 3240 agttgcccaa gtatctccga ggctaccaca agtgcacgcg ggaggaggtg ctgcagctgg 3300 gggcgctgat ctacagggtc aagttcgagg aggacaagtc ctacttcccc agcatcccca 3360 agctgctgcg ggagctggtg ccccaggacc ttatccggca ggtctcacct gatgactgga 3420 agcggtccat cgtcgcctac ttcaacaagc acgcagggaa gtccaaggag gaggccaagc 3480 tggccttcct gaagctcatc ttcaagtggc ccacctttgg ctcagccttc ttcgaggtga 3540 agcaaactac ggagccaaac ttccctgaga tcctcctaat tgccatcaac aagtatgggg 3600 tcagcctcat cgatcccaaa acgaaggata tcctcaccac tcatcccttc accaagatct 3660 ccaactggag cagcggcaac acctacttcc acatcaccat tgggaacttg gtgcgcggga 3720 gcaaactgct ctgcgagacg tcactgggct acaagatgga tgacctcctg acttcctaca 3780 ttagccagat gctcacagcc atgagcaaac agcggggctc caggagcggc aagatgtatg 3840 atgttcctga ttatgctagc ctctgaccgc ggcctgctgc cggctctgcg gcctcttccg 3900 cgtcttcgag atctgcctcg actgtgcctt ctagttgcca gccatctgtt gtttgcccct 3960 cccccgtgcc ttccttgacc ctggaaggtg ccactcccac tgtcctttcc taataaaatg 4020 aggaaattgc atcgcattgt ctgagtaggt gtcattctat tctggggggt ggggtggggc 4080 aggacagcaa gggggaggat tgggaagaca atagcaggca tgctggggac tcgagcaatt 4140 cccgataagg atcttcctag agcatggcta catctgcaga attcaggcta gctcactgct 4200 tacaaaaccc ccttgcttga gagtgtggca ctctcccccc tgtcgcgttc gctcgctcgc 4260 tggctcgttt gggggggcga cggccagagg gccgtcgtct ggcagctctt tgagctgcca 4320 cccccccaaa cgagccagcg agcgagcgaa cgcgacaggg gggagag 4367 <210> 71 <211> 4738 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 71 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240 atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300 gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat 360 caattacggg gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg 420 taaatggccc gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt 480 atgttcccat agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac 540 ggtaaactgc ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg 600 acgtcaatga cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact 660 ttcctacttg gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt 720 ggcagtacac caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc 780 ccattgacgt caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc 840 gtaataaccc cgccccgttg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata 900 taagcagagc tcgtttagtg aaccgtcaga tcactagaag ctttattgcg gtagtttatc 960 acagttaaat tgctaacgca gtcagtgctt ctgacacaac agtctcgaac ttaagctgca 1020 gaagttggtc gtgaggcact gggcaggtaa gtatcaaggt tacaagacag gtttaaggag 1080 accaatagaa actgggcttg tcgagacaga gaagactctt gcgtttctga taggcaccta 1140 ttggtcttac tgacatccac tttgcctttc tctccacagg tgtccactcc cagttcaatt 1200 acagctctta aggctagagt acttaatacg actcactata ggctagcctc gagaattcac 1260 gcgtggtacc tctagagtcg acccgggcgg ccgccatggg cttcgtgaga cagatacagc 1320 ttttgctctg gaagaactgg accctgcgga aaaggcaaaa gattcgcttt gtggtggaac 1380 tcgtgtggcc tttatcttta tttctggtct tgatctggtt aaggaatgcc aacccgctct 1440 acagccatca tgaatgccat ttccccaaca aggcgatgcc ctcagcagga atgctgccgt 1500 ggctccaggg gatcttctgc aatgtgaaca atccctgttt tcaaagcccc accccaggag 1560 aatctcctgg aattgtgtca aactataaca actccatctt ggcaagggta tatcgagatt 1620 ttcaagaact cctcatgaat gcaccagaga gccagcacct tggccgtatt tggacagagc 1680 tacacatctt gtcccaattc atggacaccc tccggactca cccggagaga attgcaggaa 1740 gaggaattcg aataagggat atcttgaaag atgaagaaac actgacacta tttctcatta 1800 aaaacatcgg cctgtctgac tcagtggtct accttctgat caactctcaa gtccgtccag 1860 agcagttcgc tcatggagtc ccggacctgg cgctgaagga catcgcctgc agcgaggccc 1920 tcctggagcg cttcatcatc ttcagccaga gacgcggggc aaagacggtg cgctatgccc 1980 tgtgctccct ctcccagggc accctacagt ggatagaaga cactctgtat gccaacgtgg 2040 acttcttcaa gctcttccgt gtgcttccca cactcctaga cagccgttct caaggtatca 2100 atctgagatc ttggggagga atattatctg atatgtcacc aagaattcaa gagtttatcc 2160 atcggccgag tatgcaggac ttgctgtggg tgaccaggcc cctcatgcag aatggtggtc 2220 cagagacctt tacaaagctg atgggcatcc tgtctgacct cctgtgtggc taccccgagg 2280 gaggtggctc tcgggtgctc tccttcaact ggtatgaaga caataactat aaggcctttc 2340 tggggattga ctccacaagg aaggatccta tctattctta tgacagaaga acaacatcct 2400 tttgtaatgc attgatccag agcctggagt caaatccttt aaccaaaatc gcttggaggg 2460 cggcaaagcc tttgctgatg ggaaaaatcc tgtacactcc tgattcacct gcagcacgaa 2520 ggatactgaa gaatgccaac tcaacttttg aagaactgga acacgttagg aagttggtca 2580 aagcctggga agaagtaggg ccccagatct ggtacttctt tgacaacagc acacagatga 2640 acatgatcag agataccctg gggaacccaa cagtaaaaga ctttttgaat aggcagcttg 2700 gtgaagaagg tattactgct gaagccatcc taaacttcct ctacaagggc cctcgggaaa 2760 gccaggctga cgacatggcc aacttcgact ggagggacat atttaacatc actgatcgca 2820 ccctccgcct tgtcaatcaa tacctggagt gcttggtcct ggataagttt gaaagctaca 2880 atgatgaaac tcagctcacc caacgtgccc tctctctact ggaggaaaac atgttctggg 2940 ccggagtggt attccctgac atgtatccct ggaccagctc tctaccaccc cacgtgaagt 3000 ataagatccg aatggacata gacgtggtgg agaaaaccaa taagattaaa gacaggtatt 3060 gggactacaa agaccatgac ggtgattata aagatcatga catcgactac aaggatgacg 3120 atgacaagga ttctggtccc agagctgatc ccgtggaaga tttccggtac atctggggcg 3180 ggtttgccta tctgcaggac atggttgaac aggggatcac aaggagccag gtgcaggcgg 3240 aggctccagt tggaatctac ctccagcaga tgccctaccc ctgcttcgtg gacgattctt 3300 tcatgatcat cctgaaccgc tgtttcccta tcttcatggt gctggcatgg atctactctg 3360 tctccatgac tgtgaagagc atcgtcttgg agaaggagtt gcgactgaag gagaccttga 3420 aaaatcaggg tgtctccaat gcagtgattt ggtgtacctg gttcctggac agcttctcca 3480 tcatgtcgat gagcatcttc ctcctgacga tattcatcat gcatggaaga atcctacatt 3540 acagcgaccc attcatcctc ttcctgttct tgttggcttt ctccactgcc accatcatgc 3600 tgtgctttct gctcagcacc ttcttctcca aggccagtct ggcagcagcc tgtagtggtg 3660 tcatctattt caccctctac ctgccacaca tcctgtgctt cgcctggcag gaccgcatga 3720 ccgctgagct gaagaaggct gtgagcttac tgtctccggt ggcatttgga tttggcactg 3780 agtacctggt tcgctttgaa gagcaaggcc tggggctgca gtggagcaac atcgggaaca 3840 gtcccacgga aggggacgaa ttcagcttcc tgctgtccat gcagatgatg ctccttgatg 3900 ctgctgtcta tggcttactc gcttggtacc ttgatcaggt gtttccagga gactatggaa 3960 ccccacttcc ttggtacttt cttctacaag agtcgtattg gcttggcggt gaagggtgtt 4020 caaccagaga agaaagagcc ctggaaaaga ccgagcccct aacagaggaa acggaggatc 4080 cagagcaccc agaaggaata cacgactcct tctttgaacg tgagcatcca gggtgggttc 4140 ctggggtatg cgtgaagaat ctggtaaaga tttttgagcc ctgtggccgg ccagctgtgg 4200 accgtctgaa catcaccttc tacgagaacc agatcaccgc attcctgggc cacaatggag 4260 ctgggaaaac caccaccttg taagtatcaa ggttacaaga caggtttaag gagaccaata 4320 gaaactgggc ttgtcgagac agagaagact cttgcgtttc tgggattttt ccgatttcgg 4380 cctattggtt aaaaaatgag ctgatttaac aaaaatttaa cgcgaatttt aacaaaatat 4440 taacgtttat aatttcaggt ggcatctttc caattcgccc ttagatctag cctatcctgg 4500 attacttgaa cgatagccta tcctggatta cttgaaaagc ttagcctatc ctggattact 4560 tgaatcacag cctatcctgg attacttgaa agatctaagg gcgaattgag gaacccctag 4620 tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa 4680 aggtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga gcgcgcag 4738 <210> 72 <211> 4770 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 72 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240 atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300 gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat 360 caattacggg gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg 420 taaatggccc gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt 480 atgttcccat agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac 540 ggtaaactgc ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg 600 acgtcaatga cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact 660 ttcctacttg gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt 720 ggcagtacac caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc 780 ccattgacgt caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc 840 gtaataaccc cgccccgttg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata 900 taagcagagc tcgtttagtg aaccgtcaga tcactagaag ctttattgcg gtagtttatc 960 acagttaaat tgctaacgca gtcagtgctt ctgacacaac agtctcgaac ttaagctgca 1020 gaagttggtc gtgaggcact gggcaggtaa gtatcaaggt tacaagacag gtttaaggag 1080 accaatagaa actgggcttg tcgagacaga gaagactctt gcgtttctga taggcaccta 1140 ttggtcttac tgacatccac tttgcctttc tctccacagg tgtccactcc cagttcaatt 1200 acagctctta aggctagagt acttaatacg actcactata ggctagcctc gagaattcac 1260 gcgtggtacc tctagagtcg acccgggcgg ccgccatggg cttcgtgaga cagatacagc 1320 ttttgctctg gaagaactgg accctgcgga aaaggcaaaa gattcgcttt gtggtggaac 1380 tcgtgtggcc tttatcttta tttctggtct tgatctggtt aaggaatgcc aacccgctct 1440 acagccatca tgaatgccat ttccccaaca aggcgatgcc ctcagcagga atgctgccgt 1500 ggctccaggg gatcttctgc aatgtgaaca atccctgttt tcaaagcccc accccaggag 1560 aatctcctgg aattgtgtca aactataaca actccatctt ggcaagggta tatcgagatt 1620 ttcaagaact cctcatgaat gcaccagaga gccagcacct tggccgtatt tggacagagc 1680 tacacatctt gtcccaattc atggacaccc tccggactca cccggagaga attgcaggaa 1740 gaggaattcg aataagggat atcttgaaag atgaagaaac actgacacta tttctcatta 1800 aaaacatcgg cctgtctgac tcagtggtct accttctgat caactctcaa gtccgtccag 1860 agcagttcgc tcatggagtc ccggacctgg cgctgaagga catcgcctgc agcgaggccc 1920 tcctggagcg cttcatcatc ttcagccaga gacgcggggc aaagacggtg cgctatgccc 1980 tgtgctccct ctcccagggc accctacagt ggatagaaga cactctgtat gccaacgtgg 2040 acttcttcaa gctcttccgt gtgcttccca cactcctaga cagccgttct caaggtatca 2100 atctgagatc ttggggagga atattatctg atatgtcacc aagaattcaa gagtttatcc 2160 atcggccgag tatgcaggac ttgctgtggg tgaccaggcc cctcatgcag aatggtggtc 2220 cagagacctt tacaaagctg atgggcatcc tgtctgacct cctgtgtggc taccccgagg 2280 gaggtggctc tcgggtgctc tccttcaact ggtatgaaga caataactat aaggcctttc 2340 tggggattga ctccacaagg aaggatccta tctattctta tgacagaaga acaacatcct 2400 tttgtaatgc attgatccag agcctggagt caaatccttt aaccaaaatc gcttggaggg 2460 cggcaaagcc tttgctgatg ggaaaaatcc tgtacactcc tgattcacct gcagcacgaa 2520 ggatactgaa gaatgccaac tcaacttttg aagaactgga acacgttagg aagttggtca 2580 aagcctggga agaagtaggg ccccagatct ggtacttctt tgacaacagc acacagatga 2640 acatgatcag agataccctg gggaacccaa cagtaaaaga ctttttgaat aggcagcttg 2700 gtgaagaagg tattactgct gaagccatcc taaacttcct ctacaagggc cctcgggaaa 2760 gccaggctga cgacatggcc aacttcgact ggagggacat atttaacatc actgatcgca 2820 ccctccgcct tgtcaatcaa tacctggagt gcttggtcct ggataagttt gaaagctaca 2880 atgatgaaac tcagctcacc caacgtgccc tctctctact ggaggaaaac atgttctggg 2940 ccggagtggt attccctgac atgtatccct ggaccagctc tctaccaccc cacgtgaagt 3000 ataagatccg aatggacata gacgtggtgg agaaaaccaa taagattaaa gacaggtatt 3060 gggactacaa agaccatgac ggtgattata aagatcatga catcgactac aaggatgacg 3120 atgacaagga ttctggtccc agagctgatc ccgtggaaga tttccggtac atctggggcg 3180 ggtttgccta tctgcaggac atggttgaac aggggatcac aaggagccag gtgcaggcgg 3240 aggctccagt tggaatctac ctccagcaga tgccctaccc ctgcttcgtg gacgattctt 3300 tcatgatcat cctgaaccgc tgtttcccta tcttcatggt gctggcatgg atctactctg 3360 tctccatgac tgtgaagagc atcgtcttgg agaaggagtt gcgactgaag gagaccttga 3420 aaaatcaggg tgtctccaat gcagtgattt ggtgtacctg gttcctggac agcttctcca 3480 tcatgtcgat gagcatcttc ctcctgacga tattcatcat gcatggaaga atcctacatt 3540 acagcgaccc attcatcctc ttcctgttct tgttggcttt ctccactgcc accatcatgc 3600 tgtgctttct gctcagcacc ttcttctcca aggccagtct ggcagcagcc tgtagtggtg 3660 tcatctattt caccctctac ctgccacaca tcctgtgctt cgcctggcag gaccgcatga 3720 ccgctgagct gaagaaggct gtgagcttac tgtctccggt ggcatttgga tttggcactg 3780 agtacctggt tcgctttgaa gagcaaggcc tggggctgca gtggagcaac atcgggaaca 3840 gtcccacgga aggggacgaa ttcagcttcc tgctgtccat gcagatgatg ctccttgatg 3900 ctgctgtcta tggcttactc gcttggtacc ttgatcaggt gtttccagga gactatggaa 3960 ccccacttcc ttggtacttt cttctacaag agtcgtattg gcttggcggt gaagggtgtt 4020 caaccagaga agaaagagcc ctggaaaaga ccgagcccct aacagaggaa acggaggatc 4080 cagagcaccc agaaggaata cacgactcct tctttgaacg tgagcatcca gggtgggttc 4140 ctggggtatg cgtgaagaat ctggtaaaga tttttgagcc ctgtggccgg ccagctgtgg 4200 accgtctgaa catcaccttc tacgagaacc agatcaccgc attcctgggc cacaatggag 4260 ctgggaaaac caccaccttg taagtatcaa ggttacaaga caggtttaag gagaccaata 4320 gaaactgggc ttgtcgagac agagaagact cttgcgtttc tgggattttt ccgatttcgg 4380 cctattggtt aaaaaatgag ctgatttaac aaaaatttaa cgcgaatttt aacaaaatat 4440 taacgtttat aatttcaggt ggcatctttc caattgaggc ataggatgac aaagggaacg 4500 ataggcatag gatgacaaag ggaaaagctt aggcatagga tgacaaaggg aaggtaccag 4560 atctggcatt caccgcgtgc cttacgatgg cattcaccgc gtgccttaaa gcttggcatt 4620 caccgcgtgc cttacaattg aggaacccct agtgatggag ttggccactc cctctctgcg 4680 cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg 4740 ggcggcctca gtgagcgagc gagcgcgcag 4770 <210> 73 <211> 4656 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 73 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240 atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300 gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat 360 caattacggg gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg 420 taaatggccc gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt 480 atgttcccat agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac 540 ggtaaactgc ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg 600 acgtcaatga cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact 660 ttcctacttg gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt 720 ggcagtacac caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc 780 ccattgacgt caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc 840 gtaataaccc cgccccgttg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata 900 taagcagagc tcgtttagtg aaccgtcaga tcactagaag ctttattgcg gtagtttatc 960 acagttaaat tgctaacgca gtcagtgctt ctgacacaac agtctcgaac ttaagctgca 1020 gaagttggtc gtgaggcact gggcaggtaa gtatcaaggt tacaagacag gtttaaggag 1080 accaatagaa actgggcttg tcgagacaga gaagactctt gcgtttctga taggcaccta 1140 ttggtcttac tgacatccac tttgcctttc tctccacagg tgtccactcc cagttcaatt 1200 acagctctta aggctagagt acttaatacg actcactata ggctagcctc gagaattcac 1260 gcgtggtacc tctagagtcg acccgggcgg ccgccatggg cttcgtgaga cagatacagc 1320 ttttgctctg gaagaactgg accctgcgga aaaggcaaaa gattcgcttt gtggtggaac 1380 tcgtgtggcc tttatcttta tttctggtct tgatctggtt aaggaatgcc aacccgctct 1440 acagccatca tgaatgccat ttccccaaca aggcgatgcc ctcagcagga atgctgccgt 1500 ggctccaggg gatcttctgc aatgtgaaca atccctgttt tcaaagcccc accccaggag 1560 aatctcctgg aattgtgtca aactataaca actccatctt ggcaagggta tatcgagatt 1620 ttcaagaact cctcatgaat gcaccagaga gccagcacct tggccgtatt tggacagagc 1680 tacacatctt gtcccaattc atggacaccc tccggactca cccggagaga attgcaggaa 1740 gaggaattcg aataagggat atcttgaaag atgaagaaac actgacacta tttctcatta 1800 aaaacatcgg cctgtctgac tcagtggtct accttctgat caactctcaa gtccgtccag 1860 agcagttcgc tcatggagtc ccggacctgg cgctgaagga catcgcctgc agcgaggccc 1920 tcctggagcg cttcatcatc ttcagccaga gacgcggggc aaagacggtg cgctatgccc 1980 tgtgctccct ctcccagggc accctacagt ggatagaaga cactctgtat gccaacgtgg 2040 acttcttcaa gctcttccgt gtgcttccca cactcctaga cagccgttct caaggtatca 2100 atctgagatc ttggggagga atattatctg atatgtcacc aagaattcaa gagtttatcc 2160 atcggccgag tatgcaggac ttgctgtggg tgaccaggcc cctcatgcag aatggtggtc 2220 cagagacctt tacaaagctg atgggcatcc tgtctgacct cctgtgtggc taccccgagg 2280 gaggtggctc tcgggtgctc tccttcaact ggtatgaaga caataactat aaggcctttc 2340 tggggattga ctccacaagg aaggatccta tctattctta tgacagaaga acaacatcct 2400 tttgtaatgc attgatccag agcctggagt caaatccttt aaccaaaatc gcttggaggg 2460 cggcaaagcc tttgctgatg ggaaaaatcc tgtacactcc tgattcacct gcagcacgaa 2520 ggatactgaa gaatgccaac tcaacttttg aagaactgga acacgttagg aagttggtca 2580 aagcctggga agaagtaggg ccccagatct ggtacttctt tgacaacagc acacagatga 2640 acatgatcag agataccctg gggaacccaa cagtaaaaga ctttttgaat aggcagcttg 2700 gtgaagaagg tattactgct gaagccatcc taaacttcct ctacaagggc cctcgggaaa 2760 gccaggctga cgacatggcc aacttcgact ggagggacat atttaacatc actgatcgca 2820 ccctccgcct tgtcaatcaa tacctggagt gcttggtcct ggataagttt gaaagctaca 2880 atgatgaaac tcagctcacc caacgtgccc tctctctact ggaggaaaac atgttctggg 2940 ccggagtggt attccctgac atgtatccct ggaccagctc tctaccaccc cacgtgaagt 3000 ataagatccg aatggacata gacgtggtgg agaaaaccaa taagattaaa gacaggtatt 3060 gggactacaa agaccatgac ggtgattata aagatcatga catcgactac aaggatgacg 3120 atgacaagga ttctggtccc agagctgatc ccgtggaaga tttccggtac atctggggcg 3180 ggtttgccta tctgcaggac atggttgaac aggggatcac aaggagccag gtgcaggcgg 3240 aggctccagt tggaatctac ctccagcaga tgccctaccc ctgcttcgtg gacgattctt 3300 tcatgatcat cctgaaccgc tgtttcccta tcttcatggt gctggcatgg atctactctg 3360 tctccatgac tgtgaagagc atcgtcttgg agaaggagtt gcgactgaag gagaccttga 3420 aaaatcaggg tgtctccaat gcagtgattt ggtgtacctg gttcctggac agcttctcca 3480 tcatgtcgat gagcatcttc ctcctgacga tattcatcat gcatggaaga atcctacatt 3540 acagcgaccc attcatcctc ttcctgttct tgttggcttt ctccactgcc accatcatgc 3600 tgtgctttct gctcagcacc ttcttctcca aggccagtct ggcagcagcc tgtagtggtg 3660 tcatctattt caccctctac ctgccacaca tcctgtgctt cgcctggcag gaccgcatga 3720 ccgctgagct gaagaaggct gtgagcttac tgtctccggt ggcatttgga tttggcactg 3780 agtacctggt tcgctttgaa gagcaaggcc tggggctgca gtggagcaac atcgggaaca 3840 gtcccacgga aggggacgaa ttcagcttcc tgctgtccat gcagatgatg ctccttgatg 3900 ctgctgtcta tggcttactc gcttggtacc ttgatcaggt gtttccagga gactatggaa 3960 ccccacttcc ttggtacttt cttctacaag agtcgtattg gcttggcggt gaagggtgtt 4020 caaccagaga agaaagagcc ctggaaaaga ccgagcccct aacagaggaa acggaggatc 4080 cagagcaccc agaaggaata cacgactcct tctttgaacg tgagcatcca gggtgggttc 4140 ctggggtatg cgtgaagaat ctggtaaaga tttttgagcc ctgtggccgg ccagctgtgg 4200 accgtctgaa catcaccttc tacgagaacc agatcaccgc attcctgggc cacaatggag 4260 ctgggaaaac caccaccttg taagtatcaa ggttacaaga caggtttaag gagaccaata 4320 gaaactgggc ttgtcgagac agagaagact cttgcgtttc tgggattttt ccgatttcgg 4380 cctattggtt aaaaaatgag ctgatttaac aaaaatttaa cgcgaatttt aacaaaatat 4440 taacgtttat aatttcaggt ggcatctttc ccgcctgcaa gaactggttc agcagcctga 4500 gccacttcgt gatccacctg caattgagga acccctagtg atggagttgg ccactccctc 4560 tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt 4620 tgcccgggcg gcctcagtga gcgagcgagc gcgcag 4656 <210> 74 <211> 4719 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 74 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct ggatccggga tttttccgat ttcggcctat tggttaaaaa atgagctgat 180 ttaacaaaaa tttaacgcga attttaacaa aatattaacg tttataattt caggtggcat 240 ctttcaagct ttgaatgaat gagataggca cctattggtc ttactgacat ccactttgcc 300 tttctctcca caggtccatc ctgacgggtc tgttgccacc aacctctggg actgtgctcg 360 ttgggggaag ggacattgaa accagcctgg atgcagtccg gcagagcctt ggcatgtgtc 420 cacagcacaa catcctgttc caccacctca cggtggctga gcacatgctg ttctatgccc 480 agctgaaagg aaagtcccag gaggaggccc agctggagat ggaagccatg ttggaggaca 540 caggcctcca ccacaagcgg aatgaagagg ctcaggacct atcaggtggc atgcagagaa 600 agctgtcggt tgccattgcc tttgtgggag atgccaaggt ggtgattctg gacgaaccca 660 cctctggggt ggacccttac tcgagacgct caatctggga tctgctcctg aagtatcgct 720 caggcagaac catcatcatg tccactcacc acatggacga ggccgacctc cttggggacc 780 gcattgccat cattgcccag ggaaggctct actgctcagg caccccactc ttcctgaaga 840 actgctttgg cacaggcttg tacttaacct tggtgcgcaa gatgaaaaac atccagagcc 900 aaaggaaagg cagtgagggg acctgcagct gctcgtctaa gggtttctcc accacgtgtc 960 cagcccacgt cgatgaccta actccagaac aagtcctgga tggggatgta aatgagctga 1020 tggatgtagt tctccaccat gttccagagg caaagctggt ggagtgcatt ggtcaagaac 1080 ttatcttcct tcttccaaat aagaacttca agcacagagc atatgccagc cttttcagag 1140 agctggagga gacgctggct gaccttggtc tcagcagttt tggaatttct gacactcccc 1200 tggaagagat ttttctgaag gtcacggagg attctgattc aggacctctg tttgcgggtg 1260 gcgctcagca gaaaagagaa aacgtcaacc cccgacaccc ctgcttgggt cccagagaga 1320 aggctggaca gacaccccag gactccaatg tctgctcccc aggggcgccg gctgctcacc 1380 cagagggcca gcctccccca gagccagagt gcccaggccc gcagctcaac acggggacac 1440 agctggtcct ccagcatgtg caggcgctgc tggtcaagag attccaacac accatccgca 1500 gccacaagga cttcctggcg cagatcgtgc tcccggctac ctttgtgttt ttggctctga 1560 tgctttctat tgttatccct ccttttggcg aataccccgc tttgaccctt cacccctgga 1620 tatatgggca gcagtacacc ttcttcagca tggatgaacc aggcagtgag cagttcacgg 1680 tacttgcaga cgtcctcctg aataagccag gctttggcaa ccgctgcctg aaggaagggt 1740 ggcttccgga gtacccctgt ggcaactcaa caccctggaa gactccttct gtgtccccaa 1800 acatcaccca gctgttccag aagcagaaat ggacacaggt caacccttca ccatcctgca 1860 ggtgcagcac cagggagaag ctcaccatgc tgccagagtg ccccgagggt gccgggggcc 1920 tcccgccccc ccagagaaca cagcgcagca cggaaattct acaagacctg acggacagga 1980 acatctccga cttcttggta aaaacgtatc ctgctcttat aagaagcagc ttaaagagca 2040 aattctgggt caatgaacag aggtatggag gaatttccat tggaggaaag ctcccagtcg 2100 tccccatcac gggggaagca cttgttgggt ttttaagcga ccttggccgg atcatgaatg 2160 tgagcggggg ccctatcact agagaggcct ctaaagaaat acctgatttc cttaaacatc 2220 tagaaactga agacaacatt aaggtgtggt ttaataacaa aggctggcat gccctggtca 2280 gctttctcaa tgtggcccac aacgccatct tacgggccag cctgcctaag gacagaagcc 2340 ccgaggagta tggaatcacc gtcattagcc aacccctgaa cctgaccaag gagcagctct 2400 cagagattac agtgctgacc acttcagtgg atgctgtggt tgccatctgc gtgattttct 2460 ccatgtcctt cgtcccagcc agctttgtcc tttatttgat ccaggagcgg gtgaacaaat 2520 ccaagcacct ccagtttatc agtggagtga gccccaccac ctactgggta accaacttcc 2580 tctgggacat catgaattat tccgtgagtg ctgggctggt ggtgggcatc ttcatcgggt 2640 ttcagaagaa agcctacact tctccagaaa accttcctgc ccttgtggca ctgctcctgc 2700 tgtatggatg ggcggtcatt cccatgatgt acccagcatc cttcctgttt gatgtcccca 2760 gcacagccta tgtggcttta tcttgtgcta atctgttcat cggcatcaac agcagtgcta 2820 ttaccttcat cttggaatta tttgagaata accggacgct gctcaggttc aacgccgtgc 2880 tgaggaagct gctcattgtc ttcccccact tctgcctggg ccggggcctc attgaccttg 2940 cactgagcca ggctgtgaca gatgtctatg cccggtttgg tgaggagcac tctgcaaatc 3000 cgttccactg ggacctgatt gggaagaacc tgtttgccat ggtggtggaa ggggtggtgt 3060 acttcctcct gaccctgctg gtccagcgcc acttcttcct ctcccaatgg attgccgagc 3120 ccactaagga gcccattgtt gatgaagatg atgatgtggc tgaagaaaga caaagaatta 3180 ttactggtgg aaataaaact gacatcttaa ggctacatga actaaccaag atttatccag 3240 gcacctccag cccagcagtg gacaggctgt gtgtcggagt tcgccctgga gagtgctttg 3300 gcctcctggg agtgaatggt gccggcaaaa caaccacatt caagatgctc actggggaca 3360 ccacagtgac ctcaggggat gccaccgtag caggcaagag tattttaacc aatatttctg 3420 aagtccatca aaatatgggc tactgtcctc agtttgatgc aatcgatgag ctgctcacag 3480 gacgagaaca tctttacctt tatgcccggc ttcgaggtgt accagcagaa gaaatcgaaa 3540 aggttgcaaa ctggagtatt aagagcctgg gcctgactgt ctacgccgac tgcctggctg 3600 gcacgtacag tgggggcaac aagcggaaac tctccacagc catcgcactc attggctgcc 3660 caccgctggt gctgctggat gagcccacca cagggatgga cccccaggca cgccgcatgc 3720 tgtggaacgt catcgtgagc atcatcagag aagggagggc tgtggtcctc acatcccaca 3780 gcatggaaga atgtgaggca ctgtgtaccc ggctggccat catggtaaag ggcgcctttc 3840 gatgtatggg caccattcag catctcaagt ccaaatttgg agatggctat atcgtcacaa 3900 tgaagatcaa atccccgaag gacgacctgc ttcctgacct gaaccctgtg gagcagttct 3960 tccaggggaa cttcccaggc agtgtgcaga gggagaggca ctacaacatg ctccagttcc 4020 aggtctcctc ctcctccctg gcgaggatct tccagctcct cctctcccac aaggacagcc 4080 tgctcatcga ggagtactca gtcacacaga ccacactgga ccaggtgttt gtaaattttg 4140 ctaaacagca gactgaaagt catgacctcc ctctgcaccc tcgagctgct ggagccagtc 4200 gacaagccca ggacgactac aaagaccatg acggtgatta taaagatcat gacatcgact 4260 acaaggatga cgatgacaag tgagcggccg cttcgagcag acatgataag atacattgat 4320 gagtttggac aaaccacaac tagaatgcag tgaaaaaaat gctttatttg tgaaatttgt 4380 gatgctattg ctttatttgt aaccattata agctgcaata aacaagttaa caacaacaat 4440 tgcattcatt ttatgtttca ggttcagggg gagatgtggg aggtttttta aagcaagtaa 4500 aacctctaca aatgtggtaa aatcgataag gatcttccta gagcatggct acgtagataa 4560 gtagcatggc gggttaatca ttaactacaa ggaaccccta gtgatggagt tggccactcc 4620 ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg 4680 ctttgcccgg gcggcctcag tgagcgagcg agcgcgcag 4719 <210> 75 <211> 4758 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 75 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct ggatccggga tttttccgat ttcggcctat tggttaaaaa atgagctgat 180 ttaacaaaaa tttaacgcga attttaacaa aatattaacg tttataattt caggtggcat 240 ctttcaagct tatgcacagc tggaacttca agctgtacgt catgggcagc ggcggggtac 300 cgataggcac ctattggtct tactgacatc cactttgcct ttctctccac aggtccatcc 360 tgacgggtct gttgccacca acctctggga ctgtgctcgt tgggggaagg gacattgaaa 420 ccagcctgga tgcagtccgg cagagccttg gcatgtgtcc acagcacaac atcctgttcc 480 accacctcac ggtggctgag cacatgctgt tctatgccca gctgaaagga aagtcccagg 540 aggaggccca gctggagatg gaagccatgt tggaggacac aggcctccac cacaagcgga 600 atgaagaggc tcaggaccta tcaggtggca tgcagagaaa gctgtcggtt gccattgcct 660 ttgtgggaga tgccaaggtg gtgattctgg acgaacccac ctctggggtg gacccttact 720 cgagacgctc aatctgggat ctgctcctga agtatcgctc aggcagaacc atcatcatgt 780 ccactcacca catggacgag gccgacctcc ttggggaccg cattgccatc attgcccagg 840 gaaggctcta ctgctcaggc accccactct tcctgaagaa ctgctttggc acaggcttgt 900 acttaacctt ggtgcgcaag atgaaaaaca tccagagcca aaggaaaggc agtgagggga 960 cctgcagctg ctcgtctaag ggtttctcca ccacgtgtcc agcccacgtc gatgacctaa 1020 ctccagaaca agtcctggat ggggatgtaa atgagctgat ggatgtagtt ctccaccatg 1080 ttccagaggc aaagctggtg gagtgcattg gtcaagaact tatcttcctt cttccaaata 1140 agaacttcaa gcacagagca tatgccagcc ttttcagaga gctggaggag acgctggctg 1200 accttggtct cagcagtttt ggaatttctg acactcccct ggaagagatt tttctgaagg 1260 tcacggagga ttctgattca ggacctctgt ttgcgggtgg cgctcagcag aaaagagaaa 1320 acgtcaaccc ccgacacccc tgcttgggtc ccagagagaa ggctggacag acaccccagg 1380 actccaatgt ctgctcccca ggggcgccgg ctgctcaccc agagggccag cctcccccag 1440 agccagagtg cccaggcccg cagctcaaca cggggacaca gctggtcctc cagcatgtgc 1500 aggcgctgct ggtcaagaga ttccaacaca ccatccgcag ccacaaggac ttcctggcgc 1560 agatcgtgct cccggctacc tttgtgtttt tggctctgat gctttctatt gttatccctc 1620 cttttggcga ataccccgct ttgacccttc acccctggat atatgggcag cagtacacct 1680 tcttcagcat ggatgaacca ggcagtgagc agttcacggt acttgcagac gtcctcctga 1740 ataagccagg ctttggcaac cgctgcctga aggaagggtg gcttccggag tacccctgtg 1800 gcaactcaac accctggaag actccttctg tgtccccaaa catcacccag ctgttccaga 1860 agcagaaatg gacacaggtc aacccttcac catcctgcag gtgcagcacc agggagaagc 1920 tcaccatgct gccagagtgc cccgagggtg ccgggggcct cccgcccccc cagagaacac 1980 agcgcagcac ggaaattcta caagacctga cggacaggaa catctccgac ttcttggtaa 2040 aaacgtatcc tgctcttata agaagcagct taaagagcaa attctgggtc aatgaacaga 2100 ggtatggagg aatttccatt ggaggaaagc tcccagtcgt ccccatcacg ggggaagcac 2160 ttgttgggtt tttaagcgac cttggccgga tcatgaatgt gagcgggggc cctatcacta 2220 gagaggcctc taaagaaata cctgatttcc ttaaacatct agaaactgaa gacaacatta 2280 aggtgtggtt taataacaaa ggctggcatg ccctggtcag ctttctcaat gtggcccaca 2340 acgccatctt acgggccagc ctgcctaagg acagaagccc cgaggagtat ggaatcaccg 2400 tcattagcca acccctgaac ctgaccaagg agcagctctc agagattaca gtgctgacca 2460 cttcagtgga tgctgtggtt gccatctgcg tgattttctc catgtccttc gtcccagcca 2520 gctttgtcct ttatttgatc caggagcggg tgaacaaatc caagcacctc cagtttatca 2580 gtggagtgag ccccaccacc tactgggtaa ccaacttcct ctgggacatc atgaattatt 2640 ccgtgagtgc tgggctggtg gtgggcatct tcatcgggtt tcagaagaaa gcctacactt 2700 ctccagaaaa ccttcctgcc cttgtggcac tgctcctgct gtatggatgg gcggtcattc 2760 ccatgatgta cccagcatcc ttcctgtttg atgtccccag cacagcctat gtggctttat 2820 cttgtgctaa tctgttcatc ggcatcaaca gcagtgctat taccttcatc ttggaattat 2880 ttgagaataa ccggacgctg ctcaggttca acgccgtgct gaggaagctg ctcattgtct 2940 tcccccactt ctgcctgggc cggggcctca ttgaccttgc actgagccag gctgtgacag 3000 atgtctatgc ccggtttggt gaggagcact ctgcaaatcc gttccactgg gacctgattg 3060 ggaagaacct gtttgccatg gtggtggaag gggtggtgta cttcctcctg accctgctgg 3120 tccagcgcca cttcttcctc tcccaatgga ttgccgagcc cactaaggag cccattgttg 3180 atgaagatga tgatgtggct gaagaaagac aaagaattat tactggtgga aataaaactg 3240 acatcttaag gctacatgaa ctaaccaaga tttatccagg cacctccagc ccagcagtgg 3300 acaggctgtg tgtcggagtt cgccctggag agtgctttgg cctcctggga gtgaatggtg 3360 ccggcaaaac aaccacattc aagatgctca ctggggacac cacagtgacc tcaggggatg 3420 ccaccgtagc aggcaagagt attttaacca atatttctga agtccatcaa aatatgggct 3480 actgtcctca gtttgatgca atcgatgagc tgctcacagg acgagaacat ctttaccttt 3540 atgcccggct tcgaggtgta ccagcagaag aaatcgaaaa ggttgcaaac tggagtatta 3600 agagcctggg cctgactgtc tacgccgact gcctggctgg cacgtacagt gggggcaaca 3660 agcggaaact ctccacagcc atcgcactca ttggctgccc accgctggtg ctgctggatg 3720 agcccaccac agggatggac ccccaggcac gccgcatgct gtggaacgtc atcgtgagca 3780 tcatcagaga agggagggct gtggtcctca catcccacag catggaagaa tgtgaggcac 3840 tgtgtacccg gctggccatc atggtaaagg gcgcctttcg atgtatgggc accattcagc 3900 atctcaagtc caaatttgga gatggctata tcgtcacaat gaagatcaaa tccccgaagg 3960 acgacctgct tcctgacctg aaccctgtgg agcagttctt ccaggggaac ttcccaggca 4020 gtgtgcagag ggagaggcac tacaacatgc tccagttcca ggtctcctcc tcctccctgg 4080 cgaggatctt ccagctcctc ctctcccaca aggacagcct gctcatcgag gagtactcag 4140 tcacacagac cacactggac caggtgtttg taaattttgc taaacagcag actgaaagtc 4200 atgacctccc tctgcaccct cgagctgctg gagccagtcg acaagcccag gacgactaca 4260 aagaccatga cggtgattat aaagatcatg acatcgacta caaggatgac gatgacaagt 4320 gagcggccgc ttcgagcaga catgataaga tacattgatg agtttggaca aaccacaact 4380 agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc tttatttgta 4440 accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt tatgtttcag 4500 gttcaggggg agatgtggga ggttttttaa agcaagtaaa acctctacaa atgtggtaaa 4560 atcgataagg atcttcctag agcatggcta cgtagataag tagcatggcg ggttaatcat 4620 taactacaag gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct 4680 cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg cggcctcagt 4740 gagcgagcga gcgcgcag 4758 <210> 76 <211> 4844 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 76 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct ggatccggga tttttccgat ttcggcctat tggttaaaaa atgagctgat 180 ttaacaaaaa tttaacgcga attttaacaa aatattaacg tttataattt caggtggcat 240 ctttcaagct tatgcacagc tggaacttca agctgtacgt catgggcagc ggcggggtac 300 catgcacagc tggaacttca agctgtacgt catgggcagc ggcggatgca cagctggaac 360 ttcaagctgt acgtcatggg cagcggcgat aggcacctat tggtcttact gacatccact 420 ttgcctttct ctccacaggt ccatcctgac gggtctgttg ccaccaacct ctgggactgt 480 gctcgttggg ggaagggaca ttgaaaccag cctggatgca gtccggcaga gccttggcat 540 gtgtccacag cacaacatcc tgttccacca cctcacggtg gctgagcaca tgctgttcta 600 tgcccagctg aaaggaaagt cccaggagga ggcccagctg gagatggaag ccatgttgga 660 ggacacaggc ctccaccaca agcggaatga agaggctcag gacctatcag gtggcatgca 720 gagaaagctg tcggttgcca ttgcctttgt gggagatgcc aaggtggtga ttctggacga 780 acccacctct ggggtggacc cttactcgag acgctcaatc tgggatctgc tcctgaagta 840 tcgctcaggc agaaccatca tcatgtccac tcaccacatg gacgaggccg acctccttgg 900 ggaccgcatt gccatcattg cccagggaag gctctactgc tcaggcaccc cactcttcct 960 gaagaactgc tttggcacag gcttgtactt aaccttggtg cgcaagatga aaaacatcca 1020 gagccaaagg aaaggcagtg aggggacctg cagctgctcg tctaagggtt tctccaccac 1080 gtgtccagcc cacgtcgatg acctaactcc agaacaagtc ctggatgggg atgtaaatga 1140 gctgatggat gtagttctcc accatgttcc agaggcaaag ctggtggagt gcattggtca 1200 agaacttatc ttccttcttc caaataagaa cttcaagcac agagcatatg ccagcctttt 1260 cagagagctg gaggagacgc tggctgacct tggtctcagc agttttggaa tttctgacac 1320 tcccctggaa gagatttttc tgaaggtcac ggaggattct gattcaggac ctctgtttgc 1380 gggtggcgct cagcagaaaa gagaaaacgt caacccccga cacccctgct tgggtcccag 1440 agagaaggct ggacagacac cccaggactc caatgtctgc tccccagggg cgccggctgc 1500 tcacccagag ggccagcctc ccccagagcc agagtgccca ggcccgcagc tcaacacggg 1560 gacacagctg gtcctccagc atgtgcaggc gctgctggtc aagagattcc aacacaccat 1620 ccgcagccac aaggacttcc tggcgcagat cgtgctcccg gctacctttg tgtttttggc 1680 tctgatgctt tctattgtta tccctccttt tggcgaatac cccgctttga cccttcaccc 1740 ctggatatat gggcagcagt acaccttctt cagcatggat gaaccaggca gtgagcagtt 1800 cacggtactt gcagacgtcc tcctgaataa gccaggcttt ggcaaccgct gcctgaagga 1860 agggtggctt ccggagtacc cctgtggcaa ctcaacaccc tggaagactc cttctgtgtc 1920 cccaaacatc acccagctgt tccagaagca gaaatggaca caggtcaacc cttcaccatc 1980 ctgcaggtgc agcaccaggg agaagctcac catgctgcca gagtgccccg agggtgccgg 2040 gggcctcccg cccccccaga gaacacagcg cagcacggaa attctacaag acctgacgga 2100 caggaacatc tccgacttct tggtaaaaac gtatcctgct cttataagaa gcagcttaaa 2160 gagcaaattc tgggtcaatg aacagaggta tggaggaatt tccattggag gaaagctccc 2220 agtcgtcccc atcacggggg aagcacttgt tgggttttta agcgaccttg gccggatcat 2280 gaatgtgagc gggggcccta tcactagaga ggcctctaaa gaaatacctg atttccttaa 2340 acatctagaa actgaagaca acattaaggt gtggtttaat aacaaaggct ggcatgccct 2400 ggtcagcttt ctcaatgtgg cccacaacgc catcttacgg gccagcctgc ctaaggacag 2460 aagccccgag gagtatggaa tcaccgtcat tagccaaccc ctgaacctga ccaaggagca 2520 gctctcagag attacagtgc tgaccacttc agtggatgct gtggttgcca tctgcgtgat 2580 tttctccatg tccttcgtcc cagccagctt tgtcctttat ttgatccagg agcgggtgaa 2640 caaatccaag cacctccagt ttatcagtgg agtgagcccc accacctact gggtaaccaa 2700 cttcctctgg gacatcatga attattccgt gagtgctggg ctggtggtgg gcatcttcat 2760 cgggtttcag aagaaagcct acacttctcc agaaaacctt cctgcccttg tggcactgct 2820 cctgctgtat ggatgggcgg tcattcccat gatgtaccca gcatccttcc tgtttgatgt 2880 ccccagcaca gcctatgtgg ctttatcttg tgctaatctg ttcatcggca tcaacagcag 2940 tgctattacc ttcatcttgg aattatttga gaataaccgg acgctgctca ggttcaacgc 3000 cgtgctgagg aagctgctca ttgtcttccc ccacttctgc ctgggccggg gcctcattga 3060 ccttgcactg agccaggctg tgacagatgt ctatgcccgg tttggtgagg agcactctgc 3120 aaatccgttc cactgggacc tgattgggaa gaacctgttt gccatggtgg tggaaggggt 3180 ggtgtacttc ctcctgaccc tgctggtcca gcgccacttc ttcctctccc aatggattgc 3240 cgagcccact aaggagccca ttgttgatga agatgatgat gtggctgaag aaagacaaag 3300 aattattact ggtggaaata aaactgacat cttaaggcta catgaactaa ccaagattta 3360 tccaggcacc tccagcccag cagtggacag gctgtgtgtc ggagttcgcc ctggagagtg 3420 ctttggcctc ctgggagtga atggtgccgg caaaacaacc acattcaaga tgctcactgg 3480 ggacaccaca gtgacctcag gggatgccac cgtagcaggc aagagtattt taaccaatat 3540 ttctgaagtc catcaaaata tgggctactg tcctcagttt gatgcaatcg atgagctgct 3600 cacaggacga gaacatcttt acctttatgc ccggcttcga ggtgtaccag cagaagaaat 3660 cgaaaaggtt gcaaactgga gtattaagag cctgggcctg actgtctacg ccgactgcct 3720 ggctggcacg tacagtgggg gcaacaagcg gaaactctcc acagccatcg cactcattgg 3780 ctgcccaccg ctggtgctgc tggatgagcc caccacaggg atggaccccc aggcacgccg 3840 catgctgtgg aacgtcatcg tgagcatcat cagagaaggg agggctgtgg tcctcacatc 3900 ccacagcatg gaagaatgtg aggcactgtg tacccggctg gccatcatgg taaagggcgc 3960 ctttcgatgt atgggcacca ttcagcatct caagtccaaa tttggagatg gctatatcgt 4020 cacaatgaag atcaaatccc cgaaggacga cctgcttcct gacctgaacc ctgtggagca 4080 gttcttccag gggaacttcc caggcagtgt gcagagggag aggcactaca acatgctcca 4140 gttccaggtc tcctcctcct ccctggcgag gatcttccag ctcctcctct cccacaagga 4200 cagcctgctc atcgaggagt actcagtcac acagaccaca ctggaccagg tgtttgtaaa 4260 ttttgctaaa cagcagactg aaagtcatga cctccctctg caccctcgag ctgctggagc 4320 cagtcgacaa gcccaggacg actacaaaga ccatgacggt gattataaag atcatgacat 4380 cgactacaag gatgacgatg acaagtgagc ggccgcttcg agcagacatg ataagataca 4440 ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa 4500 tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 4560 acaattgcat tcattttatg tttcaggttc agggggagat gtgggaggtt ttttaaagca 4620 agtaaaacct ctacaaatgt ggtaaaatcg ataaggatct tcctagagca tggctacgta 4680 gataagtagc atggcgggtt aatcattaac tacaaggaac ccctagtgat ggagttggcc 4740 actccctctc tgcgcgctcg ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc 4800 ccgggctttg cccgggcggc ctcagtgagc gagcgagcgc gcag 4844 <210> 77 <211> 4944 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 77 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct ggatccggga tttttccgat ttcggcctat tggttaaaaa atgagctgat 180 ttaacaaaaa tttaacgcga attttaacaa aatattaacg tttataattt caggtggcat 240 ctttcaagct tatgcagatc ttcgtgaaga ctctgactgg taagaccatc accctcgagg 300 tggagcccag tgacaccatc gagaatgtca aggcaaagat ccaagataag gaaggcattc 360 ctcctgatca gcagaggttg atctttgccg gaaaacagct ggaagatggt cgtaccctgt 420 ctgactacaa catccagaaa gagtccacct tgcacctggt actccgtctc agaggtgggc 480 gaagcttgat aggcacctat tggtcttact gacatccact ttgcctttct ctccacaggt 540 ccatcctgac gggtctgttg ccaccaacct ctgggactgt gctcgttggg ggaagggaca 600 ttgaaaccag cctggatgca gtccggcaga gccttggcat gtgtccacag cacaacatcc 660 tgttccacca cctcacggtg gctgagcaca tgctgttcta tgcccagctg aaaggaaagt 720 cccaggagga ggcccagctg gagatggaag ccatgttgga ggacacaggc ctccaccaca 780 agcggaatga agaggctcag gacctatcag gtggcatgca gagaaagctg tcggttgcca 840 ttgcctttgt gggagatgcc aaggtggtga ttctggacga acccacctct ggggtggacc 900 cttactcgag acgctcaatc tgggatctgc tcctgaagta tcgctcaggc agaaccatca 960 tcatgtccac tcaccacatg gacgaggccg acctccttgg ggaccgcatt gccatcattg 1020 cccagggaag gctctactgc tcaggcaccc cactcttcct gaagaactgc tttggcacag 1080 gcttgtactt aaccttggtg cgcaagatga aaaacatcca gagccaaagg aaaggcagtg 1140 aggggacctg cagctgctcg tctaagggtt tctccaccac gtgtccagcc cacgtcgatg 1200 acctaactcc agaacaagtc ctggatgggg atgtaaatga gctgatggat gtagttctcc 1260 accatgttcc agaggcaaag ctggtggagt gcattggtca agaacttatc ttccttcttc 1320 caaataagaa cttcaagcac agagcatatg ccagcctttt cagagagctg gaggagacgc 1380 tggctgacct tggtctcagc agttttggaa tttctgacac tcccctggaa gagatttttc 1440 tgaaggtcac ggaggattct gattcaggac ctctgtttgc gggtggcgct cagcagaaaa 1500 gagaaaacgt caacccccga cacccctgct tgggtcccag agagaaggct ggacagacac 1560 cccaggactc caatgtctgc tccccagggg cgccggctgc tcacccagag ggccagcctc 1620 ccccagagcc agagtgccca ggcccgcagc tcaacacggg gacacagctg gtcctccagc 1680 atgtgcaggc gctgctggtc aagagattcc aacacaccat ccgcagccac aaggacttcc 1740 tggcgcagat cgtgctcccg gctacctttg tgtttttggc tctgatgctt tctattgtta 1800 tccctccttt tggcgaatac cccgctttga cccttcaccc ctggatatat gggcagcagt 1860 acaccttctt cagcatggat gaaccaggca gtgagcagtt cacggtactt gcagacgtcc 1920 tcctgaataa gccaggcttt ggcaaccgct gcctgaagga agggtggctt ccggagtacc 1980 cctgtggcaa ctcaacaccc tggaagactc cttctgtgtc cccaaacatc acccagctgt 2040 tccagaagca gaaatggaca caggtcaacc cttcaccatc ctgcaggtgc agcaccaggg 2100 agaagctcac catgctgcca gagtgccccg agggtgccgg gggcctcccg cccccccaga 2160 gaacacagcg cagcacggaa attctacaag acctgacgga caggaacatc tccgacttct 2220 tggtaaaaac gtatcctgct cttataagaa gcagcttaaa gagcaaattc tgggtcaatg 2280 aacagaggta tggaggaatt tccattggag gaaagctccc agtcgtcccc atcacggggg 2340 aagcacttgt tgggttttta agcgaccttg gccggatcat gaatgtgagc gggggcccta 2400 tcactagaga ggcctctaaa gaaatacctg atttccttaa acatctagaa actgaagaca 2460 acattaaggt gtggtttaat aacaaaggct ggcatgccct ggtcagcttt ctcaatgtgg 2520 cccacaacgc catcttacgg gccagcctgc ctaaggacag aagccccgag gagtatggaa 2580 tcaccgtcat tagccaaccc ctgaacctga ccaaggagca gctctcagag attacagtgc 2640 tgaccacttc agtggatgct gtggttgcca tctgcgtgat tttctccatg tccttcgtcc 2700 cagccagctt tgtcctttat ttgatccagg agcgggtgaa caaatccaag cacctccagt 2760 ttatcagtgg agtgagcccc accacctact gggtaaccaa cttcctctgg gacatcatga 2820 attattccgt gagtgctggg ctggtggtgg gcatcttcat cgggtttcag aagaaagcct 2880 acacttctcc agaaaacctt cctgcccttg tggcactgct cctgctgtat ggatgggcgg 2940 tcattcccat gatgtaccca gcatccttcc tgtttgatgt ccccagcaca gcctatgtgg 3000 ctttatcttg tgctaatctg ttcatcggca tcaacagcag tgctattacc ttcatcttgg 3060 aattatttga gaataaccgg acgctgctca ggttcaacgc cgtgctgagg aagctgctca 3120 ttgtcttccc ccacttctgc ctgggccggg gcctcattga ccttgcactg agccaggctg 3180 tgacagatgt ctatgcccgg tttggtgagg agcactctgc aaatccgttc cactgggacc 3240 tgattgggaa gaacctgttt gccatggtgg tggaaggggt ggtgtacttc ctcctgaccc 3300 tgctggtcca gcgccacttc ttcctctccc aatggattgc cgagcccact aaggagccca 3360 ttgttgatga agatgatgat gtggctgaag aaagacaaag aattattact ggtggaaata 3420 aaactgacat cttaaggcta catgaactaa ccaagattta tccaggcacc tccagcccag 3480 cagtggacag gctgtgtgtc ggagttcgcc ctggagagtg ctttggcctc ctgggagtga 3540 atggtgccgg caaaacaacc acattcaaga tgctcactgg ggacaccaca gtgacctcag 3600 gggatgccac cgtagcaggc aagagtattt taaccaatat ttctgaagtc catcaaaata 3660 tgggctactg tcctcagttt gatgcaatcg atgagctgct cacaggacga gaacatcttt 3720 acctttatgc ccggcttcga ggtgtaccag cagaagaaat cgaaaaggtt gcaaactgga 3780 gtattaagag cctgggcctg actgtctacg ccgactgcct ggctggcacg tacagtgggg 3840 gcaacaagcg gaaactctcc acagccatcg cactcattgg ctgcccaccg ctggtgctgc 3900 tggatgagcc caccacaggg atggaccccc aggcacgccg catgctgtgg aacgtcatcg 3960 tgagcatcat cagagaaggg agggctgtgg tcctcacatc ccacagcatg gaagaatgtg 4020 aggcactgtg tacccggctg gccatcatgg taaagggcgc ctttcgatgt atgggcacca 4080 ttcagcatct caagtccaaa tttggagatg gctatatcgt cacaatgaag atcaaatccc 4140 cgaaggacga cctgcttcct gacctgaacc ctgtggagca gttcttccag gggaacttcc 4200 caggcagtgt gcagagggag aggcactaca acatgctcca gttccaggtc tcctcctcct 4260 ccctggcgag gatcttccag ctcctcctct cccacaagga cagcctgctc atcgaggagt 4320 actcagtcac acagaccaca ctggaccagg tgtttgtaaa ttttgctaaa cagcagactg 4380 aaagtcatga cctccctctg caccctcgag ctgctggagc cagtcgacaa gcccaggacg 4440 actacaaaga ccatgacggt gattataaag atcatgacat cgactacaag gatgacgatg 4500 acaagtgagc ggccgcttcg agcagacatg ataagataca ttgatgagtt tggacaaacc 4560 acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa tttgtgatgc tattgcttta 4620 tttgtaacca ttataagctg caataaacaa gttaacaaca acaattgcat tcattttatg 4680 tttcaggttc agggggagat gtgggaggtt ttttaaagca agtaaaacct ctacaaatgt 4740 ggtaaaatcg ataaggatct tcctagagca tggctacgta gataagtagc atggcgggtt 4800 aatcattaac tacaaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg 4860 ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg cccgggcggc 4920 ctcagtgagc gagcgagcgc gcag 4944 <210> 78 <211> 228 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 78 atgcagatct tcgtgaagac tctgactggt aagaccatca ccctcgaggt ggagcccagt 60 gacaccatcg agaatgtcaa ggcaaagatc caagataagg aaggcattcc tcctgatcag 120 cagaggttga tctttgccgg aaaacagctg gaagatggtc gtaccctgtc tgactacaac 180 atccagaaag agtccacctt gcacctggta ctccgtctca gaggtggg 228

Claims (39)

  1. 세포 내에서 관심 유전자의 코딩 서열을 발현하는 AAV 다중 벡터 시스템으로서,
    상기 코딩 서열은 제1 부분 및 제2 부분을 포함하고,
    상기 벡터 시스템은
    a) - 상기 코딩 서열의 상기 제1 부분(CDS1),
    - 제1 재구축 서열(reconstitution sequence)
    을 포함하는 제1 벡터; 및
    b) - 상기 코딩 서열의 상기 제2 부분(CDS2),
    - 제2 재구축 서열
    을 포함하는 제2 벡터
    를 포함하며,
    상기 제1 재구축 서열 및 상기 제2 재구축 서열은
    i] 상기 제1 재구축 서열은 코딩 서열의 상기 제1 부분의 3' 말단으로 구성되고, 상기 제2 재구축 서열은 코딩 서열의 상기 제2 부분의 5' 말단으로 구성되며, 상기 제1 재구축 서열 및 상기 제2 재구축 서열은 오버래핑 서열임; 또는
    ii] 상기 제1 재구축 서열은 스플라이싱 공여자 신호(SD; donor signal)를 포함하고, 상기 제2 재구축 서열은 스플라이싱 수여자 신호(SA; acceptor signal)를 포함하는 서열임
    으로 이루어진 군으로부터 선택되고,
    상기 제1 벡터 및 제2 벡터 중 하나 또는 둘 다는 분해 신호의 뉴클레오타이드 서열을 더 포함하며, 상기 분해 신호의 뉴클레오타이드 서열은 i)의 경우, CDS1의 3' 말단 및/또는 CDS2의 5' 말단에 위치하고, ii)의 경우, SD에 대하여 3' 위치 및/또는 SA에 대하여 5' 위치에 위치한다는 사실을 특징으로 하며,
    상기 분해 신호의 뉴클레오타이드 서열은 CL1 서열 번호 1을 인코딩하는 서열을 포함하거나 이로 구성되거나, 또는 서열 번호 16을 포함하거나 이로 구성되는, AAV 다중 벡터 시스템.
  2. 제1항에 있어서,
    상기 제1 벡터 및 제2 벡터가 둘 다 분해 신호의 상기 뉴클레오타이드 서열을 더 포함하고,
    상기 제1 벡터 내 분해 신호의 뉴클레오타이드 서열이 상기 제2 벡터 내 분해 신호의 뉴클레오타이드 서열과 동일하거나 상이한, AAV 다중 벡터 시스템.
  3. 제1항에 있어서,
    상기 제1 재구축 서열 및 제2 재구축 서열은 각각 재조합유전성(recombinogenic) 서열을 더 포함하며,
    상기 재조합유전성 서열은 AK GGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAAT(서열 번호 22) 또는 GGGATTTTTCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAAT(서열 번호 23), AP1(서열 번호 24), AP2(서열 번호 25) 및 AP(서열 번호 26)로 이루어진 군으로부터 선택되는, AAV 다중 벡터 시스템.
  4. 제1항에 있어서,
    상기 제1 재구축 서열이 스플라이싱 공여자 신호(SD), 및 상기 SD에 대하여 3' 위치에 재조합유전성 서열을 포함하며,
    상기 제2 재구축 서열이 스플라이싱 수여자 신호(SA), 및 상기 SA에 대하여 5' 위치에 재조합유전성 서열을 포함하고,
    상기 분해 신호의 상기 뉴클레오타이드 서열이 상기 제1 벡터 및 제2 벡터 중 하나 또는 둘 다의 재조합유전성 영역의 뉴클레오타이드 서열의 5' 말단 및/또는 3' 말단에 위치하고,
    상기 재조합유전성 서열은 AK GGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAAT(서열 번호 22) 또는 GGGATTTTTCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAAT(서열 번호 23), AP1(서열 번호 24), AP2(서열 번호 25) 및 AP(서열 번호 26)로 이루어진 군으로부터 선택되는, AAV 다중 벡터 시스템.
  5. 삭제
  6. 삭제
  7. 삭제
  8. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 제1 벡터가 코딩 서열의 상기 제1 부분(CDS1)의 5' 말단 부분에 작동적으로 연결된 프로모터 서열을 더 포함하는, AAV 다중 벡터 시스템.
  9. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 제1 벡터 및 제2 벡터가 둘 다 5'-말단 반복부(5'-TR) 뉴클레오타이드 서열 및 3'-말단 반복부(3'-TR) 뉴클레오타이드 서열을 더 포함하는, AAV 다중 벡터 시스템.
  10. 제9항에 있어서,
    상기 5'-TR이 5'-반전 말단 반복부(5'-ITR; 5'-inverted terminal repeat) 뉴클레오타이드 서열이고, 상기 3'-TR이 3'-반전 말단 반복부(3'-ITR) 뉴클레오타이드 서열이며,
    상기 ITR이 동일한 바이러스 혈청형 또는 상이한 바이러스 혈청형으로부터 유래되는, AAV 다중 벡터 시스템.
  11. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 코딩 서열이 천연 엑손-엑손 연접(junction)에서 상기 제1 부분 및 제2 부분으로 분할되는, AAV 다중 벡터 시스템.
  12. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 스플라이싱 공여자 신호가 GTAAGTATCAAGGTTACAAGACAGGTTTAAGGAGACCAATAGAAACTGGGCTTGTCGAGACAGAGAAGACTCTTGCGTTTCT(서열 번호 27)와 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 100% 동일한 서열을 포함하거나 이로 구성된, AAV 다중 벡터 시스템.
  13. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 스플라이싱 수여자 신호가 GATAGGCACCTATTGGTCTTACTGACATCCACTTTGCCTTTCTCTCCACAG(서열 번호 28)와 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 100% 동일한 서열을 포함하거나 이로 구성된, AAV 다중 벡터 시스템.
  14. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 제1 벡터가, 상기 코딩 서열에 작동적으로 연결된 적어도 하나의 인핸서 뉴클레오타이드 서열을 더 포함하는, AAV 다중 벡터 시스템.
  15. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 코딩 서열이 ABCA4, MYO7A, CEP290, CDH23, EYS, PCDH15, CACNA1, SNRNP200, RP1, PRPF8, RP1L1, ALMS1, USH2A, GPR98 및 HMCN1로 이루어진 군으로부터 선택되는 유전자의 코딩 서열인, AAV 다중 벡터 시스템.
  16. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 코딩 서열이 DMD, CFTR, F8 및 DYSF로 이루어진 군으로부터 선택되는 유전자의 코딩 서열인, AAV 다중 벡터 시스템.
  17. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 제1 벡터가 폴리아데닐화 신호 뉴클레오타이드 서열을 포함하지 않는, AAV 다중 벡터 시스템.
  18. 제1항 내지 제4항 중 어느 한 항에 있어서,
    a) 5'-3' 방향으로:
    - 5'-반전 말단 반복부(5'-ITR) 서열;
    - 프로모터 서열;
    - 관심 유전자의 코딩 서열의 5' 말단 부분(CDS1)으로서, 상기 5' 말단 부분이 상기 프로모터에 작동적으로 연결되고 이의 조절하에 있는 부분;
    - 스플라이싱 공여자 신호의 뉴클레오타이드 서열;
    - 재조합유전성 영역의 뉴클레오타이드 서열; 및
    - 3'-반전 말단 반복부(3'-ITR) 서열
    을 포함하는 제1 벡터; 및
    b) 5'-3' 방향으로:
    - 5'-반전 말단 반복부(5'-ITR) 서열;
    - 재조합유전성 영역의 뉴클레오타이드 서열;
    - 스플라이싱 수여자 신호의 뉴클레오타이드 서열;
    - 코딩 서열의 3' 말단(CDS2);
    - 폴리아데닐화 신호 뉴클레오타이드 서열; 및
    - 3'-반전 말단 반복부(3'-ITR) 서열
    을 포함하는 제2 벡터
    를 포함하고,
    분해 신호의 뉴클레오타이드 서열을 더 포함하고, 상기 서열이 상기 제1 벡터 및 제2 벡터 중 하나 또는 둘 다의 재조합유전성 영역의 뉴클레오타이드 서열의 5' 말단 또는 3' 말단에 위치하며,
    상기 분해 신호의 뉴클레오타이드 서열은 CL1 서열 번호 1을 인코딩하는 서열을 포함하거나 이로 구성되거나, 또는 서열 번호 16을 포함하거나 이로 구성되고,
    상기 재조합유전성 영역의 뉴클레오타이드 서열은 AK GGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAAT(서열 번호 22) 또는 GGGATTTTTCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAAT(서열 번호 23), AP1(서열 번호 24), AP2(서열 번호 25) 및 AP(서열 번호 26)로 이루어진 군으로부터 선택되는 것을 특징으로 하는, AAV 다중 벡터 시스템.
  19. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 아데노-연관 바이러스(AAV)가 혈청형 2, 혈청형 8, 혈청형 5, 혈청형 7 또는 혈청형 9로부터 선택되는, AAV 다중 벡터 시스템.
  20. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 코딩 서열의 제3 부분(CDS3) 및 재구축 서열을 포함하는 제3 벡터를 더 포함하고,
    상기 제2 벡터가 2개의 재구축 서열을 포함하며, 각각의 재구축 서열이 CDS2의 각각의 말단에 위치하는, AAV 다중 벡터 시스템.
  21. 제20항에 있어서,
    상기 제3 벡터가 분해 신호의 적어도 하나의 뉴클레오타이드 서열을 더 포함하고,
    상기 뉴클레오타이드 서열은 CL1 서열 번호 1을 인코딩하는 서열을 포함하거나 이로 구성되거나, 또는 서열 번호 16을 포함하거나 또는 이로 구성되는, AAV 다중 벡터 시스템.
  22. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 제2 벡터가 상기 코딩 서열의 3' 말단 부분(CDS2)에 연결된 폴리아데닐화 신호 뉴클레오타이드 서열을 더 포함하는, AAV 다중 벡터 시스템.
  23. 제1항 내지 제4항 중 어느 한 항에 따른 AAV 다중 벡터 시스템을 이용하여 형질변환된 숙주 세포.
  24. 의료용의 제1항 내지 제4항 중 어느 한 항에 따른 AAV 다중 벡터 시스템.
  25. 의료용의 제23항에 따른 숙주 세포.
  26. 유전자 치료법에 사용하기 위한, 제1항 내지 제4항 중 어느 한 항에 따른 AAV 다중 벡터 시스템.
  27. 유전자 치료법에 사용하기 위한, 제23항에 따른 숙주 세포.
  28. 망막 변성을 특징으로 하는 병태 또는 질병의 치료 또는 예방에 사용하기 위한, 제1항 내지 제4항 중 어느 한 항에 따른 AAV 다중 벡터 시스템.
  29. 망막 변성을 특징으로 하는 병태 또는 질병의 치료 또는 예방에 사용하기 위한, 제23항에 따른 숙주 세포.
  30. 제28항에 있어서,
    상기 망막 변성이 유전성인, AAV 다중 벡터 시스템.
  31. 제29항에 있어서,
    상기 망막 변성이 유전성인, 숙주 세포.
  32. 제28항에 있어서,
    상기 병태 또는 질병이 색소성 망막염(RP; retinitis pigmentosa), 레베르 선천성 흑암시(LCA; Leber congenital amaurosis), 스타르가르트 질병(STGD; Stargardt disease), 어셔 질병(USH; Usher disease), 알스트롬 증후군(Alstrom syndrome), 선천성 비진행 야맹증(CSNB; congenital stationary night blindness), 황반 이영양증(macular dystrophy), 잠복 황반 이영양증(occult macular dystrophy), ABCA4 유전자에서의 돌연변이에 의해 유발된 질병으로 이루어진 군으로부터 선택되는, AAV 다중 벡터 시스템.
  33. 제29항에 있어서,
    상기 병태 또는 질병이 색소성 망막염(RP; retinitis pigmentosa), 레베르 선천성 흑암시(LCA; Leber congenital amaurosis), 스타르가르트 질병(STGD; Stargardt disease), 어셔 질병(USH; Usher disease), 알스트롬 증후군(Alstrom syndrome), 선천성 비진행 야맹증(CSNB; congenital stationary night blindness), 황반 이영양증(macular dystrophy), 잠복 황반 이영양증(occult macular dystrophy), ABCA4 유전자에서의 돌연변이에 의해 유발된 질병으로 이루어진 군으로부터 선택되는, 숙주 세포.
  34. 뒤시엔느 근이영양증, 낭포성 섬유증, 혈우병 A 및 디스페린병증의 예방 및/또는 치료에 사용하기 위한, 제1항 내지 제4항 중 어느 한 항에 따른 AAV 다중 벡터 시스템.
  35. 뒤시엔느 근이영양증, 낭포성 섬유증, 혈우병 A 및 디스페린병증의 예방 또는 치료에 사용하기 위한, 제23항에 따른 숙주 세포.
  36. 제1항 내지 제4항 중 어느 한 항에 따른 AAV 다중 벡터 시스템 또는 제1항 내지 제4항 중 어느 한 항에 따른 AAV 다중 벡터 시스템을 이용하여 형질변환된 숙주 세포; 및 약제학적으로 허용가능한 비히클;을 포함하는 망막 변성을 특징으로 하는 병태 또는 질병의 치료 또는 예방에 사용하기 위한 약제학적 조성물.
  37. 제1항 내지 제4항 중 어느 한 항에 따른 AAV 다중 벡터 시스템 또는 제1항 내지 제4항 중 어느 한 항에 따른 AAV 다중 벡터 시스템을 이용하여 형질변환된 숙주 세포; 및 약제학적으로 허용가능한 비히클;을 포함하는 뒤시엔느 근이영양증, 낭포 성 섬유증, 혈우병 A 및 디스페린병증의 예방 또는 치료에 사용하기 위한 약제학적 조성물.
  38. 제1항의 AAV 다중 벡터 시스템의 하나 이상의 벡터에 분해 신호의 뉴클레오타이드 서열을 삽입하는 단계를 포함하고,
    상기 분해 신호의 뉴클레오타이드 서열이 CL1 서열 번호 1을 인코딩하는 서열을 포함하거나 또는 이로 구성되거나, 또는 서열 번호 16을 포함하거나 또는 이로 구성되는, 절단된 형태의 단백질의 발현을 감소시키는 방법.
  39. 삭제
KR1020177027977A 2015-03-03 2016-03-03 다중 벡터 시스템 및 이의 용도 KR102240180B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562127463P 2015-03-03 2015-03-03
US62/127,463 2015-03-03
PCT/EP2016/054602 WO2016139321A1 (en) 2015-03-03 2016-03-03 Multiple vector system and uses thereof

Publications (2)

Publication Number Publication Date
KR20170140185A KR20170140185A (ko) 2017-12-20
KR102240180B1 true KR102240180B1 (ko) 2021-04-14

Family

ID=56849204

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020177027977A KR102240180B1 (ko) 2015-03-03 2016-03-03 다중 벡터 시스템 및 이의 용도

Country Status (17)

Country Link
US (2) US20180327779A1 (ko)
EP (2) EP3265571B1 (ko)
JP (2) JP7182873B2 (ko)
KR (1) KR102240180B1 (ko)
CN (1) CN107466325A (ko)
AU (1) AU2016227668B2 (ko)
BR (1) BR112017018728A2 (ko)
CA (1) CA2979120A1 (ko)
DK (1) DK3265571T3 (ko)
ES (1) ES2919880T3 (ko)
HR (1) HRP20220776T1 (ko)
MX (2) MX2017011255A (ko)
PL (1) PL3265571T3 (ko)
PT (1) PT3265571T (ko)
RS (1) RS63416B1 (ko)
SI (1) SI3265571T1 (ko)
WO (1) WO2016139321A1 (ko)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3719134B1 (en) * 2015-03-11 2023-08-23 The United States of America, as represented by The Secretary, Department of Health and Human Services Rp2 vectors for treating x-linked retinitis pigmentosa
US11072803B2 (en) 2015-12-22 2021-07-27 Inserm (Institut National De La Sante Et De La Recherche Medicale) Hybrid dual recombinant AAV vector systems for gene therapy
JP2019530737A (ja) 2016-08-23 2019-10-24 アコーオス インコーポレイテッド ヒト対象において非加齢性聴力障害を治療するための組成物および方法
CN110892062A (zh) * 2017-05-05 2020-03-17 佛罗里达大学研究基金会 表达耳畸蛋白的组合物和方法
CN113056561A (zh) * 2018-04-05 2021-06-29 牛津大学科技创新有限公司 用于治疗黄斑营养不良的组合物和方法
EP3781213A4 (en) * 2018-04-17 2022-10-19 The Trustees of the University of Pennsylvania TRANS-SPLICE MOLECULES
US11660353B2 (en) 2018-04-27 2023-05-30 Decibel Therapeutics, Inc. Compositions and methods for treating sensorineural hearing loss using otoferlin dual vector systems
EP3867387A2 (en) * 2018-10-15 2021-08-25 Fondazione Telethon Intein proteins and uses thereof
EP3870148A4 (en) * 2018-10-25 2022-11-09 Takeda Pharmaceutical Company Limited AAV TRIPLE PLASMID SYSTEM
EP3956453A4 (en) * 2019-04-19 2023-02-22 University of Massachusetts GENE THERAPIES FOR USHER SYNDROME (USH1B)
US20220315948A1 (en) * 2019-04-26 2022-10-06 President And Fellows Of Harvard College Aav vectors encoding mini-pcdh15 and uses thereof
WO2021116138A1 (en) * 2019-12-09 2021-06-17 Ucl Business Ltd Gene therapy composition and treatment for myh7-linked cardiomyopathy
EP4100518A2 (en) * 2020-02-07 2022-12-14 The Children's Medical Center Corporation Large gene vectors and delivery and uses thereof
AU2021225035A1 (en) 2020-02-21 2022-10-13 Akouos, Inc. Compositions and methods for treating non-age-associated hearing impairment in a human subject
CN112501209B (zh) * 2020-12-07 2024-02-13 和元生物技术(上海)股份有限公司 外源基因可控表达的腺相关病毒包装方法
CA3218195A1 (en) * 2021-05-07 2022-11-10 Robin Ali Abca4 genome editing

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5827702A (en) 1994-10-31 1998-10-27 Genentech, Inc. Ocular gene therapy
GB9720465D0 (en) * 1997-09-25 1997-11-26 Oxford Biomedica Ltd Dual-virus vectors
US6106826A (en) 1997-12-17 2000-08-22 Wisconsin Alumni Research Foundation Replication competent, avirulent Herpes simplex virus as a vector for neural and ocular gene therapy
DK1071806T3 (da) 1998-04-24 2004-07-19 Univ Florida Rekombinant adeno-associeret virus-vektor, der koder for alpha-1-antitrypsin i genterapi
US6967018B2 (en) 2002-01-11 2005-11-22 Applied Genetic Technologies Corporation Adiponectin gene therapy
WO2003088916A2 (en) * 2002-04-19 2003-10-30 Georgia Tech Research Corporation Compositions and methods for the acceleration of protein secretion dynamics
WO2006036465A2 (en) 2004-09-03 2006-04-06 University Of Florida Compositions and methods for treating cystic fibrosis
JP4948845B2 (ja) * 2006-02-08 2012-06-06 財団法人 東京都医学総合研究所 神経変性疾患治療用物質のスクリーニング方法
AU2007223427A1 (en) * 2006-03-01 2007-09-13 University Of Utah Research Foundation Methods and compositions related to cyclic peptide synthesis
WO2007127428A2 (en) 2006-04-28 2007-11-08 University Of Florida Research Foundation, Inc. Double-stranded/self-complementary vectors with a truncated cba promoter and methods of gene delivery
US8236557B2 (en) * 2008-05-28 2012-08-07 University Of Missouri-Columbia Hybrid-AAV vectors to deliver large gene expression cassette
WO2010059763A1 (en) * 2008-11-19 2010-05-27 Amyris Biotechnologies, Inc. Compositions and methods for the assembly of polynucleotides
AU2010267963B2 (en) * 2009-07-02 2015-09-24 Merz Pharma Gmbh & Co. Kgaa Neurotoxins exhibiting shortened biological activity
ES2704677T3 (es) * 2013-04-18 2019-03-19 Fond Telethon Suministro eficaz de genes grandes por vectores de AAV duales

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
CHO, S. et al., Genes Dev., 2010, vol.24, pp.438-442*

Also Published As

Publication number Publication date
WO2016139321A1 (en) 2016-09-09
PL3265571T3 (pl) 2022-09-05
BR112017018728A2 (pt) 2018-04-17
DK3265571T3 (da) 2022-06-27
AU2016227668B2 (en) 2019-06-27
CN107466325A (zh) 2017-12-12
PT3265571T (pt) 2022-06-29
JP2018512125A (ja) 2018-05-17
MX2017011255A (es) 2018-08-01
JP7182873B2 (ja) 2022-12-05
EP3265571B1 (en) 2022-04-13
KR20170140185A (ko) 2017-12-20
EP4089172A3 (en) 2023-03-01
RS63416B1 (sr) 2022-08-31
EP4089172A2 (en) 2022-11-16
MX2023004479A (es) 2023-05-04
CA2979120A1 (en) 2016-09-09
AU2016227668A1 (en) 2017-08-31
ES2919880T3 (es) 2022-07-28
US20220002749A1 (en) 2022-01-06
US20180327779A1 (en) 2018-11-15
EP3265571A1 (en) 2018-01-10
HRP20220776T1 (hr) 2022-09-16
SI3265571T1 (sl) 2022-10-28
JP2022174192A (ja) 2022-11-22

Similar Documents

Publication Publication Date Title
KR102240180B1 (ko) 다중 벡터 시스템 및 이의 용도
CN110546257B (zh) 用于增强基因表达的组合物和方法
AU2014255665B2 (en) Effective delivery of large genes by dual AAV vectors
KR20200051011A (ko) 변형된 폐쇄-종결된 dna(cedna)
EP4272728A2 (en) Adeno-associated virus variant capsids and use for inhibiting angiogenesis
JP7303816B2 (ja) Aavベクター
CN116194154A (zh) 使用aav载体的plakophilin-2(pkp2)基因疗法
AU2005287393A1 (en) AAV mediated gene delivery to cochlear cells
KR20220140537A (ko) Cdkl5 결핍 장애를 치료하기 위한 유전자 요법
CN116234916A (zh) Csrp3(富含半胱氨酸和甘氨酸的蛋白质3)基因疗法
KR102545070B1 (ko) 안구 장애에 대한 유전자 치료
AU2022253065A1 (en) Compositions and methods for ocular transgene expression
KR20230039669A (ko) eEF1A2용 유전자 요법 벡터 및 이의 용도
CN112601454B (zh) 用于治疗杜兴肌营养不良的组合物和方法
RU2800026C2 (ru) МОДИФИЦИРОВАННАЯ ДНК С ЗАМКНУТЫМИ КОНЦАМИ (зкДНК)
RU2816963C2 (ru) МОДИФИЦИРОВАННАЯ ДНК С ЗАМКНУТЫМИ КОНЦАМИ (зкДНК), СОДЕРЖАЩАЯ СИММЕТРИЧНЫЕ МОДИФИЦИРОВАННЫЕ ИНВЕРТИРОВАННЫЕ КОНЦЕВЫЕ ПОВТОРЫ
KR20240023127A (ko) 망막 장애
CN112522276B (zh) 一种emc1核苷酸序列及其应用
RU2773756C2 (ru) Варианты капсидов аденоассоциированного вируса и их применение для ингибирования ангиогенеза
CN117813321A (zh) 视网膜病症
KR20240005950A (ko) 벡터 시스템
CN117836420A (zh) 重组tert编码病毒基因组和运载体
WO2023150743A2 (en) Codon-optimized smad7 gene therapy to treat and prevent muscle wasting and to enhance muscle mass
WO2023178171A2 (en) Cassettes of anti-complement component 3 antibody, vectorization and theraputic application
KR20240023126A (ko) 망막 장애

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
X091 Application refused [patent]
AMND Amendment
E90F Notification of reason for final refusal
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant