KR20230128001A - 엔젤만 증후군의 치료를 위한 조성물 및 이의 용도 - Google Patents

엔젤만 증후군의 치료를 위한 조성물 및 이의 용도 Download PDF

Info

Publication number
KR20230128001A
KR20230128001A KR1020237021519A KR20237021519A KR20230128001A KR 20230128001 A KR20230128001 A KR 20230128001A KR 1020237021519 A KR1020237021519 A KR 1020237021519A KR 20237021519 A KR20237021519 A KR 20237021519A KR 20230128001 A KR20230128001 A KR 20230128001A
Authority
KR
South Korea
Prior art keywords
leu
glu
lys
asn
ser
Prior art date
Application number
KR1020237021519A
Other languages
English (en)
Inventor
저스틴 퍼시벌
랄프 슈미드
제임스 엠. 윌슨
Original Assignee
더 트러스티스 오브 더 유니버시티 오브 펜실베니아
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 더 트러스티스 오브 더 유니버시티 오브 펜실베니아 filed Critical 더 트러스티스 오브 더 유니버시티 오브 펜실베니아
Publication of KR20230128001A publication Critical patent/KR20230128001A/ko

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0008Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0058Nucleic acids adapted for tissue specific expression, e.g. having tissue specific promoters as part of a contruct
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0075Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the delivery route, e.g. oral, subcutaneous
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • Epidemiology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Neurosurgery (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Neurology (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicinal Preparation (AREA)

Abstract

UBE3A 코딩 서열을 갖는 벡터 게놈을 갖는 rAAV가 제공된다. 또한 뉴런에서 UBE3A 발현이 결손된 환자에서 엔젤만 증후군(AS)의 하나 이상의 증상을 치료하는 방법으로서, 여기서 상기 방법이 UBE3A를 암호화하는 핵산 서열을 갖는 rAAV를 전달하는 것을 포함하는 방법이 또한 제공된다.

Description

엔젤만 증후군의 치료를 위한 조성물 및 이의 용도
엔젤만 증후군(AS)은 전 세계적으로 500,000명의 개인이 걸리는 희귀 유전 장애이다. AS의 주요 증상은 지적 장애, 운동 기능 장애, 운동 실조, 언어 장애, 심한 발작 및 독특한 행동 특징을 포함한다. AS이 있는 대부분의 개인은, 유비퀴틴을 분해를 목표로 하는 기질에 연결하는 HECT E3 유비퀴틴 리가제를 암호화하는 모계 유전 UBE3A 대립유전자의 기능 상실을 나타낸다. AS 사례의 65-70%는 모계 염색체 15q11-q13의 새로운(de novo) 결실을 수반하는 클래스 I 돌연변이로 인해 발생한다[Angelman H., Puppet' children. A report on three cases, Dev Med Child Neurol,1965, 7: 681-88; Mertz LG et al., Angelman syndrome in Denmark. Birth incidence, genetic findings, and age at diagnosis, Am J Med Genet A, 2013, 161A (9): 2197-2203, epub August 2, 2013; Clayton-Smith J., and Laan L., Angelman syndrome: a review of the clinical and genetic types, J Med Genet, 2003, 40(2): 87-95, pub February 1, 2003; Khatri N and Man H, The Autism and Angelman Syndrome Protein Ube3A/E6AP: The Gene, E3 Ligase Ubiquination Targets and Neurobiological Functions, Front Mol Neurosci, 2009, 12(109): 1-12, epub April 30, 2019].
생쥐에서 3개의 UBE3A 이소형(isoform)이 설명되었고, 여기서 이소형 2 및 3이 생쥐에서 주요 UBE3A 스플라이스 변이체로 식별되었다(Valluy, J. et al., A coding-independent function of an alternative Ube3a transcript during neuronal development, Nat Neurosci, 2015, 18(5): 666-673, epub April 13, 2015; Trezza RA et al., Loss of nuclear UBE3a causes electrophysiological and behavioral deficits in mice and is associated with Angelman syndrome, Nat Neurosci, 2019, 22(8): 1235-1247, epub June 24, 2019; Zampeta FI et al., Conserved UBE3a subcellular distribution between human and mice is facilitated by non-homologous isoforms, Hum Mol Genet, 2020, 29(18):3032-3043, epub September 2, 2020). hUBE3A 이소형 1의 손실은, 여전히 핵 hUBE3A 이소형 3 및 세포질 hUBE3A 이소형 2를 발현하는 "경증" 엔젤만 증후군을 앓는 개체에서 발생한다(Sadhwani, A et al., Two Angelman family with unusually advanced neurodevelopment carry a start codon variant in the most highly expressed UBE3a isoform, Am J Med Genet A, 2018, 176(7): 1641-1647, epub May 7, 2018).
현재 AS에 대한 치료법은 없다. 현재 치료는 완화적이며, 발작을 포함한 의료 및 발달 문제의 관리에 중점을 둔다. 치료 옵션이 없다는 것은 AS에 대한 새로운 치료법에 대한 결정적인, 충족되지 않은 필요를 강조한다.
유용하고 내약성이 우수한, UBE3A-이소형 1에 기반한 새로운 아데노-관련 바이러스(AAV) 기반 유전자 대체 요법이 본원에 제공된다. 본 조성물 및 방법은 엔젤만의 동물 모델에서 평가된 바와 같이 엔젤만 증후군(AS)과 관련된 운동 및 행동 결손을 완화할 수 있다. 한 실시양태에서, 조성물은 AS의 치료에 유용한 재조합 아데노-관련 바이러스(rAAV)의 스톡(stock)을 포함하며, 상기 rAAV는 AAV 캡시드 및 그 안에 패키징된 벡터 게놈을 포함하고, 상기 벡터 게놈은 (a) AAV 5' 역위 말단 반복부(inverted terminal repeat: ITR); (b) UBE3A 이소형 1 단백질을 암호화하는SEQ ID NO: 9 또는 이와 95% 동일한 서열(SEQ ID NO: 2)을 포함하는 UBE3A 핵산 서열로서, 여기서 상기 핵산이 인간 세포에서 UBE3A 단백질의 발현을 조절하는 조절 요소에 작동 가능하게 연결되는 UBE3A 핵산 서열; (c) (b)의 UBE3A의 발현을 지시하는 조절 요소; 및 (d) AAV 3' ITR를 포함한다. 특정 실시양태에서, 상기 조절 요소는 뉴런-특이적 프로모터를 포함한다. 특정 실시양태에서, 상기 뉴런-특이적 프로모터는 시냅신 프로모터이다. 특정 실시양태에서, 상기 시냅신 프로모터는 SEQ ID NO: 12의 핵산 서열을 갖는 단축 프로모터이다. 특정 실시양태에서, 상기 조절 요소는 구성적 프로모터를 포함한다. 특정 실시양태에서, 상기 조절 요소는 하나 이상의 인핸서 및 하나 이상의 인트론을 추가로 포함한다. 특정 실시양태에서, 상기 조절 서열은 miR182(SEQ ID NO: 20) 및/또는 miR183(SEQ ID NO: 11)에 대한 하나 이상의 표적화 서열을 추가로 포함하고, 상기 표적화 서열은 UBE3A 핵산 서열에 작동가능하게 연결된다. 특정 실시양태에서, 상기 조절 서열은 miR182 및/또는 miR183으로부터 선택된 miR에 대한 하나 이상의 표적화 서열을 추가로 포함하며, 상기 표적화 서열은 UBE3A 핵산 서열의 하류에 위치한다. 특정 실시양태에서, 상기 조절 서열은 miR183에 대한 4개의 표적화 서열을 추가로 포함하며, 상기 표적화 서열은 UBE3A 핵산 서열의 하류에 위치한다. 특정 실시양태에서, 상기 조절 서열은 SEQ ID NO: 11의 4개의 복제물을 포함한다. 특정 실시양태에서, 상기 AAV 캡시드는 AAVhu68 캡시드이다. 특정 실시양태에서, 상기 AAV 캡시드는 SEQ ID NO: 14 또는 SEQ ID NO: 16의 핵산 서열의 발현으로부터 생성된 AAVhu68 캡시드이다. 특정 실시양태에서, 상기 AAV 캡시드는 AAVrh91 캡시드이다. 특정 실시양태에서, 상기 AAV 캡시드는 SEQ ID NO: 17 또는 SEQ ID NO: 19의 핵산 서열로부터 발현된 AAVrh91 캡시드이다. 특정 실시양태에서, 상기 조성물은 생리학적으로 적합한 담체, 완충제, 보조제, 및/또는 희석제를 추가로 포함하는 수성 현탁액이다.
특정 실시양태에서, 본원에 설명된 바와 같은 조성물은 엔젤만 증후군을 갖는 환자를 치료하는 데 사용하기에 유용하다. 특정 실시양태에서, 본원에 제공된 바와 같은 조성물은 엔젤만 증후군의 하나 이상의 증상을 치료하는데 유용하며, 선택적으로 여기서 상기 증상은 발달 지연, 지적 장애, 중증 언어 장애, 운동 실조, 및/또는 간질 중 하나 이상으로부터 선택된다. 특정 실시양태에서, 본원에 제공된 발현 카세트의 전달을 통해, 뉴런에서 UBE3A 발현이 결손된 환자에서 엔젤만 증후군(AS)의 하나 이상의 증상을 치료하는 방법이 제공된다. 특정 실시양태에서, 상기 발현 카세트는 발달 지연, 지적 장애, 중증 언어 장애, 운동 실조, 및/또는 간질 중 하나 이상으로부터 선택된 증상을 치료한다. 특정 실시양태에서, 조성물은 환자로의 경막내 전달을 위해 제공된다. 특정 실시양태에서, 상기 환자에게 적어도 1 x 1010 내지 1 x 1013 GC/kg의, 조작된 UBE3A 코딩 서열을 운반하는 rAAV를 주사한다.
특정 실시양태에서, 상기 방법은 발달 지연, 지적 장애, 중증 언어 장애, 운동 실조, 및/또는 간질 중 하나 이상을 포함한 엔젤만 병 증상의 개선을 제공한다.
이들 방법 및 조성물의 다른 측면 및 이점이 하기 상세한 설명에서 추가로 설명된다.
도 1a 내지 1c는 후근 신경절 발현 및 독성을 조절하기 위한 miR 서열이 없는 발현 카세트 및 벡터 게놈의 개략적 예시를 제공한다. 도 1a는 5' AAV 역위 말단 반복부(ITR) 및 3' AAV ITR이 hUBE3A-이소형 1에 대한 발현 카세트의 측면에 있는 벡터 게놈의 개략적 예시를 제공한다. 발현 카세트는 변형된 시냅신 프로모터의 통제 하에 조작된 hUBE3A-이소형 1 코딩 서열(852개 아미노산을 암호화함; SEQ ID NO: 2)을 함유한다. hUBE3A 코딩 서열은 Ube3A 리가제의 아미노-말단 아연-집게(zinc-finger)(AZUL), HECT 도메인 및 RCC1-유사 도메인 2(HERC2), E6 단백질 결합 도메인(E6BD), 및 E6-AP 카르복실 말단에 상동인(HECT) 영역, 및 SV40 polyA를 포함한다. 도 1b는 AAV ITR이 hUBE3A-이소형 2에 대한 발현 카세트의 측면에 있는 벡터 게놈의 개략적 예시를 제공한다. 암호화된 이소형 2 단백질은 길이 875개 아미노산(SEQ ID NO: 6)이다. 도 1c는 AAV ITR이 hUBE3A-이소형 3에 대한 발현 카세트의 측면에 있는 벡터 게놈의 개략적 예시를 제공한다. 암호화된 이소형 3 단백질은 길이 872개 아미노산(SEQ ID NO: 21)이다.
도 2a 및 2b는 비인간 영장류(NHP)에서 miR183 표적 서열의 4개 복제물(4xmiR183)이 있거나(밝은 원) 4xmiR183 서열이 없는(어두운 서열) rAAVhu68.UBE3A-이소형 1의 mRNA 발현 및 벡터 생체분포의 평가 결과를 예시한다. 도 2a는 소뇌, 미상핵, 해마, 전두엽, 후두 피질, 속질, 정수리 피질, 측두 피질, 시상, DRG 경부, DRG 흉부, DRG 요추, 척수 경부, 척수 흉부, 척수 요추에서 게놈 복제물(GC)/이배체 게놈으로 측정된 바와 같은, NHP에서의 UBE3A 이소형 1 벡터 생체분포를 예시한다. 도 2b는 NHP의 DRG 및 척수에서 miR183 표적 서열의 4개 복제물(4xmiR183)이 있거나(밝은 원) 4xmiR183 서열이 없는(어두운 서열) rAAVhu68.UBE3A-이소형 1로 처리한 후의 UBE3A 이소형 1 mRNA 발현을 예시한다. 도 2c는 소뇌, 미상핵, 해마, 전두엽, 후두 피질, 속질, 정수리 피질, 측두 피질, 시상, DRG 경부, DRG 흉부, DRG 요추, 척수 경부, 척수 흉부, 척수 요추, 대뇌에서 UBE3A 이소형 1을 예시한다(음성 대조군).
도 3a 및 3b는 AAVhu68-UBE3A-이소형 1 ± 4xmiR183 벡터가 (3-4 연령의) 붉은 털 원숭이(rhesus macaque)에서 상당한 후근 신경절(DRG) 독성을 유발하지 않음을 보여준다. hUBE3A-1(그룹 1) 또는 hUbe3a-1-4xmiR183(그룹 2) 벡터는 3 x 1013 GC/동물의 용량으로 대조(Cisterna Magna, ICM) 투여 후 35일에 붉은 털 원숭이에서 상당한 AAV 유도 후근 신경절 독성을 유발하지 않는다. DRG 관련 독성은 그룹 1 동물 192285의 척수 및 말초 신경에서만 관찰되었다. 두 그룹 전체 동물에서의 DRG는, 산발적인 최소 단핵 세포 침윤물(도 3b, 원)만 있고 신경 변성의 증거 없이(3/3 동물, 그룹 1; 3/3 동물, 그룹 2) 눈에 띄지 않았다(도 3a).
도 4a 및 4b는 (3-4 연령의) 붉은 털 원숭이의 말초 신경에서 rAAVhu68.시냅신-UBE3A 이소형 1의 영향을 보여준다. 뒷다리 신경에서 최소 초점 축삭병증(화살촉)의 영향. 도 4a는 말초 신경에서 동물 AAVhu68.시냅신-UBE3A 이소형 1을 보여준다. 도 4b는 동물 192275 및 192297이 앞다리 우측 정중 신경에서 경미한 다발성 축삭병증(화살촉) 및 단핵 세포 침윤물(타원형)을 나타냈음을 보여준다.
도 5는 처리된 UBE3Am-/p+ 신생아 생쥐에서 UBE3A 단백질 양성 뉴런의 정량화를 보여준다. 처리는 뇌실내(ICV)를 통한 1x1011 GC/동물의 용량으로의 AAV-PHP.B-hSyn-UBE3A-이소형 1의 투여로 구성되었다. 피질, 해마, 시상, 시상하부 및 중뇌에서, 뉴런의 42-68%가 UBE3A 단백질을 발현했다(각각의 WT 조직에서 UBE3A 양성 뉴런으로 표준화됨).
도 6은 처리된 UBE3Am-/p+ 신생아 생쥐에서 UBE3A 단백질 양성 뉴런의 정량화를 보여준다. 처리는 뇌실내(ICV)를 통한 1x1010 GC/동물의 용량으로의 AAV-PHP.B-hSyn-UBE3A-이소형 1의 투여로 구성되었다. 피질, 해마, 시상, 시상하부 및 중뇌에서, 뉴런의 20-50%가 UBE3A 단백질을 발현했다(각각의 WT 조직에서 UBE3A 양성 뉴런으로 표준화됨).
도 7a 내지 7i는 처리된 3마리의 비인간 영장류(NHP-1, -2, -3; 35일 연구에서)로부터의 후근 신경절(경부, 흉부, 및 요추 분절)에서 조작된 인간 UBE3A 이소형 1(hUBE3A-1) 전사체 국소화의 형광 영상을 보여준다. 처리는 대조(ICM) 경로를 통한 3 x 1013 GC/동물의 용량으로의 AAV-PHP.B-hSyn-UBE3A-이소형 1의 투여로 구성되었다. 관심 영역의 영상을 다양한 배율에서 촬영하였고, 영상은 20x 배율에서 제시된다. 도 7a는 NHP-1로부터의 후근 신경절의 경부 분절에서 조작된 hUBE3A-1 전사체 국소화의 형광 영상을 보여준다. 도 7b는 NHP-2로부터의 후근 신경절의 경부 분절에서 조작된 hUBE3A-1 전사체 국소화의 형광 영상을 보여준다. 도 7c는 NHP-3으로부터의 후근 신경절의 경부 분절에서 조작된 hUBE3A-1 전사체 국소화의 형광 영상을 보여준다. 도 7d는 NHP-1로부터의 후근 신경절의 흉부 분절에서 조작된 hUBE3A-1 전사체 국소화의 형광 영상을 보여준다. 도 7e는 NHP-2로부터의 후근 신경절의 흉부 분절에서 조작된 hUBE3A-1 전사체 국소화의 형광 영상을 보여준다. 도 7f는 NHP-3로부터의 후근 신경절의 흉부 분절에서 조작된 hUBE3A-1 전사체 국소화의 형광 영상을 보여준다. 도 7g는 NHP-1로부터의 후근 신경절의 요추 분절에서 조작된 hUBE3A-1 전사체 국소화의 형광 영상을 보여준다. 도 7h는 NHP-2로부터의 후근 신경절의 요추 분절에서 조작된 hUBE3A-1 전사체 국소화의 형광 영상을 보여준다. 도 7i는 NHP-3로부터 후근 신경절의 요추 분절에서 조작된 hUBE3A-1 전사체 국소화의 형광 영상을 보여준다.
도 8은 AAV-PHP.B-hSyn-hUBE3A-이소형 1로 ICV 주사 후 UBE3Am-/p+ 및 야생형 생쥐의 뇌에서, 조작된 UBE3A 이소형 1의 발현을 보여준다.
도 9a 및 9b는 야생형 신생아 또는 AS(UBE3Am-/p+) 생쥐에게 AAV-PHP.B-시냅신-UBE3A-이소형 1 또는 이소형 2 벡터를 1x1011 게놈 복제물(GC)/동물의 용량으로 뇌실내(ICV) 주사한 후 8-10주령에서 수행한 운동 협응 행동 시험의 결과를 보여준다. 도 9a는 AAV-PHP.B-시냅신-UBE3A-이소형 1로 처리한 후 WT 및 AS 생쥐에서의 운동 협응을 보여준다. 도 9b는 AAV-PHP.B-시냅신-UBE3A-이소형 2로 처리한 후 WT 및 AS 생쥐에서의 운동 협응을 보여준다.
도 10a 내지 10d는 야생형 신생아 또는 AS(UBE3Am-/p+) 생쥐에게 AAV-PHP.B-시냅신-UBE3A-이소형 1 또는 이소형 2 벡터를 1x1011 게놈 복사(GC)/동물의 용량으로 뇌실내(ICV) 주사한 후 8-10주령에서 수행한 보금자리 구축 능력 행동 시험(the nest building ability behavioral test)의 결과를 보여준다. 도 10a는 AAV-PHP.B-시냅신-UBE3A-이소형 1로 처리한 후 WT 및 AS 생쥐에서의 보금자리 구축 점수를 보여준다. 도 10b는 AAV-PHP.B-시냅신-UBE3A-이소형 1로 처리한 후 WT 및 AS 생쥐에 의한 미사용 네슬렛(nestlet)의 백분율을 보여준다. 도 10c는 AAV-PHP.B-시냅신-UBE3A-이소형 2로 처리한 후 WT 및 AS 생쥐에서 보금자리 형성 점수를 보여준다. 도 10d는 AAV-PHP.B-시냅신-UBE3A-이소형 2로 처리한 후 WT 및 AS 생쥐에 의한 미사용 네슬렛의 백분율을 보여준다.
도 11a 내지 11d는 신생아 야생형 또는 AS(UBE3Am-/p+) 생쥐에게 AAV-PHP.B-시냅신-UBE3A-이소형 1 벡터를 1x1011 게놈 복사 복제물(GC)/동물의 용량으로 뇌실내(ICV) 주사한 후 8-10주령에서 수행한 캣워크(보폭 및 보행 개선) 행동 시험의 결과를 보여준다. 도 11a는 AAV-PHP.B-시냅신-UBE3A-이소형 1로 처리한 후 WT 및 AS 생쥐에서 오른쪽 뒷(RH) 다리의 보폭을 보여준다. 도 11b는 AAV-PHP.B-시냅신-UBE3A-이소형 1로 처리한 후 WT 및 AS 생쥐에서 왼쪽 뒷(LH) 다리의 보폭을 보여준다. 도 11c는 AAV-PHP.B-시냅신-UBE3A-이소형 1로 처리한 후 WT 및 AS 생쥐에서 오른쪽 뒷(RH) 다리의 보폭을 보여준다. 도 11d는 AAV-PHP.B-시냅신-UBE3A-이소형 1로 처리한 후 WT 및 AS 생쥐에서 왼쪽 뒷(LH) 다리의 보폭을 보여준다.
도 12a 내지 2c는 대조(ICM) 경로를 통해 3x1013 GC/동물의 용량으로 AAV-hu68-hSyn-UBE3A-이소형 1로 처리하고 35일 후 NHP의 후근 신경절(drg)에서 독성 연구 결과를 보여준다(0-5점의 병리학 등급으로 표시됨). 도 12a는 NHP의 DRG의 경부 분절에서 점수 매겨진 병리학 등급을 보여준다. 도 12b는 NHP의 DRG의 흉부 분절에서 점수 매겨진 병리학 등급을 보여준다. 도 12c는 NHP의 DRG의 요추 분절에서 점수 매겨진 병리학 등급을 보여준다.
도 13a 내지 13c는 대조(ICM) 경로를 통해 3x1013 GC/동물로 AAV-hu68-hSyn-UBE3A-이소형 1로 처리하고 35일 후 NHP의 척수에서의 독성 연구 결과를 보여준다(0-5점의 병리학 등급으로 표시됨). 도 13a는 NHP의 척수의 경부 분절에서 점수 매겨진 병리학 등급을 보여준다. 도 13b는 NHP의 척수의 흉부 분절에서 점수 매겨진 병리학 등급을 보여준다. 도 13c는 NHP의 척수의 요추 분절에서 점수 매겨진 병리학 등급을 보여준다.
도 14는 대조(ICM) 경로를 통해 3x1013 GC/동물의 용량으로 AAV-hu68-hSyn-UBE3A-이소형 1로 처리하고 35일 후 NHP의 말초 신경에서의 독성 연구 결과를 보여준다.
도 15a 내지 15c는 대조(ICM) 경로를 통해 3x1013 GC/동물의 용량으로 AAV-hu68-hSyn-UBE3A-이소형 1로 처리하고 14일 및 35일 후 말초신경 전도 연구 결과를 보여준다. 도 15a는 좌측 정중 신경의, m/sec로 측정된 속도를 보여준다. 도 15b는 mV 단위의 피크 대 피크(PP) 진폭으로 측정된, AAV-hu68-hSyn-UBE3A-이소형 1로 처리하고 14일 및 35일 후 말초 신경 전도 연구의 결과를 보여준다. 도 15c는 mV 단위의 음의 피크(NP) 진폭으로 측정된, AAV-hu68-hSyn-UBE3A-이소형 1로 처리하고 14일 및 35일 후 말초 신경 전도 연구 결과를 보여준다.
도 16a 및 16b는 WT 조직 내 UBE3A 양성 뉴런에 대해 표준화된, 피질, 해마, 시상, 시상 하부 및 중뇌의 양성 뉴런 백분율로 표시된, 처리된 UBE3Am-/p+ 신생아 생쥐에서 UBE3A 이소형 1 또는 이소형 2 단백질 양성 뉴런의 정량화를 보여준다. 처리는 뇌실내(ICV)를 통한 1x1011 GC/동물의 용량으로의 AAV-PHP.B-hSyn-UBE3A-이소형 1 또는 이소형 2의 투여로 구성되었다. 도 16a는 처리 후 생쥐의 피질, 해마, 시상, 시상하부 및 중뇌에서 UBE3A 이소형 1 양성 뉴런의 백분율을 보여준다. 도 16b는 처리 후 생쥐의 피질, 해마, 시상, 시상하부 및 중뇌에서 UBE3A 이소형 2 양성 뉴런의 백분율을 보여준다.
엔젤만 증후군의 증상을 치료하는 수준으로 (예를 들어, rAAV-매개 유전자 대체 요법을 통해) 전달될 때 UB3A 이소형 1을 발현하는 조작된 UBE3A-이소형 1 코딩 서열을 함유하는 발현 카세트가 본원에 제공된다. 특정 실시양태에서, 상기 발현 카세트 내 조절 요소는 후근신경절(DRG) 발현 및/또는 독성을 조절하기 위해 최대 8개, 예를 들어, 4개 내지 8개의 miR183 서열을 포함한다. 특정 실시양태에서, 이들 DRG-탈표적화 서열은 높은 수준으로 발현될 때 및/또는 전신 전달이 의도될 때 사용을 위해 선택된다. 다른 실시양태에서, 이들 서열은 경막내 전달이 활용될 때 포함된다.
한 실시양태에서, 발현 카세트는 표적화된 인간 세포에서 UBE3A 단백질의 발현을 조절하는 조절 요소에 작동가능하게 연결된 조작된 UBE3A 코딩(핵산 서열)을 포함한다. 특정 실시양태에서, UBE3A 코딩 서열은 SEQ ID NO: 2에서 재현되는 UBE3A 이소형 1 단백질을 암호화한다. hUBE3A 이소형 1 단백질은 Ube3A 리가제의 아미노-말단 아연-집게(AZUL), HECT 도메인 및 RCC1-유사 도메인 2(HERC2), E6 단백질 결합 도메인(E6BD), 및 E6-AP 카르복실 말단에 상동인(HECT) 영역을 포함한 여러 도메인을 포함한다. 적합하게는, 조작된 UBE3A 이소형 1 코딩 서열은 UBE3A 이소형 1 단백질을 암호화하는 SEQ ID NO: 9의 핵산 서열 또는 이와 적어도 95% 동일한 서열(SEQ ID NO: 2)이다. 특정 실시양태에서, 상기 서열은 SEQ ID NO: 9의 전장과 100% 동일하다. 다른 실시양태에서, 상기 서열은 SEQ ID NO: 9와 적어도 95% 동일하고, 적어도 97% 동일하고, 적어도 98% 동일하고, 적어도 99% 동일하고, 99.5% 동일하다. 특정 실시양태에서, UBE3A 이소형 1 코딩 서열은 5' 또는 3' 말단에서 절단되어, UBE3A 이소형 1 단백질의 카르복시 또는 N-말단의 절단을 초래한다.
특정 실시양태에서, UBE3A 이소형 2 단백질을 암호화하는 UBE3A 코딩 서열은 SEQ ID NO: 6에서 재현된다. hUBE3A 이소형 2 단백질은 Ube3A 리가제의 아미노-말단 아연-집게(AZUL), HECT 도메인 및 RCC1-유사 도메인 2(HERC2), E6 단백질 결합 도메인(E6BD), 및 E6-AP 카르복실 말단에 상동인(HECT) 영역을 포함한 여러 도메인을 포함한다. 적합하게는, 조작된 UBE3A 이소형 2 코딩 서열은 UBE3A 이소형 2 단백질을 암호화하는 SEQ ID NO: 10의 핵산 서열 또는 이와 적어도 95% 동일한 서열(SEQ ID NO: 6)이다. 특정 실시양태에서, 상기 서열은 SEQ ID NO: 10의 전장과 100% 동일하다. 다른 실시양태에서, 상기 서열은 SEQ ID NO: 10과 적어도 95% 동일하고, 적어도 97% 동일하고, 적어도 98% 동일하고, 적어도 99% 동일하고, 99.5% 동일하다. 특정 실시양태에서, UBE3A 이소형 2 코딩 서열은 5' 또는 3' 말단에서 절단되어, UBE3A 이소형 2 단백질의 카르복시 또는 N-말단의 절단을 초래한다. 특정 실시양태에서, UBE3A 이소형 3 단백질을 암호화하는 UBE3a 코딩 서열은 SEQ ID NO: 21(UNIPROT ID No: Q05086-3)에서 재현된다.
특정 실시양태에서, 발현 카세트는 UBE3A 코딩 서열을 포함하며, 여기서 선택적으로 상기 UBE3A 코딩 서열은 신호 펩타이드 및 기능성 UBE3A 단백질을 포함하는 융합 단백질을 암호화한다. 특정 실시양태에서, 상기 발현 카세트는 UBE3A 코딩 서열을 포함하며, 여기서 선택적으로 상기 UBE3A 코딩 서열은 기능적 UBE3A 단백질에 융합된 흡수 펩타이드를 포함하는 융합 단백질을 암호화한다. 특정 실시양태에서, 상기 발현 카세트는 UBE3A 코딩 서열을 포함하며, 여기서 선택적으로 상기 UBE3A 코딩 서열은 신호 펩타이드 및/또는 흡수 펩타이드에 융합된 UBE3A 단백질을 포함하는 융합 단백질을 암호화한다. 일부 실시양태에서, 상기 발현 카세트는 UBE3A 코딩 서열을 포함하며, 여기서 선택적으로 상기 신호 펩타이드 및/또는 흡수 펩타이드는 UBE3A 코딩 서열의 5' 또는 3'에 위치하여, UBE3A 단백질의 N-말단에 신호 펩타이드 및/또는 흡수 펩타이드를 포함하는 융합 단백질, UBE3A 단백질의 C-말단에 신호 펩타이드 및/또는 흡수 펩타이드를 포함하는 융합 단백질, 또는 UBE3A 단백질의 N-말단에 신호 펩타이드를 포함하는 융합 단백질, 또는 UBE3A 단백질의 C-말단에 신호 펩타이드 또는 흡수 펩타이드를 갖는 융합 단백질, 또는 이의 조합을 제공한다. 특정 실시양태에서, 상기 신호 펩타이드는 결합 면역글로불린 단백질(BiP) 신호 펩타이드이다. 특정 실시양태에서, 상기 신호 펩타이드는 가우시아(Gaussia) 신호 펩타이드이다. 또한, 전체가 본원에 참고로 편입되는 미국 특허 번호 US 9,279,007 B2((상응하는 국제 특허 출원 번호 WO2012/071422; 결합 면역글로불린 단백질(BiP) 신호 펩타이드), US 10,874,750 B2(상응하는 국제 특허 출원 번호 WO2019/213180A1; 결합 면역글로불린 단백질(BiP) 신호 펩타이드 및 가우시아 신호 펩타이드)를 참고한다. 특정 실시양태에서, 선택적으로 UBE3A는 발현, 분비 및 세포 흡수를 향상시키는 펩타이드를 포함하는 융합 단백질이다. 특정 실시양태에서, 선택적으로 UBE3A는 시스타틴 펩타이드 서열인 펩타이드를 포함하는 융합 단백질이다. 또한, 전체가 본원에 참고로 편입되는 US 9,567,369를 참고한다. 특정 실시양태에서, 선택적으로 UBE3A는 HIV TATk 펩타이드(예를 들어, TATk28, TATk11)로부터의 유도체인 펩타이드를 포함하는 융합 단백질이다. 전체가 본원에 참고로 편입되는 WO2015/128746A2(US 10,907,138 B2), WO2018/005617A2(US 2021/0268072), WO2019/108924A2, WO2020/250081A1 및 WO2021/087282A1을 참고한다. 일부 실시양태에서, 상기 펩타이드는 IGF2 펩타이드이다. 또한, 전체가 본원에 참고로 편입되는 WO21/072372를 참고한다. 특정 실시양태에서, 선택적으로 상기 UBE3A는 페네트라틴, R6W3, HIV TAT, HIV TATk 및 pVEC로부터 선택된 세포 흡수 서열을 포함하는 펩타이드를 포함하는 융합 단백질이다. 특정 실시양태에서, 선택적으로 UBE3A는 인슐린, GDNF 및 IgK로부터 선택된 분비 서열을 포함하는 펩타이드를 포함하는 융합 단백질이다. 또한, 전체가 본원에 참고로 편입되는 WO 2019/006107을 참고한다.
특정 실시양태에서, UBE3A 이소형 1 발현 카세트는 유전자 대체 요법 단독으로서의 전달을 위해 선택된다. 특정 실시양태에서, UBE3A 이소형 1 발현 카세트는 하나 이상의 다른 활성 구성요소(예를 들어, 단기 또는 장기 효소 대체 요법 및/또는 기질 고갈 요법)를 수반하는 레지멘(regimen)에서 유전자 대체 요법으로서의 전달을 위해 선택된다.
한 실시양태에서, 조성물은 UBE3A 이소형 1에 대한 발현 카세트를 포함하는 벡터를 포함한다. 적합한 벡터 및 벡터 게놈이 본원에 설명된다.
다른 실시양태에서, 재조합 파보바이러스 벡터(예를 들어, 재조합 아데노-관련 바이러스)의 스톡이 제공된다. rAAV는 AAV 캡시드 및 그 안에 패키징된 벡터 게놈을 포함하며, 상기 벡터 게놈은 (a) AAV 5' 역위 말단 반복부(ITR); (b) UBE3A 이소형 1 단백질을 암호화하는 SEQ ID NO: 9 또는 이와 95% 동일한 서열(SEQ ID NO: 2)을 포함하는 UBE3A 핵산 서열로서, 여기서 상기 핵산이 인간 세포에서 UBE3A 단백질의 발현을 조절하는 조절 요소에 작동 가능하게 연결되는 UBE3A 핵산 서열; (c) (b)의 UBE3A의 발현을 지시하는 조절 요소; 및 (d) AAV 3' ITR를 포함한다. 바람직한 AAV 캡시드는 중추신경계(CNS)에서 원하는 세포를 표적으로 하는 AAVhu68 및 AAVrh91을 포함한다.
특정 실시양태에서, rAAV는 AAV 캡시드 및 그 안에 패키징된 벡터 게놈을 포함하며, 상기 벡터 게놈은 (a) AAV 5' 역위 말단 반복부(ITR); (b) 선택적으로 펩타이드(예를 들어, 신호 또는 흡수 펩타이드); (c) UBE3A 이소형 1 단백질을 암호화하는 SEQ ID NO: 9 또는 이와 95% 동일한 서열(SEQ ID NO: 2)을 포함하는 UBE3A 핵산 서열로서, 여기서 상기 핵산 서열이 인간 세포에서 UBE3A 단백질의 발현을 조절하는 조절 요소에 작동 가능하게 연결되는 UBE3A 핵산 서열; (d) 선택적으로 펩타이드(조절 및/또는 흡수 펩타이드); (e) (b)의 UBE3A의 발현을 지시하는 조절 요소; 및 (f) AAV 3' ITR을 포함한다. 특정 실시양태에서, 상기 신호 펩타이드는 BiP 신호 펩타이드이다. 또한, 전체가 본원에 참고로 편입되는 US 9,279,007 B2(상응하는 국제 특허 출원 번호 WO2012/071422) 및 US 10,874,750 B2(상응하는 국제 특허 출원 번호 WO2019/213180A1)를 참고한다. 특정 실시양태에서, 상기 조절 펩타이드는 IGF 펩타이드이다. 또한, 전체가 본원에 참고로 편입되는 WO2021/072372를 참고한다. 특정 실시양태에서, 상기 신호 펩타이드는 인슐린, GDNF 및 IgK로부터 선택된 분비 서열을 포함하는 분비 신호 펩타이드이다. 특정 실시양태에서, 상기 흡수 펩타이드는 페네트라틴, R6W3, HIV TAT, HIV TATk 및 pVEC로부터 선택된 세포 흡수 서열을 포함한다. 또한, 전체가 본원에 참고로 편입되는 WO 2019/006107을 참고한다.
특정 실시양태에서, 상기 UBE3A는 선택적으로 본원에 설명된 바와 같은 신호 펩타이드 및/또는 흡수 펩타이드를 포함하는 융합 단백질이다. 특정 실시양태에서, 신호 펩타이드 및/또는 흡수 펩타이드는 아미노(N)-말단 또는 카르복시(C)-말단에 위치한다. 특정 실시양태에서, 신호 펩타이드는 아미노(N)-말단에 위치한다. 특정 실시양태에서, 흡수 펩타이드는 N-말단 또는 C-말단에 위치한다.
본원에 사용된 바와 같은 rAAV의 "스톡"은 rAAV의 집단을 지칭한다. 탈아미드화로 인한 이것들의 캡시드 단백질의 이질성에도 불구하고, 스톡 내 rAAV는 5개의 동일한 벡터 게놈을 공유할 것으로 예상된다. 스톡은 예를 들어, 선택된 AAV 캡시드 단백질 및 선택된 생산 시스템의, 특징적인 이종의 탈아미드화 패턴을 갖는 캡시드를 갖는 rAAV를 포함할 수 있다. 스톡은 단일 생산 시스템에서 생산될 수 있거나, 생산 시스템의 여러 실행에서 풀링될 수 있다. 본원에 설명된 것들을 포함하지만 이것들로 제한되지 않는 다양한 생산 시스템이 선택될 수 있다.
본 명세서에서 달리 정의되지 않는 한, 본원에 사용된 기술 및 과학 용어는 당업자가, 그리고 당업자에게 본 출원에 사용된 많은 용어에 대한 일반적인 안내를 제공하는 공개된 텍스트를 참고하여, 일반적으로 이해하는 것과 동일한 의미를 갖는다.
본원에 사용된 바와 같은 "질환", "장애" 및 "병태"는, 대상체에서 비정상적인 상태를 나타내기 위해 상호교환적으로 사용된다. 한 실시양태에서, 상기 질환은 엔젤만 증후군(AS)이다.
본원에서 상호교환적으로 사용된 바와 같은 "환자" 또는 "대상체"는, 인간, 수의학 또는 농장 동물, 가축 또는 애완동물, 및 임상 연구에 일반적으로 사용된 동물을 포함한 수컷 또는 암컷 포유류 동물을 의미한다. 한 실시양태에서, 이들 방법 및 조성물의 대상체는 인간 환자이다. 한 실시양태에서, 이들 방법 및 조성물의 대상체는 남성 또는 여성 인간이다.
이 명세서 및 청구범위 전반에 걸쳐 사용된 바와 같은 용어 "포함하는", "함유하는", "포함하는," 및 이의 변형은 다른 구성요소, 요소, 정수, 단계 등을 포함한다. 반대로, 용어 "구성되는(consisting)" 및 이의 변형은 다른 구성요소, 요소, 정수, 단계 등을 배제한다.
단수 형태는 하나 이상을 지칭하며, 예를 들어, 단수 형태의 "뉴런"은 하나 이상의 뉴런(들)을 나타내는 것으로 이해됨을 유의해야 한다. 이와 같이, 용어 단수 형태, "하나 이상" 및 "적어도 하나"는 본원에서 상호교환적으로 사용된다.
본원에 사용된 바와 같은 용어 "약"은, 달리 명시되지 않는 한, 주어진 기준으로부터 ±10%의 가변성을 의미한다.
어떤 경우에, 용어 "E+#"은 지수를 참조하는 데 사용된다. 예를 들어, 5E10은 5 x 1010이다. 이들 용어는 상호교환적으로 사용될 수 있다.
본원에 설명된 핵산 서열은 통상의 분자 생물학 기술을 사용하여 클로닝될 수 있거나, DNA 합성에 의해 새로 생성될 수 있다. 본원에 설명된 UBE3A 유전자의 어스펙트(aspect)를 암호화하는 핵산 서열은 조립되어, 임의의 적합한 유전적 요소, 예를 들어, 네이키드(naked) DNA, 파지, 트랜스포손, 코스미드, 에피솜 등에 놓이며, 이 유전적 요소는 예를 들어, 비-바이러스 전달 시스템(예를 들어, RNA 기반 시스템, 네이키드 DNA 등)을 생성하기 위해, 또는 패키징되는 숙주 세포에서 바이러스 벡터를 생성하기 위해, 및/또는 대상체 내 숙주 세포로 전달하기 위해 그 위에 운반된 서열을 숙주 세포로 전달한다. 한 실시양태에서, 상기 유전적 요소는 벡터이다. 한 실시양태에서, 상기 유전적 요소는 플라스미드이다. 이러한 조작된 작제물을 만드는 데 사용된 방법은 핵산 조작에서의 숙련자에게 알려져 있으며, 유전 공학, 재조합 공학, 및 합성 기술을 포함한다. 예를 들어, Green and Sambrook, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press, Cold Spring Harbor, NY (2012)을 참고한다.
발현 카세트
본원에 사용된 바와 같은 "발현 카세트"는, 생물학적으로 유용한 핵산 서열(예를 들어, 단백질, 효소 또는 기타 유용한 유전자 산물, mRNA 등을 암호화하는 유전자 cDNA), 및 상기 핵산 서열 및 이의 유전자 산물의 전사, 번역 및/또는 발현을 지시하거나 조절하는 여기에 작동 가능하게 연결된 조절 서열을 포함하는 핵산 분자를 지칭한다. 본원에 사용된 바와 같은 "작동가능하게 연결된" 서열은, 핵산 서열과 연속되거나 비연속되는 조절 서열, 및 트랜스 또는 시스 핵산 서열에서 작용하는 조절 서열 둘 다를 포함한다. 이러한 조절 서열은 전형적으로 예를 들어, 프로모터, 인핸서, 인트론, Kozak 서열, 폴리아데닐화 서열, 및 TATA 신호 중 하나 이상을 포함한다. 발현 카세트는, 다른 요소 중에서, 유전자 서열의 상류(에 대한 5') 조절 서열, 예를 들어, 프로모터, 인핸서, 인트론 등 중 하나 이상, 및 하나 이상의 인핸서, 또는 유전자 서열 하류(에 대한 3') 조절 서열, 예를 들어, 폴리아데닐화 부위를 포함하는 3' 비번역 영역(3' UTR)을 함유할 수 있다. 특정 실시양태에서, 상기 조절 서열은 유전자 산물의 핵산 서열에 작동가능하게 연결되며, 여기서 상기 조절 서열은 개재 핵산 서열, 즉 5'-비번역 영역(5'UTR)에 의해 유전자 산물의 핵산 서열로부터 분리된다. 특정 실시양태에서, 발현 카세트는 하나 이상의 유전자 산물의 핵산 서열을 포함한다. 일부 실시양태에서, 발현 카세트는 모노시스트론 또는 바이시스트론 발현 카세트일 수 있다. 다른 실시양태에서, 용어 "이식유전자"는, 표적 세포에 삽입되는 외인성 원천으로부터의 하나 이상의 DNA 서열을 지칭한다. 전형적으로, 이러한 발현 카세트는 바이러스 벡터를 생성하는데 사용될 수 있고, 바이러스 게놈 및 본원에 설명된 것들과 같은 다른 발현 통제 서열의 신호를 패키징함으로써 측면에 있는 본원에 설명된 유전자 산물에 대한 코딩 서열을 함유한다. 특정 실시양태에서, 벡터 게놈은 2개 이상의 발현 카세트를 함유할 수 있다.
일부 실시양태에서, 코딩 서열을 포함하는 핵산 분자는 UBE3A 코딩 서열이고, 프로모터를 추가로 포함하며, 이를 위한 다른 조절 서열을 포함할 수 있다. 특정 실시양태에서, 발현 카세트는, 바이러스 게놈 및 본원에 설명된 것들과 같은 다른 발현 통제 서열의 신호를 패키징함으로써, 측면에 있는 본원에 설명된 UBE3A에 대한 코딩 서열을 함유하는 바이러스 벡터(예를 들어, 바이러스 입자)를 생성하기 위해 사용된다. 일부 실시양태에서, 바이러스 벡터는 AAV 바이러스 벡터이며, 여기서 패키징 신호는 5' AAV 역위 말단 반복부(ITR) 및 3' AAV ITR이다. 선택적으로, 발현 카세트(및 벡터 게놈)는 예를 들어, drg 독성 및/또는 축삭병증을 감소시키기 위해 UTR에 하나 이상의 후근 신경절(drg)-miRNA 표적화 서열을 포함할 수 있다. 예를 들어, 전체가 본원에 편입되며 전부 "이식유전자 발현의 Drg-특이적 감소를 위한 조성물"이라는 제목의, 2019년 12월 20일자로 출원되어 현재 WO 2020/132455로 공개된 PCT/US2019/67872, 2020년 5월 12일자로 출원된 미국 가 특허 출원 번호 63/023593, 및 2020년 6월 12일자로 출원된 미국 가 특허 출원 번호 63/038488을 참고한다.
본원에 사용된 바와 같은 용어 "작동가능하게 연결된" 또는 "작동가능하게 연관된"은, 관심 유전자와 인접한 발현 통제 서열 또는 조절 요소와, 관심 유전자를 통제하기 위해 트랜스로(in trans) 또는 거리를 두고 작용하는 발현 통제 서열 둘 다를 지칭한다.
본원에 설명된 바와 같은 조절 요소는 프로모터; 인핸서; 전사 인자; 전사 종결자; 스플라이싱 및 폴리아데닐화 신호(polyA)와 같은 효율적인 RNA 처리 신호; 세포질 mRNA를 안정화시키는 서열, 예를 들어, 우드척 간염 바이러스(WHP) 전사후 조절 요소(WPRE); 번역 효율성을 향상시키는 서열(즉, Kozak 컨센서스 서열)을 포함하지만, 이것들로 제한되지 않는다.
한 실시양태에서, 발현 카세트는 UBE3A를 전달하기 위한 유전자 대체 시스템의 하나 이상의 요소를 암호화하는 서열의 발현을 지시하는 조절 요소를 포함한다. 한 실시양태에서, 조절 요소는 하나 이상의 프로모터를 포함한다. 특정 실시양태에서, 발현 카세트는 구성적 또는 조절가능한 프로모터를 포함한다. 특정 실시양태에서, 프로모터는 조직 특이적(예를 들어, 뉴런 특이적) 프로모터이다. 특정 실시양태에서, 적합한 프로모터는 제한없이 연장 인자 1 알파(EF1 알파) 프로모터(예를 들어, Kim DW et al, Use of the human elongation factor 1 alpha promoter as a versatile and efficient expression system. Gene. 1990 Jul 16;91(2):217-23 참고), 시냅신 1 프로모터(예를 들어, Kuegler S et al, Human synapsin 1 gene promoter confers high neuron-specific long-term transgene expression from an adenoviral vector in the adult rat brain depending on the transduced area. Gene Ther. 2003 Feb;10(4):337-47 참고), 본원의 실시예에 제공된 바와 같은 짧은 시냅신 프로모터(예를 들어, 코딩 서열에 대해서는 SEQ ID NO: 12 참고), 뉴런-특이적 에놀라제(NSE) 프로모터(예를 들어, Kim J et al, Involvement of cholesterol-rich lipid rafts in interleukin-6-induced neuroendocrine differentiation of LNCaP prostate cancer cells. Endocrinology. 2004 Feb;145(2):613-9. Epub 2003 Oct 16 참고), 또는 CB6 프로모터(예를 들어, Large-Scale Production of Adeno-Associated Viral Vector Serotype-9 Carrying the Human Survival Motor Neuron Gene, Mol Biotechnol. 2016 Jan;58(1):30-6. doi: 10.1007/s12033-015-9899-5 참고)를 포함한다. 다른 적합한 프로모터는 CAG 프로모터를 포함하며, 이는 (C) 사이토메갈로바이러스(CMV) 초기 인핸서 요소, (A) 프로모터, 닭 베타-액틴 유전자의 제1 엑손 및 제1 인트론, 및 (G) 토끼 베타 글로빈 유전자의 스플라이스 수락자(acceptor)를 포함한다. 예를 들어, Alexopoulou, Annika N., et al. BMC cell biology 9.1 (2008): 2를 참고한다. 덜 바람직하지만, 바이러스 프로모터, 구성적 프로모터, 유도성 프로모터, 조절가능한 프로모터(예를 들어, WO 2011/126808 및 WO 2013/04943 참고) 또는 생리학적 신호에 반응하는 프로모터와 같은 다른 프로모터가 본원에 설명된 벡터에 활용될 수 있다. 특정 실시양태에서, 발현 카세트는 U6 프로모터를 포함한다. 또 다른 실시양태에서, 조절 요소는 인핸서를 포함한다. 추가 실시양태에서, 인핸서(들)는 APB 인핸서, ABPS 인핸서, 알파 mic/bik 인핸서, TTR 인핸서, en34 인핸서, ApoE 인핸서, CMV 인핸서, 또는 RSV 인핸서 중 하나 이상으로부터 선택된다. 더욱 또 다른 실시양태에서, 조절 요소는 인트론을 포함한다. 추가 실시양태에서, 인트론은 CBA, 인간 베타 글로빈, IVS2, SV40, bGH, 알파-글로불린, 베타-글로불린, 콜라겐, 오브알부민 또는 p53으로부터 선택된다. 한 실시양태에서, 조절 요소는 polyA를 포함한다. 추가의 실시양태에서, polyA는 합성 polyA 또는 소 성장 호르몬(bGH), 인간 성장 호르몬(hGH), SV40, 예컨대 본원의 실시예에 제공된 것(예를 들어, 코딩 서열의 경우 SEQ ID NO: 13), 토끼 β-글로빈(RGB) 또는 변형된 RGB(mRGB)로부터의 것이다. 또 다른 실시양태에서, 조절 요소는 WPRE 서열을 포함할 수 있다. 더욱 또 다른 실시양태에서, 조절 요소는 Kozak 서열을 포함한다.
특정 실시양태에서, 발현 카세트는 SEQ ID NO: 22 또는 이것과 적어도 약 90% 동일한 서열의 핵산 서열을 포함하며, 이는 SEQ ID NO: 2의 아미노산 서열을 포함하는 UBE3A를 암호화한다. 특정 실시양태에서, 발현 카세트는 SEQ ID NO: 23 또는 이것과 적어도 약 90% 동일한 서열의 핵산 서열을 포함하며, 이는 SEQ ID NO: 4의 아미노산 서열을 포함하는 UBE3A를 암호화한다. 특정 실시양태에서, 발현 카세트는 SEQ ID NO: 24 또는 이것과 적어도 약 90% 동일한 서열의 핵산 서열을 포함하며, 이는 SEQ ID NO: 6의 아미노산 서열을 포함하는 UBE3A를 암호화한다. 특정 실시양태에서, 발현 카세트는 SEQ ID NO: 25 또는 이것과 적어도 약 90% 동일한 서열의 핵산 서열을 포함하며, 이는 SEQ ID NO: 8의 아미노산 서열을 포함하는 UBE3A를 암호화한다.
용어 "발현"은 본원에서 가장 넓은 의미로 사용되며, RNA의, 단백질의, 또는 RNA와 단백질 둘 다의 생산을 포함한다. RNA와 관련하여, 용어 "발현" 또는 "번역"은 특히 펩타이드 또는 단백질의 생산과 관련이 있다. 발현은 일시적일 수 있거나 안정적일 수 있다.
발현 카세트는 임의의 적절한 전달 시스템을 통해 전달될 수 있다. 적합한 비-바이러스 전달 시스템은 당업계에 공지되어 있고(예를 들어, 본원에 참고로 편입되는 Ramamoorth and Narvekar. J Clin Diagn Res. 2015 Jan;9(1):GE01-GE06 참고), 당업자에 의해 용이하게 선택될 수 있으며, 예를 들어, 네이키드 DNA, 네이키드 RNA, 덴드리머, PLGA, 폴리메타크릴레이트, 무기 입자, 지질 입자(예를 들어, 지질 나노입자 또는 LNP), 또는 키토산 기반 제형을 포함할 수 있다.
한 실시양태에서, 벡터는 이의 설명된 발현 카세트, 예를 들어, "네이키드 DNA", "네이키드 플라스미드 DNA", RNA 및 mRNA를 포함하며; 예를 들어, 미셀, 리포좀, 양이온성 지질-핵산 조성물, 폴리-글리칸 조성물 및 다른 중합체, 지질 및/또는 콜레스테롤 기반의 핵산 접합체, 및 본원에 설명된 바와 같은 다른 작제물을 포함한 다양한 조성물 및 나노 입자와 결합된, 비-바이러스 플라스미드이다. 예를 들어, 전부가 본원에 참고로 편입되는 X. Su et al, Mol. Pharmaceutics, 2011, 8(3), pp 774-787; 웹 간행물: 2011년 3월 21일; WO2013/182683, WO 2010/053572 및 WO 2012/170930을 참고한다.
유전자 대체 시스템의 하나 이상의 요소를 암호화하는 핵산 서열을 포함하는 조성물, 및 기능적 UBE3A를 대체하기 위한 이의 사용 방법이 본원에 제공된다.
선택적으로, 발현 카세트는 번역되지 않은 영역(들)에 miRNA 표적 서열을 포함할 수 있다. miRNA 표적 서열은, 이식유전자 발현이 바람직하지 않고/않거나 감소된 수준의 이식유전자 발현이 요구되는 세포에 존재하는 miRNA에 의해 특이적으로 인식되도록 설계된다. 특정 실시양태에서, miRNA 표적 서열은 3' UTR, 5' UTR, 및/또는 3' 및 5' UTR 둘 다에 위치한다. 일부 실시양태에서, miRNA 표적 서열은 발현 카세트 내 조절 서열에 작동가능하게 연결된다. 특정 실시양태에서, 발현 카세트는 DRG-특이적 miRNA 표적 서열의 적어도 2개의 탠덤 반복부(tandem repeat)를 포함하며, 여기서 상기 적어도 2개의 탠덤 반복부는 동일하거나 같을 수 있는 적어도 하나의 제1 miRNA 표적 서열 및 적어도 하나의 제2 miRNA 표적 서열을 포함한다. 특정 실시양태에서, 탠덤 miRNA 표적 서열은 연속적이거나, 1 내지 10개의 핵산으로 된 스페이서에 의해 분리되며, 여기서 상기 스페이서는 miRNA 표적 서열이 아니다.
특정 실시양태에서, 벡터 게놈 또는 발현 카세트는 miR-183(또는 miRNA183) 표적 서열인 적어도 하나의 miRNA 표적 서열을 함유한다. 특정 실시양태에서, 벡터 게놈 또는 발현 카세트는 AGTGAATTCTACAGTGCCATA(SEQ ID NO: 11)를 포함하는 miR-183 표적 서열을 함유하며, 여기서 miR-183 중심(seed) 서열에 상보적인 서열에는 밑줄이 그어져 있다. 특정 실시양태에서, 벡터 게놈 또는 발현 카세트는 miR-183 중심 서열에 100% 상보적인 서열의 하나 초과의 복제물(예를 들어, 2 또는 3개의 복제물)을 함유한다. 특정 실시양태에서, miR-183 표적 서열은 길이 약 7개의 뉴클레오타이드 내지 약 28개의 뉴클레오타이드이고, miR-183 중심 서열에 적어도 100% 상보적인 적어도 하나의 영역을 포함한다. 특정 실시양태에서, miR-183 표적 서열은 SEQ ID NO: 11에 대해 부분적 상보성을 갖는 서열을 함유하며, 따라서 SEQ ID NO: 11에 정렬될 때는 하나 이상의 불일치(mismatch)가 존재한다. 특정 실시양태에서, miR-183 표적 서열은 SEQ ID NO: 11에 정렬될 때 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 불일치를 갖는 서열을 포함하며, 여기서 상기 불일치는 비연속적일 수 있다. 특정 실시양태에서, miR-183 표적 서열은 miR-183 표적 서열 길이의 적어도 30%를 또한 포함하는 100% 상보성 영역을 포함한다. 특정 실시양태에서, 100% 상보성 영역은 miR-183 중심 서열에 대해 100% 상보성을 갖는 서열을 포함한다. 특정 실시양태에서, miR-183 표적 서열의 나머지는 miR-183에 대해 적어도 약 80% 내지 약 99% 상보성을 갖는다. 특정 실시양태에서, 발현 카세트 또는 벡터 게놈은 절단된 SEQ ID NO: 11을 포함하는 miR-183 표적 서열, 즉 SEQ ID NO: 11의 5' 또는 3' 말단 중 하나 또는 둘 다에 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 뉴클레오타이드가 결여된 서열을 포함한다. 특정 실시양태에서, 발현 카세트 또는 벡터 게놈은 이식유전자 및 하나의 miR-183 표적 서열을 포함한다. 더욱 다른 실시양태에서, 발현 카세트 또는 벡터 게놈은 적어도 2, 3 또는 4개의 miR-183 표적 서열을 포함한다.
특정 실시양태에서, 벡터 게놈 또는 발현 카세트는 miR-182 표적 서열인 적어도 하나의 miRNA 표적 서열을 함유한다. 특정 실시양태에서, 벡터 게놈 또는 발현 카세트는 AGTGTGAGTTCTACCATTGCCAAAA(SEQ ID NO: 20)를 포함하는 miR-182 표적 서열을 함유한다. 특정 실시양태에서, 벡터 게놈 또는 발현 카세트는 miR-182 중심 서열에 100% 상보적인 서열의 하나 초과의 복제물(예를 들어, 2 또는 3개의 복제물)을 함유한다. 특정 실시양태에서, miR-182 표적 서열은 길이 약 7개의 뉴클레오타이드 내지 약 28개의 뉴클레오타이드이고, miR-182 중심 서열에 적어도 100% 상보적인 적어도 하나의 영역을 포함한다. 특정 실시양태에서, miR-182 표적 서열은 SEQ ID NO: 20에 대해 부분적 상보성을 갖는 서열을 함유하며, 따라서 SEQ ID NO: 20에 정렬될 때 하나 이상의 불일치가 존재한다. 특정 실시양태에서, miR-183 표적 서열은 SEQ ID NO: 20에 정렬될 때 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 불일치를 갖는 서열을 포함하며, 여기서 상기 불일치는 비연속적일 수 있다. 특정 실시양태에서, miR-182 표적 서열은 miR-182 표적 서열 길이의 적어도 30%를 또한 포함하는 100% 상보성 영역을 포함한다. 특정 실시양태에서, 100% 상보성 영역은 miR-182 중심 서열에 대해 100% 상보성을 갖는 서열을 포함한다. 특정 실시양태에서, miR-182 표적 서열의 나머지는 miR-182에 대해 적어도 약 80% 내지 약 99% 상보성을 갖는다. 특정 실시양태에서, 발현 카세트 또는 벡터 게놈은 절단된 SEQ ID NO: 20을 포함하는 miR-182 표적 서열, 즉 SEQ ID NO: 20의 5' 또는 3' 말단 중 하나 또는 둘 다에 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 뉴클레오타이드가 결여된 서열을 포함한다. 특정 실시양태에서, 발현 카세트 또는 벡터 게놈은 이식유전자 및 하나의 miR-182 표적 서열을 포함한다. 더욱 다른 실시양태에서, 발현 카세트 또는 벡터 게놈은 적어도 2, 3 또는 4개의 miR-182 표적 서열을 포함한다.
용어 "탠덤 반복부"는, 2개 이상의 연속 miRNA 표적 서열의 존재를 지칭하기 위해 본원에서 사용된다. 이들 miRNA 표적 서열은 연속적일 수 있는데, 즉 하나의 3' 말단이 개입 서열 없이 다음 것의 5' 말단의 바로 상류에 있거나 그 반대가 되도록 서로 바로 뒤에 위치할 수 있다. 또 다른 실시양태에서, 2개 이상의 miRNA 표적 서열은 짧은 스페이서 서열에 의해 분리된다. 본원에 사용된 바와 같은 "스페이서"는, 2개 이상의 연속 miRNA 표적 서열 사이에 위치하는, 예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 뉴클레오타이드 길이로 된 임의의 선택된 핵산 서열이다. 특정 실시양태에서, 스페이서는 1 내지 8개의 뉴클레오타이드 길이, 2 내지 7개의 뉴클레오타이드 길이, 3 내지 6개의 뉴클레오타이드 길이, 4개의 뉴클레오타이드 길이, 4 내지 9개의 뉴클레오타이드, 3 내지 7개의 뉴클레오타이드, 또는 더 긴 값이다. 적절하게는, 스페이서는 코딩되지 않는 서열이다. 특정 실시양태에서, 스페이서는 4개의 뉴클레오타이드로 되어 있을 수 있다. 일부 실시양태에서, 스페이서는 GGAT이다. 특정 실시양태에서, 스페이서는 6개의 뉴클레오타이드이다. 특정 실시양태에서, 스페이서는 CACGTG 또는 GCATGC이다.
특정 실시양태에서, 탠덤 반복부는 2개, 3개, 4개 또는 그 초과의 동일한 miRNA 표적 서열을 함유한다. 특정 실시양태에서, 탠덤 반복부는 적어도 2개의 상이한 miRNA 표적 서열, 적어도 3개의 상이한 miRNA 표적 서열, 또는 적어도 4개의 상이한 miRNA 표적 서열 등을 함유한다. 특정 실시양태에서, 탠덤 반복부는 2개 또는 3개 초과의 동일한 miRNA 표적 서열 및 상이한 4개의 miRNA 표적 서열을 함유할 수 있다. 특정 실시양태에서, 발현 카세트에 적어도 2개의 상이한 세트의 탠덤 반복부가 있을 수 있다. 예를 들어, 3' UTR은 이식유전자의 바로 하류에 탠덤 반복부, UTR 서열, 및 UTR의 3' 말단에 더 가까운 2개 이상의 탠덤 반복부를 함유할 수 있다. 또 다른 예에서, 5' UTR은 하나, 둘 이상의 miRNA 표적 서열을 함유할 수 있다. 또 다른 예에서, 3'는 탠덤 반복부를 함유할 수 있고, 5' UTR은 적어도 하나의 miRNA 표적 서열을 함유할 수 있다. 특정 실시양태에서, 발현 카세트는 이식유전자에 대한 정지 코돈의 약 0 내지 20개의 뉴클레오타이드 내에서 시작하는 2개, 3개, 4개 또는 그 초과의 탠덤 반복부를 함유한다. 다른 실시양태에서, 발현 카세트는 이식유전자에 대한 정지 코돈으로부터 적어도 100 내지 약 4000개 뉴클레오타이드의 miRNA 탠덤 반복부를 함유한다.
본원에 참고로 편입되며 2018년 12월 21일자로 출원된 미국 가 특허 출원 번호 62/783,956에 대한 우선권을 주장하는, 2019년 12월 20일자로 출원되고 현재 WO 2020/132455로 공개된 PCT/US19/67872를 참고하며, 이는 본원에 참고로 편입된다. 또한, 전부 본원에 참고로 편입되는, 2020년 5월 12일자로 출원된 미국 특허 출원 번호 63/023,593, 2020년 6월 12일자로 출원된 미국 특허 출원 번호 63/038,488, 2020년 6월 24일자로 출원된 미국 특허 출원 번호 63/043,562, 2020년 9월 16일자로 출원된 특허 출원 번호 63/079,299, 및 2021년 2월 22일자로 출원된 미국 가 특허 출원 번호 63/152,042, 및 국제 특허 출원 번호 PCT/US21/32003을 또한 참고한다.
선택적으로, 발현 카세트는 본원에 설명된 바와 같은 신호 펩타이드 및/또는 흡수 펩타이드를 포함하는 융합 단백질인 UBE3A 단백질을 암호화하는 UBE3A 코딩 서열을 포함할 수 있다. 특정 실시양태에서, 신호 펩타이드 및/또는 흡수 펩타이드는 UBE3A 코딩 서열의 5' 또는 3'에 위치한다.
조작된 hUBE3A-이소형 1 코딩 서열을 포함하는 벡터 게놈은 예를 들어, SEQ ID NO: 1(hSyn.hUbe3a-1.GSco.4XmiRNA183.SV40(miR183 표적 서열이 있음)) 및 SEQ ID NO: 3(hSyn. hUbe3a-1.GSco.SV40, miR 없음))으로 본원에 제공된다.
조작된 hUBE3A-이소형 2 코딩 서열을 포함하는 벡터 게놈은 예를 들어, SEQ ID NO: 5(hSyn.hUbe3a-2.GSco.4XmiRNA183.SV40(miR183 표적 서열이 있음)) 및 SEQ ID NO: 7(hSyn .hUbe3a-2.GSco.SV40, miR 없음))로 본원에 예시된다.
본원에 설명된 발현 카세트로 된 조성물이 명세서 전체에 걸쳐 설명된 조성물 및 방법에 적용되는 것으로 의도됨이 이해되어야 한다.
벡터
특정 실시양태에서, UBE3A를 암호화하는 발현 카세트는 벡터 또는 바이러스 벡터에 의해 뉴런으로 전달되며, 이들 중 다수는 당업계에 알려져 있고 당업계에서 이용될 수 있다. 한 실시양태에서, 본원에 설명된 바와 같은 UBE3A 유전자를 포함하는 벡터가 제공된다. 한 실시양태에서, 본원에 설명된 바와 같은 발현 카세트를 포함하는 벡터가 제공된다. 한 실시양태에서, 상기 벡터는 비-바이러스 벡터이다. 추가 실시양태에서, 상기 비-바이러스 벡터는 플라스미드이다. 추가 실시양태에서, 상기 벡터는 바이러스 벡터이다. 바이러스 벡터는 보카바이러스, 아데노바이러스, 아데노-관련 바이러스(AAV), 헤르페스 바이러스, 렌티바이러스, 레트로바이러스 또는 파보바이러스를 포함하지만 이것들로 제한되지 않는, 유전자 요법에 적합한 임의의 바이러스를 포함한다. 그러나, 이해의 용이함을 위해, 상기 아데노-관련 바이러스가 본원에서 예시적인 바이러스 벡터로 언급된다. 따라서, 한 실시양태에서, 조절 요소에 작동가능하게 연결된 발현 카세트의 하나 이상의 요소를 포함하는 핵산 서열을 포함하는 아데노-관련 바이러스 벡터가 제공된다.
본원에 사용된 바와 같은 "벡터"는, 핵산 서열의 복제 또는 발현을 위해 적절한 표적 세포 내로 도입될 수 있는, 핵산 서열을 포함하는 생물학적 또는 화학적 모이어티이다. 벡터의 예는 재조합 바이러스, 플라스미드, 리포플렉스, 폴리머좀, 폴리플렉스, 덴드리머, 세포 침투 펩타이드(CPP) 접합체, 자성 입자 또는 나노입자를 포함하지만, 이것들로 제한되지 않는다. 한 실시양태에서, 벡터는 기능적 유전자 산물을 암호화하는 외인성 또는 이종의 조작된 핵산을 갖는 핵산 분자이며, 이는 이후 적절한 표적 세포로 도입될 수 있다. 이러한 벡터는 바람직하게는 하나 이상의 복제 기점, 및 재조합 DNA가 삽입될 수 있는 하나 이상의 부위를 갖는다. 벡터는 대개, 벡터가 있는 세포가, 예를 들어, 약물 내성 유전자를 암호화하는 벡터가 없는 세포로부터 선택될 수 있는 수단을 갖는다. 일반적인 벡터는 플라스미드, 바이러스 게놈 및 "인공 염색체"를 포함한다. 벡터의 생성, 생산, 특성결정 또는 정량화의 통상의 방법은 당업자가 이용할 수 있다.
본원에 사용된 바와 같은 재조합 바이러스 벡터는, 원하는 세포(들)를 표적으로 하는 임의의 적합한 바이러스 벡터이다. 따라서, 본원에 설명된 재조합 바이러스 벡터는 바람직하게는, 중추 신경계(예를 들어, 뇌)의 세포를 포함한, 엔젤만 증후군의 영향을 받는 하나 이상의 세포 및 조직을 표적으로 한다. 예는 예시적인 재조합 아데노-관련 바이러스(rAAV)를 제공한다. 그러나, 다른 적합한 바이러스 벡터는 예를 들어, 재조합 아데노바이러스, 재조합 보카바이러스와 같은 재조합 파보바이러스, 하이브리드 AAV/보카바이러스, 재조합 단순 헤르페스 바이러스, 재조합 레트로바이러스, 또는 재조합 렌티바이러스를 포함할 수 있다. 바람직한 실시양태에서, 이들 재조합 바이러스는 복제-결손(replication-defective)되어 있다.
"복제-결손" 바이러스 또는 바이러스 벡터는, 관심 유전자를 함유하는 발현 카세트가 바이러스 캡시드 또는 외피(envelope)에 패키징되어 있는 합성 또는 인공 바이러스 입자를 지칭하며, 여기서 바이러스 캡시드 또는 외피 내에 또한 패키징된 임의의 바이러스 게놈 서열은 복제-결손되어 있다; 즉, 이것들은 자손 비리온을 생성할 수 없지만, 표적 세포를 감염시키는 능력을 보유한다. 한 실시양태에서, 바이러스 벡터의 게놈은 복제에 필요한 효소를 암호화하는 유전자를 포함하지 않지만(상기 게놈은 "무감각(gutless)"하도록 조작될 수 있음 - 인공 게놈의 증폭 및 패키징에 필요한 신호가 측면에 있는 관심 유전자만을 함유함), 이들 유전자는 생산 동안 공급될 수 있다. 따라서, 복제에 필요한 바이러스 효소가 있는 경우를 제외하고, 자손 비리온에 의한 복제 및 감염이 일어날 수 없기 때문에, 이것은 유전자 요법에 사용하기에 안전한 것으로 간주된다. 이러한 복제-결손 바이러스는 아데노-관련 바이러스(AAV), 아데노바이러스, 렌티바이러스(통합 또는 비통합), 또는 또 다른 적절한 바이러스 원천일 수 있다.
"플라스미드" 또는 "플라스미드 벡터"는 일반적으로 본원에서 벡터 이름 앞 및/또는 뒤의 소문자 p로 표시된다. 본 발명에 따라 사용될 수 있는 플라스미드, 다른 클로닝 및 발현 벡터, 이의 특성, 및 이의 구성/조작 방법은 당업자에게 쉽게 명백하다. 한 실시양태에서, 본원에 설명된 바와 같은 벡터 게놈의 요소 또는 본원에 설명된 바와 같은 발현 카세트는 바이러스 벡터 생성에, 및/또는 숙주 세포, 예를 들어, 이 위에 운반된 서열을 전달하는 네이키드 DNA, 파지, 트랜스포존, 코스미드, 에피솜 등으로의 전달에 유용한, 적합한 유전적 요소(벡터)로 조작된다. 선택된 벡터는 형질감염, 전기천공, 리포좀 전달, 멤브레인 융합 기술, 고속 DNA-코팅된 펠릿, 바이러스 감염 및 원형질체 융합을 포함한 임의의 적합한 방법에 의해 전달될 수 있다. 이러한 작제물을 만드는 데 사용된 방법은 핵산 조작에서의 숙련자에게 알려져 있으며, 유전 공학, 재조합 공학, 및 합성 기술을 포함한다. 예를 들어, Sambrook et al, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press, Cold Spring Harbor, NY을 참고한다.
본원에서 상호교환적으로 사용된 용어 "이식유전자" 또는 "관심 유전자"는, 이 명세서에 설명된 발현 카세트, rAAV 게놈, 본 명세서에 기술된 재조합 플라스미드 또는 생산 플라스미드, 벡터 또는 숙주 세포 내 프로모터 및/또는 다른 조절 요소의 통제 하에 있는 외인성 및/또는 조작된 단백질 암호화 핵산 서열을 의미한다.
핵산 서열 또는 단백질을 설명하는 데 사용된 바와 같은 용어 "이종"은, 핵산 또는 단백질이, 이것이 발현되는 숙주 세포 또는 대상체와 상이한 유기체, 또는 동일한 유기체의 상이한 종으로부터 유래되었음을 의미한다. 플라스미드, 발현 카세트 또는 벡터 내 단백질 또는 핵산과 관련하여 사용될 때의 용어 "이종"은, 상기 단백질 또는 핵산이, 해당 단백질 또는 핵산과 함께 자연에서 서로 동일한 관계에서 발견되지 않는 또 다른 서열 또는 하위 서열과 함께 존재함을 나타낸다.
본원에 사용된 바와 같은 용어 "숙주 세포"는, 벡터(예를 들어, 재조합 AAV)가 생산 플라스미드로부터 생산되는, 패키징되는 세포 주를 지칭할 수 있다. 대안적으로, 용어 "숙주 세포"는 본원에 설명된 유전자 산물의 발현이 요구되는 임의의 표적 세포를 지칭할 수 있다. 따라서, "숙주 세포"는 임의의 수단, 예를 들어, 전기천공, 인산칼슘 침전, 미세주사, 형질전환, 바이러스 감염, 형질감염, 리포솜 전달, 멤브레인 융합 기술, 고속 DNA-코팅 펠릿, 바이러스 감염 및 원형질체 융합에 의해 세포 내로 도입된 외인성 또는 이종의 DNA를 함유하는 원핵 또는 진핵 세포(예를 들어, 인간 세포 또는 곤충 세포)를 지칭한다. 본원의 특정 실시양태에서, 용어 "숙주 세포"는 본원에 설명된 조성물의 시험관 내에서의 평가를 위한 다양한 포유동물 종의 세포 배양물을 지칭한다. 본원에서의 다른 실시양태에서, 용어 "숙주 세포"는 바이러스 벡터 또는 재조합 바이러스를 생성하고 패키징하는 데 사용된 세포를 지칭한다. 추가 실시양태에서, 용어 "숙주 세포"는 뉴런, 예를 들어, CNS의 뉴런이다.
본원에 사용된 바와 같은 용어 "표적 세포"는, 이종의 핵산 서열 또는 단백질의 발현이 요구되는 임의의 표적 세포를 지칭한다. 특정 실시양태에서, 표적 세포는 CNS의 뉴런, 특히 돌연변이되거나 결손된 모계 UBE3A 대립유전자를 갖는 뉴런 또는 UBE3A 발현이 결여된 뉴런이다.
본원에 사용된 바와 같은 "벡터 게놈"은, 바이러스 입자를 형성하는 파보바이러스(예를 들어, rAAV) 캡시드 내부에 패키징된 핵산 서열을 지칭한다. 이러한 핵산 서열은 AAV 역위 말단 반복 서열(ITR)을 함유한다. 본원에서의 예에서, 벡터 게놈은 최소한 5'에서 3'로 AAV 5' ITR, 코딩 서열(들), 및 AAV 3' ITR을 함유한다. 캡시드와 상이한 원천 AAV인 AAV2로부터의 또는 전장 ITR 이외의 ITR이 선택될 수 있다. 특정 실시양태에서, ITR은 생산 동안 rep 기능을 제공하는 AAV와 동일한 AAV 원천 또는 상호보완(transcomplementing) AAV로부터의 것이다. 또한, 다른 ITR, 예를 들어, 자가-상보적(scAAV) ITR이 사용될 수 있다. 또한, 벡터 게놈은 유전자 산물의 발현을 지시하는 조절 서열을 함유한다. 벡터 게놈의 적합한 구성요소는 본원에서 보다 상세히 논의된다. 한 예에서, "벡터 게놈"은 최소한 5'에서 3'로, 벡터-특이적 서열인, 표적 세포에서 이것들의 발현을 지시하는 조절 통제 서열에 작동 가능하게 연결된 UBE3A를 암호화하는 핵산 서열을 함유하며, 여기서 상기 벡터-특이적 서열은 벡터 게놈을 바이러스 벡터 캡시드 또는 외피 단백질로 특이적으로 패키징하는 말단 반복 서열일 수 있다. 예를 들어, AAV 역위 말단 반복부는 AAV 및 특정의 다른 파보바이러스 캡시드로 패키징하는 데 활용된다. 렌티바이러스 긴 말단 반복부는 렌티바이러스 벡터로의 패키징이 필요한 경우에 활용될 수 있다. 유사하게, 다른 역위 말단 반복부(예를 들어, 레트로바이러스 긴 말단 반복부) 등이 선택될 수 있다.
본원에 제공된 UBE3A 이소형 1을 암호화하는 벡터 게놈은, 예를 들어, SEQ ID NO: 1(AAV2-5' ITR - hSyn.hUbe3a-1.GSco.4XmiRNA183.SV40 - AAV2 - 3' ITR), SEQ ID NO: 3(AAV2- 5' ITR - hSyn.hUbe3a-1.GSco.SV40 - AAV2 - 3' ITR)을 포함한다.
본원에 사용된 바와 같은 용어 "AAV"는, 자연 발생 아데노-관련 바이러스, 당업자가 및/또는 본원에 설명된 조성물(들) 및 방법(들)의 견지에서 이용할 수 있는 아데노-관련 바이러스 뿐만 아니라 인공 AAV를 지칭한다. 아데노-관련 바이러스(AAV) 바이러스 벡터는 AAV 단백질 캡시드를 갖는 AAV 뉴클레아제(예를 들어, DNase) 저항성 입자로서, 표적 세포로의 전달을 위해 AAV 역위 말단 반복 서열(ITR)이 측면에 있는 발현 카세트가 그 안으로 패키징된다. 뉴클레아제 내성 재조합 AAV(rAAV)는, AAV 캡시드가 완전히 조립되었고, 생산 공정에서 존재할 수 있는 오염 핵산을 제거하도록 설계된 뉴클레아제 인큐베이션 단계 동안 이러한 패키징된 벡터 게놈 서열이 분해(소화)로부터 보호됨을 나타낸다. 많은 경우에, 본원에 설명된 rAAV는 DNase 내성이다.
아래의 예에서, 클레이드(clade) F 아데노-관련 바이러스는 AAVhu68이다. 전체가 본원에 참고로 편입되는 WO 2018/160582를 참고한다. 다른 실시양태에서, 또 다른 AAV 캡시드는 상이한 클레이드, 예를 들어, 클레이드 A, B, C, D 또는 E로부터, 또는 임의의 이들 클레이드 외부의 AAV 원천으로부터 선택된다. 예를 들어, 또 다른 적합한 캡시드는 AAVrh91이다. 본원에 참고로 편입되는, 2020년 11월 5일자로 공개된 WO 2020/223231, 2020년 8월 14일자로 출원된 미국 특허 출원 번호 63/065,616, 및 2020년 11월 4일자로 출원된 미국 특허 출원 번호 63/109,734, 국제 특허 출원 번호 PCT/US21/55436을 참고한다. 특정 실시양태에서, 캡시드 탈아미드화가 감소된 AAV 캡시드가 선택될 수 있다. 예를 들어, 둘 다 2019년 2월 27일자로 출원되고 전체가 참고로 편입된 PCT/US19/19804 및 PCT/US18/19861을 참고한다. 또한, 본원에 참고로 편입되는, 2020년 4월 29일자로 출원된 PCT/US20/030266, 현재 공개된 WO2020/223231, 및 2021년 8월 13일자로 출원된 국제 출원 번호 PCT/US21/45945를 참고한다.
다른 실시양태에서, AAV 캡시드의 원천은 임의의 수십 개의, 자연 발생의 그리고 이용 가능한 아데노-관련 바이러스 뿐만 아니라, 조작된 또는 인공 AAV 중 하나일 수 있다. AAV 캡시드는 선택된 AAV에 따라 약 1:1:10 내지 1:1:20의 비율로 20면체 대칭으로 배열되는 60개의 캡시드(cap) 단백질 소단위 VP1, VP2 및 VP3으로 구성된다. 다양한 AAV가 위에서 확인된 바와 같은 AAV 바이러스 벡터의 캡시드에 대한 원천으로서 선택될 수 있다. 예를 들어, 미국 공개 특허 출원 번호 2007-0036760-A1; 미국 공개 특허 출원 번호 2009-0197338-A1; EP 1310571을 참고한다. 또한, WO 2003/042397(AAV7 및 기타 유인원 AAV), 미국 특허 7790449 및 미국 특허 7282199(AAV8), WO 2005/033321 및 US 7,906,111(AAV9), 및 WO 2006/110689, 및 WO 2003/042397(AAVrh10)을 참고한다. 이들 문서는 또한 AAV를 생성하기 위해 선택될 수 있는 다른 AAV를 설명하며, 참고로 편입된다. 인간 또는 비인간 영장류(NHP)로부터 단리되거나 조작되고 잘 특성결정된 AAV 중에서, 인간 AAV2는 유전자 전달 벡터로 개발된 최초의 AAV이다; 상이한 표적 조직 및 동물 모델에서의 효율적인 유전자 전달 실험에 사용되었다. 달리 명시되지 않는 한, 본원에 설명된 AAV 캡시드, ITR, 및 다른 선택된 AAV 구성요소는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV8bp, AAV7M8 및 AAVAnc80으로 일반적으로 식별된 AAV를 제한없이 포함하는 임의의 AAV 중에서 쉽게 선택될 수 있다. 예를 들어, 본원에 참고로 편입되는 WO 2005/033321을 참고한다. 한 실시양태에서, AAV 캡시드는 AAV9 캡시드 또는 이의 변종이다. 특정 실시양태에서, 캡시드 단백질은 rAAV 벡터의 명칭에서 용어 "AAV" 다음에 오는 숫자, 또는 숫자와 문자의 조합으로 표시된다. 또한, 전체가 본원에 참고로 편입되는, 각각 "새로운 아데노-관련 바이러스(AAV) 벡터, 캡시드 탈아미드화가 감소된 AAV 벡터, 및 이의 용도"라는 제목으로 2019년 2월 27일자로 출원된 PCT/US19/19804 및 PCT/US19/19861을 참고한다.
ITR 또는 다른 AAV 구성요소는, AAV로부터 당업자가 이용할 수 있는 기술을 사용하여 쉽게 단리되거나 조작될 수 있다. 이러한 AAV는 학술적, 상업적 또는 공개적 원천(예를 들어, American Type Culture Collection, Manassas, Va)으로부터 단리, 조작 또는 얻을 수 있다. 대안적으로, AAV 서열은 문헌에서, 또는 예를 들어, GenBank, PubMed 등과 같은 데이터베이스에서 이용될 수 있는 것과 같은 공개된 서열을 참고하여 합성 또는 다른 적합한 수단을 통해 조작될 수 있다. AAV 바이러스는 통상의 분자 생물학 기술에 의해 조작되어, 핵산 서열의 세포 특이적 전달을 위해, 면역원성 최소화를 위해, 안정성 및 입자 수명 조정을 위해, 효율적인 분해를 위해, 핵으로의 정확한 전달 등을 위해 이들 입자를 최적화할 수 있다.
본원에 사용된 바와 같은 용어 "rAAV" 및 "재조합 AAV 벡터"는 상호교환적으로 사용되며, 제한없이, 캡시드 단백질 및 그 안에 패키징된 벡터 게놈을 포함하는 AAV를 의미하며, 여기서 상기 벡터 게놈은 AAV에 이종인 핵산을 포함한다. rAAV는 "유사형 rAAV"를 포함하며, 여기서 바이러스 벡터는 상이한 AAV 캡시드 단백질의 캡시드에 패키징된 하나의 AAV(예를 들어, AAV2)의 역위 말단 반복부를 함유하는 벡터 게놈을 함유한다. 한 실시양태에서, 캡시드 단백질은 비-자연 발생 캡시드이다. 이러한 인공 캡시드는, 선택된 AAV 서열(예를 들어, vp1 캡시드 단백질의 단편)을, 동일한 AAV의 비-연속인 부분인 상이한 선택된 AAV로부터, 비-AAV 바이러스 원천으로부터, 또는 비-바이러스 원천으로부터 얻을 수 있는 이종 서열과 함께 사용하여, 임의의 적합한 기술에 의해 생성될 수 있다. 선택된 유전적 요소는 형질감염, 전기천공, 리포좀 전달, 멤브레인 융합 기술, 고속 DNA-코팅된 펠릿, 바이러스 감염 및 원형질체 융합을 포함한 임의의 적합한 방법에 의해 전달될 수 있다. 이러한 작제물을 만드는 데 사용된 방법은 핵산 조작에서의 숙련자에게 알려져 있으며, 유전 공학, 재조합 공학, 및 합성 기술을 포함한다. 예를 들어, Green and Sambrook, Molecular: A Laboratory Manual. Cold Spring Harbor Press, Cold Spring Harbor NY(2012)을 참고한다.
vp 캡시드 단백질을 지칭하는 데 사용될 때 본원에 사용된 바와 같은 용어 "이종" 또는 이의 임의의 문법적 변형은, 동일하지 않은 요소로 구성되는, 예를 들어, 상이한 변형된 아미노산 서열과 함께 vp1, vp2 또는 vp3 단량체(단백질)를 갖는 집단을 지칭한다. SEQ ID NO: 15는 AAVhu68 vp1 단백질의 암호화된 아미노산 서열을 제공한다. vp1, vp2 및 vp3 단백질(대안적으로 이소형으로 지칭됨)과 관련하여 사용된 바와 같은 용어 "이종"은, 캡시드 내의 vp1, vp2 및 vp3 단백질의 아미노산 서열에서의 차이를 지칭한다. AAV 캡시드는 예측된 아미노산 잔기로부터 변형되는, vp1 단백질 내의, vp2 단백질 내의, 그리고 vp3 단백질 내의 하위 집단을 함유한다. 이들 하위 집단은 최소한 특정 탈아미노화된 아스파라긴(N 또는 Asn) 잔기를 포함한다. 예를 들어, 특정 하위 집단은 아스파라긴-글리신 쌍에서 적어도 1, 2, 3 또는 4개의 고도로 탈아미드화된 아스파라긴(N) 위치를 포함하고, 다른 탈아미드화된 아미노산을 선택적으로 추가로 포함하며, 여기서 상기 탈아미드화는 아미노산 변화 및 다른 선택적인 변형을 초래한다.
본원에 사용된 바와 같은 vp 단백질의 "하위 집단"은, 달리 명시되지 않는 한, 적어도 하나의 공통의 규정된 특징을 가지며 기준 그룹의 적어도 하나의 그룹 구성원 내지 모든 구성원 미만으로 구성되는 vp 단백질의 그룹을 지칭한다. 예를 들어, vp1 단백질의 "하위 집단"은, 달리 명시되지 않는 한, 조립된 AAV 캡시드의 적어도 하나(1)의 vp1 단백질 내지 모든 vp1 단백질 미만이다. 달리 명시되지 않는 한, vp3 단백질의 "하위 집단"은 조립된 AAV 캡시드의 하나(1)의 vp3 단백질 내지 모든 vp3 단백질 미만일 수 있다. 예를 들어, 조립된 AAV 캡시드에서 vp1 단백질이 vp 단백질의 하위 집단일 수 있고; vp2 단백질이 vp 단백질의 별도의 하위 집단일 수 있으며, vp3이 vp 단백질의 추가 하위 집단이다. 또 다른 예에서, vp1, vp2 및 vp3 단백질은 상이한 변형, 예를 들어, 아스파라긴-글리신 쌍에, 예를 들어, 적어도 1, 2, 3 또는 4개의 고도로 탈아미노화된 아스파라긴을 갖는 하위 집단을 함유할 수 있다.
한 측면에서, AAV 캡시드 및 발현 카세트를 포함하는 AAV 벡터로서, 여기서 상기 발현 카세트가 UBE3A 유전자의 하나 이상의 요소를 암호화하는 핵산 서열, 및 숙주 세포에서 UBE3A 유전자 요소의 발현을 지시하는 조절 요소를 포함하는 AAV 벡터가 본원에 제공된다. 상기 AAV 벡터는 또한 AAV ITR 서열을 포함한다.
ITR은 벡터 생산 동안 게놈의 복제 및 패키징을 담당하는 유전적 요소이며, rAAV를 생성하는 데 필요한 유일한 바이러스 시스(cis) 요소이다. 한 실시양태에서, ITR은 캡시드를 공급하는 것과 상이한 AAV로부터 유래한다. 바람직한 실시양태에서, AAV2로부터의 ITR 서열, 또는 이의 결실된 버전(ΔITR)이 편의를 위해 그리고 규제 승인을 가속화하기 위해 사용될 수 있다. 그러나, 다른 AAV 원천으로부터의 ITR이 선택될 수 있다. ITR의 원천이 AAV2로부터의 것이고 AAV 캡시드가 또 다른 AAV 원천로부터의 것인 경우, 생성된 벡터는 유사형으로 불려질 수 있다. 전형적으로, AAV 벡터 게놈은 AAV 5' ITR, 유전자 산물(들)을 암호화하는 핵산 서열 및 임의의 조절 서열, 및 AAV 3' ITR을 포함한다. 그러나, 이들 요소의 다른 구성이 적합할 수 있다. 한 실시양태에서, 자가-상보적 AAV가 제공된다. ΔITR로 불리는 5' ITR의 단축 버전은, D-서열 및 말단 분해 부위(trs)가 결실되는 것으로 설명되었다. 특정 실시양태에서, 벡터 게놈은 130개 염기 쌍의 단축 AAV2 ITR을 포함하며, 여기서 외부의 어느("a") 요소가 결실된다. 단축 ITR은 내부의 어느 요소를 주형으로 사용하는 벡터 DNA 증폭 동안 145개 염기쌍의 야생형 길이로 되돌아간다. 다른 실시양태에서, 전장 AAV 5' 및 3' ITR이 사용된다.
한 실시양태에서, 전체 rAAV 벡터 게놈의 크기가 약 2.0 내지 약 5.5 킬로베이스가 되도록 조절 서열이 선택된다. 한 실시양태에서, 전체 rAAV 벡터 게놈의 크기가 약 2.9 내지 약 5.5 킬로베이스가 되도록 조절 서열이 선택된다. 한 실시양태에서, 전체 rAAV 벡터 게놈의 크기가 약 2.9 kb가 되도록 조절 서열이 선택된다. 한 실시양태에서, rAAV 벡터 게놈은 천연 AAV 게놈의 크기에 근접하는 것이 바람직하다. 따라서, 한 실시양태에서, 전체 rAAV 벡터 게놈의 크기가 약 4.7 kb가 되도록 조절 서열이 선택된다. 또 다른 실시양태에서, 전체 rAAV 벡터 게놈은 크기가 약 5.2 kb 미만이다. 벡터 게놈의 크기는 프로모터, 인핸서, 인트론, 폴리 A 등을 포함한 조절 서열의 크기에 기반하여 조작될 수 있다. 본원에 참고로 편입되는 Wu et al., Mol Ther, Jan 2010, 18(1):80-6을 참고한다.
특정 실시양태에서, 엔젤만 증후군(AS)을 갖는 대상체의 치료를 위한 CNS-지시 요법으로 유용한 rAAV로서, 여기서 상기 rAAV가 AAV 캡시드, 및 그 안에 패키징된 벡터 게놈을 포함하며, 상기 벡터 게놈이 (a) AAV 5' 역위 말단 반복부(ITR); (b) 숙주 세포에서 UBE3A의 발현을 지시하는 조절 요소에 작동 가능하게 연결되는 UBE3A를 암호화하는 서열; (c) 발현을 지시하는 조절 요소; 및 (d) AAV 3' ITR을 포함하는 rAAV가 본원에 제공된다. 특정 실시양태에서, 엔젤만 증후군(AS)을 갖는 대상체의 치료를 위한 CNS-지시 요법으로 유용한 rAAV로서, 여기서 상기 rAAV가 AAV 캡시드, 및 그 안에 패키징된 벡터 게놈을 포함하며, 상기 벡터 게놈이 (a) AAV 5' 역위 말단 반복부(ITR); (b) 숙주 세포에서 UBE3A의 발현을 지시하는 조절 요소에 작동 가능하게 연결되는 UBE3A를 암호화하는 서열; (c) 선택적으로 펩타이드(들)(예를 들어, 신호 펩타이드 및/또는 흡수 펩타이드); (d) 발현을 지시하는 조절 요소; 및 (e) AAV 3' ITR을 포함하는 rAAV가 본원에 제공된다. 한 실시양태에서, rAAV는 CNS의 세포에 대한 향성(tropism)을 갖고/갖거나(예를 들어, rAAV는 AAVhu68 캡시드 또는 AAVrh91 캡시드를 포함함), 뉴런 특이적 발현 통제 요소(예를 들어, 시냅신 프로모터)를 함유한다. 한 측면에서, 바이러스 벡터 생성에 유용한 벡터(예를 들어, 플라스미드)인 작제물이 제공된다. 한 실시양태에서, AAV 5' ITR은 AAV2 ITR이고, AAV 3'ITR은 AAV2 ITR이다. 한 실시양태에서, rAAV는 본원에 설명된 바와 같은 AAV 캡시드를 포함한다. 한 실시양태에서, rAAV는 AAVhu68 캡시드를 포함한다. 다른 실시양태에서, rAAV는 AAVrh91 캡시드를 포함한다. SEQ ID NO: 18은 AAVrh91 vp1 단백질의 암호화된 아미노산 서열을 제공한다.
본원에 설명된 재조합 아데노-관련 바이러스(AAV)는 알려져 있는 기술을 사용하여 생성될 수 있다. 예를 들어, WO 2003/042397; WO 2005/033321, WO 2006/110689; US 7588772 B2를 참고한다. 이러한 방법은, AAV 캡시드를 암호화하는 핵산 서열; 기능적 rep 유전자; AAV 역위 말단 반복부(ITR)의 측면에 있는, 본원에 설명된 바와 같은 발현 카세트; 및 발현 카세트를 AAV 캡시드 단백질로 패키징하기에 충분한 헬퍼 기능을 함유하는 숙주 세포를 배양하는 것을 수반한다. 또한 AAV 캡시드를 암호화하는 핵산 서열; 기능적 rep 유전자; 설명된 바와 같은 벡터 게놈; 및 벡터 게놈을 AAV 캡시드 단백질로 패키징하기에 충분한 헬퍼 기능을 함유하는 숙주 세포가 본원에 제공된다. 한 실시양태에서, 상기 숙주 세포는 HEK 293 세포이다. 이들 방법은 본원에 참고로 편입되는 WO2017160360 A2에 보다 상세히 설명되어 있다.
당업자가 이용할 수 있는 다른 rAAV 생산 방법이 활용될 수 있다. 적합한 방법은 제한없이 바큘로바이러스 발현 시스템 또는 효모를 통한 생산을 포함할 수 있다. 예를 들어, Robert M. Kotin, Large-scale recombinant adeno-associated virus production. Hum Mol Genet. 2011 Apr 15; 20(R1): R2-R6. Published online 2011 Apr 29. doi: 10.1093/hmg/ddr141; Aucoin MG et al., Production of adeno-associated viral vectors in insect cells using triple infection: optimization of baculovirus concentration ratios. Biotechnol Bioeng. 2006 Dec 20;95(6):1081-92; SAMI S. THAKUR, Production of Recombinant Adeno-associated viral vectors in yeast. Thesis presented to the Graduate School of the University of Florida, 2012; Kondratov O et al. Direct Head-to-Head Evaluation of Recombinant Adeno-associated Viral Vectors Manufactured in Human versus Insect Cells, Mol Ther. 2017 Aug 10. pii: S1525-0016(17)30362-3. doi: 10.1016/j.ymthe.2017.08.003. [Epub ahead of print]; Mietzsch M et al, OneBac 2.0: Sf9 Cell Lines for Production of AAV1, AAV2, and AAV8 Vectors with Minimal Encapsidation of Foreign DNA. Hum Gene Ther Methods. 2017 Feb;28(1):15-22. doi: 10.1089/hgtb.2016.164.; Li L et al. Production and characterization of novel recombinant adeno-associated virus replicative-form genomes: a eukaryotic source of DNA for gene transfer. PLoS One. 2013 Aug 1;8(8):e69879. doi: 10.1371/journal.pone.0069879. Print 2013; Galibert L et al, Latest developments in the large-scale production of adeno-associated virus vectors in insect cells toward the treatment of neuromuscular diseases. J Invertebr Pathol. 2011 Jul;107 Suppl:S80-93. doi: 10.1016/j.jip.2011.05.008; and Kotin RM, Large-scale recombinant adeno-associated virus production. Hum Mol Genet. 2011 Apr 15;20(R1):R2-6. doi: 10.1093/hmg/ddr141. Epub 2011 Apr 29를 참고한다.
높은 염 농도에서의 2단계 친화성 크로마토그래피 정제에 이어 음이온 교환 수지 크로마토그래피를 사용하여 벡터 약물 제품을 정제하고 빈 캡시드를 제거한다. 이들 방법은, 본원에 참고로 편입되는, "AAV9에 대한 확장 가능한 정제 방법"이라는 제목의 WO 2017/160360, 및 "AAV1에 대한 확장 가능한 정제 방법"이라는 제목의 WO 2017/100674에 더 자세히 설명되어 있다. 요약하면, 게놈-결손 AAV 중간체로부터 패키징된 게놈 서열을 갖는 rAAV 입자를 분리하는 방법은, 재조합 AAV9 또는 AAV 바이러스 입자 및 AAV 캡시드 중간체를 포함하는 현탁액에 빠른 성능의 액체 크로마토그래피를 실시하는 것을 수반하며, 여기서 상기 AAV9 바이러스 입자 및 AAV 중간체는 rAAV9에 대해서는 약 10.2의 pH에서 또는 AAV1에 대해서는 약 9.8의 pH에서 평형화된 강한 음이온 교환 수지에 결합되고, 약 260 및 약 280에서의 자외선 흡광도에 대해 용리액을 모니터링하면서 상기 AAV9 바이러스 입자 및 AAV 중간체에 염 구배(salt gradient)를 실시한다. 이 방법에서, AAV 전체 캡시드는 A260/A280의 비율이 변곡점에 도달할 때 용리되는 분획에서 수집된다. 한 예에서, 친화성 크로마토그래피 단계를 위해, 정용여과된 생성물이, 선택된 AAV 혈청형을 효율적으로 포획하는 AAV-특이적 수지에 적용될 수 있다. 이러한 이온 조건 하에서, AAV 입자가 효율적으로 포획되면서 상당한 백분율의 잔류 세포 DNA 및 단백질이 컬럼을 통해 흐른다.
rAAV의 특성결정 또는 정량화를 위한 통상의 방법은 당업자가 이용할 수 있다. 빈 입자 함량 및 채워진 입자 함량을 계산하려면, 선택된 샘플에 대한 VP3 밴드 부피(예를 들어, 본원의 예에서 아이오딕사놀 구배-정제된 제제, 여기서 GC의 # = 입자의 #)가 로딩된 GC 입자에 대해 도식화된다. 생성된 선형 방정식(y = mx+c)을 사용하여 시험 항목 피크의 밴드 부피 내 입자 수를 계산한다. 이 후, 로딩된 20 μL당 입자 수(pt)에 50을 곱하여 입자(pt)/mL를 얻는다. Pt/mL를 GC/mL로 나누면 입자 대 게놈 복제물의 비율(pt/GC)이 얻어진다. Pt/mL에서 GC/mL를 차감하면 빈 pt/mL가 얻어진다. 빈 pt/mL을 pt/mL로 나누고 여기에 100을 곱하면 빈 입자의 백분율이 얻어진다. 일반적으로, 빈 캡시드, 및 게놈이 패키징된 AAV 벡터 입자에 대한 검정 방법은 당업계에 알려져 있다. 예를 들어, Grimm et al., Gene Therapy (1999) 6:1322-1330; Sommer et al., Molec. Ther. (2003) 7:122-128을 참고한다. 변성된 캡시드를 시험하기 위해, 상기 방법은 처리된 AAV 스톡에, 3개의 캡시드 단백질을 분리할 수 있는 임의의 겔, 예를 들어, 완충제에 3-8% 트리스-아세테이트를 함유하는 구배 겔로 구성되는 SDS-폴리아크릴아미드 겔 전기영동을 실시한 다음, 샘플 물질이 분리될 때까지 상기 겔을 흐르게 하고, 상기 겔을 나일론 또는 니트로셀룰로스 멤브레인, 바람직하게는 나일론 멤브레인 위로 블로팅하는 것을 포함한다. 이 후, 항-AAV 캡시드 항체는 변성 캡시드 단백질, 바람직하게는 항-AAV 캡시드 단클론 항체, 가장 바람직하게는 B1 항-AAV-2 단클론 항체에 결합하는 1차 항체로 사용된다(Wobus et al., J. Viral. (2000) 74:9281-9293). 이 후, 1차 항체에 결합하며 1차 항체와의 결합을 검출하기 위한 수단을 포함하는 2차 항체, 더 바람직하게는 이것에 공유 결합된 검출 분자를 함유하는 항-IgG 항체, 가장 바람직하게는 고추냉이 과산화효소에 공유 결합된 양 항-생쥐 IgG 항체가 사용된다. 1차 항체와 2차 항체 사이의 결합을 반정량적으로 측정하기 위해 결합 검출 방법, 바람직하게는 방사성 동위원소 방출, 전자기 방사선 또는 비색 변화를 검출할 수 있는 검출 방법, 가장 바람직하게는 화학발광 검출 키트가 사용된다. 예를 들어, SDS-PAGE의 경우, 컬럼 분획으로부터 샘플을 채취하고, 환원제(예를 들어, DTT)를 함유하는 SDS-PAGE 로딩 완충제에서 가열할 수 있으며, 캡시드 단백질을 미리 주조한(pre-cast) 구배의 폴리아크릴아미드 겔(예를 들어, Novex)에서 분해시켰다. 은 염색은 제조업체의 지침에 따라 SilverXpress(Invitrogen, CA) 또는 다른 적합한 염색 방법, 즉 SYPRO ruby 또는 Coomassie 염색을 사용하여 수행될 수 있다. 한 실시양태에서, 컬럼 분획 내 AAV 벡터 게놈(vg)의 농도는 정량적 실시간 PCR(Q-PCR)에 의해 측정될 수 있다. 샘플을 희석하고 DNase I(또는 또 다른 적합한 뉴클레아제)를 사용하여 분해하여 외인성 DNA를 제거한다. 뉴클레아제를 불활성화한 후, 샘플을 추가로 희석하고, 프라이머 사이의 DNA 서열에 특이적인 TaqMan™ 형광 프로브 및 프라이머를 사용하여 증폭시킨다. 규정된 형광 수준(임계값 주기, Ct)에 도달하는 데 필요한 주기 수는 Applied Biosystems Prism 7700 Sequence Detection System에서 각 샘플에 대해 측정된다. AAV 벡터에 함유된 것과 동일한 서열을 함유하는 플라스미드 DNA가 Q-PCR 반응에서 표준 곡선을 생성하는 데 사용된다. 샘플에서 얻은 주기 임계(Ct) 값은, 플라스미드 표준 곡선의 Ct 값으로 표준화하여 벡터 게놈 역가를 결정하는 데 사용된다. 디지털 PCR에 기반한 종점 분석이 또한 사용될 수 있다.
한 측면에서, 광범위 세린 프로테아제, 예를 들어, 프로테아제 K(예컨대 Qiagen에서 시판됨)를 활용하는 최적화된 q-PCR 방법이 사용된다. 더 구체적으로, 최적화된 qPCR 게놈 역가 분석은, DNase I 소화 후 샘플을 프로테아제 K 완충제로 희석하고 프로테아제 K로 처리한 다음 열 불활성화한다는 점을 제외하면, 표준 분석과 유사하다. 적합하게는, 샘플은 샘플 크기와 동일한 양의 프로테아제 K 완충제로 희석된다. 프로테아제 K 완충제는 2배 이상으로 농축될 수 있다. 전형적으로, 프로테아제 K 처리는 약 0.2 mg/mL이지만, 0.1 mg/mL에서 약 1 mg/mL까지 다양할 수 있다. 상기 처리 단계는 일반적으로 약 55℃에서 약 15분 동안 수행되지만, 더 낮은 온도(예를 들어, 약 37℃ 내지 약 50℃)에서 더 긴 시간(예를 들어, 약 20분 내지 약 30분) 동안, 또는 더 높은 온도(예를 들어, 최대 약 60℃)에서 더 짧은 시간(예를 들어, 약 5 내지 10분) 동안 수행될 수 있다. 유사하게, 열 불활성화는 일반적으로 약 95℃에서 약 15분 동안 행해지지만, 온도가 낮아지고(예를 들어, 약 70 내지 약 90℃) 시간이 연장될 수 있다(예를 들어, 약 20분 내지 약 30분). 이 후, 샘플을 희석하고(예를 들어, 1000배), 여기에 표준 분석에 설명된 바와 같은 TaqMan 분석을 실시한다.
추가로 또는 대안적으로, 액적 디지털 PCR(ddPCR)이 사용될 수 있다. 예를 들어, ddPCR에 의해 단일 가닥 및 자체 상보적 AAV 벡터 게놈 역가를 결정하는 방법이 설명되었다. 예를 들어, M. Lock et al, Hu Gene Therapy Methods, Hum Gene Ther Methods. 2014 Apr;25(2):115-25. doi: 10.1089/hgtb.2013.131. Epub 2014 Feb 14를 참고한다.
캡시드 단백질의 vp1, vp2 및 vp3 간의 비율을 결정하는 방법이 또한 이용될 수 있다. 예를 들어, Vamseedhar Rayaprolu et al., Comparative Analysis of Adeno-Associated Virus Capsid Stability and Dynamics, J Virol. 2013 Dec; 87(24): 13150-13160; Buller RM, Rose JA. 1978. Characterization of adenovirus-associated virus-induced polypeptides in KB cells. J. Virol. 25:331-338; and Rose JA, Maizel JV, Inman JK, Shatkin AJ. 1971. Structural proteins of adenovirus-associated viruses. J. Virol. 8:766-770을 참고한다.
본원에 설명된 벡터로 된 조성물은 명세서 전반에 걸쳐 설명된 다른 조성물 및 방법에 적용되도록 의도된 것임이 이해되어야 한다.
조성물
필요로 하는 대상체에서 AS를 치료하기 위해 투여하는 데 적합한 수성 현탁액으로서, 상기 현탁액이 수성 현탁 액체, 및 본원에 설명된 바와 같은, 이에 대한 조절 요소에 작동가능하게 연결된 UBE3A 유전자를 암호화하는 조작된 핵산 서열을 포함하는 벡터를 포함하는 수성 현탁액이 제공된다. 한 실시양태에서, 치료적 유효량의 상기 벡터가 현탁액에 포함된다.
핵산
특정 실시양태에서, 약제 조성물은 UBE3A 이소형 1을 암호화하는 핵산 서열및 비-바이러스 전달 시스템을 포함하는 발현 카세트를 포함한다. 이것은, 예를 들어, 네이키드 DNA, 네이키드 RNA, 무기 입자, 지질 또는 지질 유사 입자, 키토산 기반 제형, 및 당업계에 공지되고 예를 들어, 위에서 인용된 바와 같은 Ramamoorth 및 Narvekar에 의해 설명된 다른 것들을 포함할 수 있다. 다른 실시양태에서, 약제 조성물은 바이러스 벡터 시스템에 UBE3A 유전자를 포함하는 발현 카세트를 포함하는 현탁액이다. 특정 실시양태에서, 약제 조성물은 비-복제 바이러스 벡터를 포함한다. 적합한 바이러스 벡터는 예를 들어, 재조합 아데노바이러스, 재조합 렌티바이러스, 재조합 보카바이러스, 재조합 아데노-관련 바이러스(AAV), 또는 또 다른 재조합 파보바이러스와 같은 임의의 적합한 전달 벡터를 포함할 수 있다. 특정 실시양태에서, 바이러스 벡터는 이를 필요로 하는 환자에게 UBE3A 이소형 1을 전달하기 위한 재조합 AAV이다. 특정 실시양태에서, 바이러스 벡터는 이를 필요로 하는 환자에게 UBE3a 이소형 3을 전달하기 위한 재조합 AAV이다.
한 실시양태에서, 조성물은 대상체에게 전달하기에 적합한 최종 제형을 포함하며, 이것은 예를 들어, 생리학적으로 적합한 pH 및 염 농도로 완충된 수성 액체 현탁액이다. 선택적으로, 하나 이상의 계면활성제가 제형에 존재한다. 또 다른 실시양태에서, 조성물은 대상체에게 투여하기 위해 희석되는 농축물로 수송될 수 있다. 다른 실시양태에서, 조성물은 동결건조되고 투여 시점에 재구성될 수 있다.
한 실시양태에서, 상기 현탁액은 수성 현탁 액체에 용해된 계면활성제, 보존제, 부형제, 및/또는 완충제를 추가로 포함한다. 한 실시양태에서, 완충제는 PBS이다. 하기 중 하나 이상을 포함하는 것들을 포함하는 다양한 적합한 용액이 알려져 있다: 완충 식염수, 계면활성제, 및 약 100 mM 염화나트륨(NaCl) 내지 약 250 mM 염화나트륨과 동등한 이온 강도로 조정된 생리학적으로 적합한 염 또는 염의 혼합물, 또는 동등한 이온 농도로 조정된 생리학적으로 적합한 염. 적합한 계면활성제, 또는 계면활성제의 조합은 폴록사머, 즉, 폴리옥시에틸렌(폴리(에틸렌 옥사이드)), SOLUTOL HS 15(매크로골-15 하이드록시스테아레이트), LABRASOL(폴리옥시 카프릴릭 글리세라이드), 폴리옥시 10 올레일 에테르, TWEEN(폴리옥시에틸렌 소르비탄 지방산 에스테르), 에탄올 및 폴리에틸렌 글리콜의 2개의 친수성 사슬의 측면에 있는 폴리옥시프로필렌(폴리(프로필렌 옥사이드))의 중심 소수성 사슬로 구성된 비이온성 삼블록 공중합체로부터 선택될 수 있다. 한 실시양태에서, 상기 제형은 폴록사머를 함유한다. pH는 6.5 내지 8.5, 또는 7 내지 8.5, 또는 7.5 내지 8의 범위일 수 있다. 뇌척수액의 pH가 약 7.28 내지 약 7.32이므로, 경막내 전달을 위해서는 이 범위 내의 pH가 요망될 수 있는 반면; 정맥내 전달을 위해서는 6.8 내지 약 7.2의 pH가 요망될 수 있다. 그러나, 가장 넓은 범위 및 이들 하위 범위 내의 다른 pH가 다른 전달 경로를 위해 선택될 수 있다.
추가로, 약제학적으로 허용되는 담체, 및 본원에 설명된 바와 같은, 이에 대한 조절 요소에 작동가능하게 연결된 UBE3A의 하나 이상의 구성요소를 암호화하는 핵산 서열을 포함하는 벡터를 포함하는 약제 조성물이 제공된다. 본원에 사용된 바와 같은 "담체"는, 임의의 그리고 모든 용매, 분산 매체, 비히클, 코팅, 희석제, 항균제 및 항진균제, 등장성 및 흡수 지연제, 완충제, 담체 용액, 현탁액, 콜로이드 등을 포함한다. 약제 활성 물질에 대한 이러한 매체 및 제제(agent)의 사용은 당업계에 잘 알려져 있다. 보충 활성 성분이 또한 조성물에 혼입될 수 있다. 어구 "약제학적으로 허용되는"은, 숙주에 투여될 때 알레르기 반응 또는 이와 유사한 원치 않는 반응을 나타내지 않는 분자 실체 및 조성물을 지칭한다. 리포좀, 나노캡슐, 미세입자, 마이크로스피어(microsphere), 지질 입자, 소포 등과 같은 전달 비히클이 본 발명의 조성물을 적합한 숙주 세포로 도입하기 위해 사용될 수 있다. 특히, rAAV 벡터 전달된 UBE3A 이식유전자는 지질 입자, 리포좀, 소포, 나노스피어(nanosphere), 또는 나노입자 등으로 캡슐화된 전달을 위해 제형화될 수 있다. 한 실시양태에서, 치료적 유효량의 상기 벡터가 약제 조성물에 포함된다. 적합한 담체는 벡터가 향하는 표시(indication)를 고려하여 당업자에 의해 용이하게 선택될 수 있다. 예를 들어, 하나의 적합한 담체는, 다양한 완충 용액과 함께 제형화될 수 있는 식염수(예를 들어, 인산염 완충 식염수)를 포함한다. 다른 예시적인 담체는 멸균 염수, 락토스, 수크로스, 인산칼슘, 젤라틴, 덱스트란, 한천, 펙틴, 땅콩유, 참기름 및 물을 포함한다. 담체의 선택은 본 발명의 제한이 아니다. 다른 통상의 약제학적으로 허용되는 담체는, 예컨대 보존제 또는 화학적 안정제이다. 적합한 예시적인 보존제는 클로로부탄올, 소르브산칼륨, 소르브산, 이산화황, 프로필 갈레이트, 파라벤, 에틸 바닐린, 글리세린, 페놀, 및 파라클로로페놀을 포함한다. 적합한 화학적 안정제는 젤라틴 및 알부민을 포함한다.
어구 "약제학적으로 허용되는"은, 숙주에게 투여될 때 알레르기 반응 또는 유사한 원치 않는 반응을 나타내지 않는 분자 실체 및 조성물을 지칭할 수 있다.
본원에 사용된 바와 같은 용어 "투여량" 또는 "양"은, 치료 과정에서 대상체에게 전달된 총 투여량 또는 양, 또는 단일 단위(또는 다중 단위 또는 분할 투여량) 투여로 전달된 투여량 또는 양을 지칭할 수 있다.
본원에 설명된 수성 현탁액 또는 약제 조성물은 임의의 적합한 경로 또는 상이한 경로의 조합에 의해 이를 필요로 하는 대상체에게 전달하기 위해 설계된다. 한 실시양태에서, 약제 조성물은 뇌실내(ICV), 경막내(IT), 수조내 또는 정맥내(IV) 투여 경로를 통한 전달에 적합한 제형 완충제에 본원에 설명된 발현 카세트 또는 벡터를 포함한다. 대안적으로, 다른 투여 경로(예를 들어, 경구, 흡입, 비강내, 기관내, 동맥내, 안구내, 근육내, 및 다른 비경구 경로)가 선택될 수 있다.
본원에 사용된 바와 같은 용어 "경막내 전달" 또는 "경막내 투여"는, 약물이 뇌척수액(CSF)에 도달하도록 척추관, 더 구체적으로는 지주막하 공간으로의 주사를 통한 약물 투여 경로를 지칭한다. 경막내 전달은 요추 천자, 심실내, 뇌실내(icv) 후두하/수조내, 및/또는 C1-2 천자를 포함할 수 있다. 예를 들어, 요추 천자에 의한 지주막하 공간 전체를 통한 확산을 위해 물질이 도입될 수 있다. 또 다른 예에서, 대조내(대조내; ICM)로 주사될 수 있다. 대조 내 전달은 벡터 확산을 증가시키고/시키거나, 투여에 의해 유발된 독성 및 염증을 감소시킬 수 있다. 예를 들어, Christian Hinderer et al, Widespread gene transfer in the central nervous system of cynomolgus macaques following delivery of AAV9 into the cisterna magna, Mol Ther Methods Clin Dev. 2014; 1: 14051. Published online 2014 Dec 10. doi: 10.1038/mtm.2014.51을 참고한다. 본원에 사용된 바와 같은 용어 "수조내 전달" 또는 "수조내 투여"는, 더 구체적으로는 후두하 천자를 통한 또는 대조 내로의 직접적인 주사에 의한 또는 영구적으로 배치된 튜브를 통한, 뇌실의 뇌척수액 또는 대조 내로 약물을 직접 투여하는 경로를 지칭한다.
한 측면에서, 제형 완충제에 본원에 설명된 바와 같은 벡터를 포함하는 약제 조성물이 본원에 제공된다. 특정 실시양태에서, 복제-결손 바이러스 조성물은 인간 대상체에 대해서는 (체중 70 kg의 평균 대상체를 치료하기 위해) 약 1.0 x 109 GC 내지 약 1.0 x 1016 GC 범위(및 이 범위 내의 모든 정수 또는 소수 양을 포함함), 그리고 바람직하게는 1.0 x 1012 GC 내지 1.0 x 1014의 범위에 있는 복제-결손 바이러스의 양을 함유하도록 투여 단위에 제형화될 수 있다. 한 실시양태에서, 상기 조성물은 적어도 1x109, 2x109, 3x109, 4x109, 5x109, 6x109, 7x109, 8x109, 또는 9x109 GC/용량(및 이 범위 내의 모든 정수 또는 소수 양을 포함함)을 함유하도록 제형화된다. 또 다른 실시양태에서, 상기 조성물은 적어도 1x1010, 2x1010, 3x1010, 4x1010, 5x1010, 6x1010, 7x1010, 8x1010, 또는 9x1010 GC/용량(및 이 범위 내의 모든 정수 또는 소수 양을 포함함)을 함유하도록 제형화된다. 또 다른 실시양태에서, 상기 조성물은 적어도 1x1011, 2x1011, 3x1011, 4x1011, 5x1011, 6x1011, 7x1011, 8x1011, 또는 9x1011 GC/용량(및 이 범위 내의 모든 정수 또는 소수 양을 포함함)을 함유하도록 제형화된다. 또 다른 실시양태에서, 상기 조성물은 적어도 1x1012, 2x1012, 3x1012, 4x1012, 5x1012, 6x1012, 7x1012, 8x1012, 또는 9x1012 GC/용량(및 이 범위 내의 모든 정수 또는 소 수 양을 포함함)을 함유하도록 제형화된다. 또 다른 실시양태에서, 상기 조성물은 적어도 1x1013, 2x1013, 3x1013, 4x1013, 5x1013, 6x1013, 7x1013, 8x1013, 또는 9x1013 GC/용량(및 이 범위 내의 모든 정수 또는 소수 양을 포함함)을 함유하도록 제형화된다. 또 다른 실시양태에서, 상기 조성물은 적어도 1x1014, 2x1014, 3x1014, 4x1014, 5x1014, 6x1014, 7x1014, 8x1014, 또는 9x1014 GC/용량(및 이 범위 내의 모든 정수 또는 소수 양을 포함함)을 함유하도록 제형화된다. 또 다른 실시양태에서, 상기 조성물은 적어도 1x1015, 2x1015, 3x1015, 4x1015, 5x1015, 6x1015, 7x1015, 8x1015, 또는 9x1015 GC/용량(및 이 범위 내의 모든 정수 또는 소수 양을 포함함)을 함유하도록 제형화된다. 한 실시양태에서, 인간 적용을 위한 용량은 1x1010 내지 1x1012 GC/용량(및 이 범위 내의 모든 정수 또는 소수 양을 포함함)의 범위일 수 있다.
한 실시양태에서, 제형 완충제에 본원에 설명된 바와 같은 rAAV를 포함하는 약제 조성물이 제공된다. 한 실시양태에서, 상기 rAAV는 약 1 x 109 게놈 복제물(GC)/mL 내지 약 1 x 1014 GC/mL로 제형화된다. 추가 실시양태에서, 상기 rAAV는 약 3 x 109 GC/mL 내지 약 3 x 1013 GC/mL로 제형화된다. 더욱 추가의 실시양태에서, 상기 rAAV는 약 1 x 109 GC/mL 내지 약 1 x 1013 GC/mL로 제형화된다. 한 실시양태에서, 상기 rAAV는 적어도 약 1 x 1011 GC/mL로 제형화된다.
이들 용량 및 농도의 전달에 적합한 부피는 당업자에 의해 결정될 수 있다. 예를 들어, 약 1 μL 내지 150 mL의 부피가 선택될 수 있고, 성인의 경우 더 높은 부피가 선택된다. 전형적으로, 신생아의 경우 적합한 부피는 약 0.5 mL 내지 약 10 mL이고, 더 큰 유아(infant)의 경우 약 0.5 mL 내지 약 15 mL가 선택될 수 있다. 걸음마기 이후의 유아(toddler)의 경우 약 0.5 mL 내지 약 20 mL의 부피가 선택될 수 있다. 어린이의 경우 최대 약 30 mL의 부피가 선택될 수 있다. 10대 초반 및 10대의 경우 최대 약 50 mL의 부피가 선택될 수 있다. 또 다른 실시양태에서, 환자는 선택되는 약 5 mL 내지 약 15 mL, 또는 약 7.5 mL 내지 약 10 mL의 부피로 경막내 투여를 받을 수 있다. 다른 적합한 부피 및 투여량이 결정될 수 있다. 투여량은 임의의 부작용에 대해 치료적 이점의 균형을 맞추도록 조정될 것이며, 이러한 투여량은 재조합 벡터가 사용되는 치료 적용에 따라 달라질 수 있다.
AAV 바이러스 벡터의 경우, 게놈 복제물("GC")의 정량화가 수성 현탁액 또는 약제 조성물에 함유된 용량의 계량법(measure)으로 사용될 수 있다. 당업계에 알려진 임의의 방법이 본 발명의 복제-결손 바이러스 조성물의 게놈 복제물(GC) 수를 결정하는 데 사용될 수 있다. AAV GC 수 적정을 수행하는 하나의 방법은 하기와 같다: 정제된 AAV 벡터 샘플을 먼저 DNase로 처리하여, 생산 공정에서 캡슐화되지 않은 AAV 게놈 DNA 또는 오염 플라스미드 DNA를 제거한다. 이 후, DNase 내성 입자에 열처리를 실시하여 캡시드로부터 게놈을 방출시킨다. 이 후, 방출된 게놈을, 바이러스 게놈의 특정 영역(보통 폴리 A 신호)을 표적으로 하는 프라이머/프로브 세트를 사용하여 실시간 PCR 또는 정량적 PCR로 정량화한다. 복제-결손 바이러스 조성물은, 인간 환자에 대해서는 약 1.0 x 109 GC 내지 약 1.0 x 1015 GC, 그리고 바람직하게는 1.0 x 1012 GC 내지 1.0 x 1014 GC의 범위에 있는 복제-결손 바이러스의 양을 함유하도록 투여 단위에 제형화될 수 있다. 바람직하게는, 제형 내 복제-결손 바이러스의 농도는 약 1.0 x 109 GC, 약 5.0 x 109 GC, 약 1.0 x 1010 GC, 약 5.0 x 1010 GC, 약 1.0 x 1011 GC, 약 5.0 x 1011 GC, 약 1.0 x 1012 GC, 약 5.0 x 1012 GC, 약 1.0 x 1013 GC, 약 5.0 x 1013 GC, 약 1.0 x 1014 GC, 약 5.0 x 1014 GC, 또는 약 1.0 x 1015 GC이다. AAV GC 수 적정을 수행하기 위한 대안적인 또는 추가 방법은 예를 들어, 본원에 참고로 편입되는 M. Lock et al, Hum Gene Ther Methods. 2014 Apr;25(2):115-25. doi: 10.1089/hgtb.2013.131. Epub 2014 Feb 14에 설명된 바와 같은 디지털 액적 PCR(ddPCR) 또는 oqPCR을 통해서이다.
본원에 설명된 약제 조성물로 된 조성물은 명세서 전반에 걸쳐 설명된 다른 조성물, 레지멘, 측면, 실시양태, 및 방법에 적용되도록 의도되는 것으로 이해되어야 한다.
방법
특정 실시양태에서, 발현 카세트, 핵산, 또는 바이러스 또는 비-바이러스 벡터가 약제를 제조하는 데 사용된다. 특정 실시양태에서, 이를 필요로 하는 대상체에서 엔젤만 증후군의 치료를 위한 이것들의 용도가 제공된다.
본원에 사용된 바와 같은 용어 "치료" 또는 "치료하는"은, UBE3A 결손 또는 엔젤만 증후군(AS)의 하나 이상의 증상을 완화할 목적으로 본원에 설명된 하나 이상의 화합물 또는 조성물을 대상체에게 투여하는 것을 포함하는 것으로 정의된다. 따라서 "치료"는 AS의 발병 또는 진행 감소, 질환 예방, 질환 증상의 중증도 감소, 이것들의 진행 지연, 질환 증상 제거, 질환 진행 지연, 또는 주어진 대상체에서 요법 효능 증가 중 하나 이상을 포함할 수 있다.
설명된 요법은 원하는 결과, 즉 엔젤만 증후군(AS) 또는 이의 하나 이상의 증상의 치료를 성취하기 위해 UBE3A 이소형 1 발현을 제공한다. 이러한 증상은 지적 장애, 언어 장애, 운동 실조, 간질, 발작 장애, 소두증, 정신운동 지연, 및 과반사를 동반한 근육 긴장저하증 중 하나 이상을 포함할 수 있지만, 이것들로 제한되지 않는다(예를 들어, 본원에 참고로 편입되는 Buiting K et al., Angelman syndrome - insight into a rare neurogenetic disorder, Nat Rev Neurol, 2016, 12(10): 584-593, epub September 12, 2016 참고). 본원에 설명된 바와 같이, 원하는 결과는 발달 지연, 지적 장애, 심각한 언어 장애, 및 운동 및 균형 문제를 포함한 신경물리학적 합병증을 감소시키거나 제거하는 것을 포함할 수 있다.
"치료적 유효량"의 본원에 제공된 조성물이 원하는 결과를 성취하거나 치료 목표에 도달하도록 대상체에게 전달된다. 한 실시양태에서, AS를 치료하기 위한 치료 목표는 뉴런 또는 뉴런 집단에서 UBE3A 이소형 1 발현을 정상 범위에 있는 환자에서의 기능적 수준으로 또는 비-AS 수준으로 회복시키는 것이다. 또 다른 실시양태에서, AS 치료를 위한 치료 목표는 UBE3A 이소형 1 발현을 정상 또는 비-AS 수준의 적어도 약 99%, 약 95%, 약 90%, 약 85%, 약 80%, 약 75%, 약 70%, 약 65%, 약 60%, 약 55%, 약 50%, 약 45%, 약 40%, 약 45%, 약 40%, 약 35%, 약 30% 약 25%, 약 20%, 약 15%, 약 10%, 약 5%, 약 2%, 약 1%까지, 또는 치료 전 UBE3A 발현 수준과 비교하여 증가시키는 것이다. UBE3A 이소형 1 기능을 100% 미만의 활성 수준으로 옮겨서 구제된(rescued) 환자는 선택적으로 추가 치료를 받을 수 있다. 또 다른 실시양태에서, AS 치료를 위한 치료 목표는 약 60%, 약 55%, 약 50%, 약 45%, 약 40%, 약 45%, 약 40%, 약 35%, 약 30% 약 25%, 약 20%, 약 15%, 약 10%, 약 5%, 약 2%, 또는 약 1%의, 선택된 집단의 뉴런을 포함한 표적 뉴런의 백분율로 표시된, UBE3A 이소형 1 발현을 증가시키는 것이다.
특정 실시양태에서, 뉴런에서 기능적 UBE3A 이소형 1을 발현하는 UBE3A 이소형 1을 제공하는 발현 카세트, 벡터 또는 rAAV를 이를 필요로 하는 대상체에게 투여하여 AS를 치료하는 방법이 본원에 제공된다. 특정 실시양태에서, 상기 방법은 UBE3A 이소형 1을 발현하는 핵산 서열(SEQ ID NO: 2의 아미노산 서열)을 전달하는 것을 포함한다.
특정 실시양태에서, 뉴런에서 기능적 UBE3a 이소형 1을 발현하는 UBE3a 이소형 1을 제공하는 발현 카세트, 벡터 또는 rAAV를 이를 필요로 하는 대상체에게 투여하여 효소를 대체하는 방법이 본원에 제공된다. 특정 실시양태에서, 상기 방법은 UBE3a 이소형 1을 발현하는 핵산 서열(SEQ ID NO: 2의 아미노산 서열)을 전달하는 것을 포함한다. 특정 실시양태에서, 뉴런에서 기능적 UBE3a 이소형 3을 발현하는 UBE3a 이소형 3을 제공하는 발현 카세트, 벡터 또는 rAAV를 이를 필요로 하는 대상체에게 투여하여 효소를 대체하는 방법이 본원에 제공된다. 특정 실시양태에서, 상기 방법은 UBE3a 이소형 3을 발현하는 핵산 서열(SEQ ID NO: 21의 아미노산 서열)을 전달하는 것을 포함한다.
바이러스성 또는 비-바이러스성 여부에 관계없이 본원에 설명된 유전자 요법은 다른 치료(2차 요법), 즉, 대상체(환자)의 진단 및 상태에 대한 관리 기준과 함께 사용될 수 있다. 본원에 사용된 바와 같은 용어 "2차 요법"은, AS 치료를 위해 본원에 설명된 유전자 요법과 조합될 수 있는 요법을 지칭한다. 일부 실시양태에서, 본원에 설명된 유전자 요법은 항경련제 또는 제한 식이(예를 들어, 케톤생성 및 저혈당)를 투여하는 것과 같은, AS 치료를 위한 하나 이상의 2차 요법과 함께 투여된다. 2차 요법은 AS의 이러한 증상을 예방, 저지 또는 개선하는 데 도움이 되는 임의의 요법일 수 있다. 2차 요법은 위에서 설명된 조성물의 투여 전에, 동시에 또는 후에 투여될 수 있다. 대상체는 주치의의 재량에 따라 유전자 요법 치료 전 및 상기 치료와 동시에 이들의 표준 관리 치료(들)를 계속하도록 허용될 수 있다. 대안적으로, 의사는 유전자 요법 치료를 실시하기 전에 표준 관리 요법을 중단하고, 선택적으로 유전자 요법의 투여 후 병용 요법으로서 표준 관리 치료를 재개하는 것을 선호할 수 있다. 또 다른 실시양태에서, 본원에 설명된 유전자 요법은 유전자형 분석 또는 유전자 스크리닝과 조합될 수 있고, 이는 당업계에서 일상적이며 UBE3A 유전자의 핵산 서열에서 하나 이상의 돌연변이를 식별하기 위한 PCR의 사용을 포함할 수 있다. 위에서 논의된 바와 같이, 인생 초기(예를 들어, 1-3개월)에 AS 증상을 보이는 대상체 뿐만 아니라 인생 후기에 AS로 진단된 대상체가 본원에 설명된 조성물 및 방법의 의도된 수용자이다.
"투여" 또는 "투여 경로"는, 약제학적 담체 또는 부형제와 함께 또는 이것 없이 대상체에게 본원에 설명된 조성물을 전달하는 것이다. 원하는 경우, 투여 경로는 조합될 수 있다. 일부 실시양태에서, 투여는 주기적으로 반복된다. 순차적 투여는 수일, 수주, 수개월 또는 수년의 간격으로부터 다중 투여의 시간차를 의미할 수 있다. 한 실시양태에서, 본원에 설명된 조성물은 필요로 하는 대상체에게 1회 이상 투여된다. 한 실시양태에서, 투여는 수일, 수주, 수개월 또는 수년 간격이다. 한 실시양태에서, 1회, 2회, 3회 또는 그 초과의 재투여가 허용된다. 이러한 재투여는 동일한 유형의 벡터 또는 상이한 벡터와 함께 행해질 수 있다. 추가 실시양태에서, 본원에 설명된 벡터는 단독으로, 또는 환자의 진단 및 상태에 대한 치료 표준과 함께 사용될 수 있다. 본원에 설명된 핵산 분자 및/또는 벡터는 단일 조성물 또는 다중 조성물로 전달될 수 있다. 선택적으로, 2개 이상의 상이한 AAV 또는 다중 바이러스가 전달될 수 있다[예를 들어, WO 2011/126808 및 WO 2013/049493 참고].
한 실시양태에서, 발현 카세트, 벡터, 또는 유전자 요법을 위한 본원에 설명된 다른 조성물은 환자당 단일 용량으로 전달된다. 한 실시양태에서, 대상체는 치료 유효량의 본원에 설명된 조성물을 전달받는다. 본원에 사용된 바와 같은 "치료적 유효량"은, 발현 카세트 또는 벡터, 또는 이의 조합의 양을 지칭한다.
한 실시양태에서, 발현 카세트는 약 1 x 109 GC/뇌 질량 그램 내지 약 1 x 1013 게놈 복제물(GC)/뇌 질량 그램(g), 및 상기 범위 및 종점 내의 모든 정수 또는 소수의 양으로 전달된 벡터 게놈으로 되어 있다. 또 다른 실시양태에서, 투여량은 1 x 1010 GC/뇌 질량 그램 내지 약 1 x 1013 GC/뇌 질량 그램이다. 특정 실시양태에서, 환자에게 투여된 벡터의 용량은 적어도 약 1.0 x 109 GC/g, 약 1.5 x 109 GC/g, 약 2.0 x 109 GC/g, 약 2.5 x 109 GC/g, 약 3.0 x 109 GC/g, 약 3.5 x 109 GC/g, 약 4.0 x 109 GC/g, 약 4.5 x 109 GC/g, 약 5.0 x 109 GC/g, 약 5.5 x 109 GC/g, 약 6.0 x 109 GC/g, 약 6.5 x 109 GC/g, 약 7.0 x 109 GC/g, 약 7.5 x 109 GC/g, 약 8.0 x 109 GC/g, 약 8.5 x 109 GC/g, 약 9.0 x 109 GC/g, 약 9.5 x 109 GC/g, 약 1.0 x 1010 GC/g, 약 1.5 x 1010 GC/g, 약 2.0 x 1010 GC/g, 약 2.5 x 1010 GC/g, 약 3.0 x 1010 GC/g, 약 3.5 x 1010 GC/g, 약 4.0 x 1010 GC/g, 약 4.5 x 1010 GC/g, 약 5.0 x 1010 GC/g, 약 5.5 x 1010 GC/g, 약 6.0 x 1010 GC/g, 약 6.5 x 1010 GC/g, 약 7.0 x 1010 GC/g, 약 7.5 x 1010 GC/g, 약 8.0 x 1010 GC/g, 약 8.5 x 1010 GC/g, 약 9.0 x 1010 GC/g, 약 9.5 x 1010 GC/g, 약 1.0 x 1011 GC/g, 약 1.5 x 1011 GC/g, 약 2.0 x 1011 GC/g, 약 2.5 x 1011 GC/g, 약 3.0 x 1011 GC/g, 약 3.5 x 1011 GC/g, 약 4.0 x 1011 GC/g, 약 4.5 x 1011 GC/g, 약 5.0 x 1011 GC/g, 약 5.5 x 1011 GC/g, 약 6.0 x 1011 GC/g, 약 6.5 x 1011 GC/g, 약 7.0 x 1011 GC/g, 약 7.5 x 1011 GC/g, 약 8.0 x 1011 GC/g, 약 8.5 x 1011 GC/g, 약 9.0 x 1011 GC/g, 약 9.5 x 1011 GC/g, 약 1.0 x 1012 GC/g, 약 1.5 x 1012 GC/g, 약 2.0 x 1012 GC/g, 약 2.5 x 1012 GC/g, 약 3.0 x 1012 GC/g, 약 3.5 x 1012 GC/g, 약 4.0 x 1012 GC/g, 약 4.5 x 1012 GC/g, 약 5.0 x 1012 GC/g, 약 5.5 x 1012 GC/g, 약 6.0 x 1012 GC/g, 약 6.5 x 1012 GC/g, 약 7.0 x 1012 GC/g, 약 7.5 x 1012 GC/g, 약 8.0 x 1012 GC/g, 약 8.5 x 1012 GC/g, 약 9.0 x 1012 GC/g, 약 9.5 x 1012 GC/g, 약 1.0 x 1013 GC/g, 약 1.5 x 1013 GC/g, 약 2.0 x 1013 GC/g, 약 2.5 x 1013 GC/g, 약 3.0 x 1013 GC/g, 약 3.5 x 1013 GC/g, 약 4.0 x 1013 GC/g, 약 4.5 x 1013 GC/g, 약 5.0 x 1013 GC/g, 약 5.5 x 1013 GC/g, 약 6.0 x 1013 GC/g, 약 6.5 x 1013 GC/g, 약 7.0 x 1013 GC/g, 약 7.5 x 1013 GC/g, 약 8.0 x 1013 GC/g, 약 8.5 x 1013 GC/g, 약 9.0 x 1013 GC/g, 약 9.5 x 1013 GC/g, 또는 약 1.0 x 1014 GC/뇌 질량 g이다.
특정 실시양태에서, 레지멘은 유전자 편집 시스템을 포함하는 조성물을 포함하는 추가적인 치료를 수반할 수 있다. 예를 들어, "엔젤만 증후군의 치료를 위한 조성물 및 용도"라는 제목의 2020년 4월 28일자로 출원된 미국 특허 출원 번호 63/016,712 및 2020년 11월 25일자로 출원된 미국 특허 출원 번호 63/118,299를 참고한다. 이 치료는 본원에 설명된 유전자 대체 요법을 사용하여 치료하기 전일 수 있고, 초기 치료에 활용되었던 것과 상이한 캡시드를 갖는 벡터를 활용할 수 있다. AAV 캡시드의 또 다른 조합은 당업자에 의해 선택될 수 있다.
특정 실시양태에서, 치료 레지멘은 UBE3A 이소형 3과 UBE3A 이소형 1의 공동-발현을 수반할 수 있다. 특정 실시양태에서, 치료제는 (예를 들어, 이소형 3 및/또는 이소형 1 효소를 사용한) AAV.hUBE3A-이소형 1 및 hUBE3A 효소 대체 요법의 공동 요법을 수반할 수 있다. 특정 실시양태에서, 치료 레지멘은 AAV.hUBE3A-이소형 1 유전자 요법 벡터 및 면역조절 레지멘을 사용한 공동 요법을 수반할 수 있다. 이러한 면역조절 레지멘은 예를 들어, 글루코코르티코이드, 스테로이드, 항대사제, T-세포 억제제, 마크로라이드(예를 들어, 라파마이신 또는 라파로그), 및 알킬화제를 포함한 세포증식억제제와 같은 면역억제제, 항대사제, 세포독성 항생제, 항체, 또는 면역필린에 대해 활성인 제제를 포함할 수 있지만, 이것들로 제한되지 않는다. 면역 억제제는 질소 머스타드, 니트로소우레아, 백금 화합물, 메토트렉세이트, 아자티오프린, 머캅토푸린, 플루오로우라실, 닥티노마이신, 안트라사이클린, 미토마이신 C, 블레오마이신, 미트라마이신, IL-2 수용체-(CD25-) 또는 CD3-지시 항체, 항-IL-2 항체, 사이클로스포린, 타크로리무스, 시롤리무스, IFN-β, IFN-γ, 오피오이드, 또는 TNF-α(종양 괴사 인자-알파) 결합제를 포함할 수 있다. 특정 실시양태에서, 면역억제 요법은 유전자 요법 투여 전에 시작될 수 있다. 이러한 요법은 같은 날에 2개 이상의 약물(예를 들어, 프레드니솔론, 미코페놀레이트 모페틸(MMF) 및/또는 시롤리무스(즉, 라파마이신))의 공동 투여를 수반할 수 있다. 이러한 약물 중 하나 이상은 유전자 요법 투여 후 동일한 용량 또는 조정된 용량으로 계속될 수 있다. 이러한 요법은 필요에 따라 약 1주, 약 15일, 약 30일, 약 45일, 60일 또는 그보다 오랫 동안 행해질 수 있다. 또 다른 공동 치료제는 예를 들어, 항-AAV 항체를 고갈시키는 데 유용한 것으로 설명된 항-IgG 효소, 및/또는 예를 들어, "유전자 요법 환자의 치료를 위한 조성물 및 방법"의 제목으로 2020년 6월 17일자로 출원된 미국 가 특허 출원 번호 63/040,381에 설명된 (그리고 따라서 선택된 AAV 캡시드에 대한 항체의 임계 값 수준 초과로 시험되는 환자에게 투여될 수 있음) 항-FcRN 항체의 전달, 및/또는 a) 스테로이드 또는 스테로이드의 조합 및/또는 (b) IgG 절단 효소, (c) Fc-IgE 결합 억제제; (d) Fc-IgM 결합 억제제; (e) Fc-IgA 결합 억제제; 및/또는 (f) 감마 인터페론 중 하나 이상을 포함할 수 있다.
일반적으로, 상기 방법은 조절 서열의 통제 하에 UBE3A 유전자 대체 (발현) 시스템의 하나 이상의 요소를 암호화하는 핵산 서열을 운반하는 재조합 아데노-관련 바이러스(AAV)를 포함하는 조성물의 약제학적 유효량, 및 약제학적으로 허용되는 담체를 이를 필요로 하는 포유동물 대상체에게 투여하는 것을 포함한다. 한 실시양태에서, 이러한 방법은 포유동물 대상체에서 AS를 치료, 지연 또는 이의 진행을 정지시키기 위해 설계된다.
한 실시양태에서, 본 명세서에 설명된 벡터, rAAV, 수성 현탁액, 또는 약제 조성물을 필요로 하는 대상체에게 투여함으로써 AS를 치료하는 방법이 제공된다. 한 실시양태에서, rAAV는 약 1 x 1010 게놈 복제물(GC)/체중 kg 내지 약 1 x 1015 게놈 복제물(GC)/체중 kg으로 전달된다. 특정 실시양태에서, 대상체는 인간이다. 한 실시양태에서, rAAV는 1회 초과로 투여된다. 추가 실시양태에서, rAAV는 수일, 수주, 수개월 또는 수년 간격으로 투여된다.
실시예
본 발명은 이제 하기 실시예를 참고하여 설명된다. 이들 실시예는 단지 예시의 목적으로 제공되며, 본 발명은 결코 이들 실시예로 제한되는 것으로 해석되어서는 안 되며, 오히려 본원에 제공된 교시의 결과로서 명백해지는 임의의 그리고 모든 변형을 포함하는 것으로 해석되어야 한다.
엔젤만 증후군(AS)은 전 세계적으로 약 50만 명의 개인이 걸리는 희귀한 신경발달 장애이다. AS는 지적 및 신체적 장애, 발작 및 수면 장애, 및 장 기능을 특징으로 한다. 이러한 결손의 대부분은 모계 유전 유비퀴틴 단백질 리가제 E3A(UBE3A) 대립유전자의 손실로 인한 것이다. 현재, AS에 대한 치료 옵션은 제한적이다. AAV 기반의 유전자 대체 요법은 UBE3A 이소형 발현을 복원하며 AS 중증도를 완화하기 위한 유망한 전략을 나타낸다. 그러나, UBE3A 유전자는 3개의 이소형을 암호화하며, 어느 UBE3A 이소형이 가장 효과적인 후보가 될 지는 현재 불분명하다. AS의 생쥐 모델(UBE3Am-/p+)에서 조작된 인간 UBE3A 이소형을 전달하는 AAV 벡터의 효능을 비교하여 이러한 불확실성을 해결한다. 웨스턴 블롯팅 및 면역조직화학적 분석은 AAV-UBE3A 인간 이소형 1 및 2 벡터를 신생아 대조군 및 AS 생쥐에 뇌실내 주사한 결과 강력한 단백질 발현이 일어났음을 나타냈다. 이소형 1 대체는, AS 생쥐에서 용량 의존적인 방식으로 보행, 보금자리 구축 능력, 및 운동 협응을 크게 개선시켰다. 이소형 1과 달리, 이소형 2는 AS 생쥐에서 보금자리를 짓는 능력 및 운동 협응을 더욱 손상시켰다. 비인간 영장류에서의 독성학 연구는, 대조 내로 주사된 고용량의 AAV-UBE3A 이소형 1 벡터가 큰 부작용이 없었음을 시사했다. 종합하면, 이들 데이터는 AAV-UBE3A 이소형 1 벡터가 유망한 안전성 프로파일과 함께 가장 치료적으로 효과적임을 시사한다. 이러한 전임상 발견은, AS에 대한 유전자 대체 요법의 개발에서 중요한 진전을 나타낸다.
실시예 1 - 변형된 인간 시냅신 프로모터의 지시 하에, 조작된 hUBE3A 이소형 1 및 조작된 hUBE3A 이소형 2 코딩 서열
생쥐에서의 첫 번째 연구 세트를 위해, 변형된 인간 시냅신(hSyn) 프로모터(SEQ ID NO: 12)의 통제 하에 있었던 조작된 인간 UBE3A 이소형 1(SEQ ID NO: 9) 또는 UBE3A 이소형 2(SEQ ID NO: 10) 이식유전자를 함유하는 일련의 플라스미드를 조작하였다. SV40 폴리아데닐화 서열(SEQ ID NO: 13)이 전사 안정성을 촉진하기 위해 포함되었다. 프로모터-이식유전자-SV40 작제물은 역위 말단 반복부(ITR)의 측면에 있었다. 플라스미드를, C57BL6/J 생쥐의 중추 신경계의 뉴런 및 아교세포를 강력하게 변환시키는 AAV9 변종인 PHP.B에 패키징하였다.
변형된 인간 시냅신 프로모터의 코딩 서열은 SEQ ID NO: 12로 제공된다.
생성된 벡터 게놈은 SEQ ID NO: 3(hSyn.hUbe3a-1.GSco.SV40) 및 SEQ ID NO: 7(이소형 2 hSyn.hUbe3a-2.GSco.SV40)에서 재현된다.
AAVPHP.B 캡시드(US 9,585,971)를, 패키징되는 숙주 세포에 의해 제공되지 않는 필수 아데노바이러스 헬퍼 기능을 발현하는 트랜스 플라스미드 및 벡터 게놈을 함유하는 시스 플라스미드로 공동 형질감염된, AAV2 rep 코딩 서열 및 PHP.B VP1 코딩 서열을 포함하는 트랜스 플라스미드에서 삼중 형질감염 기술을 사용하여 패키징되는 숙주 세포에 생성시킨다.
실시예 2 - 생쥐 및 NHP로의 hUBE3A의 rAAV-매개 전달
A. 성체 생쥐 뇌에서 hUBE3A 이소형 1 및 2의 발현 시험
AAV-PHP.B-시냅신-UBE3A 이소형 1 및 AAV-PHP.B-시냅신-UBE3A-이소형 2 벡터를 야생형 성체 생쥐의 뇌에 (뇌실내-ICV) 주사하고, 웨스턴 블롯에 의해 이식유전자 발현을 정량화하여 가장 많이 발현되는 AAV-PHP.B-시냅신-UBE3A 이소형 1 및 AAV-PHP.B-시냅신-UBE3A 이소형 2 벡터를 식별하였다(도 8).
방법: 성체 야생형 WT(UBE3Am+/p+) 및 UBE3A KO/null(UBE3Am-/p+) 한배 새끼에서 후안와(IV) 주사로 전달된 5×1011 GC/생쥐. 웨스턴 블롯팅을 위해 주사 후 14일에 뇌를 수확하였다. 이 후, cDNA를 최적의 발현을 위해 온전한 ITR을 갖는 플라스미드로 서브클로닝했다.
B. 가장 치료적으로 효과적인 AAV-UBE3A 이소형 벡터의 결정
AS의 생쥐 모델에서 운동 및 행동 결손을 구제하기 위한 최고로 발현되는 AAV-PHP.B-시냅신-UBE3A-이소형 1(이소형 1) 및 AAV-PHP.B-시냅신-UBE3A-이소형 2(이소형 2) 벡터의 능력을 직접 비교했다. 신생아 야생형 또는 AS(UBE3Am-/p+) 생쥐에게 이소형 1 또는 이소형 2 벡터를 1x1011 게놈 복제물/동물의 용량으로 뇌실내(ICV) 주사했다. 행동 시험(8-10주령), 시험 순서: (1) 캣워크, (2) 운동 활동, (3) 로타로드(rotarod), (4) 보금자리 구축. 2개월 후, 이소형 2가 아닌 이소형 1을 주사한 AS 생쥐는, 보행(보폭 도 11a 내지 도 11d), 보금자리 구축 능력(도 10a 및 10b) 및 운동 협응(도 9a 및 9b)에서 통계적으로 유의미한 개선을 보였다. 사실상, 이소형 2의 발현은 AS 생쥐에서 보금자리 구축 능력의 결손을 악화시켰다(도 10c 및 10d). 1x1010 게놈 복제물/동물의 저용량으로의 이소형 1 주사는 덜 효과적이었지만, AS 생쥐에서 보금자리 구축 능력을 향상시켰다. 야생형 생쥐에서 이소형 1 또는 2의 과발현은 여러 행동 영역에서 부작용이 있었고, 이는 UBE3A 이소형 발현의 엄격한 통제의 중요성을 나타냄이 또한 관찰되었다. 요약하면, 헤드-투-헤드(head-to-head) 시험은 핵 UBE3A 이소형 1 벡터가 AS 생쥐에서 행동 결손을 감소시키는 데 있어서 세포질 이소형 2 벡터보다 더 큰 치료 능력을 가졌음을 나타냈다. 조작된 인간 UBE3A 이소형 1 단백질의 발현 및 국소화는, 야생형 UBE3Am-/p+ 및 처리된 UBE3Am-/p+ 생쥐로부터의 시상면 뇌 절편(즉, 피질, 해마, 시상, 시상하부, 중뇌)에서 뉴런 마커 NeuN 및 핵으로 공동 염색하여 얻은 면역형광 영상으로 확인했다. 상이한 뇌 영역에서 UBE3A 이소형 1(도 5 및 6) 및 UBE3A 이소형 2(도 7) 단백질 양성 뉴런의 분율(백분율)을 측정하고, Visiopharm 소프트웨어를 사용하여 정량화하였다(도 5 및 6).
1 x 1010 GC 용량에서, AAV-PHP.B-hSyn-UBE3A-이소형 1 투여는 야생형 내인성 UBE3A 이소형 발현의 ~50%를 성취했고, 운동 활동, 운동 협응 또는 보금자리 구축에서의 행동 결손에 크게 영향을 미치지 않았으며, 일부 보행 이상을 개선시켰다. 도 5는 처리한 UBE3Am-/p+ 생쥐에서 UBE3A 단백질 양성 뉴런의 정량화를 보여준다(통계 분석: 평균 ± SD, 짝이 없는 스튜던트 t 검정). 처리는 뇌실내(ICV)를 통한 1x1010 GC/동물의 용량으로의 AAV-PHP.B-hSyn-UBE3A-이소형 1의 투여로 구성되었다.
1 x 1011 GC의 더욱 고용량에서, AAV-PHP.B-hSyn-UBE3A-이소형 1 투여는 야생형 내인성 UBE3A 이소형 발현의 ~100%를 성취하여, 보금자리 구축 능력을 상당히 개선시켰다(도 10a). 처리된 UBE3Am-/p+ 생쥐는, Deacon RMJ, 2006, Assessing nest building in mice, Nat Protoc 1(3):1117-9의 방법에 따라 수행된 이것들의 보금자리를 구축하기 위해 훨씬 더 많은 보금자리 재료를 사용했다(도 10b). UBE3A-이소형 1 투여는 UBE3Amp+ 생쥐에서 저활동성에는 영향을 미치지 않았지만, 이전에 발표된 보행 이상(Heck et al., Analysis of cerebellar function in Ube3a-deficient mice reveals genetype-specific behaviors, 2008, Hum Mol Genetics, 17(14): 2181-2189; epub April 15, 2008에 설명된 바와 같이 평가된 보폭)으로 표준화시켰다. UBE3A-이소형 2 투여(도 9b)가 아닌 UBE3A-이소형 1 투여(도 9a)는 UBE3Am-/p+ 생쥐에서 운동 협응 결손을 상당히 감소시켰다. 도 6은 처리된 UBE3Am-/p+ 생쥐에서 UBE3A 단백질 양성 뉴런의 정량화를 보여준다(통계 분석: 짝이 없는 t 검정). 처리는 뇌실내(ICV)를 통한 1x1011 GC/동물의 용량으로의 AAV-PHP.B-hSyn-UBE3A-이소형 1의 투여로 구성되었다. 도 5로부터의 단백질 발현의 정량화는 아래의 표 1에 요약되어 있다.
UBE3A-이소형 대체의 치료 효과: 이소형 1: (i) 보폭(임상적으로 관련된 보행 결함) 정상화, (ii) 운동 협응 개선, (iii) 보금자리 구축 행동 개선, (iv) UBE3 결손(UBE3Am-/p+) 생쥐에서 운동 저활동성에 영향 없음. 이소형 2: (i) 보금자리 구축 행동 손상, (ii) (이소형 1과 같이) 운동 저활동성에 또는 운동 협응에 영향 없음.
또한, 위에서 설명된 데이터는, 강력한 UBE3A 이소형 1 단백질 발현이 여러 뇌 영역 내 뉴런의 많은 부분에서 관찰되었음을 보여준다. UBE3A 이소형 1 단백질 발현은, 1x1010 GC/동물로 처리한 동물과 비교하여 1x1011 Gc/동물로 처리한 동물에서 더 큰 백분율의 UBE3A 양성 뉴런과 함께 용량 의존성을 나타냈다.
AS 생쥐에서의 전임상 연구는, AAV-PHP.B-시냅신-UBE3A-이소형 1이 AS 생쥐에서 잘 발현되었고 운동 및 행동 결손을 완화시켰음을 나타냈다. 다음으로, 인간과의 면역 체계 및 뇌 구조의 유사성 때문에 붉은 털 원숭이에서 고용량에서의 이소형 1 벡터의 안전성 프로필을 평가하여 이것의 치료 가능성을 조사했다. 먼저, AAV-hu68-시냅신-UBE3A-이소형 1 벡터를 생성하였다. AAVhu68은 또한 비인간 영장류에서 잘 작용하는, 사내에서 개발된 AAV9 변종이다. AAVhu68-hSyn-UBE3A-이소형 1 벡터를 3 x 1013 GC/동물의 고용량으로 3마리의 붉은 털 원숭이(NHP-1, NHP-2, NHP-3)의 대조의 뇌척수액에 주사하였다. 35일 후, 붉은 털 원숭이를 분해하고, 이식유전자 발현, 면역 반응, 및 부작용에 대해 평가했다. 케이지(cage) 측면에서의 평가에서 임상적으로 현저한 병태 또는 신경학적 문제가 있는 동물은 없었다. 혈액 화학 검사는 처리된 붉은 털 원숭이에서 정상적인 응고, 간 및 신장 기능을 나타냈다. 속질, 및 정수리 및 측두 피질을 포함한 여러 뇌 영역에서는 낮은 수준의 이소형 1 벡터, 및 척추의 후근 신경절에서는 더 높은 수준이 관찰되었다(도 2a). 또한, 척추의 후근 신경절을 포함한 여러 뇌 영역에서 인간 UBE3A-이소형 1 mRNA의 낮은 발현이 검출되었다(도 2b 및 2c). 조작된 인간 UBE3A 이소형 1 전사체의 국소화를, 처리된 3개의 NHP로부터의 후근 신경절(경부, 흉부 및 요추 분절)의 형광 영상으로 확인하였다. UBE3A 이소형 1 전사체 국소화를, 조작된 인간 서열에 특이적인 RNAscope 프로브를 사용하여 측정하였고(도 7a 내지 7i), DAPI(핵)를 사용하여 대비염색하였다. 관심 영역의 영상을 다양한 배율에서 촬영하였고, 영상은 20x 배율에서 제시된다. 도 7a 내지 7i는 처리된 3마리의 비인간 영장류(NHP; 35일 연구에서)의 후근 신경절(경부, 흉부 및 요추 분절)에서, 조작된 인간 UBE3A 이소형 1(hUBE3A-1) 전사체 국소화의 형광 영상을 보여준다. 처리는 대조(ICM) 경로를 통한 3X101313 GC/동물의 용량으로의 AAV-hu68-hSyn-UBE3A-이소형 1의 투여로 구성되었다. 관심 영역의 영상은 20배 배율로 제시된다. 도 7a는 NHP-1로부터의 후근 신경절의 경부 분절에서, 조작된 hUBE3A-1 전사체 국소화의 형광 영상을 보여준다. 도 7b는 NHP-2로부터의 후근 신경절의 경부 분절에서, 조작된 hUBE3A-1 전사체 국소화의 형광 영상을 보여준다. 도 7c는 NHP-3으로부터의 후근 신경절의 경부 분절에서, 조작된 hUBE3A-1 전사체 국소화의 형광 영상을 보여준다. 도 7d는 NHP-1로부터의 후근 신경절의 흉부 분절에서, 조작된 hUBE3A-1 전사체 국소화의 형광 영상을 보여준다. 도 7e는 NHP-2로부터의 후근 신경절의 흉부 분절에서, 조작된 hUBE3A-1 전사체 국소화의 형광 영상을 보여준다. 도 7f는 NHP-3로부터의 후근 신경절의 흉부 분절에서, 조작된 hUBE3A-1 전사체 국소화의 형광 영상을 보여준다. 도 7g는 NHP-1로부터의 후근 신경절의 요추 분절에서, 조작된 hUBE3A-1 전사체 국소화의 형광 영상을 보여준다. 도 7h는 NHP-2로부터의 후근 신경절의 요추 분절에서, 조작된 hUBE3A-1 전사체 국소화의 형광 영상을 보여준다. 도 7i는 NHP-3로부터의 후근 신경절의 요추 분절에서, 조작된 hUBE3A-1 전사체 국소화의 형광 영상을 보여준다.
면역 반응은 예상대로 hu68 캡시드에 대한 적당한 면역 반응을 나타내는 ELISPOT 분석을 사용하였을 때 최소였다. 마지막으로, 후근 신경절(DRG) 독성은 비인간 영장류 및 잠재적으로 인간에서 중추 신경계 지시된 그리고 고용량 AAV의 플랫폼 문제이다. 그러나, 한 동물의 척수(도 13a 내지 13c) 및 말초 신경(도 13a 내지 13c)에서 경미한 DRG(도 12 내지 12c) 및 뉴런 독성만이 관찰되었다. 요약하면, 이러한 발견은, AAVhu68-hSyn-UBE3A-이소형 1 벡터의 고용량 ICM 전달이 비인간 영장류에서 내약성이 좋았음을 시사한다. 또한, 이 데이터 세트로부터의 결론은, pPCR 분석과 일치되게, 모든 DRG 분절에서 강력한 UBE3A 이소형 1 전사체 국소화가 검출될 수 있다는 것이다. 강력한 이식유전자 DRG 발현에도 불구하고, 처리된 NHP에서는 상당한 AAV 독성의 부재가 나타난다.
실시예 3 - 붉은 털 원숭이에서 hUBE3A 이소형 1 ± miR183 표적 서열의 발현 및 안전성을 조사하는 NHP 예비 연구
비인간 영장류 및 인간에서 고용량 AAV 유도된 DRG 독성에 대한 우려 때문에, DRG에서 이소형 1 단백질 발현을 하향 조절하여 DRG 독성을 완화하기 위해 microRNA 전략을 동시에 사용하였다. 이식유전자(이 경우 UBE3A-이소형 1)의 3' UTR에 miR183 표적 부위를 포함시키면 DRG의 감각 뉴런에서는 이소형 1 이식유전자 mRNA의 RISC 복합체 매개 분해가 선택적으로 촉진되는 한편, 뇌의 표적 뉴런에서는 치료 이식유전자 발현이 보존된다. 최고로 발현되는 조작된 이소형 1 또는 이소형 2의 3' 말단과 SV40 폴리아데닐화 부위 사이에 miR183 결합 부위의 4개 복제물을 삽입하고, 이것을 AAVhu68 캡시드에 패키징했다. SEQ ID NO: 11은 miRNA183(또는 miR183) 표적화 서열의 하나의 복제물의 서열을 제공한다. 이러한 방식으로, AAV-hu68-시냅신-UBE3A-이소형 1-4xmiR183을 생성했다. AAVhu68 캡시드를, 패키징되는 숙주 세포에 의해 제공되지 않는 필수 아데노바이러스 헬퍼 기능을 발현하는 트랜스 플라스미드 및 벡터 게놈을 함유하는 시스 플라스미드로 공동 형질감염된, AAV2 rep 코딩 서열 및 SEQ ID NO: 14의 hu68 VP1 코딩 서열을 포함하는 트랜스 플라스미드에서 삼중 형질감염 기술을 사용하여 패키징되는 숙주 세포에 생성시킨다.
4 x miR183 카세트를 포함시켰더니 1 x 1011 GC/동물 용량으로 정맥내 주사된 성인 야생형 또는 AS 생쥐의 UBE3A-이소형 1 또는 이소형 2 단백질 발현에는 크게 영향을 미치지 않았다.
다음으로 rAAVhu68-시냅신-UBE3A-이소형 1-4xmiR183 벡터의 안전성 및 발현 프로필을, 붉은 털 원숭이에서 이전에 분석된 rAAVhu68-시냅신-UBE3A-이소형 1-miR183 벡터와 비교했다. AAV-hu68-시냅신-UBE3A-이소형 1-4xmiR183을 3마리의 붉은 털 원숭이의 대조 내로 3 x 1013 GC/동물로 주사하였고, 35일 후에 붉은 털 원숭이를 분석을 위해 분해하였다. 모든 동물은 연구 기간 동안 임상적으로는 눈에 띄지 않는 상태에 있었다. 예상대로 후근 신경절 및 척수에서는 더 높은 수준의 이소형 1-miR183 벡터와 함께, 속질과 같은 일부 뇌 영역에서는 낮은 수준의 이소형 1-miR183 벡터가 관찰되었다. 또한, 대개 이소형 1에 필적하는, 후근 신경절 및 척수에서 인간 이소형 1-miR183 mRNA의 낮은 발현이 검출되었다. 이소형 1과 마찬가지로, 이소형 1-miR183은 비인간 영장류에서 면역원성이 미미하며 응고, 간 및 신장 기능에는 영향을 미치지 않으면서 내약성이 우수했다. 유사하게, 이소형 1-miR183으로 처리된 붉은 털 원숭이에서는 상당한 DRG 또는 뉴런 독성이 관찰되지 않았다. 도 3a 내지 3b를 참고한다. 말초 신경에서 rAAVhu68.시냅신-UBE3A-이소형 1의 영향은 도 4a 내지 4b에 나타나 있다.
벡터 생체분포 및 mRNA 발현을 평가하였고, 이는 도 2a 내지 2c에 나타나 있다.
요약하면, 이러한 발견은 AAVhu68-hSyn-UBE3A-이소형1-miR183 벡터의 고용량에서의 ICM 전달이 비인간 영장류에서 내약성이 좋았음을 시사한다. 이 벡터는 비인간 영장류에서는 유용하지 않지만 인간 임상 시험에 존재하는 경우 DRG 및 신경 독성을 완화하는 데 유용할 수 있다.
(서열 목록 자유 파일)
숫자 식별자 <223>으로 자유 텍스트를 함유하는 서열에 대하여 하기 정보가 제공된다:
이 명세서에 인용된 모든 문서는 본원에 참고로 편입된다. "21-9579PCT_SeqListing_ST25"의 제목으로, 본원과 함께 제출된 서열 목록, 및 그 안의 서열 및 텍스트는 참고로 편입된다. 2020년 12월 1일자로 출원된 미국 가 출원 번호 63/119,860 및 2021년 4월 26일자로 출원된 미국 가 출원 번호 63/179,807은 본원에 참고로 편입된다. 본 발명이 특정 실시양태를 참고로 설명되었지만, 본 발명의 정신을 벗어나지 않고 수정이 행해질 수 있음이 인식될 것이다. 이러한 수정은 첨부된 청구범위의 범위 내에 속하는 것으로 의도된다.
SEQUENCE LISTING <110> The Trustees of the University of Pennsylvania <120> COMPOSITIONS AND USES THEREOF FOR TREATMENT OF ANGELMAN SYNDROME <130> UPN-21-9579.PCT <150> US 63/119,860 <151> 2020-12-01 <150> US 63/179,807 <151> 2021-04-26 <160> 25 <170> PatentIn version 3.5 <210> 1 <211> 3804 <212> DNA <213> Artificial Sequence <220> <223> vector genome hSyn.hUbe3a-1.GSco.4XmiRNA183.SV40 <220> <221> repeat_region <222> (1)..(130) <223> ITR <220> <221> promoter <222> (213)..(678) <223> hSynapsin <220> <221> misc_feature <222> (690)..(695) <223> Kozak <220> <221> CDS <222> (696)..(3257) <223> hUBE3a-1 <220> <221> misc_feature <222> (779)..(779) <223> mut <220> <221> misc_feature <222> (824)..(824) <223> mut <220> <221> misc_feature <222> (1028)..(1028) <223> mut <220> <221> misc_feature <222> (1128)..(1128) <223> mut <220> <221> misc_feature <222> (1181)..(1181) <223> mut <220> <221> misc_feature <222> (1217)..(1217) <223> mut <220> <221> misc_feature <222> (1283)..(1283) <223> mut SD/AS <220> <221> misc_feature <222> (1715)..(1715) <223> mut <220> <221> misc_feature <222> (1721)..(1721) <223> mut <220> <221> misc_feature <222> (1766)..(1766) <223> mut <220> <221> misc_feature <222> (1805)..(1805) <223> mut <220> <221> misc_feature <222> (1814)..(1814) <223> mut <220> <221> misc_feature <222> (1991)..(1991) <223> mut <220> <221> misc_feature <222> (2063)..(2063) <223> mut <220> <221> misc_feature <222> (2111)..(2111) <223> mut <220> <221> misc_feature <222> (2294)..(2294) <223> mut <220> <221> misc_feature <222> (2439)..(2440) <223> mut SD/AS <220> <221> misc_feature <222> (2723)..(2723) <223> mut <220> <221> misc_feature <222> (2957)..(2957) <223> mut <220> <221> misc_feature <222> (3023)..(3023) <223> mut <220> <221> misc_feature <222> (3056)..(3056) <223> mut SD/AS <220> <221> misc_feature <222> (3152)..(3152) <223> mut <220> <221> misc_feature <222> (3161)..(3161) <223> mut <220> <221> misc_feature <222> (3230)..(3230) <223> mut <220> <221> misc_feature <222> (3264)..(3285) <223> miRNA183 <220> <221> misc_feature <222> (3318)..(3311) <223> miRNA183 <220> <221> misc_feature <222> (3318)..(3339) <223> miRNA183 <220> <221> misc_feature <222> (3346)..(3367) <223> miRNA183 <220> <221> polyA_signal <222> (3379)..(3610) <223> SV40 polyA <220> <221> repeat_region <222> (3675)..(3804) <223> ITR <400> 1 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatcc tctagaacta tagctagcat gcctgcagag ggccctgcgt atgagtgcaa 240 gtgggtttta ggaccaggat gaggcggggt gggggtgcct acctgacgac cgaccccgac 300 ccactggaca agcacccaac ccccattccc caaattgcgc atcccctatc agagaggggg 360 aggggaaaca ggatgcggcg aggcgcgtgc gcactgccag cttcagcacc gcggacagtg 420 ccttcgcccc cgcctggcgg cgcgcgccac cgccgcctca gcactgaagg cgcgctgacg 480 tcactcgccg gtcccccgca aactcccctt cccggccacc ttggtcgcgt ccgcgccgcc 540 gccggcccag ccggaccgca ccacgcgagg cgcgagatag gggggcacgg gcgcgaccat 600 ctgcgctgcg gcgccggcga ctcagcgctg cctcagtctg cggtgggcag cggaggagtc 660 gtgtcgtgcc tgagagcgca gtcgaattcg ccacc atg aag agg gca gca gca 713 Met Lys Arg Ala Ala Ala 1 5 aag cac ctg atc gag aga tac tat cac cag ctg acc gag gga tgc gga 761 Lys His Leu Ile Glu Arg Tyr Tyr His Gln Leu Thr Glu Gly Cys Gly 10 15 20 aac gag gca tgt aca aac gag ttc tgc gcc tcc tgt ccc acc ttt ctg 809 Asn Glu Ala Cys Thr Asn Glu Phe Cys Ala Ser Cys Pro Thr Phe Leu 25 30 35 agg atg gat aac aac gcc gcc gcc atc aag gcc ctg gag ctg tac aag 857 Arg Met Asp Asn Asn Ala Ala Ala Ile Lys Ala Leu Glu Leu Tyr Lys 40 45 50 atc aac gcc aag ctg tgc gac ccc cac cct agc aag aag ggc gcc agc 905 Ile Asn Ala Lys Leu Cys Asp Pro His Pro Ser Lys Lys Gly Ala Ser 55 60 65 70 tcc gcc tat ctg gag aac tcc aag ggc gcc cct aac aat agc tgt tcc 953 Ser Ala Tyr Leu Glu Asn Ser Lys Gly Ala Pro Asn Asn Ser Cys Ser 75 80 85 gag atc aag atg aat aag aag ggc gcc cgg atc gat ttc aag gac gtg 1001 Glu Ile Lys Met Asn Lys Lys Gly Ala Arg Ile Asp Phe Lys Asp Val 90 95 100 acc tac ctg aca gag gag aag gtg tac gag atc ctg gag ctg tgc cgg 1049 Thr Tyr Leu Thr Glu Glu Lys Val Tyr Glu Ile Leu Glu Leu Cys Arg 105 110 115 gag aga gag gat tac agc cca ctg atc aga gtg atc ggc aga gtg ttc 1097 Glu Arg Glu Asp Tyr Ser Pro Leu Ile Arg Val Ile Gly Arg Val Phe 120 125 130 tct agc gcc gag gcc ctg gtg cag tcc ttt aga aag gtg aag cag cac 1145 Ser Ser Ala Glu Ala Leu Val Gln Ser Phe Arg Lys Val Lys Gln His 135 140 145 150 aca aag gag gag ctg aag tct ctg cag gcc aag gac gag gac aag gac 1193 Thr Lys Glu Glu Leu Lys Ser Leu Gln Ala Lys Asp Glu Asp Lys Asp 155 160 165 gag gac gag aag gag aag gca gcc tgt tct gcc gca gca atg gag gag 1241 Glu Asp Glu Lys Glu Lys Ala Ala Cys Ser Ala Ala Ala Met Glu Glu 170 175 180 gac agc gag gca tcc tct agc cgg atc ggc gat tcc tct caa ggc gac 1289 Asp Ser Glu Ala Ser Ser Ser Arg Ile Gly Asp Ser Ser Gln Gly Asp 185 190 195 aac aat ctg cag aag ctg ggc ccc gac gac gtg agc gtg gat atc gac 1337 Asn Asn Leu Gln Lys Leu Gly Pro Asp Asp Val Ser Val Asp Ile Asp 200 205 210 gcc atc cgg aga gtg tac aca aga ctg ctg agc aac gag aag atc gag 1385 Ala Ile Arg Arg Val Tyr Thr Arg Leu Leu Ser Asn Glu Lys Ile Glu 215 220 225 230 acc gcc ttc ctg aac gcc ctg gtg tat ctg agc cct aat gtg gag tgc 1433 Thr Ala Phe Leu Asn Ala Leu Val Tyr Leu Ser Pro Asn Val Glu Cys 235 240 245 gat ctg acc tac cac aac gtg tac tcc cgg gac cca aac tac ctg aat 1481 Asp Leu Thr Tyr His Asn Val Tyr Ser Arg Asp Pro Asn Tyr Leu Asn 250 255 260 ctg ttc atc atc gtg atg gag aac aga aat ctg cac tcc ccc gag tat 1529 Leu Phe Ile Ile Val Met Glu Asn Arg Asn Leu His Ser Pro Glu Tyr 265 270 275 ctg gag atg gcc ctg cct ctg ttt tgt aag gcc atg tcc aag ctg cct 1577 Leu Glu Met Ala Leu Pro Leu Phe Cys Lys Ala Met Ser Lys Leu Pro 280 285 290 ctg gca gca cag ggc aag ctg atc agg ctg tgg tct aag tac aac gcc 1625 Leu Ala Ala Gln Gly Lys Leu Ile Arg Leu Trp Ser Lys Tyr Asn Ala 295 300 305 310 gat cag atc agg cgc atg atg gag acc ttc cag cag ctg atc aca tac 1673 Asp Gln Ile Arg Arg Met Met Glu Thr Phe Gln Gln Leu Ile Thr Tyr 315 320 325 aaa gtg atc tct aac gag ttt aat agc cgc aac ctg gtg aac gac gac 1721 Lys Val Ile Ser Asn Glu Phe Asn Ser Arg Asn Leu Val Asn Asp Asp 330 335 340 gac gcc atc gtg gcc gcc tct aag tgc ctg aag atg gtg tac tac gcc 1769 Asp Ala Ile Val Ala Ala Ser Lys Cys Leu Lys Met Val Tyr Tyr Ala 345 350 355 aac gtg gtg ggc ggc gag gtg gac aca aac cac aac gag gag gac gac 1817 Asn Val Val Gly Gly Glu Val Asp Thr Asn His Asn Glu Glu Asp Asp 360 365 370 gag gag cca atc ccc gag agc tcc gag ctg acc ctg cag gag ctg ctg 1865 Glu Glu Pro Ile Pro Glu Ser Ser Glu Leu Thr Leu Gln Glu Leu Leu 375 380 385 390 gga gag gag cgg aga aat aag aag gga cca agg gtg gat cct ctg gag 1913 Gly Glu Glu Arg Arg Asn Lys Lys Gly Pro Arg Val Asp Pro Leu Glu 395 400 405 acc gag ctg ggc gtg aag aca ctg gac tgc aga aag cct ctg atc cca 1961 Thr Glu Leu Gly Val Lys Thr Leu Asp Cys Arg Lys Pro Leu Ile Pro 410 415 420 ttc gag gag ttt atc aac gag ccc ctg aac gag gtg ctg gag atg gat 2009 Phe Glu Glu Phe Ile Asn Glu Pro Leu Asn Glu Val Leu Glu Met Asp 425 430 435 aag gac tac acc ttc ttt aag gtg gag aca gag aac aag ttc agc ttt 2057 Lys Asp Tyr Thr Phe Phe Lys Val Glu Thr Glu Asn Lys Phe Ser Phe 440 445 450 atg acc tgt cct ttc atc ctg aac gcc gtg acc aag aat ctg ggc ctg 2105 Met Thr Cys Pro Phe Ile Leu Asn Ala Val Thr Lys Asn Leu Gly Leu 455 460 465 470 tac tac gat aac agg atc cgc atg tac tcc gag agg cgc atc acc gtg 2153 Tyr Tyr Asp Asn Arg Ile Arg Met Tyr Ser Glu Arg Arg Ile Thr Val 475 480 485 ctg tat tct ctg gtg cag ggc cag cag ctg aat cct tac ctg agg ctg 2201 Leu Tyr Ser Leu Val Gln Gly Gln Gln Leu Asn Pro Tyr Leu Arg Leu 490 495 500 aag gtg cgg aga gac cac atc atc gat gac gcc ctg gtg cgc ctg gag 2249 Lys Val Arg Arg Asp His Ile Ile Asp Asp Ala Leu Val Arg Leu Glu 505 510 515 atg atc gcc atg gag aat cca gcc gat ctg aag aag cag ctg tac gtg 2297 Met Ile Ala Met Glu Asn Pro Ala Asp Leu Lys Lys Gln Leu Tyr Val 520 525 530 gag ttt gag gga gag cag gga gtg gac gag gga ggc gtg tct aag gag 2345 Glu Phe Glu Gly Glu Gln Gly Val Asp Glu Gly Gly Val Ser Lys Glu 535 540 545 550 ttc ttt cag ctg gtg gtg gag gag atc ttc aac ccc gat atc ggc atg 2393 Phe Phe Gln Leu Val Val Glu Glu Ile Phe Asn Pro Asp Ile Gly Met 555 560 565 ttt acc tac gac gag agc aca aag ctg ttc tgg ttt aat cct tct tcc 2441 Phe Thr Tyr Asp Glu Ser Thr Lys Leu Phe Trp Phe Asn Pro Ser Ser 570 575 580 ttc gag acc gag ggc cag ttt aca ctg atc ggc atc gtg ctg ggc ctg 2489 Phe Glu Thr Glu Gly Gln Phe Thr Leu Ile Gly Ile Val Leu Gly Leu 585 590 595 gcc atc tac aac aat tgt atc ctg gac gtg cac ttc cca atg gtg gtg 2537 Ala Ile Tyr Asn Asn Cys Ile Leu Asp Val His Phe Pro Met Val Val 600 605 610 tat agg aag ctg atg ggc aag aag ggc acc ttt cgc gat ctg ggc gac 2585 Tyr Arg Lys Leu Met Gly Lys Lys Gly Thr Phe Arg Asp Leu Gly Asp 615 620 625 630 tcc cac ccc gtg ctg tac cag tct ctg aag gat ctg ctg gag tat gag 2633 Ser His Pro Val Leu Tyr Gln Ser Leu Lys Asp Leu Leu Glu Tyr Glu 635 640 645 ggc aac gtg gag gat gac atg atg atc acc ttc cag atc tcc cag aca 2681 Gly Asn Val Glu Asp Asp Met Met Ile Thr Phe Gln Ile Ser Gln Thr 650 655 660 gac ctg ttt ggc aac cca atg atg tac gat ctg aag gag aac ggc gac 2729 Asp Leu Phe Gly Asn Pro Met Met Tyr Asp Leu Lys Glu Asn Gly Asp 665 670 675 aag atc ccc atc aca aac gag aat aga aag gag ttc gtg aac ctg tac 2777 Lys Ile Pro Ile Thr Asn Glu Asn Arg Lys Glu Phe Val Asn Leu Tyr 680 685 690 agc gat tat atc ctg aat aag tcc gtg gag aag cag ttc aag gcc ttt 2825 Ser Asp Tyr Ile Leu Asn Lys Ser Val Glu Lys Gln Phe Lys Ala Phe 695 700 705 710 agg cgc ggc ttc cac atg gtg acc aac gag agc cct ctg aag tat ctg 2873 Arg Arg Gly Phe His Met Val Thr Asn Glu Ser Pro Leu Lys Tyr Leu 715 720 725 ttt agg cca gag gag atc gag ctg ctg atc tgc ggc tcc cgc aat ctg 2921 Phe Arg Pro Glu Glu Ile Glu Leu Leu Ile Cys Gly Ser Arg Asn Leu 730 735 740 gac ttt cag gcc ctg gag gag acc aca gag tac gac ggc ggc tat acc 2969 Asp Phe Gln Ala Leu Glu Glu Thr Thr Glu Tyr Asp Gly Gly Tyr Thr 745 750 755 agg gac tct gtg ctg atc cgc gag ttc tgg gag atc gtg cac agc ttt 3017 Arg Asp Ser Val Leu Ile Arg Glu Phe Trp Glu Ile Val His Ser Phe 760 765 770 aca gac gag cag aag cgg ctg ttc ctg cag ttt acc acc ggc acc gac 3065 Thr Asp Glu Gln Lys Arg Leu Phe Leu Gln Phe Thr Thr Gly Thr Asp 775 780 785 790 aga gca cca gtg gga gga ctg ggc aag ctg aag atg atc atc gcc aag 3113 Arg Ala Pro Val Gly Gly Leu Gly Lys Leu Lys Met Ile Ile Ala Lys 795 800 805 aac ggc cca gac aca gag agg ctg ccc acc agc cac acc tgt ttc aac 3161 Asn Gly Pro Asp Thr Glu Arg Leu Pro Thr Ser His Thr Cys Phe Asn 810 815 820 gtg ctg ctg ctg ccc gag tac tcc tct aag gag aag ctg aag gag cgc 3209 Val Leu Leu Leu Pro Glu Tyr Ser Ser Lys Glu Lys Leu Lys Glu Arg 825 830 835 ctg ctg aag gcc atc acc tac gcc aag ggc ttt ggc atg ctg tga tga 3257 Leu Leu Lys Ala Ile Thr Tyr Ala Lys Gly Phe Gly Met Leu 840 845 850 ggtaccagtg aattctacca gtgccatagg atagtgaatt ctaccagtgc catacacgtg 3317 agtgaattct accagtgcca tagcatgcag tgaattctac cagtgccata ggcggccgct 3377 tcgagcagac atgataagat acattgatga gtttggacaa accacaacta gaatgcagtg 3437 aaaaaaatgc tttatttgtg aaatttgtga tgctattgct ttatttgtaa ccattataag 3497 ctgcaataaa caagttaaca acaacaattg cattcatttt atgtttcagg ttcaggggga 3557 gatgtgggag gttttttaaa gcaagtaaaa cctctacaaa tgtggtaaaa tcgataagga 3617 tcttcctaga gcatggctac gtagataagt agcatggcgg gttaatcatt aactacaagg 3677 aacccctagt gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg 3737 ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag 3797 cgcgcag 3804 <210> 2 <211> 852 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 2 Met Lys Arg Ala Ala Ala Lys His Leu Ile Glu Arg Tyr Tyr His Gln 1 5 10 15 Leu Thr Glu Gly Cys Gly Asn Glu Ala Cys Thr Asn Glu Phe Cys Ala 20 25 30 Ser Cys Pro Thr Phe Leu Arg Met Asp Asn Asn Ala Ala Ala Ile Lys 35 40 45 Ala Leu Glu Leu Tyr Lys Ile Asn Ala Lys Leu Cys Asp Pro His Pro 50 55 60 Ser Lys Lys Gly Ala Ser Ser Ala Tyr Leu Glu Asn Ser Lys Gly Ala 65 70 75 80 Pro Asn Asn Ser Cys Ser Glu Ile Lys Met Asn Lys Lys Gly Ala Arg 85 90 95 Ile Asp Phe Lys Asp Val Thr Tyr Leu Thr Glu Glu Lys Val Tyr Glu 100 105 110 Ile Leu Glu Leu Cys Arg Glu Arg Glu Asp Tyr Ser Pro Leu Ile Arg 115 120 125 Val Ile Gly Arg Val Phe Ser Ser Ala Glu Ala Leu Val Gln Ser Phe 130 135 140 Arg Lys Val Lys Gln His Thr Lys Glu Glu Leu Lys Ser Leu Gln Ala 145 150 155 160 Lys Asp Glu Asp Lys Asp Glu Asp Glu Lys Glu Lys Ala Ala Cys Ser 165 170 175 Ala Ala Ala Met Glu Glu Asp Ser Glu Ala Ser Ser Ser Arg Ile Gly 180 185 190 Asp Ser Ser Gln Gly Asp Asn Asn Leu Gln Lys Leu Gly Pro Asp Asp 195 200 205 Val Ser Val Asp Ile Asp Ala Ile Arg Arg Val Tyr Thr Arg Leu Leu 210 215 220 Ser Asn Glu Lys Ile Glu Thr Ala Phe Leu Asn Ala Leu Val Tyr Leu 225 230 235 240 Ser Pro Asn Val Glu Cys Asp Leu Thr Tyr His Asn Val Tyr Ser Arg 245 250 255 Asp Pro Asn Tyr Leu Asn Leu Phe Ile Ile Val Met Glu Asn Arg Asn 260 265 270 Leu His Ser Pro Glu Tyr Leu Glu Met Ala Leu Pro Leu Phe Cys Lys 275 280 285 Ala Met Ser Lys Leu Pro Leu Ala Ala Gln Gly Lys Leu Ile Arg Leu 290 295 300 Trp Ser Lys Tyr Asn Ala Asp Gln Ile Arg Arg Met Met Glu Thr Phe 305 310 315 320 Gln Gln Leu Ile Thr Tyr Lys Val Ile Ser Asn Glu Phe Asn Ser Arg 325 330 335 Asn Leu Val Asn Asp Asp Asp Ala Ile Val Ala Ala Ser Lys Cys Leu 340 345 350 Lys Met Val Tyr Tyr Ala Asn Val Val Gly Gly Glu Val Asp Thr Asn 355 360 365 His Asn Glu Glu Asp Asp Glu Glu Pro Ile Pro Glu Ser Ser Glu Leu 370 375 380 Thr Leu Gln Glu Leu Leu Gly Glu Glu Arg Arg Asn Lys Lys Gly Pro 385 390 395 400 Arg Val Asp Pro Leu Glu Thr Glu Leu Gly Val Lys Thr Leu Asp Cys 405 410 415 Arg Lys Pro Leu Ile Pro Phe Glu Glu Phe Ile Asn Glu Pro Leu Asn 420 425 430 Glu Val Leu Glu Met Asp Lys Asp Tyr Thr Phe Phe Lys Val Glu Thr 435 440 445 Glu Asn Lys Phe Ser Phe Met Thr Cys Pro Phe Ile Leu Asn Ala Val 450 455 460 Thr Lys Asn Leu Gly Leu Tyr Tyr Asp Asn Arg Ile Arg Met Tyr Ser 465 470 475 480 Glu Arg Arg Ile Thr Val Leu Tyr Ser Leu Val Gln Gly Gln Gln Leu 485 490 495 Asn Pro Tyr Leu Arg Leu Lys Val Arg Arg Asp His Ile Ile Asp Asp 500 505 510 Ala Leu Val Arg Leu Glu Met Ile Ala Met Glu Asn Pro Ala Asp Leu 515 520 525 Lys Lys Gln Leu Tyr Val Glu Phe Glu Gly Glu Gln Gly Val Asp Glu 530 535 540 Gly Gly Val Ser Lys Glu Phe Phe Gln Leu Val Val Glu Glu Ile Phe 545 550 555 560 Asn Pro Asp Ile Gly Met Phe Thr Tyr Asp Glu Ser Thr Lys Leu Phe 565 570 575 Trp Phe Asn Pro Ser Ser Phe Glu Thr Glu Gly Gln Phe Thr Leu Ile 580 585 590 Gly Ile Val Leu Gly Leu Ala Ile Tyr Asn Asn Cys Ile Leu Asp Val 595 600 605 His Phe Pro Met Val Val Tyr Arg Lys Leu Met Gly Lys Lys Gly Thr 610 615 620 Phe Arg Asp Leu Gly Asp Ser His Pro Val Leu Tyr Gln Ser Leu Lys 625 630 635 640 Asp Leu Leu Glu Tyr Glu Gly Asn Val Glu Asp Asp Met Met Ile Thr 645 650 655 Phe Gln Ile Ser Gln Thr Asp Leu Phe Gly Asn Pro Met Met Tyr Asp 660 665 670 Leu Lys Glu Asn Gly Asp Lys Ile Pro Ile Thr Asn Glu Asn Arg Lys 675 680 685 Glu Phe Val Asn Leu Tyr Ser Asp Tyr Ile Leu Asn Lys Ser Val Glu 690 695 700 Lys Gln Phe Lys Ala Phe Arg Arg Gly Phe His Met Val Thr Asn Glu 705 710 715 720 Ser Pro Leu Lys Tyr Leu Phe Arg Pro Glu Glu Ile Glu Leu Leu Ile 725 730 735 Cys Gly Ser Arg Asn Leu Asp Phe Gln Ala Leu Glu Glu Thr Thr Glu 740 745 750 Tyr Asp Gly Gly Tyr Thr Arg Asp Ser Val Leu Ile Arg Glu Phe Trp 755 760 765 Glu Ile Val His Ser Phe Thr Asp Glu Gln Lys Arg Leu Phe Leu Gln 770 775 780 Phe Thr Thr Gly Thr Asp Arg Ala Pro Val Gly Gly Leu Gly Lys Leu 785 790 795 800 Lys Met Ile Ile Ala Lys Asn Gly Pro Asp Thr Glu Arg Leu Pro Thr 805 810 815 Ser His Thr Cys Phe Asn Val Leu Leu Leu Pro Glu Tyr Ser Ser Lys 820 825 830 Glu Lys Leu Lys Glu Arg Leu Leu Lys Ala Ile Thr Tyr Ala Lys Gly 835 840 845 Phe Gly Met Leu 850 <210> 3 <211> 3700 <212> DNA <213> Artificial Sequence <220> <223> vector genome hSyn.hUbe3a-1.GSco.SV40 <220> <221> repeat_region <222> (1)..(130) <223> ITR <220> <221> promoter <222> (213)..(678) <223> hSynapsin promoter <220> <221> misc_feature <222> (690)..(695) <223> Kozak <220> <221> CDS <222> (696)..(3257) <223> hUBE3a-1 <220> <221> misc_feature <222> (779)..(779) <223> mut <220> <221> misc_feature <222> (824)..(824) <223> mut <220> <221> misc_feature <222> (1028)..(1028) <223> mut <220> <221> misc_feature <222> (1181)..(1181) <223> mut <220> <221> misc_feature <222> (1193)..(1193) <223> mut <220> <221> misc_feature <222> (1217)..(1217) <223> mut <220> <221> misc_feature <222> (1283)..(1283) <223> mut SD/AS <220> <221> misc_feature <222> (1715)..(1715) <223> mut <220> <221> misc_feature <222> (1721)..(1721) <223> mut <220> <221> misc_feature <222> (1766)..(1766) <223> mut <220> <221> misc_feature <222> (1805)..(1805) <223> mut <220> <221> misc_feature <222> (1814)..(1814) <223> mut <220> <221> misc_feature <222> (1991)..(1991) <223> mut <220> <221> misc_feature <222> (2063)..(2063) <223> mut <220> <221> misc_feature <222> (2111)..(2111) <223> mut <220> <221> misc_feature <222> (2294)..(2294) <223> mut <220> <221> misc_feature <222> (2439)..(2440) <223> mut SD/AS <220> <221> misc_feature <222> (2723)..(2723) <223> mut <220> <221> misc_feature <222> (2957)..(2957) <223> mut <220> <221> misc_feature <222> (3023)..(3023) <223> mut <220> <221> misc_feature <222> (3056)..(3056) <223> mut SD/AS <220> <221> misc_feature <222> (3152)..(3152) <223> mut <220> <221> misc_feature <222> (3161)..(3161) <223> mut <220> <221> misc_feature <222> (3230)..(3230) <223> mut <220> <221> polyA_signal <222> (3275)..(3700) <223> SV40 polyA <220> <221> repeat_region <222> (3571)..(3700) <223> ITR <400> 3 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatcc tctagaacta tagctagcat gcctgcagag ggccctgcgt atgagtgcaa 240 gtgggtttta ggaccaggat gaggcggggt gggggtgcct acctgacgac cgaccccgac 300 ccactggaca agcacccaac ccccattccc caaattgcgc atcccctatc agagaggggg 360 aggggaaaca ggatgcggcg aggcgcgtgc gcactgccag cttcagcacc gcggacagtg 420 ccttcgcccc cgcctggcgg cgcgcgccac cgccgcctca gcactgaagg cgcgctgacg 480 tcactcgccg gtcccccgca aactcccctt cccggccacc ttggtcgcgt ccgcgccgcc 540 gccggcccag ccggaccgca ccacgcgagg cgcgagatag gggggcacgg gcgcgaccat 600 ctgcgctgcg gcgccggcga ctcagcgctg cctcagtctg cggtgggcag cggaggagtc 660 gtgtcgtgcc tgagagcgca gtcgaattcg ccacc atg aag agg gca gca gca 713 Met Lys Arg Ala Ala Ala 1 5 aag cac ctg atc gag aga tac tat cac cag ctg acc gag gga tgc gga 761 Lys His Leu Ile Glu Arg Tyr Tyr His Gln Leu Thr Glu Gly Cys Gly 10 15 20 aac gag gca tgt aca aac gag ttc tgc gcc tcc tgt ccc acc ttt ctg 809 Asn Glu Ala Cys Thr Asn Glu Phe Cys Ala Ser Cys Pro Thr Phe Leu 25 30 35 agg atg gat aac aac gcc gcc gcc atc aag gcc ctg gag ctg tac aag 857 Arg Met Asp Asn Asn Ala Ala Ala Ile Lys Ala Leu Glu Leu Tyr Lys 40 45 50 atc aac gcc aag ctg tgc gac ccc cac cct agc aag aag ggc gcc agc 905 Ile Asn Ala Lys Leu Cys Asp Pro His Pro Ser Lys Lys Gly Ala Ser 55 60 65 70 tcc gcc tat ctg gag aac tcc aag ggc gcc cct aac aat agc tgt tcc 953 Ser Ala Tyr Leu Glu Asn Ser Lys Gly Ala Pro Asn Asn Ser Cys Ser 75 80 85 gag atc aag atg aat aag aag ggc gcc cgg atc gat ttc aag gac gtg 1001 Glu Ile Lys Met Asn Lys Lys Gly Ala Arg Ile Asp Phe Lys Asp Val 90 95 100 acc tac ctg aca gag gag aag gtg tac gag atc ctg gag ctg tgc cgg 1049 Thr Tyr Leu Thr Glu Glu Lys Val Tyr Glu Ile Leu Glu Leu Cys Arg 105 110 115 gag aga gag gat tac agc cca ctg atc aga gtg atc ggc aga gtg ttc 1097 Glu Arg Glu Asp Tyr Ser Pro Leu Ile Arg Val Ile Gly Arg Val Phe 120 125 130 tct agc gcc gag gcc ctg gtg cag tcc ttt aga aag gtg aag cag cac 1145 Ser Ser Ala Glu Ala Leu Val Gln Ser Phe Arg Lys Val Lys Gln His 135 140 145 150 aca aag gag gag ctg aag tct ctg cag gcc aag gac gag gac aag gac 1193 Thr Lys Glu Glu Leu Lys Ser Leu Gln Ala Lys Asp Glu Asp Lys Asp 155 160 165 gag gac gag aag gag aag gca gcc tgt tct gcc gca gca atg gag gag 1241 Glu Asp Glu Lys Glu Lys Ala Ala Cys Ser Ala Ala Ala Met Glu Glu 170 175 180 gac agc gag gca tcc tct agc cgg atc ggc gat tcc tct caa ggc gac 1289 Asp Ser Glu Ala Ser Ser Ser Arg Ile Gly Asp Ser Ser Gln Gly Asp 185 190 195 aac aat ctg cag aag ctg ggc ccc gac gac gtg agc gtg gat atc gac 1337 Asn Asn Leu Gln Lys Leu Gly Pro Asp Asp Val Ser Val Asp Ile Asp 200 205 210 gcc atc cgg aga gtg tac aca aga ctg ctg agc aac gag aag atc gag 1385 Ala Ile Arg Arg Val Tyr Thr Arg Leu Leu Ser Asn Glu Lys Ile Glu 215 220 225 230 acc gcc ttc ctg aac gcc ctg gtg tat ctg agc cct aat gtg gag tgc 1433 Thr Ala Phe Leu Asn Ala Leu Val Tyr Leu Ser Pro Asn Val Glu Cys 235 240 245 gat ctg acc tac cac aac gtg tac tcc cgg gac cca aac tac ctg aat 1481 Asp Leu Thr Tyr His Asn Val Tyr Ser Arg Asp Pro Asn Tyr Leu Asn 250 255 260 ctg ttc atc atc gtg atg gag aac aga aat ctg cac tcc ccc gag tat 1529 Leu Phe Ile Ile Val Met Glu Asn Arg Asn Leu His Ser Pro Glu Tyr 265 270 275 ctg gag atg gcc ctg cct ctg ttt tgt aag gcc atg tcc aag ctg cct 1577 Leu Glu Met Ala Leu Pro Leu Phe Cys Lys Ala Met Ser Lys Leu Pro 280 285 290 ctg gca gca cag ggc aag ctg atc agg ctg tgg tct aag tac aac gcc 1625 Leu Ala Ala Gln Gly Lys Leu Ile Arg Leu Trp Ser Lys Tyr Asn Ala 295 300 305 310 gat cag atc agg cgc atg atg gag acc ttc cag cag ctg atc aca tac 1673 Asp Gln Ile Arg Arg Met Met Glu Thr Phe Gln Gln Leu Ile Thr Tyr 315 320 325 aaa gtg atc tct aac gag ttt aat agc cgc aac ctg gtg aac gac gac 1721 Lys Val Ile Ser Asn Glu Phe Asn Ser Arg Asn Leu Val Asn Asp Asp 330 335 340 gac gcc atc gtg gcc gcc tct aag tgc ctg aag atg gtg tac tac gcc 1769 Asp Ala Ile Val Ala Ala Ser Lys Cys Leu Lys Met Val Tyr Tyr Ala 345 350 355 aac gtg gtg ggc ggc gag gtg gac aca aac cac aac gag gag gac gac 1817 Asn Val Val Gly Gly Glu Val Asp Thr Asn His Asn Glu Glu Asp Asp 360 365 370 gag gag cca atc ccc gag agc tcc gag ctg acc ctg cag gag ctg ctg 1865 Glu Glu Pro Ile Pro Glu Ser Ser Glu Leu Thr Leu Gln Glu Leu Leu 375 380 385 390 gga gag gag cgg aga aat aag aag gga cca agg gtg gat cct ctg gag 1913 Gly Glu Glu Arg Arg Asn Lys Lys Gly Pro Arg Val Asp Pro Leu Glu 395 400 405 acc gag ctg ggc gtg aag aca ctg gac tgc aga aag cct ctg atc cca 1961 Thr Glu Leu Gly Val Lys Thr Leu Asp Cys Arg Lys Pro Leu Ile Pro 410 415 420 ttc gag gag ttt atc aac gag ccc ctg aac gag gtg ctg gag atg gat 2009 Phe Glu Glu Phe Ile Asn Glu Pro Leu Asn Glu Val Leu Glu Met Asp 425 430 435 aag gac tac acc ttc ttt aag gtg gag aca gag aac aag ttc agc ttt 2057 Lys Asp Tyr Thr Phe Phe Lys Val Glu Thr Glu Asn Lys Phe Ser Phe 440 445 450 atg acc tgt cct ttc atc ctg aac gcc gtg acc aag aat ctg ggc ctg 2105 Met Thr Cys Pro Phe Ile Leu Asn Ala Val Thr Lys Asn Leu Gly Leu 455 460 465 470 tac tac gat aac agg atc cgc atg tac tcc gag agg cgc atc acc gtg 2153 Tyr Tyr Asp Asn Arg Ile Arg Met Tyr Ser Glu Arg Arg Ile Thr Val 475 480 485 ctg tat tct ctg gtg cag ggc cag cag ctg aat cct tac ctg agg ctg 2201 Leu Tyr Ser Leu Val Gln Gly Gln Gln Leu Asn Pro Tyr Leu Arg Leu 490 495 500 aag gtg cgg aga gac cac atc atc gat gac gcc ctg gtg cgc ctg gag 2249 Lys Val Arg Arg Asp His Ile Ile Asp Asp Ala Leu Val Arg Leu Glu 505 510 515 atg atc gcc atg gag aat cca gcc gat ctg aag aag cag ctg tac gtg 2297 Met Ile Ala Met Glu Asn Pro Ala Asp Leu Lys Lys Gln Leu Tyr Val 520 525 530 gag ttt gag gga gag cag gga gtg gac gag gga ggc gtg tct aag gag 2345 Glu Phe Glu Gly Glu Gln Gly Val Asp Glu Gly Gly Val Ser Lys Glu 535 540 545 550 ttc ttt cag ctg gtg gtg gag gag atc ttc aac ccc gat atc ggc atg 2393 Phe Phe Gln Leu Val Val Glu Glu Ile Phe Asn Pro Asp Ile Gly Met 555 560 565 ttt acc tac gac gag agc aca aag ctg ttc tgg ttt aat cct tct tcc 2441 Phe Thr Tyr Asp Glu Ser Thr Lys Leu Phe Trp Phe Asn Pro Ser Ser 570 575 580 ttc gag acc gag ggc cag ttt aca ctg atc ggc atc gtg ctg ggc ctg 2489 Phe Glu Thr Glu Gly Gln Phe Thr Leu Ile Gly Ile Val Leu Gly Leu 585 590 595 gcc atc tac aac aat tgt atc ctg gac gtg cac ttc cca atg gtg gtg 2537 Ala Ile Tyr Asn Asn Cys Ile Leu Asp Val His Phe Pro Met Val Val 600 605 610 tat agg aag ctg atg ggc aag aag ggc acc ttt cgc gat ctg ggc gac 2585 Tyr Arg Lys Leu Met Gly Lys Lys Gly Thr Phe Arg Asp Leu Gly Asp 615 620 625 630 tcc cac ccc gtg ctg tac cag tct ctg aag gat ctg ctg gag tat gag 2633 Ser His Pro Val Leu Tyr Gln Ser Leu Lys Asp Leu Leu Glu Tyr Glu 635 640 645 ggc aac gtg gag gat gac atg atg atc acc ttc cag atc tcc cag aca 2681 Gly Asn Val Glu Asp Asp Met Met Ile Thr Phe Gln Ile Ser Gln Thr 650 655 660 gac ctg ttt ggc aac cca atg atg tac gat ctg aag gag aac ggc gac 2729 Asp Leu Phe Gly Asn Pro Met Met Tyr Asp Leu Lys Glu Asn Gly Asp 665 670 675 aag atc ccc atc aca aac gag aat aga aag gag ttc gtg aac ctg tac 2777 Lys Ile Pro Ile Thr Asn Glu Asn Arg Lys Glu Phe Val Asn Leu Tyr 680 685 690 agc gat tat atc ctg aat aag tcc gtg gag aag cag ttc aag gcc ttt 2825 Ser Asp Tyr Ile Leu Asn Lys Ser Val Glu Lys Gln Phe Lys Ala Phe 695 700 705 710 agg cgc ggc ttc cac atg gtg acc aac gag agc cct ctg aag tat ctg 2873 Arg Arg Gly Phe His Met Val Thr Asn Glu Ser Pro Leu Lys Tyr Leu 715 720 725 ttt agg cca gag gag atc gag ctg ctg atc tgc ggc tcc cgc aat ctg 2921 Phe Arg Pro Glu Glu Ile Glu Leu Leu Ile Cys Gly Ser Arg Asn Leu 730 735 740 gac ttt cag gcc ctg gag gag acc aca gag tac gac ggc ggc tat acc 2969 Asp Phe Gln Ala Leu Glu Glu Thr Thr Glu Tyr Asp Gly Gly Tyr Thr 745 750 755 agg gac tct gtg ctg atc cgc gag ttc tgg gag atc gtg cac agc ttt 3017 Arg Asp Ser Val Leu Ile Arg Glu Phe Trp Glu Ile Val His Ser Phe 760 765 770 aca gac gag cag aag cgg ctg ttc ctg cag ttt acc acc ggc acc gac 3065 Thr Asp Glu Gln Lys Arg Leu Phe Leu Gln Phe Thr Thr Gly Thr Asp 775 780 785 790 aga gca cca gtg gga gga ctg ggc aag ctg aag atg atc atc gcc aag 3113 Arg Ala Pro Val Gly Gly Leu Gly Lys Leu Lys Met Ile Ile Ala Lys 795 800 805 aac ggc cca gac aca gag agg ctg ccc acc agc cac acc tgt ttc aac 3161 Asn Gly Pro Asp Thr Glu Arg Leu Pro Thr Ser His Thr Cys Phe Asn 810 815 820 gtg ctg ctg ctg ccc gag tac tcc tct aag gag aag ctg aag gag cgc 3209 Val Leu Leu Leu Pro Glu Tyr Ser Ser Lys Glu Lys Leu Lys Glu Arg 825 830 835 ctg ctg aag gcc atc acc tac gcc aag ggc ttt ggc atg ctg tga tga 3257 Leu Leu Lys Ala Ile Thr Tyr Ala Lys Gly Phe Gly Met Leu 840 845 850 ggtaccggcg gccgcttcga gcagacatga taagatacat tgatgagttt ggacaaacca 3317 caactagaat gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct attgctttat 3377 ttgtaaccat tataagctgc aataaacaag ttaacaacaa caattgcatt cattttatgt 3437 ttcaggttca gggggagatg tgggaggttt tttaaagcaa gtaaaacctc tacaaatgtg 3497 gtaaaatcga taaggatctt cctagagcat ggctacgtag ataagtagca tggcgggtta 3557 atcattaact acaaggaacc cctagtgatg gagttggcca ctccctctct gcgcgctcgc 3617 tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc 3677 tcagtgagcg agcgagcgcg cag 3700 <210> 4 <211> 852 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 4 Met Lys Arg Ala Ala Ala Lys His Leu Ile Glu Arg Tyr Tyr His Gln 1 5 10 15 Leu Thr Glu Gly Cys Gly Asn Glu Ala Cys Thr Asn Glu Phe Cys Ala 20 25 30 Ser Cys Pro Thr Phe Leu Arg Met Asp Asn Asn Ala Ala Ala Ile Lys 35 40 45 Ala Leu Glu Leu Tyr Lys Ile Asn Ala Lys Leu Cys Asp Pro His Pro 50 55 60 Ser Lys Lys Gly Ala Ser Ser Ala Tyr Leu Glu Asn Ser Lys Gly Ala 65 70 75 80 Pro Asn Asn Ser Cys Ser Glu Ile Lys Met Asn Lys Lys Gly Ala Arg 85 90 95 Ile Asp Phe Lys Asp Val Thr Tyr Leu Thr Glu Glu Lys Val Tyr Glu 100 105 110 Ile Leu Glu Leu Cys Arg Glu Arg Glu Asp Tyr Ser Pro Leu Ile Arg 115 120 125 Val Ile Gly Arg Val Phe Ser Ser Ala Glu Ala Leu Val Gln Ser Phe 130 135 140 Arg Lys Val Lys Gln His Thr Lys Glu Glu Leu Lys Ser Leu Gln Ala 145 150 155 160 Lys Asp Glu Asp Lys Asp Glu Asp Glu Lys Glu Lys Ala Ala Cys Ser 165 170 175 Ala Ala Ala Met Glu Glu Asp Ser Glu Ala Ser Ser Ser Arg Ile Gly 180 185 190 Asp Ser Ser Gln Gly Asp Asn Asn Leu Gln Lys Leu Gly Pro Asp Asp 195 200 205 Val Ser Val Asp Ile Asp Ala Ile Arg Arg Val Tyr Thr Arg Leu Leu 210 215 220 Ser Asn Glu Lys Ile Glu Thr Ala Phe Leu Asn Ala Leu Val Tyr Leu 225 230 235 240 Ser Pro Asn Val Glu Cys Asp Leu Thr Tyr His Asn Val Tyr Ser Arg 245 250 255 Asp Pro Asn Tyr Leu Asn Leu Phe Ile Ile Val Met Glu Asn Arg Asn 260 265 270 Leu His Ser Pro Glu Tyr Leu Glu Met Ala Leu Pro Leu Phe Cys Lys 275 280 285 Ala Met Ser Lys Leu Pro Leu Ala Ala Gln Gly Lys Leu Ile Arg Leu 290 295 300 Trp Ser Lys Tyr Asn Ala Asp Gln Ile Arg Arg Met Met Glu Thr Phe 305 310 315 320 Gln Gln Leu Ile Thr Tyr Lys Val Ile Ser Asn Glu Phe Asn Ser Arg 325 330 335 Asn Leu Val Asn Asp Asp Asp Ala Ile Val Ala Ala Ser Lys Cys Leu 340 345 350 Lys Met Val Tyr Tyr Ala Asn Val Val Gly Gly Glu Val Asp Thr Asn 355 360 365 His Asn Glu Glu Asp Asp Glu Glu Pro Ile Pro Glu Ser Ser Glu Leu 370 375 380 Thr Leu Gln Glu Leu Leu Gly Glu Glu Arg Arg Asn Lys Lys Gly Pro 385 390 395 400 Arg Val Asp Pro Leu Glu Thr Glu Leu Gly Val Lys Thr Leu Asp Cys 405 410 415 Arg Lys Pro Leu Ile Pro Phe Glu Glu Phe Ile Asn Glu Pro Leu Asn 420 425 430 Glu Val Leu Glu Met Asp Lys Asp Tyr Thr Phe Phe Lys Val Glu Thr 435 440 445 Glu Asn Lys Phe Ser Phe Met Thr Cys Pro Phe Ile Leu Asn Ala Val 450 455 460 Thr Lys Asn Leu Gly Leu Tyr Tyr Asp Asn Arg Ile Arg Met Tyr Ser 465 470 475 480 Glu Arg Arg Ile Thr Val Leu Tyr Ser Leu Val Gln Gly Gln Gln Leu 485 490 495 Asn Pro Tyr Leu Arg Leu Lys Val Arg Arg Asp His Ile Ile Asp Asp 500 505 510 Ala Leu Val Arg Leu Glu Met Ile Ala Met Glu Asn Pro Ala Asp Leu 515 520 525 Lys Lys Gln Leu Tyr Val Glu Phe Glu Gly Glu Gln Gly Val Asp Glu 530 535 540 Gly Gly Val Ser Lys Glu Phe Phe Gln Leu Val Val Glu Glu Ile Phe 545 550 555 560 Asn Pro Asp Ile Gly Met Phe Thr Tyr Asp Glu Ser Thr Lys Leu Phe 565 570 575 Trp Phe Asn Pro Ser Ser Phe Glu Thr Glu Gly Gln Phe Thr Leu Ile 580 585 590 Gly Ile Val Leu Gly Leu Ala Ile Tyr Asn Asn Cys Ile Leu Asp Val 595 600 605 His Phe Pro Met Val Val Tyr Arg Lys Leu Met Gly Lys Lys Gly Thr 610 615 620 Phe Arg Asp Leu Gly Asp Ser His Pro Val Leu Tyr Gln Ser Leu Lys 625 630 635 640 Asp Leu Leu Glu Tyr Glu Gly Asn Val Glu Asp Asp Met Met Ile Thr 645 650 655 Phe Gln Ile Ser Gln Thr Asp Leu Phe Gly Asn Pro Met Met Tyr Asp 660 665 670 Leu Lys Glu Asn Gly Asp Lys Ile Pro Ile Thr Asn Glu Asn Arg Lys 675 680 685 Glu Phe Val Asn Leu Tyr Ser Asp Tyr Ile Leu Asn Lys Ser Val Glu 690 695 700 Lys Gln Phe Lys Ala Phe Arg Arg Gly Phe His Met Val Thr Asn Glu 705 710 715 720 Ser Pro Leu Lys Tyr Leu Phe Arg Pro Glu Glu Ile Glu Leu Leu Ile 725 730 735 Cys Gly Ser Arg Asn Leu Asp Phe Gln Ala Leu Glu Glu Thr Thr Glu 740 745 750 Tyr Asp Gly Gly Tyr Thr Arg Asp Ser Val Leu Ile Arg Glu Phe Trp 755 760 765 Glu Ile Val His Ser Phe Thr Asp Glu Gln Lys Arg Leu Phe Leu Gln 770 775 780 Phe Thr Thr Gly Thr Asp Arg Ala Pro Val Gly Gly Leu Gly Lys Leu 785 790 795 800 Lys Met Ile Ile Ala Lys Asn Gly Pro Asp Thr Glu Arg Leu Pro Thr 805 810 815 Ser His Thr Cys Phe Asn Val Leu Leu Leu Pro Glu Tyr Ser Ser Lys 820 825 830 Glu Lys Leu Lys Glu Arg Leu Leu Lys Ala Ile Thr Tyr Ala Lys Gly 835 840 845 Phe Gly Met Leu 850 <210> 5 <211> 3873 <212> DNA <213> Artificial Sequence <220> <223> vector genome hSyn.hUbe3a-2.GSco.4XmiRNA183.SV40 <220> <221> repeat_region <222> (1)..(130) <223> ITR <220> <221> promoter <222> (213)..(678) <223> hSynapsin promoter <220> <221> misc_feature <222> (690)..(695) <223> Kozak <220> <221> CDS <222> (696)..(3326) <223> hUBE3a-2 <220> <221> misc_feature <222> (848)..(848) <223> mut <220> <221> misc_feature <222> (893)..(893) <223> mut <220> <221> misc_feature <222> (1097)..(1097) <223> mut <220> <221> misc_feature <222> (1250)..(1250) <223> mut <220> <221> misc_feature <222> (1262)..(1262) <223> mut <220> <221> misc_feature <222> (1286)..(1286) <223> mut <220> <221> misc_feature <222> (1352)..(1352) <223> mut SD/AS <220> <221> misc_feature <222> (1784)..(1784) <223> mut <220> <221> misc_feature <222> (1790)..(1790) <223> mut <220> <221> misc_feature <222> (1835)..(1835) <223> mut <220> <221> misc_feature <222> (1874)..(1874) <223> mut <220> <221> misc_feature <222> (1883)..(1883) <223> mut <220> <221> misc_feature <222> (2060)..(2060) <223> mut <220> <221> misc_feature <222> (2132)..(2132) <223> mut <220> <221> misc_feature <222> (2180)..(2180) <223> mut <220> <221> misc_feature <222> (2363)..(2363) <223> mut <220> <221> misc_feature <222> (2508)..(2508) <223> mut SD/AS <220> <221> misc_feature <222> (2792)..(2792) <223> mut <220> <221> misc_feature <222> (3026)..(3026) <223> mut <220> <221> misc_feature <222> (3092)..(3092) <223> mut <220> <221> misc_feature <222> (3125)..(3125) <223> mut SD/AS <220> <221> misc_feature <222> (3221)..(3221) <223> mut <220> <221> misc_feature <222> (3230)..(3230) <223> mut <220> <221> misc_feature <222> (3299)..(3299) <223> mut <220> <221> misc_feature <222> (3333)..(3354) <223> miRNA183 <220> <221> misc_feature <222> (3359)..(3380) <223> miRNA183 <220> <221> misc_feature <222> (3387)..(3408) <223> miRNA183 <220> <221> misc_feature <222> (3415)..(3436) <223> miRNA183 <220> <221> polyA_signal <222> (3448)..(3679) <223> SV40 polyA <220> <221> repeat_region <222> (3744)..(3873) <223> ITR <400> 5 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatcc tctagaacta tagctagcat gcctgcagag ggccctgcgt atgagtgcaa 240 gtgggtttta ggaccaggat gaggcggggt gggggtgcct acctgacgac cgaccccgac 300 ccactggaca agcacccaac ccccattccc caaattgcgc atcccctatc agagaggggg 360 aggggaaaca ggatgcggcg aggcgcgtgc gcactgccag cttcagcacc gcggacagtg 420 ccttcgcccc cgcctggcgg cgcgcgccac cgccgcctca gcactgaagg cgcgctgacg 480 tcactcgccg gtcccccgca aactcccctt cccggccacc ttggtcgcgt ccgcgccgcc 540 gccggcccag ccggaccgca ccacgcgagg cgcgagatag gggggcacgg gcgcgaccat 600 ctgcgctgcg gcgccggcga ctcagcgctg cctcagtctg cggtgggcag cggaggagtc 660 gtgtcgtgcc tgagagcgca gtcgaattcg ccacc atg gag aag ctg cac cag 713 Met Glu Lys Leu His Gln 1 5 tgc tac tgg aag tct ggc gag cct cag agc gac gat atc gag gca agc 761 Cys Tyr Trp Lys Ser Gly Glu Pro Gln Ser Asp Asp Ile Glu Ala Ser 10 15 20 agg atg aag aga gca gca gcc aag cac ctg atc gag cgg tac tat cac 809 Arg Met Lys Arg Ala Ala Ala Lys His Leu Ile Glu Arg Tyr Tyr His 25 30 35 cag ctg acc gag ggc tgc gga aac gag gcc tgt aca aac gag ttc tgc 857 Gln Leu Thr Glu Gly Cys Gly Asn Glu Ala Cys Thr Asn Glu Phe Cys 40 45 50 gcc tcc tgt cca acc ttt ctg aga atg gat aac aac gcc gcc gcc atc 905 Ala Ser Cys Pro Thr Phe Leu Arg Met Asp Asn Asn Ala Ala Ala Ile 55 60 65 70 aag gcc ctg gag ctg tac aag atc aac gcc aag ctg tgc gac ccc cac 953 Lys Ala Leu Glu Leu Tyr Lys Ile Asn Ala Lys Leu Cys Asp Pro His 75 80 85 cct tct aag aag ggc gcc agc tcc gcc tat ctg gag aac agc aag ggc 1001 Pro Ser Lys Lys Gly Ala Ser Ser Ala Tyr Leu Glu Asn Ser Lys Gly 90 95 100 gcc ccc aac aat agc tgt tcc gag atc aag atg aat aag aag ggc gcc 1049 Ala Pro Asn Asn Ser Cys Ser Glu Ile Lys Met Asn Lys Lys Gly Ala 105 110 115 agg atc gat ttc aag gac gtg acc tac ctg aca gag gag aag gtg tac 1097 Arg Ile Asp Phe Lys Asp Val Thr Tyr Leu Thr Glu Glu Lys Val Tyr 120 125 130 gag atc ctg gag ctg tgc cgg gag aga gag gat tac tcc cct ctg atc 1145 Glu Ile Leu Glu Leu Cys Arg Glu Arg Glu Asp Tyr Ser Pro Leu Ile 135 140 145 150 aga gtg atc gga cgc gtg ttc tct agc gcc gag gcc ctg gtg cag agc 1193 Arg Val Ile Gly Arg Val Phe Ser Ser Ala Glu Ala Leu Val Gln Ser 155 160 165 ttt cgc aag gtg aag cag cac aca aag gag gag ctg aag tcc ctg cag 1241 Phe Arg Lys Val Lys Gln His Thr Lys Glu Glu Leu Lys Ser Leu Gln 170 175 180 gcc aag gac gag gac aag gac gag gac gag aag gag aag gca gct tgt 1289 Ala Lys Asp Glu Asp Lys Asp Glu Asp Glu Lys Glu Lys Ala Ala Cys 185 190 195 tcc gcc gca gca atg gag gag gac tct gag gcc tcc tct agc agg atc 1337 Ser Ala Ala Ala Met Glu Glu Asp Ser Glu Ala Ser Ser Ser Arg Ile 200 205 210 ggc gat tcc tct caa ggc gac aac aat ctg cag aag ctg ggc ccc gac 1385 Gly Asp Ser Ser Gln Gly Asp Asn Asn Leu Gln Lys Leu Gly Pro Asp 215 220 225 230 gac gtg agc gtg gat atc gac gcc atc cgg aga gtg tac aca cgc ctg 1433 Asp Val Ser Val Asp Ile Asp Ala Ile Arg Arg Val Tyr Thr Arg Leu 235 240 245 ctg tct aac gag aag atc gag acc gcc ttc ctg aac gcc ctg gtg tat 1481 Leu Ser Asn Glu Lys Ile Glu Thr Ala Phe Leu Asn Ala Leu Val Tyr 250 255 260 ctg tct cct aat gtg gag tgc gat ctg acc tac cac aac gtg tac agc 1529 Leu Ser Pro Asn Val Glu Cys Asp Leu Thr Tyr His Asn Val Tyr Ser 265 270 275 cgg gac cca aac tac ctg aat ctg ttc atc atc gtg atg gag aac aga 1577 Arg Asp Pro Asn Tyr Leu Asn Leu Phe Ile Ile Val Met Glu Asn Arg 280 285 290 aat ctg cac tct ccc gag tat ctg gag atg gcc ctg cct ctg ttt tgt 1625 Asn Leu His Ser Pro Glu Tyr Leu Glu Met Ala Leu Pro Leu Phe Cys 295 300 305 310 aag gcc atg agc aag ctg cca ctg gca gca cag ggc aag ctg atc agg 1673 Lys Ala Met Ser Lys Leu Pro Leu Ala Ala Gln Gly Lys Leu Ile Arg 315 320 325 ctg tgg tcc aag tac aac gcc gat cag atc agg cgc atg atg gag acc 1721 Leu Trp Ser Lys Tyr Asn Ala Asp Gln Ile Arg Arg Met Met Glu Thr 330 335 340 ttc cag cag ctg atc aca tat aaa gtg atc tcc aac gag ttt aat tct 1769 Phe Gln Gln Leu Ile Thr Tyr Lys Val Ile Ser Asn Glu Phe Asn Ser 345 350 355 aga aac ctg gtg aac gac gac gac gcc atc gtg gcc gcc agc aag tgc 1817 Arg Asn Leu Val Asn Asp Asp Asp Ala Ile Val Ala Ala Ser Lys Cys 360 365 370 ctg aag atg gtg tac tac gcc aac gtg gtg ggc ggc gag gtg gac aca 1865 Leu Lys Met Val Tyr Tyr Ala Asn Val Val Gly Gly Glu Val Asp Thr 375 380 385 390 aac cac aac gag gag gac gac gag gag cca atc ccc gag agc tcc gag 1913 Asn His Asn Glu Glu Asp Asp Glu Glu Pro Ile Pro Glu Ser Ser Glu 395 400 405 ctg acc ctg cag gag ctg ctg gga gag gag cgg aga aat aag aag gga 1961 Leu Thr Leu Gln Glu Leu Leu Gly Glu Glu Arg Arg Asn Lys Lys Gly 410 415 420 cca agg gtg gat cct ctg gag acc gag ctg ggc gtg aag aca ctg gac 2009 Pro Arg Val Asp Pro Leu Glu Thr Glu Leu Gly Val Lys Thr Leu Asp 425 430 435 tgc aga aag cct ctg atc cca ttc gag gag ttt atc aac gag ccc ctg 2057 Cys Arg Lys Pro Leu Ile Pro Phe Glu Glu Phe Ile Asn Glu Pro Leu 440 445 450 aac gag gtg ctg gag atg gat aag gac tac acc ttc ttt aag gtg gag 2105 Asn Glu Val Leu Glu Met Asp Lys Asp Tyr Thr Phe Phe Lys Val Glu 455 460 465 470 aca gag aac aag ttc agc ttt atg acc tgt cct ttc atc ctg aac gcc 2153 Thr Glu Asn Lys Phe Ser Phe Met Thr Cys Pro Phe Ile Leu Asn Ala 475 480 485 gtg acc aag aat ctg ggc ctg tac tac gat aac agg atc cgc atg tac 2201 Val Thr Lys Asn Leu Gly Leu Tyr Tyr Asp Asn Arg Ile Arg Met Tyr 490 495 500 agc gag agg cgc atc acc gtg ctg tat tcc ctg gtg cag ggc cag cag 2249 Ser Glu Arg Arg Ile Thr Val Leu Tyr Ser Leu Val Gln Gly Gln Gln 505 510 515 ctg aat cct tac ctg agg ctg aag gtg cgg aga gac cac atc atc gat 2297 Leu Asn Pro Tyr Leu Arg Leu Lys Val Arg Arg Asp His Ile Ile Asp 520 525 530 gac gcc ctg gtg cgc ctg gag atg atc gcc atg gag aat cca gcc gat 2345 Asp Ala Leu Val Arg Leu Glu Met Ile Ala Met Glu Asn Pro Ala Asp 535 540 545 550 ctg aag aag cag ctg tac gtg gag ttt gag gga gag cag gga gtg gac 2393 Leu Lys Lys Gln Leu Tyr Val Glu Phe Glu Gly Glu Gln Gly Val Asp 555 560 565 gag gga ggc gtg tcc aag gag ttc ttt cag ctg gtg gtg gag gag atc 2441 Glu Gly Gly Val Ser Lys Glu Phe Phe Gln Leu Val Val Glu Glu Ile 570 575 580 ttc aac ccc gat atc ggc atg ttt acc tac gac gag tct aca aag ctg 2489 Phe Asn Pro Asp Ile Gly Met Phe Thr Tyr Asp Glu Ser Thr Lys Leu 585 590 595 ttc tgg ttt aat cct tct tcc ttc gag acc gag ggc cag ttt aca ctg 2537 Phe Trp Phe Asn Pro Ser Ser Phe Glu Thr Glu Gly Gln Phe Thr Leu 600 605 610 atc ggc atc gtg ctg ggc ctg gcc atc tac aac aat tgt atc ctg gac 2585 Ile Gly Ile Val Leu Gly Leu Ala Ile Tyr Asn Asn Cys Ile Leu Asp 615 620 625 630 gtg cac ttc cca atg gtg gtg tat agg aag ctg atg ggc aag aag ggc 2633 Val His Phe Pro Met Val Val Tyr Arg Lys Leu Met Gly Lys Lys Gly 635 640 645 acc ttt cgc gat ctg ggc gac agc cac ccc gtg ctg tac cag tcc ctg 2681 Thr Phe Arg Asp Leu Gly Asp Ser His Pro Val Leu Tyr Gln Ser Leu 650 655 660 aag gat ctg ctg gag tat gag ggc aac gtg gag gat gac atg atg atc 2729 Lys Asp Leu Leu Glu Tyr Glu Gly Asn Val Glu Asp Asp Met Met Ile 665 670 675 acc ttc cag atc tcc cag aca gac ctg ttt ggc aac cca atg atg tac 2777 Thr Phe Gln Ile Ser Gln Thr Asp Leu Phe Gly Asn Pro Met Met Tyr 680 685 690 gat ctg aag gag aac ggc gac aag atc ccc atc aca aac gag aat agg 2825 Asp Leu Lys Glu Asn Gly Asp Lys Ile Pro Ile Thr Asn Glu Asn Arg 695 700 705 710 aag gag ttc gtg aac ctg tac tct gat tat atc ctg aat aag agc gtg 2873 Lys Glu Phe Val Asn Leu Tyr Ser Asp Tyr Ile Leu Asn Lys Ser Val 715 720 725 gag aag cag ttc aag gcc ttt agg cgc ggc ttc cac atg gtg acc aac 2921 Glu Lys Gln Phe Lys Ala Phe Arg Arg Gly Phe His Met Val Thr Asn 730 735 740 gag tct cct ctg aag tat ctg ttt agg cca gag gag atc gag ctg ctg 2969 Glu Ser Pro Leu Lys Tyr Leu Phe Arg Pro Glu Glu Ile Glu Leu Leu 745 750 755 atc tgc ggc agc cgc aat ctg gac ttt cag gcc ctg gag gag acc aca 3017 Ile Cys Gly Ser Arg Asn Leu Asp Phe Gln Ala Leu Glu Glu Thr Thr 760 765 770 gag tac gac ggc ggc tat acc cgg gac tcc gtg ctg atc aga gag ttc 3065 Glu Tyr Asp Gly Gly Tyr Thr Arg Asp Ser Val Leu Ile Arg Glu Phe 775 780 785 790 tgg gag atc gtg cac tct ttt aca gac gag cag aag cgg ctg ttc ctg 3113 Trp Glu Ile Val His Ser Phe Thr Asp Glu Gln Lys Arg Leu Phe Leu 795 800 805 cag ttt acc acc ggc acc gac aga gca cca gtg gga gga ctg ggc aag 3161 Gln Phe Thr Thr Gly Thr Asp Arg Ala Pro Val Gly Gly Leu Gly Lys 810 815 820 ctg aag atg atc atc gcc aag aac ggc cca gac aca gag agg ctg ccc 3209 Leu Lys Met Ile Ile Ala Lys Asn Gly Pro Asp Thr Glu Arg Leu Pro 825 830 835 acc agc cac acc tgt ttc aac gtg ctg ctg ctg ccc gag tac tcc tct 3257 Thr Ser His Thr Cys Phe Asn Val Leu Leu Leu Pro Glu Tyr Ser Ser 840 845 850 aag gag aag ctg aag gag cgc ctg ctg aag gcc atc acc tac gcc aag 3305 Lys Glu Lys Leu Lys Glu Arg Leu Leu Lys Ala Ile Thr Tyr Ala Lys 855 860 865 870 ggc ttt ggc atg ctg tga tga ggtaccagtg aattctacca gtgccatagg 3356 Gly Phe Gly Met Leu 875 atagtgaatt ctaccagtgc catacacgtg agtgaattct accagtgcca tagcatgcag 3416 tgaattctac cagtgccata ggcggccgct tcgagcagac atgataagat acattgatga 3476 gtttggacaa accacaacta gaatgcagtg aaaaaaatgc tttatttgtg aaatttgtga 3536 tgctattgct ttatttgtaa ccattataag ctgcaataaa caagttaaca acaacaattg 3596 cattcatttt atgtttcagg ttcaggggga gatgtgggag gttttttaaa gcaagtaaaa 3656 cctctacaaa tgtggtaaaa tcgataagga tcttcctaga gcatggctac gtagataagt 3716 agcatggcgg gttaatcatt aactacaagg aacccctagt gatggagttg gccactccct 3776 ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggct 3836 ttgcccgggc ggcctcagtg agcgagcgag cgcgcag 3873 <210> 6 <211> 875 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 6 Met Glu Lys Leu His Gln Cys Tyr Trp Lys Ser Gly Glu Pro Gln Ser 1 5 10 15 Asp Asp Ile Glu Ala Ser Arg Met Lys Arg Ala Ala Ala Lys His Leu 20 25 30 Ile Glu Arg Tyr Tyr His Gln Leu Thr Glu Gly Cys Gly Asn Glu Ala 35 40 45 Cys Thr Asn Glu Phe Cys Ala Ser Cys Pro Thr Phe Leu Arg Met Asp 50 55 60 Asn Asn Ala Ala Ala Ile Lys Ala Leu Glu Leu Tyr Lys Ile Asn Ala 65 70 75 80 Lys Leu Cys Asp Pro His Pro Ser Lys Lys Gly Ala Ser Ser Ala Tyr 85 90 95 Leu Glu Asn Ser Lys Gly Ala Pro Asn Asn Ser Cys Ser Glu Ile Lys 100 105 110 Met Asn Lys Lys Gly Ala Arg Ile Asp Phe Lys Asp Val Thr Tyr Leu 115 120 125 Thr Glu Glu Lys Val Tyr Glu Ile Leu Glu Leu Cys Arg Glu Arg Glu 130 135 140 Asp Tyr Ser Pro Leu Ile Arg Val Ile Gly Arg Val Phe Ser Ser Ala 145 150 155 160 Glu Ala Leu Val Gln Ser Phe Arg Lys Val Lys Gln His Thr Lys Glu 165 170 175 Glu Leu Lys Ser Leu Gln Ala Lys Asp Glu Asp Lys Asp Glu Asp Glu 180 185 190 Lys Glu Lys Ala Ala Cys Ser Ala Ala Ala Met Glu Glu Asp Ser Glu 195 200 205 Ala Ser Ser Ser Arg Ile Gly Asp Ser Ser Gln Gly Asp Asn Asn Leu 210 215 220 Gln Lys Leu Gly Pro Asp Asp Val Ser Val Asp Ile Asp Ala Ile Arg 225 230 235 240 Arg Val Tyr Thr Arg Leu Leu Ser Asn Glu Lys Ile Glu Thr Ala Phe 245 250 255 Leu Asn Ala Leu Val Tyr Leu Ser Pro Asn Val Glu Cys Asp Leu Thr 260 265 270 Tyr His Asn Val Tyr Ser Arg Asp Pro Asn Tyr Leu Asn Leu Phe Ile 275 280 285 Ile Val Met Glu Asn Arg Asn Leu His Ser Pro Glu Tyr Leu Glu Met 290 295 300 Ala Leu Pro Leu Phe Cys Lys Ala Met Ser Lys Leu Pro Leu Ala Ala 305 310 315 320 Gln Gly Lys Leu Ile Arg Leu Trp Ser Lys Tyr Asn Ala Asp Gln Ile 325 330 335 Arg Arg Met Met Glu Thr Phe Gln Gln Leu Ile Thr Tyr Lys Val Ile 340 345 350 Ser Asn Glu Phe Asn Ser Arg Asn Leu Val Asn Asp Asp Asp Ala Ile 355 360 365 Val Ala Ala Ser Lys Cys Leu Lys Met Val Tyr Tyr Ala Asn Val Val 370 375 380 Gly Gly Glu Val Asp Thr Asn His Asn Glu Glu Asp Asp Glu Glu Pro 385 390 395 400 Ile Pro Glu Ser Ser Glu Leu Thr Leu Gln Glu Leu Leu Gly Glu Glu 405 410 415 Arg Arg Asn Lys Lys Gly Pro Arg Val Asp Pro Leu Glu Thr Glu Leu 420 425 430 Gly Val Lys Thr Leu Asp Cys Arg Lys Pro Leu Ile Pro Phe Glu Glu 435 440 445 Phe Ile Asn Glu Pro Leu Asn Glu Val Leu Glu Met Asp Lys Asp Tyr 450 455 460 Thr Phe Phe Lys Val Glu Thr Glu Asn Lys Phe Ser Phe Met Thr Cys 465 470 475 480 Pro Phe Ile Leu Asn Ala Val Thr Lys Asn Leu Gly Leu Tyr Tyr Asp 485 490 495 Asn Arg Ile Arg Met Tyr Ser Glu Arg Arg Ile Thr Val Leu Tyr Ser 500 505 510 Leu Val Gln Gly Gln Gln Leu Asn Pro Tyr Leu Arg Leu Lys Val Arg 515 520 525 Arg Asp His Ile Ile Asp Asp Ala Leu Val Arg Leu Glu Met Ile Ala 530 535 540 Met Glu Asn Pro Ala Asp Leu Lys Lys Gln Leu Tyr Val Glu Phe Glu 545 550 555 560 Gly Glu Gln Gly Val Asp Glu Gly Gly Val Ser Lys Glu Phe Phe Gln 565 570 575 Leu Val Val Glu Glu Ile Phe Asn Pro Asp Ile Gly Met Phe Thr Tyr 580 585 590 Asp Glu Ser Thr Lys Leu Phe Trp Phe Asn Pro Ser Ser Phe Glu Thr 595 600 605 Glu Gly Gln Phe Thr Leu Ile Gly Ile Val Leu Gly Leu Ala Ile Tyr 610 615 620 Asn Asn Cys Ile Leu Asp Val His Phe Pro Met Val Val Tyr Arg Lys 625 630 635 640 Leu Met Gly Lys Lys Gly Thr Phe Arg Asp Leu Gly Asp Ser His Pro 645 650 655 Val Leu Tyr Gln Ser Leu Lys Asp Leu Leu Glu Tyr Glu Gly Asn Val 660 665 670 Glu Asp Asp Met Met Ile Thr Phe Gln Ile Ser Gln Thr Asp Leu Phe 675 680 685 Gly Asn Pro Met Met Tyr Asp Leu Lys Glu Asn Gly Asp Lys Ile Pro 690 695 700 Ile Thr Asn Glu Asn Arg Lys Glu Phe Val Asn Leu Tyr Ser Asp Tyr 705 710 715 720 Ile Leu Asn Lys Ser Val Glu Lys Gln Phe Lys Ala Phe Arg Arg Gly 725 730 735 Phe His Met Val Thr Asn Glu Ser Pro Leu Lys Tyr Leu Phe Arg Pro 740 745 750 Glu Glu Ile Glu Leu Leu Ile Cys Gly Ser Arg Asn Leu Asp Phe Gln 755 760 765 Ala Leu Glu Glu Thr Thr Glu Tyr Asp Gly Gly Tyr Thr Arg Asp Ser 770 775 780 Val Leu Ile Arg Glu Phe Trp Glu Ile Val His Ser Phe Thr Asp Glu 785 790 795 800 Gln Lys Arg Leu Phe Leu Gln Phe Thr Thr Gly Thr Asp Arg Ala Pro 805 810 815 Val Gly Gly Leu Gly Lys Leu Lys Met Ile Ile Ala Lys Asn Gly Pro 820 825 830 Asp Thr Glu Arg Leu Pro Thr Ser His Thr Cys Phe Asn Val Leu Leu 835 840 845 Leu Pro Glu Tyr Ser Ser Lys Glu Lys Leu Lys Glu Arg Leu Leu Lys 850 855 860 Ala Ile Thr Tyr Ala Lys Gly Phe Gly Met Leu 865 870 875 <210> 7 <211> 3769 <212> DNA <213> Artificial Sequence <220> <223> vector genome hSyn.hUbe3a-2.GSco.SV40 <220> <221> repeat_region <222> (1)..(130) <223> ITR <220> <221> promoter <222> (213)..(678) <223> hSynapsin promoter <220> <221> misc_feature <222> (690)..(695) <223> Kozak <220> <221> CDS <222> (696)..(3326) <223> hUBE3a-2 <220> <221> misc_feature <222> (848)..(848) <223> mut <220> <221> misc_feature <222> (893)..(893) <223> mut <220> <221> misc_feature <222> (1097)..(1097) <223> mut <220> <221> misc_feature <222> (1250)..(1250) <223> mut <220> <221> misc_feature <222> (1262)..(1262) <223> mut <220> <221> misc_feature <222> (1286)..(1286) <223> mut <220> <221> misc_feature <222> (1352)..(1352) <223> mut SD/AS <220> <221> misc_feature <222> (1784)..(1784) <223> mut <220> <221> misc_feature <222> (1790)..(1790) <223> mut <220> <221> misc_feature <222> (1835)..(1835) <223> mut <220> <221> misc_feature <222> (1874)..(1874) <223> mut <220> <221> misc_feature <222> (1883)..(1883) <223> mut <220> <221> misc_feature <222> (2060)..(2060) <223> mut <220> <221> misc_feature <222> (2132)..(2132) <223> mut <220> <221> misc_feature <222> (2180)..(2180) <223> mut <220> <221> misc_feature <222> (2363)..(2363) <223> mut <220> <221> misc_feature <222> (2508)..(2509) <223> mut SD/AS <220> <221> misc_feature <222> (2792)..(2792) <223> mut <220> <221> misc_feature <222> (3026)..(3026) <223> mut <220> <221> misc_feature <222> (3092)..(3092) <223> mut <220> <221> misc_feature <222> (3125)..(3125) <223> mut SD/AS <220> <221> misc_feature <222> (3221)..(3221) <223> mut <220> <221> misc_feature <222> (3230)..(3230) <223> mut <220> <221> misc_feature <222> (3299)..(3299) <223> mut <220> <221> polyA_signal <222> (3344)..(3757) <223> SV40 polyA <220> <221> repeat_region <222> (3640)..(3769) <223> ITR <400> 7 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatcc tctagaacta tagctagcat gcctgcagag ggccctgcgt atgagtgcaa 240 gtgggtttta ggaccaggat gaggcggggt gggggtgcct acctgacgac cgaccccgac 300 ccactggaca agcacccaac ccccattccc caaattgcgc atcccctatc agagaggggg 360 aggggaaaca ggatgcggcg aggcgcgtgc gcactgccag cttcagcacc gcggacagtg 420 ccttcgcccc cgcctggcgg cgcgcgccac cgccgcctca gcactgaagg cgcgctgacg 480 tcactcgccg gtcccccgca aactcccctt cccggccacc ttggtcgcgt ccgcgccgcc 540 gccggcccag ccggaccgca ccacgcgagg cgcgagatag gggggcacgg gcgcgaccat 600 ctgcgctgcg gcgccggcga ctcagcgctg cctcagtctg cggtgggcag cggaggagtc 660 gtgtcgtgcc tgagagcgca gtcgaattcg ccacc atg gag aag ctg cac cag 713 Met Glu Lys Leu His Gln 1 5 tgc tac tgg aag tct ggc gag cct cag agc gac gat atc gag gca agc 761 Cys Tyr Trp Lys Ser Gly Glu Pro Gln Ser Asp Asp Ile Glu Ala Ser 10 15 20 agg atg aag aga gca gca gcc aag cac ctg atc gag cgg tac tat cac 809 Arg Met Lys Arg Ala Ala Ala Lys His Leu Ile Glu Arg Tyr Tyr His 25 30 35 cag ctg acc gag ggc tgc gga aac gag gcc tgt aca aac gag ttc tgc 857 Gln Leu Thr Glu Gly Cys Gly Asn Glu Ala Cys Thr Asn Glu Phe Cys 40 45 50 gcc tcc tgt cca acc ttt ctg aga atg gat aac aac gcc gcc gcc atc 905 Ala Ser Cys Pro Thr Phe Leu Arg Met Asp Asn Asn Ala Ala Ala Ile 55 60 65 70 aag gcc ctg gag ctg tac aag atc aac gcc aag ctg tgc gac ccc cac 953 Lys Ala Leu Glu Leu Tyr Lys Ile Asn Ala Lys Leu Cys Asp Pro His 75 80 85 cct tct aag aag ggc gcc agc tcc gcc tat ctg gag aac agc aag ggc 1001 Pro Ser Lys Lys Gly Ala Ser Ser Ala Tyr Leu Glu Asn Ser Lys Gly 90 95 100 gcc ccc aac aat agc tgt tcc gag atc aag atg aat aag aag ggc gcc 1049 Ala Pro Asn Asn Ser Cys Ser Glu Ile Lys Met Asn Lys Lys Gly Ala 105 110 115 agg atc gat ttc aag gac gtg acc tac ctg aca gag gag aag gtg tac 1097 Arg Ile Asp Phe Lys Asp Val Thr Tyr Leu Thr Glu Glu Lys Val Tyr 120 125 130 gag atc ctg gag ctg tgc cgg gag aga gag gat tac tcc cct ctg atc 1145 Glu Ile Leu Glu Leu Cys Arg Glu Arg Glu Asp Tyr Ser Pro Leu Ile 135 140 145 150 aga gtg atc gga cgc gtg ttc tct agc gcc gag gcc ctg gtg cag agc 1193 Arg Val Ile Gly Arg Val Phe Ser Ser Ala Glu Ala Leu Val Gln Ser 155 160 165 ttt cgc aag gtg aag cag cac aca aag gag gag ctg aag tcc ctg cag 1241 Phe Arg Lys Val Lys Gln His Thr Lys Glu Glu Leu Lys Ser Leu Gln 170 175 180 gcc aag gac gag gac aag gac gag gac gag aag gag aag gca gct tgt 1289 Ala Lys Asp Glu Asp Lys Asp Glu Asp Glu Lys Glu Lys Ala Ala Cys 185 190 195 tcc gcc gca gca atg gag gag gac tct gag gcc tcc tct agc agg atc 1337 Ser Ala Ala Ala Met Glu Glu Asp Ser Glu Ala Ser Ser Ser Arg Ile 200 205 210 ggc gat tcc tct caa ggc gac aac aat ctg cag aag ctg ggc ccc gac 1385 Gly Asp Ser Ser Gln Gly Asp Asn Asn Leu Gln Lys Leu Gly Pro Asp 215 220 225 230 gac gtg agc gtg gat atc gac gcc atc cgg aga gtg tac aca cgc ctg 1433 Asp Val Ser Val Asp Ile Asp Ala Ile Arg Arg Val Tyr Thr Arg Leu 235 240 245 ctg tct aac gag aag atc gag acc gcc ttc ctg aac gcc ctg gtg tat 1481 Leu Ser Asn Glu Lys Ile Glu Thr Ala Phe Leu Asn Ala Leu Val Tyr 250 255 260 ctg tct cct aat gtg gag tgc gat ctg acc tac cac aac gtg tac agc 1529 Leu Ser Pro Asn Val Glu Cys Asp Leu Thr Tyr His Asn Val Tyr Ser 265 270 275 cgg gac cca aac tac ctg aat ctg ttc atc atc gtg atg gag aac aga 1577 Arg Asp Pro Asn Tyr Leu Asn Leu Phe Ile Ile Val Met Glu Asn Arg 280 285 290 aat ctg cac tct ccc gag tat ctg gag atg gcc ctg cct ctg ttt tgt 1625 Asn Leu His Ser Pro Glu Tyr Leu Glu Met Ala Leu Pro Leu Phe Cys 295 300 305 310 aag gcc atg agc aag ctg cca ctg gca gca cag ggc aag ctg atc agg 1673 Lys Ala Met Ser Lys Leu Pro Leu Ala Ala Gln Gly Lys Leu Ile Arg 315 320 325 ctg tgg tcc aag tac aac gcc gat cag atc agg cgc atg atg gag acc 1721 Leu Trp Ser Lys Tyr Asn Ala Asp Gln Ile Arg Arg Met Met Glu Thr 330 335 340 ttc cag cag ctg atc aca tat aaa gtg atc tcc aac gag ttt aat tct 1769 Phe Gln Gln Leu Ile Thr Tyr Lys Val Ile Ser Asn Glu Phe Asn Ser 345 350 355 aga aac ctg gtg aac gac gac gac gcc atc gtg gcc gcc agc aag tgc 1817 Arg Asn Leu Val Asn Asp Asp Asp Ala Ile Val Ala Ala Ser Lys Cys 360 365 370 ctg aag atg gtg tac tac gcc aac gtg gtg ggc ggc gag gtg gac aca 1865 Leu Lys Met Val Tyr Tyr Ala Asn Val Val Gly Gly Glu Val Asp Thr 375 380 385 390 aac cac aac gag gag gac gac gag gag cca atc ccc gag agc tcc gag 1913 Asn His Asn Glu Glu Asp Asp Glu Glu Pro Ile Pro Glu Ser Ser Glu 395 400 405 ctg acc ctg cag gag ctg ctg gga gag gag cgg aga aat aag aag gga 1961 Leu Thr Leu Gln Glu Leu Leu Gly Glu Glu Arg Arg Asn Lys Lys Gly 410 415 420 cca agg gtg gat cct ctg gag acc gag ctg ggc gtg aag aca ctg gac 2009 Pro Arg Val Asp Pro Leu Glu Thr Glu Leu Gly Val Lys Thr Leu Asp 425 430 435 tgc aga aag cct ctg atc cca ttc gag gag ttt atc aac gag ccc ctg 2057 Cys Arg Lys Pro Leu Ile Pro Phe Glu Glu Phe Ile Asn Glu Pro Leu 440 445 450 aac gag gtg ctg gag atg gat aag gac tac acc ttc ttt aag gtg gag 2105 Asn Glu Val Leu Glu Met Asp Lys Asp Tyr Thr Phe Phe Lys Val Glu 455 460 465 470 aca gag aac aag ttc agc ttt atg acc tgt cct ttc atc ctg aac gcc 2153 Thr Glu Asn Lys Phe Ser Phe Met Thr Cys Pro Phe Ile Leu Asn Ala 475 480 485 gtg acc aag aat ctg ggc ctg tac tac gat aac agg atc cgc atg tac 2201 Val Thr Lys Asn Leu Gly Leu Tyr Tyr Asp Asn Arg Ile Arg Met Tyr 490 495 500 agc gag agg cgc atc acc gtg ctg tat tcc ctg gtg cag ggc cag cag 2249 Ser Glu Arg Arg Ile Thr Val Leu Tyr Ser Leu Val Gln Gly Gln Gln 505 510 515 ctg aat cct tac ctg agg ctg aag gtg cgg aga gac cac atc atc gat 2297 Leu Asn Pro Tyr Leu Arg Leu Lys Val Arg Arg Asp His Ile Ile Asp 520 525 530 gac gcc ctg gtg cgc ctg gag atg atc gcc atg gag aat cca gcc gat 2345 Asp Ala Leu Val Arg Leu Glu Met Ile Ala Met Glu Asn Pro Ala Asp 535 540 545 550 ctg aag aag cag ctg tac gtg gag ttt gag gga gag cag gga gtg gac 2393 Leu Lys Lys Gln Leu Tyr Val Glu Phe Glu Gly Glu Gln Gly Val Asp 555 560 565 gag gga ggc gtg tcc aag gag ttc ttt cag ctg gtg gtg gag gag atc 2441 Glu Gly Gly Val Ser Lys Glu Phe Phe Gln Leu Val Val Glu Glu Ile 570 575 580 ttc aac ccc gat atc ggc atg ttt acc tac gac gag tct aca aag ctg 2489 Phe Asn Pro Asp Ile Gly Met Phe Thr Tyr Asp Glu Ser Thr Lys Leu 585 590 595 ttc tgg ttt aat cct tct tcc ttc gag acc gag ggc cag ttt aca ctg 2537 Phe Trp Phe Asn Pro Ser Ser Phe Glu Thr Glu Gly Gln Phe Thr Leu 600 605 610 atc ggc atc gtg ctg ggc ctg gcc atc tac aac aat tgt atc ctg gac 2585 Ile Gly Ile Val Leu Gly Leu Ala Ile Tyr Asn Asn Cys Ile Leu Asp 615 620 625 630 gtg cac ttc cca atg gtg gtg tat agg aag ctg atg ggc aag aag ggc 2633 Val His Phe Pro Met Val Val Tyr Arg Lys Leu Met Gly Lys Lys Gly 635 640 645 acc ttt cgc gat ctg ggc gac agc cac ccc gtg ctg tac cag tcc ctg 2681 Thr Phe Arg Asp Leu Gly Asp Ser His Pro Val Leu Tyr Gln Ser Leu 650 655 660 aag gat ctg ctg gag tat gag ggc aac gtg gag gat gac atg atg atc 2729 Lys Asp Leu Leu Glu Tyr Glu Gly Asn Val Glu Asp Asp Met Met Ile 665 670 675 acc ttc cag atc tcc cag aca gac ctg ttt ggc aac cca atg atg tac 2777 Thr Phe Gln Ile Ser Gln Thr Asp Leu Phe Gly Asn Pro Met Met Tyr 680 685 690 gat ctg aag gag aac ggc gac aag atc ccc atc aca aac gag aat agg 2825 Asp Leu Lys Glu Asn Gly Asp Lys Ile Pro Ile Thr Asn Glu Asn Arg 695 700 705 710 aag gag ttc gtg aac ctg tac tct gat tat atc ctg aat aag agc gtg 2873 Lys Glu Phe Val Asn Leu Tyr Ser Asp Tyr Ile Leu Asn Lys Ser Val 715 720 725 gag aag cag ttc aag gcc ttt agg cgc ggc ttc cac atg gtg acc aac 2921 Glu Lys Gln Phe Lys Ala Phe Arg Arg Gly Phe His Met Val Thr Asn 730 735 740 gag tct cct ctg aag tat ctg ttt agg cca gag gag atc gag ctg ctg 2969 Glu Ser Pro Leu Lys Tyr Leu Phe Arg Pro Glu Glu Ile Glu Leu Leu 745 750 755 atc tgc ggc agc cgc aat ctg gac ttt cag gcc ctg gag gag acc aca 3017 Ile Cys Gly Ser Arg Asn Leu Asp Phe Gln Ala Leu Glu Glu Thr Thr 760 765 770 gag tac gac ggc ggc tat acc cgg gac tcc gtg ctg atc aga gag ttc 3065 Glu Tyr Asp Gly Gly Tyr Thr Arg Asp Ser Val Leu Ile Arg Glu Phe 775 780 785 790 tgg gag atc gtg cac tct ttt aca gac gag cag aag cgg ctg ttc ctg 3113 Trp Glu Ile Val His Ser Phe Thr Asp Glu Gln Lys Arg Leu Phe Leu 795 800 805 cag ttt acc acc ggc acc gac aga gca cca gtg gga gga ctg ggc aag 3161 Gln Phe Thr Thr Gly Thr Asp Arg Ala Pro Val Gly Gly Leu Gly Lys 810 815 820 ctg aag atg atc atc gcc aag aac ggc cca gac aca gag agg ctg ccc 3209 Leu Lys Met Ile Ile Ala Lys Asn Gly Pro Asp Thr Glu Arg Leu Pro 825 830 835 acc agc cac acc tgt ttc aac gtg ctg ctg ctg ccc gag tac tcc tct 3257 Thr Ser His Thr Cys Phe Asn Val Leu Leu Leu Pro Glu Tyr Ser Ser 840 845 850 aag gag aag ctg aag gag cgc ctg ctg aag gcc atc acc tac gcc aag 3305 Lys Glu Lys Leu Lys Glu Arg Leu Leu Lys Ala Ile Thr Tyr Ala Lys 855 860 865 870 ggc ttt ggc atg ctg tga tga ggtaccggcg gccgcttcga gcagacatga 3356 Gly Phe Gly Met Leu 875 taagatacat tgatgagttt ggacaaacca caactagaat gcagtgaaaa aaatgcttta 3416 tttgtgaaat ttgtgatgct attgctttat ttgtaaccat tataagctgc aataaacaag 3476 ttaacaacaa caattgcatt cattttatgt ttcaggttca gggggagatg tgggaggttt 3536 tttaaagcaa gtaaaacctc tacaaatgtg gtaaaatcga taaggatctt cctagagcat 3596 ggctacgtag ataagtagca tggcgggtta atcattaact acaaggaacc cctagtgatg 3656 gagttggcca ctccctctct gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc 3716 gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg agcgagcgcg cag 3769 <210> 8 <211> 875 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 8 Met Glu Lys Leu His Gln Cys Tyr Trp Lys Ser Gly Glu Pro Gln Ser 1 5 10 15 Asp Asp Ile Glu Ala Ser Arg Met Lys Arg Ala Ala Ala Lys His Leu 20 25 30 Ile Glu Arg Tyr Tyr His Gln Leu Thr Glu Gly Cys Gly Asn Glu Ala 35 40 45 Cys Thr Asn Glu Phe Cys Ala Ser Cys Pro Thr Phe Leu Arg Met Asp 50 55 60 Asn Asn Ala Ala Ala Ile Lys Ala Leu Glu Leu Tyr Lys Ile Asn Ala 65 70 75 80 Lys Leu Cys Asp Pro His Pro Ser Lys Lys Gly Ala Ser Ser Ala Tyr 85 90 95 Leu Glu Asn Ser Lys Gly Ala Pro Asn Asn Ser Cys Ser Glu Ile Lys 100 105 110 Met Asn Lys Lys Gly Ala Arg Ile Asp Phe Lys Asp Val Thr Tyr Leu 115 120 125 Thr Glu Glu Lys Val Tyr Glu Ile Leu Glu Leu Cys Arg Glu Arg Glu 130 135 140 Asp Tyr Ser Pro Leu Ile Arg Val Ile Gly Arg Val Phe Ser Ser Ala 145 150 155 160 Glu Ala Leu Val Gln Ser Phe Arg Lys Val Lys Gln His Thr Lys Glu 165 170 175 Glu Leu Lys Ser Leu Gln Ala Lys Asp Glu Asp Lys Asp Glu Asp Glu 180 185 190 Lys Glu Lys Ala Ala Cys Ser Ala Ala Ala Met Glu Glu Asp Ser Glu 195 200 205 Ala Ser Ser Ser Arg Ile Gly Asp Ser Ser Gln Gly Asp Asn Asn Leu 210 215 220 Gln Lys Leu Gly Pro Asp Asp Val Ser Val Asp Ile Asp Ala Ile Arg 225 230 235 240 Arg Val Tyr Thr Arg Leu Leu Ser Asn Glu Lys Ile Glu Thr Ala Phe 245 250 255 Leu Asn Ala Leu Val Tyr Leu Ser Pro Asn Val Glu Cys Asp Leu Thr 260 265 270 Tyr His Asn Val Tyr Ser Arg Asp Pro Asn Tyr Leu Asn Leu Phe Ile 275 280 285 Ile Val Met Glu Asn Arg Asn Leu His Ser Pro Glu Tyr Leu Glu Met 290 295 300 Ala Leu Pro Leu Phe Cys Lys Ala Met Ser Lys Leu Pro Leu Ala Ala 305 310 315 320 Gln Gly Lys Leu Ile Arg Leu Trp Ser Lys Tyr Asn Ala Asp Gln Ile 325 330 335 Arg Arg Met Met Glu Thr Phe Gln Gln Leu Ile Thr Tyr Lys Val Ile 340 345 350 Ser Asn Glu Phe Asn Ser Arg Asn Leu Val Asn Asp Asp Asp Ala Ile 355 360 365 Val Ala Ala Ser Lys Cys Leu Lys Met Val Tyr Tyr Ala Asn Val Val 370 375 380 Gly Gly Glu Val Asp Thr Asn His Asn Glu Glu Asp Asp Glu Glu Pro 385 390 395 400 Ile Pro Glu Ser Ser Glu Leu Thr Leu Gln Glu Leu Leu Gly Glu Glu 405 410 415 Arg Arg Asn Lys Lys Gly Pro Arg Val Asp Pro Leu Glu Thr Glu Leu 420 425 430 Gly Val Lys Thr Leu Asp Cys Arg Lys Pro Leu Ile Pro Phe Glu Glu 435 440 445 Phe Ile Asn Glu Pro Leu Asn Glu Val Leu Glu Met Asp Lys Asp Tyr 450 455 460 Thr Phe Phe Lys Val Glu Thr Glu Asn Lys Phe Ser Phe Met Thr Cys 465 470 475 480 Pro Phe Ile Leu Asn Ala Val Thr Lys Asn Leu Gly Leu Tyr Tyr Asp 485 490 495 Asn Arg Ile Arg Met Tyr Ser Glu Arg Arg Ile Thr Val Leu Tyr Ser 500 505 510 Leu Val Gln Gly Gln Gln Leu Asn Pro Tyr Leu Arg Leu Lys Val Arg 515 520 525 Arg Asp His Ile Ile Asp Asp Ala Leu Val Arg Leu Glu Met Ile Ala 530 535 540 Met Glu Asn Pro Ala Asp Leu Lys Lys Gln Leu Tyr Val Glu Phe Glu 545 550 555 560 Gly Glu Gln Gly Val Asp Glu Gly Gly Val Ser Lys Glu Phe Phe Gln 565 570 575 Leu Val Val Glu Glu Ile Phe Asn Pro Asp Ile Gly Met Phe Thr Tyr 580 585 590 Asp Glu Ser Thr Lys Leu Phe Trp Phe Asn Pro Ser Ser Phe Glu Thr 595 600 605 Glu Gly Gln Phe Thr Leu Ile Gly Ile Val Leu Gly Leu Ala Ile Tyr 610 615 620 Asn Asn Cys Ile Leu Asp Val His Phe Pro Met Val Val Tyr Arg Lys 625 630 635 640 Leu Met Gly Lys Lys Gly Thr Phe Arg Asp Leu Gly Asp Ser His Pro 645 650 655 Val Leu Tyr Gln Ser Leu Lys Asp Leu Leu Glu Tyr Glu Gly Asn Val 660 665 670 Glu Asp Asp Met Met Ile Thr Phe Gln Ile Ser Gln Thr Asp Leu Phe 675 680 685 Gly Asn Pro Met Met Tyr Asp Leu Lys Glu Asn Gly Asp Lys Ile Pro 690 695 700 Ile Thr Asn Glu Asn Arg Lys Glu Phe Val Asn Leu Tyr Ser Asp Tyr 705 710 715 720 Ile Leu Asn Lys Ser Val Glu Lys Gln Phe Lys Ala Phe Arg Arg Gly 725 730 735 Phe His Met Val Thr Asn Glu Ser Pro Leu Lys Tyr Leu Phe Arg Pro 740 745 750 Glu Glu Ile Glu Leu Leu Ile Cys Gly Ser Arg Asn Leu Asp Phe Gln 755 760 765 Ala Leu Glu Glu Thr Thr Glu Tyr Asp Gly Gly Tyr Thr Arg Asp Ser 770 775 780 Val Leu Ile Arg Glu Phe Trp Glu Ile Val His Ser Phe Thr Asp Glu 785 790 795 800 Gln Lys Arg Leu Phe Leu Gln Phe Thr Thr Gly Thr Asp Arg Ala Pro 805 810 815 Val Gly Gly Leu Gly Lys Leu Lys Met Ile Ile Ala Lys Asn Gly Pro 820 825 830 Asp Thr Glu Arg Leu Pro Thr Ser His Thr Cys Phe Asn Val Leu Leu 835 840 845 Leu Pro Glu Tyr Ser Ser Lys Glu Lys Leu Lys Glu Arg Leu Leu Lys 850 855 860 Ala Ile Thr Tyr Ala Lys Gly Phe Gly Met Leu 865 870 875 <210> 9 <211> 2562 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid sequence hUbe31a-1 <400> 9 atgaagaggg cagcagcaaa gcacctgatc gagagatact atcaccagct gaccgaggga 60 tgcggaaacg aggcatgtac aaacgagttc tgcgcctcct gtcccacctt tctgaggatg 120 gataacaacg ccgccgccat caaggccctg gagctgtaca agatcaacgc caagctgtgc 180 gacccccacc ctagcaagaa gggcgccagc tccgcctatc tggagaactc caagggcgcc 240 cctaacaata gctgttccga gatcaagatg aataagaagg gcgcccggat cgatttcaag 300 gacgtgacct acctgacaga ggagaaggtg tacgagatcc tggagctgtg ccgggagaga 360 gaggattaca gcccactgat cagagtgatc ggcagagtgt tctctagcgc cgaggccctg 420 gtgcagtcct ttagaaaggt gaagcagcac acaaaggagg agctgaagtc tctgcaggcc 480 aaggacgagg acaaggacga ggacgagaag gagaaggcag cctgttctgc cgcagcaatg 540 gaggaggaca gcgaggcatc ctctagccgg atcggcgatt cctctcaagg cgacaacaat 600 ctgcagaagc tgggccccga cgacgtgagc gtggatatcg acgccatccg gagagtgtac 660 acaagactgc tgagcaacga gaagatcgag accgccttcc tgaacgccct ggtgtatctg 720 agccctaatg tggagtgcga tctgacctac cacaacgtgt actcccggga cccaaactac 780 ctgaatctgt tcatcatcgt gatggagaac agaaatctgc actcccccga gtatctggag 840 atggccctgc ctctgttttg taaggccatg tccaagctgc ctctggcagc acagggcaag 900 ctgatcaggc tgtggtctaa gtacaacgcc gatcagatca ggcgcatgat ggagaccttc 960 cagcagctga tcacatacaa agtgatctct aacgagttta atagccgcaa cctggtgaac 1020 gacgacgacg ccatcgtggc cgcctctaag tgcctgaaga tggtgtacta cgccaacgtg 1080 gtgggcggcg aggtggacac aaaccacaac gaggaggacg acgaggagcc aatccccgag 1140 agctccgagc tgaccctgca ggagctgctg ggagaggagc ggagaaataa gaagggacca 1200 agggtggatc ctctggagac cgagctgggc gtgaagacac tggactgcag aaagcctctg 1260 atcccattcg aggagtttat caacgagccc ctgaacgagg tgctggagat ggataaggac 1320 tacaccttct ttaaggtgga gacagagaac aagttcagct ttatgacctg tcctttcatc 1380 ctgaacgccg tgaccaagaa tctgggcctg tactacgata acaggatccg catgtactcc 1440 gagaggcgca tcaccgtgct gtattctctg gtgcagggcc agcagctgaa tccttacctg 1500 aggctgaagg tgcggagaga ccacatcatc gatgacgccc tggtgcgcct ggagatgatc 1560 gccatggaga atccagccga tctgaagaag cagctgtacg tggagtttga gggagagcag 1620 ggagtggacg agggaggcgt gtctaaggag ttctttcagc tggtggtgga ggagatcttc 1680 aaccccgata tcggcatgtt tacctacgac gagagcacaa agctgttctg gtttaatcct 1740 tcttccttcg agaccgaggg ccagtttaca ctgatcggca tcgtgctggg cctggccatc 1800 tacaacaatt gtatcctgga cgtgcacttc ccaatggtgg tgtataggaa gctgatgggc 1860 aagaagggca cctttcgcga tctgggcgac tcccaccccg tgctgtacca gtctctgaag 1920 gatctgctgg agtatgaggg caacgtggag gatgacatga tgatcacctt ccagatctcc 1980 cagacagacc tgtttggcaa cccaatgatg tacgatctga aggagaacgg cgacaagatc 2040 cccatcacaa acgagaatag aaaggagttc gtgaacctgt acagcgatta tatcctgaat 2100 aagtccgtgg agaagcagtt caaggccttt aggcgcggct tccacatggt gaccaacgag 2160 agccctctga agtatctgtt taggccagag gagatcgagc tgctgatctg cggctcccgc 2220 aatctggact ttcaggccct ggaggagacc acagagtacg acggcggcta taccagggac 2280 tctgtgctga tccgcgagtt ctgggagatc gtgcacagct ttacagacga gcagaagcgg 2340 ctgttcctgc agtttaccac cggcaccgac agagcaccag tgggaggact gggcaagctg 2400 aagatgatca tcgccaagaa cggcccagac acagagaggc tgcccaccag ccacacctgt 2460 ttcaacgtgc tgctgctgcc cgagtactcc tctaaggaga agctgaagga gcgcctgctg 2520 aaggccatca cctacgccaa gggctttggc atgctgtgat ga 2562 <210> 10 <211> 2631 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid sequence hUbe3a-2 <400> 10 atggagaagc tgcaccagtg ctactggaag tctggcgagc ctcagagcga cgatatcgag 60 gcaagcagga tgaagagagc agcagccaag cacctgatcg agcggtacta tcaccagctg 120 accgagggct gcggaaacga ggcctgtaca aacgagttct gcgcctcctg tccaaccttt 180 ctgagaatgg ataacaacgc cgccgccatc aaggccctgg agctgtacaa gatcaacgcc 240 aagctgtgcg acccccaccc ttctaagaag ggcgccagct ccgcctatct ggagaacagc 300 aagggcgccc ccaacaatag ctgttccgag atcaagatga ataagaaggg cgccaggatc 360 gatttcaagg acgtgaccta cctgacagag gagaaggtgt acgagatcct ggagctgtgc 420 cgggagagag aggattactc ccctctgatc agagtgatcg gacgcgtgtt ctctagcgcc 480 gaggccctgg tgcagagctt tcgcaaggtg aagcagcaca caaaggagga gctgaagtcc 540 ctgcaggcca aggacgagga caaggacgag gacgagaagg agaaggcagc ttgttccgcc 600 gcagcaatgg aggaggactc tgaggcctcc tctagcagga tcggcgattc ctctcaaggc 660 gacaacaatc tgcagaagct gggccccgac gacgtgagcg tggatatcga cgccatccgg 720 agagtgtaca cacgcctgct gtctaacgag aagatcgaga ccgccttcct gaacgccctg 780 gtgtatctgt ctcctaatgt ggagtgcgat ctgacctacc acaacgtgta cagccgggac 840 ccaaactacc tgaatctgtt catcatcgtg atggagaaca gaaatctgca ctctcccgag 900 tatctggaga tggccctgcc tctgttttgt aaggccatga gcaagctgcc actggcagca 960 cagggcaagc tgatcaggct gtggtccaag tacaacgccg atcagatcag gcgcatgatg 1020 gagaccttcc agcagctgat cacatataaa gtgatctcca acgagtttaa ttctagaaac 1080 ctggtgaacg acgacgacgc catcgtggcc gccagcaagt gcctgaagat ggtgtactac 1140 gccaacgtgg tgggcggcga ggtggacaca aaccacaacg aggaggacga cgaggagcca 1200 atccccgaga gctccgagct gaccctgcag gagctgctgg gagaggagcg gagaaataag 1260 aagggaccaa gggtggatcc tctggagacc gagctgggcg tgaagacact ggactgcaga 1320 aagcctctga tcccattcga ggagtttatc aacgagcccc tgaacgaggt gctggagatg 1380 gataaggact acaccttctt taaggtggag acagagaaca agttcagctt tatgacctgt 1440 cctttcatcc tgaacgccgt gaccaagaat ctgggcctgt actacgataa caggatccgc 1500 atgtacagcg agaggcgcat caccgtgctg tattccctgg tgcagggcca gcagctgaat 1560 ccttacctga ggctgaaggt gcggagagac cacatcatcg atgacgccct ggtgcgcctg 1620 gagatgatcg ccatggagaa tccagccgat ctgaagaagc agctgtacgt ggagtttgag 1680 ggagagcagg gagtggacga gggaggcgtg tccaaggagt tctttcagct ggtggtggag 1740 gagatcttca accccgatat cggcatgttt acctacgacg agtctacaaa gctgttctgg 1800 tttaatcctt cttccttcga gaccgagggc cagtttacac tgatcggcat cgtgctgggc 1860 ctggccatct acaacaattg tatcctggac gtgcacttcc caatggtggt gtataggaag 1920 ctgatgggca agaagggcac ctttcgcgat ctgggcgaca gccaccccgt gctgtaccag 1980 tccctgaagg atctgctgga gtatgagggc aacgtggagg atgacatgat gatcaccttc 2040 cagatctccc agacagacct gtttggcaac ccaatgatgt acgatctgaa ggagaacggc 2100 gacaagatcc ccatcacaaa cgagaatagg aaggagttcg tgaacctgta ctctgattat 2160 atcctgaata agagcgtgga gaagcagttc aaggccttta ggcgcggctt ccacatggtg 2220 accaacgagt ctcctctgaa gtatctgttt aggccagagg agatcgagct gctgatctgc 2280 ggcagccgca atctggactt tcaggccctg gaggagacca cagagtacga cggcggctat 2340 acccgggact ccgtgctgat cagagagttc tgggagatcg tgcactcttt tacagacgag 2400 cagaagcggc tgttcctgca gtttaccacc ggcaccgaca gagcaccagt gggaggactg 2460 ggcaagctga agatgatcat cgccaagaac ggcccagaca cagagaggct gcccaccagc 2520 cacacctgtt tcaacgtgct gctgctgccc gagtactcct ctaaggagaa gctgaaggag 2580 cgcctgctga aggccatcac ctacgccaag ggctttggca tgctgtgatg a 2631 <210> 11 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> miRNA183 targeting sequence <400> 11 agtgaattct accagtgcca ta 22 <210> 12 <211> 466 <212> DNA <213> Artificial Sequence <220> <223> hSynapsin promoter <400> 12 ctgcagaggg ccctgcgtat gagtgcaagt gggttttagg accaggatga ggcggggtgg 60 gggtgcctac ctgacgaccg accccgaccc actggacaag cacccaaccc ccattcccca 120 aattgcgcat cccctatcag agagggggag gggaaacagg atgcggcgag gcgcgtgcgc 180 actgccagct tcagcaccgc ggacagtgcc ttcgcccccg cctggcggcg cgcgccaccg 240 ccgcctcagc actgaaggcg cgctgacgtc actcgccggt cccccgcaaa ctccccttcc 300 cggccacctt ggtcgcgtcc gcgccgccgc cggcccagcc ggaccgcacc acgcgaggcg 360 cgagataggg gggcacgggc gcgaccatct gcgctgcggc gccggcgact cagcgctgcc 420 tcagtctgcg gtgggcagcg gaggagtcgt gtcgtgcctg agagcg 466 <210> 13 <211> 232 <212> DNA <213> Artificial Sequence <220> <223> SV40 polyA <400> 13 cgagcagaca tgataagata cattgatgag tttggacaaa ccacaactag aatgcagtga 60 aaaaaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac cattataagc 120 tgcaataaac aagttaacaa caacaattgc attcatttta tgtttcaggt tcagggggag 180 atgtgggagg ttttttaaag caagtaaaac ctctacaaat gtggtaaaat cg 232 <210> 14 <211> 2211 <212> DNA <213> adeno-associated virus hu68 <220> <221> CDS <222> (1)..(2211) <223> AAVhu68 Capsid <400> 14 atg gct gcc gat ggt tat ctt cca gat tgg ctc gag gac aac ctc agt 48 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 gaa ggc att cgc gag tgg tgg gct ttg aaa cct gga gcc cct caa ccc 96 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 aag gca aat caa caa cat caa gac aac gct cgg ggt ctt gtg ctt ccg 144 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 ggt tac aaa tac ctt gga ccc ggc aac gga ctc gac aag ggg gag ccg 192 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 gtc aac gaa gca gac gcg gcg gcc ctc gag cac gac aag gcc tac gac 240 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 cag cag ctc aag gcc gga gac aac ccg tac ctc aag tac aac cac gcc 288 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 gac gcc gag ttc cag gag cgg ctc aaa gaa gat acg tct ttt ggg ggc 336 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 aac ctc ggg cga gca gtc ttc cag gcc aaa aag agg ctt ctt gaa cct 384 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 ctt ggt ctg gtt gag gaa gcg gct aag acg gct cct gga aag aag agg 432 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 cct gta gag cag tct cct cag gaa ccg gac tcc tcc gtg ggt att ggc 480 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Val Gly Ile Gly 145 150 155 160 aaa tcg ggt gca cag ccc gct aaa aag aga ctc aat ttc ggt cag act 528 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 ggc gac aca gag tca gtc ccc gac cct caa cca atc gga gaa cct ccc 576 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 gca gcc ccc tca ggt gtg gga tct ctt aca atg gct tca ggt ggt ggc 624 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 gca cca gtg gca gac aat aac gaa ggt gcc gat gga gtg ggt agt tcc 672 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 tcg gga aat tgg cat tgc gat tcc caa tgg ctg ggg gac aga gtc atc 720 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 acc acc agc acc cga acc tgg gcc ctg ccc acc tac aac aat cac ctc 768 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 tac aag caa atc tcc aac agc aca tct gga gga tct tca aat gac aac 816 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 gcc tac ttc ggc tac agc acc ccc tgg ggg tat ttt gac ttc aac aga 864 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 ttc cac tgc cac ttc tca cca cgt gac tgg caa aga ctc atc aac aac 912 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 aac tgg gga ttc cgg cct aag cga ctc aac ttc aag ctc ttc aac att 960 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 cag gtc aaa gag gtt acg gac aac aat gga gtc aag acc atc gct aat 1008 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 aac ctt acc agc acg gtc cag gtc ttc acg gac tca gac tat cag ctc 1056 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 ccg tac gtg ctc ggg tcg gct cac gag ggc tgc ctc ccg ccg ttc cca 1104 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 gcg gac gtt ttc atg att cct cag tac ggg tat cta acg ctt aat gat 1152 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 gga agc caa gcc gtg ggt cgt tcg tcc ttt tac tgc ctg gaa tat ttc 1200 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 ccg tcg caa atg cta aga acg ggt aac aac ttc cag ttc agc tac gag 1248 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 ttt gag aac gta cct ttc cat agc agc tat gct cac agc caa agc ctg 1296 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 gac cga ctc atg aat cca ctc atc gac caa tac ttg tac tat ctc tca 1344 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 aag act att aac ggt tct gga cag aat caa caa acg cta aaa ttc agt 1392 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 gtg gcc gga ccc agc aac atg gct gtc cag gga aga aac tac ata cct 1440 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 gga ccc agc tac cga caa caa cgt gtc tca acc act gtg act caa aac 1488 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 aac aac agc gaa ttt gct tgg cct gga gct tct tct tgg gct ctc aat 1536 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 gga cgt aat agc ttg atg aat cct gga cct gct atg gcc agc cac aaa 1584 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 gaa gga gag gac cgt ttc ttt cct ttg tct gga tct tta att ttt ggc 1632 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 aaa caa gga act gga aga gac aac gtg gat gcg gac aaa gtc atg ata 1680 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 acc aac gaa gaa gaa att aaa act acc aac cca gta gca acg gag tcc 1728 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 tat gga caa gtg gcc aca aac cac cag agt gcc caa gca cag gcg cag 1776 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 acc ggc tgg gtt caa aac caa gga ata ctt ccg ggt atg gtt tgg cag 1824 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 gac aga gat gtg tac ctg caa gga ccc att tgg gcc aaa att cct cac 1872 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 acg gac ggc aac ttt cac cct tct ccg ctg atg gga ggg ttt gga atg 1920 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 aag cac ccg cct cct cag atc ctc atc aaa aac aca cct gta cct gcg 1968 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 gat cct cca acg gct ttc aac aag gac aag ctg aac tct ttc atc acc 2016 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 cag tat tct act ggc caa gtc agc gtg gag att gag tgg gag ctg cag 2064 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 aag gaa aac agc aag cgc tgg aac ccg gag atc cag tac act tcc aac 2112 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 tat tac aag tct aat aat gtt gaa ttt gct gtt aat act gaa ggt gtt 2160 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 tat tct gaa ccc cgc ccc att ggc acc aga tac ctg act cgt aat ctg 2208 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 taa 2211 <210> 15 <211> 736 <212> PRT <213> adeno-associated virus hu68 <400> 15 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Val Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 16 <211> 2211 <212> DNA <213> adeno-associated virus hu68 <400> 16 atggctgccg atggttatct tccagattgg ctcgaggaca acctcagtga aggcattcgc 60 gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120 aacgctcggg gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180 aagggggagc cggtcaacga agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240 cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300 caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360 gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420 ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgt gggtattggc 480 aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540 tcagtccccg accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600 cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660 gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780 tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840 tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcaaaga 900 ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960 caggtcaaag aggttacgga caacaatgga gtcaagacca tcgctaataa ccttaccagc 1020 acggtccagg tcttcacgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080 gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta tggatacctc 1140 accctgaacg acggcagtca ggcggtgggc cgctcatcct tctactgcct ggagtacttc 1200 ccttcgcaga tgctgaggac tggcaacaac ttccagttca gctacgagtt cgagaacgtc 1260 cctttccaca gcagctacgc ccacagccag agtttggacc gcttgatgaa ccctctgatc 1320 gaccagtacc tgtactacct gtcaaagacg atcaacggtt ctggccagaa ccagcagacg 1380 ctgaagttca gcgtggccgg gcctagcaac atggccgtcc agggcagaaa ctacatccct 1440 gggcccagct accggcagca gagagtctca accactgtga ctcagaacaa caacagtgag 1500 ttcgcctggc ctggcgccag ctcttgggcc ctcaacggcc gcaactcgct gatgaaccca 1560 ggcccagcca tggccagtca caaggagggc gaggaccgtt tcttcccttt gtctggctct 1620 ctgatcttcg gcaagcaggg gaccggcaga gacaacgtgg acgcggacaa ggtcatgatc 1680 acgaacgagg aggagatcaa gaccaccaac cctgtggcaa ccgagtccta cggccaggtg 1740 gcaaccaacc accagagcgc ccaggcacag gcgcagactg gctgggtcca gaaccagggg 1800 atcctgcctg gcatggtgtg gcaggaccgt gacgtgtacc tgcagggccc tatctgggca 1860 aagatccctc acacggacgg caacttccac ccttctcctc tgatgggcgg cttcggcatg 1920 aagcacccgc ctcctcagat cctcatcaag aacactccgg tcccggcaga ccctccgacg 1980 gccttcaaca aggacaagct gaactcattc atcactcagt actccactgg ccaggtcagc 2040 gtggagatcg agtgggagct gcagaaggag aacagcaagc gttggaaccc agagatccag 2100 tacacttcca actactacaa gtctaacaac gtggagttcg ccgtcaacac tgagggtgtg 2160 tacagtgagc ctcgccctat cggcacccgg tacctcaccc gaaacttgtg a 2211 <210> 17 <211> 2211 <212> DNA <213> adeno-associated virus rh.91 <220> <221> CDS <222> (1)..(2211) <223> AAVrh.91 capsid <400> 17 atg gct gcc gat ggt tat ctt cca gat tgg ctc gag gac aac ctc tct 48 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 gag ggc att cgc gag tgg tgg gcg ctg aaa cct gga gcc ccg aaa ccc 96 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 aaa gcc aac cag caa aag cag gac gac ggc cgg ggt ctg gtg ctt cct 144 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 ggc tac aag tac ctc gga ccc ttc aac gga ctc gac aag ggg gag ccc 192 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 gtc aac gcg gcg gac gca gcg gcc ctc gag cac gac aag gcc tac gac 240 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 cag cag ctc aaa gcg ggt gac aat ccg tac ctg cgg tat aac cac gcc 288 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 gac gcc gag ttt cag gag cgt ctg caa gaa gat acg tct ttt ggg ggc 336 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 aac ctc ggg cga gca gtc ttc cag gcc aag aag cgg gtt ctc gaa cct 384 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 ttt ggt ctg gtt gag gaa gca gct aag acg gct cct gga aag aaa cgt 432 Phe Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 ccg gta gag cag tcg ccc caa gaa cca gac tcc tcc tcg ggc att ggc 480 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly 145 150 155 160 aaa tca ggc cag cag ccc gcc aaa aag aga ctc aat ttc ggt cag act 528 Lys Ser Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 ggc gac tca gag tca gtc ccc gac cct caa cct ctc gga gaa cct cca 576 Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro 180 185 190 gaa acc ccc gct gct gtg gga cct act aca atg gct tca ggc ggt ggc 624 Glu Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly 195 200 205 gca cca atg gca gac aat aac gaa ggc gcc gac gga gtg ggt aat gcc 672 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala 210 215 220 tca gga aat tgg cat tgc gat tcc aca tgg ctg ggc gac aga gtc atc 720 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile 225 230 235 240 acc acc agc acc cga acc tgg gcc ctt cct acc tac aac aac cac ctc 768 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 tac aag caa atc tcc agc gct tca acg ggg gcc agt aac gac aac cac 816 Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His 260 265 270 tac ttt ggc tac agc acc ccc tgg ggg tat ttt gat ttc aac aga ttc 864 Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe 275 280 285 cac tgc cac ttc tca cca cgt gac tgg cag cga ctc att aac aac aac 912 His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn 290 295 300 tgg gga ttc cgg ccc aag aga ctc aac ttc aag ctc ttc aac atc cag 960 Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln 305 310 315 320 gtc aag gag gtc acg acg aat gat ggc gtc aca acc atc gct aat aac 1008 Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn 325 330 335 ctt acc agc acg gtt caa gtg ttc tcg gac tcg gag tac cag ctg ccg 1056 Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro 340 345 350 tac gtc ctc ggt tct gcg cac cag ggc tgc ctc cct ccg ttc ccg gcg 1104 Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala 355 360 365 gac gta ttc atg att cct cag tac ggc tac cta acg ctc aac aat ggc 1152 Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly 370 375 380 agc cag gcc gta gga cgt tca tcc ttt tat tgc ctg gaa tat ttc cca 1200 Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro 385 390 395 400 tct caa atg ctg aga acg ggc aac aac ttt acc ttc agc tac acc ttt 1248 Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe 405 410 415 gaa gat gtg cct ttc cac agc agt tac gcg cac agc cag agc ctg gac 1296 Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp 420 425 430 agg cta atg aat cct cta atc gac cag tac ctg tat tac cta aac aga 1344 Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg 435 440 445 act cag aat caa tcc gga agt gca caa aac aag gac ttg ctg ttt agc 1392 Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser 450 455 460 cgg ggg tct cca gct ggc atg tct gtt cag ccc aaa aac tgg cta ccc 1440 Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro 465 470 475 480 ggg ccc tgt tac cga cag cag cgt gtt tct aaa aca aaa aca gac aac 1488 Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn 485 490 495 aac aac agc aac ttt acc tgg act ggt gcc tcc aaa tac aat ctg aac 1536 Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn 500 505 510 gga cgt gaa tcc atc att aac cct ggc acc gct atg gca tcc cac aag 1584 Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys 515 520 525 gac gac gaa gac aaa ttt ttt ccc atg agc ggt gtt atg att ttt ggc 1632 Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly 530 535 540 aaa gaa aat gca gga gca tca aac act gca tta gac aat gtt atg att 1680 Lys Glu Asn Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile 545 550 555 560 aca gat gaa gag gaa att aaa gct acc aac ccc gtg gcc acc gag aga 1728 Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg 565 570 575 ttt gga act gtg gca gtc aat ctc caa agc agc aat aca gac cct gca 1776 Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Asn Thr Asp Pro Ala 580 585 590 aca gga gac gtg cat gtc atg ggg gct tta cct ggc atg gtg tgg caa 1824 Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln 595 600 605 gac aga gac gtg tac ctg cag ggt ccc att tgg gcc aag att cct cac 1872 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 acg gat gga cac ttt cac ccg tct cct ctt atg ggc ggc ttt gga ctt 1920 Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu 625 630 635 640 aag cac ccg cct cct cag atc ctc atc aaa aac acg cct gtt cct gcg 1968 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 aat cct ccg gca gag ttt tcg gct aca aag ttt gct tca ttc atc acc 2016 Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr 660 665 670 cag tac tcc aca gga caa gtg agc gtg gaa att gaa tgg gag ctg cag 2064 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 aaa gaa aac agt aag cgc tgg aat cct gaa gtg cag tac acc tcc aac 2112 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn 690 695 700 tac gcg aaa tct gcc aac gtt gat ttc act gtg gac aac aat gga ctt 2160 Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu 705 710 715 720 tat act gag cct cgc ccc att ggc acc cgt tac ctt acc cgt ccc ctt 2208 Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu 725 730 735 taa 2211 <210> 18 <211> 736 <212> PRT <213> adeno-associated virus rh.91 <400> 18 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Phe Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly 145 150 155 160 Lys Ser Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro 180 185 190 Glu Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His 260 265 270 Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe 275 280 285 His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn 290 295 300 Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln 305 310 315 320 Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn 325 330 335 Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro 340 345 350 Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala 355 360 365 Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly 370 375 380 Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro 385 390 395 400 Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe 405 410 415 Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp 420 425 430 Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg 435 440 445 Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser 450 455 460 Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro 465 470 475 480 Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn 485 490 495 Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn 500 505 510 Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys 515 520 525 Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly 530 535 540 Lys Glu Asn Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile 545 550 555 560 Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg 565 570 575 Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Asn Thr Asp Pro Ala 580 585 590 Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn 690 695 700 Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu 705 710 715 720 Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu 725 730 735 <210> 19 <211> 2211 <212> DNA <213> adeno-associated virus rh.91 <400> 19 atggctgctg acggttatct tccagattgg ctcgaggaca acctttctga aggcattcgt 60 gagtggtggg ctctgaaacc tggagcccct aaacccaaag cgaaccaaca aaagcaggac 120 gacggccggg gtcttgtgct tccgggttac aaatacctcg gacccttcaa cggactcgac 180 aaaggagagc cggtcaacgc ggcggacgcg gcagccctcg aacacgacaa agcttacgac 240 cagcagctca aggccggtga caacccgtac ctccggtaca accacgccga cgccgagttt 300 caggagcgtc ttcaagaaga tacgtctttt gggggcaacc ttggcagagc agtcttccag 360 gccaaaaaga gggttcttga gccttttggt ctggttgagg aagcagctaa aacggctcct 420 ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcatcatc tggtattggc 480 aaatcgggcc agcagcctgc caaaaaaaga ctaaatttcg gtcagactgg cgactcagag 540 tcagtccccg accctcaacc tctcggagaa cctccagaaa cccccgctgc tgtgggacct 600 actacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660 gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720 accaccagca cccgaacctg ggcccttcct acctacaaca accacctcta caagcaaatc 780 tccagcgctt caacgggggc cagtaacgac aaccactact ttggctacag caccccctgg 840 gggtattttg atttcaacag attccactgc cacttctcac cacgtgactg gcagcgactc 900 attaacaaca actggggatt ccggcccaag agactcaact tcaagctctt caacatccag 960 gtcaaggagg tcacgacgaa tgatggcgtc acaaccatcg ctaataacct taccagcacg 1020 gttcaagtgt tctcggactc ggagtaccag ctgccgtacg tcctcggttc tgcgcaccag 1080 ggctgcctcc ctccgttccc ggcggacgta ttcatgattc ctcagtatgg atacctcacc 1140 ctgaacaacg gaagtcaagc ggtgggacgc tcatcctttt actgcctgga gtacttccct 1200 tcgcagatgc taaggactgg aaataacttc accttcagct ataccttcga ggatgtacct 1260 tttcacagca gctacgctca cagccagagt ttggatcgct tgatgaatcc tcttattgat 1320 cagtatctgt actacctgaa cagaacgcaa aatcaatctg gaagtgcaca aaacaaggac 1380 ctgcttttta gccgggggtc tcctgctggc atgtctgttc agcccaaaaa ttggctacct 1440 gggccctgct accggcaaca gagagtttca aagactaaaa cagacaacaa caacagtaac 1500 tttacctgga caggtgccag caaatataat ctcaatggcc gcgaatcgat cattaatcca 1560 ggaaccgcta tggccagtca caaggacgat gaagacaaat ttttccctat gagcggcgtt 1620 atgatatttg gcaaagaaaa tgcaggagca agtaacactg cattagataa tgtaatgatt 1680 acggatgaag aagagattaa agctaccaat cctgtggcaa cagagagatt tggaactgtg 1740 gcagtcaact tgcagagctc aaatacagac cccgcaactg gagacgtcca tgtcatgggg 1800 gccttacctg gcatggtgtg gcaagatcgt gacgtgtacc ttcaaggacc tatctgggca 1860 aagattcctc acacggatgg acactttcat ccttctcctc tgatgggagg ctttggactg 1920 aaacatccgc ctcctcaaat cctcatcaaa aatactccgg taccggcaaa tcctccggca 1980 gagttcagcg ctacaaagtt tgcttcattt atcactcagt actccactgg acaggtcagc 2040 gtggaaattg agtgggagct acagaaagaa aacagcaaac gttggaatcc agaggtgcag 2100 tacacttcca actacgcgaa gtctgccaat gtggacttta ctgtagacaa caatggtctt 2160 tatactgaac ctcgccctat tggaacccgg tatctcacac gacccttgta a 2211 <210> 20 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> miRNA182 targeting sequence <400> 20 agtgtgagtt ctaccattgc caaa 24 <210> 21 <211> 872 <212> PRT <213> Artificial Sequence <220> <223> hUBE3a isoform 3 amino acid sequence <400> 21 Met Ala Thr Ala Cys Lys Arg Ser Gly Glu Pro Gln Ser Asp Asp Ile 1 5 10 15 Glu Ala Ser Arg Met Lys Arg Ala Ala Ala Lys His Leu Ile Glu Arg 20 25 30 Tyr Tyr His Gln Leu Thr Glu Gly Cys Gly Asn Glu Ala Cys Thr Asn 35 40 45 Glu Phe Cys Ala Ser Cys Pro Thr Phe Leu Arg Met Asp Asn Asn Ala 50 55 60 Ala Ala Ile Lys Ala Leu Glu Leu Tyr Lys Ile Asn Ala Lys Leu Cys 65 70 75 80 Asp Pro His Pro Ser Lys Lys Gly Ala Ser Ser Ala Tyr Leu Glu Asn 85 90 95 Ser Lys Gly Ala Pro Asn Asn Ser Cys Ser Glu Ile Lys Met Asn Lys 100 105 110 Lys Gly Ala Arg Ile Asp Phe Lys Asp Val Thr Tyr Leu Thr Glu Glu 115 120 125 Lys Val Tyr Glu Ile Leu Glu Leu Cys Arg Glu Arg Glu Asp Tyr Ser 130 135 140 Pro Leu Ile Arg Val Ile Gly Arg Val Phe Ser Ser Ala Glu Ala Leu 145 150 155 160 Val Gln Ser Phe Arg Lys Val Lys Gln His Thr Lys Glu Glu Leu Lys 165 170 175 Ser Leu Gln Ala Lys Asp Glu Asp Lys Asp Glu Asp Glu Lys Glu Lys 180 185 190 Ala Ala Cys Ser Ala Ala Ala Met Glu Glu Asp Ser Glu Ala Ser Ser 195 200 205 Ser Arg Ile Gly Asp Ser Ser Gln Gly Asp Asn Asn Leu Gln Lys Leu 210 215 220 Gly Pro Asp Asp Val Ser Val Asp Ile Asp Ala Ile Arg Arg Val Tyr 225 230 235 240 Thr Arg Leu Leu Ser Asn Glu Lys Ile Glu Thr Ala Phe Leu Asn Ala 245 250 255 Leu Val Tyr Leu Ser Pro Asn Val Glu Cys Asp Leu Thr Tyr His Asn 260 265 270 Val Tyr Ser Arg Asp Pro Asn Tyr Leu Asn Leu Phe Ile Ile Val Met 275 280 285 Glu Asn Arg Asn Leu His Ser Pro Glu Tyr Leu Glu Met Ala Leu Pro 290 295 300 Leu Phe Cys Lys Ala Met Ser Lys Leu Pro Leu Ala Ala Gln Gly Lys 305 310 315 320 Leu Ile Arg Leu Trp Ser Lys Tyr Asn Ala Asp Gln Ile Arg Arg Met 325 330 335 Met Glu Thr Phe Gln Gln Leu Ile Thr Tyr Lys Val Ile Ser Asn Glu 340 345 350 Phe Asn Ser Arg Asn Leu Val Asn Asp Asp Asp Ala Ile Val Ala Ala 355 360 365 Ser Lys Cys Leu Lys Met Val Tyr Tyr Ala Asn Val Val Gly Gly Glu 370 375 380 Val Asp Thr Asn His Asn Glu Glu Asp Asp Glu Glu Pro Ile Pro Glu 385 390 395 400 Ser Ser Glu Leu Thr Leu Gln Glu Leu Leu Gly Glu Glu Arg Arg Asn 405 410 415 Lys Lys Gly Pro Arg Val Asp Pro Leu Glu Thr Glu Leu Gly Val Lys 420 425 430 Thr Leu Asp Cys Arg Lys Pro Leu Ile Pro Phe Glu Glu Phe Ile Asn 435 440 445 Glu Pro Leu Asn Glu Val Leu Glu Met Asp Lys Asp Tyr Thr Phe Phe 450 455 460 Lys Val Glu Thr Glu Asn Lys Phe Ser Phe Met Thr Cys Pro Phe Ile 465 470 475 480 Leu Asn Ala Val Thr Lys Asn Leu Gly Leu Tyr Tyr Asp Asn Arg Ile 485 490 495 Arg Met Tyr Ser Glu Arg Arg Ile Thr Val Leu Tyr Ser Leu Val Gln 500 505 510 Gly Gln Gln Leu Asn Pro Tyr Leu Arg Leu Lys Val Arg Arg Asp His 515 520 525 Ile Ile Asp Asp Ala Leu Val Arg Leu Glu Met Ile Ala Met Glu Asn 530 535 540 Pro Ala Asp Leu Lys Lys Gln Leu Tyr Val Glu Phe Glu Gly Glu Gln 545 550 555 560 Gly Val Asp Glu Gly Gly Val Ser Lys Glu Phe Phe Gln Leu Val Val 565 570 575 Glu Glu Ile Phe Asn Pro Asp Ile Gly Met Phe Thr Tyr Asp Glu Ser 580 585 590 Thr Lys Leu Phe Trp Phe Asn Pro Ser Ser Phe Glu Thr Glu Gly Gln 595 600 605 Phe Thr Leu Ile Gly Ile Val Leu Gly Leu Ala Ile Tyr Asn Asn Cys 610 615 620 Ile Leu Asp Val His Phe Pro Met Val Val Tyr Arg Lys Leu Met Gly 625 630 635 640 Lys Lys Gly Thr Phe Arg Asp Leu Gly Asp Ser His Pro Val Leu Tyr 645 650 655 Gln Ser Leu Lys Asp Leu Leu Glu Tyr Glu Gly Asn Val Glu Asp Asp 660 665 670 Met Met Ile Thr Phe Gln Ile Ser Gln Thr Asp Leu Phe Gly Asn Pro 675 680 685 Met Met Tyr Asp Leu Lys Glu Asn Gly Asp Lys Ile Pro Ile Thr Asn 690 695 700 Glu Asn Arg Lys Glu Phe Val Asn Leu Tyr Ser Asp Tyr Ile Leu Asn 705 710 715 720 Lys Ser Val Glu Lys Gln Phe Lys Ala Phe Arg Arg Gly Phe His Met 725 730 735 Val Thr Asn Glu Ser Pro Leu Lys Tyr Leu Phe Arg Pro Glu Glu Ile 740 745 750 Glu Leu Leu Ile Cys Gly Ser Arg Asn Leu Asp Phe Gln Ala Leu Glu 755 760 765 Glu Thr Thr Glu Tyr Asp Gly Gly Tyr Thr Arg Asp Ser Val Leu Ile 770 775 780 Arg Glu Phe Trp Glu Ile Val His Ser Phe Thr Asp Glu Gln Lys Arg 785 790 795 800 Leu Phe Leu Gln Phe Thr Thr Gly Thr Asp Arg Ala Pro Val Gly Gly 805 810 815 Leu Gly Lys Leu Lys Met Ile Ile Ala Lys Asn Gly Pro Asp Thr Glu 820 825 830 Arg Leu Pro Thr Ser His Thr Cys Phe Asn Val Leu Leu Leu Pro Glu 835 840 845 Tyr Ser Ser Lys Glu Lys Leu Lys Glu Arg Leu Leu Lys Ala Ile Thr 850 855 860 Tyr Ala Lys Gly Phe Gly Met Leu 865 870 <210> 22 <211> 3398 <212> DNA <213> Artificial Sequence <220> <223> expression cassette hSyn.hUbe3a-1.GSco.4XmiRNA183.SV40 <220> <221> promoter <222> (1)..(466) <223> hSynapsin <220> <221> misc_feature <222> (478)..(483) <223> Kozak <220> <221> misc_feature <222> (484)..(3045) <223> UBE3A-1 <220> <221> misc_feature <222> (3052)..(3073) <223> miRNA183 <220> <221> misc_feature <222> (3078)..(3099) <223> miRNA183 <220> <221> misc_feature <222> (3106)..(3127) <223> miRNA183 <220> <221> misc_feature <222> (3134)..(3155) <223> miRNA183 <220> <221> polyA_signal <222> (3167)..(3398) <223> SV40 late polyA <400> 22 ctgcagaggg ccctgcgtat gagtgcaagt gggttttagg accaggatga ggcggggtgg 60 gggtgcctac ctgacgaccg accccgaccc actggacaag cacccaaccc ccattcccca 120 aattgcgcat cccctatcag agagggggag gggaaacagg atgcggcgag gcgcgtgcgc 180 actgccagct tcagcaccgc ggacagtgcc ttcgcccccg cctggcggcg cgcgccaccg 240 ccgcctcagc actgaaggcg cgctgacgtc actcgccggt cccccgcaaa ctccccttcc 300 cggccacctt ggtcgcgtcc gcgccgccgc cggcccagcc ggaccgcacc acgcgaggcg 360 cgagataggg gggcacgggc gcgaccatct gcgctgcggc gccggcgact cagcgctgcc 420 tcagtctgcg gtgggcagcg gaggagtcgt gtcgtgcctg agagcgcagt cgaattcgcc 480 accatgaaga gggcagcagc aaagcacctg atcgagagat actatcacca gctgaccgag 540 ggatgcggaa acgaggcatg tacaaacgag ttctgcgcct cctgtcccac ctttctgagg 600 atggataaca acgccgccgc catcaaggcc ctggagctgt acaagatcaa cgccaagctg 660 tgcgaccccc accctagcaa gaagggcgcc agctccgcct atctggagaa ctccaagggc 720 gcccctaaca atagctgttc cgagatcaag atgaataaga agggcgcccg gatcgatttc 780 aaggacgtga cctacctgac agaggagaag gtgtacgaga tcctggagct gtgccgggag 840 agagaggatt acagcccact gatcagagtg atcggcagag tgttctctag cgccgaggcc 900 ctggtgcagt cctttagaaa ggtgaagcag cacacaaagg aggagctgaa gtctctgcag 960 gccaaggacg aggacaagga cgaggacgag aaggagaagg cagcctgttc tgccgcagca 1020 atggaggagg acagcgaggc atcctctagc cggatcggcg attcctctca aggcgacaac 1080 aatctgcaga agctgggccc cgacgacgtg agcgtggata tcgacgccat ccggagagtg 1140 tacacaagac tgctgagcaa cgagaagatc gagaccgcct tcctgaacgc cctggtgtat 1200 ctgagcccta atgtggagtg cgatctgacc taccacaacg tgtactcccg ggacccaaac 1260 tacctgaatc tgttcatcat cgtgatggag aacagaaatc tgcactcccc cgagtatctg 1320 gagatggccc tgcctctgtt ttgtaaggcc atgtccaagc tgcctctggc agcacagggc 1380 aagctgatca ggctgtggtc taagtacaac gccgatcaga tcaggcgcat gatggagacc 1440 ttccagcagc tgatcacata caaagtgatc tctaacgagt ttaatagccg caacctggtg 1500 aacgacgacg acgccatcgt ggccgcctct aagtgcctga agatggtgta ctacgccaac 1560 gtggtgggcg gcgaggtgga cacaaaccac aacgaggagg acgacgagga gccaatcccc 1620 gagagctccg agctgaccct gcaggagctg ctgggagagg agcggagaaa taagaaggga 1680 ccaagggtgg atcctctgga gaccgagctg ggcgtgaaga cactggactg cagaaagcct 1740 ctgatcccat tcgaggagtt tatcaacgag cccctgaacg aggtgctgga gatggataag 1800 gactacacct tctttaaggt ggagacagag aacaagttca gctttatgac ctgtcctttc 1860 atcctgaacg ccgtgaccaa gaatctgggc ctgtactacg ataacaggat ccgcatgtac 1920 tccgagaggc gcatcaccgt gctgtattct ctggtgcagg gccagcagct gaatccttac 1980 ctgaggctga aggtgcggag agaccacatc atcgatgacg ccctggtgcg cctggagatg 2040 atcgccatgg agaatccagc cgatctgaag aagcagctgt acgtggagtt tgagggagag 2100 cagggagtgg acgagggagg cgtgtctaag gagttctttc agctggtggt ggaggagatc 2160 ttcaaccccg atatcggcat gtttacctac gacgagagca caaagctgtt ctggtttaat 2220 ccttcttcct tcgagaccga gggccagttt acactgatcg gcatcgtgct gggcctggcc 2280 atctacaaca attgtatcct ggacgtgcac ttcccaatgg tggtgtatag gaagctgatg 2340 ggcaagaagg gcacctttcg cgatctgggc gactcccacc ccgtgctgta ccagtctctg 2400 aaggatctgc tggagtatga gggcaacgtg gaggatgaca tgatgatcac cttccagatc 2460 tcccagacag acctgtttgg caacccaatg atgtacgatc tgaaggagaa cggcgacaag 2520 atccccatca caaacgagaa tagaaaggag ttcgtgaacc tgtacagcga ttatatcctg 2580 aataagtccg tggagaagca gttcaaggcc tttaggcgcg gcttccacat ggtgaccaac 2640 gagagccctc tgaagtatct gtttaggcca gaggagatcg agctgctgat ctgcggctcc 2700 cgcaatctgg actttcaggc cctggaggag accacagagt acgacggcgg ctataccagg 2760 gactctgtgc tgatccgcga gttctgggag atcgtgcaca gctttacaga cgagcagaag 2820 cggctgttcc tgcagtttac caccggcacc gacagagcac cagtgggagg actgggcaag 2880 ctgaagatga tcatcgccaa gaacggccca gacacagaga ggctgcccac cagccacacc 2940 tgtttcaacg tgctgctgct gcccgagtac tcctctaagg agaagctgaa ggagcgcctg 3000 ctgaaggcca tcacctacgc caagggcttt ggcatgctgt gatgaggtac cagtgaattc 3060 taccagtgcc ataggatagt gaattctacc agtgccatac acgtgagtga attctaccag 3120 tgccatagca tgcagtgaat tctaccagtg ccataggcgg ccgcttcgag cagacatgat 3180 aagatacatt gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat 3240 ttgtgaaatt tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt 3300 taacaacaac aattgcattc attttatgtt tcaggttcag ggggagatgt gggaggtttt 3360 ttaaagcaag taaaacctct acaaatgtgg taaaatcg 3398 <210> 23 <211> 3294 <212> DNA <213> Artificial Sequence <220> <223> expression cassette hSyn.hUbe3a-1.GSco.SV40 <220> <221> promoter <222> (1)..(466) <223> hSynapsin promoter <220> <221> misc_feature <222> (478)..(483) <223> Kozak <220> <221> misc_feature <222> (484)..(3045) <223> UBE3A-1 <220> <221> polyA_signal <222> (3063)..(3294) <223> SV40 late polyA <400> 23 ctgcagaggg ccctgcgtat gagtgcaagt gggttttagg accaggatga ggcggggtgg 60 gggtgcctac ctgacgaccg accccgaccc actggacaag cacccaaccc ccattcccca 120 aattgcgcat cccctatcag agagggggag gggaaacagg atgcggcgag gcgcgtgcgc 180 actgccagct tcagcaccgc ggacagtgcc ttcgcccccg cctggcggcg cgcgccaccg 240 ccgcctcagc actgaaggcg cgctgacgtc actcgccggt cccccgcaaa ctccccttcc 300 cggccacctt ggtcgcgtcc gcgccgccgc cggcccagcc ggaccgcacc acgcgaggcg 360 cgagataggg gggcacgggc gcgaccatct gcgctgcggc gccggcgact cagcgctgcc 420 tcagtctgcg gtgggcagcg gaggagtcgt gtcgtgcctg agagcgcagt cgaattcgcc 480 accatgaaga gggcagcagc aaagcacctg atcgagagat actatcacca gctgaccgag 540 ggatgcggaa acgaggcatg tacaaacgag ttctgcgcct cctgtcccac ctttctgagg 600 atggataaca acgccgccgc catcaaggcc ctggagctgt acaagatcaa cgccaagctg 660 tgcgaccccc accctagcaa gaagggcgcc agctccgcct atctggagaa ctccaagggc 720 gcccctaaca atagctgttc cgagatcaag atgaataaga agggcgcccg gatcgatttc 780 aaggacgtga cctacctgac agaggagaag gtgtacgaga tcctggagct gtgccgggag 840 agagaggatt acagcccact gatcagagtg atcggcagag tgttctctag cgccgaggcc 900 ctggtgcagt cctttagaaa ggtgaagcag cacacaaagg aggagctgaa gtctctgcag 960 gccaaggacg aggacaagga cgaggacgag aaggagaagg cagcctgttc tgccgcagca 1020 atggaggagg acagcgaggc atcctctagc cggatcggcg attcctctca aggcgacaac 1080 aatctgcaga agctgggccc cgacgacgtg agcgtggata tcgacgccat ccggagagtg 1140 tacacaagac tgctgagcaa cgagaagatc gagaccgcct tcctgaacgc cctggtgtat 1200 ctgagcccta atgtggagtg cgatctgacc taccacaacg tgtactcccg ggacccaaac 1260 tacctgaatc tgttcatcat cgtgatggag aacagaaatc tgcactcccc cgagtatctg 1320 gagatggccc tgcctctgtt ttgtaaggcc atgtccaagc tgcctctggc agcacagggc 1380 aagctgatca ggctgtggtc taagtacaac gccgatcaga tcaggcgcat gatggagacc 1440 ttccagcagc tgatcacata caaagtgatc tctaacgagt ttaatagccg caacctggtg 1500 aacgacgacg acgccatcgt ggccgcctct aagtgcctga agatggtgta ctacgccaac 1560 gtggtgggcg gcgaggtgga cacaaaccac aacgaggagg acgacgagga gccaatcccc 1620 gagagctccg agctgaccct gcaggagctg ctgggagagg agcggagaaa taagaaggga 1680 ccaagggtgg atcctctgga gaccgagctg ggcgtgaaga cactggactg cagaaagcct 1740 ctgatcccat tcgaggagtt tatcaacgag cccctgaacg aggtgctgga gatggataag 1800 gactacacct tctttaaggt ggagacagag aacaagttca gctttatgac ctgtcctttc 1860 atcctgaacg ccgtgaccaa gaatctgggc ctgtactacg ataacaggat ccgcatgtac 1920 tccgagaggc gcatcaccgt gctgtattct ctggtgcagg gccagcagct gaatccttac 1980 ctgaggctga aggtgcggag agaccacatc atcgatgacg ccctggtgcg cctggagatg 2040 atcgccatgg agaatccagc cgatctgaag aagcagctgt acgtggagtt tgagggagag 2100 cagggagtgg acgagggagg cgtgtctaag gagttctttc agctggtggt ggaggagatc 2160 ttcaaccccg atatcggcat gtttacctac gacgagagca caaagctgtt ctggtttaat 2220 ccttcttcct tcgagaccga gggccagttt acactgatcg gcatcgtgct gggcctggcc 2280 atctacaaca attgtatcct ggacgtgcac ttcccaatgg tggtgtatag gaagctgatg 2340 ggcaagaagg gcacctttcg cgatctgggc gactcccacc ccgtgctgta ccagtctctg 2400 aaggatctgc tggagtatga gggcaacgtg gaggatgaca tgatgatcac cttccagatc 2460 tcccagacag acctgtttgg caacccaatg atgtacgatc tgaaggagaa cggcgacaag 2520 atccccatca caaacgagaa tagaaaggag ttcgtgaacc tgtacagcga ttatatcctg 2580 aataagtccg tggagaagca gttcaaggcc tttaggcgcg gcttccacat ggtgaccaac 2640 gagagccctc tgaagtatct gtttaggcca gaggagatcg agctgctgat ctgcggctcc 2700 cgcaatctgg actttcaggc cctggaggag accacagagt acgacggcgg ctataccagg 2760 gactctgtgc tgatccgcga gttctgggag atcgtgcaca gctttacaga cgagcagaag 2820 cggctgttcc tgcagtttac caccggcacc gacagagcac cagtgggagg actgggcaag 2880 ctgaagatga tcatcgccaa gaacggccca gacacagaga ggctgcccac cagccacacc 2940 tgtttcaacg tgctgctgct gcccgagtac tcctctaagg agaagctgaa ggagcgcctg 3000 ctgaaggcca tcacctacgc caagggcttt ggcatgctgt gatgaggtac cggcggccgc 3060 ttcgagcaga catgataaga tacattgatg agtttggaca aaccacaact agaatgcagt 3120 gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc tttatttgta accattataa 3180 gctgcaataa acaagttaac aacaacaatt gcattcattt tatgtttcag gttcaggggg 3240 agatgtggga ggttttttaa agcaagtaaa acctctacaa atgtggtaaa atcg 3294 <210> 24 <211> 3467 <212> DNA <213> Artificial Sequence <220> <223> expression cassette hSyn.hUbe3a-2.GSco.4XmiRNA183.SV40 <220> <221> promoter <222> (1)..(466) <223> hSynapsin <220> <221> misc_feature <222> (478)..(483) <223> Kozak <220> <221> misc_feature <222> (484)..(3114) <223> hUBE3A-2 <220> <221> misc_feature <222> (3121)..(3142) <223> miRNA183 <220> <221> misc_feature <222> (3147)..(3168) <223> miRNA183 <220> <221> misc_feature <222> (3175)..(3196) <223> miRNA183 <220> <221> misc_feature <222> (3203)..(3224) <223> miRNA183 <220> <221> polyA_signal <222> (3236)..(3467) <223> SV40 late polyA <400> 24 ctgcagaggg ccctgcgtat gagtgcaagt gggttttagg accaggatga ggcggggtgg 60 gggtgcctac ctgacgaccg accccgaccc actggacaag cacccaaccc ccattcccca 120 aattgcgcat cccctatcag agagggggag gggaaacagg atgcggcgag gcgcgtgcgc 180 actgccagct tcagcaccgc ggacagtgcc ttcgcccccg cctggcggcg cgcgccaccg 240 ccgcctcagc actgaaggcg cgctgacgtc actcgccggt cccccgcaaa ctccccttcc 300 cggccacctt ggtcgcgtcc gcgccgccgc cggcccagcc ggaccgcacc acgcgaggcg 360 cgagataggg gggcacgggc gcgaccatct gcgctgcggc gccggcgact cagcgctgcc 420 tcagtctgcg gtgggcagcg gaggagtcgt gtcgtgcctg agagcgcagt cgaattcgcc 480 accatggaga agctgcacca gtgctactgg aagtctggcg agcctcagag cgacgatatc 540 gaggcaagca ggatgaagag agcagcagcc aagcacctga tcgagcggta ctatcaccag 600 ctgaccgagg gctgcggaaa cgaggcctgt acaaacgagt tctgcgcctc ctgtccaacc 660 tttctgagaa tggataacaa cgccgccgcc atcaaggccc tggagctgta caagatcaac 720 gccaagctgt gcgaccccca cccttctaag aagggcgcca gctccgccta tctggagaac 780 agcaagggcg cccccaacaa tagctgttcc gagatcaaga tgaataagaa gggcgccagg 840 atcgatttca aggacgtgac ctacctgaca gaggagaagg tgtacgagat cctggagctg 900 tgccgggaga gagaggatta ctcccctctg atcagagtga tcggacgcgt gttctctagc 960 gccgaggccc tggtgcagag ctttcgcaag gtgaagcagc acacaaagga ggagctgaag 1020 tccctgcagg ccaaggacga ggacaaggac gaggacgaga aggagaaggc agcttgttcc 1080 gccgcagcaa tggaggagga ctctgaggcc tcctctagca ggatcggcga ttcctctcaa 1140 ggcgacaaca atctgcagaa gctgggcccc gacgacgtga gcgtggatat cgacgccatc 1200 cggagagtgt acacacgcct gctgtctaac gagaagatcg agaccgcctt cctgaacgcc 1260 ctggtgtatc tgtctcctaa tgtggagtgc gatctgacct accacaacgt gtacagccgg 1320 gacccaaact acctgaatct gttcatcatc gtgatggaga acagaaatct gcactctccc 1380 gagtatctgg agatggccct gcctctgttt tgtaaggcca tgagcaagct gccactggca 1440 gcacagggca agctgatcag gctgtggtcc aagtacaacg ccgatcagat caggcgcatg 1500 atggagacct tccagcagct gatcacatat aaagtgatct ccaacgagtt taattctaga 1560 aacctggtga acgacgacga cgccatcgtg gccgccagca agtgcctgaa gatggtgtac 1620 tacgccaacg tggtgggcgg cgaggtggac acaaaccaca acgaggagga cgacgaggag 1680 ccaatccccg agagctccga gctgaccctg caggagctgc tgggagagga gcggagaaat 1740 aagaagggac caagggtgga tcctctggag accgagctgg gcgtgaagac actggactgc 1800 agaaagcctc tgatcccatt cgaggagttt atcaacgagc ccctgaacga ggtgctggag 1860 atggataagg actacacctt ctttaaggtg gagacagaga acaagttcag ctttatgacc 1920 tgtcctttca tcctgaacgc cgtgaccaag aatctgggcc tgtactacga taacaggatc 1980 cgcatgtaca gcgagaggcg catcaccgtg ctgtattccc tggtgcaggg ccagcagctg 2040 aatccttacc tgaggctgaa ggtgcggaga gaccacatca tcgatgacgc cctggtgcgc 2100 ctggagatga tcgccatgga gaatccagcc gatctgaaga agcagctgta cgtggagttt 2160 gagggagagc agggagtgga cgagggaggc gtgtccaagg agttctttca gctggtggtg 2220 gaggagatct tcaaccccga tatcggcatg tttacctacg acgagtctac aaagctgttc 2280 tggtttaatc cttcttcctt cgagaccgag ggccagttta cactgatcgg catcgtgctg 2340 ggcctggcca tctacaacaa ttgtatcctg gacgtgcact tcccaatggt ggtgtatagg 2400 aagctgatgg gcaagaaggg cacctttcgc gatctgggcg acagccaccc cgtgctgtac 2460 cagtccctga aggatctgct ggagtatgag ggcaacgtgg aggatgacat gatgatcacc 2520 ttccagatct cccagacaga cctgtttggc aacccaatga tgtacgatct gaaggagaac 2580 ggcgacaaga tccccatcac aaacgagaat aggaaggagt tcgtgaacct gtactctgat 2640 tatatcctga ataagagcgt ggagaagcag ttcaaggcct ttaggcgcgg cttccacatg 2700 gtgaccaacg agtctcctct gaagtatctg tttaggccag aggagatcga gctgctgatc 2760 tgcggcagcc gcaatctgga ctttcaggcc ctggaggaga ccacagagta cgacggcggc 2820 tatacccggg actccgtgct gatcagagag ttctgggaga tcgtgcactc ttttacagac 2880 gagcagaagc ggctgttcct gcagtttacc accggcaccg acagagcacc agtgggagga 2940 ctgggcaagc tgaagatgat catcgccaag aacggcccag acacagagag gctgcccacc 3000 agccacacct gtttcaacgt gctgctgctg cccgagtact cctctaagga gaagctgaag 3060 gagcgcctgc tgaaggccat cacctacgcc aagggctttg gcatgctgtg atgaggtacc 3120 agtgaattct accagtgcca taggatagtg aattctacca gtgccataca cgtgagtgaa 3180 ttctaccagt gccatagcat gcagtgaatt ctaccagtgc cataggcggc cgcttcgagc 3240 agacatgata agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa 3300 atgctttatt tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa 3360 taaacaagtt aacaacaaca attgcattca ttttatgttt caggttcagg gggagatgtg 3420 ggaggttttt taaagcaagt aaaacctcta caaatgtggt aaaatcg 3467 <210> 25 <211> 3363 <212> DNA <213> Artificial Sequence <220> <223> expression cassette hSyn.hUbe3a-2.GSco.SV40 <220> <221> promoter <222> (1)..(466) <223> hSynapsin <220> <221> misc_feature <222> (478)..(483) <223> Kozak <220> <221> misc_feature <222> (484)..(3114) <223> hUBE3A-2 <220> <221> polyA_signal <222> (3132)..(3363) <223> SV40 PolyA <400> 25 ctgcagaggg ccctgcgtat gagtgcaagt gggttttagg accaggatga ggcggggtgg 60 gggtgcctac ctgacgaccg accccgaccc actggacaag cacccaaccc ccattcccca 120 aattgcgcat cccctatcag agagggggag gggaaacagg atgcggcgag gcgcgtgcgc 180 actgccagct tcagcaccgc ggacagtgcc ttcgcccccg cctggcggcg cgcgccaccg 240 ccgcctcagc actgaaggcg cgctgacgtc actcgccggt cccccgcaaa ctccccttcc 300 cggccacctt ggtcgcgtcc gcgccgccgc cggcccagcc ggaccgcacc acgcgaggcg 360 cgagataggg gggcacgggc gcgaccatct gcgctgcggc gccggcgact cagcgctgcc 420 tcagtctgcg gtgggcagcg gaggagtcgt gtcgtgcctg agagcgcagt cgaattcgcc 480 accatggaga agctgcacca gtgctactgg aagtctggcg agcctcagag cgacgatatc 540 gaggcaagca ggatgaagag agcagcagcc aagcacctga tcgagcggta ctatcaccag 600 ctgaccgagg gctgcggaaa cgaggcctgt acaaacgagt tctgcgcctc ctgtccaacc 660 tttctgagaa tggataacaa cgccgccgcc atcaaggccc tggagctgta caagatcaac 720 gccaagctgt gcgaccccca cccttctaag aagggcgcca gctccgccta tctggagaac 780 agcaagggcg cccccaacaa tagctgttcc gagatcaaga tgaataagaa gggcgccagg 840 atcgatttca aggacgtgac ctacctgaca gaggagaagg tgtacgagat cctggagctg 900 tgccgggaga gagaggatta ctcccctctg atcagagtga tcggacgcgt gttctctagc 960 gccgaggccc tggtgcagag ctttcgcaag gtgaagcagc acacaaagga ggagctgaag 1020 tccctgcagg ccaaggacga ggacaaggac gaggacgaga aggagaaggc agcttgttcc 1080 gccgcagcaa tggaggagga ctctgaggcc tcctctagca ggatcggcga ttcctctcaa 1140 ggcgacaaca atctgcagaa gctgggcccc gacgacgtga gcgtggatat cgacgccatc 1200 cggagagtgt acacacgcct gctgtctaac gagaagatcg agaccgcctt cctgaacgcc 1260 ctggtgtatc tgtctcctaa tgtggagtgc gatctgacct accacaacgt gtacagccgg 1320 gacccaaact acctgaatct gttcatcatc gtgatggaga acagaaatct gcactctccc 1380 gagtatctgg agatggccct gcctctgttt tgtaaggcca tgagcaagct gccactggca 1440 gcacagggca agctgatcag gctgtggtcc aagtacaacg ccgatcagat caggcgcatg 1500 atggagacct tccagcagct gatcacatat aaagtgatct ccaacgagtt taattctaga 1560 aacctggtga acgacgacga cgccatcgtg gccgccagca agtgcctgaa gatggtgtac 1620 tacgccaacg tggtgggcgg cgaggtggac acaaaccaca acgaggagga cgacgaggag 1680 ccaatccccg agagctccga gctgaccctg caggagctgc tgggagagga gcggagaaat 1740 aagaagggac caagggtgga tcctctggag accgagctgg gcgtgaagac actggactgc 1800 agaaagcctc tgatcccatt cgaggagttt atcaacgagc ccctgaacga ggtgctggag 1860 atggataagg actacacctt ctttaaggtg gagacagaga acaagttcag ctttatgacc 1920 tgtcctttca tcctgaacgc cgtgaccaag aatctgggcc tgtactacga taacaggatc 1980 cgcatgtaca gcgagaggcg catcaccgtg ctgtattccc tggtgcaggg ccagcagctg 2040 aatccttacc tgaggctgaa ggtgcggaga gaccacatca tcgatgacgc cctggtgcgc 2100 ctggagatga tcgccatgga gaatccagcc gatctgaaga agcagctgta cgtggagttt 2160 gagggagagc agggagtgga cgagggaggc gtgtccaagg agttctttca gctggtggtg 2220 gaggagatct tcaaccccga tatcggcatg tttacctacg acgagtctac aaagctgttc 2280 tggtttaatc cttcttcctt cgagaccgag ggccagttta cactgatcgg catcgtgctg 2340 ggcctggcca tctacaacaa ttgtatcctg gacgtgcact tcccaatggt ggtgtatagg 2400 aagctgatgg gcaagaaggg cacctttcgc gatctgggcg acagccaccc cgtgctgtac 2460 cagtccctga aggatctgct ggagtatgag ggcaacgtgg aggatgacat gatgatcacc 2520 ttccagatct cccagacaga cctgtttggc aacccaatga tgtacgatct gaaggagaac 2580 ggcgacaaga tccccatcac aaacgagaat aggaaggagt tcgtgaacct gtactctgat 2640 tatatcctga ataagagcgt ggagaagcag ttcaaggcct ttaggcgcgg cttccacatg 2700 gtgaccaacg agtctcctct gaagtatctg tttaggccag aggagatcga gctgctgatc 2760 tgcggcagcc gcaatctgga ctttcaggcc ctggaggaga ccacagagta cgacggcggc 2820 tatacccggg actccgtgct gatcagagag ttctgggaga tcgtgcactc ttttacagac 2880 gagcagaagc ggctgttcct gcagtttacc accggcaccg acagagcacc agtgggagga 2940 ctgggcaagc tgaagatgat catcgccaag aacggcccag acacagagag gctgcccacc 3000 agccacacct gtttcaacgt gctgctgctg cccgagtact cctctaagga gaagctgaag 3060 gagcgcctgc tgaaggccat cacctacgcc aagggctttg gcatgctgtg atgaggtacc 3120 ggcggccgct tcgagcagac atgataagat acattgatga gtttggacaa accacaacta 3180 gaatgcagtg aaaaaaatgc tttatttgtg aaatttgtga tgctattgct ttatttgtaa 3240 ccattataag ctgcaataaa caagttaaca acaacaattg cattcatttt atgtttcagg 3300 ttcaggggga gatgtgggag gttttttaaa gcaagtaaaa cctctacaaa tgtggtaaaa 3360 tcg 3363

Claims (22)

  1. 엔젤만 증후군(AS)의 치료에 유용한 재조합 아데노-관련 바이러스(rAAV)의 스톡(stock)을 포함하는 조성물로서,
    상기 rAAV가 AAV 캡시드 및 그 안에 패키징된 벡터 게놈을 포함하며, 상기 벡터 게놈이
    (a) AAV 5' 역위 말단 반복부(ITR);
    (b) UBE3A 이소형 1 단백질을 암호화하는 SEQ ID NO: 9 또는 이와 적어도 95% 동일한 서열(SEQ ID NO: 2)을 포함하는 UBE3A 핵산 서열로서, 여기서 상기 핵산 서열이 인간 세포에서 UBE3A 단백질의 발현을 조절하는 조절 요소에 작동 가능하게 연결되는 UBE3A 핵산 서열;
    (c) (b)의 UBE3A의 발현을 지시하는 조절 요소; 및
    (d) AAV 3' ITR을 포함하는 조성물.
  2. 청구항 1에 있어서, 상기 조절 요소가 뉴런 특이적 프로모터를 포함하는 조성물.
  3. 청구항 2에 있어서, 상기 뉴런 특이적 프로모터는 시냅신 프로모터인 조성물.
  4. 청구항 3에 있어서, 상기 시냅신 프로모터가 SEQ ID NO: 12의 핵산 서열을 갖는 단축(shortened) 프로모터인 조성물.
  5. 청구항 1에 있어서, 상기 조절 요소가 구성적 프로모터를 포함하는 조성물.
  6. 청구항 1 내지 5 중 어느 한 항에 있어서, 상기 조절 요소가 하나 이상의 인핸서 및 하나 이상의 인트론을 추가로 포함하는 조성물.
  7. 청구항 1 내지 6 중 어느 한 항에 있어서, 상기 조절 서열이 miR182 및/또는 miR183으로부터 선택된 후근 신경절에서의 miR에 대한 하나 이상의 표적화 서열을 추가로 포함하며, 상기 표적화 서열이 UBE3A 핵산 서열에 작동가능하게 연결된 조성물.
  8. 청구항 1 내지 7 중 어느 한 항에 있어서, 상기 조절 서열이 miR182 및/또는 miR183으로부터 선택된 후근 신경절에서의 miR에 대한 하나 이상의 표적화 서열을 추가로 포함하며, 상기 표적화 서열이 UBE3A 핵산 서열의 하류에 위치하는 조성물.
  9. 청구항 1 내지 8 중 어느 한 항에 있어서, 상기 조절 서열이 miR183에 대한 4개의 표적화 서열을 추가로 포함하며, 상기 표적화 서열이 UBE3A 핵산 서열의 하류에 위치하는 조성물.
  10. 청구항 1 내지 9 중 어느 한 항에 있어서, 상기 조절 서열이 SEQ ID NO:11의 4개의 복제물(copy)을 포함하는 조성물.
  11. 청구항 1 내지 10 중 어느 한 항에 있어서, 상기 AAV 캡시드가 AAVhu68 캡시드인 조성물.
  12. 청구항 1 내지 10 중 어느 한 항에 있어서, 상기 AAV 캡시드가 SEQ ID NO: 14 또는 SEQ ID NO: 16의 핵산 서열의 발현으로부터 생성된 AAVhu68 캡시드인 조성물.
  13. 청구항 1 내지 10 중 어느 한 항에 있어서, 상기 AAV 캡시드가 AAVrh91 캡시드인 조성물.
  14. 청구항 1 내지 10 중 어느 한 항에 있어서, 상기 AAV 캡시드가 SEQ ID NO: 17 또는 SEQ ID NO: 19의 핵산 서열의 발현으로부터 생성된 AAVrh91 캡시드인 조성물.
  15. 청구항 1 내지 14 중 어느 한 항에 있어서, 생리학적으로 적합한 담체, 완충제, 보조제 및/또는 희석제를 추가로 포함하는 수성 현탁액인 조성물.
  16. 엔젤만 증후군을 갖는 환자를 치료하는 데 사용하기 위한 청구항 1 내지 15 중 어느 한 항의 조성물.
  17. 엔젤만 증후군의 하나 이상의 증상을 치료하는 데 사용하기 위한 청구항 1 내지 15 중 어느 한 항의 조성물로서,
    선택적으로 상기 증상이 발달 지연, 지적 장애, 중증 언어 장애, 운동 실조 및/또는 간질 중 하나 이상으로부터 선택되는 조성물.
  18. 엔젤만 증후군의 치료 방법으로서,
    청구항 1 내지 15 중 어느 한 항의 조성물을 이를 필요로 하는 환자에게 투여하는 것을 포함하는 방법.
  19. 뉴런에서 UBE3A 발현이 결손된 환자에서 엔젤만 증후군의 하나 이상의 증상을 치료하는 방법으로서,
    청구항 1 내지 15 중 어느 한 항의 조성물을 전달하는 것을 포함하는 방법.
  20. 청구항 18 또는 19에 있어서, 상기 증상이 발달 지연, 지적 장애, 중증 언어 장애, 운동 실조 및/또는 간질 중 하나 이상으로부터 선택되는 방법.
  21. 청구항 1 내지 15, 청구항 16 또는 17, 또는 청구항 18 내지 20 중 어느 한 항에 있어서, 상기 조성물이 환자에게 경막내로 전달되는 조성물, 용도, 또는 치료 방법.
  22. 청구항 1 내지 15, 청구항 16 또는 17, 또는 청구항 18 내지 20 중 어느 한 항에 있어서, 환자에게 적어도 1 x 1010 GC/rAAV kg 내지 1 x 1013 GC/rAAV kg으로 주사되는 조성물, 용도, 또는 치료 방법.
KR1020237021519A 2020-12-01 2021-12-01 엔젤만 증후군의 치료를 위한 조성물 및 이의 용도 KR20230128001A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202063119860P 2020-12-01 2020-12-01
US63/119,860 2020-12-01
US202163179807P 2021-04-26 2021-04-26
US63/179,807 2021-04-26
PCT/US2021/061346 WO2022119890A1 (en) 2020-12-01 2021-12-01 Compositions and uses thereof for treatment of angelman syndrome

Publications (1)

Publication Number Publication Date
KR20230128001A true KR20230128001A (ko) 2023-09-01

Family

ID=80123326

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237021519A KR20230128001A (ko) 2020-12-01 2021-12-01 엔젤만 증후군의 치료를 위한 조성물 및 이의 용도

Country Status (9)

Country Link
US (1) US20230414785A1 (ko)
EP (1) EP4255500A1 (ko)
JP (1) JP2023551911A (ko)
KR (1) KR20230128001A (ko)
AU (1) AU2021392642A1 (ko)
CA (1) CA3200192A1 (ko)
IL (1) IL303239A (ko)
MX (1) MX2023006445A (ko)
WO (1) WO2022119890A1 (ko)

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NZ532635A (en) 2001-11-13 2007-05-31 Univ Pennsylvania A method of identifying unknown adeno-associated virus (AAV) sequences and a kit for the method
PT1453547T (pt) 2001-12-17 2016-12-28 Univ Pennsylvania Sequências do vírus adeno-associado (aav) do serotipo 8, vetores contendo as mesmas, e utilizações destas
ES2648241T3 (es) 2003-09-30 2017-12-29 The Trustees Of The University Of Pennsylvania Clados de virus adenoasociados (AAV), secuencias, vectores que contienen el mismo, y usos de los mismos
ES2525067T3 (es) 2005-04-07 2014-12-17 The Trustees Of The University Of Pennsylvania Método de incremento de la función de un vector de AAV
WO2007120542A2 (en) 2006-03-30 2007-10-25 The Board Of Trustees Of The Leland Stanford Junior University Aav capsid library and aav capsid proteins
MX2011004859A (es) 2008-11-07 2011-08-03 Massachusetts Inst Technology Lipidoides de aminoalcohol y usos de los mismos.
US9315825B2 (en) 2010-03-29 2016-04-19 The Trustees Of The University Of Pennsylvania Pharmacologically induced transgene ablation system
CA2793633A1 (en) 2010-03-29 2011-10-13 The Trustees Of The University Of Pennsylvania Pharmacologically induced transgene ablation system
CA2818689C (en) 2010-11-22 2021-09-21 Callidus Biopharma, Inc. Novel signal sequences to improve protein expression and secretion of recombinant enzymes and other proteins
TR201910686T4 (tr) 2011-06-08 2019-08-21 Translate Bio Inc Mrna iletimine yönelik lipit nanopartikül bileşimleri ve yöntemler.
FR2977562B1 (fr) 2011-07-06 2016-12-23 Gaztransport Et Technigaz Cuve etanche et thermiquement isolante integree dans une structure porteuse
ES2826203T3 (es) 2012-06-08 2021-05-17 Ethris Gmbh Suministro pulmonar de ARN mensajero
US9567369B2 (en) 2012-08-03 2017-02-14 A.T. Still University Method of treating metastatic cancer
WO2015038958A1 (en) 2013-09-13 2015-03-19 California Institute Of Technology Selective recovery
KR102307276B1 (ko) 2014-02-28 2021-09-30 알마마 테르 스투디오룸 유니베르시타‘ 디 볼로냐 Tatk―cdkl5 융합 단백질, 그의 조성물, 제형 및 용도
US11015173B2 (en) 2015-12-11 2021-05-25 The Trustees Of The University Of Pennsylvania Scalable purification method for AAV1
US11098286B2 (en) 2015-12-11 2021-08-24 The Trustees Of The University Of Pennsylvania Scalable purification method for AAV9
IL300254A (en) * 2016-02-05 2023-03-01 Univ Emory Administration of single-stranded or self-complementary adeno-associated virus 9 by injection into cerebrospinal fluid for the purposes of gene therapy in the central nervous system
US20210268072A1 (en) 2016-06-28 2021-09-02 Alma Mater Studiorum - Universitá Di Bologna TATk-CDKL5 Fusion Proteins, Compositions, Formulations, and Use Thereof
RS65241B1 (sr) 2017-02-28 2024-03-29 Univ Pennsylvania Vektor adeno-asociranih virusa (aav) iz podgrupe f i njegove upotrebe
CA3068304A1 (en) 2017-06-28 2019-01-03 University Of South Florida Modified ube3a gene for a gene therapy approach for angelman syndrome
WO2019108924A2 (en) 2017-11-30 2019-06-06 Amicus Therapeutics, Inc. Cdkl5 expression variants and cdkl5 fusion proteins
JP2021521851A (ja) 2018-04-30 2021-08-30 アミカス セラピューティックス インコーポレイテッド 遺伝子治療構築物及び使用方法
JP2021527087A (ja) * 2018-06-14 2021-10-11 オービッド・セラピューティクス・インコーポレイテッドOvid Therapeutics Inc. アンジェルマン症候群の処置におけるMIR−92aまたはMIR−145の使用
JP2022517174A (ja) 2018-12-21 2022-03-07 ザ・トラステイーズ・オブ・ザ・ユニバーシテイ・オブ・ペンシルベニア 導入遺伝子発現のdrg特異的低減のための組成物
BR112021020545A2 (pt) 2019-04-29 2022-01-04 Univ Pennsylvania Capsídeos de aav e composições contendo os mesmos
US20220241434A1 (en) * 2019-05-22 2022-08-04 The University Of North Carolina At Chapel Hill Ube3a genes and expression cassettes and their use
IT201900008877A1 (it) 2019-06-13 2020-12-13 Univ Bologna Alma Mater Studiorum Nuovi costrutti per terapia genica
CN115087458A (zh) 2019-10-10 2022-09-20 阿米库斯治疗学公司 变体igf2构建体
KR20220106981A (ko) 2019-10-30 2022-08-01 아미쿠스 세라퓨틱스, 인코포레이티드 재조합 cdkl5 단백질, 유전자 치료 및 생산 방법

Also Published As

Publication number Publication date
US20230414785A1 (en) 2023-12-28
MX2023006445A (es) 2023-08-10
CA3200192A1 (en) 2022-06-09
JP2023551911A (ja) 2023-12-13
WO2022119890A9 (en) 2023-07-27
WO2022119890A1 (en) 2022-06-09
AU2021392642A1 (en) 2023-06-22
IL303239A (en) 2023-07-01
EP4255500A1 (en) 2023-10-11

Similar Documents

Publication Publication Date Title
JP7384797B2 (ja) ムコ多糖症iiib型のための遺伝子療法
JP7389744B2 (ja) ムコ多糖症iiia型のための遺伝子療法
US20220370638A1 (en) Compositions and methods for treatment of maple syrup urine disease
CA3176788A1 (en) Compositions useful in treatment of cdkl5 deficiency disorder (cdd)
US20230323390A1 (en) Methods and compositions for expressing phenylalanine hydroxylase
KR20230128001A (ko) 엔젤만 증후군의 치료를 위한 조성물 및 이의 용도
JP2023526923A (ja) ポンペ病の治療に有用な組成物
CN116670159A (zh) 组合物及其用于治疗安格尔曼综合征的用途
US20240115733A1 (en) Compositions and methods for treatment of niemann pick type a disease
AU2022290521A1 (en) Recombinant adeno-associated viruses for lesch-nyhan disorders and uses thereof
WO2023086928A2 (en) Gene therapy for treatment of mucopolysaccharidosis iiia
WO2024044340A1 (en) Methods and compositions for the production of recombinant adeno-associated virus (raav) vectors
JP2024515612A (ja) 球脊髄性筋萎縮症(sbma)の治療に有用な組成物
JP2023509443A (ja) 改善されたaav-abcd1コンストラクトならびに副腎白質ジストロフィー(ald)および/または副腎脊髄ニューロパチー(amn)の処置または予防のための使用
JP2023534037A (ja) シャルコー・マリー・トゥース病の治療に有用な組成物
NZ753155B2 (en) Promoters, expression cassettes, vectors, kits, and methods for the treatment of achromatopsia and other diseases
NZ713958A (en) Promoters, expression cassettes, vectors, kits, and methods for the treatment of achromatopsia and other diseases