KR20230003569A

KR20230003569A - Cdkl5 결핍 장애 (cdd)의 치료에 유용한 조성물

Info

Publication number: KR20230003569A
Application number: KR1020227041749A
Authority: KR
Inventors: 제임스 엠. 윌슨; 랄프 슈미트
Original assignee: 더 트러스티스 오브 더 유니버시티 오브 펜실베니아
Priority date: 2020-04-27
Filing date: 2021-04-26
Publication date: 2023-01-06
Also published as: BR112022021762A2; WO2021222118A1; AU2021262735A1; CO2022016956A2; CN115885040A; CA3176788A1; JP2023524437A; EP4150051A1; IL297635A; US20230167455A1; MX2022013504A

Abstract

AAV 캡시드, 및 기능적 CDKL5 (hCDKL5)를 인코딩하는 핵산 서열을 포함하는 벡터 게놈을 갖는 재조합 아데노 관련 바이러스 (rAAV)가 제공된다. 또한, rAAV, rAAV를 포함하는 약제학적 조성물, 및 rAAV의 유효량을 이를 필요로 하는 대상체에게 투여하는 것에 의해 CDD에 걸린 대상체를 치료하거나, CDD의 증상을 완화시키거나, CDD의 진행을 지연시키는 방법이 제공된다.

Description

CDKL5 결핍 장애 (CDD)의 치료에 유용한 조성물

CDKL5 결핍 장애 (CDD)는 어린 아동을 침범하는 중증 신경발달 장애이다. 내재한 원인으로는 X-연관된 사이클린 의존성 키나제-유사 5 유전자의 돌연변이로 인한 CDKL5 단백질 발현의 결여 (남성의 멘델 유전, MIM: 300203; 이전에 STK9로서 알려짐)이고, EIEE2 (MIM: 300672), 영아 간질성 뇌병증의 형태 [Bahi-Buisson, N. et al.. Key clinical features to identify girls with CDKL5 mutations. Brain, 131: 2647-2661, doi:10.1093/brain/awn197 (2008)], 및 유아 연축 [Fehr, S. et al.. Eur. J. Hum. Genet., 21: 266-273, doi:10.1038/ejhg.2012.156 (2013); Kalscheuer, V. M. et al., American Journal of Human Genetics, 72: 1401-1411, doi:10.1086/375538 (2003); Tao, J. et al. American Journal of Human Genetics, 75: 1149-1154, doi:10.1086/426460 (2004); Weaving, L. S. et al., American Journal of Human Genetics, 75: 1079-1093, doi:10.1086/426462 (2004)]을 포함하는 일정 범위의 표현형을 유도한다. 특징적인 조기 발병 간질에 추가하여, 표현형은 반복적인 손 운동, 중증 정신운동 지체 및 일반 긴장저하증과 같은 많은 기타 특징도 포함할 수 있다. 출생 직후 증상의 발병은 CDKL5가 뇌 발달에서 중요한 역할을 담당함을 가리킨다. 또한, CDKL5는 성숙한 어른 신경계 내에서 발현된다. CDKL5는 세포 몸통의 핵과 세포질 및 수상돌기를 포함한 세포 전체에 걸쳐 발현된다.

CDKL5 유전자 돌연변이는 진행성 신경 발달 장애인 CDD의 대다수 사례의 원인, 및 여성에서 인지 무능의 가장 공통적인 원인 중 하나이다. CDD를 유발하는 유전적 돌연변이를 갖는 남성은 호된 방식으로 영향을 받는다. 이들 중 대부분은 출생 이전에 또는 영아 시절에 사망한다. 예로, ninds.nih.gov/Disorders/Patient-Caregiver-Education/Fact-Sheets/Rett-Syndrome-Fact-Sheet 및 omim.org/entry/312750 참조.

현재까지, CDD가 치유되지 않으며, 치료는 질환 증상을 완화시키는데 중점을 둔다. 많은 사례에서, 발작은 거의 통제되지 않고, 따라서 신규한 치료적 접근법을 찾아야 할 의학적 필요가 시급하다.

본원에서는 필요로 하는 대상체에서 CDKL5 결핍 장애 (CDD)를 치료하는데 유용한 재조합 아데노 관련 바이러스 (rAAV)가 제공된다. rAAV는 역전된 말단 반복서열 (ITR), 및 표적 세포에서 hCDKL5 발현을 안내하는 조절 서열의 제어 하에 기능적 인간 CDKL5 단백질을 인코딩하는 신규한 핵산 서열을 포함하고 벡터 게놈을 보유한다.

특정 구현예에서, CDD를 치료하는데 유용한 재조합 아데노 관련 바이러스 (rAAV)가 제공된다. rAAV는 (a) AAV 캡시드; 및 (b) (a)의 AAV 캡시드에 포장된 벡터 게놈을 포함하고, 벡터 게놈은 역전된 말단 반복서열 (ITR), 및 중앙 신경계 세포에서 hCDKL5 발현을 안내하는 조절 서열의 제어 하에 기능적 인간 CDKL5 (hCDKL5)를 인코딩하는 핵산 서열을 포함하며, hCDKL5 코딩 서열은 서열번호 3의 뉴클레오티드 699번 내지 3581번 (서열번호 22) 또는 서열번호 3의 뉴클레오티드 699번 내지 3581번 (서열번호 22)과 적어도 약 95% 일치하는 서열을 포함한다. 특정 구현예에서, 기능적 hCDKL5는 서열번호 2의 아미노산 서열을 갖는다. 특정 구현예에서, 조절 서열은 유비퀴틴 C (UbC) 프로모터를 포함한다. 일부 구현예에서, 조절 서열은 WPRE 요소를 포함한다.

특정 구현예에서, CDD를 치료하는데 유용한, 기능적 인간 CDKL5 (hCDKL5)가 hCDKL5 이소형 2인 재조합 아데노 관련 바이러스 (rAAV)가 제공된다. 특정 구현예에서, CDD를 치료하는데 유용한, 기능적 인간 CDKL5 (hCDKL5)가 hCDKL5 이소형 3인 재조합 아데노 관련 바이러스 (rAAV)가 제공된다. 특정 구현예에서, CDD를 치료하는데 유용한, 기능적 인간 CDKL5 (hCDKL5)가 hCDKL5 이소형 4인 재조합 아데노 관련 바이러스 (rAAV)가 제공된다.

특정 구현예에서, CDD를 치료하는데 유용한 rAAV는 AAV9 캡시드를 포함한다. 특정 구현예에서, CDD를 치료하는데 유용한 rAAV는 AAVhu68 캡시드를 포함한다. 특정 구현예에서, CDD를 치료하는데 유용한 rAAV는 AAVrh91 캡시드를 포함한다.

특정 구현예에서, CDKL5-2GS 코딩 서열은 서열번호 6을 인코딩하는 서열번호 24 또는 이와 적어도 95% 일치하는 서열이다. 특정 구현예에서, CDKL5-3GS 코딩 서열은 서열번호 8을 인코딩하는 서열번호 25 또는 이와 적어도 95% 일치하는 서열이다. 특정 구현예에서, CDKL5-4GS 코딩 서열은 서열번호 10을 인코딩하는 서열번호 26 또는 이와 적어도 95% 일치하는 서열이다.

특정 구현예에서, 벡터 게놈은 hCDKL5의 3' 미번역 영역에서 등쪽 뿌리 신경절 (drg) 특이적 miRNA 표적 서열의 적어도 2개의 일렬 반복서열을 포함하고, 적어도 2개의 일렬 반복서열은 동일하거나 상이하고, miR-183 또는 miR-182를 표적할 수 있는 적어도 제 1 miRNA 표적 서열 및 적어도 제 2 miRNA 표적 서열을 포함한다.

특정 구현예에서, rAAV 이외의 벡터가 본원에 기술된 발현 카세트의 전달에 사용된다. 벡터는 재조합 파보바이러스, 재조합 렌티바이러스, 재조합 레트로바이러스 또는 재조합 아데노바이러스; 또는 노출 DNA, 노출 RNA, 무기 입자, 지질 입자, 중합체 기반의 벡터 또는 키토산 기반의 제형물로부터 선택된 비-바이러스성 벡터일 수 있다.

특정 구현예에서, 본원에 기술된 rAAV의 스톡 또는 다른 바이러스성 벡터 및 수성 현탁 매질을 포함하는 조성물이 제공된다.

특정 구현예에서, CDD를 치료하는 방법으로서, 본원에 기술된 rAAV 또는 다른 벡터의 유효량을 이를 필요로 하는 대상체에게 투여하는 것을 포함하는, 방법이 제공된다.

특정 구현예에서, 본원에 기술된 벡터를 생산하는데 유용한 rAAV 생산 시스템이 제공된다.

특정 구현예에서, 발현 카세트를 포함하는 벡터로서, 발현 카세트는 hCDKL5 발현을 안내하는 조절 서열의 제어 하에 기능적 인간 CDKL5-co1 (hCDKL5)을 인코딩하는 핵산 서열을 포함하고, hCDKL5 코딩 서열은 서열번호 22 또는 서열번호 22와 적어도 약 95% 일치하는 서열인, 벡터가 제공된다. 특정 구현예에서, 발현 카세트를 포함하는 벡터로서, 발현 카세트는 hCDKL5-2GS 발현을 안내하는 조절 서열의 제어 하에 기능적 인간 CDKL5-2GS (hCDKL5-2GS)를 인코딩하는 핵산 서열을 포함하고, hCDKL5-2GS 코딩 서열은 서열번호 24 또는 서열번호 24와 적어도 약 95% 일치하는 서열인, 벡터가 제공된다. 특정 구현예에서, 발현 카세트를 포함하는 벡터로서, 발현 카세트는 hCDKL5-3GS 발현을 안내하는 조절 서열의 제어 하에 기능적 인간 CDKL5-3GS (hCDKL5-3GS)를 인코딩하는 핵산 서열을 포함하고, hCDKL5-3GS 코딩 서열은 서열번호 25 또는 서열번호 25와 적어도 약 95% 일치하는 서열인, 벡터가 제공된다. 특정 구현예에서, 발현 카세트를 포함하는 벡터로서, 발현 카세트는 hCDKL5-4GS 발현을 안내하는 조절 서열의 제어 하에 기능적 인간 CDKL5-4GS (hCDKL5-4GS)를 인코딩하는 핵산 서열을 포함하고, hCDKL5-2GS 코딩 서열은 서열번호 26 또는 서열번호 26과 적어도 약 95% 일치하는 서열인, 벡터가 제공된다.

특정 구현예에서, 벡터 게놈은 등쪽 뿌리 신경절 (drg) 특이적 miRNA 표적 서열의 적어도 2개의 일렬 반복서열을 추가로 포함한다. 특정 구현예에서, rAAV 또는 rAAV를 포함하는 조성물은 CDD의 증상을 완화시키고/거나 CDD의 진행을 지연시키도록 이를 필요로 하는 대상체에게 투여가능하다.

추가의 양태에서, 본원에 기술된 rAAV 또는 벡터 및 수성 현탁 매질을 포함하는 조성물이 본원에 제공된다.

또 다른 양태에서, CDD에 걸린 대상체를 치료하거나, CDD의 증상을 완화시키거나, CDD의 진행을 지연시키는 방법이 제공된다. 방법은 본원에 기술된 rAAV 또는 벡터의 유효량을 이를 필요로 하는 대상체에게 투여하는 것을 포함한다. 특정 구현예에서, 벡터 또는 rAAV는 대수조내 주사 (ICM)을 통해 환자에게 투여가능하다.

본 발명의 이들 및 다른 양태는 하기 본 발명의 상세한 설명으로부터 자명하다.

도 1a는 5' AAV 역전된 말단 반복서열 (ITR), 뉴런 프로모터, 조작된 인간 CDKL5 DNA 코딩 서열, 인핸서 및 폴리 A를 포함하는 발현 카세트, 및 3' AAV ITR을 포함하는 AAV CDKL5 벡터 게놈에 대한 AAV 벡터 설계를 나타낸다. 도 1b는 5' AAV ITR, 유니퀴틴 C (UbC) 프로모터, 조작된 인간 CDKL5 DNA 코딩 서열, drg 탈표적화 miRNA 및 폴리 A를 포함하는 발현 카세트, 및 3' AAV ITR을 포함하는 AAV CDKL5 벡터 게놈에 대한 AAV 벡터 설계를 나타낸다. 도 1c는 5' AAV ITR, 닭 베타-액틴 혼성 프로모터 (CBh), 조작된 인간 CDKL5 DNA 코딩 서열, drg 탈표적화 miRNA 및 폴리 A를 포함하는 발현 카세트, 및 3' AAV ITR을 포함하는 AAV CDKL5 벡터 게놈에 대한 AAV 벡터 설계를 나타낸다.
도 2a 및 도 2b는 CDKL5 항체 (S957D, 던디 대학교, UK)를 사용하여 평가된 바, 마우스 해마의 분석을 나타낸다. 마우스에게 신생아 뇌실내 주사를 통해 5 × 10¹⁰개 GC AAV-hSyn-CDKL5-1co.WPRE를 처리하였다. 도 2a는 PBS를 주사한 야생형 마우스, PBS를 주사한 KO 마우스 및 처리된 KO 마우스에서 CDKL5/튜불린 수준을 도시하는 웨스턴 블럿팅에 의해 CDKL5 발현을 나타낸다. 도 2b는 PBS를 주사한 야생형 마우스, PBS를 주사한 KO 마우스 및 처리된 KO 마우스에서 pS222EB2 (Baltussen et al., 2018) 수준을 사용하여 결정된 CDKL5 활성을 나타낸다.
도 3은 CDD 마우스 모델에서 AAV-hSyn-hCDKL5-1co.WPRE 주사 이후에 마우스 성숙 및 생존의 그래프를 나타낸다. 모든 주사된 마우스는 처리에서 생존하고, 체중이 증가하였다. 이들 마우스는 유해 결과의 명백한 징후를 드러내지 않았다.
도 4는 AAV-hSyn-CDKL5-1co.WPRE를 투여한 CDD 마우스에서 행동 평가로부터 나온 결과를 나타낸다. 이러한 도면은 위험 감수, 호기심 및 근심 사이의 균형감을 평가하는 상승된 제로 미로로부터 생성된다. 첫 번째 막대는 PBS를 주사한 야생형 마우스를 나타낸다. 야생형 마우스는 호기심이 많지만 주의력이 없고, 개방 시 제한된 시간을 보낸다. 중간 막대는 근심 감소를 나타내면서 개방 시 더 많은 시간을 보내는 PBS만 주사된 Cdkl5-ko 마우스를 나타내고, 이들은 개방 영역에 더 빈번하게 진입하였다. AAV-CDKL5 처리 이후, Cdkl5-ko 마우스의 행동은 야생형 행동으로 역전된다 (개방 영역에서 시간, 및 폐쇄 영역으로부터 개방 영역 내로 진입).
도 5a 및 도 5b는 AAV-hSyn-CDKL5-1co.WPRE를 투여한 CDD 마우스에서 행동 평가로부터 나온 결과를 나타낸다. 도 5a는 빔 파손/상자 대비 시간 (분)으로서 좌표화된, 개방 장소 운동장에서 마우스의 탐색 활동을 나타낸다. 점선은 호기심이 많지만 10분 이내에 장소를 탐색하고 진정하는 야생형 마우스를 나타내지만, 긴 대시선은 Cdkl5-ko 마우스가 탐색에 더 긴 시간이 걸리지만 궁극적으로 진정하는 것을 나타낸다. 대시선 및 점선은 AAV-CDKL5 처리 이후에 Cdkl5-ko 마우스의 활동이 감소되고, 전반적 활동 수준이 야생형을 닮아가는 것을 나타낸다. 도 5b는 마우스에 의한 총 빔 파손의 누적 활동 데이터를 나타내고, 이는 도 5a의 결과를 검증하고 있다.
도 6은 연속적 3일에 걸쳐 마우스의 운동 활동 및 민첩성 평가에서 측정된 하강까지의 잠복기 (초)의 그래프를 나타낸다. 야생형 마우스는 시간 경과 시 학습하면서 수행력을 증가시키는 것으로 관찰된다. Cdkl5-ko 마우스는 아마도 이전에 관찰된 초기 과다활동으로 인해 야생형 마우스와 비교하여 향상된 수행력을 나타낸다. AAV-hSyn-CDKL5-1co.WPRE. 처리 이후에, Cdkl5-ko 마우스의 행동은 야생형 행동으로 역전되지 않는다.
도 7a 및 도 7b는 해마 학습 및 기억 (Y-미로)의 결과를 나타낸다. 도 7a는 테스트 실험군 및 2가지 대조군에 대한 자발적인 변경 백분율을 나타난다. 도 7b는 테스트 실험군 및 2가지 대조군의 경우에 이동 거리 (m)을 나타낸다. 야생형 마우스는 최근에 방문하지 않은 미로 방면을 탐색하는 강한 경향성 (자발적인 변경 행동)을 나타낸다.
도 8a 내지 도 8d는 발현 이소형 1, 이소형 2, 이소형 3 또는 이소형 4에 대한 AAV.CDKL5 벡터 구조물의 CDKL5 발현 수준 또는 활성을 나타낸다. 도 8a는 비히클을 주사한 야생형 마우스 및 비히클을 주사한 녹아웃 마우스와 비교하여, AAV 벡터를 주사한 녹아웃 마우스 (5 × 10¹⁰개 GC, 신생 ICV)에서 CDKL5 이소형 1, 2, 3 및 4의 정량화된 발현 수준을 나타낸다. 도 8b는 처리된 야생형 마우스 (비히클 (PBS)이 주사됨), 녹아웃 마우스 (비히클 또는 AAV.CDKL5-1co가 주사됨)로부터 나온 조직의 웨스턴 블럿 분석에 의해 pS222EB2의 정량화된 신호로부터 결정된 CDKL5 활성을 나타낸다. 도 8c는 처리된 야생형 마우스 (비히클 (PBS)가 주사됨), 녹아웃 마우스 (비히클 또는 AAV.CDKL5 이소형 1, 2, 3 또는 4가 주사됨 (도 8a))로부터 나온 조직의 웨스턴 블럿 분석에 의해 pS222EB2의 정량화된 신호로부터 결정된 CDKL5 활성을 나타낸다. 도 8d는 KO 마우스에서 이소형 1의 정량화된 CDKL5 발현 수준을 나타낸다.
도 9a 내지 도 9f는 녹아웃 및 야생형 마우스에서 상이한 벡터 용량 (5 × 10¹⁰개 GC, 2.5 × 10¹⁰개 GC, 1 × 10¹⁰개 GC 및 5 × 10⁹개 GC)을 비교하는 마우스 연구에서 AAV.CDKL5 유전자 요법의 치료 효능을 나타낸다. 도 9a는 5 × 10¹⁰개 GC 용량의 AAV.CDKL5 또는 PBS로 처리된 마우스에 대한 10주 기간에 걸친 체중 증가 (g)을 나타낸다. 도 9b는 2.5 × 10¹⁰개 GC 용량의 AAV.CDKL5 또는 PBS로 처리된 마우스에 대한 10주 기간에 걸친 체중 증가 (g)을 나타낸다. 도 9c는 미처리된 Cdkl5-ko 마우스와 비교하여 5 × 10¹⁰개 GC 용량의 AAV.CDKL5 처리된 실험군에 대한 뒷다리 접기 테스트의 용량 의존적 결과를 나타낸다. 도 9d는 미처리된 Cdkl5-ko 마우스와 비교하여 2.5 × 10¹⁰개 GC 용량의 AAV.CDKL5 처리된 실험군에 대한 뒷다리 접기 테스트의 용량 의존적 결과를 나타낸다. 도 9e는 미처리된 Cdkl5-ko 마우스와 비교하여 1 × 10¹⁰개 GC 용량의 AAV.CDKL5 처리된 실험군에 대한 뒷다리 접기 테스트의 용량 의존적 결과를 나타낸다. 도 9c는 미처리된 Cdkl5-ko 마우스와 비교하여 6 × 10⁹개 GC 용량의 AAV.CDKL5 처리된 실험군에 대한 뒷다리 접기 테스트의 용량 의존적 결과를 나타낸다. 야생형 마우스는 접기를 나타내지 않는 반면, KO 마우스는 현저한 접기를 나타내었다. 처리 이후에, KO 마우스는 접기의 유의한 감소를 나타내었다. 주사된 야생형 마우스는 영향을 받지 않았다.
도 10a 내지 도 10e는 CDD KO 마우스 연구에서 AAV.CDKL5 유전자 요법의 치료 효능을 나타낸다. 도 10a는 미처리된 Cdkl5-ko 마우스와 비교하여 5 × 10¹⁰개 GC 용량의 AAV.CDKL5 처리된 실험군에 대한 둥지 건축 (둥지 품질/점수)의 결과를 나타낸다. 도 10b는 야생형 및 Cdkl5-ko 마우스와 비교하여 5 × 10¹⁰개 GC 용량의 AAV.CDKL5 처리된 실험군에서 정규화 경향성의 대리석 매장 작업으로부터의 결과를 나타낸다. 도 10c는 미처리된 Cdkl5-ko 마우스와 비교하여 2.5 × 10¹⁰개 GC 용량의 AAV.CDKL5 처리된 실험군에 대한 둥지 건축 (둥지 품질/점수)의 결과를 나타낸다. 도 10d는 야생형 및 미처리된 Cdkl5-ko 마우스와 비교하여 2.5 × 10¹⁰개 GC 용량의 AAV.CDKL5 처리된 실험군에서 정규화된 대리석 매장 작업으로부터의 결과를 나타낸다. 도 10e는 미처리된 Cdkl5-ko 마우스와 비교하여 1 × 10¹⁰개 GC 용량의 AAV.CDKL5 처리된 실험군에 대한 둥지 건축 (둥지 품질/점수)의 결과를 나타낸다.
도 11a 내지 도 11f는 개방 장소 활동 테스트에서 평가된 AAV.CDKL5가 처리된 KO 마우스에서 과다활동의 교정을 나타낸다. 도 11a는 5 × 10¹⁰개 GC 용량의 AAV.CDKL5 처리된 KO 마우스에서 보행 활동/상자 대 시간 (5분 간격으로 30분)을 나타낸다. 도 11b는 5 × 10¹⁰개 GC 용량의 AAV.CDKL5 처리된 KO 마우스에서 총 활동을 나타낸다. 도 11c는 2.5 × 10¹⁰개 GC 용량의 AAV.CDKL5 처리된 KO 마우스에서 보행 활동/상자 대 시간 (5분 간격으로 30분)을 나타낸다. 도 11d는 2.5 × 10¹⁰개 GC 용량의 AAV.CDKL5 처리된 KO 마우스에서 총 활동을 나타낸다. 도 11e는 6 × 10⁹개 GC 용량의 AAV.CDKL5 처리된 KO 마우스에서 보행 활동/상자 대 시간 (5분 간격으로 30분)을 나타낸다. 도 11f는 6 × 10⁹개 GC 용량의 AAV.CDKL5 처리된 KO 마우스에서 총 활동을 나타낸다. 위험 감수 증가의 정규화가 상승된 제로 미로에서 관찰되었으며, 해마 학습 결함의 정규화는 AAV.CDKL5 처리된 KO 마우스의 Y-미로에서 관찰된다.
도 12는 CDKL5 이소형 2 내지 4의 발현이 KO 마우스에서 5 × 10¹⁰개 GC 용량으로 평가될 때 뒷다리 접기 표현형의 유의한 교정을 제공함을 나타낸다.
도 13a 내지 도 13d는 5 × 10¹⁰개 GC 용량 이소형이 처리된 KO 마우스에서 강한 교정 경향성을 나타낸다. 도 13a는 5 × 10¹⁰개 GC 용량의 AAV.CDKL5 이소형 1로 처리된 KO 마우스에서 상승된 영역 활동을 나타낸다. 도 13b는 2.5 × 10¹⁰개 GC 용량의 AAV.CDKL5 이소형 1로 처리된 KO 마우스에서 상승된 영역 활동을 나타낸다. 도 13c는 5 × 10¹⁰개 GC 용량의 AAV.CDKL5 이소형 1로 처리된 KO 마우스에서 Y-미로에서의 활동을 나타낸다. 도 13d는 2.5 × 10¹⁰개 GC 용량의 AAV.CDKL5 이소형 1로 처리된 KO 마우스에서 Y-미로에서의 활동을 나타낸다.
도 14a 내지 도 14c는 녹아웃 마우스에 AAV.CDKL5-이소형 1로 처리한 이후에 뒷다리 접기의 성별 특이적 결과를 나타낸다. 도 14a는 수컷 녹아웃 마우스에게 AAV.CDKL5 이소형 1을 처리한 이후에 뒷다리 접기를 나타낸다. 도 14b는 암컷 녹아웃 마우스에게 AAV.CDKL5 이소형 1을 처리한 이후에 뒷다리 접기를 나타낸다. 반접합 수컷 및 이종접합 암컷은 둘 다 Cdkl5-ko 마우스에서 뒷다리 접기를 나타내었고, 이는 처리 이후에 유의하게 감소되었다. 야생형 실험군은 전혀 접기를 나타내지 않았다. 도 14c는 암컷 이종접합 마우스에서 고용량 (5 × 10¹⁰개 GC, 신생 ICV)으로 유의하게 개선된 보행 활동을 나타낸다.
도 15a 및 도 15b는 개방 장소에서 성별 특이적 결과 - 개방 장소 평가의 보행 활동을 나타낸다. 도 15a는 시간 경과 시 빔 파손으로서 X, Y축 좌표화된, AAV.CDKL5 이소형 1로 처리된 수컷 (KO) 마우스의 개방 장소 평가에서 보행 활동의 결과를 나타낸다. 도 15b는 시간 경과 시 빔 파손으로서 X, Y축 좌표화된, AAV.CDKL5 이소형 1로 처리된 암컷 (ht) 마우스의 개방 장소 평가에서 보행 활동의 결과를 나타낸다. 야생형으로 완전한 교정이 AAV.CDKL5 이소형 1로 처리된 수컷 (KO) 및 암컷 (ht) 마우스 둘 다의 경우 다수 시점에 대해 관찰되었다.
도 16a 및 도 16b는 AAV.CDKL5 이소형 1 벡터로 처리된 KO 마우스에서 성별 차이를 나타낸다. 도 16a는 개방 영역에서 소모 시간 (초)로서 좌표화된, AAV.CDKL5 이소형 1로 처리된 수컷 (KO) 마우스의 상승된 제로 미로 평가에서 개방 장소 - 보행 활동의 결과를 나타낸다. 도 16b는 개방 영역에서 소모 시간 (초)로서 좌표화된, AAV.CDKL5 이소형 1로 처리된 암컷 (ht) 마우스의 상승된 제로 미로 평가에서 개방 장소 - 보행 활동의 결과를 나타낸다. 위험 성향 행동이 수컷에서 관찰되고, 효과의 크기가 더욱 현저하다.
도 17은 NHP 연구로부터의 다양한 조직 시료에서 벡터 분포를 나타낸다 (1 × 10¹⁴개 GC 용량에 대한 예시). 그래프는 다양한 비-뉴런성 조직, 척수 경로 및 뇌 조직에서 gc/이배체 게놈의 rAAV.CDKL5를 제공한다. 등쪽 뿌리 신경절 (DRG)의 강한 형질도입이 관찰된다. 뇌 조직의 중간 내지 낮은 형질도입이 비-뉴런성 조직 내로의 일부 누출과 함께 관찰된다.
도 18은 NHP 연구에서 소뇌, 전두 피질, 후두 피질, 두정 피질 및 일시적 피질에서 관찰된 정량화된 hCDKL5 발현의 결과 (RT-qPCR에 의해 측정됨)를 나타낸다.
도 19a 및 도 19b는 야생형 마우스에게 CDKL5 유전자 요법 이후에 행동 변화를 측정하는 용량 증가의 연구 결과를 나타낸다. 도 19a는 PBS로 처리된 대조군 마우스와 비교하여, 7.5 × 10¹⁰개 GC 및 1 × 10¹¹개 GC의 AAV로 주사된 야생형 마우스에서 뒷다리 접기 중증도의 유의한 점수 변화가 없음을 나타낸다. 도 19b는 PBS로 처리된 대조군 마우스와 비교하여, 7.5 × 10¹⁰개 GC 및 1 × 10¹¹개 GC의 AAV로 주사된 야생형 마우스에서 뒷다리 접기 중증도의 유의한 점수 변화가 없음을 나타낸다.

본원에서는 CDD를 치료하기 위한 조성물 및 방법이 제공된다. AAV 캡시드 (예로, AAVhu68 또는 AAV-PHP.B) 및 이에 포장된 기능적 인간 사이클린 의존성 키나제 유사 5 (hCDKL5)를 인코딩하는 벡터 게놈을 갖는 재조합 아데노 관련 바이러스 (rAAV)의 유효량이 필요로 하는 대상체에게 전달된다.

I. 인간 CDKL5

인간 사이클린 의존성 키나제 유사 5 (CDKL5, CFAP247, 세린/트레오닌 키나제 9, STK9으로도 알려짐; 유니프로트 #076039) 유전자는 X 염색체의 짧은 (p) 팔 상의 위치 22.13번에 원래 위치한다. CDKL5 단백질의 N-말단은 다른 단백질의 활성을 변화시키는 효소인, 키나제로서 작용한다. CDKL5에 대한 다수의 직접적 기질이 확인되어 왔다 (Baltussen et al., 2018; Munoz et al., 2018). CDKL5 C-말단의 기능은 알려져 있지 않다.

본원에 사용된 바, 기능적 hCDKL5 단백질은 동물 모델 또는 환자에서 CDD의 증상을 완화시키거나 이의 진행을 지연시킬 수 있는, CDD 및/또는 CDKL5 단백질의 전달 또는 발현과 연관되지 않는 CDKL5 단백질의 이소형, 천연 변이체, 변이체, 이형성, 절단을 말한다. OMIM #300203 참조, 각 웹페이지는 본원에 이의 전문이 참고문헌으로 통합된다. 특정 구현예에서, 기능적 hCDKL5는 서열번호 2의 아미노산 서열 (이소형 1) 또는 이와 적어도 약 90% (예로, 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 99.9%) 일치하는 아미노산 서열을 갖는다. 특정 구현예에서, 기능적 hCDKL5는 서열번호 19의 아미노산 서열 (이소형 2) 또는 이와 적어도 약 90% (예로, 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 99.9%) 일치하는 아미노산 서열을 갖는다. 특정 구현예에서, 기능적 hCDKL5는 서열번호 20의 아미노산 서열 (이소형 3) 또는 이와 적어도 약 90% (예로, 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 99.9%) 일치하는 아미노산 서열을 갖는다. 특정 구현예에서, 기능적 hCDKL5는 서열번호 21의 아미노산 서열 (이소형 4) 또는 이와 적어도 약 90% (예로, 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 99.9%) 일치하는 아미노산 서열을 갖는다. 특정 구현예에서, 기능적 hCDKL5는 메틸-CpG 결합 도메인 (MBD) 및 NCoR/SMRT 상호작용 도메인 (NID)의 서열을 포함하는 절단된 hCDKL5이다. 본원에 이의 전문이 참고문헌으로 통합되는 국제특허출원 제 WO 2018172795 A1호 참조.

특정 구현예에서, 기능적 hCDKL5 단백질은 동물 모델에서 CDD의 증상을 완화시키거나 이의 진행을 지연시킨다. 예시화된 동물 모델 중 하나는 CDKL5-ko 마우스이다. 다른 적합한 모델은 본원에 기술되어 있다.

CDD 증상 또는 진행은 생존 플롯 (예로, 카프란-마이어 생존 플롯), 체중의 모니터링 및 행동 변화의 관찰 (예를 들면, 뒷다리 접기, 개방 장소 검정법 (운동 기능), 상승된 영역 미로 (근심/위험 대 탐색), Y-미로 (학습 및 기억/해마), 대리석 매장 검정법 (타고난 행동 및 이동), 둥지 형성 (타고난 사회적 행동) 및 회전 막대 검정법 (운동 기능, 조정)을 포함하나 이에 한정되지 않는 다양한 검정법/방법을 사용하여 평가될 수 있다. 특정 구현예에서, 동물 모델에서 기능적 hCDKL5 단백질의 투여 또는 발현은, 상응하는 야생형 동물에서 획득된 결과의 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 100% 또는 100% 이상인 검정 결과에 의해 확인된 CDD 증상의 완화 또는 CDD 진행의 지연을 유도한다. 특정 구현예에서, CDD 동물 모델에서 기능적 hCDKL5 단백질의 투여 또는 발현은, 상응하는 미처리된 CDD 동물로부터 획득된 결과의 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 100% 또는 100% 이상인 개선된 검정 결과에 의해 확인된 CDD 증상의 완화 또는 CDD 진행의 지연을 유도한다.

본원에서는 hCDKL5 코딩 서열 또는 CDKL5 코딩 서열로 명명되는 기능적 hCDKL5 단백질을 인코딩하는 핵산 서열이 제공된다. 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 3 또는 서열번호 3과 적어도 약 95% 일치하는 서열이다. 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 2 (CDKL5, CDKL5co, CDKL5-1 또는 CDKL5-1co로 지칭됨) 또는 NCBI 기준 서열, 아미노산 서열 NP_001032420.1 (서열번호 19)을 인코딩하는 NM_ 001037343.1 (CDKL5 또는 CDKL5e1로 지칭됨; 서열번호 16), 아미노산 서열 NP_001310218.1 (서열번호 20)을 인코딩하는 NM_001323289.2 (서열번호 17), 및 아미노산 서열 NP_003150.1 (서열번호 21)을 인코딩하는 NM_003159.2 (서열번호 18), 또는 이와 적어도 약 70% (예로, 적어도 약 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 99.9%) 일치하는 핵산 서열로부터 선택된다. NCBI 기준 서열 각각은 본원에 이의 전문이 참고문헌으로 통합된다. 특정 구현예에서, hCDKL5 코딩 서열은 변형되거나 조작된다 (hCDKL5, hCDKL5co, CDKL5-1 또는 CDKL5-1co). 변형된 또는 조작된 서열은 NCBI 기준 서열과 약 70% 미만 (예로, 약 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 99.9%)의 일치도를 공유한다.

특정 구현예에서, hCDKL5 코딩 서열은 서열번호 22 또는 이와 적어도 약 70% (예로, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 적어도 약 99.9%) 일치하는 핵산 서열이다. 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 24 또는 이와 적어도 약 70% (예로, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 적어도 약 99.9%) 일치하는 핵산 서열이다. 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 25 또는 이와 적어도 약 70% (예로, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 적어도 약 99.9%) 일치하는 핵산 서열이다. 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 26 또는 이와 적어도 약 70% (예로, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 적어도 약 99.9%) 일치하는 핵산 서열이다.

특정 구현예에서, hCDKL5 코딩 서열은 서열번호 37 또는 서열번호 37과 적어도 약 95% 일치하는 서열의 조작된 서열이다. 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 38 또는 서열번호 38과 적어도 약 95% 일치하는 서열의 조작된 서열이다. 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 39 또는 서열번호 39와 적어도 약 95% 일치하는 서열의 조작된 서열이다. 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 40 또는 서열번호 40과 적어도 약 95% 일치하는 서열의 조작된 서열이다. 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 41 또는 서열번호 41과 적어도 약 95% 일치하는 서열의 조작된 서열이다. 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 42 또는 서열번호 42와 적어도 약 95% 일치하는 서열의 조작된 서열이다. 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 43 또는 서열번호 43과 적어도 약 95% 일치하는 서열의 조작된 서열이다. 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 44 또는 서열번호 44와 적어도 약 95% 일치하는 서열의 조작된 서열이다. 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 45 또는 서열번호 45와 적어도 약 95% 일치하는 서열의 조작된 서열이다. 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 46 또는 서열번호 46과 적어도 약 95% 일치하는 서열의 조작된 서열이다. 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 47 또는 서열번호 47과 적어도 약 95% 일치하는 서열의 조작된 서열이다. 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 48 또는 서열번호 48과 적어도 약 95% 일치하는 서열의 조작된 서열이다.

본원에 사용된 "핵산"은 RNA, DNA 또는 이들의 변형일 수 있고, 단일가닥 또는 이중가닥일 수 있으며, 예를 들면 관심있는 단백질을 인코딩하는 핵산, 올리고뉴클레오티드, 핵산 유사체, 예를 들면 펩티드-핵산 (PNA), 유사상보적 PNA (pc-PNA), 잠긴 핵산 (LNA) 등을 포함하는 군으로부터 선택될 수 있다. 예를 들면, 이러한 핵산 서열은 예로 전사 억제인자로서 작용하는 단백질을 인코딩하는 핵산, 안티센스 분자, 리보자임, 예로 RNAi, shRNAi, siRNA, 마이크로 RNAi (mRNAi), 안티센스 올리고뉴클레오티드 등에 한정되지 않는 작은 억제성 핵산 분자를 포함하나 이에 한정되지 않는다.

핵산 서열의 맥락에서 용어 "일치도 백분율 (%)", "서열 일치도", "서열 일치도 백분율" 또는 "일치하는 백분율"은 2가지 서열에서 상응성으로 정렬될 때 동일한 잔기를 말한다. 서열 일치도 비교의 길이는 바람직하게 게놈의 전장, 유전자 코딩 서열의 전장 또는 적어도 약 500개 내지 5,000개 뉴클레오티드의 단편에 걸쳐질 수 있다. 그러나, 더 작은 단편 중의 일치도, 예로 적어도 약 7개의 뉴클레오티드, 보통 적어도 약 20개 내지 24개의 뉴클레오티드, 적어도 약 28개 내지 32개의 뉴클레오티드, 적어도 약 36개 이상의 뉴클레오티드도 바람직할 수 있다.

일치도 백분율은 단백질의 전장, 폴리펩티드, 약 32개의 아미노산, 약 330개의 아미노산 또는 이들의 펩티드 단편에 걸친 아미노산 서열, 또는 상응하는 핵산 서열 코딩 서열에 대해 쉽게 결정될 수 있다. 적합한 아미노산 단편은 적어도 약 8개 아미노산의 길이일 수 있으며, 최대 약 700개의 아미노산일 수 있다. 일반적으로, 2가지의 상이한 서열 사이의 "일치도", "상동성" 또는 "유사도"를 언급할 때, "일치도", "상동성" 또는 "유사도"는 "정렬된" 서열을 기준으로 결정된다. "정렬된" 서열 또는 "정렬"은 기준 서열과 비교하여 염기 또는 아미노산을 결실하거나 첨가하는 교정을 종종 포함하는 다수의 핵산 서열 또는 단백질 (아미노산) 서열을 말한다.

정렬은 임의의 다양한 공개적으로 사용가능한 또는 구입가능한 다수의 서열 정렬 프로그램을 사용하여 수행된다. 서열 정렬 프로그램, 예로 "크러스탈 X", "크러스탈 오메가", "MAP", "PIMA", "MSA", "블록메이커", "MEME" 및 "매치-박스" 프로그램이 아미노산 서열에 사용가능하다. 일반적으로, 임의의 이들 프로그램은 당업자라면 필요한 경우 이들 설정을 변경시킬 수 있지만, 디폴트 설정으로 사용된다. 대안적으로, 당업자라면 기준이 된 알고리즘 및 프로그램에 의해 제공된 수준과 적어도 같은 일치도 또는 정렬을 제공하는 또 다른 알고리즘 또는 컴퓨터 프로그램을 사용할 수 있다. 예로, J. D. Thomson et al., Nucl. Acids Res., "A comprehensive comparison of multiple sequence alignments", 27(13): 2682-2690 (1999) 참조.

다수의 서열 정렬 프로그램이 핵산 서열에도 사용가능하다. 이러한 프로그램의 예는 "크러스탈 W", "크러스탈 오메가", "CAP 서열 어셈블리", "BLAST", "MAP" 및 "MEME"를 포함하고, 이는 인터넷 상의 웹 서버를 통해 접근가능하다. 이러한 프로그램의 다른 출처는 당업자에게 공지되어 있다. 대안적으로, 벡터 NTI도 사용될 수 있다. 또한, 뉴클레오티드 서열 일치도를 측정하는데 사용될 수 있는, 상기 설명된 프로그램에 포함된 것을 포함하는 당해 기술분야에 공지된 알고리즘이 많이 있다. 또 다른 예로서, 폴리뉴클레오티드 서열이 GCG 버전 6.1의 프로그램, Fasta^TM를 사용하여 비교될 수 있다. Fasta^TM은 질문 및 검색 서열 사이에 최고 중첩 영역의 정렬 및 서열 일치도 백분율을 제공한다. 예를 들면, 핵산 서열 사이의 서열 일치도 백분율은, 본원에 참고문헌으로 통합되는 GCG 버전 6.1에 제공되는 이의 디폴트 매개변수 (점수매김 매트릭스를 위한 단어 크기 6 및 NOPAM 인자)와 함께 Fasta^TM를 사용하여 결정될 수 있다.

Ⅱ. 발현 카세트

본원에서는 표적 세포에서 hCDKL5 발현을 안내하는 조절 서열의 제어 하에 hCDKL5 코딩 서열을 포함하는, 발현 카세트로도 명명되는 핵산 서열이 제공된다. 본원에 사용된 바, "발현 카세트"는 코딩 서열 (예로, CDKL5 코딩 서열) 및 이와 작동가능하게 연결된 조절 서열을 포함하는 핵산 분자를 말한다. 특정 구현예에서, 벡터 게놈은 둘 이상의 발현 카세트를 포함한다. 용어 "트랜스 유전자"는 표적 세포 내에 삽입된 외인성 출처로부터 나온 DNA 서열을 말하고, 전형적으로 트랜스 유전자는 산물 (예로, CDKL5)를 인코딩한다. 전형적으로, 이러한 바이러스성 벡터 내에 포장되는 발현 벡터는 본원에 기술된 바이러스성 게놈의 포장화 신호에 의해 연접된 유전자 산물에 대한 코딩 서열 및 본원에 기술된 것과 같은 다른 발현 조절 서열을 포함한다. 필요한 조절 서열은 표적 세포에서 전사, 번역 및/또는 발현을 허용하는 방식으로 hCDKL5 코딩 서열에 작동가능하게 연결된자. 본원에 사용된 바, "작동가능하게 연결된" 서열은 hCDKL5 코딩 서열과 인접하는 전사, 번역 및/또는 발현을 조정하는 서열, 및 hCDKL5 코딩 서열을 조절하도록 트랜스로 또는 일정 거리에서 작동하는 조절 서열을 포함한다. 발현 카세트는 유전자 서열의 상류 (5') 조절 서열, 예로 프로모터, 인핸서, 인트론 등 중 하나 이상 및 하나 이상의 인핸서, 또는 유전자 서열의 하류 (3') 조절 서열, 예로 다른 요소 중에 특히 폴리아데닐화 부위를 포함하는 미번역 영역 (3' UTR)을 포함할 수 있다. 이러한 조절 서열은 전형적으로, 예로 프로모터, 인핸서, 인트론, 코작 서열, 폴리아데닐화 서열 및 TATA 신호 중 하나 이상을 포함한다. 특정 구현예에서, 프로모터는 조직 특이적 프로모터, 예로 CNS 특이적 또는 뉴런 특이적 프로모터이다. 특정 구현예에서, 프로모터는 인간 시냅신 프로모터 (서열번호 23)이다. 특정 구현예에서, 추가적인 또는 대안적인 뉴런 특이적 프로모터 서열은 뉴런 특이적 에놀라제 (NSE) 프로모터 (Andersen et al., (1993) Cell. Mol. Neurobiol., 13: 503-15), 신경필라멘트 경쇄 유전자 프로모터 (Piccioli et al., (1991) Proc. Natl. Acad. Sci. USA, 88: 5611-5), 뉴런 특이적 vgf 유전자 프로모터 (Piccioli et al., (1995) Neuron, 15: 373-84) 및/또는 기타로부터 선택될 수 있다.

특정 구현예에서, 인간 시냅신 프로모터는 본원에서 hSyn 또는 Syn으로서 명명된, 서열 (예로, 서열번호 1, 3, 5, 7, 9 또는 서열번호 23의 뉴클레오티드 213번 내지 678번)을 갖는다.

다른 구현예에서, 프로모터는 전신발현 프로모터, 예로 사이토메갈로바이러스 인핸서 (CB7) 프로모터, 인간 신장 개시인자 1 알파 (EF1a) 프로모터, 인간 유비퀴틴 C (UbC) 프로모터이다. 특정 구현예에서, 조절 서열은 중앙 신경계 (CNS) 세포에서 hCDKL5 발현을 안내한다.

특정 구현예에서, 표적 세포는 중앙 신경계 세포일 수 있다. 특정 구현예에서, 표적 세포는여기 뉴런, 억제성 뉴런, 교아 세포, 피질 세포, 전두 피질 세퍼, 뇌 피질 세퍼, 척수 세포 중 하나 이상이다. 특정 구현예에서, 표적 세포는 말단 신경계 (PNS) 세포, 예를 들면 망막 세포이다. 또한, 신경계로부터 나온 세포 이외의 기타 세포, 예컨대 단핵구, B 림프구, T 림프구, NK 세포, 림프절 세포, 편도 세포, 골수 중간엽 세포, 줄기 세포, 골수 줄기 세포, 심장 세포, 표피 세포, 식도 세포, 위 세포, 태아 절개 세포, 결장 세포, 직장 세포, 간 세포, 신장 세포, 폐 세포, 침샘 세포, 갑상샘 세포, 부신 세로 유방 세포, 췌장 세포, 랑게르한스샘 세포, 담낭 세포, 전립샘 세포, 뇨방광 세포, 피부 세포, 자궁 세포, 자궁경부 세포, 고환 세포 또는 CDD에 걸리지 않은 대상체에서 기능적 CDKL5 단백질을 발현하는 임의의 다른 세포로부터 선택될 수 있다.

특정 구현예에서, 추가적인 또는 대안적인 프로모터 서열이, 예로 선택된 5' ITR 서열 및 코딩 서열 사이에 위치하는 발현 제어 서열 (조절 서열)의 일부로서 포함될 수 있다. 전신발현 프로모터, 조절가능한 프로모터 (예로, 국제특허출원 제 WO 2011/126808호 및 제 WO 2013/04943호 참조), 조직 특이적 프로모터 또는 생리적 자극에 대해 반응하는 프로모터는 본원에 기술된 벡터에 사용될 수 있다. 프로모터(들)은 상이한 출처, 예로 인간 사이토메갈로바이러 (CMV) 극초기 인핸서/프로모터, SV40 초기 인핸서/프로모터, JC 폴리모바이러스 프로모터, 미엘린 염기성 프로모터 (MBP) 또는 교아 피브릴 산성 단백질 (GFAP) 프로모터, 헤르페스 심플렉스 바이러스 (HSV-1) 잠복 관련 프로모터 (LAP), 라우육종 바이러스 (RSV) 긴 말단 반복서열 (LTR) 프로모터, 뉴런 특이적 프로모터 (NSE), 혈소판 유래 성장인자 (PDGF) 프로모터, hSYN, 멜라닌 농축 호르몬 (MCH) 프로모터, CBA, 기질 금속단백질 프로모터 (MPP) 및 닭 베타-액틴 프로모터로부터 선택될 수 있다.

프로모터에 추가하여, 벡터는 하나 이상의 적절한 전사 개시 서열, 전사 종결 서열, 인핸서 서열, 효율적인 RNA 가공 신호, 예컨대 스플라이싱 및 폴리아데닐화 신호 (폴리 A), 세포질 mRNA를 안정화하는 서열, 예를 들면 WPRE, 번역 효율을 증진시키는 서열 (즉, 코작 공통 서열), 단백질 안정성을 증진시키는 서열, 및 바람직할 때 인코딩된 산물의 분비를 증진시키는 서열을 포함할 수 있다. 적합한 인핸서의 예는 CMV 인핸서이다. 다른 적합한 인핸서는 바람직한 표적 조직 적응증에 적절한 인핸서를 포함한다. 일 구현예에서, 조절 서열은 하나 이상의 발현 인핸서를 포함한다. 일 구현예에서, 조절 서열은 둘 이상의 발현 인핸서를 포함한다. 이들 인핸서는 서로 동일할 수 있거나, 상이할 수 있다. 예를 들면, 인핸서는 CMV 극초기 인핸서를 포함할 수 있다. 이러한 인핸서는 서로 인접하게 위치하는 2개의 사본으로 존재할 수 있다. 대안적으로, 인핸서의 이중 사본은 하나 이상의 서열에 의해 분리될 수 있다. 또 다른 구현예에서, 발현 카세트는 인트론, 예로 닭 베타-액틴 인트론을 추가로 포함한다. 특정 구현예에서, 인트론은 키메라 인트론 (CI) - 인간 베타-글로빈 스플라이싱 공여자 및 면역글로불린 스플라이싱 수여자 요소로 구성된 혼성 인트론이다. 다른 적합한 인트론은 예로 국제특허출원 제 WO 2011/126808호에 기술된 것과 같은 당해 기술분야에 공지된 인트론을 포함한다. 적합한 폴리 A의 예는 예로 토끼 글로빈 폴리 A, SV40, SV50, 소 성장호르몬 (bGH), 소 성장호르몬 (bGH) 및 합성 TK 폴리 A를 포함한다. 선택적으로, 하나 이상의 서열은 mRNA를 안정화하도록 선택될 수 있다. 이러한 서열의 예는 변형된 WPRE 서열이고, 이는 폴리 A 서열의 상류 및 코딩 서열의 하류에 조작될 수 있다 (예로, M. A. Zanta-Boussif, et al., Gene Therapy (2009), 16: 605-619 참조). 특정 구현예에서, WPRE 서열이 존재한다.

특정 구현예에서, 발현 카세트는 hCDKL5 (이소형 1; 서열번호 2)의 아미노산 서열을 인코딩하는 서열번호 1의 뉴클레오티드 213번 내지 4439번의 서열을 갖는 핵산 분자를 말한다. 특정 구현예에서, 발현 카세트는 hCDKL5 (이소형 2 또는 2GS; 서열번호 6)의 아미노산 서열을 인코딩하는 서열번호 5의 뉴클레오티드 213번 내지 4562번의 서열을 갖는 핵산 분자를 말한다. 특정 구현예에서, 발현 카세트는 hCDKL5 (이소형 3 또는 3GS; 서열번호 8)의 아미노산 서열을 인코딩하는 서열번호 7의 뉴클레오티드 213번 내지 4388번의 서열을 갖는 핵산 분자를 말한다. 특정 구현예에서, 발현 카세트는 hCDKL5 (이소형 4 또는 4GS; 서열번호 10)의 아미노산 서열을 인코딩하는 서열번호 9의 뉴클레오티드 213번 내지 4511번의 서열을 갖는 핵산 분자를 말한다. 특정 구현예에서, 발현 카세트는 서열번호 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47 또는 48로부터 선택되고, hCDKL5 (이소형 1; 서열번호 2)의 아미노산 서열을 인코딩하는 조작된 핵산 서열을 포함한다. 특정 구현예에서, 발현 카세트는 hCDKL5 (이소형 1; 서열번호 4)의 아미노산 서열을 인코딩하고 miRNA 183 (서열번호 11)을 포함하는, 서열번호 3의 뉴클레오티드 213번 내지 4555번의 서열을 갖는 핵산 서열을 말한다. 특정 구현예에서, 이들 발현 카세트는 1개, 2개, 3개 또는 4개 이상의 drg-탈표적화 서열 (즉, miRNA)를 추가로 포함한다. 예로, 2019년 12월 20일에 제출되고 현재 국제특허출원 제 WO 2020/132455호로 공개된 국제특허출원 PCT/US19/67872 참조.

Ⅲ. rAAV

본원에서는 CDD를 치료하는데 유용한 재조합 아데노 관련 바이러스 (rAAV)가 제공된다. rAAV는 (a) AAV 캡시드; 및 (b) (a)의 AAV 캡시드에 포장된 벡터 게놈을 포함한다. 적합하게, 선택된 AAV 캡시드는 치료될 세포를 표적한다. 특정 구현예에서, 캡시드는 클라드 F로부터 나온다. 그러나, 특정 구현예에서, 또 다른 AAV 캡시드 출처가 선택될 수 있다. 벡터 게놈은 역전된 말단 반복서열 (ITR), 및 hCDKL5 발현을 안내하는 조절 서열의 제어 하에 기능적 인간 사이클린 의존성 키나제 유사 5 (hCDKL5)를 인코딩하는 핵산 서열을 포함한다. 특정 구현예에서, CDKL5는 CDKL5 또는 hCDKL5, CDKL5-2GS 또는 hCDKL5-2GS, CDKL5-3GS 또는 hCDKL5-3GS, 및 CDKL5-4GS 또는 hCDKL5-4GS로 지칭될 수 있다. 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 22와 적어도 약 95% 일치한다 (CDKL5-1 또는 hCDKL5-1의 아미노산 서열, 서열번호 2를 인코딩함). 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 24와 적어도 약 95% 일치한다 (CDKL5-2GS 또는 hCDKL5-2GS의 아미노산 서열, 서열번호 6을 인코딩함). 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 25와 적어도 약 95% 일치한다 (CDKL5-3GS 또는 hCDKL5-3GS의 아미노산 서열, 서열번호 8을 인코딩함). 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 26과 적어도 약 95% 일치한다 (CDKL5-4GS 또는 hCDKL5-4GS의 아미노산 서열, 서열번호 10를 인코딩함). 특정 구현예에서, hCDKL5 코딩 서열은 hCDKL5 전사체 변이체 1 내지 3 (서열번호 16을 갖고 서열번호 19의 NP_001032420.1 아미노산 서열을 인코딩하는 NM_001037343.1; 서열번호 17을 갖고 서열번호 20의 NP_001310218.1 아미노산 서열을 인코딩하는 NM_001323289.2; 서열번호 18을 갖고 서열번호 21의 NP_003150.1 아미노산 서열을 인코딩하는 NM_003159.2) 중 어느 하나와 80% 미만으로 일치한다. 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 37, 38, 39, 40, 41, 42, 43, 44, 45, 46 및 47, 또는 이와 적어도 약 95% 일치한다 (CDKL5-1 또는 hCDKL5-1의 아미노산 서열, 서열번호 2를 인코딩함). 특정 구현예에서, 기능적 hCDKL5는 서열번호 2의 아미노산 서열을 갖는다 (CDKL5-1 또는 hCDKL5-1). 특정 구현예에서, 기능적 hCDKL5는 서열번호 6의 아미노산 서열을 갖는다 (CDKL5-2GS 또는 hCDKL5-2GS). 특정 구현예에서, 기능적 hCDKL5는 서열번호 8의 아미노산 서열을 갖는다 (CDKL5-3GS 또는 hCDKL5-3GS). 특정 구현예에서, 기능적 hCDKL5는 서열번호 10의 아미노산 서열을 갖는다 (CDKL5-4GS 또는 hCDKL5-4GS). 특정 구현예에서, 조절 서열은 중앙 신경계에서 hCDKL5 발현을 안내한다. 특정 구현예에서, 조절 서열은 인간 시냅신 프로모터 (hSyn) 또는 CB7 프로모터를 포함한다. 특정 구현예에서, 조절 서열은 코작 서열, 폴리아데닐화 서열, 인트론, 인핸서 및 TATA 신호 중 하나 이상을 포함한다. 특정 구현예에서, 벡터 게놈은 등쪽 뿌리 신경절 (drg) 특이적 miRNA 표적 서열의 적어도 2개의 일렬 반복서열을 추가로 포함하고, 적어도 2개의 일렬 반복서열은 동일하거나 상이할 수 있는 적어도 제 1 miRNA 표적 서열 및 적어도 제 2 miRNA 표적 서열을 포함한다. 특정 구현예에서, 벡터 게놈은 서열번호 1의 뉴클레오티드 1번 내지 4634번, 서열번호 3의 뉴클레오티드 1번 내지 4750번, 서열번호 5의 뉴클레오티드 1번 내지 4757번, 서열번호 7의 뉴클레오티드 1번 내지 4583번 또는 서열번호 9의 뉴클레오티드 1번 내지 4706번, 또는 이들과 적어도 약 70% (예로, 적어도 약 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 99.9%) 일치하는 핵산 서열이다.

특정 구현예에서, 벡터 게놈은 hCDKL5 (이소형 1; 서열번호 2)의 아미노산 서열을 인코딩하는 서열번호 1을 포함하는 핵산 분자를 말한다. 특정 구현예에서, 벡터 게놈은 hCDKL5 (이소형 2 또는 2GS; 서열번호 6)의 아미노산 서열을 인코딩하는 서열번호 5를 포함하는 핵산 분자를 말한다. 특정 구현예에서, 벡터 게놈은 hCDKL5 (이소형 3 또는 3GS; 서열번호 8)의 아미노산 서열을 인코딩하는 서열번호 7을 포함하는 핵산 분자를 말한다. 특정 구현예에서, 벡터 게놈은 hCDKL5 (이소형 4 또는 4GS; 서열번호 10)의 아미노산 서열을 인코딩하는 서열번호 9를 포함하는 핵산 분자를 말한다. 특정 구현예에서, 벡터 게놈은 hCDKL5 (이소형 1; 서열번호 4)의 아미노산 서열을 인코딩하는 서열번호 3를 포함하고, miRNA 183 (서열번호 11)을 포함하는 핵산 분자를 말한다.

특정 구현예에서, hCDKL5 코딩 서열에 추가하여, 또 다른 비-AAV 코딩 서열, 예로 관심있는 펩티드, 폴리펩티드, 기능적 RNA 분자, (예로, miRNA, miRNA 저해제) 또는 기타 유전자 산물이 포함될 수 있다. 유용한 유전자 산물은 miRNA를 포함할 수 있다. miRNA 및 다른 소간섭 핵산은 표적 RNA 전사체 절단/분해 또는 표적 메신저 RNA (mRNA)의 번역 억제를 통해 유전자 발현을 조절한다. miRNA는 전형적인 최종 19개 내지 25개의 미번역되는 RNA 산물로서 자연적으로 발현된다. miRNA는 표적 mRNA의 3' 미번역 영역 (UTR)과 서열 특이적인 상호작용을 통해 이들의 활성을 나타낸다. 이들 내인성으로 발현된 miRNA는 후속으로 miRNA 이중체로, 추가로 "성숙한" 단일가닥 miRNA 분자로 가공되는 헤어핀 전구체를 형성한다. 이러한 성숙한 miRNA는 다중단백질 복합체, miRISC를 안내하고, 이는 성숙한 miRNA과 이들의 상보성을 기초로 하여 표적 miRNA의 표적 부위를 예로 3' UTR 영역에서 식별한다.

본원에 사용된 "miRNA 표적 서열"은 DNA 양성 가닥 (5' 내지 3') 상에 위치한 서열이고, miRNA 종자 서열을 포함한 miRNA 서열에 적어도 부분적으로 상보적이다. miRNA 표적 서열은 인코딩된 트랜스 유전자 산물의 미번역 영역에 외인성이고, 트랜스 유전자 발현의 억제가 바람직한 세포에서 miRNA를 특이적으로 표적하도록 설계된다. 용어 "miR-183 클러스터 표적 서열"은 miR-183, miR-96 및 miR-182 (본원에 참고문헌으로 통합되는 Dambal, S. et al., Nucleic Acids Res., 43: 7173-7188, 2015년에 기술됨)를 포함하는 miR-183 클러스터 (대안적으로 패밀리로 명명됨)의 하나 이상의 구성원에 반응하는 표적 서열을 말한다.

전형적으로, miRNA 표적 서열은 적어도 7개 뉴클레오티드 내지 약 28개 뉴클레오티드의 길이, 적어도 8개 뉴클레오티드 내지 약 28개 뉴클레오티드의 길이, 7개 뉴클레오티드 내지 28개 뉴클레오티드, 8개 뉴클레오티드 내지 18개 뉴클레오티드, 12개 뉴클레오티드 내지 28개 뉴클레오티드의 길이, 약 20개 내지 약 26개 뉴클레오티드, 약 22개 뉴클레오티드, 약 24개 뉴클레오티드 또는 약 26개 뉴클레오티드의 길이이고, miRNA 종자 서열에 상보적인 적어도 하나의 연속적인 영역 (예로, 7개 내지 8개 뉴클레오티드)를 포함한다. 특정 구현예에서, 표적 서열은 miRNA 종자 서열과 정확한 상보성 (100%) 또는 부분적 상보성을 일부 미스매칭와 함께 갖는 서열을 포함한다. 특정 구현예에서, 표적 서열은 miRNA 종자 서열에 100% 상보적인 적어도 7개 내지 8개 뉴클레오티드를 포함한다. 특정 구현예에서, 표적 서열은 miRNA 종자 서열에 100% 상보적인 서열로 구성된다. 특정 구현예에서, 표적 서열은 종자 서열에 100% 상보적인 서열의 다수의 사본 (예로, 2개 또는 3개의 사본)을 포함한다. 특정 구현예에서, 100% 상보성의 영역은 표적 서열의 적어도 30%의 길이를 포함한다. 특정 구현예에서, 표적 서열의 잔여부는 miRNA와 적어도 약 80% 내지 약 99% 상보성을 갖는다. 특정 구현예에서, DNA 양성 가닥을 포함하는 발현 카세트에서, miRNA 표적 서열은 miRNA의 역상보체이다.

본원에 사용된 바, "miRNA 표적 서열"은 DNA 양성 가닥 (5' 내지 3') 상에 위치한 서열이고, miRNA 종자 서열을 포함한 miRNA 서열에 적어도 부분적으로 상보적이다. miRNA 표적 서열은 인코딩된 트랜스 유전자 산물의 미번역 영역에 외인성이고, 트랜스 유전자 발현의 억제가 바람직한 세포에서 miRNA를 특이적으로 표적하도록 설계된다. 용어 "miR-183 클러스터 표적 서열"은 miR-183, miR-96 및 miR-182 (본원에 참고문헌으로 통합되는 Dambal, S. et al., Nucleic Acids Res., 43: 7173-7188, 2015년에 기술됨)를 포함하는 miR-183 클러스터 (대안적으로 패밀리로 명명됨)의 하나 이상의 구성원에 반응하는 표적 서열을 말한다. 이론에 얽매이지 않더라도, 트랜스 유전자 (유전자 산물을 인코딩함)에 대한 메신저 RNA (mRNA)는 miRNA를 포함하는 발현 카세트가 전달되는 세포 유형에 존재하여, 3' UTR miRNA 표적 서열에 대한 miRNA의 특이적인 결합이 mRNA 침묵화 및 절단을 유도함으로써 miRNA를 발현하는 세포에서만 트랜스 유전자의 발현을 감소시키거나 제거시킨다.

특정 구현예에서, 발현 카세트 mRNA 또는 DNA 양성 가닥에 대한 적어도 제 1 및/또는 적어도 제 2 miRNA 표적 서열의 miRNA 표적 서열은 (1) AGTGAATTCTACCAGTGCCATA (miR-183, 서열번호 11); (ii) AGCAAAAATGTGCTAGTGCCAAA (miR-96, 서열번호 12); (iii) AGTGTGAGTTCTACCATTGCCAAA (miR-182, 서열번호 13)로부터 선택된다. 다른 구현예에서, AGGGATTCCTGGGAAAACTGGAC (서열번호 14)가 선택된다.

특정 구현예에서, 벡터 게놈 또는 발현 카세트는 miR-183 표적 서열인 적어도 하나의 miRNA 표적 서열을 포함한다. 특정 구현예에서, 벡터 게놈 또는 발현 카세트는 AGTGAATTCTACCAGTGCCATA (서열번호 11)를 포함하는 miRNA 표적 서열을 포함하고, 여기서 miR-183 종자 서열에 상보적인 서열은 GTGCCAT이다. 특정 구현예에서, 벡터 게놈 또는 발현 카세트는 miR-183 종자 서열에 100% 상보적인 서열의 하나 이상의 사본 (예로, 2개 또는 3개의 사본)을 포함한다. 특정 구현예에서, miR-183 표적 서열은 약 7개 뉴클레오티드 내지 약 28개 뉴클레오티드의 길이이고, miR-183 종자 서열에 적어도 100% 상보적인 적어도 하나의 영역을 포함한다. 특정 구현예에서, miR-183 표적 서열은 서열번호 11과 부분적 상보성을 갖는 서열을 포함하여, 서열번호 11과 정렬될 때 하나 이상의 미스매칭이 존재한다. 특정 구현예에서, miR-183 표적 서열은 서열번호 11과 정렬될 때 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개의 미스매칭을 갖는 서열을 포함하고, 여기서 미스매칭은 인접하지 않을 수 있다. 특정 구현예에서, miR-183 표적 서열은 miR-183 표적 서열의 적어도 30%의 길이도 포함하는 100% 상보성의 영역을 포함한다. 특정 구현예에서, 100% 상보성의 영역은 miR-183 종자 서열과 100% 상보성을 갖는 서열을 포함한다. 특정 구현예에서, miR-183 표적 서열의 잔여부는 miR-183과 적어도 약 80% 내지 약 99% 상보성을 갖는다. 특정 구현예에서, 발현 카세트 또는 벡터 게놈은 절단된 서열번호 11, 즉 서열번호 11의 5' 또는 3' 말단 또는 양쪽 말단에서 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개의 뉴클레오티드가 결여된 서열을 포함하는 miR-183 표적 서열을 포함한다. 특정 구현예에서, 발현 카세트 또는 벡터 게놈은 트랜스 유전자 및 하나의 miR-183 표적 서열을 포함한다. 또 다른 특정 구현예에서, 발현 카세트 또는 벡터 게놈은 적어도 2개, 3개 또는 4개의 miR-183 표적 서열을 포함한다. (i) AGTGAATTCTACCAGTGCCATA (miR-183, 서열번호 11); (ii) AGCAAAAATGTGCTAGTGCCAAA (miR-96, 서열번호 12).

특정 구현예에서, 벡터 게놈 또는 발현 카세트는 miR-182 표적 서열인 적어도 하나의 miRNA 표적 서열을 포함한다. 특정 구현예에서, 벡터 게놈 또는 발현 카세트는 AGTGTGAGTTCTACCATTGCCAAA (서열번호 13)를 포함하는 miR-182 표적 서열을 포함한다. 특정 구현예에서, 벡터 게놈 또는 발현 카세트는 miR-182 종자 서열에 100% 상보적인 서열의 하나 이상의 사본 (예로, 2개 또는 3개의 사본)을 포함한다. 특정 구현예에서, miR-182 표적 서열은 약 7개 뉴클레오티드 내지 약 28개 뉴클레오티드의 길이이고, miR-182 종자 서열에 적어도 100% 상보적인 적어도 하나의 영역을 포함한다. 특정 구현예에서, miR-182 표적 서열은 서열번호 13과 부분적 상보성을 갖는 서열을 포함하여, 서열번호 13과 정렬될 때 하나 이상의 미스매칭이 존재한다. 특정 구현예에서, miR-182 표적 서열은 서열번호 13과 정렬될 때 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개의 미스매칭을 갖는 서열을 포함하고, 여기서 미스매칭은 인접하지 않을 수 있다. 특정 구현예에서, miR-182 표적 서열은 miR-182 표적 서열의 적어도 30%의 길이도 포함하는 100% 상보성의 영역을 포함한다. 특정 구현예에서, 100% 상보성의 영역은 miR-182 종자 서열과 100% 상보성을 갖는 서열을 포함한다. 특정 구현예에서, miR-182 표적 서열의 잔여부는 miR-182와 적어도 약 80% 내지 약 99% 상보성을 갖는다. 특정 구현예에서, 발현 카세트 또는 벡터 게놈은 절단된 서열번호 13, 즉 서열번호 13의 5' 또는 3' 말단 또는 양쪽 말단에서 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개의 뉴클레오티드가 결여된 서열을 포함하는 miR-182 표적 서열을 포함한다. 특정 구현예에서, 발현 카세트 또는 벡터 게놈은 트랜스 유전자 및 하나의 miR-182 표적 서열을 포함한다. 또 다른 특정 구현예에서, 발현 카세트 또는 벡터 게놈은 적어도 2개, 3개 또는 4개의 miR-182 표적 서열을 포함한다.

본원에서 용어 "일렬 반복서열"은 둘 이상의 연속적인 miRNA 표적 서열의 존재를 말하는데 사용된다. 이들 miRNA 표적 서열은 연속적일 수 있고, 즉 서로 나란히 위치하여 하나의 3' 말단이 개입 서열이 없이 나머지의 5' 말단의 바로 상류이거나 이의 역이다. 또 다른 구현예에서, 둘 이상의 miRNA 표적 서열은 짧은 스페이서 서열에 의해 분리된다.

본원에 사용된 바, "스페이서"는 둘 이상의 연속적인 miRNA 표적 서열 사이에 위치하는, 예로 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개 뉴클레오티드 길이의 임의의 선택된 핵산 서열이다. 특정 구현예에서, 스페이서는 1개 내지 8개 뉴클레오티드의 길이, 2개 내지 7개 뉴클레오티드의 길이, 3개 내지 6개 뉴클레오티드의 길이, 4개 뉴클레오티드의 길이, 4개 내지 9개 뉴클레오티드의 길이, 3개 내지 7개 뉴클레오티드의 길이, 또는 더 길어진 값이다. 적합하게, 스페이서는 비-코딩 서열이다. 특정 구현예에서, 스페이서는 4개의 뉴클레오티드일 수 있다. 특정 구현예에서, 스페이서는 GGAT이다. 특정 구현예에서, 스페이서는 6개의 뉴클레오티드이다. 특정 구현예에서, 스페이서는 CACGTG 또는 GCATGC이다.

특정 구현예에서, 일렬 반복서열은 2개, 3개 또는 4개 이상의 동일한 miRNA 표적 서열을 포함한다. 특정 구현예에서, 일렬 반복서열은 적어도 2개의 상이한 miRNA 표적 서열, 적어도 3개의 상이한 miRNA 표적 서열 또는 적어도 4개의 상이한 miRNA 표적 서열 등을 포함한다. 특정 구현예에서, 일렬 반복서열은 2개 또는 3개의 동일한 miRNA 표적 서열, 및 상이한 네 번째 miRNA 표적 서열을 포함할 수 있다.

특정 구현예에서, 발현 카세트에는 일렬 반복서열의 적어도 2가지 상이한 세트가 있을 수 있다. 예를 들면, 3' UTR은 트랜스 유전자의 바로 하류의 일렬 반복서열, UTR 서열 및 UTR 3' 말단에 더 근접한 둘 이상의 일렬 반복서열을 포함할 수 있다. 또 다른 예에서, 5' UTR은 1개, 2개 또는 3개의 miRNA 표적 서열을 포함할 수 있다. 또 다른 예에서, 3'은 일렬 반복서열을 포함할 수 있고, 5' UTR은 적어도 하나의 miRNA 표적 서열을 포함할 수 있다.

특정 구현예에서, 발현 카세트는 트랜스 유전자에 대한 종결 코돈의 약 0개 내지 20개 뉴클레오티드 내에서 시작하는 2개, 3개 또는 4개 이상의 일렬 반복서열을 포함한다. 또 다른 구현예에서, 발현 카세트는 트랜스 유전자의 종결 코돈으로부터 적어도 100개 내지 약 4,000개 뉴클레오티드의 miRNA 일렬 반복서열을 포함한다.

특정 구현예에서, miRNA 표적 서열 사이의 스페이서는 동일하다. 본원에서 사용된 바, CDKL5 또는 hCDKL5는 달리 명시되지 않은 경우라면 이소형 1을 말한다. 이소형 2 내지 4는 CDKL5-2GS 또는 hCDKL5-2GS, CDKL5-3GS 또는 hCDKL5-3GS, 및 CDKL5-4GS 또는 hCDKL5-4GS로서 특정될 수 있다. 이들 이소형을 갖는 발현 카세트 및 벡터 게놈은 이소형 1에 대해 기술된 바와 같이 제작될 수 있다.

본원에 참고문헌으로 통합되는 2019년 12월 20일에 제출된 국제출원 PCT/US19/67872, 현재 국제특허출원 WP 제 2020/132455호; 2020년 5월 12일에 제출된 미국 가특허출원 제 US 63/023,593호; 2020년 6월 12일에 제출된 미국 가특허출원 제 US 63/038,488호; 2020년 6월 24일에 제출된 미국 가특허출원 제 US 63/043,562호; 2020년 9월 16일에 제출된 미국 가특허출원 제 US 63/079,299호; 2011년 2월 22일에 제출된 미국 가특허출원 제 US 63/152,042호 참조, 이들은 본원에 참고문헌으로 통합된다.

특정 구현예에서, 클라드 F AAV 캡시드는 AAVhu68 캡시드, AAV9 캡시드, AAVhu31 캡시드, AAVhu32 캡시드, 또는 이들 캡시드 중 하나의 조작된 변이체 (예로, AAV-PHP.B)로부터 선택된다. AAVhu68 캡시드 단백질을 인코딩하는 핵산 서열은 하기 실시예에서 벡터 게놈을 보유하는 AAV.hCDKL5 재조합 AAV (rAAV)의 생산에 사용된다. AAVhu68 또는 AAV-PHP.B에 관한 추가적인 세부사항은 국제특허출원 제 WO 2018/160582호 및 미국 특허 제 US 2015/0079038호에 제공되고, 이들 각각은 본원에 이의 전문이 참고문헌으로 통합된다. 본원에 기술된 클라드 F 벡터는 뇌, 해마, 운동 피질, 소뇌 및 운동 뉴런을 포함한 중앙 신경계 내의 세포로 hCDKL5 코딩 서열을 포함하는 벡터 게놈의 전달에 매우 적합하다. 이들 벡터는 중앙 신경계 (CNS) 및 특정 다른 조직 내의 다른 세포 및 CNS 외부의 세포를 표적하는데 사용될 수 있다.

특정 구현예에서, 본원에 기술된 조성물 및 방법을 위한 AAV 캡시드는 표적 세포에 기초하여 선택된다. 특정 구현예에서, AAV 캡시드는 CNS 세포 및/또는 PNS 세포를 형질도입시킨다. 특정 구현예에서, AAV 캡시드는 cy02 캡시드, rh43 캡시드, AAV8 캡시드, rh01 캡시드, AAV9 캡시드, rh8 캡시드, rh10 캡시드, bb01 캡시드, hu37 캡시드, rh02 캡시드, rh20 캡시드, rh39 캡시드, rh64 캡시드, AAV6 캡시드, AAV1 캡시드, hu44 캡시드, hu48 캡시드, cy05 캡시드, hu11 캡시드, hu32 캡시드, pi2 캡시드, 또는 이들의 변이로부터 선택된다. 특정 구현예에서, AAV 캡시드는 AAV9 캡시드, AAVhu68 캡시드, hu31 캡시드, hu32 캡시드, 또는 이들의 변이와 같은 클라드 F 캡시드이다. 예로, 각각이 본원에 이들의 전문이 참고문헌으로 통합되는 2015년 4월 14일에 공개된 국제특허출원 제 WO 2005/033321호, 제 WO 2018/160582호 및 미국 특허 제 US 2015/0079038호 참조. 특정 구현예에서, AAV 캡시드는 비-클라드 F 캡시드, 예를 들면 클라드 A, B, C, D 또는 E 캡시드이다. 특정 구현예에서, 비-클라드 F 캡시드는 AAV1 또는 이들의 변이체이다. 특정 구현예에서, AAV 캡시드는 신경계 세포 이외의 표적 세포를 형질도입시킨다. 특정 구현예에서, AAV 캡시드는 클라드 A 캡시드 (예로, AAV1, AAV6, AAVrh91), 클라드 B 캡시드 (예로, AAV 2), 클라드 C 캡시드 (예로, hu53), 클라드 D 캡시드 (예로, AAV7), 또는 클라드 E 캡시드 (예로, rh10)이다. 특정 구현예에서, AAV 캡시드는 AAVrh91 캡시드 (서열번호 33 및 35의 핵산 서열)와 같은 클라드 A 캡시드이다. 본원에 참고문헌으로 통합되는 2020년 4월 29일에 제출된 국제출원 PCT/US20/030266호, 현재 국제특허출원 WP 제 WO2020/223231호; 본원에 참고문헌으로 통합되는 2019년 4월 29일에 제출된 미국 가특허출원 제 US 63/065,616호 참조. 또한, 본원에 참고문헌으로 통합되는 2020년 8월 14일에 제출된 미국 가특허출원 제 US 63/065,616호; 및 2020년 11월 4일에 제출된 미국 가특허출원 제 US 63/109,734호 참조. 또한, 다른 AAV 캡시드도 선택될 수 있다.

본원에 사용된 바, AAV 그룹과 관련된 용어 "클라드"는 AAV vp1 아미노산 서열의 정렬을 기초로 하여, 적어도 75%의 부트스트랩 값에 의한 근연 관계 알고리즘 및 0.05 이하의 포이즌 교정 거리 측정을 사용하여 결정된 계통유전학적으로 서로 연관된 AAV 그룹을 말한다. 근연 관계 알고리즘은 문헌에 설명되어 있다. 예로, M. Nei and S. Kumar, Molecular Evolution and Phylogenetics (뉴욕, 옥스포드 대학 출판사 (2000) 참조. 이러한 알고리즘을 실행하는데 사용될 수 있는 컴퓨터 프로그램이 입수가능하다. 예를 들면, MEGA v2.1 프로그램이 변형된 네이-고조보리 (Nei-Gojobori) 방법을 실행시킨다. 이들 기법 및 컴퓨터 프로그램, 및 AAV vp1 캡시드 단백질의 서열을 사용하여, 선택된 AAV가 본원에서 확인된 클라드 중 하나, 또 다른 클라드, 또는 이들 클라드 외부에 포함되는지 여부를 당업자라면 쉽게 결정할 수 있다. 예로, 클라드 A, B, C, D, E 및 F를 식별하고, 신규한 AAV, 진뱅크 기탁번호 AY530553 내지 AY530629의 핵산 서열을 제공하는, G. Gao, et al., J. Virol., 2004년 6월, 78(10): 6381-6388 참조. 또한, 국제특허출원 제 WO 2005/033321호 참조.

rAAV는 AAV 캡시드 및 벡터 게놈으로 구성된다. AAV 캡시드는 vp1의 이종유래 집단, vp2의 이종유래 집단 및 vp3의 이종유래 집단의 조립체이다. 본원에 사용된 바, vp 캡시드 단백질을 언급하는데 사용될 때, 용어 "이종유래" 또는 임의의 문법적 활용형은 동일하지 않는, 예를 들면 상이한 변형된 아미노산 서열을 갖는 vp1, vp2 또는 vp3 단량체 (단백질)를 갖는 요소로 구성된 집단을 말한다.

본원에 사용된 바, vp 캡시드 단백질의 언급에 사용될 때, 용어 "이종유래" 또는 임의의 문법적 활용형은 동일하지 않는, 예를 들면 상이한 변형된 아미노산 서열을 갖는 vp1, vp2 또는 vp3 단량체 (단백질)를 갖는 요소로 구성된 집단을 말한다. vp1, vp2 및 vp3 단백질 (대안적으로 이소형으로 명명됨)과 연결하여 사용되는 용어 "이종유래 집단"은 캡시드 내의 vp1, vp2 및 vp3 단백질의 아미노산 서열에서의 차이를 말한다. AAV 캡시드는 예측된 아미노산 잔기로부터의 변형을 갖는 vp1 단백질 내, vp2 단백질 내 및 vp3 단백질 내의 하위집단을 포함한다. 이들 하위집단은 최소한으로 특정 탈아미노화된 아스파라진 (N 또는 Asn) 잔기를 포함한다. 예를 들면, 특정 하위집단은 아스파라진 - 글리신 쌍에서 적어도 1개, 2개, 3개 또는 4개의 높게 탈아미노화된 아스파라진 (N) 위치를 포함하고, 선택적으로 다른 탈아미노화된 아미노산을 추가로 포함하며, 여기서 탈아미노화는 아미노산 변화 및 다른 선택적 변형을 유도한다.

특정 구현예에서, 다수의 높게 탈아미노화된 "NG" 위치를 포함하는 AAV 캡시드 이소형 (즉, VP1, VP2, VP3)의 이종유래 집단을 갖는 AAV 캡시드가 제공된다. 특정 구현예에서, 높게 탈아미노화된 위치는 예측된 전장의 VP1 아미노산 서열을 기준으로, 하기에 확인된 위치에 있다. 다른 구현예에서, 캡시드 유전자는 변형되어 언급된 "NG"는 제거되고 돌연변이체 "NG"가 또 다른 위치에 조작된다.

본원에 사용된 용어 "표적 세포" 및 "표적 조직"은 주제 AAV 벡터에 의해 형질도입되도록 의도된 임의의 세포 또는 조직을 말할 수 있다. 용어는 근육, 간, 폐, 기도 상피, 중앙 신경계, 뉴런, 눈 (안구 세포) 또는 심장 중 임의의 하나 이상을 말할 수 있다.

본원에 사용된 용어 "벡터 게놈"은 바이러스 캡시드, 예를 들면 AAV 캡시드에 포장되는 핵산 분자를 말하고, 숙주 세포 또는 환자의 세포에게 전달될 수 있다. 특정 구현예에서, 벡터 게놈은 5' 및 3' 최말단에 벡터 게놈을 AAV 캡시드 내로 포장하여, 유전자의 발현을 안내하는 서열에 작동가능하게 연결된 본원에 기술된 CDKL5 유전자를 이들 사이에 포함하는데 필요한 역전된 말단 반복서열 (ITR) 서열을 갖는 발현 카세트이다. 특정 구현예에서, 벡터 게놈은 5'부터 3' 말단으로 최소한의 AAV 5' ITR, 코딩 서열(들) 및 AAV 3' ITR을 포함할 수 있다. 특정 구현예에서, ITR은 AAV2, 캡시드과 상이한 출처의 AAV로부터 나오거나, 전장의 ITR 이외의 것이 선택될 수 있다. 특정 구현예에서, ITR은 생산 과정 동안 rep 기능을 제공하는 AAV와 동일한 AAV 출처 또는 상호보완하는 (transcomplementing) AAV로부터 나온다. 또한, 다른 ITR이 사용될 수 있다. 벡터 게놈은 때로 본원에서 "미니유전자"로도 지칭된다.

본원에 사용된 용어 "숙주 세포"는 rAAV가 플라스미드로부터 생산되는 포장화 세포를 말할 수 있다. 대안으로, 용어 "숙주 세포"는 미니유전자의 발현이 바람직한 표적 세포를 말할 수 있다.

상기에 지시된 바, 원하는 세포를 표적하는 AAV 캡시드, 및 최소한으로 벡터 게놈을 캡시드 내에 포장하는데 필요한 AAV ITR, hCDKL5 코딩 서열 및 이들의 발현을 안내하는 조절 서열을 포함하는 벡터 게놈을 갖는 rAAV가 제공된다. 특정 구현예에서, 벡터 게놈은 단일가닥 AAV 벡터 게놈이다. 특정 구현예에서, 자가-상보적인 (sc) AAV 벡터 게놈을 포함하는 rAAV 벡터가 본 발명에 사용될 수 있다.

벡터의 AAV 서열은 전형적으로 시스-작용하는 5' 및 3' 역전된 말단 반복서열 (ITR) 서열을 포함한다 (예로, B. J. Carter, in "Handbook of Parvoviruses" ed., P. Tijsser, CRC Press, pp 155 168 (1990) 참조). ITR 서열은 약 145개 염기쌍 (bp)의 길이이다. 바람직하게, 이들 서열의 소수 변형이 일정 정도로 허용가능하지만, ITR을 인코딩하는 전체 서열이 실질적으로 분자에 사용된다. 이들 ITR 서열을 변형시키는 능력은 당업계의 기술에 속한다 (예로, Sambrook et al., "Molecular Cloning. A Laboratory Manual" 제 2 개정판, Cold Spring Harbor Laboratory, New York (1989); 및 K. Fisher et al., J. Virol., 70: 520-532 (1996) 참조). 본 발명에 채용된 이러한 분자의 예는 트랜스 유전자를 포함하는 "시스 작용하는" 플라스미드이고, 여기서 선택된 트랜스 유전자 및 연관된 조절 요소는 5' 및 3' AAV ITR 서열에 의해 연접된다. 일 구현예에서, ITR은 캡시드를 공급하는 것과 상이한 AAV로부터 나온다. 일 구현예에서, ITR 서열은 AAV2로부터 나온다. D-서열 및 말단 분할 부위 (trs)가 결실되어 △ITR로 명명된 5' ITR의 단축된 버전이 기재되어 왔다. 다른 구현예에서, 전장의 AAV 5' 및 3' ITR이 사용된다. 특정 구현예에서, 벡터 게놈은 외부 A 요소가 결실된, 130개 염기쌍의 단축된 AAV2 ITR를 포함한다. 단축된 ITR은 내부 A 요소를 주형으로서 사용한 벡터 DNA의 증폭 과정 동안 145개 염기쌍의 야생형 길이로 재역전된다. 그러나, 다른 AAV 출처로부터의 ITR이 선택될 수 있다. ITR의 출처가 AAV2로부터 나오고, AAV 캡시드는 또 다른 AAV 출처로부터 나오는 경우에, 생성된 벡터는 슈도형으로 명명될 수 있다. 그러나, 이들 요소의 다른 입체구조가 적합할 수 있다.

특정 구현예에서, 5' AAV ITR - 프로모터 - 선택적 인핸서 - 선택적 인트론 - hCDKL5 코딩 서열 - 폴리 A - 3' ITR을 포함하는 벡터 게놈이 제작된다. 특정 구현예에서, 5' AAV ITR - 프로모터 - 선택적 인핸서 - 선택적 인트론 - hCDKL5 코딩 서열 - 선택적으로 반복되는 miR 탈표적화 서열 - 폴리 A - 3' ITR을 포함하는 벡터 게놈이 제작된다. 특정 구현예에서, 5' AAV ITR - 프로모터 - 선택적 인트론 - hCDKL5 코딩 서열 - 선택적 인핸서 - 폴리 A - 3' ITR을 포함하는 벡터 게놈이 제작된다. 특정 구현예에서, 5' AAV ITR - 프로모터 - 선택적 인핸서 - 선택적 인트론 - hCDKL5 코딩 서열 - 선택적 인핸서 - 선택적으로 반복되는 miR 탈표적화 서열 - 폴리 A - 3' ITR을 포함하는 벡터 게놈이 제작된다. 특정 구현예에서, ITR은 AAV2로부터 나온다. 특정 구현예에서, 하나 이상의 프로모터가 존재한다. 특정 구현예에서, 인핸서가 벡터 게놈에 존재한다. 특정 구현예에서, 하나 이상의 인핸서가 존재한다. 특정 구현예에서, 인트론이 벡터 게놈에 존재한다. 특정 구현예에서, 인핸서 및 인트론이 존재한다. 특정 구현예에서, 폴리 A는 SV40 폴리 A (즉, 시미안 바이러스 40 (SV 40) 후기 유전자로부터 유래한 폴리아데닐화 (폴리 A) 신호)이다. 특정 구현예에서, 폴리 A는 토끼 베타-글로빈 (RBG) 폴리 A이다. 특정 구현예에서, 벡터 게놈은 최소한으로 5' AAV ITR - hSyn 프로모터 - hCDKL5 코딩 서열 - 폴리 A - 3' ITR을 포함한다. 특정 구현예에서, 벡터 게놈은 최소한으로 5' AAV ITR - CB7 프로모터 - hCDKL5 코딩 서열 - RBG 폴리 A - 3' ITR을 포함한다. 특정 구현예에서, drg 탈표적화 서열은 본원에 기술된 1개, 2개, 3개 또는 4개 이상의 miR-183 서열이고, 발현 카세트에 포함된다. 특정 구현예에서, hCDKL5 코딩 서열은 CDKL5에 대한 것이다. 특정 구현예에서, hCDKL5 코딩 서열은 CDKL5-2GS에 대한 것이다. 특정 구현예에서, hCDKL5 코딩 서열은 CDKL5-3GS에 대한 것이다. 특정 구현예에서, hCDKL5 코딩 서열은 CDKL5-4GS에 대한 것이다. 선택적으로, 이들 벡터 게놈 중 하나 이상은 WPRE 요소를 포함한다.

본원에 사용된 바, 벡터 게놈 또는 벡터 게놈을 포함하는 rAAV는 본원에서 AAV. 프로모터 (조건부). 코작 (조건부). 인트론 (조건부). CDKL5 코딩 서열 (예로, hCDKL5, hCDKL5co, CDKL5, CDKL5co). miRNA (조건부). 폴리 A (조건부). 스투퍼 (조건부)로서 나타낸다. 특정 구현예에서, rAAV는 본원에서 AAV 캡시드. 프로모터 (조건부). 코작 (조건부). 인트론 (조건부). CDKL5 코딩 서열. miRNA (조건부). 폴리 A (조건부). 스투퍼 (조건부)로서 나타낸다. 선택적으로, 이들 벡터 게놈 중 하나 이상은 WPRE 요소를 포함한다.

특정 구현예에서, 벡터 게놈은 최소한으로 5' AAV ITR - 유비퀴틴 C 프로모터 - hCDKL5 코딩 서열 - 1개, 2개, 3개 또는 4개 이상의 miR-183 서열 - RBG 폴리 A - 3' ITR을 포함한다. 특정 구현예에서, 벡터 게놈은 최소한으로 5' AAV ITR - 닭 베타-액틴 혼성 프로모터 - hCDKL5 코딩 서열 - 1개, 2개, 3개 또는 4개 이상의 miR-183 서열 - RBG 폴리 A - 3' ITR을 포함한다. 선택적으로, 이들 벡터 게놈 중 하나 이상은 WPRE 요소를 포함한다.

추가적으로, 본원에 기술된 rAAV를 생산하는데 유용한 rAAV 생산 시스템이 본원에 제공된다. 생산 시스템은 (a) AAV 캡시드 단백질을 인코딩하는 핵산 서열; (b) 벡터 게놈; 및 (c) AAV 캡시드 내에 상기 벡터 게놈의 포장을 허용하기에 충분한 AAV rep 기능 및 헬퍼 기능을 포함하는 세포 배양물을 포함한다. 특정 구현예에서, 벡터 게놈은 서열번호 1, 3, 5, 7, 9, 29 또는 31이다. 특정 구현예에서, 세포 배양물은 인간 배아 신장 293 세포이다. 특정 구현예에서, AAV rep은 상이한 AAV로부터 나온다. 특정 구현예에서, AAV rep은 AAV2로부터 나온다. 특정 구현예에서, AAV rep 코딩 서열 및 cap 유전자는 동일한 핵산 분자 상에 있으며, 선택적으로 rep 서열 및 cap 서열 사이에 스페이서가 있다. 특정 구현예에서, 스페이서는 atgacttaaaccaggt (서열번호 15)이다.

AAV 바이러스성 벡터 (예로, 재조합 (r)AAV)를 생성하는데 사용하기 위해, 벡터 게놈은 포장하는 숙주 세포에게 전달된 임의의 적합한 벡터, 예로 플라스미드 상에서 운반될 수 있다. 본 발명에 유용한 플라스미드는 특히 원핵 세포, 곤충 세포, 포유동물 세포에서의 복제 및 포장에 적합하도록 조작될 수 있다. 적합한 형질감염 기법 및 숙주 세포를 포장하는 것은 공지되고/거나, 당업자에 의해 쉽게 설계될 수 있다.

벡터로서의 용도에 적합한 AAV를 생성하고 단리하는 방법은 당해 기술분야에 공지되어 있다. 일반적으로, 예로 본원에 각각의 전문이 참고문헌으로 통합되는, Grieger & Samulski, 2005, "Adeno-associated virus as a gene therapy vector: Vector development, production and clinical applications," Adv. Biochem. Engin/Biotechnol. 99: 119-145; Buning et al., 2008, "Recent developments in adeno-associated virus vector technology," J. Gene Med. 10: 717-733; 및 하기에 인용된 참고문헌 참조. 본원에 사용된 바, 유전자 요법 벡터는 환자를 치료하는데 용도하기에 적합한, 본원에 기술된 rAAV를 말한다. 유전자를 비리온 내에 포장하기 위해, ITR은 유전자를 포함하는 핵산 분자와 동일한 구조물에서 시스 형태로 요구되는 유일한 AAV 구성요소이다. cap 및 rep 유전자는 트랜스 형태로 공급될 수 있다.

일 구현예에서, 선택된 유전 요소는 형질감염, 전기천공, 리포좀 전달, 막 융합 기법, 고속 DNA 코팅된 펠렛, 바이러스성 감염 및 원형질체 융합을 포함하는 임의의 적합한 방법에 의해 전달될 수 있다. 안정한 AAV 포장화 세포도 만들어질 수 있다. 이러한 구조물을 제조하는데 사용된 방법은 핵산 조작 분야의 당업자에게 공지되어 있으며, 유전공학, 재조합 공학 및 합성 기법을 포함한다. 예로, Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press, Cold Spring Harbor, NY (2012) 참조.

용어 "AAV 중간물" 또는 "AAV 벡터 중간물"은 내부에 포장되는 원하는 게놈 서열이 결여된 조립된 rAAV 캡시드를 말한다. 또한, 이들은 "빈" 캡시드로도 명명될 수 있다. 이러한 캡시드는 발현 카세트의 검출가능한 게놈 서열이 없거나, 유전자 산물의 발현을 달성하기에 불충분한 단지 부분적으로 포장된 게놈 서열만을 포함할 수 있다. 이러한 빈 캡시드는 관심있는 유전자를 숙주 세포로 전달하는 기능이 없다.

본원에 기술된 재조합 아데노 관련 바이러스 (AAV)는 공지되어 있는 기법을 사용하여 생성될 수 있다. 예로, 국제특허출원 제 WO 2003/042397호; 제 WO 2005/033321호; 제 WO 2006/110689호; 미국 특허 제 US 7588772 B2호 참조. 이러한 방법은 AAV 캡시드 단백질을 인코딩하는 핵산 서열; 기능적 rep 유전자; 최소한으로 AAV 역전된 말단 반복서열 (ITR) 및 트랜스 유전자로 구성된 발현 카세트; 및 AAV 캡시드 단백질 내에 발현 카세트의 포장을 허용하는 충분한 헬퍼 기능을 포함하는 숙주 세포를 배양하는 것이 관여한다. 캡시드, 이에 따른 코딩 서열을 생성하는 방법, 및 rAAV 바이러스성 벡터의 생산 방법은 기술되어 왔다. 예로, Gao, et al., Proc. Natl. Acad. Sci. U.S.A. 100(10): 6081-6086 (2003) 및 미국 특허 제 US 2013/0045186A1호 참조.

일 구현예에서, 재조합 AAVhu68 또는 AAVrh91을 생산하는데 유용한 생산 세포 배양물이 제공된다. 이러한 세포 배양물은 숙주 세포에서 AAVhu68 캡시드 단백질을 발현하는 핵산; AAVhu68 캡시드 내로의 포장에 적합한 핵산 분자, 예로 AAV ITR 및 숙주 세포에서 산물의 발현을 안내하는 서열에 작동가능하게 연결된 유전자 산물을 인코딩하는 비-AAV 핵산 서열을 포함하는 벡터 게놈; 및 재조합 AAVhu68 또는 AAVrh91 캡시드 내로 벡터 게놈의 포장을 허용하기에 충분한 AAV rep 기능 및 아데노바이러스 헬퍼 기능을 포함한다. 일 구현예에서, 세포 배양물은 포유동물 세포 (예로, 특히 인간 배아 신장 293 세포) 또는 곤충 세포 (예로, 배쿨로바이러스)로 구성된다. 일 구현예에서, 세포 배양물은 포유동물 세포 (특히 예로, 인간 배아 신장 293 세포) 또는 곤충 세포 (예로, 스포도프테라 프루지퍼다 (Sf9) 세포)로 구성된다. 특정 구현예에서, 배큘로바이러스는 재조합 AAVhu68 또는 AAVrh91 캡시드 내로 벡터 게놈의 포장에 필요한 헬퍼 기능을 제공한다.

선택적으로, rep 기능은 hu68 또는 AAV-PHP.B 이외의 AAV에 의해 제공된다. 특정 구현예에서, 적어도 일부의 rep 기능은 AAVhu68 또는 AAVrh91로부터 나온다. 또 다른 구현예에서, rep 단백질은 AAVhu68 rep 이외의 이종유래 rep 단백질이고, 예를 들면 이에 한정되지는 않지만 AAV1 rep 단백질, AAV2 rep 단백질, AAV3 rep 단백질, AAV4 rep 단백질, AAV5 rep 단백질, AAV6 rep 단백질, AAV7 rep 단백질, AAV8 rep 단백질; 또는 rep 78, rep 68, rep 52, rep 40, rep 68/78 및 rep 40/52; 또는 이들의 단편; 또는 또 다른 출처이다. 임의의 이러한 AAVhu68 또는 돌연변이체 AAV 캡시드 서열은 숙주 세포에서 이들의 발현을 안내하는 외인성 조절 제어 서열의 통제 하에 있을 수 있다.

일 구현예에서, 세포는 적합한 세포 배양 (예로, HEK 293 또는 Sf9) 또는 현탁액으로 제조된다. 본원에 기술된 유전자 요법 벡터를 제조하는 방법은 유전자 요법 벡터의 생산에 사용되는 플라스미드 DNA의 생성, 벡터의 생성 및 벡터의 정제와 같은 당해 기술분야에서 널리 공지된 방법을 포함한다. 일부 구현예에서, 유전자 요법 벡터는 AAV 벡터이고, 생성된 플라스미드는 AAV 벡터 게놈 및 관심있는 유전자를 인코딩하는 AAV 시스-플라스미드, AAV rep 및 cap 유전자를 포함하는 AAV 트랜스-플라스미드, 및 아데노바이러스 헬퍼 플라스미드이다. 벡터 생성 공정은 세포 배양의 개시, 세포의 계대, 세포의 접종, 플라스미드 DNA를 사용한 세포의 형질감염, 형질감염-후 무-혈청 배지로의 배지 교환, 및 벡터 포함하는 세포 및 배양 배지의 수확과 같은 방법 단계를 포함할 수 있다. 수확된 벡터 포함하는 세포 및 배양 배지는 본원에서 미정제 세포 수확물로서 지칭된다. 또 다른 시스템에서, 유전자 요법 벡터는 배큘로바이러스 기반의 벡터를 사용한 감염에 의해 곤충 세포 내에 도입된다. 이러한 생산 시스템에 관한 리뷰를 위해, 일반적으로 예로 본원에 이의 전문이 참고문헌으로 통합되는 Zang et al., 2009, "Adenovirus-adeno-associated virus hybrid for large-scale recombinant adeno-associated virus production," Human Gene Therapy 20: 922-929 참조. 또한, 이들 및 기타 AAV 생산 시스템을 제조하고 사용하는 방법은 하기 미국 특허 제 US 5,139,941호; 제 US 5,741,683호; 제 US 6,057,152호; 제 US 6,204,059호; 제 US 6,268,213호; 제 US 6,491,907호; 제 US 6,660,514호; 제 US 6,951,753호; 제 US 7,094,604호; 제 US 7,172,893호; 제 US 7,201,898호; 제 US 7,229,823호; 및 제 US 7,439,065호에 기재되어 있으며, 이들 각각은 이의 전문이 본원에 참고문헌으로 통합된다.

미정제 세포 수확물은 이어서 벡터 수확물의 농축, 벡터 수확물의 투과여과, 벡터 수확물의 미세유동화, 벡터 수확물의 뉴클레아제 소화, 미세유동화된 중간물의 여과, 크로마토그래피에 의한 일반 정제, 초원심분리에 의한 일반 정제, 접면 유동 여과에 의한 완충액 교환, 및/또는 대량의 벡터를 준비하는 제형화 및 여과와 같은 방법 단계가 시행될 수 있다.

높은 염 농도에서 두 단계 친화 크로마토그래피 정제에 이어진 음이온 교환 레진 크로마토그래피는 벡터 약물 산물을 정제하고, 빈 캡시드를 제거하는데 사용된다. 이러한 방법은 본원에 참고문헌으로 통합되는, 2016년 12월 9일에 제출된 국제특허출원 제 WO 2017/160360호 및 이의 우선권 서류; 2016년 4월 13일에 제출된 미국 특허 제 US 62/322,071호; 및 2015년 12월 11일에 제출되고 ""Scalable Purification Method for AAV9"라는 제목의 제 US 62/226,357호에 더 자세하게 기재되어 있다. 특정 구현예에서, 벡터 약물 산물 (예로, AAVrh91)의 정제는 본원에 참고문헌으로 통합되는, 2016년 12월 9일에 제출된 국제특허출원 제 WO 2017/100674호 및 이의 우선권 서류; 2015년 12월 9일에 제출된 미국 가특허출원 제 US 62/266,351호; 및 2016년 4월 13일에 제출되고 "Scalable Purification Method for AAV1"이라는 제목의 제 US 62/322,082호에 더 자세하게 기술된 것을 포함한다.

비어있는 및 완전된 입자 내용물을 계산하기 위하여, 선택된 시료 (예로, 본원의 실시예에서, GC의 수 = 입자의 수인 이오딕산올 구배-정제된 제조물)에 대한 VP3 밴드 부피가 로딩된 GC 입자에 대응하여 좌표화된다. 결과로 나온 선형 방정식 (y = mx + c)이 테스트 항목 피크의 밴드 부피에서 입자의 수를 계산하는데 사용된다. 다음으로 로딩된 20 μL 당 입자의 수 (pt)에 50을 곱하여 입자 (pt)/mL을 수득한다. GC/mL로 나누기한 pt/mL은 입자 대 게놈 사본 (pt/GC) 비를 제공한다. Pt/mL - GC/mL은 비어있는 pt/mL를 수득한다. pt/mL로 나누기한 빈 pt/mL × 100은 비어있는 입자의 백분율을 제공한다.

일반적으로, 빈 캡시드 및 포장된 게놈을 갖는 AAV 벡터 입자를 검정하는 방법은 당해 기술분야에 공지되어 있다. 예로, Grimm et al.,　Gene Therapy　(1999), 6: 1322-1330; Sommer et al.,　Molec. Ther. (2003), 7: 122-128 참조. 변성된 캡시드를 테스트하기 위해, 방법은 처리된 AAV 스톡을 3가지 캡시드 단백질을 분리할 수 있는 임의의 젤, 예를 들면 완충액 중 3% 내지 8% 트리스-아세테이트를 포함한 구배 젤로 구성되는 SDS-폴리아크릴아미드 젤 전기영동을 시행하고, 다음으로 시료 물질이 분리될 때까지 젤을 전개시키고, 나일론 또는 이트로셀룰로스 막, 바람직하게 나일론 상에 젤을 블럿팅하는 단계를 포함한다. 다음으로 항-AAV 캡시드 항체가 변성된 캡시드 단백질에 결합하는 일차 항체, 바람직하게 항-AAV 캡시드 단일클론 항체, 가장 바람직하게 B1 항-AAV-2 단일클론 항체로서 사용된다 (Wobus et al., J. Virol. (2000), 74: 9281-9293). 다음으로 이차 항체, 일차 항체에 결합하고, 일차 항체와의 결합을 검출하기 위한 수단, 더욱 바람직하게 이에 공유 결합하는 검출 분자를 포함하는 항-IgG 항체, 가장 바람직하게 호스래디쉬 퍼옥시다제에 공유 결합된 양 항-마우스 IgG 항체가 사용된다. 결합을 검출하는 방법은 일차 및 이차 항체 사이의 결합을 반정량적으로 결정하는데 사용되고, 바람직하게 방사성 동위원소 방출, 전자기적 방사선 조사 또는 비색측정 변화를 검출할 수 있는 검출 방법, 가장 바람직하게는 화학발광 검출 키트이다. 예를 들면, SDS-PAGE의 경우, 컬럼 분획으로부터의 시료는 채취되어 환원제 (예로, DTT)를 포함한 SDS-PAGE 로딩 완충액에서 가열될 수 있으며, 캡시드 단백질은 사전주입 구배 폴리아크릴아미드 젤 (예로, 노벡스사) 상에서 분리되었다. 은 염색이 제조사의 지침에 따른 실버엑스프레스 (인비트로겐사, CA) 또는 다른 적합한 염색 방법, 즉 SYPRO 루비 또는 쿠마시 염색을 사용하여 수행될 수 있다. 일 구현예에서, 컬럼 분획에서 AAV 벡터 게놈 (vg)의 농도는 정량적 실시간 PCR (Q-PCR)에 의해 측정될 수 있다. 시료는 외인성 DNA를 제거하도록 희석하여 DNase I (또는 또 다른 적합한 뉴클레아제)로 소화시킨다. 뉴클레아제의 불활성화 이후에, 시료는 추가로 희석되어 프라이머들 사이의 DNA 서열에 특이적인 TaqMan^TM형광생성 프로브를 사용하여 증폭되었다. 정의된 수준의 형광에 도달하는데 필요한 주기의 횟수 (역치 주기, Ct)는 각 시료에 대해 어플라이드 바이오시스템 프리즘 7700 서열 검출 시스템 상에서 측정되었다. AAV 벡터에 포함된 서열과 동일한 서열을 포함하는 플라스미드 DNA는 Q-PCR 반응에서 표준 곡선을 생성하는데 채용되었다. 시료로부터 획득된 주기 역치 (Ct) 값은 벡터 게놈 역가를 플라스미드 표준 곡선의 Ct 값으로 정규화함으로써 이를 결정하는데 사용된다. 디지털 PCR을 기초로 한 종결점 검정법도 사용될 수 있다.

일 양태에서, 광범위 스펙트럼 세린 프로테아제, 예로 단백질분해효소 K (예컨대 퀴아젠사로부터 구입가능함)를 사용하는 최적화된 q-PCR 방법이 사용된다. 보다 구체적으로, 최적화된 q-PCR 게놈 역가 검정법은 DNAase I 소화 이후에 시료를 단백질분해효소 K 완충액으로 희석하여 단백질분해효소 K로 처리하고, 이어서 열 불활성화를 진행하는 점을 제외하고는 표준 검정법과 유사하다. 적합하게, 시료는 시료 크기와 동등한 양의 단백질분해효소 K 완충액으로 희석된다. 단백질분해효소 K 완충액은 2배 이상으로 농축될 수 있다. 전형적으로, 단백질분해효소 K 처리는 약 0.2 mg/mL이지만, 0.1 mg/mL 내지 약 1 mg/mL으로 변화될 수 있다. 처리 단계는 일반적으로 약 55℃에서 약 15분 동안 시행되지만, 더 낮은 온도 (예로, 약 37℃ 내지 약 50℃)에서 더 긴 시간 (예로, 약 20분 내지 약 30분) 동안, 또는 더 높은 온도 (예로, 최고 약 60℃)에서 더 짧은 시간 (예로, 약 5분 내지 10분) 동안 수행될 수 있다. 유사하게, 열 불활성화는 일반적으로 약 95℃에서 약 15분 동안이지만, 온도를 낮추고 (예로, 약 70℃ 내지 약 90℃) 시간을 연장할 수 있다 (예로, 약 20분 내지 30분). 다음으로 시료를 희석하고 (예로, 1,000배), 표준 검정법에서 설명된 바와 같이 TaqMan 분석을 시행한다.

추가적으로 또는 대안적으로, 비말 디지털 PCR (ddPCR)이 사용될 수 있다. 예를 들면, ddPCR에 의해 단일가닥 및 자가-상보적 AAV 벡터 게놈 역가를 결정하는 방법이 기재되어 있다. 예로, M. Lock et al., Hu Gene Therapy Methods, Hum Gene Ther Methods, 2014년 4월; 25(2): 115-25. doi: 10.1089/hgtb.2013.131. Epub 2014년 2월 14일 참조.

간략하게, 게놈 결함성 AAVhu68 (또는 AAVrh91) 중간물로부터 포장된 게놈 서열을 갖는 rAAVhu68 (또는 rAAVrh91) 입자를 분리하는 방법은 재조합 AAVhu68 (또는 rh91) 바이러스 입자 및 AAVhu68 (또는 AAVrh91) 캡시드 중간물을 포함하는 현탁액에 대해 신속 성능 액체 크로마토그래피를 시행하는 단계를 포함하고, 여기서 AAVhu68 (또는 AAVrh91) 바이러스 입자 및 AAVhu68 중간물은 pH 약 10.2 (AAVrh91의 경우 pH 약 9.8)에서 평형화된 강한 음이온 교환 레진에 결합시키고, 용리물을 약 260 nm 및 약 280 nm에서 자외선 흡광도에 대해 모니터링하면서 염 구배를 시행한다. rAAVhu68 또는 AAVrh91의 경우에 덜 적합하지만, pH 약 10 내지 10.4의 범위일 수 있다. 이러한 방법에서, AAV 완전한 캡시드는 A260/A280 비가 감염점에 도달할 때 용리되는 분획으로부터 수집된다. 일 예에서, 친화 크로마토그래피 단계의 경우, 투과여과된 산물은 AAVhu68 또는 AAVrh91 혈청형을 효율적으로 포획하는 친화 레진 (라이프 테크놀로지사)에 적용될 수 있다. 이들 이온 조건 하에, 유의한 백분율의 잔류 세포성 DNA 및 단백질은 컬럼을 통과하는 반면, AAV 입자는 효율적으로 포획된다.

rAAV.hCDKL5는 적합한 생리학적으로 적격한 조성물 (예로, 완충된 식염수)에 현탁된다. 이러한 조성물은 보관을 위해 냉동되고, 이후에 해동되며, 선택적으로 적합한 희석제로 희석될 수 있다. 대안적으로, 벡터는 냉동 및 해동 단계를 거치지 않고도 환자에게 전달에 적합한 조성물로서 제조될 수 있다.

본원에 사용된 용어 "NAb 역가"는 항체의 표적화된 에피토프 (예로, AAV)의 생리학적 효과를 중화시키는 중화 항체 (예로, 항-AAV NAb)가 생산되는 양의 측정이다. 항-AAV NAb 역가는, 예로 본원에 참고문헌으로 통합되는 Calcedo, R., et al., Worldwide Epidemiology of Neutralizing Antibodies to Adeno-Associated Viruses. Journal of Infectious Diseases, 2009, 199(3): 381-390에 기술된 바와같이 측정될 수 있다.

약어 "sc"는 자가-상보적임을 말한다. "자가-상보적인 AAV"는 재조합 AAV 핵산에 보유되는 코딩 영역이 분자내 이중가닥 DNA 주형을 형성하도록 설계되었던 구조물을 말한다. 감염 시, 세포 매개된 두 번째 가닥의 합성을 기다리기보다는, scAAV의 2개의 상보적인 절반이 회합하여 즉각적인 복제 및 전사가 준비된 하나의 이중가닥 DNA (dsDNA) 단위를 형성할 것이다. 예로, D.M. McCarty et al, "Self-complementary recombinant adeno-associated virus (scAAV) vectors promote efficient transduction independently of DNA synthesis", Gene Therapy, (2001년 8월), Vol 8, No. 16, pp 1248-1254 참조. 자가-상보적인 AAV는, 예로 미국 특허 제 US 6,596,535호; 제 US 7,125,717호; 및 제 US 7,456,683호에 기술되어 있으며, 이들 각각은 본원에 이들의 전문이 참고문헌으로 통합된다.

"복제 결함성 바이러스" 또는 "바이러스성 벡터"는 관심있는 유전자를 포함하는 발현 카세트가 바이러스 캡시드 또는 외피에 포장되는 합성 또는 인공 바이러스 입자로서, 바이러스 캡시드 또는 외피 내에 포장된 임의의 바이러스 게놈 서열도 복제 결함성이고, 즉 이들이 자손 비리온을 생성할 수는 없지만 표적 세포를 감염시키는 능력은 보유하는, 바이러스 입자를 말한다. 일 구현예에서, 바이러스성 벡터의 게놈은 복제하는데 필요한 효소를 인코딩하는 유전자를 포함하지 않지만 (게놈이 인공 게놈의 증폭 및 포장에 필요한 신호가 연접된 관심있는 유전자만을 포함하는 "내용물이 없음"으로 조작될 수 있음), 이들 유전자가 생산 과정 동안 공급될 수 있다. 따라서, 이것은 자손 비리온에 의한 복제 및 감염이 복제에 필요한 바이러스 효소가 존재하지 않고는 발생할 수 없기 때문에 유전자 요법에 사용되기에 안전한 것으로 간주된다.

많은 경우에, rAAV 입자는 DNAase 저항성으로 언급된다. 그러나, 이러한 엔도뉴클레아제 (DNAase)에 추가하여, 다른 엔도- 및 엑소- 뉴클레아제도 본원에 기술된 정제 단계에서 오염된 핵산을 제거하는데 사용될 수 있다. 이러한 뉴클레아제는 단일가닥 DNA 및/또는 이중가닥 DNA, 및 RNA를 분해하도록 선택될 수 있다. 이러한 단계는 단일한 뉴클레아제 또는 상이한 표적으로 유도되는 뉴클레아제의 혼합물을 포함할 수 있고, 엔도뉴클레아제 또는 엑소뉴클레아제일 수 있다.

용어 "뉴클레아제 - 저항성"은 AAV 캡시드가 유전자를 숙주 세포로 전달하도록 설계된 발현 카세트 주변에 완전하게 조립되고, 이들 포장된 게놈 서열이 생산 공정으로부터 생성될 수 있는 오염된 핵산을 제거하도록 설계된 뉴클레아제 배양 단계 동안 분해 (소화)로부터 보호하는 것을 가리킨다.

Ⅳ. 기타 벡터

본원에 기술된 발현 카세트를 포함하는 벡터가 본원에 제공된다. 특정 구현예에서, 발현 카세트는 hCDKL5 발현을 안내하는 조절 서열의 제어 하에 기능적 인간 사이클린 의존성 키나제 유사 5 (hCDKL5)를 인코딩하는 핵산 서열을 포함한다. 특정 구현예에서, hCDKL5 코딩 서열은

[MKIPNIGNVMNKFEILGVVGEGAYGVVLKCRHKETHEIVAIKKFKDSEENEEVKETTLRELKMLRTLKQENIVELKEAFRRRGKLYLVFEYVEKNMLELLEEMPNGVPPEKVKSYIYQLIKAIHWCHKNDIVHRDIKPENLLISHNDVLKLCDFGFARNLSEGNNANYTEYVATRWYRSPELLLGAPYGKSVDMWSVGCILGELSDGQPLFPGESEIDQLFTIQKVLGPLPSEQMKLFYSNPRFHGLRFPAVNHPQSLERRYLGILNSVLLDLMKNLLKLDPADRYLTEQCLNHPTFQTQRLLDRSPSRSAKRKPYHVESSTLSNRNQAGKSTALQSHHRSNSKDIQNLSVGLPRADEGLPANESFLNGNLAGASLSPLHTKTYQASSQPGSTSKDLTNNNIPHLLSPKEAKSKTEFDFNIDPKPSEGPGTKYLKSNSRSQQNRHSFMESSQSKAGTLQPNEKQSRHSYIDTIPQSSRSPSYRTKAKSHGALSDSKSVSNLSEARAQIAEPSTSRYFPSSCLDLNSPTSPTPTRHSDTRTLLSPSGRNNRNEGTLDSRRTTTRHSKTMEELKLPEHMDSSHSHSLSAPHESFSYGLGYTSPFSSQQRPHRHSMYVTRDKVRAKGLDGSLSIGQGMAARANSLQLLSPQPGEQLPPEMTVARSSVKETSREGTSSFHTRQKSEGGVYHDPHSDDGTAPKENRHLYNDPVPRRVGSFYRVPSPRPDNSFHENNVSTRVSSLPSESSSGTNHSKRQPAFDPWKSPENISHSEQLKEKEKQGFFRSMKKKKKKSQTVPNSDSPDLLTLQKSIHSASTPSSRPKEWRPEKISDLQTQSQPLKSLRKLLHLSSASNHPASSDPRFQPLTAQQTKNSFSEIRIHPLSQASGGSSNIRQEPAPKGRPALQLPGQMDPGWHVSSVTRSATEGPSYSEQLGAKSGPNGHPYNRTNRSRMPNLNDLKETAL] (서열번호 2)의 아미노산 서열을 포함하는 hCDKL5 단백질을 인코딩하고, 여기서 hCDKL5 코딩 서열은 서열번호 22의 또는 서열번호 22와 적어도 약 95% 일치하고 서열번호 2의 단백질을 인코딩하는 핵산 서열이다. 특정 구현예에서, hCDKL5 코딩 서열은

[MKIPNIGNVMNKFEILGVVGEGAYGVVLKCRHKETHEIVAIKKFKDSEENEEVKETTLRELKMLRTLKQENIVELKEAFRRRGKLYLVFEYVEKNMLELLEEMPNGVPPEKVKSYIYQLIKAIHWCHKNDIVHRDIKPENLLISHNDVLKLCDFGFARNLSEGNNANYTEYVATRWYRSPELLLGAPYGKSVDMWSVGCILGELSDGQPLFPGESEIDQLFTIQKVLGPLPSEQMKLFYSNPRFHGLRFPAVNHPQSLERRYLGILNSVLLDLMKNLLKLDPADRYLTEQCLNHPTFQTQRLLDRSPSRSAKRKPYHVESSTLSNRNQAGKSTALQSHHRSNSKDIQNLSVGLPRADEGLPANESFLNGNLAGASLSPLHTKTYQASSQPGSTSKDLTNNNIPHLLSPKEAKSKTEFDFNIDPKPSEGPGTKYLKSNSRSQQNRHSFMESSQSKAGTLQPNEKQSRHSYIDTIPQSSRSPSYRTKAKSHGALSDSKSVSNLSEARAQIAEPSTSRYFPSSCLDLNSPTSPTPTRHSDTRTLLSPSGRNNRNEGTLDSRRTTTRHSKTMEELKLPEHMDSSHSHSLSAPHESFSYGLGYTSPFSSQQRPHRHSMYVTRDKVRAKGLDGSLSIGQGMAARANSLQLLSPQPGEQLPPEMTVARSSVKETSREGTSSFHTRQKSEGGVYHDPHSDDGTAPKENRHLYNDPVPRRVGSFYRVPSPRPDNSFHENNVSTRVSSLPSESSSGTNHSKRQPAFDPWKSPENISHSEQLKEKEKQGFFRSMKKKKKKSQTTDSTNGENPSIKKSLFPLFNSKNHLKHSSSLKKLPVVTPPMVPNSDSPDLLTLQKSIHSASTPSSRPKEWRPEKISDLQTQSQPLKSLRKLLHLSSASNHPASSDPRFQPLTAQQTKNSFSEIRIHPLSQASGGSSNIRQEPAPKGRPALQLPGQMDPGWHVSSVTRSATEGPSYSEQLGAKSGPNGHPYNRTNRSRMPNLNDLKETAL] (서열번호 6)의 아미노산 서열을 포함하는 hCDKL5-2GS 단백질을 인코딩하고, 여기서 hCDKL5 코딩 서열은 서열번호 24의 또는 서열번호 24와 적어도 약 95% 일치하고 서열번호 6의 단백질을 인코딩하는 핵산 서열이다. 특정 구현예에서, hCDKL5 코딩 서열은

[MKIPNIGNVMNKFEILGVVGEGAYGVVLKCRHKETHEIVAIKKFKDSEENEEVKETTLRELKMLRTLKQENIVELKEAFRRRGKLYLVFEYVEKNMLELLEEMPNGVPPEKVKSYIYQLIKAIHWCHKNDIVHRDIKPENLLISHNDVLKLCDFGFARNLSEGNNANYTEYVATRWYRSPELLLGAPYGKSVDMWSVGCILGELSDGQPLFPGESEIDQLFTIQKVLGPLPSEQMKLFYSNPRFHGLRFPAVNHPQSLERRYLGILNSVLLDLMKNLLKLDPADRYLTEQCLNHPTFQTQRLLDRSPSRNQAGKSTALQSHHRSNSKDIQNLSVGLPRADEGLPANESFLNGNLAGASLSPLHTKTYQASSQPGSTSKDLTNNNIPHLLSPKEAKSKTEFDFNIDPKPSEGPGTKYLKSNSRSQQNRHSFMESSQSKAGTLQPNEKQSRHSYIDTIPQSSRSPSYRTKAKSHGALSDSKSVSNLSEARAQIAEPSTSRYFPSSCLDLNSPTSPTPTRHSDTRTLLSPSGRNNRNEGTLDSRRTTTRHSKTMEELKLPEHMDSSHSHSLSAPHESFSYGLGYTSPFSSQQRPHRHSMYVTRDKVRAKGLDGSLSIGQGMAARANSLQLLSPQPGEQLPPEMTVARSSVKETSREGTSSFHTRQKSEGGVYHDPHSDDGTAPKENRHLYNDPVPRRVGSFYRVPSPRPDNSFHENNVSTRVSSLPSESSSGTNHSKRQPAFDPWKSPENISHSEQLKEKEKQGFFRSMKKKKKKSQTVPNSDSPDLLTLQKSIHSASTPSSRPKEWRPEKISDLQTQSQPLKSLRKLLHLSSASNHPASSDPRFQPLTAQQTKNSFSEIRIHPLSQASGGSSNIRQEPAPKGRPALQLPGQMDPGWHVSSVTRSATEGPSYSEQLGAKSGPNGHPYNRTNRSRMPNLNDLKETAL] (서열번호 8)의 아미노산 서열을 포함하는 hCDKL5-3GS 단백질을 인코딩하고, 여기서 hCDKL5 코딩 서열은 서열번호 25의 또는 서열번호 25와 적어도 약 95% 일치하고 서열번호 8의 단백질을 인코딩하는 핵산 서열이다. 특정 구현예에서, hCDKL5 코딩 서열은

[MKIPNIGNVMNKFEILGVVGEGAYGVVLKCRHKETHEIVAIKKFKDSEENEEVKETTLRELKMLRTLKQENIVELKEAFRRRGKLYLVFEYVEKNMLELLEEMPNGVPPEKVKSYIYQLIKAIHWCHKNDIVHRDIKPENLLISHNDVLKLCDFGFARNLSEGNNANYTEYVATRWYRSPELLLGAPYGKSVDMWSVGCILGELSDGQPLFPGESEIDQLFTIQKVLGPLPSEQMKLFYSNPRFHGLRFPAVNHPQSLERRYLGILNSVLLDLMKNLLKLDPADRYLTEQCLNHPTFQTQRLLDRSPSRNQAGKSTALQSHHRSNSKDIQNLSVGLPRADEGLPANESFLNGNLAGASLSPLHTKTYQASSQPGSTSKDLTNNNIPHLLSPKEAKSKTEFDFNIDPKPSEGPGTKYLKSNSRSQQNRHSFMESSQSKAGTLQPNEKQSRHSYIDTIPQSSRSPSYRTKAKSHGALSDSKSVSNLSEARAQIAEPSTSRYFPSSCLDLNSPTSPTPTRHSDTRTLLSPSGRNNRNEGTLDSRRTTTRHSKTMEELKLPEHMDSSHSHSLSAPHESFSYGLGYTSPFSSQQRPHRHSMYVTRDKVRAKGLDGSLSIGQGMAARANSLQLLSPQPGEQLPPEMTVARSSVKETSREGTSSFHTRQKSEGGVYHDPHSDDGTAPKENRHLYNDPVPRRVGSFYRVPSPRPDNSFHENNVSTRVSSLPSESSSGTNHSKRQPAFDPWKSPENISHSEQLKEKEKQGFFRSMKKKKKKSQTTDSTNGENPSIKKSLFPLFNSKNHLKHSSSLKKLPVVTPPMVPNSDSPDLLTLQKSIHSASTPSSRPKEWRPEKISDLQTQSQPLKSLRKLLHLSSASNHPASSDPRFQPLTAQQTKNSFSEIRIHPLSQASGGSSNIRQEPAPKGRPALQLPGQMDPGWHVSSVTRSATEGPSYSEQLGAKSGPNGHPYNRTNRSRMPNLNDLKETAL] (서열번호 10)의 아미노산 서열을 포함하는 hCDKL5-4GS 단백질을 인코딩하고, 여기서 hCDKL5 코딩 서열은 서열번호 26의 또는 서열번호 26과 적어도 약 95% 일치하고 서열번호 10의 단백질을 인코딩하는 핵산 서열이다.

특정 구현예에서, 벡터는 재조합 파보바이러스, 재조합 렌티바이러스, 재조합 레트로바이러스 또는 재조합 아데노바이러스; 또는 노출 DNA, 노출 RNA, 무기 입자, 지질 입자, 중합체 기반의 벡터 또는 키토산 기반의 제형물로부터 선택된 바이러스성 벡터일 수 있다. 선택된 벡터는 형질감염, 전기천공, 리포좀 전달, 막 융합 기법, 고속 DNA 코팅된 펠렛, 바이러스성 감염 및 원형질체 융합을 포함하는 임의의 적합한 방법에 의해 전달될 수 있다. 이러한 구조물을 제조하는데 사용된 방법은 핵산 조작 분야의 당업자에게 공지되어 있으며, 유전공학, 재조합 공학 및 합성 기법을 포함한다. 예로, Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press, Cold Spring Harbor, NY 참조.

"복제 결함성 바이러스" 또는 "바이러스성 벡터"는 관심있는 유전자를 포함하는 발현 카세트가 바이러스 캡시드 또는 외피에 포장되는 합성 또는 인공 바이러스 입자로서, 바이러스 캡시드 또는 외피 내에 포장된 임의의 바이러스 게놈 서열도 복제 결함성이고, 즉 이들이 자손 비리온을 생성할 수는 없지만 표적 세포를 감염시키는 능력은 보유하는, 바이러스 입자를 말한다. 일 구현예에서, 바이러스성 벡터의 게놈은 복제하는데 필요한 효소를 인코딩하는 유전자를 포함하지 않지만 (게놈이 인공 게놈의 증폭 및 포장에 필요한 신호가 연접된 관심있는 유전자만을 포함하는 "내용물이 없음"으로 조작될 수 있음), 이들 유전자가 생산 과정 동안 공급될 수 있다. 따라서, 이것은 자손 비리온에 의한 복제 및 감염이 복제에 필요한 바이러스 효소가 존재하지 않고는 발생할 수 없기 때문에 유전자 요법의 사용에 안전한 것으로 간주된다. 이러한 복제 결함성 바이러스는 아데노 관련 바이러스 (AAV), 아데노바이러스, 렌티바이러스 (혼입 또는 비-혼입), 또는 또 다른 적합한 바이러스 출처일 수 있다.

Ⅴ. 조성물

본원에서는 본원에 기술된 rAAV 또는 벡터, 및 수성 현탁액 매질을 포함하는 조성물이 제공된다. 특정 구현예에서, 현탁액은 정맥내 전달, 경막내 투여 또는 뇌실내 투여를 위해 제형화된다.

본원에서는 적어도 하나의 rAAV 스톡, 및 선택적 담체, 부형제 및/또는 보존제를 포함하는 조성물이 제공된다. 본원에 사용된 바, rAAV의 "스톡"은 rAAV의 집단을 말한다. 탈아미드화로 인한 이들의 캡시드 단백질의 이종성에도 불구하고, 스톡에서 rAAV는 일치하는 벡터 게놈을 공유할 것으로 예상된다. 스톡은 예를 들면 선택된 AAV 캡시드 단백질 및 선택된 생산 시스템의 이종유래 탈아미드화 양상 특징으로의 캡시드를 갖는 rAAV를 포함할 수 있다. 스톡은 단일 생산 시스템으로부터 생산되거나, 생산 시스템의 다수의 전개로부터 풀링될 수 있다. 본원에 기술된 생산 시스템을 포함하나 이에 한정되지 않은 다양한 생산 시스템이 선택될 수 있다.

본원에 사용된 바, "담체"는 임의의 및 모든 용매, 분산 매질, 비히클, 코팅제, 희석제, 항균제 및 항진균제, 등장제 및 흡수 지연제, 완충액, 담체 용액, 현탁액 및 콜로이드 등을 포함한다. 약제학적 활성 물질의 위한 이러한 매질 및 제제의 사용은 당해 기술분야에 널리 공지되어 있다. 또한, 보조적 활성 성분이 조성물 내에 도입될 수 있다. 용어 "약제학적으로 허용가능한"은 숙주에게 투여될 때 알레르기 또는 유사한 유해 반응을 생성하지 않는 분자적 실체 및 조성물을 말한다. 리포좀, 나노캡슐, 미세입자, 미세구, 액체 입자 및 소포 등과 같은 전달 비히클은 적합한 숙주 세포 내로 본 발명의 조성물의 도입에 사용될 수 있다. 구체적으로, rAAV 벡터 전달된 벡터 게놈은 액체 입자, 리포좀, 소포, 나노구 또는 나노입자 등에 피막화된 전달을 위해 제형화될 수 있다.

일 구현예에서, 조성물은 대상체에게 전달에 적합한 최종 제형물을 포함하고, 예로 생리학적으로 적격한 pH 및 염 농도로 완충된 수성 액체 현탁액이다. 선택적으로, 하나 이상의 계면활성제가 제형물에 존재한다. 또 다른 구현예에서, 조성물은 대상체에게 투여를 위해 희석되는 농축물로서 운반될 수 있다. 다른 구현예에서, 조성물은 동결건조되고, 투여 시 재구성될 수 있다.

적합한 계면활성제 또는 계면활성제의 조합은 비-독성인 비-이온성 계면활성제부터 선택될 수 있다. 일 구현예에서, 일차 히드록시기로 종결되는 이중기능성 블록 공중합체 계면활성제가, 예로 중성 pH를 갖고 평균 분자량 8,400을 갖는 폴록사머 188로도 알려져 있는 플루로닉^®F68 [바스프사]와 같이 선택된다. 다른 계면활성제 및 다른 폴록사머, 즉 폴리옥시에틸렌 (폴리(에틸렌 옥사이드))의 2개 친수성 사슬에 의해 연접된 폴리옥시프로필렌 (폴리(프로필렌 옥사이드))의 중앙 친수성 사슬로 구성된 비-이온성 삼중블록 공중합체, 솔루톨 HS 15 (마크로골-15 히드록시스테아레이트), 라브라졸 (폴리옥시 카프릴릭 글리세리드), 폴리옥시 10 올레일 에테르, 트윈 (폴리옥시에틸렌 소르비탄 지방산 에스테르), 에탄올 및 폴리에틸렌 글리콜이 선택될 수 있다. 일 구현예에서, 제형물은 폴록사머를 포함한다. 이들 공중합체는 공통적으로 문자 "P" (폴록사머)에 이어진 3개의 자리수로 명명되고, 처음 2개의 자리수 × 100은 폴리옥시프로필렌 코아의 대략적인 분자 질량을 나타내고, 마지막 자리수 × 10은 폴리옥시에틸렌 함량의 백분율을 나타낸다. 일 구현예에서, 폴록사머 188이 선택된다. 일 구현예에서, 계면활성제는 (중량비 w/w%를 기준으로 하여) 현탁액 중 최대 약 0.0005% 내지 약 0.001%의 양으로 존재할 수 있다. 또 다른 구현예에서, 계면활성제는 (부피비 v/v%를 기준으로 하여) 현탁액 중 최대 약 0.0005% 내지 약 0.001%의 양으로 존재할 수 있다. 또 다른 구현예에서, 계면활성제는 현탁액 중 최대 약 0.0005% 내지 약 0.001%의 양으로 존재할 수 있고, 여기서 n%는 100 mL의 현탁액 당 n 그램을 나타낸다.

또 다른 구현예에서, 조성물은 담체, 희석제, 부형제 및/또는 아쥬반트를 포함한다. 적합한 담체는 전달 바이러스가 유도하는 적응증의 관점에서 당업자라면 쉽게 선택할 수 있다. 예를 들면, 하나의 적합한 담체는 식염수이고, 이는 다양한 완충 용액으로 제형화될 수 있다 (예로, 포스페이트 완충된 식염수). 다른 예시적인 담체는 멸균 식염수, 락토스, 슈크로스, 칼슘 포스페이트, 젤라틴, 덱스트란, 한천, 펙틴, 땅콩유, 참깨유 및 물을 포함한다. 완충액/담체는 rAAV의 주입 튜브에 대한 접착을 방지하지만 생체내에서 rAAV 결합 활성에 개입하지 않는다. 적합한 계면활성제 또는 계면활성제의 조합은 비-독성인 비-이온성 계면활성제부터 선택될 수 있다. 일 구현예에서, 일차 히드록시기로 종결되는 이중기능성 블록 공중합체 계면활성제가, 예로 중성 pH를 갖고 평균 분자량 8,400을 갖는 폴록사머 188 (상표명 플루로닉^® F68 [바스프사], 루트롤^® F68, 신페로닉^® F68, 콜리포^® P188으로도 알려져 있음)와 같이 선택된다. 다른 계면활성제 및 다른 폴록사머, 즉 폴리옥시에틸렌 (폴리(에틸렌 옥사이드))의 2개 친수성 사슬에 의해 연접된 폴리옥시프로필렌 (폴리(프로필렌 옥사이드))의 중앙 친수성 사슬로 구성된 비-이온성 삼중블록 공중합체, 솔루톨 HS 15 (마크로골-15 히드록시스테아레이트), 라브라졸 (폴리옥시 카프릴릭 글리세리드), 폴리옥시-올레일 에테르, 트윈 (폴리옥시에틸렌 소르비탄 지방산 에스테르), 에탄올 및 폴리에틸렌 글리콜이 선택될 수 있다. 일 구현예에서, 제형물은 폴록사머를 포함한다. 이들 공중합체는 공통적으로 문자 "P" (폴록사머)에 이어진 3개의 자리수로 명명되고, 처음 2개의 자리수 × 100은 폴리옥시프로필렌 코아의 대략적인 분자 질량을 나타내고, 마지막 자리수 × 10은 폴리옥시에틸렌 함량의 백분율을 나타낸다. 일 구현예에서, 폴록사머 188이 선택된다. 계면활성제는 현탁액 중 최대 약 0.0005% 내지 약 0.001%의 양으로 존재할 수 있다.

특정 구현예에서, rAAV.hCDKL5를 포함하는 조성물은 pH 6.8 내지 8, pH 7.2 내지 7.8, 또는 pH 7.5 내지 8의 범위에서 전달된다. 경막내 전달을 위해, pH 7.5 초과, 예로 pH 7.5 내지 8, 또는 pH 7.8이 바람직할 수 있다.

특정 구현예에서, 제형물은 소듐 바이카보네이트를 포함하지 않는 완충된 식염수 수성 용액을 포함할 수 있다. 이러한 제형물은 물에 소듐 포스페이트, 염화나트륨, 염화 칼륨, 염화 칼슘, 염화 마그네슘 및 이들의 혼합물 중 하나 이상을 포함하는 완충된 식염수 수성 용액, 예컨대 하바드 완충액을 포함할 수 있다. 수성 용액은 바스프사로부터 입수가능하고 이전에 상표명 루트롤^® F68로 시판되었던 폴록사머, 콜리포^® P188를 추가로 포함할 수 있다. 수성 용액은 pH 7.2일 수 있다.

또 다른 구현예에서, 제형물은 1 mM 소듐 포스페이트 (Na₃PO₄), 150 mM 염화나트륨 (NaCl), 3 mM 염화 칼륨 (KCl), 1.4 mM 염화 칼슘 (CaCl₂), 0.8 mM 염화 마그네슘 (MgCl₂) 및 0.001% 폴록사머 (예로, 콜리포^®) 188, pH 7.2를 포함하는 완충된 식염수 수성 용액을 포함할 수 있다. 예로, harvardapparatus.com/harvard-apparatus-perfusion-fluid.html 참조. 특정 구현예에서, 하바드 완충액으로 관찰된 더 양호한 pH 안정성으로 인해 하바드 완충액이 바람직하다.

특정 구현예에서, 제형물 완충액은 플루로닉 F68을 갖는 인공 CSF이다. 다른 구현예에서, 제형물은 하나 이상의 투과 인핸서를 포함할 수 있다. 적합한 투과 인핸서의 예는 예로 만니톨, 소듐 글리코콜레이트, 소듐 타우로콜레이트, 소듐 데옥시콜레이트, 소듐 살리실레이트, 소듐 카프릴레이트, 소듐 카프레이트, 소듐 라우릴 설페이트, 폴리옥시에틸렌-9-라우렐 에테르 또는 EDTA를 포함할 수 있다.

선택적으로, 본 발명의 조성물은 rAAV 및 담체(들)에 추가하여, 다른 통상적인 약제학적 성분, 예컨대 보존제 또는 화학적 안정화를 포함할 수 있다. 적합한 예시적인 보존제는 클로로부탄올, 포타슘 소르베이트, 소르브산, 이산화황, 프로필 갈레이트, 파라벤, 에틸 바닐린, 글리세린, 페놀 및 파라클로로페놀을 포함한다. 적합한 화학적 안정화제는 젤라틴 및 알부민을 포함한다.

본 발명에 따른 조성물은 상기 정의된 것과 같은 약제학적으로 허용가능한 담체를 포함할 수 있다. 적합하게, 본원에 기술된 조성물은 약제학적으로 적합한 담체에 현탁되고/거나, 주사, 삼투 펌프, 경막내 카테터를 통한 대상체에게 전달을 위해 또는 또 다른 장치 또는 경로에 의한 전달을 위해 설계된 적합한 부형제와 혼합된 하나 이상의 AAV의 유효량을 포함한다. 일 예에서, 조성물은 경막내 전달을 위해 제형화된다. 일 예에서, 조성물은 정맥내 (iv) 전달을 위해 제형화된다.

Ⅵ. 용도

본원에서는 CDD를 치료하는 방법으로서, 본원에 기술된 rAAV 또는 벡터의 유효량을 이를 필요로 하는 대상체에게 투여하는 것을 포함하는, 방법이 제공된다.

특정 구현예에서, 본원의 "유효량"은 CDD 증상의 완화 및/또는 CDD 진행의 지연을 달성하는 양이다.

벡터는 과도한 유해 효과가 없이 또는 의학적으로 허용가능한 생리학적 효과와 함께 치료적 유익을 제공하도록 세포를 형질감염시켜 충분한 수준의 유전자 전달 및 발현을 제공하기에 충분한 양으로 투여되고, 이는 의학 분야의 당업자에 의해 결정될 수 있다. 통상적인 및 약제학적으로 허용가능한 투여 경로는 원하는 장기 (예로, 뇌, CSF, 간 (선택적으로 간 동맥을 통해), 폐, 심장, 눈, 신장)에 대한 직접적 전달, 경구, 흡입, 비강내, 경막내, 기관내, 동맥내, 안구내, 정맥내, 근육내, 피하, 피부내, 실질내, 뇌실내, 경막내, ICM, 요추 천자, 및 기타 비경구 투여 경로를 포함하나 이에 한정되지 않는다. 투여 경로는 원하는 경우 조합될 수 있다.

바이러스성 벡터의 용량은 주로 치료되는 병태, 환자의 연령, 체중 및 건강과 같은 요인에 의존하고, 따라서 환자들에서 변화될 수 있다. 예를 들면, 바이러스성 벡터의 치료적으로 유효한 인간 용량은 일반적으로 약 1 × 10⁹개 내지 1 × 10¹⁶개 벡터 게놈 사본의 농도를 포함하는 약 100 mL의 용액 중 약 25 μL 내지 약 1,000 μL 범위이다. 특정 구현예에서, 약 1 mL 내지 약 15 mL, 약 2.5 mL 내지 약 10 mL, 또는 약 5 mL 부피의 현탁액이 전달된다. 특정 구현예에서, 약 1 mL, 약 2 mL, 약 3 mL, 약 4 mL, 약 5 mL, 약 6 mL, 약 7 mL, 약 8 mL, 약 9 mL, 약 10 mL, 약 11 mL, 약 12 mL, 약 13 mL, 약 14 mL, 또는 약 15 mL 부피의 현탁액이 전달된다. 특정 구현예에서, 총 약 8.9 × 10¹²개 내지 2.7 × 10¹⁴개 GC의 용량이 이러한 부피로 투여된다. 특정 구현예에서, 총 약 1.1 × 10¹⁰개 GC/g 뇌 질량 내지 약 3.3 × 10¹¹개 GC/g 뇌 질량의 용량이 이러한 부피로 투여된다. 특정 구현예에서, 약 3.0 × 10⁹개 GC/g 뇌 질량, 약 4.0 × 10⁹개, 약 5.0 × 10⁹개, 약 6.0 × 10⁹개, 약 7.0 × 10⁹개, 약 8.0 × 10⁹개, 약 9.0 × 10⁹개, 약 1.0 × 10¹⁰개, 약 1.1 × 10¹⁰개, 약 1.5 × 10¹⁰개, 약 2.0 × 10¹⁰개, 약 2.5 × 10¹⁰개, 약 3.0 × 10¹⁰개, 약 3.3 × 10¹⁰개, 약 3.5 × 10¹⁰개, 약 4.0 × 10¹⁰개, 약 4.5 × 10¹⁰개, 약 5.0 × 10¹⁰개, 약 5.5 × 10¹⁰개, 약 6.0 × 10¹⁰개, 약 6.5 × 10¹⁰개, 약 7.0 × 10¹⁰개, 약 7.5 × 10¹⁰개, 약 8.0 × 10¹⁰개, 약 8.5.0 × 10¹⁰개, 약 9.0 × 10¹⁰개, 약 9.5 × 10¹⁰개, 약 1.0 × 10¹¹개, 약 1.1 × 10¹¹개, 약 1.5 × 10¹¹개, 약 2.0 × 10¹¹개, 약 2.5 × 10¹¹개, 약 3.0 × 10¹¹개, 약 3.3 × 10¹¹개, 약 3.5 × 10¹¹개, 약 4.0 × 10¹¹개, 약 4.5 × 10¹¹개, 약 5.0 × 10¹¹개, 약 5.5 × 10¹¹개, 약 6.0 × 10¹¹개, 약 6.5 × 10¹¹개, 약 7.0 × 10¹¹개, 약 7.5 × 10¹¹개, 약 8.0 × 10¹¹개, 약 8.5 × 10¹¹개, 약 9.0 × 10¹¹개 GC/g 뇌 질량의 용량이 이러한 부피로 투여된다.

용량은 임의의 부작용에 대응한 치료적 이익을 균형 잡도록 조절되고, 이러한 용량은 재조합 벡터가 채용되는 치료적 적용에 따라 달라질 수 있다. 트랜스 유전자 산물의 발현 수준은 바이러스성 벡터, 바람직하게 미니유전자를 포함하는 AAV 벡터를 생성하는 용량의 빈도를 결정하도록 모니터링될 수 있다. 선택적으로, 치료적 목적으로 기술된 것과 유사한 용량 요법은 본 발명의 조성물을 사용한 면역화에 사용될 수 있다.

복제 결함성 바이러스 조성물은 (대상체를 치료하는데) 범위 내의 모든 정수 또는 분획 양을 포함하여 약 1 × 10⁹개 내지 약 1 × 10¹⁶개 GC, 바람직하게 인간 환자의 경우 1 × 10¹²개 내지 약 1 × 10¹⁴개 GC의 범위에 있는 복제 결함성 바이러스의 양을 포함하도록 용량 단위로 제형화될 수 있다. 일 구현예에서, 조성물은 범위 내의 모든 정수 또는 분획 양을 포함하여 용량 당 적어도 1 × 10⁹개, 2 × 10⁹개, 3 × 10⁹개, 4 × 10⁹개, 5 × 10⁹개, 6 × 10⁹개, 7 × 10⁹개, 8 × 10⁹개 또는 9 × 10⁹개 GC를 포함하도록 제형화된다. 또 다른 구현예에서, 조성물은 범위 내의 모든 정수 또는 분획 양을 포함하여 용량 당 적어도 1 × 10¹⁰개, 2 × 10¹⁰개, 3 × 10¹⁰개, 4 × 10¹⁰개, 5 × 10¹⁰개, 6 × 10¹⁰개, 7 × 10¹⁰개, 8 × 10¹⁰개 또는 9 × 10¹⁰개의 GC를 포함하도록 제형화된다. 또 다른 구현예에서, 조성물은 범위 내의 모든 정수 또는 분획 양을 포함하여 용량 당 적어도 1 × 10¹¹개, 2 × 10¹¹개, 3 × 10¹¹개, 4 × 10¹¹개, 5 × 10¹¹개, 6 × 10¹¹개, 7 × 10¹¹개, 8 × 10¹¹개 또는 9 × 10¹¹개의 GC를 포함하도록 제형화된다. 또 다른 구현예에서, 조성물은 범위 내의 모든 정수 또는 분획 양을 포함하여 용량 당 적어도 1 × 10¹²개, 2 × 10¹²개, 3 × 10¹²개, 4 × 10¹²개, 5 × 10¹²개, 6 × 10¹²개, 7 × 10¹²개, 8 × 10¹²개 또는 9 × 10¹²개의 GC를 포함하도록 제형화된다. 또 다른 구현예에서, 조성물은 범위 내의 모든 정수 또는 분획 양을 포함하여 용량 당 적어도 1 × 10¹³개, 2 × 10¹³개, 3 × 10¹³개, 4 × 10¹³개, 5 × 10¹³개, 6 × 10¹³개, 7 × 10¹³개, 8 × 10¹³개 또는 9 × 10¹³개의 GC를 포함하도록 제형화된다. 또 다른 구현예에서, 조성물은 범위 내의 모든 정수 또는 분획 양을 포함하여 용량 당 적어도 1 × 10¹⁴개, 2 × 10¹⁴개, 3 × 10¹⁴개, 4 × 10¹⁴개, 5 × 10¹⁴개, 6 × 10¹⁴개, 7 × 10¹⁴개, 8 × 10¹⁴개 또는 9 × 10¹⁴개의 GC를 포함하도록 제형화된다. 또 다른 구현예에서, 조성물은 범위 내의 모든 정수 또는 분획 양을 포함하여 용량 당 적어도 1 × 10¹⁵개, 2 × 10¹⁵개, 3 × 10¹⁵개, 4 × 10¹⁵개, 5 × 10¹⁵개, 6 × 10¹⁵개, 7 × 10¹⁵개, 8 × 10¹⁵개 또는 9 × 10¹⁵개의 GC를 포함하도록 제형화된다.

일 구현예에서, 인간 적용을 위해, 용량은 범위 내의 모든 정수 또는 분획 양을 포함하여 체중 kg 당 약 1 × 10¹⁰개 내지 약 1 × 10¹⁵개 GC의 범위를 갖을 수 있다. 일 구현예에서, 벡터의 유효량은 범위 내의 모든 정수 또는 분획 양을 포함하여 체중 kg 당 약 1 × 10⁹개, 2 × 10⁹개, 3 × 10⁹개, 4 × 10⁹개, 5 × 10⁹개, 6 × 10⁹개, 7 × 10⁹개, 8 × 10⁹개 또는 9 × 10⁹개 GC이다. 일 구현예에서, 벡터의 유효량은 범위 내의 모든 정수 또는 분획 양을 포함하여 체중 kg 당 약 1 × 10¹⁰개, 2 × 10¹⁰개, 3 × 10¹⁰개, 4 × 10¹⁰개, 5 × 10¹⁰개, 6 × 10¹⁰개, 7 × 10¹⁰개, 8 × 10¹⁰개 또는 9 × 10¹⁰개 GC이다. 일 구현예에서, 벡터의 유효량은 범위 내의 모든 정수 또는 분획 양을 포함하여 체중 kg 당 약 1 × 10¹¹개, 2 × 10¹¹개, 3 × 10¹¹개, 4 × 10¹¹개, 5 × 10¹¹개, 6 × 10¹¹개, 7 × 10¹¹개, 8 × 10¹¹개 또는 9 × 10¹¹개 GC이다. 일 구현예에서, 벡터의 유효량은 범위 내의 모든 정수 또는 분획 양을 포함하여 체중 kg 당 약 1 × 10¹²개, 2 × 10¹²개, 3 × 10¹²개, 4 × 10¹²개, 5 × 10¹²개, 6 × 10¹²개, 7 × 10¹²개, 8 × 10¹²개 또는 9 × 10¹²개 GC이다. 일 구현예에서, 벡터의 유효량은 범위 내의 모든 정수 또는 분획 양을 포함하여 체중 kg 당 약 1 × 10¹³개, 2 × 10¹³개, 3 × 10¹³개, 4 × 10¹³개, 5 × 10¹³개, 6 × 10¹³개, 7 × 10¹³개, 8 × 10¹³개 또는 9 × 10¹³개 GC이다. 일 구현예에서, 벡터의 유효량은 범위 내의 모든 정수 또는 분획 양을 포함하여 체중 kg 당 약 1 × 10¹⁴개, 2 × 10¹⁴개, 3 × 10¹⁴개, 4 × 10¹⁴개, 5 × 10¹⁴개, 6 × 10¹⁴개, 7 × 10¹⁴개, 8 × 10¹⁴개 또는 9 × 10¹⁴개 GC이다. 일 구현예에서, 벡터의 유효량은 범위 내의 모든 정수 또는 분획 양을 포함하여 체중 kg 당 약 1 × 10¹⁵개, 2 × 10¹⁵개, 3 × 10¹⁵개, 4 × 10¹⁵개, 5 × 10¹⁵개, 6 × 10¹⁵개, 7 × 10¹⁵개, 8 × 10¹⁵개 또는 9 × 10¹⁵개 GC이다.

일 구현예에서, 인간 적용을 위해, 용량은 범위 내의 모든 정수 또는 분획 양을 포함하여 뇌 질량 그램 (g) 당 약 1 × 10¹⁰개 내지 약 1 × 10¹⁵개 GC의 범위를 갖을 수 있다. 일 구현예에서, 벡터의 유효량은 범위 내의 모든 정수 또는 분획 양을 포함하여 뇌 질량 그램 (g) 당 약 1 × 10⁹개, 2 × 10⁹개, 3 × 10⁹개, 4 × 10⁹개, 5 × 10⁹개, 6 × 10⁹개, 7 × 10⁹개, 8 × 10⁹개 또는 9 × 10⁹개 GC이다. 일 구현예에서, 벡터의 유효량은 범위 내의 모든 정수 또는 분획 양을 포함하여 뇌 질량 그램 (g) 당 약 1 × 10¹⁰개, 2 × 10¹⁰개, 3 × 10¹⁰개, 4 × 10¹⁰개, 5 × 10¹⁰개, 6 × 10¹⁰개, 7 × 10¹⁰개, 8 × 10¹⁰개 또는 9 × 10¹⁰개 GC이다. 일 구현예에서, 벡터의 유효량은 범위 내의 모든 정수 또는 분획 양을 포함하여 뇌 질량 그램 (g) 당 약 1 × 10¹¹개, 2 × 10¹¹개, 3 × 10¹¹개, 4 × 10¹¹개, 5 × 10¹¹개, 6 × 10¹¹개, 7 × 10¹¹개, 8 × 10¹¹개 또는 9 × 10¹¹개 GC이다. 일 구현예에서, 벡터의 유효량은 범위 내의 모든 정수 또는 분획 양을 포함하여 뇌 질량 그램 (g) 당 약 1 × 10¹²개, 2 × 10¹²개, 3 × 10¹²개, 4 × 10¹²개, 5 × 10¹²개, 6 × 10¹²개, 7 × 10¹²개, 8 × 10¹²개 또는 9 × 10¹²개 GC이다. 일 구현예에서, 벡터의 유효량은 범위 내의 모든 정수 또는 분획 양을 포함하여 뇌 질량 그램 (g) 당 약 1 × 10¹³개, 2 × 10¹³개, 3 × 10¹³개, 4 × 10¹³개, 5 × 10¹³개, 6 × 10¹³개, 7 × 10¹³개, 8 × 10¹³개 또는 9 × 10¹³개 GC이다. 일 구현예에서, 벡터의 유효량은 범위 내의 모든 정수 또는 분획 양을 포함하여 뇌 질량 그램 (g) 당 약 1 × 10¹⁴개, 2 × 10¹⁴개, 3 × 10¹⁴개, 4 × 10¹⁴개, 5 × 10¹⁴개, 6 × 10¹⁴개, 7 × 10¹⁴개, 8 × 10¹⁴개 또는 9 × 10¹⁴개 GC이다. 일 구현예에서, 벡터의 유효량은 범위 내의 모든 정수 또는 분획 양을 포함하여 뇌 질량 그램 (g) 당 약 1 × 10¹⁵개, 2 × 10¹⁵개, 3 × 10¹⁵개, 4 × 10¹⁵개, 5 × 10¹⁵개, 6 × 10¹⁵개, 7 × 10¹⁵개, 8 × 10¹⁵개 또는 9 × 10¹⁵개 GC이다.

이러한 상기 용량은 치료될 영역의 크기, 사용된 바이러스 역가, 투여 경로 및 방법의 원하는 효과에 의존하여, 범위 내의 모든 숫자를 포함하는 약 25 μL 내지 약 1,000 μL 이상의 부피 범위를 갖는, 다양한 부피의 담체, 부형제 또는 완충액 제형물로 투여될 수 있다. 일 구현예에서, 담체, 부형제 또는 완충액의 부피는 적어도 약 25 μL이다. 또 다른 구현예에서, 부피는 약 50 μL이다. 또 다른 구현예에서, 부피는 약 75 μL이다. 또 다른 구현예에서, 부피는 약 100 μL이다. 또 다른 구현예에서, 부피는 약 125 μL이다. 또 다른 구현예에서, 부피는 약 150 μL이다. 또 다른 구현예에서, 부피는 약 175 μL이다. 또 다른 구현예에서, 부피는 약 200 μL이다. 또 다른 구현예에서, 부피는 약 225 μL이다. 또 다른 구현예에서, 부피는 약 250 μL이다. 또 다른 구현예에서, 부피는 약 275 μL이다. 또 다른 구현예에서, 부피는 약 300 μL이다. 또 다른 구현예에서, 부피는 약 325 μL이다. 또 다른 구현예에서, 부피는 약 350 μL이다. 또 다른 구현예에서, 부피는 약 375 μL이다. 또 다른 구현예에서, 부피는 약 400 μL이다. 또 다른 구현예에서, 부피는 약 450 μL이다. 또 다른 구현예에서, 부피는 약 500 μL이다. 또 다른 구현예에서, 부피는 약 550 μL이다. 또 다른 구현예에서, 부피는 약 600 μL이다. 또 다른 구현예에서, 부피는 약 650 μL이다. 또 다른 구현예에서, 부피는 약 700 μL이다. 또 다른 구현예에서, 부피는 약 700 μL 내지 약 1,000 μL이다.

특정 구현예에서, 용량은 약 1 × 10⁹개 GC/g 뇌 질량 내지 약 1 × 10¹²개 GC/g 뇌 질량의 범위를 갖을 수 있다. 특정 구현예에서, 용량은 약 1 × 10¹⁰개 GC/g 뇌 질량 내지 약 3 × 10¹¹개 GC/g 뇌 질량의 범위를 갖을 수 있다. 특정 구현예에서, 용량은 약 1 × 10¹⁰개 GC/g 뇌 질량 내지 약 2.5 × 10¹¹개 GC/g 뇌 질량의 범위를 갖을 수 있다. 특정 구현예에서, 용량은 약 5 × 10¹⁰개 GC/g 뇌 질량일 수 있다.

일 구현예에서, 바이러스 구조물은 적어도 약 1 × 10⁹개 GC 내지 약 1 × 10¹⁵개 GC, 또는 약 1 × 10¹¹개 GC 내지 약 5 × 10¹³개 GC의 용량으로 전달될 수 있다. 이러한 용량 및 농도의 전달에 적합한 부피는 당업자에 의해 결정될 수 있다. 예를 들면, 약 1 μL 내지 150 mL의 부피가 선택될 수 있고, 성인의 경우 더 많은 부피가 선택된다. 전형적으로, 신생아의 경우 적합한 부피가 약 0.5 mL 내지 약 10 mL이고, 영아의 경우 약 0.5 mL 내지 약 15 mL이 선택될 수 있다. 유아의 경우 약 0.5 mL 내지 약 20 mL의 부피가 선택될 수 있다. 아동의 경우, 최대 약 30 mL의 부피가 선택될 수 있다. 십대 전후의 경우, 최대 약 50 mL의 부피가 선택될 수 있다. 또 다른 구현예에서, 환자는 선택된 약 5 mL 내지 약 15 mL, 또는 약 7.5 mL 내지 약 10 mL의 부피로 경막내 투여를 받을 수 있다. 다른 적합한 부피 및 용량이 결정될 수 있다. 용량은 임의의 부작용에 대응한 치료적 이익을 균형 잡도록 조절되고, 이러한 용량은 재조합 벡터가 채용되는 치료적 적용에 따라 달라질 수 있다.

상기 기술된 재조합 벡터는 공개된 방법에 따라 숙주 세포에게 전달될 수 있다. 바람직하게 생리학적으로 적격한 담체에 현탁된 rAAV는 인간 또는 비-인간 포유동물 환자에게 투여될 수 있다. 특정 구현예에서, 인간 환자에게 투여를 위해 rAAV는 식염수, 계면활성제 및 생리학적으로 적격한 염 또는 염 혼합물을 포함하는 수성 용액에 적합하게 현탁된다. 적합하게, 제형물은 생리학적으로 적격한 pH로, 예로 pH 6 내지 9, pH 6.5 내지 7.5, pH 7.0 내지 7.7 또는 pH 7.2 내지 7.8의 범위에서 조절된다. 뇌척수액의 pH가 약 7.28 내지 약 7.32이기 때문에, 경막내 전달을 위해 이러한 범위 이내의 pH가 바람직할 수 있는 한편, 정맥내 전달을 위해 pH 약 6.8 내지 약 7.2가 바람직할 수 있다. 그러나, 가장 넓은 범위 및 이들의 하위범위 이내의 다른 pH도 다른 전달 경로를 위해 선택될 수 있다.

본원에 사용된 용어 "경막내 전달" 또는 "경막내 투여"는 척수액 (CSF)에 도달하도록 척수관 내로, 보다 구체적으로 지주막하 공간 내로의 주사를 통한 약물의 투여 경로를 말한다. 경막내 전달은 요추 천자, 뇌실내 (뇌실내 (ICV)를 포함함), 후두하/수조내, 및/또는 C1-2 천자를 포함할 수 있다. 예를 들면, 물질은 요추 천자에 의한 지주막하 공간을 통과하는 확산을 위해 도입될 수 있다. 또 다른 예에서, 주사는 대수조 내로 시행될 수 있다. 특정 구현예에서, 본원에 기술된 rAAV 벡터 또는 조성물은 경막내 투여를 통해 이를 필요로 하는 대상체에게 투여된다. 특정 구현예에서, 경막내 투여는 2019년 11월 29일에 공개된 미국 특허 공개 제 US 2018-0339065 A1호에 기술된 바와 같이 수행되고, 본원에 이의 전문이 참고문헌으로 통합된다.

본원에 사용된 용어 "수조내 전달" 또는 "수조내 투여"는 소뇌수질 대수조의 뇌척수액 내로 직접적으로, 보다 구체적으로 후두하 천자를 통한, 대수조 내로 직접적 주사에 의한, 또는 영구적으로 위치시킨 튜브를 통한 약물의 투여를 말한다.

특정 구현예에서, 본원에 기술된 조성물의 치료는 동물 및/또는 인간 환자에서 DRG 감각 뉴런의 최소 내지 약한 무증상적 퇴화, 감각 신경 독성의 관점에서 양호한 내성화 및 무증상 감각 뉴런 병변을 보인다.

Ⅶ. 뇌척수액 내로 약제학적 조성물의 전달을 위한 장치 및 방법

일 양태에서, 본원에 제공된 벡터는 본 섹션에서 제공되고, 본원에 참고문헌으로 통합되는 국제특허출원 제 WO 2018/160582호에 기술된 방법 및 장치를 통해 경막내로 투여될 수 있다. 대안적으로, 다른 장치 및 방법이 선택될 수 있다. 특정 구현예에서, 방법은 환자의 대수조 내로 척수 바늘을 통한 CT 가이드 후두하 주사의 단계를 포함한다. 본원에 사용된 용어 컴퓨터 단층촬영 (CT)은 신체 구조의 삼차원적 영상이 컴퓨터에 의해 축을 따라 만들어진 일련의 평면 단층 영상으로부터 작성되는 방사선 촬영술이다. 특정 구현예에서, 장치는 본원에 이의 전문이 참고문헌으로 통합되는 2019년 11월 29일에 공개된 미국 특허 공개 제 US 2018-0339065 A1호에 기술된다.

Ⅷ. CDD

본원에 상호교환적으로 사용된 "환자" 또는 "대상체"는 인간, 수의학 관련 동물 또는 가축, 애완동물 또는 펫, 및 임상 연구에 정상적으로 사용되는 동물을 포함하는, 수컷 또는 암컷 포유동물을 의미한다. 일 구현예에서, 본 발명의 방법 및 조성물의 대상체는 여성 또는 남성 인간이다. 특정 구현예에서, 본 방법 및 조성물의 대상체는 CDD로 및/또는 CDD의 증상으로 진단된다.

방법 및 조성물은 임의의 CDD 병기의 치료에 사용될 수 있다. 특정 구현예에서, 환자는 연령이 약 1개월, 2개월, 3개월, 4개월, 5개월, 6개월, 7개월, 8개월, 9개월, 10개월, 11개월이거나, 약 1세, 1.5세, 2세, 2.5세, 1.5세, 2세, 2.5세, 3세, 3.5세, 4세, 4.5세, 5세, 5.5세, 6세, 6.5세, 7세, 7.5세, 8세, 8.5세, 9세, 9.5세, 10세, 10.5세, 11세, 12세, 13세, 14세, 15세, 16세, 17세, 18세이다. 특정 구현예에서, 환자는 예로 18개월 내지 3세 연령의 유아이다. 특정 구현예에서, 환자는 3세 내지 6세의 연령, 3세 내지 12세의 연령, 3세 내지 18세의 연령, 3세 내지 30세의 연령이다. 특정 구현예에서, 환자는 18세 이상의 연령이다.

CDD의 증상은 보통 처음으로 생애 3개월 이내에 시작되는 발작을 포함하고, 생후 첫 주 정도에 조기 출현할 수 있다. 발작의 유형은 연령과 함께 변화되고, 예측가능한 양상을 따를 수 있다. 가장 보편적인 유형은 의식 상실, 근육 경직 및 경련이 관여하는 일반화된 긴장성 대발작; 비정상적 근육 수축을 특징으로 하는 긴장성 발작; 및 근육 반사의 짧은 에피소드가 관여하는 간질성 연축이다. CDKL5 결핍 장애에 걸린 대부분의 사람에서 발작이 없는 기간이 있을 수 있지만, 발작은 매일 발생한다. CDKL5 결핍 장애에서 발작은 전형적으로 치료에 대한 저항성을 갖는다.

CDKL5 결핍 장애에 걸린 아동은 발달 과정이 손상된다. 대부분은 중증 지능 장애를 갖고 거의 또는 전혀 말하지 못한다. 앉기, 서기 및 걷기와 같은 육안적 운동 기능의 발달이 지연되거나 달성되지 못한다. 침범받은 개인 중 약 삼분의 일은 독립적으로 걸을 수 있다. 손가락으로 작은 물체를 뽑는 것과 같은 세밀한 운동 기능도 손상되어, 침범받은 개인 중 약 절반은 손의 고의적인 사용이 가능하다. 이러한 병태를 갖는 대부분의 사람은 시력 문제 (피질 시력 손상)를 갖는다.

기타 CDKL5 결핍 장애의 공통적인 특징은 박수치기, 손 핥기 및 손 빨기와 같은 반복적인 손 운동 (자동반복); 이 갈기 (이갈기증); 수면 교란; 섭식 곤란; 및 변비 및 산성 위 내용물의 식도로 역류 (위식도성 재유동)를 포함한 위창자 문제를 포함한다. 일부 침범받은 개인은 불규칙한 호흡의 에피소드를 갖는다. CDKL5 결핍 장애에 걸린 사람에서 구분되는 얼굴 특징은 높고 넓은 이미, 크고 깊이 박힌 눈, 코와 윗입술 사이의 매우 뚜렷한 공간 (인중), 두터운 입술, 넓게 벌어진 이빨, 및 높은 입 천장 (입천장)을 포함한다. 특별히 작은 머리 크기 (소두), 척추의 측만 (척추측만증), 및 첨형 손가락과 같은 다른 신체적 차이도 발생할 수 있다.

상기 기술된 용어 "증가시키다", "감소시키다", "감소시키다", "완화시키다", "개선하다", "지연시키다" 또는 임의의 이들의 문법적 활용형, 또는 임의의 유사한 용어 표기는, 달리 명시되지 않은 경우라면 상응하는 기준 (예로, 미처리된 대조군 또는 CDD에 걸리지 않은 정상 병태의 대상체)과 비교하여 약 5배, 약 2배, 약 1배, 약 90%, 약 80%, 약 70%, 약 60%, 약 50%, 약 40%, 약 30%, 약 20%, 약 10%, 약 5%의 변동을 의미한다.

특정 구현예에서, 환자는 발작, 근육 경직, 또는 호흡, 수면, 위창자관 또는 심장의 문제와 같은 CDD와 관련된 일부 징후 및 증상을 조절하는 의약을 투여 받는다.

특정 구현예에서, 이뇨제가 보조-요법으로 이를 필요로 하는 대상체에서 사용될 수 있다. 사용된 이뇨제는 아세트아졸아민 (디아목스) 또는 기타 적합한 이뇨제일 수 있다. 일부 구현예에서, 이뇨제는 유전자 요법 투여 시 투여된다. 일부 구현예에서, 이뇨제는 유전자 요법 투여 이전에 투여된다. 일부 구현예에서, 주사 부피가 3 mL인 이뇨제가 투여된다.

특정 구현예에서, CDKL5 이소형 1, 이소형 1, 이소형 3 및/또는 이소형 4 발현하는 벡터, 또는 이들의 다양한 2개 또는 3개 방식 조합을 포함하는 보조-요법이 사용될 수 있다. 선택적으로, 보조-요법은 또 다른 활성 제제의 투여를 추가로 포함할 수 있다. 특정 구현예에서, 보조-요법은 효소 대체 요법을 포함할 수 있다.

선택적으로, 면역억압 보조-요법이 이를 필요로 하는 대상체에서 사용될 수 있다. 이러한 보조-요법을 위한 면역억제제는 글루코코르티코이드, 스테로이드, 항-대사물, T 세포 저해제, 마크롤리드 (예로, 라파마이신 또는 라파로그), 및 알킬화제, 항-대사물, 세포독성 항생제, 항체 또는 이뮤노필린 상의 활성 제제를 포함하는 세포증식 억제제를 포함하나 이에 한정되지 않는다. 면역억제제는 질소 머스타드, 니트로소우레아, 백금 화합물, 메토크렉세이트, 아자티오프린, 머캅토퓨린, 플루오로우라실, 닥티노마이신, 안트라사이클린, 미토마이신 C, 블레오마이신, 미트라마이신, IL-2 수용체- (CD25-) 또는 CD3-안내된 항체, 항-IL-2 항체, 시클로스포린, 타크롤리무스, 시롤리무스, IFN-β, IFN-γ, 아편, 또는 TNF-α (종양 괴사인자-알파) 결합제를 포함할 수 있다. 특정 구현예에서, 면역억압 요법은 유전자 요법의 투여 0일, 1일, 2일, 3일, 4일, 5일, 6일 또는 7일 이상 이전 또는 이후에 시작될 수 있다. 이러한 면역억압 요법은 하나 또는 둘 이상의 약물 (예로, 글루코코르티코이드, 프레드넬리손, 미코페놀레이트 모페틸 (MMF) 및/또는 시롤리무스 (즉, 라파마이신))의 투여가 관여할 수 있다. 이러한 면역억압성 약물은 이를 필요로 하는 대상체에게 동일한 용량 또는 조정된 용량으로 1회 또는 2회 이상투여될 수 있다. 이러한 요법은 동일한 날에 둘 이상의 약물 (예로, 프레드넬리손, 미코페놀레이트 모페틸 (MMF) 및/또는 시롤리무스 (즉, 라파마이신))의 공동-투여가 관여할 수 있다. 하나 이상의 이들 약물은 유전자 요법 이후에 동일한 용량 또는 조정된 용량으로 계속 투여될 수 있다. 이러한 요법은 필요한 경우 약 1주 (7일) 또는 약 60일 이상 계속될 수 있다. 특정 구현예에서, 타크롤리무스가 없는 섭생이 선택된다.

단어 "포함하다", "포함하다 (comprises)" 및 "포함하는"은 배타적이지 않은 함축적으로 해석되어야 한다. 단어 "구성되는" 및 이의 활용형은 함축적이 지 않은 배타적으로 해석되어야 한다. 본 명세서의 다양한 구현예가 다른 상황 하에 "포함하는" 언어를 사용하여 제사되는 반면, 관련 구현예는 또한 "구성되는" 또는 "필수적으로 구성되는" 언어를 사용하여 해석되고 설명되도록 의도된다.

용어 "발현"은 본원에서 가장 광범위한 의미로 사용되고, RNA의 또는 RNA 및 단백질의 생산을 포함한다. 구체적으로 RNA와 관련하여, 용어 "발현" 또는 "번역"은 펩티드 또는 단백질의 생산에 관한 것이다. 발현은 일시적일 수 있거나, 안정할 수 있다.

용어 "a" 또는 "an"은 하나 이상을 말하는 것으로 언급되어야 하고, 예를 들면 "하나의 인핸서"는 하나 이상의 인핸서(들)를 나타내는 것으로 이해된다. 이와 같이, 용어 "a" (또는 "an"), "하나 이상" 및 "적어도 하나"는 본원에서 상호교환적으로 사용된다,

본 명세서 전체에 걸쳐, 지수는 용어 "e"와 이어진 수치 값 (n)을 사용하여 언급된다. 이것은 "× 10ⁿ"을 언급하는 것으로 이해될 것이다. 예를 들면, "3e9"는 3 × 10⁹과 동일하고, "1e13"은 1 × 10¹³과 동일하다.

상기 기술된 용어 "약"은 수치 값을 변형하는데 사용될 때, 달리 명시되지 않는 경우라면 ± 10%의 변동을 의미한다.

본 명세서에서 달리 정의되지 않은 경우라면, 본원에 사용된 기술 및 과학 용어는 당업자에게 본 출원에 사용된 많은 용어에 대한 일반적인 내용을 제공하는 출간된 교과서를 참조하여 당업자라면 공통적으로 이해하는 바와 동일한 의미를 갖는다.

Ⅸ. 실시예

하기 실시예는 단지 예시적이고, 본 발명을 제한하도록 의도되지 않는다.

CDD에 대한 여러 모델이 개발되었으며, 치료 효과를 평가하는데 사용되도록 선택될 수 있다. 이러한 하기 모델은 CDKL5 발현이 없다: 예로, 엑손 6번의 결실 (△엑손 6)을 갖는 Cdkl5-ko 마우스 (Wang et al., Proceedings of the National Academy of Sciences Dec 2012, 109 (52): 21516-21521; DOI: 10.1073/pnas.1216988110); 엑손 4번의 결실 (△엑손 4)을 갖는 Cdkl5-ko 마우스 (Amendola et al., (2014) Mapping Pathological Phenotypes in a Mouse Model of CDKL5 Disorder, PLoS ONE 9(5); e91613. doi.org/10.1371/journal.pone.0091613 (2014) 참조); Cdkl5 (R59X 녹인) 모델 (잭슨 연구소로부터 입수가능함; Tang et al., (2019); Tang S, et al., Altered NMDAR signaling underlies autistic-like features in mouse models of CDKL5 deficiency disorder. Nat. Commun. 2019, 10(1): 2655. 2019년 6월 14일 공개; doi:10.1038/s41467-019-10689-w); 및 Cdkl5 (D471fs) 모델 (Rodney Samaco, 베일러 의과대학, 휴스턴, TX).

본 연구에서 본 발명자들은 3가지 CDD 마우스 모델 (Cdkl5-ko (엑손 6번), Cdkl5 (R59X). Cdkl5 (D471fs))의 CNS에서 CDKL5 발현을 회복시키는 것이 질환 증상을 유의하게 개선하는 것을 보여준다. 본 발명자들은 AAVhu68 캡시드, 및 인간 시냅신 프로모터 및 조작된 인간 CDKL5 트랜스 유전자를 갖는 발현 카세트를 포함하는 AAV 유전자 요법 벡터를 개발하였다. 본 발명자들은 AAV-CDKL5 벡터가 측면 뇌 측실 내로 Cdkl5 녹아웃 마우스 내로 신생 마우스 주사를 통해 투여될 때, 뇌 전체에 걸쳐 최대 50%의 뉴런에서 명백한 발현을 검출하였다. AAV 및 인간 CDKL5 발현은 잘 내성화되었다. 인간 CDKL5은 세포질에 대부분 국소화되고, 단백질 발현 및 키나제 활성을 4개월 동안 지속하였다. 본 발명자들은 처리된 Cdkl5-ko 마우스의 코호트에게 종합 신경행동 테스트를 시행하고, 미처리된 Cdkl5-ko 표현형으로부터 야생형 마우스의 관찰된 행동 성과로 진행하는 유의한 개선을 확인하였다. 다음으로 우리는 유전자 녹아웃 대신에 환자 유래 프레임이동 돌연변이를 보유하는 2가지 상이한 CDD 마우스 모델 (Cdkl5 (R59X) 및 CDKL5 (D471fs) 모델)에서 동일한 연구를 반복하였다. 본 발명자들은 매우 유사한 결과를 획득하여, 우리의 CDKL5 유전자 요법 벡터의 치유 효과를 재연하였다.

CDKL5는 인간 뇌에서 적어도 4가지 이소형으로서 발현된다. 본 발명자들은 형질도입된 마우스 뇌에서 모두 발현되고 키나제 활성을 나타내는 것으로 확인된 3가지의 대안적으로 스플라이싱된 이소형에 대해 유사한 AAV 유전자 요법 벡터를 생성하였다.

더 큰 동물에서 AAV-CDKL5 유전자 요법 벡터의 발현에 대해 테스트하기 위하여, 본 발명자들은 레서스 머커크를 사용한 연구를 시행하였다. 대수조에 의한 뇌척수액 내로의 주입을 통하여, 우리는 뇌 전체에 걸쳐 이배체 게놈 당 0.1개 내지 1개의 벡터 사본의 벡터 분포를 달성할 수 있었다. 훨씬 더 많은 벡터 형질을입이 등쪽 뿌리 신경절 (DRG)에서 관찰하였다. 따라서, 인간 CDKL5 서열에 특이적인 프로브를 사용한 제자리 혼성화는 DRG 뉴런에서 풍부한 발현이지만, 회색 피질 뉴런에서는 훨씬 희박한 발현을 보여주었다. CDKL5 투여 및 발현은 일반적으로 6마리 레서스 머커크 모두에서 60일 동안 잘 내성화되지만, 우리는 척수 백질관의 경미한 축삭병을 주목하였다.

요약하면, 본 발명자들은 CDKL5 유전자 요법이 마우스 모델에게 지속적인 치유 효과를 제공하고, 비-인간 영장류에서 잘 내성화되는 것의 유망한 증거를 보여주고 있다. 또한, 이러한 접근법의 최적화는 궁극적으로 CCD에 걸린 아동에서 임상적 개입을 위한 옵션을 제시할 수 있다.

실시예 1. 재료 및 방법

플라스미드. 인간 뇌¹에서 발현되는 4가지 CDKL5 (사이클린 의존성 키나제 유사 5, 유니프로트 ID O76039)의 아미노산 서열을 DNA 서열로 역으로 번역하였다. 코딩 서열은, 예로 인간 게놈에서 발견되는 코돈 빈도, 숨은 RNA 스플라이싱 부위 및 대안의 해독틀을 고려하여 추가로 조작하였다. 조작된 서열은 인간 시냅신 프로모터²의 조절 하에 AAV 발현 플라스미드 내로 클로닝하였다. 코딩 서열은 코작 서열이 선행하고, WPRE 인핸서 카세트 (마못류 간염 바이러스 전사후 조절 요소), SV40 폴리 A 서열로 이어지며, AAV 역전된 말단 반복서열 (ITR)에 의한 프레임을 갖는다. 일부 실험에서는 등쪽 뿌리 신경절 (DRG)에서 발현을 억제하기 위하여, 상기 플라스미드를 CDKL5 코딩 서열 직후 및 WPRE 서열 이전에 miR-183 결합 부위 (agtgaattctaccagtgccata) (서열번호 11)의 4개 반복서열을 포함하도록 변형하였다. AAV CDKL5 벡터는 펜실베니아 대학교 벡터 코아에서, 캡시드로서 마우스 연구의 경우 PHP.B³, 또는 마우스 및 비-인간 영장류 연구의 경우 AAV9hu68⁴ 또는 AAVrh91를 사용하여 생산하였다.

마우스 연구. 마우스가 관여된 모든 연구는 펜실베니아 대학교 IACUC에 의해 승인을 받았다. 본 발명자들은 잭슨 연구소로부터 Cdkl5-ko 마우스 (B6.129(FVB)-Cdkl5tm1.1Joez/J, 균주 #021967)로부터 획득하여 이종접합 암컷 KO 마우스를 야생형 C57Bl6 수컷과 교배하여 하기 유전형의 한배 새끼 마우스를 획득하였다: 수컷 반접합 Cdkl5-ko (KO 마우스 또는 마우스로도 언급됨), 수컷 야생형, 암컷 이종접합 Cdkl5-ko 및 암컷 야생형. 마우스에게 AAV Cdkl5 벡터 (1 × 10¹¹개 GC 내지 5 × 10¹¹개 GC의 용량 범위) 또는 비히클 대조군 (멸균 포스페이트 완충된 식염수)을 총 100 μL의 부피의 안구후방 주사로 18일 내지 21일 동안 투여하였다. 대안적으로, 마우스에게 출생 일에 뇌실내로 총 2 μL의 부피의 1 × 10¹⁰개 GC 내지 5 × 10¹⁰개 GC의 용량을 주사하였다. 마우스를 유전형 및 주사 산물을 고려하여 혼합하여 사육하고, 체중을 측정하면서 적어도 매주 2회 관찰하고, 행동 테스트를 시행할 때 수컷의 경우 11주령 또는 암컷의 경우 14주령이 되었다.

웨스턴 블럿팅 및 조직 염색. 마취 이후에, 하나의 피질 반구를 급냉동시키고, 우속으로 단백질 용출물을 RIPA 완충액을 사용하여 생성하였다. 웨스턴 블럿팅은 인간 Cdkl5 (S957D, 던디 대학교, UK), EB2 (ab45767, 앱캠사) 또는 EB2 포스포22 (pab01032-P, 코바랩사, UK)에 대한 항체를 사용하여 수행하였다. 나머지 뇌 절반은 포르말린에 밤샘 고정시켜 파라핀에 포매하고, 얇은 절편을 동일한 CDKL5 항체를 사용한 면역형광 염색을 위해 처리하였다.

행동 테스트. 마우스는 매일 한 가지 테스트를 거쳤다. 해당일의 테스트 시점에, 작업자 및 환경을 동일하게 유지하였다 (60 dB 백색 소음 배경 및 1,000 루멘 간접 백열등 조명). 마우스를 각 테스트 이전에 홈 사육상자에 30분 동안 거주시켰다. 개방 장소 검정법을 위해, 최소량의 베딩이 있는 새로운 사육상자를 적외선 빔 어레이 (메드어소시에이트사) 내에 배치하였다. 단일 마우스를 사육상자의 중앙에 추가하고, 이후 30분 동안 빔 파손의 수를 자동적으로 기록하여 바닥에 근접 (일반 활동) 및 바닥 위의 3인치 (양육 활동) 빔 파손으로 구분하였다. 상승된 제로 미로 (EZM, 스토엘팅사)를 위해, 2개 대향 밀폐 사분역 및 2개 개방 사분역을 갖는 상승된 원형 플랫폼을 사용하여 방해받지 않은 탐색을 허용하였다. 단일 마우스를 개방 사분역의 중앙에 배치하고, 운동을 비디오로 15분 동안 기록하였다. Y-미로 (스토엘팅사) 연구를 위해, Y 모양의 일치하는 3가지 위치를 포함하는 밀폐된 플랫폼을 사용하였다. 단일 마우스를 작업자로부터 가장 근접한 자리에 배치하고, 이의 운동을 비디오로 5분 동안 기록하였다. 대리석 매장 검정법을 위해, 신선한 사육상자를 3인치의 알파드리 베딩 (쉐퍼드 특수 종이)으로 충전하고, 가만히 밀착하였다. 12개의 고형 청색 대리석을 베딩 위에 동등하게 이격시키고, 단일 마우스를 사육상자의 중앙에 배치하였다. 적어도 절반이 베딩으로 덮힌 대리석의 수를 30분 동안 기록하였다.

데이터 분석. 데이터를 그래프로 작성하고, 그래프패드 프리즘 소프트웨어를 사용하여 분석하였다. 비디오 파일을 20 fps의 mp4 포맷으로 기록하고, 에토비전 XT 소프트웨어 (버전 14, 놀두스 인포메이션 테크놀로지사)를 사용하여 분석하였다. 네스트 건축 검정법을 위해, 마우스를 새로운 사육상자에 밤샘 단일 사육하고, 표준화된 2 × 2 인치 사각 둥지 (면을 기초로 함)를 공급하였다. 24시간 후에, 둥지의 품질을 1 내지 5의 척도로 점수 매기고, 임의의 남은 건들지 않은 둥지 재료를 무게 측정하였다.

비-인간 영장류 실험. 비-인간 영장류가 관여된 모든 연구는 펜실베니아 대학교 IACUC에 의해 승인을 받았으며, USDA 규정에 따라 수행하였다. 마카카 물라타 (레서스 머커크) 종의 비-인간 영장류 (NHP)를 코반스 리서치 물산으로부터 획득하였다. 검역 및 동물 사육을 유전자 요법 프로그램 SOP에 따라 수행하였다. AAV 벡터 투여 1개월 이전에 및 연구 전체에 걸쳐, 체중, 온도, 호흡 속도 및 심장 박동을 정기적으로 모니터링하고, 혈액 및 CSF 시료를 채취하였다. 전혈을 세포 계수 및 감별, 및 임상 혈액 화학 패널에 사용하였다. CSF 시료는 혈액 계수 및 감별, 및 총 단백질 정량화에 사용하였다. 대수조의 천자를 통한 CSF 내로의 AAV 벡터 전달을 위해, 마취된 머카크를 머리는 앞을 보는 옆으로 누운 자세로 실험대 위에 배치하였다. 무균 기법을 사용하여, 21 내지 27 게이지, 1 내지 1.5 인치 퀸케 척수 바늘 (벡튼 디킨슨사)을 후두하 공간 내로 CSF 유출이 관찰될 때까지 진행시켰다. 바늘은 혈액 오염 및 잠재적인 뇌줄기 손상을 회피하도록 대수조의 더 넓은 바람직한 갭에서 시도될 것이다. 바늘 천자의 정확한 배치는 형광현미경을 사용한 골수조영술을 통해 검증될 것이다. 1 mL의 CSF를 투약 이전에 기저선 분석을 위해 수집하였다. CSF 수집 이후에, 접근 연장 카테터를 척수 바늘에 연결하여 1 mL 이오헥솔 (상표명: 옴니파크 180 mg/mL, 제너럴 엘렉트릭 헬스케어사) 조영 매질의 투약을 용이하게 하였다. 바늘 배치를 확인한 이후에, 테스트 항목을 포함하는 주사기 (1 mL 동등한 부피에 주사기 부피와 링커 무용 공간을 더함)를 유연한 링커에 연결하고, 30 ± 5초 동안 주사하였다. 바늘을 제거하고, 천자 부위에 직접적 압력을 적용하였다. AAVhu68.hSyn.Cdkl5-1co 및 AAVhu68.hSyn.Cdkl5-1co 벡터를 최대 3 × 10¹³개 GC/NHP 용량으로 주사하였다. 연구 0일, 14일, 18일, 41일째 및 최종 연구일에, 신경학적 기능의 자세한 평가를 위해 모든 머커크에게 신경학적 평가가 주어졌다. 간략하게, 평가는 자세 및 보행 평가, 두개 신경 평가, 고유감각 평가 및 척수/신경 반사를 포함하였다. 연구 56일째, 머카크를 마취시키고, 육안 사후 검사 및 부검을 수행하였다. 25개의 주요 조직을 급냉동 또는 포르말린 고정화를 위해 각 머카크로부터 두 벌씩 수확하였다. DNA 또는 RNA를 급냉동 조직으로부터 정제하고, 벡터 생체분포 또는 트랜스 유전자 분석에 각각 사용하였다. 벡터 생체분포 조사를 위해, 총 DNA 중량 당 게놈 사본 (GC)은 트랜스 유전자 카세트 및 내부 표준의 폴리 A 영역으로 안내되는 프로브를 사용한 TaqMan qPCR 검정법을 사용하여 결정하였다. 트랜스 유전자 발현을 정량하기 위하여, 총 RNA를 사용하여 폴리 A 올리고뉴클레오티드로의 제 1 가닥 합성, 이어서 내인성 레서스 CDKL5 서열과 교차반응하지 않는 트랜스 유전자에 특이적인 프로브를 사용한 TaqMan qPCR에 의해 cDNA를 생성하였다. 조직병리학적 분석을 위해, 머카크 조직을 파라핀에 포매시키고, 이들 절편을 H & E 용액 또는 CDKL5 항체로 각각 염색하였다. 모든 염색된 조작 절편은 위원회 인증을 받은 수의 병리학자에 의한 검토를 받고, 비정상적 결과는 동료 연구자의 검토에 의해 검증하였다.

참고문헌

1. Hector, R. D. et al., Characterization of CDKL5 Transcript Isoforms in Human and Mouse. PloS one 11, e0157758, (2016).

2. Thiel, G., Greengard, P. & Sudhof, T. C. Characterization of tissue-specific transcription by the human synapsin I gene promoter. Proc. Natl. Acad. Sci. U S A, 88: 3431-3435, (1991).

3. Deverman, B. E. et al., Cre-dependent selection yields AAV variants for widespread gene transfer to the adult brain. Nat. Biotechnol., 34: 204-209, (2016).

4. Hinderer, C. et al., Severe Toxicity in Nonhuman Primates and Piglets Following High-Dose Intravenous Administration of an Adeno-Associated Virus Vector Expressing Human SMN. Human Gene Therapy, 29: 285-298, (2018).

실시예 2: 유전자 요법 AAV 벡터

ITR 사이의 발현 구조물은 인간 시냅신 프로모터 (서열번호 23), 인간 CDKL5, 이소형 1 (서열번호 22)의 조작된 코딩 서열, WPRE 발현 인핸서 (서열번호 27) 및 SV40 폴리 A 서열 (서열번호 28)을 포함한다 (도 1a). 유사하게, 대안의 발현 구조물은 이소형 1 대신에 인간 CDKL5, 이소형 2 (CDKL5-2GS 또는 hCDKL5-2GS; 서열번호 24), 3 (CDKL5-3GS 또는 hCDKL5-3GS; 서열번호 25), 또는 4 (CDKL5-4GS 또는 hCDKL5-4GS; 서열번호 26)에 대한 조작된 코딩 서열을 각각 포함한다. 테스트된 플라스미드 모두가 마우스 뇌에서 잘 발현되었으며, EB2를 인산화하는 능력 (CDKL5 키나제 활성의 측정)에서 적은 차이를 나타낸다. 본 발명자들은 WPRE 인핸서가 마우스 뇌에서 야생형 마우스 Cdkl5 발현을 닮은 인간 CDKL5 발현 수준을 획득하는데 요구되는 것을 확인하였다 (도 2). CDKL5는 이의 내인성 표적 EB2 단백질을 인산화하는 이의 능력에 의해 결정된 바, 완전한 활성이 있었다 (도 2). CDKL5의 발현 및 국소화는 IHC에 의해 검증하였다. 또한, 본 발명자들은 인간 시냅신을 인간 유비퀴틴 C 프로모터 (Ubc)로 또는 닭 베타-액틴 혼성 프로모터로 교체함으로써 대안의 발현 구조물을 생성하였다 (도 1b). AAVrh91 캡시드에서 AAV 벡터 AAVrh91.UbC.CDKL5-1co.miR183 및 AAVrh91.CBh.CDKL5-1co.miR183은 Cdkl5-ko 마우스에게 3 × 10¹⁰개 GC의 용량으로 신생 마우스 ICV를 통해 투여하고, 부검을 P14일째 수행하였다. 마우스 뇌조직의 웨스턴 블럿 분석은 UbC 또는 CBh 프로모터를 포함하는 AAV 벡터 게놈으로의 형질도입에 이어진 CDKL5의 발현을 검증하였다. 본 발명자들은 AAVrh91.UbC.CDKL5-1co.miR183 및 AAVrh91.CBh.CDKL5-1co.miR183로의 형질도입에 이어진 마우스 뇌에서 CDKL5 트랜스 유전자의 발현을 관찰하였다. 세포 당 더 높은 CDKL5 발현을 AAVrh91.UbC.CDKL5-1co.miR183로의 형질도입 이후에 마우스 뇌의 해마에서 관찰하였다. 반면, 세포 당 더 낮은 CDKL5 발현을 AAVrh91.CBh.CDKL5-1co.miR183로의 형질도입 이후에 마우스 뇌의 해마에서 관찰하였다. 세포 당 더 높은 CDKL5 발현을 AAVrh91.UbC.CDKL5-1co.miR183로의 형질도입 이후에 마우스 뇌의 피질에서 관찰하였다. 세포 당 더 낮은 CDKL5 발현을 AAVrh91.CBh.CDKL5-1co.miR183로의 형질도입 이후에 마우스 뇌의 피질에서 관찰하였다. 또한, 본 발명자들은 Cdkl5-ko 마우스 뇌에서 AAVrh91.UbC.CDKL5-1co.miR183 (3 × 10¹⁰개 GC, 신생 마우스 ICV) 및 AAVhu68.hSyn.CDKL5-1co.miR183 (2.5 × 10¹⁰개 GC)의 투여에 이어지는 CDKL5 발현을 비교하였다. 매우 유사한 발현 양상을 특정된 AAV 투여에 이어서 마우스 뇌에서 관찰하였다. CDKL5 발현은 AAVrh91.UbC.CDKL5-1co.miR183 (AAVrh91 캡시드; 유비퀴틴 C 프로모터) 또는 AAVhu68.hSyn.CDKL5-1co.miR183 (AAVhu68 캡시드; 시냅신 프로모터) 둘 중 하나로의 형질도입 이후에 마우스 뇌에서 관찰하였다. 추가적으로, 1 × 10¹⁰개 GC, 3 × 10¹⁰개 GC 및 6 × 10¹⁰개 GC의 다양한 용량의 AAVrh91.UbC.CDKL5-1co.miR183 및 AAVrh91.CBh.CDKL5-1co.miR183는 행동 효과에 대해 Cdkl5-ko 마우스에서 조사하였다.

AAV.UbC.CDKL5-1co.miR183 벡터는 CDKL5 발현이 hSyn에 의해 유도될 때와 유사하게 마우스에서 치료적 유용성을 보여주었다. AAVrh91 캡시드는 조작된 핵산 서열을 포함하는 AAV 벡터와 함께 사용될 때 AAVhu68의 발현과 유사한 CDKL5 ㅂ바발현을 달성하였다. 마우스 뇌에서 CDKL5 단백질 수준은 hSyn 프로모터와 비교하여 UbC 프로모터를 사용하여 더 높았다.

실시예 3: CDD 마우스 모델에서 CDKL5 유전자 요법의 전임상 치료 이익

Cdkl5 결핍 마우스에 미치는 CDKL5 유전자 요법의 치료 이익을 테스트하기 위하여, 본 발명자들은 어린 Cdkl5-ko (KO 마우스 또는 마우스로도 언급됨) 및 야생형 (wt) 한배 새끼 마우스의 코호트를 5 × 10¹¹개 GC (5e11 gc)의 AAV9-PHP.B-hSyn-hCDKL5-1co.WPRE 벡터를 안구후방 Ⅳ 주사에 의해 처리하였다. 처리된 실험군 모두는 동일한 속도로 계속 성장하였으며, 처리 관련된 사망은 관찰되지 않았다. 10주령에서 마우스에게 종합 행동 테스트를 시행하였다. 본 발명자들은 상승된 제로 미로 및 개방 장소 활동 테스트에서 처리된 실험군에 대한 명백하고 통계적으로 유의한 정규화를 관찰하였다. 동일한 실험군의 회전막대 및 Y-미로 테스트에서 외연의 개선이 있었으며, 열 민감성의 개선은 없었다.

Cdkl5가 신경발달에 중요한 경우라면, 본 발명자들은 유전자 요법의 조기 투여가 마우스에서 치료 성과를 개선할 수 있을지 궁금하였다. 다음으로 우리는 신생 Cdkl5-ko 마우스 또는 야생형 한배 새끼의 코호트를 마우스 당 6 × 10⁹개 GC 내지 5 × 10¹⁰개 GC의 용량 범위의 AAVhu68-hSyn-hCDKL5-1co.WPRE 벡터를 안구후방 Ⅳ 주사에 의해 처리하였다. 행동 테스트는 지시된 바와 같이 10주령 또는 11주 내지 14주령에서 진술하였다. 모든 실험군에 걸친 종합적 관찰은 잘 내성화되고, 처리 관련된 사망이 없으며, 정상적인 체중 증가 (도 9a 및 도 9b) 및 종합적 발달을 관찰하였다. Cdkl5 마우스에서 CDKL5 트랜스 유전자의 용량 의존적 발현은 5 × 10¹⁰개 GC 용량, 2.5 × 10¹⁰개 GC 용량 및 1 × 10¹⁰개 GC 용량에서 관찰하였다. 10주령에서, KO 마우스는 특징적인 뒷다리 접기 표현형을 나타내고, 이는 처리된 KO 마우스에서 실질적으로 완화되었다. CDKL5 유전자 요법의 치료 효능은 뒷다리 접기 테스에 의해 측정하였다. 용량 의존적 개선은 처리된 CDKL5-ko 마우스에서 중증도 점수로 관찰하였다 (도 9c 내지 도 9f). 마찬가지로, KO 마우스에서 발견된 지속적인 과다활동 및 양육 표현형을 야생형 활동으로 정규화하였다. 해마의 학습 및 기억은 Y-미로 테스트 (자발적 변경 인덱스)에서의 처리된 KO 마우스에서높게 개선되었다. CDKL5 유전자 요법의 치료 효능은 개방 장소 활동 테스트에 의해 추가로 측정하고, 이는 KO 및 AAV 처리된 마우스에서 과다활동의 교정에 대해 측정한다. 처리된 Cdkl5-ko 마우스에서 과다활동의 용량 의존적 구분을 관찰하였다 (도 11a 내지 도 11f). KO 마우스는 신선한 사육상자에 밤샘 단일 사육될 때 빈약한 둥지 건축자이고, 모든 둥지 형성 재료를 절단하지 못한다. 처리된 KO 마우스는 용량 의존적 방식으로 이들의 둥지 건축 능력을 극적으로 개선하였다 (도 10a, 도 10c, 도 10e). 추가적인 2가지 다른 신경행동 검정법 (대리석 매장 및 Y-미로)은 처리된 Cdkl5-ko 마우스에서 표현형 개선에 대한 강한 경향성을 보여주었다 (도 10b 및 도 10d). EEG 표현형은 예비적 협력 연구에서 회복되었으며, 번역 바이오마커로서 유용할 수 있다. 핵심 검정법 (뒷다리 접기, 보행 활동)의 성과 입증은 독립적인 실험 코호트를 사용하여 추가적으로 수행하였다. 더 큰 코호트 크기 (N = 18/실험군)가 더 명백한 통계학적 유의성을 생성한다. 대안의 CDD 마우스 모델 (R59X, D471fs)을 사용한 핵심 검정법 (뒷다리 접기, 보행 활동)의 성과 입증도 수행한다. 요약하면, CDKL5 유전자 요법은 기능적 CDKL5 단백질을 마우스 뇌로 전달하고, CDD 수컷 마우스 모델에서 여러 신경행동 성과를 위한 용량 의존적 치료 효과를 갖는다.

행동 테스트를 마친 이후에, 마우스가 약 3개월령이 될 때 뇌를 수확하였다. 웨스턴 블럿팅은 AAV 투여 3개월 이후에도 Cdkl5-ko 뇌에서 인간 CDKL5의 명백한 발현을 나타내었다. 마지막으로, 인간 CDKL5는 인산화된 EB2 단백질에 대해 블럿팅할 때 명백한 키나제 활성을 나타내었다.

본 발명자들은 또한 대안의 CDD 마우스 모델을 사용한 CDKL5 유전자 요법의 성과를 조사하였다. Cdkl5 (D471fs)는 미성숙한 종결 코돈을 유도하는 환자 점 돌연변이를 보유한다. 환자에서와 같이, 이들 마우스의 뇌에서 CDKL5 단백질의 부재 및 매우 감소된 EB 인산화 수준을 발견하였다. 따라서, Cdkl5 (D471fs)는 Cdkl5-ko 단백질의 부재를 이전에 사용된 Cdkl5-ko 마우스와 공유하지만, 유전적 배경이 마우스 모델의 생성 방법으로 인해 약간 상이하다. 신생 마우스에게 이전과 동일한 농도 (5 × 10¹⁰개 GC, 신생 ICV)로 주사하고, 3개월 이후에 분명한 hCDKL5 단백질 발현 및 EB2 인산화가 나타났다. 소규모 예비 코호트를 사용한 행동 테스트를 시행하였다. AAV 처리는 잘 내성화되고, 이환이 관찰되지 않았다. 뒷다리 접기는 처리된 돌연변이체 마우스에서 유의하게 교정되고, 마찬가지로 상승된 제로 미로 테스트에서 돌연변이체 표현형도 처리된 돌연변이체 마우스에서 야생형 행동으로 유의하게 교정되었다 (개방 영역에서, 개방 영역 진입). 돌연변이체 마우스는 새로운 사육상자에서 유리 대리석 배열과의 빈약한 상호작용 및 매장 행동을 나타내는 반면, 야생형 마우스는 전형적으로 거의 모두를 매장시킨다. 처리된 돌연변이체 마우스는 야생형 마우스를 향한 이들 행동의 강력한 교정을 나타낸다. 처리된 실험군의 Cdkl5-ko 마우스에서 5 × 10¹⁰개 GC/마우스의 더 높은 용량으로 유의한 개선을 관찰하였다.

또한, 본 발명자들은 대안의 CDD 마우스 모델을 사용한 CDKL5 유전자 요법의 성과를 조사하였다. Cdkl5 (R59X)는 미성숙한 종결 코돈을 도입한 환자 점 돌연변이를 보유한다. 환자에서와 같이, 이들 마우스의 뇌에서 CDKL5 단백질의 부재 및 매우 감소된 EB 인산화 수준을 발견하였다. 따라서, Cdkl5 (R59X)는 Cdkl5-ko 단백질의 부재를 이전에 사용된 Cdkl5-ko 마우스와 공유하지만, 유전적 배경이 마우스 모델의 생성 방법으로 인해 약간 상이하다. 신생 마우스에게 이전과 동일한 농도 (5 × 10¹⁰개 GC, 신생 ICV)로 주사하고, 3개월 이후 명백한 hCDKL5 단백질 발현 및 EB2 인산화가 나타났다. 소규모 예비 코호트로 행동 테스트를 시행하였다. AAV 처리는 잘 내성화되고, 이환이 관찰되지 않았다. 뒷다리 접기는 처리된 돌연변이체 마우스에서 유의하게 교정되었다.

또한, 본 발명자들은 이종접합 암컷 Cdkl5-ko 마우스에서 대안의 CDD 마우스 모델을 사용한 CDKL5 유전자 요법의 성과를 조사하였다. 이러한 모델은 대부분 CDD 환자 (CDD 암컷)를 반영한다. 종합 평가는 이종접합 암컷 Cdkl5-ko 마우스 신경행동 표현형이 나중의 발병과 함께 훨씬 더 경미하여 치료 성과의 명확한 평가를 어렵게 하는 것을 확인하였다. 그러나, 고용량 (5 × 10¹⁰개 GC, 신생 ICV)에서 뒷다리 접기 및 보행 활동에 대한 대표적인 데이터는 유의한 개선을 나타낸다 (도 14b 및 도 14c).

추가적으로, 본 발명자들은 야생형 마우스에서 CDKL5 유전자 요법의 용량 증가를 조사하였다. 야생형 (C57Bl6/J) 마우스에게 신생 ICV를 통해 7.5 × 10¹⁰개 GC 및 1 × 10¹¹개 GC (즉, 이전에 사용된 최고 용량의 1.5배 또는 2배)를 주사하였다. 체중, 발달 및 생존에 미치는 외부적 효과가 관찰되지 않았다. 마우스는 정상으로 보이고, 뒷다리 접기 또는 활동 변화를 나타내지 않았다. CNS 조직의 병리학자 검토에서 관찰된 효과가 없었다 (도 19a 및 도 19b).

실시예 4: 인간 CDKL5 이소형 2 내지 4의 유용성

인간 및 마우스 뇌에는 적어도 4가지의 검출가능한 Cdkl5 mRNA 스플라이싱 변이체가 있는 것으로 밝혀졌지만, 이소형 2 내지 4가 안정한 단백질로서 존재하는지 확립되지 않고 있었다. 이소형 1은 뇌 CDKL5의 > 85%를 차지한다.

본 발명자들은 인간 CDKL4 이소형 1 내지 4의 코딩 서열을 코돈 조작하고, 이전과 동일한 AAV 벡터 내에 클로닝하였다. Cdkl5-ko 마우스에게 이소형 1 내지 4를 코딩하는 AAV9-PHP.B 벡터를 어른 꼬리 정맥으로 주사하고, 2주 후에 뇌를 웨스턴 블럿 분석을 위해 수확하였다. 본 발명자들은 모두 4가지 이소형이 명백하게 발현하고 예상된 젤 이동 양상을 나타내는 것을 확인하였다. 이소형 1의 발현량과 매우 닮은 이소형 2 내지 4의 발현을 수득하는 조작된 서열을 추적을 위해 선택하였다. 이소형 2에 의해 생성된 EB2 인산화 수준은 이소형 1과 비교하여 약간 더 높았으며, 이소형 3 또는 4에 의해 약간 더 낮았다.

대안의 3가지 CDKL5 이소형을 신생 Cdkl5-ko 마우스에게 주사하여 이소형 1의 이익과 비교하여 잠재적인 치료 이익을 테스트하였다. 도 12는 대안의 CDKL5 이소형 (2, 3 및 4)을 처리한 접기 표현형의 유의한 교정을 나타낸다. 도 8a 내지 도 8d는 발현 이소형 1, 이소형 2, 이소형 3 또는 이소형 4에 대한 AAV.CDKL5 벡터 구조물의 CDKL5 발현 수준 또는 활성을 나타낸다. 도 8a는 비히클을 주사한 야생형 마우스 및 비히클을 주사한 녹아웃 마우스와 비교하여, AAV 벡터를 주사한 (5 × 10¹⁰개 GC, 신생 ICV) 녹아웃 마우스에서 발현 수준을 나타낸다. 도 8b는 pS222EB2를 사용하여 결정된 바, 비히클 (PBS)을 주사한 야생형 마우스, 비히클 또는 AAV.CDKL5-1co를 주사한 녹아웃 마우스에서 CDKL5 활성을 나타낸다. 도 8c는 pS222EB2를 사용하여 결정된 바, 도 8a의 실험군에 대한 CDKL5 활성을 나타낸다. 도 8d는 도 8b의 실험군에 대한 CDKL5 발현 수준을 나타낸다.

요약하면, 모든 이소형은 단백질로서 발현되고, 비슷한 촉매 활성을 갖는다. CDD 마우스 모델에서 이소형 2, 3 또는 4로의 치료 성과는 차례로 테스트될 때 (5 × 10¹⁰개 GC, 신생 ICV), 이소형 1과 비슷하다. 종합하면, CDKL5 이소형 1로의 CDKL5 유전자 요법은 수컥 CDD 마우스 모델에서 유의한 치료 이익을 갖는 유망하고 안전한 접근법이다.

실시예 5: hCDKL5 유전자 요법의 독성 및 안전성 테스트를 위한 예비 NHP 연구

본 발명자들은 NHP 에서 AAVhu68 캡시드에 포장된 AAV-hSyn-CDKL5-1co.WPRE 구조물의 발현 양상 및 안전성 프로파일을 조사하길 원하였다. 벡터는 본원에 기술된 벡터 게놈 및 이전에 기술된 생산 방법을 사용하여 생성하였다. 예로, 본원에 참고문헌으로 통합되는 국제특허출원 제 WO 2018/160582호 참조. 6마리의 레서스 머커크의 실험군에게 대수조 (ICM)을 통해 주사하였다. 본 발명자들은 상이한 조건을 테스트하였다:

A. 1 mL 완충액 중 1 × 10¹⁴개 GC 용량이 주사됨

B. 3 또는 5 mL 완충액 중 1 × 10¹⁴개 GC 용량이 주사됨

C. 3 mL 완충액 중 3 × 10¹⁴개 GC 용량이 주사됨

D. CSF 생산을 감소시키는 이뇨제 아세트아졸아민 (디아목스^®)의 전처리 2일 이후에 1 mL 완충액 중 1 × 10¹⁴개 GC 용량이 주사됨.

간략하게, 비-인간 영장류 (NHP) 연구를 위해 hCDKL5 유전자 용법의 독성 및 안전성 테스트를 AAVhu68-hSyn-Cdkl5-1co-WPRE 벡터를 사용하여 수행하였다. 예비 연구에서, 3가지 용량 3 × 10¹²개 GC/동물, 1 × 10¹³개 GC/동물 및 3 × 10¹³개 GC/동물을 평가하였다. 예비 연구를 위해, 1 × 10¹⁴개 GC/동물의 용량을 선택하고, 2가지 상이한 부피 (3 mL 및 5 mL)로 대수조를 통해 뇌척수액 (CSF)으로 AAV 벡터의 전달을 평가하였다. 다른 연구 방면은 이뇨제 (예로, 디아목스 상표명의 아세트아졸아미드)와 함께 1 × 10¹⁴개 GC/동물, 또는 3 × 10¹⁴개 GC/동물 (대상체)을 사용하였다.

추가적으로, 본 발명자들은 2 × 10¹²개, 1 × 10¹³개 및 3 × 10¹³개 GC/동물 (대상체)의 용량을 테스트하였다. CDKL5 벡터로의 처리는 잘 내성화되고, 임상 혈액에서 변화의 징후는 관찰되지 않았다. 사육상자 측면의 신경학적 검사로부터의 관찰은 기저선으로부터 변화를 나타내지 않았다.

부검은 주사 이후 28일째 수행하고, 이어서 분자적 분석, 조직학 및 병리학 검토를 진행하였다. 전반적으로, CNS 외부의 주요 장기에서 주요한 형질도입 차이를 발견하지 못하였다 (예로, 간의 형질도입이 이미 최대에 도달할 것 같음). 척수 및 DRG에서 주요한 형질도입 차이를 관찰하지 못하지만 (매우 높은 형질도입율을 유지함), 주사 매개변수에 따라 뇌 조직의 유의한 변화는 명백하다. 형질도입의 최고의 증가는 피질에서 관찰하였다. 디아목스는 뇌를 통한 형질전환 효율의 약간의 증가를 유도한다.

도 17은 각 NHP의 비-뉴런성 조직, 척수관 조직 및 뇌 조직에서 벡터 생체분포를 나타낸다. 도 18에서, 단지 뇌의 벡터 생체분포 데이터를 나타낸다. 결과는 등쪽 뿌리 신경절 (DRG)의 강한 형질도입, 뇌 조직의 중간 내지 낮은 형질도입이 있음을 나타내고, 뉴런성 조직 내로의 일부 형질도입 누출을 제시한다. 병리학 결과는 등쪽 백질관에서 경미한 축삭병증을 나타내었다. hCDKL5 mRNA 수준의 약간의 차이도 관찰하였다. 3 mL의 주사 부피가 사용될 때 더 높은 mRNA 발현의 경향성이 있다. 또한, 본 발명자들은 제자리 혼성화 (ISH)에 의해 hCDKL5 mRNA 분포를 영상화하였다. 등쪽 뿌리 신경절 (DRG)은 6마리 NHP 모두에서 매우 강한 mRNA 발현을 나타내었다. 운동 피질에서는, 적은 수의 형질도입된 뉴런을 관찰하였다 (< 10%). 때로, 작은 군집의 형질도입된 뉴런을 발견하였다. 본 연구의 NHP에서 운동 피질의 hCDKL5 mRNA 양성 뉴런에서는 유의한 차이가 없었다.

병리학 검토는 조직 및 NHP에서 육안적 병변을 발견하지 못하였다. 최고 용량을 투여받은 NHP는 간에서 염증성 세포 침윤의 경미한 징후를 나타내었다. 추가적으로, 모든 NHP에서 경미한 내지 중간의 척수 축삭병증 및 DRG 위성증을 나타내었다.

추가적으로, 본 발명자들은 AAVrh91.UbC.CDKL5-1co.miR183 및 AAVrh91.CBh.CDKL5-1co.miR183 벡터의 NHP에서 벡터 발현 및 안정성 테스트를 조사한다. 벡터를 C. 머카크에게 ICM 경로를 통해 3 × 10¹⁰개 GC 용량으로 투여한다. 병리학 분석 및 신경검사를 수행하여 AAV 벡터 투여 이후에 CDKL5 발현의 효과를 평가한다.

결론적으로, 우리의 연구에서 조사한 AAV-CDKL5 벡터 (서열번호 1)은 뉴런에서 안정한 CDKL5 단백질 발현을 달성하는데 사용될 수 있다. AAV-CDKL5 유전자 요법은 CDD 마우스 모델의 표현형을 유의하게 개선할 수 있다. 추가적으로, AAV-CDKL5 벡터는 대수조를 통해 비-인간 영장류에게 효율적으로 전달되어 CNS 전체를 통해 발현될 수 있다.

참고문헌

1. Bahi-Buisson, N. et al., Key clinical features to identify girls with CDKL5 mutations. Brain, 131: 2647-2661, (2008).

2. Fehr, S. et al., The CDKL5 disorder is an independent clinical entity associated with early-onset encephalopathy. Eur. J. Hum. Genet., 21: 266-273, (2013).

3. Kalscheuer, V. M. et al., Disruption of the serine/threonine kinase 9 gene causes severe X-linked infantile spasms and mental retardation. American Journal of Human Genetics, 72: 1401-1411, (2003).

4. Tao, J. et al., Mutations in the X-linked cyclin-dependent kinase-like 5 (CDKL5/STK9) gene are associated with severe neurodevelopmental retardation. American journal of human genetics. 75: 1149-1154, (2004).

5. Weaving, L. S. et al., Mutations of CDKL5 cause a severe neurodevelopmental disorder with infantile spasms and mental retardation. American journal of human genetics, 75: 1079-1093, (2004).

6. Hector, R. D. et al., Characterization of CDKL5 Transcript Isoforms in Human and Mouse. PloS one 11: e0157758, (2016).

7. Baltussen, L. L., et al., (2018). "Chemical genetic identification of CDKL5 substrates reveals its role in neuronal microtubule dynamics." EMBO Journal, 37(24).

8. Munoz, I. M., et al., (2018). "Phosphoproteomic screening identifies physiological substrates of the CDKL5 kinase." EMBO Journal.

본 명세서에서 인용된 모든 문서는 2020년 4월 27일에 제출된 미국 가특허출원 제 63/016,036호, 2020년 10월 13일에 제출된 미국 가특허출원 제 63/091,032호 및 2020년 11월 4일에 제출된 미국 가특허출원 제 63/109,608호와 같이 본원에 참고문헌으로 통합된다. 본원과 함께 제출된, "20-9196PCT_SeqListing_ST25.txt"로 표기된 서열목록, 및 이의 서열 및 텍스트는 본원에 참고문헌으로 통합된다. 본 발명이 구체적인 구현예를 언급하여 기술되는 한편, 변형은 본 발명의 정신을 벗어나지 않고도 만들어질 수 있음이 이해될 것이다. 이러한 변형은 첨부된 청구항의 범주 내에 속하도록 의도된다.

SEQUENCE LISTING <110> THE TRUSTEES OF THE UNIVERSITY OF PENNSYLVANIA <120> Composition useful in treatment of CDKL5 deficiency disorder (CDD) <130> UPN-20-9196.PCT <150> US 63/016,036 <151> 2020-04-27 <150> US 63/091,032 <151> 2020-10-13 <150> US 63/109,608 <151> 2020-11-04 <160> 48 <170> PatentIn version 3.5 <210> 1 <211> 4634 <212> DNA <213> Artificial Sequence <220> <223> Expression cassette <220> <221> repeat_region <222> (1)..(130) <223> 5'ITR <220> <221> misc_feature <222> (130)..(168) <223> AAV 2 seq upstream of 3'ITR <220> <221> promoter <222> (213)..(678) <223> hSynapsin <220> <221> CDS <222> (699)..(3581) <223> hCDKL5_1 <220> <221> misc_feature <222> (3596)..(4183) <223> WRPE <220> <221> polyA_signal <222> (4201)..(4439) <223> SV40 polyA <220> <221> misc_feature <222> (4467)..(44505) <223> AAV2 seq upstream of 3'ITR <220> <221> repeat_region <222> (4505)..(4634) <223> 3'ITR <400> 1 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatcc tctagaacta tagctagcat gcctgcagag ggccctgcgt atgagtgcaa 240 gtgggtttta ggaccaggat gaggcggggt gggggtgcct acctgacgac cgaccccgac 300 ccactggaca agcacccaac ccccattccc caaattgcgc atcccctatc agagaggggg 360 aggggaaaca ggatgcggcg aggcgcgtgc gcactgccag cttcagcacc gcggacagtg 420 ccttcgcccc cgcctggcgg cgcgcgccac cgccgcctca gcactgaagg cgcgctgacg 480 tcactcgccg gtcccccgca aactcccctt cccggccacc ttggtcgcgt ccgcgccgcc 540 gccggcccag ccggaccgca ccacgcgagg cgcgagatag gggggcacgg gcgcgaccat 600 ctgcgctgcg gcgccggcga ctcagcgctg cctcagtctg cggtgggcag cggaggagtc 660 gtgtcgtgcc tgagagcgca gtcgaattcg ccgccacc atg aag atc ccc aac atc 716 Met Lys Ile Pro Asn Ile 1 5 ggc aac gtg atg aac aag ttc gag atc ctg ggc gtt gtc gga gaa ggc 764 Gly Asn Val Met Asn Lys Phe Glu Ile Leu Gly Val Val Gly Glu Gly 10 15 20 gct tat ggc gtg gtg ctg aag tgc aga cac aaa gaa acc cac gag atc 812 Ala Tyr Gly Val Val Leu Lys Cys Arg His Lys Glu Thr His Glu Ile 25 30 35 gtg gcc atc aag aag ttc aag gac agc gaa gag aac gag gaa gtg aaa 860 Val Ala Ile Lys Lys Phe Lys Asp Ser Glu Glu Asn Glu Glu Val Lys 40 45 50 gag aca acc ctg cgc gag ctg aag atg ctg aga acc ctg aag caa gag 908 Glu Thr Thr Leu Arg Glu Leu Lys Met Leu Arg Thr Leu Lys Gln Glu 55 60 65 70 aac atc gtg gaa ctg aaa gag gcc ttc cgg cgg aga ggc aag ctg tac 956 Asn Ile Val Glu Leu Lys Glu Ala Phe Arg Arg Arg Gly Lys Leu Tyr 75 80 85 ctg gtg ttc gag tac gtg gaa aag aac atg ctc gag ctg ctg gaa gag 1004 Leu Val Phe Glu Tyr Val Glu Lys Asn Met Leu Glu Leu Leu Glu Glu 90 95 100 atg ccc aat ggc gtg cca cct gag aaa gtg aag tcc tac atc tac cag 1052 Met Pro Asn Gly Val Pro Pro Glu Lys Val Lys Ser Tyr Ile Tyr Gln 105 110 115 ctg atc aag gcc atc cac tgg tgc cac aag aac gac atc gtg cac aga 1100 Leu Ile Lys Ala Ile His Trp Cys His Lys Asn Asp Ile Val His Arg 120 125 130 gac atc aag ccc gag aac ctg ctg atc tcc cac aac gac gtg ctg aag 1148 Asp Ile Lys Pro Glu Asn Leu Leu Ile Ser His Asn Asp Val Leu Lys 135 140 145 150 ctg tgc gac ttc ggc ttc gcc aga aat ctg agc gag ggc aac aac gcc 1196 Leu Cys Asp Phe Gly Phe Ala Arg Asn Leu Ser Glu Gly Asn Asn Ala 155 160 165 aac tac acc gag tat gtg gcc acc aga tgg tac aga agc cct gaa ctg 1244 Asn Tyr Thr Glu Tyr Val Ala Thr Arg Trp Tyr Arg Ser Pro Glu Leu 170 175 180 ctg ctg gga gcc cct tac ggc aag tct gtg gat atg tgg tcc gtg ggc 1292 Leu Leu Gly Ala Pro Tyr Gly Lys Ser Val Asp Met Trp Ser Val Gly 185 190 195 tgt atc ctg gga gag ctg tct gat ggc caa cct ctg ttt cct ggc gag 1340 Cys Ile Leu Gly Glu Leu Ser Asp Gly Gln Pro Leu Phe Pro Gly Glu 200 205 210 tcc gag atc gac cag ctg ttc aca atc cag aag gtg ctg ggc cct ctg 1388 Ser Glu Ile Asp Gln Leu Phe Thr Ile Gln Lys Val Leu Gly Pro Leu 215 220 225 230 cct agc gag cag atg aag ctg ttc tac agc aac ccc aga ttc cac ggc 1436 Pro Ser Glu Gln Met Lys Leu Phe Tyr Ser Asn Pro Arg Phe His Gly 235 240 245 ctg aga ttc cct gcc gtg aat cac cct cag agc ctg gaa aga aga tac 1484 Leu Arg Phe Pro Ala Val Asn His Pro Gln Ser Leu Glu Arg Arg Tyr 250 255 260 ctg ggc atc ctg aac agc gtg ctg ctg gac ctg atg aag aat ctg ctg 1532 Leu Gly Ile Leu Asn Ser Val Leu Leu Asp Leu Met Lys Asn Leu Leu 265 270 275 aaa ctg gac ccc gcc gac aga tac ctg acc gag cag tgt ctg aac cat 1580 Lys Leu Asp Pro Ala Asp Arg Tyr Leu Thr Glu Gln Cys Leu Asn His 280 285 290 cct acc ttt cag acc cag aga ctg ctg gat aga agc ccc agc aga agc 1628 Pro Thr Phe Gln Thr Gln Arg Leu Leu Asp Arg Ser Pro Ser Arg Ser 295 300 305 310 gcc aag aga aag ccc tac cac gtg gaa agc agc acc ctg agc aat aga 1676 Ala Lys Arg Lys Pro Tyr His Val Glu Ser Ser Thr Leu Ser Asn Arg 315 320 325 aac cag gcc gga aag agc act gcc ctg cag agc cac cac aga agc aac 1724 Asn Gln Ala Gly Lys Ser Thr Ala Leu Gln Ser His His Arg Ser Asn 330 335 340 agc aag gac atc cag aac ctg agc gtg ggc ctg cct aga gct gat gaa 1772 Ser Lys Asp Ile Gln Asn Leu Ser Val Gly Leu Pro Arg Ala Asp Glu 345 350 355 gga ctg cct gcc aac gag agc ttc ctg aat gga aat ctg gct ggc gcc 1820 Gly Leu Pro Ala Asn Glu Ser Phe Leu Asn Gly Asn Leu Ala Gly Ala 360 365 370 tct ctg agc cct ctg cac aca aag aca tac cag gcc agc agc cag cct 1868 Ser Leu Ser Pro Leu His Thr Lys Thr Tyr Gln Ala Ser Ser Gln Pro 375 380 385 390 ggc agc aca agc aag gac ctg acc aac aac aac atc cct cat ctg ctg 1916 Gly Ser Thr Ser Lys Asp Leu Thr Asn Asn Asn Ile Pro His Leu Leu 395 400 405 agc ccc aaa gag gcc aag agc aag acc gag ttc gac ttc aac atc gac 1964 Ser Pro Lys Glu Ala Lys Ser Lys Thr Glu Phe Asp Phe Asn Ile Asp 410 415 420 ccc aag cct agc gaa ggc cct ggc acc aag tac ctg aag tcc aac tcc 2012 Pro Lys Pro Ser Glu Gly Pro Gly Thr Lys Tyr Leu Lys Ser Asn Ser 425 430 435 aga agc cag cag aac cgg cac tcc ttc atg gaa agc tct cag agc aag 2060 Arg Ser Gln Gln Asn Arg His Ser Phe Met Glu Ser Ser Gln Ser Lys 440 445 450 gcc ggc aca ctg cag cct aac gag aag cag agc aga cac agc tac atc 2108 Ala Gly Thr Leu Gln Pro Asn Glu Lys Gln Ser Arg His Ser Tyr Ile 455 460 465 470 gac aca atc cct cag tcc tct cgg agc ccc agc tac aga aca aag gcc 2156 Asp Thr Ile Pro Gln Ser Ser Arg Ser Pro Ser Tyr Arg Thr Lys Ala 475 480 485 aaa tct cac ggc gcc ctg agc gat agc aag agc gtg tcc aat ctg tcc 2204 Lys Ser His Gly Ala Leu Ser Asp Ser Lys Ser Val Ser Asn Leu Ser 490 495 500 gag gct aga gcc cag atc gcc gag cct agc acc agc aga tac ttc cct 2252 Glu Ala Arg Ala Gln Ile Ala Glu Pro Ser Thr Ser Arg Tyr Phe Pro 505 510 515 agc agc tgc ctg gat ctg aac agc cct aca agc ccc aca cct acc agg 2300 Ser Ser Cys Leu Asp Leu Asn Ser Pro Thr Ser Pro Thr Pro Thr Arg 520 525 530 cac agc gat acc aga aca ctg ctg tcc cca agc ggc cgg aac aac aga 2348 His Ser Asp Thr Arg Thr Leu Leu Ser Pro Ser Gly Arg Asn Asn Arg 535 540 545 550 aat gag ggc acc ctg gac agc aga cgg acc acc aca aga cac agc aag 2396 Asn Glu Gly Thr Leu Asp Ser Arg Arg Thr Thr Thr Arg His Ser Lys 555 560 565 acc atg gaa gaa ctg aag ctg ccc gag cac atg gac tct agc cac tct 2444 Thr Met Glu Glu Leu Lys Leu Pro Glu His Met Asp Ser Ser His Ser 570 575 580 cat tct ctg agc gcc cct cac gag tcc ttt agc tac ggc ctg ggc tac 2492 His Ser Leu Ser Ala Pro His Glu Ser Phe Ser Tyr Gly Leu Gly Tyr 585 590 595 aca agc cca ttt tcc agt cag cag cgg ccc cac aga cac tct atg tac 2540 Thr Ser Pro Phe Ser Ser Gln Gln Arg Pro His Arg His Ser Met Tyr 600 605 610 gtg acc aga gac aaa gtc cgc gcc aaa ggc ctg gat ggc tct ctg tct 2588 Val Thr Arg Asp Lys Val Arg Ala Lys Gly Leu Asp Gly Ser Leu Ser 615 620 625 630 att gga caa ggc atg gcc gcc aga gcc aat agc ctg caa ctt ctg tct 2636 Ile Gly Gln Gly Met Ala Ala Arg Ala Asn Ser Leu Gln Leu Leu Ser 635 640 645 cct cag cct ggc gaa cag ctg cct cct gaa atg aca gtg gcc cgg tcc 2684 Pro Gln Pro Gly Glu Gln Leu Pro Pro Glu Met Thr Val Ala Arg Ser 650 655 660 agc gtg aaa gaa acc agc aga gag ggc acc tcc agc ttc cac acc aga 2732 Ser Val Lys Glu Thr Ser Arg Glu Gly Thr Ser Ser Phe His Thr Arg 665 670 675 cag aaa agc gaa ggc ggc gtg tac cac gat cct cac tct gat gat ggc 2780 Gln Lys Ser Glu Gly Gly Val Tyr His Asp Pro His Ser Asp Asp Gly 680 685 690 aca gcc cct aaa gag aac aga cac ctg tac aac gac ccc gtg cct aga 2828 Thr Ala Pro Lys Glu Asn Arg His Leu Tyr Asn Asp Pro Val Pro Arg 695 700 705 710 aga gtg ggc tcc ttc tac aga gtg cct tct cct aga cct gac aac tcc 2876 Arg Val Gly Ser Phe Tyr Arg Val Pro Ser Pro Arg Pro Asp Asn Ser 715 720 725 ttc cac gag aac aac gtg tca acc cgg gtg tcc agc ctg cct tct gag 2924 Phe His Glu Asn Asn Val Ser Thr Arg Val Ser Ser Leu Pro Ser Glu 730 735 740 agc agc tct ggc aca aac cac tcc aag agg cag ccc gcc ttc gat cct 2972 Ser Ser Ser Gly Thr Asn His Ser Lys Arg Gln Pro Ala Phe Asp Pro 745 750 755 tgg aag tcc cct gag aat atc agc cac tcc gag cag ctg aaa gag aaa 3020 Trp Lys Ser Pro Glu Asn Ile Ser His Ser Glu Gln Leu Lys Glu Lys 760 765 770 gag aag cag ggc ttt ttc cgg tcc atg aag aag aag aaa aag aag tcc 3068 Glu Lys Gln Gly Phe Phe Arg Ser Met Lys Lys Lys Lys Lys Lys Ser 775 780 785 790 cag aca gtc ccc aac agc gac agc cct gat ctc ctg aca ctg cag aag 3116 Gln Thr Val Pro Asn Ser Asp Ser Pro Asp Leu Leu Thr Leu Gln Lys 795 800 805 tcc atc cac agc gcc agc aca cct agc agc aga cct aaa gag tgg cgg 3164 Ser Ile His Ser Ala Ser Thr Pro Ser Ser Arg Pro Lys Glu Trp Arg 810 815 820 cca gag aag atc agc gac ctg caa aca cag agc cag cct ctg aag tcc 3212 Pro Glu Lys Ile Ser Asp Leu Gln Thr Gln Ser Gln Pro Leu Lys Ser 825 830 835 ctg agg aag ctg ctg cat ctg tcc tcc gcc tct aat cac cct gcc agc 3260 Leu Arg Lys Leu Leu His Leu Ser Ser Ala Ser Asn His Pro Ala Ser 840 845 850 agc gat ccc aga ttt cag cca ctg aca gcc cag cag acc aag aac tcc 3308 Ser Asp Pro Arg Phe Gln Pro Leu Thr Ala Gln Gln Thr Lys Asn Ser 855 860 865 870 ttc agc gag atc cgg att cac cca ctg tct cag gcc agc ggc ggc agc 3356 Phe Ser Glu Ile Arg Ile His Pro Leu Ser Gln Ala Ser Gly Gly Ser 875 880 885 tct aat atc aga caa gag ccc gct cct aag ggc aga cct gct ctc caa 3404 Ser Asn Ile Arg Gln Glu Pro Ala Pro Lys Gly Arg Pro Ala Leu Gln 890 895 900 ctg cct gga cag atg gat cct ggc tgg cac gtg tcc tct gtg aca aga 3452 Leu Pro Gly Gln Met Asp Pro Gly Trp His Val Ser Ser Val Thr Arg 905 910 915 tct gcc acc gag gga cct agc tat tct gag cag ctg ggc gcc aag tct 3500 Ser Ala Thr Glu Gly Pro Ser Tyr Ser Glu Gln Leu Gly Ala Lys Ser 920 925 930 ggc ccc aat gga cac ccc tac aac cgg acc aat cgg agc aga atg ccc 3548 Gly Pro Asn Gly His Pro Tyr Asn Arg Thr Asn Arg Ser Arg Met Pro 935 940 945 950 aac ctg aac gac ctc aaa gaa aca gcc ctc tga gagcttatcg ataatcaacc 3601 Asn Leu Asn Asp Leu Lys Glu Thr Ala Leu 955 960 tctggattac aaaatttgtg aaagattgac tggtattctt aactatgttg ctccttttac 3661 gctatgtgga tacgctgctt taatgccttt gtatcatgct attgcttccc gtatggcttt 3721 cattttctcc tccttgtata aatcctggtt gctgtctctt tatgaggagt tgtggcccgt 3781 tgtcaggcaa cgtggcgtgg tgtgcactgt gtttgctgac gcaaccccca ctggttgggg 3841 cattgccacc acctgtcagc tcctttccgg gactttcgct ttccccctcc ctattgccac 3901 ggcggaactc atcgccgcct gccttgcccg ctgctggaca ggggctcggc tgttgggcac 3961 tgacaattcc gtggtgttgt cggggaaatc atcgtccttt ccttggctgc tcgcctgtgt 4021 tgccacctgg attctgcgcg ggacgtcctt ctgctacgtc ccttcggccc tcaatccagc 4081 ggaccttcct tcccgcggcc tgctgccggc tctgcggcct cttccgcgtc ttcgccttcg 4141 ccctcagacg agtcggatct ccctttgggc cgcctccccg catcgatacc gtcgatcgag 4201 gccgcttcga gcagacatga taagatacat tgatgagttt ggacaaacca caactagaat 4261 gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct attgctttat ttgtaaccat 4321 tataagctgc aataaacaag ttaacaacaa caattgcatt cattttatgt ttcaggttca 4381 gggggagatg tgggaggttt tttaaagcaa gtaaaacctc tacaaatgtg gtaaaatcga 4441 taaggatctt cctagagcat ggctacgtag ataagtagca tggcgggtta atcattaact 4501 acaaggaacc cctagtgatg gagttggcca ctccctctct gcgcgctcgc tcgctcactg 4561 aggccgggcg accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg 4621 agcgagcgcg cag 4634 <210> 2 <211> 960 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 2 Met Lys Ile Pro Asn Ile Gly Asn Val Met Asn Lys Phe Glu Ile Leu 1 5 10 15 Gly Val Val Gly Glu Gly Ala Tyr Gly Val Val Leu Lys Cys Arg His 20 25 30 Lys Glu Thr His Glu Ile Val Ala Ile Lys Lys Phe Lys Asp Ser Glu 35 40 45 Glu Asn Glu Glu Val Lys Glu Thr Thr Leu Arg Glu Leu Lys Met Leu 50 55 60 Arg Thr Leu Lys Gln Glu Asn Ile Val Glu Leu Lys Glu Ala Phe Arg 65 70 75 80 Arg Arg Gly Lys Leu Tyr Leu Val Phe Glu Tyr Val Glu Lys Asn Met 85 90 95 Leu Glu Leu Leu Glu Glu Met Pro Asn Gly Val Pro Pro Glu Lys Val 100 105 110 Lys Ser Tyr Ile Tyr Gln Leu Ile Lys Ala Ile His Trp Cys His Lys 115 120 125 Asn Asp Ile Val His Arg Asp Ile Lys Pro Glu Asn Leu Leu Ile Ser 130 135 140 His Asn Asp Val Leu Lys Leu Cys Asp Phe Gly Phe Ala Arg Asn Leu 145 150 155 160 Ser Glu Gly Asn Asn Ala Asn Tyr Thr Glu Tyr Val Ala Thr Arg Trp 165 170 175 Tyr Arg Ser Pro Glu Leu Leu Leu Gly Ala Pro Tyr Gly Lys Ser Val 180 185 190 Asp Met Trp Ser Val Gly Cys Ile Leu Gly Glu Leu Ser Asp Gly Gln 195 200 205 Pro Leu Phe Pro Gly Glu Ser Glu Ile Asp Gln Leu Phe Thr Ile Gln 210 215 220 Lys Val Leu Gly Pro Leu Pro Ser Glu Gln Met Lys Leu Phe Tyr Ser 225 230 235 240 Asn Pro Arg Phe His Gly Leu Arg Phe Pro Ala Val Asn His Pro Gln 245 250 255 Ser Leu Glu Arg Arg Tyr Leu Gly Ile Leu Asn Ser Val Leu Leu Asp 260 265 270 Leu Met Lys Asn Leu Leu Lys Leu Asp Pro Ala Asp Arg Tyr Leu Thr 275 280 285 Glu Gln Cys Leu Asn His Pro Thr Phe Gln Thr Gln Arg Leu Leu Asp 290 295 300 Arg Ser Pro Ser Arg Ser Ala Lys Arg Lys Pro Tyr His Val Glu Ser 305 310 315 320 Ser Thr Leu Ser Asn Arg Asn Gln Ala Gly Lys Ser Thr Ala Leu Gln 325 330 335 Ser His His Arg Ser Asn Ser Lys Asp Ile Gln Asn Leu Ser Val Gly 340 345 350 Leu Pro Arg Ala Asp Glu Gly Leu Pro Ala Asn Glu Ser Phe Leu Asn 355 360 365 Gly Asn Leu Ala Gly Ala Ser Leu Ser Pro Leu His Thr Lys Thr Tyr 370 375 380 Gln Ala Ser Ser Gln Pro Gly Ser Thr Ser Lys Asp Leu Thr Asn Asn 385 390 395 400 Asn Ile Pro His Leu Leu Ser Pro Lys Glu Ala Lys Ser Lys Thr Glu 405 410 415 Phe Asp Phe Asn Ile Asp Pro Lys Pro Ser Glu Gly Pro Gly Thr Lys 420 425 430 Tyr Leu Lys Ser Asn Ser Arg Ser Gln Gln Asn Arg His Ser Phe Met 435 440 445 Glu Ser Ser Gln Ser Lys Ala Gly Thr Leu Gln Pro Asn Glu Lys Gln 450 455 460 Ser Arg His Ser Tyr Ile Asp Thr Ile Pro Gln Ser Ser Arg Ser Pro 465 470 475 480 Ser Tyr Arg Thr Lys Ala Lys Ser His Gly Ala Leu Ser Asp Ser Lys 485 490 495 Ser Val Ser Asn Leu Ser Glu Ala Arg Ala Gln Ile Ala Glu Pro Ser 500 505 510 Thr Ser Arg Tyr Phe Pro Ser Ser Cys Leu Asp Leu Asn Ser Pro Thr 515 520 525 Ser Pro Thr Pro Thr Arg His Ser Asp Thr Arg Thr Leu Leu Ser Pro 530 535 540 Ser Gly Arg Asn Asn Arg Asn Glu Gly Thr Leu Asp Ser Arg Arg Thr 545 550 555 560 Thr Thr Arg His Ser Lys Thr Met Glu Glu Leu Lys Leu Pro Glu His 565 570 575 Met Asp Ser Ser His Ser His Ser Leu Ser Ala Pro His Glu Ser Phe 580 585 590 Ser Tyr Gly Leu Gly Tyr Thr Ser Pro Phe Ser Ser Gln Gln Arg Pro 595 600 605 His Arg His Ser Met Tyr Val Thr Arg Asp Lys Val Arg Ala Lys Gly 610 615 620 Leu Asp Gly Ser Leu Ser Ile Gly Gln Gly Met Ala Ala Arg Ala Asn 625 630 635 640 Ser Leu Gln Leu Leu Ser Pro Gln Pro Gly Glu Gln Leu Pro Pro Glu 645 650 655 Met Thr Val Ala Arg Ser Ser Val Lys Glu Thr Ser Arg Glu Gly Thr 660 665 670 Ser Ser Phe His Thr Arg Gln Lys Ser Glu Gly Gly Val Tyr His Asp 675 680 685 Pro His Ser Asp Asp Gly Thr Ala Pro Lys Glu Asn Arg His Leu Tyr 690 695 700 Asn Asp Pro Val Pro Arg Arg Val Gly Ser Phe Tyr Arg Val Pro Ser 705 710 715 720 Pro Arg Pro Asp Asn Ser Phe His Glu Asn Asn Val Ser Thr Arg Val 725 730 735 Ser Ser Leu Pro Ser Glu Ser Ser Ser Gly Thr Asn His Ser Lys Arg 740 745 750 Gln Pro Ala Phe Asp Pro Trp Lys Ser Pro Glu Asn Ile Ser His Ser 755 760 765 Glu Gln Leu Lys Glu Lys Glu Lys Gln Gly Phe Phe Arg Ser Met Lys 770 775 780 Lys Lys Lys Lys Lys Ser Gln Thr Val Pro Asn Ser Asp Ser Pro Asp 785 790 795 800 Leu Leu Thr Leu Gln Lys Ser Ile His Ser Ala Ser Thr Pro Ser Ser 805 810 815 Arg Pro Lys Glu Trp Arg Pro Glu Lys Ile Ser Asp Leu Gln Thr Gln 820 825 830 Ser Gln Pro Leu Lys Ser Leu Arg Lys Leu Leu His Leu Ser Ser Ala 835 840 845 Ser Asn His Pro Ala Ser Ser Asp Pro Arg Phe Gln Pro Leu Thr Ala 850 855 860 Gln Gln Thr Lys Asn Ser Phe Ser Glu Ile Arg Ile His Pro Leu Ser 865 870 875 880 Gln Ala Ser Gly Gly Ser Ser Asn Ile Arg Gln Glu Pro Ala Pro Lys 885 890 895 Gly Arg Pro Ala Leu Gln Leu Pro Gly Gln Met Asp Pro Gly Trp His 900 905 910 Val Ser Ser Val Thr Arg Ser Ala Thr Glu Gly Pro Ser Tyr Ser Glu 915 920 925 Gln Leu Gly Ala Lys Ser Gly Pro Asn Gly His Pro Tyr Asn Arg Thr 930 935 940 Asn Arg Ser Arg Met Pro Asn Leu Asn Asp Leu Lys Glu Thr Ala Leu 945 950 955 960 <210> 3 <211> 4750 <212> DNA <213> Artificial Sequence <220> <223> Expression Cassette <220> <221> repeat_region <222> (1)..(130) <223> 5'ITR <220> <221> misc_feature <222> (130)..(168) <223> AAV2 seq usptream of 3'ITR <220> <221> promoter <222> (213)..(678) <223> hSynapsin <220> <221> CDS <222> (699)..(3581) <223> hCDKL5-1 <220> <221> misc_binding <222> (3590)..(3705) <223> miR183 <220> <221> misc_feature <222> (3712)..(4299) <223> WRPE <220> <221> polyA_signal <222> (4317)..(4555) <223> SV40 polyA <220> <221> misc_feature <222> (4583)..(4621) <223> AAV2 seq upstream of 3'ITR <220> <221> repeat_region <222> (4621)..(4750) <223> 3'ITR <400> 3 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatcc tctagaacta tagctagcat gcctgcagag ggccctgcgt atgagtgcaa 240 gtgggtttta ggaccaggat gaggcggggt gggggtgcct acctgacgac cgaccccgac 300 ccactggaca agcacccaac ccccattccc caaattgcgc atcccctatc agagaggggg 360 aggggaaaca ggatgcggcg aggcgcgtgc gcactgccag cttcagcacc gcggacagtg 420 ccttcgcccc cgcctggcgg cgcgcgccac cgccgcctca gcactgaagg cgcgctgacg 480 tcactcgccg gtcccccgca aactcccctt cccggccacc ttggtcgcgt ccgcgccgcc 540 gccggcccag ccggaccgca ccacgcgagg cgcgagatag gggggcacgg gcgcgaccat 600 ctgcgctgcg gcgccggcga ctcagcgctg cctcagtctg cggtgggcag cggaggagtc 660 gtgtcgtgcc tgagagcgca gtcgaattcg ccgccacc atg aag atc ccc aac atc 716 Met Lys Ile Pro Asn Ile 1 5 ggc aac gtg atg aac aag ttc gag atc ctg ggc gtt gtc gga gaa ggc 764 Gly Asn Val Met Asn Lys Phe Glu Ile Leu Gly Val Val Gly Glu Gly 10 15 20 gct tat ggc gtg gtg ctg aag tgc aga cac aaa gaa acc cac gag atc 812 Ala Tyr Gly Val Val Leu Lys Cys Arg His Lys Glu Thr His Glu Ile 25 30 35 gtg gcc atc aag aag ttc aag gac agc gaa gag aac gag gaa gtg aaa 860 Val Ala Ile Lys Lys Phe Lys Asp Ser Glu Glu Asn Glu Glu Val Lys 40 45 50 gag aca acc ctg cgc gag ctg aag atg ctg aga acc ctg aag caa gag 908 Glu Thr Thr Leu Arg Glu Leu Lys Met Leu Arg Thr Leu Lys Gln Glu 55 60 65 70 aac atc gtg gaa ctg aaa gag gcc ttc cgg cgg aga ggc aag ctg tac 956 Asn Ile Val Glu Leu Lys Glu Ala Phe Arg Arg Arg Gly Lys Leu Tyr 75 80 85 ctg gtg ttc gag tac gtg gaa aag aac atg ctc gag ctg ctg gaa gag 1004 Leu Val Phe Glu Tyr Val Glu Lys Asn Met Leu Glu Leu Leu Glu Glu 90 95 100 atg ccc aat ggc gtg cca cct gag aaa gtg aag tcc tac atc tac cag 1052 Met Pro Asn Gly Val Pro Pro Glu Lys Val Lys Ser Tyr Ile Tyr Gln 105 110 115 ctg atc aag gcc atc cac tgg tgc cac aag aac gac atc gtg cac aga 1100 Leu Ile Lys Ala Ile His Trp Cys His Lys Asn Asp Ile Val His Arg 120 125 130 gac atc aag ccc gag aac ctg ctg atc tcc cac aac gac gtg ctg aag 1148 Asp Ile Lys Pro Glu Asn Leu Leu Ile Ser His Asn Asp Val Leu Lys 135 140 145 150 ctg tgc gac ttc ggc ttc gcc aga aat ctg agc gag ggc aac aac gcc 1196 Leu Cys Asp Phe Gly Phe Ala Arg Asn Leu Ser Glu Gly Asn Asn Ala 155 160 165 aac tac acc gag tat gtg gcc acc aga tgg tac aga agc cct gaa ctg 1244 Asn Tyr Thr Glu Tyr Val Ala Thr Arg Trp Tyr Arg Ser Pro Glu Leu 170 175 180 ctg ctg gga gcc cct tac ggc aag tct gtg gat atg tgg tcc gtg ggc 1292 Leu Leu Gly Ala Pro Tyr Gly Lys Ser Val Asp Met Trp Ser Val Gly 185 190 195 tgt atc ctg gga gag ctg tct gat ggc caa cct ctg ttt cct ggc gag 1340 Cys Ile Leu Gly Glu Leu Ser Asp Gly Gln Pro Leu Phe Pro Gly Glu 200 205 210 tcc gag atc gac cag ctg ttc aca atc cag aag gtg ctg ggc cct ctg 1388 Ser Glu Ile Asp Gln Leu Phe Thr Ile Gln Lys Val Leu Gly Pro Leu 215 220 225 230 cct agc gag cag atg aag ctg ttc tac agc aac ccc aga ttc cac ggc 1436 Pro Ser Glu Gln Met Lys Leu Phe Tyr Ser Asn Pro Arg Phe His Gly 235 240 245 ctg aga ttc cct gcc gtg aat cac cct cag agc ctg gaa aga aga tac 1484 Leu Arg Phe Pro Ala Val Asn His Pro Gln Ser Leu Glu Arg Arg Tyr 250 255 260 ctg ggc atc ctg aac agc gtg ctg ctg gac ctg atg aag aat ctg ctg 1532 Leu Gly Ile Leu Asn Ser Val Leu Leu Asp Leu Met Lys Asn Leu Leu 265 270 275 aaa ctg gac ccc gcc gac aga tac ctg acc gag cag tgt ctg aac cat 1580 Lys Leu Asp Pro Ala Asp Arg Tyr Leu Thr Glu Gln Cys Leu Asn His 280 285 290 cct acc ttt cag acc cag aga ctg ctg gat aga agc ccc agc aga agc 1628 Pro Thr Phe Gln Thr Gln Arg Leu Leu Asp Arg Ser Pro Ser Arg Ser 295 300 305 310 gcc aag aga aag ccc tac cac gtg gaa agc agc acc ctg agc aat aga 1676 Ala Lys Arg Lys Pro Tyr His Val Glu Ser Ser Thr Leu Ser Asn Arg 315 320 325 aac cag gcc gga aag agc act gcc ctg cag agc cac cac aga agc aac 1724 Asn Gln Ala Gly Lys Ser Thr Ala Leu Gln Ser His His Arg Ser Asn 330 335 340 agc aag gac atc cag aac ctg agc gtg ggc ctg cct aga gct gat gaa 1772 Ser Lys Asp Ile Gln Asn Leu Ser Val Gly Leu Pro Arg Ala Asp Glu 345 350 355 gga ctg cct gcc aac gag agc ttc ctg aat gga aat ctg gct ggc gcc 1820 Gly Leu Pro Ala Asn Glu Ser Phe Leu Asn Gly Asn Leu Ala Gly Ala 360 365 370 tct ctg agc cct ctg cac aca aag aca tac cag gcc agc agc cag cct 1868 Ser Leu Ser Pro Leu His Thr Lys Thr Tyr Gln Ala Ser Ser Gln Pro 375 380 385 390 ggc agc aca agc aag gac ctg acc aac aac aac atc cct cat ctg ctg 1916 Gly Ser Thr Ser Lys Asp Leu Thr Asn Asn Asn Ile Pro His Leu Leu 395 400 405 agc ccc aaa gag gcc aag agc aag acc gag ttc gac ttc aac atc gac 1964 Ser Pro Lys Glu Ala Lys Ser Lys Thr Glu Phe Asp Phe Asn Ile Asp 410 415 420 ccc aag cct agc gaa ggc cct ggc acc aag tac ctg aag tcc aac tcc 2012 Pro Lys Pro Ser Glu Gly Pro Gly Thr Lys Tyr Leu Lys Ser Asn Ser 425 430 435 aga agc cag cag aac cgg cac tcc ttc atg gaa agc tct cag agc aag 2060 Arg Ser Gln Gln Asn Arg His Ser Phe Met Glu Ser Ser Gln Ser Lys 440 445 450 gcc ggc aca ctg cag cct aac gag aag cag agc aga cac agc tac atc 2108 Ala Gly Thr Leu Gln Pro Asn Glu Lys Gln Ser Arg His Ser Tyr Ile 455 460 465 470 gac aca atc cct cag tcc tct cgg agc ccc agc tac aga aca aag gcc 2156 Asp Thr Ile Pro Gln Ser Ser Arg Ser Pro Ser Tyr Arg Thr Lys Ala 475 480 485 aaa tct cac ggc gcc ctg agc gat agc aag agc gtg tcc aat ctg tcc 2204 Lys Ser His Gly Ala Leu Ser Asp Ser Lys Ser Val Ser Asn Leu Ser 490 495 500 gag gct aga gcc cag atc gcc gag cct agc acc agc aga tac ttc cct 2252 Glu Ala Arg Ala Gln Ile Ala Glu Pro Ser Thr Ser Arg Tyr Phe Pro 505 510 515 agc agc tgc ctg gat ctg aac agc cct aca agc ccc aca cct acc agg 2300 Ser Ser Cys Leu Asp Leu Asn Ser Pro Thr Ser Pro Thr Pro Thr Arg 520 525 530 cac agc gat acc aga aca ctg ctg tcc cca agc ggc cgg aac aac aga 2348 His Ser Asp Thr Arg Thr Leu Leu Ser Pro Ser Gly Arg Asn Asn Arg 535 540 545 550 aat gag ggc acc ctg gac agc aga cgg acc acc aca aga cac agc aag 2396 Asn Glu Gly Thr Leu Asp Ser Arg Arg Thr Thr Thr Arg His Ser Lys 555 560 565 acc atg gaa gaa ctg aag ctg ccc gag cac atg gac tct agc cac tct 2444 Thr Met Glu Glu Leu Lys Leu Pro Glu His Met Asp Ser Ser His Ser 570 575 580 cat tct ctg agc gcc cct cac gag tcc ttt agc tac ggc ctg ggc tac 2492 His Ser Leu Ser Ala Pro His Glu Ser Phe Ser Tyr Gly Leu Gly Tyr 585 590 595 aca agc cca ttt tcc agt cag cag cgg ccc cac aga cac tct atg tac 2540 Thr Ser Pro Phe Ser Ser Gln Gln Arg Pro His Arg His Ser Met Tyr 600 605 610 gtg acc aga gac aaa gtc cgc gcc aaa ggc ctg gat ggc tct ctg tct 2588 Val Thr Arg Asp Lys Val Arg Ala Lys Gly Leu Asp Gly Ser Leu Ser 615 620 625 630 att gga caa ggc atg gcc gcc aga gcc aat agc ctg caa ctt ctg tct 2636 Ile Gly Gln Gly Met Ala Ala Arg Ala Asn Ser Leu Gln Leu Leu Ser 635 640 645 cct cag cct ggc gaa cag ctg cct cct gaa atg aca gtg gcc cgg tcc 2684 Pro Gln Pro Gly Glu Gln Leu Pro Pro Glu Met Thr Val Ala Arg Ser 650 655 660 agc gtg aaa gaa acc agc aga gag ggc acc tcc agc ttc cac acc aga 2732 Ser Val Lys Glu Thr Ser Arg Glu Gly Thr Ser Ser Phe His Thr Arg 665 670 675 cag aaa agc gaa ggc ggc gtg tac cac gat cct cac tct gat gat ggc 2780 Gln Lys Ser Glu Gly Gly Val Tyr His Asp Pro His Ser Asp Asp Gly 680 685 690 aca gcc cct aaa gag aac aga cac ctg tac aac gac ccc gtg cct aga 2828 Thr Ala Pro Lys Glu Asn Arg His Leu Tyr Asn Asp Pro Val Pro Arg 695 700 705 710 aga gtg ggc tcc ttc tac aga gtg cct tct cct aga cct gac aac tcc 2876 Arg Val Gly Ser Phe Tyr Arg Val Pro Ser Pro Arg Pro Asp Asn Ser 715 720 725 ttc cac gag aac aac gtg tca acc cgg gtg tcc agc ctg cct tct gag 2924 Phe His Glu Asn Asn Val Ser Thr Arg Val Ser Ser Leu Pro Ser Glu 730 735 740 agc agc tct ggc aca aac cac tcc aag agg cag ccc gcc ttc gat cct 2972 Ser Ser Ser Gly Thr Asn His Ser Lys Arg Gln Pro Ala Phe Asp Pro 745 750 755 tgg aag tcc cct gag aat atc agc cac tcc gag cag ctg aaa gag aaa 3020 Trp Lys Ser Pro Glu Asn Ile Ser His Ser Glu Gln Leu Lys Glu Lys 760 765 770 gag aag cag ggc ttt ttc cgg tcc atg aag aag aag aaa aag aag tcc 3068 Glu Lys Gln Gly Phe Phe Arg Ser Met Lys Lys Lys Lys Lys Lys Ser 775 780 785 790 cag aca gtc ccc aac agc gac agc cct gat ctc ctg aca ctg cag aag 3116 Gln Thr Val Pro Asn Ser Asp Ser Pro Asp Leu Leu Thr Leu Gln Lys 795 800 805 tcc atc cac agc gcc agc aca cct agc agc aga cct aaa gag tgg cgg 3164 Ser Ile His Ser Ala Ser Thr Pro Ser Ser Arg Pro Lys Glu Trp Arg 810 815 820 cca gag aag atc agc gac ctg caa aca cag agc cag cct ctg aag tcc 3212 Pro Glu Lys Ile Ser Asp Leu Gln Thr Gln Ser Gln Pro Leu Lys Ser 825 830 835 ctg agg aag ctg ctg cat ctg tcc tcc gcc tct aat cac cct gcc agc 3260 Leu Arg Lys Leu Leu His Leu Ser Ser Ala Ser Asn His Pro Ala Ser 840 845 850 agc gat ccc aga ttt cag cca ctg aca gcc cag cag acc aag aac tcc 3308 Ser Asp Pro Arg Phe Gln Pro Leu Thr Ala Gln Gln Thr Lys Asn Ser 855 860 865 870 ttc agc gag atc cgg att cac cca ctg tct cag gcc agc ggc ggc agc 3356 Phe Ser Glu Ile Arg Ile His Pro Leu Ser Gln Ala Ser Gly Gly Ser 875 880 885 tct aat atc aga caa gag ccc gct cct aag ggc aga cct gct ctc caa 3404 Ser Asn Ile Arg Gln Glu Pro Ala Pro Lys Gly Arg Pro Ala Leu Gln 890 895 900 ctg cct gga cag atg gat cct ggc tgg cac gtg tcc tct gtg aca aga 3452 Leu Pro Gly Gln Met Asp Pro Gly Trp His Val Ser Ser Val Thr Arg 905 910 915 tct gcc acc gag gga cct agc tat tct gag cag ctg ggc gcc aag tct 3500 Ser Ala Thr Glu Gly Pro Ser Tyr Ser Glu Gln Leu Gly Ala Lys Ser 920 925 930 ggc ccc aat gga cac ccc tac aac cgg acc aat cgg agc aga atg ccc 3548 Gly Pro Asn Gly His Pro Tyr Asn Arg Thr Asn Arg Ser Arg Met Pro 935 940 945 950 aac ctg aac gac ctc aaa gaa aca gcc ctc tga gagcttatac cggtagtgaa 3601 Asn Leu Asn Asp Leu Lys Glu Thr Ala Leu 955 960 ttctaccagt gccataggat agtgaattct accagtgcca tacacgtgag tgaattctac 3661 cagtgccata gcatgcagtg aattctacca gtgccatagg tacccgataa tcaacctctg 3721 gattacaaaa tttgtgaaag attgactggt attcttaact atgttgctcc ttttacgcta 3781 tgtggatacg ctgctttaat gcctttgtat catgctattg cttcccgtat ggctttcatt 3841 ttctcctcct tgtataaatc ctggttgctg tctctttatg aggagttgtg gcccgttgtc 3901 aggcaacgtg gcgtggtgtg cactgtgttt gctgacgcaa cccccactgg ttggggcatt 3961 gccaccacct gtcagctcct ttccgggact ttcgctttcc ccctccctat tgccacggcg 4021 gaactcatcg ccgcctgcct tgcccgctgc tggacagggg ctcggctgtt gggcactgac 4081 aattccgtgg tgttgtcggg gaaatcatcg tcctttcctt ggctgctcgc ctgtgttgcc 4141 acctggattc tgcgcgggac gtccttctgc tacgtccctt cggccctcaa tccagcggac 4201 cttccttccc gcggcctgct gccggctctg cggcctcttc cgcgtcttcg ccttcgccct 4261 cagacgagtc ggatctccct ttgggccgcc tccccgcatc gataccgtcg atcgaggccg 4321 cttcgagcag acatgataag atacattgat gagtttggac aaaccacaac tagaatgcag 4381 tgaaaaaaat gctttatttg tgaaatttgt gatgctattg ctttatttgt aaccattata 4441 agctgcaata aacaagttaa caacaacaat tgcattcatt ttatgtttca ggttcagggg 4501 gagatgtggg aggtttttta aagcaagtaa aacctctaca aatgtggtaa aatcgataag 4561 gatcttccta gagcatggct acgtagataa gtagcatggc gggttaatca ttaactacaa 4621 ggaaccccta gtgatggagt tggccactcc ctctctgcgc gctcgctcgc tcactgaggc 4681 cgggcgacca aaggtcgccc gacgcccggg ctttgcccgg gcggcctcag tgagcgagcg 4741 agcgcgcag 4750 <210> 4 <211> 960 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 4 Met Lys Ile Pro Asn Ile Gly Asn Val Met Asn Lys Phe Glu Ile Leu 1 5 10 15 Gly Val Val Gly Glu Gly Ala Tyr Gly Val Val Leu Lys Cys Arg His 20 25 30 Lys Glu Thr His Glu Ile Val Ala Ile Lys Lys Phe Lys Asp Ser Glu 35 40 45 Glu Asn Glu Glu Val Lys Glu Thr Thr Leu Arg Glu Leu Lys Met Leu 50 55 60 Arg Thr Leu Lys Gln Glu Asn Ile Val Glu Leu Lys Glu Ala Phe Arg 65 70 75 80 Arg Arg Gly Lys Leu Tyr Leu Val Phe Glu Tyr Val Glu Lys Asn Met 85 90 95 Leu Glu Leu Leu Glu Glu Met Pro Asn Gly Val Pro Pro Glu Lys Val 100 105 110 Lys Ser Tyr Ile Tyr Gln Leu Ile Lys Ala Ile His Trp Cys His Lys 115 120 125 Asn Asp Ile Val His Arg Asp Ile Lys Pro Glu Asn Leu Leu Ile Ser 130 135 140 His Asn Asp Val Leu Lys Leu Cys Asp Phe Gly Phe Ala Arg Asn Leu 145 150 155 160 Ser Glu Gly Asn Asn Ala Asn Tyr Thr Glu Tyr Val Ala Thr Arg Trp 165 170 175 Tyr Arg Ser Pro Glu Leu Leu Leu Gly Ala Pro Tyr Gly Lys Ser Val 180 185 190 Asp Met Trp Ser Val Gly Cys Ile Leu Gly Glu Leu Ser Asp Gly Gln 195 200 205 Pro Leu Phe Pro Gly Glu Ser Glu Ile Asp Gln Leu Phe Thr Ile Gln 210 215 220 Lys Val Leu Gly Pro Leu Pro Ser Glu Gln Met Lys Leu Phe Tyr Ser 225 230 235 240 Asn Pro Arg Phe His Gly Leu Arg Phe Pro Ala Val Asn His Pro Gln 245 250 255 Ser Leu Glu Arg Arg Tyr Leu Gly Ile Leu Asn Ser Val Leu Leu Asp 260 265 270 Leu Met Lys Asn Leu Leu Lys Leu Asp Pro Ala Asp Arg Tyr Leu Thr 275 280 285 Glu Gln Cys Leu Asn His Pro Thr Phe Gln Thr Gln Arg Leu Leu Asp 290 295 300 Arg Ser Pro Ser Arg Ser Ala Lys Arg Lys Pro Tyr His Val Glu Ser 305 310 315 320 Ser Thr Leu Ser Asn Arg Asn Gln Ala Gly Lys Ser Thr Ala Leu Gln 325 330 335 Ser His His Arg Ser Asn Ser Lys Asp Ile Gln Asn Leu Ser Val Gly 340 345 350 Leu Pro Arg Ala Asp Glu Gly Leu Pro Ala Asn Glu Ser Phe Leu Asn 355 360 365 Gly Asn Leu Ala Gly Ala Ser Leu Ser Pro Leu His Thr Lys Thr Tyr 370 375 380 Gln Ala Ser Ser Gln Pro Gly Ser Thr Ser Lys Asp Leu Thr Asn Asn 385 390 395 400 Asn Ile Pro His Leu Leu Ser Pro Lys Glu Ala Lys Ser Lys Thr Glu 405 410 415 Phe Asp Phe Asn Ile Asp Pro Lys Pro Ser Glu Gly Pro Gly Thr Lys 420 425 430 Tyr Leu Lys Ser Asn Ser Arg Ser Gln Gln Asn Arg His Ser Phe Met 435 440 445 Glu Ser Ser Gln Ser Lys Ala Gly Thr Leu Gln Pro Asn Glu Lys Gln 450 455 460 Ser Arg His Ser Tyr Ile Asp Thr Ile Pro Gln Ser Ser Arg Ser Pro 465 470 475 480 Ser Tyr Arg Thr Lys Ala Lys Ser His Gly Ala Leu Ser Asp Ser Lys 485 490 495 Ser Val Ser Asn Leu Ser Glu Ala Arg Ala Gln Ile Ala Glu Pro Ser 500 505 510 Thr Ser Arg Tyr Phe Pro Ser Ser Cys Leu Asp Leu Asn Ser Pro Thr 515 520 525 Ser Pro Thr Pro Thr Arg His Ser Asp Thr Arg Thr Leu Leu Ser Pro 530 535 540 Ser Gly Arg Asn Asn Arg Asn Glu Gly Thr Leu Asp Ser Arg Arg Thr 545 550 555 560 Thr Thr Arg His Ser Lys Thr Met Glu Glu Leu Lys Leu Pro Glu His 565 570 575 Met Asp Ser Ser His Ser His Ser Leu Ser Ala Pro His Glu Ser Phe 580 585 590 Ser Tyr Gly Leu Gly Tyr Thr Ser Pro Phe Ser Ser Gln Gln Arg Pro 595 600 605 His Arg His Ser Met Tyr Val Thr Arg Asp Lys Val Arg Ala Lys Gly 610 615 620 Leu Asp Gly Ser Leu Ser Ile Gly Gln Gly Met Ala Ala Arg Ala Asn 625 630 635 640 Ser Leu Gln Leu Leu Ser Pro Gln Pro Gly Glu Gln Leu Pro Pro Glu 645 650 655 Met Thr Val Ala Arg Ser Ser Val Lys Glu Thr Ser Arg Glu Gly Thr 660 665 670 Ser Ser Phe His Thr Arg Gln Lys Ser Glu Gly Gly Val Tyr His Asp 675 680 685 Pro His Ser Asp Asp Gly Thr Ala Pro Lys Glu Asn Arg His Leu Tyr 690 695 700 Asn Asp Pro Val Pro Arg Arg Val Gly Ser Phe Tyr Arg Val Pro Ser 705 710 715 720 Pro Arg Pro Asp Asn Ser Phe His Glu Asn Asn Val Ser Thr Arg Val 725 730 735 Ser Ser Leu Pro Ser Glu Ser Ser Ser Gly Thr Asn His Ser Lys Arg 740 745 750 Gln Pro Ala Phe Asp Pro Trp Lys Ser Pro Glu Asn Ile Ser His Ser 755 760 765 Glu Gln Leu Lys Glu Lys Glu Lys Gln Gly Phe Phe Arg Ser Met Lys 770 775 780 Lys Lys Lys Lys Lys Ser Gln Thr Val Pro Asn Ser Asp Ser Pro Asp 785 790 795 800 Leu Leu Thr Leu Gln Lys Ser Ile His Ser Ala Ser Thr Pro Ser Ser 805 810 815 Arg Pro Lys Glu Trp Arg Pro Glu Lys Ile Ser Asp Leu Gln Thr Gln 820 825 830 Ser Gln Pro Leu Lys Ser Leu Arg Lys Leu Leu His Leu Ser Ser Ala 835 840 845 Ser Asn His Pro Ala Ser Ser Asp Pro Arg Phe Gln Pro Leu Thr Ala 850 855 860 Gln Gln Thr Lys Asn Ser Phe Ser Glu Ile Arg Ile His Pro Leu Ser 865 870 875 880 Gln Ala Ser Gly Gly Ser Ser Asn Ile Arg Gln Glu Pro Ala Pro Lys 885 890 895 Gly Arg Pro Ala Leu Gln Leu Pro Gly Gln Met Asp Pro Gly Trp His 900 905 910 Val Ser Ser Val Thr Arg Ser Ala Thr Glu Gly Pro Ser Tyr Ser Glu 915 920 925 Gln Leu Gly Ala Lys Ser Gly Pro Asn Gly His Pro Tyr Asn Arg Thr 930 935 940 Asn Arg Ser Arg Met Pro Asn Leu Asn Asp Leu Lys Glu Thr Ala Leu 945 950 955 960 <210> 5 <211> 4757 <212> DNA <213> Artificial Sequence <220> <223> Expression Cassette <220> <221> repeat_region <222> (1)..(130) <223> 5'ITR <220> <221> misc_feature <222> (130)..(168) <223> AAV2 seq usptream of 3'ITR <220> <221> promoter <222> (213)..(678) <223> hSynapsin <220> <221> misc_feature <222> (690)..(695) <223> Kozak <220> <221> CDS <222> (696)..(3704) <223> hCDKL5-2GS <220> <221> misc_feature <222> (3719)..(4306) <223> WRPE <220> <221> polyA_signal <222> (4324)..(4562) <223> SV40 polyA <220> <221> misc_feature <222> (4590)..(4628) <223> AAV2 seq usptream of 3'ITR <220> <221> repeat_region <222> (4628)..(4757) <223> 3'ITR <400> 5 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatcc tctagaacta tagctagcat gcctgcagag ggccctgcgt atgagtgcaa 240 gtgggtttta ggaccaggat gaggcggggt gggggtgcct acctgacgac cgaccccgac 300 ccactggaca agcacccaac ccccattccc caaattgcgc atcccctatc agagaggggg 360 aggggaaaca ggatgcggcg aggcgcgtgc gcactgccag cttcagcacc gcggacagtg 420 ccttcgcccc cgcctggcgg cgcgcgccac cgccgcctca gcactgaagg cgcgctgacg 480 tcactcgccg gtcccccgca aactcccctt cccggccacc ttggtcgcgt ccgcgccgcc 540 gccggcccag ccggaccgca ccacgcgagg cgcgagatag gggggcacgg gcgcgaccat 600 ctgcgctgcg gcgccggcga ctcagcgctg cctcagtctg cggtgggcag cggaggagtc 660 gtgtcgtgcc tgagagcgca gtcgaattcg ccacc atg aag atc ccc aat atc 713 Met Lys Ile Pro Asn Ile 1 5 ggc aac gtg atg aat aag ttc gag atc ctg gga gtg gtg gga gag gga 761 Gly Asn Val Met Asn Lys Phe Glu Ile Leu Gly Val Val Gly Glu Gly 10 15 20 gca tac ggc gtg gtg ctg aag tgc aga cac aag gag aca cac gag atc 809 Ala Tyr Gly Val Val Leu Lys Cys Arg His Lys Glu Thr His Glu Ile 25 30 35 gtg gcc atc aag aag ttt aag gat agc gag gag aat gag gag gtg aag 857 Val Ala Ile Lys Lys Phe Lys Asp Ser Glu Glu Asn Glu Glu Val Lys 40 45 50 gag aca acc ctg cgc gag ctg aag atg ctg cgg aca ctg aag cag gag 905 Glu Thr Thr Leu Arg Glu Leu Lys Met Leu Arg Thr Leu Lys Gln Glu 55 60 65 70 aac atc gtg gag ctg aag gag gcc ttc cgg aga agg ggc aag ctg tac 953 Asn Ile Val Glu Leu Lys Glu Ala Phe Arg Arg Arg Gly Lys Leu Tyr 75 80 85 ctg gtg ttt gag tac gtg gag aag aac atg ctg gag ctg ctg gag gag 1001 Leu Val Phe Glu Tyr Val Glu Lys Asn Met Leu Glu Leu Leu Glu Glu 90 95 100 atg cct aat ggc gtg ccc cct gag aag gtg aag agc tac atc tat cag 1049 Met Pro Asn Gly Val Pro Pro Glu Lys Val Lys Ser Tyr Ile Tyr Gln 105 110 115 ctg atc aag gcc atc cac tgg tgc cac aag aac gac atc gtg cac cgc 1097 Leu Ile Lys Ala Ile His Trp Cys His Lys Asn Asp Ile Val His Arg 120 125 130 gat atc aag cca gag aac ctg ctg atc agc cac aat gac gtg ctg aag 1145 Asp Ile Lys Pro Glu Asn Leu Leu Ile Ser His Asn Asp Val Leu Lys 135 140 145 150 ctg tgc gat ttc ggc ttt gcc cgg aac ctg tcc gag ggc aac aac gcc 1193 Leu Cys Asp Phe Gly Phe Ala Arg Asn Leu Ser Glu Gly Asn Asn Ala 155 160 165 aat tac aca gag tac gtg gca acc agg tgg tac cgg tcc cct gag ctg 1241 Asn Tyr Thr Glu Tyr Val Ala Thr Arg Trp Tyr Arg Ser Pro Glu Leu 170 175 180 ctg ctg gga gca cca tac ggc aag tct gtg gac atg tgg agc gtg ggc 1289 Leu Leu Gly Ala Pro Tyr Gly Lys Ser Val Asp Met Trp Ser Val Gly 185 190 195 tgc atc ctg gga gag ctg tcc gac gga cag cca ctg ttc cct ggc gag 1337 Cys Ile Leu Gly Glu Leu Ser Asp Gly Gln Pro Leu Phe Pro Gly Glu 200 205 210 tct gag atc gat cag ctg ttt acc atc cag aag gtg ctg ggc ccc ctg 1385 Ser Glu Ile Asp Gln Leu Phe Thr Ile Gln Lys Val Leu Gly Pro Leu 215 220 225 230 cct tcc gag cag atg aag ctg ttc tac tct aac cca agg ttc cac ggc 1433 Pro Ser Glu Gln Met Lys Leu Phe Tyr Ser Asn Pro Arg Phe His Gly 235 240 245 ctg agg ttt cca gcc gtg aat cac ccc cag tct ctg gag cgc cgg tat 1481 Leu Arg Phe Pro Ala Val Asn His Pro Gln Ser Leu Glu Arg Arg Tyr 250 255 260 ctg ggc atc ctg aac agc gtg ctg ctg gat ctg atg aag aat ctg ctg 1529 Leu Gly Ile Leu Asn Ser Val Leu Leu Asp Leu Met Lys Asn Leu Leu 265 270 275 aag ctg gac cct gcc gat cgc tac ctg acc gag cag tgt ctg aat cac 1577 Lys Leu Asp Pro Ala Asp Arg Tyr Leu Thr Glu Gln Cys Leu Asn His 280 285 290 cca aca ttt cag acc cag aga ctg ctg gac agg agc ccc tcc cgc tct 1625 Pro Thr Phe Gln Thr Gln Arg Leu Leu Asp Arg Ser Pro Ser Arg Ser 295 300 305 310 gcc aag agg aag cct tat cac gtg gag agc tcc acc ctg agc aat cgc 1673 Ala Lys Arg Lys Pro Tyr His Val Glu Ser Ser Thr Leu Ser Asn Arg 315 320 325 aac cag gcc ggc aag tcc aca gcc ctg cag tct cac cac cgg agc aac 1721 Asn Gln Ala Gly Lys Ser Thr Ala Leu Gln Ser His His Arg Ser Asn 330 335 340 tcc aag gac atc cag aat ctg agc gtg ggc ctg cca agg gca gac gag 1769 Ser Lys Asp Ile Gln Asn Leu Ser Val Gly Leu Pro Arg Ala Asp Glu 345 350 355 ggc ctg cct gcc aac gag tcc ttc ctg aat gga aac ctg gca gga gcc 1817 Gly Leu Pro Ala Asn Glu Ser Phe Leu Asn Gly Asn Leu Ala Gly Ala 360 365 370 tct ctg agc cca ctg cac aca aag acc tac cag gcc tct agc cag cct 1865 Ser Leu Ser Pro Leu His Thr Lys Thr Tyr Gln Ala Ser Ser Gln Pro 375 380 385 390 ggc tcc aca tct aag gac ctg acc aac aat aac atc cct cac ctg ctg 1913 Gly Ser Thr Ser Lys Asp Leu Thr Asn Asn Asn Ile Pro His Leu Leu 395 400 405 agc cca aag gag gcc aag tcc aag acc gag ttc gac ttt aat atc gat 1961 Ser Pro Lys Glu Ala Lys Ser Lys Thr Glu Phe Asp Phe Asn Ile Asp 410 415 420 cca aag ccc agc gag ggc cca ggc aca aag tat ctg aag agc aac tcc 2009 Pro Lys Pro Ser Glu Gly Pro Gly Thr Lys Tyr Leu Lys Ser Asn Ser 425 430 435 aga tct cag cag aat agg cac tct ttc atg gag tcc tct cag agc aag 2057 Arg Ser Gln Gln Asn Arg His Ser Phe Met Glu Ser Ser Gln Ser Lys 440 445 450 gcc ggc acc ctg cag ccc aac gag aag cag agc agg cac tcc tac atc 2105 Ala Gly Thr Leu Gln Pro Asn Glu Lys Gln Ser Arg His Ser Tyr Ile 455 460 465 470 gat acc atc cca cag agc tcc cgc agc ccc tcc tat cgg aca aag gcc 2153 Asp Thr Ile Pro Gln Ser Ser Arg Ser Pro Ser Tyr Arg Thr Lys Ala 475 480 485 aag agc cac ggc gcc ctg tct gac agc aag tcc gtg tct aat ctg tcc 2201 Lys Ser His Gly Ala Leu Ser Asp Ser Lys Ser Val Ser Asn Leu Ser 490 495 500 gag gca aga gca cag atc gca gag cca agc acc tcc agg tac ttt ccc 2249 Glu Ala Arg Ala Gln Ile Ala Glu Pro Ser Thr Ser Arg Tyr Phe Pro 505 510 515 tct tcc tgt ctg gac ctg aac tct cca aca agc cct aca cca acc aga 2297 Ser Ser Cys Leu Asp Leu Asn Ser Pro Thr Ser Pro Thr Pro Thr Arg 520 525 530 cac agc gat aca agg acc ctg ctg tct ccc agc ggc aga aat aac agg 2345 His Ser Asp Thr Arg Thr Leu Leu Ser Pro Ser Gly Arg Asn Asn Arg 535 540 545 550 aac gag ggc acc ctg gat agc aga agg acc aca acc aga cac tcc aag 2393 Asn Glu Gly Thr Leu Asp Ser Arg Arg Thr Thr Thr Arg His Ser Lys 555 560 565 aca atg gag gag ctg aag ctg ccc gag cac atg gac tcc tct cac tcc 2441 Thr Met Glu Glu Leu Lys Leu Pro Glu His Met Asp Ser Ser His Ser 570 575 580 cac tct ctg agc gcc cct cac gag tcc ttc tct tac ggc ctg ggc tat 2489 His Ser Leu Ser Ala Pro His Glu Ser Phe Ser Tyr Gly Leu Gly Tyr 585 590 595 acc agc cct ttt agc tcc cag cag cgc cca cac agg cac tcc atg tac 2537 Thr Ser Pro Phe Ser Ser Gln Gln Arg Pro His Arg His Ser Met Tyr 600 605 610 gtg aca aga gac aag gtg agg gcc aag ggc ctg gac ggc agc ctg tcc 2585 Val Thr Arg Asp Lys Val Arg Ala Lys Gly Leu Asp Gly Ser Leu Ser 615 620 625 630 atc gga cag gga atg gca gca agg gca aat agc ctg cag ctg ctg tcc 2633 Ile Gly Gln Gly Met Ala Ala Arg Ala Asn Ser Leu Gln Leu Leu Ser 635 640 645 cca cag cct gga gag cag ctg cca cca gag atg acc gtg gcc aga tct 2681 Pro Gln Pro Gly Glu Gln Leu Pro Pro Glu Met Thr Val Ala Arg Ser 650 655 660 agc gtg aag gag aca agc agg gag ggc acc tcc tct ttc cac aca aga 2729 Ser Val Lys Glu Thr Ser Arg Glu Gly Thr Ser Ser Phe His Thr Arg 665 670 675 cag aag agc gag ggc ggc gtg tat cac gac cca cac tcc gac gac gga 2777 Gln Lys Ser Glu Gly Gly Val Tyr His Asp Pro His Ser Asp Asp Gly 680 685 690 acc gca ccc aag gag aac agg cac ctg tac aac gat cca gtg ccc cgc 2825 Thr Ala Pro Lys Glu Asn Arg His Leu Tyr Asn Asp Pro Val Pro Arg 695 700 705 710 cgg gtg ggc tct ttc tat cgg gtg cct agc cca cgg ccc gac aac tcc 2873 Arg Val Gly Ser Phe Tyr Arg Val Pro Ser Pro Arg Pro Asp Asn Ser 715 720 725 ttt cac gag aat aac gtg tct acc aga gtg agc tcc ctg cct agc gag 2921 Phe His Glu Asn Asn Val Ser Thr Arg Val Ser Ser Leu Pro Ser Glu 730 735 740 tct agc tcc ggc aca aac cac tcc aag agg cag cca gcc ttt gat ccc 2969 Ser Ser Ser Gly Thr Asn His Ser Lys Arg Gln Pro Ala Phe Asp Pro 745 750 755 tgg aag tct cct gag aat atc tct cac agc gag cag ctg aag gag aag 3017 Trp Lys Ser Pro Glu Asn Ile Ser His Ser Glu Gln Leu Lys Glu Lys 760 765 770 gag aag cag ggc ttc ttt cgc agc atg aag aag aag aag aag aag agc 3065 Glu Lys Gln Gly Phe Phe Arg Ser Met Lys Lys Lys Lys Lys Lys Ser 775 780 785 790 cag aca acc gac agc acc aac ggc gag aat cct agc atc aag aag tcc 3113 Gln Thr Thr Asp Ser Thr Asn Gly Glu Asn Pro Ser Ile Lys Lys Ser 795 800 805 ctg ttc cca ctg ttt aac tcc aag aat cac ctg aag cac tct agc tcc 3161 Leu Phe Pro Leu Phe Asn Ser Lys Asn His Leu Lys His Ser Ser Ser 810 815 820 ctg aag aag ctg ccc gtg gtg aca cct cca atg gtg ccc aat tcc gac 3209 Leu Lys Lys Leu Pro Val Val Thr Pro Pro Met Val Pro Asn Ser Asp 825 830 835 tct cct gat ctg ctg acc ctg cag aag agc atc cac agc gcc tcc aca 3257 Ser Pro Asp Leu Leu Thr Leu Gln Lys Ser Ile His Ser Ala Ser Thr 840 845 850 cca tct agc aga ccc aag gag tgg agg cca gag aag atc tcc gat ctg 3305 Pro Ser Ser Arg Pro Lys Glu Trp Arg Pro Glu Lys Ile Ser Asp Leu 855 860 865 870 cag acc cag tcc cag ccc ctg aag tct ctg cgg aag ctg ctg cac ctg 3353 Gln Thr Gln Ser Gln Pro Leu Lys Ser Leu Arg Lys Leu Leu His Leu 875 880 885 tcc tct gcc agc aac cac cct gca agc tcc gac cct agg ttc cag cca 3401 Ser Ser Ala Ser Asn His Pro Ala Ser Ser Asp Pro Arg Phe Gln Pro 890 895 900 ctg aca gcc cag cag acc aag aac tct ttt agc gag atc aga atc cac 3449 Leu Thr Ala Gln Gln Thr Lys Asn Ser Phe Ser Glu Ile Arg Ile His 905 910 915 cca ctg tcc cag gcc tct gga ggc tct agc aac atc cgc cag gag cct 3497 Pro Leu Ser Gln Ala Ser Gly Gly Ser Ser Asn Ile Arg Gln Glu Pro 920 925 930 gcc cca aag ggc cgg cca gcc ctg cag ctg cca gga cag atg gac ccc 3545 Ala Pro Lys Gly Arg Pro Ala Leu Gln Leu Pro Gly Gln Met Asp Pro 935 940 945 950 ggc tgg cac gtg tcc tct gtg aca aga tcc gcc acc gag gga cca tcc 3593 Gly Trp His Val Ser Ser Val Thr Arg Ser Ala Thr Glu Gly Pro Ser 955 960 965 tac tct gag cag ctg gga gca aag tct gga cca aac gga cac cct tat 3641 Tyr Ser Glu Gln Leu Gly Ala Lys Ser Gly Pro Asn Gly His Pro Tyr 970 975 980 aac agg acc aat aga tcc agg atg cct aat ctg aac gac ctg aag gag 3689 Asn Arg Thr Asn Arg Ser Arg Met Pro Asn Leu Asn Asp Leu Lys Glu 985 990 995 aca gcc ctg tga tag aagcttatcg ataatcaacc tctggattac aaaatttgtg 3744 Thr Ala Leu 1000 aaagattgac tggtattctt aactatgttg ctccttttac gctatgtgga tacgctgctt 3804 taatgccttt gtatcatgct attgcttccc gtatggcttt cattttctcc tccttgtata 3864 aatcctggtt gctgtctctt tatgaggagt tgtggcccgt tgtcaggcaa cgtggcgtgg 3924 tgtgcactgt gtttgctgac gcaaccccca ctggttgggg cattgccacc acctgtcagc 3984 tcctttccgg gactttcgct ttccccctcc ctattgccac ggcggaactc atcgccgcct 4044 gccttgcccg ctgctggaca ggggctcggc tgttgggcac tgacaattcc gtggtgttgt 4104 cggggaaatc atcgtccttt ccttggctgc tcgcctgtgt tgccacctgg attctgcgcg 4164 ggacgtcctt ctgctacgtc ccttcggccc tcaatccagc ggaccttcct tcccgcggcc 4224 tgctgccggc tctgcggcct cttccgcgtc ttcgccttcg ccctcagacg agtcggatct 4284 ccctttgggc cgcctccccg catcgatacc gtcgatcgag gccgcttcga gcagacatga 4344 taagatacat tgatgagttt ggacaaacca caactagaat gcagtgaaaa aaatgcttta 4404 tttgtgaaat ttgtgatgct attgctttat ttgtaaccat tataagctgc aataaacaag 4464 ttaacaacaa caattgcatt cattttatgt ttcaggttca gggggagatg tgggaggttt 4524 tttaaagcaa gtaaaacctc tacaaatgtg gtaaaatcga taaggatctt cctagagcat 4584 ggctacgtag ataagtagca tggcgggtta atcattaact acaaggaacc cctagtgatg 4644 gagttggcca ctccctctct gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc 4704 gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg agcgagcgcg cag 4757 <210> 6 <211> 1001 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 6 Met Lys Ile Pro Asn Ile Gly Asn Val Met Asn Lys Phe Glu Ile Leu 1 5 10 15 Gly Val Val Gly Glu Gly Ala Tyr Gly Val Val Leu Lys Cys Arg His 20 25 30 Lys Glu Thr His Glu Ile Val Ala Ile Lys Lys Phe Lys Asp Ser Glu 35 40 45 Glu Asn Glu Glu Val Lys Glu Thr Thr Leu Arg Glu Leu Lys Met Leu 50 55 60 Arg Thr Leu Lys Gln Glu Asn Ile Val Glu Leu Lys Glu Ala Phe Arg 65 70 75 80 Arg Arg Gly Lys Leu Tyr Leu Val Phe Glu Tyr Val Glu Lys Asn Met 85 90 95 Leu Glu Leu Leu Glu Glu Met Pro Asn Gly Val Pro Pro Glu Lys Val 100 105 110 Lys Ser Tyr Ile Tyr Gln Leu Ile Lys Ala Ile His Trp Cys His Lys 115 120 125 Asn Asp Ile Val His Arg Asp Ile Lys Pro Glu Asn Leu Leu Ile Ser 130 135 140 His Asn Asp Val Leu Lys Leu Cys Asp Phe Gly Phe Ala Arg Asn Leu 145 150 155 160 Ser Glu Gly Asn Asn Ala Asn Tyr Thr Glu Tyr Val Ala Thr Arg Trp 165 170 175 Tyr Arg Ser Pro Glu Leu Leu Leu Gly Ala Pro Tyr Gly Lys Ser Val 180 185 190 Asp Met Trp Ser Val Gly Cys Ile Leu Gly Glu Leu Ser Asp Gly Gln 195 200 205 Pro Leu Phe Pro Gly Glu Ser Glu Ile Asp Gln Leu Phe Thr Ile Gln 210 215 220 Lys Val Leu Gly Pro Leu Pro Ser Glu Gln Met Lys Leu Phe Tyr Ser 225 230 235 240 Asn Pro Arg Phe His Gly Leu Arg Phe Pro Ala Val Asn His Pro Gln 245 250 255 Ser Leu Glu Arg Arg Tyr Leu Gly Ile Leu Asn Ser Val Leu Leu Asp 260 265 270 Leu Met Lys Asn Leu Leu Lys Leu Asp Pro Ala Asp Arg Tyr Leu Thr 275 280 285 Glu Gln Cys Leu Asn His Pro Thr Phe Gln Thr Gln Arg Leu Leu Asp 290 295 300 Arg Ser Pro Ser Arg Ser Ala Lys Arg Lys Pro Tyr His Val Glu Ser 305 310 315 320 Ser Thr Leu Ser Asn Arg Asn Gln Ala Gly Lys Ser Thr Ala Leu Gln 325 330 335 Ser His His Arg Ser Asn Ser Lys Asp Ile Gln Asn Leu Ser Val Gly 340 345 350 Leu Pro Arg Ala Asp Glu Gly Leu Pro Ala Asn Glu Ser Phe Leu Asn 355 360 365 Gly Asn Leu Ala Gly Ala Ser Leu Ser Pro Leu His Thr Lys Thr Tyr 370 375 380 Gln Ala Ser Ser Gln Pro Gly Ser Thr Ser Lys Asp Leu Thr Asn Asn 385 390 395 400 Asn Ile Pro His Leu Leu Ser Pro Lys Glu Ala Lys Ser Lys Thr Glu 405 410 415 Phe Asp Phe Asn Ile Asp Pro Lys Pro Ser Glu Gly Pro Gly Thr Lys 420 425 430 Tyr Leu Lys Ser Asn Ser Arg Ser Gln Gln Asn Arg His Ser Phe Met 435 440 445 Glu Ser Ser Gln Ser Lys Ala Gly Thr Leu Gln Pro Asn Glu Lys Gln 450 455 460 Ser Arg His Ser Tyr Ile Asp Thr Ile Pro Gln Ser Ser Arg Ser Pro 465 470 475 480 Ser Tyr Arg Thr Lys Ala Lys Ser His Gly Ala Leu Ser Asp Ser Lys 485 490 495 Ser Val Ser Asn Leu Ser Glu Ala Arg Ala Gln Ile Ala Glu Pro Ser 500 505 510 Thr Ser Arg Tyr Phe Pro Ser Ser Cys Leu Asp Leu Asn Ser Pro Thr 515 520 525 Ser Pro Thr Pro Thr Arg His Ser Asp Thr Arg Thr Leu Leu Ser Pro 530 535 540 Ser Gly Arg Asn Asn Arg Asn Glu Gly Thr Leu Asp Ser Arg Arg Thr 545 550 555 560 Thr Thr Arg His Ser Lys Thr Met Glu Glu Leu Lys Leu Pro Glu His 565 570 575 Met Asp Ser Ser His Ser His Ser Leu Ser Ala Pro His Glu Ser Phe 580 585 590 Ser Tyr Gly Leu Gly Tyr Thr Ser Pro Phe Ser Ser Gln Gln Arg Pro 595 600 605 His Arg His Ser Met Tyr Val Thr Arg Asp Lys Val Arg Ala Lys Gly 610 615 620 Leu Asp Gly Ser Leu Ser Ile Gly Gln Gly Met Ala Ala Arg Ala Asn 625 630 635 640 Ser Leu Gln Leu Leu Ser Pro Gln Pro Gly Glu Gln Leu Pro Pro Glu 645 650 655 Met Thr Val Ala Arg Ser Ser Val Lys Glu Thr Ser Arg Glu Gly Thr 660 665 670 Ser Ser Phe His Thr Arg Gln Lys Ser Glu Gly Gly Val Tyr His Asp 675 680 685 Pro His Ser Asp Asp Gly Thr Ala Pro Lys Glu Asn Arg His Leu Tyr 690 695 700 Asn Asp Pro Val Pro Arg Arg Val Gly Ser Phe Tyr Arg Val Pro Ser 705 710 715 720 Pro Arg Pro Asp Asn Ser Phe His Glu Asn Asn Val Ser Thr Arg Val 725 730 735 Ser Ser Leu Pro Ser Glu Ser Ser Ser Gly Thr Asn His Ser Lys Arg 740 745 750 Gln Pro Ala Phe Asp Pro Trp Lys Ser Pro Glu Asn Ile Ser His Ser 755 760 765 Glu Gln Leu Lys Glu Lys Glu Lys Gln Gly Phe Phe Arg Ser Met Lys 770 775 780 Lys Lys Lys Lys Lys Ser Gln Thr Thr Asp Ser Thr Asn Gly Glu Asn 785 790 795 800 Pro Ser Ile Lys Lys Ser Leu Phe Pro Leu Phe Asn Ser Lys Asn His 805 810 815 Leu Lys His Ser Ser Ser Leu Lys Lys Leu Pro Val Val Thr Pro Pro 820 825 830 Met Val Pro Asn Ser Asp Ser Pro Asp Leu Leu Thr Leu Gln Lys Ser 835 840 845 Ile His Ser Ala Ser Thr Pro Ser Ser Arg Pro Lys Glu Trp Arg Pro 850 855 860 Glu Lys Ile Ser Asp Leu Gln Thr Gln Ser Gln Pro Leu Lys Ser Leu 865 870 875 880 Arg Lys Leu Leu His Leu Ser Ser Ala Ser Asn His Pro Ala Ser Ser 885 890 895 Asp Pro Arg Phe Gln Pro Leu Thr Ala Gln Gln Thr Lys Asn Ser Phe 900 905 910 Ser Glu Ile Arg Ile His Pro Leu Ser Gln Ala Ser Gly Gly Ser Ser 915 920 925 Asn Ile Arg Gln Glu Pro Ala Pro Lys Gly Arg Pro Ala Leu Gln Leu 930 935 940 Pro Gly Gln Met Asp Pro Gly Trp His Val Ser Ser Val Thr Arg Ser 945 950 955 960 Ala Thr Glu Gly Pro Ser Tyr Ser Glu Gln Leu Gly Ala Lys Ser Gly 965 970 975 Pro Asn Gly His Pro Tyr Asn Arg Thr Asn Arg Ser Arg Met Pro Asn 980 985 990 Leu Asn Asp Leu Lys Glu Thr Ala Leu 995 1000 <210> 7 <211> 4583 <212> DNA <213> Artificial Sequence <220> <223> Expression Cassette <220> <221> repeat_region <222> (1)..(130) <223> 5'ITR <220> <221> misc_feature <222> (130)..(168) <223> AAV2 seq upstream of 3'ITR <220> <221> promoter <222> (213)..(678) <223> hSynapsin <220> <221> misc_feature <222> (690)..(695) <223> Kozak <220> <221> CDS <222> (696)..(3530) <223> hCDKL5-3GS <220> <221> misc_feature <222> (3545)..(4132) <223> WRPE <220> <221> polyA_signal <222> (4150)..(4388) <223> SV40 polyA <220> <221> misc_feature <222> (4416)..(4454) <223> AAV2 seq upstream of 3'ITR <220> <221> repeat_region <222> (4454)..(4583) <223> 3'ITR <400> 7 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatcc tctagaacta tagctagcat gcctgcagag ggccctgcgt atgagtgcaa 240 gtgggtttta ggaccaggat gaggcggggt gggggtgcct acctgacgac cgaccccgac 300 ccactggaca agcacccaac ccccattccc caaattgcgc atcccctatc agagaggggg 360 aggggaaaca ggatgcggcg aggcgcgtgc gcactgccag cttcagcacc gcggacagtg 420 ccttcgcccc cgcctggcgg cgcgcgccac cgccgcctca gcactgaagg cgcgctgacg 480 tcactcgccg gtcccccgca aactcccctt cccggccacc ttggtcgcgt ccgcgccgcc 540 gccggcccag ccggaccgca ccacgcgagg cgcgagatag gggggcacgg gcgcgaccat 600 ctgcgctgcg gcgccggcga ctcagcgctg cctcagtctg cggtgggcag cggaggagtc 660 gtgtcgtgcc tgagagcgca gtcgaattcg ccacc atg aag atc ccc aat atc 713 Met Lys Ile Pro Asn Ile 1 5 ggc aac gtg atg aat aag ttc gag atc ctg gga gtg gtg gga gag gga 761 Gly Asn Val Met Asn Lys Phe Glu Ile Leu Gly Val Val Gly Glu Gly 10 15 20 gca tac gga gtg gtg ctg aag tgc cgg cac aag gag aca cac gag atc 809 Ala Tyr Gly Val Val Leu Lys Cys Arg His Lys Glu Thr His Glu Ile 25 30 35 gtg gcc atc aag aag ttt aag gat agc gag gag aat gag gag gtg aag 857 Val Ala Ile Lys Lys Phe Lys Asp Ser Glu Glu Asn Glu Glu Val Lys 40 45 50 gag aca acc ctg agg gag ctg aag atg ctg cgc aca ctg aag cag gag 905 Glu Thr Thr Leu Arg Glu Leu Lys Met Leu Arg Thr Leu Lys Gln Glu 55 60 65 70 aac atc gtg gag ctg aag gag gcc ttc cgg aga agg ggc aag ctg tac 953 Asn Ile Val Glu Leu Lys Glu Ala Phe Arg Arg Arg Gly Lys Leu Tyr 75 80 85 ctg gtg ttt gag tac gtg gag aag aac atg ctg gag ctg ctg gag gag 1001 Leu Val Phe Glu Tyr Val Glu Lys Asn Met Leu Glu Leu Leu Glu Glu 90 95 100 atg cct aat ggc gtg ccc cct gag aag gtg aag agc tac atc tat cag 1049 Met Pro Asn Gly Val Pro Pro Glu Lys Val Lys Ser Tyr Ile Tyr Gln 105 110 115 ctg atc aag gcc atc cac tgg tgc cac aag aac gac atc gtg cac agg 1097 Leu Ile Lys Ala Ile His Trp Cys His Lys Asn Asp Ile Val His Arg 120 125 130 gat atc aag cca gag aac ctg ctg atc agc cac aat gac gtg ctg aag 1145 Asp Ile Lys Pro Glu Asn Leu Leu Ile Ser His Asn Asp Val Leu Lys 135 140 145 150 ctg tgc gat ttc ggc ttt gcc cgc aac ctg tcc gag ggc aac aac gcc 1193 Leu Cys Asp Phe Gly Phe Ala Arg Asn Leu Ser Glu Gly Asn Asn Ala 155 160 165 aat tac aca gag tac gtg gca acc agg tgg tac cgg tcc cca gag ctg 1241 Asn Tyr Thr Glu Tyr Val Ala Thr Arg Trp Tyr Arg Ser Pro Glu Leu 170 175 180 ctg ctg gga gca cca tac ggc aag agc gtg gac atg tgg tcc gtg ggc 1289 Leu Leu Gly Ala Pro Tyr Gly Lys Ser Val Asp Met Trp Ser Val Gly 185 190 195 tgc atc ctg ggc gag ctg tct gac ggc cag cct ctg ttc cca ggc gag 1337 Cys Ile Leu Gly Glu Leu Ser Asp Gly Gln Pro Leu Phe Pro Gly Glu 200 205 210 agc gag atc gat cag ctg ttt acc atc cag aag gtg ctg ggc cct ctg 1385 Ser Glu Ile Asp Gln Leu Phe Thr Ile Gln Lys Val Leu Gly Pro Leu 215 220 225 230 cca agc gag cag atg aag ctg ttc tac tcc aac cct agg ttc cac ggc 1433 Pro Ser Glu Gln Met Lys Leu Phe Tyr Ser Asn Pro Arg Phe His Gly 235 240 245 ctg cgc ttt ccc gcc gtg aat cac cct cag agc ctg gag cgc cgg tat 1481 Leu Arg Phe Pro Ala Val Asn His Pro Gln Ser Leu Glu Arg Arg Tyr 250 255 260 ctg ggc atc ctg aac tcc gtg ctg ctg gat ctg atg aag aat ctg ctg 1529 Leu Gly Ile Leu Asn Ser Val Leu Leu Asp Leu Met Lys Asn Leu Leu 265 270 275 aag ctg gac ccc gcc gat agg tac ctg acc gag cag tgt ctg aac cac 1577 Lys Leu Asp Pro Ala Asp Arg Tyr Leu Thr Glu Gln Cys Leu Asn His 280 285 290 ccc aca ttc cag acc cag aga ctg ctg gac agg tcc cct tct cgc aat 1625 Pro Thr Phe Gln Thr Gln Arg Leu Leu Asp Arg Ser Pro Ser Arg Asn 295 300 305 310 cag gcc ggc aag tct aca gcc ctg cag agc cac cac agg agc aac tcc 1673 Gln Ala Gly Lys Ser Thr Ala Leu Gln Ser His His Arg Ser Asn Ser 315 320 325 aag gac atc cag aat ctg agc gtg ggc ctg cct agg gca gac gag ggc 1721 Lys Asp Ile Gln Asn Leu Ser Val Gly Leu Pro Arg Ala Asp Glu Gly 330 335 340 ctg cca gca aac gag tcc ttt ctg aat gga aac ctg gca gga gcc tct 1769 Leu Pro Ala Asn Glu Ser Phe Leu Asn Gly Asn Leu Ala Gly Ala Ser 345 350 355 ctg agc cca ctg cac aca aag acc tac cag gcc agc tcc cag cca ggc 1817 Leu Ser Pro Leu His Thr Lys Thr Tyr Gln Ala Ser Ser Gln Pro Gly 360 365 370 tcc aca tct aag gat ctg acc aac aat aac atc cca cac ctg ctg tct 1865 Ser Thr Ser Lys Asp Leu Thr Asn Asn Asn Ile Pro His Leu Leu Ser 375 380 385 390 ccc aag gag gcc aag agc aag acc gag ttc gac ttt aat atc gat ccc 1913 Pro Lys Glu Ala Lys Ser Lys Thr Glu Phe Asp Phe Asn Ile Asp Pro 395 400 405 aag cct agc gag ggc cca ggc aca aag tat ctg aag agc aac tcc cgg 1961 Lys Pro Ser Glu Gly Pro Gly Thr Lys Tyr Leu Lys Ser Asn Ser Arg 410 415 420 agc cag cag aat aga cac tcc ttc atg gag tct agc cag tct aag gcc 2009 Ser Gln Gln Asn Arg His Ser Phe Met Glu Ser Ser Gln Ser Lys Ala 425 430 435 ggc acc ctg cag ccc aac gag aag cag agc cgc cac tcc tac atc gat 2057 Gly Thr Leu Gln Pro Asn Glu Lys Gln Ser Arg His Ser Tyr Ile Asp 440 445 450 acc atc ccc cag tcc tct agg agc cct tcc tat cgc aca aag gcc aag 2105 Thr Ile Pro Gln Ser Ser Arg Ser Pro Ser Tyr Arg Thr Lys Ala Lys 455 460 465 470 agc cac ggc gcc ctg tct gac agc aag tcc gtg tct aat ctg tcc gag 2153 Ser His Gly Ala Leu Ser Asp Ser Lys Ser Val Ser Asn Leu Ser Glu 475 480 485 gca agg gca cag atc gca gag ccc agc acc tcc aga tac ttt cct agc 2201 Ala Arg Ala Gln Ile Ala Glu Pro Ser Thr Ser Arg Tyr Phe Pro Ser 490 495 500 tcc tgt ctg gac ctg aac tct cca aca agc cca aca ccc acc cgg cac 2249 Ser Cys Leu Asp Leu Asn Ser Pro Thr Ser Pro Thr Pro Thr Arg His 505 510 515 agc gat aca aga acc ctg ctg tct ccc agc ggc aga aat aac agg aac 2297 Ser Asp Thr Arg Thr Leu Leu Ser Pro Ser Gly Arg Asn Asn Arg Asn 520 525 530 gag ggc acc ctg gat tct aga agg acc aca acc cgg cac agc aag aca 2345 Glu Gly Thr Leu Asp Ser Arg Arg Thr Thr Thr Arg His Ser Lys Thr 535 540 545 550 atg gag gag ctg aag ctg ccc gag cac atg gac tct agc cac tcc cac 2393 Met Glu Glu Leu Lys Leu Pro Glu His Met Asp Ser Ser His Ser His 555 560 565 tct ctg agc gcc cct cac gag tcc ttc tct tac ggc ctg ggc tat acc 2441 Ser Leu Ser Ala Pro His Glu Ser Phe Ser Tyr Gly Leu Gly Tyr Thr 570 575 580 tcc cca ttt tcc tct caa cag cgc ccc cac cgg cac tct atg tac gtg 2489 Ser Pro Phe Ser Ser Gln Gln Arg Pro His Arg His Ser Met Tyr Val 585 590 595 aca cgg gac aag gtg aga gcc aag ggc ctg gac ggc agc ctg tcc atc 2537 Thr Arg Asp Lys Val Arg Ala Lys Gly Leu Asp Gly Ser Leu Ser Ile 600 605 610 gga cag gga atg gca gca aga gca aac tcc ctg cag ctg ctg tct cct 2585 Gly Gln Gly Met Ala Ala Arg Ala Asn Ser Leu Gln Leu Leu Ser Pro 615 620 625 630 cag cca gga gag cag ctg cca cca gag atg acc gtg gca cgg agc tcc 2633 Gln Pro Gly Glu Gln Leu Pro Pro Glu Met Thr Val Ala Arg Ser Ser 635 640 645 gtg aag gag aca agc aga gag ggc acc tct agc ttc cac aca cgg cag 2681 Val Lys Glu Thr Ser Arg Glu Gly Thr Ser Ser Phe His Thr Arg Gln 650 655 660 aag tcc gag ggc ggc gtg tat cac gac cct cac tct gac gac ggc acc 2729 Lys Ser Glu Gly Gly Val Tyr His Asp Pro His Ser Asp Asp Gly Thr 665 670 675 gcc cca aag gag aac aga cac ctg tac aac gat cca gtg cct agg agg 2777 Ala Pro Lys Glu Asn Arg His Leu Tyr Asn Asp Pro Val Pro Arg Arg 680 685 690 gtg ggc tcc ttc tat cgg gtg cca tct ccc cgc cct gac aat agc ttt 2825 Val Gly Ser Phe Tyr Arg Val Pro Ser Pro Arg Pro Asp Asn Ser Phe 695 700 705 710 cac gag aat aac gtg tcc acc cgg gtg tcc tct ctg ccc tct gag agc 2873 His Glu Asn Asn Val Ser Thr Arg Val Ser Ser Leu Pro Ser Glu Ser 715 720 725 tcc tct ggc aca aac cac tct aag aga cag ccc gcc ttt gac cct tgg 2921 Ser Ser Gly Thr Asn His Ser Lys Arg Gln Pro Ala Phe Asp Pro Trp 730 735 740 aag agc cca gag aat atc tct cac agc gag cag ctg aag gag aag gag 2969 Lys Ser Pro Glu Asn Ile Ser His Ser Glu Gln Leu Lys Glu Lys Glu 745 750 755 aag cag ggc ttc ttt agg agc atg aag aag aag aag aag aag agc cag 3017 Lys Gln Gly Phe Phe Arg Ser Met Lys Lys Lys Lys Lys Lys Ser Gln 760 765 770 acc gtg cct aac tcc gac tct ccc gat ctg ctg acc ctg cag aag agc 3065 Thr Val Pro Asn Ser Asp Ser Pro Asp Leu Leu Thr Leu Gln Lys Ser 775 780 785 790 atc cac agc gcc tcc aca cca agc tcc cgg cct aag gag tgg cgg ccc 3113 Ile His Ser Ala Ser Thr Pro Ser Ser Arg Pro Lys Glu Trp Arg Pro 795 800 805 gag aag atc tcc gat ctg cag acc cag agc cag cca ctg aag tcc ctg 3161 Glu Lys Ile Ser Asp Leu Gln Thr Gln Ser Gln Pro Leu Lys Ser Leu 810 815 820 cgc aag ctg ctg cac ctg tct agc gcc agc aac cac cct gcc tcc tct 3209 Arg Lys Leu Leu His Leu Ser Ser Ala Ser Asn His Pro Ala Ser Ser 825 830 835 gac cca agg ttc cag ccc ctg aca gcc cag cag acc aag aac tct ttt 3257 Asp Pro Arg Phe Gln Pro Leu Thr Ala Gln Gln Thr Lys Asn Ser Phe 840 845 850 agc gag atc cgc atc cac cca ctg tcc caa gcc tct gga ggc agc tcc 3305 Ser Glu Ile Arg Ile His Pro Leu Ser Gln Ala Ser Gly Gly Ser Ser 855 860 865 870 aac atc agg cag gag cca gca cca aag ggc cgc ccc gcc ctg cag ctg 3353 Asn Ile Arg Gln Glu Pro Ala Pro Lys Gly Arg Pro Ala Leu Gln Leu 875 880 885 cct gga cag atg gac ccc gga tgg cac gtg tct agc gtg aca cgg tcc 3401 Pro Gly Gln Met Asp Pro Gly Trp His Val Ser Ser Val Thr Arg Ser 890 895 900 gcc acc gag gga cca tcc tac tct gag cag ctg gga gca aag agc gga 3449 Ala Thr Glu Gly Pro Ser Tyr Ser Glu Gln Leu Gly Ala Lys Ser Gly 905 910 915 cct aac gga cac cca tat aac aga acc aat aga tcc agg atg cct aat 3497 Pro Asn Gly His Pro Tyr Asn Arg Thr Asn Arg Ser Arg Met Pro Asn 920 925 930 ctg aac gac ctg aag gag aca gcc ctg tga tag aagcttatcg ataatcaacc 3550 Leu Asn Asp Leu Lys Glu Thr Ala Leu 935 940 tctggattac aaaatttgtg aaagattgac tggtattctt aactatgttg ctccttttac 3610 gctatgtgga tacgctgctt taatgccttt gtatcatgct attgcttccc gtatggcttt 3670 cattttctcc tccttgtata aatcctggtt gctgtctctt tatgaggagt tgtggcccgt 3730 tgtcaggcaa cgtggcgtgg tgtgcactgt gtttgctgac gcaaccccca ctggttgggg 3790 cattgccacc acctgtcagc tcctttccgg gactttcgct ttccccctcc ctattgccac 3850 ggcggaactc atcgccgcct gccttgcccg ctgctggaca ggggctcggc tgttgggcac 3910 tgacaattcc gtggtgttgt cggggaaatc atcgtccttt ccttggctgc tcgcctgtgt 3970 tgccacctgg attctgcgcg ggacgtcctt ctgctacgtc ccttcggccc tcaatccagc 4030 ggaccttcct tcccgcggcc tgctgccggc tctgcggcct cttccgcgtc ttcgccttcg 4090 ccctcagacg agtcggatct ccctttgggc cgcctccccg catcgatacc gtcgatcgag 4150 gccgcttcga gcagacatga taagatacat tgatgagttt ggacaaacca caactagaat 4210 gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct attgctttat ttgtaaccat 4270 tataagctgc aataaacaag ttaacaacaa caattgcatt cattttatgt ttcaggttca 4330 gggggagatg tgggaggttt tttaaagcaa gtaaaacctc tacaaatgtg gtaaaatcga 4390 taaggatctt cctagagcat ggctacgtag ataagtagca tggcgggtta atcattaact 4450 acaaggaacc cctagtgatg gagttggcca ctccctctct gcgcgctcgc tcgctcactg 4510 aggccgggcg accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg 4570 agcgagcgcg cag 4583 <210> 8 <211> 943 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 8 Met Lys Ile Pro Asn Ile Gly Asn Val Met Asn Lys Phe Glu Ile Leu 1 5 10 15 Gly Val Val Gly Glu Gly Ala Tyr Gly Val Val Leu Lys Cys Arg His 20 25 30 Lys Glu Thr His Glu Ile Val Ala Ile Lys Lys Phe Lys Asp Ser Glu 35 40 45 Glu Asn Glu Glu Val Lys Glu Thr Thr Leu Arg Glu Leu Lys Met Leu 50 55 60 Arg Thr Leu Lys Gln Glu Asn Ile Val Glu Leu Lys Glu Ala Phe Arg 65 70 75 80 Arg Arg Gly Lys Leu Tyr Leu Val Phe Glu Tyr Val Glu Lys Asn Met 85 90 95 Leu Glu Leu Leu Glu Glu Met Pro Asn Gly Val Pro Pro Glu Lys Val 100 105 110 Lys Ser Tyr Ile Tyr Gln Leu Ile Lys Ala Ile His Trp Cys His Lys 115 120 125 Asn Asp Ile Val His Arg Asp Ile Lys Pro Glu Asn Leu Leu Ile Ser 130 135 140 His Asn Asp Val Leu Lys Leu Cys Asp Phe Gly Phe Ala Arg Asn Leu 145 150 155 160 Ser Glu Gly Asn Asn Ala Asn Tyr Thr Glu Tyr Val Ala Thr Arg Trp 165 170 175 Tyr Arg Ser Pro Glu Leu Leu Leu Gly Ala Pro Tyr Gly Lys Ser Val 180 185 190 Asp Met Trp Ser Val Gly Cys Ile Leu Gly Glu Leu Ser Asp Gly Gln 195 200 205 Pro Leu Phe Pro Gly Glu Ser Glu Ile Asp Gln Leu Phe Thr Ile Gln 210 215 220 Lys Val Leu Gly Pro Leu Pro Ser Glu Gln Met Lys Leu Phe Tyr Ser 225 230 235 240 Asn Pro Arg Phe His Gly Leu Arg Phe Pro Ala Val Asn His Pro Gln 245 250 255 Ser Leu Glu Arg Arg Tyr Leu Gly Ile Leu Asn Ser Val Leu Leu Asp 260 265 270 Leu Met Lys Asn Leu Leu Lys Leu Asp Pro Ala Asp Arg Tyr Leu Thr 275 280 285 Glu Gln Cys Leu Asn His Pro Thr Phe Gln Thr Gln Arg Leu Leu Asp 290 295 300 Arg Ser Pro Ser Arg Asn Gln Ala Gly Lys Ser Thr Ala Leu Gln Ser 305 310 315 320 His His Arg Ser Asn Ser Lys Asp Ile Gln Asn Leu Ser Val Gly Leu 325 330 335 Pro Arg Ala Asp Glu Gly Leu Pro Ala Asn Glu Ser Phe Leu Asn Gly 340 345 350 Asn Leu Ala Gly Ala Ser Leu Ser Pro Leu His Thr Lys Thr Tyr Gln 355 360 365 Ala Ser Ser Gln Pro Gly Ser Thr Ser Lys Asp Leu Thr Asn Asn Asn 370 375 380 Ile Pro His Leu Leu Ser Pro Lys Glu Ala Lys Ser Lys Thr Glu Phe 385 390 395 400 Asp Phe Asn Ile Asp Pro Lys Pro Ser Glu Gly Pro Gly Thr Lys Tyr 405 410 415 Leu Lys Ser Asn Ser Arg Ser Gln Gln Asn Arg His Ser Phe Met Glu 420 425 430 Ser Ser Gln Ser Lys Ala Gly Thr Leu Gln Pro Asn Glu Lys Gln Ser 435 440 445 Arg His Ser Tyr Ile Asp Thr Ile Pro Gln Ser Ser Arg Ser Pro Ser 450 455 460 Tyr Arg Thr Lys Ala Lys Ser His Gly Ala Leu Ser Asp Ser Lys Ser 465 470 475 480 Val Ser Asn Leu Ser Glu Ala Arg Ala Gln Ile Ala Glu Pro Ser Thr 485 490 495 Ser Arg Tyr Phe Pro Ser Ser Cys Leu Asp Leu Asn Ser Pro Thr Ser 500 505 510 Pro Thr Pro Thr Arg His Ser Asp Thr Arg Thr Leu Leu Ser Pro Ser 515 520 525 Gly Arg Asn Asn Arg Asn Glu Gly Thr Leu Asp Ser Arg Arg Thr Thr 530 535 540 Thr Arg His Ser Lys Thr Met Glu Glu Leu Lys Leu Pro Glu His Met 545 550 555 560 Asp Ser Ser His Ser His Ser Leu Ser Ala Pro His Glu Ser Phe Ser 565 570 575 Tyr Gly Leu Gly Tyr Thr Ser Pro Phe Ser Ser Gln Gln Arg Pro His 580 585 590 Arg His Ser Met Tyr Val Thr Arg Asp Lys Val Arg Ala Lys Gly Leu 595 600 605 Asp Gly Ser Leu Ser Ile Gly Gln Gly Met Ala Ala Arg Ala Asn Ser 610 615 620 Leu Gln Leu Leu Ser Pro Gln Pro Gly Glu Gln Leu Pro Pro Glu Met 625 630 635 640 Thr Val Ala Arg Ser Ser Val Lys Glu Thr Ser Arg Glu Gly Thr Ser 645 650 655 Ser Phe His Thr Arg Gln Lys Ser Glu Gly Gly Val Tyr His Asp Pro 660 665 670 His Ser Asp Asp Gly Thr Ala Pro Lys Glu Asn Arg His Leu Tyr Asn 675 680 685 Asp Pro Val Pro Arg Arg Val Gly Ser Phe Tyr Arg Val Pro Ser Pro 690 695 700 Arg Pro Asp Asn Ser Phe His Glu Asn Asn Val Ser Thr Arg Val Ser 705 710 715 720 Ser Leu Pro Ser Glu Ser Ser Ser Gly Thr Asn His Ser Lys Arg Gln 725 730 735 Pro Ala Phe Asp Pro Trp Lys Ser Pro Glu Asn Ile Ser His Ser Glu 740 745 750 Gln Leu Lys Glu Lys Glu Lys Gln Gly Phe Phe Arg Ser Met Lys Lys 755 760 765 Lys Lys Lys Lys Ser Gln Thr Val Pro Asn Ser Asp Ser Pro Asp Leu 770 775 780 Leu Thr Leu Gln Lys Ser Ile His Ser Ala Ser Thr Pro Ser Ser Arg 785 790 795 800 Pro Lys Glu Trp Arg Pro Glu Lys Ile Ser Asp Leu Gln Thr Gln Ser 805 810 815 Gln Pro Leu Lys Ser Leu Arg Lys Leu Leu His Leu Ser Ser Ala Ser 820 825 830 Asn His Pro Ala Ser Ser Asp Pro Arg Phe Gln Pro Leu Thr Ala Gln 835 840 845 Gln Thr Lys Asn Ser Phe Ser Glu Ile Arg Ile His Pro Leu Ser Gln 850 855 860 Ala Ser Gly Gly Ser Ser Asn Ile Arg Gln Glu Pro Ala Pro Lys Gly 865 870 875 880 Arg Pro Ala Leu Gln Leu Pro Gly Gln Met Asp Pro Gly Trp His Val 885 890 895 Ser Ser Val Thr Arg Ser Ala Thr Glu Gly Pro Ser Tyr Ser Glu Gln 900 905 910 Leu Gly Ala Lys Ser Gly Pro Asn Gly His Pro Tyr Asn Arg Thr Asn 915 920 925 Arg Ser Arg Met Pro Asn Leu Asn Asp Leu Lys Glu Thr Ala Leu 930 935 940 <210> 9 <211> 4706 <212> DNA <213> Artificial Sequence <220> <223> Expression Cassette <220> <221> repeat_region <222> (1)..(130) <223> 5'ITR <220> <221> misc_feature <222> (130)..(168) <223> AAV2 seq upstream of 3'ITR <220> <221> promoter <222> (213)..(678) <223> hSynapsin <220> <221> misc_feature <222> (690)..(695) <223> Kozak <220> <221> CDS <222> (696)..(3653) <223> hCDKL5-4GS <220> <221> misc_feature <222> (3668)..(4255) <223> WRPE <220> <221> polyA_signal <222> (4273)..(4511) <223> SV40 PolyA <220> <221> misc_feature <222> (4539)..(4577) <223> AAV2 seq upstream of 3'ITR <220> <221> repeat_region <222> (4577)..(4706) <223> 3'ITR <400> 9 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatcc tctagaacta tagctagcat gcctgcagag ggccctgcgt atgagtgcaa 240 gtgggtttta ggaccaggat gaggcggggt gggggtgcct acctgacgac cgaccccgac 300 ccactggaca agcacccaac ccccattccc caaattgcgc atcccctatc agagaggggg 360 aggggaaaca ggatgcggcg aggcgcgtgc gcactgccag cttcagcacc gcggacagtg 420 ccttcgcccc cgcctggcgg cgcgcgccac cgccgcctca gcactgaagg cgcgctgacg 480 tcactcgccg gtcccccgca aactcccctt cccggccacc ttggtcgcgt ccgcgccgcc 540 gccggcccag ccggaccgca ccacgcgagg cgcgagatag gggggcacgg gcgcgaccat 600 ctgcgctgcg gcgccggcga ctcagcgctg cctcagtctg cggtgggcag cggaggagtc 660 gtgtcgtgcc tgagagcgca gtcgaattcg ccacc atg aag atc ccc aat atc 713 Met Lys Ile Pro Asn Ile 1 5 ggc aac gtg atg aat aag ttc gag atc ctg gga gtg gtg gga gag gga 761 Gly Asn Val Met Asn Lys Phe Glu Ile Leu Gly Val Val Gly Glu Gly 10 15 20 gca tac gga gtg gtg ctg aag tgc cgg cac aag gag aca cac gag atc 809 Ala Tyr Gly Val Val Leu Lys Cys Arg His Lys Glu Thr His Glu Ile 25 30 35 gtg gcc atc aag aag ttt aag gat agc gag gag aat gag gag gtg aag 857 Val Ala Ile Lys Lys Phe Lys Asp Ser Glu Glu Asn Glu Glu Val Lys 40 45 50 gag aca acc ctg agg gag ctg aag atg ctg cgc aca ctg aag cag gag 905 Glu Thr Thr Leu Arg Glu Leu Lys Met Leu Arg Thr Leu Lys Gln Glu 55 60 65 70 aac atc gtg gag ctg aag gag gcc ttc cgg aga agg ggc aag ctg tac 953 Asn Ile Val Glu Leu Lys Glu Ala Phe Arg Arg Arg Gly Lys Leu Tyr 75 80 85 ctg gtg ttt gag tac gtg gag aag aac atg ctg gag ctg ctg gag gag 1001 Leu Val Phe Glu Tyr Val Glu Lys Asn Met Leu Glu Leu Leu Glu Glu 90 95 100 atg cca aat ggc gtg ccc cct gag aag gtg aag tcc tac atc tat cag 1049 Met Pro Asn Gly Val Pro Pro Glu Lys Val Lys Ser Tyr Ile Tyr Gln 105 110 115 ctg atc aag gcc atc cac tgg tgc cac aag aac gac atc gtg cac agg 1097 Leu Ile Lys Ala Ile His Trp Cys His Lys Asn Asp Ile Val His Arg 120 125 130 gat atc aag ccc gag aac ctg ctg atc tcc cac aat gac gtg ctg aag 1145 Asp Ile Lys Pro Glu Asn Leu Leu Ile Ser His Asn Asp Val Leu Lys 135 140 145 150 ctg tgc gat ttc ggc ttt gcc cgc aac ctg agc gag ggc aac aac gcc 1193 Leu Cys Asp Phe Gly Phe Ala Arg Asn Leu Ser Glu Gly Asn Asn Ala 155 160 165 aat tac aca gag tac gtg gca acc agg tgg tac cgg agc cct gag ctg 1241 Asn Tyr Thr Glu Tyr Val Ala Thr Arg Trp Tyr Arg Ser Pro Glu Leu 170 175 180 ctg ctg gga gca cca tac ggc aag tct gtg gac atg tgg agc gtg ggc 1289 Leu Leu Gly Ala Pro Tyr Gly Lys Ser Val Asp Met Trp Ser Val Gly 185 190 195 tgc atc ctg gga gag ctg tcc gac gga cag cca ctg ttc cct ggc gag 1337 Cys Ile Leu Gly Glu Leu Ser Asp Gly Gln Pro Leu Phe Pro Gly Glu 200 205 210 tct gag atc gat cag ctg ttt acc atc cag aag gtg ctg ggc ccc ctg 1385 Ser Glu Ile Asp Gln Leu Phe Thr Ile Gln Lys Val Leu Gly Pro Leu 215 220 225 230 cct tcc gag cag atg aag ctg ttc tac tct aac cct agg ttc cac ggc 1433 Pro Ser Glu Gln Met Lys Leu Phe Tyr Ser Asn Pro Arg Phe His Gly 235 240 245 ctg cgc ttt cca gcc gtg aat cac ccc cag tct ctg gag cgc cgg tat 1481 Leu Arg Phe Pro Ala Val Asn His Pro Gln Ser Leu Glu Arg Arg Tyr 250 255 260 ctg ggc atc ctg aac agc gtg ctg ctg gat ctg atg aag aat ctg ctg 1529 Leu Gly Ile Leu Asn Ser Val Leu Leu Asp Leu Met Lys Asn Leu Leu 265 270 275 aag ctg gac ccc gcc gat agg tac ctg acc gag cag tgt ctg aac cac 1577 Lys Leu Asp Pro Ala Asp Arg Tyr Leu Thr Glu Gln Cys Leu Asn His 280 285 290 cct aca ttc cag acc cag aga ctg ctg gac agg tcc cca tct cgc aat 1625 Pro Thr Phe Gln Thr Gln Arg Leu Leu Asp Arg Ser Pro Ser Arg Asn 295 300 305 310 cag gcc ggc aag tcc aca gcc ctg cag tct cac cac agg agc aac tcc 1673 Gln Ala Gly Lys Ser Thr Ala Leu Gln Ser His His Arg Ser Asn Ser 315 320 325 aag gac atc cag aat ctg tcc gtg ggc ctg cca agg gca gac gag ggc 1721 Lys Asp Ile Gln Asn Leu Ser Val Gly Leu Pro Arg Ala Asp Glu Gly 330 335 340 ctg cct gcc aac gag agc ttt ctg aat gga aac ctg gca gga gcc tct 1769 Leu Pro Ala Asn Glu Ser Phe Leu Asn Gly Asn Leu Ala Gly Ala Ser 345 350 355 ctg agc cca ctg cac aca aag acc tac cag gcc agc tcc cag cct ggc 1817 Leu Ser Pro Leu His Thr Lys Thr Tyr Gln Ala Ser Ser Gln Pro Gly 360 365 370 tcc aca tct aag gac ctg acc aac aat aac atc cct cac ctg ctg agc 1865 Ser Thr Ser Lys Asp Leu Thr Asn Asn Asn Ile Pro His Leu Leu Ser 375 380 385 390 cca aag gag gcc aag tcc aag acc gag ttc gac ttt aat atc gat cca 1913 Pro Lys Glu Ala Lys Ser Lys Thr Glu Phe Asp Phe Asn Ile Asp Pro 395 400 405 aag cca tcc gag gga cca gga aca aag tat ctg aag agc aac tcc cgg 1961 Lys Pro Ser Glu Gly Pro Gly Thr Lys Tyr Leu Lys Ser Asn Ser Arg 410 415 420 agc cag cag aat aga cac tct ttc atg gag tct agc cag agc aag gcc 2009 Ser Gln Gln Asn Arg His Ser Phe Met Glu Ser Ser Gln Ser Lys Ala 425 430 435 ggc acc ctg cag cct aac gag aag cag agc cgc cac tcc tac atc gat 2057 Gly Thr Leu Gln Pro Asn Glu Lys Gln Ser Arg His Ser Tyr Ile Asp 440 445 450 acc atc cca cag tcc tct agg agc ccc tcc tat cgc aca aag gcc aag 2105 Thr Ile Pro Gln Ser Ser Arg Ser Pro Ser Tyr Arg Thr Lys Ala Lys 455 460 465 470 tcc cac ggc gcc ctg tct gac agc aag tcc gtg tct aat ctg agc gag 2153 Ser His Gly Ala Leu Ser Asp Ser Lys Ser Val Ser Asn Leu Ser Glu 475 480 485 gca agg gca cag atc gca gag cca agc acc tcc aga tac ttt ccc agc 2201 Ala Arg Ala Gln Ile Ala Glu Pro Ser Thr Ser Arg Tyr Phe Pro Ser 490 495 500 tcc tgt ctg gac ctg aac tct ccc aca agc cct aca cca acc cgg cac 2249 Ser Cys Leu Asp Leu Asn Ser Pro Thr Ser Pro Thr Pro Thr Arg His 505 510 515 agc gat aca aga acc ctg ctg tct cct agc ggc aga aat aac agg aac 2297 Ser Asp Thr Arg Thr Leu Leu Ser Pro Ser Gly Arg Asn Asn Arg Asn 520 525 530 gag ggc acc ctg gat agc aga agg acc aca acc agg cac tcc aag aca 2345 Glu Gly Thr Leu Asp Ser Arg Arg Thr Thr Thr Arg His Ser Lys Thr 535 540 545 550 atg gag gag ctg aag ctg cct gag cac atg gac tct agc cac tcc cac 2393 Met Glu Glu Leu Lys Leu Pro Glu His Met Asp Ser Ser His Ser His 555 560 565 tct ctg agc gcc cca cac gag tcc ttc tct tac ggc ctg ggc tat acc 2441 Ser Leu Ser Ala Pro His Glu Ser Phe Ser Tyr Gly Leu Gly Tyr Thr 570 575 580 agc cct ttt tcc tct caa caa cgc cca cac cgg cac tcc atg tac gtg 2489 Ser Pro Phe Ser Ser Gln Gln Arg Pro His Arg His Ser Met Tyr Val 585 590 595 aca cgg gac aag gtg aga gcc aag ggc ctg gac ggc agc ctg tcc atc 2537 Thr Arg Asp Lys Val Arg Ala Lys Gly Leu Asp Gly Ser Leu Ser Ile 600 605 610 gga cag gga atg gca gca agg gca aat agc ctg cag ctg ctg tcc cca 2585 Gly Gln Gly Met Ala Ala Arg Ala Asn Ser Leu Gln Leu Leu Ser Pro 615 620 625 630 cag cct gga gag cag ctg cca cca gag atg acc gtg gca cgg agc tcc 2633 Gln Pro Gly Glu Gln Leu Pro Pro Glu Met Thr Val Ala Arg Ser Ser 635 640 645 gtg aag gag aca agc aga gag ggc acc tct agc ttc cac aca cgg cag 2681 Val Lys Glu Thr Ser Arg Glu Gly Thr Ser Ser Phe His Thr Arg Gln 650 655 660 aag agc gag ggc ggc gtg tat cac gac cca cac tcc gac gac gga acc 2729 Lys Ser Glu Gly Gly Val Tyr His Asp Pro His Ser Asp Asp Gly Thr 665 670 675 gca cct aag gag aac aga cac ctg tac aac gat cca gtg ccc cgc cgg 2777 Ala Pro Lys Glu Asn Arg His Leu Tyr Asn Asp Pro Val Pro Arg Arg 680 685 690 gtg ggc tct ttc tat cgg gtg cct agc cca cgc ccc gac aac tcc ttt 2825 Val Gly Ser Phe Tyr Arg Val Pro Ser Pro Arg Pro Asp Asn Ser Phe 695 700 705 710 cac gag aat aac gtg tct acc cgg gtg tcc tct ctg ccc agc gag agc 2873 His Glu Asn Asn Val Ser Thr Arg Val Ser Ser Leu Pro Ser Glu Ser 715 720 725 tcc tct ggc aca aac cac tcc aag aga cag cca gcc ttt gat ccc tgg 2921 Ser Ser Gly Thr Asn His Ser Lys Arg Gln Pro Ala Phe Asp Pro Trp 730 735 740 aag tct cct gag aat atc tct cac agc gag cag ctg aag gag aag gag 2969 Lys Ser Pro Glu Asn Ile Ser His Ser Glu Gln Leu Lys Glu Lys Glu 745 750 755 aag cag ggc ttc ttt cgg tcc atg aag aag aag aag aag aag agc cag 3017 Lys Gln Gly Phe Phe Arg Ser Met Lys Lys Lys Lys Lys Lys Ser Gln 760 765 770 aca acc gac agc acc aac ggc gag aat cca agc atc aag aag tcc ctg 3065 Thr Thr Asp Ser Thr Asn Gly Glu Asn Pro Ser Ile Lys Lys Ser Leu 775 780 785 790 ttc ccc ctg ttt aac agc aag aat cac ctg aag cac agc tcc tct ctg 3113 Phe Pro Leu Phe Asn Ser Lys Asn His Leu Lys His Ser Ser Ser Leu 795 800 805 aag aag ctg ccc gtg gtg aca cct cca atg gtg ccc aat tcc gac tct 3161 Lys Lys Leu Pro Val Val Thr Pro Pro Met Val Pro Asn Ser Asp Ser 810 815 820 cct gat ctg ctg acc ctg cag aag tcc atc cac agc gcc tcc aca cca 3209 Pro Asp Leu Leu Thr Leu Gln Lys Ser Ile His Ser Ala Ser Thr Pro 825 830 835 agc tcc cgg ccc aag gag tgg cgg ccc gag aag atc agc gat ctg cag 3257 Ser Ser Arg Pro Lys Glu Trp Arg Pro Glu Lys Ile Ser Asp Leu Gln 840 845 850 acc cag tcc cag ccc ctg aag tct ctg aga aag ctg ctg cac ctg tct 3305 Thr Gln Ser Gln Pro Leu Lys Ser Leu Arg Lys Leu Leu His Leu Ser 855 860 865 870 agc gcc tcc aac cac cca gcc tcc tct gac cct cgg ttc cag cca ctg 3353 Ser Ala Ser Asn His Pro Ala Ser Ser Asp Pro Arg Phe Gln Pro Leu 875 880 885 aca gcc cag cag acc aag aac tct ttt agc gag atc cgc atc cac cca 3401 Thr Ala Gln Gln Thr Lys Asn Ser Phe Ser Glu Ile Arg Ile His Pro 890 895 900 ctg tcc caa gcc tct gga ggc agc tcc aac atc agg cag gag cct gcc 3449 Leu Ser Gln Ala Ser Gly Gly Ser Ser Asn Ile Arg Gln Glu Pro Ala 905 910 915 cca aag ggc cgc cca gcc ctg cag ctg cca gga cag atg gac ccc ggc 3497 Pro Lys Gly Arg Pro Ala Leu Gln Leu Pro Gly Gln Met Asp Pro Gly 920 925 930 tgg cac gtg tct agc gtg aca cgg agc gcc acc gag gga cct tcc tac 3545 Trp His Val Ser Ser Val Thr Arg Ser Ala Thr Glu Gly Pro Ser Tyr 935 940 945 950 tct gag cag ctg gga gca aag tct gga cca aac gga cac cct tat aac 3593 Ser Glu Gln Leu Gly Ala Lys Ser Gly Pro Asn Gly His Pro Tyr Asn 955 960 965 aga acc aat aga agc agg atg cca aat ctg aac gac ctg aag gag aca 3641 Arg Thr Asn Arg Ser Arg Met Pro Asn Leu Asn Asp Leu Lys Glu Thr 970 975 980 gcc ctg tga tag aagcttatcg ataatcaacc tctggattac aaaatttgtg 3693 Ala Leu aaagattgac tggtattctt aactatgttg ctccttttac gctatgtgga tacgctgctt 3753 taatgccttt gtatcatgct attgcttccc gtatggcttt cattttctcc tccttgtata 3813 aatcctggtt gctgtctctt tatgaggagt tgtggcccgt tgtcaggcaa cgtggcgtgg 3873 tgtgcactgt gtttgctgac gcaaccccca ctggttgggg cattgccacc acctgtcagc 3933 tcctttccgg gactttcgct ttccccctcc ctattgccac ggcggaactc atcgccgcct 3993 gccttgcccg ctgctggaca ggggctcggc tgttgggcac tgacaattcc gtggtgttgt 4053 cggggaaatc atcgtccttt ccttggctgc tcgcctgtgt tgccacctgg attctgcgcg 4113 ggacgtcctt ctgctacgtc ccttcggccc tcaatccagc ggaccttcct tcccgcggcc 4173 tgctgccggc tctgcggcct cttccgcgtc ttcgccttcg ccctcagacg agtcggatct 4233 ccctttgggc cgcctccccg catcgatacc gtcgatcgag gccgcttcga gcagacatga 4293 taagatacat tgatgagttt ggacaaacca caactagaat gcagtgaaaa aaatgcttta 4353 tttgtgaaat ttgtgatgct attgctttat ttgtaaccat tataagctgc aataaacaag 4413 ttaacaacaa caattgcatt cattttatgt ttcaggttca gggggagatg tgggaggttt 4473 tttaaagcaa gtaaaacctc tacaaatgtg gtaaaatcga taaggatctt cctagagcat 4533 ggctacgtag ataagtagca tggcgggtta atcattaact acaaggaacc cctagtgatg 4593 gagttggcca ctccctctct gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc 4653 gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg agcgagcgcg cag 4706 <210> 10 <211> 984 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 10 Met Lys Ile Pro Asn Ile Gly Asn Val Met Asn Lys Phe Glu Ile Leu 1 5 10 15 Gly Val Val Gly Glu Gly Ala Tyr Gly Val Val Leu Lys Cys Arg His 20 25 30 Lys Glu Thr His Glu Ile Val Ala Ile Lys Lys Phe Lys Asp Ser Glu 35 40 45 Glu Asn Glu Glu Val Lys Glu Thr Thr Leu Arg Glu Leu Lys Met Leu 50 55 60 Arg Thr Leu Lys Gln Glu Asn Ile Val Glu Leu Lys Glu Ala Phe Arg 65 70 75 80 Arg Arg Gly Lys Leu Tyr Leu Val Phe Glu Tyr Val Glu Lys Asn Met 85 90 95 Leu Glu Leu Leu Glu Glu Met Pro Asn Gly Val Pro Pro Glu Lys Val 100 105 110 Lys Ser Tyr Ile Tyr Gln Leu Ile Lys Ala Ile His Trp Cys His Lys 115 120 125 Asn Asp Ile Val His Arg Asp Ile Lys Pro Glu Asn Leu Leu Ile Ser 130 135 140 His Asn Asp Val Leu Lys Leu Cys Asp Phe Gly Phe Ala Arg Asn Leu 145 150 155 160 Ser Glu Gly Asn Asn Ala Asn Tyr Thr Glu Tyr Val Ala Thr Arg Trp 165 170 175 Tyr Arg Ser Pro Glu Leu Leu Leu Gly Ala Pro Tyr Gly Lys Ser Val 180 185 190 Asp Met Trp Ser Val Gly Cys Ile Leu Gly Glu Leu Ser Asp Gly Gln 195 200 205 Pro Leu Phe Pro Gly Glu Ser Glu Ile Asp Gln Leu Phe Thr Ile Gln 210 215 220 Lys Val Leu Gly Pro Leu Pro Ser Glu Gln Met Lys Leu Phe Tyr Ser 225 230 235 240 Asn Pro Arg Phe His Gly Leu Arg Phe Pro Ala Val Asn His Pro Gln 245 250 255 Ser Leu Glu Arg Arg Tyr Leu Gly Ile Leu Asn Ser Val Leu Leu Asp 260 265 270 Leu Met Lys Asn Leu Leu Lys Leu Asp Pro Ala Asp Arg Tyr Leu Thr 275 280 285 Glu Gln Cys Leu Asn His Pro Thr Phe Gln Thr Gln Arg Leu Leu Asp 290 295 300 Arg Ser Pro Ser Arg Asn Gln Ala Gly Lys Ser Thr Ala Leu Gln Ser 305 310 315 320 His His Arg Ser Asn Ser Lys Asp Ile Gln Asn Leu Ser Val Gly Leu 325 330 335 Pro Arg Ala Asp Glu Gly Leu Pro Ala Asn Glu Ser Phe Leu Asn Gly 340 345 350 Asn Leu Ala Gly Ala Ser Leu Ser Pro Leu His Thr Lys Thr Tyr Gln 355 360 365 Ala Ser Ser Gln Pro Gly Ser Thr Ser Lys Asp Leu Thr Asn Asn Asn 370 375 380 Ile Pro His Leu Leu Ser Pro Lys Glu Ala Lys Ser Lys Thr Glu Phe 385 390 395 400 Asp Phe Asn Ile Asp Pro Lys Pro Ser Glu Gly Pro Gly Thr Lys Tyr 405 410 415 Leu Lys Ser Asn Ser Arg Ser Gln Gln Asn Arg His Ser Phe Met Glu 420 425 430 Ser Ser Gln Ser Lys Ala Gly Thr Leu Gln Pro Asn Glu Lys Gln Ser 435 440 445 Arg His Ser Tyr Ile Asp Thr Ile Pro Gln Ser Ser Arg Ser Pro Ser 450 455 460 Tyr Arg Thr Lys Ala Lys Ser His Gly Ala Leu Ser Asp Ser Lys Ser 465 470 475 480 Val Ser Asn Leu Ser Glu Ala Arg Ala Gln Ile Ala Glu Pro Ser Thr 485 490 495 Ser Arg Tyr Phe Pro Ser Ser Cys Leu Asp Leu Asn Ser Pro Thr Ser 500 505 510 Pro Thr Pro Thr Arg His Ser Asp Thr Arg Thr Leu Leu Ser Pro Ser 515 520 525 Gly Arg Asn Asn Arg Asn Glu Gly Thr Leu Asp Ser Arg Arg Thr Thr 530 535 540 Thr Arg His Ser Lys Thr Met Glu Glu Leu Lys Leu Pro Glu His Met 545 550 555 560 Asp Ser Ser His Ser His Ser Leu Ser Ala Pro His Glu Ser Phe Ser 565 570 575 Tyr Gly Leu Gly Tyr Thr Ser Pro Phe Ser Ser Gln Gln Arg Pro His 580 585 590 Arg His Ser Met Tyr Val Thr Arg Asp Lys Val Arg Ala Lys Gly Leu 595 600 605 Asp Gly Ser Leu Ser Ile Gly Gln Gly Met Ala Ala Arg Ala Asn Ser 610 615 620 Leu Gln Leu Leu Ser Pro Gln Pro Gly Glu Gln Leu Pro Pro Glu Met 625 630 635 640 Thr Val Ala Arg Ser Ser Val Lys Glu Thr Ser Arg Glu Gly Thr Ser 645 650 655 Ser Phe His Thr Arg Gln Lys Ser Glu Gly Gly Val Tyr His Asp Pro 660 665 670 His Ser Asp Asp Gly Thr Ala Pro Lys Glu Asn Arg His Leu Tyr Asn 675 680 685 Asp Pro Val Pro Arg Arg Val Gly Ser Phe Tyr Arg Val Pro Ser Pro 690 695 700 Arg Pro Asp Asn Ser Phe His Glu Asn Asn Val Ser Thr Arg Val Ser 705 710 715 720 Ser Leu Pro Ser Glu Ser Ser Ser Gly Thr Asn His Ser Lys Arg Gln 725 730 735 Pro Ala Phe Asp Pro Trp Lys Ser Pro Glu Asn Ile Ser His Ser Glu 740 745 750 Gln Leu Lys Glu Lys Glu Lys Gln Gly Phe Phe Arg Ser Met Lys Lys 755 760 765 Lys Lys Lys Lys Ser Gln Thr Thr Asp Ser Thr Asn Gly Glu Asn Pro 770 775 780 Ser Ile Lys Lys Ser Leu Phe Pro Leu Phe Asn Ser Lys Asn His Leu 785 790 795 800 Lys His Ser Ser Ser Leu Lys Lys Leu Pro Val Val Thr Pro Pro Met 805 810 815 Val Pro Asn Ser Asp Ser Pro Asp Leu Leu Thr Leu Gln Lys Ser Ile 820 825 830 His Ser Ala Ser Thr Pro Ser Ser Arg Pro Lys Glu Trp Arg Pro Glu 835 840 845 Lys Ile Ser Asp Leu Gln Thr Gln Ser Gln Pro Leu Lys Ser Leu Arg 850 855 860 Lys Leu Leu His Leu Ser Ser Ala Ser Asn His Pro Ala Ser Ser Asp 865 870 875 880 Pro Arg Phe Gln Pro Leu Thr Ala Gln Gln Thr Lys Asn Ser Phe Ser 885 890 895 Glu Ile Arg Ile His Pro Leu Ser Gln Ala Ser Gly Gly Ser Ser Asn 900 905 910 Ile Arg Gln Glu Pro Ala Pro Lys Gly Arg Pro Ala Leu Gln Leu Pro 915 920 925 Gly Gln Met Asp Pro Gly Trp His Val Ser Ser Val Thr Arg Ser Ala 930 935 940 Thr Glu Gly Pro Ser Tyr Ser Glu Gln Leu Gly Ala Lys Ser Gly Pro 945 950 955 960 Asn Gly His Pro Tyr Asn Arg Thr Asn Arg Ser Arg Met Pro Asn Leu 965 970 975 Asn Asp Leu Lys Glu Thr Ala Leu 980 <210> 11 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> targeting site <400> 11 agtgaattct accagtgcca ta 22 <210> 12 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> targeting site <400> 12 agcaaaaatg tgctagtgcc aaa 23 <210> 13 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> targeting sequence <400> 13 agtgtgagtt ctaccattgc caaa 24 <210> 14 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> targeting sequence <400> 14 agggattcct gggaaaactg gac 23 <210> 15 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> spacer <400> 15 atgacttaaa ccaggt 16 <210> 16 <211> 3430 <212> DNA <213> Artificial Sequence <220> <223> transcript variant <400> 16 gggggagttg gaggaggaag accctacagg aagttgagct gtactctcca acaggcgagc 60 acatggtcgt ctcctctctc ccttcaggga gtcatttaat acttcatgat tagaacaaat 120 atgtgaaagt tcccaccaac cagtgagaat ttcttccttc agacggtttt ggatcttact 180 gcacagcttt ctgagaagtt cttttggtgc catgttttgt ggcttgcatc aaaagaggag 240 tttgtcttca tgaagattcc taacattggt aatgtgatga ataaatttga gatccttggg 300 gttgtaggtg aaggagccta tggagttgta cttaaatgca gacacaagga aacacatgaa 360 attgtggcga tcaagaaatt caaggacagt gaagaaaatg aagaagtcaa agaaacgact 420 ttacgagagc ttaaaatgct tcggactctc aagcaggaaa acattgtgga gttgaaggaa 480 gcatttcgtc ggaggggaaa gttgtacttg gtgtttgagt atgttgaaaa aaatatgctc 540 gaattgctgg aagaaatgcc aaatggagtt ccacctgaga aagtaaaaag ctacatctat 600 cagctaatca aggctattca ctggtgccat aagaatgata ttgtccatcg agatataaaa 660 ccagaaaatc tcttaatcag ccacaatgat gtcctaaaac tgtgtgactt tggttttgct 720 cgtaatctgt cagaaggcaa taatgctaat tacacagagt acgttgccac cagatggtat 780 cggtccccag aactcttact tggcgctccc tatggaaagt ccgtggacat gtggtcggtg 840 ggctgtattc ttggggagct tagcgatgga cagcctttat ttcctggaga aagtgaaatt 900 gaccaacttt ttactattca gaaggtgcta ggaccacttc catctgagca gatgaagctt 960 ttctacagta atcctcgctt ccatgggctc cggtttccag ctgttaacca tcctcagtcc 1020 ttggaaagaa gataccttgg aattttgaat agtgttctac ttgacctaat gaagaattta 1080 ctgaagttgg acccagctga cagatacttg acagaacagt gtttgaatca ccctacattt 1140 caaacccaga gacttctgga tcgttctcct tcaaggtcag caaaaagaaa accttaccat 1200 gtggaaagca gcacattgtc taatagaaac caagccggca aaagtactgc tttgcagtct 1260 caccacagat ctaacagcaa ggacatccag aacctgagtg taggcctgcc ccgggctgac 1320 gaaggtctcc ctgccaatga aagcttccta aatggaaacc ttgctggagc tagtcttagt 1380 ccactgcaca ccaaaaccta ccaagcaagc agccagcctg ggtctaccag caaagatctc 1440 accaacaaca acataccaca ccttcttagc ccaaaagaag ccaagtcaaa aacagagttt 1500 gattttaata ttgacccaaa gccttcagaa ggcccaggga caaagtacct caagtcaaac 1560 agcagatctc agcagaaccg ccactcattc atggaaagct ctcaaagcaa agctgggaca 1620 ctgcagccca atgaaaagca gagtcggcat agctatattg acacaattcc ccagtcctct 1680 aggagtccct cctacaggac caaggccaaa agccatgggg cactgagtga ctccaagtct 1740 gtgagcaacc tttctgaagc cagggcccaa attgcggagc ccagtaccag taggtacttc 1800 ccatctagct gcttagactt gaattctccc accagcccaa cccccaccag acacagtgac 1860 acgagaactt tgctcagccc ttctggaaga aataaccgaa atgagggaac gctggactca 1920 cgtcgaacca caaccagaca ttctaagacg atggaggaat tgaagctgcc ggagcacatg 1980 gacagtagcc attcccattc actgtctgca cctcacgaat ctttttctta tggactgggc 2040 tacaccagcc ccttttcttc ccagcaacgt cctcataggc attctatgta tgtgacccgt 2100 gacaaagtga gagccaaggg cttggatgga agcttgagca tagggcaagg gatggcagct 2160 agagccaaca gcctgcaact cttgtcaccc cagcctggag aacagctccc tccagagatg 2220 actgtggcaa gatcttcggt caaagagacc tccagagaag gcacctcttc cttccataca 2280 cgccagaagt ctgagggtgg agtgtatcat gacccacact ctgatgatgg cacagccccc 2340 aaagaaaata gacacctata caatgatcct gtgccaagga gagttggtag cttttacaga 2400 gtgccatctc cacgtccaga caattctttc catgaaaata atgtgtcaac tagagtttct 2460 tctctaccat cagagagcag ttctggaacc aaccactcaa aaagacaacc agcattcgat 2520 ccatggaaaa gtcctgaaaa tattagtcat tcagagcaac tcaaggaaaa agagaagcaa 2580 ggatttttca ggtcaatgaa aaagaaaaag aagaaatctc aaacagtacc caattccgac 2640 agccctgatc ttctgacgtt gcagaaatcc attcattctg ctagcactcc aagcagcaga 2700 ccaaaggagt ggcgccccga gaagatctca gatctgcaga cccaaagcca gccattaaaa 2760 tcactgcgca agttgttaca tctctcttcg gcctcaaatc acccggcttc ctcagatccc 2820 cgcttccagc ccttaacagc tcaacaaacc aaaaattcct tctcagaaat tcggattcac 2880 cccctgagcc aggcctctgg cgggagcagc aacatccggc aggaacccgc accgaagggc 2940 aggccagccc tccagctgcc agacggtgga tgtgatggca gaagacagag acaccattct 3000 ggaccccaag atagacgctt catgttaagg acgacagaac aacaaggaga atacttctgc 3060 tgtggtgacc caaagaagcc tcacactccg tgcgtcccaa accgagccct tcatcgtcca 3120 atctccagtc ctgctcccta tccagtactc caggtccgag gcacttccat gtgcccgaca 3180 ctccaggtcc gaggcactga tgctttcagc tgcccaaccc agcaatccgg gttctctttc 3240 ttcgtgagac acgttatgag ggaagccctg attcacaggg cccaggtaaa ccaagctgcg 3300 ctcctgacat accatgagaa tgcggcactg acgggcaagt gacttctgca agcctgcggc 3360 tggtcccaat gccctgaatc acctctctca tggaagaacc aattaacacc aatgaatcaa 3420 ccattaaaaa 3430 <210> 17 <211> 14572 <212> DNA <213> Artificial Sequence <220> <223> transcript variant <400> 17 agttgtctct gccgctgggg aaggtaaagc ggcgacggcg tcctcaggag ctgtggggtc 60 ccctgctaga agtgggggac tcggcggggg agtcatttaa tacttcatga ttagaacaaa 120 tatgtgaaag ttcccaccaa ccagtgagaa tttcttcctt cagacggttt tggatcttac 180 tgcacagctt tctgagaagt tcttttggtg ccatgttttg tggcttgcat caaaagagga 240 gtttgtcttc atgaagattc ctaacattgg taatgtgatg aataaatttg agatccttgg 300 ggttgtaggt gaaggagcct atggagttgt acttaaatgc agacacaagg aaacacatga 360 aattgtggcg atcaagaaat tcaaggacag tgaagaaaat gaagaagtca aagaaacgac 420 tttacgagag cttaaaatgc ttcggactct caagcaggaa aacattgtgg agttgaagga 480 agcatttcgt cggaggggaa agttgtactt ggtgtttgag tatgttgaaa aaaatatgct 540 cgaattgctg gaagaaatgc caaatggagt tccacctgag aaagtaaaaa gctacatcta 600 tcagctaatc aaggctattc actggtgcca taagaatgat attgtccatc gagatataaa 660 accagaaaat ctcttaatca gccacaatga tgtcctaaaa ctgtgtgact ttggttttgc 720 tcgtaatctg tcagaaggca ataatgctaa ttacacagag tacgttgcca ccagatggta 780 tcggtcccca gaactcttac ttggcgctcc ctatggaaag tccgtggaca tgtggtcggt 840 gggctgtatt cttggggagc ttagcgatgg acagccttta tttcctggag aaagtgaaat 900 tgaccaactt tttactattc agaaggtgct aggaccactt ccatctgagc agatgaagct 960 tttctacagt aatcctcgct tccatgggct ccggtttcca gctgttaacc atcctcagtc 1020 cttggaaaga agataccttg gaattttgaa tagtgttcta cttgacctaa tgaagaattt 1080 actgaagttg gacccagctg acagatactt gacagaacag tgtttgaatc accctacatt 1140 tcaaacccag agacttctgg atcgttctcc ttcaaggtca gcaaaaagaa aaccttacca 1200 tgtggaaagc agcacattgt ctaatagaaa ccaagccggc aaaagtactg ctttgcagtc 1260 tcaccacaga tctaacagca aggacatcca gaacctgagt gtaggcctgc cccgggctga 1320 cgaaggtctc cctgccaatg aaagcttcct aaatggaaac cttgctggag ctagtcttag 1380 tccactgcac accaaaacct accaagcaag cagccagcct gggtctacca gcaaagatct 1440 caccaacaac aacataccac accttcttag cccaaaagaa gccaagtcaa aaacagagtt 1500 tgattttaat attgacccaa agccttcaga aggcccaggg acaaagtacc tcaagtcaaa 1560 cagcagatct cagcagaacc gccactcatt catggaaagc tctcaaagca aagctgggac 1620 actgcagccc aatgaaaagc agagtcggca tagctatatt gacacaattc cccagtcctc 1680 taggagtccc tcctacagga ccaaggccaa aagccatggg gcactgagtg actccaagtc 1740 tgtgagcaac ctttctgaag ccagggccca aattgcggag cccagtacca gtaggtactt 1800 cccatctagc tgcttagact tgaattctcc caccagccca acccccacca gacacagtga 1860 cacgagaact ttgctcagcc cttctggaag aaataaccga aatgagggaa cgctggactc 1920 acgtcgaacc acaaccagac attctaagac gatggaggaa ttgaagctgc cggagcacat 1980 ggacagtagc cattcccatt cactgtctgc acctcacgaa tctttttctt atggactggg 2040 ctacaccagc cccttttctt cccagcaacg tcctcatagg cattctatgt atgtgacccg 2100 tgacaaagtg agagccaagg gcttggatgg aagcttgagc atagggcaag ggatggcagc 2160 tagagccaac agcctgcaac tcttgtcacc ccagcctgga gaacagctcc ctccagagat 2220 gactgtggca agatcttcgg tcaaagagac ctccagagaa ggcacctctt ccttccatac 2280 acgccagaag tctgagggtg gagtgtatca tgacccacac tctgatgatg gcacagcccc 2340 caaagaaaat agacacctat acaatgatcc tgtgccaagg agagttggta gcttttacag 2400 agtgccatct ccacgtccag acaattcttt ccatgaaaat aatgtgtcaa ctagagtttc 2460 ttctctacca tcagagagca gttctggaac caaccactca aaaagacaac cagcattcga 2520 tccatggaaa agtcctgaaa atattagtca ttcagagcaa ctcaaggaaa aagagaagca 2580 aggatttttc aggtcaatga aaaagaaaaa gaagaaatct caaacagtac ccaattccga 2640 cagccctgat cttctgacgt tgcagaaatc cattcattct gctagcactc caagcagcag 2700 accaaaggag tggcgccccg agaagatctc agatctgcag acccaaagcc agccattaaa 2760 atcactgcgc aagttgttac atctctcttc ggcctcaaat cacccggctt cctcagatcc 2820 ccgcttccag cccttaacag ctcaacaaac caaaaattcc ttctcagaaa ttcggattca 2880 ccccctgagc caggcctctg gcgggagcag caacatccgg caggaacccg caccgaaggg 2940 caggccagcc ctccagctgc caggtcagat ggatcctggt tggcatgtgt cctctgtgac 3000 caggagtgcc acagagggcc cttcctactc tgaacagctg ggtgccaaaa gtgggccaaa 3060 tgggcacccc tataacagaa caaatcgctc acgaatgcca aatctgaatg atttaaaaga 3120 gacagccttg taatttgtgc tggtaggggg gaggggtgga cagacaagcc agtggggagg 3180 ggtgggaaag ggtgggctgg gcttggggca tgggccgggc caagtggtga gccaatattt 3240 tcagctttat gaaggtgtgt gcaatattgc atgtgttggg gccgttgagc tcctcgcggc 3300 cacaaatgct agtcagggat cttagagcca caggagttcc ttagggatcg ccactcccca 3360 caggtcttgt gtgagaatag atagagtgtg ccattgagga agaagaaatt cttgccagtt 3420 tctccccttt acattccagc tttagtgcaa tctctgttga acttgggaat gccaggatgt 3480 gtcctggcac tgcaagggat aggaaagtcg tgttgaccga tgcccttact acatattttt 3540 ttctgcctag agtaaatgtg gggtttattg taatccaaga gtatcccttt gaagggttag 3600 cagatgaact gtatgtctta aattgttttc taaacttcca tatttgatag gatttgtaac 3660 atttatttat aattaatatt gtactgttaa aatcatatct tttatgttat aatgtaaagt 3720 tattttgagc tgtttgaaac attgtgaagc agtgggacag ctacagtagt ttctataaaa 3780 actaaacagt aacatttata tattgcatca ggagtatttt attctatata taatatatat 3840 atatggtaaa tatctgtttt ataaatatat tcatttaaag aaagtatcgt tatgacacta 3900 tctgccatat ttttatacat ttgtgatatg aagtgagtat tatacttcta ctaaagggag 3960 ttgaattgtg gctacacgtg actgtaacag tatgaacctt gctcaacttt gaggccccag 4020 cagtagcctc tagacatgat ccttggtagc agacgagatg cagcatctct ttccaaacct 4080 gcaggggaag aaagtcagat aggccagtga gaattccagc aggcctggtt tccgtcctca 4140 cacacttggc tcctgtttgt gtccagggac gttacttgca cacaggggag aatagattga 4200 ggcgttactc gtgggtcttt gtagagagaa tgtgctcttc cacttagcat tagtgtagag 4260 cgtagaccaa agatttgcca gtgaacattc cttgttgtga gatcataaga ggtacctgtc 4320 tgcagatctt gcaaaccatc tctatgctcc tgaatattgt ccactgtccc ggagactctt 4380 ggctgatggg gtgtgagata tatgtgtggc atttctattt ctgaatgcct tttttgctat 4440 tgctctctcc aataccatat ttaaaaggct cctggagcaa ttccagatag ataaaaaatt 4500 actctatcca tttttttctt cctggggctg tccacttatg acaagatttt catgcacacc 4560 tgttacgcac acaaccccca tcagaacagg acctatcttc ccctcatctg atctctttca 4620 gctcccaagt tactcccaag tatcatcaaa ccctttggcc atcaagtgtt atcctcccat 4680 gcctctgggt catccttgag ggaagtcacc tcagcaccat catctatcag tagtagtaga 4740 tttttggaat tagtctctga gcaataatac ttttaaaggt ccctcccacc cctcaaagag 4800 ataacttctc agtatttatt acttgtcctc aaattctgag tgtcagcccc tgcatcaagt 4860 cagctatgat caaaatgtgc tgttactgtt aaccctcccc cgagattttg agaatcatag 4920 ctctgatgat tatgaagatt ataaagacta aggtcctagt ttccctgaag cttaaattgt 4980 gcacatattg catttttata taaatactat aatgtgtatt gattatatag ataggtcatt 5040 ttaaggtgct ttttatttaa ttttaatgag tgtaataggc actaaaatga aactcgactg 5100 ggtactatta ctgaaaaaat ttgactcaaa ccaatagttt tgcatgctct ttagttcttt 5160 ttctgtctta cttctttcac cagttcagta ctgtttgggt agctctgaat tctggctttt 5220 ccaggcagct gcttgatgat acaaatgagg tggaccatca gcagttttgc ctggacacta 5280 atgactctaa aagggtgtgt atttaactct tctttttcat actagatctc taccttgtat 5340 tccccccttg caaaccagaa actacacttt ttttctctgg aaagacttct cactgtgcta 5400 tgcgcttagg aactgcacgg tcccgttgcc atgctgtggc attcgaggct cgtcacctag 5460 gggctggttt cccatgttgt catccttgct aacactggga tctcagatgt ttgcagaaca 5520 tttctattca tgacggttct tcaaagaagg gctagaatat ttgccttcta cctagagcaa 5580 agtaaaccta attgttgaag agtcaatacg tactttttgt actttcccag atttgagcca 5640 gaaaatacct acagatatct acaaatgttt tcaaccagtg ttttcgaggt agctctttaa 5700 tcctcttctc agcttttgtc tgttctgact tttcatccaa taagctgtaa gtgaactaca 5760 atctgcattt ccagcatgca attctcttcc tgctcacgga gggggatgca aaagttttct 5820 ctcacaccta atgggccctc tcttagcttt taactgttgt tttcccctgt tgatgaaaaa 5880 ttactgacat cacaaagatt gccatccatg gtagaaagga cttgatttaa agtcagaaaa 5940 atttgccttt tctttaggaa ggggaattca tgacatccat gtcctattat cggccgtaac 6000 ttcctaaaga agaaaaaggg tgaatgaaag cttatgttac ttttatgaaa gtatcactga 6060 tctcctttgg aaaagaaact ctgcttcact gtttttctac ctttatttct ctgccatcct 6120 cgtttttcct ctctgaagtt ctaaataccc tttaactgaa ccttgttggt cttgctctaa 6180 aatttagcct ctttctagag cccaagacca aaagggagtg cttcatgctg aggggctcaa 6240 gtgagctgac tctacaactg tggttctcaa ctaggggcag atttaccccc aagggtacat 6300 ttggcaatgt ctggggacat ttggttgtca tagctggggg ggaggtgatg gtatgctact 6360 ggcatcaagt ggttagaggc cacagatgct actaaacacc ctgccatgca caggacagcc 6420 ccccaaacaa acagtggtcc agccccaagc actactagtg ctgaggttga gaaaccctgc 6480 cctacaccat cccaagccca ccagtctgca gagcttggct ctggccttgt tctgtccagg 6540 ctacagtact gcaggtgtga tttcttcaac atcacattct cttaagagtc ttcaaccact 6600 atgcctgaat ccttggaatc ctattgttcg tttccattgt cttgggcctg ctaaaaggtg 6660 catactttgg aaggagacca gagttacttt ataggtgttg gagaacttaa attctaggtt 6720 agcatcctta gaaaatcttt catagagcca tgaggcttat atttagaagc aagcaacagc 6780 ctggcagatt ggcatgattt ttaccaactg ctcaaaggca tccgtggctt tcagctgtgt 6840 ctcccgaaag aaaatgtctt tgttttttat tcaagtcatt taatagctct ttacaaatat 6900 tagcatatgg cagaccaatt agaagcaaaa aagtccgtat tggtggttgt gatgtggctg 6960 ttatagaagt atttgtgctg tatgctttgg ttaaatctgt tttaaaacat gctttaagat 7020 tcaccttacg cagttgtact ttaattctaa gctcagagct atgctgtcag tctctagtca 7080 cgccatgtat tataaagtat gttgtggttg tagagttagc cagtttagca tgttcctaat 7140 ctgagaatta gtggactata ctaggaaatg ctatcccatt ttccctttcc agcccctctt 7200 agttaagatc atagtatcct cacttcttaa actagtcttt agagtaaata aggaaaaaag 7260 ccatttattt tcttctagcc atgtattatt gagaatgact catagtacaa ctttttttca 7320 aaggccagag gattactttg caagtgtgta gaaagatctg tctatttctg ttcacctggg 7380 acctggtggt gactgaactc tttcagcaag ggcaatggct caatgtgatt cggtgctgga 7440 gctcagctgg gactcagtaa atctgcacgt tctctgctgg tcagaacatg tttcctggag 7500 agcattgctt ttctatctag aagttcgtta cctcctgcat gatagtggga tattgagatg 7560 tgggttctaa gatccacaga ctcatacttt tgtgaacttt ggaatgtggt agggtacact 7620 gaaccaagtc agaaaatagt gaaatatttc cttgcctcct tcagttcatc actaagaaag 7680 tgtgtaggca gagaaaactt acttatggtt tgaagaacca caattgtttt tgaaagggga 7740 catagaaaag acagtacaaa ggttgtaagt gtcctgtcgc taattcccag ggccagaatc 7800 tcacaagaag atcctctcaa agacttaaaa gcctggctta caaaaataac cagaaaccaa 7860 acttgtaagc agttacaatt tcttcctttt gcttcttgac cagctgagat acagaatatc 7920 ttgaggtctg gttcagctga tgaaaaattc tgtctcagaa acgatgagta agaaaccata 7980 caagaaaaag aagtccctca tctatctgca tacacgcaat gtgggagaag tggggtggct 8040 aggaaactct gggcctgctg cccccttcga ttcttttttt ttttctttgt gaattgaatg 8100 tacgatacaa atggtaggcc ttcatgtgag ccagttacta catgaatctt catttcccac 8160 agtggtttgt tcattcatca gcgttaggct tggtcctggc tccacctttc tcctctccgg 8220 gcactgaccc cacctttccg tgtatttact gtaggctatt aaatatgatc atgacccgcc 8280 ttgcattttc attcatcacc tgtttatgcc caaatttaaa ggaagtttgt ctcattttgc 8340 cagaaaaaaa ttgtaatagt cggcacgctg gatttgtagg gccagcaaaa ttgcggcagt 8400 gaaactagtt tcacttctaa agcccttcat ttcccacaag gttaagctct cgaaacccca 8460 tttgatcctt ggttcctatt tcgatcctcc tttggaatct gaaaatcggt ctccatgttg 8520 tatgcagatt agaagttgcc ttgtttgtta ctcttccaac acagggtatc agggagaaag 8580 aggccttatc tgttcctcca tcccccctgt tttgacagac tgctaagaat tcctcaggac 8640 ttcctttggt tggggatttt actttcccaa aagtctgatc tgatttcttt caggggtaga 8700 caagcttgtc ctagtgctct gcttcaggtc ttatcagaag aaacccagga atagaaaagg 8760 tagatgcctt gacttttgtc cctgttgtgg ggactaaagt gttttttgcc agaattgtca 8820 aaagctccgg ttcaaactct gtagagtttc atggaaaaac aaaacaaaac aaaaaagatg 8880 cttatcgtcc cggagaatgt gtaagtaagt tctccagcac ggcttaggtt ttccaaaatg 8940 gaaagcaaag cttgcagaca acctgttttc tctagagaca cacaatgatt ctggccctca 9000 gtctgtttcc ctccccttgt ttactctttg gtcaccgatc gagtcaggct agaggggtaa 9060 tacggtgatt aaaagaagta aattctcact gtaaacttgg attgattaac agaaacaatt 9120 aaaccaaaca aaatcattgc cccaaatttc tatctccaag aattgctttg tgccattttg 9180 aattcaggta gttattctgt atatacttag ctaactattc agagcttctt caatctctag 9240 taagcttgaa ggtggtgtct gggaagacac agggcagggt gacatttaga ctctgttcat 9300 tcttaaaaat agggataagc cagaatgatg tgacatctag tatgtggtag atgaagaatc 9360 agtggaaatt cttaattgca cagactttat aatccattat ataaagtgta attccatact 9420 ttttactgtg gcaagggtgt gatgtgattg ttaatctttt taatttttga atccaaactg 9480 aatttaaagt gttgaatact taaatcctca caagtgaatt atgaaccatt tgtaaagtgt 9540 ttctataact ctttgtatca tgtgttggta catcttatca agttttttct ggcatgtaat 9600 tccattctaa acttatgtaa aatttctatt gttgctgtaa atattacaca aatatctatt 9660 ccgtgataac cttcattatc agcatgaaat ggttaatttt tactgagcac aatgtatttt 9720 tgaatggatc ttcccaaatg tctttaataa aatgcagatt ttgcactgac tgatgtgact 9780 gccaggccgt cccaatcttg agcactgtgg tccttcgtgt ttgaactgcg aacagctcca 9840 ttttagttcc ttcttgggaa gaaagaatgc attcgaattc aaatgaggga tgatgggcct 9900 ttgaggttgt aatcagtttg agacagaaat taatgtaaaa ctaggcaaat cctgtaactt 9960 aatgatgttg atctttgttt tcctatttat aaagcttttt tccccttacg gcattttgaa 10020 aactttggtt tgttttatac ttgagtgttg tcacctttgc acgtcgctag acactcacgt 10080 ggtagtttga ggaggatggg aagagaggcc aatcttgtgc taagtgctat ggagaaagca 10140 aagatgcaca gcttaataag ggttttttga ttctagagga gaggtgggca agcttttcct 10200 gtaaagggcc agatggtaaa tattgggggc tctgtggccc atcagttccc tgtcaacatt 10260 actcagctct gcctttgtat tgcagaggct gcatggataa tatgtaaatc agtaagtgtg 10320 gctgtggtcc cgtaaaactt tacttataga aacaggccat agtttactaa cccgttttag 10380 gccctcagtt tcatcattta gggtaacacc aaccgagtac atgttcaatc aggagggaaa 10440 gaacttagct tttgtgataa cttatagatg aaatattccc cagttttctt tctctttcta 10500 aacaaagggt aggagctgaa agtcagtgct ctccattctt aaaagtcctc tgtcaaccac 10560 ctcttcactc tatctcctta agtgacatgg aaacttgtgg cctgtgcttt caactataat 10620 cttaccaaga ctgaatgaaa gtatttggtg cttatacttt ttaatgttca tagcacttac 10680 tatggccagg cacaatgccc aagtgttttg ctttattatt attattatta ttattattat 10740 tattattatt attattattt tcacaacaac ccagcgaaac aggtactatt attatcccct 10800 ttttgtaaat gaggaaacag atttccatac ttgacattaa cctgcccaag gtcacccagt 10860 ttggaagtgg cagggccagg atttgaagcc gaatatgttc attgtaaagc ccatataccc 10920 ttaaaagtca ctgcacgtcc acgtatggta atgtggtcac aatcagtatt gtttctcttt 10980 agtaattcag atttattcaa gtaactccaa ggttcaaatt ttcaaaaaca gtttccaaca 11040 caggttatat taaaaacttt gcctgaagtt tactctaggt gcagaaataa agacaactta 11100 gtcaagtgaa ggaaagggta acagacttag aaatggctat ctacactgat ggaataagta 11160 tactaattag agcaggtaac aagtccccac gatgtataac atattcttct ctaaaagctc 11220 acaacaattt atgtgccacc ttccatcccc tttcccagca gatggtaatt gatgcaattt 11280 gagaatagaa cacttcattg aaacaagtca ctggaggtcc tctggggatg cagcttaaaa 11340 gcccaggatc aggccaggtg tggtggctca cgcctgtaat cccagcactg tgggagactg 11400 agacgggcag atcacctgaa gtcaggagtt cgagaccagc ctggccaata tagagaaacc 11460 ccgtctgtac taaaaataca aaaattaggt ctgggcggtg gctcacgccc gtaatcctag 11520 cactttggga ggccaaggtg ggtggatcac gaggtcagga gttcgagacc agcctggcca 11580 acatggtgaa accccgtctc tactaaaaat acaaaaattg ggtgtggtgg tacatgcctg 11640 taatcccagc tgcttaggag gctgaggcag gagaatcact tgaacccaaa aggcagaggt 11700 tgcagtgagc cgagatcacg ccactgcact ccagcctggc aacagagcga gactctgtct 11760 caaaaaaaaa aaaaaaaaaa tacaaaaatt agccgggaat ggtggtgaat gtctataatc 11820 ccagccactc gggaggctga ggcaggagaa tcacttgaac ccaaaaggca gaggttgcag 11880 tgagccaaga tcgcaccact gcactcccac ctggacgaca gagcgagacg ccatctcaaa 11940 aataaataaa taaataaatc cctaggatat agagtccgct tgcctgggtg gagtcttggc 12000 tccatctcct acatctcatg tgacttgaag caaggcactt cactatgcct cagtttcctt 12060 atctttaaat ggaggtaatc acagtaccta cctcagtgtt gttgtgaaga tttaatgaga 12120 taataacctg cagagcactt gagagtctca agaaatatga gctcttataa cattattgct 12180 attgtaaaac attgctatta cttctgtccc aatttggcag tttcaggaaa ttgagaagga 12240 atgtcactga atctttaatg ccagttacac agagctcagt aggtgtccgc acagcccttt 12300 agatgcacgt agcctatttg atcttcgtat cagccctgta aggttgggct taagaatgac 12360 ccagcatgga agtactcttg ggaccacagg ggaagcaaca gtccttgtaa gctgtttgtc 12420 agtgggcctt agcaaccaag ccccaagtgg acagaaagat ggggttctgt gagcatccat 12480 tccaagggtc actttagggg tgcaatcttc tgggctctga gaatggattc acagcagcat 12540 ctctatctgg aaataccttt gctttgtcca agtaacctcc tcccacacag agtacccgaa 12600 tcagctcaga ttttttttcc ttaatattgg caacacttaa tgctacttct ttgttcgtaa 12660 catttcattt aattatttaa aaatctgcaa atgttgtgta tattttaccg caatttttaa 12720 acaaactcca gtgtagaccg tgctctagca tttctaaaaa taaaagtaaa tatgttaaaa 12780 taaggtaaga gtgagttttt cctacactat gtataatttt taattgaaag tttcccccac 12840 aaaagaaatg atacttggaa gcatagtttg tgtgtttgac agcaagattc tattaggctt 12900 cagatttccc tcaataaaag ttttagtttt tatacattct gtcatgaatt gaatgaagta 12960 aataatatgc tgttgtaagc aaattatctg cagataaatg tcttatgaat cgtatatctt 13020 actgtttatt aaattctgaa gtattgagca gtttccaatg tgaaatccca gctggcttct 13080 ttgcaatgat ggacaagtta gttataattc atatggaaat tcaaggaacc cagaatagcc 13140 aaaacaatcc cgaagagcaa agttggagga ctcacatgcc ccaatttcaa aacttactac 13200 aaagctacaa taatgaagaa agtgaggtaa tagaatttgg agtccagaaa taaaccctct 13260 cacatttatg gtcaattgtt ttttgacaag ggtgccaaga tcattcaatg ggggaaagaa 13320 tagtcttttc agcaaatagt ggtgggacaa ctggatatcc acatgcaaaa gaatgacgtt 13380 ggactcctat ttcacaccat atacaaaaat taactcaaaa tggaacaaag atctaactgt 13440 aagaggtaga actataaaac tcatagaaga aaacataggg gtaaatcttc atgaccttgg 13500 atttggcagt ggtttctcag atatgacacc aaaggcacaa gcaaagagaa aaataaattg 13560 gacttcatca aatatttaaa attttgtgct taagaggact ctatcgagag ggttaaaaag 13620 atccacagaa tgggagaaaa tatttgcaaa tcatatccaa taagggaatt agaatataca 13680 aagaattctt aaactcagta agttgtaagc cgatttaaaa tgggcagagg atctgaaaaa 13740 cctttatcca aagatgtaca aatggccagt aaacacatga aaagatgctc aacatcatta 13800 gtcactaggg aaatgcaaat caaaaccaca gttgagatgc aacttcacac attatgggta 13860 tagtcaaaga tggacagtaa caagtgttgc tgaggatgtg gagaaagtgg aagcctccta 13920 cattgctggt ggaaatgtaa aatgatgcag ccacttggga taatagttcc tccaaagatt 13980 aaacaagagt gactgtgtgt cccagcagtt ttactcctaa gtatataccc aagataaatg 14040 aaaacacaca tccgcacaaa aacttataca caaatgttca tagcagcatt attcataata 14100 gctaaagagt ggaaacccaa atatccatca atggatgaat ggataaataa caatgtgctc 14160 ttgacatgat actgaacaat gatgttcagc aataaaaagg agtgacaagt gacatagtga 14220 tacacatgtt ataacgtgga tgaactttaa aacactatgc taagtgaaag aagccagtca 14280 cgaaatacca catactatat gatttcattt atgtagaacg tccagaaggc caatctacag 14340 agacagtcga ttcgtggttg cagagggctt ggggtggccg atgggttggg gagtgttggc 14400 tgatgggtgc aggatttctc tttggggtga taaactttct aaaattgatc tagtgataat 14460 ggttgcacaa ctctgaatat accaaaagtc atcaaattgt acactttaaa tggatacaaa 14520 ttgtatgtga acttaatctc aataaagccg tgacaaaagt ttccaacatg aa 14572 <210> 18 <211> 3434 <212> DNA <213> Artificial Sequence <220> <223> transcript variant <400> 18 attagttgtc tctgccgctg gggaaggtaa agcggcgacg gcgtcctcag gagctgtggg 60 gtcccctgct agaagtgggg gactcggcgg gggagtcatt taatacttca tgattagaac 120 aaatatgtga aagttcccac caaccagtga gaatttcttc cttcagacgg ttttggatct 180 tactgcacag ctttctgaga agttcttttg gtgccatgtt ttgtggcttg catcaaaaga 240 ggagtttgtc ttcatgaaga ttcctaacat tggtaatgtg atgaataaat ttgagatcct 300 tggggttgta ggtgaaggag cctatggagt tgtacttaaa tgcagacaca aggaaacaca 360 tgaaattgtg gcgatcaaga aattcaagga cagtgaagaa aatgaagaag tcaaagaaac 420 gactttacga gagcttaaaa tgcttcggac tctcaagcag gaaaacattg tggagttgaa 480 ggaagcattt cgtcggaggg gaaagttgta cttggtgttt gagtatgttg aaaaaaatat 540 gctcgaattg ctggaagaaa tgccaaatgg agttccacct gagaaagtaa aaagctacat 600 ctatcagcta atcaaggcta ttcactggtg ccataagaat gatattgtcc atcgagatat 660 aaaaccagaa aatctcttaa tcagccacaa tgatgtccta aaactgtgtg actttggttt 720 tgctcgtaat ctgtcagaag gcaataatgc taattacaca gagtacgttg ccaccagatg 780 gtatcggtcc ccagaactct tacttggcgc tccctatgga aagtccgtgg acatgtggtc 840 ggtgggctgt attcttgggg agcttagcga tggacagcct ttatttcctg gagaaagtga 900 aattgaccaa ctttttacta ttcagaaggt gctaggacca cttccatctg agcagatgaa 960 gcttttctac agtaatcctc gcttccatgg gctccggttt ccagctgtta accatcctca 1020 gtccttggaa agaagatacc ttggaatttt gaatagtgtt ctacttgacc taatgaagaa 1080 tttactgaag ttggacccag ctgacagata cttgacagaa cagtgtttga atcaccctac 1140 atttcaaacc cagagacttc tggatcgttc tccttcaagg tcagcaaaaa gaaaacctta 1200 ccatgtggaa agcagcacat tgtctaatag aaaccaagcc ggcaaaagta ctgctttgca 1260 gtctcaccac agatctaaca gcaaggacat ccagaacctg agtgtaggcc tgccccgggc 1320 tgacgaaggt ctccctgcca atgaaagctt cctaaatgga aaccttgctg gagctagtct 1380 tagtccactg cacaccaaaa cctaccaagc aagcagccag cctgggtcta ccagcaaaga 1440 tctcaccaac aacaacatac cacaccttct tagcccaaaa gaagccaagt caaaaacaga 1500 gtttgatttt aatattgacc caaagccttc agaaggccca gggacaaagt acctcaagtc 1560 aaacagcaga tctcagcaga accgccactc attcatggaa agctctcaaa gcaaagctgg 1620 gacactgcag cccaatgaaa agcagagtcg gcatagctat attgacacaa ttccccagtc 1680 ctctaggagt ccctcctaca ggaccaaggc caaaagccat ggggcactga gtgactccaa 1740 gtctgtgagc aacctttctg aagccagggc ccaaattgcg gagcccagta ccagtaggta 1800 cttcccatct agctgcttag acttgaattc tcccaccagc ccaaccccca ccagacacag 1860 tgacacgaga actttgctca gcccttctgg aagaaataac cgaaatgagg gaacgctgga 1920 ctcacgtcga accacaacca gacattctaa gacgatggag gaattgaagc tgccggagca 1980 catggacagt agccattccc attcactgtc tgcacctcac gaatcttttt cttatggact 2040 gggctacacc agcccctttt cttcccagca acgtcctcat aggcattcta tgtatgtgac 2100 ccgtgacaaa gtgagagcca agggcttgga tggaagcttg agcatagggc aagggatggc 2160 agctagagcc aacagcctgc aactcttgtc accccagcct ggagaacagc tccctccaga 2220 gatgactgtg gcaagatctt cggtcaaaga gacctccaga gaaggcacct cttccttcca 2280 tacacgccag aagtctgagg gtggagtgta tcatgaccca cactctgatg atggcacagc 2340 ccccaaagaa aatagacacc tatacaatga tcctgtgcca aggagagttg gtagctttta 2400 cagagtgcca tctccacgtc cagacaattc tttccatgaa aataatgtgt caactagagt 2460 ttcttctcta ccatcagaga gcagttctgg aaccaaccac tcaaaaagac aaccagcatt 2520 cgatccatgg aaaagtcctg aaaatattag tcattcagag caactcaagg aaaaagagaa 2580 gcaaggattt ttcaggtcaa tgaaaaagaa aaagaagaaa tctcaaacag tacccaattc 2640 cgacagccct gatcttctga cgttgcagaa atccattcat tctgctagca ctccaagcag 2700 cagaccaaag gagtggcgcc ccgagaagat ctcagatctg cagacccaaa gccagccatt 2760 aaaatcactg cgcaagttgt tacatctctc ttcggcctca aatcacccgg cttcctcaga 2820 tccccgcttc cagcccttaa cagctcaaca aaccaaaaat tccttctcag aaattcggat 2880 tcaccccctg agccaggcct ctggcgggag cagcaacatc cggcaggaac ccgcaccgaa 2940 gggcaggcca gccctccagc tgccagacgg tggatgtgat ggcagaagac agagacacca 3000 ttctggaccc caagatagac gcttcatgtt aaggacgaca gaacaacaag gagaatactt 3060 ctgctgtggt gacccaaaga agcctcacac tccgtgcgtc ccaaaccgag cccttcatcg 3120 tccaatctcc agtcctgctc cctatccagt actccaggtc cgaggcactt ccatgtgccc 3180 gacactccag gtccgaggca ctgatgcttt cagctgccca acccagcaat ccgggttctc 3240 tttcttcgtg agacacgtta tgagggaagc cctgattcac agggcccagg taaaccaagc 3300 tgcgctcctg acataccatg agaatgcggc actgacgggc aagtgacttc tgcaagcctg 3360 cggctggtcc caatgccctg aatcacctct ctcatggaag aaccaattaa caccaatgaa 3420 tcaaccatta aaaa 3434 <210> 19 <211> 1030 <212> PRT <213> Artificial Sequence <220> <223> amino acid sequence <400> 19 Met Lys Ile Pro Asn Ile Gly Asn Val Met Asn Lys Phe Glu Ile Leu 1 5 10 15 Gly Val Val Gly Glu Gly Ala Tyr Gly Val Val Leu Lys Cys Arg His 20 25 30 Lys Glu Thr His Glu Ile Val Ala Ile Lys Lys Phe Lys Asp Ser Glu 35 40 45 Glu Asn Glu Glu Val Lys Glu Thr Thr Leu Arg Glu Leu Lys Met Leu 50 55 60 Arg Thr Leu Lys Gln Glu Asn Ile Val Glu Leu Lys Glu Ala Phe Arg 65 70 75 80 Arg Arg Gly Lys Leu Tyr Leu Val Phe Glu Tyr Val Glu Lys Asn Met 85 90 95 Leu Glu Leu Leu Glu Glu Met Pro Asn Gly Val Pro Pro Glu Lys Val 100 105 110 Lys Ser Tyr Ile Tyr Gln Leu Ile Lys Ala Ile His Trp Cys His Lys 115 120 125 Asn Asp Ile Val His Arg Asp Ile Lys Pro Glu Asn Leu Leu Ile Ser 130 135 140 His Asn Asp Val Leu Lys Leu Cys Asp Phe Gly Phe Ala Arg Asn Leu 145 150 155 160 Ser Glu Gly Asn Asn Ala Asn Tyr Thr Glu Tyr Val Ala Thr Arg Trp 165 170 175 Tyr Arg Ser Pro Glu Leu Leu Leu Gly Ala Pro Tyr Gly Lys Ser Val 180 185 190 Asp Met Trp Ser Val Gly Cys Ile Leu Gly Glu Leu Ser Asp Gly Gln 195 200 205 Pro Leu Phe Pro Gly Glu Ser Glu Ile Asp Gln Leu Phe Thr Ile Gln 210 215 220 Lys Val Leu Gly Pro Leu Pro Ser Glu Gln Met Lys Leu Phe Tyr Ser 225 230 235 240 Asn Pro Arg Phe His Gly Leu Arg Phe Pro Ala Val Asn His Pro Gln 245 250 255 Ser Leu Glu Arg Arg Tyr Leu Gly Ile Leu Asn Ser Val Leu Leu Asp 260 265 270 Leu Met Lys Asn Leu Leu Lys Leu Asp Pro Ala Asp Arg Tyr Leu Thr 275 280 285 Glu Gln Cys Leu Asn His Pro Thr Phe Gln Thr Gln Arg Leu Leu Asp 290 295 300 Arg Ser Pro Ser Arg Ser Ala Lys Arg Lys Pro Tyr His Val Glu Ser 305 310 315 320 Ser Thr Leu Ser Asn Arg Asn Gln Ala Gly Lys Ser Thr Ala Leu Gln 325 330 335 Ser His His Arg Ser Asn Ser Lys Asp Ile Gln Asn Leu Ser Val Gly 340 345 350 Leu Pro Arg Ala Asp Glu Gly Leu Pro Ala Asn Glu Ser Phe Leu Asn 355 360 365 Gly Asn Leu Ala Gly Ala Ser Leu Ser Pro Leu His Thr Lys Thr Tyr 370 375 380 Gln Ala Ser Ser Gln Pro Gly Ser Thr Ser Lys Asp Leu Thr Asn Asn 385 390 395 400 Asn Ile Pro His Leu Leu Ser Pro Lys Glu Ala Lys Ser Lys Thr Glu 405 410 415 Phe Asp Phe Asn Ile Asp Pro Lys Pro Ser Glu Gly Pro Gly Thr Lys 420 425 430 Tyr Leu Lys Ser Asn Ser Arg Ser Gln Gln Asn Arg His Ser Phe Met 435 440 445 Glu Ser Ser Gln Ser Lys Ala Gly Thr Leu Gln Pro Asn Glu Lys Gln 450 455 460 Ser Arg His Ser Tyr Ile Asp Thr Ile Pro Gln Ser Ser Arg Ser Pro 465 470 475 480 Ser Tyr Arg Thr Lys Ala Lys Ser His Gly Ala Leu Ser Asp Ser Lys 485 490 495 Ser Val Ser Asn Leu Ser Glu Ala Arg Ala Gln Ile Ala Glu Pro Ser 500 505 510 Thr Ser Arg Tyr Phe Pro Ser Ser Cys Leu Asp Leu Asn Ser Pro Thr 515 520 525 Ser Pro Thr Pro Thr Arg His Ser Asp Thr Arg Thr Leu Leu Ser Pro 530 535 540 Ser Gly Arg Asn Asn Arg Asn Glu Gly Thr Leu Asp Ser Arg Arg Thr 545 550 555 560 Thr Thr Arg His Ser Lys Thr Met Glu Glu Leu Lys Leu Pro Glu His 565 570 575 Met Asp Ser Ser His Ser His Ser Leu Ser Ala Pro His Glu Ser Phe 580 585 590 Ser Tyr Gly Leu Gly Tyr Thr Ser Pro Phe Ser Ser Gln Gln Arg Pro 595 600 605 His Arg His Ser Met Tyr Val Thr Arg Asp Lys Val Arg Ala Lys Gly 610 615 620 Leu Asp Gly Ser Leu Ser Ile Gly Gln Gly Met Ala Ala Arg Ala Asn 625 630 635 640 Ser Leu Gln Leu Leu Ser Pro Gln Pro Gly Glu Gln Leu Pro Pro Glu 645 650 655 Met Thr Val Ala Arg Ser Ser Val Lys Glu Thr Ser Arg Glu Gly Thr 660 665 670 Ser Ser Phe His Thr Arg Gln Lys Ser Glu Gly Gly Val Tyr His Asp 675 680 685 Pro His Ser Asp Asp Gly Thr Ala Pro Lys Glu Asn Arg His Leu Tyr 690 695 700 Asn Asp Pro Val Pro Arg Arg Val Gly Ser Phe Tyr Arg Val Pro Ser 705 710 715 720 Pro Arg Pro Asp Asn Ser Phe His Glu Asn Asn Val Ser Thr Arg Val 725 730 735 Ser Ser Leu Pro Ser Glu Ser Ser Ser Gly Thr Asn His Ser Lys Arg 740 745 750 Gln Pro Ala Phe Asp Pro Trp Lys Ser Pro Glu Asn Ile Ser His Ser 755 760 765 Glu Gln Leu Lys Glu Lys Glu Lys Gln Gly Phe Phe Arg Ser Met Lys 770 775 780 Lys Lys Lys Lys Lys Ser Gln Thr Val Pro Asn Ser Asp Ser Pro Asp 785 790 795 800 Leu Leu Thr Leu Gln Lys Ser Ile His Ser Ala Ser Thr Pro Ser Ser 805 810 815 Arg Pro Lys Glu Trp Arg Pro Glu Lys Ile Ser Asp Leu Gln Thr Gln 820 825 830 Ser Gln Pro Leu Lys Ser Leu Arg Lys Leu Leu His Leu Ser Ser Ala 835 840 845 Ser Asn His Pro Ala Ser Ser Asp Pro Arg Phe Gln Pro Leu Thr Ala 850 855 860 Gln Gln Thr Lys Asn Ser Phe Ser Glu Ile Arg Ile His Pro Leu Ser 865 870 875 880 Gln Ala Ser Gly Gly Ser Ser Asn Ile Arg Gln Glu Pro Ala Pro Lys 885 890 895 Gly Arg Pro Ala Leu Gln Leu Pro Asp Gly Gly Cys Asp Gly Arg Arg 900 905 910 Gln Arg His His Ser Gly Pro Gln Asp Arg Arg Phe Met Leu Arg Thr 915 920 925 Thr Glu Gln Gln Gly Glu Tyr Phe Cys Cys Gly Asp Pro Lys Lys Pro 930 935 940 His Thr Pro Cys Val Pro Asn Arg Ala Leu His Arg Pro Ile Ser Ser 945 950 955 960 Pro Ala Pro Tyr Pro Val Leu Gln Val Arg Gly Thr Ser Met Cys Pro 965 970 975 Thr Leu Gln Val Arg Gly Thr Asp Ala Phe Ser Cys Pro Thr Gln Gln 980 985 990 Ser Gly Phe Ser Phe Phe Val Arg His Val Met Arg Glu Ala Leu Ile 995 1000 1005 His Arg Ala Gln Val Asn Gln Ala Ala Leu Leu Thr Tyr His Glu 1010 1015 1020 Asn Ala Ala Leu Thr Gly Lys 1025 1030 <210> 20 <211> 960 <212> PRT <213> Artificial Sequence <220> <223> amino acid sequence <400> 20 Met Lys Ile Pro Asn Ile Gly Asn Val Met Asn Lys Phe Glu Ile Leu 1 5 10 15 Gly Val Val Gly Glu Gly Ala Tyr Gly Val Val Leu Lys Cys Arg His 20 25 30 Lys Glu Thr His Glu Ile Val Ala Ile Lys Lys Phe Lys Asp Ser Glu 35 40 45 Glu Asn Glu Glu Val Lys Glu Thr Thr Leu Arg Glu Leu Lys Met Leu 50 55 60 Arg Thr Leu Lys Gln Glu Asn Ile Val Glu Leu Lys Glu Ala Phe Arg 65 70 75 80 Arg Arg Gly Lys Leu Tyr Leu Val Phe Glu Tyr Val Glu Lys Asn Met 85 90 95 Leu Glu Leu Leu Glu Glu Met Pro Asn Gly Val Pro Pro Glu Lys Val 100 105 110 Lys Ser Tyr Ile Tyr Gln Leu Ile Lys Ala Ile His Trp Cys His Lys 115 120 125 Asn Asp Ile Val His Arg Asp Ile Lys Pro Glu Asn Leu Leu Ile Ser 130 135 140 His Asn Asp Val Leu Lys Leu Cys Asp Phe Gly Phe Ala Arg Asn Leu 145 150 155 160 Ser Glu Gly Asn Asn Ala Asn Tyr Thr Glu Tyr Val Ala Thr Arg Trp 165 170 175 Tyr Arg Ser Pro Glu Leu Leu Leu Gly Ala Pro Tyr Gly Lys Ser Val 180 185 190 Asp Met Trp Ser Val Gly Cys Ile Leu Gly Glu Leu Ser Asp Gly Gln 195 200 205 Pro Leu Phe Pro Gly Glu Ser Glu Ile Asp Gln Leu Phe Thr Ile Gln 210 215 220 Lys Val Leu Gly Pro Leu Pro Ser Glu Gln Met Lys Leu Phe Tyr Ser 225 230 235 240 Asn Pro Arg Phe His Gly Leu Arg Phe Pro Ala Val Asn His Pro Gln 245 250 255 Ser Leu Glu Arg Arg Tyr Leu Gly Ile Leu Asn Ser Val Leu Leu Asp 260 265 270 Leu Met Lys Asn Leu Leu Lys Leu Asp Pro Ala Asp Arg Tyr Leu Thr 275 280 285 Glu Gln Cys Leu Asn His Pro Thr Phe Gln Thr Gln Arg Leu Leu Asp 290 295 300 Arg Ser Pro Ser Arg Ser Ala Lys Arg Lys Pro Tyr His Val Glu Ser 305 310 315 320 Ser Thr Leu Ser Asn Arg Asn Gln Ala Gly Lys Ser Thr Ala Leu Gln 325 330 335 Ser His His Arg Ser Asn Ser Lys Asp Ile Gln Asn Leu Ser Val Gly 340 345 350 Leu Pro Arg Ala Asp Glu Gly Leu Pro Ala Asn Glu Ser Phe Leu Asn 355 360 365 Gly Asn Leu Ala Gly Ala Ser Leu Ser Pro Leu His Thr Lys Thr Tyr 370 375 380 Gln Ala Ser Ser Gln Pro Gly Ser Thr Ser Lys Asp Leu Thr Asn Asn 385 390 395 400 Asn Ile Pro His Leu Leu Ser Pro Lys Glu Ala Lys Ser Lys Thr Glu 405 410 415 Phe Asp Phe Asn Ile Asp Pro Lys Pro Ser Glu Gly Pro Gly Thr Lys 420 425 430 Tyr Leu Lys Ser Asn Ser Arg Ser Gln Gln Asn Arg His Ser Phe Met 435 440 445 Glu Ser Ser Gln Ser Lys Ala Gly Thr Leu Gln Pro Asn Glu Lys Gln 450 455 460 Ser Arg His Ser Tyr Ile Asp Thr Ile Pro Gln Ser Ser Arg Ser Pro 465 470 475 480 Ser Tyr Arg Thr Lys Ala Lys Ser His Gly Ala Leu Ser Asp Ser Lys 485 490 495 Ser Val Ser Asn Leu Ser Glu Ala Arg Ala Gln Ile Ala Glu Pro Ser 500 505 510 Thr Ser Arg Tyr Phe Pro Ser Ser Cys Leu Asp Leu Asn Ser Pro Thr 515 520 525 Ser Pro Thr Pro Thr Arg His Ser Asp Thr Arg Thr Leu Leu Ser Pro 530 535 540 Ser Gly Arg Asn Asn Arg Asn Glu Gly Thr Leu Asp Ser Arg Arg Thr 545 550 555 560 Thr Thr Arg His Ser Lys Thr Met Glu Glu Leu Lys Leu Pro Glu His 565 570 575 Met Asp Ser Ser His Ser His Ser Leu Ser Ala Pro His Glu Ser Phe 580 585 590 Ser Tyr Gly Leu Gly Tyr Thr Ser Pro Phe Ser Ser Gln Gln Arg Pro 595 600 605 His Arg His Ser Met Tyr Val Thr Arg Asp Lys Val Arg Ala Lys Gly 610 615 620 Leu Asp Gly Ser Leu Ser Ile Gly Gln Gly Met Ala Ala Arg Ala Asn 625 630 635 640 Ser Leu Gln Leu Leu Ser Pro Gln Pro Gly Glu Gln Leu Pro Pro Glu 645 650 655 Met Thr Val Ala Arg Ser Ser Val Lys Glu Thr Ser Arg Glu Gly Thr 660 665 670 Ser Ser Phe His Thr Arg Gln Lys Ser Glu Gly Gly Val Tyr His Asp 675 680 685 Pro His Ser Asp Asp Gly Thr Ala Pro Lys Glu Asn Arg His Leu Tyr 690 695 700 Asn Asp Pro Val Pro Arg Arg Val Gly Ser Phe Tyr Arg Val Pro Ser 705 710 715 720 Pro Arg Pro Asp Asn Ser Phe His Glu Asn Asn Val Ser Thr Arg Val 725 730 735 Ser Ser Leu Pro Ser Glu Ser Ser Ser Gly Thr Asn His Ser Lys Arg 740 745 750 Gln Pro Ala Phe Asp Pro Trp Lys Ser Pro Glu Asn Ile Ser His Ser 755 760 765 Glu Gln Leu Lys Glu Lys Glu Lys Gln Gly Phe Phe Arg Ser Met Lys 770 775 780 Lys Lys Lys Lys Lys Ser Gln Thr Val Pro Asn Ser Asp Ser Pro Asp 785 790 795 800 Leu Leu Thr Leu Gln Lys Ser Ile His Ser Ala Ser Thr Pro Ser Ser 805 810 815 Arg Pro Lys Glu Trp Arg Pro Glu Lys Ile Ser Asp Leu Gln Thr Gln 820 825 830 Ser Gln Pro Leu Lys Ser Leu Arg Lys Leu Leu His Leu Ser Ser Ala 835 840 845 Ser Asn His Pro Ala Ser Ser Asp Pro Arg Phe Gln Pro Leu Thr Ala 850 855 860 Gln Gln Thr Lys Asn Ser Phe Ser Glu Ile Arg Ile His Pro Leu Ser 865 870 875 880 Gln Ala Ser Gly Gly Ser Ser Asn Ile Arg Gln Glu Pro Ala Pro Lys 885 890 895 Gly Arg Pro Ala Leu Gln Leu Pro Gly Gln Met Asp Pro Gly Trp His 900 905 910 Val Ser Ser Val Thr Arg Ser Ala Thr Glu Gly Pro Ser Tyr Ser Glu 915 920 925 Gln Leu Gly Ala Lys Ser Gly Pro Asn Gly His Pro Tyr Asn Arg Thr 930 935 940 Asn Arg Ser Arg Met Pro Asn Leu Asn Asp Leu Lys Glu Thr Ala Leu 945 950 955 960 <210> 21 <211> 1030 <212> PRT <213> Artificial Sequence <220> <223> amino acid sequence <400> 21 Met Lys Ile Pro Asn Ile Gly Asn Val Met Asn Lys Phe Glu Ile Leu 1 5 10 15 Gly Val Val Gly Glu Gly Ala Tyr Gly Val Val Leu Lys Cys Arg His 20 25 30 Lys Glu Thr His Glu Ile Val Ala Ile Lys Lys Phe Lys Asp Ser Glu 35 40 45 Glu Asn Glu Glu Val Lys Glu Thr Thr Leu Arg Glu Leu Lys Met Leu 50 55 60 Arg Thr Leu Lys Gln Glu Asn Ile Val Glu Leu Lys Glu Ala Phe Arg 65 70 75 80 Arg Arg Gly Lys Leu Tyr Leu Val Phe Glu Tyr Val Glu Lys Asn Met 85 90 95 Leu Glu Leu Leu Glu Glu Met Pro Asn Gly Val Pro Pro Glu Lys Val 100 105 110 Lys Ser Tyr Ile Tyr Gln Leu Ile Lys Ala Ile His Trp Cys His Lys 115 120 125 Asn Asp Ile Val His Arg Asp Ile Lys Pro Glu Asn Leu Leu Ile Ser 130 135 140 His Asn Asp Val Leu Lys Leu Cys Asp Phe Gly Phe Ala Arg Asn Leu 145 150 155 160 Ser Glu Gly Asn Asn Ala Asn Tyr Thr Glu Tyr Val Ala Thr Arg Trp 165 170 175 Tyr Arg Ser Pro Glu Leu Leu Leu Gly Ala Pro Tyr Gly Lys Ser Val 180 185 190 Asp Met Trp Ser Val Gly Cys Ile Leu Gly Glu Leu Ser Asp Gly Gln 195 200 205 Pro Leu Phe Pro Gly Glu Ser Glu Ile Asp Gln Leu Phe Thr Ile Gln 210 215 220 Lys Val Leu Gly Pro Leu Pro Ser Glu Gln Met Lys Leu Phe Tyr Ser 225 230 235 240 Asn Pro Arg Phe His Gly Leu Arg Phe Pro Ala Val Asn His Pro Gln 245 250 255 Ser Leu Glu Arg Arg Tyr Leu Gly Ile Leu Asn Ser Val Leu Leu Asp 260 265 270 Leu Met Lys Asn Leu Leu Lys Leu Asp Pro Ala Asp Arg Tyr Leu Thr 275 280 285 Glu Gln Cys Leu Asn His Pro Thr Phe Gln Thr Gln Arg Leu Leu Asp 290 295 300 Arg Ser Pro Ser Arg Ser Ala Lys Arg Lys Pro Tyr His Val Glu Ser 305 310 315 320 Ser Thr Leu Ser Asn Arg Asn Gln Ala Gly Lys Ser Thr Ala Leu Gln 325 330 335 Ser His His Arg Ser Asn Ser Lys Asp Ile Gln Asn Leu Ser Val Gly 340 345 350 Leu Pro Arg Ala Asp Glu Gly Leu Pro Ala Asn Glu Ser Phe Leu Asn 355 360 365 Gly Asn Leu Ala Gly Ala Ser Leu Ser Pro Leu His Thr Lys Thr Tyr 370 375 380 Gln Ala Ser Ser Gln Pro Gly Ser Thr Ser Lys Asp Leu Thr Asn Asn 385 390 395 400 Asn Ile Pro His Leu Leu Ser Pro Lys Glu Ala Lys Ser Lys Thr Glu 405 410 415 Phe Asp Phe Asn Ile Asp Pro Lys Pro Ser Glu Gly Pro Gly Thr Lys 420 425 430 Tyr Leu Lys Ser Asn Ser Arg Ser Gln Gln Asn Arg His Ser Phe Met 435 440 445 Glu Ser Ser Gln Ser Lys Ala Gly Thr Leu Gln Pro Asn Glu Lys Gln 450 455 460 Ser Arg His Ser Tyr Ile Asp Thr Ile Pro Gln Ser Ser Arg Ser Pro 465 470 475 480 Ser Tyr Arg Thr Lys Ala Lys Ser His Gly Ala Leu Ser Asp Ser Lys 485 490 495 Ser Val Ser Asn Leu Ser Glu Ala Arg Ala Gln Ile Ala Glu Pro Ser 500 505 510 Thr Ser Arg Tyr Phe Pro Ser Ser Cys Leu Asp Leu Asn Ser Pro Thr 515 520 525 Ser Pro Thr Pro Thr Arg His Ser Asp Thr Arg Thr Leu Leu Ser Pro 530 535 540 Ser Gly Arg Asn Asn Arg Asn Glu Gly Thr Leu Asp Ser Arg Arg Thr 545 550 555 560 Thr Thr Arg His Ser Lys Thr Met Glu Glu Leu Lys Leu Pro Glu His 565 570 575 Met Asp Ser Ser His Ser His Ser Leu Ser Ala Pro His Glu Ser Phe 580 585 590 Ser Tyr Gly Leu Gly Tyr Thr Ser Pro Phe Ser Ser Gln Gln Arg Pro 595 600 605 His Arg His Ser Met Tyr Val Thr Arg Asp Lys Val Arg Ala Lys Gly 610 615 620 Leu Asp Gly Ser Leu Ser Ile Gly Gln Gly Met Ala Ala Arg Ala Asn 625 630 635 640 Ser Leu Gln Leu Leu Ser Pro Gln Pro Gly Glu Gln Leu Pro Pro Glu 645 650 655 Met Thr Val Ala Arg Ser Ser Val Lys Glu Thr Ser Arg Glu Gly Thr 660 665 670 Ser Ser Phe His Thr Arg Gln Lys Ser Glu Gly Gly Val Tyr His Asp 675 680 685 Pro His Ser Asp Asp Gly Thr Ala Pro Lys Glu Asn Arg His Leu Tyr 690 695 700 Asn Asp Pro Val Pro Arg Arg Val Gly Ser Phe Tyr Arg Val Pro Ser 705 710 715 720 Pro Arg Pro Asp Asn Ser Phe His Glu Asn Asn Val Ser Thr Arg Val 725 730 735 Ser Ser Leu Pro Ser Glu Ser Ser Ser Gly Thr Asn His Ser Lys Arg 740 745 750 Gln Pro Ala Phe Asp Pro Trp Lys Ser Pro Glu Asn Ile Ser His Ser 755 760 765 Glu Gln Leu Lys Glu Lys Glu Lys Gln Gly Phe Phe Arg Ser Met Lys 770 775 780 Lys Lys Lys Lys Lys Ser Gln Thr Val Pro Asn Ser Asp Ser Pro Asp 785 790 795 800 Leu Leu Thr Leu Gln Lys Ser Ile His Ser Ala Ser Thr Pro Ser Ser 805 810 815 Arg Pro Lys Glu Trp Arg Pro Glu Lys Ile Ser Asp Leu Gln Thr Gln 820 825 830 Ser Gln Pro Leu Lys Ser Leu Arg Lys Leu Leu His Leu Ser Ser Ala 835 840 845 Ser Asn His Pro Ala Ser Ser Asp Pro Arg Phe Gln Pro Leu Thr Ala 850 855 860 Gln Gln Thr Lys Asn Ser Phe Ser Glu Ile Arg Ile His Pro Leu Ser 865 870 875 880 Gln Ala Ser Gly Gly Ser Ser Asn Ile Arg Gln Glu Pro Ala Pro Lys 885 890 895 Gly Arg Pro Ala Leu Gln Leu Pro Asp Gly Gly Cys Asp Gly Arg Arg 900 905 910 Gln Arg His His Ser Gly Pro Gln Asp Arg Arg Phe Met Leu Arg Thr 915 920 925 Thr Glu Gln Gln Gly Glu Tyr Phe Cys Cys Gly Asp Pro Lys Lys Pro 930 935 940 His Thr Pro Cys Val Pro Asn Arg Ala Leu His Arg Pro Ile Ser Ser 945 950 955 960 Pro Ala Pro Tyr Pro Val Leu Gln Val Arg Gly Thr Ser Met Cys Pro 965 970 975 Thr Leu Gln Val Arg Gly Thr Asp Ala Phe Ser Cys Pro Thr Gln Gln 980 985 990 Ser Gly Phe Ser Phe Phe Val Arg His Val Met Arg Glu Ala Leu Ile 995 1000 1005 His Arg Ala Gln Val Asn Gln Ala Ala Leu Leu Thr Tyr His Glu 1010 1015 1020 Asn Ala Ala Leu Thr Gly Lys 1025 1030 <210> 22 <211> 2883 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid sequence <400> 22 atgaagatcc ccaacatcgg caacgtgatg aacaagttcg agatcctggg cgttgtcgga 60 gaaggcgctt atggcgtggt gctgaagtgc agacacaaag aaacccacga gatcgtggcc 120 atcaagaagt tcaaggacag cgaagagaac gaggaagtga aagagacaac cctgcgcgag 180 ctgaagatgc tgagaaccct gaagcaagag aacatcgtgg aactgaaaga ggccttccgg 240 cggagaggca agctgtacct ggtgttcgag tacgtggaaa agaacatgct cgagctgctg 300 gaagagatgc ccaatggcgt gccacctgag aaagtgaagt cctacatcta ccagctgatc 360 aaggccatcc actggtgcca caagaacgac atcgtgcaca gagacatcaa gcccgagaac 420 ctgctgatct cccacaacga cgtgctgaag ctgtgcgact tcggcttcgc cagaaatctg 480 agcgagggca acaacgccaa ctacaccgag tatgtggcca ccagatggta cagaagccct 540 gaactgctgc tgggagcccc ttacggcaag tctgtggata tgtggtccgt gggctgtatc 600 ctgggagagc tgtctgatgg ccaacctctg tttcctggcg agtccgagat cgaccagctg 660 ttcacaatcc agaaggtgct gggccctctg cctagcgagc agatgaagct gttctacagc 720 aaccccagat tccacggcct gagattccct gccgtgaatc accctcagag cctggaaaga 780 agatacctgg gcatcctgaa cagcgtgctg ctggacctga tgaagaatct gctgaaactg 840 gaccccgccg acagatacct gaccgagcag tgtctgaacc atcctacctt tcagacccag 900 agactgctgg atagaagccc cagcagaagc gccaagagaa agccctacca cgtggaaagc 960 agcaccctga gcaatagaaa ccaggccgga aagagcactg ccctgcagag ccaccacaga 1020 agcaacagca aggacatcca gaacctgagc gtgggcctgc ctagagctga tgaaggactg 1080 cctgccaacg agagcttcct gaatggaaat ctggctggcg cctctctgag ccctctgcac 1140 acaaagacat accaggccag cagccagcct ggcagcacaa gcaaggacct gaccaacaac 1200 aacatccctc atctgctgag ccccaaagag gccaagagca agaccgagtt cgacttcaac 1260 atcgacccca agcctagcga aggccctggc accaagtacc tgaagtccaa ctccagaagc 1320 cagcagaacc ggcactcctt catggaaagc tctcagagca aggccggcac actgcagcct 1380 aacgagaagc agagcagaca cagctacatc gacacaatcc ctcagtcctc tcggagcccc 1440 agctacagaa caaaggccaa atctcacggc gccctgagcg atagcaagag cgtgtccaat 1500 ctgtccgagg ctagagccca gatcgccgag cctagcacca gcagatactt ccctagcagc 1560 tgcctggatc tgaacagccc tacaagcccc acacctacca ggcacagcga taccagaaca 1620 ctgctgtccc caagcggccg gaacaacaga aatgagggca ccctggacag cagacggacc 1680 accacaagac acagcaagac catggaagaa ctgaagctgc ccgagcacat ggactctagc 1740 cactctcatt ctctgagcgc ccctcacgag tcctttagct acggcctggg ctacacaagc 1800 ccattttcca gtcagcagcg gccccacaga cactctatgt acgtgaccag agacaaagtc 1860 cgcgccaaag gcctggatgg ctctctgtct attggacaag gcatggccgc cagagccaat 1920 agcctgcaac ttctgtctcc tcagcctggc gaacagctgc ctcctgaaat gacagtggcc 1980 cggtccagcg tgaaagaaac cagcagagag ggcacctcca gcttccacac cagacagaaa 2040 agcgaaggcg gcgtgtacca cgatcctcac tctgatgatg gcacagcccc taaagagaac 2100 agacacctgt acaacgaccc cgtgcctaga agagtgggct ccttctacag agtgccttct 2160 cctagacctg acaactcctt ccacgagaac aacgtgtcaa cccgggtgtc cagcctgcct 2220 tctgagagca gctctggcac aaaccactcc aagaggcagc ccgccttcga tccttggaag 2280 tcccctgaga atatcagcca ctccgagcag ctgaaagaga aagagaagca gggctttttc 2340 cggtccatga agaagaagaa aaagaagtcc cagacagtcc ccaacagcga cagccctgat 2400 ctcctgacac tgcagaagtc catccacagc gccagcacac ctagcagcag acctaaagag 2460 tggcggccag agaagatcag cgacctgcaa acacagagcc agcctctgaa gtccctgagg 2520 aagctgctgc atctgtcctc cgcctctaat caccctgcca gcagcgatcc cagatttcag 2580 ccactgacag cccagcagac caagaactcc ttcagcgaga tccggattca cccactgtct 2640 caggccagcg gcggcagctc taatatcaga caagagcccg ctcctaaggg cagacctgct 2700 ctccaactgc ctggacagat ggatcctggc tggcacgtgt cctctgtgac aagatctgcc 2760 accgagggac ctagctattc tgagcagctg ggcgccaagt ctggccccaa tggacacccc 2820 tacaaccgga ccaatcggag cagaatgccc aacctgaacg acctcaaaga aacagccctc 2880 tga 2883 <210> 23 <211> 466 <212> DNA <213> Artificial Sequence <220> <223> promoter <400> 23 ctgcagaggg ccctgcgtat gagtgcaagt gggttttagg accaggatga ggcggggtgg 60 gggtgcctac ctgacgaccg accccgaccc actggacaag cacccaaccc ccattcccca 120 aattgcgcat cccctatcag agagggggag gggaaacagg atgcggcgag gcgcgtgcgc 180 actgccagct tcagcaccgc ggacagtgcc ttcgcccccg cctggcggcg cgcgccaccg 240 ccgcctcagc actgaaggcg cgctgacgtc actcgccggt cccccgcaaa ctccccttcc 300 cggccacctt ggtcgcgtcc gcgccgccgc cggcccagcc ggaccgcacc acgcgaggcg 360 cgagataggg gggcacgggc gcgaccatct gcgctgcggc gccggcgact cagcgctgcc 420 tcagtctgcg gtgggcagcg gaggagtcgt gtcgtgcctg agagcg 466 <210> 24 <211> 3009 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid sequence <400> 24 atgaagatcc ccaatatcgg caacgtgatg aataagttcg agatcctggg agtggtggga 60 gagggagcat acggcgtggt gctgaagtgc agacacaagg agacacacga gatcgtggcc 120 atcaagaagt ttaaggatag cgaggagaat gaggaggtga aggagacaac cctgcgcgag 180 ctgaagatgc tgcggacact gaagcaggag aacatcgtgg agctgaagga ggccttccgg 240 agaaggggca agctgtacct ggtgtttgag tacgtggaga agaacatgct ggagctgctg 300 gaggagatgc ctaatggcgt gccccctgag aaggtgaaga gctacatcta tcagctgatc 360 aaggccatcc actggtgcca caagaacgac atcgtgcacc gcgatatcaa gccagagaac 420 ctgctgatca gccacaatga cgtgctgaag ctgtgcgatt tcggctttgc ccggaacctg 480 tccgagggca acaacgccaa ttacacagag tacgtggcaa ccaggtggta ccggtcccct 540 gagctgctgc tgggagcacc atacggcaag tctgtggaca tgtggagcgt gggctgcatc 600 ctgggagagc tgtccgacgg acagccactg ttccctggcg agtctgagat cgatcagctg 660 tttaccatcc agaaggtgct gggccccctg ccttccgagc agatgaagct gttctactct 720 aacccaaggt tccacggcct gaggtttcca gccgtgaatc acccccagtc tctggagcgc 780 cggtatctgg gcatcctgaa cagcgtgctg ctggatctga tgaagaatct gctgaagctg 840 gaccctgccg atcgctacct gaccgagcag tgtctgaatc acccaacatt tcagacccag 900 agactgctgg acaggagccc ctcccgctct gccaagagga agccttatca cgtggagagc 960 tccaccctga gcaatcgcaa ccaggccggc aagtccacag ccctgcagtc tcaccaccgg 1020 agcaactcca aggacatcca gaatctgagc gtgggcctgc caagggcaga cgagggcctg 1080 cctgccaacg agtccttcct gaatggaaac ctggcaggag cctctctgag cccactgcac 1140 acaaagacct accaggcctc tagccagcct ggctccacat ctaaggacct gaccaacaat 1200 aacatccctc acctgctgag cccaaaggag gccaagtcca agaccgagtt cgactttaat 1260 atcgatccaa agcccagcga gggcccaggc acaaagtatc tgaagagcaa ctccagatct 1320 cagcagaata ggcactcttt catggagtcc tctcagagca aggccggcac cctgcagccc 1380 aacgagaagc agagcaggca ctcctacatc gataccatcc cacagagctc ccgcagcccc 1440 tcctatcgga caaaggccaa gagccacggc gccctgtctg acagcaagtc cgtgtctaat 1500 ctgtccgagg caagagcaca gatcgcagag ccaagcacct ccaggtactt tccctcttcc 1560 tgtctggacc tgaactctcc aacaagccct acaccaacca gacacagcga tacaaggacc 1620 ctgctgtctc ccagcggcag aaataacagg aacgagggca ccctggatag cagaaggacc 1680 acaaccagac actccaagac aatggaggag ctgaagctgc ccgagcacat ggactcctct 1740 cactcccact ctctgagcgc ccctcacgag tccttctctt acggcctggg ctataccagc 1800 ccttttagct cccagcagcg cccacacagg cactccatgt acgtgacaag agacaaggtg 1860 agggccaagg gcctggacgg cagcctgtcc atcggacagg gaatggcagc aagggcaaat 1920 agcctgcagc tgctgtcccc acagcctgga gagcagctgc caccagagat gaccgtggcc 1980 agatctagcg tgaaggagac aagcagggag ggcacctcct ctttccacac aagacagaag 2040 agcgagggcg gcgtgtatca cgacccacac tccgacgacg gaaccgcacc caaggagaac 2100 aggcacctgt acaacgatcc agtgccccgc cgggtgggct ctttctatcg ggtgcctagc 2160 ccacggcccg acaactcctt tcacgagaat aacgtgtcta ccagagtgag ctccctgcct 2220 agcgagtcta gctccggcac aaaccactcc aagaggcagc cagcctttga tccctggaag 2280 tctcctgaga atatctctca cagcgagcag ctgaaggaga aggagaagca gggcttcttt 2340 cgcagcatga agaagaagaa gaagaagagc cagacaaccg acagcaccaa cggcgagaat 2400 cctagcatca agaagtccct gttcccactg tttaactcca agaatcacct gaagcactct 2460 agctccctga agaagctgcc cgtggtgaca cctccaatgg tgcccaattc cgactctcct 2520 gatctgctga ccctgcagaa gagcatccac agcgcctcca caccatctag cagacccaag 2580 gagtggaggc cagagaagat ctccgatctg cagacccagt cccagcccct gaagtctctg 2640 cggaagctgc tgcacctgtc ctctgccagc aaccaccctg caagctccga ccctaggttc 2700 cagccactga cagcccagca gaccaagaac tcttttagcg agatcagaat ccacccactg 2760 tcccaggcct ctggaggctc tagcaacatc cgccaggagc ctgccccaaa gggccggcca 2820 gccctgcagc tgccaggaca gatggacccc ggctggcacg tgtcctctgt gacaagatcc 2880 gccaccgagg gaccatccta ctctgagcag ctgggagcaa agtctggacc aaacggacac 2940 ccttataaca ggaccaatag atccaggatg cctaatctga acgacctgaa ggagacagcc 3000 ctgtgatag 3009 <210> 25 <211> 2835 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid sequence <400> 25 atgaagatcc ccaatatcgg caacgtgatg aataagttcg agatcctggg agtggtggga 60 gagggagcat acggagtggt gctgaagtgc cggcacaagg agacacacga gatcgtggcc 120 atcaagaagt ttaaggatag cgaggagaat gaggaggtga aggagacaac cctgagggag 180 ctgaagatgc tgcgcacact gaagcaggag aacatcgtgg agctgaagga ggccttccgg 240 agaaggggca agctgtacct ggtgtttgag tacgtggaga agaacatgct ggagctgctg 300 gaggagatgc ctaatggcgt gccccctgag aaggtgaaga gctacatcta tcagctgatc 360 aaggccatcc actggtgcca caagaacgac atcgtgcaca gggatatcaa gccagagaac 420 ctgctgatca gccacaatga cgtgctgaag ctgtgcgatt tcggctttgc ccgcaacctg 480 tccgagggca acaacgccaa ttacacagag tacgtggcaa ccaggtggta ccggtcccca 540 gagctgctgc tgggagcacc atacggcaag agcgtggaca tgtggtccgt gggctgcatc 600 ctgggcgagc tgtctgacgg ccagcctctg ttcccaggcg agagcgagat cgatcagctg 660 tttaccatcc agaaggtgct gggccctctg ccaagcgagc agatgaagct gttctactcc 720 aaccctaggt tccacggcct gcgctttccc gccgtgaatc accctcagag cctggagcgc 780 cggtatctgg gcatcctgaa ctccgtgctg ctggatctga tgaagaatct gctgaagctg 840 gaccccgccg ataggtacct gaccgagcag tgtctgaacc accccacatt ccagacccag 900 agactgctgg acaggtcccc ttctcgcaat caggccggca agtctacagc cctgcagagc 960 caccacagga gcaactccaa ggacatccag aatctgagcg tgggcctgcc tagggcagac 1020 gagggcctgc cagcaaacga gtcctttctg aatggaaacc tggcaggagc ctctctgagc 1080 ccactgcaca caaagaccta ccaggccagc tcccagccag gctccacatc taaggatctg 1140 accaacaata acatcccaca cctgctgtct cccaaggagg ccaagagcaa gaccgagttc 1200 gactttaata tcgatcccaa gcctagcgag ggcccaggca caaagtatct gaagagcaac 1260 tcccggagcc agcagaatag acactccttc atggagtcta gccagtctaa ggccggcacc 1320 ctgcagccca acgagaagca gagccgccac tcctacatcg ataccatccc ccagtcctct 1380 aggagccctt cctatcgcac aaaggccaag agccacggcg ccctgtctga cagcaagtcc 1440 gtgtctaatc tgtccgaggc aagggcacag atcgcagagc ccagcacctc cagatacttt 1500 cctagctcct gtctggacct gaactctcca acaagcccaa cacccacccg gcacagcgat 1560 acaagaaccc tgctgtctcc cagcggcaga aataacagga acgagggcac cctggattct 1620 agaaggacca caacccggca cagcaagaca atggaggagc tgaagctgcc cgagcacatg 1680 gactctagcc actcccactc tctgagcgcc cctcacgagt ccttctctta cggcctgggc 1740 tatacctccc cattttcctc tcaacagcgc ccccaccggc actctatgta cgtgacacgg 1800 gacaaggtga gagccaaggg cctggacggc agcctgtcca tcggacaggg aatggcagca 1860 agagcaaact ccctgcagct gctgtctcct cagccaggag agcagctgcc accagagatg 1920 accgtggcac ggagctccgt gaaggagaca agcagagagg gcacctctag cttccacaca 1980 cggcagaagt ccgagggcgg cgtgtatcac gaccctcact ctgacgacgg caccgcccca 2040 aaggagaaca gacacctgta caacgatcca gtgcctagga gggtgggctc cttctatcgg 2100 gtgccatctc cccgccctga caatagcttt cacgagaata acgtgtccac ccgggtgtcc 2160 tctctgccct ctgagagctc ctctggcaca aaccactcta agagacagcc cgcctttgac 2220 ccttggaaga gcccagagaa tatctctcac agcgagcagc tgaaggagaa ggagaagcag 2280 ggcttcttta ggagcatgaa gaagaagaag aagaagagcc agaccgtgcc taactccgac 2340 tctcccgatc tgctgaccct gcagaagagc atccacagcg cctccacacc aagctcccgg 2400 cctaaggagt ggcggcccga gaagatctcc gatctgcaga cccagagcca gccactgaag 2460 tccctgcgca agctgctgca cctgtctagc gccagcaacc accctgcctc ctctgaccca 2520 aggttccagc ccctgacagc ccagcagacc aagaactctt ttagcgagat ccgcatccac 2580 ccactgtccc aagcctctgg aggcagctcc aacatcaggc aggagccagc accaaagggc 2640 cgccccgccc tgcagctgcc tggacagatg gaccccggat ggcacgtgtc tagcgtgaca 2700 cggtccgcca ccgagggacc atcctactct gagcagctgg gagcaaagag cggacctaac 2760 ggacacccat ataacagaac caatagatcc aggatgccta atctgaacga cctgaaggag 2820 acagccctgt gatag 2835 <210> 26 <211> 2958 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid sequence <400> 26 atgaagatcc ccaatatcgg caacgtgatg aataagttcg agatcctggg agtggtggga 60 gagggagcat acggagtggt gctgaagtgc cggcacaagg agacacacga gatcgtggcc 120 atcaagaagt ttaaggatag cgaggagaat gaggaggtga aggagacaac cctgagggag 180 ctgaagatgc tgcgcacact gaagcaggag aacatcgtgg agctgaagga ggccttccgg 240 agaaggggca agctgtacct ggtgtttgag tacgtggaga agaacatgct ggagctgctg 300 gaggagatgc caaatggcgt gccccctgag aaggtgaagt cctacatcta tcagctgatc 360 aaggccatcc actggtgcca caagaacgac atcgtgcaca gggatatcaa gcccgagaac 420 ctgctgatct cccacaatga cgtgctgaag ctgtgcgatt tcggctttgc ccgcaacctg 480 agcgagggca acaacgccaa ttacacagag tacgtggcaa ccaggtggta ccggagccct 540 gagctgctgc tgggagcacc atacggcaag tctgtggaca tgtggagcgt gggctgcatc 600 ctgggagagc tgtccgacgg acagccactg ttccctggcg agtctgagat cgatcagctg 660 tttaccatcc agaaggtgct gggccccctg ccttccgagc agatgaagct gttctactct 720 aaccctaggt tccacggcct gcgctttcca gccgtgaatc acccccagtc tctggagcgc 780 cggtatctgg gcatcctgaa cagcgtgctg ctggatctga tgaagaatct gctgaagctg 840 gaccccgccg ataggtacct gaccgagcag tgtctgaacc accctacatt ccagacccag 900 agactgctgg acaggtcccc atctcgcaat caggccggca agtccacagc cctgcagtct 960 caccacagga gcaactccaa ggacatccag aatctgtccg tgggcctgcc aagggcagac 1020 gagggcctgc ctgccaacga gagctttctg aatggaaacc tggcaggagc ctctctgagc 1080 ccactgcaca caaagaccta ccaggccagc tcccagcctg gctccacatc taaggacctg 1140 accaacaata acatccctca cctgctgagc ccaaaggagg ccaagtccaa gaccgagttc 1200 gactttaata tcgatccaaa gccatccgag ggaccaggaa caaagtatct gaagagcaac 1260 tcccggagcc agcagaatag acactctttc atggagtcta gccagagcaa ggccggcacc 1320 ctgcagccta acgagaagca gagccgccac tcctacatcg ataccatccc acagtcctct 1380 aggagcccct cctatcgcac aaaggccaag tcccacggcg ccctgtctga cagcaagtcc 1440 gtgtctaatc tgagcgaggc aagggcacag atcgcagagc caagcacctc cagatacttt 1500 cccagctcct gtctggacct gaactctccc acaagcccta caccaacccg gcacagcgat 1560 acaagaaccc tgctgtctcc tagcggcaga aataacagga acgagggcac cctggatagc 1620 agaaggacca caaccaggca ctccaagaca atggaggagc tgaagctgcc tgagcacatg 1680 gactctagcc actcccactc tctgagcgcc ccacacgagt ccttctctta cggcctgggc 1740 tataccagcc ctttttcctc tcaacaacgc ccacaccggc actccatgta cgtgacacgg 1800 gacaaggtga gagccaaggg cctggacggc agcctgtcca tcggacaggg aatggcagca 1860 agggcaaata gcctgcagct gctgtcccca cagcctggag agcagctgcc accagagatg 1920 accgtggcac ggagctccgt gaaggagaca agcagagagg gcacctctag cttccacaca 1980 cggcagaaga gcgagggcgg cgtgtatcac gacccacact ccgacgacgg aaccgcacct 2040 aaggagaaca gacacctgta caacgatcca gtgccccgcc gggtgggctc tttctatcgg 2100 gtgcctagcc cacgccccga caactccttt cacgagaata acgtgtctac ccgggtgtcc 2160 tctctgccca gcgagagctc ctctggcaca aaccactcca agagacagcc agcctttgat 2220 ccctggaagt ctcctgagaa tatctctcac agcgagcagc tgaaggagaa ggagaagcag 2280 ggcttctttc ggtccatgaa gaagaagaag aagaagagcc agacaaccga cagcaccaac 2340 ggcgagaatc caagcatcaa gaagtccctg ttccccctgt ttaacagcaa gaatcacctg 2400 aagcacagct cctctctgaa gaagctgccc gtggtgacac ctccaatggt gcccaattcc 2460 gactctcctg atctgctgac cctgcagaag tccatccaca gcgcctccac accaagctcc 2520 cggcccaagg agtggcggcc cgagaagatc agcgatctgc agacccagtc ccagcccctg 2580 aagtctctga gaaagctgct gcacctgtct agcgcctcca accacccagc ctcctctgac 2640 cctcggttcc agccactgac agcccagcag accaagaact cttttagcga gatccgcatc 2700 cacccactgt cccaagcctc tggaggcagc tccaacatca ggcaggagcc tgccccaaag 2760 ggccgcccag ccctgcagct gccaggacag atggaccccg gctggcacgt gtctagcgtg 2820 acacggagcg ccaccgaggg accttcctac tctgagcagc tgggagcaaa gtctggacca 2880 aacggacacc cttataacag aaccaataga agcaggatgc caaatctgaa cgacctgaag 2940 gagacagccc tgtgatag 2958 <210> 27 <211> 588 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid sequence <400> 27 tcaacctctg gattacaaaa tttgtgaaag attgactggt attcttaact atgttgctcc 60 ttttacgcta tgtggatacg ctgctttaat gcctttgtat catgctattg cttcccgtat 120 ggctttcatt ttctcctcct tgtataaatc ctggttgctg tctctttatg aggagttgtg 180 gcccgttgtc aggcaacgtg gcgtggtgtg cactgtgttt gctgacgcaa cccccactgg 240 ttggggcatt gccaccacct gtcagctcct ttccgggact ttcgctttcc ccctccctat 300 tgccacggcg gaactcatcg ccgcctgcct tgcccgctgc tggacagggg ctcggctgtt 360 gggcactgac aattccgtgg tgttgtcggg gaaatcatcg tcctttcctt ggctgctcgc 420 ctgtgttgcc acctggattc tgcgcgggac gtccttctgc tacgtccctt cggccctcaa 480 tccagcggac cttccttccc gcggcctgct gccggctctg cggcctcttc cgcgtcttcg 540 ccttcgccct cagacgagtc ggatctccct ttgggccgcc tccccgca 588 <210> 28 <211> 239 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid sequence <400> 28 ggccgcttcg agcagacatg ataagataca ttgatgagtt tggacaaacc acaactagaa 60 tgcagtgaaa aaaatgcttt atttgtgaaa tttgtgatgc tattgcttta tttgtaacca 120 ttataagctg caataaacaa gttaacaaca acaattgcat tcattttatg tttcaggttc 180 agggggagat gtgggaggtt ttttaaagca agtaaaacct ctacaaatgt ggtaaaatc 239 <210> 29 <211> 7627 <212> DNA <213> Artificial Sequence <220> <223> Expression cassette <220> <221> repeat_region <222> (1)..(130) <223> 5' ITR <220> <221> misc_feature <222> (130)..(168) <223> AAV2 seq upstream of 3'ITR <220> <221> promoter <222> (226)..(1454) <223> UbC promoter <220> <221> misc_feature <222> (308)..(308) <223> Insertion (C) <220> <221> misc_feature <222> (1009)..(1009) <223> Insertion (G) <220> <221> CDS <222> (1470)..(4352) <223> hCDKL5_1 <220> <221> misc_feature <222> (4353)..(4353) <223> Deletion (G) <220> <221> misc_feature <222> (4370)..(4391) <223> miRNA183 <220> <221> misc_feature <222> (4396)..(4417) <223> miRNA183 <220> <221> misc_feature <222> (4424)..(4445) <223> miRNA183 <220> <221> misc_feature <222> (4452)..(4473) <223> miRNA183 <220> <221> polyA_signal <222> (4482)..(4608) <223> Rabbit Globin polyA <220> <221> misc_feature <222> (4639)..(4677) <223> AAV2 seq upstream of 3'ITR <220> <221> repeat_region <222> (4677)..(4806) <223> 3'ITR <400> 29 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatcc tctagaacta tagctagcat gctctaggaa gatctggcct ccgcgccggg 240 ttttggcgcc tcccgcgggc gcccccctcc tcacggcgag cgctgccacg tcagacgaag 300 ggcgcagcga gcgtcctgat ccttccgccc ggacgctcag gacagcggcc cgctgctcat 360 aagactcggc cttagaaccc cagtatcagc agaaggacat tttaggacgg gacttgggtg 420 actctagggc actggttttc tttccagaga gcggaacagg cgaggaaaag tagtcccttc 480 tcggcgattc tgcggaggga tctccgtggg gcggtgaacg ccgatgatta tataaggacg 540 cgccgggtgt ggcacagcta gttccgtcgc agccgggatt tgggtcgcgg ttcttgtttg 600 tggatcgctg tgatcgtcac ttggtgagta gcgggctgct gggctggccg gggctttcgt 660 ggccgccggg ccgctcggtg ggacggaagc gtgtggagag accgccaagg gctgtagtct 720 gggtccgcga gcaaggttgc cctgaactgg gggttggggg gagcgcagca aaatggcggc 780 tgttcccgag tcttgaatgg aagacgcttg tgaggcgggc tgtgaggtcg ttgaaacaag 840 gtggggggca tggtgggcgg caagaaccca aggtcttgag gccttcgcta atgcgggaaa 900 gctcttattc gggtgagatg ggctggggca ccatctgggg accctgacgt gaagtttgtc 960 actgactgga gaactcggtt tgtcgtctgt tgcgggggcg gcagttatgg cggtgccgtt 1020 gggcagtgca cccgtacctt tgggagcgcg cgccctcgtc gtgtcgtgac gtcacccgtt 1080 ctgttggctt ataatgcagg gtggggccac ctgccggtag gtgtgcggta ggcttttctc 1140 cgtcgcagga cgcagggttc gggcctaggg taggctctcc tgaatcgaca ggcgccggac 1200 ctctggtgag gggagggata agtgaggcgt cagtttcttt ggtcggtttt atgtacctat 1260 cttcttaagt agctgaagct ccggttttga actatgcgct cggggttggc gagtgtgttt 1320 tgtgaagttt tttaggcacc ttttgaaatg taatcatttg ggtcaatatg taattttcag 1380 tgttagacta gtaaattgtc cgctaaattc tggccgtttt tggctttttt gttagacgaa 1440 gctttattgc ggtagaattc gccgccacc atg aag atc ccc aac atc ggc aac 1493 Met Lys Ile Pro Asn Ile Gly Asn 1 5 gtg atg aac aag ttc gag atc ctg ggc gtt gtc gga gaa ggc gct tat 1541 Val Met Asn Lys Phe Glu Ile Leu Gly Val Val Gly Glu Gly Ala Tyr 10 15 20 ggc gtg gtg ctg aag tgc aga cac aaa gaa acc cac gag atc gtg gcc 1589 Gly Val Val Leu Lys Cys Arg His Lys Glu Thr His Glu Ile Val Ala 25 30 35 40 atc aag aag ttc aag gac agc gaa gag aac gag gaa gtg aaa gag aca 1637 Ile Lys Lys Phe Lys Asp Ser Glu Glu Asn Glu Glu Val Lys Glu Thr 45 50 55 acc ctg cgc gag ctg aag atg ctg aga acc ctg aag caa gag aac atc 1685 Thr Leu Arg Glu Leu Lys Met Leu Arg Thr Leu Lys Gln Glu Asn Ile 60 65 70 gtg gaa ctg aaa gag gcc ttc cgg cgg aga ggc aag ctg tac ctg gtg 1733 Val Glu Leu Lys Glu Ala Phe Arg Arg Arg Gly Lys Leu Tyr Leu Val 75 80 85 ttc gag tac gtg gaa aag aac atg ctc gag ctg ctg gaa gag atg ccc 1781 Phe Glu Tyr Val Glu Lys Asn Met Leu Glu Leu Leu Glu Glu Met Pro 90 95 100 aat ggc gtg cca cct gag aaa gtg aag tcc tac atc tac cag ctg atc 1829 Asn Gly Val Pro Pro Glu Lys Val Lys Ser Tyr Ile Tyr Gln Leu Ile 105 110 115 120 aag gcc atc cac tgg tgc cac aag aac gac atc gtg cac aga gac atc 1877 Lys Ala Ile His Trp Cys His Lys Asn Asp Ile Val His Arg Asp Ile 125 130 135 aag ccc gag aac ctg ctg atc tcc cac aac gac gtg ctg aag ctg tgc 1925 Lys Pro Glu Asn Leu Leu Ile Ser His Asn Asp Val Leu Lys Leu Cys 140 145 150 gac ttc ggc ttc gcc aga aat ctg agc gag ggc aac aac gcc aac tac 1973 Asp Phe Gly Phe Ala Arg Asn Leu Ser Glu Gly Asn Asn Ala Asn Tyr 155 160 165 acc gag tat gtg gcc acc aga tgg tac aga agc cct gaa ctg ctg ctg 2021 Thr Glu Tyr Val Ala Thr Arg Trp Tyr Arg Ser Pro Glu Leu Leu Leu 170 175 180 gga gcc cct tac ggc aag tct gtg gat atg tgg tcc gtg ggc tgt atc 2069 Gly Ala Pro Tyr Gly Lys Ser Val Asp Met Trp Ser Val Gly Cys Ile 185 190 195 200 ctg gga gag ctg tct gat ggc caa cct ctg ttt cct ggc gag tcc gag 2117 Leu Gly Glu Leu Ser Asp Gly Gln Pro Leu Phe Pro Gly Glu Ser Glu 205 210 215 atc gac cag ctg ttc aca atc cag aag gtg ctg ggc cct ctg cct agc 2165 Ile Asp Gln Leu Phe Thr Ile Gln Lys Val Leu Gly Pro Leu Pro Ser 220 225 230 gag cag atg aag ctg ttc tac agc aac ccc aga ttc cac ggc ctg aga 2213 Glu Gln Met Lys Leu Phe Tyr Ser Asn Pro Arg Phe His Gly Leu Arg 235 240 245 ttc cct gcc gtg aat cac cct cag agc ctg gaa aga aga tac ctg ggc 2261 Phe Pro Ala Val Asn His Pro Gln Ser Leu Glu Arg Arg Tyr Leu Gly 250 255 260 atc ctg aac agc gtg ctg ctg gac ctg atg aag aat ctg ctg aaa ctg 2309 Ile Leu Asn Ser Val Leu Leu Asp Leu Met Lys Asn Leu Leu Lys Leu 265 270 275 280 gac ccc gcc gac aga tac ctg acc gag cag tgt ctg aac cat cct acc 2357 Asp Pro Ala Asp Arg Tyr Leu Thr Glu Gln Cys Leu Asn His Pro Thr 285 290 295 ttt cag acc cag aga ctg ctg gat aga agc ccc agc aga agc gcc aag 2405 Phe Gln Thr Gln Arg Leu Leu Asp Arg Ser Pro Ser Arg Ser Ala Lys 300 305 310 aga aag ccc tac cac gtg gaa agc agc acc ctg agc aat aga aac cag 2453 Arg Lys Pro Tyr His Val Glu Ser Ser Thr Leu Ser Asn Arg Asn Gln 315 320 325 gcc gga aag agc act gcc ctg cag agc cac cac aga agc aac agc aag 2501 Ala Gly Lys Ser Thr Ala Leu Gln Ser His His Arg Ser Asn Ser Lys 330 335 340 gac atc cag aac ctg agc gtg ggc ctg cct aga gct gat gaa gga ctg 2549 Asp Ile Gln Asn Leu Ser Val Gly Leu Pro Arg Ala Asp Glu Gly Leu 345 350 355 360 cct gcc aac gag agc ttc ctg aat gga aat ctg gct ggc gcc tct ctg 2597 Pro Ala Asn Glu Ser Phe Leu Asn Gly Asn Leu Ala Gly Ala Ser Leu 365 370 375 agc cct ctg cac aca aag aca tac cag gcc agc agc cag cct ggc agc 2645 Ser Pro Leu His Thr Lys Thr Tyr Gln Ala Ser Ser Gln Pro Gly Ser 380 385 390 aca agc aag gac ctg acc aac aac aac atc cct cat ctg ctg agc ccc 2693 Thr Ser Lys Asp Leu Thr Asn Asn Asn Ile Pro His Leu Leu Ser Pro 395 400 405 aaa gag gcc aag agc aag acc gag ttc gac ttc aac atc gac ccc aag 2741 Lys Glu Ala Lys Ser Lys Thr Glu Phe Asp Phe Asn Ile Asp Pro Lys 410 415 420 cct agc gaa ggc cct ggc acc aag tac ctg aag tcc aac tcc aga agc 2789 Pro Ser Glu Gly Pro Gly Thr Lys Tyr Leu Lys Ser Asn Ser Arg Ser 425 430 435 440 cag cag aac cgg cac tcc ttc atg gaa agc tct cag agc aag gcc ggc 2837 Gln Gln Asn Arg His Ser Phe Met Glu Ser Ser Gln Ser Lys Ala Gly 445 450 455 aca ctg cag cct aac gag aag cag agc aga cac agc tac atc gac aca 2885 Thr Leu Gln Pro Asn Glu Lys Gln Ser Arg His Ser Tyr Ile Asp Thr 460 465 470 atc cct cag tcc tct cgg agc ccc agc tac aga aca aag gcc aaa tct 2933 Ile Pro Gln Ser Ser Arg Ser Pro Ser Tyr Arg Thr Lys Ala Lys Ser 475 480 485 cac ggc gcc ctg agc gat agc aag agc gtg tcc aat ctg tcc gag gct 2981 His Gly Ala Leu Ser Asp Ser Lys Ser Val Ser Asn Leu Ser Glu Ala 490 495 500 aga gcc cag atc gcc gag cct agc acc agc aga tac ttc cct agc agc 3029 Arg Ala Gln Ile Ala Glu Pro Ser Thr Ser Arg Tyr Phe Pro Ser Ser 505 510 515 520 tgc ctg gat ctg aac agc cct aca agc ccc aca cct acc agg cac agc 3077 Cys Leu Asp Leu Asn Ser Pro Thr Ser Pro Thr Pro Thr Arg His Ser 525 530 535 gat acc aga aca ctg ctg tcc cca agc ggc cgg aac aac aga aat gag 3125 Asp Thr Arg Thr Leu Leu Ser Pro Ser Gly Arg Asn Asn Arg Asn Glu 540 545 550 ggc acc ctg gac agc aga cgg acc acc aca aga cac agc aag acc atg 3173 Gly Thr Leu Asp Ser Arg Arg Thr Thr Thr Arg His Ser Lys Thr Met 555 560 565 gaa gaa ctg aag ctg ccc gag cac atg gac tct agc cac tct cat tct 3221 Glu Glu Leu Lys Leu Pro Glu His Met Asp Ser Ser His Ser His Ser 570 575 580 ctg agc gcc cct cac gag tcc ttt agc tac ggc ctg ggc tac aca agc 3269 Leu Ser Ala Pro His Glu Ser Phe Ser Tyr Gly Leu Gly Tyr Thr Ser 585 590 595 600 cca ttt tcc agt cag cag cgg ccc cac aga cac tct atg tac gtg acc 3317 Pro Phe Ser Ser Gln Gln Arg Pro His Arg His Ser Met Tyr Val Thr 605 610 615 aga gac aaa gtc cgc gcc aaa ggc ctg gat ggc tct ctg tct att gga 3365 Arg Asp Lys Val Arg Ala Lys Gly Leu Asp Gly Ser Leu Ser Ile Gly 620 625 630 caa ggc atg gcc gcc aga gcc aat agc ctg caa ctt ctg tct cct cag 3413 Gln Gly Met Ala Ala Arg Ala Asn Ser Leu Gln Leu Leu Ser Pro Gln 635 640 645 cct ggc gaa cag ctg cct cct gaa atg aca gtg gcc cgg tcc agc gtg 3461 Pro Gly Glu Gln Leu Pro Pro Glu Met Thr Val Ala Arg Ser Ser Val 650 655 660 aaa gaa acc agc aga gag ggc acc tcc agc ttc cac acc aga cag aaa 3509 Lys Glu Thr Ser Arg Glu Gly Thr Ser Ser Phe His Thr Arg Gln Lys 665 670 675 680 agc gaa ggc ggc gtg tac cac gat cct cac tct gat gat ggc aca gcc 3557 Ser Glu Gly Gly Val Tyr His Asp Pro His Ser Asp Asp Gly Thr Ala 685 690 695 cct aaa gag aac aga cac ctg tac aac gac ccc gtg cct aga aga gtg 3605 Pro Lys Glu Asn Arg His Leu Tyr Asn Asp Pro Val Pro Arg Arg Val 700 705 710 ggc tcc ttc tac aga gtg cct tct cct aga cct gac aac tcc ttc cac 3653 Gly Ser Phe Tyr Arg Val Pro Ser Pro Arg Pro Asp Asn Ser Phe His 715 720 725 gag aac aac gtg tca acc cgg gtg tcc agc ctg cct tct gag agc agc 3701 Glu Asn Asn Val Ser Thr Arg Val Ser Ser Leu Pro Ser Glu Ser Ser 730 735 740 tct ggc aca aac cac tcc aag agg cag ccc gcc ttc gat cct tgg aag 3749 Ser Gly Thr Asn His Ser Lys Arg Gln Pro Ala Phe Asp Pro Trp Lys 745 750 755 760 tcc cct gag aat atc agc cac tcc gag cag ctg aaa gag aaa gag aag 3797 Ser Pro Glu Asn Ile Ser His Ser Glu Gln Leu Lys Glu Lys Glu Lys 765 770 775 cag ggc ttt ttc cgg tcc atg aag aag aag aaa aag aag tcc cag aca 3845 Gln Gly Phe Phe Arg Ser Met Lys Lys Lys Lys Lys Lys Ser Gln Thr 780 785 790 gtc ccc aac agc gac agc cct gat ctc ctg aca ctg cag aag tcc atc 3893 Val Pro Asn Ser Asp Ser Pro Asp Leu Leu Thr Leu Gln Lys Ser Ile 795 800 805 cac agc gcc agc aca cct agc agc aga cct aaa gag tgg cgg cca gag 3941 His Ser Ala Ser Thr Pro Ser Ser Arg Pro Lys Glu Trp Arg Pro Glu 810 815 820 aag atc agc gac ctg caa aca cag agc cag cct ctg aag tcc ctg agg 3989 Lys Ile Ser Asp Leu Gln Thr Gln Ser Gln Pro Leu Lys Ser Leu Arg 825 830 835 840 aag ctg ctg cat ctg tcc tcc gcc tct aat cac cct gcc agc agc gat 4037 Lys Leu Leu His Leu Ser Ser Ala Ser Asn His Pro Ala Ser Ser Asp 845 850 855 ccc aga ttt cag cca ctg aca gcc cag cag acc aag aac tcc ttc agc 4085 Pro Arg Phe Gln Pro Leu Thr Ala Gln Gln Thr Lys Asn Ser Phe Ser 860 865 870 gag atc cgg att cac cca ctg tct cag gcc agc ggc ggc agc tct aat 4133 Glu Ile Arg Ile His Pro Leu Ser Gln Ala Ser Gly Gly Ser Ser Asn 875 880 885 atc aga caa gag ccc gct cct aag ggc aga cct gct ctc caa ctg cct 4181 Ile Arg Gln Glu Pro Ala Pro Lys Gly Arg Pro Ala Leu Gln Leu Pro 890 895 900 gga cag atg gat cct ggc tgg cac gtg tcc tct gtg aca aga tct gcc 4229 Gly Gln Met Asp Pro Gly Trp His Val Ser Ser Val Thr Arg Ser Ala 905 910 915 920 acc gag gga cct agc tat tct gag cag ctg ggc gcc aag tct ggc ccc 4277 Thr Glu Gly Pro Ser Tyr Ser Glu Gln Leu Gly Ala Lys Ser Gly Pro 925 930 935 aat gga cac ccc tac aac cgg acc aat cgg agc aga atg ccc aac ctg 4325 Asn Gly His Pro Tyr Asn Arg Thr Asn Arg Ser Arg Met Pro Asn Leu 940 945 950 aac gac ctc aaa gaa aca gcc ctc tga agcttatcga taccggtagt 4372 Asn Asp Leu Lys Glu Thr Ala Leu 955 960 gaattctacc agtgccatag gatagtgaat tctaccagtg ccatacacgt gagtgaattc 4432 taccagtgcc atagcatgca gtgaattcta ccagtgccat agcggccgcg atctttttcc 4492 ctctgccaaa aattatgggg acatcatgaa gccccttgag catctgactt ctggctaata 4552 aaggaaattt attttcattg caatagtgtg ttggaatttt ttgtgtctct cactcgatcg 4612 ataaggatct tcctagagca tggctacgta gataagtagc atggcgggtt aatcattaac 4672 tacaaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg ctcgctcact 4732 gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg cccgggcggc ctcagtgagc 4792 gagcgagcgc gcagccttaa ttaacctaat tcactggccg tcgttttaca acgtcgtgac 4852 tgggaaaacc ctggcgttac ccaacttaat cgccttgcag cacatccccc tttcgccagc 4912 tggcgtaata gcgaagaggc ccgcaccgat cgcccttccc aacagttgcg cagcctgaat 4972 ggcgaatggg acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt ggttacgcgc 5032 agcgtgaccg ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt cttcccttcc 5092 tttctcgcca cgttcgccgg ctttccccgt caagctctaa atcgggggct ccctttaggg 5152 ttccgattta gtgctttacg gcacctcgac cccaaaaaac ttgattaggg tgatggttca 5212 cgtagtgggc catcgccctg atagacggtt tttcgccctt tgacgttgga gtccacgttc 5272 tttaatagtg gactcttgtt ccaaactgga acaacactca accctatctc ggtctattct 5332 tttgatttat aagggatttt gccgatttcg gcctattggt taaaaaatga gctgatttaa 5392 caaaaattta acgcgaattt taacaaaata ttaacgctta caatttaggt ggcacttttc 5452 ggggaaatgt gcgcggaacc cctatttgtt tatttttcta aatacattca aatatgtatc 5512 cgctcatgag acaataaccc tgataaatgc ttcaataata ttgaaaaagg aagagtatga 5572 gtattcaaca tttccgtgtc gcccttattc ccttttttgc ggcattttgc cttcctgttt 5632 ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga agatcagttg ggtgcacgag 5692 tgggttacat cgaactggat ctcaacagcg gtaagatcct tgagagtttt cgccccgaag 5752 aacgttttcc aatgatgagc acttttaaag ttctgctatg tggcgcggta ttatcccgta 5812 ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta ttctcagaat gacttggttg 5872 agtactcacc agtcacagaa aagcatctta cggatggcat gacagtaaga gaattatgca 5932 gtgctgccat aaccatgagt gataacactg cggccaactt acttctgaca acgatcggag 5992 gaccgaagga gctaaccgct tttttgcaca acatggggga tcatgtaact cgccttgatc 6052 gttgggaacc ggagctgaat gaagccatac caaacgacga gcgtgacacc acgatgcctg 6112 tagcaatggc aacaacgttg cgcaaactat taactggcga actacttact ctagcttccc 6172 ggcaacaatt aatagactgg atggaggcgg ataaagttgc aggaccactt ctgcgctcgg 6232 cccttccggc tggctggttt attgctgata aatctggagc cggtgagcgt gggtctcgcg 6292 gtatcattgc agcactgggg ccagatggta agccctcccg tatcgtagtt atctacacga 6352 cggggagtca ggcaactatg gatgaacgaa atagacagat cgctgagata ggtgcctcac 6412 tgattaagca ttggtaactg tcagaccaag tttactcata tatactttag attgatttaa 6472 aacttcattt ttaatttaaa aggatctagg tgaagatcct ttttgataat ctcatgacca 6532 aaatccctta acgtgagttt tcgttccact gagcgtcaga ccccgtagaa aagatcaaag 6592 gatcttcttg agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac 6652 cgctaccagc ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa 6712 ctggcttcag cagagcgcag ataccaaata ctgttcttct agtgtagccg tagttaggcc 6772 accacttcaa gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag 6832 tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac 6892 cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc 6952 gaacgaccta caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc 7012 ccgaagggag aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca 7072 cgagggagct tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc 7132 tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg 7192 ccagcaacgc ggccttttta cggttcctgg ccttttgctg gccttttgct cacatgttct 7252 ttcctgcgtt atcccctgat tctgtggata accgtattac cgcctttgag tgagctgata 7312 ccgctcgccg cagccgaacg accgagcgca gcgagtcagt gagcgaggaa gcggaagagc 7372 gcccaatacg caaaccgcct ctccccgcgc gttggccgat tcattaatgc agctggcacg 7432 acaggtttcc cgactggaaa gcgggcagtg agcgcaacgc aattaatgtg agttagctca 7492 ctcattaggc accccaggct ttacacttta tgcttccggc tcgtatgttg tgtggaattg 7552 tgagcggata acaatttcac acaggaaaca gctatgacca tgattacgcc agatttaatt 7612 aaggccttaa ttagg 7627 <210> 30 <211> 960 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 30 Met Lys Ile Pro Asn Ile Gly Asn Val Met Asn Lys Phe Glu Ile Leu 1 5 10 15 Gly Val Val Gly Glu Gly Ala Tyr Gly Val Val Leu Lys Cys Arg His 20 25 30 Lys Glu Thr His Glu Ile Val Ala Ile Lys Lys Phe Lys Asp Ser Glu 35 40 45 Glu Asn Glu Glu Val Lys Glu Thr Thr Leu Arg Glu Leu Lys Met Leu 50 55 60 Arg Thr Leu Lys Gln Glu Asn Ile Val Glu Leu Lys Glu Ala Phe Arg 65 70 75 80 Arg Arg Gly Lys Leu Tyr Leu Val Phe Glu Tyr Val Glu Lys Asn Met 85 90 95 Leu Glu Leu Leu Glu Glu Met Pro Asn Gly Val Pro Pro Glu Lys Val 100 105 110 Lys Ser Tyr Ile Tyr Gln Leu Ile Lys Ala Ile His Trp Cys His Lys 115 120 125 Asn Asp Ile Val His Arg Asp Ile Lys Pro Glu Asn Leu Leu Ile Ser 130 135 140 His Asn Asp Val Leu Lys Leu Cys Asp Phe Gly Phe Ala Arg Asn Leu 145 150 155 160 Ser Glu Gly Asn Asn Ala Asn Tyr Thr Glu Tyr Val Ala Thr Arg Trp 165 170 175 Tyr Arg Ser Pro Glu Leu Leu Leu Gly Ala Pro Tyr Gly Lys Ser Val 180 185 190 Asp Met Trp Ser Val Gly Cys Ile Leu Gly Glu Leu Ser Asp Gly Gln 195 200 205 Pro Leu Phe Pro Gly Glu Ser Glu Ile Asp Gln Leu Phe Thr Ile Gln 210 215 220 Lys Val Leu Gly Pro Leu Pro Ser Glu Gln Met Lys Leu Phe Tyr Ser 225 230 235 240 Asn Pro Arg Phe His Gly Leu Arg Phe Pro Ala Val Asn His Pro Gln 245 250 255 Ser Leu Glu Arg Arg Tyr Leu Gly Ile Leu Asn Ser Val Leu Leu Asp 260 265 270 Leu Met Lys Asn Leu Leu Lys Leu Asp Pro Ala Asp Arg Tyr Leu Thr 275 280 285 Glu Gln Cys Leu Asn His Pro Thr Phe Gln Thr Gln Arg Leu Leu Asp 290 295 300 Arg Ser Pro Ser Arg Ser Ala Lys Arg Lys Pro Tyr His Val Glu Ser 305 310 315 320 Ser Thr Leu Ser Asn Arg Asn Gln Ala Gly Lys Ser Thr Ala Leu Gln 325 330 335 Ser His His Arg Ser Asn Ser Lys Asp Ile Gln Asn Leu Ser Val Gly 340 345 350 Leu Pro Arg Ala Asp Glu Gly Leu Pro Ala Asn Glu Ser Phe Leu Asn 355 360 365 Gly Asn Leu Ala Gly Ala Ser Leu Ser Pro Leu His Thr Lys Thr Tyr 370 375 380 Gln Ala Ser Ser Gln Pro Gly Ser Thr Ser Lys Asp Leu Thr Asn Asn 385 390 395 400 Asn Ile Pro His Leu Leu Ser Pro Lys Glu Ala Lys Ser Lys Thr Glu 405 410 415 Phe Asp Phe Asn Ile Asp Pro Lys Pro Ser Glu Gly Pro Gly Thr Lys 420 425 430 Tyr Leu Lys Ser Asn Ser Arg Ser Gln Gln Asn Arg His Ser Phe Met 435 440 445 Glu Ser Ser Gln Ser Lys Ala Gly Thr Leu Gln Pro Asn Glu Lys Gln 450 455 460 Ser Arg His Ser Tyr Ile Asp Thr Ile Pro Gln Ser Ser Arg Ser Pro 465 470 475 480 Ser Tyr Arg Thr Lys Ala Lys Ser His Gly Ala Leu Ser Asp Ser Lys 485 490 495 Ser Val Ser Asn Leu Ser Glu Ala Arg Ala Gln Ile Ala Glu Pro Ser 500 505 510 Thr Ser Arg Tyr Phe Pro Ser Ser Cys Leu Asp Leu Asn Ser Pro Thr 515 520 525 Ser Pro Thr Pro Thr Arg His Ser Asp Thr Arg Thr Leu Leu Ser Pro 530 535 540 Ser Gly Arg Asn Asn Arg Asn Glu Gly Thr Leu Asp Ser Arg Arg Thr 545 550 555 560 Thr Thr Arg His Ser Lys Thr Met Glu Glu Leu Lys Leu Pro Glu His 565 570 575 Met Asp Ser Ser His Ser His Ser Leu Ser Ala Pro His Glu Ser Phe 580 585 590 Ser Tyr Gly Leu Gly Tyr Thr Ser Pro Phe Ser Ser Gln Gln Arg Pro 595 600 605 His Arg His Ser Met Tyr Val Thr Arg Asp Lys Val Arg Ala Lys Gly 610 615 620 Leu Asp Gly Ser Leu Ser Ile Gly Gln Gly Met Ala Ala Arg Ala Asn 625 630 635 640 Ser Leu Gln Leu Leu Ser Pro Gln Pro Gly Glu Gln Leu Pro Pro Glu 645 650 655 Met Thr Val Ala Arg Ser Ser Val Lys Glu Thr Ser Arg Glu Gly Thr 660 665 670 Ser Ser Phe His Thr Arg Gln Lys Ser Glu Gly Gly Val Tyr His Asp 675 680 685 Pro His Ser Asp Asp Gly Thr Ala Pro Lys Glu Asn Arg His Leu Tyr 690 695 700 Asn Asp Pro Val Pro Arg Arg Val Gly Ser Phe Tyr Arg Val Pro Ser 705 710 715 720 Pro Arg Pro Asp Asn Ser Phe His Glu Asn Asn Val Ser Thr Arg Val 725 730 735 Ser Ser Leu Pro Ser Glu Ser Ser Ser Gly Thr Asn His Ser Lys Arg 740 745 750 Gln Pro Ala Phe Asp Pro Trp Lys Ser Pro Glu Asn Ile Ser His Ser 755 760 765 Glu Gln Leu Lys Glu Lys Glu Lys Gln Gly Phe Phe Arg Ser Met Lys 770 775 780 Lys Lys Lys Lys Lys Ser Gln Thr Val Pro Asn Ser Asp Ser Pro Asp 785 790 795 800 Leu Leu Thr Leu Gln Lys Ser Ile His Ser Ala Ser Thr Pro Ser Ser 805 810 815 Arg Pro Lys Glu Trp Arg Pro Glu Lys Ile Ser Asp Leu Gln Thr Gln 820 825 830 Ser Gln Pro Leu Lys Ser Leu Arg Lys Leu Leu His Leu Ser Ser Ala 835 840 845 Ser Asn His Pro Ala Ser Ser Asp Pro Arg Phe Gln Pro Leu Thr Ala 850 855 860 Gln Gln Thr Lys Asn Ser Phe Ser Glu Ile Arg Ile His Pro Leu Ser 865 870 875 880 Gln Ala Ser Gly Gly Ser Ser Asn Ile Arg Gln Glu Pro Ala Pro Lys 885 890 895 Gly Arg Pro Ala Leu Gln Leu Pro Gly Gln Met Asp Pro Gly Trp His 900 905 910 Val Ser Ser Val Thr Arg Ser Ala Thr Glu Gly Pro Ser Tyr Ser Glu 915 920 925 Gln Leu Gly Ala Lys Ser Gly Pro Asn Gly His Pro Tyr Asn Arg Thr 930 935 940 Asn Arg Ser Arg Met Pro Asn Leu Asn Asp Leu Lys Glu Thr Ala Leu 945 950 955 960 <210> 31 <211> 7210 <212> DNA <213> Artificial Sequence <220> <223> Expression cassette <220> <221> repeat_region <222> (1)..(130) <223> 5' ITR <220> <221> misc_feature <222> (130)..(168) <223> AAV2 seq upstream of 3' ITR <220> <221> promoter <222> (224)..(1021) <223> CBh <220> <221> misc_feature <222> (801)..(801) <223> A deletion <220> <221> CDS <222> (1053)..(3935) <223> hCDKL5-1 <220> <221> misc_feature <222> (3936)..(3936) <223> Deletion (G) <220> <221> misc_feature <222> (3953)..(3974) <223> miRNA183 <220> <221> misc_feature <222> (3979)..(4000) <223> miRNA183 <220> <221> misc_feature <222> (4007)..(4028) <223> miRNA183 <220> <221> misc_feature <222> (4035)..(4056) <223> miRNA183 <220> <221> polyA_signal <222> (4065)..(4191) <223> Rabbit Globin PolyA <220> <221> misc_feature <222> (4222)..(4260) <223> AAV2 seq upstream of 3' ITR <220> <221> repeat_region <222> (4260)..(4389) <223> 3' ITR <400> 31 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatcc tctagaacta tagctagcgc ccttaagggt acccgttaca taacttacgg 240 taaatggccc gcctggctga ccgcccaacg acccccgccc attgacgtca atagtaacgc 300 caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg 360 cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat 420 ggcccgcctg gcattgtgcc cagtacatga ccttatggga ctttcctact tggcagtaca 480 tctacgtatt agtcatcgct attaccatgg tcgaggtgag ccccacgttc tgcttcactc 540 tccccatctc ccccccctcc ccacccccaa ttttgtattt atttattttt taattatttt 600 gtgcagcgat gggggcgggg gggggggggg ggcgcgcgcc aggcggggcg gggcggggcg 660 aggggcgggg cggggcgagg cggagaggtg cggcggcagc caatcagagc ggcgcgctcc 720 gaaagtttcc ttttatggcg aggcggcggc ggcggcggcc ctataaaaag cgaagcgcgc 780 ggcgggcggg agtcgctgcg cgctgccttc gccccgtgcc ccgctccgcc gccgcctcgc 840 gccgcccgcc ccggctctga ctgaccgcgt tactcccaca ggtgagcggg cgggacggcc 900 cttctcctcc gggctgtaat tagctgagca agaggtaagg gtttaaggga tggttggttg 960 gtggggtatt aatgtttaat tacctggagc acctgcctga aatcactttt tttcaggttg 1020 gcttaagctg cagaccggaa ttcgccgcca cc atg aag atc ccc aac atc ggc 1073 Met Lys Ile Pro Asn Ile Gly 1 5 aac gtg atg aac aag ttc gag atc ctg ggc gtt gtc gga gaa ggc gct 1121 Asn Val Met Asn Lys Phe Glu Ile Leu Gly Val Val Gly Glu Gly Ala 10 15 20 tat ggc gtg gtg ctg aag tgc aga cac aaa gaa acc cac gag atc gtg 1169 Tyr Gly Val Val Leu Lys Cys Arg His Lys Glu Thr His Glu Ile Val 25 30 35 gcc atc aag aag ttc aag gac agc gaa gag aac gag gaa gtg aaa gag 1217 Ala Ile Lys Lys Phe Lys Asp Ser Glu Glu Asn Glu Glu Val Lys Glu 40 45 50 55 aca acc ctg cgc gag ctg aag atg ctg aga acc ctg aag caa gag aac 1265 Thr Thr Leu Arg Glu Leu Lys Met Leu Arg Thr Leu Lys Gln Glu Asn 60 65 70 atc gtg gaa ctg aaa gag gcc ttc cgg cgg aga ggc aag ctg tac ctg 1313 Ile Val Glu Leu Lys Glu Ala Phe Arg Arg Arg Gly Lys Leu Tyr Leu 75 80 85 gtg ttc gag tac gtg gaa aag aac atg ctc gag ctg ctg gaa gag atg 1361 Val Phe Glu Tyr Val Glu Lys Asn Met Leu Glu Leu Leu Glu Glu Met 90 95 100 ccc aat ggc gtg cca cct gag aaa gtg aag tcc tac atc tac cag ctg 1409 Pro Asn Gly Val Pro Pro Glu Lys Val Lys Ser Tyr Ile Tyr Gln Leu 105 110 115 atc aag gcc atc cac tgg tgc cac aag aac gac atc gtg cac aga gac 1457 Ile Lys Ala Ile His Trp Cys His Lys Asn Asp Ile Val His Arg Asp 120 125 130 135 atc aag ccc gag aac ctg ctg atc tcc cac aac gac gtg ctg aag ctg 1505 Ile Lys Pro Glu Asn Leu Leu Ile Ser His Asn Asp Val Leu Lys Leu 140 145 150 tgc gac ttc ggc ttc gcc aga aat ctg agc gag ggc aac aac gcc aac 1553 Cys Asp Phe Gly Phe Ala Arg Asn Leu Ser Glu Gly Asn Asn Ala Asn 155 160 165 tac acc gag tat gtg gcc acc aga tgg tac aga agc cct gaa ctg ctg 1601 Tyr Thr Glu Tyr Val Ala Thr Arg Trp Tyr Arg Ser Pro Glu Leu Leu 170 175 180 ctg gga gcc cct tac ggc aag tct gtg gat atg tgg tcc gtg ggc tgt 1649 Leu Gly Ala Pro Tyr Gly Lys Ser Val Asp Met Trp Ser Val Gly Cys 185 190 195 atc ctg gga gag ctg tct gat ggc caa cct ctg ttt cct ggc gag tcc 1697 Ile Leu Gly Glu Leu Ser Asp Gly Gln Pro Leu Phe Pro Gly Glu Ser 200 205 210 215 gag atc gac cag ctg ttc aca atc cag aag gtg ctg ggc cct ctg cct 1745 Glu Ile Asp Gln Leu Phe Thr Ile Gln Lys Val Leu Gly Pro Leu Pro 220 225 230 agc gag cag atg aag ctg ttc tac agc aac ccc aga ttc cac ggc ctg 1793 Ser Glu Gln Met Lys Leu Phe Tyr Ser Asn Pro Arg Phe His Gly Leu 235 240 245 aga ttc cct gcc gtg aat cac cct cag agc ctg gaa aga aga tac ctg 1841 Arg Phe Pro Ala Val Asn His Pro Gln Ser Leu Glu Arg Arg Tyr Leu 250 255 260 ggc atc ctg aac agc gtg ctg ctg gac ctg atg aag aat ctg ctg aaa 1889 Gly Ile Leu Asn Ser Val Leu Leu Asp Leu Met Lys Asn Leu Leu Lys 265 270 275 ctg gac ccc gcc gac aga tac ctg acc gag cag tgt ctg aac cat cct 1937 Leu Asp Pro Ala Asp Arg Tyr Leu Thr Glu Gln Cys Leu Asn His Pro 280 285 290 295 acc ttt cag acc cag aga ctg ctg gat aga agc ccc agc aga agc gcc 1985 Thr Phe Gln Thr Gln Arg Leu Leu Asp Arg Ser Pro Ser Arg Ser Ala 300 305 310 aag aga aag ccc tac cac gtg gaa agc agc acc ctg agc aat aga aac 2033 Lys Arg Lys Pro Tyr His Val Glu Ser Ser Thr Leu Ser Asn Arg Asn 315 320 325 cag gcc gga aag agc act gcc ctg cag agc cac cac aga agc aac agc 2081 Gln Ala Gly Lys Ser Thr Ala Leu Gln Ser His His Arg Ser Asn Ser 330 335 340 aag gac atc cag aac ctg agc gtg ggc ctg cct aga gct gat gaa gga 2129 Lys Asp Ile Gln Asn Leu Ser Val Gly Leu Pro Arg Ala Asp Glu Gly 345 350 355 ctg cct gcc aac gag agc ttc ctg aat gga aat ctg gct ggc gcc tct 2177 Leu Pro Ala Asn Glu Ser Phe Leu Asn Gly Asn Leu Ala Gly Ala Ser 360 365 370 375 ctg agc cct ctg cac aca aag aca tac cag gcc agc agc cag cct ggc 2225 Leu Ser Pro Leu His Thr Lys Thr Tyr Gln Ala Ser Ser Gln Pro Gly 380 385 390 agc aca agc aag gac ctg acc aac aac aac atc cct cat ctg ctg agc 2273 Ser Thr Ser Lys Asp Leu Thr Asn Asn Asn Ile Pro His Leu Leu Ser 395 400 405 ccc aaa gag gcc aag agc aag acc gag ttc gac ttc aac atc gac ccc 2321 Pro Lys Glu Ala Lys Ser Lys Thr Glu Phe Asp Phe Asn Ile Asp Pro 410 415 420 aag cct agc gaa ggc cct ggc acc aag tac ctg aag tcc aac tcc aga 2369 Lys Pro Ser Glu Gly Pro Gly Thr Lys Tyr Leu Lys Ser Asn Ser Arg 425 430 435 agc cag cag aac cgg cac tcc ttc atg gaa agc tct cag agc aag gcc 2417 Ser Gln Gln Asn Arg His Ser Phe Met Glu Ser Ser Gln Ser Lys Ala 440 445 450 455 ggc aca ctg cag cct aac gag aag cag agc aga cac agc tac atc gac 2465 Gly Thr Leu Gln Pro Asn Glu Lys Gln Ser Arg His Ser Tyr Ile Asp 460 465 470 aca atc cct cag tcc tct cgg agc ccc agc tac aga aca aag gcc aaa 2513 Thr Ile Pro Gln Ser Ser Arg Ser Pro Ser Tyr Arg Thr Lys Ala Lys 475 480 485 tct cac ggc gcc ctg agc gat agc aag agc gtg tcc aat ctg tcc gag 2561 Ser His Gly Ala Leu Ser Asp Ser Lys Ser Val Ser Asn Leu Ser Glu 490 495 500 gct aga gcc cag atc gcc gag cct agc acc agc aga tac ttc cct agc 2609 Ala Arg Ala Gln Ile Ala Glu Pro Ser Thr Ser Arg Tyr Phe Pro Ser 505 510 515 agc tgc ctg gat ctg aac agc cct aca agc ccc aca cct acc agg cac 2657 Ser Cys Leu Asp Leu Asn Ser Pro Thr Ser Pro Thr Pro Thr Arg His 520 525 530 535 agc gat acc aga aca ctg ctg tcc cca agc ggc cgg aac aac aga aat 2705 Ser Asp Thr Arg Thr Leu Leu Ser Pro Ser Gly Arg Asn Asn Arg Asn 540 545 550 gag ggc acc ctg gac agc aga cgg acc acc aca aga cac agc aag acc 2753 Glu Gly Thr Leu Asp Ser Arg Arg Thr Thr Thr Arg His Ser Lys Thr 555 560 565 atg gaa gaa ctg aag ctg ccc gag cac atg gac tct agc cac tct cat 2801 Met Glu Glu Leu Lys Leu Pro Glu His Met Asp Ser Ser His Ser His 570 575 580 tct ctg agc gcc cct cac gag tcc ttt agc tac ggc ctg ggc tac aca 2849 Ser Leu Ser Ala Pro His Glu Ser Phe Ser Tyr Gly Leu Gly Tyr Thr 585 590 595 agc cca ttt tcc agt cag cag cgg ccc cac aga cac tct atg tac gtg 2897 Ser Pro Phe Ser Ser Gln Gln Arg Pro His Arg His Ser Met Tyr Val 600 605 610 615 acc aga gac aaa gtc cgc gcc aaa ggc ctg gat ggc tct ctg tct att 2945 Thr Arg Asp Lys Val Arg Ala Lys Gly Leu Asp Gly Ser Leu Ser Ile 620 625 630 gga caa ggc atg gcc gcc aga gcc aat agc ctg caa ctt ctg tct cct 2993 Gly Gln Gly Met Ala Ala Arg Ala Asn Ser Leu Gln Leu Leu Ser Pro 635 640 645 cag cct ggc gaa cag ctg cct cct gaa atg aca gtg gcc cgg tcc agc 3041 Gln Pro Gly Glu Gln Leu Pro Pro Glu Met Thr Val Ala Arg Ser Ser 650 655 660 gtg aaa gaa acc agc aga gag ggc acc tcc agc ttc cac acc aga cag 3089 Val Lys Glu Thr Ser Arg Glu Gly Thr Ser Ser Phe His Thr Arg Gln 665 670 675 aaa agc gaa ggc ggc gtg tac cac gat cct cac tct gat gat ggc aca 3137 Lys Ser Glu Gly Gly Val Tyr His Asp Pro His Ser Asp Asp Gly Thr 680 685 690 695 gcc cct aaa gag aac aga cac ctg tac aac gac ccc gtg cct aga aga 3185 Ala Pro Lys Glu Asn Arg His Leu Tyr Asn Asp Pro Val Pro Arg Arg 700 705 710 gtg ggc tcc ttc tac aga gtg cct tct cct aga cct gac aac tcc ttc 3233 Val Gly Ser Phe Tyr Arg Val Pro Ser Pro Arg Pro Asp Asn Ser Phe 715 720 725 cac gag aac aac gtg tca acc cgg gtg tcc agc ctg cct tct gag agc 3281 His Glu Asn Asn Val Ser Thr Arg Val Ser Ser Leu Pro Ser Glu Ser 730 735 740 agc tct ggc aca aac cac tcc aag agg cag ccc gcc ttc gat cct tgg 3329 Ser Ser Gly Thr Asn His Ser Lys Arg Gln Pro Ala Phe Asp Pro Trp 745 750 755 aag tcc cct gag aat atc agc cac tcc gag cag ctg aaa gag aaa gag 3377 Lys Ser Pro Glu Asn Ile Ser His Ser Glu Gln Leu Lys Glu Lys Glu 760 765 770 775 aag cag ggc ttt ttc cgg tcc atg aag aag aag aaa aag aag tcc cag 3425 Lys Gln Gly Phe Phe Arg Ser Met Lys Lys Lys Lys Lys Lys Ser Gln 780 785 790 aca gtc ccc aac agc gac agc cct gat ctc ctg aca ctg cag aag tcc 3473 Thr Val Pro Asn Ser Asp Ser Pro Asp Leu Leu Thr Leu Gln Lys Ser 795 800 805 atc cac agc gcc agc aca cct agc agc aga cct aaa gag tgg cgg cca 3521 Ile His Ser Ala Ser Thr Pro Ser Ser Arg Pro Lys Glu Trp Arg Pro 810 815 820 gag aag atc agc gac ctg caa aca cag agc cag cct ctg aag tcc ctg 3569 Glu Lys Ile Ser Asp Leu Gln Thr Gln Ser Gln Pro Leu Lys Ser Leu 825 830 835 agg aag ctg ctg cat ctg tcc tcc gcc tct aat cac cct gcc agc agc 3617 Arg Lys Leu Leu His Leu Ser Ser Ala Ser Asn His Pro Ala Ser Ser 840 845 850 855 gat ccc aga ttt cag cca ctg aca gcc cag cag acc aag aac tcc ttc 3665 Asp Pro Arg Phe Gln Pro Leu Thr Ala Gln Gln Thr Lys Asn Ser Phe 860 865 870 agc gag atc cgg att cac cca ctg tct cag gcc agc ggc ggc agc tct 3713 Ser Glu Ile Arg Ile His Pro Leu Ser Gln Ala Ser Gly Gly Ser Ser 875 880 885 aat atc aga caa gag ccc gct cct aag ggc aga cct gct ctc caa ctg 3761 Asn Ile Arg Gln Glu Pro Ala Pro Lys Gly Arg Pro Ala Leu Gln Leu 890 895 900 cct gga cag atg gat cct ggc tgg cac gtg tcc tct gtg aca aga tct 3809 Pro Gly Gln Met Asp Pro Gly Trp His Val Ser Ser Val Thr Arg Ser 905 910 915 gcc acc gag gga cct agc tat tct gag cag ctg ggc gcc aag tct ggc 3857 Ala Thr Glu Gly Pro Ser Tyr Ser Glu Gln Leu Gly Ala Lys Ser Gly 920 925 930 935 ccc aat gga cac ccc tac aac cgg acc aat cgg agc aga atg ccc aac 3905 Pro Asn Gly His Pro Tyr Asn Arg Thr Asn Arg Ser Arg Met Pro Asn 940 945 950 ctg aac gac ctc aaa gaa aca gcc ctc tga agcttatcga taccggtagt 3955 Leu Asn Asp Leu Lys Glu Thr Ala Leu 955 960 gaattctacc agtgccatag gatagtgaat tctaccagtg ccatacacgt gagtgaattc 4015 taccagtgcc atagcatgca gtgaattcta ccagtgccat agcggccgcg atctttttcc 4075 ctctgccaaa aattatgggg acatcatgaa gccccttgag catctgactt ctggctaata 4135 aaggaaattt attttcattg caatagtgtg ttggaatttt ttgtgtctct cactcgatcg 4195 ataaggatct tcctagagca tggctacgta gataagtagc atggcgggtt aatcattaac 4255 tacaaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg ctcgctcact 4315 gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg cccgggcggc ctcagtgagc 4375 gagcgagcgc gcagccttaa ttaacctaat tcactggccg tcgttttaca acgtcgtgac 4435 tgggaaaacc ctggcgttac ccaacttaat cgccttgcag cacatccccc tttcgccagc 4495 tggcgtaata gcgaagaggc ccgcaccgat cgcccttccc aacagttgcg cagcctgaat 4555 ggcgaatggg acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt ggttacgcgc 4615 agcgtgaccg ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt cttcccttcc 4675 tttctcgcca cgttcgccgg ctttccccgt caagctctaa atcgggggct ccctttaggg 4735 ttccgattta gtgctttacg gcacctcgac cccaaaaaac ttgattaggg tgatggttca 4795 cgtagtgggc catcgccctg atagacggtt tttcgccctt tgacgttgga gtccacgttc 4855 tttaatagtg gactcttgtt ccaaactgga acaacactca accctatctc ggtctattct 4915 tttgatttat aagggatttt gccgatttcg gcctattggt taaaaaatga gctgatttaa 4975 caaaaattta acgcgaattt taacaaaata ttaacgctta caatttaggt ggcacttttc 5035 ggggaaatgt gcgcggaacc cctatttgtt tatttttcta aatacattca aatatgtatc 5095 cgctcatgag acaataaccc tgataaatgc ttcaataata ttgaaaaagg aagagtatga 5155 gtattcaaca tttccgtgtc gcccttattc ccttttttgc ggcattttgc cttcctgttt 5215 ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga agatcagttg ggtgcacgag 5275 tgggttacat cgaactggat ctcaacagcg gtaagatcct tgagagtttt cgccccgaag 5335 aacgttttcc aatgatgagc acttttaaag ttctgctatg tggcgcggta ttatcccgta 5395 ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta ttctcagaat gacttggttg 5455 agtactcacc agtcacagaa aagcatctta cggatggcat gacagtaaga gaattatgca 5515 gtgctgccat aaccatgagt gataacactg cggccaactt acttctgaca acgatcggag 5575 gaccgaagga gctaaccgct tttttgcaca acatggggga tcatgtaact cgccttgatc 5635 gttgggaacc ggagctgaat gaagccatac caaacgacga gcgtgacacc acgatgcctg 5695 tagcaatggc aacaacgttg cgcaaactat taactggcga actacttact ctagcttccc 5755 ggcaacaatt aatagactgg atggaggcgg ataaagttgc aggaccactt ctgcgctcgg 5815 cccttccggc tggctggttt attgctgata aatctggagc cggtgagcgt gggtctcgcg 5875 gtatcattgc agcactgggg ccagatggta agccctcccg tatcgtagtt atctacacga 5935 cggggagtca ggcaactatg gatgaacgaa atagacagat cgctgagata ggtgcctcac 5995 tgattaagca ttggtaactg tcagaccaag tttactcata tatactttag attgatttaa 6055 aacttcattt ttaatttaaa aggatctagg tgaagatcct ttttgataat ctcatgacca 6115 aaatccctta acgtgagttt tcgttccact gagcgtcaga ccccgtagaa aagatcaaag 6175 gatcttcttg agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac 6235 cgctaccagc ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa 6295 ctggcttcag cagagcgcag ataccaaata ctgttcttct agtgtagccg tagttaggcc 6355 accacttcaa gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag 6415 tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac 6475 cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc 6535 gaacgaccta caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc 6595 ccgaagggag aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca 6655 cgagggagct tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc 6715 tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg 6775 ccagcaacgc ggccttttta cggttcctgg ccttttgctg gccttttgct cacatgttct 6835 ttcctgcgtt atcccctgat tctgtggata accgtattac cgcctttgag tgagctgata 6895 ccgctcgccg cagccgaacg accgagcgca gcgagtcagt gagcgaggaa gcggaagagc 6955 gcccaatacg caaaccgcct ctccccgcgc gttggccgat tcattaatgc agctggcacg 7015 acaggtttcc cgactggaaa gcgggcagtg agcgcaacgc aattaatgtg agttagctca 7075 ctcattaggc accccaggct ttacacttta tgcttccggc tcgtatgttg tgtggaattg 7135 tgagcggata acaatttcac acaggaaaca gctatgacca tgattacgcc agatttaatt 7195 aaggccttaa ttagg 7210 <210> 32 <211> 960 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 32 Met Lys Ile Pro Asn Ile Gly Asn Val Met Asn Lys Phe Glu Ile Leu 1 5 10 15 Gly Val Val Gly Glu Gly Ala Tyr Gly Val Val Leu Lys Cys Arg His 20 25 30 Lys Glu Thr His Glu Ile Val Ala Ile Lys Lys Phe Lys Asp Ser Glu 35 40 45 Glu Asn Glu Glu Val Lys Glu Thr Thr Leu Arg Glu Leu Lys Met Leu 50 55 60 Arg Thr Leu Lys Gln Glu Asn Ile Val Glu Leu Lys Glu Ala Phe Arg 65 70 75 80 Arg Arg Gly Lys Leu Tyr Leu Val Phe Glu Tyr Val Glu Lys Asn Met 85 90 95 Leu Glu Leu Leu Glu Glu Met Pro Asn Gly Val Pro Pro Glu Lys Val 100 105 110 Lys Ser Tyr Ile Tyr Gln Leu Ile Lys Ala Ile His Trp Cys His Lys 115 120 125 Asn Asp Ile Val His Arg Asp Ile Lys Pro Glu Asn Leu Leu Ile Ser 130 135 140 His Asn Asp Val Leu Lys Leu Cys Asp Phe Gly Phe Ala Arg Asn Leu 145 150 155 160 Ser Glu Gly Asn Asn Ala Asn Tyr Thr Glu Tyr Val Ala Thr Arg Trp 165 170 175 Tyr Arg Ser Pro Glu Leu Leu Leu Gly Ala Pro Tyr Gly Lys Ser Val 180 185 190 Asp Met Trp Ser Val Gly Cys Ile Leu Gly Glu Leu Ser Asp Gly Gln 195 200 205 Pro Leu Phe Pro Gly Glu Ser Glu Ile Asp Gln Leu Phe Thr Ile Gln 210 215 220 Lys Val Leu Gly Pro Leu Pro Ser Glu Gln Met Lys Leu Phe Tyr Ser 225 230 235 240 Asn Pro Arg Phe His Gly Leu Arg Phe Pro Ala Val Asn His Pro Gln 245 250 255 Ser Leu Glu Arg Arg Tyr Leu Gly Ile Leu Asn Ser Val Leu Leu Asp 260 265 270 Leu Met Lys Asn Leu Leu Lys Leu Asp Pro Ala Asp Arg Tyr Leu Thr 275 280 285 Glu Gln Cys Leu Asn His Pro Thr Phe Gln Thr Gln Arg Leu Leu Asp 290 295 300 Arg Ser Pro Ser Arg Ser Ala Lys Arg Lys Pro Tyr His Val Glu Ser 305 310 315 320 Ser Thr Leu Ser Asn Arg Asn Gln Ala Gly Lys Ser Thr Ala Leu Gln 325 330 335 Ser His His Arg Ser Asn Ser Lys Asp Ile Gln Asn Leu Ser Val Gly 340 345 350 Leu Pro Arg Ala Asp Glu Gly Leu Pro Ala Asn Glu Ser Phe Leu Asn 355 360 365 Gly Asn Leu Ala Gly Ala Ser Leu Ser Pro Leu His Thr Lys Thr Tyr 370 375 380 Gln Ala Ser Ser Gln Pro Gly Ser Thr Ser Lys Asp Leu Thr Asn Asn 385 390 395 400 Asn Ile Pro His Leu Leu Ser Pro Lys Glu Ala Lys Ser Lys Thr Glu 405 410 415 Phe Asp Phe Asn Ile Asp Pro Lys Pro Ser Glu Gly Pro Gly Thr Lys 420 425 430 Tyr Leu Lys Ser Asn Ser Arg Ser Gln Gln Asn Arg His Ser Phe Met 435 440 445 Glu Ser Ser Gln Ser Lys Ala Gly Thr Leu Gln Pro Asn Glu Lys Gln 450 455 460 Ser Arg His Ser Tyr Ile Asp Thr Ile Pro Gln Ser Ser Arg Ser Pro 465 470 475 480 Ser Tyr Arg Thr Lys Ala Lys Ser His Gly Ala Leu Ser Asp Ser Lys 485 490 495 Ser Val Ser Asn Leu Ser Glu Ala Arg Ala Gln Ile Ala Glu Pro Ser 500 505 510 Thr Ser Arg Tyr Phe Pro Ser Ser Cys Leu Asp Leu Asn Ser Pro Thr 515 520 525 Ser Pro Thr Pro Thr Arg His Ser Asp Thr Arg Thr Leu Leu Ser Pro 530 535 540 Ser Gly Arg Asn Asn Arg Asn Glu Gly Thr Leu Asp Ser Arg Arg Thr 545 550 555 560 Thr Thr Arg His Ser Lys Thr Met Glu Glu Leu Lys Leu Pro Glu His 565 570 575 Met Asp Ser Ser His Ser His Ser Leu Ser Ala Pro His Glu Ser Phe 580 585 590 Ser Tyr Gly Leu Gly Tyr Thr Ser Pro Phe Ser Ser Gln Gln Arg Pro 595 600 605 His Arg His Ser Met Tyr Val Thr Arg Asp Lys Val Arg Ala Lys Gly 610 615 620 Leu Asp Gly Ser Leu Ser Ile Gly Gln Gly Met Ala Ala Arg Ala Asn 625 630 635 640 Ser Leu Gln Leu Leu Ser Pro Gln Pro Gly Glu Gln Leu Pro Pro Glu 645 650 655 Met Thr Val Ala Arg Ser Ser Val Lys Glu Thr Ser Arg Glu Gly Thr 660 665 670 Ser Ser Phe His Thr Arg Gln Lys Ser Glu Gly Gly Val Tyr His Asp 675 680 685 Pro His Ser Asp Asp Gly Thr Ala Pro Lys Glu Asn Arg His Leu Tyr 690 695 700 Asn Asp Pro Val Pro Arg Arg Val Gly Ser Phe Tyr Arg Val Pro Ser 705 710 715 720 Pro Arg Pro Asp Asn Ser Phe His Glu Asn Asn Val Ser Thr Arg Val 725 730 735 Ser Ser Leu Pro Ser Glu Ser Ser Ser Gly Thr Asn His Ser Lys Arg 740 745 750 Gln Pro Ala Phe Asp Pro Trp Lys Ser Pro Glu Asn Ile Ser His Ser 755 760 765 Glu Gln Leu Lys Glu Lys Glu Lys Gln Gly Phe Phe Arg Ser Met Lys 770 775 780 Lys Lys Lys Lys Lys Ser Gln Thr Val Pro Asn Ser Asp Ser Pro Asp 785 790 795 800 Leu Leu Thr Leu Gln Lys Ser Ile His Ser Ala Ser Thr Pro Ser Ser 805 810 815 Arg Pro Lys Glu Trp Arg Pro Glu Lys Ile Ser Asp Leu Gln Thr Gln 820 825 830 Ser Gln Pro Leu Lys Ser Leu Arg Lys Leu Leu His Leu Ser Ser Ala 835 840 845 Ser Asn His Pro Ala Ser Ser Asp Pro Arg Phe Gln Pro Leu Thr Ala 850 855 860 Gln Gln Thr Lys Asn Ser Phe Ser Glu Ile Arg Ile His Pro Leu Ser 865 870 875 880 Gln Ala Ser Gly Gly Ser Ser Asn Ile Arg Gln Glu Pro Ala Pro Lys 885 890 895 Gly Arg Pro Ala Leu Gln Leu Pro Gly Gln Met Asp Pro Gly Trp His 900 905 910 Val Ser Ser Val Thr Arg Ser Ala Thr Glu Gly Pro Ser Tyr Ser Glu 915 920 925 Gln Leu Gly Ala Lys Ser Gly Pro Asn Gly His Pro Tyr Asn Arg Thr 930 935 940 Asn Arg Ser Arg Met Pro Asn Leu Asn Asp Leu Lys Glu Thr Ala Leu 945 950 955 960 <210> 33 <211> 2211 <212> DNA <213> adeno-associated virus rh91 <220> <221> CDS <222> (1)..(2211) <223> AAVrh.91 <400> 33 atg gct gcc gat ggt tat ctt cca gat tgg ctc gag gac aac ctc tct 48 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 gag ggc att cgc gag tgg tgg gcg ctg aaa cct gga gcc ccg aaa ccc 96 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 aaa gcc aac cag caa aag cag gac gac ggc cgg ggt ctg gtg ctt cct 144 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 ggc tac aag tac ctc gga ccc ttc aac gga ctc gac aag ggg gag ccc 192 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 gtc aac gcg gcg gac gca gcg gcc ctc gag cac gac aag gcc tac gac 240 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 cag cag ctc aaa gcg ggt gac aat ccg tac ctg cgg tat aac cac gcc 288 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 gac gcc gag ttt cag gag cgt ctg caa gaa gat acg tct ttt ggg ggc 336 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 aac ctc ggg cga gca gtc ttc cag gcc aag aag cgg gtt ctc gaa cct 384 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 ttt ggt ctg gtt gag gaa gca gct aag acg gct cct gga aag aaa cgt 432 Phe Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 ccg gta gag cag tcg ccc caa gaa cca gac tcc tcc tcg ggc att ggc 480 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly 145 150 155 160 aaa tca ggc cag cag ccc gcc aaa aag aga ctc aat ttc ggt cag act 528 Lys Ser Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 ggc gac tca gag tca gtc ccc gac cct caa cct ctc gga gaa cct cca 576 Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro 180 185 190 gaa acc ccc gct gct gtg gga cct act aca atg gct tca ggc ggt ggc 624 Glu Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly 195 200 205 gca cca atg gca gac aat aac gaa ggc gcc gac gga gtg ggt aat gcc 672 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala 210 215 220 tca gga aat tgg cat tgc gat tcc aca tgg ctg ggc gac aga gtc atc 720 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile 225 230 235 240 acc acc agc acc cga acc tgg gcc ctt cct acc tac aac aac cac ctc 768 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 tac aag caa atc tcc agc gct tca acg ggg gcc agt aac gac aac cac 816 Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His 260 265 270 tac ttt ggc tac agc acc ccc tgg ggg tat ttt gat ttc aac aga ttc 864 Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe 275 280 285 cac tgc cac ttc tca cca cgt gac tgg cag cga ctc att aac aac aac 912 His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn 290 295 300 tgg gga ttc cgg ccc aag aga ctc aac ttc aag ctc ttc aac atc cag 960 Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln 305 310 315 320 gtc aag gag gtc acg acg aat gat ggc gtc aca acc atc gct aat aac 1008 Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn 325 330 335 ctt acc agc acg gtt caa gtg ttc tcg gac tcg gag tac cag ctg ccg 1056 Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro 340 345 350 tac gtc ctc ggt tct gcg cac cag ggc tgc ctc cct ccg ttc ccg gcg 1104 Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala 355 360 365 gac gta ttc atg att cct cag tac ggc tac cta acg ctc aac aat ggc 1152 Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly 370 375 380 agc cag gcc gta gga cgt tca tcc ttt tat tgc ctg gaa tat ttc cca 1200 Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro 385 390 395 400 tct caa atg ctg aga acg ggc aac aac ttt acc ttc agc tac acc ttt 1248 Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe 405 410 415 gaa gat gtg cct ttc cac agc agt tac gcg cac agc cag agc ctg gac 1296 Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp 420 425 430 agg cta atg aat cct cta atc gac cag tac ctg tat tac cta aac aga 1344 Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg 435 440 445 act cag aat caa tcc gga agt gca caa aac aag gac ttg ctg ttt agc 1392 Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser 450 455 460 cgg ggg tct cca gct ggc atg tct gtt cag ccc aaa aac tgg cta ccc 1440 Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro 465 470 475 480 ggg ccc tgt tac cga cag cag cgt gtt tct aaa aca aaa aca gac aac 1488 Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn 485 490 495 aac aac agc aac ttt acc tgg act ggt gcc tcc aaa tac aat ctg aac 1536 Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn 500 505 510 gga cgt gaa tcc atc att aac cct ggc acc gct atg gca tcc cac aag 1584 Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys 515 520 525 gac gac gaa gac aaa ttt ttt ccc atg agc ggt gtt atg att ttt ggc 1632 Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly 530 535 540 aaa gaa aat gca gga gca tca aac act gca tta gac aat gtt atg att 1680 Lys Glu Asn Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile 545 550 555 560 aca gat gaa gag gaa att aaa gct acc aac ccc gtg gcc acc gag aga 1728 Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg 565 570 575 ttt gga act gtg gca gtc aat ctc caa agc agc aat aca gac cct gca 1776 Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Asn Thr Asp Pro Ala 580 585 590 aca gga gac gtg cat gtc atg ggg gct tta cct ggc atg gtg tgg caa 1824 Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln 595 600 605 gac aga gac gtg tac ctg cag ggt ccc att tgg gcc aag att cct cac 1872 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 acg gat gga cac ttt cac ccg tct cct ctt atg ggc ggc ttt gga ctt 1920 Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu 625 630 635 640 aag cac ccg cct cct cag atc ctc atc aaa aac acg cct gtt cct gcg 1968 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 aat cct ccg gca gag ttt tcg gct aca aag ttt gct tca ttc atc acc 2016 Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr 660 665 670 cag tac tcc aca gga caa gtg agc gtg gaa att gaa tgg gag ctg cag 2064 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 aaa gaa aac agt aag cgc tgg aat cct gaa gtg cag tac acc tcc aac 2112 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn 690 695 700 tac gcg aaa tct gcc aac gtt gat ttc act gtg gac aac aat gga ctt 2160 Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu 705 710 715 720 tat act gag cct cgc ccc att ggc acc cgt tac ctt acc cgt ccc ctt 2208 Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu 725 730 735 taa 2211 <210> 34 <211> 736 <212> PRT <213> adeno-associated virus rh91 <400> 34 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Phe Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly 145 150 155 160 Lys Ser Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro 180 185 190 Glu Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His 260 265 270 Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe 275 280 285 His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn 290 295 300 Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln 305 310 315 320 Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn 325 330 335 Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro 340 345 350 Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala 355 360 365 Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly 370 375 380 Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro 385 390 395 400 Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe 405 410 415 Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp 420 425 430 Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg 435 440 445 Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser 450 455 460 Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro 465 470 475 480 Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn 485 490 495 Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn 500 505 510 Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys 515 520 525 Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly 530 535 540 Lys Glu Asn Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile 545 550 555 560 Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg 565 570 575 Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Asn Thr Asp Pro Ala 580 585 590 Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn 690 695 700 Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu 705 710 715 720 Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu 725 730 735 <210> 35 <211> 2211 <212> DNA <213> adeno-associated virus rh91 <220> <221> CDS <222> (1)..(2211) <223> AAVrh.91 <400> 35 atg gct gct gac ggt tat ctt cca gat tgg ctc gag gac aac ctt tct 48 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 gaa ggc att cgt gag tgg tgg gct ctg aaa cct gga gcc cct aaa ccc 96 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 aaa gcg aac caa caa aag cag gac gac ggc cgg ggt ctt gtg ctt ccg 144 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 ggt tac aaa tac ctc gga ccc ttc aac gga ctc gac aaa gga gag ccg 192 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 gtc aac gcg gcg gac gcg gca gcc ctc gaa cac gac aaa gct tac gac 240 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 cag cag ctc aag gcc ggt gac aac ccg tac ctc cgg tac aac cac gcc 288 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 gac gcc gag ttt cag gag cgt ctt caa gaa gat acg tct ttt ggg ggc 336 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 aac ctt ggc aga gca gtc ttc cag gcc aaa aag agg gtt ctt gag cct 384 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 ttt ggt ctg gtt gag gaa gca gct aaa acg gct cct gga aag aag agg 432 Phe Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 cct gta gag cag tct cct cag gaa ccg gac tca tca tct ggt att ggc 480 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly 145 150 155 160 aaa tcg ggc cag cag cct gcc aaa aaa aga cta aat ttc ggt cag act 528 Lys Ser Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 ggc gac tca gag tca gtc ccc gac cct caa cct ctc gga gaa cct cca 576 Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro 180 185 190 gaa acc ccc gct gct gtg gga cct act aca atg gct tca ggc ggt ggc 624 Glu Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly 195 200 205 gca cca atg gca gac aat aac gaa ggc gcc gac gga gtg ggt aat gcc 672 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala 210 215 220 tca gga aat tgg cat tgc gat tcc aca tgg ctg ggc gac aga gtc atc 720 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile 225 230 235 240 acc acc agc acc cga acc tgg gcc ctt cct acc tac aac aac cac ctc 768 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 tac aag caa atc tcc agc gct tca acg ggg gcc agt aac gac aac cac 816 Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His 260 265 270 tac ttt ggc tac agc acc ccc tgg ggg tat ttt gat ttc aac aga ttc 864 Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe 275 280 285 cac tgc cac ttc tca cca cgt gac tgg cag cga ctc att aac aac aac 912 His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn 290 295 300 tgg gga ttc cgg ccc aag aga ctc aac ttc aag ctc ttc aac atc cag 960 Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln 305 310 315 320 gtc aag gag gtc acg acg aat gat ggc gtc aca acc atc gct aat aac 1008 Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn 325 330 335 ctt acc agc acg gtt caa gtg ttc tcg gac tcg gag tac cag ctg ccg 1056 Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro 340 345 350 tac gtc ctc ggt tct gcg cac cag ggc tgc ctc cct ccg ttc ccg gcg 1104 Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala 355 360 365 gac gta ttc atg att cct cag tat gga tac ctc acc ctg aac aac gga 1152 Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly 370 375 380 agt caa gcg gtg gga cgc tca tcc ttt tac tgc ctg gag tac ttc cct 1200 Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro 385 390 395 400 tcg cag atg cta agg act gga aat aac ttc acc ttc agc tat acc ttc 1248 Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe 405 410 415 gag gat gta cct ttt cac agc agc tac gct cac agc cag agt ttg gat 1296 Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp 420 425 430 cgc ttg atg aat cct ctt att gat cag tat ctg tac tac ctg aac aga 1344 Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg 435 440 445 acg caa aat caa tct gga agt gca caa aac aag gac ctg ctt ttt agc 1392 Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser 450 455 460 cgg ggg tct cct gct ggc atg tct gtt cag ccc aaa aat tgg cta cct 1440 Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro 465 470 475 480 ggg ccc tgc tac cgg caa cag aga gtt tca aag act aaa aca gac aac 1488 Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn 485 490 495 aac aac agt aac ttt acc tgg aca ggt gcc agc aaa tat aat ctc aat 1536 Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn 500 505 510 ggc cgc gaa tcg atc att aat cca gga acc gct atg gcc agt cac aag 1584 Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys 515 520 525 gac gat gaa gac aaa ttt ttc cct atg agc ggc gtt atg ata ttt ggc 1632 Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly 530 535 540 aaa gaa aat gca gga gca agt aac act gca tta gat aat gta atg att 1680 Lys Glu Asn Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile 545 550 555 560 acg gat gaa gaa gag att aaa gct acc aat cct gtg gca aca gag aga 1728 Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg 565 570 575 ttt gga act gtg gca gtc aac ttg cag agc tca aat aca gac ccc gca 1776 Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Asn Thr Asp Pro Ala 580 585 590 act gga gac gtc cat gtc atg ggg gcc tta cct ggc atg gtg tgg caa 1824 Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln 595 600 605 gat cgt gac gtg tac ctt caa gga cct atc tgg gca aag att cct cac 1872 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 acg gat gga cac ttt cat cct tct cct ctg atg gga ggc ttt gga ctg 1920 Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu 625 630 635 640 aaa cat ccg cct cct caa atc ctc atc aaa aat act ccg gta ccg gca 1968 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 aat cct ccg gca gag ttc agc gct aca aag ttt gct tca ttt atc act 2016 Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr 660 665 670 cag tac tcc act gga cag gtc agc gtg gaa att gag tgg gag cta cag 2064 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 aaa gaa aac agc aaa cgt tgg aat cca gag gtg cag tac act tcc aac 2112 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn 690 695 700 tac gcg aag tct gcc aat gtg gac ttt act gta gac aac aat ggt ctt 2160 Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu 705 710 715 720 tat act gaa cct cgc cct att gga acc cgg tat ctc aca cga ccc ttg 2208 Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu 725 730 735 taa 2211 <210> 36 <211> 736 <212> PRT <213> adeno-associated virus rh91 <400> 36 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Phe Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly 145 150 155 160 Lys Ser Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro 180 185 190 Glu Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His 260 265 270 Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe 275 280 285 His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn 290 295 300 Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln 305 310 315 320 Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn 325 330 335 Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro 340 345 350 Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala 355 360 365 Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly 370 375 380 Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro 385 390 395 400 Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe 405 410 415 Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp 420 425 430 Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg 435 440 445 Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser 450 455 460 Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro 465 470 475 480 Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn 485 490 495 Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn 500 505 510 Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys 515 520 525 Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly 530 535 540 Lys Glu Asn Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile 545 550 555 560 Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg 565 570 575 Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Asn Thr Asp Pro Ala 580 585 590 Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn 690 695 700 Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu 705 710 715 720 Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu 725 730 735 <210> 37 <211> 2883 <212> DNA <213> Artificial Sequence <220> <223> engineered nucleic acid sequence CDKL5co-A <400> 37 atgaagatcc ccaacatcgg caacgtgatg aacaagttcg agatcctggg cgtggtgggc 60 gagggcgcct acggcgtggt gctgaagtgc aggcacaagg agacccacga gatcgtggcc 120 atcaagaagt tcaaggacag cgaggagaac gaggaggtga aggagaccac cctgagggag 180 ctgaagatgc tgaggaccct gaagcaggag aacatcgtgg agctgaagga ggccttcagg 240 aggaggggca agctgtacct ggtgttcgag tacgtggaga agaacatgct ggagctgctg 300 gaggagatgc ccaacggcgt gccccccgag aaggtgaaga gctacatcta ccagctgatc 360 aaggccatcc actggtgcca caagaacgac atcgtgcaca gggacatcaa gcccgagaac 420 ctgctgatca gccacaacga cgtgctgaag ctgtgcgact tcggcttcgc caggaacctg 480 agcgagggca acaacgccaa ctacaccgag tacgtggcca ccaggtggta caggagcccc 540 gagctgctgc tgggcgcccc ctacggcaag agcgtggaca tgtggagcgt gggctgcatc 600 ctgggcgagc tgagcgacgg ccagcccctg ttccccggcg agagcgagat cgaccagctg 660 ttcaccatcc agaaggtgct gggccccctg cccagcgagc agatgaagct gttctacagc 720 aaccccaggt tccacggcct gaggttcccc gccgtgaacc acccccagag cctggagagg 780 aggtacttgg gcatcctgaa cagcgtgctg ctggacctga tgaagaacct gctgaagctg 840 gaccccgccg acaggtactt gaccgagcag tgcctgaacc accccacctt ccagacccag 900 aggctgctgg acaggagccc cagcaggagc gccaagagga agccctacca cgtggagagc 960 agcaccctga gcaacaggaa ccaggccggc aagagcaccg ccctgcagag ccaccacagg 1020 agcaacagca aggacatcca gaacctgagc gtgggcctgc ccagggccga cgagggcctg 1080 cccgccaacg agagcttcct gaacggcaac ctggccggcg ccagcctgag ccccctgcac 1140 accaagacct accaggccag cagccagccc ggcagcacca gcaaggacct gaccaacaac 1200 aacatccccc acctgctgag ccccaaggag gccaagagca agaccgagtt cgacttcaac 1260 atcgacccca agcccagcga gggccccggc accaagtacc tgaagagcaa cagcaggagc 1320 cagcagaaca ggcacagctt catggagagc agccagagca aggccggcac cctgcagccc 1380 aacgagaagc agagcaggca cagctacatc gacaccatcc cccagagcag caggagcccc 1440 agctacagga ccaaggccaa gagccacggc gccctgagcg acagcaagag cgtgagcaac 1500 ctgagcgagg ccagggccca gatcgccgag cccagcacca gcaggtactt ccccagcagc 1560 tgcctggacc tgaacagccc caccagcccc acccccacca ggcacagcga caccaggacc 1620 ctgctgagcc ccagcggcag gaacaacagg aacgagggca ccctggacag caggaggacc 1680 accaccaggc acagcaagac catggaggag ctgaagctgc ccgagcacat ggacagcagc 1740 cacagccaca gcctgagcgc cccccacgag agcttcagct acggcctggg ctacaccagc 1800 cccttcagca gccagcagag gccccacagg cacagcatgt acgtgaccag ggacaaggtg 1860 agggccaagg gcctggacgg cagcctgagc atcggccagg gcatggccgc cagggccaac 1920 agcctgcagc tgctgagccc ccagcccggc gagcagctgc cccccgagat gaccgtggcc 1980 aggagcagcg tgaaggagac cagcagggag ggcaccagca gcttccacac caggcagaag 2040 agcgagggcg gcgtgtacca cgacccccac agcgacgacg gcaccgcccc caaggagaac 2100 aggcacctgt acaacgaccc cgtgcccagg agggtgggca gcttctacag ggtgcccagc 2160 cccaggcccg acaacagctt ccacgagaac aacgtgagca ccagggtgag cagcctgccc 2220 agcgagagca gcagcggcac caaccacagc aagaggcagc ccgccttcga cccctggaag 2280 agccccgaga acatcagcca cagcgagcag ctgaaggaga aggagaagca gggcttcttc 2340 aggagcatga agaagaagaa gaagaagagc cagaccgtgc ccaacagcga cagccccgac 2400 ctgctgaccc tgcagaagag catccacagc gccagcaccc ccagcagcag gcccaaggag 2460 tggaggcccg agaagatcag cgacctgcag acccagagcc agcccctgaa gagcctgagg 2520 aagctgctgc acctgagcag cgccagcaac caccccgcca gcagcgaccc caggttccag 2580 cccctgaccg cccagcagac caagaacagc ttcagcgaga tcaggatcca ccccctgagc 2640 caggccagcg gcggcagcag caacatcagg caggagcccg cccccaaggg caggcccgcc 2700 ctgcagctgc ccggccagat ggaccccggc tggcacgtga gcagcgtgac caggagcgcc 2760 accgagggcc ccagctacag cgagcagctg ggcgccaaga gcggccccaa cggccacccc 2820 tacaacagga ccaacaggag caggatgccc aacctgaacg acctgaagga gaccgccctg 2880 tga 2883 <210> 38 <211> 2883 <212> DNA <213> Artificial Sequence <220> <223> engineered nucleic acid sequence CDKL5co-B <400> 38 atgaaaattc ccaatatcgg taacgtgatg aataaattcg aaatacttgg agtggtaggt 60 gagggcgcct atggtgttgt acttaaatgt agacacaaag aaacacacga aatcgtggcg 120 atcaagaaat ttaaggattc cgaggagaat gaggaagtca aagagaccac actacgcgag 180 ttgaaaatgt tacgaactct aaaacaggaa aacattgtag agttaaagga ggcttttcgc 240 cgtcgcggta aactatacct ggtctttgag tatgttgaga aaaacatgct agaactgctc 300 gaggaaatgc ctaatggcgt cccgccagaa aaagtcaaat cgtatattta ccagcttata 360 aaggccatcc attggtgtca taaaaacgat atcgttcatc gcgacattaa gccagaaaat 420 ctattgatat cccacaacga cgtgctaaaa ctttgcgact tcggcttcgc taggaaccta 480 tccgaaggga ataacgcgaa ttataccgaa tatgttgcga cacgatggta ccgtagtcct 540 gaacttctat taggggcgcc ctacggtaaa tctgtagata tgtggtcagt cgggtgtata 600 ttaggagaac tttcagacgg tcaacctctg ttcccaggcg agtccgagat cgatcagctt 660 tttacaatac agaaggtatt aggtcccctc ccaagtgagc aaatgaagct attctattca 720 aatccccggt ttcatggcct tagatttccg gcggtgaacc accctcagag tctggagagg 780 cgttatctcg ggatacttaa ttcagtctta ctcgatctga tgaagaattt gctaaaactg 840 gaccctgctg atcggtacct tacagagcaa tgccttaatc acccgacttt tcaaactcaa 900 cgactgttgg accggagtcc gtcacgctca gctaaaagga aaccatacca cgtagaatca 960 tcgacattat cgaatcgaaa ccaagcgggt aagagtaccg ctttgcaaag ccatcatcga 1020 tccaatagta aagacattca gaatctgtca gtgggattgc ctagagctga cgaaggatta 1080 ccggcgaacg agagttttct gaacggcaac ctcgcaggcg catctctgtc tccgcttcat 1140 acgaaaactt accaagcgtc atcacagcca ggcagtacga gtaaagacct gactaacaat 1200 aatattccac atctgttatc accgaaggaa gctaagagca agaccgagtt cgacttcaac 1260 atagacccca aaccctccga gggtcctggc accaagtatc tcaaatcaaa ctctagatct 1320 cagcagaaca ggcacagctt catggagtcc tcacaaagta aagctgggac actgcagccc 1380 aacgaaaagc aaagccgaca ttcttatatt gacacgatcc ctcagagttc acgcagccct 1440 agctatcgga caaaagctaa gtcccacggt gccctttctg attcgaagag tgttagtaac 1500 ctttccgaag ctagagccca aattgcggag cctagtacat cgagatactt cccctccagc 1560 tgcctggacc ttaactctcc aaccagcccc actccaacgc gccactcaga taccaggaca 1620 ctgctctcac catccggaag aaataataga aatgaaggaa cgcttgactc tcggcgcact 1680 acgacaaggc acagcaagac gatggaagaa cttaagctac ctgagcacat ggacagttcg 1740 cattcccact cactctcggc gccacatgag tcgttttcct atggactggg ttacacaagt 1800 ccctttagct ctcagcagcg tcctcaccgc cactctatgt acgttacaag ggataaagtt 1860 cgcgctaagg ggttggatgg gagtctttcc attggccaag gcatggccgc gcgggcaaat 1920 tctctacaac ttctttcgcc acagccaggt gagcaactcc caccagaaat gaccgtcgcc 1980 agaagcagtg ttaaagaaac ttcgagggag gggacatcat cgtttcatac ccgccagaaa 2040 tctgagggcg gtgtatatca tgatcctcat tccgacgacg gaacggcccc caaagagaac 2100 cgacacctat acaatgaccc tgtcccaagg agagtgggat ctttctatcg agttccttca 2160 ccaagacctg ataacagttt ccatgagaac aacgtttcca cgagggtgtc aagtctacct 2220 tcggaatcat cttccggaac caatcactca aaacgccagc cagctttcga tccatggaaa 2280 tcaccggaaa acatcagtca tagcgagcaa ttgaaagaga aagaaaagca aggttttttc 2340 agaagtatga agaagaagaa aaagaagtca cagaccgtac ctaattcaga tagtccagac 2400 ttgttaacgc tccagaaatc aattcatagc gcatcgactc catcgtcccg accaaaggaa 2460 tggcgccctg agaagatctc cgatctgcag acccaatccc aacccctgaa gtctctcagg 2520 aaattactcc acctctcgtc tgctagtaac caccccgcat cgtctgaccc tcgcttccag 2580 ccgctgacag cccagcaaac aaagaacagt ttctcagaaa tccggattca tcctttaagc 2640 caagctagcg gcggtagttc taacataaga caagagcccg ctccaaaggg cagacccgct 2700 ctgcagttgc ctgggcagat ggatcccggg tggcacgtct catcagtaac ccgaagtgcc 2760 accgagggcc cgtcatattc agagcagctc ggagcgaaaa gtggtcctaa cgggcaccca 2820 tataatcgaa caaaccgttc aaggatgcca aatctcaacg atctaaagga aacggccctt 2880 taa 2883 <210> 39 <211> 2883 <212> DNA <213> Artificial Sequence <220> <223> engineered nucleic acid sequence CDKL5co-C <400> 39 atgaagatcc ccaatatcgg aaacgtgatg aacaaattcg agattctcgg agtggtgggc 60 gagggcgcct atggagtggt tttaaaatgc agacacaagg agacccacga gatcgtcgct 120 atcaaaaagt tcaaagactc cgaggaaaac gaagaggtca aggagaccac cttacgtgag 180 ctcaaaatgc tcagaacact gaagcaagag aatatcgtcg agctcaagga ggccttcaga 240 aggaggggca aactgtattt agtgttcgag tacgtggaga agaacatgct ggagctgctg 300 gaggaaatgc ccaacggcgt cccccccgaa aaggtgaaat cctacattta ccaactgatc 360 aaggccattc actggtgcca caaaaatgat atcgtccatc gtgacatcaa gcccgagaat 420 ctgctgatca gccataacga cgtgctgaaa ctgtgcgact tcggattcgc cagaaattta 480 agcgagggca acaacgccaa ttacaccgag tacgtcgcca caaggtggta taggagcccc 540 gagctgctgc tcggagcccc ttatggcaag agcgtggaca tgtggagcgt gggctgcatt 600 ctgggagaac tgtccgacgg ccagcctctg ttccccggcg agtccgagat tgaccagctg 660 ttcacaatcc agaaagtcct cggccctctg cccagcgaac aaatgaagct cttctacagc 720 aaccctcgtt tccacggttt aaggttcccc gccgtgaatc acccccagag cctcgagaga 780 aggtatctgg gcattctgaa cagcgtgctg ctcgatttaa tgaagaattt attaaagctg 840 gaccccgctg ataggtacct cacagagcag tgtttaaatc accccacctt ccagacccag 900 agactgctcg atcgtagccc tagcagatcc gccaaaagga agccttacca cgtcgagagc 960 tccactttaa gcaatcgtaa ccaagctgga aaatccaccg ctttacagtc ccaccatagg 1020 tccaacagca aagacattca gaatttaagc gtgggactgc ctagggctga cgagggcctc 1080 cccgccaacg aatccttttt aaatggcaat ctcgccggag ccagcctcag ccctttacat 1140 acaaaaacct accaagctag ctcccagccc ggtagcacct ccaaggacct caccaacaac 1200 aacatccccc atttactgtc ccccaaggag gccaagagca agaccgagtt tgactttaat 1260 atcgacccta agcccagcga gggacccggc acaaagtatc tgaagtccaa ttctcgtagc 1320 cagcagaatc gtcacagctt catggagagc tcccaaagca aggccggcac actgcagccc 1380 aatgagaagc aatctcgtca ttcctacatc gacaccatcc cccagagctc tcgtagcccc 1440 tcctatagga caaaggccaa gtcccacggc gctctgtccg attccaagtc cgtctccaat 1500 ttatccgagg ctcgtgccca gatcgccgaa cctagcacct ctcgttattt cccctcctct 1560 tgtctggacc tcaattcccc cacaagccct acacctactc gtcacagcga caccagaact 1620 ttactgagcc ccagcggaag gaataatcgt aacgagggca ctttagactc tcgtagaacc 1680 accacaaggc acagcaagac catggaggag ctgaagctgc ccgaacatat ggactcctcc 1740 cattcccatt ctttatccgc cccccacgag agcttcagct atggtttagg ctatacatcc 1800 cccttcagct cccagcagag accccacaga cactccatgt acgtgactcg tgataaggtg 1860 agggccaaag gactggatgg aagcctctcc atcggccaag gcatggccgc tcgtgccaat 1920 agcctccagt tattatcccc ccaacccgga gaacagctgc ctcccgaaat gacagtggcc 1980 agaagcagcg tcaaggaaac atctcgtgag ggaacctcca gctttcacac aaggcagaag 2040 agcgagggcg gagtctatca tgacccccac tccgatgacg gcacagcccc caaagagaat 2100 cgtcatctct acaacgaccc cgtgcctcgt agagtcggct ccttctacag agtccccagc 2160 cccagacccg acaacagctt tcacgagaac aacgtgagca ctcgtgtctc ctctttacct 2220 agcgagagct cctccggaac caaccacagc aaaaggcagc ccgccttcga cccttggaag 2280 tcccccgaaa acatcagcca cagcgagcag ctgaaggaga aagagaagca aggtttcttc 2340 agaagcatga aaaagaagaa gaaaaaatcc caaaccgtgc ccaactccga ctcccccgat 2400 ttactgaccc tccagaagtc catccactcc gcttccaccc ctagctccag acccaaggag 2460 tggaggcccg agaagatttc cgatttacag acacagagcc agcctctcaa gtctttaaga 2520 aagctgctgc atttatccag cgccagcaat caccccgctt ccagcgaccc taggttccag 2580 cctttaaccg cccagcagac caagaatagc ttttccgaga tccgtattca tcctctgagc 2640 caagctagcg gaggcagctc caacatcaga caagaacccg ctcctaaggg cagacccgct 2700 ttacaactcc ccggtcagat ggatcccggt tggcacgtga gcagcgtcac aaggagcgcc 2760 acagagggcc ccagctatag cgaacagctg ggcgccaaaa gcggacccaa cggccatccc 2820 tacaatagaa ccaatcgttc cagaatgccc aatctcaacg acctcaagga aacagcttta 2880 tga 2883 <210> 40 <211> 2883 <212> DNA <213> Artificial Sequence <220> <223> engineered nucleic acid sequence CDKL5co-D <400> 40 atgaagatcc ccaacatcgg caacgtgatg aacaagttcg agatcctggg cgtcgtcggc 60 gaaggcgctt atggcgttgt gctgaagtgc agacacaaag aaacccacga gatcgtggcc 120 atcaagaagt tcaaggacag cgaagagaac gaggaagtga aagagacaac cctgcgcgag 180 ctgaagatgc tgcggaccct gaagcaagag aacatcgtgg aactgaaaga ggccttccgg 240 cggagaggca agctgtacct ggtgttcgag tacgtggaaa agaacatgct cgagctgctg 300 gaagagatgc ccaacggcgt gccacctgag aaagtgaagt cctacatcta ccagctgatc 360 aaggccatcc actggtgcca caagaacgac atcgtgcacc gggacatcaa gcccgagaac 420 ctgctgatct cccacaacga cgtgctgaag ctgtgcgact tcggcttcgc cagaaatctg 480 agcgagggca acaacgccaa ctacaccgaa tacgtggcca ccagatggta cagaagccct 540 gagctgctgc tgggagcccc ttatggcaag tccgtggata tgtggagcgt gggctgtatc 600 ctgggagagc tgtctgatgg ccagcctctg tttcctggcg agtccgagat cgaccagctg 660 ttcaccatcc agaaggtgct gggccctctg cctagcgagc agatgaagct gttctacagc 720 aaccccagat tccacggcct gagattcccc gccgtgaatc accctcagag cctggaaaga 780 agatacctgg gcatcctgaa cagcgtgctg ctggacctga tgaagaatct gctgaaactg 840 gaccccgccg acagatacct gaccgagcag tgcctgaacc atcctacctt tcagacccag 900 agactgctgg atcggagccc tagcagaagc gccaagagaa agccctacca cgtggaaagc 960 agcaccctga gcaacagaaa ccaggccggc aagtctacag ccctgcagag ccaccacaga 1020 agcaacagca aggacatcca gaacctgtcc gtgggcctgc ctagagccga tgaaggactg 1080 cctgccaacg agagcttcct gaacggaaat ctggctggcg cctctctgag ccctctgcac 1140 acaaagacat accaggccag cagccagcct ggcagcacaa gcaaggatct gaccaacaac 1200 aacatccctc atctgctgag ccccaaagag gccaagagca agaccgagtt cgacttcaac 1260 atcgacccca agcctagcga aggccctggc accaagtacc tgaagtccaa cagcagaagc 1320 cagcagaacc ggcactcctt catggaaagc tcccagagca aggccggcac actgcagcct 1380 aatgagaagc agagcagaca cagctacatc gacacaatcc cacagagcag caggtcccca 1440 agctacagga ccaaggccaa atctcacggc gccctgagcg atagcaagag cgtgtccaat 1500 ctgtccgagg ctagagccca gatcgccgag cctagcacca gcagatactt ccctagctcc 1560 tgcctggatc tgaacagccc aacaagcccc acacctacca ggcacagcga caccagaaca 1620 ctgctgtccc catccggcag aaacaaccgg aatgagggca ccctggacag cagacggacc 1680 accacaagac acagcaagac catggaagaa ctgaagctgc ccgagcacat ggactccagc 1740 cactctcatt ctctgagcgc ccctcacgag tccttctctt acggcctggg ctacacaagc 1800 cccttcagct ctcagcagag gccccacaga cactctatgt acgtgacccg ggacaaagtg 1860 cgcgccaaag gcctggatgg ctctctgtct atcggccaag gcatggccgc cagagccaat 1920 tctctgcagc tgctgtctcc tcagcctggg gaacaactgc ctcctgagat gaccgtggcc 1980 agatccagcg tgaaagaaac cagcagagag ggcacctcca gcttccacac cagacagaaa 2040 agcgaaggcg gagtgtacca cgatcctcac agcgacgacg gcacagcccc taaagagaac 2100 agacacctgt acaacgaccc cgtgcctaga agagtgggct ccttctacag agtgccttct 2160 cctagacctg acaactcctt ccacgagaac aatgtgtcca ccagagtgtc cagcctgcct 2220 tccgaaagca gctccggcac caaccactcc aagagacagc ctgctttcga cccctggaag 2280 tcccctgaga acatcagcca ctccgagcag ctgaaagaga aagagaagca gggctttttc 2340 cggtccatga agaagaagaa aaagaagtcc cagacggtcc ccaacagcga ctccccagat 2400 ctgctgaccc tgcagaagtc catccactcc gccagcacac ctagcagcag acccaaagag 2460 tggcggccag agaagatcag cgatctgcag acccagtctc agcctctgaa gtccctgagg 2520 aagctgctgc atctgagcag cgcctctaat caccctgcca gcagcgaccc tagatttcag 2580 ccactgacag cccagcagac caagaactcc ttcagcgaga tccggattca cccactgtct 2640 caggccagcg gcggcagcag caatatcaga caagagcccg ctcctaaggg cagacctgct 2700 ctgcaactgc ctggccagat ggatccagga tggcacgtgt cctctgtgac cagatccgcc 2760 acagagggac ctagctacag cgaacagctc ggcgccaagt ctggccctaa tggacacccc 2820 tacaaccgga ccaaccggtc cagaatgccc aacctgaacg acctcaaaga aacagccctg 2880 tga 2883 <210> 41 <211> 2883 <212> DNA <213> Artificial Sequence <220> <223> engineered nucleic acid sequence CDKL5coA1 <400> 41 atgaagatcc ccaacatcgg caacgtgatg aacaagttcg agatcctggg cgtcgtcggc 60 gaaggcgctt atggcgttgt gctgaagtgc agacacaaag aaacccacga gatcgtggcc 120 atcaagaagt tcaaggacag cgaagagaac gaggaagtga aagagacaac cctgcgcgag 180 ctgaagatgc tgcggaccct gaagcaagag aacatcgtgg aactgaaaga ggccttccgg 240 cggagaggca agctgtacct ggtgttcgag tacgtggaaa agaacatgct cgagctgctg 300 gaagagatgc ccaacggcgt gccacctgag aaagtgaagt cctacatcta ccagctgatc 360 aaggccatcc actggtgcca caagaacgac atcgtgcacc gggacatcaa gcccgagaac 420 ctgctgatct cccacaacga cgtgctgaag ctgtgcgact tcggcttcgc cagaaatctg 480 agcgagggca acaacgccaa ctacaccgaa tacgtggcca ccagatggta cagaagccct 540 gagctgctgc tgggagcccc ttacggcaag tccgtggata tgtggagcgt gggctgtatc 600 ctgggagagc tgtctgacgg ccagcctctg tttcctggcg agtccgagat cgaccagctg 660 ttcaccatcc agaaggtgct gggccctctg cctagcgagc agatgaagct gttctacagc 720 aaccccagat tccacggcct gagattcccc gccgtgaatc accctcagag cctggaaaga 780 agatacctgg gcatcctgaa cagcgtgctg ctggacctga tgaagaatct gctgaaactg 840 gaccccgccg acagatacct gaccgagcag tgcctgaacc atcctacctt tcaaacccag 900 agactgctgg atcggagccc tagcagaagc gccaagagaa agccctacca cgtggaaagc 960 agcaccctga gcaacagaaa ccaggccggc aagtctacag ccctgcagag ccaccacaga 1020 agcaacagca aggacatcca gaacctgtcc gtgggcctgc ctagagccga cgaaggactg 1080 cctgccaacg agagcttcct gaacggaaat ctggctggcg cctctctgag ccctctgcac 1140 acaaagacat accaggccag cagccagcct ggcagcacaa gcaaggatct gaccaacaac 1200 aacatccctc atctgctgag ccccaaagag gccaagagca agaccgagtt cgacttcaac 1260 atcgacccca agcctagcga aggccctggc accaagtacc tgaagtccaa cagcagaagc 1320 cagcagaacc ggcactcctt catggaaagc tcccagagca aggccggcac actgcagcct 1380 aacgagaagc agagcagaca cagctacatc gacacaatcc cacagagcag caggtcccca 1440 agctacagga ccaaggccaa atctcacggc gccctgagcg atagcaagag cgtgtccaat 1500 ctgtccgagg ctagagccca gatcgccgag cctagcacca gcagatactt ccctagctcc 1560 tgcctggatc tgaacagccc aacaagcccc acacctacca ggcacagcga caccagaaca 1620 ctgctgtccc catccggcag aaacaaccgg aacgagggca ccctggacag cagacggacc 1680 accacaagac acagcaagac catggaagaa ctgaagctgc ccgagcacat ggactccagc 1740 cactctcatt ctctgagcgc ccctcacgag tccttctctt acggcctggg ctacacaagc 1800 cccttcagct ctcagcagag gccccacaga cacagcatgt atgtgacccg ggacaaagtg 1860 cgcgccaaag gcctggacgg ctctctgtct atcggccaag gcatggccgc cagagccaat 1920 tctctgcagc tgctgtctcc tcagcctggg gaacaactgc ctcctgagat gaccgtggcc 1980 agatccagcg tgaaagaaac cagcagagag ggcacctcca gcttccacac cagacagaaa 2040 agcgaaggcg gagtgtacca cgatcctcac agcgacgacg gcacagcccc taaagagaac 2100 agacacctgt acaacgaccc cgtgcctaga agagtgggct ccttctacag agtgccttct 2160 cctagacctg acaactcctt ccacgagaac aacgtgtcca ccagagtgtc cagcctgcct 2220 tccgaaagca gctccggcac caaccactcc aagagacagc ctgctttcga cccctggaag 2280 tcccctgaga acatcagcca ctccgagcag ctgaaagaga aagagaagca gggctttttc 2340 cggtccatga agaagaagaa aaagaagtcc cagacggtcc ccaacagcga ctccccagat 2400 ctgctgaccc tgcagaagtc catccactcc gccagcacac ctagcagcag acccaaagag 2460 tggcggccag agaagatcag cgatctgcag acccagtctc agcctctgaa gtccctgagg 2520 aagctgctgc atctgagcag cgcctctaat caccctgcca gcagcgaccc tagatttcag 2580 ccactgacag cccagcagac caagaactcc ttcagcgaga tccggattca cccactgtct 2640 caggccagcg gcggcagcag caatatcaga caagagcccg ctcctaaggg cagacctgct 2700 ctgcaactgc ctggccagat ggatccaggc tggcacgtgt cctctgtgac cagatccgcc 2760 acagagggac ctagctacag cgaacagctc ggcgccaagt ctggccctaa cggacacccc 2820 tacaaccgga ccaaccggtc cagaatgccc aacctgaacg acctcaaaga gactgccctt 2880 tga 2883 <210> 42 <211> 2883 <212> DNA <213> Artificial Sequence <220> <223> engineered nucleic acid sequence CDKL5coB1 <400> 42 atgaagatcc ctaatatcgg caacgtgatg aataagttcg agatcctggg agtggtggga 60 gagggagcat acggagtggt gctgaagtgc cgccacaagg agacccacga gatcgtggcc 120 atcaagaagt ttaaggatag cgaggagaat gaggaggtga aggagaccac actgagagag 180 ctgaagatgc tgaggacact gaagcaggag aacatcgtgg agctgaagga ggccttccgg 240 agaaggggca agctgtacct ggtgtttgag tacgtggaga agaacatgct ggagctgctg 300 gaggagatgc ccaatggcgt gccccctgag aaggtgaagt cctacatcta tcagctgatc 360 aaggccatcc actggtgcca caagaacgac atcgtgcaca gagatatcaa gcctgagaac 420 ctgctgatct cccacaatga cgtgctgaag ctgtgcgatt tcggctttgc caggaacctg 480 agcgagggca acaacgccaa ttacacagag tacgtggcca cccgctggta cagaagccca 540 gagctgctgc tgggagcacc atacggcaag agcgtggaca tgtggtccgt gggctgcatc 600 ctgggcgagc tgtctgacgg ccagcctctg ttcccaggcg agagcgagat cgatcagctg 660 tttaccatcc agaaggtgct gggccctctg ccaagcgagc agatgaagct gttctactcc 720 aaccccagat tccacggcct gaggtttccc gccgtgaatc accctcagag cctggagcgc 780 cggtatctgg gcatcctgaa ctccgtgctg ctggatctga tgaagaatct gctgaagctg 840 gaccccgccg atcgctacct gaccgagcag tgtctgaatc accctacatt tcagacccag 900 cgcctgctgg accggagccc ttccagatct gccaagagga agccatatca cgtggagagc 960 tccaccctgt ccaatagaaa ccaggccggc aagtctacag ccctgcagag ccaccacagg 1020 agcaactcca aggacatcca gaatctgtcc gtgggactgc ctagggcaga cgagggactg 1080 ccagcaaacg agagcttcct gaacggaaac ctggcaggag catctctgag cccactgcac 1140 acaaagacct accaggcctc tagccagccc ggctccacat ctaaggacct gaccaacaat 1200 aacatcccac acctgctgtc tcccaaggag gccaagagca agaccgagtt cgactttaat 1260 atcgatccca agcctagcga gggccctggc acaaagtatc tgaagagcaa ctcccgctct 1320 cagcagaatc ggcactcctt catggagtcc tctcagtcta aggccggcac cctgcagcca 1380 aacgagaagc agagcaggca ctcctacatc gataccatcc cccagagctc cagaagccct 1440 tcctatagaa caaaggccaa gtctcacggc gccctgtctg acagcaagtc cgtgtctaat 1500 ctgagcgagg caagggcaca gatcgcagag cccagcacct cccggtactt tccttcttcc 1560 tgtctggacc tgaactctcc tacaagccca acacccaccc gccactccga tacacggacc 1620 ctgctgtctc caagcggcag aaataacagg aacgagggca ccctggattc tagaaggacc 1680 acaaccagac acagcaagac aatggaggag ctgaagctgc cagagcacat ggactcctct 1740 cactcccact ctctgagcgc ccctcacgag tccttctctt acggcctggg ctatacctcc 1800 cccttctcct cccaacaaag gccacaccgg cacagcatgt atgtgacaag ggacaaggtc 1860 cgggcaaagg gactggacgg aagcctgtcc atcggacagg gaatggcagc aagggccaac 1920 tccctgcagc tgctgtctcc tcagccagga gagcagctgc caccagagat gaccgtggca 1980 cgctctagcg tgaaggagac aagccgggag ggcacctcct ctttccacac acgccagaag 2040 tccgagggcg gcgtgtatca cgacccccac tctgacgacg gcacagcccc taaggagaac 2100 cggcacctgt acaacgatcc cgtgcctagg agggtgggat ccttctatag agtgccatct 2160 cccaggcctg acaatagctt tcacgagaat aacgtgtcca cccgcgtgag ctccctgcca 2220 tctgagtcta gctccggcac aaaccactct aagcggcagc ccgcctttga tccttggaag 2280 agcccagaga atatctctca cagcgagcag ctgaaggaga aggagaagca gggcttcttt 2340 agaagcatga agaagaagaa gaagaagagc cagaccgtgc ctaactccga ctctccagac 2400 ctgctgaccc tgcagaagtc catccacagc gcctccacac catctagcag gcctaaggag 2460 tggcggcctg agaagatcag cgatctgcag acccagagcc agccactgaa gtccctgagg 2520 aagctgctgc acctgtcctc tgccagcaac cacccagcca gctccgaccc aagattccag 2580 cccctgacag cccagcagac caagaacagc ttcagcgaga tcaggatcca cccactgtcc 2640 caggcatctg gaggatctag caacatcaga caggagccag caccaaaggg caggcccgcc 2700 ctgcagctgc ctggccagat ggacccaggc tggcacgtgt cctctgtgac acgctccgcc 2760 accgagggac catcctactc tgagcagctg ggagcaaaga gcggacctaa cggacaccca 2820 tataaccgga ccaatagatc caggatgccc aatctgaacg acctgaagga gacagccctg 2880 tga 2883 <210> 43 <211> 2883 <212> DNA <213> Artificial Sequence <220> <223> engineered nucleic acid sequence CDKL5coC1 <400> 43 atgaagatcc ccaacatcgg caacgtgatg aacaagttcg agatcctggg cgtggtgggc 60 gagggcgcct acggcgtggt gctgaagtgc aggcacaagg agacccacga gatcgtggcc 120 atcaagaagt tcaaggacag cgaggagaac gaggaggtga aggagaccac cctgagggag 180 ctgaagatgc tgaggaccct gaagcaggag aacatcgtgg agctgaagga ggccttcagg 240 aggaggggca agctgtacct ggtgttcgag tacgtggaga agaacatgct ggagctgctg 300 gaggagatgc ccaacggcgt gccccccgag aaggtgaaga gctacatcta ccagctgatc 360 aaggccatcc actggtgcca caagaacgac atcgtgcaca gggacatcaa gcccgagaac 420 ctgctgatca gccacaacga cgtgctgaag ctgtgcgact tcggcttcgc caggaacctg 480 agcgagggca acaacgccaa ctacaccgag tacgtggcca ccaggtggta caggagcccc 540 gagctgctgc tgggcgcccc ctacggcaag agcgtggaca tgtggagcgt gggctgcatc 600 ctgggcgagc tgagcgacgg ccagcccctg ttccccggcg agagcgagat cgaccagctg 660 ttcaccatcc agaaggtgct gggccccctg cccagcgagc agatgaagct gttctacagc 720 aaccccaggt tccacggcct gaggttcccc gccgtgaacc acccccagag cctggagagg 780 aggtatctgg gcatcctgaa cagcgtgctg ctggacctga tgaagaacct gctgaagctg 840 gaccccgccg acaggtatct gaccgagcag tgcctgaacc accccacctt ccagacccag 900 aggctgctgg acaggagccc cagcaggagc gccaagagga agccctacca cgtggagagc 960 agcaccctga gcaacaggaa ccaggccggc aagagcaccg ccctgcagag ccaccacagg 1020 agcaacagca aggacatcca gaacctgagc gtgggcctgc ccagggccga cgagggcctg 1080 cccgccaacg agagcttcct gaacggcaac ctggccggcg ccagcctgag ccccctgcac 1140 accaagacct accaggccag cagccagccc ggcagcacca gcaaggacct gaccaacaac 1200 aacatccccc acctgctgag ccccaaggag gccaagagca agaccgagtt cgacttcaac 1260 atcgacccca agcccagcga gggccccggc accaagtacc tgaagagcaa cagcaggagc 1320 cagcagaaca ggcacagctt catggagagc agccagagca aggccggcac cctgcagccc 1380 aacgagaagc agagcaggca cagctacatc gacaccatcc cccagagcag caggagcccc 1440 agctacagga ccaaggccaa gagccacggc gccctgagcg acagcaagag cgtgagcaac 1500 ctgagcgagg ccagggccca gatcgccgag cccagcacca gcagatactt ccccagcagc 1560 tgcctggacc tgaacagccc caccagcccc acccccaccc gccacagcga caccaggacc 1620 ctgctgagcc ccagcggcag gaacaacagg aacgagggca ccctggacag caggaggacc 1680 accaccaggc acagcaagac catggaggag ctgaagctgc ccgagcacat ggacagcagc 1740 cacagccaca gcctgagcgc cccccacgag agcttcagct acggcctggg ctacaccagc 1800 cccttcagca gccagcagag gccccacagg cacagcatgt acgtgaccag ggacaaagtg 1860 agggccaagg gcctggacgg cagcctgagc atcggccagg gcatggccgc cagggccaac 1920 agcctgcagc tgctgagccc ccagcccggc gagcagctgc cccccgagat gaccgtggcc 1980 aggagcagcg tgaaggagac cagcagggag ggcaccagca gcttccacac caggcagaag 2040 agcgagggcg gcgtgtacca cgacccccac agcgacgacg gcaccgcccc caaggagaac 2100 aggcacctgt acaacgaccc cgtgcccagg agggtgggca gcttctacag ggtgcccagc 2160 cccaggcccg acaacagctt ccacgagaac aatgtgagca ccagagtcag cagcctgccc 2220 agcgagagca gcagcggcac caaccacagc aagaggcagc ccgccttcga cccctggaag 2280 agccccgaga acatcagcca cagcgagcag ctgaaggaga aggagaagca gggcttcttc 2340 aggagcatga agaagaagaa gaagaagagc cagaccgtgc ccaacagcga cagccccgac 2400 ctgctgaccc tgcagaagag catccacagc gccagcaccc ccagcagcag gcccaaggag 2460 tggaggcccg agaagatcag cgacctgcag acccagagcc agcccctgaa gagcctgagg 2520 aagctgctgc acctgagcag cgccagcaac caccccgcca gcagcgaccc caggttccag 2580 cccctgaccg cccagcagac caagaacagc ttcagcgaga tcaggatcca ccccctgagc 2640 caggccagcg gcggcagcag caacatcagg caggagcccg cccccaaggg caggcccgcc 2700 ctgcagctgc ccggccagat ggaccccggc tggcacgtga gcagcgtgac caggagcgcc 2760 accgagggcc ccagctacag cgagcagctg ggcgccaaga gcggccccaa cggccacccc 2820 tacaacagga ccaacaggag caggatgccc aacctgaacg acctgaagga gaccgccctg 2880 tga 2883 <210> 44 <211> 2883 <212> DNA <213> Artificial Sequence <220> <223> engineered nucleic acid sequence CDKL5coD1 <400> 44 atgaagattc ccaacattgg gaatgtcatg aacaagtttg agattctggg cgtggtggga 60 gagggagcct acggcgttgt tctcaagtgc cgccacaagg aaactcacga gatcgtggct 120 atcaagaaat tcaaggatag tgaggaaaat gaagaagtca aggagacaac tcttcgagaa 180 ttaaagatgc tcagaacctt aaaacaagaa aatattgtgg aattgaaaga ggccttcaga 240 agacgaggaa aactctacct ggtgtttgaa tatgtggaga agaacatgct ggaactgttg 300 gaagagatgc ctaatggggt ccctcctgaa aaagtgaagt cctacatcta tcagctaatc 360 aaggccatcc actggtgcca caaaaatgat attgtccacc gggacatcaa accagagaat 420 ttgctcatca gccacaatga tgtgctcaaa ctttgtgatt ttggatttgc ccgaaacctc 480 tccgaaggca ataatgccaa ctacaccgag tacgtggcca cccgctggta tcgctctcca 540 gagcttctgc ttggggcccc ctatggcaag tctgtggaca tgtggagcgt tggctgcatc 600 ctgggcgagc tgtcagatgg gcagccactc ttcccagggg agtccgaaat cgaccagctg 660 ttcaccatcc agaaagtcct ggggccactt cccagcgagc aaatgaaact gttttacagc 720 aatccaagat ttcatggatt acgcttccct gctgtcaacc accctcaatc cctggagagg 780 agatacttgg gcatcctcaa cagtgtgctg ctggacctca tgaagaatct cctcaagttg 840 gaccctgccg acagatatct tactgagcag tgcctgaacc atcccacatt tcagacccag 900 agattgctag acaggagccc atcaaggagt gccaagagaa agccttatca tgtggagagc 960 agcacactat caaacagaaa ccaggctgga aagagtacag ctttacaatc tcaccaccgc 1020 tccaactcaa aggacattca gaacttgtca gttggactgc ccagagcaga tgagggactc 1080 cccgccaatg aaagcttcct gaatggaaac ctggcaggtg cctccctttc tcctctgcac 1140 acaaagacct accaggcgtc cagccaacct ggatccacat caaaagatct gaccaacaac 1200 aatatccccc accttttatc accaaaggaa gccaaaagta aaacagagtt cgacttcaac 1260 atcgacccca aaccttcaga agggcctggc accaaatatt taaaatcaaa ttcaagaagc 1320 cagcagaatc ggcactcatt catggaatcc tcacagagca aagctgggac actccagcca 1380 aatgagaagc agtccagaca tagttatatt gacaccattc ctcagtcatc cagatcccca 1440 agctaccgga caaaagccaa gagccatggc gcgctgtccg attccaagtc agtatcaaat 1500 ctttcagaag caagagctca gatcgcagag ccctccactt cccgctactt cccctcttca 1560 tgtttggatc tcaattcccc tacttcacct acacccaccc gtcatagtga cacacggacc 1620 ctgctcagtc caagcggcag gaataaccgg aacgagggca cactggacag ccgccgcacc 1680 accacaaggc attctaaaac catggaggag ctgaaattgc ccgagcacat ggactcttca 1740 cattctcatt cactatctgc acctcatgaa agttttagct atggattggg atataccagc 1800 cccttctcca gtcagcagag gcctcacaga cacagcatgt atgtcaccag ggacaaggtg 1860 cgggcaaagg gcctggatgg atctttaagt attggccagg gcatggctgc cagagcaaat 1920 tctcttcagc tgctttcacc ccagcctggg gaacaactgc caccagaaat gacagtggca 1980 aggagcagtg taaaagagac ctccagagaa ggaacatcca gcttccatac tcgccagaag 2040 tcggaaggtg gtgtgtacca cgacccacat tctgatgatg ggaccgctcc caaggaaaac 2100 aggcacctgt acaacgatcc tgtgccccgc cgcgtgggct ctttctacag agttccttct 2160 cctagaccag acaactcctt ccacgaaaac aatgtgtcca ccagagtgag cagtttaccc 2220 tctgagagtt ctagtggaac caatcattcc aaaagacagc ctgcatttga cccctggaag 2280 tccccggaga atatctccca ctccgagcag ctcaaagaaa aggagaaaca gggattcttc 2340 aggtccatga aaaagaagaa gaaaaaaagc cagacagtac caaacagcga ttctccagat 2400 cttctcactc tgcaaaaatc catccattct gccagtactc catcatctcg acccaaggag 2460 tggagacctg agaaaatttc agacctgcag actcagtctc agcccctgaa atctttgagg 2520 aagttattac acctctcatc agcttccaat cacccagcca gctcagatcc caggttccag 2580 ccgctcacag cccagcaaac aaaaaactct ttttcagaaa tacgtattca tcctttgtcc 2640 caggcatcag gaggcagcag caacatcagg caggagccag ctccaaaagg aaggcccgct 2700 ctgcagctgc caggacagat ggatccaggc tggcatgttt cctctgtcac tagatcagcc 2760 acagaaggac catcctattc tgaacagctg ggtgcaaaaa gtggccccaa tggccacccc 2820 tacaatagaa caaatcgcag cagaatgccc aacttaaatg acttgaaaga aacagcactg 2880 tga 2883 <210> 45 <211> 2883 <212> DNA <213> Artificial Sequence <220> <223> engineered nucleic acid sequence CDKL5coA2 <400> 45 atgaagatcc ccaacatcgg caacgtgatg aacaagttcg agatcctggg cgtcgtcggc 60 gaaggcgctt atggcgttgt gctgaagtgc agacacaaag aaacccacga gatcgtggcc 120 atcaagaagt tcaaggacag cgaagagaac gaggaagtga aagagacaac cctgcgcgag 180 ctgaagatgc tgcggaccct gaagcaagag aacatcgtgg aactgaaaga ggccttccgg 240 cggagaggca agctgtacct ggtgttcgag tacgtggaaa agaacatgct cgagctgctg 300 gaagagatgc ccaacggcgt gccacctgag aaagtgaagt cctacatcta ccagctgatc 360 aaggccatcc actggtgcca caagaacgac atcgtgcacc gggacatcaa gcccgagaac 420 ctgctgatct cccacaacga cgtgctgaag ctgtgcgact tcggcttcgc cagaaatctg 480 agcgagggca acaacgccaa ctacaccgaa tacgtggcca ccagatggta cagaagccct 540 gagctgctgc tgggagcccc ttacggcaag tccgtggata tgtggagcgt gggctgtatc 600 ctgggagagc tgtctgacgg ccagcctctg tttcctggcg agtccgagat cgaccagctg 660 ttcaccatcc agaaggtgct gggccctctg cctagcgagc agatgaagct gttctacagc 720 aaccccagat tccacggcct gagattcccc gccgtgaatc accctcagag cctggaaaga 780 agatacctgg gcatcctgaa cagcgtgctg ctggacctga tgaagaatct gctgaaactg 840 gaccccgccg acagatacct gaccgagcag tgcctgaacc atcctacctt tcaaacccag 900 agactgctgg atcggagccc tagcagaagc gccaagagaa agccctacca cgtggaaagc 960 agcaccctga gcaacagaaa ccaggccggc aagtctacag ccctgcagag ccaccacaga 1020 agcaacagca aggacatcca gaacctgtcc gtgggcctgc ctagagccga cgaaggactg 1080 cctgccaacg agagcttcct gaacggaaat ctggctggcg cctctctgag ccctctgcac 1140 acaaagacat accaggccag cagccagcct ggcagcacaa gcaaggatct gaccaacaac 1200 aacatccctc atctgctgag ccccaaagag gccaagagca agaccgagtt cgacttcaac 1260 atcgacccca agcctagcga aggccctggc accaagtacc tgaagtccaa cagcagaagc 1320 cagcagaacc ggcactcctt catggaaagc tcccagagca aggccggcac actgcagcct 1380 aacgagaagc agagcagaca cagctacatc gacacaatcc cacagagcag caggtcccca 1440 agctacagga ccaaggccaa atctcacggc gccctgagcg atagcaagag cgtgtccaat 1500 ctgtccgagg ctagagccca gatcgccgag cctagcacca gcagatactt ccctagctcc 1560 tgcctggatc tgaacagccc aacaagcccc acacctacca ggcacagcga caccagaaca 1620 ctgctgtccc catccggcag aaacaaccgg aacgagggca ccctggacag cagacggacc 1680 accacaagac acagcaagac catggaagaa ctgaagctgc ccgagcacat ggactccagc 1740 cactctcatt ctctgagcgc ccctcacgag tccttctctt acggcctggg ctacacaagc 1800 cccttcagct ctcagcagag gccccacaga cacagtatgt atgtgacccg ggacaaagtg 1860 cgcgccaaag gcctggacgg ctctctgtct atcggccaag gcatggccgc cagagccaat 1920 tctctgcagc tgctgtctcc tcagcctggg gaacaactgc ctcctgagat gaccgtggcc 1980 agatccagcg tgaaagaaac cagcagagag ggcacctcca gcttccacac cagacagaaa 2040 agcgaaggcg gagtgtacca cgatcctcac agcgacgacg gcacagcccc taaagagaac 2100 agacacctgt acaacgaccc cgtgcctaga agagtgggct ccttctacag agtgccttct 2160 cctagacctg acaactcctt ccacgagaac aacgtgtcca ccagagtgtc cagcctgcct 2220 tccgaaagca gctccggcac caaccactcc aagagacagc ctgctttcga cccctggaag 2280 tcccctgaga acatcagcca ctccgagcag ctgaaagaga aagagaagca gggctttttc 2340 cggtccatga agaagaagaa aaagaagtcc cagacggtcc ccaacagcga ctccccagat 2400 ctgctgaccc tgcagaagtc catccactcc gccagcacac ctagcagcag acccaaagag 2460 tggcggccag agaagatcag cgatctgcag acccagtctc agcctctgaa gtccctgagg 2520 aagctgctgc atctgagcag cgcctctaat caccctgcca gcagcgaccc tagatttcag 2580 ccactgacag cccagcagac caagaactcc ttcagcgaga tccggattca cccactgtct 2640 caggccagcg gcggcagcag caatatcaga caagagcccg ctcctaaggg cagacctgct 2700 ctgcaactgc ctggccagat ggatccaggc tggcacgtgt cctctgtgac cagatccgcc 2760 acagagggac ctagctacag cgaacagctc ggcgccaagt ctggccctaa cggacacccc 2820 tacaaccgga ccaaccggtc cagaatgccc aatctgaacg acctcaaaga aacggccctg 2880 tga 2883 <210> 46 <211> 2883 <212> DNA <213> Artificial Sequence <220> <223> engineered nucleic acid sequence CDKL5coB2 <400> 46 atgaagatcc caaatatcgg caacgtgatg aataagttcg agatcctggg agtggtggga 60 gagggagcat atggcgtggt gctgaagtgc aggcacaagg agacccacga gatcgtggcc 120 atcaagaagt ttaaggacag cgaggagaat gaggaggtga aggagaccac actgagagag 180 ctgaagatgc tgaggacact gaagcaggag aacatcgtgg agctgaagga ggccttccgg 240 agaaggggca agctgtacct ggtgtttgag tacgtggaga agaacatgct ggagctgctg 300 gaggagatgc caaatggcgt gccccctgag aaggtgaagt cctacatcta tcagctgatc 360 aaggccatcc actggtgcca caagaacgac atcgtgcaca gagatatcaa gcccgagaac 420 ctgctgatct cccacaatga cgtgctgaag ctgtgcgatt tcggctttgc caggaacctg 480 agcgagggca acaacgccaa ttacacagag tacgtggcca ccaggtggta caggagccca 540 gagctgctgc tgggagcacc atacggcaag agcgtggata tgtggtccgt gggctgcatc 600 ctgggcgagc tgtctgacgg ccagcctctg ttcccaggcg agagcgagat cgatcagctg 660 tttaccatcc agaaggtgct gggccctctg ccaagcgagc agatgaagct gttctactcc 720 aaccctagat tccacggcct gaggtttccc gccgtgaatc accctcagag cctggagcgc 780 cggtatctgg gcatcctgaa ctccgtgctg ctggatctga tgaagaatct gctgaagctg 840 gaccccgccg atagatacct gaccgagcag tgtctgaatc accctacatt tcagacccag 900 cgcctgctgg accggagccc ttccagatct gccaagagga agccatatca cgtggagagc 960 tccaccctgt ccaatagaaa ccaggccggc aagtctacag ccctgcagag ccaccacagg 1020 agcaactcca aggacatcca gaatctgtcc gtgggactgc ctagggcaga cgagggactg 1080 ccagccaacg agagcttcct gaacggaaac ctggcaggag catctctgag cccactgcac 1140 acaaagacct accaggcctc tagccagccc ggctccacat ctaaggacct gaccaacaat 1200 aacatcccac acctgctgtc tcccaaggag gccaagagca agaccgagtt cgactttaat 1260 atcgatccaa agcctagcga gggaccaggc acaaagtatc tgaagagcaa ctcccgctct 1320 cagcagaatc ggcactcctt catggagtcc tctcagtcta aggccggcac cctgcagcct 1380 aacgagaagc agagcagaca ctcctacatc gataccatcc cccagagctc cagaagccct 1440 tcctatagaa caaaggccaa gtctcacggc gccctgtctg acagcaagtc cgtgtctaat 1500 ctgagcgagg caagggcaca gatcgcagag cccagcacct cccggtactt tccttcttcc 1560 tgtctggacc tgaactctcc tacaagccca acacccaccc gccacagcga tacacggacc 1620 ctgctgtctc caagcggccg caataaccgg aacgagggca ccctggattc tagaaggacc 1680 acaacccgcc acagcaagac aatggaggag ctgaagctgc cagagcacat ggactcctct 1740 cactcccact ctctgagcgc ccctcacgag tccttctctt acggcctggg ctatacctcc 1800 cccttctcct cccaacaaag accccacagg cacagcatgt acgtgacaag ggacaaggtc 1860 cgggcaaagg gactggacgg aagcctgtcc atcggacagg gaatggcagc aagggccaac 1920 tccctgcagc tgctgtctcc tcagccagga gagcagctgc caccagagat gaccgtggca 1980 cgctctagcg tgaaggagac aagccgggag ggcacctcct ctttccacac acgccagaag 2040 tccgagggag gcgtgtacca cgacccacac tctgacgacg gcacagcccc taaggagaac 2100 cggcacctgt acaacgatcc cgtgcctagg agggtgggat ccttctatag agtgccatct 2160 cccaggcctg acaatagctt tcacgagaat aacgtgtcca cccgcgtgag ctccctgcca 2220 tctgagtcta gctccggcac aaaccactct aagcggcagc ccgcctttga cccttggaag 2280 agcccagaga atatctctca cagcgagcag ctgaaggaga aggagaagca gggcttcttt 2340 cgcagcatga agaagaagaa gaagaagagc cagaccgtgc ctaactccga ctctccagac 2400 ctgctgaccc tgcagaagtc catccacagc gcctccacac catctagcag gcctaaggag 2460 tggcggcctg agaagatcag cgatctgcag acccagagcc agccactgaa gtccctgcgg 2520 aagctgctgc acctgtcctc tgcctccaac cacccagcaa gctccgaccc aagattccag 2580 cccctgacag cccagcagac caagaacagc ttcagcgaga tcaggatcca ccctctgtcc 2640 caagcatctg gaggatctag caacatcaga caggagccag caccaaaggg caggcccgcc 2700 ctgcagctgc ctggccagat ggatccaggc tggcacgtgt cctctgtgac acgcagcgcc 2760 accgagggac catcctactc tgagcagctg ggagcaaaga gcggacctaa cggacaccca 2820 tataaccgga ccaatagatc caggatgccc aatctgaacg acctgaagga gacagccctg 2880 tga 2883 <210> 47 <211> 2883 <212> DNA <213> Artificial Sequence <220> <223> engineered nucleic acid sequence CDKL5coC2 <400> 47 atgaagatcc ccaacatcgg caacgtgatg aacaagttcg agatcctggg cgtggtgggc 60 gagggcgcct acggcgtggt gctgaagtgc aggcacaagg agacccacga gatcgtggcc 120 atcaagaagt tcaaggacag cgaggagaac gaggaggtga aggagaccac cctgagggag 180 ctgaagatgc tgaggaccct gaagcaggag aacatcgtgg agctgaagga ggccttcagg 240 aggaggggca agctgtacct ggtgttcgag tacgtggaga agaacatgct ggagctgctg 300 gaggagatgc ccaacggcgt gccccctgag aaggtgaaga gctacatcta ccagctgatc 360 aaggccatcc actggtgcca caagaacgac atcgtgcaca gggacatcaa gcccgagaac 420 ctgctgatca gccacaacga cgtgctgaag ctgtgcgact tcggcttcgc caggaacctg 480 agcgagggca acaacgccaa ctacaccgag tacgtggcca ccaggtggta caggagcccc 540 gagctgctgc tgggcgcccc ctacggcaag agcgtggaca tgtggagcgt gggctgcatc 600 ctgggcgagc tgagcgacgg ccagcccctg ttccccggcg agagcgagat cgaccagctg 660 ttcaccatcc agaaggtgct gggccccctg cccagcgagc agatgaagct gttctacagc 720 aaccccaggt tccacggcct gaggttcccc gccgtgaacc acccccagag cctggagagg 780 agatacctgg gcatcctgaa cagcgtgctg ctggacctga tgaagaacct gctgaagctg 840 gaccccgccg acagatacct gaccgagcag tgcctgaacc accccacctt ccagacccag 900 aggctgctgg acaggagccc cagcaggagc gccaagagga agccctacca cgtggagagc 960 agcaccctga gcaacaggaa ccaggccggc aagagcaccg ccctgcagag ccaccacagg 1020 agcaacagca aggacatcca gaacctgagc gtgggcctgc ccagggccga cgagggcctg 1080 cccgccaacg agagcttcct gaacggcaac ctggccggcg ccagcctgag ccccctgcac 1140 accaagacct accaggccag cagccagccc ggcagcacca gcaaggacct gaccaacaac 1200 aacatccccc acctgctgag ccccaaggag gccaagagca agaccgagtt cgacttcaac 1260 atcgacccca agcccagcga gggccccggc accaagtacc tgaagagcaa cagcaggagc 1320 cagcagaaca ggcacagctt catggagagc agccagagca aggccggcac cctgcagccc 1380 aacgagaagc agagcaggca cagctacatc gacaccatcc cccagagcag caggagcccc 1440 agctacagga ccaaggccaa gagccacggc gccctgagcg acagcaagag cgtgagcaac 1500 ctgagcgagg ccagggccca gatcgccgag cccagcacca gcagatactt ccccagcagc 1560 tgcctggacc tgaacagccc caccagcccc acccccacca ggcacagcga caccaggacc 1620 ctgctgagcc ccagcggcag gaacaacagg aacgagggca ccctggacag caggaggacc 1680 accaccaggc acagcaagac catggaggag ctgaagctgc ccgagcacat ggacagcagc 1740 cacagccaca gcctgagcgc ccctcacgag agcttcagct acggcctggg ctacaccagc 1800 cccttcagca gccagcagag gccccacagg cacagcatgt acgtgaccag ggacaaagtg 1860 agggccaagg gcctggacgg cagcctgagc atcggccagg gcatggccgc cagggccaac 1920 agcctgcagc tgctgagccc ccagcccggc gagcagctgc ctcccgagat gaccgtggcc 1980 aggagcagcg tgaaggagac cagcagggag ggcaccagca gcttccacac caggcagaag 2040 agcgagggcg gcgtgtacca cgacccccac agcgacgacg gcaccgcccc caaggagaac 2100 aggcacctgt acaacgaccc cgtgcccagg agggtgggca gcttctacag ggtgcccagc 2160 cccaggcccg acaacagctt ccacgagaac aatgtgagca ccagagtgag cagcctgccc 2220 agcgagagca gcagcggcac caaccacagc aagaggcagc ccgccttcga cccctggaag 2280 agccccgaga acatcagcca cagcgagcag ctgaaggaga aggagaagca gggcttcttc 2340 aggagcatga agaagaagaa gaagaagagc cagaccgtgc ccaacagcga cagccccgac 2400 ctgctgaccc tgcagaagag catccacagc gccagcaccc ccagcagcag gcccaaggag 2460 tggaggcccg agaagatcag cgacctgcag acccagagcc agcccctgaa gagcctgagg 2520 aagctgctgc acctgagcag cgccagcaac caccccgcca gcagcgaccc caggttccag 2580 cccctgaccg cccagcagac caagaacagc ttcagcgaga tcaggatcca ccccctgagc 2640 caggccagcg gcggcagcag caacatcagg caggagcccg cccccaaggg caggcccgcc 2700 ctgcagctgc ccggccagat ggaccccggc tggcacgtga gcagcgtgac caggagcgcc 2760 accgagggcc ccagctacag cgagcagctg ggcgccaaga gcggccccaa cggccacccc 2820 tacaacagga ccaacaggag caggatgccc aacctgaacg acctgaagga gaccgccctg 2880 tga 2883 <210> 48 <211> 2883 <212> DNA <213> Artificial Sequence <220> <223> engineered nucleic acid sequence CDKL5coD2 <400> 48 atgaagatcc ctaacatcgg gaatgtcatg aacaagtttg aaatcctggg ggtggtgggg 60 gagggagctt atggagttgt tttgaaatgt cgtcataagg aaactcatga aatcgtggcc 120 attaagaagt tcaaggacag tgaggagaat gaagaggtga aggagaccac tctccgcgag 180 ctgaagatgc tgaggacact gaagcaggaa aacattgtgg agctgaagga ggccttccga 240 cgacggggta agttgtacct ggtgtttgag tacgtggaga aaaacatgtt agaacttctg 300 gaggaaatgc caaacggtgt acctccagaa aaagtcaagt catatatcta ccagttgatc 360 aaagccatcc actggtgtca taaaaatgac atcgtccaca gagatataaa accagagaat 420 cttctgatct ctcacaatga tgtattaaaa ctttgtgatt ttggttttgc ccgtaatctg 480 tctgaaggta ataatgctaa ctatactgag tatgtagcaa ctcgctggta cagatcgcct 540 gaactgctac tgggtgctcc ttacggaaaa agtgtggaca tgtggagcgt tggttgtatc 600 ctaggagagc tgagtgatgg gcagccattg ttcccggggg agagtgaaat tgaccaacta 660 ttcacaatcc agaaagtgct ggggccacta ccaagtgaac aaatgaaact tttttattca 720 aatcctagat ttcacggtct acgtttcccc gctgtgaacc atcctcagtc cttagaacgg 780 cgatatttag gcattctgaa ctctgttctg ttagatctga tgaagaattt actaaaatta 840 gacccggctg accgctattt gacagagcag tgtttaaatc atccaacctt ccagacacag 900 agactcctag accgttcacc atctagaagt gcgaaaagaa aaccctacca cgttgaatca 960 agtaccctct ccaatcgcaa ccaggctggg aagagtactg ccctacaatc gcaccacagg 1020 agtaatagta aagatattca gaatctatct gtagggcttc ctcgagcgga cgagggtcta 1080 cctgccaatg aaagtttcct caatggtaac ttagctgggg catcactgtc gccccttcat 1140 actaagacct accaagcctc atctcaaccg gggagtacta gtaaagacct caccaacaat 1200 aacatccccc atttattatc tcccaaggag gcgaaatcca agactgagtt cgatttcaac 1260 attgacccaa agccctctga agggcctggc accaaatacc tgaaatctaa tagcagaagt 1320 caacaaaata ggcacagctt catggagtcc tcgcagagca aagctggcac actgcaacct 1380 aatgaaaagc aaagccgaca ttcatatatt gataccatcc cccaatctag tagaagccct 1440 tcataccgca cgaaagcaaa gtctcatggc gcactgtcag attctaaatc cgtcagcaat 1500 ctcagtgaag ccagggctca gatcgccgag ccctctacat ctcgctactt tccctcatcc 1560 tgcctggacc taaactcccc gacctctccc acccccacgc gtcacagcga cacccgaaca 1620 ttactttcac cttcgggcag gaataatcga aatgagggca ccctagattc gcgccgtacg 1680 actacacggc attcaaaaac catggaagaa ttgaaattgc ctgagcacat ggattcgtca 1740 cactctcaca gtctatcggc ccctcacgag agtttcagtt acgggcttgg ctacaccagt 1800 cccttctcca gccagcaacg cccacaccgc cactccatgt atgtcacccg cgacaaggtc 1860 cgtgccaaag gactcgatgg cagcctaagc ataggacagg gcatggccgc cagggccaac 1920 agtctccagt tactaagtcc ccagcccgga gaacagctgc cacccgagat gactgtggct 1980 agatcgtccg tgaaagagac aagtagggaa gggacctcta gcttccacac cagacagaaa 2040 tccgaggggg gcgtgtatca tgaccctcat agtgatgatg gtacagcccc gaaggaaaat 2100 agacacttgt acaatgaccc tgtgccccga agagttggct ccttctaccg ggtgccctct 2160 ccacggccag acaacagctt ccatgagaac aatgtttcaa cccgggtaag ctccctgcct 2220 agtgaaagtt catccggaac aaatcactcg aagcgtcagc cagccttcga cccctggaag 2280 tctccggaga acataagtca cagcgagcag ctcaaagaaa aagaaaaaca aggcttcttc 2340 agaagcatga agaagaaaaa aaaaaagtct caaacagtgc caaattccga ttcccccgac 2400 ttattaacac tacaaaagag catccattca gcttctacgc caagcagtag gcccaaagag 2460 tggagacccg agaagatttc tgatctacag acccagtctc agcctttaaa atcgctcagg 2520 aagctgctgc acctgtcttc cgcttcaaac cacccggcct ccagtgaccc tcggtttcag 2580 ccactgactg cccagcagac taaaaatagt ttttcagaga tcaggattca tcccttatca 2640 caggcctctg gcggcagcag caatatccgg caggagcctg cccctaaagg ccggcccgcg 2700 ttgcagctgc ccggccagat ggacccaggc tggcatgtgt catcagttac acgcagtgcc 2760 acagaaggcc ccagctactc agaacaattg ggtgctaagt caggacccaa tggccaccca 2820 tacaaccgaa ccaacagatc aaggatgccc aacctcaacg acctcaaaga aacagctctc 2880 tga 2883

Claims

CDKL5 결핍 장애 (CDD)를 치료하는데 유용한 재조합 아데노 관련 바이러스 (rAAV)로서, 상기 rAAV는
(a) AAV 캡시드; 및
(b) (a)의 상기 AAV 캡시드에 포장된 벡터 게놈
을 포함하고, 상기 벡터 게놈은 역전된 말단 반복서열 (ITR), 및 중앙 신경계 세포에서 hCDKL5 발현을 안내하는 조절 서열의 제어 하에 상기 기능적 인간 CDKL5 (hCDKL5)를 인코딩하는 핵산 서열인 hCDKL5 코딩 서열을 포함하고, 상기 hCDKL5 코딩 서열은 서열번호 3의 뉴클레오티드 699번 내지 3581번 (서열번호 22) 또는 서열번호 3의 뉴클레오티드 699번 내지 3581번 (서열번호 22)과 적어도 약 95% 일치하는 서열인, 재조합 아데노 관련 바이러스 (rAAV).
제 1항에 있어서,
상기 hCDKL5 코딩 서열은 hCDKL5 전사물 변이체 1 내지 3 (NM_001037343.1 (서열번호 16), NM_ NM_001323289.2 (서열번호 17) 및 NM_003159.2 (서열번호 18)) 중 어느 하나와 80% 미만으로 일치하는, rAAV.
제 1항 또는 제 2항에 있어서,
상기 기능적 hCDKL5는 서열번호 2의 아미노산 서열을 갖는, rAAV.
CDKL5 결핍 장애 (CDD)를 치료하는데 유용한 재조합 아데노 관련 바이러스 (rAAV)로서, 상기 rAAV는
(a) AAV 캡시드; 및
(b) (a)의 상기 rAAV 캡시드에 포장된 벡터 게놈
을 포함하고, 상기 벡터 게놈은 역전된 말단 반복서열 (ITR), 및 hCDKL5 발현을 안내하는 조절 서열의 제어 하에 상기 기능적 인간 CDKL5 (hCDKL5)를 인코딩하는 핵산 서열인 hCDKL5 코딩 서열을 포함하고, 상기 기능적 hCDKL5은 기능적 hCDKL5 이소형 2 (hCDKL5-2GS), 기능적 hCDKL5 이소형 3 (hCDKL5-3GS) 또는 기능적 hCDKL5 이소형 4 (hCDKL5-4GS)인, 재조합 아데노 관련 바이러스 (rAAV).
제 4항에 있어서,
상기 벡터 게놈은 서열번호 6의 아미노산 서열을 갖는 기능적 hCDKL5-2GS를 인코딩하는 핵산 서열을 포함하는, rAAV.
제 4항 또는 제 5항에 있어서,
상기 hCDKL5 코딩 서열은 서열번호 6을 인코딩하는 서열번호 24 또는 이와 적어도 95% 일치하는 서열인, rAAV.
제 4항에 있어서,
상기 벡터 게놈은 서열번호 8의 아미노산 서열을 갖는 기능적 hCDKL5-3GS를 인코딩하는 핵산 서열을 포함하는, rAAV.
제 4항 또는 제 7항에 있어서,
상기 hCDKL5 코딩 서열은 서열번호 8을 인코딩하는 서열번호 25 또는 이와 적어도 95% 일치하는 서열인, rAAV.
제 4항에 있어서,
상기 벡터 게놈은 서열번호 10의 아미노산 서열을 갖는 기능적 hCDKL5-4GS를 인코딩하는 핵산 서열을 포함하는, rAAV.
제 4항 또는 제 9항에 있어서,
상기 hCDKL5 코딩 서열은 서열번호 10을 인코딩하는 서열번호 26 또는 이와 적어도 95% 일치하는 서열인, rAAV.
제 1항 내지 제 10항 중 어느 한 항에 있어서,
상기 조절 서열은 뉴런 특이적 프로모터를 포함하는, rAAV.
제 1항 내지 제 11항 중 어느 한 항에 있어서,
상기 조절 서열은 인간 시냅신 프로모터를 포함하는, rAAV.
제 1항 내지 제 10항 중 어느 한 항에 있어서,
상기 조절 서열은 전신발현 프로모터를 포함하는, rAAV.
제 1항 내지 제 10항 또는 제 13항 중 어느 한 항에 있어서,
상기 조절 서열은 CB7 프로모터를 포함하는, rAAV.
제 1항 내지 제 10항 또는 제 13항 중 어느 한 항에 있어서,
상기 조절 서열은 UbC 프로모터를 포함하는, rAAV.
제 1항 내지 제 6항 중 어느 한 항에 있어서,
상기 조절 서열은 코작 서열, 인트론, 인핸서, TATA 신호 및 폴리 A 서열 중 하나 이상을 추가로 포함하는, rAAV.
제 1항 내지 제 6항 또는 제 16항 중 어느 한 항에 있어서,
상기 조절 서열은 WPRE 요소를 추가로 포함하는, rAAV.
제 1항 내지 제 16항 중 어느 한 항에 있어서,
상기 벡터 게놈은 hCDKL5의 3' 미번역 영역에서 등쪽 뿌리 신경절 (drg) 특이적 miRNA 표적 서열의 적어도 2개의 일렬 반복서열을 추가로 포함하고, 상기 적어도 2개의 일렬 반복서열은 동일하거나 상이하고, miR-183 또는 miR-182를 표적할 수 있는 적어도 제 1 miRNA 표적 서열 및 적어도 제 2 miRNA 표적 서열을 포함하는, rAAV.
제 1항 내지 제 16항 또는 제 18항 중 어느 한 항에 있어서,
상기 발현 카세트 mRNA 또는 DNA 양성 가닥에 대한 상기 적어도 제 1 및/또는 적어도 제 2 miRNA 표적 서열의 상기 miRNA 표적 서열은 (i) AGTGAATTCTACCAGTGCCATA (miR-183, 서열번호 11); 및 (ii) AGCAAAAATGTGCTAGTGCCAAA (서열번호 12)인, rAAV.
제 18항 또는 제 19항에 있어서,
상기 둘 이상의 miRNA 표적 서열은 (A) GGAT; (B) CACGTG; 또는 (C) GCATGC 중 하나 이상으로부터 독립적으로 선택되는, rAAV.
제 20항에 있어서,
상기 miRNA 표적 서열 사이에 위치한 스페이서는 첫 번째 miRNA 표적 서열의 3' 및/또는 마지막 miRNA 표적 서열의 5'에 위치할 수 있는, rAAV.
제 20항 또는 제 21항에 있어서,
상기 miRNA 표적 서열 사이의 스페이서는 동일한, rAAV.
제 1항 내지 제 22항 중 어느 한 항에 있어서,
상기 캡시드는 AAVhu68 캡시드, AAV9 캡시드 또는 AAVrh91 캡시드인, rAAV.
제 1항 내지 제 23항 중 어느 한 항에 따른 rAAV의 스톡 및 수성 현탁 매질을 포함하는 조성물.
제 24항에 있어서,
상기 현탁액은 정맥내 투여, 경막내 투여, 대수조내 투여 또는 뇌실내 투여를 위해 제형화되는, 조성물,
발현 카세트를 포함하는 벡터로서, 상기 발현 카세트는 hCDKL5 발현을 안내하는 조절 서열의 제어 하에 기능적 인간 CDKL5 (hCDKL5)를 인코딩하는 핵산 서열인 상기 hCDKL5 코딩 서열을 포함하고, 상기 hCDKL5 코딩 서열은 서열번호 22 또는 서열번호 22와 적어도 약 95% 일치하는 서열인, 벡터.
제 26항에 있어서,
상기 벡터는
재조합 파보바이러스, 재조합 렌티바이러스, 재조합 레트로바이러스 또는 재조합 아데노바이러스로부터 선택된 바이러스성 벡터; 또는
노출 DNA, 노출 RNA, 무기 입자, 지질 입자, 중합체 기반의 벡터 또는 키토산 기반의 제형물로부터 선택된 비-바이러스성 벡터인, 벡터.
CDD를 치료하는 방법으로서, 제 1항 내지 제 23항 중 어느 한 항에 따른 rAAV, 또는 제 26항 또는 제 27항에 따른 벡터의 유효량을 이를 필요로 하는 대상체에게 투여하는 것을 포함하는, 방법.
제 1항 내지 제 23항 중 어느 한 항에 따른 rAAV를 생산하는데 유용한 rAAV 생산 시스템으로서,
(a) 클라드 F 캡시드 단백질을 인코딩하는 핵산 서열;
(b) 벡터 게놈; 및
(c) 상기 클라드 F 캡시드 내에 상기 벡터 게놈의 포장을 허용하기에 충분한 AAV rep 기능 및 헬퍼 기능
을 포함하는 세포 배양물을 포함하는, rAAV 생산 시스템.
제 29항에 있어서,
상기 벡터 게놈은 서열번호 1인, rAAV 생산 시스템.
제 29항에 있어서,
상기 벡터 게놈은 서열번호 29인, rAAV 생산 시스템.
제 29항에 있어서,
상기 벡터 게놈은 서열번호 31인, rAAV 생산 시스템.
제 29항 내지 제 32항 중 어느 한 항에 있어서,
상기 세포 배양물은 인간 배아 신장 293 세포 배양물인, rAAV 생산 시스템.
제 29항 내지 제 33항 중 어느 한 항에 있어서,
상기 AAV rep은 상이한 AAV로부터 나오는, rAAV 생산 시스템.
제 29항에 있어서,
상기 벡터 게놈은 서열번호 3인, rAAV 생산 시스템.
제 29항에 있어서,
상기 벡터 게놈은 서열번호 5인, rAAV 생산 시스템.
제 29항에 있어서,
상기 벡터 게놈은 서열번호 7인, rAAV 생산 시스템.
제 29항에 있어서,
상기 벡터 게놈은 서열번호 9인, rAAV 생산 시스템.
발현 카세트를 포함하는 벡터로서, 상기 발현 카세트는 hCDKL5-2GS 발현을 안내하는 조절 서열의 제어 하에 기능적 인간 CDKL5 이소형 2 (hCDKL5-2GS)를 인코딩하는 핵산 서열인 상기 hCDKL5-2GS 코딩 서열을 포함하고, 상기 hCDKL5-2GS 코딩 서열은 서열번호 24 또는 서열번호 24와 적어도 약 95% 일치하는 서열인, 벡터.
발현 카세트를 포함하는 벡터로서, 상기 발현 카세트는 hCDKL5-3GS 발현을 안내하는 조절 서열의 제어 하에 기능적 인간 CDKL5 이소형 3 (hCDKL5-3GS)를 인코딩하는 핵산 서열인 상기 hCDKL5-3GS 코딩 서열을 포함하고, 상기 hCDKL5-3GS 코딩 서열은 서열번호 25 또는 서열번호 25와 적어도 약 95% 일치하는 서열인, 벡터.
발현 카세트를 포함하는 벡터로서, 상기 발현 카세트는 hCDKL5-4GS 발현을 안내하는 조절 서열의 제어 하에 기능적 인간 CDKL5 이소형 4 (hCDKL5-4GS)를 인코딩하는 핵산 서열인 상기 hCDKL5-4GS 코딩 서열을 포함하고, 상기 hCDKL5-4GS 코딩 서열은 서열번호 26 또는 서열번호 26과 적어도 약 95% 일치하는 서열인, 벡터.