KR20230117157A

KR20230117157A - 조직 특이적 표적화 모티프를 갖는 신규 조성물 및 이를 포함하는 조성물

Info

Publication number: KR20230117157A
Application number: KR1020237020955A
Authority: KR
Inventors: 제임스 엠. 윌슨; 조슈아 조이너 심즈; 위안 위안
Original assignee: 더 트러스티스 오브 더 유니버시티 오브 펜실베니아
Priority date: 2020-12-01
Filing date: 2021-12-01
Publication date: 2023-08-07
Also published as: IL303236A; EP4256065A2; WO2022119871A2; WO2022119871A3; AU2021390480A9; CN116670152A; US20240024507A1; AU2021390480A1; TW202237850A; AR124216A1; CA3200014A1; JP2023551903A

Abstract

N- x- (T/I/V/A)- (K/R)의 아미노산 서열 (서열번호 47)을 포함하는 적어도 하나의 외인성 펩티드를 갖는 재조합 벡터의 표적 단백질에 결합되거나 삽입된 표적화 펩티드를 포함하는 조성물이 제공된다. 돌연변이 캡시드 또는 막 단백질을 갖는 이러한 접합체, 표적화 펩티드 또는 재조합 벡터를 제공하는 조성물이 이의 용도로 제공된다.

Description

조직 특이적 표적화 모티프를 갖는 신규 조성물 및 이를 포함하는 조성물

아데노-연관 바이러스(AAV)는 현재 선택된 유전자 치료 벡터이다. 이는 AAV가 통합되지 않은 게놈에서 수십 년 동안 안정적으로 발현되는 이식유전자를 전달할 수 있고 AAV가 매우 안전하고 비면역원성이기 때문이다. 그러나 AAV 유전자 요법은 현재 전달 및 향성 문제로 인해 소수의 질병으로 제한된다. 이는 특히 중추신경계(CNS) 장애에 해당된다. AAV 유전자 치료 벡터의 직접 전달은 벡터를 뇌척수액(CSF)에 직접 주입하여 가능하지만, 이 방법은 전형적으로 뇌 세포의 1% 이하를 형질도입한다. 더욱이, 그 형질도입의 대부분은 CSF와 직접 접촉하는 세포에 집중되어 있다. "심부 뇌"의 세포는 거의 형질도입되지 않는다. 이것은 유전자 요법으로 치료할 수 있는 CNS 장애의 수를 제한했다.

CSF 네트워크와 달리 뇌의 혈관계는 CNS의 거의 모든 세포에 도달한다. 이것은 이러한 조직이 포도당, 산소 및 기타 영양소에 대한 수요가 높기 때문이다. 그러나 뇌와 척수의 세포는 특수 혈관 단위인 혈관 뇌 장벽(BBB)에 의해 순환계로부터 보호된다. BBB는 뇌와 척수의 혈관을 둘러싸고 있는 단단히 연결된 세포의 복잡한 네트워크를 통해 바이러스 벡터 및 단백질과 같은 큰 분자, 심지어 많은 작은 분자 약물의 확산을 제한한다. 따라서, CNS에 대한 유전자 치료 전달의 큰 과제는 높은 효율로 BBB를 통과할 수 있는 AAV 변이체의 조작과 심부 뇌의 세포를 형질도입하는 것이었다.

캘리포니아 공과대학(CalTech)에서 개발한 한 AAV 캡시드에는 일부 마우스 계통의 뇌 맥관 구조에 있는 GPI 고정 수용체인 Ly6a와의 상호작용을 매개하는 것으로 보고된 AAV9-PHP.B라는 rAAV를 생성하기 위해 AAV9 캡시드의 초가변 루프 8(HVR8)에 삽입된 7개의 아미노산 펩티드가 있다. 미국 특허 공개 출원 번호 2017/0166926A1. 이 상호 작용은 BBB를 통해 AAV9-PHP.B의 수송을 유도하여 AAV9 보다 ~50배 더 높은 뇌 세포의 전달을 초래한다. 그러나 이 발견은 더 큰 동물이나 인간에게 적용되지 않았다.

선별된 조직 및 세포 유형을 특이적으로 표적화할 수 있는 벡터에 대한 필요성이 여전히 존재한다.

특정 구체예에서, 모티프 N- x- (T/I/V/A)- (K/R) (서열번호 47)을 포함하는 아미노산 서열을 포함하는 캡시드를 갖는 재조합 아데노-연관 바이러스 입자(rAAV)가 제공된다. 적합하게는, 아미노산 서열은 캡시드 내의 적어도 AAV vp3 단백질의 일부 및 캡시드가 NDVRAVS(서열번호 48) 서열을 포함하는 돌연변이 AAV2 캡시드가 아닌 경우, 이의 발현을 지시하는 서열의 제어 하에 유전자 생성물을 인코딩하는 핵산 서열을 포함하는 캡시드 내에 패키징된 벡터 게놈의 일부이다. 특정 구체예에서, 아미노산 서열은 N- x- (T/I/V/A)- (K/R) 모티프는 2개의 아미노산 내지 7개의 아미노산에 의해 모티프의 아미노 말단 및/또는 카르복시 말단에서 선택적으로 측접되어 AAV 캡시드 vp3 영역에 삽입되는 것을 포함하는 것을 포함한다. 특정 구체예에서, 캡시드에 삽입된 서열은 다음을 포함한다: (a) SSNTVKLTSGH (서열번호 40); (b) EFSSNTVKLTS (서열번호 38); (c) GGVLTNIARGEYMRGG (서열번호 46); (d) GGIEINATRAGTNLGG (서열번호 43); (e) GGSSNTVKLTSGHGG (서열번호 39); (f) IEINATRAGTNL(서열번호 42); 또는 (g) SANFIKPTSY (서열번호 41). 특정 구체예에서, 모티프의 아미노산 서열은 NTVK이고, 선택적으로 카르복시- 및/또는 아미노 말단에 2개 내지 7개의 아미노산이 측접되어 있고 아미노산 서열: 서열번호 44의 넘버링에 기초하여 AAV9 캡시드 단백질의 아미노산 588 및 589 사이에 삽입된다.

특정 구체예에서, 캡시드에 NTVK 서열이 삽입된 rAAV로서, 서열은 선택적으로 카르복시- 및/또는 아미노 말단에 2개 내지 7개의 아미노산이 측접되어 있고 아미노산 서열: 서열번호 44의 넘버링에 기초하여 AAV9 캡시드 단백질의 아미노산 588 및 589 사이에 삽입된다.

특정 구체예에서, 조성물은 삽입된 모티프 및 선택적 측접 서열을 갖는 rAAV 및 생리학적으로 적합한 담체, 부형제 및/또는 수성 현탁액 베이스 중 하나 이상을 포함한다.

특정 구체예에서, 내피 세포 표적화 펩티드가 제공되고, 펩티드는 N- x- (T/I/V/A)- (K/R) (서열번호 47)의 아미노산 서열을 포함하고 선택적으로 모티프의 아미노 말단 및/또는 카르복시 말단에 2개의 아미노산 내지 7개의 아미노산이 측접되어 있고, 선택적으로 나노입자, 제2 분자, 또는 바이러스 캡시드 단백질에 추가로 접합된다. 특정 구체예에서, 내피 세포 표적화 펩티드는 다음을 포함한다: (a) SSNTVKLTSGH (서열번호 40); (b) EFSSNTVKLTS (서열번호 38); (c) GGVLTNIARGEYMRGG (서열번호 46); (d) GGIEINATRAGTNLGG (서열번호 43); (e) GGSSNTVKLTSGHGG (서열번호 39); (f) IEINATRAGTNL(서열번호 42); 또는 (g) SANFIKPTSY(서열번호 41). 특정 구체예에서, 모티프의 아미노산 서열은 NTVK이다. 특정 구체예에서, 내피 세포 표적화 펩티드 및 생리학적으로 적합한 담체, 부형제 및/또는 수성 현탁액 베이스 중 하나 이상을 포함하는 조성물이 제공된다.

특정 구체예에서, 뇌 내피 세포 표적화 펩티드 및 적어도 하나의 폴리펩티드 또는 단백질을 포함하는 융합 파트너를 포함하는 융합 폴리펩티드 또는 단백질이 본원에서 제공된다. 특정 구체예에서, 제11항에 따른 융합 폴리펩티드 또는 단백질 및 생리학적으로 적합한 담체, 부형제 및/또는 수성 현탁액 베이스 중 하나 이상을 포함하는 조성물.

치료를 필요로 하는 환자에게 치료제를 전달하기 위한 rAAV, 내피 세포 표적화 펩티드, 융합 폴리펩티드 또는 단백질, 및/또는 본원에 기술된 조성물을 사용하기 위한 조성물 및 방법이 본원에 제공된다. 특정 구체예에서, 치료제는 뇌 내피 세포를 표적으로 한다.

특정 구체예에서, 상기 인코딩된 유전자 산물은 MCT8 단백질인, 본원에 기술된 바와 같은 rAAV를 이를 필요로 하는 대상체에게 전달함으로써 알란-헌돈-더들리병을 치료하기 위한 조성물 및 방법이 제공된다.

특정 구체예에서, 본원에 기술된 rAAV를 이를 필요로 하는 환자에게 투여하는 단계를 포함하는 폐에 대한 표적 요법을 위한 방법이 제공된다.

특정 구체예에서, 표적화 펩티드가 삽입된 캡시드를 갖고 치료 유전자 산물을 인코딩하는 rAAV를 이를 필요로 하는 대상체에게 전달함으로써 폐 질환을 치료하는 방법이 제공되고, 상기 인코딩된 유전자 산물은 가용성 Ace2 단백질, 항-SARS 항체, 항-SARS-CoV2 항체, 항-인플루엔자 항체 또는 낭포성 섬유증 막횡단 단백질이다.

특정 구체예에서, N- x- (T/I/V/A)- (K/R) 모티프를 AAV 캡시드에 삽입하는 단계를 포함하는 시험관 내에서 AAV 생산 세포의 형질도입을 증가시키는 방법이 제공된다. 특정 구체예에서, 생산 세포는 293 세포이다.

본 발명의 이들 및 다른 구체예 및 이점은 본 발명의 상세한 설명을 포함하지만 이에 제한되지 않는 명세서로부터 명백할 것이다.

도 1a 내지 1b는 참조 펩티드와 함께 스크린에서 마우스 뇌에서 최고 수행 펩티드 히트에 대한 농축 점수를 보여준다. 도 1a는 C57BL/6J 마우스에 대한 농축 점수를 보여준다. 도 1b는 Balb/c 마우스에 대한 농축 점수를 보여준다.
도 2a 및 2b는 스크린에서 NHP 조직에서 최고 수행 히트에 대한 농축 점수를 보여준다. 도 2a는 NHP 뇌에 대한 농축 점수를 보여준다. 도 2b는 NHP 척수 조직에 대한 농축 점수를 보여준다.
도 3a 내지 3d는 GFP 리포터 이식유전자를 포함하는 AAV 캡시드에서 최고 수행 펩티드 적중의 형질도입 수준의 2차 검증을 보여준다. 결과는 AAV9 형질도입과 관련하여 플롯된다. 도 3a는 Balb/c 마우스에서 뇌 조직의 선택된 펩티드 표적의 2차 검증 스크린을 보여준다. 도 3b는 C57BL/6 마우스에서 뇌 조직의 선택된 펩티드 표적의 2차 검증 스크린을 보여준다. 도 3c는 Balb/c 마우스에서 간 조직의 선택된 펩티드 표적의 2차 검증 스크린을 보여준다. 도 3d는 C57BL/6 마우스에서 간 조직의 선택된 펩티드 표적의 2차 검증 스크린을 보여준다.
도 4는 AA9, AAV8, AAV7, AAV6, AAV5, AAV4, AAV3B. AAV2, 및 AAV1의 다양한 AAV 캡시드 단백질의 아미노산 서열 정렬 영역을 나타낸 것으로, 표적화 펩티드가 삽입될 수 있는 HVRVIII 영역에 초점이 맞춰져 있다(구조 분석 기준).
도 5는 "NxTK" 모티프가 SAN 삽입체에서 뇌 생체분포를 위한 결정적인 모티프임을 나타내고, 치환의 평균 영향(원래 서열로부터 배수-변화)을 나타낸다.
도 6은 "NxTK" 모티프가 SAN 펩티드 삽입체에서 플라스미드에서 AAV로의 전환을 제어하고 치환의 평균 영향(원래 배수 변화)을 보여준다는 것을 보여준다.
도 7a 내지 7d는 "NxTK" 모티프가 세포주에 걸쳐 광범위한 형질도입 이점을 부여함을 보여준다. 도 7a는 293 세포에서 AAV9 캡시드와 비교할 때 상대적 형질도입 수준을 보여준다. 도 7b는 NIH3T3 세포에서 AAV9 캡시드와 비교할 때 상대적 형질도입 수준을 보여준다. 도 7c는 HUH7 세포에서 AAV9 캡시드와 비교할 때 상대적 형질도입 수준을 보여준다. 도 7d는 마카크 1차 기도 세포에서 형질도입 후 3일(3DPT) 및 형질도입 후 7일(7DPT)에서의 형질도입 수준을 보여준다. 도 7e는 담체(즉, 벡터 없음)로 처리된 대조군 샘플에서 마카크 원발성 기도 상피 세포의 현미경 분석을 보여준다. 도 7f는 AAV9-GFP 벡터로 형질도입 후 마카크 원발성 기도 상피 세포의 현미경 분석을 나타낸다. 도 7g는 EFS 펩티드 삽입물을 포함하는 AAV9-GFP 벡터로 형질도입 후 마카크 1차 기도 상피 세포의 현미경 분석을 나타낸다. 도 7h는 SAN 펩티드 삽입물을 포함하는 AAV9-GFP로 형질도입 후 마카크 1차 기도 상피 세포의 현미경 분석을 보여준다.
도 8은 마이크로그램 총 mRNA에 대한 mRNA 카피 수의 비율로서 플로팅된 배양된 인간 세포(비강, 기관지 및 기관)에서 GFP 벡터를 사용한 예비 형질도입 시험을 보여준다.

표적화 펩티드 서열이 본원에서 제공된다. N- x- (T/I/V/A)- (K/R)(서열번호 47)의 외인성 표적화 펩티드 모티프에 작동 가능하게 연결된 융합 단백질, 변형된 단백질, 돌연변이 바이러스 캡시드 및 기타 모이어티도 본원에서 제공된다. 특정 구체예에서, 이 외인성 모티프는 소스(모) 단백질, 바이러스 벡터 또는 다른 모이어티의 천연 조직 특이성을 변형시키는 이들 조성물에 부여한다. 특정 구체예에서, 이 모티프의 표적화 펩티드는 강화되거나 변경된 내피 세포 표적화를 제공한다. 특정 구체예에서, 이 모티프의 표적화 펩티드는 향상되거나 변경된 폐, 기관지, 기관 및/또는 비상피 표적화를 제공한다. 특정 구체예에서, 이 모티프를 갖는 변형된 캡시드를 갖는 바이러스 벡터는 시험관내에서 AAV 생산 세포의 증가된 형질도입을 나타낸다.

표적화 펩티드는 융합 단백질 또는 접합체를 형성하기 위해 원하는 조직(예를 들어, CNS 또는 폐)을 표적화하기 위해 재조합 단백질(예를 들어, 효소 대체 요법용) 또는 폴리펩티드(예를 들어, 면역글로불린)에 연결될 수 있다. 추가적으로, 표적화 펩티드는 원하는 조직을 표적화하기 위해 펩티드-코팅된 리포좀 및/또는 LNP를 형성하는 리포좀 및/또는 나노입자(지질 나노입자, LNP)에 연결될 수 있다. 적어도 하나의 표적화 펩티드 카피를 인코딩하는 서열 및 선택적 연결 서열은 재조합 단백질에 대한 인코딩 서열과 프레임 내에서 융합될 수 있고 융합 단백질 또는 접합체를 제공하기 위해 단백질 또는 폴리펩티드와 공동-발현될 수 있다. 또는 다른 합성 방법을 사용하여 단백질, 폴리펩티드 또는 다른 부분(예를 들어 DNA, RNA 또는 소분자)과 접합체를 형성할 수 있다. 특정 구체예에서, 표적화 펩티드의 다중 카피가 융합 단백질/접합체에 존재한다. 표적화 펩티드를 재조합 단백질에 접합시키기에 적합한 방법은 제1 가교제를 사용하여 재조합 인간 단백질(예를 들어, 효소) 상의 아미노 (N)-말단 및 하나 이상의 잔기를 변형시켜 제1 가교제 변형된 재조합 인간 단백질을 발생시키는 단계, 제2 가교제를 사용하여 표적화 펩티드 앞의 짧은 연장 링커 영역의 아미노 (N)-말단을 변형시켜 제2 가교제 변형된 변이체 표적 펩티드를 발생시키는 단계, 및 이어서 짧은 연장 링커를 함유하는 제2 가교제 변형된 변이체 표적화 펩티드에 제1 가교제 변형된 재조합 인간 단백질을 접합시키는 단계를 포함한다. 표적화 펩티드를 재조합 단백질에 접합시키는 다른 적합한 방법은 제1 가교제 변형된 재조합 인간 단백질을 하나 이상의 제2 가교제 변형된 변이체 표적화 펩티드에 접합시키는 단계, 상기 제1 가교제 변형된 재조합 단백질은 화학적으로 변형된 N-말단을 갖는 것을 특징으로 하는 재조합 단백질을 포함하고, 하나 이상의 변형된 라이신 잔기 및 하나 이상의 제2 가교제 변형된 변이체 표적화 펩티드는 표적화 펩티드 앞의 짧은 연장 링커의 변형된 N-말단 아미노산을 포함하는 하나 이상의 변이체 표적화 펩티드를 포함한다. 표적화 펩티드를 단백질, 폴리펩티드, 나노입자 또는 다른 생물학적으로 유용한 화학적 모이어티에 접합시키기 위한 또 다른 적합한 방법이 선택될 수 있다. 예를 들어, 미국 특허 번호 US 9,545,450 B2(NHS-포스핀 가교제; NHS-아지드 가교제); 미국 공개 특허 출원 번호 US 2018/0185503 A1(알데히드-히드라지드 가교결합)을 참조한다.

특정 구체예에서, 표적화 펩티드는 단백질 또는 폴리펩티드(예를 들어, 바이러스 캡시드 단백질) 내의 적합한 부위에 삽입될 수 있다. 특정 이들 구체예 및 특정 다른 구체예에서, 표적화 펩티드는 짧은 연장 링커에 의해 그의 카르복시(COO-) 및/또는 아미노(N) 말단에서 측접할 수 있다. 이러한 링커는 길이가 1 내지 20개 아미노산 잔기, 또는 약 2 내지 20개 아미노산 잔기, 또는 약 1 내지 15개 아미노산 잔기, 또는 약 2 내지 12개 아미노산 잔기, 또는 2 내지 7개 아미노산 잔기 길이일 수 있다. 짧은 연장 링커는 길이가 약 10개 아미노산일 수도 있다. N-말단 링커의 존재 및 길이는 카르복시-말단 링커로부터 독립적으로 선택되고, 카르복시 말단 링커의 존재 및 길이는 N-말단 링커로부터 독립적으로 선택된다. 적합한 짧은 연장 링커는 5-아미노산 유연한 GS 연장 링커(글리신-글리신-글리신-글리신-세린), 2개의 유연한 GS 링커를 포함하는 10-아미노산 확장 링커, 3개의 유연한 GS 링커를 포함하는 15-아미노산 확장 링커, 4개의 유연한 GS 링커를 포함하는 20-아미노산 확장 링커, 또는 이들의 임의의 조합을 사용하여 제공될 수 있다.

특정 구체예에서, 내피 세포를 표적화하는데 유용한 조성물이 제공된다. 조성물은 다음을 포함하는 적어도 하나의 외인성 표적화 펩티드를 포함하는 돌연변이 캡시드, 융합 단백질 또는 또 다른 접합체이다: N- x- (T/I/V/A)- (K/R) (서열번호 47)의 아미노산 서열 선택적으로 모티프의 아미노 말단 및/또는 카르복시 말단에 2개의 아미노산 내지 7개의 아미노산이 측접되어 있고, 선택적으로 나노입자, 제2 분자, 또는 바이러스 캡시드 단백질에 추가로 접합된다. 표적화 펩티드는 선택적인 연결서열과 함께 다음 서열을 포함한다:

(a) SSNTVKLTSGH (서열번호 40);

(b) EFSSNTVKLTS (서열번호 38);

(c) GGVLTNIARGEYMRGG (서열번호 46);

(d) GGIEINATRAGTNLGG (서열번호 43);

(e) GGSSNTVKLTSGHGG (서열번호 39);

(f) IEINATRAGTNL(서열번호 42); 또는

(g) SANFIKPTSY(서열번호 41).

특정 구체예에서, 표적화 펩티드 모티프는 다음으로부터 선택된 핵산 서열에 의해 인코딩된다:

(a)　agcagcaacaccgtgaagctgaccagcggacac (서열번호 54);　

(b) gagttcagcagcaacaccgtgaagctgaccagc (서열번호 50);　

(c)　ggaggagtgctgaccaacatcgctagaggagagtacatgagaggagga (서열번호　56);　

(d)　ggaggaatcgagatcaacgctaccagagctggaaccaacctgggagga (서열번호 52);　

(e) ggaggaagcagcaacaccgtgaagctgaccagcggacacggagga　(서열번호 55);　

(f) atcgagatcaacgctaccagagctggaaccaacctg (서열번호 51); 또는

(g) agcgctaacttcatcaagcctaccagctac (서열번호 53).

특정 구체예에서, 표적화 펩티드는 서열번호 50의 핵산 서열 또는 이와 적어도 약 70% 동일한 서열에 의해 인코딩된다. 특정 구체예에서, 표적화 펩티드는 서열번호 51의 핵산 서열, 또는 이와 적어도 약 70% 동일한 서열에 의해 인코딩된다. 특정 구체예에서, 표적화 펩티드는 서열번호 52의 핵산 서열, 또는 이와 적어도 약 70% 동일한 서열에 의해 인코딩된다. 특정 구체예에서, 표적화 펩티드는 서열번호 53의 핵산 서열, 또는 이와 적어도 약 70% 동일한 서열에 의해 인코딩된다. 특정 구체예에서, 표적화 펩티드는 서열번호 54의 핵산 서열, 또는 이와 적어도 약 70% 동일한 서열에 의해 인코딩된다. 특정 구체예에서, 표적화 펩티드는 서열번호 55의 핵산 서열, 또는 이와 적어도 약 70% 동일한 서열에 의해 인코딩된다. 특정 구체예에서, 표적화 펩티드는 서열번호 56의 핵산 서열, 또는 이와 적어도 약 70% 동일한 서열에 의해 인코딩된다. 일부 구체예에서, 표적화 펩티드 모티프를 인코딩하는 핵산 서열은 연장 링커의 6개 내지 21개 뉴클레오티드에 의해 모티프의 핵산 서열의 5' 및/또는 3' 말단에서 선택적으로 측접되어 있다.

특정 구체예에서, 표적화 펩티드 NTVK. 특정 구체예에서, 표적화 펩티드 NTVR. 특정 구체예에서, 이 모티프 내의 표적화 펩티드의 하나 이상의 카피가 접합체 또는 변형된 단백질(예를 들어, 파보바이러스 캡시드)로 제공된다. 특정 구체예에서, 2개 이상의 상이한 표적화 펩티드가 존재한다

특정 구체예에서, 비-상피 및/또는 폐 상피 세포를 표적화하는데 유용한 조성물이 제공된다. 조성물은 N-x- 선택적으로 아미노 말단 및/또는 모티프의 카르복시 말단에 2개의 아미노산 내지 7개의 아미노산이 측접되어 있고, 선택적으로 추가로 나노입자, 제2 분자 또는 바이러스 캡시드 단백질에 측접되어 있는 (T/I/V/A)-(K/R)의 아미노산 서열(서열번호 47)을 포함하는 적어도 하나의 외인성 표적화 펩티드를 포함하는 돌연변이 캡시드, 융합 단백질 또는 또 다른 접합체이다. 표적화 펩티드는 (a) SSNTVKLTSGH(서열번호 40); (b) EFSSNTVKLTS(서열번호 38); (c) GGVLTNIARGEYMRGG(서열번호 46); (d) GGIEINATRAGTNLGG(서열번호 43); (e) GGSSNTVKLTSGHGG(서열번호 39); (f) IEINATRAGTNL(서열번호 42); 또는 (g) SANFIKPTSY(서열번호 41)를 포함한다.

특정 구체예에서, 표적화 펩티드 NTVK. 특정 구체예에서, 표적 펩티드 NTVR은 선택적으로 본원에 기재된 바와 같은 스페이서 아미노산에 측접되어 있다. 특정 구체예에서, 이 모티프 내의 표적화 펩티드의 하나 이상의 카피가 접합체 또는 변형된 단백질(예를 들어, 파보바이러스 캡시드)로 제공된다. 특정 구체예에서, 2개 이상의 상이한 표적화 펩티드가 존재한다.

효소, 면역글로불린, 치료 단백질, 면역원성 폴리펩티드, 나노입자, DNA, RNA, 및 표적화를 위한 기타 모이어티(예를 들어, 소분자 등)를 포함하는 적합한 단백질의 예는 하기에 보다 상세히 기술된다. 이들 및 다른 생물학적 및 화학적 모이어티는 본원에 제공된 표적화 펩티드와 함께 사용하기에 적합하다.

특정 구체예에서, 조성물은 핵산 서열 분자이고, 상기 핵산 서열은 DNA 분자 또는 RNA 분자, 예를 들어 네이키드 DNA, 네이키드 플라스미드 DNA, 메신저 RNA(mRNA)이며, 핵산 분자에 연결된 표적화 펩티드 서열 모티프를 함유한다. 일부 구체예에서, 핵산 분자는 예를 들어 미셀, 리포솜, 양이온성 지질-핵산 조성물, 폴리-글리칸 조성물 및 기타 중합체, 지질 및/또는 콜레스테롤-기반 핵산 접합체, 및 본원에 기술된 것과 같은 다른 작제물을 포함하는 다양한 조성물 및 나노 입자와 추가로 커플링된다. 예를 들어, WO2014/089486, US 2018/0353616A1, US2013/0037977A1, WO2015/074085A1, US9670152B2, 및 US 8,853,377B2, X. Su 등, Mol. Pharmaceutics, 2011, 8 (3), pp 774-787; 웹 간행물: 2011년 3월 21일; WO2013/182683, WO 2010/053572 및 WO 2012/170930을 참조하며, 이들 모두는 본 명세서에 참조로 포함된다. 특정 구체예에서, 표적화 펩티드 모티프는 나노입자 표면에 화학적으로 연결되며, 상기 나노입자는 핵산 분자를 캡슐화한다. 일부 구체예에서 표면에 연결된 표적화 펩티드를 포함하는 나노입자는 표적화된 조직 특이적 전달을 위해 설계된다. 일부 구체예에서 2개 이상의 상이한 표적화 펩티드가 나노입자의 표면에 연결된다. 적합한 화학적 연결 또는 가교는 당업자에게 공지된 것을 포함한다.

캡시드

특정 구체예에서, N- x- (T/I/V/A)- (K/R) 표적화 모티프로부터 적어도 외인성 펩티드를 갖는 변형된 파보바이러스 캡시드를 갖는 재조합 파보바이러스가 제공된다. 이러한 재조합 파보바이러스는 하이브리드 보카바이러스/AAV 또는 재조합 AAV 벡터일 수 있다. 다른 구체예에서, 모 벡터와 비교하여 바이러스 벡터의 표적 특이성을 조절 및/또는 변경하기 위해 노출된 캡시드 단백질에서 N- x- (T/I/V/A)- (K/R) 모티프(동일하거나 상이하거나 이들의 조합일 수 있음)로부터의 하나 이상의 외인성 표적화 펩티드를 갖는 다른 바이러스 벡터가 생성될 수 있다.

표적화 펩티드는 임의의 적합한 위치에서 초가변 루프(HVR) VIII에 삽입될 수 있다. 예를 들어, AAV9 캡시드의 넘버링에 기초하여 펩티드는 AAV9 VP1 아미노산 서열의 넘버링에 기초하여 AAV9 캡시드 단백질의 아미노산 588과 589(Q-A) 사이에 다양한 길이의 링커와 함께 삽입된다: 서열번호 44. 또한, AAV9에 대한 탈아미드화 패턴을 제공하는 표 G를 포함하여 2019년 9월 6일에 공개된 WO 2019/168961 및 2018년 9월 7일에 출원된 WO 2020/160582를 참조한다. 아미노산 잔기 위치는 AAVhu68(SEQ ID NO: 45)에서 동일하다. 그러나 HVRVIII 내에서 다른 위치를 선택할 수 있다. 대안적으로, 다른 노출된 루프 HVR(예를 들어, HVRIV)이 삽입을 위해 선택될 수 있다. 비교 가능한 HVR 영역은 다른 캡시드에서 선택될 수 있다. 특정 구체예에서, HVRVIII 및 HVRIV에 대한 위치는 본원에 그 전체 내용이 참조로 포함된 미국 특허 번호 US 9,737,618 B2(컬럼 15, 행 3-23), 및 미국 특허 번호 US 10,308,958 B2(컬럼 15, 행 46 - 컬럼 16, 행 6)에 기술된 바와 같은 알고리즘 및/또는 정렬 기술을 사용하여 결정된다. 특정 구체예에서, AAV1 캡시드 단백질은 모 캡시드로서 선택되며, 상기 다양한 길이의 링커를 갖는 표적화 펩티드는 vp1 넘버링에 기초한 아미노산 582 내지 585의 HVRVIII 영역, 또는 아미노산 456 내지 459의 HVRIV 영역의 적합한 위치에 삽입된다(Gurda, BL., 등, Capsid Antibodies to Different Adeno-Associated Virus Serotypes Bind Common Regions, 2012, Journal of Virology, 2013년 6월 12일, 87(16): 9111-91114). 특정 구체예에서, AAV8은 모 캡시드로서 선택되며, 상기 다양한 길이의 링커를 갖는 표적화 펩티드는 VP1 넘버링에 기초한 아미노산 586 내지 591(예를 들어, 590-591(N-T))의 HVRVIII 영역, 또는 아미노산 456 내지 460의 HVRIV 영역의 적합한 위치에 삽입된다(Gurda, BL., 등, Mapping a Neutralizing epitope onto the Capsid of Adeno-Associated Virus Serotype 8, 2012, Journal of Virology, 2012년 5월 16일, 86(15):7739-7751). 특정 구체예에서, AAV7은 모 캡시드로서 선택되고, 상기 다양한 길이의 링커를 갖는 표적화 펩티드는 아미노산 589 내지 590(N-T)의 적합한 위치에 삽입된다. 특정 구체예에서, AAV6은 모 캡시드로서 선택되며, 상기 다양한 길이의 링커를 갖는 표적화 펩티드는 아미노산 588 내지 589(S-T)의 적합한 위치에 삽입된다. 특정 구체예에서, AAV5는 모 캡시드로서 선택되며, 상기 다양한 길이의 링커를 갖는 표적화 펩티드는 아미노산 577 내지 578(T-T)의 적합한 위치에 삽입된다. 특정 구체예에서, AAV4는 모 캡시드로서 선택되며, 상기 다양한 길이의 링커를 갖는 표적화 펩티드는 아미노산 586 내지 587(S-N)의 적합한 위치에 삽입된다. 특정 구체예에서, AAV3B는 모 캡시드로서 선택되고, 상기 다양한 길이의 링커를 갖는 표적화 펩티드는 아미노산 588 내지 589(N-T)의 적합한 위치에 삽입된다. 특정 구체예에서, AAV2는 모 캡시드로서 선택되며, 상기 다양한 길이의 링커를 갖는 표적화 펩티드는 아미노산 587 내지 588(N-R)의 적합한 위치에 삽입된다. 특정 구체예에서, AAV1은 모 캡시드로서 선택되며, 상기 다양한 길이의 링커를 갖는 표적화 펩티드는 아미노산 589 내지 589(S-T)의 적합한 위치에 삽입된다. 또한, 도 4를 참조한다.

특정 구체예에서, 선택적 측접 서열과 함께 N- x- (T/I/V/A)- (K/R) 모티프를 함유하도록 변형된 모 캡시드는 발현을 향상 및/또는 그렇지 않으면 CNS 표적 세포의 유형을 조절하기 위해 CNS (예를 들어, 클레이드 F AAV(예를 들어, AAVhu68 또는 AAV9), 클레이드 E(예를 들어, AAV8) 또는 특정 클레이드 A AAV(예를 들어, AAV1, AAVrh91)) 캡시드 또는 비-파보바이러스 캡시드(예를 들어, 단순 헤르페스 바이러스 등)를 천연적으로 표적화하는 파보바이러스로부터 선택된다. 다른 실시형태에서, 캡시드는 CNS(예를 들어, 클레이드 F AAV, 예를 들어, AAVhu68 또는 AAV9, 또는 특정 클레이드 A AAV, 예를 들어, AAV1, AAVrh91) 캡시드, 또는 비파보바이러스 캡시드(예를 들어, 단순 포진 바이러스(HSV) 등)를 천연적으로 표적화하지 않는 파보바이러스로부터 선택된다. 예를 들어, WO 2020/223231, 2020년 11월 5일 공개(rh91, 탈아미드화 패턴이 있는 표 포함), 2020년 8월 14일에 제출된 미국 가출원 번호 63/065,616 및 2020년 11월 4일에 제출된 미국 가출원 번호 63/109734를 참조한다. 특정 구체예에서, 캡시드는 AAV 클레이드 F AAVhu95 및 AAVhu96 캡시드로부터 선택된다. 예를 들어, 2201년 10월 2일에 출원된 미국 가출원 번호 63/251,599를 참조한다.

특정 구체예에서, N- x- (T/I/V/A)- (K/R) 모티프를 함유하도록 변형된 모 캡시드는 모 AAV(예를 들어, 클레이드 A AAV, 예를 들어, AAV1, AAVrh32.33, AAV6.2, AAV6, AAVrh91), 또는 AAV5, 또는 특정 클레이드 F AAV, 예를 들어, AAVhu68 또는 AAV9, 캡시드 또는 비파보바이러스 캡시드(예를 들어 아데노바이러스, HSV, RSV) 등과 비교하여 표적화를 향상시키기 위해 비강 상피 세포, 비인두 세포 및/또는 폐 세포를 기본적으로 표적으로 하는 바이러스(예를 들어, AAV)로부터 선택된다. 예를 들어, WO 2020/223231, 2020년 11월 5일 공개(rh91, 탈아미드화 패턴이 있는 표 포함), 2020년 8월 14일에 출원된 미국 임시 특허 출원 번호 63/065,616 및 2020년 11월 4일에 출원된 미국 가출원 번호 63/109734를 참조한다.

특정 구체예에서, AAV 캡시드는 NDVRAVS(서열번호 48) 서열을 포함하는 돌연변이 AAV2 캡시드가 아니다.

예를 들어, AAVhu68 또는 AAV9와 같은 Clade F AAV의 캡시드가 선택될 수 있다. AAV9 캡시드 또는 AAVhu68 캡시드, 및/또는 AAV9로부터 유도된 키메라 캡시드를 갖는 벡터를 생성하는 방법이 기술되었다. 예를 들어, 본원에 참조로 포함된 US 7,906,111을 참조한다. 비강 세포 또는 다른 적합한 표적(예를 들어, 근육 또는 폐)을 형질도입하는 다른 AAV 혈청형은 예를 들어 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV6.2, AAV7, AAV8, AAV9, rh10, AAVrh64R1, AAVrh64R2, rh8, AAVrh32.33을 포함하는 AAV 바이러스 벡터의 캡시드에 대한 소스로서 선택될 수 있다(예를 들어, 미국 공개 특허 출원 번호 2007-0036760-A1; 미국 공개 특허 출원 번호 2009-0197338-A1; 및 EP 1310571 참조한다). 또한, WO 2003/042397(AAV7 및 기타 유인원 AAV), 미국 특허 7790449 및 미국 특허 7282199(AAV8), WO 2005/033321(AAV9), 및 WO 2006/110689, 또는 아직 발견되지 않은, 또는 이에 기초한 재조합 AAV는 AAV 캡시드에 대한 공급원으로 사용될 수 있음을 참조한다. 예를 들어 WO 2020/223232 A1(AAV rh90), WO 2020/223231 A1 및 2021년 8월 13일에 출원된 국제 출원 번호 PCT/US21/45945(AAV rh91), 및 WO 2020/223236 A1(AAV rh92, AAV rh93, AAV rh9193)을 참조하며, 이는 그 전체가 참조로 본 명세서에 포함된다. 이들 문서는 또한 AAV를 생성하기 위해 선택될 수 있는 다른 AAV를 기술하고 참조에 의해 통합된다. 일부 구체예에서, 바이러스 벡터에 사용하기 위한 AAV 캡시드(cap)는 전술한 AAV 캡 중 하나 또는 이의 인코딩 핵산의 돌연변이 유발에 의해(즉, 삽입, 결실 또는 치환에 의해) 생성될 수 있다. 일부 구체예에서, AAV 캡시드는 전술한 AAV 캡시드 단백질 중 2개 또는 3개 또는 4개 이상으로부터의 도메인을 포함하는 키메라이다. 일부 구체예에서, AAV 캡시드는 2개 또는 3개의 상이한 AAV 또는 재조합 AAV로부터의 Vp1, Vp2 및 Vp3 단량체의 모자이크이다. 일부 구체예에서, rAAV 조성물은 전술한 캡 중 하나 이상을 포함한다.

본원에서 사용되는 용어 "클레이드"는 최소 75%의 부트스트랩 값(최소 1000회 복제 중)으로 이웃 결합 알고리즘을 사용하여 결정된 대로 서로 계통발생학적으로 관련있는 AAV 그룹과 관련하여 AAV vp1 아미노산 서열의 정렬에 기초하여 AAV 그룹 및 0.05 이하의 포아송 보정 거리 측정치를 지칭한다. 이웃 결합 알고리즘은 문헌에 설명되어 있다. 예를 들어, M. Nei 및 S. Kumar, Molecular Evolution and Phylogenetics(Oxford University Press, New York(2000))를 참조한다. 이 알고리즘을 구현하는 데 사용할 수 있는 컴퓨터 프로그램이 있다. 예를 들어, MEGA v2.1 프로그램은 수정된 Nei-Gojobori 방법을 구현한다. 이들 기술 및 컴퓨터 프로그램, 및 AAV vp1 캡시드 단백질의 서열을 사용하여, 당업자는 선택된 AAV가 본원에서 확인된 클레이드 중 하나에 포함되는지, 또 다른 클레이드에 포함되는지 또는 이러한 클레이드 외부에 있는지를 쉽게 결정할 수 있다. 예를 들어, 클레이드 A, B, C, D, E 및 F를 식별하고 신규 AAV, GenBank 접근 번호 AY530553 내지 AY530629의 핵산 서열을 제공하는 G Gao, 등, J Virol, 2004 Jun; 78(12): 6381-6388을 참조한다. 또한 WO 2005/033321을 참조한다.

본원에서 사용되는 바와 같이, "AAV9 캡시드"는 다수의 AAV9 vp 단백질로 구성된 자가 조립된 AAV 캡시드이다. AAV9 vp 단백질은 전형적으로 GenBank accession: AAS99264의 vp1 아미노산 서열을 인코딩하는 핵산 서열에 의해 인코딩된 대체 스플라이스 변이체로서 발현된다. 이러한 스플라이스 변형으로 인해 길이가 다른 단백질이 생성된다. 특정 구체예에서, "AAV9 캡시드"는 AAS99264와 99% 동일하거나 이에 대해 99% 동일한 아미노산 서열을 갖는 AAV를 포함한다. 또한, AAV9에 대한 탈아미드화 패턴을 제공하는 표 G를 포함하여 2019년 9월 6일에 공개된 WO 2019/168961을 참조한다. US7906111 및 WO 2005/033321 참조. 본원에 사용된 "AAV9 변이체"는 예를 들어 WO2016/049230, US 8,927,514, US 2015/0344911 및 US 8,734,809에 기재된 것을 포함한다.

rAAVhu68은 AAVhu68 캡시드와 벡터 게놈으로 구성된다. AAVhu68 캡시드는 vp1의 이종 집단, vp2의 이종 집단 및 vp3 단백질의 이종 집단의 집합체이다. vp 캡시드 단백질을 지칭하기 위해 본원에서 사용되는 용어 "이종" 또는 그의 임의의 문법적 변형은 동일하지 않은 요소, 예를 들어 상이한 변형된 아미노산 서열을 갖는 vp1, vp2 또는 vp3 단량체(단백질)를 갖는 구성된 집단을 지칭한다. 또한, PCT/US2018/019992, WO 2018/160582, 제목 "Adeno-Associated Virus (AAV) Clade F Vector and Uses Therefor"를 참조한다.

다른 재조합 바이러스 벡터의 경우, 표적 특이성을 담당하는 바이러스 캡시드 또는 외피 단백질의 적합한 노출 부분이 표적 펩티드의 삽입을 위해 선택된다. 예를 들어, 아데노바이러스에서 헥손 단백질을 변형하는 것이 바람직할 수 있다. 렌티바이러스에서, 막 융합 단백질은 표적 모티프의 하나 이상의 카피를 포함하는 변형될 수 있다. 백시니아 바이러스의 경우, 표적 모티프의 하나 이상의 카피를 포함하도록 주요 당단백질이 변형될 수 있다. 적합하게는, 이러한 재조합 바이러스 벡터는 안전 목적을 위해 복제 결함이 있다.

발현 카세트 및 벡터

AAV 캡시드에 패키징되어 숙주 세포로 전달되는 벡터 게놈 서열은 전형적으로 최소한, 이식유전자 및 이의 조절 서열 및 AAV 역위 말단 반복부(ITR)로 구성된다. 단일 가닥 AAV 및 자체 보완(sc) AAV 둘 모두는 rAAV에 포함된다. 이식유전자는 폴리펩티드, 단백질, 기능적 RNA 분자(예를 들어, miRNA, miRNA 억제제) 또는 기타 관심 유전자 산물을 인코딩하는 벡터 서열과 이종인 핵산 코딩 서열이다. 핵산 코딩 서열은 표적 조직의 세포에서 이식유전자 전사, 번역 및/또는 발현을 허용하는 방식으로 조절 구성요소에 작동가능하게 연결된다.

벡터의 AAV 서열은 전형적으로 cis-작용 5' 및 3' 역 말단 반복(ITR) 서열을를 포함한다(예를 들어, B. J. Carter, in "Handbook of Parvoviruses", ed., P. Tijsser, CRC Press, pp. 155 168 (1990)을 참조한다). ITR 서열은 길이가 약 145 염기쌍(bp)이다. 바람직하게는, 실질적으로 ITR을 인코딩하는 전체 서열이 분자에 사용되지만, 이들 서열의 약간의 변형이 어느 정도 허용된다. 이러한 ITR 서열을 수정하는 능력은 당업계의 기술 범위 내에 있다. (예를 들어, Sambrook 등, "Molecular Cloning. A Laboratory Manual" 2d ed., Cold Spring Harbor Laboratory, New York (1989); 및 K. Fisher 등, J. Virol., 70:520 532 (1996)와 같은 텍스트를 참조한다). 본 발명에서 사용되는 이러한 분자의 예는 선택된 이식유전자 서열 및 연관된 조절 구성요소가 5' 및 3' AAV ITR 서열에 측접한 이식유전자를 함유하는 "cis-작용" 플라스미드이다. 일 구체예에서, ITR은 캡시드를 공급하는 것과 상이한 AAV로부터 유래한다. 일 구체예에서, ITR 서열은 AAV2로부터의 것이다. ΔITR이라고 하는 5' ITR의 단축 버전은 D-서열과와 터미널 해상도 사이트(trs)가 삭제된 것으로 설명되었다. 특정 구체예에서, (예를 들어, 플라스미드의) 벡터 게놈은 130개 염기쌍의 단축된 AAV2 ITR을 포함하고, 여기서 외부 A 요소는 결실된다. 단축된 ITR은 내부 A 요소를 주형으로 사용하고 캡시드로 패키징하여 바이러스 입자를 형성하는 벡터 DNA 증폭 동안 145개 염기쌍의 야생형 길이로 되돌아갈 수 있다. 다른 구체예에서, 전장 AAV 5' 및 3' ITR이 사용된다. 그러나 다른 AAV 소스의 ITR을 선택할 수 있다. ITR의 소스가 AAV2에 있고 AAV 캡시드가 다른 AAV 소스에 있는 경우 결과 벡터는 유사형이라고 할 수 있다. 그러나 이러한 요소의 다른 구성이 적합할 수 있다.

재조합 AAV 벡터에 대해 위에서 확인된 주요 요소에 더하여, 벡터는 또한 플라스미드 벡터로 형질감염되거나 본 발명에 의해 생성된 바이러스로 감염된 세포에서 그의 전사, 번역 및/또는 발현을 허용하는 방식으로 이식유전자에 작동가능하게 연결된 필수적인 통상적인 제어 요소를 포함한다. 본원에서 사용되는 바와 같이, "작동가능하게 연결된" 서열은 관심 유전자와 인접하는 발현 제어 서열 및 관심 유전자를 제어하기 위해 트랜스로 또는 일정 거리에서 작용하는 발현 제어 서열 모두를 포함한다.

조절 제어 요소는 전형적으로 예를 들어 선택된 5' ITR 서열과 코딩 서열 사이에 위치한 발현 제어 서열의 일부로서 프로모터 서열을 함유한다. 구성적 프로모터, 조절 가능한 프로모터[예를 들어, WO 2011/126808 및 WO 2013/04943을 참조한다], 조직 특이적 프로모터 또는 생리학적 신호에 반응하는 프로모터가 본원에 기재된 벡터에서 사용될 수 있다.

치료제의 발현 조절에 적합한 구성적 프로모터의 예는 닭 β-액틴(CB) 프로모터, CB7 프로모터, 인간 사이토메갈로바이러스(CMV) 프로모터, 유비퀴틴 C 프로모터(UbC), 유인원 바이러스 40(SV40)의 초기 및 후기 프로모터, U6 프로모터, 메탈로티오네인 프로모터, EFlα 프로모터, 유비퀴틴 프로모터, 하이포크산틴 포스포리보실 전이효소(HPRT) 프로모터, 디히드로폴레이트 환원효소(DHFR) 프로모터 (Scharfmann 등, Proc. Natl. Acad. Sci. USA 88:4626-4630 (1991), 아데노신 데아미나제 프로모터, 포스포글리세롤 키나제(PGK) 프로모터, 피루베이트 키나제 프로모터 포스포글리세롤 뮤타제 프로모터, β-액틴 프로모터 (Lai 등, Proc. Natl. Acad. Sci. USA 86: 10006-10010 (1989)), 몰로니 백혈병 바이러스 및 기타 레트로바이러스의 긴 말단 반복부(LTR), 단순 헤르페스 바이러스의 티미딘 키나제 프로모터 및 당업자에게 공지된 다른 구성적 프로모터를 포함하나 이에 제한되지 않는다. 본 발명에 사용하기에 적합한 조직- 또는 세포-특이적 프로모터의 예는 내피 세포에 특이적인 엔도텔린-I(ET-I) 및 Flt-I, FoxJ1을 포함하지만 이에 제한되지 않는다(섬모 세포를 표적으로 함). 본 발명에 사용하기에 적합한 조직 특이적 프로모터의 다른 예는 간 특이적 프로모터를 포함하나 이에 제한되지 않는다. 간-특이적 프로모터의 예는 예를 들어 갑상선 호르몬-결합 글로불린(TBG), 알부민, Miyatake 등, (1997) J. Virol., 71:5124 32; B형 간염 바이러스 코어 프로모터, Sandig 등, (1996) Gene Ther., 3:1002 9; 또는 인간 알파 1-항트립신, 포스포에놀피루베이트 카르복시키나제(PECK) 또는 알파 태아단백질(AFP), Arbuthnot 등, (1996) Hum. Gene Ther., 7:1503 14)을 포함할 수 있다. 바람직하게는, 이러한 프로모터는 인간 기원이다.

치료제의 발현 조절에 적합한 유도성 프로모터는 외인성 제제(예를 들어, 약리학적 제제) 또는 생리학적 신호에 반응하는 프로모터를 포함한다. 이러한 반응 요소에는 HIF-Iα 및 β에 결합하는 저산소증 반응 요소(HRE), Mayo 등 (1982, Cell 29:99-108); Brinster 등 (1982, Nature 296:39-42) 및 Searle 등 (1985, Mol. Cell. Biol. 5:1480-1489); 또는 Nouer 등에 의해 기술된 것과 같은 열충격 반응 요소 (in: Heat Shock Response, ed. Nouer, L., CRC, Boca Raton, Fla., ppI67-220, 1991)에 의해 기술된 금속 이온 반응 요소가 포함되지만 이에 제한되지 않는다.

일 구체예에서, 유전자 산물의 발현은 유전자 산물, 예를 들어, 약리학적 제제, 또는 약리학적 제제에 의해 활성화된 전사 인자를 인코딩하는 서열의 전사에 대한 엄격한 제어를 제공하거나, 대안적 구체예에서는 생리학적 신호를 제공하는 조절가능한 프로모터에 의해 제어된다. 새지 않고 엄격하게 제어할 수 있는 프로모터 시스템이 선호된다.

본 발명에서 사용될 수 있는 리간드-의존성 전사 인자 복합체인 조절 가능한 프로모터의 예는 이의 각각의 리간드에 의해 활성화되는 핵 수용체 슈퍼패밀리의 구성원(예를 들어, 글루코코르티코이드, 에스트로겐, 프로게스틴, 레티노이드, 엑디손, 및 이들의 유사체 및 모방체) 및 테트라사이클린에 의해 활성화되는 rTTA를 포함하지만 이에 제한되지 않는다. 본 발명의 일 측면에서, 유전자 스위치는 EcR 기반 유전자 스위치이다. 그러한 시스템의 예는 제한 없이 미국 특허 번호 6,258,603, 7,045,315, 미국 공개 특허 출원 번호 2006/0014711, 2007/0161086 및 국제 공개 출원 번호 WO 01/70816에 설명된 시스템을 포함한다. 키메라 에크디손 수용체 시스템의 예는 미국 특허 번호 7,091,038, 미국 공개 특허 출원 번호 2002/0110861, 2004/0033600, 2004/0096942, 2005/0266457 및 2006/0100416, 및 국제 공개 출원 번호 WO 01/70816, WO 02/066612, WO 02/066613, WO 02/066614, WO 02/066615, WO 02/29075, 및 WO 2005/108617에 기술되어 있으며, 이들 각각은 전문이 참조로 포함되어 있다. 비스테로이드성 엑디손 작용제 조절 시스템의 예는 RheoSwitch® 포유류 유도 발현 시스템(New England Biolabs, Ipswich, MA)이다.

또 다른 프로모터 시스템은 테트라사이클린(tet) 반응 요소(Gossen & Bujard(1992, Proc. Natl. Acad. Sci. USA 89:5547-551)에 기술된 것과 같은) 또는 Lee 등 (1981, Nature 294:228-232); Hynes 등 (1981, Proc. Natl. Acad. Sci. USA 78:2038-2042); Klock 등 (1987, Nature 329:734-736); 및 Israel & Kaufman (1989, Nucl. Acids Res. 17:2589-2604)으로 기술된 것과 같은 호르몬 반응 요소 및 당업계에 공지된 다른 유도성 프로모터를 포함하나 이에 제한되지 않는 반응 요소를 포함할 수 있다. 이러한 프로모터를 사용하여 가용성 hACE2 구조의 발현을 예를 들어 Tet-on/off 시스템(Gossen 등, 1995, Science 268:1766-9; Gossen 등, 1992, Proc. Natl. Acad. Sci. USA., 89(12):5547-51); TetR-KRAB 시스템 (Urrutia R., 2003, Genome Biol., 4(10):231; Deuschle U 등, 1995, Mol Cell Biol. (4):1907-14); 미페프리스톤(RU486) 조절 시스템 (Geneswitch; Wang Y 등, 1994, Proc. Natl. Acad. Sci. USA., 91(17):8180-4; Schillinger 등, 2005, Proc. Natl. Acad. Sci. U S A.102(39):13789-94) 및 인간화 타목시펜-dep 조절 시스템 (Roscilli 등, 2002, Mol. Ther. 6(5):653-63)으로 제어할 수 있다.

또 다른 측면에서, 유전자 스위치는 FKBP 라파마이신 관련 단백질(FRAP)과 FK506 결합 단백질(FKBP)의 이종이량체화를 기반으로 하며 라파마이신 또는 이의 비면역억제 유사체를 통해 조절된다. 이러한 시스템의 예는 제한 없이 ARGENT™ Transcriptional Technology(ARIAD Pharmaceuticals, Cambridge, Mass.) 및 미국 특허 번호 6,015,709, 6,117,680, 6,479,653, 6,187,757, 및 6,649,595, 미국 공개 번호 2002/0173474, 미국 공개 번호 200910100535, 미국 특허 번호 5,834,266, 미국 특허 번호 7,109,317, 미국 특허 번호 7,485,441, 미국 특허 번호 5,830,462, 미국 특허 번호 5,869,337, 미국 특허 번호 5,871,753, 미국 특허 번호 6,011,018, 미국 특허 번호 6,043,082, 미국 특허 번호 6,046,047, 미국 특허 번호 6,063,625, 미국 특허 번호 6,140,120, 미국 특허 번호 6,165,787, 미국 특허 번호 6,972,193, 미국 특허 번호 6,326,166, 미국 특허 번호 7,008,780, 미국 특허 번호 6,133,456, 미국 특허 번호 6,150,527, 미국 특허 번호 6,506,379, 미국 특허 번호 6,258,823, 미국 특허 번호 6,693,189, 미국 특허 번호 6,127,521, 미국 특허 번호 6,150,137, 미국 특허 번호 6,464,974, 미국 특허 번호 6,509,152, 미국 특허 번호 6,015,709, 미국 특허 번호 6,117,680, 미국 특허 번호 6,479,653, 미국 특허 번호 6,187,757, 미국 특허 번호 6,649,595, 미국 특허 번호 6,984,635, 미국 특허 번호 7,067,526, 미국 특허 번호 7,196,192, 미국 특허 번호 6,476,200, 미국 특허 번호 6,492,106, WO 94/18347, WO 96/20951, WO 96/06097, WO 97/31898, WO 96/41865, WO 98/02441, WO 95/33052, WO 99110508, WO 99110510, WO 99/36553, WO 99/41258,WO 01114387, ARGENT™ 규제 전사 레트로바이러스 키트, 버전 2.0(9109102) 및 ARGENT™ 규제 전사 플라스미드 키트, 버전 2.0(9109/02)에 기술된 시스템을 포함하며, 이들 각각은 그 전문이 본원에 참조로 포함된다. Ariad 시스템은 라파마이신 및 "라파로그"라고 하는 이의 유사체에 의해 유도되도록 설계되었다. 적합한 라파마이신의 예는 ARGENT™ 시스템의 설명과 관련하여 위에 나열된 문서에 제공된다. 일 구체예에서, 분자는 라파마이신[예를 들어, Pfizer에 의해 Rapamune™으로 시판됨]이다. 다른 구체예에서, AP21967[ARIAD]로 알려진 라팔로그가 사용된다. 본 발명에서 사용될 수 있는 이러한 이합체 분자의 예는 내인성 FKBP 및/또는 FRAP에 대한 친화성을 감소시키거나 제거하는 "돌기"를 추가하기 위해 천연 제품의 화학적 변형에 의해 쉽게 준비되는 라파마이신, FK506, FK1012(FK506의 동종이량체), 라파마이신 유사체("라파로그")를 포함하지만 이에 제한되지 않는다. 라파로그의 예는 내인성 FKBP와의 상호 작용을 최소화하도록 설계된 '범프'가 있는 AP26113(Ariad), AP1510 (Amara, J.F. 등, 1997, Proc. Natl. Acad. Sci. USA, 94(20): 10618-23) AP22660, AP22594, AP21370, AP22594, AP23054, AP1855, AP1856, AP1701, AP1861, AP1692 및 AP1889를 포함하지만 이에 제한되지 않는다. 또 다른 라파로그, 예를 들어 AP23573[Merck]이 선택될 수 있다. 특정 구체예에서, 라파마이신 또는 적합한 유사체는 비인두의 AAV-형질감염된 세포에 국소적으로 전달될 수 있다. 이 국소 전달은 볼루스, 크림 또는 젤을 통해 세포에 국소적으로 비강내 주사에 의해 이루어질 수 있다. 본원에 참조로 포함된 미국 특허 출원 US 2019/0216841 A1을 참조한다.

다른 적합한 인핸서는 원하는 표적 조직 적응증에 적절한 것들을 포함한다. 일 구체예에서, 발현 카세트는 하나 이상의 발현 인핸서를 포함한다. 일 구체예에서, 발현 카세트는 2개 이상의 발현 인핸서를 함유한다. 이들 인핸서는 서로 동일하거나 상이할 수 있다. 예를 들어, 인핸서는 CMV 즉시 초기 인핸서를 포함할 수 있다. 이 인핸서는 서로 인접해 있는 두 개의 사본에 존재할 수 있다. 대안적으로, 인핸서의 이중 카피는 하나 이상의 서열에 의해 분리될 수 있다. 또 다른 구체예에서, 발현 카세트는 인트론, 예를 들어 닭 베타-액틴 인트론을 추가로 함유한다. 다른 적합한 인트론은 당업계에 공지된 것, 예를 들어 WO 2011/126808에 기재된 것을 포함한다. 적합한 폴리아데닐화(polyA) 서열의 예는 예를 들어 토끼 결합 글로불린(토끼 베타 글로빈 또는 rBG라고도 함), SV40, SV50, 소 성장 호르몬(bGH), 인간 성장 호르몬 및 합성 polyA를 포함한다. 선택적으로, mRNA를 안정화하기 위해 하나 이상의 서열이 선택될 수 있다. 그러한 서열의 예는 폴리A 서열의 상류 및 코딩 서열의 하류에서 조작될 수 있는 변형된 WPRE 서열이다(예를 들어, MA Zanta-Boussif, 등, Gene Therapy (2009) 16: 605-619를 참조한다).

AAV 바이러스 벡터는 다수의 이식유전자를 포함할 수 있다. 특정 상황에서, 단백질의 각 서브유닛(예를 들어, 면역글로불린 도메인, 면역글로불린 중쇄, 면역글로불린 경쇄)을 인코딩하기 위해 상이한 이식유전자가 사용될 수 있다. 일 구체예에서, 세포는 각각의 상이한 서브유닛을 함유하는 바이러스로 감염/형질감염된 후 다중 서브유닛 단백질을 생산한다. 또 다른 구체예에서, 단백질의 상이한 서브유닛은 동일한 이식유전자에 의해 인코딩될 수 있다. IRES는 각각의 서브유닛을 인코딩하는 DNA의 크기가 작을 때, 예를 들어 서브유닛과 IRES를 인코딩하는 DNA의 총 크기가 5킬로베이스 미만일 때 바람직하다. IRES에 대한 대안으로서, DNA는 2A 펩티드를 인코딩하는 서열에 의해 분리될 수 있으며, 이는 번역 후 사건에서 자가 절단된다. 예를 들어, ML Donnelly, 등, (Jan 1997) J. Gen. Virol., 78(Pt 1):13-21; S. Furler, S 등, (June 2001) Gene Ther., 8(11):864-873; H. Klump, 등., (May 2001) Gene Ther., 8(10):811-817을 참조한다. 이 2A 펩티드는 IRES보다 훨씬 작기 때문에 공간이 제한 요인일 때 사용하기에 매우 적합하다. 더 자주, 이식유전자가 크거나 다중 서브유닛으로 구성되거나 두 개의 이식유전자가 공동 전달되는 경우, 원하는 이식유전자(들) 또는 서브유닛을 운반하는 rAAV가 공동 투여되어 단일 벡터 게놈을 형성하기 위해 생체 내에서 연쇄체화할 수 있다. 이러한 구체예에서, 제1 AAV는 단일 이식유전자를 발현하는 발현 카세트를 운반할 수 있고, 제2 AAV는 숙주 세포에서 공동-발현을 위해 상이한 이식유전자를 발현하는 발현 카세트를 운반할 수 있다. 그러나, 선택된 이식유전자는 임의의 생물학적 활성 생성물 또는 다른 생성물, 예를 들어 연구에 바람직한 생성물을 인코딩할 수 있다.

발현 카세트에 대해 위에서 확인된 요소에 더하여, 벡터는 또한 플라스미드 벡터로 형질감염되거나 본 발명에 의해 생성된 바이러스로 감염된 세포에서 인코딩된 생성물(예를 들어, 가용성 hACE2 구조, 항-인플루엔자 항체, 항-COVID19 항체)의 전사, 번역 및/또는 발현을 허용하는 방식으로 코딩 서열에 작동가능하게 연결된 통상적인 제어 요소를 포함한다. 다른 적합한 이식유전자의 예가 본원에 제공된다. 본원에서 사용되는 바와 같이, "작동가능하게 연결된" 서열은 관심 유전자와 인접하는 발현 제어 서열 및 관심 유전자를 제어하기 위해 트랜스로 또는 일정 거리에서 작용하는 발현 제어 서열 모두를 포함한다.

발현 조절 서열은 적절한 강화제; 전사 인자; 전사 종결자; 발기인; 스플라이싱 및 폴리아데닐화(polyA) 신호와 같은 효율적인 RNA 처리 신호; 세포질 mRNA를 안정화시키는 서열, 예를 들어 우드척 간염 바이러스(WHP) 전사 후 조절 요소(WPRE); 번역 효율성을 향상시키는 서열(즉, Kozak 컨센서스 서열); 단백질 안정성을 향상시키는 서열; 및 원하는 경우 인코딩된 생성물의 분비를 향상시키는 서열을 포함한다. 일 구체예에서, 전체 rAAV 벡터 게놈의 크기가 약 2.0 내지 약 5.5킬로베이스가 되도록 조절 서열이 선택된다. 일 구체예에서, rAAV 벡터 게놈은 천연 AAV 게놈의 크기에 근접하는 것이 바람직하다. 따라서, 일 구체예에서, 전체 rAAV 벡터 게놈의 크기가 약 4.7kb가 되도록 조절 서열을 선택한다. 다른 구체예에서, 전체 rAAV 벡터 게놈은 크기가 약 5.2kb 미만이다. 벡터 게놈의 크기는 프로모터, 인핸서, 인트론, 폴리 A 등을 포함하는 조절 서열의 크기에 따라 조작될 수 있다. 본 명세서에 참조로 포함된 Wu 등, Mol. Ther., Jan 2010 18(1):80-6을 참조한다.

따라서, 일 구체예에서, 인트론은 벡터에 포함된다. 적합한 인트론은 닭 베타-액틴 인트론, 인간 베타 글로빈 IVS2(Kelly 등, Nucleic Acids Research, 43(9):4721-32 (2015)); Promega 키메라 인트론(Almond, B. 및 Schenborn, E. T. A Comparison of pCI-neo Vector and pcDNA4/HisMax Vector); 및 hFIX 인트론을 포함한다. 본원에 적합한 다양한 인트론은 당업계에 공지되어 있고, 본원에 참조로 포함된 bpg.utoledo.edu/~afedorov/lab/eid.html에서 발견된 것들을 포함하나 이에 제한되지 않는다. 또한, Shepelev V., Fedorov A. Advances in the Exon-Intron Database. Briefings in Bioinformatics 2006, 7: 178-185를 참조하며, 이는 본원에 참조로 포함된다.

본원에 기술된 연구에서 여러 상이한 바이러스 게놈이 생성되었다. 그러나, 당업자는 다른 조절 서열을 포함하는 다른 게놈 구성이 프로모터, 인핸서를 대체할 수 있고 다른 코딩 서열이 선택될 수 있음을 이해할 것이다.

rAAV 벡터 생산

AAV 바이러스 벡터(예를 들어, 재조합(r) AAV)를 생산하는 데 사용하기 위한 발현 카세트는 패키징 숙주 세포에 전달되는 임의의 적합한 벡터, 예를 들어 플라스미드에 운반될 수 있다. 본 발명에 유용한 플라스미드는 특히 원핵 세포, 곤충 세포, 포유동물 세포에서 복제 및 시험관내 패키징에 적합하도록 조작될 수 있다. 적합한 형질감염 기술 및 패키징 숙주 세포는 공지되어 있고/있거나 당업자에 의해 용이하게 설계될 수 있다.

특정 구체예에서, AAV 캡시드에 N- x- (T/I/V/A)- (K/R) 모티프의 적어도 하나의 카피를 포함하는 것은 AAV 캡시드에 적어도 하나의 모티프 카피를 포함하지 않는 방법과 비교하여 생산에서 이점을 제공하며, 상기 생산 세포는 293 세포이다.

AAV 기반 벡터(예를 들어, AAV9 또는 다른 AAV 캡시드를 가짐)를 제조하는 방법은 알려져 있다. 예를 들어, 본원에 참조로 포함된 미국 공개 특허 출원 번호 2007/0036760(2007년 2월 15일)을 참조한다. 본 발명은 AAV9 또는 다른 클레이드 F AAV 아미노산 서열의 사용에 제한되지 않고, 예를 들어 화학적 합성, 다른 합성 기술 또는 다른 방법에 의해 포함하는 당업계에 공지된 다른 방법에 의해 생성된 말단 β-갈락토스 결합을 함유하는 펩티드 및/또는 단백질을 포함한다. 본원에 제공된 임의의 AAV 캡시드의 서열은 다양한 기술을 사용하여 쉽게 생성될 수 있다. 적합한 생산 기술은 당업자에게 잘 알려져 있다. 예를 들어 Sambrook 등, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press (Cold Spring Harbor, NY)를 참조한다. 대안적으로, 펩티드는 잘 알려진 고상 펩티드 합성 방법에 의해 합성될 수도 있다(Merrifield, (1962) J. Am. Chem. Soc., 85:2149; Stewart 및 Young, Solid Phase Peptide Synthesis (Freeman, San Francisco, 1969) pp. 27-62). 이러한 방법에는 예를 들어 AAV 캡시드를 인코딩하는 핵산 서열을 함유하는 숙주 세포를 배양하는 단계; 기능적 대표 유전자; 최소한 AAV 역위 말단 반복부(ITR) 및 이식유전자로 구성된 미니유전자; 미니유전자를 AAV 캡시드 단백질로 패키징할 수 있도록 하는 충분한 헬퍼 기능이 포함될 수 있다. 이들 및 다른 적합한 제조 방법은 당업자의 지식 내에 있으며 본 발명의 제한이 아니다.

AAV 캡시드에 AAV 미니유전자를 패키징하기 위해 숙주 세포에서 배양되는 데 필요한 구성요소는 숙주 세포에 트랜스로 제공될 수 있다. 대안적으로, 임의의 하나 이상의 필요한 구성요소(예를 들어, 미니유전자, rep 서열, cap 서열 및/또는 헬퍼 기능)는 당업자에게 공지된 방법을 사용하여 하나 이상의 필요한 구성요소를 함유하도록 조작된 안정한 숙주 세포에 의해 제공될 수 있다. 가장 적절하게는, 그러한 안정한 숙주 세포는 유도성 프로모터의 제어 하에 필요한 성분을 함유할 것이다. 그러나 필요한 구성 요소는 구성적 프로모터의 통제하에 있을 수 있다. 적합한 유도성 및 구성적 프로모터의 예는 이식유전자와 함께 사용하기에 적합한 조절 요소의 논의에서 본원에서 제공된다. 또 다른 대안에서, 선택된 안정한 숙주 세포는 구성적 프로모터의 제어 하에 선택된 성분 및 하나 이상의 유도성 프로모터의 제어 하에 다른 선택된 성분을 함유할 수 있다. 예를 들어, 293 세포(구성적 프로모터의 제어 하에 E1 헬퍼 기능을 함유함)로부터 유도되지만 유도성 프로모터의 제어 하에 rep 및/또는 cap 단백질을 함유하는 안정한 숙주 세포가 생성될 수 있다. 또 다른 안정한 숙주 세포는 당업자에 의해 생성될 수 있다.

이러한 rAAV는 치료 목적 및 감염 예방을 위한 유전자 전달에 특히 적합하다. 또한, 본 발명의 조성물은 시험관 내에서 목적하는 유전자 산물의 생산에도 사용될 수 있다. 시험관내 생성을 위해, 원하는 생성물(예를 들어, 단백질)은 원하는 생성물을 코딩하는 분자를 함유하는 rAAV로 숙주 세포를 형질감염시키고 발현을 허용하는 조건 하에서 세포 배양물을 배양한 후 원하는 배양물로부터 얻을 수 있다. 그런 다음 발현된 제품을 원하는 대로 정제하고 분리할 수 있다. 형질감염, 세포 배양, 정제 및 단리를 위한 적합한 기술은 당업자에게 공지되어 있다. 벡터로서 사용하기에 적합한 AAV를 생성하고 분리하는 방법은 당업계에 공지되어 있다. 일반적으로, 예를 들어, Grieger & Samulski, 2005, "Adeno-associated virus as a gene therapy vector: Vector development, production and clinical applications," Adv. Biochem. Engin/Biotechnol. 99: 119-145; Buning 등, 2008, "Recent developments in adeno-associated virus vector technology," J. Gene Med. 10:717-733; 아래에 인용된 참고문헌, 각각은 그 전체가 참고문헌으로 본 명세서에 포함된다. 이식유전자를 비리온으로 패키징하기 위해, ITR은 발현 카세트를 포함하는 핵산 분자와 동일한 구조에서 cis에 필요한 유일한 AAV 구성 요소이다. cap 및 rep 유전자는 트랜스로 제공될 수 있다.

일 구체예에서, 본원에 기술된 발현 카세트는 바이러스 벡터 생산을 위해 그 위에 운반된 면역글로불린 작제물 서열을 패키징 숙주 세포로 전달하는 유전 요소(예를 들어, 셔틀 플라스미드)로 조작된다. 일 구체예에서, 선택된 유전 요소는 형질감염, 전기천공법, 리포좀 전달, 막 융합 기술, 고속 DNA-코팅된 펠릿, 바이러스 감염 및 원형질체 융합을 포함하는 임의의 적합한 방법에 의해 AAV 패키징 세포로 전달될 수 있다. 안정적인 AAV 패키징 셀도 만들 수 있다. 대안적으로, 발현 카세트는 AAV 이외의 바이러스 벡터를 생성하기 위해 또는 시험관 내에서 항체 혼합물의 생성을 위해 사용될 수 있다. 그러한 작제물을 만드는 데 사용되는 방법은 핵산 조작 분야의 숙련자에게 알려져 있으며 유전 공학, 재조합 공학 및 합성 기술을 포함한다. 예를 들어, Molecular Cloning: A Laboratory Manual, ed. Green and Sambrook, Cold Spring Harbor Press, Cold Spring Harbor, NY (2012)를 참조한다.

용어 "AAV 중간체" 또는 "AAV 벡터 중간체"는 패키징된 원하는 게놈 서열이 결여된 조립된 rAAV 캡시드를 지칭한다. 이들은 또한 "빈" 캡시드라고도 한다. 이러한 캡시드는 검출 가능한 발현 카세트의 게놈 서열을 포함하지 않거나, 유전자 산물의 발현을 달성하기에 불충분한 부분적으로 패키징된 게놈 서열만을 포함할 수 있다. 이러한 빈 캡시드는 관심 있는 유전자를 숙주 세포로 전달하는 기능이 없다.

본원에 기재된 재조합 AAV는 공지된 기술을 사용하여 생성될 수 있다. 예를 들어 WO 2003/042397; WO 2005/033321, WO 2006/110689; US 7588772 B2를 참조한다. 이러한 방법은 AAV 캡시드를 인코딩하는 핵산 서열; 기능적 대표 유전자; 최소한 AAV 역위 말단 반복(ITR) 및 이식유전자로 구성된 발현 카세트; 및 AAV 캡시드 단백질로의 발현 카세트의 패키징을 허용하기에 충분한 헬퍼 기능을 포함하는 숙주 세포를 배양하는 것을 포함한다. 캡시드를 생성하는 방법, 그에 따른 코딩 서열, 및 rAAV 바이러스 벡터의 생성 방법이 기재되어 있다. 예를 들어, Gao, 등, Proc. Natl. Acad. Sci. U.S.A. 100 (10), 6081-6086 (2003) 및 US 2013/0045186A1를 참조한다.

일 구체예에서, 세포는 적합한 세포 배양물에서 제조된다(예를 들어, HEK 293 세포). 본 명세서에 기술된 유전자 치료 벡터의 제조 방법은 유전자 치료 벡터의 생산에 사용되는 플라스미드 DNA의 생성, 벡터의 생성 및 벡터의 정제와 같은 당업계에 잘 알려진 방법을 포함한다. 일부 구체예에서, 유전자 치료 벡터는 AAV 벡터이고 생성된 플라스미드는 AAV 게놈을 인코딩하는 AAV cis-플라스미드와 캡시드로 패키징하기 위한 관심 유전자, AAV rep 및 cap 유전자를 포함하는 AAV 트랜스-플라스미드 및 아데노바이러스 헬퍼 플라스미드이다. 벡터 생성 프로세스에는 세포 배양 개시, 세포 계대, 세포 접종, 플라스미드 DNA로 세포의 형질감염, 형질감염 후 배지를 무혈청 배지로 교환, 벡터 함유 세포 및 배양 배지의 수확 과 같은 방법 단계가 포함될 수 있다. 수확된 벡터 함유 세포 및 배양 배지는 본원에서 미정제 세포 수확으로 지칭된다. 또 다른 시스템에서 유전자 치료 벡터는 배큘로바이러스 기반 벡터로 감염시켜 곤충 세포에 도입된다. 이러한 생산 시스템에 대한 검토를 위해 일반적으로, 예를 들어 전체가 참조로 본 명세서에 포함된 Zhang 등, 2009, "Adenovirus-adeno-associated virus hybrid for large-scale recombinant adeno-associated virus production," Human Gene Therapy 20:922-929 를 참조한다. 이들 및 다른 AAV 생산 시스템을 만들고 사용하는 방법은 또한 다음 미국 특허에 설명되어 있으며, 각 특허의 내용은 전체적으로 참조로 본원에 포함된다: 5,139,941; 5,741,683; 6,057,152; 6,204,059; 6,268,213; 6,491,907; 6,660,514; 6,951,753; 7,094,604; 7,172,893; 7,201,898; 7,229,823; 및 7,439,065. 특정 구체예에서, AAV 생산 시스템을 만들고 사용하는 방법은 2020년 4월 28일에 출원된 미국 특허 출원 63/016,894에 기술된 가성 광견병 바이러스(rPRV)를 사용하는 방법을 포함하며, 본원에 참조로 포함된다.

조 세포 수거물은 그 후 벡터 수확물의 농축, 벡터 수확물의 정용여과, 벡터 수확물의 미세유동화, 벡터 수확물의 뉴클레아제 소화, 미세유동화 중간체의 여과, 크로마토그래피에 의한 조 정제, 초원심분리에 의한 조 정제, 접선 흐름 여과에 의한 완충액 교환, 및/또는 벌크 벡터를 준비하기 위한 제형화 및 여과와 같은 대상 방법 단계일 수 있다.

높은 염 농도에서 2단계 친화성 크로마토그래피 정제 후 음이온 교환 수지 크로마토그래피를 사용하여 벡터 약물 제품을 정제하고 빈 캡시드를 제거한다. 이들 방법은 2016년 12월 9일 출원된 "Scalable Purification Method for AAV9"라는 제목의 국제 특허 출원 번호 PCT/US2016/065970에 더 자세히 설명되어 있으며, 이는 참조로 포함된다. 2016년 12월 9일 출원된 국제 특허 출원 번호 PCT/US2016/065976에 기재된 AAV8의 정제 방법, 및 2016년 12월 9일 출원된 "Scalable Purification Method for AAVrh10"라는 제목의, 또한 2015년 12월 11일 출원된, 국제 특허 출원 번호 PCT/US16/66013의 rh10의 정제 방법, 및 2015년 12월 11일 출원된 "Scalable Purification Method for AAV1"에 대해 2016년 12월 9일 출원된 국제 특허 출원 번호 PCT/US2016/065974의 AAV1의 정제 방법은 모두 본원에 참조로 포함된다.

빈 입자 및 전체 입자 함량을 계산하기 위해, 선택된 샘플(예를 들어, 본원의 예에서 GC 수 = 입자 수인 요오딕사놀 구배-정제 제제)에 대한 vp3 밴드 부피가 로드된 GC 입자에 대해 플롯된다. 결과 선형 방정식(y = mx+c)은 테스트 항목 피크의 밴드 부피에서 입자 수를 계산하는 데 사용된다. 로드된 20μL당 입자 수(pt)에 50을 곱하여 입자(pt)/mL를 제공한다. Pt/mL을 GC/mL로 나눈 값은 입자 대 게놈 사본의 비율(pt/GC)을 제공한다. Pt/mL-GC/mL은 빈 pt/mL을 제공한다. 빈 pt/mL을 pt/mL으로 나누고 x 100 하면 빈 입자의 백분율을 제공한다.

일반적으로, 패키징된 게놈을 갖는 빈 캡시드 및 AAV 벡터 입자에 대한 검정 방법은 당업계에 공지되어 있다. 예를 들어, Grimm 등, Gene Therapy (1999) 6:1322-1330; 및 Sommer 등, Molec. Ther. (2003) 7:122-128을 참조한다. 변성 캡시드를 테스트하기 위해 방법에는 처리된 AAV 스톡을 SDS-폴리아크릴아미드 겔 전기영동에 적용하는 단계, 3개의 캡시드 단백질을 분리할 수 있는 임의의 겔, 예를 들어 완충액에 3-8% 트리스-아세테이트를 함유한 구배 겔, 그리고 샘플 물질이 분리될 때까지 겔 실행하는 단계, 및 젤을 나일론 또는 니트로셀룰로스 막, 바람직하게는 나일론에 블로팅하는 단계가 포함된다. 항-AAV 캡시드 항체는 변성 캡시드 단백질, 바람직하게는 항-AAV 캡시드 단일 클론 항체, 가장 바람직하게는 B1 항-AAV-2 단일 클론 항체에 결합하는 1차 항체로 사용된다(Wobus 등, J. Virol. (2000) 74:9281-9293). 그런 다음 1차 항체에 결합하고 1차 항체, 보다 바람직하게는 이것에 공유 결합된 검출 분자를 함유하는 항-IgG 항체, 가장 바람직하게는 서양고추냉이 퍼옥시다제에 공유 결합된 양 항-마우스 IgG 항체와의 결합을 검출하는 수단을 포함하는 2차 항체가 사용된다. 결합을 검출하는 방법은 1차 항체와 2차 항체 사이의 결합을 반정량적으로 결정하기 위해 사용되며, 바람직하게는 방사성 동위원소 방출, 전자기 방사선 또는 비색 변화를 검출할 수 있는 검출 방법, 가장 바람직하게는 화학발광 검출 키트이다. 예를 들어, SDS-PAGE의 경우 컬럼 분획의 샘플을 채취하여 환원제(예를 들어, DTT)를 함유하는 SDS-PAGE 로딩 완충액에서 가열할 수 있으며, 캡시드 단백질은 미리 주조된 구배 폴리아크릴아미드 겔(예를 들어, Novex)에서 분해되었다. 실버 염색은 제조업체의 지침에 따라 SilverXpress(Invitrogen, CA) 또는 기타 적합한 염색 방법, 즉 SYPRO ruby 또는 쿠마시 염색을 사용하여 수행할 수 있다. 일 구체예에서, 컬럼 분획에서 AAV 벡터 게놈(vg)의 농도는 정량적 실시간 PCR(Q-PCR)에 의해 측정될 수 있다. 샘플을 희석하고 DNase I(또는 다른 적합한 뉴클레아제)로 분해하여 외인성 DNA를 제거한다. 뉴클레아제를 불활성화한 후, 샘플을 추가로 희석하고 프라이머 사이의 DNA 서열에 특이적인 TaqMan™ 형광 프로브와 프라이머를 사용하여 증폭한다. 정의된 형광 수준(임계값 주기, Ct)에 도달하는 데 필요한 주기 수는 Applied Biosystems Prism 7700 Sequence Detection System에서 각 샘플에 대해 측정된다. AAV 벡터에 포함된 것과 동일한 서열을 포함하는 플라스미드 DNA는 Q-PCR 반응에서 표준 곡선을 생성하기 위해 사용된다. 샘플에서 얻은 주기 역치(Ct) 값은 플라스미드 표준 곡선의 Ct 값으로 정규화하여 벡터 게놈 역가를 결정하는 데 사용된다. 디지털 PCR을 기반으로 하는 종점 분석도 사용할 수 있다.

또한, 빈 입자 대 전체 입자 비율을 측정하는 또 다른 예도 당업계에 알려져 있다. 분석 초원심분리기(AUC)에서 측정된 침전 속도는 응집체, 기타 미량 성분을 검출할 수 있을 뿐만 아니라 서로 다른 침전 계수를 기반으로 서로 다른 입자 종의 상대적인 양을 양호하게 정량화할 수 있다. 이것은 길이와 시간의 기본 단위를 기반으로 하는 절대 방법이며 참조로 표준 분자가 필요하지 않다. 벡터 샘플은 광학 경로 길이가 12mm인 2채널 목탄-에폰 센터피스가 있는 셀에 로드된다. 제공된 희석 완충액은 각 셀의 참조 채널에 로드된다. 그런 다음 로드된 세포를 AN-60Ti 분석 로터에 넣고 흡광도 및 RI 검출기가 모두 장착된 Beckman-Coulter ProteomeLab XL-I 분석 초원심분리기에 로드한다. 20℃에서 전체 온도 평형 후 로터는 12,000 rpm의 최종 실행 속도가 된다. A₂₈₀ 스캔은 ~5.5시간 동안 약 3분마다 기록된다(각 샘플에 대해 총 110개의 스캔). 원시 데이터는 c(s) 방법을 사용하여 분석되고 분석 프로그램 SEDFIT에서 구현된다. 결과 크기 분포가 그래프로 표시되고 피크가 통합된다. 각 피크와 관련된 백분율 값은 모든 피크 아래 총 면적의 피크 면적 비율을 나타내며 280nm에서 생성된 원시 데이터를 기반으로 하며; 많은 실험실에서 이 값을 사용하여 빈: 전체 입자 비율을 계산한다. 그러나 빈 입자와 가득 찬 입자는 이 파장에서 흡광 계수가 다르기 때문에 원시 데이터를 그에 따라 조정할 수 있다. 흡광계수 조정 전후의 빈 입자와 전체 단량체 피크 값의 비율을 사용하여 빈-가득 입자 비율을 결정한다.

일 측면에서, 광범위한 스펙트럼의 세린 프로테아제, 예를 들어 프로테이나제 K(예를 들어 Qiagen에서 시판됨)를 이용하는 최적화된 q-PCR 방법이 사용된다. 보다 구체적으로, 최적화된 qPCR 게놈 역가 분석은 DNase I 소화 후 샘플을 프로테이나제 K 완충액으로 희석하고 프로테이나제 K로 처리한 다음 열 불활성화한다는 점을 제외하면 표준 분석과 유사하다. 적당하게 샘플은 샘플 크기와 동일한 양의 프로테이나제 K 완충액으로 희석된다. 단백분해효소 K 완충액은 2배 이상으로 농축될 수 있다. 전형적으로, 프로테이나제 K 처리는 약 0.2mg/mL이지만, 0.1mg/mL에서 약 1mg/mL까지 다양할 수 있다. 상기 처리 단계는 일반적으로 약 55℃에서 약 15분 동안 수행되나, 더 낮은 온도(예를 들어 약 37℃ 내지 약 50℃)에서 더 긴 시간(예를 들어 약 20분 내지 약 30분) 또는 더 짧은 시간(예를 들어, 약 5 내지 10분) 동안 더 높은 온도(예를 들어, 최대 약 60℃)에 걸쳐 수행될 수 있다. 유사하게, 열 불활성화는 일반적으로 약 95℃에서 약 15분 동안이지만, 온도를 낮추고(예를 들어, 약 70 내지 약 90℃) 시간을 연장할 수 있다(예를 들어, 약 20분 내지 약 30분). 그런 다음 샘플을 희석(예를 들어 1000배)하고 표준 분석에 설명된 대로 TaqMan 분석을 수행한다. 정량화는 ViroCyt 또는 유세포 분석을 사용하여 수행할 수도 있다.

추가로 또는 대안적으로 액적 디지털 PCR(ddPCR)을 사용할 수 있다. 예를 들어, ddPCR에 의해 단일 가닥 및 자체 상보적 AAV 벡터 게놈 역가를 결정하는 방법이 설명되었다. 예를 들어, M. Lock 등, Hu Gene Therapy Methods, Hum. Gene Ther. Methods. 2014 Apr;25(2):115-25. doi: 10.1089/hgtb.2013.131. Epub 2014 Feb 14를 참조한다.

치료 단백질 및 전달 시스템

본원에 제공된 표적화 모티프인 N- x- (T/I/V/A)- (K/R) 모티프를 함유하는 융합 파트너, 컨쥬게이트 파트너 및 재조합 벡터는 다양한 상이한 치료 단백질, 폴리펩티드, 나노입자 및 전달 시스템에 유용하다. 본원에서 제공되는 조성물 및 표적 전달에 유용한 단백질 및 화합물의 예는 다음을 포함한다. 바이러스 벡터, 나노입자 및 기타 전달 시스템은 생체내 발현을 위해 선택된 단백질(또는 접합체)을 인코딩하는 서열을 함유한다는 것을 이해할 것이다.

특정 구체예에서, 단백질은 Allan-Herndon-Dudley 질병 및 이의 증상을 치료하기 위한 MCT8 단백질(SLC16A2 유전자) 및 기타 화합물이다.

특정 구체예에서, 단백질은 예를 들어 무엇보다도 낭포성 섬유증(낭포성 섬유증 막관통 조절제), 알파-1-항트립신(유전성 폐기종), FE(유전성 혈색소침착증), 티로시나아제(눈피부 백색증), 단백질 C(단백질 C 결핍증), 보체 C 억제제(I형 유전성 혈관부종), 알파-D-갈락토시다제(파브리병), 베타 헥소사미니다제(Tay-Sachs), 수크라제-이소말타제(선천성 수크라제-이소말타제 결핍증), UDP-글루코로노실-트랜스퍼라제(Crigler-Najjar 유형 II), 인슐린 수용체(당뇨병), 성장 호르몬 수용체(라론 증후군)와 같은 수송 결함과 관련된 질병으로부터 선택된다. 무엇보다도 척수성 근위축증(SMA, SMN1), 헌팅던병, 레트 증후군(예: 메틸-CpG 결합 단백질 2(MeCP2); UniProtKB - P51608), 근위축성 측삭 경화증(ALS), 뒤쉔형 근이영양증, 프리드리히 운동 실조증(예: 프라탁신), 척수소뇌 운동실조 2형(SCA2)/ALS와 관련된 ATXN2; ALS와 관련된 TDP-43, 프로그래눌린(PRGN)(전측두엽 치매(FTD), 진행성 비유창성 실어증(PNFA) 및 의미 치매를 포함하는 비알츠하이머 뇌 변성과 관련됨)과 관련된 다른 유전자 및 단백질의 예. 예를 들어, www.orpha.net/consor/cgi-bin/Disease_Search_List.php; rarediseases.info.nih.gov/diseases를 참조한다. rAAV를 통해 전달될 수 있는 추가의 예시적인 유전자에는 글리코겐 축적 질환 또는 결핍 유형 1A(GSD1)와 관련된 글루코스-6-포스파타제, PEPCK 결핍과 관련된 포스포에놀피루베이트-카르복시키나제(PEPCK); 발작 및 심각한 신경 발달 장애와 관련된 세린/트레오닌 키나아제 9(STK9)로도 알려진 사이클린 의존 키나아제 유사 5(CDKL5); 갈락토오스혈증과 관련된 갈락토오스-1 인산염 유리딜 전이효소; 페닐케톤뇨증(PKU)과 관련된 페닐알라닌 수산화효소(PAH); 히드록시산 옥시다제 1(GO/HAO1) 및 메이플 시럽 소변 질환과 관련된 BCKDH, BCKDH-E2, BAKDH-E1a 및 BAKDH-E1b를 포함하는 분지쇄 알파-케토산 탈수소효소인 AGXT를 포함하는 원발성 고옥산뇨증 1형과 관련된 유전자 산물; 티로신혈증 유형 1과 관련된 푸마릴아세토아세테이트 가수분해효소; 메틸말론산혈증과 관련된 메틸말로닐-CoA 뮤타제; 중쇄 아세틸 CoA 결핍과 관련된 중쇄 아실 CoA 탈수소효소; 오르니틴 트랜스카바밀라제 결핍과 관련된 오르니틴 트랜스카바밀라제(OTC); 시트룰린혈증과 관련된 아르기니노숙신산 합성효소(ASS1); 레시틴-콜레스테롤 아실트랜스퍼라제(LCAT) 결핍; 메틸말론산혈증(MMA); 니만-픽병(C1형)과 관련된 NPC1); 프로피온 학계(PA); 트랜스티레틴(TTR) 관련 유전성 아밀로이드증과 관련된 TTR; 가족성 고콜레스테롤혈증(FH)과 관련된 저밀도 지단백질 수용체(LDLR) 단백질, LDLR 변이체, 예컨대 WO 2015/164778에 기술된 것들; PCSK9; 치매와 관련된 ApoE 및 ApoC 단백질; Crigler-Najjar 질병과 관련된 UDP-glucouronosyltransferase; 중증 복합 면역결핍 질환과 관련된 아데노신 데아미나제; 통풍 및 Lesch-Nyan 증후군과 관련된 하이포크산틴 구아닌 포스포리보실 전이효소; 바이오티미다제 결핍과 관련된 바이오티미다제; 파브리병과 관련된 알파-갈락토시다제 A(a-Gal A); GM1 강글리오시다제와 관련된 베타-갈락토시다제(GLB1); 윌슨병과 관련된 ATP7B; Gaucher병 2형 및 3형과 관련된 베타-글루코세레브로시다제; Zellweger 증후군과 관련된 peroxisome 막 단백질 70 kDa; 이색성 백질이영양증과 관련된 아릴설파타제 A(ARSA), 크라베병과 관련된 갈락토세레브로시다제(GALC) 효소, 폼페병과 관련된 알파-글루코시다제(GAA); Nieman Pick 질병 A형과 관련된 스핑고미엘리나제(SMPD1) 유전자; 성인 발병 II형 시트룰린혈증(CTLN2)과 관련된 아르기니노숙시네이트 합성효소; 우레아 순환 장애와 관련된 카르바모일-포스페이트 신타제 1(CPS1); 척수성 근위축증과 관련된 생존 운동 뉴런(SMN) 단백질; 파버 지방육아종증과 관련된 세라미다제; GM2 강글리오시드증 및 테이-삭스병 및 샌드호프병과 관련된 b-헥소사미니다제; 아스파르틸-글루코사미뇨증과 관련된 아스파르틸글루코사미니다제; 푸코시다아제와 관련된 α-푸코시다아제; 알파-만노시다증과 관련된 α-만노시다아제; 급성 간헐적 포르피린증(AIP)과 관련된 포르포빌리노겐 데아미나제; 알파-1 항트립신 결핍(폐기종) 치료를 위한 알파-1 항트립신; 지중해 빈혈 또는 신부전으로 인한 빈혈 치료를 위한 에리스로포이에틴; 허혈성 질환 치료를 위한 혈관 내피 성장 인자, 안지오포이에틴-1 및 섬유아세포 성장 인자; 예를 들어 죽상경화증, 혈전증 또는 색전증에서 볼 수 있는 폐색된 혈관의 치료를 위한 트롬보모듈린 및 조직 인자 경로 억제제; 파킨슨병 치료를 위한 방향족 아미노산 탈탄산효소(AADC) 및 티로신 수산화효소(TH)가 포함되나 이에 제한되지 않는다.

본원에서 제공되는 조성물 및 표적 전달에 유용한 단백질 및 화합물의 예는 치료 단백질 및 기타 화합물 및 다음의 호흡기 관련 감염 질환의 백신 단백질 유도체 및 이러한 감염 질환에 대한 직접적인 수동 면역글로불린을 포함한다. 적합한 치료 단백질의 예는 예를 들어 알파-1-항트립신, 낭포성 섬유증 막관통 단백질 및 이의 변이체, 계면활성제-B, 골형성 단백질 수용체 유형 II(폐동맥 고혈압과 관련됨) 및 다양한 암 치료제를 포함한다.

적합한 백신 또는 수동 면역화의 예에는 중증급성호흡기증후군(SARS-CoV1), 일반 감기 및 A형, B형 또는 C형 이외의 간염과 관련이 있는 인간 호흡기 코로나바이러스를 포함하여 공기 중 병원체에서 유래한 단백질이 포함된다. SARS-CoV2는 COVID-19의 원인 병원체이며 이 바이러스에 특이적인 항체가 설명되었다. SARS-CoV2의 인간 ACE2의 스파이크 단백질에 결합하는 데 유용하고 중화 활성을 갖는 것으로 기술된 IgG 항체의 예는 예를 들어 LY-CoV555 (Eli Lilly), TY027 (Tychon), STI-1499 및 STI-2020 (COVI-GUARD; Sorrento), 80R, ADI055689/56046 (Adimab) (Renn 등, Trends in Pharmacological Sciences, 2020); BD-217, BD-218, BD-236 (Cao 등, Cell, 182, 73-84 (2020))를 포함한다. SARS-COV2의 인간 ACE2의 수용체 결합 도메인(RBD)에 결합하는 데 유용하고 중화 활성을 갖는 것으로 기술된 IgG 항체의 예는 예를 들어 COV2-2196, COV2-2130, COV2-2165 (Zost 등, Nature, 584, 443-465 (2020)); BD-361, BD-368, BD-368-2 (Cao 등, Cell, 182, 73-84 (2020)); B38, H4 (Y. Wu 등, Science 10.1126/science.abc2241 (2020); Jahanshahlu 및 Rezaei, Biomedicine and Pharmacotherapy 129 (2020)); S309, S315, S304(Pinto 등, Nature, 583, 290-311 (2020)); CC6.29, CC6.30, CC6.33, CC12.1, CC12.3(Rogers 등, Science 369, 956-963 (2020)); JS016(일라이 릴리), CA1, CB6-LALA, P2C-1F11/P2B-2F6/P2A-1A3, 311mab-31B5311/32D4, COVA 2-15, 414-1, (Renn 등., Trends in Pharmacological Sciences, 2020)를 포함한다. SARS-COV1의 인간 ACE2의 스파이크 단백질에 결합하는 데 유용하고 중화 활성을 갖는 것으로 기술된 IgG 항체의 예는 예를 들어 m396 및 CR3104(Prabakaran 등, Journal of Biological Chemistry, 281, 15829-15836 (2006); ter Meulen 등, PLoS, 3, 7 (2006))을 포함한다. SARS-COV1 및 SARS-CoV2 모두의 RBD 또는 인간 ACE2의 스파이크 단백질에 결합하는 데 유용하고 중화 활성을 갖는 것으로 기술된 IgG 항체의 예는 예를 들어 CR3022 및 47D11(Wang 등, Nature Communications, 11, nature.com/naturecommunications (2020))을 포함한다.

다른 표적 바이러스의 예는 인플루엔자 A, 인플루엔자 B 및 인플루엔자 C를 포함하는 오르토믹소바이러스과의 인플루엔자 바이러스를 포함한다. 유형 A 바이러스는 가장 치명적인 인간 병원체이다. 전염병과 관련된 인플루엔자 A의 혈청형에는 1918년 스페인 독감과 2009년 돼지 독감을 일으킨 H1N1; 1957년 아시아 독감을 일으킨 H2N2; 1968년 홍콩 독감을 일으킨 H3N2; 2004년에 조류 독감을 일으킨 H5N1; H7N7; H1N2; H9N2; H7N2; H7N3; 및 H10N7이 포함된다. 인플루엔자 A에 대한 광범위한 중화 항체가 설명되었다. 본원에서 사용되는 바와 같이, "광범위한 중화 항체"는 다수의 아형으로부터 다수의 균주를 중화시킬 수 있는 중화 항체를 의미한다. 예를 들어, CR6261[The Scripps Institute/Crucell]은 1918년 "스페인 독감"(SC1918/H1)을 포함한 광범위한 인플루엔자 바이러스와 2004년 베트남에서 닭에서 인간으로 점프한 조류 인플루엔자(Viet04/H5)의 H5N1 클래스 바이러스에 결합하는 단일 클론 항체로 설명되었다. CR6261은 인플루엔자 바이러스 표면의 우세한 단백질인 헤마글루티닌의 막 근위 줄기에서 고도로 보존된 나선형 영역을 인식한다. 이 항체는 본원에 참고로 포함된 WO 2010/130636에 기술되어 있다. 또 다른 중화 항체인 F10[XOMA Ltd]는 H1N1 및 H5N1에 대해 유용한 것으로 설명되었다. [Sui 등, Nature Structural and Molecular Biology (Sui, 등 2009, 16(3):265-73)] 인플루엔자에 대한 다른 항체, 예를 들어 Fab28 및 Fab49가 선택될 수 있다. 예를 들어, 참고로 포함된 WO 2010/140114 및 WO 2009/115972를 참조한다. WO 2010/010466, 미국 공개 특허 공개 US/2011/076265 및 WO 2008/156763에 기술된 것과 같은 또 다른 항체가 쉽게 선택될 수 있다.

다른 표적 병원성 바이러스에는 아레나바이러스(후닌, 마추포 및 라사 포함), 필로바이러스(마르버그 및 에볼라 포함), 한타바이러스, 피코르노바이러스과(라이노바이러스, 에코바이러스 포함), 코로나바이러스, 파라믹소바이러스, 모르빌리바이러스, 호흡기 세포융합 바이러스, 토가바이러스, 콕사키바이러스, 파보바이러스 B19, 파라인플루엔자, 아데노바이러스, 리오바이러스, 천연두(중증형(두창)) 및 폭스바이러스 계열의 백시니아(우두) 및 수두-대상포진(가성광견병)이 포함된다. 바이러스성 출혈열은 아레나바이러스 계열(라사열)(이 계열은 림프구성 맥락수막염(LCM)과도 관련이 있음), 필로바이러스(에볼라 바이러스) 및 한타바이러스(퓨레말라)에 의해 발생한다. 피코르나바이러스(라이노바이러스의 아과)의 구성원은 인간의 감기와 관련이 있다. 전염성 기관지염 바이러스(가금류), 돼지 전염성 위장병 바이러스(돼지), 돼지 혈구응집소 뇌척수염 바이러스(돼지), 고양이 전염성 복막염 바이러스(고양이), 고양이 장 코로나바이러스(고양이), 개 코로나바이러스(개)와 같은 다수의 비인간 바이러스를 포함하는 코로나바이러스 계열. 파라믹소바이러스 계열에는 파라인플루엔자 바이러스 1형, 파라인플루엔자 바이러스 3형, 소 파라인플루엔자 바이러스 3형, 루벨라바이러스(볼거리 바이러스, 파라인플루엔자 바이러스 2형, 파라인플루엔자 바이러스 4형, 뉴캐슬병 바이러스(닭), 우역, 홍역 및 개 홍역을 포함하는 모르빌리바이러스 및 호흡기 세포융합 바이러스(RSV)를 포함하는 뉴모바이러스가 포함된다. 파보바이러스 계열에는 고양이 파보바이러스(고양이 장염), 고양이 범백혈구 감소증 바이러스, 개 파보바이러스 및 돼지 파보바이러스가 포함된다. 아데노바이러스 계열에는 호흡기 질환을 일으키는 바이러스(EX, AD7, ARD, O.B.)가 포함된다.

박테리아 병원체에 대한 중화 항체 작제물이 또한 본 발명에서 사용하기 위해 선택될 수 있다. 일 구체예에서, 중화 항체 작제물은 박테리아 자체에 대해 지시된다. 또 다른 구체예에서, 중화 항체 작제물은 박테리아에 의해 생성된 독소에 대해 지시된다. 공기 중 박테리아 병원체의 예는 예를 들어, 나이세리아 수막염(수막염), 클렙시엘라 슈모니아(폐렴), 슈도모나스 애루기노사(폐렴), 슈도모나스 슈도말레이(폐렴), 슈도모나스 말레이(폐렴), 아시네토박터(폐렴), 모락셀라 카타랄리스, 모락셀라 라쿠나타, 알칼리겐, 카디오박테리움, 헤모필루스 인플루엔자(독감), 헤모필루스 파라인플루엔자에, 보르데텔라 퍼투시스(백일해), 프란시셀라 툴라렌시스(폐렴/발열), 레지오넬라 슈모니아(재향군인병), 클라미디아 시타시(폐렴), 클라미디아 슈모니아(폐렴), 마이코박테리움 투베르쿨로시스(결핵(TB)), 마이코박테리움 칸사시(TB), 마이코박테리움 아비움 (폐렴), 노카르디아 아스테로이드(폐렴), 바실러스 안트라시스(탄저균), 스타필로코커스 아우레우스 (폐렴), 스트렙토코커스 표진스(성홍열), 스트렙토코커스 슈모니애(폐렴), 코리네박테리아 디프테리아(디프테리아), 마이코플라즈마 슈모니애(폐렴)을 포함한다. 탄저병의 원인 물질은 바실러스 안트라시스가 생성하는 독소이다. 톡소이드를 형성하는 3개의 펩티드 중 하나인 보호제(PA)에 대한 중화 항체가 기술되었다. 다른 두 폴리펩티드는 치사 인자(LF)와 부종 인자(EF)로 구성된다. 항-PA 중화 항체는 탄저병에 대한 수동 면역화에 효과적인 것으로 기술되었다. 예를 들어 미국 특허 번호 7,442,373; R. Sawada-Hirai 등, J Immune Based Ther Vaccines. 2004; 2: 5를 참조한다. (온라인 2004년 5월 12일). 또 다른 항-탄저 독소 중화 항체가 기술되었고/되거나 생성될 수 있다. 마찬가지로, 다른 박테리아 및/또는 박테리아 독소에 대한 중화 항체를 사용하여 본원에 기술된 비-IgG 항체를 생성할 수 있다.

다른 감염성 질병은 예를 들어, 아스페르길루스 종, 압시디아 코림비페라, 릭퍼스 스톨로니퍼, 무코르 플럼베우스, 크립토코쿠스 네오포르만스, 히스토플라즘 캡슐라텀, 블라스토마이스 더마티티디스, 콕시디오이데스 임미티스, 페니실리움 종, 마이크로폴리스포라 패니, 써모악티노마이세스 불가리스, 알터나리아 알터네이트, 클라도스포리움 종, 헬민토스포리움, 및 스타치보트리스 종을 포함한 공기 중 진균에 의해 발생할 수 있다.

인간에게 영향을 미치는 공기 감염성 질병 상태에 더하여, 그 중 다수는 위에 설명되어 있고, 본 발명에 따른 수동 면역화는 비강의 직접적인 접종과 관련된 상태, 예를 들어 손가락과 비강의 직접적인 접촉에 의해 전염될 수 있는 상태를 예방하기 위해 사용될 수 있다. 이러한 조건에는 진균 감염(예를 들어, 무좀), 백선 또는 바이러스, 박테리아, 기생충, 진균 및 직접 접촉으로 전염될 수 있는 기타 병원체가 포함될 수 있다. 또한, 가정용 애완동물, 소 및 기타 가축 및 기타 동물에 영향을 미치는 다양한 조건. 예를 들어, 개에서 개 부비동 아스페르길루스증에 의한 상기도 감염은 심각한 질병을 유발한다. 고양이의 경우, 코에서 발생하는 상부 호흡기 질환 또는 고양이 호흡기 질환 복합체를 치료하지 않고 방치하면 이환율과 사망을 유발한다. 소는 전염성 소 비기관염(일반적으로 IBR 또는 빨간 코라고 함)에 의해 감염되기 쉽다. 소의 급성 전염성 바이러스 질병이다. 또한 소는 경증에서 중증의 호흡기 질환을 유발하고 다른 질병에 대한 내성을 손상시킬 수 있는 소 호흡기 세포융합 바이러스(BRSV)에 걸리기 쉽다. 또 다른 병원체 및 질병은 당업자에게 자명할 것이다.

본원에서 구체적으로 확인된 것과 같은 병원체에 대한 항체(예를 들어, 항SARS-CoV2, 항SARS-CoV1, 항인플루엔자, 항에볼라, 항RSV), 특히 중화 항체는 클래스 전환 또는 비-IgG 항체를 생성하는 데 사용될 수 있다. 광범위한 중화 능력을 가진 단일 클론 항체(mAb)는 항체 파지 디스플레이를 사용하여 최근에 계절성 독감 백신을 접종한 기증자, 면역이 없는 인간 또는 자연 감염의 생존자로부터 라이브러리를 스크리닝하여 식별할 수 있다. 인플루엔자의 경우, 숙주 세포와의 바이러스 융합을 차단하여 하나 이상의 인플루엔자 아형을 중화시키는 항체가 확인되었다. 이 기술은 중화 단일 클론 항체를 얻기 위해 다른 감염과 함께 활용될 수 있다. 예를 들어, 항호흡기 세포융합 바이러스(RSV) 중화 항체의 생성을 설명하는 US 5,811,524를 참조한다. 본원에 기술된 기술은 다른 병원체에 적용할 수 있다. 이러한 항체는 그대로 사용하거나 인공 또는 재조합 중화 항체 작제물을 생성하기 위해 변형된 이의 서열(스캐폴드)을 사용할 수 있다. 이러한 방법은 [예를 들어, WO 2010/13036; WO 2009/115972; WO 2010/140114]에 설명되어 있다. 일 구체예에서, 마우스, 래트, 햄스터 또는 다른 숙주 동물은 면역화 항원에 대한 결합 특이성을 갖는 항체를 생산하는 림프구를 생성하기 위해 면역화제로 면역화된다. 대안적인 접근법에서, 림프구는 시험관 내에서 면역화될 수 있다. 인간 항체는 파지 디스플레이 라이브러리와 같은 기술을 사용하여 생산할 수 있다(Hoogenboom 및 Winter, J. Mol. Biol, 1991, 227:381, Marks 등, J. Mol. Biol. 1991, 222:581).

조성물 및 용도

적어도 하나의 rAAV 스톡(예를 들어, rAAV9 또는 rAAVhu68 돌연변이 스톡) 및 선택적 담체, 부형제 및/또는 보존제를 함유하는 조성물이 본원에서 제공된다. rAAV 스톡은 예를 들어 농도 및 용량 단위의 논의에서 하기 기술된 양과 같이 동일한 다수의 rAAV 벡터를 지칭한다.

특정 구체예에서, 조성물은 적어도 제2의 상이한 rAAV 스톡을 함유할 수 있다. 이 두 번째 벡터 스톡은 다른 AAV 캡시드 및/또는 다른 벡터 게놈을 가짐으로써 첫 번째 스톡과 다를 수 있다. 특정 구체예에서, 본원에 기재된 바와 같은 조성물은 본원에 기재된 바와 같은 발현 카세트를 발현하는 상이한 벡터 또는 또 다른 활성 성분(예를 들어, 항체 작제물, 또 다른 생물제제 및/또는 소분자 약물)을 함유할 수 있다.

본원에서 사용되는 "담체"는 모든 용매, 분산 매질, 비히클, 코팅, 희석제, 항균제 및 항진균제, 등장성 및 흡수 지연제, 완충액, 담체 용액, 현탁액, 콜로이드 등을 포함한다. 약제학적 활성 물질에 대한 이러한 매질 및 제제의 사용은 당업계에 잘 알려져 있다. 보충 활성 성분이 또한 조성물에 혼입될 수 있다. "약제학적으로 허용되는"이라는 어구는 숙주에 투여될 때 알레르기 반응 또는 이와 유사한 원치 않는 반응을 일으키지 않는 분자 실체 및 조성물을 의미한다. 리포좀, 나노캡슐, 미세입자, 미세구, 지질 입자, 소포 등과 같은 전달 비히클은 본 발명의 조성물을 적합한 숙주 세포로 도입하기 위해 사용될 수 있다. 특히, rAAV 벡터 전달된 이식유전자는 지질 입자, 리포좀, 소포, 나노구 또는 나노입자 등에 캡슐화된 전달을 위해 제형화될 수 있다.

일 구체예에서, 조성물은 대상체에게 전달하기에 적합한 최종 제형을 포함하며, 예를 들어 생리학적으로 적합한 pH 및 염 농도로 완충된 수성 액체 현탁액이다. 선택적으로 하나 이상의 계면활성제가 제형에 존재한다. 다른 구체예에서, 조성물은 대상체에게 투여하기 위해 희석되는 농축물로서 수송될 수 있다. 다른 구체예에서, 조성물은 동결건조되고 투여 시점에 재구성될 수 있다.

적합한 계면활성제 또는 계면활성제의 조합은 비독성인 비이온성 계면활성제 중에서 선택될 수 있다. 일 구체예에서, 1차 히드록실기에서 종결되는 이작용기성 블록 공중합체 계면활성제가 선택되며, 예를 들어 중성 pH를 갖고 8400의 평균 분자량을 갖는 Pluronic® F68[BASF](폴록사머 188로도 알려짐)이 선택된다. 다른 계면활성제 및 다른 폴록사머, 즉 폴리옥시에틸렌(폴리(에틸렌 옥사이드)), SOLUTOL HS 15(마크로골-15 히드록시스테아레이트), LABRASOL(폴리옥시 카프릴릭 글리세라이드), 폴리옥시 10 올레일 에테르, TWEEN(폴리옥시에틸렌 소르비탄 지방산 에스테르), 에탄올 및 폴리에틸렌 글리콜 의 2개의 친수성 사슬이 측접한 폴리옥시프로필렌(폴리(프로필렌 옥사이드))의 중심 소수성 사슬로 구성된 비이온성 삼블록 공중합체가 선택될 수 있다. 일 구체예에서, 제형은 폴록사머를 함유한다. 이러한 공중합체는 일반적으로 문자 "P"(폴록사머의 경우) 뒤에 3자리 숫자로 명명된다. 처음 두 자리 x 100은 폴리옥시프로필렌 코어의 대략적인 분자량을 나타내고 마지막 숫자 x 10은 폴리옥시에틸렌 함량의 백분율을 나타낸다. 일 구체예에서 폴록사머 188이 선택된다. 계면활성제는 현탁액의 약 0.0005% 내지 약 0.001%까지의 양으로 존재할 수 있다.

일 구체예에서, 제형 완충액은 총 염 농도가 200mM, 0.001%(w/v) 플루로닉 F68(최종 제형 완충액, FFB)인 인산염 완충 식염수(PBS)이다.

벡터는 세포를 형질감염시키고 충분한 수준의 유전자 전달 및 발현을 제공하기에 충분한 양으로 투여되어 과도한 역효과 없이 또는 의학적으로 허용되는 생리학적 효과를 갖는 치료적 이점을 제공하며, 이는 의학 분야의 숙련자에 의해 결정될 수 있다. 특정 구체예에서, 벡터는 비강 및/또는 비인두 상피 세포로의 표적 전달을 위한 비강내 전달 장치를 통한 전달을 위해 제형화된다. 특정 구체예에서, 벡터는 에어로졸 전달 장치용으로, 예를 들어 분무기 또는 다른 적합한 장치를 통해 제형화된다. 다른 통상적이고 약제학적으로 허용되는 투여 경로는 원하는 기관(예를 들어, 폐), 경구 흡입, 척수강내, 기관내, 동맥내, 안구내, 정맥내, 근육내, 피하, 피내 및 기타 비경구 투여 경로로의 직접 전달을 포함하지만 이에 제한되지 않는다. 일 구체예에서, 벡터는 비강 점막 분무화 장치(LMA® MAD Nasal™- MAD110)를 사용하여 비강내로 투여된다. 다른 구체예에서 벡터는 Vibrating Mesh Nebulizer(Aerogen® 단독) 또는 MADgic™ Laryngeal Mucosal Atomizer를 사용하여 분무된 형태로 폐내 투여된다. 원하는 경우 투여 경로를 조합할 수 있다. rAAV 벡터를 전달하기 위한 투여 경로 및 이용 경로는 다음의 공개된 미국 특허 출원에도 기술되어 있으며, 각각의 내용은 전문이 본원에 참조로 포함된다: US 2018/0155412A1, US 2018/0243416A1, US 2014/0031418 A1 및 US 2019/0216841A1.

바이러스 벡터의 용량은 주로 치료되는 상태, 환자의 연령, 체중 및 건강과 같은 요인에 따라 달라지므로 환자마다 다를 수 있다. 예를 들어, 바이러스 벡터의 치료학적으로 유효한 인간 투여량은 일반적으로 약 10⁹ 내지 4x10¹⁴ GC의 AAV 벡터를 함유하는 약 25 내지 약 1000 마이크로리터 내지 약 5 mL의 수성 현탁액 범위이다. 투여량은 임의의 부작용에 대한 치료적 이점의 균형을 맞추도록 조정될 것이며 이러한 투여량은 재조합 벡터가 사용되는 치료 적용에 따라 달라질 수 있다. 이식유전자의 발현 수준은 바이러스 벡터, 바람직하게는 미니유전자를 함유하는 AAV 벡터를 초래하는 투여 빈도를 결정하기 위해 모니터링될 수 있다. 선택적으로, 치료 목적을 위해 기술된 것과 유사한 투여 요법이 본 발명의 조성물을 사용하는 면역화에 이용될 수 있다.

복제-결함 바이러스 조성물은 범위 내의 모든 정수 또는 분수, 바람직하게는 인간 환자의 경우 10¹² GC 내지 10¹⁴ GC를 포함하는 약 10⁹ GC 내지 약 10¹⁶ GC(체중 70kg의 평균 대상체를 치료하기 위해)의 범위인 복제-결함 바이러스의 양을 함유하도록 용량 단위로 제형화될 수 있다. 일 구체예에서, 조성물은 범위 내의 모든 정수 또는 분수 양을 포함하여 용량당 적어도 10⁹, 2x10⁹, 3x10⁹, 4x10⁹, 5x10⁹, 6x10⁹, 7x10⁹, 8x10⁹, 또는 9x10⁹GC를 함유하도록 제형화된다. 다른 구체예에서, 조성물은 범위 내의 모든 정수 또는 부분량을 포함하여 용량당 적어도 10¹⁰, 2x10¹⁰,3x10¹⁰, 4x10¹⁰, 5x10¹⁰, 6x10¹⁰, 7x10¹⁰, 8x10¹⁰, 또는 9x10¹⁰ GC를 함유하도록 제형화된다. 다른 구체예에서, 조성물은 범위 내의 모든 정수 또는 부분량을 포함하여 용량당 적어도 10¹¹, 2x10¹¹, 3x10¹¹, 4x10¹¹, 5x10¹¹, 6x10¹¹, 7x10¹¹, 8x10¹¹, 또는 9x10¹¹GC를 함유하도록 제형화된다. 또 다른 구체예에서, 조성물은 범위 내의 모든 정수 또는 부분량을 포함하여 용량당 적어도 10¹², 2x10¹², 3x10¹², 4x10¹², 5x10¹², 6x10¹², 7x10¹², 8x10¹², or 9x10¹² GC를 함유하도록 제형화된다. 다른 구체예에서, 조성물은 범위 내의 모든 정수 또는 부분량을 포함하여 용량당 적어도 10¹³, 2x10¹³, 3x10¹³, 4x10¹³, 5x10¹³, 6x10¹³, 7x10¹³, 8x10¹³, 또는 9x10¹³ GC를 함유하도록 제형화된다. 다른 구체예에서, 조성물은 범위 내의 모든 정수 또는 부분량을 포함하여 용량당 적어도 10¹⁴, 2x10¹⁴,3x10¹⁴, 4x10¹⁴, 5x10¹⁴, 6x10¹⁴, 7x10¹⁴, 8x10¹⁴, 또는 9x10¹⁴ GC를 함유하도록 제형화된다. 다른 구체예에서, 조성물은 범위 내의 모든 정수 또는 부분량을 포함하여 용량당 적어도 10¹⁵, 2x10¹⁵, 3x10¹⁵, 4x10¹⁵, 5x10¹⁵, 6x10¹⁵, 7x10¹⁵, 8x10¹⁵, 또는 9x10¹⁵ GC를 함유하도록 제형화된다. 일 구체예에서, 인간 적용을 위한 용량은 범위 내의 모든 정수 또는 분수 양을 포함하여 용량당 10¹⁰ 내지 약 10¹² GC 범위일 수 있다. 일 구체예에서, 인간 적용을 위한 용량은 범위 내의 모든 정수 또는 소수량을 포함하여 용량당 10⁹ 내지 약 7x10¹³ GC 범위일 수 있다. 일 구체예에서, 인간 적용을 위한 용량 범위는 6.25x10¹² GC 내지 5.00x10¹³ GC이다. 추가 구체예에서, 용량은 약 6.25x10¹² GC, 약 1.25x10¹³ GC, 약 2.50x10¹³ GC, 또는 약 5.00x10¹³ GC이다. 특정 구체예에서, 용량은 절반으로 균등하게 분할되어 각각의 콧구멍에 투여된다. 특정 구체예에서, 인간 적용을 위한 용량 범위는 6.25x10¹² GC 내지 5.00x10¹³ GC이며 각 피험자에게 전달되는 총 부피 0.8ml에 대해 콧구멍당 0.2ml의 2개의 분취량으로 투여된다.

이러한 상기 용량은 약 25 내지 약 1000 마이크로리터 또는 그 이상의 부피 범위의 다양한 부피의 담체, 부형제 또는 완충제 제형으로 투여될 수 있고, 치료할 영역의 크기, 사용된 바이러스 역가, 투여 경로 및 방법의 원하는 효과에 따라 범위 내의 모든 숫자를 포함한다. 일 구체예에서, 담체, 부형제 또는 완충제의 부피는 적어도 약 25μL이다. 일 구체예에서, 부피는 약 50μL이다. 다른 구체예에서, 부피는 약 75μL이다. 다른 구체예에서, 부피는 약 100μL이다. 다른 구체예에서, 부피는 약 125μL이다. 다른 구체예에서, 부피는 약 150μL이다. 또 다른 구체예에서, 부피는 약 175μL이다. 또 다른 구체예에서, 부피는 약 200μL이다. 다른 구체예에서, 부피는 약 225μL이다. 또 다른 구체예에서, 부피는 약 250μL이다. 또 다른 구체예에서, 부피는 약 275μL이다. 또 다른 구체예에서, 부피는 약 300μL이다. 또 다른 구체예에서, 부피는 약 325μL이다. 또 다른 구체예에서, 부피는 약 350μL이다. 다른 구체예에서, 부피는 약 375μL이다. 다른 구체예에서, 부피는 약 400μL이다. 다른 구체예에서, 부피는 약 450μL이다. 다른 구체예에서, 부피는 약 500μL이다. 다른 구체예에서, 부피는 약 550μL이다. 다른 구체예에서, 부피는 약 600μL이다. 또 다른 구체예에서, 부피는 약 650μL이다. 다른 구체예에서, 부피는 약 700μL이다. 다른 구체예에서, 부피는 약 700 내지 1000μL이다.

특정 구체예에서, 재조합 벡터는 각각의 콧구멍에 2개의 스프레이를 사용함으로써 비강내 투여될 수 있다. 일 구체예에서, 2개의 스프레이는 각각의 콧구멍에 교대로, 예를 들어 왼쪽 콧구멍 스프레이, 오른쪽 콧구멍 스프레이, 이어서 왼쪽 콧구멍 스프레이, 오른쪽 콧구멍 스프레이로 투여된다. 특정 구체예에서, 교대 스프레이 사이에 지연이 있을 수 있다. 예를 들어, 각각의 콧구멍은 약 10 내지 60초, 또는 20 내지 40초, 또는 약 30초 내지 몇 분 또는 그 이상의 간격으로 분리된 다수의 스프레이를 수용할 수 있다. 이러한 스프레이는 약 200μL 내지 약 600μL, 400μL 내지 700μL, 또는 450μL 내지 1000μL의 투여된 총 부피를 달성하기 위해 예를 들어 각 스프레이에서 약 150μL 내지 300μL 또는 약 250μL를 전달할 수 있다.

특정 구체예에서, 재조합 AAV 벡터는 투약 후 비강 세척 용액에서 측정될 때 5-20 ng/ml의 이식유전자 발현 산물 농도를 달성하기 위해 비강내로 예를 들어, 벡터 투여 후 1주 내지 4주, 또는 약 2주 후 투약될 수 있다. 이식유전자의 발현 산물의 정량화 방법뿐만 아니라 피험자에서 비강 세척액을 얻는 방법은 통상적이다.

다른 투여 경로(예를 들어, 정맥내 또는 근육내)의 경우 용량 수준은 비강내 전달보다 높을 것이다. 예를 들어, 이러한 현탁액은 약 2.5x10¹⁵ GC까지의 용량을 갖는 약 1mL 내지 약 25mL의 부피 용량일 수 있다.

특정 구체예에서, 비강내 전달 장치는 약 30미크론 내지 약 100미크론 크기의 평균 크기 범위를 갖는 미스트 입자를 전달하는 스페이 분무기를 제공한다. 특정 구체예에서, 평균 크기 범위는 약 10미크론 내지 약 50미크론이다. 적합한 장치는 문헌에 기술되어 있으며 일부는 예를 들어 LMA MAD NASAL™(Teleflex Medical, 아일랜드); Teleflex VaxINator™(Teleflex Medical, 아일랜드); Kurve Technologies의 Controlled Particle Dispersion®(CPD)와 같이 상업적으로 이용 가능하다. 또한 PG Djupesland, Drug Deliv and Transl. Res (2013) 3: 42-62를 참조한다. 특정 구체예에서, 비강 상피 세포를 우선적으로 표적화하고 폐로의 표적화를 최소화하기 위해 입자 크기 및 전달 부피를 제어한다. 다른 구체예에서, 미스트 입자는 폐 세포에 전달하기 위해 약 0.1 마이크론 내지 약 20 마이크론 이하이다. 이러한 더 작은 입자 크기는 비강 상피의 체류를 최소화할 수 있다.

한 장치는 약 16미크론에서 약 22미크론의 평균 직경으로 입자를 분무한다. 미스트는 3.5mm 굴곡성 광섬유 기관지경(Olympus, Melville, NY)의 흡입 채널을 통해 삽입된 기관지 나무에 직접 전달될 수 있다. 다른 적합한 전달 장치는 성대를 지나 상기도를 가로질러 투여하기 위해 제공되는 후두-기관 점막 분무기를 포함할 수 있다. 그것은 성대를 통해 후두 마스크 또는 비강으로 들어간다. 액적은 약 30미크론 내지 약 100미크론의 평균 직경으로 원자화된다. 표준 장치는 팁 직경이 약 0.18인치(4.6mm)이고 길이가 약 4.5-8.5인치이며 흡입 채널을 통해 삽입되고 스코프의 원위 팁을 넘어 약 3mm 전진한다. 용량은 오른쪽 및 왼쪽 주 줄기 기관지에 분무된 식염수 또는 rAAV를 사용하여 대조군의 10 분취량(각각 약 150 μl)으로 투여될 수 있다.

일 구체예에서, 본원에 기술된 바와 같은 완충액 중에 rAAV를 동결 형태로 함유하는 동결 조성물이 제공된다. 임의로, 하나 이상의 계면활성제(예를 들어, 플로로닉 F68), 안정제 또는 방부제가 이 조성물에 존재한다. 적합하게는, 사용을 위해 조성물을 해동하고 적합한 희석제, 예를 들어 멸균 식염수 또는 완충 식염수를 사용하여 원하는 용량으로 적정한다.

일 구체예에서, 모티프 N- x- (T/I/V/A)- (K/R)(서열번호 47)로부터의 하나 이상의 외인성 내피 세포 표적화 펩티드 및 임의의 측접 링커 서열을 포함하는 조성물이 하나 이상의 생리학적으로 적합한 담체, 부형제 및/또는 수성 현탁액 베이스와 함께 제공된다. 이를 인코딩하는 핵산 서열을 포함하는 조성물이 추가로 제공된다. 특정 구체예에서, 표적화 펩티드는 서열번호 40이고 서열번호 54의 핵산 서열 또는 이와 적어도 약 70% 동일한 서열에 의해 인코딩된다. 특정 구체예에서, 표적화 펩티드는 서열번호 38이고 서열번호 50의 핵산 서열 또는 이와 적어도 약 70% 동일한 서열에 의해 인코딩된다. 특정 구체예에서, 표적화 펩티드는 서열번호 46이고 서열번호 56의 핵산 서열 또는 이와 적어도 약 70% 동일한 서열에 의해 인코딩된다. 특정 구체예에서, 표적화 펩티드는 서열번호 43이고 서열번호 52의 핵산 서열, 또는 이와 적어도 약 70% 동일한 서열에 의해 인코딩된다. 특정 구체예에서, 표적화 펩티드는 서열번호 39이고 서열번호 55의 핵산 서열 또는 이와 적어도 약 70% 동일한 서열에 의해 인코딩된다. 특정 구체예에서, 표적화 펩티드는 서열번호 42이고 서열번호 51의 핵산 서열 또는 이와 적어도 약 70% 동일한 서열에 의해 인코딩된다. 특정 구체예에서, 표적화 펩티드는 서열번호 41이고 서열번호 53의 핵산 서열 또는 이와 적어도 약 70% 동일한 서열에 의해 인코딩된다.

다른 구체예에서, 모티프 N- x- (T/I/V/A)- (K/R) (서열번호 47)로부터의 하나 이상의 외인성 뇌 내피 세포 표적화 펩티드를 포함하는 융합 폴리펩티드 또는 단백질이 제공되며, 적어도 하나의 폴리펩티드 또는 단백질을 포함하는 융합 파트너가 제공된다. 이를 인코딩하는 핵산 서열이 추가로 제공된다.

특정 구체예에서, 융합 폴리펩티드 또는 단백질, 또는 융합 폴리펩티드 또는 단백질을 인코딩하는 핵산 서열, 또는 이를 함유하는 나노입자를 포함하는 조성물이 제공된다. 조성물은 생리학적으로 적합한 담체, 부형제 및/또는 수성 현탁액 베이스 중 하나 이상을 추가로 포함할 수 있다.

특정 구체예에서, 융합 폴리펩티드 단백질을 인코딩하는 핵산 서열은 지질 나노입자(LNP)에 캡슐화된다. 본원에서 사용되는 "지질 나노입자" 또는 "나노입자"라는 어구는 하나 이상의 지질(예를 들어, 양이온성 지질, 비양이온성 지질 및 PEG-변성 지질)을 포함하는 전달 비히클을 의미한다. 바람직하게는, 지질 나노입자는 하나 이상의 표적 세포(예를 들어, 간 및/또는 근육)에 하나 이상의 핵산 서열을 전달하도록 제형화된다. 적합한 지질의 예는 예를 들어 포스파티딜 화합물(예를 들어, 포스파티딜글리세롤, 포스파티딜콜린, 포스파티딜세린, 포스파티딜에탄올아민, 스핑고지질, 세레브로시드 및 강글리오시드)을 포함한다. 단독으로 또는 다른 전달 비히클과 함께 폴리머를 전달 비히클로 사용하는 것도 고려된다. 적합한 중합체는 예를 들어 폴리아크릴레이트, 폴리알킬시아노아크릴레이트, 폴리락티드, 폴리락티드-폴리글리콜라이드 공중합체, 폴리카프로락톤, 덱스트란, 알부민, 젤라틴, 알기네이트, 콜라겐, 키토산, 사이클로덱스트린, 덴드리머 및 폴리에틸렌이민을 포함할 수 있다. 일 구체예에서, 전달 비히클은 그 안에 캡슐화된 핵산 서열의 표적 세포로의 형질감염을 용이하게 하는 능력에 기초하여 선택된다. 핵산 서열에 유용한 지질 나노입자는 단백질 생산을 위한 창고로서 작용할 표적 세포로의 이러한 핵산 서열의 전달을 캡슐화 및/또는 향상시키기 위한 양이온성 지질을 포함한다. 본원에서 사용되는 "양이온성 지질"이라는 어구는 생리학적 pH와 같은 선택된 pH에서 알짜 양전하를 갖는 임의의 다수의 지질 종을 의미한다. 고려되는 지질 나노입자는 하나 이상의 양이온성 지질, 비양이온성 지질 및 PEG-변성 지질을 사용하는 다양한 비율의 다성분 지질 혼합물을 포함함으로써 제조될 수 있다. 여러 양이온성 지질이 문헌에 기재되어 있으며, 이들 중 다수는 상업적으로 입수가능하다. 예를 들어 WO2014/089486, US 2018/0353616A1 및 US 8,853,377B2를 참조한다. 특정 구체예에서, LNP 제형은 콜레스테롤, 이온화 지질, 헬퍼 지질, PEG-지질 및 캡슐화된 핵산 서열 주위에 지질 이중층을 형성하는 중합체를 포함하는 일상적인 절차를 사용하여 수행된다(Kowalski 등, 2019, Mol. Ther. 27(4):710-728). 일부 구체예에서, LNP는 헬퍼 지질 DOPE와 함께 양이온성 지질(즉, N-[1-(2,3-디올레오일옥시)프로필]-N,N,N-트리메틸암모늄 클로라이드(DOTMA) 또는 1,2-디올레오일-3-트리메틸암모늄-프로판(DOTAP))을 포함한다. 일부 구체예에서, LNP는 이온화 지질 Dlin-MC3-DMA 이온화 지질, 또는 디케토피페라진계 이온화 지질(cKK-E12)을 포함한다. 일부 구체예에서, 중합체는 폴리에틸렌이민(PEI) 또는 폴리(β-아미노)에스테르(PBAE)를 포함한다. 예를 들어 WO2014/089486, US 2018/0353616A1, US2013/0037977A1, WO2015/074085A1, US9670152B2 및 US 8,853,377B2를 참조한다.

특정 구체예에서, 조성물, 예를 들어, N- x- (T/I/V/A)- (K/R)(서열번호 47) 펩티드 및 선택적 링커 서열, 융합 폴리펩티드 또는 단백질, 또는 나노입자 또는 화학 잔기를 포함하는 접합체가 있는 변형된 캡시드를 갖는 rAAV는 이를 환자에게 치료제를 전달하는 데 유용하다. 특정 구체예에서, 방법은 뇌 내피 세포에 대한 표적 요법을 위한 것이다. 특정 구체예에서, 상기 방법은 MCT8 단백질(예를 들어, UniProt ID No.: P36021) 또는 MCT8을 생체 내에서 발현하는 유전자를 전달함으로써 알란-헌돈-더들리병을 치료하기 위한 것이다. 다른 구체예에서, 상기 방법은 폐에 대한 표적 요법을 위한 것이다. 특정 구체예에서, 전달된 제품은 가용성 Ace2 단백질(예를 들어, hAce2 디코이 또는 hAce2 디코이 융합), 항-SARS 항체, 항-SARS-CoV2 항체, 항-인플루엔자 항체 또는 낭포성 섬유증 막관통 단백질이다. 또한 omim.org/entry/300523을 참조하며, 그 내용은 본원에 참조로 포함되어 있다. 또한, 본원에 참조로 포함된 2021년 1월 29일에 출원된 미국 가출원 번호 63/143,614, 2021년 3월 12일에 출원된 미국 가출원 번호 63/16 5 0,511 및 2021년 3월 26일에 출원된 미국 특허 출원 번호 63/166,686, 2021년 6월 25일에 출원된 미국 가출원 번호 63/215,159, 2021년 10월 8일에 출원된 미국 가출원 번호 63/253,654를 참조한다.

특정 구체예에서, 본원에 기재된 바와 같은 변형된 캡시드를 갖는 rAAV는 하나 이상의 다른 활성 성분을 추가로 포함하는 공동-치료 요법으로 전달될 수 있다. 특정 구체예에서, 요법은 면역조절 요소의 공동-투여를 수반할 수 있다. 이러한 면역조절 요법은 예를 들어 글루코코르티코이드, 스테로이드, 항대사물질, T-세포 억제제, 마크로라이드(예를 들어, 라파마이신 또는 라파로그), 및 알킬화제, 항대사물질, 세포독성 항생제, 항체 또는 면역필린 활성 작용제를 포함하는 세포증식억제제와 같은 면역억제제를 포함할 수 있지만 이에 제한되지 않는다. 면역억제제는 질소 머스타드, 니트로소우레아, 백금 화합물, 메토트렉세이트, 아자티오프린, 머캅토퓨린, 플루오로우라실, 닥티노마이신, 안트라사이클린, 미토마이신 C, 블레오마이신, 미트라마이신, IL-2 수용체-(CD25-) 또는 CD3-지시 항체, 항-IL-2 항체, 사이클로스포린, 타크로리무스, 시롤리무스, IFN-β, IFN-γ, 오피오이드 또는 TNF-α(종양 괴사 인자-알파) 결합제를 포함할 수 있다. 특정 구체예에서, 면역억제 요법은 유전자 요법 투여 전에 시작될 수 있다. 이러한 요법은 같은 날에 2개 이상의 약물(예를 들어, 프레드넬리손, 미코페놀레이트 모페틸(MMF) 및/또는 시롤리무스(즉, 라파마이신))의 병용 투여를 포함할 수 있다. 이러한 약물 중 하나 이상은 유전자 요법 투여 후 동일한 용량 또는 조정된 용량으로 계속 사용할 수 있다. 이러한 요법은 필요에 따라 약 1주, 약 15일, 약 30일, 약 45일, 60일 또는 그 이상 동안 있을 수 있다. 또 다른 공동-치료제는 예를 들어 항-AAV 항체를 고갈시키는 데 유용한 것으로 기술된 항-IgG 효소(따라서 선택된 AAV 캡시드에 대한 항체의 역치 수준 이상으로 시험하는 환자에게 투여를 허용할 수 있음), 및/또는 예를 들어, "Compositions and Methods for Treatment of Gene Therapy Patients"라는 제목으로 2020년 6월 17일에 출원된 미국 가출원 번호 63/040,381에 기재된 항-FcRN 항체의 전달, 및/또는 a) 스테로이드 또는 스테로이드의 조합 및/또는 (b) IgG 절단 효소, (c) Fc-IgE 결합 억제제; (d) Fc-IgM 결합 억제제; (e) Fc-IgA 결합 억제제; 및/또는 (f) 감마 인터페론을 포함할 수 있다.

항체 "Fc 영역"은 세포 표면 수용체(Fc 수용체)와 상호작용하는 항체 영역인 결정성 단편을 의미한다. 일 구체예에서, Fc 영역은 인간 IgG1 Fc이다. 일 구체예에서, Fc 영역은 인간 IgG2 Fc이다. 일 구체예에서, Fc 영역은 인간 IgG4 Fc이다. 일 구체예에서, Fc 영역은 조작된 Fc 단편이다. 예를 들어, Lobner, Elisabeth, 등 "Engineered IgG1-Fc-one fragment to bind them all." Immunological reviews 270.1 (2016): 113-131; Saxena, Abhishek, 및 Donghui Wu. "Advances in therapeutic Fc engineering-modulation of IgG-Associated effector functions and serum half-life." Frontiers in immunology 7 (2016); Irani, Vashti, 등 "Molecular properties of human IgG subclasses and their implications for designing therapeutic monoclonal antibodies against infectious diseases." Molecular immunology 67.2 (2015): 171-182; Rath, Timo, 등 "Fc-fusion proteins and FcRn: structural insights for longer-lasting and more effective therapeutics." Critical reviews in biotechnology 35.2 (2015): 235-254; 및 Invivogen, IgG-Fc Engineering For Therapeutic Use, invivogen.com/docs/Insight200605.pdf, April 2006를 참조하며, 이들 각각은 본 명세서에 참조로 포함된다.

항체 "힌지 영역"은 이황화 결합에 의해 이들 두 사슬을 연결하는 IgG 및 IgA 면역글로불린 클래스의 중쇄의 유연한 아미노산 부분이다.

"면역글로불린 분자"는 함께 공유 결합되고 항원과 특이적으로 결합할 수 있는 면역글로불린 중쇄 및 면역글로불린 경쇄의 면역학적 활성 부분을 함유하는 단백질이다. 면역글로불린 분자는 모든 유형(예를 들어, IgG, IgE, IgM, IgD, IgA 및 IgY), 클래스(예를 들어, IgG1, IgG2, IgG3, IgG4, IgA1 및 IgA2) 또는 하위 클래스이다. 용어 "항체" 및 "면역글로불린"은 본원에서 상호교환적으로 사용될 수 있다.

"면역글로불린 중쇄"는 면역글로불린의 항원 결합 도메인의 적어도 일부 및 면역글로불린 중쇄의 가변 영역의 적어도 일부 또는 면역글로불린 중쇄의 불변 영역의 적어도 일부를 포함하는 폴리펩티드이다. 따라서, 면역글로불린 유래 중쇄는 면역글로불린 유전자 슈퍼패밀리의 구성원과 아미노산 서열 상동성의 상당한 영역을 갖는다. 예를 들어, Fab 단편의 중쇄는 면역글로불린 유래 중쇄이다.

"면역글로불린 경쇄"는 면역글로불린의 항원 결합 도메인의 적어도 일부 및 면역글로불린 경쇄의 가변 영역의 적어도 일부 또는 불변 영역의 적어도 일부를 포함하는 폴리펩티드이다. 따라서, 면역글로불린 유래 경쇄는 면역글로불린 유전자 슈퍼패밀리의 구성원과 아미노산 상동성의 상당한 영역을 갖는다.

"중화 항체 역가"(NAb 역가)는 표적화된 에피토프(예를 들어, AAV)의 생리학적 효과를 중화시키는 중화 항체(예를 들어, 항-AAV NAb)가 생성되는 양의 측정치이다. 항-AAV NAb 역가는 예를 들어 Calcedo, R., 등, Worldwide Epidemiology of Neutralizing Antibodies to Adeno-Associated Viruses. Journal of Infectious Diseases, 2009, 199 (3): p. 381-390에 기재된 바와 같이 측정될 수 있으며, 본원에 참조로 포함된다.

본원에 사용된 바와 같이, vp 단백질의 "하위 집단"은 달리 명시되지 않는 한, 적어도 하나의 공통된 정의된 특징을 갖고 적어도 하나의 군 구성원 내지 참조 군의 모든 구성원 미만으로 구성되는 vp 단백질 그룹을 지칭한다. 예를 들어, vp1 단백질의 "하위 집단"은 달리 명시되지 않는 한 적어도 하나(1)의 vp1 단백질이고 조립된 AAV 캡시드의 모든 vp1 단백질보다 적다. 달리 명시되지 않는 한, vp3 단백질의 "하위 집단"은 하나(1)의 vp3 단백질 내지 조립된 AAV 캡시드의 모든 vp3 단백질 미만일 수 있다. 예를 들어, vp1 단백질은 vp 단백질의 하위 집단일 수 있고; vp2 단백질은 vp 단백질의 별도 하위 집단일 수 있으며; vp3은 조립된 AAV 캡시드에서 vp 단백질의 추가 하위 집단이다. 또 다른 예에서, vp1, vp2 및 vp3 단백질은 예를 들어 아스파라긴-글리신 쌍에서 예를 들어 적어도 1, 2, 3 또는 4개의 고도로 탈아미노화된 아스파라긴과 같이 상이한 변형을 갖는 하위 집단을 함유할 수 있다. 달리 명시되지 않는 한, 고도로 탈아미드화된 것은 참조 아미노산 위치에서 예측된 아미노산 서열과 비교하여 참조 아미노산 위치에서 최소 45% 탈아미드화, 최소 50% 탈아미드화, 최소 60% 탈아미드화, 최소 65% 탈아미드화, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상, 97%, 99%, 최대 약 100% 탈아미드화를 의미한다. 이러한 백분율은 2D-겔, 질량 분석 기술 또는 기타 적합한 기술을 사용하여 결정될 수 있다.

본원에서 사용되는 바와 같이, rAAV의 "스톡"은 rAAV의 집단을 의미한다. 탈아미드화로 인한 캡시드 단백질의 이질성에도 불구하고 스톡의 rAAV는 동일한 벡터 게놈을 공유할 것으로 예상된다. 스톡은 예를 들어 선택된 AAV 캡시드 단백질 및 선택된 생산 시스템의 특징적인 이종 탈아미드화 패턴을 갖는 캡시드를 갖는 rAAV를 포함할 수 있다. 재고는 단일 생산 시스템에서 생산되거나 생산 시스템의 여러 실행에서 풀링될 수 있다. 본원에 설명된 것을 포함하지만 이에 제한되지 않는 다양한 생산 시스템이 선택될 수 있다. 예를 들어, AAV9에 대한 탈아미드화 패턴을 제공하는 표 G를 포함하는 2019년 9월 6일에 공개된 WO 2019/168961 및 2018년 9월 7일에 출원된 WO 2020/160582를 참조한다. 또한, 예를 들어, 2020년 11월 5일에 공개된 WO 2020/223231(rh91, 탈아미드화 패턴을 갖는 표 포함), 2020년 8월 14일에 출원된 미국 가출원 특허 출원 번호 63/065,616 및 2020년 11월 4일에 출원된 미국 가출원 특허 출원 번호 63/109,734 및 2021년 8월 13일에 출원된 국제 특허 출원 번호 PCT/US21/45945를 참조하고, 이들은 모두 그 전문이 본원에 참조로 포함된다.

약어 "sc"는 자체 보완을 나타낸다. "자가-상보적 AAV"는 재조합 AAV 핵산 서열에 의해 운반되는 코딩 영역이 분자내 이중 가닥 DNA 주형을 형성하도록 디자인된 작제물을 지칭한다. 감염 시 두 번째 가닥의 세포 매개 합성을 기다리지 않고 scAAV의 상보적인 두 반쪽이 결합하여 즉각적인 복제 및 전사 준비가 된 하나의 이중 가닥 DNA(dsDNA) 단위를 형성한다. 예를 들어, D M McCarty 등, "Self-complementary recombinant adeno-associated virus (scAAV) vectors promote efficient transduction independently of DNA synthesis", Gene Therapy, (August 2001), Vol 8, Number 16, Pages 1248-1254를 참조한다. 자기-상보적 AAV는 예를 들어 미국 특허 번호 6,596,535; 7,125,717; 및 7,456,683에 기술되어 있으며, 이들 각각은 그 전문이 본 명세서에 참조로 포함된다.

본원에서 사용되는 바와 같이, "작동가능하게 연결된"이라는 용어는 관심 유전자와 인접한 발현 제어 서열 및 관심 유전자를 제어하기 위해 트랜스로 또는 일정 거리에서 작용하는 발현 제어 서열 모두를 의미한다.

단백질 또는 핵산과 관련하여 사용되는 용어 "이종"은 단백질 또는 핵산이 자연에서 서로 동일한 관계로 발견되지 않는 2개 이상의 서열 또는 하위 서열을 포함함을 나타낸다. 예를 들어, 핵산은 일반적으로 새로운 기능적 핵산을 만들기 위해 배열된 관련 없는 유전자의 2개 이상의 서열을 갖는 재조합 방식으로 생산된다. 예를 들어, 일 구체예에서, 핵산은 상이한 유전자로부터의 코딩 서열의 발현을 지시하도록 배열된 하나의 유전자로부터의 프로모터를 갖는다. 따라서, 코딩 서열과 관련하여 프로모터는 이종이다.

"복제 결함 바이러스" 또는 "바이러스 벡터"는 관심 있는 유전자를 포함하는 발현 카세트가 바이러스 캡시드 또는 막에 패키징된 합성 또는 인공 바이러스 입자를 의미하며, 바이러스 캡시드 또는 막 내에 패키징된 임의의 바이러스 게놈 서열이 복제 결핍인 경우; 즉, 그들은 자손 비리온을 생성할 수 없지만 표적 세포를 감염시키는 능력을 유지한다. 일 구체예에서, 바이러스 벡터의 게놈은 복제에 필요한 효소를 코딩하는 유전자를 포함하지 않지만(게놈은 인공 게놈의 증폭 및 패키징에 필요한 신호가 측접한 관심 이식유전자만 포함하는 "무감각"으로 조작될 수 있다), 이러한 유전자는 생산 중에 공급될 수 있다. 따라서 복제에 필요한 바이러스 효소가 있는 경우를 제외하고 자손 비리온에 의한 복제 및 감염이 발생할 수 없기 때문에 유전자 치료에 사용하기에 안전한 것으로 간주된다.

"재조합 AAV" 또는 "rAAV"는 AAV 캡시드 및 AAV 캡시드 내에 패키징된 적어도 비-AAV 코딩 서열을 포함하는 벡터 게놈의 2개 요소를 함유하는 DNAse-내성 바이러스 입자이다. 특정 구체예에서, 캡시드는 자가 조립하여 캡시드를 형성하는 vp1 단백질, vp2 단백질 및 vp3 단백질로 구성된 약 60개의 단백질을 함유한다. 달리 명시되지 않는 한, "재조합 AAV" 또는 "rAAV"는 구 "rAAV 벡터"와 상호교환적으로 사용될 수 있다. rAAV는 기능적 AAV rep 유전자 또는 기능적 AAV cap 유전자가 결여되어 자손을 생성할 수 없기 때문에 "복제 결함 바이러스" 또는 "바이러스 벡터"이다. 특정 구체예에서, 유일한 AAV 서열은 AAV 역위 말단 반복 서열(ITR)이고, 일반적으로 벡터 게놈의 극단 5' 및 3' 말단에 위치하여 ITR 사이에 위치한 유전자 및 조절 서열이 AAV 캡시드 내에 패키징되도록 한다.

"뉴클레아제 저항성"이라는 용어는 AAV 캡시드가 이식유전자를 숙주 세포에 전달하도록 설계되었으며 생산 공정에서 존재할 수 있는 오염 핵산을 제거하도록 설계된 뉴클레아제 인큐베이션 단계 동안 분해(소화)로부터 이러한 포장된 게놈 서열을 보호하는 발현 카세트 주위에 조립되었음을 나타낸다.

본원에서 사용되는 "벡터 게놈"은 바이러스 입자를 형성하는 파보바이러스(예를 들어, rAAV) 캡시드 내부에 패키징된 핵산 서열을 의미한다. 그러한 핵산 서열은 AAV 역위 말단 반복 서열(ITR)을 함유한다. 본 명세서의 예에서, 벡터 게놈은 최소한 5'에서 3'까지 AAV 5' ITR, 코딩 서열(즉, 이식유전자) 및 AAV 3' ITR을 함유한다. AAV2로부터의 ITR, 캡시드와 다른 소스 AAV 또는 전체 길이 ITR 이외의 것이 선택될 수 있다. 특정 구체예에서, ITR은 생성 동안 rep 기능을 제공하는 AAV 또는 트랜스보완 AAV와 동일한 AAV 소스로부터 유래한다. 또한, 다른 ITR, 예를 들어 자가-상보적(scAAV) ITR이 사용될 수 있다. 단일 가닥 AAV 및 자체 보완(sc) AAV는 모두 rAAV에 포함된다. 이식유전자는 폴리펩티드, 단백질, 기능적 RNA 분자(예를 들어, miRNA, miRNA 억제제) 또는 기타 관심 유전자 산물을 인코딩하는 벡터 서열과 이종인 핵산 코딩 서열이다. 핵산 코딩 서열은 표적 조직의 세포에서 이식유전자 전사, 번역 및/또는 발현을 허용하는 방식으로 조절 구성요소에 작동가능하게 연결된다. 벡터 게놈의 적합한 구성요소는 본 명세서에서 보다 상세히 논의된다. 일 예에서, "벡터 게놈"은 최소한 5'에서 3'까지 벡터 특이적 서열, 조절 제어 서열에 작동 가능하게 연결된 관심 단백질을 인코딩하는 핵산 서열을 포함하고(표적 세포에서 발현을 지시함), 여기서 벡터 특이적 서열은 벡터 게놈을 바이러스 벡터 캡시드 또는 외피 단백질로 특이적으로 패키징하는 말단 반복 서열일 수 있다. 예를 들어, AAV 반전 말단 반복은 AAV 및 특정 기타 파보바이러스 캡시드로 패키징하는 데 사용된다.

본원에서 사용되는 바와 같이, "작동가능하게 연결된" 서열은 관심 유전자와 인접하는 발현 제어 서열 및 관심 유전자를 제어하기 위해 트랜스로 또는 일정 거리에서 작용하는 발현 제어 서열 모두를 포함한다.

특정 구체예에서, rAAV의 제조에 사용되는 비-바이러스 유전 요소는 벡터(예를 들어, 생산 벡터)로 지칭될 것이다. 특정 구체예에서, 이들 벡터는 플라스미드이지만, 다른 적합한 유전 요소의 사용이 고려된다. 이러한 생산 플라스미드는 rAAV 생산 동안 발현되는 서열, 예를 들어 rAAV로 패키징되지 않는 rAAV의 생산에 필요한 AAV 캡시드 또는 rep 단백질을 인코딩할 수 있다. 대안적으로, 그러한 생성 플라스미드는 rAAV에 패키징되는 벡터 게놈을 운반할 수 있다.

본원에서 사용되는 "모체 캡시드"는 파보바이러스 또는 기타 바이러스(예를 들어, AAV, 아데노바이러스, HSV, RSV 등)로부터 선택되는 비돌연변이 또는 비변형 캡시드를 의미한다. 특정 구체예에서, 모 캡시드는 캡시드 단백질(즉, vp 단백질)을 인코딩하는 야생형 게놈을 포함하는 임의의 자연 발생 AAV 캡시드를 포함하며, 상기 캡시드 단백질은 AAV 형질도입 및/또는 조직 특이적 향성을 지시한다. 일부 구체예에서, 모 캡시드는 본래 CNS를 표적으로 하는 AAV로부터 선택된다. 다른 구체예에서, 모 캡시드는 본래 CNS를 표적화하지 않는 AAV로부터 선택된다.

본원에서 사용된 "변이체 캡시드" 또는 "변이체 AAV" 또는 "변체 AAV 캡시드"는 변형된 캡시드 또는 돌연변이된 캡시드를 지칭하며, 상기 캡시드 단백질은 조직-특이적 표적화 펩티드의 삽입을 포함한다.

본원에서 사용되는 바와 같이, "발현 카세트"는 생물학적으로 유용한 핵산 서열(예를 들어, 단백질, 효소 또는 기타 유용한 유전자 산물, mRNA 등을 인코딩하는 유전자 cDNA) 및 작동 가능하게 연결된 조절 서열을 포함하는 핵산 분자를 의미한다. 핵산 서열 및 이의 유전자 산물의 전사, 번역 및/또는 발현을 지시하거나 조절한다. 본원에서 사용되는 바와 같이, "작동가능하게 연결된" 서열은 핵산 서열과 인접하거나 비연속적인 조절 서열 및 트랜스 또는 시스 핵산 서열에서 작용하는 조절 서열을 모두 포함한다. 이러한 조절 서열은 전형적으로 예를 들어 프로모터, 인핸서, 인트론, 코작 서열, 폴리아데닐화 서열 및 TATA 신호 중 하나 이상을 포함한다. 발현 카세트는 유전자 서열의 상류(5'에서) 조절 서열, 예를 들어 하나 이상의 프로모터, 인핸서, 인트론 등, 및 하나 이상의 인핸서, 또는 유전자 서열 하류(3'에서) 조절 서열, 예를 들어 다른 요소 중에서 폴리아데닐화 부위를 포함하는 3' 비번역 영역(3' UTR)을 포함할 수 있다. 특정 구체예에서, 조절 서열은 유전자 산물의 핵산 서열에 작동가능하게 연결되며, 여기서 조절 서열은 개재 핵산 서열, 즉 5'-비번역 영역(5' UTR)에 의해 유전자 산물의 핵산 서열로부터 분리된다. 특정 구체예에서, 발현 카세트는 하나 이상의 유전자 산물의 핵산 서열을 포함한다. 일부 구체예에서, 발현 카세트는 모노시스트론 또는 바이시스트론 발현 카세트일 수 있다. 다른 구체예에서, 용어 "이식유전자"는 표적 세포에 삽입되는 외인성 공급원으로부터의 하나 이상의 DNA 서열을 의미한다.

본 발명의 맥락에서 용어 "번역"은 리보솜에서의 과정에 관한 것이며, 상기 mRNA 가닥은 아미노산 서열의 조립을 제어하여 단백질 또는 펩티드를 생성한다.

용어 "발현"은 본원에서 가장 넓은 의미로 사용되며 RNA 또는 RNA 및 단백질의 생성을 포함한다. 발현은 일시적이거나 안정적일 수 있다.

핵산 또는 이의 단편을 언급할 때 "실질적인 상동성" 또는 "실질적인 유사성"이라는 용어는 다른 핵산(또는 이의 상보적 가닥)과의 적절한 뉴클레오티드 삽입 또는 결실로 최적으로 정렬될 때, 정렬된 서열의 적어도 약 95 내지 99%에서 뉴클레오티드 서열 동일성이 존재함을 나타낸다. 바람직하게는, 상동성은 전체 길이 서열, 또는 이의 오픈 리딩 프레임, 또는 길이가 적어도 15개 뉴클레오티드인 또 다른 적합한 단편에 걸쳐 있다. 적합한 단편의 예는 본원에 기술되어 있다.

핵산 서열과 관련하여 용어 "서열 동일성" "서열 동일성 백분율" 또는 "동일성 비율"은 최대 일치를 위해 정렬될 때 동일한 두 서열의 잔기를 의미한다. 서열 동일성 비교의 길이는 게놈의 전장, 유전자 코딩 서열의 전장, 또는 적어도 약 500 내지 5000개 뉴클레오티드의 단편일 수 있다. 그러나, 예를 들어, 적어도 약 9개의 뉴클레오티드, 일반적으로 적어도 약 20 내지 24개의 뉴클레오티드, 적어도 약 28 내지 32개의 뉴클레오티드, 적어도 약 36개 이상의 뉴클레오티드의 더 작은 단편들 사이의 동일성이 또한 바람직할 수 있다. 유사하게, "퍼센트 서열 동일성"은 단백질 또는 이의 단편의 전체 길이에 걸쳐 아미노산 서열에 대해 쉽게 결정될 수 있다. 적합하게는, 단편은 적어도 약 8개의 아미노산 길이이고 최대 약 700개의 아미노산일 수 있다. 적합한 단편의 예는 본원에 기술되어 있다.

아미노산 또는 이의 단편을 언급할 때 용어 "실질적인 상동성" 또는 "실질적인 유사성"은 다른 아미노산(또는 이의 상보적 가닥)과 적절한 아미노산 삽입 또는 결실로 최적으로 정렬될 때, 정렬된 서열의 적어도 약 95 내지 99%에서 아미노산 서열 동일성이 존재함을 의미한다. 바람직하게는, 상동성은 예를 들어, 면역글로불린 영역 또는 도메인, AAV 캡 단백질, 또는 적어도 8개 아미노산, 또는 더 바람직하게는 적어도 15개 아미노산 길이인 이의 단편과 같은 전장 서열, 또는 이의 단백질에 걸쳐 있다. 적합한 단편의 예는 본원에 기술되어 있다.

용어 "고도로 보존된"은 적어도 80% 동일성, 바람직하게는 적어도 90% 동일성, 보다 바람직하게는 97% 이상의 동일성을 의미한다. 동일성은 당업자에게 공지된 알고리즘 및 컴퓨터 프로그램에 의지하여 당업자에 의해 쉽게 결정된다.

일반적으로, 2개의 상이한 아데노 관련 바이러스 간의 "동일성", "상동성" 또는 "유사성"을 언급할 때 "동일성", "상동성" 또는 "유사성"은 "정렬된" 서열을 참조하여 결정된다. "정렬된" 서열 또는 "정렬"은 종종 참조 서열과 비교하여 누락되거나 추가된 염기 또는 아미노산에 대한 수정을 포함하는 다수의 핵산 서열 또는 단백질(아미노산) 서열을 지칭한다. 정렬은 공개적으로 또는 상업적으로 이용 가능한 다양한 다중 서열 정렬 프로그램을 사용하여 수행된다. 이러한 프로그램의 예로는 인터넷의 웹 서버를 통해 액세스할 수 있는 "Clustal Omega", "Clustal W", "CAP Sequence Assembly", "MAP" 및 "MEME"가 있다. 그러한 프로그램에 대한 다른 소스는 당업자에게 알려져 있다. 또는 Vector NTI 유틸리티도 사용된다. 또한, 전술한 프로그램에 포함된 것을 포함하여 뉴클레오티드 서열 동일성을 측정하기 위해 사용될 수 있는 당업계에 공지된 다수의 알고리즘이 있다. 또 다른 예로서, 폴리뉴클레오티드 서열은 Fasta™를 사용하여 비교할 수 있으며, GCG 버전 6.1. Fasta™의 프로그램은 질의와 검색 서열 사이에서 가장 잘 겹치는 영역의 정렬 및 퍼센트 서열 동일성을 제공한다. 예를 들어, GCG 버전 6.1(본원에 참조로 포함됨)에 제공된 기본 매개변수(단어 크기 6 및 스코어링 매트릭스에 대한 NOPAM 인자)와 함께 Fasta™를 사용하여 핵산 서열 사이의 서열 동일성 백분율을 결정할 수 있다. "Clustal Omega", "Clustal X", "MAP", "PIMA", "MSA", "BLOCKMAKER", "MEME" 및 "Match-Box" 프로그램과 같은 아미노산 서열에 대해 여러 서열 정렬 프로그램도 사용할 수 있다. 일반적으로 이러한 프로그램은 기본 설정으로 사용되지만 당업자는 필요에 따라 이러한 설정을 변경할 수 있다. 대안적으로, 당업자는 참조된 알고리즘 및 프로그램에 의해 제공되는 것과 같은 수준의 동일성 또는 정렬을 제공하는 다른 알고리즘 또는 컴퓨터 프로그램을 이용할 수 있다. 예를 들어, J. D. Thomson 등, Nucl. Acids. Res., “comprehensive comparison of multiple sequence alignments”27(13):2682-2690 (1999)을 참조한다.

유효량은 인간 환자가 아닌 동물 모델을 기준으로 결정될 수 있다.

전술한 바와 같이 수치를 수식하는 데 사용되는 용어 "약"은 달리 명시되지 않는 한 주어진 기준으로부터 ±10%(±10%, 예를 들어, ±1, ±2, ±3, ±4, ±5, ±6, ±7, ±8, ±9, ±10 또는 그 사이의 값)의 변동을 의미한다.

특정 경우에 "E+#" 또는 "e+#"라는 용어는 지수를 참조하는 데 사용된다. 예를 들어, "5E10" 또는 "5e10"은 5 x 10¹⁰이다. 이 용어는 같은 의미로 사용할 수 있다.

본 명세서 및 청구범위 전반에 걸쳐 사용된 바와 같이, 용어 "포함하다" 및 "포함하다" 및 "포함하다", "포함하다", "함유하다" 및 "함유하는"을 포함하는 그의 변형은 다른 구성요소, 요소, 정수, 단계 등을 포함한다. "이루어진" 또는 "구성된"이라는 용어는 다른 구성 요소, 요소, 정수, 단계 등을 배제한다.

용어 "a" 또는 "an"은 하나 이상, 예를 들어 "인핸서"를 의미하며 하나 이상의 인핸서를 나타내는 것으로 이해된다는 점에 유의해야 한다. 이와 같이, 용어 "a"(또는 "an"), "하나 이상" 및 "적어도 하나"는 본 명세서에서 상호교환적으로 사용된다.

이들 발명의 설명과 관련하여, 본 명세서에 기술된 각각의 조성물은 본 발명의 방법에서 또 다른 구체예에서 유용한 것으로 의도된다. 또한, 방법에 유용한 것으로 본 명세서에 기술된 각각의 조성물은 또 다른 구체예에서 그 자체가 본 발명의 구체예인 것으로 의도된다.

본 명세서에서 달리 정의되지 않는 한, 본 명세서에서 사용된 기술 및 과학 용어는 본 발명이 속하는 기술 분야의 통상의 기술자에 의해 공개된 텍스트를 참조하여 일반적으로 이해되는 것과 동일한 의미를 가지며, 이는 본 출원에서 사용되는 많은 용어에 대한 일반적인 가이드를 당업자에게 제공한다.

실험예

하기 실험예는 예시일 뿐이며 본 명세서에 기술된 발명을 제한하지 않는다.

실험예 1. 1차 스크린

AAV 캡시드 표면의 유연한 루프에 작은 펩티드 삽입이 새로운 세포 수용체와의 상호작용을 매개할 수 있는 것으로 나타났다. CalTech(AAV9-PHP.B)에서 발견된 한 사례에서는 AAV9의 HVR8 루프에 삽입된 7개의 아미노산 펩티드가 일부 마우스 계통의 뇌 맥관 구조에 있는 GPI 고정 수용체인 Ly6a와의 상호작용을 매개한다. 이 상호작용은 혈액-뇌 장벽(BBB)을 가로질러 AAV9-PHP.B의 수송을 유도하여 AAV9보다 ~50배 더 높은 뇌 세포의 전달을 초래한다. 이 작업에서 본 발명자는 BBB의 세포막 표적에 결합하여 BBB를 가로질러 AAV9 캡시드를 구동할 수 있는 펩티드 삽입물을 검색한다.

본 발명자는 먼저 뇌의 혈관 세포와 상호 작용할 가능성이 있는 펩티드 서열에 대한 이용 가능한 학술 및 특허 문헌을 조사하여 AAV-BBB 문제를 해결하고자 하였다. 본 발명자는 이러한 펩티드의 다음 소스를 찾았다.

· 파지 디스플레이 라이브러리가 일차 뇌 내피 세포에 대해 패닝된 파지 디스플레이 실험의 발표된 결과;

· 알려진 BBB 상주 막 단백질에 대한 천연 리간드 펩티드;

· BBB 상주 막 단백질을 표적으로 하는 항체의 CDR;

· 뇌염을 유발하는 플라비바이러스의 바이러스 외피 단백질; 및

· GPI 앵커리지에서 세포 결합 활동을 하는 세균성 독소.

본 발명자는 HVR8 유전자좌(위치 588과 589 사이, 서열번호 44의 AAV9 캡시드의 아미노산 서열의 넘버링에 기초함)에 개별적으로 삽입된 이들 공급원으로부터의 수백 개의 펩티드를 포함하는 AAV9 삽입 돌연변이 라이브러리를 생성하였다. 각 펩티드는 일반적으로 라이브러리에 1) 삽입된 펩티드의 길이, 2) 펩티드 양쪽에 유연한 GSG 또는 GG 링커 서열의 존재가 다른 여러 형태로 존재하였다. 펩티드는 또한 다중 동의 코돈을 사용하여 인코딩되어 화면에서 복제 활동을 독립적으로 관찰할 수 있다.

또한, 본 발명자는 AAVhu68 캡시드의 HVR8에서 혈액-뇌 장벽(BBB) 수용체를 표적으로 하는 알려진 또는 의심되는 리간드 펩티드(서열번호 45의 AAVhu68의 아미노산 서열의 넘버링을 기준으로 위치 588과 589 사이)를 사용하여 삽입 변이체 라이브러리를 생성하였다. 이는 다음과 같다:

· 포유류 뇌 내피에 결합하는 펩티드(파지 디스플레이 데이터 공개);

· 고전적인 RMT 수용체 리간드(예를 들어, Tf);

· RMT 수용체에 대한 mAb의 CDR(예를 들어, 항-TfR); 및

· 뇌염을 일으키는 플라비바이러스의 외피 단백질.

대조군으로서 PHP.B 펩티드도 포함되었다(C57/BL6에 대한 양성 대조군 및 Balb/c & NHP에 대한 음성 대조군). 각 펩티드는 여러 방식으로(링커가 있거나 없거나, 여러 동의 DNA 서열에서) 인코딩되었다.

본 발명자는 이 라이브러리를 고용량 정맥 주사(IV)로 2마리의 마우스 변종과 1마리의 비인간 영장류에 주입하였다. 2-3주의 수명 기간 후, 동물을 부검하고 조직을 수집하였다. 본 발명자는 CNS 및 기타 조직에서 AAV 벡터의 DNA 게놈을 추출하고 이를 차세대 시퀀싱(NGS)에 적용하였다. 벡터 변이체는 자신의 캡시드 유전자 변이체를 캡슐화하여 관심 있는 조직에서 캡시드 유전자 변이체의 상대적 풍부함을 통해 캡시드 활동을 추적할 수 있다. 본 발명자는 주입된 라이브러리 혼합물의 풍부함으로 정규화된 CNS의 풍부함을 계산하여 라이브러리의 각 변형의 BBB 활동("농축 점수")을 기록하였다.

마우스 연구에서, C57/BL6 마우스에서 상부 뇌 강화 HVR8 삽입은 다음과 같다: TLAVPFK(SEQ ID NO: 49)(PHP.B), 양성 대조군 PHP.B는 가장 강화된 적중으로 독립적으로 3배 나타난다. 동의 코돈이 있는 PHP.B 펩티드 중 3개가 독립적으로 강화된다. 여러 다른 펩티드도 뇌에 풍부하다. 도 1a 및 1b는 화면에서 최고의 마우스 뇌 히트에 대한 농축 점수를 나타내고, 참조 펩티드와 함께(C57BL/6J 마우스에 대한 도 1a; 및 Balb/c 마우스에 대한 도 1b. 도 2a 및 2b는 최고 수행 NHP 뇌(도 2a) 및 척수(도 2b) 조직에 대한 농축 점수를 보여준다.

표 1. 기본 화면의 히트 펩티드 목록(NHP 및 마우스의 화면에서 확인됨).

실험예 2. 2차 검증

여러 적중 캡시드에 대한 GFP 리포터 벡터를 생성하여 마우스의 기본 스크린을 추적하였다. 벡터를 C57BL/6J 마우스에 고용량 IV로 주사하였다. 2주 후, 마우스를 부검하고 뇌 섹션의 GFP 이미지를 수집하였다(데이터는 표시되지 않음). GFP 연구에서 테스트된 모든 적중 벡터는 간 GFP 염색(데이터는 표시되지 않음)에서 명백한 바와 같이 간에서 비편재화되었다.

고배율 이미징은 캡시드 SSN과 SAN이 상당히 뇌에 국한되어 있지만 내피로 제한되어 있음을 보여주었다. RCA-렉틴은 이 섹션에서 뇌 내피 세포의 공동 염색 마커이다(데이터는 표시되지 않음). 이러한 결과는 화면에서 확인된 AAV 캡시드가 BBB-수용체 결합이지만 BBB를 가로지르지 않음을 나타낸다. 돌연변이 계열은 Ly6a 수용체에 대해 다양한 친화성을 보였다. 뇌 형질도입 수준은 Ly6a 수용체에 대한 펩티드의 보다 긴밀한 친화성 결합이 관찰된 것과 관련하여 감소하였다. 관찰된 단단한 결합은 게놈이 내피에 고착되었을 가능성이 있기 때문에 형질도입을 감소시켰다.

이 내피 국소화는 특정 질병에 유용할 수 있다. 또한, 이 활동은 뇌 국소화에서 BBB 교차 벡터로 변환하도록 최적화될 수 있다. 본 발명자는 바코드 벡터 연구에서 이러한 BBB 교차 및 뇌 국소화 활동을 확인하였다. 간략하게, 각각의 캡시드는 고유한 DNA 바코드가 포함된 GFP 리포터 유전자를 포함하는 벡터를 개별적으로 생산하는 데 사용되었다. 바코딩된 캡시드 프렙을 동일한 비율로 혼합하고 C57BL/6J 또는 Balb/c 마우스에 주사하였다(도 3a-3d). 사망하면 마우스 조직을 NGS 시퀀싱하여 조직에서 추출한 벡터 게놈 중 각 바코드의 존재비를 세었다. 결과는 기본 화면에서 식별된 모든 히트 캡시드에 대한 벡터 게놈의 뇌 위치를 확인한다. Balb/c 마우스에서, 2차 검증 스크린은 1차 스크린에서 발견된 모든 히트 서열에 대한 뇌 표적화를 보여주었다(도 3a). C576BL/6 마우스에서 2차 검증 화면은 1차 화면에서 발견된 모든 적중 서열에 대한 뇌 표적화를 보여주었다(도 3b). Balb/c 및 C57BL/6 마우스 모두에서, AVA9에 비해 모든 적중 서열에 대한 간 탈표적화는 뇌 맥관구조에 대한 친화성과 일치하였다(도 3c 및 3d).

실험예 3. 내피 표적화 서열

NHP 2차 검증을 위해 바코드 연구가 수행되었다. 이 연구는 21일 후 4.5x10¹³ GC/kg에서 AAV9를 포함하여 27개의 바코딩된 벡터의 주입된 혼합물로 2개의 NHP에서 수행되었다. 전뇌 조직 균질물의 분석이 수행되었다. 일부 벡터는 완만하게 개선된 벡터 생체분포를 보였지만 어떤 벡터도 개선된 전뇌 형질도입을 나타내지 않았다. 뇌(DNA)에서 벡터 게놈의 축적과 벡터 유래 전사체(mRNA)의 발현은 거의 상관관계가 없었다(표 2). 본 발명자는 내피 표적화 벡터에 대한 불량한 mRNA 대 DNA 상관관계를 관찰하였다.

표 2.

아래의 표 3은 AAV9(1과 동일)로 표준화된 바코드 연구에서 두 NHP에 대한 평균 상대 위치 파악 점수를 보여준다. 뇌 중심 라이브러리 설계에 따라 대부분의 벡터는 비 뇌 조직에서 눈에 띄지 않는 국소화를 보인다. 이에 대한 예외는 벡터 PMK로 AAV9에 비해 두 NHP의 비장에 크게 재편성되었다.

표 3.

하기 표 4는 뇌 내피 히트가 공통 시험관내 형질도입 프로파일(293 형질도입에서 측정된 바와 같음) 및 공통 생산 프로파일을 가짐을 보여준다. 중요하게도, 내피 표적화 활성을 갖는 벡터는 모두 NGS에 의해 측정된 바와 같이 AAV 대 플라스미드 라이브러리에서 극적으로 증가된 상대적 존재비를 나타낸다.

표 4.

SAN 펩티드의 돌연변이 라이브러리는 뇌 표적화에서 "NxTK" 모티프의 역할을 확인한다. 이 연구에서는 SAN 삽입에 가능한 모든 단일 아미노산 변경이 이루어지고 최적화된 라이브러리 변이체가 마우스에 주입되었으며 각 변이체에 대한 생체 분포 및 수율에 대한 점수가 측정되었다. "NxTK" 모티프는 SAN 삽입물에서 뇌 생체분포를 위한 중요한 모티프이다(표 5 및 도 5). "NxTK" 모티프는 SAN 펩티드 삽입물에서 플라스미드에서 AAV로의 전환을 제어한다(표 6 및 도 6). 또한, "NxTK" 모티프는 "NxTK" 부류에서 이러한 내피 벡터의 세 가지 특성, 즉 내피 세포 형질도입, 개선된 293 세포 형질도입 및 라이브러리 생산 동안 전파되는 능력을 연결하였다. 도 7a 내지 7d는 "NxTK" 모티프가 세포주에 걸쳐 광범위한 형질도입 이점을 부여함을 보여준다. 상대적 형질도입 수준은 293 세포(도 7a), NIH3T3 세포(도 7b) 및 HUH7 세포(도 7c)에서 AAV9 캡시드와 비교할 때 개선되었다. 도 7d는 형질도입 후 3일(3DPT)에서 형질도입의 상당한 초기 개선 및 형질도입 후 7일(7DPT)까지 약 10배 개선을 보여준다. EFS 및 SAN 펩티드 삽입물이 있는 AAV-GFP 벡터는 일차 마카크 기도 상피 세포를 형질도입했을 때 개선된 형질도입을 보여주었다(도 7e-7h).

표 5. 뇌 생체분포(위에서 아래로의 평균).

표 6. 플라스미드에서 AAV로의 수율 전환

요약하면, 표 7에 나열된 선택된 아미노산 서열은 모두 기능적 모티프 N- x- (T/I/V/A)- (K/R) 모티프(서열번호 47)를 포함한다. 표 7에 나타낸 선택된 서열 외에, 스크리닝 동안 다른 서열이 확인되었다. 본 발명자는 이러한 삽입 서열에 대한 많은 대체가 또한 내피 표적화 활동을 지원하거나 개선한다는 것을 뒷받침하는 데이터를 가지고 있다. 또한 대규모 무작위 삽입 라이브러리에서 이 모티프에 맞는 약 수천 개의 시퀀스를 발견하였다. 이러한 시퀀스는 모두 향상된 변환 속성을 공유할 가능성이 높다.

표 7. 선택된 내피 표적화 서열

본 발명자는 NHP에서 기본 스크린 히트의 바코드 평가를 완료하였다. AAV9-PMK에 의한 비장 표적화 가능성을 제외하고는 말초 조직 표적화에 있어 유의미한 향상이 없는 반면, 뇌 국소화는 이 라이브러리로부터의 적중의 가장 두드러진 특징이다. 본 발명자는 뇌-내피 표적 활동을 가진 모든 펩티드 삽입물에 공통적인 서열 모티프를 정의하였다. 본 발명자는 광범위한 시험관 내 전달 이점을 부여할 뿐만 아니라 뇌-내피 표적화에서 이 모티프의 활성을 확인하였다. 단일 시퀀스 모티프 "NxTK"는 세 가지 속성을 공유하는 4개의 관련 없는 소스에서 삽입을 정의한다:

(1) 293 및 기타 세포주에서 극적으로 개선된 시험관내 형질도입;

(2) 라이브러리 생산 중 기생 확장 - "확산" 표현형; 및

(3) 마우스 및 NHP에서 생체내 내피 생체분포.

"NxTK" 모티프는 SAN 및 EFS 벡터 삽입의 전신 돌연변이 스크린에 매핑되었다. 전신 돌연변이 스크리닝에서 "NxTK" 모티프는 라이브러리 생산의 풍부함뿐만 아니라 뇌 내피 생체 분포에 중요한 것으로 나타났다. 라이브러리 생산 중 캡시드 수율을 의미하는 플라스미드에서 AAV로의 전환은 2가지 요인, 즉 기생 확산 모티프의 존재(주 요인) 및 고유 캡시드 수율(부수 요인)에 의해 제어된다. 확산 모티프 중 하나는 "NxTK"로 확인되었으며 293개의 세포 표면 수용체와 상호 작용하고 전달 이점을 부여할 가능성이 있다. 293의 형질도입 이점은 라이브러리 생산이 제한된 Cap으로 이루어지기 때문에 생산 기간 동안 벡터 게놈(Cap)을 이웃 세포로 전파할 수 있으므로 대부분의 세포는 초기에 Cap 유전자를 제외한 모든 것을 가지고 있다. 사소한 요인은 기생 확산 모티프가 있는 벡터를 디지털 필터링한 후에만 분명했다.

실험예 4. 기도 전달을 위한 AAV 캡시드 개발을 위한 공학적 전략

현재 AAV 벡터는 비강과 상기도의 세포를 제대로 변환하지 못하여 인플루엔자 또는 COVID-19와 같은 상기도 전염병으로부터 보호하기 위한 예방적 AAV 전략의 효능을 제한한다. 이 프로젝트는 이러한 조직의 향상된 형질도입을 위해 AAV 캡시드를 설계하는 것을 목표로 하며, 특히 유도 진화 및 수용체 표적화 전략을 추구한다. AAV 기도 특정 캡시드 선택을 위해 추구하는 엔지니어링 전략은 삽입물(10³에서 10⁹ 초기 다양성)이 있는 다양한 구성 라이브러리 생성을 포함하되 이에 국한되지 않는 단계, 1차 영장류 또는 인간 기도 세포에서의 스크리닝 및 선택하는 단계, 선택된 작제물의 게놈 정체성(DNA 또는 RNA)을 확인하는 단계, 히트에 수렴하기 위해 추가 스크리닝을 수행하고 NHP에서 개선된 캡시드의 히트를 검증하는 단계로 구성된다. 기도 전달을 위한 캡시드 다양성의 출처는 편향되지 않은 접근 방식과 편향된 접근 방식의 두 가지 접근 방식을 추구하는 것으로 구성된다. 편향되지 않은 접근 방식에서 임의의 펩티드가 AAV 캡시드 표면에 삽입되어 10⁷개 이상의 변이체 다양성이 있는 큰 라이브러리를 생성한다. 편향된 접근법에서 알려진 또는 의심되는 기도 세포 결합 활성을 가진 펩티드가 AAV Capsid에 삽입되어 약 10³개의 변이 다양성을 가진 작은 라이브러리를 생성한다. 이러한 알려진 또는 의심되는 기도 세포 결합 펩티드의 소스: 발표된 파지 디스플레이 결과, 바이러스 수용체 결합 도메인의 펩티드, 기도 수용체에 대한 알려진 리간드 및 이전 시험관 내 라이브러리 스크리닝에서 생성된 펩티드. 생성된 캡시드 라이브러리를 시험관 내에서 스크리닝하기 위해 공기-액체 인터페이스(ALI) 배양에서 1차 기도 세포를 사용한 분석이 사용된다. 사용된 세포는 인간 및 마카크 기원이며 비강, 기관 및 기관지 세포 기원을 포함한다. 마카크 1차 기도 상피 세포 배양물에서 GFP 벡터를 사용한 예비 형질도입 시험은 AAV 캡시드로의 EFS 및 SAN 삽입 펩티드에 대한 형질도입에서 상당한 초기 개선을 보여주었다(도 7d 및 7e-7h). 도 7e는 담체(즉, 벡터 없음)로 처리된 대조군 샘플에서 마카크 원발성 기도 상피 세포의 현미경 분석을 보여준다. 도 7f는 AAV9-GFP 벡터로 형질도입 후 마카크 원발성 기도 상피 세포의 현미경 분석을 나타낸다. 도 7g는 EFS 펩티드 삽입물을 포함하는 AAV9-GFP 벡터로 형질도입 후 마카크 일차 기도 상피 세포의 현미경 분석을 보여준다. 도 7h는 SAN 펩티드 삽입물을 포함하는 AAV9-GFP로 형질도입 후 마카크 일차 기도 상피 세포의 현미경 분석을 보여준다. 배양된 인간 세포에서 GFP 벡터를 사용한 예비 형질도입 테스트는 전반적으로 낮은 형질도입을 보여주었으며, 상기 7일째 총 mRNA 마이크로그램에 대한 mRNA 카피 수의 비율은 배양된 인간 세포의 경우 1x10⁴(도 8) 및 배양된 마카크 원발성 기도 상피 세포의 경우 1x10⁶(도 7d)이었다. SAN 모티프는 AAV9 형질도입과 비교할 때 7일째 형질도입에서 이점을 보였다(도 8). EFS 모티프는 기관지 및 기관 배양 인간 세포에서 더 불량한 형질도입을 보였다(도 8).

또한, 극적으로 개선된 세포 결합 및 형질도입 활성을 부여하는 다른 프로젝트에서 시험관 내 선택 체계를 통해 다수의 삽입 서열을 개발하였다. 생성된 AAV 삽입 벡터는 ALI 문화의 바코드 풀에서 테스트된다. 결과는 시험관 내에서 선택된 모든 AAV9-삽입 벡터가 AAV9 벡터보다 우수함을 보여준다(결과는 나타내지 않음). 구체적으로, Spr3L(NxTK)의 AAV9-삽입 벡터는 비교할 때 가장 좋았고, 후자는 AAV9 캡시드보다 약 50배 더 나은 형질도입을 보였다.

(서열 목록 자유 텍스트)

아래의 자유 텍스트를 포함하는 시퀀스에 대해 다음 정보가 제공된다.

숫자 식별자 <223>.

본 명세서에 인용된 모든 문헌은 본 명세서에 참조로 포함된다. 2020년 12월 1일에 출원된 미국 가출원 번호 63/119,863은 그 전체 내용이 참조로 본원에 포함된다. "20-9409PCT_ST25"로 명명된 본원에 제출된 서열 목록 및 그 안의 서열 및 텍스트는 참고로 포함된다. 본 발명은 특정 구체예를 참조하여 설명되었지만, 본 발명의 사상을 벗어나지 않고 수정이 이루어질 수 있음을 이해할 것이다. 그러한 수정은 첨부된 청구 범위 내에 있는 것으로 의도된다.

SEQUENCE LISTING <110> The Trustees of the University of Pennsylvania <120> NOVEL AAV CAPSIDS WITH ENDOTHELIAL TISSUE-SPECIFIC TARGETING MOTIFS AND COMPOSITIONS CONTAINING SAME <130> UPN-20-9409.PCT <150> US 63/119,863 <151> 2020-12-01 <160> 56 <170> PatentIn version 3.5 <210> 1 <211> 4725 <212> DNA <213> Artificial Sequence <220> <223> AAV2/9 n.588.EFS nucleic acid sequence expression cassette <220> <221> misc_feature <222> (1)..(36) <223> truncated promoter <220> <221> promoter <222> (1)..(7) <223> p5 promoter <220> <221> CDS <222> (37)..(1899) <223> AAV2-Rep <220> <221> CDS <222> (1919)..(4162) <223> AAV9 Cap <220> <221> misc_feature <222> (3683)..(3715) <223> EFS <220> <221> misc_feature <222> (4253)..(4383) <223> p5 promoter <220> <221> misc_feature <222> (4511)..(4725) <223> LacZ promoter <400> 1 ccattttgaa gcgggaggtt tgaacgcgca gccgcc atg ccg ggg ttt tac gag 54 Met Pro Gly Phe Tyr Glu 1 5 att gtg att aag gtc ccc agc gac ctt gac gag cat ctg ccc ggc att 102 Ile Val Ile Lys Val Pro Ser Asp Leu Asp Glu His Leu Pro Gly Ile 10 15 20 tct gac agc ttt gtg aac tgg gtg gcc gag aag gaa tgg gag ttg ccg 150 Ser Asp Ser Phe Val Asn Trp Val Ala Glu Lys Glu Trp Glu Leu Pro 25 30 35 cca gat tct gac atg gat ctg aat ctg att gag cag gca ccc ctg acc 198 Pro Asp Ser Asp Met Asp Leu Asn Leu Ile Glu Gln Ala Pro Leu Thr 40 45 50 gtg gcc gag aag ctg cag cgc gac ttt ctg acg gaa tgg cgc cgt gtg 246 Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Thr Glu Trp Arg Arg Val 55 60 65 70 agt aag gcc ccg gag gct ctt ttc ttt gtg caa ttt gag aag gga gag 294 Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Gln Phe Glu Lys Gly Glu 75 80 85 agc tac ttc cac atg cac gtg ctc gtg gaa acc acc ggg gtg aaa tcc 342 Ser Tyr Phe His Met His Val Leu Val Glu Thr Thr Gly Val Lys Ser 90 95 100 atg gtt ttg gga cgt ttc ctg agt cag att cgc gaa aaa ctg att cag 390 Met Val Leu Gly Arg Phe Leu Ser Gln Ile Arg Glu Lys Leu Ile Gln 105 110 115 aga att tac cgc ggg atc gag ccg act ttg cca aac tgg ttc gcg gtc 438 Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu Pro Asn Trp Phe Ala Val 120 125 130 aca aag acc aga aat ggc gcc gga ggc ggg aac aag gtg gtg gat gag 486 Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Asn Lys Val Val Asp Glu 135 140 145 150 tgc tac atc ccc aat tac ttg ctc ccc aaa acc cag cct gag ctc cag 534 Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Thr Gln Pro Glu Leu Gln 155 160 165 tgg gcg tgg act aat atg gaa cag tat tta agc gcc tgt ttg aat ctc 582 Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu Ser Ala Cys Leu Asn Leu 170 175 180 acg gag cgt aaa cgg ttg gtg gcg cag cat ctg acg cac gtg tcg cag 630 Thr Glu Arg Lys Arg Leu Val Ala Gln His Leu Thr His Val Ser Gln 185 190 195 acg cag gag cag aac aaa gag aat cag aat ccc aat tct gat gcg ccg 678 Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Pro Asn Ser Asp Ala Pro 200 205 210 gtg atc aga tca aaa act tca gcc agg tac atg gag ctg gtc ggg tgg 726 Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Met Glu Leu Val Gly Trp 215 220 225 230 ctc gtg gac aag ggg att acc tcg gag aag cag tgg atc cag gag gac 774 Leu Val Asp Lys Gly Ile Thr Ser Glu Lys Gln Trp Ile Gln Glu Asp 235 240 245 cag gcc tca tac atc tcc ttc aat gcg gcc tcc aac tcg cgg tcc caa 822 Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Ser Asn Ser Arg Ser Gln 250 255 260 atc aag gct gcc ttg gac aat gcg gga aag att atg agc ctg act aaa 870 Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile Met Ser Leu Thr Lys 265 270 275 acc gcc ccc gac tac ctg gtg ggc cag cag ccc gtg gag gac att tcc 918 Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro Val Glu Asp Ile Ser 280 285 290 agc aat cgg att tat aaa att ttg gaa cta aac ggg tac gat ccc caa 966 Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn Gly Tyr Asp Pro Gln 295 300 305 310 tat gcg gct tcc gtc ttt ctg gga tgg gcc acg aaa aag ttc ggc aag 1014 Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr Lys Lys Phe Gly Lys 315 320 325 agg aac acc atc tgg ctg ttt ggg cct gca act acc ggg aag acc aac 1062 Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr Thr Gly Lys Thr Asn 330 335 340 atc gcg gag gcc ata gcc cac act gtg ccc ttc tac ggg tgc gta aac 1110 Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe Tyr Gly Cys Val Asn 345 350 355 tgg acc aat gag aac ttt ccc ttc aac gac tgt gtc gac aag atg gtg 1158 Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys Val Asp Lys Met Val 360 365 370 atc tgg tgg gag gag ggg aag atg acc gcc aag gtc gtg gag tcg gcc 1206 Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys Val Val Glu Ser Ala 375 380 385 390 aaa gcc att ctc gga gga agc aag gtg cgc gtg gac cag aaa tgc aag 1254 Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val Asp Gln Lys Cys Lys 395 400 405 tcc tcg gcc cag ata gac ccg act ccc gtg atc gtc acc tcc aac acc 1302 Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile Val Thr Ser Asn Thr 410 415 420 aac atg tgc gcc gtg att gac ggg aac tca acg acc ttc gaa cac cag 1350 Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr Thr Phe Glu His Gln 425 430 435 cag ccg ttg caa gac cgg atg ttc aaa ttt gaa ctc acc cgc cgt ctg 1398 Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu Leu Thr Arg Arg Leu 440 445 450 gat cat gac ttt ggg aag gtc acc aag cag gaa gtc aaa gac ttt ttc 1446 Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Val Lys Asp Phe Phe 455 460 465 470 cgg tgg gca aag gat cac gtg gtt gag gtg gag cat gaa ttc tac gtc 1494 Arg Trp Ala Lys Asp His Val Val Glu Val Glu His Glu Phe Tyr Val 475 480 485 aaa aag ggt gga gcc aag aaa aga ccc gcc ccc agt gac gca gat ata 1542 Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro Ser Asp Ala Asp Ile 490 495 500 agt gag ccc aaa cgg gtg cgc gag tca gtt gcg cag cca tcg acg tca 1590 Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala Gln Pro Ser Thr Ser 505 510 515 gac gcg gaa gct tcg atc aac tac gca gac agg tac caa aac aaa tgt 1638 Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg Tyr Gln Asn Lys Cys 520 525 530 tct cgt cac gtg ggc atg aat ctg atg ctg ttt ccc tgc aga caa tgc 1686 Ser Arg His Val Gly Met Asn Leu Met Leu Phe Pro Cys Arg Gln Cys 535 540 545 550 gag aga atg aat cag aat tca aat atc tgc ttc act cac gga cag aaa 1734 Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe Thr His Gly Gln Lys 555 560 565 gac tgt tta gag tgc ttt ccc gtg tca gaa tct caa ccc gtt tct gtc 1782 Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Ser Gln Pro Val Ser Val 570 575 580 gtc aaa aag gcg tat cag aaa ctg tgc tac att cat cat atc atg gga 1830 Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ile His His Ile Met Gly 585 590 595 aag gtg cca gac gct tgc act gcc tgc gat ctg gtc aat gtg gat ttg 1878 Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Leu Val Asn Val Asp Leu 600 605 610 gat gac tgc atc ttt gaa caa taaatgattt aaatcaggt atg gct gcc gat 1930 Asp Asp Cys Ile Phe Glu Gln Met Ala Ala Asp 615 620 625 ggt tat ctt cca gat tgg ctc gag gac aac ctt agt gaa gga att cgc 1978 Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser Glu Gly Ile Arg 630 635 640 gag tgg tgg gct ttg aaa cct gga gcc cct caa ccc aag gca aat caa 2026 Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro Lys Ala Asn Gln 645 650 655 caa cat caa gac aac gct cga ggt ctt gtg ctt ccg ggt tac aaa tac 2074 Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro Gly Tyr Lys Tyr 660 665 670 ctt gga ccc ggc aac gga ctc gac aag ggg gag ccg gtc aac gca gca 2122 Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro Val Asn Ala Ala 675 680 685 gac gcg gcg gcc ctc gag cac gac aag gcc tac gac cag cag ctc aag 2170 Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp Gln Gln Leu Lys 690 695 700 705 gcc gga gac aac ccg tac ctc aag tac aac cac gcc gac gcc gag ttc 2218 Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp Ala Glu Phe 710 715 720 cag gag cgg ctc aaa gaa gat acg tct ttt ggg ggc aac ctc ggg cga 2266 Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly Asn Leu Gly Arg 725 730 735 gca gtc ttc cag gcc aaa aag agg ctt ctt gaa cct ctt ggt ctg gtt 2314 Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro Leu Gly Leu Val 740 745 750 gag gaa gcg gct aag acg gct cct gga aag aag agg cct gta gag cag 2362 Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg Pro Val Glu Gln 755 760 765 tct cct cag gaa ccg gac tcc tcc gcg ggt att ggc aaa tcg ggt gca 2410 Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly Lys Ser Gly Ala 770 775 780 785 cag ccc gct aaa aag aga ctc aat ttc ggt cag act ggc gac aca gag 2458 Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr Gly Asp Thr Glu 790 795 800 tca gtc cca gac cct caa cca atc gga gaa cct ccc gca gcc ccc tca 2506 Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro Ala Ala Pro Ser 805 810 815 ggt gtg gga tct ctt aca atg gct tca ggt ggt ggc gca cca gtg gca 2554 Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly Ala Pro Val Ala 820 825 830 gac aat aac gaa ggt gcc gat gga gtg ggt agt tcc tcg gga aat tgg 2602 Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser Ser Gly Asn Trp 835 840 845 cat tgc gat tcc caa tgg ctg ggg gac aga gtc atc acc acc agc acc 2650 His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile Thr Thr Ser Thr 850 855 860 865 cga acc tgg gcc ctg ccc acc tac aac aat cac ctc tac aag caa atc 2698 Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile 870 875 880 tcc aac agc aca tct gga gga tct tca aat gac aac gcc tac ttc ggc 2746 Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn Ala Tyr Phe Gly 885 890 895 tac agc acc ccc tgg ggg tat ttt gac ttc aac aga ttc cac tgc cac 2794 Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His Cys His 900 905 910 ttc tca cca cgt gac tgg cag cga ctc atc aac aac aac tgg gga ttc 2842 Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Phe 915 920 925 cgg cct aag cga ctc aac ttc aag ctc ttc aac att cag gtc aaa gag 2890 Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val Lys Glu 930 935 940 945 gtt acg gac aac aat gga gtc aag acc atc gcc aat aac ctt acc agc 2938 Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn Asn Leu Thr Ser 950 955 960 acg gtc cag gtc ttc acg gac tca gac tat cag ctc ccg tac gtg ctc 2986 Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu Pro Tyr Val Leu 965 970 975 ggg tcg gct cac gag ggc tgc ctc ccg ccg ttc cca gcg gac gtt ttc 3034 Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro Ala Asp Val Phe 980 985 990 atg att cct cag tac ggg tat ctg acg ctt aat gat gga agc cag gcc 3082 Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp Gly Ser Gln Ala 995 1000 1005 gtg ggt cgt tcg tcc ttt tac tgc ctg gaa tat ttc ccg tcg caa 3127 Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln 1010 1015 1020 atg cta aga acg ggt aac aac ttc cag ttc agc tac gag ttt gag 3172 Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu Phe Glu 1025 1030 1035 aac gta cct ttc cat agc agc tac gct cac agc caa agc ctg gac 3217 Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp 1040 1045 1050 cga cta atg aat cca ctc atc gac caa tac ttg tac tat ctc tca 3262 Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 1055 1060 1065 aag act att aac ggt tct gga cag aat caa caa acg cta aaa ttc 3307 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe 1070 1075 1080 agt gtg gcc gga ccc agc aac atg gct gtc cag gga aga aac tac 3352 Ser Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr 1085 1090 1095 ata cct gga ccc agc tac cga caa caa cgt gtc tca acc act gtg 3397 Ile Pro Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val 1100 1105 1110 act caa aac aac aac agc gaa ttt gct tgg cct gga gct tct tct 3442 Thr Gln Asn Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser 1115 1120 1125 tgg gct ctc aat gga cgt aat agc ttg atg aat cct gga cct gct 3487 Trp Ala Leu Asn Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala 1130 1135 1140 atg gcc agc cac aaa gaa gga gag gac cgt ttc ttt cct ttg tct 3532 Met Ala Ser His Lys Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser 1145 1150 1155 gga tct tta att ttt ggc aaa caa gga act gga aga gac aac gtg 3577 Gly Ser Leu Ile Phe Gly Lys Gln Gly Thr Gly Arg Asp Asn Val 1160 1165 1170 gat gcg gac aaa gtc atg ata acc aac gaa gaa gaa att aaa act 3622 Asp Ala Asp Lys Val Met Ile Thr Asn Glu Glu Glu Ile Lys Thr 1175 1180 1185 act aac ccg gta gca acg gag tcc tat gga caa gtg gcc aca aac 3667 Thr Asn Pro Val Ala Thr Glu Ser Tyr Gly Gln Val Ala Thr Asn 1190 1195 1200 cac cag agt gcc caa gag ttc agc agc aac acc gtg aag ctg acc 3712 His Gln Ser Ala Gln Glu Phe Ser Ser Asn Thr Val Lys Leu Thr 1205 1210 1215 agc gca cag gcg cag acc ggc tgg gtt caa aac caa gga ata ctt 3757 Ser Ala Gln Ala Gln Thr Gly Trp Val Gln Asn Gln Gly Ile Leu 1220 1225 1230 ccg ggt atg gtt tgg cag gac aga gat gtg tac ctg caa gga ccc 3802 Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro 1235 1240 1245 att tgg gcc aaa att cct cac acg gac ggc aac ttt cac cct tct 3847 Ile Trp Ala Lys Ile Pro His Thr Asp Gly Asn Phe His Pro Ser 1250 1255 1260 ccg ctg atg gga ggg ttt gga atg aag cac ccg cct cct cag atc 3892 Pro Leu Met Gly Gly Phe Gly Met Lys His Pro Pro Pro Gln Ile 1265 1270 1275 ctc atc aaa aac aca cct gta cct gcg gat cct cca acg gcc ttc 3937 Leu Ile Lys Asn Thr Pro Val Pro Ala Asp Pro Pro Thr Ala Phe 1280 1285 1290 aac aag gac aag ctg aac tct ttc atc acc cag tat tct act ggc 3982 Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr Gln Tyr Ser Thr Gly 1295 1300 1305 caa gtc agc gtg gag atc gag tgg gag ctg cag aag gaa aac agc 4027 Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser 1310 1315 1320 aag cgc tgg aac ccg gag atc cag tac act tcc aac tat tac aag 4072 Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Tyr Lys 1325 1330 1335 tct aat aat gtt gaa ttt gct gtt aat act gaa ggt gta tat agt 4117 Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val Tyr Ser 1340 1345 1350 gaa ccc cgc ccc att ggc acc aga tac ctg act cgt aat ctg taa 4162 Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 1355 1360 1365 ttgcttgtta atcaataaac cgtttaattc gtttcagttg aactttggtc tctgcgaagg 4222 gcgaattcgt ttaaacctgc aggactagag gtcctgtatt agaggtcacg tgagtgtttt 4282 gcgacatttt gcgacaccat gtggtcacgc tgggtattta agcccgagtg agcacgcagg 4342 gtctccattt tgaagcggga ggtttgaacg cgcagccgcc aagccgaatt ctgcagatat 4402 ccatcacact ggcggccgct cgactagagc ggccgccacc gcggtggagc tccagctttt 4462 gttcccttta gtgagggtta attgcgcgct tggcgtaatc atggtcatag ctgtttcctg 4522 tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 4582 aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 4642 ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 4702 gaggcggttt gcgtattggg cgc 4725 <210> 2 <211> 621 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 2 Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp 1 5 10 15 Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu 20 25 30 Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile 35 40 45 Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu 50 55 60 Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val 65 70 75 80 Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu 85 90 95 Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile 100 105 110 Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu 115 120 125 Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly 130 135 140 Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys 145 150 155 160 Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu 165 170 175 Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His 180 185 190 Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn 195 200 205 Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr 210 215 220 Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys 225 230 235 240 Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala 245 250 255 Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys 260 265 270 Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln 275 280 285 Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu 290 295 300 Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala 305 310 315 320 Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala 325 330 335 Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro 340 345 350 Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp 355 360 365 Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala 370 375 380 Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg 385 390 395 400 Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val 405 410 415 Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser 420 425 430 Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe 435 440 445 Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln 450 455 460 Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val 465 470 475 480 Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala 485 490 495 Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val 500 505 510 Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp 515 520 525 Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu 530 535 540 Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys 545 550 555 560 Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu 565 570 575 Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr 580 585 590 Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp 595 600 605 Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln 610 615 620 <210> 3 <211> 747 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 3 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Glu Phe Ser Ser 580 585 590 Asn Thr Val Lys Leu Thr Ser Ala Gln Ala Gln Thr Gly Trp Val Gln 595 600 605 Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr 610 615 620 Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly Asn Phe 625 630 635 640 His Pro Ser Pro Leu Met Gly Gly Phe Gly Met Lys His Pro Pro Pro 645 650 655 Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asp Pro Pro Thr Ala 660 665 670 Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr Gln Tyr Ser Thr Gly 675 680 685 Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys 690 695 700 Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Tyr Lys Ser Asn 705 710 715 720 Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val Tyr Ser Glu Pro Arg 725 730 735 Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 740 745 <210> 4 <211> 4728 <212> DNA <213> Artificial Sequence <220> <223> AAV2/9 n.588.IEI nucleic acid sequence expression cassette <220> <221> misc_feature <222> (1)..(36) <223> truncated promoter <220> <221> promoter <222> (1)..(7) <223> p5 promoter <220> <221> CDS <222> (37)..(1899) <223> AAV2-Rep <220> <221> CDS <222> (1919)..(4165) <223> AAV9 Cap <220> <221> misc_feature <222> (3683)..(3718) <223> IEI <220> <221> misc_feature <222> (4256)..(4386) <223> p5 promoter <220> <221> misc_feature <222> (4514)..(4728) <223> LacZ promoter <400> 4 ccattttgaa gcgggaggtt tgaacgcgca gccgcc atg ccg ggg ttt tac gag 54 Met Pro Gly Phe Tyr Glu 1 5 att gtg att aag gtc ccc agc gac ctt gac gag cat ctg ccc ggc att 102 Ile Val Ile Lys Val Pro Ser Asp Leu Asp Glu His Leu Pro Gly Ile 10 15 20 tct gac agc ttt gtg aac tgg gtg gcc gag aag gaa tgg gag ttg ccg 150 Ser Asp Ser Phe Val Asn Trp Val Ala Glu Lys Glu Trp Glu Leu Pro 25 30 35 cca gat tct gac atg gat ctg aat ctg att gag cag gca ccc ctg acc 198 Pro Asp Ser Asp Met Asp Leu Asn Leu Ile Glu Gln Ala Pro Leu Thr 40 45 50 gtg gcc gag aag ctg cag cgc gac ttt ctg acg gaa tgg cgc cgt gtg 246 Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Thr Glu Trp Arg Arg Val 55 60 65 70 agt aag gcc ccg gag gct ctt ttc ttt gtg caa ttt gag aag gga gag 294 Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Gln Phe Glu Lys Gly Glu 75 80 85 agc tac ttc cac atg cac gtg ctc gtg gaa acc acc ggg gtg aaa tcc 342 Ser Tyr Phe His Met His Val Leu Val Glu Thr Thr Gly Val Lys Ser 90 95 100 atg gtt ttg gga cgt ttc ctg agt cag att cgc gaa aaa ctg att cag 390 Met Val Leu Gly Arg Phe Leu Ser Gln Ile Arg Glu Lys Leu Ile Gln 105 110 115 aga att tac cgc ggg atc gag ccg act ttg cca aac tgg ttc gcg gtc 438 Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu Pro Asn Trp Phe Ala Val 120 125 130 aca aag acc aga aat ggc gcc gga ggc ggg aac aag gtg gtg gat gag 486 Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Asn Lys Val Val Asp Glu 135 140 145 150 tgc tac atc ccc aat tac ttg ctc ccc aaa acc cag cct gag ctc cag 534 Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Thr Gln Pro Glu Leu Gln 155 160 165 tgg gcg tgg act aat atg gaa cag tat tta agc gcc tgt ttg aat ctc 582 Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu Ser Ala Cys Leu Asn Leu 170 175 180 acg gag cgt aaa cgg ttg gtg gcg cag cat ctg acg cac gtg tcg cag 630 Thr Glu Arg Lys Arg Leu Val Ala Gln His Leu Thr His Val Ser Gln 185 190 195 acg cag gag cag aac aaa gag aat cag aat ccc aat tct gat gcg ccg 678 Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Pro Asn Ser Asp Ala Pro 200 205 210 gtg atc aga tca aaa act tca gcc agg tac atg gag ctg gtc ggg tgg 726 Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Met Glu Leu Val Gly Trp 215 220 225 230 ctc gtg gac aag ggg att acc tcg gag aag cag tgg atc cag gag gac 774 Leu Val Asp Lys Gly Ile Thr Ser Glu Lys Gln Trp Ile Gln Glu Asp 235 240 245 cag gcc tca tac atc tcc ttc aat gcg gcc tcc aac tcg cgg tcc caa 822 Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Ser Asn Ser Arg Ser Gln 250 255 260 atc aag gct gcc ttg gac aat gcg gga aag att atg agc ctg act aaa 870 Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile Met Ser Leu Thr Lys 265 270 275 acc gcc ccc gac tac ctg gtg ggc cag cag ccc gtg gag gac att tcc 918 Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro Val Glu Asp Ile Ser 280 285 290 agc aat cgg att tat aaa att ttg gaa cta aac ggg tac gat ccc caa 966 Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn Gly Tyr Asp Pro Gln 295 300 305 310 tat gcg gct tcc gtc ttt ctg gga tgg gcc acg aaa aag ttc ggc aag 1014 Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr Lys Lys Phe Gly Lys 315 320 325 agg aac acc atc tgg ctg ttt ggg cct gca act acc ggg aag acc aac 1062 Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr Thr Gly Lys Thr Asn 330 335 340 atc gcg gag gcc ata gcc cac act gtg ccc ttc tac ggg tgc gta aac 1110 Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe Tyr Gly Cys Val Asn 345 350 355 tgg acc aat gag aac ttt ccc ttc aac gac tgt gtc gac aag atg gtg 1158 Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys Val Asp Lys Met Val 360 365 370 atc tgg tgg gag gag ggg aag atg acc gcc aag gtc gtg gag tcg gcc 1206 Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys Val Val Glu Ser Ala 375 380 385 390 aaa gcc att ctc gga gga agc aag gtg cgc gtg gac cag aaa tgc aag 1254 Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val Asp Gln Lys Cys Lys 395 400 405 tcc tcg gcc cag ata gac ccg act ccc gtg atc gtc acc tcc aac acc 1302 Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile Val Thr Ser Asn Thr 410 415 420 aac atg tgc gcc gtg att gac ggg aac tca acg acc ttc gaa cac cag 1350 Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr Thr Phe Glu His Gln 425 430 435 cag ccg ttg caa gac cgg atg ttc aaa ttt gaa ctc acc cgc cgt ctg 1398 Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu Leu Thr Arg Arg Leu 440 445 450 gat cat gac ttt ggg aag gtc acc aag cag gaa gtc aaa gac ttt ttc 1446 Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Val Lys Asp Phe Phe 455 460 465 470 cgg tgg gca aag gat cac gtg gtt gag gtg gag cat gaa ttc tac gtc 1494 Arg Trp Ala Lys Asp His Val Val Glu Val Glu His Glu Phe Tyr Val 475 480 485 aaa aag ggt gga gcc aag aaa aga ccc gcc ccc agt gac gca gat ata 1542 Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro Ser Asp Ala Asp Ile 490 495 500 agt gag ccc aaa cgg gtg cgc gag tca gtt gcg cag cca tcg acg tca 1590 Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala Gln Pro Ser Thr Ser 505 510 515 gac gcg gaa gct tcg atc aac tac gca gac agg tac caa aac aaa tgt 1638 Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg Tyr Gln Asn Lys Cys 520 525 530 tct cgt cac gtg ggc atg aat ctg atg ctg ttt ccc tgc aga caa tgc 1686 Ser Arg His Val Gly Met Asn Leu Met Leu Phe Pro Cys Arg Gln Cys 535 540 545 550 gag aga atg aat cag aat tca aat atc tgc ttc act cac gga cag aaa 1734 Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe Thr His Gly Gln Lys 555 560 565 gac tgt tta gag tgc ttt ccc gtg tca gaa tct caa ccc gtt tct gtc 1782 Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Ser Gln Pro Val Ser Val 570 575 580 gtc aaa aag gcg tat cag aaa ctg tgc tac att cat cat atc atg gga 1830 Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ile His His Ile Met Gly 585 590 595 aag gtg cca gac gct tgc act gcc tgc gat ctg gtc aat gtg gat ttg 1878 Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Leu Val Asn Val Asp Leu 600 605 610 gat gac tgc atc ttt gaa caa taaatgattt aaatcaggt atg gct gcc gat 1930 Asp Asp Cys Ile Phe Glu Gln Met Ala Ala Asp 615 620 625 ggt tat ctt cca gat tgg ctc gag gac aac ctt agt gaa gga att cgc 1978 Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser Glu Gly Ile Arg 630 635 640 gag tgg tgg gct ttg aaa cct gga gcc cct caa ccc aag gca aat caa 2026 Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro Lys Ala Asn Gln 645 650 655 caa cat caa gac aac gct cga ggt ctt gtg ctt ccg ggt tac aaa tac 2074 Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro Gly Tyr Lys Tyr 660 665 670 ctt gga ccc ggc aac gga ctc gac aag ggg gag ccg gtc aac gca gca 2122 Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro Val Asn Ala Ala 675 680 685 gac gcg gcg gcc ctc gag cac gac aag gcc tac gac cag cag ctc aag 2170 Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp Gln Gln Leu Lys 690 695 700 705 gcc gga gac aac ccg tac ctc aag tac aac cac gcc gac gcc gag ttc 2218 Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp Ala Glu Phe 710 715 720 cag gag cgg ctc aaa gaa gat acg tct ttt ggg ggc aac ctc ggg cga 2266 Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly Asn Leu Gly Arg 725 730 735 gca gtc ttc cag gcc aaa aag agg ctt ctt gaa cct ctt ggt ctg gtt 2314 Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro Leu Gly Leu Val 740 745 750 gag gaa gcg gct aag acg gct cct gga aag aag agg cct gta gag cag 2362 Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg Pro Val Glu Gln 755 760 765 tct cct cag gaa ccg gac tcc tcc gcg ggt att ggc aaa tcg ggt gca 2410 Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly Lys Ser Gly Ala 770 775 780 785 cag ccc gct aaa aag aga ctc aat ttc ggt cag act ggc gac aca gag 2458 Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr Gly Asp Thr Glu 790 795 800 tca gtc cca gac cct caa cca atc gga gaa cct ccc gca gcc ccc tca 2506 Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro Ala Ala Pro Ser 805 810 815 ggt gtg gga tct ctt aca atg gct tca ggt ggt ggc gca cca gtg gca 2554 Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly Ala Pro Val Ala 820 825 830 gac aat aac gaa ggt gcc gat gga gtg ggt agt tcc tcg gga aat tgg 2602 Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser Ser Gly Asn Trp 835 840 845 cat tgc gat tcc caa tgg ctg ggg gac aga gtc atc acc acc agc acc 2650 His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile Thr Thr Ser Thr 850 855 860 865 cga acc tgg gcc ctg ccc acc tac aac aat cac ctc tac aag caa atc 2698 Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile 870 875 880 tcc aac agc aca tct gga gga tct tca aat gac aac gcc tac ttc ggc 2746 Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn Ala Tyr Phe Gly 885 890 895 tac agc acc ccc tgg ggg tat ttt gac ttc aac aga ttc cac tgc cac 2794 Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His Cys His 900 905 910 ttc tca cca cgt gac tgg cag cga ctc atc aac aac aac tgg gga ttc 2842 Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Phe 915 920 925 cgg cct aag cga ctc aac ttc aag ctc ttc aac att cag gtc aaa gag 2890 Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val Lys Glu 930 935 940 945 gtt acg gac aac aat gga gtc aag acc atc gcc aat aac ctt acc agc 2938 Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn Asn Leu Thr Ser 950 955 960 acg gtc cag gtc ttc acg gac tca gac tat cag ctc ccg tac gtg ctc 2986 Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu Pro Tyr Val Leu 965 970 975 ggg tcg gct cac gag ggc tgc ctc ccg ccg ttc cca gcg gac gtt ttc 3034 Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro Ala Asp Val Phe 980 985 990 atg att cct cag tac ggg tat ctg acg ctt aat gat gga agc cag gcc 3082 Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp Gly Ser Gln Ala 995 1000 1005 gtg ggt cgt tcg tcc ttt tac tgc ctg gaa tat ttc ccg tcg caa 3127 Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln 1010 1015 1020 atg cta aga acg ggt aac aac ttc cag ttc agc tac gag ttt gag 3172 Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu Phe Glu 1025 1030 1035 aac gta cct ttc cat agc agc tac gct cac agc caa agc ctg gac 3217 Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp 1040 1045 1050 cga cta atg aat cca ctc atc gac caa tac ttg tac tat ctc tca 3262 Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 1055 1060 1065 aag act att aac ggt tct gga cag aat caa caa acg cta aaa ttc 3307 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe 1070 1075 1080 agt gtg gcc gga ccc agc aac atg gct gtc cag gga aga aac tac 3352 Ser Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr 1085 1090 1095 ata cct gga ccc agc tac cga caa caa cgt gtc tca acc act gtg 3397 Ile Pro Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val 1100 1105 1110 act caa aac aac aac agc gaa ttt gct tgg cct gga gct tct tct 3442 Thr Gln Asn Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser 1115 1120 1125 tgg gct ctc aat gga cgt aat agc ttg atg aat cct gga cct gct 3487 Trp Ala Leu Asn Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala 1130 1135 1140 atg gcc agc cac aaa gaa gga gag gac cgt ttc ttt cct ttg tct 3532 Met Ala Ser His Lys Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser 1145 1150 1155 gga tct tta att ttt ggc aaa caa gga act gga aga gac aac gtg 3577 Gly Ser Leu Ile Phe Gly Lys Gln Gly Thr Gly Arg Asp Asn Val 1160 1165 1170 gat gcg gac aaa gtc atg ata acc aac gaa gaa gaa att aaa act 3622 Asp Ala Asp Lys Val Met Ile Thr Asn Glu Glu Glu Ile Lys Thr 1175 1180 1185 act aac ccg gta gca acg gag tcc tat gga caa gtg gcc aca aac 3667 Thr Asn Pro Val Ala Thr Glu Ser Tyr Gly Gln Val Ala Thr Asn 1190 1195 1200 cac cag agt gcc caa atc gag atc aac gct acc aga gct gga acc 3712 His Gln Ser Ala Gln Ile Glu Ile Asn Ala Thr Arg Ala Gly Thr 1205 1210 1215 aac ctg gca cag gcg cag acc ggc tgg gtt caa aac caa gga ata 3757 Asn Leu Ala Gln Ala Gln Thr Gly Trp Val Gln Asn Gln Gly Ile 1220 1225 1230 ctt ccg ggt atg gtt tgg cag gac aga gat gtg tac ctg caa gga 3802 Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly 1235 1240 1245 ccc att tgg gcc aaa att cct cac acg gac ggc aac ttt cac cct 3847 Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly Asn Phe His Pro 1250 1255 1260 tct ccg ctg atg gga ggg ttt gga atg aag cac ccg cct cct cag 3892 Ser Pro Leu Met Gly Gly Phe Gly Met Lys His Pro Pro Pro Gln 1265 1270 1275 atc ctc atc aaa aac aca cct gta cct gcg gat cct cca acg gcc 3937 Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asp Pro Pro Thr Ala 1280 1285 1290 ttc aac aag gac aag ctg aac tct ttc atc acc cag tat tct act 3982 Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr Gln Tyr Ser Thr 1295 1300 1305 ggc caa gtc agc gtg gag atc gag tgg gag ctg cag aag gaa aac 4027 Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn 1310 1315 1320 agc aag cgc tgg aac ccg gag atc cag tac act tcc aac tat tac 4072 Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Tyr 1325 1330 1335 aag tct aat aat gtt gaa ttt gct gtt aat act gaa ggt gta tat 4117 Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val Tyr 1340 1345 1350 agt gaa ccc cgc ccc att ggc acc aga tac ctg act cgt aat ctg 4162 Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 1355 1360 1365 taa ttgcttgtta atcaataaac cgtttaattc gtttcagttg aactttggtc 4215 tctgcgaagg gcgaattcgt ttaaacctgc aggactagag gtcctgtatt agaggtcacg 4275 tgagtgtttt gcgacatttt gcgacaccat gtggtcacgc tgggtattta agcccgagtg 4335 agcacgcagg gtctccattt tgaagcggga ggtttgaacg cgcagccgcc aagccgaatt 4395 ctgcagatat ccatcacact ggcggccgct cgactagagc ggccgccacc gcggtggagc 4455 tccagctttt gttcccttta gtgagggtta attgcgcgct tggcgtaatc atggtcatag 4515 ctgtttcctg tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc 4575 ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc 4635 tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa 4695 cgcgcgggga gaggcggttt gcgtattggg cgc 4728 <210> 5 <211> 621 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 5 Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp 1 5 10 15 Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu 20 25 30 Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile 35 40 45 Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu 50 55 60 Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val 65 70 75 80 Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu 85 90 95 Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile 100 105 110 Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu 115 120 125 Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly 130 135 140 Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys 145 150 155 160 Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu 165 170 175 Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His 180 185 190 Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn 195 200 205 Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr 210 215 220 Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys 225 230 235 240 Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala 245 250 255 Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys 260 265 270 Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln 275 280 285 Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu 290 295 300 Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala 305 310 315 320 Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala 325 330 335 Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro 340 345 350 Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp 355 360 365 Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala 370 375 380 Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg 385 390 395 400 Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val 405 410 415 Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser 420 425 430 Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe 435 440 445 Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln 450 455 460 Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val 465 470 475 480 Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala 485 490 495 Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val 500 505 510 Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp 515 520 525 Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu 530 535 540 Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys 545 550 555 560 Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu 565 570 575 Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr 580 585 590 Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp 595 600 605 Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln 610 615 620 <210> 6 <211> 748 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 6 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ile Glu Ile Asn 580 585 590 Ala Thr Arg Ala Gly Thr Asn Leu Ala Gln Ala Gln Thr Gly Trp Val 595 600 605 Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val 610 615 620 Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly Asn 625 630 635 640 Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met Lys His Pro Pro 645 650 655 Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asp Pro Pro Thr 660 665 670 Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr Gln Tyr Ser Thr 675 680 685 Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser 690 695 700 Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Tyr Lys Ser 705 710 715 720 Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val Tyr Ser Glu Pro 725 730 735 Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 740 745 <210> 7 <211> 4740 <212> DNA <213> Artificial Sequence <220> <223> AAV2/9 n.588.IEI-L nucleic acid sequence epxression cassette <220> <221> misc_feature <222> (1)..(36) <223> trunccated promoter <220> <221> promoter <222> (1)..(7) <223> p5 Promoter <220> <221> CDS <222> (37)..(1899) <223> AAV2 Rep <220> <221> CDS <222> (1919)..(4177) <223> AAV9 Cap <220> <221> misc_feature <222> (3683)..(3739) <223> IEI-L <220> <221> misc_feature <222> (4268)..(4398) <223> p5 promoter <220> <221> misc_feature <222> (4526)..(4740) <223> LacZ promoter <400> 7 ccattttgaa gcgggaggtt tgaacgcgca gccgcc atg ccg ggg ttt tac gag 54 Met Pro Gly Phe Tyr Glu 1 5 att gtg att aag gtc ccc agc gac ctt gac gag cat ctg ccc ggc att 102 Ile Val Ile Lys Val Pro Ser Asp Leu Asp Glu His Leu Pro Gly Ile 10 15 20 tct gac agc ttt gtg aac tgg gtg gcc gag aag gaa tgg gag ttg ccg 150 Ser Asp Ser Phe Val Asn Trp Val Ala Glu Lys Glu Trp Glu Leu Pro 25 30 35 cca gat tct gac atg gat ctg aat ctg att gag cag gca ccc ctg acc 198 Pro Asp Ser Asp Met Asp Leu Asn Leu Ile Glu Gln Ala Pro Leu Thr 40 45 50 gtg gcc gag aag ctg cag cgc gac ttt ctg acg gaa tgg cgc cgt gtg 246 Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Thr Glu Trp Arg Arg Val 55 60 65 70 agt aag gcc ccg gag gct ctt ttc ttt gtg caa ttt gag aag gga gag 294 Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Gln Phe Glu Lys Gly Glu 75 80 85 agc tac ttc cac atg cac gtg ctc gtg gaa acc acc ggg gtg aaa tcc 342 Ser Tyr Phe His Met His Val Leu Val Glu Thr Thr Gly Val Lys Ser 90 95 100 atg gtt ttg gga cgt ttc ctg agt cag att cgc gaa aaa ctg att cag 390 Met Val Leu Gly Arg Phe Leu Ser Gln Ile Arg Glu Lys Leu Ile Gln 105 110 115 aga att tac cgc ggg atc gag ccg act ttg cca aac tgg ttc gcg gtc 438 Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu Pro Asn Trp Phe Ala Val 120 125 130 aca aag acc aga aat ggc gcc gga ggc ggg aac aag gtg gtg gat gag 486 Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Asn Lys Val Val Asp Glu 135 140 145 150 tgc tac atc ccc aat tac ttg ctc ccc aaa acc cag cct gag ctc cag 534 Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Thr Gln Pro Glu Leu Gln 155 160 165 tgg gcg tgg act aat atg gaa cag tat tta agc gcc tgt ttg aat ctc 582 Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu Ser Ala Cys Leu Asn Leu 170 175 180 acg gag cgt aaa cgg ttg gtg gcg cag cat ctg acg cac gtg tcg cag 630 Thr Glu Arg Lys Arg Leu Val Ala Gln His Leu Thr His Val Ser Gln 185 190 195 acg cag gag cag aac aaa gag aat cag aat ccc aat tct gat gcg ccg 678 Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Pro Asn Ser Asp Ala Pro 200 205 210 gtg atc aga tca aaa act tca gcc agg tac atg gag ctg gtc ggg tgg 726 Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Met Glu Leu Val Gly Trp 215 220 225 230 ctc gtg gac aag ggg att acc tcg gag aag cag tgg atc cag gag gac 774 Leu Val Asp Lys Gly Ile Thr Ser Glu Lys Gln Trp Ile Gln Glu Asp 235 240 245 cag gcc tca tac atc tcc ttc aat gcg gcc tcc aac tcg cgg tcc caa 822 Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Ser Asn Ser Arg Ser Gln 250 255 260 atc aag gct gcc ttg gac aat gcg gga aag att atg agc ctg act aaa 870 Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile Met Ser Leu Thr Lys 265 270 275 acc gcc ccc gac tac ctg gtg ggc cag cag ccc gtg gag gac att tcc 918 Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro Val Glu Asp Ile Ser 280 285 290 agc aat cgg att tat aaa att ttg gaa cta aac ggg tac gat ccc caa 966 Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn Gly Tyr Asp Pro Gln 295 300 305 310 tat gcg gct tcc gtc ttt ctg gga tgg gcc acg aaa aag ttc ggc aag 1014 Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr Lys Lys Phe Gly Lys 315 320 325 agg aac acc atc tgg ctg ttt ggg cct gca act acc ggg aag acc aac 1062 Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr Thr Gly Lys Thr Asn 330 335 340 atc gcg gag gcc ata gcc cac act gtg ccc ttc tac ggg tgc gta aac 1110 Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe Tyr Gly Cys Val Asn 345 350 355 tgg acc aat gag aac ttt ccc ttc aac gac tgt gtc gac aag atg gtg 1158 Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys Val Asp Lys Met Val 360 365 370 atc tgg tgg gag gag ggg aag atg acc gcc aag gtc gtg gag tcg gcc 1206 Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys Val Val Glu Ser Ala 375 380 385 390 aaa gcc att ctc gga gga agc aag gtg cgc gtg gac cag aaa tgc aag 1254 Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val Asp Gln Lys Cys Lys 395 400 405 tcc tcg gcc cag ata gac ccg act ccc gtg atc gtc acc tcc aac acc 1302 Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile Val Thr Ser Asn Thr 410 415 420 aac atg tgc gcc gtg att gac ggg aac tca acg acc ttc gaa cac cag 1350 Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr Thr Phe Glu His Gln 425 430 435 cag ccg ttg caa gac cgg atg ttc aaa ttt gaa ctc acc cgc cgt ctg 1398 Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu Leu Thr Arg Arg Leu 440 445 450 gat cat gac ttt ggg aag gtc acc aag cag gaa gtc aaa gac ttt ttc 1446 Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Val Lys Asp Phe Phe 455 460 465 470 cgg tgg gca aag gat cac gtg gtt gag gtg gag cat gaa ttc tac gtc 1494 Arg Trp Ala Lys Asp His Val Val Glu Val Glu His Glu Phe Tyr Val 475 480 485 aaa aag ggt gga gcc aag aaa aga ccc gcc ccc agt gac gca gat ata 1542 Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro Ser Asp Ala Asp Ile 490 495 500 agt gag ccc aaa cgg gtg cgc gag tca gtt gcg cag cca tcg acg tca 1590 Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala Gln Pro Ser Thr Ser 505 510 515 gac gcg gaa gct tcg atc aac tac gca gac agg tac caa aac aaa tgt 1638 Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg Tyr Gln Asn Lys Cys 520 525 530 tct cgt cac gtg ggc atg aat ctg atg ctg ttt ccc tgc aga caa tgc 1686 Ser Arg His Val Gly Met Asn Leu Met Leu Phe Pro Cys Arg Gln Cys 535 540 545 550 gag aga atg aat cag aat tca aat atc tgc ttc act cac gga cag aaa 1734 Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe Thr His Gly Gln Lys 555 560 565 gac tgt tta gag tgc ttt ccc gtg tca gaa tct caa ccc gtt tct gtc 1782 Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Ser Gln Pro Val Ser Val 570 575 580 gtc aaa aag gcg tat cag aaa ctg tgc tac att cat cat atc atg gga 1830 Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ile His His Ile Met Gly 585 590 595 aag gtg cca gac gct tgc act gcc tgc gat ctg gtc aat gtg gat ttg 1878 Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Leu Val Asn Val Asp Leu 600 605 610 gat gac tgc atc ttt gaa caa taaatgattt aaatcaggt atg gct gcc gat 1930 Asp Asp Cys Ile Phe Glu Gln Met Ala Ala Asp 615 620 625 ggt tat ctt cca gat tgg ctc gag gac aac ctt agt gaa gga att cgc 1978 Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser Glu Gly Ile Arg 630 635 640 gag tgg tgg gct ttg aaa cct gga gcc cct caa ccc aag gca aat caa 2026 Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro Lys Ala Asn Gln 645 650 655 caa cat caa gac aac gct cga ggt ctt gtg ctt ccg ggt tac aaa tac 2074 Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro Gly Tyr Lys Tyr 660 665 670 ctt gga ccc ggc aac gga ctc gac aag ggg gag ccg gtc aac gca gca 2122 Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro Val Asn Ala Ala 675 680 685 gac gcg gcg gcc ctc gag cac gac aag gcc tac gac cag cag ctc aag 2170 Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp Gln Gln Leu Lys 690 695 700 705 gcc gga gac aac ccg tac ctc aag tac aac cac gcc gac gcc gag ttc 2218 Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp Ala Glu Phe 710 715 720 cag gag cgg ctc aaa gaa gat acg tct ttt ggg ggc aac ctc ggg cga 2266 Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly Asn Leu Gly Arg 725 730 735 gca gtc ttc cag gcc aaa aag agg ctt ctt gaa cct ctt ggt ctg gtt 2314 Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro Leu Gly Leu Val 740 745 750 gag gaa gcg gct aag acg gct cct gga aag aag agg cct gta gag cag 2362 Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg Pro Val Glu Gln 755 760 765 tct cct cag gaa ccg gac tcc tcc gcg ggt att ggc aaa tcg ggt gca 2410 Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly Lys Ser Gly Ala 770 775 780 785 cag ccc gct aaa aag aga ctc aat ttc ggt cag act ggc gac aca gag 2458 Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr Gly Asp Thr Glu 790 795 800 tca gtc cca gac cct caa cca atc gga gaa cct ccc gca gcc ccc tca 2506 Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro Ala Ala Pro Ser 805 810 815 ggt gtg gga tct ctt aca atg gct tca ggt ggt ggc gca cca gtg gca 2554 Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly Ala Pro Val Ala 820 825 830 gac aat aac gaa ggt gcc gat gga gtg ggt agt tcc tcg gga aat tgg 2602 Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser Ser Gly Asn Trp 835 840 845 cat tgc gat tcc caa tgg ctg ggg gac aga gtc atc acc acc agc acc 2650 His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile Thr Thr Ser Thr 850 855 860 865 cga acc tgg gcc ctg ccc acc tac aac aat cac ctc tac aag caa atc 2698 Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile 870 875 880 tcc aac agc aca tct gga gga tct tca aat gac aac gcc tac ttc ggc 2746 Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn Ala Tyr Phe Gly 885 890 895 tac agc acc ccc tgg ggg tat ttt gac ttc aac aga ttc cac tgc cac 2794 Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His Cys His 900 905 910 ttc tca cca cgt gac tgg cag cga ctc atc aac aac aac tgg gga ttc 2842 Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Phe 915 920 925 cgg cct aag cga ctc aac ttc aag ctc ttc aac att cag gtc aaa gag 2890 Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val Lys Glu 930 935 940 945 gtt acg gac aac aat gga gtc aag acc atc gcc aat aac ctt acc agc 2938 Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn Asn Leu Thr Ser 950 955 960 acg gtc cag gtc ttc acg gac tca gac tat cag ctc ccg tac gtg ctc 2986 Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu Pro Tyr Val Leu 965 970 975 ggg tcg gct cac gag ggc tgc ctc ccg ccg ttc cca gcg gac gtt ttc 3034 Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro Ala Asp Val Phe 980 985 990 atg att cct cag tac ggg tat ctg acg ctt aat gat gga agc cag gcc 3082 Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp Gly Ser Gln Ala 995 1000 1005 gtg ggt cgt tcg tcc ttt tac tgc ctg gaa tat ttc ccg tcg caa 3127 Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln 1010 1015 1020 atg cta aga acg ggt aac aac ttc cag ttc agc tac gag ttt gag 3172 Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu Phe Glu 1025 1030 1035 aac gta cct ttc cat agc agc tac gct cac agc caa agc ctg gac 3217 Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp 1040 1045 1050 cga cta atg aat cca ctc atc gac caa tac ttg tac tat ctc tca 3262 Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 1055 1060 1065 aag act att aac ggt tct gga cag aat caa caa acg cta aaa ttc 3307 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe 1070 1075 1080 agt gtg gcc gga ccc agc aac atg gct gtc cag gga aga aac tac 3352 Ser Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr 1085 1090 1095 ata cct gga ccc agc tac cga caa caa cgt gtc tca acc act gtg 3397 Ile Pro Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val 1100 1105 1110 act caa aac aac aac agc gaa ttt gct tgg cct gga gct tct tct 3442 Thr Gln Asn Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser 1115 1120 1125 tgg gct ctc aat gga cgt aat agc ttg atg aat cct gga cct gct 3487 Trp Ala Leu Asn Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala 1130 1135 1140 atg gcc agc cac aaa gaa gga gag gac cgt ttc ttt cct ttg tct 3532 Met Ala Ser His Lys Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser 1145 1150 1155 gga tct tta att ttt ggc aaa caa gga act gga aga gac aac gtg 3577 Gly Ser Leu Ile Phe Gly Lys Gln Gly Thr Gly Arg Asp Asn Val 1160 1165 1170 gat gcg gac aaa gtc atg ata acc aac gaa gaa gaa att aaa act 3622 Asp Ala Asp Lys Val Met Ile Thr Asn Glu Glu Glu Ile Lys Thr 1175 1180 1185 act aac ccg gta gca acg gag tcc tat gga caa gtg gcc aca aac 3667 Thr Asn Pro Val Ala Thr Glu Ser Tyr Gly Gln Val Ala Thr Asn 1190 1195 1200 cac cag agt gcc caa gga gga atc gag atc aac gct acc aga gct 3712 His Gln Ser Ala Gln Gly Gly Ile Glu Ile Asn Ala Thr Arg Ala 1205 1210 1215 gga acc aac ctg gga gga gca cag gcg cag acc ggc tgg gtt caa 3757 Gly Thr Asn Leu Gly Gly Ala Gln Ala Gln Thr Gly Trp Val Gln 1220 1225 1230 aac caa gga ata ctt ccg ggt atg gtt tgg cag gac aga gat gtg 3802 Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val 1235 1240 1245 tac ctg caa gga ccc att tgg gcc aaa att cct cac acg gac ggc 3847 Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly 1250 1255 1260 aac ttt cac cct tct ccg ctg atg gga ggg ttt gga atg aag cac 3892 Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met Lys His 1265 1270 1275 ccg cct cct cag atc ctc atc aaa aac aca cct gta cct gcg gat 3937 Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asp 1280 1285 1290 cct cca acg gcc ttc aac aag gac aag ctg aac tct ttc atc acc 3982 Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 1295 1300 1305 cag tat tct act ggc caa gtc agc gtg gag atc gag tgg gag ctg 4027 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu 1310 1315 1320 cag aag gaa aac agc aag cgc tgg aac ccg gag atc cag tac act 4072 Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 1325 1330 1335 tcc aac tat tac aag tct aat aat gtt gaa ttt gct gtt aat act 4117 Ser Asn Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr 1340 1345 1350 gaa ggt gta tat agt gaa ccc cgc ccc att ggc acc aga tac ctg 4162 Glu Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu 1355 1360 1365 act cgt aat ctg taa ttgcttgtta atcaataaac cgtttaattc gtttcagttg 4217 Thr Arg Asn Leu 1370 aactttggtc tctgcgaagg gcgaattcgt ttaaacctgc aggactagag gtcctgtatt 4277 agaggtcacg tgagtgtttt gcgacatttt gcgacaccat gtggtcacgc tgggtattta 4337 agcccgagtg agcacgcagg gtctccattt tgaagcggga ggtttgaacg cgcagccgcc 4397 aagccgaatt ctgcagatat ccatcacact ggcggccgct cgactagagc ggccgccacc 4457 gcggtggagc tccagctttt gttcccttta gtgagggtta attgcgcgct tggcgtaatc 4517 atggtcatag ctgtttcctg tgtgaaattg ttatccgctc acaattccac acaacatacg 4577 agccggaagc ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat 4637 tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg 4697 aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgc 4740 <210> 8 <211> 621 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 8 Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp 1 5 10 15 Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu 20 25 30 Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile 35 40 45 Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu 50 55 60 Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val 65 70 75 80 Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu 85 90 95 Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile 100 105 110 Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu 115 120 125 Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly 130 135 140 Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys 145 150 155 160 Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu 165 170 175 Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His 180 185 190 Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn 195 200 205 Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr 210 215 220 Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys 225 230 235 240 Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala 245 250 255 Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys 260 265 270 Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln 275 280 285 Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu 290 295 300 Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala 305 310 315 320 Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala 325 330 335 Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro 340 345 350 Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp 355 360 365 Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala 370 375 380 Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg 385 390 395 400 Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val 405 410 415 Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser 420 425 430 Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe 435 440 445 Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln 450 455 460 Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val 465 470 475 480 Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala 485 490 495 Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val 500 505 510 Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp 515 520 525 Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu 530 535 540 Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys 545 550 555 560 Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu 565 570 575 Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr 580 585 590 Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp 595 600 605 Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln 610 615 620 <210> 9 <211> 752 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 9 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Gly Gly Ile Glu 580 585 590 Ile Asn Ala Thr Arg Ala Gly Thr Asn Leu Gly Gly Ala Gln Ala Gln 595 600 605 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 610 615 620 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 625 630 635 640 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 645 650 655 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 660 665 670 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 675 680 685 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 690 695 700 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 705 710 715 720 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 725 730 735 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 740 745 750 <210> 10 <211> 4722 <212> DNA <213> Artificial Sequence <220> <223> AAV2/9 n.588.SAN nucleic acid sequence expression cassette <220> <221> misc_feature <222> (1)..(36) <223> truncated promoter <220> <221> promoter <222> (1)..(7) <223> p5 promoter <220> <221> CDS <222> (37)..(1899) <223> AAV2 Rep <220> <221> CDS <222> (1919)..(4159) <223> AAV 9 Cap <220> <221> misc_feature <222> (3683)..(3712) <223> SAN <220> <221> misc_feature <222> (4250)..(4380) <223> p5 promoter <220> <221> misc_feature <222> (4508)..(4722) <223> LacZ promoter <400> 10 ccattttgaa gcgggaggtt tgaacgcgca gccgcc atg ccg ggg ttt tac gag 54 Met Pro Gly Phe Tyr Glu 1 5 att gtg att aag gtc ccc agc gac ctt gac gag cat ctg ccc ggc att 102 Ile Val Ile Lys Val Pro Ser Asp Leu Asp Glu His Leu Pro Gly Ile 10 15 20 tct gac agc ttt gtg aac tgg gtg gcc gag aag gaa tgg gag ttg ccg 150 Ser Asp Ser Phe Val Asn Trp Val Ala Glu Lys Glu Trp Glu Leu Pro 25 30 35 cca gat tct gac atg gat ctg aat ctg att gag cag gca ccc ctg acc 198 Pro Asp Ser Asp Met Asp Leu Asn Leu Ile Glu Gln Ala Pro Leu Thr 40 45 50 gtg gcc gag aag ctg cag cgc gac ttt ctg acg gaa tgg cgc cgt gtg 246 Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Thr Glu Trp Arg Arg Val 55 60 65 70 agt aag gcc ccg gag gct ctt ttc ttt gtg caa ttt gag aag gga gag 294 Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Gln Phe Glu Lys Gly Glu 75 80 85 agc tac ttc cac atg cac gtg ctc gtg gaa acc acc ggg gtg aaa tcc 342 Ser Tyr Phe His Met His Val Leu Val Glu Thr Thr Gly Val Lys Ser 90 95 100 atg gtt ttg gga cgt ttc ctg agt cag att cgc gaa aaa ctg att cag 390 Met Val Leu Gly Arg Phe Leu Ser Gln Ile Arg Glu Lys Leu Ile Gln 105 110 115 aga att tac cgc ggg atc gag ccg act ttg cca aac tgg ttc gcg gtc 438 Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu Pro Asn Trp Phe Ala Val 120 125 130 aca aag acc aga aat ggc gcc gga ggc ggg aac aag gtg gtg gat gag 486 Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Asn Lys Val Val Asp Glu 135 140 145 150 tgc tac atc ccc aat tac ttg ctc ccc aaa acc cag cct gag ctc cag 534 Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Thr Gln Pro Glu Leu Gln 155 160 165 tgg gcg tgg act aat atg gaa cag tat tta agc gcc tgt ttg aat ctc 582 Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu Ser Ala Cys Leu Asn Leu 170 175 180 acg gag cgt aaa cgg ttg gtg gcg cag cat ctg acg cac gtg tcg cag 630 Thr Glu Arg Lys Arg Leu Val Ala Gln His Leu Thr His Val Ser Gln 185 190 195 acg cag gag cag aac aaa gag aat cag aat ccc aat tct gat gcg ccg 678 Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Pro Asn Ser Asp Ala Pro 200 205 210 gtg atc aga tca aaa act tca gcc agg tac atg gag ctg gtc ggg tgg 726 Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Met Glu Leu Val Gly Trp 215 220 225 230 ctc gtg gac aag ggg att acc tcg gag aag cag tgg atc cag gag gac 774 Leu Val Asp Lys Gly Ile Thr Ser Glu Lys Gln Trp Ile Gln Glu Asp 235 240 245 cag gcc tca tac atc tcc ttc aat gcg gcc tcc aac tcg cgg tcc caa 822 Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Ser Asn Ser Arg Ser Gln 250 255 260 atc aag gct gcc ttg gac aat gcg gga aag att atg agc ctg act aaa 870 Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile Met Ser Leu Thr Lys 265 270 275 acc gcc ccc gac tac ctg gtg ggc cag cag ccc gtg gag gac att tcc 918 Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro Val Glu Asp Ile Ser 280 285 290 agc aat cgg att tat aaa att ttg gaa cta aac ggg tac gat ccc caa 966 Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn Gly Tyr Asp Pro Gln 295 300 305 310 tat gcg gct tcc gtc ttt ctg gga tgg gcc acg aaa aag ttc ggc aag 1014 Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr Lys Lys Phe Gly Lys 315 320 325 agg aac acc atc tgg ctg ttt ggg cct gca act acc ggg aag acc aac 1062 Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr Thr Gly Lys Thr Asn 330 335 340 atc gcg gag gcc ata gcc cac act gtg ccc ttc tac ggg tgc gta aac 1110 Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe Tyr Gly Cys Val Asn 345 350 355 tgg acc aat gag aac ttt ccc ttc aac gac tgt gtc gac aag atg gtg 1158 Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys Val Asp Lys Met Val 360 365 370 atc tgg tgg gag gag ggg aag atg acc gcc aag gtc gtg gag tcg gcc 1206 Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys Val Val Glu Ser Ala 375 380 385 390 aaa gcc att ctc gga gga agc aag gtg cgc gtg gac cag aaa tgc aag 1254 Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val Asp Gln Lys Cys Lys 395 400 405 tcc tcg gcc cag ata gac ccg act ccc gtg atc gtc acc tcc aac acc 1302 Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile Val Thr Ser Asn Thr 410 415 420 aac atg tgc gcc gtg att gac ggg aac tca acg acc ttc gaa cac cag 1350 Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr Thr Phe Glu His Gln 425 430 435 cag ccg ttg caa gac cgg atg ttc aaa ttt gaa ctc acc cgc cgt ctg 1398 Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu Leu Thr Arg Arg Leu 440 445 450 gat cat gac ttt ggg aag gtc acc aag cag gaa gtc aaa gac ttt ttc 1446 Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Val Lys Asp Phe Phe 455 460 465 470 cgg tgg gca aag gat cac gtg gtt gag gtg gag cat gaa ttc tac gtc 1494 Arg Trp Ala Lys Asp His Val Val Glu Val Glu His Glu Phe Tyr Val 475 480 485 aaa aag ggt gga gcc aag aaa aga ccc gcc ccc agt gac gca gat ata 1542 Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro Ser Asp Ala Asp Ile 490 495 500 agt gag ccc aaa cgg gtg cgc gag tca gtt gcg cag cca tcg acg tca 1590 Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala Gln Pro Ser Thr Ser 505 510 515 gac gcg gaa gct tcg atc aac tac gca gac agg tac caa aac aaa tgt 1638 Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg Tyr Gln Asn Lys Cys 520 525 530 tct cgt cac gtg ggc atg aat ctg atg ctg ttt ccc tgc aga caa tgc 1686 Ser Arg His Val Gly Met Asn Leu Met Leu Phe Pro Cys Arg Gln Cys 535 540 545 550 gag aga atg aat cag aat tca aat atc tgc ttc act cac gga cag aaa 1734 Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe Thr His Gly Gln Lys 555 560 565 gac tgt tta gag tgc ttt ccc gtg tca gaa tct caa ccc gtt tct gtc 1782 Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Ser Gln Pro Val Ser Val 570 575 580 gtc aaa aag gcg tat cag aaa ctg tgc tac att cat cat atc atg gga 1830 Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ile His His Ile Met Gly 585 590 595 aag gtg cca gac gct tgc act gcc tgc gat ctg gtc aat gtg gat ttg 1878 Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Leu Val Asn Val Asp Leu 600 605 610 gat gac tgc atc ttt gaa caa taaatgattt aaatcaggt atg gct gcc gat 1930 Asp Asp Cys Ile Phe Glu Gln Met Ala Ala Asp 615 620 625 ggt tat ctt cca gat tgg ctc gag gac aac ctt agt gaa gga att cgc 1978 Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser Glu Gly Ile Arg 630 635 640 gag tgg tgg gct ttg aaa cct gga gcc cct caa ccc aag gca aat caa 2026 Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro Lys Ala Asn Gln 645 650 655 caa cat caa gac aac gct cga ggt ctt gtg ctt ccg ggt tac aaa tac 2074 Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro Gly Tyr Lys Tyr 660 665 670 ctt gga ccc ggc aac gga ctc gac aag ggg gag ccg gtc aac gca gca 2122 Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro Val Asn Ala Ala 675 680 685 gac gcg gcg gcc ctc gag cac gac aag gcc tac gac cag cag ctc aag 2170 Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp Gln Gln Leu Lys 690 695 700 705 gcc gga gac aac ccg tac ctc aag tac aac cac gcc gac gcc gag ttc 2218 Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp Ala Glu Phe 710 715 720 cag gag cgg ctc aaa gaa gat acg tct ttt ggg ggc aac ctc ggg cga 2266 Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly Asn Leu Gly Arg 725 730 735 gca gtc ttc cag gcc aaa aag agg ctt ctt gaa cct ctt ggt ctg gtt 2314 Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro Leu Gly Leu Val 740 745 750 gag gaa gcg gct aag acg gct cct gga aag aag agg cct gta gag cag 2362 Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg Pro Val Glu Gln 755 760 765 tct cct cag gaa ccg gac tcc tcc gcg ggt att ggc aaa tcg ggt gca 2410 Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly Lys Ser Gly Ala 770 775 780 785 cag ccc gct aaa aag aga ctc aat ttc ggt cag act ggc gac aca gag 2458 Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr Gly Asp Thr Glu 790 795 800 tca gtc cca gac cct caa cca atc gga gaa cct ccc gca gcc ccc tca 2506 Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro Ala Ala Pro Ser 805 810 815 ggt gtg gga tct ctt aca atg gct tca ggt ggt ggc gca cca gtg gca 2554 Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly Ala Pro Val Ala 820 825 830 gac aat aac gaa ggt gcc gat gga gtg ggt agt tcc tcg gga aat tgg 2602 Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser Ser Gly Asn Trp 835 840 845 cat tgc gat tcc caa tgg ctg ggg gac aga gtc atc acc acc agc acc 2650 His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile Thr Thr Ser Thr 850 855 860 865 cga acc tgg gcc ctg ccc acc tac aac aat cac ctc tac aag caa atc 2698 Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile 870 875 880 tcc aac agc aca tct gga gga tct tca aat gac aac gcc tac ttc ggc 2746 Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn Ala Tyr Phe Gly 885 890 895 tac agc acc ccc tgg ggg tat ttt gac ttc aac aga ttc cac tgc cac 2794 Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His Cys His 900 905 910 ttc tca cca cgt gac tgg cag cga ctc atc aac aac aac tgg gga ttc 2842 Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Phe 915 920 925 cgg cct aag cga ctc aac ttc aag ctc ttc aac att cag gtc aaa gag 2890 Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val Lys Glu 930 935 940 945 gtt acg gac aac aat gga gtc aag acc atc gcc aat aac ctt acc agc 2938 Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn Asn Leu Thr Ser 950 955 960 acg gtc cag gtc ttc acg gac tca gac tat cag ctc ccg tac gtg ctc 2986 Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu Pro Tyr Val Leu 965 970 975 ggg tcg gct cac gag ggc tgc ctc ccg ccg ttc cca gcg gac gtt ttc 3034 Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro Ala Asp Val Phe 980 985 990 atg att cct cag tac ggg tat ctg acg ctt aat gat gga agc cag gcc 3082 Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp Gly Ser Gln Ala 995 1000 1005 gtg ggt cgt tcg tcc ttt tac tgc ctg gaa tat ttc ccg tcg caa 3127 Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln 1010 1015 1020 atg cta aga acg ggt aac aac ttc cag ttc agc tac gag ttt gag 3172 Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu Phe Glu 1025 1030 1035 aac gta cct ttc cat agc agc tac gct cac agc caa agc ctg gac 3217 Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp 1040 1045 1050 cga cta atg aat cca ctc atc gac caa tac ttg tac tat ctc tca 3262 Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 1055 1060 1065 aag act att aac ggt tct gga cag aat caa caa acg cta aaa ttc 3307 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe 1070 1075 1080 agt gtg gcc gga ccc agc aac atg gct gtc cag gga aga aac tac 3352 Ser Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr 1085 1090 1095 ata cct gga ccc agc tac cga caa caa cgt gtc tca acc act gtg 3397 Ile Pro Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val 1100 1105 1110 act caa aac aac aac agc gaa ttt gct tgg cct gga gct tct tct 3442 Thr Gln Asn Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser 1115 1120 1125 tgg gct ctc aat gga cgt aat agc ttg atg aat cct gga cct gct 3487 Trp Ala Leu Asn Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala 1130 1135 1140 atg gcc agc cac aaa gaa gga gag gac cgt ttc ttt cct ttg tct 3532 Met Ala Ser His Lys Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser 1145 1150 1155 gga tct tta att ttt ggc aaa caa gga act gga aga gac aac gtg 3577 Gly Ser Leu Ile Phe Gly Lys Gln Gly Thr Gly Arg Asp Asn Val 1160 1165 1170 gat gcg gac aaa gtc atg ata acc aac gaa gaa gaa att aaa act 3622 Asp Ala Asp Lys Val Met Ile Thr Asn Glu Glu Glu Ile Lys Thr 1175 1180 1185 act aac ccg gta gca acg gag tcc tat gga caa gtg gcc aca aac 3667 Thr Asn Pro Val Ala Thr Glu Ser Tyr Gly Gln Val Ala Thr Asn 1190 1195 1200 cac cag agt gcc caa agc gct aac ttc atc aag cct acc agc tac 3712 His Gln Ser Ala Gln Ser Ala Asn Phe Ile Lys Pro Thr Ser Tyr 1205 1210 1215 gca cag gcg cag acc ggc tgg gtt caa aac caa gga ata ctt ccg 3757 Ala Gln Ala Gln Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro 1220 1225 1230 ggt atg gtt tgg cag gac aga gat gtg tac ctg caa gga ccc att 3802 Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile 1235 1240 1245 tgg gcc aaa att cct cac acg gac ggc aac ttt cac cct tct ccg 3847 Trp Ala Lys Ile Pro His Thr Asp Gly Asn Phe His Pro Ser Pro 1250 1255 1260 ctg atg gga ggg ttt gga atg aag cac ccg cct cct cag atc ctc 3892 Leu Met Gly Gly Phe Gly Met Lys His Pro Pro Pro Gln Ile Leu 1265 1270 1275 atc aaa aac aca cct gta cct gcg gat cct cca acg gcc ttc aac 3937 Ile Lys Asn Thr Pro Val Pro Ala Asp Pro Pro Thr Ala Phe Asn 1280 1285 1290 aag gac aag ctg aac tct ttc atc acc cag tat tct act ggc caa 3982 Lys Asp Lys Leu Asn Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln 1295 1300 1305 gtc agc gtg gag atc gag tgg gag ctg cag aag gaa aac agc aag 4027 Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys 1310 1315 1320 cgc tgg aac ccg gag atc cag tac act tcc aac tat tac aag tct 4072 Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Tyr Lys Ser 1325 1330 1335 aat aat gtt gaa ttt gct gtt aat act gaa ggt gta tat agt gaa 4117 Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val Tyr Ser Glu 1340 1345 1350 ccc cgc ccc att ggc acc aga tac ctg act cgt aat ctg taa 4159 Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 1355 1360 1365 ttgcttgtta atcaataaac cgtttaattc gtttcagttg aactttggtc tctgcgaagg 4219 gcgaattcgt ttaaacctgc aggactagag gtcctgtatt agaggtcacg tgagtgtttt 4279 gcgacatttt gcgacaccat gtggtcacgc tgggtattta agcccgagtg agcacgcagg 4339 gtctccattt tgaagcggga ggtttgaacg cgcagccgcc aagccgaatt ctgcagatat 4399 ccatcacact ggcggccgct cgactagagc ggccgccacc gcggtggagc tccagctttt 4459 gttcccttta gtgagggtta attgcgcgct tggcgtaatc atggtcatag ctgtttcctg 4519 tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 4579 aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 4639 ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 4699 gaggcggttt gcgtattggg cgc 4722 <210> 11 <211> 621 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 11 Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp 1 5 10 15 Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu 20 25 30 Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile 35 40 45 Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu 50 55 60 Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val 65 70 75 80 Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu 85 90 95 Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile 100 105 110 Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu 115 120 125 Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly 130 135 140 Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys 145 150 155 160 Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu 165 170 175 Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His 180 185 190 Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn 195 200 205 Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr 210 215 220 Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys 225 230 235 240 Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala 245 250 255 Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys 260 265 270 Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln 275 280 285 Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu 290 295 300 Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala 305 310 315 320 Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala 325 330 335 Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro 340 345 350 Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp 355 360 365 Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala 370 375 380 Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg 385 390 395 400 Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val 405 410 415 Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser 420 425 430 Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe 435 440 445 Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln 450 455 460 Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val 465 470 475 480 Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala 485 490 495 Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val 500 505 510 Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp 515 520 525 Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu 530 535 540 Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys 545 550 555 560 Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu 565 570 575 Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr 580 585 590 Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp 595 600 605 Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln 610 615 620 <210> 12 <211> 746 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 12 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ser Ala Asn Phe 580 585 590 Ile Lys Pro Thr Ser Tyr Ala Gln Ala Gln Thr Gly Trp Val Gln Asn 595 600 605 Gln Gly Ile Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu 610 615 620 Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly Asn Phe His 625 630 635 640 Pro Ser Pro Leu Met Gly Gly Phe Gly Met Lys His Pro Pro Pro Gln 645 650 655 Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asp Pro Pro Thr Ala Phe 660 665 670 Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln 675 680 685 Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg 690 695 700 Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Tyr Lys Ser Asn Asn 705 710 715 720 Val Glu Phe Ala Val Asn Thr Glu Gly Val Tyr Ser Glu Pro Arg Pro 725 730 735 Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 740 745 <210> 13 <211> 4725 <212> DNA <213> Artificial Sequence <220> <223> AAV2/9 n.588.SSN nucleic acid sequence expression cassette <220> <221> misc_feature <222> (1)..(36) <223> trunctaed promoter <220> <221> promoter <222> (1)..(7) <223> p5 promoter <220> <221> CDS <222> (37)..(1899) <223> AAV2 Rep <220> <221> CDS <222> (1919)..(4162) <223> AAV9 Cap <220> <221> misc_feature <222> (3683)..(3715) <223> SSN <220> <221> misc_feature <222> (4253)..(4383) <223> p5 promoter <220> <221> misc_feature <222> (4511)..(4725) <223> LacZ promoter <400> 13 ccattttgaa gcgggaggtt tgaacgcgca gccgcc atg ccg ggg ttt tac gag 54 Met Pro Gly Phe Tyr Glu 1 5 att gtg att aag gtc ccc agc gac ctt gac gag cat ctg ccc ggc att 102 Ile Val Ile Lys Val Pro Ser Asp Leu Asp Glu His Leu Pro Gly Ile 10 15 20 tct gac agc ttt gtg aac tgg gtg gcc gag aag gaa tgg gag ttg ccg 150 Ser Asp Ser Phe Val Asn Trp Val Ala Glu Lys Glu Trp Glu Leu Pro 25 30 35 cca gat tct gac atg gat ctg aat ctg att gag cag gca ccc ctg acc 198 Pro Asp Ser Asp Met Asp Leu Asn Leu Ile Glu Gln Ala Pro Leu Thr 40 45 50 gtg gcc gag aag ctg cag cgc gac ttt ctg acg gaa tgg cgc cgt gtg 246 Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Thr Glu Trp Arg Arg Val 55 60 65 70 agt aag gcc ccg gag gct ctt ttc ttt gtg caa ttt gag aag gga gag 294 Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Gln Phe Glu Lys Gly Glu 75 80 85 agc tac ttc cac atg cac gtg ctc gtg gaa acc acc ggg gtg aaa tcc 342 Ser Tyr Phe His Met His Val Leu Val Glu Thr Thr Gly Val Lys Ser 90 95 100 atg gtt ttg gga cgt ttc ctg agt cag att cgc gaa aaa ctg att cag 390 Met Val Leu Gly Arg Phe Leu Ser Gln Ile Arg Glu Lys Leu Ile Gln 105 110 115 aga att tac cgc ggg atc gag ccg act ttg cca aac tgg ttc gcg gtc 438 Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu Pro Asn Trp Phe Ala Val 120 125 130 aca aag acc aga aat ggc gcc gga ggc ggg aac aag gtg gtg gat gag 486 Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Asn Lys Val Val Asp Glu 135 140 145 150 tgc tac atc ccc aat tac ttg ctc ccc aaa acc cag cct gag ctc cag 534 Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Thr Gln Pro Glu Leu Gln 155 160 165 tgg gcg tgg act aat atg gaa cag tat tta agc gcc tgt ttg aat ctc 582 Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu Ser Ala Cys Leu Asn Leu 170 175 180 acg gag cgt aaa cgg ttg gtg gcg cag cat ctg acg cac gtg tcg cag 630 Thr Glu Arg Lys Arg Leu Val Ala Gln His Leu Thr His Val Ser Gln 185 190 195 acg cag gag cag aac aaa gag aat cag aat ccc aat tct gat gcg ccg 678 Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Pro Asn Ser Asp Ala Pro 200 205 210 gtg atc aga tca aaa act tca gcc agg tac atg gag ctg gtc ggg tgg 726 Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Met Glu Leu Val Gly Trp 215 220 225 230 ctc gtg gac aag ggg att acc tcg gag aag cag tgg atc cag gag gac 774 Leu Val Asp Lys Gly Ile Thr Ser Glu Lys Gln Trp Ile Gln Glu Asp 235 240 245 cag gcc tca tac atc tcc ttc aat gcg gcc tcc aac tcg cgg tcc caa 822 Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Ser Asn Ser Arg Ser Gln 250 255 260 atc aag gct gcc ttg gac aat gcg gga aag att atg agc ctg act aaa 870 Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile Met Ser Leu Thr Lys 265 270 275 acc gcc ccc gac tac ctg gtg ggc cag cag ccc gtg gag gac att tcc 918 Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro Val Glu Asp Ile Ser 280 285 290 agc aat cgg att tat aaa att ttg gaa cta aac ggg tac gat ccc caa 966 Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn Gly Tyr Asp Pro Gln 295 300 305 310 tat gcg gct tcc gtc ttt ctg gga tgg gcc acg aaa aag ttc ggc aag 1014 Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr Lys Lys Phe Gly Lys 315 320 325 agg aac acc atc tgg ctg ttt ggg cct gca act acc ggg aag acc aac 1062 Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr Thr Gly Lys Thr Asn 330 335 340 atc gcg gag gcc ata gcc cac act gtg ccc ttc tac ggg tgc gta aac 1110 Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe Tyr Gly Cys Val Asn 345 350 355 tgg acc aat gag aac ttt ccc ttc aac gac tgt gtc gac aag atg gtg 1158 Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys Val Asp Lys Met Val 360 365 370 atc tgg tgg gag gag ggg aag atg acc gcc aag gtc gtg gag tcg gcc 1206 Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys Val Val Glu Ser Ala 375 380 385 390 aaa gcc att ctc gga gga agc aag gtg cgc gtg gac cag aaa tgc aag 1254 Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val Asp Gln Lys Cys Lys 395 400 405 tcc tcg gcc cag ata gac ccg act ccc gtg atc gtc acc tcc aac acc 1302 Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile Val Thr Ser Asn Thr 410 415 420 aac atg tgc gcc gtg att gac ggg aac tca acg acc ttc gaa cac cag 1350 Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr Thr Phe Glu His Gln 425 430 435 cag ccg ttg caa gac cgg atg ttc aaa ttt gaa ctc acc cgc cgt ctg 1398 Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu Leu Thr Arg Arg Leu 440 445 450 gat cat gac ttt ggg aag gtc acc aag cag gaa gtc aaa gac ttt ttc 1446 Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Val Lys Asp Phe Phe 455 460 465 470 cgg tgg gca aag gat cac gtg gtt gag gtg gag cat gaa ttc tac gtc 1494 Arg Trp Ala Lys Asp His Val Val Glu Val Glu His Glu Phe Tyr Val 475 480 485 aaa aag ggt gga gcc aag aaa aga ccc gcc ccc agt gac gca gat ata 1542 Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro Ser Asp Ala Asp Ile 490 495 500 agt gag ccc aaa cgg gtg cgc gag tca gtt gcg cag cca tcg acg tca 1590 Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala Gln Pro Ser Thr Ser 505 510 515 gac gcg gaa gct tcg atc aac tac gca gac agg tac caa aac aaa tgt 1638 Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg Tyr Gln Asn Lys Cys 520 525 530 tct cgt cac gtg ggc atg aat ctg atg ctg ttt ccc tgc aga caa tgc 1686 Ser Arg His Val Gly Met Asn Leu Met Leu Phe Pro Cys Arg Gln Cys 535 540 545 550 gag aga atg aat cag aat tca aat atc tgc ttc act cac gga cag aaa 1734 Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe Thr His Gly Gln Lys 555 560 565 gac tgt tta gag tgc ttt ccc gtg tca gaa tct caa ccc gtt tct gtc 1782 Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Ser Gln Pro Val Ser Val 570 575 580 gtc aaa aag gcg tat cag aaa ctg tgc tac att cat cat atc atg gga 1830 Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ile His His Ile Met Gly 585 590 595 aag gtg cca gac gct tgc act gcc tgc gat ctg gtc aat gtg gat ttg 1878 Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Leu Val Asn Val Asp Leu 600 605 610 gat gac tgc atc ttt gaa caa taaatgattt aaatcaggt atg gct gcc gat 1930 Asp Asp Cys Ile Phe Glu Gln Met Ala Ala Asp 615 620 625 ggt tat ctt cca gat tgg ctc gag gac aac ctt agt gaa gga att cgc 1978 Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser Glu Gly Ile Arg 630 635 640 gag tgg tgg gct ttg aaa cct gga gcc cct caa ccc aag gca aat caa 2026 Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro Lys Ala Asn Gln 645 650 655 caa cat caa gac aac gct cga ggt ctt gtg ctt ccg ggt tac aaa tac 2074 Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro Gly Tyr Lys Tyr 660 665 670 ctt gga ccc ggc aac gga ctc gac aag ggg gag ccg gtc aac gca gca 2122 Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro Val Asn Ala Ala 675 680 685 gac gcg gcg gcc ctc gag cac gac aag gcc tac gac cag cag ctc aag 2170 Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp Gln Gln Leu Lys 690 695 700 705 gcc gga gac aac ccg tac ctc aag tac aac cac gcc gac gcc gag ttc 2218 Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp Ala Glu Phe 710 715 720 cag gag cgg ctc aaa gaa gat acg tct ttt ggg ggc aac ctc ggg cga 2266 Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly Asn Leu Gly Arg 725 730 735 gca gtc ttc cag gcc aaa aag agg ctt ctt gaa cct ctt ggt ctg gtt 2314 Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro Leu Gly Leu Val 740 745 750 gag gaa gcg gct aag acg gct cct gga aag aag agg cct gta gag cag 2362 Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg Pro Val Glu Gln 755 760 765 tct cct cag gaa ccg gac tcc tcc gcg ggt att ggc aaa tcg ggt gca 2410 Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly Lys Ser Gly Ala 770 775 780 785 cag ccc gct aaa aag aga ctc aat ttc ggt cag act ggc gac aca gag 2458 Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr Gly Asp Thr Glu 790 795 800 tca gtc cca gac cct caa cca atc gga gaa cct ccc gca gcc ccc tca 2506 Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro Ala Ala Pro Ser 805 810 815 ggt gtg gga tct ctt aca atg gct tca ggt ggt ggc gca cca gtg gca 2554 Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly Ala Pro Val Ala 820 825 830 gac aat aac gaa ggt gcc gat gga gtg ggt agt tcc tcg gga aat tgg 2602 Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser Ser Gly Asn Trp 835 840 845 cat tgc gat tcc caa tgg ctg ggg gac aga gtc atc acc acc agc acc 2650 His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile Thr Thr Ser Thr 850 855 860 865 cga acc tgg gcc ctg ccc acc tac aac aat cac ctc tac aag caa atc 2698 Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile 870 875 880 tcc aac agc aca tct gga gga tct tca aat gac aac gcc tac ttc ggc 2746 Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn Ala Tyr Phe Gly 885 890 895 tac agc acc ccc tgg ggg tat ttt gac ttc aac aga ttc cac tgc cac 2794 Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His Cys His 900 905 910 ttc tca cca cgt gac tgg cag cga ctc atc aac aac aac tgg gga ttc 2842 Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Phe 915 920 925 cgg cct aag cga ctc aac ttc aag ctc ttc aac att cag gtc aaa gag 2890 Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val Lys Glu 930 935 940 945 gtt acg gac aac aat gga gtc aag acc atc gcc aat aac ctt acc agc 2938 Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn Asn Leu Thr Ser 950 955 960 acg gtc cag gtc ttc acg gac tca gac tat cag ctc ccg tac gtg ctc 2986 Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu Pro Tyr Val Leu 965 970 975 ggg tcg gct cac gag ggc tgc ctc ccg ccg ttc cca gcg gac gtt ttc 3034 Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro Ala Asp Val Phe 980 985 990 atg att cct cag tac ggg tat ctg acg ctt aat gat gga agc cag gcc 3082 Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp Gly Ser Gln Ala 995 1000 1005 gtg ggt cgt tcg tcc ttt tac tgc ctg gaa tat ttc ccg tcg caa 3127 Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln 1010 1015 1020 atg cta aga acg ggt aac aac ttc cag ttc agc tac gag ttt gag 3172 Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu Phe Glu 1025 1030 1035 aac gta cct ttc cat agc agc tac gct cac agc caa agc ctg gac 3217 Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp 1040 1045 1050 cga cta atg aat cca ctc atc gac caa tac ttg tac tat ctc tca 3262 Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 1055 1060 1065 aag act att aac ggt tct gga cag aat caa caa acg cta aaa ttc 3307 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe 1070 1075 1080 agt gtg gcc gga ccc agc aac atg gct gtc cag gga aga aac tac 3352 Ser Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr 1085 1090 1095 ata cct gga ccc agc tac cga caa caa cgt gtc tca acc act gtg 3397 Ile Pro Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val 1100 1105 1110 act caa aac aac aac agc gaa ttt gct tgg cct gga gct tct tct 3442 Thr Gln Asn Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser 1115 1120 1125 tgg gct ctc aat gga cgt aat agc ttg atg aat cct gga cct gct 3487 Trp Ala Leu Asn Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala 1130 1135 1140 atg gcc agc cac aaa gaa gga gag gac cgt ttc ttt cct ttg tct 3532 Met Ala Ser His Lys Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser 1145 1150 1155 gga tct tta att ttt ggc aaa caa gga act gga aga gac aac gtg 3577 Gly Ser Leu Ile Phe Gly Lys Gln Gly Thr Gly Arg Asp Asn Val 1160 1165 1170 gat gcg gac aaa gtc atg ata acc aac gaa gaa gaa att aaa act 3622 Asp Ala Asp Lys Val Met Ile Thr Asn Glu Glu Glu Ile Lys Thr 1175 1180 1185 act aac ccg gta gca acg gag tcc tat gga caa gtg gcc aca aac 3667 Thr Asn Pro Val Ala Thr Glu Ser Tyr Gly Gln Val Ala Thr Asn 1190 1195 1200 cac cag agt gcc caa agc agc aac acc gtg aag ctg acc agc gga 3712 His Gln Ser Ala Gln Ser Ser Asn Thr Val Lys Leu Thr Ser Gly 1205 1210 1215 cac gca cag gcg cag acc ggc tgg gtt caa aac caa gga ata ctt 3757 His Ala Gln Ala Gln Thr Gly Trp Val Gln Asn Gln Gly Ile Leu 1220 1225 1230 ccg ggt atg gtt tgg cag gac aga gat gtg tac ctg caa gga ccc 3802 Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro 1235 1240 1245 att tgg gcc aaa att cct cac acg gac ggc aac ttt cac cct tct 3847 Ile Trp Ala Lys Ile Pro His Thr Asp Gly Asn Phe His Pro Ser 1250 1255 1260 ccg ctg atg gga ggg ttt gga atg aag cac ccg cct cct cag atc 3892 Pro Leu Met Gly Gly Phe Gly Met Lys His Pro Pro Pro Gln Ile 1265 1270 1275 ctc atc aaa aac aca cct gta cct gcg gat cct cca acg gcc ttc 3937 Leu Ile Lys Asn Thr Pro Val Pro Ala Asp Pro Pro Thr Ala Phe 1280 1285 1290 aac aag gac aag ctg aac tct ttc atc acc cag tat tct act ggc 3982 Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr Gln Tyr Ser Thr Gly 1295 1300 1305 caa gtc agc gtg gag atc gag tgg gag ctg cag aag gaa aac agc 4027 Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser 1310 1315 1320 aag cgc tgg aac ccg gag atc cag tac act tcc aac tat tac aag 4072 Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Tyr Lys 1325 1330 1335 tct aat aat gtt gaa ttt gct gtt aat act gaa ggt gta tat agt 4117 Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val Tyr Ser 1340 1345 1350 gaa ccc cgc ccc att ggc acc aga tac ctg act cgt aat ctg taa 4162 Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 1355 1360 1365 ttgcttgtta atcaataaac cgtttaattc gtttcagttg aactttggtc tctgcgaagg 4222 gcgaattcgt ttaaacctgc aggactagag gtcctgtatt agaggtcacg tgagtgtttt 4282 gcgacatttt gcgacaccat gtggtcacgc tgggtattta agcccgagtg agcacgcagg 4342 gtctccattt tgaagcggga ggtttgaacg cgcagccgcc aagccgaatt ctgcagatat 4402 ccatcacact ggcggccgct cgactagagc ggccgccacc gcggtggagc tccagctttt 4462 gttcccttta gtgagggtta attgcgcgct tggcgtaatc atggtcatag ctgtttcctg 4522 tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 4582 aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 4642 ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 4702 gaggcggttt gcgtattggg cgc 4725 <210> 14 <211> 621 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 14 Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp 1 5 10 15 Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu 20 25 30 Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile 35 40 45 Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu 50 55 60 Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val 65 70 75 80 Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu 85 90 95 Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile 100 105 110 Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu 115 120 125 Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly 130 135 140 Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys 145 150 155 160 Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu 165 170 175 Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His 180 185 190 Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn 195 200 205 Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr 210 215 220 Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys 225 230 235 240 Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala 245 250 255 Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys 260 265 270 Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln 275 280 285 Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu 290 295 300 Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala 305 310 315 320 Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala 325 330 335 Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro 340 345 350 Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp 355 360 365 Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala 370 375 380 Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg 385 390 395 400 Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val 405 410 415 Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser 420 425 430 Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe 435 440 445 Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln 450 455 460 Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val 465 470 475 480 Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala 485 490 495 Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val 500 505 510 Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp 515 520 525 Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu 530 535 540 Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys 545 550 555 560 Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu 565 570 575 Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr 580 585 590 Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp 595 600 605 Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln 610 615 620 <210> 15 <211> 747 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 15 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ser Ser Asn Thr 580 585 590 Val Lys Leu Thr Ser Gly His Ala Gln Ala Gln Thr Gly Trp Val Gln 595 600 605 Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr 610 615 620 Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly Asn Phe 625 630 635 640 His Pro Ser Pro Leu Met Gly Gly Phe Gly Met Lys His Pro Pro Pro 645 650 655 Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asp Pro Pro Thr Ala 660 665 670 Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr Gln Tyr Ser Thr Gly 675 680 685 Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys 690 695 700 Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Tyr Lys Ser Asn 705 710 715 720 Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val Tyr Ser Glu Pro Arg 725 730 735 Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 740 745 <210> 16 <211> 4737 <212> DNA <213> Artificial Sequence <220> <223> AAV2/9 n.588.SSN-L nucleic acid sequence expression cassette <220> <221> misc_feature <222> (1)..(36) <223> truncated promoter <220> <221> promoter <222> (1)..(7) <223> p5 promoter <220> <221> CDS <222> (37)..(1899) <223> AAV2 Rep <220> <221> CDS <222> (1919)..(4174) <223> AAV9 Cap <220> <221> misc_feature <222> (3683)..(3727) <223> SSN-L <220> <221> misc_feature <222> (4253)..(4737) <223> LacZ promoter <220> <221> misc_feature <222> (4265)..(4395) <223> p5 promoter <400> 16 ccattttgaa gcgggaggtt tgaacgcgca gccgcc atg ccg ggg ttt tac gag 54 Met Pro Gly Phe Tyr Glu 1 5 att gtg att aag gtc ccc agc gac ctt gac gag cat ctg ccc ggc att 102 Ile Val Ile Lys Val Pro Ser Asp Leu Asp Glu His Leu Pro Gly Ile 10 15 20 tct gac agc ttt gtg aac tgg gtg gcc gag aag gaa tgg gag ttg ccg 150 Ser Asp Ser Phe Val Asn Trp Val Ala Glu Lys Glu Trp Glu Leu Pro 25 30 35 cca gat tct gac atg gat ctg aat ctg att gag cag gca ccc ctg acc 198 Pro Asp Ser Asp Met Asp Leu Asn Leu Ile Glu Gln Ala Pro Leu Thr 40 45 50 gtg gcc gag aag ctg cag cgc gac ttt ctg acg gaa tgg cgc cgt gtg 246 Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Thr Glu Trp Arg Arg Val 55 60 65 70 agt aag gcc ccg gag gct ctt ttc ttt gtg caa ttt gag aag gga gag 294 Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Gln Phe Glu Lys Gly Glu 75 80 85 agc tac ttc cac atg cac gtg ctc gtg gaa acc acc ggg gtg aaa tcc 342 Ser Tyr Phe His Met His Val Leu Val Glu Thr Thr Gly Val Lys Ser 90 95 100 atg gtt ttg gga cgt ttc ctg agt cag att cgc gaa aaa ctg att cag 390 Met Val Leu Gly Arg Phe Leu Ser Gln Ile Arg Glu Lys Leu Ile Gln 105 110 115 aga att tac cgc ggg atc gag ccg act ttg cca aac tgg ttc gcg gtc 438 Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu Pro Asn Trp Phe Ala Val 120 125 130 aca aag acc aga aat ggc gcc gga ggc ggg aac aag gtg gtg gat gag 486 Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Asn Lys Val Val Asp Glu 135 140 145 150 tgc tac atc ccc aat tac ttg ctc ccc aaa acc cag cct gag ctc cag 534 Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Thr Gln Pro Glu Leu Gln 155 160 165 tgg gcg tgg act aat atg gaa cag tat tta agc gcc tgt ttg aat ctc 582 Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu Ser Ala Cys Leu Asn Leu 170 175 180 acg gag cgt aaa cgg ttg gtg gcg cag cat ctg acg cac gtg tcg cag 630 Thr Glu Arg Lys Arg Leu Val Ala Gln His Leu Thr His Val Ser Gln 185 190 195 acg cag gag cag aac aaa gag aat cag aat ccc aat tct gat gcg ccg 678 Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Pro Asn Ser Asp Ala Pro 200 205 210 gtg atc aga tca aaa act tca gcc agg tac atg gag ctg gtc ggg tgg 726 Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Met Glu Leu Val Gly Trp 215 220 225 230 ctc gtg gac aag ggg att acc tcg gag aag cag tgg atc cag gag gac 774 Leu Val Asp Lys Gly Ile Thr Ser Glu Lys Gln Trp Ile Gln Glu Asp 235 240 245 cag gcc tca tac atc tcc ttc aat gcg gcc tcc aac tcg cgg tcc caa 822 Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Ser Asn Ser Arg Ser Gln 250 255 260 atc aag gct gcc ttg gac aat gcg gga aag att atg agc ctg act aaa 870 Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile Met Ser Leu Thr Lys 265 270 275 acc gcc ccc gac tac ctg gtg ggc cag cag ccc gtg gag gac att tcc 918 Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro Val Glu Asp Ile Ser 280 285 290 agc aat cgg att tat aaa att ttg gaa cta aac ggg tac gat ccc caa 966 Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn Gly Tyr Asp Pro Gln 295 300 305 310 tat gcg gct tcc gtc ttt ctg gga tgg gcc acg aaa aag ttc ggc aag 1014 Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr Lys Lys Phe Gly Lys 315 320 325 agg aac acc atc tgg ctg ttt ggg cct gca act acc ggg aag acc aac 1062 Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr Thr Gly Lys Thr Asn 330 335 340 atc gcg gag gcc ata gcc cac act gtg ccc ttc tac ggg tgc gta aac 1110 Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe Tyr Gly Cys Val Asn 345 350 355 tgg acc aat gag aac ttt ccc ttc aac gac tgt gtc gac aag atg gtg 1158 Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys Val Asp Lys Met Val 360 365 370 atc tgg tgg gag gag ggg aag atg acc gcc aag gtc gtg gag tcg gcc 1206 Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys Val Val Glu Ser Ala 375 380 385 390 aaa gcc att ctc gga gga agc aag gtg cgc gtg gac cag aaa tgc aag 1254 Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val Asp Gln Lys Cys Lys 395 400 405 tcc tcg gcc cag ata gac ccg act ccc gtg atc gtc acc tcc aac acc 1302 Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile Val Thr Ser Asn Thr 410 415 420 aac atg tgc gcc gtg att gac ggg aac tca acg acc ttc gaa cac cag 1350 Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr Thr Phe Glu His Gln 425 430 435 cag ccg ttg caa gac cgg atg ttc aaa ttt gaa ctc acc cgc cgt ctg 1398 Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu Leu Thr Arg Arg Leu 440 445 450 gat cat gac ttt ggg aag gtc acc aag cag gaa gtc aaa gac ttt ttc 1446 Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Val Lys Asp Phe Phe 455 460 465 470 cgg tgg gca aag gat cac gtg gtt gag gtg gag cat gaa ttc tac gtc 1494 Arg Trp Ala Lys Asp His Val Val Glu Val Glu His Glu Phe Tyr Val 475 480 485 aaa aag ggt gga gcc aag aaa aga ccc gcc ccc agt gac gca gat ata 1542 Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro Ser Asp Ala Asp Ile 490 495 500 agt gag ccc aaa cgg gtg cgc gag tca gtt gcg cag cca tcg acg tca 1590 Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala Gln Pro Ser Thr Ser 505 510 515 gac gcg gaa gct tcg atc aac tac gca gac agg tac caa aac aaa tgt 1638 Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg Tyr Gln Asn Lys Cys 520 525 530 tct cgt cac gtg ggc atg aat ctg atg ctg ttt ccc tgc aga caa tgc 1686 Ser Arg His Val Gly Met Asn Leu Met Leu Phe Pro Cys Arg Gln Cys 535 540 545 550 gag aga atg aat cag aat tca aat atc tgc ttc act cac gga cag aaa 1734 Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe Thr His Gly Gln Lys 555 560 565 gac tgt tta gag tgc ttt ccc gtg tca gaa tct caa ccc gtt tct gtc 1782 Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Ser Gln Pro Val Ser Val 570 575 580 gtc aaa aag gcg tat cag aaa ctg tgc tac att cat cat atc atg gga 1830 Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ile His His Ile Met Gly 585 590 595 aag gtg cca gac gct tgc act gcc tgc gat ctg gtc aat gtg gat ttg 1878 Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Leu Val Asn Val Asp Leu 600 605 610 gat gac tgc atc ttt gaa caa taaatgattt aaatcaggt atg gct gcc gat 1930 Asp Asp Cys Ile Phe Glu Gln Met Ala Ala Asp 615 620 625 ggt tat ctt cca gat tgg ctc gag gac aac ctt agt gaa gga att cgc 1978 Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser Glu Gly Ile Arg 630 635 640 gag tgg tgg gct ttg aaa cct gga gcc cct caa ccc aag gca aat caa 2026 Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro Lys Ala Asn Gln 645 650 655 caa cat caa gac aac gct cga ggt ctt gtg ctt ccg ggt tac aaa tac 2074 Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro Gly Tyr Lys Tyr 660 665 670 ctt gga ccc ggc aac gga ctc gac aag ggg gag ccg gtc aac gca gca 2122 Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro Val Asn Ala Ala 675 680 685 gac gcg gcg gcc ctc gag cac gac aag gcc tac gac cag cag ctc aag 2170 Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp Gln Gln Leu Lys 690 695 700 705 gcc gga gac aac ccg tac ctc aag tac aac cac gcc gac gcc gag ttc 2218 Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp Ala Glu Phe 710 715 720 cag gag cgg ctc aaa gaa gat acg tct ttt ggg ggc aac ctc ggg cga 2266 Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly Asn Leu Gly Arg 725 730 735 gca gtc ttc cag gcc aaa aag agg ctt ctt gaa cct ctt ggt ctg gtt 2314 Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro Leu Gly Leu Val 740 745 750 gag gaa gcg gct aag acg gct cct gga aag aag agg cct gta gag cag 2362 Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg Pro Val Glu Gln 755 760 765 tct cct cag gaa ccg gac tcc tcc gcg ggt att ggc aaa tcg ggt gca 2410 Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly Lys Ser Gly Ala 770 775 780 785 cag ccc gct aaa aag aga ctc aat ttc ggt cag act ggc gac aca gag 2458 Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr Gly Asp Thr Glu 790 795 800 tca gtc cca gac cct caa cca atc gga gaa cct ccc gca gcc ccc tca 2506 Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro Ala Ala Pro Ser 805 810 815 ggt gtg gga tct ctt aca atg gct tca ggt ggt ggc gca cca gtg gca 2554 Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly Ala Pro Val Ala 820 825 830 gac aat aac gaa ggt gcc gat gga gtg ggt agt tcc tcg gga aat tgg 2602 Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser Ser Gly Asn Trp 835 840 845 cat tgc gat tcc caa tgg ctg ggg gac aga gtc atc acc acc agc acc 2650 His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile Thr Thr Ser Thr 850 855 860 865 cga acc tgg gcc ctg ccc acc tac aac aat cac ctc tac aag caa atc 2698 Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile 870 875 880 tcc aac agc aca tct gga gga tct tca aat gac aac gcc tac ttc ggc 2746 Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn Ala Tyr Phe Gly 885 890 895 tac agc acc ccc tgg ggg tat ttt gac ttc aac aga ttc cac tgc cac 2794 Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His Cys His 900 905 910 ttc tca cca cgt gac tgg cag cga ctc atc aac aac aac tgg gga ttc 2842 Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Phe 915 920 925 cgg cct aag cga ctc aac ttc aag ctc ttc aac att cag gtc aaa gag 2890 Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val Lys Glu 930 935 940 945 gtt acg gac aac aat gga gtc aag acc atc gcc aat aac ctt acc agc 2938 Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn Asn Leu Thr Ser 950 955 960 acg gtc cag gtc ttc acg gac tca gac tat cag ctc ccg tac gtg ctc 2986 Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu Pro Tyr Val Leu 965 970 975 ggg tcg gct cac gag ggc tgc ctc ccg ccg ttc cca gcg gac gtt ttc 3034 Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro Ala Asp Val Phe 980 985 990 atg att cct cag tac ggg tat ctg acg ctt aat gat gga agc cag gcc 3082 Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp Gly Ser Gln Ala 995 1000 1005 gtg ggt cgt tcg tcc ttt tac tgc ctg gaa tat ttc ccg tcg caa 3127 Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln 1010 1015 1020 atg cta aga acg ggt aac aac ttc cag ttc agc tac gag ttt gag 3172 Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu Phe Glu 1025 1030 1035 aac gta cct ttc cat agc agc tac gct cac agc caa agc ctg gac 3217 Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp 1040 1045 1050 cga cta atg aat cca ctc atc gac caa tac ttg tac tat ctc tca 3262 Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 1055 1060 1065 aag act att aac ggt tct gga cag aat caa caa acg cta aaa ttc 3307 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe 1070 1075 1080 agt gtg gcc gga ccc agc aac atg gct gtc cag gga aga aac tac 3352 Ser Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr 1085 1090 1095 ata cct gga ccc agc tac cga caa caa cgt gtc tca acc act gtg 3397 Ile Pro Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val 1100 1105 1110 act caa aac aac aac agc gaa ttt gct tgg cct gga gct tct tct 3442 Thr Gln Asn Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser 1115 1120 1125 tgg gct ctc aat gga cgt aat agc ttg atg aat cct gga cct gct 3487 Trp Ala Leu Asn Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala 1130 1135 1140 atg gcc agc cac aaa gaa gga gag gac cgt ttc ttt cct ttg tct 3532 Met Ala Ser His Lys Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser 1145 1150 1155 gga tct tta att ttt ggc aaa caa gga act gga aga gac aac gtg 3577 Gly Ser Leu Ile Phe Gly Lys Gln Gly Thr Gly Arg Asp Asn Val 1160 1165 1170 gat gcg gac aaa gtc atg ata acc aac gaa gaa gaa att aaa act 3622 Asp Ala Asp Lys Val Met Ile Thr Asn Glu Glu Glu Ile Lys Thr 1175 1180 1185 act aac ccg gta gca acg gag tcc tat gga caa gtg gcc aca aac 3667 Thr Asn Pro Val Ala Thr Glu Ser Tyr Gly Gln Val Ala Thr Asn 1190 1195 1200 cac cag agt gcc caa gga gga agc agc aac acc gtg aag ctg acc 3712 His Gln Ser Ala Gln Gly Gly Ser Ser Asn Thr Val Lys Leu Thr 1205 1210 1215 agc gga cac gga gga gca cag gcg cag acc ggc tgg gtt caa aac 3757 Ser Gly His Gly Gly Ala Gln Ala Gln Thr Gly Trp Val Gln Asn 1220 1225 1230 caa gga ata ctt ccg ggt atg gtt tgg cag gac aga gat gtg tac 3802 Gln Gly Ile Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr 1235 1240 1245 ctg caa gga ccc att tgg gcc aaa att cct cac acg gac ggc aac 3847 Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly Asn 1250 1255 1260 ttt cac cct tct ccg ctg atg gga ggg ttt gga atg aag cac ccg 3892 Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met Lys His Pro 1265 1270 1275 cct cct cag atc ctc atc aaa aac aca cct gta cct gcg gat cct 3937 Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asp Pro 1280 1285 1290 cca acg gcc ttc aac aag gac aag ctg aac tct ttc atc acc cag 3982 Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr Gln 1295 1300 1305 tat tct act ggc caa gtc agc gtg gag atc gag tgg gag ctg cag 4027 Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 1310 1315 1320 aag gaa aac agc aag cgc tgg aac ccg gag atc cag tac act tcc 4072 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser 1325 1330 1335 aac tat tac aag tct aat aat gtt gaa ttt gct gtt aat act gaa 4117 Asn Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu 1340 1345 1350 ggt gta tat agt gaa ccc cgc ccc att ggc acc aga tac ctg act 4162 Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr 1355 1360 1365 cgt aat ctg taa ttgcttgtta atcaataaac cgtttaattc gtttcagttg 4214 Arg Asn Leu 1370 aactttggtc tctgcgaagg gcgaattcgt ttaaacctgc aggactagag gtcctgtatt 4274 agaggtcacg tgagtgtttt gcgacatttt gcgacaccat gtggtcacgc tgggtattta 4334 agcccgagtg agcacgcagg gtctccattt tgaagcggga ggtttgaacg cgcagccgcc 4394 aagccgaatt ctgcagatat ccatcacact ggcggccgct cgactagagc ggccgccacc 4454 gcggtggagc tccagctttt gttcccttta gtgagggtta attgcgcgct tggcgtaatc 4514 atggtcatag ctgtttcctg tgtgaaattg ttatccgctc acaattccac acaacatacg 4574 agccggaagc ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat 4634 tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg 4694 aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgc 4737 <210> 17 <211> 621 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 17 Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp 1 5 10 15 Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu 20 25 30 Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile 35 40 45 Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu 50 55 60 Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val 65 70 75 80 Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu 85 90 95 Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile 100 105 110 Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu 115 120 125 Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly 130 135 140 Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys 145 150 155 160 Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu 165 170 175 Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His 180 185 190 Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn 195 200 205 Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr 210 215 220 Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys 225 230 235 240 Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala 245 250 255 Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys 260 265 270 Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln 275 280 285 Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu 290 295 300 Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala 305 310 315 320 Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala 325 330 335 Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro 340 345 350 Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp 355 360 365 Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala 370 375 380 Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg 385 390 395 400 Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val 405 410 415 Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser 420 425 430 Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe 435 440 445 Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln 450 455 460 Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val 465 470 475 480 Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala 485 490 495 Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val 500 505 510 Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp 515 520 525 Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu 530 535 540 Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys 545 550 555 560 Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu 565 570 575 Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr 580 585 590 Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp 595 600 605 Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln 610 615 620 <210> 18 <211> 751 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 18 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Gly Gly Ser Ser 580 585 590 Asn Thr Val Lys Leu Thr Ser Gly His Gly Gly Ala Gln Ala Gln Thr 595 600 605 Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln Asp 610 615 620 Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr 625 630 635 640 Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met Lys 645 650 655 His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asp 660 665 670 Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr Gln 675 680 685 Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys 690 695 700 Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr 705 710 715 720 Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val Tyr 725 730 735 Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 740 745 750 <210> 19 <211> 4740 <212> DNA <213> Artificial Sequence <220> <223> AAV2/9 n.588.VLT-L nucleic acid sequence expression cassette <220> <221> misc_feature <222> (1)..(36) <223> truncated promoter <220> <221> promoter <222> (1)..(7) <223> p5 promoter <220> <221> CDS <222> (37)..(1899) <223> AAV2 Rep <220> <221> CDS <222> (1919)..(4177) <223> AAV9 Cap <220> <221> misc_feature <222> (3683)..(3730) <223> VLT-L <220> <221> misc_feature <222> (4268)..(4398) <223> p5 promoter <220> <221> misc_feature <222> (4526)..(4740) <223> LacZ promoter <400> 19 ccattttgaa gcgggaggtt tgaacgcgca gccgcc atg ccg ggg ttt tac gag 54 Met Pro Gly Phe Tyr Glu 1 5 att gtg att aag gtc ccc agc gac ctt gac gag cat ctg ccc ggc att 102 Ile Val Ile Lys Val Pro Ser Asp Leu Asp Glu His Leu Pro Gly Ile 10 15 20 tct gac agc ttt gtg aac tgg gtg gcc gag aag gaa tgg gag ttg ccg 150 Ser Asp Ser Phe Val Asn Trp Val Ala Glu Lys Glu Trp Glu Leu Pro 25 30 35 cca gat tct gac atg gat ctg aat ctg att gag cag gca ccc ctg acc 198 Pro Asp Ser Asp Met Asp Leu Asn Leu Ile Glu Gln Ala Pro Leu Thr 40 45 50 gtg gcc gag aag ctg cag cgc gac ttt ctg acg gaa tgg cgc cgt gtg 246 Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Thr Glu Trp Arg Arg Val 55 60 65 70 agt aag gcc ccg gag gct ctt ttc ttt gtg caa ttt gag aag gga gag 294 Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Gln Phe Glu Lys Gly Glu 75 80 85 agc tac ttc cac atg cac gtg ctc gtg gaa acc acc ggg gtg aaa tcc 342 Ser Tyr Phe His Met His Val Leu Val Glu Thr Thr Gly Val Lys Ser 90 95 100 atg gtt ttg gga cgt ttc ctg agt cag att cgc gaa aaa ctg att cag 390 Met Val Leu Gly Arg Phe Leu Ser Gln Ile Arg Glu Lys Leu Ile Gln 105 110 115 aga att tac cgc ggg atc gag ccg act ttg cca aac tgg ttc gcg gtc 438 Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu Pro Asn Trp Phe Ala Val 120 125 130 aca aag acc aga aat ggc gcc gga ggc ggg aac aag gtg gtg gat gag 486 Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Asn Lys Val Val Asp Glu 135 140 145 150 tgc tac atc ccc aat tac ttg ctc ccc aaa acc cag cct gag ctc cag 534 Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Thr Gln Pro Glu Leu Gln 155 160 165 tgg gcg tgg act aat atg gaa cag tat tta agc gcc tgt ttg aat ctc 582 Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu Ser Ala Cys Leu Asn Leu 170 175 180 acg gag cgt aaa cgg ttg gtg gcg cag cat ctg acg cac gtg tcg cag 630 Thr Glu Arg Lys Arg Leu Val Ala Gln His Leu Thr His Val Ser Gln 185 190 195 acg cag gag cag aac aaa gag aat cag aat ccc aat tct gat gcg ccg 678 Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Pro Asn Ser Asp Ala Pro 200 205 210 gtg atc aga tca aaa act tca gcc agg tac atg gag ctg gtc ggg tgg 726 Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Met Glu Leu Val Gly Trp 215 220 225 230 ctc gtg gac aag ggg att acc tcg gag aag cag tgg atc cag gag gac 774 Leu Val Asp Lys Gly Ile Thr Ser Glu Lys Gln Trp Ile Gln Glu Asp 235 240 245 cag gcc tca tac atc tcc ttc aat gcg gcc tcc aac tcg cgg tcc caa 822 Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Ser Asn Ser Arg Ser Gln 250 255 260 atc aag gct gcc ttg gac aat gcg gga aag att atg agc ctg act aaa 870 Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile Met Ser Leu Thr Lys 265 270 275 acc gcc ccc gac tac ctg gtg ggc cag cag ccc gtg gag gac att tcc 918 Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro Val Glu Asp Ile Ser 280 285 290 agc aat cgg att tat aaa att ttg gaa cta aac ggg tac gat ccc caa 966 Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn Gly Tyr Asp Pro Gln 295 300 305 310 tat gcg gct tcc gtc ttt ctg gga tgg gcc acg aaa aag ttc ggc aag 1014 Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr Lys Lys Phe Gly Lys 315 320 325 agg aac acc atc tgg ctg ttt ggg cct gca act acc ggg aag acc aac 1062 Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr Thr Gly Lys Thr Asn 330 335 340 atc gcg gag gcc ata gcc cac act gtg ccc ttc tac ggg tgc gta aac 1110 Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe Tyr Gly Cys Val Asn 345 350 355 tgg acc aat gag aac ttt ccc ttc aac gac tgt gtc gac aag atg gtg 1158 Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys Val Asp Lys Met Val 360 365 370 atc tgg tgg gag gag ggg aag atg acc gcc aag gtc gtg gag tcg gcc 1206 Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys Val Val Glu Ser Ala 375 380 385 390 aaa gcc att ctc gga gga agc aag gtg cgc gtg gac cag aaa tgc aag 1254 Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val Asp Gln Lys Cys Lys 395 400 405 tcc tcg gcc cag ata gac ccg act ccc gtg atc gtc acc tcc aac acc 1302 Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile Val Thr Ser Asn Thr 410 415 420 aac atg tgc gcc gtg att gac ggg aac tca acg acc ttc gaa cac cag 1350 Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr Thr Phe Glu His Gln 425 430 435 cag ccg ttg caa gac cgg atg ttc aaa ttt gaa ctc acc cgc cgt ctg 1398 Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu Leu Thr Arg Arg Leu 440 445 450 gat cat gac ttt ggg aag gtc acc aag cag gaa gtc aaa gac ttt ttc 1446 Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Val Lys Asp Phe Phe 455 460 465 470 cgg tgg gca aag gat cac gtg gtt gag gtg gag cat gaa ttc tac gtc 1494 Arg Trp Ala Lys Asp His Val Val Glu Val Glu His Glu Phe Tyr Val 475 480 485 aaa aag ggt gga gcc aag aaa aga ccc gcc ccc agt gac gca gat ata 1542 Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro Ser Asp Ala Asp Ile 490 495 500 agt gag ccc aaa cgg gtg cgc gag tca gtt gcg cag cca tcg acg tca 1590 Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala Gln Pro Ser Thr Ser 505 510 515 gac gcg gaa gct tcg atc aac tac gca gac agg tac caa aac aaa tgt 1638 Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg Tyr Gln Asn Lys Cys 520 525 530 tct cgt cac gtg ggc atg aat ctg atg ctg ttt ccc tgc aga caa tgc 1686 Ser Arg His Val Gly Met Asn Leu Met Leu Phe Pro Cys Arg Gln Cys 535 540 545 550 gag aga atg aat cag aat tca aat atc tgc ttc act cac gga cag aaa 1734 Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe Thr His Gly Gln Lys 555 560 565 gac tgt tta gag tgc ttt ccc gtg tca gaa tct caa ccc gtt tct gtc 1782 Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Ser Gln Pro Val Ser Val 570 575 580 gtc aaa aag gcg tat cag aaa ctg tgc tac att cat cat atc atg gga 1830 Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ile His His Ile Met Gly 585 590 595 aag gtg cca gac gct tgc act gcc tgc gat ctg gtc aat gtg gat ttg 1878 Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Leu Val Asn Val Asp Leu 600 605 610 gat gac tgc atc ttt gaa caa taaatgattt aaatcaggt atg gct gcc gat 1930 Asp Asp Cys Ile Phe Glu Gln Met Ala Ala Asp 615 620 625 ggt tat ctt cca gat tgg ctc gag gac aac ctt agt gaa gga att cgc 1978 Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser Glu Gly Ile Arg 630 635 640 gag tgg tgg gct ttg aaa cct gga gcc cct caa ccc aag gca aat caa 2026 Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro Lys Ala Asn Gln 645 650 655 caa cat caa gac aac gct cga ggt ctt gtg ctt ccg ggt tac aaa tac 2074 Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro Gly Tyr Lys Tyr 660 665 670 ctt gga ccc ggc aac gga ctc gac aag ggg gag ccg gtc aac gca gca 2122 Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro Val Asn Ala Ala 675 680 685 gac gcg gcg gcc ctc gag cac gac aag gcc tac gac cag cag ctc aag 2170 Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp Gln Gln Leu Lys 690 695 700 705 gcc gga gac aac ccg tac ctc aag tac aac cac gcc gac gcc gag ttc 2218 Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp Ala Glu Phe 710 715 720 cag gag cgg ctc aaa gaa gat acg tct ttt ggg ggc aac ctc ggg cga 2266 Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly Asn Leu Gly Arg 725 730 735 gca gtc ttc cag gcc aaa aag agg ctt ctt gaa cct ctt ggt ctg gtt 2314 Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro Leu Gly Leu Val 740 745 750 gag gaa gcg gct aag acg gct cct gga aag aag agg cct gta gag cag 2362 Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg Pro Val Glu Gln 755 760 765 tct cct cag gaa ccg gac tcc tcc gcg ggt att ggc aaa tcg ggt gca 2410 Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly Lys Ser Gly Ala 770 775 780 785 cag ccc gct aaa aag aga ctc aat ttc ggt cag act ggc gac aca gag 2458 Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr Gly Asp Thr Glu 790 795 800 tca gtc cca gac cct caa cca atc gga gaa cct ccc gca gcc ccc tca 2506 Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro Ala Ala Pro Ser 805 810 815 ggt gtg gga tct ctt aca atg gct tca ggt ggt ggc gca cca gtg gca 2554 Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly Ala Pro Val Ala 820 825 830 gac aat aac gaa ggt gcc gat gga gtg ggt agt tcc tcg gga aat tgg 2602 Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser Ser Gly Asn Trp 835 840 845 cat tgc gat tcc caa tgg ctg ggg gac aga gtc atc acc acc agc acc 2650 His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile Thr Thr Ser Thr 850 855 860 865 cga acc tgg gcc ctg ccc acc tac aac aat cac ctc tac aag caa atc 2698 Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile 870 875 880 tcc aac agc aca tct gga gga tct tca aat gac aac gcc tac ttc ggc 2746 Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn Ala Tyr Phe Gly 885 890 895 tac agc acc ccc tgg ggg tat ttt gac ttc aac aga ttc cac tgc cac 2794 Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His Cys His 900 905 910 ttc tca cca cgt gac tgg cag cga ctc atc aac aac aac tgg gga ttc 2842 Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Phe 915 920 925 cgg cct aag cga ctc aac ttc aag ctc ttc aac att cag gtc aaa gag 2890 Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val Lys Glu 930 935 940 945 gtt acg gac aac aat gga gtc aag acc atc gcc aat aac ctt acc agc 2938 Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn Asn Leu Thr Ser 950 955 960 acg gtc cag gtc ttc acg gac tca gac tat cag ctc ccg tac gtg ctc 2986 Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu Pro Tyr Val Leu 965 970 975 ggg tcg gct cac gag ggc tgc ctc ccg ccg ttc cca gcg gac gtt ttc 3034 Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro Ala Asp Val Phe 980 985 990 atg att cct cag tac ggg tat ctg acg ctt aat gat gga agc cag gcc 3082 Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp Gly Ser Gln Ala 995 1000 1005 gtg ggt cgt tcg tcc ttt tac tgc ctg gaa tat ttc ccg tcg caa 3127 Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln 1010 1015 1020 atg cta aga acg ggt aac aac ttc cag ttc agc tac gag ttt gag 3172 Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu Phe Glu 1025 1030 1035 aac gta cct ttc cat agc agc tac gct cac agc caa agc ctg gac 3217 Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp 1040 1045 1050 cga cta atg aat cca ctc atc gac caa tac ttg tac tat ctc tca 3262 Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 1055 1060 1065 aag act att aac ggt tct gga cag aat caa caa acg cta aaa ttc 3307 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe 1070 1075 1080 agt gtg gcc gga ccc agc aac atg gct gtc cag gga aga aac tac 3352 Ser Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr 1085 1090 1095 ata cct gga ccc agc tac cga caa caa cgt gtc tca acc act gtg 3397 Ile Pro Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val 1100 1105 1110 act caa aac aac aac agc gaa ttt gct tgg cct gga gct tct tct 3442 Thr Gln Asn Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser 1115 1120 1125 tgg gct ctc aat gga cgt aat agc ttg atg aat cct gga cct gct 3487 Trp Ala Leu Asn Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala 1130 1135 1140 atg gcc agc cac aaa gaa gga gag gac cgt ttc ttt cct ttg tct 3532 Met Ala Ser His Lys Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser 1145 1150 1155 gga tct tta att ttt ggc aaa caa gga act gga aga gac aac gtg 3577 Gly Ser Leu Ile Phe Gly Lys Gln Gly Thr Gly Arg Asp Asn Val 1160 1165 1170 gat gcg gac aaa gtc atg ata acc aac gaa gaa gaa att aaa act 3622 Asp Ala Asp Lys Val Met Ile Thr Asn Glu Glu Glu Ile Lys Thr 1175 1180 1185 act aac ccg gta gca acg gag tcc tat gga caa gtg gcc aca aac 3667 Thr Asn Pro Val Ala Thr Glu Ser Tyr Gly Gln Val Ala Thr Asn 1190 1195 1200 cac cag agt gcc caa gga gga gtg ctg acc aac atc gct aga gga 3712 His Gln Ser Ala Gln Gly Gly Val Leu Thr Asn Ile Ala Arg Gly 1205 1210 1215 gag tac atg aga gga gga gca cag gcg cag acc ggc tgg gtt caa 3757 Glu Tyr Met Arg Gly Gly Ala Gln Ala Gln Thr Gly Trp Val Gln 1220 1225 1230 aac caa gga ata ctt ccg ggt atg gtt tgg cag gac aga gat gtg 3802 Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val 1235 1240 1245 tac ctg caa gga ccc att tgg gcc aaa att cct cac acg gac ggc 3847 Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly 1250 1255 1260 aac ttt cac cct tct ccg ctg atg gga ggg ttt gga atg aag cac 3892 Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met Lys His 1265 1270 1275 ccg cct cct cag atc ctc atc aaa aac aca cct gta cct gcg gat 3937 Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asp 1280 1285 1290 cct cca acg gcc ttc aac aag gac aag ctg aac tct ttc atc acc 3982 Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 1295 1300 1305 cag tat tct act ggc caa gtc agc gtg gag atc gag tgg gag ctg 4027 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu 1310 1315 1320 cag aag gaa aac agc aag cgc tgg aac ccg gag atc cag tac act 4072 Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 1325 1330 1335 tcc aac tat tac aag tct aat aat gtt gaa ttt gct gtt aat act 4117 Ser Asn Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr 1340 1345 1350 gaa ggt gta tat agt gaa ccc cgc ccc att ggc acc aga tac ctg 4162 Glu Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu 1355 1360 1365 act cgt aat ctg taa ttgcttgtta atcaataaac cgtttaattc gtttcagttg 4217 Thr Arg Asn Leu 1370 aactttggtc tctgcgaagg gcgaattcgt ttaaacctgc aggactagag gtcctgtatt 4277 agaggtcacg tgagtgtttt gcgacatttt gcgacaccat gtggtcacgc tgggtattta 4337 agcccgagtg agcacgcagg gtctccattt tgaagcggga ggtttgaacg cgcagccgcc 4397 aagccgaatt ctgcagatat ccatcacact ggcggccgct cgactagagc ggccgccacc 4457 gcggtggagc tccagctttt gttcccttta gtgagggtta attgcgcgct tggcgtaatc 4517 atggtcatag ctgtttcctg tgtgaaattg ttatccgctc acaattccac acaacatacg 4577 agccggaagc ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat 4637 tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg 4697 aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgc 4740 <210> 20 <211> 621 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 20 Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp 1 5 10 15 Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu 20 25 30 Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile 35 40 45 Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu 50 55 60 Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val 65 70 75 80 Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu 85 90 95 Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile 100 105 110 Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu 115 120 125 Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly 130 135 140 Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys 145 150 155 160 Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu 165 170 175 Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His 180 185 190 Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn 195 200 205 Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr 210 215 220 Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys 225 230 235 240 Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala 245 250 255 Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys 260 265 270 Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln 275 280 285 Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu 290 295 300 Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala 305 310 315 320 Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala 325 330 335 Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro 340 345 350 Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp 355 360 365 Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala 370 375 380 Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg 385 390 395 400 Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val 405 410 415 Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser 420 425 430 Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe 435 440 445 Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln 450 455 460 Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val 465 470 475 480 Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala 485 490 495 Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val 500 505 510 Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp 515 520 525 Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu 530 535 540 Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys 545 550 555 560 Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu 565 570 575 Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr 580 585 590 Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp 595 600 605 Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln 610 615 620 <210> 21 <211> 752 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 21 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Gly Gly Val Leu 580 585 590 Thr Asn Ile Ala Arg Gly Glu Tyr Met Arg Gly Gly Ala Gln Ala Gln 595 600 605 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 610 615 620 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 625 630 635 640 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 645 650 655 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 660 665 670 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 675 680 685 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 690 695 700 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 705 710 715 720 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 725 730 735 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 740 745 750 <210> 22 <211> 1863 <212> DNA <213> Artificial Sequence <220> <223> AAV2 Rep nucleic acid sequence <400> 22 atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60 ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120 tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180 cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggctct tttctttgtg 240 caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300 aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360 taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420 gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480 acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540 aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600 gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660 tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720 cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780 tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840 cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900 attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960 acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020 accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080 aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140 aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200 gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260 aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320 ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380 gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440 gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500 gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560 gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620 aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680 ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740 tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800 ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860 caa 1863 <210> 23 <211> 621 <212> PRT <213> Artificial Sequence <220> <223> AAV2 Rep amino acid sequence <400> 23 Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp 1 5 10 15 Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu 20 25 30 Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile 35 40 45 Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu 50 55 60 Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val 65 70 75 80 Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu 85 90 95 Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile 100 105 110 Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu 115 120 125 Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly 130 135 140 Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys 145 150 155 160 Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu 165 170 175 Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His 180 185 190 Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn 195 200 205 Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr 210 215 220 Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys 225 230 235 240 Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala 245 250 255 Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys 260 265 270 Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln 275 280 285 Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu 290 295 300 Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala 305 310 315 320 Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala 325 330 335 Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro 340 345 350 Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp 355 360 365 Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala 370 375 380 Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg 385 390 395 400 Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val 405 410 415 Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser 420 425 430 Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe 435 440 445 Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln 450 455 460 Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val 465 470 475 480 Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala 485 490 495 Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val 500 505 510 Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp 515 520 525 Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu 530 535 540 Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys 545 550 555 560 Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu 565 570 575 Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr 580 585 590 Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp 595 600 605 Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln 610 615 620 <210> 24 <211> 2244 <212> DNA <213> Artificial Sequence <220> <223> AAV9 Cap n.588.EFS nucleic acid sequence <220> <221> misc_feature <222> (1765)..(1797) <223> EFS <400> 24 atggctgccg atggttatct tccagattgg ctcgaggaca accttagtga aggaattcgc 60 gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120 aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180 aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240 cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300 caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360 gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420 ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480 aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540 tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600 cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660 gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780 tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840 tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcagcga 900 ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960 caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa ccttaccagc 1020 acggtccagg tcttcacgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080 gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta cgggtatctg 1140 acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct ggaatatttc 1200 ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta 1260 cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa tccactcatc 1320 gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa tcaacaaacg 1380 ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct 1440 ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa caacagcgaa 1500 tttgcttggc ctggagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct 1560 ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct 1620 ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata 1680 accaacgaag aagaaattaa aactactaac ccggtagcaa cggagtccta tggacaagtg 1740 gccacaaacc accagagtgc ccaagagttc agcagcaaca ccgtgaagct gaccagcgca 1800 caggcgcaga ccggctgggt tcaaaaccaa ggaatacttc cgggtatggt ttggcaggac 1860 agagatgtgt acctgcaagg acccatttgg gccaaaattc ctcacacgga cggcaacttt 1920 cacccttctc cgctgatggg agggtttgga atgaagcacc cgcctcctca gatcctcatc 1980 aaaaacacac ctgtacctgc ggatcctcca acggccttca acaaggacaa gctgaactct 2040 ttcatcaccc agtattctac tggccaagtc agcgtggaga tcgagtggga gctgcagaag 2100 gaaaacagca agcgctggaa cccggagatc cagtacactt ccaactatta caagtctaat 2160 aatgttgaat ttgctgttaa tactgaaggt gtatatagtg aaccccgccc cattggcacc 2220 agatacctga ctcgtaatct gtaa 2244 <210> 25 <211> 747 <212> PRT <213> Artificial Sequence <220> <223> AAV9 Cap n.588.EFS amino acid sequence <220> <221> MISC_FEATURE <222> (499)..(599) <223> EFS <400> 25 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Glu Phe Ser Ser 580 585 590 Asn Thr Val Lys Leu Thr Ser Ala Gln Ala Gln Thr Gly Trp Val Gln 595 600 605 Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr 610 615 620 Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly Asn Phe 625 630 635 640 His Pro Ser Pro Leu Met Gly Gly Phe Gly Met Lys His Pro Pro Pro 645 650 655 Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asp Pro Pro Thr Ala 660 665 670 Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr Gln Tyr Ser Thr Gly 675 680 685 Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys 690 695 700 Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Tyr Lys Ser Asn 705 710 715 720 Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val Tyr Ser Glu Pro Arg 725 730 735 Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 740 745 <210> 26 <211> 2247 <212> DNA <213> Artificial Sequence <220> <223> AAV9 Cap n588.IEI nucleic acid sequence <220> <221> misc_feature <222> (1765)..(1800) <223> IEI <400> 26 atggctgccg atggttatct tccagattgg ctcgaggaca accttagtga aggaattcgc 60 gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120 aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180 aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240 cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300 caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360 gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420 ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480 aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540 tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600 cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660 gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780 tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840 tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcagcga 900 ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960 caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa ccttaccagc 1020 acggtccagg tcttcacgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080 gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta cgggtatctg 1140 acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct ggaatatttc 1200 ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta 1260 cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa tccactcatc 1320 gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa tcaacaaacg 1380 ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct 1440 ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa caacagcgaa 1500 tttgcttggc ctggagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct 1560 ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct 1620 ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata 1680 accaacgaag aagaaattaa aactactaac ccggtagcaa cggagtccta tggacaagtg 1740 gccacaaacc accagagtgc ccaaatcgag atcaacgcta ccagagctgg aaccaacctg 1800 gcacaggcgc agaccggctg ggttcaaaac caaggaatac ttccgggtat ggtttggcag 1860 gacagagatg tgtacctgca aggacccatt tgggccaaaa ttcctcacac ggacggcaac 1920 tttcaccctt ctccgctgat gggagggttt ggaatgaagc acccgcctcc tcagatcctc 1980 atcaaaaaca cacctgtacc tgcggatcct ccaacggcct tcaacaagga caagctgaac 2040 tctttcatca cccagtattc tactggccaa gtcagcgtgg agatcgagtg ggagctgcag 2100 aaggaaaaca gcaagcgctg gaacccggag atccagtaca cttccaacta ttacaagtct 2160 aataatgttg aatttgctgt taatactgaa ggtgtatata gtgaaccccg ccccattggc 2220 accagatacc tgactcgtaa tctgtaa 2247 <210> 27 <211> 748 <212> PRT <213> Artificial Sequence <220> <223> AAV9 Cap n588.IEI amino acid sequence <220> <221> MISC_FEATURE <222> (499)..(600) <223> IEI <400> 27 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ile Glu Ile Asn 580 585 590 Ala Thr Arg Ala Gly Thr Asn Leu Ala Gln Ala Gln Thr Gly Trp Val 595 600 605 Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val 610 615 620 Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly Asn 625 630 635 640 Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met Lys His Pro Pro 645 650 655 Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asp Pro Pro Thr 660 665 670 Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr Gln Tyr Ser Thr 675 680 685 Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser 690 695 700 Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Tyr Lys Ser 705 710 715 720 Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val Tyr Ser Glu Pro 725 730 735 Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 740 745 <210> 28 <211> 2259 <212> DNA <213> Artificial Sequence <220> <223> AAV9 Cap n.588.IEI-L nucleic acid sequence <220> <221> misc_feature <222> (1765)..(1812) <223> IEI-L <400> 28 atggctgccg atggttatct tccagattgg ctcgaggaca accttagtga aggaattcgc 60 gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120 aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180 aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240 cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300 caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360 gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420 ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480 aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540 tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600 cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660 gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780 tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840 tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcagcga 900 ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960 caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa ccttaccagc 1020 acggtccagg tcttcacgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080 gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta cgggtatctg 1140 acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct ggaatatttc 1200 ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta 1260 cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa tccactcatc 1320 gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa tcaacaaacg 1380 ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct 1440 ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa caacagcgaa 1500 tttgcttggc ctggagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct 1560 ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct 1620 ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata 1680 accaacgaag aagaaattaa aactactaac ccggtagcaa cggagtccta tggacaagtg 1740 gccacaaacc accagagtgc ccaaggagga atcgagatca acgctaccag agctggaacc 1800 aacctgggag gagcacaggc gcagaccggc tgggttcaaa accaaggaat acttccgggt 1860 atggtttggc aggacagaga tgtgtacctg caaggaccca tttgggccaa aattcctcac 1920 acggacggca actttcaccc ttctccgctg atgggagggt ttggaatgaa gcacccgcct 1980 cctcagatcc tcatcaaaaa cacacctgta cctgcggatc ctccaacggc cttcaacaag 2040 gacaagctga actctttcat cacccagtat tctactggcc aagtcagcgt ggagatcgag 2100 tgggagctgc agaaggaaaa cagcaagcgc tggaacccgg agatccagta cacttccaac 2160 tattacaagt ctaataatgt tgaatttgct gttaatactg aaggtgtata tagtgaaccc 2220 cgccccattg gcaccagata cctgactcgt aatctgtaa 2259 <210> 29 <211> 752 <212> PRT <213> Artificial Sequence <220> <223> AAV9 Cap n.588.IEI-L amino acid sequence <220> <221> MISC_FEATURE <222> (499)..(604) <223> IEI-L <400> 29 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Gly Gly Ile Glu 580 585 590 Ile Asn Ala Thr Arg Ala Gly Thr Asn Leu Gly Gly Ala Gln Ala Gln 595 600 605 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 610 615 620 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 625 630 635 640 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 645 650 655 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 660 665 670 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 675 680 685 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 690 695 700 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 705 710 715 720 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 725 730 735 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 740 745 750 <210> 30 <211> 2241 <212> DNA <213> Artificial Sequence <220> <223> AAV9 Cap n.588.SAN nucleic acid sequence <220> <221> misc_feature <222> (1765)..(1794) <223> SAN <400> 30 atggctgccg atggttatct tccagattgg ctcgaggaca accttagtga aggaattcgc 60 gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120 aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180 aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240 cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300 caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360 gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420 ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480 aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540 tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600 cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660 gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780 tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840 tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcagcga 900 ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960 caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa ccttaccagc 1020 acggtccagg tcttcacgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080 gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta cgggtatctg 1140 acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct ggaatatttc 1200 ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta 1260 cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa tccactcatc 1320 gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa tcaacaaacg 1380 ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct 1440 ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa caacagcgaa 1500 tttgcttggc ctggagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct 1560 ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct 1620 ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata 1680 accaacgaag aagaaattaa aactactaac ccggtagcaa cggagtccta tggacaagtg 1740 gccacaaacc accagagtgc ccaaagcgct aacttcatca agcctaccag ctacgcacag 1800 gcgcagaccg gctgggttca aaaccaagga atacttccgg gtatggtttg gcaggacaga 1860 gatgtgtacc tgcaaggacc catttgggcc aaaattcctc acacggacgg caactttcac 1920 ccttctccgc tgatgggagg gtttggaatg aagcacccgc ctcctcagat cctcatcaaa 1980 aacacacctg tacctgcgga tcctccaacg gccttcaaca aggacaagct gaactctttc 2040 atcacccagt attctactgg ccaagtcagc gtggagatcg agtgggagct gcagaaggaa 2100 aacagcaagc gctggaaccc ggagatccag tacacttcca actattacaa gtctaataat 2160 gttgaatttg ctgttaatac tgaaggtgta tatagtgaac cccgccccat tggcaccaga 2220 tacctgactc gtaatctgta a 2241 <210> 31 <211> 746 <212> PRT <213> Artificial Sequence <220> <223> AAV9 Cap n.588.SAN amino acid sequence <220> <221> MISC_FEATURE <222> (499)..(598) <223> SAN <400> 31 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ser Ala Asn Phe 580 585 590 Ile Lys Pro Thr Ser Tyr Ala Gln Ala Gln Thr Gly Trp Val Gln Asn 595 600 605 Gln Gly Ile Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu 610 615 620 Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly Asn Phe His 625 630 635 640 Pro Ser Pro Leu Met Gly Gly Phe Gly Met Lys His Pro Pro Pro Gln 645 650 655 Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asp Pro Pro Thr Ala Phe 660 665 670 Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln 675 680 685 Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg 690 695 700 Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Tyr Lys Ser Asn Asn 705 710 715 720 Val Glu Phe Ala Val Asn Thr Glu Gly Val Tyr Ser Glu Pro Arg Pro 725 730 735 Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 740 745 <210> 32 <211> 2244 <212> DNA <213> Artificial Sequence <220> <223> AAV9 Cap n.588.SSN nucleic acid sequence <220> <221> misc_feature <222> (1765)..(1797) <223> SSN <400> 32 atggctgccg atggttatct tccagattgg ctcgaggaca accttagtga aggaattcgc 60 gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120 aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180 aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240 cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300 caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360 gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420 ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480 aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540 tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600 cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660 gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780 tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840 tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcagcga 900 ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960 caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa ccttaccagc 1020 acggtccagg tcttcacgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080 gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta cgggtatctg 1140 acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct ggaatatttc 1200 ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta 1260 cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa tccactcatc 1320 gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa tcaacaaacg 1380 ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct 1440 ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa caacagcgaa 1500 tttgcttggc ctggagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct 1560 ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct 1620 ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata 1680 accaacgaag aagaaattaa aactactaac ccggtagcaa cggagtccta tggacaagtg 1740 gccacaaacc accagagtgc ccaaagcagc aacaccgtga agctgaccag cggacacgca 1800 caggcgcaga ccggctgggt tcaaaaccaa ggaatacttc cgggtatggt ttggcaggac 1860 agagatgtgt acctgcaagg acccatttgg gccaaaattc ctcacacgga cggcaacttt 1920 cacccttctc cgctgatggg agggtttgga atgaagcacc cgcctcctca gatcctcatc 1980 aaaaacacac ctgtacctgc ggatcctcca acggccttca acaaggacaa gctgaactct 2040 ttcatcaccc agtattctac tggccaagtc agcgtggaga tcgagtggga gctgcagaag 2100 gaaaacagca agcgctggaa cccggagatc cagtacactt ccaactatta caagtctaat 2160 aatgttgaat ttgctgttaa tactgaaggt gtatatagtg aaccccgccc cattggcacc 2220 agatacctga ctcgtaatct gtaa 2244 <210> 33 <211> 747 <212> PRT <213> Artificial Sequence <220> <223> AAV9 Cap n.588.SSN amino acid sequence <220> <221> MISC_FEATURE <222> (499)..(599) <223> SSN <400> 33 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ser Ser Asn Thr 580 585 590 Val Lys Leu Thr Ser Gly His Ala Gln Ala Gln Thr Gly Trp Val Gln 595 600 605 Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr 610 615 620 Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly Asn Phe 625 630 635 640 His Pro Ser Pro Leu Met Gly Gly Phe Gly Met Lys His Pro Pro Pro 645 650 655 Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asp Pro Pro Thr Ala 660 665 670 Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr Gln Tyr Ser Thr Gly 675 680 685 Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys 690 695 700 Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Tyr Lys Ser Asn 705 710 715 720 Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val Tyr Ser Glu Pro Arg 725 730 735 Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 740 745 <210> 34 <211> 2256 <212> DNA <213> Artificial Sequence <220> <223> AAV9 Cap n.588.SSN-L nucleic acid sequence <220> <221> misc_feature <222> (1765)..(1809) <223> SSN-L <400> 34 atggctgccg atggttatct tccagattgg ctcgaggaca accttagtga aggaattcgc 60 gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120 aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180 aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240 cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300 caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360 gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420 ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480 aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540 tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600 cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660 gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780 tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840 tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcagcga 900 ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960 caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa ccttaccagc 1020 acggtccagg tcttcacgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080 gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta cgggtatctg 1140 acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct ggaatatttc 1200 ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta 1260 cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa tccactcatc 1320 gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa tcaacaaacg 1380 ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct 1440 ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa caacagcgaa 1500 tttgcttggc ctggagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct 1560 ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct 1620 ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata 1680 accaacgaag aagaaattaa aactactaac ccggtagcaa cggagtccta tggacaagtg 1740 gccacaaacc accagagtgc ccaaggagga agcagcaaca ccgtgaagct gaccagcgga 1800 cacggaggag cacaggcgca gaccggctgg gttcaaaacc aaggaatact tccgggtatg 1860 gtttggcagg acagagatgt gtacctgcaa ggacccattt gggccaaaat tcctcacacg 1920 gacggcaact ttcacccttc tccgctgatg ggagggtttg gaatgaagca cccgcctcct 1980 cagatcctca tcaaaaacac acctgtacct gcggatcctc caacggcctt caacaaggac 2040 aagctgaact ctttcatcac ccagtattct actggccaag tcagcgtgga gatcgagtgg 2100 gagctgcaga aggaaaacag caagcgctgg aacccggaga tccagtacac ttccaactat 2160 tacaagtcta ataatgttga atttgctgtt aatactgaag gtgtatatag tgaaccccgc 2220 cccattggca ccagatacct gactcgtaat ctgtaa 2256 <210> 35 <211> 751 <212> PRT <213> Artificial Sequence <220> <223> AAV9 Cap n.588.SSN-L amino acid sequence <220> <221> MISC_FEATURE <222> (499)..(603) <223> SSN-L <400> 35 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Gly Gly Ser Ser 580 585 590 Asn Thr Val Lys Leu Thr Ser Gly His Gly Gly Ala Gln Ala Gln Thr 595 600 605 Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln Asp 610 615 620 Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr 625 630 635 640 Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met Lys 645 650 655 His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asp 660 665 670 Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr Gln 675 680 685 Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys 690 695 700 Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr 705 710 715 720 Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val Tyr 725 730 735 Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 740 745 750 <210> 36 <211> 2259 <212> DNA <213> Artificial Sequence <220> <223> AAV9 Cap n588.VLT-L nucleic acid sequence <220> <221> misc_feature <222> (1765)..(1812) <223> VLT-L <400> 36 atggctgccg atggttatct tccagattgg ctcgaggaca accttagtga aggaattcgc 60 gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120 aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180 aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240 cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300 caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360 gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420 ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480 aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540 tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600 cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660 gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780 tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840 tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcagcga 900 ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960 caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa ccttaccagc 1020 acggtccagg tcttcacgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080 gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta cgggtatctg 1140 acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct ggaatatttc 1200 ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta 1260 cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa tccactcatc 1320 gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa tcaacaaacg 1380 ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct 1440 ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa caacagcgaa 1500 tttgcttggc ctggagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct 1560 ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct 1620 ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata 1680 accaacgaag aagaaattaa aactactaac ccggtagcaa cggagtccta tggacaagtg 1740 gccacaaacc accagagtgc ccaaggagga gtgctgacca acatcgctag aggagagtac 1800 atgagaggag gagcacaggc gcagaccggc tgggttcaaa accaaggaat acttccgggt 1860 atggtttggc aggacagaga tgtgtacctg caaggaccca tttgggccaa aattcctcac 1920 acggacggca actttcaccc ttctccgctg atgggagggt ttggaatgaa gcacccgcct 1980 cctcagatcc tcatcaaaaa cacacctgta cctgcggatc ctccaacggc cttcaacaag 2040 gacaagctga actctttcat cacccagtat tctactggcc aagtcagcgt ggagatcgag 2100 tgggagctgc agaaggaaaa cagcaagcgc tggaacccgg agatccagta cacttccaac 2160 tattacaagt ctaataatgt tgaatttgct gttaatactg aaggtgtata tagtgaaccc 2220 cgccccattg gcaccagata cctgactcgt aatctgtaa 2259 <210> 37 <211> 752 <212> PRT <213> Artificial Sequence <220> <223> AAV9 Cap n588.VLT-L amino acid sequence <220> <221> MISC_FEATURE <222> (499)..(604) <223> VLT-L <400> 37 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Gly Gly Val Leu 580 585 590 Thr Asn Ile Ala Arg Gly Glu Tyr Met Arg Gly Gly Ala Gln Ala Gln 595 600 605 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 610 615 620 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 625 630 635 640 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 645 650 655 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 660 665 670 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 675 680 685 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 690 695 700 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 705 710 715 720 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 725 730 735 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 740 745 750 <210> 38 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> EFS peptide sequence <400> 38 Glu Phe Ser Ser Asn Thr Val Lys Leu Thr Ser 1 5 10 <210> 39 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> SSN-L peptide sequence <400> 39 Gly Gly Ser Ser Asn Thr Val Lys Leu Thr Ser Gly His Gly Gly 1 5 10 15 <210> 40 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> SSN peptide sequence <400> 40 Ser Ser Asn Thr Val Lys Leu Thr Ser Gly His 1 5 10 <210> 41 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> SAN peptide sequence <400> 41 Ser Ala Asn Phe Ile Lys Pro Thr Ser Tyr 1 5 10 <210> 42 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> IEI peptide sequence <400> 42 Ile Glu Ile Asn Ala Thr Arg Ala Gly Thr Asn Leu 1 5 10 <210> 43 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> IEI-L peptide sequence <400> 43 Gly Gly Ile Glu Ile Asn Ala Thr Arg Ala Gly Thr Asn Leu Gly Gly 1 5 10 15 <210> 44 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV9 capsid <400> 44 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 45 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAVhu68 capsid <400> 45 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Val Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 46 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> VLT-L peptide sequence <400> 46 Gly Gly Val Leu Thr Asn Ile Ala Arg Gly Glu Tyr Met Arg Gly Gly 1 5 10 15 <210> 47 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> N-X-(T/I/V/A)-(K/R) motif <220> <221> MISC_FEATURE <222> (2)..(2) <223> any amino acid <220> <221> MISC_FEATURE <222> (3)..(3) <223> Xaa is selected from Threonine (T), Isoleucine (I), Valine (V) or Alanine (A) <220> <221> MISC_FEATURE <222> (4)..(4) <223> Xaa is selelcted from Lysine (K) or Arginine (R) <400> 47 Asn Xaa Xaa Xaa 1 <210> 48 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> AAV2 variant peptide NDVRAVS <400> 48 Asn Asp Val Arg Ala Val Ser 1 5 <210> 49 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> PHP.B peptide insert <400> 49 Thr Leu Ala Val Pro Phe Lys 1 5 <210> 50 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid sequence EFS <400> 50 gagttcagca gcaacaccgt gaagctgacc agc 33 <210> 51 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid sequence IEI <400> 51 atcgagatca acgctaccag agctggaacc aacctg 36 <210> 52 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid sequence IEI-L <400> 52 ggaggaatcg agatcaacgc taccagagct ggaaccaacc tgggagga 48 <210> 53 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid sequence SAN <400> 53 agcgctaact tcatcaagcc taccagctac 30 <210> 54 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid sequence SSN <400> 54 agcagcaaca ccgtgaagct gaccagcgga cac 33 <210> 55 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid sequence SSN-L <400> 55 ggaggaagca gcaacaccgt gaagctgacc agcggacacg gagga 45 <210> 56 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid sequence VLT-L <400> 56 ggaggagtgc tgaccaacat cgctagagga gagtacatga gaggagga 48

Claims

모티프 N- x- (T/I/V/A)- (K/R)(서열번호 47)을 포함하는 아미노산 서열을 포함하는 캡시드를 갖는 재조합 아데노-연관 바이러스 입자(rAAV)로서, 상기 아미노산 서열은 캡시드 내의 적어도 AAV vp3 단백질의 일부이고, 이의 발현을 지시하는 서열의 제어 하에 유전자 산물을 인코딩하는 핵산 서열을 포함하는 캡시드 내에 패키징된 벡터 게놈이되, 캡시드는 NDVRAVS(서열번호 48) 서열을 포함하는 돌연변이 AAV2 캡시드가 아닌 것인 재조합 아데노-연관 바이러스 입자.
제1항에 있어서, 상기 아미노산 서열은 2개의 아미노산 내지 7개의 아미노산에 의해 모티프의 아미노 말단 및/또는 카르복시 말단에서 선택적으로 측접한 N- x- (T/I/V/A)- (K/R) 모티프가 AAV 캡시드 vp3 영역에 삽입되는 것을 포함하는, rAAV.
제1항 또는 제2항에 있어서, 상기 캡시드에 삽입된 서열은 다음을 포함하는 것인, rAAV:
(a) SSNTVKLTSGH (서열번호 40);
(b) EFSSNTVKLTS (서열번호 38);
(c) GGVLTNIARGEYMRGG (서열번호 46);
(d) GGIEINATRAGTNLGG (서열번호 43);
(e) GGSSNTVKLTSGHGG (서열번호 39);
(f) IEINATRAGTNL(서열번호 42); 또는
(g) SANFIKPTSY (서열번호 41).
제1항 내지 제3항 중 어느 한 항에 있어서, 상기 모티프의 아미노산 서열은 NTVK인, rAAV.
제1항에 있어서, 상기 모티프 N- x- (T/I/V/A)- (K/R)(서열번호 47)은 선택적으로 이의 카르복시- 및/또는 아미노 말단에 2개 내지 7개의 아미노산이 측접되어 있고 아미노산 서열: 서열번호 44의 넘버링에 기초하여 AAV9 캡시드 단백질의 아미노산 588 및 589 사이에 삽입된 것인, rAAV.
제1항 내지 제5항 중 어느 한 항에 따른 rAAV의 스톡 및 생리학적으로 적합한 담체, 부형제 및/또는 수성 현탁액 베이스 중 하나 이상을 포함하는, 조성물.
내피 세포 표적화 펩티드로서, 상기 내피 세포 표적화 펩티드는 N- x- (T/I/V/A)- (K/R) (서열번호 47)의 아미노산 서열을 포함하고 선택적으로 모티프의 아미노 말단 및/또는 카르복시 말단에 2개의 아미노산 내지 7개의 아미노산이 측접되어 있고, 선택적으로 나노입자, 제2 분자, 또는 바이러스 캡시드 단백질에 추가로 접합되는 것인, 내피 세포 표적화 펩티드.
제7항에 있어서, 상기 내피 세포 표적화 펩티드는 다음을 포함하는, 내피 세포 표적화 펩티드:
(a) SSNTVKLTSGH (서열번호 40);
(b) EFSSNTVKLTS (서열번호 38);
(c) GGVLTNIARGEYMRGG (서열번호 46);
(d) GGIEINATRAGTNLGG (서열번호 43);
(e) GGSSNTVKLTSGHGG (서열번호 39);
(f) IEINATRAGTNL(서열번호 42); 또는
(g) SANFIKPTSY(서열번호 41).
제7항 또는 제8항에 있어서, 상기 모티프의 아미노산 서열은 NTVK인, 내피 세포 표적화 펩티드.
제7항 내지 제9항 중 어느 한 항에 따른 내피 세포 표적화 펩티드 및 생리학적으로 적합한 담체, 부형제 및/또는 수성 현탁액 베이스 중 하나 이상을 포함하는, 조성물.
제7항 내지 제9항 중 어느 한 항에 따른 뇌 내피 세포 표적화 펩티드 및 적어도 하나의 폴리펩티드 또는 단백질을 포함하는 융합 파트너를 포함하는, 융합 폴리펩티드 또는 단백질.
제11항에 따른 융합 폴리펩티드 또는 단백질 및 생리학적으로 적합한 담체, 부형제 및/또는 수성 현탁액 베이스 중 하나 이상을 포함하는 조성물.
치료를 필요로 하는 환자에게 치료제를 전달하기 위한, 제1항 내지 제5항 중 어느 한 항에 따른 rAAV의 스톡, 제7항 내지 제9항 중 어느 한 항에 따른 내피 세포 표적화 펩티드, 또는 제11항에 따른 융합 폴리펩티드 또는 단백질, 또는 제6항, 제10항 또는 제12항 중 어느 한 항에 따른 조성물의 용도.
뇌의 내피 세포에 대한 표적 치료 방법으로서, 상기 방법은 치료를 필요로 하는 환자에게 제1항 내지 제5항 중 어느 한 항에 따른 rAAV의 스톡을 투여하는 단계를 포함하는, 방법.
제1항 내지 제5항 중 어느 한 항에 따른 rAAV의 스톡을 이를 필요로 하는 대상체에게 전달함으로써 알란-헌돈-더들리병을 치료하는 방법으로서, 인코딩된 유전자 산물이 MCT8 단백질인, 방법.
폐에 대한 표적 치료 방법으로서, 치료를 필요로 하는 환자에게 제1항 내지 제5항 중 어느 한 항에 따른 rAAV의 스톡을 투여하는 단계를 포함하는, 방법.
제1항 내지 제5항 중 어느 한 항에 따른 rAAV의 스톡을 치료를 필요로 하는 대상체에게 전달함으로써 폐 질환을 치료하는 방법으로서, 인코딩된 유전자 산물은 가용성 Ace2 단백질, 항-SARS 항체, 항-SARS-CoV2 항체, 항인플루엔자 항체 또는 낭포성 섬유증 막관통 단백질인, 방법.
N- x- (T/I/V/A)- (K/R)(서열번호 47) 모티프를 AAV 캡시드에 삽입하는 단계를 포함하는 시험관 내에서 AAV 생산 세포의 형질도입을 증가시키는 방법.
제16항에 있어서, 상기 생산 세포는 293 세포인 방법.