KR20240005950A

KR20240005950A - 벡터 시스템

Info

Publication number: KR20240005950A
Application number: KR1020237042749A
Authority: KR
Inventors: 알베르토 아우리치오; 파비오 델라퀼라; 이바나 트라파니; 리타 페를라
Original assignee: 폰다지오네 텔레톤 이티에스
Priority date: 2021-05-12
Filing date: 2022-05-12
Publication date: 2024-01-12
Also published as: BR112023023599A2; IL308356A; US20220389450A1; AU2022274162A1; CA3218631A1; WO2022238556A1; EP4337779A1; MX2023013393A; JP2024517957A; CN117377771A

Abstract

세포에서 트랜스진을 발현시키기 위한 벡터 시스템으로서, 벡터 시스템이 제1 벡터 및 제2 벡터를 포함하고, 여기서 (a) 제1 벡터는 5'에서 3' 방향으로 프로모터; 인트론; 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 스플라이스 공여체 서열; 및 제1 재조합원성 영역을 포함하고; (b) 제2 벡터가 5'에서 3' 방향으로 제2 재조합원성 영역; 스플라이스 수용체 서열; 및 트랜스진 CDS의 3' 말단 부분을 포함하고; 여기서 5' 말단 부분 및 3' 말단 부분은 함께 트랜스진 CDS를 구성하고, 인트론은 스플라이스 공여체 서열과 상동성 재조합할 수 없어 트랜스진 CDS의 5' 말단 부분을 절제한다.

Description

벡터 시스템

발명의 분야

본 발명은 벡터 및 벡터 시스템, 특히 표적 세포에 큰 트랜스진의 전달을 가능하게 하는 벡터 및 벡터 시스템에 관한 것이다. 본 발명은 또한 유전자 요법에서 벡터 및 벡터 시스템의 용도에 관한 것이다.

본 발명에 따른 배경

예를 들어, 아데노-관련 바이러스(AAV) 벡터를 사용한 유전자 요법은 많은 유전성 망막 변성(IRD)의 치료를 위한 유망한 접근법을 대표한다. 실제로, 다양한 IRD에 대한 수년간의 전임상 연구 및 임상 시험은 질병에 걸린 망막 층(예를 들어, 광수용기(PR) 및 망막 색소 상피(RPE))에 치료 유전자를 효율적으로 전달하는 AAV의 능력을 보여주었고 이들의 인간에서 우수한 안전성 및 효능 프로파일을 강조하였다. 그러나, AAV 유전자 요법 벡터를 이용하는 데 있어 주요 장애물 중 하나는 트랜스진을 패키징하는 이들의 능력이며, 이는 최대 약 5kb로 제한될 수 있다. 이는 5 kb 초과의 코딩 서열(CDS)을 갖는 유전자의 돌연변이로 인해 발생하는 질병, 예를 들어, IRD에 대한 유전자 대체 요법의 개발에 대한 제한 인자일 수 있다.

AAV의 용량을 증가시키기 위한 전략의 확인에 상당한 관심이 집중되어 왔다. 예를 들어, 분자간 재조합을 통해 연쇄동일서열화하는 AAV 게놈의 능력에 기반한 이중 AAV 벡터는 이 문제를 해결하기 위해 성공적으로 이용되었다. 이중 AAV 벡터는 큰 트랜스진 CDS를 별도의 부분으로 분할하고 각각을 단일 정상 크기(NS; < 5 kb) AAV 벡터로 패키징함으로써 생성될 수 있다. 전장 트랜스진 CDS의 재구성은 두 이중 AAV 벡터 모두에 의한 동일한 세포의 공동-감염에 이어 i) 2개의 벡터 게놈의 역 말단 반복부(ITR-)-매개된 테일-투-헤드 연쇄동일서열화 후 스플라이싱(이중 AAV 트랜스-스플라이싱, TS)(Duan et al. (2001) Molecular Therapy: Journal of the American Society of Gene Therapy 4: 383-391); ii) 2개의 벡터 게놈에 함유된 중첩 영역 사이의 상동성 재조합(이중 AAV 중첩, OV)((Duan et al. (2001) Molecular Therapy : Journal of the American Society of Gene Therapy 4: 383-391)); 또는 iii) 이 둘의 조합(이중 AAV 하이브리드)(Ghosh et al. (2008) Molecular Therapy : the journal of the American Society of Gene Therapy 16: 124-130)시 달성될 수 있다.

이중 AAV 하이브리드 벡터와 관련하여 가장 많이 사용되는 재조합원성 영역은 높은 수준의 이중 AAV 하이브리드 벡터 재구성을 부여하는 것으로 밝혀진 인간 알칼리성 포스파타제 cDNA의 중간 1/3의 872 bp 서열로부터 유래된다. 또한, F1 파지 게놈(AK)으로부터의 77 bp 서열은 시험관내 및 생체내 실험에서 고도로 재조합원성인 것으로 밝혀졌다.

연구는 관심 조직에서 큰 트랜스진의 전달 및 재구성을 위한 AAV 벡터 시스템과 같은 이중 벡터 시스템의 가능성이 강조되었지만, 임상 용도로의 이들의 번역은 상당한 충족되지 않은 요구로 남아 있다.

발명의 개요

큰 트랜스진(예를 들어, Myosin7A, MYO7A)의 전달을 위한 이중 벡터 시스템의 개발 동안, 본 발명자들은 트랜스진 CDS의 5' 말단 부분을 함유하는 벡터의 제조에서 일관된 오염물을 예상치 못하게 발견하였다. 본 발명자들은 서던 블롯으로 제조물을 분석하고 예상된 벡터에 상응하는 밴드를 확인하였고 놀랍게도 또한 오염물에 상응하는 약 1.3 kb의 더 작은 크기의 밴드를 발견하였다.

이후, 본 발명자들은 벡터를 추가로 연구하고, 벡터에서 사용된 스플라이싱 공여체(SD) 부위와 키메라 프로모터 인트론 사이의 상동성 영역을 확인하였다. 정제된 바이러스 DNA의 추가 시퀀싱 분석은, 상동성 재조합 사건이 작제물 내에 이러한 상동성 영역의 존재로 인해 발생하여, AAV 역 말단 반복부(ITR)를 유지하면서 인트론의 나머지 부분, 트랜스진 CDS의 5' 말단 부분 및 SD 부위의 결실을 초래하며, 이에 따라 벡터 생성을 지원함을 확인시켜 주었다.

일 양태에서, 본 발명은 세포에서 트랜스진을 발현시키기 위한 벡터 시스템을 제공하며, 상기 벡터 시스템은 제1 벡터 및 제2 벡터를 포함하고, 여기서

(a) 제1 벡터는 5'에서 3' 방향으로 인트론; 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 및 스플라이스 공여체 서열을 포함하며;

(b) 제2 벡터는 5'에서 3' 방향으로 스플라이스 수용체 서열; 및 트랜스진 CDS의 3' 말단 부분을 포함하며;

여기서 5' 말단 부분 및 3' 말단 부분은 함께 트랜스진 CDS를 구성하고, 인트론은 스플라이스 공여체 서열과 상동성 재조합할 수 없어 트랜스진 CDS의 5' 말단 부분을 절제한다.

또 다른 양태에서, 본 발명은 세포에서 트랜스진을 발현시키기 위한 벡터 시스템을 제공하며, 상기 벡터 시스템은 제1 벡터 및 제2 벡터를 포함하고, 여기서

(a) 제1 벡터는 5'에서 3' 방향으로 프로모터; 인트론; 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 및 스플라이스 공여체 서열을 포함하며;

또 다른 양태에서, 본 발명은 세포에서 트랜스진을 발현시키기 위한 벡터 시스템을 제공하며, 벡터 시스템은 제1 벡터 및 제2 벡터를 포함하고, 여기서

(a) 제1 벡터는 5'에서 3' 방향으로 프로모터; 인트론; 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 스플라이스 공여체 서열; 및 제1 재조합 영역을 포함하며;

(b) 제2 벡터는 5'에서 3' 방향으로 제2 재조합 영역; 스플라이스 수용체 서열; 및 트랜스진 CDS의 3' 말단 부분을 포함하며;

바람직한 구체예에서, 인트론은 시미안 바이러스 40(SV40) 인트론이다. SV40 인트론은 변형된 SV40 인트론일 수 있다.

일부 구체예에서, 인트론은 미닛 바이러스 마우스(MVM) 인트론이다.

일부 구체예에서, 인트론은 SEQ ID NO: 3 또는 4에 대해 적어도 95% 서열 동일성(예를 들어, 적어도 96%, 97%, 98% 또는 99% 서열 동일성, 또는 100% 서열 동일성)을 갖는 뉴클레오티드 서열을 포함한다. 바람직한 구체예에서, 인트론은 SEQ ID NO: 3에 대해 적어도 95% 서열 동일성(예를 들어, 적어도 96%, 97%, 98% 또는 99% 서열 동일성, 또는 100% 서열 동일성)을 갖는 뉴클레오티드 서열을 포함한다.

일부 구체예에서, 스플라이스 공여체 서열은 SEQ ID NO: 5와 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함한다.

바람직한 구체예에서, 제1 재조합원성 영역 및 제2 재조합원성 영역은 동일하다.

일부 구체예에서, 제1 재조합원성 영역 및 제2 재조합원성 영역은 둘 모두 F1 파지 재조합원성 영역 또는 이의 단편이다.

일부 구체예에서, 제1 재조합원성 영역 및 제2 재조합원성 영역 둘 모두는 SEQ ID NO: 7에 대해 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열 또는 이의 단편을 포함한다.

일부 구체예에서, 제1 벡터 및 제2 벡터는 바이러스 벡터이다. 바이러스 벡터는 아데노-관련 바이러스(AAV) 벡터, 아데노바이러스 벡터, 레트로바이러스 벡터, 렌티바이러스 벡터, 단순 포진 바이러스 벡터, 피코르나바이러스 벡터 또는 알파바이러스 벡터일 수 있다. 일부 구체예에서, 제1 벡터 및 제2 벡터는 플라스미드이다. 제1 및/또는 제2 플라스미드는, 예를 들어, 제1 및/또는 제2 바이러스 벡터 입자를 생성하는데 사용될 수 있다(예를 들어, 조성물에서 별도로 또는 함께).

바람직한 구체예에서, 제1 벡터 및 제2 벡터는 AAV 벡터이다.

일부 구체예에서, AAV 벡터는 동일한 혈청형이다(예를 들어, 동일한 혈청형의 캡시드를 포함한다). 일부 구체예에서, AAV 벡터는 상이한 혈청형이다(예를 들어, 상이한 혈청형의 캡시드를 포함한다).

일부 구체예에서, 제1 벡터 및 제2 벡터는 AAV2, AAV8, AAV5, AAV7, AAV9, AAV-PhP.B 및 AAV-PhP.eB로 구성된 군으로부터 선택된다. 일부 구체예에서, 제1 벡터 및 제2 벡터는 hu68(예를 들어, WO 2018/160582 참조), Anc 라이브러리(예를 들어, WO 2015/054653 및 WO 2017/019994 참조) 및 AAV2-TT(예를 들어, WO 2015/121501 참조)로 구성된 군으로부터 선택된다.

일부 구체예에서, 제1 벡터 및 제2 벡터는 AAV2 벡터이다. 일부 구체예에서, 제1 벡터 및 제2 벡터는 AAV8 벡터이다.

일부 구체예에서, 제1 벡터 및 제2 벡터는 AAV2, AAV8, AAV5, AAV7, AAV9, AAV-PhP.B 및 AAV-PhP.eB로 구성된 군으로부터 선택되는 캡시드를 포함한다. 일부 구체예에서, 제1 벡터 및 제2 벡터는 hu68(예를 들어, WO 2018/160582 참조), Anc 라이브러리(예를 들어, WO 2015/054653 및 WO 2017/019994 참조) 및 AAV2-TT(예를 들어, WO 2015/121501 참조)로 구성된 군으로부터 선택되는 캡시드를 포함한다.

일부 구체예에서, 제1 벡터 및 제2 벡터는 AAV2 캡시드를 포함한다. 일부 구체예에서, 제1 벡터 및 제2 벡터는 AAV8 캡시드를 포함한다.

일부 구체예에서, 제1 벡터는 5' ITR 및 3' ITR을 추가로 포함한다. 일부 구체예에서, 제2 벡터는 5' ITR 및 3' ITR을 추가로 포함한다. 바람직한 구체예에서, 제1 벡터는 5' ITR 및 3' ITR을 추가로 포함하고, 제2 벡터는 5' ITR 및 3' ITR을 추가로 포함한다.

바람직한 구체예에서, ITR은 AAV ITR, 바람직하게는 AAV2 ITR이다. 일부 구체예에서, ITR은 AAV8 ITR이다.

바람직한 구체예에서, 제1 벡터 및 제2 벡터는 AAV2/8 벡터이다.

일부 구체예에서, ITR은 동일한 AAV 혈청형으로부터 유래된다. 일부 구체예에서, ITR은 상이한 AAV 혈청형으로부터 유래된다.

바람직한 구체예에서, 제1 벡터의 3' ITR 및 제2 벡터의 5' ITR은 동일한 AAV 혈청형으로부터 유래된다.

바람직한 구체예에서, 제1 벡터의 5' ITR 및 제2 벡터의 5' ITR은 동일한 AAV 혈청형으로부터 유래된다. 바람직한 구체예에서, 제1 벡터의 3' ITR 및 제2 벡터의 3' ITR은 동일한 AAV 혈청형으로부터 유래된다.

바람직한 구체예에서, 제1 벡터의 5' ITR 및 제2 벡터의 5' ITR은 AAV2 5' ITR이고, 제1 벡터의 3' ITR 및 제2 벡터의 3' ITR은 AAV2 3' ITR이다.

일부 구체예에서, 제1 벡터의 5' ITR 및 제2 벡터의 5' ITR은 AAV8 5' ITR이고, 제1 벡터의 3' ITR 및 제2 벡터의 3' ITR은 AAV8 3' ITR이다.

일부 구체예에서, 제1 벡터의 5' ITR 및 제2 벡터의 5' ITR은 상이한 AAV 혈청형으로부터 유래된다. 일부 구체예에서, 제1 벡터의 3' ITR 및 제2 벡터의 3' ITR은 상이한 AAV 혈청형으로부터 유래된다. 일부 구체예에서, 제1 벡터의 5' ITR 및 제2 벡터의 5' ITR은 상이한 AAV 혈청형으로부터 유래되고, 제1 벡터의 3' ITR 및 제2 벡터의 3' ITR은 상이한 AAV 혈청형으로부터 유래된다.

일부 구체예에서, 제1 벡터의 5' ITR 및 제2 벡터의 3' ITR은 상이한 AAV 혈청형으로부터 유래된다.

일부 구체예에서, 제1 벡터 및 제2 벡터는 바이러스 벡터 입자이다.

일부 구체예에서, 프로모터는 CBA 프로모터 또는 이의 단편이다.

일부 구체예에서, 제1 벡터는 인핸서 서열을 추가로 포함한다. 바람직한 구체예에서, 인핸서는 CMV 인핸서이다.

일부 구체예에서, 제2 벡터는 트랜스진 CDS의 3' 말단 부분의 다운스트림에 폴리아데닐화 서열을 추가로 포함한다. 바람직한 구체예에서, 폴리아데닐화 서열은 소 성장 호르몬(bGH) 폴리아데닐화 서열이다.

일부 구체예에서, 트랜스진은 Myosin 7A(MYO7A), ABCA4, CEP290, CDH23, EYS, USH2a, GPR98 및 ALMS1로 구성된 군으로부터 선택된다.

바람직한 구체예에서, 트랜스진은 Myosin 7A(MYO7A) 트랜스진이다. 일부 구체예에서, 트랜스진은 ABCA4 트랜스진이다. 일부 구체예에서, 트랜스진 CDS는 야생형 서열이다. 일부 구체예에서, 트랜스진 CDS는 코돈 최적화된다(예를 들어, 인간에서 발현을 위해 최적화된 코돈).

바람직한 구체예에서:

(a) 제1 벡터는 SEQ ID NO: 14에 대해 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하고/거나;

(b) 제2 벡터는 SEQ ID NO: 15에 대해 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함한다.

특히 바람직한 구체예에서:

(a) 제1 벡터는 SEQ ID NO: 14의 뉴클레오티드 서열을 포함하고/거나;

(b) 제2 벡터는 SEQ ID NO: 15의 뉴클레오티드 서열을 포함한다.

일부 구체예에서, 제1 벡터 및 제2 벡터는 1:1 게놈 복사체 비율로 존재한다.

또 다른 양태에서, 본 발명은 세포에서 트랜스진을 발현시키기 위한 방법으로서, 트랜스진이 세포에서 발현되도록 본원에 개시된 바와 같은 제1 벡터 및 제2 벡터로 세포를 형질도입 또는 형질감염시키는 것을 포함하는, 방법을 제공한다.

또 다른 양태에서, 본 발명은 본원에 개시된 바와 같은 제1 벡터 및 제2 벡터를 포함하는 세포를 제공한다.

또 다른 양태에서, 본 발명은 본원에 개시된 바와 같은 제1 벡터 및 제2 벡터로 형질도입되거나 형질감염된 세포를 제공한다.

일부 구체예에서, 세포는 포유동물 세포, 인간 세포, 망막 세포 또는 비배아 줄기 세포이다.

또 다른 양태에서, 본 발명은 벡터가 본원에 개시된 바와 같은 제1 벡터인 벡터를 제공한다.

또 다른 양태에서, 본 발명은 벡터가 본원에 개시된 바와 같은 제2 벡터인 벡터를 제공한다.

또 다른 양태에서, 본 발명은 5'에서 3' 방향으로 인트론; 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 및 스플라이스 공여체 서열을 포함는 벡터로서, 인트론은 스플라이스 공여체 서열과 상동성 재조합할 수 없어 트랜스진 CDS의 5' 말단 부분을 절제하는, 벡터를 제공한다.

또 다른 양태에서, 본 발명은 5'에서 3' 방향으로 프로모터; 인트론; 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 및 스플라이스 공여체 서열을 포함는 벡터로서, 인트론은 스플라이스 공여체 서열과 상동성 재조합할 수 없어 트랜스진 CDS의 5' 말단 부분을 절제하는, 벡터를 제공한다.

또 다른 양태에서, 본 발명은 5'에서 3' 방향으로 프로모터; 인트론; 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 스플라이스 공여체 서열; 및 재조합원성 영역을 포함는 벡터로서, 인트론은 스플라이스 공여체 서열과 상동성 재조합할 수 없어 트랜스진 CDS의 5' 말단 부분을 절제하는, 벡터를 제공한다.

일부 구체예에서, 벡터는 5' ITR 및 3' ITR을 추가로 포함한다. 바람직한 구체예에서, ITR은 AAV ITR, 바람직하게는 AAV2 ITR이다.

또 다른 양태에서, 본 발명은 5'에서 3' 방향으로 스플라이스 수용체 서열; 및 트랜스진 코딩 서열(CDS)의 3' 말단 부분을 포함하는 벡터를 제공한다.

또 다른 양태에서, 본 발명은 5'에서 3' 방향으로 재조합원성 영역; 스플라이스 수용체 서열; 및 트랜스진 코딩 서열(CDS)의 3' 말단 부분을 포함하는 벡터를 제공한다.

일부 구체예에서, 벡터는 SEQ ID NO: 14에 대해 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함한다.

바람직한 구체예에서, 벡터는 SEQ ID NO: 14의 뉴클레오티드 서열을 포함한다.

또 다른 양태에서, 본 발명은 본원에 개시된 바와 같은 제1 벡터 및 본원에 개시된 바와 같은 제2 벡터를 포함하는 키트를 제공한다.

또 다른 양태에서, 본 발명은 본원에 개시된 바와 같은 제1 벡터 및 본원에 개시된 바와 같은 제2 벡터를 포함하는 조성물을 제공한다.

바람직한 구체예에서, 조성물은 약학적으로 허용되는 담체, 희석제 또는 부형제를 포함하는 약학적 조성물이다.

또 다른 양태에서, 본 발명은 요법에 사용하기 위한 본 발명의 벡터 시스템, 벡터, 키트 또는 조성물을 제공한다.

또 다른 양태에서, 본 발명은 망막 변성의 치료에 사용하기 위한 본 발명의 벡터 시스템, 벡터, 키트 또는 조성물을 제공한다. 바람직하게는, 망막 변성은 유전성 망막 변성이다.

또 다른 양태에서, 본 발명은 요법에 사용하기 위한 본원에 개시된 바와 같은 제1 벡터로서, 여기서 제1 벡터는 본원에 개시된 바와 같은 제2 벡터와 함께 동시에, 순차적으로 또는 별도로 투여되는, 제1 벡터를 제공한다.

또 다른 양태에서, 본 발명은 망막 변성의 치료에 사용하기 위한 본원에 개시된 바와 같은 제1 벡터로서, 제1 벡터는 본원에 개시된 바와 같은 제2 벡터와 함께 동시에, 순차적으로 또는 별도로 투여되는, 제1 벡터를 제공한다. 바람직하게는, 망막 변성은 유전성 망막 변성이다.

또 다른 양태에서, 본 발명은 요법에 사용하기 위한 본원에 개시된 바와 같은 제2 벡터로서, 여기서 제2 벡터는 본원에 개시된 바와 같은 제1 벡터와 함께 동시에, 순차적으로 또는 별도로 투여되는, 제2 벡터를 제공한다.

또 다른 양태에서, 본 발명은 망막 변성의 치료에 사용하기 위한 본원에 개시된 바와 같은 제2 벡터로서, 제2 벡터는 본원에 개시된 바와 같은 제1 벡터와 함께 동시에, 순차적으로 또는 별도로 투여되는, 제2 벡터를 제공한다. 바람직하게는, 망막 변성은 유전성 망막 변성이다.

일부 구체예에서, 용도는 어셔 증후군, 색소성 망막염, 레버 선천성 흑암시(LCA), 스타가르트병, 알스트롬 증후군 또는 ABCA4-관련 질병의 치료 또는 예방에 있다.

또 다른 양태에서, 본 발명은 어셔 증후군의 치료에 사용하기 위한 본 발명의 벡터 시스템, 벡터, 키트 또는 조성물을 제공한다.

또 다른 양태에서, 본 발명은 유효량의 본 발명의 벡터 시스템, 벡터, 키트 또는 조성물을 이를 필요로 하는 대상체에게 투여하는 것을 포함하는 망막 변성을 치료 또는 예방하는 방법을 제공한다. 바람직하게는, 망막 변성은 유전성 망막 변성이다.

또 다른 양태에서, 본 발명은 유효량의 본 발명의 벡터 시스템, 벡터, 키트 또는 조성물을 이를 필요로 하는 대상체에게 투여하는 것을 포함하는 어셔 증후군을 치료 또는 예방하는 방법을 제공한다.

도면의 설명
도 1. 오염 벡터의 확인.
(A) AAV-5'hMYO7A(상단 화살표로 표시됨) 및 오염물 벡터(하단 화살표로 표시됨)에 상응하는 게놈을 보여주는 서던 블롯 이미지. DNAse: 오염된 외부 DNA의 분해를 위한 DNAse로의 처리; 플라스미드: AAV8-CBA-키메라 인트론-5'hMYO7A를 생성하기 위한 DNA 서열을 함유하는 플라스미드 DNA; 5'AAV 게놈-CI: AAV8-CBA 프로모터-키메라 인트론-5'hMYO7A로부터 추출된 게놈 DNA; 킬로베이스로 표현된 분자량 마커; bp = 염기쌍. CI: 키메라 인트론. (B) 서던 블롯 프로브에 의해 인식되는 서열을 나타내는 AAV-5'hMYO7A 게놈의 묘사. (C) 키메라 프로모터의 인트론과 SD 신호 사이의 페어링 메커니즘(점선으로 표시됨). (D) 서던 블롯 프로브에 의해 인식되는 서열을 나타내는 오염물 벡터 게놈의 묘사. (E) 하기 발현 카세트를 포함하는 AAV 제조물의 서던 블롯 분석: 1. 5'CMV ABCA4 AK(이중 하이브리드); 2. 5'CMV ABCA4 TS(이중 트랜스-스플라이싱); 3. 5'CMV NO INTR ABCA4 OV(이중 중첩); 4. 5'CMV NO INTR ABCA4 AK(이중 하이브리드); 5. 5'VMD2 ABCA4 AK(이중 하이브리드); 6. 5'RHO ABCA4 AK(이중 하이브리드); 7. 5'RHO ABCA4 TS(이중 트랜스-스플라이싱). 키메라 인트론은 벡터 1 및 2에 존재하고 벡터 3 내지 7에는 존재하지 않는다. 점선 상자는 예상 크기의 전장 게놈을 나타내고; 실선 박스는 짧고 절두된 게놈을 나타낸다.
도 2. EGFP 형광에 의한 키메라 인트론, SV40 인트론, MVM 인트론 및 인트론 부재의 시험관내 비교.
(A) 키메라 인트론, SV40 인트론 또는 MVM 인트론을 갖거나 인트론이 없는 EGFP를 인코딩하는 플라스미드의 묘사. (B) 형질감염된 HEK293 세포의 대표적인 현미경 형광 사진(10X 배율, 스케일 바 100 μm). CI: 키메라 인트론; SV40: 시미안 바이러스 40; MVM: 미닛 바이러스 마우스.
도 3. 웨스턴 블롯 분석에 의한 키메라 인트론, SV40 인트론, MVM 인트론 및 인트론 부재의 시험관내 비교.
A) 이중 AAV2-키메라 인트론-hMYO7A, 이중 AAV2-SV40 인트론-hMYO7A, 이중 AAV2-MVM 인트론-hMYO7A, 이중 AAV2-인트론 부재-hMYO7A 또는 벡터 부재로의 감염 후 72시간째 HEK293 세포의 웨스턴 블롯 분석. 화살표는 전장 단백질을 나타내고, 60 μg의 단백질을 각 레인에 로딩하였고, 각 웨스턴 블롯에 있어서 분자 마커는 왼쪽에 보고된다. 실험 번호는 샘플의 각 세트 아래에 보고되어 있다. 음성 대조군: 이중 AAV2-hMYO7A를 수용하지 않은 세포; @MYO7A: 항-Myosin7A(MYO7A) 항체를 이용한 웨스턴 블롯; @Filamin: 로딩 대조군으로 사용된 항-Filamin 항체를 이용한 웨스턴 블롯. SV40 인트론: 변형된 시미안 바이러스 40 인트론; MVM 인트론: 미닛 바이러스 마우스 인트론.
B) HEK293에서 이중 AAV2-키메라 인트론-hMYO7A, 이중 AAV2-SV40 인트론-hMYO7A, 이중 AAV2-MVM 인트론-hMYO7A 또는 이중 AAV2-인트론 부재-hMYO7A로의 감염시 발현된 hMYO7A 수준의 정량화. hMYO7A의 수준은 이중 AAV2-키메라 인트론-hMYO7A에 의해 발현되는 hMYO7A에 상대적이다. 각 흑색 사각형은 해당 군의 각 샘플에 대해 정량화된 값을 나타낸다. 항-MYO7A 항체를 사용하여 웨스턴 블롯 분석에 의해 정량화를 수행하고, 인간 MYO7A 밴드 강도의 측정치를 Filamin으로 표준화하였다. 평균 값은 각 그룹의 히스토그램 내에 보고된다. SV40 인트론: 변형된 시미안 바이러스 40 인트론; MVM 인트론: 미닛 바이러스 마우스 인트론.
도 4. 키메라 인트론, SV40 인트론 및 MVM 인트론의 비교.
AAV8-5'hMYO7A에 의해 운반되는 발현 카세트의 묘사. 상단: AAV8-5'hMYO7A 키메라 인트론; 중간: AAV8-5'hMYO7A SV40 인트론; 하단: AAV8-5'hMYO7A MVM 인트론. (B) AAV8-5'hMYO7A 키메라 인트론, AAV8-5'hMYO7A SV40 인트론 및 AAV8-5'hMYO7A MVM 인트론으로부터의 바이러스 게놈의 서던 블롯. 모든 샘플을 DNAse로 처리하여 오염된 외부 DNA를 분해한 다음, 바이러스 게놈 DNA를 추출하였다. 5'AAV 게놈-CI: AAV8-CBA 프로모터-키메라 인트론-5'hMYO7A로부터 추출된 바이러스 게놈 DNA; 5'AAV 게놈-SV40: AAV8-CBA 프로모터-SV40 인트론-5'hMYO7A로부터 추출된 바이러스 게놈 DNA; 5'AAV 게놈-MVM: AAV8-CBA 프로모터-SV40 인트론-5'hMYO7A로부터 추출된 바이러스 게놈 DNA; 킬로베이스로 표현된 분자량 마커; bp = 염기쌍. CI: 키메라 인트론; SV40: 시미안 바이러스 40 인트론; MVM: 미닛 바이러스 마우스 인트론. (C) AAV8-3'hMYO7A-3XFLAG, 또는 부형제와 조합된 AAV8-5'hMYO7A 키메라 인트론, AAV8-5'hMYO7A SV40 인트론 또는 AAV8-5'hMYO7A MVM 인트론의 망막하 주사 후 2주째 C57BL/6 아이컵의 대표적인 웨스턴 블롯 분석. 화살표는 전장 단백질을 나타내고, 각 레인에 150 μg의 단백질을 로딩하였다. 음성 대조군: 부형제가 주사된 눈; @Flag: 전장 Myosin7A-3XFlag를 인식하기 위한 항-플래그를 갖는 웨스턴 블롯; @Dysferlin: 로딩 대조군으로 사용된 항-Dysferlin 항체로의 웨스턴 블롯. (D) 망막하 주사된 C57BL/6 아이컵에서 AAV8-3'hMYO7A-3XFLAG와 조합된 AAV8-5'hMYO7A 키메라 인트론, AAV8-5'hMYO7A SV40 인트론 또는 AAV8-5'hMYO7A MVM 인트론으로부터 발현된 hMYO7A 수준의 정량화. hMYO7A-3XFLAG의 수준은 AAV8-3'hMYO7A-3XFLAG와 조합된 AAV8-5'hMYO7A 키메라 인트론에 의해 발현되는 hMYO7A-3XFLAG에 상대적이다. hMYO7A-3XFLAG에 대한 양성 눈의 수(n)는 각 막대 아래에 묘사되어 있다. 항-Flag 항체를 사용하여 웨스턴 블롯 분석(패널 C)에 의해 정량화를 수행하고, Dysferlin에 대해 표준화된 hMYO7A-3XFLAG 밴드 강도의 측정을 수행하였다. 평균 값은 상응하는 막대 위에 묘사되어 있다. 값은 평균 ± 평균의 표준 오차(s.e.m.)로 표시된다.
도 5. 셰이커 마우스에서 정단 멜라노솜 국소화 및 hMYO7A 단백질 재구성의 용량-의존적 개선.
(A) 음성 대조군으로서 용매, 또는 이중 AAV8.hMYO7A(용량 1.37E+10, 4.4E+9 또는 1.37E+9 총 GC/눈)의 망막하 주사를 수용하는 sh1-/- 및 양성 대조군으로서 용매의 망막하 주사를 수용하는 sh1 +/-를 나타내는 톨루이딘 블루로 염색된 반-얇은 망막 절편. 눈금 막대(백색 막대)는 10 μm이다. 검은색 화살표는 올바르게 국소화된 멜라노솜을 가리킨다. (B) 이중 AAV8.hMYO7A의 망막하 전달 후 3개월째 sh1 마우스의 전체 망막 섹션의 RPE 융모에서 멜라노솜 국소화의 정량화. 정단 멜라노솜의 수/100 μm의 RPE가 보고된다. 데이터는 각 눈(점)에 대한 단일 측정 및 평균 ± s.e.m(열)으로 표시된다. 일원 ANOVA에 이어 Tukey 사후 테스트를 사용하여 통계적 분석을 수행하였다. P 값 대 용매가 투여된 sh1^-/-는 다음과 같다: ** p<0.01; **** p <0.0001. (C) 1.37E+10, 4.4E+9 또는 1.37E+9 총 GC/눈의 용량에서 이중 AAV8.hMYO7A의 망막하 전달 후 5주째에 sh1-/- 아이컵의 대표적인 웨스턴 블롯 분석. 양성 및 음성 대조군으로서, sh1 +/- 및 sh1-/-는 각각 용매의 망막하 주사(이중 AAV와 동일한 부피)를 투여받았다. α-MYO7A, 항-Myosin 7A 항체를 이용한 웨스턴 블롯; α-Dysferlin: 로딩 대조군으로 사용된 항-Dysferlin 항체를 이용한 웨스턴 블롯. (D) 용매가 주사된 한배새끼 sh1+/- 눈에서 발현된 내인성 Myo7a의 백분율(%)로서 이중 AAV8 벡터의 망막하 주사 후 5주째에 sh1-/- 아이컵에서 발현된 인간 MYO7A 수준의 정량화. 항-MYO7A 항체를 사용하여 웨스턴 블롯 분석에 의해 정량화를 수행하고, MYO7A 및 Myo7a 밴드 강도의 측정치를 Dysferlin에 대해 표준화하였다. 데이터는 평균 ± s.e.m으로 표시된다(평균 값은 상응하는 막대 위에 도시된다).

발명의 상세한 설명

본원에서 사용되는 용어 "포함하는", "포함하는" 및 "~로 구성된"은 "포함하는" 또는 "포함하다"; 또는 "함유하는" 또는 "함유하다"와 동의어이며, 포괄적이거나 개방적이며, 언급되지 않은 추가의 구성원, 요소 또는 단계를 배제하지 않는다. 용어 "포함하는", "포함하다" 및 "로 구성된다"는 또한 용어 "로 구성되는"을 포함한다.

벡터 시스템

(a) 제1 벡터는 5'에서 3' 방향으로 프로모터; 인트론; 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 스플라이스 공여체 서열; 및 제1 재조합원성 영역을 포함하며;

(a) 제1 벡터는 5'에서 3' 방향으로 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 및 스플라이스 공여체 서열을 포함하며;

여기서 5' 말단 부분 및 3' 말단 부분은 함께 트랜스진 CDS를 구성한다.

(a) 제1 벡터는 5'에서 3' 방향으로 프로모터; 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 및 스플라이스 공여체 서열을 포함하며;

(b) 제2 벡터는 5'에서 3' 방향으로: 스플라이스 수용체 서열; 및 트랜스진 CDS의 3' 말단 부분을 포함하며;

(a) 제1 벡터는 5'에서 3' 방향으로 프로모터; 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 스플라이스 공여체 서열; 및 제1 재조합원성 영역을 포함하며;

(b) 제2 벡터는 5'에서 3' 방향으로 제2 재조합원성 영역; 스플라이스 수용체 서열; 및 트랜스진 CDS의 3' 말단 부분을 포함하며;

또 다른 양태에서, 본 발명은 세포에서 트랜스진을 발현시키기 위한 벡터의 조합물을 제공하며, 상기 조합물은 제1 벡터 및 제2 벡터를 포함하고, 여기서

또 다른 양태에서, 본 발명은 세포에서 트랜스진을 발현시키기 위한 벡터의 조합물을 제공하며, 상기 벡터 시스템은 제1 벡터 및 제2 벡터를 포함하고, 여기서

본 발명의 벡터 시스템 또는 벡터의 조합물은, 예를 들어, 벡터의 크기 제약으로 인해 트랜스진이 단일 벡터에 의해 패키징될 수 없는 경우 트랜스진을 세포에 전달하는데 사용될 수 있다. 예를 들어, AAV 벡터는 최대 약 5 kb로 제한된 트랜스진을 패키징하기 위한 용량을 가질 수 있다.

제1 벡터 및 제2 벡터가 세포에 도입될 때, 트랜스진 CDS는 5' 및 3' 말단 부분으로부터 재구성될 수 있다. 재구성된 트랜스진은 세포에서 발현될 수 있다.

예를 들어, 전장 트랜스진 CDS의 재구성은 i) 2개의 벡터 게놈의 역 말단 반복부(ITR-)-매개 테일-투-헤드 연쇄동일서열화에 이은 스플라이싱(이중 벡터 트랜스-스플라이싱, TS); ii) 2개의 벡터 게놈에 함유된 중첩 영역 사이의 상동성 재조합(이중 벡터 중첩, OV); 또는 iii) 둘의 조합(이중 벡터 하이브리드)에 의해 제1 및 제2 벡터 둘 모두의 동일한 세포로의 도입시 달성될 수 있다.

일부 구체예에서, 트랜스진 CDS의 부분(예를 들어, 5' 및/또는 3' 말단 부분)은 10 kb 이하, 예를 들어, 9.5 kb, 9 kb, 8.5 kb, 8 kb, 7.5 kb, 7 kb, 6.5 kb, 6 kb, 5.5 kb, 5 kb 또는 4.5 kb 이하이다. 바람직한 구체예에서, 트랜스진 CDS의 부분(예를 들어, 5' 및/또는 3' 말단 부분)은 5 kb 이하이다.

일부 구체예에서, 5' 말단 부분 및 3' 말단 부분은 중첩 서열을 포함하지 않는다.

일부 구체예에서, 트랜스진 CDS는 천연 엑손-엑손 접합부에서 5' 말단 부분 및 3' 말단 부분으로 분할된다.

본원에서 사용되는 용어 "상동성 재조합할 수 없는"은 벡터가 표준 조건(예를 들어, AAV 벡터 입자의 경우, (a) 벡터 게놈; (b) Rep 및 Cap 단백질; 및 (c) AAV 생산에 필요한 아데노바이러스 헬퍼 유전자(예를 들어, E2, E4 및/또는 VARNA)를 인코딩하는 플라스미드로 HEK293 세포의 트랜스펙션에 이은 예를 들어, 본원의 실시예에 개시된 바와 같은 정제) 하에 제조되는 경우 상동성 재조합이 검출가능하지 않거나 실질적으로 전혀 검출가능하지 않음을 의미할 수 있다(예를 들어, 본원의 실시예에 개시된 바와 같은 서던 블롯 분석을 사용하여). 인트론이 스플라이스 공여체 서열과 상동성 재조합할 수 없는 경우, 트랜스진 CDS의 5' 말단 부분의 절제는 최소화되거나 방지될 수 있으며, 예를 들어, 이에 의해 제1 및 제2 벡터가 세포에 도입될 때 5' 및 3' 말단 부분으로부터 재구성되는 트린스진 CDS의 양을 증가시킨다.

일부 구체예에서, 인트론은 스플라이스 공여체 서열의 영역에 대해 적어도 95%, 96%, 97%, 98%, 99% 또는 100%(바람직하게는 100%) 서열 동일성을 갖는 적어도 20, 30, 40, 50, 60, 70, 80, 90 또는 100개의 인접 뉴클레오티드의 영역을 포함하지 않는다. 인트론은 스플라이스 공여체 서열과 상동성을 공유하지 않기 때문에, 이는 그 서열과 상동성 재조합할 수 없다.

여기서, 5' 말단 부분 및 3' 말단 부분은 함께 트린스진 CDS를 구성하며, 인트론은 스플라이스 공여체 서열의 영역에 대해 적어도 95%, 96%, 97%, 98%, 99% 또는 100%(바람직하게는 100%) 서열 동일성을 갖는 적어도 20, 30, 40, 50, 60, 70, 80, 90 또는 100개의 인접 뉴클레오티드의 영역을 포함하지 않는다.

여기서 5' 말단 부분 및 3' 말단 부분은 함께 트린스진 CDS를 구성하며, 인트론은 스플라이스 공여체 서열의 영역에 대해 적어도 95%, 96%, 97%, 98%, 99% 또는 100%(바람직하게는 100%)의 서열 동일성을 갖는 적어도 20, 30, 40, 50, 60, 70, 80, 90 또는 100개의 인접 뉴클레오티드의 영역을 포함하지 않는다.

프로모터 및 인핸서

본 발명의 벡터는 프로모터를 포함할 수 있다. 적합하게는, 트랜스진 CDS의 5' 말단 부분은 프로모터에 작동 가능하게 연결된다. 본원에서 사용되는 용어 "작동가능하게 연결된"은 부분들(예를 들어, 트랜스진 및 프로모터)이 둘 모두가 실질적으로 방해받지 않고 이들의 기능을 수행할 수 있는 방식으로 함께 연결되는 것을 의미한다.

임의의 적합한 프로모터가 사용될 수 있으며, 이들의 선택은 당업자에 의해 용이하게 이루어질 수 있다. 프로모터 서열은 구성적으로 활성일 수 있거나(즉, 임의의 숙주 세포 배경에서 작동 가능함), 대안적으로 특정 숙주 세포 환경에서만 활성일 수 있어, 특정 세포 유형(예를 들어, 조직-특이적 프로모터)에서 트랜스진의 표적화된 발현을 허용할 수 있다. 프로모터는 또 다른 인자, 예를 들어, 숙주 세포에 존재하는 인자의 존재에 반응하여 유도성 발현을 나타낼 수 있다. 벡터가 요법을 위해 투여되는 경우, 프로모터는 표적 세포(예를 들어, 망막 세포)에서 기능성인 것이 바람직하다.

일부 구체예에서, 프로모터는 사이토메갈로바이러스 프로모터, 로돕신 프로모터, 로돕신 키나제 프로모터, 광수용체간 레티노이드 결합 단백질 프로모터, 및 난황 황반 이영양증 2 프로모터; 또는 이의 단편으로 구성된 군으로부터 선택된다.

바람직한 구체예에서, 프로모터는 닭 β-액틴(CBA) 프로모터 또는 이의 단편이다.

예시적인 CBA 프로모터 서열은 다음을 포함한다:

(SEQ ID NO: 1)

(SEQ ID NO: 28)

일부 구체예에서, 프로모터는 SEQ ID NO: 1에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열 또는 이의 단편을 포함하거나 이로 구성되며, 바람직하게는 프로모터는 SEQ ID NO: 1의 프로모터의 천연 기능을 실질적으로 보유한다.

일부 구체예에서, 프로모터는 SEQ ID NO: 28에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열 또는 이의 단편을 포함하거나 이로 구성되며, 바람직하게는 프로모터는 SEQ ID NO: 28의 프로모터의 천연 기능을 실질적으로 보유한다.

바람직한 구체예에서, 프로모터는 SEQ ID NO: 1의 핵산 서열 또는 이의 단편을 포함하거나 이로 구성된다.

바람직한 구체예에서, 제1 벡터는 SEQ ID NO: 1의 핵산 서열 또는 이의 단편을 포함하거나 이로 구성되는 프로모터를 포함한다.

로돕신(Rho) 프로모터 서열의 예는 다음과 같다:

(SEQ ID NO: 29)

일부 구체예에서, 프로모터는 SEQ ID NO: 29에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열 또는 이의 단편을 포함하거나 이로 구성되며, 바람직하게는 프로모터는 SEQ ID NO: 29의 프로모터의 천연 기능을 실질적으로 보유한다.

예시적인 난황 황반 이영양증 2(VMD2) 프로모터 서열은 다음과 같다:

(SEQ ID NO: 30)

일부 구체예에서, 프로모터는 SEQ ID NO: 30에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열 또는 이의 단편을 포함하거나 이로 구성되며, 바람직하게는 프로모터는 SEQ ID NO: 30의 프로모터의 천연 기능을 실질적으로 보유한다.

본 발명의 벡터는 인핸서를 포함할 수 있다. 적합하게는, 트랜스진 CDS의 5' 말단 부분은 인핸서에 작동 가능하게 연결된다.

일부 구체예에서, 인핸서는 프로모터의 업스트림(즉, 벡터의 5' 종결 말단쪽으로)에 있다.

"인핸서"는 특정 유전자의 전사가 일어날 가능성을 증가시키기 위해 단백질(활성화제)에 의해 결합될 수 있는 DNA의 영역이다. 인핸서는 시스-작용한다. 이들은 유전자로부터 최대 1 Mbp(1,000,000 bp) 떨어져 출발 부위로부터 업스트림 또는 다운스트림에 위치할 수 있다.

바람직한 구체예에서, 인핸서는 CMV 인핸서이다.

예시적인 CMV 인핸서 서열은 다음과 같다:

(SEQ ID NO: 2)

일부 구체예에서, 인핸서는 SEQ ID NO: 2에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열 또는 이의 단편을 포함하거나 이로 구성되며, 바람직하게는 인핸서는 SEQ ID NO: 2의 인핸서의 천연 기능을 실질적으로 보유한다.

바람직한 구체예에서, 인핸서는 SEQ ID NO: 2의 핵산 서열 또는 이의 단편을 포함하거나 이로 구성된다.

바람직한 구체예에서, 제1 벡터는 SEQ ID NO: 2의 핵산 서열 또는 이의 단편을 포함하거나 이로 구성되는 인핸서를 포함한다.

인트론

인트론은 트랜스진 발현을 증가시키기 위해 벡터에 포함될 수 있다. 임의의 적합한 인트론이 사용될 수 있고, 이의 선택은 당업자에 의해 용이하게 이루어질 수 있으며, 단, 제1 벡터의 인트론은 스플라이스 공여체 서열과 상동성 재조합할 수 없어 트랜스진 CDS의 5' 말단 부분을 절제한다.

예시적인 인트론 서열은 다음을 포함한다:

(SEQ ID NO: 31; 야생형 작은 T 항원 인트론)

(SEQ ID NO: 32; 야생형 큰 T 항원 인트론)

(SEQ ID NO: 33; SV40 인트론, 예를 들어, 업스트림 서열은 큰 T 항원 인트론으로부터 유래되고, 다운스트림 서열은 SV40 cds로부터 유래됨)

일부 구체예에서, 인트론은 SEQ ID NO: 31, 32 또는 33에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되며, 바람직하게는 인트론은 각각 SEQ ID NO: 31, 32 또는 33의 인트론의 천연 기능을 실질적으로 보유한다.

바람직한 구체예에서, 인트론은 시미안 바이러스 40(SV40) 인트론이다. SV40 인트론은 변형된 SV40 인트론일 수 있다(예를 들어, 문헌[Nathwani et al. (2006) Blood 107: 2653-2661] 참조).

예시적인 SV40 인트론 서열은 다음과 같다:

(SEQ ID NO: 3; 변형된 SV40 인트론)

바람직한 구체예에서, 인트론은 SEQ ID NO: 3에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되며, 바람직하게는 인트론은 SEQ ID NO: 3의 인트론의 천연 기능을 실질적으로 보유한다.

일부 구체예에서, 인트론은 SEQ ID NO: 3의 핵산 서열, 또는 4, 3, 2 또는 1개의 뉴클레오티드 치환, 부가 또는 결실을 갖는 이의 변이체를 포함하거나 이로 구성되며, 바람직하게는 여기서 인트론은 SEQ ID NO: 3의 인트론의 천연 기능을 실질적으로 보유한다.

바람직한 구체예에서, 인트론은 SEQ ID NO: 3의 핵산 서열을 포함하거나 이로 구성된다.

바람직한 구체예에서, 제1 벡터는 SEQ ID NO: 3의 핵산 서열을 포함하거나 이로 구성되는 인트론을 포함한다.

예시적인 MVM 인트론 서열은 다음과 같다:

(SEQ ID NO: 4)

일부 구체예에서, 인트론은 SEQ ID NO: 4에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되며, 바람직하게는 인트론은 SEQ ID NO: 4의 인트론의 천연 기능을 실질적으로 보유한다.

일부 구체예에서, 인트론은 SEQ ID NO: 4의 핵산 서열, 또는 4, 3, 2 또는 1개의 뉴클레오티드 치환, 부가 또는 결실을 갖는 이의 변이체를 포함하거나 이로 구성되며, 바람직하게는 인트론은 SEQ ID NO: 4의 인트론의 천연 기능을 실질적으로 보유한다.

바람직한 구체예에서, 인트론은 SEQ ID NO: 4의 핵산 서열을 포함하거나 이로 이루어진다.

바람직한 구체예에서, 제1 벡터는 SEQ ID NO: 4의 핵산 서열을 포함하거나 이로 구성되는 인트론을 포함한다.

여기서 5' 말단 부분 및 3' 말단 부분은 함께 트랜스진 CDS를 구성하고, 인트론은 SEQ ID NO: 3 또는 4에 대한 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되며, 바람직하게는 인트론은 각각 SEQ ID NO: 3 또는 4의 인트론의 천연 기능을 실질적으로 보유한다.

스플라이스 공여체 및 수용체

RNA 스플라이싱은 새로 만들어진 전구체 메신저 RNA(프리-mRNA) 전사체가 성숙 메신저 RNA(mRNA)로 형질전환되는 RNA 프로세싱의 한 형태이다. 스플라이싱 동안, 인트론(비코딩 영역)이 제거되고 엑손(코딩 영역)이 함께 연결된다.

인트론 내에서, 스플라이싱을 위해 공여체 부위(인트론의 5' 말단), 분지 부위(인트론의 3' 말단 부근) 및 수용체 부위(인트론의 3' 말단)가 필요하다. 스플라이스 공여체 부위는 더 크고 덜 고도로 보존된 영역 내에서 인트론의 5' 말단에 거의 불변인 서열 GU를 포함한다. 인트론의 3' 말단에서 스플라이스 수용체 부위는 거의 불변의 AG 서열로 인트론을 종결시킨다. AG로부터 상류(5'-방향)에는 피리미딘(C 및 U), 또는 폴리피리미딘 트랙이 높은 영역이 있다. 폴리피리미딘 트랙으로부터 추가 업스트림는 분지점이다.

"스플라이스 공여체 서열"은 인트론의 5' 말단에서 공여체 부위로서 기능할 수 있는 뉴클레오티드 서열이다. 인간 스플라이스 부위 영역의 컨센서스 서열 및 빈도는 문헌[Ma et al. (2015) PLoS One 10(6): p.e0130729]에 기술되어 있다.

"스플라이스 수용체 서열"은 인트론의 3' 말단에서 수용체 부위로서 기능할 수 있는 뉴클레오티드 서열이다. 인간 스플라이스 부위 영역의 컨센서스 서열 및 빈도는 문헌[Ma et al. (2015) PLoS One 10(6): p.e0130729]에 기술되어 있다.

예시적인 스플라이스 공여체 서열은 다음과 같다:

(SEQ ID NO: 5)

일부 구체예에서, 스플라이스 공여체 서열은 SEQ ID NO: 5에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되며, 바람직하게는 스플라이스 공여체 서열은 SEQ ID NO: 5의 스플라이스 공여체 서열의 천연 기능을 실질적으로 보유한다.

바람직한 구체예에서, 스플라이스 공여체 서열은 SEQ ID NO: 5의 핵산 서열을 포함하거나 이로 구성된다.

바람직한 구체예에서, 제1 벡터는 SEQ ID NO: 5의 핵산 서열을 포함하거나 이로 구성되는 스플라이스 공여체 서열을 포함한다.

예시적인 스플라이스 수용체 서열은 다음과 같다:

(SEQ ID NO: 6)

일부 구체예에서, 스플라이스 수용체 서열은 SEQ ID NO: 6에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되며, 바람직하게는 스플라이스 수용체 서열은 SEQ ID NO: 6의 스플라이스 수용체 서열의 천연 기능을 실질적으로 보유한다.

바람직한 구체예에서, 스플라이스 수용체 서열은 SEQ ID NO: 6의 핵산 서열을 포함하거나 이로 이루어진다.

바람직한 구체예에서, 제2 벡터는 SEQ ID NO: 6의 핵산 서열을 포함하거나 이로 구성되는 스플라이스 수용체 서열을 포함한다.

재조합 영역

재조합을 증가시키기 위해 재조합원성 영역이 이중 벡터에 첨가될 수 있다. 바람직하게는, 제1 재조합원성 영역은 제1 벡터에서 스플라이스 공여체 서열의 다운스트림에 위치하고, 제2 재조합원성 영역은 제2 벡터에서 스플라이스 수용체 서열의 업스트림에 위치한다.

일부 구체예에서, 제1 재조합원성 영역 및 제2 재조합원성 영역은 둘 모두 F1 파지 재조합원성 영역 또는 이의 단편이다. 바람직한 구체예에서, 제1 재조합원성 영역 및 제2 재조합원성 영역은 둘 모두 AK 재조합원성 영역 또는 이의 단편이다.

예시적인 재조합원성 영역 서열(AK)은 다음을 포함한다:

(SEQ ID NO: 7)

(SEQ ID NO: 34)

일부 구체예에서, 재조합원성 영역(예를 들어, 제1 재조합원성 영역 및 제2 재조합원성 영역)은 SEQ ID NO: 7에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열 또는 이의 단편을 포함하거나 이로 구성되며, 바람직하게는 여기서 재조합원성 영역은 SEQ ID NO: 7의 재조합원성 영역의 천연 기능을 실질적으로 보유한다.

일부 구체예에서, 재조합원성 영역(예를 들어, 제1 재조합원성 영역 및 제2 재조합원성 영역)은 SEQ ID NO: 34에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열 또는 이의 단편을 포함하거나 이로 구성되며, 바람직하게는 여기서 재조합원성 영역은 SEQ ID NO: 34의 재조합원성 영역의 천연 기능을 실질적으로 보유한다.

바람직한 구체예에서, 재조합원성 영역(예를 들어, 제1 재조합원성 영역 및 제2 재조합원성 영역)은 SEQ ID NO: 7의 핵산 서열 또는 이의 단편을 포함하거나 이로 구성된다.

바람직한 구체예에서, 제1 벡터는 SEQ ID NO: 7의 핵산 서열 또는 이의 단편을 포함하거나 이로 구성되는 재조합원성 영역을 포함한다.

바람직한 구체예에서, 제2 벡터는 SEQ ID NO: 7의 핵산 서열 또는 이의 단편을 포함하거나 이로 구성되는 재조합원성 영역을 포함한다.

일부 구체예에서, 제1 재조합원성 영역 및 제2 재조합원성 영역 둘 모두는 알칼리성 포스파타제 유전자, 예컨대, AP(NM 001632, bp 823-1100, SEQ ID NO: 35); AP1(XM 005246439.2, bp 1802-1516, SEQ ID NO: 36); AP2(XM_005246439.2, bp 1225-938, SEQ ID NO: 37)로부터 유래된다.

예시적인 AP 재조합원성 영역 서열은 다음을 포함한다:

(SEQ ID NO: 35; AP)

(SEQ ID NO: 36; AP1)

(SEQ ID NO: 37; AP2)

일부 구체예에서, 재조합원성 영역(예를 들어, 제1 재조합원성 영역 및 제2 재조합원성 영역)은 SEQ ID NO: 35에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열 또는 이의 단편을 포함하거나 이로 구성되며, 바람직하게는 여기서 재조합원성 영역은 SEQ ID NO: 35의 재조합원성 영역의 천연 기능을 실질적으로 보유한다.

일부 구체예에서, 재조합원성 영역(예를 들어, 제1 재조합원성 영역 및 제2 재조합원성 영역)은 SEQ ID NO: 36에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열 또는 이의 단편을 포함하거나 이로 구성되며, 바람직하게는 여기서 재조합원성 영역은 SEQ ID NO: 36의 재조합원성 영역의 천연 기능을 실질적으로 보유한다.

일부 구체예에서, 재조합원성 영역(예를 들어, 제1 재조합원성 영역 및 제2 재조합원성 영역)은 SEQ ID NO: 37에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열 또는 이의 단편을 포함하거나 이로 구성되며, 바람직하게는 여기서 재조합원성 영역은 SEQ ID NO: 37의 재조합원성 영역의 천연 기능을 실질적으로 보유한다.

폴리아데닐화 서열

본 발명의 벡터는 폴리아데닐화 서열을 포함할 수 있다. 적합하게는, 트랜스진은 폴리아데닐화 서열에 작동 가능하게 연결된다. 폴리아데닐화 서열은 트랜스진 발현을 개선시키기 위해 트랜스진의 다운스트림에 삽입될 수 있다.

폴리아데닐화 서열은 전형적으로 폴리아데닐화 신호, 폴리아데닐화 부위 및 다운스트림 요소를 포함한다: 폴리아데닐화 신호는 RNA 절단 복합체에 의해 인식되는 서열 모티프를 포함하고; 폴리아데닐화 부위는 폴리-A 테일이 mRNA에 첨가되는 절단 부위이고; 다운스트림 요소는 일반적으로 폴리아데닐화 부위의 바로 다운스트림에 있는 GT-풍부 영역이며, 이는 효율적인 프로세싱에 중요하다.

일부 구체예에서, 제2 벡터는 트랜스진 CDS의 3' 말단 부분의 다운스트림에 폴리아데닐화 서열을 추가로 포함한다.

일부 구체예에서, 폴리아데닐화 서열은 소 성장 호르몬(bGH) 폴리아데닐화 서열 또는 SV40 폴리아데닐화 서열이다.

바람직한 구체예에서, 폴리아데닐화 서열은 소 성장 호르몬(bGH) 폴리아데닐화 서열이다.

예시적인 폴리아데닐화 서열은 다음을 포함한다:

(SEQ ID NO: 8)

(SEQ ID NO: 38)

일부 구체예에서, 폴리아데닐화 서열은 SEQ ID NO: 8에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되며, 바람직하게는 폴리아데닐화 서열은 SEQ ID NO: 8의 폴리아데닐화 서열의 천연 기능을 실질적으로 보유한다.

일부 구체예에서, 폴리아데닐화 서열은 SEQ ID NO: 38에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되며, 바람직하게는 폴리아데닐화 서열은 SEQ ID NO: 38의 폴리아데닐화 서열의 천연 기능을 실질적으로 보유한다.

바람직한 구체예에서, 폴리아데닐화 수용체 서열은 SEQ ID NO: 8의 핵산 서열을 포함하거나 구성된다.

바람직한 구체예에서, 제2 벡터는 SEQ ID NO: 8의 핵산 서열을 포함하거나 이로 구성되는 폴리아데닐화 서열을 포함한다.

벡터

벡터는 하나의 환경에서 다른 환경으로의 실체의 이동을 허용하거나 용이하게 하는 도구이다. 본 발명에 따르면, 예로서, 재조합 핵산 기술에 사용되는 일부 벡터는 실체, 예를 들어, 핵산의 세그먼트(예를 들어, 이종성 DNA 세그먼트, 예컨대, 이종성 cDNA 세그먼트)가 표적 세포 내로 이동되게 한다. 벡터는 세포 내에서 이종성 핵산(DNA 또는 RNA)을 유지하거나, 핵산의 세그먼트를 포함하는 벡터의 복제를 용이하게 하거나, 핵산의 세그먼트에 의해 인코딩된 단백질의 발현을 용이하게 하는 목적을 제공할 수 있다. 벡터는 비바이러스 또는 바이러스 벡터일 수 있다. 재조합 핵산 기술에 사용되는 벡터의 예는 플라스미드, mRNA 분자(예를 들어, 시험관내 전사된 mRNA), 염색체, 인공 염색체 및 바이러스를 포함하나, 이에 제한되지 않는다. 벡터는 또한, 예를 들어, 네이키드 핵산(예를 들어, DNA)일 수 있다. 가장 간단한 형태로, 벡터는 그 자체가 관심 뉴클레오티드일 수 있다.

벡터는 형질감염, 형질전환 및 형질도입과 같은 당 분야에 공지된 다양한 기술을 사용하여 세포 내로 도입될 수 있다. 이러한 여러 기술, 예를 들어, 재조합 바이러스 벡터, 예컨대, 레트로바이러스, 렌티바이러스(예를 들어, 통합-결함 렌티바이러스), 아데노바이러스, 아데노-관련 바이러스, 배큘로바이러스 및 단순 포진 바이러스 벡터로의 감염; 핵산의 직접 주입 및 생물학적 형질전환이 당업계에 공지되어 있다.

비-바이러스 전달 시스템은 DNA 형질감염 방법을 포함하나 이에 제한되지 않는다. 여기서, 형질감염은 표적 세포에 유전자를 전달하기 위해 비-바이러스 벡터를 사용하는 공정을 포함한다. 전형적인 형질감염 방법은 전기천공, DNA 바이오리스틱, 지질-매개 형질감염, 압축된 DNA-매개 형질감염, 리포솜, 면역리포솜, 리포펙틴, 양이온성 제제-매개 형질감염, 양이온성 안면 양친매성 분자(CFA)(Nat. Biotechnol. (1996) 14: 556) 및 이들의 조합을 포함한다.

바이러스 벡터

바람직한 구체예에서, 벡터는 바이러스 벡터이고, 예를 들어, 바이러스(바람직하게는 AAV) 벡터 게놈을 포함한다. 바이러스 벡터는 바이러스 벡터 입자의 형태일 수 있다.

바이러스 벡터는 아데노-관련 바이러스(AAV) 벡터, 아데노바이러스 벡터, 레트로바이러스 벡터, 렌티바이러스 벡터, 단순 포진 바이러스 벡터, 피코르나바이러스 벡터 또는 알파바이러스 벡터일 수 있다.

바람직한 구체예에서, 제1 벡터 및 제2 벡터는 AAV 벡터이다. AAV 벡터는 AAV 벡터 입자의 형태일 수 있다.

아데노-관련 바이러스 벡터

AAV 벡터 또는 AAV 벡터 입자는 AAV 게놈 또는 이의 단편 또는 유도체를 포함할 수 있다. AAV 게놈은 AAV 입자의 생성에 필요한 기능을 인코딩할 수 있는 폴리뉴클레오티드 서열이다. 이러한 기능은 AAV 입자로의 AAV 게놈의 캡시드화를 포함하여, 숙주 세포에서 AAV의 복제 및 패키징 사이클에서 작동하는 것을 포함한다. 자연 발생 AAV는 복제-결핍이며, 복제 및 패키징 사이클의 완료를 위해 트랜스로 헬퍼 기능의 제공에 의존한다. 따라서, AAV 게놈은 전형적으로 복제-결핍이다.

AAV 게놈은 양성 또는 음성-센스의 단일-가닥 형태 또는 대안적으로 이중-가닥 형태일 수 있다. 이중 가닥 형태의 사용은 표적 세포에서 DNA 복제 단계의 우회를 가능하게 하여 트랜스진 발현을 가속화시킬 수 있다.

자연에서 발생하는 AAV는 다양한 생물학적 시스템에 따라 분류될 수 있다. AAV 게놈은 AAV의 임의의 천연 유래된 혈청형, 분리물 또는 클레이드로부터 유래될 수 있다.

AAV는 이들의 혈청형과 관련하여 언급될 수 있다. 혈청형은 캡시드 표면 항원의 발현 프로파일로 인해 다른 변이체 아종과 구별하는데 사용될 수 있는 독특한 반응성을 갖는 AAV의 변이체 아종에 상응한다. 전형적으로, 특정 AAV 혈청형을 갖는 AAV 벡터 입자는 임의의 다른 AAV 혈청형에 특이적인 중화 항체와 효율적으로 교차-반응하지 않는다. AAV 혈청형은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV-PhP.B 및 AAV-PhP.eB을 포함한다.

AAV는 또한 클레이드 또는 클론과 관련하여 언급될 수 있다. 이는 자연 유래된 AAV의 계통발생적 관계, 및 전형적으로 공통 조상으로 역추적될 수 있는 AAV의 계통발생적 그룹을 지칭하고, 이의 모든 후손을 포함한다. 또한, AAV는 특정 분리물, 즉, 자연에서 발견되는 특정 AAV의 유전적 분리물과 관련하여 언급될 수 있다. 용어 유전적 분리물은 다른 자연 발생 AAV와 제한된 유전적 혼합을 거친 AAV의 집단을 기술함으로써, 유전자 수준에서 인식가능하게 별개의 집단을 정의한다.

전형적으로, AAV의 자연 유래된 혈청형, 분리물 또는 클레이드의 AAV 게놈은 적어도 하나의 역 말단 반복 서열(ITR)을 포함한다. ITR 서열은 시스로 작용하여 기능적 복제 기점을 제공하고 세포의 게놈으로부터 벡터의 통합 및 절제를 가능하게 한다. 적합하게는, 하나 이상의 ITR 서열은 트랜스진 또는 이의 부분에 측접한다.

AAV 게놈은 또한 AAV 입자에 대한 패키징 기능을 인코딩하는 rep 및/또는 cap 유전자와 같은 패키징 유전자를 포함할 수 있다. 프로모터는 각각의 패키징 유전자에 작동가능하게 연결될 수 있다. 이러한 프로모터의 특정 예는 p5, p19 및 p40 프로모터를 포함한다. 예를 들어, p5 및 p19 프로모터는 일반적으로 rep 유전자를 발현하는데 사용되는 반면, p40 프로모터는 일반적으로 cap 유전자를 발현하는데 사용된다. rep 유전자는 단백질 Rep78, Rep68, Rep52 및 Rep40 중 하나 이상 또는 이의 변이체를 인코딩한다. cap 유전자는 하나 이상의 캡시드 단백질, 예컨대, VP1, VP2 및 VP3 또는 이의 변이체를 인코딩한다.

AAV 게놈은 자연 발생 AAV의 전체 게놈일 수 있다. 예를 들어, 전체 AAV 게놈을 포함하는 벡터는 AAV 벡터 또는 벡터 입자를 제조하는데 사용될 수 있다.

적합하게는, AAV 게놈은 환자에게 투여할 목적으로 유도체화된다. 이러한 유도체화는 당 분야의 표준이며, 본 발명은 AAV 게놈의 임의의 공지된 유도체, 및 당 분야에 공지된 기술을 적용함으로써 생성될 수 있는 유도체의 사용을 포함한다. AAV 게놈은 임의의 자연 발생 AAV의 유도체일 수 있다. 적합하게는, AAV 게놈은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10 또는 AAV11의 유도체이다.

AAV 게놈의 유도체는 생체내에서 본 발명의 AAV 벡터로부터 트랜스진의 발현을 가능하게 하는 임의의 절두된 또는 변형된 형태의 AAV 게놈을 포함한다. 전형적으로, 최소 바이러스 서열을 포함하면서도 상기 기능을 여전히 유지하기 위해 AAV 게놈을 유의하게 절두하는 것이 가능하다. 이는 벡터와 야생형 바이러스의 재조합 위험을 감소시킬 수 있고, 표적 세포에서 바이러스 유전자 단백질의 존재에 의해 세포 면역 반응을 촉발시키는 것을 피할 수 있다.

전형적으로, 유도체는 적어도 하나의 역 말단 반복 서열(ITR), 임의적으로 하나 초과의 ITR, 예를 들어, 2개 이상의 ITR을 포함할 것이다. ITR 중 하나 이상은 상이한 혈청형을 갖는 AAV 게놈으로부터 유래될 수 있거나, 키메라 또는 돌연변이체 ITR일 수 있다. 적합한 돌연변이체 ITR은 trs(말단 분해 부위)가 결실된 것이다. 이러한 결실은 코딩 및 상보적 서열 둘 모두를 함유하는 단일-가닥 게놈, 즉, 자가-상보적 AAV 게놈을 생성하기 위해 게놈의 지속적인 복제를 가능하게 한다. 이는 표적 세포에서 DNA 복제의 우회를 가능하게 하여, 가속화된 트랜스진 발현을 가능하게 한다.

AAV 게놈은 AAV 또는 이의 변이체의 임의의 자연 유래된 혈청형, 분리물 또는 클레이드로부터의 하나 이상의 ITR 서열을 포함할 수 있다. AAV 게놈은 적어도 하나, 예컨대, 2개의 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10 또는 AAV11 ITR 또는 이의 변이체를 포함할 수 있다.

하나 이상의 ITR은 어느 한쪽 말단에서 트랜스진 또는 이의 일부에 측접할 수 있다. 하나 이상의 ITR의 포함은 예를 들어, 숙주 세포 DNA 폴리머라제의 작용에 의해 단일-가닥 벡터 DNA의 이중-가닥 DNA로의 전환 후, 숙주 세포의 핵에서 AAV 벡터의 연쇄동일서열 형성을 도울 수 있다. 이러한 에피솜 연쇄동일서열의 형성은 숙주 세포의 수명 동안 AAV 벡터를 보호하여, 생체내에서 트랜스진의 연장된 발현을 가능하게 한다.

적합하게는, ITR 요소는 유도체에서 자연 AAV 게놈으로부터 보유된 유일한 서열일 것이다. 적합하게는, 유도체는 천연 게놈의 rep 및/또는 cap 유전자 및 천연 게놈의 임의의 다른 서열을 포함하지 않을 수 있다. 이는 벡터가 숙주 세포 게놈으로 통합될 가능성을 감소시킬 수 있다. 또한, AAV 게놈의 크기를 감소시키는 것은 트랜스진 또는 이의 일부에 추가하여 벡터 내에 다른 서열 요소(예를 들어, 조절 요소)를 혼입하는데 있어서 증가된 유연성을 허용한다.

따라서, 하기 부분이 본 발명의 유도체에서 제거될 수 있다: 하나의 역 말단 반복부(ITR) 서열, 복제(rep) 및 캡시드(cap) 유전자. 그러나, 유도체는 AAV 게놈의 하나 이상의 rep 및/또는 cap 유전자 또는 다른 바이러스 서열을 추가로 포함할 수 있다. 자연 발생 AAV는 인간 염색체 19 상의 특정 부위에서 높은 빈도로 통합되고, AAV 벡터에서 통합 능력의 보유가 치료 환경에서 허용될 수 있도록 무시할 만한 무작위 통합 빈도를 나타낸다.

본 발명은 추가로 천연 AAV 게놈의 것과 상이한 순서 및 구성의 AAV 게놈의 서열의 제공을 포함한다. 본 발명은 또한 하나 이상의 AAV 서열 또는 유전자를 또 다른 바이러스로부터의 서열로 또는 하나 초과의 바이러스로부터의 서열로 구성된 키메라 유전자로 대체하는 것을 포함한다. 이러한 키메라 유전자는 상이한 바이러스 종의 2개 이상의 관련된 바이러스 단백질로부터의 서열로 구성될 수 있다.

AAV 벡터 입자는 캡시드 단백질에 의해 캡시드화될 수 있다. 적합하게는, AAV 벡터 입자는 트랜스캡시드화된 형태일 수 있고, 여기서 하나의 혈청형의 ITR을 갖는 AAV 게놈 또는 유도체는 상이한 혈청형의 캡시드에 패키징된다. AAV 벡터 입자는 또한 2개 이상의 상이한 혈청형으로부터의 비변형된 캡시드 단백질의 혼합물이 바이러스 캡시드를 구성하는 모자이크 형태를 포함한다. AAV 벡터 입자는 또한 캡시드 표면에 흡착된 리간드를 보유하는 화학적으로 변형된 형태를 포함한다. 예를 들어, 이러한 리간드는 특정 세포 표면 수용체를 표적화하기 위한 항체를 포함할 수 있다.

유도체가 캡시드 단백질, 즉, VP1, VP2 및/또는 VP3을 포함하는 경우, 유도체는 하나 이상의 자연 발생 AAV의 키메라, 셔플된 또는 캡시드-변형된 유도체일 수 있다. 특히, 본 발명은 동일한 벡터(즉, 슈도타입화된 벡터) 내의 AAV의 상이한 혈청형, 클레이드, 클론 또는 분리물로부터의 캡시드 단백질 서열의 제공을 포함한다. AAV 벡터는 슈도타입화된 AAV 벡터 입자의 형태일 수 있다.

키메라, 셔플된 또는 캡시드-변형된 유도체는 전형적으로 AAV 벡터에 대한 하나 이상의 요망되는 작용기를 제공하도록 선택될 것이다. 따라서, 이러한 유도체는 자연 발생 AAV 게놈을 포함하는 AAV 벡터와 비교하여 증가된 유전자 전달 효율 및/또는 감소된 면역원성(체액 또는 세포)을 나타낼 수 있다. 유전자 전달의 증가된 효율은 예를 들어, 세포 표면에서 개선된 수용체 또는 공동-수용체 결합, 개선된 내재화, 세포 내 및 핵으로의 개선된 트래피킹, 바이러스 입자의 개선된 언코팅 및 단일-가닥 게놈의 이중 가닥 형태로의 개선된 전환에 의해 달성될 수 있다.

키메라 캡시드 단백질은 자연 발생 AAV 혈청형의 2개 이상의 캡시드 코딩 서열 사이의 재조합에 의해 생성된 것들을 포함한다. 이는 예를 들어, 한 혈청형의 비-감염성 캡시드 서열이 상이한 혈청형의 캡시드 서열로 공동-형질감염되고, 지시된 선택이 요망되는 특성을 갖는 캡시드 서열을 선택하기 위해 사용되는 마커 구조 접근법에 의해 수행될 수 있다. 상이한 혈청형의 캡시드 서열은 세포 내에서 상동성 재조합에 의해 변경되어 신규한 키메라 캡시드 단백질을 생성할 수 있다.

키메라 캡시드 단백질은 또한 2개 이상의 캡시드 단백질 사이, 예를 들어, 상이한 혈청형의 2개 이상의 캡시드 단백질 사이에 특정 캡시드 단백질 도메인, 표면 루프 또는 특정 아미노산 잔기를 전달하기 위해 캡시드 단백질 서열의 조작에 의해 생성된 것들을 포함한다.

셔플링된 또는 키메라 캡시드 단백질은 또한 DNA 셔플링 또는 오류-유발 PCR에 의해 생성될 수 있다. 하이브리드 AAV 캡시드 유전자는 관련된 AAV 유전자의 서열, 예를 들어, 다수의 상이한 혈청형의 캡시드 단백질을 인코딩하는 서열을 무작위로 단편화한 다음, 후속하여 서열 상동성 영역에서 크로스오버를 또한 유발할 수 있는 자가-프라이밍 폴리머라제 반응에서 단편을 재조립함으로써 생성될 수 있다. 여러 혈청형의 캡시드 유전자를 셔플링함으로써 이러한 방식으로 생성된 하이브리드 AAV 유전자의 라이브러리는 요망되는 작용성을 갖는 바이러스 클론을 확인하기 위해 스크리닝될 수 있다. 유사하게, 오류가 발생하기 쉬운 PCR은 AAV 캡시드 유전자를 무작위로 돌연변이시켜 다양한 변이체 라이브러리를 생성하는데 사용될 수 있으며 이후 원하는 특성에 대해 선택될 수 있다.

캡시드 유전자의 서열은 또한 천연 야생형 서열과 관련하여 특정 결실, 치환 또는 삽입을 도입하도록 유전적으로 변형될 수 있다. 특히, 캡시드 유전자는 캡시드 코딩 서열의 오픈 리딩 프레임 내에, 또는 캡시드 코딩 서열의 N- 및/또는 C-말단에서 관련되지 않은 단백질 또는 펩티드의 서열의 삽입에 의해 변형될 수 있다. 관련되지 않은 단백질 또는 펩티드는 유리하게는 특정 세포 유형에 대한 리간드로서 작용함으로써 표적 세포에 대한 향상된 결합을 부여하거나 특정 세포 집단에 대한 벡터의 표적화 특이성을 향상시키는 것일 수 있다. 관련되지 않은 단백질은 또한 생성 공정의 일부로서 바이러스 입자의 정제를 돕는 것, 즉, 에피토프 또는 친화성 태그일 수 있다. 삽입 부위는 전형적으로 바이러스 입자의 다른 기능, 예를 들어, 바이러스 입자의 내재화, 트래피킹을 방해하지 않도록 선택될 것이다.

캡시드 단백질은 인공 또는 돌연변이체 캡시드 단백질일 수 있다. 본원에서 사용되는 용어 "인공 캡시드"는 캡시드 입자가 자연에서 발생하지 않거나 자연 발생 캡시드 아미노산 서열로부터 조작된(예를 들어, 변형된) 아미노산 서열을 포함하는 아미노산 서열을 포함하는 것을 의미한다. 다시 말해서, 인공 캡시드 단백질은 인공 캡시드 아미노산 서열과 모 캡시드 아미노산 서열이 정렬되는 경우, 인공 캡시드 단백질이 유래된 모 캡시드의 서열과 비교하여 아미노산 서열의 돌연변이 또는 변이를 포함한다.

일부 구체예에서, 제1 벡터 및 제2 벡터는 hu68(예를 들어, WO 2018/160582 참조), Anc 라이브러리(예를 들어, WO 2015/054653 및 WO 2017/019994 참조) 및 AAV2-TT(예를 들어, WO 2015/121501 참조)로 구성된 군으로부터 선택된다.

예시적인 5' ITR 서열은 다음과 같다:

(SEQ ID NO: 9)

일부 구체예에서, 5' ITR은 SEQ ID NO: 9에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되며, 바람직하게는 5'ITR은 SEQ ID NO: 9의 5'ITR의 천연 기능을 실질적으로 보유한다.

바람직한 구체예에서, 5'ITR은 SEQ ID NO: 9의 핵산 서열을 포함하거나 이로 구성된다.

바람직한 구체예에서, 제1 벡터 및 제2 벡터는 SEQ ID NO: 9의 핵산 서열을 포함하거나 이로 구성된 5' ITR을 포함한다.

예시적인 3' ITR 서열은 다음과 같다:

(SEQ ID NO: 10)

일부 구체예에서, 3' ITR은 SEQ ID NO: 10에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되며, 바람직하게는 3'ITR은 SEQ ID NO: 10의 3'ITR의 천연 기능을 실질적으로 보유한다.

바람직한 구체예에서, 3'ITR은 SEQ ID NO: 10의 핵산 서열을 포함하거나 이로 구성된다.

바람직한 구체예에서, 제1 벡터 및 제2 벡터는 SEQ ID NO: 10의 핵산 서열을 포함하거나 이로 구성된 3' ITR을 포함한다.

트랜스진

바람직한 구체예에서, 트랜스진은 Myosin 7A(MYO7A) 트랜스진이다.

예시적인 MYO7A 뉴클레오티드 서열은 다음과 같다:

(SEQ ID NO: 11)

MYO7A 트랜스진의 예시적인 5' 말단 부분은 다음과 같다:

(SEQ ID NO: 12)

일부 구체예에서, 트랜스진의 5' 말단 부분은 SEQ ID NO: 12에 대한 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되며, 바람직하게는 트랜스진의 5' 말단 부분이 SEQ ID NO: 12의 트랜스진의 5' 말단 부분의 천연 기능을 실질적으로 유지한다.

바람직한 구체예에서, 트랜스진의 5' 말단 부분은 SEQ ID NO: 12의 핵산 서열을 포함하거나 이로 구성된다.

바람직한 구체예에서, 제1 벡터는 SEQ ID NO: 12의 핵산 서열을 포함하거나 이로 구성되는 트랜스진의 5' 말단 부분을 포함한다.

MYO7A 트랜스진의 예시적인 3' 말단 부분은 다음과 같다:

(SEQ ID NO: 13)

일부 구체예에서, 트랜스진의 3' 말단 부분은 SEQ ID NO: 13에 대한 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되며, 바람직하게는 트랜스진의 3' 말단 부분은 SEQ ID NO: 13의 트랜스진의 3' 말단 부분의 천연 기능을 실질적으로 유지한다.

바람직한 구체예에서, 트랜스진의 3' 말단 부분은 SEQ ID NO: 13의 핵산 서열을 포함하거나 이로 구성된다.

바람직한 구체예에서, 제1 벡터는 SEQ ID NO: 13의 핵산 서열을 포함하거나 이로 구성되는 트랜스진의 3' 말단 부분을 포함한다.

추가의 예시적인 MYO7A 뉴클레오티드 서열은 다음과 같다:

(SEQ ID NO: 39; NM_000260.3 뉴클레오티드 273-6920)

MYO7A 트랜스진의 추가의 예시적인 5' 말단 부분은 다음과 같다:

(SEQ ID NO: 40; NM_000260.3 뉴클레오티드 273-3380)

일부 구체예에서, 트랜스진의 5' 말단 부분은 SEQ ID NO: 40에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되며, 바람직하게는 트랜스진의 5' 말단 부분은 SEQ ID NO: 40의 트랜스진의 5' 말단 부분의 천연 기능을 실질적으로 유지한다.

바람직한 구체예에서, 트랜스진의 5' 말단 부분은 SEQ ID NO: 40의 핵산 서열을 포함하거나 이로 구성된다.

바람직한 구체예에서, 제1 벡터는 SEQ ID NO: 40의 핵산 서열을 포함하거나 이로 구성되는 트랜스진의 5' 말단 부분을 포함한다.

MYO7A 트랜스진의 예시적인 3' 말단 부분은 다음과 같다:

(SEQ ID NO: 41; NM_000260.3 뉴클레오티드 3381-6920)

일부 구체예에서, 트랜스진의 3' 말단 부분은 SEQ ID NO: 41에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되며, 바람직하게는 트랜스진의 3' 말단 부분은 SEQ ID NO: 41의 트랜스진의 3' 말단 부분의 천연 기능을 실질적으로 유지한다.

바람직한 구체예에서, 트랜스진의 3' 말단 부분은 SEQ ID NO: 41의 핵산 서열을 포함하거나 이로 구성된다.

바람직한 구체예에서, 제1 벡터는 SEQ ID NO: 41의 핵산 서열을 포함하거나 이로 구성되는 트랜스진의 3' 말단 부분을 포함한다.

일부 구체예에서, 트랜스진은 ABCA4 트랜스진이다.

예시적인 ABCA4 뉴클레오티드 서열은 다음과 같다:

(SEQ ID NO: 42)

ABCA4 트랜스진의 예시적인 5' 말단 부분은 다음과 같다:

(SEQ ID NO: 43)

일부 구체예에서, 트랜스진의 5' 말단 부분은 SEQ ID NO: 43에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되며, 바람직하게는 트랜스진의 5' 말단 부분은 SEQ ID NO: 43의 트랜스진의 5' 말단 부분의 천연 기능을 실질적으로 유지한다.

ABCA4 트랜스진의 예시적인 3' 말단 부분은 다음과 같다:

(SEQ ID NO: 44)

일부 구체예에서, 트랜스진의 3' 말단 부분은 SEQ ID NO: 44에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되며, 바람직하게는 트랜스진의 5' 말단 부분은 SEQ ID NO: 44의 트랜스진의 5' 말단 부분의 천연 기능을 실질적으로 유지한다.

본 발명에서 사용되는 폴리뉴클레오티드는 코돈-최적화될 수 있다. 일부 구체예에서, 트랜스진은 코돈 최적화된다. 코돈 최적화는 WO 1999/41397 및 WO 2001/79518에 이미 기재되어 있다. 상이한 세포는 특정 코돈의 사용이 상이하다. 이러한 코돈 편향은 세포 유형에서 특정 tRNA의 상대적 풍부도에서의 편향에 상응한다. 상응하는 tRNA의 상대적 존재비와 일치하도록 맞춤화되게 서열의 코돈을 변경함으로써, 발현을 증가시키는 것이 가능하다. 동일한 토큰으로, 상응하는 tRNA가 특정 세포 유형에서 드문 것으로 알려진 코돈을 의도적으로 선택함으로써 발현을 감소시키는 것이 가능하다. 따라서, 추가적인 정도의 번역 제어가 가능하다. 코돈 사용 표는 포유동물 세포뿐만 아니라 다양한 다른 유기체에 대해 당 분야에 공지되어 있다.

예시적인 벡터

본 발명의 제1 벡터의 예시적인 서열은 다음과 같다:

(SEQ ID NO: 14)

5' ITR

CMV 인핸서

CBA 프로모터

변형된 SV40 인트론

MYO7A 트랜스진의 5' 말단 부분

3' ITR

일부 구체예에서, 제1 벡터는 SEQ ID NO: 14에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되며, 바람직하게는 제1 벡터는 SEQ ID NO: 14의 제1 벡터의 천연 기능을 실질적으로 보유한다.

바람직한 구체예에서, 제1 벡터는 SEQ ID NO: 14의 핵산 서열을 포함하거나 이로 구성된다.

본 발명의 제2 벡터의 예시적인 서열은 다음과 같다:

(SEQ ID NO: 15)

5' ITR

MYO7A 트랜스진의 3' 말단 부분

bGH 폴리아데닐화 서열

3' ITR

일부 구체예에서, 제2 벡터는 SEQ ID NO: 15에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되며, 바람직하게는 제2 벡터는 SEQ ID NO: 15의 제2 벡터의 천연 기능을 실질적으로 보유한다.

바람직한 구체예에서, 제2 벡터는 SEQ ID NO: 15의 핵산 서열을 포함하거나 이로 구성된다.

특히 바람직한 구체예에서, 제1 벡터는 SEQ ID NO: 14의 핵산 서열을 포함하거나 이로 구성되고, 제2 벡터는 SEQ ID NO: 15의 핵산 서열을 포함하거나 이로 구성된다.

조성물

본 발명의 벡터, 벡터 시스템 및 세포는 약학적으로 허용되는 담체, 희석제 또는 부형제와 함께 대상체에 투여하기 위해 제형화될 수 있다. 적합한 담체 및 희석제는 등장성 염수 용액, 예를 들어, 포스페이트-완충된 염수를 포함하고, 잠재적으로 인간 혈청 알부민을 함유한다.

약학적 조성물을 제형화하는데 사용되는 물질은 무독성이어야 하고 활성 성분의 효능을 방해하지 않아야 한다. 담체 또는 다른 물질의 정확한 성질은 투여 경로에 따라 당업자에 의해 결정될 수 있다.

약학적 조성물은 전형적으로 액체 형태이다. 액체 약학적 조성물은 일반적으로 물, 석유, 동물성 또는 식물성 오일, 광유 또는 합성 오일과 같은 액체 담체를 포함한다. 생리학적 염수 용액, 마그네슘 클로라이드, 덱스트로스 또는 다른 사카라이드 용액, 또는 글리콜, 예컨대, 에틸렌 글리콜, 프로필렌 글리콜 또는 폴리에틸렌 글리콜이 포함될 수 있다. 일부 경우에, 계면활성제, 예컨대 플루론산(PF68) 0.001%가 사용될 수 있다.

주사를 위해, 활성 성분은 발열원이 없고 적합한 pH, 등장성 및 안정성을 갖는 수용액의 형태일 수 있다. 당업자는, 예를 들어, 등장성 비히클, 예컨대, 소듐 클로라이드 주사, 링거 주사 또는 락테이트 링거 주사를 사용하여 적합한 용액을 잘 제조할 수 있다. 보존제, 안정화제, 완충제, 항산화제 및/또는 다른 첨가제가 필요에 따라 포함될 수 있다.

지연 방출을 위해, 의약은 생체적합성 중합체로부터 형성된 마이크로캡슐 또는 당 분야에 공지된 방법에 따라 리포솜 담체 시스템과 같이 서방형을 위해 제형화되는 약학적 조성물에 포함될 수 있다.

세포 요법 생성물의 취급은 바람직하게는, 세포 요법에 대한 FACT-JACIE 국제 표준에 따라 수행된다.

치료 방법

일 양태에서, 본 발명은 요법에 사용하기 위한 본 발명의 벡터 시스템, 벡터, 키트 또는 조성물을 제공한다.

바람직한 구체예에서, 어셔 증후군은 어셔 증후군 타입 1B이다.

일부 구체예에서, 망막 색소 상피(RPE) 정단 융모로의 멜라노솜의 국소화는 증가되거나 표준화된다(예를 들어, 건강한 대상체와 거의 동일한 수준으로 증가한다). 증가는 본 발명에 따라 치료되지 않은 눈(예를 들어, 질환을 앓지만 달리 실질적으로 동일한 조건 하에 있는 대상체로부터의 눈임)으로부터의 RPE 정단 융모와 비교할 수 있다. 증가(예를 들어, 100 μm 당 수)는 예를 들어, 적어도 2배, 적어도 3배, 적어도 4배, 적어도 5배, 적어도 6배, 적어도 7배, 적어도 8배, 적어도 9배 또는 적어도 10배의 증가일 수 있다. 증가는 예를 들어, 멜라노솜의 수(예를 들어, 100 μm 당 수)를 건강항 대상체에 대한 수의 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95% 또는 99% 이내로 증가시킬 수 있다. 멜라노솜을 분석하기 위한 방법은 당업자에게 잘 알려져 있으며, 예를 들어, 본원에 개시된 방법을 포함한다.

1/2,000의 전반적인 글로벌 유병률을 갖는 유전성 망막 변성(IRD)은 전세계적으로 실명의 주요 원인이다. 가장 빈번하고 중증인 IRD 중에는 색소성 망막염(RP), 레버 선천성 흑암시(LCA) 및 스타가르트병(STGD)이 있으며, 이들은 대부분 단일원성 질환으로 유전된다. IRD를 유발하는 돌연변이의 대부분은 망막의 뉴런 광수용기(PR), 간상체 및/또는 원추체에서 발현되는 유전자에서 발생한다.

AAV 벡터는 단일 망막하 투여시 장기 치료를 위해 PR 및 망막 색소 상피(RPE) 둘 모두를 표적화하는데 가장 효율적인 벡터 중 하나이다. 본 발명은 단일 AAV 벡터(이는 약 5kb의 최대 카고 용량을 가질 수 있음)로 치료하기 어려울 수 있는 하기 표에 열거된 것과 같은 질병의 치료를 가능하게 한다:

질환	유전자	CDS	발현
어셔 1B	MYO7A	6.7Kb	RPE 및 PR
스타가르트병	ABCA4	6.8Kb	간상체 & 원추체 PR
레버 선천성 흑암시	CEP290	7.5 Kb	주로 PR(범망막)
어셔1D, 비증후군성 난청, 상염색체 열성(DFNB12)	CDH23	10.1Kb	PR
색소성 망막염	EYS	9.4 Kb	PR ECM
어셔 2A	USH2a	15.6 Kb	간상체 & 원추체 PR
어셔 2C	GPR98	18.0 Kb	주로 PR
알스트롬 증후군	ALMS1	12.5 Kb	간상체 & 원추체 PR

어셔 증후군 유형 IB(USH1B)는 망막 내의 PR 및 RPE 둘 모두에서 발현되는 액틴-기반 모터인 비통상적인 MYO7A를 인코딩하는 MYO7A 유전자(CDS: 6648 bp)의 돌연변이에 의해 야기되는 가장 심각한 형태의 RP 및 난청이다.

스타가르트병(STGD)은 PR 외부 세그먼트에 위치한 올-트랜스 망막 수송체를 인코딩하는 ABCA4 유전자(CDS: 6822 bp)의 돌연변이에 의해 야기되는 유전성 황반 변성의 가장 흔한 형태이다.

원추-간상 이영양증 타입 3, 안저 플라비마쿨라투스(fundus flavimaculatus), 연령-관련 황반 변성 타입 2, 조기-발병 중증 망막 이영양증 및 색소성 망막염 타입 19는 또한 ABCA4 돌연변이(ABCA4-관련 질환)와 관련이 있다.

치료에 대한 본원의 모든 언급은 치유적, 고식적 및 예방적 치료를 포함한다. 포유동물, 특히 인간의 치료가 바람직하다. 인간 및 수의학적 치료 둘 모두는 본 발명의 범위 내에 있다.

투여

일부 구체예에서, 벡터, 벡터 시스템 또는 세포는 대상체에게 국소적으로 투여된다.

일부 구체예에서, 벡터, 벡터 시스템 또는 세포는 대상체의 눈에 투여된다. 투여는 주사, 예를 들어, 망막하 주사에 의한 것일 수 있다.

제1 벡터 및 제2 벡터는 동시에, 순차적으로 또는 개별적으로 조합하여 투여될 수 있다.

본원에서 사용되는 용어 "조합", 또는 용어 "조합하여", "조합하여 사용되는" 또는 "조합된 제조물"은 2개 이상의 제제를 동시에, 순차적으로 또는 개별적으로 조합 투여하는 것을 지칭할 수 있다.

본원에서 사용되는 용어 "동시"는 제제가 동시에, 즉, 동시에 투여되는 것을 의미한다.

본원에서 사용되는 용어 "순차적"은 제제가 차례로 투여되는 것을 의미한다.

본원에서 사용되는 용어 "분리된"은 제제가 서로 독립적으로, 그러나 제제가 조합된, 바람직하게는 상승적인 효과를 나타내도록 하는 시간 간격 내에 투여되는 것을 의미한다. 따라서, "별도의" 투여는 하나의 제제가, 예를 들어, 다른 제제 후 1분, 5분 또는 10분 이내에 투여되도록 할 수 있다.

투여량

당업자는 대상체에게 투여하기 위한 본 발명의 제제의 적절한 용량을 용이하게 결정할 수 있다. 전형적으로, 의사는 개별 환자에게 가장 적합할 실제 투여량을 결정할 것이며, 이는 사용된 특정 화합물의 활성, 그 화합물의 대사 안정성 및 작용 길이, 연령, 체중, 일반적인 건강, 성별, 식이, 투여 방식 및 시간, 배설 속도, 약물 조합, 특정 병태의 중증도, 및 요법을 받는 개체를 포함하는 다양한 인자에 의존적일 것이다. 물론 더 높거나 더 낮은 투여량 범위가 적합한 개별적인 경우가 있을 수 있으며, 이는 본 발명의 범위 내에 있다.

용량은 예를 들어, 망막 변성을 치료하거나 예방하기에 충분할 수 있다. 용량은 예를 들어, 어셔 증후군, 색소성 망막염, 레버 선천성 흑암시(LCA), 스타가르트병, 알스트롬 증후군 또는 ABCA4-관련 질병을 치료하거나 예방하기에 충분할 수 있다.

일부 구체예에서, 용량은 눈 당 1×10⁹ 내지 1.5×10¹⁰개의 총 게놈 복사체이다. 일부 구체예에서, 용량은 눈 당 4×10⁹ 내지 1.5×10¹⁰개의 총 게놈 복사체이다. 일부 구체예에서, 용량은 눈 당 1x10⁹ 내지 8x10⁹ 총 게놈 복사체, 눈 당 2x10⁹ 내지 7x10⁹ 총 게놈 복사체, 눈 당 3x10⁹ 내지 6x10⁹ 총 게놈 복사체 또는 눈 당 4x10⁹ 내지 5x10⁹ 총 게놈 복사체이다. 일부 구체예에서, 용량은 눈 당 7x10⁹ 내지 5x10¹⁰ 총 게놈 복사체, 눈 당 8x10⁹ 내지 4x10¹⁰ 총 게놈 복사체, 눈 당 9x10⁹ 내지 3x10¹⁰ 총 게놈 복사체 또는 눈 당 1x10¹⁰ 내지 2x10¹⁰ 총 게놈 복사체이다.

인간 대상체에 최적화된 등가 용량이 사용될 수 있다. 일부 구체예에서, 용량은 눈 당 1×10⁹ 내지 2×10¹²개의 총 게놈 복사체이다. 일부 구체예에서, 용량은 눈 당 1×10¹⁰ 내지 2×10¹²개의 총 게놈 복사체이다. 일부 구체예에서, 용량은 눈 당 1×10¹¹ 내지 2×10¹²개의 총 게놈 복사체이다.

일부 구체예에서, 용량은 눈 당 1×10¹¹ 내지 1.5×10¹²개의 총 게놈 복사체이다. 일부 구체예에서, 용량은 눈 당 4×10¹¹ 내지 1.5×10¹²개의 총 게놈 복사체이다. 일부 구체예에서, 용량은 눈 당 1x10¹¹ 내지 8x10¹¹ 총 게놈 복사체, 눈 당 2x10¹¹ 내지 7x10¹¹ 총 게놈 복사체, 눈 당 3x10¹¹ 내지 6x10¹¹ 총 게놈 복사체 또는 눈 당 4x10¹¹ 내지 5x10¹¹ 총 게놈 복사체이다. 일부 구체예에서, 용량은 눈 당 7x10¹¹ 내지 5x10¹² 총 게놈 복사체, 눈 당 8x10¹¹ 내지 4x10¹² 총 게놈 복사체, 눈 당 9x10¹¹ 내지 3x10¹² 총 게놈 복사체 또는 눈 당 1x10¹¹ 내지 2x10¹² 총 게놈 복사체이다.

다양한 인간외 대상체에 최적화된 등가 용량이 사용될 수 있다.

대상체

본원에서 사용되는 용어 "대상체"는 인간 또는 비인간 동물을 지칭한다.

비인간 동물의 예는 척추동물, 예를 들어, 비인간 영장류(특히 고등 영장류), 개, 설치류(예를 들어, 마우스, 래트 또는 기니피그), 돼지 및 고양이와 같은 포유동물을 포함한다. 비인간 동물은 반려 동물일 수 있다.

바람직하게는, 대상체는 인간이다.

변이체, 유도체, 유사체 및 단편

본원에 언급된 특정 단백질 및 폴리뉴클레오티드 이외에, 본 발명은 또한 이의 변이체, 유도체 및 단편을 포함한다.

본 발명의 맥락에서, 임의의 주어진 서열의 "변이체"는 잔기의 특정 서열이 (아미노산 또는 핵산 잔기이든) 해당 폴리펩티드 또는 폴리뉴클레오티드가 이의 내인성 기능 중 적어도 하나를 보유하는 방식으로 변형된 서열이다. 변이체 서열은 자연 발생 폴리펩티드 또는 폴리뉴클레오티드에 존재하는 적어도 하나의 잔기의 첨가, 결실, 치환, 변형, 대체 및/또는 변이에 의해 수득될 수 있다.

본 발명의 단백질 또는 폴리펩티드와 관련하여 본원에서 사용되는 용어 "유도체"는 생성된 단백질 또는 폴리펩티드가 이의 내인성 기능 중 적어도 하나를 유지하는 한, 서열로부터의 또는 서열로의 하나(또는 그 초과)의 아미노산 잔기의 임의의 치환, 변이, 변형, 대체, 결실 및/또는 부가를 포함한다.

전형적으로, 아미노산 치환은 예를 들어, 1, 2 또는 3, 내지 10 또는 20개의 치환이 이루어질 수 있으며, 단, 변형된 서열은 요구되는 활성 또는 능력을 보유한다. 아미노산 치환은 비-자연 발생 유사체의 사용을 포함할 수 있다.

본 발명에서 사용되는 단백질은 또한 침묵 변화를 생성하고 기능적으로 동등한 단백질을 생성하는 아미노산 잔기의 결실, 삽입 또는 치환을 가질 수 있다. 고의적인 아미노산 치환은 내인성 기능이 유지되는 한 잔기의 극성, 전하, 용해도, 소수성, 친수성 및/또는 양친매성 성질의 유사성에 기초하여 이루어질 수 있다. 예를 들어, 음으로 하전된 아미노산은 아스파르트산 및 글루탐산을 포함하고; 양으로 하전된 아미노산은 리신 및 아르기닌을 포함하고; 유사한 친수성 값을 갖는 하전되지 않은 극성 헤드 기를 갖는 아미노산은 아스파라긴, 글루타민, 세린, 트레오닌 및 티로신을 포함한다.

보존적 치환은 예를 들어, 하기 표에 따라 이루어질 수 있다. 제2 컬럼의 동일한 블록 및 제3 컬럼의 동일한 라인에 있는 아미노산은 서로 치환될 수 있다:

지방족	비극성	G A P
		I L V
	극성 - 비하전됨	C S T M
		N Q
	극성-하전됨	D E
		K R H
방향족		F W Y

전형적으로, 변이체는 야생형 아미노산 서열 또는 야생형 뉴클레오티드 서열과 특정 동일성을 가질 수 있다.

본 문맥에서, 변이 서열은 대상체 서열과 적어도 50%, 55%, 65%, 75%, 85% 또는 90% 동일할 수 있는, 적합하게는 적어도 95%, 96% 또는 97% 또는 98% 또는 99% 동일할 수 있는 아미노산 서열을 포함하는 것으로 간주된다. 변이체는 또한 유사성(즉, 유사한 화학적 특성/기능을 갖는 아미노산 잔기)의 관점에서 고려될 수 있지만, 본 발명의 맥락에서, 서열 동일성의 관점에서 표현하는 것이 바람직하다.

본 문맥에서, 변이 서열은 대상체 서열에 대해 적어도 50%, 55%, 65%, 75%, 85% 또는 90% 동일할 수 있는, 적합하게는 적어도 95%, 96% 또는 97% 또는 98% 또는 99% 동일할 수 있는 뉴클레오티드 서열을 포함하는 것으로 간주된다. 변이체는 또한 유사성 측면에서 고려될 수 있지만, 본 발명의 맥락에서, 서열 동일성 측면에서 이를 표현하는 것이 바람직하다.

적합하게는, 본원에 상세히 기재된 SEQ ID NO 중 어느 하나에 대해 퍼센트 동일성을 갖는 서열에 대한 언급은 언급된 SEQ ID NO의 전체 길이에 걸쳐 언급된 퍼센트 동일성을 갖는 서열을 지칭한다.

서열 동일성 비교는 눈으로, 또는 보다 일반적으로 용이하게 이용 가능한 서열 비교 프로그램의 도움으로 수행될 수 있다. 이러한 상업적으로 이용 가능한 컴퓨터 프로그램은 2개 이상의 서열 사이의 동일성 퍼센트를 계산할 수 있다.

동일성 퍼센트는 인접한 서열에 대해 계산될 수 있고, 즉, 하나의 서열은 다른 서열과 정렬되고, 한 서열의 각 아미노산 또는 뉴클레오티드는 한 번에 하나의 잔기로 다른 서열의 상응하는 아미노산 또는 뉴클레오티드와 직접 비교된다. 이것을 "갭핑되지 않은" 정렬이라 한다. 전형적으로, 이러한 갭핑되지 않은 정렬은 비교적 짧은 수의 잔기에 대해서만 수행된다.

이는 매우 간단하고 일관된 방법이지만, 예를 들어, 달리 동일한 서열 쌍에서, 아미노산 또는 뉴클레오티드 서열에서 하나의 삽입 또는 결실이 다음 잔기 또는 코돈이 정렬을 이탈되게 하여 전체 정렬이 수행될 때 잠재적으로 동일성 퍼센트의 큰 감소를 초래할 수 있음은 고려되지 않았다. 결과적으로, 대부분의 서열 비교 방법은 전체 동일성 스코어에 부당한 페널티를 주지 않으면서 가능한 삽입 및 결실을 고려하는 최적의 정렬을 생성하도록 설계된다. 이는 국소 동일성을 최대화하기 위해 서열 정렬에 "갭"을 삽입함으로써 달성된다.

그러나, 이러한 보다 복잡한 방법은 정렬에서 발생하는 각 갭에 "갭 페널티"를 할당하여, 동일한 수의 동일한 아미노산 또는 뉴클레오티드에 있어서, 비교된 두 서열 사이의 더 높은 관련성을 반영하여 가능한 한 적은 갭을 갖는 서열 정렬이 많은 갭을 갖는 것보다 더 높은 스코어를 달성할 것이다. "아핀 갭 코스트(Affine gap cost)"는 전형적으로 갭의 존재에 대해 비교적 높은 코스트를 부과하고 갭의 각각의 후속 잔기에 대해 더 적은 패널티를 부과하는 데 사용된다. 이것은 가장 일반적으로 사용되는 갭 스코어링 시스템이다. 높은 갭 패널티는 물론 더 적은 갭을 갖는 최적화된 정렬을 생성할 것이다. 대부분의 정렬 프로그램은 갭 페널티가 수정될 수 있도록 한다. 그러나, 서열 비교를 위해 이러한 소프트웨어를 사용할 때 디폴트 값을 사용하는 것이 바람직하다. 예를 들어, GCG Wisconsin Bestfit 패키지를 사용할 때, 아미노산 서열에 대한 디폴트 갭 패널티는 갭의 경우 -12이고 각 연장부의 경우 -4이다.

따라서, 최대 동일성 퍼센트의 계산은 갭 페널티를 고려하여 먼저 최적의 정렬의 생성을 필요로 한다. 이러한 정렬을 수행하기에 적합한 컴퓨터 프로그램은 GCG Wisconsin Bestfit 패키지이다(University of Wisconsin, USA; Devereux et al. (1984) Nucleic Acids Research 12: 387). 서열 비교를 수행할 수 있는 다른 소프트웨어의 예는 비제한적으로, BLAST 패키지(문헌 [Ausubel et al. (1999) ibid - Ch. 18] 참조), FASTA(Atschul et al. (1990) J. Mol. Biol. 403-410), EMBOSS Needle (Madeira, F., et al., 2019. Nucleic acids research, 47(W1), pp.W636-W641) 및 비교 툴의 GENEWORKS 수트를 포함한다. BLAST 및 FASTA 둘 모두는 오프라인 및 온라인 검색에 이용 가능하다(문헌 [Ausubel et al. (1999) ibid, pages 7-58 to 7-60] 참조). 그러나, 일부 적용의 경우, GCG Bestfit 프로그램을 사용하는 것이 바람직하다. 또 다른 도구인 BLAST 2 Sequences는 또한 단백질 및 뉴클레오티드 서열을 비교하는데 이용 가능하다(FEMS Microbiol. Lett. (1999) 174(2):247-50; FEMS Microbiol. Lett. (1999) 177(1):187-8).

최종 동일성 퍼센트는 측정될 수 있지만, 정렬 과정 자체는 전형적으로 모두-또는-전무(all-or-nothing) 쌍 비교를 기반으로 하지 않는다. 대신, 화학적 유사성 또는 진화적 거리에 기반하여 각각의 쌍별 비교에 스코어를 할당하는 스케일링된 유사성 스코어 매트릭스가 일반적으로 사용된다. 일반적으로 사용되는 이러한 매트릭스의 예는 BLOSUM62 매트릭스(BLAST 슈트 프로그램에 대한 디폴트 매트릭스)이다. GCG 위스콘신 프로그램은 일반적으로 공개 디폴트 값 또는 제공되는 경우 사용자 정의 기호 비교 표를 사용한다(자세한 내용은 사용자 설명서 참조). 일부 적용의 경우, GCG 패키지에 있어서 공개 디폴트 값을 사용하거나, 다른 소프트웨어의 경우, BLOSUM62와 같은 디폴트 매트릭스를 사용하는 것이 바람직하다.

소프트웨어가 최적의 정렬을 생성하면, 서열 동일성 퍼센트를 계산하는 것이 가능하다. 소프트웨어는 전형적으로 서열 비교의 일부로서 이를 수행하고 수치 결과를 생성한다. 퍼센트 서열 동일성은 언급된 SEQ ID NO에서 총 잔기의 백분율로서 동일한 잔기의 수로서 계산될 수 있다.

"단편"은 또한 변이체이고, 용어는 전형적으로 기능적으로 또는, 예를 들어, 검정에서 관심 있는 폴리펩티드 또는 폴리뉴클레오티드의 선택된 영역을 지칭한다. 따라서, "단편"은 전장 폴리펩티드 또는 폴리뉴클레오티드의 일부인 아미노산 또는 핵산 서열을 지칭한다.

이러한 변이체, 유도체 및 단편은 부위-지정 돌연변이유발과 같은 표준 재조합 DNA 기술을 사용하여 제조될 수 있다. 삽입이 이루어질 경우, 삽입 부위의 어느 한 쪽에 자연-발생 서열에 상응하는 5' 및 3' 측접 영역과 함께 삽입부를 인코딩하는 합성 DNA가 만들어질 수 있다. 측접 영역은 자연 발생 서열의 부위에 상응하는 편리한 제한 부위를 함유하여 서열이 적절한 효소(들)로 절단되고 합성 DNA가 절단부에 리게이션될 수 있다. 이후, DNA는 본 발명에 따라 발현되어 인코딩된 단백질을 제조한다. 이러한 방법은 DNA 서열의 조작을 위해 당 분야에 공지된 수많은 표준 기술의 예시일 뿐이며, 다른 공지된 기술이 또한 사용될 수 있다.

당업자는 개시된 바와 같은 본 발명의 범위를 벗어나지 않으면서 본원에 개시된 본 발명의 모든 특징을 조합할 수 있음을 이해할 것이다.

본 발명의 바람직한 특징 및 구체예는 이제 비제한적인 실시예에 의해 기술될 것이다.

본 발명의 실시는 달리 지시되지 않는 한, 당업자의 능력 내에 있는 화학, 생화학, 분자 생물학, 미생물학 및 면역학의 통상적인 기술을 이용할 것이다. 이러한 기술은 문헌에 설명되어 있다. 예를 들어, 하기 문헌 참조: Sambrook, J., Fritsch, E.F. and Maniatis, T. (1989) Molecular Cloning: A Laboratory Manual, 2nd Edition, Cold Spring Harbor Laboratory Press; Ausubel, F.M. et al. (1995 and periodic supplements) Current Protocols in Molecular Biology, Ch. 9, 13 and 16, John Wiley & Sons; Roe, B., Crabtree, J. and Kahn, A. (1996) DNA Isolation and Sequencing: Essential Techniques, John Wiley & Sons; Polak, J.M. and McGee, J.O'D. (1990) In Situ Hybridization: Principles and Practice, Oxford University Press; Gait, M.J. (1984) Oligonucleotide Synthesis: A Practical Approach, IRL Press; and Lilley, D.M. and Dahlberg, J.E. (1992) Methods in Enzymology: DNA Structures Part A: Synthesis and Physical Analysis of DNA, Academic Press. 이러한 일반적인 텍스트 각각은 본원에 참조로 포함된다.

실시예

실시예 1

결과 및 논의

이중 아데노-관련 바이러스(AAV) 벡터의 최적화

인간 Myosin7A(hMYO7A)의 전달을 위한 이중 AAV8 벡터의 특성화 동안, 본 발명자들은 트랜스진 코딩 서열 CDS(AAV8-5'hMYO7A)의 5' 말단 부분을 포함하는 벡터의 제조물에서 오염물 벡터를 발견하였다.

벡터에 사용된 닭 베타-액틴(CBA) 프로모터를 인식하는 프로브를 사용하여 개발된 서던 블롯 분석은 예상되는 AAV8-5'hMYO7A에 상응하는 더 큰 밴드 및 오염물에 상응하는 약 1.3 Kb의 더 작은 밴드를 나타내었다( 도 1a, b).

더 작은 게놈 오염물은 벡터 제조물에 일관되게 존재하였으나, 이들을 생성하는 데 사용된 플라스미드에는 없었다. 따라서, 본 발명자들은 문제가 바이러스 게놈과 관련이 있고, 원래의 플라스미드 게놈이 명백히 손상되지 않았기 때문에 벡터 입자의 제조시 또는 제조 후에 더 작은 생성물의 생성이 발생하였다고 가정하였다.

그 후, 본 발명자들은 2개의 서열: 키메라 프로모터 인트론 및 스플라이싱 공여체(SD) 신호 사이의 82개 염기쌍 상동성 영역을 확인하였다(도 1c, 하기 서열 참조).

키메라 인트론(Bothwell et al. (1981) Cell 24: 625-637):

(SEQ ID NO: 16)

스플라이싱 공여체(SD) 서열:

(SEQ ID NO: 17)

밑줄 친 서열은 동일하다: SD 서열은 키메라 인트론의 뉴클레오티드 1-82와 동일하다.

정제된 바이러스 DNA의 서브클로닝 및 Sanger 시퀀싱을 사용하여, 본 발명자들은 작제물 내의 상동성 영역의 존재로 인해 상동성 재조합 사건이 발생함을 확인하였다. 이는 인트론의 나머지 부분, 5'hMYO7A 서열 및 SD 신호의 결실을 초래하는 한편, 새로운 작제물은 여전히 AAV 역 말단 반복부(ITR)를 유지하여, 벡터 생성을 지원한다(도 1d).

인트론 서열 및 SD 서열을 함유하는 다른 벡터(예를 들어, 다른 트랜스진 및 프로모터 포함)에서 유사한 오염물이 관찰되었고(도 1e), 인트론 서열을 제거함으로써 폐기되었다.

이어서, 본 발명자들은 키메라 인트론을 SD 서열과 상동성이 아닌 서열로 치환하였다. 본 발명자들은 형질감염에 의한 HEK293 세포에서 EGFP 발현의 관점에서 비교하기 위해 시미안 바이러스 40(SV40) 인트론의 변형된 버전인 키메라 인트론(Nathwani et al. (2006) Blood 107: 2653-2661), 또는 미닛 바이러스 마우스(MVM) 인트론(Wu et al. (2008) Mol. Ther. 16: 280-289)을 갖거나 인트론이 부재하는 향상된 녹색 형광 단백질(EGFP)를 인코딩하는 플라스미드를 클로닝하였다. 형광 영상화(도 2b)는 SV40 인트론 또는 MVM 인트론을 함유하는 작제물로부터의 EGFP 발현이 키메라 인트론을 함유하는 것과 유사하다는 것을 보여준다.

SV40 및 MVM 인트론을 클로닝한 후, 본 발명자들은 hMYO7A CDS의 5' 말단 부분을 포함하는 각각의 AAV2 벡터(AAV2-SV40 인트론-5'hMYO7A 및 AAV2-MVM 인트론-5'hMYO7A)를 생성하여 AAV2-키메라 인트론-5'hMYO7A 및 AAV2-인트론 부재-5'hMYO7A에 대한 MYO7A 발현에 의한 HEK293 세포에서 시험관내에서 제2 비교를 수행하였다.

웨스턴 블롯 분석은 SV40 및 MVM 인트론 둘 모두가 시험관내에서 hMYO7A의 필적할만한 발현 수준을 유도함을 보여준다(도 3).

마지막으로, 본 발명자들은 hMYO7A CDS의 5' 말단 부분을 포함하는 각각의 AAV8 벡터(AAV8-SV40 인트론-5'hMYO7A 및 AAV8-MVM 인트론-5'hMYO7A)를 생성하였다. 이어서, 본 발명자들은 정제된 바이러스 DNA의 서던 블롯에 의해 AAV8-키메라 인트론-5'hMYO7A에 대한 제3 비교를 수행하였고, 또한 웨스턴 블롯 분석에 의해 hMYO7A 발현 수준을 평가하기 위해 AAV8-3'hMYO7A-3XFlag를 함께 C57BL/6 마우스에 망막하 주사하였다.

본 발명자들은 SV40 및 MVM 인트론 둘 모두가 오염물 벡터의 형성을 피하고 생체내에서 유사한 hMYO7A 발현 수준을 달성한다는 것을 발견하였다(도 4). 본 발명자들은 비임상 및 임상 연구에 사용하기 위해 이중 AAV8-5'hMYO7A의 생성을 위해 AAV8-SV40 인트론-5'hMYO7A를 사용하기로 결정하였다.

재료 및 방법

AAV 벡터 플라스미드의 생성

AAV 벡터 생성에 사용된 플라스미드는 AAV 혈청형 2의 역 말단 반복부(ITR)를 함유하였다. 이중 AAV 벡터를 생성하는데 필요한 2개의 AAV 벡터 플라스미드(5' 및 3')는 여러 요소를 함유하였다. 5' 플라스미드는 다음을 함유하였다: 인간 β-글로빈 유전자 및 분지의 제1 인트론으로부터의 5'-공여체 부위 및 면역글로불린 유전자 중쇄 가변 영역의 본체와 리더 사이에 있는 인트론으로부터의 3'-수용체 부위로 구성된 키메라 프로모터 인트론(Bothwell et al. (1981) Cell 24: 625-637), 시미안 바이러스 40 프로모터 인트론(SV40)의 변형된 버젼(Nathwani et al. (2006) Blood 107: 2653-2661) 또는 미닛 바이러스 마우스 인트론(Wu et al. (2008) Mol. Ther. 16: 280-289)과 결합된 닭 베타-액틴 프로모터(CBA) 및 CMV 인핸서; 트랜스진 코딩 서열(CDS)의 N-말단 부분; 스플라이스 공여체 서열. 3' 플라스미드는 다음을 함유하였다: 스플라이스 수용체 서열 및 트린스진 CDS의 C-말단 부분에 이은 BGH 폴리A. 일부 실험에 있어서, C-종결 말단에 3XFlag-태그를 갖는 hMYO7A의 3' 부분을 사용하였다.

hMYO7A CDS를 엑손 24-25 사이의 천연 엑손-엑손 접합부에서 분할하였다(5' 절반: NM_000260.3, bp 273-3380; 3' 절반: NM_000260.3, bp 3381-6920).

이중 AAV 벡터 플라스미드에 함유된 스플라이스 공여체(SD) 및 스플라이스 수용체(SA) 서열은 다음과 같다:

SD:

(SEQ ID NO: 18)

SA:

(SEQ ID NO: 19)

하이브리드 AK 벡터 플라스미드에 함유된 재조합원성 서열은 파아지 F1 게놈으로부터 유래되었다(Gene Bank 수탁 번호: J02448.1; bp 5850-5926). AK 서열은 다음과 같다:

(SEQ ID NO: 20)

AAV 벡터 생성 및 특성화

이중 AAV-hMYO7A 벡터는 TIGEM AAV 벡터 코어에 의해 생성되었다. 벡터는 HEK293 세포의 삼중 형질감염 후 2회 CsCl₂ 정제에 의해 생성되었다(Grimm et al. (1998) Hum. Gene Ther. 2760: 2745-2760; Liu et al.(2003) Biotechniques 34: 184-189; Salvetti). et al. (1998) Hum. Gene Ther. 9: 695-706; Zolotukhin et al.(1999) Gene Ther. 6: 973-985). 각각의 바이러스 제조물에 있어서, 물리적 역가[게놈 복사체(GC)/ml]를 TaqMan 정량적 PCR(Applied Biosystems, Carlsbad, CA, USA)에 의해 결정하였다. 프라이머 및 프로브는 AAV-5'hMYO7a의 경우 5'-hMYO7A 및 AAV-3'hMYO7A의 경우 BGH pA에서 어닐링되도록 설계되었다. AAV-5'hMYO7A에 대한 알칼리성 서던 블롯 분석을 하기와 같이 수행하였다: 3E+10 GC의 바이러스 DNA를 AAV 입자로부터 추출하였다. 패키징되지 않은 게놈을 분해하기 위해, 벡터 용액을 37℃에서 2h 동안 pH 7.9에서 40 mM TRIS-HCl, 10 mM NaCl, 6 mM MgCl₂, 1 mM CaCl₂를 함유하는 300 μL의 총 부피 중 1 U/μL의 DNase I(Roche, Milan, Italy)과 함께 인큐베이션하였다. 이어서, DNase I을 50 mM EDTA로 불활성화시킨 다음, 프로테이나제 K 및 2.5% N-라우로일-사르코실 용액과 함께 50℃에서 45분 동안 인큐베이션하여 캡시드를 용해시켰다. DNA를 페놀-클로로포름으로 2회 추출하고, 2 부피의 무수 에탄올 및 10% 소듐 아세테이트(3 M, pH 7)로 침전시켰다. 정제된 DNA를 알칼리성 아가로스 겔에서 작동시키고, 디곡시제닌 비-방사성 방법(Roche, Milan, Italy)을 사용하여 영상화하였다. 10 μL의 1 kb DNA 래더(N3232L; New England Biolabs, Ipswich, MA, USA)를 분자량 마커로서 로딩하였다. 서던 블롯 프로브는 544 염기쌍 프로브를 추출하고 정제하기 위해 KpnI-XhoI를 사용한 5'AAV 플라스미드 DNA의 효소적 분해에 의해 수득되었다.

세포 배양 및 형질감염

HEK293 세포를 10% 우태아 혈청(FBS)이 보충된 DMEM에서 유지시켰다(Gibco, Thermo Fisher Scientific, Waltham, MA, USA). 세포를 6-웰 플레이트(HEK293 1E+6 세포/웰)에 플레이팅하고, 24시간 후에 웰을 칼슘 포스페이트 + 1.5 μg의 상응하는 플라스미드를 사용하여 형질감염시켰다. 4시간 후, 배지를 2 mL의 새로운 예열된 배지로 교체하였다. 세포를 수확하고 형질감염 후 72시간째에 용해시켰다.

마우스에서 AAV 벡터의 망막하 주사

이 연구는 안과 및 시력 연구에서 동물의 사용에 대한 시력 및 안과 연구 협회 및 동물 시술에 대한 이탈리아 보건부 규정(승인 번호 301/2020-PR)에 따라 수행되었다.

C57BL/6 및 쉐이커 -/- 마우스를 TIGEM 동물 하우스(Pozzuoli, Italy)에 수용하고 12h 명/암 주기(광 페이스 동안 10-50 lux 노출) 하에 유지하였다. 수술은 마취 하에 수행되었고 고통을 최소화하기 위해 모든 노력을 기울였다. 성체 마우스를 2 mL/100 g 체중의 케타민/메데토미딘의 복강내 주사로 마취시켰다. 동일한 부피의 벡터 용액 또는 부형제를 리앙 등(Liang et al. (2000) Vis. Res. Protoc. 47: 125-139)에 기술된 바와 같이 후방 경공막 경맥락막 접근법을 통해 망막하로 전달하였다.

웨스턴 블롯 분석

웨스턴 블롯(Wb) 분석을 위한 세포 및 아이컵(컵 + 망막)을 RIPA 완충제(50 mM Tris-HCl pH 8.0, 150 mM NaCl, 1% NP40, 0.5% Na-데옥시콜레이트, 1 mM EDTA pH 8.0, 0.1% SDS)에서 용해시켜 MYO7A를 추출하였다. 용해 완충제에 0.5% 페닐메틸설포닐 플루오라이드(PSMF)(Sigma-Aldrich, St. Louis, Missouri, USA) 및 1% 완전 EDTA-비함유 프로테아제 억제제 칵테일(Roche, Milan, Italy)을 보충하였다. Pierce BCA 단백질 검정 키트(Thermo-Scientific)를 사용하여 단백질 농도를 결정하였다. 용해 후, 샘플을 β-메르캅토에탄올이 보충된 4X Laemmli 샘플 완충제(Bio-rad, Milan, Italy) 1:10에서 99℃에서 5분 동안 변성시켰다. 샘플을 7% 아크릴아미드 겔에서 분리하였다. 면역-블롯팅에 사용된 항체는 하기와 같았다: 전장 hMYO7A-3XFlag를 인식하기 위한 항-3XFlag(1:1000, 모노클로날, A8592; Sigma); 항-Dysferlin (1:500, MONX10795; Tebu-bio, Le Perray-en-Yveline, France). Wb 밴드의 정량화는 ImageJ 소프트웨어를 사용하여 수행되었고, hMYO7A 발현은 Dysferlin의 발현에 대해 표준화되었다.

벡터 서열

실험에 사용된 MYO7A-인코딩 벡터의 서열은 본원에서 SEQ ID NO: 14 및 15로서 개시된다.

실험에 사용된 추가 벡터의 서열은 다음과 같다:

5'CMV- ABCA4 -AK

(SEQ ID NO: 21)

5' ITR

CMV 즉시-초기 인핸서/프로모터

키메라 인트론

ABCA4의 5' 말단 부분

3' ITR

5'CMV- ABCA4 -TS

(SEQ ID NO: 22)

5' ITR

CMV 즉시-초기 인핸서/프로모터

키메라 인트론

ABCA4의 5' 말단 부분

3' ITR

5'CMV NO INTRON ABCA4 OV

(SEQ ID NO: 23)

5' ITR

CMV 즉시-초기 인핸서/프로모터

ABCA4의 5' 말단 부분

3' ITR

5'CMV NO INTRON ABCA4 -AK

(SEQ ID NO: 24)

5' ITR

CMV 즉시-초기 인핸서/프로모터

ABCA4의 5' 말단 부분

3' ITR

5'VMD2 ABCA4 -AK

(SEQ ID NO: 25)

5' ITR

인핸서

VMD2 프로모터

ABCA4의 5' 말단 부분

3' ITR

5'RHO ABCA4 -AK

(SEQ ID NO: 26)

5' ITR

인핸서

RHO 프로모터

ABCA4의 5' 말단 부분

3' ITR

5'RHO ABCA4 -TS

(SEQ ID NO: 27)

5' ITR

인핸서

RHO 프로모터

ABCA4의 5' 말단 부분

3' ITR

실시예 2. 이중 AAV8.hMYO7A 반응 연구

SV40 인트론을 갖는 AAV8.5'MYO7A를 포함하는 이중 AAV8.MYO7A의 치료 효능을 어셔 1b의 마우스 모델인 쉐이커1^-/- (sh1 ^-/-) 마우스에서 생체내 시험하였다. 어셔 증후군 타입 1B(USH1B) 대상체에서 사용될 용량을 선택하기 위해, 본 발명자들은 우수한 제조-유사 관행(즉, tox 로트) 하에 생산된 이중 AAV8.hMYO7A를 사용하여 용량 반응 연구를 수행하였다. USH1B의 마우스 모델인 망막하 주사된 sh1^-/- 마우스를 망막 결함의 구조 및 단백질 hMYO7A 수준에 대해 분석하였다. 본 발명자들은 3개의 상이한 용량을 선택하였다: 1,37E+9(저용량 또는 LD), 4,4E+9(중간 용량 또는 MD), 및 1,37E+10(고용량 또는 HD) 총 GC/눈. AAV 용매(NaCl 35 mM 및 0.001% 폴록사머 188이 보충된 포스페이트 완충된 염수)만 주사된 비이환된 이형접합성 마우스 및 이환된 마우스를 각각 양성 및 음성 대조군으로 사용하였다. Sh1^-/- 마우스는 망막 색소 상피(RPE) 정단 융모에 멜라노솜이 거의 위치하지 않기 때문에 망막의 초미세구조 결함을 나타낸다. 주사 후 3개월에, 본 발명자들은 RPE 정단 융모에 정확하게 국소화된 멜라노솜의 수를 측정함으로써 용량-의존적 효과를 확인하였다(도 5a-b). 이중 AAV8.hMYO7A의 HD 및 MD의 주사는 용매만을 수용한 sh1^-/-와 비교하여 망막 결함을 유의하게 구제하였다; 또한, HD로 처리된 비이환된 눈과 이환된 눈 사이에는 통계적 차이가 없었다(도 5b, pANOVA 값: 제형 완충제로 주사된 이환된 sh1^-/- vs 제형 완충제로 주사된 비이환된 sh1^+/- < 0.0001, 고용량으로 처리된 sh1^{-/ -} < 0.0001, 중간 용량으로 처리된 sh1^-/- < 0.01 또는 저용량으로 처리된 sh1^-/- = 0.313; 고용량으로 처리된 sh1^-/- vs 제형 완충제로 주사된 비이환된 sh1^+/- = 0.105, 중간 용량으로 처리된 sh1^-/- = 0.113 또는 저용량으로 처리된 sh1^-/- < 0.01; 중간 용량으로 처리된 sh1^-/- vs 제형 완충제가 주사된 비이환된 sh1^+/- < 0.001 또는 저용량으로 처리된 sh1^-/- = 0.442; 제형 완충제로 주사된 비이환된 sh1^+/- vs 저용량으로 처리된 sh1^-/- < 0.0001). Sh1^-/- LD-처리된 눈은 또한 음성 대조군과 비교하여 망막 표현형의 교정을 나타내었다. 비이환된 sh1^+/- 그룹 내에서 통계적 분석에 영향을 미치는 약간의 변동성이 있었고, 따라서 본 발명자들은 비이환된 sh1^+/- 부재하에 ANOVA 분석을 반복하고 LD에 대해서도 통계적 유의성에 도달하였다(도 5b, pANOVA 값: 제형 완충제로 주사된 이환된 sh1^-/- vs 고용량으로 처리된 sh1^-/- < 0.0001, 중간 용량으로 처리된 sh1^-/- <0.0001 또는 저용량으로 처리된 sh1^-/- < 0.01; 고용량으로 처리된 sh1^-/- vs 중간 용량으로 처리된 sh1^-/- < 0.001 또는 저용량으로 처리된 sh1^-/- < 0.0001; 중간 용량으로 처리된 sh1^-/- vs 저용량으로 처리된 sh1^-/- < 0.05). 망막하 주사 후 5주째에 sh1^-/- 마우스로부터의 용해된 아이컵(RPE + 신경 망막)의 웨스턴 블롯 분석은 이중 AAV8.hMYO7A의 모든 선택된 용량에 대한 전장 hMYO7A의 발현을 나타낸다(도 5c-d). 더 많은 수의 눈이 LD와 비교하여 HD 및 MD를 사용한 hMYO7A 발현에 대해 양성이었다(도 5d). 인간 망막이 뮤린 망막의 100X임을 고려하면(Panda-Jonas et al. (1994) Ophthalmology 101: 519-523; Remtulla et al. (1985) Vision Res. 25: 21-31), 본 발명자들은 인간에서 해당 치료 용량이 이중 AAV8.hMYO7A의 1.37E+11 내지 1.37E+12 총 GC/눈 범위일 수 있다고 추론할 수 있다.

재료 및 방법

웨스턴 블롯 분석

웨스턴 블롯(WB) 분석을 위한 아이컵(컵 + 망막)을 RIPA 완충제(50 mM Tris-HCl pH 8.0, 150 mM NaCl, 1% NP40, 0.5% Na-데옥시콜레이트, 1 mM EDTA pH 8.0, 0.1% SDS)에서 용해시켰다. 용해 완충제에 0.5% 페닐메틸설포닐 플루오라이드(PSMF)(Sigma-Aldrich, St. Louis, Missouri) 및 1% 완전 EDTA-비함유 프로테아제 억제제 칵테일(Roche, Milan, Italy)을 보충하였다. Pierce BCA 단백질 검정 키트(Thermo-Scientific, Waltham, Massachusetts)를 사용하여 단백질 농도를 결정하였다. 용해 후, 샘플을 1:10 희석된 β-메르캅토에탄올(Sigma-Aldrich)이 보충된 4X Laemmli 샘플 완충제(Bio-rad, Milan, Italy)에서 99℃에서 5분 동안 변성시켰다. 4-20% 구배 사전-캐스트 TGX 겔(Bio-rad)에 대한 MYO7A 분석을 위한 샘플. 하기 항체를 면역-블롯팅에 사용하였다: hMYO7A 단백질의 아미노산 941-1070에 상응하는 펩티드(DMVDKMFGFLGTSGGLPGQEGQAPSGFEDLERGRREMVEEDLDAALPLPDEDEEDLSEYKFAKFAATYFQGTTTHSYTRRPLKQPLLYHDDEGDQLAALAVWITILRFMGDLPEPKYHTAMSDGSEKIPV; 밀줄친 아미노산은 뮤린 Myo7A에서 상이하다(1.6%))를 인식하는 맞춤형 항-hMYO7A(1:200, 폴리클로날; Primm Srl, Milan, Italy); 항-Dysferlin (1:500, MONX10795; Tebu-bio, Le Perray-en-Yveline, France). WB 밴드의 정량화는 ImageJ 소프트웨어를 사용하여 수행되었다. hMYO7A 발현은 Dysferlin의 발현에 대해 표준화되었다.

멜라노솜 국소화 분석

착색된 sh1 마우스(+/- 또는 -/-)의 눈을 AAV 주사 후 3개월에 적출하고 각막의 측두부에서 소작되었다. 0.1 M PBS 중 2% 글루타르알데하이드-2% 파라포름알데하이드를 사용하여 밤새 고정을 수행하고, 0.1 M PBS에서 린싱하고, 광학 현미경으로 해부하였다. 아이컵의 측두 부분은 Araldite 502/EMbed 812(Araldite 502/EMbed 812 KIT, 카탈로그 #13940; Electron Microscopy Sciences, Hatfield, PA, USA)에 포매시켰다. 반-얇은(0.5 μm) 섹션을 Leica Ultramicrotome RM2235(Leica Microsystems, Bannockburn, IL, USA)에서 가로로 절단하고, 슬라이드에 탑재하고, 톨루이딘 블루 및 보라스(borace) 염색으로 염색하였다. 멜라노솜을 100X 배율로 Zeiss Apotome(Carl Zeiss, Oberkochen, Germany)을 사용하여 중첩 필드의 획득을 통해 수득된 전체 망막 섹션의 몽타주에서 마스킹된 오퍼레이터에 의해 계수하였으며; 이후, 전체 망막 섹션을 Photoshop 소프트웨어(Adobe, San Jose, California)에서 재구성하였다. 멜라노솜 수 및 망막 색소 상피(RPE) 측정을 ImageJ 소프트웨어를 사용하여 수행하였다. 멜라노솜 수를 100 μm로 나눈 RPE의 길이에 걸쳐 표준화하였다.

통계학적 분석

일원 분산 분석(ANOVA)에 이은 Tuckey 사후 분석을 이용하여 도 5에서 그룹 사이의 다중 쌍 비교를 수행하였다. 도 5: 망막 색소 상피에 대해 정확하게 국소화된 멜라노솜에 대한 용량-의존적 효과: ANOVA p-값은 다음과 같다. 제형 완충제로 주사된 이환된 sh1^-/- vs 제형 완충제로 주사된 비이환된 sh1^+/-(pANOVA < 0.0001), 고용량으로 처리된 sh1^-/-(pANOVA < 0.0001), 중간 용량으로 처리된 sh1^-/-(pANOVA <0.01) 또는 저용량으로 처리된 sh1^-/-(pANOVA = 0.313); 고용량으로 처리된 sh1^-/- vs 제형 완충제로 주사된 비이환된 sh1^+/-(pANOVA = 0.105), 중간 용량으로 처리된 sh1^-/-(pANOVA = 0.113) 또는 저용량으로 처리된 sh1^-/-(pANOVA < 0.01); 중간 용량으로 처리된 sh1^-/- vs 제형 완충제가 주사된 비이환된 sh1^+/-(pANOVA < 0.001) 또는 저용량으로 처리된 sh1^-/-(pANOVA 0.442); 제형 완충제가 주사된 비이환된 sh1^+/- vs 저용량으로 처리된 sh1^-/-(pANOVA < 0.0001). ANOVA 분석에 영향을 미치는 제형 완충제로 주사된 sh1^+/-의 가변성으로 인해, 비이환된 대조군 없이 비교를 다시 분석하였고, ANOVA p-값은 다음과 같다: 제형 완충제가 주사된 이환된 sh1^-/- Vs 고용량으로 처리된 sh1^-/- (pANOVA < 0.0001), 중간 용량으로 처리된 sh1^-/-(pANOVA <0.0001) 또는 저용량으로 처리된 sh1^-/-(pANOVA < 0.01); 고용량으로 처리된 sh1^-/- Vs 중간 용량으로 처리된 sh1^-/-(pANOVA < 0.001) 또는 저용량으로 처리된 sh1^-/-(pANOVA < 0.0001); 중간 용량으로 처리된 sh1^-/- Vs 저용량으로 처리된 sh1^-/-(pANOVA < 0.05). 데이터는 독립적인 시험관내 실험 또는 눈의 수를 사용하여 계산된 평균[± 평균의 표준 오차(s.e.m.)]으로 제시된다(동일한 샘플의 반복 측정이 아님). 통계적 p-값 ≤ 0.05는 유의한 것으로 간주되었다.

상기 명세서에 언급된 모든 간행물은 본원에 참조로 포함된다. 본 발명의 개시된 벡터, 시스템, 방법 및 용도의 다양한 변경 및 변형은 본 발명의 범위 및 사상을 벗어나지 않으면서 당업자에게 명백할 것이다. 본 발명이 특정 바람직한 구체예와 관련하여 개시되었지만, 청구된 바와 같은 본 발명은 이러한 특정 구체예로 과도하게 제한되어서는 안된다는 것이 이해되어야 한다. 실제로, 당업자에게 명백한 본 발명을 수행하기 위한 개시된 모드의 다양한 변형은 하기 청구범위의 범위 내에 있는 것으로 의도된다.

SEQUENCE LISTING <110> Fondazione Telethon <120> VECTOR SYSTEM <130> P122384PCT <140> PCT/EP2022/062989 <141> 2022-05-12 <150> EP21173687.1 <151> 2021-05-12 <160> 45 <170> PatentIn version 3.5 <210> 1 <211> 227 <212> DNA <213> Artificial Sequence <220> <223> Exemplary CBA promoter <400> 1 gaggtgagcc ccacgttctg cttcactctc cccatctccc ccccctcccc acccccaatt 60 ttgtatttat ttatttttta attattttgt gcagcgatgg gggcggggcg gggcgaggcg 120 gagaggtgcg gcggcagcca atcggagcgg cgcgctccga aagtttcctt ttatggcgag 180 gcggcggcgg cggcggctct ataaaaagcg aagcgcgcgg cgggcgg 227 <210> 2 <211> 378 <212> DNA <213> Artificial Sequence <220> <223> example CMV enhancer <400> 2 gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60 catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120 acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180 ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240 aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300 ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 360 tagtcatcgc tattacca 378 <210> 3 <211> 93 <212> DNA <213> Artificial Sequence <220> <223> example SV40 intron sequence <400> 3 ctctaaggta aatataaaat ttttaagtgt ataatgtgtt aaactactga ttctaattgt 60 ttctctcttt tagattccaa cctttggaac tga 93 <210> 4 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> example MVM intron sequence <400> 4 aagaggtaag ggtttaaggg atggttggtt ggtggggtat taatgtttaa ttacctggag 60 cacctgcctg aaatcacttt ttttcaggtt gg 92 <210> 5 <211> 82 <212> DNA <213> Artificial Sequence <220> <223> example splice donor sequence <400> 5 gtaagtatca aggttacaag acaggtttaa ggagaccaat agaaactggg cttgtcgaga 60 cagagaagac tcttgcgttt ct 82 <210> 6 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> example splice acceptor sequence <400> 6 gataggcacc tattggtctt actgacatcc actttgcctt tctctccaca g 51 <210> 7 <211> 77 <212> DNA <213> Artificial Sequence <220> <223> Exemplary recombinogenic region sequence (AK) <400> 7 gggatttttc cgatttcggc ctattggtta aaaaatgagc tgatttaaca aaaatttaac 60 gcgaatttta acaaaat 77 <210> 8 <211> 208 <212> DNA <213> Artificial Sequence <220> <223> Exemplary polyadenylation sequence <400> 8 ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc 60 tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc 120 tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt 180 gggaagacaa tagcaggcat gctgggga 208 <210> 9 <211> 130 <212> DNA <213> Artificial Sequence <220> <223> example 5' ITR <400> 9 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct 130 <210> 10 <211> 130 <212> DNA <213> Artificial Sequence <220> <223> example 3' ITR <400> 10 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120 gagcgcgcag 130 <210> 11 <211> 6648 <212> DNA <213> Artificial Sequence <220> <223> example MYO7A nucleotide sequence <400> 11 atggtgattc ttcagcaggg ggaccatgtg tggatggacc tgagattggg gcaggagttc 60 gacgtgccca tcggggcggt ggtgaagctc tgcgactctg ggcaggtcca ggtggtggat 120 gatgaagaca atgaacactg gatctctccg cagaacgcaa cgcacatcaa gcctatgcac 180 cccacgtcgg tccacggcgt ggaggacatg atccgcctgg gggacctcaa cgaggcgggc 240 atcttgcgca acctgcttat ccgctaccgg gaccacctca tctacacgta tacgggctcc 300 atcctggtgg ctgtgaaccc ctaccagctg ctctccatct actcgccaga gcacatccgc 360 cagtatacca acaagaagat tggggagatg cccccccaca tctttgccat tgctgacaac 420 tgctacttca acatgaaacg caacagccga gaccagtgct gcatcatcag tggggaatct 480 ggggccggga agacggagag cacaaagctg atcctgcagt tcctggcagc catcagtggg 540 cagcactcgt ggattgagca gcaggtcttg gaggccaccc ccattctgga agcatttggg 600 aatgccaaga ccatccgcaa tgacaactca agccgtttcg gaaagtacat cgacatccac 660 ttcaacaagc ggggcgccat cgagggcgcg aagattgagc agtacctgct ggaaaagtca 720 cgtgtctgtc gccaggccct ggatgaaagg aactaccacg tgttctactg catgctggag 780 ggcatgagtg aggatcagaa gaagaagctg ggcttgggcc aggcctctga ctacaactac 840 ttggccatgg gtaactgcat aacctgtgag ggccgggtgg acagccagga gtacgccaac 900 atccgctccg ccatgaaggt gctcatgttc actgacaccg agaactggga gatctcgaag 960 ctcctggctg ccatcctgca cctgggcaac ctgcagtatg aggcacgcac atttgaaaac 1020 ctggatgcct gtgaggttct cttctcccca tcgctggcca cagctgcatc cctgcttgag 1080 gtgaaccccc cagacctgat gagctgcctg actagccgca ccctcatcac ccgcggggag 1140 acggtgtcca ccccactgag cagggaacag gcactggacg tgcgcgacgc cttcgtaaag 1200 gggatctacg ggcggctgtt cgtgtggatt gtggacaaga tcaacgcagc aatttacaag 1260 cctccctccc aggatgtgaa gaactctcgc aggtccatcg gcctcctgga catctttggg 1320 tttgagaact ttgctgtgaa cagctttgag cagctctgca tcaacttcgc caatgagcac 1380 ctgcagcagt tctttgtgcg gcacgtgttc aagctggagc aggaggaata tgacctggag 1440 agcattgact ggctgcacat cgagttcact gacaaccagg atgccctgga catgattgcc 1500 aacaagccca tgaacatcat ctccctcatc gatgaggaga gcaagttccc caagggcaca 1560 gacaccacca tgttacacaa gctgaactcc cagcacaagc tcaacgccaa ctacatcccc 1620 cccaagaaca accatgagac ccagtttggc atcaaccatt ttgcaggcat cgtctactat 1680 gagacccaag gcttcctgga gaagaaccga gacaccctgc atggggacat tatccagctg 1740 gtccactcct ccaggaacaa gttcatcaag cagatcttcc aggccgatgt cgccatgggc 1800 gccgagacca ggaagcgctc gcccacactt agcagccagt tcaagcggtc actggagctg 1860 ctgatgcgca cgctgggtgc ctgccagccc ttctttgtgc gatgcatcaa gcccaatgag 1920 ttcaagaagc ccatgctgtt cgaccggcac ctgtgcgtgc gccagctgcg gtactcagga 1980 atgatggaga ccatccgaat ccgccgagct ggctacccca tccgctacag cttcgtagag 2040 tttgtggagc ggtaccgtgt gctgctgcca ggtgtgaagc cggcctacaa gcagggcgac 2100 ctccgcggga cttgccagcg catggctgag gctgtgctgg gcacccacga tgactggcag 2160 ataggcaaaa ccaagatctt tctgaaggac caccatgaca tgctgctgga agtggagcgg 2220 gacaaagcca tcaccgacag agtcatcctc cttcagaaag tcatccgggg attcaaagac 2280 aggtctaact ttctgaagct gaagaacgct gccacactga tccagaggca ctggcggggt 2340 cacaactgta ggaagaacta cgggctgatg cgtctgggct tcctgcggct gcaggccctg 2400 caccgctccc ggaagctgca ccagcagtac cgcctggccc gccagcgcat catccagttc 2460 caggcccgct gccgcgccta tctggtgcgc aaggccttcc gccaccgcct ctgggctgtg 2520 ctcaccgtgc aggcctatgc ccggggcatg atcgcccgca ggctgcacca acgcctcagg 2580 gctgagtatc tgtggcgcct cgaggctgag aaaatgcggc tggcggagga agagaagctt 2640 cggaaggaga tgagcgccaa gaaggccaag gaggaggccg agcgcaagca tcaggagcgc 2700 ctggcccagc tggctcgtga ggacgctgag cgggagctga aggagaagga ggccgctcgg 2760 cggaagaagg agctcctgga gcagatggaa agggcccgcc atgagcctgt caatcactca 2820 gacatggtgg acaagatgtt tggcttcctg gggacttcag gtggcctgcc aggccaggag 2880 ggccaggcac ctagtggctt tgaggacctg gagcgagggc ggagggagat ggtggaggag 2940 gacctggatg cagccctgcc cctgcctgac gaggatgagg aggacctctc tgagtataaa 3000 tttgccaagt tcgcggccac ctacttccag gggacaacta cgcactccta cacccggcgg 3060 ccactcaaac agccactgct ctaccatgac gacgagggtg accagctggc agccctggcg 3120 gtctggatca ccatcctccg cttcatgggg gacctccctg agcccaagta ccacacagcc 3180 atgagtgatg gcagtgagaa gatccctgtg atgaccaaga tttatgagac cctgggcaag 3240 aagacgtaca agagggagct gcaggccctg cagggcgagg gcgaggccca gctccccgag 3300 ggccagaaga agagcagtgt gaggcacaag ctggtgcatt tgactctgaa aaagaagtcc 3360 aagctcacag aggaggtgac caagaggctg catgacgggg agtccacagt gcagggcaac 3420 agcatgctgg aggaccggcc cacctccaac ctggagaagc tgcacttcat catcggcaat 3480 ggcatcctgc ggccagcact ccgggacgag atctactgcc agatcagcaa gcagctgacc 3540 cacaacccct ccaagagcag ctatgcccgg ggctggattc tcgtgtctct ctgcgtgggc 3600 tgtttcgccc cctccgagaa gtttgtcaag tacctgcgga acttcatcca cgggggcccg 3660 cccggctacg ccccgtactg tgaggagcgc ctgagaagga cctttgtcaa tgggacacgg 3720 acacagccgc ccagctggct ggagctgcag gccaccaagt ccaagaagcc aatcatgttg 3780 cccgtgacat tcatggatgg gaccaccaag accctgctga cggactcggc aaccacggcc 3840 aaggagctct gcaacgcgct ggccgacaag atctctctca aggaccggtt cgggttctcc 3900 ctctacattg ccctgtttga caaggtgtcc tccctgggca gcggcagtga ccacgtcatg 3960 gacgccatct cccagtgcga gcagtacgcc aaggagcagg gcgcccagga gcgcaacgcc 4020 ccctggaggc tcttcttccg caaagaggtc ttcacgccct ggcacagccc ctccgaggac 4080 aacgtggcca ccaacctcat ctaccagcag gtggtgcgag gagtcaagtt tggggagtac 4140 aggtgtgaga aggaggacga cctggctgag ctggcctccc agcagtactt tgtagactat 4200 ggctctgaga tgatcctgga gcgcctcctg aacctcgtgc ccacctacat ccccgaccgc 4260 gagatcacgc ccctgaagac gctggagaag tgggcccagc tggccatcgc cgcccacaag 4320 aaggggattt atgcccagag gagaactgat gcccagaagg tcaaagagga tgtggtcagt 4380 tatgcccgct tcaagtggcc cttgctcttc tccaggtttt atgaagccta caaattctca 4440 ggccccagtc tccccaagaa cgacgtcatc gtggccgtca actggacggg tgtgtacttt 4500 gtggatgagc aggagcaggt acttctggag ctgtccttcc cagagatcat ggccgtgtcc 4560 agcagcaggg agtgccgtgt ctggctctca ctgggctgct ctgatcttgg ctgtgctgcg 4620 cctcactcag gctgggcagg actgaccccg gcggggccct gttctccgtg ttggtcctgc 4680 aggggagcga aaacgacggc ccccagcttc acgctggcca ccatcaaggg ggacgaatac 4740 accttcacct ccagtaatgc tgaggacatt cgtgacctgg tggtcacctt cctagagggg 4800 ctccggaaga gatctaagta tgttgtggcc ctgcaggata accccaaccc cgcaggcgag 4860 gagtcaggct tcctcagctt tgccaaggga gacctcatca tcctggacca tgacacgggc 4920 gagcaggtca tgaactcggg ctgggccaac ggcatcaatg agaggaccaa gcagcgtggg 4980 gacttcccca ccgactgtgt gtacgtcatg cccactgtca ccatgccacc tcgtgagatt 5040 gtggccctgg tcaccatgac tcccgatcag aggcaggacg ttgtccggct cttgcagctg 5100 cgaacggcgg agcccgaggt gcgtgccaag ccctacacgc tggaggagtt ttcctatgac 5160 tacttcaggc ccccacccaa gcacacgctg agccgtgtca tggtgtccaa ggcccgaggc 5220 aaggaccggc tgtggagcca cacgcgggaa ccgctcaagc aggcgctgct caagaagctc 5280 ctgggcagtg aggagctctc gcaggaggcc tgcctggcct tcattgctgt gctcaagtac 5340 atgggcgact acccgtccaa gaggacacgc tccgtcaatg agctcaccga ccagatcttt 5400 gagggtcccc tgaaagccga gcccctgaag gacgaggcat atgtgcagat cctgaagcag 5460 ctgaccgaca accacatcag gtacagcgag gagcggggtt gggagctgct ctggctgtgc 5520 acgggccttt tcccacccag caacatcctc ctgccccacg tgcagcgctt cctgcagtcc 5580 cgaaagcact gcccactcgc catcgactgc ctgcaacggc tccagaaagc cctgagaaac 5640 gggtcccgga agtaccctcc gcacctggtg gaggtggagg ccatccagca caagaccacc 5700 cagattttcc acaaggtcta cttccctgat gacactgacg aggccttcga agtggagtcc 5760 agcaccaagg ccaaggactt ctgccagaac atcgccacca ggctgctcct caagtcctca 5820 gagggattca gcctctttgt caaaattgca gacaaggtca tcagcgttcc tgagaatgac 5880 ttcttctttg actttgttcg acacttgaca gactggataa agaaagctcg gcccatcaag 5940 gacggaattg tgccctcact cacctaccag gtgttcttca tgaagaagct gtggaccacc 6000 acggtgccag ggaaggatcc catggccgat tccatcttcc actattacca ggagttgccc 6060 aagtatctcc gaggctacca caagtgcacg cgggaggagg tgctgcagct gggggcgctg 6120 atctacaggg tcaagttcga ggaggacaag tcctacttcc ccagcatccc caagctgctg 6180 cgggagctgg tgccccagga ccttatccgg caggtctcac ctgatgactg gaagcggtcc 6240 atcgtcgcct acttcaacaa gcacgcaggg aagtccaagg aggaggccaa gctggccttc 6300 ctgaagctca tcttcaagtg gcccaccttt ggctcagcct tcttcgaggt gaagcaaact 6360 acggagccaa acttccctga gatcctccta attgccatca acaagtatgg ggtcagcctc 6420 atcgatccca aaacgaagga tatcctcacc actcatccct tcaccaagat ctccaactgg 6480 agcagcggca acacctactt ccacatcacc attgggaact tggtgcgcgg gagcaaactg 6540 ctctgcgaga cgtcactggg ctacaagatg gatgacctcc tgacttccta cattagccag 6600 atgctcacag ccatgagcaa acagcggggc tccaggagcg gcaagtga 6648 <210> 12 <211> 3108 <212> DNA <213> Artificial Sequence <220> <223> example 5' end portion of a MYO7A transgene <400> 12 atggtgattc ttcagcaggg ggaccatgtg tggatggacc tgagattggg gcaggagttc 60 gacgtgccca tcggggcggt ggtgaagctc tgcgactctg ggcaggtcca ggtggtggat 120 gatgaagaca atgaacactg gatctctccg cagaacgcaa cgcacatcaa gcctatgcac 180 cccacgtcgg tccacggcgt ggaggacatg atccgcctgg gggacctcaa cgaggcgggc 240 atcttgcgca acctgcttat ccgctaccgg gaccacctca tctacacgta tacgggctcc 300 atcctggtgg ctgtgaaccc ctaccagctg ctctccatct actcgccaga gcacatccgc 360 cagtatacca acaagaagat tggggagatg cccccccaca tctttgccat tgctgacaac 420 tgctacttca acatgaaacg caacagccga gaccagtgct gcatcatcag tggggaatct 480 ggggccggga agacggagag cacaaagctg atcctgcagt tcctggcagc catcagtggg 540 cagcactcgt ggattgagca gcaggtcttg gaggccaccc ccattctgga agcatttggg 600 aatgccaaga ccatccgcaa tgacaactca agccgtttcg gaaagtacat cgacatccac 660 ttcaacaagc ggggcgccat cgagggcgcg aagattgagc agtacctgct ggaaaagtca 720 cgtgtctgtc gccaggccct ggatgaaagg aactaccacg tgttctactg catgctggag 780 ggcatgagtg aggatcagaa gaagaagctg ggcttgggcc aggcctctga ctacaactac 840 ttggccatgg gtaactgcat aacctgtgag ggccgggtgg acagccagga gtacgccaac 900 atccgctccg ccatgaaggt gctcatgttc actgacaccg agaactggga gatctcgaag 960 ctcctggctg ccatcctgca cctgggcaac ctgcagtatg aggcacgcac atttgaaaac 1020 ctggatgcct gtgaggttct cttctcccca tcgctggcca cagctgcatc cctgcttgag 1080 gtgaaccccc cagacctgat gagctgcctg actagccgca ccctcatcac ccgcggggag 1140 acggtgtcca ccccactgag cagggaacag gcactggacg tgcgcgacgc cttcgtaaag 1200 gggatctacg ggcggctgtt cgtgtggatt gtggacaaga tcaacgcagc aatttacaag 1260 cctccctccc aggatgtgaa gaactctcgc aggtccatcg gcctcctgga catctttggg 1320 tttgagaact ttgctgtgaa cagctttgag cagctctgca tcaacttcgc caatgagcac 1380 ctgcagcagt tctttgtgcg gcacgtgttc aagctggagc aggaggaata tgacctggag 1440 agcattgact ggctgcacat cgagttcact gacaaccagg atgccctgga catgattgcc 1500 aacaagccca tgaacatcat ctccctcatc gatgaggaga gcaagttccc caagggcaca 1560 gacaccacca tgttacacaa gctgaactcc cagcacaagc tcaacgccaa ctacatcccc 1620 cccaagaaca accatgagac ccagtttggc atcaaccatt ttgcaggcat cgtctactat 1680 gagacccaag gcttcctgga gaagaaccga gacaccctgc atggggacat tatccagctg 1740 gtccactcct ccaggaacaa gttcatcaag cagatcttcc aggccgatgt cgccatgggc 1800 gccgagacca ggaagcgctc gcccacactt agcagccagt tcaagcggtc actggagctg 1860 ctgatgcgca cgctgggtgc ctgccagccc ttctttgtgc gatgcatcaa gcccaatgag 1920 ttcaagaagc ccatgctgtt cgaccggcac ctgtgcgtgc gccagctgcg gtactcagga 1980 atgatggaga ccatccgaat ccgccgagct ggctacccca tccgctacag cttcgtagag 2040 tttgtggagc ggtaccgtgt gctgctgcca ggtgtgaagc cggcctacaa gcagggcgac 2100 ctccgcggga cttgccagcg catggctgag gctgtgctgg gcacccacga tgactggcag 2160 ataggcaaaa ccaagatctt tctgaaggac caccatgaca tgctgctgga agtggagcgg 2220 gacaaagcca tcaccgacag agtcatcctc cttcagaaag tcatccgggg attcaaagac 2280 aggtctaact ttctgaagct gaagaacgct gccacactga tccagaggca ctggcggggt 2340 cacaactgta ggaagaacta cgggctgatg cgtctgggct tcctgcggct gcaggccctg 2400 caccgctccc ggaagctgca ccagcagtac cgcctggccc gccagcgcat catccagttc 2460 caggcccgct gccgcgccta tctggtgcgc aaggccttcc gccaccgcct ctgggctgtg 2520 ctcaccgtgc aggcctatgc ccggggcatg atcgcccgca ggctgcacca acgcctcagg 2580 gctgagtatc tgtggcgcct cgaggctgag aaaatgcggc tggcggagga agagaagctt 2640 cggaaggaga tgagcgccaa gaaggccaag gaggaggccg agcgcaagca tcaggagcgc 2700 ctggcccagc tggctcgtga ggacgctgag cgggagctga aggagaagga ggccgctcgg 2760 cggaagaagg agctcctgga gcagatggaa agggcccgcc atgagcctgt caatcactca 2820 gacatggtgg acaagatgtt tggcttcctg gggacttcag gtggcctgcc aggccaggag 2880 ggccaggcac ctagtggctt tgaggacctg gagcgagggc ggagggagat ggtggaggag 2940 gacctggatg cagccctgcc cctgcctgac gaggatgagg aggacctctc tgagtataaa 3000 tttgccaagt tcgcggccac ctacttccag gggacaacta cgcactccta cacccggcgg 3060 ccactcaaac agccactgct ctaccatgac gacgagggtg accagctg 3108 <210> 13 <211> 3540 <212> DNA <213> Artificial Sequence <220> <223> example 3' end portion of a MYO7A transgene <400> 13 gcagccctgg cggtctggat caccatcctc cgcttcatgg gggacctccc tgagcccaag 60 taccacacag ccatgagtga tggcagtgag aagatccctg tgatgaccaa gatttatgag 120 accctgggca agaagacgta caagagggag ctgcaggccc tgcagggcga gggcgaggcc 180 cagctccccg agggccagaa gaagagcagt gtgaggcaca agctggtgca tttgactctg 240 aaaaagaagt ccaagctcac agaggaggtg accaagaggc tgcatgacgg ggagtccaca 300 gtgcagggca acagcatgct ggaggaccgg cccacctcca acctggagaa gctgcacttc 360 atcatcggca atggcatcct gcggccagca ctccgggacg agatctactg ccagatcagc 420 aagcagctga cccacaaccc ctccaagagc agctatgccc ggggctggat tctcgtgtct 480 ctctgcgtgg gctgtttcgc cccctccgag aagtttgtca agtacctgcg gaacttcatc 540 cacgggggcc cgcccggcta cgccccgtac tgtgaggagc gcctgagaag gacctttgtc 600 aatgggacac ggacacagcc gcccagctgg ctggagctgc aggccaccaa gtccaagaag 660 ccaatcatgt tgcccgtgac attcatggat gggaccacca agaccctgct gacggactcg 720 gcaaccacgg ccaaggagct ctgcaacgcg ctggccgaca agatctctct caaggaccgg 780 ttcgggttct ccctctacat tgccctgttt gacaaggtgt cctccctggg cagcggcagt 840 gaccacgtca tggacgccat ctcccagtgc gagcagtacg ccaaggagca gggcgcccag 900 gagcgcaacg ccccctggag gctcttcttc cgcaaagagg tcttcacgcc ctggcacagc 960 ccctccgagg acaacgtggc caccaacctc atctaccagc aggtggtgcg aggagtcaag 1020 tttggggagt acaggtgtga gaaggaggac gacctggctg agctggcctc ccagcagtac 1080 tttgtagact atggctctga gatgatcctg gagcgcctcc tgaacctcgt gcccacctac 1140 atccccgacc gcgagatcac gcccctgaag acgctggaga agtgggccca gctggccatc 1200 gccgcccaca agaaggggat ttatgcccag aggagaactg atgcccagaa ggtcaaagag 1260 gatgtggtca gttatgcccg cttcaagtgg cccttgctct tctccaggtt ttatgaagcc 1320 tacaaattct caggccccag tctccccaag aacgacgtca tcgtggccgt caactggacg 1380 ggtgtgtact ttgtggatga gcaggagcag gtacttctgg agctgtcctt cccagagatc 1440 atggccgtgt ccagcagcag ggagtgccgt gtctggctct cactgggctg ctctgatctt 1500 ggctgtgctg cgcctcactc aggctgggca ggactgaccc cggcggggcc ctgttctccg 1560 tgttggtcct gcaggggagc gaaaacgacg gcccccagct tcacgctggc caccatcaag 1620 ggggacgaat acaccttcac ctccagtaat gctgaggaca ttcgtgacct ggtggtcacc 1680 ttcctagagg ggctccggaa gagatctaag tatgttgtgg ccctgcagga taaccccaac 1740 cccgcaggcg aggagtcagg cttcctcagc tttgccaagg gagacctcat catcctggac 1800 catgacacgg gcgagcaggt catgaactcg ggctgggcca acggcatcaa tgagaggacc 1860 aagcagcgtg gggacttccc caccgactgt gtgtacgtca tgcccactgt caccatgcca 1920 cctcgtgaga ttgtggccct ggtcaccatg actcccgatc agaggcagga cgttgtccgg 1980 ctcttgcagc tgcgaacggc ggagcccgag gtgcgtgcca agccctacac gctggaggag 2040 ttttcctatg actacttcag gcccccaccc aagcacacgc tgagccgtgt catggtgtcc 2100 aaggcccgag gcaaggaccg gctgtggagc cacacgcggg aaccgctcaa gcaggcgctg 2160 ctcaagaagc tcctgggcag tgaggagctc tcgcaggagg cctgcctggc cttcattgct 2220 gtgctcaagt acatgggcga ctacccgtcc aagaggacac gctccgtcaa tgagctcacc 2280 gaccagatct ttgagggtcc cctgaaagcc gagcccctga aggacgaggc atatgtgcag 2340 atcctgaagc agctgaccga caaccacatc aggtacagcg aggagcgggg ttgggagctg 2400 ctctggctgt gcacgggcct tttcccaccc agcaacatcc tcctgcccca cgtgcagcgc 2460 ttcctgcagt cccgaaagca ctgcccactc gccatcgact gcctgcaacg gctccagaaa 2520 gccctgagaa acgggtcccg gaagtaccct ccgcacctgg tggaggtgga ggccatccag 2580 cacaagacca cccagatttt ccacaaggtc tacttccctg atgacactga cgaggccttc 2640 gaagtggagt ccagcaccaa ggccaaggac ttctgccaga acatcgccac caggctgctc 2700 ctcaagtcct cagagggatt cagcctcttt gtcaaaattg cagacaaggt catcagcgtt 2760 cctgagaatg acttcttctt tgactttgtt cgacacttga cagactggat aaagaaagct 2820 cggcccatca aggacggaat tgtgccctca ctcacctacc aggtgttctt catgaagaag 2880 ctgtggacca ccacggtgcc agggaaggat cccatggccg attccatctt ccactattac 2940 caggagttgc ccaagtatct ccgaggctac cacaagtgca cgcgggagga ggtgctgcag 3000 ctgggggcgc tgatctacag ggtcaagttc gaggaggaca agtcctactt ccccagcatc 3060 cccaagctgc tgcgggagct ggtgccccag gaccttatcc ggcaggtctc acctgatgac 3120 tggaagcggt ccatcgtcgc ctacttcaac aagcacgcag ggaagtccaa ggaggaggcc 3180 aagctggcct tcctgaagct catcttcaag tggcccacct ttggctcagc cttcttcgag 3240 gtgaagcaaa ctacggagcc aaacttccct gagatcctcc taattgccat caacaagtat 3300 ggggtcagcc tcatcgatcc caaaacgaag gatatcctca ccactcatcc cttcaccaag 3360 atctccaact ggagcagcgg caacacctac ttccacatca ccattgggaa cttggtgcgc 3420 gggagcaaac tgctctgcga gacgtcactg ggctacaaga tggatgacct cctgacttcc 3480 tacattagcc agatgctcac agccatgagc aaacagcggg gctccaggag cggcaagtga 3540 <210> 14 <211> 4488 <212> DNA <213> Artificial Sequence <220> <223> vector <400> 14 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatcc ttatcgggaa ttcgccctta agctagcgtg ccacctggtc gacattgatt 240 attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc catatatgga 300 gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca acgacccccg 360 cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga ctttccattg 420 acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc aagtgtatca 480 tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc 540 ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat tagtcatcgc 600 tattaccatg gtcgaggtga gccccacgtt ctgcttcact ctccccatct cccccccctc 660 cccaccccca attttgtatt tatttatttt ttaattattt tgtgcagcga tgggggcggg 720 gcggggcgag gcggagaggt gcggcggcag ccaatcggag cggcgcgctc cgaaagtttc 780 cttttatggc gaggcggcgg cggcggcggc tctataaaaa gcgaagcgcg cggcgggcgg 840 ctgcagaagt tggtcgtgag gcactgggca gctctaaggt aaatataaaa tttttaagtg 900 tataatgtgt taaactactg attctaattg tttctctctt ttagattcca acctttggaa 960 ctgagtgtcc aggcggccgc catggtgatt cttcagcagg gggaccatgt gtggatggac 1020 ctgagattgg ggcaggagtt cgacgtgccc atcggggcgg tggtgaagct ctgcgactct 1080 gggcaggtcc aggtggtgga tgatgaagac aatgaacact ggatctctcc gcagaacgca 1140 acgcacatca agcctatgca ccccacgtcg gtccacggcg tggaggacat gatccgcctg 1200 ggggacctca acgaggcggg catcttgcgc aacctgctta tccgctaccg ggaccacctc 1260 atctacacgt atacgggctc catcctggtg gctgtgaacc cctaccagct gctctccatc 1320 tactcgccag agcacatccg ccagtatacc aacaagaaga ttggggagat gcccccccac 1380 atctttgcca ttgctgacaa ctgctacttc aacatgaaac gcaacagccg agaccagtgc 1440 tgcatcatca gtggggaatc tggggccggg aagacggaga gcacaaagct gatcctgcag 1500 ttcctggcag ccatcagtgg gcagcactcg tggattgagc agcaggtctt ggaggccacc 1560 cccattctgg aagcatttgg gaatgccaag accatccgca atgacaactc aagccgtttc 1620 ggaaagtaca tcgacatcca cttcaacaag cggggcgcca tcgagggcgc gaagattgag 1680 cagtacctgc tggaaaagtc acgtgtctgt cgccaggccc tggatgaaag gaactaccac 1740 gtgttctact gcatgctgga gggcatgagt gaggatcaga agaagaagct gggcttgggc 1800 caggcctctg actacaacta cttggccatg ggtaactgca taacctgtga gggccgggtg 1860 gacagccagg agtacgccaa catccgctcc gccatgaagg tgctcatgtt cactgacacc 1920 gagaactggg agatctcgaa gctcctggct gccatcctgc acctgggcaa cctgcagtat 1980 gaggcacgca catttgaaaa cctggatgcc tgtgaggttc tcttctcccc atcgctggcc 2040 acagctgcat ccctgcttga ggtgaacccc ccagacctga tgagctgcct gactagccgc 2100 accctcatca cccgcgggga gacggtgtcc accccactga gcagggaaca ggcactggac 2160 gtgcgcgacg ccttcgtaaa ggggatctac gggcggctgt tcgtgtggat tgtggacaag 2220 atcaacgcag caatttacaa gcctccctcc caggatgtga agaactctcg caggtccatc 2280 ggcctcctgg acatctttgg gtttgagaac tttgctgtga acagctttga gcagctctgc 2340 atcaacttcg ccaatgagca cctgcagcag ttctttgtgc ggcacgtgtt caagctggag 2400 caggaggaat atgacctgga gagcattgac tggctgcaca tcgagttcac tgacaaccag 2460 gatgccctgg acatgattgc caacaagccc atgaacatca tctccctcat cgatgaggag 2520 agcaagttcc ccaagggcac agacaccacc atgttacaca agctgaactc ccagcacaag 2580 ctcaacgcca actacatccc ccccaagaac aaccatgaga cccagtttgg catcaaccat 2640 tttgcaggca tcgtctacta tgagacccaa ggcttcctgg agaagaaccg agacaccctg 2700 catggggaca ttatccagct ggtccactcc tccaggaaca agttcatcaa gcagatcttc 2760 caggccgatg tcgccatggg cgccgagacc aggaagcgct cgcccacact tagcagccag 2820 ttcaagcggt cactggagct gctgatgcgc acgctgggtg cctgccagcc cttctttgtg 2880 cgatgcatca agcccaatga gttcaagaag cccatgctgt tcgaccggca cctgtgcgtg 2940 cgccagctgc ggtactcagg aatgatggag accatccgaa tccgccgagc tggctacccc 3000 atccgctaca gcttcgtaga gtttgtggag cggtaccgtg tgctgctgcc aggtgtgaag 3060 ccggcctaca agcagggcga cctccgcggg acttgccagc gcatggctga ggctgtgctg 3120 ggcacccacg atgactggca gataggcaaa accaagatct ttctgaagga ccaccatgac 3180 atgctgctgg aagtggagcg ggacaaagcc atcaccgaca gagtcatcct ccttcagaaa 3240 gtcatccggg gattcaaaga caggtctaac tttctgaagc tgaagaacgc tgccacactg 3300 atccagaggc actggcgggg tcacaactgt aggaagaact acgggctgat gcgtctgggc 3360 ttcctgcggc tgcaggccct gcaccgctcc cggaagctgc accagcagta ccgcctggcc 3420 cgccagcgca tcatccagtt ccaggcccgc tgccgcgcct atctggtgcg caaggccttc 3480 cgccaccgcc tctgggctgt gctcaccgtg caggcctatg cccggggcat gatcgcccgc 3540 aggctgcacc aacgcctcag ggctgagtat ctgtggcgcc tcgaggctga gaaaatgcgg 3600 ctggcggagg aagagaagct tcggaaggag atgagcgcca agaaggccaa ggaggaggcc 3660 gagcgcaagc atcaggagcg cctggcccag ctggctcgtg aggacgctga gcgggagctg 3720 aaggagaagg aggccgctcg gcggaagaag gagctcctgg agcagatgga aagggcccgc 3780 catgagcctg tcaatcactc agacatggtg gacaagatgt ttggcttcct ggggacttca 3840 ggtggcctgc caggccagga gggccaggca cctagtggct ttgaggacct ggagcgaggg 3900 cggagggaga tggtggagga ggacctggat gcagccctgc ccctgcctga cgaggatgag 3960 gaggacctct ctgagtataa atttgccaag ttcgcggcca cctacttcca ggggacaact 4020 acgcactcct acacccggcg gccactcaaa cagccactgc tctaccatga cgacgagggt 4080 gaccagctgg taagtatcaa ggttacaaga caggtttaag gagaccaata gaaactgggc 4140 ttgtcgagac agagaagact cttgcgtttc tgggattttt ccgatttcgg cctattggtt 4200 aaaaaatgag ctgatttaac aaaaatttaa cgcgaatttt aacaaaatat taacgtttat 4260 aatttcaggt ggcatctttc caattgaagg gcgaattccg atcttcctag agcatggcta 4320 cgtagataag tagcatggcg ggttaatcat taactacaag gaacccctag tgatggagtt 4380 ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg 4440 acgcccgggc tttgcccggg cggcctcagt gagcgagcga gcgcgcag 4488 <210> 15 <211> 4383 <212> DNA <213> Artificial Sequence <220> <223> vector <400> 15 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatcg gaattcgccc ttatatgatc agggattttt ccgatttcgg cctattggtt 240 aaaaaatgag ctgatttaac aaaaatttaa cgcgaatttt aacaaaatat taacgtttat 300 aatttcaggt ggcatctttc gataggcacc tattggtctt actgacatcc actttgcctt 360 tctctccaca ggcagccctg gcggtctgga tcaccatcct ccgcttcatg ggggacctcc 420 ctgagcccaa gtaccacaca gccatgagtg atggcagtga gaagatccct gtgatgacca 480 agatttatga gaccctgggc aagaagacgt acaagaggga gctgcaggcc ctgcagggcg 540 agggcgaggc ccagctcccc gagggccaga agaagagcag tgtgaggcac aagctggtgc 600 atttgactct gaaaaagaag tccaagctca cagaggaggt gaccaagagg ctgcatgacg 660 gggagtccac agtgcagggc aacagcatgc tggaggaccg gcccacctcc aacctggaga 720 agctgcactt catcatcggc aatggcatcc tgcggccagc actccgggac gagatctact 780 gccagatcag caagcagctg acccacaacc cctccaagag cagctatgcc cggggctgga 840 ttctcgtgtc tctctgcgtg ggctgtttcg ccccctccga gaagtttgtc aagtacctgc 900 ggaacttcat ccacgggggc ccgcccggct acgccccgta ctgtgaggag cgcctgagaa 960 ggacctttgt caatgggaca cggacacagc cgcccagctg gctggagctg caggccacca 1020 agtccaagaa gccaatcatg ttgcccgtga cattcatgga tgggaccacc aagaccctgc 1080 tgacggactc ggcaaccacg gccaaggagc tctgcaacgc gctggccgac aagatctctc 1140 tcaaggaccg gttcgggttc tccctctaca ttgccctgtt tgacaaggtg tcctccctgg 1200 gcagcggcag tgaccacgtc atggacgcca tctcccagtg cgagcagtac gccaaggagc 1260 agggcgccca ggagcgcaac gccccctgga ggctcttctt ccgcaaagag gtcttcacgc 1320 cctggcacag cccctccgag gacaacgtgg ccaccaacct catctaccag caggtggtgc 1380 gaggagtcaa gtttggggag tacaggtgtg agaaggagga cgacctggct gagctggcct 1440 cccagcagta ctttgtagac tatggctctg agatgatcct ggagcgcctc ctgaacctcg 1500 tgcccaccta catccccgac cgcgagatca cgcccctgaa gacgctggag aagtgggccc 1560 agctggccat cgccgcccac aagaagggga tttatgccca gaggagaact gatgcccaga 1620 aggtcaaaga ggatgtggtc agttatgccc gcttcaagtg gcccttgctc ttctccaggt 1680 tttatgaagc ctacaaattc tcaggcccca gtctccccaa gaacgacgtc atcgtggccg 1740 tcaactggac gggtgtgtac tttgtggatg agcaggagca ggtacttctg gagctgtcct 1800 tcccagagat catggccgtg tccagcagca gggagtgccg tgtctggctc tcactgggct 1860 gctctgatct tggctgtgct gcgcctcact caggctgggc aggactgacc ccggcggggc 1920 cctgttctcc gtgttggtcc tgcaggggag cgaaaacgac ggcccccagc ttcacgctgg 1980 ccaccatcaa gggggacgaa tacaccttca cctccagtaa tgctgaggac attcgtgacc 2040 tggtggtcac cttcctagag gggctccgga agagatctaa gtatgttgtg gccctgcagg 2100 ataaccccaa ccccgcaggc gaggagtcag gcttcctcag ctttgccaag ggagacctca 2160 tcatcctgga ccatgacacg ggcgagcagg tcatgaactc gggctgggcc aacggcatca 2220 atgagaggac caagcagcgt ggggacttcc ccaccgactg tgtgtacgtc atgcccactg 2280 tcaccatgcc acctcgtgag attgtggccc tggtcaccat gactcccgat cagaggcagg 2340 acgttgtccg gctcttgcag ctgcgaacgg cggagcccga ggtgcgtgcc aagccctaca 2400 cgctggagga gttttcctat gactacttca ggcccccacc caagcacacg ctgagccgtg 2460 tcatggtgtc caaggcccga ggcaaggacc ggctgtggag ccacacgcgg gaaccgctca 2520 agcaggcgct gctcaagaag ctcctgggca gtgaggagct ctcgcaggag gcctgcctgg 2580 ccttcattgc tgtgctcaag tacatgggcg actacccgtc caagaggaca cgctccgtca 2640 atgagctcac cgaccagatc tttgagggtc ccctgaaagc cgagcccctg aaggacgagg 2700 catatgtgca gatcctgaag cagctgaccg acaaccacat caggtacagc gaggagcggg 2760 gttgggagct gctctggctg tgcacgggcc ttttcccacc cagcaacatc ctcctgcccc 2820 acgtgcagcg cttcctgcag tcccgaaagc actgcccact cgccatcgac tgcctgcaac 2880 ggctccagaa agccctgaga aacgggtccc ggaagtaccc tccgcacctg gtggaggtgg 2940 aggccatcca gcacaagacc acccagattt tccacaaggt ctacttccct gatgacactg 3000 acgaggcctt cgaagtggag tccagcacca aggccaagga cttctgccag aacatcgcca 3060 ccaggctgct cctcaagtcc tcagagggat tcagcctctt tgtcaaaatt gcagacaagg 3120 tcatcagcgt tcctgagaat gacttcttct ttgactttgt tcgacacttg acagactgga 3180 taaagaaagc tcggcccatc aaggacggaa ttgtgccctc actcacctac caggtgttct 3240 tcatgaagaa gctgtggacc accacggtgc cagggaagga tcccatggcc gattccatct 3300 tccactatta ccaggagttg cccaagtatc tccgaggcta ccacaagtgc acgcgggagg 3360 aggtgctgca gctgggggcg ctgatctaca gggtcaagtt cgaggaggac aagtcctact 3420 tccccagcat ccccaagctg ctgcgggagc tggtgcccca ggaccttatc cggcaggtct 3480 cacctgatga ctggaagcgg tccatcgtcg cctacttcaa caagcacgca gggaagtcca 3540 aggaggaggc caagctggcc ttcctgaagc tcatcttcaa gtggcccacc tttggctcag 3600 ccttcttcga ggtgaagcaa actacggagc caaacttccc tgagatcctc ctaattgcca 3660 tcaacaagta tggggtcagc ctcatcgatc ccaaaacgaa ggatatcctc accactcatc 3720 ccttcaccaa gatctccaac tggagcagcg gcaacaccta cttccacatc accattggga 3780 acttggtgcg cgggagcaaa ctgctctgcg agacgtcact gggctacaag atggatgacc 3840 tcctgacttc ctacattagc cagatgctca cagccatgag caaacagcgg ggctccagga 3900 gcggcaagtg accgcggcct gctgccggct ctgcggcctc ttccgcgtct tcgagatctg 3960 cctcgactgt gccttctagt tgccagccat ctgttgtttg cccctccccc gtgccttcct 4020 tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa attgcatcgc 4080 attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac agcaaggggg 4140 aggattggga agacaatagc aggcatgctg gggactcgag caattcccga taaggatctt 4200 cctagagcat ggctacgtag ataagtagca tggcgggtta atcattaact acaaggaacc 4260 cctagtgatg gagttggcca ctccctctct gcgcgctcgc tcgctcactg aggccgggcg 4320 accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg agcgagcgcg 4380 cag 4383 <210> 16 <211> 133 <212> DNA <213> Artificial Sequence <220> <223> chimeric intron <400> 16 gtaagtatca aggttacaag acaggtttaa ggagaccaat agaaactggg cttgtcgaga 60 cagagaagac tcttgcgttt ctgataggca cctattggtc ttactgacat ccactttgcc 120 tttctctcca cag 133 <210> 17 <211> 82 <212> DNA <213> Artificial Sequence <220> <223> Splicing donor (SD) sequence <400> 17 gtaagtatca aggttacaag acaggtttaa ggagaccaat agaaactggg cttgtcgaga 60 cagagaagac tcttgcgttt ct 82 <210> 18 <211> 82 <212> DNA <213> Artificial Sequence <220> <223> splice donor <400> 18 gtaagtatca aggttacaag acaggtttaa ggagaccaat agaaactggg cttgtcgaga 60 cagagaagac tcttgcgttt ct 82 <210> 19 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> splice acceptor <400> 19 gataggcacc tattggtctt actgacatcc actttgcctt tctctccaca g 51 <210> 20 <211> 77 <212> DNA <213> Artificial Sequence <220> <223> AK sequence <400> 20 gggatttttc cgatttcggc ctattggtta aaaaatgagc tgatttaaca aaaatttaac 60 gcgaatttta acaaaat 77 <210> 21 <211> 4540 <212> DNA <213> Artificial Sequence <220> <223> 5'CMV-ABCA4-AK <400> 21 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240 atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300 gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat 360 caattacggg gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg 420 taaatggccc gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt 480 atgttcccat agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac 540 ggtaaactgc ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg 600 acgtcaatga cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact 660 ttcctacttg gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt 720 ggcagtacac caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc 780 ccattgacgt caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc 840 gtaataaccc cgccccgttg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata 900 taagcagagc tcgtttagtg aaccgtcaga tcactagaag ctttattgcg gtagtttatc 960 acagttaaat tgctaacgca gtcagtgctt ctgacacaac agtctcgaac ttaagctgca 1020 gaagttggtc gtgaggcact gggcaggtaa gtatcaaggt tacaagacag gtttaaggag 1080 accaatagaa actgggcttg tcgagacaga gaagactctt gcgtttctga taggcaccta 1140 ttggtcttac tgacatccac tttgcctttc tctccacagg tgtccactcc cagttcaatt 1200 acagctctta aggctagagt acttaatacg actcactata ggctagcctc gagaattcac 1260 gcgtggtacc tctagagtcg acccgggcgg ccgccatggg cttcgtgaga cagatacagc 1320 ttttgctctg gaagaactgg accctgcgga aaaggcaaaa gattcgcttt gtggtggaac 1380 tcgtgtggcc tttatcttta tttctggtct tgatctggtt aaggaatgcc aacccgctct 1440 acagccatca tgaatgccat ttccccaaca aggcgatgcc ctcagcagga atgctgccgt 1500 ggctccaggg gatcttctgc aatgtgaaca atccctgttt tcaaagcccc accccaggag 1560 aatctcctgg aattgtgtca aactataaca actccatctt ggcaagggta tatcgagatt 1620 ttcaagaact cctcatgaat gcaccagaga gccagcacct tggccgtatt tggacagagc 1680 tacacatctt gtcccaattc atggacaccc tccggactca cccggagaga attgcaggaa 1740 gaggaattcg aataagggat atcttgaaag atgaagaaac actgacacta tttctcatta 1800 aaaacatcgg cctgtctgac tcagtggtct accttctgat caactctcaa gtccgtccag 1860 agcagttcgc tcatggagtc ccggacctgg cgctgaagga catcgcctgc agcgaggccc 1920 tcctggagcg cttcatcatc ttcagccaga gacgcggggc aaagacggtg cgctatgccc 1980 tgtgctccct ctcccagggc accctacagt ggatagaaga cactctgtat gccaacgtgg 2040 acttcttcaa gctcttccgt gtgcttccca cactcctaga cagccgttct caaggtatca 2100 atctgagatc ttggggagga atattatctg atatgtcacc aagaattcaa gagtttatcc 2160 atcggccgag tatgcaggac ttgctgtggg tgaccaggcc cctcatgcag aatggtggtc 2220 cagagacctt tacaaagctg atgggcatcc tgtctgacct cctgtgtggc taccccgagg 2280 gaggtggctc tcgggtgctc tccttcaact ggtatgaaga caataactat aaggcctttc 2340 tggggattga ctccacaagg aaggatccta tctattctta tgacagaaga acaacatcct 2400 tttgtaatgc attgatccag agcctggagt caaatccttt aaccaaaatc gcttggaggg 2460 cggcaaagcc tttgctgatg ggaaaaatcc tgtacactcc tgattcacct gcagcacgaa 2520 ggatactgaa gaatgccaac tcaacttttg aagaactgga acacgttagg aagttggtca 2580 aagcctggga agaagtaggg ccccagatct ggtacttctt tgacaacagc acacagatga 2640 acatgatcag agataccctg gggaacccaa cagtaaaaga ctttttgaat aggcagcttg 2700 gtgaagaagg tattactgct gaagccatcc taaacttcct ctacaagggc cctcgggaaa 2760 gccaggctga cgacatggcc aacttcgact ggagggacat atttaacatc actgatcgca 2820 ccctccgcct tgtcaatcaa tacctggagt gcttggtcct ggataagttt gaaagctaca 2880 atgatgaaac tcagctcacc caacgtgccc tctctctact ggaggaaaac atgttctggg 2940 ccggagtggt attccctgac atgtatccct ggaccagctc tctaccaccc cacgtgaagt 3000 ataagatccg aatggacata gacgtggtgg agaaaaccaa taagattaaa gacaggtatt 3060 gggattctgg tcccagagct gatcccgtgg aagatttccg gtacatctgg ggcgggtttg 3120 cctatctgca ggacatggtt gaacagggga tcacaaggag ccaggtgcag gcggaggctc 3180 cagttggaat ctacctccag cagatgccct acccctgctt cgtggacgat tctttcatga 3240 tcatcctgaa ccgctgtttc cctatcttca tggtgctggc atggatctac tctgtctcca 3300 tgactgtgaa gagcatcgtc ttggagaagg agttgcgact gaaggagacc ttgaaaaatc 3360 agggtgtctc caatgcagtg atttggtgta cctggttcct ggacagcttc tccatcatgt 3420 cgatgagcat cttcctcctg acgatattca tcatgcatgg aagaatccta cattacagcg 3480 acccattcat cctcttcctg ttcttgttgg ctttctccac tgccaccatc atgctgtgct 3540 ttctgctcag caccttcttc tccaaggcca gtctggcagc agcctgtagt ggtgtcatct 3600 atttcaccct ctacctgcca cacatcctgt gcttcgcctg gcaggaccgc atgaccgctg 3660 agctgaagaa ggctgtgagc ttactgtctc cggtggcatt tggatttggc actgagtacc 3720 tggttcgctt tgaagagcaa ggcctggggc tgcagtggag caacatcggg aacagtccca 3780 cggaagggga cgaattcagc ttcctgctgt ccatgcagat gatgctcctt gatgctgctg 3840 tctatggctt actcgcttgg taccttgatc aggtgtttcc aggagactat ggaaccccac 3900 ttccttggta ctttcttcta caagagtcgt attggcttgg cggtgaaggg tgttcaacca 3960 gagaagaaag agccctggaa aagaccgagc ccctaacaga ggaaacggag gatccagagc 4020 acccagaagg aatacacgac tccttctttg aacgtgagca tccagggtgg gttcctgggg 4080 tatgcgtgaa gaatctggta aagatttttg agccctgtgg ccggccagct gtggaccgtc 4140 tgaacatcac cttctacgag aaccagatca ccgcattcct gggccacaat ggagctggga 4200 aaaccaccac cttgtaagta tcaaggttac aagacaggtt taaggagacc aatagaaact 4260 gggcttgtcg agacagagaa gactcttgcg tttctgggat ttttccgatt tcggcctatt 4320 ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgt 4380 ttataatttc aggtggcatc tttccaattg aggaacccct agtgatggag ttggccactc 4440 cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg 4500 gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag 4540 <210> 22 <211> 4431 <212> DNA <213> Artificial Sequence <220> <223> 5'CMV-ABCA4-TS <400> 22 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240 atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300 gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat 360 caattacggg gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg 420 taaatggccc gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt 480 atgttcccat agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac 540 ggtaaactgc ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg 600 acgtcaatga cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact 660 ttcctacttg gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt 720 ggcagtacac caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc 780 ccattgacgt caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc 840 gtaataaccc cgccccgttg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata 900 taagcagagc tcgtttagtg aaccgtcaga tcactagaag ctttattgcg gtagtttatc 960 acagttaaat tgctaacgca gtcagtgctt ctgacacaac agtctcgaac ttaagctgca 1020 gaagttggtc gtgaggcact gggcaggtaa gtatcaaggt tacaagacag gtttaaggag 1080 accaatagaa actgggcttg tcgagacaga gaagactctt gcgtttctga taggcaccta 1140 ttggtcttac tgacatccac tttgcctttc tctccacagg tgtccactcc cagttcaatt 1200 acagctctta aggctagagt acttaatacg actcactata ggctagcctc gagaattcac 1260 gcgtggtacc tctagagtcg acccgggcgg ccgccatggg cttcgtgaga cagatacagc 1320 ttttgctctg gaagaactgg accctgcgga aaaggcaaaa gattcgcttt gtggtggaac 1380 tcgtgtggcc tttatcttta tttctggtct tgatctggtt aaggaatgcc aacccgctct 1440 acagccatca tgaatgccat ttccccaaca aggcgatgcc ctcagcagga atgctgccgt 1500 ggctccaggg gatcttctgc aatgtgaaca atccctgttt tcaaagcccc accccaggag 1560 aatctcctgg aattgtgtca aactataaca actccatctt ggcaagggta tatcgagatt 1620 ttcaagaact cctcatgaat gcaccagaga gccagcacct tggccgtatt tggacagagc 1680 tacacatctt gtcccaattc atggacaccc tccggactca cccggagaga attgcaggaa 1740 gaggaattcg aataagggat atcttgaaag atgaagaaac actgacacta tttctcatta 1800 aaaacatcgg cctgtctgac tcagtggtct accttctgat caactctcaa gtccgtccag 1860 agcagttcgc tcatggagtc ccggacctgg cgctgaagga catcgcctgc agcgaggccc 1920 tcctggagcg cttcatcatc ttcagccaga gacgcggggc aaagacggtg cgctatgccc 1980 tgtgctccct ctcccagggc accctacagt ggatagaaga cactctgtat gccaacgtgg 2040 acttcttcaa gctcttccgt gtgcttccca cactcctaga cagccgttct caaggtatca 2100 atctgagatc ttggggagga atattatctg atatgtcacc aagaattcaa gagtttatcc 2160 atcggccgag tatgcaggac ttgctgtggg tgaccaggcc cctcatgcag aatggtggtc 2220 cagagacctt tacaaagctg atgggcatcc tgtctgacct cctgtgtggc taccccgagg 2280 gaggtggctc tcgggtgctc tccttcaact ggtatgaaga caataactat aaggcctttc 2340 tggggattga ctccacaagg aaggatccta tctattctta tgacagaaga acaacatcct 2400 tttgtaatgc attgatccag agcctggagt caaatccttt aaccaaaatc gcttggaggg 2460 cggcaaagcc tttgctgatg ggaaaaatcc tgtacactcc tgattcacct gcagcacgaa 2520 ggatactgaa gaatgccaac tcaacttttg aagaactgga acacgttagg aagttggtca 2580 aagcctggga agaagtaggg ccccagatct ggtacttctt tgacaacagc acacagatga 2640 acatgatcag agataccctg gggaacccaa cagtaaaaga ctttttgaat aggcagcttg 2700 gtgaagaagg tattactgct gaagccatcc taaacttcct ctacaagggc cctcgggaaa 2760 gccaggctga cgacatggcc aacttcgact ggagggacat atttaacatc actgatcgca 2820 ccctccgcct tgtcaatcaa tacctggagt gcttggtcct ggataagttt gaaagctaca 2880 atgatgaaac tcagctcacc caacgtgccc tctctctact ggaggaaaac atgttctggg 2940 ccggagtggt attccctgac atgtatccct ggaccagctc tctaccaccc cacgtgaagt 3000 ataagatccg aatggacata gacgtggtgg agaaaaccaa taagattaaa gacaggtatt 3060 gggattctgg tcccagagct gatcccgtgg aagatttccg gtacatctgg ggcgggtttg 3120 cctatctgca ggacatggtt gaacagggga tcacaaggag ccaggtgcag gcggaggctc 3180 cagttggaat ctacctccag cagatgccct acccctgctt cgtggacgat tctttcatga 3240 tcatcctgaa ccgctgtttc cctatcttca tggtgctggc atggatctac tctgtctcca 3300 tgactgtgaa gagcatcgtc ttggagaagg agttgcgact gaaggagacc ttgaaaaatc 3360 agggtgtctc caatgcagtg atttggtgta cctggttcct ggacagcttc tccatcatgt 3420 cgatgagcat cttcctcctg acgatattca tcatgcatgg aagaatccta cattacagcg 3480 acccattcat cctcttcctg ttcttgttgg ctttctccac tgccaccatc atgctgtgct 3540 ttctgctcag caccttcttc tccaaggcca gtctggcagc agcctgtagt ggtgtcatct 3600 atttcaccct ctacctgcca cacatcctgt gcttcgcctg gcaggaccgc atgaccgctg 3660 agctgaagaa ggctgtgagc ttactgtctc cggtggcatt tggatttggc actgagtacc 3720 tggttcgctt tgaagagcaa ggcctggggc tgcagtggag caacatcggg aacagtccca 3780 cggaagggga cgaattcagc ttcctgctgt ccatgcagat gatgctcctt gatgctgctg 3840 tctatggctt actcgcttgg taccttgatc aggtgtttcc aggagactat ggaaccccac 3900 ttccttggta ctttcttcta caagagtcgt attggcttgg cggtgaaggg tgttcaacca 3960 gagaagaaag agccctggaa aagaccgagc ccctaacaga ggaaacggag gatccagagc 4020 acccagaagg aatacacgac tccttctttg aacgtgagca tccagggtgg gttcctgggg 4080 tatgcgtgaa gaatctggta aagatttttg agccctgtgg ccggccagct gtggaccgtc 4140 tgaacatcac cttctacgag aaccagatca ccgcattcct gggccacaat ggagctggga 4200 aaaccaccac cttgtaagta tcaaggttac aagacaggtt taaggagacc aatagaaact 4260 gggcttgtcg agacagagaa gactcttgcg tttctcaatt gaggaacccc tagtgatgga 4320 gttggccact ccctctctgc gcgctcgctc gctcactgag gccgggcgac caaaggtcgc 4380 ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgca g 4431 <210> 23 <211> 4536 <212> DNA <213> Artificial Sequence <220> <223> 5'CMV NO INTRON ABCA4 OV <400> 23 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240 atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300 gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat 360 caattacggg gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg 420 taaatggccc gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt 480 atgttcccat agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac 540 ggtaaactgc ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg 600 acgtcaatga cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact 660 ttcctacttg gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt 720 ggcagtacac caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc 780 ccattgacgt caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc 840 gtaataaccc cgccccgttg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata 900 taagcagagc tcggcggccg ccatgggctt cgtgagacag atacagcttt tgctctggaa 960 gaactggacc ctgcggaaaa ggcaaaagat tcgctttgtg gtggaactcg tgtggccttt 1020 atctttattt ctggtcttga tctggttaag gaatgccaac ccgctctaca gccatcatga 1080 atgccatttc cccaacaagg cgatgccctc agcaggaatg ctgccgtggc tccaggggat 1140 cttctgcaat gtgaacaatc cctgttttca aagccccacc ccaggagaat ctcctggaat 1200 tgtgtcaaac tataacaact ccatcttggc aagggtatat cgagattttc aagaactcct 1260 catgaatgca ccagagagcc agcaccttgg ccgtatttgg acagagctac acatcttgtc 1320 ccaattcatg gacaccctcc ggactcaccc ggagagaatt gcaggaagag gaattcgaat 1380 aagggatatc ttgaaagatg aagaaacact gacactattt ctcattaaaa acatcggcct 1440 gtctgactca gtggtctacc ttctgatcaa ctctcaagtc cgtccagagc agttcgctca 1500 tggagtcccg gacctggcgc tgaaggacat cgcctgcagc gaggccctcc tggagcgctt 1560 catcatcttc agccagagac gcggggcaaa gacggtgcgc tatgccctgt gctccctctc 1620 ccagggcacc ctacagtgga tagaagacac tctgtatgcc aacgtggact tcttcaagct 1680 cttccgtgtg cttcccacac tcctagacag ccgttctcaa ggtatcaatc tgagatcttg 1740 gggaggaata ttatctgata tgtcaccaag aattcaagag tttatccatc ggccgagtat 1800 gcaggacttg ctgtgggtga ccaggcccct catgcagaat ggtggtccag agacctttac 1860 aaagctgatg ggcatcctgt ctgacctcct gtgtggctac cccgagggag gtggctctcg 1920 ggtgctctcc ttcaactggt atgaagacaa taactataag gcctttctgg ggattgactc 1980 cacaaggaag gatcctatct attcttatga cagaagaaca acatcctttt gtaatgcatt 2040 gatccagagc ctggagtcaa atcctttaac caaaatcgct tggagggcgg caaagccttt 2100 gctgatggga aaaatcctgt acactcctga ttcacctgca gcacgaagga tactgaagaa 2160 tgccaactca acttttgaag aactggaaca cgttaggaag ttggtcaaag cctgggaaga 2220 agtagggccc cagatctggt acttctttga caacagcaca cagatgaaca tgatcagaga 2280 taccctgggg aacccaacag taaaagactt tttgaatagg cagcttggtg aagaaggtat 2340 tactgctgaa gccatcctaa acttcctcta caagggccct cgggaaagcc aggctgacga 2400 catggccaac ttcgactgga gggacatatt taacatcact gatcgcaccc tccgccttgt 2460 caatcaatac ctggagtgct tggtcctgga taagtttgaa agctacaatg atgaaactca 2520 gctcacccaa cgtgccctct ctctactgga ggaaaacatg ttctgggccg gagtggtatt 2580 ccctgacatg tatccctgga ccagctctct accaccccac gtgaagtata agatccgaat 2640 ggacatagac gtggtggaga aaaccaataa gattaaagac aggtattggg attctggtcc 2700 cagagctgat cccgtggaag atttccggta catctggggc gggtttgcct atctgcagga 2760 catggttgaa caggggatca caaggagcca ggtgcaggcg gaggctccag ttggaatcta 2820 cctccagcag atgccctacc cctgcttcgt ggacgattct ttcatgatca tcctgaaccg 2880 ctgtttccct atcttcatgg tgctggcatg gatctactct gtctccatga ctgtgaagag 2940 catcgtcttg gagaaggagt tgcgactgaa ggagaccttg aaaaatcagg gtgtctccaa 3000 tgcagtgatt tggtgtacct ggttcctgga cagcttctcc atcatgtcga tgagcatctt 3060 cctcctgacg atattcatca tgcatggaag aatcctacat tacagcgacc cattcatcct 3120 cttcctgttc ttgttggctt tctccactgc caccatcatg ctgtgctttc tgctcagcac 3180 cttcttctcc aaggccagtc tggcagcagc ctgtagtggt gtcatctatt tcaccctcta 3240 cctgccacac atcctgtgct tcgcctggca ggaccgcatg accgctgagc tgaagaaggc 3300 tgtgagctta ctgtctccgg tggcatttgg atttggcact gagtacctgg ttcgctttga 3360 agagcaaggc ctggggctgc agtggagcaa catcgggaac agtcccacgg aaggggacga 3420 attcagcttc ctgctgtcca tgcagatgat gctccttgat gctgctgtct atggcttact 3480 cgcttggtac cttgatcagg tgtttccagg agactatgga accccacttc cttggtactt 3540 tcttctacaa gagtcgtatt ggcttggcgg tgaagggtgt tcaaccagag aagaaagagc 3600 cctggaaaag accgagcccc taacagagga aacggaggat ccagagcacc cagaaggaat 3660 acacgactcc ttctttgaac gtgagcatcc agggtgggtt cctggggtat gcgtgaagaa 3720 tctggtaaag atttttgagc cctgtggccg gccagctgtg gaccgtctga acatcacctt 3780 ctacgagaac cagatcaccg cattcctggg ccacaatgga gctgggaaaa ccaccacctt 3840 gtccatcctg acgggtctgt tgccaccaac ctctgggact gtgctcgttg ggggaaggga 3900 cattgaaacc agcctggatg cagtccggca gagccttggc atgtgtccac agcacaacat 3960 cctgttccac cacctcacgg tggctgagca catgctgttc tatgcccagc tgaaaggaaa 4020 gtcccaggag gaggcccagc tggagatgga agccatgttg gaggacacag gcctccacca 4080 caagcggaat gaagaggctc aggacctatc aggtggcatg cagagaaagc tgtcggttgc 4140 cattgccttt gtgggagatg ccaaggtggt gattctggac gaacccacct ctggggtgga 4200 cccttactcg agacgctcaa tctgggatct gctcctgaag tatcgctcag gcagaaccat 4260 catcatgtcc actcaccaca tggacgaggc cgacctcctt ggggaccgca ttgccatcat 4320 tgcccaggga aggctctact gctcaggcac cccactcttc ctgaagaact gctttggcac 4380 aggcttgtac ttaaccttgg tgcgcaagga acccctagtg atggagttgg ccactccctc 4440 tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt 4500 tgcccgggcg gcctcagtga gcgagcgagc gcgcag 4536 <210> 24 <211> 4167 <212> DNA <213> Artificial Sequence <220> <223> 5'CMV NO INTRON ABCA4-AK <400> 24 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240 atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300 gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat 360 caattacggg gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg 420 taaatggccc gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt 480 atgttcccat agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac 540 ggtaaactgc ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg 600 acgtcaatga cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact 660 ttcctacttg gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt 720 ggcagtacac caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc 780 ccattgacgt caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc 840 gtaataaccc cgccccgttg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata 900 taagcagagc tcggcggccg ccatgggctt cgtgagacag atacagcttt tgctctggaa 960 gaactggacc ctgcggaaaa ggcaaaagat tcgctttgtg gtggaactcg tgtggccttt 1020 atctttattt ctggtcttga tctggttaag gaatgccaac ccgctctaca gccatcatga 1080 atgccatttc cccaacaagg cgatgccctc agcaggaatg ctgccgtggc tccaggggat 1140 cttctgcaat gtgaacaatc cctgttttca aagccccacc ccaggagaat ctcctggaat 1200 tgtgtcaaac tataacaact ccatcttggc aagggtatat cgagattttc aagaactcct 1260 catgaatgca ccagagagcc agcaccttgg ccgtatttgg acagagctac acatcttgtc 1320 ccaattcatg gacaccctcc ggactcaccc ggagagaatt gcaggaagag gaattcgaat 1380 aagggatatc ttgaaagatg aagaaacact gacactattt ctcattaaaa acatcggcct 1440 gtctgactca gtggtctacc ttctgatcaa ctctcaagtc cgtccagagc agttcgctca 1500 tggagtcccg gacctggcgc tgaaggacat cgcctgcagc gaggccctcc tggagcgctt 1560 catcatcttc agccagagac gcggggcaaa gacggtgcgc tatgccctgt gctccctctc 1620 ccagggcacc ctacagtgga tagaagacac tctgtatgcc aacgtggact tcttcaagct 1680 cttccgtgtg cttcccacac tcctagacag ccgttctcaa ggtatcaatc tgagatcttg 1740 gggaggaata ttatctgata tgtcaccaag aattcaagag tttatccatc ggccgagtat 1800 gcaggacttg ctgtgggtga ccaggcccct catgcagaat ggtggtccag agacctttac 1860 aaagctgatg ggcatcctgt ctgacctcct gtgtggctac cccgagggag gtggctctcg 1920 ggtgctctcc ttcaactggt atgaagacaa taactataag gcctttctgg ggattgactc 1980 cacaaggaag gatcctatct attcttatga cagaagaaca acatcctttt gtaatgcatt 2040 gatccagagc ctggagtcaa atcctttaac caaaatcgct tggagggcgg caaagccttt 2100 gctgatggga aaaatcctgt acactcctga ttcacctgca gcacgaagga tactgaagaa 2160 tgccaactca acttttgaag aactggaaca cgttaggaag ttggtcaaag cctgggaaga 2220 agtagggccc cagatctggt acttctttga caacagcaca cagatgaaca tgatcagaga 2280 taccctgggg aacccaacag taaaagactt tttgaatagg cagcttggtg aagaaggtat 2340 tactgctgaa gccatcctaa acttcctcta caagggccct cgggaaagcc aggctgacga 2400 catggccaac ttcgactgga gggacatatt taacatcact gatcgcaccc tccgccttgt 2460 caatcaatac ctggagtgct tggtcctgga taagtttgaa agctacaatg atgaaactca 2520 gctcacccaa cgtgccctct ctctactgga ggaaaacatg ttctgggccg gagtggtatt 2580 ccctgacatg tatccctgga ccagctctct accaccccac gtgaagtata agatccgaat 2640 ggacatagac gtggtggaga aaaccaataa gattaaagac aggtattggg attctggtcc 2700 cagagctgat cccgtggaag atttccggta catctggggc gggtttgcct atctgcagga 2760 catggttgaa caggggatca caaggagcca ggtgcaggcg gaggctccag ttggaatcta 2820 cctccagcag atgccctacc cctgcttcgt ggacgattct ttcatgatca tcctgaaccg 2880 ctgtttccct atcttcatgg tgctggcatg gatctactct gtctccatga ctgtgaagag 2940 catcgtcttg gagaaggagt tgcgactgaa ggagaccttg aaaaatcagg gtgtctccaa 3000 tgcagtgatt tggtgtacct ggttcctgga cagcttctcc atcatgtcga tgagcatctt 3060 cctcctgacg atattcatca tgcatggaag aatcctacat tacagcgacc cattcatcct 3120 cttcctgttc ttgttggctt tctccactgc caccatcatg ctgtgctttc tgctcagcac 3180 cttcttctcc aaggccagtc tggcagcagc ctgtagtggt gtcatctatt tcaccctcta 3240 cctgccacac atcctgtgct tcgcctggca ggaccgcatg accgctgagc tgaagaaggc 3300 tgtgagctta ctgtctccgg tggcatttgg atttggcact gagtacctgg ttcgctttga 3360 agagcaaggc ctggggctgc agtggagcaa catcgggaac agtcccacgg aaggggacga 3420 attcagcttc ctgctgtcca tgcagatgat gctccttgat gctgctgtct atggcttact 3480 cgcttggtac cttgatcagg tgtttccagg agactatgga accccacttc cttggtactt 3540 tcttctacaa gagtcgtatt ggcttggcgg tgaagggtgt tcaaccagag aagaaagagc 3600 cctggaaaag accgagcccc taacagagga aacggaggat ccagagcacc cagaaggaat 3660 acacgactcc ttctttgaac gtgagcatcc agggtgggtt cctggggtat gcgtgaagaa 3720 tctggtaaag atttttgagc cctgtggccg gccagctgtg gaccgtctga acatcacctt 3780 ctacgagaac cagatcaccg cattcctggg ccacaatgga gctgggaaaa ccaccacctt 3840 gtaagtatca aggttacaag acaggtttaa ggagaccaat agaaactggg cttgtcgaga 3900 cagagaagac tcttgcgttt ctgggatttt tccgatttcg gcctattggt taaaaaatga 3960 gctgatttaa caaaaattta acgcgaattt taacaaaata ttaacgttta taatttcagg 4020 tggcatcttt ccaattgagg aacccctagt gatggagttg gccactccct ctctgcgcgc 4080 tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc 4140 ggcctcagtg agcgagcgag cgcgcag 4167 <210> 25 <211> 4289 <212> DNA <213> Artificial Sequence <220> <223> 5'VMD2 ABCA4-AK <400> 25 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240 atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300 gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagtaac ggccgccagt 360 gtgctggaat tcgcccttaa taacttaagc gtcagcatat gcagaattct gtcattttac 420 tagggtgatg aaattcccaa gcaacaccat ccttttcaga taagggcact gaggctgaga 480 gaggagctga aacctacccg gggtcaccac acacaggtgg caaggctggg accagaaacc 540 aggactgttg actgcagccc ggtattcatt ctttccatag cccacagggc tgtcaaagac 600 cccagggcct agtcagaggc tcctccttcc tggagagttc ctggcacaga agttgaagct 660 cagcacagcc ccctaacccc caactctctc tgcaaggcct caggggtcag aacactggtg 720 gagcagatcc tttagcctct ggattttagg gccatggtag agggggtgtt gccctaaatt 780 ccagccctgg tctcagccca acaccctcca agaagaaatt agaggggcca tggccaggct 840 gtgctagccg ttgcttctga gcagattaca agaagggact aagacaagga ctcctttgtg 900 gaggtcctgg cttagggagt caagtgacgg cggctcagca ctcacgtggg cagtgccagc 960 ctctaagagt gggcaggggc actggccaca gagtcccagg gagtcccacc agcctagtcg 1020 ccagaccttc tgtgggcggc cgccatgggc ttcgtgagac agatacagct tttgctctgg 1080 aagaactgga ccctgcggaa aaggcaaaag attcgctttg tggtggaact cgtgtggcct 1140 ttatctttat ttctggtctt gatctggtta aggaatgcca acccgctcta cagccatcat 1200 gaatgccatt tccccaacaa ggcgatgccc tcagcaggaa tgctgccgtg gctccagggg 1260 atcttctgca atgtgaacaa tccctgtttt caaagcccca ccccaggaga atctcctgga 1320 attgtgtcaa actataacaa ctccatcttg gcaagggtat atcgagattt tcaagaactc 1380 ctcatgaatg caccagagag ccagcacctt ggccgtattt ggacagagct acacatcttg 1440 tcccaattca tggacaccct ccggactcac ccggagagaa ttgcaggaag aggaattcga 1500 ataagggata tcttgaaaga tgaagaaaca ctgacactat ttctcattaa aaacatcggc 1560 ctgtctgact cagtggtcta ccttctgatc aactctcaag tccgtccaga gcagttcgct 1620 catggagtcc cggacctggc gctgaaggac atcgcctgca gcgaggccct cctggagcgc 1680 ttcatcatct tcagccagag acgcggggca aagacggtgc gctatgccct gtgctccctc 1740 tcccagggca ccctacagtg gatagaagac actctgtatg ccaacgtgga cttcttcaag 1800 ctcttccgtg tgcttcccac actcctagac agccgttctc aaggtatcaa tctgagatct 1860 tggggaggaa tattatctga tatgtcacca agaattcaag agtttatcca tcggccgagt 1920 atgcaggact tgctgtgggt gaccaggccc ctcatgcaga atggtggtcc agagaccttt 1980 acaaagctga tgggcatcct gtctgacctc ctgtgtggct accccgaggg aggtggctct 2040 cgggtgctct ccttcaactg gtatgaagac aataactata aggcctttct ggggattgac 2100 tccacaagga aggatcctat ctattcttat gacagaagaa caacatcctt ttgtaatgca 2160 ttgatccaga gcctggagtc aaatccttta accaaaatcg cttggagggc ggcaaagcct 2220 ttgctgatgg gaaaaatcct gtacactcct gattcacctg cagcacgaag gatactgaag 2280 aatgccaact caacttttga agaactggaa cacgttagga agttggtcaa agcctgggaa 2340 gaagtagggc cccagatctg gtacttcttt gacaacagca cacagatgaa catgatcaga 2400 gataccctgg ggaacccaac agtaaaagac tttttgaata ggcagcttgg tgaagaaggt 2460 attactgctg aagccatcct aaacttcctc tacaagggcc ctcgggaaag ccaggctgac 2520 gacatggcca acttcgactg gagggacata tttaacatca ctgatcgcac cctccgcctt 2580 gtcaatcaat acctggagtg cttggtcctg gataagtttg aaagctacaa tgatgaaact 2640 cagctcaccc aacgtgccct ctctctactg gaggaaaaca tgttctgggc cggagtggta 2700 ttccctgaca tgtatccctg gaccagctct ctaccacccc acgtgaagta taagatccga 2760 atggacatag acgtggtgga gaaaaccaat aagattaaag acaggtattg ggattctggt 2820 cccagagctg atcccgtgga agatttccgg tacatctggg gcgggtttgc ctatctgcag 2880 gacatggttg aacaggggat cacaaggagc caggtgcagg cggaggctcc agttggaatc 2940 tacctccagc agatgcccta cccctgcttc gtggacgatt ctttcatgat catcctgaac 3000 cgctgtttcc ctatcttcat ggtgctggca tggatctact ctgtctccat gactgtgaag 3060 agcatcgtct tggagaagga gttgcgactg aaggagacct tgaaaaatca gggtgtctcc 3120 aatgcagtga tttggtgtac ctggttcctg gacagcttct ccatcatgtc gatgagcatc 3180 ttcctcctga cgatattcat catgcatgga agaatcctac attacagcga cccattcatc 3240 ctcttcctgt tcttgttggc tttctccact gccaccatca tgctgtgctt tctgctcagc 3300 accttcttct ccaaggccag tctggcagca gcctgtagtg gtgtcatcta tttcaccctc 3360 tacctgccac acatcctgtg cttcgcctgg caggaccgca tgaccgctga gctgaagaag 3420 gctgtgagct tactgtctcc ggtggcattt ggatttggca ctgagtacct ggttcgcttt 3480 gaagagcaag gcctggggct gcagtggagc aacatcggga acagtcccac ggaaggggac 3540 gaattcagct tcctgctgtc catgcagatg atgctccttg atgctgctgt ctatggctta 3600 ctcgcttggt accttgatca ggtgtttcca ggagactatg gaaccccact tccttggtac 3660 tttcttctac aagagtcgta ttggcttggc ggtgaagggt gttcaaccag agaagaaaga 3720 gccctggaaa agaccgagcc cctaacagag gaaacggagg atccagagca cccagaagga 3780 atacacgact ccttctttga acgtgagcat ccagggtggg ttcctggggt atgcgtgaag 3840 aatctggtaa agatttttga gccctgtggc cggccagctg tggaccgtct gaacatcacc 3900 ttctacgaga accagatcac cgcattcctg ggccacaatg gagctgggaa aaccaccacc 3960 ttgtaagtat caaggttaca agacaggttt aaggagacca atagaaactg ggcttgtcga 4020 gacagagaag actcttgcgt ttctgggatt tttccgattt cggcctattg gttaaaaaat 4080 gagctgattt aacaaaaatt taacgcgaat tttaacaaaa tattaacgtt tataatttca 4140 ggtggcatct ttccaattga ggaaccccta gtgatggagt tggccactcc ctctctgcgc 4200 gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg ctttgcccgg 4260 gcggcctcag tgagcgagcg agcgcgcag 4289 <210> 26 <211> 4436 <212> DNA <213> Artificial Sequence <220> <223> 5'RHOABCA4-AK <400> 26 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240 atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300 gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagcaga tcttccccac 360 ctagccacct ggcaaactgc tccttctctc aaaggcccaa acatggcctc ccagactgca 420 acccccaggc agtcaggccc tgtctccaca acctcacagc caccctggac ggaatctgct 480 tcttcccaca tttgagtcct cctcagcccc tgagctcctc tgggcagggc tgtttctttc 540 catctttgta ttcccagggg cctgcaaata aatgtttaat gaacgaacaa gagagtgaat 600 tccaattcca tgcaacaagg attgggctcc tgggccctag gctatgtgtc tggcaccaga 660 aacggaagct gcaggttgca gcccctgccc tcatggagct cctcctgtca gaggagtgtg 720 gggactggat gactccagag gtaacttgtg ggggaacgaa caggtaaggg gctgtgtgac 780 gagatgagag actgggagaa taaaccagaa agtctctagc tgtccagagg acatagcaca 840 gaggcccatg gtccctattt caaacccagg ccaccagact gagctgggac cttgggacag 900 acaagtcatg cagaagttag gggaccttct cctccctttt cctggatcct gagtacctct 960 cctccctgac ctcaggcttc ctcctagtgt caccttggcc cctcttagaa gccaattagg 1020 ccctcagttt ctgcagcggg gattaatatg attatgaaca cccccaatct cccagatgct 1080 gattcagcca ggagcttagg agggggaggt cactttataa gggtctgggg gggtcagaac 1140 ccagagtcat ccgcctgaat tctgcagata tccatcacac tggcggccgc catgggcttc 1200 gtgagacaga tacagctttt gctctggaag aactggaccc tgcggaaaag gcaaaagatt 1260 cgctttgtgg tggaactcgt gtggccttta tctttatttc tggtcttgat ctggttaagg 1320 aatgccaacc cgctctacag ccatcatgaa tgccatttcc ccaacaaggc gatgccctca 1380 gcaggaatgc tgccgtggct ccaggggatc ttctgcaatg tgaacaatcc ctgttttcaa 1440 agccccaccc caggagaatc tcctggaatt gtgtcaaact ataacaactc catcttggca 1500 agggtatatc gagattttca agaactcctc atgaatgcac cagagagcca gcaccttggc 1560 cgtatttgga cagagctaca catcttgtcc caattcatgg acaccctccg gactcacccg 1620 gagagaattg caggaagagg aattcgaata agggatatct tgaaagatga agaaacactg 1680 acactatttc tcattaaaaa catcggcctg tctgactcag tggtctacct tctgatcaac 1740 tctcaagtcc gtccagagca gttcgctcat ggagtcccgg acctggcgct gaaggacatc 1800 gcctgcagcg aggccctcct ggagcgcttc atcatcttca gccagagacg cggggcaaag 1860 acggtgcgct atgccctgtg ctccctctcc cagggcaccc tacagtggat agaagacact 1920 ctgtatgcca acgtggactt cttcaagctc ttccgtgtgc ttcccacact cctagacagc 1980 cgttctcaag gtatcaatct gagatcttgg ggaggaatat tatctgatat gtcaccaaga 2040 attcaagagt ttatccatcg gccgagtatg caggacttgc tgtgggtgac caggcccctc 2100 atgcagaatg gtggtccaga gacctttaca aagctgatgg gcatcctgtc tgacctcctg 2160 tgtggctacc ccgagggagg tggctctcgg gtgctctcct tcaactggta tgaagacaat 2220 aactataagg cctttctggg gattgactcc acaaggaagg atcctatcta ttcttatgac 2280 agaagaacaa catccttttg taatgcattg atccagagcc tggagtcaaa tcctttaacc 2340 aaaatcgctt ggagggcggc aaagcctttg ctgatgggaa aaatcctgta cactcctgat 2400 tcacctgcag cacgaaggat actgaagaat gccaactcaa cttttgaaga actggaacac 2460 gttaggaagt tggtcaaagc ctgggaagaa gtagggcccc agatctggta cttctttgac 2520 aacagcacac agatgaacat gatcagagat accctgggga acccaacagt aaaagacttt 2580 ttgaataggc agcttggtga agaaggtatt actgctgaag ccatcctaaa cttcctctac 2640 aagggccctc gggaaagcca ggctgacgac atggccaact tcgactggag ggacatattt 2700 aacatcactg atcgcaccct ccgccttgtc aatcaatacc tggagtgctt ggtcctggat 2760 aagtttgaaa gctacaatga tgaaactcag ctcacccaac gtgccctctc tctactggag 2820 gaaaacatgt tctgggccgg agtggtattc cctgacatgt atccctggac cagctctcta 2880 ccaccccacg tgaagtataa gatccgaatg gacatagacg tggtggagaa aaccaataag 2940 attaaagaca ggtattggga ttctggtccc agagctgatc ccgtggaaga tttccggtac 3000 atctggggcg ggtttgccta tctgcaggac atggttgaac aggggatcac aaggagccag 3060 gtgcaggcgg aggctccagt tggaatctac ctccagcaga tgccctaccc ctgcttcgtg 3120 gacgattctt tcatgatcat cctgaaccgc tgtttcccta tcttcatggt gctggcatgg 3180 atctactctg tctccatgac tgtgaagagc atcgtcttgg agaaggagtt gcgactgaag 3240 gagaccttga aaaatcaggg tgtctccaat gcagtgattt ggtgtacctg gttcctggac 3300 agcttctcca tcatgtcgat gagcatcttc ctcctgacga tattcatcat gcatggaaga 3360 atcctacatt acagcgaccc attcatcctc ttcctgttct tgttggcttt ctccactgcc 3420 accatcatgc tgtgctttct gctcagcacc ttcttctcca aggccagtct ggcagcagcc 3480 tgtagtggtg tcatctattt caccctctac ctgccacaca tcctgtgctt cgcctggcag 3540 gaccgcatga ccgctgagct gaagaaggct gtgagcttac tgtctccggt ggcatttgga 3600 tttggcactg agtacctggt tcgctttgaa gagcaaggcc tggggctgca gtggagcaac 3660 atcgggaaca gtcccacgga aggggacgaa ttcagcttcc tgctgtccat gcagatgatg 3720 ctccttgatg ctgctgtcta tggcttactc gcttggtacc ttgatcaggt gtttccagga 3780 gactatggaa ccccacttcc ttggtacttt cttctacaag agtcgtattg gcttggcggt 3840 gaagggtgtt caaccagaga agaaagagcc ctggaaaaga ccgagcccct aacagaggaa 3900 acggaggatc cagagcaccc agaaggaata cacgactcct tctttgaacg tgagcatcca 3960 gggtgggttc ctggggtatg cgtgaagaat ctggtaaaga tttttgagcc ctgtggccgg 4020 ccagctgtgg accgtctgaa catcaccttc tacgagaacc agatcaccgc attcctgggc 4080 cacaatggag ctgggaaaac caccaccttg taagtatcaa ggttacaaga caggtttaag 4140 gagaccaata gaaactgggc ttgtcgagac agagaagact cttgcgtttc tgggattttt 4200 ccgatttcgg cctattggtt aaaaaatgag ctgatttaac aaaaatttaa cgcgaatttt 4260 aacaaaatat taacgtttat aatttcaggt ggcatctttc caattgagga acccctagtg 4320 atggagttgg ccactccctc tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag 4380 gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc gcgcag 4436 <210> 27 <211> 4327 <212> DNA <213> Artificial Sequence <220> <223> 5'RHO ABCA4-TS <400> 27 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240 atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300 gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagcaga tcttccccac 360 ctagccacct ggcaaactgc tccttctctc aaaggcccaa acatggcctc ccagactgca 420 acccccaggc agtcaggccc tgtctccaca acctcacagc caccctggac ggaatctgct 480 tcttcccaca tttgagtcct cctcagcccc tgagctcctc tgggcagggc tgtttctttc 540 catctttgta ttcccagggg cctgcaaata aatgtttaat gaacgaacaa gagagtgaat 600 tccaattcca tgcaacaagg attgggctcc tgggccctag gctatgtgtc tggcaccaga 660 aacggaagct gcaggttgca gcccctgccc tcatggagct cctcctgtca gaggagtgtg 720 gggactggat gactccagag gtaacttgtg ggggaacgaa caggtaaggg gctgtgtgac 780 gagatgagag actgggagaa taaaccagaa agtctctagc tgtccagagg acatagcaca 840 gaggcccatg gtccctattt caaacccagg ccaccagact gagctgggac cttgggacag 900 acaagtcatg cagaagttag gggaccttct cctccctttt cctggatcct gagtacctct 960 cctccctgac ctcaggcttc ctcctagtgt caccttggcc cctcttagaa gccaattagg 1020 ccctcagttt ctgcagcggg gattaatatg attatgaaca cccccaatct cccagatgct 1080 gattcagcca ggagcttagg agggggaggt cactttataa gggtctgggg gggtcagaac 1140 ccagagtcat ccgcctgaat tctgcagata tccatcacac tggcggccgc catgggcttc 1200 gtgagacaga tacagctttt gctctggaag aactggaccc tgcggaaaag gcaaaagatt 1260 cgctttgtgg tggaactcgt gtggccttta tctttatttc tggtcttgat ctggttaagg 1320 aatgccaacc cgctctacag ccatcatgaa tgccatttcc ccaacaaggc gatgccctca 1380 gcaggaatgc tgccgtggct ccaggggatc ttctgcaatg tgaacaatcc ctgttttcaa 1440 agccccaccc caggagaatc tcctggaatt gtgtcaaact ataacaactc catcttggca 1500 agggtatatc gagattttca agaactcctc atgaatgcac cagagagcca gcaccttggc 1560 cgtatttgga cagagctaca catcttgtcc caattcatgg acaccctccg gactcacccg 1620 gagagaattg caggaagagg aattcgaata agggatatct tgaaagatga agaaacactg 1680 acactatttc tcattaaaaa catcggcctg tctgactcag tggtctacct tctgatcaac 1740 tctcaagtcc gtccagagca gttcgctcat ggagtcccgg acctggcgct gaaggacatc 1800 gcctgcagcg aggccctcct ggagcgcttc atcatcttca gccagagacg cggggcaaag 1860 acggtgcgct atgccctgtg ctccctctcc cagggcaccc tacagtggat agaagacact 1920 ctgtatgcca acgtggactt cttcaagctc ttccgtgtgc ttcccacact cctagacagc 1980 cgttctcaag gtatcaatct gagatcttgg ggaggaatat tatctgatat gtcaccaaga 2040 attcaagagt ttatccatcg gccgagtatg caggacttgc tgtgggtgac caggcccctc 2100 atgcagaatg gtggtccaga gacctttaca aagctgatgg gcatcctgtc tgacctcctg 2160 tgtggctacc ccgagggagg tggctctcgg gtgctctcct tcaactggta tgaagacaat 2220 aactataagg cctttctggg gattgactcc acaaggaagg atcctatcta ttcttatgac 2280 agaagaacaa catccttttg taatgcattg atccagagcc tggagtcaaa tcctttaacc 2340 aaaatcgctt ggagggcggc aaagcctttg ctgatgggaa aaatcctgta cactcctgat 2400 tcacctgcag cacgaaggat actgaagaat gccaactcaa cttttgaaga actggaacac 2460 gttaggaagt tggtcaaagc ctgggaagaa gtagggcccc agatctggta cttctttgac 2520 aacagcacac agatgaacat gatcagagat accctgggga acccaacagt aaaagacttt 2580 ttgaataggc agcttggtga agaaggtatt actgctgaag ccatcctaaa cttcctctac 2640 aagggccctc gggaaagcca ggctgacgac atggccaact tcgactggag ggacatattt 2700 aacatcactg atcgcaccct ccgccttgtc aatcaatacc tggagtgctt ggtcctggat 2760 aagtttgaaa gctacaatga tgaaactcag ctcacccaac gtgccctctc tctactggag 2820 gaaaacatgt tctgggccgg agtggtattc cctgacatgt atccctggac cagctctcta 2880 ccaccccacg tgaagtataa gatccgaatg gacatagacg tggtggagaa aaccaataag 2940 attaaagaca ggtattggga ttctggtccc agagctgatc ccgtggaaga tttccggtac 3000 atctggggcg ggtttgccta tctgcaggac atggttgaac aggggatcac aaggagccag 3060 gtgcaggcgg aggctccagt tggaatctac ctccagcaga tgccctaccc ctgcttcgtg 3120 gacgattctt tcatgatcat cctgaaccgc tgtttcccta tcttcatggt gctggcatgg 3180 atctactctg tctccatgac tgtgaagagc atcgtcttgg agaaggagtt gcgactgaag 3240 gagaccttga aaaatcaggg tgtctccaat gcagtgattt ggtgtacctg gttcctggac 3300 agcttctcca tcatgtcgat gagcatcttc ctcctgacga tattcatcat gcatggaaga 3360 atcctacatt acagcgaccc attcatcctc ttcctgttct tgttggcttt ctccactgcc 3420 accatcatgc tgtgctttct gctcagcacc ttcttctcca aggccagtct ggcagcagcc 3480 tgtagtggtg tcatctattt caccctctac ctgccacaca tcctgtgctt cgcctggcag 3540 gaccgcatga ccgctgagct gaagaaggct gtgagcttac tgtctccggt ggcatttgga 3600 tttggcactg agtacctggt tcgctttgaa gagcaaggcc tggggctgca gtggagcaac 3660 atcgggaaca gtcccacgga aggggacgaa ttcagcttcc tgctgtccat gcagatgatg 3720 ctccttgatg ctgctgtcta tggcttactc gcttggtacc ttgatcaggt gtttccagga 3780 gactatggaa ccccacttcc ttggtacttt cttctacaag agtcgtattg gcttggcggt 3840 gaagggtgtt caaccagaga agaaagagcc ctggaaaaga ccgagcccct aacagaggaa 3900 acggaggatc cagagcaccc agaaggaata cacgactcct tctttgaacg tgagcatcca 3960 gggtgggttc ctggggtatg cgtgaagaat ctggtaaaga tttttgagcc ctgtggccgg 4020 ccagctgtgg accgtctgaa catcaccttc tacgagaacc agatcaccgc attcctgggc 4080 cacaatggag ctgggaaaac caccaccttg taagtatcaa ggttacaaga caggtttaag 4140 gagaccaata gaaactgggc ttgtcgagac agagaagact cttgcgtttc tcaattgagg 4200 aacccctagt gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg 4260 ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag 4320 cgcgcag 4327 <210> 28 <211> 277 <212> DNA <213> Artificial Sequence <220> <223> Exemplary CBA promoter <400> 28 tcgaggtgag ccccacgttc tgcttcactc tccccatctc ccccccctcc ccacccccaa 60 ttttgtattt atttattttt taattatttt gtgcagcgat gggggcgggg gggggggggg 120 cgcgcgccag gcggggcggg gcggggcgag gggcggggcg gggcgaggcg gagaggtgcg 180 gcggcagcca atcagagcgg cgcgctccga aagtttcctt ttatggcgag gcggcggcgg 240 cggcggccct ataaaaagcg aagcgcgcgg cgggcgg 277 <210> 29 <211> 835 <212> DNA <213> Artificial Sequence <220> <223> example rhodopsin (Rho) promoter <400> 29 agatcttccc cacctagcca cctggcaaac tgctccttct ctcaaaggcc caaacatggc 60 ctcccagact gcaaccccca ggcagtcagg ccctgtctcc acaacctcac agccaccctg 120 gacggaatct gcttcttccc acatttgagt cctcctcagc ccctgagctc ctctgggcag 180 ggctgtttct ttccatcttt gtattcccag gggcctgcaa ataaatgttt aatgaacgaa 240 caagagagtg aattccaatt ccatgcaaca aggattgggc tcctgggccc taggctatgt 300 gtctggcacc agaaacggaa gctgcaggtt gcagcccctg ccctcatgga gctcctcctg 360 tcagaggagt gtggggactg gatgactcca gaggtaactt gtgggggaac gaacaggtaa 420 ggggctgtgt gacgagatga gagactggga gaataaacca gaaagtctct agctgtccag 480 aggacatagc acagaggccc atggtcccta tttcaaaccc aggccaccag actgagctgg 540 gaccttggga cagacaagtc atgcagaagt taggggacct tctcctccct tttcctggat 600 cctgagtacc tctcctccct gacctcaggc ttcctcctag tgtcaccttg gcccctctta 660 gaagccaatt aggccctcag tttctgcagc ggggattaat atgattatga acacccccaa 720 tctcccagat gctgattcag ccaggagctt aggaggggga ggtcacttta taagggtctg 780 ggggggtcag aacccagagt catccgcctg aattctgcag atatccatca cactg 835 <210> 30 <211> 688 <212> DNA <213> Artificial Sequence <220> <223> example vitelliform macular dystrophy 2 (VMD2) promoter <400> 30 aacggccgcc agtgtgctgg aattcgccct taataactta agcgtcagca tatgcagaat 60 tctgtcattt tactagggtg atgaaattcc caagcaacac catccttttc agataagggc 120 actgaggctg agagaggagc tgaaacctac ccggggtcac cacacacagg tggcaaggct 180 gggaccagaa accaggactg ttgactgcag cccggtattc attctttcca tagcccacag 240 ggctgtcaaa gaccccaggg cctagtcaga ggctcctcct tcctggagag ttcctggcac 300 agaagttgaa gctcagcaca gccccctaac ccccaactct ctctgcaagg cctcaggggt 360 cagaacactg gtggagcaga tcctttagcc tctggatttt agggccatgg tagagggggt 420 gttgccctaa attccagccc tggtctcagc ccaacaccct ccaagaagaa attagagggg 480 ccatggccag gctgtgctag ccgttgcttc tgagcagatt acaagaaggg actaagacaa 540 ggactccttt gtggaggtcc tggcttaggg agtcaagtga cggcggctca gcactcacgt 600 gggcagtgcc agcctctaag agtgggcagg ggcactggcc acagagtccc agggagtccc 660 accagcctag tcgccagacc ttctgtgg 688 <210> 31 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> wild-type small T antigen intron <400> 31 taaatataaa atttttaagt gtataatgtg ttaaactact gattctaatt gtttgtgtat 60 tttag 65 <210> 32 <211> 346 <212> DNA <213> Artificial Sequence <220> <223> wild-type large T antigen intron <400> 32 gtatttgctt cttccttaaa tcctggtgtt gatgcaatgt actgcaaaca atggcctgag 60 tgtgcaaaga aaatgtctgc taactgcata tgcttgctgt gcttactgag gatgaagcat 120 gaaaatagaa aattatacag gaaagatcca cttgtgtggg ttgattgcta ctgcttcgat 180 tgctttagaa tgtggtttgg acttgatctt tgtgaaggaa ccttacttct gtggtgtgac 240 ataattggac aaactaccta cagagattta aagctctaag gtaaatataa aatttttaag 300 tgtataatgt gttaaactac tgattctaat tgtttgtgta ttttag 346 <210> 33 <211> 93 <212> DNA <213> Artificial Sequence <220> <223> SV40 intron <400> 33 ctctaaggta aatataaaat ttttaagtgt ataatgtgtt aaactactga ttctaattgt 60 ttgtgtattt tagattccaa cctatggaac tga 93 <210> 34 <211> 77 <212> DNA <213> Artificial Sequence <220> <223> Exemplary recombinogenic region sequence (AK) <400> 34 gggattttgc cgatttcggc ctattggtta aaaaatgagc tgatttaaca aaaatttaac 60 gcgaatttta acaaaat 77 <210> 35 <211> 278 <212> DNA <213> Artificial Sequence <220> <223> AP <400> 35 gtgatcctag gtggaggccg aaagtacatg tttcgcatgg gaaccccaga ccctgagtac 60 ccagatgact acagccaagg tgggaccagg ctggacggga agaatctggt gcaggaatgg 120 ctggcgaagc gccagggtgc ccggtacgtg tggaaccgca ctgagctcat gcaggcttcc 180 ctggacccgt ctgtgaccca tctcatgggt ctctttgagc ctggagacat gaaatacgag 240 atccaccgag actccacact ggacccctcc ctgatgga 278 <210> 36 <211> 287 <212> DNA <213> Artificial Sequence <220> <223> AP1 <400> 36 ccccgggtgc gcggcgtcgg tggtgccggc ggggggcgcc aggtcgcagg cggtgtaggg 60 ctccaggcag gcggcgaagg ccatgacgtg cgctatgaag gtctgctcct gcacgccgtg 120 aaccaggtgc gcctgcgggc cgcgcgcgaa caccgccacg tcctcgcctg cgtgggtctc 180 ttcgtccagg ggcactgctg actgctgccg atactcgggg ctcccgctct cgctctcggt 240 aacatccggc cgggcgccgt ccttgagcac atagcctgga ccgtttc 287 <210> 37 <211> 288 <212> DNA <213> Artificial Sequence <220> <223> AP2 <400> 37 cgcagggcag cctctgtcat ctccatcagg gaggggtcca gtgtggagtc tcggtggatc 60 tcgtatttca tgtctccagg ctcaaagaga cccatgagat gggtcacaga cgggtccagg 120 gaagcctgca tgagctcagt gcggttccac acataccggg caccctggcg cttcgccagc 180 cattcctgca ccagattctt cccgtccagc ctggtcccac cttggctgta gtcatctggg 240 tactcagggt ctggggttcc catgcgaaac atgtactttc ggcctcca 288 <210> 38 <211> 261 <212> DNA <213> Artificial Sequence <220> <223> Exemplary polyadenylation sequence <400> 38 ttcgagcaga catgataaga tacattgatg agtttggaca aaccacaact agaatgcagt 60 gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc tttatttgta accattataa 120 gctgcaataa acaagttaac aacaacaatt gcattcattt tatgtttcag gttcaggggg 180 agatgtggga ggttttttaa agcaagtaaa acctctacaa atgtggtaaa atcgataagg 240 atcttcctag agcatggcta c 261 <210> 39 <211> 6648 <212> DNA <213> Artificial Sequence <220> <223> example MYO7A nucleotide sequence <400> 39 atggtgattc ttcagcaggg ggaccatgtg tggatggacc tgagattggg gcaggagttc 60 gacgtgccca tcggggcggt ggtgaagctc tgcgactctg ggcaggtcca ggtggtggat 120 gatgaagaca atgaacactg gatctctccg cagaacgcaa cgcacatcaa gcctatgcac 180 cccacgtcgg tccacggcgt ggaggacatg atccgcctgg gggacctcaa cgaggcgggc 240 atcttgcgca acctgcttat ccgctaccgg gaccacctca tctacacgta tacgggctcc 300 atcctggtgg ctgtgaaccc ctaccagctg ctctccatct actcgccaga gcacatccgc 360 cagtatacca acaagaagat tggggagatg cccccccaca tctttgccat tgctgacaac 420 tgctacttca acatgaaacg caacagccga gaccagtgct gcatcatcag tggggaatct 480 ggggccggga agacggagag cacaaagctg atcctgcagt tcctggcagc catcagtggg 540 cagcactcgt ggattgagca gcaggtcttg gaggccaccc ccattctgga agcatttggg 600 aatgccaaga ccatccgcaa tgacaactca agccgtttcg gaaagtacat cgacatccac 660 ttcaacaagc ggggcgccat cgagggcgcg aagattgagc agtacctgct ggaaaagtca 720 cgtgtctgtc gccaggccct ggatgaaagg aactaccacg tgttctactg catgctggag 780 ggtatgagtg aggatcagaa gaagaagctg ggcttgggcc aggcctctga ctacaactac 840 ttggccatgg gtaactgcat aacctgtgag ggccgggtgg acagccagga gtacgccaac 900 atccgctccg ccatgaaggt gctcatgttc actgacaccg agaactggga gatctcgaag 960 ctcctggctg ccatcctgca cctgggcaac ctgcagtatg aggcacgcac atttgaaaac 1020 ctggatgcct gtgaggttct cttctcccca tcgctggcca cagctgcatc cctgcttgag 1080 gtgaaccccc cagacctgat gagctgcctg actagccgca ccctcatcac ccgcggggag 1140 acggtgtcca ccccactgag cagggaacag gcactggacg tgcgcgacgc cttcgtaaag 1200 gggatctacg ggcggctgtt cgtgtggatt gtggacaaga tcaacgcagc aatttacaag 1260 cctccctccc aggatgtgaa gaactctcgc aggtccatcg gcctcctgga catctttggg 1320 tttgagaact ttgctgtgaa cagctttgag cagctctgca tcaacttcgc caatgagcac 1380 ctgcagcagt tctttgtgcg gcacgtgttc aagctggagc aggaggaata tgacctggag 1440 agcattgact ggctgcacat cgagttcact gacaaccagg atgccctgga catgattgcc 1500 aacaagccca tgaacatcat ctccctcatc gatgaggaga gcaagttccc caagggcaca 1560 gacaccacca tgttacacaa gctgaactcc cagcacaagc tcaacgccaa ctacatcccc 1620 cccaagaaca accatgagac ccagtttggc atcaaccatt ttgcaggcat cgtctactat 1680 gagacccaag gcttcctgga gaagaaccga gacaccctgc atggggacat tatccagctg 1740 gtccactcct ccaggaacaa gttcatcaag cagatcttcc aggccgatgt cgccatgggc 1800 gccgagacca ggaagcgctc gcccacactt agcagccagt tcaagcggtc actggagctg 1860 ctgatgcgca cgctgggtgc ctgccagccc ttctttgtgc gatgcatcaa gcccaatgag 1920 ttcaagaagc ccatgctgtt cgaccggcac ctgtgcgtgc gccagctgcg gtactcagga 1980 atgatggaga ccatccgaat ccgccgagct ggctacccca tccgctacag cttcgtagag 2040 tttgtggagc ggtaccgtgt gctgctgcca ggtgtgaagc cggcctacaa gcagggcgac 2100 ctccgcggga cttgccagcg catggctgag gctgtgctgg gcacccacga tgactggcag 2160 ataggcaaaa ccaagatctt tctgaaggac caccatgaca tgctgctgga agtggagcgg 2220 gacaaagcca tcaccgacag agtcatcctc cttcagaaag tcatccgggg attcaaagac 2280 aggtctaact ttctgaagct gaagaacgct gccacactga tccagaggca ctggcggggt 2340 cacaactgta ggaagaacta cgggctgatg cgtctgggct tcctgcggct gcaggccctg 2400 caccgctccc ggaagctgca ccagcagtac cgcctggccc gccagcgcat catccagttc 2460 caggcccgct gccgcgccta tctggtgcgc aaggccttcc gccaccgcct ctgggctgtg 2520 ctcaccgtgc aggcctatgc ccggggcatg atcgcccgca ggctgcacca acgcctcagg 2580 gctgagtatc tgtggcgcct cgaggctgag aaaatgcggc tggcggagga agagaagctt 2640 cggaaggaga tgagcgccaa gaaggccaag gaggaggccg agcgcaagca tcaggagcgc 2700 ctggcccagc tggctcgtga ggacgctgag cgggagctga aggagaagga ggccgctcgg 2760 cggaagaagg agctcctgga gcagatggaa agggcccgcc atgagcctgt caatcactca 2820 gacatggtgg acaagatgtt tggcttcctg gggacttcag gtggcctgcc aggccaggag 2880 ggccaggcac ctagtggctt tgaggacctg gagcgagggc ggagggagat ggtggaggag 2940 gacctggatg cagccctgcc cctgcctgac gaggatgagg aggacctctc tgagtataaa 3000 tttgccaagt tcgcggccac ctacttccag gggacaacca cgcactccta cacccggcgg 3060 ccactcaaac agccactgct ctaccatgac gacgagggtg accagctggc agccctggcg 3120 gtctggatca ccatcctccg cttcatgggg gacctccctg agcccaagta ccacacagcc 3180 atgagtgatg gcagtgagaa gatccctgtg atgaccaaga tttatgagac cctgggcaag 3240 aagacgtaca agagggagct gcaggccctg cagggcgagg gcgaggccca gctccccgag 3300 ggccagaaga agagcagtgt gaggcacaag ctggtgcatt tgactctgaa aaagaagtcc 3360 aagctcacag aggaggtgac caagaggctg catgacgggg agtccacagt gcagggcaac 3420 agcatgctgg aggaccggcc cacctccaac ctggagaagc tgcacttcat catcggcaat 3480 ggcatcctgc ggccagcact ccgggacgag atctactgcc agatcagcaa gcagctgacc 3540 cacaacccct ccaagagcag ctatgcccgg ggctggattc tcgtgtctct ctgcgtgggc 3600 tgtttcgccc cctccgagaa gtttgtcaag tacctgcgga acttcatcca cgggggcccg 3660 cccggctacg ccccgtactg tgaggagcgc ctgagaagga cctttgtcaa tgggacacgg 3720 acacagccgc ccagctggct ggagctgcag gccaccaagt ccaagaagcc aatcatgttg 3780 cccgtgacat tcatggatgg gaccaccaag accctgctga cggactcggc aaccacggcc 3840 aaggagctct gcaacgcgct ggccgacaag atctctctca aggaccggtt cgggttctcc 3900 ctctacattg ccctgtttga caaggtgtcc tccctgggca gcggcagtga ccacgtcatg 3960 gacgccatct cccagtgcga gcagtacgcc aaggagcagg gcgcccagga gcgcaacgcc 4020 ccctggaggc tcttcttccg caaagaggtc ttcacgccct ggcacagccc ctccgaggac 4080 aacgtggcca ccaacctcat ctaccagcag gtggtgcgag gagtcaagtt tggggagtac 4140 aggtgtgaga aggaggacga cctggctgag ctggcctccc agcagtactt tgtagactat 4200 ggctctgaga tgatcctgga gcgcctcctg aacctcgtgc ccacctacat ccccgaccgc 4260 gagatcacgc ccctgaagac gctggagaag tgggcccagc tggccatcgc cgcccacaag 4320 aaggggattt atgcccagag gagaactgat gcccagaagg tcaaagagga tgtggtcagt 4380 tatgcccgct tcaagtggcc cttgctcttc tccaggtttt atgaagccta caaattctca 4440 ggccccagtc tccccaagaa cgacgtcatc gtggccgtca actggacggg tgtgtacttt 4500 gtggatgagc aggagcaggt acttctggag ctgtccttcc cagagatcat ggccgtgtcc 4560 agcagcaggg agtgccgtgt ctggctctca ctgggctgct ctgatcttgg ctgtgctgcg 4620 cctcactcag gctgggcagg actgaccccg gcggggccct gttctccgtg ttggtcctgc 4680 aggggagcga aaacgacggc ccccagcttc acgctggcca ccatcaaggg ggacgaatac 4740 accttcacct ccagcaatgc tgaggacatt cgtgacctgg tggtcacctt cctagagggg 4800 ctccggaaga gatctaagta tgttgtggcc ctgcaggata accccaaccc cgcaggcgag 4860 gagtcaggct tcctcagctt tgccaaggga gacctcatca tcctggacca tgacacgggc 4920 gagcaggtca tgaactcggg ctgggccaac ggcatcaatg agaggaccaa gcagcgtggg 4980 gacttcccca ccgacagtgt gtacgtcatg cccactgtca ccatgccacc gcgggagatt 5040 gtggccctgg tcaccatgac tcccgatcag aggcaggacg ttgtccggct cttgcagctg 5100 cgaacggcgg agcccgaggt gcgtgccaag ccctacacgc tggaggagtt ttcctatgac 5160 tacttcaggc ccccacccaa gcacacgctg agccgtgtca tggtgtccaa ggcccgaggc 5220 aaggaccggc tgtggagcca cacgcgggaa ccgctcaagc aggcgctgct caagaagctc 5280 ctgggcagtg aggagctctc gcaggaggcc tgcctggcct tcattgctgt gctcaagtac 5340 atgggcgact acccgtccaa gaggacacgc tccgtcaacg agctcaccga ccagatcttt 5400 gagggtcccc tgaaagccga gcccctgaag gacgaggcat atgtgcagat cctgaagcag 5460 ctgaccgaca accacatcag gtacagcgag gagcggggtt gggagctgct ctggctgtgc 5520 acgggccttt tcccacccag caacatcctc ctgccccacg tgcagcgctt cctgcagtcc 5580 cgaaagcact gcccactcgc catcgactgc ctgcaacggc tccagaaagc cctgagaaac 5640 gggtcccgga agtaccctcc gcacctggtg gaggtggagg ccatccagca caagaccacc 5700 cagattttcc acaaagtcta cttccctgat gacactgacg aggccttcga agtggagtcc 5760 agcaccaagg ccaaggactt ctgccagaac atcgccacca ggctgctcct caagtcctca 5820 gagggattca gcctctttgt caaaattgca gacaaggtcc tcagcgttcc tgagaatgac 5880 ttcttctttg actttgttcg acacttgaca gactggataa agaaagctcg gcccatcaag 5940 gacggaattg tgccctcact cacctaccag gtgttcttca tgaagaagct gtggaccacc 6000 acggtgccag ggaaggatcc catggccgat tccatcttcc actattacca ggagttgccc 6060 aagtatctcc gaggctacca caagtgcacg cgggaggagg tgctgcagct gggggcgctg 6120 atctacaggg tcaagttcga ggaggacaag tcctacttcc ccagcatccc caagctgctg 6180 cgggagctgg tgccccagga ccttatccgg caggtctcac ctgatgactg gaagcggtcc 6240 atcgtcgcct acttcaacaa gcacgcaggg aagtccaagg aggaggccaa gctggccttc 6300 ctgaagctca tcttcaagtg gcccaccttt ggctcagcct tcttcgaggt gaagcaaact 6360 acggagccaa acttccctga gatcctccta attgccatca acaagtatgg ggtcagcctc 6420 atcgatccca aaacgaagga tatcctcacc actcatccct tcaccaagat ctccaactgg 6480 agcagcggca acacctactt ccacatcacc attgggaact tggtgcgcgg gagcaaactg 6540 ctctgcgaga cgtcactggg ctacaagatg gatgacctcc tgacttccta cattagccag 6600 atgctcacag ccatgagcaa acagcggggc tccaggagcg gcaagtga 6648 <210> 40 <211> 3108 <212> DNA <213> Artificial Sequence <220> <223> example 5' end portion of a MYO7A transgene <400> 40 atggtgattc ttcagcaggg ggaccatgtg tggatggacc tgagattggg gcaggagttc 60 gacgtgccca tcggggcggt ggtgaagctc tgcgactctg ggcaggtcca ggtggtggat 120 gatgaagaca atgaacactg gatctctccg cagaacgcaa cgcacatcaa gcctatgcac 180 cccacgtcgg tccacggcgt ggaggacatg atccgcctgg gggacctcaa cgaggcgggc 240 atcttgcgca acctgcttat ccgctaccgg gaccacctca tctacacgta tacgggctcc 300 atcctggtgg ctgtgaaccc ctaccagctg ctctccatct actcgccaga gcacatccgc 360 cagtatacca acaagaagat tggggagatg cccccccaca tctttgccat tgctgacaac 420 tgctacttca acatgaaacg caacagccga gaccagtgct gcatcatcag tggggaatct 480 ggggccggga agacggagag cacaaagctg atcctgcagt tcctggcagc catcagtggg 540 cagcactcgt ggattgagca gcaggtcttg gaggccaccc ccattctgga agcatttggg 600 aatgccaaga ccatccgcaa tgacaactca agccgtttcg gaaagtacat cgacatccac 660 ttcaacaagc ggggcgccat cgagggcgcg aagattgagc agtacctgct ggaaaagtca 720 cgtgtctgtc gccaggccct ggatgaaagg aactaccacg tgttctactg catgctggag 780 ggtatgagtg aggatcagaa gaagaagctg ggcttgggcc aggcctctga ctacaactac 840 ttggccatgg gtaactgcat aacctgtgag ggccgggtgg acagccagga gtacgccaac 900 atccgctccg ccatgaaggt gctcatgttc actgacaccg agaactggga gatctcgaag 960 ctcctggctg ccatcctgca cctgggcaac ctgcagtatg aggcacgcac atttgaaaac 1020 ctggatgcct gtgaggttct cttctcccca tcgctggcca cagctgcatc cctgcttgag 1080 gtgaaccccc cagacctgat gagctgcctg actagccgca ccctcatcac ccgcggggag 1140 acggtgtcca ccccactgag cagggaacag gcactggacg tgcgcgacgc cttcgtaaag 1200 gggatctacg ggcggctgtt cgtgtggatt gtggacaaga tcaacgcagc aatttacaag 1260 cctccctccc aggatgtgaa gaactctcgc aggtccatcg gcctcctgga catctttggg 1320 tttgagaact ttgctgtgaa cagctttgag cagctctgca tcaacttcgc caatgagcac 1380 ctgcagcagt tctttgtgcg gcacgtgttc aagctggagc aggaggaata tgacctggag 1440 agcattgact ggctgcacat cgagttcact gacaaccagg atgccctgga catgattgcc 1500 aacaagccca tgaacatcat ctccctcatc gatgaggaga gcaagttccc caagggcaca 1560 gacaccacca tgttacacaa gctgaactcc cagcacaagc tcaacgccaa ctacatcccc 1620 cccaagaaca accatgagac ccagtttggc atcaaccatt ttgcaggcat cgtctactat 1680 gagacccaag gcttcctgga gaagaaccga gacaccctgc atggggacat tatccagctg 1740 gtccactcct ccaggaacaa gttcatcaag cagatcttcc aggccgatgt cgccatgggc 1800 gccgagacca ggaagcgctc gcccacactt agcagccagt tcaagcggtc actggagctg 1860 ctgatgcgca cgctgggtgc ctgccagccc ttctttgtgc gatgcatcaa gcccaatgag 1920 ttcaagaagc ccatgctgtt cgaccggcac ctgtgcgtgc gccagctgcg gtactcagga 1980 atgatggaga ccatccgaat ccgccgagct ggctacccca tccgctacag cttcgtagag 2040 tttgtggagc ggtaccgtgt gctgctgcca ggtgtgaagc cggcctacaa gcagggcgac 2100 ctccgcggga cttgccagcg catggctgag gctgtgctgg gcacccacga tgactggcag 2160 ataggcaaaa ccaagatctt tctgaaggac caccatgaca tgctgctgga agtggagcgg 2220 gacaaagcca tcaccgacag agtcatcctc cttcagaaag tcatccgggg attcaaagac 2280 aggtctaact ttctgaagct gaagaacgct gccacactga tccagaggca ctggcggggt 2340 cacaactgta ggaagaacta cgggctgatg cgtctgggct tcctgcggct gcaggccctg 2400 caccgctccc ggaagctgca ccagcagtac cgcctggccc gccagcgcat catccagttc 2460 caggcccgct gccgcgccta tctggtgcgc aaggccttcc gccaccgcct ctgggctgtg 2520 ctcaccgtgc aggcctatgc ccggggcatg atcgcccgca ggctgcacca acgcctcagg 2580 gctgagtatc tgtggcgcct cgaggctgag aaaatgcggc tggcggagga agagaagctt 2640 cggaaggaga tgagcgccaa gaaggccaag gaggaggccg agcgcaagca tcaggagcgc 2700 ctggcccagc tggctcgtga ggacgctgag cgggagctga aggagaagga ggccgctcgg 2760 cggaagaagg agctcctgga gcagatggaa agggcccgcc atgagcctgt caatcactca 2820 gacatggtgg acaagatgtt tggcttcctg gggacttcag gtggcctgcc aggccaggag 2880 ggccaggcac ctagtggctt tgaggacctg gagcgagggc ggagggagat ggtggaggag 2940 gacctggatg cagccctgcc cctgcctgac gaggatgagg aggacctctc tgagtataaa 3000 tttgccaagt tcgcggccac ctacttccag gggacaacca cgcactccta cacccggcgg 3060 ccactcaaac agccactgct ctaccatgac gacgagggtg accagctg 3108 <210> 41 <211> 3540 <212> DNA <213> Artificial Sequence <220> <223> example 3' end portion of a MYO7A transgene <400> 41 gcagccctgg cggtctggat caccatcctc cgcttcatgg gggacctccc tgagcccaag 60 taccacacag ccatgagtga tggcagtgag aagatccctg tgatgaccaa gatttatgag 120 accctgggca agaagacgta caagagggag ctgcaggccc tgcagggcga gggcgaggcc 180 cagctccccg agggccagaa gaagagcagt gtgaggcaca agctggtgca tttgactctg 240 aaaaagaagt ccaagctcac agaggaggtg accaagaggc tgcatgacgg ggagtccaca 300 gtgcagggca acagcatgct ggaggaccgg cccacctcca acctggagaa gctgcacttc 360 atcatcggca atggcatcct gcggccagca ctccgggacg agatctactg ccagatcagc 420 aagcagctga cccacaaccc ctccaagagc agctatgccc ggggctggat tctcgtgtct 480 ctctgcgtgg gctgtttcgc cccctccgag aagtttgtca agtacctgcg gaacttcatc 540 cacgggggcc cgcccggcta cgccccgtac tgtgaggagc gcctgagaag gacctttgtc 600 aatgggacac ggacacagcc gcccagctgg ctggagctgc aggccaccaa gtccaagaag 660 ccaatcatgt tgcccgtgac attcatggat gggaccacca agaccctgct gacggactcg 720 gcaaccacgg ccaaggagct ctgcaacgcg ctggccgaca agatctctct caaggaccgg 780 ttcgggttct ccctctacat tgccctgttt gacaaggtgt cctccctggg cagcggcagt 840 gaccacgtca tggacgccat ctcccagtgc gagcagtacg ccaaggagca gggcgcccag 900 gagcgcaacg ccccctggag gctcttcttc cgcaaagagg tcttcacgcc ctggcacagc 960 ccctccgagg acaacgtggc caccaacctc atctaccagc aggtggtgcg aggagtcaag 1020 tttggggagt acaggtgtga gaaggaggac gacctggctg agctggcctc ccagcagtac 1080 tttgtagact atggctctga gatgatcctg gagcgcctcc tgaacctcgt gcccacctac 1140 atccccgacc gcgagatcac gcccctgaag acgctggaga agtgggccca gctggccatc 1200 gccgcccaca agaaggggat ttatgcccag aggagaactg atgcccagaa ggtcaaagag 1260 gatgtggtca gttatgcccg cttcaagtgg cccttgctct tctccaggtt ttatgaagcc 1320 tacaaattct caggccccag tctccccaag aacgacgtca tcgtggccgt caactggacg 1380 ggtgtgtact ttgtggatga gcaggagcag gtacttctgg agctgtcctt cccagagatc 1440 atggccgtgt ccagcagcag ggagtgccgt gtctggctct cactgggctg ctctgatctt 1500 ggctgtgctg cgcctcactc aggctgggca ggactgaccc cggcggggcc ctgttctccg 1560 tgttggtcct gcaggggagc gaaaacgacg gcccccagct tcacgctggc caccatcaag 1620 ggggacgaat acaccttcac ctccagcaat gctgaggaca ttcgtgacct ggtggtcacc 1680 ttcctagagg ggctccggaa gagatctaag tatgttgtgg ccctgcagga taaccccaac 1740 cccgcaggcg aggagtcagg cttcctcagc tttgccaagg gagacctcat catcctggac 1800 catgacacgg gcgagcaggt catgaactcg ggctgggcca acggcatcaa tgagaggacc 1860 aagcagcgtg gggacttccc caccgacagt gtgtacgtca tgcccactgt caccatgcca 1920 ccgcgggaga ttgtggccct ggtcaccatg actcccgatc agaggcagga cgttgtccgg 1980 ctcttgcagc tgcgaacggc ggagcccgag gtgcgtgcca agccctacac gctggaggag 2040 ttttcctatg actacttcag gcccccaccc aagcacacgc tgagccgtgt catggtgtcc 2100 aaggcccgag gcaaggaccg gctgtggagc cacacgcggg aaccgctcaa gcaggcgctg 2160 ctcaagaagc tcctgggcag tgaggagctc tcgcaggagg cctgcctggc cttcattgct 2220 gtgctcaagt acatgggcga ctacccgtcc aagaggacac gctccgtcaa cgagctcacc 2280 gaccagatct ttgagggtcc cctgaaagcc gagcccctga aggacgaggc atatgtgcag 2340 atcctgaagc agctgaccga caaccacatc aggtacagcg aggagcgggg ttgggagctg 2400 ctctggctgt gcacgggcct tttcccaccc agcaacatcc tcctgcccca cgtgcagcgc 2460 ttcctgcagt cccgaaagca ctgcccactc gccatcgact gcctgcaacg gctccagaaa 2520 gccctgagaa acgggtcccg gaagtaccct ccgcacctgg tggaggtgga ggccatccag 2580 cacaagacca cccagatttt ccacaaagtc tacttccctg atgacactga cgaggccttc 2640 gaagtggagt ccagcaccaa ggccaaggac ttctgccaga acatcgccac caggctgctc 2700 ctcaagtcct cagagggatt cagcctcttt gtcaaaattg cagacaaggt cctcagcgtt 2760 cctgagaatg acttcttctt tgactttgtt cgacacttga cagactggat aaagaaagct 2820 cggcccatca aggacggaat tgtgccctca ctcacctacc aggtgttctt catgaagaag 2880 ctgtggacca ccacggtgcc agggaaggat cccatggccg attccatctt ccactattac 2940 caggagttgc ccaagtatct ccgaggctac cacaagtgca cgcgggagga ggtgctgcag 3000 ctgggggcgc tgatctacag ggtcaagttc gaggaggaca agtcctactt ccccagcatc 3060 cccaagctgc tgcgggagct ggtgccccag gaccttatcc ggcaggtctc acctgatgac 3120 tggaagcggt ccatcgtcgc ctacttcaac aagcacgcag ggaagtccaa ggaggaggcc 3180 aagctggcct tcctgaagct catcttcaag tggcccacct ttggctcagc cttcttcgag 3240 gtgaagcaaa ctacggagcc aaacttccct gagatcctcc taattgccat caacaagtat 3300 ggggtcagcc tcatcgatcc caaaacgaag gatatcctca ccactcatcc cttcaccaag 3360 atctccaact ggagcagcgg caacacctac ttccacatca ccattgggaa cttggtgcgc 3420 gggagcaaac tgctctgcga gacgtcactg ggctacaaga tggatgacct cctgacttcc 3480 tacattagcc agatgctcac agccatgagc aaacagcggg gctccaggag cggcaagtga 3540 <210> 42 <211> 6822 <212> DNA <213> Artificial Sequence <220> <223> example ABCA4 nucleotide sequence <400> 42 atgggcttcg tgagacagat acagcttttg ctctggaaga actggaccct gcggaaaagg 60 caaaagattc gctttgtggt ggaactcgtg tggcctttat ctttatttct ggtcttgatc 120 tggttaagga atgccaaccc gctctacagc catcatgaat gccatttccc caacaaggcg 180 atgccctcag caggaatgct gccgtggctc caggggatct tctgcaatgt gaacaatccc 240 tgttttcaaa gccccacccc aggagaatct cctggaattg tgtcaaacta taacaactcc 300 atcttggcaa gggtatatcg agattttcaa gaactcctca tgaatgcacc agagagccag 360 caccttggcc gtatttggac agagctacac atcttgtccc aattcatgga caccctccgg 420 actcacccgg agagaattgc aggaagagga attcgaataa gggatatctt gaaagatgaa 480 gaaacactga cactatttct cattaaaaac atcggcctgt ctgactcagt ggtctacctt 540 ctgatcaact ctcaagtccg tccagagcag ttcgctcatg gagtcccgga cctggcgctg 600 aaggacatcg cctgcagcga ggccctcctg gagcgcttca tcatcttcag ccagagacgc 660 ggggcaaaga cggtgcgcta tgccctgtgc tccctctccc agggcaccct acagtggata 720 gaagacactc tgtatgccaa cgtggacttc ttcaagctct tccgtgtgct tcccacactc 780 ctagacagcc gttctcaagg tatcaatctg agatcttggg gaggaatatt atctgatatg 840 tcaccaagaa ttcaagagtt tatccatcgg ccgagtatgc aggacttgct gtgggtgacc 900 aggcccctca tgcagaatgg tggtccagag acctttacaa agctgatggg catcctgtct 960 gacctcctgt gtggctaccc cgagggaggt ggctctcggg tgctctcctt caactggtat 1020 gaagacaata actataaggc ctttctgggg attgactcca caaggaagga tcctatctat 1080 tcttatgaca gaagaacaac atccttttgt aatgcattga tccagagcct ggagtcaaat 1140 cctttaacca aaatcgcttg gagggcggca aagcctttgc tgatgggaaa aatcctgtac 1200 actcctgatt cacctgcagc acgaaggata ctgaagaatg ccaactcaac ttttgaagaa 1260 ctggaacacg ttaggaagtt ggtcaaagcc tgggaagaag tagggcccca gatctggtac 1320 ttctttgaca acagcacaca gatgaacatg atcagagata ccctggggaa cccaacagta 1380 aaagactttt tgaataggca gcttggtgaa gaaggtatta ctgctgaagc catcctaaac 1440 ttcctctaca agggccctcg ggaaagccag gctgacgaca tggccaactt cgactggagg 1500 gacatattta acatcactga tcgcaccctc cgccttgtca atcaatacct ggagtgcttg 1560 gtcctggata agtttgaaag ctacaatgat gaaactcagc tcacccaacg tgccctctct 1620 ctactggagg aaaacatgtt ctgggccgga gtggtattcc ctgacatgta tccctggacc 1680 agctctctac caccccacgt gaagtataag atccgaatgg acatagacgt ggtggagaaa 1740 accaataaga ttaaagacag gtattgggat tctggtccca gagctgatcc cgtggaagat 1800 ttccggtaca tctggggcgg gtttgcctat ctgcaggaca tggttgaaca ggggatcaca 1860 aggagccagg tgcaggcgga ggctccagtt ggaatctacc tccagcagat gccctacccc 1920 tgcttcgtgg acgattcttt catgatcatc ctgaaccgct gtttccctat cttcatggtg 1980 ctggcatgga tctactctgt ctccatgact gtgaagagca tcgtcttgga gaaggagttg 2040 cgactgaagg agaccttgaa aaatcagggt gtctccaatg cagtgatttg gtgtacctgg 2100 ttcctggaca gcttctccat catgtcgatg agcatcttcc tcctgacgat attcatcatg 2160 catggaagaa tcctacatta cagcgaccca ttcatcctct tcctgttctt gttggctttc 2220 tccactgcca ccatcatgct gtgctttctg ctcagcacct tcttctccaa ggccagtctg 2280 gcagcagcct gtagtggtgt catctatttc accctctacc tgccacacat cctgtgcttc 2340 gcctggcagg accgcatgac cgctgagctg aagaaggctg tgagcttact gtctccggtg 2400 gcatttggat ttggcactga gtacctggtt cgctttgaag agcaaggcct ggggctgcag 2460 tggagcaaca tcgggaacag tcccacggaa ggggacgaat tcagcttcct gctgtccatg 2520 cagatgatgc tccttgatgc tgctgtctat ggcttactcg cttggtacct tgatcaggtg 2580 tttccaggag actatggaac cccacttcct tggtactttc ttctacaaga gtcgtattgg 2640 cttggcggtg aagggtgttc aaccagagaa gaaagagccc tggaaaagac cgagccccta 2700 acagaggaaa cggaggatcc agagcaccca gaaggaatac acgactcctt ctttgaacgt 2760 gagcatccag ggtgggttcc tggggtatgc gtgaagaatc tggtaaagat ttttgagccc 2820 tgtggccggc cagctgtgga ccgtctgaac atcaccttct acgagaacca gatcaccgca 2880 ttcctgggcc acaatggagc tgggaaaacc accaccttgt ccatcctgac gggtctgttg 2940 ccaccaacct ctgggactgt gctcgttggg ggaagggaca ttgaaaccag cctggatgca 3000 gtccggcaga gccttggcat gtgtccacag cacaacatcc tgttccacca cctcacggtg 3060 gctgagcaca tgctgttcta tgcccagctg aaaggaaagt cccaggagga ggcccagctg 3120 gagatggaag ccatgttgga ggacacaggc ctccaccaca agcggaatga agaggctcag 3180 gacctatcag gtggcatgca gagaaagctg tcggttgcca ttgcctttgt gggagatgcc 3240 aaggtggtga ttctggacga acccacctct ggggtggacc cttactcgag acgctcaatc 3300 tgggatctgc tcctgaagta tcgctcaggc agaaccatca tcatgtccac tcaccacatg 3360 gacgaggccg acctccttgg ggaccgcatt gccatcattg cccagggaag gctctactgc 3420 tcaggcaccc cactcttcct gaagaactgc tttggcacag gcttgtactt aaccttggtg 3480 cgcaagatga aaaacatcca gagccaaagg aaaggcagtg aggggacctg cagctgctcg 3540 tctaagggtt tctccaccac gtgtccagcc cacgtcgatg acctaactcc agaacaagtc 3600 ctggatgggg atgtaaatga gctgatggat gtagttctcc accatgttcc agaggcaaag 3660 ctggtggagt gcattggtca agaacttatc ttccttcttc caaataagaa cttcaagcac 3720 agagcatatg ccagcctttt cagagagctg gaggagacgc tggctgacct tggtctcagc 3780 agttttggaa tttctgacac tcccctggaa gagatttttc tgaaggtcac ggaggattct 3840 gattcaggac ctctgtttgc gggtggcgct cagcagaaaa gagaaaacgt caacccccga 3900 cacccctgct tgggtcccag agagaaggct ggacagacac cccaggactc caatgtctgc 3960 tccccagggg cgccggctgc tcacccagag ggccagcctc ccccagagcc agagtgccca 4020 ggcccgcagc tcaacacggg gacacagctg gtcctccagc atgtgcaggc gctgctggtc 4080 aagagattcc aacacaccat ccgcagccac aaggacttcc tggcgcagat cgtgctcccg 4140 gctacctttg tgtttttggc tctgatgctt tctattgtta tccctccttt tggcgaatac 4200 cccgctttga cccttcaccc ctggatatat gggcagcagt acaccttctt cagcatggat 4260 gaaccaggca gtgagcagtt cacggtactt gcagacgtcc tcctgaataa gccaggcttt 4320 ggcaaccgct gcctgaagga agggtggctt ccggagtacc cctgtggcaa ctcaacaccc 4380 tggaagactc cttctgtgtc cccaaacatc acccagctgt tccagaagca gaaatggaca 4440 caggtcaacc cttcaccatc ctgcaggtgc agcaccaggg agaagctcac catgctgcca 4500 gagtgccccg agggtgccgg gggcctcccg cccccccaga gaacacagcg cagcacggaa 4560 attctacaag acctgacgga caggaacatc tccgacttct tggtaaaaac gtatcctgct 4620 cttataagaa gcagcttaaa gagcaaattc tgggtcaatg aacagaggta tggaggaatt 4680 tccattggag gaaagctccc agtcgtcccc atcacggggg aagcacttgt tgggttttta 4740 agcgaccttg gccggatcat gaatgtgagc gggggcccta tcactagaga ggcctctaaa 4800 gaaatacctg atttccttaa acatctagaa actgaagaca acattaaggt gtggtttaat 4860 aacaaaggct ggcatgccct ggtcagcttt ctcaatgtgg cccacaacgc catcttacgg 4920 gccagcctgc ctaaggacag aagccccgag gagtatggaa tcaccgtcat tagccaaccc 4980 ctgaacctga ccaaggagca gctctcagag attacagtgc tgaccacttc agtggatgct 5040 gtggttgcca tctgcgtgat tttctccatg tccttcgtcc cagccagctt tgtcctttat 5100 ttgatccagg agcgggtgaa caaatccaag cacctccagt ttatcagtgg agtgagcccc 5160 accacctact gggtaaccaa cttcctctgg gacatcatga attattccgt gagtgctggg 5220 ctggtggtgg gcatcttcat cgggtttcag aagaaagcct acacttctcc agaaaacctt 5280 cctgcccttg tggcactgct cctgctgtat ggatgggcgg tcattcccat gatgtaccca 5340 gcatccttcc tgtttgatgt ccccagcaca gcctatgtgg ctttatcttg tgctaatctg 5400 ttcatcggca tcaacagcag tgctattacc ttcatcttgg aattatttga gaataaccgg 5460 acgctgctca ggttcaacgc cgtgctgagg aagctgctca ttgtcttccc ccacttctgc 5520 ctgggccggg gcctcattga ccttgcactg agccaggctg tgacagatgt ctatgcccgg 5580 tttggtgagg agcactctgc aaatccgttc cactgggacc tgattgggaa gaacctgttt 5640 gccatggtgg tggaaggggt ggtgtacttc ctcctgaccc tgctggtcca gcgccacttc 5700 ttcctctccc aatggattgc cgagcccact aaggagccca ttgttgatga agatgatgat 5760 gtggctgaag aaagacaaag aattattact ggtggaaata aaactgacat cttaaggcta 5820 catgaactaa ccaagattta tccaggcacc tccagcccag cagtggacag gctgtgtgtc 5880 ggagttcgcc ctggagagtg ctttggcctc ctgggagtga atggtgccgg caaaacaacc 5940 acattcaaga tgctcactgg ggacaccaca gtgacctcag gggatgccac cgtagcaggc 6000 aagagtattt taaccaatat ttctgaagtc catcaaaata tgggctactg tcctcagttt 6060 gatgcaatcg atgagctgct cacaggacga gaacatcttt acctttatgc ccggcttcga 6120 ggtgtaccag cagaagaaat cgaaaaggtt gcaaactgga gtattaagag cctgggcctg 6180 actgtctacg ccgactgcct ggctggcacg tacagtgggg gcaacaagcg gaaactctcc 6240 acagccatcg cactcattgg ctgcccaccg ctggtgctgc tggatgagcc caccacaggg 6300 atggaccccc aggcacgccg catgctgtgg aacgtcatcg tgagcatcat cagagaaggg 6360 agggctgtgg tcctcacatc ccacagcatg gaagaatgtg aggcactgtg tacccggctg 6420 gccatcatgg taaagggcgc ctttcgatgt atgggcacca ttcagcatct caagtccaaa 6480 tttggagatg gctatatcgt cacaatgaag atcaaatccc cgaaggacga cctgcttcct 6540 gacctgaacc ctgtggagca gttcttccag gggaacttcc caggcagtgt gcagagggag 6600 aggcactaca acatgctcca gttccaggtc tcctcctcct ccctggcgag gatcttccag 6660 ctcctcctct cccacaagga cagcctgctc atcgaggagt actcagtcac acagaccaca 6720 ctggaccagg tgtttgtaaa ttttgctaaa cagcagactg aaagtcatga cctccctctg 6780 caccctcgag ctgctggagc cagtcgacaa gcccaggact ga 6822 <210> 43 <211> 2918 <212> DNA <213> Artificial Sequence <220> <223> example 5' end portion of a ABCA4 transgene <400> 43 atgggcttcg tgagacagat acagcttttg ctctggaaga actggaccct gcggaaaagg 60 caaaagattc gctttgtggt ggaactcgtg tggcctttat ctttatttct ggtcttgatc 120 tggttaagga atgccaaccc gctctacagc catcatgaat gccatttccc caacaaggcg 180 atgccctcag caggaatgct gccgtggctc caggggatct tctgcaatgt gaacaatccc 240 tgttttcaaa gccccacccc aggagaatct cctggaattg tgtcaaacta taacaactcc 300 atcttggcaa gggtatatcg agattttcaa gaactcctca tgaatgcacc agagagccag 360 caccttggcc gtatttggac agagctacac atcttgtccc aattcatgga caccctccgg 420 actcacccgg agagaattgc aggaagagga attcgaataa gggatatctt gaaagatgaa 480 gaaacactga cactatttct cattaaaaac atcggcctgt ctgactcagt ggtctacctt 540 ctgatcaact ctcaagtccg tccagagcag ttcgctcatg gagtcccgga cctggcgctg 600 aaggacatcg cctgcagcga ggccctcctg gagcgcttca tcatcttcag ccagagacgc 660 ggggcaaaga cggtgcgcta tgccctgtgc tccctctccc agggcaccct acagtggata 720 gaagacactc tgtatgccaa cgtggacttc ttcaagctct tccgtgtgct tcccacactc 780 ctagacagcc gttctcaagg tatcaatctg agatcttggg gaggaatatt atctgatatg 840 tcaccaagaa ttcaagagtt tatccatcgg ccgagtatgc aggacttgct gtgggtgacc 900 aggcccctca tgcagaatgg tggtccagag acctttacaa agctgatggg catcctgtct 960 gacctcctgt gtggctaccc cgagggaggt ggctctcggg tgctctcctt caactggtat 1020 gaagacaata actataaggc ctttctgggg attgactcca caaggaagga tcctatctat 1080 tcttatgaca gaagaacaac atccttttgt aatgcattga tccagagcct ggagtcaaat 1140 cctttaacca aaatcgcttg gagggcggca aagcctttgc tgatgggaaa aatcctgtac 1200 actcctgatt cacctgcagc acgaaggata ctgaagaatg ccaactcaac ttttgaagaa 1260 ctggaacacg ttaggaagtt ggtcaaagcc tgggaagaag tagggcccca gatctggtac 1320 ttctttgaca acagcacaca gatgaacatg atcagagata ccctggggaa cccaacagta 1380 aaagactttt tgaataggca gcttggtgaa gaaggtatta ctgctgaagc catcctaaac 1440 ttcctctaca agggccctcg ggaaagccag gctgacgaca tggccaactt cgactggagg 1500 gacatattta acatcactga tcgcaccctc cgccttgtca atcaatacct ggagtgcttg 1560 gtcctggata agtttgaaag ctacaatgat gaaactcagc tcacccaacg tgccctctct 1620 ctactggagg aaaacatgtt ctgggccgga gtggtattcc ctgacatgta tccctggacc 1680 agctctctac caccccacgt gaagtataag atccgaatgg acatagacgt ggtggagaaa 1740 accaataaga ttaaagacag gtattgggat tctggtccca gagctgatcc cgtggaagat 1800 ttccggtaca tctggggcgg gtttgcctat ctgcaggaca tggttgaaca ggggatcaca 1860 aggagccagg tgcaggcgga ggctccagtt ggaatctacc tccagcagat gccctacccc 1920 tgcttcgtgg acgattcttt catgatcatc ctgaaccgct gtttccctat cttcatggtg 1980 ctggcatgga tctactctgt ctccatgact gtgaagagca tcgtcttgga gaaggagttg 2040 cgactgaagg agaccttgaa aaatcagggt gtctccaatg cagtgatttg gtgtacctgg 2100 ttcctggaca gcttctccat catgtcgatg agcatcttcc tcctgacgat attcatcatg 2160 catggaagaa tcctacatta cagcgaccca ttcatcctct tcctgttctt gttggctttc 2220 tccactgcca ccatcatgct gtgctttctg ctcagcacct tcttctccaa ggccagtctg 2280 gcagcagcct gtagtggtgt catctatttc accctctacc tgccacacat cctgtgcttc 2340 gcctggcagg accgcatgac cgctgagctg aagaaggctg tgagcttact gtctccggtg 2400 gcatttggat ttggcactga gtacctggtt cgctttgaag agcaaggcct ggggctgcag 2460 tggagcaaca tcgggaacag tcccacggaa ggggacgaat tcagcttcct gctgtccatg 2520 cagatgatgc tccttgatgc tgctgtctat ggcttactcg cttggtacct tgatcaggtg 2580 tttccaggag actatggaac cccacttcct tggtactttc ttctacaaga gtcgtattgg 2640 cttggcggtg aagggtgttc aaccagagaa gaaagagccc tggaaaagac cgagccccta 2700 acagaggaaa cggaggatcc agagcaccca gaaggaatac acgactcctt ctttgaacgt 2760 gagcatccag ggtgggttcc tggggtatgc gtgaagaatc tggtaaagat ttttgagccc 2820 tgtggccggc cagctgtgga ccgtctgaac atcaccttct acgagaacca gatcaccgca 2880 ttcctgggcc acaatggagc tgggaaaacc accacctt 2918 <210> 44 <211> 3904 <212> DNA <213> Artificial Sequence <220> <223> example 3' end portion of a ABCA4 transgene <400> 44 gtccatcctg acgggtctgt tgccaccaac ctctgggact gtgctcgttg ggggaaggga 60 cattgaaacc agcctggatg cagtccggca gagccttggc atgtgtccac agcacaacat 120 cctgttccac cacctcacgg tggctgagca catgctgttc tatgcccagc tgaaaggaaa 180 gtcccaggag gaggcccagc tggagatgga agccatgttg gaggacacag gcctccacca 240 caagcggaat gaagaggctc aggacctatc aggtggcatg cagagaaagc tgtcggttgc 300 cattgccttt gtgggagatg ccaaggtggt gattctggac gaacccacct ctggggtgga 360 cccttactcg agacgctcaa tctgggatct gctcctgaag tatcgctcag gcagaaccat 420 catcatgtcc actcaccaca tggacgaggc cgacctcctt ggggaccgca ttgccatcat 480 tgcccaggga aggctctact gctcaggcac cccactcttc ctgaagaact gctttggcac 540 aggcttgtac ttaaccttgg tgcgcaagat gaaaaacatc cagagccaaa ggaaaggcag 600 tgaggggacc tgcagctgct cgtctaaggg tttctccacc acgtgtccag cccacgtcga 660 tgacctaact ccagaacaag tcctggatgg ggatgtaaat gagctgatgg atgtagttct 720 ccaccatgtt ccagaggcaa agctggtgga gtgcattggt caagaactta tcttccttct 780 tccaaataag aacttcaagc acagagcata tgccagcctt ttcagagagc tggaggagac 840 gctggctgac cttggtctca gcagttttgg aatttctgac actcccctgg aagagatttt 900 tctgaaggtc acggaggatt ctgattcagg acctctgttt gcgggtggcg ctcagcagaa 960 aagagaaaac gtcaaccccc gacacccctg cttgggtccc agagagaagg ctggacagac 1020 accccaggac tccaatgtct gctccccagg ggcgccggct gctcacccag agggccagcc 1080 tcccccagag ccagagtgcc caggcccgca gctcaacacg gggacacagc tggtcctcca 1140 gcatgtgcag gcgctgctgg tcaagagatt ccaacacacc atccgcagcc acaaggactt 1200 cctggcgcag atcgtgctcc cggctacctt tgtgtttttg gctctgatgc tttctattgt 1260 tatccctcct tttggcgaat accccgcttt gacccttcac ccctggatat atgggcagca 1320 gtacaccttc ttcagcatgg atgaaccagg cagtgagcag ttcacggtac ttgcagacgt 1380 cctcctgaat aagccaggct ttggcaaccg ctgcctgaag gaagggtggc ttccggagta 1440 cccctgtggc aactcaacac cctggaagac tccttctgtg tccccaaaca tcacccagct 1500 gttccagaag cagaaatgga cacaggtcaa cccttcacca tcctgcaggt gcagcaccag 1560 ggagaagctc accatgctgc cagagtgccc cgagggtgcc gggggcctcc cgccccccca 1620 gagaacacag cgcagcacgg aaattctaca agacctgacg gacaggaaca tctccgactt 1680 cttggtaaaa acgtatcctg ctcttataag aagcagctta aagagcaaat tctgggtcaa 1740 tgaacagagg tatggaggaa tttccattgg aggaaagctc ccagtcgtcc ccatcacggg 1800 ggaagcactt gttgggtttt taagcgacct tggccggatc atgaatgtga gcgggggccc 1860 tatcactaga gaggcctcta aagaaatacc tgatttcctt aaacatctag aaactgaaga 1920 caacattaag gtgtggttta ataacaaagg ctggcatgcc ctggtcagct ttctcaatgt 1980 ggcccacaac gccatcttac gggccagcct gcctaaggac agaagccccg aggagtatgg 2040 aatcaccgtc attagccaac ccctgaacct gaccaaggag cagctctcag agattacagt 2100 gctgaccact tcagtggatg ctgtggttgc catctgcgtg attttctcca tgtccttcgt 2160 cccagccagc tttgtccttt atttgatcca ggagcgggtg aacaaatcca agcacctcca 2220 gtttatcagt ggagtgagcc ccaccaccta ctgggtaacc aacttcctct gggacatcat 2280 gaattattcc gtgagtgctg ggctggtggt gggcatcttc atcgggtttc agaagaaagc 2340 ctacacttct ccagaaaacc ttcctgccct tgtggcactg ctcctgctgt atggatgggc 2400 ggtcattccc atgatgtacc cagcatcctt cctgtttgat gtccccagca cagcctatgt 2460 ggctttatct tgtgctaatc tgttcatcgg catcaacagc agtgctatta ccttcatctt 2520 ggaattattt gagaataacc ggacgctgct caggttcaac gccgtgctga ggaagctgct 2580 cattgtcttc ccccacttct gcctgggccg gggcctcatt gaccttgcac tgagccaggc 2640 tgtgacagat gtctatgccc ggtttggtga ggagcactct gcaaatccgt tccactggga 2700 cctgattggg aagaacctgt ttgccatggt ggtggaaggg gtggtgtact tcctcctgac 2760 cctgctggtc cagcgccact tcttcctctc ccaatggatt gccgagccca ctaaggagcc 2820 cattgttgat gaagatgatg atgtggctga agaaagacaa agaattatta ctggtggaaa 2880 taaaactgac atcttaaggc tacatgaact aaccaagatt tatccaggca cctccagccc 2940 agcagtggac aggctgtgtg tcggagttcg ccctggagag tgctttggcc tcctgggagt 3000 gaatggtgcc ggcaaaacaa ccacattcaa gatgctcact ggggacacca cagtgacctc 3060 aggggatgcc accgtagcag gcaagagtat tttaaccaat atttctgaag tccatcaaaa 3120 tatgggctac tgtcctcagt ttgatgcaat cgatgagctg ctcacaggac gagaacatct 3180 ttacctttat gcccggcttc gaggtgtacc agcagaagaa atcgaaaagg ttgcaaactg 3240 gagtattaag agcctgggcc tgactgtcta cgccgactgc ctggctggca cgtacagtgg 3300 gggcaacaag cggaaactct ccacagccat cgcactcatt ggctgcccac cgctggtgct 3360 gctggatgag cccaccacag ggatggaccc ccaggcacgc cgcatgctgt ggaacgtcat 3420 cgtgagcatc atcagagaag ggagggctgt ggtcctcaca tcccacagca tggaagaatg 3480 tgaggcactg tgtacccggc tggccatcat ggtaaagggc gcctttcgat gtatgggcac 3540 cattcagcat ctcaagtcca aatttggaga tggctatatc gtcacaatga agatcaaatc 3600 cccgaaggac gacctgcttc ctgacctgaa ccctgtggag cagttcttcc aggggaactt 3660 cccaggcagt gtgcagaggg agaggcacta caacatgctc cagttccagg tctcctcctc 3720 ctccctggcg aggatcttcc agctcctcct ctcccacaag gacagcctgc tcatcgagga 3780 gtactcagtc acacagacca cactggacca ggtgtttgta aattttgcta aacagcagac 3840 tgaaagtcat gacctccctc tgcaccctcg agctgctgga gccagtcgac aagcccagga 3900 ctga 3904 <210> 45 <211> 130 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 45 Asp Met Val Asp Lys Met Phe Gly Phe Leu Gly Thr Ser Gly Gly Leu 1 5 10 15 Pro Gly Gln Glu Gly Gln Ala Pro Ser Gly Phe Glu Asp Leu Glu Arg 20 25 30 Gly Arg Arg Glu Met Val Glu Glu Asp Leu Asp Ala Ala Leu Pro Leu 35 40 45 Pro Asp Glu Asp Glu Glu Asp Leu Ser Glu Tyr Lys Phe Ala Lys Phe 50 55 60 Ala Ala Thr Tyr Phe Gln Gly Thr Thr Thr His Ser Tyr Thr Arg Arg 65 70 75 80 Pro Leu Lys Gln Pro Leu Leu Tyr His Asp Asp Glu Gly Asp Gln Leu 85 90 95 Ala Ala Leu Ala Val Trp Ile Thr Ile Leu Arg Phe Met Gly Asp Leu 100 105 110 Pro Glu Pro Lys Tyr His Thr Ala Met Ser Asp Gly Ser Glu Lys Ile 115 120 125 Pro Val 130

Claims

세포에서 트랜스진을 발현시키기 위한 벡터 시스템으로서, 벡터 시스템은 제1 벡터 및 제2 벡터를 포함하고, 여기서
(a) 제1 벡터는 5'에서 3' 방향으로 프로모터; 인트론; 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 스플라이스 공여체 서열; 및 제1 재조합원성 영역을 포함하며;
(b) 제2 벡터는 5'에서 3' 방향으로 제2 재조합원성 영역; 스플라이스 수용체 서열; 및 트랜스진 CDS의 3' 말단 부분을 포함하며;
여기서 5' 말단 부분 및 3' 말단 부분은 함께 트랜스진 CDS를 구성하고, 인트론은 스플라이스 공여체 서열과 상동성 재조합할 수 없어 트랜스진 CDS의 5' 말단 부분을 절제하는, 벡터 시스템.
제1항에 있어서, 인트론이 스플라이스 공여체 서열의 영역에 대해 적어도 95%, 96%, 97%, 98%, 99% 또는 100%(바람직하게는 100%) 서열 동일성을 갖는 적어도 20, 30, 40, 50, 60, 70, 80, 90 또는 100개의 인접 뉴클레오티드의 영역을 포함하지 않는, 벡터 시스템.
제1항 또는 제2항에 있어서, 인트론이
(a) 시미안 바이러스 40(SV40) 인트론 또는 미닛 바이러스 마우스(MVM) 인트론이고/거나;
(b) SEQ ID NO: 3 또는 4에 대해 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는, 벡터 시스템.
제1항 내지 제3항 중 어느 한 항에 있어서, 스플라이스 공여체 서열이 SEQ ID NO: 5에 대해 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는, 벡터 시스템.
제1항 내지 제4항 중 어느 한 항에 있어서, 제1 재조합원성 영역 및 제2 재조합원성 영역이
(a) 둘 모두 F1 파지 재조합원성 영역 또는 이의 단편이고/거나;
(b) 둘 모두 SEQ ID NO: 7에 대해 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열 또는 이의 단편을 포함하는, 벡터 시스템.
제1항 내지 제5항 중 어느 한 항에 있어서, 제1 벡터 및 제2 벡터가 바이러스 벡터인, 벡터 시스템.
제1항 내지 제6항 중 어느 한 항에 있어서, 제1 벡터 및 제2 벡터가 AAV 벡터이고, 임의적으로 제1 벡터는 5' ITR 및 3' ITR을 추가로 포함하고, 제2 벡터는 5' ITR 및 3' ITR을 추가로 포함하는, 벡터 시스템.
제1항 내지 제7항 중 어느 한 항에 있어서, 프로모터가 CBA 프로모터 또는 이의 단편인, 벡터 시스템.
제1항 내지 제8항 중 어느 한 항에 있어서, 제2 벡터가 트랜스진 CDS의 3' 말단 부분의 다운스트림에 폴리아데닐화 서열을 추가로 포함하는, 벡터 시스템.
제1항 내지 제9항 중 어느 한 항에 있어서, 트랜스진이 Myosin 7A(MYO7A) 트랜스진인, 벡터 시스템.
제1항 내지 제10항 중 어느 한 항에 있어서,
(a) 제1 벡터가 SEQ ID NO: 14에 대해 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하고/거나;
(b) 제2 벡터는 SEQ ID NO: 15에 대해 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는, 벡터 시스템.
세포에서 트랜스진을 발현시키기 위한 방법으로서, 트랜스진이 세포에서 발현되도록 제1항 내지 제11항 중 어느 한 항에 정의된 바와 같은 제1 벡터 및 제2 벡터로 세포를 형질도입 또는 형질감염시키는 것을 포함하는, 방법.
5'에서 3' 방향으로 프로모터; 인트론; 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 스플라이스 공여체 서열; 및 재조합원성 영역을 포함는 벡터로서, 인트론은 스플라이스 공여체 서열과 상동성 재조합할 수 없어 트랜스진 CDS의 5' 말단 부분을 절제하는, 벡터.
제13항에 있어서, 벡터가 SEQ ID NO: 14에 대해 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는, 벡터.
제1항 내지 제11항 중 어느 한 항에 있어서, 요법에 사용하기 위한 벡터 시스템.
제1항 내지 제11항 중 어느 한 항에 있어서, 어셔 증후군, 임의적으로 어셔 증후군 타입 1B의 치료에 사용하기 위한 벡터 시스템.
유효량의 제1항 내지 제11항 중 어느 한 항의 벡터 시스템을 어셔 증후군의 치료 또는 예방을 필요로 하는 대상체에게 투여하는 것을 포함하는 어셔 증후군을 치료 또는 예방하는 방법으로서, 임의적으로 어셔 증후군이 어셔 증후군 타입 1B인, 방법.