KR20220164743A

KR20220164743A - Ids 유전자 전달을 위한 아데노-연관 바이러스 조성물 및 이의 사용 방법

Info

Publication number: KR20220164743A
Application number: KR1020227037747A
Authority: KR
Inventors: 자생뜨 깅라스; 크루티 파텔; 로라 제인 스미스; 이본 화이트; 세레나 니콜 돌리브; 리샤우트 로라 밴; 브렌다 버넘
Original assignee: 호몰로지 메디슨, 인크.
Priority date: 2020-04-06
Filing date: 2021-04-05
Publication date: 2022-12-13
Also published as: MX2022012407A; AU2021252515A1; WO2021207077A1; JP2023522852A; EP4132562A1; CO2022013833A2; CN115484975A; IL296986A; EP4132562A4; CA3173207A1; BR112022019182A2; TW202204629A; US20210361778A1

Abstract

세포에서 IDS 유전자 기능을 복원할 수 있는 아데노-연관 바이러스(AAV) 조성물, 및 IDS 유전자 기능의 감소와 연관된 장애(예를 들어, 헌터 증후군)를 치료하기 위해 이러한 AAV 조성물을 사용하는 방법이 제공된다. 또한, AAV 조성물을 제조하기 위한 조성물, 시스템 및 방법이 제공된다.

Description

IDS 유전자 전달을 위한 아데노-연관 바이러스 조성물 및 이의 사용 방법

관련 출원

본 출원은 2020년 4월 6일에 출원된 미국 특허 가출원 제63/005,833호, 2020년 10월 21일에 출원된 제63/094,800호, 및 2021년 2월 3일에 출원된 제63/145,258호에 대한 우선권을 주장하며, 이의 전체 개시 내용은 본원에 참조로서 통합된다.

서열 목록

본 출원은 ASCII 포맷으로 전자 제출된 서열 목록을 포함하며, 그 전체가 본원에 참조로서 통합된다(전술한 ASCII 사본은 2021년 3월 30일에 생성되었고, "404217-HMW-037WO(182710)SL.txt"로 명명되며, 크기는 217,283바이트임).

헌터 증후군, 또는 뮤코다당류증 II(mcocopolysaccharidosis II, MPS II)는 치명적인 리소좀 축적 장애로서, 기대 수명을 10 내지 20년 심각하게 감소시키며 충족되지 않은 의학적 요구가 높다. 이 질환은 주로 남성에게 영향을 미치고, 글리코사미노글리칸(GAG)으로도 알려진 특정 뮤코다당류를 분해하고 재활용하는 신체의 능력을 방해하는 희귀한 X-연관 유전 장애이다. 헌터 증후군은 GAG, 헤파란 설페이트및 더마탄 설페이트의 단계적 분해에 필수적인 리소좀 효소인 이두로네이트-2-설파타제(IDS)의 유전자 결함에 의해 야기된다. IDS 결함은 신체 전반에 걸쳐 GAG를 세포 내에 축적시켜 특정 세포 및 기관의 적절한 기능을 방해한다. GAG의 축적이 계속됨에 따라, 헌터 증후군의 징후 및 증상이 더 잘 보이게 된다. 여기에는 뚜렷한 안면 특징, 큰 머리, 복부 비대, 난청, 심장 기능 저하를 야기하는 심장 판막의 비후화, 폐쇄성 기도 질환, 수면 무호흡증, 운동 범위 및 이동성 감소, 간 및 비장 비대를 포함할 수 있다. 헌터 증후군 환자의 2/3는 중추 신경계(CNS) 질환이 발생하여 신경인지 및 행동의 이상을 초래한다. 2 내지 4세 정도의 아동은 거친 안면 특징, 골격 이상, 장기 비대(특히, 간) 및 인지 장애를 동반한 심혈관 합병증과 같은 증상을 나타낼 수 있다. 미국에서 헌터 증후군의 질병 발생률은 1:130,000이다.

현재, 헌터 증후군은 몇 가지 다른 치료로 관리할 수 있다. 치료는 골수 이식 및 효소 대체 요법(ERT)을 포함한다. ERT는 엘라프라제(Elaprase)와 같은 정기적인 투여를 필요로 하는데, 엘라프라제는 1~8시간 동안 지속되는 주입으로 매주 투여되야 한다. 승인된 ERT 치료는 헌터 환자의 2/3와 관련된 신경퇴행을 치료하기에는 불충분하다. 혈액 뇌 장벽을 통과하도록 조작된 항체와 IDS의 융합 단백질인 SHP631과 같은 다른 ERT 치료는 여전히 임상 시험 단계에 있다. 다른 치료는, IDS 유전자와 함께 형질도입된 말초 혈액 림프구의 확장을 포함하는 생체 외 유전자 요법을 포함하며, 이는 인지 질환 환자에게 권장되지 않는 접근법이다. 몇 가지 다른 치료 옵션이 있음에도 불구하고, 헌터 증후군에 대한 치유법은 없다.

유전자 요법은 헌터 증후군을 치유할 기회를 제공한다. 렌티바이러스 벡터를 포함하는 레트로바이러스 벡터는 핵산을 숙주 세포 게놈 내로 통합시킬 수 있어, 게놈 내로의 비표적화된 삽입으로 인한 안전성 우려를 제기할 수 있다. 예를 들어, 벡터는 종양 억제 유전자를 교란시키거나 종양 유전자를 활성화시켜 악성 종양을 유발할 위험이 있다. 실제로, CD34⁺ 골수 전구체를 감마레트로바이러스 벡터로 형질도입함으로써 X-연관 중증 복합 면역결핍(SCID)을 치료하기 위한 임상시험에서, 10명의 환자 중 4명에서 백혈병이 발생했다(Hacein-Bey-Abina 등의 문헌[J Clin Invest. (2008) 118(9):3132-42], 그 전체가 참조로서 본원에 포함됨). 반면, 비통합 벡터는 종종 생체 내 불충분한 발현 수준 또는 부적절한 발현 지속시간을 경험한다.

따라서, 헌터 증후군 환자에서 IDS 유전자 기능을 효율적이고 안전하게 복원할 수 있는 개선된 유전자 요법 조성물 및 방법이 당업계에 필요하다.

본원에서는, 세포에서 IDS 유전자 기능을 복원할 수 있는 아데노-연관 바이러스(AAV) 조성물, 및 IDS 유전자 기능의 감소와 연관된 장애(예를 들어, 헌터 증후군)를 치료하기 위해 이를 사용하는 방법이 제공된다. 또한, AAV 조성물을 제조하기 위한 조성물, 시스템 및 방법이 제공된다.

따라서, 일 양태에서, 본 개시는 (a) AAV 캡시드 단백질을 포함하는 AAV 캡시드; 및 (b) 인트론을 포함하는 이두로네이트-2-설파타제(IDS) 인트론 삽입 암호화 서열에 작동가능하게 연결된 전사 조절 요소를 포함하는 rAAV 게놈을 포함하는, 재조합 아데노-연관 바이러스(rAAV)를 제공한다.

특정 구현예에서, IDS 인트론-삽입 암호화 서열은 인간 IDS 단백질을 암호화한다. 특정 구현예에서, IDS 인트론-삽입 암호화 서열은 서열번호 23에 제시된 아미노산 서열을 암호화한다.

특정 구현예에서, 인트론은 이종 인트론이다. 특정 구현예에서, 인트론은 서열번호 33에 제시된 뉴클레오티드 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 서열 동일성을 갖는다.

특정 구현예에서, 인트론은 서열번호 24에 제시된 IDS 암호화 서열의 708 및 709 위치에 상응하는 IDS 인트론-삽입 암호화 서열 내 뉴클레오티드 사이에 위치한다. 특정 구현예에서, IDS 인트론-삽입 암호화 서열은 서열번호 25, 59 또는 60에 제시된 뉴클레오티드 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 갖는 뉴클레오티드 서열을 포함한다.

특정 구현예에서, 인트론은 서열번호 26에 제시된 IDS 암호화 서열의 580 및 581 위치에 상응하는 IDS 인트론-삽입 암호화 서열 내 뉴클레오티드 사이에 위치한다. 특정 구현예에서, IDS 인트론-삽입 암호화 서열은 서열번호 27에 제시된 뉴클레오티드 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 갖는 뉴클레오티드 서열을 포함한다.

특정 구현예에서, IDS 인트론-삽입 암호화 서열은 서열번호 25, 27, 59, 또는 60에 제시된 뉴클레오티드 서열을 포함한다.

특정 구현예에서, 전사 조절 요소는 거대세포바이러스(CMV) 인핸서 요소, 거대세포바이러스(CMV) 프로모터, 닭-β-액틴(CBA) 프로모터, 작은 닭-β-액틴(SmCBA) 프로모터, 글리세르알데히드 3-포스페이트 탈수소효소(GAPDH) 프로모터, 베타-글루쿠로니다아제(GUSB) 프로모터, 변형 인간 EF-1 프로모터, CALM1 프로모터, 합성 프로모터 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된 하나 이상의 요소를 포함한다.

특정 구현예에서, 전사 조절 요소는 서열번호 29, 30, 36, 39, 40, 41, 42, 44, 46, 47, 48, 또는 55에 제시된 뉴클레오티드 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 갖는 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 전사 조절 요소는 서열번호 29에 제시된 뉴클레오티드 서열을 포함한다.

특정 구현예에서, rAAV 게놈은 IDS 인트론-삽입 암호화 서열 3'에 폴리아데닐화 서열을 추가로 포함한다. 특정 구현예에서, 폴리아데닐화 서열은 외인성 폴리아데닐화 서열이다. 특정 구현예에서, 외인성 폴리아데닐화 서열은 SV40 폴리아데닐화 서열이다. 특정 구현예에서, SV40 폴리아데닐화 서열은 서열번호 45에 제시된 뉴클레오티드 서열을 포함한다.

특정 구현예에서, rAAV 게놈은 서열번호 37, 43, 52, 54, 61, 63, 65, 69, 75, 또는 77에 제시된 뉴클레오티드 서열을 포함한다.

특정 구현예에서, rAAV 게놈은 5' 역위 말단 반복(5' ITR) 뉴클레오티드 및 3' 역위 말단 반복(3' ITR) 뉴클레오티드 서열을 추가로 포함한다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 18, 20 또는 49와 적어도 95%의 서열 동일성을 갖고, 3' ITR 뉴클레오티드 서열은 서열번호 14, 19, 21, 또는 51과 적어도 95%의 서열 동일성을 갖는다.

특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 18과 적어도 80%의 서열 동일성을 갖고, 3' ITR 뉴클레오티드 서열은 서열번호 14와 적어도 80%의 서열 동일성을 갖는다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 18에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 가지며, 3' ITR 뉴클레오티드 서열은 서열번호 19에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 18과 적어도 80%의 서열 동일성을 갖고, 3' ITR 뉴클레오티드 서열은 서열번호 51과 적어도 80%의 서열 동일성을 갖는다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 49에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 가지며, 3' ITR 뉴클레오티드 서열은 서열번호 14에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 49에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 가지며, 3' ITR 뉴클레오티드 서열은 서열번호 19에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 49에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 가지며, 3' ITR 뉴클레오티드 서열은 서열번호 51에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 20에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 가지며, 3' ITR 뉴클레오티드 서열은 서열번호 21에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열 및 3' ITR 뉴클레오티드는 각각 서열번호 18 및 14; 18 및 19; 18 및 51; 49 및 14; 49 및 19; 40 및 51; 또는 20 및 21의 서열을 포함한다.

특정 구현예에서, rAAV 게놈은 서열번호 28, 38, 50, 53, 56, 57, 58, 62, 64, 66, 70, 71, 72, 73, 또는 74에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈은 서열번호 72 및 74; 72 및 28; 73 및 74; 또는 73 및 28에 제시된 뉴클레오티드 서열을 포함한다.

특정 구현예에서, rAAV 게놈은 서열번호 38, 50, 62, 64, 66, 70, 76, 또는 78에 제시된 뉴클레오티드 서열을 포함한다.

특정 구현예에서, AAV 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 구현예에서, 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 내의 아미노산이 C이거나; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 내의 아미노산이 H이거나; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 내의 아미노산이 Q이거나; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 내의 아미노산이 A이거나; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 내의 아미노산이 N이거나; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 내의 아미노산이 S이거나; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 내의 아미노산이 I이거나; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내의 아미노산이 G 또는 Y이거나; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 내의 아미노산이 M이거나; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 내의 아미노산이 K이거나; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 내의 아미노산이 C이거나; 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 내의 아미노산이 G이다.

특정 구현예에서, (a) 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내의 아미노산이 G이고, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 내의 아미노산이 G이거나; (b) 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 내의 아미노산이 H이고, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 내의 아미노산이 N이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이고, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 내의 아미노산이 M이거나; (c) 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이고, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; (d) 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 내의 아미노산은이 A이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; (e) 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 내의 아미노산이 I이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산은 R이고, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 내의 아미노산이 C이다.

특정 구현예에서, 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산 서열을 포함한다.

특정 구현예에서, AAV 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 구현예에서, 서열번호 16의 아미노산 151에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 160에 상응하는 캡시드 단백질 내의 아미노산이 D이거나; 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 내의 아미노산이 C이거나; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 내의 아미노산이 H이거나; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 내의 아미노산이 Q이거나; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 내의 아미노산이 A이거나; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 내의 아미노산이 N이거나; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 내의 아미노산이 S이거나; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 내의 아미노산이 I이거나; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내의 아미노산이 G 또는 Y이거나; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 내의 아미노산이 M이거나; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 내의 아미노산이 K이거나; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 내의 아미노산이 C이거나; 또는 상기 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 내의 아미노산은 G이다.

특정 구현예에서, 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열을 포함한다.

특정 구현예에서, AAV 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 구현예에서, 서열번호 16의 아미노산 2에 상응하는 캡시드 단백질 내의 아미노산이 T이거나; 서열번호 16의 아미노산 65에 상응하는 캡시드 단백질 내의 아미노산이 I이거나; 서열번호 16의 아미노산 68에 상응하는 캡시드 단백질 내의 아미노산이 V이거나; 서열번호 16의 아미노산 77에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 119에 상응하는 캡시드 단백질 내의 아미노산이 L이거나; 서열번호 16의 아미노산 151에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 160에 상응하는 캡시드 단백질 내의 아미노산이 D이거나; 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 내의 아미노산이 C이거나; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 내의 아미노산이 H이거나; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 내의 아미노산이 Q이거나; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 내의 아미노산이 A이거나; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 내의 아미노산이 N이거나; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 내의 아미노산이 S이거나; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 내의 아미노산이 I이거나; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내의 아미노산이 G 또는 Y이거나; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 내의 아미노산이 M이거나; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 내의 아미노산이 K이거나; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 내의 아미노산이 C이거나; 또는 상기 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 내의 아미노산은 G이다.

특정 구현예에서, (a) 서열번호 16의 아미노산 2에 상응하는 캡시드 단백질 내의 아미노산이 T이고, 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 내의 아미노산이 Q이거나; (b) 서열번호 16의 아미노산 65에 상응하는 캡시드 단백질 내의 아미노산이 I이고, 상기 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내의 아미노산이 Y이거나; (c) 서열번호 16의 아미노산 77에 상응하는 캡시드 단백질 내의 아미노산이 R이고, 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 내의 아미노산이 K이거나; (d) 서열번호 16의 아미노산 119에 상응하는 캡시드 단백질 내의 아미노산이 L이고, 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 내의 아미노산이 S이거나; (e) 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내의 아미노산이 G이고, 상기 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 내의 아미노산이 G이거나; (f) 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 내의 아미노산이 H이고, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 내의 아미노산이 N이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이고, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 내의 아미노산이 M이거나; (g) 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이고, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; (h) 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 내의 아미노산이 A이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; (i) 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 내의 아미노산이 I이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산은 R이고, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 내의 아미노산은 C이다.

특정 구현예에서, 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열을 포함한다.

또 다른 양태에서, 본 개시는 세포에서 이두로네이트-2-설파타제(IDS) 폴리펩티드를 발현하기 위한 방법을 제공하며, 이러한 방법은 세포를 본원에 기술된 바와 같은 재조합 아데노-연관 바이러스(rAAV)로 형질도입하는 단계를 포함한다.

특정 구현예에서, 세포는 중추 신경계의 세포이다. 특정 구현예에서, 세포는 척수, 운동 피질, 감각 피질, 해마, 피각, 소뇌, 선택적으로 소뇌 핵, 및 임의의 이의 조합으로 이루어진 군으로부터 선택된 중추 신경계 영역의 세포이다. 특정 구현예에서, 세포는 뉴런 및/또는 신경교세포이되, 선택적으로 이러한 세포는 중추 신경계 및/또는 말초 신경계의 뉴런 및/또는 신경교세포이다. 특정 구현예에서, 세포는 운동 뉴런, 성상교세포, 희소돌기교세포, 중추 신경계의 대뇌 피질의 세포, 말초 신경계의 감각 뉴런, 슈반(Schwann) 세포, 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된 세포이다.

특정 구현예에서, 세포는 간의 세포이다. 특정 구현예에서, 세포는 심장의 세포이다. 특정 구현예에서, 세포는 폐의 세포이다. 특정 구현예에서, 세포는 신장의 세포이다. 특정 구현예에서, 세포는 비장의 세포이다.

특정 구현예에서, 세포는 포유류 대상체에 존재하고, rAAV는 대상체에서 세포를 형질도입하기에는데데 효과적인 양으로 대상체에게 투여된다.

또 다른 양태에서, 본 개시는 본원에 기술된 rAAV를 포함하는 약학적 조성물을 제공한다.

또 다른 양태에서, 본 개시는 헌터 증후군(HS)을 가진 대상체를 치료하기 위한 방법을 제공하며, 이러한 방법은 유효량의 본원에 기술된 rAAV, 또는 본원에 기술된 약학적 조성물을 대상체에게 투여하는 단계를 포함한다.

특정 구현예에서, rAAV 또는 약학적 조성물은 정맥내 투여된다.

특정 구현예에서, 헌터 증후군(HS)은 이두로네이트-2-설파타제(IDS) 유전자 돌연변이와 연관된다.

특정 구현예에서, 대상체는 인간 대상체이다.

또 다른 양태에서, 본 개시는 rAAV의 제조를 위한 패키징 시스템을 제공하며, 여기서 패키징 시스템은 (a) 하나 이상의 AAV Rep 단백질을 암호화하는 제1 뉴클레오티드 서열; (b) 본원에 기술된 바와 같은 rAAV의 캡시드 단백질을 암호화하는 제2 뉴클레오티드 서열; 및 (c) 본원에 기술된 바와 같은 rAAV의 rAAV 게놈 서열을 포함하는 제3 뉴클레오티드 서열을포함한다.

특정 구현예에서, 패키징 시스템은 제1 뉴클레오티드 서열 및 제2 뉴클레오티드 서열을 포함하는 제1 벡터, 및 제3 뉴클레오티드 서열을 포함하는 제2 벡터를 포함한다.

특정 구현예에서, 패키징 시스템은 하나 이상의 헬퍼 바이러스 유전자를 포함하는 제4 뉴클레오티드 서열을 추가로 포함한다. 특정 구현예에서, 제4 뉴클레오티드 서열은 제3 벡터 내에 포함된다. 특정 구현예에서, 제4 뉴클레오티드 서열은 아데노바이러스, 포진 바이러스, 우두 바이러스, 및 거대세포 바이러스(CMV)로 이루어진 군으로부터 선택된 바이러스로부터 유래한 하나 이상의 유전자를 포함한다.

특정 구현예에서, 제1 벡터, 제2 벡터, 및/또는 제3 벡터는 플라스미드이다.

또 다른 양태에서, 본 개시는 rAAV의 재조합 제조 방법을 제공하며, 이러한 방법은 rAAV가 생산되는 조건 하에서 본원에 기술된 패키징 시스템을 세포에 도입하는 단계를 포함한다.

또 다른 양태에서, 본 개시는 서열번호 25, 26, 27, 37, 38, 43, 50, 52, 53, 54, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 75, 76, 77, 또는 78에 제시된 뉴클레오티드 서열과 적어도 80%, 81%, 82%, 83%, 84%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함하는 폴리뉴클레오티드를 제공한다. 특정 구현예에서, 폴리뉴클레오티드는 서열번호 25, 26, 27, 37, 38, 43, 50, 52, 53, 54, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 75, 76, 77, 또는 78에 제시된 핵산 서열을 포함한다. 특정 구현예에서, 폴리뉴클레오티드는 벡터, 선택적으로는 바이러스 벡터(예를 들어, AAV 벡터, 레트로바이러스 벡터, 또는 아데노바이러스 벡터) 또는 플라스미드 벡터 내에 포함된다. 또 다른 양태에서, 본 개시는 전술한 폴리뉴클레오티드를 포함하는 재조합 세포를 제공한다.

또 다른 양태에서, 본 개시는 의약으로서 사용하기 위한, 본원에 기술된 바와 같은 rAAV, 본원에 기술된 바와 같은 약학적 조성물, 본원에 기술된 바와 같은 폴리뉴클레오티드, 또는 본원에 기술된 바와 같은 재조합 세포를 제공한다.

또 다른 양태에서, 본 개시는 헌터 증후군(HS)의 치료에 사용하기 위한, 본원에 기술된 바와 같은 rAAV, 본원에 기술된 바와 같은 약학적 조성물, 본원에 기술된 바와 같은 폴리뉴클레오티드, 또는 본원에 기술된 바와 같은 재조합 세포를 제공한다.

또 다른 양태에서, 본 개시는 헌터 증후군(HS)을 가진 대상체를 치료하는 방법에 사용하기 위한, 본원에 기술된 바와 같은 rAAV, 본원에 기술된 바와 같은 약학적 조성물, 본원에 기술된 바와 같은 폴리뉴클레오티드, 또는 본원에 기술된 바와 같은 재조합 세포를 제공하며, 이러한 방법은 유효량의 rAAV, 약학적 조성물, 폴리뉴클레오티드, 또는 세포를 대상체에게 투여하는 단계를 포함한다.

도 1a, 1b, 1c, 1d, 및 1e는 각각 pHM-05205, pHM-05213, pHM-05214, pHM-05216, 및 pHM-05217 벡터의 벡터 맵이다.
도 2a 및 2b. 도 2a는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 간에서 형질도입된 세포의 DNA의 ng당 벡터 게놈의 수를 보여주는 그래프이다. 도 2b는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 간에서 nmol/hr/mg의 단백질로 표현된 I2S 활성을 나타내는 그래프이다. 도 2a 및 2b에서, WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; AAV9-hIDS는 AAV9 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭하며; HSC15-hIDS는 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭한다. 도 2b에서, 인간 간은 정상 인간 간에서 대표적인 I2S 활성 수준을 지칭한다. *는 p<0.05의 통계적 유의성을 나타낸다; WT와 비교해 ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 3a 및 3b. 도 3a는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 뇌(전뇌, 중뇌 및 후뇌)에서 형질도입된 세포의 DNA의 ng당 벡터 게놈의 수를 보여주는 그래프이다. 도 3b는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 전뇌에서, nmol/hr/mg의 단백질로 표현된 I2S 활성을 보여주는 그래프이다. 도 3a 및 3b에서, WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; AAV9-hIDS는 AAV9 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭하며; HSC15-hIDS는 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭한다. 도 3b에서, 인간 뇌는 정상 성인 인간 뇌에서 대표적인 I2S 활성 수준을 지칭한다. n.s는 유의하지 않음을 나타낸다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 4a 및 4b. 도 4a는, 투여 후 4주차에, 마우스 간 내 대표적인 야생형 I2S 활성 수준의 백분율로 표현된, 2e13 vg/kg의 투여량으로 AAV9 캡시드(AAV9-hIDS)에 패키징된 pHM-05205 또는 2e13 vg/kg의 투여량으로 AAVHSC15 캡시드(HSC15-hIDS)에 패키징된 pHM-05205를 투여한 Ids KO KO 반접합체 마우스의 간에서 검출된 I2S 활성 수준을 보여주는 그래프이다. FIG. 4b는, 투여 후 4주차에, 간 내 대표적인 정상 인간 I2S 활성 수준의 백분율로 표현된, 2e13 vg/kg의 투여량으로 AAV9 캡시드(AAV9-hIDS)에 패키징된 pHM-05205 또는 2e13 vg/kg의 투여량으로 AAVHSC15 캡시드(HSC15-hIDS)에 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스의 간에서 검출된 I2S 활성 수준을 보여주는 그래프이다. 도 4a 및 4b에서, *는 p<0.05의 통계적 유의성을 나타낸다.
도 5a 및 5b. 도 5a는, 마우스 뇌 내 대표적인 야생형 I2S활성 수준의 백분율로 표현된, 투여 후 4주차에 2e13 vg/kg의 투여량으로 AAV9 캡시드(AAV9-hIDS)에 패키징된 pHM-05205 또는 2e13 vg/kg의 투여량으로 AAVHSC15 캡시드(HSC15-I2S)에 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스의 뇌에서 검출된 I2S 활성 수준을 보여주는 그래프이다. FIG. 5b는, 뇌 내 대표적인 정상 인간 I2S 활성 수준의 백분율로 표현된, 투여 후 4주차에, 2e13 vg/kg의 투여량으로 AAV9 캡시드(AAV9-hIDS)에 패키징된 pHM-05205 또는 2e13 vg/kg의 투여량으로 AAVHSC15 캡시드(HSC15-hIDS)에 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스의 뇌에서 검출된 I2S 활성 수준을 보여주는 그래프이다.
도 6a, 6b, 및 6c. 도 6a는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 간에서 검출된 GAG 수준을 보여주는 그래프이다. 도 6b는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 뇌에서 검출된 GAG 수준을 보여주는 그래프이다. 도 6c는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 소변에서 검출된 GAG 수준을 보여주는 그래프이다. 도 6a, 6b, 및 6c에서, WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; AAV9-hIDS는 AAV9 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭하며; HSC15-hIDS는 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭한다. 도 6a에서, 인간 간은 인간 간에서 대표적인 GAG 수준을 지칭한다. 도 6b에서, 인간 뇌는 인간 뇌에서 대표적인 GAG 수준을 지칭한다. 도 6a~6c에서, *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타낸다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 7a 및 7b. 도 7a는 투여 후 4주차에, 마우스 GAPDH의 발현 수준에 대해 정규화된, 야생형 및 Ids KO 반접합체 마우스의 간에서 hIDS의 발현을 보여주는 그래프이다. 도 7b는 투여 후 4주차에, 마우스 GAPDH의 발현 수준에 대해 정규화된, 야생형 및 Ids KO 반접합체 마우스의 뇌에서 hIDS의 발현을 보여주는 그래프이다. 도 7a 및 7b에서, WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; AAV9-hIDS는 AAV9 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭하며; HSC15-hIDS는 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭한다. 도 7b에서, 인간 뇌는 성인 정상 인간 뇌에서의 대표적인 IDS 발현 수준을 지칭한다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 8a, 8b, 및 8c. 도 8a는 시간에 따라, 야생형 및 Ids KO 반접합체 마우스의 소변에서 검출된 총 GAG 수준을 보여주는 그래프이다. 도 8b는 투여 후 12주차에 야생형 및 Ids KO 반접합체 마우스의 간에서 검출된 GAG 수준을 보여주는 그래프이다. 도 8c는 투여 후 12주차에 야생형 및 Ids KO 반접합체 마우스의 간에서 nmol/hr/mg의 단백질로 표현된 I2S 활성을 나타내는 그래프이다. 도 8a, 8b, 및 8c에서, WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; HSC15-hIDS는 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭한다. 도 8a~8c에서, ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 9a, 9b, 및 9c. 도 9a는 투여 후 12주차에 야생형 및 Ids KO 반접합체 마우스의 뇌에서 검출된 GAG 수준을 보여주는 그래프이다. 도 9b는 투여 후 12주차에 야생형 및 Ids KO 반접합체 마우스의 뇌에서 nmol/hr/mg의 단백질로서 표현된 I2S 활성을 나타내는 그래프이다. 도 9a 및 9b에서, *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타낸다. 도 9c는, 대표적인 야생형 마우스 I2S 활성의 백분율로서 표현된, 투여 후 12주차에 야생형 및 Ids KO 반접합체 마우스의 뇌에서의 I2S 활성을 나타내는 그래프이다. 도 9a, 9b, 및 9c에서, WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; HSC15-hIDS는 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭한다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 10a, 10b, 10c, 및 10d는 각각 T-004, T-005, 및 T-006 벡터의 벡터 맵이다.
도 11a 및 11b. 도 11a는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 소변에서 검출된 총 GAG 수준을 보여주는 그래프이다. 도 11b는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스에서 검출된 nmol/hr/ml로 표현된 혈청 I2S 활성을 보여주는 그래프이다. 도 11a 및 11b에서, WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; AAV9-hIDS는 AAV9 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭하며; HSC15-hIDS는 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭하며; HSC15-T-004는 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 T-004를 투여한 Ids KO 반접합체 마우스를 지칭하고; HSC15-T-005는 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 T-005를 투여한 Ids KO 반접합체 마우스를 지칭하며; HSC15-T-006은 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 T-006을 투여한 Ids KO 반접합체 마우스를 지칭한다. 도 11a 및 11b에서, *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타내며, ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 12a, 12b, 12c, 및 12d. 도 12a는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 뇌에서 검출된 GAG 수준을 보여주는 그래프이다. 도 12b는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 간에서 검출된 GAG 수준을 보여주는 그래프이다. 도 12c는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 뇌에서 검출된 I2S 활성을 보여주는 그래프이다. 도 12d는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 간에서 검출된 I2S 활성을 보여주는 그래프이다. 도 12a, 12b, 12c, 및 12d에서, WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; AAV9-hIDS는 AAV9 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭하며; HSC15-hIDS는 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭하며; HSC15-T-004는 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 T-004를 투여한 Ids KO 반접합체 마우스를 지칭하고; HSC15-T-005는 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 T-005를 투여한 Ids KO 반접합체 마우스를 지칭하며; HSC15-T-006은 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 T-006을 투여한 Ids KO 반접합체 마우스를 지칭한다. 도 12a, 12b, 및 12d에서, *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타내고, ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 13a 및 13b는 투여 후 4주까지 야생형 및 Ids KO 반접합체 마우스의 체중을 보여주는 그래프이다. 도 13a 및 13b에서, 그룹 1: 미치료 Ids KO 반접합체 대조군; 그룹 2: AAVHSC15 캡시드에 2.2e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스; 그룹 3: AAVHSC15 캡시드에 6.5e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스; 그룹 4: AAVHSC15 캡시드에 1.1e14 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스; 그룹 5: 야생형 마우스 대조군; 그룹 6: AAVHSC15 캡시드에 2.2e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 야생형 마우스; 및 그룹 7: AAVHSC15 캡시드에 1.1e14 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 야생형 마우스. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 14a, 14b, 및 14c는 AAVHSC15에 패키징된 pHM-05217을 투여한 야생형 마우스에서 투여량 의존적인 I2S 활성을 보여주는 그래프이다. 도 14a는 투여 후 2주차에 야생형 및 Ids KO 반접합체 마우스에서 검출된 nmol/hr/ml 단위의 혈청 I2S 활성을 보여주는 그래프이다. 도 14b는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스에서 검출된 nmol/hr/ml 단위의 혈청 I2S 활성을 보여주는 그래프이다. 도 14c는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 간에서 nmol/hr/mg 단위의 I2S 활성을 보여주는 그래프이다. 도 14a, 14b, 및 14c에서, WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; WT - 2.2E+13은 AAVHSC15에 2.2e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 야생형 마우스를 지칭한며; WT - 1.1E+14는 AAVHSC15에 1.1e14 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 야생형 마우스를 지칭한다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 15a 및 15b. 도 15a는 투여 후 4주차에 야생형 및 반접합체 마우스의 뇌에서 총 GAG 수준을 보여주는 그래프이다. 도 15b는 투여 후 4주차에 야생형 및 반접합체 마우스의 간에서 총 GAG 수준을 보여주는 그래프이다. 도 15a 및 15b에서, WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; WT - 2.2E+13은 AAVHSC15에 2.2e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 야생형 마우스를 지칭한며; WT - 1.1E+14는 AAVHSC15에 1.1e14 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 야생형 마우스를 지칭한다. 도 15a 및 15b에서, ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 16a 및 16b. 도 16a는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 뇌에서 IDS의 발현 수준을 보여주는 그래프이다. 도 16b는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 간에서 IDS의 발현 수준을 보여주는 그래프이다. 도 16a 및 16b에서, WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; MPS II - 2.2E+13은 AAVHSC15에 2.2e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭하며; MPS II - 6.5E+13은 AAVHSC15에 6.5e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭하고; MPS II - 1.1E+14는 AAVHSC15에 1.1e14 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭한다. 도 16a 및 16b에서, *는 p<0.05의 통계적 유의성을 나타내고, ***는 p<0.001의 통계적 유의성을 나타낸다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 17a 및 17b. 도 17a는 투여 후 2주차에 야생형 및 Ids KO 반접합체 마우스에서 검출된 혈청 I2S 활성을 보여주는 그래프이다. 도 17b는 투여 후 4주차에 야생형 Ids IDS KO 반접합체 마우스에서 검출된 혈청 I2S 활성을 보여주는 그래프이다. 도 17a 및 17b에서, WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; MPS II - 2.2E+13은 AAVHSC15에 2.2e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭하며; MPS II - 6.5E+13은 AAVHSC15에 6.5e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭하고; MPS II - 1.1E+14는 AAVHSC15에 1.1e14 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭한다. 도 17a 및 17b에서, **는 p<0.01의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타내고, ns는 유의하지 않음을 나타낸다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 18은 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 간에서 검출된 I2S 활성을 보여주는 그래프이다. WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; MPS II - 2.2E+13은 AAVHSC15에 2.2e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭하며; MPS II - 6.5E+13은 AAVHSC15에 6.5e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭하고; MPS II - 1.1E+14는 AAVHSC15에 1.1e14 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭한다. 도 18에서, **는 p<0.01의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 19a 및 19b는, 소변 내 크레아티닌 수준으로 정규화된, 투여 후 2주(도 19a) 및 4주(도 19b)차에 야생형 및 Ids KO 반접합체 마우스의 소변에서 검출된 총 GAG 수준을 보여주는 그래프이다. 도 19c 및 도 19d는 투여 후 4주차에 야생형 마우스 및 Ids KO 반접합체 마우스에서 GAG 헤파란 설페이트(GAG-HS; "HS")(도 19c) 및 GAG 더마탄 설페이트(GAG-DS; "DS")(도 19d)의 수준을 보여주는 그래프이다. WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; MPS II - 2.2E+13은 AAVHSC15에 2.2e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭하며; MPS II - 6.5E+13은 AAVHSC15에 6.5e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭하고; MPS II - 1.1E+14는 AAVHSC15에 1.1e14 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭한다. 도 19a~19d에서, ns는 통계적 유의성이 없음을 나타내고, **는 p<0.01의 통계적 유의성을 나타내고, ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 20a, 20b, 20c, 20d, 20e, 및 20f는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 간(도 20a), 심장(도 20b), 폐(도 20c), 뇌(도 20d), 신장(도 20e), 및 비장(도 20f)에서 검출된 총 GAG 수준을 보여주는 그래프이다. 도 20a 20b, 20c, 20d, 20e, 및 20f에서, WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; MPS II - 2.2E+13은 AAVHSC15에 2.2e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭하며; MPS II - 6.5E+13은 AAVHSC15에 6.5e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭하고; MPS II - 1.1E+14는 AAVHSC15에 1.1e14 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭한다. 도 20a~20f에서, *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타내며, ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 21a, 21b, 21c, 및 21d. 도 21a는 투여 후 4주차에 표시된 바와 같은 다양한 투여량으로 AAVHSC15에 패키징된 pHM-05217을 투여한 MPS II 마우스의 뇌, 심장, 신장, 간, 폐, 및 비장 조직에서 형질도입된 세포의 DNA ?g당 벡터 게놈의 수를 보여주는 그래프이다. 도 21b는 투여 후 4주차에 다양한 표시된 투여량으로 AAVHSC15에 패키징된 pHM-05217을 투여한 MPS II 마우스의 뇌, 심장, 신장, 간, 폐, 및 비장 조직에서 검출된 정규화된 침묵 변형 hIDS 전사체를 보여주는 그래프이다. 도 21c는 투여 후 4주차에 다양한 표시된 투여량으로 AAVHSC15에 패키징된 pHM-05217을 투여한 MPS II 마우스의 뇌, 신장, 심장, 간, 폐, 및 비장 조직에서 검출된 헤파란 설페이트를 보여주는 그래프이다. 도 21d는 투여 후 4주차에 다양한 표시된 투여량으로 AAVHSC15에 패키징된 pHM-05217을 투여한 MPS II 마우스의 신장, 심장, 간, 및 폐 조직에서 검출된 더마탄 설페이트를 보여주는 그래프이다. 도 21c 및 21d에서, 비히클이 투여된 야생형 마우스 및 MPS II 마우스를 대조군으로서 사용하였다. 도 21c 및 21d에서, *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타내고, ****는 p<0.000의 통계적 유의성을 나타내고, ns는 유의하지 않음을 나타낸다.
도 22a, 22b, 22c, 및 22d는 투여 후 4주차에 다양한 표시된 투여량으로 AAVHSC15에 패키징된 pHM-05217을 투여한 MPS II 마우스의 뇌 조직-특이적 벡터 게놈 수준(도 22a), 뇌 조직에서 정규화된 침묵 변형 hIDS 전사체(도 22b), 뇌 조직 hI2S 활성(도 22c) 및 뇌 조직-특이적 헤파란 설페이트 수준(도 22d)을 보여주는 그래프이다. 비히클이 투여된 야생형 마우스 및 MPS II 마우스를 대조군으로서 사용하였다. 도 22c 및 22d에서, *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타내며, ***는 p<0.001의 통계적 유의성을 나타내고, ns는 유의하지 않음을 나타낸다.
도 23a, 23b, 및 23c는 투여 후 4주차에 다양한 표시된 투여량으로 AAVHSC15에 패키징된 pHM-05217을 투여한 MPS II 마우스의 소뇌(도 23a), 척수(도 23b) 및 해마(도 23c)에서 IHC에 의해 검출된 LAMP1 단백질의 픽셀 강도를 보여주는 그래프이다. 비히클이 투여된 야생형 마우스 및 MPS II 마우스를 대조군으로서 사용하였다. 도 23a~23c에서, *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타내며, ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타내며, ns는 유의하지 않음을 나타낸다.
도 24는 투여 후 4주차에 다양한 표시된 투여량으로 AAVHSC15에 패키징된 pHM-05217을 투여한 MPS II 마우스에서 측정된 혈청 I2S 활성을 보여주는 그래프이다. 비히클이 투여된 야생형 마우스 및 MPS II 마우스를 대조군으로서 사용하였다. 도 24에서, **는 p<0.01의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타내며, ns는 유의하지 않음을 나타낸다.
도 25는 투여 후 4주차에 다양항 표시된 투여량으로 AAVHSC15에 패키징된 pHM-05217을 투여한 MPS II 마우스에서 측정된 간 조직 I2S 활성을 보여주는 그래프이다. 비히클이 투여된 야생형 마우스 및 MPS II 마우스를 대조군으로서 사용하였다. 도 25에서, **는 p<0.01의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다.
도 26a는pHM-05205 벡터의 벡터맵이다. 도 26b, 26c 및 26d는 투여 후 4주차에 6e13 vg/kg의 투여량으로 AAVHSC15에 패키징된 pHM-05205(야생형 hIDS 암호화 서열을 포함함) 또는 pHM-05208(침묵 변형 hIDS 암호화 서열을 포함함) 중 하나를 투여한 MPS II 마우스의 뇌에서 혈청 I2S 활성(도 26b), 간 조직 I2S 활성(도 26c), 및 정규화된 hIDS 전사체(도 26d)를 보여주는 그래프이다. 비히클이 투여된 야생형 마우스 및 MPS II 마우스(또한 "Hemi"로도 지칭함)를 대조군으로서 사용하였다. 도 26b~26d에서, ****는 p<0.0001의 통계적 유의성을 나타내고, ns는 유의하지 않음을 나타낸다.
도 27a는pHM-05211 벡터의 벡터맵이다. 도 27b 및 27c. 도 27b는 AAVHSC15 캡시드에 각각 2e13 vg/kg의 투여량으로 패키징된 pHM-05205 또는 pHM-05211을 투여한 MPS II 마우스에서 검출된 혈청 I2S 활성의 수준을 보여주는 그래프이다. 혈청 I2S 활성은 표시된 바와 같이, 투여 후 6 또는 8주차에 측정하였다. 비히클이 투여된 MPS II 마우스를 대조군으로서 사용하였다. 도 27c는 각각 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205 또는 pHM-05211을 투여한 MPS II 마우스의 뇌에서 정규화된 hIDS 전사체의 수준을 보여주는 그래프이다. 지시된 바와 같이, 투여 후 2 또는 8주차에 마우스를 희생시키고, 뇌 hIDS 전사체를 측정하였다. 도 27b 및 27c에서, ns는 유의하지 않음을 나타낸다.
도 28a~28o는 AAVHSC15에 1.8e14 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 MPS II 마우스와 관련된 다양한 데이터를 보여주는 그래프이다. 도 28a는 투여 후 52주까지 치료된 MPS II 마우스에서 형광 효소 검정을 사용하여 검출된 혈청 I2S 활성의 수준을 보여주는 그래프이다. 개별 마우스(그룹당 n=3~5마리 마우스) 중의 최소, 최대 및 중앙값은 표준 편차를 나타내는 오차 막대와 함께 상자에 표시된다. 도 28b는 투여 후 12, 24, 39, 및 52주차에 치료된 MPS II 마우스의 뇌, 심장, 간, 비장, 신장 및 폐 조직에서 형질도입된 세포의 DNA의 ?g당 벡터 게놈의 수를 보여주는 그래프이다. 도 28c는 투여 후 12, 24, 39, 및 52주차에 치료된 MPS II 마우스의 뇌, 심장, 간, 비장, 신장 및 폐 조직에서 검출된 hIDS 전사체의 수를 보여주는 그래프이다. 도 28d는 투여 후 52주차에 치료된 MPS II 마우스의 뇌, 심장, 간, 비장, 신장 및 폐 조직에서 검출된 헤파란 설페이트의 수준을 보여주는 그래프이다. 도 28e 및 도 28f는 투여 후 52주차에 치료된 MPS II 마우스의 척수(도 28e) 및 해마(도 28f)에서 IHC에 의해 검출된 LAMP1 단백질의 픽셀 강도를 보여주는 그래프이다. 도 28g는 투여 후 39주차에 치료된 MPS II의 삼차 신경절에서 형질도입된 세포의 DNA μg당 벡터 게놈의 수를 보여주는 그래프이다. 도 28h는 투여 후 12, 24, 39, 및 52주차에 치료한 MPS II 마우스의 간 조직에서 검출된 I2S 활성의 수준을 보여주는 그래프이다. 도 28i~28l은 투여 후 12(도 28i), 24(도 28j), 39(도 28k), 및 52(도 28l)주차에 치료된 MPS II 마우스의 뇌 조직에서 검출된 I2S 활성의 수준을 보여주는 그래프이다. 도 28m은 투여 후 52주차에 1.8e14 vg/kg으로 AAVHSC15에 패키징된 pHM-05217을 투여한 MPS II 마우스의 소변에서 검출된 GAG-HS의 수준을 보여주는 그래프이다. 도 28n은 투여 후 52주차에 1.8e14 vg/kg으로 AAVHSC15에 패키징된 pHM-05217을 투여한 MPS II 마우스에서 퍼킨지 세포층 세포 밀도의 정량화를 보여주는 그래프이다. 도 28o는 투여 후 52주차에 치료된 MPS II 마우스의 관골궁 두께를 보여주는 그래프이다. 도 28b~28d 및 28e~28m의 각각에서, 미치료 MPS II 및 야생형 마우스를 대조군으로서 사용하였다. 도 28j~28l에서, 정상 성인 인간 뇌 조직을 추가 대조군으로서 사용하였다. 각각의 경우에, *는 p<0.05의 통계적 유의성을 나타내고, **는 p <0.01의 통계적 유의성을 나타내며, ***는 p<0.001의 통계적 유의성을 나타내고, ns는 유의하지 않음을 나타낸다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 29a~29e. 도 29a는 발목 및 발의 깊이와 폭 측정치의 위치를 보여주는 개략도이다. 도 29b~29e는 AAVHSC15에 1.8e14 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 MPS II 마우스에서 투여 후 14, 20, 28, 34, 37, 40, 46, 및 52주차에서의 발의 폭(도 29b), 발 깊이(도 29c), 발목 폭(도 29d) 및 발목 깊이(도 29e) 측정치를 보여주는 그래프이다. 각각의 경우에, 비히클을 투여한 야생형 마우스 및 MPS II 마우스를 대조군으로서 사용하였다.
도 30a~30e. 도 30a, 30d, 및 30e는 AAVHSC15에 패키징된 1.8e14 vg/kg의 pHM-05217을 투여한 MPS II 마우스에서 투여 후 8주까지 혈청(도 30a), 간 조직(도 30d) 및 뇌 조직(도 30f)에서 검출된 I2S 활성의 수준을 보여주는 그래프이다 . 비히클이 투여된 MPS II 마우스를 대조군으로서 사용하였다. 도 30a에서, *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타내며, ***는 p<0.001의 통계적 유의성을 나타내고, ns는 유의하지 않음을 나타낸다. 도 30b 및 30c는, 표시된 바와 같이, 투여 후 8일, 2주 및 8주에 AAVHSC15에 패키징된 1.8e14 vg/kg의 pHM-05217이 투여된 MPS II 마우스의 뇌, 심장, 간, 및 비장 조직에서 검출된 벡터 게놈(도 30b) 및 침묵 변형된 hIDS 전사체(도 30C)의 수준을 보여주는 그래프이다.
도 31a, 31b, 및 31c는, 표시된 바와 같이, 투여 후 8일(도 31a), 2주(도 31b), 및 8주(도 31c)에 AAVHSC15에 패키징된 1.8e14 vg/kg의 pHM-05217을 투여한 MPS II 마우스의 뇌, 심장, 간 및 비장 조직에서 검출된 GAG-HS의 수준을 보여주는 그래프이다. 도 31d는 AAVHSC15에 패키징된 1.8e14 vg/kg의 pHM-05217을 투여한 MPS II 마우스의 소변에서 검출된 GAG-HS의 수준을 표시된 다양한 시점에서 보여주는 그래프이다. 각각의 경우에, 비히클을 투여한 야생형 및 MPS II 마우스를 대조군으로서 사용하였다.
도 32a 및 32b는, 표시된 바와 같이, 비히클로 처리한 야생형(WT) 마우스, 비히클로 처리한 MPS II 마우스 및 6e13 vg/kg(MPS II 6E+13), 1e14 vg/kg(MPS II 1E+14), 또는 2e14 vg/kg(MPS II 2E+14)의 투여량으로 정맥 내 투여된 AAVHSC15 캡시드에 패키징된 pHM-05217을 처리한 MPS II 마우스의 뇌척수액(CSF)(도 32a) 또는 뇌 조직(도 32b)에서 HPLC-MS/MS에 의해 검출된 GAG-HS 수준을 보여주는 그래프이다. 도 32c는, 표시된 바와 같이, 비히클 처리한 야생형(WT) 마우스, 비히클 처리한 MPS II 마우스, 및 6e13 vg/kg(MPS II 6E+13), 1e14 vg/kg(MPS II 1E/14), 또는 2e14 (MPS II 1+2E/14)의 투여량으로 정맥 내 투여한 AAVHSC15 캡시드에 패키징된 pHM-05217을 처리한 MPS II 마우스의 뇌 조직에서 검출된 I2S 활성 수준을 보여주는 그래프이다. 정상 성인 인간 뇌 조직을 추가 대조군("인간 WT")으로서 사용하였다. 도 32a~32c에서, *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타내고, ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다.
도 33은 만노스 6-포스페이트(M6P)의 존재 또는 부재 하에 AAVHSC15에 패키징된 1.8e14 vg/kg의 pHM-05217의 투여 8일 후 MPS II 마우스로부터 수득한 혈청으로 인큐베이션한 IDS KO HeLa 세포의 세포 용해물에서 검출된 I2S 활성 수준을 보여주는 그래프이다. 도 33에서, *는 p<0.05의 통계적 유의성을 나타내고, ***는 p<0.001의 통계적 유의성을 나타낸다.

본 개시는 세포에서 IDS 유전자 기능을 복원할 수 있는 AAV 조성물, 및 IDS 유전자 기능의 감소와 관련된 장애(예컨대, 헌터 증후군)를 치료하기 위해 이를 사용하는 방법을 제공한다. 또한, AAV 조성물을 제조하기 위한 조성물, 시스템 및 방법이 제공된다.

I. 정의

본원에서 사용되는 용어 "재조합 아데노-연관 바이러스"는 또는 "rAAV"는 기능적 rep 및 cap 유전자가 결여된 게놈을 포함하는 AAV를 지칭한다.

본원에서 사용되는 용어 "IDS 유전자"는 이두로네이트-2-설파타제 유전자를 지칭한다. 인간 IDS 유전자는 국립생물공학정보센터(National Center for Biotechnology Information, NCBI) 유전자 ID 3423에 의해 식별된다. IDS 유전자의 상보적 암호화 서열의 예시적인 뉴클레오티드 서열은 서열번호 24에 제공된다. IDS 폴리펩티드의 예시적인 아미노산 서열은 서열번호 23으로 제공된다.

본원에서 사용되는 용어 "rAAV 게놈"은 rAAV의 게놈 서열을 포함하는 핵산 분자(예를 들어, DNA 및/또는 RNA)를 지칭한다. 당업자는 rAAV 게놈이 이식유전자(예를 들어, 전사 조절 요소에 작동 가능하게 연결된 IDS 코팅 서열)를 포함하는 경우, rAAV 게놈이 이식유전자의 전사 방향에 대해 센스 또는 안티센스 배향에 있을 수 있음을 이해할 것이다.

본원에서 사용되는 용어 "AAV 캡시드 단백질"은 AAV VP1, VP2, 또는 VP3 캡시드 단백질을 지칭한다. 용어 "클레이드(Clade) F 캡시드 단백질"은 본원에서 각각 서열번호 1~736, 138~736, 및 203~736의 아미노산에 제시된 VP1, VP2 또는 VP3 아미노산 서열과 적어도 90%의 동일성을 갖는 AAV VP1, VP2 또는 VP3 캡시드 단백질을 지칭한다.

본원에서 사용되는 바와 같이, 2개의 뉴클레오티드 서열 사이 또는 2개의 아미노산 서열 사이의 "백분율 동일성"은 정렬된 서열 쌍 사이의 일치되는 수에 100을 곱하고, 내부 갭을 포함하는 정렬된 영역의 길이를 나눔으로써 계산된다. 동일성 채점은 완벽한 일치만을 계산하며, 아미노산의 서로 유사한 정도는 고려하지 않는다. 내부 갭만이 길이에 포함되고, 서열 말단에서의 갭은 포함되지 않는다.

본원에서 사용되는 "IDS 유전자 돌연변이와 연관된 질환 또는 장애"라는 용어는 IDS 유전자의 돌연변이에 의해 야기되거나, 이에 의해 악화되거나, 또는 이와 유전적으로 연결된 임의의 질환 또는 장애를 지칭한다. 특정 구현예에서, IDS 유전자 돌연변이와 연관된 질환 또는 장애는 헌터 증후군 또는 뮤코다당류증 II(MPS II)이다.

본원에서 사용되는 용어 "암호화 서열"은, 시작 코돈에서 시작하여 정지 코돈에서 끝나는, 폴리펩티드를 암호화하는 상보적 DNA(cDNA)의 부분을 지칭한다. 유전자는 대안적 스플라이싱, 대안적 번역 개시, 및 모집단 내 변이로 인해 하나 이상의 암호화 서열을 가질 수 있다. 암호화 서열은 야생형이거나 침묵 변형되거나 인트론-삽입될 수 있다. 예시적인 야생형 IDS 암호화 서열은 서열번호 24에 제시되어 있다.

본원에서 사용되는 용어 "침묵 변형된"은 암호화 서열 또는 스터퍼-삽입 암호화 서열에 의해 암호화된 폴리펩티드의 아미노산 서열을 변화시키지 않는 (예를 들어, 뉴클레오티드 치환에 의한) 유전자의 암호화 서열 또는 인트론-삽입 암호화 서열의 변형을 지칭한다. 이러한 침묵 변형은 암호화 서열이 세포 내로 형질도입될 때 암호화 서열의 번역 효율을 증가시킬 수 있고/있거나 내인성 유전자의 상응하는 서열과의 재조합을 방지할 수 있다는 점에서 유리하다. 본원에 기술된 바와 같은 예시적인 침묵 변형된 IDS 암호화 서열은 서열번호 26, 67, 또는 68에 제시되어 있다.

본원에서 사용되는 용어 유전자의 "인트론-삽입 암호화 서열"은 유전자의 암호화 서열에 삽입된 하나 이상의 인트론을 포함하는 뉴클레오티드 서열을 지칭한다. 유전자의 인트론-삽입 암호화 서열은 인트론을 포함하는 인트론-삽입 암호화 서열로도 지칭된다. 특정 구현예에서, 인트론 중 적어도 하나는 비천연 또는 이종 인트론, 즉, 유전자의 천연 인트론과 상이한 서열을 갖는 인트론이다. 특정 구현예에서, 인트론-삽입 암호화 서열의 모든 인트론은 비천연 인트론이다. 비천연 인트론은 상이한 종으로부터의 인트론의 서열 또는 동일한 종으로부터의 또는 상이한 종으로부터의 상이한 유전자에서의 인트론의 서열을 가질 수 있다. 대안적으로 또는 추가적으로, 비천연 인트론 서열의 적어도 일부는 합성일 수 있다. 당업자는 비천연 인트론 서열이 당업계에 공지된 임의의 공동(consensus) 스플라이싱 모티프를 도입함으로써 RNA 스플라이싱을 매개하도록 설계될 수 있음을 이해할 것이다. 예시적인 공동 스플라이싱 모티프는 Sibley 등의 문헌[(2016) Nature Reviews Genetics, 17, 407-21]에 제공되며, 그 전문은 본원에 참조로서 통합된다. 비천연 인트론의 삽입은 벡터 패키징의 효율 및 견고성을 증진할 수 있는데, 이는 이러한 서열이 벡터가 최적의 크기(예를 들어, 4.5~4.8 kb)에 도달할 수 있도록 조정을 가능하게 하기 때문이다. 특정 구현예에서, 인트론 중 적어도 하나는 유전자의 천연 인트론이다. 특정 구현예에서, 인트론-삽입 암호화 서열의 모든 인트론은 유전자의 천연 인트론이다. 비천연 또는 천연 인트론은 암호화 서열 내 임의의 뉴클레오티드간 결합에 삽입될 수 있다. 특정 구현예에서, 하나 이상의 비천연 또는 천연 인트론은 효율적인 스플라이싱을 촉진하기 위해 예측된 뉴클레오티드간 결합에 삽입된다(예를 들어, Zhang (1998) Human Molecular Genetics, 7(5):919-32참조, 그 개시 내용은 그 전체가 참조로서 본원에 통합됨). 특정 구현예에서, 하나 이상의 비천연 또는 천연 인트론은 2개의 내인성 엑손을 연결하는 뉴클레오티드간 결합에 삽입된다. 따라서, 특정 구현예에서, 유전자의 인트론-삽입 암호화 서열은 효율적인 스플라이싱을 위해 설계된 하나 이상의 인트론을 포함한다. 특정 구현예에서, 하나 이상의 인트론은 (예를 들어, 인트론 매개 강화(IME)를 통해) 유전자의 발현을 향상시키기 위해 유전자의 암호화 서열 내에 삽입될 수 있다.

본원에서 사용되는 용어 "이종 인트론" 및 "비천연 인트론"은 주어진 유전자에 대해 천연이 아닌 인트론을 지칭한다.

본 개시에서, IDS 유전자에서의 뉴클레오티드 위치는 시작 코돈의 제1 뉴클레오티드와 관련하여 명시된다. 시작 코돈의 제1 뉴클레오티드는 위치 1이고; 시작 코돈의 제1 뉴클레오티드에 대한 5' 뉴클레오티드는 음의 수를 가지고; 시작 코돈의 제1 뉴클레오티드에 대한 3' 뉴클레오티드는 양의 수를 가진다. 인간 IDS 유전자의 예시적인 뉴클레오티드 1은 NCBI 참조 서열 NG_011900.3(등록 영역 NG_011900, 영역 5029..33347, 분류군 9606, 염색체 X, 맵 Xq28)의 뉴클레오티드 170이고, 인간 IDS 유전자의 예시적인 뉴클레오티드 3은 NCBI 참조 서열 NG_011900.3의 뉴클레오티드 172이다. 시작 코돈에 인접한 5' 뉴클레오티드는 뉴클레오티드 -1이다.

본원에서 사용되는 용어 "전사 조절 요소" 또는 "TRE"는 RNA 중합효소에 의해 작동 가능하게 연결된 뉴클레오티드 서열의 전사를 조절(예를 들어, 제어, 증가, 또는 감소)하여 RNA 분자를 형성하는 시스-작용 뉴클레오티드 서열, 예를 들어, DNA 서열을 지칭한다. TRE는 전사 인자와 같은 하나 이상의 트랜스-작용 분자에 의존하여 전사를 조절한다. 따라서, 하나의 TRE는, 예를 들어, 상이한 유형의 세포에 존재할 때, 상이한 트랜스-작용 분자와 접촉할 경우 상이한 방식으로 전사를 조절할 수 있다. TRE는 하나 이상의 프로모터 요소 및/또는 인핸서 요소를 포함할 수 있다. 당업자는, 유전자 내의 프로모터 및 인핸서 요소가 위치상 근접할 수 있고, 용어 "프로모터"는 프로모터 요소 및 인핸서 요소를 포함하는 서열을 지칭할 수 있음을 이해할 것이다. 따라서, 용어 "프로모터"는 서열에서의 인핸서 요소를 배제하지 않는다. 프로모터 및 인핸서 요소는 동일한 유전자 또는 종으로부터 유래될 필요가 없으며, 각각의 프로모터 또는 인핸서 요소의 서열은 게놈 내의 상응하는 내인성 서열과 동일하거나 실질적으로 동일할 수 있다.

본원에서 사용되는 용어 "작동 가능하게 연결된"은 TRE와 전사될 암호화 서열 사이의 연결을 설명하는 데 사용된다. 일반적으로, 유전자 발현은 하나 이상의 프로모터 및/또는 인핸서 요소를 포함하는 TRE의 조절 하에 배치된다. 암호화 서열의 전사가 TRE에 의해 제어되거나 영향을 받는 경우, 암호화 서열은 TRE에 "작동 가능하게 연결"된다. TRE의 프로모터 및 인핸서 요소는 원하는 전사 활성이 수득되는 한, 암호화 서열로부터 임의의 배향 및/또는 거리에 있을 수 있다. 특정 구현예에서, TRE는 암호화 서열로부터 상류에 있다.

본원에서 사용되는 용어 "폴리아데닐화 서열"은 RNA로 전사될 때 폴리아데닐화 신호 서열을 구성하는 DNA 서열을 지칭한다. 폴리아데닐화 서열은 (예를 들어, IDS 유전자로부터 유래된) 천연이거나 외인성일 수 있다. 외인성 폴리아데닐화 서열은 포유류 또는 바이러스 폴리아데닐화 서열(예를 들어, SV40 폴리아데닐화 서열)일 수 있다.

본원에서 사용되는 "외인성 폴리아데닐화 서열"은 IDS 유전자(예를 들어, 인간 IDS 유전자)의 내인성 폴리아데닐화 서열과 동일하지 않거나 실질적으로 동일하지 않은 폴리아데닐화 서열을 지칭한다. 특정 구현예에서, 외인성 폴리아데닐화 서열은 동일한 종(예를 들어, 인간)에서의 비-IDS 유전자의 폴리아데닐화 서열이다. 특정 구현예에서, 외인성 폴리아데닐화 서열은 상이한 종(예를 들어, 바이러스)의 폴리아데닐화 서열이다.

본원에서 사용되는, 대상체에게 AAV를 투여하는 맥락에서의 용어 "유효량"은 원하는 예방 효과 또는 치료 효과를 달성하는 AAV의 양을 지칭한다.

본원에서 사용되는 바와 같이, IDS 단백질의 발현 수준과 같은 측정 가능한 값을 지칭할 때, 용어 "약" 또는 "대략"은, 주어진 값 또는 범위의 ±20% 또는 ±10%, ±5%, ±1%, 또는 ±0.1%의 변이를 포함하고, 본원에 개시된 방법을 수행하기에 적절하다.

II. 아데노-연관 바이러스 조성물

일 양태에서, IDS 유전자 기능이 감소되거나 결함이 있는 세포에서 IDS 폴리펩티드를 발현시키는데 유용한 신규 rAAV 조성물이 본원에 제공된다. 특정 구현예에서, 본원에 개시된 AAV는 캡시드 단백질(예를 들어, AAV 클레이드 F 캡시드 단백질)을 포함하는 AAV 캡시드; 및 AAV가 형질도입된 세포에서 IDS의 염색체 외 발현을 가능하게 하는 인트론-삽입 IDS 암호화 서열(예를 들어, 침묵 변형된 인트론-삽입 IDS 암호화 서열)에 작동가능하게 연결된 전사 조절 요소를 포함하는 rAAV 게놈을 포함한다.

AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, 또는 AAV9 혈청형으로부터의 캡시드 단백질을 포함하되 이로 제한되지 않는, 당업계에 공지된 임의의 캡시드로부터의 캡시드 단백질이 본원에 개시된 rAAV 조성물에 사용될 수 있다. 예를 들어, 특정 구현예에서, 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 구현예에서, 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하며, 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 내 아미노산은 C이거나 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 내의 아미노산이 H이거나; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 내의 아미노산이 Q이거나; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 내의 아미노산이 A이거나; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 내의 아미노산이 N이거나; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 내의 아미노산이 S이거나; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 내의 아미노산이 I이거나; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내의 아미노산이 G 또는 Y이거나; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 내의 아미노산이 M이거나; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 내의 아미노산이 K이거나; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 내의 아미노산이 C이거나; 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 내 아미노산은 G이다. 특정 구현예에서, 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내 아미노산은 G이고; 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 내 아미노산은 G이다. 특정 구현예에서, 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 내 아미노산은 H이고; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 내 아미노산은 N이고; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내 아미노산은 R이고, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 내 아미노산은 M이다. 특정 구현예에서, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내 아미노산은 R이고, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 내 아미노산은 R이다. 특정 구현예에서, 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 내 아미노산은 A이고, 서열번번호 16의 아미노산 505에 상응하는 캡시드 단백질 내 아미노산은 R이다. 특정 구현예에서, 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 내 아미노산은 I이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내 아미노산은 R이고, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 내 아미노산은 C이다. 특정 구현예에서, 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산 서열을 포함한다.

예를 들어, 특정 구현예에서, 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 구현예에서, 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하며, 여기에서 서열번호 16의 아미노산 151에 상응하는 캡시드 단백질 내 아미노산은 R이거나; 서열번호 16의 아미노산 160에 상응하는 캡시드 단백질 내의 아미노산이 D이거나; 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 내의 아미노산이 C이거나; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 내의 아미노산이 H이거나; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 내의 아미노산이 Q이거나; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 내의 아미노산이 A이거나; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 내의 아미노산이 N이거나; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 내의 아미노산이 S이거나; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 내의 아미노산이 I이거나; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내의 아미노산이 G 또는 Y이거나; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 내의 아미노산이 M이거나; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 내의 아미노산이 K이거나; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 내의 아미노산이 C이거나; 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 내의 아미노산은 G이다. 특정 구현예에서, 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내의 아미노산은 G이고, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 내의 아미노산은 G이다. 특정 구현예에서, 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 내의 아미노산은 H이고, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 내의 아미노산은 N이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산은 R이고, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 내의 아미노산은 M이다. 특정 구현예에서, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산은 R이고, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 내의 아미노산은 R이다. 특정 구현예에서, 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 내의 아미노산은 A이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산은 R이다. 특정 구현예에서, 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 내의 아미노산은 I이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산은 R이고, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 내 아미노산은 C이다. 특정 구현예에서, 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열을 포함한다.

예를 들어, 특정 구현예에서, 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 구현예에서, 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하며, 여기에서 서열번호 16의 아미노산 2에 상응하는 캡시드 단백질 내의 아미노산은 T이거나; 서열번호 16의 아미노산 65에 상응하는 캡시드 단백질 내의 아미노산이 I이거나; 서열번호 16의 아미노산 68에 상응하는 캡시드 단백질 내의 아미노산이 V이거나; 서열번호 16의 아미노산 77에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 119에 상응하는 캡시드 단백질 내의 아미노산이 L이거나; 서열번호 16의 아미노산 151에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 160에 상응하는 캡시드 단백질 내의 아미노산이 D이거나; 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 내의 아미노산이 C이거나; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 내의 아미노산이 H이거나; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 내의 아미노산이 Q이거나; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 내의 아미노산이 A이거나; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 내의 아미노산이 N이거나; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 내의 아미노산이 S이거나; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 내의 아미노산이 I이거나; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내의 아미노산이 G 또는 Y이거나; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 내의 아미노산이 M이거나; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 내의 아미노산이 K이거나; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 내의 아미노산이 C이거나; 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 내의 아미노산은 G이다. 특정 구현예에서, 서열번호 16의 아미노산 2에 상응하는 캡시드 단백질 내의 아미노산은 T이고, 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 내의 아미노산은 Q이다. 특정 구현예에서, 서열번호 16의 아미노산 65에 상응하는 캡시드 단백질 내의 아미노산은 I이고, 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내의 아미노산은 Y이다. 특정 구현예에서, 서열번호 16의 아미노산 77에 상응하는 캡시드 단백질 내의 아미노산은 R이고, 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 내의 아미노산은 K이다. 특정 구현예에서, 서열번호 16의 아미노산 119에 상응하는 캡시드 단백질 내의 아미노산은 L이고, 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 내의 아미노산은 S이다. 특정 구현예에서, 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내의 아미노산은 G이고, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 내의 아미노산은 G이다. 특정 구현예에서, 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 내의 아미노산은 H이고, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 내의 아미노산은 N이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산은 R이고, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 내의 아미노산은 M이다. 특정 구현예에서, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산은 R이고, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 내의 아미노산은 R이다. 특정 구현예에서, 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 내의 아미노산은 A이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산은 R이다. 특정 구현예에서, 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 내의 아미노산은 I이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산은 R이고, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 내의 아미노산은 C이다. 특정 구현예에서 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열을 포함한다.

특정 구현예에서, AAV 캡시드 단백질은 다음 중 둘 이상을 포함한다: (a) 서열번호 1, 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열을 포함하는 캡시드 단백질. 특정 구현예에서, AAV 캡시드 단백질은 다음을 포함한다: (a) 서열번호 1, 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; (b) 서열번호 1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; 및 (c) 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질.

특정 구현예에서, AAV 캡시드 단백질은 다음 중 하나 이상을 포함한다: (a)서열번호 8의 아미노산 203 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 8의 아미노산 138 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 8의 아미노산 1 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질. 특정 구현예에서, AAV 캡시드는 다음 중 하나 이상을 포함한다: (a) 서열번호 8의 아미노산 203 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 8의 아미노산 138 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 8의 아미노산 1 내지 736의 아미노산 서열을 포함하는 캡시드 단백질. 특정 구현예에서, AAV 캡시드는 다음 중 둘 이상을 포함한다: (a) 서열번호 8의 아미노산 203 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 8의 아미노산 138 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 8의 아미노산 1 내지 736의 아미노산 서열을 포함하는 캡시드 단백질. 특정 구현예에서, AAV 캡시드는 다음을 포함한다: (a) 서열번호 8의 아미노산 203 내지 736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; (b) 서열번호 8의 아미노산 138 내지 736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; 및 (c) 서열번호 8의 아미노산 1 내지 736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질.

특정 구현예에서, AAV 캡시드 단백질은 다음 중 하나 이상을 포함한다: (a) 서열번호 11의 아미노산 203 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 11의 아미노산 138 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 11의 아미노산 1 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질. 특정 구현예에서, AAV 캡시드는 다음 중 하나 이상을 포함한다: (a) 서열번호 11의 아미노산 203 내지 736의 아미노산 서열을 포함하는 캡시드 단백질;. (b) 서열번호 11의 아미노산 138 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 11의 아미노산 1 내지 736의 아미노산 서열을 포함하는 캡시드 단백질. 특정 구현예에서, AAV 캡시드는 다음 중 둘 이상을 포함한다: (a) 서열번호 11의 아미노산 203 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 11의 아미노산 138 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 11의 아미노산 1 내지 736의 아미노산 서열을 포함하는 캡시드 단백질. 특정 구현예에서, AAV 캡시드는 다음을 포함한다: (a) 서열번호 11의 아미노산 203 내지 736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; (b) 서열번호 11의 아미노산 138 내지 736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; 및 (c) 서열번호 11의 아미노산 1 내지 736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질.

특정 구현예에서, AAV 캡시드 단백질은 다음 중 하나 이상을 포함한다: (a) 서열번호 13의 아미노산 203 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 13의 아미노산 138 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 13의 아미노산 1 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질. 특정 구현예에서, AAV 캡시드는 다음 중 하나 이상을 포함한다: (a) 서열번호 13의 아미노산 203 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 13의 아미노산 138 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 13의 아미노산 1 내지 736의 아미노산 서열을 포함하는 캡시드 단백질. 특정 구현예에서, AAV 캡시드는 다음 중 둘 이상을 포함한다: (a) 서열번호 13의 아미노산 203 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 13의 아미노산 138 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 13의 아미노산 1 내지 736의 아미노산 서열을 포함하는 캡시드 단백질. 특정 구현예에서, AAV 캡시드는 다음을 포함한다: (a) 서열번호 13의 아미노산 203 내지 736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; (b) 서열번호 13의 아미노산 138 내지 736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; 및 (c) 서열번호 13의 아미노산 1 내지 736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질.

특정 구현예에서, AAV 캡시드 단백질은 다음 중 하나 이상을 포함한다: (a) 서열번호 16의 아미노산 203 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 16의 아미노산 138 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 16의 아미노산 1 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질. 특정 구현예에서, AAV 캡시드는 다음 중 하나 이상을 포함한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 16의 아미노산 1 내지 736의 아미노산 서열을 포함하는 캡시드 단백질. 특정 구현예에서, AAV 캡시드는 다음 중 둘 이상을 포함한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 16의 아미노산 1 내지 736의 아미노산 서열을 포함하는 캡시드 단백질. 특정 구현예에서, AAV 캡시드는 다음을 포함한다: (a) 서열번호 16의 아미노산 203 내지 736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; (b) 서열번호 16의 아미노산 138 내지 736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; 및 (c) 서열번호 16의 아미노산 1 내지 736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질.

본원에 개시된 AAV 조성물에 유용한 rAAV 게놈은 일반적으로 인트론-삽입 IDS 암호화 서열에 작동 가능하게 연결된 전사 조절 요소(TRE)를 포함한다. 특정 구현예에서, rAAV 게놈은 TRE 및 인트론-삽입 IDS 암호화 서열의 5' 역위 말단 반복(5' ITR) 뉴클레오티드 서열 5', 및 TRE 및 인트론-삽입 IDS 암호화 서열의 3' 역위 말단 반복(3' ITR) 뉴클레오티드 서열 3'을 포함한다.

특정 구현예에서, 인트론-삽입 IDS 암호화 서열은 IDS 유전자의 암호화 서열의 전부 또는 실질적으로 전부를 포함한다. 특정 구현예에서, rAAV 게놈은 서열번호 23을 암호화하는 뉴클레오티드 서열을 포함하고, 선택적으로 인트론-삽입 IDS 암호화 서열의 3'에 외인성 폴리아데닐화 서열을 추가로 포함할 수 있다. 특정 구현예에서, 서열번호 23을 암호화하는 인트론-삽입 IDS 암호화 서열의 뉴클레오티드 서열은 야생형이다(예를 들어, 서열번호 25에 제시된 서열을 가짐). 특정 구현예에서, 서열번호 23을 암호화하는 인트론-삽입 IDS 암호화 서열의 뉴클레오티드 서열은 침묵 변형된다(예를 들어, 서열번호 27, 59, 또는 60에 제시된 서열을 가짐).

특정 구현예에서, 인트론-삽입 IDS 암호화 서열은 IDS 단백질의 아미노산 서열의 전부 또는 실질적으로 전부를 포함하는 폴리펩티드를 암호화한다. 특정 구현예에서, 인트론-삽입 IDS 암호화 서열은 야생형 IDS 단백질(예를 들어, 인간 IDS 단백질)의 아미노산 서열을 암호화한다. 특정 구현예에서, 인트론-삽입 IDS 암호화 서열은 돌연변이 IDS 단백질(예를 들어, 인간 IDS 단백질)의 아미노산 서열을 암호화하며, 여기에서 돌연변이 IDS 폴리펩티드는 야생형 IDS 폴리펩티드의 기능적 균등물이다. 즉, 야생형 IDS 폴리펩티드로서 기능할 수 있다. 특정 구현예에서, 기능적으로 균등한 IDS 폴리펩티드는 야생형 IDS 폴리펩티드에서 발견되지 않는 적어도 하나의 특성, 예를 들어, 단백질 분해에 저항하는 능력을 추가로 포함한다.

특정 구현예에서, 본원에 개시된 AAV 조성물에 유용한 rAAV 게놈은 일반적으로 IDS를 암호화하는 인트론-삽입 암호화 서열에 작동 가능하게 연결된 전사 조절 요소(TRE)를 포함한다.

rAAV 게놈은 임의의 포유류 세포(예를 들어, 인간 세포)에서 IDS를 발현하는데 사용될 수 있다. 따라서, TRE는 임의의 포유류 세포(예를 들어, 인간 세포)에서 활성일 수 있다. 특정 구현예에서, TRE는 광범위한 인간 세포에서 활성이다. 이러한 TRE는 거대세포바이러스(CMV) 프로모터/인핸서(예를 들어, 서열번호 29, 40, 또는 46에 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함함), SV40 프로모터, 닭 ACTB 프로모터(예를 들어, 서열번호 47에 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함함), JeT 프로모터(예를 들어, 서열번호 30에 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함함), smCBA 프로모터(예를 들어, 서열번호 55에 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함함), 인간 신장 인자 1 알파(EF1α) 프로모터(예를 들어, 서열번호 39에 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함함), 전사 인자 결합 부위를 포함하는 미세 생쥐 바이러스(MVM) 인트론(예를 들어, 서열번호 33에 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함함), 인간 포스포글리세레이트 키나아제(PGK1) 프로모터, 인간 유비퀴틴 C(Ubc) 프로모터, 인간 베타 액틴 프로모터, 인간 뉴런-특이적 에놀라아제(ENO2) 프로모터, 인간 베타-글루쿠로니다아제(GUSB) 프로모터, 토끼 베타-글로빈 요소(예를 들어, 서열번호 41에 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함함), 인간 칼모둘린 1(CALM1) 프로모터(예를 들어, 서열번호 44에 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함함), 및/또는 인간 메틸-CpG 결합 단백질 2(MeCP2) 프로모터를 포함하는 구성 프로모터 및/또는 인핸서 요소를 포함할 수 있다. 이들 TRE 중 어느 하나는 효율적인 전사를 유도하기 위해 임의의 순서로 조합될 수 있다. 예를 들어, rAAV 게놈은 CMV 인핸서, CBA 프로모터, 및 집합적으로 CAG 프로모터로 지칭되는 토끼 베타-글로빈 유전자의 엑손 3의 스플라이싱 수용체를 포함할 수 있다(예를 들어, 서열번호 42와 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함함). 예를 들어, rAAV 게놈은 집합적으로 CASI 프로모터 영역으로 지칭되는 CMV 인핸서 및 CBA 프로모터, 및 이에 이어지는 스플라이싱 공여자 및 스플라이싱 수용체를 포함할 수 있다(예를 들어, 서열번호 48과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함함).

대안적으로, TRE는 조직-특이적 TRE일 수 있는데, 즉, 특정 조직(들) 및/또는 기관(들)에서 활성이다. 조직-특이적 TRE는 하나 이상의 조직-특이적 프로모터 및/또는 인핸서 요소, 및 선택적으로 하나 이상의 구성 프로모터 및/또는 인핸서 요소를 포함한다. 당업자는 조직-특이적 프로모터 및/또는 인핸서 요소가 당업계에 공지된 방법에 의해 조직에서 특이적으로 발현된 유전자로부터 단리될 수 있음을 이해할 것이다.

특정 구현예에서, TRE는 뇌-특이적(예를 들어, 뉴런-특이적, 신경교세포-특이적, 성상교세포-특이적, 희소돌기교세포-특이적, 미세교세포-특이적 및/또는 중추 신경계-특이적)이다. 예시적인 뇌-특이적 TRE는, 제한 없이, 인간 신경교 섬유소 산성 단백질(GFAP) 프로모터, 인간 시냅신 1(SYN1) 프로모터, 인간 시냅신 2(SYN2) 프로모터, 인간 메탈로티오네인 3(MT3) 프로모터, 및/또는 인간 프로테오리피드 단백질 1(PLP1) 프로모터로부터의 하나 이상의 요소를 포함할 수 있다. 더 많은 뇌-특이적 프로모터 요소가 WO2016/100575A1에 개시되어 있으며, 이는 그 전체가 참조로서 본원에 통합된다.

특정 구현예에서, rAAV 게놈은 전술한 TRE 중 적어도 하나를 선택적으로 포함하는, 2개 이상의 TRE를 포함한다. 당업자는 이들 TRE 중 임의의 것이 임의의 순서로 조합될 수 있고, 구성 TRE 및 조직-특이적 TRE의 조합이 효율적이고 조직-특이적인 전사를 유도할 수 있음을 이해할 것이다.

특정 구현예에서, rAAV 벡터는 IDS 암호화 서열의 5'에 또는 이에 삽입된 인트론을 추가로 포함한다. 이러한 인트론은, 예를 들어, 전사 침묵을 감소시키고 핵에서 세포질로 mRNA를 내보내는 것을 향상시킴으로써 이식유전자 발현을 증가시킬 수 있다. 특정 구현예에서, rAAV 게놈은 5'에서 3'으로 비암호화 엑손, 인트론, 및 IDS 암호화 서열을 포함한다. 특정 구현예에서, 인트론 서열은 IDS 암호화 서열에 삽입되되, 선택적으로, 인트론은 2개의 천연 엑손을 연결하는 뉴클레오티드 간 결합에 삽입된다. 특정 구현예에서, 인트론은 천연 엑손 1 및 엑손 2를 연결하는 뉴클레오티드간 결합에 삽입된다.

인트론은 IDS 유전자의 천연 인트론 서열, 상이한 종으로부터 또는 동일한 종으로부터의 상이한 유전자로부터의 인트론 서열(즉, 비천연 또는 이종 인트론), 및/또는 합성 인트론 서열을 포함할 수 있다. 당업자는 합성 인트론 서열이 당업계에 공지된 임의의 공통 스플라이싱 모티프를 도입함으로써 RNA 스플라이싱을 매개하도록 설계될 수 있음을 이해할 것이다(예를 들어, Sibley 등의 문헌[(2016) Nature Reviews Genetics, 17, 407-21 참조, 이는 그 전체가 본원에 참조로서 통합됨). 예시적인 인트론 서열은 Lu등의 문헌 [(2013) Molecular Therapy 21(5): 954-63], 및 Lu 등의 문헌 [(2017) Hum. Gene Ther. 28(1): 125-34]에 제공되며, 그 전체가 참조로서 본원에 통합된다. 특정 구현예에서, rAAV 게놈은 SV40 요소(예를 들어, 서열번호 31과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열을 포함함) 또는 마우스의 미세 바이러스(MVM) 인트론(예를 들어, 서열번호 33과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열을 포함함)을 포함한다. 특정 구현예에서, rAAV 게놈은 SV40 요소(예를 들어, 서열번호 31에 제시된 뉴클레오티드 서열을 포함함) 또는 마우스의 미세 바이러스(MVM) 인트론(예를 들어, 서열번호 33에 제시된 뉴클레오티드 서열을 포함함)을 포함한다. 특정 구현예에서, rAAV 게놈은, 부분적으로 전사되지 않은 닭 ACTB(cACTB) 프로모터, 모든 cACTB 엑손 1, 부분적으로 cACTB 인트론 1, 부분적으로 토끼 HBB2(rHBB2) 인트론 2, 및 부분적으로 rHBB2 엑손 3을 포함하는, 닭 및 토끼 서열의 조합을 포함하는 키메라 인트론 서열(예를 들어, 서열번호 32)을 포함한다. 특정 구현예에서, rAAV 게놈은 키메라 인트론 서열(예를 들어, 서열번호 32와 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열을 포함함)을 포함한다. 특정 구현예에서, rAAV 게놈은 키메라 인트론 서열(예를 들어, 서열번호 32에 제시된 뉴클레오티드 서열을 포함함)을 포함한다.

특정 구현예에서, rAAV 게놈은 CMV 인핸서, CBA 프로모터, 및 키메라 인트론 서열(예를 들어, 서열번호 36과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열을 포함함)을 포함하는 TRE를 포함한다. 특정 구현예에서, rAAV 게놈은 서열번호 36을 포함하는 TRE를 포함한다.

특정 구현예에서, rAAV 게놈은 서열번호 29와 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열을 포함하는 TRE를 포함한다. 특정 구현예에서, rAAV 게놈은 서열번호 29를 포함하는 TRE를 포함한다.

특정 구현예에서, 본원에서 개시된 rAAV 게놈은 전사 종결자(예를 들어, 폴리아데닐화 서열)를 추가로 포함한다. 특정 구현예에서, 전사 종결자는 인트론-삽입 IDS 암호화 서열에 대해 3'이다. 전사 종결자는 전사를 효과적으로 종료하는 임의의 서열일 수 있고, 당업자는 이러한 서열이 인트론-삽입 IDS 암호화 서열의 전사가 필요한 세포에서 발현되는 임의의 유전자로부터 단리될 수 있음을 이해할 것이다. 특정 구현예에서, 전사 종결자는 폴리아데닐화 서열을 포함한다. 특정 구현예에서, 폴리아데닐화 서열은 인간 IDS 유전자의 내인성 폴리아데닐화 서열과 동일하거나 실질적으로 동일하다. 특정 구현예에서, 폴리아데닐화 서열은 외인성 폴리아데닐화 서열이다. 특정 구현예에서, 폴리아데닐화 서열은 SV40 폴리아데닐화 서열(예를 들어, 서열번호 34, 35, 또는 45에 제시된 뉴클레오티드 서열, 또는 이에 상보적인 뉴클레오티드 서열을 포함함)이다. 특정 구현예에서, 폴리아데닐화 서열은 서열번호 45에 제시된 서열을 포함한다.

특정 구현예에서, rAAV 게놈은 5'에서 3'으로 TRE, 인트론-삽입 IDS 암호화 서열, 및 폴리아데닐화 서열을 포함한다. 특정 구현예에서, TRE는 서열번호 29, 30, 31, 32, 33, 35, 36, 39, 40, 41, 42, 44, 46, 47, 48, 및/또는 55 중 어느 하나에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖고/갖거나; 인트론-삽입 IDS 암호화 서열은 서열번호 25, 27, 59 또는 60에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖고/갖거나; 폴리아데닐화 서열은 서열번호 34, 35 또는 45 중 어느 하나에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다.

특정 구현예에서, TRE는 서열 번호 29에 제시된 뉴클레오티드 서열을 포함하고/하거나; 인트론-삽입 IDS 암호화 서열은 서열번호 25에 제시된 서열을 포함하고/하거나; 폴리아데닐화 서열은 서열번호 45에 제시된 서열을 포함한다.

특정 구현예에서, TRE는 서열 번호 29에 제시된 뉴클레오티드 서열을 포함하고/하거나; 인트론-삽입 IDS 암호화 서열은 서열번호 27에 제시된 서열을 포함하고/하거나; 폴리아데닐화 서열은 서열번호 45에 제시된 서열을 포함한다.

특정 구현예에서, TRE는 서열 번호 29에 제시된 뉴클레오티드 서열을 포함하고/하거나; 인트론-삽입 IDS 암호화 서열은 서열번호 59에 제시된 서열을 포함하고/하거나; 폴리아데닐화 서열은 서열번호 45에 제시된 서열을 포함한다.

특정 구현예에서, TRE는 서열 번호 29에 제시된 뉴클레오티드 서열을 포함하고/하거나; 인트론-삽입 IDS 암호화 서열은 서열번호 60에 제시된 서열을 포함하고/하거나; 폴리아데닐화 서열은 서열번호 45에 제시된 서열을 포함한다.

특정 구현예에서, rAAV 게놈은 서열번호 37, 43, 52, 54, 61, 63, 65, 69, 75, 또는 77과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 포함한다. 특정 구현예에서, rAAV 게놈은 서열번호 37, 43, 52, 54, 61, 63, 65, 69, 75, 또는 77에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 37, 43, 52, 54, 61, 63, 65, 69, 75, 또는 77에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, rAAV 게놈은 서열번호 37에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 37에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, rAAV 게놈은 서열번호 43에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 43에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, rAAV 게놈은 서열번호 52에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 52에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, rAAV 게놈은 서열번호 54에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 54에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, rAAV 게놈은 서열번호 61에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 61에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, rAAV 게놈은 서열번호 63에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 63에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, rAAV 게놈은 서열번호 65에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 65에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, rAAV 게놈은 서열번호 69에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 69에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, rAAV 게놈은 서열번호 75에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 75에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, rAAV 게놈은 서열번호 77에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 77에 제시된 뉴클레오티드 서열로 이루어진다.

특정 구현예에서, 본원에 개시된 rAAV 게놈은 TRE의 5'에 5' 역위 말단 반복(5' ITR) 뉴클레오티드 서열, 및 IDS 암호화 서열의 3'에 3' 역위 말단 반복(3' ITR) 뉴클레오티드 서열을 추가로 포함한다. 임의의 AAV 혈청형 또는 이의 변이체로부터의 ITR 서열은 본원에 개시된 rAAV 게놈에 사용될 수 있다. 5' 및 3' ITR은 동일한 혈청형의 AAV 또는 상이한 혈청형의 AAV로부터 유래할 수 있다. 본원에 개시된 rAAV 게놈에 사용하기 위한 예시적인 ITR은 본원에서 서열번호 14, 18~21, 28, 49, 51, 57, 및 72~74에 제시되어 있다.

특정 구현예에서, 5' ITR 또는 3' ITR은 AAV2로부터 유래한다. 특정 구현예에서, 5' ITR 및 3' ITR 둘 모두는 AAV2로부터 유래한다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 18에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖거나, 3' ITR 뉴클레오티드 서열은 서열번호 14에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 18에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 가지며, 3' ITR 뉴클레오티드 서열은 서열번호 14에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다. 특정 구현예에서, rAAV 게놈은 서열번호 37, 43, 52, 또는 54 중 어느 하나에 제시된 뉴클레오티드 서열, 서열번호 18의 서열을 갖는 5' ITR 뉴클레오티드 서열, 및 서열번호 14의 서열을 갖는 3' ITR 뉴클레오티드 서열을 포함한다.

특정 구현예에서, 5' ITR 또는 3' ITR은 AAV2로부터 유래한다. 특정 구현예에서, 5' ITR 및 3' ITR 둘 모두는 AAV2로부터 유래한다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 18에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖거나, 3' ITR 뉴클레오티드 서열은 서열번호 19에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 18에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 가지며, 3' ITR 뉴클레오티드 서열은 서열번호 19에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다. 특정 구현예에서, rAAV 게놈은 서열번호 37, 43, 52, 또는 54 중 어느 하나에 제시된 뉴클레오티드 서열, 서열번호 18의 서열을 갖는 5' ITR 뉴클레오티드 서열, 및 서열번호 19의 서열을 갖는 3' ITR 뉴클레오티드 서열을 포함한다.

특정 구현예에서, 5' ITR 또는 3' ITR은 AAV5로부터 유래한다. 특정 구현예에서, 5' ITR 및 3' ITR 둘 모두는 AAV5로부터 유래한다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열이 서열번호 20에 대해 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖거나, 3' ITR 뉴클레오티드 서열이 서열번호 21에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 20에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 가지며, 3' ITR 뉴클레오티드 서열은 서열번호 21에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다. 특정 구현예에서, rAAV 게놈은 서열번호 37, 43, 52, 또는 54 중 어느 하나에 제시된 뉴클레오티드 서열, 서열번호 20의 서열을 갖는 5' ITR 뉴클레오티드 서열, 및 서열번호 21의 서열을 갖는 3' ITR 뉴클레오티드 서열을 포함한다.

특정 구현예에서, 5' ITR 뉴클레오티드 서열 및 3' ITR 뉴클레오티드 서열은 서로 실질적으로 상보적(예를 들어, 5' 또는 3' ITR에서 1, 2, 3, 4 또는 5개의 뉴클레오티드 위치에서의 불일치를 제외하고 서로 상보적임)이다.

특정 구현예에서, 5' ITR 또는 3' ITR은 Rep 단백질("비-분해성 ITR")에 의한 분해능을 감소시키거나 폐지하도록 변형된다. 특정 구현예에서, 비-분해성 ITR은 말단 분해 부위의 뉴클레오티드 서열에 삽입, 결실, 또는 치환을 포함한다. 이러한 변형은 rAAV 게놈이 감염된 세포에서 복제된 후 AAV의 자가-상보성, 이중-가닥 DNA 게놈의 형성을 가능하게 한다. 예시적인 비-분해성 ITR 서열은 당업계에 공지되어 있다(예를 들어, 미국 특허 제7,790,154호 및 제9,783,824호에 제공된 것들을 참조하며, 이들은 그 전체가 참조로서 본원에 통합됨). 특정 구현예에서, 5' ITR은 서열번호 49와 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 5' ITR은 서열번호 49와 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, 5' ITR은 서열번호 49에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, 3' ITR은 서열번호 51과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 5' ITR은 서열번호 51과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, 3' ITR은 서열번호 51에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, 5' ITR은 서열번호 49에 제시된 뉴클레오티드 서열로 이루어지고, 3' ITR은 서열번호 51에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, 5' ITR은 서열번호 49에 제시된 뉴클레오티드 서열로 이루어지고, 3' ITR은 서열번호 14에 제시된 뉴클레오티드 서열로 이루어진다.

특정 구현예에서, 5' ITR은 야생형 AAV2 게놈 서열로부터 유래된 추가의 뉴클레오티드 서열의 측면에 위치한다. 특정 구현예에서, 5' ITR은 야생형 AAV2 ITR에 인접한 야생형 AAV2 서열로부터 유래된 추가의 46 bp 서열의 측면에 위치한다. 특정 구현예에서, 추가의 46 bp 서열은 5' ITR의 내부에 있다. 특정 구현예에서, 46 bp 서열은 서열 번호 71에 제시된 서열로 이루어진다. 특정 구현예에서, 5' ITR은 서열번호 71과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 5' ITR은 서열 번호 72 또는 73에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 5' ITR의 뉴클레오티드 서열은 서열번호 72 또는 73과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, 5' ITR의 뉴클레오티드 서열은 서열번호 72 또는 73에 제시된 뉴클레오티드 서열로 이루어진다.

특정 구현예에서, 3' ITR은 야생형 AAV2 게놈 서열로부터 유래된 추가의 뉴클레오티드 서열의 측면에 위치한다. 특정 구현예에서, 3' ITR은 야생형 AAV2 ITR에 인접한 야생형 AAV2 서열로부터 유래된 추가의 37 bp 서열의 측면에 위치한다. 예를 들어, Savy 등의 문헌[Human Gene Therapy Methods (2017) 28(5): 277-289]을 참조한다(이는 그 전체가 본원에 참조로서 통합됨). 특정 구현예에서, 추가의 37 bp 서열은 3' ITR의 내부에 있다. 특정 구현예에서, 37 bp 서열은 서열번호 56에 제시된 서열로 이루어진다. 특정 구현예에서, 3' ITR은 서열번호 28, 57 또는 74와 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 3' ITR은 서열 번호 28, 57, 또는 74에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 3' ITR의 뉴클레오티드 서열은 서열번호 28, 57 또는 74와 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, 3' ITR의 뉴클레오티드 서열은 서열번호 28, 57, 또는 74에 제시된 뉴클레오티드 서열로 이루어진다.

특정 구현예에서, rAAV 게놈은 5'에서 3'으로 5' ITR; 본원에 개시된 바와 같이, 5'에서 3'으로 TRE, 선택적으로 비암호화 엑손 및 인트론, 인트론-삽입 IDS 암호화 서열, 및 폴리아데닐화 서열을 포함하는 내부 요소; 비-분해성 ITR; 내부 요소에 상보적인 뉴클레오티드 서열; 및 3' ITR을 포함한다. 이러한 rAAV 게놈은 감염 후 및 복제 전에 AAV의 자가-상보성, 이중-가닥 DNA 게놈을 형성할 수 있다.

특정 구현예에서, rAAV 게놈은 5'에서 3'으로 5' ITR, TRE, 인트론-삽입 IDS 암호화 서열, 폴리아데닐화 서열, 및 3' ITR을 포함한다. 특정 구현예에서, 5' ITR은 서열번호 18, 20, 49, 또는 73과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖고/가지거나; TRE는 서열번호 29, 30, 31, 32, 33, 35, 36, 39, 40, 41, 42, 44, 46, 47, 48, 및/또는 55 중 어느 하나에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 가지고/가지거나; 인트론-삽입 IDS 암호화 서열은 서열번호 25, 27, 59 또는 60에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%,또는 99%의 서열 동일성을 가지고/가지거나; 폴리아데닐화 서열은 서열번호 34, 35 또는 45 중 어느 하나와 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 가지고/가지거나; 3' ITR은 서열번호 14, 19, 21, 28, 51, 57, 또는 74에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다. 특정 구현예에서, 5' ITR은 서열번호 18, 20, 49, 또는 73으로 이루어진 군으로부터 선택되는 뉴클레오티드 서열을 포함하거나 이로 이루어지고/이루어지거나; TRE는 서열번호 29, 30, 31, 32, 33, 35, 36, 39, 40, 41, 42, 44, 46, 47, 48, 및/또는 55로 이루어진 군으로부터 선택된 뉴클레오티드 서열을 포함하고/하거나; 인트론-삽입 IDS 암호화 서열은 서열번호 25, 27, 59, 또는 60에 제시된 서열을 포함하고/하거나; 폴리아데닐화 서열은 서열번호 34, 35 또는 45로 이루어진 군으로부터 선택된 뉴클레오티드 서열을 포함하고/하거나; 3' ITR은 서열번호 14, 19, 21, 28, 51, 57, 또는 74로 이루어진 군으로부터 선택된 뉴클레오티드 서열을 포함하거나 이로 이루어진다.

특정 구현예에서, 5' ITR은 서열번호 18 또는 49에 제시된 서열을 포함하거나 이로 이루어지고/이루어지거나; TRE는 서열번호 29에 제시된 서열을 포함하고/하거나; 인트론-삽입 IDS 암호화 서열은 서열번호 25, 27, 59, 또는 60에 제시된 서열을 포함하고/하거나; 폴리아데닐화 서열은 서열번호 45에 제시된 서열을 포함하고/하거나; 3' ITR은 서열번호 14 또는 51에 제시된 서열을 포함하거나 이로 이루어진다.

특정 구현예에서, 5' ITR은 서열번호 49에 제시된 서열을 포함하거나 이로 이루어지고/이루어지거나; TRE는 서열번호 29에 제시된 서열을 포함하고/하거나; 인트론-삽입 IDS 암호화 서열은 서열번호 25에 제시된 서열을 포함하고/하거나; 폴리아데닐화 서열은 서열번호 45에 제시된 서열을 포함하고/하거나; 3' ITR은 서열번호 51에 제시된 서열을 포함하거나 이로 이루어진다.

특정 구현예에서, 5' ITR은 서열번호 49에 제시된 서열을 포함하거나 이로 이루어지고/이루어지거나; TRE는 서열번호 29에 제시된 서열을 포함하고/하거나; 인트론-삽입 IDS 암호화 서열은 서열번호 25에 제시된 서열을 포함하고/하거나; 폴리아데닐화 서열은 서열번호 45에 제시된 서열을 포함하고/하거나; 3' ITR은 서열번호 14에 제시된 서열을 포함하거나 이로 이루어진다.

특정 구현예에서, 5' ITR은 서열번호 49에 제시된 서열을 포함하거나 이로 이루어지고/이루어지거나; TRE는 서열번호 29에 제시된 서열을 포함하고/하거나; 인트론-삽입 IDS 암호화 서열은 서열번호 27에 제시된 서열을 포함하고/하거나; 폴리아데닐화 서열은 서열번호 45에 제시된 서열을 포함하고/하거나; 3' ITR은 서열번호 14에 제시된 서열을 포함하거나 이로 이루어진다.

특정 구현예에서, 5' ITR은 서열번호 18에 제시된 서열을 포함하거나 이로 이루어지고/이루어지거나; TRE는 서열번호 29에 제시된 서열을 포함하고/하거나; 인트론-삽입 IDS 암호화 서열은 서열번호 25에 제시된 서열을 포함하고/하거나; 폴리아데닐화 서열은 서열번호 45에 제시된 서열을 포함하고/하거나; 3' ITR은 서열번호 14에 제시된 서열을 포함하거나 이로 이루어진다.

특정 구현예에서, 5' ITR은 서열번호 18에 제시된 서열을 포함하거나 이로 이루어지고/이루어지거나; TRE는 서열번호 29에 제시된 서열을 포함하고/하거나; 인트론-삽입 IDS 암호화 서열은 서열번호 27에 제시된 서열을 포함하고/하거나; 폴리아데닐화 서열은 서열번호 45에 제시된 서열을 포함하고/하거나; 3' ITR은 서열번호 14에 제시된 서열을 포함하거나 이로 이루어진다.

특정 구현예에서, 5' ITR은 서열번호 18에 제시된 서열을 포함하거나 이로 이루어지고/이루어지거나; TRE는 서열번호 29에 제시된 서열을 포함하고/하거나; 인트론-삽입 IDS 암호화 서열은 서열번호 27에 제시된 서열을 포함하고/하거나; 폴리아데닐화 서열은 서열번호 45에 제시된 서열을 포함하고/하거나; 3' ITR은 서열번호 19에 제시된 서열을 포함하거나 이로 이루어진다.

특정 구현예에서, 5' ITR은 서열번호 49에 제시된 서열을 포함하거나 이로 이루어지고/이루어지거나; TRE는 서열번호 29에 제시된 서열을 포함하고/하거나; 인트론-삽입 IDS 암호화 서열은 서열번호 59에 제시된 서열을 포함하고/하거나; 폴리아데닐화 서열은 서열번호 45에 제시된 서열을 포함하고/하거나; 3' ITR은 서열번호 14에 제시된 서열을 포함하거나 이로 이루어진다.

특정 구현예에서, 5' ITR은 서열번호 49에 제시된 서열을 포함하거나 이로 이루어지고/이루어지거나; TRE는 서열번호 29에 제시된 서열을 포함하고/하거나; 인트론-삽입 IDS 암호화 서열은 서열번호 60에 제시된 서열을 포함하고/하거나; 폴리아데닐화 서열은 서열번호 45에 제시된 서열을 포함하고/하거나; 3' ITR은 서열번호 14에 제시된 서열을 포함하거나 이로 이루어진다.

특정 구현예에서, rAAV 게놈은 서열번호 38, 50, 53, 58, 62, 64, 66, 70, 76, 또는 78과 적어도 90%(예를 들어, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100%) 동일한 서열을 포함한다. 특정 구현예에서, rAAV 게놈은 서열번호 38, 50, 53, 58, 62, 64, 66, 70, 76, 또는 78에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 38, 50, 53, 58, 62, 64, 66, 70, 76, 또는 78에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, rAAV 게놈은 서열번호 38에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 38에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, rAAV 게놈은 서열번호 50에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 50에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈은 서열번호 53에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 53에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, rAAV 게놈은 서열번호 58에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 58에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, rAAV 게놈은 서열번호 62에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 62에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, rAAV 게놈은 서열번호 64에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 64에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, rAAV 게놈은 서열번호 66에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 66에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, rAAV 게놈은 서열번호 70에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 70에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, rAAV 게놈은 서열번호 76에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 76에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, rAAV 게놈은 서열번호 78에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 78에 제시된 뉴클레오티드 서열로 이루어진다.

특정 구현예에서, rAAV는 다음을 포함한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 야생형 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 25의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열 45), 및 3' ITR 요소(예를 들어, 서열번호 51의 3' ITR:); (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 야생형 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 25의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 51의 3' ITR); 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 야생형 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 25의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 51의 3' ITR).

특정 구현예에서, rAAV는 다음을 포함한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 야생형 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 25의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 야생형 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 25의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열 45), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 야생형 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 25의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR).

특정 구현예에서, rAAV는 다음을 포함한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 27의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 27의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 27의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR).

특정 구현예에서, rAAV는 다음을 포함한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 야생형 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 25의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 야생형 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 25의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 야생형 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 25의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR).

특정 구현예에서, rAAV는 다음을 포함한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 27의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 27의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 27의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR).

특정 구현예에서, rAAV는 다음을 포함한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 27의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 19의 3' ITR); (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 27의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 19의 3' ITR); 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 27의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 19의 3' ITR).

특정 구현예에서, rAAV는 다음을 포함한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 59의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 59의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 59의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR).

특정 구현예에서, rAAV는 다음을 포함한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 60의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 60의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 60의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR).

특정 구현예에서, rAAV는 (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질, 및 서열번호 25, 27, 29, 37, 38, 43, 50, 52, 53, 54, 58, 60, 61, 62, 63, 64, 65, 66, 69, 70, 75, 76, 77, 또는 78 중 어느 하나에 제시된 뉴클레오티드 서열을 포함하는 rAAV 게놈; (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질, 및 서열번호 25, 27, 29, 37, 38, 43, 50, 52, 53, 54, 58, 60, 61, 62, 63, 64, 65, 66, 69, 70, 75, 76, 77, 또는 78 중 어느 하나에 제시된 뉴클레오티드 서열을 포함하는 rAAV 게놈; 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질, 및 서열번호 25, 27, 29, 37, 38, 43, 50, 52, 53, 54, 58, 60, 61, 62, 63, 64, 65, 66, 69, 70, 75, 76, 77, 또는 78 중 어느 하나에 제시된 뉴클레오티드 서열을 포함하는 rAAV 게놈을 포함한다.

또 다른 양태에서, 서열번호 25, 26, 27, 37, 38, 43, 50, 52, 53, 54, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 75, 76, 77, 또는 78에 제시된 핵산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드가 본원에 제공된다. 특정 구현예에서, 폴리뉴클레오티드는 서열번호 25, 26, 27, 37, 38, 43, 50, 52, 53, 54, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 75, 76, 77, 또는 78에 제시된 핵산 서열을 포함한다. 　 특정 구현예에서, 폴리뉴클레오티드의 핵산 서열은 서열번호 25, 26, 27, 37, 38, 43, 50, 52, 53, 54, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 75, 76, 77, 또는 78에 제시된 핵산 서열로 이루어진다. 　 특정 구현예에서, 폴리뉴클레오티드는 서열번호 25, 26, 27, 37, 38, 43, 50, 52, 53, 54, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 75, 76, 77, 또는 78에 제시된 핵산 서열을 포함한다. 특정 구현예에서, 폴리뉴클레오티드의 핵산 서열은 서열번호 25, 26, 27, 37, 38, 43, 50, 52, 53, 54, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 75, 76, 77, 또는 78에 제시된 핵산 서열로 이루어진다.

또한, 서열번호 25, 27, 59, 또는 60에 제시된 핵산 서열과 적어도 80%(예를 들어, 적어도 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%) 동일한 핵산 서열을 포함하는 폴리뉴클레오티드가 본원에 제공된다. 특정 구현예에서, 폴리뉴클레오티드는 서열번호 25, 27, 59, 또는 60에 제시된 핵산 서열을 포함한다. 　 특정 구현예에서, 폴리뉴클레오티드의 핵산 서열은 서열번호 25, 27, 59, 또는 60에 제시된 핵산 서열로 이루어진다. 　 특정 구현예에서, 폴리뉴클레오티드는 서열번호 25에 제시된 핵산 서열을 포함한다. 특정 구현예에서, 폴리뉴클레오티드의 핵산 서열은 서열번호 25에 제시된 핵산 서열로 이루어진다. 특정 구현예에서, 폴리뉴클레오티드는 서열번호 27에 제시된 핵산 서열을 포함한다. 특정 구현예에서, 폴리뉴클레오티드의 핵산 서열은 서열번호 27에 제시된 핵산 서열로 이루어진다. 특정 구현예에서, 폴리뉴클레오티드는 서열번호 59에 제시된 핵산 서열을 포함한다. 특정 구현예에서, 폴리뉴클레오티드의 핵산 서열은 서열번호 59에 제시된 핵산 서열로 이루어진다. 특정 구현예에서, 폴리뉴클레오티드는 서열번호 60에 제시된 핵산 서열을 포함한다. 특정 구현예에서, 폴리뉴클레오티드의 핵산 서열은 서열번호 60에 제시된 핵산 서열로 이루어진다.

폴리뉴클레오티드는 DNA, RNA, 변형된 DNA, 변형된 RNA, 또는 이들의 조합을 포함할 수 있다. 특정 구현예에서, 폴리뉴클레오티드는 벡터, 예를 들어, 바이러스 벡터 또는 플라스미드 내에 포함된다. 또한, 폴리뉴클레오티드 또는 벡터를 포함하는 재조합 세포가 본원에 제공된다.

또 다른 양태에서, 본 개시는 약학적으로 허용 가능한 부형제, 보조제, 희석제, 비히클 또는 담체, 또는 이들의 조합과 함께 본원에 개시된 바와 같은 AAV를 포함하는 약학적 조성물을 제공한다. "약학적으로 허용 가능한 담체"는, 조성물의 활성 성분과 조합될 때, 성분이 생물학적 활성을 유지할 수 있게 하고 의도하지 않은 면역 반응과 같은 파괴적인 생리학적 반응을 일으키지 않는 임의의 물질을 포함한다. 약학적으로 허용 가능한 담체는 물, 인산염 완충 식염수, 유화액, 예컨대 오일/물 유화액, 및 습윤제를 포함한다. 이러한 담체를 포함하는 조성물은 문헌[Remington's Pharmaceutical Sciences, current Ed., Mack Publishing Co., Easton Pa. 18042, USA; A. Gennaro (2000) "Remington: The Science and Practice of Pharmacy", 20th, Lippincott, Williams, & Wilkins; Pharmaceutical Dosage Forms and Drug Delivery Systems (1999) H. C. Ansel et al, 7th ed., Lippincott, Williams, & Wilkins; and Handbook of Pharmaceutical Excipients (2000) A. H. Kibbe et al, 3rd ed. Amer. Pharmaceutical Assoc.]에 제시된 바와 같이 잘 알려진 통상적인 방법에 의해 제형화될 수 있다.

III. 사용 방법

또 다른 양태에서, 본 개시는 세포에서 IDS 폴리펩티드를 발현시키는 방법을 제공한다. 이러한 방법은 일반적으로 본원에 개시된 바와 같은 rAAV로 세포를 형질도입하는 단계를 포함한다. 이러한 방법은 IDS 발현을 복원하는 데 매우 효율적이다. 따라서, 특정 구현예에서, 본원에 개시된 방법은 본원에 개시된 rAAV로 세포를 형질도입하는 단계를 포함한다.

본원에 개시된 방법은 IDS 유전자에서 돌연변이를 보유하는 임의의 세포에 적용될 수 있다. 당업자는 활성 내인성 IDS(예를 들어, 내인성 I2S 활성)를 필요로 하는 세포가 특히 관심 대상임을 이해할 것이다. 따라서, 특정 구현예에서, 본 방법은 내인성 I2S 활성을 상실한 임의의 세포에 적용된다.

특정 구현예에서, 본 방법은 뉴런 및/또는 신경교세포에 적용된다. 특정 구현예에서, 특정 관심 대상은 활성 내인성 IDS(예를 들어, 내인성 I2S 활성)를 필요로 하는 뉴런 및/또는 신경교세포이다. 특정 구현예에서, 본 방법은 중추 신경계(CNS)의 세포 및/또는 말초 신경계(PNS)의 세포에 적용된다. 특정 구현예에서, 특정 관심 대상은 활성 내인성 IDS(예를 들어, 내인성 I2S 활성)를 필요로 하는 중추 신경계 및/또는 말초 신경계의 세포이다. 특정 구현예에서, 특정 관심 대상은 전뇌, 중뇌, 후뇌, 척수, 및 이들의 임의의 조합의 세포이다. 특정 구현예에서, 특정 관심 대상은 척수, 운동 피질, 감각 피질, 시상, 해마, 피각, 소뇌(예를 들어, 소뇌 핵), 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된 중추 신경계 영역의 세포이다. 특정 구현예에서, 특정 관심 대상은 뇌의 교뇌 및 수질, 척수의 상행근막의 세포, 및 이들의 임의의 조합이다. 특정 구현예에서, 특정 관심 대상은, 활성 내인성 IDS(예를 들어, 내인성 I2S 활성)를 필요로 하는, 척수, 운동 피질, 감각 피질, 시상, 해마, 피각, 소뇌(예를 들어, 소뇌 핵), 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된 중추 신경계(CNS) 영역의 세포이다. 특정 구현예에서, 특정 관심 대상은 중추 신경계(CNS)에서의 운동 뉴런 및 성상교세포 프로파일, CNS에서의 희소돌기교세포(상행 섬유), CNS에서의 대뇌 피질의 세포 집단, 및 말초 신경계(PNS)의 감각 뉴런이다. 특정 구현예에서, 특정 관심 대상은 척수의 배측 근막 내에 있는 것과 같은 희소돌기교세포이다. 특정 구현예에서, 특정 관심 대상은, 성상교세포, 희소돌기교세포, 슈반 세포, 및 이들의 임의의 조합을 포함하지만 이에 한정되지 않는, 중추 신경계에서의 신경교 프로파일이다. 특정 구현예에서, 특정 관심 대상은 운동 뉴런, 성상교세포, 희소돌기교세포, 중추 신경계의 대뇌 피질 세포, 말초 신경계의 감각 뉴런, 말초 신경계의 신경교세포(예를 들어, 슈반 세포), 및 이들의 임의의 조합이다.

특정 구현예에서, 본 방법은 간 세포(예를 들어, 간세포)에 적용된다. 특정 구현예에서, 특정 관심 대상은 활성 내인성 IDS(예를 들어, 내인성 I2S 활성)를 필요로 하는 간 세포이다. 특정 구현예에서, 본 방법은 심장 세포(예를 들어, 심근 세포)에 적용된다. 특정 구현예에서, 특정 관심 대상은 활성 내인성 IDS(예를 들어, 내인성 I2S 활성)를 필요로 하는 심장 세포이다. 특정 구현예에서, 본 방법은 폐 세포(예를 들어, 기도 상피 세포)에 적용된다. 특정 구현예에서, 특정 관심 대상은 활성 내인성 IDS(예를 들어, 내인성 I2S 활성)를 필요로 하는 폐 세포이다. 특정 구현예에서, 본 방법은 신장 세포(예를 들어, 신장 상피 세포)에 적용된다. 특정 구현예에서, 특정 관심 대상은 활성 내인성 IDS(예를 들어, 내인성 I2S 활성)를 필요로 하는 신장 세포이다. 특정 구현예에서, 본 방법은 비장 세포(예를 들어, 비장세포)에 적용된다. 특정 구현예에서, 특정 관심 대상은 활성 내인성 IDS(예를 들어, 내인성 I2S 활성)를 필요로 하는 비장 세포이다.

본원에 개시된 방법은 연구 목적을 위해 시험관 내에서 수행될 수 있거나, 치료 목적을 위해 생체 외 또는 생체 내에서 수행될 수 있다.

특정 구현예에서, 형질도입될 세포는 포유류 대상체에 존재하고, AAV는 대상체에서 세포에 형질도입되기에 효과적인 양으로 대상체에게 투여된다. 따라서, 특정 구현예에서, 본 개시는 IDS 유전자 돌연변이와 연관된 질환 또는 장애를 갖는 대상체를 치료하기 위한 방법을 제공하며, 이러한 방법은 일반적으로 본원에 개시된 바와 같은 rAAV의 유효량을 대상체에게 투여하는 단계를 포함한다. 대상체는 IDS 돌연변이를 갖는 인간 대상체, 비인간 영장류 대상체(예를 들어, 시노몰구스(cynomolgus)) 또는 설치류 대상체(예를 들어, 마우스)일 수 있다. IDS 유전자 돌연변이와 연관된 임의의 질환 또는 장애는 본원에 개시된 방법을 사용하여 치료될 수 있다. 적절한 질환 또는 장애는, 제한 없이, 헌터 증후군을 포함한다.

특정 구현예에서, 전술한 방법은 다음을 포함하는 rAAV를 사용한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 야생형 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 25의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 51의 3' ITR); (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 야생형 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 25의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 51의 3' ITR); 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 야생형 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 25의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 51의 3' ITR).

특정 구현예에서, 전술한 방법은 다음을 포함하는 rAAV를 사용한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 야생형 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 25의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 야생형 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 25의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열 45), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 야생형 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 25의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR).

특정 구현예에서, 전술한 방법은 다음을 포함하는 rAAV를 사용한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 27의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 27의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 27의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR).

특정 구현예에서, 전술한 방법은 다음을 포함하는 rAAV를 사용한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 야생형 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 25의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 야생형 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 25의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 야생형 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 25의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR).

특정 구현예에서, 전술한 방법은 다음을 포함하는 rAAV를 사용한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 27의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 27의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 27의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR).

특정 구현예에서, 전술한 방법은 다음을 포함하는 rAAV를 사용한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 27의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 19의 3' ITR); (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 27의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 19의 3' ITR); 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 27의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 19의 3' ITR).

특정 구현예에서, 전술한 방법은 다음을 포함하는 rAAV를 사용한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 59의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 59의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 59의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR).

특정 구현예에서, 전술한 방법은 다음을 포함하는 rAAV를 사용한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 60의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 60의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 60의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR).

특정 구현예에서, 전술한 방법은 다음을 포함하는 rAAV를 사용한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질, 및 서열번호 25, 27, 37, 38, 43, 50, 52, 53, 54, 58, 59, 60, 61, 62, 63, 64, 65, 66, 69, 또는 70;중 어느 하나에 제시된 뉴클레오티드 서열을 포함하는 rAAV 게놈; (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질, 및 서열번호 25, 27, 37, 38, 43, 50, 52, 53, 54, 58, 59, 60, 61, 62, 63, 64, 65, 66, 69, 또는 70 중 어느 하나에 제시된 뉴클레오티드 서열을 포함하는 rAAV 게놈; 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질, 및 서열번호 25, 27, 37, 38, 43, 50, 52, 53, 54, 58, 59, 60, 61, 62, 63, 64, 65, 66, 69, 또는 70 중 어느 하나에 제시된 뉴클레오티드 서열을 포함하는 rAAV 게놈.

본원에 개시된 방법은 생체 내 및 시험관 내 모두에서 높은 효율로 세포에서 IDS 단백질을 발현할 수 있다는 점에서 특히 유리하다. 특정 구현예에서, 이러한 IDS 단백질의 발현 수준은 IDS 유전자에 돌연변이를 갖지 않는 동일한 유형의 세포의 내인성 IDS 단백질의 발현 수준의 적어도 약 0.1%, 적어도 약 0.2%, 적어도 약 0.3%, 적어도 약 0.4%, 적어도 약 0.5%, 적어도 약 0.6%, 적어도 약 0.7%, 적어도 약 0.8%, 적어도 약 0.9%, 적어도 약 1%, 적어도 약 2%, 적어도 약 3%, 적어도 약 4%, 적어도 약 5%, 적어도 약 6%, 적어도 약 7%, 적어도 약 8%, 적어도 약 9%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 99%, 적어도 약 100%, 또는 이들의 임의의 중간 백분율이다. 특정 구현예에서, IDS 단백질의 발현 수준은 IDS 유전자 내에 돌연변이를 갖지 않는 동일한 유형의 세포에서의 내인성 IDS 단백질의 발현 수준보다 적어도 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10배 더 높다. ELISA, 웨스턴 블롯팅, 면역 염색, 및 질량 분광분석을 포함하되 이들로 한정되지 않는, IDS 단백질의 발현 수준을 결정하는 임의의 방법이 사용될 수 있다.

특정 구현예에서, 본원에 개시된 AAV 조성물로 세포를 형질도입하는 것은 본원에 제공된 바와 같이 또는 당업자에게 공지된 임의의 형질도입 방법에 의해 수행될 수 있다. 특정 구현예에서, 세포는 AAV와 50,000; 100,000; 150,000; 200,000; 250,000; 300,000; 350,000; 400,000; 450,000; 또는 500,000의 감염 다중도(MOI) 또는 세포에 대해 최적의 형질도입을 제공하는 임의의 MOI로 접촉할 수 있다.

본원에 개시된 AAV 조성물은 정맥내, 경막내, 복강내, 피하, 근육내, 비강내, 국소 또는 피부내 경로를 포함하되 이들로 한정되지 않는 임의의 적절한 경로에 의해 대상체에게 투여될 수 있다. 특정 구현예에서, 조성물은 정맥내 주사 또는 피하 주사를 통해 투여되도록 제형화된다.

IV. AAV 패키징 시스템

또 다른 양태에서, 본 개시는 본원에 개시된 재조합 아데노-연관 바이러스(rAAV)의 재조합 제조를 위한 패키징 시스템을 제공한다. 이러한 패키징 시스템은 일반적으로 하나 이상의 AAV Rep 단백질을 암호화하는 제1 뉴클레오티드; 본원에 개시된 바와 같은 AAV 중 어느 하나의 캡시드 단백질을 암호화하는 제2 뉴클레오티드; 및 본원에 개시된 바와 같은 rAAV 게놈 중 어느 하나를 포함하는 제3 뉴클레오티드 서열을 포함하되, 패키징 시스템은 캡시드 내에 rAAV 게놈을 둘러싸서 AAV를 형를 형성하도록 작동된다.

특정 구현예에서, 패키징 시스템은 하나 이상의 AAV Rep 단백질을 암호화하는 제1 뉴클레오티드 서열 및 AAV 캡시드 단백질을 암호화하는 제2 뉴클레오티드 서열을 포함하는 제1 벡터 및 rAAV 게놈을 포함하는 제3 뉴클레오티드 서열을 포함하는 제2 벡터를 포함한다. 본원에 기술된 패키징 시스템의 맥락에서 사용되는 "벡터"는 핵산을 세포 내로 도입하기 위한 비히클인 핵산 분자를 지칭한다(예를 들어, 플라스미드, 바이러스, 코스미드, 인공 염색체 등).

임의의 AAV Rep 단백질은 본원에 개시된 패키징 시스템에 사용될 수 있다. 패키징 시스템의 특정 구현예에서, Rep 뉴클레오티드 서열은 AAV2 Rep 단백질을 암호화한다. 적절한 AAV2 Rep 단백질은 Rep 78/68 또는 Rep 68/52를 포함하되 이에 한정되지 않는다. 패키징 시스템의 특정 구현예에서, AAV2 Rep 단백질을 암호화하는 뉴클레오티드 서열은 서열번호 22의 AAV2 Rep 아미노산 서열과 최소 백분율 서열 동일성을 갖는 단백질을 암호화하는 뉴클레오티드 서열을 포함하되, 최소 백분율 서열 동일성은 AAV2 Rep 단백질의 아미노산 서열 길이에 걸쳐 적어도 70%(예를 들어, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 100%)이다. 패키징 시스템의 특정 구현예에서, AAV2 Rep 단백질은 서열번호 22에 제시된 아미노산 서열을 갖는다.

패키징 시스템의 특정 구현예에서, 패키징 시스템은 하나 이상의 헬퍼 바이러스 유전자를 포함하는 제4 뉴클레오티드 서열을 추가로 포함한다. 패키징 시스템의 특정 구현예에서, 패키징 시스템은 하나 이상의 헬퍼 바이러스 유전자를 포함하는 제4 뉴클레오티드 서열을 포함하는 제3 벡터, 예를 들어 헬퍼 바이러스 벡터를 추가로 포함한다. 제3 벡터는 독립적인 제3 벡터이거나, 제1 벡터와 일체화되거나, 제2 벡터와 일체화될 수 있다.

패키징 시스템의 특정 구현예에서, 헬퍼 바이러스는 아데노바이러스, 포진 바이러스(단순 포진 바이러스(HSV)를 포함함), 수두 바이러스(예를 들어, 우두 바이러스), 거대세포 바이러스(CMV), 및 배큘로바이러스로 이루어진 군으로부터 선택된다. 헬퍼 바이러스가 아데노바이러스인 패키징 시스템의 특정 구현예에서, 아데노바이러스 게놈은 El, E2, E4 및 VA로 이루어진 군으로부터 선택된 하나 이상의 아데노바이러스 RNA 유전자를 포함한다. 헬퍼 바이러스가 HSV인 패키징 시스템의 특정 구현예에서, HSV 게놈은 UL5/8/52, ICPO, ICP4, ICP22 및 UL30/UL42로 이루어진 군으로부터 선택된 하나 이상의 HSV 유전자를 포함한다.

패키징 시스템의 특정 구현예에서, 제1, 제2 및/또는 제3 벡터는 하나 이상의 플라스미드 내에 함유된다. 특정 구현예에서, 제1 벡터 및 제3 벡터는 제1 플라스미드 내에 함유된다. 특정 구현예에서, 제2 벡터 및 제3 벡터는 제2 플라스미드 내에 함유된다.

패키징 시스템의 특정 구현예에서, 제1, 제2 및/또는 제3 벡터는 하나 이상의 재조합 헬퍼 바이러스 내에 함유된다. 특정 구현예에서, 제1 벡터 및 제3 벡터는 재조합 헬퍼 바이러스 내에 함유된다. 특정 구현예에서, 제2 벡터 및 제3 벡터는 재조합 헬퍼 바이러스 내에 함유된다.

또 다른 양태에서, 본 개시는 본원에 기술된 바와 같은 AAV의 재조합 제조 방법을 제공하며, 이러한 방법은 본원에 기술된 바와 같은 rAAV를 형성하도록 캡시드 내에 rAAV 게놈을 둘러싸도록 작동되는 조건 하에서 본원에 기술된 바와 같은 패키징 시스템으로 세포를 형질감염시키거나 형질도입하는 단계를 포함한다. rAAV의 재조합 제조를 위한 예시적인 방법은 일시적 형질감염(예를 들어, 본원에 기재된 바와 같은 제1, 및 제2, 및 선택적으로 제3 벡터를 함유하는 하나 이상의 형질감염 플라스미드를 사용함), 바이러스 감염(예를 들어, 본원에 개시된 바와 같은 제1, 및 제2, 및 선택적으로 제3 벡터를 함유하는 하나 이상의 재조합 헬퍼 바이러스, 예컨대 아데노바이러스, 수두바이러스(예를 들어, 우두 바이러스), 포진 바이러스(HSV를 포함함) 거대세포 바이러스, 또는 바큘로바이러스를 사용함), 및 안정한 생산자 세포주 형질감염 또는 감염(예를 들어, 본원에 기재된 바와 같은 하나 이상의 AAV Rep 단백질을 암호화하는 Rep 뉴클레오티드 서열 및/또는 하나 이상의 AAV 캡시드 단백질을 암호화하는 Cap 뉴클레오티드 서열을 함유하는 포유동물 또는 곤충 세포와 같은 안정한 생산자 세포, 및 플라스미드 또는 재조합 헬퍼 바이러스의 형태로 전달되는 본원에 기술된 rAAV 게놈을 사용함)을 포함한다.

따라서, 본 개시는 재조합 AAV(rAAV)의 제조를 위한 패키징 시스템을 제공하며, 여기서 패키징 시스템은 하나 이상의 AAV Rep 단백질을 암호화하는 제1 뉴클레오티드 서열; 본원에 기술된 AAV 중 어느 하나의 캡시드 단백질을 암호화하는 제2 뉴클레오티드 서열; 및 본원에 기술된 AAV 중 어느 하나의 rAAV 게놈 서열을 포함하는 제3 뉴클레오티드 서열; 및 선택적으로 하나 이상의 헬퍼 바이러스 유전자를 포함하는 제4 뉴클레오티드 서열을 포함한다.

V. 실시예

본원에 개시된 재조합 AAV 벡터는 시험관 내 및 생체 내에서 매우 효율적인 유전자 전달을 매개한다. 다음의 실시예는 본원에 개시된 바와 같은 AAV 기반 벡터를 사용하여 (헌터 증후군과 같은 특정 인간 질환에서 돌연변이된) IDS 유전자의 발현을 효율적으로 복원하는 것을 입증한다. 이들 실시예는 예시로서 제공되며, 제한하는 것이 아니다.

아래의 실시예 5, 6 및 11에서, 벡터 게놈 내 인간 IDS 유전자에 대하여 2.2e13 vg/kg, 6.5e13 vg/kg, 및 1.1e14 vg/kg 투여량의 AAV가 정량된다. 벡터 게놈 내 SV40 polyA 서열을 사용하여 정량될 때, AAV의 등가 투여량은 2e13 vg/kg, 6e13 vg/kg, 및 1e14 vg/kg이다. 아래의 실시예 9, 10 및 12에서, 벡터 게놈 내의 인간 IDS 유전자에 대해 1.8e14 vg/kg 투여량의 AAV가 정량된다. 벡터 게놈 내 SV40 polyA 서열에 대해 정량될 때, AAV의 등가 투여량은 1e14 vg/kg이다.

실시예 1: 인간 IDS 전달 벡터

본 실시예는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 IDS(hIDS)의 발현을 위한 인간 IDS 전달 벡터 pHM-05205, pHM-05213, pHM-05214, pHM-05216, 및 pHM-05217을 제공한다.

a) pHM-05205

도 1a에 도시된 바와 같이, IDS 전달 벡터 pHM-05205는 5'에서 3'으로 다음의 유전적 요소를 포함한다: 5' ITR 요소; CMV 프로모터를 포함하는 전사 조절 요소; 야생형 인간 IDS 인트론-삽입 암호화 서열; SV40 폴리아데닐화 서열; 및 3' ITR 요소. 이들 요소의 서열은 표 1에 제시되어 있다. 이 벡터는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 IDS 단백질을 발현할 수 있다.

b) pHM-05213

도 1b에 도시된 바와 같이, IDS 전달 벡터 pHM-05213은, 5'에서 3'으로 다음의 유전적 요소를 포함한다: 5' ITR 요소; CMV 프로모터를 포함하는 전사 조절 요소; 야생형 인간 IDS 인트론-삽입 암호화 서열; SV40 폴리아데닐화 서열; 및 3' ITR 요소. 이들 요소의 서열은 표 1에 제시되어 있다. 이 벡터는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 IDS 단백질을 발현할 수 있다.

c) pHM-05214

도 1c에 도시된 바와 같이, IDS 전달 벡터 pHM-05214는 5'에서 3'으로 다음의 유전적 요소를 포함한다: 5' ITR 요소; CMV 프로모터를 포함하는 전사 조절 요소; 침묵 변형된 인간 IDS 인트론-삽입 암호화 서열; SV40 폴리아데닐화 서열; 및 3' ITR 요소. 이들 요소의 서열은 표 1에 제시되어 있다. 이 벡터는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 IDS 단백질을 발현할 수 있다.

d) pHM-05216

도 1d에 도시된 바와 같이, IDS 전달 벡터 pHM-05216은 5'에서 3'으로 다음의 유전적 요소를 포함한다: 5' ITR 요소; CMV 프로모터를 포함하는 전사 조절 요소; 야생형 인간 IDS 인트론-삽입 암호화 서열; SV40 폴리아데닐화 서열; 및 3' ITR 요소. 이들 요소의 서열은 표 1에 제시되어 있다. 이 벡터는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 IDS 단백질을 발현할 수 있다.

e) pHM-05217

도 1e에 도시된 바와 같이, IDS 전달 벡터 pHM-05217은 5'에서 3'으로 다음의 유전적 요소를 포함한다: 5' ITR 요소; CMV 프로모터를 포함하는 전사 조절 요소; 침묵 변형된 인간 IDS 인트론-삽입 암호화 서열; SV40 폴리아데닐화 서열; 및 3' ITR 요소. 이들 요소의 서열은 표 1에 제시되어 있다. 이 벡터는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 IDS 단백질을 발현할 수 있다.

인간 IDS 전달 벡터 pHM-05210, pHM-05213, pHM-05214, pHM-05216, 및 pHM-05217에서의 유전적 요소
유전적 요소	pHM-05205	pHM-05213	pHM-05214	pHM-05216	pHM-05217
유전적 요소	서열번호
5' ITR 요소	49	49	49	18	18
전사 조절 요소	29	29	29	29	29
인간 IDS 암호화 서열	25	25	27	25	27
SV40 폴리아데닐화 서열	45	45	45	45	45
3' ITR 요소	14	14	14	14	19
rAAV 게놈(프로모터에서 폴리아데닐화 서열까지)	75	37	43	52	54

본원에 개시된 벡터는 AAV 캡시드, 예를 들어, 이에 제한되지는 않으나, AAVHSC5, AAVHSC7, AAVHSC15 또는 AAVHSC17 캡시드와 같은 AAV 클레이드 F 캡시드에 패키징될 수 있다. 패키징된 바이러스 입자는 야생형 동물 또는 IDS-결핍 동물에 투여될 수 있다.

실시예 2: 뮤코다당류증(MPS) II형(헌터 증후군) 마우스 모델에서의 IDS 유전자 전달

헌터 증후군은 희귀한 X-연관 유전 장애로서, 주로 남성에게 영향을 미치는 질환이다. 이 질환은 리소좀 효소 이두로네이트-2-설파타제(IDS)의 유전자 결함에 의해 야기된다. IDS는 글리코사미노글리칸(GAG), 헤파란 설페이트(HS), 및 더마탄 설페이트(DS)의 단계적 분해에 필수적이다. IDS는 주로 중추 신경계에서 발현된다.

IDS 유전자 전달의 생체 내 효과를 연구하기 위해 MPS II 마우스 모델을 사용하였다. MPS II 마우스 모델 B6J.Cg-Ids^tm1Muen/HMI는 쥣과 동물 Ids Ids 유전자의 엑손 4 및 엑손 5의 일부에서의 결실을 포함하여 유전자 발현이 파괴된 Ids 녹아웃(IdsKO) 마우스이다. Garcia 등의 문헌 [(2007) J. Inherit. Metab. Dis. 30(6): 924-934]을 참조한다. Ids KO 마우스는 I2S 활성이 결여되어 있고, 증가된 조직 및 기관 GAG 수준뿐만 아니라 소변 GAG 배설을 나타낸다. LAMP1 발현은 Ids KO 마우스의 조직에서 상승된다. Ids KO 마우스는 손가락이 두꺼워지고 비절이 부은 것과 같은 진행성 골격 이상을 나타낸다.

본 실시예에서는 7~9주령의 야생형 및 Ids KO 반접합체(Ids KO 반접합체) 수컷을 사용하였다. AAVHSC15 캡시드에 패키징된 pHM-05205 또는 AAV9 캡시드에 패키징된 pHM-05205를 체중 kg당 2e13 벡터 게놈(vg/kg)의 단일 투여량으로 마우스에게 정맥 내 투여하였다. 투여 후 4주차에 마우스를 희생시켰다.

벡터 게놈 및 hI2S 활성은 Ids KO 반접합체 마우스의 뇌 및 간 조직에서 검출된 것으로 밝혀졌다. 도 2는 야생형, Ids KO 반접합체 수컷, 또는 표시된 바와 같이 rAAV를 투여한 Ids KO 반접합체 수컷의 간에서 검출된 벡터 게놈(도 2a) 및 I2S 활성(도 2b)을 나타낸다 . *는 p<0.05의 통계적 유의성을 나타낸다; WT와 비교해 ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다. 도 3은 야생형, Ids KO 반접합체 수컷, 또는 표시된 바와 같이 rAAV를 투여한 Ids KO 반접합체 수컷의 뇌에서 검출된 벡터 게놈(도 3a) 및 hI2S 활성(도 3b)을 보여준다. 벡터 게놈의 양과 hI2S 활성은 뇌에 비해 간에서 더 높은 것으로 밝혀졌다. 뇌에서, 벡터 게놈 수준은 문미축에 걸쳐 유사한 것으로 밝혀졌으며, AAV9 캡시드로 패키징된 pHM-05205가 투여된 Ids KO 반접합체 마우스에 비해 AAVHSC15 캡시드로 패키징된 pHM-05205가 투여된 Ids KO 반접합체 마우스에서 더 높게 나타났다.

도 4는 AAV9 캡시드로 패키징된 pHM-05205가 투여된 Ids KO 반접합체 마우스와 비교한 AAVHSC15 캡시드로 패키징된 pHM-05205가 투여된 Ids KO 반접합체 마우스의 간 및 뇌에서 hI2S 활성을 보여준다. AAV9 캡시드로 패키징된 pHM-05205가 투여된 Ids KO 반접합체 마우스와 비교하여, AAVHSC15 캡시드로 패키징된 pHM-05205가 투여된 Ids KO 반접합체 마우스 둘 다에서 간에서 검출된 hI2S 활성 수준이 생리학적 이상인 것으로 밝혀졌다(도 4a는 간에서 야생형 I2S 활성 수준의 백분율로서 I2S 활성을 보여준다; 도 4b는 간에서 정상 인간 I2S 활성의 백분율로서 I2S 활성을 보여준다). 또한, AAVHSC15 캡시드로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스는 AAV9 캡시드로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스와 비교하여 상당히 더 높은 hI2S 활성을 나타내는 것으로 밝혀졌다. 뇌에서, AAVHSC15 캡시드로 패키징된 pHM-05205가 투여된 Ids KO 반접합체 마우스와 비교하여 AAV9 캡시드로 패키징된 pHM-05205가 투여된 Ids KO 반접합체 마우스의 hI2S 활성 수준은 각각 야생형 마우스의 약 40% 및 약 45%였고, 성인 인간 수준의 약 75% 및 약 82%인 것으로 밝혀졌다(도 5a는 뇌에서 마우스 I2S 활성 수준의 백분율로서 I2S 활성을 보여준다; 도 5b는 뇌에서 정상 인간 I2S 활성의 백분율로서 I2S 활성을 보여준다). *는 p<0.05의 통계적 유의성을 나타낸다.

AAVHSC15 캡시드로 패키징된 pHM-05205가 투여된 Ids KO 반접합체 마우스 및 AAV9 캡시드로 패키징된 pHM-05205 Ids KO 반접합체 마우스는 미치료 Ids KO 반접합체 마우스(비히클로 치료된 Ids KO 반접합체 마우스)에 비해 뇌, 간 및 소변에서 GAG 수준이 감소된 것으로 밝혀졌다. 도 6은 야생형(WT), Ids KO 반접합체 마우스(MPS II), AAV9 캡시드(AAV9-hIDS)로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스, AAVHSC15 캡시드(HSC15-hIDS)로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스, 및/또는 대표적인 인간의 간(도 6a), 뇌(도 6b) 및 소변(도 6c)에서의 GAG 수준을 보여준다. AAVHSC15 캡시드로 패키징된 pHM-05205가 투여된 Ids KO 반접합체 마우스 및 AAV9 캡시드로 패키징된 pHM-05205가 투여된 Ids KO 마우스의 간 및 뇌에서의 GAG 수준이 야생형 수준까지 감소한 것으로 밝혀졌다. 소변에서, AAVHSC15 캡시드로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스의 GAG 수준은 야생형 마우스에서보다 유의하게 더 낮은 것으로 밝혀졌다. *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타낸다.

도 7은 야생형(WT), Ids KO 반접합체 마우스(MPS II), AAV9 캡시드(AAV9-hIDS)로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스, AAVHSC15 캡시드(HSC15-hIDS)로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스, 및/또는 대표적인 인간의 hIDS의 mRNA 발현이 간(도 7a) 및 뇌(도 7b)에서 검출되었음을 보여준다.

투여 후 12주차에 간 조직 및 소변에서, AAVHSC15 캡시드로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스는 지속성 및 표현형 회복을 나타냈다. 도 8a는 표시된 시간에 소변 샘플 내의 GAG 수준이 야생형 수준으로 구제되었음을 보여준다: 야생형 마우스(WT), Ids KO 반접합체 마우스(MPS II), 및 AAVHSC15 캡시드(HSC15-hIDS)로 패키징된 pHM-05205가 투여된 Ids KO 반접합체 마우스. ***는 p<0.001의 통계적 유의성을 나타낸다. 도 8b는 간에서의 GAG 수준이 야생형 수준으로 구제되었음을 보여준다: 야생형 마우스(WT), Ids KO 반접합체 마우스(MPS II), 및 AAVHSC15 캡시드(HSC15-hIDS)로 패키징된 pHM-05205가 투여된 Ids KO 반접합체 마우스. ****는 p<0.0001의 통계적 유의성을 나타낸다. 도 8c는 간에서 I2S 활성이 증가하였음을 보여준다: 야생형 마우스(WT), 및 AAVHSC15 캡시드(HSC15-hIDS)에 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스. ****는 p<0.0001의 통계적 유의성을 나타낸다. 또한, 항-LAMP1을 사용한 면역 조직 화학에 의해 검출된 바와 같이, AAVHSC15에 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스는 간 조직 내 LAMP1가 감소된 것으로 밝혀졌다.

투여 후 12주차에 뇌에서, AAVHSC15 캡시드로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스는 내구성과 표현형 회복을 나타냈다. 도 9a는, 뇌에서의 GAG 수준이 야생형 수준으로 구제되었음을 보여준다: 야생형 마우스(WT), Ids KO 반접합체 마우스(MPS II), 및 AAVHSC15 캡시드(HSC15-hIDS)에 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스. *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타낸다. 야생형 마우스(WT) 및 AAVHSC15 캡시드에 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스의 뇌에서 hI2S 활성을 검출하였다(도 9b 및 도 9c). *는 p<0.05의 통계적 유의성을 나타낸다.

실시예 3: 인간 IDS 전달 벡터

본 실시예는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 IDS(hIDS)의 발현을 위한 인간 IDS 전달 벡터 T-004, T-005, 및 T-006을 제공한다.

a) T-004

도 10a에 도시된 바와 같이, IDS 전달 벡터 T-004는 5'에서 3'으로 다음의 유전적 요소를 포함한다: 5' ITR 요소; CMV 프로모터를 포함하는 전사 조절 요소; 침묵 변형된 인간 IDS 인트론-삽입 암호화 서열; SV40 폴리아데닐화 서열; 및 3' ITR 요소. 이들 요소의 서열은 표 2에 제시되어 있다. 이 벡터는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 IDS 단백질을 발현할 수 있다.

b) T-005

도 10b에 도시된 바와 같이, IDS 전달 벡터 T-005는 5'에서 3'으로 다음의 유전적 요소를 포함한다: 5' ITR 요소; CMV 프로모터를 포함하는 전사 조절 요소; 침묵 변형된 인간 IDS 인트론-삽입 암호화 서열; SV40 폴리아데닐화 서열; 및 3' ITR 요소. 이들 요소의 서열은 표 2에 제시되어 있다. 이 벡터는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 IDS 단백질을 발현할 수 있다.

c) T-006

도 10c에 도시된 바와 같이, IDS 전달 벡터 T-006은 5'에서 3'으로 다음의 유전적 요소를 포함한다: 5' ITR 요소; CMV 프로모터를 포함하는 전사 조절 요소; 침묵 변형된 인간 IDS 인트론-삽입 암호화 서열; SV40 폴리아데닐화 서열; 및 3' ITR 요소. 이들 요소의 서열은 표 2에 제시되어 있다. 이 벡터는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 IDS 단백질을 발현할 수 있다.

인간 IDS 전달 벡터 T-004, T-005, 및 T-006에서의 유전적 요소
유전적 요소	T-004	T-005	T-006
유전적 요소	서열번호
5' ITR 요소	49	49	49
전사 조절 요소	29	29	29
인간 IDS 암호화 서열	59	60	27
SV40 폴리아데닐화 서열	45	45	45
3' ITR 요소	14	14	14
rAAV 게놈(프로모터에서 폴리아데닐화 서열까지)	61	63	65
rAAV 게놈(5' ITR에서 3' ITR까지)	62	64	66

실시예 4: 뮤코다당류증(MPS) II(헌터 증후군) 마우스 모델에서의 IDS 유전자 전달

본 실시예에서는 6~9주령의 야생형 및 Ids KO 반접합체(Ids KO 반접합체, 또한 MPS II로도 지칭됨) 수컷을 사용하였다. AAVHSC15 캡시드 또는 AAV9 캡시드 중 하나에 패키징된 pHM-05205, T-004, T-005, 또는 T-006 2e13 vg/kg의 단일 투여량을 마우스에게 정맥 내 투여하였다. 투여 후 4주차에 마우스를 희생시켰다.

도 11은 4마리의 야생형 마우스(WT); 4마리의 Ids KO 반접합체 마우스(MPS II); AAV9 캡시드(AAV9-hIDS)에 패키징된 pHM-05205를 투여한 4마리의 Ids KO 반접합체 마우스; AAVHSC15 캡시드(HSC15-hIDS)에 패키징된 pHM-05205를 투여한 4마리의 Ids KO 반접합체 마우스; AAVHSC15 캡시드(HSC15-T-004)에 패키징된 T-004를 투여한 8마리의 Ids KO 반접합체 마우스; AAVHSC15 캡시드(HSC15-T-005)에 패키징된 T-005를 투여한 4마리의 IDS KO 반접합체 마우스; 및 AAVHSC15 캡시드(hIDS-T-006)로 패키징된 T-006을 투여한 4마리의 IDS KO 반접합체 마우스의 소변에서 검출된 GAG 수준(도 11a) 및 혈청 I2S 활성(도 11b)을 보여준다. 도 11a에 도시된 바와 같이, 치료된 Ids KO 반접합체 마우스의 소변 중 GAG 수준은 미치료 Ids KO 반접합체 마우스(비히클로 치료된Ids KO 반접합체 마우스)와 비교하여 감소되었다. 도 11b에 도시된 바와 같이, AAVHSC15 캡시드에 패키징된 T-004, T-005, 또는 T-006을 투여한 Ids KO 반접합체 마우스에게서 혈청 I2S 활성을 검출하였다. *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타내며, ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다.

도 12는 야생형 마우스(WT); Ids KO 반접합체 마우스(MPS II); AAV9 캡시드(AAV9-hIDS)에 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스; AAVHSC15 캡시드(HSC15-hIDS)에 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스; AAVHSC15 캡시드(HSC15-T-004)에 패키징된 T-004를 투여한 Ids KO 반접합체 마우스; AAVHSC15 캡시드(HSC15-T-005)에 패키징된 T-005를 투여한 Ids KO 반접합체 마우스; 및/또는 AAVHSC15 캡시드(hIDS-T-006)에 패키징된 T-006을 투여한 Ids KO 반접합체 마우스의 뇌 및 간에서 검출된 GAG 수준(도 12a 및 12b) 및 뇌 및 간에서의 I2S 활성(도 12c 및 12d)을 보여준다. 도시된 바와 같이, 치료된 Ids KO 반접합체 마우스의 뇌(도 12a) 및 간(도 12ㅠ) 내 GAG 수준은 미치료된 Ids KO 반접합체 마우스(비히클로 치료된Ids KO 반접합체 마우스)와 비교하여 감소되었다. 도시된 바와 같이, AAVHSC15 캡시드에 패키징된 T-004, T-005, 또는 T-006을 투여한 Ids KO 반접합체 마우스에서 뇌(도 12c) 및 간(도 12d)에서의 I2S 활성을 검출하였다. *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타내며, ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다.

실시예 5: 뮤코다당류증(MPS) II(헌터 증후군) 마우스 모델에서의 IDS 유전자 전달

본 실시예에서는 7~10주령의 야생형 및 Ids KO 반접합체(Ids KO 반접합체, 또한 MPS II로도 지칭됨) 수컷을 사용하였다. AAVHSC15 캡시드에 패키징된 2.2e13 vg/kg, 6.5e13 vg/kg, 및 1.1e14 vg/kg의 pHM-05217을 포함하는 투여량 범위를 그룹 당 5마리의 마우스에게 정맥 내 투여하였다. 투여 후 4주차에 마우스를 희생시켰다. 본 실시예에서, 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.

AAVHSC15 캡시드에 패키징된 pHM-05217의 안전성을 조사하기 위해, 야생형 마우스에 대한 바이러스 투여의 효과를 연구하였다. AAVHSC15 캡시드에 패키징된 pHM-05217의 내약성은 투여 용량에 걸쳐 그리고 시간에 따라 체중 감소의 증거가 관찰되지 않았을 때 입증되었다(도 13a 및 도 13b). 도 13a 및 도 13b에 도시된 바와 같이, AAVHSC15에 패키징된 pHM-05217로 치료한 야생형 및 Ids KO 반접합체 마우스 둘 다는 시간 경과에 따른 체중 감소의 증거를 나타내지 않았다. 도 13에서, 그룹 1: Ids KO 반접합체 마우스 대조군; 그룹 2: AAVHSC15 캡시드에 2.2e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스; 그룹 3: 6.5e13 vg/kg의 투여량으로 AAVHSC15 캡시드에 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스; 그룹 4: AAVHSC15 캡시드에 1.1e14 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스; 및 그룹 5: 야생형 마우스. 도 13b에서, 그룹 5: 야생형 마우스; 그룹 6: AAVHSC15 캡시드에 2.2e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 야생형 마우스; 및 그룹 7: AAVHSC15 캡시드에 1.1e14 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 야생형 마우스.

야생형 마우스에서의 I2S 활성은 AAVHSC15 캡시드에 패키징된 pHM-05217의 투여 시 투여량 의존적인 것으로 밝혀졌다. 혈청에서, 투여 후 2주(도 14a) 및 4주(도 14b)차에, 표시된 바와 같은 투여량으로 AAVHSC15 캡시드에 패키징된 pHM-05217을 투여한 야생형 마우스는 I2S 활성의 투여량 의존적 증가를 나타냈다. 미치료 야생형(WT) 마우스 및 Ids KO 반접합체(MPS II) 마우스를 대조군으로서 사용하였다. 간에서, 투여 후 4주차(도 14c)에, 표시된 바와 같은 투여량으로 AAVHSC15 캡시드에 패키징된 pHM-05217을 투여한 야생형 마우스는 I2S 활성의 투여량 의존적 증가를 나타냈다. 이는 인간 I2S 활성이 야생형 마우스에서 검출 가능하며, 야생형 마우스에서 정상 수준보다 I2S 활성을 증가시키는 것이 체중에 영향을 미치지 않음을 입증하였다.

AAVHSC15 캡시드로 패키징된 pHM-05217을 투여한 야생형 마우스에서의 GAG 수준은 야생형 미치료 마우스의 GAG 수준과 유사하며, 야생형 수준 미만으로 더 감소되지 않는 것으로 밝혀졌다. 뇌(도 15a) 및 간(도 15b)에서, 치료된 Ids KO 반접합체 마우스의 GAG 수준은 야생형 미치료 마우스(대조군)와 유사한 것으로 밝혀졌다. ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다.

뇌 및 간에서의 발현은 AAVHSC15에 패키징된 pHM-05217의 투여 시 용량 의존적인 것으로 밝혀졌다. 도 16a는 표시된 투여량으로 AAVHSC15에 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스의 뇌 발현을 보여주는데, 이는 투여량이 증가함에 따라 발현이 증가하는 것을 보여준다. 도 16b는 표시된 투여량으로 AAVHSC15에 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스의 간 발현을 보여주는데, 이는 투여량이 증가함에 따라 발현이 증가하는 것을 보여준다. 일반적으로, 간은 뇌보다 더 많은 양의 침묵 변형된 IDS 발현을 갖는 것으로 밝혀졌다. *는 p<0.05의 통계적 유의성을 나타내고, ***는 p<0.001의 통계적 유의성을 나타낸다.

AAVHSC15 캡시드에 패키징된 pHM-05217의 효능을 조사하기 위해, Ids KO 반접합체 마우스에 대한 바이러스 투여의 효과를 연구하였다. AAVHSC15 캡시드로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스의 혈청 I2S 활성은 투여 후 2주차(도 17a)에 검출되었고, 4주차(도 17b)에 일관되게 유지되었다. 4주차에, 혈청 I2S 활성은 6.5e13 vg/kg의 투여량까지 투여량 의존적인 것으로 밝혀졌다. **는 p<0.01의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다.

AAVHSC15 캡시드에 패키징된 pHM-05217은 또한 간에서 투여량 의존적인 I2S 활성을 나타냈다. 도 18은 AAVHSC15 캡시드에 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스의 간 I2S 활성을 보여준다. **는 p<0.01의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다.

AAVHSC15에 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스의 소변 내 GAG 수준은 투여 후 2주차(도 19a) 및 4 주차(도 19b)에 모든 투여량에서 야생형 수준으로 감소되는 것으로 밝혀졌다. AAVHSC15에 패키징된 pHM-05217를 투여한 Ids KO 반접합체 마우스의 소변 내 GAG 헤파린 설페이트(GAG-HS)(도 19c) 및 GAG 더마탄 설페이트(GAG-DS)(도 19d) 수준은 투여 후 4주차에 야생형 수준까지 감소된 것으로 밝혀졌다. GAG 수준을 질량 분광분석에 의해 결정하고, 각 소변 샘플에서 크레아티닌 수준으로 정규화하였다. 이원분산분석(ANOVA)을 사용하여 통계적 분석을 수행하였다: ns는 통계적 유의성이 없음을 나타내고, **는 p<0.01의 통계적 유의성을 나타내고, ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다.

AAVHSC15에 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스의 간(도 20a), 심장(도 20b), 폐(도 20c), 뇌(도 20d), 신장(도 20e) 및 비장(도 20f)의 GAG 수준은 투여 후 4주차에 모든 투여량에서 야생형 수준으로 감소되는 것으로 밝혀졌다. *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타내며, ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다.

실시예 6: 뮤코다당류증(MPS) II(헌터 증후군) 마우스 모델에서의 IDS 유전자 전달

또 다른 실시예에서, 성인 야생형 및 Ids KO 반접합체 마우스(Ids KO 반접합체; MPS II로도 지칭됨)에서 4주 정맥 내 단일 투여량 범위 확인 연구를 수행하였다. 2.2e13 vg/kg, 6.5e13 vg/kg, 및 1.1e14 vg/kg의 AAVHSC15 캡시드에 패키징된 pHM-05217을 그룹 당 4~5마리의 마우스의 정맥 내에 투여하였다. 투여 후 4주차에 마우스를 희생시켰다. 이들 실험에서, AAVHSC15에 패키징된 pHM-05217은 뇌의 혈액-뇌 장벽을 통과하고 세포에 형질도입되어, 뇌에서 I2S의 발현 및 유의한 헤파란 설페이트 감소 및 용량 의존적 LAMP1 감소를 유도하는 것으로 밝혀졌다. 혈청 및 간 I2S 활성은 또한 투여량 의존적인 것으로 밝혀졌다. 모든 투여량에서, 헤파란 설페이트 수준은 시험한 모든 말초 조직에서 감소하는 것으로 밝혀졌다. MPS II 또는 WT 치료 동물의 체중 감소 결여에 기반하여, AAVHSC15에 패키징된 최대 1.1e14 vg/kg의 pHM-05217의 투여량은 관용성이 있는 것으로 밝혀졌다.

AAVHSC15 캡시드에 패키징된 pHM-05217의 단일 정맥 내 투여는 벡터 게놈의 수준(도 21a) 및 주요 쥣과 동물 말초 및 중앙 장기에서 hIDS 전사체(도 21b)의 투여량 의존적 증가를 초래하는 것으로 밝혀졌다. 도 21b는 야생형 hIDS 전사체에 대해 정규화된 침묵 변형된 hIDS 전사체의 백분율을 보여준다. 헤파란 설페이트(도 21c), 더마탄 설페이트(도 21d) 및/또는 총 GAG 수준은 모든 투여량에서 모든 기관에서 감소되는 것으로 밝혀졌다. 도 21c 및 21d에서, *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타내며, ****는 p<0.0001의 통계적 유의성을 나타내고, ns는 유의하지 않음을 나타낸다.

투여 후 4주차에, AAVHSC15 캡시드에 패키징된 pHM-05217을 투여한 MPS II 마우스는 뇌에서 벡터 게놈 수준(도 22a), 인간 야생형 hIDS 전사체에 대해 정규화된 침묵 변형된 hIDS 전사체의 백분율(도 22b) 및 I2S 활성(도 22c)의 투여량 의존적 증가를 나타냈다. AAVHSC15에 패키징된 pHM-05217을 투여한 MPS II 마우스의 뇌에서의 헤파란 설페이트 수준은 투여 후 4주차에 모든 투여량에서 감소되는 것으로 밝혀졌다(도 22d). 도 22a~22d에 나타낸 바와 같이, AAVHSC15 캡시드에 패키징된 pHM-05217은 혈액-뇌 장벽을 통과하고, 뇌 조직에 형질도입되어, 침묵 변형된 hIDS를 발현하였고, 뇌에서 검출 가능한 I2S 활성을 초래하고, 뇌 조직 특이적 GAG를 감소시켰다. 도 22a~22d에서, *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타내며, ***는 p<0.001의 통계적 유의성을 나타내고, ns는 유의하지 않음을 나타낸다.

AAVHSC15 캡시드에 패키징된 pHM-05217의 투여가 뇌 병리에 미치는 효과를 추가로 평가하기 위해, 소뇌(도 23a), 척수(도 23b) 및 해마(도 23c)를 면역조직화학(IHC)에 의해 리소좀-연관 막 단백질 1(LAMP1)에 대해 분석하였다. LAMP1의 존재는 리소좀 부담의 증거이다. 면역조직화학(IHC)에 의한 LAMP1의검출은 토끼 다클론 항-LAMP1 항체(Abcam, ab24170)를 사용하여 수행하였다. 간략하게, 포르말린 고정 파라핀 포매(FFPE) 샘플을 4 μm 또는 6 μm로 절단하고 하전된 슬라이드에 장착하였다. 슬라이드는 자동 염색기를 사용하여 처리되고 가공되었고, 항-LAMP1 일차 항체로 30분 동안 염색되었고(0.25 μg/ml), 항-토끼 표지된 중합체-HRP로 30분 동안 염색되었다. 염색된 절편의 이미지를 촬영하고 픽셀 평균 회색 값을 분석하여, 각 절편에서 LAMP1의 발현에 대한 반정량적 보고를 허용하였다. 도 23a~23c에서, AAVHSC15에 패키징된 pHM-05217은 혈액-뇌 장벽을 통과하였고, 치료한 MPS II 마우스의 CNS에서 LAMP1 감소의 투여량 의존적 추세를 초래하였다. 도 23a~23c에서, *는 p<0.05의 통계적 유의성을 나타내고, **는p<0.01의 통계적 유의성을 나타내며, ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타내며, ns는 유의하지 않음을 나타낸다.

LAMP1 발현은 또한 간, 비장, 심장, 신장 및 폐를 포함하는 주요 기관에서 IHC에 의해 분석되었다. AAVHSC15 캡시드에 1.1e14 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 MPS II 마우스의 정성적 분석은 미치료 MPS II 마우스(비히클을 투여한 MPS II 마우스)와 비교하여, 치료한 MPS II 마우스의 간, 비장, 심장, 신장 및 폐에서 LAMP1의 발현이 감소하였음을 입증하였다.

투여 후 4주차에, AAVHSC15 캡시드에 패키징된 pHM-05217을 투여한 MPS II 마우스는 혈청(도 24) 및 간(도 25)에서 I2S 활성의 용량 의존적 증가를 보여주었다. 도 24 및 25에서, **는 p<0.01의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타내며, ns는 유의하지 않음을 나타낸다.

실시예 7: 야생형 및 침묵 변형된 hIDS 전달 벡터 간의 비교

본 실시예는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 IDS(hIDS)의 발현을 위한 인간 IDS 전달 벡터 pHM-05205를 제공한다. 본 실시예는 hIDS 전달 벡터 T-006과 pHM-05205의 효능 간의 비교를 제공한다. T-006은 실시예 3에 기술되어 있고, pHM-05205는 아래에 기술되어 있다.

pHM-05205

도 26a에 도시된 바와 같이, IDS 전달 벡터 pHM-05205는 5'에서 3'으로 다음의 유전적 요소를 포함한다: 5' ITR 요소; CMV 프로모터를 포함하는 전사 조절 요소; 야생형 인간 IDS 인트론-삽입 암호화 서열; SV40 폴리아데닐화 서열; 및 3' ITR 요소. 이들 요소의 서열은 표 3에 제시되어 있다. 이 벡터는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 IDS 단백질을 발현할 수 있다.

인간 IDS 전달 벡터 pHM-05205에서의 유전적 요소
유전적 요소	pHM-05205
유전적 요소	서열번호
5' ITR 요소	49
전사 조절 요소	29
인간 IDS 암호화 서열	25
SV40 폴리아데닐화 서열	45
3' ITR 요소	14
rAAV 게놈(프로모터에서 폴리아데닐화 서열까지)	75
rAAV 게놈(5' ITR에서 3' ITR까지)	76

야생형 hIDS 암호화 서열을 포함하는 hIDS 전달 벡터(pHM-05205) 및 침묵 변형된 hIDS 암호화 서열을 포함하는 hIDS 전달 벡터(T-006)의 효능을 시험하기 위해, T-006 및 pHM-05205를 AAVHSC15에 각각 포장하여 6e13 vg/kg의 투여량으로 MPS II 마우스에 투여하였다. 투여 후 4주차에 마우스를 희생시키고 혈청(도 26b) 및 간(도 26c) 내 I2S 활성뿐 아니라 쥣과 G 단백질 경로 억제자 1(GPS1)의 발현에 대해 정규화된 hIDS 전사체의 상대적 발현을 측정하였다(도 26d). 도 26b 및 26c에 나타낸 바와 같이, 야생형 hIDS 전달 벡터(pHM-05205; "SC WT")의 투여에 비해, 침묵 변형된 hIDS 전달 벡터(T-006; "SC SA")의 투여는 치료된 MPS II 마우스 내 혈청 및 간에서 각각 유의하게 더 높은 I2S 활성을 초래하였다. 도 26d는 야생형 hIDS 전달 벡터의 투여와 비교하여 치료된 MPS II 마우스에서 침묵 변형된 hIDS 전달 벡터의 투여는 뇌 조직에서 hIDS 전사체의 유의하게 더 높은 상대적 발현을 초래함을 보여준다. 비히클로 치료한 MPS II 마우스를 대조군으로서 사용하였다. 도 26b~26d에서, ****는 p<0.0001의 통계적 유의성을 나타내고, ns는 유의하지 않음을 나타낸다.

실시예 8: 단일-가닥 및 자가 상보성 hIDS 전달 벡터 간의 비교

본 실시예는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 IDS(hIDS)의 발현을 위한 인간 IDS 전달 벡터 pHM-05211을 제공한다. 본 실시예는 hIDS 전달 벡터 pHM-05205와 pHM-05211 간의 비교를 제공한다. pHM-05205는 실시예 7에 기술되어 있고, pHM-05211은 아래에 기술되어 있다.

pHM-05211

도 27a에 나타낸 바와 같이, IDS 전달 벡터 pHM-05211은 5'에서 3'로 다음의 유전적 요소를 포함한다: 5' ITR 요소; CMV 프로모터를 포함하는 전사 조절 요소; 야생형 인간 IDS 인트론-삽입 암호화 서열; SV40 폴리아데닐화 서열; 및 3' ITR 요소. 이들 요소의 서열은 표 4에 제시되어 있다. 이 벡터는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 IDS 단백질을 발현할 수 있다.

표 4:

[0001] 단일-가닥 hIDS 전달 벡터(pHM-05211; "SS WT")와 자가-상보성 hIDS 전달 벡터(pHM-05205; "SC WT") 간의 비교를 수행하였다. 도 27b는 각각 AAVHSC15 캡시드에 2e13 vg/kg의 용량으로 패키징된 pHM-05211 또는 pHM-05205를 투여한 MPS II 마우스에서 검출된 혈청 hI2S 활성의 수준을 보여준다. 혈청 hI2S 활성은 표시된 바와 같이, 투여 후 6 또는 8주차에 측정하였다. 단일-가닥 및 자가-상보성 hIDS 전달 벡터의 혈청 hI2S 활성을 유도하는 능력 사이에 유의한 차이는 발견되지 않았다. 도 27c는 단일-가닥 또는 자가-상보성 전달 벡터로 치료한 MPS II 마우스에서 쥣과 G 단백질 경로 억제자 1(GPS1)의 발현에 대해 정규화된 hIDS 전사체의 상대적 발현을 보여준다. 표시된 바와 같이, 투여 후 2 또는 8주차에 마우스를 희생시켰고, 각 코호트에서 단일-가닥 또는 자가-상보성 전달 벡터로 치료한 마우스 사이에서 hIDS 전사체의 상대적 발현에서 차이가 검출되지 않았다. ns는 유의하지 않음을 나타낸다.

[0002] 분석적 초원심분리 침강 속도(AUC)는 침강 계수에 기초하여 거대분자를 정량화하는 데 사용되는 분석 방법이다. rAAV 샘플의 분석을 위해, AUC를 사용해 DNA-함유(완전한 캡시드 및 부분적으로 완전한 캡시드) 및 빈 캡시드의 상대 백분율을 결정할 수 있다. 단일-가닥 및 자가-상보성 전달 벡터에 대한 AUC 프로파일을 결정하였다. 단일-가닥 전달 벡터의 AUC 프로파일은 자가-상보성 전달 벡터의 AUC 프로파일과 비교하여 완전한 캡시드의 백분율이 더 높은 프로파일을 나타냈다. 자가-상보성 전달 벡터(pHM-05205)는 31.7%의 완전히 패키징된 캡시드를 초래하였고, 단일-가닥 전달 벡터(pHM-05211)는 85.0%의 완전히 패키징된 캡시드를 초래하였다.

실시예 9: 뮤코다당류증(MPS) II(헌터 증후군) 마우스 모델에서의 hIDS 유전자 전달

본 실시예는 성인 야생형 및 Ids KO 반접합체 마우스(Ids KO 반접합체; MPS II 마우스로도 지칭됨)에서 52주 단일 정맥 내 투여 시간 경과, 내구성 및 효능 연구를 기술한다. AAVHSC15 캡시드에 패키징된 1.8e14 vg/kg 용량의 pHM-05217을 그룹 당 3~5마리의 마우스에게 정맥 내 투여하였다.

MPS II 마우스에게 정맥내로 투여되는 AAVHSC15 캡시드에 패키징된 pHM-05217의 단일 1.8e14 vg/kg 투여량은 대조군 비히클-치료 MPS II 마우스와 비교하여 유의한 혈청 I2S 활성을 유발하는 것으로 밝혀졌다(도 28a). 혈청 I2S 활성은 투여 후 52주까지 검출 가능하였다.

투여 후 52주차에, 벡터 게놈 및 발현을 유지하였다. 전달 벡터로 치료한 MPS II 마우스의 뇌, 심장, 간, 비장, 신장 및 폐 조직에서 투여 후 52주까지 벡터 게놈(도 28b) 및 hIDS 전사체(도 28c)의 수준을 검출하였다. AAVHSC15에 패키징된 1.8e14 vg/kg의 pHM-05217을 투여한 후 52주차에, 뇌, 심장, 간, 비장, 신장 및 폐 조직에서의 글리코사미노글리칸 헤파란 설페이트(GAG-HS) 수준은 비히클로 치료한 MPS II 마우스와 비교하여 감소한 것으로 밝혀졌다(도 28d).

뇌에서, IHC에 의해 분석된 바와 같이, 투여 후 52주차에 척수(도 28e) 및 해마(도 28f)에서 LAMP-1 염색의 감소가 관찰되었다. 해마에서, LAMP-1 염색은 전달 벡터로 치료한 MPS II 마우스에서 비히클로 치료한 MPS II 마우스와 비교하여 유의하게 감소하였다. 도 28e 및 28f에서, *는 p<0.05의 통계적 유의성을 나타내고, ns는 유의하지 않음을 나타낸다.

혈액-신경 장벽(BNB)의 통과 및 말초 신경계(PNS)의 형질도입을 평가하기 위해, 동물로부터 삼차 신경절을 채취하였다. 비히클로 치료한 MPS II 마우스 및 야생형 마우스와 비교하여, AAVHSC15 캡시드에 패키징된 1.8e14 vg/kg의 투여량의 pHM-05217을 투여한 MPS II 마우스에서는 투여 후 39주차에 벡터 게놈이 검출되었다(도 28g). 도 28g에 나타낸 바와 같이, AAVHSC15에 패키징된 pHM-05217은 BNB를 통과하여 PNS의 세포에 형질도입되는 것으로 밝혀졌다.

AAVHSC15 캡시드에 패키징된 1.8e14 vg/kg의 투여량의 pHM-05217을 투여한 MPS II 마우스에서 간 및 뇌 조직 특이적 I2S 효소 활성을 검출하였다. 간 특이적 I2S 효소 활성은 투여 후 12, 24, 39, 및 52주차에 검출되었고(도 28h), 뇌 특이적 I2S 효소 활성은 투여 후 12주(도 28i), 24주(도 28j), 39주(도 28k), 및 52주(도 28l)차에 검출되었다. 도 28j~28l에서, 정상 성인 인간 뇌 조직을 추가 대조군으로서 사용하였다.

AAVHSC15에 패키징된 1.8e14 vg/kg의 pHM-05217을 투여한 MPS II 마우스의 소변에서 검출된 GAG-HS의 수준은, 비히클로 치료한 MPS II 마우스와 비교하여, 투여 후 적어도 52주까지 감소하는 것으로 밝혀졌다(도 28m). 소변 GAG-HS 수준을 질량 분광분석에 의해 결정하고 각 소변 샘플에서 크레아티닌 수준으로 정규화하였다. 도 28m에서, 데이터는 각 투여량 코호트에 대한 평균 수준으로서 제시된다(n=3~5마리 마우스/그룹).

MPS II 마우스는 소뇌에서 퍼킨지 세포 뉴런의 진행성 변성을 특징으로 한다. AAVHSC15에 패키징된 1.8e14 vg/kg의 pHM-05217을 투여한 MPS II 마우스의 투여 후 52주차에 퍼킨지 세포층(PCL) 세포 선형 밀도를 정량화하였다. 헤마톡실린 및 에오신(H&E)으로 공동 염색된 시상 뇌 절편에 대해 퍼킨지 세포 선형 밀도의 정량화를 수행하였다. 소뇌의 이미지를 수집하고, 400 μm 길이의 퍼킨지 세포층(PCL) 영역을 따라 총 퍼킨지 세포체 수를 수동으로 계수하였다. 절편 당 3개의 PCL 영역을 무작위로 샘플링하였다(n = 동물 당 1개의 섹션). AAVHSC15에 패키징된 1.8e14 vg/kg의 pHM-05217을 투여한 MPS II 마우스는, 비히클로 치료한 MPS II 마우스와 비교하여, 퍼킨지 세포 변성을 완화시킨 것으로 밝혀졌다(도 28n). 도 28n에서, **은 일원 분산 분석(ANOVA) 검정에 의해 계산했을 때, p<0.01의 통계적 유의성을 나타낸다.

MPS II 마우스는 야생형 동물과 비교하여, 비후해진 관공굴, 비후한 손가략, 및 뒷발 비대를 포함하는 골격 이상을 특징으로 한다. 껍질을 제거한 동물의 두개골에서 캘리퍼를 사용하여 관공굴 기저부 형태 측정 값을 평가하였다. AAVHSC15 캡시드에 패키징된 1.8e14 vg/kg 투여량의 pHM-05217을 투여한 MPS II 마우스는 비히클로 치료한 MPS II 마우스와 비교하여 관골궁 두께가 감소된 것으로 밝혀졌다(도 28o). 도 28o에서, ***는 p<0.01의 통계적 유의성을 나타내고, ns는 유의하지 않음을 나타낸다.

투여 후 52주차에, AAVHSC15에 패키징된 1.8e14 vg/kg의 pHM-05217로 치료한 MPS II 마우스는 미치료 MPS II 마우스(비히클을 투여한 MPS II 마우스)에 비해 감소된 발과 발목 비대를 나타냈다. 마취된 마우스에 대해 디지털 캘리버를 사용하여 도 29a에 제공된 바와 같은 도식을 따라 발목 및 발 측정을 수행하였다. 도 29b 및 29c에 나타낸 바와 같이, 전달 벡터로 치료한 MPS II 마우스는 비히클-치료 MPS II 대조군 마우스와 비교하여 발 폭(도 29b) 및 깊이(도 29c) 모두에서 측정된 바와 같이 시간에 따른 뒷발의 비후화의 완화를 보여주었다 도 29d 및 29e에 나타낸 바와 같이, 전달 벡터로 치료한 MPS II 마우스는 비히클로 치료한 MPS II 대조군 마우스와 비교하여 발목 폭(도 29d) 및 깊이(도 29e) 둘 다에서 측정된 바와 같이 시간에 따른 비절의 팽창의 완화를 보여주었다

실시예 10: 뮤코다당류증(MPS) II(헌터 증후군) 마우스 모델에서의 IDS 유전자 전달

본 실시예는 성인 야생형 및 Ids KO 반접합체 마우스(Ids KO 반접합체; 또한 MPS II 마우스로도 지칭됨)에서 8주 단일 정맥 내 투여 생물학적 동역학 연구를 기술한다. AAVHSC15 캡시드에 패키징된 1.8e14 vg/kg 투여량의 pHM-05217을 그룹 당 4~5마리의 마우스에게 정맥 내 투여하였다.

MPS II 마우스에게 정맥내로 투여되는 AAVHSC15 캡시드에 패키징된 1.8e14 vg/kg의 단일 투여량의 pHM-05217은, 대조군 비히클 치료된 MPS II 마우스와 비교하여 투여 후 이르게는 1일차에 측정 가능한 유의한 혈청 I2SS 활성을 유발하는 것으로 밝혀졌다(도 30a). AAVHSC15 캡시드에 패키징된 1.8e14 vg/kg의 단일 투여량의 pHM-05217을 정맥 내 투여한 MPS II 마우스에서 벡터 게놈(도 30b) 및 발현(도 30c) 수준을 시험한 모든 시점에, 뇌, 심장, 간 및 비장 조직에서 검출하였다. 투여 후 8주차에, AAVHSC15 캡시드에 패키징된 1.8e14 vg/kg의 단일 투여량의 pHM-05217을 정맥 내 투여한 MPS II 마우스에서 간 조직(도 30d) 및 뇌 조직(도 30e) 특이적 I2S 활성을 검출하였다. AAVHSC15에 패키징된 1.8e14 vg/kg의 pHM-05217의 투여 후 8일(도 31a), 2주(도 31b), 및 8주(도 31c)차의 시점에 시점에, 뇌, 심장, 간 및 비장 조직에서의 글리코사미노글리칸 헤파란 설페이트(GAG-HS) 수준은 비히클로 치료한 MPS II 마우스와 비교하여 감소한 것으로 밝혀졌다. AAVHSC15에 패키징된 1.8e14 vg/kg의 pHM-05217을 투여한 MPS II 마우스의 소변에서 검출된 GAG-HS의 수준은, 비히클로 치료한 MPS II 마우스와 비교하여, 투여 후 3일 및 적어도 8주까지 베이스라인 수준 대비 감소하는 것으로 밝혀졌다(도 31d). 도 30a~31d에서, *는 p<0.05의 통계적 유의성을 나타내고,, **는 p<0.01의 통계적 유의성을 나타내며, ***는 p<0.001의 통계적 유의성을 나타내고, ns는 유의하지 않음을 나타낸다.

실시예 11: 뮤코다당류증(MPS) II(헌터 증후군) 마우스 모델에서의 IDS 유전자 전달

고성능 액체 크로마토그래피 질량 분광분석을 사용하여, 헤파란란분해효소 분해 후 CSF 샘플에서 헤파란 설페이트 특이적 이당류를 측정함으로써 마우스의 뇌척수액(CSF)에서 글리코사미노글리칸 헤파란 설페이트(GAG-HS) 수준을 결정하였다. 도 32a에 표시된 바와 같이, 투여 후 12주차에 GAG-HS 수준을 야생형(WT) 마우스, 비히클로 치료한 MPS II 마우스, 및 6e13 vg/kg(MPS II 6E+13), 1e14 vg/kg(MPS II 1E+14), 또는 2e14 vg/kg (MPS II 2E+14)의 투여량으로 정맥 내 투여한 AAVHSC15 캡시드로 패키징된 pHM-05217로 치료한 MPS II 마우스의 CSF에서 측정하였다. 비히클로 치료한 MPS II 마우스와 비교했을 때, 시험한 모든 투여량에서 CSF GAG-HS 수준의 감소가 관찰되었다. 도 32a에서, 각 군은 총 5마리의 마우스로부터 모인 3개의 CSF 샘플을 갖는다. 통계적 분석은 일방향 분산 분석(ANOVA)을 사용하여 수행하였다. *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타낸다. 도 32b에 표시된 바와 같이, 투여 후 12주차에, 야생형(WT) 마우스, 비히클로 치료한 MPS II 마우스, 및 6e13 vg/kg(MPS II 6E+13), 1e14 vg/kg(MPS II 1E+14), 또는 2e14 vg/kg(MPS II 2E+14)의 투여량으로 정맥 내 투여한 AAVHSC15 캡시드로 패키징된 pHM-05217로 치료된 MPS II 마우스의 뇌 조직 내 GAG-HS 수준. 도 32b에 도시된 바와 같이, 비히클로 치료한 미치료 MPS II 마우스와 비교했을 때, 시험한 모든 투여량에서 뇌 GAG-HS 수준의 감소가 관찰되었다. 통계적 분석은 일방향 분산 분석(ANOVA)을 사용하여 수행하였다. ****는 p<0.0001의 통계적 유의성을 나타낸다.

도 32c에 표시된 바와 같이, 투여 후 12주차에 야생형(WT) 마우스, MPS II 마우스, 6e13 vg/kg(MPS II 6E+13), 1e14 vg/kg(MPS II 1E+14), 또는 2e14 vg/kg(MPS II 2E+14)의 투여량으로 정맥 내 투여한 AAVHSC15 캡시드로 패키징된 pHM-05217로 치료한 MPS II 마우스의 뇌 조직에서 I2S 활성을 검출하였다. 정상 성인 인간 뇌 조직을 추가 대조군으로서 사용하였다. 통계적 분석은 일방향 분산 분석(ANOVA) 검정을 사용하여 수행하였다. *는 p<0.05의 통계적 유의성을 나타내고, ***는 p<0.001의 통계적 유의성을 나타낸다.

실시예 12: IDS 유전자 전달 교차 보정

AAV 유전자 전달 벡터로부터 발현된 I2S의 교차-보정 능력을 조사하기 위해, AAVHSC15에 패키징된 1.8e14 vg/kg의 pHM-05217을 MPS II 마우스에 정맥 내 투여하고 혈청을 분석하였다.

이두로네이트-2-설파타제는 번역 후 변형된다. 초기 73~78 kDa IDS 단백질은 만노오스 6-포스페이트(M6P) 모이어티의 첨가를 통해 90 kDa 인산화 전구체로 전환된다. 그런 다음, 90 kDa 전구체를 다양한 중간체를 통한 단백질 분해 절단을 통해 주요 55 kDa 중간체로 가공하고, 18 kDa 폴리펩티드를 방출한다. 티올 프로테아제에 의한 추가 단백질 분해 절단은 혼성 및 복합형 올리고당 사슬을 함유하는 45 kDa 성숙 형태를 초래한다.

요약하자면, IDS KO HeLa 세포를 배양하고, 투여 후 8일차에 AAVHSC15에 패키징된 1.8e14 vg/kg의 pHM-05217로 치료한 MPS II 마우스로부터 수득한 마우스 혈청과 함께 배양하였다. 세포를 48시간 동안 M6P의 존재 또는 부재 하에 처리된 마우스 혈청과 함께 인큐베이션하였다. 염소 항-hIDS 1차 항체로 탐침하고 당나귀 항-염소 2차 항체를 사용하여 검출한 웨스턴 블롯은 다음을 확인하였다: (1) AAVHSC15에 패키징된 pHM-05217에 의해 만들어진 hIDS 단백질은 90 kDa 전구체 형태로 치료한 MPS II 마우스의 혈청에서 순환하고; (2) 90 kDa 형태는 촉매 활성이고; (3) IDS KO HeLa 세포에서 M6P-의존성 경로를 통해 90 kDa 형태를 취하고, IDS KO HeLa 세포의 리소좀에서 중간체 55 kDa 및 성숙한 45 kDa 단백질로 가공한다.

처리된 MPS II 마우스로부터 수득한 마우스 혈청과 함께 IDS KO HeLa 세포를 인큐베이션한 후, 세포를 원심분리하고 상청액을 제거하였다. 그런 다음, 펠릿화된 세포를 용해시키고 hI2S 활성에 대해 분석하였다. 도 33은 IDS KO 세포(대조군), M6P 없이 처리된 MPS II 마우스 혈청으로 인큐베이션한 IDS KO 세포, 및 M6P와 함께 처리된 MPS II 마우스 혈청으로 인큐베이션한 IDS KO 세포에서 검출된 I2SS 활성의 수준을 보여준다. 도 33에 도시된 바와 같이, AAVHSC15에 패키징된 1.8e14 vg/kg의 pHM-05217을 투여한 후 8일차에 MPS II 마우스로부터 수득된 혈청으로 처리된 IDS KO HeLa 세포의 용해물에서 I2S 활성을 검출하였다. I2S 활성은 M6P가 존재할 때 더 낮은 것으로 밝혀졌으며, 임의의 이론에 구속되지 않고, M6P가 M6P 수용체에 대해 경쟁하고, 따라서 hI2S 흡수가 시험관 내에서 M6P 수용체 경로에 의해 매개된다는 것을 시사한다. *는 p<0.05의 통계적 유의성을 나타내고, ***는 p<0.001의 통계적 유의성을 나타낸다.

* * *

본 발명은 본원에 기술된 특정 구현예에 의해 그 범위가 제한되지 않는다. 실제로, 기술된 것들에 더하여, 본 발명의 다양한 변형은 전술한 설명 및 첨부 도면으로부터 당업자에게 명백해질 것이다. 이러한 변형은 첨부된 청구범위의 범주 내에 속하는 것으로 의도된다.

본원에 인용된 모든 참조(예를 들어, 간행물 또는 특허 또는 특허 출원)는 각각의 개별 참조(예를 들어, 간행물 또는 특허 또는 특허 출원)가 모든 목적을 위해 그 전체가 참조로서 포함되는 것으로 구체적 및 개별적으로 표시된 것과 동일한 정도로 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다. 다른 구현예는 다음의 청구범위 내에 있다.

<110> HOMOLOGY MEDICINES, INC. <120> ADENO-ASSOCIATED VIRUS COMPOSITIONS FOR IDS GENE TRANSFER AND METHODS OF USE THEREOF <130> HMW-037WO (182710) <150> US 63/005,833 <151> 2020-04-06 <150> US 63/094,800 <151> 2020-10-21 <150> US 63/145,258 <151> 2021-02-03 <160> 78 <170> PatentIn version 3.5 <210> 1 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> adeno-associated virus 9 <400> 1 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 2 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 2 Met Thr Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Gln Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 3 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 3 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Gly Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Gly Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 4 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 4 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Ile Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Tyr Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 5 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 5 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Asp 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 6 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 6 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Leu Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Ser Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 7 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 7 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Arg Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 8 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 8 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Val Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 9 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 9 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Arg Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 10 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 10 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Cys Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 11 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 11 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Arg Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Lys Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 12 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 12 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro His Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Asn 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Met Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 13 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 13 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 14 <211> 145 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 14 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120 gagcgcgcag agagggagtg gccaa 145 <210> 15 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 15 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Arg Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 16 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 16 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Ala Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 17 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 17 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Ile Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Cys Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 18 <211> 145 <212> DNA <213> Artificial Sequence <220> <223> AAV2 5' ITR <400> 18 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcct 145 <210> 19 <211> 145 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 19 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgcccgggc aaagcccggg cgtcgggcga cctttggtcg cccggcctca gtgagcgagc 120 gagcgcgcag agagggagtg gccaa 145 <210> 20 <211> 167 <212> DNA <213> Artificial Sequence <220> <223> AAV5 5' ITR <400> 20 ctctcccccc tgtcgcgttc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60 agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120 cgcgacaggg gggagagtgc cacactctca agcaaggggg ttttgta 167 <210> 21 <211> 167 <212> DNA <213> Artificial Sequence <220> <223> AAV5 3' ITR <400> 21 tacaaaacct ccttgcttga gagtgtggca ctctcccccc tgtcgcgttc gctcgctcgc 60 tggctcgttt gggggggtgg cagctcaaag agctgccaga cgacggccct ctggccgtcg 120 cccccccaaa cgagccagcg agcgagcgaa cgcgacaggg gggagag 167 <210> 22 <211> 621 <212> PRT <213> Artificial Sequence <220> <223> AAV2 Rep <400> 22 Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp 1 5 10 15 Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu 20 25 30 Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile 35 40 45 Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu 50 55 60 Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val 65 70 75 80 Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu 85 90 95 Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile 100 105 110 Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu 115 120 125 Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly 130 135 140 Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys 145 150 155 160 Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu 165 170 175 Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His 180 185 190 Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn 195 200 205 Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr 210 215 220 Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys 225 230 235 240 Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala 245 250 255 Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys 260 265 270 Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln 275 280 285 Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu 290 295 300 Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala 305 310 315 320 Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala 325 330 335 Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro 340 345 350 Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp 355 360 365 Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala 370 375 380 Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg 385 390 395 400 Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val 405 410 415 Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser 420 425 430 Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe 435 440 445 Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln 450 455 460 Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val 465 470 475 480 Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala 485 490 495 Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val 500 505 510 Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp 515 520 525 Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu 530 535 540 Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys 545 550 555 560 Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu 565 570 575 Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr 580 585 590 Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp 595 600 605 Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln 610 615 620 <210> 23 <211> 550 <212> PRT <213> Homo sapiens <400> 23 Met Pro Pro Pro Arg Thr Gly Arg Gly Leu Leu Trp Leu Gly Leu Val 1 5 10 15 Leu Ser Ser Val Cys Val Ala Leu Gly Ser Glu Thr Gln Ala Asn Ser 20 25 30 Thr Thr Asp Ala Leu Asn Val Leu Leu Ile Ile Val Asp Asp Leu Arg 35 40 45 Pro Ser Leu Gly Cys Tyr Gly Asp Lys Leu Val Arg Ser Pro Asn Ile 50 55 60 Asp Gln Leu Ala Ser His Ser Leu Leu Phe Gln Asn Ala Phe Ala Gln 65 70 75 80 Gln Ala Val Cys Ala Pro Ser Arg Val Ser Phe Leu Thr Gly Arg Arg 85 90 95 Pro Asp Thr Thr Arg Leu Tyr Asp Phe Asn Ser Tyr Trp Arg Val His 100 105 110 Ala Gly Asn Phe Ser Thr Ile Pro Gln Tyr Phe Lys Glu Asn Gly Tyr 115 120 125 Val Thr Met Ser Val Gly Lys Val Phe His Pro Gly Ile Ser Ser Asn 130 135 140 His Thr Asp Asp Ser Pro Tyr Ser Trp Ser Phe Pro Pro Tyr His Pro 145 150 155 160 Ser Ser Glu Lys Tyr Glu Asn Thr Lys Thr Cys Arg Gly Pro Asp Gly 165 170 175 Glu Leu His Ala Asn Leu Leu Cys Pro Val Asp Val Leu Asp Val Pro 180 185 190 Glu Gly Thr Leu Pro Asp Lys Gln Ser Thr Glu Gln Ala Ile Gln Leu 195 200 205 Leu Glu Lys Met Lys Thr Ser Ala Ser Pro Phe Phe Leu Ala Val Gly 210 215 220 Tyr His Lys Pro His Ile Pro Phe Arg Tyr Pro Lys Glu Phe Gln Lys 225 230 235 240 Leu Tyr Pro Leu Glu Asn Ile Thr Leu Ala Pro Asp Pro Glu Val Pro 245 250 255 Asp Gly Leu Pro Pro Val Ala Tyr Asn Pro Trp Met Asp Ile Arg Gln 260 265 270 Arg Glu Asp Val Gln Ala Leu Asn Ile Ser Val Pro Tyr Gly Pro Ile 275 280 285 Pro Val Asp Phe Gln Arg Lys Ile Arg Gln Ser Tyr Phe Ala Ser Val 290 295 300 Ser Tyr Leu Asp Thr Gln Val Gly Arg Leu Leu Ser Ala Leu Asp Asp 305 310 315 320 Leu Gln Leu Ala Asn Ser Thr Ile Ile Ala Phe Thr Ser Asp His Gly 325 330 335 Trp Ala Leu Gly Glu His Gly Glu Trp Ala Lys Tyr Ser Asn Phe Asp 340 345 350 Val Ala Thr His Val Pro Leu Ile Phe Tyr Val Pro Gly Arg Thr Ala 355 360 365 Ser Leu Pro Glu Ala Gly Glu Lys Leu Phe Pro Tyr Leu Asp Pro Phe 370 375 380 Asp Ser Ala Ser Gln Leu Met Glu Pro Gly Arg Gln Ser Met Asp Leu 385 390 395 400 Val Glu Leu Val Ser Leu Phe Pro Thr Leu Ala Gly Leu Ala Gly Leu 405 410 415 Gln Val Pro Pro Arg Cys Pro Val Pro Ser Phe His Val Glu Leu Cys 420 425 430 Arg Glu Gly Lys Asn Leu Leu Lys His Phe Arg Phe Arg Asp Leu Glu 435 440 445 Glu Asp Pro Tyr Leu Pro Gly Asn Pro Arg Glu Leu Ile Ala Tyr Ser 450 455 460 Gln Tyr Pro Arg Pro Ser Asp Ile Pro Gln Trp Asn Ser Asp Lys Pro 465 470 475 480 Ser Leu Lys Asp Ile Lys Ile Met Gly Tyr Ser Ile Arg Thr Ile Asp 485 490 495 Tyr Arg Tyr Thr Val Trp Val Gly Phe Asn Pro Asp Glu Phe Leu Ala 500 505 510 Asn Phe Ser Asp Ile His Ala Gly Glu Leu Tyr Phe Val Asp Ser Asp 515 520 525 Pro Leu Gln Asp His Asn Met Tyr Asn Asp Ser Gln Gly Gly Asp Leu 530 535 540 Phe Gln Leu Leu Met Pro 545 550 <210> 24 <211> 1653 <212> DNA <213> Homo sapiens <400> 24 atgccgccac cccggaccgg ccgaggcctt ctctggctgg gtctggttct gagctccgtc 60 tgcgtcgccc tcggatccga aacgcaggcc aactcgacca cagatgctct gaacgttctt 120 ctcatcatcg tggatgacct gcgcccctcc ctgggctgtt atggggataa gctggtgagg 180 tccccaaata ttgaccaact ggcatcccac agcctcctct tccagaatgc ctttgcgcag 240 caagcagtgt gcgccccgag ccgcgtttct ttcctcactg gcaggagacc tgacaccacc 300 cgcctgtacg acttcaactc ctactggagg gtgcacgctg gaaacttctc caccatcccc 360 cagtacttca aggagaatgg ctatgtgacc atgtcggtgg gaaaagtctt tcaccctggg 420 atatcttcta accataccga tgattctccg tatagctggt cttttccacc ttatcatcct 480 tcctctgaga agtatgaaaa cactaagaca tgtcgagggc cagatggaga actccatgcc 540 aacctgcttt gccctgtgga tgtgctggat gttcccgagg gcaccttgcc tgacaaacag 600 agcactgagc aagccataca gttgttggaa aagatgaaaa cgtcagccag tcctttcttc 660 ctggccgttg ggtatcataa gccacacatc cccttcagat accccaagga atttcagaag 720 ttgtatccct tggagaacat caccctggcc cccgatcccg aggtccctga tggcctaccc 780 cctgtggcct acaacccctg gatggacatc aggcaacggg aagacgtcca agccttaaac 840 atcagtgtgc cgtatggtcc aattcctgtg gactttcagc ggaaaatccg ccagagctac 900 tttgcctctg tgtcatattt ggatacacag gtcggccgcc tcttgagtgc tttggacgat 960 cttcagctgg ccaacagcac catcattgca tttacctcgg atcatgggtg ggctctaggt 1020 gaacatggag aatgggccaa atacagcaat tttgatgttg ctacccatgt tcccctgata 1080 ttctatgttc ctggaaggac ggcttcactt ccggaggcag gcgagaagct tttcccttac 1140 ctcgaccctt ttgattccgc ctcacagttg atggagccag gcaggcaatc catggacctt 1200 gtggaacttg tgtctctttt tcccacgctg gctggacttg caggactgca ggttccacct 1260 cgctgccccg ttccttcatt tcacgttgag ctgtgcagag aaggcaagaa ccttctgaag 1320 cattttcgat tccgtgactt ggaagaggat ccgtacctcc ctggtaatcc ccgtgaactg 1380 attgcctata gccagtatcc ccggccttca gacatccctc agtggaattc tgacaagccg 1440 agtttaaaag atataaagat catgggctat tccatacgca ccatagacta taggtatact 1500 gtgtgggttg gcttcaatcc tgatgaattt ctagctaact tttctgacat ccatgcaggg 1560 gaactgtatt ttgtggattc tgacccattg caggatcaca atatgtataa tgattcccaa 1620 ggtggagatc ttttccagtt gttgatgcct tga 1653 <210> 25 <211> 1735 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 25 atgccgccac cccggaccgg ccgaggcctt ctctggctgg gtctggttct gagctccgtc 60 tgcgtcgccc tcggatccga aacgcaggcc aactcgacca cagatgctct gaacgttctt 120 ctcatcatcg tggatgacct gcgcccctcc ctgggctgtt atggggataa gctggtgagg 180 tccccaaata ttgaccaact ggcatcccac agcctcctct tccagaatgc ctttgcgcag 240 caagcagtgt gcgccccgag ccgcgtttct ttcctcactg gcaggagacc tgacaccacc 300 cgcctgtacg acttcaactc ctactggagg gtgcacgctg gaaacttctc caccatcccc 360 cagtacttca aggagaatgg ctatgtgacc atgtcggtgg gaaaagtctt tcaccctggg 420 atatcttcta accataccga tgattctccg tatagctggt cttttccacc ttatcatcct 480 tcctctgaga agtatgaaaa cactaagaca tgtcgagggc cagatggaga actccatgcc 540 aacctgcttt gccctgtgga tgtgctggat gttcccgagg gcaccttgcc tgacaaacag 600 agcactgagc aagccataca gttgttggaa aagatgaaaa cgtcagccag tcctttcttc 660 ctggccgttg ggtatcataa gccacacatc cccttcagat accccaaggt aagggtttaa 720 gggatggttg gttggtgggg tattaatgtt taattacctg gagcacctgc ctgaaatcac 780 tttttttcag gaatttcaga agttgtatcc cttggagaac atcaccctgg cccccgatcc 840 cgaggtccct gatggcctac cccctgtggc ctacaacccc tggatggaca tcaggcaacg 900 ggaagacgtc caagccttaa acatcagtgt gccgtatggt ccaattcctg tggactttca 960 gcggaaaatc cgccagagct actttgcctc tgtgtcatat ttggatacac aggtcggccg 1020 cctcttgagt gctttggacg atcttcagct ggccaacagc accatcattg catttacctc 1080 ggatcatggg tgggctctag gtgaacatgg agaatgggcc aaatacagca attttgatgt 1140 tgctacccat gttcccctga tattctatgt tcctggaagg acggcttcac ttccggaggc 1200 aggcgagaag cttttccctt acctcgaccc ttttgattcc gcctcacagt tgatggagcc 1260 aggcaggcaa tccatggacc ttgtggaact tgtgtctctt tttcccacgc tggctggact 1320 tgcaggactg caggttccac ctcgctgccc cgttccttca tttcacgttg agctgtgcag 1380 agaaggcaag aaccttctga agcattttcg attccgtgac ttggaagagg atccgtacct 1440 ccctggtaat ccccgtgaac tgattgccta tagccagtat ccccggcctt cagacatccc 1500 tcagtggaat tctgacaagc cgagtttaaa agatataaag atcatgggct attccatacg 1560 caccatagac tataggtata ctgtgtgggt tggcttcaat cctgatgaat ttctagctaa 1620 cttttctgac atccatgcag gggaactgta ttttgtggat tctgacccat tgcaggatca 1680 caatatgtat aatgattccc aaggtggaga tcttttccag ttgttgatgc cttga 1735 <210> 26 <211> 1653 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 26 atgcccccac ccaggaccgg aagaggcctg ctgtggctgg gcctggtgct ctcttccgtg 60 tgcgtggccc tgggaagcga aacccaggcc aacagcacaa ccgacgccct gaatgtgctg 120 ctgatcattg tggacgatct gagaccctcc ctgggctgtt acggcgacaa actggtgcgg 180 tccccaaaca tcgaccagct ggcctcccac tccctgctgt tccagaacgc cttcgcccag 240 caggccgtgt gtgcccccag cagggtgagc ttcctgaccg gcagaagacc tgacaccacc 300 aggctgtacg actttaacag ctactggcgg gtgcacgccg gcaatttcag caccattcct 360 cagtacttca aggagaatgg ctacgtgaca atgtccgtgg gcaaggtgtt tcatcccggc 420 attagctcca accacaccga cgatagccca tactcctggt ccttcccccc ctaccatccc 480 tccagcgaga agtacgagaa caccaaaacc tgcagaggcc ctgacggaga gctgcacgcc 540 aacctgctgt gccctgtgga tgtcctggat gtgcccgaag gcaccctgcc agacaagcag 600 tccacagagc aggccatcca gctgctggag aagatgaaga caagcgccag ccccttcttt 660 ctggccgtgg gataccacaa gcctcacatt ccattccggt acccaaaaga gttccagaag 720 ctgtaccctc tggaaaacat caccctggcc cctgaccccg aggtgccaga cgggctgcct 780 cctgtggcct acaatccctg gatggacatc agacagcggg aggatgtgca ggccctgaat 840 atttccgtgc cctatgggcc catccctgtg gactttcagc ggaaaatcag acagtcttac 900 tttgccagcg tgtcctacct ggacacccag gtgggccgcc tgctctcagc cctggacgac 960 ctgcagctgg ccaattccac catcatcgcc ttcaccagcg atcacggctg ggccctgggc 1020 gagcacgggg agtgggccaa atacagcaac ttcgatgtgg ccacccacgt gcctctgatt 1080 ttttatgtgc ccggccggac agccagcctg cccgaggccg gggagaagct ctttccttac 1140 ctggaccctt tcgactctgc cagccagctg atggaacctg gcagacagag catggacctg 1200 gtggagctgg tgagcctctt ccccactctg gccggcctgg ctggcctgca ggtgccacca 1260 agatgcccag tgccttcttt ccacgtggag ctgtgtagag agggaaagaa cctgctgaag 1320 cacttcagat ttagagatct ggaggaggat ccctacctgc caggcaaccc aagggagctg 1380 atcgcctaca gccagtatcc cagaccctct gatatccccc agtggaacag cgataagccc 1440 tccctgaaag acatcaagat tatgggctac tccatcagga ccattgacta ccggtacaca 1500 gtgtgggtgg gcttcaaccc cgatgagttt ctggccaact tcagcgacat ccacgccggc 1560 gagctgtatt ttgtggactc cgaccccctg caggaccaca acatgtacaa cgactcccag 1620 ggcggcgacc tgttccagct gctgatgccc tga 1653 <210> 27 <211> 1735 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 27 atgcccccac ccaggaccgg aagaggcctg ctgtggctgg gcctggtgct ctcttccgtg 60 tgcgtggccc tgggaagcga aacccaggcc aacagcacaa ccgacgccct gaatgtgctg 120 ctgatcattg tggacgatct gagaccctcc ctgggctgtt acggcgacaa actggtgcgg 180 tccccaaaca tcgaccagct ggcctcccac tccctgctgt tccagaacgc cttcgcccag 240 caggccgtgt gtgcccccag cagggtgagc ttcctgaccg gcagaagacc tgacaccacc 300 aggctgtacg actttaacag ctactggcgg gtgcacgccg gcaatttcag caccattcct 360 cagtacttca aggagaatgg ctacgtgaca atgtccgtgg gcaaggtgtt tcatcccggc 420 attagctcca accacaccga cgatagccca tactcctggt ccttcccccc ctaccatccc 480 tccagcgaga agtacgagaa caccaaaacc tgcagaggcc ctgacggaga gctgcacgcc 540 aacctgctgt gccctgtgga tgtcctggat gtgcccgaag gtaagggttt aagggatggt 600 tggttggtgg ggtattaatg tttaattacc tggagcacct gcctgaaatc actttttttc 660 aggcaccctg ccagacaagc agtccacaga gcaggccatc cagctgctgg agaagatgaa 720 gacaagcgcc agccccttct ttctggccgt gggataccac aagcctcaca ttccattccg 780 gtacccaaaa gagttccaga agctgtaccc tctggaaaac atcaccctgg cccctgaccc 840 cgaggtgcca gacgggctgc ctcctgtggc ctacaatccc tggatggaca tcagacagcg 900 ggaggatgtg caggccctga atatttccgt gccctatggg cccatccctg tggactttca 960 gcggaaaatc agacagtctt actttgccag cgtgtcctac ctggacaccc aggtgggccg 1020 cctgctctca gccctggacg acctgcagct ggccaattcc accatcatcg ccttcaccag 1080 cgatcacggc tgggccctgg gcgagcacgg ggagtgggcc aaatacagca acttcgatgt 1140 ggccacccac gtgcctctga ttttttatgt gcccggccgg acagccagcc tgcccgaggc 1200 cggggagaag ctctttcctt acctggaccc tttcgactct gccagccagc tgatggaacc 1260 tggcagacag agcatggacc tggtggagct ggtgagcctc ttccccactc tggccggcct 1320 ggctggcctg caggtgccac caagatgccc agtgccttct ttccacgtgg agctgtgtag 1380 agagggaaag aacctgctga agcacttcag atttagagat ctggaggagg atccctacct 1440 gccaggcaac ccaagggagc tgatcgccta cagccagtat cccagaccct ctgatatccc 1500 ccagtggaac agcgataagc cctccctgaa agacatcaag attatgggct actccatcag 1560 gaccattgac taccggtaca cagtgtgggt gggcttcaac cccgatgagt ttctggccaa 1620 cttcagcgac atccacgccg gcgagctgta ttttgtggac tccgaccccc tgcaggacca 1680 caacatgtac aacgactccc agggcggcga cctgttccag ctgctgatgc cctga 1735 <210> 28 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 28 gtagataagt agcatggcgg gttaatcatt aactacaagg aacccctagt gatggagttg 60 gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga 120 cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc 180 aa 182 <210> 29 <211> 173 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 29 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 60 aaaatcaacg ggactttcca aaatgtcgta ataaccccgc cccgttgacg caaatgggcg 120 gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac cgt 173 <210> 30 <211> 201 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 30 gaattcgggc ggagttaggg cggagccaat cagcgtgcgc cgttccgaaa gttgcctttt 60 atggctgggc ggagaatggg cggtgaacgc cgatgattat ataaggacgc gccgggtgtg 120 gcacagctag ttccgtcgca gccgggattt gggtcgcggt tcttgtttgt ggatccctgt 180 gatcgtgatc atcacttgtg a 201 <210> 31 <211> 93 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 31 ctctaaggta aatataaaat ttttaagtgt ataatgtgtt aaactactga ttctaattgt 60 ttctctcttt tagattccaa cctttggaac tga 93 <210> 32 <211> 924 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 32 gtgagcgggc gggacggccc ttctcctccg ggctgtaatt agcgcttggt ttaatgacgg 60 cttgtttctt ttctgtggct gcgtgaaagc cttgaggggc tccgggaggg ccctttgtgc 120 ggggggagcg gctcgggggg tgcgtgcgtg tgtgtgtgcg tggggagcgc cgcgtgcggc 180 tccgcgctgc ccggcggctg tgagcgctgc gggcgcggcg cggggctttg tgcgctccgc 240 agtgtgcgcg aggggagcgc ggccgggggc ggtgccccgc ggtgcggggg gggctgcgag 300 gggaacaaag gctgcgtgcg gggtgtgtgc gtgggggggt gagcaggggg tgtgggcgcg 360 tcggtcgggc tgcaaccccc cctgcacccc cctccccgag ttgctgagca cggcccggct 420 tcgggtgcgg ggctccgtac ggggcgtggc gcggggctcg ccgtgccggg cggggggtgg 480 cggcaggtgg gggtgccggg cggggcgggg ccgcctcggg ccggggaggg ctcgggggag 540 gggcgcggcg gcccccggag cgccggcggc tgtcgaggcg cggcgagccg cagccattgc 600 cttttatggt aatcgtgcga gagggcgcag ggacttcctt tgtcccaaat ctgtgcggag 660 ccgaaatctg ggaggcgccg ccgcaccccc tctagcgggc gcggggcgaa gcggtgcggc 720 gccggcagga aggaaatggg cggggagggc cttcgtgcgt cgccgcgccg ccgtcccctt 780 ctccctctcc agcctcgggg ctgtccgcgg ggggacggct gccttcgggg gggacggggc 840 agggcggggt tcggcttctg gcgtgtgacc ggcggctcta gagcctctgc taaccatgtt 900 catgccttct tctttttcct acag 924 <210> 33 <211> 82 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 33 gtaagggttt aagggatggt tggttggtgg ggtattaatg tttaattacc tggagcacct 60 gcctgaaatc actttttttc ag 82 <210> 34 <211> 122 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 34 aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca 60 aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct 120 ta 122 <210> 35 <211> 133 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 35 tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat aagctgcaat 60 aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg 120 gaggtttttt aaa 133 <210> 36 <211> 1676 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 36 ggcattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60 catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120 acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180 ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240 aagtgtatca tatgccaagt ccgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300 ggcattatgc ccagtacatg accttacggg actttcctac ttggcagtac atctacgtat 360 tagtcatcgc tattaccatg gtcgaggtga gccccacgtt ctgcttcact ctccccatct 420 cccccccctc cccaccccca attttgtatt tatttatttt ttaattattt tgtgcagcga 480 tgggggcggg gggggggggg gggcgcgcgc caggcggggc ggggcggggc gaggggcggg 540 gcggggcgag gcggagaggt gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc 600 cttttatggc gaggcggcgg cggcggcggc cctataaaaa gcgaagcgcg cggcgggcgg 660 gagtcgctgc gcgctgcctt cgccccgtgc cccgctccgc cgccgcctcg cgccgcccgc 720 cccggctctg actgaccgcg ttactcccac aggtgagcgg gcgggacggc ccttctcctc 780 cgggctgtaa ttagcgcttg gtttaatgac ggcttgtttc ttttctgtgg ctgcgtgaaa 840 gccttgaggg gctccgggag ggccctttgt gcggggggag cggctcgggg ggtgcgtgcg 900 tgtgtgtgtg cgtggggagc gccgcgtgcg gctccgcgct gcccggcggc tgtgagcgct 960 gcgggcgcgg cgcggggctt tgtgcgctcc gcagtgtgcg cgaggggagc gcggccgggg 1020 gcggtgcccc gcggtgcggg gggggctgcg aggggaacaa aggctgcgtg cggggtgtgt 1080 gcgtgggggg gtgagcaggg ggtgtgggcg cgtcggtcgg gctgcaaccc cccctgcacc 1140 cccctccccg agttgctgag cacggcccgg cttcgggtgc ggggctccgt acggggcgtg 1200 gcgcggggct cgccgtgccg ggcggggggt ggcggcaggt gggggtgccg ggcggggcgg 1260 ggccgcctcg ggccggggag ggctcggggg aggggcgcgg cggcccccgg agcgccggcg 1320 gctgtcgagg cgcggcgagc cgcagccatt gccttttatg gtaatcgtgc gagagggcgc 1380 agggacttcc tttgtcccaa atctgtgcgg agccgaaatc tgggaggcgc cgccgcaccc 1440 cctctagcgg gcgcggggcg aagcggtgcg gcgccggcag gaaggaaatg ggcggggagg 1500 gccttcgtgc gtcgccgcgc cgccgtcccc ttctccctct ccagcctcgg ggctgtccgc 1560 ggggggacgg ctgccttcgg gggggacggg gcagggcggg gttcggcttc tggcgtgtga 1620 ccggcggctc tagagcctct gctaaccatg ttcatgcctt cttctttttc ctacag 1676 <210> 37 <211> 2112 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 37 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 60 aaaatcaacg ggactttcca aaatgtcgta ataaccccgc cccgttgacg caaatgggcg 120 gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac cgtgccacca 180 tgccgccacc ccggaccggc cgaggccttc tctggctggg tctggttctg agctccgtct 240 gcgtcgccct cggatccgaa acgcaggcca actcgaccac agatgctctg aacgttcttc 300 tcatcatcgt ggatgacctg cgcccctccc tgggctgtta tggggataag ctggtgaggt 360 ccccaaatat tgaccaactg gcatcccaca gcctcctctt ccagaatgcc tttgcgcagc 420 aagcagtgtg cgccccgagc cgcgtttctt tcctcactgg caggagacct gacaccaccc 480 gcctgtacga cttcaactcc tactggaggg tgcacgctgg aaacttctcc accatccccc 540 agtacttcaa ggagaatggc tatgtgacca tgtcggtggg aaaagtcttt caccctggga 600 tatcttctaa ccataccgat gattctccgt atagctggtc ttttccacct tatcatcctt 660 cctctgagaa gtatgaaaac actaagacat gtcgagggcc agatggagaa ctccatgcca 720 acctgctttg ccctgtggat gtgctggatg ttcccgaggg caccttgcct gacaaacaga 780 gcactgagca agccatacag ttgttggaaa agatgaaaac gtcagccagt cctttcttcc 840 tggccgttgg gtatcataag ccacacatcc ccttcagata ccccaaggta agggtttaag 900 ggatggttgg ttggtggggt attaatgttt aattacctgg agcacctgcc tgaaatcact 960 ttttttcagg aatttcagaa gttgtatccc ttggagaaca tcaccctggc ccccgatccc 1020 gaggtccctg atggcctacc ccctgtggcc tacaacccct ggatggacat caggcaacgg 1080 gaagacgtcc aagccttaaa catcagtgtg ccgtatggtc caattcctgt ggactttcag 1140 cggaaaatcc gccagagcta ctttgcctct gtgtcatatt tggatacaca ggtcggccgc 1200 ctcttgagtg ctttggacga tcttcagctg gccaacagca ccatcattgc atttacctcg 1260 gatcatgggt gggctctagg tgaacatgga gaatgggcca aatacagcaa ttttgatgtt 1320 gctacccatg ttcccctgat attctatgtt cctggaagga cggcttcact tccggaggca 1380 ggcgagaagc ttttccctta cctcgaccct tttgattccg cctcacagtt gatggagcca 1440 ggcaggcaat ccatggacct tgtggaactt gtgtctcttt ttcccacgct ggctggactt 1500 gcaggactgc aggttccacc tcgctgcccc gttccttcat ttcacgttga gctgtgcaga 1560 gaaggcaaga accttctgaa gcattttcga ttccgtgact tggaagagga tccgtacctc 1620 cctggtaatc cccgtgaact gattgcctat agccagtatc cccggccttc agacatccct 1680 cagtggaatt ctgacaagcc gagtttaaaa gatataaaga tcatgggcta ttccatacgc 1740 accatagact ataggtatac tgtgtgggtt ggcttcaatc ctgatgaatt tctagctaac 1800 ttttctgaca tccatgcagg ggaactgtat tttgtggatt ctgacccatt gcaggatcac 1860 aatatgtata atgattccca aggtggagat cttttccagt tgttgatgcc ttgagatcca 1920 gacatgataa gatacattga tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa 1980 tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat aagctgcaat 2040 aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg 2100 gaggtttttt aa 2112 <210> 38 <211> 2482 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 38 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggggag gggtggagtc 120 gtgacgtgaa ttacgtcata gggttaggga ggtcctgcat atgcggccgc aactcacggg 180 gatttccaag tctccacccc attgacgtca atgggagttt gttttggcac caaaatcaac 240 gggactttcc aaaatgtcgt aataaccccg ccccgttgac gcaaatgggc ggtaggcgtg 300 tacggtggga ggtctatata agcagagctc gtttagtgaa ccgtgccacc atgccgccac 360 cccggaccgg ccgaggcctt ctctggctgg gtctggttct gagctccgtc tgcgtcgccc 420 tcggatccga aacgcaggcc aactcgacca cagatgctct gaacgttctt ctcatcatcg 480 tggatgacct gcgcccctcc ctgggctgtt atggggataa gctggtgagg tccccaaata 540 ttgaccaact ggcatcccac agcctcctct tccagaatgc ctttgcgcag caagcagtgt 600 gcgccccgag ccgcgtttct ttcctcactg gcaggagacc tgacaccacc cgcctgtacg 660 acttcaactc ctactggagg gtgcacgctg gaaacttctc caccatcccc cagtacttca 720 aggagaatgg ctatgtgacc atgtcggtgg gaaaagtctt tcaccctggg atatcttcta 780 accataccga tgattctccg tatagctggt cttttccacc ttatcatcct tcctctgaga 840 agtatgaaaa cactaagaca tgtcgagggc cagatggaga actccatgcc aacctgcttt 900 gccctgtgga tgtgctggat gttcccgagg gcaccttgcc tgacaaacag agcactgagc 960 aagccataca gttgttggaa aagatgaaaa cgtcagccag tcctttcttc ctggccgttg 1020 ggtatcataa gccacacatc cccttcagat accccaaggt aagggtttaa gggatggttg 1080 gttggtgggg tattaatgtt taattacctg gagcacctgc ctgaaatcac tttttttcag 1140 gaatttcaga agttgtatcc cttggagaac atcaccctgg cccccgatcc cgaggtccct 1200 gatggcctac cccctgtggc ctacaacccc tggatggaca tcaggcaacg ggaagacgtc 1260 caagccttaa acatcagtgt gccgtatggt ccaattcctg tggactttca gcggaaaatc 1320 cgccagagct actttgcctc tgtgtcatat ttggatacac aggtcggccg cctcttgagt 1380 gctttggacg atcttcagct ggccaacagc accatcattg catttacctc ggatcatggg 1440 tgggctctag gtgaacatgg agaatgggcc aaatacagca attttgatgt tgctacccat 1500 gttcccctga tattctatgt tcctggaagg acggcttcac ttccggaggc aggcgagaag 1560 cttttccctt acctcgaccc ttttgattcc gcctcacagt tgatggagcc aggcaggcaa 1620 tccatggacc ttgtggaact tgtgtctctt tttcccacgc tggctggact tgcaggactg 1680 caggttccac ctcgctgccc cgttccttca tttcacgttg agctgtgcag agaaggcaag 1740 aaccttctga agcattttcg attccgtgac ttggaagagg atccgtacct ccctggtaat 1800 ccccgtgaac tgattgccta tagccagtat ccccggcctt cagacatccc tcagtggaat 1860 tctgacaagc cgagtttaaa agatataaag atcatgggct attccatacg caccatagac 1920 tataggtata ctgtgtgggt tggcttcaat cctgatgaat ttctagctaa cttttctgac 1980 atccatgcag gggaactgta ttttgtggat tctgacccat tgcaggatca caatatgtat 2040 aatgattccc aaggtggaga tcttttccag ttgttgatgc cttgagatcc agacatgata 2100 agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt 2160 tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt 2220 aacaacaaca attgcattca ttttatgttt caggttcagg gggaggtgtg ggaggttttt 2280 taacctgcag gtctagatac gtagataagt agcatggcgg gttaatcatt aactacaagg 2340 aacccctagt gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg 2400 ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag 2460 cgcgcagaga gggagtggcc aa 2482 <210> 39 <211> 1168 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 39 cgtgaggctc cggtgcccgt cagtgggcag agcgcacatc gcccacagtc cccgagaagt 60 tggggggagg ggtcggcaat tgaaccggtg cctagagaag gtggcgcggg gtaaactggg 120 aaagtgatgt cgtgtactgg ctccgccttt ttcccgaggg tgggggagaa ccgtatataa 180 gtgcagtagt cgccgtgaac gttctttttc gcaacgggtt tgccgccaga acacaggtaa 240 gtgccgtgtg tggttcccgc gggcctggcc tctttacggg ttatggccct tgcgtgcctt 300 gaattacttc cacctggctc cagtacgtga ttcttgatcc cgagctggag ccaggggcgg 360 gccttgcgct ttaggagccc cttcgcctcg tgcttgagtt gaggcctggc ctgggcgctg 420 gggccgccgc gtgcgaatct ggtggcacct tcgcgcctgt ctcgctgctt tcgataagtc 480 tctagccatt taaaattttt gatgacctgc tgcgacgctt tttttctggc aagatagtct 540 tgtaaatgcg ggccaggatc tgcacactgg tatttcggtt tttggggccg cgggcggcga 600 cggggcccgt gcgtcccagc gcacatgttc ggcgaggcgg ggcctgcgag cgcggccacc 660 gagaatcgga cgggggtagt ctcaagctgg ccggcctgct ctggtgcctg gcctcgcgcc 720 gccgtgtatc gccccgccct gggcggcaag gctggcccgg tcggcaccag ttgcgtgagc 780 ggaaagatgg ccgcttcccg gccctgctcc agggggctca aaatggagga cgcggcgctc 840 gggagagcgg gcgggtgagt cacccacaca aaggaaaggg gcctttccgt cctcagccgt 900 cgcttcatgt gactccacgg agtaccgggc gccgtccagg cacctcgatt agttctggag 960 cttttggagt acgtcgtctt taggttgggg ggaggggttt tatgcgatgg agtttcccca 1020 cactgagtgg gtggagactg aagttaggcc agcttggcac ttgatgtaat tctccttgga 1080 atttgccctt tttgagtttg gatcttggtt cattctcaag cctcagacag tggttcaaag 1140 tttttttctt ccatttcagg tgtcgtga 1168 <210> 40 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 40 ccaaaatcaa cgggactttc caaaatgtcg taataacccc gccccgttga cgcaaatggg 60 cggtaggcgt gtacggtggg aggtctatat aagcagagct 100 <210> 41 <211> 95 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 41 cctctgctaa ccatgttcat gccttcttct ttttcctaca gctcctgggc aacgtgctgg 60 ttattgtgct gtctcatcat tttggcaaag aattc 95 <210> 42 <211> 1873 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 42 gatcttcaat attggccatt agccatatta ttcattggtt atatagcata aatcaatatt 60 ggctattggc cattgcatac gttgtatcta tatcataata tgtacattta tattggctca 120 tgtccaatat gaccgccatg ttggcattga ttattgacta gttattaata gtaatcaatt 180 acggggtcat tagttcatag cccatatatg gagttccgcg ttacataact tacggtaaat 240 ggcccgcctg gctgaccgcc caacgacccc cgcccattga cgtcaataat gacgtatgtt 300 cccatagtaa cgccaatagg gactttccat tgacgtcaat gggtggagta tttacggtaa 360 actgcccact tggcagtaca tcaagtgtat catatgccaa gtccgccccc tattgacgtc 420 aatgacggta aatggcccgc ctggcattat gcccagtaca tgaccttacg ggactttcct 480 acttggcagt acatctacgt attagtcatc gctattacca tggtcgaggt gagccccacg 540 ttctgcttca ctctccccat ctcccccccc tccccacccc caattttgta tttatttatt 600 ttttaattat tttgtgcagc gatgggggcg gggggggggg gggggcgcgc gccaggcggg 660 gcggggcggg gcgaggggcg gggcggggcg aggcggagag gtgcggcggc agccaatcag 720 agcggcgcgc tccgaaagtt tccttttatg gcgaggcggc ggcggcggcg gccctataaa 780 aagcgaagcg cgcggcgggc gggagtcgct gcgacgctgc cttcgccccg tgccccgctc 840 cgccgccgcc tcgcgccgcc cgccccggct ctgactgacc gcgttactcc cacaggtgag 900 cgggcgggac ggcccttctc ctccgggctg taattagcgc ttggtttaat gacggcttgt 960 ttcttttctg tggctgcgtg aaagccttga ggggctccgg gagggccctt tgtgcggggg 1020 ggagcggctc ggggggtgcg tgcgtgtgtg tgtgcgtggg gagcgccgcg tgcggcccgc 1080 gctgcccggc ggctgtgagc gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt 1140 gcgcgagggg agcgcggccg ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa 1200 caaaggctgc gtgcggggtg tgtgcgtggg ggggtgagca gggggtgtgg gcgcggcggt 1260 cgggctgtaa cccccccctg cacccccctc cccgagttgc tgagcacggc ccggcttcgg 1320 gtgcggggct ccgtacgggg cgtggcgcgg ggctcgccgt gccgggcggg gggtggcggc 1380 aggtgggggt gccgggcggg gcggggccgc ctcgggccgg ggagggctcg ggggaggggc 1440 gcggcggccc ccggagcgcc ggcggctgtc gaggcgcggc gagccgcagc cattgccttt 1500 tatggtaatc gtgcgagagg gcgcagggac ttcctttgtc ccaaatctgt gcggagccga 1560 aatctgggag gcgccgccgc accccctcta gcgggcgcgg ggcgaagcgg tgcggcgccg 1620 gcaggaagga aatgggcggg gagggccttc gtgcgtcgcc gcgccgccgt ccccttctcc 1680 ctctccagcc tcggggctgt ccgcgggggg acggctgcct tcggggggga cggggcaggg 1740 cggggttcgg cttctggcgt gtgaccggcg gctctagagc ctctgctaac catgttcatg 1800 ccttcttctt tttcctacag ctcctgggca acgtgctggt tattgtgctg tctcatcatt 1860 ttggcaaaga att 1873 <210> 43 <211> 2113 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 43 aactcacggg gatttccaag tctccacccc attgacgtca atgggagttt gttttggcac 60 caaaatcaac gggactttcc aaaatgtcgt aataaccccg ccccgttgac gcaaatgggc 120 ggtaggcgtg tacggtggga ggtctatata agcagagctc gtttagtgaa ccgtgccacc 180 atgcccccac ccaggaccgg aagaggcctg ctgtggctgg gcctggtgct ctcttccgtg 240 tgcgtggccc tgggaagcga aacccaggcc aacagcacaa ccgacgccct gaatgtgctg 300 ctgatcattg tggacgatct gagaccctcc ctgggctgtt acggcgacaa actggtgcgg 360 tccccaaaca tcgaccagct ggcctcccac tccctgctgt tccagaacgc cttcgcccag 420 caggccgtgt gtgcccccag cagggtgagc ttcctgaccg gcagaagacc tgacaccacc 480 aggctgtacg actttaacag ctactggcgg gtgcacgccg gcaatttcag caccattcct 540 cagtacttca aggagaatgg ctacgtgaca atgtccgtgg gcaaggtgtt tcatcccggc 600 attagctcca accacaccga cgatagccca tactcctggt ccttcccccc ctaccatccc 660 tccagcgaga agtacgagaa caccaaaacc tgcagaggcc ctgacggaga gctgcacgcc 720 aacctgctgt gccctgtgga tgtcctggat gtgcccgaag gtaagggttt aagggatggt 780 tggttggtgg ggtattaatg tttaattacc tggagcacct gcctgaaatc actttttttc 840 aggcaccctg ccagacaagc agtccacaga gcaggccatc cagctgctgg agaagatgaa 900 gacaagcgcc agccccttct ttctggccgt gggataccac aagcctcaca ttccattccg 960 gtacccaaaa gagttccaga agctgtaccc tctggaaaac atcaccctgg cccctgaccc 1020 cgaggtgcca gacgggctgc ctcctgtggc ctacaatccc tggatggaca tcagacagcg 1080 ggaggatgtg caggccctga atatttccgt gccctatggg cccatccctg tggactttca 1140 gcggaaaatc agacagtctt actttgccag cgtgtcctac ctggacaccc aggtgggccg 1200 cctgctctca gccctggacg acctgcagct ggccaattcc accatcatcg ccttcaccag 1260 cgatcacggc tgggccctgg gcgagcacgg ggagtgggcc aaatacagca acttcgatgt 1320 ggccacccac gtgcctctga ttttttatgt gcccggccgg acagccagcc tgcccgaggc 1380 cggggagaag ctctttcctt acctggaccc tttcgactct gccagccagc tgatggaacc 1440 tggcagacag agcatggacc tggtggagct ggtgagcctc ttccccactc tggccggcct 1500 ggctggcctg caggtgccac caagatgccc agtgccttct ttccacgtgg agctgtgtag 1560 agagggaaag aacctgctga agcacttcag atttagagat ctggaggagg atccctacct 1620 gccaggcaac ccaagggagc tgatcgccta cagccagtat cccagaccct ctgatatccc 1680 ccagtggaac agcgataagc cctccctgaa agacatcaag attatgggct actccatcag 1740 gaccattgac taccggtaca cagtgtgggt gggcttcaac cccgatgagt ttctggccaa 1800 cttcagcgac atccacgccg gcgagctgta ttttgtggac tccgaccccc tgcaggacca 1860 caacatgtac aacgactccc agggcggcga cctgttccag ctgctgatgc cctgagatcc 1920 agacatgata agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa 1980 atgctttatt tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa 2040 taaacaagtt aacaacaaca attgcattca ttttatgttt caggttcagg gggaggtgtg 2100 ggaggttttt taa 2113 <210> 44 <211> 913 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 44 ggcatcctaa aaaatattca gtggaaacgt aaaaacatta aagactgatt aaacatcgca 60 gcatgacaca gatttagcaa ctgagcataa ataatttgac tcggatactg ctccaaaatc 120 cgaagaggac caatttcttc caggaggaca actacctcgt cctctgcaga cccctctcct 180 cggcagctga aggagtgtgg ccaatctgcc tccacctccc cgcggacccc ctactctcag 240 gacctcctgc agcaccccaa actggaagtg gccgctgcag acccaaggac gaggggcacg 300 cgggagccgg cagccctagt ggagcggttg gagatgttga ggtgggaggg tcacccaggt 360 ggggtgaggc tggggtaggt agcggagtga acggcttccg aagctctggg ccgcccccag 420 gttggactaa gcaggcgctc tgtcttcgcc cccgcccagg gtgggcgtct cctgaggact 480 ccccgccaca cctgacccga gaccgcgcgc ccagcctaga acgcttcccc gacccagcgt 540 agggccgccg cgactggcgg gcgagggtcg gcgggaggcc tggcgaaccc gggggcggga 600 ccaggcgggc aaggcccggc tgccgcagcg ccgctctgcg cgaggcggct ccgccgcggc 660 ggagggatac ggcgcaccat atatatatcg cggggcgcag actcgcgctc cggcagtggt 720 gctgggagtg tcgtggacgc cgtgccgtta ctcgtagtca ggcggcggcg caggcggcgg 780 cggcggcata gcgcacagcg cgccttagca gcagcagcag cagcagcggc atcggaggta 840 cccccgccgt cgcagccccc gcgctggtgc agccaccctc gctccctctg ctcttcctcc 900 cttcgctcgc acc 913 <210> 45 <211> 198 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 45 gatccagaca tgataagata cattgatgag tttggacaaa ccacaactag aatgcagtga 60 aaaaaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac cattataagc 120 tgcaataaac aagttaacaa caacaattgc attcatttta tgtttcaggt tcagggggag 180 gtgtgggagg ttttttaa 198 <210> 46 <211> 380 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 46 ggcattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60 catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120 acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180 ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240 aagtgtatca tatgccaagt ccgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300 ggcattatgc ccagtacatg accttacggg actttcctac ttggcagtac atctacgtat 360 tagtcatcgc tattaccatg 380 <210> 47 <211> 1246 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 47 tcgaggtgag ccccacgttc tgcttcactc tccccatctc ccccccctcc ccacccccaa 60 ttttgtattt atttattttt taattatttt gtgcagcgat gggggcgggg gggggggggg 120 ggcgcgcgcc aggcggggcg gggcggggcg aggggcgggg cggggcgagg cggagaggtg 180 cggcggcagc caatcagagc ggcgcgctcc gaaagtttcc ttttatggcg aggcggcggc 240 ggcggcggcc ctataaaaag cgaagcgcgc ggcgggcggg agtcgctgcg cgctgccttc 300 gccccgtgcc ccgctccgcc gccgcctcgc gccgcccgcc ccggctctga ctgaccgcgt 360 tactcccaca ggtgagcggg cgggacggcc cttctcctcc gggctgtaat tagcgcttgg 420 tttaatgacg gcttgtttct tttctgtggc tgcgtgaaag ccttgagggg ctccgggagg 480 gccctttgtg cggggggagc ggctcggggg gtgcgtgcgt gtgtgtgtgc gtggggagcg 540 ccgcgtgcgg ctccgcgctg cccggcggct gtgagcgctg cgggcgcggc gcggggcttt 600 gtgcgctccg cagtgtgcgc gaggggagcg cggccggggg cggtgccccg cggtgcgggg 660 ggggctgcga ggggaacaaa ggctgcgtgc ggggtgtgtg cgtggggggg tgagcagggg 720 gtgtgggcgc gtcggtcggg ctgcaacccc ccctgcaccc ccctccccga gttgctgagc 780 acggcccggc ttcgggtgcg gggctccgta cggggcgtgg cgcggggctc gccgtgccgg 840 gcggggggtg gcggcaggtg ggggtgccgg gcggggcggg gccgcctcgg gccggggagg 900 gctcggggga ggggcgcggc ggcccccgga gcgccggcgg ctgtcgaggc gcggcgagcc 960 gcagccattg ccttttatgg taatcgtgcg agagggcgca gggacttcct ttgtcccaaa 1020 tctgtgcgga gccgaaatct gggaggcgcc gccgcacccc ctctagcggg cgcggggcga 1080 agcggtgcgg cgccggcagg aaggaaatgg gcggggaggg ccttcgtgcg tcgccgcgcc 1140 gccgtcccct tctccctctc cagcctcggg gctgtccgcg gggggacggc tgccttcggg 1200 ggggacgggg cagggcgggg ttcggcttct ggcgtgtgac cggcgg 1246 <210> 48 <211> 1061 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 48 tagggaggtc ctgcacgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 60 cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac 120 tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca 180 agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg 240 gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt 300 agtcatcgct attaccatgg tcgaggtgag ccccacgttc tgcttcactc tccccatctc 360 ccccccctcc ccacccccaa ttttgtattt atttattttt taattatttt gtgcagcgat 420 gggggcgggg gggggggggg gcgcgcgcca ggcggggcgg ggcggggcga ggggcggggc 480 ggggcgaggc ggagaggtgc ggcggcagcc aatcagagcg gcgcgctccg aaagtttcct 540 tttatggcga ggcggcggcg gcggcggccc tataaaaagc gaagcgcgcg gcgggcggga 600 gtcgctgcgc gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc 660 cggctctgac tgaccgcgtt actaaaacag gtaagtccgg cctccgcgcc gggttttggc 720 gcctcccgcg ggcgcccccc tcctcacggc gagcgctgcc acgtcagacg aagggcgcag 780 cgagcgtcct gatccttccg cccggacgct caggacagcg gcccgctgct cataagactc 840 ggccttagaa ccccagtatc agcagaagga cattttagga cgggacttgg gtgactctag 900 ggcactggtt ttctttccag agagcggaac aggcgaggaa aagtagtccc ttctcggcga 960 ttctgcggag ggatctccgt ggggcggtga acgccgatga tgcctctact aaccatgttc 1020 atgttttctt tttttttcta caggtcctgg gtgacgaaca g 1061 <210> 49 <211> 106 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 49 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtgg 106 <210> 50 <211> 2482 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 50 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggggag gggtggagtc 120 gtgacgtgaa ttacgtcata gggttaggga ggtcctgcat atgcggccgc aactcacggg 180 gatttccaag tctccacccc attgacgtca atgggagttt gttttggcac caaaatcaac 240 gggactttcc aaaatgtcgt aataaccccg ccccgttgac gcaaatgggc ggtaggcgtg 300 tacggtggga ggtctatata agcagagctc gtttagtgaa ccgtgccacc atgcccccac 360 ccaggaccgg aagaggcctg ctgtggctgg gcctggtgct ctcttccgtg tgcgtggccc 420 tgggaagcga aacccaggcc aacagcacaa ccgacgccct gaatgtgctg ctgatcattg 480 tggacgatct gagaccctcc ctgggctgtt acggcgacaa actggtgcgg tccccaaaca 540 tcgaccagct ggcctcccac tccctgctgt tccagaacgc cttcgcccag caggccgtgt 600 gtgcccccag cagggtgagc ttcctgaccg gcagaagacc tgacaccacc aggctgtacg 660 actttaacag ctactggcgg gtgcacgccg gcaatttcag caccattcct cagtacttca 720 aggagaatgg ctacgtgaca atgtccgtgg gcaaggtgtt tcatcccggc attagctcca 780 accacaccga cgatagccca tactcctggt ccttcccccc ctaccatccc tccagcgaga 840 agtacgagaa caccaaaacc tgcagaggcc ctgacggaga gctgcacgcc aacctgctgt 900 gccctgtgga tgtcctggat gtgcccgaag gtaagggttt aagggatggt tggttggtgg 960 ggtattaatg tttaattacc tggagcacct gcctgaaatc actttttttc aggcaccctg 1020 ccagacaagc agtccacaga gcaggccatc cagctgctgg agaagatgaa gacaagcgcc 1080 agccccttct ttctggccgt gggataccac aagcctcaca ttccattccg gtacccaaaa 1140 gagttccaga agctgtaccc tctggaaaac atcaccctgg cccctgaccc cgaggtgcca 1200 gacgggctgc ctcctgtggc ctacaatccc tggatggaca tcagacagcg ggaggatgtg 1260 caggccctga atatttccgt gccctatggg cccatccctg tggactttca gcggaaaatc 1320 agacagtctt actttgccag cgtgtcctac ctggacaccc aggtgggccg cctgctctca 1380 gccctggacg acctgcagct ggccaattcc accatcatcg ccttcaccag cgatcacggc 1440 tgggccctgg gcgagcacgg ggagtgggcc aaatacagca acttcgatgt ggccacccac 1500 gtgcctctga ttttttatgt gcccggccgg acagccagcc tgcccgaggc cggggagaag 1560 ctctttcctt acctggaccc tttcgactct gccagccagc tgatggaacc tggcagacag 1620 agcatggacc tggtggagct ggtgagcctc ttccccactc tggccggcct ggctggcctg 1680 caggtgccac caagatgccc agtgccttct ttccacgtgg agctgtgtag agagggaaag 1740 aacctgctga agcacttcag atttagagat ctggaggagg atccctacct gccaggcaac 1800 ccaagggagc tgatcgccta cagccagtat cccagaccct ctgatatccc ccagtggaac 1860 agcgataagc cctccctgaa agacatcaag attatgggct actccatcag gaccattgac 1920 taccggtaca cagtgtgggt gggcttcaac cccgatgagt ttctggccaa cttcagcgac 1980 atccacgccg gcgagctgta ttttgtggac tccgaccccc tgcaggacca caacatgtac 2040 aacgactccc agggcggcga cctgttccag ctgctgatgc cctgagatcc agacatgata 2100 agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt 2160 tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt 2220 aacaacaaca attgcattca ttttatgttt caggttcagg gggaggtgtg ggaggttttt 2280 taacctgcag gtctagatac gtagataagt agcatggcgg gttaatcatt aactacaagg 2340 aacccctagt gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg 2400 ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag 2460 cgcgcagaga gggagtggcc aa 2482 <210> 51 <211> 143 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 51 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120 gagcgcgcag agagggagtg gcc 143 <210> 52 <211> 2112 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 52 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 60 aaaatcaacg ggactttcca aaatgtcgta ataaccccgc cccgttgacg caaatgggcg 120 gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac cgtgccacca 180 tgccgccacc ccggaccggc cgaggccttc tctggctggg tctggttctg agctccgtct 240 gcgtcgccct cggatccgaa acgcaggcca actcgaccac agatgctctg aacgttcttc 300 tcatcatcgt ggatgacctg cgcccctccc tgggctgtta tggggataag ctggtgaggt 360 ccccaaatat tgaccaactg gcatcccaca gcctcctctt ccagaatgcc tttgcgcagc 420 aagcagtgtg cgccccgagc cgcgtttctt tcctcactgg caggagacct gacaccaccc 480 gcctgtacga cttcaactcc tactggaggg tgcacgctgg aaacttctcc accatccccc 540 agtacttcaa ggagaatggc tatgtgacca tgtcggtggg aaaagtcttt caccctggga 600 tatcttctaa ccataccgat gattctccgt atagctggtc ttttccacct tatcatcctt 660 cctctgagaa gtatgaaaac actaagacat gtcgagggcc agatggagaa ctccatgcca 720 acctgctttg ccctgtggat gtgctggatg ttcccgaggg caccttgcct gacaaacaga 780 gcactgagca agccatacag ttgttggaaa agatgaaaac gtcagccagt cctttcttcc 840 tggccgttgg gtatcataag ccacacatcc ccttcagata ccccaaggta agggtttaag 900 ggatggttgg ttggtggggt attaatgttt aattacctgg agcacctgcc tgaaatcact 960 ttttttcagg aatttcagaa gttgtatccc ttggagaaca tcaccctggc ccccgatccc 1020 gaggtccctg atggcctacc ccctgtggcc tacaacccct ggatggacat caggcaacgg 1080 gaagacgtcc aagccttaaa catcagtgtg ccgtatggtc caattcctgt ggactttcag 1140 cggaaaatcc gccagagcta ctttgcctct gtgtcatatt tggatacaca ggtcggccgc 1200 ctcttgagtg ctttggacga tcttcagctg gccaacagca ccatcattgc atttacctcg 1260 gatcatgggt gggctctagg tgaacatgga gaatgggcca aatacagcaa ttttgatgtt 1320 gctacccatg ttcccctgat attctatgtt cctggaagga cggcttcact tccggaggca 1380 ggcgagaagc ttttccctta cctcgaccct tttgattccg cctcacagtt gatggagcca 1440 ggcaggcaat ccatggacct tgtggaactt gtgtctcttt ttcccacgct ggctggactt 1500 gcaggactgc aggttccacc tcgctgcccc gttccttcat ttcacgttga gctgtgcaga 1560 gaaggcaaga accttctgaa gcattttcga ttccgtgact tggaagagga tccgtacctc 1620 cctggtaatc cccgtgaact gattgcctat agccagtatc cccggccttc agacatccct 1680 cagtggaatt ctgacaagcc gagtttaaaa gatataaaga tcatgggcta ttccatacgc 1740 accatagact ataggtatac tgtgtgggtt ggcttcaatc ctgatgaatt tctagctaac 1800 ttttctgaca tccatgcagg ggaactgtat tttgtggatt ctgacccatt gcaggatcac 1860 aatatgtata atgattccca aggtggagat cttttccagt tgttgatgcc ttgagatcca 1920 gacatgataa gatacattga tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa 1980 tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat aagctgcaat 2040 aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg 2100 gaggtttttt aa 2112 <210> 53 <211> 2521 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 53 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180 ggttagggag gtcctgcata tgcggccgca actcacgggg atttccaagt ctccacccca 240 ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg ggactttcca aaatgtcgta 300 ataaccccgc cccgttgacg caaatgggcg gtaggcgtgt acggtgggag gtctatataa 360 gcagagctcg tttagtgaac cgtgccacca tgccgccacc ccggaccggc cgaggccttc 420 tctggctggg tctggttctg agctccgtct gcgtcgccct cggatccgaa acgcaggcca 480 actcgaccac agatgctctg aacgttcttc tcatcatcgt ggatgacctg cgcccctccc 540 tgggctgtta tggggataag ctggtgaggt ccccaaatat tgaccaactg gcatcccaca 600 gcctcctctt ccagaatgcc tttgcgcagc aagcagtgtg cgccccgagc cgcgtttctt 660 tcctcactgg caggagacct gacaccaccc gcctgtacga cttcaactcc tactggaggg 720 tgcacgctgg aaacttctcc accatccccc agtacttcaa ggagaatggc tatgtgacca 780 tgtcggtggg aaaagtcttt caccctggga tatcttctaa ccataccgat gattctccgt 840 atagctggtc ttttccacct tatcatcctt cctctgagaa gtatgaaaac actaagacat 900 gtcgagggcc agatggagaa ctccatgcca acctgctttg ccctgtggat gtgctggatg 960 ttcccgaggg caccttgcct gacaaacaga gcactgagca agccatacag ttgttggaaa 1020 agatgaaaac gtcagccagt cctttcttcc tggccgttgg gtatcataag ccacacatcc 1080 ccttcagata ccccaaggta agggtttaag ggatggttgg ttggtggggt attaatgttt 1140 aattacctgg agcacctgcc tgaaatcact ttttttcagg aatttcagaa gttgtatccc 1200 ttggagaaca tcaccctggc ccccgatccc gaggtccctg atggcctacc ccctgtggcc 1260 tacaacccct ggatggacat caggcaacgg gaagacgtcc aagccttaaa catcagtgtg 1320 ccgtatggtc caattcctgt ggactttcag cggaaaatcc gccagagcta ctttgcctct 1380 gtgtcatatt tggatacaca ggtcggccgc ctcttgagtg ctttggacga tcttcagctg 1440 gccaacagca ccatcattgc atttacctcg gatcatgggt gggctctagg tgaacatgga 1500 gaatgggcca aatacagcaa ttttgatgtt gctacccatg ttcccctgat attctatgtt 1560 cctggaagga cggcttcact tccggaggca ggcgagaagc ttttccctta cctcgaccct 1620 tttgattccg cctcacagtt gatggagcca ggcaggcaat ccatggacct tgtggaactt 1680 gtgtctcttt ttcccacgct ggctggactt gcaggactgc aggttccacc tcgctgcccc 1740 gttccttcat ttcacgttga gctgtgcaga gaaggcaaga accttctgaa gcattttcga 1800 ttccgtgact tggaagagga tccgtacctc cctggtaatc cccgtgaact gattgcctat 1860 agccagtatc cccggccttc agacatccct cagtggaatt ctgacaagcc gagtttaaaa 1920 gatataaaga tcatgggcta ttccatacgc accatagact ataggtatac tgtgtgggtt 1980 ggcttcaatc ctgatgaatt tctagctaac ttttctgaca tccatgcagg ggaactgtat 2040 tttgtggatt ctgacccatt gcaggatcac aatatgtata atgattccca aggtggagat 2100 cttttccagt tgttgatgcc ttgagatcca gacatgataa gatacattga tgagtttgga 2160 caaaccacaa ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg tgatgctatt 2220 gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa ttgcattcat 2280 tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aacctgcagg tctagatacg 2340 tagataagta gcatggcggg ttaatcatta actacaagga acccctagtg atggagttgg 2400 ccactccctc tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac 2460 gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 2520 a 2521 <210> 54 <211> 2113 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 54 aactcacggg gatttccaag tctccacccc attgacgtca atgggagttt gttttggcac 60 caaaatcaac gggactttcc aaaatgtcgt aataaccccg ccccgttgac gcaaatgggc 120 ggtaggcgtg tacggtggga ggtctatata agcagagctc gtttagtgaa ccgtgccacc 180 atgcccccac ccaggaccgg aagaggcctg ctgtggctgg gcctggtgct ctcttccgtg 240 tgcgtggccc tgggaagcga aacccaggcc aacagcacaa ccgacgccct gaatgtgctg 300 ctgatcattg tggacgatct gagaccctcc ctgggctgtt acggcgacaa actggtgcgg 360 tccccaaaca tcgaccagct ggcctcccac tccctgctgt tccagaacgc cttcgcccag 420 caggccgtgt gtgcccccag cagggtgagc ttcctgaccg gcagaagacc tgacaccacc 480 aggctgtacg actttaacag ctactggcgg gtgcacgccg gcaatttcag caccattcct 540 cagtacttca aggagaatgg ctacgtgaca atgtccgtgg gcaaggtgtt tcatcccggc 600 attagctcca accacaccga cgatagccca tactcctggt ccttcccccc ctaccatccc 660 tccagcgaga agtacgagaa caccaaaacc tgcagaggcc ctgacggaga gctgcacgcc 720 aacctgctgt gccctgtgga tgtcctggat gtgcccgaag gtaagggttt aagggatggt 780 tggttggtgg ggtattaatg tttaattacc tggagcacct gcctgaaatc actttttttc 840 aggcaccctg ccagacaagc agtccacaga gcaggccatc cagctgctgg agaagatgaa 900 gacaagcgcc agccccttct ttctggccgt gggataccac aagcctcaca ttccattccg 960 gtacccaaaa gagttccaga agctgtaccc tctggaaaac atcaccctgg cccctgaccc 1020 cgaggtgcca gacgggctgc ctcctgtggc ctacaatccc tggatggaca tcagacagcg 1080 ggaggatgtg caggccctga atatttccgt gccctatggg cccatccctg tggactttca 1140 gcggaaaatc agacagtctt actttgccag cgtgtcctac ctggacaccc aggtgggccg 1200 cctgctctca gccctggacg acctgcagct ggccaattcc accatcatcg ccttcaccag 1260 cgatcacggc tgggccctgg gcgagcacgg ggagtgggcc aaatacagca acttcgatgt 1320 ggccacccac gtgcctctga ttttttatgt gcccggccgg acagccagcc tgcccgaggc 1380 cggggagaag ctctttcctt acctggaccc tttcgactct gccagccagc tgatggaacc 1440 tggcagacag agcatggacc tggtggagct ggtgagcctc ttccccactc tggccggcct 1500 ggctggcctg caggtgccac caagatgccc agtgccttct ttccacgtgg agctgtgtag 1560 agagggaaag aacctgctga agcacttcag atttagagat ctggaggagg atccctacct 1620 gccaggcaac ccaagggagc tgatcgccta cagccagtat cccagaccct ctgatatccc 1680 ccagtggaac agcgataagc cctccctgaa agacatcaag attatgggct actccatcag 1740 gaccattgac taccggtaca cagtgtgggt gggcttcaac cccgatgagt ttctggccaa 1800 cttcagcgac atccacgccg gcgagctgta ttttgtggac tccgaccccc tgcaggacca 1860 caacatgtac aacgactccc agggcggcga cctgttccag ctgctgatgc cctgagatcc 1920 agacatgata agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa 1980 atgctttatt tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa 2040 taaacaagtt aacaacaaca attgcattca ttttatgttt caggttcagg gggaggtgtg 2100 ggaggttttt taa 2113 <210> 55 <211> 953 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 55 aattcggtac cctagttatt aatagtaatc aattacgggg tcattagttc atagcccata 60 tatggagttc cgcgttacat aacttacggt aaatggcccg cctggctgac cgcccaacga 120 cccccgccca ttgacgtcaa taatgacgta tgttcccata gtaacgccaa tagggacttt 180 ccattgacgt caatgggtgg actatttacg gtaaactgcc cacttggcag tacatcaagt 240 gtatcatatg ccaagtacgc cccctattga cgtcaatgac ggtaaatggc ccgcctggca 300 ttatgcccag tacatgacct tatgggactt tcctacttgg cagtacatct acgtattagt 360 catcgctatt accatggtcg aggtgagccc cacgttctgc ttcactctcc ccatctcccc 420 cccctcccca cccccaattt tgtatttatt tattttttaa ttattttgtg cagcgatggg 480 ggcggggggg gggggggggc gcgcgccagg cggggcgggg cggggcgagg ggcggggcgg 540 ggcgaggcgg agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa agtttccttt 600 tatggcgagg cggcggcggc ggcggcccta taaaaagcga agcgcgcggc gggcgggagt 660 cgctgcgacg ctgccttcgc cccgtgcccc gctccgccgc cgcctcgcgc cgcccgcccc 720 ggctctgact gaccgcgtta ctcccacagg tgagcgggcg ggacggccct tctcctccgg 780 gctgtaatta gcgcttggtt taatgacggc ttgtttcttt tctgtggctg cgtgaaagcc 840 ttgaggggct ccgggagcta gagcctctgc taaccatgtt catgccttct tctttttcct 900 acagctcctg ggcaacgtgc tggttattgt gctgtctcat cattttggca aag 953 <210> 56 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 56 gtagataagt agcatggcgg gttaatcatt aactaca 37 <210> 57 <211> 180 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 57 gtagataagt agcatggcgg gttaatcatt aactacaagg aacccctagt gatggagttg 60 gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga 120 cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc 180 180 <210> 58 <211> 2522 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 58 tttggccact ccctctctgc gcgctcgctc gctcactgag gccgggcgac caaaggtcgc 60 ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgca gagagggagt 120 ggccaactcc atcactaggg gttcctggag gggtggagtc gtgacgtgaa ttacgtcata 180 gggttaggga ggtcctgcat atgcggccgc aactcacggg gatttccaag tctccacccc 240 attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc aaaatgtcgt 300 aataaccccg ccccgttgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata 360 agcagagctc gtttagtgaa ccgtgccacc atgcccccac ccaggaccgg aagaggcctg 420 ctgtggctgg gcctggtgct ctcttccgtg tgcgtggccc tgggaagcga aacccaggcc 480 aacagcacaa ccgacgccct gaatgtgctg ctgatcattg tggacgatct gagaccctcc 540 ctgggctgtt acggcgacaa actggtgcgg tccccaaaca tcgaccagct ggcctcccac 600 tccctgctgt tccagaacgc cttcgcccag caggccgtgt gtgcccccag cagggtgagc 660 ttcctgaccg gcagaagacc tgacaccacc aggctgtacg actttaacag ctactggcgg 720 gtgcacgccg gcaatttcag caccattcct cagtacttca aggagaatgg ctacgtgaca 780 atgtccgtgg gcaaggtgtt tcatcccggc attagctcca accacaccga cgatagccca 840 tactcctggt ccttcccccc ctaccatccc tccagcgaga agtacgagaa caccaaaacc 900 tgcagaggcc ctgacggaga gctgcacgcc aacctgctgt gccctgtgga tgtcctggat 960 gtgcccgaag gtaagggttt aagggatggt tggttggtgg ggtattaatg tttaattacc 1020 tggagcacct gcctgaaatc actttttttc aggcaccctg ccagacaagc agtccacaga 1080 gcaggccatc cagctgctgg agaagatgaa gacaagcgcc agccccttct ttctggccgt 1140 gggataccac aagcctcaca ttccattccg gtacccaaaa gagttccaga agctgtaccc 1200 tctggaaaac atcaccctgg cccctgaccc cgaggtgcca gacgggctgc ctcctgtggc 1260 ctacaatccc tggatggaca tcagacagcg ggaggatgtg caggccctga atatttccgt 1320 gccctatggg cccatccctg tggactttca gcggaaaatc agacagtctt actttgccag 1380 cgtgtcctac ctggacaccc aggtgggccg cctgctctca gccctggacg acctgcagct 1440 ggccaattcc accatcatcg ccttcaccag cgatcacggc tgggccctgg gcgagcacgg 1500 ggagtgggcc aaatacagca acttcgatgt ggccacccac gtgcctctga ttttttatgt 1560 gcccggccgg acagccagcc tgcccgaggc cggggagaag ctctttcctt acctggaccc 1620 tttcgactct gccagccagc tgatggaacc tggcagacag agcatggacc tggtggagct 1680 ggtgagcctc ttccccactc tggccggcct ggctggcctg caggtgccac caagatgccc 1740 agtgccttct ttccacgtgg agctgtgtag agagggaaag aacctgctga agcacttcag 1800 atttagagat ctggaggagg atccctacct gccaggcaac ccaagggagc tgatcgccta 1860 cagccagtat cccagaccct ctgatatccc ccagtggaac agcgataagc cctccctgaa 1920 agacatcaag attatgggct actccatcag gaccattgac taccggtaca cagtgtgggt 1980 gggcttcaac cccgatgagt ttctggccaa cttcagcgac atccacgccg gcgagctgta 2040 ttttgtggac tccgaccccc tgcaggacca caacatgtac aacgactccc agggcggcga 2100 cctgttccag ctgctgatgc cctgagatcc agacatgata agatacattg atgagtttgg 2160 acaaaccaca actagaatgc agtgaaaaaa atgctttatt tgtgaaattt gtgatgctat 2220 tgctttattt gtaaccatta taagctgcaa taaacaagtt aacaacaaca attgcattca 2280 ttttatgttt caggttcagg gggaggtgtg ggaggttttt taacctgcag gtctagatac 2340 gtagataagt agcatggcgg gttaatcatt aactacaagg aacccctagt gatggagttg 2400 gccactccct ctctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt 2460 cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc 2520 aa 2522 <210> 59 <211> 1735 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 59 atgcccccac ctagaaccgg cagaggcctg ctgtggctgg gcctggtcct gagcagcgtt 60 tgtgtggccc tgggcagcga gacacaggcc aactccacaa cagacgccct gaacgtgctg 120 ctgatcatcg tggacgacct gagacctagc ctgggatgtt acggcgacaa gctggtgcgg 180 agccccaaca tcgaccagct ggctagccac agcctgctgt tccagaacgc ctttgcccag 240 caggctgtgt gcgccccttc tagagtgtcc tttctgaccg gcagaaggcc tgacaccaca 300 agactgtacg acttcaactc ttactggcgg gtgcacgccg gcaacttcag caccatcccc 360 cagtacttta aggagaacgg ctacgtgacc atgagcgtgg gcaaggtgtt ccatcctggc 420 atcagcagca accacaccga cgacagcccc tacagctggt ccttcccccc ctatcacccc 480 tctagcgaga agtacgagaa taccaagacc tgccggggcc ccgatggcga actgcacgcc 540 aacctgctct gccctgtgga cgtgctggat gtgcctgagg gcaccctgcc tgacaagcag 600 agcaccgagc aggccatcca gctgctcgaa aagatgaaaa catctgccag ccctttcttc 660 ctggccgtgg gctaccacaa gcctcacatc ccttttcggt accctaaggt aagggtttaa 720 gggatggttg gttggtgggg tattaatgtt taattacctg gagcacctgc ctgaaatcac 780 tttttttcag gaattccaaa aactgtaccc cctcgagaac ataacactgg ctcctgaccc 840 cgaagtgcca gacggcctcc ctccagtggc ttataacccc tggatggata tccggcagcg 900 ggaagatgtc caggccctta atatcagcgt gccatacggc cctatccctg tggacttcca 960 gagaaagatc agacagagct acttcgccag cgtctcctac ctggatacac aggtgggaag 1020 actgctgtct gccctcgatg atctgcagct ggcaaacagc acaatcatcg ccttcaccag 1080 cgaccacggc tgggctctgg gcgaacacgg cgagtgggcc aagtactcca actttgacgt 1140 ggccacccac gtgccactga tcttctacgt gcccggccgg accgcctctc tgccagaggc 1200 cggagagaaa ctgtttccat atctggaccc cttcgacagc gcctctcagc tgatggaacc 1260 tggcagacaa tctatggacc tggtggaact ggtgtccctg ttccctaccc tggccggact 1320 ggctggcctt caagtgcctc cacggtgccc cgtgccaagc ttccacgttg agctgtgcag 1380 agagggaaaa aacctgctga agcacttcag attccgggac ctggaggaag atccttacct 1440 ccctggaaat cctagagagc tgatcgccta cagccagtac cccagaccca gcgacatccc 1500 tcagtggaac agcgataagc cctccctgaa ggacattaag atcatgggat atagcatcag 1560 aaccatcgac tacagataca ccgtgtgggt cggcttcaac cccgacgagt tcctggccaa 1620 tttcagcgac atccacgccg gagaactgta cttcgtggat tctgaccctc tgcaggacca 1680 caacatgtac aacgacagcc agggcggcga tctgttccag ctgcttatgc cttga 1735 <210> 60 <211> 1735 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 60 atgccccccc ccagaaccgg gagaggcctc ctgtggctgg gcctggtgct gagctccgtg 60 tgtgtggccc tgggcagcga gacccaggcc aacagcacca cagacgccct gaatgtgctg 120 ctgatcattg tggatgacct gaggcccagc ctgggctgct acggcgacaa gctggtgcgc 180 agcccaaaca ttgaccagct ggcctcccac agcctgctgt ttcagaatgc cttcgcccag 240 caggctgtgt gtgcccccag cagagtgtcc tttctgacag gccggcggcc agataccacc 300 agactgtatg acttcaattc ctattggaga gtgcacgctg gcaacttcag caccatcccc 360 cagtatttca aagagaatgg ctacgtgacc atgtccgtgg gcaaggtgtt ccaccctggc 420 atcagcagca accacacaga cgatagcccc tatagctggt ctttcccacc ttatcatccc 480 agcagcgaga agtatgaaaa caccaagacc tgcaggggcc ccgacggaga actgcacgcc 540 aacctgctgt gccccgtgga cgtgctggac gtgcctgagg gcaccctgcc cgataagcag 600 agcactgagc aggctatcca gctgctggag aagatgaaga caagcgcctc tcctttcttc 660 ctggccgtgg gctaccataa gcctcacatc cccttcaggt accctaaggt aagggtttaa 720 gggatggttg gttggtgggg tattaatgtt taattacctg gagcacctgc ctgaaatcac 780 tttttttcag gagttccaga agctgtatcc cctggagaac atcaccctgg cccccgaccc 840 agaggtgccc gatggcctgc cccccgtggc ctacaaccca tggatggata ttcgccagag 900 ggaggatgtg caggctctga acatcagcgt gccctacggc cccatccccg tggacttcca 960 gcgcaagatc cggcagagct actttgcctc cgtgtcttac ctggatacac aggtgggcag 1020 gctgctgtcc gccctggacg atctgcagct ggccaatagc accatcatcg ccttcaccag 1080 cgaccatggc tgggccctgg gcgagcacgg agaatgggcc aagtacagca actttgacgt 1140 ggccacccac gtgccactta tcttctacgt gcccggcagg accgccagcc tgcccgaggc 1200 tggcgagaag ctgttcccct acctcgatcc ttttgattct gcctcccagc tgatggagcc 1260 cggcaggcag agcatggacc tggtggagct ggtgagcctg tttccaacac tggccgggct 1320 ggccggcctg caggtgccac ccagatgccc agtgcccagt tttcatgtgg agctgtgtag 1380 ggagggcaag aatctgctga agcacttcag attcagggat ctggaggagg acccatacct 1440 gcctggaaat cccagggagc tgatcgcata ctcccagtac cccagaccta gcgacatccc 1500 tcagtggaac tctgataagc ccagcctcaa ggacattaag attatgggct acagtatcag 1560 gaccatcgac tacagataca cagtgtgggt gggatttaac ccagacgagt tcctggccaa 1620 tttctccgac atccacgccg gcgagctgta cttcgtggac tctgaccctc tgcaggacca 1680 caacatgtac aatgacagcc agggaggaga cctgttccag ctgctgatgc cctga 1735 <210> 61 <211> 2112 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 61 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 60 aaaatcaacg ggactttcca aaatgtcgta ataaccccgc cccgttgacg caaatgggcg 120 gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac cgtgccagga 180 tgcccccacc tagaaccggc agaggcctgc tgtggctggg cctggtcctg agcagcgttt 240 gtgtggccct gggcagcgag acacaggcca actccacaac agacgccctg aacgtgctgc 300 tgatcatcgt ggacgacctg agacctagcc tgggatgtta cggcgacaag ctggtgcgga 360 gccccaacat cgaccagctg gctagccaca gcctgctgtt ccagaacgcc tttgcccagc 420 aggctgtgtg cgccccttct agagtgtcct ttctgaccgg cagaaggcct gacaccacaa 480 gactgtacga cttcaactct tactggcggg tgcacgccgg caacttcagc accatccccc 540 agtactttaa ggagaacggc tacgtgacca tgagcgtggg caaggtgttc catcctggca 600 tcagcagcaa ccacaccgac gacagcccct acagctggtc cttccccccc tatcacccct 660 ctagcgagaa gtacgagaat accaagacct gccggggccc cgatggcgaa ctgcacgcca 720 acctgctctg ccctgtggac gtgctggatg tgcctgaggg caccctgcct gacaagcaga 780 gcaccgagca ggccatccag ctgctcgaaa agatgaaaac atctgccagc cctttcttcc 840 tggccgtggg ctaccacaag cctcacatcc cttttcggta ccctaaggta agggtttaag 900 ggatggttgg ttggtggggt attaatgttt aattacctgg agcacctgcc tgaaatcact 960 ttttttcagg aattccaaaa actgtacccc ctcgagaaca taacactggc tcctgacccc 1020 gaagtgccag acggcctccc tccagtggct tataacccct ggatggatat ccggcagcgg 1080 gaagatgtcc aggcccttaa tatcagcgtg ccatacggcc ctatccctgt ggacttccag 1140 agaaagatca gacagagcta cttcgccagc gtctcctacc tggatacaca ggtgggaaga 1200 ctgctgtctg ccctcgatga tctgcagctg gcaaacagca caatcatcgc cttcaccagc 1260 gaccacggct gggctctggg cgaacacggc gagtgggcca agtactccaa ctttgacgtg 1320 gccacccacg tgccactgat cttctacgtg cccggccgga ccgcctctct gccagaggcc 1380 ggagagaaac tgtttccata tctggacccc ttcgacagcg cctctcagct gatggaacct 1440 ggcagacaat ctatggacct ggtggaactg gtgtccctgt tccctaccct ggccggactg 1500 gctggccttc aagtgcctcc acggtgcccc gtgccaagct tccacgttga gctgtgcaga 1560 gagggaaaaa acctgctgaa gcacttcaga ttccgggacc tggaggaaga tccttacctc 1620 cctggaaatc ctagagagct gatcgcctac agccagtacc ccagacccag cgacatccct 1680 cagtggaaca gcgataagcc ctccctgaag gacattaaga tcatgggata tagcatcaga 1740 accatcgact acagatacac cgtgtgggtc ggcttcaacc ccgacgagtt cctggccaat 1800 ttcagcgaca tccacgccgg agaactgtac ttcgtggatt ctgaccctct gcaggaccac 1860 aacatgtaca acgacagcca gggcggcgat ctgttccagc tgcttatgcc ttgagatcca 1920 gacatgataa gatacattga tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa 1980 tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat aagctgcaat 2040 aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg 2100 gaggtttttt aa 2112 <210> 62 <211> 2482 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 62 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggggag gggtggagtc 120 gtgacgtgaa ttacgtcata gggttaggga ggtcctgcat atgcggccgc aactcacggg 180 gatttccaag tctccacccc attgacgtca atgggagttt gttttggcac caaaatcaac 240 gggactttcc aaaatgtcgt aataaccccg ccccgttgac gcaaatgggc ggtaggcgtg 300 tacggtggga ggtctatata agcagagctc gtttagtgaa ccgtgccagg atgcccccac 360 ctagaaccgg cagaggcctg ctgtggctgg gcctggtcct gagcagcgtt tgtgtggccc 420 tgggcagcga gacacaggcc aactccacaa cagacgccct gaacgtgctg ctgatcatcg 480 tggacgacct gagacctagc ctgggatgtt acggcgacaa gctggtgcgg agccccaaca 540 tcgaccagct ggctagccac agcctgctgt tccagaacgc ctttgcccag caggctgtgt 600 gcgccccttc tagagtgtcc tttctgaccg gcagaaggcc tgacaccaca agactgtacg 660 acttcaactc ttactggcgg gtgcacgccg gcaacttcag caccatcccc cagtacttta 720 aggagaacgg ctacgtgacc atgagcgtgg gcaaggtgtt ccatcctggc atcagcagca 780 accacaccga cgacagcccc tacagctggt ccttcccccc ctatcacccc tctagcgaga 840 agtacgagaa taccaagacc tgccggggcc ccgatggcga actgcacgcc aacctgctct 900 gccctgtgga cgtgctggat gtgcctgagg gcaccctgcc tgacaagcag agcaccgagc 960 aggccatcca gctgctcgaa aagatgaaaa catctgccag ccctttcttc ctggccgtgg 1020 gctaccacaa gcctcacatc ccttttcggt accctaaggt aagggtttaa gggatggttg 1080 gttggtgggg tattaatgtt taattacctg gagcacctgc ctgaaatcac tttttttcag 1140 gaattccaaa aactgtaccc cctcgagaac ataacactgg ctcctgaccc cgaagtgcca 1200 gacggcctcc ctccagtggc ttataacccc tggatggata tccggcagcg ggaagatgtc 1260 caggccctta atatcagcgt gccatacggc cctatccctg tggacttcca gagaaagatc 1320 agacagagct acttcgccag cgtctcctac ctggatacac aggtgggaag actgctgtct 1380 gccctcgatg atctgcagct ggcaaacagc acaatcatcg ccttcaccag cgaccacggc 1440 tgggctctgg gcgaacacgg cgagtgggcc aagtactcca actttgacgt ggccacccac 1500 gtgccactga tcttctacgt gcccggccgg accgcctctc tgccagaggc cggagagaaa 1560 ctgtttccat atctggaccc cttcgacagc gcctctcagc tgatggaacc tggcagacaa 1620 tctatggacc tggtggaact ggtgtccctg ttccctaccc tggccggact ggctggcctt 1680 caagtgcctc cacggtgccc cgtgccaagc ttccacgttg agctgtgcag agagggaaaa 1740 aacctgctga agcacttcag attccgggac ctggaggaag atccttacct ccctggaaat 1800 cctagagagc tgatcgccta cagccagtac cccagaccca gcgacatccc tcagtggaac 1860 agcgataagc cctccctgaa ggacattaag atcatgggat atagcatcag aaccatcgac 1920 tacagataca ccgtgtgggt cggcttcaac cccgacgagt tcctggccaa tttcagcgac 1980 atccacgccg gagaactgta cttcgtggat tctgaccctc tgcaggacca caacatgtac 2040 aacgacagcc agggcggcga tctgttccag ctgcttatgc cttgagatcc agacatgata 2100 agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt 2160 tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt 2220 aacaacaaca attgcattca ttttatgttt caggttcagg gggaggtgtg ggaggttttt 2280 taacctgcag gtctagatac gtagataagt agcatggcgg gttaatcatt aactacaagg 2340 aacccctagt gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg 2400 ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag 2460 cgcgcagaga gggagtggcc aa 2482 <210> 63 <211> 2112 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 63 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 60 aaaatcaacg ggactttcca aaatgtcgta ataaccccgc cccgttgacg caaatgggcg 120 gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac cgtgccagga 180 tgcccccccc cagaaccggg agaggcctcc tgtggctggg cctggtgctg agctccgtgt 240 gtgtggccct gggcagcgag acccaggcca acagcaccac agacgccctg aatgtgctgc 300 tgatcattgt ggatgacctg aggcccagcc tgggctgcta cggcgacaag ctggtgcgca 360 gcccaaacat tgaccagctg gcctcccaca gcctgctgtt tcagaatgcc ttcgcccagc 420 aggctgtgtg tgcccccagc agagtgtcct ttctgacagg ccggcggcca gataccacca 480 gactgtatga cttcaattcc tattggagag tgcacgctgg caacttcagc accatccccc 540 agtatttcaa agagaatggc tacgtgacca tgtccgtggg caaggtgttc caccctggca 600 tcagcagcaa ccacacagac gatagcccct atagctggtc tttcccacct tatcatccca 660 gcagcgagaa gtatgaaaac accaagacct gcaggggccc cgacggagaa ctgcacgcca 720 acctgctgtg ccccgtggac gtgctggacg tgcctgaggg caccctgccc gataagcaga 780 gcactgagca ggctatccag ctgctggaga agatgaagac aagcgcctct cctttcttcc 840 tggccgtggg ctaccataag cctcacatcc ccttcaggta ccctaaggta agggtttaag 900 ggatggttgg ttggtggggt attaatgttt aattacctgg agcacctgcc tgaaatcact 960 ttttttcagg agttccagaa gctgtatccc ctggagaaca tcaccctggc ccccgaccca 1020 gaggtgcccg atggcctgcc ccccgtggcc tacaacccat ggatggatat tcgccagagg 1080 gaggatgtgc aggctctgaa catcagcgtg ccctacggcc ccatccccgt ggacttccag 1140 cgcaagatcc ggcagagcta ctttgcctcc gtgtcttacc tggatacaca ggtgggcagg 1200 ctgctgtccg ccctggacga tctgcagctg gccaatagca ccatcatcgc cttcaccagc 1260 gaccatggct gggccctggg cgagcacgga gaatgggcca agtacagcaa ctttgacgtg 1320 gccacccacg tgccacttat cttctacgtg cccggcagga ccgccagcct gcccgaggct 1380 ggcgagaagc tgttccccta cctcgatcct tttgattctg cctcccagct gatggagccc 1440 ggcaggcaga gcatggacct ggtggagctg gtgagcctgt ttccaacact ggccgggctg 1500 gccggcctgc aggtgccacc cagatgccca gtgcccagtt ttcatgtgga gctgtgtagg 1560 gagggcaaga atctgctgaa gcacttcaga ttcagggatc tggaggagga cccatacctg 1620 cctggaaatc ccagggagct gatcgcatac tcccagtacc ccagacctag cgacatccct 1680 cagtggaact ctgataagcc cagcctcaag gacattaaga ttatgggcta cagtatcagg 1740 accatcgact acagatacac agtgtgggtg ggatttaacc cagacgagtt cctggccaat 1800 ttctccgaca tccacgccgg cgagctgtac ttcgtggact ctgaccctct gcaggaccac 1860 aacatgtaca atgacagcca gggaggagac ctgttccagc tgctgatgcc ctgagatcca 1920 gacatgataa gatacattga tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa 1980 tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat aagctgcaat 2040 aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg 2100 gaggtttttt aa 2112 <210> 64 <211> 2482 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 64 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggggag gggtggagtc 120 gtgacgtgaa ttacgtcata gggttaggga ggtcctgcat atgcggccgc aactcacggg 180 gatttccaag tctccacccc attgacgtca atgggagttt gttttggcac caaaatcaac 240 gggactttcc aaaatgtcgt aataaccccg ccccgttgac gcaaatgggc ggtaggcgtg 300 tacggtggga ggtctatata agcagagctc gtttagtgaa ccgtgccagg atgccccccc 360 ccagaaccgg gagaggcctc ctgtggctgg gcctggtgct gagctccgtg tgtgtggccc 420 tgggcagcga gacccaggcc aacagcacca cagacgccct gaatgtgctg ctgatcattg 480 tggatgacct gaggcccagc ctgggctgct acggcgacaa gctggtgcgc agcccaaaca 540 ttgaccagct ggcctcccac agcctgctgt ttcagaatgc cttcgcccag caggctgtgt 600 gtgcccccag cagagtgtcc tttctgacag gccggcggcc agataccacc agactgtatg 660 acttcaattc ctattggaga gtgcacgctg gcaacttcag caccatcccc cagtatttca 720 aagagaatgg ctacgtgacc atgtccgtgg gcaaggtgtt ccaccctggc atcagcagca 780 accacacaga cgatagcccc tatagctggt ctttcccacc ttatcatccc agcagcgaga 840 agtatgaaaa caccaagacc tgcaggggcc ccgacggaga actgcacgcc aacctgctgt 900 gccccgtgga cgtgctggac gtgcctgagg gcaccctgcc cgataagcag agcactgagc 960 aggctatcca gctgctggag aagatgaaga caagcgcctc tcctttcttc ctggccgtgg 1020 gctaccataa gcctcacatc cccttcaggt accctaaggt aagggtttaa gggatggttg 1080 gttggtgggg tattaatgtt taattacctg gagcacctgc ctgaaatcac tttttttcag 1140 gagttccaga agctgtatcc cctggagaac atcaccctgg cccccgaccc agaggtgccc 1200 gatggcctgc cccccgtggc ctacaaccca tggatggata ttcgccagag ggaggatgtg 1260 caggctctga acatcagcgt gccctacggc cccatccccg tggacttcca gcgcaagatc 1320 cggcagagct actttgcctc cgtgtcttac ctggatacac aggtgggcag gctgctgtcc 1380 gccctggacg atctgcagct ggccaatagc accatcatcg ccttcaccag cgaccatggc 1440 tgggccctgg gcgagcacgg agaatgggcc aagtacagca actttgacgt ggccacccac 1500 gtgccactta tcttctacgt gcccggcagg accgccagcc tgcccgaggc tggcgagaag 1560 ctgttcccct acctcgatcc ttttgattct gcctcccagc tgatggagcc cggcaggcag 1620 agcatggacc tggtggagct ggtgagcctg tttccaacac tggccgggct ggccggcctg 1680 caggtgccac ccagatgccc agtgcccagt tttcatgtgg agctgtgtag ggagggcaag 1740 aatctgctga agcacttcag attcagggat ctggaggagg acccatacct gcctggaaat 1800 cccagggagc tgatcgcata ctcccagtac cccagaccta gcgacatccc tcagtggaac 1860 tctgataagc ccagcctcaa ggacattaag attatgggct acagtatcag gaccatcgac 1920 tacagataca cagtgtgggt gggatttaac ccagacgagt tcctggccaa tttctccgac 1980 atccacgccg gcgagctgta cttcgtggac tctgaccctc tgcaggacca caacatgtac 2040 aatgacagcc agggaggaga cctgttccag ctgctgatgc cctgagatcc agacatgata 2100 agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt 2160 tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt 2220 aacaacaaca attgcattca ttttatgttt caggttcagg gggaggtgtg ggaggttttt 2280 taacctgcag gtctagatac gtagataagt agcatggcgg gttaatcatt aactacaagg 2340 aacccctagt gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg 2400 ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag 2460 cgcgcagaga gggagtggcc aa 2482 <210> 65 <211> 2112 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 65 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 60 aaaatcaacg ggactttcca aaatgtcgta ataaccccgc cccgttgacg caaatgggcg 120 gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac cgtgccagga 180 tgcccccacc caggaccgga agaggcctgc tgtggctggg cctggtgctc tcttccgtgt 240 gcgtggccct gggaagcgaa acccaggcca acagcacaac cgacgccctg aatgtgctgc 300 tgatcattgt ggacgatctg agaccctccc tgggctgtta cggcgacaaa ctggtgcggt 360 ccccaaacat cgaccagctg gcctcccact ccctgctgtt ccagaacgcc ttcgcccagc 420 aggccgtgtg tgcccccagc agggtgagct tcctgaccgg cagaagacct gacaccacca 480 ggctgtacga ctttaacagc tactggcggg tgcacgccgg caatttcagc accattcctc 540 agtacttcaa ggagaatggc tacgtgacaa tgtccgtggg caaggtgttt catcccggca 600 ttagctccaa ccacaccgac gatagcccat actcctggtc cttccccccc taccatccct 660 ccagcgagaa gtacgagaac accaaaacct gcagaggccc tgacggagag ctgcacgcca 720 acctgctgtg ccctgtggat gtcctggatg tgcccgaagg taagggttta agggatggtt 780 ggttggtggg gtattaatgt ttaattacct ggagcacctg cctgaaatca ctttttttca 840 ggcaccctgc cagacaagca gtccacagag caggccatcc agctgctgga gaagatgaag 900 acaagcgcca gccccttctt tctggccgtg ggataccaca agcctcacat tccattccgg 960 tacccaaaag agttccagaa gctgtaccct ctggaaaaca tcaccctggc ccctgacccc 1020 gaggtgccag acgggctgcc tcctgtggcc tacaatccct ggatggacat cagacagcgg 1080 gaggatgtgc aggccctgaa tatttccgtg ccctatgggc ccatccctgt ggactttcag 1140 cggaaaatca gacagtctta ctttgccagc gtgtcctacc tggacaccca ggtgggccgc 1200 ctgctctcag ccctggacga cctgcagctg gccaattcca ccatcatcgc cttcaccagc 1260 gatcacggct gggccctggg cgagcacggg gagtgggcca aatacagcaa cttcgatgtg 1320 gccacccacg tgcctctgat tttttatgtg cccggccgga cagccagcct gcccgaggcc 1380 ggggagaagc tctttcctta cctggaccct ttcgactctg ccagccagct gatggaacct 1440 ggcagacaga gcatggacct ggtggagctg gtgagcctct tccccactct ggccggcctg 1500 gctggcctgc aggtgccacc aagatgccca gtgccttctt tccacgtgga gctgtgtaga 1560 gagggaaaga acctgctgaa gcacttcaga tttagagatc tggaggagga tccctacctg 1620 ccaggcaacc caagggagct gatcgcctac agccagtatc ccagaccctc tgatatcccc 1680 cagtggaaca gcgataagcc ctccctgaaa gacatcaaga ttatgggcta ctccatcagg 1740 accattgact accggtacac agtgtgggtg ggcttcaacc ccgatgagtt tctggccaac 1800 ttcagcgaca tccacgccgg cgagctgtat tttgtggact ccgaccccct gcaggaccac 1860 aacatgtaca acgactccca gggcggcgac ctgttccagc tgctgatgcc ctgagatcca 1920 gacatgataa gatacattga tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa 1980 tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat aagctgcaat 2040 aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg 2100 gaggtttttt aa 2112 <210> 66 <211> 2482 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 66 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggggag gggtggagtc 120 gtgacgtgaa ttacgtcata gggttaggga ggtcctgcat atgcggccgc aactcacggg 180 gatttccaag tctccacccc attgacgtca atgggagttt gttttggcac caaaatcaac 240 gggactttcc aaaatgtcgt aataaccccg ccccgttgac gcaaatgggc ggtaggcgtg 300 tacggtggga ggtctatata agcagagctc gtttagtgaa ccgtgccagg atgcccccac 360 ccaggaccgg aagaggcctg ctgtggctgg gcctggtgct ctcttccgtg tgcgtggccc 420 tgggaagcga aacccaggcc aacagcacaa ccgacgccct gaatgtgctg ctgatcattg 480 tggacgatct gagaccctcc ctgggctgtt acggcgacaa actggtgcgg tccccaaaca 540 tcgaccagct ggcctcccac tccctgctgt tccagaacgc cttcgcccag caggccgtgt 600 gtgcccccag cagggtgagc ttcctgaccg gcagaagacc tgacaccacc aggctgtacg 660 actttaacag ctactggcgg gtgcacgccg gcaatttcag caccattcct cagtacttca 720 aggagaatgg ctacgtgaca atgtccgtgg gcaaggtgtt tcatcccggc attagctcca 780 accacaccga cgatagccca tactcctggt ccttcccccc ctaccatccc tccagcgaga 840 agtacgagaa caccaaaacc tgcagaggcc ctgacggaga gctgcacgcc aacctgctgt 900 gccctgtgga tgtcctggat gtgcccgaag gtaagggttt aagggatggt tggttggtgg 960 ggtattaatg tttaattacc tggagcacct gcctgaaatc actttttttc aggcaccctg 1020 ccagacaagc agtccacaga gcaggccatc cagctgctgg agaagatgaa gacaagcgcc 1080 agccccttct ttctggccgt gggataccac aagcctcaca ttccattccg gtacccaaaa 1140 gagttccaga agctgtaccc tctggaaaac atcaccctgg cccctgaccc cgaggtgcca 1200 gacgggctgc ctcctgtggc ctacaatccc tggatggaca tcagacagcg ggaggatgtg 1260 caggccctga atatttccgt gccctatggg cccatccctg tggactttca gcggaaaatc 1320 agacagtctt actttgccag cgtgtcctac ctggacaccc aggtgggccg cctgctctca 1380 gccctggacg acctgcagct ggccaattcc accatcatcg ccttcaccag cgatcacggc 1440 tgggccctgg gcgagcacgg ggagtgggcc aaatacagca acttcgatgt ggccacccac 1500 gtgcctctga ttttttatgt gcccggccgg acagccagcc tgcccgaggc cggggagaag 1560 ctctttcctt acctggaccc tttcgactct gccagccagc tgatggaacc tggcagacag 1620 agcatggacc tggtggagct ggtgagcctc ttccccactc tggccggcct ggctggcctg 1680 caggtgccac caagatgccc agtgccttct ttccacgtgg agctgtgtag agagggaaag 1740 aacctgctga agcacttcag atttagagat ctggaggagg atccctacct gccaggcaac 1800 ccaagggagc tgatcgccta cagccagtat cccagaccct ctgatatccc ccagtggaac 1860 agcgataagc cctccctgaa agacatcaag attatgggct actccatcag gaccattgac 1920 taccggtaca cagtgtgggt gggcttcaac cccgatgagt ttctggccaa cttcagcgac 1980 atccacgccg gcgagctgta ttttgtggac tccgaccccc tgcaggacca caacatgtac 2040 aacgactccc agggcggcga cctgttccag ctgctgatgc cctgagatcc agacatgata 2100 agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt 2160 tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt 2220 aacaacaaca attgcattca ttttatgttt caggttcagg gggaggtgtg ggaggttttt 2280 taacctgcag gtctagatac gtagataagt agcatggcgg gttaatcatt aactacaagg 2340 aacccctagt gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg 2400 ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag 2460 cgcgcagaga gggagtggcc aa 2482 <210> 67 <211> 1653 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 67 atgcccccac ctagaaccgg cagaggcctg ctgtggctgg gcctggtcct gagcagcgtt 60 tgtgtggccc tgggcagcga gacacaggcc aactccacaa cagacgccct gaacgtgctg 120 ctgatcatcg tggacgacct gagacctagc ctgggatgtt acggcgacaa gctggtgcgg 180 agccccaaca tcgaccagct ggctagccac agcctgctgt tccagaacgc ctttgcccag 240 caggctgtgt gcgccccttc tagagtgtcc tttctgaccg gcagaaggcc tgacaccaca 300 agactgtacg acttcaactc ttactggcgg gtgcacgccg gcaacttcag caccatcccc 360 cagtacttta aggagaacgg ctacgtgacc atgagcgtgg gcaaggtgtt ccatcctggc 420 atcagcagca accacaccga cgacagcccc tacagctggt ccttcccccc ctatcacccc 480 tctagcgaga agtacgagaa taccaagacc tgccggggcc ccgatggcga actgcacgcc 540 aacctgctct gccctgtgga cgtgctggat gtgcctgagg gcaccctgcc tgacaagcag 600 agcaccgagc aggccatcca gctgctcgaa aagatgaaaa catctgccag ccctttcttc 660 ctggccgtgg gctaccacaa gcctcacatc ccttttcggt accctaagga attccaaaaa 720 ctgtaccccc tcgagaacat aacactggct cctgaccccg aagtgccaga cggcctccct 780 ccagtggctt ataacccctg gatggatatc cggcagcggg aagatgtcca ggcccttaat 840 atcagcgtgc catacggccc tatccctgtg gacttccaga gaaagatcag acagagctac 900 ttcgccagcg tctcctacct ggatacacag gtgggaagac tgctgtctgc cctcgatgat 960 ctgcagctgg caaacagcac aatcatcgcc ttcaccagcg accacggctg ggctctgggc 1020 gaacacggcg agtgggccaa gtactccaac tttgacgtgg ccacccacgt gccactgatc 1080 ttctacgtgc ccggccggac cgcctctctg ccagaggccg gagagaaact gtttccatat 1140 ctggacccct tcgacagcgc ctctcagctg atggaacctg gcagacaatc tatggacctg 1200 gtggaactgg tgtccctgtt ccctaccctg gccggactgg ctggccttca agtgcctcca 1260 cggtgccccg tgccaagctt ccacgttgag ctgtgcagag agggaaaaaa cctgctgaag 1320 cacttcagat tccgggacct ggaggaagat ccttacctcc ctggaaatcc tagagagctg 1380 atcgcctaca gccagtaccc cagacccagc gacatccctc agtggaacag cgataagccc 1440 tccctgaagg acattaagat catgggatat agcatcagaa ccatcgacta cagatacacc 1500 gtgtgggtcg gcttcaaccc cgacgagttc ctggccaatt tcagcgacat ccacgccgga 1560 gaactgtact tcgtggattc tgaccctctg caggaccaca acatgtacaa cgacagccag 1620 ggcggcgatc tgttccagct gcttatgcct tga 1653 <210> 68 <211> 1653 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 68 atgccccccc ccagaaccgg gagaggcctc ctgtggctgg gcctggtgct gagctccgtg 60 tgtgtggccc tgggcagcga gacccaggcc aacagcacca cagacgccct gaatgtgctg 120 ctgatcattg tggatgacct gaggcccagc ctgggctgct acggcgacaa gctggtgcgc 180 agcccaaaca ttgaccagct ggcctcccac agcctgctgt ttcagaatgc cttcgcccag 240 caggctgtgt gtgcccccag cagagtgtcc tttctgacag gccggcggcc agataccacc 300 agactgtatg acttcaattc ctattggaga gtgcacgctg gcaacttcag caccatcccc 360 cagtatttca aagagaatgg ctacgtgacc atgtccgtgg gcaaggtgtt ccaccctggc 420 atcagcagca accacacaga cgatagcccc tatagctggt ctttcccacc ttatcatccc 480 agcagcgaga agtatgaaaa caccaagacc tgcaggggcc ccgacggaga actgcacgcc 540 aacctgctgt gccccgtgga cgtgctggac gtgcctgagg gcaccctgcc cgataagcag 600 agcactgagc aggctatcca gctgctggag aagatgaaga caagcgcctc tcctttcttc 660 ctggccgtgg gctaccataa gcctcacatc cccttcaggt accctaagga gttccagaag 720 ctgtatcccc tggagaacat caccctggcc cccgacccag aggtgcccga tggcctgccc 780 cccgtggcct acaacccatg gatggatatt cgccagaggg aggatgtgca ggctctgaac 840 atcagcgtgc cctacggccc catccccgtg gacttccagc gcaagatccg gcagagctac 900 tttgcctccg tgtcttacct ggatacacag gtgggcaggc tgctgtccgc cctggacgat 960 ctgcagctgg ccaatagcac catcatcgcc ttcaccagcg accatggctg ggccctgggc 1020 gagcacggag aatgggccaa gtacagcaac tttgacgtgg ccacccacgt gccacttatc 1080 ttctacgtgc ccggcaggac cgccagcctg cccgaggctg gcgagaagct gttcccctac 1140 ctcgatcctt ttgattctgc ctcccagctg atggagcccg gcaggcagag catggacctg 1200 gtggagctgg tgagcctgtt tccaacactg gccgggctgg ccggcctgca ggtgccaccc 1260 agatgcccag tgcccagttt tcatgtggag ctgtgtaggg agggcaagaa tctgctgaag 1320 cacttcagat tcagggatct ggaggaggac ccatacctgc ctggaaatcc cagggagctg 1380 atcgcatact cccagtaccc cagacctagc gacatccctc agtggaactc tgataagccc 1440 agcctcaagg acattaagat tatgggctac agtatcagga ccatcgacta cagatacaca 1500 gtgtgggtgg gatttaaccc agacgagttc ctggccaatt tctccgacat ccacgccggc 1560 gagctgtact tcgtggactc tgaccctctg caggaccaca acatgtacaa tgacagccag 1620 ggaggagacc tgttccagct gctgatgccc tga 1653 <210> 69 <211> 2118 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 69 aactcacggg gatttccaag tctccacccc attgacgtca atgggagttt gttttggcac 60 caaaatcaac gggactttcc aaaatgtcgt aataaccccg ccccgttgac gcaaatgggc 120 ggtaggcgtg tacggtggga ggtctatata agcagagctc gtttagtgaa ccgtgccacc 180 atgccgccac cccggaccgg ccgaggcctt ctctggctgg gtctggttct gagctccgtc 240 tgcgtcgccc tcggatccga aacgcaggcc aactcgacca cagatgctct gaacgttctt 300 ctcatcatcg tggatgacct gcgcccctcc ctgggctgtt atggggataa gctggtgagg 360 tccccaaata ttgaccaact ggcatcccac agcctcctct tccagaatgc ctttgcgcag 420 caagcagtgt gcgccccgag ccgcgtttct ttcctcactg gcaggagacc tgacaccacc 480 cgcctgtacg acttcaactc ctactggagg gtgcacgctg gaaacttctc caccatcccc 540 cagtacttca aggagaatgg ctatgtgacc atgtcggtgg gaaaagtctt tcaccctggg 600 atatcttcta accataccga tgattctccg tatagctggt cttttccacc ttatcatcct 660 tcctctgaga agtatgaaaa cactaagaca tgtcgagggc cagatggaga actccatgcc 720 aacctgcttt gccctgtgga tgtgctggat gttcccgagg gcaccttgcc tgacaaacag 780 agcactgagc aagccataca gttgttggaa aagatgaaaa cgtcagccag tcctttcttc 840 ctggccgttg ggtatcataa gccacacatc cccttcagat accccaaggt aagggtttaa 900 gggatggttg gttggtgggg tattaatgtt taattacctg gagcacctgc ctgaaatcac 960 tttttttcag gaatttcaga agttgtatcc cttggagaac atcaccctgg cccccgatcc 1020 cgaggtccct gatggcctac cccctgtggc ctacaacccc tggatggaca tcaggcaacg 1080 ggaagacgtc caagccttaa acatcagtgt gccgtatggt ccaattcctg tggactttca 1140 gcggaaaatc cgccagagct actttgcctc tgtgtcatat ttggatacac aggtcggccg 1200 cctcttgagt gctttggacg atcttcagct ggccaacagc accatcattg catttacctc 1260 ggatcatggg tgggctctag gtgaacatgg agaatgggcc aaatacagca attttgatgt 1320 tgctacccat gttcccctga tattctatgt tcctggaagg acggcttcac ttccggaggc 1380 aggcgagaag cttttccctt acctcgaccc ttttgattcc gcctcacagt tgatggagcc 1440 aggcaggcaa tccatggacc ttgtggaact tgtgtctctt tttcccacgc tggctggact 1500 tgcaggactg caggttccac ctcgctgccc cgttccttca tttcacgttg agctgtgcag 1560 agaaggcaag aaccttctga agcattttcg attccgtgac ttggaagagg atccgtacct 1620 ccctggtaat ccccgtgaac tgattgccta tagccagtat ccccggcctt cagacatccc 1680 tcagtggaat tctgacaagc cgagtttaaa agatataaag atcatgggct attccatacg 1740 caccatagac tataggtata ctgtgtgggt tggcttcaat cctgatgaat ttctagctaa 1800 cttttctgac atccatgcag gggaactgta ttttgtggat tctgacccat tgcaggatca 1860 caatatgtat aatgattccc aaggtggaga tcttttccag ttgttgatgc cttgactcga 1920 gatccagaca tgataagata cattgatgag tttggacaaa ccacaactag aatgcagtga 1980 aaaaaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac cattataagc 2040 tgcaataaac aagttaacaa caacaattgc attcatttta tgtttcaggt tcagggggag 2100 gtgtgggagg ttttttaa 2118 <210> 70 <211> 2432 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 70 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggaatt cacgcgtgga 120 tctgaattca attcacgcgt ggtaccaact cacggggatt tccaagtctc caccccattg 180 acgtcaatgg gagtttgttt tggcaccaaa atcaacggga ctttccaaaa tgtcgtaata 240 accccgcccc gttgacgcaa atgggcggta ggcgtgtacg gtgggaggtc tatataagca 300 gagctcgttt agtgaaccgt gccaccatgc cgccaccccg gaccggccga ggccttctct 360 ggctgggtct ggttctgagc tccgtctgcg tcgccctcgg atccgaaacg caggccaact 420 cgaccacaga tgctctgaac gttcttctca tcatcgtgga tgacctgcgc ccctccctgg 480 gctgttatgg ggataagctg gtgaggtccc caaatattga ccaactggca tcccacagcc 540 tcctcttcca gaatgccttt gcgcagcaag cagtgtgcgc cccgagccgc gtttctttcc 600 tcactggcag gagacctgac accacccgcc tgtacgactt caactcctac tggagggtgc 660 acgctggaaa cttctccacc atcccccagt acttcaagga gaatggctat gtgaccatgt 720 cggtgggaaa agtctttcac cctgggatat cttctaacca taccgatgat tctccgtata 780 gctggtcttt tccaccttat catccttcct ctgagaagta tgaaaacact aagacatgtc 840 gagggccaga tggagaactc catgccaacc tgctttgccc tgtggatgtg ctggatgttc 900 ccgagggcac cttgcctgac aaacagagca ctgagcaagc catacagttg ttggaaaaga 960 tgaaaacgtc agccagtcct ttcttcctgg ccgttgggta tcataagcca cacatcccct 1020 tcagataccc caaggtaagg gtttaaggga tggttggttg gtggggtatt aatgtttaat 1080 tacctggagc acctgcctga aatcactttt tttcaggaat ttcagaagtt gtatcccttg 1140 gagaacatca ccctggcccc cgatcccgag gtccctgatg gcctaccccc tgtggcctac 1200 aacccctgga tggacatcag gcaacgggaa gacgtccaag ccttaaacat cagtgtgccg 1260 tatggtccaa ttcctgtgga ctttcagcgg aaaatccgcc agagctactt tgcctctgtg 1320 tcatatttgg atacacaggt cggccgcctc ttgagtgctt tggacgatct tcagctggcc 1380 aacagcacca tcattgcatt tacctcggat catgggtggg ctctaggtga acatggagaa 1440 tgggccaaat acagcaattt tgatgttgct acccatgttc ccctgatatt ctatgttcct 1500 ggaaggacgg cttcacttcc ggaggcaggc gagaagcttt tcccttacct cgaccctttt 1560 gattccgcct cacagttgat ggagccaggc aggcaatcca tggaccttgt ggaacttgtg 1620 tctctttttc ccacgctggc tggacttgca ggactgcagg ttccacctcg ctgccccgtt 1680 ccttcatttc acgttgagct gtgcagagaa ggcaagaacc ttctgaagca ttttcgattc 1740 cgtgacttgg aagaggatcc gtacctccct ggtaatcccc gtgaactgat tgcctatagc 1800 cagtatcccc ggccttcaga catccctcag tggaattctg acaagccgag tttaaaagat 1860 ataaagatca tgggctattc catacgcacc atagactata ggtatactgt gtgggttggc 1920 ttcaatcctg atgaatttct agctaacttt tctgacatcc atgcagggga actgtatttt 1980 gtggattctg acccattgca ggatcacaat atgtataatg attcccaagg tggagatctt 2040 ttccagttgt tgatgccttg actcgagatc cagacatgat aagatacatt gatgagtttg 2100 gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 2160 ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 2220 attttatgtt tcaggttcag ggggaggtgt gggaggtttt ttaaagcatg ctggggagag 2280 atcgatctga ggaaccccta gtgatggagt tggccactcc ctctctgcgc gctcgctcgc 2340 tcactgaggc cgggcgacca aaggtcgccc gacgcccggg ctttgcccgg gcggcctcag 2400 tgagcgagcg agcgcgcaga gagggagtgg cc 2432 <210> 71 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 71 ggaggggtgg agtcgtgacg tgaattacgt catagggtta gggagg 46 <210> 72 <211> 191 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 72 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180 ggttagggag g 191 <210> 73 <211> 152 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 73 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggggag gggtggagtc 120 gtgacgtgaa ttacgtcata gggttaggga gg 152 <210> 74 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 74 gtagataagt agcatggcgg gttaatcatt aactacaagg aacccctagt gatggagttg 60 gccactccct ctctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt 120 cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc 180 aa 182 <210> 75 <211> 2117 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 75 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 60 aaaatcaacg ggactttcca aaatgtcgta ataaccccgc cccgttgacg caaatgggcg 120 gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac cgtgccacca 180 tgccgccacc ccggaccggc cgaggccttc tctggctggg tctggttctg agctccgtct 240 gcgtcgccct cggatccgaa acgcaggcca actcgaccac agatgctctg aacgttcttc 300 tcatcatcgt ggatgacctg cgcccctccc tgggctgtta tggggataag ctggtgaggt 360 ccccaaatat tgaccaactg gcatcccaca gcctcctctt ccagaatgcc tttgcgcagc 420 aagcagtgtg cgccccgagc cgcgtttctt tcctcactgg caggagacct gacaccaccc 480 gcctgtacga cttcaactcc tactggaggg tgcacgctgg aaacttctcc accatccccc 540 agtacttcaa ggagaatggc tatgtgacca tgtcggtggg aaaagtcttt caccctggga 600 tatcttctaa ccataccgat gattctccgt atagctggtc ttttccacct tatcatcctt 660 cctctgagaa gtatgaaaac actaagacat gtcgagggcc agatggagaa ctccatgcca 720 acctgctttg ccctgtggat gtgctggatg ttcccgaggg caccttgcct gacaaacaga 780 gcactgagca agccatacag ttgttggaaa agatgaaaac gtcagccagt cctttcttcc 840 tggccgttgg gtatcataag ccacacatcc ccttcagata ccccaaggta agggtttaag 900 ggatggttgg ttggtggggt attaatgttt aattacctgg agcacctgcc tgaaatcact 960 ttttttcagg aatttcagaa gttgtatccc ttggagaaca tcaccctggc ccccgatccc 1020 gaggtccctg atggcctacc ccctgtggcc tacaacccct ggatggacat caggcaacgg 1080 gaagacgtcc aagccttaaa catcagtgtg ccgtatggtc caattcctgt ggactttcag 1140 cggaaaatcc gccagagcta ctttgcctct gtgtcatatt tggatacaca ggtcggccgc 1200 ctcttgagtg ctttggacga tcttcagctg gccaacagca ccatcattgc atttacctcg 1260 gatcatgggt gggctctagg tgaacatgga gaatgggcca aatacagcaa ttttgatgtt 1320 gctacccatg ttcccctgat attctatgtt cctggaagga cggcttcact tccggaggca 1380 ggcgagaagc ttttccctta cctcgaccct tttgattccg cctcacagtt gatggagcca 1440 ggcaggcaat ccatggacct tgtggaactt gtgtctcttt ttcccacgct ggctggactt 1500 gcaggactgc aggttccacc tcgctgcccc gttccttcat ttcacgttga gctgtgcaga 1560 gaaggcaaga accttctgaa gcattttcga ttccgtgact tggaagagga tccgtacctc 1620 cctggtaatc cccgtgaact gattgcctat agccagtatc cccggccttc agacatccct 1680 cagtggaatt ctgacaagcc gagtttaaaa gatataaaga tcatgggcta ttccatacgc 1740 accatagact ataggtatac tgtgtgggtt ggcttcaatc ctgatgaatt tctagctaac 1800 ttttctgaca tccatgcagg ggaactgtat tttgtggatt ctgacccatt gcaggatcac 1860 aatatgtata atgattccca aggtggagat cttttccagt tgttgatgcc ttgactcgag 1920 atccagacat gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa 1980 aaaaatgctt tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct 2040 gcaataaaca agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg 2100 tgtgggaggt tttttaa 2117 <210> 76 <211> 2487 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 76 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggggag gggtggagtc 120 gtgacgtgaa ttacgtcata gggttaggga ggtcctgcat atgcggccgc aactcacggg 180 gatttccaag tctccacccc attgacgtca atgggagttt gttttggcac caaaatcaac 240 gggactttcc aaaatgtcgt aataaccccg ccccgttgac gcaaatgggc ggtaggcgtg 300 tacggtggga ggtctatata agcagagctc gtttagtgaa ccgtgccacc atgccgccac 360 cccggaccgg ccgaggcctt ctctggctgg gtctggttct gagctccgtc tgcgtcgccc 420 tcggatccga aacgcaggcc aactcgacca cagatgctct gaacgttctt ctcatcatcg 480 tggatgacct gcgcccctcc ctgggctgtt atggggataa gctggtgagg tccccaaata 540 ttgaccaact ggcatcccac agcctcctct tccagaatgc ctttgcgcag caagcagtgt 600 gcgccccgag ccgcgtttct ttcctcactg gcaggagacc tgacaccacc cgcctgtacg 660 acttcaactc ctactggagg gtgcacgctg gaaacttctc caccatcccc cagtacttca 720 aggagaatgg ctatgtgacc atgtcggtgg gaaaagtctt tcaccctggg atatcttcta 780 accataccga tgattctccg tatagctggt cttttccacc ttatcatcct tcctctgaga 840 agtatgaaaa cactaagaca tgtcgagggc cagatggaga actccatgcc aacctgcttt 900 gccctgtgga tgtgctggat gttcccgagg gcaccttgcc tgacaaacag agcactgagc 960 aagccataca gttgttggaa aagatgaaaa cgtcagccag tcctttcttc ctggccgttg 1020 ggtatcataa gccacacatc cccttcagat accccaaggt aagggtttaa gggatggttg 1080 gttggtgggg tattaatgtt taattacctg gagcacctgc ctgaaatcac tttttttcag 1140 gaatttcaga agttgtatcc cttggagaac atcaccctgg cccccgatcc cgaggtccct 1200 gatggcctac cccctgtggc ctacaacccc tggatggaca tcaggcaacg ggaagacgtc 1260 caagccttaa acatcagtgt gccgtatggt ccaattcctg tggactttca gcggaaaatc 1320 cgccagagct actttgcctc tgtgtcatat ttggatacac aggtcggccg cctcttgagt 1380 gctttggacg atcttcagct ggccaacagc accatcattg catttacctc ggatcatggg 1440 tgggctctag gtgaacatgg agaatgggcc aaatacagca attttgatgt tgctacccat 1500 gttcccctga tattctatgt tcctggaagg acggcttcac ttccggaggc aggcgagaag 1560 cttttccctt acctcgaccc ttttgattcc gcctcacagt tgatggagcc aggcaggcaa 1620 tccatggacc ttgtggaact tgtgtctctt tttcccacgc tggctggact tgcaggactg 1680 caggttccac ctcgctgccc cgttccttca tttcacgttg agctgtgcag agaaggcaag 1740 aaccttctga agcattttcg attccgtgac ttggaagagg atccgtacct ccctggtaat 1800 ccccgtgaac tgattgccta tagccagtat ccccggcctt cagacatccc tcagtggaat 1860 tctgacaagc cgagtttaaa agatataaag atcatgggct attccatacg caccatagac 1920 tataggtata ctgtgtgggt tggcttcaat cctgatgaat ttctagctaa cttttctgac 1980 atccatgcag gggaactgta ttttgtggat tctgacccat tgcaggatca caatatgtat 2040 aatgattccc aaggtggaga tcttttccag ttgttgatgc cttgactcga gatccagaca 2100 tgataagata cattgatgag tttggacaaa ccacaactag aatgcagtga aaaaaatgct 2160 ttatttgtga aatttgtgat gctattgctt tatttgtaac cattataagc tgcaataaac 2220 aagttaacaa caacaattgc attcatttta tgtttcaggt tcagggggag gtgtgggagg 2280 ttttttaacc tgcaggtcta gatacgtaga taagtagcat ggcgggttaa tcattaacta 2340 caaggaaccc ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga 2400 ggccgggcga ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct cagtgagcga 2460 gcgagcgcgc agagagggag tggccaa 2487 <210> 77 <211> 2117 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 77 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 60 aaaatcaacg ggactttcca aaatgtcgta ataaccccgc cccgttgacg caaatgggcg 120 gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac cgtgccacca 180 tgccgccacc ccggaccggc cgaggccttc tctggctggg tctggttctg agctccgtct 240 gcgtcgccct cggatccgaa acgcaggcca actcgaccac agatgctctg aacgttcttc 300 tcatcatcgt ggatgacctg cgcccctccc tgggctgtta tggggataag ctggtgaggt 360 ccccaaatat tgaccaactg gcatcccaca gcctcctctt ccagaatgcc tttgcgcagc 420 aagcagtgtg cgccccgagc cgcgtttctt tcctcactgg caggagacct gacaccaccc 480 gcctgtacga cttcaactcc tactggaggg tgcacgctgg aaacttctcc accatccccc 540 agtacttcaa ggagaatggc tatgtgacca tgtcggtggg aaaagtcttt caccctggga 600 tatcttctaa ccataccgat gattctccgt atagctggtc ttttccacct tatcatcctt 660 cctctgagaa gtatgaaaac actaagacat gtcgagggcc agatggagaa ctccatgcca 720 acctgctttg ccctgtggat gtgctggatg ttcccgaggg caccttgcct gacaaacaga 780 gcactgagca agccatacag ttgttggaaa agatgaaaac gtcagccagt cctttcttcc 840 tggccgttgg gtatcataag ccacacatcc ccttcagata ccccaaggta agggtttaag 900 ggatggttgg ttggtggggt attaatgttt aattacctgg agcacctgcc tgaaatcact 960 ttttttcagg aatttcagaa gttgtatccc ttggagaaca tcaccctggc ccccgatccc 1020 gaggtccctg atggcctacc ccctgtggcc tacaacccct ggatggacat caggcaacgg 1080 gaagacgtcc aagccttaaa catcagtgtg ccgtatggtc caattcctgt ggactttcag 1140 cggaaaatcc gccagagcta ctttgcctct gtgtcatatt tggatacaca ggtcggccgc 1200 ctcttgagtg ctttggacga tcttcagctg gccaacagca ccatcattgc atttacctcg 1260 gatcatgggt gggctctagg tgaacatgga gaatgggcca aatacagcaa ttttgatgtt 1320 gctacccatg ttcccctgat attctatgtt cctggaagga cggcttcact tccggaggca 1380 ggcgagaagc ttttccctta cctcgaccct tttgattccg cctcacagtt gatggagcca 1440 ggcaggcaat ccatggacct tgtggaactt gtgtctcttt ttcccacgct ggctggactt 1500 gcaggactgc aggttccacc tcgctgcccc gttccttcat ttcacgttga gctgtgcaga 1560 gaaggcaaga accttctgaa gcattttcga ttccgtgact tggaagagga tccgtacctc 1620 cctggtaatc cccgtgaact gattgcctat agccagtatc cccggccttc agacatccct 1680 cagtggaatt ctgacaagcc gagtttaaaa gatataaaga tcatgggcta ttccatacgc 1740 accatagact ataggtatac tgtgtgggtt ggcttcaatc ctgatgaatt tctagctaac 1800 ttttctgaca tccatgcagg ggaactgtat tttgtggatt ctgacccatt gcaggatcac 1860 aatatgtata atgattccca aggtggagat cttttccagt tgttgatgcc ttgactcgag 1920 atccagacat gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa 1980 aaaaatgctt tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct 2040 gcaataaaca agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg 2100 tgtgggaggt tttttaa 2117 <210> 78 <211> 2526 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 78 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180 ggttagggag gtcctgcata tgcggccgca actcacgggg atttccaagt ctccacccca 240 ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg ggactttcca aaatgtcgta 300 ataaccccgc cccgttgacg caaatgggcg gtaggcgtgt acggtgggag gtctatataa 360 gcagagctcg tttagtgaac cgtgccacca tgccgccacc ccggaccggc cgaggccttc 420 tctggctggg tctggttctg agctccgtct gcgtcgccct cggatccgaa acgcaggcca 480 actcgaccac agatgctctg aacgttcttc tcatcatcgt ggatgacctg cgcccctccc 540 tgggctgtta tggggataag ctggtgaggt ccccaaatat tgaccaactg gcatcccaca 600 gcctcctctt ccagaatgcc tttgcgcagc aagcagtgtg cgccccgagc cgcgtttctt 660 tcctcactgg caggagacct gacaccaccc gcctgtacga cttcaactcc tactggaggg 720 tgcacgctgg aaacttctcc accatccccc agtacttcaa ggagaatggc tatgtgacca 780 tgtcggtggg aaaagtcttt caccctggga tatcttctaa ccataccgat gattctccgt 840 atagctggtc ttttccacct tatcatcctt cctctgagaa gtatgaaaac actaagacat 900 gtcgagggcc agatggagaa ctccatgcca acctgctttg ccctgtggat gtgctggatg 960 ttcccgaggg caccttgcct gacaaacaga gcactgagca agccatacag ttgttggaaa 1020 agatgaaaac gtcagccagt cctttcttcc tggccgttgg gtatcataag ccacacatcc 1080 ccttcagata ccccaaggta agggtttaag ggatggttgg ttggtggggt attaatgttt 1140 aattacctgg agcacctgcc tgaaatcact ttttttcagg aatttcagaa gttgtatccc 1200 ttggagaaca tcaccctggc ccccgatccc gaggtccctg atggcctacc ccctgtggcc 1260 tacaacccct ggatggacat caggcaacgg gaagacgtcc aagccttaaa catcagtgtg 1320 ccgtatggtc caattcctgt ggactttcag cggaaaatcc gccagagcta ctttgcctct 1380 gtgtcatatt tggatacaca ggtcggccgc ctcttgagtg ctttggacga tcttcagctg 1440 gccaacagca ccatcattgc atttacctcg gatcatgggt gggctctagg tgaacatgga 1500 gaatgggcca aatacagcaa ttttgatgtt gctacccatg ttcccctgat attctatgtt 1560 cctggaagga cggcttcact tccggaggca ggcgagaagc ttttccctta cctcgaccct 1620 tttgattccg cctcacagtt gatggagcca ggcaggcaat ccatggacct tgtggaactt 1680 gtgtctcttt ttcccacgct ggctggactt gcaggactgc aggttccacc tcgctgcccc 1740 gttccttcat ttcacgttga gctgtgcaga gaaggcaaga accttctgaa gcattttcga 1800 ttccgtgact tggaagagga tccgtacctc cctggtaatc cccgtgaact gattgcctat 1860 agccagtatc cccggccttc agacatccct cagtggaatt ctgacaagcc gagtttaaaa 1920 gatataaaga tcatgggcta ttccatacgc accatagact ataggtatac tgtgtgggtt 1980 ggcttcaatc ctgatgaatt tctagctaac ttttctgaca tccatgcagg ggaactgtat 2040 tttgtggatt ctgacccatt gcaggatcac aatatgtata atgattccca aggtggagat 2100 cttttccagt tgttgatgcc ttgactcgag atccagacat gataagatac attgatgagt 2160 ttggacaaac cacaactaga atgcagtgaa aaaaatgctt tatttgtgaa atttgtgatg 2220 ctattgcttt atttgtaacc attataagct gcaataaaca agttaacaac aacaattgca 2280 ttcattttat gtttcaggtt cagggggagg tgtgggaggt tttttaacct gcaggtctag 2340 atacgtagat aagtagcatg gcgggttaat cattaactac aaggaacccc tagtgatgga 2400 gttggccact ccctctctgc gcgctcgctc gctcactgag gccgggcgac caaaggtcgc 2460 ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgca gagagggagt 2520 ggccaa 2526

Claims

재조합 아데노-연관 바이러스(rAAV)로서,
(a) AAV 캡시드 단백질을 포함하는 AAV 캡시드; 및
(b) 인트론을 포함하는 이두로네이트-2-설파타제(IDS) 인트론-삽입 암호화 서열에 작동가능하게 연결된 전사 조절 요소를 포함하는 rAAV 게놈을 포함하는, rAAV.
1. 제1항에 있어서, 상기 IDS 인트론-삽입 암호화 서열은 인간 IDS 단백질을 암호화하는, rAAV.
제1항 또는 제2항에 있어서, 상기 IDS 인트론-삽입 암호화 서열은 서열번호 23에 제시된 아미노산 서열을 암호화하는, rAAV.
제1항 내지 제3항 중 어느 한 항에 있어서, 상기 인트론은 이종 인트론인, rAAV.
제1항 내지 제4항 중 어느 한 항에 있어서, 상기 인트론은 서열번호 33에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 갖는, rAAV.
제1항 내지 제5항 중 어느 한 항에 있어서, 상기 인트론은 서열번호 24에 제시된 상기 IDS 암호화 서열의 708 및 709 위치에 상응하는 상기 IDS 인트론 삽입 암호화 서열의 뉴클레오티드 사이에 위치하는, rAAV.
제1항 내지 제6항 중 어느 한 항에 있어서, 상기 IDS 인트론-삽입 암호화 서열은 서열번호 25, 59 또는 60에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는, rAAV.
제1항 내지 제5항 중 어느 한 항에 있어서, 상기 인트론은 서열번호 26에 제시된 상기 IDS 암호화 서열의 580 및 581 위치에 상응하는 상기 IDS 인트론-삽입 암호화 서열의 뉴클레오티드 사이에 위치하는, rAAV.
제8항에 있어서, 상기 IDS 인트론-삽입 암호화 서열은 서열번호 27에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는, rAAV.
제1항 내지 제5항 중 어느 한 항에 있어서, 상기 IDS 인트론-삽입 암호화 서열은 서열번호 25, 27, 59 또는 60에 제시된 뉴클레오티드 서열을 포함하는, rAAV.
제1항 내지 제10항 중 어느 한 항에 있어서, 상기 전사 조절 요소는 거대세포바이러스(CMV) 인핸서 요소, 거대세포바이러스(CMV) 프로모터, 닭-β-액틴(CBA) 프로모터, 작은 닭-β-액틴(SmCBA) 프로모터, 글리세르알데히드 3-포스페이트 탈수소효소(GAPDH) 프로모터, 베타-글루쿠로니다아제(GUSB) 프로모터, 변형된 인간 EF-1 프로모터, CALM1 프로모터, 합성 프로모터, 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된 하나 이상의 요소를 포함하는, rAAV.
제1항 내지 제11항 중 어느 한 항에 있어서, 상기 전사 조절 요소는 서열번호 29, 30, 36, 39, 40, 41, 42, 44, 46, 47, 48, 또는 55에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는, rAAV.
제1항 내지 제12항 중 어느 한 항에 있어서, 상기 전사 조절 요소는 서열번호 29에 제시된 뉴클레오티드 서열을 포함하는, rAAV.
제1항 내지 제13항 중 어느 한 항에 있어서, 상기 rAAV 게놈은 상기 IDS 인트론-삽입 암호화 서열의 3'에 폴리아데닐화 서열을 추가로 포함하는, rAAV.
제14항에 있어서, 상기 폴리아데닐화 서열은 외인성 폴리아데닐화 서열인, rAAV.
제15항에 있어서, 상기 외인성 폴리아데닐화 서열은 SV40 폴리아데닐화 서열인, rAAV.
제16항에 있어서, 상기 SV40 폴리아데닐화 서열은 서열번호 34, 35, 또는 45에 제시된 뉴클레오티드 서열을 포함하는, rAAV.
제1항 내지 제17항 중 어느 한 항에 있어서, 상기 rAAV 게놈은 서열번호 37, 43, 52, 54, 61, 63, 65, 69, 75, 또는 77에 제시된 뉴클레오티드 서열을 포함하는, rAAV.
제1항 내지 제18항 중 어느 한 항에 있어서, 상기 rAAV 게놈은 5' 역위 말단 반복(5' ITR) 뉴클레오티드 서열 및 3' 역위 말단 반복(3' ITR) 뉴클레오티드 서열을 추가로 포함하는, rAAV.
제19항에 있어서, 상기 5' ITR 뉴클레오티드 서열은 서열번호 18, 20 또는 49에 대해 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 갖고/갖거나, 상기 3' ITR 뉴클레오티드 서열은 서열번호 14, 19, 21 또는 51에 대해 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 갖는, rAAV.
제19항에 있어서,
(a) 상기 5' ITR 뉴클레오티드 서열은 서열번호 18에 대해 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 가지고, 상기 3' ITR 뉴클레오티드 서열은 서열번호 14에 대해 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 가지거나;
(b) 상기 5' ITR 뉴클레오티드 서열은 서열번호 18에 대해 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 가지고, 상기 3' ITR 뉴클레오티드 서열은 서열번호 19에 대해 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 가지거나;
(c) 상기 5' ITR 뉴클레오티드 서열은 서열번호 18에 대해 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 가지고, 상기 3' ITR 뉴클레오티드 서열은 서열번호 51에 대해 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 가지거나;
(d) 상기 5' ITR 뉴클레오티드 서열은 서열번호 49에 대해 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 가지고, 상기 3' ITR 뉴클레오티드 서열은 서열번호 14에 대해 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 가지거나;
(d) 상기 5' ITR 뉴클레오티드 서열은 서열번호 49에 대해 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 가지고, 상기 3' ITR 뉴클레오티드 서열은 서열번호 19에 대해 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 가지거나;
(f) 상기 5' ITR 뉴클레오티드 서열은 서열번호 49에 대해 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 가지고, 상기 3' ITR 뉴클레오티드 서열은 서열번호 51에 대해 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 가지거나; 또는
(g) 상기 5' ITR 뉴클레오티드 서열은 서열번호 20에 대해 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 가지고, 상기 3' ITR 뉴클레오티드 서열은 서열번호 21에 대해 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 가지는, rAAV.
제19항에 있어서, 상기 5' ITR 뉴클레오티드 서열 및 상기 3' ITR 뉴클레오티드는 각각 서열번호 18 및 14; 18 및 19; 18 및 51; 49 및 14; 49 및 19; 49 및 51; 또는 20 및 21의 서열을 포함하는. rAAV.
제1항 내지 제22항 중 어느 한 항에 있어서, 상기 rAAV 게놈은 서열번호 28, 38, 50, 53, 56, 57, 58, 62, 64, 66, 70, 71, 72, 73, 또는 74에 제시된 뉴클레오티드 서열을 포함하는, rAAV.
제23항에 있어서, 상기 rAAV 게놈은 서열번호 72 및 74; 72 및 28; 73 및 74; 또는 73 및 28에 제시된 뉴클레오티드 서열을 포함하는, rAAV.
제1항 내지 제18항 중 어느 한 항에 있어서, 상기 rAAV 게놈은 자가-상보성인, rAAV.
제25항에 있어서, 상기 rAAV 게놈은 서열번호 38, 50, 62, 64, 66, 70, 76, 또는 78에 제시된 뉴클레오티드 서열을 포함하는, rAAV.
제1항 내지 제18항 중 어느 한 항에 있어서, 상기 rAAV 게놈은 단일 가닥인, rAAV.
제27항에 있어서, 상기 rAAV 게놈은 서열번호 53, 또는 58에 제시된 뉴클레오티드 서열을 포함하는, rAAV.
제1항 내지 제28항 중 어느 한 항에 있어서, 상기 AAV 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는, rAAV.
제29항에 있어서, 상기 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 내의 아미노산이 C이거나; 상기 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 내의 아미노산이 H이거나; 상기 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 내의 아미노산이 Q이거나; 상기 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 내의 아미노산이 A이거나; 상기 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 내의 아미노산이 N이거나; 상기 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 내의 아미노산이 S이거나; 상기 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 내의 아미노산이 I이거나; 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 상기 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 상기 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내의 아미노산이 G 또는 Y이거나; 상기 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 내의 아미노산이 M이거나; 상기 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 상기 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 내의 아미노산이 K이거나; 상기 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 내의 아미노산이 C이거나; 또는 상기 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 내의 아미노산은 G인, rAAV.
제30항에 있어서,
(a) 상기 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내의 아미노산은 G이고, 상기 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 내의 아미노산은 G이거나;
(b) 상기 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 내의 아미노산은 H이고, 상기 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 내의 아미노산은 N이고, 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산은 R이고, 상기 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 내의 아미노산은 M이거나;
(c) 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산은 R이고, 상기 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 내의 아미노산은 R이거나;
(d) 상기 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 내의 아미노산은 A이고, 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산은 R이거나; 또는
(e) 상기 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 내의 아미노산은 I이고, 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산은 R이고, 상기 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 내의 아미노산은 C인, rAAV.
제29항에 있어서, 상기 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산 서열을 포함하는, rAAV.
제1항 내지 제32항 중 어느 한 항에 있어서, 상기 AAV 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는, rAAV.
제33항에 있어서, 상기 서열번호 16의 아미노산 151에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 상기 서열번호 16의 아미노산 160에 상응하는 캡시드 단백질 내의 아미노산이 D이거나; 상기 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 내의 아미노산이 C이거나; 상기 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 내의 아미노산이 H이거나; 상기 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 내의 아미노산이 Q이거나; 상기 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 내의 아미노산이 A이거나; 상기 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 내의 아미노산이 N이거나; 상기 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 내의 아미노산이 S이거나; 상기 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 내의 아미노산이 I이거나; 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 상기 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 상기 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내의 아미노산이 G 또는 Y이거나; 상기 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 내의 아미노산이 M이거나; 상기 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 상기 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 내의 아미노산이 K이거나; 상기 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 내의 아미노산이 C이거나; 상기 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 내의 아미노산이 G인, rAAV.
제34항에 있어서,
(a) 상기 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내의 아미노산은 G이고, 상기 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 내의 아미노산은 G이거나;
(b) 상기 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 내의 아미노산은 H이고, 상기 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 내의 아미노산은 N이고, 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산은 R이고, 상기 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 내의 아미노산은 M이거나;
(c) 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산은 R이고, 상기 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 내의 아미노산은 R이거나;
(d) 상기 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 내의 아미노산은 A이고, 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산은 R이거나; 또는
(e) 상기 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 내의 아미노산은 I이고, 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산은 R이고, 상기 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 내의 아미노산은 C인, rAAV.
제33항에 있어서, 상기 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열을 포함하는, rAAV.
제1항 내지 제36항 중 어느 한 항에 있어서, 상기 AAV 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는, rAAV.
제37항에 있어서, 상기 서열번호 16의 아미노산 2에 상응하는 캡시드 단백질 내의 아미노산이 C이거나; 상기 서열번호 16의 아미노산 65에 상응하는 캡시드 단백질 내의 아미노산이 I이거나; 상기 서열번호 16의 아미노산 68에 상응하는 캡시드 단백질 내의 아미노산이 V이거나; 상기 서열번호 16의 아미노산 77에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 상기 서열번호 16의 아미노산 119에 상응하는 캡시드 단백질 내의 아미노산이 L이거나; 상기 서열번호 16의 아미노산 151에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 상기 서열번호 16의 아미노산 160에 상응하는 캡시드 단백질 내의 아미노산이 D이거나; 상기 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 내의 아미노산이 C이거나; 상기 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 내의 아미노산이 H이거나; 상기 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 내의 아미노산이 Q이거나; 상기 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 내의 아미노산이 A이거나; 상기 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 내의 아미노산이 N이거나; 상기 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 내의 아미노산이 S이거나; 상기 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 내의 아미노산이 I이거나; 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 상기 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 상기 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내의 아미노산이 G 또는 Y이거나; 상기 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 내의 아미노산이 M이거나; 상기 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 상기 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 내의 아미노산이 K이거나; 상기 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 내의 아미노산이 C이거나; 상기 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 내의 아미노산이 G인, rAAV.
제38항에 있어서,
(a) 상기 서열번호 16의 아미노산 2에 상응하는 캡시드 단백질 내의 아미노산이 T이고, 상기 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 내의 아미노산이 Q이거나;
(b) 상기 서열번호 16의 아미노산 65에 상응하는 캡시드 단백질 내의 아미노산이 I이고, 상기 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내의 아미노산이 Y이거나;
(c) 상기 서열번호 16의 아미노산 77에 상응하는 캡시드 단백질 내의 아미노산이 R이고, 상기 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 내의 아미노산이 K이거나;
(d) 상기 서열번호 16의 아미노산 119에 상응하는 캡시드 단백질 내의 아미노산이 L이고, 상기 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 내의 아미노산이 S이거나;
(e) 상기 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내의 아미노산이 G이고, 상기 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 내의 아미노산이 G이거나;
(f) 상기 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 내의 아미노산이 H이고, 상기 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 내의 아미노산이 N이고, 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이고, 상기 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 내의 아미노산이 M이거나;
(g) 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이고, 상기 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 내의 아미노산이 R이거나;
(h) 상기 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 내의 아미노산이 A이고, 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 또는
(i) 상기 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 내의 아미노산이 I이고, 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이고, 상기 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 내의 아미노산은 C인, rAAV.
제37항에 있어서, 상기 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열을 포함하는, rAAV.
세포를 제1항 내지 제40항 중 어느 한 항의 재조합 아데노-연관 바이러스(rAAV)로 형질도입하는 단계를 포함하는, 세포에서 이두로네이트-2-설파타제(IDS) 폴리펩티드를 발현시키는 방법.
제41항에 있어서, 상기 세포는 중추 신경계의 세포인, 방법.
제41항에 있어서, 상기 세포는 척수, 운동 피질, 감각 피질, 해마, 피각, 소뇌, 선택적으로 소뇌 핵, 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된 중추 신경계 영역의 세포인, 방법.
제41항에 있어서, 상기 세포는 뉴런 또는 신경교세포이되, 선택적으로 상기 세포는 상기 중추 신경계 또는 상기 말초 신경계의 뉴런 또는 신경교세포인, 방법.
제41항에 있어서, 상기 세포는 운동 뉴런, 성상교세포, 희소돌기교세포, 중추 신경계의 대뇌 피질의 세포, 말초 신경계의 감각 뉴런, 슈반 세포, 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는, 방법.
제41항에 있어서, 상기 세포는 간, 심장, 폐, 신장, 또는 비장의 세포인, 방법.
제41항 내지 제46항 중 어느 한 항에 있어서, 상기 세포는 포유류 대상체에 존재하고, 상기 rAAV는 상기 대상체에서 상기 세포를 형질도입하기에 효과적인 양으로 상기 대상체에게 투여되는, 방법.
제1항 내지 제40항 중 어느 한 항의 rAAV를 포함하는 약학적 조성물.
제1항 내지 제40항 중 어느 한 항의 rAAV 또는 제48항의 약학적 조성물의 유효량을 대상체에게 투여하는 단계를 포함하는 헌터 증후군(HS)을 앓고 있는 대상체를 치료하는 방법.
제49항에 있어서, 상기 rAAV 또는 약학적 조성물은 정맥내 투여되는, 방법.
제49항 또는 제50항에 있어서, 헌터 증후군(HS)은 이두로네이트-2-설파타제(IDS) 유전자 돌연변이와 연관된, 방법.
제49항 내지 제51항 중 어느 한 항에 있어서, 상기 대상체는 인간 대상체인, 방법.
rAAV의 제조를 위한 패키징 시스템으로서, 상기 패키징 시스템은,
(a) 하나 이상의 AAV Rep 단백질을 암호화하는 제1 뉴클레오티드 서열;
(b) 제1항 내지 제40항 중 어느 한 항의 rAAV의 캡시드 단백질을 암호화하는 제2 뉴클레오티드 서열; 및
(c) 제1항 내지 제40항 중 어느 한 항의 rAAV의 rAAV 게놈 서열을 포함하는 제3 뉴클레오티드 서열을 포함하는, 패키징 시스템.
제53항에 있어서, 상기 패키징 시스템은 상기 제1 뉴클레오티드 서열 및 상기 제2 뉴클레오티드 서열을 포함하는 제1 벡터, 및 상기 제3 뉴클레오티드 서열을 포함하는 제2 벡터를 포함하는, 패키징 시스템.
제53항 또는 제54항에 있어서, 하나 이상의 헬퍼 바이러스 유전자를 포함하는 제4 뉴클레오티드 서열을 추가로 포함하는, 패키징 시스템.
제55항에 있어서, 상기 제4 뉴클레오티드 서열은 제3 벡터 내에 포함되는, 패키징 시스템.
제55항 또는 제56항에 있어서, 상기 제4 뉴클레오티드 서열은 아데노바이러스, 포진 바이러스, 우두 바이러스, 및 거대세포바이러스(CMV)로 이루어진 군으로부터 선택된 바이러스로부터의 하나 이상의 유전자를 포함하는, 패키징 시스템.
제53항 내지 제57항 중 어느 한 항에 있어서, 상기 제1 벡터, 제2 벡터, 및/또는 상기 제3 벡터는 플라스미드인, 패키징 시스템.
상기 rAAV가 생성되는 조건 하에서 제53항 내지 제58항 중 어느 한 항의 패키징 시스템을 세포 내에 도입하는 단계를 포함하는 rAAV의 재조합 제조 방법.
서열번호 25, 26, 27, 37, 38, 43, 50, 52, 53, 54, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 75, 76, 77, 또는 78에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 갖는 핵산 서열을 포함하는 폴리뉴클레오티드로서, 선택적으로 상기 폴리뉴클레오티드는 바이러스 벡터 또는 플라스미드 벡터 내에 포함되는, 폴리뉴클레오티드.
제60항의 폴리뉴클레오티드를 포함하는 재조합 세포.
제1항 내지 제40항 중 어느 한 항의 rAAV, 제48항의 약학적 조성물, 제60항의 폴리뉴클레오티드 또는 제61항의 재조합 세포의 의약으로서 용도.
제1항 내지 제40항 중 어느 한 항의 rAAV, 제48항의 약학적 조성물, 제60항의 폴리뉴클레오티드 또는 제61항의 재조합 세포의 헌터 증후군(HS)의 치료에서의 용도.
제1항 내지 제40항 중 어느 한 항의 rAAV, 제48항의 약학적 조성물, 제60항의 폴리뉴클레오티드 또는 제61항의 재조합 세포의 헌터 증후군(HS)을 갖는 대상체를 치료하는 방법에서의 용도로서, 상기 방법은 상기 rAAV, 상기 약학적 조성물, 상기 폴리뉴클레오티드, 또는 상기 세포의 유효량을 상기 대상체에게 투여하는 단계를 포함하는 것인, 용도.