KR20210006327A - 캡시드 탈아미드화가 감소된 신규 아데노-연관 바이러스(aav) 벡터 및 이의 용도 - Google Patents

캡시드 탈아미드화가 감소된 신규 아데노-연관 바이러스(aav) 벡터 및 이의 용도 Download PDF

Info

Publication number
KR20210006327A
KR20210006327A KR1020207027462A KR20207027462A KR20210006327A KR 20210006327 A KR20210006327 A KR 20210006327A KR 1020207027462 A KR1020207027462 A KR 1020207027462A KR 20207027462 A KR20207027462 A KR 20207027462A KR 20210006327 A KR20210006327 A KR 20210006327A
Authority
KR
South Korea
Prior art keywords
seq
protein
hsa
mir
capsid
Prior art date
Application number
KR1020207027462A
Other languages
English (en)
Inventor
제임스 엠. 윌슨
에이프릴 테페
케빈 터너
조슈아 조이너 심스
치앙 왕
Original Assignee
더 트러스티스 오브 더 유니버시티 오브 펜실베니아
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 더 트러스티스 오브 더 유니버시티 오브 펜실베니아 filed Critical 더 트러스티스 오브 더 유니버시티 오브 펜실베니아
Publication of KR20210006327A publication Critical patent/KR20210006327A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14121Viruses as such, e.g. new isolates, mutants or their genomic sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Virology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

vp1 단백질의 이질적 집단, vp2 단백질의 이질적 집단 및 vp3 단백질의 이질적 집단을 갖는 AAV 캡시드를 포함하는 재조합 아데노-연관 바이러스(rAAV) 벡터. 캡시드는 암호화된 VP1 아미노산 서열과 비교하여 변형된 아미노산을 함유하고, 캡시드는 아스파라긴 - 글리신 쌍에서 고도로 탈아미드화된 아스파라긴 잔기를 함유하며, 다수의 다른 덜 탈아미드화된 아스파라긴 및 임의적으로 글루타민 잔기를 추가로 포함한다.

Description

캡시드 탈아미드화가 감소된 신규 아데노-연관 바이러스(AAV) 벡터 및 이의 용도
연방 지원 연구 진술
본 발명은 미국 국립 보건원이 수여한 허가 번호 P01HL059407 하에 정부 지원으로 이루어졌다. 정부는 본 발명에 대한 특정 권리를 가지고 있다.
EFS-WEB을 통해 제출된 서열 목록 참조
2019년 2월 27일 작성되어 본 출원과 함께 EFS-Web을 통해 전자적으로 제출된 파일명 "18-8592PCT_Sequence_Listing_ST25"의 서열 목록의 내용은 전체가 본원에 참조로 포함된다.
아데노-연관 바이러스(AAV) 캡시드는 정20면체 구조이며 1:1:10 비로 60개의 바이러스 단백질(VP) 단량체(VP1, VP2, 및 VP3)로 구성된다(Xie Q, et al. Proc Natl Acad Sci USA. 2002; 99(16):10405-10). VP3 단백질 서열(~535aa) 전체는 VP1 및 VP2 둘 다의 C-말단 내에 함유되며, 공유된 VP3 서열은 주로 전반적인 캡시드 구조에 대해 책임이 있다. VP1/VP2 고유 영역의 구조적 유연성 및 어셈블리된 캡시드에서 VP3 단량체에 비해 VP1 및 VP2 단량체의 낮은 표시로 인해, VP3은 x-선 결정학을 통해 분해되는 유일한 캡시드 단백질이다(Nam HJ, et al. J Virol. 2007; 81(22):12260-71). VP3은 AAV 혈청형 사이의 서열 변이의 주요 공급원인 9 개의 초가변 영역(HVR)을 함유한다(Govindasamy L, et al. J Virol. 2013; 87(20):11187-99). 그들의 유연성 및 캡시드 표면 상의 위치를 고려하면, HVR은 주로 표적 세포 뿐만 아니라 면역계와의 상호작용에 대해 책임이 있다(Huang LY, et al. J Virol. 2016; 90(11):5219-30; Raupp C, et al. J Virol. 2012; 86(17):9396-408). 다수의 혈청형의 구조가 각각 AAV2, AAVrh.8, AAV6, AAV9, AAV3B, AAV8, 및 AAV4에 대한 구조 진입을 위해 공개되었지만(구조 생물정보학 공동 연구실(RCSB) 데이터베이스로부터의 단백질 데이터 뱅크(PDB) ID 1LP3, 4RSO, 4V86, 3UX1, 3KIC, 2QA0, 2G8G), 이들 캡시드 표면 상의 변형에 관한 문헌 정보는 거의 없다. 연구는 캡시드의 세포내 인산화가 특이적 티로신 잔기에서 발생한다는 것을 시사한다(Zhong L, et al. Virology. 2008; 381(2):194-202). 1차 VP3 서열에서 추정 글리코실화 부위에도 불구하고, AAV2에서는 글리코실화 사건이 식별되지 않았으며(Murray S, et al. J Virol. 2006; 80(12):6171-6; Jin X, et al. Hum Gene Ther Methods. 2017; 28(5):255-267); 다른 AAV 혈청형은 캡시드 글리코실화에 대해 아직 평가되지 않았다.
AAV 유전자 요법 벡터는 재조합 단백질 치료제의 개발 및 제조에 전형적으로 수반되는 분자-수준 정밀조사를 덜 받았다. AAV 캡시드 번역후 변형(PTM)은 대체로 탐구되지 않아서, 기능에 영향을 미칠 가능성, 또는 제조된 AAV 요법에서 PTM 수준을 제어하는 전략에 대해서 알려진 바가 거의 없다.
비-유전자 요법 단백질 치료제의 번역후 변형의 변이는 약물로서 개발을 복잡하게 한다. Jenkins, N, Murphy, L, and Tyther, R (2008). Post-translational modifications of recombinant proteins: significance for biopharmaceuticals. Mol Biotechnol 39: 113-118; Houde, D, Peng, Y, Berkowitz, SA, and Engen, JR (2010). Post-translational modifications differentially affect IgG1 conformation and receptor binding. Mol Cell Proteomics 9: 1716-1728. 예를 들어, 선택된 아미노산의 탈아미드화는 재조합 보호 항원-기반 탄저 백신의 안정성 및 면역 반응을 조절한다. (Powell BS, et al. Proteins. 2007; 68(2):458-79; Verma A, et al. Clin Vaccine Immunol. 2016; 23(5):396-402). 일부 경우에, 이 과정은 바이러스 또는 박테리아 데아미다제에 의해 촉매되어 숙주 세포 신호전달 경로 또는 선천적 면역 반응을 조절한다(Zhao J, et al. J Virol. 2016; 90(9):4262-8; Zhao J, et al. Cell Host Microbe. 2016; 20(6):770-84). 보다 일반적으로, 내인성 탈아미드화는 효소-독립적 자발적 과정이다. 자발적 탈아미드화의 목적이 완전히 밝혀지지는 않았지만, 이전 연구는 이 사건이 단백질의 상대적 수명을 나타내고 전환을 조절하는 분자 시계로서 역할을 한다는 것을 시사한다(Robinson NE and Robinson AB. Proc Natl Acad Sci USA. 2001; 98(3):944-9).
탈아미드화는 아스파라긴 또는 덜 빈번하게 글루타민의 아미드 기가 인접한 질소 원자로부터 친핵성 공격을 받아 아미드 기가 상실될 때 발생한다. 이 과정은 가수분해를 통해, 아스파르트산 및 이소아스파르트산(또는 글루탐산 및 이소글루탐산)의 혼합물로 분해되는(Catak S, et al. J Phys Chem A. 2009; 113(6):1111-20) 숙신이미딜 중간체를 초래한다(Yang H and Zubarev RA. Electrophoresis. 2010; 31(11):1764-72). 짧은 합성 펩티드의 연구는 이 가수분해가 이소아스파르트산 대 아스파르트산의 3:1 혼합물을 야기한다고 추정한다(Geiger T. and Clarke S. J Biol Chem. 1987; 262(2):785-94.
안정한 수용체 결합 및/또는 안정한 캡시드를 갖고, 항체 중화를 피하고/피하거나 저장 시 순도를 유지하는 이종 분자의 전달을 위한 AAV-기반 작제물을 포함하는 조성물에 대한 요구가 계속되고 있다.
일 구현예에서, 재조합 아데노-연관 바이러스(rAAV)의 혼합 집단을 포함하는 조성물이 제공되며, 상기 rAAV 각각은 하기를 포함한다: (a) 약 60 개의 캡시드 vp1 단백질, vp2 단백질 및 vp3 단백질을 포함하는 AAV 캡시드로, 여기서 vp1, vp2 및 vp3 단백질은 선택된 AAV vp1 아미노산 서열을 암호화하는 핵산 서열로부터 생성된 vp1 단백질의 이질적 집단, 선택된 AAV vp2 아미노산 서열을 암호화하는 핵산 서열로부터 생성된 vp2 단백질의 이질적 집단, 선택된 AAV vp3 아미노산 서열을 암호화하는 핵산 서열로부터 생성된 vp3 단백질의 이질적 집단이며, 여기서 vp1, vp2 및 vp3 단백질은 AAV 캡시드 내 아스파라긴 - 글리신 쌍에서 적어도 2 개의 고도로 탈아미드화된 아스파라긴(N)을 포함하는 아미노산 변형을 갖는 하위집단을 함유하고 임의적으로 다른 탈아미드화된 아미노산을 포함하는 하위집단을 추가로 포함하며, 여기서 탈아미드화는 아미노산 변화를 야기하는 것; 및 (b) AAV 캡시드 내 벡터 게놈으로, 상기 벡터 게놈은 AAV 도립된 말단 반복부 서열 및 숙주 세포에서 생성물의 발현을 지시하는 서열에 작동가능하게 연결된 생성물을 암호화하는 비-AAV 핵산 서열을 포함하는 핵산 분자를 포함하는 것.
특정 구현예에서, 탈아미드화된 아스파라긴은 아스파르트산, 이소아스파르트산, 상호전환 아스파르트산/이소아스파르트산 쌍, 또는 이의 조합으로 탈아미드화된다. 특정 구현예에서, 캡시드는 (α)-글루탐산, γ-글루탐산, 상호전환 (α)-글루탐산/γ-글루탐산 쌍, 또는 이의 조합으로 탈아미드화되는 탈아미드화된 글루타민(들)을 추가로 포함한다.
추가의 측면에서, 하기를 포함하는 재조합 아데노-연관 바이러스(rAAV)가 제공된다: (A) 하기 중 하나 이상을 포함하는 AAVrh79 캡시드: (1) 다음을 포함하는 AAVrh79 캡시드 단백질: 서열번호: 2의 1 내지 738의 예측된 아미노산 서열을 암호화하는 핵산 서열로부터 발현에 의해 생성된 vp1 단백질, 서열번호: 1로부터 생성된 vp1 단백질, 또는 서열번호: 2의 1 내지 738의 예측된 아미노산 서열을 암호화하는 서열번호: 1과 적어도 70% 동일한 핵산 서열로부터 생성된 vp1 단백질로부터 선택된 AAVrh79 vp1 단백질의 이질적 집단, 서열번호: 2의 적어도 약 아미노산 138 내지 738의 예측된 아미노산 서열을 암호화하는 핵산 서열로부터 발현에 의해 생성된 vp2 단백질, 서열번호: 1의 적어도 뉴클레오티드 412 내지 2214를 포함하는 서열로부터 생성된 vp2 단백질, 또는 서열번호: 2의 적어도 약 아미노산 138 내지 738의 예측된 아미노산 서열을 암호화하는 서열번호: 1의 적어도 뉴클레오티드 412 내지 2214와 적어도 70% 동일한 핵산 서열로부터 생성된 vp2 단백질로부터 선택된 AAVrh79 vp2 단백질의 이질적 집단, 서열번호: 2의 적어도 약 아미노산 204 내지 738의 예측된 아미노산 서열을 암호화하는 핵산 서열로부터 발현에 의해 생성된 vp3 단백질, 서열번호: 1의 적어도 뉴클레오티드 610 내지 2214를 포함하는 서열로부터 생성된 vp3 단백질, 또는 서열번호: 2의 적어도 약 아미노산 204 내지 738의 예측된 아미노산 서열을 암호화하는 서열번호: 1의 적어도 뉴클레오티드 610 내지 2214와 적어도 70% 동일한 핵산 서열로부터 생성된 vp3 단백질로부터 선택된 AAVrh79 vp3 단백질의 이질적 집단; 및/또는 (2) 서열번호: 2의 아미노산 서열을 암호화하는 핵산 서열의 생성물인 vp1 단백질의 이질적 집단, 서열번호: 2의 적어도 약 아미노산 138 내지 738의 아미노산 서열을 암호화하는 핵산 서열의 생성물인 vp2 단백질의 이질적 집단, 및 서열번호: 2의 적어도 아미노산 204 내지 738을 암호화하는 핵산 서열의 생성물인 vp3 단백질의 이질적 집단, 여기서 vp1, vp2 및 vp3 단백질은 서열번호: 2에서 아스파라긴 - 글리신 쌍에서 적어도 2 개의 고도로 탈아미드화된 아스파라긴(N)을 포함하는 아미노산 변형을 갖는 하위집단을 함유하고 임의적으로 다른 탈아미드화된 아미노산을 포함하는 하위집단을 추가로 포함하며, 여기서 탈아미드화는 아미노산 변화를 야기하는 것; 및 (B) AAVrh79 캡시드 내 벡터 게놈으로, 상기 벡터 게놈은 AAV 도립된 말단 반복부 서열 및 숙주 세포에서 생성물의 발현을 지시하는 서열에 작동가능하게 연결된 생성물을 암호화하는 비-AAV 핵산 서열을 포함하는 핵산 분자를 포함하는 것.
또 다른 측면에서, 표적 조직을 형질도입하는 방법이 제공된다. 일 구현예에서, 상기 방법은 본원에 기재된 바와 같은 AAVrh79 캡시드를 갖는 AAV를 투여하는 단계를 포함한다. 일 구현예에서, AAVrh79 캡시드를 갖는 AAV를 투여하는 단계를 포함하는, 간 조직을 형질도입하는 방법이 제공된다. 또 다른 구현예에서, AAVrh79 캡시드를 갖는 AAV를 투여하는 단계를 포함하는, 근육 조직을 형질도입하는 방법이 제공된다.
또 다른 측면에서, AAVrh79 캡시드의 탈아미드화를 감소시키는 방법이 제공된다. 일 구현예에서, 상기 방법은 변형된 AAVrh79 VP 코돈을 함유하는 핵산 서열로부터 AAVrh79 캡시드를 생성하는 단계를 포함하며, 상기 핵산 서열은 서열번호: 2에서 위치 N57, N263, N385 및/또는 N514에 위치한 아스파라긴 - 글리신 쌍 중 1 내지 4 개에서 독립적으로 변형된 글리신 코돈을 포함하여, 변형된 코돈이 글리신 이외의 아미노산을 암호화하도록 한다. 또 다른 구현예에서, 상기 방법은 변형된 AAVrh79 VP 코돈을 함유하는 핵산 서열로부터 AAVrh79 캡시드를 생성하는 단계를 포함하며, 상기 핵산 서열은 서열번호: 2의 위치 N94, N254, N305, N410, 및/또는 N479에 위치한 아스파라긴 - 글리신 쌍 중 1 내지 4개에서 독립적으로 변형된 글리신 코돈을 포함한다.
추가의 구현예에서, 하기를 포함하는 rAAV8.AR2.08이 제공된다: (A) 하기 중 하나 이상을 포함하는 AAV8.AR2.08 캡시드: (1) 다음을 포함하는 AAV8.2.08 캡시드 단백질: 서열번호: 18의 1 내지 738의 예측된 아미노산 서열을 암호화하는 핵산 서열로부터 발현에 의해 생성된 vp1 단백질, 서열번호: 17로부터 생성된 vp1 단백질, 또는 서열번호: 18의 1 내지 738의 예측된 아미노산 서열을 암호화하는 서열번호: 17과 적어도 70% 동일한 핵산 서열로부터 생성된 vp1 단백질로부터 선택된 AAV8.AR2.08 vp1 단백질의 이질적 집단, 서열번호: 18의 적어도 약 아미노산 138 내지 738의 예측된 아미노산 서열을 암호화하는 핵산 서열로부터 발현에 의해 생성된 AAV8.AR2.08 vp2 단백질, 서열번호: 17의 적어도 뉴클레오티드 411 내지 2214를 포함하는 서열로부터 생성된 vp2 단백질, 또는 서열번호: 18의 적어도 약 아미노산 138 내지 738의 예측된 아미노산 서열을 암호화하는 서열번호: 17의 적어도 뉴클레오티드 412 내지 2214와 적어도 70% 동일한 핵산 서열로부터 생성된 vp2 단백질로부터 선택된 AAV8.AR2.08 vp2 단백질의 이질적 집단, 서열번호: 18의 적어도 약 아미노산 204 내지 738의 예측된 아미노산 서열을 암호화하는 핵산 서열로부터 발현에 의해 생성된 vp3 단백질, 서열번호: 17의 적어도 뉴클레오티드 607 내지 2214를 포함하는 서열로부터 생성된 vp3 단백질, 또는 서열번호: 18의 적어도 약 아미노산 204 내지 738의 예측된 아미노산 서열을 암호화하는 서열번호: 17의 적어도 뉴클레오티드 607 내지 2214와 적어도 70% 동일한 핵산 서열로부터 생성된 vp3 단백질로부터 선택된 AAV8.AR2.08 vp3 단백질의 이질적 집단; 및/또는 (2) 서열번호: 18의 아미노산 서열을 암호화하는 핵산 서열의 생성물인 vp1 단백질의 이질적 집단, 서열번호: 18의 적어도 약 아미노산 138 내지 738의 아미노산 서열을 암호화하는 핵산 서열의 생성물인 vp2 단백질의 이질적 집단, 및 서열번호: 18의 적어도 아미노산 204 내지 738을 암호화하는 핵산 서열의 생성물인 vp3 단백질의 이질적 집단, 여기서 vp1, vp2 및 vp3 단백질은 서열번호: 18에서 아스파라긴 - 글리신 쌍에서 적어도 2 개의 고도로 탈아미드화된 아스파라긴(N)을 포함하는 아미노산 변형을 갖는 하위집단을 함유하고 임의적으로 다른 탈아미드화된 아미노산을 포함하는 하위집단을 추가로 포함하며, 여기서 탈아미드화는 아미노산 변화를 야기하는 것; 및 (B) AAV8.AR2.08 캡시드 내 벡터 게놈으로, 상기 벡터 게놈은 AAV 도립된 말단 반복부 서열 및 숙주 세포에서 생성물의 발현을 지시하는 서열에 작동가능하게 연결된 생성물을 암호화하는 비-AAV 핵산 서열을 포함하는 핵산 분자를 포함하는 것.
또 다른 측면에서, 표적 조직을 형질도입하는 방법이 제공된다. 일 구현예에서, 상기 방법은 본원에 기재된 바와 같은 AAV8.AR2.08 캡시드를 갖는 AAV를 투여하는 단계를 포함한다. 일 구현예에서, AAV8.AR2.08 캡시드를 갖는 AAV를 투여하는 단계를 포함하는, 간 조직을 형질도입하는 방법이 제공된다. 또 다른 구현예에서, AAV8.AR2.08 캡시드를 갖는 AAV를 투여하는 단계를 포함하는, 근육 조직을 형질도입하는 방법이 제공된다.
또 다른 측면에서, AAV8.AR2.08 캡시드의 탈아미드화를 감소시키는 방법이 제공된다. 일 구현예에서, 상기 방법은 변형된 AAV8.AR2.08 vp 코돈을 함유하는 핵산 서열로부터 AAV8.AR2.08 캡시드를 생성하는 단계를 포함하며, 상기 핵산 서열은 서열번호: 18에서 위치 N57, N263, N385, N514, 및/또는 N540에 위치한 아스파라긴 - 글리신 쌍 중 1 내지 4 개에서 독립적으로 변형된 글리신 코돈을 포함하여, 변형된 코돈이 글리신 이외의 아미노산을 암호화하도록 한다. 또 다른 구현예에서, 상기 방법은 변형된 AAV8.AR2.08 vp 코돈을 함유하는 핵산 서열로부터 AAV8.AR2.08 캡시드를 생성하는 단계를 포함하며, 상기 핵산 서열은 서열번호: 18의 위치 N94, N254, N305, N521, N590, Q601, N653, 및/또는 N665에 위치한 아스파라긴 - 글리신 쌍 중 1 내지 4 개에서 독립적으로 변형된 글리신 코돈을 포함한다.
특정 구현예에서, 하기를 포함하는 rAAV5.5.9가 제공된다: (A) 하기 중 하나 이상을 포함하는 AAV5.5.9 캡시드: (1) 다음을 포함하는 AAVG5 캡시드 단백질: 서열번호: 10의 1 내지 736의 예측된 아미노산 서열을 암호화하는 핵산 서열로부터 발현에 의해 생성된 vp1 단백질, 서열번호: 9로부터 생성된 vp1 단백질, 또는 서열번호: 1의 1 내지 736의 예측된 아미노산 서열을 암호화하는 서열번호: 9와 적어도 70% 동일한 핵산 서열로부터 생성된 vp1 단백질로부터 선택된 AAV5.5.9 vp1 단백질의 이질적 집단, 서열번호: 10의 적어도 약 아미노산 138 내지 736의 예측된 아미노산 서열을 암호화하는 핵산 서열로부터 발현에 의해 생성된 AAVG5 vp2 단백질, 서열번호: 9의 적어도 뉴클레오티드 412 내지 2211을 포함하는 서열로부터 생성된 vp2 단백질, 또는 서열번호: 10의 적어도 약 아미노산 138 내지 736의 예측된 아미노산 서열을 암호화하는 서열번호: 9의 적어도 뉴클레오티드 412 내지 2211과 적어도 70% 동일한 핵산 서열로부터 생성된 vp2 단백질로부터 선택된 AAV5.5.9 vp2 단백질, 서열번호: 10의 적어도 약 아미노산 203 내지 736의 예측된 아미노산 서열을 암호화하는 핵산 서열로부터 발현에 의해 생성된 AAV5.5.9 vp3 단백질, 서열번호: 9의 적어도 뉴클레오티드 607 내지 2211을 포함하는 서열로부터 생성된 vp3 단백질, 또는 서열번호: 10의 적어도 약 아미노산 203 내지 736의 예측된 아미노산 서열을 암호화하는 서열번호: 9의 적어도 뉴클레오티드 607 내지 2211과 적어도 70% 동일한 핵산 서열로부터 생성된 vp3 단백질로부터 선택된 AAV5.5.9 vp3 단백질의 이질적 집단; 및/또는 (2) 서열번호: 10의 아미노산 서열을 암호화하는 핵산 서열의 생성물인 vp1 단백질의 이질적 집단, 서열번호: 10의 적어도 약 아미노산 138 내지 736의 아미노산 서열을 암호화하는 핵산 서열의 생성물인 vp2 단백질의 이질적 집단, 및 서열번호: 10의 적어도 아미노산 203 내지 726을 암호화하는 핵산 서열의 생성물인 vp3 단백질의 이질적 집단, 여기서 vp1, vp2 및 vp3 단백질은 서열번호: 10에서 아스파라긴 - 글리신 쌍에서 적어도 2 개의 고도로 탈아미드화된 아스파라긴(N)을 포함하는 아미노산 변형을 갖는 하위집단을 함유하고 임의적으로 다른 탈아미드화된 아미노산을 포함하는 하위집단을 포함하며, 여기서 탈아미드화는 아미노산 변화를 야기하는 것; 및 (B) AAV5.5.9 캡시드 내 벡터 게놈으로, 상기 벡터 게놈은 AAV 도립된 말단 반복부 서열 및 숙주 세포에서 생성물의 발현을 지시하는 서열에 작동가능하게 연결된 생성물을 암호화하는 비-AAV 핵산 서열을 포함하는 핵산 분자를 포함하는 것.
또 다른 측면에서, 표적 조직을 형질도입하는 방법이 제공된다. 일 구현예에서, 상기 방법은 본원에 기재된 바와 같은 AAV5.5.9 캡시드를 갖는 AAV를 투여하는 단계를 포함한다. 일 구현예에서, AAV5.5.9 캡시드를 갖는 AAV를 투여하는 단계를 포함하는, 간 조직을 형질도입하는 방법이 제공된다. 또 다른 구현예에서, AAV5.5.9 캡시드를 갖는 AAV를 투여하는 단계를 포함하는, 근육 조직을 형질도입하는 방법이 제공된다.
또 다른 측면에서, AAV5.5.9 캡시드의 탈아미드화를 감소시키는 방법이 제공된다. 일 구현예에서, 상기 방법은 변형된 AAV5.5.9 vp 코돈을 함유하는 핵산 서열로부터 AAV5.5.9 캡시드를 생성하는 단계를 포함하며, 상기 핵산 서열은 서열번호: 10에서 위치 N57, N319, N442, 및/또는 N502에 위치한 아스파라긴 - 글리신 쌍 중 1 내지 4 개에서 독립적으로 변형된 글리신 코돈을 포함하여, 상기 변형된 코돈이 글리신 이외의 아미노산을 암호화하도록 한다. 또 다른 구현예에서, 상기 방법은 변형된 AAV5.5.9 vp 코돈을 함유하는 핵산 서열로부터 AAV5.5.9 캡시드를 생성하는 단계를 포함하며, 상기 핵산 서열은 서열번호: 10의 위치 N35, N113, N204, N217, N243, N249, N293/294, N304, N399/400, N505, Q589, N618, N641, N653, N658, 및/또는 N699에 위치한 아스파라긴 - 글리신 쌍 중 1 내지 4 개에서 독립적으로 변형된 글리신 코돈을 포함한다.
또 다른 측면에서, 상기 기재된 바와 같이, 재조합 AAVrh79, AAV8.AR2.08, 또는 AAV5.5.9의 혼합 집단을 포함하는 조성물이 제공된다.
또 다른 측면에서, 원하는 유전자 산물을 이를 필요로 하는 대상체에 전달하기 위한, 본원에 기재된 바와 같은 재조합 AAV(rAAV)가 제공된다.
또 다른 측면에서, 본원에 기재된 바와 같은 rAAV를 생성하는 데 유용한 rAAV 생산 시스템이 제공된다. 일 구현예에서, 상기 시스템은 (a) 서열번호: 2, 10, 또는 18의 예측된 아미노산 서열을 암호화하는 AAVrh79, AAV8.AR2.08, 또는 AAV5.5.9 캡시드 핵산 서열; (b) AAV 캡시드에 패키징하기에 적합한 핵산 분자로, 적어도 하나의 AAV 도립된 말단 반복부(ITR) 및 숙주 세포에서 생성물의 발현을 지시하는 서열에 작동가능하게 연결된 유전자 산물을 암호화하는 비-AAV 핵산 서열을 포함하는, 핵산 분자; 및 (c) 핵산 분자를 재조합 AAV 캡시드 내에 패키징하도록 하기에 충분한 AAV rep 기능 및 헬퍼 기능을 포함한다.
이들 및 본 발명의 다른 측면은 본 발명의 하기 상세한 설명으로부터 명백해질 것이다.
도 1a - 도 1g. AAV8 VP 이소형의 전기영동 분석. (도 1a) 아스파라긴 잔기가 인접한 질소 원자에 의해 친핵성 공격을 받아, 숙신이미딜 중간체를 형성하는 메커니즘을 도시하는 다이어그램. 그 다음에 이 중간체는 가수분해를 거쳐, 아스파르트산 및 이소아스파르트산의 혼합물로 분해된다. 베타 탄소는 이와 같이 표지된다. 다이어그램은 BIOVIA Draw 2018에서 생성되었다. (도 1b) 1 μg의 AAV8 벡터를 변성 1차원 SDS-PAGE 상에서 실행하였다. (도 1c) 카르보닉 안히드라제 pI 마커 스폿의 등전점이 제시되어 있다. (도 1d) 5 μg의 AAV8 벡터를 2차원 겔 전기영동으로 분석하고 쿠마시 블루(Coomassie Blue)로 염색하였다. 스폿 1-20은 카르바밀화된 카르보닉 안히드라제 pI 마커이다. 박스 영역은 다음과 같다: a=VP1, b=VP2, c=VP3, d= 내부 트로포미오신 마커(화살표: MW=33kDa의 트로포미오신 스폿, pI=5.2). 등전점 전기영동(Isoelectric focusing)을 4-8의 pI 범위로 수행하였다. 도 1e - 도 1g) 4-8의 pI 범위로 수행된 등전점 전기영동의 결과. 2D 겔 전기영동으로 분석하고 시프로 루비(Sypro Ruby)로 염색한 wtAAV8(도 1e) 또는 돌연변이체(도 1f 및 도 1g) 벡터의 1e11 GC. 단백질 표지: A=VP1; B=VP2; C=VP3, D=계란 흰자위 콘알부민 마커, E=터보뉴클레아제 마커. 등전점 전기영동을 6-10의 pI 범위로 수행하였다. 주요 VP1/2/3 이소형 스폿은 원으로 표시되고, 마커의 주요 스폿의 이동 거리는 수직선으로 표시된다(터보뉴클레아제=점선, 콘알부민=실선).
도 2a - 도 2e. AAV8 캡시드 단백질에서 아스파라긴 및 글루타민 탈아미드화의 분석. (도 2a - 도 2b) Asn-94(도 2a) 및 Asp-94(도 2b)를 함유하는 3+ 펩티드(93-103)의 전기분무 이온화(ESI) 질량 분석법 및 이론적 및 관찰된 질량을 도시한다. (도 2c - 도 2d) Asn-254(도 2c) 및 Asp-254(도 2d)를 함유하는 3+ 펩티드(247-259)의 ESI 질량 분석법 및 이론적 및 관찰된 질량을 도시한다. Asn-94 및 Asn-254에 대해 관찰된 질량 이동은 0.984 Da의 이론적 질량 이동 대비, 각각 0.982 Da 및 0.986 Da였다. (도 2e) 상이한 방법으로 정제된 AAV8 트립신 펩티드에 대해 관심있는 특이적 아스파라긴 및 글루타민 잔기에서의 퍼센트 탈아미드화가 도시된다. N+1 글리신을 갖는 아스파라긴 잔기에서 탈아미드화를 나타내는 막대는 교차선 음영으로 표시된다. 분석된 적어도 하나의 프렙(prep)에서 적어도 2% 탈아미드화되는 것으로 결정된 잔기가 포함되었다. 데이터는 평균 ± 표준 편차로 표시된다.
도 3a - 도 3e. AAV8 VP3 단량체의 구조적 모델링 및 탈아미드화된 부위의 분석. (도 3a) AAV8 VP3 단량체(PDB 식별자: 3RA8)는 코일 표시로 나타낸다. 리본의 색상은 상대 유연성 정도(청색=가장 단단함/정상 온도 인자, 적색=가장 유연함/고온 인자)를 나타낸다. 구체는 관심있는 잔기를 나타낸다. 확대된 다이어그램은 국소 단백질 구조를 입증하기 위해 관심있는 잔기 및 주변 잔기의 공 및 막대 표시이다(청색=질소, 적색=산소). 밑줄 친 잔기는 NG 모티프에 있는 것들이다. 도 3b - 도 3e: N+1 글리신을 갖는 탈아미드화된 아스파라긴의 이소아스파르트산 모델을 도시한다. 2FoFc 전자 밀도 맵(1 시그마 수준)은 (도 3c) N263, (도 3d) N514, 및 (도 3e) N540의 이소아스파르트산 모델과 비교하여 (도 3b) N410의 아스파라긴 모델을 사용한 AAV8 결정 구조(PDB ID: 3RA8)의 정련으로부터 생성되었다. 전자 밀도 맵은 마젠타 격자로 도시된다. 베타 탄소는 이와 같이 표지된다. 화살표는 관심있는 잔기의 R 기에 상응하는 전자 밀도를 나타낸다.
도 4a - 도 4d. AAV8 캡시드 탈아미드화에 영향을 미치는 인자의 결정. AAV8 프렙을 (도 4a) 70℃에서 3 또는 7 일 동안 인큐베이션하거나, (도 4b) pH 2 또는 pH 10에 7 일 동안 노출시키거나, 또는 (도 4c) H2O 대신에 D2O를 사용한 질량 분석법을 준비하여 AAV 캡시드 형성에 고유하지 않는 탈아미드화의 가능한 공급원을 결정하였다. (도 4d) 캡시드 구조적 완전성을 평가하기 위해 B1 항체(변성된 캡시드에 반응) 및 AAV8 형태 특이적 항체(온전한 캡시드에 반응)를 사용하여 벡터의 도트 블롯을 도 4a에서와 같이 처리하였다.
도 5a - 도 5b. 비-AAV 단백질의 탈아미드화 빈도. AAV 탈아미드화 백분율과 비교하여, 탈아미드화될 가능성이 있는 NG 모티프를 함유하는 2 개의 비-AAV 재조합 단백질, 인간 카르보닉 안히드라제(도 5a) 및 래트 페닐알라닌-히드록실라제(도 5b)에 대한 탈아미드화 백분율이 제시된다.
도 6. 두 기관으로부터의 데이터 분석 파이프라인을 사용하여 계산된 AAV8 퍼센트 탈아미드화의 비교. 상이한 두 기관에서 평가된 AAV8 트립신 펩티드에 대해 관심있는 특이적 아스파라긴 및 글루타민 잔기에서의 퍼센트 탈아미드화가 제시된다.
도 7a - 도 7c는 로트 간 높은 변동성을 갖는 비-NG 부위에서 기능적 아스파라긴 치환을 도시한다. (도 7a) wtAAV8 및 돌연변이체 벡터의 역가를 정량적 PCR(qPCR)에 의해 측정 시, 293 세포에서 소규모 삼중 형질감염으로 생성하였다. 역가는 wtAAV8 대조군과 비교하여 보고된다. 형질도입 효율을 도 8b에 기재된 바와 같이 측정하였다. 역가 및 형질도입 효율을 wtAAV8 대조군에 대한 값으로 정규화한다. (도 7b) wtAAV8.CB7.ffluc 및 N499Q 캡시드 돌연변이체 벡터를 받은 마우스에 대하여 주사후 14 일의 대표적인 루시퍼라제 이미지를 도시한다. (도 7c) wtAAV8 또는 돌연변이체 벡터가 정맥내 주사된 C57BL/6 마우스(n=3 또는 4)로부터의 연구 기간 중 14 일의 루시퍼라제 발현을 루시퍼라제 이미지로 측정하고 총 플럭스 단위로 보고하였다. 모든 데이터는 평균 + 표준 편차로 표시된다.
도 8a 및 도 8b는 벡터 성능에 대한 유전적 탈아미드화 영향의 시험관내 분석 결과를 도시한다. (도 8a) 정량적 PCR(qPCR)에 의해 측정 시, 293 세포에서 소규모 삼중 형질감염에 의해 생성된 wtAAV8 및 유전적 탈아미드화 돌연변이체의 역가. 역가는 wtAAV8 대조군과 비교하여 보고된다. 높은 탈아미드화를 갖는 NG 부위(패턴화된 막대), 낮은 탈아미드화를 갖는 부위(백색 막대) 및 고도로 가변적인 부위(흑색 막대)는 wtAAV8 및 음성 대조군으로 표시된다. (도 8b) wtAAV8 대조군과 비교하여 보고된 파이어플라이 루시퍼라제를 생성하는 돌연변이체 AAV8 벡터의 형질도입 효율. 형질도입 효율은 HUH7 세포에 첨가된 GC 당 생성된 발광 단위로 측정되고, 다중 희석에서 조질 벡터로 형질도입을 수행함으로써 결정된다. 형질도입 효율 데이터는 wt 참조로 정규화된다. 모든 데이터는 평균 ± 표준 편차로 표시된다.
도 9a - 도 9d는 시간에 따른 벡터 활성 상실이 점진적인 탈아미드화와 상관관계가 있음을 도시한다. (도 9a) 루시퍼라제 리포터 유전자를 패키징하는 AAV8 벡터를 생성하는 삼중-형질감염된 HEK 293 세포의 시간경과에 대한 벡터 생산(DNAseI 내성 게놈 카피, GC). GC 수준은 최대 관찰된 값으로 정규화된다. (도 9b) 정제된 시간경과 벡터를 사용하여 Huh7 세포를 형질도입하였다. 정제된 시간경과 벡터 샘플의 다중 희석을 사용하여 도 8b에서와 같이 형질도입 효율(표적 세포에 첨가된 GC 당 발광 단위)을 측정하였다. 오차 막대는 각각의 샘플 시간에 대해 적어도 10 개의 기술 복제의 표준 편차를 나타낸다. 형질감염 후 1, 2 및 5 일에 수집된 벡터에 대한 AAV8 NG 부위(도 9c) 및 비-NG 부위(도 9d)의 탈아미드화.
도 10a - 도 10d은 벡터 성능에 대한 아스파라긴 안정화의 영향을 도시한다. 도 10a는 정량적 PCR(qPCR)에 의해 측정 시, 293 세포에서 소규모 삼중 형질감염에 의해 생성된 wtAAV8 및 +1 위치 돌연변이체 벡터의 역가를 도시한다. 역가는 wtAAV8 대조군과 비교하여 보고된다. 도 10b는 wtAAV8 대조군과 비교하여 보고된 파이어플라이 루시퍼라제를 생성하는 돌연변이체 AAV8 벡터의 형질도입 효율을 도시한다. 형질도입 효율은 조질 벡터 물질을 사용하여 도 8b에서와 같이 측정하였다. 2-표본 t-검정(*p<0.005)을 실행하여 G264A/G515A 및 G264A/G541A에 대한 wtAAV8 및 돌연변이체 형질도입 효율 사이의 유의성을 결정하였다. 도 10c는 루시퍼라제 이미지로 측정되고 총 플럭스 단위로 보고된 wtAAV8 또는 돌연변이체 벡터가 정맥내 주사된 C57BL/6 마우스(n=3 내지 5)로부터의 간 영역에서 연구 기간의 14 일에서 루시퍼라제 발현을 도시한다. 도 10d는 wtAAV8 대조군과 비교하여 보고된 파이어플라이 루시퍼라제를 생성하는 다중-부위 AAV8 돌연변이체 벡터의 역가 및 형질도입 효율을 도시한다. 모든 데이터는 평균 ± 표준 편차로 표시된다.
도 11a - 도 11c. AAV9 캡시드 단백질에서 아스파라긴 및 글루타민 탈아미드화의 분석. (도 11a) wtAAV9의 1e11 GC를 2D 겔 전기영동으로 분석하고 시프로 루비로 염색하였다. 단백질 표지: A=VP1; B=VP2; C=VP3, D=계란 흰자위 콘알부민 마커, E=터보뉴클레아제 마커. 등전점 전기영동을 6-10의 pI로 수행하였다. (도 11b) 상이한 방법으로 정제된 AAV9 트립신 펩티드에 대해 관심있는 특이적 아스파라긴 및 글루타민 잔기에서의 퍼센트 탈아미드화를 도시한다. N+1 글리신을 갖는 아스파라긴 잔기에서 탈아미드화를 나타내는 막대는 교차선 음영으로 표시된다. 분석된 적어도 하나의 프렙에서 적어도 2% 탈아미드화되는 것으로 결정된 잔기가 포함되었다. 데이터는 평균 ± 표준 편차로 표시된다. (도 11c) N512의 이소아스파르트산 모델은 AAV9 결정 구조(PDB ID: 3UX1)의 비편향된 정련에 의해 생성된 2FoFc 전자 밀도 맵에 제시된다. 화살표는 잔기 N512의 R 기에 상응하는 전자 밀도를 나타낸다.
도 11d - 도 11f. AAV9 캡시드 탈아미드화에 영향을 미치는 인자의 결정. (도 11d) 2 개의 AAV9 프렙을 70℃에서 3 또는 7 일 동안 인큐베이션하거나 또는 (도 11f) pH 2 또는 pH 10에 7 일 동안 노출시켜 AAV 캡시드 형성에 고유하지 않은 탈아미드화의 가능한 공급원을 결정하였다. 데이터는 평균 ± 표준 편차로 표시된다. (도 11f) 캡시드 구조적 완전성을 평가하기 위해 B1 항체(변성된 캡시드에 반응)를 사용하여 벡터의 도트 블롯을 도 11d에서와 같이 처리하였다.
도 11g 및 도 11h는 AAV9에 대해 벡터 성능에 대한 유전적 탈아미드화 영향의 시험관내 분석을 도시한다. (도 11g) 정량적 PCR(qPCR)에 의해 측정 시, 293 세포에서 소규모 삼중 형질감염에 의해 wtAAV9 및 유전적 탈아미드화 돌연변이체 벡터의 역가를 생성하였다. 역가는 wtAAV9 대조군과 비교하여 보고된다. 높은 탈아미드화를 갖는 NG 부위(패턴화된 막대), 낮은 탈아미드화를 갖는 부위(백색 막대) 및 고도로 가변적인 부위(흑색 막대)는 wtAAV8 및 음성 대조군으로 제시된다. (도 11h) 파이어플라이 루시퍼라제를 생성하는 돌연변이체 AAV9 벡터의 형질도입 효율은 wtAAV9 대조군과 비교하여 보고된다. 모든 데이터는 평균 ± 표준 편차로 표시된다.
도 11i - 도 11k는 시간에 따른 AAV9 벡터 시험관내 효능을 도시한다. (도 11i) 루시퍼라제 리포터 유전자를 패키징하는 AAV9 벡터를 생성하는 삼중-형질감염된 HEK 293 세포의 시간 경과에 대한 벡터 생산(DNAseI 내성 게놈 카피, GC). GC 수준은 최대 관찰된 값으로 정규화된다. (도 11j) 조질 시간경과 벡터를 사용하여 Huh7 세포를 형질도입하였다. (도 11k) 조질 및 정제된 벡터 샘플에 대해 형질감염후 1 일 vs 형질감염후 5 일에 수집된 벡터의 형질도입 효율이 제시된다. 형질도입 효율은 루시퍼라제 활성/GC로 표현되며, 1 일 값으로 정규화된다.
도 12a는 Clustal Omega 1.2.2 및 정렬을 위한 기본값 매개변수를 사용하여 제조된, AAV5.5.9[서열번호: 10](또한 때때로 AAVG5라고 불림), AAV9[서열번호: 4], 및 AAVPHP.B[서열번호: 12]의 아미노산 서열의 정렬을 제공한다. 도 12b - 12e는 AAV5.5.9[서열번호: 9], PHP.B[서열번호: 11], AAV9[서열번호: 3], 및 AAVhu68[서열번호: 14]의 뉴클레오티드 서열의 정렬을 제공한다.
도 13a는 Clustal Omega 1.2.2 및 정렬을 위한 기본값 매개변수를 사용하여 제조된, AAV8 삼중 돌연변이체(AAV8T)[서열번호: 16], AAV8.AR2.08[서열번호: 18](또한 때때로 AAVG3 또는 AR2 또는 AAV.AR2라고 불림), 및 AAV8[서열번호: 20]의 아미노산 서열의 정렬을 제공한다. 도 13b - 13d는 AAV8 삼중 돌연변이체[서열번호: 15], AAV8.AR2.08[서열번호: 17], AAV8[서열번호: 19]의 뉴클레오티드 서열의 정렬을 제공한다.
도 14a는 Clustal Omega 1.2.2 및 정렬을 위한 기본값 매개변수를 사용하여, AAVrh79[서열번호: 2](또한 때때로 AAVG2라고 불림), AAVrh10[서열번호: 24] 및 AAVhu37[서열번호: 22]의 아미노산 서열의 정렬을 제공한다. 도 14b - 14d는 AAVrh79[서열번호: 1], AAVrh10[서열번호: 22] 및 AAVhu37[서열번호: 21]의 뉴클레오티드 서열의 정렬을 제공한다.
도 15a 및 15b는 참조 벡터의 소규모 또는 초대규모 프렙에서 AAV8삼중, AAVhu68, AAV9, AAV9 및 AAVrh79에 대한 생산 수율을 도시한다.
도 16은 도 15b의 초대규모 프렙의 생산 순도를 제공한다.
도 17a 내지 17d는 파이어플라이 루시퍼라제를 발현하는 벡터를 사용하여 수컷 C57BL/6 마우스(n = 5/그룹)의 비복근에 3x1011 GC/마우스의 근육내(IM) 투여 후 간 및 근육 조직에서 루시퍼라제의 발현을 도시한다.
도 18a는 실시예 5에서 바코드 실험에 사용된 플라스미드를 도시한다. 도 18b는 흑색 6 마리 마우스에 주사된 각각의 AAV 바코드 변이체의 양을 도시한다. 동물을 희생시키고, 조직 샘플을 수확하고, 각각에서 DAN를 단리하였다. 3 마리 동물에 대한 총 벡터 분포는 도 18c에 도시되어 있다. 주사된 벡터 믹스의 실제 vs. 이론적 빈도는 도 18d에 도시되어 있다.
도 19a-도 20c는 실시예 5의 바코드 생물분포 실험 결과를 도시한다. 개별 조직 샘플을 게놈 및 cDNA에 대한 샘플 vs. 주사 믹스의 개별 바코드 빈도를 분석하였다. 결과는 근육(도 19a, 19b); 심장(도 19c 및 도 19d) 및 간(도 19e 및 도 19F)에 대해 제시된다. 이론적 빈도와 비교한 배수 변화는 도 20a - 도 20c에 도시되어 있다.
도 21 및 22는 AAV8과 비교하여 마우스에서 AAV8.AR2.08 생물분포를 도시한다. 결과는 AAV8.AR2.08이 AAV8보다 간에 더 특이적임을 제시한다.
도 23은 제조가능성과 관련한 역가 및 수율에 대해 AAV8 vs. AAV8.AR2.08 vs. AAVrh79를 비교한다.
도 24는 AAV8(중간 및 우측 막대)과 비교하여 조직(가장 좌측 막대)에서 AAV8.AR2.08 생물분포를 도시한다.
도 25-28은 비-인간 영장류에 AAV 벡터의 투여 후 결과를 도시한다. 도 25는 연구 동안 사용된 벡터 및 동물에 대한 상세한 사항을 제공한다. 도 26은 AAV8, AAVrh79, 또는 AAV8.AR2.08 벡터를 받은 동물의 간에서 검출된 GC 및 GFP 수준을 정량화한다. 도 27은 HNP 간에서 GFP 발현 수준을 요약한다. 도 28은 AAV8, AAVrh79, 또는 AAV8.AR2.08 벡터가 투여된 HNP의 조직에서 검출된 벡터 수준을 도시한다.
도 29는 다양한 조직에서 검출된 AAVrh79 벡터의 생물분포를 도시한다.
본원에는 재조합 AAV의 캡시드 내에서 발견된 캡시드 단백질 VP1, VP2, 및 VP3의 3 개의 집단 각각에서 서열 및 전하 이질성을 갖는 재조합 아데노-연관 바이러스(rAAV) 및 이를 함유하는 조성물이 제공된다. 본원에는 신규 rAAV, 뿐만 아니라 탈아미드화, 및 임의적으로 다른 캡시드 단량체 변형을 감소시키는 방법이 제공된다. 본원에는 더 큰 안정성, 효능, 및/또는 순도를 유지하는 캡시드를 갖는 rAAV를 제공하는 데 유용한, 변형이 감소된 변형된 rAAV가 추가로 제공된다.
"재조합 AAV" 또는 "rAAV"는 2 개의 요소, 즉 AAV 캡시드 및 AAV 캡시드 내에서 패키징된 적어도 비-AAV 코딩 서열을 함유하는 벡터 게놈을 함유하는 DNAse-내성 바이러스 입자이다. 달리 명시되지 않는 한, 이 용어는 어구 "rAAV 벡터"와 상호교환가능하게 사용될 수 있다. rAAV는 임의의 기능적 AAV rep 유전자 또는 기능적 AAV cap 유전자가 결여되어 있고 자손을 생성할 수 없으므로, "복제-결함 바이러스" 또는 "바이러스 벡터"이다. 특정 구현예에서, 유일한 AAV 서열은 ITR 사이에 위치한 유전자 및 조절 서열이 AAV 캡시드 내에서 패키징될 수 있도록 전형적으로 벡터 게놈의 극단적 5' 및 3' 단부에 위치한 AAV 도립된 말단 반복부 서열(ITR)이다.
본원에 사용된 바와 같이, "벡터 게놈"은 바이러스 입자를 형성하는 rAAV 캡시드 내부에 패키징된 핵산 서열을 지칭한다. 이러한 핵산 서열은 AAV 도립된 말단 반복부 서열(ITR)을 함유한다. 본원의 예에서, 벡터 게놈은 최소한, 5'에서 3'으로, AAV 5' ITR, 코딩 서열(들), 및 AAV 3' ITR을 함유한다. AAV2의 ITR, 캡시드와 상이한 공급원 AAV, 또는 전장 ITR 이외의 것이 선택될 수 있다. 특정 구현예에서, ITR은 생산 동안 rep 기능을 제공하는 AAV와 동일한 AAV 공급원 또는 트랜스상보성(transcomplementing) AAV에서 유래된다. 또한, 다른 ITR이 사용될 수 있다. 또한, 벡터 게놈은 유전자 산물의 발현을 지시하는 조절 서열을 함유한다. 벡터 게놈의 적합한 구성요소는 본원에 보다 상세하게 논의된다.
rAAV는 AAV 캡시드 및 벡터 게놈으로 구성된다. AAV 캡시드는 vp1의 이질적 집단, vp2의 이질적 집단, 및 vp3 단백질의 이질적 집단의 어셈블리이다. vp 캡시드 단백질을 지칭하기 위해 사용될 때 본원에 사용된 용어 "이질적" 또는 이의 임의의 문법적 변이는 동일하지 않은 요소로 이루어진 집단, 예를 들어, 상이한 변형된 아미노산 서열을 갖는 vp1, vp2 또는 vp3 단량체(단백질)를 갖는 집단을 지칭한다.
본원에 사용된 바와 같이, 용어 "이질적 집단"은 vp1, vp2 및 vp3 단백질(대안적으로 이소형으로 불림)과 관련하여 사용될 때 캡시드 내에서 vp1, vp2 및 vp3 단백질의 아미노산 서열 차이를 지칭한다. AAV 캡시드는 예측된 아미노산 잔기로부터 변형된 vp1 단백질 내에서, vp2 단백질 내에서 및 vp3 단백질 내에서 하위집단을 함유한다. 이들 하위집단은 최소한 특정 탈아미드화된 아스파라긴(N 또는 Asn) 잔기를 포함한다. 예를 들어, 특정 하위집단은 아스파라긴 - 글리신 쌍에서 적어도 1, 2, 3 또는 4 개의 고도로 탈아미드화된 아스파라긴(N) 위치를 포함하고 임의적으로 다른 탈아미드화된 아미노산을 추가로 포함하며, 여기서 탈아미드화는 아미노산 변화 및 다른 임의적인 변형을 야기한다.
본원에 사용된 바와 같이, vp 단백질의 "하위집단"은 달리 명시되지 않는 한, 공통으로 적어도 하나의 정의된 특성을 갖고 참조 그룹의 모든 구성원보다 적은 적어도 하나의 그룹 구성원으로 이루어진 vp 단백질 그룹을 지칭한다. 예를 들어, vp1 단백질의 "하위집단"은 달리 명시되지 않는 한, 적어도 하나(1)의 vp1 단백질이고 어셈블리된 AAV 캡시드 내 모든 vp1 단백질보다 적을 수 있다. vp3 단백질의 "하위집단"은 달리 명시되지 않는 한, 하나(1)의 vp3 단백질 내지 어셈블리된 AAV 캡시드 내 모든 vp3 단백질보다 적을 수 있다. 예를 들어, vp1 단백질은 vp 단백질의 하위집단일 수 있고; vp2 단백질은 vp 단백질의 별개의 하위집단일 수 있고, vp3은 어셈블리된 AAV 캡시드 내 vp 단백질의 추가의 하위집단이다. 또 다른 예에서, vp1, vp2 및 vp3 단백질은 예를 들어, 아스파라긴 - 글리신 쌍에서 상이한 변형, 예를 들어, 적어도 1, 2, 3 또는 4 개의 고도로 탈아미드화된 아스파라긴을 갖는 하위집단을 함유할 수 있다.
달리 명시되지 않는 한, 고도로 탈아미드화된은 참조 아미노산 위치에서 예측된 아미노산 서열과 비교하여, 참조 아미노산 위치에서 적어도 45% 탈아미드화, 적어도 50% 탈아미드화, 적어도 60% 탈아미드화, 적어도 65% 탈아미드화, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 99%, 또는 최대 약 100% 탈아미드화된 것을 지칭한다(예를 들어, 서열번호: 2의 아미노산 57에서 아스파라긴의 적어도 80%는 총 vp1 단백질에 기초하여 탈아미드화될 수 있으며 총 vp1, vp2 및 vp3 단백질에 기초하여 탈아미드화될 수 있다). 이러한 백분율은 2D-겔, 질량 분석법 기술, 또는 다른 적합한 기술을 사용하여 결정될 수 있다.
이론에 얽매이기를 바라지 않으면서, AAV 캡시드 내의 vp 단백질에서 적어도 고도로 탈아미드화된 잔기의 탈아미드화는 자연에서 주로 비-효소적인 것으로 여겨지며, 선택된 아스파라긴, 및 더 적은 정도로 글루타민 잔기를 탈아미드화시키는 캡시드 단백질 내의 작용기에 의해 야기된다. 대부분의 탈아미드화 vp1 단백질의 효율적인 캡시드 어셈블리는 이들 사건이 캡시드 어셈블리 후 발생하거나 또는 개별 단량체(vp1, vp2 또는 vp3)의 탈아미드화가 구조적으로 널리 용인되고 어셈블리 역학에 크게 영향을 미치지 않는다는 것을 나타낸다. VP1-고유(VP1-u) 영역(~aa 1-137)에서 광범위한 탈아미드화는 일반적으로 세포 진입 전에 내부적으로 위치하는 것으로 간주되며, 이는 VP 탈아미드화가 캡시드 어셈블리 전에 발생할 수 있다는 것을 시사한다.
이론에 얽매이기를 바라지 않으면서, N의 탈아미드화는 C-말단 잔기의 백본 질소 원자를 통해 발생할 수 있으며 Asn의 측쇄 아미드 기 탄소 원자에 대한 친핵성 공격을 수행한다. 중간체 폐환 숙신이미드 잔기를 형성하는 것으로 여겨진다. 그 다음에 숙신이미드 잔기는 빠른 가수분해를 수행하여 최종 생성물 아스파르트산(Asp) 또는 이소 아스파르트산(IsoAsp)을 초래한다. 따라서, 특정 구현예에서, 아스파라긴(N 또는 Asn)의 탈아미드화는 Asp 또는 IsoAsp를 초래하며, 이는 예를 들어, 하기 예시된 바와 같이, 숙신이미드 중간체를 통해 상호전환될 수 있다.
Figure pct00001
본원에 제공된 바와 같이, VP1, VP2 또는 VP3에서 각각의 탈아미드화된 N은 독립적으로 아스파르트산(Asp), 이소아스파르트산(isoAsp), 아스파르테이트, 및/또는 Asp 및 isoAsp의 상호전환 블렌드, 또는 이의 조합일 수 있다. α- 및 이소아스파르트산의 임의의 적합한 비가 존재할 수 있다. 예를 들어, 특정 구현예에서, 상기 비는 10:1 내지 1:10 아스파르트산 대 이소아스파르트산, 약 50:50 아스파르트산:이소아스파르트산, 또는 약 1:3 아스파르트산:이소아스파르트산, 또는 또 다른 선택된 비일 수 있다.
특정 구현예에서, 하나 이상의 글루타민(Q)은 글루탐산(Glu), 즉, α-글루탐산, γ-글루탐산(Glu), 또는 α- 및 γ-글루탐산의 블렌드로 탈아미드화될 수 있으며, 이는 공통의 글루타린이미드 중간체를 통해 상호전환될 수 있다. α- 및 γ-글루탐산의 임의의 적합한 비가 존재할 수 있다. 예를 들어, 특정 구현예에서, 상기 비는 10:1 내지 1:10 α 대 γ, 약 50:50 α:γ, 또는 약 1:3 α : γ, 또는 또 다른 선택된 비일 수 있다.
Figure pct00002
따라서, rAAV는 최소한, 적어도 하나의 고도로 탈아미드화된 아스파라긴을 포함하는 적어도 하나의 하위집단을 포함하는 탈아미드화된 아미노산을 갖는 vp1, vp2 및/또는 vp3 단백질의 rAAV 캡시드 내에서 하위집단을 포함한다. 게다가, 다른 변형은 특히 선택된 아스파르트산(D 또는 Asp) 잔기 위치에서 이성질체화를 포함할 수 있다. 또 다른 구현예에서, 변형은 Asp 위치에서 아미드화를 포함할 수 있다.
특정 구현예에서, AAV 캡시드는 적어도 1 개, 적어도 2 개, 적어도 3 개, 적어도 4 개, 적어도 5 개 내지 적어도 약 25 개의 탈아미드화된 아미노산 잔기 위치를 갖는 vp1, vp2 및 vp3의 하위집단을 함유하며, 이 중 적어도 1 내지 10%, 적어도 10 내지 25%, 적어도 25 내지 50%, 적어도 50 내지 70%, 적어도 70 내지 100%, 적어도 75 내지 100%, 적어도 80-100% 또는 적어도 90-100%가 vp 단백질의 암호화된 아미노산 서열과 비교하여 탈아미드화된다. 이들 중 대부분은 N 잔기일 수 있다. 그러나, Q 잔기가 또한 탈아미드화될 수 있다.
본원에 사용된 바와 같이, "암호화된 아미노산 서열"은 아미노산으로 번역되는 참조 핵산 서열의 알려진 DNA 코돈의 번역에 기초하여 예측되는 아미노산을 지칭한다. 하기 표는 DNA 코돈 및 20 개의 공통 아미노산을 예시하며, 단일 문자 코드(SLC) 및 3 문자 코드(3LC) 둘 다로 제시된다.
Figure pct00003
특정 구현예에서, rAAV는 본원에 제공되고 본원에 참조로 포함된 표에 제시된 위치에서 2, 3, 4, 5 개 또는 그 이상의 탈아미드화된 잔기의 조합을 포함하는 하위집단을 갖는 vp1, vp2 및 vp3 단백질을 갖는 AAV 캡시드를 갖는다.
rAAV에서의 탈아미드화는 2D 겔 전기영동, 및/또는 질량 분석법, 및/또는 단백질 모델링 기술을 사용하여 결정될 수 있다. 온라인 크로마토그래피는 Acclaim PepMap 칼럼 및 NanoFlex 소스를 사용한 Q Exactive HF(Thermo Fisher Scientific)에 연결된 Thermo UltiMate 3000 RSLC 시스템(Thermo Fisher Scientific)으로 수행될 수 있다. MS 데이터는 Q Exactive HF에 대한 데이터-의존적 상위-20 방법을 사용하여 조사 스캔(200-2000 m/z)으로부터 가장 풍부한 아직 서열분석되지 않은 전구체 이온을 동적으로 선택하여 획득된다. 서열분석은 예측 자동 획득 제어로 결정된 1e5 이온의 표적 값으로 더 높은 에너지 충돌 해리 단편화를 통해 수행되고 전구체 단리는 4 m/z의 창으로 수행되었다. 조사 스캔은 m/z 200에서 120,000의 해상도로 획득되었다. HCD 스펙트럼에 대한 해상도는 최대 이온 주사 시간 50 ms 및 정규화된 충돌 에너지 30으로 m/z200에서 30,000으로 설정될 수 있다. S-렌즈 RF 수준은 50으로 설정되어, 소화로부터 펩티드에 의해 차지된 m/z 영역의 최적 전송을 제공할 수 있다. 단일 미할당 또는 6 이상의 전하 상태를 갖는 전구체 이온은 단편화 선택으로부터 제외될 수 있다. 획득된 데이터 분석을 위해 BioPharma Finder 1.0 소프트웨어(Thermo Fischer Scientific)가 사용될 수 있다. 펩티드 맵핑을 위해, 고정된 변형으로 설정된 카르바미도메틸화; 및 가변 변형으로 설정된 산화, 탈아미드화, 및 인산화, 10-ppm 질량 정확도, 높은 프로테아제 특이성, 및 MS/MS 스펙트럼에 대한 신뢰 수준 0.8로 단일-진입 단백질 FASTA 데이터베이스를 사용하여 검색이 수행된다. 적합한 프로테아제의 예는 예를 들어, 트립신 또는 키모트립신을 포함할 수 있다. 탈아미드화된 펩티드의 질량 분석 식별은 탈아미드화가 온전한 분자의 질량 +0.984 Da(-OH 및 -NH2 기 사이의 질량 차이)에 추가되므로, 비교적 간단하다. 특정 펩티드의 퍼센트 탈아미드화는 탈아미드화된 펩티드의 질량 면적을 탈아미드화 및 천연 펩티드의 면적의 합으로 나누어 결정된다. 가능한 탈아미드화 부위의 수를 고려하여, 상이한 부위에서 탈아미드화된 동중(isobaric) 종이 단일 피크에서 공-이동할 수 있다. 그 결과, 다수의 잠재적인 탈아미드화 부위를 갖는 펩티드로부터 유래한 단편 이온을 사용하여 탈아미드화의 다수의 부위를 찾아내거나 또는 구별할 수 있다. 이러한 경우에, 관찰된 동위원소 패턴 내에서 상대 강도를 사용하여 상이한 탈아미드화된 펩티드 이성질체의 상대 풍부도를 구체적으로 결정할 수 있다. 이 방법은 모든 이성질체 종에 대한 단편화 효율이 동일하고 탈아미드화 부위와는 관련이 없다는 것을 가정한다. 이러한 예시적인 방법에 대한 다수의 변이가 사용될 수 있다는 것이 당업자에 의해 이해될 것이다. 예를 들어, 적합한 질량 분광계는 예를 들어, 4중극자 비행 시간 질량 분광계(QTOF), 예컨대 Waters Xevo 또는 Agilent 6530 또는 궤도 기구, 예컨대 Orbitrap Fusion 또는 Orbitrap Velos(Thermo Fisher)를 포함할 수 있다. 적합한 액체 크로마토그래피 시스템은 예를 들어, Waters 또는 Agilent 시스템(1100 또는 1200 시리즈)으로부터의 Acquity UPLC 시스템을 포함한다. 적합한 데이터 분석 소프트웨어는 예를 들어, MassLynx(Waters), Pinpoint 및 Pepfinder(Thermo Fischer Scientific), Mascot(Matrix Science), Peaks DB(Bioinformatics Solutions)를 포함할 수 있다. 또 다른 기술은 예를 들어, 2017년 6월 16일 온라인 공개된 X. Jin et al, Hu Gene Therapy Methods, Vol. 28, No. 5, pp. 255-267에 기재될 수 있다.
탈아미드화 이외에도, 다른 변형이 발생할 수 있지만 하나의 아미노산이 상이한 아미노산 잔기로 전환되지 않는다. 이러한 변형은 아세틸화된 잔기, 이성질체화, 인산화, 또는 산화를 포함할 수 있다.
탈아미드화의 조절: 특정 구현예에서, AAV는 탈아미드화를 감소시키기 위해 아스파라긴-글리신 쌍에서 글리신을 바꾸도록 변형된다. 다른 구현예에서, 아스파라긴은 상이한 아미노산, 예를 들어, 더 느린 속도로 탈아미드화되는 글루타민; 또는 아미드 기가 결여된 아미노산(예를 들어, 글루타민 및 아스파라긴은 아미드 기를 함유함); 및/또는 아민 기가 결여된 아미노산(예를 들어, 리신, 아르기닌 및 히스티딘은 아민 기를 함유함)으로 변경된다. 본원에 사용된 바와 같이, 아미드 또는 아민 측기가 결여된 아미노산은 예를 들어, 글리신, 알라닌, 발린, 류신, 이소류신, 세린, 트레오닌, 시스틴, 페닐알라닌, 티로신, 또는 트립토판, 및/또는 프롤린을 지칭한다. 기재된 바와 같은 변형은 암호화된 AAV 아미노산 서열에서 발견된 아스파라긴-글리신 쌍 중 1, 2, 또는 3 개에 있을 수 있다. 특정 구현예에서, 이러한 변형은 아스파라긴 - 글리신 쌍 중 4 개 모두에서 이루어지지 않는다. 따라서, AAV 및/또는 더 낮은 탈아미드화 속도를 갖는 조작된 AAV 변이체의 탈아미드화를 감소시키는 방법. 추가적으로, 또는 대안적으로 하나 이상의 다른 아미드 아미노산은 AAV의 탈아미드화를 감소시키기 위해 비-아미드 아미노산으로 바꿀 수 있다. 특정 구현예에서, 본원에 기재된 바와 같은 돌연변이체 AAV 캡시드는 아스파라긴 - 글리신 쌍에서 돌연변이를 함유하여, 글리신을 알라닌 또는 세린으로 바꾸도록 한다. 돌연변이체 AAV 캡시드는 참조 AAV가 선천적으로 4 개의 NG 쌍을 함유하는 경우 1, 2 또는 3 개의 돌연변이체를 함유할 수 있다. 특정 구현예에서, AAV 캡시드는 참조 AAV가 선천적으로 5 개의 NG 쌍을 함유하는 경우 1, 2, 3 또는 4 개의 이러한 돌연변이체를 함유할 수 있다. 특정 구현예에서, 돌연변이체 AAV 캡시드는 NG 쌍에서 단일 돌연변이만을 함유한다. 특정 구현예에서, 돌연변이체 AAV 캡시드는 2 개의 상이한 NG 쌍에서 돌연변이를 함유한다. 특정 구현예에서, 돌연변이체 AAV 캡시드는 AAV 캡시드에서 구조적으로 별개의 위치에 위치한 2 개의 상이한 NG 쌍인 돌연변이를 함유한다. 특정 구현예에서, 돌연변이는 VP1-고유 영역 내에 있지 않다. 특정 구현예에서, 돌연변이 중 하나는 VP1-고유 영역 내에 있다. 임의적으로, 돌연변이체 AAV 캡시드는 NG 쌍에서 변형을 함유하지 않지만, NG 쌍의 외부에 위치한 하나 이상의 아스파라긴, 또는 글루타민에서 탈아미드화를 최소화 또는 제거하도록 돌연변이를 함유한다.
특정 구현예에서, 야생형 AAV 캡시드에서 NG 중 하나 이상을 제거하는 AAV 캡시드를 조작하는 것을 포함하는 rAAV 벡터의 효능을 증가시키는 방법이 제공된다. 특정 구현예에서, "NG"의 "G"에 대한 코딩 서열은 또 다른 아미노산을 암호화하도록 조작된다. 하기 특정 예에서, "S" 또는 "A"가 치환된다. 그러나, 다른 적합한 아미노산 코딩 서열이 선택될 수 있다. 예를 들어, AAV8의 넘버링에 기초하여, 다음 위치: N57+1, N263+1, N385+1, N514+1, N540+1 중 적어도 하나에 대한 코딩 서열이 변형된 하기 표, 또는 하기 표에 제시된 바와 같은 것 참조. 특정 구현예에서, AAV8 돌연변이체는 위치 N57, N94, N263, N305, Q467, N479, 및/또는 N653에서 NG 쌍의 변화를 피한다. 특정 구현예에서, 다른 AAV는 참조로서 AAV8 넘버링을 사용하여, AAV8과의 정렬에 기초하여 결정 시 상응하는 N 위치에서 돌연변이를 피한다.
이들 아미노산 변형은 통상적인 유전 공학 기술로 이루어질 수 있다. 예를 들어, 아르기닌 - 글리신 쌍에서 글리신을 암호화하는 코돈 중 1 내지 3 개가 글리신 이외의 아미노산을 암호화하도록 변형되는 변형된 AAV vp 코돈을 함유하는 핵산 서열이 생성될 수 있다. 특정 구현예에서, 변형된 아르기닌 코돈을 함유하는 핵산 서열은 아르기닌 - 글리신 쌍 중 1 내지 3 개에서 조작될 수 있어서, 변형된 코돈이 아르기닌 이외의 아미노산을 암호화하도록 한다. 각각의 변형된 코돈은 상이한 아미노산을 암호화할 수 있다. 대안적으로, 변경된 코돈 중 하나 이상은 동일한 아미노산을 암호화할 수 있다. 특정 구현예에서, 이들 변형된 AAVAAVrh79, AAV8.AR2.08 또는 AAV5.5.9 핵산 서열을 사용하여 천연 AAVrh79, AAV8.AR2.08 또는 AAV5.5.9 캡시드보다 탈아미드화가 더 낮은 캡시드를 갖는 돌연변이체 rAAV를 생성할 수 있다. 이러한 돌연변이체 rAAV는 감소된 면역원성을 가질 수 있고/있거나 저장, 특히 현탁액 형태로 저장에 대한 안정성을 증가시킬 수 있다.
또한 본원에는 탈아미드화가 감소된 AAV 캡시드를 암호화하는 핵산 서열이 제공된다. DNA(게놈 또는 cDNA), 또는 RNA(예를 들어, mRNA)를 포함하여 이 AAV 캡시드를 암호화하는 핵산 서열을 설계하는 것은 당업계의 기술 내에 있다. 이러한 핵산 서열은 선택된 시스템(즉, 세포 유형)에서 발현을 위해 코돈-최적화될 수 있으며 다양한 방법에 의해 설계될 수 있다. 이 최적화는 온라인으로 이용가능한 방법(예를 들어, GeneArt), 공개된 방법, 또는 코돈 최적화 서비스를 제공하는 회사, 예를 들어, DNA2.0(캘리포니아주 멘로 파크 소재)를 사용하여 수행될 수 있다. 하나의 코돈 최적화 방법은 예를 들어, 국제 특허 공개 번호 WO 2015/012924에 기재되어 있으며, 그 전문이 본원에 참조로 포함된다. 또한 예를 들어, 미국 특허 공개 번호 제2014/0032186호 및 미국 특허 공개 번호 제2006/0136184호 참조. 적합하게, 생성물에 대한 오픈 리딩 프레임(ORF)의 전체 길이가 변형될 수 있다. 그러나, 일부 구현예에서, ORF의 단편만이 변경될 수 있다. 이들 방법 중 하나를 사용함으로써, 임의의 주어진 폴리펩티드 서열에 빈도를 적용하고 폴리펩티드를 암호화하는 코돈-최적화된 코딩 영역의 핵산 단편을 생성할 수 있다. 코돈에 대한 실제 변화를 수행하거나 또는 본원에 기재된 바와 같이 설계된 코돈-최적화된 코딩 영역을 합성하기 위해 다수의 옵션이 이용가능하다. 이러한 변형 또는 합성은 당업자에게 널리 알려진 표준 및 일상적인 분자 생물학적 조작을 사용하여 수행될 수 있다. 하나의 접근법에서, 각각의 길이가 80-90 개 뉴클레오티드이고 원하는 서열의 길이에 걸쳐있는 일련의 상보성 올리고뉴클레오티드 쌍은 표준 방법으로 합성된다. 이들 올리고뉴클레오티드 쌍은 어닐링 시 점착 단부를 함유하는 80-90 개 염기 쌍의 이중 가닥 단편을 형성하도록 합성되며, 예를 들어, 쌍의 각각의 올리고뉴클레오티드가 쌍의 다른 올리고뉴클레오티드에 상보성인 영역을 넘어 3, 4, 5, 6, 7, 8, 9, 10 개, 또는 그 이상의 염기로 확대되도록 합성된다. 올리고뉴클레오티드의 각각의 쌍의 단일-가닥 단부는 올리고뉴클레오티드의 또 다른 쌍의 단일-가닥 단부와 어닐링하도록 설계된다. 올리고뉴클레오티드 쌍을 어닐링되게 한 다음, 이들 이중-가닥 단편 중 대략적으로 5 내지 6 개를 점착 단일 가닥 단부를 통해 함께 어닐링되게 하여서, 함께 결찰시키고 표준 박테리아 클로닝 벡터, 예를 들어, 캘리포니아주 칼스배드 소재의 Invitrogen Corporation으로부터 이용가능한 TOPO® 벡터 내로 클로닝한다. 그 다음에 작제물은 표준 방법으로 서열분석된다. 함께 결찰된 80 내지 90 개 염기 쌍 단편 중 5 내지 6 개 단편, 즉, 약 500 개 염기 쌍의 단편으로 이루어진 이러한 여러 작제물을 제조하여, 전체 원하는 서열이 일련의 플라스미드 작제물로 표시되도록 한다. 그 다음에 이러한 플라스미드의 삽입물은 적절한 제한 효소로 절단되고 함께 결찰되어 최종 작제물이 형성된다. 그 다음에 최종 작제물은 표준 박테리아 클로닝 벡터 내로 클로닝되고, 서열분석된다. 추가적인 방법은 당업자에게 즉시 명백할 것이다. 게다가, 유전자 합성은 상업적으로 쉽게 이용가능하다.
특정 구현예에서, 다수의 고도로 탈아미드화된 "NG" 위치를 함유하는 AAV 캡시드 이소형의 이질적 집단(즉, VP1, VP2, VP3)을 갖는 AAV 캡시드가 제공된다. 특정 구현예에서, 고도로 탈아미드화된 위치는 예측된 전장 VP1 아미노산 서열을 참조하여, 하기 식별된 위치 내에 있다. 다른 구현예에서, 캡시드 유전자는 언급된 "NG"가 절제되고, 돌연변이체 "NG"가 또 다른 위치 내에 조작되도록 변형된다.
특정 구현예에서, rAAV의 혼합 집단은 하나의 AAV 유형의 예측된 AAV VP1 아미노산 서열을 암호화하는 단일 AAV 캡시드 핵산 서열을 사용하는 생산 시스템으로부터 유래한다. 그러나, 생산 및 제조 과정은 상기 기재된 캡시드 단백질의 이질적 집단을 제공한다.
특정 구현예에서, 신규 단리된 AAVrh79 캡시드가 제공된다. AAV를 암호화하는 핵산 서열은 서열번호: 1에서 제공되고 암호화된 아미노산 서열은 서열번호: 2에서 제공된다.
특정 구현예에서, rAAV는 AAVrh79 캡시드를 포함한다. AAVrh79 캡시드는 AAVrh79 vp1 단백질, AAVrh79 vp2 단백질, 및 AAVrh79 vp3 단백질의 이질적 집단을 포함한다. 일 구현예에서, AAVrh79 캡시드는 서열번호: 2의 1 내지 738의 예측된 아미노산 서열을 암호화하는 핵산 서열로부터 발현에 의해 생성된다. 임의적으로, vp1-고유 영역(약 aa 1 내지 137) 또는 vp2-고유 영역(약 aa 1 내지 203)을 제외한 핵산 서열로부터의 vp3 단백질, 서열번호: 1로부터 생성된 vp1 단백질, 또는 서열번호: 2의 1 내지 738의 예측된 아미노산 서열을 암호화하는 서열번호: 1과 적어도 70% 동일한 핵산 서열로부터 생성된 vp1 단백질을 공동-발현하는 서열. 다른 구현예에서, 서열번호: 2의 적어도 약 아미노산 138 내지 738의 예측된 아미노산 서열을 암호화하는 핵산 서열로부터 발현에 의해 생성된 AAVrh79 vp2 단백질, 서열번호: 1의 적어도 뉴클레오티드 412 내지 2214를 포함하는 서열로부터 생성된 vp2 단백질, 또는 서열번호: 2의 적어도 약 아미노산 138 내지 738의 예측된 아미노산 서열을 암호화하는 서열번호: 1의 적어도 뉴클레오티드 412 내지 2214와 적어도 70% 동일한 핵산 서열로부터 생성된 vp2 단백질, 서열번호: 2의 적어도 약 아미노산 204 내지 738의 예측된 아미노산 서열을 암호화하는 핵산 서열로부터 발현에 의해 생성된 AAVrh79 vp3 단백질, 서열번호: 1의 적어도 뉴클레오티드 610 내지 2214를 포함하는 서열로부터 생성된 vp3 단백질, 또는 서열번호: 2의 적어도 약 아미노산 204 내지 738의 예측된 아미노산 서열을 암호화하는 서열번호: 1의 적어도 뉴클레오티드 610 내지 2214와 적어도 70% 동일한 핵산 서열로부터 생성된 vp3 단백질.
특정 구현예에서, AAVrh79 캡시드는 서열번호: 2의 아미노산 서열을 암호화하는 핵산 서열의 생성물인 vp1 단백질의 이질적 집단, 서열번호: 2의 적어도 약 아미노산 138 내지 738의 아미노산 서열을 암호화하는 핵산 서열의 생성물인 vp2 단백질의 이질적 집단, 및 서열번호: 2의 적어도 아미노산 204 내지 738을 암호화하는 핵산 서열의 생성물인 vp3 단백질의 이질적 집단을 포함한다.
AAVrh79 vp1, vp2 및 vp3 단백질은 서열번호: 2에서 아스파라긴 - 글리신 쌍에서 적어도 2 개의 고도로 탈아미드화된 아스파라긴(N)을 포함하는 아미노산 변형을 갖는 하위집단을 함유하고 임의적으로 다른 탈아미드화된 아미노산을 포함하는 하위집단을 추가로 포함하며, 여기서 탈아미드화는 아미노산 변화를 야기한다. 서열번호: 2의 수에 비해 N-G 쌍 N57, N263, N385 및/또는 N514에서 높은 수준의 탈아미드화가 관찰된다. 탈아미드화는 하기 표 및 실시예에 제시된 바와 같이, 다른 잔기에서 관찰되었다. 특정 구현예에서, AAVrh79는 예를 들어, 전형적으로 10% 미만으로 탈아미드화된 이들 또는 다른 잔기를 가질 수 있고/있거나 메틸화(예를 들어, ~R487)(주어진 잔기에서 전형적으로 5% 미만, 보다 전형적으로 1% 미만), 이성질체화(예를 들어, D97에서)(주어진 잔기에서 전형적으로 5% 미만, 보다 전형적으로 1% 미만, 인산화(예를 들어, 존재하는 경우, 약 10 내지 약 60%, 또는 약 10 내지 약 30%, 또는 약 20 내지 약 60% 범위 내)(예를 들어, S149, ~S153, ~S474, ~T570, ~S665 중 하나 이상에서), 또는 산화(예를 들어, W248, W307, W307, M405, M437, M473, W480, W480, W505, M526, M544, M561, W621, M637, 및/또는 W697 중 하나 이상에서)를 포함하여 다른 변형을 가질 수 있다. 임의적으로 W는 키누레닌으로 산화될 수 있다.
표 A - AAVrh79 탈아미드화
Figure pct00004
특정 구현예에서, AAVrh79 캡시드는 트립신 효소를 사용한 질량 분석법을 사용하여 결정 시, 하기 제공된 범위에서, 상기 표에 식별된 위치 중 하나 이상에서 변형된다. 특정 구현예에서, 하기 위치 중 하나 이상, 또는 N 다음의 글리신은 본원에 기재된 바와 같이 변형된다. 잔기 번호는 본원에 제공된 AAVrh79 서열에 기초한다. 서열번호: 2 참조.
특정 구현예에서, AAVrh79 vp1 캡시드 단백질을 암호화하는 핵산 서열은 서열번호: 1에서 제공된다. 다른 구현예에서, 서열번호: 1과 70% 내지 99.9% 동일한 핵산 서열은 AAVrh79 캡시드 단백질을 발현하도록 선택될 수 있다. 특정 다른 구현예에서, 핵산 서열은 서열번호: 1과 적어도 약 75% 동일, 적어도 80% 동일, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97% 동일, 또는 적어도 99% 내지 99.9% 동일하다. 그러나, 서열번호: 2의 아미노산 서열을 암호화하는 다른 핵산 서열은 rAAV 캡시드를 생성하는 데 사용하기 위해 선택될 수 있다. 특정 구현예에서, 핵산 서열은 서열번호: 1의 핵산 서열 또는 서열번호: 2를 암호화하는 서열번호: 1과 적어도 70% 내지 99% 동일, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 99% 동일한 서열을 갖는다. 특정 구현예에서, 핵산 서열은 서열번호: 1의 핵산 서열 또는 서열번호: 2의 vp2 캡시드 단백질(약 aa 138 내지 738)을 암호화하는 서열번호: 1의 약 nt 412 내지 약 nt 2214와 적어도 70% 내지 99.%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 99% 동일한 서열을 갖는다. 특정 구현예에서, 핵산 서열은 서열번호: 1의 약 nt 610 내지 약 nt 2214의 핵산 서열 또는 서열번호: 2의 vp3 캡시드 단백질(약 aa 204 내지 738)을 암호화하는 nt 서열번호: 1과 적어도 70% 내지 99.%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 99% 동일한 서열을 갖는다.
본 발명은 또한 하나 이상의 잔기가 탈아미드화를 감소시키기 위해 변경된 돌연변이체 AAVrh79를 암호화하는 핵산 서열, 또는 본원에서 식별되는 다른 변형을 포함한다. 이러한 핵산 서열은 돌연변이체 rAAVrh79 캡시드의 생산에 사용될 수 있다.
특정 구현예에서, 신규 AAV8.AR2.08 캡시드가 제공된다. AAV를 암호화하는 핵산 서열은 서열번호: 17에서 제공되고 암호화된 아미노산 서열은 서열번호: 18에서 제공된다. 일 구현예에서, 재조합 아데노-연관 바이러스(rAAV)는 AAV8.AR2.08 캡시드를 갖는다. AAV8T, AAV8.AR2.08 및 AAV8의 아미노산 서열의 정렬은 도 13a에 제공된다. AAV8T, AAV8.AR2.08 및 AAV8의 핵산 서열의 정렬은 도 13b-13d에 제공된다.
특정 구현예에서, AAV8.AR2.08 캡시드는 하기를 포함하는 AAV8.AR2.08 캡시드 단백질을 포함한다: 서열번호: 18의 1 내지 738의 예측된 아미노산 서열을 암호화하는 핵산 서열로부터 발현에 의해 생성된 AAV8.AR2.08 vp1 단백질, 서열번호: 17로부터 생성된 vp1 단백질, 또는 서열번호: 18의 1 내지 738의 예측된 아미노산 서열을 암호화하는 서열번호: 17과 적어도 70% 동일한 핵산 서열로부터 생성된 vp1 단백질, 서열번호: 18의 적어도 약 아미노산 138 내지 738의 예측된 아미노산 서열을 암호화하는 핵산 서열로부터 발현에 의해 생성된 AAV8.AR2.08 vp2 단백질, 서열번호: 17의 적어도 뉴클레오티드 412 내지 2214를 포함하는 서열로부터 생성된 vp2 단백질, 또는 서열번호: 18의 적어도 약 아미노산 138 내지 738의 예측된 아미노산 서열을 암호화하는 서열번호: 17의 적어도 뉴클레오티드 412 내지 2214와 적어도 70% 동일한 핵산 서열로부터 생성된 vp2 단백질, 서열번호: 18의 적어도 약 아미노산 204 내지 738의 예측된 아미노산 서열을 암호화하는 핵산 서열로부터 발현에 의해 생성된 AAV8.AR2.08 vp3 단백질, 서열번호: 17의 적어도 뉴클레오티드 610 내지 2214를 포함하는 서열로부터 생성된 vp3 단백질, 또는 서열번호: 18의 적어도 약 아미노산 204 내지 738의 예측된 아미노산 서열을 암호화하는 서열번호: 17의 적어도 뉴클레오티드 610 내지 2214와 적어도 70% 동일한 핵산 서열로부터 생성된 vp3 단백질.
추가적으로, 또는 대안적으로 AAV8.AR2.08 캡시드는 하기를 포함한다: 서열번호: 18의 아미노산 서열을 암호화하는 핵산 서열의 생성물인 vp1 단백질의 이질적 집단, 서열번호: 18의 적어도 약 아미노산 138 내지 738의 아미노산 서열을 암호화하는 핵산 서열의 생성물인 vp2 단백질의 이질적 집단, 및 서열번호: 18의 적어도 아미노산 204 내지 738을 암호화하는 핵산 서열의 생성물인 vp3 단백질의 이질적 집단, 여기서 vp1, vp2 및 vp3 단백질은 서열번호: 18에서 아스파라긴 - 글리신 쌍에서 적어도 2 개의 고도로 탈아미드화된 아스파라긴(N)을 포함하는 아미노산 변형을 갖는 하위집단을 함유하고 임의적으로 다른 탈아미드화된 아미노산을 포함하는 하위집단을 추가로 포함하며, 여기서 탈아미드화는 아미노산 변화를 야기하는 것. AAV8.AR2.08은 예를 들어, AAV8.AR2.08 VP1[서열번호: 18]의 넘버링에 기초한 위치 N57, N263, N385, N514 및 N540에서 고도로 탈아미드화된 잔기를 갖는 것을 특징으로 한다. 추가적으로, 하기 표의 위치 및 본 출원의 상세한 표에서의 잔기는 AAV8.AR2.08 캡시드에서 관찰된 탈아미드화를 제시한다.
특정 구현예에서, AAV8.AR2.08 캡시드는 트립신 효소를 사용한 질량 분석법을 사용하여 결정 시, 하기 제공된 범위에서, 하기 위치 중 하나 이상에서 변형된다. 특정 구현예에서, 하기 위치 중 하나 이상, 또는 N 다음의 글리신은 본원에 기재된 바와 같이 변형된다. 예를 들어, 특정 구현예에서, G는 예를 들어, 위치 58, 264, 386, 515, 또는 541에서 S 또는 A로 변형될 수 있다. NG57/58이 NS 57/58 또는 NA57/58로 변경될 때 탈아미드화의 유의한 감소가 관찰된다. 그러나, 특정 구현예에서, NG가 NS 또는 NA로 변경될 때 탈아미드화의 증가가 관찰된다. 특정 구현예에서, NG 쌍의 N은 G를 유지하면서 Q로 변형된다. 특정 구현예에서, NG 쌍의 두 아미노산이 변형된다. 특정 구현예에서, N385Q는 해당 위치에서 탈아미드화의 유의한 감소를 야기한다. 특정 구현예에서, N499Q는 해당 위치에서 탈아미드화의 유의한 증가를 야기한다.
탈아미드화 이외에도, 다른 변형은 이성질체화(예를 들어, D442 및/또는 D584 중 하나 이상에서)(1-15%), 인산화(예를 들어, ~S149, ~T417, ~T454, ~T493, S600, 및/또는 ~T663 중 하나 이상에서), 및/또는 산화(예를 들어, 위치 ~W22, ~M204, ~M212, W248, W307, M405, M437, M473, W480, W505, M526, M561, M607, ~W609, W621, M637, W697 중 하나 이상에서)를 포함할 수 있다. 또 다른 위치는 이러한 변형 또는 다른 변형(예를 들어, 아세틸화 또는 추가의 탈아미드화)을 가질 수 있다.
표 B - AAV8.AR2.08 탈아미드화
Figure pct00005
특정 구현예에서, AAV8.AR2.08 vp1 캡시드 단백질을 암호화하는 핵산 서열은 서열번호: 17에서 제공된다. 다른 구현예에서, 서열번호: 17과 70% 내지 99.9% 동일한 핵산 서열은 AAV8.AR2.08 캡시드 단백질을 발현하도록 선택될 수 있다. 특정 다른 구현예에서, 핵산 서열은 서열번호: 17과 적어도 약 75% 동일, 적어도 80% 동일, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97% 동일, 또는 적어도 99% 내지 99.9% 동일하다. 그러나, 서열번호: 18의 아미노산 서열을 암호화하는 다른 핵산 서열은 rAAV8.AR2.08 캡시드를 생성하는 데 사용하기 위해 선택될 수 있다. 특정 구현예에서, 핵산 서열은 서열번호: 17의 핵산 서열 또는 서열번호: 18을 암호화하는 서열번호: 17과 적어도 70% 내지 99% 동일, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 99% 동일한 서열을 갖는다. 특정 구현예에서, 핵산 서열은 서열번호: 17의 핵산 서열 또는 서열번호: 18의 vp2 캡시드 단백질(약 aa 138 내지 738)을 암호화하는 서열번호: 17의 약 nt 412 내지 약 nt 2214와 적어도 70% 내지 99.%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 99% 동일한 서열을 갖는다. 특정 구현예에서, 핵산 서열은 서열번호: 17의 약 nt 607 내지 약 nt 2214의 핵산 서열 또는 서열번호: 18의 vp3 캡시드 단백질(약 aa 204 내지 738)을 암호화하는 nt 서열번호: 17과 적어도 70% 내지 99.%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 99% 동일한 서열을 갖는다.
본 발명은 또한 하나 이상의 잔기가 탈아미드화를 감소시키기 위해 변경된 돌연변이체 AAV8.2.08을 암호화하는 핵산 서열, 또는 본원에서 식별되는 다른 변형을 포함한다. 이러한 핵산 서열은 돌연변이체 rAAV8.2.08의 생산에 사용될 수 있다.
특정 구현예에서, 신규 AAV5.5.9 캡시드가 제공된다. AAV를 암호화하는 핵산 서열은 서열번호: 9에서 제공되고 암호화된 아미노산 서열은 서열번호: 10에서 제공된다. AAV5.5.9, AAV9, 및 AAVPHP.B의 아미노산 서열의 정렬은 도 12a에 제시되어 있다. AAV5.5.9, AAV9, 및 AAVPHP.B의 핵산 서열의 정렬은 도 12b-12e에 제시되어 있다. 일 구현예에서, 재조합 아데노-연관 바이러스(rAAV)는 하기를 포함하는 AAV5.5.9 캡시드 단백질을 포함하는 AAV5.5.9 캡시드를 갖는다: 서열번호: 10의 1 내지 726의 예측된 아미노산 서열을 암호화하는 핵산 서열로부터 발현에 의해 생성된 AAV5.5.9 vp1 단백질, 서열번호: 9로부터 생성된 vp1 단백질, 또는 서열번호: 1의 1 내지 726의 예측된 아미노산 서열을 암호화하는 서열번호: 9와 적어도 70% 동일한 핵산 서열로부터 생성된 vp1 단백질의 이질적 집단; 서열번호: 10의 적어도 약 아미노산 137 내지 726의 예측된 아미노산 서열을 암호화하는 핵산 서열로부터 발현에 의해 생성된 AAV5.5.9 vp2 단백질, 서열번호: 9의 적어도 뉴클레오티드 409 내지 2178을 포함하는 서열로부터 생성된 vp2 단백질, 또는 서열번호: 10의 적어도 약 아미노산 137 내지 726의 예측된 아미노산 서열을 암호화하는 서열번호: 9의 적어도 뉴클레오티드 577 내지 2178과 적어도 70% 동일한 핵산 서열로부터 생성된 vp2 단백질의 이종 집단, 및 서열번호: 10의 적어도 약 아미노산 193 내지 726의 예측된 아미노산 서열을 암호화하는 핵산 서열로부터 발현에 의해 생성된 AAV5.5.9 vp3 단백질, 서열번호: 9의 적어도 뉴클레오티드 577 내지 2178을 포함하는 서열로부터 생성된 vp3 단백질, 또는 서열번호: 10의 적어도 약 아미노산 193 내지 726의 예측된 아미노산 서열을 암호화하는 서열번호: 9의 적어도 뉴클레오티드 577 내지 2178과 적어도 70% 동일한 핵산 서열로부터 생성된 vp3 단백질의 이종 집단.
추가적으로 또는 대안적으로, AAV5.5.9 캡시드는 하기를 포함한다: 서열번호: 10의 아미노산 서열을 암호화하는 핵산 서열의 생성물인 vp1 단백질의 이질적 집단, 서열번호: 10의 적어도 약 아미노산 137 내지 726의 아미노산 서열을 암호화하는 핵산 서열의 생성물인 vp2 단백질의 이질적 집단, 및 서열번호: 10의 적어도 아미노산 193 내지 726을 암호화하는 핵산 서열의 생성물인 vp3 단백질의 이질적 집단, 여기서 vp1, vp2 및 vp3 단백질은 서열번호: 10에서 아스파라긴 - 글리신 쌍에서 적어도 2 개의 고도로 탈아미드화된 아스파라긴(N)을 포함하는 아미노산 변형을 갖는 하위집단을 함유하고 임의적으로 다른 탈아미드화된 아미노산을 포함하는 하위집단을 추가로 포함하며, 여기서 탈아미드화는 아미노산 변화를 야기하는 것.
표 C - AAV5.5.9 탈아미드화
Figure pct00006
Figure pct00007
특정 구현예에서, AAV5.5.9 vp1 캡시드 단백질을 암호화하는 핵산 서열은 서열번호: 9에서 제공된다. 다른 구현예에서, 서열번호: 9와 70% 내지 99.9% 동일한 핵산 서열은 AAV5.5.9 캡시드 단백질을 발현하도록 선택될 수 있다. 특정 다른 구현예에서, 핵산 서열은 서열번호: 9와 적어도 약 75% 동일, 적어도 80% 동일, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97% 동일, 또는 적어도 99% 내지 99.9% 동일하다. 그러나, 서열번호: 10의 아미노산 서열을 암호화하는 다른 핵산 서열은 rAAV5.5.9 캡시드를 생성하는 데 사용하기 위해 선택될 수 있다. 특정 구현예에서, 핵산 서열은 서열번호: 10의 핵산 서열 또는 서열번호: 10을 암호화하는 서열번호: 9와 적어도 70% 내지 99% 동일, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 99% 동일한 서열을 갖는다. 특정 구현예에서, 핵산 서열은 서열번호: 9의 핵산 서열 또는 서열번호: 10의 vp2 캡시드 단백질(약 aa 137 내지 726)을 암호화하는 서열번호: 9의 약 nt 409 내지 약 nt 2178과 적어도 70% 내지 99.%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 99% 동일한 서열을 갖는다. 특정 구현예에서, 핵산 서열은 서열번호: 9의 약 nt 577 내지 약 nt 2178의 핵산 서열 또는 서열번호: 10의 vp3 캡시드 단백질(약 aa 193 내지 726)을 암호화하는 서열번호: 9의 nt 577 내지 2178과 적어도 70% 내지 99%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 99% 동일한 서열을 갖는다.
본 발명은 또한 하나 이상의 잔기가 탈아미드화를 감소시키기 위해 변경된 돌연변이체 AAV5.5.9를 암호화하는 핵산 서열, 또는 본원에서 식별되는 다른 변형을 포함한다. 이러한 핵산 서열은 돌연변이체 rAAV5.5.9의 생산에 사용될 수 있다.
I. rAAV 벡터
상기 나타낸 바와 같이, 신규 AAV 서열 및 단백질은 rAAV의 생산에 유용하고, 또한 안티센스 전달 벡터, 유전자 요법 벡터, 또는 백신 벡터일 수 있는 재조합 AAV 벡터에 유용하다. 추가적으로, 본원에 기재된 조작된 AAV 캡시드를 사용하여 다수의 적합한 핵산 분자를 표적 세포 및 조직에 전달하기 위한 rAAV 벡터를 조작할 수 있다.
AAV 캡시드 내에 패키징되고 숙주 세포에 전달되는 게놈 서열은 전형적으로 최소한, 전이유전자(transgene) 및 이의 조절 서열, 및 AAV 도립된 말단 반복부(ITR)로 구성된다. 단일-가닥 AAV 및 자기-상보성(sc) AAV 둘 다는 rAAV에 포함된다. 전이유전자는 관심있는 폴리펩티드, 단백질, 기능적 RNA 분자(예를 들어, miRNA, miRNA 억제제) 또는 다른 유전자 산물을 암호화하는, 벡터 서열에 이질적인 핵산 코딩 서열이다. 핵산 코딩 서열은 표적 조직의 세포에서 전이유전자 전사, 번역, 및/또는 발현을 허용하는 방식으로 조절 구성요소에 작동적으로 연결된다.
벡터의 AAV 서열은 전형적으로 시스-작용 5' 및 3' 도립된 말단 반복부 서열을 포함한다(예를 들어, B. J. Carter, in "Handbook of Parvoviruses", ed., P. Tijsser, CRC Press, pp. 155 168 (1990) 참조). ITR 서열은 약 145 bp 길이이다. 바람직하게는, 실질적으로 ITR을 암호화하는 전체 서열이 분자에서 사용되지만, 이들 서열의 어느 정도 사소한 변형이 허용가능하다. 이들 ITR 서열을 변형시키는 능력은 당업계의 기술 내에 있다. (예를 들어, Sambrook et al, "Molecular Cloning. A Laboratory Manual", 2d ed., Cold Spring Harbor Laboratory, New York (1989); 및 K. Fisher et al., J. Virol., 70:520 532 (1996)과 같은 텍스트 참조). 본 발명에 이용되는 이러한 분자의 예는 전이유전자를 함유하는 "시스-작용" 플라스미드이며, 여기서 선택된 전이유전자 서열 및 연관된 조절 요소는 5' 및 3' AAV ITR 서열에 의해 측면에 있다. 일 구현예에서, ITR은 캡시드를 공급하는 것과 상이한 AAV로부터 유래되어, 가성형태화(pseudotyped) 벡터를 야기한다. 일 구현예에서, ITR 서열은 AAV2로부터 유래한다. D-서열 및 말단 분해 부위(trs)가 결실된 ΔITR이라고 명명된 5' ITR의 단축된 버전이 기재되었다. 다른 구현예에서, 전장 AAV 5' 및 3' ITR이 사용된다. 그러나, 다른 AAV 공급원으로부터의 ITR이 선택될 수 있다. ITR의 공급원이 AAV2로부터 유래되고 AAV 캡시드가 또 다른 AAV 공급원으로부터 유래되는 경우, 생성된 벡터는 가성형태화라고 명명될 수 있다. 그러나, 이들 요소의 다른 형태가 적합할 수 있다.
재조합 AAV 벡터에 대해 상기 식별된 주요 요소 이외에도, 벡터는 또한 플라스미드 벡터로 형질감염되거나 또는 본 발명에 의해 생성된 바이러스로 감염된 세포에서 전사, 번역 및/또는 발현을 허용하는 방식으로 전이유전자에 작동가능하게 연결된 필요한 통상적인 제어 요소를 포함한다. 본원에 사용된 바와 같이, "작동가능하게 연결된" 서열은 관심있는 유전자와 인접하는 발현 제어 서열 및 관심있는 유전자를 제어하기 위해 트랜스에서 또는 떨어져서 작용하는 발현 제어 서열 둘 다를 포함한다.
조절 제어 요소는 전형적으로 예를 들어, 선택된 5' ITR 서열 및 코딩 서열 사이에 위치한 발현 제어 서열의 일부로서 프로모터 서열을 함유한다. 구성적 프로모터, 조절가능한 프로모터[예를 들어, WO 2011/126808 및 WO 2013/04943 참조], 조직 특이적 프로모터, 또는 생리학적 단서에 반응하는 프로모터가 사용될 수 있으며 본원에 기재된 벡터에 활용될 수 있다. 프로모터(들)는 상이한 공급원, 예를 들어, 인간 사이토메갈로바이러스(CMV) 급초기 인핸서/프로모터, SV40 초기 인핸서/프로모터, JC 폴리오마바이러스 프로모터, 미엘린 염기성 단백질(MBP) 또는 신경교 섬유질 산성 단백질(GFAP) 프로모터, 단순 헤르페스 바이러스(HSV-1) 잠복기 연관 프로모터(LAP), 라우스 육종 바이러스(RSV) 긴 말단 반복부(LTR) 프로모터, 뉴런-특이적 프로모터(NSE), 혈소판 유래 성장 인자(PDGF) 프로모터, hSYN, 멜라닌-응집 호르몬(MCH) 프로모터, CBA, 기질 금속단백질 프로모터(MPP), 및 닭 베타-액틴 프로모터로부터 선택될 수 있다. 일 구현예에서, 프로모터는 본원에 예시된 LSP로 불리는 것과 같은 간 특이적 프로모터이다.
프로모터 이외에도 벡터는 하나 이상의 다른 적절한 전사 개시, 종결, 인핸서 서열, 효율적인 RNA 처리 신호 예컨대 스플라이싱 및 폴리아데닐화(폴리A) 신호; 세포질 mRNA 예를 들어 WPRE를 안정화시키는 서열; 번역 효율을 향상시키는 서열(즉, 코작(Kozak) 공통 서열); 단백질 안정성을 향상시키는 서열; 및 원하는 경우, 암호화된 생성물의 분비를 향상시키는 서열을 함유할 수 있다. 적합한 인핸서의 예는 CMV 인핸서이다. 다른 적합한 인핸서는 원하는 표적 조직 적응증에 적절한 것들을 포함한다. 일 구현예에서, 발현 카세트는 하나 이상의 발현 인핸서를 포함한다. 일 구현예에서, 발현 카세트는 2 개 이상의 발현 인핸서를 함유한다. 이들 인핸서는 동일할 수 있거나 또는 서로 상이할 수 있다. 예를 들어, 인핸서는 CMV 급초기 인핸서를 포함할 수 있다. 이 인핸서는 서로 인접하게 위치한 2 개의 카피에 존재할 수 있다. 대안적으로, 인핸서의 이중 카피는 하나 이상의 서열에 의해 분리될 수 있다. 또 다른 구현예에서, 발현 카세트는 인트론, 예를 들어, 닭 베타-액틴 인트론을 추가로 함유한다. 다른 적합한 인트론은 예를 들어, WO 2011/126808에 기재된 바와 같이 당업계에 알려진 것들을 포함한다. 적합한 폴리A 서열의 예는 예를 들어, SV40, SV50, 소 성장 호르몬(bGH), 인간 성장 호르몬, 및 합성 폴리A를 포함한다. 임의적으로, 하나 이상의 서열은 mRNA를 안정화시키도록 선택될 수 있다. 이러한 서열의 예는 폴리A 서열의 상류 및 코딩 서열의 하류에서 조작될 수 있는 변형된 WPRE 서열이다[예를 들어, MA Zanta-Boussif, et al, Gene Therapy (2009) 16: 605-619 참조.
이들 rAAV는 보호 면역을 유도하는 것을 포함하여, 치료 목적 및 면역화를 위한 유전자 전달에 특히 적절하다. 추가로, 본 발명의 조성물은 또한 시험관내에서 원하는 유전자 산물의 생산에 사용될 수 있다. 시험관내 생산을 위해, 원하는 생성물(예를 들어, 단백질)은 숙주 세포를 원하는 생성물을 암호화하는 분자를 함유하는 rAAV로 형질감염시키고 발현을 허용하는 조건 하에 세포 배양물을 배양한 후 원하는 배양물로부터 수득될 수 있다. 그 다음에 발현된 생성물은 원하는 경우 정제 및 단리될 수 있다. 형질감염, 세포 배양, 정제, 및 단리에 적합한 기술은 당업자에게 알려져 있다.
치료용 전이유전자
전이유전자에 의해 암호화된 유용한 생성물은 결함 또는 결핍 유전자를 대체하거나, 불활성화 또는 "녹아웃(knock-out)" 또는 "녹다운(knock-down)"시키거나 또는 바람직하지 않게 높은 수준으로 발현하거나, 또는 원하는 치료 효과를 갖는 유전자 산물을 전달하는 유전자의 발현을 감소시키는 다양한 유전자 산물을 포함한다. 대부분의 구현예에서, 요법은 "체세포 유전자 요법", 즉, 유전자를 정자 또는 난자를 생성하지 않는 신체의 세포에 전달할 것이다. 특정 구현예에서, 전이유전자 발현 단백질은 천연 인간 서열의 서열을 갖는다. 그러나, 다른 구현예에서, 합성 단백질이 발현된다. 이러한 단백질은 인간의 치료를 위해 의도될 수 있거나, 또는 다른 구현예에서, 개 또는 고양이 집단과 같은 반려 동물을 포함하는 동물의 치료를 위해, 또는 가축 또는 인간 집단과 접촉하게 되는 다른 동물의 치료를 위해 설계될 수 있다.
적합한 유전자 산물의 예는 가족성 고콜레스테롤혈증, 근위축증, 낭포성 섬유증, 및 희귀 또는 고아 질환과 연관된 것들을 포함할 수 있다. 이러한 희귀 질환의 예는 특히 척수근위축증(SMA), 헌팅턴병, 레트 증후군(예를 들어, 메틸-CpG-결합 단백질 2(MeCP2); UniProtKB - P51608), 근위축성 측색 경화증(ALS), 뒤시엔느형 근위축증, 프레드리히 운동실조증(예를 들어, 프라탁신), 프로그래뉼린(PRGN)(전측두엽 치매(FTD), 진행성 비유창성 실어증(PNFA) 및 의미 치매를 포함하는 비알츠하이머 대뇌 변성과 연관됨)을 포함할 수 있다. 예를 들어, www.orpha.net/consor/cgi-bin/Disease_Search_List.php; rarediseases.info.nih.gov/diseases 참조.
적합한 유전자의 예는 예를 들어, 비제한적으로, 인슐린, 글루카곤, 글루카곤-유사 펩티드-1(GLP1), 성장 호르몬(GH), 부갑상선 호르몬(PTH), 성장 호르몬 방출 인자(GRF), 난포 자극 호르몬(FSH), 황체형성 호르몬(LH), 인간 융모성 고나도트로핀(hCG), 혈관 내피 성장 인자(VEGF), 안지오포이에틴, 안지오스타틴, 과립구 콜로니 자극 인자(GCSF), 에리트로포이에틴(EPO)(예를 들어, 인간, 개 또는 고양이 epo 포함), 결합 조직 성장 인자(CTGF)를 포함하는 호르몬 및 성장 및 분화 인자, 예를 들어, 염기성 섬유아세포 성장 인자(bFGF), 산성 섬유아세포 성장 인자(aFGF), 표피 성장 인자(EGF), 혈소판-유래 성장 인자(PDGF), 인슐린 성장 인자 I 및 II(IGF-I 및 IGF-II)를 포함하는 신경영양 인자, TGFα, 액티빈, 인히빈, 또는 골 형성 단백질(BMP) BMP 1-15 중 임의의 하나를 포함하는 형질전환 성장 인자 α 슈퍼패밀리 중 임의의 하나, 성장 인자의 헤레글루인/뉴레굴린/ARIA/neu 분화 인자(NDF) 패밀리 중 임의의 하나, 신경 성장 인자(NGF), 뇌-유도 신경영양 인자(BDNF), 뉴로트로핀 NT-3 및 NT-4/5, 섬모 신경영양 인자(CNTF), 아교세포주 유래 신경영양 인자(GDNF), 뉴투린, 아그린, 세마포린/콜랍신의 패밀리 중 임의의 하나, 네트린-1 및 네트린-2, 간세포 성장 인자(HGF), 에프린, 노긴, 소닉 헤지혹 및 티로신 히드록실라제를 포함할 수 있다.
다른 유용한 전이유전자 산물은 면역계를 조절하는 단백질, 예컨대 비제한적으로 사이토카인 및 림포카인 예컨대 트롬보포이에틴(TPO), 인터류킨(IL) IL-1 내지 IL-36(예를 들어, 인간 인터류킨 IL-1, IL-1α, IL-1β, IL-2, IL-3, IL-4, IL-6, IL-8, IL-12, IL-11, IL-12, IL-13, IL-18, IL-31, IL-35 포함), 단핵구 화학주성 단백질, 백혈병 억제 인자, 과립구-대식세포 콜로니 자극 인자, Fas 리간드, 종양 괴사 인자 α 및 β, 인터페론 α, β, 및 γ, 줄기 세포 인자, flk-2/flt3 리간드를 포함한다. 면역계에 의해 생성된 유전자 산물은 또한 본 발명에 유용하다. 이들은, 비제한적으로, 면역글로불린 IgG, IgM, IgA, IgD 및 IgE, 키메라 면역글로불린, 인간화 항체, 단일 쇄 항체, T 세포 수용체, 키메라 T 세포 수용체, 단일 쇄 T 세포 수용체, 클래스 I 및 클래스 II MHC 분자, 뿐만 아니라 조작된 면역글로불린 및 MHC 분자를 포함한다. 예를 들어, 특정 구현예에서, 예를 들어, 항-IgE, 항-IL31, 항-CD20, 항-NGF, 항-GnRH와 같은 rAAV 항체는 개 또는 고양이 항체를 전달하도록 설계될 수 있다. 유용한 유전자 산물은 또한 보체 조절 단백질, 막 보조인자 단백질(MCP), 붕괴 가속화 인자(DAF), CR1, CF2, CD59, 및 C1 에스테라제 억제제(C1-INH)와 같은 보체 조절 단백질을 포함한다.
또 다른 유용한 유전자 산물은 호르몬, 성장 인자, 사이토카인, 림포카인, 조절 단백질 및 면역계 단백질에 대한 수용체 중 임의의 하나를 포함한다. 본 발명은 저밀도 지단백질(LDL) 수용체, 고밀도 지단백질(HDL) 수용체, 초저밀도 지단백질(VLDL) 수용체, 및 스캐빈저 수용체를 포함하는 콜레스테롤 조절 및/또는 지질 조절을 위한 수용체를 포함한다. 본 발명은 또한 글루코코르티코이드 수용체 및 에스트로겐 수용체를 포함하는 스테로이드 호르몬 수용체 슈퍼패밀리의 구성원, 비타민 D 수용체 및 다른 핵 수용체와 같은 유전자 산물을 포함한다. 또한, 유용한 유전자 산물은 jun, fos, max, mad, 혈청 반응 인자(SRF), AP-1, AP2, myb, MyoD 및 미오게닌, ETS-박스 함유 단백질, TFE3, E2F, ATF1, ATF2, ATF3, ATF4, ZF5, NFAT, CREB, HNF-4, C/EBP, SP1, CCAAT-박스 결합 단백질, 인터페론 조절 인자(IRF-1), 빌름스 종양 단백질, ETS-결합 단백질, STAT, GATA-박스 결합 단백질, 예를 들어, GATA-3, 및 윙드 헬릭스 단백질의 포크헤드 패밀리와 같은 전사 인자를 포함한다.
다른 유용한 유전자 산물은 카르바모일 신테타제 I, 오르티닌 트랜스카르바밀라제(OTC), 아르기노숙시네이트 신테타제, 아르구노숙시네이트 리아제 결핍의 치료를 위한 아르기노숙시네이트 리아제(ASL), 아르기나제, 푸마릴아세테이트 히드롤라제, 페닐알라닌 히드록실라제, 알파-1 항트립신, 레서스 알파-태아단백질(AFP), 레서스 융모성 고나도트로핀(CG), 글루코스-6-포스파타제, 포르포빌리노겐 데아미나제, 시스타티온 베타-신타제, 분지쇄 케토산 데카르복실라제, 알부민, 이소발레릴-coA 데히드로게나제, 프로피오닐 CoA 카르복실라제, 메틸 말로닐 CoA 뮤타제, 글루타릴 CoA 데히드로게나제, 인슐린, 베타-글루코시다제, 피루베이트 카르복실레이트, 간 포스포릴라제, 포스포릴라제 키나제, 글리신 데카르복실라제, H-단백질, T-단백질, 낭포성 섬유증 막횡단 조절인자(CFTR) 서열, 및 디스트로핀 유전자 산물[예를 들어, 미니- 또는 마이크로-디스트로핀]을 포함한다. 또 다른 유용한 유전자 산물은 효소 대체 요법에 유용할 수 있는 것과 같은 효소를 포함하며, 효소 활성의 결핍으로 야기되는 다양한 상태에 유용하다. 예를 들어, 만노스-6-포스페이트를 함유하는 효소는 리소좀 축적 질환에 대한 요법에 활용될 수 있다(예를 들어, β-글루쿠로니다제(GUSB)를 암호화하는 적합한 유전자 포함).
특정 구현예에서, rAAV는 유전자 편집 시스템에 사용될 수 있으며, 이 시스템은 하나의 rAAV 또는 다수의 rAAV 스톡의 공-투여를 수반할 수 있다. 예를 들어, rAAV는 SpCas9, SaCas9, ARCUS, Cpf1, 및 다른 적합한 유전자 편집 작제물을 전달하도록 조작될 수 있다.
또 다른 유용한 유전자 산물은 혈우병 B(인자 IX 포함) 및 혈우병 A(인자 VIII 및 이의 변이체, 예컨대 이종이량체 및 B-결실 도메인의 경쇄 및 중쇄 포함; 미국 특허 번호 제6,200,560호 및 미국 특허 번호 제6,221,349호)를 포함하는 혈우병의 치료에 사용되는 것들을 포함한다. 일부 구현예에서, 미니유전자는 10 개 아미노산 신호 서열을 암호화하는 인자 VIII 중쇄의 처음 57 개 염기 쌍, 뿐만 아니라 인간 성장 호르몬(hGH) 폴리아데닐화 서열을 포함한다. 대안적인 구현예에서, 미니유전자는 A1 및 A2 도메인, 뿐만 아니라 B 도메인의 N-말단으로부터의 5 개 아미노산, 및/또는 B 도메인의 C-말단의 85 개 아미노산, 뿐만 아니라 A3, C1 및 C2 도메인을 추가로 포함한다. 또 다른 구현예에서, 인자 VIII 중쇄 및 경쇄를 암호화하는 핵산은 B 도메인의 14 개 아미노산을 암호화하는 42 개 핵산에 의해 분리된 단일 미니유전자로 제공된다[미국 특허 번호 제6,200,560호].
다른 유용한 유전자 산물은 삽입, 결실 또는 아미노산 치환을 함유하는 비-자연적으로 발생하는 아미노산 서열을 갖는 키메라 또는 하이브리드 폴리펩티드와 같은 비-자연적으로 발생하는 폴리펩티드를 포함한다. 예를 들어, 단일-쇄 조작된 면역글로불린은 특정 면역손상된 환자에서 유용할 수 있다. 다른 유형의 비-자연적으로 발생하는 유전자 서열은 안티센스 분자 및 표적의 과발현을 감소시키는 데 사용될 수 있는 리보자임과 같은 촉매적 핵산을 포함한다.
유전자 발현의 감소 및/또는 조절은 암 및 건선과 같이 세포를 과증식하는 것을 특징으로 하는 과증식성 상태의 치료에 특히 바람직하다. 표적 폴리펩티드는 정상 세포와 비교하여 과증식성 세포에서 배타적으로 또는 더 높은 수준으로 생성되는 폴리펩티드를 포함한다. 표적 항원은 myb, myc, fyn과 같은 종양유전자, 및 전위 유전자 bcr/abl, ras, src, P53, neu, trk 및 EGRF에 의해 암호화된 폴리펩티드를 포함한다. 표적 항원으로서 종양유전자 산물 이외에도, 항암 치료 및 보호 레지멘을 위한 표적 폴리펩티드는 B 세포 림프종에 의해 만들어진 항체의 가변 영역 및 일부 구현예에서 또한 자가면역 질환에 대한 표적 항원으로 사용되는 T 세포 림프종의 T 세포 수용체의 가변 영역을 포함한다. 다른 종양-연관 폴리펩티드는 모노클로날 항체 17-1A에 의해 인식된 폴리펩티드 및 폴레이트 결합 폴리펩티드를 포함하는 종양 세포에서 더 높은 수준으로 발견되는 폴리펩티드와 같은 표적 폴리펩티드로서 사용될 수 있다.
다른 적합한 치료용 폴리펩티드 및 단백질은 "자기"-지향 항체를 생성하는 세포 및 세포 수용체를 포함하는 자가면역과 연관된 표적에 대한 광범위한 기반 보호 면역 반응을 부여함으로써 자가면역 질환 및 장애를 앓고 있는 개체를 치료하는 데 유용할 수 있는 것들을 포함한다. T 세포 매개 자가면역 질환은 류머티스성 관절염(RA), 다발성 경화증(MS), 쇼그렌 증후군, 사르코이드증, 인슐린 의존성 당뇨병(IDDM), 자가면역 갑상선염, 반응성 관절염, 강직성 척수염, 경피증, 다발성근염, 피부근염, 건선, 혈관염, 베게너 육아종증, 크론병 및 궤양성 대장염을 포함한다. 이들 질환 각각은 내인성 항원에 결합하고 자가면역 질환과 연관된 염증성 캐스캐이드를 개시하는 T 세포 수용체(TCR)를 특징으로 한다.
rAAV를 통해 전달될 수 있는 추가의 예시적인 유전자는 비제한적으로 하기를 포함한다: 글리코겐 축적병 또는 결핍 유형 1A(GSD1)와 연관된 글루코스-6-포스파타제, PEPCK 결핍과 연관된 포스포에놀피루베이트-카르복시키나제(PEPCK); 발작 및 중증 신경발달 장애와 연관된 세린/트레오닌 키나제 9(STK9)로도 알려져 있는 사이클린-의존성 키나제-유사 5(CDKL5); 갈락토스혈증과 연관된 갈락토스-1 포스페이트 우리딜 트랜스퍼라제; 페닐케토뇨증(PKU)과 연관된 페닐알라닌 히드록실라제; 단풍시럽뇨병과 연관된 분지쇄 알파-케토산 데히드로게나제; 티로신혈증 유형 1과 연관된 푸마릴아세토아세테이트 히드롤라제; 메틸말론산혈증과 연관된 메틸말로닐-CoA 뮤타제; 중간 쇄 아세틸 CoA 결핍과 연관된 중간 쇄 아실 CoA 데히드로게나제; 오르티닌 트랜스카르바밀라제 결핍과 연관된 오르티닌 트랜스카르바밀라제(OTC); 시트룰린혈증과 연관된 아르기니노숙신산 신테타제(ASS1); 레시틴-콜레스테롤 아실트랜스퍼라제(LCAT) 결핍; 아메틸말론산혈증(MMA); 니만-픽병, 유형 C1); 프로피온산혈증(PA); 가족성 고콜레스테롤혈증(FH)과 연관된 저밀도 지단백질 수용체(LDLR) 단백질; 크리글러-나자르병과 연관된 UDP-글루코우로노실트랜스퍼라제; 중증 복합 면역결핍병과 연관된 아데노신 데아미나제; 통풍 및 레쉬-니한 증후군과 연관된 히포크산틴 구아닌 포스포리보실 트랜스퍼라제; 비오티미다제 결핍과 연관된 비오티미다제; 파브리병과 연관된 알파-갈락토시다제 A(a-Gal A)); 윌슨병과 연관된 ATP7B; 고셰병 유형 2 및 3과 연관된 베타-글루코세레브로시다제; 젤웨거 증후군과 연관된 퍼옥시좀 막 단백질 70 kDa; 이염색성 백질장애와 연관된 아릴술파타제 A(ARSA), 크라베병과 연관된 갈락토세레브로시다제(GALC) 효소, 폼페병과 연관된 알파-글루코시다제(GAA); 니만 픽병 유형 A와 연관된 스핑고미엘리나제(SMPD1) 유전자; 성인 발병 유형 II 시트룰린혈증(CTLN2)과 연관된 아르기니노숙시네이트 신타제; 우레아 순환 장애와 연관된 카르바모일-포스페이트 신타제 1(CPS1); 척수근위축증과 연관된 생존 운동 뉴런(SMN) 단백질; 파아버 지방육아종증과 연관된 세라미다제; GM2 강글리오시드증 및 테이-삭스병 및 샌드호프병과 연관된 b-헥소스아미니다제; 아스파르틸-글루코사민뇨와 연관된 아스파르틸글루코사미니다제; 푸코시드축적증과 연관된 α-푸코시다제; 알파-만노시드증과 연관된 α-만노시다제; 급성 간헐성 포르피린증(AIP)과 연관된 포르포빌리노겐 데아미나제; 알파-1 항트립신 결핍(기종)의 치료를 위한 알파-1 항트립신; 지중해 빈혈 또는 신부전으로 인한 빈혈의 치료를 위한 에리트로포이에틴; 허혈성 질환의 치료를 위한 혈관 내피 성장 인자, 안지오포이에틴-1, 및 섬유아세포 성장 인자; 예를 들어, 죽상경화증, 혈전증, 또는 색전증에서 볼 수 있는 차단된 혈관의 치료를 위한 트롬보모듈린 및 조직 인자 경로 억제제; 파킨슨병의 치료를 위한 방향족 아미노산 데카르복실라네(AADC), 및 티로신 히드록실라제(TH); 울혈성 심부전의 치료를 위한 베타 아드레날린 수용체, 포스포람반에 대한 안티센스 또는 돌연변이체 형태, 근(내)형질 망상 아데노신 트리포스파타제-2(SERCA2), 및 심장 아데닐릴 사이클라제; 다양한 암의 치료를 위한 p53과 같은 종양 저해 유전자; 염증성 및 면역 장애 및 암의 치료를 위한 다양한 인터류킨 중 하나와 같은 사이토카인; 근위축증의 치료를 위한 디스트로핀 또는 미니디스트로핀 및 유트로핀 또는 미니유트로핀; 및 당뇨병의 치료를 위한 인슐린 또는 GLP-1.
관심있는 추가적인 유전자 및 질환은 예를 들어, 선천성 감각 자율 신경병증 유형 VI과 같은 디스토닌 유전자 관련 질환(DST 유전자는 디스토닌을 암호화하며; 이중 AAV 벡터는 단백질의 크기(~7570 aa)로 인해 필요할 수 있음); 기능 돌연변이체의 상실은 통증을 느끼지 못하게 하고 기능 돌연변이체의 획득은 통증 상태를 야기하는, 홍색사지통증과 같은 SCN9A 관련 질환을 포함한다. 또 다른 상태는 NEFL 유전자(신경섬유 경쇄)의 돌연변이로 인한 샤르코-마리-투스병 유형 1F 및 2E이며, 다양한 임상 및 전기생리학적 발현에 따른 진행성 말초 운동 및 감각 신경병증을 특징으로 한다.
특정 구현예에서, 본원에 기재된 rAAV는 점액다당류(MPS) 장애의 치료에 사용될 수 있다. 이러한 rAAV는 MPS I(헐러, 헐러-샤이에 및 샤이에 증후군)을 치료하기 위한 α-L-이두로니다제(IDUA)를 암호화하는 핵산 서열; MPS II(헌터 증후군)를 치료하기 위한 이두로네이트-2-술파타제(IDS)를 암호화하는 핵산 서열; MPSIII A, B, C, 및 D(산필리포 증후군)를 치료하기 위한 술파미다제(SGSH)를 암호화하는 핵산 서열; MPS IV A 및 B(모르키오 증후군)를 치료하기 위한 N-아세틸갈락토사민-6-술페이트 술파타제(GALNS)를 암호화하는 핵산 서열; MPS VI(마로토-라미 증후군)를 치료하기 위한 아릴술파타제 B(ARSB)를 암호화하는 핵산 서열; MPSI IX(히알루로니다제 결핍)를 치료하기 위한 히알루로니다제를 암호화하는 핵산 서열 및 MPS VII(슬라이 증후군)을 치료하기 위한 베타-글루쿠로니다제를 암호화하는 핵산 서열 운반을 함유할 수 있다.
면역원성 전이유전자
일부 구현예에서, 암과 연관된 유전자 산물(예를 들어, 종양 저해인자)을 암호화하는 핵산을 포함하는 rAAV 벡터는 rAAV 벡터를 보유하는 rAAV를 암이 있는 대상체에 투여함으로써, 암을 치료하는 데 사용될 수 있다. 일부 구현예에서, 암과 연관된 유전자 산물(예를 들어, 종양유전자)의 발현을 억제하는 작은 간섭 핵산(예를 들어, shRNA, miRNA)을 암호화하는 핵산을 포함하는 rAAV 벡터는 rAAV 벡터를 보유하는 rAAV를 암이 있는 대상체에 투여함으로써, 암을 치료하는 데 사용될 수 있다. 일부 구현예에서, 암과 연관된 유전자 산물(또는 암과 연관된 유전자의 발현을 억제하는 기능적 RNA)을 암호화하는 핵산을 포함하는 rAAV 벡터는 예를 들어, 암을 연구하거나 또는 암을 치료하는 치료제를 식별하기 위한 연구 목적으로 사용될 수 있다. 하기는 암 발병과 연관되는 것으로 알려진 예시적인 유전자(예를 들어, 종양유전자 및 종양 저해인자)의 비제한적인 목록이다: AARS, ABCB1, ABCC4, ABI2, ABL1, ABL2, ACK1, ACP2, ACY1, ADSL, AK1, AKR1C2, AKT1, ALB, ANPEP, ANXA5, ANXA7, AP2M1, APC, ARHGAP5, ARHGEF5, ARID4A, ASNS, ATF4, ATM, ATP5B, ATP5O, AXL, BARD1, BAX, BCL2, BHLHB2, BLMH, BRAF, BRCA1, BRCA2, BTK, CANX, CAP1, CAPN1, CAPNS1, CAV1, CBFB, CBLB, CCL2, CCND1, CCND2, CCND3, CCNE1, CCT5, CCYR61, CD24, CD44, CD59, CDC20, CDC25, CDC25A, CDC25B, CDC2L5, CDK10, CDK4, CDK5, CDK9, CDKL1, CDKN1A, CDKN1B, CDKN1C, CDKN2A, CDKN2B, CDKN2D, CEBPG, CENPC1, CGRRF1, CHAF1A, CIB1, CKMT1, CLK1, CLK2, CLK3, CLNS1A, CLTC, COL1A1, COL6A3, COX6C, COX7A2, CRAT, CRHR1, CSF1R, CSK, CSNK1G2, CTNNA1, CTNNB1, CTPS, CTSC, CTSD, CUL1, CYR61, DCC, DCN, DDX10, DEK, DHCR7, DHRS2, DHX8, DLG3, DVL1, DVL3, E2F1, E2F3, E2F5, EGFR, EGR1, EIF5, EPHA2, ERBB2, ERBB3, ERBB4, ERCC3, ETV1, ETV3, ETV6, F2R, FASTK, FBN1, FBN2, FES, FGFR1, FGR, FKBP8, FN1, FOS, FOSL1, FOSL2, FOXG1A, FOXO1A, FRAP1, FRZB, FTL, FZD2, FZD5, FZD9, G22P1, GAS6, GCN5L2, GDF15, GNA13, GNAS, GNB2, GNB2L1, GPR39, GRB2, GSK3A, GSPT1, GTF2I, HDAC1, HDGF, HMMR, HPRT1, HRB, HSPA4, HSPA5, HSPA8, HSPB1, HSPH1, HYAL1, HYOU1, ICAM1, ID1, ID2, IDUA, IER3, IFITM1, IGF1R, IGF2R, IGFBP3, IGFBP4, IGFBP5, IL1B, ILK, ING1, IRF3, ITGA3, ITGA6, ITGB4, JAK1, JARID1A, JUN, JUNB, JUND, K-알파-1, KIT, KITLG, KLK10, KPNA2, KRAS2, KRT18, KRT2A, KRT9, LAMB1, LAMP2, LCK, LCN2, LEP, LITAF, LRPAP1, LTF, LYN, LZTR1, MADH1, MAP2K2, MAP3K8, MAPK12, MAPK13, MAPKAPK3, MAPRE1, MARS, MAS1, MCC, MCM2, MCM4, MDM2, MDM4, MET, MGST1, MICB, MLLT3, MME, MMP1, MMP14, MMP17, MMP2, MNDA, MSH2, MSH6, MT3, MYB, MYBL1, MYBL2, MYC, MYCL1, MYCN, MYD88, MYL9, MYLK, NEO1, NF1, NF2, NFKB1, NFKB2, NFSF7, NID, NINE, NMBR, NME1, NME2, NME3, NOTCH1, NOTCH2, NOTCH4, NPM1, NQO1, NR1D1, NR2F1, NR2F6, NRAS, NRG1, NSEP1, OSM, PA2G4, PABPC1, PCNA, PCTK1, PCTK2, PCTK3, PDGFA, PDGFB, PDGFRA, PDPK1, PEA15, PFDN4, PFDN5, PGAM1, PHB, PIK3CA, PIK3CB, PIK3CG, PIM1, PKM2, PKMYT1, PLK2, PPARD, PPARG, PPIH, PPP1CA, PPP2R5A, PRDX2, PRDX4, PRKAR1A, PRKCBP1, PRNP, PRSS15, PSMA1, PTCH, PTEN, PTGS1, PTMA, PTN, PTPRN, RAB5A, RAC1, RAD50, RAF1, RALBP1, RAP1A, RARA, RARB, RASGRF1, RB1, RBBP4, RBL2, REA, REL, RELA, RELB, RET, RFC2, RGS19, RHOA, RHOB, RHOC, RHOD, RIPK1, RPN2, RPS6 KB1, RRM1, SARS, SELENBP1, SEMA3C, SEMA4D, SEPP1, SERPINH1, SFN, SFPQ, SFRS7, SHB, SHH, SIAH2, SIVA, SIVA TP53, SKI, SKIL, SLC16A1, SLC1A4, SLC20A1, SMO, 스핑고미엘린 포스포디에스테라제 1(SMPD1), SNAI2, SND1, SNRPB2, SOCS1, SOCS3, SOD1, SORT1, SPINT2, SPRY2, SRC, SRPX, STAT1, STAT2, STAT3, STAT5B, STC1, TAF1, TBL3, TBRG4, TCF1, TCF7L2, TFAP2C, TFDP1, TFDP2, TGFA, TGFB1, TGFBI, TGFBR2, TGFBR3, THBS1, TIE, TIMP1, TIMP3, TJP1, TK1, TLE1, TNF, TNFRSF10A, TNFRSF10B, TNFRSF1A, TNFRSF1B, TNFRSF6, TNFSF7, TNK1, TOB1, TP53, TP53BP2, TP5313, TP73, TPBG, TPT1, TRADD, TRAM1, TRRAP, TSG101, TUFM, TXNRD1, TYRO3, UBC, UBE2L6, UCHL1, USP7, VDAC1, VEGF, VHL, VIL2, WEE1, WNT1, WNT2, WNT2B, WNT3, WNT5A, WT1, XRCC1, YES1, YWHAB, YWHAZ, ZAP70, 및 ZNF9.
rAAV 벡터는 세포자멸사를 조절하는 단백질 또는 기능적 RNA를 암호화하는 핵산을 전이유전자로서 포함할 수 있다. 하기는 세포자멸사와 연관된 유전자의 비제한적인 목록이며 이들 유전자 및 이들의 상동체의 생성물을 암호화하고 이들 유전자 또는 이들의 상동체의 발현을 억제하는 작은 간섭 핵산(예를 들어, shRNA, miRNA)을 암호화하는 핵산은 본 발명의 특정 구현예에서 전이유전자로서 유용하다: RPS27A, ABL1, AKT1, APAF1, BAD, BAG1, BAG3, BAG4, BAK1, BAX, BCL10, BCL2, BCL2A1, BCL2L1, BCL2L10, BCL2L11, BCL2L12, BCL2L13, BCL2L2, BCLAF1, BFAR, BID, BIK, NAIP, BIRC2, BIRC3, XIAP, BIRC5, BIRC6, BIRC7, BIRC8, BNIP1, BNIP2, BNIP3, BNIP3L, BOK, BRAF, CARD10, CARD11, NLRC4, CARD14, NOD2, NOD1, CARD6, CARDS, CARDS, CASP1, CASP10, CASP14, CASP2, CASP3, CASP4, CASP5, CASP6, CASP7, CASP8, CASP9, CFLAR, CIDEA, CIDEB, CRADD, DAPK1, DAPK2, DFFA, DFFB, FADD, GADD45A, GDNF, HRK, IGF1R, LTA, LTBR, MCL1, NOL3, PYCARD, RIPK1, RIPK2, TNF, TNFRSF10A, TNFRSF10B, TNFRSF10C, TNFRSF10D, TNFRSF11B, TNFRSF12A, TNFRSF14, TNFRSF19, TNFRSF1A, TNFRSF1B, TNFRSF21, TNFRSF25, CD40, FAS, TNFRSF6B, CD27, TNFRSF9, TNFSF10, TNFSF14, TNFSF18, CD40LG, FASLG, CD70, TNFSF8, TNFSF9, TP53, TP53BP2, TP73, TP63, TRADD, TRAF1, TRAF2, TRAF3, TRAF4, 및 TRAF5.
유용한 전이유전자 산물은 또한 miRNA를 포함한다. miRNA 및 다른 작은 간섭 핵산은 표적 RNA 전사체 절단/분해 또는 표적 메신저 RNA(mRNA)의 번역 억제를 통해 유전자 발현을 조절한다. miRNA는 전형적으로 최종 19-25 개의 비-번역된 RNA 생성물로서 선천적으로 발현된다. miRNA는 표적 mRNA의 3' 비번역된 영역(UTR)과의 서열-특이적 상호작용을 통해 이들의 활성을 나타낸다. 이러한 내인성으로 발현된 miRNA는 헤어핀 전구체를 형성하며 후속적으로 miRNA 듀플렉스로 처리되고, 추가로 "성숙" 단일 가닥 miRNA 분자로 처리된다. 이 성숙 miRNA는 다중단백질 복합체인 miRISC를 유도하며, 이는 성숙 miRNA에 대한 상보성에 기초하여 표적 RNA의 표적 부위, 예를 들어 3' UTR 영역을 식별한다.
miRNA 유전자, 및 이들의 상동체의 하기 비제한적인 목록은 상기 방법의 특정 구현예에서 전이유전자 또는 전이유전자에 의해 암호화된 작은 간섭 핵산(예를 들어, miRNA 스폰지, 안티센스 올리고뉴클레오티드, TuD RNA)에 대한 표적으로 유용하다: hsa-let-7a, hsa-let-7a*, hsa-let-7b, hsa-let-7b*, hsa-let-7c, hsa-let-7c*, hsa-let-7d, hsa-let-7d*, hsa-let-7e, hsa-let-7e*, hsa-let-7f, hsa-let-7f-1*, hsa-let-7f-2*, hsa-let-7g, hsa-let-7g*, hsa-let-71, hsa-let-71*, hsa-miR-1, hsa-miR-100, hsa-miR-100*, hsa-miR-101, hsa-miR-101*, hsa-miR-103, hsa-miR-105, hsa-miR-105*, hsa-miR-106a, hsa-miR-106a*, hsa-miR-106b, hsa-miR-106b*, hsa-miR-107, hsa-miR-10a, hsa-miR-10a*, hsa-miR-10b, hsa-miR-10b*, hsa-miR-1178, hsa-miR-1179, hsa-miR-1180, hsa-miR-1181, hsa-miR-1182, hsa-miR-1183, hsa-miR-1184, hsa-miR-1185, hsa-miR-1197, hsa-miR-1200, hsa-miR-1201, hsa-miR-1202, hsa-miR-1203, hsa-miR-1204, hsa-miR-1205, hsa-miR-1206, hsa-miR-1207-3p, hsa-miR-1207-5p, hsa-miR-1208, hsa-miR-122, hsa-miR-122*, hsa-miR-1224-3p, hsa-miR-1224-5p, hsa-miR-1225-3p, hsa-miR-1225-5p, hsa-miR-1226, hsa-miR-1226*, hsa-miR-1227, hsa-miR-1228, hsa-miR-1228*, hsa-miR-1229, hsa-miR-1231, hsa-miR-1233, hsa-miR-1234, hsa-miR-1236, hsa-miR-1237, hsa-miR-1238, hsa-miR-124, hsa-miR-124*, hsa-miR-1243, hsa-miR-1244, hsa-miR-1245, hsa-miR-1246, hsa-miR-1247, hsa-miR-1248, hsa-miR-1249, hsa-miR-1250, hsa-miR-1251, hsa-miR-1252, hsa-miR-1253, hsa-miR-1254, hsa-miR-1255a, hsa-miR-1255b, hsa-miR-1256, hsa-miR-1257, hsa-miR-1258, hsa-miR-1259, hsa-miR-125a-3p, hsa-miR-125a-5p, hsa-miR-125b, hsa-miR-125b-1*, hsa-miR-125b-2*, hsa-miR-126, hsa-miR-126*, hsa-miR-1260, hsa-miR-1261, hsa-miR-1262, hsa-miR-1263, hsa-miR-1264, hsa-miR-1265, hsa-miR-1266, hsa-miR-1267, hsa-miR-1268, hsa-miR-1269, hsa-miR-1270, hsa-miR-1271, hsa-miR-1272, hsa-miR-1273, hsa-miR-127-3p, hsa-miR-1274a, hsa-miR-1274b, hsa-miR-1275, hsa-miR-127-5p, hsa-miR-1276, hsa-miR-1277, hsa-miR-1278, hsa-miR-1279, hsa-miR-128, hsa-miR-1280, hsa-miR-1281, hsa-miR-1282, hsa-miR-1283, hsa-miR-1284, hsa-miR-1285, hsa-miR-1286, hsa-miR-1287, hsa-miR-1288, hsa-miR-1289, hsa-miR-129*, hsa-miR-1290, hsa-miR-1291, hsa-miR-1292, hsa-miR-1293, hsa-miR-129-3p, hsa-miR-1294, hsa-miR-1295, hsa-miR-129-5p, hsa-miR-1296, hsa-miR-1297, hsa-miR-1298, hsa-miR-1299, hsa-miR-1300, hsa-miR-1301, hsa-miR-1302, hsa-miR-1303, hsa-miR-1304, hsa-miR-1305, hsa-miR-1306, hsa-miR-1307, hsa-miR-1308, hsa-miR-130a, hsa-miR-130a*, hsa-miR-130b, hsa-miR-130b*, hsa-miR-132, hsa-miR-132*, hsa-miR-1321, hsa-miR-1322, hsa-miR-1323, hsa-miR-1324, hsa-miR-133a, hsa-miR-133b, hsa-miR-134, hsa-miR-135a, hsa-miR-135a*, hsa-miR-135b, hsa-miR-135b*, hsa-miR-136, hsa-miR-136*, hsa-miR-137, hsa-miR-138, hsa-miR-138-1*, hsa-miR-138-2*, hsa-miR-139-3p, hsa-miR-139-5p, hsa-miR-140-3p, hsa-miR-140-5p, hsa-miR-141, hsa-miR-141*, hsa-miR-142-3p, hsa-miR-142-5p, hsa-miR-143, hsa-miR-143*, hsa-miR-144, hsa-miR-144*, hsa-miR-145, hsa-miR-145*, hsa-miR-146a, hsa-miR-146a*, hsa-miR-146b-3p, hsa-miR-146b-5p, hsa-miR-147, hsa-miR-147b, hsa-miR-148a, hsa-miR-148a*, hsa-miR-148b, hsa-miR-148b*, hsa-miR-149, hsa-miR-149*, hsa-miR-150, hsa-miR-150*, hsa-miR-151-3p, hsa-miR-151-5p, hsa-miR-152, hsa-miR-153, hsa-miR-154, hsa-miR-154*, hsa-miR-155, hsa-miR-155*, hsa-miR-15a, hsa-miR-15a*, hsa-miR-15b, hsa-miR-15b*, hsa-miR-16, hsa-miR-16-1*, hsa-miR-16-2*, hsa-miR-17, hsa-miR-17*, hsa-miR-181a, hsa-miR-181a*, hsa-miR-181a-2*, hsa-miR-181b, hsa-miR-181c, hsa-miR-181c*, hsa-miR-181d, hsa-miR-182, hsa-miR-182*, hsa-miR-1825, hsa-miR-1826, hsa-miR-1827, hsa-miR-183, hsa-miR-183*, hsa-miR-184, hsa-miR-185, hsa-miR-185*, hsa-miR-186, hsa-miR-186*, hsa-miR-187, hsa-miR-187*, hsa-miR-188-3p, hsa-miR-188-5p, hsa-miR-18a, hsa-miR-18a*, hsa-miR-18b, hsa-miR-18b*, hsa-miR-190, hsa-miR-190b, hsa-miR-191, hsa-miR-191*, hsa-miR-192, hsa-miR-192*, hsa-miR-193a-3p, hsa-miR-193a-5p, hsa-miR-193b, hsa-miR-193b*, hsa-miR-194, hsa-miR-194*, hsa-miR-195, hsa-miR-195*, hsa-miR-196a, hsa-miR-196a*, hsa-miR-196b, hsa-miR-197, hsa-miR-198, hsa-miR-199a-3p, hsa-miR-199a-5p, hsa-miR-199b-5p, hsa-miR-19a, hsa-miR-19a*, hsa-miR-19b, hsa-miR-19b-1*, hsa-miR-19b-2*, hsa-miR-200a, hsa-miR-200a*, hsa-miR-200b, hsa-miR-200b*, hsa-miR-200c, hsa-miR-200c*, hsa-miR-202, hsa-miR-202*, hsa-miR-203, hsa-miR-204, hsa-miR-205, hsa-miR-206, hsa-miR-208a, hsa-miR-208b, hsa-miR-20a, hsa-miR-20a*, hsa-miR-20b, hsa-miR-20b*, hsa-miR-21, hsa-miR-21*, hsa-miR-210, hsa-miR-211, hsa-miR-212, hsa-miR-214, hsa-miR-214*, hsa-miR-215, hsa-miR-216a, hsa-miR-216b, hsa-miR-217, hsa-miR-218, hsa-miR-218-1*, hsa-miR-218-2*, hsa-miR-219-1-3p, hsa-miR-219-2-3p, hsa-miR-219-5p, hsa-miR-22, hsa-miR-22*, hsa-miR-220a, hsa-miR-220b, hsa-miR-220c, hsa-miR-221, hsa-miR-221*, hsa-miR-222, hsa-miR-222*, hsa-miR-223, hsa-miR-223*, hsa-miR-224, hsa-miR-23a, hsa-miR-23a*, hsa-miR-23b, hsa-miR-23b*, hsa-miR-24, hsa-miR-24-1*, hsa-miR-24-2*, hsa-miR-25, hsa-miR-25*, hsa-miR-26a, hsa-miR-26a-1*, hsa-miR-26a-2*, hsa-miR-26b, hsa-miR-26b*, hsa-miR-27a, hsa-miR-27a*, hsa-miR-27b, hsa-miR-27b*, hsa-miR-28-3p, hsa-miR-28-5p, hsa-miR-296-3p, hsa-miR-296-5p, hsa-miR-297, hsa-miR-298, hsa-miR-299-3p, hsa-miR-299-5p, hsa-miR-29a, hsa-miR-29a*, hsa-miR-29b, hsa-miR-296-1*, hsa-miR-296-2*, hsa-miR-29c, hsa-miR-29c*, hsa-miR-300, hsa-miR-301a, hsa-miR-301b, hsa-miR-302a, hsa-miR-302a*, hsa-miR-302b, hsa-miR-302b*, hsa-miR-302c, hsa-miR-302c*, hsa-miR-302d, hsa-miR-302d*, hsa-miR-302e, hsa-miR-302f, hsa-miR-30a, hsa-miR-30a*, hsa-miR-30b, hsa-miR-30b*, hsa-miR-30c, hsa-miR-30c-1*, hsa-miR-30c-2*, hsa-miR-30d, hsa-miR-30d*, hsa-miR-30e, hsa-miR-30e*, hsa-miR-31, hsa-miR-31*, hsa-miR-32, hsa-miR-32*, hsa-miR-320a, hsa-miR-320b, hsa-miR-320c, hsa-miR-320d, hsa-miR-323-3p, hsa-miR-323-5p, hsa-miR-324-3p, hsa-miR-324-5p, hsa-miR-325, hsa-miR-326, hsa-miR-328, hsa-miR-329, hsa-miR-330-3p, hsa-miR-330-5p, hsa-miR-331-3p, hsa-miR-331-5p, hsa-miR-335, hsa-miR-335*, hsa-miR-337-3p, hsa-miR-337-5p, hsa-miR-338-3p, hsa-miR-338-5p, hsa-miR-339-3p, hsa-miR-339-5p, hsa-miR-33a, hsa-miR-33a*, hsa-miR-33b, hsa-miR-33b*, hsa-miR-340, hsa-miR-340*, hsa-miR-342-3p, hsa-miR-342-5p, hsa-miR-345, hsa-miR-346, hsa-miR-34a, hsa-miR-34a*, hsa-miR-34b, hsa-miR-34b*, hsa-miR-34c-3p, hsa-miR-34c-5p, hsa-miR-361-3p, hsa-miR-361-5p, hsa-miR-362-3p, hsa-miR-362-5p, hsa-miR-363, hsa-miR-363*, hsa-miR-365, hsa-miR-367, hsa-miR-367*, hsa-miR-369-3p, hsa-miR-369-5p, hsa-miR-370, hsa-miR-371-3p, hsa-miR-371-5p, hsa-miR-372, hsa-miR-373, hsa-miR-373*, hsa-miR-374a, hsa-miR-374a*, hsa-miR-374b, hsa-miR-374b*, hsa-miR-375, hsa-miR-376a, hsa-miR-376a*, hsa-miR-376b, hsa-miR-376c, hsa-miR-377, hsa-miR-377*, hsa-miR-378, hsa-miR-378*, hsa-miR-379, hsa-miR-379*, hsa-miR-380, hsa-miR-380*, hsa-miR-381, hsa-miR-382, hsa-miR-383, hsa-miR-384, hsa-miR-409-3p, hsa-miR-409-5p, hsa-miR-410, hsa-miR-411, hsa-miR-411*, hsa-miR-412, hsa-miR-421, hsa-miR-422a, hsa-miR-423-3p, hsa-miR-423-5p, hsa-miR-424, hsa-miR-424*, hsa-miR-425, hsa-miR-425*, hsa-miR-429, hsa-miR-431, hsa-miR-431*, hsa-miR-432, hsa-miR-432*, hsa-miR-433, hsa-miR-448, hsa-miR-449a, hsa-miR-449b, hsa-miR-450a, hsa-miR-450b-3p, hsa-miR-450b-5p, hsa-miR-451, hsa-miR-452, hsa-miR-452*, hsa-miR-453, hsa-miR-454, hsa-miR-454*, hsa-miR-455-3p, hsa-miR-455-5p, hsa-miR-483-3p, hsa-miR-483-5p, hsa-miR-484, hsa-miR-485-3p, hsa-miR-485-5p, hsa-miR-486-3p, hsa-miR-486-5p, hsa-miR-487a, hsa-miR-487b, hsa-miR-488, hsa-miR-488*, hsa-miR-489, hsa-miR-490-3p, hsa-miR-490-5p, hsa-miR-491-3p, hsa-miR-491-5p, hsa-miR-492, hsa-miR-493, hsa-miR-493*, hsa-miR-494, hsa-miR-495, hsa-miR-496, hsa-miR-497, hsa-miR-497*, hsa-miR-498, hsa-miR-499-3p, hsa-miR-499-5p, hsa-miR-500, hsa-miR-500*, hsa-miR-501-3p, hsa-miR-501-5p, hsa-miR-502-3p, hsa-miR-502-5p, hsa-miR-503, hsa-miR-504, hsa-miR-505, hsa-miR-505*, hsa-miR-506, hsa-miR-507, hsa-miR-508-3p, hsa-miR-508-5p, hsa-miR-509-3-5p, hsa-miR-509-3p, hsa-miR-509-5p, hsa-miR-510, hsa-miR-511, hsa-miR-512-3p, hsa-miR-512-5p, hsa-miR-513a-3p, hsa-miR-513a-5p, hsa-miR-513b, hsa-miR-513c, hsa-miR-514, hsa-miR-515-3p, hsa-miR-515-5p, hsa-miR-516a-3p, hsa-miR-516a-5p, hsa-miR-516b, hsa-miR-517*, hsa-miR-517a, hsa-miR-517b, hsa-miR-517c, hsa-miR-518a-3p, hsa-miR-518a-5p, hsa-miR-518b, hsa-miR-518c, hsa-miR-518c*, hsa-miR-518d-3p, hsa-miR-518d-5p, hsa-miR-518e, hsa-miR-518e*, hsa-miR-518f, hsa-miR-518f*, hsa-miR-519a, hsa-miR-519b-3p, hsa-miR-519c-3p, hsa-miR-519d, hsa-miR-519e, hsa-miR-519e*, hsa-miR-520a-3p, hsa-miR-520a-5p, hsa-miR-520b, hsa-miR-520c-3p, hsa-miR-520d-3p, hsa-miR-520d-5p, hsa-miR-520e, hsa-miR-520f, hsa-miR-520g, hsa-miR-520h, hsa-miR-521, hsa-miR-522, hsa-miR-523, hsa-miR-524-3p, hsa-miR-524-5p, hsa-miR-525-3p, hsa-miR-525-5p, hsa-miR-526b, hsa-miR-526b*, hsa-miR-532-3p, hsa-miR-532-5p, hsa-miR-539, hsa-miR-541, hsa-miR-541*, hsa-miR-542-3p, hsa-miR-542-5p, hsa-miR-543, hsa-miR-544, hsa-miR-545, hsa-miR-545*, hsa-miR-548a-3p, hsa-miR-548a-5p, hsa-miR-548b-3p, hsa-miR-5486-5p, hsa-miR-548c-3p, hsa-miR-548c-5p, hsa-miR-548d-3p, hsa-miR-548d-5p, hsa-miR-548e, hsa-miR-548f, hsa-miR-548g, hsa-miR-548h, hsa-miR-548i, hsa-miR-548j, hsa-miR-548k, hsa-miR-5481, hsa-miR-548m, hsa-miR-548n, hsa-miR-548o, hsa-miR-548p, hsa-miR-549, hsa-miR-550, hsa-miR-550*, hsa-miR-551a, hsa-miR-551b, hsa-miR-551b*, hsa-miR-552, hsa-miR-553, hsa-miR-554, hsa-miR-555, hsa-miR-556-3p, hsa-miR-556-5p, hsa-miR-557, hsa-miR-558, hsa-miR-559, hsa-miR-561, hsa-miR-562, hsa-miR-563, hsa-miR-564, hsa-miR-566, hsa-miR-567, hsa-miR-568, hsa-miR-569, hsa-miR-570, hsa-miR-571, hsa-miR-572, hsa-miR-573, hsa-miR-574-3p, hsa-miR-574-5p, hsa-miR-575, hsa-miR-576-3p, hsa-miR-576-5p, hsa-miR-577, hsa-miR-578, hsa-miR-579, hsa-miR-580, hsa-miR-581, hsa-miR-582-3p, hsa-miR-582-5p, hsa-miR-583, hsa-miR-584, hsa-miR-585, hsa-miR-586, hsa-miR-587, hsa-miR-588, hsa-miR-589, hsa-miR-589*, hsa-miR-590-3p, hsa-miR-590-5p, hsa-miR-591, hsa-miR-592, hsa-miR-593, hsa-miR-593*, hsa-miR-595, hsa-miR-596, hsa-miR-597, hsa-miR-598, hsa-miR-599, hsa-miR-600, hsa-miR-601, hsa-miR-602, hsa-miR-603, hsa-miR-604, hsa-miR-605, hsa-miR-606, hsa-miR-607, hsa-miR-608, hsa-miR-609, hsa-miR-610, hsa-miR-611, hsa-miR-612, hsa-miR-613, hsa-miR-614, hsa-miR-615-3p, hsa-miR-615-5p, hsa-miR-616, hsa-miR-616*, hsa-miR-617, hsa-miR-618, hsa-miR-619, hsa-miR-620, hsa-miR-621, hsa-miR-622, hsa-miR-623, hsa-miR-624, hsa-miR-624*, hsa-miR-625, hsa-miR-625*, hsa-miR-626, hsa-miR-627, hsa-miR-628-3p, hsa-miR-628-5p, hsa-miR-629, hsa-miR-629*, hsa-miR-630, hsa-miR-631, hsa-miR-632, hsa-miR-633, hsa-miR-634, hsa-miR-635, hsa-miR-636, hsa-miR-637, hsa-miR-638, hsa-miR-639, hsa-miR-640, hsa-miR-641, hsa-miR-642, hsa-miR-643, hsa-miR-644, hsa-miR-645, hsa-miR-646, hsa-miR-647, hsa-miR-648, hsa-miR-649, hsa-miR-650, hsa-miR-651, hsa-miR-652, hsa-miR-653, hsa-miR-654-3p, hsa-miR-654-5p, hsa-miR-655, hsa-miR-656, hsa-miR-657, hsa-miR-658, hsa-miR-659, hsa-miR-660, hsa-miR-661, hsa-miR-662, hsa-miR-663, hsa-miR-663b, hsa-miR-664, hsa-miR-664*, hsa-miR-665, hsa-miR-668, hsa-miR-671-3p, hsa-miR-671-5p, hsa-miR-675, hsa-miR-7, hsa-miR-708, hsa-miR-708*, hsa-miR-7-1*, hsa-miR-7-2*, hsa-miR-720, hsa-miR-744, hsa-miR-744*, hsa-miR-758, hsa-miR-760, hsa-miR-765, hsa-miR-766, hsa-miR-767-3p, hsa-miR-767-5p, hsa-miR-768-3p, hsa-miR-768-5p, hsa-miR-769-3p, hsa-miR-769-5p, hsa-miR-770-5p, hsa-miR-802, hsa-miR-873, hsa-miR-874, hsa-miR-875-3p, hsa-miR-875-5p, hsa-miR-876-3p, hsa-miR-876-5p, hsa-miR-877, hsa-miR-877*, hsa-miR-885-3p, hsa-miR-885-5p, hsa-miR-886-3p, hsa-miR-886-5p, hsa-miR-887, hsa-miR-888, hsa-miR-888*, hsa-miR-889, hsa-miR-890, hsa-miR-891a, hsa-miR-891b, hsa-miR-892a, hsa-miR-892b, hsa-miR-9, hsa-miR-9*, hsa-miR-920, hsa-miR-921, hsa-miR-922, hsa-miR-923, hsa-miR-924, hsa-miR-92a, hsa-miR-92a-1*, hsa-miR-92a-2*, hsa-miR-92b, hsa-miR-92b*, hsa-miR-93, hsa-miR-93*, hsa-miR-933, hsa-miR-934, hsa-miR-935, hsa-miR-936, hsa-miR-937, hsa-miR-938, hsa-miR-939, hsa-miR-940, hsa-miR-941, hsa-miR-942, hsa-miR-943, hsa-miR-944, hsa-miR-95, hsa-miR-96, hsa-miR-96*, hsa-miR-98, hsa-miR-99a, hsa-miR-99a*, hsa-miR-99b, 및 hsa-miR-99b*. 예를 들어, 근위축성 측색 경화증(ALS)과 연관된, 수퍼옥사이드 디스뮤타제(SOD1)를 발현하는 염색체 8 오픈 리딩 프레임 72(C9orf72)를 표적으로 하는 miRNA가 관심을 끌 수 있다.
miRNA는 표적으로 하는 mRNA의 기능을 억제하며, 결과적으로, mRNA에 의해 암호화된 폴리펩티드의 발현을 억제한다. 따라서, miRNA의 활성을 (부분적으로 또는 전체적으로) 차단하는 것(예를 들어, miRNA 침묵)은 발현이 억제된 폴리펩티드의 발현을 효과적으로 유도하거나, 또는 회복시킬 수 있다(폴리펩티드 활성화). 일 구현예에서, miRNA의 mRNA 표적에 의해 암호화된 폴리펩티드의 활성화는 다양한 방법 중 임의의 하나를 통해 세포에서 miRNA 활성을 억제함으로써 달성된다. 예를 들어, miRNA의 활성을 차단하는 것은 miRNA에 상보성이거나, 또는 실질적으로 상보성인 작은 간섭 핵산(예를 들어, 안티센스 올리고뉴클레오티드, miRNA 스폰지, TuD RNA)과 혼성화하여, 이에 의해 miRNA와 표적 mRNA의 상호작용을 차단함으로써 달성될 수 있다. 본원에 사용된 바와 같이, miRNA에 실질적으로 상보성인 작은 간섭 핵산은 miRNA와 혼성화하고 miRNA의 활성을 차단할 수 있는 것이다. 일부 구현예에서, miRNA에 실질적으로 상보성인 작은 간섭 핵산은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 또는 18 개 염기를 제외하고 miRNA와 상보성인 작은 간섭 핵산이다. "miRNA 억제제"는 miRNA 기능, 발현 및/또는 처리를 차단하는 제제이다. 예를 들어, 이들 분자는 microRNA 특이적 안티센스, microRNA 스폰지, 강력 유인 RNA(TuD RNA) 및 드로샤 복합체와 miRNA 상호작용을 억제하는 microRNA 올리고뉴클레오티드(이중-가닥, 헤어핀, 짧은 올리고뉴클레오티드)를 포함하나 이에 제한되지 않는다.
또 다른 유용한 전이유전자는 병원체에 수동 면역을 부여하는 면역글로불린을 암호화하는 것들을 포함할 수 있다. "면역글로불린 분자"는 함께 공유 결합되고 항원과 특이적으로 조합할 수 있는 면역글로불린 중쇄 및 면역글로불린 경쇄의 면역학적으로 활성 부분을 함유하는 단백질이다. 면역글로불린 분자는 임의의 유형(예를 들어, IgG, IgE, IgM, IgD, IgA 및 IgY), 클래스(예를 들어, IgG1, IgG2, IgG3, IgG4, IgA1 및 IgA2) 또는 하위클래스이다. 용어 "항체" 및 "면역글로불린"은 본원에서 상호교환적으로 사용될 수 있다.
"면역글로불린 중쇄"는 면역글로불린의 항원 결합 도메인의 적어도 일부 및 면역글로불린 중쇄의 가변 영역의 적어도 일부 또는 면역글로불린 중쇄의 불변 영역의 적어도 일부를 함유하는 폴리펩티드이다. 따라서, 면역글로불린 유래 중쇄는 면역글로불린 유전자 슈퍼패밀리의 구성원과 상동성인 아미노산 서열의 유의한 영역을 갖는다. 예를 들어, Fab 단편에서 중쇄는 면역글로불린-유래 중쇄이다.
"면역글로불린 경쇄"는 면역글로불린의 항원 결합 도메인의 적어도 일부 및 면역글로불린 경쇄의 가변 영역의 적어도 일부 또는 불변 영역의 적어도 일부를 함유하는 폴리펩티드이다. 따라서, 면역글로불린-유래 경쇄는 면역글로불린 유전자 슈퍼패밀리의 구성원과 상동성인 아미노산의 유의한 영역을 갖는다.
"면역접합체"는 결합 단백질, 일반적으로 수용체, 리간드, 또는 세포-부착 분자의 기능적 도메인을 일반적으로 힌지 및 Fc 영역을 포함하는 면역글로불린 불변 도메인과 조합하는 키메라 항체-유사 분자이다.
"단편 항원-결합"(Fab) 단편"은 항원에 결합하는 항체 상의 영역이다. 이는 중쇄 및 경쇄 각각의 하나의 불변 및 하나의 가변 도메인으로 구성된다.
항-병원체 작제물은 보호되어야 할 질병에 대한 원인 인자(병원체)에 기초하여 선택된다. 이들 병원체는 바이러스, 박테리아, 또는 진균 기원일 수 있고, 인간에서 인간 질환에 대한 감염을 예방하거나, 또는 비-인간 포유동물 또는 다른 동물에서 수의학 질환의 감염을 예방하는 데 사용될 수 있다.
rAAV는 항체, 특히 바이러스 병원체에 대한 중화 항체를 암호화하는 유전자를 포함할 수 있다. 이러한 항-바이러스 항체는 인플루엔자 A, 인플루엔자 B, 및 인플루엔자 C 중 하나 이상에 대하여 지시된 항-인플루엔자 항체를 포함할 수 있다. 유형 A 바이러스는 가장 치명적인 인간 병원체이다. 유행병과 연관된 인플루엔자 A의 혈청형은 1918년에 스페인 독감, 및 2009년에 돼지 독감을 유발한 H1N1; 1957년에 아시아 독감을 유발한 H2N2; 1968년에 홍콩 독감을 유발한 H3N2; 2004년에 조류 독감을 유발한 H5N1; H7N7; H1N2; H9N2; H7N2; H7N3; 및 H10N7을 포함한다. 다른 표적 병원체성 바이러스는 아레나바이러스(푸닌, 마추포, 및 라사 포함), 필로바이러스(마르부르크 및 에볼라 포함), 한타바이러스, 피코르나바이러스과(리노바이러스, 에코바이러스 포함), 코로나바이러스, 파라믹소바이러스, 모빌리바이러스, 호흡기 세포융합 바이러스, 토가바이러스, 콕사키바이러스, JC 바이러스, 파보바이러스 B19, 파라인플루엔자, 아데노바이러스, 레오바이러스, 폭스바이러스 패밀리의 두창(대두창(천연두)) 및 백시니아(우두), 및 수두대상포진(위광견병)을 포함한다. 바이러스 출혈열은 아레나바이러스 패밀리(라사 열)(이 패밀리는 또한 림프구성 맥락수막염(LCM)과 연관됨), 필로바이러스(에볼라 바이러스), 및 한타바이러스(퓨어말라)의 구성원에 의해 유발된다. 피코르나바이러스(리노바이러스의 하위패밀리)의 구성원은 인간에서 감기와 연관되어 있다. 코로나바이러스 패밀리는 감염성 기관지염 바이러스(가금류), 돼지 전염성 위장 바이러스(돼지), 돼지 혈구응집성 뇌척수염 바이러스(돼지), 고양이 감염성 복막염 바이러스(고양이), 고양이 장내 코로나바이러스(고양이), 개 코로나바이러스(개)와 같은 다수의 비-인간 바이러스를 포함한다. 인간 호흡기 코로나바이러스는 감기, 비-A, B 또는 C형 간염, 및 갑작스러운 급성 호흡기 증후군(SARS)과 연관된 것으로 추정된다. 파라믹소바이러스 패밀리는 파라인플루엔자 바이러스 유형 1, 파라인플루엔자 바이러스 유형 3, 소 파라인플루엔자 바이러스 유형 3, 루불라바이러스(볼거리 바이러스, 파라인플루엔자 바이러스 유형 2, 파라인플루엔자 바이러스 유형 4, 뉴캐슬병 바이러스(닭), 우역, 홍역 및 개 급성 전염병을 포함하는 모빌리바이러스, 및 호흡기 세포융합 바이러스(RSV)를 포함하는 폐렴바이러스를 포함한다. 파보바이러스 패밀리는 고양이 파보바이러스(고양이 장염), 고양이 범백혈구감소증 바이러스, 개 파보바이러스, 및 돼지 파보바이러스를 포함한다. 아데노바이러스 패밀리는 호흡기 질환을 유발하는 바이러스(EX, AD7, ARD, O.B.)를 포함한다. 따라서, 특정 구현예에서, 본원에 기재된 rAAV 벡터는 항-에볼라 항체, 예를 들어, 2G4, 4G7, 13C6, 항-인플루엔자 항체, 예를 들어, FI6, CR8033, 및 항-RSV 항체, 예를 들어, 팔리비주맙, 모타비주맙을 발현하도록 조작될 수 있다. 박테리아 병원체에 대한 중화 항체 작제물이 또한 본 발명에 사용하기 위해 선택될 수 있다. 일 구현예에서, 중화 항체 작제물은 바이러스 자체에 대하여 지시된다. 또 다른 구현예에서, 중화 항체 작제물은 박테리아에 의해 생성된 독소에 대하여 지시된다. 공기 중에 떠다니는 박테리아 병원체의 예는 예를 들어, 네이세리아 메닌지티디스(Neisseria meningitidis)(수막염), 클렙시엘라 뉴모니아(Klebsiella pneumonia)(폐렴), 슈도모나스 아에루지노사(Pseudomonas aeruginosa)(폐렴), 슈도모나스 슈도말레이(Pseudomonas pseudomallei)(폐렴), 슈도모나스 말레이(Pseudomonas mallei)(폐렴), 아시네토박터(Acinetobacter)(폐렴), 모락셀라 카타랄리스(Moraxella catarrhalis), 모락셀라 라쿠나타(Moraxella lacunata), 알칼리게네스(Alkaligenes), 카르디오박테리움(Cardiobacterium), 헤모필루스 인플루엔자에(Haemophilus influenzae)(독감), 헤모필루스 파라인플루엔자에(Haemophilus parainfluenzae), 보르데텔라 페르투시스(Bordetella pertussis)(백일해), 프란시셀라 투라렌시스(Francisella tularensis)(폐렴/열), 레지오넬라 뉴모니아(Legionella pneumonia)(재향군인병), 클라미디아 시타시(Chlamydia psittaci)(폐렴), 클라미디아 뉴모니아에(Chlamydia pneumoniae)(폐렴), 미코박테리움 투베르쿨로시스(Mycobacterium tuberculosis)(결핵(TB)), 미코박테리움 칸사시이(Mycobacterium kansasii)(TB), 미코박테리움 아비움(Mycobacterium avium)(폐렴), 노카르디아 아스테로이데스(Nocardia asteroides)(폐렴), 바실루스 안트라시스(Bacillus anthracis)(탄저병), 스타필로코쿠스 아우레우스(Staphylococcus aureus)(폐렴), 스트렙토코쿠스 피오게네스(Streptococcus pyogenes)(성홍열), 스트렙토코쿠스 뉴모니아에(Streptococcus pneumoniae)(폐렴), 코리네박테리아 디프테리아(Corynebacteria diphtheria)(디프테리아), 미코플라스마 뉴모니아에(Mycoplasma pneumoniae)(폐렴)를 포함한다.
rAAV는 바실루스 안트라시스(Bacillius anthracis)에 의해 생성된 독소인 탄저병의 원인 인자와 같은 박테리아 병원체에 대한 항체, 및 특히 중화 항체를 암호화하는 유전자를 포함할 수 있다. 톡소이드를 형성하는 3 개의 펩티드 중 하나인 보호제(PA)에 대한 중화 항체가 기재되었다. 다른 2 개의 폴리펩티드는 치사 인자(LF) 및 부종 인자(EF)로 이루어진다. 항-PA 중화 항체는 탄저병에 대한 수동적 면역에 효과적인 것으로 기재되었다. 예를 들어, 미국 특허 번호 제7,442,373호; R. Sawada-Hirai et al, J Immune Based Ther Vaccines. 2004; 2: 5. (온라인 2004년 5월 12일) 참조. 또 다른 항-탄저병 독소 중화 항체가 기재되었고/기재되었거나 생성될 수 있다. 유사하게, 다른 박테리아 및/또는 박테리아 독소에 대한 중화 항체가 본원에 기재된 바와 같은 AAV-전달 항-병원체 작제물을 생성하는 데 사용될 수 있다.
감염성 질환에 대한 항체는 기생충에 의해 또는 예를 들어, 아스페르길루스(Aspergillus) 종, 압시디아 코림비페라(Absidia corymbifera), 릭크푸스 스톨로니페르(Rhixpus stolonifer), 무코르 플룸베아우스(Mucor plumbeaus), 크립토코쿠스 네오포르만스(Cryptococcus neoformans), 히스토플라슴 캅술라툼(Histoplasm capsulatum), 블라스토미세스 데르마티티디스(Blastomyces dermatitidis), 코시디오이데스 이미티스(Coccidioides immitis), 페니실리움(Penicillium) 종, 마이크로폴리스포라 파에니(Micropolyspora faeni), 써모악티노미세스 불가리스(Thermoactinomyces vulgaris), 알테르나리아 알테르네이트(Alternaria alternate), 클라도스포리움(Cladosporium) 종, 헬민토스포리움(Helminthosporium), 및 스타키보트리스(Stachybotrys) 종을 포함한 균류에 의해 유발될 수 있다.
rAAV는 알츠하이머병(AD), 파킨슨병(PD), GBA-연관 - 파킨슨병(GBA - PD), 류머티스성 관절염(RA), 과민성 대장 증후군(IBS), 만성 폐쇄성 폐 질환(COPD), 암, 종양, 전신경화증, 천식 및 다른 질환과 같은 질환의 병원체성 인자에 대한 항체, 및 특히 중화 항체를 암호화하는 유전자를 포함할 수 있다. 이러한 항체는 비제한적으로, 예를 들어, 알파-시누클레인, 항-혈관 내피 성장 인자(VEGF)(항-VEGF), 항-VEGFA, 항-PD-1, 항-PDL1, 항-CTLA-4, 항-TNF-알파, 항-IL-17, 항-IL-23, 항-IL-21, 항-IL-6, 항-IL-6 수용체, 항-IL-5, 항-IL-7, 항-인자 XII, 항-IL-2, 항-HIV, 항-IgE, 항-종양 괴사 인자 수용체-1(TNFR1), 항-노치 2/3, 항-노치 1, 항-OX40, 항-erb-b2 수용체 티로신 키나제 3(ErbB3), 항-ErbB2, 항-베타 세포 성숙 항원, 항-B 림프구 자극인자, 항-CD20, 항-HER2, 항-과립구 대식세포 콜로니- 자극 인자, 항-온코스타틴 M(OSM), 항-림프구 활성화 유전자 3(LAG3) 단백질, 항-CCL20, 항-혈청 아밀로이드 P 구성요소(SAP), 항-프롤릴 히드록실라제 억제제, 항-CD38, 항-당단백질 IIb/IIIa, 항-CD52, 항-CD30, 항-IL-1베타, 항-표피 성장 인자 수용체, 항-CD25, 항-RANK 리간드, 항-보체 시스템 단백질 C5, 항-CD11a, 항-CD3 수용체, 항-알파-4(α4) 인테그린, 항-RSV F 단백질, 및 항-인테그린 α4β7일 수 있다. 또 다른 병원체 및 질환은 당업자에게 명백할 것이다. 다른 적합한 항체는 특히 예를 들어, 항-베타-아밀로이드(예를 들어, 크레네주맙(crenezumab), 솔라네주맙(solanezumab), 아두카누맙(aducanumab)), 항-베타-아밀로이드 원섬유, 항-베타-아밀로이드 플라크, 항-tau, 바피네우자맙(bapineuzamab)과 같은 알츠하이머병을 치료하는 데 유용한 것들을 포함할 수 있다. 다양한 적응증을 치료하는 데 적합한 다른 항체는 예를 들어, WO 2017/075119A1로 공개된 2016년 10월 27일 출원된 PCT/US2016/058968에 기재된 것들을 포함한다.
II. rAAV 벡터 생산
AAV 바이러스 벡터(예를 들어, 재조합(r) AAV)를 생성하는 데 사용하기 위해, 발현 카세트는 패키징된 숙주 세포에 전달되는 임의의 적합한 벡터, 예를 들어, 플라스미드 상으로 운반될 수 있다. 본 발명에 유용한 플라스미드는 특히 원핵생물 세포, 곤충 세포, 포유동물 세포에서 시험관내 복제 및 패키징에 적합하도록 조작될 수 있다. 적합한 형질감염 기술 및 패키징 숙주 세포는 알려져 있고/있거나 당업자에 의해 쉽게 설계될 수 있다.
벡터로서 사용하기에 적합한 AAV를 생성 및 단리하는 방법은 당업계에 알려져 있다. 일반적으로, 예를 들어, Grieger & Samulski, 2005, "Adeno-associated virus as a gene therapy vector: Vector development, production and clinical applications," Adv. Biochem. Engin/Biotechnol. 99: 119-145; Buning et al., 2008, "Recent developments in adeno-associated virus vector technology," J. Gene Med. 10:717-733; 및 하기 인용된 참고문헌을 참조하며, 상기 문헌은 각각 그 전문이 본원에 참조로 포함된다. 전이유전자를 비리온 내에 패키징하기 위해, ITR은 발현 카세트를 함유하는 핵산 분자와 동일한 작제물 내 시스에서 필요한 유일한 AAV 구성요소이다. cap 및 rep 유전자는 트랜스로 공급될 수 있다.
일 구현예에서, 본원에 기재된 발현 카세트는 바이러스 벡터를 생성하기 위해 그 위에 운반된 전이유전자 작제물 서열을 패키징 숙주 세포 내에 전달하는 유전적 요소(예를 들어, 셔틀 플라스미드)로 조작된다. 일 구현예에서, 선택된 유전적 요소는 형질감염, 전기천공법, 리포솜 전달, 막 융합 기술, 고속 DNA-코팅 펠릿, 바이러스 감염 및 원형체 융합을 포함하는 임의의 적합한 방법에 의해 AAV 패키징 세포에 전달될 수 있다. 안정된 AAV 패키징 세포가 또한 만들어질 수 있다. 대안적으로, 발현 카세트는 AAV 이외의 바이러스 벡터를 생성하는 데 사용될 수 있다. 이러한 작제물을 제조하는 데 사용되는 방법은 핵산 조작 숙련자에게 알려져 있고 유전 공학, 재조합 공학, 및 합성 기술을 포함한다. 예를 들어, Molecular Cloning: A Laboratory Manual, ed. Green and Sambrook, Cold Spring Harbor Press, Cold Spring Harbor, NY (2012) 참조.
용어 "AAV 중간체" 또는 "AAV 벡터 중간체"는 그 안에 패키징된 원하는 게놈 서열이 결여된 어셈블리된 rAAV 캡시드를 지칭한다. 이들은 또한 "빈" 캡시드라고도 명명될 수 있다. 이러한 캡시드는 발현 카세트의 검출가능한 게놈 서열이 없거나, 또는 유전자 산물의 발현을 달성하기에 불충분한 부분적으로 패키징된 게놈 서열만을 함유할 수 있다. 이들 빈 캡시드는 관심있는 유전자를 숙주 세포에 전달하는 기능이 없다.
본원에 기재된 재조합 아데노-연관 바이러스(AAV)는 알려진 기술을 사용하여 생성될 수 있다. 예를 들어, WO 2003/042397; WO 2005/033321, WO 2006/110689; US 7588772 B2 참조. 이러한 방법은 AAV 캡시드 단백질을 암호화하는 핵산 서열; 기능적 rep 유전자; 최소한, AAV 도립된 말단 반복부(ITR) 및 전이유전자로 구성된 발현 카세트; 및 발현 카세트를 AAV 캡시드 단백질 내에 패키징하도록 하기에 충분한 헬퍼 기능을 함유하는 숙주 세포를 배양하는 단계를 수반한다. 캡시드를 생성하는 방법, 이에 대한 코딩 서열, 및 rAAV 바이러스 벡터의 생산 방법이 기재되었다. 예를 들어, Gao, et al, Proc. Natl. Acad. Sci. U.S.A. 100 (10), 6081-6086 (2003) 및 US 2013/0045186A1 참조.
일 구현예에서, 재조합 AAV를 생산하는 데 유용한 생산 세포 배양물이 제공된다. 이러한 세포 배양물은 숙주 세포에서 AAV 캡시드 단백질을 발현하는 핵산; AAV 캡시드 내에 패키징하기에 적합한 핵산 분자, 예를 들어, AAV ITR 및 숙주 세포에서 생성물의 발현을 지시하는 서열에 작동가능하게 연결된 유전자 산물을 암호화하는 비-AAV 핵산 서열을 함유하는 벡터 게놈; 및 핵산 분자를 재조합 AAV 캡시드 내에 패키징하도록 하기에 충분한 AAV rep 기능 및 아데노바이러스 헬퍼 기능을 함유한다. 일 구현예에서, 세포 배양물은 포유동물 세포(예를 들어, 특히 인간 배아 신장 293 세포) 또는 곤충 세포(예를 들어, 배큘로바이러스)로 구성된다.
임의적으로 rep 기능은 캡시드를 제공하는 AAV 이외의 AAV에 의해 제공된다. 예를 들어 rep는 AAV1 rep 단백질, AAV2 rep 단백질, AAV3 rep 단백질, AAV4 rep 단백질, AAV5 rep 단백질, AAV6 rep 단백질, AAV7 rep 단백질, AAV8 rep 단백질; 또는 rep 78, rep 68, rep 52, rep 40, rep68/78 및 rep40/52; 또는 이의 단편; 또는 또 다른 공급원일 수 있으나 이에 제한되지 않는다. 임의적으로, rep 및 cap 서열은 세포 배양물에서 동일한 유전적 요소 상에 있다. rep 서열 및 cap 유전자 사이에 스페이서가 있을 수 있다. 임의의 이러한 AAV 또는 돌연변이체 AAV 캡시드 서열은 숙주 세포에서 이의 발현을 지시하는 외인성 조절 제어 서열의 제어 하에 있을 수 있다.
일 구현예에서, 세포는 적합한 세포 배양(예를 들어, HEK 293) 세포에서 제조될 수 있다. 본원에 기재된 유전자 요법 벡터를 제조하는 방법은 유전자 요법 벡터의 생산에 사용되는 플라스미드 DNA의 생성, 벡터의 생성, 및 벡터의 정제와 같은 당업계에 널리 알려진 방법을 포함한다. 일부 구현예에서, 유전자 요법 벡터는 AAV 벡터이고 생성된 플라스미드는 관심있는 유전자를 포함한 벡터 게놈을 암호화하는 AAV 시스-플라스미드, AAV rep 및 cap 유전자를 함유하는 AAV 트랜스-플라스미드, 및 아데노바이러스 헬퍼 플라스미드이다. 벡터 생성 과정은 세포 배양 개시, 세포 계대, 세포 시딩, 세포를 플라스미드 DNA로 형질감염, 형질감염후 무혈청 배지로 배지 교환, 및 벡터-함유 세포 및 배양 배지의 수확과 같은 방법 단계를 포함할 수 있다. 수확된 벡터-함유 세포 및 배양 배지는 본원에서 조질 세포 수확물로 지칭된다. 또 다른 시스템에서, 유전자 요법 벡터는 배큘로바이러스-기반 벡터를 사용한 감염에 의해 곤충 세포 내에 도입된다. 이들 생산 시스템에 대한 검토를 위해, 일반적으로 예를 들어, Zhang et al., 2009, "Adenovirus-adeno-associated virus hybrid for large-scale recombinant adeno-associated virus production," Human Gene Therapy 20:922-929을 참조하며, 이의 각각의 내용은 그 전문이 본원에 참조로 포함된다. 이들 및 다른 AAV 생산 시스템을 제조 및 사용하는 방법은 또한 하기 미국 특허에 기재되어 있으며, 이들 각각의 내용은 그 전문이 본원에 참조로 포함된다: 제5,139,941호; 제5,741,683호; 제6,057,152호; 제6,204,059호; 제6,268,213호; 제6,491,907호; 제6,660,514호; 제6,951,753호; 제7,094,604호; 제7,172,893호; 제7,201,898호; 제7,229,823호; 및 제7,439,065호.
이후에 조질 세포 수확물은 벡터 수확물의 농축, 벡터 수확물의 정용여과, 벡터 수확물의 미세유체화, 벡터 수확물의 뉴클레아제 소화, 미세유체화된 중간체의 여과, 크로마토그래피에 의한 조질 정제, 초원심분리에 의한 조질 정제, 접속 유동 여과에 의한 완충액 교환, 및/또는 벌크 벡터를 제조하기 위한 제형화 및 여과와 같은 방법 단계에 적용될 수 있다.
높은 염 농도에서 2-단계 친화성 크로마토그래피 정제 이어서 음이온 교환 수지 크로마토그래피를 사용하여 벡터 약물 생성물을 정제하고 빈 캡시드를 제거한다. 이들 방법은 국제 특허 공개 번호 WO 2017/160360에 보다 상세하게 기재되어 있으며, 이는 본원에 참조로 포함된다. 정제 방법에 대하여 AAV8의 경우, 공개 번호 WO2017/100676, 및 rh10의 경우, 국제 특허 공개 번호 WO 2017/100704, 및 AAV1의 경우, 국제 특허 공개 번호 WO 2017/100674가 모두 본원에 참조로 포함된다.
빈 입자 및 가득 찬 입자 함량을 계산하기 위해, 선택된 샘플(예를 들어, 본원의 예에서 GC의 수 = 입자의 수인 요오딕사놀 구배-정제 제제)에 대한 VP3 밴드 부피를 로딩된 GC 입자에 대해 플롯팅한다. 생성된 선형 방정식(y = mx+c)을 사용하여 시험 물품 피크의 밴드 부피에서 입자의 수를 계산한다.  그 다음에 로딩된 20 μL 당 입자(pt)의 수에 50을 곱하여 입자(pt)/mL를 제공한다.  Pt/mL를 GC/mL로 나누어 입자 대 게놈 카피의 비(pt/GC)를 제공한다.  Pt/mL-GC/mL는 빈 pt/mL을 제공한다.  빈 pt/mL를 pt/mL로 나누고 100을 곱하여 빈 입자의 백분율을 제공한다.
일반적으로, 빈 캡시드 및 패키징된 게놈을 갖는 AAV 벡터 입자를 검정하는 방법은 당업계에 알려져 있다. 예를 들어, Grimm et al., Gene Therapy (1999) 6:1322-1330; Sommer et al., Molec. Ther. (2003) 7:122-128 참조. 변성된 캡시드에 대한 시험을 위해, 방법은 처리된 AAV 스톡을 3 개의 캡시드 단백질을 분리할 수 있는 임의의 겔, 예를 들어, 완충액 중 3-8% Tris-아세테이트를 함유하는 구배 겔로 이루어진 SDS-폴리아크릴아미드 겔 전기영동에 적용시킨 다음, 샘플 물질이 분리될 때까지 겔을 실행시키고, 상기 겔을 나일론 또는 니트로셀룰로스 막, 바람직하게는 나일론 위에 블롯팅하는 단계를 포함한다. 그 다음에 항-AAV 캡시드 항체는 변성된 캡시드 단백질에 결합하는 1차 항체, 바람직하게는 항-AAV 캡시드 모노클로날 항체, 가장 바람직하게는 B1 항-AAV-2 모노클로날 항체로 사용된다(Wobus et al., J. Virol. (2000) 74:9281-9293). 그 다음에 1차 항체에 결합하고 1차 항체와의 결합을 검출하기 위한 수단을 함유하는 2차 항체, 보다 바람직하게는 공유 결합된 검출 분자를 함유하는 항-IgG 항체, 가장 바람직하게는 서양고추냉이 퍼옥시다제에 공유 결합된 양 항-마우스 IgG 항체가 사용된다. 결합을 검출하는 방법, 바람직하게는 방사성 동위원소 방출, 전자기 방사, 또는 비색 변화를 검출할 수 있는 검출 방법, 가장 바람직하게는 화학발광 검출 키트를 사용하여 1차 및 2차 항체 사이의 결합을 반-정량적으로 결정한다. 예를 들어, SDS-PAGE의 경우, 칼럼 분획으로부터 샘플을 취하여 환원제(예를 들어, DTT)를 함유하는 SDS-PAGE 로딩 완충액에서 가열할 수 있고, 캡시드 단백질은 프리-캐스트 구배 폴리아크릴아미드 겔(예를 들어, Novex) 상에서 분해되었다. 은 염색은 제조업체의 설명서에 따라 SilverXpress(Invitrogen, 캘리포니아주 소재)를 사용하거나 또는 다른 적합한 염색 방법, 즉, 시프로 루비 또는 쿠마시 염색을 사용하여 수행될 수 있다. 일 구현예에서, 칼럼 분획에서 AAV 벡터 게놈(vg)의 농도는 정량적 실시간 PCR(Q-PCR)에 의해 측정될 수 있다. 샘플을 희석하고 DNase I(또는 또 다른 적합한 뉴클레아제)로 소화시켜 외인성 DNA를 제거한다. 뉴클레아제의 불활성화 후, 샘플을 추가로 희석하고 프라이머 및 프라이머 사이의 DNA 서열에 특이적인 TaqMan™ 형광발색 프로브를 사용하여 증폭시킨다. 정의된 형광발광 수준에 도달하는 데 필요한 사이클 수(역치 사이클, Ct)를 Applied Biosystems Prism 7700 서열 검출 시스템 상에서 각각의 샘플에 대해 측정한다. AAV 벡터에 함유된 것과 동일한 서열을 함유하는 플라스미드 DNA를 이용하여 Q-PCR 반응에서 표준 곡선을 생성한다. 샘플로부터 수득된 사이클 역치(Ct) 값을 사용하여 플라스미드 표준 곡선의 Ct 값으로 정규화함으로써 벡터 게놈 역가를 결정한다. 디지털 PCR에 기초한 종료점 검정이 또한 사용될 수 있다.
일 측면에서, 광범위 스펙트럼 세린 프로테아제, 예를 들어, 프로테이나제 K (예컨대 Qiagen으로부터 상업적으로 입수가능함)를 활용하는 최적화된 q-PCR 방법이 사용된다. 보다 특히, 최적화된 qPCR 게놈 역가 검정은 DNase I 소화 후, 샘플을 프로테이나제 K 완충액으로 희석하고 프로테이나제 K로 처리한 다음 열 불활성화시킨다는 것을 제외하고는, 표준 검정과 유사하다.  적절하게 샘플을 샘플 크기와 동일한 양의 프로테이나제 K 완충액으로 희석한다.  프로테이나제 K 완축액은 2 배 또는 그 이상 농축될 수 있다.  전형적으로, 프로테이나제 K 처리는 약 0.2 mg/mL이지만, 0.1 mg/mL 내지 약 1 mg/mL로 달라질 수 있다.  처리 단계는 일반적으로 약 55℃에서 약 15 분 동안 수행되지만, 더 낮은 온도(예를 들어, 약 37℃ 내지 약 50℃)에서 장시간(예를 들어, 약 20 분 내지 약 30 분)에 걸쳐, 또는 더 높은 온도(예를 들어, 최대 약 60℃)에서 단시간(예를 들어, 약 5 내지 10 분)에 걸쳐 수행될 수 있다. 유사하게, 열 불활성화는 일반적으로 약 95℃에서 약 15 분 동안이지만, 온도는 더 낮아지고(예를 들어, 약 70 내지 약 90℃) 시간은 연장될 수 있다(예를 들어, 약 20 분 내지 약 30 분).  그 다음에 샘플을 희석하고(예를 들어, 1000 배) 표준 검정에 기재된 바와 같이 TaqMan 분석에 적용한다. 
추가적으로, 또는 대안적으로, 액적 디지털 PCR(ddPCR)이 사용될 수 있다. 예를 들어, ddPCR에 의해 단일-가닥 및 자기-상보성 AAV 벡터 게놈 역가를 결정하는 방법이 기재되었다. 예를 들어, M. Lock et al, Hum Gene Ther Methods. 2014 Apr;25(2):115-25. doi: 10.1089/hgtb.2013.131. Epub 2014 Feb 14 참조.
간단히 말해서, 게놈-결핍 AAV 중간체로부터 패키징된 게놈 서열을 갖는 rAAV 입자를 분리하는 방법은 재조합 AAV 바이러스 입자 및 AAV 캡시드 중간체를 포함하는 현탁액을 고속 성능 액체 크로마토그래피에 적용하는 것을 수반하며, 여기서 AAV 바이러스 입자 및 AAV 중간체는 높은 pH에서 평형시킨 강한 음이온 교환 수지에 결합되고, 약 260 및 약 280에서 자외선 흡광도에 대해 용리액을 모니터링하면서 염 구배에 적용된다. pH는 선택된 AAV에 따라 조정될 수 있다. 예를 들어, 본원에 참조로 포함된 WO2017/160360(AAV9), WO2017/100704(AAVrh10), WO 2017/100676(예를 들어, AAV8), 및 WO 2017/100674(AAV1)] 참조. 이 방법에서, A260/A280의 비가 변곡점에 도달할 때 용리되는 분획으로부터 AAV 가득 찬 캡시드가 수집된다. 일 예에서, 친화성 크로마토그래피 단계의 경우, 정용여과된 생성물은 AAV2 혈청형을 효율적으로 포획하는 Capture SelectTM Poros-AAV2/9 친화성 수지(Life Technologies)에 적용될 수 있다. 이러한 이온성 조건 하에, 유의한 백분율의 잔류 세포 DNA 및 단백질이 칼럼을 통해 유동하고, AAV 입자가 효율적으로 포획된다.
III. 조성물 및 용도
본원에는 적어도 하나의 rAAV 스톡(예를 들어, rAAV 스톡 또는 돌연변이체 rAAV 스톡) 및 임의적인 담체, 부형제 및/또는 보존제를 함유하는 조성물이 제공된다. rAAV 스톡은 예를 들어 농도 및 투여량 단위의 논의에서 하기 기재된 양에서와 같이 동일한 복수의 rAAV 벡터를 지칭한다.
본원에 사용된 바와 같이, "담체"는 임의의 및 모든 용매, 분산 매질, 비히클, 코팅제, 희석제, 항균제 및 항진균제, 등장성 및 흡수 지연제, 완충제, 담체 용액, 현탁액, 콜로이드 등을 포함한다. 약제학적 활성 물질에 대한 이러한 매질 및 제제의 사용은 당업계에 널리 알려져 있다. 보충 활성성분이 또한 조성물 내에 혼입될 수 있다. 어구 "약제학적으로 허용되는"은 숙주에 투여될 때 알레르기성 또는 유사한 원치않은 반응을 생성하지 않는 분자 실체 및 조성물을 지칭한다. 리포솜, 나노캡슐, 미세입자, 미소구체, 지질 입자, 소포 등과 같은 전달 비히클은 본 발명의 조성물을 적합한 숙주 세포 내에 도입하기 위해 사용될 수 있다. 특히, 전달을 위해 지질 입자, 리포솜, 소포, 나노구체, 또는 나노입자 등에 캡슐화된 rAAV 벡터 전달 전이유전자가 제형화될 수 있다.
일 구현예에서, 조성물은 대상체에 전달하기에 적합한 최종 제형을 포함하며, 예를 들어, 생리학적으로 호환되는 pH 및 염 농도로 완충된 수성 액체 현탁액이다. 임의적으로, 하나 이상의 계면활성제가 제형에 존재한다. 또 다른 구현예에서, 조성물은 대상체에 투여하기 위해 희석되는 농축물로 수송될 수 있다. 다른 구현예에서, 조성물은 동결건조되고 투여 시 재구성될 수 있다.
적합한 계면활성제, 또는 계면활성제의 조합은 무독성인 비-이온성 계면활성제 중에서 선택될 수 있다. 일 구현예에서, 예를 들어, 중성 pH를 갖고, 평균 분자량이 8400이며 폴록사머 188(Poloxamer 188)로도 알려져 있는 Pluronic® F68[BASF]과 같은 1차 히드록실 기에서 종결되는 이작용성 블록 공중합체 계면활성제가 선택된다. 다른 계면활성제 및 다른 폴록사머, 즉, 폴리옥시에틸렌(폴리(에틸렌 옥사이드))의 2 개의 친수성 쇄가 측면에 있는 폴리옥시프로필렌(폴리(프로필렌 옥사이드))의 중심 소수성 쇄, SOLUTOL HS 15(마크로골-15 히드록시스테아레이트), LABRASOL(폴리옥시 카프릴산 글리세리드), 폴리옥시 10 올레일 에테르, TWEEN(폴리옥시에틸렌 소르비탄 지방산 에스테르), 에탄올 및 폴리에틸렌 글리콜로 구성된 비이온성 트리블록 공중합체가 선택될 수 있다. 일 구현예에서, 제형은 폴록사머를 함유한다. 이들 공중합체는 통상적으로 문자 "P"(폴록사머의 경우) 다음에 3 자리 숫자로 명명되는데, 처음 2 자리 숫자에 100을 곱하여 폴리옥시프로필렌 코어의 대략적인 분자 질량을 제공하고, 마지막 자리 숫자에 10을 곱하여 폴리옥시에틸렌 함량 백분율을 제공한다. 일 구현예에서 폴록사머 188이 선택된다. 계면활성제는 현탁액의 최대 약 0.0005% 내지 약 0.001%의 양으로 존재할 수 있다.
벡터는 과도한 부작용 없이, 또는 의학적으로 허용되는 생리학적 효과를 갖는 치료 이점을 제공하기 위해 세포를 형질감염시키고 충분한 수준의 유전자 전달 및 발현을 제공하기에 충분한 양으로 투여되며, 이는 의약 분야의 숙련자에 의해 결정될 수 있다. 통상적이고 약제학적으로 허용되는 투여 경로는 원하는 기관(예를 들어, 간(임의적으로 간 동맥을 통해), 폐, 심장, 눈, 신장)으로의 직접 전달, 경구, 흡입, 비강내, 척추강내, 기관내, 동맥내, 눈에 직접 전달(임의적으로 안구 전달, 망막하 주사, 망막내 주사, 유리체내, 국소), 정맥내, 근육내, 피하, 피내, 및 다른 비경구 투여 경로를 포함하나 이에 제한되지 않는다. 일 구현예에서, 투여 경로는 망막하 또는 유리체내 주사이다. 투여 경로는 원하는 경우 조합될 수 있다.
바이러스 벡터의 투여량은 주로 치료되는 상태, 환자의 연령, 체중 및 건강과 같은 요인을 따를 것이며, 따라서 환자마다 다를 수 있다. 예를 들어, 바이러스 벡터의 치료적으로 효과적인 인간 투여량은 일반적으로 약 1 x 109 내지 1 x 1016 게놈 바이러스 벡터의 농도를 함유하는 용액의 약 25 내지 약 1000 마이크로리터 내지 약 100 mL 범위이다. 투여량은 임의의 부작용에 대한 치료적 이점을 균형맞추기 위해 조정될 것이며 이러한 투여량은 재조합 벡터가 이용되는 치료적 적용에 따라 달라질 수 있다. 전이유전자의 발현 수준을 모니터링하여 바이러스 벡터, 바람직하게는 미니유전자를 함유하는 AAV 벡터를 생성하는 투여량 빈도를 결정할 수 있다. 임의적으로, 치료적 목적에 대해 기재된 것들과 유사한 투여량 레지멘이 본 발명의 조성물을 사용한 면역화에 활용될 수 있다.
복제-결함 바이러스 조성물은 범위 내의 모든 정수 또는 분수량을 포함하여 약 1.0 x 109 GC 내지 약 1.0 x 1016 GC(평균 체중 70 kg의 대상체를 치료하기 위해), 및 바람직하게는 인간 환자의 경우 1.0 x 1012 GC 내지 1.0 x 1014 GC 범위의 복제-결함 바이러스의 양을 함유하도록 투여량 단위로 제형화될 수 있다. 일 구현예에서, 조성물은 범위 내의 모든 정수 또는 분수량을 포함하여 용량 당 적어도 1x109, 2x109, 3x109, 4x109, 5x109, 6x109, 7x109, 8x109, 또는 9x109 GC를 함유하도록 제형화된다. 또 다른 구현예에서, 조성물은 범위 내의 모든 정수 또는 분수량을 포함하여 용량 당 적어도 1x1010, 2x1010, 3x1010, 4x1010, 5x1010, 6x1010, 7x1010, 8x1010, 또는 9x1010 GC를 함유하도록 제형화된다. 또 다른 구현예에서, 조성물은 범위 내의 모든 정수 또는 분수량을 포함하여 용량 당 적어도 1x1011, 2x1011, 3x1011, 4x1011, 5x1011, 6x1011, 7x1011, 8x1011, 또는 9x1011 GC를 함유하도록 제형화된다. 또 다른 구현예에서, 조성물은 범위 내의 모든 정수 또는 분수량을 포함하여 용량 당 적어도 1x1012, 2x1012, 3x1012, 4x1012, 5x1012, 6x1012, 7x1012, 8x1012, 또는 9x1012 GC를 함유하도록 제형화된다. 또 다른 구현예에서, 조성물은 범위 내의 모든 정수 또는 분수량을 포함하여 용량 당 적어도 1x1013, 2x1013, 3x1013, 4x1013, 5x1013, 6x1013, 7x1013, 8x1013, 또는 9x1013 GC를 함유하도록 제형화된다. 또 다른 구현예에서, 조성물은 범위 내의 모든 정수 또는 분수량을 포함하여 용량 당 적어도 1x1014, 2x1014, 3x1014, 4x1014, 5x1014, 6x1014, 7x1014, 8x1014, 또는 9x1014 GC를 함유하도록 제형화된다. 또 다른 구현예에서, 조성물은 범위 내의 모든 정수 또는 분수량을 포함하여 용량 당 적어도 1x1015, 2x1015, 3x1015, 4x1015, 5x1015, 6x1015, 7x1015, 8x1015, 또는 9x1015 GC를 함유하도록 제형화된다. 일 구현예에서, 인간 적용의 경우 용량은 범위 내의 모든 정수 또는 분수량을 포함하여 용량 당 1x1010 내지 약 1x1012 GC 범위일 수 있다.
이러한 상기 용량은 치료되는 면적의 크기, 사용되는 바이러스 역가, 투여 경로, 및 원하는 방법 효과에 따라, 범위 내의 모든 수를 포함하여, 약 25 내지 약 1000 마이크로 리터, 또는 그 이상의 부피 범위의 다양한 부피의 담체, 부형제 또는 완충제 제형으로 투여될 수 있다. 일 구현예에서, 담체, 부형제 또는 완충제의 부피는 적어도 약 25 μL이다. 일 구현예에서, 부피는 약 50 μL이다. 또 다른 구현예에서, 부피는 약 75 μL이다. 또 다른 구현예에서, 부피는 약 100 μL이다. 또 다른 구현예에서, 부피는 약 125 μL이다. 또 다른 구현예에서, 부피는 약 150 μL이다. 또 다른 구현예에서, 부피는 약 175 μL이다. 또 다른 구현예에서, 부피는 약 200 μL이다. 또 다른 구현예에서, 부피는 약 225 μL이다. 또 다른 구현예에서, 부피는 약 250 μL이다. 또 다른 구현예에서, 부피는 약 275 μL이다. 또 다른 구현예에서, 부피는 약 300 μL이다. 또 다른 구현예에서, 부피는 약 325 μL이다. 또 다른 구현예에서, 부피는 약 350 μL이다. 또 다른 구현예에서, 부피는 약 375 μL이다. 또 다른 구현예에서, 부피는 약 400 μL이다. 또 다른 구현예에서, 부피는 약 450 μL이다. 또 다른 구현예에서, 부피는 약 500 μL이다. 또 다른 구현예에서, 부피는 약 550 μL이다. 또 다른 구현예에서, 부피는 약 600 μL이다. 또 다른 구현예에서, 부피는 약 650 μL이다. 또 다른 구현예에서, 부피는 약 700 μL이다. 또 다른 구현예에서, 부피는 약 700 내지 1000 μL이다.
특정 구현예에서, 용량은 약 1 x 109 GC/g 뇌 질량 내지 약 1 x 1012 GC/g 뇌 질량 범위일 수 있다. 특정 구현예에서, 용량은 약 3 x 1010 GC/g 뇌 질량 내지 약 3 x 1011 GC/g 뇌 질량 범위일 수 있다. 특정 구현예에서, 용량은 약 5 x 1010 GC/g 뇌 질량 내지 약 1.85 x 1011 GC/g 뇌 질량 범위일 수 있다.
또 다른 측면에서, 대상체에 투여하기에 적합한 수성 현탁액이 제공된다. 일 구현예에서, 현탁액은 수성 현탁 액체 및 안구 질환의 치료 또는 예방을 위한 치료제로서 유용한 본원에 기재된 바와 같은 재조합 아데노-연관 바이러스(rAAV)의 눈 당 약 1 x109 바이러스 입자 내지 약 1 x1013 GC 바이러스 입자를 포함한다. 일 구현예에서, 현탁액은 망막하 또는 유리체내 주사에 적합하다.
일 구현예에서, 바이러스 작제물은 적어도 약 최소 1x109 GC 내지 약 1 x 1015 GC, 또는 약 1 x 1011 GC 내지 5 x 1013 GC의 용량으로 전달될 수 있다. 이들 용량 및 농도의 전달에 적합한 부피는 당업자에 의해 결정될 수 있다. 예를 들어, 약 1 μL 내지 150 mL의 부피가 선택될 수 있으며, 성인의 경우 더 높은 부피가 선택된다. 전형적으로, 신생아의 경우 적합한 부피는 약 0.5 mL 내지 약 10 mL이며, 영아의 경우, 약 0.5 mL 내지 약 15 mL가 선택될 수 있다. 유아의 경우, 약 0.5 mL 내지 약 20 mL의 부피가 선택될 수 있다. 어린이의 경우, 최대 약 30 mL의 부피가 선택될 수 있다. 십대 초반 및 십대의 경우, 최대 약 50 mL의 부피가 선택될 수 있다. 또 다른 구현예에서, 환자는 약 5 mL 내지 약 15 mL의 부피가 선택되거나, 또는 약 7.5 mL 내지 약 10 mL로 척수강내 투여를 받을 수 있다. 다른 적합한 부피 및 투여량이 결정될 수 있다. 투여량은 임의의 부작용에 대한 치료적 이점을 균형맞추기 위해 조정될 것이며 이러한 투여량은 재조합 벡터가 이용되는 치료적 적용에 따라 달라질 수 있다.
상기 기재된 재조합 벡터는 공개된 방법에 따라 숙주 세포에 전달될 수 있다. 바람직하게는 생리학적으로 호환되는 담체에 현탁된 rAAV는 인간 또는 비-인간 포유동물 환자에게 투여될 수 있다. 특정 구현예에서, 인간 환자에게 투여하는 경우, rAAV는 염수, 계면활성제, 및 생리학적으로 호환되는 염 또는 염의 혼합물을 함유하는 수용액에 적합하게 현탁된다. 적합하게, 제형은 생리학적으로 허용되는 pH, 예를 들어, pH 6 내지 9, 또는 pH 6.5 내지 7.5, pH 7.0 내지 7.7, 또는 pH 7.2 내지 7.8 범위로 조정된다. 뇌척수액의 pH는 약 7.28 내지 약 7.32이므로, 척수강내 전달의 경우, 이 범위 내의 pH가 바람직할 수 있지만; 정맥내, 망막하 또는 유리체내 전달의 경우, 약 6.8 내지 약 7.2의 pH가 바람직할 수 있다. 그러나, 다른 전달 경로를 위해 광범위한 범위 및 이들 하위 범위 내의 다른 pH가 선택될 수 있다.
또 다른 구현예에서, 조성물은 담체, 희석제, 부형제 및/또는 애주번트(adjuvant)를 포함한다. 적합한 담체는 전달 바이러스가 지시되는 적응증의 관점에서 당업자에 의해 쉽게 선택될 수 있다. 예를 들어, 하나의 적합한 담체는 염수를 포함하며, 다양한 완충 용액(예를 들어, 포스페이트 완충 염수)로 제형화될 수 있다. 다른 예시적인 담체는 멸균 염수, 락토스, 수크로스, 칼슘 포스페이트, 젤라틴, 덱스트란, 한천, 펙틴, 땅콩유, 참깨유, 및 물을 포함한다. 완충제/담체는 rAAV가 주사관에 붙는 것을 방지하지만 생체내에서 rAAV 결합 활성을 방해하지 않는 구성요소를 포함해야 한다. 적합한 계면활성제, 또는 계면활성제의 조합은 무독성인 비-이온성 계면활성제 중에서 선택될 수 있다. 일 구현예에서, 예를 들어 중성 pH를 갖고, 평균 분자량이 8400이며 폴록사머 188로도 알려져 있는 Pluronic® F68[BASF]과 같은 1차 히드록실 기에서 종결되는 이작용성 블록 공중합체 계면활성제가 선택된다. 다른 계면활성제 및 다른 폴록사머, 즉, 폴리옥시에틸렌(폴리(에틸렌 옥사이드))의 2 개의 친수성 쇄가 측면에 있는 폴리옥시프로필렌(폴리(프로필렌 옥사이드))의 중심 소수성 쇄, SOLUTOL HS 15(마크로골-15 히드록시스테아레이트), LABRASOL(폴리옥시 카프릴산 글리세리드), 폴리옥시 -올레일 에테르, TWEEN(폴리옥시에틸렌 소르비탄 지방산 에스테르), 에탄올 및 폴리에틸렌 글리콜로 구성된 비이온성 트리블록 공중합체가 선택될 수 있다. 일 구현예에서, 제형은 폴록사머를 함유한다. 이들 공중합체는 통상적으로 문자 "P"(폴록사머의 경우) 다음에 3 자리 숫자로 명명되는데, 처음 2 자리 숫자에 100을 곱하여 폴리옥시프로필렌 코어의 대략적인 분자 질량을 제공하고, 마지막 자리 숫자에 10을 곱하여 폴리옥시에틸렌 함량 백분율을 제공한다. 일 구현예에서 폴록사머 188이 선택된다. 계면활성제는 현탁액의 최대 약 0.0005% 내지 약 0.001%의 양으로 존재할 수 있다. 일 예에서, 제형은 예를 들어, 물 중에 나트륨 클로라이드, 나트륨 비카르보네이트, 덱스트로스, 마그네슘 술페이트(예를 들어, 마그네슘 술페이트·7H2O), 칼륨 클로라이드, 칼슘 클로라이드(예를 들어, 칼슘 클로라이드·2H2O), 이염기성 나트륨 포스페이트, 및 이의 혼합물 중 하나 이상을 포함하는 완충 염수 용액을 함유할 수 있다. 적합하게, 척수강내 전달의 경우, 삼투압 농도는 뇌척수액과 호환가능한 범위(예를 들어, 약 275 내지 약 290) 내에 있으며; 예를 들어, emedicine.medscape.com/article/2093316-overview를 참조한다. 임의적으로, 척수강내 전달을 위해, 상업적으로 입수가능한 희석제가 현탁제로서, 또는 또 다른 현탁제 및 다른 임의적인 부형제와 조합하여 사용될 수 있다. 예를 들어, Elliotts B® 용액[Lukare Medical] 참조. 다른 구현예에서, 제형은 하나 이상의 투과 증진제를 함유할 수 있다. 적합한 투과 증진제의 예는 예를 들어, 만니톨, 나트륨 글리코콜레이트, 나트륨 타우로콜레이트, 나트륨 데옥시콜레이트, 나트륨 살리실레이트, 나트륨 카프릴레이트, 나트륨 카프레이트, 나트륨 라우릴 술페이트, 폴리옥시에틸렌-9-라우렐 에테르, 또는 EDTA를 포함할 수 있다.
임의적으로, 본 발명의 조성물은 rAAV 및 담체(들) 이외에도, 보존제, 또는 화학 안정화제와 같은 다른 통상적인 약제학적 성분을 함유할 수 있다. 적합한 예시적인 보존제는 클로로부탄올, 칼륨 소르베이트, 소르브산, 이산화황, 프로필 갈레이트, 파라벤, 에틸 바닐린, 글리세린, 페놀, 및 파라클로로페놀을 포함한다. 적합한 화학 안정화제는 젤라틴 및 알부민을 포함한다.
본 발명에 따른 조성물은 상기 정의된 바와 같은 약제학적으로 허용되는 담체를 포함할 수 있다. 적합하게, 본원에 기재된 조성물은 약제학적으로 적합한 담체에 현탁되고/되거나 주사, 삼투압 펌프, 척수강내 카테터를 통해 대상체에 전달하기 위해, 또는 또 다른 장치 또는 경로에 의해 전달하기 위해 설계된 적합한 부형제와 혼합된 유효량의 하나 이상의 AAV를 포함한다. 일 예에서, 조성물은 척수강내 전달을 위해 제형화된다.
본원에 사용된 용어 "척수강내 전달" 또는 "척수강내 투여"는 약물이 뇌척수액(CSF)에 도달하도록 척추관으로, 보다 구체적으로 지주막하 공간으로 주사를 통한 약물의 투여 경로를 지칭한다. 척수강내 전달은 요추 천자, 심실내(뇌실내(ICV) 포함), 후두하/수조내, 및/또는 C1-2 천자를 포함할 수 있다. 예를 들어, 요추 천자에 의해 지주막하 공간 전체에 확산시키기 위한 물질이 도입될 수 있다. 또 다른 예에서, 주사는 대수조 내로 이루어질 수 있다.
본원에 사용된 용어 "수조내 전달" 또는 "수조내 투여"는 대수조 소뇌숨뇌의 뇌척수액으로 직접, 보다 구체적으로 후두하 천자를 통하거나 또는 대수소 내에 직접 주사하거나 또는 영구적으로 배치된 튜브를 통한 약물의 투여 경로를 지칭한다.
일 측면에서, 본원에 제공된 벡터는 방법 및/또는 장치를 통해 척추강내로 투여될 수 있다. 예를 들어, 본원에 참조로 포함된 WO 2017/181113 참조. 대안적으로, 다른 장치 및 방법이 선택될 수 있다. 방법은 척추 바늘을 환자의 대수조 내에 전진시키는 단계, 유연한 관의 길이를 척추 바늘의 근위 허브에 연결하고 밸브의 출력 포트를 유연한 관의 근위 단부에 연결하는 단계, 및 상기 전진 및 연결 단계 후 및 관을 환자의 뇌척수액으로 자가-프라이밍하도록 허용한 후, 일정량의 등장성 용액을 함유하는 제1 용기를 밸브의 플러시 입력 포트에 연결하고 이후에 일정량의 약제학적 조성물을 함유하는 제2 용기를 밸브의 벡터 입력 포트에 연결하는 단계를 포함한다. 제1 및 제2 용기를 밸브에 연결한 후, 밸브의 벡터 입력 포트 및 출력 포트 사이에 유체 흐름용 경로를 개방하고 약제학적 조성물을 척추 바늘을 통해 환자에 주사하고, 약제학적 조성물을 주사한 후, 밸브의 플러시 입력 포트 및 출력 포트를 통해 유체 흐름용 경로를 개방하고 등장성 용액을 척추 바늘에 주사하여 약제학적 조성물을 환자에게 플러시한다.
이 방법 및 이 장치는 각각 본원에 제공된 조성물의 척수강내 전달을 위해 임의적으로 사용될 수 있다. 대안적으로, 다른 방법 및 장치가 이러한 척수강내 전달을 위해 사용될 수 있다.
단수형 용어가 하나 이상을 지칭한다는 점에 유의해야 한다. 이와 같이, 단수형, "하나 이상", 및 "적어도 하나"라는 용어는 본원에서 상호교환가능하게 사용된다.
"포함하다", "포함한다", 및 "포함하는"이라는 단어는 배타적이지 않고 포괄적으로 해석되어야 한다. "이루어지다", "이루어진", 및 이의 변이는 포괄적이지 않고 배타적으로 해석되어야 한다. 명세서에서 다양한 구현예가 "포함하는"이라는 언어를 사용하여 제시되지만, 다른 상황 하에, 관련 구현예는 또한 "로 이루어진" 또는 "로 본질적으로 이루어진"이라는 언어를 사용하여 해석되고 기재되는 것으로 의도된다.
본원에 사용된 용어 "약"은 달리 명시되지 않는 한, 주어진 참조로부터 10%의 변동성(±10%)을 의미한다.
본원에 사용된 바와 같이, "질환", "장애" 및 "상태"는 대상체의 비정상적인 상태를 나타내기 위해 상호교환가능하게 사용된다.
본 명세서에서 달리 정의되지 않는 한, 본원에 사용되는 기술적 및 과학적 용어는 당업자에 의해 및 공개된 텍스트를 참조하여 통상적으로 이해되는 것과 동일한 의미를 가지며, 이는 당업자에게 본 출원에 사용되는 많은 용어에 대한 일반적인 지침을 제공한다.
용어 "발현"은 광범위한 의미로 본원에 사용되며 RNA의 생산 또는 RNA 및 단백질의 생산을 포함한다. RNA와 관련하여, 용어 "발현" 또는 "번역"은 특히 펩티드 또는 단백질의 생산에 관한 것이다. 발현은 일시적일 수 있거나 또는 안정적일 수 있다.
본원에 사용된 용어 "NAb 역가"는 표적화된 에피토프(예를 들어, AAV)의 생리학적 효과를 중화시키는 중화 항체(예를 들어, 항-AAV Nab)가 얼마나 많이 생성되었는지에 대한 측정치이다. 항-AAV NAb 역가는 예를 들어, 본원에 참조로 포함된 Calcedo, R., et al., Worldwide Epidemiology of Neutralizing Antibodies to Adeno-Associated Viruses. Journal of Infectious Diseases, 2009. 199(3): p. 381-390에 기재된 바와 같이 측정될 수 있다.
본원에 사용된 바와 같이, "발현 카세트"는 코딩 서열, 프로모터를 포함하고, 이에 대한 다른 조절 서열을 포함할 수 있는 핵산 분자를 지칭하며, 카세트는 유전적 요소(예를 들어, 플라스미드)를 통해 패키징 숙주 세포에 전달되고 바이러스 벡터(예를 들어, 바이러스 입자)의 캡시드 내에 패키징될 수 있다. 전형적으로, 바이러스 벡터를 생성하기 위한 이러한 발현 카세트는 바이러스 게놈 및 본원에 기재된 것과 같은 다른 발현 제어 서열의 패키징 신호에 의해 측면에 있는 본원에 기재된 유전자 산물에 대한 코딩 서열을 함유한다.
약어 "sc"는 자기-상보성을 지칭한다. "자기-상보성 AAV"는 재조합 AAV 핵산 서열에 의해 운반되는 코딩 영역이 분자내 이중-가닥 DNA 주형을 형성하도록 설계된 작제물을 지칭한다. 감염 시, 제2 가닥의 세포 매개 분석을 기다리기 보다, scAAV의 2 개의 상보성 반쪽은 즉시 복제 및 전사할 준비가 된 하나의 이중 가닥 DNA(dsDNA) 단위를 형성하도록 회합될 것이다. 예를 들어, D M McCarty et al, "Self-complementary recombinant adeno-associated virus (scAAV) vectors promote efficient transduction independently of DNA synthesis", Gene Therapy, (August 2001), Vol 8, Number 16, Pages 1248-1254 참조. 자기-상보성 AAV는 예를 들어, 미국 특허 번호 제6,596,535호; 제7,125,717호; 및 제7,456,683호에 기재되어 있으며, 각각은 그 전문이 본원에 참조로 포함된다.
본원에 사용된 용어 "작동가능하게 연결된"은 관심있는 유전자와 인접하는 발현 제어 서열 및 관심있는 유전자를 제어하기 위해 트랜스에서 또는 떨어져서 작용하는 발현 제어 서열 둘 다를 지칭한다
용어 "이종"은 단백질 또는 핵산과 관련하여 사용될 때 단백질 또는 핵산이 2 개 이상의 서열 또는 자연에서 서로 동일한 관계에서 발견되지 않는 하위서열을 포함한다는 것을 나타낸다. 예를 들어, 핵산은 전형적으로 재조합적으로 생성되며, 새로운 기능적 핵산을 만들도록 정렬된 관련없는 유전자로부터 2 개 이상의 서열을 갖는다. 예를 들어, 일 구현예에서, 상이한 유전자로부터 코딩 서열의 발현을 지시하도록 배열된 하나의 유전자로부터의 프로모터를 갖는다. 따라서, 코딩 서열과 관련하여, 프로모터는 이종이다.
"복제-결함 바이러스" 또는 "바이러스 벡터"는 관심있는 유전자를 함유하는 발현 카세트가 바이러스 캡시드 또는 외피에 패키징되는 합성 또는 인공 바이러스 입자를 지칭하며, 여기서 또한 바이러스 캡시드 또는 외피 내에서 패키징된 임의의 바이러스 게놈 서열은 복제-결핍이며; 즉, 자손 비리온을 생성할 수 없지만 표적 세포를 감염시키는 능력을 보유한다. 일 구현예에서, 바이러스 벡터의 게놈은 복제에 필요한 효소를 암호화하는 유전자를 포함하지 않지만(게놈은 인공 게놈의 증폭 및 패키징에 필요한 신호가 측면에 있는 관심있는 전이유전자만을 함유하는 "실질이 없는(gutless)" 것으로 조작될 수 있음), 이들 유전자는 생산 동안 공급될 수 있다. 따라서, 자손 비리온에 의한 복제 및 감염이 복제에 필요한 바이러스 효소가 존재하는 경우를 제외하고는 발생할 수 없으므로 유전자 요법에서 사용하기에 안전한 것으로 간주된다.
많은 경우에, rAAV 입자는 DNase 내성으로 지칭된다. 그러나, 이 엔도뉴클레아제(DNase) 이외에도, 다른 엔도- 및 엑소-뉴클레아제가 또한 본원에 기재된 정제 단계에 사용되어, 오염된 핵산을 제거할 수 있다. 이러한 뉴클레아제는 단일 가닥 DNA 및/또는 이중-가닥 DNA, 및 RNA를 분해하기 위해 선택될 수 있다. 이러한 단계는 단일 뉴클레아제, 또는 상이한 표적에 대해 지시된 뉴클레아제의 혼합물을 함유할 수 있고, 엔도뉴클레아제 또는 엑소뉴클레아제일 수 있다.
용어 "뉴클레아제-내성"은 AAV 캡시드가 전이유전자를 숙주 세포에 전달하도록 설계된 발현 카세트 주위에 완전히 어셈블리되며 생산 과정에서 존재할 수 있는 오염된 핵산을 제거하도록 설계된 뉴클레아제 인큐베이션 단계 동안 분해(소화)로부터 이들 패키징된 게놈 서열을 보호하는 것을 나타낸다.
본 발명의 맥락에서 용어 "번역"은 리보솜에서의 과정에 관한 것이며, 여기서 mRNA 가닥은 아미노산 서열의 어셈블리를 제어하여 단백질 또는 펩티드를 생성한다.
본 명세서 및 청구범위 전반에 걸쳐 사용된 바와 같이, 용어 "포함하는" 및 "포함한"은 다른 구성요소, 요소, 정수, 단계 등을 포함한다. 반대로, 용어 "이루어진" 및 이의 변이는 다른 구성요소, 요소, 정수, 단계 등을 제외한다.
상기 기재된 바와 같이, 용어 "약"은 수치 값을 수식하는 데 사용될 때, 달리 명시되지 않는 한 ±10%의 변동을 의미한다.
하기 실시예는 단지 예시적이며 본 발명을 제한하는 것으로 의도되지 않는다.
실시예
하기 실시예는 구조적, 생화학적, 및 질량 분석법 접근법으로 증거가 뒷받침된 AAV8 및 추가적인 다양한 AAV 혈청형의 광범위한 탈아미드화를 보고한다. 각각의 부위에서 탈아미드화 정도는 벡터의 수명 및 다중 1차-서열 및 3D-구조적 인자에 따라 달라졌지만, 벡터 회수 및 정제 조건과는 거의 무관하였다. 벡터 형질도입 활성에 영향을 미치는 탈아미드화에 대한 잠재력을 입증하고, 벡터 활성 상실의 초기 시점을 여러 AAV8 아스파라긴에서 빠르게 진행되는 자발적 탈아미드화와 관련시킨다. 본 발명은 벡터 형질도입을 개선시키고 생물제제 제조 시 주요 관심사인 로트 간 분자 변동성을 감소시켜, 측쇄 아미드를 안정화시키는 돌연변이 전략을 탐구한다. 이 연구는 AAV 캡시드 이질성의 이전에 알려지지 않은 측면을 예시하고 유전자 요법을 위한 이들 벡터의 개발에서 그 중요성을 강조한다.
실시예 1은 1차원 및 2차원 겔 전기영동, 질량 분석법, 및 드 노보 구조적 모델링에 의한 AAV8 벡터 캡시드에 대한 번역후 변형의 특성을 제공한다. 캡시드 표면 상의 다수의 추정 탈아미드화 부위의 식별 후, 시험관내 및 생체내 둘 다에서 캡시드 구조 및 기능에 대한 영향을 평가한다. 실시예 1은 이 분석을 AAV9로 추가로 확대시켜 이 현상이 AAV8 이외의 혈청형에 적용되는지를 결정하여, AAV 캡시드의 탈아미드화가 혈청형 특이적이 아님을 확인한다. 실시예 2-5는 별도의 AAV에서 탈아미드화를 제시한다.
실시예 1: 아데노-연관 바이러스 캡시드 표면 상에서 아미노산의 탈아미드화
A. 물질 및 방법
1. 1D 및 2D 겔 전기영동
1D SDS 폴리아크릴아미드 겔 전기영동(SDS-PAGE) 분석을 위해, 먼저 리튬 도데실 술페이트 및 환원제의 존재 하에 80℃에서 20 분 동안 AAV 벡터를 변성시켰다. 그 다음에, 상기 벡터를 200V에서 90 분 동안 4-12% Bis-Tris 겔 상에서 실행시키고 쿠마시 블루로 염색하였다. 도 1a - 도 1d의 데이터를 위해, Kendrick Laboratories, Inc.(위스콘신주 매디슨 소재)는 2D 겔 전기영동을 수행하였다. 후속 실험을 위해, 자체 2D SDS-PAGE를 수행하였다. 이를 위해, 35mM NaCl 및 1mM MgCl2를 함유하는 150μL 포스페이트 완충 염수(PBS)에서 500U 터보뉴클레아제 마커(Accelagen, 캘리포니아주 샌디에이고 소재)를 3 x 1011 GC의 AAV 벡터와 혼합하고 37℃에서 10 분 동안 인큐베이션하였다. 다음으로 9 부피의 절대 에탄올을 첨가하고, 샘플을 볼텍싱하고, -80℃에서 적어도 2 시간 동안 인큐베이션한 후 얼음에서 5 분 동안 인큐베이션하고 최대 속도로 30 분 동안 15℃에서 원심분리하였다. 상청액을 따라내고 펠릿을 공기-건조시킨 다음, 재현탁 완충액 #1[ddH2O 중 당일 첨가된 0.15% SDS, 50mM 디티오트레이톨(DTT), 10mM Tris pH 7.5, 및 1μL pH6-9 양성체, ThermoFisher ZM0023]에 재현탁하고 방해받지 않고 실온에서 인큐베이션하였다. 30 분 후, 샘플 튜브를 가볍게 쳐서 샘플을 혼합하고, 1μg 닭 콘알부민 마커(Sigma Aldrich, 미주리주 세인트루이스 소재)를 첨가하고, 샘플을 37℃에서 30 분 동안 인큐베이션하고, 가볍게 쳐서 15 분에 혼합하였다. 그 다음에 샘플을 50℃로 15-20 분 동안 옮기고, 볼텍싱하고, 95℃에서 2.5 분 동안 인큐베이션하고, 냉각시킨 후 최대 속도로 1 분 동안 원심분리하고 잠시 볼텍싱하였다. 그 다음에 10μL의 각각의 샘플을 140μL 재현탁 완충액 #2(ddH2O 중 당일 첨가된 9.7M 우레아, 2% CHAPS, 0.002% 브로모페놀 블루, 및 상기 기재된 0.05% 양성체)와 혼합하고 실온에서 10 분 동안 인큐베이션하였다. 그 다음에 혼합물을 pH 6-10 고정화 pH 구배(IPG) 스트립(ThermoFisher 매사추세츠주 월섬 소재)에 적용하고 제조업체의 설명서에 따라 ZOOM IPGRunner 시스템 상에서 실행하였다. 하기 등전점 전기영동 파라미터를 사용하였다: 120 분 동안 100-1,000V, 120 분 동안 1,000-2,000V, 120 분 동안 2,000V, 스트립 실행 당 0.1W 및 0.05mA로 제한. 그 다음에 IPG 스트립을 환원시키고 단일-웰 4-12% Bis-Tris 겔에 로딩하고 상기 기재된 바와 같이 1D로 실행시켰다. 내부 대조군 단백질 터보뉴클레아제(Accelagen, 27kDa) 및 계란 흰자위 콘알부민(Sigma Aldrich, 76kDa, pI 6.0-6.6)과 비교하여 AAV VP의 상대 이동을 결정하였다.
2. 벡터 생산
펜실베니아 대학 벡터 코어(The University of Pennsylvania Vector Core)는 1D 및 2D 겔 전기영동 및 질량 분석법 실험을 위한 재조합 AAV 벡터를 생성하고 이전에 기재된 바와 같이 세슘 클로라이드 또는 요오딕사놀 구배로 정제하였다. (Lock M, et al. Hum Gene Ther 2010; 21(10):1259-71; Gao GP, et al. Proc Natl Acad Sci USA. 2002; 99(18):11854-9). 다음과 같은 친화성 정제된 벡터를 생성하였다: 10 개의 36-층 하이퍼스택 용기(Corning)에서 HEK293 세포를 성장시키고, 벡터 게놈 플라스미드(pAAV-LSP-IVS2.hFIXco-WPRE-bGH), AAV2 rep 및 AAV8 cap 유전자를 함유하는 트랜스 플라스미드, 및 아데노바이러스 헬퍼 플라스미드의 혼합물로 공-형질감염시켰다. 형질감염제로 PEIpro(PolyPlus)를 사용하였다. 형질감염 후 5 일에, 상청액을 수확하고, Sartoguard PES Midicap 필터(Sartorious Stedim)를 통해 정화시키고, 벤조아제(Millipore)로 처리한 후, 0.6M이 되도록 염을 첨가하였다. 정화된 벌크 수확 물질을 접속 유동 여과(TFF)에 의해 10-배 농축시킨 다음 4 부피의 친화성 칼럼 로딩 완충액에 대해 정용여과하였다. 벡터를 POROS CaptureSelect(ThermoFisher) 친화성 칼럼 상에서 포획하고 벡터 피크를 낮은 pH에서 중화 완충액으로 직접 용리하였다. 중화된 용리액을 고-pH 결합 완충액으로 희석하고 이를 음이온 교환 연마 칼럼(Cimultus QA-8; Bia Separations) 상에 로딩하였으며, 이때 제제를 게놈-함유 (가득 찬) 입자로 풍부화하였다. 가득 찬 벡터 입자를 얕은 염 용리 구배로 용리하고 즉시 중화시켰다. 최종적으로, 최종 농도를 위해 벡터를 TFF의 제2 라운드에 적용하고 완충액을 제형 완충액(PBS + 0.001% 플루로닉 F-68)으로 교환하였다.
6-웰 플레이트에서 HEK293 세포의 소규모 삼중 형질감염에 의해 시험관내 검정을 위한 돌연변이체 벡터를 생성하였다. 90μL 무혈청 배지 중 5.6 μL의 1mg/mL 폴리에틸렌이민을 플라스미드 DNA(90μL 무혈청 배지 중 0.091μg 시스 플라스미드, 0.91μg 트랜스 플라스미드, 1.82 μg 델타F6 Ad-헬퍼 플라스미드)와 혼합하고, 이를 실온에서 15 분 동안 인큐베이션하고, 세포에 첨가하고 추가 0.8 mL의 신선한 무혈청 배지를 첨가하였다. 다음 날, 0.5mL의 상부 배지를 완전 혈청 배지로 대체하였다. 형질감염후 3 일에 동결/해동 사이클을 3 회 적용하여 벡터를 수확한 후 원심분리하여 세포 파편 및 상청액 수확물을 제거하였다. 시스 플라스미드는 Promega 키메라 인트론 및 토끼 베타-글로빈(RBG) 폴리아데닐화 신호를 갖는 닭-베타 액틴(CB7) 프로모터의 제어 하에 파이어플라이 루시퍼라제 전이유전자를 암호화하는 전이유전자 카세트를 함유하였다. 트랜스 플라스미드를 wtAAV8 cap 유전자로 암호화하여; 돌연변이체 AAV8 cap 변이체를 생성하였으며, Quikchange Lightning Mutagenesis 키트를 사용하였다(Agilent Technologies, 델라웨어주 윌밍턴 소재). 벡터는 이전에 기재된 바와 같이 적정하였다. (Lock M, et al. Hum Gene Ther 2010; 21(10):1259-71).
시간경과 벡터 생산 실험을 위해, 15cm 조직 배양 접시에서 HEK293 세포의 중간-규모 삼중 형질감염에 의해 벡터를 생성하였다. 플레이트 당, 2mL 무혈청 배지 중 36μL의 1mg/mL 폴리에틸렌이민 용액을 플라스미드 DNA(0.6μg 시스 플라스미드, 5.8μg 트랜스 플라스미드, 11.6μg 델타F6 Ad-헬퍼 플라스미드)와 혼합하고, 이를 실온에서 15 분 동안 인큐베이션하고, 14ml의 무혈청 배지로 다시 채운 플레이트 상에서 대략 60% 합류(confluency)로 세포에 첨가하였다. 다음 날, 8ml의 상부 배지를 신선한 완전 혈청 배지로 대체하였다. 모든 상부 배지를 수확하고, 접시에서 세포를 긁어내고 이를 -80℃에서 동결시켜 벡터를 수확하였다. 동결/해동 사이클을 3 회 적용하고, 용해물을 원심분리에 의해 정화시켜 상청액/세포 혼합물로부터 조질 벡터를 회수하였다. 벤조아제, 1M Tris pH7.5, 및 5M NaCl을 20 mM Tris 및 360mM NaCl의 최종 농도로 정화된 용해물에 첨가함으로써 질량 분석법 분석을 위한 벡터를 정제 및 농축하였다. 1 ml POROS CaptureSelect 친화성 칼럼 상에서 벡터를 포획하고 낮은 pH에서 벡터 피크를 중화 완충액으로 직접 용리하였다. 분획을 280nm에서의 흡광도로 분석하였고, 가장 농축된 분획을 질량 분석법 분석에 적용하였다.
생체내 실험을 위해, wtAAV8 캡시드 또는 6 개의 탈아미드화 돌연변이체 중 하나를 사용하여 이전에 기재된 바와 같은 벡터를 생성하였으며; 전이유전자 카세트는 CB7 프로모터, PI 인트론, 파이어플라이 루시퍼라제 전이유전자, 및 RBG 폴리아데닐화 신호를 포함하였다(Lock M, et al. Hum Gene Ther 2010; 21(10):1259-71).
3. 질량 분석법 실행/소화/분석
물질: 암모늄 비카르보네이트, DTT, 요오도아세트아미드(IAM), 및 18O-풍부화 물(97.1% 순도)은 Sigma(미주리주 세인트루이스 소재)로부터 구입하고; 아세토니트릴, 포름산, 트리플루오로아세트산(TFA), 8M 구아니딘 히드로클로라이드(GndHCl), 및 트립신은 Thermo Fischer Scientific(일리노이주 록퍼드 소재)으로부터 구입하였다.
트립신 소화: 1M DTT 및 1.0M 요오도아세트아미드의 스톡 용액을 제조하였다. 캡시드 단백질을 변성시키고 10mM DTT 및 2M GndHCl의 존재 하에 90℃에서 10 분 동안 환원시켰다. 샘플을 실온으로 냉각시킨 다음 실온에서 30 분 동안 암실에서 30mM IAM으로 알킬화하였다. 1mL DTT를 첨가하여 알킬화 반응을 급랭시켰다. 20mM 암모늄 비카르보네이트(pH 7.5-8)를 최종 GndHCl 농도가 200mM로 희석된 부피로 변성된 단백질 용액에 첨가하였다. 트립신 용액을 1:20 트립신 대 단백질 비로 첨가하고 37℃에서 밤새 인큐베이션하였다. 소화 후, TFA를 0.5%의 최종 농도로 첨가하여 소화 반응물을 급랭시켰다.
18O-물 실험을 위해, 캡시드 샘플을 먼저 Zeba 스핀 탈염화 칼럼(Thermo Scientific, 일리노이주 록퍼드 소재)을 사용하여 18O-물에서 제조된 100 mM 암모늄 비카르보네이트로 완충액 교환하였다. 샘플에서 물을 완전히 제거하도록 하기 위해, 완충액 교환을 2 회 수행하였다. 18O-물에서 1M DTT 및 1M IAM의 스톡 용액을 제조하였다. 18O-물 시약 및 완축액을 사용하여 상기와 동일한 변성, 알킬화, 및 소화 단계를 따랐다.
액체 크로마토그래피 탠덤-질량 분석법: Acclaim PepMap 칼럼(15cm 길이, 300μm 내부 직경) 및 NanoFlex 소스를 사용한 Q Exactive HF(Thermo Fisher Scientific)에 연결된 Thermo UltiMate 3000 RSLC 시스템(Thermo Fisher Scientific)을 사용하여 온라인 크로마토그래피를 수행하였다. 온라인 분석 동안, 칼럼 온도는 35℃의 온도로 유지하였다. 펩티드를 이동상 A(0.1% 포름산을 함유하는 MilliQ 물) 및 이동상 B(0.1% 포름산을 함유하는 아세토니트릴)의 구배로 분리하였다. 구배를 4% B에서 6% B로 15 분에 걸쳐, 10% B로 25 분에 걸쳐(총 40 분), 이어서 30% B로 46 분에 걸쳐(총 86 분) 실행하였다. 샘플을 칼럼 상에 직접 로딩하였다. 칼럼 크기는 75 cm x 15 um I.D.였고 2 미크론 C18 배지(Acclaim PepMap)로 패킹하였다. 로딩, 도입, 및 세척 단계로 인해, 각각의 액체 크로마토그래피 탠덤-질량 분석법 실행에 대한 총 시간은 약 2 시간이었다.
Q Exactive HF 질량 분광계 상에서 데이터-의존적 상위-20 방법을 사용하여 질량 분석법 데이터를 획득하여, 조사 스캔(200-2000 m/z)으로부터 가장 풍부한 아직 서열분석되지 않은 전구체 이온을 동적으로 선택하였다. 예측 자동 획득 제어로 결정된 1e5 이온의 표적 값으로 더 높은 에너지 충돌 해리 단편화를 통해 서열분석을 수행하였으며; 4m/z의 창으로 전구체 단리를 수행하였다. 200m/z에서 120,000의 해상도로 조사 스캔을 획득하였다. HCD 스펙트럼에 대한 해상도를 최대 이온 주사 시간 50ms 및 정규화된 충돌 에너지 30으로 m/z200에서 30,000으로 설정하였다. S-렌즈 RF 수준을 50으로 설정하여, 본 발명의 소화로부터 펩티드에 의해 차지된 m/z 영역의 최적 전송을 수득하였다. 단일 미할당 또는 6 이상의 전하 상태를 갖는 전구체 이온을 단편화 선택으로부터 제외하였다.
데이터 처리: BioPharma Finder 1.0 소프트웨어(Thermo Fischer Scientific)를 사용하여 획득한 모든 데이터를 분석하였다. 펩티드 맵핑을 위해, 카르바미도메틸화를 고정된 변형으로 설정하고, 산화, 탈아미드화, 및 인산화를 가변 변형으로 설정한 단일-진입 단백질 FASTA 데이터베이스를 사용하여 검색을 수행하였다. 탠덤-질량 분석법 스펙트럼에 대한 10ppm 질량 정확도, 높은 프로테아제 특이성, 및 신뢰 수준 0.8을 사용하였다. 탈아미드화된 펩티드의 질량 분석 식별은 탈아미드화가 온전한 분자의 질량 +0.984 Da(-OH 및 -NH2 기 사이의 질량 차이)에 추가되므로, 비교적 간단하다. 탈아미드화된 펩티드의 질량 면적을 탈아미드화 및 천연 펩티드의 면적의 합으로 나누어 특정 펩티드의 퍼센트 탈아미드화를 결정하였다. 가능한 탈아미드화 부위의 수를 고려하면, 상이한 부위에서 탈아미드화된 동중 종은 단일 피크에서 공-이동할 수 있다. 그 결과, 다수의 잠재적인 탈아미드화 부위를 갖는 펩티드로부터 유래한 단편 이온을 사용하여 다수의 탈아미드화 부위를 찾아내거나 또는 구별할 수 있다. 이러한 경우에, 관찰된 동위원소 패턴 내에서 상대 강도를 사용하여 상이한 탈아미드화된 펩티드 이성질체의 상대 풍부도를 구체적으로 결정할 수 있다. 이 방법은 모든 이성질체성 종에 대한 단편화 효율이 동일하고 탈아미드화 부위와는 관련이 없다는 것을 가정한다. 이 접근법은 탈아미드화에 관여하는 특이적 부위 및 탈아미드화에 관여하는 잠재적 조합의 정의를 허용한다.
2차 데이터 처리: 원시 질량 분석법의 2차 분석은 하기 방법을 사용하여 메릴랜드 볼티모어 카운티 대학에서 수행하였다. Peaks Studio v5.3 소프트웨어(Bioinformatics Solutions Inc.)를 모든 질량 분석법 분석에 사용하였다. 원시 데이터 파일의 데이터 정련을 하기 파라미터로 수행하였다: ≤10ppm의 전구체 m/z 허용오차, 및 최소 2, 최대 4의 전구체 전하 상태. 입력 스펙트럼의 드 노보 서열분석을 전구체 이온 오류 허용오차 10ppm 및 생성물 이온 오류 허용오차 0.1Da를 갖는 Peaks 알고리즘을 사용하여 수행하였다. 소화 효소는 트립신으로 설정하였고, 가변 변형은 산화, 인산화, 및 탈아미드화였고, 고정 변형은 시스테인의 카르바미도메틸화였다.
4. AAV 캡시드의 구조적 분석
RCSB 단백질 데이터 뱅크(PDB ID: 3RA8)로부터 AAV8 원자 좌표, 구조적 인자, 및 연관된 캡시드 모델을 수득하였다. 구조 정련을 수행하고 캡시드의 3차원(3D) 구조적 분석에 사용하기 위해 AAV8 VP3의 1차 아미노산 서열과 관계없이 전자 밀도를 생성하였다. AAV8 VP3의 예측된 1차 서열에 의해 편향되지 않은 AAV8 캡시드에서 이소아스파르트산 전자 밀도를 관찰하기 위해 이 분석을 수행하였다. 생성된 구조를 사용하여, 이소아스파르트산으로 N+1 글리신을 갖는 AAV8 VP3 1차 서열에서 4 개의 아스파라긴을 모델링한 다음 표준 정련 프로토콜을 사용하여 정20면체 비-결정학적 매트릭스를 엄격하게 부과함으로써 결정학 및 NMR 시스템(CNS) 소프트웨어를 사용하여 AAV8 캡시드 구조를 정련하였다(Brunger AT, et al. Acta Crystallogr D Biol Crystallogr 1998; 54(Pt 5):905-21). HIC-UP 데이터베이스로부터 이소아스파르트산의 구조적 모델을 수득한 후, 구조 정련을 위해 PRODRG에서 분자 사전을 생성하였다(Kleywegt GJ Acta Crystallogr D Biol Crystallogr 2007; 63(Pt 1):94-100). 그 다음에 AAV8 캡시드의 평균 전자 밀도 맵을 (또한 CNS에서) 계산하고 이를 COOT 소프트웨어를 사용하여 시각화한 다음, 생성된 모델을 약간 조정하여 모델링된 이소아스파르트산 잔기를 전자 밀도 맵에 피팅하였다(Emsley P and Cowtan K Acta Crystallogr D Biol Crystallogr 2004; 60(Pt 12 Pt 1):2126-32). 이 프로토콜을 반복하여 N+1 글리신을 갖는 AAV9 VP3 1차 서열에서 N512를 추가적으로 모델링하였다(PDB ID: 3UX1). COOT, PyMol, 및 UCSF Chimera를 사용하여 모든 도면을 생성하였다(Emsley P and Cowtan K Acta Crystallogr D Biol Crystallogr 2004; 60(Pt 12 Pt 1):2126-32; DeLano WL PyMOL: An Open-Source Molecular Graphics Tool Vol. 40, 2002:82-92; Pettersen EF, et al. J Comput Chem 2004; 25(13):1605-12). 탈아미드화된 이소아스파르트산 잔기에 대한 전자 밀도 맵을 AAV8 및 AAV9로부터 본 발명의 모델링된 이소아스파르트산 잔기와 비교하기 위해 이전에 식별된 탈아미드화된 단백질(PDB ID: 1DY5, 4E7G, 1RTU, 1W9V, 4E7D, 및 1C9D)의 다수의 구조를 수득하였다(Rao FV, et al. Chem Biol 2005; 12(1):65-76; Noguchi S, et al. Biochemistry 1995; 34(47):15583-91; Esposito L, et al. J Mol Biol 2000; 297(3):713-32).
AAV8 또는 AAV9 결정 구조 원자 좌표(PDB ID: 3RA8, 3UX1)에 보고된 각각의 아스파라긴 잔기의 각각의 원자에 대한 온도 인자를 평균냄으로서 탈아미드화된 잔기에 대한 온도 인자를 결정하였다.
5. 동물 연구
펜실베니아 대학의 기관 동물 관리 및 사용 위원회(Institutional Animal Care and Use Committee of the University of Pennsylvania)는 모든 동물 절차를 승인하였다. 벡터 성능을 평가하기 위해, 3e10 GC의 wtAAV8 또는 캡시드 돌연변이체 벡터를 100μL의 부피로 꼬리 정맥 주사를 통해 8주령 C57BL/6 마우스에 정맥내로 주사하였다. 모든 마우스를 14 일에 희생시켰다. 루시퍼라제 발현의 생체내 평가를 위해, 마우스(~20g)를 마취시키고 200μL 또는 15mg/mL 루시페린 기질(Perkin Elmer, 매사추세츠주 월섬 소재)을 복강내로 주사하였다. 마우스를 루시페린 투여 후 5 분에 이미지화하고 IVIS Xenogen In Vivo Imaging System을 통해 이미지화하였다. Living Image 3.0 소프트웨어를 사용하여 관심있는 기재된 영역에서 신호를 정량화하였다. 7 및 14 일에 측정하였다.
6. 돌연변이체 벡터 역가 및 시험관내 형질도입 효율의 평가
DNAseI-내성 게놈의 qPCR에 의해 벡터 역가를 결정하였다. qPCR 프라이머는 패키징된 전이유전자의 폴리아데닐화 서열에 어닐링된다. 루시퍼라제 발현에 의한 벡터 형질도입 효율의 시험관내 평가를 위해, 완전 DMEM(10% 태아 소 혈청, 1% 페니실린/스트렙토마이신)이 함유된 흑색-벽 96-웰 플레이트에 0.9e5 Huh7 세포/웰을 시딩하였다. 다음 날, 배지를 제거하고 완전 배지에 희석된 50μL 조질 또는 정제된 벡터로 대체하였다. 각각의 조질 벡터 샘플에 대해 3 배 희석 시리즈로 4 개의 희석을 시험하였다. 48 시간 후, 완전 배지에서 0.3μg/μL로 루시페린(Promega, 위스콘신주 매디슨 소재)을 제조하고 이를 50μL의 부피로 형질도입된 세포에 첨가하였다. 결과를 Biotek Clarity 광도계 상에서 판독하였다. 본 발명자들은 표적 세포에 첨가된 루시퍼라제 활성/GC가 광범위한 GC에 걸쳐 일정하지만, 높은 MOI에서 포화될 수 있다는 것을 발견한다. 따라서 선형성에 대한 희석 시리즈 데이터(발광 단위 vs GC)를 조사하고, 포화가 분명한 경우 최고점을 제외하여, 각각의 변이체에 대한 각각의 검정의 선형 범위에서 값에 대한 평균 루시퍼라제/GC를 계산한다. 이는 형질도입 효율 값을 산출한다. 데이터를 정규화하여 wt 대조군을 1의 값으로 설정함으로써 비교를 단순화한다.
7. 생물분포
QIAamp DNA Mini Kit(Qiagen, 독일 힐덴 소재)를 사용하여 간 샘플로부터 DNA를 추출한 다음, 전이유전자 카세트의 RBG 폴리아데닐화 신호에 대해 설계된 프라이머/프로브 설정으로 이전에 기재된 바와 같이 실시간 PCR에 의해 벡터 GC에 대한 DNA를 분석하였다(Chen SJ, et al. Hum Gene Ther Clin Dev 2013; 24(4):154-60).
AAV8 돌연변이체에 대한 프라이머 서열
Figure pct00008
Figure pct00009
Figure pct00010
Figure pct00011
Figure pct00012
B. 결과
AAV8은 캡시드 단백질에서 실질적인 전하 이질성을 제시한다
벡터 성능에 영향을 미칠 수 있는 AAV8 벡터 캡시드에 대한 번역후 변형의 존재를 정성적으로 평가하기 위해, 요오딕사놀 구배로 정제된 AAV8 총 캡시드 단백질을 1D 및 2D 겔 전기영동 둘 다에 의해 분석하였다. 1D 환원 나트륨 도데실 술페이트 SDS 겔에서, VP1, VP2, 및 VP3은 적절한 분자량에서 단일 밴드로서 분해된다(도 1b)(Rose JA, et al. J Virol 1971; 8(5):766-70). 전하에 기초하여 단백질을 분리하는 2D 겔 전기영동에 의해 추가로 평가할 때(도 1c), 각각의 캡시드 단백질은 VP 이소형에 따라 pH 6.3 내지 >7.0 범위의 상이한 등전점(pI)을 갖는 일련의 별개의 스폿으로 추가적으로 분해되었다(도 1d). 각각의 VP에 대한 개별 스폿은 카르보닉 안히드라제 이소형 내부 등전점 표준과 관련한 이동으로 측정 시 0.1 pI 단위의 별개의 간격으로 분리되었으며, 이는 단일 잔기 전하 변화를 시사한다. 이들 이소형의 존재는 각각의 VP가 많은 변형을 겪을 가능성이 있어서, 등전점 전기 영동 하에 상이하게 이동시킬 수 있음을 시사한다.
(전형적으로 아스파라긴) 측쇄 아미드 기의 분획이 카르복실산으로 전환되는 탈아미드화(도 1a)는 단백질 제제에서 전하 이질성의 공통 소스이다. 탈아미드화가 VP 전하 이소형의 별개의 집단에 책임이 있을 수 있는지를 결정하기 위해, 2 개의 AAV8 아스파라긴 잔기를 개별적으로 아스파르테이트로 돌연변이시켰다. 이들 캡시드 돌연변이는 단일 추가적인 아스파라긴 잔기의 완전 탈아미드화와 동등한 양만큼 전하를 이동시켜야 한다. 돌연변이체의 2D 겔 분석은 VP1, VP2, 및 VP3에 대한 주요 스폿이 야생형(wt) AAV8의 동등한 스폿보다 더 산성(0.1 pH 단위)으로 하나의 스폿 위치가 이동하였음을 나타낸다(도 1e - 도 1g). 이러한 이동 규모는 wt VP 전하 이소형 사이의 관찰된 공간에서 동등하다. 따라서, AAV 캡시드 단백질의 2D 겔 패턴화는 다중-부위 탈아미드화와 일치한다.
AAV8 벡터 캡시드 상에서 자발적 탈아미드화가 발생한다
각각의 캡시드 단백질에 대한 별개의 스폿팅 패턴을 담당하는 변형을 식별하기 위해, 질량 분석법에 의해 AAV8 벡터의 패널을 분석하였다. AAV8 캡시드 단백질의 적용범위를 총 VP1 서열의 >95%로 평균내었다(데이터는 제시되지 않음). 질량 분광법에 의해 아스파라긴 및 글루타민 잔기의 하위집합의 광범위한 탈아미드화를 검출하였으며, 이는 DNA에 의해 암호화된 서열에 기초하여 예측된 값과 비교하여 개별 펩티드의 관찰된 질량에서 ~1 Da의 증가를 제시하였으며; AAV8 벡터의 모든 제조에서 이러한 탈아미드화 패턴을 관찰하였다(도 2a - 도 2d).
통상적으로 사용되는 정제 방법 사이의 탈아미드화의 전반적인 이질성을 평가하고 VP1 및 VP2 고유 영역에서 탈아미드화를 조사하기 위해, 293 세포에서 삼중 형질감염에 의해 생성된 AAV8의 9 개 로트를 선택하고 세슘 클로라이드 구배, 요오딕사놀 구배, 또는 친화성 크로마토그래피로 정제하였다. 벡터는 또한 프로모터 및 전이유전자 카세트와 관련하여 다양하였다. 벡터 게놈의 존재가 탈아미드화에 영향을 미쳤는지를 결정하기 위해, 또한 시스 플라스미드의 부재 하에 293 세포에서 삼중 형질감염에 의해 생성된 AAV8 프렙을 평가하고(빈 캡시드만 생성) 요오딕사놀 구배로 정제하였다.
AAV8 캡시드의 아스파라긴 및 글루타민 잔기에 걸쳐 광범위한 탈아미드화가 존재하였으며, 검출불가능한 것부터 탈아미드화되는 개별 아미노산의 99% 이상까지의 범위였다(도 2e). 최고 수준의 탈아미드화(>75%)는 N+1 잔기가 글리신(즉, NG 쌍)인 아스파라긴 잔기에서 발생하였다(표 1). N+1이 글리신이 아닌 추가적인 아스파라긴 잔기에서 더 낮은 수준의 탈아미드화(즉, 최대 17%)를 검출하였다. 아스파라긴에 대한 평균 탈아미드화는 프렙 사이에 대체로 일치하였다. 또한 글루타민 잔기에서 탈아미드화를 검출하였지만 아스파라긴보다 빈도가 낮았으며; 관찰된 최고 퍼센트는 Q467에서 <2%였다(도 7). 이 관찰은 제제에 걸쳐 일치하지 않았다(데이터는 제시되지 않음). 잔기 N499(N+1 잔기는 아스파라긴임)에서 최대 제제 간 차이를 관찰하였으며, 값은 <1% 내지 50% 이상 탈아미드화 범위였다. 그럼에도 불구하고, 벡터 제제 사이의 탈아미드화에서 관찰된 변이는 정제 방법, 전이유전자 동일성, 또는 벡터 게놈의 존재와 관련된 것으로 보이지 않았으며, 이들 인자가 탈아미드화 속도에 영향을 미치지 않는다는 것을 시사한다.
표 1: 관심있는 AAV8 탈아미드화된 잔기의 특성. 별표는 추가의 분석을 위해 선택된 잔기를 나타낸다.
Figure pct00013
다음으로, 샘플 취급이 AAV8에서 관찰된 탈아미드화 수준에 기여했는지를 결정하기 위해 일련의 실험을 실행하였다. 극한 온도(7 일 동안 70℃) 또는 pH(7 일 동안 pH 2 또는 pH 10)는 AAV8 캡시드에서 추가적인 탈아미드화를 유의하게 유도하지 않았다(도 4a 및 도 4b). 이러한 내성을 고려하면, 관찰된 탈아미드화가 정제 단계에서만 발생할 가능성은 낮았고, 이는 비교적 짧고 상대적으로 온화하였다는 것으로 추론된다. 정제 전 및 후의 탈아미드화 정도를 결정하기 위해 정제되지 않은 벡터에 대한 질량 분석법 분석을 수행하려 시도하였지만, 실패하였다. 마찬가지로, 중수(heavy water) 제어는 본 발명의 질량 분석법 워크플로우에 특이적인 처리가 추가적인 탈아미드화 사건에 기여하지 않는다는 것을 나타낸다(도 4c).
본 발명의 질량 분석법 워크플로우를 검증하기 위해, 탈아미드화에 대해 이전에 평가된 2 개의 재조합 단백질을 조사하였으며; 본 발명의 결과(도 5a 및 도 5b)는 공개된 결과와 일치한다[Henderson, LE, Henriksson, D, and Nyman, PO (1976). Primary structure of human carbonic anhydrase C. The Journal of biological chemistry 251: 5457-5463 및 Carvalho, RN, Solstad, T, Bjorgo, E, Barroso, JF, and Flatmark, T (2003). Deamidations in recombinant human phenylalanine hydroxyla. Identification of labile asparagine residues and functional characterization of Asn --> Asp mutant forms. The Journal of biological chemistry 278: 15142-1515]. 추가적으로, AAV8의 원시 데이터를 평가하기 위해 이차적인 기관과 협력하였다. 이 독립적 분석은 탈아미드된 동일한 부위를 식별하였으며, 피크 검출 및 면적 계산에서 소프트웨어 간 변이에 기인할 수 있는 각각의 부위에서 변형 정도는 최소 변이였다(도 6).
구조적 토폴로지, 온도 인자, 및 N+1 아미노산의 동일성은 탈아미드화 빈도에 기여한다
AAV8의 구조가 풀리고 공개됨에 따라(PDB 식별자: 2QA0)(Nam HJ, et al. J Virol 2011; 85(22):11791-99), 다음으로 비-효소적 탈아미드화에 대한 유리한 조건의 증거를 찾고 확립된 구조적 특징을 갖는 퍼센트 탈아미드화의 상관관계를 보여주기 위해 AAV8 캡시드 구조를 조사하였다(Nam HJ, et al. J Virol 2007; 81(22):12260-71). 아스파라긴 탈아미드화에 영향을 미치는 인자는 문헌에서 더 잘 특성화되어 있고 아스파라긴 탈아미드화 사건은 글루타민 탈아미드화 사건보다 훨씬 더 일반적이므로, 오직 아스파라긴 잔기에만 집중하였다(Robinson, NE, and Robinson, AB (2001). Molecular clocks. Proc Natl Acad Sci USA 98: 944-949). 또한 AAV8 결정 구조로부터 이들 잔기 각각에 대한 온도(또는 B) 인자를 결정하였으며; 온도 인자는 평균 위치에서 원자 변위의 측정치이며, 값이 높을수록 더 큰 변위, 더 높은 열 진동, 및 이에 따라 증가된 유연성을 나타낸다(Parthasarathy S and Murphy MR. Protein Science: A Publication of the Protein Society 1997; 6:2561-7). 관심있는 대부분의 아스파라긴은 표면-노출된 HVR의 내부 또는 근처에 위치하였으며(표 1), 이는 탈아미드화에 구조적으로 유리하고 용매-노출된 환경을 제공한다(Govindasamy L, et al. J Virol 2013; 87(20):11187-99). 이러한 유연한 루프 영역에 위치한 잔기가 베타 가닥 및 알파 헬릭스와 같은 덜 유연한 영역의 잔기보다 평균적으로 더 빈번하게 탈아미드화되었다는 것이 발견되었다. 예를 들어, 위치 N263에서의 NG 잔기는 HVR I의 일부이고, 높은 온도 인자를 갖고, 평균적으로 >98% 탈아미드화되었다(도 7a 및 도 6, 표 1). 시간의 ~85%가 탈아미드화된 N514(도 3 및 도 6, 표 1)는 또한 N+1 글리신을 갖는 HVR(HVR V)에 있지만; 3-배 축에서 다른 VP 단량체 상의 잔기와의 상호작용으로 인해 국소 온도 인자는 N263과 비교하여 상대적으로 낮다. 덜-유리한 +1 잔기 및 더 낮은 국소 온도 인자는 심지어 HVR 잔기에 대해서도 더 낮은 탈아미드화와 상관관계가 있었다. 예를 들어, N517은 평균적으로 4%만 탈아미드화되었으며(표 1); 이 잔기는 고도로 탈아미드화된 N514와 동등한 온도 인자를 갖지만, 이의 N+1 잔기는 세린이며, 입체 장애로 인해 탈아미드화 가능성이 감소한다. 이는 +1 잔기의 동일성이 분명히 가장 영향력 있는 인자이긴 하지만, 다수의 인자가 주어진 캡시드 위치에서 탈아미드화 정도를 누적적으로 결정한다는 것을 입증한다.
아스파라긴 탈아미드화에서 +1 잔기의 역할을 시험하기 위해, AAV8 NG 부위가 +1 위치에서 알라닌 또는 세린으로 개별적으로 돌연변이된 돌연변이체 벡터를 생성하였다. 모델 펩티드 연구는 NG 펩티드가 1 일 정도로 짧은 반감기로 탈아미드화되지만, NA 또는 NS 펩티드가 전형적으로 각각 25- 또는 16-배 더 느리게 탈아미드화된다는 것을 나타낸다(Robinson NE and Robinson AB. Proc Natl Acad Sci USA. 2001; 98(8):4367-72). 벡터 돌연변이체의 질량 분석법 분석은 벡터 탈아미드화 정도를 결정하는 데 있어서 +1 부위의 중심 역할을 확인하였다. 이 설정에서 NG 부위(wt에서 >80% 탈아미드화)는 +1 부위가 알라닌(<5% 탈아미드화) 또는 세린(<14% 탈아미드화)으로 변경되었을 때 인접한 아스파라긴의 선택적 안정화를 제시하였다(표 2).
표 2: wt 및 6 개의 +1 부위 돌연변이체 내 5 개의 AAV8 NG 부위에서 탈아미드화 정도(%)
Figure pct00014
적어도 부분적으로 묻혀있고 용매에 쉽게 노출되지 않고/않았거나 온전하고 완전히 어셈블리된 AAV8 캡시드에서 낮은 국소 유연성 영역에 위치한 잔기는 더 유리한 환경에 위치한 것들에 비해 탈아미드화 빈도가 더 낮았다(표 1). 그럼에도 불구하고, 불리한 조건의 잔기 중 일부가 탈아미드화되었다. 예를 들어, N630은 적어도 부분적으로 묻혀있지만 여전히 검출가능한 정도의 탈아미드화가 있었다. 이 잔기의 경우, N+1 잔기로서 페닐알라닌의 존재는 이 영역이 AAV8 VP3 단백질 내에서 비-효소적 자가단백질분해 절단의 신규 부위일 수 있다는 것을 시사한다.
AAV8 VP3의 구조적 모델링은 탈아미드화 사건을 확인한다
어셈블리된 캡시드의 맥락에서 탈아미드화의 직접 증거를 제공하기 위해, AAV8의 결정 구조를 평가하였다(Nam H-J, et al. J Virol 2011; 85(22):11791-9). 이러한 혈청형의 이용가능한 결정 구조의 해상도(즉, 2.7Å)는 R 기에서 말단 원자를 식별하기에 충분히 높지 않아서, 아스파라긴, 아스파르트산 및 이소아스파르트산 잔기 사이를 직접 구별하기에 불충분하다. 이러한 조건 하에 형성되는 아스파르트산의 이성질체 구조의 다른 측면은 2.7Å 구조로부터 탈아미드화를 결정하는 기회를 제공하였다. 이 분석은 두가지 가정에 기반하였다: 1) 아스파라긴의 자발적 탈아미드화의 우세한 생성물은 3:1 비로 생성되는 아스파르트산이 아니라 이소아스파르트산이고(Geiger T and Clarke S. J Biol Chem 1987; 262(2):785-94), 2) 아스파라긴 또는 아스파르트산은 이소아스파르트산의 R 기에 상응하는 전자 밀도 맵의 길이가 더 짧기 때문에 이소아스파르트산과 구별될 수 있다. 이 더 짧은 R 기는 이소아스파르트산의 R 기로부터의 베타 탄소가 탈아미드화 반응 동안 숙신이미딜 중간체의 분해 후 AAV8 VP3 캡시드 단백질 백본의 주쇄 내에 혼입될 때 상실되는 경우 생성된다.
먼저 AAV8 구조 자체를 정련하여, 알려진 AAV8 VP3 서열에 편향되지 않은 AAV8 캡시드 전자 밀도를 생성하였다. 그 다음에 이소아스파르트산과 회합된 더 짧은 R 기의 존재에 기초하여 탈아미드화의 증거를 위해 정련된 AAV8 결정 구조를 조사하였다(도 3a - 도 3e). 전자 밀도 맵은 질량 분석법에 의해 탈아미드화가 검출되지 않은 401(도 3b)에서의 아스파라긴과 비교 시 위치 263(도 3c), 385(제시되지 않음), 514(도 3d), 및 540(도 3e)에서의 고도로 탈아미드화된 N+1 글리신 잔기에 대해 더 짧은 R 기를 확인하였다. 따라서 전자 밀도 맵에 의해 나타낸 탈아미드화는 >75% 탈아미드화를 갖는 이들 부위에서 질량 분석법에 의해 생성된 데이터와 일치한다. 생성된 이소아스파르트산 모델은 다른 알려진 탈아미드화된 단백질의 결정 구조에서 관찰된 이소아스파르트산 잔기와 필적할만하였으며, 이는 본 발명의 AAV8 분석에 대한 타당성을 뒷받침한다(Rao FV, et al. Chem Biol. 2005; 12(1):65-76; Noguchi S, et al. Biochemistry 1995; 34(47):15583-91; Esposito L, et al. J Mol Biol 2000; 297(3):713-32). 이 구조적 분석은 질량 분석법을 통한 AAV8 캡시드의 분석 시 관찰된 탈아미드화 현상의 독립적인 확인으로 역할을 한다.
AAV 캡시드의 탈아미드화는 혈청형 특이적이지 않다
캡시드 탈아미드화의 증거를 위해 AAV8을 능가하는 혈청형을 조사하였다. 잠재적인 벡터-처리 효과에 대한 제어(도 11d - 도 11f)를 포함하여, 2D 겔 전기영동(도 11a) 및 질량 분석법(도 11b)을 사용하여 AAV9 벡터 제제를 조사하였다. AAV9 탈아미드화의 패턴 및 정도는 AAV8과 유사하였다. 모든 4 개의 AAV9 NG 부위는 >85% 탈아미드화되었고; 13 개의 비-NG 부위는 더 적은 정도로 탈아미드화되었으며, 일부 부위는 % 탈아미드화에서 높은 로트 간 변동성을 제시하였다. 다음으로, 구조적 분석 워크플로우를 적용하고 기존 AAV9 결정학적 데이터를 다시 피팅하였다(도 11c, 표 3). AAV8과 마찬가지로, 이소아스파르트산은 AAV9 결정 구조에서 여러 NG 부위의 전자 밀도에 더 잘 피팅된다. 2D 겔 분석(데이터는 제시되지 않음) 및 질량 분석법(표 4에 요약됨)을 5 개의 추가적인 진화적으로 다양한 혈청형(rh32.33, AAV7, AAV5, AAV4, AAV3B 및 AAV1)으로 확대하였다. 조사된 모든 캡시드는 유사한 탈아미드화 패턴 및 정도를 함유하며, 이는 이 변형이 임상적으로 관련된 AAV 벡터에 널리 퍼져 있고, 유사한 기본적인 1차-서열 및 구조적 인자에 의해 결정된다는 것을 나타낸다.
표 3. 관심있는 AAV9 탈아미드화된 잔기의 특성.
(AAV8과 비교하여) 상동 N+1 잔기를 갖는 보존된 아스파라긴 잔기는 이탤릭체로 나타낸다(AAV8 및 AAV9 VP1의 전장 아미노산 서열의 정렬에 의해 결정됨).
Figure pct00015
표 4. 다양한 혈청형에 대해 관찰된 탈아미드화 정도
Figure pct00016
탈아미드화 사건은 캡시드 어셈블리 및 형질도입 효율에 영향을 미칠 수 있다
탈아미드화의 기능적 영향을 시험하는 하나의 접근법은 유전적 돌연변이에 의해 아스파라긴을 아스파르테이트로 치환하는 것이다. 293 세포의 소규모 삼중 형질감염에 의해 각각의 탈아미드화된 AAV8 아스파라긴에 대한 루시퍼라제 리포터를 암호화하는 아스파르테이트 돌연변이체 벡터를 생성하고, DNAseI 내성 게놈 카피의 qPCR에 의해 적정하였다(도 8a). 돌연변이는 wtAAV8에 비해 캡시드 어셈블리에 거의 영향을 미치지 않았고, 효과는 wt 벡터에서 전체 탈아미드화가 낮은 대부분 묻혀있는 비-NG 부위로 제한되었다. 다음으로, 인간 간-유래 Huh7 세포의 시험관내 형질도입 효율에 대한 돌연변이 패널을 평가하였다(도 8b). 여러 돌연변이체는 손상된 형질도입 효율을 제시하였으며, 위치 N57, N94, N263, N305, Q467, N479, 및 N653은 >10-배 형질도입 상실을 나타내었다. AAV9에 대해 유사한 수의 민감한 부위를 관찰하였다(도 11g 및 도 11h). 전형적으로 주어진 위치에서 잔기의 일부만이 내인성으로 탈아미드화되므로, 이 접근법은 기능적 단위가 동종체 어셈블리인 캡시드와 같은 단백질에 대한 기능 상실을 과대평가할 가능성이 있으며; 하나의 캡시드 부위에서 내인성 변형은 온전한 잔기를 갖는 인접한 하위단위에 의해 보상될 수 있다. 그럼에도 불구하고, 상기 방법은 제조 또는 돌연변이 안정화 동안 향후 모니터링을 위해 탈아미드화된 잔기를 우선적으로 처리하는 데 도움을 줄 수 있다는 것을 추론하였다. 벡터를 내인성으로 탈아미드화하는 집단으로부터의 기능적 데이터는 이 기능상실 돌연변이유발 데이터를 적절한 맥락에 배치하는 데 필요할 것이다.
시간에 따른 벡터 활성 상실은 점진적인 탈아미드화와 상관관계가 있다
NG 탈아미드화의 명백하게 짧은 반감기를 고려하면, 거의 1 일 정도 차이가 나는 벡터 샘플은 별개의 탈아미드화 프로파일을 제시할 수 있으며, 따라서 내인성 탈아미드화를 기능과 연관시킬 수 있는 기회를 제공한다는 것을 추론하였다. 본 발명의 대규모 벡터 제조 프로토콜은 293 세포의 삼중 형질감염 후 벡터 생산을 위해 인큐베이션 5 일 및 벡터 정제를 위해 1-2 일을 요구한다. 이 과정에 가까워지기 위해, wt AAV8을 사용하여 293 세포의 중간 규모 삼중 형질감염(각각 10 x 15 cm 세포 배양 접시)을 제조하였다. 5 일 동안 1 일 간격으로 벡터(2 x 15 cm 세포 배양 접시/일)를 수집하여, 벡터를 -80C에서 동결시켜 5 일 기간이 끝날 때까지 시점을 보존하였다. 다음으로, 상기 기재된 바와 같이 조질 벡터 역가 및 시험관내 형질도입 효율을 평가하였다. 예상한 바와 같이, 어셈블리된 DNAseI-내성 게놈 카피의 수는 시간이 지남에 따라 증가하였다(도 9a). 그 다음에 친화성 정제에 의해 초기(1 및 2 일) 및 후기(5 일) 시점 동안 조질 벡터를 빠르게 처리하고 huh7 세포의 시험관내 형질도입 효율을 측정하였다. 벡터의 상대 형질도입 효율은 시간이 지남에 따라 점진적으로 떨어졌다(도 9b). 표적 세포에 첨가된 GC 당 전이유전자 발현 측면에서, 5 일 벡터는 1 일 물질만큼 40% 효율에 불과하였다. 이 활성 하락은 조질 물질에 대해서도 관찰되었으며, 이는 정제 전에 분자 조성물의 변화를 나타낸다(도). 5 일에 걸쳐 AAV9에 대한 활성 상실의 유사한 경향을 관찰하였으며, 벡터 효능은 대략 40% 감소하였다(도 11i - 도 11k).
다음으로 질량 분석법에 의해 시간 경과 샘플의 탈아미드화를 측정하였다. NG 부위 탈아미드화는 모든 간격에 걸쳐 실질적으로 진행되었으며, 1 일에 평균 25% 탈아미드화되고 5 일까지 부위의 >60%가 전환되었다(도 9c). 비-NG 부위 탈아미드화는 일반적으로 5 일에 걸쳐 진행되었지만, 2 내지 5 일 사이에 수준은 훨씬 낮았고 일관성은 낮았다(도 9d). 데이터는 내인성 벡터 탈아미드화를 특이적 활성의 초기 시점 붕괴와 상관관계가 있고, 생산 사이클을 단축시키거나 또는 아스파라긴을 안정화시키는 캡시드 돌연변이를 찾음으로써 더 활성인 벡터를 포획하는 잠재적인 기회를 강조한다.
도 2a - 도 2e의 질량 분석법 분석에 사용되는 물질은 정제에 추가 2 일이 더 걸렸기 때문에 형질감염후 적어도 7 일이었다는 것을 유의한다. 이들 샘플에서 더 높은 NG 부위 탈아미드화(>80%)는 탈아미드화가 발현 기간 후 및 회수 및 정제 과정 동안 NG 부위가 완전히 탈아미드화되거나 또는 벡터 샘플이 동결될 때까지 대략적으로 동일한 속도로 계속될 가능성이 있다는 것을 나타낸다. 따라서 탈아미드화는 주로 벡터의 수명에 의해 결정되고 회수 및 정제 과정에 배타적이거나 또는 이에 의해 야기되는 과정이 아니다. 1 일 물질 vs 5 일 물질(둘 다 친화성 정제됨)의 훨씬 더 낮은 탈아미드화 값이 이 점을 강조한다.
NG 아스파라긴의 안정화는 벡터 성능을 개선시킬 수 있다
벡터 NG 탈아미드화 및 형질도입 효율 상실 사이의 상관관계를 고려하면, NG 아미드를 +1 부위 돌연변이유발에 의해 안정화시키는 것은 벡터 기능을 개선시킬 수 있다는 것을 추론하였다. 각각의 +1 잔기가 개별적으로 알라닌 또는 세린으로 전환된 AAV8 NG 부위 돌연변이체에 대해 소규모로 벡터를 생성하였다. 단일 +1 돌연변이체는 벡터 어셈블리(도 10a) 및 형질도입 효율(도 10b) 측면에서 널리 용인되었다. 캡시드 표면 상에서 이전에 정의된 "사각 지대(dead zone)" 근처에 위치한 G386 치환(Aydemir F, et al. J Virol July 2016; 90(16):7196-204)은 시험관내 형질도입에 결함이 있었다. G386 돌연변이체의 기능 상실은 N385에서 탈아미드화된 아스파라긴에 대한 선호를 나타낼 수 있다. 대안적으로, +1 위치에서 추가적인 측쇄 벌크는 아미드-기 안정화와 관계없는 기능에 부정적인 영향을 미칠 수 있다. 인접한 아스파라긴의 극적인 안정화에도 불구하고, 단일-부위 돌연변이체는 시험관내 형질도입을 유의하게 개선시키지 못하였다(표 2). 시험관내 및 생체내 형질도입 활성이 일치하지 않을 수 있기 때문에, C57BL/6 마우스에서 간 형질도입에 대한 단일-부위 +1 돌연변이체의 하위집합을 시험하였다. 정맥내 꼬리 정맥 주사(n=3 내지 5)를 수행하고 2 주 동안 매주 이미지화함으로써 루시퍼라제 활성을 조사하였다(도 10c). 생체내 및 시험관내 형질도입 데이터는 각각의 검정과 연관된 오차 내에서(즉, 오차 범위 내에서) 일치하였다. G386 치환은 형질도입에 결함이 있었던 반면, 다른 위치에서 +1 부위 돌연변이는 대체로 허용되어, wtAAV8을 초과하지 않는 동등한 수준으로 간을 형질도입하였다.
임의의 하나의 NG 부위에서 아미드를 안정화시키는 것이 필요하지만 기능적 복원에 충분하지 않을 수 있기 때문에, 다음으로 +1 부위 알라닌 치환의 조합으로 벡터 변이체를 평가하였다. +1 알라닌이 고도로 기능적인 3 개의 AAV8 NG 부위(N263, N514, 및 N540)를 모두 재조합하였다. 삼중 돌연변이체 G264A/G515A/G541A를 포함하는 일부 조합은 불량하게 어셈블리되었고 형질도입에 대해 기능장애를 나타내었다. 그러나, N263을 수반하는 쌍별 조합(G246A/G515A 및 G264A/G541A) 둘 다는 역가 상실 없이 시험관내 형질도입 효율을 개선시켰다(wtAAV8에 비해 각각 2.0- 및 2.6-배)(도 10d). 이들 돌연변이는 적어도 두 가지 변화(N-아미드 안정 및 +1 잔기 측쇄 치환)를 도입하기 때문에, 이들 데이터는 NG 탈아미드화를 결정적으로 기능 상실과 연결하지 않는다. 그러나, 데이터는 NG 부위 탈아미드화가 시험관내 형질도입 효율에 영향을 미칠 수 있는 시간경과 연구에서 확립된 모델과 일치한다.
기능적 아스파라긴 치환은 벡터 제조에서 로트 간 재현성을 개선시킨다
본 발명에 보고된 벡터 탈아미드화 프로파일의 또 다른 잠재적으로 문제가 있는 측면은 일부 위치에서 탈아미드화의 높은 로트 간 변동성이다. wtAAV8의 경우, 이 변동성은 N459(0% 내지 31% 범위의 탈아미드화 관찰됨) 및 N499(0% 내지 53% 범위의 탈아미드화 관찰됨)에서 가장 두드러진다. 번역후 변형의 변동성은 전형적으로 이 변동성을 나타내는 클론을 완전히 피하고, 주의깊게 모니터링하고 생산 균주 및 조건을 제어함으로써, 또는 영향을 받은 후보의 단백질 공학에 의해 생물제제 개발 동안 사실상 피한다.
N459 및 N499 탈아미드화 변동성에 기여하는 생산 또는 처리 인자를 결정할 수 없었으므로(도 2e), 이들 위치에서 기능적 아미노산 치환을 찾았다. 먼저 각각의 위치에서 개별적으로 글루타민으로의 보존적 치환을 위한 소규모 벡터 제제를 평가하였다. N459Q 및 N499Q 둘 다를 벡터 내에 효율적으로 어셈블리하였고, 시험관내 형질도입 효율에 대해 wtAAV8 참조와 동등하였다(도 7a). 다음으로, 돌연변이체를 대규모로 생산하고 질량 분석법을 수행하였다. 극히 드문 글루타민 탈아미드화에 대한 관찰과 일치하게, 이들 돌연변이체의 위치 459 또는 499에서 글루타민 아미드의 선택적이고 완전한 안정화를 관찰하였다(데이터는 제시되지 않음). C57BL/6 마우스에 꼬리 정맥 주사 후 간 형질 도입에 대해 상기와 같이 생체내에서 이들 돌연변이체 로트를 평가하였다(도 7b 및 도 7c). 본 실험에서 대조군으로 사용된 wtAAV8 벡터 로트는 N499에서 16.8% 탈아미드화되었지만, N459에서 탈아미드화는 검출되지 않았다(데이터는 제시되지 않음). 두 돌연변이체에 대한 14 일에서의 간 형질도입은 wtAAV8과 동등하였다. 이 데이터는 제조된 AAV 벡터에서 탈아미드화와 연관된 분자 변동성을 설명하는 단백질 공학 접근법에 대한 잠재력을 입증한다.
C. 논의
2D 겔 전기영동, 질량 분석법, 드 노보 단백질 모델링, 및 시험관내 및 생체내 둘 다에서의 기능적 연구에 의해 독립적으로 AAV8 캡시드에 대한 아스파라긴 및 글루타민 잔기의 비-효소적 탈아미드화를 식별하고 평가하였다. 탈아미드화는 광범위하게 다양한 단백질에서 발생하고 항체-기반 치료제(Nebija D et al. Int J Mol Sci 2014; 15(4):6399-411) 및 펩티드-기반 백신(Verma A et al. Clin Vaccine Immunol. 2016; 23(5):396-402)을 포함한 생물제제의 활성에 유의하게 영향을 미치는 것으로 제시되었다. 로타바이러스의 VP6 단백질과 같은 다른 바이러스 단백질은 질량 분석법에 의해 탈아미드화 사건을 겪는 것으로 제시되었다(Emslie KR et al. Funct Integr Genomics 2000; 1(1):12-24).
이러한 탈아미드화가 AAV8에서 발생하는 맥락은 자발적 비-효소적 사건의 결과임을 시사하였다. 아스파라긴 잔기는 글루타민 잔기보다 더 광범위하게 탈아미드화되는 것으로 알려져 있으며; 아스파라긴의 아미노산 하류는 가장 효율적으로 탈아미드화되는 글리신의 N+1(즉, NG)이 탈아미드화 속도에 실질적으로 영향을 미친다. VP1에 존재하는 모든 NG가 >75% 수준으로 탈아미드화되었지만 캡시드 내 임의의 다른 아스파라긴 또는 글루타민에서 탈아미드화가 일관되게 >20%가 아니었다는 점에서 AAV 캡시드의 탈아미드화에서 N+1 아미노산의 역할에 대한 주목할만한 확인을 관찰하였다. AAV8 및 AAV9 캡시드에서 사실상 모든 NG 모티프(즉, 7/9)는 또한 높은 비율의 입체형태 유연성 및 열 진동과 연관된 HVR 영역에 함유된 캡시드 표면 상에 존재하였다. 이는 유연성이 알파 헬릭스 또는 베타 시트와 같은 보다 정렬된 구조가 아닌 적절한 단백질 기능에 필요할 수 있는 영역에 위치한 다른 단백질의 NG 모티프의 이전 보고와 일치한다(Yan BX and Sun YQ J Biol Chem 1997; 272(6):3190-4). 표면 노출된 HVR에서 NG 모티프의 선호는 용매 접근성 및 입체형태 유연성을 제공함으로써 탈아미드화 속도를 추가로 향상시켜, 숙신이미딜 중간체의 형성을 용이하게 한다. 예측된 바와 같이, 환경이 좋지 않을수록 탈아미드화의 속도가 훨씬 낮아진다.
AAV의 생물학 및 벡터로서 이의 사용에 관한 중요한 질문은 이러한 탈아미드화의 기능적 결과이다. 아스파라긴을 아스파르트산으로 전환시키기 위한 캡시드 DNA의 돌연변이유발은 특정 부위에서의 모든 아미노산이 아스파르트산으로 표시되는 캡시드의 평가를 허용한다. 그러나, 잠재적으로 N+1 잔기를 돌연변이시키는 것 이외에 탈아미드화를 방지하기 위해 돌연변이유발을 사용하는 쉬운 전략은 존재하지 않으며, 두번째 부위 돌연변이의 직접 결과에 의해 혼동된다. 본 발명자들은 아스파라긴 잔기가 돌연변이유발에 의해 아스파르트산으로 전환되는 제한된 수의 변이체를 연구하였다. 기능적 분석은 캡시드 어셈블리 및 시험관내 및 생체내 형질도입을 포함하였다. 벡터 기능에 대한 돌연변이유발의 가장 실질적인 효과는 기준선에서 불완전하게 탈아미드화되고 표면 노출되지 않은 아스파라긴을 수반하는 것들이었다. 그러나 놀랍게도 514에서 고도로 탈아미드화된 아스파라긴을 아스파르트산으로 돌연변이유발하는 것은 기능에 일부 영향을 미쳤다. 이 결과는 잔류량의 상응하는 아미드의 존재가 기능에 영향을 미칠 수 있다는 것을 시사한다. 이는 탈아미드화 후 이 잔기가 아스파르트산으로 전환될 때 상실되는 또 다른 3-배 관련 VP3 단량체(wtAAV8 결정 구조에서 식별됨)의 N514 및 D531 사이의 수소 결합 상호작용의 존재에 부분적으로 기인할 수 있다.
AAV 벡터에서 탈아미드화 정도에 영향을 미치는 인자에 대한 더 나은 이해는 이러한 탈아미드화가 신규 치료제 개발에 미치는 영향을 평가할 때 중요하다. 탈아미드화 역학을 현저하게 가속화하는 것으로 알려진 극한 조건 하에 벡터를 인큐베이션하는 것은 거의 효과가 없었다. 동위원소 결합 연구와 함께, 이 결과는 탈아미드화가 캡시드 어셈블리 동안 발생하고 벡터 처리 또는 질량 분석법 분석의 작위적인 결과가 아님을 시사한다. NG 부위에서의 탈아미드화는 평가된 모든 샘플에서 반응이 사실상 완료되었으므로 벡터 성능에 실질적인 영향을 미칠 가능성은 없다. 그러나, 초기 기능적 연구는 잔류량의 비-탈아미드화된 아스파라긴이 기능에 기여할 수 있다는 것을 시사한다. 탈아미드화는 덜 완전하였으며, 대부분의 경우에 또한 샘플 간 변이와 연관되었던 부위에 대해 더 우려된다. 예는 평균 17%로 0% 내지 53% 범위의 탈아미드화를 제시하는 위치 499에서의 아스파라긴이다. 벡터 생산 조건의 미묘한 차이는 이러한 이질성에 기여할 수 있는 가능성이 있다. AAV8 및 AAV9에서 탈아미드화의 현저한 유사성은 이 바이러스의 전체 패밀리의 특성임을 시사한다.
요약하면, AAV8 및 AAV9 캡시드 단백질의 1차 아미노 구조에서 실질적인 이질성을 발견하였다. 이들 연구는 여러 방식으로 벡터로서 AAV의 개발에 잠재적으로 영향을 미친다. 첫째, VP 단백질의 실제 아미노산 서열은 상응하는 DNA 서열에 의해 예측된 것이 아니다. 둘째, 생산 방법의 측면은 탈아미드화의 변이 및 벡터 기능의 상응하는 변화를 초래할 수 있다. 비-NG 부위에서 탈아미드화 속도에 영향을 미치는 인자를 취급하고 이의 기능적 결과를 더 잘 이해할 때까지 임상-등급 AAV 벡터의 특성에 탈아미드화를 포함시킬 필요가 있을 수 있다. 2D 겔 전기영동은 순 탈아미드화의 전반적인 평가를 제공할 수 있지만, 질량 분석법은 특이적 잔기에서 탈아미드화를 평가하는 데 필요할 것이다.
실시예 2: 탈아미드화 AAV5.5.9
AAV5.5.9의 신규 서열은 각각 서열번호: 9 및 10에서 제공된다. AAV5.5.9 벡터를 AAV9에 대해 실시예 1에 기재된 바와 같이 탈아미드화에 대해 평가하였다. 고도로 탈아미드화된 잔기는 N57, N319, N442, N502에서 볼 수 있다.
Figure pct00017
Figure pct00018
실시예 3: 탈아미드화 AAVrh79(클레이드 E)
레서스 원숭이의 소장 조직에서 추출된 DNA로부터 AAVrh79를 단리하였다. 이는 계통 발생적으로 클레이드 E 내에 있는 것으로 특징되었다(도 14a-14d). 이의 서열은 본원에 제공되며, 뉴클레오티드 서열은 서열번호: 1에 있고 아미노산 서열은 서열번호: 2에 있다. AAVrh79, AAVrh.10 및 AAVhu.37의 아미노산 서열의 정렬은 도 14a에서 제공된다. AAVrh79, AAVrh.10 및 AAVhu.37의 핵산 서열의 정렬은 도 14b-14d에 제공된다.
AAVrh79는 1차 서열에서 3 개의 아미노산 차이를 갖는다. AAVhu37은 1차 VP1 서열의 위치 67에 위치한 Ala 및 위치 169에서 Lys을 갖는 반면, AAVrh79는 위치 67에서 글루탐산(E) 및 위치 169에서 Arg을 갖는다. rh.79, hu.37, 및 hu.40 중에서 VP1의 DNA 서열의 차이는 도 11b에 제시되어 있다. 다양한 클레이드 E 변이체에 기초하여 eGFP를 발현하는 벡터를 제조하고 Huh7 세포의 상대 감염성에 대해 평가하였다(도 11c). C57BL/6 마우스에 두 가지 투여량 수준(3x1010 및 3x1011 GC/마우스)의 eGFP-발현 AAV8 또는 AAVrh.79 벡터를 주사하고 형광 현미경으로 감염성을 평가하였다(데이터는 제시되지 않음).
AAV8 벡터에 대해 이전에 기재된 것과 같이, cap의 생산을 위한 AAVrh79 뉴클레오티드 서열을 사용한 알려진 생산 기술을 사용하여 AAVrh79에 기초한 벡터를 제조하였다. 생산 수율 및 생산 순도 평가 결과는 각각 도 15a-15b 및 도 16에 제공된다.
마커 유전자(파이어플라이 루시퍼라제)를 함유하는 AAVrh79를 사용하여 발현 수준을 평가하기 위해, 6-8 주령의 수컷 RAG KO 마우스에 Hamilton 주사기를 사용하여 수행된 벡터의 3x1011 GC/마우스를 근육내로 주사하였다. ffLuc 발현을 이전에 기재된 바와 같이 전신 생물발광 이미지로 시각화하였다[Greig JA, Peng H, Ohlstein J, Medina-Jaszek CA, Ahonkhai O, Mentzinger A, et al.(2014) Intramuscular Injection of AAV8 in Mice and Macaques Is Associated with Substantial Hepatic Targeting and Transgene Expression. PLoS ONE 9(11): e112268. doi.org/-10.1371/journal.pone.-0112268.] 결과는 도 17a-17d에 제공된다.
AVV8삼중, AAVhu68, AAV9, AAV8, 및 AAVrh79 벡터의 발현은 1013 GC/kg AAVrh79를 수컷 및 암컷 시노몰구스 원숭이에 근육내 투여한 후 비교하였다(도 17e).
분비된 전이유전자를 발현하는 벡터(201Ig IA)를 수컷 RAG KO 마우스(n = 5/그룹)(3x1010 또는 3x1011 GC/마우스)의 비복근에 근육내로 투여하였다. 결과는 AAV8삼중이 IM 주사 후 더 잘 발현되고 시험된 더 낮은 용량에서 AAV8삼중으로부터의 발현 차이가 상당하였다는 것을 나타내었다. 더 높은 용량에서, AVVrh79는 시험된 다른 벡터와 필적할만한 수준으로 발현되었다(도 17f).
암컷 시노몰구스 원숭이(RA2362)를 NAb에 대해 사전 스크리닝하고(도 18a) AAVG2.TBG.eGFP.WPRE.bGH(1x1013 ddGC/kg, 정맥내)를 주사하였다. 동물을 처리 후 7 일에 안락사시켰고, 부검을 수행하여 분석을 위한 간 및 다른 조직을 단리하였다. 간 및 비장에서의 GFP 발현을 7 일에 평가하였다(도 18b 및 18c). 다양한 조직에서 검출된 벡터 수준은 도 18d에 제시된다. GFP 발현 수준을 AAVG2(RA2362) 또는 AAV8 및 AAVG3 벡터를 받은 동물 간에서 평가하였다(도 18e - 도 ij). 도 18k는 이들 동물로부터의 다양한 조직에서 검출된 벡터 수준을 제시한다.
다양한 AAV8 및 AAVrh79 벡터를 생성하였고, 일부 경우에 다수의 로트를 생성하였다. 이들 AAV9 및 AAVrh79 벡터 로트의 수율을 비교하였다(도 19).
AAV8 및 AAV9에 대해 실시예 1에 기재된 바와 같이 AAVrh79 벡터를 탈아미드화에 대해 평가하였다. 결과는 벡터가 AAVrh79(서열번호: 1)의 넘버링에 기초하여, 아스파라긴 - 글리신 쌍에서 아스파라긴에 상응하는 고도로 탈아미드화된 4 개의 아미노산(N57, N263, N385, N514)을 함유한다는 것을 제시한다. 더 낮은 탈아미드화 백분율이 잔기 N94, N254, N410에서 일관되게 관찰된다.
Figure pct00019
Figure pct00020
Figure pct00021
실시예 4: AAV8.2.08의 제조
WO 2017/180854(본원에 참조로 포함됨)에서 논의된 바와 같이, 여러 AAV8 돌연변이체는 HVR.VIII 영역에서 돌연변이를 갖는 c41, c42, c46, g110, g113, g115 및 g117을 생성하였다. Gurda 등에서 논의된 바와 같이, 주요 ADK8 에피토프는 HVR.VIII 영역(AAV8 vp1 넘버링을 사용하여 아미노산 586 내지 591)에 놓여 있다. 이들 돌연변이체를 ADK8 내성에 대해 시험관 내에서 시험하였고, 이들 중 일부를 ADK8 내성에 대해 생체 내에서 시험하였다. 예를 들어, 상기 인용된 Lochrie 2006 참조.
AR2.1-9를 무작위로 선발하였다. AR2.25-61을 빈도에 기초하여 선택하였다. 6-웰 플레이트 수율 및 Huh7 형질도입 측면에서 무작위로 선발된 변이체, 뿐만 아니라 더 높은 빈도의 것이 살아있다. 도 24는 AAV8.AR2.08(가장 좌측 막대 세트)의 다양한 조직에서 발현을 제시한다.
실시예 5: AAV8.AR2.08의 탈아미드화
AAV8.AR2.08의 신규 서열은 각각 서열번호: 17 및 18에서 제공되며, 이는 실시예 4에서와 같이 설계하였다.
A. 변형 AAV8.AR2.08 벡터를 생성하고 AAV8에 대해 실시예 1에 기재된 바와 같이 변형에 대해 평가하였다. 결과는 벡터가 AAV8.AR2.08(서열번호: 18)의 넘버링에 기초하여, 아스파라긴 - 글리신 쌍에서 아스파라긴에 상응하는 고도로 탈아미드화된 5 개의 아미노산(N57, N263, N385, N514, 및 N540)을 함유한다는 것을 제시한다. 더 낮은 탈아미드화 백분율이 잔기 N94, N254, N410에서 일관되게 관찰된다. AAV8과 대조적으로, 탈아미드화는 위치 N459(AAV8에서 평균 7%) 또는 N499(AAV8에서 평균 17%)에서 관찰되지 않는다.
Figure pct00022
Figure pct00023
B. 단일 세포 RNA-seq은 AAV8로 처리 후 비-인간 영장류로부터 단리된 형질도입된 간세포의 조직 국소화 및 전사 서명을 나타낸다
단일 세포 RNA 서열분석은 전례없는 단일 세포 분해능으로 세포 전사체를 특성화하는 강력한 기술이라는 것이 입증되었다. 본 발명의 현재 작업에서, 본 발명자들은 단일 세포 RNA-seq를 활용하여 GFP를 발현하는 AAV8 벡터로 처리 후 레서스 원숭이로부터 단리된 1차 간세포의 전사 전망을 연구한다. FACS-분류된 GFP+ 및 GFP- 세포의 전사체 분석은 간 소엽 내에서 형질도입된 세포의 조직 국소화 뿐만 아니라 간세포 형질도입 및 전이유전자 발현의 조절에 수반된 유전자 및 조절 경로를 나타낸다.
본 연구 설계를 위해, 레서스 원숭이를 1x1013 ddGC/kg AAV8.TBG.EGFP.WPRE(n=1) 또는 1x1013 ddGC/kg AAV8.2.08.TBG.EGFP.WPRE(AAV8 변이체, n=1)로 처리하였다. 처리 후 7 일에 동물을 안락사시키고, 부검을 수행하여 두 동물로부터 간을 단리하였다. 콜라게나제 및 구배 원심분리로 처리 후, 단리된 간세포를 BD PreciseTM 96 웰 플레이트 상에서 GFP 전이유전자 발현에 의해 FACS 분류하였다. 192 개의 단일 세포를 각각의 동물(96 개의 GFP+ 및 96 개의 GFP-)로부터 단리하고 후속적으로 표준 BD PreciseTM 프로토콜에 따라 단일 세포 RNA-seq 라이브러리를 제조하는데 사용하였다. GFP- 및 GFP+ 분류된 세포 사이에 차등적으로 발현된 전사체를 결정하고 확립된 전사 발현 서명을 사용하여 간 소엽 내에서 단리된 세포의 공간 재구성을 수행하기 위해 R에서 Seurat, Scran, 및 Scater 패키지를 사용하여 데이터를 분석하였다.
AAV8.AR2.08은 간 향성이 증가한 것으로 밝혀졌고 AAV8과 비교하여 1.5-배 증가한 형질도입 효율을 나타내었다. 분류된 간세포의 단일 세포 전사체 분석은 전이유전자-발현 세포가 간 소엽에 걸쳐 균일하게 분포되어 있음을 나타내며, 이는 조직병리학에서도 관찰된 문맥주위 영역에 대한 약간의 선호를 제시한다. 흥미롭게도, 분류된 GFP- 세포의 하위집단은 분류된 GFP+ 세포와 필적할만한 수준으로 전이유전자 전사체를 발현하는 것으로 밝혀졌으며, 이는 이들 세포가 번역된 단백질의 검출가능한 수준의 부재에도 불구하고, 실제로 형질도입되어 전이유전자 mRNA를 발현한다는 것을 시사한다. GFP- 및 GFP+ 세포의 전사 프로파일을 비교하면 바이러스 mRNA 번역에 수반되는 차등적으로 발현된 전사체를 나타내어, 형질도입 세포에서 전이유전자 단백질 발현의 조절에 관여된 가능한 경로를 설명한다.
C. 인간 간 이종 이식 모델을 통한 유도 진화로 비인간 영장류에서 더 나은 간 형질도입 및 더 높은 간 특이성을 갖는 아데노-연관 바이러스 8 변이체의 단리
더 나은 형질도입 및 더 높은 특이성을 갖는 AAV 변이체를 유도하기 위해, 간 유전자 요법에 대한 기준인 AAV8의 캡시드 상의 표면 노출된 부위를 표적화하는 포화 돌연변이를 사용하여, AAV-유도 진화를 수행한 다음, 인간 간 이종 이식 마우스 모델에서 생체내 풍부화를 2 회 수행하고, AAV8.2.08이라고 불리는 AAV8 변이체를 단리하였다. 1e13 게놈 카피(GC)/kg 체중의 용량으로 비인간 영장류에 정맥내 주사 후, 다양한 기관(폐, 심장, 위, 췌장, 신장, 및 장간막 림프절 포함)에서 AAV8.AR2.08에 의해 전달된 벡터 게놈 카피는 AAV8과 비교하여, 간에서 전달이 증가하는 동안 감소하였으며, 이는 더 나은 간 형질도입 및 더 높은 조직 특이성을 의미한다. 차세대 서열분석은 생체내 선택 동안 AAV8.AR2.08의 유의한 풍부화를 나타내었으며, 이는 새롭고 개선된 향성을 갖는 캡시드를 단리하기 위한 접근법의 잠재력을 입증한다. 다른 비교는 도 21 내지 27에 제시된다). 도 28은 AAV8.AR2.08 및 AAV8의 생물분포를 제시한다.
D. 바코드화
흑색 6 마리의 마우스에 12 개의 제제로부터 유래된 rAAVG3의 혼합물 2x1012 GC/마우스를 I.V. 주사하였다(도 18b). 각각의 제제는 벡터 게놈 내에서 별도의 바코드를 함유하여 특이적 제제를 식별하게 한다(도 18a). 2 주 후, 동물을 안락사시키고, 조직을 수확하였다. 예측된 바와 같이, rAAVG3 발현은 심장 또는 근육보다 간에서 더 높았다. 도 18c. 조직 분포 실험은 실제 빈도가 주사된 벡터 믹스에서 바코드의 이론적 빈도와 일치하며(도 18d, 총; 도 19a, 19b, 근육; 도 19c, 19d, 심장; 및 도 19e, 19f, 간), BC02 및 BC06에서 약간 이상이 있음(도 20a-20c)을 제시한다. 본 명세서에 인용된 모든 문서는 본원에 참조로 포함된다. 2018년 8월 24일 출원된 미국 가특허 출원 번호 제62/722,388호 및 제62/722,382호, 2018년 7월 26일 출원된 미국 가특허 출원 번호 제62/703,670호 및 제62/703,673호, 2018년 5월 29일 출원된 미국 가특허 출원 번호 제62/677,471호 및 제62/677,474호, 2018년 5월 29일 출원된 미국 가특허 출원 번호 제62/667,585호, 및 2018년 2월 27일 출원된 미국 가특허 출원 번호 제62/635,964호가 본원에 참조로 포함된다. 2018년 5월 7일 출원된 미국 가특허 출원 번호 제62/667,881호, 2018년 5월 7일 출원된 미국 가특허 출원 번호 제62/667,888호, 2018년 5월 6일 출원된 미국 가특허 출원 번호 제62/667,587호, 2018년 4월 27일 출원된 미국 가특허 출원 번호 제62/663,797호, 2018년 4월 27일 출원된 미국 가특허 출원 번호 제62/663,788호, 2018년 2월 27일 출원된 미국 가특허 출원 번호 제62/635,968호가 본원에 참조로 포함된다. 본원에 언급되고 첨부된 서열 목록에 나타낸 서열번호는 참조로 포함된다. 본 발명이 특정 구현예를 참조하여 기재되었지만, 본 발명의 사상을 벗어나지 않고 변형이 이루어질 수 있음이 이해될 것이다. 이러한 변형은 첨부된 청구범위의 범위 내에 속하도록 의도된다.
SEQUENCE LISTING <110> The Trustees of the University of Pennsylvania <120> Novel Adeno-Associated Virus (AAV) Vectors, AAV Vectors Having Reduced Capsid Deamidation And Uses Therefor <130> 18-8592PCT <150> US 62/722,382 <151> 2018-08-24 <150> US 62/703,670 <151> 2018-07-26 <150> US 62/677,471 <151> 2018-05-29 <150> US 62/667,585 <151> 2018-05-29 <150> US 62/635,964 <151> 2018-02-27 <150> US 62/722,388 <151> 2018-08-24 <150> US 62/703,673 <151> 2018-07-26 <150> US 62/677,474 <151> 2018-05-29 <150> US 62/667,587 <151> 2018-05-06 <150> US 62/635,968 <151> 2018-02-27 <150> US 62/667,881 <151> 2018-05-07 <150> US 62/663,797 <151> 2018-04-27 <150> US 62/667,888 <151> 2018-05-07 <150> US 62/633,788 <151> 2018-04-27 <160> 128 <170> PatentIn version 3.5 <210> 1 <211> 2214 <212> DNA <213> AAVrh79 <220> <221> CDS <222> (1)..(2214) <400> 1 atg gct gct gac ggt tat ctt cca gat tgg ctc gag gac aac ctc tct 48 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 gag ggc att cgc gag tgg tgg gac ctg aaa cct gga gcc ccc aag ccc 96 Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 aag gcc aac cag cag aag cag gac gac ggc cgg ggt ctg gtg ctt cct 144 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 ggc tac aag tac ctc gga ccc ttc aac gga ctc gac aag ggg gag ccc 192 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 gtc aac gag gcg gac gcc gcg gcc ctc gag cac gac aag gcc tac gac 240 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 cag cag ctc aaa gcg ggt gac aat ccg tac ctg cgg tat aac cac gcc 288 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 gac gcc gag ttt cag gag cgt ctg caa gaa gat acg tct ttt ggg ggc 336 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 aac ctc ggg cga gca gtc ttc cag gcc aag aag cgg gtt ctc gaa cct 384 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 ctc ggt ctg gtt gag gaa gct gct aag acg gct cct gga aag aag aga 432 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 ccg gta gaa ccg tca cct cag cga tcc ccc gac tcc tcc acg ggc atc 480 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 ggc aaa aaa ggc cag cag ccc gcg aga aag aga ctg aac ttt ggg cag 528 Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln 165 170 175 act ggc gac tca gag tca gtc ccc gac cct caa cca atc gga gaa cca 576 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro 180 185 190 cca gca ggc ccc tct ggt ctg gga tct ggt aca atg gct gca ggc ggt 624 Pro Ala Gly Pro Ser Gly Leu Gly Ser Gly Thr Met Ala Ala Gly Gly 195 200 205 ggc gct cca atg gca gac aat aac gaa ggc gcc gac gga gtg ggt agt 672 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 tcc tca gga aat tgg cat tgc gat tcc aca tgg ctg ggc gac aga gtc 720 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 atc acc acc agc acc cga acc tgg gcc ctg ccc acc tac aac aac cac 768 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 ctc tac aag caa atc tcc aat ggg aca tcg gga gga agc acc aac gac 816 Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp 260 265 270 aac acc tac ttc ggc tac agc acc ccc tgg ggg tat ttt gac ttc aac 864 Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn 275 280 285 aga ttc cac tgt cac ttc tca cca cgt gac tgg cag aga ctc atc aac 912 Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn 290 295 300 aac aac tgg gga ttc cgg ccc aag aga ctc agc ttc aag ctc ttc aac 960 Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn 305 310 315 320 atc cag gtt aag gag gtc acg cag aat gaa ggc acc aag acc atc gcc 1008 Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala 325 330 335 aat aac ctt acc agc acg att cag gta ttt acg gac tcg gaa tac cag 1056 Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln 340 345 350 ctg ccg tac gtc ctc ggc tcc gcg cac cag ggc tgc ctg cct ccg ttc 1104 Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe 355 360 365 ccg gcg gat gtc ttc atg att ccc cag tac ggc tac ctg aca ctg aac 1152 Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn 370 375 380 aac gga agt caa gcc gta ggc cgt tcc tca ttc tac tgc ctg gaa tat 1200 Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr 385 390 395 400 ttt cca tct caa atg ctg cgg act gga aac aac ttt gaa ttt agc tac 1248 Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr 405 410 415 acc ttt gag gac gtg ccc ttc cac agc agc tac gca cac agc cag agc 1296 Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser 420 425 430 ctg gac cgg ctg atg aac cct ctc atc gac cag tac ctg tat tac cta 1344 Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu 435 440 445 tcc aga act cag tcc aca gga gga act caa ggt aca cag caa ttg tta 1392 Ser Arg Thr Gln Ser Thr Gly Gly Thr Gln Gly Thr Gln Gln Leu Leu 450 455 460 ttt tct caa gcc ggg cct gca aat atg tcg gct cag gcc aag aac tgg 1440 Phe Ser Gln Ala Gly Pro Ala Asn Met Ser Ala Gln Ala Lys Asn Trp 465 470 475 480 cta cct gga cct tgc tac cgg cag cag cga gtc tcc acg aca ctg tcg 1488 Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser 485 490 495 caa aac aac aac agc aac ttt gct tgg act ggt gcc acg aaa tat cat 1536 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His 500 505 510 ctg aac gga aga gac tct ttg gtg aat ccc ggt gtt gct atg gca acg 1584 Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr 515 520 525 cat aag gac gac gag gaa cgt ttc ttt cca tcg agc gga gtc ctg atg 1632 His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Ser Gly Val Leu Met 530 535 540 ttt gga aaa cag ggt gct gga aga gac aat gtg gac tat agc agc gtt 1680 Phe Gly Lys Gln Gly Ala Gly Arg Asp Asn Val Asp Tyr Ser Ser Val 545 550 555 560 atg cta acc agc gag gaa gaa atc aag acc act aac cct gta gcc act 1728 Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr 565 570 575 gaa caa tac ggc gtg gtg gct gat aac ttg cag caa acc aat aca gga 1776 Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln Gln Thr Asn Thr Gly 580 585 590 cct atc gtg gga aat gtc aac agc caa gga gcc tta cct ggc atg gtc 1824 Pro Ile Val Gly Asn Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val 595 600 605 tgg cag aac cga gac gtg tac ctg cag ggt ccc att tgg gcc aag att 1872 Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 610 615 620 cct cac acg gac ggc aac ttt cac ccg tct cct ctg atg ggc ggc ttt 1920 Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe 625 630 635 640 gga ctg aaa cac ccg cct cct caa atc ctg atc aag aac act ccc gtt 1968 Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val 645 650 655 cct gcg gat cct cca acg acg ttc agc cag gcg aaa ttg gct tcc ttc 2016 Pro Ala Asp Pro Pro Thr Thr Phe Ser Gln Ala Lys Leu Ala Ser Phe 660 665 670 atc acg cag tat agt acc ggc cag gtc agc gtg gag atc gag tgg gag 2064 Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu 675 680 685 ctg cag aag gag aac agc aag cgc tgg aac cca gaa att cag tat act 2112 Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 690 695 700 tcc aac tac tac aaa tct aca aat gtg gac ttt gct gtc aat acc gag 2160 Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Glu 705 710 715 720 ggt aca tat tca gag cct cgc ccc att gga act cgt tac ctc acc cgt 2208 Gly Thr Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 725 730 735 aat ctg 2214 Asn Leu <210> 2 <211> 738 <212> PRT <213> AAVrh79 <400> 2 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln 165 170 175 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro 180 185 190 Pro Ala Gly Pro Ser Gly Leu Gly Ser Gly Thr Met Ala Ala Gly Gly 195 200 205 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp 260 265 270 Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn 275 280 285 Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn 290 295 300 Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn 305 310 315 320 Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala 325 330 335 Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln 340 345 350 Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe 355 360 365 Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn 370 375 380 Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr 385 390 395 400 Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr 405 410 415 Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser 420 425 430 Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu 435 440 445 Ser Arg Thr Gln Ser Thr Gly Gly Thr Gln Gly Thr Gln Gln Leu Leu 450 455 460 Phe Ser Gln Ala Gly Pro Ala Asn Met Ser Ala Gln Ala Lys Asn Trp 465 470 475 480 Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser 485 490 495 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His 500 505 510 Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr 515 520 525 His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Ser Gly Val Leu Met 530 535 540 Phe Gly Lys Gln Gly Ala Gly Arg Asp Asn Val Asp Tyr Ser Ser Val 545 550 555 560 Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr 565 570 575 Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln Gln Thr Asn Thr Gly 580 585 590 Pro Ile Val Gly Asn Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val 595 600 605 Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 610 615 620 Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe 625 630 635 640 Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val 645 650 655 Pro Ala Asp Pro Pro Thr Thr Phe Ser Gln Ala Lys Leu Ala Ser Phe 660 665 670 Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu 675 680 685 Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 690 695 700 Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Glu 705 710 715 720 Gly Thr Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 725 730 735 Asn Leu <210> 3 <211> 2208 <212> DNA <213> AAV9 <220> <221> CDS <222> (1)..(2208) <400> 3 atg gct gcc gat ggt tat ctt cca gat tgg ctc gag gac aac ctt agt 48 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 gaa gga att cgc gag tgg tgg gct ttg aaa cct gga gcc cct caa ccc 96 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 aag gca aat caa caa cat caa gac aac gct cga ggt ctt gtg ctt ccg 144 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 ggt tac aaa tac ctt gga ccc ggc aac gga ctc gac aag ggg gag ccg 192 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 gtc aac gca gca gac gcg gcg gcc ctc gag cac gac aag gcc tac gac 240 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 cag cag ctc aag gcc gga gac aac ccg tac ctc aag tac aac cac gcc 288 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 gac gcc gag ttc cag gag cgg ctc aaa gaa gat acg tct ttt ggg ggc 336 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 aac ctc ggg cga gca gtc ttc cag gcc aaa aag agg ctt ctt gaa cct 384 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 ctt ggt ctg gtt gag gaa gcg gct aag acg gct cct gga aag aag agg 432 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 cct gta gag cag tct cct cag gaa ccg gac tcc tcc gcg ggt att ggc 480 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 aaa tcg ggt gca cag ccc gct aaa aag aga ctc aat ttc ggt cag act 528 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 ggc gac aca gag tca gtc cca gac cct caa cca atc gga gaa cct ccc 576 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 gca gcc ccc tca ggt gtg gga tct ctt aca atg gct tca ggt ggt ggc 624 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 gca cca gtg gca gac aat aac gaa ggt gcc gat gga gtg ggt agt tcc 672 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 tcg gga aat tgg cat tgc gat tcc caa tgg ctg ggg gac aga gtc atc 720 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 acc acc agc acc cga acc tgg gcc ctg ccc acc tac aac aat cac ctc 768 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 tac aag caa atc tcc aac agc aca tct gga gga tct tca aat gac aac 816 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 gcc tac ttc ggc tac agc acc ccc tgg ggg tat ttt gac ttc aac aga 864 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 ttc cac tgc cac ttc tca cca cgt gac tgg cag cga ctc atc aac aac 912 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 aac tgg gga ttc cgg cct aag cga ctc aac ttc aag ctc ttc aac att 960 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 cag gtc aaa gag gtt acg gac aac aat gga gtc aag acc atc gcc aat 1008 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 aac ctt acc agc acg gtc cag gtc ttc acg gac tca gac tat cag ctc 1056 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 ccg tac gtg ctc ggg tcg gct cac gag ggc tgc ctc ccg ccg ttc cca 1104 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 gcg gac gtt ttc atg att cct cag tac ggg tat ctg acg ctt aat gat 1152 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 gga agc cag gcc gtg ggt cgt tcg tcc ttt tac tgc ctg gaa tat ttc 1200 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 ccg tcg caa atg cta aga acg ggt aac aac ttc cag ttc agc tac gag 1248 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 ttt gag aac gta cct ttc cat agc agc tac gct cac agc caa agc ctg 1296 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 gac cga cta atg aat cca ctc atc gac caa tac ttg tac tat ctc tca 1344 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 aag act att aac ggt tct gga cag aat caa caa acg cta aaa ttc agt 1392 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 gtg gcc gga ccc agc aac atg gct gtc cag gga aga aac tac ata cct 1440 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 gga ccc agc tac cga caa caa cgt gtc tca acc act gtg act caa aac 1488 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 aac aac agc gaa ttt gct tgg cct gga gct tct tct tgg gct ctc aat 1536 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 gga cgt aat agc ttg atg aat cct gga cct gct atg gcc agc cac aaa 1584 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 gaa gga gag gac cgt ttc ttt cct ttg tct gga tct tta att ttt ggc 1632 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 aaa caa gga act gga aga gac aac gtg gat gcg gac aaa gtc atg ata 1680 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 acc aac gaa gaa gaa att aaa act act aac ccg gta gca acg gag tcc 1728 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 tat gga caa gtg gcc aca aac cac cag agt gcc caa gca cag gcg cag 1776 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 acc ggc tgg gtt caa aac caa gga ata ctt ccg ggt atg gtt tgg cag 1824 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 gac aga gat gtg tac ctg caa gga ccc att tgg gcc aaa att cct cac 1872 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 acg gac ggc aac ttt cac cct tct ccg ctg atg gga ggg ttt gga atg 1920 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 aag cac ccg cct cct cag atc ctc atc aaa aac aca cct gta cct gcg 1968 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 gat cct cca acg gcc ttc aac aag gac aag ctg aac tct ttc atc acc 2016 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 cag tat tct act ggc caa gtc agc gtg gag atc gag tgg gag ctg cag 2064 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 aag gaa aac agc aag cgc tgg aac ccg gag atc cag tac act tcc aac 2112 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 tat tac aag tct aat aat gtt gaa ttt gct gtt aat act gaa ggt gta 2160 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 tat agt gaa ccc cgc ccc att ggc acc aga tac ctg act cgt aat ctg 2208 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 4 <211> 736 <212> PRT <213> AAV9 <400> 4 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 5 <211> 2211 <212> DNA <213> AAVhu31 <220> <221> CDS <222> (1)..(2211) <400> 5 atg gct gcc gat ggt tat ctt cca gat tgg ctc gag gac act ctc tct 48 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 gaa gga ata aga cag tgg tgg aag ctc aaa cct ggc ccc cca cca cca 96 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 aag ccc gca gag cgg cat aag gac gac agc agg ggt ctt gtg ctt cct 144 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 ggg tac aag tac ctc gga ccc ggc aac gga ctc gac aag ggg gag ccg 192 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 gtc aac gca gca gac gcg gcg gcc ctc gag cac gac aag gcc tac gac 240 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 cag cag ctc aag gcc gga gac aac ccg tac ctc aag tac aac cac gcc 288 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 gac gcc gag ttc cag gag cgg ctc aaa gaa gat acg tct ttt ggg ggc 336 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 aac ctc ggg cga gca gtc ttc cag gcc aaa aag agg ctt ctt gaa cct 384 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 ctt ggt ctg gtt gag gaa gcg gct aag acg gct cct gga aag aag agg 432 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 cct gta gag cag tct cct cag gaa ccg gac tcc tcc gcg ggt att ggc 480 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 aaa tcg ggt tca cag ccc gct aaa aag aaa ctc aat ttc ggt cag act 528 Lys Ser Gly Ser Gln Pro Ala Lys Lys Lys Leu Asn Phe Gly Gln Thr 165 170 175 ggc gac aca gag tca gtc ccc gac cct caa cca atc gga gaa cct ccc 576 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 gca gcc ccc tca ggt gtg gga tct ctt aca atg gct tca ggt ggt ggc 624 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 gca cca gtg gca gac aat aac gaa ggt gcc gat gga gtg ggt agt tcc 672 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 tcg gga aat tgg cat tgc gat tcc caa tgg ctg ggg gac aga gtc atc 720 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 acc acc agc acc cga acc tgg gcc ctg ccc acc tac aac aat cac ctc 768 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 tac aag caa atc tcc aac agc aca tct gga gga tct tca aat gac aac 816 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 gcc tac ttc ggc tac agc acc ccc tgg ggg tat ttt gac ttc aac aga 864 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 ttc cac tgc cac ttc tca cca cgt gac tgg cag cga ctc atc aac aac 912 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 aac tgg gga ttc cgg cct aag cga ctc aac ttc aag ctc ttc aac att 960 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 cag gtc aaa gag gtt acg gac aac aat gga gtc aag acc atc gcc aat 1008 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 aac ctt acc agc acg gtc cag gtc ttc acg gac tca gac tat cag ctc 1056 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 ccg tac gtg ctc ggg tcg gct cac gag ggc tgc ctc ccg ccg ttc cca 1104 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 gcg gac gtt ttc atg att cct cag tac ggg tat ctg acg ctt aat gat 1152 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 gga ggc cag gcc gtg ggt cgt tcg tcc ttt tac tgc ctg gaa tat ttc 1200 Gly Gly Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 ccg tcg caa atg cta aga acg ggt aac aac ttc cag ttc agc tac gag 1248 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 ttt gag aac gta cct ttc cat agc agc tac gct cac agc caa agc ctg 1296 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 gac cga cta atg aat cca ctc atc gac caa tac ttg tac tat ctc tca 1344 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 aag act att aac ggt tct gga cag aat caa caa acg cta aaa ttc agt 1392 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 gtg gcc gga ccc agc aac atg gct gtc cag gga aga aac tac ata cct 1440 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 gga ccc agc tac cga caa caa cgt gtc tca acc act gtg act caa aac 1488 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 aac aac agc gaa ttt gct tgg cct gga gct tct tct tgg gct ctc aat 1536 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 gga cgt aat agc ttg atg aat cct gga cct gct atg gcc agc cac aaa 1584 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 gaa gga gag gac cgt ttc ttt cct ttg tcc gga tct tta att ttt ggc 1632 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 aaa caa gga act gga aga gac aac gtg gat gcg gac aaa gtc atg ata 1680 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 acc aac gaa gaa gaa att aaa act act aac ccg gta gca acg gag tcc 1728 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 tat gga caa gtg gcc aca aac cac cag agt gcc caa gca cag gcg cag 1776 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 acc ggc tgg gtt caa aac caa gga ata ctt ccg ggt atg gtt tgg cag 1824 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 gac aga gat gtg tac ctg caa gga ccc att tgg gcc aaa att cct cac 1872 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 acg gac ggc aac ttt cac cct tct ccg cta atg gga ggg ttt gga atg 1920 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 aag cac ccg cct cct cag atc ctc atc aaa aac aca cct gta cct gcg 1968 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 gat cct cca acg gct ttc aat aag gac aag ctg aac tct ttc atc acc 2016 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 cag tat tct act ggc caa gtc agc gtg gag att gag tgg gag ctg cag 2064 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 aag gaa aac agc aag cgc tgg aac ccg gag atc cag tac act tcc aac 2112 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 tat tac aag tct aat aat gtt gaa ttt gct gtt agt act gaa ggt gta 2160 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Ser Thr Glu Gly Val 705 710 715 720 tat agt gaa ccc cgc ccc att ggc acc aga tac ctg act cgt aat ctg 2208 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 taa 2211 <210> 6 <211> 736 <212> PRT <213> AAVhu31 <400> 6 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ser Gln Pro Ala Lys Lys Lys Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Gly Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Ser Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 7 <211> 2211 <212> DNA <213> AAVhu32 <220> <221> CDS <222> (1)..(2211) <400> 7 atg gct gcc gat ggt tat ctt cca gat tgg ctc gag gac act ctc tct 48 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 gaa gga ata aga cag tgg tgg aag ctc aaa cct ggc cca cca cca cca 96 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 aag ccc gca gag cgg cat aag gac gac agc agg ggt ctt gtg ctt cct 144 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 ggg tac aag tac ctc gga ccc ggc aac gga ctc gac aag ggg gag ccg 192 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 gtc aac gca gca gac gcg gcg gcc ctc gag cac gac aag gcc tac gac 240 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 cag cag ctc aag gcc gga gac aac ccg tac ctc aag tac aac cac gcc 288 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 gac gcc gag ttc cag gag cgg ctc aaa gaa gat acg tct ttt ggg ggc 336 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 aac ctc ggg cga gca gtc ttc cag gcc aaa aag agg ctt ctt gaa cct 384 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 ctt ggt ctg gtt gag gaa gcg gct aag acg gct cct gga aag aag agg 432 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 cct gta gag cag tct cct cag gaa ccg gac tcc tcc gcg ggt att ggc 480 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 aaa tcg ggt tca cag ccc gct aaa aag aaa ctc aat ttc ggt cag act 528 Lys Ser Gly Ser Gln Pro Ala Lys Lys Lys Leu Asn Phe Gly Gln Thr 165 170 175 ggc gac aca gag tca gtc ccc gac cct caa cca atc gga gaa cct ccc 576 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 gca gcc ccc tca ggt gtg gga tct ctt aca atg gct tca ggt ggt ggc 624 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 gca cca gtg gca gac aat aac gaa ggt gcc gat gga gtg ggt agt tcc 672 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 tcg gga aat tgg cat tgc gat tcc caa tgg ctg ggg gac aga gtc atc 720 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 acc acc agc acc cga acc tgg gcc ctg ccc acc tac aac aat cac ctc 768 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 tac aag caa atc tcc aac agc aca tct gga gga tct tca aat gac aac 816 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 gcc tac ttc ggc tac agc acc ccc tgg ggg tat ttt gac ttc aac aga 864 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 ttc cac tgc cac ttc tca cca cgt gac tgg cag cga ctc atc aac aac 912 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 aac tgg gga ttc cgg cct aag cga ctc aac ttc aag ctc ttc aac att 960 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 cag gtc aaa gag gtt acg gac aac aat gga gtc aag acc atc gcc aat 1008 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 aac ctt acc agc acg gtc cag gtc ttc acg gac tca gac tat cag ctc 1056 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 ccg tac gtg ctc ggg tcg gct cac gag ggc tgc ctc ccg ccg ttc cca 1104 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 gcg gac gtt ttc atg att cct cag tac ggg tat ctg acg ctt aat gat 1152 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 ggg agc cag gcc gtg ggt cgt tcg tcc ttt tac tgc ctg gaa tat ttc 1200 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 ccg tcg caa atg cta aga acg ggt aac aac ttc cag ttc agc tac gag 1248 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 ttt gag aac gta cct ttc cat agc agc tac gct cac agc caa agc ctg 1296 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 gac cga cta atg aat cca ctc atc gac caa tac ttg tac tat ctc tca 1344 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 aag act att aac ggt tct gga cag aat caa caa acg cta aaa ttc agc 1392 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 gtg gcc gga ccc agc aac atg gct gtc cag gga aga aac tac ata cct 1440 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 gga ccc agc tac cga caa caa cgt gtc tca acc act gtg act caa aac 1488 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 aac aac agc gaa ttt gct tgg cct gga gct tct tct tgg gct ctc aat 1536 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 gga cgt aat agc ttg atg aat cct gga cct gct atg gcc agc cac aaa 1584 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 gaa gga gag gac cgt ttc ttt cct ttg tct gga tct tta att ttt ggc 1632 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 aaa caa gga act gga aga gac aac gtg gat gcg gac aaa gtc atg ata 1680 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 acc aac gaa gaa gaa att aaa act act aac ccg gta gca acg gag tcc 1728 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 tat gga caa gtg gcc aca aac cac cag agt gcc caa gca cag gcg cag 1776 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 acc ggc tgg gtt caa aac caa gga ata ctt ccg ggt atg gtt tgg cag 1824 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 gac aga gat gtg tac ctg caa gga ccc att tgg gcc aaa att cct cac 1872 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 acg gac ggc aac ttt cac cct tct ccg cta atg gga ggg ttt gga atg 1920 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 aag cac ccg cct cct cag atc ctc atc aaa aac aca cct gta cct gcg 1968 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 gat cct cca acg gct ttc aat aag gac aag ctg aac tct ttc atc acc 2016 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 cag tat tct act ggc caa gtc agc gtg gag att gag tgg gag ctg cag 2064 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 aag gaa aac agc aag cgc tgg aac ccg gag atc cag tac act tcc aac 2112 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 tat tac aag tct aat aat gtt gaa ttt gct gtt aat act gaa ggt gta 2160 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 tat agt gaa ccc cgc ccc att ggc acc aga tac ctg act cgt aat ctg 2208 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 taa 2211 <210> 8 <211> 736 <212> PRT <213> AAVhu32 <400> 8 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ser Gln Pro Ala Lys Lys Lys Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 9 <211> 2178 <212> DNA <213> AAV5.5.9 <220> <221> CDS <222> (1)..(2178) <400> 9 atg tct ttt gtt gat cac cct cca gat tgg ttg gaa gaa gtt ggt gaa 48 Met Ser Phe Val Asp His Pro Pro Asp Trp Leu Glu Glu Val Gly Glu 1 5 10 15 ggt ctt cgc gag ttt ttg ggc ctt gaa gcg ggc cca ccg aaa cca aaa 96 Gly Leu Arg Glu Phe Leu Gly Leu Glu Ala Gly Pro Pro Lys Pro Lys 20 25 30 ccc aat cag cag cat caa gat caa gcc cgt ggt ctt gtg ctg cct ggt 144 Pro Asn Gln Gln His Gln Asp Gln Ala Arg Gly Leu Val Leu Pro Gly 35 40 45 tat aac tat ctc gga ccc gga aac ggt ctc gat cga gga gag cct gtc 192 Tyr Asn Tyr Leu Gly Pro Gly Asn Gly Leu Asp Arg Gly Glu Pro Val 50 55 60 aac agg gca gac gag gtc gcg cga gag cac gac atc tcg tac aac gag 240 Asn Arg Ala Asp Glu Val Ala Arg Glu His Asp Ile Ser Tyr Asn Glu 65 70 75 80 cag ctt gag gcg gga gac aac ccc tac ctc aag tac aac cac gcg gac 288 Gln Leu Glu Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp 85 90 95 gcc gag ttt cag gag aag ctc gcc gac gac aca tcc ttc ggg gga aac 336 Ala Glu Phe Gln Glu Lys Leu Ala Asp Asp Thr Ser Phe Gly Gly Asn 100 105 110 ctc gga aag gca gtc ttt cag gcc aag aaa agg gtt ctc gaa cct ttt 384 Leu Gly Lys Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro Phe 115 120 125 ggc ctg gtt gaa gag ggt gct aag acg gcc cct acc gga aag cgg ata 432 Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg Ile 130 135 140 gac gac cac ttt cca aaa aga aag aag gcc cgg acc gaa gag gac tcc 480 Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp Ser 145 150 155 160 aag cct tcc acc tcg tca gac gcc gaa gct gga ccc agc gga tcc cag 528 Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser Gln 165 170 175 cag ctg caa atc cca gcc caa cca gcc tca agt ttg gga gct gat aca 576 Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp Thr 180 185 190 atg gct tca ggt ggt ggc gca cca gtg gca gac aat aac gaa ggt gcc 624 Met Ala Ser Gly Gly Gly Ala Pro Val Ala Asp Asn Asn Glu Gly Ala 195 200 205 gat gga gtg ggt agt tcc tcg gga aat tgg cat tgc gat tcc caa tgg 672 Asp Gly Val Gly Ser Ser Ser Gly Asn Trp His Cys Asp Ser Gln Trp 210 215 220 ctg ggg gac aga gtc atc acc acc agc acc cga acc tgg gcc ctg ccc 720 Leu Gly Asp Arg Val Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro 225 230 235 240 acc tac aac aat cac ctc tac aag caa atc tcc aac agc aca tct gga 768 Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly 245 250 255 gga tct tca aat gac aac gcc tac ttc ggc tac agc acc ccc tgg ggg 816 Gly Ser Ser Asn Asp Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly 260 265 270 tat ttt gac ttc aac aga ttc cac tgc cac ttc tca cca cgt gac tgg 864 Tyr Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp 275 280 285 cag cga ctc atc aac aac aac tgg gga ttc cgg cct aag cga ctc aac 912 Gln Arg Leu Ile Asn Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn 290 295 300 ttc aag ctc ttc aac att cag gtc aaa gag gtt acg gac aac aat gga 960 Phe Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Asp Asn Asn Gly 305 310 315 320 gtc aag acc atc gcc aat aac ctt acc agc acg gtc cag gtc ttc acg 1008 Val Lys Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr 325 330 335 gac tca gac tat cag ctc ccg tac gtg ctc ggg tcg gct cac gag ggc 1056 Asp Ser Asp Tyr Gln Leu Pro Tyr Val Leu Gly Ser Ala His Glu Gly 340 345 350 tgc ctc ccg ccg ttc cca gcg gac gtt ttc atg att cct cag tac ggg 1104 Cys Leu Pro Pro Phe Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly 355 360 365 tat ctg acg ctt aat gat gga agc cag gcc gtg ggt cgt tcg tcc ttt 1152 Tyr Leu Thr Leu Asn Asp Gly Ser Gln Ala Val Gly Arg Ser Ser Phe 370 375 380 tac tgc ctg gaa tat ttc ccg tcg caa atg cta aga acg ggt aac aac 1200 Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn 385 390 395 400 ttc cag ttc agc tac gag ttt gag aac gta cct ttc cat agc agc tac 1248 Phe Gln Phe Ser Tyr Glu Phe Glu Asn Val Pro Phe His Ser Ser Tyr 405 410 415 gct cac agc caa agc ctg gac cga cta atg aat cca ctc atc gac caa 1296 Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln 420 425 430 tac ttg tac tat ctc tca aag act att aac ggt tct gga cag aat caa 1344 Tyr Leu Tyr Tyr Leu Ser Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln 435 440 445 caa acg cta aaa ttc agt gtg gcc gga ccc agc aac atg gct gtc cag 1392 Gln Thr Leu Lys Phe Ser Val Ala Gly Pro Ser Asn Met Ala Val Gln 450 455 460 gga aga aac tac ata cct gga ccc agc tac cga caa caa cgt gtc tca 1440 Gly Arg Asn Tyr Ile Pro Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser 465 470 475 480 acc act gtg act caa aac aac aac agc gaa ttt gct tgg cct gga gct 1488 Thr Thr Val Thr Gln Asn Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala 485 490 495 tct tct tgg gct ctc aat gga cgt aat agc ttg atg aat cct gga cct 1536 Ser Ser Trp Ala Leu Asn Gly Arg Asn Ser Leu Met Asn Pro Gly Pro 500 505 510 gct atg gcc agc cac aaa gaa gga gag gac cgt ttc ttt cct ttg tct 1584 Ala Met Ala Ser His Lys Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser 515 520 525 gga tct tta att ttt ggc aaa caa gga act gga aga gac aac gtg gat 1632 Gly Ser Leu Ile Phe Gly Lys Gln Gly Thr Gly Arg Asp Asn Val Asp 530 535 540 gcg gac aaa gtc atg ata acc aac gaa gaa gaa att aaa act act aac 1680 Ala Asp Lys Val Met Ile Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn 545 550 555 560 ccg gta gca acg gag tcc tat gga caa gtg gcc aca aac cac cag agt 1728 Pro Val Ala Thr Glu Ser Tyr Gly Gln Val Ala Thr Asn His Gln Ser 565 570 575 gcc caa gca cag gcg cag acc ggc tgg gtt caa aac caa gga ata ctt 1776 Ala Gln Ala Gln Ala Gln Thr Gly Trp Val Gln Asn Gln Gly Ile Leu 580 585 590 ccg ggt atg gtt tgg cag gac aga gat gtg tac ctg caa gga ccc att 1824 Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile 595 600 605 tgg gcc aaa att cct cac acg gac ggc aac ttt cac cct tct ccg ctg 1872 Trp Ala Lys Ile Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu 610 615 620 atg gga ggg ttt gga atg aag cac ccg cct cct cag atc ctc atc aaa 1920 Met Gly Gly Phe Gly Met Lys His Pro Pro Pro Gln Ile Leu Ile Lys 625 630 635 640 aac aca cct gta cct gcg gat cct cca acg gcc ttc aac aag gac aag 1968 Asn Thr Pro Val Pro Ala Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys 645 650 655 ctg aac tct ttc atc acc cag tat tct act ggc caa gtc agc gtg gag 2016 Leu Asn Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu 660 665 670 atc gag tgg gag ctg cag aag gaa aac agc aag cgc tgg aac ccg gag 2064 Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu 675 680 685 atc cag tac act tcc aac tat tac aag tct aat aat gtt gaa ttt gct 2112 Ile Gln Tyr Thr Ser Asn Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala 690 695 700 gtt aat act gaa ggt gta tat agt gaa ccc cgc ccc att ggc acc aga 2160 Val Asn Thr Glu Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg 705 710 715 720 tac ctg act cgt aat ctg 2178 Tyr Leu Thr Arg Asn Leu 725 <210> 10 <211> 726 <212> PRT <213> AAV5.5.9 <400> 10 Met Ser Phe Val Asp His Pro Pro Asp Trp Leu Glu Glu Val Gly Glu 1 5 10 15 Gly Leu Arg Glu Phe Leu Gly Leu Glu Ala Gly Pro Pro Lys Pro Lys 20 25 30 Pro Asn Gln Gln His Gln Asp Gln Ala Arg Gly Leu Val Leu Pro Gly 35 40 45 Tyr Asn Tyr Leu Gly Pro Gly Asn Gly Leu Asp Arg Gly Glu Pro Val 50 55 60 Asn Arg Ala Asp Glu Val Ala Arg Glu His Asp Ile Ser Tyr Asn Glu 65 70 75 80 Gln Leu Glu Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp 85 90 95 Ala Glu Phe Gln Glu Lys Leu Ala Asp Asp Thr Ser Phe Gly Gly Asn 100 105 110 Leu Gly Lys Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro Phe 115 120 125 Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg Ile 130 135 140 Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp Ser 145 150 155 160 Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser Gln 165 170 175 Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp Thr 180 185 190 Met Ala Ser Gly Gly Gly Ala Pro Val Ala Asp Asn Asn Glu Gly Ala 195 200 205 Asp Gly Val Gly Ser Ser Ser Gly Asn Trp His Cys Asp Ser Gln Trp 210 215 220 Leu Gly Asp Arg Val Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro 225 230 235 240 Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly 245 250 255 Gly Ser Ser Asn Asp Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly 260 265 270 Tyr Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp 275 280 285 Gln Arg Leu Ile Asn Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn 290 295 300 Phe Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Asp Asn Asn Gly 305 310 315 320 Val Lys Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr 325 330 335 Asp Ser Asp Tyr Gln Leu Pro Tyr Val Leu Gly Ser Ala His Glu Gly 340 345 350 Cys Leu Pro Pro Phe Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly 355 360 365 Tyr Leu Thr Leu Asn Asp Gly Ser Gln Ala Val Gly Arg Ser Ser Phe 370 375 380 Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn 385 390 395 400 Phe Gln Phe Ser Tyr Glu Phe Glu Asn Val Pro Phe His Ser Ser Tyr 405 410 415 Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln 420 425 430 Tyr Leu Tyr Tyr Leu Ser Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln 435 440 445 Gln Thr Leu Lys Phe Ser Val Ala Gly Pro Ser Asn Met Ala Val Gln 450 455 460 Gly Arg Asn Tyr Ile Pro Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser 465 470 475 480 Thr Thr Val Thr Gln Asn Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala 485 490 495 Ser Ser Trp Ala Leu Asn Gly Arg Asn Ser Leu Met Asn Pro Gly Pro 500 505 510 Ala Met Ala Ser His Lys Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser 515 520 525 Gly Ser Leu Ile Phe Gly Lys Gln Gly Thr Gly Arg Asp Asn Val Asp 530 535 540 Ala Asp Lys Val Met Ile Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn 545 550 555 560 Pro Val Ala Thr Glu Ser Tyr Gly Gln Val Ala Thr Asn His Gln Ser 565 570 575 Ala Gln Ala Gln Ala Gln Thr Gly Trp Val Gln Asn Gln Gly Ile Leu 580 585 590 Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile 595 600 605 Trp Ala Lys Ile Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu 610 615 620 Met Gly Gly Phe Gly Met Lys His Pro Pro Pro Gln Ile Leu Ile Lys 625 630 635 640 Asn Thr Pro Val Pro Ala Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys 645 650 655 Leu Asn Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu 660 665 670 Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu 675 680 685 Ile Gln Tyr Thr Ser Asn Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala 690 695 700 Val Asn Thr Glu Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg 705 710 715 720 Tyr Leu Thr Arg Asn Leu 725 <210> 11 <211> 2229 <212> DNA <213> AAVPHP.B <220> <221> CDS <222> (1)..(2229) <400> 11 atg gct gcc gat ggt tat ctt cca gat tgg ctc gag gac aac ctt agt 48 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 gaa gga att cgc gag tgg tgg gct ttg aaa cct gga gcc cct caa ccc 96 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 aag gca aat caa caa cat caa gac aac gct cga ggt ctt gtg ctt ccg 144 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 ggt tac aaa tac ctt gga ccc ggc aac gga ctc gac aag ggg gag ccg 192 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 gtc aac gca gca gac gcg gcg gcc ctc gag cac gac aag gcc tac gac 240 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 cag cag ctc aag gcc gga gac aac ccg tac ctc aag tac aac cac gcc 288 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 gac gcc gag ttc cag gag cgg ctc aaa gaa gat acg tct ttt ggg ggc 336 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 aac ctc ggg cga gca gtc ttc cag gcc aaa aag agg ctt ctt gaa cct 384 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 ctt ggt ctg gtt gag gaa gcg gct aag acg gct cct gga aag aag agg 432 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 cct gta gag cag tct cct cag gaa ccg gac tcc tcc gcg ggt att ggc 480 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 aaa tcg ggt gca cag ccc gct aaa aag aga ctc aat ttc ggt cag act 528 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 ggc gac aca gag tca gtc cca gac cct caa cca atc gga gaa cct ccc 576 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 gca gcc ccc tca ggt gtg gga tct ctt aca atg gct tca ggt ggt ggc 624 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 gca cca gtg gca gac aat aac gaa ggt gcc gat gga gtg ggt agt tcc 672 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 tcg gga aat tgg cat tgc gat tcc caa tgg ctg ggg gac aga gtc atc 720 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 acc acc agc acc cga acc tgg gcc ctg ccc acc tac aac aat cac ctc 768 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 tac aag caa atc tcc aac agc aca tct gga gga tct tca aat gac aac 816 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 gcc tac ttc ggc tac agc acc ccc tgg ggg tat ttt gac ttc aac aga 864 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 ttc cac tgc cac ttc tca cca cgt gac tgg cag cga ctc atc aac aac 912 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 aac tgg gga ttc cgg cct aag cga ctc aac ttc aag ctc ttc aac att 960 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 cag gtc aaa gag gtt acg gac aac aat gga gtc aag acc atc gcc aat 1008 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 aac ctt acc agc acg gtc cag gtc ttc acg gac tca gac tat cag ctc 1056 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 ccg tac gtg ctc ggg tcg gct cac gag ggc tgc ctc ccg ccg ttc cca 1104 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 gcg gac gtt ttc atg att cct cag tac ggg tat ctg acg ctt aat gat 1152 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 gga agc cag gcc gtg ggt cgt tcg tcc ttt tac tgc ctg gaa tat ttc 1200 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 ccg tcg caa atg cta aga acg ggt aac aac ttc cag ttc agc tac gag 1248 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 ttt gag aac gta cct ttc cat agc agc tac gct cac agc caa agc ctg 1296 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 gac cga cta atg aat cca ctc atc gac caa tac ttg tac tat ctc tct 1344 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 aga act att aac ggt tct gga cag aat caa caa acg cta aaa ttc agt 1392 Arg Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 gtg gcc gga ccc agc aac atg gct gtc cag gga aga aac tac ata cct 1440 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 gga ccc agc tac cga caa caa cgt gtc tca acc act gtg act caa aac 1488 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 aac aac agc gaa ttt gct tgg cct gga gct tct tct tgg gct ctc aat 1536 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 gga cgt aat agc ttg atg aat cct gga cct gct atg gcc agc cac aaa 1584 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 gaa gga gag gac cgt ttc ttt cct ttg tct gga tct tta att ttt ggc 1632 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 aaa caa ggt acc ggc aga gac aac gtg gat gcg gac aaa gtc atg ata 1680 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 acc aac gaa gaa gaa att aaa act act aac ccg gta gca acg gag tcc 1728 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 tat gga caa gtg gcc aca aac cac cag agt gcc caa act ttg gcg gtg 1776 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Thr Leu Ala Val 580 585 590 cct ttt aag gca cag gcg cag acc ggt tgg gtt caa aac caa gga ata 1824 Pro Phe Lys Ala Gln Ala Gln Thr Gly Trp Val Gln Asn Gln Gly Ile 595 600 605 ctt ccg ggt atg gtt tgg cag gac aga gat gtg tac ctg caa gga ccc 1872 Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro 610 615 620 att tgg gcc aaa att cct cac acg gac ggc aac ttt cac cct tct ccg 1920 Ile Trp Ala Lys Ile Pro His Thr Asp Gly Asn Phe His Pro Ser Pro 625 630 635 640 ctg atg gga ggg ttt gga atg aag cac ccg cct cct cag atc ctc atc 1968 Leu Met Gly Gly Phe Gly Met Lys His Pro Pro Pro Gln Ile Leu Ile 645 650 655 aaa aac aca cct gta cct gcg gat cct cca acg gcc ttc aac aag gac 2016 Lys Asn Thr Pro Val Pro Ala Asp Pro Pro Thr Ala Phe Asn Lys Asp 660 665 670 aag ctg aac tct ttc atc acc cag tat tct act ggc caa gtc agc gtg 2064 Lys Leu Asn Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val 675 680 685 gag atc gag tgg gag ctg cag aag gaa aac agc aag cgc tgg aac ccg 2112 Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro 690 695 700 gag atc cag tac act tcc aac tat tac aag tct aat aat gtt gaa ttt 2160 Glu Ile Gln Tyr Thr Ser Asn Tyr Tyr Lys Ser Asn Asn Val Glu Phe 705 710 715 720 gct gtt aat act gaa ggt gta tat agt gaa ccc cgc ccc att ggc acc 2208 Ala Val Asn Thr Glu Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr 725 730 735 aga tac ctg act cgt aat ctg 2229 Arg Tyr Leu Thr Arg Asn Leu 740 <210> 12 <211> 743 <212> PRT <213> AAVPHP.B <400> 12 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Arg Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Thr Leu Ala Val 580 585 590 Pro Phe Lys Ala Gln Ala Gln Thr Gly Trp Val Gln Asn Gln Gly Ile 595 600 605 Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro 610 615 620 Ile Trp Ala Lys Ile Pro His Thr Asp Gly Asn Phe His Pro Ser Pro 625 630 635 640 Leu Met Gly Gly Phe Gly Met Lys His Pro Pro Pro Gln Ile Leu Ile 645 650 655 Lys Asn Thr Pro Val Pro Ala Asp Pro Pro Thr Ala Phe Asn Lys Asp 660 665 670 Lys Leu Asn Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val 675 680 685 Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro 690 695 700 Glu Ile Gln Tyr Thr Ser Asn Tyr Tyr Lys Ser Asn Asn Val Glu Phe 705 710 715 720 Ala Val Asn Thr Glu Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr 725 730 735 Arg Tyr Leu Thr Arg Asn Leu 740 <210> 13 <211> 2208 <212> DNA <213> AAVhu68 <220> <221> CDS <222> (1)..(2208) <400> 13 atg gct gcc gat ggt tat ctt cca gat tgg ctc gag gac aac ctc agt 48 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 gaa ggc att cgc gag tgg tgg gct ttg aaa cct gga gcc cct caa ccc 96 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 aag gca aat caa caa cat caa gac aac gct cgg ggt ctt gtg ctt ccg 144 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 ggt tac aaa tac ctt gga ccc ggc aac gga ctc gac aag ggg gag ccg 192 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 gtc aac gaa gca gac gcg gcg gcc ctc gag cac gac aag gcc tac gac 240 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 cag cag ctc aag gcc gga gac aac ccg tac ctc aag tac aac cac gcc 288 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 gac gcc gag ttc cag gag cgg ctc aaa gaa gat acg tct ttt ggg ggc 336 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 aac ctc ggg cga gca gtc ttc cag gcc aaa aag agg ctt ctt gaa cct 384 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 ctt ggt ctg gtt gag gaa gcg gct aag acg gct cct gga aag aag agg 432 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 cct gta gag cag tct cct cag gaa ccg gac tcc tcc gtg ggt att ggc 480 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Val Gly Ile Gly 145 150 155 160 aaa tcg ggt gca cag ccc gct aaa aag aga ctc aat ttc ggt cag act 528 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 ggc gac aca gag tca gtc ccc gac cct caa cca atc gga gaa cct ccc 576 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 gca gcc ccc tca ggt gtg gga tct ctt aca atg gct tca ggt ggt ggc 624 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 gca cca gtg gca gac aat aac gaa ggt gcc gat gga gtg ggt agt tcc 672 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 tcg gga aat tgg cat tgc gat tcc caa tgg ctg ggg gac aga gtc atc 720 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 acc acc agc acc cga acc tgg gcc ctg ccc acc tac aac aat cac ctc 768 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 tac aag caa atc tcc aac agc aca tct gga gga tct tca aat gac aac 816 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 gcc tac ttc ggc tac agc acc ccc tgg ggg tat ttt gac ttc aac aga 864 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 ttc cac tgc cac ttc tca cca cgt gac tgg caa aga ctc atc aac aac 912 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 aac tgg gga ttc cgg cct aag cga ctc aac ttc aag ctc ttc aac att 960 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 cag gtc aaa gag gtt acg gac aac aat gga gtc aag acc atc gct aat 1008 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 aac ctt acc agc acg gtc cag gtc ttc acg gac tca gac tat cag ctc 1056 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 ccg tac gtg ctc ggg tcg gct cac gag ggc tgc ctc ccg ccg ttc cca 1104 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 gcg gac gtt ttc atg att cct cag tac ggg tat cta acg ctt aat gat 1152 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 gga agc caa gcc gtg ggt cgt tcg tcc ttt tac tgc ctg gaa tat ttc 1200 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 ccg tcg caa atg cta aga acg ggt aac aac ttc cag ttc agc tac gag 1248 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 ttt gag aac gta cct ttc cat agc agc tat gct cac agc caa agc ctg 1296 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 gac cga ctc atg aat cca ctc atc gac caa tac ttg tac tat ctc tca 1344 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 aag act att aac ggt tct gga cag aat caa caa acg cta aaa ttc agt 1392 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 gtg gcc gga ccc agc aac atg gct gtc cag gga aga aac tac ata cct 1440 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 gga ccc agc tac cga caa caa cgt gtc tca acc act gtg act caa aac 1488 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 aac aac agc gaa ttt gct tgg cct gga gct tct tct tgg gct ctc aat 1536 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 gga cgt aat agc ttg atg aat cct gga cct gct atg gcc agc cac aaa 1584 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 gaa gga gag gac cgt ttc ttt cct ttg tct gga tct tta att ttt ggc 1632 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 aaa caa gga act gga aga gac aac gtg gat gcg gac aaa gtc atg ata 1680 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 acc aac gaa gaa gaa att aaa act acc aac cca gta gca acg gag tcc 1728 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 tat gga caa gtg gcc aca aac cac cag agt gcc caa gca cag gcg cag 1776 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 acc ggc tgg gtt caa aac caa gga ata ctt ccg ggt atg gtt tgg cag 1824 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 gac aga gat gtg tac ctg caa gga ccc att tgg gcc aaa att cct cac 1872 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 acg gac ggc aac ttt cac cct tct ccg ctg atg gga ggg ttt gga atg 1920 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 aag cac ccg cct cct cag atc ctc atc aaa aac aca cct gta cct gcg 1968 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 gat cct cca acg gct ttc aac aag gac aag ctg aac tct ttc atc acc 2016 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 cag tat tct act ggc caa gtc agc gtg gag att gag tgg gag ctg cag 2064 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 aag gaa aac agc aag cgc tgg aac ccg gag atc cag tac act tcc aac 2112 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 tat tac aag tct aat aat gtt gaa ttt gct gtt aat act gaa ggt gtt 2160 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 tat tct gaa ccc cgc ccc att ggc acc aga tac ctg act cgt aat ctg 2208 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 14 <211> 736 <212> PRT <213> AAVhu68 <400> 14 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Val Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 15 <211> 2211 <212> DNA <213> AAV8T <220> <221> CDS <222> (1)..(2211) <400> 15 atg gct gcc gat ggt tat ctt cca gat tgg ctc gag gac aac ctc tct 48 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 gag ggc att cgc gag tgg tgg gcg ctg aaa cct gga gcc ccg aag ccc 96 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 aaa gcc aac cag caa aag cag gac gac ggc cgg ggt ctg gtg ctt cct 144 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 ggc tac aag tac ctc gga ccc ttc aac gga ctc gac aag ggg gag ccc 192 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 gtc aac gcg gcg gac gca gcg gcc ctc gag cac gac aag gcc tac gac 240 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 cag cag ctg cag gcg ggt gac aat ccg tac ctg cgg tat aac cac gcc 288 Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 gac gcc gag ttt cag gag cgt ctg caa gaa gat acg tct ttt ggg ggc 336 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 aac ctc ggg cga gca gtc ttc cag gcc aag aag cgg gtt ctc gaa cct 384 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 ctc ggt ctg gtt gag gaa ggc gct aag acg gct cct gga aag aag aga 432 Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 ccg gta gag cca tca ccc cag cgt tct cca gac tcc tct acg ggc atc 480 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 ggc aag aaa ggc caa cag ccc gcc aga aaa aga ctc aat ttt ggt cag 528 Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln 165 170 175 act ggc gac tca gag tca gtt cca gac cct caa cct ctc gga gaa cct 576 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro 180 185 190 cca gca gcg ccc tct ggt gtg gga cct aat aca atg gct gca ggc ggt 624 Pro Ala Ala Pro Ser Gly Val Gly Pro Asn Thr Met Ala Ala Gly Gly 195 200 205 ggc gca cca atg gca gac aat aac gaa ggc gcc gac gga gtg ggt agt 672 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 tcc tcg gga aat tgg cat tgc gat tcc aca tgg ctg ggc gac aga gtc 720 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 atc acc acc agc acc cga acc tgg gcc ctg ccc acc tac aac aac cac 768 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 ctc tac aag caa atc tcc tct ggt act cat gga gcc acc aac gac aac 816 Leu Tyr Lys Gln Ile Ser Ser Gly Thr His Gly Ala Thr Asn Asp Asn 260 265 270 acc tac ttc ggc tac agc acc ccc tgg ggg tat ttt gac ttt aac aga 864 Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 ttc cac tgc cac ttt tca cca cgt gac tgg cag cga ctc atc aac aac 912 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 aac tgg gga ttc cgg ccc aag aga ctc agc ttc aag ctc ttc aac atc 960 Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn Ile 305 310 315 320 cag gtc aag gag gtc acg cag aat gaa ggc acc aag acc atc gcc aat 1008 Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala Asn 325 330 335 aac ctc acc agc acc atc cag gtg ttt acg gac tcg gag tac cag ctg 1056 Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu 340 345 350 ccg tac gtt ctc ggc tct gcc cac cag ggc tgc ctg cct ccg ttc ccg 1104 Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro 355 360 365 gcg gac gtg ttc atg att ccc cag tac ggc tac cta aca ctc aac aac 1152 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn 370 375 380 ggt agt cag gcc gtg gga cgc tcc tcc ttc tac tgc ctg gaa tac ttt 1200 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 cct tcg cag atg ctg aga acc ggc aac aac ttc cag ttt act tac acc 1248 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Thr Tyr Thr 405 410 415 ttc gag gac gtg cct ttc cac agc agc tac gcc cac agc cag agc ttg 1296 Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 gac cgg ctg atg aat cct ctg att gac cag tac ctg tac tac ttg tct 1344 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 cgg act caa aca aca ggt ggg agt agg cct acg cag act ctg ggc ttc 1392 Arg Thr Gln Thr Thr Gly Gly Ser Arg Pro Thr Gln Thr Leu Gly Phe 450 455 460 agc caa ggt ggg cct aat aca atg gcc aat cag gca aag aac tgg ctg 1440 Ser Gln Gly Gly Pro Asn Thr Met Ala Asn Gln Ala Lys Asn Trp Leu 465 470 475 480 cca gga ccc tgt tac cgc caa caa cgc gtc tca acg aca acc ggg caa 1488 Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Thr Gly Gln 485 490 495 aac aac aat agc aac ttt gcc tgg act gct ggg acc aaa tac cat ctg 1536 Asn Asn Asn Ser Asn Phe Ala Trp Thr Ala Gly Thr Lys Tyr His Leu 500 505 510 aat gga aga aat tca ttg gct aat cct ggc atc gct atg gca aca cac 1584 Asn Gly Arg Asn Ser Leu Ala Asn Pro Gly Ile Ala Met Ala Thr His 515 520 525 aaa gac gac gag gag cgt ttt ttt ccc agt aac ggg atc ctg att ttt 1632 Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Asn Gly Ile Leu Ile Phe 530 535 540 ggc aaa caa aat gct gcc aga gac aat gcg gat tac agc gat gtc atg 1680 Gly Lys Gln Asn Ala Ala Arg Asp Asn Ala Asp Tyr Ser Asp Val Met 545 550 555 560 ctc acc agc gag gaa gaa atc aaa acc act aac cct gtg gct aca gag 1728 Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu 565 570 575 gaa tac ggt atc gtg ggt gat aac ttg cag ttg tat aac acg gct cct 1776 Glu Tyr Gly Ile Val Gly Asp Asn Leu Gln Leu Tyr Asn Thr Ala Pro 580 585 590 ggt tcg gtg ttt gtc aac agc cag ggg gcc tta ccc ggt atg gtc tgg 1824 Gly Ser Val Phe Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val Trp 595 600 605 cag aac cgg gac gtg tac ctg cag ggt ccc atc tgg gcc aag att cct 1872 Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro 610 615 620 cac acg gac ggc aac ttc cac ccg tct ccg ctg atg ggc ggc ttt ggc 1920 His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly 625 630 635 640 ctg aaa cat cct ccg cct cag atc ctg atc aag aac acg cct gta cct 1968 Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro 645 650 655 gcg gat cct ccg acc acc ttc aac cag tca aag ctg aac tct ttc atc 2016 Ala Asp Pro Pro Thr Thr Phe Asn Gln Ser Lys Leu Asn Ser Phe Ile 660 665 670 acg caa tac agc acc gga cag gtc agc gtg gaa att gaa tgg gag ctg 2064 Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu 675 680 685 cag aag gaa aac agc aag cgc tgg aac ccc gag atc cag tac acc tcc 2112 Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser 690 695 700 aac tac tac aaa tct aca agt gtg gac ttt gct gtt aat aca gaa ggc 2160 Asn Tyr Tyr Lys Ser Thr Ser Val Asp Phe Ala Val Asn Thr Glu Gly 705 710 715 720 gtg tac tct gaa ccc cgc ccc att ggc acc cgt tac ctc acc cgt aat 2208 Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn 725 730 735 ctg 2211 Leu <210> 16 <211> 737 <212> PRT <213> AAV8T <400> 16 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln 165 170 175 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro 180 185 190 Pro Ala Ala Pro Ser Gly Val Gly Pro Asn Thr Met Ala Ala Gly Gly 195 200 205 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 Leu Tyr Lys Gln Ile Ser Ser Gly Thr His Gly Ala Thr Asn Asp Asn 260 265 270 Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Thr Tyr Thr 405 410 415 Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Arg Thr Gln Thr Thr Gly Gly Ser Arg Pro Thr Gln Thr Leu Gly Phe 450 455 460 Ser Gln Gly Gly Pro Asn Thr Met Ala Asn Gln Ala Lys Asn Trp Leu 465 470 475 480 Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Thr Gly Gln 485 490 495 Asn Asn Asn Ser Asn Phe Ala Trp Thr Ala Gly Thr Lys Tyr His Leu 500 505 510 Asn Gly Arg Asn Ser Leu Ala Asn Pro Gly Ile Ala Met Ala Thr His 515 520 525 Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Asn Gly Ile Leu Ile Phe 530 535 540 Gly Lys Gln Asn Ala Ala Arg Asp Asn Ala Asp Tyr Ser Asp Val Met 545 550 555 560 Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu 565 570 575 Glu Tyr Gly Ile Val Gly Asp Asn Leu Gln Leu Tyr Asn Thr Ala Pro 580 585 590 Gly Ser Val Phe Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val Trp 595 600 605 Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro 610 615 620 His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly 625 630 635 640 Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro 645 650 655 Ala Asp Pro Pro Thr Thr Phe Asn Gln Ser Lys Leu Asn Ser Phe Ile 660 665 670 Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu 675 680 685 Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser 690 695 700 Asn Tyr Tyr Lys Ser Thr Ser Val Asp Phe Ala Val Asn Thr Glu Gly 705 710 715 720 Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn 725 730 735 Leu <210> 17 <211> 2214 <212> DNA <213> AAV8.AR2.08 <220> <221> CDS <222> (1)..(2214) <400> 17 atg gct gcc gat ggt tat ctt cca gat tgg ctc gag gac aac ctc tct 48 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 gag ggc att cgc gag tgg tgg gcg ctg aaa cct gga gcc ccg aag ccc 96 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 aaa gcc aac cag caa aag cag gac gac ggc cgg ggt ctg gtg ctt cct 144 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 ggc tac aag tac ctc gga ccc ttc aac gga ctc gac aag ggg gag ccc 192 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 gtc aac gcg gcg gac gca gcg gcc ctc gag cac gac aag gcc tac gac 240 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 cag cag ctg cag gcg ggt gac aat ccg tac ctg cgg tat aac cac gcc 288 Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 gac gcc gag ttt cag gag cgt ctg caa gaa gat acg tct ttt ggg ggc 336 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 aac ctc ggg cga gca gtc ttc cag gcc aag aag cgg gtt ctc gaa cct 384 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 ctc ggt ctg gtt gag gaa ggc gct aag acg gct cct gga aag aag aga 432 Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 ccg gta gag cca tca ccc cag cgt tct cca gac tcc tct acg ggc atc 480 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 ggc aag aaa ggc caa cag ccc gcc aga aaa aga ctc aat ttt ggt cag 528 Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln 165 170 175 act ggc gac tca gag tca gtt cca gac cct caa cct ctc gga gaa cct 576 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro 180 185 190 cca gca gcg ccc tct ggt gtg gga cct aat aca atg gct gca ggc ggt 624 Pro Ala Ala Pro Ser Gly Val Gly Pro Asn Thr Met Ala Ala Gly Gly 195 200 205 ggc gca cca atg gca gac aat aac gaa ggc gcc gac gga gtg ggt agt 672 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 tcc tcg gga aat tgg cat tgc gat tcc aca tgg ctg ggc gac aga gtc 720 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 atc acc acc agc acc cga acc tgg gcc ctg ccc acc tac aac aac cac 768 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 ctc tac aag caa atc tcc aac ggg aca tcg gga gga gcc acc aac gac 816 Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ala Thr Asn Asp 260 265 270 aac acc tac ttc ggc tac agc acc ccc tgg ggg tat ttt gac ttt aac 864 Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn 275 280 285 aga ttc cac tgc cac ttt tca cca cgt gac tgg cag cga ctc atc aac 912 Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn 290 295 300 aac aac tgg gga ttc cgg ccc aag aga ctc agc ttc aag ctc ttc aac 960 Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn 305 310 315 320 atc cag gtc aag gag gtc acg cag aat gaa ggc acc aag acc atc gcc 1008 Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala 325 330 335 aat aac ctc acc agc acc atc cag gtg ttt acg gac tcg gag tac cag 1056 Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln 340 345 350 ctg ccg tac gtt ctc ggc tct gcc cac cag ggc tgc ctg cct ccg ttc 1104 Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe 355 360 365 ccg gcg gac gtg ttc atg att ccc cag tac ggc tac cta aca ctc aac 1152 Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn 370 375 380 aac ggt agt cag gcc gtg gga cgc tcc tcc ttc tac tgc ctg gaa tac 1200 Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr 385 390 395 400 ttt cct tcg cag atg ctg aga acc ggc aac aac ttc cag ttt act tac 1248 Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Thr Tyr 405 410 415 acc ttc gag gac gtg cct ttc cac agc agc tac gcc cac agc cag agc 1296 Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser 420 425 430 ttg gac cgg ctg atg aat cct ctg att gac cag tac ctg tac tac ttg 1344 Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu 435 440 445 tct cgg act caa aca aca gga ggc acg gca aat acg cag act ctg ggc 1392 Ser Arg Thr Gln Thr Thr Gly Gly Thr Ala Asn Thr Gln Thr Leu Gly 450 455 460 ttc agc caa ggt ggg cct aat aca atg gcc aat cag gca aag aac tgg 1440 Phe Ser Gln Gly Gly Pro Asn Thr Met Ala Asn Gln Ala Lys Asn Trp 465 470 475 480 ctg cca gga ccc tgt tac cgc caa caa cgc gtc tca acg aca acc ggg 1488 Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Thr Gly 485 490 495 caa aac aac aat agc aac ttt gcc tgg act gct ggg acc aaa tac cat 1536 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Ala Gly Thr Lys Tyr His 500 505 510 ctg aat gga aga aat tca ttg gct aat cct ggc atc gct atg gca aca 1584 Leu Asn Gly Arg Asn Ser Leu Ala Asn Pro Gly Ile Ala Met Ala Thr 515 520 525 cac aaa gac gac gag gag cgt ttt ttt ccc agt aac ggg atc ctg att 1632 His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Asn Gly Ile Leu Ile 530 535 540 ttt ggc aaa caa aat gct gcc aga gac aat gcg gat tac agc gat gtc 1680 Phe Gly Lys Gln Asn Ala Ala Arg Asp Asn Ala Asp Tyr Ser Asp Val 545 550 555 560 atg ctc acc agc gag gaa gaa atc aaa acc act aac cct gtg gct aca 1728 Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr 565 570 575 gag gaa tac ggt atc gtg tgt gat aac ttg cag agt cgg aac acg gct 1776 Glu Glu Tyr Gly Ile Val Cys Asp Asn Leu Gln Ser Arg Asn Thr Ala 580 585 590 cct cgt gag gag att gtc aac agc cag ggg gcc tta ccc ggt atg gtc 1824 Pro Arg Glu Glu Ile Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val 595 600 605 tgg cag aac cgg gac gtg tac ctg cag ggt ccc atc tgg gcc aag att 1872 Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 610 615 620 cct cac acg gac ggc aac ttc cac ccg tct ccg ctg atg ggc ggc ttt 1920 Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe 625 630 635 640 ggc ctg aaa cat cct ccg cct cag atc ctg atc aag aac acg cct gta 1968 Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val 645 650 655 cct gcg gat cct ccg acc acc ttc aac cag tca aag ctg aac tct ttc 2016 Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ser Lys Leu Asn Ser Phe 660 665 670 atc acg caa tac agc acc gga cag gtc agc gtg gaa att gaa tgg gag 2064 Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu 675 680 685 ctg cag aag gaa aac agc aag cgc tgg aac ccc gag atc cag tac acc 2112 Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 690 695 700 tcc aac tac tac aaa tct aca agt gtg gac ttt gct gtt aat aca gaa 2160 Ser Asn Tyr Tyr Lys Ser Thr Ser Val Asp Phe Ala Val Asn Thr Glu 705 710 715 720 ggc gtg tac tct gaa ccc cgc ccc att ggc acc cgt tac ctc acc cgt 2208 Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 725 730 735 aat ctg 2214 Asn Leu <210> 18 <211> 738 <212> PRT <213> AAV8.AR2.08 <400> 18 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln 165 170 175 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro 180 185 190 Pro Ala Ala Pro Ser Gly Val Gly Pro Asn Thr Met Ala Ala Gly Gly 195 200 205 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ala Thr Asn Asp 260 265 270 Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn 275 280 285 Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn 290 295 300 Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn 305 310 315 320 Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala 325 330 335 Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln 340 345 350 Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe 355 360 365 Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn 370 375 380 Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr 385 390 395 400 Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Thr Tyr 405 410 415 Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser 420 425 430 Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu 435 440 445 Ser Arg Thr Gln Thr Thr Gly Gly Thr Ala Asn Thr Gln Thr Leu Gly 450 455 460 Phe Ser Gln Gly Gly Pro Asn Thr Met Ala Asn Gln Ala Lys Asn Trp 465 470 475 480 Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Thr Gly 485 490 495 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Ala Gly Thr Lys Tyr His 500 505 510 Leu Asn Gly Arg Asn Ser Leu Ala Asn Pro Gly Ile Ala Met Ala Thr 515 520 525 His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Asn Gly Ile Leu Ile 530 535 540 Phe Gly Lys Gln Asn Ala Ala Arg Asp Asn Ala Asp Tyr Ser Asp Val 545 550 555 560 Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr 565 570 575 Glu Glu Tyr Gly Ile Val Cys Asp Asn Leu Gln Ser Arg Asn Thr Ala 580 585 590 Pro Arg Glu Glu Ile Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val 595 600 605 Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 610 615 620 Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe 625 630 635 640 Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val 645 650 655 Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ser Lys Leu Asn Ser Phe 660 665 670 Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu 675 680 685 Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 690 695 700 Ser Asn Tyr Tyr Lys Ser Thr Ser Val Asp Phe Ala Val Asn Thr Glu 705 710 715 720 Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 725 730 735 Asn Leu <210> 19 <211> 2214 <212> DNA <213> AAV8 <220> <221> CDS <222> (1)..(2214) <400> 19 atg gct gcc gat ggt tat ctt cca gat tgg ctc gag gac aac ctc tct 48 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 gag ggc att cgc gag tgg tgg gcg ctg aaa cct gga gcc ccg aag ccc 96 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 aaa gcc aac cag caa aag cag gac gac ggc cgg ggt ctg gtg ctt cct 144 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 ggc tac aag tac ctc gga ccc ttc aac gga ctc gac aag ggg gag ccc 192 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 gtc aac gcg gcg gac gca gcg gcc ctc gag cac gac aag gcc tac gac 240 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 cag cag ctg cag gcg ggt gac aat ccg tac ctg cgg tat aac cac gcc 288 Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 gac gcc gag ttt cag gag cgt ctg caa gaa gat acg tct ttt ggg ggc 336 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 aac ctc ggg cga gca gtc ttc cag gcc aag aag cgg gtt ctc gaa cct 384 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 ctc ggt ctg gtt gag gaa ggc gct aag acg gct cct gga aag aag aga 432 Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 ccg gta gag cca tca ccc cag cgt tct cca gac tcc tct acg ggc atc 480 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 ggc aag aaa ggc caa cag ccc gcc aga aaa aga ctc aat ttt ggt cag 528 Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln 165 170 175 act ggc gac tca gag tca gtt cca gac cct caa cct ctc gga gaa cct 576 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro 180 185 190 cca gca gcg ccc tct ggt gtg gga cct aat aca atg gct gca ggc ggt 624 Pro Ala Ala Pro Ser Gly Val Gly Pro Asn Thr Met Ala Ala Gly Gly 195 200 205 ggc gca cca atg gca gac aat aac gaa ggc gcc gac gga gtg ggt agt 672 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 tcc tcg gga aat tgg cat tgc gat tcc aca tgg ctg ggc gac aga gtc 720 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 atc acc acc agc acc cga acc tgg gcc ctg ccc acc tac aac aac cac 768 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 ctc tac aag caa atc tcc aac ggg aca tcg gga gga gcc acc aac gac 816 Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ala Thr Asn Asp 260 265 270 aac acc tac ttc ggc tac agc acc ccc tgg ggg tat ttt gac ttt aac 864 Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn 275 280 285 aga ttc cac tgc cac ttt tca cca cgt gac tgg cag cga ctc atc aac 912 Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn 290 295 300 aac aac tgg gga ttc cgg ccc aag aga ctc agc ttc aag ctc ttc aac 960 Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn 305 310 315 320 atc cag gtc aag gag gtc acg cag aat gaa ggc acc aag acc atc gcc 1008 Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala 325 330 335 aat aac ctc acc agc acc atc cag gtg ttt acg gac tcg gag tac cag 1056 Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln 340 345 350 ctg ccg tac gtt ctc ggc tct gcc cac cag ggc tgc ctg cct ccg ttc 1104 Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe 355 360 365 ccg gcg gac gtg ttc atg att ccc cag tac ggc tac cta aca ctc aac 1152 Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn 370 375 380 aac ggt agt cag gcc gtg gga cgc tcc tcc ttc tac tgc ctg gaa tac 1200 Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr 385 390 395 400 ttt cct tcg cag atg ctg aga acc ggc aac aac ttc cag ttt act tac 1248 Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Thr Tyr 405 410 415 acc ttc gag gac gtg cct ttc cac agc agc tac gcc cac agc cag agc 1296 Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser 420 425 430 ttg gac cgg ctg atg aat cct ctg att gac cag tac ctg tac tac ttg 1344 Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu 435 440 445 tct cgg act caa aca aca gga ggc acg gca aat acg cag act ctg ggc 1392 Ser Arg Thr Gln Thr Thr Gly Gly Thr Ala Asn Thr Gln Thr Leu Gly 450 455 460 ttc agc caa ggt ggg cct aat aca atg gcc aat cag gca aag aac tgg 1440 Phe Ser Gln Gly Gly Pro Asn Thr Met Ala Asn Gln Ala Lys Asn Trp 465 470 475 480 ctg cca gga ccc tgt tac cgc caa caa cgc gtc tca acg aca acc ggg 1488 Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Thr Gly 485 490 495 caa aac aac aat agc aac ttt gcc tgg act gct ggg acc aaa tac cat 1536 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Ala Gly Thr Lys Tyr His 500 505 510 ctg aat gga aga aat tca ttg gct aat cct ggc atc gct atg gca aca 1584 Leu Asn Gly Arg Asn Ser Leu Ala Asn Pro Gly Ile Ala Met Ala Thr 515 520 525 cac aaa gac gac gag gag cgt ttt ttt ccc agt aac ggg atc ctg att 1632 His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Asn Gly Ile Leu Ile 530 535 540 ttt ggc aaa caa aat gct gcc aga gac aat gcg gat tac agc gat gtc 1680 Phe Gly Lys Gln Asn Ala Ala Arg Asp Asn Ala Asp Tyr Ser Asp Val 545 550 555 560 atg ctc acc agc gag gaa gaa atc aaa acc act aac cct gtg gct aca 1728 Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr 565 570 575 gag gaa tac ggt atc gtg gca gat aac ttg cag cag caa aac acg gct 1776 Glu Glu Tyr Gly Ile Val Ala Asp Asn Leu Gln Gln Gln Asn Thr Ala 580 585 590 cct caa att gga act gtc aac agc cag ggg gcc tta ccc ggt atg gtc 1824 Pro Gln Ile Gly Thr Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val 595 600 605 tgg cag aac cgg gac gtg tac ctg cag ggt ccc atc tgg gcc aag att 1872 Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 610 615 620 cct cac acg gac ggc aac ttc cac ccg tct ccg ctg atg ggc ggc ttt 1920 Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe 625 630 635 640 ggc ctg aaa cat cct ccg cct cag atc ctg atc aag aac acg cct gta 1968 Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val 645 650 655 cct gcg gat cct ccg acc acc ttc aac cag tca aag ctg aac tct ttc 2016 Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ser Lys Leu Asn Ser Phe 660 665 670 atc acg caa tac agc acc gga cag gtc agc gtg gaa att gaa tgg gag 2064 Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu 675 680 685 ctg cag aag gaa aac agc aag cgc tgg aac ccc gag atc cag tac acc 2112 Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 690 695 700 tcc aac tac tac aaa tct aca agt gtg gac ttt gct gtt aat aca gaa 2160 Ser Asn Tyr Tyr Lys Ser Thr Ser Val Asp Phe Ala Val Asn Thr Glu 705 710 715 720 ggc gtg tac tct gaa ccc cgc ccc att ggc acc cgt tac ctc acc cgt 2208 Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 725 730 735 aat ctg 2214 Asn Leu <210> 20 <211> 738 <212> PRT <213> AAV8 <400> 20 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln 165 170 175 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro 180 185 190 Pro Ala Ala Pro Ser Gly Val Gly Pro Asn Thr Met Ala Ala Gly Gly 195 200 205 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ala Thr Asn Asp 260 265 270 Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn 275 280 285 Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn 290 295 300 Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn 305 310 315 320 Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala 325 330 335 Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln 340 345 350 Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe 355 360 365 Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn 370 375 380 Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr 385 390 395 400 Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Thr Tyr 405 410 415 Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser 420 425 430 Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu 435 440 445 Ser Arg Thr Gln Thr Thr Gly Gly Thr Ala Asn Thr Gln Thr Leu Gly 450 455 460 Phe Ser Gln Gly Gly Pro Asn Thr Met Ala Asn Gln Ala Lys Asn Trp 465 470 475 480 Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Thr Gly 485 490 495 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Ala Gly Thr Lys Tyr His 500 505 510 Leu Asn Gly Arg Asn Ser Leu Ala Asn Pro Gly Ile Ala Met Ala Thr 515 520 525 His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Asn Gly Ile Leu Ile 530 535 540 Phe Gly Lys Gln Asn Ala Ala Arg Asp Asn Ala Asp Tyr Ser Asp Val 545 550 555 560 Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr 565 570 575 Glu Glu Tyr Gly Ile Val Ala Asp Asn Leu Gln Gln Gln Asn Thr Ala 580 585 590 Pro Gln Ile Gly Thr Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val 595 600 605 Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 610 615 620 Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe 625 630 635 640 Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val 645 650 655 Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ser Lys Leu Asn Ser Phe 660 665 670 Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu 675 680 685 Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 690 695 700 Ser Asn Tyr Tyr Lys Ser Thr Ser Val Asp Phe Ala Val Asn Thr Glu 705 710 715 720 Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 725 730 735 Asn Leu <210> 21 <211> 2214 <212> DNA <213> AAVhu37 <220> <221> CDS <222> (1)..(2214) <400> 21 atg gct gct gac ggt tat ctt cca gat tgg ctc gag gac aac ctc tct 48 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 gag ggc att cgc gag tgg tgg gac ctg aaa cct gga gcc ccc aag ccc 96 Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 aag gcc aac cag cag aag cag gac gac ggc cgg ggt ctg gtg ctt cct 144 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 ggc tac aag tac ctc gga ccc ttc aac gga ctc gac aag ggg gag ccc 192 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 gtc aac gcg gcg gac gca gcg gcc ctc gag cac gac aag gcc tac gac 240 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 cag cag ctc aaa gcg ggt gac aat ccg tac ctg cgg tat aac cac gcc 288 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 gac gcc gag ttt cag gag cgt ctg caa gaa gat acg tct ttt ggg ggc 336 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 aac ctc ggg cga gca gtc ttc cag gcc aag aag cgg gtt ctc gaa cct 384 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 ctc ggt ctg gtt gag gaa gct gct aag acg gct cct gga aag aag aga 432 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 ccg gta gaa ccg tca cct cag cgt tcc ccc gac tcc tcc acg ggc atc 480 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 ggc aag aaa ggc cag cag ccc gct aaa aag aga ctg aac ttt ggt cag 528 Gly Lys Lys Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln 165 170 175 act ggc gac tca gag tca gtc ccc gac cct caa cca atc gga gaa cca 576 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro 180 185 190 cca gca ggc ccc tct ggt ctg gga tct ggt aca atg gct gca ggc ggt 624 Pro Ala Gly Pro Ser Gly Leu Gly Ser Gly Thr Met Ala Ala Gly Gly 195 200 205 ggc gct cca atg gca gac aat aac gaa ggc gcc gac gga gtg ggt agt 672 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 tcc tca gga aat tgg cat tgc gat tcc aca tgg ctg ggc gac aga gtc 720 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 atc acc acc agc acc cga acc tgg gcc ctg ccc acc tac aac aac cac 768 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 ctc tac aag caa ata tcc aat ggg aca tcg gga gga agc acc aac gac 816 Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp 260 265 270 aac acc tac ttc ggc tac agc acc ccc tgg ggg tat ttt gac ttc aac 864 Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn 275 280 285 aga ttc cac tgc cac ttc tca cca cgt gac tgg cag cga ctc atc aac 912 Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn 290 295 300 aac aac tgg gga ttc cgg cca aaa aga ctc agc ttc aag ctc ttc aac 960 Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn 305 310 315 320 atc cag gtc aag gag gtc acg cag aat gaa ggc acc aag acc atc gcc 1008 Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala 325 330 335 aat aac ctt acc agc acg att cag gta ttt acg gac tcg gaa tac cag 1056 Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln 340 345 350 ctg ccg tac gtc ctc ggc tcc gcg cac cag ggc tgc ctg cct ccg ttc 1104 Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe 355 360 365 ccg gcg gac gtc ttc atg att ccc cag tac ggc tac ctt aca ctg aac 1152 Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn 370 375 380 aat gga agt caa gcc gta ggc cgt tcc tcc ttc tac tgc ctg gaa tat 1200 Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr 385 390 395 400 ttt cca tct caa atg ctg cga act gga aac aat ttt gaa ttc agc tac 1248 Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr 405 410 415 acc ttc gag gac gtg cct ttc cac agc agc tac gca cac agc cag agc 1296 Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser 420 425 430 ttg gac cga ctg atg aat cct ctc atc gac cag tac ctg tac tac tta 1344 Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu 435 440 445 tcc aga act cag tcc aca gga gga act caa ggt acc cag caa ttg tta 1392 Ser Arg Thr Gln Ser Thr Gly Gly Thr Gln Gly Thr Gln Gln Leu Leu 450 455 460 ttt tct caa gct ggg cct gca aac atg tcg gct cag gct aag aac tgg 1440 Phe Ser Gln Ala Gly Pro Ala Asn Met Ser Ala Gln Ala Lys Asn Trp 465 470 475 480 cta cct gga cct tgc tac cgg cag cag cga gtc tct acg aca ctg tcg 1488 Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser 485 490 495 caa aac aac aac agc aac ttt gct tgg act ggt gcc acc aaa tat cac 1536 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His 500 505 510 ctg aac gga aga gac tct ttg gta aat ccc ggt gtc gcc atg gca acc 1584 Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr 515 520 525 cac aag gac gac gag gaa cgc ttc ttc ccg tcg agt gga gtc ctg atg 1632 His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Ser Gly Val Leu Met 530 535 540 ttc gga aaa cag ggt gct gga aga gac aat gtg gac tac agc agc gtt 1680 Phe Gly Lys Gln Gly Ala Gly Arg Asp Asn Val Asp Tyr Ser Ser Val 545 550 555 560 atg cta acc agc gaa gaa gaa att aaa acc act aac ccc gta gcc aca 1728 Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr 565 570 575 gaa caa tac ggt gtg gtg gct gac aac ttg cag caa acc aat aca ggg 1776 Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln Gln Thr Asn Thr Gly 580 585 590 cct att gtg gga aat gtc aac agc caa gga gcc tta cct ggc atg gtc 1824 Pro Ile Val Gly Asn Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val 595 600 605 tgg cag aac cga gac gtg tac ctg cag ggt ccc atc tgg gcc aag att 1872 Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 610 615 620 cct cac acg gac ggc aac ttc cac cct tca ccg cta atg gga gga ttt 1920 Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe 625 630 635 640 gga ctg aag cac cca cct cct cag atc ctg atc aag aac acg ccg gta 1968 Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val 645 650 655 cct gcg gat cct cca aca acg ttc agc cag gcg aaa ttg gct tcc ttc 2016 Pro Ala Asp Pro Pro Thr Thr Phe Ser Gln Ala Lys Leu Ala Ser Phe 660 665 670 att acg cag tac agc acc gga cag gtc agc gtg gaa atc gag tgg gag 2064 Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu 675 680 685 ctg cag aag gag aac agc aaa cgc tgg aac cca gag att cag tac act 2112 Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 690 695 700 tca aac tac tac aaa tct aca aat gtg gac ttt gct gtc aat aca gag 2160 Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Glu 705 710 715 720 gga act tat tct gag cct cgc ccc att ggt act cgt tac ctc acc cgt 2208 Gly Thr Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 725 730 735 aat ctg 2214 Asn Leu <210> 22 <211> 738 <212> PRT <213> AAVhu37 <400> 22 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 Gly Lys Lys Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln 165 170 175 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro 180 185 190 Pro Ala Gly Pro Ser Gly Leu Gly Ser Gly Thr Met Ala Ala Gly Gly 195 200 205 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp 260 265 270 Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn 275 280 285 Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn 290 295 300 Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn 305 310 315 320 Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala 325 330 335 Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln 340 345 350 Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe 355 360 365 Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn 370 375 380 Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr 385 390 395 400 Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr 405 410 415 Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser 420 425 430 Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu 435 440 445 Ser Arg Thr Gln Ser Thr Gly Gly Thr Gln Gly Thr Gln Gln Leu Leu 450 455 460 Phe Ser Gln Ala Gly Pro Ala Asn Met Ser Ala Gln Ala Lys Asn Trp 465 470 475 480 Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser 485 490 495 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His 500 505 510 Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr 515 520 525 His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Ser Gly Val Leu Met 530 535 540 Phe Gly Lys Gln Gly Ala Gly Arg Asp Asn Val Asp Tyr Ser Ser Val 545 550 555 560 Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr 565 570 575 Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln Gln Thr Asn Thr Gly 580 585 590 Pro Ile Val Gly Asn Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val 595 600 605 Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 610 615 620 Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe 625 630 635 640 Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val 645 650 655 Pro Ala Asp Pro Pro Thr Thr Phe Ser Gln Ala Lys Leu Ala Ser Phe 660 665 670 Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu 675 680 685 Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 690 695 700 Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Glu 705 710 715 720 Gly Thr Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 725 730 735 Asn Leu <210> 23 <211> 2214 <212> DNA <213> AAVrh10 <220> <221> CDS <222> (1)..(2214) <400> 23 atg gct gcc gat ggt tat ctt cca gat tgg ctc gag gac aac ctc tct 48 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 gag ggc att cgc gag tgg tgg gac ttg aaa cct gga gcc ccg aaa ccc 96 Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 aaa gcc aac cag caa aag cag gac gac ggc cgg ggt ctg gtg ctt cct 144 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 ggc tac aag tac ctc gga ccc ttc aac gga ctc gac aag ggg gag ccc 192 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 gtc aac gcg gcg gac gca gcg gcc ctc gag cac gac aag gcc tac gac 240 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 cag cag ctc aaa gcg ggt gac aat ccg tac ctg cgg tat aac cac gcc 288 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 gac gcc gag ttt cag gag cgt ctg caa gaa gat acg tct ttt ggg ggc 336 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 aac ctc ggg cga gca gtc ttc cag gcc aag aag cgg gtt ctc gaa cct 384 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 ctc ggt ctg gtt gag gaa ggc gct aag acg gct cct gga aag aag aga 432 Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 ccg gta gag cca tca ccc cag cgt tct cca gac tcc tct acg ggc atc 480 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 ggc aag aaa ggc cag cag ccc gcg aaa aag aga ctc aac ttt ggg cag 528 Gly Lys Lys Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln 165 170 175 act ggc gac tca gag tca gtg ccc gac cct caa cca atc gga gaa ccc 576 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro 180 185 190 ccc gca ggc ccc tct ggt ctg gga tct ggt aca atg gct gca ggc ggt 624 Pro Ala Gly Pro Ser Gly Leu Gly Ser Gly Thr Met Ala Ala Gly Gly 195 200 205 ggc gct cca atg gca gac aat aac gaa ggc gcc gac gga gtg ggt agt 672 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 tcc tca gga aat tgg cat tgc gat tcc aca tgg ctg ggc gac aga gtc 720 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 atc acc acc agc acc cga acc tgg gcc ctc ccc acc tac aac aac cac 768 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 ctc tac aag caa atc tcc aac ggg act tcg gga gga agc acc aac gac 816 Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp 260 265 270 aac acc tac ttc ggc tac agc acc ccc tgg ggg tat ttt gac ttt aac 864 Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn 275 280 285 aga ttc cac tgc cac ttc tca cca cgt gac tgg cag cga ctc atc aac 912 Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn 290 295 300 aac aac tgg gga ttc cgg ccc aag aga ctc aac ttc aag ctc ttc aac 960 Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn 305 310 315 320 atc cag gtc aag gag gtc acg cag aat gaa ggc acc aag acc atc gcc 1008 Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala 325 330 335 aat aac ctt acc agc acg att cag gtc ttt acg gac tcg gaa tac cag 1056 Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln 340 345 350 ctc ccg tac gtc ctc ggc tct gcg cac cag ggc tgc ctg cct ccg ttc 1104 Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe 355 360 365 ccg gcg gac gtc ttc atg att cct cag tac ggg tac ctg act ctg aac 1152 Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn 370 375 380 aat ggc agt cag gcc gtg ggc cgt tcc tcc ttc tac tgc ctg gag tac 1200 Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr 385 390 395 400 ttt cct tct caa atg ctg aga acg ggc aac aac ttt gag ttc agc tac 1248 Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr 405 410 415 cag ttt gag gac gtg cct ttt cac agc agc tac gcg cac agc caa agc 1296 Gln Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser 420 425 430 ctg gac cgg ctg atg aac ccc ctc atc gac cag tac ctg tac tac ctg 1344 Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu 435 440 445 tct cgg act cag tcc acg gga ggt acc gca gga act cag cag ttg cta 1392 Ser Arg Thr Gln Ser Thr Gly Gly Thr Ala Gly Thr Gln Gln Leu Leu 450 455 460 ttt tct cag gcc ggg cct aat aac atg tcg gct cag gcc aaa aac tgg 1440 Phe Ser Gln Ala Gly Pro Asn Asn Met Ser Ala Gln Ala Lys Asn Trp 465 470 475 480 cta ccc ggg ccc tgc tac cgg cag caa cgc gtc tcc acg aca ctg tcg 1488 Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser 485 490 495 caa aat aac aac agc aac ttt gcc tgg acc ggt gcc acc aag tat cat 1536 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His 500 505 510 ctg aat ggc aga gac tct ctg gta aat ccc ggt gtc gct atg gca acc 1584 Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr 515 520 525 cac aag gac gac gaa gag cga ttt ttt ccg tcc agc gga gtc tta atg 1632 His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Ser Gly Val Leu Met 530 535 540 ttt ggg aaa cag gga gct gga aaa gac aac gtg gac tat agc agc gtt 1680 Phe Gly Lys Gln Gly Ala Gly Lys Asp Asn Val Asp Tyr Ser Ser Val 545 550 555 560 atg cta acc agt gag gaa gaa att aaa acc acc aac cca gtg gcc aca 1728 Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr 565 570 575 gaa cag tac ggc gtg gtg gcc gat aac ctg caa cag caa aac gcc gct 1776 Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln Gln Gln Asn Ala Ala 580 585 590 cct att gta ggg gcc gtc aac agt caa gga gcc tta cct ggc atg gtc 1824 Pro Ile Val Gly Ala Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val 595 600 605 tgg cag aac cgg gac gtg tac ctg cag ggt cct atc tgg gcc aag att 1872 Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 610 615 620 cct cac acg gac gga aac ttt cat ccc tcg ccg ctg atg gga ggc ttt 1920 Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe 625 630 635 640 gga ctg aaa cac ccg cct cct cag atc ctg att aag aat aca cct gtt 1968 Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val 645 650 655 ccc gcg gat cct cca act acc ttc agt caa gct aag ctg gcg tcg ttc 2016 Pro Ala Asp Pro Pro Thr Thr Phe Ser Gln Ala Lys Leu Ala Ser Phe 660 665 670 atc acg cag tac agc acc gga cag gtc agc gtg gaa att gaa tgg gag 2064 Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu 675 680 685 ctg cag aaa gaa aac agc aaa cgc tgg aac cca gag att caa tac act 2112 Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 690 695 700 tcc aac tac tac aaa tct aca aat gtg gac ttt gct gtt aac aca gat 2160 Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Asp 705 710 715 720 ggc act tat tct gag cct cgc ccc atc ggc acc cgt tac ctc acc cgt 2208 Gly Thr Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 725 730 735 aat ctg 2214 Asn Leu <210> 24 <211> 738 <212> PRT <213> AAVrh10 <400> 24 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 Gly Lys Lys Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln 165 170 175 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro 180 185 190 Pro Ala Gly Pro Ser Gly Leu Gly Ser Gly Thr Met Ala Ala Gly Gly 195 200 205 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp 260 265 270 Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn 275 280 285 Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn 290 295 300 Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn 305 310 315 320 Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala 325 330 335 Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln 340 345 350 Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe 355 360 365 Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn 370 375 380 Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr 385 390 395 400 Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr 405 410 415 Gln Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser 420 425 430 Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu 435 440 445 Ser Arg Thr Gln Ser Thr Gly Gly Thr Ala Gly Thr Gln Gln Leu Leu 450 455 460 Phe Ser Gln Ala Gly Pro Asn Asn Met Ser Ala Gln Ala Lys Asn Trp 465 470 475 480 Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser 485 490 495 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His 500 505 510 Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr 515 520 525 His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Ser Gly Val Leu Met 530 535 540 Phe Gly Lys Gln Gly Ala Gly Lys Asp Asn Val Asp Tyr Ser Ser Val 545 550 555 560 Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr 565 570 575 Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln Gln Gln Asn Ala Ala 580 585 590 Pro Ile Val Gly Ala Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val 595 600 605 Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 610 615 620 Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe 625 630 635 640 Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val 645 650 655 Pro Ala Asp Pro Pro Thr Thr Phe Ser Gln Ala Lys Leu Ala Ser Phe 660 665 670 Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu 675 680 685 Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 690 695 700 Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Asp 705 710 715 720 Gly Thr Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 725 730 735 Asn Leu <210> 25 <211> 33 <212> PRT <213> AAV9 <400> 25 Gln Arg Val Ser Thr Thr Val Thr Gln Asn Asn Asn Ser Glu Phe Ala 1 5 10 15 Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn Gly Arg Asn Ser Leu Met 20 25 30 Asn <210> 26 <211> 33 <212> PRT <213> AAV8 <400> 26 Gln Arg Val Ser Thr Thr Thr Gly Gln Asn Asn Asn Ser Asn Phe Ala 1 5 10 15 Trp Thr Ala Gly Thr Lys Tyr His Leu Asn Gly Arg Asn Ser Leu Ala 20 25 30 Asn <210> 27 <211> 33 <212> PRT <213> AAVrh10 <400> 27 Gln Arg Val Ser Thr Thr Leu Ser Gln Asn Asn Asn Ser Asn Phe Ala 1 5 10 15 Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly Arg Asp Ser Leu Val 20 25 30 Asn <210> 28 <211> 33 <212> PRT <213> AAV3B <400> 28 Gln Arg Leu Ser Lys Thr Ala Asn Asp Asn Asn Asn Ser Asn Phe Pro 1 5 10 15 Trp Thr Ala Ala Ser Lys Tyr His Leu Asn Gly Arg Asp Ser Leu Val 20 25 30 Asn <210> 29 <211> 33 <212> PRT <213> AAV2 <400> 29 Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn Asn Ser Glu Tyr Ser 1 5 10 15 Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly Arg Asp Ser Leu Val 20 25 30 Asn <210> 30 <211> 33 <212> PRT <213> AAV9 <400> 30 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 1 5 10 15 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 20 25 30 Asp <210> 31 <211> 33 <212> PRT <213> AAV8 <400> 31 Tyr Gly Ile Val Ala Asp Asn Leu Gln Gln Gln Asn Thr Ala Pro Gln 1 5 10 15 Ile Gly Thr Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val Trp Gln 20 25 30 Asn <210> 32 <211> 33 <212> PRT <213> AAVrh10 <400> 32 Tyr Gly Val Val Ala Asp Asn Leu Gln Gln Gln Asn Ala Ala Pro Ile 1 5 10 15 Val Gly Ala Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val Trp Gln 20 25 30 Asn <210> 33 <211> 33 <212> PRT <213> AAV3B <400> 33 Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr 1 5 10 15 Thr Arg Thr Val Asn Asp Gln Gly Ala Leu Pro Gly Met Val Trp Gln 20 25 30 Asp <210> 34 <211> 33 <212> PRT <213> AAV2 <400> 34 Tyr Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala 1 5 10 15 Thr Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln 20 25 30 Asp <210> 35 <211> 736 <212> PRT <213> AAV1 <400> 35 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly 145 150 155 160 Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro 180 185 190 Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His 260 265 270 Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe 275 280 285 His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn 290 295 300 Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln 305 310 315 320 Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn 325 330 335 Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro 340 345 350 Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala 355 360 365 Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly 370 375 380 Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro 385 390 395 400 Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe 405 410 415 Glu Glu Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp 420 425 430 Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg 435 440 445 Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser 450 455 460 Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro 465 470 475 480 Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn 485 490 495 Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn 500 505 510 Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys 515 520 525 Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly 530 535 540 Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile 545 550 555 560 Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg 565 570 575 Phe Gly Thr Val Ala Val Asn Phe Gln Ser Ser Ser Thr Asp Pro Ala 580 585 590 Thr Gly Asp Val His Ala Met Gly Ala Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu 625 630 635 640 Lys Asn Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn 690 695 700 Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu 705 710 715 720 Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu 725 730 735 <210> 36 <211> 736 <212> PRT <213> AAV3B <400> 36 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Val Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Arg Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly 145 150 155 160 Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro 180 185 190 Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr 435 440 445 Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser 450 455 460 Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro 465 470 475 480 Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn Asp Asn 485 490 495 Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn 500 505 510 Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly 530 535 540 Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile 545 550 555 560 Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln 565 570 575 Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr 580 585 590 Thr Arg Thr Val Asn Asp Gln Gly Ala Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu 625 630 635 640 Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 37 <211> 724 <212> PRT <213> AAV5 <400> 37 Met Ser Phe Val Asp His Pro Pro Asp Trp Leu Glu Glu Val Gly Glu 1 5 10 15 Gly Leu Arg Glu Phe Leu Gly Leu Glu Ala Gly Pro Pro Lys Pro Lys 20 25 30 Pro Asn Gln Gln His Gln Asp Gln Ala Arg Gly Leu Val Leu Pro Gly 35 40 45 Tyr Asn Tyr Leu Gly Pro Gly Asn Gly Leu Asp Arg Gly Glu Pro Val 50 55 60 Asn Arg Ala Asp Glu Val Ala Arg Glu His Asp Ile Ser Tyr Asn Glu 65 70 75 80 Gln Leu Glu Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp 85 90 95 Ala Glu Phe Gln Glu Lys Leu Ala Asp Asp Thr Ser Phe Gly Gly Asn 100 105 110 Leu Gly Lys Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro Phe 115 120 125 Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg Ile 130 135 140 Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp Ser 145 150 155 160 Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser Gln 165 170 175 Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp Thr 180 185 190 Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly Ala 195 200 205 Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr Trp 210 215 220 Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu Pro 225 230 235 240 Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val Asp 245 250 255 Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr 260 265 270 Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp Gln 275 280 285 Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg Val 290 295 300 Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser Thr 305 310 315 320 Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp 325 330 335 Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly Cys 340 345 350 Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly Tyr 355 360 365 Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser Ser 370 375 380 Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly Asn 385 390 395 400 Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser Ser 405 410 415 Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val Asp 420 425 430 Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val Gln 435 440 445 Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn Trp 450 455 460 Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser Gly 465 470 475 480 Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met Glu 485 490 495 Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met Thr 500 505 510 Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met Ile 515 520 525 Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu Glu 530 535 540 Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn Arg 545 550 555 560 Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser Ser 565 570 575 Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val Pro 580 585 590 Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp 595 600 605 Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala Met 610 615 620 Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys Asn 625 630 635 640 Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val Ser 645 650 655 Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met Glu 660 665 670 Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln 675 680 685 Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro Asp 690 695 700 Ser Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr Leu 705 710 715 720 Thr Arg Pro Leu <210> 38 <211> 737 <212> PRT <213> AAV7 <400> 38 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asn Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Ala Lys Lys Arg 130 135 140 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln 165 170 175 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro 180 185 190 Pro Ala Ala Pro Ser Ser Val Gly Ser Gly Thr Val Ala Ala Gly Gly 195 200 205 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn 210 215 220 Ala Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 Leu Tyr Lys Gln Ile Ser Ser Glu Thr Ala Gly Ser Thr Asn Asp Asn 260 265 270 Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Lys Leu Arg Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Ile Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn 370 375 380 Gly Ser Gln Ser Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr Ser 405 410 415 Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ala 435 440 445 Arg Thr Gln Ser Asn Pro Gly Gly Thr Ala Gly Asn Arg Glu Leu Gln 450 455 460 Phe Tyr Gln Gly Gly Pro Ser Thr Met Ala Glu Gln Ala Lys Asn Trp 465 470 475 480 Leu Pro Gly Pro Cys Phe Arg Gln Gln Arg Val Ser Lys Thr Leu Asp 485 490 495 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His 500 505 510 Leu Asn Gly Arg Asn Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr 515 520 525 His Lys Asp Asp Glu Asp Arg Phe Phe Pro Ser Ser Gly Val Leu Ile 530 535 540 Phe Gly Lys Thr Gly Ala Thr Asn Lys Thr Thr Leu Glu Asn Val Leu 545 550 555 560 Met Thr Asn Glu Glu Glu Ile Arg Pro Thr Asn Pro Val Ala Thr Glu 565 570 575 Glu Tyr Gly Ile Val Ser Ser Asn Leu Gln Ala Ala Asn Thr Ala Ala 580 585 590 Gln Thr Gln Val Val Asn Asn Gln Gly Ala Leu Pro Gly Met Val Trp 595 600 605 Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro 610 615 620 His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly 625 630 635 640 Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro 645 650 655 Ala Asn Pro Pro Glu Val Phe Thr Pro Ala Lys Phe Ala Ser Phe Ile 660 665 670 Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu 675 680 685 Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser 690 695 700 Asn Phe Glu Lys Gln Thr Gly Val Asp Phe Ala Val Asp Ser Gln Gly 705 710 715 720 Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn 725 730 735 Leu <210> 39 <211> 733 <212> PRT <213> AAVrh32.33 <400> 39 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Leu Glu Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly Lys 145 150 155 160 Lys Gly Lys Gln Pro Ala Lys Lys Arg Leu Asn Phe Glu Glu Asp Thr 165 170 175 Gly Ala Gly Asp Gly Pro Pro Glu Gly Ser Asp Thr Ser Ala Met Ser 180 185 190 Ser Asp Ile Glu Met Arg Ala Ala Pro Gly Gly Asn Ala Val Asp Ala 195 200 205 Gly Gln Gly Ser Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys 210 215 220 Asp Ser Thr Trp Ser Glu Gly Lys Val Thr Thr Thr Ser Thr Arg Thr 225 230 235 240 Trp Val Leu Pro Thr Tyr Asn Asn His Leu Tyr Leu Arg Leu Gly Thr 245 250 255 Thr Ser Asn Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp Gly Tyr 260 265 270 Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln 275 280 285 Arg Leu Ile Asn Asn Asn Trp Gly Leu Arg Pro Lys Ala Met Arg Val 290 295 300 Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Thr Ser Asn Gly Glu 305 310 315 320 Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Val Gln Ile Phe Ala Asp 325 330 335 Ser Ser Tyr Glu Leu Pro Tyr Val Met Asp Ala Gly Gln Glu Gly Ser 340 345 350 Leu Pro Pro Phe Pro Asn Asp Val Phe Met Val Pro Gln Tyr Gly Tyr 355 360 365 Cys Gly Ile Val Thr Gly Glu Asn Gln Asn Gln Thr Asp Arg Asn Ala 370 375 380 Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly Asn 385 390 395 400 Asn Phe Glu Met Ala Tyr Asn Phe Glu Lys Val Pro Phe His Ser Met 405 410 415 Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Leu Asp 420 425 430 Gln Tyr Leu Trp His Leu Gln Ser Thr Thr Ser Gly Glu Thr Leu Asn 435 440 445 Gln Gly Asn Ala Ala Thr Thr Phe Gly Lys Ile Arg Ser Gly Asp Phe 450 455 460 Ala Phe Tyr Arg Lys Asn Trp Leu Pro Gly Pro Cys Val Lys Gln Gln 465 470 475 480 Arg Phe Ser Lys Thr Ala Ser Gln Asn Tyr Lys Ile Pro Ala Ser Gly 485 490 495 Gly Asn Ala Leu Leu Lys Tyr Asp Thr His Tyr Thr Leu Asn Asn Arg 500 505 510 Trp Ser Asn Ile Ala Pro Gly Pro Pro Met Ala Thr Ala Gly Pro Ser 515 520 525 Asp Gly Asp Phe Ser Asn Ala Gln Leu Ile Phe Pro Gly Pro Ser Val 530 535 540 Thr Gly Asn Thr Thr Thr Ser Ala Asn Asn Leu Leu Phe Thr Ser Glu 545 550 555 560 Glu Glu Ile Ala Ala Thr Asn Pro Arg Asp Thr Asp Met Phe Gly Gln 565 570 575 Ile Ala Asp Asn Asn Gln Asn Ala Thr Thr Ala Pro Ile Thr Gly Asn 580 585 590 Val Thr Ala Met Gly Val Leu Pro Gly Met Val Trp Gln Asn Arg Asp 595 600 605 Ile Tyr Tyr Gln Gly Pro Ile Trp Ala Lys Ile Pro His Ala Asp Gly 610 615 620 His Phe His Pro Ser Pro Leu Ile Gly Gly Phe Gly Leu Lys His Pro 625 630 635 640 Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ala 645 650 655 Thr Thr Phe Thr Ala Ala Arg Val Asp Ser Phe Ile Thr Gln Tyr Ser 660 665 670 Thr Gly Gln Val Ala Val Gln Ile Glu Trp Glu Ile Glu Lys Glu Arg 675 680 685 Ser Lys Arg Trp Asn Pro Glu Val Gln Phe Thr Ser Asn Tyr Gly Asn 690 695 700 Gln Ser Ser Met Leu Trp Ala Pro Asp Thr Thr Gly Lys Tyr Thr Glu 705 710 715 720 Pro Arg Val Ile Gly Ser Arg Tyr Leu Thr Asn His Leu 725 730 <210> 40 <211> 2214 <212> DNA <213> Artificial Sequence <220> <223> AVV mutant 8G264AG515A <220> <221> CDS <222> (1)..(2214) <400> 40 atg gct gcc gat ggt tat ctt cca gat tgg ctc gag gac aac ctc tct 48 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 gag ggc att cgc gag tgg tgg gcg ctg aaa cct gga gcc ccg aag ccc 96 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 aaa gcc aac cag caa aag cag gac gac ggc cgg ggt ctg gtg ctt cct 144 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 ggc tac aag tac ctc gga ccc ttc aac gga ctc gac aag ggg gag ccc 192 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 gtc aac gcg gcg gac gca gcg gcc ctc gag cac gac aag gcc tac gac 240 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 cag cag ctg cag gcg ggt gac aat ccg tac ctg cgg tat aac cac gcc 288 Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 gac gcc gag ttt cag gag cgt ctg caa gaa gat acg tct ttt ggg ggc 336 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 aac ctc ggg cga gca gtc ttc cag gcc aag aag cgg gtt ctc gaa cct 384 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 ctc ggt ctg gtt gag gaa ggc gct aag acg gct cct gga aag aag aga 432 Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 ccg gta gag cca tca ccc cag cgt tct cca gac tcc tct acg ggc atc 480 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 ggc aag aaa ggc caa cag ccc gcc aga aaa aga ctc aat ttt ggt cag 528 Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln 165 170 175 act ggc gac tca gag tca gtt cca gac cct caa cct ctc gga gaa cct 576 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro 180 185 190 cca gca gcg ccc tct ggt gtg gga cct aat aca atg gct gca ggc ggt 624 Pro Ala Ala Pro Ser Gly Val Gly Pro Asn Thr Met Ala Ala Gly Gly 195 200 205 ggc gca cca atg gca gac aat aac gaa ggc gcc gac gga gtg ggt agt 672 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 tcc tcg gga aat tgg cat tgc gat tcc aca tgg ctg ggc gac aga gtc 720 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 atc acc acc agc acc cga acc tgg gcc ctg ccc acc tac aac aac cac 768 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 ctc tac aag caa atc tcc aac gcg aca tcg gga gga gcc acc aac gac 816 Leu Tyr Lys Gln Ile Ser Asn Ala Thr Ser Gly Gly Ala Thr Asn Asp 260 265 270 aac acc tac ttc ggc tac agc acc ccc tgg ggg tat ttt gac ttt aac 864 Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn 275 280 285 aga ttc cac tgc cac ttt tca cca cgt gac tgg cag cga ctc atc aac 912 Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn 290 295 300 aac aac tgg gga ttc cgg ccc aag aga ctc agc ttc aag ctc ttc aac 960 Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn 305 310 315 320 atc cag gtc aag gag gtc acg cag aat gaa ggc acc aag acc atc gcc 1008 Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala 325 330 335 aat aac ctc acc agc acc atc cag gtg ttt acg gac tcg gag tac cag 1056 Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln 340 345 350 ctg ccg tac gtt ctc ggc tct gcc cac cag ggc tgc ctg cct ccg ttc 1104 Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe 355 360 365 ccg gcg gac gtg ttc atg att ccc cag tac ggc tac cta aca ctc aac 1152 Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn 370 375 380 aac ggt agt cag gcc gtg gga cgc tcc tcc ttc tac tgc ctg gaa tac 1200 Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr 385 390 395 400 ttt cct tcg cag atg ctg aga acc ggc aac aac ttc cag ttt act tac 1248 Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Thr Tyr 405 410 415 acc ttc gag gac gtg cct ttc cac agc agc tac gcc cac agc cag agc 1296 Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser 420 425 430 ttg gac cgg ctg atg aat cct ctg att gac cag tac ctg tac tac ttg 1344 Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu 435 440 445 tct cgg act caa aca aca gga ggc acg gca aat acg cag act ctg ggc 1392 Ser Arg Thr Gln Thr Thr Gly Gly Thr Ala Asn Thr Gln Thr Leu Gly 450 455 460 ttc agc caa ggt ggg cct aat aca atg gcc aat cag gca aag aac tgg 1440 Phe Ser Gln Gly Gly Pro Asn Thr Met Ala Asn Gln Ala Lys Asn Trp 465 470 475 480 ctg cca gga ccc tgt tac cgc caa caa cgc gtc tca acg aca acc ggg 1488 Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Thr Gly 485 490 495 caa aac aac aat agc aac ttt gcc tgg act gct ggg acc aaa tac cat 1536 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Ala Gly Thr Lys Tyr His 500 505 510 ctg aat gca aga aat tca ttg gct aat cct ggc atc gct atg gca aca 1584 Leu Asn Ala Arg Asn Ser Leu Ala Asn Pro Gly Ile Ala Met Ala Thr 515 520 525 cac aaa gac gac gag gag cgt ttt ttt ccc agt aac ggg atc ctg att 1632 His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Asn Gly Ile Leu Ile 530 535 540 ttt ggc aaa caa aat gct gcc aga gac aat gcg gat tac agc gat gtc 1680 Phe Gly Lys Gln Asn Ala Ala Arg Asp Asn Ala Asp Tyr Ser Asp Val 545 550 555 560 atg ctc acc agc gag gaa gaa atc aaa acc act aac cct gtg gct aca 1728 Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr 565 570 575 gag gaa tac ggt atc gtg gca gat aac ttg cag cag caa aac acg gct 1776 Glu Glu Tyr Gly Ile Val Ala Asp Asn Leu Gln Gln Gln Asn Thr Ala 580 585 590 cct caa att gga act gtc aac agc cag ggg gcc tta ccc ggt atg gtc 1824 Pro Gln Ile Gly Thr Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val 595 600 605 tgg cag aac cgg gac gtg tac ctg cag ggt ccc atc tgg gcc aag att 1872 Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 610 615 620 cct cac acg gac ggc aac ttc cac ccg tct ccg ctg atg ggc ggc ttt 1920 Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe 625 630 635 640 ggc ctg aaa cat cct ccg cct cag atc ctg atc aag aac acg cct gta 1968 Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val 645 650 655 cct gcg gat cct ccg acc acc ttc aac cag tca aag ctg aac tct ttc 2016 Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ser Lys Leu Asn Ser Phe 660 665 670 atc acg caa tac agc acc gga cag gtc agc gtg gaa att gaa tgg gag 2064 Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu 675 680 685 ctg cag aag gaa aac agc aag cgc tgg aac ccc gag atc cag tac acc 2112 Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 690 695 700 tcc aac tac tac aaa tct aca agt gtg gac ttt gct gtt aat aca gaa 2160 Ser Asn Tyr Tyr Lys Ser Thr Ser Val Asp Phe Ala Val Asn Thr Glu 705 710 715 720 ggc gtg tac tct gaa ccc cgc ccc att ggc acc cgt tac ctc acc cgt 2208 Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 725 730 735 aat ctg 2214 Asn Leu <210> 41 <211> 738 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 41 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln 165 170 175 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro 180 185 190 Pro Ala Ala Pro Ser Gly Val Gly Pro Asn Thr Met Ala Ala Gly Gly 195 200 205 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 Leu Tyr Lys Gln Ile Ser Asn Ala Thr Ser Gly Gly Ala Thr Asn Asp 260 265 270 Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn 275 280 285 Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn 290 295 300 Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn 305 310 315 320 Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala 325 330 335 Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln 340 345 350 Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe 355 360 365 Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn 370 375 380 Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr 385 390 395 400 Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Thr Tyr 405 410 415 Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser 420 425 430 Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu 435 440 445 Ser Arg Thr Gln Thr Thr Gly Gly Thr Ala Asn Thr Gln Thr Leu Gly 450 455 460 Phe Ser Gln Gly Gly Pro Asn Thr Met Ala Asn Gln Ala Lys Asn Trp 465 470 475 480 Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Thr Gly 485 490 495 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Ala Gly Thr Lys Tyr His 500 505 510 Leu Asn Ala Arg Asn Ser Leu Ala Asn Pro Gly Ile Ala Met Ala Thr 515 520 525 His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Asn Gly Ile Leu Ile 530 535 540 Phe Gly Lys Gln Asn Ala Ala Arg Asp Asn Ala Asp Tyr Ser Asp Val 545 550 555 560 Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr 565 570 575 Glu Glu Tyr Gly Ile Val Ala Asp Asn Leu Gln Gln Gln Asn Thr Ala 580 585 590 Pro Gln Ile Gly Thr Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val 595 600 605 Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 610 615 620 Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe 625 630 635 640 Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val 645 650 655 Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ser Lys Leu Asn Ser Phe 660 665 670 Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu 675 680 685 Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 690 695 700 Ser Asn Tyr Tyr Lys Ser Thr Ser Val Asp Phe Ala Val Asn Thr Glu 705 710 715 720 Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 725 730 735 Asn Leu <210> 42 <211> 2214 <212> DNA <213> Artificial Sequence <220> <223> AVV mutant 8G264AG541A <220> <221> CDS <222> (1)..(2214) <400> 42 atg gct gcc gat ggt tat ctt cca gat tgg ctc gag gac aac ctc tct 48 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 gag ggc att cgc gag tgg tgg gcg ctg aaa cct gga gcc ccg aag ccc 96 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 aaa gcc aac cag caa aag cag gac gac ggc cgg ggt ctg gtg ctt cct 144 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 ggc tac aag tac ctc gga ccc ttc aac gga ctc gac aag ggg gag ccc 192 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 gtc aac gcg gcg gac gca gcg gcc ctc gag cac gac aag gcc tac gac 240 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 cag cag ctg cag gcg ggt gac aat ccg tac ctg cgg tat aac cac gcc 288 Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 gac gcc gag ttt cag gag cgt ctg caa gaa gat acg tct ttt ggg ggc 336 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 aac ctc ggg cga gca gtc ttc cag gcc aag aag cgg gtt ctc gaa cct 384 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 ctc ggt ctg gtt gag gaa ggc gct aag acg gct cct gga aag aag aga 432 Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 ccg gta gag cca tca ccc cag cgt tct cca gac tcc tct acg ggc atc 480 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 ggc aag aaa ggc caa cag ccc gcc aga aaa aga ctc aat ttt ggt cag 528 Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln 165 170 175 act ggc gac tca gag tca gtt cca gac cct caa cct ctc gga gaa cct 576 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro 180 185 190 cca gca gcg ccc tct ggt gtg gga cct aat aca atg gct gca ggc ggt 624 Pro Ala Ala Pro Ser Gly Val Gly Pro Asn Thr Met Ala Ala Gly Gly 195 200 205 ggc gca cca atg gca gac aat aac gaa ggc gcc gac gga gtg ggt agt 672 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 tcc tcg gga aat tgg cat tgc gat tcc aca tgg ctg ggc gac aga gtc 720 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 atc acc acc agc acc cga acc tgg gcc ctg ccc acc tac aac aac cac 768 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 ctc tac aag caa atc tcc aac gcg aca tcg gga gga gcc acc aac gac 816 Leu Tyr Lys Gln Ile Ser Asn Ala Thr Ser Gly Gly Ala Thr Asn Asp 260 265 270 aac acc tac ttc ggc tac agc acc ccc tgg ggg tat ttt gac ttt aac 864 Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn 275 280 285 aga ttc cac tgc cac ttt tca cca cgt gac tgg cag cga ctc atc aac 912 Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn 290 295 300 aac aac tgg gga ttc cgg ccc aag aga ctc agc ttc aag ctc ttc aac 960 Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn 305 310 315 320 atc cag gtc aag gag gtc acg cag aat gaa ggc acc aag acc atc gcc 1008 Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala 325 330 335 aat aac ctc acc agc acc atc cag gtg ttt acg gac tcg gag tac cag 1056 Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln 340 345 350 ctg ccg tac gtt ctc ggc tct gcc cac cag ggc tgc ctg cct ccg ttc 1104 Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe 355 360 365 ccg gcg gac gtg ttc atg att ccc cag tac ggc tac cta aca ctc aac 1152 Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn 370 375 380 aac ggt agt cag gcc gtg gga cgc tcc tcc ttc tac tgc ctg gaa tac 1200 Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr 385 390 395 400 ttt cct tcg cag atg ctg aga acc ggc aac aac ttc cag ttt act tac 1248 Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Thr Tyr 405 410 415 acc ttc gag gac gtg cct ttc cac agc agc tac gcc cac agc cag agc 1296 Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser 420 425 430 ttg gac cgg ctg atg aat cct ctg att gac cag tac ctg tac tac ttg 1344 Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu 435 440 445 tct cgg act caa aca aca gga ggc acg gca aat acg cag act ctg ggc 1392 Ser Arg Thr Gln Thr Thr Gly Gly Thr Ala Asn Thr Gln Thr Leu Gly 450 455 460 ttc agc caa ggt ggg cct aat aca atg gcc aat cag gca aag aac tgg 1440 Phe Ser Gln Gly Gly Pro Asn Thr Met Ala Asn Gln Ala Lys Asn Trp 465 470 475 480 ctg cca gga ccc tgt tac cgc caa caa cgc gtc tca acg aca acc ggg 1488 Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Thr Gly 485 490 495 caa aac aac aat agc aac ttt gcc tgg act gct ggg acc aaa tac cat 1536 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Ala Gly Thr Lys Tyr His 500 505 510 ctg aat gga aga aat tca ttg gct aat cct ggc atc gct atg gca aca 1584 Leu Asn Gly Arg Asn Ser Leu Ala Asn Pro Gly Ile Ala Met Ala Thr 515 520 525 cac aaa gac gac gag gag cgt ttt ttt ccc agt aac gcg atc ctg att 1632 His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Asn Ala Ile Leu Ile 530 535 540 ttt ggc aaa caa aat gct gcc aga gac aat gcg gat tac agc gat gtc 1680 Phe Gly Lys Gln Asn Ala Ala Arg Asp Asn Ala Asp Tyr Ser Asp Val 545 550 555 560 atg ctc acc agc gag gaa gaa atc aaa acc act aac cct gtg gct aca 1728 Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr 565 570 575 gag gaa tac ggt atc gtg gca gat aac ttg cag cag caa aac acg gct 1776 Glu Glu Tyr Gly Ile Val Ala Asp Asn Leu Gln Gln Gln Asn Thr Ala 580 585 590 cct caa att gga act gtc aac agc cag ggg gcc tta ccc ggt atg gtc 1824 Pro Gln Ile Gly Thr Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val 595 600 605 tgg cag aac cgg gac gtg tac ctg cag ggt ccc atc tgg gcc aag att 1872 Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 610 615 620 cct cac acg gac ggc aac ttc cac ccg tct ccg ctg atg ggc ggc ttt 1920 Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe 625 630 635 640 ggc ctg aaa cat cct ccg cct cag atc ctg atc aag aac acg cct gta 1968 Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val 645 650 655 cct gcg gat cct ccg acc acc ttc aac cag tca aag ctg aac tct ttc 2016 Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ser Lys Leu Asn Ser Phe 660 665 670 atc acg caa tac agc acc gga cag gtc agc gtg gaa att gaa tgg gag 2064 Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu 675 680 685 ctg cag aag gaa aac agc aag cgc tgg aac ccc gag atc cag tac acc 2112 Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 690 695 700 tcc aac tac tac aaa tct aca agt gtg gac ttt gct gtt aat aca gaa 2160 Ser Asn Tyr Tyr Lys Ser Thr Ser Val Asp Phe Ala Val Asn Thr Glu 705 710 715 720 ggc gtg tac tct gaa ccc cgc ccc att ggc acc cgt tac ctc acc cgt 2208 Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 725 730 735 aat ctg 2214 Asn Leu <210> 43 <211> 738 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 43 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln 165 170 175 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro 180 185 190 Pro Ala Ala Pro Ser Gly Val Gly Pro Asn Thr Met Ala Ala Gly Gly 195 200 205 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 Leu Tyr Lys Gln Ile Ser Asn Ala Thr Ser Gly Gly Ala Thr Asn Asp 260 265 270 Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn 275 280 285 Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn 290 295 300 Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn 305 310 315 320 Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala 325 330 335 Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln 340 345 350 Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe 355 360 365 Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn 370 375 380 Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr 385 390 395 400 Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Thr Tyr 405 410 415 Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser 420 425 430 Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu 435 440 445 Ser Arg Thr Gln Thr Thr Gly Gly Thr Ala Asn Thr Gln Thr Leu Gly 450 455 460 Phe Ser Gln Gly Gly Pro Asn Thr Met Ala Asn Gln Ala Lys Asn Trp 465 470 475 480 Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Thr Gly 485 490 495 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Ala Gly Thr Lys Tyr His 500 505 510 Leu Asn Gly Arg Asn Ser Leu Ala Asn Pro Gly Ile Ala Met Ala Thr 515 520 525 His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Asn Ala Ile Leu Ile 530 535 540 Phe Gly Lys Gln Asn Ala Ala Arg Asp Asn Ala Asp Tyr Ser Asp Val 545 550 555 560 Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr 565 570 575 Glu Glu Tyr Gly Ile Val Ala Asp Asn Leu Gln Gln Gln Asn Thr Ala 580 585 590 Pro Gln Ile Gly Thr Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val 595 600 605 Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 610 615 620 Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe 625 630 635 640 Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val 645 650 655 Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ser Lys Leu Asn Ser Phe 660 665 670 Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu 675 680 685 Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 690 695 700 Ser Asn Tyr Tyr Lys Ser Thr Ser Val Asp Phe Ala Val Asn Thr Glu 705 710 715 720 Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 725 730 735 Asn Leu <210> 44 <211> 2214 <212> DNA <213> Artificial Sequence <220> <223> AVV mutant 8G515AG541A <220> <221> CDS <222> (1)..(2214) <400> 44 atg gct gcc gat ggt tat ctt cca gat tgg ctc gag gac aac ctc tct 48 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 gag ggc att cgc gag tgg tgg gcg ctg aaa cct gga gcc ccg aag ccc 96 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 aaa gcc aac cag caa aag cag gac gac ggc cgg ggt ctg gtg ctt cct 144 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 ggc tac aag tac ctc gga ccc ttc aac gga ctc gac aag ggg gag ccc 192 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 gtc aac gcg gcg gac gca gcg gcc ctc gag cac gac aag gcc tac gac 240 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 cag cag ctg cag gcg ggt gac aat ccg tac ctg cgg tat aac cac gcc 288 Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 gac gcc gag ttt cag gag cgt ctg caa gaa gat acg tct ttt ggg ggc 336 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 aac ctc ggg cga gca gtc ttc cag gcc aag aag cgg gtt ctc gaa cct 384 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 ctc ggt ctg gtt gag gaa ggc gct aag acg gct cct gga aag aag aga 432 Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 ccg gta gag cca tca ccc cag cgt tct cca gac tcc tct acg ggc atc 480 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 ggc aag aaa ggc caa cag ccc gcc aga aaa aga ctc aat ttt ggt cag 528 Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln 165 170 175 act ggc gac tca gag tca gtt cca gac cct caa cct ctc gga gaa cct 576 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro 180 185 190 cca gca gcg ccc tct ggt gtg gga cct aat aca atg gct gca ggc ggt 624 Pro Ala Ala Pro Ser Gly Val Gly Pro Asn Thr Met Ala Ala Gly Gly 195 200 205 ggc gca cca atg gca gac aat aac gaa ggc gcc gac gga gtg ggt agt 672 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 tcc tcg gga aat tgg cat tgc gat tcc aca tgg ctg ggc gac aga gtc 720 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 atc acc acc agc acc cga acc tgg gcc ctg ccc acc tac aac aac cac 768 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 ctc tac aag caa atc tcc aac ggg aca tcg gga gga gcc acc aac gac 816 Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ala Thr Asn Asp 260 265 270 aac acc tac ttc ggc tac agc acc ccc tgg ggg tat ttt gac ttt aac 864 Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn 275 280 285 aga ttc cac tgc cac ttt tca cca cgt gac tgg cag cga ctc atc aac 912 Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn 290 295 300 aac aac tgg gga ttc cgg ccc aag aga ctc agc ttc aag ctc ttc aac 960 Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn 305 310 315 320 atc cag gtc aag gag gtc acg cag aat gaa ggc acc aag acc atc gcc 1008 Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala 325 330 335 aat aac ctc acc agc acc atc cag gtg ttt acg gac tcg gag tac cag 1056 Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln 340 345 350 ctg ccg tac gtt ctc ggc tct gcc cac cag ggc tgc ctg cct ccg ttc 1104 Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe 355 360 365 ccg gcg gac gtg ttc atg att ccc cag tac ggc tac cta aca ctc aac 1152 Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn 370 375 380 aac ggt agt cag gcc gtg gga cgc tcc tcc ttc tac tgc ctg gaa tac 1200 Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr 385 390 395 400 ttt cct tcg cag atg ctg aga acc ggc aac aac ttc cag ttt act tac 1248 Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Thr Tyr 405 410 415 acc ttc gag gac gtg cct ttc cac agc agc tac gcc cac agc cag agc 1296 Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser 420 425 430 ttg gac cgg ctg atg aat cct ctg att gac cag tac ctg tac tac ttg 1344 Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu 435 440 445 tct cgg act caa aca aca gga ggc acg gca aat acg cag act ctg ggc 1392 Ser Arg Thr Gln Thr Thr Gly Gly Thr Ala Asn Thr Gln Thr Leu Gly 450 455 460 ttc agc caa ggt ggg cct aat aca atg gcc aat cag gca aag aac tgg 1440 Phe Ser Gln Gly Gly Pro Asn Thr Met Ala Asn Gln Ala Lys Asn Trp 465 470 475 480 ctg cca gga ccc tgt tac cgc caa caa cgc gtc tca acg aca acc ggg 1488 Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Thr Gly 485 490 495 caa aac aac aat agc aac ttt gcc tgg act gct ggg acc aaa tac cat 1536 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Ala Gly Thr Lys Tyr His 500 505 510 ctg aat gca aga aat tca ttg gct aat cct ggc atc gct atg gca aca 1584 Leu Asn Ala Arg Asn Ser Leu Ala Asn Pro Gly Ile Ala Met Ala Thr 515 520 525 cac aaa gac gac gag gag cgt ttt ttt ccc agt aac gcg atc ctg att 1632 His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Asn Ala Ile Leu Ile 530 535 540 ttt ggc aaa caa aat gct gcc aga gac aat gcg gat tac agc gat gtc 1680 Phe Gly Lys Gln Asn Ala Ala Arg Asp Asn Ala Asp Tyr Ser Asp Val 545 550 555 560 atg ctc acc agc gag gaa gaa atc aaa acc act aac cct gtg gct aca 1728 Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr 565 570 575 gag gaa tac ggt atc gtg gca gat aac ttg cag cag caa aac acg gct 1776 Glu Glu Tyr Gly Ile Val Ala Asp Asn Leu Gln Gln Gln Asn Thr Ala 580 585 590 cct caa att gga act gtc aac agc cag ggg gcc tta ccc ggt atg gtc 1824 Pro Gln Ile Gly Thr Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val 595 600 605 tgg cag aac cgg gac gtg tac ctg cag ggt ccc atc tgg gcc aag att 1872 Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 610 615 620 cct cac acg gac ggc aac ttc cac ccg tct ccg ctg atg ggc ggc ttt 1920 Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe 625 630 635 640 ggc ctg aaa cat cct ccg cct cag atc ctg atc aag aac acg cct gta 1968 Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val 645 650 655 cct gcg gat cct ccg acc acc ttc aac cag tca aag ctg aac tct ttc 2016 Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ser Lys Leu Asn Ser Phe 660 665 670 atc acg caa tac agc acc gga cag gtc agc gtg gaa att gaa tgg gag 2064 Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu 675 680 685 ctg cag aag gaa aac agc aag cgc tgg aac ccc gag atc cag tac acc 2112 Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 690 695 700 tcc aac tac tac aaa tct aca agt gtg gac ttt gct gtt aat aca gaa 2160 Ser Asn Tyr Tyr Lys Ser Thr Ser Val Asp Phe Ala Val Asn Thr Glu 705 710 715 720 ggc gtg tac tct gaa ccc cgc ccc att ggc acc cgt tac ctc acc cgt 2208 Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 725 730 735 aat ctg 2214 Asn Leu <210> 45 <211> 738 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 45 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln 165 170 175 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro 180 185 190 Pro Ala Ala Pro Ser Gly Val Gly Pro Asn Thr Met Ala Ala Gly Gly 195 200 205 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ala Thr Asn Asp 260 265 270 Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn 275 280 285 Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn 290 295 300 Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn 305 310 315 320 Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala 325 330 335 Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln 340 345 350 Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe 355 360 365 Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn 370 375 380 Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr 385 390 395 400 Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Thr Tyr 405 410 415 Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser 420 425 430 Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu 435 440 445 Ser Arg Thr Gln Thr Thr Gly Gly Thr Ala Asn Thr Gln Thr Leu Gly 450 455 460 Phe Ser Gln Gly Gly Pro Asn Thr Met Ala Asn Gln Ala Lys Asn Trp 465 470 475 480 Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Thr Gly 485 490 495 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Ala Gly Thr Lys Tyr His 500 505 510 Leu Asn Ala Arg Asn Ser Leu Ala Asn Pro Gly Ile Ala Met Ala Thr 515 520 525 His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Asn Ala Ile Leu Ile 530 535 540 Phe Gly Lys Gln Asn Ala Ala Arg Asp Asn Ala Asp Tyr Ser Asp Val 545 550 555 560 Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr 565 570 575 Glu Glu Tyr Gly Ile Val Ala Asp Asn Leu Gln Gln Gln Asn Thr Ala 580 585 590 Pro Gln Ile Gly Thr Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val 595 600 605 Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 610 615 620 Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe 625 630 635 640 Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val 645 650 655 Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ser Lys Leu Asn Ser Phe 660 665 670 Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu 675 680 685 Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 690 695 700 Ser Asn Tyr Tyr Lys Ser Thr Ser Val Asp Phe Ala Val Asn Thr Glu 705 710 715 720 Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 725 730 735 Asn Leu <210> 46 <211> 2214 <212> DNA <213> Artificial Sequence <220> <223> AVV mutant 8G264AG515AG541A <220> <221> CDS <222> (1)..(2214) <400> 46 atg gct gcc gat ggt tat ctt cca gat tgg ctc gag gac aac ctc tct 48 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 gag ggc att cgc gag tgg tgg gcg ctg aaa cct gga gcc ccg aag ccc 96 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 aaa gcc aac cag caa aag cag gac gac ggc cgg ggt ctg gtg ctt cct 144 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 ggc tac aag tac ctc gga ccc ttc aac gga ctc gac aag ggg gag ccc 192 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 gtc aac gcg gcg gac gca gcg gcc ctc gag cac gac aag gcc tac gac 240 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 cag cag ctg cag gcg ggt gac aat ccg tac ctg cgg tat aac cac gcc 288 Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 gac gcc gag ttt cag gag cgt ctg caa gaa gat acg tct ttt ggg ggc 336 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 aac ctc ggg cga gca gtc ttc cag gcc aag aag cgg gtt ctc gaa cct 384 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 ctc ggt ctg gtt gag gaa ggc gct aag acg gct cct gga aag aag aga 432 Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 ccg gta gag cca tca ccc cag cgt tct cca gac tcc tct acg ggc atc 480 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 ggc aag aaa ggc caa cag ccc gcc aga aaa aga ctc aat ttt ggt cag 528 Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln 165 170 175 act ggc gac tca gag tca gtt cca gac cct caa cct ctc gga gaa cct 576 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro 180 185 190 cca gca gcg ccc tct ggt gtg gga cct aat aca atg gct gca ggc ggt 624 Pro Ala Ala Pro Ser Gly Val Gly Pro Asn Thr Met Ala Ala Gly Gly 195 200 205 ggc gca cca atg gca gac aat aac gaa ggc gcc gac gga gtg ggt agt 672 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 tcc tcg gga aat tgg cat tgc gat tcc aca tgg ctg ggc gac aga gtc 720 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 atc acc acc agc acc cga acc tgg gcc ctg ccc acc tac aac aac cac 768 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 ctc tac aag caa atc tcc aac gcg aca tcg gga gga gcc acc aac gac 816 Leu Tyr Lys Gln Ile Ser Asn Ala Thr Ser Gly Gly Ala Thr Asn Asp 260 265 270 aac acc tac ttc ggc tac agc acc ccc tgg ggg tat ttt gac ttt aac 864 Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn 275 280 285 aga ttc cac tgc cac ttt tca cca cgt gac tgg cag cga ctc atc aac 912 Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn 290 295 300 aac aac tgg gga ttc cgg ccc aag aga ctc agc ttc aag ctc ttc aac 960 Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn 305 310 315 320 atc cag gtc aag gag gtc acg cag aat gaa ggc acc aag acc atc gcc 1008 Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala 325 330 335 aat aac ctc acc agc acc atc cag gtg ttt acg gac tcg gag tac cag 1056 Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln 340 345 350 ctg ccg tac gtt ctc ggc tct gcc cac cag ggc tgc ctg cct ccg ttc 1104 Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe 355 360 365 ccg gcg gac gtg ttc atg att ccc cag tac ggc tac cta aca ctc aac 1152 Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn 370 375 380 aac ggt agt cag gcc gtg gga cgc tcc tcc ttc tac tgc ctg gaa tac 1200 Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr 385 390 395 400 ttt cct tcg cag atg ctg aga acc ggc aac aac ttc cag ttt act tac 1248 Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Thr Tyr 405 410 415 acc ttc gag gac gtg cct ttc cac agc agc tac gcc cac agc cag agc 1296 Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser 420 425 430 ttg gac cgg ctg atg aat cct ctg att gac cag tac ctg tac tac ttg 1344 Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu 435 440 445 tct cgg act caa aca aca gga ggc acg gca aat acg cag act ctg ggc 1392 Ser Arg Thr Gln Thr Thr Gly Gly Thr Ala Asn Thr Gln Thr Leu Gly 450 455 460 ttc agc caa ggt ggg cct aat aca atg gcc aat cag gca aag aac tgg 1440 Phe Ser Gln Gly Gly Pro Asn Thr Met Ala Asn Gln Ala Lys Asn Trp 465 470 475 480 ctg cca gga ccc tgt tac cgc caa caa cgc gtc tca acg aca acc ggg 1488 Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Thr Gly 485 490 495 caa aac aac aat agc aac ttt gcc tgg act gct ggg acc aaa tac cat 1536 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Ala Gly Thr Lys Tyr His 500 505 510 ctg aat gca aga aat tca ttg gct aat cct ggc atc gct atg gca aca 1584 Leu Asn Ala Arg Asn Ser Leu Ala Asn Pro Gly Ile Ala Met Ala Thr 515 520 525 cac aaa gac gac gag gag cgt ttt ttt ccc agt aac gcg atc ctg att 1632 His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Asn Ala Ile Leu Ile 530 535 540 ttt ggc aaa caa aat gct gcc aga gac aat gcg gat tac agc gat gtc 1680 Phe Gly Lys Gln Asn Ala Ala Arg Asp Asn Ala Asp Tyr Ser Asp Val 545 550 555 560 atg ctc acc agc gag gaa gaa atc aaa acc act aac cct gtg gct aca 1728 Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr 565 570 575 gag gaa tac ggt atc gtg gca gat aac ttg cag cag caa aac acg gct 1776 Glu Glu Tyr Gly Ile Val Ala Asp Asn Leu Gln Gln Gln Asn Thr Ala 580 585 590 cct caa att gga act gtc aac agc cag ggg gcc tta ccc ggt atg gtc 1824 Pro Gln Ile Gly Thr Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val 595 600 605 tgg cag aac cgg gac gtg tac ctg cag ggt ccc atc tgg gcc aag att 1872 Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 610 615 620 cct cac acg gac ggc aac ttc cac ccg tct ccg ctg atg ggc ggc ttt 1920 Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe 625 630 635 640 ggc ctg aaa cat cct ccg cct cag atc ctg atc aag aac acg cct gta 1968 Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val 645 650 655 cct gcg gat cct ccg acc acc ttc aac cag tca aag ctg aac tct ttc 2016 Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ser Lys Leu Asn Ser Phe 660 665 670 atc acg caa tac agc acc gga cag gtc agc gtg gaa att gaa tgg gag 2064 Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu 675 680 685 ctg cag aag gaa aac agc aag cgc tgg aac ccc gag atc cag tac acc 2112 Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 690 695 700 tcc aac tac tac aaa tct aca agt gtg gac ttt gct gtt aat aca gaa 2160 Ser Asn Tyr Tyr Lys Ser Thr Ser Val Asp Phe Ala Val Asn Thr Glu 705 710 715 720 ggc gtg tac tct gaa ccc cgc ccc att ggc acc cgt tac ctc acc cgt 2208 Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 725 730 735 aat ctg 2214 Asn Leu <210> 47 <211> 738 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 47 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln 165 170 175 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro 180 185 190 Pro Ala Ala Pro Ser Gly Val Gly Pro Asn Thr Met Ala Ala Gly Gly 195 200 205 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 Leu Tyr Lys Gln Ile Ser Asn Ala Thr Ser Gly Gly Ala Thr Asn Asp 260 265 270 Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn 275 280 285 Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn 290 295 300 Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn 305 310 315 320 Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala 325 330 335 Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln 340 345 350 Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe 355 360 365 Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn 370 375 380 Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr 385 390 395 400 Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Thr Tyr 405 410 415 Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser 420 425 430 Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu 435 440 445 Ser Arg Thr Gln Thr Thr Gly Gly Thr Ala Asn Thr Gln Thr Leu Gly 450 455 460 Phe Ser Gln Gly Gly Pro Asn Thr Met Ala Asn Gln Ala Lys Asn Trp 465 470 475 480 Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Thr Gly 485 490 495 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Ala Gly Thr Lys Tyr His 500 505 510 Leu Asn Ala Arg Asn Ser Leu Ala Asn Pro Gly Ile Ala Met Ala Thr 515 520 525 His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Asn Ala Ile Leu Ile 530 535 540 Phe Gly Lys Gln Asn Ala Ala Arg Asp Asn Ala Asp Tyr Ser Asp Val 545 550 555 560 Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr 565 570 575 Glu Glu Tyr Gly Ile Val Ala Asp Asn Leu Gln Gln Gln Asn Thr Ala 580 585 590 Pro Gln Ile Gly Thr Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val 595 600 605 Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 610 615 620 Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe 625 630 635 640 Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val 645 650 655 Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ser Lys Leu Asn Ser Phe 660 665 670 Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu 675 680 685 Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 690 695 700 Ser Asn Tyr Tyr Lys Ser Thr Ser Val Asp Phe Ala Val Asn Thr Glu 705 710 715 720 Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 725 730 735 Asn Leu <210> 48 <211> 2211 <212> DNA <213> Artificial Sequence <220> <223> AVV mutant 9G330AG453A <220> <221> CDS <222> (1)..(2211) <400> 48 atg gct gcc gat ggt tat ctt cca gat tgg ctc gag gac aac ctt agt 48 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 gaa gga att cgc gag tgg tgg gct ttg aaa cct gga gcc cct caa ccc 96 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 aag gca aat caa caa cat caa gac aac gct cga ggt ctt gtg ctt ccg 144 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 ggt tac aaa tac ctt gga ccc ggc aac gga ctc gac aag ggg gag ccg 192 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 gtc aac gca gca gac gcg gcg gcc ctc gag cac gac aag gcc tac gac 240 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 cag cag ctc aag gcc gga gac aac ccg tac ctc aag tac aac cac gcc 288 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 gac gcc gag ttc cag gag cgg ctc aaa gaa gat acg tct ttt ggg ggc 336 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 aac ctc ggg cga gca gtc ttc cag gcc aaa aag agg ctt ctt gaa cct 384 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 ctt ggt ctg gtt gag gaa gcg gct aag acg gct cct gga aag aag agg 432 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 cct gta gag cag tct cct cag gaa ccg gac tcc tcc gcg ggt att ggc 480 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 aaa tcg ggt gca cag ccc gct aaa aag aga ctc aat ttc ggt cag act 528 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 ggc gac aca gag tca gtc cca gac cct caa cca atc gga gaa cct ccc 576 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 gca gcc ccc tca ggt gtg gga tct ctt aca atg gct tca ggt ggt ggc 624 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 gca cca gtg gca gac aat aac gaa ggt gcc gat gga gtg ggt agt tcc 672 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 tcg gga aat tgg cat tgc gat tcc caa tgg ctg ggg gac aga gtc atc 720 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 acc acc agc acc cga acc tgg gcc ctg ccc acc tac aac aat cac ctc 768 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 tac aag caa atc tcc aac agc aca tct gga gga tct tca aat gac aac 816 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 gcc tac ttc ggc tac agc acc ccc tgg ggg tat ttt gac ttc aac aga 864 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 ttc cac tgc cac ttc tca cca cgt gac tgg cag cga ctc atc aac aac 912 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 aac tgg gga ttc cgg cct aag cga ctc aac ttc aag ctc ttc aac att 960 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 cag gtc aaa gag gtt acg gac aac aat gca gtc aag acc atc gcc aat 1008 Gln Val Lys Glu Val Thr Asp Asn Asn Ala Val Lys Thr Ile Ala Asn 325 330 335 aac ctt acc agc acg gtc cag gtc ttc acg gac tca gac tat cag ctc 1056 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 ccg tac gtg ctc ggg tcg gct cac gag ggc tgc ctc ccg ccg ttc cca 1104 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 gcg gac gtt ttc atg att cct cag tac ggg tat ctg acg ctt aat gat 1152 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 gga agc cag gcc gtg ggt cgt tcg tcc ttt tac tgc ctg gaa tat ttc 1200 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 ccg tcg caa atg cta aga acg ggt aac aac ttc cag ttc agc tac gag 1248 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 ttt gag aac gta cct ttc cat agc agc tac gct cac agc caa agc ctg 1296 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 gac cga cta atg aat cca ctc atc gac caa tac ttg tac tat ctc tca 1344 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 aag act att aac gct tct gga cag aat caa caa acg cta aaa ttc agt 1392 Lys Thr Ile Asn Ala Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 gtg gcc gga ccc agc aac atg gct gtc cag gga aga aac tac ata cct 1440 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 gga ccc agc tac cga caa caa cgt gtc tca acc act gtg act caa aac 1488 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 aac aac agc gaa ttt gct tgg cct gga gct tct tct tgg gct ctc aat 1536 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 gga cgt aat agc ttg atg aat cct gga cct gct atg gcc agc cac aaa 1584 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 gaa gga gag gac cgt ttc ttt cct ttg tct gga tct tta att ttt ggc 1632 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 aaa caa gga act gga aga gac aac gtg gat gcg gac aaa gtc atg ata 1680 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 acc aac gaa gaa gaa att aaa act act aac ccg gta gca acg gag tcc 1728 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 tat gga caa gtg gcc aca aac cac cag agt gcc caa gca cag gcg cag 1776 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 acc ggc tgg gtt caa aac caa gga ata ctt ccg ggt atg gtt tgg cag 1824 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 gac aga gat gtg tac ctg caa gga ccc att tgg gcc aaa att cct cac 1872 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 acg gac ggc aac ttt cac cct tct ccg ctg atg gga ggg ttt gga atg 1920 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 aag cac ccg cct cct cag atc ctc atc aaa aac aca cct gta cct gcg 1968 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 gat cct cca acg gcc ttc aac aag gac aag ctg aac tct ttc atc acc 2016 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 cag tat tct act ggc caa gtc agc gtg gag atc gag tgg gag ctg cag 2064 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 aag gaa aac agc aag cgc tgg aac ccg gag atc cag tac act tcc aac 2112 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 tat tac aag tct aat aat gtt gaa ttt gct gtt aat act gaa ggt gta 2160 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 tat agt gaa ccc cgc ccc att ggc acc aga tac ctg act cgt aat ctg 2208 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 taa 2211 <210> 49 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 49 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Ala Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Ala Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 50 <211> 2211 <212> DNA <213> Artificial Sequence <220> <223> AVV mutant 9G330AG513A <220> <221> CDS <222> (1)..(2211) <400> 50 atg gct gcc gat ggt tat ctt cca gat tgg ctc gag gac aac ctt agt 48 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 gaa gga att cgc gag tgg tgg gct ttg aaa cct gga gcc cct caa ccc 96 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 aag gca aat caa caa cat caa gac aac gct cga ggt ctt gtg ctt ccg 144 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 ggt tac aaa tac ctt gga ccc ggc aac gga ctc gac aag ggg gag ccg 192 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 gtc aac gca gca gac gcg gcg gcc ctc gag cac gac aag gcc tac gac 240 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 cag cag ctc aag gcc gga gac aac ccg tac ctc aag tac aac cac gcc 288 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 gac gcc gag ttc cag gag cgg ctc aaa gaa gat acg tct ttt ggg ggc 336 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 aac ctc ggg cga gca gtc ttc cag gcc aaa aag agg ctt ctt gaa cct 384 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 ctt ggt ctg gtt gag gaa gcg gct aag acg gct cct gga aag aag agg 432 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 cct gta gag cag tct cct cag gaa ccg gac tcc tcc gcg ggt att ggc 480 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 aaa tcg ggt gca cag ccc gct aaa aag aga ctc aat ttc ggt cag act 528 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 ggc gac aca gag tca gtc cca gac cct caa cca atc gga gaa cct ccc 576 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 gca gcc ccc tca ggt gtg gga tct ctt aca atg gct tca ggt ggt ggc 624 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 gca cca gtg gca gac aat aac gaa ggt gcc gat gga gtg ggt agt tcc 672 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 tcg gga aat tgg cat tgc gat tcc caa tgg ctg ggg gac aga gtc atc 720 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 acc acc agc acc cga acc tgg gcc ctg ccc acc tac aac aat cac ctc 768 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 tac aag caa atc tcc aac agc aca tct gga gga tct tca aat gac aac 816 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 gcc tac ttc ggc tac agc acc ccc tgg ggg tat ttt gac ttc aac aga 864 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 ttc cac tgc cac ttc tca cca cgt gac tgg cag cga ctc atc aac aac 912 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 aac tgg gga ttc cgg cct aag cga ctc aac ttc aag ctc ttc aac att 960 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 cag gtc aaa gag gtt acg gac aac aat gca gtc aag acc atc gcc aat 1008 Gln Val Lys Glu Val Thr Asp Asn Asn Ala Val Lys Thr Ile Ala Asn 325 330 335 aac ctt acc agc acg gtc cag gtc ttc acg gac tca gac tat cag ctc 1056 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 ccg tac gtg ctc ggg tcg gct cac gag ggc tgc ctc ccg ccg ttc cca 1104 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 gcg gac gtt ttc atg att cct cag tac ggg tat ctg acg ctt aat gat 1152 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 gga agc cag gcc gtg ggt cgt tcg tcc ttt tac tgc ctg gaa tat ttc 1200 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 ccg tcg caa atg cta aga acg ggt aac aac ttc cag ttc agc tac gag 1248 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 ttt gag aac gta cct ttc cat agc agc tac gct cac agc caa agc ctg 1296 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 gac cga cta atg aat cca ctc atc gac caa tac ttg tac tat ctc tca 1344 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 aag act att aac ggt tct gga cag aat caa caa acg cta aaa ttc agt 1392 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 gtg gcc gga ccc agc aac atg gct gtc cag gga aga aac tac ata cct 1440 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 gga ccc agc tac cga caa caa cgt gtc tca acc act gtg act caa aac 1488 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 aac aac agc gaa ttt gct tgg cct gga gct tct tct tgg gct ctc aat 1536 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 gca cgt aat agc ttg atg aat cct gga cct gct atg gcc agc cac aaa 1584 Ala Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 gaa gga gag gac cgt ttc ttt cct ttg tct gga tct tta att ttt ggc 1632 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 aaa caa gga act gga aga gac aac gtg gat gcg gac aaa gtc atg ata 1680 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 acc aac gaa gaa gaa att aaa act act aac ccg gta gca acg gag tcc 1728 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 tat gga caa gtg gcc aca aac cac cag agt gcc caa gca cag gcg cag 1776 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 acc ggc tgg gtt caa aac caa gga ata ctt ccg ggt atg gtt tgg cag 1824 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 gac aga gat gtg tac ctg caa gga ccc att tgg gcc aaa att cct cac 1872 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 acg gac ggc aac ttt cac cct tct ccg ctg atg gga ggg ttt gga atg 1920 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 aag cac ccg cct cct cag atc ctc atc aaa aac aca cct gta cct gcg 1968 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 gat cct cca acg gcc ttc aac aag gac aag ctg aac tct ttc atc acc 2016 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 cag tat tct act ggc caa gtc agc gtg gag atc gag tgg gag ctg cag 2064 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 aag gaa aac agc aag cgc tgg aac ccg gag atc cag tac act tcc aac 2112 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 tat tac aag tct aat aat gtt gaa ttt gct gtt aat act gaa ggt gta 2160 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 tat agt gaa ccc cgc ccc att ggc acc aga tac ctg act cgt aat ctg 2208 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 taa 2211 <210> 51 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 51 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Ala Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Ala Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 52 <211> 2211 <212> DNA <213> Artificial Sequence <220> <223> AVV mutant 9G453AG513A <220> <221> CDS <222> (1)..(2211) <400> 52 atg gct gcc gat ggt tat ctt cca gat tgg ctc gag gac aac ctt agt 48 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 gaa gga att cgc gag tgg tgg gct ttg aaa cct gga gcc cct caa ccc 96 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 aag gca aat caa caa cat caa gac aac gct cga ggt ctt gtg ctt ccg 144 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 ggt tac aaa tac ctt gga ccc ggc aac gga ctc gac aag ggg gag ccg 192 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 gtc aac gca gca gac gcg gcg gcc ctc gag cac gac aag gcc tac gac 240 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 cag cag ctc aag gcc gga gac aac ccg tac ctc aag tac aac cac gcc 288 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 gac gcc gag ttc cag gag cgg ctc aaa gaa gat acg tct ttt ggg ggc 336 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 aac ctc ggg cga gca gtc ttc cag gcc aaa aag agg ctt ctt gaa cct 384 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 ctt ggt ctg gtt gag gaa gcg gct aag acg gct cct gga aag aag agg 432 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 cct gta gag cag tct cct cag gaa ccg gac tcc tcc gcg ggt att ggc 480 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 aaa tcg ggt gca cag ccc gct aaa aag aga ctc aat ttc ggt cag act 528 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 ggc gac aca gag tca gtc cca gac cct caa cca atc gga gaa cct ccc 576 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 gca gcc ccc tca ggt gtg gga tct ctt aca atg gct tca ggt ggt ggc 624 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 gca cca gtg gca gac aat aac gaa ggt gcc gat gga gtg ggt agt tcc 672 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 tcg gga aat tgg cat tgc gat tcc caa tgg ctg ggg gac aga gtc atc 720 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 acc acc agc acc cga acc tgg gcc ctg ccc acc tac aac aat cac ctc 768 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 tac aag caa atc tcc aac agc aca tct gga gga tct tca aat gac aac 816 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 gcc tac ttc ggc tac agc acc ccc tgg ggg tat ttt gac ttc aac aga 864 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 ttc cac tgc cac ttc tca cca cgt gac tgg cag cga ctc atc aac aac 912 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 aac tgg gga ttc cgg cct aag cga ctc aac ttc aag ctc ttc aac att 960 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 cag gtc aaa gag gtt acg gac aac aat gga gtc aag acc atc gcc aat 1008 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 aac ctt acc agc acg gtc cag gtc ttc acg gac tca gac tat cag ctc 1056 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 ccg tac gtg ctc ggg tcg gct cac gag ggc tgc ctc ccg ccg ttc cca 1104 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 gcg gac gtt ttc atg att cct cag tac ggg tat ctg acg ctt aat gat 1152 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 gga agc cag gcc gtg ggt cgt tcg tcc ttt tac tgc ctg gaa tat ttc 1200 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 ccg tcg caa atg cta aga acg ggt aac aac ttc cag ttc agc tac gag 1248 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 ttt gag aac gta cct ttc cat agc agc tac gct cac agc caa agc ctg 1296 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 gac cga cta atg aat cca ctc atc gac caa tac ttg tac tat ctc tca 1344 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 aag act att aac gct tct gga cag aat caa caa acg cta aaa ttc agt 1392 Lys Thr Ile Asn Ala Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 gtg gcc gga ccc agc aac atg gct gtc cag gga aga aac tac ata cct 1440 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 gga ccc agc tac cga caa caa cgt gtc tca acc act gtg act caa aac 1488 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 aac aac agc gaa ttt gct tgg cct gga gct tct tct tgg gct ctc aat 1536 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 gca cgt aat agc ttg atg aat cct gga cct gct atg gcc agc cac aaa 1584 Ala Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 gaa gga gag gac cgt ttc ttt cct ttg tct gga tct tta att ttt ggc 1632 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 aaa caa gga act gga aga gac aac gtg gat gcg gac aaa gtc atg ata 1680 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 acc aac gaa gaa gaa att aaa act act aac ccg gta gca acg gag tcc 1728 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 tat gga caa gtg gcc aca aac cac cag agt gcc caa gca cag gcg cag 1776 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 acc ggc tgg gtt caa aac caa gga ata ctt ccg ggt atg gtt tgg cag 1824 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 gac aga gat gtg tac ctg caa gga ccc att tgg gcc aaa att cct cac 1872 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 acg gac ggc aac ttt cac cct tct ccg ctg atg gga ggg ttt gga atg 1920 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 aag cac ccg cct cct cag atc ctc atc aaa aac aca cct gta cct gcg 1968 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 gat cct cca acg gcc ttc aac aag gac aag ctg aac tct ttc atc acc 2016 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 cag tat tct act ggc caa gtc agc gtg gag atc gag tgg gag ctg cag 2064 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 aag gaa aac agc aag cgc tgg aac ccg gag atc cag tac act tcc aac 2112 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 tat tac aag tct aat aat gtt gaa ttt gct gtt aat act gaa ggt gta 2160 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 tat agt gaa ccc cgc ccc att ggc acc aga tac ctg act cgt aat ctg 2208 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 taa 2211 <210> 53 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 53 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Ala Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Ala Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 54 <211> 2211 <212> DNA <213> Artificial Sequence <220> <223> AVV mutant 9G330AG453AG513A <220> <221> CDS <222> (1)..(2211) <400> 54 atg gct gcc gat ggt tat ctt cca gat tgg ctc gag gac aac ctt agt 48 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 gaa gga att cgc gag tgg tgg gct ttg aaa cct gga gcc cct caa ccc 96 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 aag gca aat caa caa cat caa gac aac gct cga ggt ctt gtg ctt ccg 144 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 ggt tac aaa tac ctt gga ccc ggc aac gga ctc gac aag ggg gag ccg 192 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 gtc aac gca gca gac gcg gcg gcc ctc gag cac gac aag gcc tac gac 240 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 cag cag ctc aag gcc gga gac aac ccg tac ctc aag tac aac cac gcc 288 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 gac gcc gag ttc cag gag cgg ctc aaa gaa gat acg tct ttt ggg ggc 336 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 aac ctc ggg cga gca gtc ttc cag gcc aaa aag agg ctt ctt gaa cct 384 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 ctt ggt ctg gtt gag gaa gcg gct aag acg gct cct gga aag aag agg 432 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 cct gta gag cag tct cct cag gaa ccg gac tcc tcc gcg ggt att ggc 480 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 aaa tcg ggt gca cag ccc gct aaa aag aga ctc aat ttc ggt cag act 528 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 ggc gac aca gag tca gtc cca gac cct caa cca atc gga gaa cct ccc 576 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 gca gcc ccc tca ggt gtg gga tct ctt aca atg gct tca ggt ggt ggc 624 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 gca cca gtg gca gac aat aac gaa ggt gcc gat gga gtg ggt agt tcc 672 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 tcg gga aat tgg cat tgc gat tcc caa tgg ctg ggg gac aga gtc atc 720 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 acc acc agc acc cga acc tgg gcc ctg ccc acc tac aac aat cac ctc 768 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 tac aag caa atc tcc aac agc aca tct gga gga tct tca aat gac aac 816 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 gcc tac ttc ggc tac agc acc ccc tgg ggg tat ttt gac ttc aac aga 864 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 ttc cac tgc cac ttc tca cca cgt gac tgg cag cga ctc atc aac aac 912 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 aac tgg gga ttc cgg cct aag cga ctc aac ttc aag ctc ttc aac att 960 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 cag gtc aaa gag gtt acg gac aac aat gca gtc aag acc atc gcc aat 1008 Gln Val Lys Glu Val Thr Asp Asn Asn Ala Val Lys Thr Ile Ala Asn 325 330 335 aac ctt acc agc acg gtc cag gtc ttc acg gac tca gac tat cag ctc 1056 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 ccg tac gtg ctc ggg tcg gct cac gag ggc tgc ctc ccg ccg ttc cca 1104 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 gcg gac gtt ttc atg att cct cag tac ggg tat ctg acg ctt aat gat 1152 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 gga agc cag gcc gtg ggt cgt tcg tcc ttt tac tgc ctg gaa tat ttc 1200 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 ccg tcg caa atg cta aga acg ggt aac aac ttc cag ttc agc tac gag 1248 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 ttt gag aac gta cct ttc cat agc agc tac gct cac agc caa agc ctg 1296 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 gac cga cta atg aat cca ctc atc gac caa tac ttg tac tat ctc tca 1344 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 aag act att aac gct tct gga cag aat caa caa acg cta aaa ttc agt 1392 Lys Thr Ile Asn Ala Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 gtg gcc gga ccc agc aac atg gct gtc cag gga aga aac tac ata cct 1440 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 gga ccc agc tac cga caa caa cgt gtc tca acc act gtg act caa aac 1488 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 aac aac agc gaa ttt gct tgg cct gga gct tct tct tgg gct ctc aat 1536 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 gca cgt aat agc ttg atg aat cct gga cct gct atg gcc agc cac aaa 1584 Ala Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 gaa gga gag gac cgt ttc ttt cct ttg tct gga tct tta att ttt ggc 1632 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 aaa caa gga act gga aga gac aac gtg gat gcg gac aaa gtc atg ata 1680 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 acc aac gaa gaa gaa att aaa act act aac ccg gta gca acg gag tcc 1728 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 tat gga caa gtg gcc aca aac cac cag agt gcc caa gca cag gcg cag 1776 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 acc ggc tgg gtt caa aac caa gga ata ctt ccg ggt atg gtt tgg cag 1824 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 gac aga gat gtg tac ctg caa gga ccc att tgg gcc aaa att cct cac 1872 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 acg gac ggc aac ttt cac cct tct ccg ctg atg gga ggg ttt gga atg 1920 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 aag cac ccg cct cct cag atc ctc atc aaa aac aca cct gta cct gcg 1968 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 gat cct cca acg gcc ttc aac aag gac aag ctg aac tct ttc atc acc 2016 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 cag tat tct act ggc caa gtc agc gtg gag atc gag tgg gag ctg cag 2064 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 aag gaa aac agc aag cgc tgg aac ccg gag atc cag tac act tcc aac 2112 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 tat tac aag tct aat aat gtt gaa ttt gct gtt aat act gaa ggt gta 2160 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 tat agt gaa ccc cgc ccc att ggc acc aga tac ctg act cgt aat ctg 2208 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 taa 2211 <210> 55 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 55 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Ala Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Ala Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Ala Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 56 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 56 cgacaaccgg gcaaaaccag aatagcaact ttgcctgg 38 <210> 57 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 57 ccaggcaaag ttgctattct ggttttgccc ggttgtcg 38 <210> 58 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 58 gacaaccggg caaaacgaca atagcaactt tgcctg 36 <210> 59 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 59 caggcaaagt tgctattgtc gttttgcccg gttgtc 36 <210> 60 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 60 ggaggcacgg cacagacgca gactctggg 29 <210> 61 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 61 cccagagtct gcgtctgtgc cgtgcctcc 29 <210> 62 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 62 caggaggcac ggcagatacg cagactctgg 30 <210> 63 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 63 ccagagtctg cgtatctgcc gtgcctcctg 30 <210> 64 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 64 ctcctcccga tgtcgcgttg gagatttgc 29 <210> 65 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 65 gcaaatctcc aacgcgacat cgggaggag 29 <210> 66 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 66 cccacggcct gactagcgtt gttgagtgtt a 31 <210> 67 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 67 taacactcaa caacgctagt caggccgtgg g 31 <210> 68 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 68 ggattagcca atgaatttct tgcattcaga tggtatttgg tcc 43 <210> 69 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 69 ggaccaaata ccatctgaat gcaagaaatt cattggctaa tcc 43 <210> 70 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 70 tttgccaaaa atcaggatcg cgttactggg aaaaaaacg 39 <210> 71 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 71 cgtttttttc ccagtaacgc gatcctgatt tttggcaaa 39 <210> 72 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 72 ggacccttca acgcactcga caagggg 27 <210> 73 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 73 ccccttgtcg agtgcgttga agggtcc 27 <210> 74 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 74 tggctcctcc cgatgtgctg ttggagattt gcttg 35 <210> 75 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 75 caagcaaatc tccaacagca catcgggagg agcca 35 <210> 76 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 76 cccacggcct gactactgtt gttgagtgtt agg 33 <210> 77 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 77 cctaacactc aacaacagta gtcaggccgt ggg 33 <210> 78 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 78 ttagccaatg aatttctgct attcagatgg tatttggtcc cagcag 46 <210> 79 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 79 ctgctgggac caaataccat ctgaatagca gaaattcatt ggctaa 46 <210> 80 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 80 ttgtttgcca aaaatcagga tgctgttact gggaaaaaaa cgctc 45 <210> 81 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 81 gagcgttttt ttcccagtaa cagcatcctg atttttggca aacaa 45 <210> 82 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 82 ctcccccttg tcgaggctgt tgaagggtcc gag 33 <210> 83 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 83 ctcggaccct tcaacagcct cgacaagggg gag 33 <210> 84 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 84 cagcgactca tcaacgacaa ctggggattc cg 32 <210> 85 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 85 ggaggcacgg cagatacgca gactctgg 28 <210> 86 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 86 gacaaccggg caaaacgaca atagcaactt tgcctg 36 <210> 87 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 87 ccatctgaat ggaagagatt cattggctaa tcctggcatc 40 <210> 88 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 88 cgaagcccaa agccgaccag caaaagcagg 30 <210> 89 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 89 gtacctgcgg tatgaccacg ccgacgcc 28 <210> 90 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 90 gatgctgaga accggcgaca acttccagtt tacttac 37 <210> 91 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 91 cagactctgg gcttcagcga tggtgggcct aatacaatg 39 <210> 92 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 92 ccaatcaggc aaaggactgg ctgccaggac 30 <210> 93 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 93 cacggacggc gacttccacc cgtctc 26 <210> 94 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 94 gatcctgatc aaggacacgc ctgtacctgc g 31 <210> 95 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 95 gtacctcgga cccttccagg gactcgacaa ggg 33 <210> 96 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 96 ctacaagcaa atctcccagg ggacatcggg aggagc 36 <210> 97 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 97 gctacctaac actcaaccag ggtagtcagg ccgtgg 36 <210> 98 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 98 gctgggacca aataccatct gcagggaaga aattcattgg c 41 <210> 99 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 99 ggagcgtttt tttcccagtc aggggatcct gatttttggc 40 <210> 100 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 100 cggaatcccc agttgtcgtt gatgagtcgc tg 32 <210> 101 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 101 ccagagtctg cgtatctgcc gtgcctcc 28 <210> 102 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 102 caggcaaagt tgctattgtc gttttgcccg gttgtc 36 <210> 103 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 103 gatgccagga ttagccaatg aatctcttcc attcagatgg 40 <210> 104 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 104 cctgcttttg ctggtcggct ttgggcttcg 30 <210> 105 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 105 ggcgtcggcg tggtcatacc gcaggtac 28 <210> 106 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 106 gtaagtaaac tggaagttgt cgccggttct cagcatc 37 <210> 107 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 107 cattgtatta ggcccaccat cgctgaagcc cagagtctg 39 <210> 108 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 108 gtcctggcag ccagtccttt gcctgattgg 30 <210> 109 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 109 gagacgggtg gaagtcgccg tccgtg 26 <210> 110 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 110 cgcaggtaca ggcgtgtcct tgatcaggat c 31 <210> 111 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 111 gcagcgactc atcaacgaca actggggatt ccggc 35 <210> 112 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 112 gccggaatcc ccagttgtcg ttgatgagtc gctgc 35 <210> 113 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 113 cagcgactca tcaacgacaa ctggggattc cggc 34 <210> 114 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 114 gccggaatcc ccagttgtcg ttgatgagtc gctg 34 <210> 115 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 115 gcgactcatc aacgacaact ggggattccg 30 <210> 116 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 116 cggaatcccc agttgtcgtt gatgagtcgc 30 <210> 117 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 117 ctctgggctt cagcgaaggt gggcctaata c 31 <210> 118 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 118 gtattaggcc caccttcgct gaagcccaga g 31 <210> 119 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 119 cctcggaccc ttcgacggac tcgacaagg 29 <210> 120 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 120 tacaagcaaa tctccgacgg gacatcggga ggag 34 <210> 121 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 121 ctacctaaca ctcaacgacg gtagtcaggc cgtg 34 <210> 122 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 122 ctgggaccaa ataccatctg gatggaagaa attcattggc taatc 45 <210> 123 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 123 gagcgttttt ttcccagtga cgggatcctg atttttggc 39 <210> 124 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 124 ccttgtcgag tccgtcgaag ggtccgagg 29 <210> 125 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 125 ctcctcccga tgtcccgtcg gagatttgct tgta 34 <210> 126 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 126 cacggcctga ctaccgtcgt tgagtgttag gtag 34 <210> 127 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 127 gattagccaa tgaatttctt ccatccagat ggtatttggt cccag 45 <210> 128 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> primer sequence <400> 128 gccaaaaatc aggatcccgt cactgggaaa aaaacgctc 39

Claims (64)

  1. 재조합 아데노-연관 바이러스(rAAV)로서,
    (A) 하기 중 하나 이상을 포함하는 AAVrh79 캡시드:
    (1) 다음을 포함하는 AAVrh79 캡시드 단백질:
    서열번호: 2의 1 내지 738의 예측된 아미노산 서열을 암호화하는 핵산 서열로부터 발현에 의해 생성된 vp1 단백질, 서열번호: 1로부터 생성된 vp1 단백질, 또는 서열번호: 2의 1 내지 738의 예측된 아미노산 서열을 암호화하는 서열번호: 1과 적어도 70% 동일한 핵산 서열로부터 생성된 vp1 단백질로부터 선택된 AAVrh79 vp1 단백질의 이질적 집단,
    서열번호: 2의 적어도 약 아미노산 138 내지 738의 예측된 아미노산 서열을 암호화하는 핵산 서열로부터 발현에 의해 생성된 vp2 단백질, 서열번호: 1의 적어도 뉴클레오티드 412 내지 2214를 포함하는 서열로부터 생성된 vp2 단백질, 또는 서열번호: 2의 적어도 약 아미노산 138 내지 738의 예측된 아미노산 서열을 암호화하는 서열번호: 1의 적어도 뉴클레오티드 412 내지 2214와 적어도 70% 동일한 핵산 서열로부터 생성된 vp2 단백질로부터 선택된 AAVrh79 vp2 단백질의 이질적 집단,
    서열번호: 2의 적어도 약 아미노산 204 내지 738의 예측된 아미노산 서열을 암호화하는 핵산 서열로부터 발현에 의해 생성된 vp3 단백질, 서열번호: 1의 적어도 뉴클레오티드 607 내지 2214를 포함하는 서열로부터 생성된 vp3 단백질, 또는 서열번호: 2의 적어도 약 아미노산 204 내지 738의 예측된 아미노산 서열을 암호화하는 서열번호: 1의 적어도 뉴클레오티드 607 내지 2214와 적어도 70% 동일한 핵산 서열로부터 생성된 vp3 단백질로부터 선택된 AAVrh79 vp3 단백질의 이질적 집단; 및/또는
    (2) 서열번호: 2의 아미노산 서열을 암호화하는 핵산 서열의 생성물인 vp1 단백질의 이질적 집단, 서열번호: 2의 적어도 약 아미노산 138 내지 738의 아미노산 서열을 암호화하는 핵산 서열의 생성물인 vp2 단백질의 이질적 집단, 및 서열번호: 2의 적어도 아미노산 204 내지 738을 암호화하는 핵산 서열의 생성물인 vp3 단백질의 이질적 집단, 여기서 vp1, vp2 및 vp3 단백질은 서열번호: 2에서 아스파라긴 - 글리신 쌍에서 적어도 2 개의 고도로 탈아미드화된 아스파라긴(N)을 포함하는 아미노산 변형을 갖는 하위집단을 함유하고 임의적으로 다른 탈아미드화된 아미노산을 포함하는 하위집단을 추가로 포함하며, 여기서 탈아미드화는 아미노산 변화를 야기하는 것; 및
    (B) AAV 도립된 말단 반복부 서열 및 숙주 세포에서 생성물의 발현을 지시하는 서열에 작동가능하게 연결된 생성물을 암호화하는 비-AAV 핵산 서열을 포함하는 핵산 분자를 포함하는 AAVrh79 캡시드 내 벡터 게놈
    을 포함하는, rAAV.
  2. 제1항에 있어서, 상기 탈아미드화된 아스파라긴이 아스파르트산, 이소아스파르트산, 상호전환 아스파르트산/이소아스파르트산 쌍, 또는 이의 조합으로 탈아미드화되는, rAAV.
  3. 제1항 또는 제2항에 있어서, 상기 캡시드가 (α)-글루탐산, γ-글루탐산, 상호전환 (α)-글루탐산/γ-글루탐산 쌍, 또는 이의 조합으로 탈아미드화되는 탈아미드화된 글루타민(들)을 추가로 포함하는, rAAV.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 AAVrh79 캡시드가 하기 중 하나 이상을 갖는 하위집단을 포함하는, rAAV:
    (a) 서열번호: 2의 넘버링에 기초하여, vp1 단백질의 위치 57에 위치한 아스파라긴 - 글리신 쌍에서 아스파라긴(N)의 적어도 75%가 탈아미드화됨;
    (b) 서열번호: 2의 아미노산 서열의 잔기 넘버링에 기초하여, vp1, v2 및 vp3 단백질의 위치 263에서 아스파라긴 - 글리신 쌍에서 N의 적어도 75%가 탈아미드화됨;
    (c) 서열번호: 2의 아미노산 서열의 잔기 넘버링에 기초하여, vp1, v2 및 vp3 단백질의 위치 385에서 아스파라긴 - 글리신 쌍에서 N의 적어도 70%가 탈아미드화됨; 및/또는
    (d) 서열번호: 2의 아미노산 서열의 잔기 넘버링에 기초하여, vp1, v2 및 vp3 단백질의 위치 514에서 아스파라긴 - 글리신 쌍에서 N의 적어도 85%가 탈아미드화됨.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 rAAVrh79 캡시드가 질량 분석법을 사용하여 결정 시, vp1 단백질의 위치 57에서 N의 75% 내지 100%가 탈아미드화된 vp1의 하위집단을 포함하는, rAAV.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 rAAVrh79 캡시드가 질량 분석법을 사용하여 결정 시, 서열번호: 2의 넘버링에 기초하여, 위치 263에서 N의 75% 내지 100%가 탈아미드화된 vp1 단백질, vp2 단백질, 및/또는 vp3 단백질의 하위집단을 포함하는, rAAV.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 rAAVrh79 캡시드가 질량 분석법을 사용하여 결정 시, 서열번호: 2의 넘버링에 기초하여, 위치 385에서 N의 75% 내지 100%가 탈아미드화된 vp1 단백질, vp2 단백질, 및/또는 vp3 단백질의 하위집단을 포함하는, rAAV.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 rAAVrh79 캡시드가 서열번호: 2의 넘버링에 기초하여, 위치 514에서 N의 75% 내지 100%가 탈아미드화된 vp1 단백질, vp2 단백질, 및/또는 vp3 단백질의 하위집단을 포함하는, rAAV.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 단백질을 암호화하는 핵산 서열이 서열번호: 1, 또는 서열번호: 2의 아미노산 서열을 암호화하는 서열번호: 1과 적어도 80% 내지 적어도 99% 동일한 서열인, rAAV.
  10. 제9항에 있어서, 상기 핵산 서열이 서열번호: 1과 적어도 80% 내지 97% 동일한, rAAV.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 rAAVrh79 캡시드가 N57, 263, 385, 514, 또는 이의 조합 중 하나 이상으로부터 선택된 적어도 4 개의 위치에서 적어도 약 50 내지 100% 탈아미드화를 포함하는 서열번호: 2로부터 아미노산 변형을 갖는 vp1, vp2 및/또는 vp3 단백질의 적어도 하위집단을 추가로 포함하는, rAAV.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, 상기 rAAVrh79 캡시드가 위치 N94, N254, N305, N410, N479, N653, 또는 이의 조합 중 적어도 하나 이상에서 1% 내지 약 40% 탈아미드화를 추가로 포함하는 vp1, vp2 및/또는 vp3 단백질의 하위집단을 포함하는, rAAV.
  13. 제1항 내지 제11항 중 어느 한 항에 있어서, 상기 rAAVrh79 캡시드가 아세틸화된 리신, 인산화된 세린 및/또는 트레오닌, 이성질체화된 아스파르트산, 산화된 트립토판 및/또는 메티오닌, 또는 아미드화된 아미노산 중 하나 이상에서 하나 이상의 변형으로부터 선택된 하나 이상의 변형을 추가로 포함하는 vp1, vp2 및/또는 vp3 단백질의 하위집단을 포함하는, rAAV.
  14. 재조합 아데노-연관 바이러스(rAAV)로서,
    (A) 하기 중 하나 이상을 포함하는 AAV8.AR2.08캡시드:
    (1) 다음을 포함하는 AAV G3 캡시드 단백질:
    서열번호: 18의 1 내지 738의 예측된 아미노산 서열을 암호화하는 핵산 서열로부터 발현에 의해 생성된 vp1 단백질, 서열번호: 17로부터 생성된 vp1 단백질, 또는 서열번호: 18의 1 내지 738의 예측된 아미노산 서열을 암호화하는 서열번호: 17과 적어도 70% 동일한 핵산 서열로부터 생성된 vp1 단백질로부터 선택된 AAV8.AR2.08vp1 단백질의 이질적 집단,
    서열번호: 18의 적어도 약 아미노산 138 내지 738의 예측된 아미노산 서열을 암호화하는 핵산 서열로부터 발현에 의해 생성된 AAV8.AR2.08vp2 단백질, 서열번호: 17의 적어도 뉴클레오티드 411 내지 2214를 포함하는 서열로부터 생성된 vp2 단백질, 또는 서열번호: 18의 적어도 약 아미노산 138 내지 738의 예측된 아미노산 서열을 암호화하는 서열번호: 17의 적어도 뉴클레오티드 412 내지 2214와 적어도 70% 동일한 핵산 서열로부터 생성된 vp2 단백질로부터 선택된 AAV8.AR2.08vp2 단백질의 이질적 집단,
    서열번호: 18의 적어도 약 아미노산 204 내지 738의 예측된 아미노산 서열을 암호화하는 핵산 서열로부터 발현에 의해 생성된 vp3 단백질, 서열번호: 17의 적어도 뉴클레오티드 607 내지 2214를 포함하는 서열로부터 생성된 vp3 단백질, 또는 서열번호: 18의 적어도 약 아미노산 204 내지 738의 예측된 아미노산 서열을 암호화하는 서열번호: 17의 적어도 뉴클레오티드 607 내지 2214와 적어도 70% 동일한 핵산 서열로부터 생성된 vp3 단백질로부터 선택된 AAV8.AR2.08vp3 단백질의 이질적 집단; 및/또는
    (2) 서열번호: 18의 아미노산 서열을 암호화하는 핵산 서열의 생성물인 vp1 단백질의 이질적 집단, 서열번호: 18의 적어도 약 아미노산 138 내지 738의 아미노산 서열을 암호화하는 핵산 서열의 생성물인 vp2 단백질의 이질적 집단, 및 서열번호: 18의 적어도 아미노산 204 내지 738을 암호화하는 핵산 서열의 생성물인 vp3 단백질의 이질적 집단, 여기서 vp1, vp2 및 vp3 단백질은 서열번호: 18에서 아스파라긴 - 글리신 쌍에서 적어도 2 개의 고도로 탈아미드화된 아스파라긴(N)을 포함하는 아미노산 변형을 갖는 하위집단을 함유하고 임의적으로 다른 탈아미드화된 아미노산을 포함하는 하위집단을 추가로 포함하며, 여기서 탈아미드화는 아미노산 변화를 야기하는 것; 및
    (B) AAV 도립된 말단 반복부 서열 및 숙주 세포에서 생성물의 발현을 지시하는 서열에 작동가능하게 연결된 생성물을 암호화하는 비-AAV 핵산 서열을 포함하는 핵산 분자를 포함하는 AAV8.AR2.08캡시드 내 벡터 게놈
    을 포함하는, rAAV.
  15. 제14항에 있어서, 상기 탈아미드화된 아스파라긴이 아스파르트산, 이소아스파르트산, 상호전환 아스파르트산/이소아스파르트산 쌍, 또는 이의 조합으로 탈아미드화되는, rAAV.
  16. 제14항 또는 제15항에 있어서, 상기 캡시드가 (α)-글루탐산, γ-글루탐산, 상호전환 (α)-글루탐산/γ-글루탐산 쌍, 또는 이의 조합으로 탈아미드화되는 탈아미드화된 글루타민(들)을 추가로 포함하는, rAAV.
  17. 제14항 내지 제16항 중 어느 한 항에 있어서, 상기 AAV8.AR2.08 캡시드가 하기 중 하나 이상을 갖는 하위집단을 포함하는, rAAV:
    (a) 서열번호: 18의 넘버링에 기초하여, vp1 단백질의 위치 57에 위치한 아스파라긴 - 글리신 쌍에서 아스파라긴(N)의 적어도 75%가 탈아미드화됨;
    (b) 서열번호: 18의 아미노산 서열의 잔기 넘버링에 기초하여, vp1, v2 및 vp3 단백질의 위치 263에서 아스파라긴 - 글리신 쌍에서 N의 적어도 75%가 탈아미드화됨;
    (c) 서열번호: 18의 아미노산 서열의 잔기 넘버링에 기초하여, vp1, v2 및 vp3 단백질의 위치 385에서 아스파라긴 - 글리신 쌍에서 N의 적어도 70%가 탈아미드화됨; 및/또는
    (d) 서열번호: 18의 아미노산 서열의 잔기 넘버링에 기초하여, vp1, v2 및 vp3 단백질의 위치 514에서 아스파라긴 - 글리신 쌍에서 N의 적어도 85%가 탈아미드화됨; 및/또는
    (e) 서열번호: 18의 아미노산 서열의 잔기 넘버링에 기초하여, vp1, v2 및 vp3 단백질의 위치 540에서 아스파라긴 - 글리신 쌍에서 N의 적어도 85%가 탈아미드화됨.
  18. 제14항 내지 제17항 중 어느 한 항에 있어서, 상기 rAAV8.AR2.08캡시드가 질량 분석법을 사용하여 결정 시, vp1 단백질의 위치 57에서 N의 75% 내지 100%가 탈아미드화된 vp1의 하위집단을 포함하는, rAAV.
  19. 제14항 내지 제18항 중 어느 한 항에 있어서, 상기 rAAV8.AR2.08캡시드가 질량 분석법을 사용하여 결정 시, 서열번호: 2의 넘버링에 기초하여, 위치 263에서 N의 75% 내지 100%가 탈아미드화된 vp1 단백질, vp2 단백질, 및/또는 vp3 단백질의 하위집단을 포함하는, rAAV.
  20. 제14항 내지 제19항 중 어느 한 항에 있어서, 상기 rAAV8.AR2.08캡시드가 질량 분석법을 사용하여 결정 시, 서열번호: 2의 넘버링에 기초하여, 위치 385에서 N의 75% 내지 100%가 탈아미드화된 vp1 단백질, vp2 단백질, 및/또는 vp3 단백질의 하위집단을 포함하는, rAAV.
  21. 제14항 내지 제20항 중 어느 한 항에 있어서, 상기 rAAV8.AR2.08캡시드가 서열번호: 2의 넘버링에 기초하여, 위치 514에서 N의 75% 내지 100%가 탈아미드화된 vp1 단백질, vp2 단백질, 및/또는 vp3 단백질의 하위집단을 포함하는, rAAV.
  22. 제14항 내지 제20항 중 어느 한 항에 있어서, 상기 rAAV8.AR2.08캡시드가 서열번호: 2의 넘버링에 기초하여, 위치 540에서 N의 75% 내지 100%가 탈아미드화된 vp1 단백질, vp2 단백질, 및/또는 vp3 단백질의 하위집단을 포함하는, rAAV.
  23. 제14항 내지 제22항 중 어느 한 항에 있어서, 상기 단백질을 암호화하는 핵산 서열이 서열번호: 17, 또는 서열번호: 18의 아미노산 서열을 암호화하는 서열번호: 17과 적어도 80% 내지 적어도 99% 동일한 서열인, rAAV.
  24. 제23항에 있어서, 상기 핵산 서열이 서열번호: 17과 적어도 80% 내지 97% 동일한, rAAV.
  25. 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 rAAV8.AR2.08캡시드가 N57, 263, 385, 514, 540 또는 이의 조합 중 하나 이상으로부터 적어도 4 개의 위치에서 적어도 약 50 내지 100% 탈아미드화를 포함하는 서열번호: 18로부터 아미노산 변형을 갖는 vp1, vp2 및/또는 vp3 단백질의 적어도 하위집단을 추가로 포함하는, rAAV.
  26. 제14항 내지 제25항 중 어느 한 항에 있어서, 상기 rAAV8.AR2.08캡시드가 위치 N94, N254, N305, N521, 또는 이의 조합 중 적어도 하나 이상에서 1% 내지 약 40% 탈아미드화를 추가로 포함하는 vp1, vp2 및/또는 vp3 단백질의 하위집단을 포함하는, rAAV.
  27. 제14항 내지 제25항 중 어느 한 항에 있어서, 상기 rAAV8.AR2.08캡시드가 아세틸화된 리신, 인산화된 세린 및/또는 트레오닌, 이성질체화된 아스파르트산, 산화된 트립토판 및/또는 메티오닌, 또는 아미드화된 아미노산 중 하나 이상에서 하나 이상의 변형으로부터 선택된 하나 이상의 변형을 추가로 포함하는 vp1, vp2 및/또는 vp3 단백질의 하위집단을 포함하는, rAAV.
  28. 재조합 아데노-연관 바이러스(rAAV)로서,
    (A) 하기 중 하나 이상을 포함하는 AAV5.5.9 캡시드:
    (1) 다음을 포함하는 AAV5.5.9 캡시드 단백질:
    서열번호: 10의 1 내지 736의 예측된 아미노산 서열을 암호화하는 핵산 서열로부터 발현에 의해 생성된 vp1 단백질, 서열번호: 9로부터 생성된 vp1 단백질, 또는 서열번호: 1의 1 내지 726의 예측된 아미노산 서열을 암호화하는 서열번호: 9와 적어도 70% 동일한 핵산 서열로부터 생성된 vp1 단백질로부터 선택된 AAV5.5.9 vp1 단백질의 이질적 집단,
    서열번호: 10의 적어도 약 아미노산 137 내지 726의 예측된 아미노산 서열을 암호화하는 핵산 서열로부터 발현에 의해 생성된 AAV5.5.9 vp2 단백질, 서열번호: 9의 적어도 뉴클레오티드 409 내지 2178을 포함하는 서열로부터 생성된 vp2 단백질, 또는 서열번호: 10의 적어도 약 아미노산 137 내지 726의 예측된 아미노산 서열을 암호화하는 서열번호: 9의 적어도 뉴클레오티드 409 내지 2178과 적어도 70% 동일한 핵산 서열로부터 생성된 vp2 단백질로부터 선택된 AAV5.5.9 vp2 단백질의 이질적 집단,
    서열번호: 10의 적어도 약 아미노산 193 내지 726의 예측된 아미노산 서열을 암호화하는 핵산 서열로부터 발현에 의해 생성된 AAV5.5.9 vp3 단백질, 서열번호: 9의 적어도 뉴클레오티드 577 내지 2178을 포함하는 서열로부터 생성된 vp3 단백질, 또는 서열번호: 10의 적어도 약 아미노산 193 내지 726의 예측된 아미노산 서열을 암호화하는 서열번호: 9의 적어도 뉴클레오티드 577 내지 2178과 적어도 70% 동일한 핵산 서열로부터 생성된 vp3 단백질로부터 선택된 AAV5.5.9 vp3 단백질의 이질적 집단; 및/또는
    (2) 서열번호: 10의 아미노산 서열을 암호화하는 핵산 서열의 생성물인 vp1 단백질의 이질적 집단, 서열번호: 10의 적어도 약 아미노산 137 내지 726의 아미노산 서열을 암호화하는 핵산 서열의 생성물인 vp2 단백질의 이질적 집단, 및 서열번호: 10의 적어도 아미노산 193 내지 726을 암호화하는 핵산 서열의 생성물인 vp3 단백질의 이질적 집단, 여기서 vp1, vp2 및 vp3 단백질은 서열번호: 10에서 아스파라긴 - 글리신 쌍에서 적어도 2 개의 고도로 탈아미드화된 아스파라긴(N)을 포함하는 아미노산 변형을 갖는 하위집단을 함유하고 임의적으로 다른 탈아미드화된 아미노산을 포함하는 하위집단을 추가로 포함하며, 여기서 탈아미드화는 아미노산 변화를 야기하는 것; 및
    (B) AAV5.5.9 캡시드 내 벡터 게놈으로, 상기 벡터 게놈은 AAV 도립된 말단 반복부 서열 및 숙주 세포에서 생성물의 발현을 지시하는 서열에 작동가능하게 연결된 생성물을 암호화하는 비-AAV 핵산 서열을 포함하는 핵산 분자를 포함하는 것
    을 포함하는, rAAV.
  29. 제28항에 있어서, 상기 탈아미드화된 아스파라긴이 아스파르트산, 이소아스파르트산, 상호전환 아스파르트산/이소아스파르트산 쌍, 또는 이의 조합으로 탈아미드화되는, rAAV.
  30. 제28항 또는 제29항에 있어서, 상기 캡시드가 (α)-글루탐산, γ-글루탐산, 상호전환 (α)-글루탐산/γ-글루탐산 쌍, 또는 이의 조합으로 탈아미드화되는 탈아미드화된 글루타민(들)을 추가로 포함하는, rAAV.
  31. 제28항 내지 제30항 중 어느 한 항에 있어서, 상기 AAV5.5.9 캡시드가 하기 중 하나 이상을 갖는 하위집단을 포함하는, rAAV:
    (a) 서열번호: 10의 넘버링에 기초하여, vp1 단백질의 위치 57에 위치한 아스파라긴 - 글리신 쌍에서 아스파라긴(N)의 적어도 75%가 탈아미드화됨;
    (b) 서열번호: 10의 아미노산 서열의 잔기 넘버링에 기초하여, vp1, v2 및 vp3 단백질의 위치 319에서 아스파라긴 - 글리신 쌍에서 N의 적어로 70%가 탈아미드화됨; 및/또는
    (c) 서열번호: 10의 아미노산 서열의 잔기 넘버링에 기초하여, vp1, v2 및 vp3 단백질의 위치 442에서 아스파라긴 - 글리신 쌍에서 N의 적어도 85%가 탈아미드화됨; 및/또는
    (d) 서열번호: 10의 아미노산 서열의 잔기 넘버링에 기초하여, vp1, v2 및 vp3 단백질의 위치 502에서 아스파라긴 - 글리신 쌍에서 N의 적어도 85%가 탈아미드화됨.
  32. 제28항 내지 제31항 중 어느 한 항에 있어서, 상기 rAAV5.5.9 캡시드가 질량 분석법을 사용하여 결정 시, vp1 단백질의 위치 57에서 N의 75% 내지 100%가 탈아미드화된 vp1의 하위집단을 포함하는, rAAV.
  33. 제28항 내지 제32항 중 어느 한 항에 있어서, 상기 rAAV5.5.9 캡시드가 질량 분석법을 사용하여 결정 시, 서열번호: 10의 넘버링에 기초하여, 위치 319에서 N의 75% 내지 100%가 탈아미드화된 vp1 단백질, vp2 단백질, 및/또는 vp3 단백질의 하위집단을 포함하는, rAAV.
  34. 제28항 내지 제33항 중 어느 한 항에 있어서, 상기 rAAV5.5.9 캡시드가 질량 분석법을 사용하여 결정 시, 서열번호: 10의 넘버링에 기초하여, 위치 442에서 N의 75% 내지 100%가 탈아미드화된 vp1 단백질, vp2 단백질, 및/또는 vp3 단백질의 하위집단을 포함하는, rAAV.
  35. 제28항 내지 제34항 중 어느 한 항에 있어서, 상기 rAAV5.5.9 캡시드가 서열번호: 10의 넘버링에 기초하여, 위치 502에서 N의 75% 내지 100%가 탈아미드화된 vp1 단백질, vp2 단백질, 및/또는 vp3 단백질의 하위집단을 포함하는, rAAV.
  36. 제28항 내지 제35항 중 어느 한 항에 있어서, 상기 단백질을 암호화하는 핵산 서열이 서열번호: 9, 또는 서열번호: 10의 아미노산 서열을 암호화하는 서열번호: 9와 적어도 80% 내지 적어도 99% 동일한 서열인, rAAV.
  37. 제36항에 있어서, 상기 핵산 서열이 서열번호: 9와 적어도 80% 내지 97% 동일한, rAAV.
  38. 제28항 내지 제36항 중 어느 한 항에 있어서, 상기 rAAV5.5.9 캡시드가 위치 N35, N113, N204, N217, N243, N249, N293/294, N304, N399.400, N467, N505, Q589, N618, N641, N653, N658, N699, 또는 이의 조합 중 적어도 하나 이상에서 1% 내지 약 40% 탈아미드화를 추가로 포함하는 vp1, vp2 및/또는 vp3 단백질의 하위집단을 포함하는, rAAV.
  39. 제28항 내지 제38항 중 어느 한 항에 있어서, 상기 rAAV5.5.9 캡시드가 아세틸화된 리신, 인산화된 세린 및/또는 트레오닌, 이성질체화된 아스파르트산, 산화된 트립토판 및/또는 메티오닌, 또는 아미드화된 아미노산 중 하나 이상에서 하나 이상의 변형으로부터 선택된 하나 이상의 변형을 추가로 포함하는 vp1, vp2 및/또는 vp3 단백질의 하위집단을 포함하는, rAAV.
  40. 제1항 내지 제39항 중 어느 한 항에 있어서, 상기 rAAV가 약 1 vp1 대 약 1 내지 1.5 vp2 대 3 내지 10 vp3 단백질의 비로 약 60 개의 총 캡시드 단백질을 포함하는, rAAV.
  41. 제1항 내지 제40항 중 어느 한 항에 있어서, 상기 AAV ITR 서열이 캡시드를 제공하는 AAV 이외의 AAV 공급원으로부터의 5' ITR 및 3' ITR인, rAAV.
  42. 제1항 내지 제41항 중 어느 한 항에 따른 AAV 및 약제학적 담체, 부형제, 및/또는 희석제를 포함하는 조성물.
  43. 원하는 유전자 산물을 이를 필요로 하는 대상체에 전달하기 위한 제1항 내지 제41항 중 어느 한 항에 따른 rAAV 또는 제42항에 따른 조성물.
  44. 원하는 유전자 산물을 이를 필요로 하는 대상체에 전달하기 위한 제1항 내지 제41항 중 어느 한 항에 따른 AAV 또는 제42항에 따른 조성물의 용도.
  45. 하기를 함유하는 숙주 세포를 배양하는 단계를 포함하는, AAV 캡시드를 포함하는 재조합 AAV를 생성하는 방법: (a) vp1 캡시드 단백질, 아미노산 1 내지 738, 서열번호: 2(AAVrh79 캡시드 단백질); vp2 캡시드 단백질, 아미노산 138 내지 738, 서열번호: 2(AAVrh79 캡시드 단백질); 또는 vp3 캡시드 단백질, 아미노산 204 내지 738, 서열번호: 2(AAVrh79 캡시드 단백질)로부터 선택된 AAV 캡시드 단백질을 암호화하는 핵산 서열; (b) 기능적 rep 유전자; (c) AAV 도립된 말단 반복부(ITR) 및 전이유전자를 포함하는 미니유전자; 및 (d) 미니유전자를 AAV 캡시드 내에 패키징하도록 하기에 충분한 헬퍼 기능.
  46. 하기를 함유하는 숙주 세포를 배양하는 단계를 포함하는, AAV 캡시드를 포함하는 재조합 AAV를 생성하는 방법: (a) vp1 캡시드 단백질, 아미노산 1 내지 738, 서열번호: 18(AAV8.AR2.08캡시드 단백질); vp2 캡시드 단백질, 아미노산 138 내지 738, 서열번호: 18(AAV8.AR2.08캡시드 단백질); 또는 vp3 캡시드 단백질, 아미노산 204 내지 738, 서열번호: 18(AAV8.AR2.08캡시드 단백질)로부터 선택된 AAV 캡시드 단백질을 암호화하는 핵산 서열; (b) 기능적 rep 유전자; (c) AAV 도립된 말단 반복부(ITR) 및 전이유전자를 포함하는 미니유전자; 및 (d) 미니유전자를 AAV 캡시드 내에 패키징하도록 하기에 충분한 헬퍼 기능.
  47. 하기를 함유하는 숙주 세포를 배양하는 단계를 포함하는, AAV 캡시드를 포함하는 재조합 AAV를 생성하는 방법: (a) vp1 캡시드 단백질, 아미노산 1 내지 736, 서열번호: 10(AAV5.5.9 캡시드 단백질); vp2 캡시드 단백질, 아미노산 138 내지 736, 서열번호: 10(AAV5.5.9 캡시드 단백질); 또는 vp3 캡시드 단백질, 아미노산 203 내지 736, 서열번호: 10(AAV5.5.9 캡시드 단백질)으로부터 선택된 AAV 캡시드 단백질을 암호화하는 핵산 서열; (b) 기능적 rep 유전자; (c) AAV 도립된 말단 반복부(ITR) 및 전이유전자를 포함하는 미니유전자; 및 (d) 미니유전자를 AAV 캡시드 내에 패키징하도록 하기에 충분한 헬퍼 기능.
  48. 제1항 내지 제47항 중 어느 한 항에 따른 AAV로 시험관 내에서 형질감염된 숙주 세포.
  49. 재조합 핵산 분자로서,
    (a) 서열번호: 2의 아미노산 1 내지 738을 포함하는 예측된 아미노산 서열을 암호화하거나; 또는
    (b) 서열번호: 1의 뉴클레오티드 1 내지 2214, 또는 서열번호: 1의 뉴클레오티드 1 내지 2214와 적어도 99% 동일한 뉴클레오티드 서열을 포함하며,
    AAV 도립된 말단 반복부를 함유하지 않는, 재조합 핵산 분자.
  50. 재조합 핵산 분자로서,
    (a) 서열번호: 18의 아미노산 1 내지 738을 포함하는 예측된 아미노산 서열을 암호화하거나; 또는
    (b) 서열번호: 17의 뉴클레오티드 1 내지 2214, 또는 서열번호: 17의 뉴클레오티드 1 내지 2214와 적어도 99% 동일한 뉴클레오티드 서열을 포함하며,
    AAV 도립된 말단 반복부를 함유하지 않는, 재조합 핵산 분자.
  51. 재조합 핵산 분자로서,
    (a) 서열번호: 10의 아미노산 1 내지 736을 포함하는 예측된 아미노산 서열을 암호화하거나; 또는
    (b) 서열번호: 1의 뉴클레오티드 1 내지 2214, 또는 서열번호: 1의 뉴클레오티드 1 내지 2214와 적어도 99% 동일한 뉴클레오티드 서열을 포함하며,
    AAV 도립된 말단 반복부를 함유하지 않는, 재조합 핵산 분자.
  52. 제49항 내지 제51항 중 어느 한 항에 있어서, 기능적 rep 유전자를 추가로 포함하는, 재조합 핵산 분자.
  53. 제49항 내지 제51항 중 어느 한 항에 있어서, 상기 재조합 핵산 분자가 플라스미드인, 재조합 핵산 분자.
  54. 제49항 내지 제53항 중 어느 한 항에 따른 재조합 핵산 분자로 형질감염된 숙주 세포.
  55. 제54항에 있어서, 기능적 rep 유전자, AAV 도립된 말단 반복부(ITR) 및 전이유전자를 포함하는 미니유전자, 및 미니유전자를 AAV 캡시드 내에 패키징하도록 하기에 충분한 헬퍼 기능을 포함하는, 숙주 세포.
  56. 제1항 내지 제41항 중 어느 한 항에 따른 재조합 AAV를 생성하는 데 유용한 rAAV 생산 시스템으로서,
    (a) 서열번호: 2, 서열번호: 10 또는 서열번호: 18의 아미노산 서열을 암호화하는 AAV 캡시드 핵산 서열;
    (b) AAV 캡시드 내에 패키징하기에 적합한 핵산 분자로, 적어도 하나의 AAV 도립된 말단 반복부(ITR) 및 숙주 세포에서 생성물의 발현을 지시하는 서열에 작동가능하게 연결된 유전자 산물을 암호화하는 비-AAV 핵산 서열을 포함하는, 핵산 분자; 및
    (c) 핵산 분자를 재조합 AAV 캡시드 내에 패키징하도록 하기에 충분한 AAV rep 기능 및 헬퍼 기능을 포함하는, 시스템.
  57. 제56항에 있어서, 상기 (a)의 핵산 서열이 적어도 서열번호: 1, 또는 서열번호: 2의 아미노산 서열을 암호화하는 서열번호: 1과 적어도 70% 내지 적어도 99% 동일한 서열을 포함하는, 시스템.
  58. 제56항에 있어서, 상기 (a)의 핵산 서열이 적어도 서열번호: 9, 또는 서열번호: 10의 아미노산 서열을 암호화하는 서열번호: 9와 적어도 70% 내지 적어도 99% 동일한 서열을 포함하는, 시스템.
  59. 제56항에 있어서, 상기 (a)의 핵산 서열이 적어도 서열번호: 17, 또는 서열번호: 18의 아미노산 서열을 암호화하는 서열번호: 17과 적어도 70% 내지 적어도 99% 동일한 서열을 포함하는, 시스템.
  60. 제56항 내지 제59항 중 어느 한 항에 있어서, 상기 세포 배양물이 인간 배아 신장 293 세포를 포함하는, 시스템.
  61. 제56항 내지 제60항 중 어느 한 항에 있어서, 상기 AAV rep가 캡시드를 공급하는 것과 상이한 AAV로부터 유래되는, 시스템.
  62. 제61항에 있어서, 상기 AAV rep가 AAV2로부터 유래되는, 시스템.
  63. 역가, 효능, 또는 형질도입이 증가된 rAAV의 집단을 포함하는 조성물로, rAAV가 AAVhu68이 아니면, 표 A(AAVrh79), 표 B(AAV8.AR2.08), 또는 표 C(AAV5.5.9) 중 임의의 하나에 따른 캡시드 탈아미드화 패턴으로 탈아미드화 패턴을 갖는 rAAV와 비교하여 총 탈아미드화가 감소되도록 변형된 캡시드를 갖는 rAAV를 포함하는, 조성물.
  64. 제63항에 있어서, 상기 rAAV 캡시드가 하기 이외의 위치에서 변형되는, 조성물:
    (a) AAVrh79 캡시드에 대해, 초기 M으로 예측된 vp1 아미노산 서열의 넘버링에 기초하여, 서열번호: 2의 넘버링에 기초한 N57, N263, N398, 및/또는 N514;
    (b) AAV8.AR2.08 캡시드에 대해, 초기 M으로 예측된 vp1 아미노산 서열의 넘버링에 기초하여, 서열번호: 18의 넘버링을 참조한 N57, N263, N398, N514 및/또는 N540;
    (c) AAV5.5.9 캡시드에 대해, 초기 M으로 예측된 vp1 아미노산 서열의 넘버링에 기초하여, 서열번호: 10의 넘버링을 참조한 N57, N319, N442, 및/또는 N502.
KR1020207027462A 2018-02-27 2019-02-27 캡시드 탈아미드화가 감소된 신규 아데노-연관 바이러스(aav) 벡터 및 이의 용도 KR20210006327A (ko)

Applications Claiming Priority (29)

Application Number Priority Date Filing Date Title
US201862635964P 2018-02-27 2018-02-27
US201862635968P 2018-02-27 2018-02-27
US62/635,964 2018-02-27
US62/635,968 2018-02-27
US201862663788P 2018-04-27 2018-04-27
US201862663797P 2018-04-27 2018-04-27
US62/663,797 2018-04-27
US62/663,788 2018-04-27
US201862667587P 2018-05-06 2018-05-06
US62/667,587 2018-05-06
US201862667888P 2018-05-07 2018-05-07
US201862667881P 2018-05-07 2018-05-07
US62/667,888 2018-05-07
US62/667,881 2018-05-07
US201862677474P 2018-05-29 2018-05-29
US201862667585P 2018-05-29 2018-05-29
US201862677471P 2018-05-29 2018-05-29
US62/677,471 2018-05-29
US62/667,585 2018-05-29
US62/677,474 2018-05-29
US201862703670P 2018-07-26 2018-07-26
US201862703673P 2018-07-26 2018-07-26
US62/703,673 2018-07-26
US62/703,670 2018-07-26
US201862722382P 2018-08-24 2018-08-24
US201862722388P 2018-08-24 2018-08-24
US62/722,382 2018-08-24
US62/722,388 2018-08-24
PCT/US2019/019861 WO2019169004A1 (en) 2018-02-27 2019-02-27 Novel adeno-associated virus (aav) vectors, aav vectors having reduced capsid deamidation and uses therefor

Publications (1)

Publication Number Publication Date
KR20210006327A true KR20210006327A (ko) 2021-01-18

Family

ID=67809202

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020207027462A KR20210006327A (ko) 2018-02-27 2019-02-27 캡시드 탈아미드화가 감소된 신규 아데노-연관 바이러스(aav) 벡터 및 이의 용도

Country Status (13)

Country Link
US (1) US20210123073A1 (ko)
EP (1) EP3768695A4 (ko)
KR (1) KR20210006327A (ko)
CN (1) CN112236443A (ko)
AU (1) AU2019228504A1 (ko)
BR (1) BR112020017278A2 (ko)
CA (1) CA3091795A1 (ko)
CL (1) CL2020002201A1 (ko)
IL (1) IL276860A (ko)
MA (1) MA52087A (ko)
MX (1) MX2020008932A (ko)
SG (1) SG11202007942YA (ko)
WO (1) WO2019169004A1 (ko)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3831842A1 (en) 2015-09-28 2021-06-09 The University of North Carolina at Chapel Hill Methods and compositions for antibody-evading virus vectors
EP3774854A1 (en) 2018-04-03 2021-02-17 Stridebio, Inc. Antibody-evading virus vectors
EP3884057A4 (en) * 2018-12-21 2022-09-07 The University of North Carolina at Chapel Hill OPTIMIZED GALC GENES AND EXPRESSION CASSETTE AND THEIR USE
TW202102525A (zh) 2019-03-21 2021-01-16 美商史崔德生物公司 重組腺相關病毒載體
MX2022004352A (es) 2019-10-17 2022-07-19 Stridebio Inc Vectores virales adenoasociados para el tratamiento de la enfermedad de niemann-pick tipo c.
WO2021080991A1 (en) * 2019-10-21 2021-04-29 The Trustees Of The University Of Pennsylvania Aav3b variants with improved production yield and liver tropism
BR112022012813A2 (pt) * 2020-01-03 2022-09-27 Sarepta Therapeutics Inc Métodos para analisar proteínas do capsídeo de aav
EP4117735A4 (en) * 2020-03-09 2024-04-10 Univ Massachusetts GENE REPLACEMENT THERAPY FOR FOXG1 SYNDROME
CA3183153A1 (en) 2020-06-17 2021-12-23 Christian HINDERER Compositions and methods for treatment of gene therapy patients
CN116438311A (zh) 2020-07-13 2023-07-14 宾夕法尼亚州大学信托人 可用于治疗夏科-马里-图思病的组合物
TW202229315A (zh) * 2020-10-18 2022-08-01 賓州大學委員會 改良的腺相關病毒(aav)載體及其用途
WO2022165313A1 (en) 2021-02-01 2022-08-04 Regenxbio Inc. Gene therapy for neuronal ceroid lipofuscinoses
KR20230170022A (ko) 2021-04-12 2023-12-18 더 트러스티스 오브 더 유니버시티 오브 펜실베니아 척수 및 연수 근위축증(sbma) 치료에 유용한 조성물
WO2023081807A1 (en) * 2021-11-04 2023-05-11 The Trustees of the University of Pennsylvania Penn Center for Innovation Compositions and methods for reducing pcsk9 levels in a subject
WO2023133584A1 (en) 2022-01-10 2023-07-13 The Trustees Of The University Of Pennsylvania Compositions useful in treatment of metachromatic leukodystrophy
AR128239A1 (es) 2022-01-10 2024-04-10 Univ Pennsylvania Composiciones y métodos útiles para el tratamiento de trastornos mediados por c9orf72
WO2023196892A1 (en) 2022-04-06 2023-10-12 The Trustees Of The University Of Pennsylvania Passive immunization with anti- aav neutralizing antibodies to prevent off-target transduction of intrathecally delivered aav vectors

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004083441A2 (en) * 2003-03-19 2004-09-30 Deutsches Krebsforschungszentrum Stiftung des öffentlichen Rechts Random peptide library displayed on aav vectors
AU2004278684B2 (en) * 2003-09-30 2011-05-12 The Trustees Of The University Of Pennsylvania Adeno-associated virus (AAV) clades, sequences, vectors containing same, and uses therefor
CN112029737A (zh) * 2005-04-07 2020-12-04 宾夕法尼亚大学托管会 增强腺相关病毒载体功能的方法
EP3198018B1 (en) * 2014-09-24 2020-12-09 City of Hope Adeno-associated virus vector variants for high efficiency genome editing and methods thereof
EP3224362A4 (en) * 2014-11-26 2018-06-06 The Regents of The University of California Therapeutic compositions comprising transcription factors and methods of making and using the same
JP7140683B2 (ja) * 2016-04-15 2022-09-21 ザ・トラステイーズ・オブ・ザ・ユニバーシテイ・オブ・ペンシルベニア 新規なaav8変異カプシド及びそれを含有する組成物
US11584780B2 (en) * 2016-07-26 2023-02-21 Biomarin Pharmaceutical Inc. Adeno-associated virus capsid proteins
AU2017312951B2 (en) * 2016-08-15 2024-02-08 Genzyme Corporation Methods for detecting AAV
SG10201912976WA (en) * 2017-02-28 2020-02-27 Univ Pennsylvania Adeno-associated virus (aav) clade f vector and uses therefor
JOP20190200A1 (ar) * 2017-02-28 2019-08-27 Univ Pennsylvania تركيبات نافعة في معالجة ضمور العضل النخاعي

Also Published As

Publication number Publication date
MX2020008932A (es) 2020-10-01
WO2019169004A1 (en) 2019-09-06
CN112236443A (zh) 2021-01-15
BR112020017278A2 (pt) 2020-12-22
JP2021515548A (ja) 2021-06-24
CL2020002201A1 (es) 2020-12-18
CA3091795A1 (en) 2019-09-06
SG11202007942YA (en) 2020-09-29
AU2019228504A1 (en) 2020-09-10
IL276860A (en) 2020-10-29
WO2019169004A9 (en) 2019-10-31
US20210123073A1 (en) 2021-04-29
EP3768695A1 (en) 2021-01-27
WO2019169004A8 (en) 2019-12-05
EP3768695A4 (en) 2022-04-06
MA52087A (fr) 2021-06-02

Similar Documents

Publication Publication Date Title
US20240117322A1 (en) Novel adeno-associated virus (aav) clade f vector and uses therefor
US20200407750A1 (en) Novel adeno-associated virus (aav) vectors, aav vectors having reduced capsid deamidation and uses therefor
US20210123073A1 (en) Novel adeno-associated virus (aav) vectors, aav vectors having reduced capsid deamidation and uses therefor
US20230407333A1 (en) Aav capsids and compositions containing same
US20230002788A1 (en) Aav3b variants with improved production yield and liver tropism
JP7498665B2 (ja) 新規アデノ随伴ウイルス(aav)ベクター、低減されたカプシド脱アミド化を有するaavベクター、およびその使用
AU2018227440B2 (en) Adeno-associated virus (AAV) clade f vector and uses therefor
WO2024015966A2 (en) Recombinant aav having aav clade d and clade e capsids and compositions containing same
TW202309066A (zh) 衍生自豬的腺相關病毒衣殼及其用途

Legal Events

Date Code Title Description
A201 Request for examination