KR20220011664A - 변형된 바이러스 입자 및 이의 용도 - Google Patents

변형된 바이러스 입자 및 이의 용도 Download PDF

Info

Publication number
KR20220011664A
KR20220011664A KR1020217041074A KR20217041074A KR20220011664A KR 20220011664 A KR20220011664 A KR 20220011664A KR 1020217041074 A KR1020217041074 A KR 1020217041074A KR 20217041074 A KR20217041074 A KR 20217041074A KR 20220011664 A KR20220011664 A KR 20220011664A
Authority
KR
South Korea
Prior art keywords
aav
protein
amino acid
acid sequence
capsid protein
Prior art date
Application number
KR1020217041074A
Other languages
English (en)
Inventor
리 사빈
크리스토스 키랏수스
스벤 몰러-탱크
Original Assignee
리제너론 파마슈티칼스 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 리제너론 파마슈티칼스 인코포레이티드 filed Critical 리제너론 파마슈티칼스 인코포레이티드
Publication of KR20220011664A publication Critical patent/KR20220011664A/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/315Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Streptococcus (G), e.g. Enterococci
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14123Virus like particles [VLP]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14145Special targeting system for viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14151Methods of production or purification of viral material
    • C12N2750/14152Methods of production or purification of viral material relating to complementing cells and packaging systems for producing virus or viral particles

Abstract

비영장류 동물 AAV, 원격 AAV, 또는 이들의 조합의 캡시드를 포함하는 아데노-연관 바이러스(AAV) 입자를 구성하기 위한 조성물 및 방법이 본원에 제공된다. 이에 따라 구성된 AAV는 치료를 필요로 하는 환자를 치료하기 위한 실행 가능한 유전자 요법 플랫폼일 수 있고, 현재의 치료용 AAV 입자에 대한 항체 역가가 높아서 현재의 치료용 AAV 입자를 포함하는 현재의 치료 방법에서 제외된 환자에게 특히 유용할 수 있다.

Description

변형된 바이러스 입자 및 이의 용도
서열 목록에 대한 참조
EFS 웹을 통해 텍스트 파일로 제출됨
10364WO01_ST25.txt 파일에 기록된 서열 목록은 269 킬로바이트이고, 2020년 5월 19일에 생성되었으며, 본원에 참조로서 통합된다.
기술 분야
본원의 개시는 비영장류 동물 AAV 및/또는 원격 AAV의 캡시드 단백질을 포함하는 재조합 AAV 입자를 제조하고 사용하는 방법에 관한 것이다.
특정 표적 세포 내로 유전자를 전달하는 것은 다양한 만성 유전적 질환의 잠재적인 치료를 위한 현대 의약에 있어서 가장 중요한 기술 중 하나가 되었다. 지금까지, 유전자 치료를 임상에 적용함에 있어서의 진전은 이상적인 유전자 전달 비히클의 결여로 인해 제한되어 왔다.
이상적으로는, 유전자 전달 비히클은 (1) 유전 물질을 원하는 세포 내로 안정적으로 도입하고, (2) 유전 물질이 비표적 세포 내로 도입되는 것을 피하고, (3) 환자의 면역 체계, 예를 들어 환자의 항체에 의한 중화를 벗어날 수 있다. 현재 몇 가지 비병원성 비히클을 이용할 수 있지만, 이들 비히클이 특이적 세포를 형질도입하고 숙주 면역 반응에 대해 비가시적인 상태로 스스로를 유지시키는 능력은 여전히 이상적인 수준에 못미친다.
예를 들어, 영장류, 특히 인간으로부터 단리한 아데노 연관 바이러스(AAV)(예: AAV 혈청형 AAV2, AAV4, AAV6, AAV7, AAV8, 및 AAV9)에 근거한 바이러스 입자는 많은 연구의 초점이 되어 왔는데, 이는 AAV가 독성 또는 병원성의 증거 없이 생체 내에서 광범위한 영장류 종 및 조직을 형질도입할 수 있기 때문에 었다. (Muzyczka 등의 문헌[(1992) Current Topics in Microbiology and Immunology, 158:97-129]). 또한, AAV는 분열후 조직을 안전하게 형질도입한다. 바이러스가 가끔씩 숙주 염색체에 통합될 수는 있지만, 매우 드물게 인간 염색체 19의 세이프 하버(safe-harbor) 유전자좌 내로 통합되고, 복제 (Rep) 단백질이 트랜스로 공급될 때에 한해서 통합된다. AAV 게놈은 감염된 세포에서 신속하게 순환하고 연쇄체화(concatemerize)되며 감염된 세포에서 안정한 에피솜 상태로 존재하여 이들의 페이로드(payload)를 장기적으로 안정하게 발현한다.
또한, 영장류 AAV 감염증을 조작하고 특정 세포에 대해 재유도하는 것은 달성된 것은 불과 몇 년 전이다. 바이러스 입자를 사용한 표적화 유전자 요법의 진전은 바이러스 입자의 비-재조합(비-유전자) 또는 재조합(유전자) 변형으로서 요약될 수 있으며, 이는 바이러스 입자의 위형화, 증식, 및/또는 바이러스 입자의 자연 향성의 재표적화로 이어진다. (Nicklin 및 Baker읨 문헌[(2002) Curr. Gene Ther. 2:273-93]; Verheiji 및 Rottier의 문헌[(2012) Advances Virol 2012:1-15]에서 검토됨).
직접적인 재조합 표적화 접근법에서, 표적화 리간드는 바이러스 캡시드에 직접 삽입되거나 이에 결합된다. 즉, 단백질 바이러스 캡시드 유전자가 이종 표적화 리간드를 포함하는 캡시드 단백질을 발현하도록 변형된다. 그런 다음, 표적화 리간드는 표적 세포 상에서 우선적으로 또는 배타적으로 발현되는 수용체 또는 마커를 재유도(예를 들어 이에 결합)한다. (Stachler 등의 문헌[(2006) Gene Ther. 13:926-931]; White 등의 문헌[(2004) Circulation 109:513-519]과 더불어 Park 등의 문헌[(2007) Frontiers in Bioscience 13:2653-59]; Girod 등의 문헌[(1999) Nature Medicine 5:1052-56]; Grifman 등의 문헌[(2001) Molecular Therapy 3:964-75]; Shi 등의 문헌[(2001) Human Gene Therapy 12:1697-1711]; Shi 및 Bartlett의 문헌[(2003) Molecular Therapy 7:515-525]도 참조한다).
간접적인 재조합 접근법에서, 바이러스 캡시드는 이종 "스캐폴드(scaffold)"를 사용해 변형된 다음, 표적화 리간드를 포함하는 어댑터에 연결된다. 어댑터는 스캐폴드 및 표적 셀에 결합한다. (아놀드 등의 문헌[(2006) Mol. Ther. 5:125-132]; Ponnazhagen 등의 문헌[(2002) J. Virol. 76: 12900~907]; 및 WO 97/05266 참조). (1) 항체 어댑터의 Fc에 결합하는 Fc 결합 분자(예: Fc 수용체, 단백질 A, 등), (2) 비오티닐화 어댑터에 결합하는 (스트렙트)아비딘, (3) (스트렙트)아비딘과 융합된 어댑터에 결합하는 비오틴, (4) 검출 가능한 표지 및 표적 분자에 비공유 결합할 수 있는 이중 특이적 어댑터가 결합된 바이러스 입자의 검출 및/또는 단리에 유용한 검출 가능한 표지, 및 최근의 (5) 이소펩티드 결합을 형성하는 단백질:단백질 결합 쌍과 같은 스캐폴드가 다양한 바이러스 입자에 대해 기술되어 왔다. (예를 들어, Gigout 등의 문헌[(2005) Molecular Therapy 11:856-865]; Stachler 등의 문헌[(2008) Molecular Therapy 16:1467-1473]; Quetglas 등의 문헌[(2010) Virus Research 153:179-196]; Ohno 등의 문헌[(1997) Nature Biotechnology 15:763-767]; Klimstra 등의 문헌[(2005) Virology 338:9-21] 참조).
AAV 감염을 유도하는 능력을 제공하는 진전이 있었음에도 불구하고, 유전자 전달 비히클로서 재표적화된 AAV는, AAV 캡시드(NAb)에 대한 중화 항체의 존재로 인해, 이상적인 수준에 미치지 못한 상태로 남아 있다. 어린이에게 AAV NAb가 존재한다는 것은 AAV로 인한 감염이 생애 초기에 발생한다는 것을 시사한다(Calcedo 등의 문헌[(2011) ASGCT]; Huser 등의 문헌[(2017) J. Virol. 91:e02137-16]). 생애 초기에 AAV 감염에 의해 생성된 항체는 이들 기존 항체에 의해 인식되고 중화되는 AAV로부터 유래된 AAV 유전자 요법 벡터의 후속 사용을 손상시킬 수 있는 것으로 나타났다. (Hurlbut 등의 문헌[(2010) Mol. Ther. 18:1983-94]; Jiang 등의 문헌[(2006) Blood 108:3321-8]; Manno 등의 문헌[(2006) Nat. Med. 12:342-7]; Scallan 등의 문헌[(2006) Blood 107:1810-7]; Wang 등의 문헌[(2010) Mol. Ther. 18:126-34]). 또한, 높은 역가를 가진 환자들은 AAV 혈청형을 포함하는 임의의 치료에 부적합한 것으로 간주되기 때문에, AAV 혈청형에 대한 중화 항체 역가의 존재는 임상적으로 유의하다. (Jeune 등의 문헌[(2013) Hum Gene Ther Methods 24:59-67]).
따라서, 비병원성이고, 다양한 표적 세포에게 관심 핵산의 표적화 전달에 맞게 구성되며, 치료를 필요로 하는 환자에게서 기존 항체에 의해 야기된 장애물을 극복하는 바이러스 시스템에 대한 필요성이 여전히 존재한다.
이전의 및 현재의 아데노-연관 바이러스(AAV) 입자 치료 접근법과 관련된 여러 가지 문제를 동시에 완화시킬 수 있는 전략이 본원에 기술된다. 이론에 구속되고자 함이 없이, 대부분의 인간은 인간에 의한 AAV에 대한 이전 노출이 적은 AAV에 대해 기존 NAb가 부족할 것으로 예상된다. 그러나, 특정 세포를 표적화하여 감염시키고/시키거나 인간 모집단에서 임의의 기존 항체에 의한 교차 반응성을 회피할 수 있는 유전자 요법 벡터로서 사용하기 위해 성공적으로 조작될 수 있는 이러한 AAV 혈청형의 능력은 지금까지 알려지지 않았다.
본원은, 비영장류 동물 종의 AAV 캡시드 단백질을 변형하여, 관심 뉴클레오티드를 상이한 동물 종의 포유류 세포 내로 표적화하여 도입할 수 있다는 것을 보여준다. 또한, 본원은, 그렇게 변형된 비영장류 동물 AAV 입자가 잘 특성화된 인간 AAV 혈청형에 기초하는 현재의 AAV 치료 방법보다 인간 모집단에서 발견되는 기존 항체에 의해 인식되고/되거나 검출될 가능성이 더 낮다는 것을 보여준다. 따라서, 선택된 세포를 감염시킬 수 있고 기존 항체에 의한 중화를 더 잘 회피할 수 있는 재조합 AAV 바이러스 입자가 본원에 기술된다.
본원에는 (i) AAV VP1, VP2, 및 VP3 캡시드 단백질을 포함하는 AAV 캡시드, 및 (ii) AAV 역위 말단 반복(ITR) 서열을 포함하고, AAV 캡시드 내에 포장된 핵산 서열을 포함하는 재조합 AAV 바이러스 입자가 기술되며,
여기서
a) AAV VP1 캡시드 단백질,
b) AAV VP1 캡시드 단백질의 임의의 일부,
c) AAV VP2 캡시드 단백질,
d) AAV VP2 캡시드 단백질의 임의의 일부,
e) AAV VP3 캡시드 단백질, 및
f) AAV VP3 캡시드 단백질의 임의의 일부 중 적어도 하나는
비영장류 동물 AAV 또는 이의 일부, 또는 원격 AAV 또는 이의 일부의 캡시드 단백질의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95%의 동일성을 갖는 아미노산 서열을 포함하고,
여기서
I. AAV VP1, VP2, 및 VP3 캡시드 단백질 중 적어도 하나는
(a) 단백질:단백질 결합 쌍의 제1 구성원(여기서, 단백질:단백질 결합 쌍은 AAV 바이러스 입자의 향성을 유도함),
(b) 검출 가능한 표지,
(c) 점 돌연변이, 바람직하게는, AAV 바이러스 입자의 천연 향성을 감소시키고/시키거나 검출 가능한 표지를 생성하는 점 돌연변이,
(d) 키메라 아미노산 서열, 및
(e) (a), (b), (c), 및 (d)의 임의의 조합으로 이루어진 군으로부터 선택된 변형을 포함하고/하거나,
II. ITR 서열 또는 이의 일부는 제2 AAV 또는 이의 일부의 ITR 서열과 상당한 서열 동일성, 예를 들어 적어도 95%의 동일성을 갖는 핵산 서열을 포함하되, 제2 AAV는 비영장류 동물 AAV 또는 원격 AAV와 동일하지 않으며,
재조합 AAV 바이러스 입자는 포유류 숙주, 바람직하게는 영장류 숙주를 감염시킬 수 있다.
일부 구현예에서, 재조합 AAV 바이러스 입자는 (i) AAV VP1, VP2, 및 VP3 캡시드 단백질을 포함하는 AAV 캡시드, 및 (ii) AAV 역위 말단 반복(ITR) 서열을 포함하고, AAV 캡시드 내에 포장된 핵산 서열을 포함하고,
여기서
a) AAV VP1 캡시드 단백질,
b) AAV VP2 캡시드 단백질, 및
c) AAV VP3 캡시드 단백질 중 적어도 하나는
비영장류 동물 AAV 또는 원격 AAV의 캡시드 단백질의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95%의 동일성을 갖는 아미노산 서열을 포함하고,
여기서
I. AAV VP1, VP2, 및 VP3 캡시드 단백질 중 적어도 하나는
(a) 단백질:단백질 결합 쌍의 제1 구성원(여기서, 단백질:단백질 결합 쌍은 AAV 바이러스 입자의 향성을 유도함),
(b) 검출 가능한 표지,
(c) 점 돌연변이, 바람직하게는, AAV 바이러스 입자의 천연 향성을 감소시키고/시키거나 검출 가능한 표지를 생성하는 점 돌연변이,
(d) 키메라 아미노산 서열, 및
(e) (a), (b), (c), 및 (d)의 임의의 조합으로 이루어진 군으로부터 선택된 변형을 포함하고/하거나,
II. ITR 서열 또는 이의 일부는 제2 AAV 또는 이의 일부의 ITR 서열과 상당한 서열 동일성, 예를 들어 적어도 95%의 동일성을 갖는 핵산 서열을 포함하되, 제2 AAV는 비영장류 동물 AAV 또는 원격 AAV와 동일하지 않으며,
재조합 AAV 바이러스 입자는 포유류 숙주, 바람직하게는 영장류 숙주를 감염시킬 수 있다.
일부 구현예에서, 재조합 AAV 바이러스 입자는 (i) AAV VP1, VP2, 및 VP3 캡시드 단백질을 포함하는 AAV 캡시드, 및 (ii) AAV 역위 말단 반복(ITR) 서열을 포함하고, AAV 캡시드 내에 포장된 핵산 서열을 포함하고,
여기서
a. AAV VP1 캡시드 단백질의 임의의 일부,
b. AAV VP2 캡시드 단백질의 임의의 일부, 및
c. AAV VP3 캡시드 단백질의 임의의 일부 중 적어도 하나는
비영장류 동물 AAV 또는 이의 일부, 또는 원격 AAV 또는 이의 일부의 캡시드 단백질의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95%의 동일성을 갖는 아미노산 서열을 포함하고,
여기서
I. AAV VP1, VP2, 및 VP3 캡시드 단백질 중 적어도 하나는
(a) 단백질:단백질 결합 쌍의 제1 구성원(여기서, 단백질:단백질 결합 쌍은 AAV 바이러스 입자의 향성을 유도함),
(b) 검출 가능한 표지,
(c) 점 돌연변이, 바람직하게는, AAV 바이러스 입자의 천연 향성을 감소시키고/시키거나 검출 가능한 표지를 생성하는 점 돌연변이,
(d) 키메라 아미노산 서열, 및
(e) (a), (b), (c), 및 (d)의 임의의 조합으로 이루어진 군으로부터 선택된 변형을 포함하고/하거나,
II. ITR 서열 또는 이의 일부는 제2 AAV 또는 이의 일부의 ITR 서열과 상당한 서열 동일성, 예를 들어 적어도 95%의 동일성을 갖는 핵산 서열을 포함하되, 제2 AAV는 비영장류 동물 AAV 또는 원격 AAV와 동일하지 않으며,
재조합 AAV 바이러스 입자는 포유류 숙주, 바람직하게는 영장류 숙주를 감염시킬 수 있다.
일부 재조합 AAV 바이러스 입자의 구현예에서, 재조합 바이러스 입자는 (i) AAV VP1, VP2, 및 VP3 캡시드 단백질을 포함하는 AAV 캡시드, 및 (ii) AAV 캡시드 내에 포장되고, AAV 역위 말단 반복(ITR) 서열을 포함하는 핵산 서열을 포함하되, AAV VP1 캡시드 단백질, AAV VP1 캡시드 단백질의 임의의 일부, AAV VP2 캡시드 단백질, AAV VP2 캡시드 단백질의 임의의 일부, AAV VP3 캡시드 단백질, AAV VP3 캡시드 단백질의 임의의 일부 중 적어도 하나는 비영장류 동물 AAV 또는 이의 일부의 캡시드 단백질의 아미노산 서열에 대해 상당한 서열 동일성을 갖는, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하고, AAV VP1, VP2, VP3 캡시드 단백질 중 적어도 하나는 다음으로 이루어진 군으로부터 선택된 변형을 포함하고:
(a) 단백질:단백질 결합 쌍의 제1 구성원(여기서, 단백질:단백질 결합 쌍은 AAV 바이러스 입자의 향성을 유도함),
(b) 검출 가능한 표지,
(c) 점 돌연변이, 바람직하게는, AAV 바이러스 입자의 천연 향성을 감소시키고/시키거나 검출 가능한 표지를 생성하는 점 돌연변이,
(d) 키메라 아미노산 서열, 및
(e) (a), (b), (c), 및 (d)의 임의의 조합,
전체 ITR 서열 또는 ITR 서열의 일부는 비영장류 동물 AAV의 ITR에 대해 상당한 서열 동일성을 갖는, 예를 들어 적어도 95% 동일성을 갖는 핵산 서열을 포함하고, 임의로 ITR 서열은 키메라 핵산 서열을 포함하고, 비영장류 AAV 또는 이의 일부의 ITR에 대해 상당한 서열 동일성을 갖는, 예를 들어 적어도 95% 동일성을 갖는 키메라 핵산 서열의 일부는 제2 AAV 또는 이의 일부의 ITR에 대해 상당한 서열 동일성을 갖는, 예를 들어 적어도 95% 동일성을 갖는 키메라 핵산 서열의 일부에 작동 가능하게 연결되고, 제2 AAV는 비영장류 동물 AAV와 동일하지 않고, 재조합 AAV 바이러스 입자는 포유류 숙주, 바람직하게는 영장류 숙주를 감염시킬 수 있다.
일부 구현예에서, 재조합 AAV 바이러스 입자는 (i) AAV VP1, VP2, 및 VP3 캡시드 단백질을 포함하는 AAV 캡시드, 및 (ii) AAV 캡시드 내에 포장되고, AAV 역위 말단 반복(ITR) 서열을 포함하는 핵산 서열을 포함하되, AAV VP1 캡시드 단백질, AAV VP1 캡시드 단백질의 임의의 일부, AAV VP2 캡시드 단백질, AAV VP2 캡시드 단백질의 임의의 일부, AAV VP3 캡시드 단백질, AAV VP3 캡시드 단백질의 임의의 일부 중 적어도 하나는 비영장류 동물 AAV 또는 이의 일부의 캡시드 단백질의 아미노산 서열에 대해 상당한 서열 동일성을 갖는, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하고,
ITR 서열 또는 이의 일부는 제2 AAV 또는 이의 일부의 ITR 서열에 대해 상당한 서열 동일성을 갖는, 예를 들어 적어도 95%의 동일성을 갖는 핵산 서열을 포함하되, 제2 AAV는 비영장류 동물 AAV와 동일하지 않고,
재조합 AAV 바이러스 입자는 포유류 숙주, 바람직하게는 영장류 숙주를 감염시킬 수 있으며,
임의로, AAV VP1, VP2, 및 VP3 캡시드 단백질 중 적어도 하나는 다음으로 이루어진 군으로부터 선택된 변화를 포함한다:
(a) 단백질:단백질 결합 쌍의 제1 구성원(여기서, 단백질:단백질 결합 쌍은 AAV 바이러스 입자의 향성을 유도함),
(b) 검출 가능한 표지,
(c) 점 돌연변이, 바람직하게는 AAV 바이러스 입자의 자연 향성을 감소시키고/시키거나 검출 가능한 표지를 생성하는 점 돌연변이, 및
(d) (a)~(c)의 임의의 조합.
일부 구현예에서, 재조합 AAV 바이러스 입자는 (i) AAV VP1, VP2, 및 VP3 캡시드 단백질을 포함하는 AAV 캡시드, 및 (ii) AAV 캡시드 내에 포장되고, AAV 역위 말단 반복(ITR) 서열을 포함하는 핵산 서열을 포함하되, AAV VP1 캡시드 단백질, AAV VP1 캡시드 단백질의 임의의 일부, AAV VP2 캡시드 단백질, AAV VP2 캡시드 단백질의 임의의 일부, AAV VP3 캡시드 단백질, 및 AAV VP3 캡시드 단백질의 임의의 일부 중 적어도 하나는 키메라 아미노산 서열을 포함하되, 키메라 아미노산 서열은 (A) 비영장류 동물 AAV 캡시드 단백질 또는 이의 일부의 아미노산 서열에 대해 상당한 서열 동일성을 갖는, 예를 들어 적어도 95%의 동일성을 갖는 아미노산 서열, 및 (B) 제2 AAV 캡시드 단백질 또는 이의 일부의 아미노산 서열에 대해 상당한 동일성을 갖는, 예를 들어 95%의 동일성을 갖는 아미노산 서열을 포함하되, (A)는 (B)에 작동 가능하게 연결되며, 제2 AAV는 비영장류 동물 AAV와 동일하지 않고, 재조합 AAV 바이러스 입자는 포유류 숙주, 바람직하게는 영장류 숙주를 감염시킬 수 있고, 임의로 키메라 아미노산 서열을 포함하는 AAV VP1 캡시드 단백질, AAV VP1 캡시드 단백질의 임의의 일부, AAV VP2 캡시드 단백질, AAV VP2 캡시드 단백질의 임의의 일부, AAV VP3 캡시드 단백질, 및 AAV VP3 캡시드 단백질의 임의의 일부 중 적어도 다음으로 이루어진 군으로부터 선택된 변형을 추가로 포함한다:
(a) 단백질:단백질 결합 쌍의 제1 구성원,
(b) 검출 가능한 표지, 및
(c) (a)와 (b)의 조합.
일부 재조합 AAV 바이러스 입자의 구현예에서, 재조합 바이러스 입자는 (i) AAV VP1, VP2, 및 VP3 캡시드 단백질을 포함하는 AAV 캡시드, 및 (ii) AAV 캡시드 내에 포장되고, AAV 역위 말단 반복(ITR) 서열을 포함하는 핵산 서열을 포함하되, AAV VP1 캡시드 단백질, AAV VP1 캡시드 단백질의 임의의 일부, AAV VP2 캡시드 단백질, AAV VP2 캡시드 단백질의 임의의 일부, AAV VP3 캡시드 단백질, AAV VP3 캡시드 단백질의 임의의 일부 중 적어도 하나는 비영장류 동물 AAV 또는 이의 일부의 캡시드 단백질의 아미노산 서열에 대해 상당한 서열 동일성을 갖는, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하고, AAV VP1, VP2, 및 VP3 캡시드 단백질 중 적어도 하나는 다음으로 이루어진 군으로부터 선택된 변형을 하고:
(a) 단백질:단백질 결합 쌍의 제1 구성원(여기서, 단백질:단백질 결합 쌍은 AAV 바이러스 입자의 향성을 유도함),
(b) 검출 가능한 표지,
(c) 점 돌연변이, 바람직하게는, AAV 바이러스 입자의 천연 향성을 감소시키고/시키거나 검출 가능한 표지를 생성하는 점 돌연변이,
(d) 키메라 아미노산 서열, 및
(e) (a), (b), (c), 및 (d)의 임의의 조합,
전체 ITR 서열 또는 ITR 서열의 일부는 원격 AAV의 ITR에 대해 상당한 서열 동일성을 갖는, 예를 들어 적어도 95% 동일성을 갖는 핵산 서열을 포함하고, 임의로 ITR 서열은 키메라 핵산 서열을 포함하고, 원격 AAV 또는 이의 일부의 ITR에 대해 상당한 서열 동일성을 갖는, 예를 들어 적어도 95% 동일성을 갖는 키메라 핵산 서열의 일부는 제2 AAV 또는 이의 일부의 ITR에 대해 상당한 서열 동일성을 갖는, 예를 들어 적어도 95% 동일성을 갖는 키메라 핵산 서열의 일부에 작동 가능하게 연결되고, 제2 AAV는 원격 AAV와 동일하지 않고, 재조합 AAV 바이러스 입자는 포유류 숙주, 바람직하게는 영장류 숙주를 감염시킬 수 있다.
일부 구현예에서, 재조합 AAV 바이러스 입자는 (i) AAV VP1, VP2, 및 VP3 캡시드 단백질을 포함하는 AAV 캡시드, 및 (ii) AAV 캡시드 내에 포장되고, AAV 역위 말단 반복(ITR) 서열을 포함하는 핵산 서열을 포함하되, AAV VP1 캡시드 단백질, AAV VP1 캡시드 단백질의 임의의 일부, AAV VP2 캡시드 단백질, AAV VP2 캡시드 단백질의 임의의 일부, AAV VP3 캡시드 단백질, AAV VP3 캡시드 단백질의 임의의 일부 중 적어도 하나는 원격 AAV 또는 이의 일부의 캡시드 단백질의 아미노산 서열에 대해 상당한 서열 동일성을 갖는, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하고,
ITR 서열 또는 이의 일부는 제2 AAV 또는 이의 일부의 ITR 서열에 대해 상당한 서열 동일성을 갖는, 예를 들어 적어도 95%의 동일성을 갖는 핵산 서열을 포함하되, 제2 AAV는 원격 AAV와 동일하지 않고,
재조합 AAV 바이러스 입자는 포유류 숙주, 바람직하게는 영장류 숙주를 감염시킬 수 있으며,
임의로, AAV VP1, VP2, 및 VP3 캡시드 단백질 중 적어도 하나는 다음으로 이루어진 군으로부터 선택된 변화를 포함한다:
(a) 단백질:단백질 결합 쌍의 제1 구성원(여기서, 단백질:단백질 결합 쌍은 AAV 바이러스 입자의 향성을 유도함),
(b) 검출 가능한 표지,
(c) 점 돌연변이, 바람직하게는 AAV 바이러스 입자의 자연 향성을 감소시키고/시키거나 검출 가능한 표지를 생성하는 점 돌연변이, 및
(d) (a)~(c)의 임의의 조합.
일부 구현예에서, 재조합 AAV 바이러스 입자는 (i) AAV VP1, VP2, 및 VP3 캡시드 단백질을 포함하는 AAV 캡시드, 및 (ii) AAV 캡시드 내에 포장되고, AAV 역위 말단 반복(ITR) 서열을 포함하는 핵산 서열을 포함하되, AAV VP1 캡시드 단백질, AAV VP1 캡시드 단백질의 임의의 일부, AAV VP2 캡시드 단백질, AAV VP2 캡시드 단백질의 임의의 일부, AAV VP3 캡시드 단백질, 및 AAV VP3 캡시드 단백질의 임의의 일부 중 적어도 하나는 키메라 아미노산 서열을 포함하되, 키메라 아미노산 서열은 (A) 원격 AAV 캡시드 단백질 또는 이의 일부의 아미노산 서열에 대해 상당한 서열 동일성을 갖는, 예를 들어 적어도 95%의 동일성을 갖는 아미노산 서열, 및 (B) 제2 AAV 캡시드 단백질 또는 이의 일부의 아미노산 서열에 대해 상당한 동일성을 갖는, 예를 들어 95%의 동일성을 갖는 아미노산 서열을 포함하되, (A)는 (B)에 작동 가능하게 연결되며, 제2 AAV는 원격 AAV와 동일하지 않고, 재조합 AAV 바이러스 입자는 포유류 숙주, 바람직하게는 영장류 숙주를 감염시킬 수 있고, 임의로 키메라 아미노산 서열을 포함하는 AAV VP1 캡시드 단백질, AAV VP1 캡시드 단백질의 임의의 일부, AAV VP2 캡시드 단백질, AAV VP2 캡시드 단백질의 임의의 일부, AAV VP3 캡시드 단백질, 및 AAV VP3 캡시드 단백질의 임의의 일부 중 적어도 다음으로 이루어진 군으로부터 선택된 변형을 추가로 포함한다:
(a) 단백질:단백질 결합 쌍의 제1 구성원,
(b) 검출 가능한 표지, 및
(c) (a)와 (b)의 조합.
본 발명의 일부 구현예에서, AAV 바이러스 입자는 AAV 캡시드를 포함하되, 상기 AAV 캡시드의 적어도 하나의 AAV 캡시드 단백질(예를 들어, AAV VP1 캡시드 단백질, AAV VP2 캡시드 단백질, 및/또는 AAV VP3 캡시드 단백질)은 비영장류 동물 AAV의 캡시드 단백질, 원격 AAV의 캡시드 단백질, 및 이들의 조합으로부터 선택된 캡시드 단백질의 아미노산 서열의 적어도 일부를 포함하고, 상기 AAV 캡시드의 적어도 하나의 AAV 캡시드 단백질은 (a) 단백질:단백질 결합 쌍의 적어도 제1 구성원, (b) 검출 가능한 표지, (c) 점돌연변이, (d) 비영장류 동물 AAV의 캡시드 단백질, 원격 AAV의 캡시드 단백질, 또는 이들의 조합으로 이루어진 군으로부터 선택된 캡시드 단백질의 상기 아미노산 서열에 작동 가능하게 연결된 다른 (예를 들어, 제2) AAV 캡시드 단백질의 아미노산 서열의 일부를 포함하는 키메라 아미노산 서열, 및 (e) (a), (b), (c), 및 (d)의 임의의 조합을 포함하도록 변형된다. 본 발명의 일부 구현예에서, AAV 바이러스 입자는 AAV 캡시드를 포함하되, 상기 AAV 캡시드 또는 이의 일부의 적어도 하나의 AAV 캡시드 단백질(예를 들어, AAV VP1 캡시드 단백질, AAV VP2 캡시드 단백질, 및/또는 AAV VP3 캡시드 단백질)은 비영장류 동물 AAV의 캡시드 단백질, 비영장류 동물 AAV의 캡시드 단백질의 일부, 원격 AAV의 캡시드 단백질, 원격 AAV의 캡시드 단백질의 일부, 및 이들의 조합으로부터 선택된 캡시드 단백질에 대해 상당한 서열 동일성을, 예를 들어 적어도 95% 동일성을 갖고, 상기 AAV 캡시드의 적어도 하나의 AAV 캡시드 단백질은 (a) 단백질:단백질 결합 쌍의 적어도 제1 구성원, (b) 검출 가능한 표지, (c) 점돌연변이, (d) 비영장류 동물 AAV의 캡시드 단백질, 원격 AAV의 캡시드 단백질, 또는 이들의 조합으로 이루어진 군으로부터 선택된 캡시드 단백질의 상기 아미노산 서열에 작동 가능하게 연결된 다른 (예를 들어, 제2) AAV 캡시드 단백질의 아미노산 서열의 일부를 포함하는 키메라 아미노산 서열, 및 (e) (a), (b), (c), 및 (d)의 임의의 조합을 포함하도록 변형된다. 본 발명의 일부 구현예에서, AAV 바이러스 입자는 AAV 캡시드를 포함하되, 상기 AAV 캡시드의 적어도 하나의 AAV 캡시드 단백질(예를 들어, AAV VP1 캡시드 단백질, AAV VP2 캡시드 단백질, 및/또는 AAV VP3 캡시드 단백질)은 비영장류 동물 AAV의 캡시드 단백질의 아미노산 서열의 적어도 일부를 포함하고(예를 들어, 적어도 하나의 AAV 캡시드 단백질은 비영장류 동물 AAV의 캡시드 단백질에 대해 상당한 서열 동일성을, 예를 들어 95% 서열 동일성을 갖는 아미노산 서열을 포함함), 상기 AAV 캡시드의 적어도 하나의 AAV 캡시드 단백질은 (a) 단백질:단백질 결합 쌍의 적어도 제1 구성원, (b) 검출 가능한 표지, (c) 점돌연변이, (d) 비영장류 동물 AAV의 캡시드의 상기 아미노산 서열에 작동 가능하게 연결된 다른 (예를 들어, 제2) AAV 캡시드 단백질의 아미노산 서열의 일부를 포함하는 키메라 아미노산 서열, 및 (e) (a), (b), (c), 및 (d)의 임의의 조합을 포함하도록 변형된다.
본 발명의 일부 구현예에서, AAV 바이러스 입자는 AAV 캡시드를 포함하되, 상기 AAV 캡시드의 적어도 하나의 AAV 캡시드 단백질(예를 들어, AAV VP1 캡시드 단백질, AAV VP2 캡시드 단백질, 및/또는 AAV VP3 캡시드 단백질)은 원격 AAV의 캡시드 단백질의 아미노산 서열의 적어도 일부를 포함하고(예를 들어, 적어도 하나의 AAV 캡시드 단백질은 원격 AAV의 캡시드 단백질에 대해 상당한 서열 동일성을, 예를 들어 95% 서열 동일성을 갖는 아미노산 서열을 포함함), 상기 AAV 캡시드의 적어도 하나의 AAV 캡시드 단백질은 (a) 단백질:단백질 결합 쌍의 적어도 제1 구성원, (b) 검출 가능한 표지, (c) 점돌연변이, (d) 원격 AAV의 캡시드 단백질의 상기 아미노산 서열에 작동 가능하게 연결된 다른 (예를 들어, 제2) AAV 캡시드 단백질의 아미노산 서열의 일부를 포함하는 키메라 아미노산 서열, 및 (e) (a), (b), (c), 및 (d)의 임의의 조합을 포함하도록 변형된다.
본 발명의 일부 구현예에서, AAV 바이러스 입자는 (A) (i) 비영장류 동물 AAV의 캡시드 단백질의 아미노산 서열, (ii) 원격 영장류 AAV의 캡시드 단백질의 아미노산 서열, 및 (iii) 이들의 조합의 아미노산 서열로 이루어진 군으로부터 선택된 아미노산 서열과 동일하거나 이에 대해 상당한 서열 동일성을 갖는, 예를 들어 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 적어도 하나의 AAV 캡시드 단백질(예를 들어, AAV VP1 캡시드 단백질, AAV VP2 캡시드 단백질, 및/또는 AAV VP3 캡시드 단백질), 및 (B) 관심 뉴클레오티드, 및 다른 (예를 들어, 제2) AAV의 ITR 서열의 적어도 일부를 포함하는 AAV ITR을 포함하는 AAV 게놈을 포함하되, 다른 AAV는 비영장류 동물 AAV와 동일하지 않고, 원격 영장류 AAV와도 동일하지 않다.
본 발명의 일부 구현예에서, AAV 바이러스 입자는 (A) 비영장류 동물 AAV의 캡시드 단백질의 아미노산 서열과 동일하거나 이에 대해 상당한 서열 동일성을 갖는, 예를 들어 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 적어도 하나의 AAV 캡시드 단백질(예를 들어, AAV VP1 캡시드 단백질, AAV VP2 캡시드 단백질, 및/또는 AAV VP3 캡시드 단백질), 및 (B) 관심 뉴클레오티드, 및 다른 (예를 들어, 제2) AAV의 ITR 서열의 적어도 일부를 포함하는 AAV ITR을 포함하는 AAV 게놈을 포함하되, 다른 AAV는 비영장류 동물 AAV와 동일하지 않다.
본 발명의 일부 구현예에서, AAV 바이러스 입자는 (A) 원격 AAV의 캡시드 단백질의 아미노산 서열과 동일하거나 이에 대해 상당한 서열 동일성을 갖는, 예를 들어 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 적어도 하나의 AAV 캡시드 단백질(예를 들어, AAV VP1 캡시드 단백질, AAV VP2 캡시드 단백질, 및/또는 AAV VP3 캡시드 단백질), 및 (B) 관심 뉴클레오티드, 및 다른 (예를 들어, 제2) AAV의 ITR 서열의 적어도 일부를 포함하는 AAV ITR을 포함하는 AAV 게놈을 포함하되, 다른 AAV는 원격 AAV와 동일하지 않다.
본 발명의 AAV 바이러스 입자의 일부 구현예에서, 비영장류 동물 AAV의 캡시드 단백질, 원격 AAV의 캡시드 단백질, 또는 이들의 조합의 아미노산 서열과 동일하거나 이에 대해 상당한 동일성, 예를 들어 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질은 (a) 단백질:단백질 결합 쌍의 적어도 제1 구성원, (b) 검출 가능한 표지, (c) 점 돌연변이를 포함하도록 변형된다.
본 발명의 AAV 바이러스 입자의 일부 구현예에서, 비영장류 동물 AAV의 캡시드 단백질, 원격 AAV의 캡시드 단백질, 또는 이들의 조합의 아미노산 서열과 동일하거나 이에 대해 상당한 동일성, 예를 들어 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질은 비영장류 동물 AAV의 VP3 캡시드 단백질의 아미노산 서열 및/또는 원격 AAV의 VP3 캡시드 단백질의 아미노산 서열과 동일하거나 이에 대해 상당한 동일성, 예를 들어 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 구현예에서, 비영장류 동물 AAV의 캡시드 단백질, 원격 AAV의 캡시드 단백질, 또는 이들의 조합의 아미노산 서열과 동일하거나 이에 대해 상당한 동일성, 예를 들어 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질은 비영장류 동물 AAV의 VP2 캡시드 단백질의 아미노산 서열 및/또는 원격 AAV의 VP2 캡시드 단백질의 아미노산 서열과 동일하거나 이에 대해 상당한 동일성, 예를 들어 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 구현예에서, 비영장류 동물 AAV의 캡시드 단백질, 원격 AAV의 캡시드 단백질, 또는 이들의 조합의 아미노산 서열과 동일하거나 이에 대해 상당한 동일성, 예를 들어 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질은 비영장류 동물 AAV의 VP1 캡시드 단백질의 아미노산 서열 및/또는 원격 AAV의 VP1 캡시드 단백질의 아미노산 서열과 동일하거나 이에 대해 상당한 동일성, 예를 들어 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함한다.
본 발명의 AAV 바이러스 입자의 일부 구현예에서, 상기 입자의 캡시드는 (i) (a) 키메라 AAV VP1 캡시드 단백질(임의로, 여기서 키메라 VP1 캡시드 단백질은 비영장류 AAV 또는 원격 AAV의 VP1/VP2 공통 영역 및 VP3 영역에 작동 가능하게 연결된 다른 (예를 들어, 제2) AAV의 VP1-고유 영역(VP1-u)을 포함함), 또는 (b) 비영장류 AAV 또는 원격 AAV의 VP1 캡시드 단백질 중 어느 하나인 VP1 캡시드 단백질, (ii) (a) 키메라 AAV VP2 캡시드 단백질(임의로, 여기서 키메라 VP2 캡시드 단백질은 비영장류 AAV 또는 원격 AAV의 VP3 영역에 작동 가능하게 연결된 다른 (예를 들어, 제2) AAV의 VP1/VP3 공통 영역을 포함함), 또는 (b) 비영장류 AAV 또는 원격 AAV의 VP2 캡시드 단백질 중 어느 하나인 VP2 캡시드 단백질, 및 (iii) 비영장류 AAV 또는 원격 AAV의 VP3 캡시드 단백질을 포함한다. 일부 구현예에서, 상기 입자의 캡시드는 (i) 키메라 AAV VP1 캡시드 단백질(임의로, 여기서 키메라 VP1 캡시드 단백질은 비영장류 AAV 또는 원격 AAV의 VP1/VP2 공통 영역 및 VP3 영역에 작동 가능하게 연결된 다른 (예를 들어, 제2) AAV의 VP1-고유 영역(VP1-u)을 포함함), (ii) 키메라 AAV VP2 캡시드 단백질(임의로, 여기서 키메라 VP2 캡시드 단백질은 비영장류 AAV 또는 원격 AAV의 VP3 영역에 작동 가능하게 연결된 다른 (예를 들어, 제2) AAV의 VP1/VP3 공통 영역을 포함함), 및 (iii) 비영장류 AAV 또는 원격 AAV의 VP3 캡시드 단백질을 포함한다. 일부 구현예에서, 상기 입자의 캡시드는 (i) 키메라 AAV VP1 캡시드 단백질(임의로, 여기서 키메라 VP1 캡시드 단백질은 비영장류 AAV 또는 원격 AAV의 VP1/VP2 공통 영역 및 VP3 영역에 작동 가능하게 연결된 다른 (예를 들어, 제2) AAV의 VP1-고유 영역(VP1-u)을 포함함), (ii) 비영장류 AAV 또는 원격 AAV의 VP2 캡시드 단백질, 및 (iii) 비영장류 AAV 또는 원격 AAV의 VP3 캡시드 단백질을 포함한다. 일부 구현예에서, 캡시드는 (i) 비영장류 AAV 또는 원격 AAV의 VP1 캡시드 단백질, (ii) 비영장류 AAV 또는 원격 AAV의 VP2 캡시드 단백질, 및 (iii) 비영장류 AAV 또는 원격 AAV의 VP3 캡시드 단백질을 포함하되, 임의로 입자는 캡시드 내에 있는 다른 (예를 들어, 제2) AAV의 ITR 서열의 적어도 일부를 포함하는 AAV ITR을 포함하는 AAV 게놈을 포함한다. 일부 구현예에서, 다른 AAV는 비영장류 동물 AAV와 동일하지 않다.
재조합 AAV 바이러스 입자의 일부 구현예에서, (i) VP1 캡시드 단백질은 (a) 키메라 아미노산 서열(임의로, 키메라 AAV VP1 캡시드 단백질의 VP1-고유 영역(VP1-u)은 제2 AAV의 VP1-u의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하고, 키메라 AAV VP1 캡시드의 VP1/VP2 공통 영역 및 VP3 영역은 비영장류 동물 AAV의 VP1/VP2 공통 영역 및 VP3 영역의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함함), 또는 (b) 비영장류 인간 AAV의 VP1 캡시드 단백질에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하고; (ii) VP2 캡시드 단백질은 (a) 키메라 아미노산 서열(임의로, 키메라 AAV VP2 캡시드 단백질의 VP1/VP2 공통 영역은 제2 AAV의 VP1/VP2 공통 영역의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하고, 키메라 VP2 캡시드 단백질의 VP3 영역은 비영장류 동물 AAV의 VP3 영역에 대해 적어도 95% 동일성을 포함함), 또는 (b) 비영장류 동물 AAV의 VP2 캡시드 단백질에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하고; (iii) VP3 캡시드 단백질은 비영장류 동물 AAV의 VP3 캡시드 단백질의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함한다. 일부 구현예에서, (i) VP1 캡시드 단백질은 키메라 아미노산 서열을 포함하고, 임의로, 키메라 AAV VP1 캡시드 단백질의 VP1-고유 영역(VP1-u)은 제2 AAV의 VP1-u의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하고, 키메라 AAV VP1 캡시드의 VP1/VP2 공통 영역 및 VP3 영역은 비영장류 동물 AAV의 VP1/VP2 공통 영역 및 VP3 영역의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하고; (ii) VP2 캡시드 단백질은 키메라 아미노산 서열을 포함하고, 임의로, 키메라 AAV VP2 캡시드 단백질의 VP1/VP2 공통 영역은 제2 AAV의 VP1/VP2 공통 영역의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하고, 키메라 VP2 캡시드 단백질의 VP3 영역은 비영장류 동물 AAV의 VP3 영역에 대해 적어도 95% 동일성을 포함하며; (iii) VP3 캡시드 단백질은 비영장류 동물 AAV의 VP3 캡시드 단백질의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함한다. 일부 구현예에서, (i) AAV VP1 캡시드 단백질은 키메라 아미노산 서열을 포함하고, 임의로, 키메라 AAV VP1 캡시드 단백질의 VP1-고유 영역(VP1-u)은 제2 AAV의 VP1-u의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하고, 키메라 AAV VP1 캡시드의 VP1/VP2 공통 영역 및 VP3 영역은 비영장류 동물 AAV의 VP1/VP2 공통 영역 및 VP3 영역의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하고; (ii) VP2 캡시드 단백질은 비영장류 동물 AAV의 VP2 캡시드 단백질의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하며; (iii) VP3 캡시드 단백질은 비영장류 동물 AAV의 VP3 캡시드 단백질의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함한다. 일부 구현예에서, (i) VP1 캡시드 단백질은 비영장류 동물 AAV의 VP1 캡시드 단백질의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하고; (ii) VP2 캡시드 단백질은 비영장류 동물 AAV의 VP2 캡시드 단백질의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하며; (iii) VP3 캡시드 단백질은 비영장류 동물 AAV의 VP3 캡시드 단백질의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하되, 임의로 입자는 캡시드 내의 다른 (예를 들어 제2) AAV의 ITR 서열의 적어도 일부를 포함하는 AAV ITR을 포함하는 AAV 게놈을 포함한다. 일부 구현예에서, 다른 AAV는 비영장류 동물 AAV와 동일하지 않다.
본 발명의 AAV 바이러스 입자의 일부 구현예에서, 다른 (예를 들어, 제2) AAV는 영장류 AAV이거나 영장류 AAV의 조합이다. 일부 구현예에서, 다른 AAV는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, 및 이들의 조합으로 이루어진 군으로부터 선택된다. 일부 구현예에서, 다른 AAV는 AAV2이다.
본 발명의 AAV 바이러스 입자의 일부 구현예에서, 비영장류 동물 AAV는 표 2에 열거된 비영장류 AAV이다. 일부 구현예에서, 비영장류 AAV는 조류 AAV (AAAV), 바다 사자 AAV, 또는 턱수염 도마뱀 AAV이다. 일부 구현예에서, 비영장류 동물 AAV는 AAAV이고, 임의로 AAAV 캡시드 단백질의 아미노산 서열은 AAAV의 VP1 캡시드 단백질의 위치 I444 또는 I580에서의 변형을 포함한다. 일부 구현예에서, 비영장류 동물 AAV는 유린류 AAV, 예를 들어, 턱수염 도마뱀 AAV이고, 임의로 턱수염 도마뱀 AAV의 아미노산 서열은 턱수염 도마뱀 AAV의 VP1 캡시드 단백질의 위치 I573 또는 I436에서의 변형을 포함한다. 일부 구현예에서, 비영장류 동물 AAV는 포유류 AAV, 예를 들어, 바다 사자 AAV이고, 임의로 바다 사자 AAV의 아미노산 서열은 바다 사자 AAV의 VP1 캡시드 단백질의 I429, I430, I431, I432, I433, I434, I436, I437, 및 A565로 이루어진 군으로부터 선택된 위치에서 변형을 포함한다.
본 발명의 AAV 바이러스 입자의 일부 구현예에서, 단백질:단백질 결합 쌍은 SpyTag:SpyCatcher, SpyTag:KTag, Isopeptag:pilin C, SnoopTag:SnoopCatcher, 및 SpyTag002:SpyCatcher002로 이루어진 군으로부터 선택된다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 서열번호 44로서 제시된 서열을 포함하는 c-myc를 포함한다. 일부 구현예에서, 검출 가능한 표지는 IGTRYLTR(서열번호 45)의 아미노산 서열을 포함하는 B1 에피토프를 포함한다.
일부 구현예에서, 본 발명의 AAV 입자는 비영장류 동물 AAV, 원격 AAV, 또는 이들의 조합의 VP3 캡시드를 포함하되, VP3 캡시드 단백질은 (a) 단백질:단백질 결합 쌍의 적어도 제1 구성원(임의로, 단백질:단백질 결합 쌍은 SpyTag:SpyCatcher, SpyTag:KTag, Isopeptag:pilin C, SnoopTag:SnoopCatcher, 및 SpyTag002:SpyCatcher002로 이루어진 군으로부터 선택됨), (b) 검출 가능한 표지(임의로, 검출 가능한 표지는 서열번호 44로서 제시된 아미노산 서열 또는 서열번호 45로서 제시된 아미노산산 서열을 포함함), (c) 점돌연변이, 또는 (d) (a), (b), 및 (c)의 임의의 조합을 포함하도록 변형된다. 일부 구현예에서, 비영장류 동물 AAV, 원격 AAV, 또는 이들의 조합의 VP3 캡시드 단백질은 (a) 서열번호 43으로서 제시된 아미노산 서열을 포함하는 적어도 SpyTag 및/또는 (b) 서열번호 45로서 제시된 아미노산 서열을 포함하는 검출 가능한 표지를 포함하도록 변형된다.
일부 구현예에서, 본 발명의 AAV 입자는 단백질:단백질 결합 쌍의 제1 구성원 및/또는 검출 가능한 표지를 상기 AAV 입자의 캡시드의 캡시드 단백질에 작동 가능하게 연결하는 제1 및/또는 제2 링커를 포함한다. 일부 구현예에서, 제1 및 제2 링커는 동일하지 않다. 일부 구현예에서, 제1 및 제2 링커는 동일하다. 일부 구현예에서, 제1 및/또는 제2 링커는 10개의 아미노산 길이이다.
본 발명의 바이러스 입자의 일부 구현예에서, VP1, VP2, 및 VP3 캡시드 단백질 중 적어도 하나는(임의로 적어도 VP3 캡시드는) (a) 단백질:단백질 결합 쌍의 제1 구성원, (b) 검출 가능한 표지, (c) 점 돌연변이, 또는 (d) (a), (b), 및/또는 (c)의 임의의 조합을 포함하도록 변형된다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원 및/또는 검출 가능한 표지 또는 점 돌연변이는 캡시드 단백질의 가변 영역 내에 배치된다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원 또는 검출 가능한 표지는 제1 링커 및/또는 제2 링커가 측면에 위치한다. 일부 구현예에서, 제1 및/또는 제2 링커는 1~10개의 아미노산 길이이다. 일부 구현예에서, 제1 및 제2 링커는 동일하지 않다. 일부 구현예에서, 제1 및 제2 링커는 동일하다.
바이러스 입자의 일부 구현예에서, AAAV VP3 캡시드 단백질은 변형(임의로 단백질:단백질 결합 쌍의 제1 구성원)을 포함하되, 임의로 변형은 위치(들) I444(예: G444) 및/또는 I580(예: K580)에서의 변형이다. 일부 구현예에서, AAAV VP3 캡시드 단백질은 변형(임의로 단백질:단백질 결합 쌍의 제1 구성원)을 포함하되, 임의로 변형은 위치(들) I444(예: G444) 및/또는 I580(예: K580)에서의 변형이다. 일부 구현예에서, 턱수염 도마뱀 AAV VP3 캡시드 단백질은 변형(임의로 단백질:단백질 결합 쌍의 제1 구성원)을 포함하되, 임의로 변형은 위치(들) I573(예: T573) 및/또는 I436(예: G436)에서의 변형이다. 일부 구현예에서, 바다 사자 VP3 캡시드 단백질은 변형(임의로 단백질:단백질 결합 쌍의 제1 구성원)을 포함하되, 임의로 변형은 I429 (예: N429), I430 (예: P430), I431 (예: T431), I432 (예: G432), I433 (예: S433), I434 (예: T434), I436 (예: R436), I437 (예: D437), 및 I565 (A565)로 이루어진 군으로부터 선택된 위치에서의 변형이다.
본 발명의 바이러스 입자의 일부 구현예에서, 적어도 하나의 캡시드 단백질(임의로 적어도 VP3 캡시드)은 단백질:단백질 결합 쌍의 제1 구성원을 포함하도록 변형된다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 단백질:단백질 결합 쌍의 제1 구성원을 포함한다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 단백질:단백질 결합 쌍의 제2 동족 구성원을 포함한다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 및 제2 구성원은 공유 결합(예를 들어, 이소펩티드 결합)에 의해 결합된다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 SpyTag이고, 임의로, 단백질:단백질 결합 쌍의 제2 구성원은 SpyCatcher 또는 KTag이다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 KTag이고, 임의로, 단백질:단백질 결합 쌍의 제2 구성원은 SpyTag이다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 SnoopTag이고 단백질:단백질 결합 쌍의 제2 구성원은 SnoopCatcher이다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 isopeptag이고 단백질:단백질 결합 쌍의 제2 구성원은 Pilin-C이다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 SpyTag002이고 단백질:단백질 결합 쌍의 제2 구성원은 SpyCatcher002이다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제2 구성원은 표적화 리간드, 예를 들어, 결합 모이어티, 예를 들어, 항체 또는 이의 단편에 연결된다. 일부 구현예에서, 표적화 리간드는 (임의로 제2 구성원의 C-말단에 있는 링커를 통해) 단백질:단백질 결합 쌍의 제2 구성원, 예를 들어, SpyCatcher에 융합될 수 있고, 링커는 링커의 C-말단에 있는 SpyCatcher에 융합된다. 일부 구현예에서, 링커는 서열 GSGESG(서열번호 49)를 포함한다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 검출 가능한 표지를 포함한다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 검출 가능한 표지 c-myc를 포함한다.
본 발명의 바이러스 입자의 일부 구현예에서, 적어도 하나의 캡시드 단백질(임의로 적어도 VP3 캡시드)은 검출 가능한 표지를 포함하도록 변형된다. 일부 구현예에서, 검출 가능한 표지는 AAV B1 에피토프, 예를 들어 아미노산 서열 IGTRYLTR(서열번호 45)을 포함한다.
본 발명의 바이러스 입자의 일부 구현예에서, 적어도 하나의 캡시드 단백질(임의로 적어도 VP3 캡시드)은 다음을 포함하도록 변형된다:
(a) 단백질:단백질 결합 쌍의 적어도 제1 구성원(임의로, 여기서 단백질:단백질 결합 쌍은 SpyTag:SpyCatcher, SpyTag:KTag, Isopeptag:pilin-C, SnoopTag:SnoopCatcher, SpyTag002:SpyCatcher002, 및 c-myc:항-c-myc 항체로 이루어진 군으로부터 선택됨)을 포함하는 단백질:단백질 결합 쌍의 제1 구성원,
(b) 검출 가능한 표지(임의로, 여기서 검출 가능한 표지는 서열번호 44로서 제시된 아미노산 서열 또는 서열번호 45로서 제시된 아미노산 서열을 포함함),
(c) 점돌연변이, 또는
(d) (a), (b), 및 (c)의 임의의 조합.
본 발명의 바이러스 입자의 일부 구현예에서, 적어도 하나의 캡시드 단백질(임의로 적어도 VP3 캡시드)은 다음을 포함하도록 변형된다:
(a) 서열번호 43으로서 제시된 아미노산 서열을 포함하는 적어도 SpyTag를 포함하는 단백질:단백질 결합 쌍의 제1 구성원 및/또는
(b) 서열번호 45로서 제시된 아미노산 서열을 포함하는 검출 가능한 표지.
일부 구현예에서, 본 발명의 AAV 입자는 다음으로 이루어진 군으로부터 선택된 아미노산 서열을 포함하는 캡시드 단백질을 포함한다: (a) 서열번호 2로서 제시된 아미노산 서열, (b) 서열번호 4로서 제시된 아미노산 서열,
(c) 서열번호 6으로서 제시된 아미노산 서열, (d) 서열번호 8로서 제시된 아미노산 서열, (e) 서열번호 10으로서 제시된 아미노산 서열, (f) 서열번호 12로서 제시된 아미노산 서열, (g) 서열번호 14로서 제시된 아미노산 서열, (h) 서열번호 16으로서 제시된 아미노산 서열, (i) 서열번호 18로서 제시된 아미노산 서열, (j) 서열번호 20로서 제시된 아미노산 서열, (k) 서열번호 22로서 제시된 아미노산 서열, (l) 서열번호 24로서 제시된 아미노산 서열, (m) 서열번호 26으로서 제시된 아미노산 서열, (n) 서열번호 28로서 제시된 아미노산 서열, (o) 서열번호 30으로서 제시된 아미노산 서열, (p) 서열번호 32로서 제시된 아미노산 서열, (q) 서열번호 34로서 제시된 아미노산 서열, (r) 서열번호 36으로서 제시된 아미노산 서열, (s) 서열번호 53로서 제시된 아미노산 서열, (t) 서열번호 55로서 제시된 아미노산 서열, (u) 서열번호 57로서 제시된 아미노산 서열, (v) 서열번호 59로서 제시된 아미노산 서열, (w) 서열번호 61로서 제시된 아미노산 서열, (x) 서열번호 63으로서 제시된 아미노산 서열, (y) 서열번호 65로서 제시된 아미노산 서열, (z) 서열번호 67로서 제시된 아미노산 서열, (aa) 서열번호 69로서 제시된 아미노산 서열, (bb) 서열번호 71로서 제시된 아미노산 서열, (cc) 서열번호 2, 서열번호 4, 서열번호 6, 서열번호 8, 서열번호 10, 서열번호 12, 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26, 서열번호 28, 서열번호 30, 서열번호 32, 서열번호 34, 서열번호 36, 서열번호 53, 서열번호 55, 서열번호 57, 서열번호 59, 서열번호 61, 서열번호 63, 서열번호 65, 서열번호 67, 서열번호 69, 또는 서열번호 71에 대해 적어도 95% 동일성을 갖는 아미노산 서열, 및 (dd) (a)~(cc) 중 어느 하나에 제시된 아미노산 서열의 임의의 VP2 및/또는 VP3 부분의 아미노산 서열.
본 발명의 바이러스 입자의 일부 구현예에서, AAV VP1, VP2, 및 VP3 캡시드 단백질 중 적어도 하나는 변형(예를 들어, 단백질:단백질 결합 쌍의 제1 구성원)을 포함하고, 바이러스 입자는 추가로 기준 캡시드 단백질을 포함하고, 캡시드가 모자이크 캡시드가 되도록 변형을 제외한 AAV VP1, VP2, 및 VP3 캡시드 단백질 중 적어도 하나에 상응하는 캡시드 단백질을 임의로 포함한다. 일부 구현예에서, 모자이크 캡시드는 단백질:단백질 결합 쌍의 제1 구성원으로 변형된 VP1 캡시드 단백질 및 기준 VP1 캡시드 단백질을 포함한다. 일부 구현예에서, 모자이크 캡시드는 단백질:단백질 결합 쌍의 제1 구성원으로 변형된 VP2 캡시드 단백질 및 기준 VP2 캡시드 단백질을 포함한다. 일부 구현예에서, 모자이크 캡시드는 단백질:단백질 결합 쌍의 제1 구성원으로 변형된 VP3 캡시드 단백질 및 기준 VP3 캡시드 단백질을 포함한다.
또한, 본 발명의 AAV 캡시드 단백질을 포함하는 본 발명의 바이러스 입자가 기술된다. 본 발명의 일부 구현예에서, 본 발명의 AAV 캡시드 단백질은 비영장류 동물 AAV 또는 원격 AAV의 캡시드 단백질의 아미노산 서열과 동일하거나 이에 대해 상당한 동일성, 예를 들어 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하되, AAV 캡시드 단백질은 다음으로 이루어진 군으로부터 선택된다: (a) 키메라 AAV VP1 캡시드 단백질(임의로, 단백질:단백질 결합 쌍의 적어도 제1 구성원, 검출 가능한 표지, 및/또는 점 돌연변이를 포함하도록 변형된 키메라 동물 AAV VP1 캡시드 단백질), (b) 단백질:단백질 결합 쌍의 적어도 제1 구성원 및/또는 검출 가능한 표지를 포함하도록 변형된 비키메라 AAV VP1 캡시드 단백질, (c) 키메라 VP2 캡시드 단백질(임의로, 키메라 AAV VP2 캡시드 단백질은 단백질:단백질 결합 쌍의 적어도 제1 구성원, 검출 가능한 표지, 및/또는 점 돌연변이를 포함하도록 변형됨), (d) 단백질:단백질 결합 쌍의 적어도 제1 구성원, 검출 가능한 표지, 및/또는 점 돌연변이를 포함하도록 변형된 비키메라 AAV VP2 캡시드 단백질, (e) 단백질:단백질 결합 쌍의 적어도 제1 구성원, 검출 가능한 표지, 및/또는 점 돌연변이를 포함하도록 변형된 키메라 AAV VP3 캡시드 단백질, 및 (f) 단백질:단백질 결합 쌍의 적어도 제1 구성원, 검출 가능한 표지, 및/또는 점 돌연변이를 포함하도록 변형된 비키메라 AAV VP3 캡시드 단백질.
본 발명의 AAV 캡시드 단백질의 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원 및/또는 검출 가능한 표지의 일측 또는 양측에는 단백질:단백질 결합 쌍의 제1 구성원 및/또는 검출 가능한 표지를 캡시드 단백질에 연결하는 제1 및/또는 제2 링커가 각각 위치하며, 제1 및/또는 제2 링커는 각각 독립적으로 적어도 하나의 아미노산 길이이다. 일부 구현예에서, 제1 및 제2 링커는 동일하지 않다. 일부 구현예에서, 제1 및 제2 링커는 동일하고, 10개의 아미노산 길이이다.
일부 구현예에서, 본 발명의 AAV 캡시드 단백질은 검출 가능한 표지를 포함하되, 검출 가능한 표지는 서열번호 45로서 제시된 아미노산 서열을 포함하는 B1 에피토프를 포함한다. 일부 구현예에서, 검출 가능한 표지는 c-myc를 포함한다.
일부 구현예에서, 본 발명의 AAV 캡시드 단백질은 단백질:단백질 결합 쌍의 제1 구성원 및 제2 동족 구성원 둘 다를 포함하되, 임의로 제1 및 제2 구성원은 공유 결합, 임의로 이소펩티드 결합에 의해 결합된다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 SpyTag이고, 임의로 제2 동족 구성원은 SpyCatcher 또는 KTag이다. 일부 구현예에서, 제1 구성원은 KTag이고 제2 동족 구성원은 SpyTag이다. 일부 구현예에서, 제1 구성원은 SnoopTag이고 제2 동족 구성원은 SnoopCatcher이다. 일부 구현예에서, 제1 구성원은 isopeptag이고 제2 동족 구성원은 Pilin-C이다. 일부 구현예에서, 제1 구성원은 SpyTag002이고 제2 동족 구성원은 SpyCatcher002이다. 일부 구현예에서, 제1 구성원은 c-myc와 같은 그러나 이에 한정되지 않는 검출 가능한 표지를 포함하되, 이의 결합 쌍은 항-c-myc 항체 또는 이의 일부이다. 일부 구현예에서, 제2 구성원은 표적화 리간드에 작동 가능하게 연결되고, 임의로 표적화 리간드는 세포 마커를 임의로 표적화하는 결합 모이어티이다. 일부 구현예에서, 표적화 리간드는 항체 또는 이의 일부이다. 일부 구현예에서, 결합 모이어티는, 임의로 공유 결합(예컨대, 이소펩티드 결합이지만 이에 한정되지 않음) 또는 링커를 통해 단백질:단백질 결합 쌍의 제2 구성원에 작동 가능하게 연결된다. 일부 구현예에서, 결합 모이어티는 결합 모이어티의 C-말단에서 융합된 링커를 통해 단백질:단백질 결합 쌍의 제2 구성원에 융합되며, 여기서 링커는 링커의 C-말단에서 제2 구성원에 융합되고, 임의로 링커는 서열번호 49로서 제시된 서열(GSGESG)을 포함한다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 캡시드 단백질의 VR I, VR II, VR III, VR IV, VR V, VR VI, VR VII, VR VIII, VR IX, 또는 HI 루프에서, 임의로는 캡시드 단백질의 VR VIII 또는 VR IV에서 발견되는 아미노산 위치에 있다.
본 발명의 AAV 캡시드 단백질의 일부 구현예에서, 비영장류 동물 AAV는 표 2에 열거된 비영장류 AAV이다. 일부 구현예에서, 비영장류 AAV는 조류 AAV (AAAV), 바다 사자 AAV, 또는 턱수염 도마뱀 AAV이다. 일부 구현예에서, 비영장류 동물 AAV는 AAAV이고, 임의로 AAAV 캡시드 단백질의 아미노산 서열은 AAAV의 VP1 캡시드 단백질의 I444 또는 I580 위치에서의 변형을 포함한다. 일부 구현예에서, 비영장류 동물 AAV는 유린류 AAV, 예를 들어, 턱수염 도마뱀 AAV이고, 임의로 턱수염 도마뱀 AAV의 아미노산 서열은 턱수염 도마뱀 AAV의 VP1 캡시드 단백질의 위치 I573 또는 I436에서의 변형을 포함한다. 일부 구현예에서, 비영장류 동물 AAV는 포유류 AAV, 예를 들어, 바다 사자 AAV이고, 임의로 바다 사자 AAV의 아미노산 서열은 바다 사자 AAV의 VP1 캡시드 단백질의 I429, I430, I431, I432, I433, I434, I436, I437, 및 A565로 이루어진 군으로부터 선택된 위치에서의 변형을 포함한다.
본 발명의 비영장류 동물 VP3 캡시드 단백질은, (a) 다른 (예를 들어, 제2) AAV의 게놈을 캡시드화하고/하거나 (b) 돌연변이되는 비영장류 VP3 캡시드를 포함한다. 일부 구현예에서, 본 발명의 비인간 동물 AAV의 VP3 캡시드 단백질은 비영장류 동물의 게놈이 아닌 제2 AAV의 게놈을 캡시드화한다. 일부 구현예에서, 본 발명의 비영장류 동물 AAV의 VP3 캡시드 단백질은 (임의로 제1 및/또는 제2 링커를 통해) 단백질:단백질 결합 쌍의 제1 구성원에 작동 가능하게 연결될 수 있고/있거나, 예를 들어, 캡시드 단백질의 자연 향성이 감소 내지는 제거되도록 및/또는 캡시드 단백질이 검출 가능한 표지를 포함하도록 점 돌연변이를 포함할 수 있다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 검출 가능한 표지를 포함한다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 c-myc(서열번호 44)를 포함하는 검출 가능한 표지를 포함한다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 공유 결합을 형성하는 단백질:단백질 결합 쌍의 제1 구성원, 및 임의로 제2 구성원을 포함한다. 일부 구현예에서, 단백질:단백질 결합 쌍은 (a) SpyTag:SpyCatcher, (b) SpyTag:KTag, (c) Isopeptag:pilin C, (d) SnoopTag:SnoopCatcher, 및 I SpyTag002:SpyCatcher002로 이루어진 군으로부터 선택된다. 일부 구현예에서, 비영장류 동물 AAV의 VP3 캡시드 단백질은 (a) B1 에피토프(서열번호 45), (b) SpyTag, (c) SpyCatcher, 또는 (a)~(c)의 임의의 조합을 포함할 수 있다.
일부 구현예에서, 본 발명의 비영장류 동물 AAV의 VP3 캡시드 단백질은, 임의로 제1 또는 제2 링커를 통해 이에 작동 가능하게 연결된 단백질:단백질 결합 쌍의 제1 구성원을 포함한다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 VP3 캡시드 단백질의 가변 영역(VR) 또는 이의 일부에서 발견되는 아미노산 위치에서 비영장류 동물 AAV의 VP3 캡시드에 작동 가능하게 연결되며, 임의로 단백질:단백질 결합 쌍의 제1 구성원은 제1 및/또는 제2 링커를 통해 VP3 캡시드에 연결된다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 VP3 캡시드 단백질의 VR I, VR II, VR III, VR IV, VR V, VR VI, VR VII, VR VIII, VR IX 또는 HI 루프에서 발견되는 아미노산 위치에서 비영장류 동물 AAV의 VP3 캡시드에 작동 가능하게 연결되며, 임의로 단백질:단백질 결합 쌍의 제1 구성원은 제1 및/또는 제2 링커를 통해 VP3 캡시드에 연결된다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 VP3 캡시드 단백질의 VR VIII 또는 VR IV에서 발견되는 아미노산 위치에서 비영장류 동물 AAV의 VP3 캡시드에 작동 가능하게 연결되며, 임의로 단백질:단백질 결합 쌍의 제1 구성원은 제1 및/또는 제2 링커를 통해 VP3 캡시드에 연결된다. 일부 구현예에서, 비영장류 동물 AAV의 VP3 캡시드 단백질은 표 2에 제공된 비영장류 동물 AAV로부터 선택된 비영장류 동물 AAV의 VP3 캡시드 단백질이다. 일부 구현예에서, 비영장류 동물 AAV의 VP3 캡시드 단백질은 조류 AAV(AAAV)의 VP3 캡시드 단백질이다. 일부 구현예에서, AAAV의 VP3 캡시드 단백질은, 임의로 제1 또는 제2 링커를 통해, 위치 I444 또는 I580에서 작동 가능하게 연결된 단백질:단백질 결합 쌍의 제1 구성원(예: SpyTag)을 포함한다. 일부 구현예에서, 비영장류 동물 AAV의 VP3 캡시드 단백질은 턱수염 도마뱀 AAV의 VP3 캡시드 단백질이다. 일부 구현예에서, 턱수염 도마뱀 AAV의 VP3 캡시드 단백질은, 임의로 제1 또는 제2 링커를 통해, 위치 I573 또는 I436에서 작동 가능하게 연결된 단백질:단백질 결합 쌍의 제1 구성원(예: SpyTag)을 포함한다. 일부 구현예에서, 비영장류 동물 AAV의 VP3 캡시드 단백질은 바다 사자 AAV의 VP3 캡시드 단백질이다. 일부 구현예에서, 바다 사자 AAV의 VP3 캡시드 단백질은, 임의로 제1 및/또는 제2 링커를 통해, I429, I430, I431, I432, I433, I434, I436, I437, 및 I565로 이루어진 군으로부터 선택된 위치에서, 및 임의로 I429, I430, I431, I432, I433, I436, 및 I437로 이루어진 군으로부터 선택된 위치에서; 임의로 I432 위치에서 작동 가능하게 연결된 단백질:단백질 결합 쌍의 제1 구성원(예: SpyTag)을 포함한다.
본 발명의 비영장류 동물 VP2 캡시드 단백질은 (a) 다른 (예를 들어, 제2) AAV의 게놈을 캡시드화하고/하거나 (b) 돌연변이되는 비영장류 VP2 캡시드를 포함한다. 일부 구현예에서, 본 발명의 비영장류 동물 AAV의 VP2 캡시드 단백질은 다른 (예를 들어, 제2) AAV의 게놈을 캡시드화한다. 일부 구현예에서, 본 발명의 비영장류 동물 AAV의 VP2 캡시드 단백질은 단백질:단백질 결합 쌍의 제1 구성원에 작동 가능하게 연결될 수 있고/있거나, 예를 들어, 캡시드 단백질의 자연 향성이 감소 내지는 제거되도록 및/또는 캡시드 단백질이 검출 가능한 표지를 포함하도록 점 돌연변이를 포함할 수 있다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 검출 가능한 표지를 포함한다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 c-myc(서열번호 44)를 포함하는 검출 가능한 표지를 포함한다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 공유 결합을 형성하는 단백질:단백질 결합 쌍의 제1 구성원, 및 임의로 제2 구성원을 포함한다. 일부 구현예에서, 단백질:단백질 결합 쌍은 (a) SpyTag:SpyCatcher, (b) SpyTag:KTag, (c) Isopeptag:pilin C, (d) SnoopTag:SnoopCatcher, 및 (e) SpyTag002:SpyCatcher002로 이루어진 군으로부터 선택된다. 일부 구현예에서, 비영장류 동물 AAV의 VP2 캡시드 단백질은 (a) B1 에피토프(서열번호 45), (b) SpyTag, (c) SpyCatcher, 또는 (a)~(c)의 임의의 조합을 포함할 수 있다.
일부 구현예에서, 본 발명의 비영장류 동물 AAV의 VP2 캡시드 단백질은, 임의로 제1 및 제2 링커를 통해 이에 작동 가능하게 연결된 단백질:단백질 결합 쌍의 제1 구성원을 포함한다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 VP2 캡시드 단백질의 가변 영역(VR) 또는 이의 일부에서 발견되는 아미노산 위치에서 비영장류 동물 AAV의 VP2 캡시드에 작동 가능하게 연결되며, 임의로 단백질:단백질 결합 쌍의 제1 구성원은 제1 및/또는 제2 링커를 통해 VP2 캡시드에 연결된다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 VP2 캡시드 단백질의 VR I, VR II, VR III, VR IV, VR V, VR VI, VR VII, VR VIII, VR IX 또는 HI 루프에서 발견되는 아미노산 위치에서 비영장류 동물 AAV의 VP2 캡시드에 작동 가능하게 연결되며, 임의로 단백질:단백질 결합 쌍의 제1 구성원은 제1 및/또는 제2 링커를 통해 VP2 캡시드에 연결된다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 VP2 캡시드 단백질의 VR VIII 또는 VR IV에서 발견되는 아미노산 위치에서 비영장류 동물 AAV의 VP2 캡시드에 작동 가능하게 연결되며, 임의로 단백질:단백질 결합 쌍의 제1 구성원은 제1 및/또는 제2 링커를 통해 VP2 캡시드에 연결된다. 일부 구현예에서, 비영장류 동물 AAV의 VP2 캡시드 단백질은 표 2에 제공된 비영장류 동물 AAV로부터 선택된 비영장류 동물 AAV의 VP2 캡시드 단백질이다. 일부 구현예에서, 비영장류 동물 AAV의 VP2 캡시드 단백질은 조류 AAV(AAAV)의 VP2 캡시드 단백질이다. 일부 구현예에서, AAAV의 VP2 캡시드 단백질은, 임의로 제1 또는 제2 링커를 통해, 위치 I444 또는 I580에서 작동 가능하게 연결된 단백질:단백질 결합 쌍의 제1 구성원(예: SpyTag)을 포함한다. 일부 구현예에서, 비영장류 동물 AAV의 VP2 캡시드 단백질은 턱수염 도마뱀 AAV의 VP2 캡시드 단백질이다. 일부 구현예에서, 턱수염 도마뱀 AAV의 VP2 캡시드 단백질은, 임의로 제1 또는 제2 링커를 통해, 위치 I573 또는 I436에서 작동 가능하게 연결된 단백질:단백질 결합 쌍의 제1 구성원(예: SpyTag)을 포함한다. 일부 구현예에서, 비영장류 동물 AAV의 VP2 캡시드 단백질은 바다 사자 AAV의 VP2 캡시드 단백질이다. 일부 구현예에서, 바다 사자 AAV의 VP2 캡시드 단백질은, 임의로 제1 및/또는 제2 링커를 통해, I429, I430, I431, I432, I433, I434, I436, I437, 및 I565로 이루어진 군으로부터 선택된 위치에서, 및 임의로 I429, I430, I431, I432, I433, I436, 및 I437로 이루어진 군으로부터 선택된 위치에서; 임의로 I431 위치에서 작동 가능하게 연결된 단백질:단백질 결합 쌍의 제1 구성원(예: SpyTag)을 포함한다.
일부 구현예에서, 본 발명의 VP2 캡시드 단백질은, 비영장류 동물 AAV의 VP2 캡시드 단백질의 일부 및 다른 (예를 들어, 제2) AAV의 VP2 캡시드 단백질의 일부를 작동 가능하게 연결된 상태로 포함하는 키메라 VP2 캡시드 단백질일 수 있다. 일부 구현예에서, 키메라 VP2 캡시드 단백질은 N-말단에서 C-말단 방향으로 (a) 다른 (예를 들어, 제2) AAV의 VP2 캡시드 단백질, (b) 비영장류 동물 AAV의 VP3 캡시드 단백질의 적어도 아미노산 서열을 포함하는 비영장류 동물 AAV의 VP2 캡시드의 일부를 포함하며, (a)는 (b)에 작동 가능하게 연결된다. 일부 구현예에서, 키메라 VP2 캡시드 단백질은 N-말단에서 C-말단 방향으로 (a) 다른 AAV의 VP1/VP2 공통 영역의 아미노산 서열, (b) 비영장류 동물 AAV의 VP3 캡시드 단백질의 아미노산 서열을 포함할 수 있으며, (a)는 (b)에 작동 가능하게 연결된다. 일부 구현예에서, 다른 AAV는 비영장류 동물 AAV이다. 일부 구현예에서, 다른 AAV는 영장류 AAV이다.
일부 구현예에서, 본 발명의 키메라 VP2 캡시드 단백질은 (a) 영장류 AAV의 VP2 캡시드 단백질의 일부, (b) 비영장류 동물 AAV의 VP3 캡시드 단백질의 적어도 아미노산 서열을 포함하는 비영장류 동물 AAV의 VP2 캡시드의 일부를 포함하며, (a)는 (b)에 작동 가능하게 연결된다. 일부 구현예에서, 키메라 VP2 캡시드 단백질은 N-말단에서 C-말단 방향으로 (a) 영장류 AAV의 VP1/VP2 공통 영역의 아미노산 서열, (b) 비영장류 동물 AAV의 VP3 캡시드 단백질의 아미노산 서열을 포함할 수 있으며, (a)는 (b)에 작동 가능하게 연결된다. 일부 구현예에서, 영장류 AAV는 AAV1이다. 일부 구현예에서, 영장류 AAV는 AAV2이다. 일부 구현예에서, 영장류 AAV는 AAV3이다. 일부 구현예에서, 영장류 AAV는 AAV4이다. 일부 구현예에서, 영장류 AAV는 AAV5이다. 일부 구현예에서, 영장류 AAV는 AAV6이다. 일부 구현예에서, 영장류 AAV는 AAV7이다. 일부 구현예에서, 영장류 AAV는 AAV8이다. 일부 구현예에서, 영장류 AAV는 AAV9이다. 일부 구현예에서, 비영장류 동물 AAV는 표 2에 제공된 비영장류 동물 AAV의 군으로부터 선택된다. 일부 구현예에서, 비영장류 동물 AAV는 조류 AAV, 턱수염 도마뱀 AAV, 또는 바다 사자 AAV이다.
일부 구현예에서, 본 발명의 키메라 VP2 캡시드 단백질은 (a) AAV2의 VP2 캡시드 단백질의 일부, (b) 비영장류 동물 AAV의 VP3 캡시드 단백질의 적어도 아미노산 서열을 포함하는 비영장류 동물 AAV의 VP2 캡시드의 일부를 포함하며, (a)는 (b)에 작동 가능하게 연결된다. 일부 구현예에서, 키메라 VP2 캡시드 단백질은 N-말단에서 C-말단 방향으로 (a) AAV2의 VP1/VP2 공통 영역의 아미노산 서열, (b) 비영장류 동물 AAV의 VP3 캡시드 단백질의 아미노산 서열을 포함할 수 있으며, (a)는 (b)에 작동 가능하게 연결된다.
일부 구현예에서, 본 발명의 키메라 AAV2/AAAV VP2 캡시드 단백질은 (a) AAV2의 VP2 캡시드 단백질의 일부, (b) 조류 AAV(AAAV)의 VP3 캡시드 단백질의 적어도 아미노산 서열을 포함하는 AAAV의 VP2 캡시드의 일부를 포함하며, (a)는 (b)에 작동 가능하게 연결된다. 일부 구현예에서, 키메라 AAV2/AAAV VP2 캡시드 단백질은 N-말단에서 C-말단 방향으로 (a) AAV2의 VP1/VP2 공통 영역의 아미노산 서열, (b) AAAV의 VP3 캡시드 단백질의 아미노산 서열을 포함할 수 있으며, (a)는 (b)에 작동 가능하게 연결된다.
일부 구현예에서, 본 발명의 키메라 AAV2/바다 사자 AAV VP2 캡시드 단백질은 (a) AAV2의 VP2 캡시드 단백질의 일부, (b) 바다 사자 AAV의 VP3 캡시드 단백질의 적어도 아미노산 서열을 포함하는 바다 사자 AAV의 VP2 캡시드의 일부를 포함하며, (a)는 (b)에 작동 가능하게 연결된다. 일부 구현예에서, 키메라 AAV2/바다 사자 AAV VP2 캡시드 단백질은 N-말단에서 C-말단 방향으로 (a) AAV2의 VP1/VP2 공통 영역의 아미노산 서열, (b) 바다 사자 AAV의 VP3 캡시드 단백질의 아미노산 서열을 포함할 수 있으며, (a)는 (b)에 작동 가능하게 연결된다.
일부 구현예에서, 본 발명의 키메라 AAV2/턱수염 도마뱀 AAV VP2 캡시드 단백질은 (a) AAV2의 VP2 캡시드 단백질의 일부, (b) 턱수염 도마뱀 AAV의 VP3 캡시드 단백질의 적어도 아미노산 서열을 포함하는 턱수염 도마뱀 AAV의 VP2 캡시드의 일부를 포함하며, (a)는 (b)에 작동 가능하게 연결된다. 일부 구현예에서, 키메라 AAV2/턱수염 도마뱀 AAV VP2 캡시드 단백질은 N-말단에서 C-말단 방향으로 (a) AAV2의 VP1/VP2 공통 영역의 아미노산 서열, (b) 턱수염 도마뱀 AAV의 VP3 캡시드 단백질의 아미노산 서열을 포함할 수 있으며, (a)는 (b)에 작동 가능하게 연결된다.
일부 구현예에서, 본 발명의 키메라 VP2 캡시드 단백질은 단백질:단백질 결합 쌍의 제1 구성원에 작동 가능하게 연결될 수 있고/있거나, 예를 들어, 캡시드 단백질의 자연 향성이 감소 내지는 제거되도록 및/또는 캡시드 단백질이 검출 가능한 표지를 포함하도록 점 돌연변이를 포함할 수 있다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 검출 가능한 표지를 포함한다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 c-myc(서열번호 44)를 포함하는 검출 가능한 표지를 포함한다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 공유 결합을 형성하는 단백질:단백질 결합 쌍의 제1 구성원, 및 임의로 제2 구성원을 포함한다. 일부 구현예에서, 단백질:단백질 결합 쌍은 (a) SpyTag:SpyCatcher, (b) SpyTag:KTag, (c) Isopeptag:pilin C, (d) SnoopTag:SnoopCatcher, 및 (e) SpyTag002:SpyCatcher002로 이루어진 군으로부터 선택된다. 일부 구현예에서, 키메라 VP2 캡시드 단백질은 (a) B1 에피토프(서열번호 45), (b) SpyTag, (c) SpyCatcher, 또는 (a)~(c)의 임의의 조합을 포함할 수 있다.
일부 구현예에서, 본 발명의 키메라 영장류/비영장류 동물 VP2 캡시드 단백질(예를 들어, 키메라 AAV2/AAAV VP2 캡시드 단백질, 키메라 AAV2/바다 사자 AAV VP2 캡시드 단백질, 키메라 AAV2/턱수염 도마뱀 AAV VP2 캡시드 단백질 등)은 임의로 제1 또는 제2 링커를 통해 작동 가능하게 연결된 단백질:단백질 결합 쌍의 제1 구성원을 포함한다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 키메라 영장류/비영장류 VP2 캡시드 단백질의 가변 영역(VR) 또는 이의 일부에서 발견되는 아미노산 위치에서 키메라 영장류/비영장류 VP2 캡시드 단백질(예를 들어, 키메라 AAV2/AAAV VP2 캡시드 단백질, 키메라 AAV2/바다 사자 AAV VP2 캡시드 단백질, 키메라 AAV2/턱수염 도마뱀 AAV VP2 캡시드 단백질, 등)에 작동 가능하게 연결되며, 임의로 단백질:단백질 결합 쌍의 제1 구성원은 제1 및/또는 제2 링커를 통해 키메라 영장류/비영장류 VP2 캡시드 단백질에 연결된다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 키메라 영장류/비영장류 VP2 캡시드 단백질의 VR I, VR II, VR III, VR IV, VR V, VR VI, VR VII, VR VIII, VR IX, 또는 HI 루프에서 발견되는 아미노산 위치에서 키메라 영장류/비영장류 VP2 캡시드에 작동 가능하게 연결되며, 임의로 단백질:단백질 결합 쌍의 제1 구성원은 제1 및/또는 제2 링커를 통해 VP2 캡시드에 연결된다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 키메라 영장류/비영장류 VP2 캡시드 단백질의 VR VIII 또는 VR IV에서 발견되는 아미노산 위치에서 키메라 영장류/비영장류 VP2 캡시드 단백질(예를 들어, 키메라 AAV2/AAAV VP2 캡시드 단백질, 키메라 AAV2/바다 사자 AAV VP2 캡시드 단백질, 키메라 AAV2/턱수염 도마뱀 AAV VP2 캡시드 단백질, 등)에 작동 가능하게 연결되며, 임의로 단백질:단백질 결합 쌍의 제1 구성원은 제1 및/또는 제2 링커를 통해 키메라 영장류/비영장류 VP2 캡시드 단백질에 연결된다. 일부 구현예에서, 키메라 AAV2/AAAV VP2 캡시드 단백질은, 임의로 제1 및/또는 제2 링커를 통해, 위치 I444 또는 I580에서 작동 가능하게 연결된 단백질:단백질 결합 쌍의 제1 구성원(예: SpyTag)을 포함한다. 일부 구현예에서, 키메라 AAV2/턱수염 도마뱀 AAV의 VP2 캡시드 단백질은, 임의로 제1 및/또는 제2 링커를 통해, 위치 I573 또는 I436에서 작동 가능하게 연결된 단백질:단백질 결합 쌍의 제1 구성원(예: SpyTag)을 포함한다. 일부 구현예에서, 키메라 AAV2/바다 사자 AAV의 VP2 캡시드 단백질은, 임의로 제1 및/또는 제2 링커를 통해, I429, I430, I431, I432, I433, I434, I436, I437, 및 I565로 이루어진 군으로부터 선택된 위치에서, 및 임의로 I429, I430, I431, I432, I433, I436, 및 I437로 이루어진 군으로부터 선택된 위치에서; 임의로 I431 위치에서 작동 가능하게 연결된 단백질:단백질 결합 쌍의 제1 구성원(예: SpyTag)을 포함한다.
본 발명의 비영장류 동물 VP1 캡시드 단백질은 (a) 다른 (예를 들어, 제2) AAV의 게놈을 캡시드화하고/하거나 (b) 돌연변이되는 비영장류 VP1 캡시드를 포함한다. 일부 구현예에서, 본 발명의 비영장류 동물 AAV의 VP1 캡시드 단백질은 다른 (예를 들어, 제2) AAV의 게놈을 캡시드화한다. 일부 구현예에서, 본 발명의 비영장류 동물의 VP1 캡시드 단백질은 단백질:단백질 결합 쌍의 제1 구성원에 작동 가능하게 연결될 수 있고/있거나, 예를 들어, 캡시드 단백질의 자연 향성이 감소 내지는 제거되도록 및/또는 캡시드 단백질이 검출 가능한 표지를 포함하도록 점 돌연변이를 포함할 수 있다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 검출 가능한 표지를 포함한다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 c-myc(서열번호 44)를 포함하는 검출 가능한 표지를 포함한다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 공유 결합을 형성하는 단백질:단백질 결합 쌍의 제1 구성원, 및 임의로 제2 구성원을 포함한다. 일부 구현예에서, 단백질:단백질 결합 쌍은 (a) SpyTag:SpyCatcher, (b) SpyTag:KTag, (c) Isopeptag:pilin C, (d) SnoopTag:SnoopCatcher, 및 (e) SpyTag002:SpyCatcher002로 이루어진 군으로부터 선택된다. 일부 구현예에서, 비영장류 동물 AAV의 VP3 캡시드 단백질은 (a) B1 에피토프(서열번호 45), (b) SpyTag, (c) SpyCatcher, 또는 (a)~(c)의 임의의 조합을 포함할 수 있다.
일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 VP1 캡시드 단백질의 가변 영역(VR) 또는 이의 일부에서 발견되는 아미노산 위치에서 본 발명의 비영장류 동물 AAV의 VP1 캡시드에 작동 가능하게 연결되며, 임의로 단백질:단백질 결합 쌍의 제1 구성원은 제1 및/또는 제2 링커를 통해 VP1 캡시드에 연결된다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 VP1 캡시드 단백질의 VR I, VR II, VR III, VR IV, VR V, VR VI, VR VII, VR VIII, VR IX 또는 HI 루프에서 발견되는 아미노산 위치에서 비영장류 동물 AAV의 VP1 캡시드에 작동 가능하게 연결되며, 임의로 단백질:단백질 결합 쌍의 제1 구성원은 제1 및/또는 제2 링커를 통해 VP1 캡시드에 연결된다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 VP1 캡시드 단백질의 VR VIII 또는 VR IV에서 발견되는 아미노산 위치에서 비영장류 동물 AAV의 VP1 캡시드에 작동 가능하게 연결되며, 임의로 단백질:단백질 결합 쌍의 제1 구성원은 제1 및/또는 제2 링커를 통해 VP1 캡시드에 연결된다. 일부 구현예에서, 비영장류 동물 AAV의 VP1 캡시드 단백질은 표 2에 제공된 비영장류 동물 AAV의 군으로로부터 선택된 비영장류 AAV의 VP1 캡시드 단백질이다. 일부 구현예에서, 비영장류 동물 AAV의 VP1 캡시드 단백질은 조류 AAV(AAAV)의 VP1 캡시드 단백질이다. 일부 구현예에서, AAAV의 VP1 캡시드 단백질은, 임의로 제1 또는 제2 링커를 통해, 위치 I444 또는 I580에서 작동 가능하게 연결된 단백질:단백질 결합 쌍의 제1 구성원(예: SpyTag)을 포함한다. 일부 구현예에서, 비영장류 동물 AAV의 VP1 캡시드 단백질은 턱수염 도마뱀 AAV의 VP31 캡시드 단백질이다. 일부 구현예에서, 턱수염 도마뱀 AAV의 VP1 캡시드 단백질은, 임의로 제1 또는 제2 링커를 통해, 위치 I573 또는 I436에서 작동 가능하게 연결된 단백질:단백질 결합 쌍의 제1 구성원(예: SpyTag)을 포함한다. 일부 구현예에서, 비영장류 동물 AAV의 VP1 캡시드 단백질은 바다 사자 AAV의 VP1 캡시드 단백질이다. 일부 구현예에서, 바다 사자 AAV의 VP1 캡시드 단백질은, 임의로 제1 및/또는 제2 링커를 통해, I429, I430, I431, I432, I433, I434, I436, I437, 및 I565로 이루어진 군으로부터 선택된 위치에서, 및 임의로 I429, I430, I431, I432, I433, I436, 및 I437로 이루어진 군으로부터 선택된 위치에서; 임의로 I431 위치에서 작동 가능하게 연결된 단백질:단백질 결합 쌍의 제1 구성원(예: SpyTag)을 포함한다.
일부 다른 구현예에서, 본 발명의 VP1 캡시드 단백질은, 비영장류 동물 AAV의 VP1 캡시드 단백질의 일부 및 다른 AAV의 VP1 캡시드 단백질의 일부를 작동 가능하게 연결된 상태로 포함하는 키메라 VP1 캡시드 단백질일 수 있으며, 여기서 다른 AAV는 비영장류 동물 AAV가 아니다. 일부 구현예에서, 키메라 VP1 캡시드 단백질은 N-말단에서 C-말단 방향으로 (a) 다른 AAV의 VP2 적어도 PLA2 도메인을 포함하는 다른 AAV의 VP1 캡시드 단백질의 일부, 및 (b) 비영장류 동물 AAV의 VP3 캡시드 단백질의 적어도 아미노산 서열을 포함하는 비영장류 동물 AAV의 VP1 캡시드의 일부를 포함한다. 일부 구현예에서, 키메라 VP1 캡시드 단백질은 N-말단에서 C-말단 방향으로 (a) 다른 AAV의 VP2 적어도 VP1-u 도메인을 포함하는 다른 AAV의 VP1 캡시드 단백질의 일부, 및 (b) 비영장류 동물 AAV의 VP3 캡시드 단백질의 적어도 아미노산 서열을 포함하는 비영장류 동물 AAV의 VP1 캡시드의 일부를 포함한다. 일부 구현예에서, 키메라 VP1 캡시드 단백질은 N-말단에서 C-말단 방향으로 (a) 다른 (예를 들어, 제2) AAV의 VP1-u 도메인 및 VP1/VP2 공통 영역의 아미노산 서열, 및 (b) 비영장류 동물 AAV의 VP3 캡시드 단백질의 아미노산 서열을 포함한다. 일부 구현예에서, 다른 AAV는 비영장류 동물 AAV이다. 일부 구현예에서, 다른 AAV는 영장류 AAV이다.
일부 구현예에서, 키메라 VP1 캡시드 단백질은 N-말단에서 C-말단 방향으로 (a) 영장류 AAV의 적어도 PLA2 도메인을 포함하는 영장류 AAV의 VP1 캡시드 단백질의 일부, 및 (b) 비영장류 동물 AAV의 VP3 캡시드 단백질의 적어도 아미노산 서열을 포함하는 비영장류 동물 AAV의 VP1 캡시드의 일부를 포함한다. 일부 구현예에서, 키메라 VP1 캡시드 단백질은 N-말단에서 C-말단 방향으로 (a) 영장류 AAV의 적어도 VP1-u 도메인을 포함하는 영장류 AAV의 VP1 캡시드 단백질의 일부, 및 (b) 비영장류 동물 AAV의 VP3 캡시드 단백질의 적어도 아미노산 서열을 포함하는 비영장류 동물 AAV의 VP1 캡시드의 일부를 포함한다. 일부 구현예에서, 키메라 VP1 캡시드 단백질은 N-말단에서 C-말단 방향으로 (a) 영장류 AAV의 VP1-u 도메인 및 VP1/VP2 공통 영역의 아미노산 서열, 및 (b) 비영장류 동물 AAV의 VP3 캡시드 단백질의 아미노산 서열을 포함한다. 일부 구현예에서, 영장류 AAV는 AAV1이다. 일부 구현예에서, 영장류 AAV는 AAV2이다. 일부 구현예에서, 영장류 AAV는 AAV3이다. 일부 구현예에서, 영장류 AAV는 AAV4이다. 일부 구현예에서, 영장류 AAV는 AAV5이다. 일부 구현예에서, 영장류 AAV는 AAV6이다. 일부 구현예에서, 영장류 AAV는 AAV7이다. 일부 구현예에서, 영장류 AAV는 AAV8이다. 일부 구현예에서, 영장류 AAV는 AAV9이다. 일부 구현예에서, 비영장류 동물 AAV는 표 2에 제공된 비영장류 동물 AAV의 군으로부터 선택된다. 일부 구현예에서, 비영장류 동물 AAV는 조류 AAV, 턱수염 도마뱀 AAV, 또는 바다 사자 AAV이다.
일부 구현예에서, 키메라 VP1 캡시드 단백질은 N-말단에서 C-말단 방향으로 (a) AAV2의 적어도 PLA2 도메인을 포함하는 AAV2의 VP1 캡시드 단백질의 일부, 및 (b) 비영장류 동물 AAV의 VP3 캡시드 단백질의 적어도 아미노산 서열을 포함하는 비영장류 동물 AAV의 VP1 캡시드의 일부를 포함한다. 일부 구현예에서, 키메라 VP1 캡시드 단백질은 N-말단에서 C-말단 방향으로 (a) AAV2의 적어도 VP1-u 도메인을 포함하는 AAV2의 VP1 캡시드 단백질의 일부, 및 (b) 비영장류 동물 AAV의 VP3 캡시드 단백질의 적어도 아미노산 서열을 포함하는 비영장류 동물 AAV의 VP1 캡시드의 일부를 포함한다. 일부 구현예에서, 키메라 VP1 캡시드 단백질은 N-말단에서 C-말단 방향으로 (a) AAV2의 VP1-u 도메인 및 VP1/VP2 공통 영역의 아미노산 서열, 및 (b) 비영장류 동물의 VP3 캡시드 단백질의 아미노산 서열을 포함한다.
일부 구현예에서, 키메라 AAV2/AAAV VP1 캡시드 단백질은 N-말단에서 C-말단 방향으로 (a) AAV2의 적어도 PLA2 도메인을 포함하는 AAV2의 VP1 캡시드 단백질의 일부, 및 (b) AAAV의 VP3 캡시드 단백질의 적어도 아미노산 서열을 포함하는 조류 AAV(AAAV)의 VP1 캡시드의 일부를 포함한다. 일부 구현예에서, 키메라 AAV2/AAAV VP1 캡시드 단백질은 N-말단에서 C-말단 방향으로 (a) AAV2의 적어도 VP1-u 도메인을 포함하는 AAV2의 VP1 캡시드 단백질의 일부, 및 (b) AAAV의 VP3 캡시드 단백질의 적어도 아미노산 서열을 포함하는 AAAV의 VP1 캡시드의 일부를 포함한다. 일부 구현예에서, 키메라 AAV2/AAAV VP1 캡시드 단백질은 N-말단에서 C-말단 방향으로 (a) AAV2의 VP1-u 도메인 및 VP1/VP2 공통 영역의 아미노산 서열, 및 (b) AAAV의 VP3 캡시드 단백질의 아미노산 서열을 포함한다. 일부 구현예에서, 키메라 AAV2/AAAV VP1 캡시드 단백질은 서열번호 2로서 제시된 아미노산 서열을 포함한다.
일부 구현예에서, 키메라 AAV2/바다 사자 VP1 캡시드 단백질은 N-말단에서 C-말단 방향으로 (a) AAV2의 적어도 PLA2 도메인을 포함하는 AAV2의 VP1 캡시드 단백질의 일부, 및 (b) 바다 사자의 VP3 캡시드 단백질의 적어도 아미노산 서열을 포함하는 바다 사자 AAV의 VP1 캡시드의 일부를 포함한다. 일부 구현예에서, 키메라 AAV2/바다 사자 VP1 캡시드 단백질은 N-말단에서 C-말단 방향으로 (a) AAV2의 적어도 VP1-u 도메인을 포함하는 AAV2의 VP1 캡시드 단백질의 일부, 및 (b) 바다 사자의 VP3 캡시드 단백질의 적어도 아미노산 서열을 포함하는 바다 사자의 VP1 캡시드의 일부를 포함한다. 일부 구현예에서, 키메라 AAV2/바다 사자 VP1 캡시드 단백질은 N-말단에서 C-말단 방향으로 (a) AAV2의 VP1-u 도메인 및 VP1/VP2 공통 영역의 아미노산 서열, 및 (b) 바다 사자의 VP3 캡시드 단백질의 아미노산 서열을 포함한다. 일부 구현예에서, 키메라 AAV2/바다 사자 VP1 캡시드 단백질은 서열번호 4로서 제시된 아미노산 서열을 포함한다.
일부 구현예에서, 키메라 AAV2/턱수염 도마뱀 VP1 캡시드 단백질은 N-말단에서 C-말단 방향으로 (a) AAV2의 적어도 PLA2 도메인을 포함하는 AAV2의 VP1 캡시드 단백질의 일부, 및 (b) 턱수염 도마뱀의 VP3 캡시드 단백질의 적어도 아미노산 서열을 포함하는 턱수염 도마뱀 AAV의 VP1 캡시드의 일부를 포함한다. 일부 구현예에서, 키메라 AAV2/턱수염 도마뱀 VP1 캡시드 단백질은 N-말단에서 C-말단 방향으로 (a) AAV2의 적어도 VP1-u 도메인을 포함하는 AAV2의 VP1 캡시드 단백질의 일부, 및 (b) 턱수염 도마뱀의 VP3 캡시드 단백질의 적어도 아미노산 서열을 포함하는 턱수염 도마뱀의 VP1 캡시드의 일부를 포함한다. 일부 구현예에서, 키메라 AAV2/턱수염 도마뱀 VP1 캡시드 단백질은 N-말단에서 C-말단 방향으로 (a) AAV2의 VP1-u 도메인 및 VP1/VP2 공통 영역의 아미노산 서열, 및 (b) 턱수염 도마뱀의 VP3 캡시드 단백질의 아미노산 서열을 포함한다. 일부 구현예에서, 키메라 AAV2/턱수염 도마뱀 VP1 캡시드 단백질은 서열번호 6으로서 제시된 아미노산 서열을 포함한다.
일부 구현예에서, 키메라 VP1 캡시드 단백질은 단백질:단백질 결합 쌍의 제1 구성원에 작동 가능하게 연결될 수 있고/있거나, 예를 들어, 캡시드 단백질의 자연 향성이 감소 내지는 제거되도록 및/또는 캡시드 단백질이 검출 가능한 표지를 포함하도록 점 돌연변이를 포함할 수 있다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 검출 가능한 표지를 포함한다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 c-myc(서열번호 44)를 포함하는 검출 가능한 표지를 포함한다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 공유 결합을 형성하는 단백질:단백질 결합 쌍의 제1 구성원, 및 임의로 제2 구성원을 포함한다. 일부 구현예에서, 단백질:단백질 결합 쌍은 (a) SpyTag:SpyCatcher, (b) SpyTag:KTag, (c) Isopeptag:pilin C, (d) SnoopTag:SnoopCatcher, 및 (e) SpyTag002:SpyCatcher002로 이루어진 군으로부터 선택된다. 일부 구현예에서, 키메라 VP1 캡시드 단백질은 (a) B1 에피토프(서열번호 45), (b) SpyTag, (c) SpyCatcher, 및 (a)~(c)의 임의의 조합을 포함할 수 있다.
일부 구현예에서, 키메라 영장류/비영장류 동물 VP1 캡시드 단백질(예를 들어, 키메라 AAV2/AAAV VP1 캡시드 단백질, 키메라 AAV2/바다 사자 AAV VP1 캡시드 단백질, 키메라 AAV2/턱수염 도마뱀 AAV VP1 캡시드 단백질 등)은 임의로 제1 또는 제2 링커를 통해 작동 가능하게 연결된 단백질:단백질 결합 쌍의 제1 구성원을 포함한다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 키메라 영장류/비영장류 VP1 캡시드 단백질의 가변 영역(VR) 또는 이의 일부에서 발견되는 아미노산 위치에서 키메라 영장류/비영장류 VP1 캡시드 단백질(예를 들어, 키메라 AAV2/AAAV VP1 캡시드 단백질, 키메라 AAV2/바다 사자 AAV VP1 캡시드 단백질, 키메라 AAV2/턱수염 도마뱀 AAV VP1 캡시드 단백질, 등)에 작동 가능하게 연결되며, 임의로 단백질:단백질 결합 쌍의 제1 구성원은 제1 및/또는 제2 링커를 통해 키메라 영장류/비영장류 VP1 캡시드 단백질에 연결된다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 키메라 영장류/비영장류 VP1 캡시드 단백질의 VR I, VR II, VR III, VR IV, VR V, VR VI, VR VII, VR VIII, VR IX, 또는 HI 루프에서 발견되는 아미노산 위치에서 키메라 영장류/비영장류 동물 VP1 캡시드 단백질의 VP1 캡시드에 작동 가능하게 연결되며, 임의로 단백질:단백질 결합 쌍의 제1 구성원은 제1 및/또는 제2 링커를 통해 키메라 영장류/비영장류 동물 VP1 캡시드 단백질 캡시드에 연결된다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 키메라 영장류/비영장류 VP1 캡시드 단백질의 VR VIII 또는 VR IV에서 발견되는 아미노산 위치에서 키메라 영장류/비영장류 VP1 캡시드 단백질(예를 들어, 키메라 AAV2/AAAV VP1 캡시드 단백질, 키메라 AAV2/바다 사자 AAV VP1 캡시드 단백질, 키메라 AAV2/턱수염 도마뱀 AAV VP1 캡시드 단백질, 등)에 작동 가능하게 연결되며, 임의로 단백질:단백질 결합 쌍의 제1 구성원은 제1 및/또는 제2 링커를 통해 키메라 영장류/비영장류 VP1 캡시드 단백질에 연결된다.
일부 구현예에서, 키메라 AAV2/AAAV VP1 캡시드 단백질은, 임의로 제1 및/또는 제2 링커를 통해, 위치 I444 또는 I580에서 작동 가능하게 연결된 단백질:단백질 결합 쌍의 제1 구성원을 포함한다. 일부 구현예에서, 키메라 AAV2/AAAV VP1 캡시드 단백질은, 임의로 제1 및 제2 링커 서열을 통해 위치 I444에서 작동 가능하게 연결된 SpyTag를 포함한다. 일부 구현예에서, 키메라 AAV2/AAAV VP1 캡시드 단백질은 서열번호 8로서 제시된 아미노산 서열을 포함한다. 일부 구현예에서, 키메라 AAV2/AAAV VP1 캡시드 단백질은, 임의로 제1 및 제2 링커 서열을 통해 위치 I580에서 작동 가능하게 연결된 SpyTag를 포함한다. 일부 구현예에서, 키메라 AAV2/AAAV VP1 캡시드 단백질은 서열번호 10으로서 제시된 아미노산 서열을 포함한다.
일부 구현예에서, 키메라 AAV2/바다 사자 AAV의 VP1 캡시드 단백질은, 임의로 제1 및/또는 제2 링커를 통해, I429, I430, I431, I432, I433, I434, I436, I437, 및 I565로 이루어진 군으로부터 선택된 위치에서, 및 임의로 I429, I430, I431, I432, I433, I436, 및 I437로 이루어진 군으로부터 선택된 위치에서; 임의로 I432 위치에서 작동 가능하게 연결된 단백질:단백질 결합 쌍의 제1 구성원을 포함한다. 일부 구현예에서, 키메라 AAV2/바다 사자 AAV VP1 캡시드 단백질은, 임의로 제1 및 제2 링커 서열을 통해 위치 I432에서 작동 가능하게 연결된 SpyTag를 포함한다. 일부 구현예에서, 키메라 AAV2/바다 사자 AAV VP1 캡시드 단백질은 서열번호 12로서 제시된 아미노산 서열을 포함한다. 일부 구현예에서, 키메라 AAV2/바다 사자 AAV VP1 캡시드 단백질은, 임의로 제1 및 제2 링커 서열을 통해 위치 I565에서 작동 가능하게 연결된 SpyTag를 포함한다. 일부 구현예에서, 키메라 AAV2/바다 사자 AAV VP1 캡시드 단백질은 서열번호 14로서 제시된 아미노산 서열을 포함한다. 일부 구현예에서, 키메라 AAV2/바다 사자 AAV VP1 캡시드 단백질은, 임의로 제1 및 제2 링커 서열을 통해 위치 I429에서 작동 가능하게 연결된 SpyTag를 포함한다. 일부 구현예에서, 키메라 AAV2/바다 사자 AAV VP1 캡시드 단백질은 서열번호 16으로서 제시된 아미노산 서열을 포함한다. 일부 구현예에서, 키메라 AAV2/바다 사자 AAV VP1 캡시드 단백질은, 임의로 제1 및 제2 링커 서열을 통해 위치 I430에서 작동 가능하게 연결된 SpyTag를 포함한다. 일부 구현예에서, 키메라 AAV2/바다 사자 AAV VP1 캡시드 단백질은 서열번호 18로서 제시된 아미노산 서열을 포함한다. 일부 구현예에서, 키메라 AAV2/바다 사자 AAV VP1 캡시드 단백질은, 임의로 제1 및 제2 링커 서열을 통해 위치 I431에서 작동 가능하게 연결된 SpyTag를 포함한다. 일부 구현예에서, 키메라 AAV2/바다 사자 AAV VP1 캡시드 단백질은 서열번호 20으로서 제시된 아미노산 서열을 포함한다. 일부 구현예에서, 키메라 AAV2/바다 사자 AAV VP1 캡시드 단백질은, 임의로 제1 및 제2 링커 서열을 통해 위치 I433에서 작동 가능하게 연결된 SpyTag를 포함한다. 일부 구현예에서, 키메라 AAV2/바다 사자 AAV VP1 캡시드 단백질은 서열번호 22로서 제시된 아미노산 서열을 포함한다. 일부 구현예에서, 키메라 AAV2/바다 사자 AAV VP1 캡시드 단백질은, 임의로 제1 및 제2 링커 서열을 통해 위치 I434에서 작동 가능하게 연결된 SpyTag를 포함한다. 일부 구현예에서, 키메라 AAV2/바다 사자 AAV VP1 캡시드 단백질은 서열번호 24로서 제시된 아미노산 서열을 포함한다. 일부 구현예에서, 키메라 AAV2/바다 사자 AAV VP1 캡시드 단백질은, 임의로 제1 및 제2 링커 서열을 통해 위치 I435에서 작동 가능하게 연결된 SpyTag를 포함한다. 일부 구현예에서, 키메라 AAV2/바다 사자 AAV VP1 캡시드 단백질은 서열번호 26으로서 제시된 아미노산 서열을 포함한다. 일부 구현예에서, 키메라 AAV2/바다 사자 AAV VP1 캡시드 단백질은, 임의로 제1 및 제2 링커 서열을 통해 위치 I436에서 작동 가능하게 연결된 SpyTag를 포함한다. 일부 구현예에서, 키메라 AAV2/바다 사자 AAV VP1 캡시드 단백질은 서열번호 28로서 제시된 아미노산 서열을 포함한다. 일부 구현예에서, 키메라 AAV2/바다 사자 AAV VP1 캡시드 단백질은, 임의로 제1 및 제2 링커 서열을 통해 위치 I437에서 작동 가능하게 연결된 SpyTag를 포함한다. 일부 구현예에서, 키메라 AAV2/바다 사자 AAV VP1 캡시드 단백질은 서열번호 30으로서 제시된 아미노산 서열을 포함한다. 일부 구현예에서, 키메라 AAV2/바다 사자 AAV VP1 캡시드 단백질은, 임의로 제1 및 제2 링커 서열을 통해 위치 I432에서 작동 가능하게 연결된 SpyTag를 포함한다. 일부 구현예에서, 키메라 AAV2/바다 사자 AAV VP1 캡시드 단백질은 서열번호 32로서 제시된 아미노산 서열을 포함한다. 일부 구현예에서, 키메라 AAV2/바다 사자 AAV VP1 캡시드 단백질은 서열번호 53으로서 제시된 아미노산 서열을 포함한다. 일부 구현예에서, 키메라 AAV2/바다 사자 AAV VP1 캡시드 단백질은 서열번호 55로서 제시된 아미노산 서열을 포함한다. 일부 구현예에서, 키메라 AAV2/바다 사자 AAV VP1 캡시드 단백질은 서열번호 57로서 제시된 아미노산 서열을 포함한다. 일부 구현예에서, 키메라 AAV2/바다 사자 AAV VP1 캡시드 단백질은 서열번호 59로서 제시된 아미노산 서열을 포함한다. 일부 구현예에서, 키메라 AAV2/바다 사자 AAV VP1 캡시드 단백질은 서열번호 61로서 제시된 아미노산 서열을 포함한다. 일부 구현예에서, 키메라 AAV2/바다 사자 AAV VP1 캡시드 단백질은 서열번호 63으로서 제시된 아미노산 서열을 포함한다. 일부 구현예에서, 키메라 AAV2/바다 사자 AAV VP1 캡시드 단백질은 서열번호 65로서 제시된 아미노산 서열을 포함한다. 일부 구현예에서, 키메라 AAV2/바다 사자 AAV VP1 캡시드 단백질은 서열번호 67로서 제시된 아미노산 서열을 포함한다. 일부 구현예에서, 키메라 AAV2/바다 사자 AAV VP1 캡시드 단백질은 서열번호 69로서 제시된 아미노산 서열을 포함한다. 일부 구현예에서, 키메라 AAV2/바다 사자 AAV VP1 캡시드 단백질은 서열번호 71로서 제시된 아미노산 서열을 포함한다.
일부 구현예에서, 키메라 AAV2/턱수염 도마뱀 AAV VP1 캡시드 단백질은, 임의로 제1 및/또는 제2 링커를 통해, 위치 I436 또는 I573에서 작동 가능하게 연결된 단백질:단백질 결합 쌍의 제1 구성원을 포함한다. 일부 구현예에서, 키메라 AAV2/턱수염 도마뱀 AAV VP1 캡시드 단백질은, 임의로 제1 및 제2 링커 서열을 통해 위치 I436에서 작동 가능하게 연결된 SpyTag를 포함한다. 일부 구현예에서, 키메라 AAV2/턱수염 도마뱀 AAV VP1 캡시드 단백질은 서열번호 34로서 제시된 아미노산 서열을 포함한다. 일부 구현예에서, 키메라 AAV2/턱수염 도마뱀 AAV VP1 캡시드 단백질은, 임의로 제1 및 제2 링커 서열을 통해 위치 I573에서 작동 가능하게 연결된 SpyTag를 포함한다. 일부 구현예에서, 키메라 AAV2/턱수염 도마뱀 AAV VP1 캡시드 단백질은 서열번호 36으로서 제시된 아미노산 서열을 포함한다.
일부 구현예에서, 본 발명의 캡시드 단백질은 단백질:단백질 결합 쌍의 제1 구성원 및 제2 구성원을 추가로 포함하되, 임의로 제2 구성원은 표적화 리간드에 작동 가능하게 연결되고, 임의로 표적화 리간드는 결합 모이어티이다. 일부 구현예에서, 표적화 리간드는 항체 또는 이의 일부이다. 일부 구현예에서, 항체 또는 이의 일부는 제2 구성원, 예를 들어 SpyCatcher에 융합된다. 일부 구현예에서, 항체 또는 이의 일부는 이의 C-말단에서 링커, 임의로 서열번호 49로서 제시된 서열(GSGESG)을 포함하는 링커에 융합되고, 링커는 링커의 C-말단에서 제2 구성원, 예를 들어 SpyCatcher에 융합된다.
일부 구현예에서, 본 발명의 캡시드 단백질은 검출 가능한 표지를 포함할 수 있으며, 상기 검출 가능한 표지는 임의로 단백질:단백질 결합 쌍의 제1 구성원으로서 작용할 수 있고/있거나 캡시드 단백질의 검출 및/또는 단리를 위해 작용할 수 있다. 일부 구현예에서, 검출 가능한 표지는 c-myc이다. 일부 구현예에서, 검출 가능한 표지는 AAV B1 에피토프, 예를 들어 아미노산 서열 IGTRYLTR(서열번호 45)을 포함한다.
본 발명의 AAV 캡시드 단백질은 다음으로 이루어진 군으로부터 선택된 아미노산 서열을 포함할 수 있다: (a) 서열번호 2로서 제시된 아미노산 서열, (b) 서열번호 4로서 제시된 아미노산 서열, (c) 서열번호 6으로서 제시된 아미노산 서열, (d) 서열번호 8로서 제시된 아미노산 서열, (e) 서열번호 10으로서 제시된 아미노산 서열, (f) 서열번호 12로서 제시된 아미노산 서열, (g) 서열번호 14로서 제시된 아미노산 서열, (h) 서열번호 16으로서 제시된 아미노산 서열, (i) 서열번호 18로서 제시된 아미노산 서열, (j) 서열번호 20로서 제시된 아미노산 서열, (k) 서열번호 22로서 제시된 아미노산 서열, (l) 서열번호 24로서 제시된 아미노산 서열, (m) 서열번호 26으로서 제시된 아미노산 서열, (n) 서열번호 28로서 제시된 아미노산 서열, (o) 서열번호 30으로서 제시된 아미노산 서열, (p) 서열번호 32로서 제시된 아미노산 서열, (q) 서열번호 34로서 제시된 아미노산 서열, (r) 서열번호 36으로서 제시된 아미노산 서열, (s) 서열번호 53로서 제시된 아미노산 서열, (t) 서열번호 55로서 제시된 아미노산 서열, (u) 서열번호 57로서 제시된 아미노산 서열, (v) 서열번호 59로서 제시된 아미노산 서열, (w) 서열번호 61로서 제시된 아미노산 서열, (x) 서열번호 63으로서 제시된 아미노산 서열, (y) 서열번호 65로서 제시된 아미노산 서열, (z) 서열번호 67로서 제시된 아미노산 서열, (aa) 서열번호 69로서 제시된 아미노산 서열, (bb) 서열번호 71로서 제시된 아미노산 서열, (cc) 서열번호 2, 서열번호 4, 서열번호 6, 서열번호 8, 서열번호 10, 서열번호 12, 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26, 서열번호 28, 서열번호 30, 서열번호 32, 서열번호 34, 서열번호 36, 서열번호 53, 서열번호 55, 서열번호 57, 서열번호 59, 서열번호 61, 서열번호 63, 서열번호 65, 서열번호 67, 서열번호 69, 또는 서열번호 71에 대해 적어도 95% 동일성을 갖는 아미노산 서열, 및 (dd) (a)~(cc) 중 어느 하나에 제시된 아미노산 서열의 임의의 VP2 및/또는 VP3 부분의 아미노산 서열.
일부 구현예에서, 본 발명의 캡시드 단백질은 본 발명의 핵산 분자에 의해 암호화된다. 또한, 본 발명의 캡시드 단백질을 암호화하는 핵산 분자가 본원에 제공된다.
AAV VP1 캡시드 단백질, AAV VP2 캡시드 단백질, 및/또는 AAV VP3 캡시드 단백질을 암호화하는 AAV cap 유전자를 포함하는 핵산 분자가 본원에 기술되며, 여기서 AAV cap 유전자 또는 이의 일부는 비영장류 동물 AAV 또는 이의 일부, 또는 원격 AAV 또는 이의 일부의 cap 유전자의 핵산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 핵산 서열을 포함하며, AAV cap 유전자는 (a) 단백질:단백질 결합 쌍의 제1 구성원을 암호화하는 뉴클레오티드 서열, (b) 검출 가능한 표지를 암호화하는 뉴클레오티드 서열, (c) 점돌연변이, (d) 키메라 뉴클레오티드 서열, 또는 (e) (a), (b), (c), 및 (d)의 임의의 조합을 포함하도록 추가로 변형된다. 핵산 분자의 일부 구현예에서, 핵산은 AAV rep 유전자 및 AAV cap 유전자를 포함하되, 전체 AAV cap 유전자는 비영장류 동물 AAV 또는 원격 AAV의 cap 유전자의 핵산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 제1 핵산 서열을 포함하고, AAV rep 유전자 또는 이의 일부는 제2 AAV 또는 이의 일부의 rep 유전자의 핵산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 제2 핵산 서열을 포함하며, 여기서 비영장류 동물 AAV는 제2 AAV와 동일하지 않다. 일부 구현예에서, 본 발명의 핵산 분자는 AAV 캡시드 단백질을 암호화하는 AAV cap 유전자를 포함하되, AAV cap 유전자는 (i) 비영장류 동물 AAV의 cap 유전자, (ii) 원격 AAV의 cap 유전자, 또는 (iii) 이들의 조합으로 이루어진 군으로부터 선택된 cap 유전자의 뉴클레오티드 서열과 동일하거나 이에 대해 상당한 동일성, 예를 들어 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하며, 상기 AAV cap 유전자는 다음을 포함하도록 추가로 변형된다: (a) 단백질:단백질 결합 쌍의 제1 구성원을 암호화하는 뉴클레오티드 서열, (b) 검출 가능한 표지를 암호화하는 뉴클레오티드 서열, (c) 점 돌연변이, (d) 비영장류 동물 AAV, 원격 AAV, 또는 이들의 조합의 cap 유전자로 이루어진 군으로부터 선택된 AAV cap 유전자의 상기 뉴클레오티드 서열에 작동 가능하게 연결된 다른 (예를 들어, 제2) AAV cap 유전자의 뉴클레오티드 서열의 일부를 포함하는 키메라 뉴클레오티드 서열, (e) (a), (b), (c), 및 (d)의 임의의 조합.
일부 구현예에서, 본 발명의 핵산 분자는 AAV 캡시드 단백질을 암호화하는 AAV cap 유전자를 포함하되, AAV cap 유전자는 비영장류 동물 AAV의 cap 유전자의 뉴클레오티드 서열과 동일하거나 이에 대해 상당한 동일성, 예를 들어 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하며, 상기 AAV cap 유전자는 다음을 포함하도록 추가로 변형된다: (a) 단백질:단백질 결합 쌍의 제1 구성원을 암호화하는 뉴클레오티드 서열, (b) 검출 가능한 표지를 암호화하는 뉴클레오티드 서열, (c) 점 돌연변이, (d) 비영장류 동물 AAV의 cap 유전자의 상기 뉴클레오티드 서열에 작동 가능하게 연결된 다른 (예를 들어, 제2) AAV cap 유전자의 뉴클레오티드 서열의 일부를 포함하는 키메라 뉴클레오티드 서열, (e) (a), (b), (c), 및 (d)의 임의의 조합.
일부 구현예에서, 본 발명의 핵산 분자는 AAV 캡시드 단백질을 암호화하는 AAV cap 유전자를 포함하되, AAV cap 유전자는 원격 AAV의 cap 유전자의 뉴클레오티드 서열과 동일하거나 이에 대해 상당한 동일성, 예를 들어 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하며, 상기 AAV cap 유전자는 다음을 포함하도록 추가로 변형된다: (a) 단백질:단백질 결합 쌍의 제1 구성원을 암호화하는 뉴클레오티드 서열, (b) 검출 가능한 표지를 암호화하는 뉴클레오티드 서열, (c) 점 돌연변이, (d) 원격 AAV의 cap 유전자의 상기 뉴클레오티드 서열에 작동 가능하게 연결된 다른 AAV cap 유전자의 뉴클레오티드 서열의 일부를 포함하는 키메라 뉴클레오티드 서열, (e) (a), (b), (c), 및 (d)의 임의의 조합.
일부 구현예에서, 본 발명의 핵산 분자는 AAV rep 유전자 및 AAV cap 유전자를 포함하되, AAV cap 유전자는 (i) 비영장류 동물 AAV의 cap 유전자, (ii) 원격 영장류 AAV의 cap 유전자, 및 (iv) 이들의 조합으로 이루어진 군으로부터 선택된 cap 유전자의 뉴클레오티드 서열과 동일하거나 이에 대해 상당한 동일성, 예를 들어 적어도 95% 서열 동일성을 갖는 제1 뉴클레오티드 서열을 포함하며, AAV rep 유전자는 다른 (예를 들어, 제2) AAV rep 유전자의 제2 뉴클레오티드 서열을 포함한다.
일부 구현예에서, 본 발명의 핵산 분자는 AAV rep 유전자 및 AAV cap 유전자를 포함하되, AAV cap 유전자는 비영장류 동물 AAV의 cap 유전자의 뉴클레오티드 서열과 동일하거나 이에 대해 상당한 동일성, 예를 들어 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열인 제1 뉴클레오티드 서열을 포함하고, AAV rep 유전자는 다른 (예를 들어, 제2) AAV의 AAV rep 유전자의 뉴클레오티드 서열과 동일하거나 이에 대해 상당한 동일성, 예를 들어 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열인 제2 뉴클레오티드 서열을 포함한다.
일부 구현예에서, 본 발명의 핵산 분자는 AAV rep 유전자 및 AAV cap 유전자를 포함하되, AAV cap 유전자는 원격 동물 AAV의 cap 유전자의 제1 뉴클레오티드 서열과 동일하거나 이에 대해 상당한 동일성, 예를 들어 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하고, AAV rep 유전자는 다른 (예를 들어, 제2) AAV의 AAV rep 유전자의 제2 뉴클레오티드 서열과 동일하거나 이에 대해 상당한 동일성, 예를 들어 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함한다.
본 발명의 핵산 분자의 일부 구현예에서, 비영장류 동물 AAV의 뉴클레오티드 서열과 동일하거나 이에 대해 상당한 동일성, 예를 들어 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는 cap 유전자의 뉴클레오티드 서열, 원격 AAV의 뉴클레오티드 서열과 동일하거나 이에 대해 상당한 동일성, 예를 들어 적어도 95% 서열 동일성을 갖는 cap 유전자의 뉴클레오티드 서열, 또는 이들의 조합은 다음을 포함하도록 변형된다: (a) 단백질:단백질 결합 쌍의 적어도 제1 구성원을 암호화하는 뉴클레오티드 서열, (b) 검출 가능한 표지를 암호화하는 뉴클레오티드 서열, 및/또는 (c) 점 돌연변이를 암호화하는 뉴클레오티드 서열.
핵산의 일부 구현예에서, 단백질:단백질 결합 쌍은 SpyTag:SpyCatcher, SpyTag:KTag, Isopeptag:pilin-C, SnoopTag:SnoopCatcher, 및 SpyTag002:SpyCatcher002로부터 선택된다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 검출 가능한 표지, 예를 들어 서열번호 44로서 제시된 서열을 포함하는 c-myc를 포함한다.
핵산의 일부 구현예에서, 비영장류 동물 AAV의 cap 유전자, 원격 AAV의 cap 유전자, 또는 이들의 조합의 뉴클레오티드 서열은 아미노산 서열 IGTRYLTR(서열번호 45)을 포함하는 B1 에피토프를 포함하도록 변형된다.
본 발명의 핵산 분자의 일부 구현예에서, 비영장류 동물 AAV의 cap 유전자, 원격 AAV의 cap 유전자, 또는 이들의 조합의 뉴클레오티드 서열은 비영장류 동물 AAV의 VP3 캡시드 단백질의 아미노산 서열 및/또는 원격 AAV의 VP3 캡시드 단백질의 아미노산 서열과 동일하거나 이에 대해 상당한 동일성, 예를 들어 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 VP3 캡시드 단백질을 암호화하는 뉴클레오티드 서열 또는 이의 일부를 포함한다. 일부 구현예에서, 비영장류 동물 AAV의 cap 유전자, 원격 AAV의 cap 유전자, 또는 이들의 조합의 뉴클레오티드 서열은 비영장류 동물 AAV의 VP2 캡시드 단백질의 아미노산 서열 및/또는 원격 AAV의 VP2 캡시드 단백질의 아미노산 서열과 동일하거나 이에 대해 상당한 동일성, 예를 들어 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 VP2 캡시드 단백질을 암호화하는 뉴클레오티드 서열 또는 이의 일부를 포함한다. 일부 구현예에서, 비영장류 동물 AAV의 cap 유전자, 원격 AAV의 cap 유전자, 또는 이들의 조합의 뉴클레오티드 서열은 비영장류 동물 AAV의 VP1 캡시드 단백질의 아미노산 서열 및/또는 원격 AAV의 VP1 캡시드 단백질의 아미노산 서열과 동일하거나 이에 대해 상당한 동일성, 예를 들어 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 VP1 캡시드 단백질을 암호화하는 뉴클레오티드 서열 또는 이의 일부를 포함한다.
일부 구현예에서, 본 발명의 핵산 분자는 본 발명의 비영장류 동물 VP3 캡시드 단백질을 암호화하는 뉴클레오티드 서열을 포함한다. 일부 구현예에서, 본 발명의 핵산 분자는 본 발명의 비영장류 동물 VP3 캡시드 단백질 및 본 발명의 비영장류 동물 VP2 캡시드 단백질을 암호화하는 뉴클레오티드 서열을 포함한다. 일부 구현예에서, 본 발명의 핵산 분자는 본 발명의 비영장류 동물 VP3 캡시드 단백질, 및 본 발명의 VP2 캡시드 단백질, 및 본 발명의 VP1 캡시드 단백질을 암호화하는 뉴클레오티드 서열을 포함한다.
일부 구현예에서, 본 발명의 핵산 분자의 cap 유전자는 다음을 암호화한다: (i) (a) 키메라 AAV VP1 캡시드 단백질(임의로, 키메라 VP1 캡시드 단백질은, 비영장류 AAV 또는 원격 AAV의 아미노산 서열과 동일하거나 이에 대해 상당한 동일성, 예를 들어 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 VP1/VP2 공통 영역 및 VP3 영역에 작동 가능하게 연결된 다른 (예를 들어, 제2) AAV의 아미노산 서열과 동일하거나 상당한 동일성, 예를 들어 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 VP1-고유 영역(VP1-u)을 포함함)이거나, (b) 비영장류 AAV 또는 원격 AAV의 VP1 캡시드 단백질의 아미노산 서열과 동일하거나 이에 대해 상당한 동일성, 예를 들어 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 VP1 캡시드 단백질인, VP1 캡시드 단백질; (ii) (a) 키메라 AAV VP2 캡시드 단백질(임의로, 키메라 VP2 캡시드 단백질은, 비영장류 AAV의 아미노산 서열과 동일하거나 이에 대해 상당한 동일성, 예를 들어 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 VP3 영역에 작동 가능하게 연결된 다른 (예를 들어, 제2) AAV의 아미노산 서열과 동일하거나 이에 대해 상당한 동일성, 예를 들어 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 VP1/VP2 공통 영역을 포함함)이거나, (b) 비영장류 AAV의 VP2 캡시드 단백질의 아미노산 서열과 동일하거나 이에 대해 상당한 동일성, 예를 들어 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 VP2 캡시드 단백질인, VP2 캡시드 단백질; 및/또는 (iii) 비영장류 AAV 또는 원격 AAV의 VP3 캡시드 단백질의 아미노산 서열과 동일하거나 상당한 동일성, 예를 들어 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 VP3 캡시드 단백질.
일부 구현예에서, 본 발명의 핵산 분자의 cap 유전자는 다음을 암호화한다: (i) 키메라 AAV VP1 캡시드 단백질(임의로, 키메라 VP1 캡시드 단백질은, 비영장류 AAV 또는 원격 AAV의 아미노산 서열과 동일하거나 이에 대해 상당한 동일성, 예를 들어 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 VP1/VP2 공통 영역 및 VP3 영역에 작동 가능하게 연결된 다른 (예를 들어, 제2) AAV의 아미노산 서열과 동일하거나 이에 대해 상당한 동일성, 예를 들어 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 VP1-고유 영역(VP1-u)을 포함함); (ii) 키메라 AAV VP2 캡시드 단백질(임의로, 키메라 VP2 캡시드 단백질은, 비영장류 동물 AAV 또는 원격 AAV의 VP3 영역에 작동 가능하게 연결된 다른 (예를 들어, 제2) AAV의 아미노산 서열과 동일하거나 이에 대해 상당한 동일성, 예를 들어 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 VP1/VP2 공통 영역을 포함함); 및/또는 (iii) 비영장류 AAV 또는 원격 AAV의 아미노산 서열과 동일하거나 이에 대해 상당한 동일성, 예를 들어 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 VP3 캡시드 단백질.
일부 구현예에서, 본 발명의 핵산 분자의 cap 유전자는 다음을 암호화한다: (i) 키메라 AAV VP1 캡시드 단백질(임의로, 키메라 VP1 캡시드 단백질은, 비영장류 AAV 또는 원격 AAV의 아미노산 서열과 동일하거나 이에 대해 상당한 동일성, 예를 들어 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 VP1/VP2 공통 영역 및 VP3 영역에 작동 가능하게 연결된 다른 AAV의 아미노산 서열과 동일하거나 이에 대해 상당한 동일성, 예를 들어 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 VP1-고유 영역(VP1-u)을 포함함); (ii) 비영장류 동물 AAV 또는 원격 AAV의 아미노산 서열과 동일하거나 이에 대해 상당한 동일성, 예를 들어 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 VP2 캡시드 단백질; 및 (iii) 비영장류 AAV 또는 원격 AAV의 아미노산 서열과 동일하거나 이에 대해 상당한 동일성, 예를 들어 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 VP3 캡시드 단백질.
일부 구현예에서, 본 발명의 핵산 분자의 cap 유전자는 다음을 암호화한다: (i) 비영장류 AAV 또는 원격 AAV의 아미노산 서열과 동일하거나 이에 대해 상당한 동일성, 예를 들어 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 VP1 캡시드 단백질; (ii) 비영장류 동물 AAV 또는 원격 AAV의 아미노산 서열과 동일하거나 이에 대해 상당한 동일성, 예를 들어 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 VP2 캡시드 단백질; 및/또는 (iii) 비영장류 AAV 또는 원격 AAV의 아미노산 서열과 동일하거나 이에 대해 상당한 동일성, 예를 들어 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 VP3 캡시드 단백질.
본 발명의 핵산 분자의 일부 구현예에서, 다른 (제2) AAV는 영장류 AAV이거나 영장류 AAV의 조합이다. 일부 구현예에서, 다른 AAV는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, 및 이들의 조합으로 이루어진 군으로부터 선택된다. 일부 구현예에서, 다른 AAV는 AAV2이다.
본 발명의 핵산 분자의 일부 구현예에서, 비영장류 동물 AAV는 표 2에 열거된 비영장류 AAV이다. 일부 구현예에서, 비영장류 AAV는 조류 AAV (AAAV), 바다 사자 AAV, 또는 턱수염 도마뱀 AAV이다. 일부 구현예에서, 비영장류 동물 AAV는 AAAV이고, 임의로 AAAV 캡시드 단백질의 뉴클레오티드 서열은 AAAV의 VP1 캡시드 단백질의 위치 I444 또는 I580에서의 변형을 포함한다. 일부 구현예에서, 비영장류 동물 AAV는 유린류 AAV, 예를 들어, 턱수염 도마뱀 AAV이고, 임의로 턱수염 도마뱀 AAV의 뉴클레오티드 서열은 턱수염 도마뱀 AAV의 VP1 캡시드 단백질의 위치 I573 또는 I436에서의 변형을 포함한다. 일부 구현예에서, 비영장류 동물 AAV는 포유류 AAV, 예를 들어, 바다 사자 AAV이고, 임의로 바다 사자 AAV의 뉴클레오티드 서열은 바다 사자 AAV의 VP1 캡시드 단백질의 I429, I430, I431, I432, I433, I434, I436, I437, 및 A565로 이루어진 군으로부터 선택된 위치에서 변형을 포함한다.
본 발명의 핵산 분자의 구현예는 다음으로 이루어진 군으로부터 선택된 뉴클레오티드 서열을 포함할 수 있다: (a) 서열번호 1로서 제시된 뉴클레오티드 서열, (b) 서열번호 3으로서 제시된 뉴클레오티드 서열, (c) 서열번호 5로서 제시된 뉴클레오티드 서열, (d) 서열번호 7로서 제시된 뉴클레오티드 서열, (e) 서열번호 9로서 제시된 뉴클레오티드 서열, (f) 서열번호 11로서 제시된 뉴클레오티드 서열, (g) 서열번호 13으로서 제시된 뉴클레오티드 서열, (h) 서열번호 15로서 제시된 뉴클레오티드 서열, (i) 서열번호 17로서 제시된 뉴클레오티드 서열, (j) 서열번호 19로서 제시된 뉴클레오티드 서열, (k) 서열번호 21로서 제시된 뉴클레오티드 서열, (l) 서열번호 23으로서 제시된 뉴클레오티드 서열, (m) 서열번호 25로서 제시된 뉴클레오티드 서열, (n) 서열번호 27로서 제시된 뉴클레오티드 서열, (o) 서열번호 29로서 제시된 뉴클레오티드 서열, (p) 서열번호 31로서 제시된 뉴클레오티드 서열, (q) 서열번호 33으로서 제시된 뉴클레오티드 서열, (r) 서열번호 35로서 제시된 뉴클레오티드 서열, (s) 서열번호 52로서 제시된 뉴클레오티드 서열, (t) 서열번호 54로서 제시된 뉴클레오티드 서열, (u) 서열번호 56으로서 제시된 뉴클레오티드 서열, (v) 서열번호 58로서 제시된 뉴클레오티드 서열, (w) 서열번호 60으로서 제시된 뉴클레오티드 서열, (x) 서열번호 62로서 제시된 뉴클레오티드 서열, (y) 서열번호 64로서 제시된 뉴클레오티드 서열, (z) 서열번호 66으로서 제시된 뉴클레오티드 서열, (aa) 서열번호 68로서 제시된 뉴클레오티드 서열, (bb) 서열번호 70으로서 제시된 뉴클레오티드 서열, (cc) 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33,35, 52, 54, 56, 58, 60, 62, 64, 66, 68, 또는 70으로서 제시된 뉴클레오티드 서열에 대해 적어도 95% 동일성을 갖는 뉴클레오티드 서열, (dd) VP2 캡시드 단백질 및/또는 VP3 캡시드 단백질을 암호화하는 (a)~(cc)의 뉴클레오티드 서열의 임의의 일부.
일부 구현예에서, 핵산 분자는 서열번호 1로서 제시된 뉴클레오티드 서열, VP2 및/또는 VP3 캡시드 단백질을 암호화하는 이의 일부, 및 이의 퇴행성 변이체를 포함한다. 일부 구현예에서, 핵산 분자는 서열번호 3으로서 제시된 뉴클레오티드 서열, VP2 및/또는 VP3 캡시드 단백질을 암호화하는 이의 일부, 및 이의 퇴행성 변이체를 포함한다. 일부 구현예에서, 핵산 분자는 서열번호 5로서 제시된 뉴클레오티드 서열, VP2 및/또는 VP3 캡시드 단백질을 암호화하는 이의 일부, 및 이의 퇴행성 변이체를 포함한다. 일부 구현예에서, 핵산 분자는 서열번호 7로서 제시된 뉴클레오티드 서열, VP2 및/또는 VP3 캡시드 단백질을 암호화하는 이의 일부, 및 이의 퇴행성 변이체를 포함한다. 일부 구현예에서, 핵산 분자는 서열번호 9로서 제시된 뉴클레오티드 서열, VP2 및/또는 VP3 캡시드 단백질을 암호화하는 이의 일부, 및 이의 퇴행성 변이체를 포함한다. 일부 구현예에서, 핵산 분자는 서열번호 11로서 제시된 뉴클레오티드 서열, VP2 및/또는 VP3 캡시드 단백질을 암호화하는 이의 일부, 및 이의 퇴행성 변이체를 포함한다. 일부 구현예에서, 핵산 분자는 서열번호 13으로서 제시된 뉴클레오티드 서열, VP2 및/또는 VP3 캡시드 단백질을 암호화하는 이의 일부, 및 이의 퇴행성 변이체를 포함한다. 일부 구현예에서, 핵산 분자는 서열번호 15로서 제시된 뉴클레오티드 서열, VP2 및/또는 VP3 캡시드 단백질을 암호화하는 이의 일부, 및 이의 퇴행성 변이체를 포함한다. 일부 구현예에서, 핵산 분자는 서열번호 17로서 제시된 뉴클레오티드 서열, VP2 및/또는 VP3 캡시드 단백질을 암호화하는 이의 일부, 및 이의 퇴행성 변이체를 포함한다. 일부 구현예에서, 핵산 분자는 서열번호 19로서 제시된 뉴클레오티드 서열, VP2 및/또는 VP3 캡시드 단백질을 암호화하는 이의 일부, 및 이의 퇴행성 변이체를 포함한다. 일부 구현예에서, 핵산 분자는 서열번호 21로서 제시된 뉴클레오티드 서열, VP2 및/또는 VP3 캡시드 단백질을 암호화하는 이의 일부, 및 이의 퇴행성 변이체를 포함한다. 일부 구현예에서, 핵산 분자는 서열번호 23으로서 제시된 뉴클레오티드 서열, VP2 및/또는 VP3 캡시드 단백질을 암호화하는 이의 일부, 및 이의 퇴행성 변이체를 포함한다. 일부 구현예에서, 핵산 분자는 서열번호 25로서 제시된 뉴클레오티드 서열, VP2 및/또는 VP3 캡시드 단백질을 암호화하는 이의 일부, 및 이의 퇴행성 변이체를 포함한다. 일부 구현예에서, 핵산 분자는 서열번호 27로서 제시된 뉴클레오티드 서열, VP2 및/또는 VP3 캡시드 단백질을 암호화하는 이의 일부, 및 이의 퇴행성 변이체를 포함한다. 일부 구현예에서, 핵산 분자는 서열번호 29로서 제시된 뉴클레오티드 서열, VP2 및/또는 VP3 캡시드 단백질을 암호화하는 이의 일부, 및 이의 퇴행성 변이체를 포함한다. 일부 구현예에서, 핵산 분자는 서열번호 31로서 제시된 뉴클레오티드 서열, VP2 및/또는 VP3 캡시드 단백질을 암호화하는 이의 일부, 및 이의 퇴행성 변이체를 포함한다. 일부 구현예에서, 핵산 분자는 서열번호 33으로서 제시된 뉴클레오티드 서열, VP2 및/또는 VP3 캡시드 단백질을 암호화하는 이의 일부, 및 이의 퇴행성 변이체를 포함한다. 일부 구현예에서, 핵산 분자는 서열번호 35로서 제시된 뉴클레오티드 서열, VP2 및/또는 VP3 캡시드 단백질을 암호화하는 이의 일부, 및 이의 퇴행성 변이체를 포함한다. 일부 구현예에서, 핵산 분자는 서열번호 52로서 제시된 뉴클레오티드 서열, VP2 및/또는 VP3 캡시드 단백질을 암호화하는 이의 일부, 및 이의 퇴행성 변이체를 포함한다. 일부 구현예에서, 핵산 분자는 서열번호 54로서 제시된 뉴클레오티드 서열, VP2 및/또는 VP3 캡시드 단백질을 암호화하는 이의 일부, 및 이의 퇴행성 변이체를 포함한다. 일부 구현예에서, 핵산 분자는 서열번호 56으로서 제시된 뉴클레오티드 서열, VP2 및/또는 VP3 캡시드 단백질을 암호화하는 이의 일부, 및 이의 퇴행성 변이체를 포함한다. 일부 구현예에서, 핵산 분자는 서열번호 58로서 제시된 뉴클레오티드 서열, VP2 및/또는 VP3 캡시드 단백질을 암호화하는 이의 일부, 및 이의 퇴행성 변이체를 포함한다. 일부 구현예에서, 핵산 분자는 서열번호 60으로서 제시된 뉴클레오티드 서열, VP2 및/또는 VP3 캡시드 단백질을 암호화하는 이의 일부, 및 이의 퇴행성 변이체를 포함한다. 일부 구현예에서, 핵산 분자는 서열번호 62로서 제시된 뉴클레오티드 서열, VP2 및/또는 VP3 캡시드 단백질을 암호화하는 이의 일부, 및 이의 퇴행성 변이체를 포함한다. 일부 구현예에서, 핵산 분자는 서열번호 64로서 제시된 뉴클레오티드 서열, VP2 및/또는 VP3 캡시드 단백질을 암호화하는 이의 일부, 및 이의 퇴행성 변이체를 포함한다. 일부 구현예에서, 핵산 분자는 서열번호 66으로서 제시된 뉴클레오티드 서열, VP2 및/또는 VP3 캡시드 단백질을 암호화하는 이의 일부, 및 이의 퇴행성 변이체를 포함한다. 일부 구현예에서, 핵산 분자는 서열번호 68로서 제시된 뉴클레오티드 서열, VP2 및/또는 VP3 캡시드 단백질을 암호화하는 이의 일부, 및 이의 퇴행성 변이체를 포함한다. 일부 구현예에서, 핵산 분자는 서열번호 70으로서 제시된 뉴클레오티드 서열, VP2 및/또는 VP3 캡시드 단백질을 암호화하는 이의 일부, 및 이의 퇴행성 변이체를 포함한다.
일부 구현예에서, 본 발명의 VP1 캡시드 단백질 및 임의로 본 발명의 VP2 및/또는 VP3 캡시드 단백질을 암호화하는 뉴클레오티드 서열은 프로모터에 작동 가능하게 연결된다. 일부 구현예에서, 프로모터는 바이러스 프로모터, 박테리아 프로모터, 포유류 프로모터(예: 인간 또는 비인간), 조류 프로모터, 어류 프로모터, 곤충 프로모터, 및 이들의 임의의 조합으로부터 선택된다. 일부 구현예에서, 프로모터는 p40, SV40, EF, CMV, B19p6, 및 CAG로부터 선택된다. 일부 구현예에서, 프로모터는 AAV p40 프로모터이다. 일부 구현예에서, 프로모터는 포장 세포에서 캡시드 단백질(들)의 발현을 유도한다.
일부 구현예에서, 본 발명의 핵산 분자의 cap 유전자는 프로모터에 작동 가능하게 연결된다. 일부 구현예에서, 프로모터는 포장 세포에서 캡시드 단백질(들)의 발현을 유도한다. 일부 구현예에서, 프로모터는 p40, SV40, EF(예를 들어, EF1α), CMV, B19p6, 및 CAG로부터 선택된다.
일부 구현예에서, 본 발명의 핵산 분자는 하나 이상의 AAV Rep 단백질을 암호화하는 제2 뉴클레오티드 서열을 추가로 포함하되, 임의로, 제2 뉴클레오티드 서열은 프로모터에 작동가능하게 연결된다. 일부 구현예에서, 하나 이상의 Rep 단백질은 영장류 동물 AAV Rep 단백질이다. 일부 구현예에서, 하나 이상의 Rep 단백질은 비영장류 동물 AAV Rep 단백질이다. 일부 구현예에서, 하나 이상의 Rep 단백질은 Rep78, Rep68, Rep52, 및 Rep40으로부터 선택되고, 임의로 하나 이상의 Rep 단백질은 Rep78을 포함한다. 일부 구현예에서, 하나 이상의 AAV Rep 단백질을 암호화하는 제2 뉴클레오티드 서열에 작동 가능하게 연결된 프로모터는 바이러스 프로모터, 박테리아 프로모터, 포유류 프로모터(예: 인간 또는 비인간), 조류 프로모터, 어류 프로모터, 곤충 프로모터, 및 이들의 임의의 조합으로부터 선택된다. 일부 구현예에서, 하나 이상의 AAV Rep 단백질을 암호화하는 제2 뉴클레오티드 서열에 작동가능하게 연결된 프로모터는 p19, p5, p40, SV40, EF(예를 들어, EF1α), CMV, B19p6, 및 CAG로부터 선택된다. 일부 구현예에서, 프로모터는 포장 세포에서 캡시드 단백질(들)의 발현을 유도한다. 일부 구현예에서, 하나 이상의 AAV Rep 단백질을 암호화하는 제2 뉴클레오티드 서열에 작동가능하게 연결된 프로모터는 p19 및/또는 p5로부터 선택된다.
본 발명의 핵산 분자를 포함하는 조성물 및 포장 세포, 및 본 발명의 핵산 분자로부터 암호화된 캡시드 단백질 또한 본 발명의 일부이다. 본 발명의 포장 세포에 의해 발현된 바이러스 입자가 또한 기술된다.
본 발명의 AAV 바이러스 입자를 생산하기 위한 조성물 및 포장 세포는, 일부 구현예에서, 예를 들어, 본 발명의 AAV 캡시드 단백질을 암호화하는 본 발명의 cap 유전자를 포함하는, 본 발명의 핵산 분자를 포함한다. 일부 구현예에서, 본 발명의 조성물 및/또는 포장 세포는 본 발명의 핵산 분자를 포함한다. 일부 구현예에서, cap 유전자는 다음으로 이루어진 군으로부터 선택된 뉴클레오티드 서열을 포함한다: 서열번호 1로서 제시된 뉴클레오티드 서열, 서열번호 3으로서 제시된 뉴클레오티드 서열, 서열번호 5로서 제시된 뉴클레오티드 서열, 서열번호 7로서 제시된 뉴클레오티드 서열, 서열번호 9로서 제시된 뉴클레오티드 서열, 서열번호 11로서 제시된 뉴클레오티드 서열, 서열번호 13으로서 제시된 뉴클레오티드 서열, 서열번호 15로서 제시된 뉴클레오티드 서열, 서열번호 17로서 제시된 뉴클레오티드 서열, 서열번호 19로서 제시된 뉴클레오티드 서열, 서열번호 21로서 제시된 뉴클레오티드 서열, 서열번호 23으로서 제시된 뉴클레오티드 서열, 서열번호 25로서 제시된 뉴클레오티드 서열, 서열번호 27로서 제시된 뉴클레오티드 서열, 서열번호 29로서 제시된 뉴클레오티드 서열, 서열번호 31로서 제시된 뉴클레오티드 서열, 서열번호 33으로서 제시된 뉴클레오티드 서열, 서열번호 35로서 제시된 뉴클레오티드 서열, 서열번호 52로서 제시된 뉴클레오티드 서열, 서열번호 54로서 제시된 뉴클레오티드 서열, 서열번호 56으로서 제시된 뉴클레오티드 서열, 서열번호 58로서 제시된 뉴클레오티드 서열, 서열번호 60으로서 제시된 뉴클레오티드 서열, 서열번호 62로서 제시된 뉴클레오티드 서열, 서열번호 64로서 제시된 뉴클레오티드 서열, 서열번호 66으로서 제시된 뉴클레오티드 서열, 서열번호 68로서 제시된 뉴클레오티드 서열, 서열번호 70으로서 제시된 뉴클레오티드 서열, VP2 캡시드를 암호화하는 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 52, 54, 56, 58, 60, 62, 64, 66, 68, 또는 70으로서 제시된 뉴클레오티드 서열의 임의의 일부, VP3 캡시드를 암호화하는 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 52, 54, 56, 58, 60, 62, 64, 66, 68, 또는 70으로서 제시된 뉴클레오티드 서열의 임의의 일부, 및 이들의 임의의 조합.
일부 구현예에서, 조성물 및 포장 세포는 하나 이상의 AAV Rep 단백질을 암호화하는 rep 유전자를 포함하는 핵산 분자를 추가로 포함하되, 상기 rep 유전자는 프로모터에 작동 가능하게 연결되고, 임의로 rep 유전자 및 cap 유전자는 2개의 상이한 AAV의 유전자이다. 일부 구현예에서, rep 유전자에 작동 가능하게 연결된 프로모터는 포장 세포에서 Rep 단백질(들)의 발현을 유도하며, 예를 들어, 프로모터는 p5, p19 SV40, EF, CMV, B19p6, 및 CAG로부터 선택된다. 일부 구현예에서, 하나 이상의 Rep 단백질은 Rep78, Rep68, Rep52, 및 Rep40으로부터 선택되고, 임의로 하나 이상의 Rep 단백질은 Rep78을 포함한다. 일부 구현예에서, 하나 이상의 Rep 단백질은 영장류 동물 AAV Rep 단백질이다. 일부 다른 구현예에서, 하나 이상의 Rep 단백질은 비영장류 동물 AAV Rep 단백질이다. 일부 구현예에서, 하나 이상의 Rep 단백질은 둘 다를 포함한다.
일부 구현예에서, 본 발명의 조성물 및 포장 세포는 하나 이상의 Rep 단백질에 의해 인식되는 적어도 하나의 AAV 역위 말단 반복(ITR)이 적어도 일측에 위치하는 관심 뉴클레오티드의 뉴클레오티드 서열을 포함하는 핵산 분자를 추가로 포함한다. 일부 구현예에서, 관심 뉴클레오티드의 타측에는 적어도 하나의 ITR과 동일한 AAV의 제2 ITR이 위치한다. 일부 구현예에서, 관심 뉴클레오티드의 타측에는 제2 ITR이 위치하되, 제2 ITR과 적어도 하나의 ITR은 상이한 AAV의 ITR이다.
일부 구현예에서, 본 발명의 조성물 및/또는 포장 세포는 5' 및 3' AAV 역위 말단 반복(ITR)이 측면에 위치하는 관심 뉴클레오티드(예를 들어, 이식유전자의 뉴클레오티드 서열)를 포함하는 핵산 분자를 추가로 포함하여, 관심 바이러스 입자는 5' 및 3' AAV ITR이 측면에 위치하는 관심 뉴클레오티드를 포함하는 게놈을 추가로 포함한다.
일부 구현예에서, 본 발명의 조성물 및/또는 포장 세포는 기준 캡시드 단백질을 암호화하는 뉴클레오티드 서열을 추가로 포함한다.
따라서, 일부 구현예에서, 본 발명의 조성물, 포장 세포, 및/또는 바이러스 입자는 5'에서 3' 방향으로: 5' ITR, 관심 뉴클레오티드, 및 3' ITR을 포함하는 게놈을 추가로 포함한다. 일부 구현예에서, 게놈은 관심 뉴클레오티드에 작동 가능하게 연결된 프로모터를 추가로 포함한다. 일부 구현예에서, 5' 및 3' ITR은 동일한 종의 AAV로부터 유래한다. 일부 구현예에서, 5' 및 3' ITR은 2가지 상이한 종의 AAV로부터 유래한다.
일부 구현예에서, 관심 뉴클레오티드는 리포터 유전자이다. 일부 구현예에서, 리포터 유전자는 β-갈락토시다아제, 녹색 형광 단백질(GFP), 강화된 녹색 형광 단백질(eGFP), MmGFP, 청색 형광 단백질(BFP), 강화된 청색 형광 단백질(eBFP), mPlum, mCherry, tdTomato, mStrawberry, J-Red, DsRed, mOrange, mKO, mCitrine, Venus, YPet, 황색 형광 단백질(YFP), 강화된 황색 형광 단백질(eYFP), 에머랄드(Emerald), CyPet, 홍색 형광 단백질(CFP), 진청색(Cerulean), T-Sapphire, 루시퍼라제(luciferase), 알칼리 포스파타아제(alkaline phosphatase), 또는 이들의 조합을 암호화한다.
일부 구현예에서, 관심 뉴클레오티드는 치료 단백질, 자살 유전자, 항체 또는 이의 단편, CRISPR/Cas 시스템 또는 이의 일부(들), 안티센스 올리고뉴클레오티드, 리보자임, RNAi 분자, 또는 shRNA 분자를 암호화한다.
본 발명의 AAV 바이러스 입자를 제조하는 방법이 본원에 기술되며, 상기 방법은 바이러스 입자를 생산하기에 충분한 조건 하에서 포장 세포를 배양하는 단계를 포함하되, 포장 세포는 (1) 하나 이상의 AAV Rep 단백질을 암호화하는 적어도 하나의 뉴클레오티드 서열(예를 들어, rep 유전자), 및 (2) AAV VP1 캡시드 단백질을 암호화하는 제1 뉴클레오티드 서열을 포함하고, 임의로 AAV VP2 캡시드 단백질을 암호화하는 제2 뉴클레오티드 서열, 및 비영장류 동물 AAV VP3 캡시드 단백질을 암호화하는 제3 뉴클레오티드 서열(예를 들어, 본 발명의 제1, 제2, 및 제3 뉴클레오티드 분자), 및 임의로 (3) 제2 AAV의 제1 및/또는 제2 ITR이 측면에 위치하는 관심 뉴클레오티드를 포함하며, 여기서 하나 이상의 AAV Rep 단백질은 제2 AAV의 제1 및/또는 제2 ITR의 인식 부위를 인식하고, 제3 뉴클레오티드 서열은 본 발명의 비영장류 동물 AAV VP3 캡시드 단백질을 암호화하고, 임의로 제1 뉴클레오티드 서열은 본 발명의 AAV VP1 캡시드 단백질을 암호화하고/하거나 제2 뉴클레오티드 서열은 본 발명의 AAV VP2 캡시드 단백질을 암호화한다. 일부 구현예에서, 본 발명의 단일 cap 유전자는 제1, 제2, 및 제3 뉴클레오티드 서열을 포함한다. 일부 구현예에서, 단일 포장 플라스미드는, 하나 이상의 AAV Rep 단백질을 암호화하는 적어도 하나의 뉴클레오티드, 및 비영장류 동물의 AAV VP1 캡시드 단백질, AAV VP2 캡시드 단백질, 및 AAV VP3 캡시드 단백질을 각각 암호화하는 제1, 제2, 및 제3 뉴클레오티드의 임의의 조합을 포함한다.
일부 구현예에서, 상기 방법은 본 발명의 포장 세포를 배양하는 단계를 포함한다. 일부 구현예에서, 상기 방법은 본 발명의 핵산 분자를 포함하는 본 발명의 포장 세포를 배양하는 단계를 포함하되, 포장 세포는 임의로 관심 뉴클레오티드를 포함하는 헬퍼 플라스미드 및/또는 전달 플라스미드를 추가로 포함한다.
일부 구현예에서, 상기 방법은 배양 상청액 및/또는 세포 용해물로부터 자기-상보성 아데노-연관 바이러스 입자를 단리시키는 단계를 추가로 포함한다. 일부 구현예에서, 상기 방법은 포장 세포를 용해시키고 배양 상청액 및/또는 세포 용해물로부터 단일-가닥 아데노-연관 바이러스 입자를 단리하는 단계를 추가로 포함한다. 일부 구현예는: a. 세포 찌꺼기를 제거하는 단계, b. 바이러스 입자를 함유하는 상청액을 벤조나아제 또는 DNase I 및 MgCl2로 처리하는 단계, c. 바이러스 입자를 농축하는 단계, d. 바이러스 입자를 정제하는 단계, 및 e. a~d의 임의의 조합을 추가로 포함한다.
일부 구현예에서, 모자이크 바이러스 입자는, 단백질:단백질 결합 쌍의 제1 구성원을 포함하는 VP 캡시드 단백질을 암호화하는 제1 cap 유전자 및 기준 VP 캡시드 단백질을 암호화하는 적어도 하나의 기준 cap 유전자의 혼합물을 특정 비율로 포장 세포 내로 형질감염시킴으로써 생성된다. 일부 구현예에서, 본 발명의 모자이크 바이러스 입자는 변형된 cap 유전자:기준 cap 유전자(들)의 혼합물로 생성될 수 있다. 일부 구현예에서, 변형된 cap 유전자는 변형(예를 들어, 단백질:단백질 결합 쌍의 제1 구성원)을 포함하는 AAV VP1, VP2, 및 VP3 캡시드 단백질 중 적어도 하나를 암호화하고, 기준 cap 유전자는 변형을 제외하고는 변형된 AAV VP1, VP2, 및 VP3 캡시드 단백질 중 적어도 하나에 상응하는 기준 캡시드 단백질을 암호화한다. 일부 구현예에서, 변형된 cap 유전자는 단백질:단백질 결합 쌍의 제1 구성원으로 변형된 VP1 캡시드 단백질을 암호화하고, 기준 cap 유전자는 변형이 결여된 기준 VP1 캡시드 단백질을 암호화한다. 일부 구현예에서, 변형된 cap 유전자는 단백질:단백질 결합 쌍의 제1 구성원으로 변형된 VP2 캡시드 단백질을 암호화하고, 기준 cap 유전자는 변형이 결여된 기준 VP2 캡시드 단백질을 암호화한다. 일부 구현예에서, 변형된 cap 유전자는 단백질:단백질 결합 쌍의 제1 구성원으로 변형된 VP3 캡시드 단백질을 암호화하고, 기준 cap 유전자는 변형이 결여된 기준 VP3 캡시드 단백질을 암호화한다.
일반적으로, 본원에 기술된 바와 같은 바이러스 입자는 모자이크 바이러스 캡시드를 포함하여 본원에 기술된 것과 같은 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드를 포함하며, 여기서 바이러스 캡시드는 관심 뉴클레오티드를 캡시드화한다. 일부 구현예에서, 관심 뉴클레오티드는 바이러스 프로모터, 박테리아 프로모터, 포유류 프로모터, 조류 프로모터, 어류 프로모터, 곤충 프로모터, 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된 프로모터에 의해 조절된다. 일부 구현예에서, 관심 뉴클레오티드는 비인간 프로모터에 의해 조절된다. 일부 구현예에서, 프로모터는 거대세포바이러스(CMV) 프로모터이다. 일부 구현예에서, 프로모터는 EF 프로모터, 예를 들어 EF1α 프로모터이다. 일부 구현예에서, 프로모터는 CAG 프로모터이다. 일부 구현예에서, 프로모터는 유비퀴틴 C(UbC) 프로모터이다.
일반적으로, 관심 뉴클레오티드는 검출 가능한 마커(예: 리포터) 또는 치료 폴리펩티드를 암호화할 수 있는 하나 이상의 유전자일 수 있다. 일부 구현예에서, 관심 뉴클레오티드는 리포터 유전자이다. 일부 구현예에서, 관심 뉴클레오티드는 녹색 형광 단백질, 루시퍼라아제, β-갈락토시다아제 등으로 이루어진 군으로부터 선택된 검출 가능한 마커를 암호화하는 리포터 유전자이다. 일부 구현예에서, 검출 가능한 마커는 녹색 형광 단백질이다. 다른 구현예에서, 관심 뉴클레오티드는 자살 유전자, 항체 또는 이의 단편을 암호화하는 뉴클레오티드, CRISPR/Cas 시스템 또는 이의 일부분(들)을 암호화하는 뉴클레오티드, 안티센스 RNA를 암호화하는 뉴클레오티드, siRNA 암호화 뉴클레오티드, 분비된 효소, 치료 단백질을 암호화하는 유전자 등으로 이루어진 군으로부터 선택된다. 일 구현예에서, 관심 뉴클레오티드는 다중 도메인 치료제, 예를 들어, 2개의 구별되는 기능을 제공하는 적어도 2개의 도메인을 포함하는 단백질을 암호화한다.
본원에 기술된 조성물은 일반적으로, 본원에 기술된 것과 같은 바이러스 캡시드 단백질을 포함하는, 예를 들어, (모자이크 캡시드를 포함하는) 바이러스 캡시드 단백질을 포함하는 캡시드를 포함하는 바이러스 입자를 포함하며, 여기서 캡시드는 관심 뉴클레오티드를 캡시드화한다. 일부 구현예에서, 본원에 기술된 조성물은 (1) 본원에 기술된 바이러스 캡시드 단백질을 포함하는 캡시드를 갖는 바이러스 입자, 및 (2) 약학적으로 허용 가능한 담체를 포함한다.
또한, 바이러스 캡시드 단백질, 이를 포함하는 바이러스 벡터, 조성물 등의 사용 방법이 본원에 기술된다. 일부 구현예에서, 상기 방법은 본원에 기술된 것과 같은 바이러스 캡시드 단백질을 포함하는 바이러스 입자와 표적 세포를 (시험관 내에서(예를 들어, 생체 외에서) 또는 생체 내에서, 예를 들어, 인간 내에서) 접촉시키는 단계를 포함하되, 바이러스 캡시드 또는 바이러스 입자는 표적 세포 표면에서 발현되는 단백질에 특이적으로 결합하는 표적화 리간드를 포함한다.
본원에 기술된 것과 같은 바이러스 입자는 관심 뉴클레오티드를 특정 세포에 표적화하여 도입하는 데 특히 적합한다, 이는 본원에 기술된 바이러스 캡시드 단백질(들)이, 임의로 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 동족 제2 구성원에 대한 제1 구성원을 포함하기 때문이다. 일부 구현예에서, 표적화 리간드는 단백질(제2 구성원)에 작동 가능하게 연결되고, 예를 들어, 임의로 링커를 통해서, 단백질에 융합된다. 일부 구현예에서, 표적화 리간드는 결합 모이어티(예를 들어, 자연적인 리간드, 항체, 다 특이적 결합 분자 등)일 수 있다. 일부 구현예에서, 표적화 리간드는 항체 또는 이의 일부분이다. 일부 구현예에서, 표적화 리간드는 가변 도메인을 포함하는 항체이며, 상기 가변 도메인은 표적 세포 상에 세포 표면 단백질 및 중쇄 불변 도메인과 결합한다. 일부 구현예에서, 표적화 리간드는 가변 도메인을 포함하는 항체이며, 상기 가변 도메인은 표적 세포 상에 세포 표면 단백질 및 IgG 중쇄 불변 도메인과 결합한다. 일부 구현예에서, 표적화 리간드는 가변 도메인을 포함하는 항체이며, 상기 가변 도메인은 표적 세포 상 세포 표면 단백질 및 IgG 중쇄 불변 도메인과 결합하고, IgG 중쇄 불변 도메인은, 예를 들어, 링커를 통해, 제1 구성원과 이소펩티드 공유 결합을 형성하는 단백질(단백질:단백질 결합 쌍의 제2 구성원)에 작동 가능하게 연결된다. 일부 구현예에서, 본원에 기술된 캡시드 단백질은 SpyTag에 공유 연결되고, SpyTag와 바이러스 캡시드 단백질에 작동 가능하게 연결된 SpyTag를 포함하는 제1 구성원, 및 항체 가변 도메인 및 IgG 중쇄 도메인을 포함하는 표적화 리간드에 연결되는 SpyCatcher를 포함하는 제2 구성원을 포함하되, SpyCatcher 및 IgG 중쇄 도메인은 아미노산 링커, 예를 들어, GSGESG(서열번호 49)를 통해 연결된다. 일부 구현예에서, 제2 구성원은, 인간 IgG4 중쇄의 일부를 포함하고 서열 번호 47로서 제시된 서열을 포함하되, 상기 IgG4의 일부는, 링커(서열번호 49)를 통해 SpyCatcher(서열번호 43)에 연결되고 서열번호 51로서 제시된 서열을 갖는다.
일반적으로, 표적화 리간드는 포유류(예를 들어, 인간) 진핵 세포, 예컨대 표적 세포의 표면에서 발현되는 세포 표면 분자, 예를 들어, 올리고당, 수용체, 세포 표면 마커 등에 특이적으로 결합한다.
도 1은 AAV 키메라 바이러스 입자를 생성하는 데 사용될 수 있는 본 발명의 Rep-Cap 발현 플라스미드의 도시적이고(축척에 비례하지는 않음), 비제한적이며, 예시적인 구현예를 제공한다. 영장류 AAV 서열은 빈 박스로서 도시되어 있고, 비영장류 동물 AAV 서열은 채워진 박스로 도시되어 있다. 또한, (1) 암호화된 VP1, VP2, 및 VP3 단백질을 포함하는 조립된 캡시드의 향성을 유도하기 위한 단백질:단백질 결합 쌍의 제1 구성원의 삽입(비영장류 동물 AAV의 캡시드 서열 내의 실선), 및 (2) 암호화된 VP1, VP2, 및 VP3 단백질의 검출을 위한 검출 가능한 표지의 삽입(비영장류 동물 AAV의 캡시드 서열 내의 점선)을 위한 예시적인 비제한적 위치(축척에 비례하지는 않음)가 단지 예시의 목적으로 도시된다. 도 1에 도시된 것과 같은 Rep-Cap 발현 플라스미드를 사용하여 영장류 AAV의 5' 및 3' 역위 말단 반복(ITR) 서열이 측면에 위치하는 관심 뉴클레오티드를 포함하는 AAV 바이러스 입자를 생산할 수 있다.
도 2는 키메라 영장류/비영장류 동물 AAV cap 유전자로서 조작된(도 1 참조) B1 에피토프를 인식하는 B1 항체를 사용하여, 생성된 키메라 영장류/비영장류 동물 AAV VP1 단백질, 비영장류 동물 AAV VP2 단백질, 및 비영장류 동물 AAV VP3 단백질을 분석하기 위한 웨스턴 블롯을 제공한다. 영장류 AAV는 AAV2였고, 비영장류 동물 AAV는 (A) 조류 AAV, (B) 바다 사자 AAV, 또는 (C) 턱수염 도마뱀 AAV였다. 웨스턴 블롯은 친화도 크로마토그래피를 통해 AAV 입자의 다양한 정제 단계 동안 수집된 단백질 샘플을 분석하였으며, 여기에는 투입 샘플, 관류(FT) 분획, 및 친화도 크로마토그래피 컬럼으로부터의 용리 분획이 포함된다.
도 3a는 단백질:단백질 결합 쌍의 제1 구성원에 대한 비제한적인 삽입 부위로서 K580 및 G444를 강조하는 비제한적인 예상 조류 AAV VP3 리본 구조를 제공한다. 도 3b는 SpyTag가 없거나 표시된 위치에 삽입된 SpyTag를 포함하는 키메라 AAV2/조류 AAV 바이러스 입자; 또는 표시된 위치에 삽입된 SpyTag 펩티드를 갖는 AAV2/조류 AAV 입자와 혼합된 SpyTag가 없는 AAV2/조류 AAV 입자를 포함하는 모자이크 입자에 대한 패널로 이루어진, 미정제 바이러스 제제로부터 달성된 바이러스 역가의 qPCR 정량화를 제공한다. 도 3c는 키메라 AAV2/조류 AAV VP1, VP2, 및 VP3 캡시드 단백질로서 조작된 선형 에피토프를 인식하는 B1 항체를 사용해, SpyCatcher와 융합된 항-ASGR1 "SpyC-항-ASGR1 mAb" 및 표시된 위치에 SpyTag가 삽입되었거나 결여된 키메라 AAV2/조류 AAV 바이러스 입자의 패널, 또는 표시된 위치에 삽입된 SpyTag 펩티드를 갖는 키메라 AAV2/조류 AAV 입자와 혼합되고 SpyTag가 없는 키메라 AAV2/조류 AAV 입자를 포함하는 모자이크 입자 간의 반응을 분석하는 웨스턴 블롯을 제공한다.
도 4a는 단백질:단백질 결합 쌍의 제1 구성원에 대한 비제한적인 삽입 부위로서 A565 및 G432를 강조하는 비제한적인 예상 바다 사자 AAV VP3 리본 구조를 제공한다. 도 4b는 SpyTag가 없거나 표시된 위치에 삽입된 SpyTag를 포함하는 키메라 AAV2/바다 사자 AAV 바이러스 입자; 또는 표시된 위치에 삽입된 SpyTag 펩티드를 갖는 AAV2/바다 사자 AAV 입자와 혼합된 SpyTag가 없는 AAV2/바다 사자 AAV 입자를 포함하는 모자이크 입자에 대한 패널로 이루어진, 미정제 바이러스 제제로부터 달성된 바이러스 역가의 qPCR 정량화를 제공한다. 도 4c는 키메라 AAV2/바다 사자 AAV VP1, VP2, 및 VP3 캡시드 단백질로서 조작된 선형 에피토프를 인식하는 B1 항체를 사용해, SpyCatcher와 융합된 항-HER2 항체(HERCEPTIN®) "SpyC-항-HER2 mAb" 및 표시된 위치에 SpyTag가 삽입되었거나 결여된 키메라 AAV2/바다 사자 AAV 바이러스 입자의 패널, 또는 표시된 위치에 삽입된 SpyTag 펩티드를 갖는 키메라 AAV2/바다 사자 AAV 입자와 혼합되고 SpyTag가 없는 키메라 AAV2/바다 사자 AAV 입자를 포함하는 모자이크 AAV2/바다 사자 AAV 입자 간의 반응을 분석하는 웨스턴 블롯을 제공한다.
도 5는 (A) SpyTag가 없거나 표시된 위치에 SpyTag가 삽입된 AAV2/바다 사자 AAV 바이러스 입자의 패널로 이루어진 미정제 바이러스 제제로부터 달성된 바이러스 역가의 qPCR 정량화, 및 (B) 키메라 AAV2/바다 사자 AAV VP1, VP2, 및 VP3 캡시드 단백질로서 조작된 선형 에피토프를 인식하는 B1 항체를 사용해, SpyCatcher와 융합된 항-HER2 항체(HERCEPTIN®) "SpyC-mAb", 및 SpyTag가 없거나 표시된 위치에 삽입된 SpyTag를 갖는 바다 사자 AAV 바이러스 입자의 패널 간의 반응을 분석하는 웨스턴 블롯을 제공한다.
도 6a는 단백질:단백질 결합 쌍의 제1 구성원에 대한 비제한적인 삽입 부위로서 T573 및 G436을 강조하는 비제한적인 예상 턱수염 도마뱀 AAV VP3 리본 구조를 제공한다. 도 6b는 SpyTag가 없거나 표시된 위치에 삽입된 SpyTag를 포함하는 키메라 AAV2/턱수염 도마뱀 AAV 바이러스 입자; 또는 표시된 위치에 삽입된 SpyTag 펩티드를 갖는 AAV2/턱수염 도마뱀 AAV 입자와 혼합된 SpyTag가 없는 AAV2/턱수염 도마뱀 AAV 입자를 포함하는 모자이크 입자에 대한 패널로 이루어진, 미정제 바이러스 제제로부터 달성된 바이러스 역가의 qPCR 정량화를 제공한다. 도 6c는 키메라 AAV2/턱수염 도마뱀 AAV VP1, VP2, 및 VP3 캡시드 단백질로서 조작된 선형 에피토프를 인식하는 B1 항체를 사용해, SpyCatcher와 융합된 항-HER2 항체 "SpyC-항-HER2 mAb" 및 표시된 위치에 SpyTag가 삽입되었거나 결여된 키메라 AAV2/턱수염 도마뱀 AAV 바이러스 입자의 패널, 또는 표시된 위치에 삽입된 SpyTag 펩티드를 갖는 키메라 AAV2/턱수염 도마뱀 AAV 입자와 혼합되고 SpyTag가 없는 키메라 AAV2/턱수염 도마뱀 AAV 입자를 포함하는 모자이크 AAV2/턱수염 도마뱀 AAV 입자 간의 반응을 분석하는 웨스턴 블롯을 제공한다.
도 7a는 SpyTag가 없는 키메라 AAV2/AAAV G444 입자, 키메라 AAV2/AAAV G444 링커6 SpyTag 입자, 또는 키메라 AAV2/AAAV K580 링커6 SpyTag 입자로 감염된 HER2-양성 (+) 293 hErbB2 세포에 의한 녹색 형광 단백질(GFP) 발현을 평가하는 유세포 계측으로부터 수득한 산포도를 제공한다. 키메라 AAV2/AAAV G444 링커6 SpyTag 입자 및 키메라 AAV2/AAAV K580 링커6 SpyTag 입자는 GLP1R에 대한 무관한 대조군 항체 또는 SpyTag(서열번호 42)를 통해 SpyCatcher(서열번호 43)와 융합된 항-HER2 항체(HERCEPTIN®) 중 어느 하나에 접합시켰다. 바이러스는 형질도입의 마커로서 GFP를 발현한다. 도 7b는 SpyTag가 없는 키메라 AAV2/AAAV 입자 또는 키메라 AAV2/AAAV K580 링커6 SpyTag 입자로 감염된 부모 ASGR1-음성 (-) 293 세포 또는 ASGR1-양성 (+) 293 hASGR1 세포에 의한 녹색 형광 단백질(GFP) 발현을 평가하는 유세포 계측으로부터 수득한 산포도를 제공한다. 키메라 AAV2/AAAV K580 링커6 SpyTag 입자는 SpyTag를 통해 SpyCatcher와 융합된 GLP1R에 대한 무관한 이소형 대조군 항체에 접합시키거나, SpyTag를 통해 ASGR1에 특이적으로 결합하는 SpyCatcher-융합 항체에 접합시켰다. 바이러스는 형질도입의 마커로서 GFP를 발현한다.
도 8a는 SpyTag가 없는 키메라 AAV2/바다 사자 입자 또는 키메라 AAV2/바다 사자 G432 링커6 SpyTag 입자로 감염된 HER2-양성 (+) 293 hErbB2 세포 또는 HER2-음성 (-) 293 부모 세포에 의한 녹색 형광 단백질(GFP) 발현을 평가하는 유세포 계측으로부터 수득한 산포도를 제공한다. 키메라 AAV2/바다 사자 G432 링커6 SpyTag 입자는 SpyTag를 통해 SpyCatcher와 융합된 GLP1R에 대한 무관한 이소형 대조군 항체에 접합시키거나, SpyTag를 통해 SpyCatcher(서열번호 43)와 융합된 항-HER2 항체(HERCEPTIN®)에 접합시켰다. 바이러스는 형질도입의 마커로서 GFP를 발현한다. 도 8b는 SpyTag가 없는 키메라 AAV2/바다 사자 입자로 감염되거나 키메라 AAV2/바다 사자 G432 링커6 SpyTag 입자로 감염된 ASGR1-양성 (+) 293 hASGR1 또는 ASGR1-음성 (-) 293 부모 세포에 의한 녹색 형광 단백질(GFP) 발현을 평가하는 유세포 계측으로부터 수득한 산포도를 제공한다. 키메라 AAV2/바다 사자 G432 링커6 SpyTag 입자는 SpyTag를 통해 SpyCatcher와 융합된 GLP1R에 대한 무관한 이소형 대조군 항체에 접합시키거나, SpyTag를 통해 ASGR1에 특이적으로 결합하는 SpyCatcher-융합 항체에 접합시켰다. 바이러스는 형질도입의 마커로서 GFP를 발현한다.
도 9는 키메라 AAV2/바다 사자 AAV 바이러스 입자, SpyTag가 없거나 표시된 위치에 삽입된 SpyTag를 포함하는 키AAV2/바다 사자 AAV 입자로 감염된 HER2-양성 (+) 293에 의한 녹색 형광 단백질(GFP) 발현을 평가하는 유세포 계측으로부터 수득한 산포도를 제공한다. 키메라 AAV2/바다 사자 입자에 삽입된 SpyTag는 SpyTag를 통해 SpyCatcher(서열번호 43)와 융합된 항-HER2 항체(HERCEPTIN®)에 접합시켰다. 바이러스는 형질도입의 마커로서 GFP를 발현한다.
도 10a는 SpyTag가 없는 키메라 AAV2/턱수염 도마뱀 AAV 입자, 키메라 AAV2/턱수염 도마뱀 T573 링커6 SpyTag 모자이크 입자, 또는 키메라 AAV2/턱수염 도마뱀 G436 링커6 SpyTag 모자이크 입자로 감염되었거나 "감염되지 않은" HER2-양성 (+) 293 hErbB2 세포에 의한 녹색 형광 단백질(GFP) 발현을 평가하는 유세포 계측으로부터 수득한 산포도를 제공한다. 키메라 AAV2/턱수염 도마뱀 T573 링커6 SpyTag 모자이크 입자 및 키메라 AAV2/턱수염 도마뱀 G436 링커6 SpyTag 모자이크 입자는 SpyTag를 통해 SpyCatcher(서열번호 43)에 융합된 항-HER2 항체(HERCEPTIN®)에 접합시켰다. 바이러스는 형질도입의 마커로서 GFP를 발현한다. 도 10b는 SpyTag가 없는 키메라 AAV2/턱수염 도마뱀 AAV 입자, 키메라 AAV2/턱수염 도마뱀 T573 링커6 SpyTag 모자이크 입자, 또는 키메라 AAV2/턱수염 도마뱀 T573 링커6 SpyTag 항-ASGR1 입자로 감염된 ASGR1-양성 (+) 293 hASGR1 또는 ASGR1-음성 (-) 293 부모 세포에 의한 녹색 형광 단백질(GFP) 발현을 평가하는 유세포 계측으로부터 수득한 산포도를 제공한다. AAV2/턱수염 도마뱀 T573 링커6 SpyTag 항-ASGR1 입자는 SpyTag를 통해 ASGR1에 특이적으로 결합하는 SpyCatcher-융합 항체에 접합시켰다. 바이러스는 형질도입의 마커로서 GFP를 발현한다.
도 11a는 표시된 농도의 정제된 인간IgG의 존재 하에 "AAV2 항-ASGR1" 입자, 키메라 AAV2/AAAV 항-ASGR1 입자, 또는 키메라 AAV2/바다 사자 AAV 항-ASGR1 입자로 감염시킨 후 hASGR1에 대해 양성(+)인 세포에 의한 Nanoluc 리포터 발현을 평가하는 Nanoluc 루시퍼라제 검정의 결과를 제공한다. 모든 입자는 SpyTag를 통해 ASGR1에 특이적으로 결합하는 SpyCatcher-융합 항체에 접합시켰다. 바이러스는 Nanoluc을 형질도입의 마커로서 발현한다. 도 11b는 도 11a에서의 그래프의 정량화를 제공한 것으로서, "PBS 단독" 조건으로 정규화한 것이다. 도 11c는 표시된 바이러스를 50%만큼 중화시키는 데 필요한 IgG 농도에 대한 IC50 값의 표를 제공한다.
도 12는 인산염 완충 식염수(PBS)를 정맥 내 주입하거나, 관심 반딧불이 루시퍼라제 뉴클레오티드를 보유하고 (1) SpyCatcher-항-인간 ASGR1 항체 또는 (2) SpyCatcher-항-인간 GLP1R 항체(대조군 mAb)에 의해 변형되고, SpyTag로 태그된 키메라 AAV2/AAAV 입자로 이루어진 바이러스 게놈(vg)을 동물 1마리당 5.0x1011개의 vg로 정맥 내 주입한 후 33일차에 간세포에서 인간 ASGR1을 발현하는, 유전적으로 변형된 마우스의 발광 이미지를 제공한다(A). 바이러스는 반딧불이 루시퍼라제를 형질도입의 마커로서 발현한다. 마우스를 이소플루란을 사용하여 마취시키고, 루시페린 기질을 주입하고, 10분 후에 IVIS 스펙트럼 생체 내 이미징 시스템(PerkinElmer)을 사용하여 영상화하였으며; 패널 A에 도시된 발광 이미지 내의 개별 동물의 평균 방사휘도의 정량화는 (B)에 도시되어 있고; 패널 A에 도시된 동물로부터 절제한 기관(간 및 폐)의 평균 방사휘도의 정량화는 (C)에 도시되어 있다.
도 13은 인산염 완충 식염수(PBS)를 정맥 내 주입하거나, 관심 반딧불이 루시퍼라제 뉴클레오티드를 보유하고 (1) SpyCatcher-항-인간 ASGR1 항체 또는 (2) SpyCatcher-항-인간 GLP1R 항체(대조군 mAb)에 의해 변형되고, SpyTag로 태그된 키메라 AAV2/바다 사자 AAV 입자로 이루어진 바이러스 게놈(vg)을 동물 1마리당 5.0x1011개의 vg로 정맥 내 주입한 후 33일차에 간세포에서 인간 ASGR1을 발현하는, 유전적으로 변형된 마우스의 발광 이미지를 제공한다(A). 바이러스는 반딧불이 루시퍼라제를 형질도입의 마커로서 발현한다. 마우스를 이소플루란을 사용하여 마취시키고, 루시페린 기질을 주입하고, 10분 후에 IVIS 스펙트럼 생체 내 이미징 시스템(PerkinElmer)을 사용하여 영상화하였으며; 패널 A에 도시된 발광 이미지 내의 개별 동물의 평균 방사휘도의 정량화는 (B)에 도시되어 있고; 패널 A에 도시된 동물로부터 절제한 기관(간 및 폐)의 평균 방사휘도의 정량화는 (C)에 도시되어 있다.
도 14는 SpyTag가 없는 키메라 AAV2/바다 사자 AAV 입자로 감염시킨 후 3일차에 신생아 마우스 내이 기관의 피질 외식편 배양물의 면역형광 이미지를 제공한다. 바이러스는 GFP를 형질도입의 마커(녹색)로서 발현하며, 유모 세포는 Myo7a(적색)를 검출하는 항체로 표지된다.
도 15a는 B1 에피토프의 변형을 포함하는 AAV2 또는 AAV2/바다 사자 키메라 서열의 C-말단에 있는 16개 아미노산의 정렬을 제공하며, 여기서 B1 에피토프의 변형은 상동성 바다 사자 AAV 서열로 상기 서열을 전체적으로 치환하거나 잔기 730에서만 치환하는 것이다. B1 단클론 항체 에피토프가 도시되어 있다. 도 15b는 SpyTag가 없거나, SpyTag가 없고 B1 에피토프의 변형을 포함하는 키메라 AAV2/바다 사자 AAV 입자의 정제된 바이러스 제제로부터 달성된 바이러스 역가의 qPCR 정량화를 제공하며, 여기서 B1 에피토프의 변형은 상동한 바다 사자 AAV 서열로 상기 서열을 전체적으로 치환하거나 잔기 730에서만 치환하는 것이다. 도 15c는 SYPRO Ruby를 사용해 SpyTag가 없거나, SpyTag가 없고 B1 에피토프의 변형을 포함하는 키메라 AAV2/바다 사자 AAV 입자의 VP1, VP2, 및 VP3 캡시드 단백질의 발현을 분석하는 단백질 겔 염색을 제공하며, 여기서 B1 에피토프의 변형은 상동성 바다 사자 AAV 서열로 상기 서열을 전체적으로 치환하거나 잔기 730에서만 치환하는 것이다. 도 15d는 SpyTag가 없거나, SpyTag가 없고 B1 에피토프의 변형을 포함하는 키메라 AAV2/바다 사자 AAV 입자로 다양한 다중감염도(MOI)로 감염시킨 HEK293T 세포 용해물로부터 NanoLuc 루시퍼라제 발현에 대한 발광 평가로부터 수득한 XY-플롯을 제공하며, 여기서 B1 에피토프의 변형은 상동성 바다 사자 AAV 서열로 상기 서열을 전체적으로 치환하거나 잔기 730에서만 치환하는 것이다. 바이러스는 NanoLuc 루시퍼라제를 형질도입의 마커로서 발현한다.
도 16은 인산염 완충 식염수(PBS)를 정맥내 주입하거나, 관심 반딧불이 루시퍼라제 뉴클레오티드를 보유하고 SpyTag를 갖지 않거나 SpyTag를 갖지 않고 B1 에피토프의 변형을 포함함으로써 변형된 키메라 AAV2/바다 사자 AAV 입자로 이루어진 바이러스 게놈(vg)을 동물 1마리당 5.0x1011개의 vg로 정맥내 주입한 후 34일차에 마우스로부터 절제한 기관의 평균 방사휘도의 정량화를 제공하며, 여기서 B1의 변형은 상동성 바다 사자 AAV 서열로 상기 서열을 전체적으로 치환하거나 잔기 730에서만 치환하는 것이다. 바이러스는 반딧불이 루시퍼라제를 형질도입의 마커로서 발현한다. 마우스를 이소플루란을 사용하여 마취시키고, 루시페린 기재를 주입하고, IVIS 스펙트럼을 생체 내 이미징 시스템(PerkinElmer)을 사용하여 10분 후에 촬영하였다.
도 17은 AAV 키메라 바이러스 입자를 생성하는 데 사용될 수 있는 본 발명의 Rep-Cap 발현 플라스미드의 도시적이고(축척에 비례하지는 않음), 비제한적이며, 예시적인 구현예를 제공한다. 영장류 AAV 서열은 빈 박스로서 도시되어 있고, 바다 사자 AAV 서열은 채워진 박스로 표시되어 있다. 또한, (1) 영장류 및 바다 사자 캡시드 서열들 간의 대안적인 계면 위치(영장류 동물 AAV의 캡시드 서열 내의 검은 점선) 및 (2) 암호화된 VP1, VP2, 및 VP3 단백질의 검출을 이한 검출 가능한 표지(비영장류 동물 AAV의 캡시드 서열 내의 점선)에 대한 예시적이고 비제한적인 위치(축척에 비례하지는 않음)가 단지 예시의 목적으로 도시된다. 도 17에 도시된 바와 같은 Rep-Cap 발현 플라스미드를 사용하여 영장류 AAV의 5' 및 3' 역위 말단 반복(ITR) 서열이 측면에 위치하는 관심 뉴클레오티드를 포함하는 AAV 바이러스 입자를 생산할 수 있다.
도 18a는 SpyTag가 없고 AAV2와 바다 사자 캡시드 서열들 간의 대안적인 계면 위치를 포함하는 키메라 AAV2/바다 사자 AAV 입자의 정제된 바이러스 제제로부터 달성된 바이러스 역가의 qPCR 정량화를 제공한다. 제제는 세포 용해물(v2 - v4) 또는 세포 용해물과 배지(v5) 둘 다로부터 정제하였다. 도 18b도 18c는 SpyTag가 없고 AAV2와 바다 사자 캡시드 서열들 간의 교반하는 계면 위치를 포함하는 AAV2/바다 사자 AAV 입자로 다양한 감염다중도(MOI)로 감염시킨 HEK293T 세포 용해물로부터 NanoLuc 루시퍼라제 발현에 대한 발광 평가로부터 수득한 XY-플롯을 제공한다. AAV2/바다 사자 AAV SpyTag 없음에 대한 과거 데이터세트를 기준으로서 사용한다. 바이러스는 NanoLuc 루시퍼라제를 형질도입의 마커로서 발현한다. 도 18d는 인산염 완충 식염수(PBS)를 정맥내 주입하거나, 관심 반딧불이 루시퍼라제 뉴클레오티드를 보유하고 SpyTag를 갖지 않거나 SpyTag를 갖지 않고 B1 에피토프를 AAV2와 바다 사자 캡시드 서열들 간에 교반하는 계면 위치가 있거나 없는 상동성 바다 사자 AAV 서열로 전체적으로 치환함으로써 변형된 키메라 AAV2/바다 사자 AAV 입자로 이루어진 바이러스 게놈(vg)을 동물 1마리당 5.0x1011개의 vg로 정맥내 주입한 후 56일차에 마우스로부터 절제한 기관의 평균 방사휘도의 정량화를 제공한다. 바이러스는 반딧불이 루시퍼라제를 형질도입의 마커로서 발현한다. 마우스를 이소플루란을 사용하여 마취시키고, 루시페린 기재를 주입하고, IVIS 스펙트럼을 생체 내 이미징 시스템(PerkinElmer)을 사용하여 10분 후에 촬영하였다.
AAV 유전자 요법을 통해 특이적 세포를 표적화하기 위한 재조합 접근법이 최근 몇 년 동안 개선을 나타냈지만, 기존 항체에 의한 검출 및/또는 중화를 회피하는 AAV를 개발하는데 사용되는, 초기에 개발된 것으로 추정되는 현재의 재조합 접근법은 여전히 문제가 있다. (1) 영장류 세포를 감염시키는 비영장류 동물 AAV 또는 원격 AAV의 자연 능력, (2) 인간에서, 비영장류 동물 AAV 캡시드 단백질에 대한 NAb의 결여, 및 원하거나 필요한 경우 (3) 유도식 유전자 요법에 유용한 AAV 바이러스 입자를 생산하기 위해 AAV 캡시드 단백질로 조작된 단백질:단백질 결합 쌍의 제1 구성원의 적응성, 예를 들어 특이적 관심 세포에 대한 관심 뉴클레오티드의 도입을 활용하는 접근법이 본원에 기술된다. 원하는 기능에 따라 활용되는 적어도 AAV cap 유전자를 포함하는 뉴클레오티드 분자가 본원에 기술된다. 본 발명의 뉴클레오티드 분자는 (기존 NAb에 의해 쉽게 인식되지 않는 바이러스 캡시드의 생산을 위한) 비영장류 동물 및/또는 원격 AAV의 cap 유전자 또는 이의 일부를 포함한다. 비영장류 AAV의 cap 유전자 또는 이의 일부는 단백질:단백질 결합 쌍의 제1 구성원으로 변형될 수 있으며, 표적화 리간드를 포함하는 제2 구성원은 제1 구성원에 결합하여, 생성된 AAV 바이러스 입자의 향성을 유도할 수 있다.
영장류 세포를 감염시킬 수 없는 비영장류 동물 AAV 또는 원격 AAV의 경우, cap 유전자는 영장류 AAV VP1 캡시드 단백질의 적어도 포스포리파아제 A2(PLA2) 도메인 및 비인간 영장류 AAV 또는 원격 AAV의 VP3 캡시드 단백질의 적어도 일부를 암호화하는 키메라 cap 유전자로서 설계될 수 있다. PLA2 도메인은 VP1 캡시드 단백질(보다 구체적으로 VP1 캡시드의 VP1-고유(VP1-u) 영역)에 의해 운반되며, AAV 감염 도중에 후기 엔도솜/리소좀으로부터 핵으로 바이러스 게놈의 전달을 매개함으로써 복제를 개시하는 데 중요한 것으로 여겨진다(Zadori 등의 문헌[2001, Dev Cell, 1(2):291-302]). VP3 캡시드 단백질은 AAV 바이러스 입자의 주요 표면 캡시드 단백질이며, 이와 같이, 비영장류 동물 AAV 또는 원격 AAV의 VP3 캡시드 단백질의 적어도 일부를 포함하는 바이러스 캡시드는 영장류 AAV로 감염시키는 과정 동안 영장류로부터 단리된 AAV 혈청형에 대해 상승된 NAb에 의해 인식될 가능성이 낮다.
영장류 AAV의 rep 유전자 및 키메라 cap 유전자를 포함하는 핵산 분자의 비제한적인 도시가 도 1에 제공된다. 영장류 세포를 감염시킬 수 있는 비영장류 인간 AAV 및 원격 AAV의 경우, 영장류 AAV의 rep 유전자는 본원에 기술된 것과 같은 키메라 cap 유전자 또는 비영장류 AAV의 cap 유전자에 작동 가능하게 연결될 수 있다. 본원의 실시예는, 이러한 핵산 분자는, 관심 뉴클레오티드를 보유한 헬퍼 플라스미드 및 영장류 AAV 게놈에 의해 포장 세포주에서 발현될 때, 영장류 AAV 게놈을 생체 내에서 세포를 감염시킬 수 있는 바이러스 입자로 각각 복제하고 캡시드화하도록 작용하는 적절한 복제 단백질 및 캡시드 단백질을 암호화할 수 있음을 보여준다. 또한, 실시예는, 이러한 AAV 바이러스 입자의 향성이 단백질:단백질 결합 쌍의 제1 및 제2 구성원의 사용을 통해 쉽게 조정되고, 또한 단백질:단백질 결합 쌍의 제1 및 제2 구성원의 삽입이 영장류 AAV 감염에 대해 상승된 NAb에 의해 인식될 가능성을 증가시키지 않음을 보여준다. 이와 같이, 유전적으로 변형된 바이러스 입자, 이를 포함하는 조성물, 및 이를 제조 및 사용하는 방법을 본원에서 제공한다.
달리 정의되지 않는 한, 본원에 사용된 모든 기술적 및 과학적 용어는 본 발명이 속한 당해 기술분야의 통상의 기술을 가진 자에 의해 널리 이해되는 것과 동일한 의미를 가진다.
단수 형태("a", "an", 및 "the")는 문맥상 명시적으로 달리 언급하지 않는 한 복수의 참조를 포함한다. 따라서, 예를 들어, "방법"에 대한 참조는 하나 이상의 방법 및/또는 본 발명에서 설명 및/또는 본 명세서를 읽으면 당업자에게 명백해질 종류의 단계를 포함한다. 
"동일성 백분율(%)" 등은 단백질의 전장 또는 이의 일부에 걸쳐 아미노산 또는 뉴클레오티드 서열에 대해 쉽게 결정될 수 있다. "일부"는 각각 적어도 약 5개 아미노산 또는 24개 뉴클레오티드의 길이일 수 있고, 각각 최대 약 700개 아미노산 또는 2100개 뉴클레오티드의 길이일 수 있다. 일반적으로, 2개의 상이한 아데노-연관 바이러스 간의 "동일성", "상동성" 또는 "유사성"을 지칭할 때, "동일성", "상동성" 또는 "유사성"은 "정렬된" 서열을 참조하여 결정된다. "정렬된" 서열 또는 "정렬"은 다수의 핵산 서열 또는 단백질(아미노산) 서열을 지칭하며, 종종 기준 서열과 비교하여 누락되거나 추가된 염기 또는 아미노산에 대한 보정을 함유한다.
정렬은 공개적으로 또는 상업적으로 이용 가능한 다양한 다중 서열 정렬 프로그램 중 어느 하나를 사용하여 수행될 수 있다. "Clustal X", "MAP", "PIMA", "MSA", "BLOCKMAKER", "MEME", 및 "Match-Box" 프로그램과 같은 서열 정렬 프로그램을 아미노산 서열에 대해 이용할 수 있다. 일반적으로, 이들 프로그램 중 어느 하나가 기본 설정으로 사용되지만, 당업자는 필요에 따라 이러한 설정을 변경할 수 있다. 대안적으로, 당업자는 참조된 알고리즘 및 프로그램에 의해 제공되는 것과 적어도 동일성 또는 정렬 수준이 같은 다른 알고리즘 또는 컴퓨터 프로그램을 이용할 수 있다. 예를 들어, J. D. Thomson 등의 문헌[Nucl. Acids. Res., "A comprehensive comparison of multiple sequence alignments", 27(13):2682-2690 (1999)]을 참조한다.
핵산 서열에 대해 다수의 서열 정렬 프로그램을 이용할 수도 있다. 이러한 프로그램의 예는 "Clustal W", "CAP Sequence Assembly", "MAP", 및 "MEME"를 포함하며, 이들은 인터넷 상의 웹 서버를 통해 액세스할 수 있다. 이러한 프로그램에 대한 다른 공급원은 당업자에게 알려져 있다. 대안적으로, 벡터 NTI 유틸리티(Vector NTI utilities)도 사용된다. 전술한 프로그램에 포함된 것들을 포함하여, 뉴클레오티드 서열 동일성을 측정하는 데 사용될 수 있는 당업계에 공지된 다수의 알고리즘이 또한 존재한다. 또 다른 예로서, GCG 버전 6.1 내의 프로그램인 FASTA??을 사용하여 폴리뉴클레오티드 서열을 비교할 수 있다. FASTA??는 쿼리 및 검색 서열 사이의 가장 중첩된 영역의 정렬 및 서열 동일성 백분율을 제공한다. 예를 들어, 본원에 참조로서 통합된 GCG 버전 6.1에 제공된 바와 같이, 핵산 서열들 간의 서열 동일성 백분율은 FASTA??를 이의 기본 파라미터(6의 단어 크기, 및 스코어링 매트릭스를 위한 NOPAM 인자)들과 함께 사용해 결정할 수 있다.
"상당한 동일성"은 적어도 90%, 예를 들어 적어도 93%, 예를 들어 적어도 95%, 예를 들어 적어도 96%, 예를 들어 적어도 97%, 예를 들어 적어도 98%, 예를 들어 적어도 99%, 또는 예를 들어 적어도 100% 동일한 아미노산 또는 핵산 서열 정렬을 포함한다.
용어 "키메라"는 적어도 2개의 상이한 유기체, 예를 들어 적어도 제1 및 제2 AAV의 유전자 또는 폴리펩티드의 일부에서 유래된 핵산 서열 또는 아미노산 서열을 각각 포함하는 기능적 유전자 또는 폴리펩티드를 포함하며, 여기서 적어도 제1 및 제2 부분은 작동 가능하게 연결된다. 키메라로서 명시되지 않는 한, 뉴클레오티드 서열, 유전자, 폴리펩티드, 및 아미노산은, 예를 들어, 단일 유기체, 예를 들어, 단일 AAV의 핵산 서열 또는 아미노산 서열만을 포함하는 비키메라로서 간주된다.
용어 "항체(antibody)"는 4개의 폴리펩티드 사슬, 즉 이황화 결합에 의해 상호 연결된 2개의 중(H)쇄 및 2개의 경(L)쇄를 포함하는 면역글로불린 분자를 포함한다. 각각의 중쇄는 중쇄 가변 도메인(V-H) 및 중쇄 불변 영역(CH).)을 포함한다. 중쇄 불변 영역은 적어도 3개의 도메인 CH1, CH2, CH3 및 임의로 CH4.를 포함한다. 각각의 경쇄는 경쇄 가변 도메인(CH) 및 경쇄 불변 영역(CL).)을 포함한다. 중쇄 및 경쇄 가변 도메인은 프레임워크 영역(FR)으로 불리는 보다 보존적인 영역이 사이 사이에 배치되는 상보성 결정 영역(CDR)으로 불리는 초가변성 영역으로 다시 나눠질 수 있다. 각각의 중쇄 및 경쇄 가변 도메인은 아미노 말단으로부터 카르복시 말단 방향으로 다음의 순서로 배열된 3개의 CDR과 4개의 FR을 포함한다: FR1, CDR1, FR2, CDR2, FR3, CDR3, FR4 (중쇄 CDR은 HCDR1, HCDR2 및 HCDR3으로 약칭될 수 있고; 경쇄 CDR은 LCDR1, LCDR2 및 LCDR3으로 약칭될 수 있음). 전형적인 사량체 항체 구조는 2개의 동일한 항원 결합 도메인을 포함하며, 이들 각각은 VH 및 VL 도메인의 결합에 의해 형성되고, 이들 각각은 CH 및 CL 도메인 각각과 함께 항체 Fv 영역을 형성한다. 단일 도메인 항체는 단일 항원 결합 도메인, 예를 들어, VH 또는 VL을 포함한다. 항체의 항원 결합 도메인, 예를 들어, 항원의 특이적 결합 쌍의 제1 구성원을 인식하고 이에 결합하는 항체의 부분은 "파라토프"로도 지칭된다. 이는 항체의 Fv 영역의 작은 영역(5 내지 10개의 아미노산)으로서, 단편 항원 결합의 일부(Fab 영역)이며, 항체의 중쇄 및/또는 경쇄의 일부를 함유할 수 있다. 파라토프는, 파라토프가 높은 친화도로 특이적 결합 쌍의 제1 구성원에 결합할 때 특이적 결합 쌍의 제1 구성원에 특이적으로 결합한다. 용어 "고 친화도" 항체는, 특이적 결합 쌍의 표적 제1 구성원에 대해 약 10-9 M 이하(예를 들어, 약 1 x 10-9 M, 1 x 10-10 M, 1 x 10-11 M, 또는 약 1 x 10-12 M)의 KD를 갖는 항체를 지칭한다. 일 구현예에서, KD는 표면 플라스몬 공명, 예를 들어, BIACORE??에 의해 측정되고; 다른 구현예에서, KD는 ELISA에 의해 측정된다.
문구 "상보성 결정 영역", 또는 용어 "CDR"은 보통 (즉, 야생형 동물에서) 면역글로불린 분자 (예, 항체 또는 T 세포 수용체)의 경쇄 또는 중쇄의 가변 영역의 2개의 프레임워크 영역 사이에 나타나는, 유기체의 면역글로불린 유전자의 핵산 서열에 의해 암호화된 아미노산 서열을 포함한다. CDR은 예를 들어, 생식계열 서열 또는 재배열되거나 재배열되지 않은 서열에 의해 암호화될 수 있으며, 예를 들어, 미처리 B 세포 또는 성숙한 B 세포 또는 T 세포에 의해 암호화될 수 있다. CDR은 체세포 돌연변이 (예를 들어, 동물의 생식선에서 암호화되는 서열에 따라 달라짐), 인간화, 및/또는 아미노산 치환, 부가, 또는 결실로 변형될 수 있다.  일부 경우에(예: CDR3의 경우), CDR은, (예컨대, 재배열되지 않은 핵산 서열에서는) 서로 인접하지 않지만 B 세포 핵산 서열 내에서는 인접하는 2개 이상의 서열(예: 생식계열 서열)에 의해, 예를 들어 서열의 접합 또는 연결(예를 들어, 중쇄 CDR3을 형성하기 위한 V-D-J 재조합)의 결과로서 암호화될 수 있다.
"경쇄(light chain)"라는 문구는 임의의 유기체의 면역글로불린 경쇄 서열을 포함하며, 달리 명시되지 않는 한 인간 κ 및 λ 경쇄 및 VpreB, 및 대용(surrogate) 경쇄를 포함한다. 경쇄 가변 (VL) 도메인은 달리 명시되지 않은 한, 일반적으로 3개의 경쇄 CDR 및 4개의 프레임워크(FR) 영역을 포함한다. 일반적으로, 전장 경쇄는 아미노 말단에서 카르복실 말단까지, FR1-CDR1-FR2-CDR2-FR3-CDR3-FR4를 포함하는 가변 도메인, 및 경쇄 불변 영역을 포함한다. 경쇄 가변 도메인은, 생식선에 존재하는 V 및 J 분절의 레파토리로부터 유래된 VL 및 JL 분절을 일반적으로 포함하는 경쇄 가변 영역 유전자 서열에 의해 암호화된다. 다양한 유기체에 대한 V 및 J 경쇄 분절에 대한 서열, 위치 및 명명법은 IMGT 데이터베이스인 www.imgt.org에서 찾을 수 있다. 경쇄는 예를 들어 이들이 나타나는 특이적 결합 쌍의 제1 구성원 결합 단백질에 의해 선택적으로 결합된 특이적 결합 쌍의 제1 또는 제2의 제1 구성원 중 어느 하나에 선택적으로 결합하지 않는 것을 포함한다. 경쇄는 또한 이들이 나타나는 특이적 결합 쌍의 제1 구성원 결합 단백질에 의해 선택적으로 결합된 하나 이상의 특이적 결합 쌍의 제1 구성원에 결합하고 인식하는 것들을 포함하거나, 중쇄 또는 또 다른 경쇄가 상기 하나 이상의 특이적 결합 쌍의 제1 구성원에 결합하고 인식하는 것을 돕는다. 공통 경쇄 또는 범용 경쇄는 인간 Vκ1-39Jκ 유전자 또는 인간 Vκ3-20Jκ 유전자로부터 유래된 것들을 포함하고, 이들의 체세포 돌연변이된(예를 들어, 친화도 성숙된) 버전을 포함한다. 예시적인 인간 VL 분절은 인간 Vκ1-39 유전자 분절, 인간 Vκ3-20 유전자 분절, 인간 Vλ1-40 유전자 분절, 인간 Vλ1-44 유전자 분절, 인간 Vλ2-8 유전자 분절, 인간 Vλ2-14 유전자 분절, 및 인간 Vλ3-21개 유전자 분절을 포함하고, 이들의 체세포 돌연변이된 (예를 들어, 친화도 성숙된) 버전을 포함한다. 하나의 유기체(예를 들어, 인간 또는 설치류, 예컨대 랫트 또는 마우스; 또는 조류, 예컨대 닭) 유래의 가변 도메인 및 동일하거나 상이한 유기체(예를 들어, 인간 또는 설치류, 예를 들어, 랫트 또는 마우스; 예컨대 닭) 유래의 불변 영역을 포함하는 경쇄를 제조할 수 있다.
용어 "약(about)" 또는 "대략(approximately)"은 통계학적으로 유의미한 값의 범위 내에 있는 것을 포함한다. 이러한 범위는 주어진 값 또는 범위의 크기 몇 배 이내, 바람직하게는 50% 이내, 더 바람직하게는 20% 이내, 더욱 더 바람직하게는 10% 이내, 및 보다 더 바람직하게는 5% 이내일 수 있다. 용어 "약" 또는 "대략"에 의해 포함된 허용가능한 편차는 연구 중인 특정 시스템에 따라 달라지며, 당업자에 의해 쉽게 이해될 수 있다.
"중쇄" 또는 "면역글로불린 중쇄"라는 문구는 임의의 유기체의 면역글로불린 중쇄 불변 영역 서열을 포함하여, 면역글로불린 중쇄 서열을 포함한다. 중쇄 가변 도메인은 달리 명시되지 않는 한, 3개의 중쇄 CDR 및 4개의 FR 영역을 포함한다. 중쇄의 단편에는 CDR, CDR 및 FR 및 이들의 조합이 포함된다. 일반적인 중쇄는, 가변 도메인에 이어서 (N-말단에서 C-말단 방향으로) CH1 도메인, 힌지, CH2 도메인 및 CH3 도메인을 갖는다. 중쇄의 기능성 단편은 특이적 결합 쌍의 제1 구성원을 특이적으로 인식할 수 있고 (예, 마이크로몰, 나노몰 또는 피코몰 범위의 KD로 특이적 결합 쌍의 제1 구성원을 인식함), 세포로부터 발현 및 분비가 가능하고, 적어도 하나의 CDR을 포함하는, 단편을 포함한다. 중쇄 가변 도메인은, 생식선에 존재하는 VH, DH, 및 JH 분절의 레파토리로부터 유래된 VH, DH, 및 JH 분절을 일반적으로 포함하는 가변 영역 유전자 서열에 의해 암호화된다. 다양한 유기체에 대한 V, D 및 J 중쇄 분절에 대한 서열, 위치 및 명명법은 IMGT 데이터베이스에서 찾을 수 있으며, 인터넷을 통해 "www.imgt.org" URL에 접속할 수 있다.
용어 "중쇄만의 항체(heavy chain only antibody)", "중쇄만의 항원 결합 단백질(heavy chain only antigen binding protein)", "단일 도메인 항원 결합 단백질(single domain antigen binding protein)", "단일 도메인 결합 단백질(single domain binding protein)" 등은 중쇄 불변 영역에 작동 가능하게 연결된 가변 도메인을 포함하는 면역글로불린-유사 사슬을 포함하는 단량체 또는 동종이량체 면역글로불린 분자를 지칭한다(상기 가변 도메인은 중쇄 불변 영역에 일반적으로 기능성 CH1 도메인이 없기 때문에 경쇄와 결합할 수 없음). 따라서, 용어 "중쇄만의 항체", "중쇄만의 항원 결합 단백질", "단일 도메인 항원 결합 단백질", "단일 도메인 결합 단백질" 등은 기능성 CH1이 없는 중쇄 불변 영역에 작동가능하게 연결된 가변 도메인을 포함하는 면역글로불린 유사 사슬 중 하나를 포함하는 단량체 단일 도메인 항원 결합 단백질, 또는 (ii) 기능성 CH1이 없는 중쇄 불변 영역에 작동 가능하게 연결된 가변 도메인을 각각 포함하는 2개의 면역글로불린 유사 사슬을 포함하는 동종이량체 단일 도메인 항원 결합 단백질 모두를 포함한다. 다양한 양태에서, 동종이량체 단일 도메인 항원 결합 단백질은 2개의 동일한 면역글로불린 유사 사슬을 포함하며, 이들 각각은 기능성 CH1이 없는 동일한 중쇄 불변 영역에 작동 가능하게 연결된 동일한 가변 도메인을 포함한다. 추가적으로, 단일 도메인 항원 결합 단백질의 각 면역글로불린 유사 사슬은, 중쇄 가변 영역 유전자 분절(예: VH, DH, JH), 경쇄 유전자 분절 (예를 들어, VL, JL), 또는 이들의 조합으로부터 유래될 수 있고 중쇄 불변 영역 유전자, 예를 들어, IgG, IgA, IgE, IgD, 또는 이들의 조합의 CH1 암호화 서열(및 임의로는 힌지 영역)에서 결실 또는 불활성화 돌연변이를 포함하는 중쇄 불변 영역(CH) 유전자 서열에 연결될 수 있는 가변 도메인을 포함한다. 중쇄 유전자 분절으로부터 유래된 가변 도메인을 포함하는 단일 도메인 항원 결합 단백질은 "VH- -단일 도메인 항체" 또는 "VH-단일 도메인 항원 결합 단백질"로서 지칭될 수 있으며, 이에 관해서는, 예를 들어, 미국 특허 제8,754,287호; 미국 특허 공개 제20140289876호; 제20150197553호; 제20150197554호; 제20150197555호; 제20150196015호; 제20150197556호 및 제20150197557호를 참조하고, 그 전체는 참조로서 본원에 통합된다. 경쇄 유전자 분절으로부터 유래된 가변 도메인을 포함하는 단일 도메인 항원 결합 단백질은 "VL-단일 도메인 항원 결합 단백질"로서 지칭될 수 있으며, 이에 관해서는, 예를 들어, 미국 특허 공개 제20150289489호를 참조하고, 그 전체는 참조로서 본원에 통합된다.
"경쇄(light chain)"라는 문구는 임의의 유기체의 면역글로불린 경쇄 서열을 포함하며, 달리 명시되지 않는 한 인간 카파(κ) 및 람다(λ) 경쇄 및 VpreB, 및 대용 경쇄를 포함한다. 경쇄 가변 (VL) 도메인은 달리 명시되지 않은 한, 일반적으로 3개의 경쇄 CDR 및 4개의 프레임워크(FR) 영역을 포함한다. 일반적으로, 전장 경쇄는 아미노 말단에서 카르복실 말단까지, FR1-CDR1-FR2-CDR2-FR3-CDR3-FR4를 포함하는 가변 도메인, 및 경쇄 불변 영역 아미노산 서열을 포함한다. 경쇄 가변 도메인은, 생식선에 존재하는 V 및 J 유전자 분절의 레파토리로부터 유래된 경쇄 VL 및 JL 유전자 분절을 일반적으로 포함하는, 경쇄 가변 영역 뉴클레오티드 서열에 의해 암호화된다. 다양한 유기체에 대한 V 및 J 유전자 분절에 대한 서열, 위치 및 명명법은 IMGT 데이터베이스에서 찾을 수 있으며, 인터넷을 통해 "www.imgt.org" URL에 접속할 수 있다. 경쇄는, 예를 들어, 이들이 나타나는 특이적 결합 쌍의 제1 구성원 결합 단백질에 의해 선택적으로 결합된 특이적 결합 쌍의 제1 또는 제2의 제1 구성원 중 어느 하나에 선택적으로 결합하지 않는 것을 포함한다. 경쇄는 또한 이들이 나타나는 특이적 결합 쌍의 제1 구성원 결합 단백질에 의해 선택적으로 결합된 하나 이상의 특이적 결합 쌍의 제1 구성원에 결합하고 인식하는 것들을 포함하거나, 중쇄가 상기 하나 이상의 특이적 결합 쌍의 제1 구성원에 결합하고 인식하는 것을 돕는다. 경쇄는 또한 이들이 나타나는 특이적 결합 쌍의 제1 구성원 결합 단백질에 의해 선택적으로 결합된 하나 이상의 특이적 결합 쌍의 제1 구성원에 결합하고 인식하는 것들을 포함하거나, 중쇄가 상기 하나 이상의 특이적 결합 쌍의 제1 구성원에 결합하고 인식하는 것을 돕는다. 공통 경쇄 또는 범용 경쇄는 인간 Vκ1-39Jκ5 유전자 또는 인간 Vκ3-20Jκ1 유전자로부터 유래된 것들을 포함하고, 이들의 체세포 돌연변이된(예를 들어, 친화도 성숙된) 버전을 포함한다.
본원에 사용된 바와 같이, "작동 가능하게 연결된(operably linked)"이라는 어구는, 서로 직접적으로 또는 간접적으로 상호 작용하거나, 달리 서로 협력하여 생물학적 이벤트에 참여하는 구성 요소 또는 성분의 (예를 들어, 3차원 공간에서의) 물리적 병치를 포함하며, 이러한 이러한 상호 작용 및/또는 협력은 병치에 의해 달성하거나 허용된다. 예를 하나 들자면, 핵산 내의 조절 서열(예를 들어, 발현 조절 서열)은, 이 서열의 존재 또는 부재가 코딩 서열의 발현 및/또는 활성에 영향을 미치도록 코딩 서열에 대해 상대적으로 위치되는 경우, 코딩 서열에 "작동 가능하게 연결된" 것으로 일컬어진다. 많은 구현예에서, "작동 가능한 연결"은 관련 구성 요소 또는 성분들 서로 간의 공유 연결을 포함한다. 당업자는, 일부 구현예에서, 효과적인 작동 가능한 연결을 달성하는 데 공유 연결이 필요한 것은 아니라는 것을 쉽게 이해할 것이다. 예를 들어, 일부 구현예에서, 조절 대상 코딩 서열에 작동 가능하게 연결되는 핵산 조절 서열은 관심 뉴클레오티드와 인접한다. 대안적으로 또는 추가적으로, 일부 구현예에서, 하나 이상의 이러한 조절 서열은 트랜스에서 작용하거나 관심 코딩 서열의 조절 거리에서 작용한다. 일부 구현예에서, 본원에 사용된 바와 같은 용어 "발현 조절 서열(expression control sequence)"은 발현 조절 서열이 연결되는 코딩 서열의 발현 및 프로세싱을 수행하는 데 필요하고/하거나 충분한 폴리뉴클레오티드 서열을 지칭한다. 일부 구현예에서, 발현 조절 서열은 다음이거나 이를 포함할 수 있다: 적절한 전사 개시 서열, 종결 서열, 프로모터 서열 및 인핸서 서열; 스플라이싱 및 폴리아데닐화 신호와 같은 효율적인 RNA 프로세싱 신호; 세포질 mRNA를 안정화하는 서열; 번역 효율을 증진하는 서열(예: Kozak 공통 서열); 단백질 안정성을 증진하는 서열; 및/또는, 일부 구현예에서는, 단백질 분비를 증진하는 서열. 일부 구현예에서, 하나 이상의 조절 서열은 특정 숙주 세포 또는 유기체에서 또는 조절 서열의 유형에서 우선적으로 또는 배타적으로 활성이다. 예를 하나 들자면, 원핵생물에서, 조절 서열은 일반적으로 프로모터, 리보솜 결합 부위, 및 전사 종결 서열을 포함하고; 진핵생물의 경우, 많은 구현예에서, 조절 서열은 일반적으로 프로모터, 인핸서, 및/또는 전사 종결 서열을 포함한다. 당업자는, 많은 구현예에서, "조절 서열"이란 용어가 발현과 프로세싱에 필수적으로 존재해야 하는 성분을 지칭하고, 일부 구현예에서는, 존재하는 것이 발현에 유리한 성분(예를 들어, 리더 서열, 표적화 서열, 및/또는 융합 파트너 서열을 포함함)을 포함한다는 것을 맥락 상 이해할 것이다.
"재표적화(retargeting)" 또는 "재유도(redirecting)"는, 야생형 입자가 조직 내의 여러 개의 세포 및/또는 유기체 내의 여러 개의 기관를 표적화하는 시나리오를 포함할 수 있으며, 조직 또는 기관의 일반적인 표적화는 이종 아미노산의 삽입에 의해 감소 내지는 제거되며, 조직 내의 보다 특이적인 세포 또는 유기체 내의 특이적인 기관에 대한 재표적화는 특이적 세포에 의해 발현되는 마커에 결합하는 표적화 리간드로 (예를 들어, 표적화 리간드를 통해) 달성된다. 이러한 재표적화 또는 재유도는, 야생형 입자가 조직을 표적화하는 시나리오를 포함할 수도 있으며, 조직의 표적화는 이종 아미노산의 삽입에 의해 감소 내지는 제거되고, 완전히 다른 조직에 대한 재표적화는 표적화 리간드로 달성된다.
"특이적 결합 쌍", "단백질:단백질 결합 쌍" 등은, 결합 형성을 가능하게 하거나 촉진하는 조건 하에 상호작용하여 결합(예를 들어, 제1 구성원 에피토프와 에피토프를 인식하는 항체의 제2 구성원 항원 결합 부분 간의 비공유 결합) 또는 공유 이소펩티드 결합을 형성하는 2개의 단백질(예를 들어, 제1 구성원(예: 제1 폴리펩티드) 및 제2 동족 구성원(예: 제2 폴리펩티드))을 포함한다. 일부 구현예에서, 용어 "동족(cognate)"은 함께 기능하는 성분을 지칭한다. 에피토프 및 이에 대한 동족 항체, 특히 검출 가능한 표지(예를 들어, c-myc)로서 작용할 수도 있는 에피토프는 당업계에 잘 알려져 있다. 상호작용하여 공유 이소펩티드 결합을 형성할 수 있는 특이적 결합 쌍은 Veggiani 등의 문헌[(2014) Trends Biotechnol. 32:506]에서 검토되고, SpyTag:SpyCatcher, SpyTag002:SpyCatcher002; SpyTag:KTag; isopeptag:pilin C, SnoopTag:SnoopCatcher 등과 같은 단백질:단백질 결합 쌍을 포함한다. 일반적으로, 단백질:단백질 결합 쌍의 제1 구성원은, 일반적으로 30개 미만의 아미노산 길이이고, 제2 동족 단백질과 공유 이소펩티드 결합을 형성하는 단백질:단백질 결합 쌍의 구성원을 지칭하며, 여기서 제2 동족 단백질은 일반적으로 크지만, SpyTag:KTag sytem에서와 같이 30개 미만의 아미노산 길이일 수도 있다.
용어 "이소펩티드 결합"은 카르복실 또는 카르복사미드기 및 아미노기 사이의 아미드 결합을 지칭하며, 이들 중 적어도 하나는 단백질 주사슬로부터 유래되지 않거나 대안적으로 볼 때 단백질 골격의 일부가 아니다. 이소펩티드 결합은 단일 단백질 내에서 형성할 수 있거나 두 개 펩티드 또는 펩티드와 단백질 사이에서 생길 수 있다. 따라서, 이소펩티드 결합은 단일 단백질 내 분자 내에서 형성할 수 있거나, 분자 간에서, 즉, 두 펩티드/단백질 분자 사이에서, 예를 들어, 두 펩티드 링커 사이에서 형성할 수 있다. 통상적으로, 이소펩티드 결합은 리신 잔기와 아스파라긴, 아스파르트산, 글루타민, 또는 글루탐산 잔기 또는 단백질 또는 펩티드 사슬의 말단 카르복실기 사이에서 생길 수 있거나, 단백질 또는 펩티드 사슬의 알파-아미노 말단과 아스파라긴, 아스파르트산, 글루타민 또는 글루탐산 사이에서 생길 수 있다. 이소펩타이드 결합에 관련된 쌍의 각각의 잔기는 본원에서 반응성 잔기로서 지칭된다. 본 발명의 바람직한 실시예에서, 이소펩티드 결합은 리신 잔기와 아스파라긴 잔기 사이 또는 리신 잔기와 아스파르트산 잔기 사이에 형성될 수 있다. 구체적으로, 이소펩타이드 결합은 리신의 측쇄 아민과 아스파라긴의 카르복사미기또는 아스파르트산염의 카르복실기 사이에서 생길 수 있다.
SpyTag:SpyCatcher 시스템은 미국 특허 제9,547,003호 및 Zakeri 등의 문헌[(2012) PNAS 109:E690-E697]에 기술되어 있으며(이들 각각은 그 전체가 참조로서 본원에 통합됨), 화농성 연쇄상구균(Streptococcus pyogenes) 피브로넥틴-결합 단백질인 FbaB의 CnaB2 도메인으로부터 유래된다. 도메인을 분할함으로써, Zakeri 등은 서열 AHIVMVDAYKPTK(서열번호 42)를 가진 펩티드 "SpyTag"를 수득하였는데, 이는 서열번호 43에 제시된 아미노산 서열을 가진 112개의 아미노산 폴리펩티드인 이의 동족 단백질 "SpyCatcher"에 대한 아미드 결합을 형성한다. (전술한 Zakeri 등의 (2012) 문헌 참조). CnAb2 도메인으로부터 유도된 추가의 특이적 결합 쌍은 SpyTag:KTag이며, SpyLigase의 존재 하에 이소펩티드 결합을 형성한다. (Fierer (2014) PNAS 111:E1176-1181) SpyLigase는, 반응성 리신을 함유하는 SpyCatcher로부터 β가닥을 잘라내고, 아미노산 서열 ATHIKFSKRD(서열번호 72)를 갖는 단백질:단백질 결합 쌍의 제1 구성원의 10개 잔기인 KTag를 생성하여 조작하였다. SpyTag002:SpyCatcher002 시스템은 Keeble 등의 문헌[(2017) Angew Chem Int Ed Engl 56:16521-25]에 기술되어 있고, 그 전체는 본원에 참조로서 통합된다. SpyTag002는 서열번호 73에 제시된 아미노산 서열 VPTIVMVDAYKRYK를 가지며, SpyCatcher002에 결합한다.
SnoopTag:SnoopCatcher 시스템은 Veggiani의 문헌[(2016) PNAS 113:1202-07]에 기술되어 있다. 폐렴구군(Streptococcus pneumoniae)의 접착부인 RrgA의 D4 Ig 유사 도메인을 분할하여 SnoopTag(잔기 734~745)와 SnoopCatcher(잔기 749~860)를 형성하였다. SnoopTag 및 SnoopCatcher를 인큐베이션하여 상보적 단백질들 사이에서 특이적인 자발적인 이소펩티드 결합을 유도한다. 전술한 Veggiani의 (2016) 문헌 참조.
isopeptag:pilin-C 특이적 결합 쌍은 화농성 연쇄상구균(Streptococcus pyogenes)의 주요 필린 단백질 Spy0128로부터 유래되었다. (Zakeir 및 Howarth의 문헌[(2010) J. Am. Chem. Soc. 132:4526-27]). Isopeptag는 서열번호 75로서 제시된 아미노산 서열 TDKDMTITFTNKKDAE를 가지며, pilin-C(Spy0128의 잔기 18~299)에 결합한다. SnoopTag 및 SnoopCatcher를 인큐베이션하여 상보적 단백질들 사이에서 특이적인 자발적인 이소펩티드 결합을 유도한다. 전술한 Zakeir 및 Howarth의 (2010) 문헌.
용어 "검출 가능한 표지"는, 예를 들어 비공유 결합을 통해 높은 친화도로 다른 폴리펩티드 서열(예: 항체 파라토프)와 특이적으로 결합하는 특이적 결합 쌍의 구성원인 폴리펩티드 서열을 포함한다. 예시적이고 비제한적인 검출 가능한 표지는 헥사히스티딘 태그, FLAG 태그, 스트렙 II 태그, 스트렙트아비딘-결합 펩티드(SBP) 태그, 칼모듈린-결합 펩티드(CBP), 글루타티온 S-전이효소(GST), 말토오스-결합 단백질(MBP), S-태그, HA 태그, 및 c-myc(서열번호 44)를 포함한다. (Zhao 등의 (2013) J. Analytical Meth. Chem. 1-8에서 검토되었으며; 동 문헌은 참조로서 본원에 통합됨). 영장류 AAV에 대한 흔한 검출 가능한 표지는 B1 에피토프(서열번호 45)이다. B1 에피토프를 자연적으로 포함하지 않는 본 발명의 비영장류 AAV 캡시드 단백질은 본원에서 B1 에피토프를 포함하도록 변형될 수 있다. 일반적으로, 비영장류 AAV 캡시드 단백질은 캡시드 단백질의 마지막 10개 아미노산 이내에서 B1 에피토프에 대해 실질적인 상동성을 갖는 서열을 포함할 수 있다. 따라서, 일부 구현예에서, 본 발명의 비영장류 AAV 캡시드 단백질은, AAV 캡시드 단백질이 B1 에피토프를 포함하도록, 캡시드 단백질의 마지막 10개 아미노산 이내에서 1개 내지 5개 미만의 점 돌연변이로 변형될 수 있다.
용어 "표적 세포"는 관심 뉴클레오티드의 발현이 필요한 임의의 세포를 포함한다. 바람직하게는, 표적 세포는 그 표면에서 수용체를 나타내는데, 이는 후술하는 바와 같이, 표적화 리간드를 사용해 세포를 표적화할 수 있게 한다.
용어 "형질도입" 또는 "감염" 등은 바이러스 입자에 의해 표적 세포 내로 핵산을 도입하는 것을 지칭한다. 형질도입 등과 관련된 용어 효율(efficiency), 예를 들어, "형질도입 효율(transduction efficiency)"은 관심 뉴클레오티드를 포함하는 설정된 개수의 바이러스 입자로 인큐베이션한 후 관심 뉴클레오티드를 발현하는 세포의 분획(예: 백분율)을 의미한다. 형질도입 효율을 결정하는 잘 알려진 방법은, 형광 리포터 유전자를 이용해 형질도입된 세포의 유세포 계측, 관심 뉴클레오티드의 발현에 대한 PR-PCR, 등을 포함한다.
일반적으로, “기준” 바이러스 캡시드 단백질/캡시드/입자는 시험해야 할 효과에 대한 변화를 제외하고는 시험 바이러스 캡시드 단백질/캡시드/입자와 동일하다. 예를 들어, 특이적 결합 쌍의 제1 구성원을 시험 바이러스 입자에 삽입하는 것의 효과(예: 형질도입 효율)를 결정하기 위해, 특이적 결합 쌍의 제1 구성원이 존재하는 것 외에는 모든 경우(예컨대, 추가 돌연변이, 관심 뉴클레오티드, 바이러스 벡터 및 타겟 세포의 개수 등)에 있어서 시험 바이러스 입자와 동일한 기준 바이러스 입자(필요에 따라, 적절한 표적화 리간드가 존재하거나 부재할 수 있음)의 형질도입 효율과 시험 바이러스 입자(적절한 표적화 리간드가 존재하거나 부재할 수 있음)의 형질도입 효율을 비교할 수 있다. 일부 구현예에서, 기준 바이러스 캡시드 단백질은 단백질:단백질 결합 쌍의 적어도 제1 구성원을 포함하도록 변형된 제2 바이러스 캡시드 단백질과 함께 캡시드를 형성할 수 있고, 여기서 기준 바이러스 캡시드 단백질은 단백질:단백질 결합 쌍의 제1 구성원을 포함하지 않으며, 바람직하게는, 기준 바이러스 캡시드 단백질 및 변형된 바이러스 캡시드 단백질에 의해 형성된 캡시드는 모자이크 캡시드이다.
아데노-연관 바이러스 (AAV)
"AAV"는 아데노-연관 바이러스에 대한 약어이며, 바이러스 자체 또는 이의 유도체를 지칭하도록 사용될 수 있다. AAV는 작은 비외피형 단일-가닥 DNA 바이러스이다. 일반적으로, 야생형 AAV 게놈은 4.7 kb이고, 2개의 역위 말단 반복(ITR) 및 2개의 개방 해독 프레임(ORF), rep cap을 특징으로 한다. 야생형 rep 해독 프레임은 분자량 78 kD("Rep78"), 68 kD("Rep68"), 52 kD("Rep52"), 및 40 kD("Rep 40")의 4개의 단백질을 암호화한다. Rep78 및 Rep68은 p5 프로모터로부터 전사되고, Rep52 및 Rep40은 p19 프로모터로부터 전사된다. 이들 단백질은 주로 AAV 게놈의 전사 및 복제를 조절하는 작용을 한다. 야생형 cap 해독 프레임은 83~85 kD(VP1), 72~73 kD(VP2) 및 61~62 kD(VP3)의 분자량을 갖는 3개의 구조(캡시드) 바이러스 단백질(VP)을 암호화한다. AAV 비리온(캡시드) 내의 총 단백질 중 80%가 넘는 단백질이 VP3를 포함하고; 성숙한 비리온에서는 VP1, VP2 및 VP3이 1:1:8의 비율로 보고된 적이 있지만, 대략 1:1:10의 상대 존재비로 발견된다. Padron 등의 문헌[(2005) J. Virology 79:5047-58].
AAV의 다양한 혈청형의 게놈 서열뿐만 아니라, 천연 역위 말단 반복(ITR), Rep 단백질, 및 캡시드 서브유닛의 서열도 당업계에 공지되어 있다. 이러한 서열은 문헌 또는 GenBank와 같은 공개 데이터베이스에서 확인할 수 있다. 예를 들어, GenBank 수탁 번호 NC_002077 (AAV1), AF063497 (AAV1), NC001401 (AAV-2), AF043303 (AAV2), NC_001729 (AAV3), NC_001829 (AAV4), U89790 (AAV4), NC_006152 (AAV5), AF513851 (AAV7), AF513852 (AAV8), 및 NC_006261 (AAV8)을 참조하고; 이들의 개시 내용은 AAV 핵산 및 아미노산 서열의 교지를 위해 참조로서 본원에 통합된다. 예를 들어, Srivistava 등의 문헌[(1983) J. Virology 45:555]; Chiorini 등의 문헌[(1998) J. Virology 71:6823]; Chiorini 등의 문헌[(1999) J. Virology 73: 1309]; Bantel-Schaal 등의 문헌[(1999) J. Virology 73:939]; Xiao 등의 문헌[(1999) J. Virology 73:3994]; Muramatsu 등의 문헌[(1996) Virology 221:208]; Shade 등의 문헌[(1986) J. Virol. 58:921]; Gao 등의 문헌[(2002) Proc. Nat. Acad. Sci. USA 99: 11854]; Moris 등의 문헌[(2004) Virology 33:375-383]; 미국 특허 공개 제20170130245호; 국제 특허 공개 WO 00/28061, WO 99/61601, WO 98/11244; 및 미국 특허 제6,156,303호를 또한 참조하고, 이들 각각은 그 전체가 참조로서 본원에 통합된다. 본원의 표 2는 다양한 비영장류 AAV의 서열을 제공한다.
"AAV"는 달리 요구되는 경우를 제외하고, 모든 아형 및 자연 발생 형태와 변형된 형태 둘다를 포함한다. AAV는 영장류 AAV (예: AAV 1형(AAV1), 영장류 AAV 2형(AAV2), 영장류 AAV 3형(AAV3), 영장류 AAV 4형(AAV4), 영장류 AAV 5형(AAV5), 영장류 AAV 6형(AAV6), 영장류 AAV 7형(AAV7), 영장류 AAV 8형(AAV8)), 비영장류 동물 AAV (예: 조류 AAV (AAAV)), 및 다른 비영장류 동물 AAV, 예컨대 포유류 AAV (예: 박쥐 AAV, 바다 사자 AAV, 소 AAV, 개 AAV, 말 AAV, 염소 AAV, 및 양 AAV 등), 유린류 AAV (예: 뱀 AAV, 턱수염 도마뱀 AAV), 등, 및 원격 AAV 등을 포함한다. "영장류 AAV"는 일반적으로 영장류로부터 단리된 AAV를 지칭한다. 유사하게, "비영장류 동물 AAV"는 비영장류 동물로부터 단리된 AAV를 지칭한다. 본원에 사용된 "원격 AAV"는 다음을 포함한다:
일반적으로 일반 인간 모집단과 제한된 접촉을 갖는 영장류 또는 비영장류 동물로부터 단리된 AAV;
영장류 동물로부터 단리된 AAV(예: 영장류 AAV)로서, 다음 각각에 대해 99% 미만, 예를 들어 95% 미만, 예를 들어 90% 미만, 예를 들어 85% 미만의 아미노산 서열 동일성을 갖는 아미노산을 포함하는 야생형 VP1 캡시드 단백질을 포함하는 AAV: AAV1의 VP1 캡시드 단백질, AAV2의 VP1 캡시드 단백질, AAV3의 VP1 캡시드 단백질, AAV4의 VP1 캡시드 단백질, AAV5의 VP1 캡시드 단백질, AAV6의 VP1 캡시드 단백질, AAV7의 VP1 캡시드 단백질, AAV8의 VP1 캡시드 단백질, AAV9의 VP1 캡시드 단백질, AAV10의 VP1 캡시드 단백질, AAV11의 VP1 캡시드 단백질, AAV12의 VP1 캡시드 단백질, 및 AAV13의 VP1 캡시드 단백질; 및/또는
비영장류 동물로부터 단리된 AAV(예: 비영장류 동물 AAV)로서, 표 2에 열거된 AAV 각각에 대해 99% 미만, 예를 들어, 95% 미만, 예를 들어, 90% 미만, 예를 들어, 85% 미만의 아미노산 서열 동일성을 갖는 아미노산 서열을 포함하는 야생형 캡시드 단백질을 포함하는, AAV.
혈청 반응 양성(seropositivity)은 잘 알려진 방법을 사용해 평가할 수 있다. 예를 들어, IgG의 부재 또는 존재는 효소-결합 면역흡착 검정(ELISA) 또는 다른 잘 알려진 면역 기반 검정에 의해 수행될 수 있다. 중화 항체를 검출하기 위해, AAV 입자를 (i) 특정 대상체의 혈청 또는 다수의 대상체의 혼합 혈청 또는 (ii) (예를 들어, 주어진 모집단내에서 면역글로불린의 단면을 대표하는 수십 명 내지 수천 명의 공여자 유래의) 개별 샘플 또는 풀링된 혈청 샘플로부터 제조하고 정제한 면역글로불린(IVIG 또는 IgG)의 양을 증가시키면서 (연속 희석) 함께 인큐베이션하고, 이어서, 예를 들어 다음의 리포터 유전자 발현(예: 루시퍼라제, GFP, 등)에 의해 세포 감염을 검출하는 중화 검정을 수행할 수 있다. 그런 다음, 감염 수준을 혈청/IVIG/IgG에 노출되지 않은 대조군 샘플에서의 수준과 비교한다. 예를 들어, 실시예 8 참조. 중화 역가는, 예를 들어, IVIG/IgG의 농도로서 정의하거나, 대조군과 비교했을 때 리포터 유전자 발현의 50% 이상을 억제시키는 혈청의 가장 높은 희석 인자로서 정의할 수 있다. 일 구현예에서, 대조군과 비교하여 감염된 세포의 수에 있어서 70%를 초과하는 감소가 관찰되는 혈청 희석물은 중화 활성에 대해 양성인 것으로 간주된다. 알려진 특정 중화 항체와의 상호작용은, 예를 들어, 면역블롯 검정을 사용하여 연구할 수 있다.
본원에서 사용되는 바와 같이, 유전자(예: rep, cap, 등), 캡시드 단백질(예: VP1 캡시드 단백질, VP2 캡시드 단백질, VP3 캡시드 단백질, 등), 특정 AAV의 캡시드 단백질의 영역(예: PLA2 영역, VP1-u 영역, VP1/VP2 공통 영역, VP3 영역), 뉴클레오티드 서열(예: ITR 서열)과 관련된 "[명시된] AAV의 ~", 예를 들어, AAV2의 cap 유전자 또는 캡시드 단백질 등은, 특정 AAV에 대해 본원에서 제시된 핵산 서열 또는 아미노산 서열을 각각 포함하는 유전자 또는 폴리펩티드에 추가하여, 하나 이상의 생물학적 기능을 유지하는 데 필요한 최소 수의 뉴클레오티드 또는 아미노산을 포함하는 변이체를 포함하여, 유전자 또는 폴리펩티드의 변이체도 포함한다. 본원에서 사용되는 바와 같이, 변이체 유전자 또는 변이체 폴리펩티드는 명시된 AAV의 유전자 또는 폴리펩티드에 대해 본원에 제시된 핵산 서열 또는 아미노산 서열과 상이한 핵산 서열 또는 아미노산 서열을 포함하며, 여기서 상이함(들)은, 예를 들어 상이함(들)이 유전자 코드의 퇴화, 단리된 변이체, 서열의 길이 등에 기인할 수 있는 경우, 유전자 또는 폴리펩티드의 적어도 하나의 생물학적 기능 및/또는 유전자 또는 폴리펩티드의 계통적 특징을 일반적으로 변경시키지 않는다. 예를 들어, 본원에서 사용되는 rep 유전자 및 cap 유전자는, 유전자가 하나 이상의 Rep 단백질 및 Cap 단백질을 각각 암호화할 수 있다는 면에서 야생형 유전자와 상이한 rep 유전자 및 cap 유전자를 포함할 수 있다. 일부 구현예에서, Rep 유전자는 적어도 Rep78 및/또는 Rep68을 암호화한다. 일부 구현예에서, cap 유전자는, cap 유전자가 하나의 Cap 단백질만을 암호화하도록 하나 이상의 대안적인 시작 코돈 또는 하나 이상의 대안적인 시작 코돈 사이의 서열이 제거된다는 점에서 야생형과 상이할 수 있으며, 예를 들어, 여기서 VP2 및/또는 VP3 시작 코돈은 cap 유전자가 기능적 VP1 캡시드 단백질을 암호화하지만 VP2 캡시드 단백질 또는 VP3 캡시드 단백질은 암호화하지 않도록, 제거되거나 치환된다. 따라서, 본원에서 사용되는 바와 같이, rep 유전자는 기능적 Rep 단백질을 암호화하는 임의의 서열을 포함한다. cap 유전자는 적어도 하나의 기능적 cap 유전자를 암호화하는 임의의 서열을 포함한다.
야생형 cap 유전자는 rep ORF에서 발견되는 p40 프로모터의 조절 하에 cap 유전자의 단일 개방 해독 프레임으로부터 3개의 VP1, VP2, 및 VP3 캡시드 단백질을 모두 발현한다는 것이 잘 알려져 있다. 용어 "캡시드 단백질(capsid protein)", "Cap 단백질" 등은 바이러스의 캡시드의 일부인 단백질을 포함한다. 아데노-연관 바이러스의 경우, 캡시드 단백질은 일반적으로 VP1, VP2, 및/또는 VP3으로 지칭되며, 단일 cap 유전자에 의해 암호화될 수 있다. AAV의 경우, 3개의 단백질이 공통 종결 코돈을 사용함에도 불구하고, 대안적인 번역 시작 코돈의 사용을 통해 3개의 AAV 캡시드 단백질이 자연적으로 중첩하는 방식으로 cap ORF로부터 생산된다. 야생형 cap 유전자의 ORF는 5'에서 3' 방향으로 3개의 대안적인 시작 코돈: "VP1 시작 코돈", "VP2 시작 코돈", 및 "VP3 시작 코돈"; 및 하나의 "공통 종결 코돈"을 암호화한다. 가장 큰 바이러스 단백질인 VP1은 일반적으로 VP1 시작 코돈에서 "공통 종결 코돈"까지 암호화된다. VP2은 일반적으로 VP2 시작 코돈에서 공통 종결 코돈까지 암호화된다. VP3은 일반적으로 VP3 시작 코돈에서 공통 종결 코돈까지 암호화된다. 따라서, VP1은 이의 N-말단 서열에서 VP2 또는 VP3과 공유하지 않는, VP1 고유 영역(VP1-u)으로 지칭되는 영역을 포함한다. VP1-u 영역은 일반적으로 VP1 시작 코돈에서 시작해 "VP2 시작 코돈"으로 이어지는 야생형 cap 유전자의 서열에 의해 암호화된다. VP1-u는 감염에 중요할 수 있는 포스포리파아제 A2 도메인(PLA2)을 비롯하여, 바이러스가 코팅 해제 및 게놈 방출을 위해 핵을 표적화하는 데 도움을 줄 수 있는 핵 국소화 신호도 포함한다. VP1, VP2, 및 VP3 캡시드 단백질은 VP3의 온전성을 구성하는 동일한 C-말단 서열을 공유하는데, 이는 본원에서 VP3 영역으로서 지칭될 수도 있다. VP3 영역은 일반적으로 VP3 시작 코돈에서 공통 종결 코돈까지 암호화된다. VP2는 VP1과 공유하는 약 60개의 추가 아미노산을 갖는다. 이 영역을 VP1/VP2 공통 영역이라고 한다.
일부 구현예에서, 본 발명의 Cap 단백질 중 하나 이상은 하나 이상의 ORF를 갖는 하나 이상의 cap 유전자에 의해 암호화될 수 있다. 일부 구현예에서, 본 발명의 VP 단백질은, 각각 본 발명의 VP1, VP2 및/또는 VP3 캡시드 단백질 중 하나 이상을 생산하는 포장 세포에서의 발현을 위해 적어도 하나의 발현 조절 서열에 작동 가능하게 연결된 별도의 뉴클레오티드 서열을 사용함으로써, VP1, VP2, 및/또는 VP3의 임의의 조합을 암호화하는 뉴클레오티드 서열을 포함하는 둘 이상의 ORF로부터 발현될 수 있다. 일부 구현예에서, 본 발명의 VP 캡시드 단백질은, 각각 VP1, VP2, 또는 VP3 캡시드 단백질 중 단 하나만을 생산하는 바이러스 복제 세포에서의 발현을 위해 하나의 발현 조절 서열에 작동 가능하게 연결된 별도의 뉴클레오티드 서열을 사용함으로써, VP1, VP2, 또는 VP3 중 어느 하나를 암호화하는 뉴클레오티드 서열을 포함하는 ORF로부터 개별적으로 발현될 수 있다. 또 다른 구현예에서, 본 발명의 VP 단백질은, 각각 VP1, VP2, 및 VP3 캡시드 단백질을 생산하는 바이러스 복제 세포에서의 발현을 위해 적어도 하나의 발현 조절 서열에 작동 가능하게 연결된 VP1, VP2, 및 VP3 캡시드 단백질을 암호화하는 뉴클레오티드 서열을 포함하는 ORF로부터 발현될 수 있다. 따라서, 본원에서 제공된 아미노산 위치가 기준 AAV의 VP1 캡시드 단백질과 관련하여 제공될 수 있지만, 당업자는 AAV의 VP2 및/또는 VP3 캡시드 단백질 내에서 해당하는 동일한 아미노산의 위치 및 상이한 AAV 중 아미노산의 상응하는 위치를 각각 그리고 쉽게 결정할 수 있을 것이다.
문구 "역위 말단 반복(inverted terminal repeat)" 또는 "ITR"은 효율적인 복제에 요구되는 아데노-연관 바이러스의 게놈에서의 대칭 핵산 서열을 포함한다. ITR 서열은 AAV DNA 게놈의 각 말단에 위치한다. ITR은 바이러스 DNA 합성을 위한 복제 기원의 역할을 하며, AAV 입자를 생성하기 위한, 예를 들어 AAV 입자 내로 포장하기 위한 필수 시스(cis) 성분이다.
AAV ITR은 복제 단백질 Rep78 또는 Rep68에 대한 인식 부위를 포함한다. ITR의 "D" 영역은 DNA 복제가 개시되고 핵산 복제 단계에 방향성을 제공하는 DNA 닉 부위를 포함한다. 포유류 세포에서의 AAV 복제는 일반적으로 2개의 ITR 서열을 포함한다.
단일 ITR은 "A" 영역의 양 가닥 상의 Rep 결합 부위 및 ITR 회문(palindrome)의 각 측에 있는 2개의 대칭 D 영역에 의해 조작될 수 있다. 이중-가닥 원형 DNA 템플릿 상의 이러한 조작된 작제물은 Rep78 또는 Rep68이 핵산 복제를 개시하도록 하는데, 이는 양 방향으로 진행된다. 단일 ITR은 원형 입자의 AAV 복제에 충분하다. 본 발명의 AAV 바이러스 입자를 생산하는 방법에서, rep 암호화 서열은 전달 플라스미드 상에 포함된 ITR에 결합할 수 있는 Rep 단백질 또는 Rep 단백질 등가물을 암호화한다.
본 발명의 Cap 단백질은, 포장 세포에 의해 적절한 Rep 단백질과 함께 발현될 때, 관심 뉴클레오티드 및 2개 이상의 짝수의 ITR 서열을 포함하는 전달 플라스미드를 캡시드화할 수 있다. 일부 구현예에서, 전달 플라스미드는 하나의 ITR 서열을 포함한다. 일부 구현예에서, 전달 플라스미드는 2개의 ITR 서열을 포함한다.
Rep78 및/또는 Rep68은 ITR 헤어핀의 서열 상의 고유하고 알려진 부위에 결합하여, AAV 게놈의 단부에 있는 헤어핀 구조를 파괴하고 풀도록 작용하여, 바이러스 복제 세포의 복제 기계에 대한 액세스를 제공한다. 잘 알려진 바와 같이, Rep 단백질은, 각각 Rep78, Rep68, Rep 52, 및/또는 Rep40 Rep 단백질 중 하나 이상을 생산하는 바이러스 복제 세포에서의 발현을 위해 적어도 하나의 발현 조절 서열에 작동 가능하게연결된 별도의 뉴클레오티드 서열을 사용함으로써, Rep78, Rep68, Rep 52, 및/또는 Rep40의 임의의 조합을 암호화하는 뉴클레오티드 서열을 포함하는 둘 이상의 ORF로부터 발현될 수 있다. 대안적으로, Rep 단백질은, 각각 단 하나의 Rep78, Rep68, Rep 52, 및/또는 Rep40 Rep 단백질만을 생산하는 포장 세포에서의 발현을 위해 하나의 발현 조절 서열에 작동 가능하게연결된 별도의 뉴클레오티드 서열을 사용함으로써, Rep78, Rep68, Rep 52, 및/또는 Rep40 중 어느 하나를 암호화하는 뉴클레오티드 서열을 포함하는 ORF로부터 개별적으로 발현될 수 있다. 또 다른 구현예에서, Rep 단백질은, 각각 Rep78 및 Rep52 Rep 단백질을 생산하는 바이러스 복제 세포에서의 발현을 위해 적어도 하나의 발현 조절 서열에 작동 가능하게 연결된 Rep78 및 Rep52 Rep 단백질을 암호화하는 뉴클레오티드 서열을 포함하는 하나의 ORF로부터 발현될 수 있다.
본 발명의 AAV 비리온, 예를 들어, 바이러스 입자를 생산하는 방법에서, 본 발명의 rep 암호화 서열 및 cap 유전자가 단일 포장 플라스미드로 제공될 수 있다(예를 들어, 도 1 참조). 그러나, 당업자는 이러한 단서가 필요하지 않다는 것을 인식할 것이다. 이러한 바이러스 입자는 게놈을 포함하거나 포함하지 않을 수 있다.
"키메라 AAV 캡시드 단백질"은, 2개 이상의 상이한 AAV 유래의 아미노산 서열, 예를 들어 일부를 포함하고 AAV 바이러스 캡시드/바이러스 입자를 형성하고/하거나 형성할 수 있는 AAV 캡시드 단백질을 포함한다. 키메라 AAV 캡시드 단백질은 예를 들어 복수의, 예를 들어, 적어도 2개의 핵산 서열을 포함하는 키메라 뉴클레오티드와 같은 키메라 AAV 캡시드 유전자에 의해 암호화되며, 상기 복수의 핵산 서열 각각은 구별되는 AAV의 캡시드 단백질을 암호화하는 캡시드 유전자의 일부분과 동일하며, 상기 복수의 핵산 서열은 기능성 키메라 AAV 캡시드 단백질을 함께 암호화한다. 특이적 AAV에 키메라 캡시드 단백질이 결합하는 것은, 캡시드 단백질이 해당 AAV의 캡시드 단백질 유래의 하나 이상의 부분 및 상이한 AAV의 캡시드 단백질 유래의 하나 이상의 부분을 포함한다는 것을 나타낸다. 예를 들어, 키메라 AAV2 캡시드 단백질은, AAV2의 VP1, VP2, 및/또는 VP3 캡시드 단백질의 하나 이상의 부분 및 상이한 AAV의 VP1, VP2, 및/또는 VP3 캡시드 단백질의 하나 이상의 부분을 포함하는 캡시드 단백질을 포함한다.
용어 "일부(portion)"는 일부가 유래되는 서열과 100% 동일성을 갖는 적어도 5개의 아미노산 또는 적어도 15개의 뉴클레오티드를 지칭하지만, 전장 폴리펩티드 또는 핵산 분자보다는 작다(Penzes의 문헌[(2015) J. General Virol. 2769] 참조). "일부"는 일부가 유래되는 폴리펩티드 또는 핵산 분자 형태가 "[명시된] AAV의 것"이거나, 특정 AAV, 예를 들어, 비영장류 동물 AAV 또는 원격 AAV에 대해 "상당한 동일성"을 갖는 다는 것을 결정하기에 충분한 아미노산 또는 뉴클레오티드의 임의의 연속 분절을 포함한다. 일부 구현예에서, 일부는 명시된 AAV와 연관된 서열에 대해 100% 동일성을 갖는 적어도 5개의 아미노산 또는 15개의 뉴클레오티드를 포함한다. 일부 구현예에서, 일부는 특정 AAV와 연관된 서열에 대해 100% 동일성을 갖는 적어도 10개의 아미노산 또는 30개의 뉴클레오티드를 포함한다. 일부 구현예에서, 일부는 특정 AAV와 연관된 서열에 대해 100% 동일성을 갖는 적어도 15개의 아미노산 또는 45개의 뉴클레오티드를 포함한다. 일부 구현예에서, 일부는 특정 AAV와 연관된 서열에 대해 100% 동일성을 갖는 적어도 20개의 아미노산 또는 60개의 뉴클레오티드를 포함한다. 일부 구현예에서, 일부는 특정 AAV와 연관된 서열에 대해 100% 동일성을 갖는 적어도 25개의 아미노산 또는 75개의 뉴클레오티드를 포함한다. 일부 구현예에서, 일부는 특정 AAV와 연관된 서열에 대해 100% 동일성을 갖는 적어도 30개의 아미노산 또는 90개의 뉴클레오티드를 포함한다. 일부 구현예에서, 일부는 특정 AAV와 연관된 서열에 대해 100% 동일성을 갖는 적어도 35개의 아미노산 또는 105개의 뉴클레오티드를 포함한다. 일부 구현예에서, 일부는 특정 AAV와 연관된 서열에 대해 100% 동일성을 갖는 적어도 40개의 아미노산 또는 120개의 뉴클레오티드를 포함한다. 일부 구현예에서, 일부는 특정 AAV와 연관된 서열에 대해 100% 동일성을 갖는 적어도 45개의 아미노산 또는 135개의 뉴클레오티드를 포함한다. 일부 구현예에서, 일부는 특정 AAV와 연관된 서열에 대해 100% 동일성을 갖는 적어도 50개의 아미노산 또는 150개의 뉴클레오티드를 포함한다. 일부 구현예에서, 일부는 특정 AAV와 연관된 서열에 대해 100% 동일성을 갖는 적어도 60개의 아미노산 또는 180개의 뉴클레오티드를 포함한다. 일부 구현예에서, 일부는 특정 AAV와 연관된 서열에 대해 100% 동일성을 갖는 적어도 70개의 아미노산 또는 210개의 뉴클레오티드를 포함한다. 일부 구현예에서, 일부는 특정 AAV와 연관된 서열에 대해 100% 동일성을 갖는 적어도 80개의 아미노산 또는 240개의 뉴클레오티드를 포함한다. 일부 구현예에서, 일부는 특정 AAV와 연관된 서열에 대해 100% 동일성을 갖는 적어도 90개의 아미노산 또는 270개의 뉴클레오티드를 포함한다. 일부 구현예에서, 일부는 특정 AAV와 연관된 서열에 대해 100% 동일성을 갖는 적어도 100개의 아미노산 또는 300개의 뉴클레오티드를 포함한다.
변형된 바이러스 캡시드 단백질, 바이러스 입자, 핵산
일부 구현예에서, 본 발명의 Cap 단백질, 예를 들어, 본원에 기술된 것과 같은 VP1 캡시드 단백질, 본원에 기술된 것과 같은 VP2 캡시드 단백질, 및/또는 본원에 기술된 것과 같은 VP3 캡시드 단백질은, 예를 들어 단백질:단백질 결합 쌍의 제1 구성원, 검출 가능한 표지, 점 돌연변이 등을 포함하도록 변형된다.
키메리즘(chemerism)는 본원에 기술된 것과 같은 일종의 변형이다. 일반적으로, 명시된 AAV 또는 이의 변이체의 유전자 또는 폴리펩티드의 변형은, 명시된 AAV에 대해 본원에 제시된 핵산 서열 또는 아미노산 서열과 상이한 핵산 서열 또는 아미노산 서열을 초래하며, 여기서 변형은 하나 이상의 생물학적 기능을 변경, 부여, 또는 제거하지만, 유전자 또는 폴리펩티드의 계통발생적 특성을 바꾸지는 않는다. 변형은, 예를 들어, 캡시드 단백질의 자연 향성이 감소 내지는 제거되도록 및/또는 캡시드 단백질이 검출 가능한 표지를 포함하도록, 예를 들어 단백질:단백질 결합 쌍의 제1 구성원 및 점 돌연변이를 삽입하는 것을 포함할 수 있다. 바람직한 변형은, 다른 AAV로 감염시키는, 예를 들어, AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, AAVDJ, Anc80L65, AAV2G9, AAV-LK03와 같은 혈청형, 이러한 혈청형에 기초한 비리온, 현재 사용되는 유전자 요법 방법에서의 비리온, 또는 이들의 조합으로 감염시키는 과정 중에 생성된, 일반 모집단에서 발견되는 기존 항체가 변형된 캡시드를 낮게 내지는 인식하지 못하는 것을 변경하지 않는, 바람직하게는 감소시키는 것들을 포함한다. 본원에 기술된 것과 같은 다른 변형은 캡시드 단백질이 단백질:단백질 결합 쌍의 제1 구성원, 검출 가능한 표지 등을 포함하도록 캡시드 단백질을 변형시키는 것을 포함하며, 이러한 변형은 일반적으로 유전자 수준에서, 예를 들어, cap 유전자의 변형으로부터 생성된다.
일부 구현예에서, 본원에 기술된 것과 같은 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 모자이크 캡시드이며, 예를 들어, VP1, VP2, 및/또는 VP3 단백질의 적어도 2개의 세트를 포함하며, 이들 각각의 세트는 상이한 cap 유전자에 의해 암호화된다. 본원의 모자이크 캡시드는 일반적으로 단백질:단백질 결합 쌍의 제1 구성원을 포함하도록 변형된 제1 바이러스 캡시드 단백질 및 단백질:단백질 결합 쌍의 제1 구성원이 결여된 상응하는 제2 바이러스 캡시드 단백질로 이루어진 모자이크를 지칭한다. 모자이크 캡시드와 관련하여, 단백질:단백질 결합 쌍의 제1 구성원이 결여된 제2 바이러스 캡시드 단백질은 기준 cap 유전자에 의해 암호화된 기준 캡시드 단백질로서 지칭될 수 있다. 모자이크 캡시드의 일부 구현예에서, 바람직하게는 단백질:단백질 쌍의 제1 구성원으로 변형된 VP1, VP2, 및/또는 VP3 캡시드 단백질이 키메라 캡시드 단백질이 아닌 경우, VP1, VP2, 및/또는 VP3 기준 캡시드 단백질은, 기준 캡시드 단백질에 단백질:단백질 결합 쌍의 제1 구성원이 결여되어 있다는 것을 제외하고는, 단백질:단백질 결합 쌍의 제1 구성원으로 변형된 바이러스 VP1, VP2, 및/또는 VP3 캡시드 단백질의 아미노산 서열과 동일한 아미노산 서열을 포함할 수 있다. 모자이크 캡시드의 일부 구현예에서, VP1, VP2, 및/또는 VP3 기준 캡시드 단백질은, 기준 캡시드 단백질에 단백질:단백질 결합 쌍의 제1 구성원이 결여되어 있다는 것을 제외하고는, 단백질:단백질 결합 쌍의 제1 구성원으로 변형된 바이러스 VP1, VP2, 및/또는 VP3 캡시드 단백질에 상응한다. 일부 구현예에서, VP1 기준 캡시드 단백질은, 기준 캡시드 단백질에 단백질:단백질 결합 쌍의 제1 구성원이 결여되어 있다는 것을 제외하고는, 단백질:단백질 결합 쌍의 제1 구성원으로 변형된 바이러스 VP1 캡시드 단백질에 상응한다. 일부 구현예에서, VP2 기준 캡시드 단백질은, 기준 캡시드 단백질에 단백질:단백질 결합 쌍의 제1 구성원이 결여되어 있다는 것을 제외하고는, 단백질:단백질 결합 쌍의 제1 구성원으로 변형된 바이러스 VP2 캡시드 단백질에 상응한다. 일부 구현예에서, VP3 기준 캡시드 단백질은, 기준 캡시드 단백질에 단백질:단백질 결합 쌍의 제1 구성원이 결여되어 있다는 것을 제외하고는, 단백질:단백질 결합 쌍의 제1 구성원으로 변형된 바이러스 VP3 캡시드 단백질에 상응한다. 단백질:단백질 결합 쌍의 제1 구성원을 포함하도록 추가로 변형된 키메라 VP1, VP2, 및/또는 VP3 캡시드 단백질을 포함하는 모자이크 캡시드의 일부 구현예에서, 기준 단백질은 이의 일부가 키메라 캡시드 단백질의 일부를 형성하는 상응하는 캡시드 단백질일 수 있다. 비제한적인 예로서, 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원을 포함하도록 변형된 키메라 AAV2/AAAV VP1 캡시드 단백질을 포함하는 모자이크 캡시드는 기준 캡시드 단백질로서, 제1 구성원이 결여된 AAV2 VP1 캡시드 단백질, 제1 구성원이 결여된 AAAV VP1 캡시드 단백질, 제1 구성원이 결여된 키메라 AAV2/AAAV VP1 캡시드 단백질을 추가로 포함할 수 있다. 유사하게, 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원을 포함하도록 변형된 키메라 AAV2/AAAV VP2 캡시드 단백질을 포함하는 모자이크 캡시드는 기준 캡시드 단백질로서, 제1 구성원이 결여된 AAV2 VP2 캡시드 단백질, 제1 구성원이 결여된 AAAV VP2 캡시드 단백질, 제1 구성원이 결여된 키메라 AAV2/AAAV VP2 캡시드 단백질을 추가로 포함할 수 있다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원을 포함하도록 변형된 키메라 AAV2/AAAV VP3 캡시드 단백질을 포함하는 모자이크 캡시드는 기준 캡시드 단백질로서, 제1 구성원이 결여된 AAV2 VP2 캡시드 단백질, 제1 구성원이 결여된 AAAV VP1 캡시드 단백질, 제1 구성원이 결여된 키메라 AAV2/AAAV VP3 캡시드 단백질을 추가로 포함할 수 있다. 모자이크 캡시드의 일부 구현예에서, 기준 캡시드 단백질은, 단백질:단백질 결합 쌍의 제1 구성원이 결여되고, 단백질:단백질 결합 쌍의 제1 구성원으로 변형된 제1 캡시드 단백질과 함께 캡시드를 형성할 수 있는 한 임의의 캡시드 단백질일 수 있다.
일반적으로, 모자이크 입자는 변형된 Cap 유전자와 기준 Cap 유전자의 혼합물을 표시된 비율로 생산 세포 내로 형질감염시킴으로써 생성될 수 있다. 단백질 서브유닛 비율, 예를 들어, 입자 내의 변형된 VP 단백질:미변형 VP 단백질 비율은, 단백질:단백질 결합 쌍의 제1 구성원으로 변형된 제1 캡시드 단백질을 암호화하는 cap 유전자 및 하나 이상의 기준 cap 유전자로 이루어진 적어도 2개의 종(예를 들어, 포장 세포 내로 형질감염된 변형된 cap 유전자:기준 cap 유전자(들))의 비율을 화학량론적으로 반영할 수 있지만, 반드시 그런 것은 아니다. 일부 구현예에서, 입자 내의 단백질 서브유닛 비율은 포장 세포 내로 형질감염된 변형된 cap 유전자:기준 cap 유전자(들) 비율을 화학량론적으로 반영하지는 않는다.
모자이크 바이러스 입자의 일부 구현예에서, 단백질 서브유닛 비율은 약 1:59 내지 약 59:1의 범위이다. 모자이크 바이러스 입자의 일부 구현예에서, 단백질 서브유닛은 적어도 약 1:1이다(예를 들어, 모자이크 바이러스 입자는 약 30개의 변형된 캡시드 단백질 및 약 30개의 기준 캡시드 단백질을 포함함). 모자이크 바이러스 입자의 일부 구현예에서, 단백질 서브유닛은 적어도 약 1:2이다(예를 들어, 모자이크 바이러스 입자는 약 20개의 변형된 캡시드 단백질 및 약 40개의 기준 캡시드 단백질을 포함함). 모자이크 바이러스 입자의 일부 구현예에서, 단백질 서브유닛 비율은 약 3:5이다. 모자이크 바이러스 입자의 일부 구현예에서, 단백질 서브유닛은 적어도 약 1:3이다(예를 들어, 모자이크 바이러스 입자는 약 15개의 변형된 캡시드 단백질 및 약 45개의 기준 캡시드 단백질을 포함함). 모자이크 바이러스 입자의 일부 구현예에서, 단백질 서브유닛은 적어도 약 1:4이다(예를 들어, 모자이크 바이러스 입자는 약 12개의 변형된 캡시드 단백질 및 약 48개의 기준 캡시드 단백질을 포함함). 모자이크 바이러스 입자의 일부 구현예에서, 단백질 서브유닛은 적어도 약 1:5이다(예를 들어, 모자이크 바이러스 입자는 약 10개의 변형된 캡시드 단백질 및 약 50개의 기준 캡시드 단백질을 포함함). 모자이크 바이러스 입자의 일부 구현예에서, 단백질 서브유닛 비율은 약 1:6이다. 모자이크 바이러스 입자의 일부 구현예에서, 단백질 서브유닛 비율은 약 1:7이다. 모자이크 바이러스 입자의 일부 구현예에서, 단백질 서브유닛 비율은 약 1:8이다. 모자이크 바이러스 입자의 일부 구현예에서, 단백질 서브유닛은 적어도 약 1:9이다(예를 들어, 모자이크 바이러스 입자는 약 6개의 변형된 캡시드 단백질 및 약 54개의 기준 캡시드 단백질을 포함함). 모자이크 바이러스 입자의 일부 구현예에서, 단백질 서브유닛 비율은 약 1:10이다. 모자이크 바이러스 입자의 일부 구현예에서, 단백질 서브유닛은 적어도 약 1:11이다(예를 들어, 모자이크 바이러스 입자는 약 5개의 변형된 캡시드 단백질 및 약 55개의 기준 캡시드 단백질을 포함함). 모자이크 바이러스 입자의 일부 구현예에서, 단백질 서브유닛 비율은 약 1:12이다. 모자이크 바이러스 입자의 일부 구현예에서, 단백질 서브유닛 비율은 약 1:13이다. 모자이크 바이러스 입자의 일부 구현예에서, 단백질 서브유닛은 적어도 약 1:14이다(예를 들어, 모자이크 바이러스 입자는 약 4개의 변형된 캡시드 단백질 및 약 56개의 기준 캡시드 단백질을 포함함). 모자이크 바이러스 입자의 일부 구현예에서, 단백질 서브유닛 비율은 약 1:15이다. 모자이크 바이러스 입자의 일부 구현예에서, 단백질 서브유닛은 적어도 약 1:19이다(예를 들어, 모자이크 바이러스 입자는 약 3개의 변형된 캡시드 단백질 및 약 57개의 기준 캡시드 단백질을 포함함). 모자이크 바이러스 입자의 일부 구현예에서, 단백질 서브유닛은 적어도 약 1:29이다(예를 들어, 모자이크 바이러스 입자는 약 2개의 변형된 캡시드 단백질 및 약 58개의 기준 캡시드 단백질을 포함함). 모자이크 바이러스 입자의 일부 구현예에서, 단백질 서브유닛 비율은 약 1:59이다. 모자이크 바이러스 입자의 일부 구현예에서, 단백질 서브유닛은 적어도 약 2:1이다(예를 들어, 모자이크 바이러스 입자는 약 40개의 변형된 캡시드 단백질 및 약 20개의 기준 캡시드 단백질을 포함함). 모자이크 바이러스 입자의 일부 구현예에서, 단백질 서브유닛 비율은 약 5:3이다. 모자이크 바이러스 입자의 일부 구현예에서, 단백질 서브유닛은 적어도 약 3:1이다(예를 들어, 모자이크 바이러스 입자는 약 45개의 변형된 캡시드 단백질 및 약 15개의 기준 캡시드 단백질을 포함함). 모자이크 바이러스 입자의 일부 구현예에서, 단백질 서브유닛은 적어도 약 4:1이다(예를 들어, 모자이크 바이러스 입자는 약 48개의 변형된 캡시드 단백질 및 약 12개의 기준 캡시드 단백질을 포함함). 모자이크 바이러스 입자의 일부 구현예에서, 단백질 서브유닛은 적어도 약 5:1이다(예를 들어, 모자이크 바이러스 입자는 약 50개의 변형된 캡시드 단백질 및 약 10개의 기준 캡시드 단백질을 포함함). 모자이크 바이러스 입자의 일부 구현예에서, 단백질 서브유닛 비율은 약 6:1이다. 모자이크 바이러스 입자의 일부 구현예에서, 단백질 서브유닛 비율은 약 7:1이다. 모자이크 바이러스 입자의 일부 구현예에서, 단백질 서브유닛 비율은 약 8:1이다. 모자이크 바이러스 입자의 일부 구현예에서, 단백질 서브유닛은 적어도 약 9:1이다(예를 들어, 모자이크 바이러스 입자는 약 54개의 변형된 캡시드 단백질 및 약 6개의 기준 캡시드 단백질을 포함함). 모자이크 바이러스 입자의 일부 구현예에서, 단백질 서브유닛 비율은 약 10:1이다. 모자이크 바이러스 입자의 일부 구현예에서, 단백질 서브유닛은 적어도 약 11:1이다(예를 들어, 모자이크 바이러스 입자는 약 55개의 변형된 캡시드 단백질 및 약 5개의 기준 캡시드 단백질을 포함함). 모자이크 바이러스 입자의 일부 구현예에서, 단백질 서브유닛 비율은 약 12:1이다. 모자이크 바이러스 입자의 일부 구현예에서, 단백질 서브유닛 비율은 약 13:1이다. 모자이크 바이러스 입자의 일부 구현예에서, 단백질 서브유닛은 적어도 약 14:1이다(예를 들어, 모자이크 바이러스 입자는 약 56개의 변형된 캡시드 단백질 및 약 4개의 기준 캡시드 단백질을 포함함). 모자이크 바이러스 입자의 일부 구현예에서, 단백질 서브유닛 비율은 약 15:1이다. 모자이크 바이러스 입자의 일부 구현예에서, 단백질 서브유닛은 적어도 약 19:1이다(예를 들어, 모자이크 바이러스 입자는 약 57개의 변형된 캡시드 단백질 및 약 3개의 기준 캡시드 단백질을 포함함). 모자이크 바이러스 입자의 일부 구현예에서, 단백질 서브유닛은 적어도 약 29:1이다(예를 들어, 모자이크 바이러스 입자는 약 58개의 변형된 캡시드 단백질 및 약 2개의 기준 캡시드 단백질을 포함함). 모자이크 바이러스 입자의 일부 구현예에서, 단백질 서브유닛 비율은 약 59:1이다.
비모자이크 바이러스 입자의 일부 구현예에서, 단백질 서브유닛 비율은 1:0일 수 있으며, 여기서 비모자이크 바이러스 입자의 각각의 캡시드 단백질은 단백질:단백질 결합 쌍의 제1 구성원으로 변형된다. 비모자이크 바이러스 입자의 일부 구현예에서, 단백질 서브유닛 비율은 0:1일 수 있으며, 여기서 비모자이크 바이러스 입자의 각각의 캡시드 단백질은 단백질:단백질 결합 쌍의 제1 구성원으로 변형되지 않는다.
일부 구현예에서, 본 발명의 캡시드 단백질은 검출 가능한 표지를 포함하도록 변형된다. 많은 검출 가능한 표지가 당업계에 공지되어 있다. (예를 들어, Nilsson 등의 문헌[(1997) "Affinity fusion strategies for detection, purification, and immobilization of modified proteins" Protein Expression and Purification 11: 1-16], Terpe 등의 문헌[(2003) "Overview of tag protein fusions: From molecular and biochemical fundamentals to commercial systems" Applied Microbiology and Biotechnology 60:523-533], 및 이들 문헌 중의 참조 문헌을 참조한다). 검출 가능한 표지는 다음을 포함하되 이들로 한정되지는 않는다: 고정된 2가 양이온(예: Ni2+)에 결합하는 폴리히스티딘 검출 가능한 표지(예를 들어, His-6, His-8, 또는 His-10); 고정된 아비딘에 결합하는 (예를 들어, 생체 내에서 비오티닐화된 폴리펩티드 서열 상의) 비오틴 모이어티; 고정된 글루타티온에 결합하는 GST(글루타티온 S-트랜스퍼라제) 서열; 고정된 S 단백질에 결합하는 S 태그; 고정된 항체 또는 이의 도메인 또는 단편에 결합에 결합하는 항원(예를 들어, 상응하는 항체에 결합하는 T7, myc, FLAG 및 B 태그 포함); FLASH 태그(특이적 아르신계 모이어티에 결합하는 고도로 검출 가능한 표지); 고정된 리간드에 결합하는 수용체 또는 수용체 도메인(그 반대도 동일함), 고정된 IgG에 결합하는 단백질 A 또는 이의 유도체(예: Z); 고정된 아밀로오스에 결합하는 말토오스 결합 단백질(MBP); 고정된 알부민에 결합하는 알부민 결합 단백질; 고정된 키틴에 결합하는 키틴 결합 단백질; 고정된 칼모듈린에 결합하는 칼모듈린 결합 펩티드; 및 고정된 셀룰로오스에 결합하는 셀룰로오스 결합 도메인. 또 다른 검출 가능한 표지는 SNAP-태그이며, Covalys(www.covalys.com)로부터 상업적으로 입수 가능하다. 일부 구현예에서, 본원에 개시된 검출 가능한 표지는 항체 파라토프에 의해서만 인식되는 검출 가능한 표지를 포함한다. 일부 구현예에서, 본원에 개시된 검출 가능한 표지는 항체 파라토프 및 다른 특이적 결합 쌍에 의해서 인식되는 검출 가능한 표지를 포함한다.
일부 구현예에서, 검출 가능한 표지는 면역글로불린 불변 도메인과 결합 쌍을 형성한다. 일부 구현예에서, 검출 가능한 표지 및/또는 검출 가능한 표지는 금속 이온, 예를 들어, Ni2+, Co2+, Cu2+, Zn2+, Fe3+ 등과 결합 쌍을 형성한다. 일부 구현예에서, 검출 가능한 표지는 스트렙트아비딘, 스트렙 II, HA, L14, 4C-RGD, LH, 및 단백질 A로 이루어진 군으로부터 선택된다.
일부 구현예에서, 검출 가능한 표지는 FLAG, HA, 및 c-myc(EQKLISEEDL; 서열번호 44)로 이루어진 군으로부터 선택된다. 일부 구현예에서, 검출 가능한 표지는 c-myc(서열번호 44)이다.
일부 구현예에서, 검출 가능한 표지는 B 세포 에피토프이고, 예를 들어, 약 1개 아미노산 내지 약 35개 아미노산의 길이이며, 항체 파라토프, 예를 들어, 면역글로불린 가변 도메인과 결합 쌍을 형성한다. 일부 구현예에서, 검출 가능한 표지는 B1 에피토프(서열번호 45)를 포함한다. 일부 구현예에서, 캡시드 단백질은 VP3 영역에서 B1 에피토프를 포함하도록 변형된다.
일부 구현예에서, 본 발명의 캡시드 단백질은 펩티드:펩티드 결합 쌍의 적어도 제1 구성원을 포함한다.
일부 구현예에서, 본 발명의 캡시드 단백질은 검출 가능한 표지를 포함하는 단백질:단백질 결합 쌍의 제1 구성원을 포함하며, 상기 검출 가능한 표지는 Cap 단백질의 검출 및/또는 단리에도 사용될 수 있고/있거나 단백질:단백질 결합 쌍의 제1 구성원으로서도 사용될 수 있다. 일부 구현예에서, 검출 가능한 표지는, 관심 세포에 의해 발현된 표적 및 검출 가능한 표지 둘 다에 결합할 수 있는 다중특이적 결합 단백질을 포함하는 표적화 리간드의 결합을 위한 단백질:단백질 결합 쌍의 제1 구성원으로서 작용한다. 일부 구현예에서, 본 발명의 Cap 단백질은 c-myc(서열번호 44)를 포함하는 단백질:단백질 결합 쌍의 제1 구성원을 포함한다. 단백질:단백질 결합 쌍의 제1 구성원으로서 검출 가능한 표지의 용도는, 예를 들어 WO2019006043에 기술되어 있으며, 동 문헌은 그 전체가 참조로서 본원에 통합된다.
일부 구현예에서, 캡시드 단백질은 단백질:단백질 결합 쌍의 제1 구성원을 포함하되, 단백질:단백질 결합 쌍은 공유 이소펩티드 결합을 형성한다. 일부 구현예에서, 펩티드:펩티드 결합 쌍의 제1 구성원은 이소펩티드 결합을 통해 펩티드:펩티드 결합 쌍의 동족 제2 구성원에 공유 결합되고, 임의로 펩티드:펩티드 결합 쌍의 동족 제2 구성원은 표적화 리간드와 융합되며, 표적화 리간드는 관심 세포에 의해 발현된 표적에 결합한다. 일부 구현예에서, 단백질:단백질 결합 쌍은 SpyTag:SpyCatcher, SpyTag002:SpyCatcher002, SpyTag:KTag, Isopeptag:pilin-C, 및 SnoopTag:SnoopCatcher로 이루어진 군으로부터 선택될 수 있다. 일부 구현예에서, 제1 구성원은 SpyTag(또는 이의 생물학적으로 활성인 부분)이고 단백질(제2 동족 구성원)은 SpyCatcher(또는 이의 생물학적으로 활성인 부분)이다. 일부 구현예에서, 제1 구성원은 SpyTag(또는 이의 생물학적으로 활성인 부분)이고 단백질(제2 동족 구성원)은 KTag(또는 이의 생물학적으로 활성인 부분)이다. 일부 구현예에서, 제1 구성원은 KTag(또는 이의 생물학적으로 활성인 부분)이고 단백질(제2 동족 구성원)은 SpyTag(또는 이의 생물학적으로 활성인 부분)이다. 일부 구현예에서, 제1 구성원은 SnoopTag(또는 이의 생물학적으로 활성인 부분)이고 단백질(제2 동족 구성원)은 SnoopCatcher(또는 이의 생물학적으로 활성인 부분)이다. 일부 구현예에서, 제1 구성원은 Isopeptag(또는 이의 생물학적 활성 부분)이고 단백질(제2 동족 구성원)은 Pilin-C(또는 이의 생물학적으로 활성인 부분)이다. 일부 구현예에서, 제1 구성원은 SpyTag002(또는 이의 생물학적으로 활성인 부분)이고 단백질(제2 동족 구성원)은 SpyCatcher002(또는 이의 생물학적으로 활성인 부분)이다. 일부 구현예에서, 본 발명의 Cap 단백질은 SpyTag를 포함한다. 단백질:단백질 결합 쌍의 제1 구성원으로서 검출 가능한 표지의 용도는 WO2019006046에 기술되어 있으며, 동 문헌은 그 전체가 본원에 통합된다.
일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원 및/또는 검출 가능한 표지는 제1 또는 제2 링커(예를 들어, 적어도 1개의 아미노산 길이인 아미노산 스페이서)를 통해 본 발명의 Cap 단백질에 작동 가능하게 연결된다(Cap 단백질과 함께 프레임 내 번역되고/되거나, Cap 단백질에 화학적으로 부착되고/되거나 Cap 단백질에 의해 표시된다). 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원은 그 측면에 제1 및/또는 제2 링커(예를 들어, 제1 및/또는 제2 아미노산 스페이서; 스페이서 각각은 적어도 1개 아미노산의 길이임)가 위치한다.
일부 구현예에서, 제1 및/또는 제2 링커는 동일하지 않다. 일부 구현예에서, 제1 및/또는 제2 링커는 각각 독립적으로 1 또는 2개의 아미노산 길이이다. 일부 구현예에서, 제1 및/또는 제2 링커는 각각 독립적으로 1, 2, 또는 3개의 아미노산 길이이다. 일부 구현예에서, 제1 및/또는 제2 링커는 각각 독립적으로 1, 2, 3, 또는 4개의 아미노산 길이이다. 일부 구현예에서, 제1 및/또는 제2 링커는 각각 독립적으로 1, 2, 3, 4, 또는 5개의 아미노산 길이이다. 일부 구현예에서, 제1 및/또는 제2 링커는 각각 독립적으로 1, 2, 3, 4, 또는 5개의 아미노산 길이이다. 일부 구현예에서, 제1 및/또는 제2 링커는 각각 독립적으로 1, 2, 3, 4, 5, 또는 6개의 아미노산 길이이다. 일부 구현예에서, 제1 및/또는 제2 링커는 각각 독립적으로 1, 2, 3, 4, 5, 6, 또는 7개의 아미노산 길이이다. 일부 구현예에서, 제1 및/또는 제2 링커는 각각 독립적으로 1, 2, 3, 4, 5, 6, 7, 또는 8개의 아미노산 길이이다. 일부 구현예에서, 제1 및/또는 제2 링커는 각각 독립적으로 1, 2, 3, 4, 5, 6, 7, 8, 또는 9개의 아미노산 길이이다. 일부 구현예에서, 제1 및/또는 제2 링커는 각각 독립적으로 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 아미노산 길이이다. 일부 구현예에서, 제1 및/또는 제2 링커는 각각 독립적으로 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 이상의 아미노산 길이이다.
일부 구현예에서, 제1 및 제2 링커는 서열 및/또는 길이가 동일하고, 각각 1개의 아미노산 길이이다. 일부 구현예에서, 제1 및 제2 링커는 길이가 동일하고, 각각 1개의 아미노산 길이이다. 일부 구현예에서, 제1 및 제2 링커는 길이가 동일하고, 각각 2개의 아미노산 길이이다. 일부 구현예에서, 제1 및 제2 링커는 길이가 동일하고, 각각 3개의 아미노산 길이이다. 일부 구현예에서, 제1 및 제2 링커는 길이가 동일하고, 각각 4개의 아미노산 길이이다(예를 들어, 링커는 GLSG(서열번호 37)임). 일부 구현예에서, 제1 및 제2 링커는 길이가 동일하고, 각각 5개의 아미노산 길이이다. 일부 구현예에서, 제1 및 제2 링커는 길이가 동일하고, 각각 5개의 아미노산 길이이다(예를 들어, 제1 및 제2 링커는 GLSGSG(서열번호 38)의 서열을 각각 포함함). 일부 구현예에서, 제1 및 제2 링커는 길이가 동일하고, 각각 7개의 아미노산 길이이다. 일부 구현예에서, 제1 및 제2 링커는 길이가 동일하고, 각각 8개의 아미노산 길이이다(예를 들어, 제1 및 제2 링커는 GLSGLSGS(서열번호 39)의 서열을 각각 포함함). 일부 구현예에서, 제1 및 제2 링커는 길이가 동일하고, 각각 9개의 아미노산 길이이다. 일부 구현예에서, 제1 및 제2 링커는 길이가 동일하고, 각각 10개의 아미노산 길이이다(예를 들어, 제1 및 제2 링커는 GLSGLSGLSG(서열번호 40) 또는 GLSGGSGLSG(서열번호 41)의 서열을 각각 포함함). 일부 구현예에서, 제1 및 제2 링커는 길이가 동일하고, 각각 10개 초과의 아미노산 길이이다.
일반적으로, (예를 들어, 특이적 결합 쌍의 제1 구성원 그 자체를 포함하거나 하나 이상의 링커와의 조합으로 포함하는 특이적 결합 쌍의 제1 구성원을 포함하는) 본원에 기술된 바와 같은 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 약 5개 아미노산 내지 약 50개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 적어도 5개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 6개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 7개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 8개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 9개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 10개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 11개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 12개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 13개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 14개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 15개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 16개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 17개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 18개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 19개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 20개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 21개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 22개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 23개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 24개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 25개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 26개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 27개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 28개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 29개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 30개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 31개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 32개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 33개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 34개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 35개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 36개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 37개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 38개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 39개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 40개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 41개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 42개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 43개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 44개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 45개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 46개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 47개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 48개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 49개 아미노산의 길이이다. 일부 구현예에서, 단백질:단백질 결합 쌍 아미노산 서열의 제1 구성원은 50개 아미노산의 길이이다.
적어도 큰 스트레치의 고도의 보존 및 밀접하게 관련된 계열 구성원 중 큰 구성원로 인해, 열거된 AAV를 제외한 AAV에 대한 상응하는 삽입 부위는 아미노산 정렬을 수행하거나 캡시드 구조를 비교함으로써 식별될 수 있다. 상이한 AAV 캡시드 단백질의 예시적인 정렬에 대해서는, 예를 들어, Rutledge 등의 문헌[(1998) J. Virol. 72:309-19]; Mietzsch 등의 문헌[(2019) Viruses 11, 362, 1-34], 및 미국 특허 제9,624,274호를 참조하고, 이들 각각은 그 전체가 참조로서 본원에 통합된다. 예를 들어, Mietzcsh 등의 (2019) 문헌은 상이한 데펜도파보바이러스의 리본의 오버레이를 도 7에서 제공하여, 가변 영역 VR I 내지 VR IX를 도시한다. 본원에 기술된 것과 같은 이러한 구조 분석, 및 서열 분석을 사용하여, 당업자는 가변 영역 내의 어떤 아미노산이 단백질:단백질 결합 쌍의 제1 구성원 및/또는 검출 가능한 표지의 삽입을 수용할 수 있는 AAV의 아미노산 서열에 상응하는지 결정할 수 있다.
일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원 및/또는 검출 가능한 표지는 AAV2 캡시드 단백질 VP1의 G453, AAV2 캡시드 단백질 VP1의 N587, AAV9 캡시드 단백질 VP1의 G453, 및 AAV9 캡시드 단백질 VP1의 A589로 이루어진 군으로부터 선택된 아미노산 위치와 상응하는 아미노산 위치 다음의 비영장류 AAV의 VP1 캡시드 단백질에 삽입된다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원 및/또는 검출 가능한 표지는 AAV2 VP1 캡시드의 N587 및 R588에 상응하는 아미노산들 사이에서 비영장류 동물 AAV의 VP1 캡시드 단백질에 삽입된다. 비영장류 동물 VP1 캡시드 단백질의 추가의 적절한 삽입 부위는 AAV2의 VP1 캡시드 단백질의 I-1, I-34, I-138, I-139, I-161, I-261, I-266, I-381, I-447, I-448, I-459, I-471, I-520, I-534, I-570, I-573, I-584, I-587, I-588, I-591, I-657, I-664, I-713, 및 I-716에 상응하는 것들을 포함한다(Wu 등의 문헌[(2000) J. Virol. 74:8635-8647]). 본원에 기술된 것과 같은 변형된 바이러스 캡시드 단백질은 I-1, I-34, I-138, I-139, I-161, I-261, I-266, I-381, I-447, I-448, I-459, I-471, I-520, I-534, I-570, I-573, I-584, I-587, I-588, I-591, I-657, I-664, I-713, I-716, 및 이들의 조합으로 이루어진 군으로부터 선택된 AAV2 캡시드 단백질의 위치와 상응하는 위치에 삽입된 단백질:단백질 결합 쌍의 제1 구성원 및/또는 검출 가능한 표지를 포함하는 비영장류 동물 캡시드 단백질일 수 있다. 비영장류 인간 AAV의 추가의 적절한 삽입 부위는 AAV1의 I-587, AAV1의 I-589, AAV3의 I-585, AAV4의 I-585, 및 AAV5의 I-585에 상응하는 것들을 포함한다. 일부 구현예에서, 본원에 기술된 것과 같은 변형된 바이러스 캡시드 단백질은 I-587(AAV1), I-589(AAV1), I-585(AAV3), I-585(AAV4), I-585(AAV5), 및 이들의 조합으로 이루어진 군으로부터 선택된 위치와 상응하는 위치에 삽입된 단백질:단백질 결합 쌍의 제1 구성원 및/또는 검출 가능한 표지를 포함하는 비영장류 동물 캡시드 단백질일 수 있다.
일부 구현예에서, 단백질:단백질 결합 쌍의 제1 구성원 및/또는 검출 가능한 표지는 다음으로 이루어진 군으로부터 선택된 아미노산 위치와 상응하는 아미노산 위치 다음의 비영장류 동물 AAV의 VP1 캡시드 단백질에 삽입된다: 조류 AAV 캡시드 단백질 VP1의 I444, 조류 AAV 캡시드 단백질 VP1의 I580, 턱수염 도마뱀 AAV 캡시드 단백질 VP1의 I573, 턱수염 도마뱀 AAV 캡시드 단백질 VP1의 I436, 바다 사자 AAV 캡시드 단백질 VP1의 I429, 바다 사자 AAV 캡시드 단백질 VP1의 I430, 바다 사자 AAV 캡시드 단백질 VP1의 I431, 바다 사자 AAV 캡시드 단백질 VP1의 I432, 바다 사자 AAV 캡시드 단백질 VP1의 I433, 바다 사자 AAV 캡시드 단백질 VP1의 I434, 바다 사자 AAV 캡시드 단백질 VP1의 I436, 바다 사자 AAV 캡시드 단백질 VP1의 I437, 및 바다 사자 AAV 캡시드 단백질 VP1의 I565.
본원에서의 명명법 I-###, I# 등은 삽입 부위(I)를 지칭하고, ###은 AAV 캡시드 단백질의 VP1 단백질에 대한 아미노산 번호를 명명하는 것이지만, 이러한 삽입은 바로 N-말단 또는 C-말단에 위치할 수 있고, 바람직하게는 주어진 아미노산의 N-말단 또는 C-말단에 있는 5개의 아미노산의 서열 중 하나의 아미노산의 C-말단에 위치할 수 있고, 바람직하게는 주어진 아미노산의 N-말단 또는 C-말단에 있는 3개, 더 바람직하게는 2개 중 하나의 아미노산, 특히 1개의 아미노산의 C-말단에 위치할 수 있다. 또한, 본원에서 언급되는 위치는 AAV 캡시드 유전자에 의해 암호화된 VP1 단백질에 상대적인 것이며, 상응하는 위치(및 이의 점 돌연변이)는 적절한 AAV 캡시드 유전자에 의해 암호화되는 VP1, VP2, 및 VP3 단백질의 서열 정렬을 수행함으로써 캡시드 유전자에 의해 암호화되는 VP2 및 VP3 캡시드 단백질에 대해 쉽게 식별될 수 있다.
따라서, cap 유전자를 이들 부위 중 하나의 코딩 핵산의 상응하는 위치에 삽입하는 것은 VP1, VP2, 및/또는 VP3에 삽입하는 결과를 초래하는데, 이는 캡시드 단백질이 엇갈린 시작 코돈과 동일한 유전자의 중첩 해독 프레임에 의해 암호화되기 때문이다. 그러므로, 예를 들어 본 명명법에 따른 AAV2의 경우, 아미노산 1과 138 사이에서의 삽입은 VP1에만 삽입되고, 138과 203 사이에서의 삽입은 VP1 및 VP2에 삽입되며, 203과 C-말단 사이에서의 삽입은 VP1, VP2, 및 VP3에 삽입되는데, 이는 삽입 부위 I-587에도 당연히 적용되는 경우이다. 따라서, 본 발명은 VP1, VP2 및/또는 VP3 단백질에 상응하는 삽입을 갖는 AAV의 구조적 유전자를 포함한다.
또한, 본 발명의 VP3 캡시드 단백질을 암호화하는 핵산이 본원에 제공된다. AAV 캡시드 단백질은, 시차를 둔 시작 코돈과 중첩되는 동일한 유전자의 중첩 판독 프레임에 의해 암호화될 수 있지만, 반드시 그렇지는 않다. 일부 구현예에서, 본 발명의 VP3 캡시드 단백질을 암호화하는 핵산은 본 발명의 VP2 캡시드 단백질 또는 VP1 캡시드 단백질도 암호화하지는 않는다. 일부 구현예에서, 본 발명의 VP3 캡시드 단백질을 암호화하는 핵산은 본 발명의 VP2 캡시드 단백질을 암호화할 수도 있지만 본 발명의 VP1 캡시드 단백질도 암호화하지는 않는다. 일부 구현예에서, 본 발명의 VP3 캡시드 단백질을 암호화하는 핵산은 본 발명의 VP2 캡시드 단백질 및 본 발명의 VP1 캡시드 단백질도 암호화할 수 있다.
일부 구현예에서, 단백질:단백질 결합 쌍의 제1 및 제2 구성원을 포함하는 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드(예를 들어, 여기서 제2 구성원은 표적화 리간드에 작동 가능하게 연결되고, 다중 특이적 결합 단백질 등을 포함함)는 특정 세포를 감염시킬 수 있고, 예를 들어, 단백질:단백질 결합 쌍의 제1 및 제2 구성원 중 어느 하나 또는 둘 모두가 결여된다는 점을 제외하고는, 변형된 바이러스 캡시드 단백질과 동일한 대조군 바이러스 캡시드의 능력과 비교하여 특이적 세포를 표적화하여 이에 결합하는 강화된 능력을 갖고, 예를 들어, 대조군 캡시드 단백질을 포함한다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 검출 불가능한 형질도입 효율과 비교하여 검출 가능한 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 10% 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 20% 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 적절한 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 30% 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 적절한 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 40% 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 적절한 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 50% 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 적절한 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 60% 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 적절한 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 70% 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 적절한 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 75% 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 적절한 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 80% 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 적절한 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 85% 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 적절한 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 캡시드의 형질도입 효율보다 90% 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 적절한 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 95% 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 99% 더 큰 형질도입 효율을 나타낸다.
일부 구현예에서, 단백질:단백질 결합 쌍의 제1 및 제2 구성원을 포함하는 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드(예를 들어, 여기서 제2 구성원은 표적화 리간드에 작동 가능하게 연결되고, 다중 특이적 결합 단백질 등을 포함함)는 특정 세포를 감염시킬 수 있고, 예를 들어, 단백질:단백질 결합 쌍의 제1 및 제2 구성원 중 어느 하나 또는 둘 모두가 결여된다는 점을 제외하고는, 변형된 바이러스 캡시드 단백질과 동일한 대조군 바이러스 캡시드의 능력과 비교하여 특이적 세포를 표적화하여 이에 결합하는 강화된 능력을 갖고, 예를 들어, 대조군 캡시드 단백질을 포함한다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 검출 불가능한 형질도입 효율과 비교하여 검출 가능한 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 10% 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 20% 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 적절한 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 30% 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 적절한 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 40% 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 적절한 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 50% 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 적절한 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 60% 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 적절한 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 70% 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 적절한 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 75% 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 적절한 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 80% 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 적절한 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 85% 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 적절한 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 캡시드의 형질도입 효율보다 90% 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 적절한 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 95% 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 99% 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 적어도 1.5배 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 적어도 2배 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 적절한 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 적어도 3배 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 적절한 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 적어도 4배 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 적절한 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 적어도 5배 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 적절한 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 적어도 6배 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 적절한 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 적어도 7배 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 적절한 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 적어도 8배 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 적절한 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 적어도 9배 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 적절한 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 적어도 10배 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 적절한 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 캡시드의 형질도입 효율보다 적어도 20배 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 적절한 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 적어도 30배 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 적어도 40배 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 적어도 50배 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 적어도 60배 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 적어도 70배 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 적어도 80배 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 본원에 기술된 바와 같이, 표적화 리간드에 연결된 단백질:단백질 결합 쌍의 제1 및 제2 구성원에 결합된 변형된 바이러스 캡시드 단백질을 포함하는 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 적어도 90배 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 단백질:단백질 결합 쌍의 제1 및 제2 구성원에 결합된 본원에 기술된 바와 같은 변형된 바이러스 캡시드 단백질을 포함하고 표적화 리간드에 연결된 바이러스 캡시드는 대조군 바이러스 캡시드의 형질도입 효율보다 적어도 100배 더 큰 형질도입 효율을 나타낸다. 일부 구현예에서, 비영장류 동물 AAV, 원격 AAV, 또는 이들의 조합의 캡시드 단백질의 아미노산 서열을 포함하는 바이러스 캡시드 단백질을 포함하고, 임의로 단백질:단백질 결합 쌍의 제1 및 제2 구성원을 포함하는(예를 들어, 제2 구성원은 다중특이적 결합 단백질 등을 포함하는 표적화 리간드에 작동 가능하게 연결됨) 본 발명의 바이러스 입자는, 임의로 단백질:단백질 결합 쌍의 제1 및 제2 구성원을 또한 포함하는(예를 들어, 제2 구성원은 다중특이적 결합 단백질 등을 포함하는 표적화 리간드에 작동 가능하게 연결됨) 적절한 대조군 바이러스 입자(예를 들어, 본 발명의 바이러스 캡시드에 일부가 포함된 AAV 혈청형의 바이러스 캡시드를, 예를 들어, 비영장류 동물 AAV, 원격 AAV, 또는 이들의 조합의 캡시드 단백질의 아미노산 서열을 포함하는 바이러스 캡시드 단백질의 일부로서 포함함)와 비교해, 인간 환자로부터 단리한 기존 항체에 의한 중화를 더 잘 회피할 수 있다. 일부 구현예에서, 비영장류 동물 AAV, 원격 AAV, 또는 이들의 조합의 캡시드 단백질의 아미노산 서열을 포함하는 바이러스 캡시드 단백질을 포함하는 본 발명의 바이러스 입자는, 적절한 대조군 바이러스 입자(예를 들어, 본 발명의 바이러스 입자는 대조군 바이러스 입자의 IC50 값의 적어도 2배인 IC50 값을 가짐)와 비교해 중화를 위해 적어도 2배 더 많은 총 IVIG 또는 IgG(예를 들어, 50% 이상의 감염 억제)를 필요로 한다.
일부 구현예에서, 비영장류 동물 AAV, 원격 AAV, 또는 이들의 조합의 캡시드 단백질의 아미노산 서열을 포함하는 바이러스 캡시드 단백질을 포함하는 본 발명의 바이러스 입자는, 적절한 대조군 바이러스 입자(예를 들어, 본 발명의 바이러스 입자는 대조군 바이러스 입자의 IC50 값의 적어도 3배인 IC50 값을 가짐)와 비교해 중화를 위해 적어도 3배 더 많은 총 IVIG 또는 IgG(예를 들어, 50% 이상의 감염 억제)를 필요로 한다. 일부 구현예에서, 비영장류 동물 AAV, 원격 AAV, 또는 이들의 조합의 캡시드 단백질의 아미노산 서열을 포함하는 바이러스 캡시드 단백질을 포함하는 본 발명의 바이러스 입자는, 적절한 대조군 바이러스 입자(예를 들어, 본 발명의 바이러스 입자는 대조군 바이러스 입자의 IC50 값의 적어도 4배인 IC50 값을 가짐)와 비교해 중화를 위해 적어도 4배 더 많은 총 IVIG 또는 IgG(예를 들어, 50% 이상의 감염 억제)를 필요로 한다. 일부 구현예에서, 비영장류 동물 AAV, 원격 AAV, 또는 이들의 조합의 캡시드 단백질의 아미노산 서열을 포함하는 바이러스 캡시드 단백질을 포함하는 본 발명의 바이러스 입자는, 적절한 대조군 바이러스 입자(예를 들어, 본 발명의 바이러스 입자는 대조군 바이러스 입자의 IC50 값의 적어도 5배인 IC50 값을 가짐)와 비교해 중화를 위해 적어도 5배 더 많은 총 IVIG 또는 IgG(예를 들어, 50% 이상의 감염 억제)를 필요로 한다. 일부 구현예에서, 비영장류 동물 AAV, 원격 AAV, 또는 이들의 조합의 캡시드 단백질의 아미노산 서열을 포함하는 바이러스 캡시드 단백질을 포함하는 본 발명의 바이러스 입자는, 적절한 대조군 바이러스 입자(예를 들어, 본 발명의 바이러스 입자는 대조군 바이러스 입자의 IC50 값의 적어도 6배인 IC50 값을 가짐)와 비교해 중화를 위해 적어도 6배 더 많은 총 IVIG 또는 IgG(예를 들어, 50% 이상의 감염 억제)를 필요로 한다. 일부 구현예에서, 비영장류 동물 AAV, 원격 AAV, 또는 이들의 조합의 캡시드 단백질의 아미노산 서열을 포함하는 바이러스 캡시드 단백질을 포함하는 본 발명의 바이러스 입자는, 적절한 대조군 바이러스 입자에 비해 중화(예를 들어, 50% 이상의 감염 억제)를 위해 적어도 7배 더 많은 총 IVIG 또는 IgG를 필요로 한다(예를 들어, 본 발명의 바이러스 입자는 대조군 바이러스 입자의 IC50 값의 적어도 7배인 IC50 값을 가짐). 일부 구현예에서, 비영장류 동물 AAV, 원격 AAV, 또는 이들의 조합의 캡시드 단백질의 아미노산 서열을 포함하는 바이러스 캡시드 단백질을 포함하는 본 발명의 바이러스 입자는, 적절한 대조군 바이러스 입자에 비해 중화(예를 들어, 50% 이상의 감염 억제)를 위해 적어도 8배 더 많은 총 IVIG 또는 IgG를 필요로 한다(예를 들어, 본 발명의 바이러스 입자는 대조군 바이러스 입자의 IC50 값의 적어도 8배인 IC50 값을 가짐). 일부 구현예에서, 비영장류 동물 AAV, 원격 AAV, 또는 이들의 조합의 캡시드 단백질의 아미노산 서열을 포함하는 바이러스 캡시드 단백질을 포함하는 본 발명의 바이러스 입자는, 적절한 대조군 바이러스 입자에 비해 중화(예를 들어, 50% 이상의 감염 억제)를 위해 적어도 9배 더 많은 총 IVIG 또는 IgG를 필요로 한다(예를 들어, 본 발명의 바이러스 입자는 대조군 바이러스 입자의 IC50 값의 적어도 9배인 IC50 값을 가짐). 일부 구현예에서, 비영장류 동물 AAV, 원격 AAV, 또는 이들의 조합의 캡시드 단백질의 아미노산 서열을 포함하는 바이러스 캡시드 단백질을 포함하는 본 발명의 바이러스 입자는, 적절한 대조군 바이러스 입자에 비해 중화(예를 들어, 50% 이상의 감염 억제)를 위해 적어도 10배 더 많은 총 IVIG 또는 IgG를 필요로 한다(예를 들어, 본 발명의 바이러스 입자는 대조군 바이러스 입자의 IC50 값의 적어도 10배인 IC50 값을 가짐). 일부 구현예에서, 비영장류 동물 AAV, 원격 AAV, 또는 이들의 조합의 캡시드 단백질의 아미노산 서열을 포함하는 바이러스 캡시드 단백질을 포함하는 본 발명의 바이러스 입자는, 적절한 대조군 바이러스 입자에 비해 중화(예를 들어, 50% 이상의 감염 억제)를 위해 적어도 20배 더 많은 총 IVIG 또는 IgG를 필요로 한다(예를 들어, 본 발명의 바이러스 입자는 대조군 바이러스 입자의 IC50 값의 적어도 20배인 IC50 값을 가짐). 일부 구현예에서, 비영장류 동물 AAV, 원격 AAV, 또는 이들의 조합의 캡시드 단백질의 아미노산 서열을 포함하는 바이러스 캡시드 단백질을 포함하는 본 발명의 바이러스 입자는, 적절한 대조군 바이러스 입자에 비해 중화(예를 들어, 50% 이상의 감염 억제)를 위해 적어도 30배 더 많은 총 IVIG 또는 IgG를 필요로 한다(예를 들어, 본 발명의 바이러스 입자는 대조군 바이러스 입자의 IC50 값의 적어도 30배인 IC50 값을 가짐). 일부 구현예에서, 비영장류 동물 AAV, 원격 AAV, 또는 이들의 조합의 캡시드 단백질의 아미노산 서열을 포함하는 바이러스 캡시드 단백질을 포함하는 본 발명의 바이러스 입자는, 적절한 대조군 바이러스 입자에 비해 중화(예를 들어, 50% 이상의 감염 억제)를 위해 적어도 40배 더 많은 총 IVIG 또는 IgG를 필요로 한다(예를 들어, 본 발명의 바이러스 입자는 대조군 바이러스 입자의 IC50 값의 적어도 40배인 IC50 값을 가짐). 일부 구현예에서, 비영장류 동물 AAV, 원격 AAV, 또는 이들의 조합의 캡시드 단백질의 아미노산 서열을 포함하는 바이러스 캡시드 단백질을 포함하는 본 발명의 바이러스 입자는, 적절한 대조군 바이러스 입자에 비해 중화(예를 들어, 50% 이상의 감염 억제)를 위해 적어도 50배 더 많은 총 IVIG 또는 IgG를 필요로 한다(예를 들어, 본 발명의 바이러스 입자는 대조군 바이러스 입자의 IC50 값의 적어도 50배인 IC50 값을 가짐). 일부 구현예에서, 비영장류 동물 AAV, 원격 AAV, 또는 이들의 조합의 캡시드 단백질의 아미노산 서열을 포함하는 바이러스 캡시드 단백질을 포함하는 본 발명의 바이러스 입자는, 적절한 대조군 바이러스 입자에 비해 중화(예를 들어, 50% 이상의 감염 억제)를 위해 적어도 60배 더 많은 총 IVIG 또는 IgG를 필요로 한다(예를 들어, 본 발명의 바이러스 입자는 대조군 바이러스 입자의 IC50 값의 적어도 60배인 IC50 값을 가짐). 일부 구현예에서, 비영장류 동물 AAV, 원격 AAV, 또는 이들의 조합의 캡시드 단백질의 아미노산 서열을 포함하는 바이러스 캡시드 단백질을 포함하는 본 발명의 바이러스 입자는, 적절한 대조군 바이러스 입자에 비해 중화(예를 들어, 50% 이상의 감염 억제)를 위해 적어도 70배 더 많은 총 IVIG 또는 IgG를 필요로 한다(예를 들어, 본 발명의 바이러스 입자는 대조군 바이러스 입자의 IC50 값의 적어도 70배인 IC50 값을 가짐). 일부 구현예에서, 비영장류 동물 AAV, 원격 AAV, 또는 이들의 조합의 캡시드 단백질의 아미노산 서열을 포함하는 바이러스 캡시드 단백질을 포함하는 본 발명의 바이러스 입자는, 적절한 대조군 바이러스 입자에 비해 중화(예를 들어, 50% 이상의 감염 억제)를 위해 적어도 80배 더 많은 총 IVIG 또는 IgG를 필요로 한다(예를 들어, 본 발명의 바이러스 입자는 대조군 바이러스 입자의 IC50 값의 적어도 80배인 IC50 값을 가짐). 일부 구현예에서, 비영장류 동물 AAV, 원격 AAV, 또는 이들의 조합의 캡시드 단백질의 아미노산 서열을 포함하는 바이러스 캡시드 단백질을 포함하는 본 발명의 바이러스 입자는, 적절한 대조군 바이러스 입자에 비해 중화(예를 들어, 50% 이상의 감염 억제)를 위해 적어도 90배 더 많은 총 IVIG 또는 IgG를 필요로 한다(예를 들어, 본 발명의 바이러스 입자는 대조군 바이러스 입자의 IC50 값의 적어도 90배인 IC50 값을 가짐). 일부 구현예에서, 비영장류 동물 AAV, 원격 AAV, 또는 이들의 조합의 캡시드 단백질의 아미노산 서열을 포함하는 바이러스 캡시드 단백질을 포함하는 본 발명의 바이러스 입자는, 적절한 대조군 바이러스 입자에 비해 중화(예를 들어, 50% 이상의 감염 억제)를 위해 적어도 100배 더 많은 총 IVIG 또는 IgG를 필요로 한다(예를 들어, 본 발명의 바이러스 입자는 대조군 바이러스 입자의 IC50 값의 적어도 100배인 IC50 값을 가짐). 일부 구현예에서, 비영장류 동물 AAV, 원격 AAV, 또는 이들의 조합의 캡시드 단백질의 아미노산 서열을 포함하는 바이러스 캡시드 단백질을 포함하는 본 발명의 바이러스 입자는, 적어도 100; 10,000; 20,000; 30,000; 40,000; 50,000; 또는 그 이상의 인간 공여자로부터 풀링된 인간 혈청 Ig와 함께 인큐베이션할 때 검출할 수 없는 IC50을 갖는다.
표적화 리간드
본원에 기술된 바이러스 입자는 표적화 리간드를 추가로 포함할 수 있다.
검출 가능한 표지를 포함하는 본 발명의 일부 구현예에서, 표적화 리간드는, (i) 검출 가능한 표지에 특이적으로 결합하는 항체 파라토프 및 (ii) (예를 들어, 정제를 위해) 비드의 표면에 접합되거나 표적 세포에 의해 발현될 수 있는 수용체에 특이적으로 결합하는 제2 결합 도메인을 포함하는 다중특이적 결합 분자를 포함한다. 따라서, (i) 검출 가능한 표지에 특이적으로 결합하는 항체 파라토프 및 (ii) 수용체에 특이적으로 결합하는 제2 결합 도메인을 포함하는 다중특이적 결합 분자는 바이러스 입자를 표적화한다. 이러한 "표적화(targeting)" 또는 "유도(directing)"는, 야생형 바이러스 입자가 조직 내의 여러 개의 세포 및/또는 유기체 내의 여러 개의 기관를 표적화하고, 조직 또는 기관의 광범위한 표적화는 검출 가능한 표지의 삽입에 의해 감소 내지는 제거되며, 조직 내의 보다 특이적인 세포 또는 유기체 내의 보다 특이적인 기관에 대한 재 표적화는 다중특이적 결합 분자로 달성된다는 시나리오를 포함할 수 있다. 이러한 재표적화 또는 재유도는, 야생형 바이러스 입자가 조직을 표적화하고, 조직을 표적화하는 것은 검출 가능한 표지의 삽입에 의해 감소 내지는 제거되고, 완전히 다른 조직에 대한 재표적화는 다중특이적 결합 분자로 달성된다는 시나리오를 포함할 수도 있다. 본원에 기술된 바와 같은 항체 파라토프는 일반적으로 검출 가능한 표지를 특이적으로 인식하는 상보성 결정 영역(CDR), 예를 들어, 중쇄 및/또는 경쇄 가변 도메인의 CDR3 영역을 최소한으로 포함한다. 일부 구현예에서, 다중특이적 결합 분자는 검출 가능한 표지에 특이적으로 결합하는 항체 파라토프를 포함하는 항체(또는 이의 일부분)를 포함한다. 예를 들어, 다중특이적 결합 분자는 단일 도메인 중쇄 가변 영역 또는 단일 도메인 경쇄 가변 영역을 포함할 수 있으며, 여기서 단일 도메인 중쇄 가변 영역 또는 단일 도메인 경쇄 가변 영역은 검출 가능한 표지에 특이적으로 결합하는 항체 파라토프를 포함한다. 일부 구현예에서, 다중특이적 결합 분자는 Fv 영역을 포함할 수 있으며, 예를 들어, 다중특이적 결합 분자는 검출 가능한 표지에 특이적으로 결합하는 항체 파라토프를 포함하는 scFv를 포함할 수 있다. 일부 구현예에서, 본원에 기술된 바와 같은 다중특이적 결합 분자는 c-myc(서열번호 44)에 특이적으로 결합하는 항체 파라토프를 포함한다.
본 발명의 일 구현예는 본 발명의 변형된 바이러스 캡시드 단백질을 포함하는 다량체 구조이다. 다량체 구조는 본원에 기술된 바와 같은 특이적 결합 쌍의 제1 구성원을 포함하는 적어도 5개, 바람직하게는 적어도 10개, 더 바람직하게는 적어도 30개, 가장 바람직하게는 적어도 60개의 변형된 바이러스 캡시드 단백질을 포함한다. 이들은 규칙적인 바이러스 캡시드(공 바이러스 입자) 또는 바이러스 입자(관심 뉴클레오티드를 캡시드화하는 캡시드)를 형성할 수 있다. 바이러스 게놈을 포함하는 바이러스 입자의 형성은 본원에 기술된 변형된 바이러스 캡시드의 사용에 매우 바람직한 특징이다.
본 발명의 추가 구현예는 적어도 하나의 변형된 바이러스 캡시드 단백질 및/또는 이를 암호화하는 핵산의 용도, 바람직하게는 관심 뉴클레이티드의 제조, 및 관심 뉴클레오티드를 표적 세포에 전달하는 데 사용하기 위한 적어도 하나의 다량체 구조(예를 들어, 바이러스 입자)의 용도이다.
사용 방법 및 제조 방법
본원에 기술된 변형된 바이러스 캡시드 단백질의 추가 구현예는, 관심 뉴클레오티드(예: 리포터 유전자 또는 치료 유전자)를 표적 세포에 전달하기 위한 이들의 용도이다. 일반적으로, 관심 뉴클레오티드는 전달 플라스미드일 수 있으며, 이는 일반적으로, (AAV 입자 내에 포함될 때, 바이러스 또는 비바이러스 프로모터에 의해 조절될 수 있는) 리포터 유전자(들) 또는 치료 유전자(들)의 측면에 위치하는 5' 및 3' 역위 말단 반복(ITR) 서열을 포함할 수 있다. 일 구현예에서, 관심 뉴클레오티드는 5'에서 3' 방향으로 5' ITR, 프로모터, 유전자(예: 리포터 및/또는 치료 유전자), 및 3' ITR을 포함하는 전달 플라스미드이다.
유용한 프로모터의 비-제한적인 실시예는, 예를 들어, 사이토메갈로바이러스(CMV)-프로모터, 비장 병소 형성 바이러스(SFFV)-프로모터, 전사 신장 인자 1 알파(EF1a)-프로모터(1.2 kb EFla-프로모터 또는 0.2 kb EFla-프로모터), 키메라 EF 1 a/IF4-프로모터, 및 포스포-글리세린산 키나아제(PGK)-프로모터를 포함한다. 관심 유전자의 발현을 증가시키기 위해 바이러스 작제물 내에 내부 인핸서가 존재할 수도 있다. 예를 들어, CMV 인핸서(Karasuyama 등의 문헌[1989. J. Exp. Med. 169:13]을 참조하고; 그 전체는 참조로서 본원에 통합됨)가 사용될 수 있다. 일부 구현예에서, CMV 인핸서는 닭 β-액틴 프로모터와 조합하여 사용될 수 있다.
다양한 리포터 유전자(또는 검출 가능한 모이어티)는 본원에 기술된 변형된 바이러스 캡시드 단백질을 포함하는 다량체 구조 내에 캡슐화될 수 있다. 예시적인 리포터 유전자는, 예를 들어, β-갈락토시다아제(암호화된 lacZ 유전자), 녹색 형광 단백질(Green Fluorescent Protein; GFP), 강화된 녹색 형광 단백질(eGFP), MmGFP, 청색 형광 단백질(BFP), 강화된 청색 형광 단백질(eBFP), mPlum, mCherry, tdTomato, mStrawberry, J-Red, DsRed, mOrange, mKO, mCitrine, Venus, YPet, 황색 형광 단백질(YFP), 강화된 황색 형광 단백질(eYFP), 에머랄드(Emerald), CyPet, 홍색 형광 단백질(CFP), 진청색(Cerulean), T-Sapphire, 루시퍼라제(luciferase), 알칼리 포스파타아제(alkaline phosphatase), 또는 이들의 조합을 포함한다. 본원에 기술된 방법은, 녹색 형광 단백질을 암호화하는 리포터 유전자를 사용해 표적화 입자를 작제하는 것을 보여주지만, 본 개시를 읽음으로써 당업자는 본원에 기술된 바이러스 캡시드가 리포터 유전자 없이 또는 당업계에 알려진 임의의 리포터 유전자를 사용해 생성될 수 있다는 것을 이해할 것이다.
다양한 치료 유전자가 본원에 기술된 변형된 바이러스 캡시드 단백질을 포함하는 다량체 구조에, 예를 들어 전달 입자의 일부로서 캡슐화될 수도 있다. 치료 유전자의 비-제한적인 실시예는 독소(예를 들어, 자살 유전자), 치료 항체 또는 이의 단편, CRISPR/Cas 시스템 또는 이의 일부분(들), 안티센스 RNA, siRNA, shRNA 등을 암호화하는 것들을 포함한다.
본 발명의 추가 구현예는 변형된 캡시드 단백질의 제조 방법으로서, 상기 방법은:
a) 적절한 조건 하에서 변형된 캡시드 단백질을 암호화하는 핵산을 발현시키는 단계, 및
b) 단계 a)의 발현된 캡시드 단백질을 단리하는 단계를 포함한다.
일부 구현예에서, 본원에 기술된 바와 같은 바이러스 입자는 모자이크 캡시드, 예를들어, 본원에 기술된 바와 같이 유전적으로 변형된 캡시드 단백질을 포함하는 캡시드를 (표적화 리간드와 공유 결합의 부재 또는 존재 시) 기준 캡시드 단백질과 함께 특정 비율로 포함한다. 이러한 모자이크 바이러스 입자를 제조하는 방법은:
a) 적절한 조건 하에서, 변형된 캡시드 단백질을 암호화하는 핵산 및 기준 캡시드 단백질을 암호화하는 뉴클레오티드를 적어도 약 60:1 내지 약 1:60, 예를 들어, 2:1, 1:1, 3:5, 1:2, 1:3 등의 비율(wt/wt)로 발현시키는 단계, 및
b) 단계 a)의 발현된 캡시드 단백질을 단리하는 단계를 포함한다.
일부 구현예에서, 본원에 기술된 조성물, 또는 본원에 기술된 방법은 변형된 cap 유전자:기준 cap 유전자(또는 기준 cap 유전자의 조합)를 적어도 약 1:60 내지 약 60:1의 범위의 비율로, 예를 들어, 2:1, 1:1, 3:5, 1:2, 1:3 등의 비율로 조합한다. 일부 구현예에서, 비율은 적어도 약 1:2이다. 일부 구현예에서, 비율은 적어도 약 1:3이다. 일부 구현예에서, 비율은 적어도 약 1:4이다. 일부 구현예에서, 비율은 적어도 약 1:5이다. 일부 구현예에서, 비율은 적어도 약 1:6이다. 일부 구현예에서, 비율은 적어도 약 1:7이다. 일부 구현예에서, 비율은 적어도 약 1:8이다. 일부 구현예에서, 비율은 적어도 약 1:9이다. 일부 구현예에서, 비율은 적어도 약 1:10이다. 일부 구현예에서, 비율은 적어도 약 1:11이다. 일부 구현예에서, 비율은 적어도 약 1:12이다. 일부 구현예에서, 비율은 적어도 약 1:13이다. 일부 구현예에서, 비율은 적어도 약 1:14이다. 일부 구현예에서, 비율은 적어도 약 1:15이다. 일부 구현예에서, 비율은 적어도 약 1:16이다. 일부 구현예에서, 비율은 적어도 약 1:17이다. 일부 구현예에서, 비율은 적어도 약 1:18이다. 일부 구현예에서, 비율은 적어도 약 1:19이다. 일부 구현예에서, 비율은 적어도 약 1:20이다. 일부 구현예에서, 비율은 적어도 약 1:25이다. 일부 구현예에서, 비율은 적어도 약 1:30이다. 일부 구현예에서, 비율은 적어도 약 1:35이다. 일부 구현예에서, 비율은 적어도 약 1:40이다. 일부 구현예에서, 비율은 적어도 약 1:45이다. 일부 구현예에서, 비율은 적어도 약 1:50이다. 일부 구현예에서, 비율은 적어도 약 1:55이다. 일부 구현예에서, 비율은 적어도 약 1:60이다. 일부 구현예에서, 비율은 적어도 약 2:1이다. 일부 구현예에서, 비율은 적어도 약 3:1이다. 일부 구현예에서, 비율은 적어도 약 4:1이다. 일부 구현예에서, 비율은 적어도 약 5:1이다. 일부 구현예에서, 비율은 적어도 약 6:1이다. 일부 구현예에서, 비율은 적어도 약 7:1이다. 일부 구현예에서, 비율은 적어도 약 8:1이다. 일부 구현예에서, 비율은 적어도 약 9:1이다. 일부 구현예에서, 비율은 적어도 약 10:1이다. 일부 구현예에서, 비율은 적어도 약 11:1이다. 일부 구현예에서, 비율은 적어도 약 12:1이다. 일부 구현예에서, 비율은 적어도 약 13:1이다. 일부 구현예에서, 비율은 적어도 약 14:1이다. 일부 구현예에서, 비율은 적어도 약 15:1이다. 일부 구현예에서, 비율은 적어도 약 16:1이다. 일부 구현예에서, 비율은 적어도 약 17:1이다. 일부 구현예에서, 비율은 적어도 약 18:1이다. 일부 구현예에서, 비율은 적어도 약 19:1이다. 일부 구현예에서, 비율은 적어도 약 20:1이다. 일부 구현예에서, 비율은 적어도 약 25:1이다. 일부 구현예에서, 비율은 적어도 약 30:1이다. 일부 구현예에서, 비율은 적어도 약 35:1이다. 일부 구현예에서, 비율은 적어도 약 40:1이다. 일부 구현예에서, 비율은 적어도 약 45:1이다. 일부 구현예에서, 비율은 적어도 약 50:1이다. 일부 구현예에서, 비율은 적어도 약 55:1이다. 일부 구현예에서, 비율은 적어도 약 60:1이다.
일부 구현예에서, 모자이크 바이러스 입자 내의 VP 단백질 서브유닛 비율은, 변형된 cap 유전자:기준 cap 유전자의 비율을 화학량론적으로 반영할 수 있지만, 반드시 그렇지는 않다. 비제한적인 예시적인 구현예로서, 상기 방법에 따라 형성된 모자이크 캡시드는 모자이크 캡시드를 생산하는 데 사용된 변형된 캡시드 단백질을 암호화하는 핵산의 비율(wt:wt)과 유사한 변형된 캡시드 단백질:기준 캡시드 단백질 비율을 갖는 것으로 간주될 수 있지만, 반드시 그렇지는 않다. 일부 구현예에서, 모자이크 캡시드는 약 1:59 내지 약 59:1의 단백질 서브유닛 비율을 포함한다.
본 발명의 추가 구현예는 바이러스의 향성을 변경시키는 방법으로서, 상기 방법은: (a) 아미노산 서열을 암호화하는 핵산을 바이러스 캡시드 단백질을 암호화하는 핵산 서열에 삽입하여 아미노산 서열을 포함하는 유전적으로 변형된 캡시드 단백질을 암호화하는 뉴클레오티드 서열을 형성하는 단계 및/또는 (b) 바이러스 입자를 생산하기에 충분한 조건에서 포장 세포를 인큐베이션하는 단계를 포함하며, 여기서 포장 세포는 핵산을 포함한다. 본 발명의 추가 구현예는 캡시드 단백질의 표면에 표적 리간드를 제시하는 방법으로서, 상기 방법은: (a) 적합한 조건 하에서 본원에 기술된 바와 같이 변형된 바이러스 캡시드 단백질을 암호화하는 핵산(및 임의로는 기준 캡시드 단백질을 암호화하는 뉴클레오티드)을 발현시키는 단계(여기서 핵산은 특이적 결합 쌍의 제1 구성원을 포함하는 캡시드 단백질을 암호화함), (b) 단계 (a)의 특이적 결합 쌍의 제1 구성원 또는 그를 포함하는 캡시드를 포함하는 발현된 캡시드 단백질을 단리하는 단계, 및 (c) 제1 및 제2 구성원 사이에 이소펩티드 결합의 형성을 허용하는 적절한 조건 하에서 특이적 결합 쌍의 제2 동족 구성원을 가진 캡시드 단백질 또는 캡시드를 인큐베이팅하는 단계를 포함하며, 여기서 특이적 결합 쌍의 제2 동족 구성원은 표적화 리간드와 융합된다.
일부 구현예에서, 포장 세포는 관심 뉴클레오티드를 포함하는 헬퍼 플라스미드 및/또는 전달 플라스미드를 추가로 포함한다. 일부 구현예에서, 상기 방법은 배양 상청액으로부터 자기-상보성 아데노-연관 바이러스 입자를 단리시키는 단계를 추가로 포함한다. 일부 구현예에서, 상기 방법은 포장 세포를 용해시키고 세포 용해물로부터 단일-가닥 아데노-연관 바이러스 입자를 단리하는 단계를 추가로 포함한다. 일부 구현예에서, 상기 방법은 (a) 세포 찌꺼기를 제거하는 단계, (b) 바이러스 입자를 함유하는 상청액을 핵산 분해 효소(예를 들어, DNase I) 및 MgCl2로 처리하는 단계, (c) 바이러스 입자를 농축시키는 단계, (d) 바이러스 입자를 정제하는 단계, 및 (e) (a) 내지 (d)의 임의의 조합을 추가로 포함한다.
본원에 기술된 바이러스 입자의 생산에 유용한 포장 세포는, 예를 들어, 바이러스를 허용하는 동물 세포, 또는 바이러스를 허용하도록 변형된 세포; 또는, 예를 들어, 인산칼슘과 같은 형질전환제를 사용하는 포장 세포 작제물을 포함한다. 본원에 기술된 바이러스 입자를 생산하는 데 유용한 포장 세포주의 비제한적인 예는, 예를 들어, 인간 배아 신장 293(HEK-293) 세포(예를 들어, American Type Culture Collection[ATCC] 번호 CRL-1573), SV40 큰 T-항원을 함유하는 HEK-293 세포(HEK-293T 또는 293T), HEK293T/17 세포, 인간 육종 세포주 HT-1080(CCL-121), 림프아세포-유사 세포주 Raji(CCL-86), 교아세포종-성상세포종 상피-유사 세포주 U87-MG(HTB-14), T-림프종 세포주 HuT78(TIB-161), NIH/3T3 세포, 차이니즈 햄스터 난소 세포(CHO)(예: ATCC 번호 CRL9618, CCL61, CRL9096), HeLa 세포(예: ATCC 번호 CCL-2), 베로 세포, NIH 3T3 세포(예: ATCC 번호 CRL-1658), Huh-7 세포, BHK 세포(예: ATCC 번호 CCL10), PC12 세포(ATCC 번호 CRL1721), COS 세포, COS-7 세포(ATCC 번호 CRL1651), RATI 세포, 마우스 L 세포(ATCC 번호 CCLI.3), HLHepG2 세포, CAP 세포, CAP-T 세포 등을 포함한다.
Cosset 등의 (1995) J Virol 69,7430-7436에서 개략적으로 서술된 FLY 바이러스 포장 세포 시스템인 L929 세포는 NS0 (쥐 골수종) 세포, 인간 양수 세포(예: CAP, CAP-T), 효모 세포(S. 세레비시애, 피히시아 파스토스), 식물 세포(예를 들어, 이에 한정되지 않지만, S. 세레비시에, 피치아 파스토리스를 포함하되 이들로 한정되지 않음), 식물 세포(담배 NTI, BY-2를 포함하되 이들로 한정되지 않음), 곤충 세포(SF9, S2, SF21, Tni (예: High 5)를 포함하되 이들르 한정되지 않음), 또는 박테리아 세포(대장균을 포함하되 이들로 한정되지 않음)를 포함한다.
추가적인 포장 세포 및 시스템, 핵산 게놈을 위형화된 바이러스 입자 내에 포장하기 위한 포장 기술 및 입자에 대해서는, 예를 들어, Polo 등의 문헌[Proc Natl Acad Sci USA, (1999) 96:4598-4603]을 참조한다. 포장 방법은 바이러스 성분을 영구적으로 발현하는 포장 세포를 사용하는 단계, 또는 세포를 플라스미드로 일시적으로 형질감염시키는 단계를 포함한다.
추가의 구현예는 표적 세포에 바이러스를 재유도하고/하거나 리포터 또는 치료 유전자를 표적 세포에 전달하는 방법을 포함하며, 상기 방법은 세포를 시험관 내에서 (예를 들어, 생체 외에서) 또는 생체 내에서 형질도입하는 방법을 포함하고, 상기 방법은: 본원에 기술된 캡시드를 포함하는 바이러스 입자와 표적 세포를 접촉시키는 단계를 포함하며, 여기서 캡시드는 표적 세포에 의해 발현된 수용체에 특이적으로 결합하는 표적화 리간드를 포함한다. 일부 구현예에서, 표적 세포는 시험관 내(예를 들어, 생체 외)에 있다. 다른 구현예에서, 표적 세포는 대상체, 예를 들어, 인간의 생체 내에 있다.
표적 세포
매우 다양한 세포가 본원에 개시된 바와 같은 변형된 바이러스 입자를 사용해 관심 뉴클레오티드를 전달하도록 표적화될 수 있다. 표적 세포는 일반적으로 관심 뉴클레오티드 및 원하는 효과를 기준으로 선택되게 된다.
일부 구현예에서, 관심 뉴클레오티드가 전달되어 표적 세포가 효소 결핍이나 면역 결핍(예: X-염색체 관련 중증 복합 면역결핍)과 같은 결핍을 보전하기 위한 단백질을 유기체에서 생산하게 할 수 있다. 따라서, 일부 구현예에서, 동물에서 단백질을 정상적으로 생산하게 되는 세포가 표적화된다. 다른 구현예에서, 단백질이 가장 유익한 영역 내의 세포가 표적화된다.
다른 구현예에서, siRNA를 암호화하는 유전자와 같은 관심 뉴클레오티드는 표적 세포에서 특정 유전자의 발현을 억제할 수 있다. 관심 뉴클레오티드는, 예를 들어, 병원체 수명 주기에 관여하는 유전자의 발현을 억제할 수 있다. 따라서, 병원균에 쉽게 감염될 수 있는 세포 또는 병원균에 감염된 세포가 표적화될 수 있다. 다른 구현예에서, 관심 뉴클레오티드는 표적 세포에서 독소의 생산을 담당하는 유전자의 발현을 억제할 수 있다.
다른 구현예에서, 관심 뉴클레오티드는 독성 단백질을 발현한 세포를 죽이는 독성 단백질을 암호화할 수 있다. 이 경우, 종양 세포 또는 다른 원하지 않는 세포가 표적화될 수 있다.
또 다른 실시예에서, 치료 단백질을 암호화하는 관심 뉴클레오티드가 있다.
관심 뉴클레오티드의 발현이 요구되는 표적 세포의 특정 집단이 식별된 경우, 표적 세포의 해당 집단에서 특이적으로 발현되는 표적 수용체가 선택된다. 표적 수용체는 해당 세포 집단에서만 배타적으로 발현되거나, 다른 세포 집단에서보다 더 큰 정도로 해당 세포에서 발현될 수 있다. 발현이 더 특이적일수록, 더 특이적인 전달이 표적 세포로 유도될 수 있다. 상황에 따라, 마커의 원하는 특이성의 양(따라서, 원하는 유전자 전달의 양)은 달라질 수 있다. 예를 들어, 독성 유전자를 도입하는 경우, 비-표적화된 세포를 죽이지 않도록 높은 특이성이 가장 바람직하다. 전체적인 충격이 요구되는 수확용 단백질의 발현 또는 분비 산물의 발현의 경우, 더 낮은 마커 특이성이 필요할 수 있다.
위에서 논의된 바와 같이, 표적 수용체는 표적화 리간드가 식별되거나 생성될 수 있는 임의의 수용체일 수 있다. 바람직하게는 표적 수용체는 수용체와 같은 펩티드 또는 폴리펩티드이다. 그러나, 다른 구현예에서, 표적 수용체는 결합 파트너에 의해 인식될 수 있는 탄수화물 또는 다른 분자일 수 있다. 표적 수용체의 결합 파트너(예: 리간드)가 이미 알려져 있는 경우, 이를 친화도 분자로서 사용할 수 있다. 그러나, 결합 분자가 알려지지 않은 경우, 표준 절차를 사용해 표적 수용체에 대한 항체를 생성할 수 있다. 이어서, 항체는 표적화 리간드로서 사용될 수 있다.
따라서, 표적 세포는, 예를 들어, (1) 응용 분야(예: 치료, 수집될 단백질의 발현, 및 질병 내성의 부여) 및 (2) 원하는 양의 특이성을 갖는 마커의 발현을 포함하는 다양한 인자에 기초하여 선택될 수 있다.
표적 세포는 어떤 식으로도 제한되지 않으며, 생식선 세포와 세포주 및 체세포와 세포주 둘 다를 포함한다. 표적 세포는 둘 중 어느 하나의 기원으로부터 유래된 줄기 세포일 수 있다. 표적 세포가 생식선 세포인 경우, 표적 세포는 바람직하게는 단일 세포 배아 및 배아 줄기 세포(ES)로 이루어진 군으로부터 선택된다.
약학적 조성물, 투여 형태, 및 투여
추가적인 실시예는 본 발명에 따른 적어도 하나의 변형된 바이러스 캡시드 단백질 및 적절한 표적화 리간드 및/또는 본 발명에 따른 핵산을 포함하는 의약을 제공한다. 바람직하게는, 이러한 의약은 유전자 전달 입자로서 유용하다.
본원에 기술된 바이러스 입자를 포함하는 약학적 조성물 및 약학적으로 허용 가능한 담체 및/또는 부형제가 또한 본원에 개시된다. 또한, 본원에 기술된 바이러스 입자를 포함하는 약학적 투여 형태가 본원에 개시된다.
본원에서 논의된 바와 같이, 본원에 기술된 바이러스 입자는 다양한 치료 용도(생체 내 및 생체 외)에 사용될 수 있고 연구 도구로서 사용될 수 있다.
본원에 개시된 바이러스 입자에 기초한 약학적 조성물은 하나 이상의 생리학적으로 허용 가능한 담체 및/또는 부형제를 사용해 임의의 통상적인 방식으로 제형화될 수 있다. 바이러스 입자는, 예를 들어, 주입, 흡입 또는 (입이나 코를 통한) 흡인 투여용으로 제형화되거나, 경구, 구강, 비경구, 또는 직장 투여용으로 제형화되거나, 종양에 대한 직접 투여용으로 제형화될 수 있다.
약학적 조성물은 전신, 국소 또는 국지화 투여를 포함하는 다양한 투여 모드에 맞게 제형화될 수 있다. 기술 및 제형에 대해서는, 예를 들어 Remrning's Pharmaceutical Sciences, Meade Publishing Co., Easton, Pa에서 확인할 수 있다. 전신 투여의 경우, 근육 내, 정맥 내, 복강 내, 및 피하 주사를 포함하는 주사가 바람직하다. 주사의 목적으로, 약학적 조성물은 액체 용액으로, 바람직하게는 생리학적으로 양립 가능한 완충액, 예컨대 행크액(Hank's solution) 또는 링거액(Ringer's solution)으로 제형화될 수 있다. 또한, 약학적 조성물은 고형분 형태로 제형화되어 사용 직전에 재용해하거나 현탁할 수 있다. 약학적 조성물의 동결건조된 형태도 적합하다.
경구 투여의 경우, 약학적 조성물은, 예를 들어, 결합제(예: 미리 젤라틴화된 옥수수 전분, 폴리비닐피롤리돈, 또는 히드록시프로필 메틸셀룰로오스); 필러(예: 락토오스, 미정질 셀룰로오스 또는 인산수소칼슘); 윤활제(예: 스테아린산마그네슘, 탈크 또는 실리카); 붕해제(예: 감자 전분 또는 전분 글리콜산나트륨); 또는 습윤제(예: 라우릴황산나트륨)와 같은 약학적으로 허용 가능한 부형제와 함께 종래 수단에 의해 제조된 정제 또는 캡슐의 형태를 취할 수 있다. 정제는 당업계에 잘 알려진 방법에 의해 코팅될 수도 있다. 경구 투여용 액체 제제는, 예를 들어, 용액, 시럽, 또는 현탁액의 형태를 취할 수 있거나, 사용 전에 물이나 다른 적합한 비히클과 섞을 수 있도록 건조 제품으로서 제공될 수 있다. 이러한 액체 제제는 약제학적으로 허용 가능한 첨가제, 예컨대 현탁제(예: 소르비톨 시럽, 셀룰로오스 유도체, 또는 수소화 식용 지방); 유화제(예: 레시틴 또는 아카시아); 비-수성 비히클(예: 오일, 유성 에스테르, 에틸 알코올, 또는 분획된 식물성 오일); 및 보존제(예: 메틸 또는 프로필-p-히드록시벤조에이트 또는 소르브산)와 함께 종래 수단에 의해 제조될 수 있다. 상기 제제는 적당량의 완충염, 향미제, 착색제, 및 감미제를 함유할 수도 있다.
약학적 조성물은 주사에 의한 비경구 투여, 예를 들어, 볼루스 주사 또는 연속 주입에 의한 비경구 투여용으로 제형화될 수 있다. 주사용 제형은 단위 투약 형태로, 예를 들어 앰플로 제공되거나 임의로 첨가되는 보존제와 함께 다중 투약 용기에 제공될 수 있다. 약학적 조성물은 유성 또는 수성 비히클 중의 현탁액, 용액, 또는 유화액으로서 추가로 제형화될 수 있고, 현탁제, 안정화제 및/또는 분산제를 포함하는 다른 제제를 함유할 수 있다.
또한, 약학적 조성물은 데포 제제로서 제형화될 수도 있다. 이러한 장기 작용성 제형은 이식(예: 피하 이식 또는 근육 내 이식)에 의하거나 근육내 주사에 의해 투여될 수 있다. 따라서, 예를 들어, 화합물은 적절한 중합체 또는 소수성 물질(예를 들어, 허용 가능한 오일 내의 유화액), 또는 이온 교환 수지와 함께 제형화 되거나, 난용성(sparingly soluble) 유도체로서, 예를 들어, 낭용성 염으로서 제형화될 수 있다. 다른 적절한 전달 시스템은 연장된 기간에 걸쳐 약물의 비침습적 국소 전달을 가능하게 하는 미소구체를 포함한다. 이러한 기술은 전모세관 크기를 갖는 미소구체를 포함할 수 있는데, 이는 염증이나 허혈을 일으키지 않고 관상 동맥 카테터를 통해 기관의 임의의 선택된 부분 내에 주입될 수 있다. 투여된 치료제는 미소구체로부터 서방출되어 선택된 조직에 존재하는 주변 세포에 의해 흡수된다.
전신 투여는 또한 점막 또는 경피 수단에 의한 것일 수 있다. 점막 또는 경피 투여의 경우, 침투 대상 장벽에 적합한 침투제가 제제에 사용한다. 이러한 침투제는 당업계에 일반적으로 알려져 있으며, 예를 들어, 점막 투여의 경우, 담즙염 및 푸시딘산 유도체를 포함한다. 또한, 투과를 용이하게 하는 세제가 사용될 수 있다. 점막 투여는 비강 분무나 좌제를 사용하여 이뤄질 수 있다. 국소 투여의 경우, 본원에 기술된 바이러스 입자는 당업계에 일반적으로 공지된 바와 같은 연고, 고약, 겔, 또는 크림으로 제형화될 수 있다. 치유를 가속화하기 위해 부상이나 염증을 치료하기 위한 세척액이 국소적으로 사용될 수 있다.
주사용으로 적합한 약학적 형태는: 멸균 수용액이나 분산액; 참기름, 땅콩유, 또는 수성 프로필렌 글리콜을 포함하는 제형; 및 멸균 주사 용액이나 분산액을 즉석에서 제조하기 위한 멸균 분말을 포함할 수 있다. 모든 경우에, 이러한 형태는 반드시 멸균 상태여야 하고 반드시 유체여야 한다. 이는 제조 및 특정 저장 파라미터(예: 냉장 및 냉동)의 조건 하에서 반드시 안정적이어야 하며, 박테리아 및 곰팡이와 같은 미생물의 오염 작용에 대항하도록 보존되어야만 한다.
본원에 개시된 제형이 대상체에서 면역 반응을 증가시키는 치료제로서 사용되는 경우, 치료제는 중성 또는 염 형태의 조성물로 제형화될 수 있다. 약학적으로 허용 가능한 염은 산 부가염(단백질의 유리 아미노기와 함께 형성됨)을 포함하고, 예를 들어, 염산이나 인산과 같은 무기산과 함께 형성되거나, 아세트산, 옥살산, 타르타르산, 만델산 등과 같은 유기산과 함께 형성된다. 유리 카복실기와 함께 형성된 염은, 예를 들어, 나트륨, 칼륨, 암모늄, 칼슘, 또는 수산화제이철과 같은 무기 염기로부터 유도될 수도 되고, 이소프로필아민, 트리메틸아민, 히스티딘, 프로카인 등과 같은 유기 염기로부터 유도될 수도 있다.
담체는 용매일 수도 있고, 예를 들어, 물, 에탄올, 폴리올(예: 글리세롤, 프로필렌 글리콜, 및 액체 폴리에틸렌 글리콜 등), 이의 적절한 혼합물, 및 식물성 오일을 함유하는 분산 매질일 수도 있다. 적절한 유동성은, 예를 들어, 레시틴과 같은 코팅제를 사용함으로써, 분산액의 경우 요구되는 입자의 크기를 유지함으로써, 및 계면활성제를 사용함으로써 유지될 수 있다. 미생물의 작용을 방지하는 것은 당업계에 공지된 다양한 항박테리아제 및 항진균제에 의해 달성될 수 있다. 많은 경우에, 당이나 염화나트륨과 같은 등장화제를 포함하는 것이 바람직할 것이다. 주사식 조성물의 장시간 흡수는 스테아린산 알루미늄 및 젤라틴과 같은 흡수 지연제를 조성물에 사용함으로써 달성될 수 있다.
멸균 주사액은, 필요량의 활성 화합물 또는 작제물을, 필요에 따라, 위에서 열거된 다양한 다른 성분과 함께 적절한 용매에 혼입한 다음, 멸균 여과함으로써 제조할 수 있다.
제형화 시, 용액은 투약식 제형과 비슷한 방식으로, 및 치료적으로 유효한 양으로 투여될 수 있다. 제형은 전술한 주사액의 유형과 같은 다양한 투약 형태로 쉽게 투여되지만, 서방성 캡슐이나 극미립자 및 미소구체 등도 사용될 수 있다.
예를 들어, 수용액을 비경구 투여하는 경우, 필요 시, 용액을 적절히 완충해야만 하고, 액체 희석제는 먼저 충분한 식염수 또는 포도당으로 등장화시켜야 한다. 이들 특정 수용액은 정맥 내, 종양 내, 근육 내, 피하, 및 복강 내 투여에 특히 적합하다. 이러한 맥락에서, 사용할 수 있는 멸균 수성 매질은 본 개시에 비추어 당업자에게 공지될 것이다. 예를 들어, 1 ml의 등장성 NaCl 용액에 1회 투약량을 용해시킨 다음, 1000 ml의 피하주입용 유체에 첨가하거나 제안된 주입 부위에 주입할 수 있다.
모든 경우에 있어서, 개별 대상체에게 적절한 투여량은 투여 담당의가 결정하게 된다. 예를 들어, 병원성 유기체에 대한 노출의 필요성 또는 대상체의 병태(예를 들어 암)에 따라, 대상체에게는 본원에 기술된 바이러스 입자가 일정 기간 동안 매일, 주별로 투여되거나, 월별로 투여되거나, 2년에 한 번 또는 매년 투여될 수 있다.
정맥 내, 종양 내, 피 내, 또는 근육 내 주사와 같은 비경구 투여용으로 제형화된 화합물 이외에, 약학적으로 허용 가능한 다른 형태는, 예를 들어, 경구 투여용 정제 또는 기타 고형분; 리포솜 제형; 지속 방출 캡슐; 생분해성 형태 및 현재 사용되는 임의의 다른 형태를 포함한다.
비강내 투약식 또는 흡입식 용액이나 분무제, 에어로졸 또는 흡입제를 사용할 수도 있다. 비강 용액은 비강 통로에 점적 또는 분무에 의해 투여되도록 설계된 수용액일 수 있다. 비강 용액은 많은 부분에서 비강 분비물과 유사하도록 제조될 수 있다. 따라서, 수성 비강 용액은 일반적으로 등장성이며 5.5 내지 7.5의 pH를 유지하도록 약간 완충된다. 또한, 안과 제제에 사용되는 것들과 유사한 항균 보존제, 및 필요에 따라 적절한 약물 안정화제가 제형에 포함될 수 있다. 다양한 상업적 비강 제제가 알려져 있고, 예를 들어, 항생제 및 항히스타민제를 포함할 수 있으며, 이들은 천식 예방에 사용된다.
경구 제형은 부형제를, 예를 들어, 약학 등급의 만니톨, 락토오스, 전분, 스테아르산 마그네슘, 사카린나트륨, 셀룰로오스, 탄산마그네슘 등으로서 포함할 수 있다. 이들 조성물은 용액, 현탁액, 정제, 알약, 캡슐, 서방성 제형, 또는 분말의 형태를 취한다. 정의된 특정 구현예에서, 경구용 약학적 조성물은 불활성 희석제 또는 동화성 식용 담체를 포함하게 되거나, 경질 또는 연질-쉘의 젤라틴 캡슐에 둘러싸이거나, 압착되어 정제로 만들어지거나, 식단의 음식과 함께 직접 혼입될 수 있다. 경구 치료제의 투여를 위해, 활성 화합물을 부형제와 혼입하여 섭취 가능한 정제, 구강용 정제, 트로키, 캡슐, 엘릭서, 현탁액, 시럽, 웨이퍼 등의 형태로 사용할 수 있다.
정제, 트로키, 알약, 캡슐 등은 다음을 함유할 수도 있다: 검 트라가칸트, 아카시아, 옥수수 전분, 또는 젤라틴과 같은 결합제; 인산이칼슘과 같은 부형제; 옥수수 전분, 감자 전분, 알긴산 등과 같은 붕해제; 스테아린산 마그네슘과 같은 윤활제; 및 수크로오스, 락토오스 또는 사카린과 같은 감미제. 이 외에도 페페민트, 윈터그린 오일 또는 체리향과 같은 향미제를 첨가할 수도 있다. 투약 단위 형태가 캡슐일 때, 전술한 유형의 물질에 추가로 액체 담체를 함유할 수 있다. 다양한 다른 물질이 코팅제로서 존재하거나, 투약 단위의 물리적 형태를 달리 변경할 수 있다. 예를 들어, 정제, 알약 또는 캡슐은 셸락, 당 또는 둘 모두로 코팅될 수 있다. 엘릭서 시럽은 활성 화합물을 함유할 수 있는데, 예를 들어, 감미제로서 수크로오스, 보존제로서 메틸 및 프로필파라멘, 체리향 또는 오렌지향과 같은 염색 및 향미제를 함유할 수 있다.
본원에 개시된 추가 구현예는 방법 및 조성물과 함께 사용하기 위한 키트를 포함할 수 있다. 키트는 적절한 용기, 예를 들어, 바이알, 튜브, 미니- 또는 마이크로퓨지 튜브, 시험 튜브, 플라스크, 병, 주사기 또는 다른 용기를 포함할 수도 있다. 추가의 성분이나 제제가 제공되는 경우, 키트는 이러한 제제 또는 성분이 배치될 수 있는 하나 이상의 추가 용기를 포함할 수 있다. 본원의 키트는 또한 일반적으로 바이러스 입자를 담기 위한 수단 및 상업적 판매를 위한 밀폐식 시약 용기를 포함할 것이다. 이러한 용기는 원하는 바이알이 유지되는 사출식 용기 또는 취입 성형식 용기를 포함할 수 있다. 임의로는, 예를 들어, 항염증제, 항바이러스제, 항진균제나 항세균제, 또는 항-종양제와 같은 하나 이상의 추가 활성제가 기술된 조성물에 필요할 수도 있다.
본원에 개시된 조성물은 당업계에 공지된 임의의 수단에 의해 투여될 수 있다. 예를 들어, 조성물은 정맥 내, 종양 내, 피 내, 동맥 내, 복강 내, 병소 내, 두개 내, 관절 내, 전립선 내, 흉막 내, 기관 내, 비강 내, 유리체 내, 질 내, 직장 내, 국부적으로, 종양 내, 근육 내, 경막 내, 피하, 결막 하, 소포 내, 점막, 심막 내, 배꼽 내, 안구 내, 경구, 국소적으로, 흡입에 의해, 주사에 의해, 주입에 이해, 연속 주입에 의해, 국소 관류에 의해, 카테터를 통해, 세척을 통해, 크림으로, 또는 지질 조성물로 대상체에게 투여되는 것을 포함할 수 있다.
당업자에게 공지된 임의의 방법이 본원에 기술된 바이러스 입자, 포장 세포 및 입자 작제물의 대규모 생산에 사용될 수 있다. 예를 들어, 마스터 시드 스톡 및 작업용 시드 스톡은 GMP 조건 하에, 검정된 일차 CEF에서 제조되거나 다른 방법에 의해 제조될 수 있다. 포장 세포는 큰 표면적의 플라스크에 도말되어, 증식에 가깝게 성장될 수 있고, 바이러스 입자가 정제될 수 있다. 세포를 수확하여, 바이러스 입자를 단리되고 정제된 배양 배지 내로 방출할 수 있거나, 세포 내 바이러스 입자를 기계적으로 파괴하여 방출할 수 있다(세포 찌꺼기는 큰 기공 심층 여과(large-pore depth filtration)로 제거하고, 숙주 세포 DNA는 엔도뉴클레아제로 소화함). 바이러스 입자를 후속하여 정제하고, 접선 유동 여과에 이어서 투석 여과에 의해 농축할 수 있다. 생성된 농축된 벌크를 안정화제가 포함된 완충액으로 희석시켜 제형화하고, 바이알로 채우고, 동결 건조시킬 수 있다. 조성물 및 제형은 추후 사용을 위해 저장할 수 있다. 사용하기 위해, 동결 건조된 바이러스 입자에 희석제를 첨가하여 이를 재구성할 수 있다.
병용 요법에 사용되는 특정 추가 제제를 당업계에 알려진 임의의 수단에 의해 제형화하여 투여할 수 있다.
본원에 개시된 바와 같은 조성물은 알루미늄염 및 기타 광물 보조제, 텐소액티브제(tensoactive agent), 박테리아 유도체, 비히클 및 사이토카인과 같은 보조제를 포함할 수 있다. 보조제는 길항성 면역 조절 특성을 가질 수도 있다. 예를 들어, 보조제는 Th1 또는 Th2 면역성을 자극할 수 있다. 본원에 개시된 바와 같은 조성물 및 방법은 보조제 요법을 포함할 수도 있다.
비제한적이고 예시적인 구현예가 아래에 열거되어 있다.
구현예 1. AAV 캡시드를 포함하는 AAV 바이러스 입자로서,
상기 AAV 캡시드의 적어도 하나의 AAV 캡시드 단백질은 다음으로 이루어진 군으로부터 선택된 캡시드 단백질의 아미노산 서열의 적어도 일부를 포함하고:
비-영장류 동물 AAV의 캡시드 단백질,
원격 AAV의 캡시드 단백질, 및
이들의 조합,
상기 AAV 캡시드의 적어도 하나의 AAV 캡시드 단백질은 다음을 포함하도록 변형되는, AAV 바이러스 입자:
(a) 단백질:단백질 결합 쌍의 적어도 제1 구성원,
(b) 검출 가능한 표지,
(c) 점돌연변이,
(d) 비-영장류 동물 AAV의 캡시드 단백질, 원격 AAV의 캡시드 단백질, 또는 이들의 조합으로 이루어진 군으로부터 선택된 캡시드 단백질의 상기 아미노산 서열에 작동 가능하게 연결되는 다른 AAV 캡시드 단백질의 아미노산 서열의 일부를 포함하는 키메라 아미노산 서열, 및
(e) (a), (b), (c), 및 (d)의 임의의 조합.
구현예 2. AAV 캡시드를 포함하는 AAV 바이러스 입자로서,
상기 AAV 캡시드의 적어도 하나의 AAV 캡시드 단백질은 비-영장류 동물 AAV의 캡시드 단백질의 아미노산 서열의 적어도 일부를 포함하고,
상기 AAV 캡시드의 적어도 하나의 AAV 캡시드 단백질은 다음을 포함하도록 변형되는, AAV 바이러스 입자:
(a) 단백질:단백질 결합 쌍의 적어도 제1 구성원,
(b) 검출 가능한 표지,
(c) 점돌연변이,
(d) 비-영장류 동물 AAV의 캡시드의 상기 아미노산 서열에 작동 가능하게 연결되는 다른 AAV 캡시드 단백질의 아미노산 서열의 일부를 포함하는 키메라 아미노산 서열, 및
(e) (a), (b), (c), 및 (d)의 임의의 조합.
구현예 3. AAV 캡시드를 포함하는 AAV 바이러스 입자로서,
상기 AAV 캡시드의 적어도 하나의 AAV 캡시드 단백질은 원격 AAV의 캡시드 단백질의 아미노산 서열의 적어도 일부를 포함하고,
상기 AAV 캡시드의 적어도 하나의 AAV 캡시드 단백질은 다음을 포함하도록 변형되는, AAV 바이러스 입자:
(a) 단백질:단백질 결합 쌍의 적어도 제1 구성원,
(b) 검출 가능한 표지,
(c) 점돌연변이,
(d) 원격 AAV의 캡시드 단백질의 상기 아미노산 서열에 작동 가능하게 연결되는 다른 AAV 캡시드 단백질의 아미노산 서열의 일부를 포함하는 키메라 아미노산 서열, 및
(e) (a), (b), (c), 및 (d)의 임의의 조합.
구현예 4. 다음을 포함하는 AAV 바이러스 입자:
(A) 다음으로 이루어진 군으로부터 선택된 아미노산 서열을 포함하는 적어도 하나의 AAV 캡시드 단백질:
(i) 비-영장류 동물 AAV의 캡시드 단백질의 아미노산 서열,
(ii) 원격 AAV의 캡시드 단백질의 아미노산 서열, 및
(iii) 이들의 조합의 아미노산 서열, 및
(B) 관심 뉴클레오티드; 및 다른 AAV의 ITR 서열의 적어도 일부를 포함하는 AAV ITR을 포함하는, AAV 게놈.
구현예 5. 다음을 포함하는 AAV 바이러스 입자:
(A) 비-영장류 동물 AAV의 캡시드 단백질의 아미노산 서열을 포함하는 적어도 하나의 AAV 캡시드 단백질, 및
(B) 관심 뉴클레오티드; 및 다른 AAV의 ITR 서열의 적어도 일부를 포함하는 AAV ITR을 포함하는, AAV 게놈.
구현예 6. 다음을 포함하는 AAV 바이러스 입자:
(A) 원격 AAV의 캡시드 단백질의 아미노산 서열을 포함하는 적어도 하나의 AAV 캡시드 단백질, 및
(B) 관심 뉴클레오티드; 및 다른 AAV의 ITR 서열의 적어도 일부를 포함하는 AAV ITR을 포함하는, AAV 게놈.
구현예 7. 구현예 1 내지 구현예 6 중 어느 하나에 있어서, 비-영장류 동물 AAV의 캡시드 단백질, 원격 AAV의 캡시드 단백질, 또는 이들의 조합의 상기 아미노산 서열은 다음을 포함하도록 변형되는, AAV 바이러스 입자:
(a) 단백질:단백질 결합 쌍의 적어도 제1 구성원,
(b) 검출 가능한 표지,
(c) 점돌연변이.
구현예 8. 구현예 7에 있어서, 단백질:단백질 결합 쌍은 SpyTag:SpyCatcher, SpyTag:KTag, Isopeptag:pilin-C, SnoopTag:SnoopCatcher, 및 SpyTag002:SpyCatcher002로부터 선택되는, AAV 입자.
구현예 9. 구현예 7에 있어서, 단백질:단백질 결합 쌍의 제1 구성원은 서열번호 44로 제시된 서열을 포함하는 c-myc를 포함하는, AAV 입자.
구현예 10. 구현예 1 내지 9 중 어느 하나에 있어서, 검출 가능한 표지는 IGTRYLTR(서열번호 45)의 아미노산 서열을 포함하는 B1 에피토프를 포함하는, AAV 입자.
구현예 11. 구현예 1 내지 10 중 어느 하나에 있어서, 비영장류 동물 AAV의 캡시드 단백질, 원격 AAV의 캡시드 단백질, 또는 이들의 조합의 상기 아미노산 서열은 비영장류 동물 AAV의 VP3 캡시드 단백질의 아미노산 서열 및/또는 원격 AAV의 VP3 캡시드 단백질의 아미노산 서열을 포함하는, AAV 바이러스 입자.
구현예 12. 구현예 1 내지 11 중 어느 하나에 있어서, 비영장류 동물 AAV의 캡시드 단백질, 원격 AAV의 캡시드 단백질, 또는 이들의 조합의 상기 아미노산 서열은 비영장류 동물 AAV의 VP2 캡시드 단백질의 아미노산 서열 및/또는 원격 AAV의 VP2 캡시드 단백질의 아미노산 서열을 포함하는, AAV 바이러스 입자.
구현예 13. 구현예 1 내지 12 중 어느 하나에 있어서, 비영장류 동물 AAV의 캡시드 단백질, 원격 AAV의 캡시드 단백질, 또는 이들의 조합의 상기 아미노산 서열은 비영장류 동물 AAV의 VP1 캡시드 단백질의 아미노산 서열 및/또는 원격 AAV의 VP1 캡시드 단백질의 아미노산 서열을 포함하는, AAV 바이러스 입자.
구현예 14. 구현예 1 내지 13 중 어느 하나에 있어서, 상기 입자의 캡시드는 다음을 포함하는, AAV 바이러스 입자:
(i) 다음 중 어느 하나인 VP1 캡시드 단백질:
키메라 AAV VP1 캡시드 단백질(임의로, 여기서 키메라 VP1 캡시드 단백질은 비영장류 AAV 또는 원격 AAV의 VP1/VP2 공통 영역 VP3 영역에 작동 가능하게 연결된 다른 AAV의 VP1-고유 영역(VP1-u)을 포함함); 또는
비영장류 AAV 또는 원격 AAV의 VP1 캡시드 단백질,
(ii) 다음 중 어느 하나인 VP2 캡시드 단백질:
키메라 AAV VP2 캡시드 단백질(임의로, 여기서 키메라 VP2 캡시드 단백질은 비영장류 AAV 또는 원격 AAV의 VP3 영역에 작동 가능하게 연결된 다른 AAV의 VP1/VP2 공통 영역을 포함함); 또는
비영장류 AAV 또는 원격 AAV의 VP2 캡시드 단백질, 및
(iii) 비영장류 AAV 또는 원격 AAV의 VP3 캡시드 단백질.
구현예 15. 구현예 1 내지 14 중 어느 하나에 있어서, 상기 입자의 캡시드는 다음을 포함하는, AAV 바이러스 입자:
(i) 키메라 AAV VP1 캡시드 단백질(임의로, 여기서 키메라 VP1 캡시드 단백질은 비영장류 AAV 또는 원격 AAV의 VP1/VP2 공통 영역 VP3 영역에 작동 가능하게 연결된 다른 AAV의 VP1-고유 영역(VP1-u)을 포함함),
(ii) 키메라 AAV VP2 캡시드 단백질(임의로, 여기서 키메라 VP2 캡시드 단백질은 비영장류 AAV 또는 원격 AAV의 VP3 영역에 작동 가능하게 연결된 다른 AAV의 VP1/VP2 공통 영역을 포함함); 및
(iii) 비영장류 AAV 또는 원격 AAV의 VP3 캡시드 단백질.
구현예 16. 구현예 1 내지 15 중 어느 하나에 있어서, 상기 입자의 캡시드는 다음을 포함하는, AAV 바이러스 입자:
(i) 키메라 AAV VP1 캡시드 단백질(임의로, 여기서 키메라 VP1 캡시드 단백질은 비영장류 AAV 또는 원격 AAV의 VP1/VP2 공통 영역 VP3 영역에 작동 가능하게 연결된 다른 AAV의 VP1-고유 영역(VP1-u)을 포함함),
(ii) 비영장류 AAV 또는 원격 AAV의 VP2 캡시드 단백질, 및
(iii) 비영장류 AAV 또는 원격 AAV의 VP3 캡시드 단백질.
구현예 17. 구현예 1 내지 16 중 어느 하나에 있어서, 캡시드는 다음을 포함하는, AAV 바이러스 입자:
(i) 비영장류 AAV 또는 원격 AAV의 VP1 캡시드 단백질,
(ii) 비영장류 AAV 또는 원격 AAV의 VP2 캡시드 단백질, 및
(iii) 비영장류 AAV 또는 원격 AAV의 VP3 캡시드 단백질,
구현예 18. 구현예 1 내지 17 중 어느 하나에 있어서, 상기 다른 AAV는 영장류 AAV 또는 영장류 AAV의 조합인, AAV 바이러스 입자.
구현예 19. 구현예 1 내지 18 중 어느 하나에 있어서, 상기 다른 AAV는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, 및 이들의 조합으로 이루어진 군으로부터 선택되는, AAV 바이러스 입자.
구현예 20. 구현예 1 내지 19 중 어느 하나에 있어서, 상기 다른 AAV는 AAV2인, AAV 바이러스 입자.
구현예 21. 구현예 1 내지 2, 4 내지 5, 및 7 내지 20 중 어느 하나에 있어서, 상기 비영장류 동물 AAV는 표 2에 열거된 비영장류 AAV인, AAV 바이러스 입자.
구현예 22. 구현예 1 내지 2, 4 내지 5, 및 7 내지 21 중 어느 하나에 있어서, 비영장류 AAV는 조류 AAV, 바다 사자 AAV, 또는 턱수염 도마뱀 AAV인, AAV 바이러스 입자.
구현예 23. 구현예 1 내지 2, 4 내지 5, 및 7 내지 22 중 어느 하나에 있어서, 비영장류 동물 AAV는 AAAV인, AAV 바이러스 입자.
구현예 24. 구현예 1 내지 2, 4 내지 5, 및 7 내지 23 중 어느 하나에 있어서, 변형은 AAAV의 VP1 캡시드 단백질의 위치 I444 또는 I580에서의 변형인, AAV 바이러스 입자.
구현예 25. 구현예 1 내지 2, 4 내지 5, 및 7 내지 22 중 어느 하나에 있어서, 비영장류 동물 AAV는 유린류 AAV인, AAV 바이러스 입자.
구현예 26. 구현예 1 내지 2, 4 내지 5, 7 내지 22, 및 25 중 어느 하나에 있어서, 유린류 AAV는 턱수염 도마뱀 AAV인, AAV 바이러스 입자.
구현예 27. 구현예 1 내지 2, 4 내지 5, 7 내지 22, 및 25 내지 26 중 어느 하나에 있어서, 변형은 턱수염 도마뱀 AAV의 VP1 캡시드 단백질의 위치 I573 또는 I436에서의 변형인, AAV 바이러스 입자.
구현예 28. 구현예 1 내지 2, 4 내지 5, 및 7 내지 22 중 어느 하나에 있어서, 비영장류 동물 AAV는 포유류 AAV인, AAV 바이러스 입자.
구현예 29. 구현예 1 내지 2, 4 내지 5, 7 내지 22, 및 28 중 어느 하나에 있어서, 포유류 AAV는 바다 사자 AAV인, AAV 바이러스 입자.
구현예 30. 구현예 1 내지 2, 4 내지 5, 7 내지 22, 및 28 내지 29 중 어느 하나에 있어서, 변형은 바다 사자 AAV의 VP1의 I429, I430, I431, I432, I433, I434, I436, I437, 및 A565로 이루어진 군으로부터 선택된 위치에서의 변형인, AAV 바이러스 입자.
구현예 31. 구현예 1 내지 구현예 30 중 어느 하나에 있어서, 비영장류 동물 AAV, 원격 AAV, 또는 이들의 조합의 VP3 캡시드 단백질을 포함하되, VP3 캡시드 단백질은 다음을 포함하도록 변형되는, AAV 입자:
(a) 단백질:단백질 결합 쌍의 적어도 제1 구성원(임의로, 여기서 단백질:단백질 결합 쌍은 SpyTag:SpyCatcher, SpyTag:KTag, Isopeptag:pilin-C, SnoopTag:SnoopCatcher, 및 SpyTag002:SpyCatcher002로 이루어진 군으로부터 선택됨),
(b) 검출 가능한 표지(임의로, 여기서 검출 가능한 표지는 서열번호 44로 제시된 아미노산 서열 또는 서열번호 45로 제시된 아미노산 서열을 포함함),
(c) 점돌연변이, 또는
(d) (a), (b), 및 (c)의 임의의 조합.
구현예 32. 구현예 31에 있어서, 비영장류 동물 AAV, 원격 AAV, 또는 이들의 조합의 VP3 캡시드 단백질은 다음을 포함하도록 변형되는, AAV 입자:
(a) 서열번호 42로 제시된 아미노산 서열을 포함하는 적어도 SpyTag 및/또는
(b) 서열번호 45로서 제시된 아미노산 서열을 포함하는 검출 가능한 표지.
구현예 33. 구현예 1 내지 32 중 어느 하나에 있어서, 단백질:단백질 결합 쌍의 제1 구성원 및/또는 검출 가능한 표지를 상기 AAV 입자의 캡시드의 캡시드 단백질에 작동 가능하게 연결하는 제1 및/또는 제2 링커를 포함하는, AAV 입자.
구현예 34. 구현예 33에 있어서, 제1 및 제2 링커는 동일하지 않은, AAV 입자.
구현예 35. 구현예 33 또는 구현예 34에 있어서, 제1 및 제2 링커는 동일한, AAV 입자.
구현예 36. 구현예 33 내지 35 중 어느 하나에 있어서, 제1 및/또는 제2 링커는 10개 아미노산의 길이인, AAV 입자.
구현예 37. 구현예 1 내지 36 중 어느 하나에 있어서, 상기 AAV 입자의 캡시드의 캡시드 단백질의 가변 영역에 작동 가능하게 연결된 단백질:단백질 결합 쌍의 제1 구성원 및/또는 검출 가능한 표지를 포함하는, AAV 입자.
구현예 38. 구현예 1 또는 구현예 2에 있어서, 다음으로 이루어진 군으로부터 선택된 아미노산 서열을 포함하는 캡시드 단백질을 포함하는, AAV 입자:
(a) 서열번호 2로 제시된 아미노산 서열,
(b) 서열번호 4로 제시된 아미노산 서열,
(c) 서열번호 6으로 제시된 아미노산 서열,
(d) 서열번호 8로서 제시된 아미노산 서열,
(e) 서열번호 10으로서 제시된 아미노산 서열,
(f) 서열번호 12로서 제시된 아미노산 서열,
(g) 서열번호 14로서 제시된 아미노산 서열,
(h) 서열번호 16으로서 제시된 아미노산 서열,
(i) 서열번호 18로서 제시된 아미노산 서열,
(j) 서열번호 20으로서 제시된 아미노산 서열;
(k) 서열번호 22로서 제시된 아미노산 서열,
(l) 서열번호 24로서 제시된 아미노산 서열,
(m) 서열번호 26으로서 제시된 아미노산 서열;
(n) 서열번호 28로서 제시된 아미노산 서열,
(o) 서열번호 30으로서 제시된 아미노산 서열,
(p) 서열번호 32로서 제시된 아미노산 서열,
(q) 서열번호 34로서 제시된 아미노산 서열;
(r) 서열번호 36으로서 제시된 아미노산 서열,
(s) 서열번호 53으로서 제시된 아미노산 서열,
(t) 서열번호 55로서 제시된 아미노산 서열,
(u) 서열번호 57로서 제시된 아미노산 서열,
(v) 서열번호 59로서 제시된 아미노산 서열,
(w) 서열번호 61로서 제시된 아미노산 서열,
(x) 서열번호 63으로서 제시된 아미노산 서열,
(y) 서열번호 65로서 제시된 아미노산 서열,
(z) 서열번호 67로서 제시된 아미노산 서열,
(aa) 서열번호 69로서 제시된 아미노산 서열,
(bb) 서열번호 71로서 제시된 아미노산 서열,
(cc) 서열번호 2, 서열번호 4, 서열번호 6, 서열번호 8, 서열번호 10, 서열번호 12, 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26, 서열번호 28, 서열번호 30, 서열번호 32, 서열번호 34, 서열번호 36, 서열번호 53, 서열번호 55, 서열번호 57, 서열번호 59, 서열번호 61, 서열번호 63, 서열번호 65, 서열번호 67, 서열번호 69, 또는 서열번호 71과 상당한 서열 동일성을, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열, 및
(dd) (a)~(cc) 중 어느 하나에 제시된 아미노산 서열의 임의의 VP2 및/또는 VP3 부분의 아미노산 서열.
구현예 39. 구현예 1 내지 38 중 어느 하나에 있어서, 캡시드가 모자이크 캡시드가 되도록 기준 캡시드 단백질을 추가로 포함하는, AAV 입자.
구현예 40. 구현예 1 내지 39 중 어느 하나에 있어서, 단백질:단백질 결합 쌍의 제1 구성원으로 변형된 VP3 캡시드 단백질 및 기준 VP3 캡시드 단백질을 포함하는 모자이크 캡시드를 포함하는, AAV 입자.
구현예 41. 비영장류 동물 AAV 또는 원격 AAV의 캡시드 단백질의 아미노산 서열을 포함하는 아데노-연관 바이러스(AAV) 캡시드 단백질로서, 상기 AAV 캡시드 단백질은 다음으로 이루어진 군으로부터 선택되는, AAV 캡시드 단백질:
(a) 키메라 AAV VP1 캡시드 단백질(임의로, 여기서 키메라 동물 AAV VP1 캡시드 단백질은 단백질:단백질 결합 쌍의 적어도 제1 구성원, 검출 가능한 표지, 및/또는 점 돌연변이를 포함하도록 변형됨),
(b) 단백질:단백질 결합 쌍의 적어도 제1 구성원 및/또는 검출 가능한 표지를 포함하도록 변형된 비키메라 AAV VP1 캡시드 단백질,
(c) 키메라 AAV VP2 캡시드 단백질(임의로, 여기서 키메라 AAV VP2 캡시드 단백질은 단백질:단백질 결합 쌍의 적어도 제1 구성원, 검출 가능한 표지, 및/또는 점 돌연변이를 포함하도록 변형됨),
(d) 단백질:단백질 결합 쌍의 적어도 제1 구성원, 검출 가능한 표지, 및/또는 점 돌연변이를 포함하도록 변형된 비키메라 AAV VP2 캡시드 단백질,
(e) 단백질:단백질 결합 쌍의 적어도 제1 구성원, 검출 가능한 표지, 및/또는 점 돌연변이를 포함하도록 변형된 키메라 AAV VP3 캡시드 단백질, 및
(f) 단백질:단백질 결합 쌍의 적어도 제1 구성원, 검출 가능한 표지, 및/또는 점 돌연변이를 포함하도록 변형된 비키메라 AAV VP3 캡시드 단백질.
구현예 42. 구현예 41에 있어서, 단백질:단백질 결합 쌍의 제1 구성원의 측면에는 단백질:단백질 결합 쌍의 제1 구성원을 캡시드 단백질에 연결하는 제1 및/또는 제2 링커가 위치하며, 제1 및/또는 제2 링커는 각각 독립적으로 적어도 하나의 아미노산 길이인, AAV 캡시드 단백질.
구현예 43. 구현예 42에 있어서, 제1 및 제2 링커는 동일하지 않은, AAV 캡시드 단백질.
구현예 44. 구현예 42에 있어서, 제1 및 제2 링커는 동일하고, 10개의 아미노산 길이인, AAV 캡시드 단백질.
구현예 45. 구현예 41 내지 44 중 어느 하나에 있어서, 캡시드 단백질은 단백질:단백질 결합 쌍의 제2 동족 구성원을 추가로 포함하고, 임의로 제1 및 제2 구성원은 공유 결합, 임의로 이소펩티드 결합에 의해 결합되는, AAV 캡시드 단백질.
구현예 46. 구현예 41 내지 45 중 어느 하나에 있어서, 단백질:단백질 결합 쌍의 제1 구성원은 SpyTag를 포함하는, AAV 캡시드 단백질.
구현예 47. 구현예 45 또는 구현예 46에 있어서, 제2 동족 구성원은 SpyCatcher를 포함하는, AAV 캡시드 단백질.
구현예 48. 구현예 45 내지 47 중 어느 하나에 있어서, 제2 동족 구성원은 KTag를 포함하는, AAV 캡시드 단백질.
구현예 49. 구현예 45에 있어서, 제1 구성원은 KTag이고 제2 동족 구성원은 SpyCatcher를 포함하는, AAV 캡시드 단백질.
구현예 50. 구현예 45에 있어서, 제1 구성원은 SnoopTag이고 제2 동족 구성원은 SnoopCatcher를 포함하는, AAV 캡시드 단백질.
구현예 51. 구현예 45에 있어서, 제1 구성원은 isopeptag이고 제2 동족 구성원은 Pilin-C를 포함하는, AAV 캡시드 단백질.
구현예 52. 구현예 45에 있어서, 제1 구성원은 SpyTag002이고 제2 동족 구성원은 SpyCatcher002를 포함하는, AAV 캡시드 단백질.
구현예 53. 구현예 45 내지 52 중 어느 하나에 있어서, 제2 구성원은 표적화 리간드에 작동 가능하게 연결되고, 임의로 표적화 리간드는 결합 모이어티인, AAV 캡시드 단백질.
구현예 54. 구현예 53에 있어서, 결합 모이어티는 항체 또는 그의 일부인, AAV 캡시드 단백질.
구현예 55. 구현예 54에 있어서, 항체 또는 그의 일부는 SpyCatcher에 융합되는, AAV 캡시드 단백질.
구현예 56. 구현예 54 또는 구현예 55에 있어서, 항체 또는 그의 일부는 C-말단에서 링커에 융합되고, 링커는 링커의 C-말단에서 SpyCatcher에 융합되는, AAV 캡시드 단백질.
구현예 57. 구현예 56에 있어서, 링커는 서열 번호 49로서 제시된 서열(GSGESG)을 포함하는, AAV 캡시드 단백질.
구현예 58. 구현예 41 내지 57 중 어느 하나에 있어서, 검출 가능한 표지는 서열번호 45로서 제시된 아미노산 서열을 포함하는 B1 에피토프를 포함하는, AAV 캡시드 단백질.
구현예 59. 구현예 41 내지 58 중 어느 하나에 있어서, 상기 비영장류 동물 AAV는 표 2에 열거된 비영장류 AAV인, AAV 캡시드 단백질.
구현예 60. 구현예 41 내지 59 중 어느 하나에 있어서, 비영장류 AAV는 조류 AAV, 바다 사자 AAV, 또는 턱수염 도마뱀 AAV인, AAV 캡시드 단백질.
구현예 61. 구현예 41 내지 60 중 어느 하나에 있어서, 비영장류 동물 AAV는 AAAV인, AAV 캡시드 단백질.
구현예 62. 구현예 41 내지 61 중 어느 하나에 있어서, 변형은 AAAV의 VP1 캡시드 단백질의 위치 I444 또는 I580에서의 변형인, AAV 캡시드 단백질.
구현예 63. 구현예 41 내지 60 중 어느 하나에 있어서, 비영장류 동물 AAV는 유린류 AAV인, AAV 캡시드 단백질.
구현예 64. 구현예 41 내지 60 및 63 중 어느 하나에 있어서, 유린류 AAV는 턱수염 도마뱀 AAV인, AAV 캡시드 단백질.
구현예 65. 구현예 41 내지 60, 및 63 내지 64 중 어느 하나에 있어서, 변형은 턱수염 도마뱀 AAV의 VP1 캡시드 단백질의 위치 I573 또는 I436에서의 변형인, AAV 캡시드 단백질.
구현예 66. 구현예 41 내지 60 중 어느 하나에 있어서, 비영장류 동물 AAV는 포유류 AAV인, AAV 캡시드 단백질.
구현예 67. 구현예 41 내지 60 및 66 중 어느 하나에 있어서, 포유류 AAV는 바다 사자 AAV인, AAV 캡시드 단백질.
구현예 68. 구현예 41 내지 60 및 66 내지 67 중 어느 하나에 있어서, 변형은 바다 사자 AAV의 VP1의 I429, I430, I431, I432, I433, I434, I436, I437, 및 A565로 이루어진 군으로부터 선택된 위치에서의 변형인, AAV 캡시드 단백질.
구현예 69. 구현예 41 내지 68 중 어느 하나에 있어서, 다음으로부터 선택된 아미노산 서열을 포함하는, AAV 캡시드 단백질:
(a) 서열번호 2로 제시된 아미노산 서열,
(b) 서열번호 4로 제시된 아미노산 서열,
(c) 서열번호 6으로 제시된 아미노산 서열,
(d) 서열번호 8로서 제시된 아미노산 서열,
(e) 서열번호 10으로서 제시된 아미노산 서열,
(f) 서열번호 12로서 제시된 아미노산 서열,
(g) 서열번호 14로서 제시된 아미노산 서열,
(h) 서열번호 16으로서 제시된 아미노산 서열,
(i) 서열번호 18로서 제시된 아미노산 서열,
(j) 서열번호 20으로서 제시된 아미노산 서열;
(k) 서열번호 22로서 제시된 아미노산 서열,
(l) 서열번호 24로서 제시된 아미노산 서열,
(m) 서열번호 26으로서 제시된 아미노산 서열;
(n) 서열번호 28로서 제시된 아미노산 서열,
(o) 서열번호 30으로서 제시된 아미노산 서열,
(p) 서열번호 32로서 제시된 아미노산 서열,
(q) 서열번호 34로서 제시된 아미노산 서열;
(r) 서열번호 36으로서 제시된 아미노산 서열,
(s) 서열번호 53으로서 제시된 아미노산 서열,
(t) 서열번호 55로서 제시된 아미노산 서열,
(u) 서열번호 57로서 제시된 아미노산 서열,
(v) 서열번호 59로서 제시된 아미노산 서열,
(w) 서열번호 61로서 제시된 아미노산 서열,
(x) 서열번호 63으로서 제시된 아미노산 서열,
(y) 서열번호 65로서 제시된 아미노산 서열,
(z) 서열번호 67로서 제시된 아미노산 서열,
(aa) 서열번호 69로서 제시된 아미노산 서열,
(bb) 서열번호 71로서 제시된 아미노산 서열,
(cc) 서열번호 2, 서열번호 4, 서열번호 6, 서열번호 8, 서열번호 10, 서열번호 12, 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26, 서열번호 28, 서열번호 30, 서열번호 32, 서열번호 34, 서열번호 36, 서열번호 53, 서열번호 55, 서열번호 57, 서열번호 59, 서열번호 61, 서열번호 63, 서열번호 65, 서열번호 67, 서열번호 69, 또는 서열번호 71과 상당한 서열 동일성을, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열, 및
(dd) (a)~(cc) 중 어느 하나에 제시된 아미노산 서열의 임의의 VP2 및/또는 VP3 부분의 아미노산 서열.
구현예 70. 구현예 41 내지 69 중 어느 하나에 있어서, 단백질:단백질 결합 쌍의 제1 구성원은 검출 가능한 표지를 포함하는, AAV 캡시드 단백질.
구현예 71. 구현예 70에 있어서, 검출 가능한 표지는 c-myc(서열번호 44)를 포함하는, AAV 캡시드 단백질.
구현예 72. 구현예 41 내지 71 중 어느 하나의 AAV 캡시드 단백질을 포함하는 AAV 입자.
구현예 73. 구현예 41 내지 71 중 어느 하나의 AAV 캡시드 단백질을 암호화하는 cap 유전자를 포함하는 핵산.
구현예 74. AAV 캡 단백질을 암호화하는 AAV cap 유전자를 포함하는 핵산 분자로서,
AAV cap 유전자는
(i) 비영장류 동물 AAV의 cap 유전자,
(ii) 원격 AAV의 cap 유전자, 또는
(iii) 이들의 조합으로 이루어진 군으로부터 선택된 cap 유전자의 뉴클레오티드 서열의 적어도 일부를 포함하되,
상기 AAV cap 유전자는 다음을 포함하도록 추가로 변형되는, 핵산 분자:
(a) 단백질:단백질 결합 쌍의 제1 구성원을 암호화하는 뉴클레오티드 서열,
(b) 검출 가능한 표지를 암호화하는 뉴클레오티드 서열,
(c) 점돌연변이,
(d) 비영장류 동물 AAV, 원격 AAV, 또는 이들의 조합의 cap 유전자로 이루어진 군으로부터 선택된 AAV cap 유전자의 상기 뉴클레오티드 서열에 작동 가능하게 연결된 다른 AAV cap 유전자의 뉴클레오티드 서열의 일부를 포함하는 키메라 뉴클레오티드 서열,
(e) (a), (b), (c), 및 (d)의 임의의 조합.
구현예 75. AAV 캡 단백질을 암호화하는 AAV cap 유전자를 포함하는 핵산 분자로서,
AAV cap 유전자는 비영장류 동물 AAV의 cap 유전자의 뉴클레오티드 서열의 적어도 일부를 포함하고,
상기 AAV cap 유전자는 다음을 포함하도록 추가로 변형되는, 핵산 분자:
(a) 단백질:단백질 결합 쌍의 제1 구성원을 암호화하는 뉴클레오티드 서열,
(b) 검출 가능한 표지를 암호화하는 뉴클레오티드 서열,
(c) 점돌연변이,
(d) 비영장류 동물 AAV의 cap 유전자의 상기 뉴클레오티드 서열에 작동 가능하게 연결된 다른 AAV cap 유전자의 뉴클레오티드 서열의 일부를 포함하는 키메라 뉴클레오티드 서열,
(e) (a), (b), (c), 및 (d)의 임의의 조합.
구현예 76. AAV 캡 단백질을 암호화하는 AAV cap 유전자를 포함하는 핵산 분자로서,
AAV cap 유전자는 원격 AAV의 cap 유전자의 뉴클레오티드 서열의 적어도 일부를 포함하고,
상기 AAV cap 유전자는 다음을 포함하도록 추가로 변형되는, 핵산 분자:
(a) 단백질:단백질 결합 쌍의 제1 구성원을 암호화하는 뉴클레오티드 서열,
(b) 검출 가능한 표지를 암호화하는 뉴클레오티드 서열,
(c) 점돌연변이,
(d) 원격 동물 AAV의 cap 유전자의 상기 뉴클레오티드 서열에 작동 가능하게 연결된 다른 AAV cap 유전자의 뉴클레오티드 서열의 일부를 포함하는 키메라 뉴클레오티드 서열,
(e) (a), (b), (c), 및 (d)의 임의의 조합.
구현예 77. AAV rep 유전자 및 AAV cap 유전자를 포함하는 핵산 분자로서,
AAV cap 유전자는
(i) 비영장류 동물 AAV의 cap 유전자,
(ii) 원격 AAV의 cap 유전자, 및
(iii) 이들의 조합으로 이루어진 군으로부터 선택된 cap 유전자의 뉴클레오티드 서열의 적어도 일부를 포함하되,
AAV rep 유전자는 다른 AAV의 AAV rep 유전자의 제2 뉴클레오티드 서열을 포함하는, 핵산 분자.
구현예 78. AAV rep 유전자 및 AAV cap 유전자를 포함하는 핵산 분자로서,
AAV cap 유전자는 비영장류 동물 AAV의 cap 유전자의 제1 뉴클레오티드 서열을 포함하고,
AAV rep 유전자는 다른 AAV의 AAV rep 유전자의 제2 뉴클레오티드 서열을 포함하는, 핵산 분자.
구현예 79. AAV rep 유전자 및 AAV cap 유전자를 포함하는 핵산 분자로서,
AAV cap 유전자는 원격 동물 AAV의 cap 유전자의 제1 뉴클레오티드 서열을 포함하고,
AAV rep 유전자는 다른 AAV의 AAV rep 유전자의 제2 뉴클레오티드 서열을 포함하는, 핵산 분자.
구현예 80. 구현예 73 내지 79 중 어느 하나에 있어서, cap 유전자는 프로모터에 작동 가능하게 연결되는, 핵산 분자.
구현예 81. 구현예 80에 있어서, 상기 프로모터는 포장 세포에서 캡시드 단백질(들)의 발현을 유도하는, 핵산 분자.
구현예 82. 구현예 80 또는 구현예 81에 있어서, 프로모터는 p40, SV40, EF, CMV, B19p6, 및 CAG로부터 선택되는, 핵산 분자.
구현예 83. 구현예 73 내지 82 중 어느 하나에 있어서, 비영장류 동물 AAV의 cap 유전자, 원격 AAV의 cap 유전자, 또는 이들의 조합의 상기 뉴클레오티드 서열은 다음을 포함하도록 변형되는, 핵산 분자:
(a) 단백질:단백질 결합 쌍의 적어도 제1 구성원을 암호화하는 뉴클레오티드 서열,
(b) 검출 가능한 표지를 암호화하는 뉴클레오티드 서열, 및/또는
(c) 점 돌연변이를 암호화하는 뉴클레오티드 서열.
구현예 84. 구현예 83에 있어서, 단백질:단백질 결합 쌍은 SpyTag:SpyCatcher, SpyTag:KTag, Isopeptag:pilin-C, SnoopTag:SnoopCatcher, 및 SpyTag002:SpyCatcher002로부터 선택되는, 핵산 분자.
구현예 85. 구현예 83에 있어서, 단백질:단백질 결합 쌍의 제1 구성원은 서열번호 44로서 제시된 서열을 포함하는 c-myc를 포함하는, 핵산 분자.
구현예 86. 구현예 83 내지 85 중 어느 하나에 있어서, 검출 가능한 표지는 IGTRYLTR(서열번호 45)의 아미노산 서열을 포함하는 B1 에피토프를 포함하는, 핵산 분자.
구현예 87. 구현예 73 내지 86 중 어느 하나에 있어서, 비영장류 동물 AAV의 cap 유전자, 원격 AAV의 cap 유전자, 또는 이들의 조합의 상기 뉴클레오티드 서열은 비영장류 동물 AAV의 VP3 캡시드 단백질의 아미노산 서열 및/또는 원격 AAV의 VP3 캡시드 단백질의 아미노산 서열을 포함하는, 핵산 분자.
구현예 88. 구현예 73 내지 87 중 어느 하나에 있어서, 비영장류 동물 AAV의 cap 유전자, 원격 AAV의 cap 유전자, 또는 이들의 조합의 상기 뉴클레오티드 서열은 비영장류 동물 AAV의 VP2 캡시드 단백질의 아미노산 서열 및/또는 원격 AAV의 VP2 캡시드 단백질의 아미노산 서열을 암호화하는 뉴클레오티드 서열을 포함하는, 핵산 분자.
구현예 89. 구현예 73 내지 87 중 어느 하나에 있어서, 비영장류 동물 AAV의 cap 유전자, 원격 AAV의 cap 유전자, 또는 이들의 조합의 상기 뉴클레오티드 서열은 비영장류 동물 AAV의 VP1 캡시드 단백질의 아미노산 서열 및/또는 원격 AAV의 VP1 캡시드 단백질의 아미노산 서열을 암호화하는 뉴클레오티드 서열을 포함하는, 핵산 분자.
구현예 90. 구현예 73 내지 89 중 어느 하나에 있어서, cap 유전자는 다음을 암호화하는, 핵산 분자:
(i) 다음 중 어느 하나인 VP1 캡시드 단백질:
키메라 AAV VP1 캡시드 단백질(임의로, 여기서 키메라 VP1 캡시드 단백질은 비영장류 AAV 또는 원격 AAV의 VP1/VP2 공통 영역 VP3 영역에 작동 가능하게 연결된 다른 AAV의 VP1-고유 영역(VP1-u)을 포함함); 또는
비영장류 AAV 또는 원격 AAV의 VP1 캡시드 단백질,
(ii) 다음 중 어느 하나인 VP2 캡시드 단백질:
키메라 AAV VP2 캡시드 단백질(임의로, 여기서 키메라 VP2 캡시드 단백질은 비영장류 AAV 또는 원격 AAV의 VP3 영역에 작동 가능하게 연결된 다른 AAV의 VP1/VP2 공통 영역을 포함함); 또는
비영장류 AAV 또는 원격 AAV의 VP2 캡시드 단백질, 및/또는
(iii) 비영장류 AAV 또는 원격 AAV의 VP3 캡시드 단백질.
구현예 91. 구현예 73 내지 90 중 어느 하나에 있어서, cap 유전자는 다음을 암호화하는, 핵산 분자:
(i) 키메라 AAV VP1 캡시드 단백질(임의로, 여기서 키메라 VP1 캡시드 단백질은 비영장류 AAV 또는 원격 AAV의 VP1/VP2 공통 영역 VP3 영역에 작동 가능하게 연결된 다른 AAV의 VP1-고유 영역(VP1-u)을 포함함),
(ii) 키메라 AAV VP2 캡시드 단백질(임의로, 여기서 키메라 VP2 캡시드 단백질은 비영장류 AAV 또는 원격 AAV의 VP3 영역에 작동 가능하게 연결된 다른 AAV의 VP1/VP2 공통 영역을 포함함); 및/또는
(iii) 비영장류 AAV 또는 원격 AAV의 VP3 캡시드 단백질.
구현예 92. 구현예 73 내지 90 중 어느 하나에 있어서, cap 유전자는 다음을 암호화하는, 핵산 분자:
(i) 키메라 AAV VP1 캡시드 단백질(임의로, 여기서 키메라 VP1 캡시드 단백질은 비영장류 AAV 또는 원격 AAV의 VP1/VP2 공통 영역 VP3 영역에 작동 가능하게 연결된 다른 AAV의 VP1-고유 영역(VP1-u)을 포함함),
(ii) 비영장류 AAV 또는 원격 AAV의 VP2 캡시드 단백질, 및
(iii) 비영장류 AAV 또는 원격 AAV의 VP3 캡시드 단백질.
구현예 93. 구현예 73 내지 90 중 어느 하나에 있어서, cap 유전자는 다음을 암호화하는, 핵산 분자:
(i) 비영장류 AAV 또는 원격 AAV의 VP1 캡시드 단백질,
(ii) 비영장류 AAV 또는 원격 AAV의 VP2 캡시드 단백질, 및/또는
(iii) 비영장류 AAV 또는 원격 AAV의 VP3 캡시드 단백질,
구현예 94. 구현예 73 내지 93 중 어느 하나에 있어서, 상기 다른 AAV는 영장류 AAV 또는 영장류 AAV의 조합인, 핵산 분자.
구현예 95. 구현예 73 내지 94 중 어느 하나에 있어서, 상기 다른 AAV는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, 및 이들의 조합으로 이루어진 군으로부터 선택되는, 핵산 분자.
구현예 96. 구현예 73 내지 95 중 어느 하나에 있어서, 상기 다른 AAV는 AAV2인, 핵산 분자.
구현예 97. 구현예 73 내지 75, 77 내지 78, 및 80 내지 96 중 어느 하나에 있어서, 상기 비영장류 동물 AAV는 표 2에 열거된 비영장류 AAV인, 핵산 분자.
구현예 98. 구현예 73 내지 75, 77 내지 78, 및 80 내지 97 중 어느 하나에 있어서, 비영장류 AAV는 조류 AAV, 바다 사자 AAV, 또는 턱수염 도마뱀 AAV인, 핵산 분자.
구현예 99. 구현예 73 내지 75, 77 내지 78, 및 80 내지 98 중 어느 하나에 있어서, 비영장류 AAV는 AAAV인, 핵산 분자.
구현예 100. 구현예 73 내지 75, 77 내지 78, 및 80 내지 99 중 어느 하나에 있어서, 변형은 AAAV의 VP1 캡시드 단백질의 위치 I444 또는 I580을 암호화하는 코돈에서의 변형인, 핵산 분자.
구현예 101. 구현예 73 내지 75, 77 내지 78, 및 80 내지 98 중 어느 하나에 있어서, 비영장류 동물 AAV는 유린류 AAV인, 핵산 분자.
구현예 102. 구현예 73 내지 75, 77 내지 78, 80 내지 98, 및 101 중 어느 하나에 있어서, 유린류 AAV는 턱수염 도마뱀 AAV인, 핵산 분자.
구현예 103. 구현예 73 내지 75, 76 내지 77, 및 80 내지 98, 및 101 내지 102 중 어느 하나에 있어서, 변형은 턱수염 도마뱀 AAV의 VP1 캡시드 단백질의 위치 I573 또는 I436을 암호화하는 코돈에서의 변형인, 핵산 분자.
구현예 104. 구현예 73 내지 75, 76 내지 77, 및 80 내지 98 중 어느 하나에 있어서, 비영장류 AAV는 포유류 AAV인, 핵산 분자.
구현예 105. 구현예 73 내지 75, 77 내지 78, 80 내지 98, 및 104 중 어느 하나에 있어서, 포유류 AAV는 바다 사자 AAV인, 핵산 분자.
구현예 106. 구현예 73 내지 75, 77 내지 78, 80 내지 98, 및 105 중 어느 하나에 있어서, 변형은 바다 사자 AAV의 VP1의 I429, I430, I431, I432, I433, I434, I436, I437, 및 A565로 이루어진 군으로부터 선택된 위치에서의 변형인, 핵산 분자.
구현예 107. 구현예 73 내지 106 중 어느 하나에 있어서, 다음으로 이루어진 군으로부터 선택된 뉴클레오티드 서열을 포함하는, 핵산 분자:
(a) 서열번호 1로서 제시된 뉴클레오티드 서열,
(b) 서열번호 3으로서 제시된 뉴클레오티드 서열,
(c) 서열번호 5로서 제시된 뉴클레오티드 서열,
(d) 서열번호 7로서 제시된 뉴클레오티드 서열,
(e) 서열번호 9로서 제시된 뉴클레오티드 서열,
(f) 서열번호 11로서 제시된 뉴클레오티드 서열,
(g) 서열번호 13으로서 제시된 뉴클레오티드 서열,
(h) 서열번호 15로서 제시된 뉴클레오티드 서열;
(i) 서열번호 17로서 제시된 뉴클레오티드 서열,
(j) 서열번호 19로서 제시된 뉴클레오티드 서열,
(k) 서열번호 21로서 제시된 뉴클레오티드 서열,
(l) 서열번호 23으로서 제시된 뉴클레오티드 서열,
(m) 서열번호 25로서 제시된 뉴클레오티드 서열,
(n) 서열번호 27로서 제시된 뉴클레오티드 서열,
(o) 서열번호 29로서 제시된 뉴클레오티드 서열,
(p) 서열번호 31로서 제시된 뉴클레오티드 서열,
(q) 서열번호 33으로서 제시된 뉴클레오티드 서열,
(r) 서열번호 35로서 제시된 뉴클레오티드 서열,
(s) 서열번호 52로서 제시된 뉴클레오티드 서열,
(t) 서열번호 54로서 제시된 뉴클레오티드 서열
(u) 서열번호 56으로서 제시된 뉴클레오티드 서열
(v) 서열번호 58로서 제시된 뉴클레오티드 서열
(w) 서열번호 60으로서 제시된 뉴클레오티드 서열
(x) 서열번호 62로서 제시된 뉴클레오티드 서열
(y) 서열번호 64로서 제시된 뉴클레오티드 서열
(z) 서열번호 66으로서 제시된 뉴클레오티드 서열
(aa) 서열번호 68로서 제시된 뉴클레오티드 서열
(bb) 서열번호 70으로서 제시된 뉴클레오티드 서열
(cc) VP2 캡시드를 암호화하는 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 또는 이의 어느 하나에 제시된 뉴클레오티드 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95%의 동일성을 갖는 뉴클레오티드 서열,
(dd) VP2 캡시드 단백질 및/또는 VP3 캡시드 단백질을 암호화하는 (a)~(s)의 뉴클레오티드 서열의 임의의 일부.
구현예 108. 구현예 73 내지 107 중 어느 하나에 있어서, 하나 이상의 AAV Rep 단백질을 암호화하고, 프로모터에 작동 가능하게 연결되는 AAV rep 유전자를 추가로 포함하는, 핵산 분자.
구현예 109. 구현예 108에 있어서, 프로모터는 p5, p19 SV40, EF, CMV, B19p6, 및 CAG로 이루어진 군으로부터 선택되는, 핵산 분자.
구현예 110. 구현예 108 또는 구현예 109에 있어서, 하나 이상의 Rep 단백질은 Rep78, Rep68, Rep52, 및 Rep40으로부터 선택되는, 핵산 분자.
구현예 111. 구현예 108 내지 110 중 어느 하나에 있어서, 하나 이상의 Rep 단백질은 Rep78을 포함하는, 핵산 분자.
구현예 112. 구현예 108 내지 110 중 어느 하나에 있어서, 하나 이상의 Rep 단백질은 유인원 동물 AAV Rep 단백질인, 핵산 분자.
구현예 113. 구현예 73 내지 112 중 어느 하나의 아미노산 서열을 포함하는 AAV 캡시드 단백질.
구현예 114. 구현예 113의 캡시드 단백질을 포함하는 AAV 입자.
구현예 115. 구현예 73 내지 112 중 어느 하나에 따른 cap 유전자를 포함하는 핵산 분자를 포함하는 AAV 입자를 생산하기 위한 포장 세포.
구현예 116. 구현예 115에 있어서, 하나 이상의 AAV Rep 단백질을 암호화하는 rep 유전자를 포함하는 핵산 분자를 추가로 포함하되, 상기 rep 유전자는 프로모터에 작동 가능하게 연결되고, 임의로, rep 유전자 및 cap 유전자는 2개의 상이한 AAV의 유전자인, 포장 세포.
구현예 117. 구현예 116에 있어서, rep 유전자에 작동 가능하게 연결된 프로모터는 포장 세포에서 Rep 단백질(들)의 발현을 유도하는, 포장 세포.
구현예 118. 구현예 116 또는 구현예 117에 있어서, 프로모터는 p5, p19 SV40, EF, CMV, B19p6, 및 CAG로부터 선택되는, 포장 분자.
구현예 119. 구현예 116 내지 118 중 어느 하나에 있어서, 하나 이상의 Rep 단백질은 Rep78, Rep68, Rep52, 및 Rep40으로부터 선택되는, 포장 세포.
구현예 120. 구현예 116 내지 119 중 어느 하나에 있어서, 하나 이상의 Rep 단백질은 Rep78을 포함하는, 포장 세포.
구현예 121. 구현예 116 내지 120 중 어느 하나에 있어서, 하나 이상의 Rep 단백질은 영장류 동물 AAV Rep 단백질인, 포장 세포.
구현예 122. 구현예 116 내지 120 중 어느 하나에 있어서, 하나 이상의 Rep 단백질은 비영장류 동물 AAV Rep 단백질인, 포장 세포.
구현예 123. 구현예 116 내지 122 중 어느 하나에 있어서, 하나 이상의 Rep 단백질에 의해 인식되는 적어도 하나의 AAV 역위 말단 반복(ITR) 서열이 적어도 일측에 위치하는 관심 뉴클레오티드의 뉴클레오티드 서열을 포함하는 핵산 분자를 추가로 포함하는, 포장 세포.
구현예 124. 구현예 123에 있어서, 뉴클레오티드의 타측에는 적어도 하나의 ITR과 동일한 AAV의 제2 ITR이 위치하는, 포장 세포.
구현예 125. 구현예 124에 있어서, 뉴클레오티드의 타측에는 제2 ITR이 위치하고, 제2 ITR 및 적어도 하나의 ITR은 상이한 AAV의 ITR인, 포장 세포.
구현예 126. 구현예 123 내지 125 중 어느 하나에 있어서, 관심 뉴클레오티드는 리포터 유전자인, 포장 세포.
구현예 127. 구현예 126에 있어서, 리포터 유전자는 β-갈락토시다아제, 녹색 형광 단백질(GFP), 강화된 녹색 형광 단백질(eGFP), MmGFP, 청색 형광 단백질(BFP), 강화된 청색 형광 단백질(eBFP), mPlum, mCherry, tdTomato, mStrawberry, J-Red, DsRed, mOrange, mKO, mCitrine, Venus, YPet, 황색 형광 단백질(YFP), 강화된 황색 형광 단백질(eYFP), 에머랄드(Emerald), CyPet, 홍색 형광 단백질(CFP), 진청색(Cerulean), T-Sapphire, 루시퍼라제(luciferase), 알칼리 포스파타아제(alkaline phosphatase), 또는 이들의 조합을 암호화하는, 포장 세포.
구현예 128. 구현예 123 내지 125 중 어느 하나에 있어서, 관심 뉴클레오티드는 치료 단백질, 자살 유전자, 항체 또는 이의 단편, CRISPR/Cas 시스템 또는 이의 일부(들), 안티센스 올리고뉴클레오티드, 리보자임, RNAi 분자, 또는 shRNA 분자를 암호화하는, 포장 세포.
구현예 129. 구현예 115 내지 133 중 어느 하나에 있어서, 기준 캡시드 단백질을 암호화하는 뉴클레오티드 서열을 추가로 포함하는, 포장 세포.
구현예 130. 바이러스 입자를 생산하는 방법으로서, 바이러스 입자를 생산하기에 충분한 조건에서 구현예 115 내지 129 중 어느 하나에 따른 포장 세포를 배양하는 단계를 포함하는, 방법.
구현예 131. 구현예 130에 있어서, 포장 세포는 관심 뉴클레오티드를 포함하는 헬퍼 플라스미드 및/또는 전달 플라스미드를 추가로 포함하는, 방법.
구현예 132. 구현예 130 또는 구현예 131에 있어서, 다음 단계 중 하나 이상을 추가로 포함하되:
a. 세포 찌꺼기를 제거하는 단계,
b. 바이러스 입자를 함유하는 상청액을 벤조나아제 또는 DNase I 및 MgCl2로 처리하는 단계,
c. 바이러스 입자를 농축시키는 단계,
d. 바이러스 입자를 정제하는 단계, 및
e. a 내지 d의 임의의 조합,
임의로, 바이러스 입자는 자가-상보성 아데노-연관 바이러스 입자이고/이거나 배양 상청액으로부터 단리되는, 방법.
구현예 133. 구현예 130 내지 132 중 어느 하나의 방법에 따라 제조된 AAV 입자.
구현예 134. 구현예 1 내지 40, 72, 114, 및 133 중 어느 하나에 있어서, 관심 뉴클레오티드를 추가로 포함하는, AAV 입자.
구현예 135. 구현예 134에 있어서, 관심 뉴클레오티드는 리포터 유전자인, AAV 입자.
구현예 136. 구현예 135에 있어서, 리포터 유전자는 β-갈락토시다아제, 녹색 형광 단백질(GFP), 강화된 녹색 형광 단백질(eGFP), MmGFP, 청색 형광 단백질(BFP), 강화된 청색 형광 단백질(eBFP), mPlum, mCherry, tdTomato, mStrawberry, J-Red, DsRed, mOrange, mKO, mCitrine, Venus, YPet, 황색 형광 단백질(YFP), 강화된 황색 형광 단백질(eYFP), 에머랄드(Emerald), CyPet, 홍색 형광 단백질(CFP), 진청색(Cerulean), T-Sapphire, 루시퍼라제, 알칼리 포스파타아제, 또는 이들의 조합을 암호화하는, AAV 입자.
구현예 137. 구현예 134에 있어서, 관심 뉴클레오티드는 치료 단백질, 자살 유전자, 항체 또는 이의 단편, CRISPR/Cas 시스템 또는 이의 일부(들), 안티센스 올리고뉴클레오티드, 리보자임, RNAi 분자, 또는 shRNA 분자를 암호화하는, AAV 입자.
구현예 138. 약학적 조성물로서, (a) 구현예 1 내지 40, 72, 114, 및 133 중 어느 하나에 따른 AAV 입자; 구현예 41 내지 71 및 113 중 어느 하나에 따른 AAV 캡시드 단백질을 포함하는 AAV 입자; 또는 구현예 130 내지 132 중 어느 하나의 방법에 따라 제조된 AAV 입자, 및 (b) 약학적으로 허용 가능한 담체 또는 부형제를 포함하는 약학적 조성물.
구현예 139. 관심 뉴클레오티드를 표적 세포에 전달하는 방법으로서, (a) 구현예 1 내지 40, 72, 114, 및 133 중 어느 하나에 따른 AAV 입자, 또는 (b) 구현예 138의 조성물을 표적 세포를 접촉시키는 단계를 포함하는, 방법.
구현예 140. 구현예 139에 있어서, AAV 입자의 캡시드는 표적 세포 표면에서 발현되는 단백질에 특이적으로 결합하는 표적화 리간드를 포함하는, 방법.
구현예 141. 구현예 139 또는 구현예 140에 있어서, 접촉시키는 단계은 생체 외에서 수행되는, 방법.
구현예 142. 구현예 139 또는 구현예 140에 있어서, 표적 세포는 대상체 내에 있는, 방법.
구현예 143. 구현예 142에 있어서, 대상체는 인간인, 방법.
구현예 144. 구현예 139 내지 143 중 어느 하나에 있어서, 표적 세포는 인간 세포인, 방법.
구현예 145. 구현예 139 내지 144 중 어느 하나에 있어서, 관심 뉴클레오티드는 치료 단백질, 자살 유전자, 항체 또는 이의 단편, CRISPR/Cas 시스템 또는 이의 일부(들), 안티센스 올리고뉴클레오티드, 리보자임, RNAi 분자, 또는 shRNA 분자를 암호화하는, 방법.
Figure pct00001
Figure pct00002
Figure pct00003
Figure pct00004
Figure pct00005
실시예
하기 실시예는 단지 예시를 위해 제공되며 본 발명의 범위를 한정하도록 의도되지 않는다.
물질 및 방법
세포주 및 항체
모든 293 및 293T 세포주를 10% FBS, 1% Pen/Strep, 및 1% L-글루타민을 보충한 DMEM에 유지시켰다. 293 hErbB2 및 293hASGR1/2 세포주는 부모 293 세포주를 상응하는 cDNA를 발현하는 분자로 렌티 바이러스 형질도입하여 생성하였다. 모든 세포주는 Regeneron TC core facility로부터 구입하였다. B1 항체는 AAV VP1, VP2 및 VP3에 의해 공유되는 선형 에피토프를 인식한다.
AAV 캡시드 단백질 작제물
SpyTag 삽입, 링커 아미노산의 측면 삽입, 및 점 돌연변이의 추가를 포함하여, 원하는 AAV 캡시드 서열의 중합효소 연쇄 반응 증폭을 위해 원하는 AAV 캡시드 서열 또는 프라이머를 암호화하는 GeneBlock을 IDT로부터 구입하고, 제조사의 프로토콜(NEB)에 따라 깁슨 어셈블리(Gibson Assembly)를 사용해 pAAV R2C2에 클로닝하였다.
SpyCatcher와 항체의 융합
SpyCatcher를 암호화하는 GeneBlock을 IDT로부터 구매하고, 깁슨 어셈블리를 사용하여 코딩 서열을 가요성 아미노산 링커 GSGESG(서열번호 49)에 의해 분리되는 각 작제물의 C 말단에 있는 항체 중쇄에 대한 발현 플라스미드 내로 프레임 내 복제하였다.
AAV 바이러스 입자의 제조
바이러스는, 항체의 scFv 또는 중쇄 및 경쇄 중 어느 하나를 암호화하는 추가적인 플라스미드의 유무와 상관 없이, PEI Pro 또는 PEI Max를 사용해 다음의 플라스미드로 293T 포장 세포를 형질감염시켜 생성하였다: pAd 헬퍼, 리포터 단백질을 암호화하는 AAV2 ITR-함유 게놈 플라스미드, 및 AAV Rep 및 Cap 유전자를 암호화하는 pAAV-CAP 플라스미드. scFv 및 항체 중쇄 구성물을 전술한 C 말단에서 SpyCatcher에 모두 융합한다. 형질감염을 OptiMEM에서 수행하였고, 배지를 10% FBS, 1% Pen/Strep, 및 1% L-Glut를 보충한 DMEM으로 8시간 후에 변경하였다. 형질감염 후 배지를 교환하지 않고 150 mM NaCl에서 대안적인 형질감염 프로토콜을 수행하였다.
형질감염된 포장 세포를 3일 동안 37℃에서 인큐베이션한 다음, 표준 동결-융해 프로토콜을 사용해 세포 용해물로부터 수집하였다. 간략하게, 포장 세포를 긁어서 들어 올리고 펠릿화하였다. 상청액을 제거하고, 세포를 50mM 트리스-HCl; 150mM NaCl; 및 2 mM MgCl2 [pH 8.0] 또는 25mM 트리스-HCl; 100mM NaCl; 1mM MgCl2; 2.5 mM KCl; 0.001% 플루로닉 F68 [pH 7.4]의 용액에 재현탁하였다. 3회의 연속 동결-융해 사이클을 통해 세포 용해를 유도함으로써 세포 내 바이러스 입자들을 방출시켰으며, 상기 동결-융해 사이클은 세포 현탁액을 드라이 아이스/에탄올 조와 37℃ 수조 사이를 옮겨가며 격렬하게 와동시키는 것으로 이루어진다. 점도를 60분 동안 37℃에서, 간헐적으로 혼합하며 EMD Millipore Benzonase(세포 용해물 50 U/ml)로 용해물을 처리함으로써 감소시켰다. 그런 다음, 찌꺼기를 원심분리에 의해 펠릿화하고, 생성된 상청액을 처리하여 미정제 용해물을 제조하거나 아이오디사놀-구배로 추가로 정제하였다. 미정제 용해물을 제조하기 위해, 상청액을 0.22 μm PVDF Millex-GV 필터를 통해, Ultracel-100 막(100 KDa MWCO) 필터 카트리지가 구비된 Amicon Ultra-15 원심분리 필터 유닛의 상단 챔버 내로 직접 여과하였다. 필터 유닛을 상부 챔버에서 원하는 부피가 될 때까지 5~10분 간격으로 원심분리하였고, 그런 다음 농축된 미정제 바이러스를 저 단백질 결합 튜브 내로 피펫팅하고, 4℃에서 보관하였다. 아이오디사놀-구배 정제를 위해, 용해물을 0.2 μm PES Nalgene Rapid-Flow 필터를 통해 여과하였다. AAV 함유 배지를 접선 유동 여과에 의해 별도로 농축하고, 0.001% Pluronic F-68이 보충된 1xPBS로 정용여과하였다. 정화된 용해물 또는 농축된 배지를 불연속적인 아이오디사놀 구배 상에 로딩하고, SW 32 Ti 로터를 사용하여 10℃에서 16 내지 18시간 동안 29,600 rpm으로 원심분리하였다. 40% 내지 60%의 아이오디사놀 용액 사이의 계면에서 바이러스 분획을 제거하고, 100 KDa 명목 분자량 한계를 갖는 Amicon Ultra Centrifugal 필터를 사용하여 0.001% Pluronic F-68로 보충된 1xPBS로 교환하였다. 알려진 농도의 바이러스의 표준 곡선을 사용하여 qPCR에 의해 역가(밀리리터당 벡터 게놈, vg/mL)를 결정하였다.
세포 감염/형질도입 및 유세포 계측/형광 분석
세포를 감염시키기 위해, 바이러스 입자를 배양 중인 세포 배지에 직접적으로 첨가하고, 혼합물을 37℃에서 밤새 인큐베이션하였다. 미정제 용해물로 형질도입하기 위해, 각 웰 내의 배지를 24시간 후에 교체하고, 세포를 3~5일 동안 인큐베이션하였다. GFP 발현의 평가를 위해, 감염 후 3, 4, 또는 5일차에, 세포를 트립신으로 처리하고, 2% FBS가 포함된 PBS에 재현탁하고, BD FACSCanto 유세포 계측기를 이용해 GFP+ 세포의 백분율을 집계하고, FlowJo 소프트웨어를 사용하여 분석하였다. NanoLuc 발현의 평가를 위해, 감염 후 2 또는 3일차에, 세포를 1x 패시브 용해 완충액(Promega)에서 용해시키고 Nano-Glo 루시퍼라제 분석 시약과 함께 인큐베이션하였다. 발광은 SpectraMax 플레이트 판독기를 사용하여 평가하였다.
IgG 존재 시의 중화 분석
PBS에서 제조한 정제된 인간 IgG를 그 농도를 증가시키면서 바이러스 입자와 혼합하고, 바이러스 입자와 IgG의 혼합물을 37℃에서 30분 동안 인큐베이션하여 결합되도록 하였다. 세포를 감염시키기 위해, 배양 중인 세포 배지에 바이러스 입자를 직접 첨가하고, 혼합물을 37℃에서 2일 동안 인큐베이션하였다. 감염 후 2일차에, Nanoglo 루시퍼라제 검정(Promega)을 사용해 Nanoluc 발현발현을 측정하고, 플레이트 판독기(PerkinElmer)를 이용해 RLU 데이터를 수집하였다.
웨스턴 블롯 분석법
SpyTag가 태그된 AAV 단백질 VP1, VP2, 및 VP3와 SpyCatcher가 태그된 항체 또는 scFv 사이의 반응을 웨스턴 블롯 분석법으로 모니터링하였다. 환원제가 포함된 Novex® Tris-Glycine SDS 샘플 완충액을 미정제 바이러스 제제와 동일한 부피로 첨가하고, 샘플을 85℃에서 5분 동안 가열한 다음, 실온으로 냉각시키고 프리-캐스트 4~12% Tris-Glycine 겔(Invitrogen) 상에 로딩하였다. 단백질을 환원 SDS-PAGE로 분리하고, 습식 전사를 통해 PVDF 상에 블롯팅하였다. 5% 밀크로 막을 차단하고, 4℃의 TBST에서 1:100으로 밤새 희석시킨 마우스 단클론 B1 항체(ARP American Research Products, Inc.)로 프로브하였다. 블롯을 TBST에서 세척하고, 항-마우스 HRP-접합 항체로 프로브하고, Bio-Rad ChemiDoc MP 이미저 상에서 화학발광 검출 시약을 사용하여 검출하였다.
단백질 염색 분석
AAV 단백질 VP1, VP2, 및 VP3의 상대 발현을 SDS-PAGE 겔의 단백질 염색 분석에 의해 모니터링하였다. NuPAGE LDS 샘플 완충액 및 환원제(Invitrogen)를 제조사의 지침에 따라 사용하여 AAV 샘플을 제조하였다. 샘플을 95℃로 10분 동안 가열한 다음, 실온으로 냉각시키고, 프리캐스트 4~12% NuPAGE Bis-Tris 겔(Invitrogen) 상에 로딩하였다. 단백질 분리 후, 겔을 50% 메탄올; 7% 아세트산 중에 고정시키고, SYPRO Ruby 겔 염색(Invitrogen)에서 염색하고, 10% 메탄올;7% 아세트산에서 세척하였다. Bio-Rad ChemiDoc MP 이미저 상에서 겔 이미지를 캡쳐하였다.
실시예 1. 비영장류 AAV 키메라 입자는 친화도 크로마토그래피를 통해 생산하고 정제할 수 있다.
각각의 바이러스는, 293T 포장 세포의 15 cm 플레이트 1개를 다음의 플라스미드와 다음의 양으로 형질감염시켜 전술한 바와 같이 생성하였다:
pAd Helper 8μg
pAAV-UbC-반딧불이 루시퍼라제 4μg
pRep Cap 플라스미드 작제물 4μg
다음을 포함하는 Rep Cap 플라스미드 작제물:
pRep2 Cap AAV2 VP1 AAAV VP2 VP3
pRep2 Cap AAV2 VP1 바다 사자 VP2 VP3
pRep2 Cap AAV2 VP1 턱수염 도마뱀 VP2 VP3
그런 다음, 미정제 바이러스 제제를 친화도 크로마토그래피를 통해 정제하고, 투입물, 관류(FT) 도중, 및 용리 분획에 존재하는 캡시드 단백질을 웨스턴 블롯팅에 의해 평가하였다(도 2). 3가지 바이러스 모두에서 유래된 캡시드 단백질이 크로마토그래피 컬럼 투입물에 존재하였고, 관류에서 감소하였고, 용리 분획에 존재하였는데, 이는 AAV2와 같은 영장류-유래 캡시드를 정제하는 데 사용되는 친화도 컬럼 크로마토그래피 접근법이 비영장류 AAV의 정제에도 사용될 수 있음을 시사한다.
다음의 실시예 각각에서, 다음을 포함하는 pRep2 Cap AAV2 VP1 AAAV VP2 VP3 플라스미드는 "pAAV R2Cap AAV2/AAAV"로 표기된다: AAV2의 rep 유전자; 및 AAAV의 VP1/VP2 공통 영역, AAAV VP2 캡시드 단백질, 및 AAAV VP3 캡시드 단백질과 작동 가능하게 연결된 AAV2의 VP1-u 영역을 포함하는 키메라 VP1 캡시드 단백질을 암호화하는 키메라 cap 유전자. 다음을 포함하는 pRep2 Cap AAV2 VP1 바다 사자 VP2 VP3 플라스미드는 "pAAV R2Cap AAV2/바다 사자"로 표기된다: AAV2의 rep 유전자; 및 바다 사자 AAV의 VP1/VP2 공통 영역, 바다 사자 VP2 캡시드 단백질, 및 바다 사자 VP3 캡시드 단백질과 작동 가능하게 연결된 AAV2의 VP1-u 영역을 포함하는 키메라 VP1 캡시드 단백질을 암호화하는 키메라 cap 유전자. 다음을 포함하는 pRep2 Cap AAV2 VP1 턱수염 도마뱀 VP2 VP3 플라스미드는 "pAAV R2Cap AAV2/턱수염 도마뱀"으로 표기된다: AAV2의 rep 유전자; 및 턱수염 도마뱀 AAV의 VP1/VP2 공통 영역, 턱수염 도마뱀 VP2 캡시드 단백질, 및 턱수염 도마뱀 VP3 캡시드 단백질과 작동 가능하게 연결된 AAV2의 VP1-u 영역을 포함하는 키메라 VP1 캡시드 단백질을 암호화하는 키메라 cap 유전자.
실시예 2. 조류 AAV 캡시드의 VP3 영역 내로의 펩티드 삽입은 내약성이 양호하며, SpyCatcher-SpyTag를 통해 바이러스 입자에 대한 항체의 공유 부착을 매개할 수 있다.
조류 AAV의 추정 가변 루프 IV 및 가변 루프 VIII 내의 잠재적인 펩티드 삽입 부위를 PyMol 모델링을 사용하여 예측하고(도 3a), 상응하는 SpyTag 삽입 작제물을 클로닝하였다. 각각의 바이러스는, 293T 포장 세포의 15 cm 플레이트 1개를 다음의 플라스미드와 다음의 양으로 형질감염시켜 전술한 바와 같이 생성하였다:
pAd Helper 16μg
pAAV-CAG-GFP 8μg
pAAV R2CapX 8μg
다음을 포함하는 pAAV R2CapX 작제물:
pAAV R2Cap AAV2/AAAV No SpyTag
pAAV R2Cap AAV2/AAAV G444 링커6 SpyTag
pAAV R2Cap AAV2/AAAV K580 링커6 SpyTag
또는
pAd Helper 16μg
pAAV-CAG-GFP 8μg
pAAV R2Cap AAV2/AAAV No SpyTag 6.7ug
다음을 포함함
pAAV R2Cap AAV2/AAAV G444 링커6 SpyTag 1.3μg
또는
pAAV R2Cap AAV2/AAAV K580 링커6 SpyTag 1.3μg
위에 열거된 바와 같이, SpyTag 삽입이 결여된 키메라 AAV2/AAAV 입자를 비롯하여 캡시드 내의 다양한 위치에서 SpyTag 삽입을 갖는 키메라 AAV2/AAAV 입자를 ITR2-함유 AAV 게놈으로 포장하였다. 키메라 AAV2/AAAV 캡시드가 성공적으로 형성되고 AAV2 ITR을 함유하는 게놈으로 포장될 수 있는지 여부를 이해하기 위한 노력의 일환으로, 정량적 PCR을 수행하여 SpyTag 삽입이 결여된 키메라 AAV2/AAAV 입자 대비 SpyTag 삽입을 갖는 키메라 AAV2/AAAV 입자의 역가(밀리리터 당 게놈의 수 또는 vg/mL)를 측정하였다(도 3b). 측정된 역가는 키메라 AAV2/AAAV 입자가 AAV2 ITR 게놈으로 포장될 수 있음을 입증한다. 키메라 AAV2/AAAV 입자의 역가는 SpyTag 삽입이 결여된 키메라 AAV2/AAAV 입자와 SpyTag 삽입을 갖는 키메라 AAV2/AAAV 입자 간에 유사하였다.
다음은, SpyTag 삽입이 결여된 키메라 AAV2/AAAV 입자 및 ASGR1에 결합하는 SpyCatcher가 태그된 항체가 있거나 없이 SpyTag 삽입을 갖는 키메라 AAV2/AAAV 입자이다. SpyTag가 태그된 키메라 AAV2/AAAV 단백질 VP1, VP2, 및 VP3와 SpyCatcher가 태그된 항-ASGR1 중쇄 사이의 반응을 웨스턴 블롯에 의해 모니터링하였으며; SpyCatcher가 태그된 항체와 반응했던 SpyTag가 태그된 캡시드 단백질은 SDS-PAGE에 의하면 크기 증가를 나타낸다. SpyCatcher가 태그된 항-ASGR1 mAb가 존재하는 경우, SpyTag가 태그된 키메라 AAV2/AAAV 캡시드 단백질은, 웨스턴 블롯팅에 의하면, SpyTag가 태그된 AAAV 캡시드 단백질 단독과 비교하여 명백한 크기 증가를 나타냈다(도 3c). 이는 SpyTag가 태그된 키메라 AAV2/AAAV 입자가 SpyCatcher가 태그된 항-ASGR1 mAb와 공유 결합을 성공적으로 형성할 수 있었음을 나타냈다.
실시예 3. 바다 사자 AAV 캡시드의 VP3 영역 내로의 펩티드 삽입은 내약성이 양호하며, SpyCatcher-SpyTag를 통해 바이러스 입자에 대한 항체의 공유 부착을 매개할 수 있다.
바다 사자 AAV의 추정 가변 루프 IV 및 가변 루프 VIII 내의 잠재적인 펩티드 삽입 부위를 PyMol 모델링을 사용하여 예측하고(도 4a), 상응하는 SpyTag 삽입 작제물을 클로닝하였다. 각각의 바이러스를 전술한 바와 같이 다음의 플라스미드와 다음의 양으로 293T 포장 세포의 15 cm 플레이트 1개에 형질감염시킴으로써 만들어냈다:
pAd Helper 8μg
pAAV-CAG-GFP 4μg
pAAV R2CapX 4μg
다음을 포함하는 pAAV R2CapX 작제물:
pAAV R2Cap AAV2/바다 사자 No SpyTag
pAAV R2Cap AAV2/바다 사자 N429 링커6 SpyTag
pAAV R2Cap AAV2/바다 사자 P430 링커6 SpyTag
pAAV R2Cap AAV2/바다 사자 T431 링커6 SpyTag
pAAV R2Cap AAV2/바다 사자 G432 링커6 SpyTag
pAAV R2Cap AAV2/바다 사자 S433 링커6 SpyTag
pAAV R2Cap AAV2/바다 사자 T434 링커6 SpyTag
pAAV R2Cap AAV2/바다 사자 R436 링커6 SpyTag
pAAV R2Cap AAV2/바다 사자 D437 링커6 SpyTag
pAAV R2Cap AAV2/바다 사자 A565 링커6 SpyTag
또는
pAd Helper 8μg
pAAV-CMV-GFP 4μg
pAAV R2Cap AAV2/바다 사자 No SpyTa 3.3ug
다음을 포함함
pAAV R2Cap AAV2/바다 사자 G432 링커6 SpyTag 0.7μg
또는
pAAV R2Cap AAV2/바다 사자 A565 링커6 SpyTag 0.7μg
위에 열거된 바와 같이, SpyTag 삽입이 결여된 키메라 AAV2/바다 사자 AAV 입자를 비롯하여 캡시드 내의 다양한 위치에서 SpyTag 삽입을 갖는 키메라 AAV2/바다 사자 AAV 입자를 ITR2-함유 AAV 게놈으로 포장하였다. 키메라 AAV2/바다 사자 AAV 캡시드가 성공적으로 형성되고 AAV2 ITR을 함유하는 게놈으로 포장될 수 있는지 여부를 이해하기 위한 노력의 일환으로, 정량적 PCR을 수행하여 SpyTag 삽입이 결여된 키메라 AAV2/바다 사자 AAV 입자 대비 SpyTag 삽입을 갖는 키메라 AAV2/바다 사자 AAV 입자의 역가(밀리리터 당 게놈의 수 또는 vg/mL)를 측정하였다(도 4b, 5a). 측정된 역가는 SpyTag 삽입이 결여된 키메라 AAV2/바다 사자 AAV 입자가 AAV2 ITR 게놈으로 포장될 수 있음을 입증한다. SpyTag가 결여된 키메라 AAV2/바다 사자 AAV 입자와 위치 N429, P430, T431, G432, S433, R436, 및 D437에서 SpyTag 삽입을 갖는 키메라 AAV2/바다 사자 AAV 입자 간의 역가는 유사하였지만, 위치 T434 또는 위치 A565에서의 SpyTag 삽입은 키메라 AAV2/바다 사자 AAV에 의하면 내약성이 없었고, 역가는 좋지 않았다.
다음으로, SpyTag 삽입이 결여된 키메라 AAV2/바다 사자 AAV 입자 및 HER2에 결합하는 SpyCatcher가 태그된 항체가 있거나 없이 SpyTag 삽입을 갖는 키메라 AAV2/바다 사자 AAV 입자를 인큐베이션하였다. SpyTag가 태그된 키메라 AAV2/바다 사자 AAV 단백질 VP1, VP2, 및 VP3와 SpyCatcher가 태그된 항-HER2 중쇄 사이의 반응을 웨스턴 블롯에 의해 모니터링하였으며; SpyCatcher가 태그된 항체와 반응했던 SpyTag가 태그된 캡시드 단백질은 SDS-PAGE에 의하면 크기 증가를 나타낸다. SpyCatcher가 태그된 항-HER2 mAb가 존재하는 경우, SpyTag가 태그된 키메라 AAV2/바다 사자 AAV 캡시드 단백질은, 웨스턴 블롯팅에 의하면, SpyTag가 태그된 AAV2/바다 사자 AAV 캡시드 단백질 단독과 비교하여 명백한 크기 증가를 나타냈다(도 4c, 5b). 이는 SpyTag가 태그된 키메라 AAV2/바다 사자 AAV 입자가 SpyCatcher가 태그된 항-HER2 mAb와 공유 결합을 성공적으로 형성할 수 있었음을 나타냈다. 측정된 역가가 낮은, SpyTag가 태그된 키메라 AAV2/바다 사자 AAV 입자(T434 및 A565에 SpyTag 삽입됨)는 웨스턴 블롯 상에서 검출 가능한 단백질을 갖지 않았다(도 4c, 5b).
실시예 4. 턱수염 도마뱀 AAV 캡시드의 VP3 영역 내로의 펩티드 삽입은 내약성이 양호하며, SpyCatcher-SpyTag를 통해 바이러스 입자에 대한 항체의 공유 부착을 매개할 수 있다.
조류 AAV의 추정 가변 루프 IV 및 가변 루프 VIII 내의 잠재적인 펩티드 삽입 부위를 PyMol 모델링을 사용하여 예측하고(도 6a), 상응하는 SpyTag 삽입 작제물을 클로닝하였다. 각각의 바이러스를 전술한 바와 같이 다음의 플라스미드와 다음의 양으로 293T 포장 세포의 15 cm 플레이트 1개에 형질감염시킴으로써 만들어냈다:
pAd Helper 8μg
pAAV-CMV-GFP 4μg
pAAV R2CapX 4μg
다음을 포함하는 pAAV R2CapX 작제물:
pAAV R2Cap AAV2/턱수염 도마뱀 No SpyTag
pAAV R2Cap AAV2/턱수염 도마뱀 G436 링커6 SpyTag
pAAV R2Cap AAV2/턱수염 도마뱀 T573 링커6 SpyTag
또는
pAd Helper 8μg
pAAV-CMV-GFP 4μg
pAAV R2Cap AAV2/턱수염 도마뱀 No SpyTag 3.3ug
다음을 포함함
pAAV R2Cap AAV2/턱수염 도마뱀 G436 링커6 SpyTag 0.7μg
또는
pAAV R2Cap AAV2/턱수염 도마뱀 T573 링커6 SpyTag 0.7μg
위에 열거된 바와 같이, SpyTag가 결여된 키메라 AAV2/턱수염 도마뱀 AAV 입자를 비롯하여 캡시드 내의 다양한 위치에서 SpyTag 삽입을 갖는 키메라 AAV2/턱수염 도마뱀 AAV 입자를 ITR2-함유 AAV 게놈으로 포장하였다. 키메라 AAV2/턱수염 도마뱀 AAV 캡시드가 성공적으로 형성되고 AAV2 ITR을 함유하는 게놈으로 포장될 수 있는지 여부를 이해하기 위한 노력의 일환으로, 정량적 PCR을 수행하여 SpyTag가 결여된 키메라 AAV2/턱수염 도마뱀 AAV 입자 대비 SpyTag 삽입을 갖는 키메라 AAV2/턱수염 도마뱀 AAV 입자의 역가(밀리리터 당 게놈의 수 또는 vg/mL)를 측정하였다(도 6b). 측정된 역가는 키메라 AAV2/턱수염 도마뱀 AAV 입자가 AAV2 ITR 게놈으로 포장될 수 있음을 입증한다. SpyTag 삽입을 갖는 키메라 AAV2/턱수염 도마뱀 AAV 입자의 역가는 SpyTag가 결여된 키메라 AAV2/턱수염 도마뱀 AAV 입자보다 적었다.
다음으로, SpyTag가 결여된 키메라 AAV2/턱수염 도마뱀 AAV 입자 및 HER2에 결합하는 SpyCatcher가 태그된 항체가 있거나 없이 SpyTag 삽입을 갖는 키메라 AAV2/턱수염 도마뱀 AAV 입자를 인큐베이션하였다. SpyTag가 태그된 키메라 AAV2/턱수염 도마뱀 AAV 단백질 VP1, VP2, 및 VP3와 SpyCatcher가 태그된 항-HER2 중쇄 사이의 반응을 웨스턴 블롯에 의해 모니터링하였으며; SpyCatcher가 태그된 항체와 반응했던 SpyTag가 태그된 캡시드 단백질은 SDS-PAGE에 의하면 크기 증가를 나타낸다. SpyCatcher가 태그된 항-HER2 mAb가 존재하는 경우, SpyTag가 태그된 키메라 AAV2/턱수염 도마뱀 AAV 캡시드 단백질은, 웨스턴 블롯팅에 의하면, SpyTag가 태그된 AAV2/턱수염 도마뱀 AAV 캡시드 단백질 단독과 비교하여 명백한 크기 증가를 나타냈다(도 6c). 이는 SpyTag가 태그된 키메라 AAV2/턱수염 도마뱀 AAV 입자가 SpyCatcher가 태그된 항-HER2 mAb와 공유 결합을 성공적으로 형성할 수 있었음을 나타냈다.
실시예 5. 잔기 G444 또는 K580에서 조류 AAV 캡시드 내로 삽입된 펩티드에 대한 항체의 접합은 시험관 내에서 항원 특이적 표적화를 유도한다.
각각의 바이러스는, 293T 포장 세포의 15 cm 플레이트 1개를 다음의 플라스미드와 다음의 양으로 형질감염시켜 전술한 바와 같이 생성하였다:
pAd Helper 16μg
pAAV-CAG-GFP 8μg
pAAV R2CapX 8μg
다음을 포함하는 pAAV R2CapX 작제물:
pAAV R2Cap AAV2/AAAV No SpyTag
pAAV R2Cap AAV2/AAAV G444 링커6 SpyTag
pAAV R2Cap AAV2/AAAV K580 링커6 SpyTag
다음을 포함하거나 포함하지 않음
SpyCatcher가 융합된 Vh 중쇄 플라스미드 1.5 ug
Vk 경쇄 플라스미드 3 ug
전술한 바와 같이 SpyTag가 결여된 AAV2/조류 AAV 입자를 비롯하여 캡시드 내의 다양한 위치에서 SpyTag 삽입을 갖는 키메라 AAV2/조류 AAV를 중쇄의 C-말단에서 GLP1R에 결합하고 SpyCatcher에 융합되는 항체인 SpyCatcher-항-GLP1R; 중쇄의 C-말단에서 HER2에 결합하고 SpyCatcher에 융합되는 항체인 SpyCatcher-Herceptin; 또는 중쇄의 C-말단에서 ASGR1에 결합하고 SpyCatcher에 융합되는 항체인 SpyCatcher-항-ASGR1 중 어느 하나를 암호화하는 항체 중쇄 및 경쇄의 존재 또는 부재 하에 생산하였다. 전술한 바와 같이 바이러스 입자로 감염시킨 세포를 유동 세포 측정 분석법에 의해 평가하여 형질도입을 관찰하였다. HER2-표적화 항체에 접합된 키메라 AAV2/AAAV는 HER2+ 세포를 특이적으로 감염시켰고(도 7a), 대조군 비표적화 항-GLP1R 항체에 접합된 키메라 AAV2/AAAV는 임의의 세포 유형에서 배경 감염을 거의 나타내지 않았다(도 7a, 7b). ASGR1-표적화 항체에 접합된 키메라 AAV2/AAAV는 ASGR1+ 세포를 특이적으로 감염시켰고, ASGR1- 세포의 배경 감염을 거의 나타내지 않았다(도 7b).
실시예 6. 잔기 G432에서 바다 사자 AAV 캡시드 내로 삽입된 펩티드에 대한 항체의 접합은 시험관 내에서 항원 특이적 표적화를 유도한다.
각각의 바이러스를 전술한 바와 같이 다음의 플라스미드와 다음의 양으로 293T 포장 세포의 15 cm 플레이트 1개에 형질감염시킴으로써 만들어냈다:
pAd Helper 16μg
pAAV-CAG-GFP 8μg
pAAV R2Cap AAV2/바다 사자 No SpyTag 8ug
또는
pAd Helper 16μg
pAAV-CAG-GFP 8μg
pAAV R2Cap AAV2/바다 사자 No SpyTag 4ug
다음을 포함함
pAAV R2CapX 4ug
다음을 포함하는 pAAV R2CapX 작제물:
pAAV R2Cap AAV2/바다 사자 N429 링커6 SpyTag
pAAV R2Cap AAV2/바다 사자 P430 링커6 SpyTag
pAAV R2Cap AAV2/바다 사자 T431 링커6 SpyTag
pAAV R2Cap AAV2/바다 사자 G432 링커6 SpyTag
pAAV R2Cap AAV2/바다 사자 S433 링커6 SpyTag
pAAV R2Cap AAV2/바다 사자 R436 링커6 SpyTag
pAAV R2Cap AAV2/바다 사자 D437 링커6 SpyTag
다음을 포함하거나 포함하지 않음
SpyCatcher가 융합된 Vh 중쇄 플라스미드 1.5 ug
Vk 경쇄 플라스미드 3 ug
전술한 바와 같이 SpyTag가 결여된 AAV2/바다 사자 AAV 입자를 비롯하여 캡시드 내의 위치 G432에서 SpyTag 삽입을 갖는 키메라 AAV2/바다 사자 AAV를 중쇄의 C-말단에서 GLP1R에 결합하고 SpyCatcher에 융합되는 항체인 SpyCatcher-항-GLP1R; 중쇄의 C-말단에서 HER2에 결합하고 SpyCatcher에 융합되는 항체인 SpyCatcher-Herceptin; 또는 중쇄의 C-말단에서 ASGR1에 결합하고 SpyCatcher에 융합되는 항체인 SpyCatcher-항-ASGR1 중 어느 하나를 암호화하는 항체 중쇄 및 경쇄의 존재 또는 부재 하에 생산하였다. 전술한 바와 같이 바이러스 입자로 감염시킨 세포를 유동 세포 측정 분석법에 의해 평가하여 형질도입을 관찰하였다. G432에서 SpyTag를 갖고 HER2-표적화 항체에 접합된 키메라 AAV2/바다 사자 AAV는 HER2+ 세포를 특이적으로 감염시키고 HER- 세포의 배경 감염을 거의 나타내지 않은 반면(도 8a), 대조군 비표적화 항-GLP1R 항체에 접합된 키메라 AAV2/AAAV는 임의의 세포 유형에서 배경 감염을 거의 나타내지 않았다(도 8a, 8b). G432에서 SpyTag를 갖고 ASGR1-표적화 항체에 접합된 키메라 AAV2/바다 사자 AAV는 ASGR1+ 세포를 특이적으로 감염시켰고, ASGR1- 세포의 배경 감염을 거의 나타내지 않았다(도 8b).
SpyTag가 결여된 키메라 AAV2/바다 사자 AAV 입자를 비롯하여 전술한 바와 같이 캡시드의 예측된 가변 루프 4 내의 다양한 위치에서 SpyTag 삽입을 갖는 키메라 AAV2/바다 사자 AAV를, 중쇄의 C-말단에서 HER2에 결합하고 SpyCatcher에 융합되는 항체인 SpyCatcher-Herceptin을 암호화하는 항체 중쇄 및 경쇄의 존재 또는 부재 하에 생산하였다. 전술한 바와 같이 바이러스 입자로 감염시킨 세포를 유동 세포 측정 분석법에 의해 평가하여 형질도입을 관찰하였다. 캡시드 내의 많은 상이한 위치에서 SpyTag 삽입을 갖고 HER2-표적화 항체에 접합된 키메라 AAV2/바다 사자 AAV 입자는 HER2+ 세포를 특이적으로 감염시켰고, SpyTag가 없는 키메라 AAV2/바다 사자 AAV 입자는 HER2+ 세포의 배경 감염을 거의 나타내지 않았다(도 9). 이는 키메라 AAV2/바다 사자 AAV 캡시드 내의 다수의 부위가 SpyTag 삽입에 용이하고 SpyCatcher 융합 항체 접근법을 사용하여 재표적화하는 데 용이함을 시사한다.
실시예 7: 잔기 G436 또는 T573에서 턱수염 도마뱀 AAV 캡시드 내로 삽입된 펩티드에 대한 항체의 접합은 시험관 내에서 항원 특이적 표적화를 유도한다.
각각의 바이러스를 전술한 바와 같이 다음의 플라스미드와 다음의 양으로 293T 포장 세포의 15 cm 플레이트 1개에 형질감염시킴으로써 만들어냈다:
pAd Helper 8μg
pAAV-CMV-GFP 4μg
pAAV R2CapX 4μg
다음을 포함하는 pAAV R2CapX 작제물:
pAAV R2Cap AAV2/턱수염 도마뱀 No SpyTag
pAAV R2Cap AAV2/턱수염 도마뱀 G436 링커6 SpyTag
pAAV R2Cap AAV2/턱수염 도마뱀 T573 링커6 SpyTag
또는
pAd Helper 8μg
pAAV-CMV-GFP 4μg
pAAV R2Cap AAV2/턱수염 도마뱀 No SpyTag 3.4ug
다음을 포함함
pAAV R2Cap AAV2/턱수염 도마뱀 G436 링커6 SpyTag 0.6μg
또는
pAAV R2Cap AAV2/턱수염 도마뱀 T573 링커6 SpyTag 0.6μg
다음을 포함하거나 포함하지 않음
SpyCatcher-융합된 Vh 중쇄 플라스미드 1.5μg
Vk 경쇄 플라스미드 3 ug
전술한 바와 같이 SpyTag가 결여된 AAV2/턱수염 도마뱀 AAV 입자를 비롯하여 캡시드 내의 다양한 위치에서 SpyTag 삽입을 갖는 키메라 AAV2/턱수염 도마뱀 AAV 입자를, 중쇄의 C-말단에서 HER2에 결합하고 SpyCatcher에 융합되는 항체인 SpyCatcher-Herceptin; 또는 중쇄의 C-말단에서 ASGR1에 결합하고 SpyCatcher에 융합되는 항체인 SpyCatcher-항-ASGR1 중 어느 하나를 암호화하는 항체 중쇄 및 경쇄의 존재 또는 부재 하에 생산하였다. 전술한 바와 같이 바이러스 입자로 감염시킨 세포를 유동 세포 측정 분석법에 의해 평가하여 형질도입을 관찰하였다. HER2-표적화 항체에 접합된 키메라 AAV2/턱수염 도마뱀 AAV는 HER2+ 세포를 감염시켰다(도 10a). ASGR1-표적화 항체에 접합된 키메라 AAV2/턱수염 도마뱀 AAV는 ASGR1+ 세포를 특이적으로 감염시켰고, ASGR1- 세포의 배경 감염을 거의 나타내지 않았다(도 10b).
실시예 8: 항체-접합 조류 AAV 및 바다 사자 AAV는 AAV2보다 더 높은 수준의 정제된 인간 면역글로불린의 존재 하에 세포를 감염시킬 수 있다.
인간 혈청에서 발견되는 항체에 의한 중화에 대한 키메라 AAV2/AAAV 및 키메라 AAV2/바다 사자 AAV 입자의 민감도를 프로브하기 위해, AAV 입자를 인간 모집단에서 면역글로불린의 단면을 대표하는 수십 명 내지 수천 명의 공여자 유래의 풀링된 혈청 샘플로부터 제조한 IgG (hIgG)의 양을 증가시키면서 함께 인큐베이션 하는 중화 검정을 수행하였다.
각각의 바이러스를 전술한 바와 같이 다음의 플라스미드와 다음의 양으로 293T 포장 세포의 15 cm 플레이트에 형질감염시킴으로써 만들어냈다:
pAd Helper 16μg
pAAV-CMV-Nanoluc 8μg
pAnti-hASGR1 SpyCatcher Vh 3μg
pAnti-hASGR1 Vk 6μg
다음 중 하나를 포함함:
pAAV R2C2 N587 Myc 7.5μg
pAAV R2C2 G453 링커10 SpyTag 0.5μg
또는:
pAAV R2Cap AAV2/AAAV No SpyTag 5μg
pAAV R2Cap AAV2/AAAV K580 링커6 SpyTag 3μg
또는:
pAAV R2Cap AAV2/바다 사자 No SpyTag 5μg
pAAV R2Cap AAV2/바다 사자 G432 링커10 SpyTag 3μg
모자이크 AAV2, 캡시드 내에서 SpyTag 삽입을 갖는 모자이크 키메라 AAV2/AAAV 입자, 및 위에 열거된 것과 같이 캡시드 내에서 SpyTag 삽입을 갖는 모자이크 키메라 AAV2/바다 사자 AAV 입자를, 중쇄의 C-말단에서 hASGR1에 결합하고 SpyCatcher에 융합되는 항체인 SpyCatcher-항-ASGR1을 암호화하는 항체 중쇄 및 경쇄의 존재 하에 생산하였다. 그런 다음, 증가하는 농도의 hIgG의 존재 하에 37℃에서 30분 동안 입자를 인큐베이션한 다음, 바이러스 입자와 hIgG의 혼합물을 hASGR1을 발현하는 세포에 첨가하였다. 전술한 바와 같이 바이러스 입자로 감염시킨 세포를 Nanoglo 루시퍼라제 검정에 의해 평가하여 형질도입을 모니터링하였다.
도 11a는 표시된 농도의 hIgG의 존재 하에 표시된 바이러스 입자로 감염시킨 ASGR1+ 세포의 원 Nanoluc 루시퍼라제 활성을 보여준다. 항-ASGR1 항체에 접합된 모자이크 AAV2 입자와 비교하여, 항-ASGR1 항체에 접합된 모자이크 키메라 AAV2/AAAV 입자의 감염을 억제하기 위해서는 더 많은 양의 hIgG가 필요하고, 항-ASGR1 항체에 접합된 모자이크 키메라 AAV2/바다 사자 AAV 입자의 감염을 억제하기 위해서는 훨씬 더 많은 양의 hIgG가 필요하다. 도 11b는 도 11a의 Nanoluc 루시퍼라제 데이터를 도시한 것으로서, 3개의 AAV 혈청형을 서로 직접 비교하기 위해, 각 AAV 혈청형을 PBS 단독(hIgG 없음) 조건으로 정규화한 것이다. 항-ASGR1 항체에 접합된 모자이크 키메라 AAV2/AAAV 입자 및 항-ASGR1 항체에 접합된 모자이크 키메라 AAV2/바다 사자 AAV 입자 둘 다의 Nanoluc 루시퍼라제 발현을 감소시키기 위해서는 더 높은 농도의 hIgG가 필요하다. 2개의 독립적인 실험에 대해 감염을 50%만큼 억제하는 데 필요한 웰당 hIgG의 농도(IC50 값)가 도 11c에 도시되어 있다. 항-ASGR1 항체에 접합된 모자이크 키메라 AAV2/AAAV 입자에 대한 hIgG IC50 값 및 항-ASGR1 항체에 접합된 모자이크 키메라 AAV2/바다 사자 AAV 입자에 대한 hIgG IC50 값은 항-ASGR1 항체에 접합된 모자이크 AAV2 입자에 대한 hIgG IC50 값보다 훨씬 더 크다. 특히, 모자이크 키메라 AAV2/바다 사자 AAV 입자는 시험된 가장 높은 hIgG의 농도를 제외하고는 인간 항체에 의해 전혀 영향을 받지 않는 것으로 보인다.
실시예 9. 조류 AAV는 생체 내에서 ASGR1에 대해 재표적화될 수 있다.
ASGR1에 특이적인 항체에 접합된 바이러스 입자가 생체 내에서 hASGR1을 발현하는 간 세포에 대해 재표적화될 수 있는지 여부를 결정하기 위해, C57BL/6 배경에서 간 세포가 hASGR1을 발현하도록 유전적으로 변형된 마우스에게 반딧불이 루시퍼라제 리포터 유전자를 보유하고 SpyCatcher-SpyTag를 통해 hASGR1에 특이적인 항체 또는 인간 GLP1R을 표적화하는 대조군 항체 중 어느 하나에 접합된 모자이크 키메라 AAV2/AAAV 바이러스 입자를 정맥내 주사하였다. 인산염 완충 식염수(PBS)를 주입한 마우스가 추가 대조군으로서의 역할을 하였다.
각각의 바이러스를 전술한 바와 같이 다음의 플라스미드와 다음의 양으로 293T 포장 세포의 15 cm 플레이트에 형질감염시킴으로써 만들어냈다:
조류 AAV 항-인간 GLP1R/항-인간 ASGR1 루시퍼라제
pAd Helper 16μg
pAAV-UbC-반딧불이 루시퍼라제 8μg
pAAV R2Cap AAV2/AAAV No SpyTag 5μg
pAAV R2Cap AAV2/AAAV K580 링커6 SpyTag 3μg
다음을 포함하거나 포함하지 않음
pAnti-hGLP1R 또는 항-hASGR1 SpyCatcher Vh 2.5μg
pAnti-hGLP1R 또는 항-hASGR1 Vk 5μg
도 12는 PBS를 주사하거나, hASGR1을 표적화하는 항체에 접합되거나 비표적화 대조군으로서 hGLP1R에 접합된 전술한 것과 같은 모자이크 키메라 AAV2/AAAV 바이러스 입자를 주사한 후 33일차에 동물의 발광을 도시한다. 살아 있는 동물을 이소플루란을 사용하여 마취시키고, 루시페린 기재를 주입하고, IVIS 스펙트럼 생체 내 이미징 시스템(PerkinElmer)을 사용하여 10분 후에 촬영하였다. 도 12a는 모자이크 키메라 AAV2/AAAV-SpyTag-SpyCatcher-Vh 복합체에 의한 감염이 hASGR1-재표적화 모자이크 키메라 AAV2/AAAV를 주입한 hASGR1-발현 마우스의 간에서만 검출되었고 PBS 또는 대조군 비표적화 hGLP1R-재표적화 모자이크 키메라 AAV2/AAAV를 주입한 hASGR1-발현 마우스의 간에서는 검출되지 않았음을 보여준다. IVIS 스펙트럼 생체 내 이미징 시스템(PerkinElmer)을 사용하여 살아있는 마우스로부터 검출한 반딧불이 루시퍼라제 신호의 평균 방사휘도는 도 12b에 정량화되어 있고, 감염된 마우스의 절제 후 생체 외에서 촬영된 개별 기관의 평균 방사휘도는 도 12c에 정량화되어 있다. 이들 도면은, 모자이크 키메라 AAV2/AAAV가 hASGR1-특이적 항체에 접합될 때만 hASGR1-발현 마우스의 간을 특이적으로 형질도입한다는 것을 입증한다.
실시예 10. 바다 사자 AAV는 마우스의 생체 내에서 간과 폐를 형질도입한다.
ASGR1에 특이적인 항체에 접합된 바이러스 입자가 생체 내에서 hASGR1을 발현하는 간 세포에 대해 재표적화될 수 있는지 여부를 결정하기 위해, C57BL/6 배경에서 간 세포가 hASGR1을 발현하도록 유전적으로 변형된 마우스에게 반딧불이 루시퍼라제 리포터 유전자를 보유하고 SpyCatcher-SpyTag를 통해 hASGR1에 특이적인 항체 또는 인간 GLP1R을 표적화하는 대조군 항체 중 어느 하나에 접합된 모자이크 키메라 AAV2/바다 사자 AAV 바이러스 입자를 정맥내 주사하였다. 인산염 완충 식염수(PBS)를 주입한 마우스가 추가 대조군으로서의 역할을 하였다.
각각의 바이러스를 전술한 바와 같이 다음의 플라스미드와 다음의 양으로 293T 포장 세포의 15 cm 플레이트에 형질감염시킴으로써 만들어냈다:
바다 사자 AAV 항-인간 GLP1R/항-인간 ASGR1 루시퍼라제
pAd Helper 16μg
pAAV-UbC-반딧불이 루시퍼라제 8μg
pAAV R2Cap AAV2/바다 사자 No SpyTag 5μg
pAAV R2Cap AAV2/바다 사자 G432 링커10 SpyTag 3ug
다음을 포함하거나 포함하지 않음
pAnti-hGLP1R 또는 항-hASGR1 SpyCatcher Vh 2.5μg
pAnti-hGLP1R 또는 항-hASGR1 Vk 5μg
도 13은 PBS를 주사하거나, hASGR1을 표적화하는 항체에 접합되거나 비표적화 대조군으로서 hGLP1R에 접합된 전술한 것과 같은 모자이크 키메라 AAV2/바다 사자 AAV 바이러스 입자를 주사한 후 33일차에 동물의 발광을 도시한다. 살아 있는 동물을 이소플루란을 사용하여 마취시키고, 루시페린 기재를 주입하고, IVIS 스펙트럼 생체 내 이미징 시스템(PerkinElmer)을 사용하여 10분 후에 촬영하였다. 도 13a는 모자이크 키메라 AAV2/바다 사자 AAV-SpyTag-SpyCatcher-Vh 복합체에 의한 감염이 hASGR1-재표적화 키메라 AAV2/바다 사자 AAV를 주입한 hASGR1-발현 마우스 및 대조군 비표적화 hGLP1R-재표적화 모자이크 키메라 AAV2/바다 사자 AAV를 주입한 hASGR1-발현 마우스 모두에서 검출되었음을 보여준다. 이는 키메라 AAV2/바다 사자 AAV가 재표적화 항체의 도움 없이 마우스의 간 및 다른 기관을 자연적으로 형질도입할 수 있음을 시사한다. IVIS 스펙트럼 생체 내 이미징 시스템(PerkinElmer)을 사용하여 살아있는 마우스로부터 검출한 반딧불이 루시퍼라제 신호의 평균 방사휘도는 도 13b에 정량화되어 있고, 감염된 마우스의 절제 후 생체 외에서 촬영된 개별 기관의 평균 방사휘도는 도 13c에 정량화되어 있다. 이들 도면은, 모자이크 키메라 AAV2/바다 사자 AAV가 hASGR1-특이적 항체 또는 비표적화 대조군 hGLP1R-특이적 대조군 항체에 접합될 때 hASGR1-발현 마우스의 간과 폐를 형질도입한다는 것을 입증한다.
실시예 11. 키메라 AAV2/바다 사자 AAV는 마우스의 내이에서 약간의 자연 향성을 나타낸다.
각각의 바이러스를 전술한 바와 같이 다음의 플라스미드와 다음의 양으로 293T 포장 세포의 15 cm 플레이트에 형질감염시킴으로써 만들어냈다:
pAd Helper 16μg
pAAV-CAG-GFP 8μg
pAAV R2Cap AAV2/바다 사자 No SpyTag 8μg
키메라 AAV2/바다 사자 AAV가 마우스의 특정 조직에 대한 자연 향성을 갖는지 여부를 결정하기 위해, 피질 기관을 신생아 마우스로부터 절제하고, 생체 외에서 배양한 다음, AAV2/바다 사자 AAV 바이러스 입자를 사용해 배양물을 감염시켰다. 감염 후 3일차에, 와우 유모 세포를 Myo7a로 적색으로 염색하였으며, 바이러스는 GFP를 형질도입의 마커로서 발현하였다. 다수의 세포 유형의 강력한 형질도입이 관찰되었는데(도 14) 이는 키메라 AAV2/바다 사자 AAV 입자가 자연적으로 내이를 형질도입할 수 있음을 시사한다.
실시예 12. 키메라 AAV2/바다 사자 AAV 캡시드의 B1 에피토프를 바다 사자 AAV의 상동성 서열과 부분적으로 또는 전체적으로 치환하는 것은 내약성이 양호하고 형질도입 효율을 향상시킨다.
변형을 AAV2/바다 사자 키메라의 B1 에피토프 내에서 만들었고(도 15a), Y730에서 또는 I705에서 H712까지의 B1 에피토프 서열을 상동성 바다 사자 캡시드 서열로 치환하였다. 각각의 바이러스를 전술한 바와 같이 다음의 플라스미드와 다음의 양으로 HEK 293T 포장 세포의 15 cm 플레이트 5개, 10개, 또는 12개를 형질감염시킴으로써 생성하였다.
pAd 헬퍼 12μg
pAAV-CMV-X 6μg
다음을 포함하는 pAAV-CMV-X 작제물:
pAAV-CMV-NanoLuc 루시퍼라제
pAAV-CMV-반딧불이 루시퍼라제
pAAV R2CapX 10μg
다음을 포함하는 pAAV R2CapX 작제물:
pAAV R2Cap AAV2/바다 사자 AAV No SpyTag
pAAV R2Cap AAV2/바다 사자 AAV No SpyTag/Y730F
pAAV R2Cap AAV2/바다 사자 AAV No SpyTag/No B1
위에 열거한 바와 같이, SpyTag 삽입이 없고 캡시드 내에서 B1 에피토프 서열의 변형을 함유하는 키메라 AAV2/바다 사자 AAV 입자를 ITR2-함유 AAV 게놈으로 포장하였다. B1 에피토프가 변형된 키메라 AAV2/바다 사자 AAV 캡시드가 성공적으로 형성되고 AAV2 ITR을 함유하는 게놈으로 포장될 수 있는지 여부를 이해하기 위한 노력의 일환으로, 정량적 PCR을 수행하여 B1 에피토프가 변형된 키메라 AAV2/바다 사자 AAV 입자 대비 B1 에피토프를 가진 키메라 AAV2/바다 사자 AAV 입자의 역가(밀리리터 당 벡터 게놈의 수 또는 vg/mL)를 측정하였다(도 15b). 측정된 역가는 B1 에피토프가 변형된 키메라 AAV2/바다 사자 AAV 입자가 AAV2 ITR 게놈으로 포장될 수 있음을 입증한다. 키메라 AAV2/바다 사자 AAV 입자의 역가는 B1 에피토프 변형이 있거나 없는 키메라 AAV2/바다 사자 입자들 간에 유사하였다.
변형된 B1 에피토프를 갖는 키메라 AAV2/바다 사자 AAV 입자 내로 조립된 VP1, VP2, 및 VP3의 존재는 SDS-PAGE 및 단백질 염색에 의해 모니터링하였다. 결과는, VP2 및 VP3 대비 VP1 발현의 비율이, B1 에피토프가 있거나 B1 에피토프 내에 Y730F 돌연변이가 있는 AAV2/바다 사자 AAV 바이러스 입자에서보다 B1 에피토프가 상동성 바다 사자 AAV 캡시드 서열로 완전히 치환된 AAV2/바다 사자 AAV 바이러스 입자에서 더 컸음을 나타낸다(도 15c). 이러한 관찰은 NanoLuc 루시퍼라제 활성에 의해 결정했을 때, HEK 293T 세포의 형질도입 효율의 증가와 상관 관계가 있었다(도 15d).
B1 에피토프가 AAV 바다 사자 서열로 완전히 치환된 AAV2/바다 사자 AAV 입자에 대한 형질도입 효율의 증가가 생체 내에서 재현되는지 여부를 결정하기 위해, C57BL/6 마우스에게 반딧불이 루시퍼라제 리포터 유전자를 갖는 키메라 AAV2/바다 사자 입자를 정맥내 주사하였다. 인산염 완충 식염수(PBS)를 주입한 마우스가 추가 대조군으로서의 역할을 하였다.
도 16은 전술한 바와 같이 PBS 또는 키메라 AAV2/바다 사자 바이러스 입자 중 어느 하나를 주사한 후 34일차에 동물의 발광 데이터를 보여준다. 살아 있는 동물을 이소플루란을 사용하여 마취시키고, 루시페린 기재를 주입하고, IVIS 스펙트럼 생체 내 이미징 시스템(PerkinElmer)을 사용하여 10분 후에 촬영하였다. 감염된 마우스를 절제한 후 생체 외에서 촬영된 개별 기관의 평균 방사휘도를 정량화한다. 도면은 키메라 AAV2/바다 사자 AAV가 간과 폐를 형질도입한다는 것을 보여준다. B1 에피토프가 상동성 바다 사자 AAV 캡시드 서열로 완전히 치환되는 B1 에피토프 변형을 함유하는 AAV2/바다 사자 AAV는 심장에 대한 향성을 확장시켰고 간 및 폐에서의 형질도입을 약간 개선시켰다.
실시예 13. AAV2와 바다 사자 AAV 캡시드 서열 간의 키메라 계면의 조정 또는 AAV 바다 사자 유래의 것들로 완전히 구성된 캡시드 서열의 사용은 내약성이 양호하다.
AAV2 및 씨 바다 사자 캡시드 서열 사이의 키메라 인터페이스를 조절하여 VP1 및 VP2 고유 서열이 AAV2 또는 바다 사자 AAV 또는 이들의 조합으로부터 유래된 전사체를 생성하도록 변형을 생성하였다(도 17). 각각의 바이러스는, 전술한 바와 같이 다음의 플라스미드와 다음의 양으로 HEK 293T 포장 세포의 15 cm 플레이트 5개, 10개, 또는 20개를 형질감염시켜 생성하였다:
pAd 헬퍼 12μg
pAAV-CMV-NanoLuc 루시퍼라아제 6μg
pAAV R2CapX 10μg
다음을 포함하는 pAAV R2CapX 작제물:
pAAV R2Cap AAV2/바다 사자 AAV No SpyTag
pAAV R2Cap AAV2/바다 사자 AAV No SpyTag v2
pAAV R2Cap AAV2/바다 사자 AAV No SpyTag v3
pAAV R2Cap AAV2/바다 사자 AAV No SpyTag v4
pAAV R2Cap AAV2/바다 사자 AAV No SpyTag v5
위에 열거된 것과 같이 키메라 AAV2와 AAV 바다 사자 캡시드 서열 사이의 대안적인 계면을 갖는 키메라 AAV2/바다 사자 AAV 입자를 ITR2-함유 AAV 게놈으로 포장하였다. 이러한 대안적인 키메라 AAV2/바다 사자 캡시드가 성공적으로 형성되어 AAV2 ITR을 함유하는 게놈으로 포장될 수 있는지 여부를 이해하기 위한 노력의 일환으로, 정량적 PCR을 수행하여 용해물 또는 상청액으로부터 정제한 바이러스 입자의 역가(밀리리터 당 벡터 게놈의 수 또는 vg/mL)를 측정하였다(도 18a). 측정된 역가는 대안적인 키메라 계면을 가진 키메라 AAV2/바다 사자 AAV 입자가 AAV2 ITR 게놈으로 포장될 수 있음을 입증한다. v3을 제외한 키메라 AAV2/바다 사자 AAV 입자의 역가는 용해물로부터 정제한 키메라 AAV2/바다 사자 입자들 간에 유사하였다. 배지로부터 정제한 AAV2/바다 사자 AAV No SpyTag v5 입자의 역가는 용해물로부터 정제했을 때의 역가보다 약간 높았다. 키메라 AAV2/바다 사자 AAV 입자의 NanoLuc 루시퍼라제 활성에 의해 결정했을 때 HEK 293T 세포의 형질도입 효율은 대안적인 계면 위치들 간에 비슷하였다(도 18b18c).
대안적인 계면 부위를 가진 AAV2/바다 사자 키메라에서 B1 에피토프 서열을 완전히 상동성인 바다 사자 캡시드 서열로 변형시켜, B1 변형이 AAV2/바다 사자 AAV No SpyTag에 대해 수행된 것과 유사하게 형질도입을 향상시키게 될 것인지 여부를 결정하였다. 각각의 바이러스는, 전술한 바와 같이 다음의 플라스미드와 다음의 양으로 HEK 293T 포장 세포의 15 cm 플레이트 5개, 10개, 또는 20개를 형질감염시켜 생성하였다:
pAd Helper 12μg
pAAV-CMV-반딧불이 루시퍼라제 6μg
pAAV R2CapX 10μg
다음을 포함하는 pAAV R2CapX 작제물:
pAAV R2Cap AAV2/바다 사자 AAV No SpyTag
pAAV R2Cap AAV2/바다 사자 AAV No SpyTag/No B1 v2
pAAV R2Cap AAV2/바다 사자 AAV No SpyTag/No B1 v3
pAAV R2Cap AAV2/바다 사자 AAV No SpyTag/No B1 v4
pAAV R2Cap AAV2/바다 사자 AAV No SpyTag/No B1 v5
B1 에피토프가 AAV 바다 사자 서열로 완전히 치환된 대안적인 AAV2/바다 사자 AAV 입자에 대한 형질도입 효율의 증가가 생체 내에서 형질도입을 향상시키는지 여부를 결정하기 위해, C57BL/6 마우스에게 반딧불이 루시퍼라제 리포터 유전자를 갖는 키메라 AAV2/바다 사자 입자를 정맥내 주사하였다. 인산염 완충 식염수(PBS)를 주입한 마우스가 추가 대조군으로서의 역할을 하였다.
도 18d는 전술한 바와 같이 PBS 또는 키메라 AAV2/바다 사자 바이러스 입자 중 어느 하나를 주사한 후 46일차에 동물의 발광 데이터를 보여준다. 살아 있는 동물을 이소플루란을 사용하여 마취시키고, 루시페린 기재를 주입하고, IVIS 스펙트럼 생체 내 이미징 시스템(PerkinElmer)을 사용하여 10분 후에 촬영하였다. 감염된 마우스를 절제한 후 생체 외에서 촬영된 개별 기관의 방사휘도가 정량화되어 있다. 도면은 키메라 AAV2/바다 사자 AAV가 간, 폐, 및 심장을 형질도입한다는 것을 보여준다. 조직을 형질도입하는 AAV2/바다 사자 AAV No SpyTag/No B1 v5(서열번호 71)의 능력은, 키메라 AAV2/바다 사자 AAV 캡시드 입자 이외에, 완전히 바다 사자 캡시드로만 이루어진 AAV 캡시드 입자(비키메라 캡시드 단백질)가 유전자 전달 벡터로서 기능할 수 있음을 나타낸다.
본 발명은 다수의 구현예를 참조하여 특히 도시되고 기술되었지만, 당업자는 본 발명의 사상 및 범주를 벗어나지 않고도 본원에 개시된 다양한 구현예에 대한 형태 및 세부 사항에 있어서의 변경이 이루어질 수 있고, 본원에 개시된 다양한 구현예들이 청구범위의 범주를 제한하도록 의도되지 않는다는 것을 이해할 것이다. 본원에 기재된 방법 및 재료와 유사 또는 동등한 어떠한 방법 및 재료도 본 발명의 실시 또는 검사에 사용될 수 있으며, 몇몇 바람직한 방법 및 재료를 지금부터 설명한다. 본원에 인용된 모든 공개문헌은 그 전체가 참조로서 본원에 통합된다. 달리 정의되지 않는 한, 본원에 사용된 모든 기술적 및 과학적 용어는 본 발명이 속한 당해 기술분야의 통상의 기술을 가진 자에 의해 널리 이해되는 것과 동일한 의미를 가진다.
SEQUENCE LISTING <110> REGENERON PHARMACEUTICALS, INC. SABIN, LEAH KYRATSOUS, CHRISTOS MOLLER-TANK, SVEN <120> Modified Viral Particles and Uses Thereof <130> 10364WO01 <150> 62/852,791 <151> 2019-05-24 <160> 73 <170> PatentIn version 3.5 <210> 1 <211> 2190 <212> DNA <213> Artificial Sequence <220> <223> Cap AAV2 VP1 AAAV VP2 VP3 <400> 1 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggccggg 420 accggggaga agcgtcccga acgcgtcgac gactttttcc cgaaaaagaa gaaggccaag 480 accgagcaag gcaaagcccc tgctcaaacg ggcgaagacc ccggagaagg aacctcttcc 540 aacgctggat caagcgcccc ctctagtgtg ggatcatctg tcatggctga aggaggtggc 600 ggtccaatgg gcgatgcagg ccaaggtgcc gacggagtgg gcaattcctc gggaaattgg 660 cattgcgatt cccaatggct ggacaacgga gtcgttaccc gaaccactcg aacctgggtc 720 ctgcccagct acaacaacca cttgtacaag cggatccaag gaccgggagg aaccgacccc 780 aacaataaat tctttggatt cagcaccccc tgggggtact ttgactacaa ccgattccac 840 tgccacttct ccccccgaga ctggcaacga ctcatcaaca acaactgggg catccgaccc 900 aaagcgatgc gctttagact ctttaacatc caggttaaag aagtcactgt ccaagactcc 960 aacaccacca tcgccaacaa cctcaccagc acggtccaag tctttgcgga caaggactac 1020 cagctgccgt acgtcctcgg atcggctaca gagggcacct tcccgccgtt cccagcggat 1080 atctacacga tcccgcagta tggttactgc acgctaaact acaacaacga ggcggtggat 1140 cgttcggcct tctactgtct agactatttc ccctcagaca tgctgcggac aggaaataac 1200 tttgaattca cttacacgtt cgaggacgtt cctttccata gcatgtttgc tcacaaccag 1260 acgctagacc ggctgatgaa tcctctcgtc gatcagtacc tgtgggcttt cagttccgtc 1320 agccaaacag gctcgtctgg acgggcactc aattattcac gcgcgaccaa aaccaatatg 1380 gcaacccagt acagaaactg gttacctgga cccttcgtcc gggatcagca aatctttacg 1440 ggggctagca acatcaccca aaacaacgtg ttcaacgttt gggataaagg caagcagtgg 1500 gtgatagaca atcggatcaa tatgatgcag cccggccctg cagcagcgac cacctttagc 1560 ggagaacccg accgtcaagc catgcaaaac acgctggcct ttagtcggac ggtctacgac 1620 cagacaacca gtacgaccga tcgtaaccag ttgctcatta ccaacgaaga tgaaatcaga 1680 cccaccaact cggtcggcat cgacacgtgg ggagtagttc ccaacaacaa ccagtccaag 1740 gtgaccgccg gcactcgcgc ggccatcaac aaccaagggg cgcttcccgg gatggtgtgg 1800 caaaacagag acatttacct ccaaggaccc atttgggcca aaatccccga cacagacaat 1860 cacttccatc cgtccccgct tattggcggg tttggctgca agcatccccc tccccagatt 1920 ttcattaaaa acacacccgt cccggccaac ccttcggaaa cgttccagac ggccaaggtg 1980 gcctccttca tcaaccagta ctcgaccgga cagtgcaccg tcgaaatctt ttgggaactc 2040 aagaaggaaa cctccaagcg ctggaacccc gaaatccagt tcacctccaa ctttggcaac 2100 gcggccgaca tccagtttgc tgtctccgac accggatcct attccgaacc tcgtcccatt 2160 ggcaccagat acctgactcg tcctctgtaa 2190 <210> 2 <211> 729 <212> PRT <213> Artificial Sequence <220> <223> Cap AAV2 VP1 AAAV VP2 VP3 <400> 2 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Gly Thr Gly Glu Lys 130 135 140 Arg Pro Glu Arg Val Asp Asp Phe Phe Pro Lys Lys Lys Lys Ala Lys 145 150 155 160 Thr Glu Gln Gly Lys Ala Pro Ala Gln Thr Gly Glu Asp Pro Gly Glu 165 170 175 Gly Thr Ser Ser Asn Ala Gly Ser Ser Ala Pro Ser Ser Val Gly Ser 180 185 190 Ser Val Met Ala Glu Gly Gly Gly Gly Pro Met Gly Asp Ala Gly Gln 195 200 205 Gly Ala Asp Gly Val Gly Asn Ser Ser Gly Asn Trp His Cys Asp Ser 210 215 220 Gln Trp Leu Asp Asn Gly Val Val Thr Arg Thr Thr Arg Thr Trp Val 225 230 235 240 Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Ile Gln Gly Pro Gly 245 250 255 Gly Thr Asp Pro Asn Asn Lys Phe Phe Gly Phe Ser Thr Pro Trp Gly 260 265 270 Tyr Phe Asp Tyr Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp 275 280 285 Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Ala Met Arg 290 295 300 Phe Arg Leu Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser 305 310 315 320 Asn Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Ala 325 330 335 Asp Lys Asp Tyr Gln Leu Pro Tyr Val Leu Gly Ser Ala Thr Glu Gly 340 345 350 Thr Phe Pro Pro Phe Pro Ala Asp Ile Tyr Thr Ile Pro Gln Tyr Gly 355 360 365 Tyr Cys Thr Leu Asn Tyr Asn Asn Glu Ala Val Asp Arg Ser Ala Phe 370 375 380 Tyr Cys Leu Asp Tyr Phe Pro Ser Asp Met Leu Arg Thr Gly Asn Asn 385 390 395 400 Phe Glu Phe Thr Tyr Thr Phe Glu Asp Val Pro Phe His Ser Met Phe 405 410 415 Ala His Asn Gln Thr Leu Asp Arg Leu Met Asn Pro Leu Val Asp Gln 420 425 430 Tyr Leu Trp Ala Phe Ser Ser Val Ser Gln Thr Gly Ser Ser Gly Arg 435 440 445 Ala Leu Asn Tyr Ser Arg Ala Thr Lys Thr Asn Met Ala Thr Gln Tyr 450 455 460 Arg Asn Trp Leu Pro Gly Pro Phe Val Arg Asp Gln Gln Ile Phe Thr 465 470 475 480 Gly Ala Ser Asn Ile Thr Gln Asn Asn Val Phe Asn Val Trp Asp Lys 485 490 495 Gly Lys Gln Trp Val Ile Asp Asn Arg Ile Asn Met Met Gln Pro Gly 500 505 510 Pro Ala Ala Ala Thr Thr Phe Ser Gly Glu Pro Asp Arg Gln Ala Met 515 520 525 Gln Asn Thr Leu Ala Phe Ser Arg Thr Val Tyr Asp Gln Thr Thr Ser 530 535 540 Thr Thr Asp Arg Asn Gln Leu Leu Ile Thr Asn Glu Asp Glu Ile Arg 545 550 555 560 Pro Thr Asn Ser Val Gly Ile Asp Thr Trp Gly Val Val Pro Asn Asn 565 570 575 Asn Gln Ser Lys Val Thr Ala Gly Thr Arg Ala Ala Ile Asn Asn Gln 580 585 590 Gly Ala Leu Pro Gly Met Val Trp Gln Asn Arg Asp Ile Tyr Leu Gln 595 600 605 Gly Pro Ile Trp Ala Lys Ile Pro Asp Thr Asp Asn His Phe His Pro 610 615 620 Ser Pro Leu Ile Gly Gly Phe Gly Cys Lys His Pro Pro Pro Gln Ile 625 630 635 640 Phe Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Glu Thr Phe Gln 645 650 655 Thr Ala Lys Val Ala Ser Phe Ile Asn Gln Tyr Ser Thr Gly Gln Cys 660 665 670 Thr Val Glu Ile Phe Trp Glu Leu Lys Lys Glu Thr Ser Lys Arg Trp 675 680 685 Asn Pro Glu Ile Gln Phe Thr Ser Asn Phe Gly Asn Ala Ala Asp Ile 690 695 700 Gln Phe Ala Val Ser Asp Thr Gly Ser Tyr Ser Glu Pro Arg Pro Ile 705 710 715 720 Gly Thr Arg Tyr Leu Thr Arg Pro Leu 725 <210> 3 <211> 2145 <212> DNA <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 <400> 3 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aaccctctca gccagattcg 420 tcctcggaca acacggcgcc acccgtgaaa aagtcccgtc tcgaagaagc ccagcccatt 480 caaagtccag acgtttccag cagcactggc ggaggaattg ccgacgtcat gtctggagat 540 gctgaaatgg ctgcagtggg cgggggagca ccgggcgtcg acggccaggg tgccgaggga 600 gtgggtactt cctcgggtaa ttggcattgc gattcccagt ggtcagaagg acacgtcaga 660 accaccagca ccagaacctg ggtgttgccc agctacaaca accacctgta taaacggctt 720 ggaagtagcg cacaatccaa tacctacaac ggattctcca ccccctgggg atacctcgac 780 ttcaatagat ggcactgtca cttcagtcct cggaactggc aacgtctcat caacaacaac 840 tggggcatca gaccaaaaag acttaatgtt aaattgttca acatacaagt caaagaggtc 900 acgacggaag gggggacgac gaccgtcgcc aataacctta ccagcacgat tcaggtgttt 960 gcggacaacg cgtacgaact cccgtatgtt gtcgacgcgg gtcacgaggg ggcattgccg 1020 ccgttcccaa acgacgtgtt tatgattccc caatacggat actgcgggct ggtgtctggt 1080 caaagtcagg ctcagtcgga cttgtgttcg ttttattgcc tggagtattt tccatcccag 1140 atgctgagaa caggaaacaa ttttgaaatg aatttcaggt ttgaagacgt tccatttcac 1200 tccatgtacg cccacagcca gtctctagac aggctcatga atcctttaat tgatcagtat 1260 ctgtggagtc taaaacaaac aggaaacccg actggatcaa caacgagaga cttaaaattt 1320 atcaagaaca aagttcccaa ttttgcacat tatggaaaaa attggcttcc tggacctttt 1380 attagacaac aggggtggac aacacaaaat attaataata gtgttgttaa ttttaatgac 1440 atgctgggaa aaaattcgac atttactttg gacactagat ggagttcatt agcgcctggt 1500 ccgtgtatgg gggatgacgg acgaactcca tccaccacca agttctcaaa tgctcagctc 1560 atgtttggat ctggaacaca acccaccgaa ggcggtgaag atgctgtaca tattacatcc 1620 gagtcggagg tcaaggcaac caacccaact gcaatcgatg aatacggacg agtggccgat 1680 aatacgcaaa atgcaacaac cgccccaacc acagtgggaa atgctgcaat gggggccatg 1740 cctgggatgg tgtggcaaga tagggatatc tatcttcaag gacccatctg gggaaaaata 1800 ccccatacag acggacattt tcatccgtct cctctcatgg gggggtttgg atacagaaaa 1860 ccccctccgc aaatttttat taaaaacacc cccgttcctg gaaatccggc aactacattt 1920 tctccaaata gaataaacaa tttcattact caatactcaa cgggacaagt gaccgttact 1980 attgactggg agctgcaaaa ggaaaactca aagagatgga acccagaagt acaatttaca 2040 tcaaattttg gcacggtcga ttcactaaac tgggcaccgg acaacgcggg aaactacaaa 2100 gaaccaaggg tgattggcac cagatacctg actcgtatac tataa 2145 <210> 4 <211> 714 <212> PRT <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 <400> 4 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Ser Gln Pro Asp Ser Ser Ser Asp Asn 130 135 140 Thr Ala Pro Pro Val Lys Lys Ser Arg Leu Glu Glu Ala Gln Pro Ile 145 150 155 160 Gln Ser Pro Asp Val Ser Ser Ser Thr Gly Gly Gly Ile Ala Asp Val 165 170 175 Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly Gly Ala Pro Gly 180 185 190 Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser Ser Gly Asn Trp 195 200 205 His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg Thr Thr Ser Thr 210 215 220 Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Leu 225 230 235 240 Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp 245 250 255 Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe Ser Pro Arg Asn 260 265 270 Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Arg Leu 275 280 285 Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Glu Gly 290 295 300 Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe 305 310 315 320 Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp Ala Gly His Glu 325 330 335 Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met Ile Pro Gln Tyr 340 345 350 Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala Gln Ser Asp Leu 355 360 365 Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr 370 375 380 Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp Val Pro Phe His 385 390 395 400 Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu 405 410 415 Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly Asn Pro Thr Gly 420 425 430 Ser Thr Thr Arg Asp Leu Lys Phe Ile Lys Asn Lys Val Pro Asn Phe 435 440 445 Ala His Tyr Gly Lys Asn Trp Leu Pro Gly Pro Phe Ile Arg Gln Gln 450 455 460 Gly Trp Thr Thr Gln Asn Ile Asn Asn Ser Val Val Asn Phe Asn Asp 465 470 475 480 Met Leu Gly Lys Asn Ser Thr Phe Thr Leu Asp Thr Arg Trp Ser Ser 485 490 495 Leu Ala Pro Gly Pro Cys Met Gly Asp Asp Gly Arg Thr Pro Ser Thr 500 505 510 Thr Lys Phe Ser Asn Ala Gln Leu Met Phe Gly Ser Gly Thr Gln Pro 515 520 525 Thr Glu Gly Gly Glu Asp Ala Val His Ile Thr Ser Glu Ser Glu Val 530 535 540 Lys Ala Thr Asn Pro Thr Ala Ile Asp Glu Tyr Gly Arg Val Ala Asp 545 550 555 560 Asn Thr Gln Asn Ala Thr Thr Ala Pro Thr Thr Val Gly Asn Ala Ala 565 570 575 Met Gly Ala Met Pro Gly Met Val Trp Gln Asp Arg Asp Ile Tyr Leu 580 585 590 Gln Gly Pro Ile Trp Gly Lys Ile Pro His Thr Asp Gly His Phe His 595 600 605 Pro Ser Pro Leu Met Gly Gly Phe Gly Tyr Arg Lys Pro Pro Pro Gln 610 615 620 Ile Phe Ile Lys Asn Thr Pro Val Pro Gly Asn Pro Ala Thr Thr Phe 625 630 635 640 Ser Pro Asn Arg Ile Asn Asn Phe Ile Thr Gln Tyr Ser Thr Gly Gln 645 650 655 Val Thr Val Thr Ile Asp Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg 660 665 670 Trp Asn Pro Glu Val Gln Phe Thr Ser Asn Phe Gly Thr Val Asp Ser 675 680 685 Leu Asn Trp Ala Pro Asp Asn Ala Gly Asn Tyr Lys Glu Pro Arg Val 690 695 700 Ile Gly Thr Arg Tyr Leu Thr Arg Ile Leu 705 710 <210> 5 <211> 2187 <212> DNA <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Dragon VP2 VP3 <400> 5 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggccgaa 420 aagcgaaaga cacccgaaga gtggttagct caagaaaaga ctccaaccaa acaaaggttc 480 cagataccag ctccaggaca atctggatca gattctcctt ccacctcagg atccggcggt 540 actgcaggct ccagttctag cgcatcaaat acaatggctc aaggaggtgg cggaccaatg 600 gcagacgata accaaggcgc cgagggagtg ggtaatgcct cgggagattg gcattgcgat 660 acccaatggc tgggcgacca cgtcattaca aaatctacca gaacttgggt tctgccctct 720 tacgggaatc atctctactc gcccatcaac tttgatggaa ccacagggaa cggaacccaa 780 gccgcttact gcggatacgc taccccctgg gcctactttg actttaaccg attccactgc 840 cacttttccc cccgagactg gcaaagactc attaacaacc ataccggaat acgaccagtc 900 ggactcaaat tcaagctgtt caacatccag gtcaaggaaa tcacagtaca agattcgacc 960 aaaacgatcg ccaacaatct caccagcacc gtacaggtct ttgcggacac ggagcaccag 1020 ctcccgtacg tattaggaaa tgccacgcag ggcacgtttc ctccctttcc ggctgaagtc 1080 tttcagttgc ctcagtacgg ctactgtacc atccaaggcc ctcagggtaa gtttaccgac 1140 agaagtgcct tctactgctt ggagtacttt ccttccaaga tgctgagaac ggggaataac 1200 tttgaattta cttacaagtt cgagaaggtt cccttccatt ctggctgggc tcaaagccag 1260 tcgttggatc gattgatgaa tcccttgatc ccacagtacc tgttggccga ttatggtacg 1320 accgccagta gtgccataac atactatcgg ccaaacagca cagacttgag ctggtacttt 1380 aaaaactggc tgcctgggcc agtggaaagg cgacagcaaa tcaattctga agactcgacg 1440 aaaaaccatg ccaatttgaa cgggaatgca cacaccaaca aatacagcat ccagcacaga 1500 caaaccaaga tgatgccagg ggtggctctc agtagtaaat acacaggtgc tgctgaagga 1560 acgtcgttac tgaacggggt attgaccttt gataagatcg ccaatgacaa tactaacatc 1620 acggatacaa ataatgtcaa tcggacgatc gaagatgaaa ttcaaggtac caatccttat 1680 ggaaacgacg tacccattac cgtcgctgtc aatacacaaa acgcgaccac ttctcctacc 1740 atgcaaaaca gcagcacgta tgaactatta cctggtgctg tctggtccaa cagagatatt 1800 tacctgcaag gtcccatctg ggctaaaata cccgataccg atggacactt tcacccgtct 1860 ccacaaatgg gtggtttcgg acttaaaaac ccaccaccga tgatcctcat caaaaacaca 1920 cccgttcccg ccgatccacc aacgaccttc aaaccgactc cgatgaacag cttcatcagc 1980 gaatacagta ccggtcaggt gactgtagag atgctgtggg aggtccggaa agaagactcc 2040 aagagatgga acccggaaat ccagtttacc tccaattttg gattgtccga tcctcagatc 2100 gacggtatac cctttggtat taccaaattg ggtaattacg aggaaccacg tcctattggc 2160 accagatacc tgactcgtca tttgtaa 2187 <210> 6 <211> 728 <212> PRT <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Dragon VP2 VP3 <400> 6 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Glu Lys Arg Lys Thr 130 135 140 Pro Glu Glu Trp Leu Ala Gln Glu Lys Thr Pro Thr Lys Gln Arg Phe 145 150 155 160 Gln Ile Pro Ala Pro Gly Gln Ser Gly Ser Asp Ser Pro Ser Thr Ser 165 170 175 Gly Ser Gly Gly Thr Ala Gly Ser Ser Ser Ser Ala Ser Asn Thr Met 180 185 190 Ala Gln Gly Gly Gly Gly Pro Met Ala Asp Asp Asn Gln Gly Ala Glu 195 200 205 Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Thr Gln Trp Leu 210 215 220 Gly Asp His Val Ile Thr Lys Ser Thr Arg Thr Trp Val Leu Pro Ser 225 230 235 240 Tyr Gly Asn His Leu Tyr Ser Pro Ile Asn Phe Asp Gly Thr Thr Gly 245 250 255 Asn Gly Thr Gln Ala Ala Tyr Cys Gly Tyr Ala Thr Pro Trp Ala Tyr 260 265 270 Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln 275 280 285 Arg Leu Ile Asn Asn His Thr Gly Ile Arg Pro Val Gly Leu Lys Phe 290 295 300 Lys Leu Phe Asn Ile Gln Val Lys Glu Ile Thr Val Gln Asp Ser Thr 305 310 315 320 Lys Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Ala Asp 325 330 335 Thr Glu His Gln Leu Pro Tyr Val Leu Gly Asn Ala Thr Gln Gly Thr 340 345 350 Phe Pro Pro Phe Pro Ala Glu Val Phe Gln Leu Pro Gln Tyr Gly Tyr 355 360 365 Cys Thr Ile Gln Gly Pro Gln Gly Lys Phe Thr Asp Arg Ser Ala Phe 370 375 380 Tyr Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly Asn Asn 385 390 395 400 Phe Glu Phe Thr Tyr Lys Phe Glu Lys Val Pro Phe His Ser Gly Trp 405 410 415 Ala Gln Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile Pro Gln 420 425 430 Tyr Leu Leu Ala Asp Tyr Gly Thr Thr Ala Ser Ser Ala Ile Thr Tyr 435 440 445 Tyr Arg Pro Asn Ser Thr Asp Leu Ser Trp Tyr Phe Lys Asn Trp Leu 450 455 460 Pro Gly Pro Val Glu Arg Arg Gln Gln Ile Asn Ser Glu Asp Ser Thr 465 470 475 480 Lys Asn His Ala Asn Leu Asn Gly Asn Ala His Thr Asn Lys Tyr Ser 485 490 495 Ile Gln His Arg Gln Thr Lys Met Met Pro Gly Val Ala Leu Ser Ser 500 505 510 Lys Tyr Thr Gly Ala Ala Glu Gly Thr Ser Leu Leu Asn Gly Val Leu 515 520 525 Thr Phe Asp Lys Ile Ala Asn Asp Asn Thr Asn Ile Thr Asp Thr Asn 530 535 540 Asn Val Asn Arg Thr Ile Glu Asp Glu Ile Gln Gly Thr Asn Pro Tyr 545 550 555 560 Gly Asn Asp Val Pro Ile Thr Val Ala Val Asn Thr Gln Asn Ala Thr 565 570 575 Thr Ser Pro Thr Met Gln Asn Ser Ser Thr Tyr Glu Leu Leu Pro Gly 580 585 590 Ala Val Trp Ser Asn Arg Asp Ile Tyr Leu Gln Gly Pro Ile Trp Ala 595 600 605 Lys Ile Pro Asp Thr Asp Gly His Phe His Pro Ser Pro Gln Met Gly 610 615 620 Gly Phe Gly Leu Lys Asn Pro Pro Pro Met Ile Leu Ile Lys Asn Thr 625 630 635 640 Pro Val Pro Ala Asp Pro Pro Thr Thr Phe Lys Pro Thr Pro Met Asn 645 650 655 Ser Phe Ile Ser Glu Tyr Ser Thr Gly Gln Val Thr Val Glu Met Leu 660 665 670 Trp Glu Val Arg Lys Glu Asp Ser Lys Arg Trp Asn Pro Glu Ile Gln 675 680 685 Phe Thr Ser Asn Phe Gly Leu Ser Asp Pro Gln Ile Asp Gly Ile Pro 690 695 700 Phe Gly Ile Thr Lys Leu Gly Asn Tyr Glu Glu Pro Arg Pro Ile Gly 705 710 715 720 Thr Arg Tyr Leu Thr Arg His Leu 725 <210> 7 <211> 2265 <212> DNA <213> Artificial Sequence <220> <223> Cap AAV2 VP1 AAAV VP2 VP3 G444 Linker6 SpyTag <400> 7 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggccggg 420 accggggaga agcgtcccga acgcgtcgac gactttttcc cgaaaaagaa gaaggccaag 480 accgagcaag gcaaagcccc tgctcaaacg ggcgaagacc ccggagaagg aacctcttcc 540 aacgctggat caagcgcccc ctctagtgtg ggatcatctg tcatggctga aggaggtggc 600 ggtccaatgg gcgatgcagg ccaaggtgcc gacggagtgg gcaattcctc gggaaattgg 660 cattgcgatt cccaatggct ggacaacgga gtcgttaccc gaaccactcg aacctgggtc 720 ctgcccagct acaacaacca cttgtacaag cggatccaag gaccgggagg aaccgacccc 780 aacaataaat tctttggatt cagcaccccc tgggggtact ttgactacaa ccgattccac 840 tgccacttct ccccccgaga ctggcaacga ctcatcaaca acaactgggg catccgaccc 900 aaagcgatgc gctttagact ctttaacatc caggttaaag aagtcactgt ccaagactcc 960 aacaccacca tcgccaacaa cctcaccagc acggtccaag tctttgcgga caaggactac 1020 cagctgccgt acgtcctcgg atcggctaca gagggcacct tcccgccgtt cccagcggat 1080 atctacacga tcccgcagta tggttactgc acgctaaact acaacaacga ggcggtggat 1140 cgttcggcct tctactgtct agactatttc ccctcagaca tgctgcggac aggaaataac 1200 tttgaattca cttacacgtt cgaggacgtt cctttccata gcatgtttgc tcacaaccag 1260 acgctagacc ggctgatgaa tcctctcgtc gatcagtacc tgtgggcttt cagttccgtc 1320 agccaaacag gcggcctgag cggcagcggc gcccacatcg tgatggtgga cgcctacaag 1380 ccgacgaagg gcctgagcgg cagcggctcg tctggacggg cactcaatta ttcacgcgcg 1440 accaaaacca atatggcaac ccagtacaga aactggttac ctggaccctt cgtccgggat 1500 cagcaaatct ttacgggggc tagcaacatc acccaaaaca acgtgttcaa cgtttgggat 1560 aaaggcaagc agtgggtgat agacaatcgg atcaatatga tgcagcccgg ccctgcagca 1620 gcgaccacct ttagcggaga acccgaccgt caagccatgc aaaacacgct ggcctttagt 1680 cggacggtct acgaccagac aaccagtacg accgatcgta accagttgct cattaccaac 1740 gaagatgaaa tcagacccac caactcggtc ggcatcgaca cgtggggagt agttcccaac 1800 aacaaccagt ccaaggtgac cgccggcact cgcgcggcca tcaacaacca aggggcgctt 1860 cccgggatgg tgtggcaaaa cagagacatt tacctccaag gacccatttg ggccaaaatc 1920 cccgacacag acaatcactt ccatccgtcc ccgcttattg gcgggtttgg ctgcaagcat 1980 ccccctcccc agattttcat taaaaacaca cccgtcccgg ccaacccttc ggaaacgttc 2040 cagacggcca aggtggcctc cttcatcaac cagtactcga ccggacagtg caccgtcgaa 2100 atcttttggg aactcaagaa ggaaacctcc aagcgctgga accccgaaat ccagttcacc 2160 tccaactttg gcaacgcggc cgacatccag tttgctgtct ccgacaccgg atcctattcc 2220 gaacctcgtc ccattggcac cagatacctg actcgtcctc tgtaa 2265 <210> 8 <211> 754 <212> PRT <213> Artificial Sequence <220> <223> Cap AAV2 VP1 AAAV VP2 VP3 G444 Linker6 SpyTag <400> 8 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Gly Thr Gly Glu Lys 130 135 140 Arg Pro Glu Arg Val Asp Asp Phe Phe Pro Lys Lys Lys Lys Ala Lys 145 150 155 160 Thr Glu Gln Gly Lys Ala Pro Ala Gln Thr Gly Glu Asp Pro Gly Glu 165 170 175 Gly Thr Ser Ser Asn Ala Gly Ser Ser Ala Pro Ser Ser Val Gly Ser 180 185 190 Ser Val Met Ala Glu Gly Gly Gly Gly Pro Met Gly Asp Ala Gly Gln 195 200 205 Gly Ala Asp Gly Val Gly Asn Ser Ser Gly Asn Trp His Cys Asp Ser 210 215 220 Gln Trp Leu Asp Asn Gly Val Val Thr Arg Thr Thr Arg Thr Trp Val 225 230 235 240 Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Ile Gln Gly Pro Gly 245 250 255 Gly Thr Asp Pro Asn Asn Lys Phe Phe Gly Phe Ser Thr Pro Trp Gly 260 265 270 Tyr Phe Asp Tyr Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp 275 280 285 Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Ala Met Arg 290 295 300 Phe Arg Leu Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser 305 310 315 320 Asn Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Ala 325 330 335 Asp Lys Asp Tyr Gln Leu Pro Tyr Val Leu Gly Ser Ala Thr Glu Gly 340 345 350 Thr Phe Pro Pro Phe Pro Ala Asp Ile Tyr Thr Ile Pro Gln Tyr Gly 355 360 365 Tyr Cys Thr Leu Asn Tyr Asn Asn Glu Ala Val Asp Arg Ser Ala Phe 370 375 380 Tyr Cys Leu Asp Tyr Phe Pro Ser Asp Met Leu Arg Thr Gly Asn Asn 385 390 395 400 Phe Glu Phe Thr Tyr Thr Phe Glu Asp Val Pro Phe His Ser Met Phe 405 410 415 Ala His Asn Gln Thr Leu Asp Arg Leu Met Asn Pro Leu Val Asp Gln 420 425 430 Tyr Leu Trp Ala Phe Ser Ser Val Ser Gln Thr Gly Gly Leu Ser Gly 435 440 445 Ser Gly Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys Gly 450 455 460 Leu Ser Gly Ser Gly Ser Ser Gly Arg Ala Leu Asn Tyr Ser Arg Ala 465 470 475 480 Thr Lys Thr Asn Met Ala Thr Gln Tyr Arg Asn Trp Leu Pro Gly Pro 485 490 495 Phe Val Arg Asp Gln Gln Ile Phe Thr Gly Ala Ser Asn Ile Thr Gln 500 505 510 Asn Asn Val Phe Asn Val Trp Asp Lys Gly Lys Gln Trp Val Ile Asp 515 520 525 Asn Arg Ile Asn Met Met Gln Pro Gly Pro Ala Ala Ala Thr Thr Phe 530 535 540 Ser Gly Glu Pro Asp Arg Gln Ala Met Gln Asn Thr Leu Ala Phe Ser 545 550 555 560 Arg Thr Val Tyr Asp Gln Thr Thr Ser Thr Thr Asp Arg Asn Gln Leu 565 570 575 Leu Ile Thr Asn Glu Asp Glu Ile Arg Pro Thr Asn Ser Val Gly Ile 580 585 590 Asp Thr Trp Gly Val Val Pro Asn Asn Asn Gln Ser Lys Val Thr Ala 595 600 605 Gly Thr Arg Ala Ala Ile Asn Asn Gln Gly Ala Leu Pro Gly Met Val 610 615 620 Trp Gln Asn Arg Asp Ile Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 625 630 635 640 Pro Asp Thr Asp Asn His Phe His Pro Ser Pro Leu Ile Gly Gly Phe 645 650 655 Gly Cys Lys His Pro Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro Val 660 665 670 Pro Ala Asn Pro Ser Glu Thr Phe Gln Thr Ala Lys Val Ala Ser Phe 675 680 685 Ile Asn Gln Tyr Ser Thr Gly Gln Cys Thr Val Glu Ile Phe Trp Glu 690 695 700 Leu Lys Lys Glu Thr Ser Lys Arg Trp Asn Pro Glu Ile Gln Phe Thr 705 710 715 720 Ser Asn Phe Gly Asn Ala Ala Asp Ile Gln Phe Ala Val Ser Asp Thr 725 730 735 Gly Ser Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 740 745 750 Pro Leu <210> 9 <211> 2265 <212> DNA <213> Artificial Sequence <220> <223> Cap AAV2 VP1 AAAV VP2 VP3 K580 Linker6 SpyTag <400> 9 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggccggg 420 accggggaga agcgtcccga acgcgtcgac gactttttcc cgaaaaagaa gaaggccaag 480 accgagcaag gcaaagcccc tgctcaaacg ggcgaagacc ccggagaagg aacctcttcc 540 aacgctggat caagcgcccc ctctagtgtg ggatcatctg tcatggctga aggaggtggc 600 ggtccaatgg gcgatgcagg ccaaggtgcc gacggagtgg gcaattcctc gggaaattgg 660 cattgcgatt cccaatggct ggacaacgga gtcgttaccc gaaccactcg aacctgggtc 720 ctgcccagct acaacaacca cttgtacaag cggatccaag gaccgggagg aaccgacccc 780 aacaataaat tctttggatt cagcaccccc tgggggtact ttgactacaa ccgattccac 840 tgccacttct ccccccgaga ctggcaacga ctcatcaaca acaactgggg catccgaccc 900 aaagcgatgc gctttagact ctttaacatc caggttaaag aagtcactgt ccaagactcc 960 aacaccacca tcgccaacaa cctcaccagc acggtccaag tctttgcgga caaggactac 1020 cagctgccgt acgtcctcgg atcggctaca gagggcacct tcccgccgtt cccagcggat 1080 atctacacga tcccgcagta tggttactgc acgctaaact acaacaacga ggcggtggat 1140 cgttcggcct tctactgtct agactatttc ccctcagaca tgctgcggac aggaaataac 1200 tttgaattca cttacacgtt cgaggacgtt cctttccata gcatgtttgc tcacaaccag 1260 acgctagacc ggctgatgaa tcctctcgtc gatcagtacc tgtgggcttt cagttccgtc 1320 agccaaacag gctcgtctgg acgggcactc aattattcac gcgcgaccaa aaccaatatg 1380 gcaacccagt acagaaactg gttacctgga cccttcgtcc gggatcagca aatctttacg 1440 ggggctagca acatcaccca aaacaacgtg ttcaacgttt gggataaagg caagcagtgg 1500 gtgatagaca atcggatcaa tatgatgcag cccggccctg cagcagcgac cacctttagc 1560 ggagaacccg accgtcaagc catgcaaaac acgctggcct ttagtcggac ggtctacgac 1620 cagacaacca gtacgaccga tcgtaaccag ttgctcatta ccaacgaaga tgaaatcaga 1680 cccaccaact cggtcggcat cgacacgtgg ggagtagttc ccaacaacaa ccagtccaag 1740 ggcctgagcg gcagcggcgc ccacatcgtg atggtggacg cctacaagcc gacgaagggc 1800 ctgagcggca gcggcgtgac cgccggcact cgcgcggcca tcaacaacca aggggcgctt 1860 cccgggatgg tgtggcaaaa cagagacatt tacctccaag gacccatttg ggccaaaatc 1920 cccgacacag acaatcactt ccatccgtcc ccgcttattg gcgggtttgg ctgcaagcat 1980 ccccctcccc agattttcat taaaaacaca cccgtcccgg ccaacccttc ggaaacgttc 2040 cagacggcca aggtggcctc cttcatcaac cagtactcga ccggacagtg caccgtcgaa 2100 atcttttggg aactcaagaa ggaaacctcc aagcgctgga accccgaaat ccagttcacc 2160 tccaactttg gcaacgcggc cgacatccag tttgctgtct ccgacaccgg atcctattcc 2220 gaacctcgtc ccattggcac cagatacctg actcgtcctc tgtaa 2265 <210> 10 <211> 754 <212> PRT <213> Artificial Sequence <220> <223> Cap AAV2 VP1 AAAV VP2 VP3 K580 Linker6 SpyTag <400> 10 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Gly Thr Gly Glu Lys 130 135 140 Arg Pro Glu Arg Val Asp Asp Phe Phe Pro Lys Lys Lys Lys Ala Lys 145 150 155 160 Thr Glu Gln Gly Lys Ala Pro Ala Gln Thr Gly Glu Asp Pro Gly Glu 165 170 175 Gly Thr Ser Ser Asn Ala Gly Ser Ser Ala Pro Ser Ser Val Gly Ser 180 185 190 Ser Val Met Ala Glu Gly Gly Gly Gly Pro Met Gly Asp Ala Gly Gln 195 200 205 Gly Ala Asp Gly Val Gly Asn Ser Ser Gly Asn Trp His Cys Asp Ser 210 215 220 Gln Trp Leu Asp Asn Gly Val Val Thr Arg Thr Thr Arg Thr Trp Val 225 230 235 240 Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Ile Gln Gly Pro Gly 245 250 255 Gly Thr Asp Pro Asn Asn Lys Phe Phe Gly Phe Ser Thr Pro Trp Gly 260 265 270 Tyr Phe Asp Tyr Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp 275 280 285 Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Ala Met Arg 290 295 300 Phe Arg Leu Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser 305 310 315 320 Asn Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Ala 325 330 335 Asp Lys Asp Tyr Gln Leu Pro Tyr Val Leu Gly Ser Ala Thr Glu Gly 340 345 350 Thr Phe Pro Pro Phe Pro Ala Asp Ile Tyr Thr Ile Pro Gln Tyr Gly 355 360 365 Tyr Cys Thr Leu Asn Tyr Asn Asn Glu Ala Val Asp Arg Ser Ala Phe 370 375 380 Tyr Cys Leu Asp Tyr Phe Pro Ser Asp Met Leu Arg Thr Gly Asn Asn 385 390 395 400 Phe Glu Phe Thr Tyr Thr Phe Glu Asp Val Pro Phe His Ser Met Phe 405 410 415 Ala His Asn Gln Thr Leu Asp Arg Leu Met Asn Pro Leu Val Asp Gln 420 425 430 Tyr Leu Trp Ala Phe Ser Ser Val Ser Gln Thr Gly Ser Ser Gly Arg 435 440 445 Ala Leu Asn Tyr Ser Arg Ala Thr Lys Thr Asn Met Ala Thr Gln Tyr 450 455 460 Arg Asn Trp Leu Pro Gly Pro Phe Val Arg Asp Gln Gln Ile Phe Thr 465 470 475 480 Gly Ala Ser Asn Ile Thr Gln Asn Asn Val Phe Asn Val Trp Asp Lys 485 490 495 Gly Lys Gln Trp Val Ile Asp Asn Arg Ile Asn Met Met Gln Pro Gly 500 505 510 Pro Ala Ala Ala Thr Thr Phe Ser Gly Glu Pro Asp Arg Gln Ala Met 515 520 525 Gln Asn Thr Leu Ala Phe Ser Arg Thr Val Tyr Asp Gln Thr Thr Ser 530 535 540 Thr Thr Asp Arg Asn Gln Leu Leu Ile Thr Asn Glu Asp Glu Ile Arg 545 550 555 560 Pro Thr Asn Ser Val Gly Ile Asp Thr Trp Gly Val Val Pro Asn Asn 565 570 575 Asn Gln Ser Lys Gly Leu Ser Gly Ser Gly Ala His Ile Val Met Val 580 585 590 Asp Ala Tyr Lys Pro Thr Lys Gly Leu Ser Gly Ser Gly Val Thr Ala 595 600 605 Gly Thr Arg Ala Ala Ile Asn Asn Gln Gly Ala Leu Pro Gly Met Val 610 615 620 Trp Gln Asn Arg Asp Ile Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 625 630 635 640 Pro Asp Thr Asp Asn His Phe His Pro Ser Pro Leu Ile Gly Gly Phe 645 650 655 Gly Cys Lys His Pro Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro Val 660 665 670 Pro Ala Asn Pro Ser Glu Thr Phe Gln Thr Ala Lys Val Ala Ser Phe 675 680 685 Ile Asn Gln Tyr Ser Thr Gly Gln Cys Thr Val Glu Ile Phe Trp Glu 690 695 700 Leu Lys Lys Glu Thr Ser Lys Arg Trp Asn Pro Glu Ile Gln Phe Thr 705 710 715 720 Ser Asn Phe Gly Asn Ala Ala Asp Ile Gln Phe Ala Val Ser Asp Thr 725 730 735 Gly Ser Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 740 745 750 Pro Leu <210> 11 <211> 2220 <212> DNA <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 G432 Linker6 SpyTag <400> 11 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aaccctctca gccagattcg 420 tcctcggaca acacggcgcc acccgtgaaa aagtcccgtc tcgaagaagc ccagcccatt 480 caaagtccag acgtttccag cagcactggc ggaggaattg ccgacgtcat gtctggagat 540 gctgaaatgg ctgcagtggg cgggggagca ccgggcgtcg acggccaggg tgccgaggga 600 gtgggtactt cctcgggtaa ttggcattgc gattcccagt ggtcagaagg acacgtcaga 660 accaccagca ccagaacctg ggtgttgccc agctacaaca accacctgta taaacggctt 720 ggaagtagcg cacaatccaa tacctacaac ggattctcca ccccctgggg atacctcgac 780 ttcaatagat ggcactgtca cttcagtcct cggaactggc aacgtctcat caacaacaac 840 tggggcatca gaccaaaaag acttaatgtt aaattgttca acatacaagt caaagaggtc 900 acgacggaag gggggacgac gaccgtcgcc aataacctta ccagcacgat tcaggtgttt 960 gcggacaacg cgtacgaact cccgtatgtt gtcgacgcgg gtcacgaggg ggcattgccg 1020 ccgttcccaa acgacgtgtt tatgattccc caatacggat actgcgggct ggtgtctggt 1080 caaagtcagg ctcagtcgga cttgtgttcg ttttattgcc tggagtattt tccatcccag 1140 atgctgagaa caggaaacaa ttttgaaatg aatttcaggt ttgaagacgt tccatttcac 1200 tccatgtacg cccacagcca gtctctagac aggctcatga atcctttaat tgatcagtat 1260 ctgtggagtc taaaacaaac aggaaacccg actggaggcc tgagcggcag cggcgcccac 1320 atcgtgatgg tggacgccta caagccgacg aagggcctga gcggcagcgg ctcaacaacg 1380 agagacttaa aatttatcaa gaacaaagtt cccaattttg cacattatgg aaaaaattgg 1440 cttcctggac cttttattag acaacagggg tggacaacac aaaatattaa taatagtgtt 1500 gttaatttta atgacatgct gggaaaaaat tcgacattta ctttggacac tagatggagt 1560 tcattagcgc ctggtccgtg tatgggggat gacggacgaa ctccatccac caccaagttc 1620 tcaaatgctc agctcatgtt tggatctgga acacaaccca ccgaaggcgg tgaagatgct 1680 gtacatatta catccgagtc ggaggtcaag gcaaccaacc caactgcaat cgatgaatac 1740 ggacgagtgg ccgataatac gcaaaatgca acaaccgccc caaccacagt gggaaatgct 1800 gcaatggggg ccatgcctgg gatggtgtgg caagataggg atatctatct tcaaggaccc 1860 atctggggaa aaatacccca tacagacgga cattttcatc cgtctcctct catggggggg 1920 tttggataca gaaaaccccc tccgcaaatt tttattaaaa acacccccgt tcctggaaat 1980 ccggcaacta cattttctcc aaatagaata aacaatttca ttactcaata ctcaacggga 2040 caagtgaccg ttactattga ctgggagctg caaaaggaaa actcaaagag atggaaccca 2100 gaagtacaat ttacatcaaa ttttggcacg gtcgattcac taaactgggc accggacaac 2160 gcgggaaact acaaagaacc aagggtgatt ggcaccagat acctgactcg tatactataa 2220 <210> 12 <211> 739 <212> PRT <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 G432 Linker6 SpyTag <400> 12 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Ser Gln Pro Asp Ser Ser Ser Asp Asn 130 135 140 Thr Ala Pro Pro Val Lys Lys Ser Arg Leu Glu Glu Ala Gln Pro Ile 145 150 155 160 Gln Ser Pro Asp Val Ser Ser Ser Thr Gly Gly Gly Ile Ala Asp Val 165 170 175 Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly Gly Ala Pro Gly 180 185 190 Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser Ser Gly Asn Trp 195 200 205 His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg Thr Thr Ser Thr 210 215 220 Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Leu 225 230 235 240 Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp 245 250 255 Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe Ser Pro Arg Asn 260 265 270 Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Arg Leu 275 280 285 Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Glu Gly 290 295 300 Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe 305 310 315 320 Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp Ala Gly His Glu 325 330 335 Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met Ile Pro Gln Tyr 340 345 350 Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala Gln Ser Asp Leu 355 360 365 Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr 370 375 380 Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp Val Pro Phe His 385 390 395 400 Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu 405 410 415 Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly Asn Pro Thr Gly 420 425 430 Gly Leu Ser Gly Ser Gly Ala His Ile Val Met Val Asp Ala Tyr Lys 435 440 445 Pro Thr Lys Gly Leu Ser Gly Ser Gly Ser Thr Thr Arg Asp Leu Lys 450 455 460 Phe Ile Lys Asn Lys Val Pro Asn Phe Ala His Tyr Gly Lys Asn Trp 465 470 475 480 Leu Pro Gly Pro Phe Ile Arg Gln Gln Gly Trp Thr Thr Gln Asn Ile 485 490 495 Asn Asn Ser Val Val Asn Phe Asn Asp Met Leu Gly Lys Asn Ser Thr 500 505 510 Phe Thr Leu Asp Thr Arg Trp Ser Ser Leu Ala Pro Gly Pro Cys Met 515 520 525 Gly Asp Asp Gly Arg Thr Pro Ser Thr Thr Lys Phe Ser Asn Ala Gln 530 535 540 Leu Met Phe Gly Ser Gly Thr Gln Pro Thr Glu Gly Gly Glu Asp Ala 545 550 555 560 Val His Ile Thr Ser Glu Ser Glu Val Lys Ala Thr Asn Pro Thr Ala 565 570 575 Ile Asp Glu Tyr Gly Arg Val Ala Asp Asn Thr Gln Asn Ala Thr Thr 580 585 590 Ala Pro Thr Thr Val Gly Asn Ala Ala Met Gly Ala Met Pro Gly Met 595 600 605 Val Trp Gln Asp Arg Asp Ile Tyr Leu Gln Gly Pro Ile Trp Gly Lys 610 615 620 Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly 625 630 635 640 Phe Gly Tyr Arg Lys Pro Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro 645 650 655 Val Pro Gly Asn Pro Ala Thr Thr Phe Ser Pro Asn Arg Ile Asn Asn 660 665 670 Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Thr Ile Asp Trp 675 680 685 Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Phe 690 695 700 Thr Ser Asn Phe Gly Thr Val Asp Ser Leu Asn Trp Ala Pro Asp Asn 705 710 715 720 Ala Gly Asn Tyr Lys Glu Pro Arg Val Ile Gly Thr Arg Tyr Leu Thr 725 730 735 Arg Ile Leu <210> 13 <211> 2220 <212> DNA <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 A565 Linker6 SpyTag <400> 13 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aaccctctca gccagattcg 420 tcctcggaca acacggcgcc acccgtgaaa aagtcccgtc tcgaagaagc ccagcccatt 480 caaagtccag acgtttccag cagcactggc ggaggaattg ccgacgtcat gtctggagat 540 gctgaaatgg ctgcagtggg cgggggagca ccgggcgtcg acggccaggg tgccgaggga 600 gtgggtactt cctcgggtaa ttggcattgc gattcccagt ggtcagaagg acacgtcaga 660 accaccagca ccagaacctg ggtgttgccc agctacaaca accacctgta taaacggctt 720 ggaagtagcg cacaatccaa tacctacaac ggattctcca ccccctgggg atacctcgac 780 ttcaatagat ggcactgtca cttcagtcct cggaactggc aacgtctcat caacaacaac 840 tggggcatca gaccaaaaag acttaatgtt aaattgttca acatacaagt caaagaggtc 900 acgacggaag gggggacgac gaccgtcgcc aataacctta ccagcacgat tcaggtgttt 960 gcggacaacg cgtacgaact cccgtatgtt gtcgacgcgg gtcacgaggg ggcattgccg 1020 ccgttcccaa acgacgtgtt tatgattccc caatacggat actgcgggct ggtgtctggt 1080 caaagtcagg ctcagtcgga cttgtgttcg ttttattgcc tggagtattt tccatcccag 1140 atgctgagaa caggaaacaa ttttgaaatg aatttcaggt ttgaagacgt tccatttcac 1200 tccatgtacg cccacagcca gtctctagac aggctcatga atcctttaat tgatcagtat 1260 ctgtggagtc taaaacaaac aggaaacccg actggatcaa caacgagaga cttaaaattt 1320 atcaagaaca aagttcccaa ttttgcacat tatggaaaaa attggcttcc tggacctttt 1380 attagacaac aggggtggac aacacaaaat attaataata gtgttgttaa ttttaatgac 1440 atgctgggaa aaaattcgac atttactttg gacactagat ggagttcatt agcgcctggt 1500 ccgtgtatgg gggatgacgg acgaactcca tccaccacca agttctcaaa tgctcagctc 1560 atgtttggat ctggaacaca acccaccgaa ggcggtgaag atgctgtaca tattacatcc 1620 gagtcggagg tcaaggcaac caacccaact gcaatcgatg aatacggacg agtggccgat 1680 aatacgcaaa atgcaggcct gagcggcagc ggcgcccaca tcgtgatggt ggacgcctac 1740 aagccgacga agggcctgag cggcagcggc acaaccgccc caaccacagt gggaaatgct 1800 gcaatggggg ccatgcctgg gatggtgtgg caagataggg atatctatct tcaaggaccc 1860 atctggggaa aaatacccca tacagacgga cattttcatc cgtctcctct catggggggg 1920 tttggataca gaaaaccccc tccgcaaatt tttattaaaa acacccccgt tcctggaaat 1980 ccggcaacta cattttctcc aaatagaata aacaatttca ttactcaata ctcaacggga 2040 caagtgaccg ttactattga ctgggagctg caaaaggaaa actcaaagag atggaaccca 2100 gaagtacaat ttacatcaaa ttttggcacg gtcgattcac taaactgggc accggacaac 2160 gcgggaaact acaaagaacc aagggtgatt ggcaccagat acctgactcg tatactataa 2220 <210> 14 <211> 739 <212> PRT <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 A565 Linker6 SpyTag <400> 14 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Ser Gln Pro Asp Ser Ser Ser Asp Asn 130 135 140 Thr Ala Pro Pro Val Lys Lys Ser Arg Leu Glu Glu Ala Gln Pro Ile 145 150 155 160 Gln Ser Pro Asp Val Ser Ser Ser Thr Gly Gly Gly Ile Ala Asp Val 165 170 175 Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly Gly Ala Pro Gly 180 185 190 Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser Ser Gly Asn Trp 195 200 205 His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg Thr Thr Ser Thr 210 215 220 Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Leu 225 230 235 240 Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp 245 250 255 Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe Ser Pro Arg Asn 260 265 270 Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Arg Leu 275 280 285 Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Glu Gly 290 295 300 Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe 305 310 315 320 Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp Ala Gly His Glu 325 330 335 Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met Ile Pro Gln Tyr 340 345 350 Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala Gln Ser Asp Leu 355 360 365 Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr 370 375 380 Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp Val Pro Phe His 385 390 395 400 Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu 405 410 415 Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly Asn Pro Thr Gly 420 425 430 Ser Thr Thr Arg Asp Leu Lys Phe Ile Lys Asn Lys Val Pro Asn Phe 435 440 445 Ala His Tyr Gly Lys Asn Trp Leu Pro Gly Pro Phe Ile Arg Gln Gln 450 455 460 Gly Trp Thr Thr Gln Asn Ile Asn Asn Ser Val Val Asn Phe Asn Asp 465 470 475 480 Met Leu Gly Lys Asn Ser Thr Phe Thr Leu Asp Thr Arg Trp Ser Ser 485 490 495 Leu Ala Pro Gly Pro Cys Met Gly Asp Asp Gly Arg Thr Pro Ser Thr 500 505 510 Thr Lys Phe Ser Asn Ala Gln Leu Met Phe Gly Ser Gly Thr Gln Pro 515 520 525 Thr Glu Gly Gly Glu Asp Ala Val His Ile Thr Ser Glu Ser Glu Val 530 535 540 Lys Ala Thr Asn Pro Thr Ala Ile Asp Glu Tyr Gly Arg Val Ala Asp 545 550 555 560 Asn Thr Gln Asn Ala Gly Leu Ser Gly Ser Gly Ala His Ile Val Met 565 570 575 Val Asp Ala Tyr Lys Pro Thr Lys Gly Leu Ser Gly Ser Gly Thr Thr 580 585 590 Ala Pro Thr Thr Val Gly Asn Ala Ala Met Gly Ala Met Pro Gly Met 595 600 605 Val Trp Gln Asp Arg Asp Ile Tyr Leu Gln Gly Pro Ile Trp Gly Lys 610 615 620 Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly 625 630 635 640 Phe Gly Tyr Arg Lys Pro Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro 645 650 655 Val Pro Gly Asn Pro Ala Thr Thr Phe Ser Pro Asn Arg Ile Asn Asn 660 665 670 Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Thr Ile Asp Trp 675 680 685 Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Phe 690 695 700 Thr Ser Asn Phe Gly Thr Val Asp Ser Leu Asn Trp Ala Pro Asp Asn 705 710 715 720 Ala Gly Asn Tyr Lys Glu Pro Arg Val Ile Gly Thr Arg Tyr Leu Thr 725 730 735 Arg Ile Leu <210> 15 <211> 2220 <212> DNA <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 N429 Linker6 SpyTag <400> 15 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aaccctctca gccagattcg 420 tcctcggaca acacggcgcc acccgtgaaa aagtcccgtc tcgaagaagc ccagcccatt 480 caaagtccag acgtttccag cagcactggc ggaggaattg ccgacgtcat gtctggagat 540 gctgaaatgg ctgcagtggg cgggggagca ccgggcgtcg acggccaggg tgccgaggga 600 gtgggtactt cctcgggtaa ttggcattgc gattcccagt ggtcagaagg acacgtcaga 660 accaccagca ccagaacctg ggtgttgccc agctacaaca accacctgta taaacggctt 720 ggaagtagcg cacaatccaa tacctacaac ggattctcca ccccctgggg atacctcgac 780 ttcaatagat ggcactgtca cttcagtcct cggaactggc aacgtctcat caacaacaac 840 tggggcatca gaccaaaaag acttaatgtt aaattgttca acatacaagt caaagaggtc 900 acgacggaag gggggacgac gaccgtcgcc aataacctta ccagcacgat tcaggtgttt 960 gcggacaacg cgtacgaact cccgtatgtt gtcgacgcgg gtcacgaggg ggcattgccg 1020 ccgttcccaa acgacgtgtt tatgattccc caatacggat actgcgggct ggtgtctggt 1080 caaagtcagg ctcagtcgga cttgtgttcg ttttattgcc tggagtattt tccatcccag 1140 atgctgagaa caggaaacaa ttttgaaatg aatttcaggt ttgaagacgt tccatttcac 1200 tccatgtacg cccacagcca gtctctagac aggctcatga atcctttaat tgatcagtat 1260 ctgtggagtc taaaacaaac aggaaacggc ctgagcggca gcggcgccca catcgtgatg 1320 gtggacgcct acaagccgac gaagggcctg agcggcagcg gcccgactgg atcaacaacg 1380 agagacttaa aatttatcaa gaacaaagtt cccaattttg cacattatgg aaaaaattgg 1440 cttcctggac cttttattag acaacagggg tggacaacac aaaatattaa taatagtgtt 1500 gttaatttta atgacatgct gggaaaaaat tcgacattta ctttggacac tagatggagt 1560 tcattagcgc ctggtccgtg tatgggggat gacggacgaa ctccatccac caccaagttc 1620 tcaaatgctc agctcatgtt tggatctgga acacaaccca ccgaaggcgg tgaagatgct 1680 gtacatatta catccgagtc ggaggtcaag gcaaccaacc caactgcaat cgatgaatac 1740 ggacgagtgg ccgataatac gcaaaatgca acaaccgccc caaccacagt gggaaatgct 1800 gcaatggggg ccatgcctgg gatggtgtgg caagataggg atatctatct tcaaggaccc 1860 atctggggaa aaatacccca tacagacgga cattttcatc cgtctcctct catggggggg 1920 tttggataca gaaaaccccc tccgcaaatt tttattaaaa acacccccgt tcctggaaat 1980 ccggcaacta cattttctcc aaatagaata aacaatttca ttactcaata ctcaacggga 2040 caagtgaccg ttactattga ctgggagctg caaaaggaaa actcaaagag atggaaccca 2100 gaagtacaat ttacatcaaa ttttggcacg gtcgattcac taaactgggc accggacaac 2160 gcgggaaact acaaagaacc aagggtgatt ggcaccagat acctgactcg tatactataa 2220 <210> 16 <211> 739 <212> PRT <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 N429 Linker6 SpyTag <400> 16 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Ser Gln Pro Asp Ser Ser Ser Asp Asn 130 135 140 Thr Ala Pro Pro Val Lys Lys Ser Arg Leu Glu Glu Ala Gln Pro Ile 145 150 155 160 Gln Ser Pro Asp Val Ser Ser Ser Thr Gly Gly Gly Ile Ala Asp Val 165 170 175 Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly Gly Ala Pro Gly 180 185 190 Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser Ser Gly Asn Trp 195 200 205 His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg Thr Thr Ser Thr 210 215 220 Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Leu 225 230 235 240 Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp 245 250 255 Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe Ser Pro Arg Asn 260 265 270 Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Arg Leu 275 280 285 Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Glu Gly 290 295 300 Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe 305 310 315 320 Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp Ala Gly His Glu 325 330 335 Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met Ile Pro Gln Tyr 340 345 350 Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala Gln Ser Asp Leu 355 360 365 Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr 370 375 380 Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp Val Pro Phe His 385 390 395 400 Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu 405 410 415 Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly Asn Gly Leu Ser 420 425 430 Gly Ser Gly Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys 435 440 445 Gly Leu Ser Gly Ser Gly Pro Thr Gly Ser Thr Thr Arg Asp Leu Lys 450 455 460 Phe Ile Lys Asn Lys Val Pro Asn Phe Ala His Tyr Gly Lys Asn Trp 465 470 475 480 Leu Pro Gly Pro Phe Ile Arg Gln Gln Gly Trp Thr Thr Gln Asn Ile 485 490 495 Asn Asn Ser Val Val Asn Phe Asn Asp Met Leu Gly Lys Asn Ser Thr 500 505 510 Phe Thr Leu Asp Thr Arg Trp Ser Ser Leu Ala Pro Gly Pro Cys Met 515 520 525 Gly Asp Asp Gly Arg Thr Pro Ser Thr Thr Lys Phe Ser Asn Ala Gln 530 535 540 Leu Met Phe Gly Ser Gly Thr Gln Pro Thr Glu Gly Gly Glu Asp Ala 545 550 555 560 Val His Ile Thr Ser Glu Ser Glu Val Lys Ala Thr Asn Pro Thr Ala 565 570 575 Ile Asp Glu Tyr Gly Arg Val Ala Asp Asn Thr Gln Asn Ala Thr Thr 580 585 590 Ala Pro Thr Thr Val Gly Asn Ala Ala Met Gly Ala Met Pro Gly Met 595 600 605 Val Trp Gln Asp Arg Asp Ile Tyr Leu Gln Gly Pro Ile Trp Gly Lys 610 615 620 Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly 625 630 635 640 Phe Gly Tyr Arg Lys Pro Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro 645 650 655 Val Pro Gly Asn Pro Ala Thr Thr Phe Ser Pro Asn Arg Ile Asn Asn 660 665 670 Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Thr Ile Asp Trp 675 680 685 Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Phe 690 695 700 Thr Ser Asn Phe Gly Thr Val Asp Ser Leu Asn Trp Ala Pro Asp Asn 705 710 715 720 Ala Gly Asn Tyr Lys Glu Pro Arg Val Ile Gly Thr Arg Tyr Leu Thr 725 730 735 Arg Ile Leu <210> 17 <211> 2220 <212> DNA <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 P430 Linker6 SpyTag <400> 17 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aaccctctca gccagattcg 420 tcctcggaca acacggcgcc acccgtgaaa aagtcccgtc tcgaagaagc ccagcccatt 480 caaagtccag acgtttccag cagcactggc ggaggaattg ccgacgtcat gtctggagat 540 gctgaaatgg ctgcagtggg cgggggagca ccgggcgtcg acggccaggg tgccgaggga 600 gtgggtactt cctcgggtaa ttggcattgc gattcccagt ggtcagaagg acacgtcaga 660 accaccagca ccagaacctg ggtgttgccc agctacaaca accacctgta taaacggctt 720 ggaagtagcg cacaatccaa tacctacaac ggattctcca ccccctgggg atacctcgac 780 ttcaatagat ggcactgtca cttcagtcct cggaactggc aacgtctcat caacaacaac 840 tggggcatca gaccaaaaag acttaatgtt aaattgttca acatacaagt caaagaggtc 900 acgacggaag gggggacgac gaccgtcgcc aataacctta ccagcacgat tcaggtgttt 960 gcggacaacg cgtacgaact cccgtatgtt gtcgacgcgg gtcacgaggg ggcattgccg 1020 ccgttcccaa acgacgtgtt tatgattccc caatacggat actgcgggct ggtgtctggt 1080 caaagtcagg ctcagtcgga cttgtgttcg ttttattgcc tggagtattt tccatcccag 1140 atgctgagaa caggaaacaa ttttgaaatg aatttcaggt ttgaagacgt tccatttcac 1200 tccatgtacg cccacagcca gtctctagac aggctcatga atcctttaat tgatcagtat 1260 ctgtggagtc taaaacaaac aggaaacccg ggcctgagcg gcagcggcgc ccacatcgtg 1320 atggtggacg cctacaagcc gacgaagggc ctgagcggca gcggcactgg atcaacaacg 1380 agagacttaa aatttatcaa gaacaaagtt cccaattttg cacattatgg aaaaaattgg 1440 cttcctggac cttttattag acaacagggg tggacaacac aaaatattaa taatagtgtt 1500 gttaatttta atgacatgct gggaaaaaat tcgacattta ctttggacac tagatggagt 1560 tcattagcgc ctggtccgtg tatgggggat gacggacgaa ctccatccac caccaagttc 1620 tcaaatgctc agctcatgtt tggatctgga acacaaccca ccgaaggcgg tgaagatgct 1680 gtacatatta catccgagtc ggaggtcaag gcaaccaacc caactgcaat cgatgaatac 1740 ggacgagtgg ccgataatac gcaaaatgca acaaccgccc caaccacagt gggaaatgct 1800 gcaatggggg ccatgcctgg gatggtgtgg caagataggg atatctatct tcaaggaccc 1860 atctggggaa aaatacccca tacagacgga cattttcatc cgtctcctct catggggggg 1920 tttggataca gaaaaccccc tccgcaaatt tttattaaaa acacccccgt tcctggaaat 1980 ccggcaacta cattttctcc aaatagaata aacaatttca ttactcaata ctcaacggga 2040 caagtgaccg ttactattga ctgggagctg caaaaggaaa actcaaagag atggaaccca 2100 gaagtacaat ttacatcaaa ttttggcacg gtcgattcac taaactgggc accggacaac 2160 gcgggaaact acaaagaacc aagggtgatt ggcaccagat acctgactcg tatactataa 2220 <210> 18 <211> 739 <212> PRT <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 P430 Linker6 SpyTag <400> 18 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Ser Gln Pro Asp Ser Ser Ser Asp Asn 130 135 140 Thr Ala Pro Pro Val Lys Lys Ser Arg Leu Glu Glu Ala Gln Pro Ile 145 150 155 160 Gln Ser Pro Asp Val Ser Ser Ser Thr Gly Gly Gly Ile Ala Asp Val 165 170 175 Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly Gly Ala Pro Gly 180 185 190 Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser Ser Gly Asn Trp 195 200 205 His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg Thr Thr Ser Thr 210 215 220 Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Leu 225 230 235 240 Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp 245 250 255 Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe Ser Pro Arg Asn 260 265 270 Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Arg Leu 275 280 285 Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Glu Gly 290 295 300 Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe 305 310 315 320 Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp Ala Gly His Glu 325 330 335 Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met Ile Pro Gln Tyr 340 345 350 Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala Gln Ser Asp Leu 355 360 365 Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr 370 375 380 Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp Val Pro Phe His 385 390 395 400 Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu 405 410 415 Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly Asn Pro Gly Leu 420 425 430 Ser Gly Ser Gly Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr 435 440 445 Lys Gly Leu Ser Gly Ser Gly Thr Gly Ser Thr Thr Arg Asp Leu Lys 450 455 460 Phe Ile Lys Asn Lys Val Pro Asn Phe Ala His Tyr Gly Lys Asn Trp 465 470 475 480 Leu Pro Gly Pro Phe Ile Arg Gln Gln Gly Trp Thr Thr Gln Asn Ile 485 490 495 Asn Asn Ser Val Val Asn Phe Asn Asp Met Leu Gly Lys Asn Ser Thr 500 505 510 Phe Thr Leu Asp Thr Arg Trp Ser Ser Leu Ala Pro Gly Pro Cys Met 515 520 525 Gly Asp Asp Gly Arg Thr Pro Ser Thr Thr Lys Phe Ser Asn Ala Gln 530 535 540 Leu Met Phe Gly Ser Gly Thr Gln Pro Thr Glu Gly Gly Glu Asp Ala 545 550 555 560 Val His Ile Thr Ser Glu Ser Glu Val Lys Ala Thr Asn Pro Thr Ala 565 570 575 Ile Asp Glu Tyr Gly Arg Val Ala Asp Asn Thr Gln Asn Ala Thr Thr 580 585 590 Ala Pro Thr Thr Val Gly Asn Ala Ala Met Gly Ala Met Pro Gly Met 595 600 605 Val Trp Gln Asp Arg Asp Ile Tyr Leu Gln Gly Pro Ile Trp Gly Lys 610 615 620 Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly 625 630 635 640 Phe Gly Tyr Arg Lys Pro Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro 645 650 655 Val Pro Gly Asn Pro Ala Thr Thr Phe Ser Pro Asn Arg Ile Asn Asn 660 665 670 Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Thr Ile Asp Trp 675 680 685 Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Phe 690 695 700 Thr Ser Asn Phe Gly Thr Val Asp Ser Leu Asn Trp Ala Pro Asp Asn 705 710 715 720 Ala Gly Asn Tyr Lys Glu Pro Arg Val Ile Gly Thr Arg Tyr Leu Thr 725 730 735 Arg Ile Leu <210> 19 <211> 2220 <212> DNA <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 T431 Linker6 SpyTag <400> 19 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aaccctctca gccagattcg 420 tcctcggaca acacggcgcc acccgtgaaa aagtcccgtc tcgaagaagc ccagcccatt 480 caaagtccag acgtttccag cagcactggc ggaggaattg ccgacgtcat gtctggagat 540 gctgaaatgg ctgcagtggg cgggggagca ccgggcgtcg acggccaggg tgccgaggga 600 gtgggtactt cctcgggtaa ttggcattgc gattcccagt ggtcagaagg acacgtcaga 660 accaccagca ccagaacctg ggtgttgccc agctacaaca accacctgta taaacggctt 720 ggaagtagcg cacaatccaa tacctacaac ggattctcca ccccctgggg atacctcgac 780 ttcaatagat ggcactgtca cttcagtcct cggaactggc aacgtctcat caacaacaac 840 tggggcatca gaccaaaaag acttaatgtt aaattgttca acatacaagt caaagaggtc 900 acgacggaag gggggacgac gaccgtcgcc aataacctta ccagcacgat tcaggtgttt 960 gcggacaacg cgtacgaact cccgtatgtt gtcgacgcgg gtcacgaggg ggcattgccg 1020 ccgttcccaa acgacgtgtt tatgattccc caatacggat actgcgggct ggtgtctggt 1080 caaagtcagg ctcagtcgga cttgtgttcg ttttattgcc tggagtattt tccatcccag 1140 atgctgagaa caggaaacaa ttttgaaatg aatttcaggt ttgaagacgt tccatttcac 1200 tccatgtacg cccacagcca gtctctagac aggctcatga atcctttaat tgatcagtat 1260 ctgtggagtc taaaacaaac aggaaacccg actggcctga gcggcagcgg cgcccacatc 1320 gtgatggtgg acgcctacaa gccgacgaag ggcctgagcg gcagcggcgg atcaacaacg 1380 agagacttaa aatttatcaa gaacaaagtt cccaattttg cacattatgg aaaaaattgg 1440 cttcctggac cttttattag acaacagggg tggacaacac aaaatattaa taatagtgtt 1500 gttaatttta atgacatgct gggaaaaaat tcgacattta ctttggacac tagatggagt 1560 tcattagcgc ctggtccgtg tatgggggat gacggacgaa ctccatccac caccaagttc 1620 tcaaatgctc agctcatgtt tggatctgga acacaaccca ccgaaggcgg tgaagatgct 1680 gtacatatta catccgagtc ggaggtcaag gcaaccaacc caactgcaat cgatgaatac 1740 ggacgagtgg ccgataatac gcaaaatgca acaaccgccc caaccacagt gggaaatgct 1800 gcaatggggg ccatgcctgg gatggtgtgg caagataggg atatctatct tcaaggaccc 1860 atctggggaa aaatacccca tacagacgga cattttcatc cgtctcctct catggggggg 1920 tttggataca gaaaaccccc tccgcaaatt tttattaaaa acacccccgt tcctggaaat 1980 ccggcaacta cattttctcc aaatagaata aacaatttca ttactcaata ctcaacggga 2040 caagtgaccg ttactattga ctgggagctg caaaaggaaa actcaaagag atggaaccca 2100 gaagtacaat ttacatcaaa ttttggcacg gtcgattcac taaactgggc accggacaac 2160 gcgggaaact acaaagaacc aagggtgatt ggcaccagat acctgactcg tatactataa 2220 <210> 20 <211> 739 <212> PRT <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 T431 Linker6 SpyTag <400> 20 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Ser Gln Pro Asp Ser Ser Ser Asp Asn 130 135 140 Thr Ala Pro Pro Val Lys Lys Ser Arg Leu Glu Glu Ala Gln Pro Ile 145 150 155 160 Gln Ser Pro Asp Val Ser Ser Ser Thr Gly Gly Gly Ile Ala Asp Val 165 170 175 Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly Gly Ala Pro Gly 180 185 190 Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser Ser Gly Asn Trp 195 200 205 His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg Thr Thr Ser Thr 210 215 220 Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Leu 225 230 235 240 Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp 245 250 255 Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe Ser Pro Arg Asn 260 265 270 Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Arg Leu 275 280 285 Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Glu Gly 290 295 300 Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe 305 310 315 320 Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp Ala Gly His Glu 325 330 335 Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met Ile Pro Gln Tyr 340 345 350 Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala Gln Ser Asp Leu 355 360 365 Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr 370 375 380 Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp Val Pro Phe His 385 390 395 400 Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu 405 410 415 Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly Asn Pro Thr Gly 420 425 430 Leu Ser Gly Ser Gly Ala His Ile Val Met Val Asp Ala Tyr Lys Pro 435 440 445 Thr Lys Gly Leu Ser Gly Ser Gly Gly Ser Thr Thr Arg Asp Leu Lys 450 455 460 Phe Ile Lys Asn Lys Val Pro Asn Phe Ala His Tyr Gly Lys Asn Trp 465 470 475 480 Leu Pro Gly Pro Phe Ile Arg Gln Gln Gly Trp Thr Thr Gln Asn Ile 485 490 495 Asn Asn Ser Val Val Asn Phe Asn Asp Met Leu Gly Lys Asn Ser Thr 500 505 510 Phe Thr Leu Asp Thr Arg Trp Ser Ser Leu Ala Pro Gly Pro Cys Met 515 520 525 Gly Asp Asp Gly Arg Thr Pro Ser Thr Thr Lys Phe Ser Asn Ala Gln 530 535 540 Leu Met Phe Gly Ser Gly Thr Gln Pro Thr Glu Gly Gly Glu Asp Ala 545 550 555 560 Val His Ile Thr Ser Glu Ser Glu Val Lys Ala Thr Asn Pro Thr Ala 565 570 575 Ile Asp Glu Tyr Gly Arg Val Ala Asp Asn Thr Gln Asn Ala Thr Thr 580 585 590 Ala Pro Thr Thr Val Gly Asn Ala Ala Met Gly Ala Met Pro Gly Met 595 600 605 Val Trp Gln Asp Arg Asp Ile Tyr Leu Gln Gly Pro Ile Trp Gly Lys 610 615 620 Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly 625 630 635 640 Phe Gly Tyr Arg Lys Pro Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro 645 650 655 Val Pro Gly Asn Pro Ala Thr Thr Phe Ser Pro Asn Arg Ile Asn Asn 660 665 670 Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Thr Ile Asp Trp 675 680 685 Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Phe 690 695 700 Thr Ser Asn Phe Gly Thr Val Asp Ser Leu Asn Trp Ala Pro Asp Asn 705 710 715 720 Ala Gly Asn Tyr Lys Glu Pro Arg Val Ile Gly Thr Arg Tyr Leu Thr 725 730 735 Arg Ile Leu <210> 21 <211> 2220 <212> DNA <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 S433 Linker6 SpyTag <400> 21 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aaccctctca gccagattcg 420 tcctcggaca acacggcgcc acccgtgaaa aagtcccgtc tcgaagaagc ccagcccatt 480 caaagtccag acgtttccag cagcactggc ggaggaattg ccgacgtcat gtctggagat 540 gctgaaatgg ctgcagtggg cgggggagca ccgggcgtcg acggccaggg tgccgaggga 600 gtgggtactt cctcgggtaa ttggcattgc gattcccagt ggtcagaagg acacgtcaga 660 accaccagca ccagaacctg ggtgttgccc agctacaaca accacctgta taaacggctt 720 ggaagtagcg cacaatccaa tacctacaac ggattctcca ccccctgggg atacctcgac 780 ttcaatagat ggcactgtca cttcagtcct cggaactggc aacgtctcat caacaacaac 840 tggggcatca gaccaaaaag acttaatgtt aaattgttca acatacaagt caaagaggtc 900 acgacggaag gggggacgac gaccgtcgcc aataacctta ccagcacgat tcaggtgttt 960 gcggacaacg cgtacgaact cccgtatgtt gtcgacgcgg gtcacgaggg ggcattgccg 1020 ccgttcccaa acgacgtgtt tatgattccc caatacggat actgcgggct ggtgtctggt 1080 caaagtcagg ctcagtcgga cttgtgttcg ttttattgcc tggagtattt tccatcccag 1140 atgctgagaa caggaaacaa ttttgaaatg aatttcaggt ttgaagacgt tccatttcac 1200 tccatgtacg cccacagcca gtctctagac aggctcatga atcctttaat tgatcagtat 1260 ctgtggagtc taaaacaaac aggaaacccg actggatcag gcctgagcgg cagcggcgcc 1320 cacatcgtga tggtggacgc ctacaagccg acgaagggcc tgagcggcag cggcacaacg 1380 agagacttaa aatttatcaa gaacaaagtt cccaattttg cacattatgg aaaaaattgg 1440 cttcctggac cttttattag acaacagggg tggacaacac aaaatattaa taatagtgtt 1500 gttaatttta atgacatgct gggaaaaaat tcgacattta ctttggacac tagatggagt 1560 tcattagcgc ctggtccgtg tatgggggat gacggacgaa ctccatccac caccaagttc 1620 tcaaatgctc agctcatgtt tggatctgga acacaaccca ccgaaggcgg tgaagatgct 1680 gtacatatta catccgagtc ggaggtcaag gcaaccaacc caactgcaat cgatgaatac 1740 ggacgagtgg ccgataatac gcaaaatgca acaaccgccc caaccacagt gggaaatgct 1800 gcaatggggg ccatgcctgg gatggtgtgg caagataggg atatctatct tcaaggaccc 1860 atctggggaa aaatacccca tacagacgga cattttcatc cgtctcctct catggggggg 1920 tttggataca gaaaaccccc tccgcaaatt tttattaaaa acacccccgt tcctggaaat 1980 ccggcaacta cattttctcc aaatagaata aacaatttca ttactcaata ctcaacggga 2040 caagtgaccg ttactattga ctgggagctg caaaaggaaa actcaaagag atggaaccca 2100 gaagtacaat ttacatcaaa ttttggcacg gtcgattcac taaactgggc accggacaac 2160 gcgggaaact acaaagaacc aagggtgatt ggcaccagat acctgactcg tatactataa 2220 <210> 22 <211> 739 <212> PRT <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 S433 Linker6 SpyTag <400> 22 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Ser Gln Pro Asp Ser Ser Ser Asp Asn 130 135 140 Thr Ala Pro Pro Val Lys Lys Ser Arg Leu Glu Glu Ala Gln Pro Ile 145 150 155 160 Gln Ser Pro Asp Val Ser Ser Ser Thr Gly Gly Gly Ile Ala Asp Val 165 170 175 Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly Gly Ala Pro Gly 180 185 190 Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser Ser Gly Asn Trp 195 200 205 His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg Thr Thr Ser Thr 210 215 220 Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Leu 225 230 235 240 Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp 245 250 255 Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe Ser Pro Arg Asn 260 265 270 Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Arg Leu 275 280 285 Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Glu Gly 290 295 300 Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe 305 310 315 320 Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp Ala Gly His Glu 325 330 335 Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met Ile Pro Gln Tyr 340 345 350 Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala Gln Ser Asp Leu 355 360 365 Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr 370 375 380 Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp Val Pro Phe His 385 390 395 400 Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu 405 410 415 Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly Asn Pro Thr Gly 420 425 430 Ser Gly Leu Ser Gly Ser Gly Ala His Ile Val Met Val Asp Ala Tyr 435 440 445 Lys Pro Thr Lys Gly Leu Ser Gly Ser Gly Thr Thr Arg Asp Leu Lys 450 455 460 Phe Ile Lys Asn Lys Val Pro Asn Phe Ala His Tyr Gly Lys Asn Trp 465 470 475 480 Leu Pro Gly Pro Phe Ile Arg Gln Gln Gly Trp Thr Thr Gln Asn Ile 485 490 495 Asn Asn Ser Val Val Asn Phe Asn Asp Met Leu Gly Lys Asn Ser Thr 500 505 510 Phe Thr Leu Asp Thr Arg Trp Ser Ser Leu Ala Pro Gly Pro Cys Met 515 520 525 Gly Asp Asp Gly Arg Thr Pro Ser Thr Thr Lys Phe Ser Asn Ala Gln 530 535 540 Leu Met Phe Gly Ser Gly Thr Gln Pro Thr Glu Gly Gly Glu Asp Ala 545 550 555 560 Val His Ile Thr Ser Glu Ser Glu Val Lys Ala Thr Asn Pro Thr Ala 565 570 575 Ile Asp Glu Tyr Gly Arg Val Ala Asp Asn Thr Gln Asn Ala Thr Thr 580 585 590 Ala Pro Thr Thr Val Gly Asn Ala Ala Met Gly Ala Met Pro Gly Met 595 600 605 Val Trp Gln Asp Arg Asp Ile Tyr Leu Gln Gly Pro Ile Trp Gly Lys 610 615 620 Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly 625 630 635 640 Phe Gly Tyr Arg Lys Pro Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro 645 650 655 Val Pro Gly Asn Pro Ala Thr Thr Phe Ser Pro Asn Arg Ile Asn Asn 660 665 670 Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Thr Ile Asp Trp 675 680 685 Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Phe 690 695 700 Thr Ser Asn Phe Gly Thr Val Asp Ser Leu Asn Trp Ala Pro Asp Asn 705 710 715 720 Ala Gly Asn Tyr Lys Glu Pro Arg Val Ile Gly Thr Arg Tyr Leu Thr 725 730 735 Arg Ile Leu <210> 23 <211> 2220 <212> DNA <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 T434 Linker6 SpyTag <400> 23 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aaccctctca gccagattcg 420 tcctcggaca acacggcgcc acccgtgaaa aagtcccgtc tcgaagaagc ccagcccatt 480 caaagtccag acgtttccag cagcactggc ggaggaattg ccgacgtcat gtctggagat 540 gctgaaatgg ctgcagtggg cgggggagca ccgggcgtcg acggccaggg tgccgaggga 600 gtgggtactt cctcgggtaa ttggcattgc gattcccagt ggtcagaagg acacgtcaga 660 accaccagca ccagaacctg ggtgttgccc agctacaaca accacctgta taaacggctt 720 ggaagtagcg cacaatccaa tacctacaac ggattctcca ccccctgggg atacctcgac 780 ttcaatagat ggcactgtca cttcagtcct cggaactggc aacgtctcat caacaacaac 840 tggggcatca gaccaaaaag acttaatgtt aaattgttca acatacaagt caaagaggtc 900 acgacggaag gggggacgac gaccgtcgcc aataacctta ccagcacgat tcaggtgttt 960 gcggacaacg cgtacgaact cccgtatgtt gtcgacgcgg gtcacgaggg ggcattgccg 1020 ccgttcccaa acgacgtgtt tatgattccc caatacggat actgcgggct ggtgtctggt 1080 caaagtcagg ctcagtcgga cttgtgttcg ttttattgcc tggagtattt tccatcccag 1140 atgctgagaa caggaaacaa ttttgaaatg aatttcaggt ttgaagacgt tccatttcac 1200 tccatgtacg cccacagcca gtctctagac aggctcatga atcctttaat tgatcagtat 1260 ctgtggagtc taaaacaaac aggaaacccg actggatcaa caggcctgag cggcagcggc 1320 gcccacatcg tgatggtgga cgcctacaag ccgacgaagg gcctgagcgg cagcggcacg 1380 agagacttaa aatttatcaa gaacaaagtt cccaattttg cacattatgg aaaaaattgg 1440 cttcctggac cttttattag acaacagggg tggacaacac aaaatattaa taatagtgtt 1500 gttaatttta atgacatgct gggaaaaaat tcgacattta ctttggacac tagatggagt 1560 tcattagcgc ctggtccgtg tatgggggat gacggacgaa ctccatccac caccaagttc 1620 tcaaatgctc agctcatgtt tggatctgga acacaaccca ccgaaggcgg tgaagatgct 1680 gtacatatta catccgagtc ggaggtcaag gcaaccaacc caactgcaat cgatgaatac 1740 ggacgagtgg ccgataatac gcaaaatgca acaaccgccc caaccacagt gggaaatgct 1800 gcaatggggg ccatgcctgg gatggtgtgg caagataggg atatctatct tcaaggaccc 1860 atctggggaa aaatacccca tacagacgga cattttcatc cgtctcctct catggggggg 1920 tttggataca gaaaaccccc tccgcaaatt tttattaaaa acacccccgt tcctggaaat 1980 ccggcaacta cattttctcc aaatagaata aacaatttca ttactcaata ctcaacggga 2040 caagtgaccg ttactattga ctgggagctg caaaaggaaa actcaaagag atggaaccca 2100 gaagtacaat ttacatcaaa ttttggcacg gtcgattcac taaactgggc accggacaac 2160 gcgggaaact acaaagaacc aagggtgatt ggcaccagat acctgactcg tatactataa 2220 <210> 24 <211> 739 <212> PRT <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 T434 Linker6 SpyTag <400> 24 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Ser Gln Pro Asp Ser Ser Ser Asp Asn 130 135 140 Thr Ala Pro Pro Val Lys Lys Ser Arg Leu Glu Glu Ala Gln Pro Ile 145 150 155 160 Gln Ser Pro Asp Val Ser Ser Ser Thr Gly Gly Gly Ile Ala Asp Val 165 170 175 Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly Gly Ala Pro Gly 180 185 190 Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser Ser Gly Asn Trp 195 200 205 His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg Thr Thr Ser Thr 210 215 220 Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Leu 225 230 235 240 Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp 245 250 255 Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe Ser Pro Arg Asn 260 265 270 Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Arg Leu 275 280 285 Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Glu Gly 290 295 300 Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe 305 310 315 320 Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp Ala Gly His Glu 325 330 335 Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met Ile Pro Gln Tyr 340 345 350 Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala Gln Ser Asp Leu 355 360 365 Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr 370 375 380 Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp Val Pro Phe His 385 390 395 400 Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu 405 410 415 Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly Asn Pro Thr Gly 420 425 430 Ser Thr Gly Leu Ser Gly Ser Gly Ala His Ile Val Met Val Asp Ala 435 440 445 Tyr Lys Pro Thr Lys Gly Leu Ser Gly Ser Gly Thr Arg Asp Leu Lys 450 455 460 Phe Ile Lys Asn Lys Val Pro Asn Phe Ala His Tyr Gly Lys Asn Trp 465 470 475 480 Leu Pro Gly Pro Phe Ile Arg Gln Gln Gly Trp Thr Thr Gln Asn Ile 485 490 495 Asn Asn Ser Val Val Asn Phe Asn Asp Met Leu Gly Lys Asn Ser Thr 500 505 510 Phe Thr Leu Asp Thr Arg Trp Ser Ser Leu Ala Pro Gly Pro Cys Met 515 520 525 Gly Asp Asp Gly Arg Thr Pro Ser Thr Thr Lys Phe Ser Asn Ala Gln 530 535 540 Leu Met Phe Gly Ser Gly Thr Gln Pro Thr Glu Gly Gly Glu Asp Ala 545 550 555 560 Val His Ile Thr Ser Glu Ser Glu Val Lys Ala Thr Asn Pro Thr Ala 565 570 575 Ile Asp Glu Tyr Gly Arg Val Ala Asp Asn Thr Gln Asn Ala Thr Thr 580 585 590 Ala Pro Thr Thr Val Gly Asn Ala Ala Met Gly Ala Met Pro Gly Met 595 600 605 Val Trp Gln Asp Arg Asp Ile Tyr Leu Gln Gly Pro Ile Trp Gly Lys 610 615 620 Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly 625 630 635 640 Phe Gly Tyr Arg Lys Pro Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro 645 650 655 Val Pro Gly Asn Pro Ala Thr Thr Phe Ser Pro Asn Arg Ile Asn Asn 660 665 670 Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Thr Ile Asp Trp 675 680 685 Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Phe 690 695 700 Thr Ser Asn Phe Gly Thr Val Asp Ser Leu Asn Trp Ala Pro Asp Asn 705 710 715 720 Ala Gly Asn Tyr Lys Glu Pro Arg Val Ile Gly Thr Arg Tyr Leu Thr 725 730 735 Arg Ile Leu <210> 25 <211> 2220 <212> DNA <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 T435 Linker6 SpyTag <400> 25 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aaccctctca gccagattcg 420 tcctcggaca acacggcgcc acccgtgaaa aagtcccgtc tcgaagaagc ccagcccatt 480 caaagtccag acgtttccag cagcactggc ggaggaattg ccgacgtcat gtctggagat 540 gctgaaatgg ctgcagtggg cgggggagca ccgggcgtcg acggccaggg tgccgaggga 600 gtgggtactt cctcgggtaa ttggcattgc gattcccagt ggtcagaagg acacgtcaga 660 accaccagca ccagaacctg ggtgttgccc agctacaaca accacctgta taaacggctt 720 ggaagtagcg cacaatccaa tacctacaac ggattctcca ccccctgggg atacctcgac 780 ttcaatagat ggcactgtca cttcagtcct cggaactggc aacgtctcat caacaacaac 840 tggggcatca gaccaaaaag acttaatgtt aaattgttca acatacaagt caaagaggtc 900 acgacggaag gggggacgac gaccgtcgcc aataacctta ccagcacgat tcaggtgttt 960 gcggacaacg cgtacgaact cccgtatgtt gtcgacgcgg gtcacgaggg ggcattgccg 1020 ccgttcccaa acgacgtgtt tatgattccc caatacggat actgcgggct ggtgtctggt 1080 caaagtcagg ctcagtcgga cttgtgttcg ttttattgcc tggagtattt tccatcccag 1140 atgctgagaa caggaaacaa ttttgaaatg aatttcaggt ttgaagacgt tccatttcac 1200 tccatgtacg cccacagcca gtctctagac aggctcatga atcctttaat tgatcagtat 1260 ctgtggagtc taaaacaaac aggaaacccg actggatcaa caacgggcct gagcggcagc 1320 ggcgcccaca tcgtgatggt ggacgcctac aagccgacga agggcctgag cggcagcggc 1380 agagacttaa aatttatcaa gaacaaagtt cccaattttg cacattatgg aaaaaattgg 1440 cttcctggac cttttattag acaacagggg tggacaacac aaaatattaa taatagtgtt 1500 gttaatttta atgacatgct gggaaaaaat tcgacattta ctttggacac tagatggagt 1560 tcattagcgc ctggtccgtg tatgggggat gacggacgaa ctccatccac caccaagttc 1620 tcaaatgctc agctcatgtt tggatctgga acacaaccca ccgaaggcgg tgaagatgct 1680 gtacatatta catccgagtc ggaggtcaag gcaaccaacc caactgcaat cgatgaatac 1740 ggacgagtgg ccgataatac gcaaaatgca acaaccgccc caaccacagt gggaaatgct 1800 gcaatggggg ccatgcctgg gatggtgtgg caagataggg atatctatct tcaaggaccc 1860 atctggggaa aaatacccca tacagacgga cattttcatc cgtctcctct catggggggg 1920 tttggataca gaaaaccccc tccgcaaatt tttattaaaa acacccccgt tcctggaaat 1980 ccggcaacta cattttctcc aaatagaata aacaatttca ttactcaata ctcaacggga 2040 caagtgaccg ttactattga ctgggagctg caaaaggaaa actcaaagag atggaaccca 2100 gaagtacaat ttacatcaaa ttttggcacg gtcgattcac taaactgggc accggacaac 2160 gcgggaaact acaaagaacc aagggtgatt ggcaccagat acctgactcg tatactataa 2220 <210> 26 <211> 739 <212> PRT <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 T435 Linker6 SpyTag <400> 26 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Ser Gln Pro Asp Ser Ser Ser Asp Asn 130 135 140 Thr Ala Pro Pro Val Lys Lys Ser Arg Leu Glu Glu Ala Gln Pro Ile 145 150 155 160 Gln Ser Pro Asp Val Ser Ser Ser Thr Gly Gly Gly Ile Ala Asp Val 165 170 175 Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly Gly Ala Pro Gly 180 185 190 Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser Ser Gly Asn Trp 195 200 205 His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg Thr Thr Ser Thr 210 215 220 Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Leu 225 230 235 240 Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp 245 250 255 Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe Ser Pro Arg Asn 260 265 270 Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Arg Leu 275 280 285 Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Glu Gly 290 295 300 Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe 305 310 315 320 Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp Ala Gly His Glu 325 330 335 Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met Ile Pro Gln Tyr 340 345 350 Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala Gln Ser Asp Leu 355 360 365 Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr 370 375 380 Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp Val Pro Phe His 385 390 395 400 Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu 405 410 415 Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly Asn Pro Thr Gly 420 425 430 Ser Thr Thr Gly Leu Ser Gly Ser Gly Ala His Ile Val Met Val Asp 435 440 445 Ala Tyr Lys Pro Thr Lys Gly Leu Ser Gly Ser Gly Arg Asp Leu Lys 450 455 460 Phe Ile Lys Asn Lys Val Pro Asn Phe Ala His Tyr Gly Lys Asn Trp 465 470 475 480 Leu Pro Gly Pro Phe Ile Arg Gln Gln Gly Trp Thr Thr Gln Asn Ile 485 490 495 Asn Asn Ser Val Val Asn Phe Asn Asp Met Leu Gly Lys Asn Ser Thr 500 505 510 Phe Thr Leu Asp Thr Arg Trp Ser Ser Leu Ala Pro Gly Pro Cys Met 515 520 525 Gly Asp Asp Gly Arg Thr Pro Ser Thr Thr Lys Phe Ser Asn Ala Gln 530 535 540 Leu Met Phe Gly Ser Gly Thr Gln Pro Thr Glu Gly Gly Glu Asp Ala 545 550 555 560 Val His Ile Thr Ser Glu Ser Glu Val Lys Ala Thr Asn Pro Thr Ala 565 570 575 Ile Asp Glu Tyr Gly Arg Val Ala Asp Asn Thr Gln Asn Ala Thr Thr 580 585 590 Ala Pro Thr Thr Val Gly Asn Ala Ala Met Gly Ala Met Pro Gly Met 595 600 605 Val Trp Gln Asp Arg Asp Ile Tyr Leu Gln Gly Pro Ile Trp Gly Lys 610 615 620 Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly 625 630 635 640 Phe Gly Tyr Arg Lys Pro Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro 645 650 655 Val Pro Gly Asn Pro Ala Thr Thr Phe Ser Pro Asn Arg Ile Asn Asn 660 665 670 Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Thr Ile Asp Trp 675 680 685 Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Phe 690 695 700 Thr Ser Asn Phe Gly Thr Val Asp Ser Leu Asn Trp Ala Pro Asp Asn 705 710 715 720 Ala Gly Asn Tyr Lys Glu Pro Arg Val Ile Gly Thr Arg Tyr Leu Thr 725 730 735 Arg Ile Leu <210> 27 <211> 2220 <212> DNA <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 R436 Linker6 SpyTag <400> 27 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aaccctctca gccagattcg 420 tcctcggaca acacggcgcc acccgtgaaa aagtcccgtc tcgaagaagc ccagcccatt 480 caaagtccag acgtttccag cagcactggc ggaggaattg ccgacgtcat gtctggagat 540 gctgaaatgg ctgcagtggg cgggggagca ccgggcgtcg acggccaggg tgccgaggga 600 gtgggtactt cctcgggtaa ttggcattgc gattcccagt ggtcagaagg acacgtcaga 660 accaccagca ccagaacctg ggtgttgccc agctacaaca accacctgta taaacggctt 720 ggaagtagcg cacaatccaa tacctacaac ggattctcca ccccctgggg atacctcgac 780 ttcaatagat ggcactgtca cttcagtcct cggaactggc aacgtctcat caacaacaac 840 tggggcatca gaccaaaaag acttaatgtt aaattgttca acatacaagt caaagaggtc 900 acgacggaag gggggacgac gaccgtcgcc aataacctta ccagcacgat tcaggtgttt 960 gcggacaacg cgtacgaact cccgtatgtt gtcgacgcgg gtcacgaggg ggcattgccg 1020 ccgttcccaa acgacgtgtt tatgattccc caatacggat actgcgggct ggtgtctggt 1080 caaagtcagg ctcagtcgga cttgtgttcg ttttattgcc tggagtattt tccatcccag 1140 atgctgagaa caggaaacaa ttttgaaatg aatttcaggt ttgaagacgt tccatttcac 1200 tccatgtacg cccacagcca gtctctagac aggctcatga atcctttaat tgatcagtat 1260 ctgtggagtc taaaacaaac aggaaacccg actggatcaa caacgagagg cctgagcggc 1320 agcggcgccc acatcgtgat ggtggacgcc tacaagccga cgaagggcct gagcggcagc 1380 ggcgacttaa aatttatcaa gaacaaagtt cccaattttg cacattatgg aaaaaattgg 1440 cttcctggac cttttattag acaacagggg tggacaacac aaaatattaa taatagtgtt 1500 gttaatttta atgacatgct gggaaaaaat tcgacattta ctttggacac tagatggagt 1560 tcattagcgc ctggtccgtg tatgggggat gacggacgaa ctccatccac caccaagttc 1620 tcaaatgctc agctcatgtt tggatctgga acacaaccca ccgaaggcgg tgaagatgct 1680 gtacatatta catccgagtc ggaggtcaag gcaaccaacc caactgcaat cgatgaatac 1740 ggacgagtgg ccgataatac gcaaaatgca acaaccgccc caaccacagt gggaaatgct 1800 gcaatggggg ccatgcctgg gatggtgtgg caagataggg atatctatct tcaaggaccc 1860 atctggggaa aaatacccca tacagacgga cattttcatc cgtctcctct catggggggg 1920 tttggataca gaaaaccccc tccgcaaatt tttattaaaa acacccccgt tcctggaaat 1980 ccggcaacta cattttctcc aaatagaata aacaatttca ttactcaata ctcaacggga 2040 caagtgaccg ttactattga ctgggagctg caaaaggaaa actcaaagag atggaaccca 2100 gaagtacaat ttacatcaaa ttttggcacg gtcgattcac taaactgggc accggacaac 2160 gcgggaaact acaaagaacc aagggtgatt ggcaccagat acctgactcg tatactataa 2220 <210> 28 <211> 739 <212> PRT <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 R436 Linker6 SpyTag <400> 28 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Ser Gln Pro Asp Ser Ser Ser Asp Asn 130 135 140 Thr Ala Pro Pro Val Lys Lys Ser Arg Leu Glu Glu Ala Gln Pro Ile 145 150 155 160 Gln Ser Pro Asp Val Ser Ser Ser Thr Gly Gly Gly Ile Ala Asp Val 165 170 175 Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly Gly Ala Pro Gly 180 185 190 Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser Ser Gly Asn Trp 195 200 205 His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg Thr Thr Ser Thr 210 215 220 Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Leu 225 230 235 240 Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp 245 250 255 Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe Ser Pro Arg Asn 260 265 270 Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Arg Leu 275 280 285 Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Glu Gly 290 295 300 Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe 305 310 315 320 Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp Ala Gly His Glu 325 330 335 Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met Ile Pro Gln Tyr 340 345 350 Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala Gln Ser Asp Leu 355 360 365 Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr 370 375 380 Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp Val Pro Phe His 385 390 395 400 Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu 405 410 415 Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly Asn Pro Thr Gly 420 425 430 Ser Thr Thr Arg Gly Leu Ser Gly Ser Gly Ala His Ile Val Met Val 435 440 445 Asp Ala Tyr Lys Pro Thr Lys Gly Leu Ser Gly Ser Gly Asp Leu Lys 450 455 460 Phe Ile Lys Asn Lys Val Pro Asn Phe Ala His Tyr Gly Lys Asn Trp 465 470 475 480 Leu Pro Gly Pro Phe Ile Arg Gln Gln Gly Trp Thr Thr Gln Asn Ile 485 490 495 Asn Asn Ser Val Val Asn Phe Asn Asp Met Leu Gly Lys Asn Ser Thr 500 505 510 Phe Thr Leu Asp Thr Arg Trp Ser Ser Leu Ala Pro Gly Pro Cys Met 515 520 525 Gly Asp Asp Gly Arg Thr Pro Ser Thr Thr Lys Phe Ser Asn Ala Gln 530 535 540 Leu Met Phe Gly Ser Gly Thr Gln Pro Thr Glu Gly Gly Glu Asp Ala 545 550 555 560 Val His Ile Thr Ser Glu Ser Glu Val Lys Ala Thr Asn Pro Thr Ala 565 570 575 Ile Asp Glu Tyr Gly Arg Val Ala Asp Asn Thr Gln Asn Ala Thr Thr 580 585 590 Ala Pro Thr Thr Val Gly Asn Ala Ala Met Gly Ala Met Pro Gly Met 595 600 605 Val Trp Gln Asp Arg Asp Ile Tyr Leu Gln Gly Pro Ile Trp Gly Lys 610 615 620 Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly 625 630 635 640 Phe Gly Tyr Arg Lys Pro Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro 645 650 655 Val Pro Gly Asn Pro Ala Thr Thr Phe Ser Pro Asn Arg Ile Asn Asn 660 665 670 Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Thr Ile Asp Trp 675 680 685 Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Phe 690 695 700 Thr Ser Asn Phe Gly Thr Val Asp Ser Leu Asn Trp Ala Pro Asp Asn 705 710 715 720 Ala Gly Asn Tyr Lys Glu Pro Arg Val Ile Gly Thr Arg Tyr Leu Thr 725 730 735 Arg Ile Leu <210> 29 <211> 2220 <212> DNA <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 D437 Linker6 SpyTag <400> 29 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aaccctctca gccagattcg 420 tcctcggaca acacggcgcc acccgtgaaa aagtcccgtc tcgaagaagc ccagcccatt 480 caaagtccag acgtttccag cagcactggc ggaggaattg ccgacgtcat gtctggagat 540 gctgaaatgg ctgcagtggg cgggggagca ccgggcgtcg acggccaggg tgccgaggga 600 gtgggtactt cctcgggtaa ttggcattgc gattcccagt ggtcagaagg acacgtcaga 660 accaccagca ccagaacctg ggtgttgccc agctacaaca accacctgta taaacggctt 720 ggaagtagcg cacaatccaa tacctacaac ggattctcca ccccctgggg atacctcgac 780 ttcaatagat ggcactgtca cttcagtcct cggaactggc aacgtctcat caacaacaac 840 tggggcatca gaccaaaaag acttaatgtt aaattgttca acatacaagt caaagaggtc 900 acgacggaag gggggacgac gaccgtcgcc aataacctta ccagcacgat tcaggtgttt 960 gcggacaacg cgtacgaact cccgtatgtt gtcgacgcgg gtcacgaggg ggcattgccg 1020 ccgttcccaa acgacgtgtt tatgattccc caatacggat actgcgggct ggtgtctggt 1080 caaagtcagg ctcagtcgga cttgtgttcg ttttattgcc tggagtattt tccatcccag 1140 atgctgagaa caggaaacaa ttttgaaatg aatttcaggt ttgaagacgt tccatttcac 1200 tccatgtacg cccacagcca gtctctagac aggctcatga atcctttaat tgatcagtat 1260 ctgtggagtc taaaacaaac aggaaacccg actggatcaa caacgagaga cggcctgagc 1320 ggcagcggcg cccacatcgt gatggtggac gcctacaagc cgacgaaggg cctgagcggc 1380 agcggcttaa aatttatcaa gaacaaagtt cccaattttg cacattatgg aaaaaattgg 1440 cttcctggac cttttattag acaacagggg tggacaacac aaaatattaa taatagtgtt 1500 gttaatttta atgacatgct gggaaaaaat tcgacattta ctttggacac tagatggagt 1560 tcattagcgc ctggtccgtg tatgggggat gacggacgaa ctccatccac caccaagttc 1620 tcaaatgctc agctcatgtt tggatctgga acacaaccca ccgaaggcgg tgaagatgct 1680 gtacatatta catccgagtc ggaggtcaag gcaaccaacc caactgcaat cgatgaatac 1740 ggacgagtgg ccgataatac gcaaaatgca acaaccgccc caaccacagt gggaaatgct 1800 gcaatggggg ccatgcctgg gatggtgtgg caagataggg atatctatct tcaaggaccc 1860 atctggggaa aaatacccca tacagacgga cattttcatc cgtctcctct catggggggg 1920 tttggataca gaaaaccccc tccgcaaatt tttattaaaa acacccccgt tcctggaaat 1980 ccggcaacta cattttctcc aaatagaata aacaatttca ttactcaata ctcaacggga 2040 caagtgaccg ttactattga ctgggagctg caaaaggaaa actcaaagag atggaaccca 2100 gaagtacaat ttacatcaaa ttttggcacg gtcgattcac taaactgggc accggacaac 2160 gcgggaaact acaaagaacc aagggtgatt ggcaccagat acctgactcg tatactataa 2220 <210> 30 <211> 739 <212> PRT <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 D437 Linker6 SpyTag <400> 30 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Ser Gln Pro Asp Ser Ser Ser Asp Asn 130 135 140 Thr Ala Pro Pro Val Lys Lys Ser Arg Leu Glu Glu Ala Gln Pro Ile 145 150 155 160 Gln Ser Pro Asp Val Ser Ser Ser Thr Gly Gly Gly Ile Ala Asp Val 165 170 175 Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly Gly Ala Pro Gly 180 185 190 Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser Ser Gly Asn Trp 195 200 205 His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg Thr Thr Ser Thr 210 215 220 Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Leu 225 230 235 240 Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp 245 250 255 Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe Ser Pro Arg Asn 260 265 270 Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Arg Leu 275 280 285 Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Glu Gly 290 295 300 Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe 305 310 315 320 Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp Ala Gly His Glu 325 330 335 Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met Ile Pro Gln Tyr 340 345 350 Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala Gln Ser Asp Leu 355 360 365 Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr 370 375 380 Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp Val Pro Phe His 385 390 395 400 Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu 405 410 415 Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly Asn Pro Thr Gly 420 425 430 Ser Thr Thr Arg Asp Gly Leu Ser Gly Ser Gly Ala His Ile Val Met 435 440 445 Val Asp Ala Tyr Lys Pro Thr Lys Gly Leu Ser Gly Ser Gly Leu Lys 450 455 460 Phe Ile Lys Asn Lys Val Pro Asn Phe Ala His Tyr Gly Lys Asn Trp 465 470 475 480 Leu Pro Gly Pro Phe Ile Arg Gln Gln Gly Trp Thr Thr Gln Asn Ile 485 490 495 Asn Asn Ser Val Val Asn Phe Asn Asp Met Leu Gly Lys Asn Ser Thr 500 505 510 Phe Thr Leu Asp Thr Arg Trp Ser Ser Leu Ala Pro Gly Pro Cys Met 515 520 525 Gly Asp Asp Gly Arg Thr Pro Ser Thr Thr Lys Phe Ser Asn Ala Gln 530 535 540 Leu Met Phe Gly Ser Gly Thr Gln Pro Thr Glu Gly Gly Glu Asp Ala 545 550 555 560 Val His Ile Thr Ser Glu Ser Glu Val Lys Ala Thr Asn Pro Thr Ala 565 570 575 Ile Asp Glu Tyr Gly Arg Val Ala Asp Asn Thr Gln Asn Ala Thr Thr 580 585 590 Ala Pro Thr Thr Val Gly Asn Ala Ala Met Gly Ala Met Pro Gly Met 595 600 605 Val Trp Gln Asp Arg Asp Ile Tyr Leu Gln Gly Pro Ile Trp Gly Lys 610 615 620 Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly 625 630 635 640 Phe Gly Tyr Arg Lys Pro Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro 645 650 655 Val Pro Gly Asn Pro Ala Thr Thr Phe Ser Pro Asn Arg Ile Asn Asn 660 665 670 Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Thr Ile Asp Trp 675 680 685 Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Phe 690 695 700 Thr Ser Asn Phe Gly Thr Val Asp Ser Leu Asn Trp Ala Pro Asp Asn 705 710 715 720 Ala Gly Asn Tyr Lys Glu Pro Arg Val Ile Gly Thr Arg Tyr Leu Thr 725 730 735 Arg Ile Leu <210> 31 <211> 2244 <212> DNA <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 G432 Linker10 SpyTag <400> 31 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aaccctctca gccagattcg 420 tcctcggaca acacggcgcc acccgtgaaa aagtcccgtc tcgaagaagc ccagcccatt 480 caaagtccag acgtttccag cagcactggc ggaggaattg ccgacgtcat gtctggagat 540 gctgaaatgg ctgcagtggg cgggggagca ccgggcgtcg acggccaggg tgccgaggga 600 gtgggtactt cctcgggtaa ttggcattgc gattcccagt ggtcagaagg acacgtcaga 660 accaccagca ccagaacctg ggtgttgccc agctacaaca accacctgta taaacggctt 720 ggaagtagcg cacaatccaa tacctacaac ggattctcca ccccctgggg atacctcgac 780 ttcaatagat ggcactgtca cttcagtcct cggaactggc aacgtctcat caacaacaac 840 tggggcatca gaccaaaaag acttaatgtt aaattgttca acatacaagt caaagaggtc 900 acgacggaag gggggacgac gaccgtcgcc aataacctta ccagcacgat tcaggtgttt 960 gcggacaacg cgtacgaact cccgtatgtt gtcgacgcgg gtcacgaggg ggcattgccg 1020 ccgttcccaa acgacgtgtt tatgattccc caatacggat actgcgggct ggtgtctggt 1080 caaagtcagg ctcagtcgga cttgtgttcg ttttattgcc tggagtattt tccatcccag 1140 atgctgagaa caggaaacaa ttttgaaatg aatttcaggt ttgaagacgt tccatttcac 1200 tccatgtacg cccacagcca gtctctagac aggctcatga atcctttaat tgatcagtat 1260 ctgtggagtc taaaacaaac aggaaacccg actggaggcc tggggagcgg cggaggcctg 1320 agcggcgccc acatcgtgat ggtggacgcc tacaagccga cgaagggcct gagcggcggc 1380 agcggcctgg ggggctcaac aacgagagac ttaaaattta tcaagaacaa agttcccaat 1440 tttgcacatt atggaaaaaa ttggcttcct ggacctttta ttagacaaca ggggtggaca 1500 acacaaaata ttaataatag tgttgttaat tttaatgaca tgctgggaaa aaattcgaca 1560 tttactttgg acactagatg gagttcatta gcgcctggtc cgtgtatggg ggatgacgga 1620 cgaactccat ccaccaccaa gttctcaaat gctcagctca tgtttggatc tggaacacaa 1680 cccaccgaag gcggtgaaga tgctgtacat attacatccg agtcggaggt caaggcaacc 1740 aacccaactg caatcgatga atacggacga gtggccgata atacgcaaaa tgcaacaacc 1800 gccccaacca cagtgggaaa tgctgcaatg ggggccatgc ctgggatggt gtggcaagat 1860 agggatatct atcttcaagg acccatctgg ggaaaaatac cccatacaga cggacatttt 1920 catccgtctc ctctcatggg ggggtttgga tacagaaaac cccctccgca aatttttatt 1980 aaaaacaccc ccgttcctgg aaatccggca actacatttt ctccaaatag aataaacaat 2040 ttcattactc aatactcaac gggacaagtg accgttacta ttgactggga gctgcaaaag 2100 gaaaactcaa agagatggaa cccagaagta caatttacat caaattttgg cacggtcgat 2160 tcactaaact gggcaccgga caacgcggga aactacaaag aaccaagggt gattggcacc 2220 agatacctga ctcgtatact ataa 2244 <210> 32 <211> 747 <212> PRT <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 G432 Linker10 SpyTag <400> 32 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Ser Gln Pro Asp Ser Ser Ser Asp Asn 130 135 140 Thr Ala Pro Pro Val Lys Lys Ser Arg Leu Glu Glu Ala Gln Pro Ile 145 150 155 160 Gln Ser Pro Asp Val Ser Ser Ser Thr Gly Gly Gly Ile Ala Asp Val 165 170 175 Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly Gly Ala Pro Gly 180 185 190 Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser Ser Gly Asn Trp 195 200 205 His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg Thr Thr Ser Thr 210 215 220 Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Leu 225 230 235 240 Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp 245 250 255 Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe Ser Pro Arg Asn 260 265 270 Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Arg Leu 275 280 285 Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Glu Gly 290 295 300 Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe 305 310 315 320 Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp Ala Gly His Glu 325 330 335 Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met Ile Pro Gln Tyr 340 345 350 Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala Gln Ser Asp Leu 355 360 365 Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr 370 375 380 Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp Val Pro Phe His 385 390 395 400 Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu 405 410 415 Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly Asn Pro Thr Gly 420 425 430 Gly Leu Gly Ser Gly Gly Gly Leu Ser Gly Ala His Ile Val Met Val 435 440 445 Asp Ala Tyr Lys Pro Thr Lys Gly Leu Ser Gly Gly Ser Gly Leu Gly 450 455 460 Gly Ser Thr Thr Arg Asp Leu Lys Phe Ile Lys Asn Lys Val Pro Asn 465 470 475 480 Phe Ala His Tyr Gly Lys Asn Trp Leu Pro Gly Pro Phe Ile Arg Gln 485 490 495 Gln Gly Trp Thr Thr Gln Asn Ile Asn Asn Ser Val Val Asn Phe Asn 500 505 510 Asp Met Leu Gly Lys Asn Ser Thr Phe Thr Leu Asp Thr Arg Trp Ser 515 520 525 Ser Leu Ala Pro Gly Pro Cys Met Gly Asp Asp Gly Arg Thr Pro Ser 530 535 540 Thr Thr Lys Phe Ser Asn Ala Gln Leu Met Phe Gly Ser Gly Thr Gln 545 550 555 560 Pro Thr Glu Gly Gly Glu Asp Ala Val His Ile Thr Ser Glu Ser Glu 565 570 575 Val Lys Ala Thr Asn Pro Thr Ala Ile Asp Glu Tyr Gly Arg Val Ala 580 585 590 Asp Asn Thr Gln Asn Ala Thr Thr Ala Pro Thr Thr Val Gly Asn Ala 595 600 605 Ala Met Gly Ala Met Pro Gly Met Val Trp Gln Asp Arg Asp Ile Tyr 610 615 620 Leu Gln Gly Pro Ile Trp Gly Lys Ile Pro His Thr Asp Gly His Phe 625 630 635 640 His Pro Ser Pro Leu Met Gly Gly Phe Gly Tyr Arg Lys Pro Pro Pro 645 650 655 Gln Ile Phe Ile Lys Asn Thr Pro Val Pro Gly Asn Pro Ala Thr Thr 660 665 670 Phe Ser Pro Asn Arg Ile Asn Asn Phe Ile Thr Gln Tyr Ser Thr Gly 675 680 685 Gln Val Thr Val Thr Ile Asp Trp Glu Leu Gln Lys Glu Asn Ser Lys 690 695 700 Arg Trp Asn Pro Glu Val Gln Phe Thr Ser Asn Phe Gly Thr Val Asp 705 710 715 720 Ser Leu Asn Trp Ala Pro Asp Asn Ala Gly Asn Tyr Lys Glu Pro Arg 725 730 735 Val Ile Gly Thr Arg Tyr Leu Thr Arg Ile Leu 740 745 <210> 33 <211> 2262 <212> DNA <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Dragon VP2 VP3 G436 Linker6 SpyTag <400> 33 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggccgaa 420 aagcgaaaga cacccgaaga gtggttagct caagaaaaga ctccaaccaa acaaaggttc 480 cagataccag ctccaggaca atctggatca gattctcctt ccacctcagg atccggcggt 540 actgcaggct ccagttctag cgcatcaaat acaatggctc aaggaggtgg cggaccaatg 600 gcagacgata accaaggcgc cgagggagtg ggtaatgcct cgggagattg gcattgcgat 660 acccaatggc tgggcgacca cgtcattaca aaatctacca gaacttgggt tctgccctct 720 tacgggaatc atctctactc gcccatcaac tttgatggaa ccacagggaa cggaacccaa 780 gccgcttact gcggatacgc taccccctgg gcctactttg actttaaccg attccactgc 840 cacttttccc cccgagactg gcaaagactc attaacaacc ataccggaat acgaccagtc 900 ggactcaaat tcaagctgtt caacatccag gtcaaggaaa tcacagtaca agattcgacc 960 aaaacgatcg ccaacaatct caccagcacc gtacaggtct ttgcggacac ggagcaccag 1020 ctcccgtacg tattaggaaa tgccacgcag ggcacgtttc ctccctttcc ggctgaagtc 1080 tttcagttgc ctcagtacgg ctactgtacc atccaaggcc ctcagggtaa gtttaccgac 1140 agaagtgcct tctactgctt ggagtacttt ccttccaaga tgctgagaac ggggaataac 1200 tttgaattta cttacaagtt cgagaaggtt cccttccatt ctggctgggc tcaaagccag 1260 tcgttggatc gattgatgaa tcccttgatc ccacagtacc tgttggccga ttatggtggc 1320 ctgagcggca gcggcgccca catcgtgatg gtggacgcct acaagccgac gaagggcctg 1380 agcggcagcg gcacgaccgc cagtagtgcc ataacatact atcggccaaa cagcacagac 1440 ttgagctggt actttaaaaa ctggctgcct gggccagtgg aaaggcgaca gcaaatcaat 1500 tctgaagact cgacgaaaaa ccatgccaat ttgaacggga atgcacacac caacaaatac 1560 agcatccagc acagacaaac caagatgatg ccaggggtgg ctctcagtag taaatacaca 1620 ggtgctgctg aaggaacgtc gttactgaac ggggtattga cctttgataa gatcgccaat 1680 gacaatacta acatcacgga tacaaataat gtcaatcgga cgatcgaaga tgaaattcaa 1740 ggtaccaatc cttatggaaa cgacgtaccc attaccgtcg ctgtcaatac acaaaacgcg 1800 accacttctc ctaccatgca aaacagcagc acgtatgaac tattacctgg tgctgtctgg 1860 tccaacagag atatttacct gcaaggtccc atctgggcta aaatacccga taccgatgga 1920 cactttcacc cgtctccaca aatgggtggt ttcggactta aaaacccacc accgatgatc 1980 ctcatcaaaa acacacccgt tcccgccgat ccaccaacga ccttcaaacc gactccgatg 2040 aacagcttca tcagcgaata cagtaccggt caggtgactg tagagatgct gtgggaggtc 2100 cggaaagaag actccaagag atggaacccg gaaatccagt ttacctccaa ttttggattg 2160 tccgatcctc agatcgacgg tatacccttt ggtattacca aattgggtaa ttacgaggaa 2220 ccacgtccta ttggcaccag atacctgact cgtcatttgt aa 2262 <210> 34 <211> 753 <212> PRT <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Dragon VP2 VP3 G436 Linker6 SpyTag <400> 34 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Glu Lys Arg Lys Thr 130 135 140 Pro Glu Glu Trp Leu Ala Gln Glu Lys Thr Pro Thr Lys Gln Arg Phe 145 150 155 160 Gln Ile Pro Ala Pro Gly Gln Ser Gly Ser Asp Ser Pro Ser Thr Ser 165 170 175 Gly Ser Gly Gly Thr Ala Gly Ser Ser Ser Ser Ala Ser Asn Thr Met 180 185 190 Ala Gln Gly Gly Gly Gly Pro Met Ala Asp Asp Asn Gln Gly Ala Glu 195 200 205 Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Thr Gln Trp Leu 210 215 220 Gly Asp His Val Ile Thr Lys Ser Thr Arg Thr Trp Val Leu Pro Ser 225 230 235 240 Tyr Gly Asn His Leu Tyr Ser Pro Ile Asn Phe Asp Gly Thr Thr Gly 245 250 255 Asn Gly Thr Gln Ala Ala Tyr Cys Gly Tyr Ala Thr Pro Trp Ala Tyr 260 265 270 Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln 275 280 285 Arg Leu Ile Asn Asn His Thr Gly Ile Arg Pro Val Gly Leu Lys Phe 290 295 300 Lys Leu Phe Asn Ile Gln Val Lys Glu Ile Thr Val Gln Asp Ser Thr 305 310 315 320 Lys Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Ala Asp 325 330 335 Thr Glu His Gln Leu Pro Tyr Val Leu Gly Asn Ala Thr Gln Gly Thr 340 345 350 Phe Pro Pro Phe Pro Ala Glu Val Phe Gln Leu Pro Gln Tyr Gly Tyr 355 360 365 Cys Thr Ile Gln Gly Pro Gln Gly Lys Phe Thr Asp Arg Ser Ala Phe 370 375 380 Tyr Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly Asn Asn 385 390 395 400 Phe Glu Phe Thr Tyr Lys Phe Glu Lys Val Pro Phe His Ser Gly Trp 405 410 415 Ala Gln Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile Pro Gln 420 425 430 Tyr Leu Leu Ala Asp Tyr Gly Gly Leu Ser Gly Ser Gly Ala His Ile 435 440 445 Val Met Val Asp Ala Tyr Lys Pro Thr Lys Gly Leu Ser Gly Ser Gly 450 455 460 Thr Thr Ala Ser Ser Ala Ile Thr Tyr Tyr Arg Pro Asn Ser Thr Asp 465 470 475 480 Leu Ser Trp Tyr Phe Lys Asn Trp Leu Pro Gly Pro Val Glu Arg Arg 485 490 495 Gln Gln Ile Asn Ser Glu Asp Ser Thr Lys Asn His Ala Asn Leu Asn 500 505 510 Gly Asn Ala His Thr Asn Lys Tyr Ser Ile Gln His Arg Gln Thr Lys 515 520 525 Met Met Pro Gly Val Ala Leu Ser Ser Lys Tyr Thr Gly Ala Ala Glu 530 535 540 Gly Thr Ser Leu Leu Asn Gly Val Leu Thr Phe Asp Lys Ile Ala Asn 545 550 555 560 Asp Asn Thr Asn Ile Thr Asp Thr Asn Asn Val Asn Arg Thr Ile Glu 565 570 575 Asp Glu Ile Gln Gly Thr Asn Pro Tyr Gly Asn Asp Val Pro Ile Thr 580 585 590 Val Ala Val Asn Thr Gln Asn Ala Thr Thr Ser Pro Thr Met Gln Asn 595 600 605 Ser Ser Thr Tyr Glu Leu Leu Pro Gly Ala Val Trp Ser Asn Arg Asp 610 615 620 Ile Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro Asp Thr Asp Gly 625 630 635 640 His Phe His Pro Ser Pro Gln Met Gly Gly Phe Gly Leu Lys Asn Pro 645 650 655 Pro Pro Met Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asp Pro Pro 660 665 670 Thr Thr Phe Lys Pro Thr Pro Met Asn Ser Phe Ile Ser Glu Tyr Ser 675 680 685 Thr Gly Gln Val Thr Val Glu Met Leu Trp Glu Val Arg Lys Glu Asp 690 695 700 Ser Lys Arg Trp Asn Pro Glu Ile Gln Phe Thr Ser Asn Phe Gly Leu 705 710 715 720 Ser Asp Pro Gln Ile Asp Gly Ile Pro Phe Gly Ile Thr Lys Leu Gly 725 730 735 Asn Tyr Glu Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg His 740 745 750 Leu <210> 35 <211> 2262 <212> DNA <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Dragon VP2 VP3 T573 Linker6 SpyTag <400> 35 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggccgaa 420 aagcgaaaga cacccgaaga gtggttagct caagaaaaga ctccaaccaa acaaaggttc 480 cagataccag ctccaggaca atctggatca gattctcctt ccacctcagg atccggcggt 540 actgcaggct ccagttctag cgcatcaaat acaatggctc aaggaggtgg cggaccaatg 600 gcagacgata accaaggcgc cgagggagtg ggtaatgcct cgggagattg gcattgcgat 660 acccaatggc tgggcgacca cgtcattaca aaatctacca gaacttgggt tctgccctct 720 tacgggaatc atctctactc gcccatcaac tttgatggaa ccacagggaa cggaacccaa 780 gccgcttact gcggatacgc taccccctgg gcctactttg actttaaccg attccactgc 840 cacttttccc cccgagactg gcaaagactc attaacaacc ataccggaat acgaccagtc 900 ggactcaaat tcaagctgtt caacatccag gtcaaggaaa tcacagtaca agattcgacc 960 aaaacgatcg ccaacaatct caccagcacc gtacaggtct ttgcggacac ggagcaccag 1020 ctcccgtacg tattaggaaa tgccacgcag ggcacgtttc ctccctttcc ggctgaagtc 1080 tttcagttgc ctcagtacgg ctactgtacc atccaaggcc ctcagggtaa gtttaccgac 1140 agaagtgcct tctactgctt ggagtacttt ccttccaaga tgctgagaac ggggaataac 1200 tttgaattta cttacaagtt cgagaaggtt cccttccatt ctggctgggc tcaaagccag 1260 tcgttggatc gattgatgaa tcccttgatc ccacagtacc tgttggccga ttatggtacg 1320 accgccagta gtgccataac atactatcgg ccaaacagca cagacttgag ctggtacttt 1380 aaaaactggc tgcctgggcc agtggaaagg cgacagcaaa tcaattctga agactcgacg 1440 aaaaaccatg ccaatttgaa cgggaatgca cacaccaaca aatacagcat ccagcacaga 1500 caaaccaaga tgatgccagg ggtggctctc agtagtaaat acacaggtgc tgctgaagga 1560 acgtcgttac tgaacggggt attgaccttt gataagatcg ccaatgacaa tactaacatc 1620 acggatacaa ataatgtcaa tcggacgatc gaagatgaaa ttcaaggtac caatccttat 1680 ggaaacgacg tacccattac cgtcgctgtc aatacacaaa acgcgaccgg cctgagcggc 1740 agcggcgccc acatcgtgat ggtggacgcc tacaagccga cgaagggcct gagcggcagc 1800 ggcacttctc ctaccatgca aaacagcagc acgtatgaac tattacctgg tgctgtctgg 1860 tccaacagag atatttacct gcaaggtccc atctgggcta aaatacccga taccgatgga 1920 cactttcacc cgtctccaca aatgggtggt ttcggactta aaaacccacc accgatgatc 1980 ctcatcaaaa acacacccgt tcccgccgat ccaccaacga ccttcaaacc gactccgatg 2040 aacagcttca tcagcgaata cagtaccggt caggtgactg tagagatgct gtgggaggtc 2100 cggaaagaag actccaagag atggaacccg gaaatccagt ttacctccaa ttttggattg 2160 tccgatcctc agatcgacgg tatacccttt ggtattacca aattgggtaa ttacgaggaa 2220 ccacgtccta ttggcaccag atacctgact cgtcatttgt aa 2262 <210> 36 <211> 753 <212> PRT <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Dragon VP2 VP3 T573 Linker6 SpyTag <400> 36 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Glu Lys Arg Lys Thr 130 135 140 Pro Glu Glu Trp Leu Ala Gln Glu Lys Thr Pro Thr Lys Gln Arg Phe 145 150 155 160 Gln Ile Pro Ala Pro Gly Gln Ser Gly Ser Asp Ser Pro Ser Thr Ser 165 170 175 Gly Ser Gly Gly Thr Ala Gly Ser Ser Ser Ser Ala Ser Asn Thr Met 180 185 190 Ala Gln Gly Gly Gly Gly Pro Met Ala Asp Asp Asn Gln Gly Ala Glu 195 200 205 Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Thr Gln Trp Leu 210 215 220 Gly Asp His Val Ile Thr Lys Ser Thr Arg Thr Trp Val Leu Pro Ser 225 230 235 240 Tyr Gly Asn His Leu Tyr Ser Pro Ile Asn Phe Asp Gly Thr Thr Gly 245 250 255 Asn Gly Thr Gln Ala Ala Tyr Cys Gly Tyr Ala Thr Pro Trp Ala Tyr 260 265 270 Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln 275 280 285 Arg Leu Ile Asn Asn His Thr Gly Ile Arg Pro Val Gly Leu Lys Phe 290 295 300 Lys Leu Phe Asn Ile Gln Val Lys Glu Ile Thr Val Gln Asp Ser Thr 305 310 315 320 Lys Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Ala Asp 325 330 335 Thr Glu His Gln Leu Pro Tyr Val Leu Gly Asn Ala Thr Gln Gly Thr 340 345 350 Phe Pro Pro Phe Pro Ala Glu Val Phe Gln Leu Pro Gln Tyr Gly Tyr 355 360 365 Cys Thr Ile Gln Gly Pro Gln Gly Lys Phe Thr Asp Arg Ser Ala Phe 370 375 380 Tyr Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly Asn Asn 385 390 395 400 Phe Glu Phe Thr Tyr Lys Phe Glu Lys Val Pro Phe His Ser Gly Trp 405 410 415 Ala Gln Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile Pro Gln 420 425 430 Tyr Leu Leu Ala Asp Tyr Gly Thr Thr Ala Ser Ser Ala Ile Thr Tyr 435 440 445 Tyr Arg Pro Asn Ser Thr Asp Leu Ser Trp Tyr Phe Lys Asn Trp Leu 450 455 460 Pro Gly Pro Val Glu Arg Arg Gln Gln Ile Asn Ser Glu Asp Ser Thr 465 470 475 480 Lys Asn His Ala Asn Leu Asn Gly Asn Ala His Thr Asn Lys Tyr Ser 485 490 495 Ile Gln His Arg Gln Thr Lys Met Met Pro Gly Val Ala Leu Ser Ser 500 505 510 Lys Tyr Thr Gly Ala Ala Glu Gly Thr Ser Leu Leu Asn Gly Val Leu 515 520 525 Thr Phe Asp Lys Ile Ala Asn Asp Asn Thr Asn Ile Thr Asp Thr Asn 530 535 540 Asn Val Asn Arg Thr Ile Glu Asp Glu Ile Gln Gly Thr Asn Pro Tyr 545 550 555 560 Gly Asn Asp Val Pro Ile Thr Val Ala Val Asn Thr Gln Asn Ala Thr 565 570 575 Gly Leu Ser Gly Ser Gly Ala His Ile Val Met Val Asp Ala Tyr Lys 580 585 590 Pro Thr Lys Gly Leu Ser Gly Ser Gly Thr Ser Pro Thr Met Gln Asn 595 600 605 Ser Ser Thr Tyr Glu Leu Leu Pro Gly Ala Val Trp Ser Asn Arg Asp 610 615 620 Ile Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro Asp Thr Asp Gly 625 630 635 640 His Phe His Pro Ser Pro Gln Met Gly Gly Phe Gly Leu Lys Asn Pro 645 650 655 Pro Pro Met Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asp Pro Pro 660 665 670 Thr Thr Phe Lys Pro Thr Pro Met Asn Ser Phe Ile Ser Glu Tyr Ser 675 680 685 Thr Gly Gln Val Thr Val Glu Met Leu Trp Glu Val Arg Lys Glu Asp 690 695 700 Ser Lys Arg Trp Asn Pro Glu Ile Gln Phe Thr Ser Asn Phe Gly Leu 705 710 715 720 Ser Asp Pro Gln Ile Asp Gly Ile Pro Phe Gly Ile Thr Lys Leu Gly 725 730 735 Asn Tyr Glu Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg His 740 745 750 Leu <210> 37 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> 4 linker <400> 37 Gly Leu Ser Gly 1 <210> 38 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> 6 linker <400> 38 Gly Leu Ser Gly Ser Gly 1 5 <210> 39 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> 8 linker <400> 39 Gly Leu Ser Gly Leu Ser Gly Ser 1 5 <210> 40 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> 10 linker <400> 40 Gly Leu Ser Gly Leu Ser Gly Leu Ser Gly 1 5 10 <210> 41 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> 10 linker <400> 41 Gly Leu Ser Gly Gly Ser Gly Leu Ser Gly 1 5 10 <210> 42 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> SpyTag <400> 42 Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys 1 5 10 <210> 43 <211> 113 <212> PRT <213> Artificial Sequence <220> <223> Spycatcher <400> 43 Val Asp Thr Leu Ser Gly Leu Ser Ser Glu Gln Gly Gln Ser Gly Asp 1 5 10 15 Met Thr Ile Glu Glu Asp Ser Ala Thr His Ile Lys Phe Ser Lys Arg 20 25 30 Asp Glu Asp Gly Lys Glu Leu Ala Gly Ala Thr Met Glu Leu Arg Asp 35 40 45 Ser Ser Gly Lys Thr Ile Ser Thr Trp Ile Ser Asp Gly Gln Val Lys 50 55 60 Asp Phe Tyr Leu Tyr Pro Gly Lys Tyr Thr Phe Val Glu Thr Ala Ala 65 70 75 80 Pro Asp Gly Tyr Glu Val Ala Thr Ala Ile Thr Phe Thr Val Asn Glu 85 90 95 Gln Gly Gln Val Thr Val Asn Gly Lys Ala Thr Lys Gly Asp Ala His 100 105 110 Ile <210> 44 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> c-myc <400> 44 Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu 1 5 10 <210> 45 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> B1 <400> 45 Ile Gly Thr Arg Tyr Leu Thr Arg 1 5 <210> 46 <211> 1341 <212> DNA <213> Artificial Sequence <220> <223> Human IgG4 heavy chain - linker - SpyCatcher <400> 46 gcctccacca agggcccatc ggtcttcccc ctggcgccct gctccaggag cacctccgag 60 agcacagccg ccctgggctg cctggtcaag gactacttcc ccgaaccggt gacggtgtcg 120 tggaactcag gcgccctgac cagcggcgtg cacaccttcc cggctgtcct acagtcctca 180 ggactctact ccctcagcag cgtggtgacc gtgccctcca gcagcttggg cacgaagacc 240 tacacctgca acgtagatca caagcccagc aacaccaagg tggacaagag agttgagtcc 300 aaatatggtc ccccatgccc accctgccca gcacctgagt tcctgggggg accatcagtc 360 ttcctgttcc ccccaaaacc caaggacact ctcatgatct cccggacccc tgaggtcacg 420 tgcgtggtgg tggacgtgag ccaggaagac cccgaggtcc agttcaactg gtacgtggat 480 ggcgtggagg tgcataatgc caagacaaag ccgcgggagg agcagttcaa cagcacgtac 540 cgtgtggtca gcgtcctcac cgtcctgcac caggactggc tgaacggcaa ggagtacaag 600 tgcaaggtct ccaacaaagg cctcccgtcc tccatcgaga aaaccatctc caaagccaaa 660 gggcagcccc gagagccaca ggtgtacacc ctgcccccat cccaggagga gatgaccaag 720 aaccaggtca gcctgacctg cctggtcaaa ggcttctacc ccagcgacat cgccgtggag 780 tgggagagca atgggcagcc ggagaacaac tacaagacca cgcctcccgt gctggactcc 840 gacggctcct tcttcctcta cagcaggctc accgtggaca agagcaggtg gcaggagggg 900 aatgtcttct catgctccgt gatgcatgag gctctgcaca accactacac acagaagtcc 960 ctctccctgt ctctgggtaa aggaagcggc gaaagcggcg tggataccct gtccggactg 1020 agcagtgagc aaggccagtc cggagatatg acaattgaag aagatagcgc cacccatatt 1080 aaattctcca aaagagatga ggacggcaaa gagctggctg gagcaacaat ggagctgaga 1140 gattcctctg gaaagactat tagtacatgg atctctgatg gccaagtgaa agatttctat 1200 ctgtatccag gaaagtacac atttgtcgaa accgctgcac cagacggata tgaggtggct 1260 acagctatta cctttacagt gaatgagcaa ggacaggtga ctgttaatgg caaagctact 1320 aaaggagacg ctcatattta a 1341 <210> 47 <211> 446 <212> PRT <213> Artificial Sequence <220> <223> Human IgG4 heavy chain - linker - SpyCatcher <400> 47 Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Cys Ser Arg 1 5 10 15 Ser Thr Ser Glu Ser Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr 20 25 30 Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser 35 40 45 Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser 50 55 60 Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Lys Thr 65 70 75 80 Tyr Thr Cys Asn Val Asp His Lys Pro Ser Asn Thr Lys Val Asp Lys 85 90 95 Arg Val Glu Ser Lys Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro 100 105 110 Glu Phe Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys 115 120 125 Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val 130 135 140 Asp Val Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp 145 150 155 160 Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe 165 170 175 Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp 180 185 190 Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu 195 200 205 Pro Ser Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg 210 215 220 Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys 225 230 235 240 Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp 245 250 255 Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys 260 265 270 Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser 275 280 285 Arg Leu Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser 290 295 300 Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser 305 310 315 320 Leu Ser Leu Ser Leu Gly Lys Gly Ser Gly Glu Ser Gly Val Asp Thr 325 330 335 Leu Ser Gly Leu Ser Ser Glu Gln Gly Gln Ser Gly Asp Met Thr Ile 340 345 350 Glu Glu Asp Ser Ala Thr His Ile Lys Phe Ser Lys Arg Asp Glu Asp 355 360 365 Gly Lys Glu Leu Ala Gly Ala Thr Met Glu Leu Arg Asp Ser Ser Gly 370 375 380 Lys Thr Ile Ser Thr Trp Ile Ser Asp Gly Gln Val Lys Asp Phe Tyr 385 390 395 400 Leu Tyr Pro Gly Lys Tyr Thr Phe Val Glu Thr Ala Ala Pro Asp Gly 405 410 415 Tyr Glu Val Ala Thr Ala Ile Thr Phe Thr Val Asn Glu Gln Gly Gln 420 425 430 Val Thr Val Asn Gly Lys Ala Thr Lys Gly Asp Ala His Ile 435 440 445 <210> 48 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> IgG-SpyCatcher Linker <400> 48 ggaagcggcg aaagcggc 18 <210> 49 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> IgG-SpyCatcher Linker <400> 49 Gly Ser Gly Glu Ser Gly 1 5 <210> 50 <211> 981 <212> DNA <213> Artificial Sequence <220> <223> hIgG4 <400> 50 gcctccacca agggcccatc ggtcttcccc ctggcgccct gctccaggag cacctccgag 60 agcacagccg ccctgggctg cctggtcaag gactacttcc ccgaaccggt gacggtgtcg 120 tggaactcag gcgccctgac cagcggcgtg cacaccttcc cggctgtcct acagtcctca 180 ggactctact ccctcagcag cgtggtgacc gtgccctcca gcagcttggg cacgaagacc 240 tacacctgca acgtagatca caagcccagc aacaccaagg tggacaagag agttgagtcc 300 aaatatggtc ccccatgccc accctgccca gcacctgagt tcctgggggg accatcagtc 360 ttcctgttcc ccccaaaacc caaggacact ctcatgatct cccggacccc tgaggtcacg 420 tgcgtggtgg tggacgtgag ccaggaagac cccgaggtcc agttcaactg gtacgtggat 480 ggcgtggagg tgcataatgc caagacaaag ccgcgggagg agcagttcaa cagcacgtac 540 cgtgtggtca gcgtcctcac cgtcctgcac caggactggc tgaacggcaa ggagtacaag 600 tgcaaggtct ccaacaaagg cctcccgtcc tccatcgaga aaaccatctc caaagccaaa 660 gggcagcccc gagagccaca ggtgtacacc ctgcccccat cccaggagga gatgaccaag 720 aaccaggtca gcctgacctg cctggtcaaa ggcttctacc ccagcgacat cgccgtggag 780 tgggagagca atgggcagcc ggagaacaac tacaagacca cgcctcccgt gctggactcc 840 gacggctcct tcttcctcta cagcaggctc accgtggaca agagcaggtg gcaggagggg 900 aatgtcttct catgctccgt gatgcatgag gctctgcaca accactacac acagaagtcc 960 ctctccctgt ctctgggtaa a 981 <210> 51 <211> 327 <212> PRT <213> Artificial Sequence <220> <223> hIgG4 <400> 51 Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Cys Ser Arg 1 5 10 15 Ser Thr Ser Glu Ser Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr 20 25 30 Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser 35 40 45 Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser 50 55 60 Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Lys Thr 65 70 75 80 Tyr Thr Cys Asn Val Asp His Lys Pro Ser Asn Thr Lys Val Asp Lys 85 90 95 Arg Val Glu Ser Lys Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro 100 105 110 Glu Phe Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys 115 120 125 Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val 130 135 140 Asp Val Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp 145 150 155 160 Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe 165 170 175 Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp 180 185 190 Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu 195 200 205 Pro Ser Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg 210 215 220 Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys 225 230 235 240 Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp 245 250 255 Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys 260 265 270 Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser 275 280 285 Arg Leu Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser 290 295 300 Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser 305 310 315 320 Leu Ser Leu Ser Leu Gly Lys 325 <210> 52 <211> 2145 <212> DNA <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 Y730F <400> 52 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aaccctctca gccagattcg 420 tcctcggaca acacggcgcc acccgtgaaa aagtcccgtc tcgaagaagc ccagcccatt 480 caaagtccag acgtttccag cagcactggc ggaggaattg ccgacgtcat gtctggagat 540 gctgaaatgg ctgcagtggg cgggggagca ccgggcgtcg acggccaggg tgccgaggga 600 gtgggtactt cctcgggtaa ttggcattgc gattcccagt ggtcagaagg acacgtcaga 660 accaccagca ccagaacctg ggtgttgccc agctacaaca accacctgta taaacggctt 720 ggaagtagcg cacaatccaa tacctacaac ggattctcca ccccctgggg atacctcgac 780 ttcaatagat ggcactgtca cttcagtcct cggaactggc aacgtctcat caacaacaac 840 tggggcatca gaccaaaaag acttaatgtt aaattgttca acatacaagt caaagaggtc 900 acgacggaag gggggacgac gaccgtcgcc aataacctta ccagcacgat tcaggtgttt 960 gcggacaacg cgtacgaact cccgtatgtt gtcgacgcgg gtcacgaggg ggcattgccg 1020 ccgttcccaa acgacgtgtt tatgattccc caatacggat actgcgggct ggtgtctggt 1080 caaagtcagg ctcagtcgga cttgtgttcg ttttattgcc tggagtattt tccatcccag 1140 atgctgagaa caggaaacaa ttttgaaatg aatttcaggt ttgaagacgt tccatttcac 1200 tccatgtacg cccacagcca gtctctagac aggctcatga atcctttaat tgatcagtat 1260 ctgtggagtc taaaacaaac aggaaacccg actggatcaa caacgagaga cttaaaattt 1320 atcaagaaca aagttcccaa ttttgcacat tatggaaaaa attggcttcc tggacctttt 1380 attagacaac aggggtggac aacacaaaat attaataata gtgttgttaa ttttaatgac 1440 atgctgggaa aaaattcgac atttactttg gacactagat ggagttcatt agcgcctggt 1500 ccgtgtatgg gggatgacgg acgaactcca tccaccacca agttctcaaa tgctcagctc 1560 atgtttggat ctggaacaca acccaccgaa ggcggtgaag atgctgtaca tattacatcc 1620 gagtcggagg tcaaggcaac caacccaact gcaatcgatg aatacggacg agtggccgat 1680 aatacgcaaa atgcaacaac cgccccaacc acagtgggaa atgctgcaat gggggccatg 1740 cctgggatgg tgtggcaaga tagggatatc tatcttcaag gacccatctg gggaaaaata 1800 ccccatacag acggacattt tcatccgtct cctctcatgg gggggtttgg atacagaaaa 1860 ccccctccgc aaatttttat taaaaacacc cccgttcctg gaaatccggc aactacattt 1920 tctccaaata gaataaacaa tttcattact caatactcaa cgggacaagt gaccgttact 1980 attgactggg agctgcaaaa ggaaaactca aagagatgga acccagaagt acaatttaca 2040 tcaaattttg gcacggtcga ttcactaaac tgggcaccgg acaacgcggg aaactacaaa 2100 gaaccaaggg tgattggcac cagattcctg actcgtatac tataa 2145 <210> 53 <211> 714 <212> PRT <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 Y730F <400> 53 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Ser Gln Pro Asp Ser Ser Ser Asp Asn 130 135 140 Thr Ala Pro Pro Val Lys Lys Ser Arg Leu Glu Glu Ala Gln Pro Ile 145 150 155 160 Gln Ser Pro Asp Val Ser Ser Ser Thr Gly Gly Gly Ile Ala Asp Val 165 170 175 Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly Gly Ala Pro Gly 180 185 190 Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser Ser Gly Asn Trp 195 200 205 His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg Thr Thr Ser Thr 210 215 220 Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Leu 225 230 235 240 Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp 245 250 255 Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe Ser Pro Arg Asn 260 265 270 Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Arg Leu 275 280 285 Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Glu Gly 290 295 300 Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe 305 310 315 320 Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp Ala Gly His Glu 325 330 335 Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met Ile Pro Gln Tyr 340 345 350 Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala Gln Ser Asp Leu 355 360 365 Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr 370 375 380 Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp Val Pro Phe His 385 390 395 400 Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu 405 410 415 Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly Asn Pro Thr Gly 420 425 430 Ser Thr Thr Arg Asp Leu Lys Phe Ile Lys Asn Lys Val Pro Asn Phe 435 440 445 Ala His Tyr Gly Lys Asn Trp Leu Pro Gly Pro Phe Ile Arg Gln Gln 450 455 460 Gly Trp Thr Thr Gln Asn Ile Asn Asn Ser Val Val Asn Phe Asn Asp 465 470 475 480 Met Leu Gly Lys Asn Ser Thr Phe Thr Leu Asp Thr Arg Trp Ser Ser 485 490 495 Leu Ala Pro Gly Pro Cys Met Gly Asp Asp Gly Arg Thr Pro Ser Thr 500 505 510 Thr Lys Phe Ser Asn Ala Gln Leu Met Phe Gly Ser Gly Thr Gln Pro 515 520 525 Thr Glu Gly Gly Glu Asp Ala Val His Ile Thr Ser Glu Ser Glu Val 530 535 540 Lys Ala Thr Asn Pro Thr Ala Ile Asp Glu Tyr Gly Arg Val Ala Asp 545 550 555 560 Asn Thr Gln Asn Ala Thr Thr Ala Pro Thr Thr Val Gly Asn Ala Ala 565 570 575 Met Gly Ala Met Pro Gly Met Val Trp Gln Asp Arg Asp Ile Tyr Leu 580 585 590 Gln Gly Pro Ile Trp Gly Lys Ile Pro His Thr Asp Gly His Phe His 595 600 605 Pro Ser Pro Leu Met Gly Gly Phe Gly Tyr Arg Lys Pro Pro Pro Gln 610 615 620 Ile Phe Ile Lys Asn Thr Pro Val Pro Gly Asn Pro Ala Thr Thr Phe 625 630 635 640 Ser Pro Asn Arg Ile Asn Asn Phe Ile Thr Gln Tyr Ser Thr Gly Gln 645 650 655 Val Thr Val Thr Ile Asp Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg 660 665 670 Trp Asn Pro Glu Val Gln Phe Thr Ser Asn Phe Gly Thr Val Asp Ser 675 680 685 Leu Asn Trp Ala Pro Asp Asn Ala Gly Asn Tyr Lys Glu Pro Arg Val 690 695 700 Ile Gly Thr Arg Phe Leu Thr Arg Ile Leu 705 710 <210> 54 <211> 2145 <212> DNA <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 B1 Replaced <400> 54 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aaccctctca gccagattcg 420 tcctcggaca acacggcgcc acccgtgaaa aagtcccgtc tcgaagaagc ccagcccatt 480 caaagtccag acgtttccag cagcactggc ggaggaattg ccgacgtcat gtctggagat 540 gctgaaatgg ctgcagtggg cgggggagca ccgggcgtcg acggccaggg tgccgaggga 600 gtgggtactt cctcgggtaa ttggcattgc gattcccagt ggtcagaagg acacgtcaga 660 accaccagca ccagaacctg ggtgttgccc agctacaaca accacctgta taaacggctt 720 ggaagtagcg cacaatccaa tacctacaac ggattctcca ccccctgggg atacctcgac 780 ttcaatagat ggcactgtca cttcagtcct cggaactggc aacgtctcat caacaacaac 840 tggggcatca gaccaaaaag acttaatgtt aaattgttca acatacaagt caaagaggtc 900 acgacggaag gggggacgac gaccgtcgcc aataacctta ccagcacgat tcaggtgttt 960 gcggacaacg cgtacgaact cccgtatgtt gtcgacgcgg gtcacgaggg ggcattgccg 1020 ccgttcccaa acgacgtgtt tatgattccc caatacggat actgcgggct ggtgtctggt 1080 caaagtcagg ctcagtcgga cttgtgttcg ttttattgcc tggagtattt tccatcccag 1140 atgctgagaa caggaaacaa ttttgaaatg aatttcaggt ttgaagacgt tccatttcac 1200 tccatgtacg cccacagcca gtctctagac aggctcatga atcctttaat tgatcagtat 1260 ctgtggagtc taaaacaaac aggaaacccg actggatcaa caacgagaga cttaaaattt 1320 atcaagaaca aagttcccaa ttttgcacat tatggaaaaa attggcttcc tggacctttt 1380 attagacaac aggggtggac aacacaaaat attaataata gtgttgttaa ttttaatgac 1440 atgctgggaa aaaattcgac atttactttg gacactagat ggagttcatt agcgcctggt 1500 ccgtgtatgg gggatgacgg acgaactcca tccaccacca agttctcaaa tgctcagctc 1560 atgtttggat ctggaacaca acccaccgaa ggcggtgaag atgctgtaca tattacatcc 1620 gagtcggagg tcaaggcaac caacccaact gcaatcgatg aatacggacg agtggccgat 1680 aatacgcaaa atgcaacaac cgccccaacc acagtgggaa atgctgcaat gggggccatg 1740 cctgggatgg tgtggcaaga tagggatatc tatcttcaag gacccatctg gggaaaaata 1800 ccccatacag acggacattt tcatccgtct cctctcatgg gggggtttgg atacagaaaa 1860 ccccctccgc aaatttttat taaaaacacc cccgttcctg gaaatccggc aactacattt 1920 tctccaaata gaataaacaa tttcattact caatactcaa cgggacaagt gaccgttact 1980 attgactggg agctgcaaaa ggaaaactca aagagatgga acccagaagt acaatttaca 2040 tcaaattttg gcacggtcga ttcactaaac tgggcaccgg acaacgcggg aaactacaaa 2100 gaaccaaggg tggtggggtc tcgattcctt acgcatatac tataa 2145 <210> 55 <211> 714 <212> PRT <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 B1 Replaced <400> 55 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Ser Gln Pro Asp Ser Ser Ser Asp Asn 130 135 140 Thr Ala Pro Pro Val Lys Lys Ser Arg Leu Glu Glu Ala Gln Pro Ile 145 150 155 160 Gln Ser Pro Asp Val Ser Ser Ser Thr Gly Gly Gly Ile Ala Asp Val 165 170 175 Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly Gly Ala Pro Gly 180 185 190 Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser Ser Gly Asn Trp 195 200 205 His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg Thr Thr Ser Thr 210 215 220 Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Leu 225 230 235 240 Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp 245 250 255 Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe Ser Pro Arg Asn 260 265 270 Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Arg Leu 275 280 285 Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Glu Gly 290 295 300 Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe 305 310 315 320 Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp Ala Gly His Glu 325 330 335 Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met Ile Pro Gln Tyr 340 345 350 Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala Gln Ser Asp Leu 355 360 365 Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr 370 375 380 Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp Val Pro Phe His 385 390 395 400 Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu 405 410 415 Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly Asn Pro Thr Gly 420 425 430 Ser Thr Thr Arg Asp Leu Lys Phe Ile Lys Asn Lys Val Pro Asn Phe 435 440 445 Ala His Tyr Gly Lys Asn Trp Leu Pro Gly Pro Phe Ile Arg Gln Gln 450 455 460 Gly Trp Thr Thr Gln Asn Ile Asn Asn Ser Val Val Asn Phe Asn Asp 465 470 475 480 Met Leu Gly Lys Asn Ser Thr Phe Thr Leu Asp Thr Arg Trp Ser Ser 485 490 495 Leu Ala Pro Gly Pro Cys Met Gly Asp Asp Gly Arg Thr Pro Ser Thr 500 505 510 Thr Lys Phe Ser Asn Ala Gln Leu Met Phe Gly Ser Gly Thr Gln Pro 515 520 525 Thr Glu Gly Gly Glu Asp Ala Val His Ile Thr Ser Glu Ser Glu Val 530 535 540 Lys Ala Thr Asn Pro Thr Ala Ile Asp Glu Tyr Gly Arg Val Ala Asp 545 550 555 560 Asn Thr Gln Asn Ala Thr Thr Ala Pro Thr Thr Val Gly Asn Ala Ala 565 570 575 Met Gly Ala Met Pro Gly Met Val Trp Gln Asp Arg Asp Ile Tyr Leu 580 585 590 Gln Gly Pro Ile Trp Gly Lys Ile Pro His Thr Asp Gly His Phe His 595 600 605 Pro Ser Pro Leu Met Gly Gly Phe Gly Tyr Arg Lys Pro Pro Pro Gln 610 615 620 Ile Phe Ile Lys Asn Thr Pro Val Pro Gly Asn Pro Ala Thr Thr Phe 625 630 635 640 Ser Pro Asn Arg Ile Asn Asn Phe Ile Thr Gln Tyr Ser Thr Gly Gln 645 650 655 Val Thr Val Thr Ile Asp Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg 660 665 670 Trp Asn Pro Glu Val Gln Phe Thr Ser Asn Phe Gly Thr Val Asp Ser 675 680 685 Leu Asn Trp Ala Pro Asp Asn Ala Gly Asn Tyr Lys Glu Pro Arg Val 690 695 700 Val Gly Ser Arg Phe Leu Thr His Ile Leu 705 710 <210> 56 <211> 2145 <212> DNA <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 v2 <400> 56 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggacggcgcc acccgtgaaa aagtcccgtc tcgaagaagc ccagcccatt 480 caaagtccag acgtttccag cagcactggc ggaggaattg ccgacgtcat gtctggagat 540 gctgaaatgg ctgcagtggg cgggggagca ccgggcgtcg acggccaggg tgccgaggga 600 gtgggtactt cctcgggtaa ttggcattgc gattcccagt ggtcagaagg acacgtcaga 660 accaccagca ccagaacctg ggtgttgccc agctacaaca accacctgta taaacggctt 720 ggaagtagcg cacaatccaa tacctacaac ggattctcca ccccctgggg atacctcgac 780 ttcaatagat ggcactgtca cttcagtcct cggaactggc aacgtctcat caacaacaac 840 tggggcatca gaccaaaaag acttaatgtt aaattgttca acatacaagt caaagaggtc 900 acgacggaag gggggacgac gaccgtcgcc aataacctta ccagcacgat tcaggtgttt 960 gcggacaacg cgtacgaact cccgtatgtt gtcgacgcgg gtcacgaggg ggcattgccg 1020 ccgttcccaa acgacgtgtt tatgattccc caatacggat actgcgggct ggtgtctggt 1080 caaagtcagg ctcagtcgga cttgtgttcg ttttattgcc tggagtattt tccatcccag 1140 atgctgagaa caggaaacaa ttttgaaatg aatttcaggt ttgaagacgt tccatttcac 1200 tccatgtacg cccacagcca gtctctagac aggctcatga atcctttaat tgatcagtat 1260 ctgtggagtc taaaacaaac aggaaacccg actggatcaa caacgagaga cttaaaattt 1320 atcaagaaca aagttcccaa ttttgcacat tatggaaaaa attggcttcc tggacctttt 1380 attagacaac aggggtggac aacacaaaat attaataata gtgttgttaa ttttaatgac 1440 atgctgggaa aaaattcgac atttactttg gacactagat ggagttcatt agcgcctggt 1500 ccgtgtatgg gggatgacgg acgaactcca tccaccacca agttctcaaa tgctcagctc 1560 atgtttggat ctggaacaca acccaccgaa ggcggtgaag atgctgtaca tattacatcc 1620 gagtcggagg tcaaggcaac caacccaact gcaatcgatg aatacggacg agtggccgat 1680 aatacgcaaa atgcaacaac cgccccaacc acagtgggaa atgctgcaat gggggccatg 1740 cctgggatgg tgtggcaaga tagggatatc tatcttcaag gacccatctg gggaaaaata 1800 ccccatacag acggacattt tcatccgtct cctctcatgg gggggtttgg atacagaaaa 1860 ccccctccgc aaatttttat taaaaacacc cccgttcctg gaaatccggc aactacattt 1920 tctccaaata gaataaacaa tttcattact caatactcaa cgggacaagt gaccgttact 1980 attgactggg agctgcaaaa ggaaaactca aagagatgga acccagaagt acaatttaca 2040 tcaaattttg gcacggtcga ttcactaaac tgggcaccgg acaacgcggg aaactacaaa 2100 gaaccaaggg tgattggcac cagatacctg actcgtatac tataa 2145 <210> 57 <211> 714 <212> PRT <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 v2 <400> 57 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Thr Ala Pro Pro Val Lys Lys Ser Arg Leu Glu Glu Ala Gln Pro Ile 145 150 155 160 Gln Ser Pro Asp Val Ser Ser Ser Thr Gly Gly Gly Ile Ala Asp Val 165 170 175 Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly Gly Ala Pro Gly 180 185 190 Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser Ser Gly Asn Trp 195 200 205 His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg Thr Thr Ser Thr 210 215 220 Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Leu 225 230 235 240 Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp 245 250 255 Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe Ser Pro Arg Asn 260 265 270 Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Arg Leu 275 280 285 Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Glu Gly 290 295 300 Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe 305 310 315 320 Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp Ala Gly His Glu 325 330 335 Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met Ile Pro Gln Tyr 340 345 350 Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala Gln Ser Asp Leu 355 360 365 Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr 370 375 380 Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp Val Pro Phe His 385 390 395 400 Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu 405 410 415 Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly Asn Pro Thr Gly 420 425 430 Ser Thr Thr Arg Asp Leu Lys Phe Ile Lys Asn Lys Val Pro Asn Phe 435 440 445 Ala His Tyr Gly Lys Asn Trp Leu Pro Gly Pro Phe Ile Arg Gln Gln 450 455 460 Gly Trp Thr Thr Gln Asn Ile Asn Asn Ser Val Val Asn Phe Asn Asp 465 470 475 480 Met Leu Gly Lys Asn Ser Thr Phe Thr Leu Asp Thr Arg Trp Ser Ser 485 490 495 Leu Ala Pro Gly Pro Cys Met Gly Asp Asp Gly Arg Thr Pro Ser Thr 500 505 510 Thr Lys Phe Ser Asn Ala Gln Leu Met Phe Gly Ser Gly Thr Gln Pro 515 520 525 Thr Glu Gly Gly Glu Asp Ala Val His Ile Thr Ser Glu Ser Glu Val 530 535 540 Lys Ala Thr Asn Pro Thr Ala Ile Asp Glu Tyr Gly Arg Val Ala Asp 545 550 555 560 Asn Thr Gln Asn Ala Thr Thr Ala Pro Thr Thr Val Gly Asn Ala Ala 565 570 575 Met Gly Ala Met Pro Gly Met Val Trp Gln Asp Arg Asp Ile Tyr Leu 580 585 590 Gln Gly Pro Ile Trp Gly Lys Ile Pro His Thr Asp Gly His Phe His 595 600 605 Pro Ser Pro Leu Met Gly Gly Phe Gly Tyr Arg Lys Pro Pro Pro Gln 610 615 620 Ile Phe Ile Lys Asn Thr Pro Val Pro Gly Asn Pro Ala Thr Thr Phe 625 630 635 640 Ser Pro Asn Arg Ile Asn Asn Phe Ile Thr Gln Tyr Ser Thr Gly Gln 645 650 655 Val Thr Val Thr Ile Asp Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg 660 665 670 Trp Asn Pro Glu Val Gln Phe Thr Ser Asn Phe Gly Thr Val Asp Ser 675 680 685 Leu Asn Trp Ala Pro Asp Asn Ala Gly Asn Tyr Lys Glu Pro Arg Val 690 695 700 Ile Gly Thr Arg Tyr Leu Thr Arg Ile Leu 705 710 <210> 58 <211> 2145 <212> DNA <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 v3 <400> 58 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactat gtctggagat 540 gctgaaatgg ctgcagtggg cgggggagca ccgggcgtcg acggccaggg tgccgaggga 600 gtgggtactt cctcgggtaa ttggcattgc gattcccagt ggtcagaagg acacgtcaga 660 accaccagca ccagaacctg ggtgttgccc agctacaaca accacctgta taaacggctt 720 ggaagtagcg cacaatccaa tacctacaac ggattctcca ccccctgggg atacctcgac 780 ttcaatagat ggcactgtca cttcagtcct cggaactggc aacgtctcat caacaacaac 840 tggggcatca gaccaaaaag acttaatgtt aaattgttca acatacaagt caaagaggtc 900 acgacggaag gggggacgac gaccgtcgcc aataacctta ccagcacgat tcaggtgttt 960 gcggacaacg cgtacgaact cccgtatgtt gtcgacgcgg gtcacgaggg ggcattgccg 1020 ccgttcccaa acgacgtgtt tatgattccc caatacggat actgcgggct ggtgtctggt 1080 caaagtcagg ctcagtcgga cttgtgttcg ttttattgcc tggagtattt tccatcccag 1140 atgctgagaa caggaaacaa ttttgaaatg aatttcaggt ttgaagacgt tccatttcac 1200 tccatgtacg cccacagcca gtctctagac aggctcatga atcctttaat tgatcagtat 1260 ctgtggagtc taaaacaaac aggaaacccg actggatcaa caacgagaga cttaaaattt 1320 atcaagaaca aagttcccaa ttttgcacat tatggaaaaa attggcttcc tggacctttt 1380 attagacaac aggggtggac aacacaaaat attaataata gtgttgttaa ttttaatgac 1440 atgctgggaa aaaattcgac atttactttg gacactagat ggagttcatt agcgcctggt 1500 ccgtgtatgg gggatgacgg acgaactcca tccaccacca agttctcaaa tgctcagctc 1560 atgtttggat ctggaacaca acccaccgaa ggcggtgaag atgctgtaca tattacatcc 1620 gagtcggagg tcaaggcaac caacccaact gcaatcgatg aatacggacg agtggccgat 1680 aatacgcaaa atgcaacaac cgccccaacc acagtgggaa atgctgcaat gggggccatg 1740 cctgggatgg tgtggcaaga tagggatatc tatcttcaag gacccatctg gggaaaaata 1800 ccccatacag acggacattt tcatccgtct cctctcatgg gggggtttgg atacagaaaa 1860 ccccctccgc aaatttttat taaaaacacc cccgttcctg gaaatccggc aactacattt 1920 tctccaaata gaataaacaa tttcattact caatactcaa cgggacaagt gaccgttact 1980 attgactggg agctgcaaaa ggaaaactca aagagatgga acccagaagt acaatttaca 2040 tcaaattttg gcacggtcga ttcactaaac tgggcaccgg acaacgcggg aaactacaaa 2100 gaaccaaggg tgattggcac cagatacctg actcgtatac tataa 2145 <210> 59 <211> 714 <212> PRT <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 v3 <400> 59 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly Gly Ala Pro Gly 180 185 190 Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser Ser Gly Asn Trp 195 200 205 His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg Thr Thr Ser Thr 210 215 220 Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Leu 225 230 235 240 Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp 245 250 255 Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe Ser Pro Arg Asn 260 265 270 Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Arg Leu 275 280 285 Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Glu Gly 290 295 300 Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe 305 310 315 320 Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp Ala Gly His Glu 325 330 335 Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met Ile Pro Gln Tyr 340 345 350 Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala Gln Ser Asp Leu 355 360 365 Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr 370 375 380 Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp Val Pro Phe His 385 390 395 400 Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu 405 410 415 Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly Asn Pro Thr Gly 420 425 430 Ser Thr Thr Arg Asp Leu Lys Phe Ile Lys Asn Lys Val Pro Asn Phe 435 440 445 Ala His Tyr Gly Lys Asn Trp Leu Pro Gly Pro Phe Ile Arg Gln Gln 450 455 460 Gly Trp Thr Thr Gln Asn Ile Asn Asn Ser Val Val Asn Phe Asn Asp 465 470 475 480 Met Leu Gly Lys Asn Ser Thr Phe Thr Leu Asp Thr Arg Trp Ser Ser 485 490 495 Leu Ala Pro Gly Pro Cys Met Gly Asp Asp Gly Arg Thr Pro Ser Thr 500 505 510 Thr Lys Phe Ser Asn Ala Gln Leu Met Phe Gly Ser Gly Thr Gln Pro 515 520 525 Thr Glu Gly Gly Glu Asp Ala Val His Ile Thr Ser Glu Ser Glu Val 530 535 540 Lys Ala Thr Asn Pro Thr Ala Ile Asp Glu Tyr Gly Arg Val Ala Asp 545 550 555 560 Asn Thr Gln Asn Ala Thr Thr Ala Pro Thr Thr Val Gly Asn Ala Ala 565 570 575 Met Gly Ala Met Pro Gly Met Val Trp Gln Asp Arg Asp Ile Tyr Leu 580 585 590 Gln Gly Pro Ile Trp Gly Lys Ile Pro His Thr Asp Gly His Phe His 595 600 605 Pro Ser Pro Leu Met Gly Gly Phe Gly Tyr Arg Lys Pro Pro Pro Gln 610 615 620 Ile Phe Ile Lys Asn Thr Pro Val Pro Gly Asn Pro Ala Thr Thr Phe 625 630 635 640 Ser Pro Asn Arg Ile Asn Asn Phe Ile Thr Gln Tyr Ser Thr Gly Gln 645 650 655 Val Thr Val Thr Ile Asp Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg 660 665 670 Trp Asn Pro Glu Val Gln Phe Thr Ser Asn Phe Gly Thr Val Asp Ser 675 680 685 Leu Asn Trp Ala Pro Asp Asn Ala Gly Asn Tyr Lys Glu Pro Arg Val 690 695 700 Ile Gly Thr Arg Tyr Leu Thr Arg Ile Leu 705 710 <210> 60 <211> 2145 <212> DNA <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 v4 <400> 60 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaactggc ggaggaattg ccgacgtcat gtctggagat 540 gctgaaatgg ctgcagtggg cgggggagca ccgggcgtcg acggccaggg tgccgaggga 600 gtgggtactt cctcgggtaa ttggcattgc gattcccagt ggtcagaagg acacgtcaga 660 accaccagca ccagaacctg ggtgttgccc agctacaaca accacctgta taaacggctt 720 ggaagtagcg cacaatccaa tacctacaac ggattctcca ccccctgggg atacctcgac 780 ttcaatagat ggcactgtca cttcagtcct cggaactggc aacgtctcat caacaacaac 840 tggggcatca gaccaaaaag acttaatgtt aaattgttca acatacaagt caaagaggtc 900 acgacggaag gggggacgac gaccgtcgcc aataacctta ccagcacgat tcaggtgttt 960 gcggacaacg cgtacgaact cccgtatgtt gtcgacgcgg gtcacgaggg ggcattgccg 1020 ccgttcccaa acgacgtgtt tatgattccc caatacggat actgcgggct ggtgtctggt 1080 caaagtcagg ctcagtcgga cttgtgttcg ttttattgcc tggagtattt tccatcccag 1140 atgctgagaa caggaaacaa ttttgaaatg aatttcaggt ttgaagacgt tccatttcac 1200 tccatgtacg cccacagcca gtctctagac aggctcatga atcctttaat tgatcagtat 1260 ctgtggagtc taaaacaaac aggaaacccg actggatcaa caacgagaga cttaaaattt 1320 atcaagaaca aagttcccaa ttttgcacat tatggaaaaa attggcttcc tggacctttt 1380 attagacaac aggggtggac aacacaaaat attaataata gtgttgttaa ttttaatgac 1440 atgctgggaa aaaattcgac atttactttg gacactagat ggagttcatt agcgcctggt 1500 ccgtgtatgg gggatgacgg acgaactcca tccaccacca agttctcaaa tgctcagctc 1560 atgtttggat ctggaacaca acccaccgaa ggcggtgaag atgctgtaca tattacatcc 1620 gagtcggagg tcaaggcaac caacccaact gcaatcgatg aatacggacg agtggccgat 1680 aatacgcaaa atgcaacaac cgccccaacc acagtgggaa atgctgcaat gggggccatg 1740 cctgggatgg tgtggcaaga tagggatatc tatcttcaag gacccatctg gggaaaaata 1800 ccccatacag acggacattt tcatccgtct cctctcatgg gggggtttgg atacagaaaa 1860 ccccctccgc aaatttttat taaaaacacc cccgttcctg gaaatccggc aactacattt 1920 tctccaaata gaataaacaa tttcattact caatactcaa cgggacaagt gaccgttact 1980 attgactggg agctgcaaaa ggaaaactca aagagatgga acccagaagt acaatttaca 2040 tcaaattttg gcacggtcga ttcactaaac tgggcaccgg acaacgcggg aaactacaaa 2100 gaaccaaggg tgattggcac cagatacctg actcgtatac tataa 2145 <210> 61 <211> 714 <212> PRT <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 v4 <400> 61 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Thr Gly Gly Gly Ile Ala Asp Val 165 170 175 Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly Gly Ala Pro Gly 180 185 190 Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser Ser Gly Asn Trp 195 200 205 His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg Thr Thr Ser Thr 210 215 220 Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Leu 225 230 235 240 Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp 245 250 255 Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe Ser Pro Arg Asn 260 265 270 Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Arg Leu 275 280 285 Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Glu Gly 290 295 300 Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe 305 310 315 320 Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp Ala Gly His Glu 325 330 335 Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met Ile Pro Gln Tyr 340 345 350 Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala Gln Ser Asp Leu 355 360 365 Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr 370 375 380 Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp Val Pro Phe His 385 390 395 400 Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu 405 410 415 Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly Asn Pro Thr Gly 420 425 430 Ser Thr Thr Arg Asp Leu Lys Phe Ile Lys Asn Lys Val Pro Asn Phe 435 440 445 Ala His Tyr Gly Lys Asn Trp Leu Pro Gly Pro Phe Ile Arg Gln Gln 450 455 460 Gly Trp Thr Thr Gln Asn Ile Asn Asn Ser Val Val Asn Phe Asn Asp 465 470 475 480 Met Leu Gly Lys Asn Ser Thr Phe Thr Leu Asp Thr Arg Trp Ser Ser 485 490 495 Leu Ala Pro Gly Pro Cys Met Gly Asp Asp Gly Arg Thr Pro Ser Thr 500 505 510 Thr Lys Phe Ser Asn Ala Gln Leu Met Phe Gly Ser Gly Thr Gln Pro 515 520 525 Thr Glu Gly Gly Glu Asp Ala Val His Ile Thr Ser Glu Ser Glu Val 530 535 540 Lys Ala Thr Asn Pro Thr Ala Ile Asp Glu Tyr Gly Arg Val Ala Asp 545 550 555 560 Asn Thr Gln Asn Ala Thr Thr Ala Pro Thr Thr Val Gly Asn Ala Ala 565 570 575 Met Gly Ala Met Pro Gly Met Val Trp Gln Asp Arg Asp Ile Tyr Leu 580 585 590 Gln Gly Pro Ile Trp Gly Lys Ile Pro His Thr Asp Gly His Phe His 595 600 605 Pro Ser Pro Leu Met Gly Gly Phe Gly Tyr Arg Lys Pro Pro Pro Gln 610 615 620 Ile Phe Ile Lys Asn Thr Pro Val Pro Gly Asn Pro Ala Thr Thr Phe 625 630 635 640 Ser Pro Asn Arg Ile Asn Asn Phe Ile Thr Gln Tyr Ser Thr Gly Gln 645 650 655 Val Thr Val Thr Ile Asp Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg 660 665 670 Trp Asn Pro Glu Val Gln Phe Thr Ser Asn Phe Gly Thr Val Asp Ser 675 680 685 Leu Asn Trp Ala Pro Asp Asn Ala Gly Asn Tyr Lys Glu Pro Arg Val 690 695 700 Ile Gly Thr Arg Tyr Leu Thr Arg Ile Leu 705 710 <210> 62 <211> 2157 <212> DNA <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 v5 <400> 62 atgtcttctt tgtttaaaga gtacctgcag agtaccggac tggtgggtat ccagtcggga 60 gcgccgaagc caaaggccgg ccagcagaag caggatacag ggtcctttga gtggaaaaag 120 aaggaggaca cagccagagg gctggtcctt cccggttaca agtacctcgg gcccttcaac 180 ggtctagagc ggggcgagcc tgtgaatgcc gcggacgccg cggcccagcg acacgaccga 240 cagtacgatc gtattctaca acaagggggt aatccatacc tcacgtacaa ccacgccgac 300 cgagagttcc aggaggagct ccagtctgac gagtcttttg ggggaaatct tggcaaggct 360 gtgtttcagg ccaagaagcg aatcctagag cccctcggtc tggttgaaga ggatccctct 420 cagccagatt cgtcctcgga caacacggcg ccacccgtga aaaagtcccg tctcgaagaa 480 gcccagccca ttcaaagtcc agacgtttcc agcagcactg gcggaggaat tgccgacgtc 540 atgtctggag atgctgaaat ggctgcagtg ggcgggggag caccgggcgt cgacggccag 600 ggtgccgagg gagtgggtac ttcctcgggt aattggcatt gcgattccca gtggtcagaa 660 ggacacgtca gaaccaccag caccagaacc tgggtgttgc ccagctacaa caaccacctg 720 tataaacggc ttggaagtag cgcacaatcc aatacctaca acggattctc caccccctgg 780 ggatacctcg acttcaatag atggcactgt cacttcagtc ctcggaactg gcaacgtctc 840 atcaacaaca actggggcat cagaccaaaa agacttaatg ttaaattgtt caacatacaa 900 gtcaaagagg tcacgacgga aggggggacg acgaccgtcg ccaataacct taccagcacg 960 attcaggtgt ttgcggacaa cgcgtacgaa ctcccgtatg ttgtcgacgc gggtcacgag 1020 ggggcattgc cgccgttccc aaacgacgtg tttatgattc cccaatacgg atactgcggg 1080 ctggtgtctg gtcaaagtca ggctcagtcg gacttgtgtt cgttttattg cctggagtat 1140 tttccatccc agatgctgag aacaggaaac aattttgaaa tgaatttcag gtttgaagac 1200 gttccatttc actccatgta cgcccacagc cagtctctag acaggctcat gaatccttta 1260 attgatcagt atctgtggag tctaaaacaa acaggaaacc cgactggatc aacaacgaga 1320 gacttaaaat ttatcaagaa caaagttccc aattttgcac attatggaaa aaattggctt 1380 cctggacctt ttattagaca acaggggtgg acaacacaaa atattaataa tagtgttgtt 1440 aattttaatg acatgctggg aaaaaattcg acatttactt tggacactag atggagttca 1500 ttagcgcctg gtccgtgtat gggggatgac ggacgaactc catccaccac caagttctca 1560 aatgctcagc tcatgtttgg atctggaaca caacccaccg aaggcggtga agatgctgta 1620 catattacat ccgagtcgga ggtcaaggca accaacccaa ctgcaatcga tgaatacgga 1680 cgagtggccg ataatacgca aaatgcaaca accgccccaa ccacagtggg aaatgctgca 1740 atgggggcca tgcctgggat ggtgtggcaa gatagggata tctatcttca aggacccatc 1800 tggggaaaaa taccccatac agacggacat tttcatccgt ctcctctcat gggggggttt 1860 ggatacagaa aaccccctcc gcaaattttt attaaaaaca cccccgttcc tggaaatccg 1920 gcaactacat tttctccaaa tagaataaac aatttcatta ctcaatactc aacgggacaa 1980 gtgaccgtta ctattgactg ggagctgcaa aaggaaaact caaagagatg gaacccagaa 2040 gtacaattta catcaaattt tggcacggtc gattcactaa actgggcacc ggacaacgcg 2100 ggaaactaca aagaaccaag ggtgattggc accagatacc tgactcgtat actataa 2157 <210> 63 <211> 718 <212> PRT <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 v5 <400> 63 Met Ser Ser Leu Phe Lys Glu Tyr Leu Gln Ser Thr Gly Leu Val Gly 1 5 10 15 Ile Gln Ser Gly Ala Pro Lys Pro Lys Ala Gly Gln Gln Lys Gln Asp 20 25 30 Thr Gly Ser Phe Glu Trp Lys Lys Lys Glu Asp Thr Ala Arg Gly Leu 35 40 45 Val Leu Pro Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Glu Arg 50 55 60 Gly Glu Pro Val Asn Ala Ala Asp Ala Ala Ala Gln Arg His Asp Arg 65 70 75 80 Gln Tyr Asp Arg Ile Leu Gln Gln Gly Gly Asn Pro Tyr Leu Thr Tyr 85 90 95 Asn His Ala Asp Arg Glu Phe Gln Glu Glu Leu Gln Ser Asp Glu Ser 100 105 110 Phe Gly Gly Asn Leu Gly Lys Ala Val Phe Gln Ala Lys Lys Arg Ile 115 120 125 Leu Glu Pro Leu Gly Leu Val Glu Glu Asp Pro Ser Gln Pro Asp Ser 130 135 140 Ser Ser Asp Asn Thr Ala Pro Pro Val Lys Lys Ser Arg Leu Glu Glu 145 150 155 160 Ala Gln Pro Ile Gln Ser Pro Asp Val Ser Ser Ser Thr Gly Gly Gly 165 170 175 Ile Ala Asp Val Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly 180 185 190 Gly Ala Pro Gly Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser 195 200 205 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg 210 215 220 Thr Thr Ser Thr Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu 225 230 235 240 Tyr Lys Arg Leu Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe 245 250 255 Ser Thr Pro Trp Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe 260 265 270 Ser Pro Arg Asn Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg 275 280 285 Pro Lys Arg Leu Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val 290 295 300 Thr Thr Glu Gly Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr 305 310 315 320 Ile Gln Val Phe Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp 325 330 335 Ala Gly His Glu Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met 340 345 350 Ile Pro Gln Tyr Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala 355 360 365 Gln Ser Asp Leu Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln 370 375 380 Met Leu Arg Thr Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp 385 390 395 400 Val Pro Phe His Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu 405 410 415 Met Asn Pro Leu Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly 420 425 430 Asn Pro Thr Gly Ser Thr Thr Arg Asp Leu Lys Phe Ile Lys Asn Lys 435 440 445 Val Pro Asn Phe Ala His Tyr Gly Lys Asn Trp Leu Pro Gly Pro Phe 450 455 460 Ile Arg Gln Gln Gly Trp Thr Thr Gln Asn Ile Asn Asn Ser Val Val 465 470 475 480 Asn Phe Asn Asp Met Leu Gly Lys Asn Ser Thr Phe Thr Leu Asp Thr 485 490 495 Arg Trp Ser Ser Leu Ala Pro Gly Pro Cys Met Gly Asp Asp Gly Arg 500 505 510 Thr Pro Ser Thr Thr Lys Phe Ser Asn Ala Gln Leu Met Phe Gly Ser 515 520 525 Gly Thr Gln Pro Thr Glu Gly Gly Glu Asp Ala Val His Ile Thr Ser 530 535 540 Glu Ser Glu Val Lys Ala Thr Asn Pro Thr Ala Ile Asp Glu Tyr Gly 545 550 555 560 Arg Val Ala Asp Asn Thr Gln Asn Ala Thr Thr Ala Pro Thr Thr Val 565 570 575 Gly Asn Ala Ala Met Gly Ala Met Pro Gly Met Val Trp Gln Asp Arg 580 585 590 Asp Ile Tyr Leu Gln Gly Pro Ile Trp Gly Lys Ile Pro His Thr Asp 595 600 605 Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Tyr Arg Lys 610 615 620 Pro Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro Val Pro Gly Asn Pro 625 630 635 640 Ala Thr Thr Phe Ser Pro Asn Arg Ile Asn Asn Phe Ile Thr Gln Tyr 645 650 655 Ser Thr Gly Gln Val Thr Val Thr Ile Asp Trp Glu Leu Gln Lys Glu 660 665 670 Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Phe Thr Ser Asn Phe Gly 675 680 685 Thr Val Asp Ser Leu Asn Trp Ala Pro Asp Asn Ala Gly Asn Tyr Lys 690 695 700 Glu Pro Arg Val Ile Gly Thr Arg Tyr Leu Thr Arg Ile Leu 705 710 715 <210> 64 <211> 2145 <212> DNA <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 v2 B1 Replaced <400> 64 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggacggcgcc acccgtgaaa aagtcccgtc tcgaagaagc ccagcccatt 480 caaagtccag acgtttccag cagcactggc ggaggaattg ccgacgtcat gtctggagat 540 gctgaaatgg ctgcagtggg cgggggagca ccgggcgtcg acggccaggg tgccgaggga 600 gtgggtactt cctcgggtaa ttggcattgc gattcccagt ggtcagaagg acacgtcaga 660 accaccagca ccagaacctg ggtgttgccc agctacaaca accacctgta taaacggctt 720 ggaagtagcg cacaatccaa tacctacaac ggattctcca ccccctgggg atacctcgac 780 ttcaatagat ggcactgtca cttcagtcct cggaactggc aacgtctcat caacaacaac 840 tggggcatca gaccaaaaag acttaatgtt aaattgttca acatacaagt caaagaggtc 900 acgacggaag gggggacgac gaccgtcgcc aataacctta ccagcacgat tcaggtgttt 960 gcggacaacg cgtacgaact cccgtatgtt gtcgacgcgg gtcacgaggg ggcattgccg 1020 ccgttcccaa acgacgtgtt tatgattccc caatacggat actgcgggct ggtgtctggt 1080 caaagtcagg ctcagtcgga cttgtgttcg ttttattgcc tggagtattt tccatcccag 1140 atgctgagaa caggaaacaa ttttgaaatg aatttcaggt ttgaagacgt tccatttcac 1200 tccatgtacg cccacagcca gtctctagac aggctcatga atcctttaat tgatcagtat 1260 ctgtggagtc taaaacaaac aggaaacccg actggatcaa caacgagaga cttaaaattt 1320 atcaagaaca aagttcccaa ttttgcacat tatggaaaaa attggcttcc tggacctttt 1380 attagacaac aggggtggac aacacaaaat attaataata gtgttgttaa ttttaatgac 1440 atgctgggaa aaaattcgac atttactttg gacactagat ggagttcatt agcgcctggt 1500 ccgtgtatgg gggatgacgg acgaactcca tccaccacca agttctcaaa tgctcagctc 1560 atgtttggat ctggaacaca acccaccgaa ggcggtgaag atgctgtaca tattacatcc 1620 gagtcggagg tcaaggcaac caacccaact gcaatcgatg aatacggacg agtggccgat 1680 aatacgcaaa atgcaacaac cgccccaacc acagtgggaa atgctgcaat gggggccatg 1740 cctgggatgg tgtggcaaga tagggatatc tatcttcaag gacccatctg gggaaaaata 1800 ccccatacag acggacattt tcatccgtct cctctcatgg gggggtttgg atacagaaaa 1860 ccccctccgc aaatttttat taaaaacacc cccgttcctg gaaatccggc aactacattt 1920 tctccaaata gaataaacaa tttcattact caatactcaa cgggacaagt gaccgttact 1980 attgactggg agctgcaaaa ggaaaactca aagagatgga acccagaagt acaatttaca 2040 tcaaattttg gcacggtcga ttcactaaac tgggcaccgg acaacgcggg aaactacaaa 2100 gaaccaaggg tggtggggtc tcgattcctt acgcatatac tataa 2145 <210> 65 <211> 714 <212> PRT <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 v2 B1 Replaced <400> 65 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Thr Ala Pro Pro Val Lys Lys Ser Arg Leu Glu Glu Ala Gln Pro Ile 145 150 155 160 Gln Ser Pro Asp Val Ser Ser Ser Thr Gly Gly Gly Ile Ala Asp Val 165 170 175 Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly Gly Ala Pro Gly 180 185 190 Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser Ser Gly Asn Trp 195 200 205 His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg Thr Thr Ser Thr 210 215 220 Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Leu 225 230 235 240 Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp 245 250 255 Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe Ser Pro Arg Asn 260 265 270 Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Arg Leu 275 280 285 Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Glu Gly 290 295 300 Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe 305 310 315 320 Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp Ala Gly His Glu 325 330 335 Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met Ile Pro Gln Tyr 340 345 350 Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala Gln Ser Asp Leu 355 360 365 Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr 370 375 380 Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp Val Pro Phe His 385 390 395 400 Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu 405 410 415 Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly Asn Pro Thr Gly 420 425 430 Ser Thr Thr Arg Asp Leu Lys Phe Ile Lys Asn Lys Val Pro Asn Phe 435 440 445 Ala His Tyr Gly Lys Asn Trp Leu Pro Gly Pro Phe Ile Arg Gln Gln 450 455 460 Gly Trp Thr Thr Gln Asn Ile Asn Asn Ser Val Val Asn Phe Asn Asp 465 470 475 480 Met Leu Gly Lys Asn Ser Thr Phe Thr Leu Asp Thr Arg Trp Ser Ser 485 490 495 Leu Ala Pro Gly Pro Cys Met Gly Asp Asp Gly Arg Thr Pro Ser Thr 500 505 510 Thr Lys Phe Ser Asn Ala Gln Leu Met Phe Gly Ser Gly Thr Gln Pro 515 520 525 Thr Glu Gly Gly Glu Asp Ala Val His Ile Thr Ser Glu Ser Glu Val 530 535 540 Lys Ala Thr Asn Pro Thr Ala Ile Asp Glu Tyr Gly Arg Val Ala Asp 545 550 555 560 Asn Thr Gln Asn Ala Thr Thr Ala Pro Thr Thr Val Gly Asn Ala Ala 565 570 575 Met Gly Ala Met Pro Gly Met Val Trp Gln Asp Arg Asp Ile Tyr Leu 580 585 590 Gln Gly Pro Ile Trp Gly Lys Ile Pro His Thr Asp Gly His Phe His 595 600 605 Pro Ser Pro Leu Met Gly Gly Phe Gly Tyr Arg Lys Pro Pro Pro Gln 610 615 620 Ile Phe Ile Lys Asn Thr Pro Val Pro Gly Asn Pro Ala Thr Thr Phe 625 630 635 640 Ser Pro Asn Arg Ile Asn Asn Phe Ile Thr Gln Tyr Ser Thr Gly Gln 645 650 655 Val Thr Val Thr Ile Asp Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg 660 665 670 Trp Asn Pro Glu Val Gln Phe Thr Ser Asn Phe Gly Thr Val Asp Ser 675 680 685 Leu Asn Trp Ala Pro Asp Asn Ala Gly Asn Tyr Lys Glu Pro Arg Val 690 695 700 Val Gly Ser Arg Phe Leu Thr His Ile Leu 705 710 <210> 66 <211> 2145 <212> DNA <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 v3 B1 Replaced <400> 66 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactat gtctggagat 540 gctgaaatgg ctgcagtggg cgggggagca ccgggcgtcg acggccaggg tgccgaggga 600 gtgggtactt cctcgggtaa ttggcattgc gattcccagt ggtcagaagg acacgtcaga 660 accaccagca ccagaacctg ggtgttgccc agctacaaca accacctgta taaacggctt 720 ggaagtagcg cacaatccaa tacctacaac ggattctcca ccccctgggg atacctcgac 780 ttcaatagat ggcactgtca cttcagtcct cggaactggc aacgtctcat caacaacaac 840 tggggcatca gaccaaaaag acttaatgtt aaattgttca acatacaagt caaagaggtc 900 acgacggaag gggggacgac gaccgtcgcc aataacctta ccagcacgat tcaggtgttt 960 gcggacaacg cgtacgaact cccgtatgtt gtcgacgcgg gtcacgaggg ggcattgccg 1020 ccgttcccaa acgacgtgtt tatgattccc caatacggat actgcgggct ggtgtctggt 1080 caaagtcagg ctcagtcgga cttgtgttcg ttttattgcc tggagtattt tccatcccag 1140 atgctgagaa caggaaacaa ttttgaaatg aatttcaggt ttgaagacgt tccatttcac 1200 tccatgtacg cccacagcca gtctctagac aggctcatga atcctttaat tgatcagtat 1260 ctgtggagtc taaaacaaac aggaaacccg actggatcaa caacgagaga cttaaaattt 1320 atcaagaaca aagttcccaa ttttgcacat tatggaaaaa attggcttcc tggacctttt 1380 attagacaac aggggtggac aacacaaaat attaataata gtgttgttaa ttttaatgac 1440 atgctgggaa aaaattcgac atttactttg gacactagat ggagttcatt agcgcctggt 1500 ccgtgtatgg gggatgacgg acgaactcca tccaccacca agttctcaaa tgctcagctc 1560 atgtttggat ctggaacaca acccaccgaa ggcggtgaag atgctgtaca tattacatcc 1620 gagtcggagg tcaaggcaac caacccaact gcaatcgatg aatacggacg agtggccgat 1680 aatacgcaaa atgcaacaac cgccccaacc acagtgggaa atgctgcaat gggggccatg 1740 cctgggatgg tgtggcaaga tagggatatc tatcttcaag gacccatctg gggaaaaata 1800 ccccatacag acggacattt tcatccgtct cctctcatgg gggggtttgg atacagaaaa 1860 ccccctccgc aaatttttat taaaaacacc cccgttcctg gaaatccggc aactacattt 1920 tctccaaata gaataaacaa tttcattact caatactcaa cgggacaagt gaccgttact 1980 attgactggg agctgcaaaa ggaaaactca aagagatgga acccagaagt acaatttaca 2040 tcaaattttg gcacggtcga ttcactaaac tgggcaccgg acaacgcggg aaactacaaa 2100 gaaccaaggg tggtggggtc tcgattcctt acgcatatac tataa 2145 <210> 67 <211> 714 <212> PRT <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 v3 B1 Replaced <400> 67 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly Gly Ala Pro Gly 180 185 190 Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser Ser Gly Asn Trp 195 200 205 His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg Thr Thr Ser Thr 210 215 220 Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Leu 225 230 235 240 Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp 245 250 255 Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe Ser Pro Arg Asn 260 265 270 Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Arg Leu 275 280 285 Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Glu Gly 290 295 300 Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe 305 310 315 320 Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp Ala Gly His Glu 325 330 335 Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met Ile Pro Gln Tyr 340 345 350 Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala Gln Ser Asp Leu 355 360 365 Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr 370 375 380 Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp Val Pro Phe His 385 390 395 400 Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu 405 410 415 Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly Asn Pro Thr Gly 420 425 430 Ser Thr Thr Arg Asp Leu Lys Phe Ile Lys Asn Lys Val Pro Asn Phe 435 440 445 Ala His Tyr Gly Lys Asn Trp Leu Pro Gly Pro Phe Ile Arg Gln Gln 450 455 460 Gly Trp Thr Thr Gln Asn Ile Asn Asn Ser Val Val Asn Phe Asn Asp 465 470 475 480 Met Leu Gly Lys Asn Ser Thr Phe Thr Leu Asp Thr Arg Trp Ser Ser 485 490 495 Leu Ala Pro Gly Pro Cys Met Gly Asp Asp Gly Arg Thr Pro Ser Thr 500 505 510 Thr Lys Phe Ser Asn Ala Gln Leu Met Phe Gly Ser Gly Thr Gln Pro 515 520 525 Thr Glu Gly Gly Glu Asp Ala Val His Ile Thr Ser Glu Ser Glu Val 530 535 540 Lys Ala Thr Asn Pro Thr Ala Ile Asp Glu Tyr Gly Arg Val Ala Asp 545 550 555 560 Asn Thr Gln Asn Ala Thr Thr Ala Pro Thr Thr Val Gly Asn Ala Ala 565 570 575 Met Gly Ala Met Pro Gly Met Val Trp Gln Asp Arg Asp Ile Tyr Leu 580 585 590 Gln Gly Pro Ile Trp Gly Lys Ile Pro His Thr Asp Gly His Phe His 595 600 605 Pro Ser Pro Leu Met Gly Gly Phe Gly Tyr Arg Lys Pro Pro Pro Gln 610 615 620 Ile Phe Ile Lys Asn Thr Pro Val Pro Gly Asn Pro Ala Thr Thr Phe 625 630 635 640 Ser Pro Asn Arg Ile Asn Asn Phe Ile Thr Gln Tyr Ser Thr Gly Gln 645 650 655 Val Thr Val Thr Ile Asp Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg 660 665 670 Trp Asn Pro Glu Val Gln Phe Thr Ser Asn Phe Gly Thr Val Asp Ser 675 680 685 Leu Asn Trp Ala Pro Asp Asn Ala Gly Asn Tyr Lys Glu Pro Arg Val 690 695 700 Val Gly Ser Arg Phe Leu Thr His Ile Leu 705 710 <210> 68 <211> 2145 <212> DNA <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 v4 B1 Replaced <400> 68 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaactggc ggaggaattg ccgacgtcat gtctggagat 540 gctgaaatgg ctgcagtggg cgggggagca ccgggcgtcg acggccaggg tgccgaggga 600 gtgggtactt cctcgggtaa ttggcattgc gattcccagt ggtcagaagg acacgtcaga 660 accaccagca ccagaacctg ggtgttgccc agctacaaca accacctgta taaacggctt 720 ggaagtagcg cacaatccaa tacctacaac ggattctcca ccccctgggg atacctcgac 780 ttcaatagat ggcactgtca cttcagtcct cggaactggc aacgtctcat caacaacaac 840 tggggcatca gaccaaaaag acttaatgtt aaattgttca acatacaagt caaagaggtc 900 acgacggaag gggggacgac gaccgtcgcc aataacctta ccagcacgat tcaggtgttt 960 gcggacaacg cgtacgaact cccgtatgtt gtcgacgcgg gtcacgaggg ggcattgccg 1020 ccgttcccaa acgacgtgtt tatgattccc caatacggat actgcgggct ggtgtctggt 1080 caaagtcagg ctcagtcgga cttgtgttcg ttttattgcc tggagtattt tccatcccag 1140 atgctgagaa caggaaacaa ttttgaaatg aatttcaggt ttgaagacgt tccatttcac 1200 tccatgtacg cccacagcca gtctctagac aggctcatga atcctttaat tgatcagtat 1260 ctgtggagtc taaaacaaac aggaaacccg actggatcaa caacgagaga cttaaaattt 1320 atcaagaaca aagttcccaa ttttgcacat tatggaaaaa attggcttcc tggacctttt 1380 attagacaac aggggtggac aacacaaaat attaataata gtgttgttaa ttttaatgac 1440 atgctgggaa aaaattcgac atttactttg gacactagat ggagttcatt agcgcctggt 1500 ccgtgtatgg gggatgacgg acgaactcca tccaccacca agttctcaaa tgctcagctc 1560 atgtttggat ctggaacaca acccaccgaa ggcggtgaag atgctgtaca tattacatcc 1620 gagtcggagg tcaaggcaac caacccaact gcaatcgatg aatacggacg agtggccgat 1680 aatacgcaaa atgcaacaac cgccccaacc acagtgggaa atgctgcaat gggggccatg 1740 cctgggatgg tgtggcaaga tagggatatc tatcttcaag gacccatctg gggaaaaata 1800 ccccatacag acggacattt tcatccgtct cctctcatgg gggggtttgg atacagaaaa 1860 ccccctccgc aaatttttat taaaaacacc cccgttcctg gaaatccggc aactacattt 1920 tctccaaata gaataaacaa tttcattact caatactcaa cgggacaagt gaccgttact 1980 attgactggg agctgcaaaa ggaaaactca aagagatgga acccagaagt acaatttaca 2040 tcaaattttg gcacggtcga ttcactaaac tgggcaccgg acaacgcggg aaactacaaa 2100 gaaccaaggg tggtggggtc tcgattcctt acgcatatac tataa 2145 <210> 69 <211> 714 <212> PRT <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 v4 B1 Replaced <400> 69 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Thr Gly Gly Gly Ile Ala Asp Val 165 170 175 Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly Gly Ala Pro Gly 180 185 190 Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser Ser Gly Asn Trp 195 200 205 His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg Thr Thr Ser Thr 210 215 220 Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Leu 225 230 235 240 Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp 245 250 255 Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe Ser Pro Arg Asn 260 265 270 Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Arg Leu 275 280 285 Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Glu Gly 290 295 300 Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe 305 310 315 320 Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp Ala Gly His Glu 325 330 335 Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met Ile Pro Gln Tyr 340 345 350 Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala Gln Ser Asp Leu 355 360 365 Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr 370 375 380 Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp Val Pro Phe His 385 390 395 400 Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu 405 410 415 Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly Asn Pro Thr Gly 420 425 430 Ser Thr Thr Arg Asp Leu Lys Phe Ile Lys Asn Lys Val Pro Asn Phe 435 440 445 Ala His Tyr Gly Lys Asn Trp Leu Pro Gly Pro Phe Ile Arg Gln Gln 450 455 460 Gly Trp Thr Thr Gln Asn Ile Asn Asn Ser Val Val Asn Phe Asn Asp 465 470 475 480 Met Leu Gly Lys Asn Ser Thr Phe Thr Leu Asp Thr Arg Trp Ser Ser 485 490 495 Leu Ala Pro Gly Pro Cys Met Gly Asp Asp Gly Arg Thr Pro Ser Thr 500 505 510 Thr Lys Phe Ser Asn Ala Gln Leu Met Phe Gly Ser Gly Thr Gln Pro 515 520 525 Thr Glu Gly Gly Glu Asp Ala Val His Ile Thr Ser Glu Ser Glu Val 530 535 540 Lys Ala Thr Asn Pro Thr Ala Ile Asp Glu Tyr Gly Arg Val Ala Asp 545 550 555 560 Asn Thr Gln Asn Ala Thr Thr Ala Pro Thr Thr Val Gly Asn Ala Ala 565 570 575 Met Gly Ala Met Pro Gly Met Val Trp Gln Asp Arg Asp Ile Tyr Leu 580 585 590 Gln Gly Pro Ile Trp Gly Lys Ile Pro His Thr Asp Gly His Phe His 595 600 605 Pro Ser Pro Leu Met Gly Gly Phe Gly Tyr Arg Lys Pro Pro Pro Gln 610 615 620 Ile Phe Ile Lys Asn Thr Pro Val Pro Gly Asn Pro Ala Thr Thr Phe 625 630 635 640 Ser Pro Asn Arg Ile Asn Asn Phe Ile Thr Gln Tyr Ser Thr Gly Gln 645 650 655 Val Thr Val Thr Ile Asp Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg 660 665 670 Trp Asn Pro Glu Val Gln Phe Thr Ser Asn Phe Gly Thr Val Asp Ser 675 680 685 Leu Asn Trp Ala Pro Asp Asn Ala Gly Asn Tyr Lys Glu Pro Arg Val 690 695 700 Val Gly Ser Arg Phe Leu Thr His Ile Leu 705 710 <210> 70 <211> 2157 <212> DNA <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 v5 B1 Replaced <400> 70 atgtcttctt tgtttaaaga gtacctgcag agtaccggac tggtgggtat ccagtcggga 60 gcgccgaagc caaaggccgg ccagcagaag caggatacag ggtcctttga gtggaaaaag 120 aaggaggaca cagccagagg gctggtcctt cccggttaca agtacctcgg gcccttcaac 180 ggtctagagc ggggcgagcc tgtgaatgcc gcggacgccg cggcccagcg acacgaccga 240 cagtacgatc gtattctaca acaagggggt aatccatacc tcacgtacaa ccacgccgac 300 cgagagttcc aggaggagct ccagtctgac gagtcttttg ggggaaatct tggcaaggct 360 gtgtttcagg ccaagaagcg aatcctagag cccctcggtc tggttgaaga ggatccctct 420 cagccagatt cgtcctcgga caacacggcg ccacccgtga aaaagtcccg tctcgaagaa 480 gcccagccca ttcaaagtcc agacgtttcc agcagcactg gcggaggaat tgccgacgtc 540 atgtctggag atgctgaaat ggctgcagtg ggcgggggag caccgggcgt cgacggccag 600 ggtgccgagg gagtgggtac ttcctcgggt aattggcatt gcgattccca gtggtcagaa 660 ggacacgtca gaaccaccag caccagaacc tgggtgttgc ccagctacaa caaccacctg 720 tataaacggc ttggaagtag cgcacaatcc aatacctaca acggattctc caccccctgg 780 ggatacctcg acttcaatag atggcactgt cacttcagtc ctcggaactg gcaacgtctc 840 atcaacaaca actggggcat cagaccaaaa agacttaatg ttaaattgtt caacatacaa 900 gtcaaagagg tcacgacgga aggggggacg acgaccgtcg ccaataacct taccagcacg 960 attcaggtgt ttgcggacaa cgcgtacgaa ctcccgtatg ttgtcgacgc gggtcacgag 1020 ggggcattgc cgccgttccc aaacgacgtg tttatgattc cccaatacgg atactgcggg 1080 ctggtgtctg gtcaaagtca ggctcagtcg gacttgtgtt cgttttattg cctggagtat 1140 tttccatccc agatgctgag aacaggaaac aattttgaaa tgaatttcag gtttgaagac 1200 gttccatttc actccatgta cgcccacagc cagtctctag acaggctcat gaatccttta 1260 attgatcagt atctgtggag tctaaaacaa acaggaaacc cgactggatc aacaacgaga 1320 gacttaaaat ttatcaagaa caaagttccc aattttgcac attatggaaa aaattggctt 1380 cctggacctt ttattagaca acaggggtgg acaacacaaa atattaataa tagtgttgtt 1440 aattttaatg acatgctggg aaaaaattcg acatttactt tggacactag atggagttca 1500 ttagcgcctg gtccgtgtat gggggatgac ggacgaactc catccaccac caagttctca 1560 aatgctcagc tcatgtttgg atctggaaca caacccaccg aaggcggtga agatgctgta 1620 catattacat ccgagtcgga ggtcaaggca accaacccaa ctgcaatcga tgaatacgga 1680 cgagtggccg ataatacgca aaatgcaaca accgccccaa ccacagtggg aaatgctgca 1740 atgggggcca tgcctgggat ggtgtggcaa gatagggata tctatcttca aggacccatc 1800 tggggaaaaa taccccatac agacggacat tttcatccgt ctcctctcat gggggggttt 1860 ggatacagaa aaccccctcc gcaaattttt attaaaaaca cccccgttcc tggaaatccg 1920 gcaactacat tttctccaaa tagaataaac aatttcatta ctcaatactc aacgggacaa 1980 gtgaccgtta ctattgactg ggagctgcaa aaggaaaact caaagagatg gaacccagaa 2040 gtacaattta catcaaattt tggcacggtc gattcactaa actgggcacc ggacaacgcg 2100 ggaaactaca aagaaccaag ggtggtgggg tctcgattcc ttacgcatat actataa 2157 <210> 71 <211> 718 <212> PRT <213> Artificial Sequence <220> <223> Cap AAV2 VP1 Sea Lion VP2 VP3 v5 B1 Replaced <400> 71 Met Ser Ser Leu Phe Lys Glu Tyr Leu Gln Ser Thr Gly Leu Val Gly 1 5 10 15 Ile Gln Ser Gly Ala Pro Lys Pro Lys Ala Gly Gln Gln Lys Gln Asp 20 25 30 Thr Gly Ser Phe Glu Trp Lys Lys Lys Glu Asp Thr Ala Arg Gly Leu 35 40 45 Val Leu Pro Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Glu Arg 50 55 60 Gly Glu Pro Val Asn Ala Ala Asp Ala Ala Ala Gln Arg His Asp Arg 65 70 75 80 Gln Tyr Asp Arg Ile Leu Gln Gln Gly Gly Asn Pro Tyr Leu Thr Tyr 85 90 95 Asn His Ala Asp Arg Glu Phe Gln Glu Glu Leu Gln Ser Asp Glu Ser 100 105 110 Phe Gly Gly Asn Leu Gly Lys Ala Val Phe Gln Ala Lys Lys Arg Ile 115 120 125 Leu Glu Pro Leu Gly Leu Val Glu Glu Asp Pro Ser Gln Pro Asp Ser 130 135 140 Ser Ser Asp Asn Thr Ala Pro Pro Val Lys Lys Ser Arg Leu Glu Glu 145 150 155 160 Ala Gln Pro Ile Gln Ser Pro Asp Val Ser Ser Ser Thr Gly Gly Gly 165 170 175 Ile Ala Asp Val Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly 180 185 190 Gly Ala Pro Gly Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser 195 200 205 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg 210 215 220 Thr Thr Ser Thr Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu 225 230 235 240 Tyr Lys Arg Leu Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe 245 250 255 Ser Thr Pro Trp Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe 260 265 270 Ser Pro Arg Asn Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg 275 280 285 Pro Lys Arg Leu Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val 290 295 300 Thr Thr Glu Gly Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr 305 310 315 320 Ile Gln Val Phe Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp 325 330 335 Ala Gly His Glu Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met 340 345 350 Ile Pro Gln Tyr Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala 355 360 365 Gln Ser Asp Leu Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln 370 375 380 Met Leu Arg Thr Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp 385 390 395 400 Val Pro Phe His Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu 405 410 415 Met Asn Pro Leu Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly 420 425 430 Asn Pro Thr Gly Ser Thr Thr Arg Asp Leu Lys Phe Ile Lys Asn Lys 435 440 445 Val Pro Asn Phe Ala His Tyr Gly Lys Asn Trp Leu Pro Gly Pro Phe 450 455 460 Ile Arg Gln Gln Gly Trp Thr Thr Gln Asn Ile Asn Asn Ser Val Val 465 470 475 480 Asn Phe Asn Asp Met Leu Gly Lys Asn Ser Thr Phe Thr Leu Asp Thr 485 490 495 Arg Trp Ser Ser Leu Ala Pro Gly Pro Cys Met Gly Asp Asp Gly Arg 500 505 510 Thr Pro Ser Thr Thr Lys Phe Ser Asn Ala Gln Leu Met Phe Gly Ser 515 520 525 Gly Thr Gln Pro Thr Glu Gly Gly Glu Asp Ala Val His Ile Thr Ser 530 535 540 Glu Ser Glu Val Lys Ala Thr Asn Pro Thr Ala Ile Asp Glu Tyr Gly 545 550 555 560 Arg Val Ala Asp Asn Thr Gln Asn Ala Thr Thr Ala Pro Thr Thr Val 565 570 575 Gly Asn Ala Ala Met Gly Ala Met Pro Gly Met Val Trp Gln Asp Arg 580 585 590 Asp Ile Tyr Leu Gln Gly Pro Ile Trp Gly Lys Ile Pro His Thr Asp 595 600 605 Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Tyr Arg Lys 610 615 620 Pro Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro Val Pro Gly Asn Pro 625 630 635 640 Ala Thr Thr Phe Ser Pro Asn Arg Ile Asn Asn Phe Ile Thr Gln Tyr 645 650 655 Ser Thr Gly Gln Val Thr Val Thr Ile Asp Trp Glu Leu Gln Lys Glu 660 665 670 Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Phe Thr Ser Asn Phe Gly 675 680 685 Thr Val Asp Ser Leu Asn Trp Ala Pro Asp Asn Ala Gly Asn Tyr Lys 690 695 700 Glu Pro Arg Val Val Gly Ser Arg Phe Leu Thr His Ile Leu 705 710 715 <210> 72 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> KTag <400> 72 Ala Thr His Ile Lys Phe Ser Lys Arg Asp 1 5 10 <210> 73 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> SpyTag002 <400> 73 Val Pro Thr Ile Val Met Val Asp Ala Tyr Lys Arg Tyr Lys 1 5 10

Claims (138)

  1. 재조합 AAV 바이러스 입자로서, (i) AAV VP1, VP2, 및 VP3 캡시드 단백질을 포함하는 AAV 캡시드, 및 (ii) AAV 캡시드 내에 포장되고, AAV 역위 말단 반복(ITR) 서열을 포함하는 핵산 서열을 포함하되,
    AAV VP1 캡시드 단백질, AAV VP1 캡시드 단백질의 임의의 일부, AAV VP2 캡시드 단백질, AAV VP2 캡시드 단백질의 임의의 일부, AAV VP3 캡시드 단백질, 및 AAV VP3 캡시드 단백질의 임의의 일부 중 적어도 하나는, 비영장류 동물 AAV 또는 이의 일부 또는 원격 AAV 또는 이의 일부에 캡시드 단백질의 아미노산 부분에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하고,
    여기서
    I. AAV VP1, VP2, 및 VP3 캡시드 단백질 중 적어도 하나는
    (a) 단백질:단백질 결합 쌍의 제1 구성원(여기서, 단백질:단백질 결합 쌍은 AAV 바이러스 입자의 향성을 유도함),
    (b) 검출 가능한 표지,
    (c) 점 돌연변이, 바람직하게는, AAV 바이러스 입자의 천연 향성을 감소시키고/시키거나 검출 가능한 표지를 생성하는 점 돌연변이,
    (d) 키메라 아미노산 서열, 및
    (e) (a), (b), (c), 및 (d)의 임의의 조합으로 이루어진 군으로부터 선택된 변형을 포함하고/하거나,
    II. ITR 서열 또는 이의 일부는 제2 AAV의 일부의 ITR 서열과 상당한 서열 동일성, 예를 들어 적어도 95%의 동일성을 갖는 핵산 서열을 포함하되, 제2 AAV는 비영장류 동물 AAV 또는 원격 AAV와 동일하지 않으며,
    재조합 AAV 바이러스 입자는 포유류 숙주, 바람직하게는 영장류 숙주를 감염시킬 수 있는, 재조합 AAV 바이러스 입자.
  2. 재조합 AAV 바이러스 입자로서, (i) AAV VP1, VP2, 및 VP3 캡시드 단백질을 포함하는 AAV 캡시드, 및 (ii) AAV 캡시드 내에 포장되고, AAV 역위 말단 반복(ITR) 서열을 포함하는 핵산 서열을 포함하되,
    AAV VP1 캡시드 단백질, AAV VP1 캡시드 단백질의 임의의 일부, AAV VP2 캡시드 단백질, AAV VP2 캡시드 단백질의 임의의 일부, AAV VP3 캡시드 단백질, 및 AAV VP3 캡시드 단백질의 임의의 일부 중 적어도 하나는 비영장류 동물 AAV 또는 이의 일부의 캡시드 단백질의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하고,
    AAV VP1, VP2, 및 VP3 캡시드 단백질 중 적어도 하나는 다음으로 이루어진 군으로부터 선택된 변화를 포함하고:
    (a) 단백질:단백질 결합 쌍의 제1 구성원(여기서, 단백질:단백질 결합 쌍은 AAV 바이러스 입자의 향성을 유도함),
    (b) 검출 가능한 표지,
    (c) 점 돌연변이, 바람직하게는, AAV 바이러스 입자의 천연 향성을 감소시키고/시키거나 검출 가능한 표지를 생성하는 점 돌연변이,
    (d) 키메라 아미노산 서열, 및
    (e) (a), (b), (c), 및 (d)의 임의의 조합,
    전체 ITR 서열 또는 ITR 서열의 일부는 비영장류 동물 AAV의 ITR에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 핵산 서열을 포함하고, 임의로 ITR 서열은 키메라 핵산 서열을 포함하고, 비영장류 AAV의 ITR에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 키메라 핵산 서열의 일부는 제2 AAV의 ITR에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 키메라 핵산 서열의 일부에 작동 가능하게 연결되고, 제2 AAV는 비영장류 동물 AAV와 동일하지 않고,
    재조합 AAV 바이러스 입자는 포유류 숙주, 바람직하게는 영장류 숙주를 감염시킬 수 있는, 재조합 AAV 바이러스 입자.
  3. 재조합 AAV 바이러스 입자로서, (i) AAV VP1, VP2, 및 VP3 캡시드 단백질을 포함하는 AAV 캡시드, 및 (ii) AAV 캡시드 내에 포장되고, AAV 역위 말단 반복(ITR) 서열을 포함하는 핵산 서열을 포함하되,
    AAV VP1 캡시드 단백질, AAV VP1 캡시드 단백질의 임의의 일부, AAV VP2 캡시드 단백질, AAV VP2 캡시드 단백질의 임의의 일부, AAV VP3 캡시드 단백질, 및 AAV VP3 캡시드 단백질의 임의의 일부 중 적어도 하나는 비영장류 동물 AAV 또는 이의 일부의 캡시드 단백질의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하고, 임의로 AAV VP1, VP2, 및 VP3 캡시드 단백질 중 적어도 하나는 다음으로 이루어진 군으로부터 선택된 변형을 포함하고:
    (a) 단백질:단백질 결합 쌍의 제1 구성원(여기서, 단백질:단백질 결합 쌍은 AAV 바이러스 입자의 향성을 유도함),
    (b) 검출 가능한 표지,
    (c) 점 돌연변이, 바람직하게는 AAV 바이러스 입자의 자연 향성을 감소시키고/시키거나 검출 가능한 표지를 생성하는 점 돌연변이, 및
    (d) (a)~(c)의 임의의 조합,
    ITR 서열 또는 이의 일부는 제2 AAV의 ITR 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 핵산 서열을 포함하되, 제2 AAV는 비영장류 동물 AAV와 동일하지 않고,
    재조합 AAV 바이러스 입자는 포유류 숙주, 바람직하게는 영장류 숙주를 감염시킬 수 있는, 재조합 AAV 바이러스 입자.
  4. 재조합 AAV 바이러스 입자로서, (i) AAV VP1, VP2, 및 VP3 캡시드 단백질을 포함하는 AAV 캡시드, 및 (ii) AAV 캡시드 내에 포장되고, AAV 역위 말단 반복(ITR) 서열을 포함하는 핵산 서열을 포함하되,
    AAV VP1 캡시드 단백질, AAV VP1 캡시드 단백질의 임의의 일부, AAV VP2 캡시드 단백질, AAV VP2 캡시드 단백질의 임의의 일부, AAV VP3 캡시드 단백질, 및 AAV VP3 캡시드 단백질의 임의의 일부 중 적어도 하나는 (A) 비영장류 동물 AAV 캡시드 단백질 또는 이의 일부의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열, 및 (B) 제2 AAV 캡시드 단백질 또는 이의 일부의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하는 키메라 아미노산 서열을 포함하되, (A)는 (B)에 작동 가능하게 연결되며,
    제2 AAV는 비영장류 동물 AAV와 동일하지 않고,
    재조합 AAV 바이러스 입자는 포유류 숙주, 바람직하게는 영장류 숙주를 감염시킬 수 있으며, 임의로
    키메라 아미노산 서열을 포함하는 AAV VP1 캡시드 단백질, AAV VP1 캡시드 단백질의 임의의 일부, AAV VP2 캡시드 단백질, AAV VP2 캡시드 단백질의 임의의 일부, AAV VP3 캡시드 단백질, 및 AAV VP3 캡시드 단백질의 임의의 일부 중 적어도 하나는 다음으로 이루어진 군으로부터 선택된 변형을 추가로 포함하는, 재조합 AAV 바이러스 입자:
    (a) 단백질:단백질 결합 쌍의 제1 구성원,
    (b) 검출 가능한 표지, 및
    (c) (a)와 (b)의 조합.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 단백질:단백질 결합 쌍은 SpyTag:SpyCatcher, SpyTag:KTag, Isopeptag:pilin-C, SnoopTag:SnoopCatcher, 및 SpyTag002:SpyCatcher002로부터 선택되는, 재조합 AAV 입자.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 단백질:단백질 결합 쌍의 제1 구성원은 서열번호 44로서 제시된 서열을 포함하는 c-myc를 포함하는, 재조합 AAV 입자.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 검출 가능한 표지는 IGTRYLTR(서열번호 45)의 아미노산 서열을 포함하는 B1 에피토프를 포함하는, 재조합 AAV 입자.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 캡시드 단백질 또는 이의 일부는 비영장류 동물 AAV의 VP3 캡시드 단백질의 아미노산 서열과 상당한 서열 동일성, 예를 들어, 적어도 95%의 동일성을 갖는 아미노산 서열을 포함하는, 재조합 AAV 바이러스 입자.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 캡시드 단백질 또는 이의 일부는 비영장류 동물 AAV의 VP2 캡시드 단백질의 아미노산 서열과 상당한 서열 동일성, 예를 들어, 적어도 95%의 동일성을 갖는 아미노산 서열을 포함하는, 재조합 AAV 바이러스 입자.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 캡시드 단백질 또는 이의 일부는 비영장류 동물 AAV의 VP1 캡시드 단백질의 아미노산 서열과 상당한 서열 동일성, 예를 들어, 적어도 95%의 동일성을 갖는 아미노산 서열을 포함하는, 재조합 AAV 바이러스 입자.
  11. 제1항 내지 제13항 중 어느 한 항에 있어서,
    (i) VP1 캡시드 단백질은 다음 중 어느 하나를 포함하고
    키메라 아미노산 서열(임의로, 키메라 AAV VP1 캡시드 단백질의 VP1-고유 영역(VP1-u)은 제2 AAV의 VP1-u의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하고, 키메라 AAV VP1 캡시드의 VP1/VP2 공통 영역 및 VP3 영역은 비영장류 동물 AAV의 VP1/VP2 공통 영역 및 VP3 영역의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함함), 및
    비영장류 동물 AAV의 VP1 캡시드 단백질에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열,
    (ii) VP2 캡시드 단백질은 다음 중 어느 하나를 포함하고
    키메라 아미노산 서열(임의로, 키메라 AAV VP2 캡시드 단백질의 VP1/VP2 공통 영역은 제2 AAV의 VP1/VP2 공통 영역의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하고, 키메라 VP2 캡시드 단백질의 VP3 영역은 비영장류 동물 AAV의 VP3 영역에 대해 적어도 95% 동일성을 포함함), 또는
    비영장류 동물 AAV의 VP2 캡시드 단백질에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열,
    (iii) VP3 캡시드 단백질은 비영장류 동물 AAV의 VP3 캡시드 단백질의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하는, 재조합 AAV 바이러스 입자.
  12. 제1항 내지 제13항 중 어느 한 항에 있어서,
    (i) VP1 캡시드 단백질은 키메라 아미노산 서열을 포함하고(임의로, 키메라 AAV VP1 캡시드 단백질의 VP1-고유 영역(VP1-u)은 제2 AAV의 VP1-u의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하고, 키메라 AAV VP1 캡시드의 VP1/VP2 공통 영역 및 VP3 영역은 비영장류 동물 AAV의 VP1/VP2 공통 영역 및 VP3 영역의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함함),
    (ii) VP2 캡시드 단백질은 키메라 아미노산 서열을 포함하고(임의로, 키메라 AAV VP2 캡시드 단백질의 VP1/VP2 공통 영역은 제2 AAV의 VP1/VP2 공통 영역의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하고, 키메라 VP2 캡시드 단백질의 VP3 영역은 비영장류 동물 AAV의 VP3 영역에 대해 적어도 95% 동일성을 포함함),
    (iii) VP3 캡시드 단백질은 비영장류 동물 AAV의 VP3 캡시드 단백질의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하는, 재조합 AAV 바이러스 입자.
  13. 제1항 내지 제13항 중 어느 한 항에 있어서,
    (i) AAV VP1 캡시드 단백질은 키메라 아미노산 서열을 포함하고(임의로, 키메라 AAV VP1 캡시드 단백질의 VP1-고유 영역(VP1-u)은 제2 AAV의 VP1-u의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하고, 키메라 AAV VP1 캡시드의 VP1/VP2 공통 영역 및 VP3 영역은 비영장류 동물 AAV의 VP1/VP2 공통 영역 및 VP3 영역의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함함),
    (ii) VP2 캡시드 단백질은 비영장류 동물 AAV의 VP2 캡시드 단백질의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하고,
    (iii) VP3 캡시드 단백질은 비영장류 동물 AAV의 VP3 캡시드 단백질의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하는, 재조합 AAV 바이러스 입자.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서,
    (i) VP1 캡시드 단백질은 비영장류 동물 AAV의 VP1 캡시드 단백질의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하고,
    (ii) VP2 캡시드 단백질은 비영장류 동물 AAV의 VP2 캡시드 단백질의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하고,
    (iii) VP3 캡시드 단백질은 비영장류 동물 AAV의 VP3 캡시드 단백질의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하는, 재조합 AAV 바이러스 입자.
  15. 제1항 내지 제14항 중 어느 한 항에 있어서, 제2 AAV는 영장류 AAV 또는 영장류 AAV의 조합인, 재조합 AAV 바이러스 입자.
  16. 제1항 내지 제15항 중 어느 한 항에 있어서, 제2 AAV는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, 및 이들의 조합으로 이루어진 군으로부터 선택되는, 재조합 AAV 바이러스 입자.
  17. 제1항 내지 제16항 중 어느 한 항에 있어서, 제2 AAV는 AAV2인, 재조합 AAV 바이러스 입자.
  18. 제1항 내지 제17항 중 어느 한 항에 있어서, 비영장류 동물 AAV는 표 2에 열거된 군으로부터 선택된 비영장류 AAV인, 재조합 AAV 바이러스 입자.
  19. 제1항 내지 제18항 중 어느 한 항에 있어서, 비영장류 동물 AAV는 조류 AAV(AAAV), 바다 사자 AAV, 또는 턱수염 도마뱀 AAV인, 재조합 AAV 바이러스 입자.
  20. 제1항 내지 제19항 중 어느 한 항에 있어서, 비영장류 동물 AAV는 AAAV인, 재조합 AAV 바이러스 입자.
  21. 제1항 내지 제20항 중 어느 한 항에 있어서, 변형은 AAAV의 VP1 캡시드 단백질의 위치 I444 또는 I580에서의 변형인, 재조합 AAV 바이러스 입자.
  22. 제1항 내지 제19항 중 어느 한 항에 있어서, 비영장류 동물 AAV는 유린류 AAV인, 재조합 AAV 바이러스 입자.
  23. 제1항 내지 제19항 및 제22항 중 어느 한 항에 있어서, 유린류 AAV는 턱수염 도마뱀 AAV인, 재조합 AAV 바이러스 입자.
  24. 제1항 내지 제19항 및 제22항 내지 제23항 중 어느 한 항에 있어서, 변형은 턱수염 도마뱀 AAV의 VP1 캡시드 단백질의 위치 I573 또는 I436에서의 변형인, 재조합 AAV 바이러스 입자.
  25. 제1항 내지 제19항 중 어느 한 항에 있어서, 비영장류 동물 AAV는 포유류 AAV인, 재조합 AAV 바이러스 입자.
  26. 제1항 내지 제19항 및 제25항 중 어느 한 항에 있어서, 포유류 AAV는 바다 사자 AAV인, 재조합 AAV 바이러스 입자.
  27. 제1항 내지 제19항 및 제25항 내지 제26항 중 어느 한 항에 있어서, 변형은 바다 사자 AAV의 VP1의 I429, I430, I431, I432, I433, I434, I436, I437, 및 A565로 이루어진 군으로부터 선택된 위치에서의 변형인, 재조합 AAV 바이러스 입자.
  28. 제1항 내지 제27항 중 어느 한 항에 있어서, VP3 캡시드 단백질은 다음을 포함하도록 변형되는, 재조합 AAV 바이러스 입자:
    (a) 단백질:단백질 결합 쌍의 적어도 제1 구성원(임의로, 여기서 단백질:단백질 결합 쌍은 SpyTag:SpyCatcher, SpyTag:KTag, Isopeptag:pilin-C, SnoopTag:SnoopCatcher, 및 SpyTag002:SpyCatcher002로 이루어진 군으로부터 선택됨),
    (b) 검출 가능한 표지(임의로, 여기서 검출 가능한 표지는 서열번호 44로 제시된 아미노산 서열 또는 서열번호 45로 제시된 아미노산 서열을 포함함),
    (c) 점돌연변이, 또는
    (d) (a), (b), 및 (c)의 임의의 조합.
  29. 제28항에 있어서, VP3 캡시드 단백질은 다음을 포함하도록 변형되는, 재조합 AAV 바이러스 입자:
    (a) 서열번호 42로서 제시된 아미노산 서열을 포함하는 적어도 SpyTag 및/또는
    (b) 서열번호 45로서 제시된 아미노산 서열을 포함하는 검출 가능한 표지.
  30. 제1항 내지 제29항 중 어느 한 항에 있어서, 단백질:단백질 결합 쌍의 제1 구성원 및/또는 검출 가능한 표지를 상기 AAV 입자의 캡시드의 캡시드 단백질에 작동 가능하게 연결하는 제1 및/또는 제2 링커를 포함하는, 재조합 AAV 바이러스 입자.
  31. 제30항에 있어서, 제1 및 제2 링커는 동일하지 않은, 재조합 AAV 바이러스 입자.
  32. 제30항에 있어서, 제1 및 제2 링커는 동일한, 재조합 AAV 바이러스 입자.
  33. 제30항 내지 제32항 중 어느 한 항에 있어서, 제1 및/또는 제2 링커는 10개 아미노산의 길이인, 재조합 AAV 바이러스 입자.
  34. 제1항 내지 제33항 중 어느 한 항에 있어서, 상기 AAV 입자의 캡시드의 캡시드 단백질의 가변 영역에 작동 가능하게 연결된 단백질:단백질 결합 쌍의 제1 구성원 및/또는 검출 가능한 표지를 포함하는, 재조합 AAV 바이러스 입자.
  35. 제1항 내지 제34항 중 어느 한 항에 있어서, 다음으로 이루어진 군으로부터 선택된 아미노산 서열을 포함하는 캡시드 단백질을 포함하는, 재조합 AAV 바이러스 입자:
    (a) 서열번호 2로 제시된 아미노산 서열,
    (b) 서열번호 4로 제시된 아미노산 서열,
    (c) 서열번호 6으로 제시된 아미노산 서열,
    (d) 서열번호 8로서 제시된 아미노산 서열,
    (e) 서열번호 10으로서 제시된 아미노산 서열,
    (f) 서열번호 12로서 제시된 아미노산 서열,
    (g) 서열번호 14로서 제시된 아미노산 서열,
    (h) 서열번호 16으로서 제시된 아미노산 서열,
    (i) 서열번호 18로서 제시된 아미노산 서열,
    (j) 서열번호 20으로서 제시된 아미노산 서열;
    (k) 서열번호 22로서 제시된 아미노산 서열,
    (l) 서열번호 24로서 제시된 아미노산 서열,
    (m) 서열번호 26으로서 제시된 아미노산 서열;
    (n) 서열번호 28로서 제시된 아미노산 서열,
    (o) 서열번호 30으로서 제시된 아미노산 서열,
    (p) 서열번호 32로서 제시된 아미노산 서열,
    (q) 서열번호 34로서 제시된 아미노산 서열;
    (r) 서열번호 36으로서 제시된 아미노산 서열,
    (s) 서열번호 53으로서 제시된 아미노산 서열,
    (t) 서열번호 55로서 제시된 아미노산 서열,
    (u) 서열번호 57로서 제시된 아미노산 서열,
    (v) 서열번호 59로서 제시된 아미노산 서열,
    (w) 서열번호 61로서 제시된 아미노산 서열,
    (x) 서열번호 63으로서 제시된 아미노산 서열,
    (y) 서열번호 65로서 제시된 아미노산 서열,
    (z) 서열번호 67로서 제시된 아미노산 서열,
    (aa) 서열번호 69로서 제시된 아미노산 서열,
    (bb) 서열번호 71로서 제시된 아미노산 서열,
    (cc) 서열번호 2, 서열번호 4, 서열번호 6, 서열번호 8, 서열번호 10, 서열번호 12, 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26, 서열번호 28, 서열번호 30, 서열번호 32, 서열번호 34, 서열번호 36, 서열번호 53, 서열번호 55, 서열번호 57, 서열번호 59, 서열번호 61, 서열번호 63, 서열번호 65, 서열번호 67, 서열번호 69, 또는 서열번호 71과 상당한 서열 동일성을, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열, 및
    (dd) (a) 내지 (cc) 중 어느 하나에 제시된 아미노산 서열의 임의의 VP2 및/또는 VP3 부분의 아미노산 서열.
  36. 제1항 내지 제35항 중 어느 한 항에 있어서, 캡시드가 모자이크 캡시드가 되도록 기준 캡시드 단백질을 추가로 포함하는, 재조합 AAV 바이러스 입자.
  37. 제1항 내지 제36항 중 어느 한 항에 있어서, VP3 캡시드 단백질은 단백질:단백질 결합 쌍의 제1 구성원과의 변형을 포함하고, 캡시드는 단백질:단백질 결합 쌍의 제1 구성원이 결여된 기준 VP3 캡시드 단백질을 추가로 포함하는, 재조합 AAV 바이러스 입자.
  38. 아미노산 서열을 포함하는 아데노-연관 바이러스(AAV) 캡시드 단백질로서, 아미노산 서열 또는 이의 일부는 비영장류 동물 AAV 또는 이의 일부, 또는 원격 AAV 또는 이의 일부의 캡시드 단백질의 아미노산 서열과 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖고,
    AAV 캡시드 단백질은 다음으로 이루어진 군으로부터 선택되는, AAV 캡시드 단백질:
    (a) 키메라 AAV VP1 캡시드 단백질(임의로 키메라 AAV VP1 캡시드 단백질은 단백질:단백질 결합 쌍의 적어도 제1 구성원, 검출 가능한 표지, 및/또는 AAV 바이러스 입자의 자연 향성을 감소시키고/시키거나 검출 가능한 표지를 생성하는 점 돌연변이를 포함하도록 변형됨),
    (b) 단백질:단백질 결합 쌍의 적어도 제1 구성원, 검출 가능한 표지, 및/또는 AAV 바이러스 입자의 자연 향성을 감소시키고/시키거나 검출 가능한 표지를 생성하는 점 돌연변이를 포함하도록 변형된 비영장류 동물 AAV 또는 원격 AAV의 비키메라 AAV VP1 캡시드 단백질,
    (c) 키메라 AAV VP2 캡시드 단백질(임의로 키메라 AAV VP2 캡시드 단백질은 단백질:단백질 결합 쌍의 적어도 제1 구성원, 검출 가능한 표지, 및/또는 AAV 바이러스 입자의 자연 향성을 감소시키고/시키거나 검출 가능한 표지를 생성하는 점 돌연변이를 포함하도록 변형됨),
    (d) 단백질:단백질 결합 쌍의 적어도 제1 구성원, 검출 가능한 표지, 및/또는 AAV 바이러스 입자의 자연 향성을 감소시키고/시키거나 검출 가능한 표지를 생성하는 점 돌연변이를 포함하도록 변형된 비영장류 동물 AAV 또는 원격 AAV의 비키메라 AAV VP2 캡시드 단백질,
    (e) 단백질:단백질 결합 쌍의 적어도 제1 구성원, 검출 가능한 표지, 및/또는 AAV 바이러스 입자의 자연 향성을 감소시키고/시키거나 검출 가능한 표지를 생성하는 점 돌연변이를 포함하도록 변형된 비키메라 AAV VP3 캡시드 단백질, 및
    (f) 단백질:단백질 결합 쌍의 적어도 제1 구성원, 검출 가능한 표지, 및/또는 AAV 바이러스 입자의 자연 향성을 감소시키고/시키거나 검출 가능한 표지를 생성하는 점 돌연변이를 포함하도록 변형된 비인간 AAV 또는 원격 AAV의 비키메라 AAV VP3 캡시드 단백질.
  39. 제38항에 있어서, 단백질:단백질 결합 쌍의 제1 구성원의 측면에는 단백질:단백질 결합 쌍의 제1 구성원을 캡시드 단백질에 연결시키는 제1 및/또는 제2 링커가 위치하며, 제1 및/또는 제2 링커는 각각 독립적으로 적어도 하나의 아미노산 길이인, AAV 캡시드 단백질.
  40. 제39항에 있어서, 제1 및 제2 링커는 동일하지 않은, AAV 캡시드 단백질.
  41. 제39항에 있어서, 제1 및 제2 링커는 동일하고, 10개의 아미노산 길이인, AAV 캡시드 단백질.
  42. 제38항 내지 제41항 중 어느 한 항에 있어서, 캡시드 단백질은 단백질:단백질 결합 쌍의 제2 동족 구성원을 추가로 포함하되, 임의로 제1 및 제2 구성원은 공유결합에 의해, 임의로 이소펩티드 결합에 의해 결합되는, AAV 캡시드 단백질.
  43. 제38항 내지 제42항 중 어느 한 항에 있어서, 단백질:단백질 결합 쌍의 제1 구성원은 SpyTag를 포함하는, AAV 캡시드 단백질.
  44. 제42항 또는 제43항에 있어서, 제2 동족 구성원은 SpyCatcher를 포함하는, AAV 캡시드 단백질.
  45. 제42항 내지 제44항 중 어느 한 항에 있어서, 제2 동족 구성원은 KTag를 포함하는, AAV 캡시드 단백질.
  46. 제42항에 있어서, 제1 구성원은 KTag이고 제2 동족 구성원은 SpyTag를 포함하는, AAV 캡시드 단백질.
  47. 제42항에 있어서, 제1 구성원은 SnoopTag이고 제2 동족 구성원은 SnoopCatcher를 포함하는, AAV 캡시드 단백질.
  48. 제42항에 있어서, 제1 구성원은 isopeptag이고 제2 동족 구성원은 Pilin-C를 포함하는, AAV 캡시드 단백질.
  49. 제42항에 있어서, 제1 구성원은 SpyTag002이고 제2 동족 구성원은 SpyCatcher002를 포함하는, AAV 캡시드 단백질.
  50. 제42항 내지 제49항 중 어느 한 항에 있어서, 제2 구성원은 표적화 리간드에 작동 가능하게 연결되고, 임의로 표적화 리간드는 결합 모이어티인, AAV 캡시드 단백질.
  51. 제50항에 있어서, 결합 모이어티는 항체 또는 그의 일부인, AAV 캡시드 단백질.
  52. 제51항에 있어서, 항체 또는 그의 일부는 SpyCatcher에 융합되는, AAV 캡시드 단백질.
  53. 제51항 또는 제52항에 있어서, 항체 또는 그의 일부는 C-말단에서 링커에 융합되고, 링커는 링커의 C-말단에서 SpyCatcher에 융합되는, AAV 캡시드 단백질.
  54. 제53항에 있어서, 링커는 서열번호 49(GSGESG)로서 제시된 서열을 포함하는, AAV 캡시드 단백질.
  55. 제38항 내지 제54항 중 어느 한 항에 있어서, 검출 가능한 표지는 서열번호 45로서 제시된 아미노산 서열을 포함하는 B1 에피토프를 포함하는, AAV 캡시드 단백질.
  56. 제38항 내지 제55항 중 어느 한 항에 있어서, 상기 비영장류 동물 AAV는 표 2에 열거된 비영장류 AAV인, AAV 캡시드 단백질.
  57. 제38항 내지 제56항 중 어느 한 항에 있어서, 비영장류 AAV는 조류 AAV(AAAV), 바다 사자 AAV, 또는 턱수염 도마뱀 AAV인, AAV 캡시드 단백질.
  58. 제38항 내지 제57항 중 어느 한 항에 있어서, 비영장류 동물 AAV는 AAAV인, AAV 캡시드 단백질.
  59. 제38항 내지 제58항 중 어느 한 항에 있어서, 변형은 AAAV의 VP1 캡시드 단백질의 위치 I444 또는 I580에서의 변형인, AAV 캡시드 단백질.
  60. 제38항 내지 제56항 중 어느 한 항에 있어서, 비영장류 동물 AAV는 유린류 AAV인, AAV 캡시드 단백질.
  61. 제38항 내지 제56항 및 제60항 중 어느 한 항에 있어서, 유린류 AAV는 턱수염 도마뱀 AAV인, AAV 캡시드 단백질.
  62. 제38항 내지 제56항 및 제60항 내지 제61항 중 어느 한 항에 있어서, 변형은 턱수염 도마뱀 AAV의 VP1 캡시드 단백질의 위치 I573 또는 I436에서의 변형인, AAV 캡시드 단백질.
  63. 제38항 내지 제56항 중 어느 한 항에 있어서, 비영장류 동물 AAV는 포유류 AAV인, AAV 캡시드 단백질.
  64. 제38항 내지 제56항 및 제63항 중 어느 한 항에 있어서, 포유류 AAV는 바다 사자 AAV인, AAV 캡시드 단백질.
  65. 제38항 내지 제56항 및 제63항 내지 제64항 중 어느 한 항에 있어서, 변형은 바다 사자 AAV의 VP1의 I429, I430, I431, I432, I433, I434, I436, I437, 및 A565로 이루어진 군으로부터 선택된 위치에서의 변형인, AAV 캡시드 단백질.
  66. 제38항 내지 제65항 중 어느 한 항에 있어서, 다음으로 이루어진 군으로부터 선택된 아미노산 서열을 포함하는, AAV 캡시드 단백질:
    (a) 서열번호 2로 제시된 아미노산 서열,
    (b) 서열번호 4로 제시된 아미노산 서열,
    (c) 서열번호 6으로 제시된 아미노산 서열,
    (d) 서열번호 8로서 제시된 아미노산 서열,
    (e) 서열번호 10으로서 제시된 아미노산 서열,
    (f) 서열번호 12로서 제시된 아미노산 서열,
    (g) 서열번호 14로서 제시된 아미노산 서열,
    (h) 서열번호 16으로서 제시된 아미노산 서열,
    (i) 서열번호 18로서 제시된 아미노산 서열,
    (j) 서열번호 20으로서 제시된 아미노산 서열;
    (k) 서열번호 22로서 제시된 아미노산 서열,
    (l) 서열번호 24로서 제시된 아미노산 서열,
    (m) 서열번호 26으로서 제시된 아미노산 서열;
    (n) 서열번호 28로서 제시된 아미노산 서열,
    (o) 서열번호 30으로서 제시된 아미노산 서열,
    (p) 서열번호 32로서 제시된 아미노산 서열,
    (q) 서열번호 34로서 제시된 아미노산 서열;
    (r) 서열번호 36으로서 제시된 아미노산 서열,
    (s) 서열번호 53으로서 제시된 아미노산 서열,
    (t) 서열번호 55로서 제시된 아미노산 서열,
    (u) 서열번호 57로서 제시된 아미노산 서열,
    (v) 서열번호 59로서 제시된 아미노산 서열,
    (w) 서열번호 61로서 제시된 아미노산 서열,
    (x) 서열번호 63으로서 제시된 아미노산 서열,
    (y) 서열번호 65로서 제시된 아미노산 서열,
    (z) 서열번호 67로서 제시된 아미노산 서열,
    (aa) 서열번호 69로서 제시된 아미노산 서열,
    (bb) 서열번호 71로서 제시된 아미노산 서열,
    (cc) 서열번호 2, 서열번호 4, 서열번호 6, 서열번호 8, 서열번호 10, 서열번호 12, 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26, 서열번호 28, 서열번호 30, 서열번호 32, 서열번호 34, 서열번호 36, 서열번호 53, 서열번호 55, 서열번호 57, 서열번호 59, 서열번호 61, 서열번호 63, 서열번호 65, 서열번호 67, 서열번호 69, 또는 서열번호 71과 상당한 서열 동일성을, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열, 및
    (dd) (a)~(cc) 중 어느 하나에 제시된 아미노산 서열의 임의의 VP2 및/또는 VP3 부분의 아미노산 서열.
  67. 제38항 내지 제66항 중 어느 한 항에 있어서, 단백질:단백질 결합 쌍의 제1 구성원은 검출 가능한 표지를 포함하는, AAV 캡시드 단백질.
  68. 제67항에 있어서, 검출 가능한 표지는 c-myc(서열번호 44)를 포함하는, AAV 캡시드 단백질.
  69. 제38항 내지 제68항 중 어느 한 항의 AAV 캡시드 단백질을 포함하는 AAV 입자.
  70. 제38항 내지 제68항 중 어느 한 항의 AAV 캡시드 단백질을 암호화하는 cap 유전자를 포함하는 핵산 분자.
  71. AAV VP1 캡시드 단백질, AAV VP2 캡시드 단백질, 및/또는 AAV VP3 캡시드 단백질을 암호화하는 AAV cap 유전자를 포함하는 핵산 분자로서,
    AAV cap 유전자 또는 이의 일부는 비영장류 동물 AAV 또는 이의 일부 또는 원격 AAV 또는 이의 일부의 cap 유전자의 핵산 서열과 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 핵산 서열을 포함하고,
    AAV cap 유전자는 다음을 포함하도록 추가로 변형되는, 핵산 분자:
    (a) 단백질:단백질 결합 쌍의 제1 구성원을 암호화하는 뉴클레오티드 서열,
    (b) 검출 가능한 표지를 암호화하는 뉴클레오티드 서열,
    (c) 점돌연변이,
    (d) 키메라 뉴클레오티드 서열, 또는
    (e) (a), (b), (c), 및 (d)의 임의의 조합.
  72. AAV rep 유전자 및 AAV cap 유전자를 포함하는 핵산 분자로서,
    전체 AAV cap 유전자는 비영장류 동물 AAV 또는 원격 AAV의 cap 유전자의 핵산 서열과 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 제1 핵산 서열을 포함하고,
    AAV rep 유전자 또는 이의 일부는 제2 AAV 또는 이의 일부의 rep 유전자의 핵산 서열과 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 제2 핵산 서열을 포함하고,
    비영장류 동물 AAV는 제2 AAV와 동일하지 않은, 핵산 분자.
  73. 제70항 내지 제72항 중 어느 한 항에 있어서, cap 유전자는 프로모터에 작동 가능하게 연결되는, 핵산 분자.
  74. 제73항에 있어서, 상기 프로모터는 포장 세포에서 캡시드 단백질(들)의 발현을 유도하는, 핵산 분자.
  75. 제73항 또는 제74항에 있어서, 프로모터는 p40, SV40, EF, CMV, B19p6, 및 CAG로부터 선택되는, 핵산 분자.
  76. 제70항 내지 제75항 중 어느 한 항에 있어서, AAV cap 유전자는 다음을 포함하도록 변형되는, 핵산 분자:
    (a) 단백질:단백질 결합 쌍의 적어도 제1 구성원을 암호화하는 뉴클레오티드 서열,
    (b) 검출 가능한 표지를 암호화하는 뉴클레오티드 서열, 및/또는
    (c) 점 돌연변이를 암호화하는 뉴클레오티드 서열.
  77. 제76항에 있어서, 단백질:단백질 결합 쌍은 SpyTag:SpyCatcher, SpyTag:KTag, Isopeptag:pilin-C, SnoopTag:SnoopCatcher, 및 SpyTag002:SpyCatcher002로부터 선택되는, 핵산 분자.
  78. 제76항에 있어서, 단백질:단백질 결합 쌍의 제1 구성원은 서열번호 44로서 제시된 서열을 포함하는 c-myc를 포함하는, 핵산 분자.
  79. 제76항 내지 제78항 중 어느 한 항에 있어서, 검출 가능한 표지는 IGTRYLTR(서열번호 45)의 아미노산 서열을 포함하는 B1 에피토프를 포함하는, 핵산 분자.
  80. 제70항 내지 제79항 중 어느 한 항에 있어서, cap 유전자는 VP3 캡시드 단백질을 암호화하고, VP3 캡시드 단백질 또는 이의 일부는 비영장류 동물 AAV의 VP3 캡시드 단백질의 아미노산 서열과 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하는, 핵산 분자.
  81. 제70항 내지 제80항 중 어느 한 항에 있어서, cap 유전자는 VP2 캡시드 단백질을 암호화하고, VP2 캡시드 단백질 또는 이의 일부는 비영장류 동물 AAV의 VP2 캡시드 단백질의 아미노산 서열과 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하는, 핵산 분자.
  82. 제70항 내지 제81항 중 어느 한 항에 있어서, cap 유전자는 VP1 캡시드 단백질을 암호화하고, VP1 캡시드 단백질 또는 이의 일부는 비영장류 동물 AAV의 VP1 캡시드 단백질의 아미노산 서열과 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하는, 핵산 분자.
  83. 제70항 내지 제82항 중 어느 한 항에 있어서, cap 유전자는 다음을 암호화하는, 핵산 분자:
    (i) 다음 중 어느 하나를 포함하는 VP1 캡시드 단백질:
    키메라 아미노산 서열(임의로, 키메라 AAV VP1 캡시드 단백질의 VP1-고유 영역(VP1-u)은 제2 AAV의 VP1-u의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하고, 키메라 AAV VP1 캡시드의 VP1/VP2 공통 영역 및 VP3 영역은 비영장류 동물 AAV의 VP1/VP2 공통 영역 및 VP3 영역의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함함), 및
    비영장류 동물 AAV의 VP1 캡시드 단백질에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열,
    (ii) 다음 중 어느 하나를 포함하는 VP2 캡시드 단백질:
    키메라 아미노산 서열(임의로, 키메라 AAV VP2 캡시드 단백질의 VP1/VP2 공통 영역은 제2 AAV의 VP1/VP2 공통 영역의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하고, 키메라 VP2 캡시드 단백질의 VP3 영역은 비영장류 동물 AAV의 VP3 영역에 대해 적어도 상당한 서용 동일성, 예를 들어 95% 동일성을 갖는 아미노산 서열을 포함함), 또는
    비영장류 동물 AAV의 VP2 캡시드 단백질에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열, 및/또는
    (iii) 비영장류 동물 AAV의 VP3 캡시드 단백질의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하는 VP3 캡시드 단백질.
  84. 제70항 내지 제83항 중 어느 한 항에 있어서, cap 유전자는 다음을 암호화하는, 핵산 분자:
    (i) 키메라 아미노산 서열을 포함하는 VP1 캡시드 단백질(임의로, 키메라 AAV VP1 캡시드 단백질의 VP1-고유 영역(VP1-u)은 제2 AAV의 VP1-u의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하고, 키메라 AAV VP1 캡시드의 VP1/VP2 공통 영역 및 VP3 영역은 비영장류 동물 AAV의 VP1/VP2 공통 영역 및 VP3 영역의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함함),
    (ii) 키메라 아미노산 서열을 포함하는 VP2 캡시드 단백질(임의로, 키메라 AAV VP22 캡시드 단백질의 VP1/VP2 공통 영역은 제2 AAV의 VP1/VP2 공통 영역의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하고, 키메라 VP2 캡시드 단백질의 VP3 영역은 비영장류 동물 AAV의 VP3 영역의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함함), 및/또는
    (iii) 비영장류 동물 AAV의 VP3 캡시드 단백질의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하는 VP3 캡시드 단백질.
  85. 다음을제70항 내지 제84항 중 어느 한 항에 있어서, cap 유전자는 다음을 암호화하는, 핵산 분자:
    (i) 키메라 아미노산 서열을 포함하는 VP1 캡시드 단백질(임의로, 키메라 AAV VP1 캡시드 단백질의 VP1-고유 영역(VP1-u)은 제2 AAV의 VP1-u의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하고, 키메라 AAV VP1 캡시드의 VP1/VP2 공통 영역 및 VP3 영역은 비영장류 동물 AAV의 VP1/VP2 공통 영역 및 VP3 영역의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함함),
    (ii) 비영장류 동물 AAV의 VP2 캡시드 단백질에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하는 VP2 캡시드 단백질, 및
    (iii) 비영장류 동물 AAV의 VP3 캡시드 단백질의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하는 VP3 캡시드 단백질.
  86. 제70항 내지 제83항 중 어느 한 항에 있어서, cap 유전자는 다음을 암호화하는, 핵산 분자:
    (i) 비영장류 동물 AAV의 VP1 캡시드 단백질에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하는 VP1 캡시드 단백질,
    (ii) 비영장류 동물 AAV의 VP2 캡시드 단백질에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하는 VP2 캡시드 단백질, 및
    (iii) 비영장류 동물 AAV의 VP3 캡시드 단백질의 아미노산 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95% 동일성을 갖는 아미노산 서열을 포함하는 VP3 캡시드 단백질.
  87. 제70항 내지 제86항 중 어느 한 항에 있어서, 제2 AAV는 영장류 AAV이거나 영장류 AAV의 조합인, 핵산 분자.
  88. 제70항 내지 제87항 중 어느 한 항에 있어서, 제2 AAV는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, 및 이들의 조합으로 이루어진 군으로부터 선택되는, 핵산 분자.
  89. 제70항 내지 제88항 중 어느 한 항에 있어서, 제2 AAV는 AAV2인, 핵산 분자.
  90. 제70항 내지 제89항 중 어느 한 항에 있어서, 비영장류 동물 AAV는 표 2에 열거된 비영장류 AAV로부터 선택된 비영장류 AAV인, 핵산 분자.
  91. 제70항 내지 제90항 중 어느 한 항에 있어서, 비영장류 AAV는 조류 AAV, 바다 사자 AAV, 또는 턱수염 도마뱀 AAV인, 핵산 분자.
  92. 제70항 내지 제91항 중 어느 한 항에 있어서, 비영장류 동물 AAV는 AAAV인, 핵산 분자.
  93. 제70항 내지 제92항 중 어느 한 항에 있어서, 변형은 AAAV의 VP1 캡시드 단백질의 위치 I444 또는 I580을 암호화하는 코돈에서의 변형인, 핵산 분자.
  94. 제70항 내지 제91항 중 어느 한 항에 있어서, 비영장류 동물 AAV는 유린류 AAV인, 핵산 분자.
  95. 제70항 내지 제91항 및 제94항 중 어느 한 항에 있어서, 유린류 AAV는 턱수염 도마뱀 AAV인, 핵산 분자.
  96. 제70항 내지 제91항 및 제94항 내지 제95항 중 어느 한 항에 있어서, 변형은 턱수염 도마뱀 AAV의 VP1 캡시드 단백질의 위치 I573 또는 I436을 암호화하는 코돈에서의 변형인, 핵산 분자.
  97. 제70항 내지 제91항 중 어느 한 항에 있어서, 비영장류 동물 AAV는 포유류 AAV인, 핵산 분자.
  98. 제70항 내지 제91항 및 제97항 중 어느 한 항에 있어서, 포유류 AAV는 바다 사자 AAV인, 핵산 분자.
  99. 제70항 내지 제91항 및 제97항 내지 제98항 중 어느 한 항에 있어서, 변형은 바다 사자 AAV의 VP1의 I429, I430, I431, I432, I433, I434, I436, I437, 및 A565로 이루어진 군으로부터 선택된 위치에서의 변형인, 핵산 분자.
  100. 제70항 내지 제99항 중 어느 한 항에 있어서, 다음으로 이루어진 군으로부터 선택된 뉴클레오티드 서열을 포함하는, 핵산 분자:
    (a) 서열번호 1로서 제시된 뉴클레오티드 서열,
    (b) 서열번호 3으로서 제시된 뉴클레오티드 서열,
    (c) 서열번호 5로서 제시된 뉴클레오티드 서열,
    (d) 서열번호 7로서 제시된 뉴클레오티드 서열,
    (e) 서열번호 9로서 제시된 뉴클레오티드 서열,
    (f) 서열번호 11로서 제시된 뉴클레오티드 서열,
    (g) 서열번호 13으로서 제시된 뉴클레오티드 서열,
    (h) 서열번호 15로서 제시된 뉴클레오티드 서열;
    (i) 서열번호 17로서 제시된 뉴클레오티드 서열,
    (j) 서열번호 19로서 제시된 뉴클레오티드 서열,
    (k) 서열번호 21로서 제시된 뉴클레오티드 서열,
    (l) 서열번호 23으로서 제시된 뉴클레오티드 서열,
    (m) 서열번호 25로서 제시된 뉴클레오티드 서열,
    (n) 서열번호 27로서 제시된 뉴클레오티드 서열,
    (o) 서열번호 29로서 제시된 뉴클레오티드 서열,
    (p) 서열번호 31로서 제시된 뉴클레오티드 서열,
    (q) 서열번호 33으로서 제시된 뉴클레오티드 서열,
    (r) 서열번호 35로서 제시된 뉴클레오티드 서열,
    (s) 서열번호 52로서 제시된 뉴클레오티드 서열,
    (t) 서열번호 54로서 제시된 뉴클레오티드 서열
    (u) 서열번호 56으로서 제시된 뉴클레오티드 서열
    (v) 서열번호 58로서 제시된 뉴클레오티드 서열
    (w) 서열번호 60으로서 제시된 뉴클레오티드 서열
    (x) 서열번호 62로서 제시된 뉴클레오티드 서열
    (y) 서열번호 64로서 제시된 뉴클레오티드 서열
    (z) 서열번호 66으로서 제시된 뉴클레오티드 서열
    (aa) 서열번호 68로서 제시된 뉴클레오티드 서열
    (bb) 서열번호 70으로서 제시된 뉴클레오티드 서열
    (cc) VP2 캡시드를 암호화하는 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 또는 이의 어느 하나에 제시된 뉴클레오티드 서열에 대해 상당한 서열 동일성, 예를 들어 적어도 95%의 동일성을 갖는 뉴클레오티드 서열,
    (dd) VP2 캡시드 단백질 및/또는 VP3 캡시드 단백질을 암호화하는 (a)~(s)의 뉴클레오티드 서열의 임의의 일부.
  101. 제70항 내지 제100항 중 어느 한 항에 있어서, 하나 이상의 AAV Rep 단백질을 암호화하고 프로모터에 작동 가능하게 연결되는 AAV rep 유전자를 추가로 포함하는, 핵산 분자.
  102. 제101항에 있어서, 프로모터는 p5, p19 SV40, EF, CMV, B19p6, 및 CAG로 이루어진 군으로부터 선택되는, 핵산 분자.
  103. 제101항 또는 제102항에 있어서, 하나 이상의 Rep 단백질은 Rep78, Rep68, Rep52, 및 Rep40으로부터 선택되는, 핵산 분자.
  104. 제101항 내지 제103항 중 어느 한 항에 있어서, 하나 이상의 Rep 단백질은 Rep78을 포함하는, 핵산 분자.
  105. 제101항 내지 제104항 중 어느 한 항에 있어서, 하나 이상의 Rep 단백질은 영장류 동물 AAV Rep 단백질인, 핵산 분자.
  106. 제70항 내지 제105항 중 어느 한 항의 핵산 분자에 의해 암호화된 아미노산 서열을 포함하는 AAV 캡시드 단백질.
  107. 제106항의 캡시드 단백질을 포함하는 AAV 입자.
  108. 제70항 내지 제105항 중 어느 한 항의 핵산 분자를 포함하는 AAV 입자를 생산하기 위한 포장 세포.
  109. 제108항에 있어서, 하나 이상의 AAV Rep 단백질을 암호화하는 rep 유전자를 포함하는 핵산 분자를 포함하되, 상기 rep 유전자는 프로모터에 작동 가능하게 연결되고, 임의로 rep 유전자 및 cap 유전자는 2개의 상이한 AAV의 유전자인, 포장 세포.
  110. 제109항에 있어서, rep 유전자에 작동 가능하게 연결된 프로모터는 포장 세포에서 Rep 단백질(들)의 발현을 유도하는, 포장 세포.
  111. 제109항 또는 제110항에 있어서, 프로모터는 p5, p19, SV40, EF, CMV, B19p6, 및 CAG로부터 선택되는, 포장 세포.
  112. 제109항 내지 제111항 중 어느 한 항에 있어서, 하나 이상의 Rep 단백질은 Rep78, Rep68, Rep52, 및 Rep40으로부터 선택되는, 포장 세포.
  113. 제109항 내지 제112항 중 어느 한 항에 있어서, 하나 이상의 Rep 단백질은 Rep78을 포함하는, 포장 세포.
  114. 제109항 내지 제113항 중 어느 한 항에 있어서, 하나 이상의 Rep 단백질은 영장류 동물 AAV Rep 단백질인, 포장 세포.
  115. 제109항 내지 제114항 중 어느 한 항에 있어서, 하나 이상의 Rep 단백질은 비영장류 동물 AAV Rep 단백질인, 포장 세포.
  116. 제109항 내지 제115항 중 어느 한 항에 있어서, 하나 이상의 Rep 단백질에 의해 인식되는 적어도 하나의 AAV 역위 말단 반복(ITR)이 적어도 일측에 위치하는 관심 뉴클레오티드의 뉴클레오티드 서열을 포함하는 핵산 분자를 추가로 포함하는, 포장 세포.
  117. 제116항에 있어서, 뉴클레오티드의 타측에는 적어도 하나의 ITR과 동일한 AAV의 제2 ITR이 위치하는, 포장 세포.
  118. 제117항에 있어서, 뉴클레오티드의 타측에는 제2 ITR이 위치하고, 제2 ITR 및 적어도 하나의 ITR은 상이한 AAV의 ITR인, 포장 세포.
  119. 제116항 내지 제118항 중 어느 한 항에 있어서, 관심 뉴클레오티드는 리포터 유전자인, 포장 세포.
  120. 제119항에 있어서, 리포터 유전자는 β-갈락토시다아제, 녹색 형광 단백질(GFP), 강화된 녹색 형광 단백질(eGFP), MmGFP, 청색 형광 단백질(BFP), 강화된 청색 형광 단백질(eBFP), mPlum, mCherry, tdTomato, mStrawberry, J-Red, DsRed, mOrange, mKO, mCitrine, Venus, YPet, 황색 형광 단백질(YFP), 강화된 황색 형광 단백질(eYFP), 에머랄드(Emerald), CyPet, 홍색 형광 단백질(CFP), 진청색(Cerulean), T-Sapphire, 루시퍼라제(luciferase), 알칼리 포스파타아제(alkaline phosphatase), 또는 이들의 조합을 암호화하는, 포장 세포.
  121. 제116항 내지 제118항 중 어느 한 항에 있어서, 관심 뉴클레오티드는 치료 단백질, 자살 유전자, 항체 또는 이의 단편, CRISPR/Cas 시스템 또는 이의 일부(들), 안티센스 올리고뉴클레오티드, 리보자임, RNAi 분자, 또는 shRNA 분자를 암호화하는, 포장 세포.
  122. 제108항 내지 제121항 중 어느 한 항에 있어서, 기준 캡시드 단백질을 암호화하는 뉴클레오티드 서열을 추가로 포함하는, 포장 세포.
  123. 바이러스 입자를 생산하는 방법으로서, 바이러스 입자를 생산하기에 충분한 조건에서 제108항 내지 제122항 중 어느 한 항에 따른 포장 세포를 배양하는 단계를 포함하는, 방법.
  124. 제123항에 있어서, 포장 세포는 관심 뉴클레오티드를 포함하는 헬퍼 플라스미드 및/또는 전달 플라스미드를 추가로 포함하는, 방법.
  125. 제123항 또는 제124항에 있어서, 다음 단계 중 하나 이상을 추가로 포함하되
    a. 세포 찌꺼기를 제거하는 단계,
    b. 바이러스 입자를 함유하는 상청액을 벤조나아제 또는 DNase I 및 MgCl2로 처리하는 단계,
    c. 바이러스 입자를 농축시키는 단계,
    d. 바이러스 입자를 정제하는 단계, 및
    e. a 내지 d의 임의의 조합,
    임의로, 바이러스 입자는 자가-상보성 아데노-연관 바이러스 입자이고/이거나 배양 상청액으로부터 단리되는, 방법.
  126. 제123항 내지 제125항 중 어느 한 항의 방법에 따라 제조된 AAV 입자.
  127. 제1항 내지 제37항, 제69항, 제107항, 및 제126항 중 어느 한 항에 있어서, 관심 뉴클레오티드를 포함하는, AAV 입자.
  128. 제127항에 있어서, 관심 뉴클레오티드는 리포터 유전자인, AAV 입자.
  129. 제128항에 있어서, 리포터 유전자는 β-갈락토시다아제, 녹색 형광 단백질(GFP), 강화된 녹색 형광 단백질(eGFP), MmGFP, 청색 형광 단백질(BFP), 강화된 청색 형광 단백질(eBFP), mPlum, mCherry, tdTomato, mStrawberry, J-Red, DsRed, mOrange, mKO, mCitrine, Venus, YPet, 황색 형광 단백질(YFP), 강화된 황색 형광 단백질(eYFP), 에머랄드(Emerald), CyPet, 홍색 형광 단백질(CFP), 진청색(Cerulean), T-Sapphire, 루시퍼라제(luciferase), 알칼리 포스파타아제(alkaline phosphatase), 또는 이들의 조합을 암호화하는, AAV 입자.
  130. 제127항에 있어서, 관심 뉴클레오티드는 치료 단백질, 자살 유전자, 항체 또는 이의 단편, CRISPR/Cas 시스템 또는 이의 일부(들), 안티센스 올리고뉴클레오티드, 리보자임, RNAi 분자, 또는 shRNA 분자를 암호화하는, AAV 입자.
  131. 약학적 조성물로서, (a) 제1항 내지 제37항, 제69항, 제107항, 및 제126항 내지 제130항 중 어느 한 항에 따른 AAV 입자, 제38항 내지 제68항 및 제106항 중 어느 한 항에 따른 AAV 캡시드 단백질을 포함하는 AAV 입자, 또는 제123항 내지 제125항 중 어느 한 항의 방법에 따라 제조된 AAV 입자; 및 (b) 약학적으로 허용 가능한 담체 또는 부형제를 포함하는 약학적 조성물.
  132. 표적 세포에 관심 뉴클레오티드를 전달하는 방법으로서, (a) 제1항 내지 제37항, 제69항, 제107항, 및 제126항 내지 제130항 중 어느 한 항에 따른 AAV 입자, 제38항 내지 제68항 및 제106항 중 어느 한 항에 따른 AAV 캡시드 단백질을 포함하는 AAV 입자, 또는 제123항 내지 제125항 중 어느 한 항의 방법에 따라 제조된 AAV 입자, 또는 (b) 제131항의 조성물과 표적 세포를 접촉시키는 단계를 포함하는, 방법.
  133. 제132항에 있어서, AAV 입자의 캡시드는 표적 세포 표면에서 발현되는 단백질에 특이적으로 결합하는 표적화 리간드를 포함하는, 방법.
  134. 제132항 또는 제133항에 있어서, 접촉시키는 단계는 생체 외에서 수행되는, 방법.
  135. 제132항 또는 제133항에 있어서, 표적 세포는 대상체의 생체 내에 있는, 방법.
  136. 136. 제135항에 있어서, 대상체는 영장류 동물, 바람직하게는 인간인, 방법.
  137. 제132항 내지 제136항 중 어느 한 항에 있어서, 표적 세포는 인간 세포인, 방법.
  138. 제132항 내지 제137항 중 어느 한 항에 있어서, 관심 뉴클레오티드는 치료 단백질, 자살 유전자, 항체 또는 이의 단편, CRISPR/Cas 시스템 또는 이의 일부(들), 안티센스 올리고뉴클레오티드, 리보자임, RNAi 분자, 또는 shRNA 분자를 암호화하는, 방법.
KR1020217041074A 2019-05-24 2020-05-22 변형된 바이러스 입자 및 이의 용도 KR20220011664A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962852791P 2019-05-24 2019-05-24
US62/852,791 2019-05-24
PCT/US2020/034328 WO2020242984A1 (en) 2019-05-24 2020-05-22 Modified viral particles and uses thereof

Publications (1)

Publication Number Publication Date
KR20220011664A true KR20220011664A (ko) 2022-01-28

Family

ID=71094822

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217041074A KR20220011664A (ko) 2019-05-24 2020-05-22 변형된 바이러스 입자 및 이의 용도

Country Status (18)

Country Link
US (1) US20220241430A1 (ko)
EP (1) EP3976631A1 (ko)
JP (1) JP2022533438A (ko)
KR (1) KR20220011664A (ko)
CN (2) CN113874386A (ko)
AR (2) AR118997A1 (ko)
AU (1) AU2020283537A1 (ko)
BR (1) BR112021023692A2 (ko)
CA (1) CA3140386A1 (ko)
CL (2) CL2021003096A1 (ko)
CO (1) CO2021017692A2 (ko)
IL (1) IL288233A (ko)
MA (1) MA56035A (ko)
MX (1) MX2021014338A (ko)
PE (1) PE20212357A1 (ko)
SG (1) SG11202112917PA (ko)
TW (1) TW202110869A (ko)
WO (1) WO2020242984A1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3976631A1 (en) * 2019-05-24 2022-04-06 Regeneron Pharmaceuticals, Inc. Modified viral particles and uses thereof
WO2022187377A1 (en) * 2021-03-02 2022-09-09 University Of Pittsburgh - Of The Commonwealth System Of Higher Education Adeno-associated viruses and methods and materials for making and using adeno-associated viruses
EP4314021A1 (en) * 2021-04-30 2024-02-07 Duke University Compositions comprising adeno-associated virus chimera capsid proteins and methods of using the same
CN117957325A (zh) * 2021-06-23 2024-04-30 迪诺治疗公司 衣壳变体及其使用方法
WO2023220603A1 (en) 2022-05-09 2023-11-16 Regeneron Pharmaceuticals, Inc. Vectors and methods for in vivo antibody production
WO2023240124A1 (en) 2022-06-07 2023-12-14 Regeneron Pharmaceuticals, Inc. Pseudotyped viral particles for targeting tcr-expressing cells

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0840797B1 (en) 1995-07-25 2014-09-03 Crucell Holland B.V. Methods and means for targeted gene delivery
AU4645697A (en) 1996-09-11 1998-04-02 Government Of The United States Of America, As Represented By The Secretary Of The Department Of Health And Human Services, The Aav4 vector and uses thereof
US6156303A (en) 1997-06-11 2000-12-05 University Of Washington Adeno-associated virus (AAV) isolates and AAV vectors derived therefrom
JP4060531B2 (ja) 1998-05-28 2008-03-12 アメリカ合衆国 Aav5ベクターおよびその使用
JP4573437B2 (ja) 1998-11-05 2010-11-04 ザ・トラステイーズ・オブ・ザ・ユニバーシテイ・オブ・ペンシルベニア アデノ随伴ウイルス血清型1核酸配列、ベクターおよび同一物を含有する宿主細胞
NZ532635A (en) * 2001-11-13 2007-05-31 Univ Pennsylvania A method of identifying unknown adeno-associated virus (AAV) sequences and a kit for the method
US20100203083A1 (en) 2007-05-31 2010-08-12 Medigene Ag Mutated structural protein of a parvovirus
LT2954779T (lt) 2009-12-10 2019-05-27 Regeneron Pharmaceuticals, Inc. Pelės, gaminančios sunkiosios grandinės antikūnus
GB201002362D0 (en) 2010-02-11 2010-03-31 Isis Innovation Peptide tag systems that spontaneously form an irreversible link to protein partners via isopeptide bonds
CN106459984B (zh) * 2014-03-10 2021-09-07 优尼科Ip有限公司 昆虫细胞中产生的进一步改善的aav载体
KR20210088756A (ko) 2014-03-21 2021-07-14 리제너론 파마슈티칼스 인코포레이티드 단일 도메인 결합 단백질을 생산하는 비-인간 동물
WO2015191508A1 (en) * 2014-06-09 2015-12-17 Voyager Therapeutics, Inc. Chimeric capsids
JP7372154B2 (ja) 2017-06-27 2023-10-31 リジェネロン・ファーマシューティカルズ・インコーポレイテッド 遺伝物質をヒト細胞に標的化して導入するための指向性改変組換えウイルスベクターおよびその使用
SG11201911614XA (en) * 2017-06-27 2020-01-30 Regeneron Pharma Tropism-modified recombinant viral particles and uses thereof for the targeted introduction of genetic material into human cells
EP3976631A1 (en) * 2019-05-24 2022-04-06 Regeneron Pharmaceuticals, Inc. Modified viral particles and uses thereof

Also Published As

Publication number Publication date
BR112021023692A2 (pt) 2022-01-04
CL2021003096A1 (es) 2022-09-20
AR124119A2 (es) 2023-02-15
TW202110869A (zh) 2021-03-16
US20220241430A1 (en) 2022-08-04
CL2023000629A1 (es) 2023-10-20
MX2021014338A (es) 2022-01-06
WO2020242984A1 (en) 2020-12-03
AU2020283537A1 (en) 2021-12-16
WO2020242984A9 (en) 2021-01-14
MA56035A (fr) 2022-04-06
JP2022533438A (ja) 2022-07-22
CN114989267A (zh) 2022-09-02
AR118997A1 (es) 2021-11-17
SG11202112917PA (en) 2021-12-30
PE20212357A1 (es) 2021-12-17
IL288233A (en) 2022-01-01
CO2021017692A2 (es) 2022-01-17
CN113874386A (zh) 2021-12-31
CA3140386A1 (en) 2020-12-03
EP3976631A1 (en) 2022-04-06

Similar Documents

Publication Publication Date Title
KR20220011664A (ko) 변형된 바이러스 입자 및 이의 용도
KR20200021987A (ko) 유전 물질을 인간 세포 내로 표적화하여 도입하기 위한 향성-변형 재조합 바이러스 입자 및 이의 용도
KR20220012231A (ko) 완전-인간 번역 후 변형된 항체 치료제
AU2018290882B2 (en) Tropism-modified recombinant viral vectors and uses thereof for the targeted introduction of genetic material into human cells
JP7410522B2 (ja) 抗fam19a5抗体のアデノ関連ウイルス(aav)伝達
JP6731933B2 (ja) Pcsk9抗体、及び医薬組成物とその使用
KR20230093437A (ko) 안구 적응증을 위한 벡터화된 항-TNF-α 항체
KR20230154074A (ko) 이중 바이러스 벡터 시스템을 이용한 항체 전달
RU2811426C2 (ru) Рекомбинантные вирусные частицы с модифицированным тропизмом и пути их применения для нацеленного введения генетического материала в клетки человека
CN115772544B (zh) 抗vegf-a和ang-2的aav载体
CA3233698A1 (en) Viral particles retargeted to skeletal muscle
WO2024026494A1 (en) Viral particles retargeted to transferrin receptor 1

Legal Events

Date Code Title Description
A201 Request for examination