CN114269926A - Aav工程化 - Google Patents

Aav工程化 Download PDF

Info

Publication number
CN114269926A
CN114269926A CN202080044908.6A CN202080044908A CN114269926A CN 114269926 A CN114269926 A CN 114269926A CN 202080044908 A CN202080044908 A CN 202080044908A CN 114269926 A CN114269926 A CN 114269926A
Authority
CN
China
Prior art keywords
seq
nucleic acid
aav
capsid protein
amino acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080044908.6A
Other languages
English (en)
Inventor
K·麦克戈文
D·S·欧加拉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
San Gamo Treatment Co ltd
Original Assignee
San Gamo Treatment Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by San Gamo Treatment Co ltd filed Critical San Gamo Treatment Co ltd
Publication of CN114269926A publication Critical patent/CN114269926A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • G01N33/502Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics for testing non-proliferative effects
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K7/00Peptides having 5 to 20 amino acids in a fully defined sequence; Derivatives thereof
    • C07K7/04Linear peptides containing only normal peptide links
    • C07K7/08Linear peptides containing only normal peptide links having 12 to 20 amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1058Directional evolution of libraries, e.g. evolution of libraries is achieved by mutagenesis and screening or selection of mixed population of organisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6897Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids involving reporter genes operably linked to promoters
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B20/00Methods specially adapted for identifying library members
    • C40B20/04Identifying library members by means of a tag, label, or other readable or detectable entity associated with the library members, e.g. decoding processes
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14171Demonstrated in vivo effect
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/179Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/185Nucleic acid dedicated to use as a hidden marker/bar code, e.g. inclusion of nucleic acids to mark art objects or animals
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/005Assays involving biological materials from specific organisms or of a specific nature from viruses
    • G01N2333/01DNA viruses
    • G01N2333/075Adenoviridae

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Immunology (AREA)
  • Virology (AREA)
  • Plant Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Ecology (AREA)
  • Cell Biology (AREA)
  • Food Science & Technology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Toxicology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)

Abstract

本公开内容提供了用于开发与天然AAV血清型相比具有所需特性的AAV衣壳的方法和组合物。这些衣壳可用于例如递送基因组工程化分子和基因治疗分子以治疗有此需要的受试者。

Description

AAV工程化
对相关申请的交叉引用
本申请要求于2019年4月26日提交的美国临时申请62/839,421、2019年10月15日提交的美国临时申请62/915,386和2019年11月22日提交的美国临时申请62/939,094的权益和优先权。前述申请中的每一篇均通过引用整体并入本文。
序列表
本申请包含已以ASCII格式以电子方式提交的序列表,其通过引用整体并入本文。所述ASCII副本创建于2020年4月17日,名为000222-0002-WO1_SL.txt,大小为70,821字节。
技术领域
本公开属于与基因组工程和基因治疗相关的分子的递送领域。
背景
人工核酸酶,例如工程化锌指核酸酶(zinc finger nucleases,ZFN)、转录激活因子样效应核酸酶(transcription-activator like effector nucleases,TALEN)、具有工程化crRNA/tracrRNA(‘单向导RNA’)的CRISPR/Cas系统,也称为RNA引导核酸酶,和/或基于Argonaute系统的核酸酶正在彻底改变医学、生物技术和农业领域。这些分子工具使生物体基因组的遗传操作(例如编辑)达到前所未有的水平。此外,临床上正在研究基因疗法(将转基因递送至体内细胞,该转基因在染色体外维持并表达转基因编码的产物),以递送所需的蛋白质,诸如凝血因子和治疗眼部疾病的蛋白质。这些革命性技术之前景取决于将核酸酶系统和/或转基因有效递送到体内的适当组织。
腺相关病毒(Adeno-associated virus,AAV)是一种有前途的体外和体内基因递送载体,用于递送上述核酸酶系统以及与基因治疗相关的载体。AAV有几种天然存在的(“野生型”)血清型和100多种已知的变体,每一种的氨基酸序列都不同,特别是在衣壳蛋白的高变区,因此它们的基因递送特性也不同。AAV尚未发现与任何人类疾病有关,这使得重组AAV对临床应用具有吸引力。AAV还显示出几个额外的有利特征,包括无致病性、低免疫原性和稳定的附加型转基因表达。然而,AAV的使用也存在一些问题,包括混杂的病毒嗜性、绕过生物屏障的能力有限,以及人类受试者中预先存在针对AAV衣壳蛋白之中和抗体的高发生率,这些可能会限制其功效。因此,需要改进AAV设计以充分利用这些新系统。
概述
本公开提供了开发与天然AAV血清型相比具有所需特征的AAV衣壳的方法和组合物。这些衣壳可用于例如递送基因组工程分子和基因治疗分子以治疗有需要的受试者。在一些实施方案中,衣壳用于将有效载荷递送至所需组织、细胞或细胞器。
在第一方面,本公开提供了一种鉴定与天然AAV血清型相比具有所需特征的AAV衣壳变体的方法,包括:(i)将细胞、细胞系或组织与AAV变体文库接触,其中文库的每个成员包含:a)编码AAV变体衣壳蛋白的核酸,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽;和下述一种或多种:b)所述核酸序列中在a)的AAV变体衣壳蛋白中肽插入位点侧翼的一个或多个沉默突变;c)编码定位信号的核酸;d)包含条形码的核酸;e)编码报告蛋白的核酸;(ii)允许所述文库中的AAV变体转导所述细胞、细胞系或组织;(iii)从所述细胞、细胞系或组织中回收AAV变体;(iv)鉴定具有所需特征的AAV衣壳变体。
在一些实施方案中,本文公开的方法中使用的文库的每个成员包含a)编码AAV变体衣壳蛋白的核酸,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,和b)所述核酸序列中在AAV变体衣壳蛋白中的肽插入位点侧翼的一个或多个沉默突变。在一些实施方案中,本文公开的方法中使用的文库的每个成员包含a)编码AAV变体衣壳蛋白的核酸,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,b)所述核酸序列中在AAV变体衣壳蛋白中的肽插入位点侧翼的一个或多个沉默突变,和c)编码定位信号的核酸。在一些实施方案中,本文公开的方法中使用的文库的每个成员包含a)编码AAV变体衣壳蛋白的核酸,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,b)所述核酸序列中在AAV变体衣壳蛋白中的肽插入位点侧翼的一个或多个沉默突变,c)编码定位信号的核酸,和d)包含条形码的核酸。在一些实施方案中,本文公开的方法中使用的文库的每个成员包含a)编码AAV变体衣壳蛋白的核酸,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,b)所述核酸序列中AAV变体衣壳蛋白中的肽插入位点侧翼的一个或多个沉默突变,c)编码定位信号的核酸,d)包含条形码的核酸,和e)编码报告蛋白的核酸。
在一些实施方案中,本文公开的方法中使用的文库的每个成员包含a)编码AAV变体衣壳蛋白的核酸,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,c)编码定位信号的核酸。在一些实施方案中,本文公开的方法中使用的文库的每个成员包含a)编码AAV变体衣壳蛋白的核酸,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,c)编码定位信号的核酸,和d)包含条形码的核酸。在一些实施方案中,本文公开的方法中使用的文库的每个成员包含a)编码AAV变体衣壳蛋白的核酸,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,c)编码定位信号的核酸,和e)编码报告蛋白的核酸。在一些实施方案中,本文公开的方法中使用的文库的每个成员包含a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,c)编码定位信号,d)包含条形码的核酸,和e)编码报告蛋白的核酸。
在一些实施方案中,本文公开的方法中使用的文库的每个成员包含a)编码AAV变体衣壳蛋白的核酸,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,d)包含条形码的核酸。在一些实施方案中,本文公开的方法中使用的文库的每个成员包含a)编码AAV变体衣壳蛋白的核酸,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,和e)编码报告蛋白的核酸。在一些实施方案中,本文公开的方法中使用的文库的每个成员包含a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,和e)编码报告蛋白的核酸。
在第二个方面,本公开提供了一种鉴定与天然AAV血清型相比具有所需特征的AAV衣壳变体的方法,包括:(i)将细胞、细胞系或组织与AAV变体文库接触,其中该文库的每个成员包含:a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽;和下述一种或多种:b)编码a)的AAV变体衣壳蛋白的核酸中的一个或多个沉默突变,其中所述一个或多个沉默突变位于肽插入位点侧翼的核酸序列中;c)编码定位信号的核酸;d)包含条形码的核酸;e)编码报告蛋白的核酸;(ii)允许所述文库中的AAV变体转导细胞、细胞系或组织;(iii)从所述细胞、细胞系或组织中回收AAV变体;(iv)鉴定具有所需特征的AAV衣壳变体。
在一些实施方案中,本文公开的方法中使用的文库的每个成员包含a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,和b)编码a)的AAV变体衣壳蛋白的核酸中的一个或多个沉默突变,其中所述一个或多个沉默突变位于肽插入位点侧翼的核酸序列中。在一些实施方案中,本文公开的方法中使用的文库的每个成员包含a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,和b)编码a)的AAV变体衣壳蛋白的核酸中的一个或多个沉默突变,其中所述一个或多个沉默突变位于肽插入位点侧翼的核酸序列中,和c)编码定位信号的核酸。在一些实施方案中,本文公开的方法中使用的文库的每个成员包含a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,和b)编码a)的AAV变体衣壳蛋白的核酸中的一个或多个沉默突变,其中所述一个或多个沉默突变位于肽插入位点侧翼的核酸序列中,c)编码定位信号的核酸,和d)包含条形码的核酸。在一些实施方案中,本文公开的方法中使用的文库的每个成员包含a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,和b)编码a)的AAV变体衣壳蛋白的核酸中的一个或多个沉默突变,其中所述一个或多个沉默突变位于肽插入位点侧翼的核酸序列中,c)编码定位信号的核酸,d)包含条形码的核酸,和e)编码报告蛋白的核酸。
在一些实施方案中,本文公开的方法中使用的文库的每个成员包含a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,和c)编码定位信号的核酸。在一些实施方案中,本文公开的方法中使用的文库的每个成员包含a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,c)编码定位信号的核酸,和d)包含条形码的核酸。在一些实施方案中,本文公开的方法中使用的文库的每个成员包含a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,c)编码定位信号,和e)编码报告蛋白的核酸。在一些实施方案中,本文公开的方法中使用的文库的每个成员包含a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,c)编码定位信号的核酸,d)包含条形码的核酸,和e)编码报告蛋白的核酸。
在一些实施方案中,本文公开的方法中使用的文库的每个成员包括a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,和d)包含条形码的核酸。在一些实施方案中,本文公开的方法中使用的文库的每个成员包含a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,d)包含条形码的核酸,和e)编码报告蛋白的核酸。在一些实施方案中,本文公开的方法中使用的文库的每个成员包含a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,和e)编码报告蛋白的核酸。
在一些实施方案中,编码AAV变体衣壳蛋白的核酸和编码定位信号的核酸、包含条形码的核酸和/或编码报告蛋白的核酸位于分开的核酸中分子。在其他实施方案中,编码AAV变体衣壳蛋白的核酸、编码定位信号的核酸、包含条形码的核酸和/或编码报告蛋白的核酸位于一个核酸分子中。在一些实施方案中,编码AAV变体衣壳蛋白的核酸和编码定位信号的核酸、包含条形码的核酸和/或编码报告蛋白的核酸以任何顺序彼此连接。在一些实施方案中,文库的每个成员按顺序包含:5’ITR序列、包含条形码的核酸、编码报告蛋白的核酸、编码AAV变体衣壳蛋白的核酸和3’ITR序列。
在一些实施方案中,本文公开的方法中使用的AAV变体文库包含源自两种或更多种AAV血清型的AAV变体衣壳蛋白。在一些实施方案中,所述AAV血清型选自以下的一种或多种:AAV1、AAV2、AAV3B、AAV5、AAV6、AAV8、AAV9、AAV3、AAV4、AAV7、AAV11、AAVrh10、AAVrh39和AAVrh74。
在一些实施方案中,编码报告蛋白的核酸和编码AAV变体衣壳的核酸处于分开的启动子的控制的下。在一些实施方案中,编码报告蛋白的核酸和编码AAV变体衣壳的核酸各自独立地与启动子可操作地连接。
在一些实施方案中,通过本文公开的方法鉴定的AAV衣壳变体的所需特征是增强的细胞或组织嗜性。
在第三个方面,本公开提供了一种鉴定与天然AAV血清型相比具有所需特征的AAV衣壳变体的方法,包括:(i)将多个编码肽的核酸插入到核酸群体中编码AAV衣壳蛋白的高变和/或表面暴露的环的核酸群体中,以创建编码AAV变体衣壳蛋白的核酸文库;(ii)将所述文库中编码AAV变体衣壳蛋白的每个核酸与以下一个或多个连接:(a)包含条形码的核酸,(b)编码报告蛋白的核酸,和(c)编码定位信号的核酸;(iii)通过反式提供腺病毒辅助和AAV rep功能,在生产者细胞中制造AAV变体文库;(iv)纯化AAV变体文库;(v)将细胞、细胞系或组织与AAV变体文库接触;(vi)从靶细胞、细胞系或组织中回收AAV变体;(vii)鉴定具有所需特征的AAV衣壳变体。
在一些实施方案中,在本文公开的方法中使用的所述文库中的编码AAV变体衣壳蛋白的每个核酸与(a)包含条形码的核酸连接。在一些实施方案中,在本文公开的方法中使用的所述文库中编码AAV变体衣壳蛋白的每个核酸与(a)包含条形码的核酸和(b)编码报告蛋白的核酸连接。在一些实施方案中,本文公开的方法中使用的所述文库中编码AAV变体衣壳蛋白的每个核酸与(a)包含条形码的核酸和(c)编码定位信号的核酸连接。在一些实施方案中,本文公开的方法中使用的所述文库中编码AAV变体衣壳蛋白的每个核酸与(a)包含条形码的核酸,(b)编码报告蛋白的核酸,和(c)编码定位信号的核酸连接。在一些实施方案中,在本文公开的方法中使用的所述文库中编码AAV变体衣壳蛋白的每个核酸连接(a)包含条形码的核酸,和(d)肽插入位点侧翼的核酸序列中的一个或多个沉默突变。在一些实施方案中,本文公开的方法中使用的所述文库中编码AAV变体衣壳蛋白的每个核酸连接(a)包含条形码的核酸,(b)编码报告蛋白的核酸,和(d)肽插入位点侧翼的核酸序列中的一个或多个沉默突变。在一些实施方案中,在本文公开的方法中使用的所述文库中编码AAV变体衣壳蛋白的每个核酸连接(a)包含条形码的核酸,(b)编码报告蛋白的核酸,(c)编码定位信号的核酸和(d)在肽插入位点侧翼的核酸序列中的一个或多个沉默突变。
在一些实施方案中,在本文公开的方法中使用的所述文库中编码AAV变体衣壳蛋白的每个核酸与(b)编码报告蛋白的核酸连接。在一些实施方案中,在本文公开的方法中使用的所述文库中编码AAV变体衣壳蛋白的每个核酸与(b)编码报告蛋白的核酸和(c)编码定位信号的核酸连接。在一些实施方案中,本文公开的方法中使用的所述文库中编码AAV变体衣壳蛋白的每个核酸与(c)编码定位信号的核酸连接。在一些实施方案中,编码AAV变体衣壳蛋白的每个核酸在肽插入位点侧翼的核酸序列中还包含一个或多个沉默突变。在一些实施方案中,本文公开的方法中使用的所述文库中编码AAV变体衣壳蛋白的每个核酸连接(b)编码报告蛋白的核酸和(d)肽插入位点侧翼的核酸序列中的一个或多个沉默突变。在一些实施方案中,本文公开的方法中使用的所述文库中编码AAV变体衣壳蛋白的每个核酸连接(c)编码定位信号的核酸和(d)肽插入位点侧翼的核酸序列中的一个或多个沉默突变。在一些实施方案中,在本文公开的方法中使用的所述文库中编码AAV变体衣壳蛋白的每个核酸与(d)肽插入位点侧翼的核酸序列中的一个或多个沉默突变连接。
在一些实施方案中,步骤(iv)还包括组合基于两种或更多种AAV血清型的变体AAV文库以产生单一库。在一些实施方案中,本文公开的方法中使用的编码AAV衣壳蛋白的高变和/或表面暴露的环的核酸序列群包含源自两种或更多种AAV血清型的序列。在一些实施方案中,所述AAV血清型选自以下的一种或多种:AAV1、AAV2、AAV3B、AAV5、AAV6、AAV8、AAV9、AAV3、AAV4、AAV7、AAV11、AAVrh10、AAVrh39和AAVrh74。
在一些实施方案中,本文公开的方法中使用的腺病毒辅助功能包括E2A、E4、VA、E1A和E1B中的一种或多种。在一些实施方案中,AAV rep功能包含rep78、rep 68、rep 52和rep40基因。在一些实施方案中,本文公开的方法中使用的rep78和/或rep68基因的起始密码子从ACG修饰为ATG。在一些实施方案中,本文公开的方法中使用的生产者细胞是HEK293细胞。
在一些实施方案中,将编码AAV变体衣壳蛋白的核酸、包含条形码的核酸、编码报告蛋白的核酸和/或编码本文公开的方法中使用的定位信号的核酸以任何顺序彼此连接。在一些实施方案中,文库的每个成员按下述顺序包含:5’ITR序列、包含条形码的核酸、编码报告蛋白的核酸、编码AAV变体衣壳蛋白的核酸和3’ITR序列。
在一些实施方案中,本文公开的方法中使用的编码报告蛋白的核酸和编码AAV变体衣壳的核酸处于分开的启动子的控制的下。在一些实施方案中,本文公开的方法中使用的编码报告蛋白的核酸和编码AAV变体衣壳的核酸各自独立地与启动子可操作地连接。
在一些实施方案中,AAV衣壳变体的所需特征是增强的细胞或组织嗜性。
在本文公开的方法的一些实施方案中,具有所需特征的AAV衣壳变体通过相关条形码的测序来鉴定。在本文公开的方法的一些实施方案中,具有所需特征的AAV衣壳变体通过相关的一个或多个条形码的测序来鉴定。在一些实施方案中,与启动子可操作地连接的第一条形码识别靶细胞群例如神经元或肝细胞中的条形码化转录物,因为启动子仅在特定细胞群中表达。在一些实施方案中,第二条形码识别所有细胞类型中的表达,因为它与驱动普遍表达的启动子有效连接。
在本文公开的方法的一些实施方案中,通过AAV基因组的纯化和测序鉴定具有所需特征的AAV衣壳变体。
在本文公开的方法的一些实施方案中,所述细胞或组织包括但不限于来自CNS、心脏、肺、气管、食道、肌肉、骨、软骨、胃、胰腺、肠、肝脏、膀胱、肾脏、输尿管、尿道、子宫、输卵管、卵巢、睾丸、前列腺、眼睛、血液、淋巴或口腔粘膜。
在本文公开的方法的一些实施方案中,所述细胞包括但不限于神经元、神经胶质细胞、星形胶质细胞、少突胶质细胞、小神经胶质细胞、雪旺氏细胞、室管膜细胞、肝细胞、星状脂肪储存细胞、枯否氏细胞、肝脏内皮细胞、上皮细胞、心肌细胞、平滑肌细胞、T细胞、B细胞、造血干细胞和胚胎干细胞。
在本文公开的方法的一些实施方案中,相对于编码包含所述插入肽的AAV变体衣壳蛋白的核酸而言,以反式提供下述一种或多种:(i)编码定位信号的核酸;(ii)包含条形码的核酸;和(iii)编码报告蛋白的核酸。在本文公开的方法的一些实施方案中,相对于编码包含所述插入肽的AAV变体衣壳蛋白的核酸而言,均以反式提供i)编码定位信号的核酸;(ii)包含条形码的核酸;(iii)编码报告蛋白的核酸。在本文公开的方法的一些实施方案中,相对于编码包含所述插入肽的AAV变体衣壳蛋白的核酸而言,以顺式提供下述一种或多种:(i)编码定位信号的核酸;(ii)包含条形码的核酸;和(iii)编码报告蛋白的核酸。在本文公开的方法的一些实施方案中,相对于编码包含所述插入肽的AAV变体衣壳蛋白的核酸而言,均以顺式提供i)编码定位信号的核酸;(ii)包含条形码的核酸;和(iii)编码报告蛋白的核酸。
在第四个方面,本公开提供了AAV变体文库,其中所述文库的每个成员包含:a)编码AAV变体衣壳蛋白的核酸序列,所述变体衣壳蛋白包含插入其高变和/或表面暴露的环的肽,和下述一种或多种:b)a)的AAV变体衣壳蛋白中肽插入位点侧翼的核酸序列中的一个或多个沉默突变;c)编码定位信号的核酸;d)包含条形码的核酸;和e)编码报告蛋白的核酸。
在一些实施方案中,本文公开的文库的每个成员包含:a)编码AAV变体衣壳蛋白的核酸序列,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,和b)AAV变体衣壳蛋白中肽插入位点侧翼的核酸序列中的一个或多个沉默突变。在一些实施方案中,本文公开的文库的每个成员包含a)编码AAV变体衣壳蛋白的核酸序列,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,b)AAV变体衣壳蛋白中肽插入位点侧翼的核酸序列中的一个或多个沉默突变,和c)编码定位信号的核酸。在一些实施方案中,本文公开的文库的每个成员包含:a)编码AAV变体衣壳蛋白的核酸序列,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,b)AAV变体衣壳蛋白中肽插入位点侧翼的核酸序列中的一个或多个沉默突变,c)编码定位信号的核酸,和d)包含条形码的核酸。在一些实施方案中,本文公开的文库的每个成员包含a)编码AAV变体衣壳蛋白的核酸序列,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,b)AAV变体衣壳蛋白中肽插入位点侧翼的核酸序列中的一个或多个沉默突变,c)编码定位信号的核酸,d)包含条形码的核酸,和e)编码报告蛋白的核酸。
在一些实施方案中,本文公开的文库的每个成员包含a)编码AAV变体衣壳蛋白的核酸序列,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,和c)编码定位信号的核酸。在一些实施方案中,本文公开的文库的每个成员包含a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,c)编码定位信号的核酸,和d)包含条形码的核酸。在一些实施方案中,本文公开的文库的每个成员包含a)编码AAV变体衣壳蛋白的核酸序列,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,c)编码定位信号的核酸,和e)编码报告蛋白的核酸。在一些实施方案中,本文公开的文库的每个成员包含a)编码AAV变体衣壳蛋白的核酸序列,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,c)编码定位信号的核酸,d)包含条形码的核酸,和e)编码报告蛋白的核酸。
在一些实施方案中,本文公开的文库的每个成员包含a)编码AAV变体衣壳蛋白的核酸序列,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,和d)包含条形码的核酸。在一些实施方案中,本文公开的文库的每个成员包含a)编码AAV变体衣壳蛋白的核酸序列,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,d)包含条形码,和e)编码报告蛋白的核酸。在一些实施方案中,本文公开的文库的每个成员包含a)编码AAV变体衣壳蛋白的核酸序列,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,和e)编码报告蛋白的核酸。
在第五方面,本公开提供了AAV变体文库,其中所述文库的每个成员包括:a)AAV变体衣壳蛋白,变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽;和下述一种或多种:b)编码a)的AAV变体衣壳蛋白的核酸中的一个或多个沉默突变,其中所述一个或多个沉默突变位于肽插入位点侧翼的核酸序列中;c)编码定位信号的核酸;d)包含条形码的核酸;和e)编码报告蛋白的核酸。
在一些实施方案中,本文公开的文库的每个成员包含a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,和b)在编码a)的AAV变体衣壳蛋白的核酸中的一个或多个沉默突变,其中所述一个或多个沉默突变位于肽插入位点侧翼的核酸序列中。在一些实施方案中,本文公开的文库的每个成员包含a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,和b)编码a)的AAV变体衣壳蛋白的核酸中的一个或多个沉默突变,其中所述一个或多个沉默突变位于肽插入位点侧翼的核酸序列中,和c)编码定位信号的核酸。在一些实施方案中,本文公开的文库的每个成员包含a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,和b)编码a)的AAV变体衣壳蛋白的核酸中的一个或多个沉默突变,其中所述一个或多个沉默突变位于肽插入位点侧翼的核酸序列中,c)编码定位信号的核酸,和d)包含条形码的核酸。在一些实施方案中,本文公开的文库的每个成员包含a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,和b)编码a)的AAV变体衣壳蛋白的核酸中的一个或多个沉默突变,其中所述一个或多个沉默突变位于肽插入位点侧翼的核酸序列中,c)编码定位信号的核酸,d)包含条形码的核酸,和e)编码报告蛋白的核酸。
在一些实施方案中,本文公开的文库的每个成员包含a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,和c)编码定位信号的核酸。在一些实施方案中,本文公开的文库的每个成员包含a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,c)编码定位信号的核酸,和d)包含条形码的核酸。在一些实施方案中,本文公开的文库的每个成员包含a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,c)编码定位信号的核酸,和e)编码报告蛋白的核酸。在一些实施方案中,本文公开的文库的每个成员包含a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,c)编码定位信号的核酸,d)包含条形码的核酸,和e)编码报告蛋白的核酸。
在一些实施方案中,本文公开的文库的每个成员包含a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,和d)包含条形码的核酸。在一些实施方案中,本文公开的文库的每个成员包含a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,d)包含条形码的核酸,和e)编码报告蛋白的核酸。在一些实施方案中,本文公开的文库的每个成员包含a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,和e)编码报告蛋白的核酸。
在一些实施方案中,编码AAV变体衣壳蛋白的核酸和编码定位信号的核酸、包含条形码的核酸和/或编码报告蛋白的核酸位于分开的核酸分子中。在其他实施方案中,编码AAV变体衣壳蛋白的核酸、编码定位信号的核酸、包含条形码的核酸和/或编码报告蛋白的核酸位于一个核酸分子中。在一些实施方案中,编码AAV变体衣壳蛋白的核酸和编码定位信号的核酸、包含条形码的核酸和/或编码报告蛋白的核酸以任何顺序彼此连接。在一些实施方案中,本文公开的文库的每个成员按下述顺序包含:5’ITR序列、包含条形码的核酸、编码报告蛋白的核酸、编码AAV变体衣壳蛋白的核酸和3’ITR序列。
在一些实施方案中,本文公开的AAV变体文库包含源自两种或更多种AAV血清型的AAV变体衣壳蛋白。在一些实施方案中,所述AAV血清型选自以下的一种或多种:AAV1、AAV2、AAV3B、AAV5、AAV6、AAV8、AAV9、AAV3、AAV4、AAV7、AAV11、AAVrh10、AAVrh39和AAVrh74。
在一些实施方案中,编码报告蛋白的核酸和编码AAV变体衣壳的核酸处于分开的启动子的控制的下。在一些实施方案中,编码报告蛋白的核酸和编码AAV变体衣壳的核酸各自独立地与启动子可操作地连接。
在第六方面,本公开提供了一种AAV变体,其包含:a)编码AAV变体衣壳蛋白的核酸序列,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽;和下述一个或多个:b)a)的AAV变体衣壳蛋白中肽插入位点侧翼的核酸序列中的一个或多个沉默突变;c)编码定位信号的核酸;d)包含条形码的核酸;e)编码报告蛋白的核酸。
在一些实施方案中,本文公开的AAV变体包含a)编码AAV变体衣壳蛋白的核酸序列,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,和b)所述AAV变体衣壳蛋白中肽插入位点侧翼的核酸序列中的一个或多个沉默突变。在一些实施方案中,本文公开的AAV变体包含a)编码AAV变体衣壳蛋白的核酸序列,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,b)AAV变体衣壳蛋白中肽插入位点侧翼的核酸序列中的一个或多个沉默突变,和c)编码定位信号的核酸。在一些实施方案中,本文公开的AAV变体包含a)编码AAV变体衣壳蛋白的核酸序列,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,b)AAV变体衣壳蛋白中肽插入位点侧翼的核酸序列中的一个或多个沉默突变,c)编码定位信号的核酸,和d)包含条形码的核酸。在一些实施方案中,本文公开的AAV变体包含a)编码AAV变体衣壳蛋白的核酸序列,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,b)AAV变体衣壳蛋白中肽插入位点侧翼的核酸序列中的一个或多个沉默突变,c)编码定位信号的核酸,d)包含条形码的核酸,和e)编码报道蛋白的核酸。
在一些实施方案中,本文公开的AAV变体包含a)编码AAV变体衣壳蛋白的核酸序列,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,和c)编码定位信号的核酸。在一些实施方案中,本文公开的AAV变体包含a)编码AAV变体衣壳蛋白的核酸序列,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,c)编码定位信号的核酸,和d)包含条形码的核酸。在一些实施方案中,本文公开的AAV变体包含a)编码AAV变体衣壳蛋白的核酸序列,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,c)编码定位信号的核酸,e)编码报告蛋白的核酸。在一些实施方案中,本文公开的AAV变体包含a)编码AAV变体衣壳蛋白的核酸序列,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,c)编码定位信号的核酸,d)包含条形码的核酸,和e)编码报告蛋白的核酸。
在一些实施方案中,本文公开的AAV变体包含a)编码AAV变体衣壳蛋白的核酸序列,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,和d)包含条形码的核酸。在一些实施方案中,本文公开的AAV变体包含a)编码AAV变体衣壳蛋白的核酸序列,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,d)包含条形码的核酸,e)编码报告蛋白的核酸。在一些实施方案中,本文公开的AAV变体包含a)编码AAV变体衣壳蛋白的核酸序列,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,和e)编码报告蛋白的核酸。
在第七个方面,本公开提供了一种AAV变体,其包含:a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽;和下述一个或多个:b)编码a)的AAV变体衣壳蛋白的核酸中在肽插入位点侧翼的核酸序列中的一个或多个沉默突变;c)编码定位信号的核酸;d)包含条形码的核酸;e)编码报告蛋白的核酸。
在一些实施方案中,本文公开的AAV变体包含a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,和b)编码a)的AAV变体衣壳蛋白的核酸中的一个或多个沉默突变,所述一个或多个沉默突变位于肽插入位点侧翼的核酸序列中。在一些实施方案中,本文公开的AAV变体包含a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,和b)编码a)的AAV变体衣壳蛋白的核酸中的一个或多个沉默突变,所述一个或多个沉默突变位于肽插入位点侧翼的核酸序列中,和c)编码定位信号的核酸。在一些实施方案中,本文公开的AAV变体包含a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,和b)编码a)的AAV变体衣壳蛋白的核酸中的一个或多个沉默突变,所述一个或多个沉默突变位于肽插入位点侧翼的核酸序列中,c)编码定位信号的核酸,和d)包含条形码的核酸。在一些实施方案中,本文公开的AAV变体包含a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,和b)编码a)的AAV变体衣壳蛋白的核酸中的一个或多个沉默突变,所述一个或多个沉默突变位于肽插入位点侧翼的核酸序列中,c)编码定位信号的核酸,d)包含条形码的核酸,和e)编码报告蛋白的核酸。
在一些实施方案中,本文公开的AAV变体包含a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,和c)编码定位信号的核酸。在一些实施方案中,本文公开的AAV变体包含a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,c)编码定位信号的核酸,和d)包含条形码的核酸。在一些实施方案中,本文公开的AAV变体包含a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,c)编码定位信号的核酸,和e)编码报告蛋白的核酸。在一些实施方案中,本文公开的AAV变体包含a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,c)编码定位信号的核酸,d)包含条形码的核酸,和e)编码报告蛋白的核酸。
在一些实施方案中,本文公开的AAV变体包含a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,和d)包含条形码的核酸。在一些实施方案中,本文公开的AAV变体包含a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,d)包含条形码的核酸,和e)编码报告蛋白的核酸。在一些实施方案中,本文公开的AAV变体包含a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,和e)编码报告蛋白的核酸。
在一些实施方案中,编码AAV变体衣壳蛋白的核酸和编码定位信号的核酸、包含条形码的核酸和/或编码报告蛋白的核酸位于分开的核酸中分子。在其他实施方案中,编码AAV变体衣壳蛋白的核酸、编码定位信号的核酸、包含条形码的核酸和/或编码报告蛋白的核酸位于一个核酸分子中。在一些实施方案中,编码AAV变体衣壳蛋白的核酸和编码定位信号的核酸、包含条形码的核酸和/或编码报告蛋白的核酸以任何顺序彼此连接。在一些实施方案中,AAV变体按下述顺序包含:5’ITR序列、包含条形码的核酸、编码报告蛋白的核酸、编码AAV变体衣壳蛋白的核酸和3’ITR序列。
在一些实施方案中,本文公开的AAV变体来自于:AAV1、AAV2、AAV3B、AAV5、AAV6、AAV8、AAV9、AAV3、AAV4、AAV7、AAV11、AAVrh10、AAVrh39和AAVrh74。
在一些实施方案中,编码报告蛋白的核酸和编码AAV变体衣壳的核酸处于分开的启动子的控制的下。在一些实施方案中,编码报告蛋白的核酸和编码AAV变体衣壳的核酸各自独立地与启动子可操作地连接。
在第八个方面,本公开提供了一种核酸分子,其包含a)编码AAV变体衣壳蛋白的核酸序列,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽;和下述一个或多个:b)编码变体衣壳蛋白的核酸序列,该核酸序列在变体衣壳蛋白的高变和/或表面暴露的环中肽插入位点侧翼的核苷酸序列中包含一个或多个沉默突变;c)编码定位信号的核酸序列;d)包含条形码的核酸序列;e)编码报告蛋白的核酸序列。
在一些实施方案中,本文公开的核酸包含a)编码AAV变体衣壳蛋白的核酸序列,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,和b)AAV变体衣壳蛋白中肽插入位点侧翼的核酸序列中的一个或多个沉默突变。在一些实施方案中,本文公开的核酸包含a)编码AAV变体衣壳蛋白的核酸序列,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,b)AAV变体衣壳蛋白中肽插入位点侧翼的核酸序列中的一个或多个沉默突变,和c)编码定位信号的核酸。在一些实施方案中,本文公开的核酸包含a)编码AAV变体衣壳蛋白的核酸序列,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,b)AAV变体衣壳蛋白中肽插入位点侧翼的核酸序列中的一个或多个沉默突变,c)编码定位信号的核酸,和d)包含条形码的核酸。在一些实施方案中,本文公开的核酸包含a)编码AAV变体衣壳蛋白的核酸序列,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,b)AAV变体衣壳蛋白中肽插入位点侧翼的核酸序列中的一个或多个沉默突变,c)编码定位信号的核酸,d)包含条形码的核酸,和e)编码报道蛋白的核酸。
在一些实施方案中,本文公开的核酸包含a)编码AAV变体衣壳蛋白的核酸序列,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,和c)编码定位信号的核酸。在一些实施方案中,本文公开的核酸包含a)编码AAV变体衣壳蛋白的核酸序列,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,c)编码定位信号的核酸,和d)包含条形码的核酸。在一些实施方案中,本文公开的核酸包含a)编码AAV变体衣壳蛋白的核酸序列,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,c)编码定位信号的核酸,和e)编码报告蛋白的核酸。在一些实施方案中,本文公开的核酸包含a)编码AAV变体衣壳蛋白的核酸序列,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,c)编码定位信号的核酸,d)包含条形码的核酸,和e)编码报告蛋白的核酸。
在一些实施方案中,本文公开的核酸包含a)编码AAV变体衣壳蛋白的核酸序列,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,和d)包含条形码的核酸。在一些实施方案中,本文公开的核酸包含a)编码AAV变体衣壳蛋白的核酸序列,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,d)包含条形码的核酸,和e)编码报告蛋白的核酸。在一些实施方案中,本文公开的核酸包含a)编码AAV变体衣壳蛋白的核酸序列,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽,和e)编码报告蛋白的核酸。
在本文公开的方法、文库、AAV变体或核酸的一些实施方案中,插入变体衣壳蛋白的肽具有4-15个氨基酸的长度。在一些实施方案中,所述肽具有6-15个氨基酸的长度。在一些实施方案中,所述肽具有7、10或15个氨基酸的长度。在一些实施方案中,所述肽具有7个氨基酸的长度。在一些实施方案中,所述插入的肽包含SEQ ID NO:1-32中任一个所示的氨基酸序列的至少4个连续氨基酸。在一些实施方案中,所述插入的肽包含SEQ ID NO:68-110中任一个所示的氨基酸序列的至少4个连续氨基酸。在一些实施方案中,所述肽包含SEQ IDNO:1-32中任一个所示的氨基酸序列。在一些实施方案中,所述肽包含SEQ ID NO:68-110中任一个所示的氨基酸序列。
在一些实施方案中,所述肽被插入到衣壳蛋白的VR-I、VR-II、VR-III、VR-IV、VR-V、VR-VI、VR-VII、VR-VIII或VR-IX区域中。在一些实施方案中,所述肽被插入到衣壳蛋白的VR-I中。在一些实施方案中,所述肽被插入到衣壳蛋白的VR-IV中。在一些实施方案中,所述肽被插入到衣壳蛋白的VR-VIII中。在一些实施方案中,所述肽被插入到衣壳蛋白VP1、VP2或VP3中。众所周知,VP2和VP3蛋白是VP1蛋白的截短形式。
在一些实施方案中,所述肽被插入在衣壳蛋白的氨基酸残基450和600之间的位置。在一些实施方案中,(i)所述AAV血清型是AAV1,并且所述肽被插入在衣壳蛋白的氨基酸位置590处,(ii)所述AAV血清型是AAV6,并且所述肽被插入在衣壳蛋白的氨基酸位置454或590处,(iii)所述AAV血清型是AAV2,并且所述肽被插入衣壳蛋白的氨基酸位置588处,(iv)所述AAV血清型是AAV3B,并且所述肽被插入衣壳蛋白的氨基酸位置589处,(v)所述AAV血清型是AAV5,并且所述肽被插入在衣壳蛋白的氨基酸位置578处,(vi)所述AAV血清型是AAV8,并且所述肽被插入在衣壳蛋白的氨基酸位置591处,或(vii)所述AAV血清型为AAV9,并且所述肽被插入在衣壳蛋白的氨基酸位置266、455或589处,其中各所述位置对应于所述AAV血清型中VP1的编号。
在本文公开的方法、文库、AAV变体或核酸的一些实施方案中,编码AAV变体衣壳蛋白的核酸处于p40启动子的控制的下。在本文公开的方法、文库、AAV变体或核酸的一些实施方案中,编码AAV变体衣壳蛋白的核酸与p40启动子可操作地连接。
在本文公开的方法、文库、AAV变体或核酸的一些实施方案中,编码报告蛋白的核酸编码荧光蛋白。在一些实施方案中,所述报告蛋白选自:EGFP、mCherry、mClover3、mRuby3、mApple、iRFP、tdTomato、mVenus、YFP、RFP、萤火虫荧光素酶和nanoluciferase。
在一些实施方案中,编码报告蛋白的核酸处于细胞类型和/或组织特异性启动子的控制的下。在一些实施方案中,编码报告蛋白的核酸与细胞类型和/或组织特异性启动子可操作地连接。在一些实施方案中,编码报告蛋白的核酸与细胞类型特异性RNA聚合酶II启动子(例如甲状腺素运载蛋白或hSynapsin1)可操作地连接。在一些实施方案中,所述细胞类型和/或组织特异性启动子选自:人突触蛋白启动子(hSyn1)、甲状腺素运载蛋白启动子(TTR)、细胞角蛋白18、细胞角蛋白19、unc-45肌球蛋白伴侣B(unc45b)启动子、心肌肌钙蛋白T(cTnT)启动子、神经胶质纤维酸性蛋白(GFAP)启动子、髓鞘碱性蛋白(MBP)启动子和甲基CpG结合蛋白2(Mecp2)启动子。在一些实施方案中,所述细胞类型和/或组织特异性启动子是hSyn1启动子。在一些实施方案中,所述细胞类型和/或组织特异性启动子是TTR启动子。
在本文公开的方法、文库、AAV变体或核酸的一些实施方案中,报告蛋白与定位信号融合。在一些实施方案中,定位信号在N-末端、C-末端或N-末端和C-末端与报道蛋白融合。在一些实施方案中,定位信号是核定位信号(NLS)、核包膜结合域或组蛋白结合域。在一些实施方案中,NLS是SV40 NLS。在一些实施方案中,核包膜结合域是KASH域。在一些实施方式中,组蛋白结合域是H2B。
在本文公开的方法、文库、AAV变体或核酸的一些实施方案中,条形码的长度为5-18个核苷酸。
在本文公开的方法、文库、AAV变体或核酸的一些实施方案中,包含条形码的核酸包含选自序列SEQ ID NO:111-154或155-198中任一个的序列。在一些实施方案中,包含条形码的核酸包含选自序列SEQ ID NO:111-154中任一个的序列。在一些实施方案中,包含条形码的核酸包含选自序列SEQ ID NO:155-198中任一个的序列。在本文公开的方法、文库、AAV变体或核酸的一些实施方案中,包含条形码的核酸选自序列SEQ ID NO:111-154或155-198中的任一个。在一些实施方案中,包含条形码的核酸选自序列SEQ ID NO:111-154中的任一个。在一些实施方案中,包含条形码的核酸选自序列SEQ ID NO:155-198中的任一个。
在本文公开的方法、AAV变体文库、AAV变体或核酸的一些实施方案中,文库的每个成员包含含有第一条形码的第一核酸和含有第二条形码的第二核酸。在一些实施方案中,含有第一条形码的第一核酸和含有第二条形码的第二核酸不同。在一些实施方案中,包含第一条形码的第一核酸包含选自序列SEQ ID NO:111-154中任一个的序列或选自序列SEQID NO:111-154中任一个。在本文公开的方法、AAV变体文库、AAV变体或核酸的一些实施方案中,包含第二条形码的第二核酸包含选自序列SEQ ID NO:155-198中任一个的序列或选自任何序列SEQ ID NO:155-198的一。在一些实施方案中,包含第一条形码的第一核酸包含选自序列SEQ ID NO:111-154中任一个的序列或选自序列SEQ ID NO:111-154中的任一个,并且包含第二条形码的第二核酸包含选自序列SEQ ID NO:155-198中任一个的序列或选自序列SEQ ID NO:155-198中任一个。在一些实施方案中,含有第一条形码的第一核酸和含有第二条形码的第二核酸中的每一个独立地与启动子可操作地连接。在一些实施方式中,所述启动子对于第一条形码和第二条形码中的每一个是不同的。在一些实施方案中,包含第一条形码的第一核酸和第二核酸中的每一个在不同的启动子下独立地控制。在一些实施方案中,与包含第一条形码的第一核酸可操作地连接的启动子和与包含第二条形码的第二核酸可操作地连接的启动子各自独立地为RNA Pol II启动子(例如,人突触蛋白启动子(hSynl)、转甲状腺素蛋白启动子(TTR)、细胞角蛋白18、细胞角蛋白19、unc-45肌球蛋白伴侣B(unc45b)启动子、心肌肌钙蛋白T(cTnT)启动子、胶质纤维酸性蛋白(GFAP)启动子、髓鞘碱性蛋白(MBP)启动子或甲基CpG-结合蛋白2(Mecp2)启动子)。在一些实施方案中,与包含第一条形码的第一核酸可操作地连接的启动子和与包含第二条形码的第二核酸可操作地连接的启动子各自独立地是RNA Pol III启动子(例如,U6启动子、H1启动子或7SK启动子)。在一些实施方案中,与包含第一条形码的第一核酸可操作地连接的启动子是RNA Pol II启动子,并且与包含第二条形码的第二核酸可操作地连接的启动子是RNAPol III启动子。在一些实施方案中,包含条形码的核酸进一步包含报告基因、核定位信号和聚腺苷酸化信号。
在本文公开的方法、文库、AAV变体或核酸的一些实施方案中,每个插入的肽编码序列以多个不同的核酸序列合成,均编码相同的肽。每个核酸序列都与一个独特的条形码相连,这样当两个或多个变体被鉴定为具有相同的插入肽序列但其中不同的核酸序列编码该插入肽时,可以验证插入肽的性能(例如富集)。
在本文公开的方法、文库、AAV变体或核酸的一些实施方案中,相对于编码包含插入肽的AAV变体衣壳蛋白的核酸而言,以反式提供下述一个或多个:(i)编码定位信号的核酸;(i)包含条形码的核酸;(iii)编码报告蛋白的核酸。在本文公开的方法、文库、AAV变体或核酸的一些实施方案中,相对于编码包含插入肽的AAV变体衣壳蛋白的核酸而言,均以反式提供(i)编码定位信号的核酸,(ii)包含条形码的核酸;和(iii)编码报告蛋白的核酸。在本文公开的方法、文库、AAV变体或核酸的一些实施方案中,相对于编码包含插入肽的AAV变体衣壳蛋白的核酸而言,以顺式提供下述一个或多个:(i)编码定位信号的核酸;(ii)包含条形码的核酸;和(iii)编码报告蛋白的核酸。在本文公开的方法、文库、AAV变体或核酸的一些实施方案中,相对于编码包含插入肽的AAV变体衣壳蛋白的核酸而言,均以顺式提供(i)编码定位信号的核酸;(ii)包含条形码的核酸;和(iii)编码报告蛋白的核酸。
在第九个方面,本文公开的AAV变体用于将转基因递送至靶细胞或组织。在一些实施方案中,所述转基因可用于基因治疗。在一些实施方案中,所述转基因可用于基因组编辑。
在第十个方面,本公开提供了包含编码肽的核酸的AAV载体,该肽包含SEQ IDNos.1-32或68-110中列出的氨基酸序列的至少4个连续氨基酸。在一些实施方案中,AAV载体包含编码肽的核酸,该肽包含SEQ ID Nos.1-32中所列氨基酸序列的至少4个连续氨基酸。在其他实施方案中,AAV载体包含编码肽的核酸,所述肽包含SEQ ID Nos.68-110中所列氨基酸序列的至少4个连续氨基酸。在一些实施方案中,所述核酸编码SEQ ID Nos.1-32或SEQ ID Nos.68-110中任一个的氨基酸序列。在一些实施方案中,所述核酸编码SEQ IDNos.1-32中任一个的氨基酸序列。在一些实施方案中,所述核酸编码SEQ ID Nos.68-110中任一个的氨基酸序列。在一些实施方案中,被插入的氨基酸序列是衣壳蛋白的一部分。在一些实施方案中,所述衣壳蛋白是VP1、VP2或VP3。在一些实施方案中,所述氨基酸序列被插入在衣壳蛋白的氨基酸残基450和600之间的位置。在一些实施方案中,氨基酸序列被插入在(i)AAV1衣壳蛋白的氨基酸位置590处,(ii)AAV6衣壳蛋白的氨基酸位置454或590处,(iii)AAV2衣壳蛋白的氨基酸位置588处,(iv)AAV3B衣壳蛋白的氨基酸位置589处,(v)AAV5衣壳蛋白的氨基酸位置578处,(vi)AAV8衣壳蛋白的氨基酸位置591处,或(vi)AAV9衣壳蛋白的氨基酸位置266、455或589处,其中所述位置对应于所述AAV血清型中VP1的编号。
在第十一方面,本公开提供了一种药物组合物,其中包含本文公开的AAV载体和药学上可接受的载体。
在第十二方面,本公开提供了一种肽,其包含在SEQ ID Nos.1-32或68-110的任一个中列出的氨基酸序列。在一些实施方案中,所述肽包含在SEQ ID Nos.1-32的任一个中列出的氨基酸序列。在一些实施方案中,所述肽包含在SEQ ID Nos.68-110的任一个中列出的氨基酸序列。在一些实施方案中,肽是SEQ ID Nos.1-32中列出的任何序列。在一些实施方案中,所述肽是SEQ ID Nos.68-110中列出的任何序列。在一些实施方案中,所述肽是AAV载体的一部分。在一些实施方案中,所述肽是AAV载体的衣壳蛋白的一部分。
在第十三方面,本公开提供了包含肽的衣壳蛋白,所述肽包含SEQ ID Nos.1-32或68-110中列出的氨基酸序列的至少4个连续氨基酸。在一些实施方案中,所述衣壳蛋白包含插入的肽,该插入肽包含SEQ ID Nos.1-32中列出的氨基酸序列的至少4个连续氨基酸。在一些实施方案中,所述衣壳蛋白包含在SEQ ID Nos.1-32的任一个中列出的氨基酸序列。在一些实施方案中,所述衣壳蛋白包含插入的肽,该插入肽包含SEQ ID Nos.68-110中列出的氨基酸序列的至少4个连续氨基酸。在一些实施方案中,所述衣壳蛋白包含在SEQ IDNos.68-110的任一个中列出的氨基酸序列。
在第十四方面,本公开提供了编码本文公开的肽或衣壳蛋白的核酸序列。
在第十五方面,本公开提供一种将核酸递送至受试者的靶细胞或组织的方法,包括:施用包含含有所述核酸的AAV载体的组合物,其中所述AAV载体进一步包含含有插入肽的衣壳蛋白,所述插入肽包含SEQ ID Nos.1-32或68-110中列出的氨基酸序列的至少4个连续氨基酸。在一些实施方案中,所述衣壳蛋白包含插入的肽,该插入肽包含SEQ ID Nos.1-32中列出的氨基酸序列的至少4个连续氨基酸。在其他实施方案中,所述衣壳蛋白包含插入的肽,该插入肽包含SEQ ID Nos.68-110中列出的氨基酸序列的至少4个连续氨基酸。在一些实施方案中,所述衣壳蛋白包含在SEQ ID Nos.1-32的任一个中列出的氨基酸序列。在其他实施方案中,所述衣壳蛋白包含在SEQ ID Nos.68-110的任一个中列出的氨基酸序列。
在一些实施方案中,所述靶细胞或组织包括但不限于来自CNS、心脏、肺、气管、食道、肌肉、骨、软骨、胃、胰腺、肠、肝脏、膀胱、肾脏、输尿管、尿道、子宫、输卵管、卵巢、睾丸、前列腺、眼睛、血液、淋巴或口腔粘膜的细胞或组织。在一些实施方案中,所述靶细胞或组织包括但不限于CNS、心脏、肺、气管、食道、肌肉、骨、软骨、胃、胰腺、肠、肝、膀胱、肾、输尿管、尿道、子宫、输卵管、卵巢、睾丸、前列腺、眼睛、血液、淋巴或口腔粘膜。在一些实施方案中,所述靶细胞或组织是CNS细胞或组织。在其他实施方案中,所述靶细胞或组织是肝细胞或组织。
在一些实施方案中,所述靶细胞包括但不限于神经元、神经胶质细胞、星形胶质细胞、少突胶质细胞、小神经胶质细胞、雪旺细胞、室管膜细胞、肝细胞、星状脂肪储存细胞、枯否氏细胞、肝内皮细胞、上皮细胞、心肌细胞、平滑肌细胞、T细胞、B细胞、造血干细胞和胚胎干细胞。
在一些实施方案中,所述靶细胞或组织来自肝脏。
在一些实施方式中,所述靶细胞或组织来自CNS。
根据本公开的整体,这些和其他方面对于本领域技术人员来说将是显而易见的。
附图说明
本专利或申请文件包含至少一幅彩色绘图。本专利或专利申请公开的带有彩色附图的副本在请求并支付必要费用后由专利局提供。
图1描绘了与衣壳文库的组装有关的信息。图A是AAV衣壳蛋白的图示,其中箭头表示肽插入其内的暴露环。图1B是插入肽的AAV血清型骨架图。在肽插入位点周围的区域(显示为与插入的肽区域“肽”相邻的灰色框)进行了沉默突变,以便能够使用相同的通用下一代测序(Next-Generation Sequencing,NGS)引物来扩增多样化的区域和在正面比较中量化变体性能。单个插入区域(VR-VIII)作为代表性示例进行了描述,但相同的策略可推广到其他以多样化为目标的衣壳区域。
图2说明了用于产生具有高度多样性的衣壳文库的方法的实例。图A显示了用于构建衣壳编码基因的片段,其中左右两个片段通过两个PCR扩增产物和一个预消化的质粒骨架的Gibson组装连接起来。图B是用于通过Gibson组装连接两个片段的引物对(反向:SEQID NO:204和正向:SEQ ID NO:205)的放大图,还描述了包含在RF Fwd引物中的多样化序列,其中X的长度可以在12到45个核苷酸之间。
图3A和图3B是各种文库构建体的图,这些文库构建体包含顺式变体衣壳文库和表达盒,两者侧接病毒ITR用于病毒基因组的衣壳化。图A是一种构建体,其中变体衣壳基因“Cap”受p40启动子调控,转录物由聚腺苷酸化信号序列(“polyA”)终止。该构建体还包含受CMV启动子调控的EGFP报告基因,其中EGFP在其N端与SV40核定位序列(“SV40 NLS”)相连。该构建体还包含牛生长激素polyA信号序列BGH和5'和3'ITR序列。图B与图A类似,不同的处在于它有一个mCherry报告蛋白。图C显示了变体衣壳基因的相同设计,并且还包含受CMV启动子调控的EGFP报告基因,其中EGFP基因与KASH核被膜结合域(“KASH”)融合。图D显示了类似于图C的构建体,不同的处在于使用了mCherry报告基因。图E显示具有相同变体衣壳表达构建体的构建体,但具有突触蛋白启动子(“hSyn1”)驱动与组蛋白2B DNA结合域(“H2B”)在其3'末端融合的EGFP报告基因的表达。该构建体还包含SV40多聚腺苷酸化信号序列。图F和G与图E相似,不同的是图F使用mClover3报告蛋白,图G使用mRuby3报告蛋白。
图4A和图4B说明了方法1的步骤,用于将每个变体衣壳序列与随机生成或指定的条形码进行生物信息学连接。在步骤1中,合成一小段DNA,其包含随机生成的或指定的条形码和随机生成的或指定的衣壳变体区域,以及用于Gibson组装的两个区域。步骤2包括扩增所述多样化区域3'的衣壳序列。第3步是Gibson组装反应,其中5’ITR和SV40多聚腺苷酸化序列与条形码在5'端的融合,第二个Gibson组装区与衣壳基因、用于衣壳基因的polyA信号和3’ITR的3'端融合。步骤4包括对条形码和变体衣壳序列进行
Figure BDA0003419732690000251
测序。步骤5包括用BsaI限制酶消化。步骤6是PCR扩增步骤,其中制备H2B、EGFP、hSyn1和p40启动子以及衣壳基因的5'端。或者,可以将包含H2B、EGFP、hSyn1、p40启动子和衣壳基因5'端的片段预组装在供体质粒中,用BsaI消化,然后进行凝胶纯化。步骤7是最后的金门克隆(goldengate cloning)步骤,以创建最终构建体。
图4C和图4D示意了方法1的替代方法,用于将每个变体衣壳序列与随机生成的条形码进行生物信息学连接。在步骤1中,合成了两个DNA片段。片段A包含Gibson组装区#1、BsaI位点、可变衣壳区和与用作PCR引物的衣壳基因同源的区域。片段B包含Gibson组装区#2、随机条形码、BsaI位点和Gibson组装区#1。接下来,执行PCR程序,其中使用在步骤1中合成的片段A作为PCR引物扩增衣壳基因的3'序列。接下来,通过Gibson组装生成中间AAV构建体,其中该构建体以5'到3'的顺序包含5'ITR、SV40 poly A信号、条形码、两个限制性内切核酸酶位点、变体衣壳序列、3'衣壳蛋白区域、用于衣壳表达构建体的polyA序列和3'ITR(步骤3)。步骤4包括对条形码和变体衣壳序列进行
Figure BDA0003419732690000261
测序。步骤5包括用BsaI限制酶消化。步骤6是PCR扩增步骤,其中制备H2B、EGFP、hSyn1和p40启动子以及衣壳基因的5'端。或者,可以将包含H2B、EGFP、hSyn1、p40启动子和衣壳基因5'端的片段预组装在供体质粒中,用BsaI消化,然后进行凝胶纯化。步骤7是最后的金门克隆步骤,以创建最终构建体。
图5说明了用于将每个突变的衣壳序列与随机生成的条形码进行生物信息学连接的方法2的步骤。首先,使用两组
Figure BDA0003419732690000262
测序引物分别对随机条形码和突变衣壳序列进行高保真度测序。接下来,进行OXFORD
Figure BDA0003419732690000263
测序以对整个构建体进行测序。Nanopore测序不如
Figure BDA0003419732690000264
测序准确,但可用于通过生物信息学分析将两个
Figure BDA0003419732690000265
序列连接成一个分子。
图6是用AAV变体文库转导后从原代小鼠皮层神经元分离的AAV变体的图。Y轴表示与转导前施用的文库中的变体频率相比,从转导细胞中选择和恢复后变体频率的log2倍变化。数据表明,与基于插入其他AAV血清型的变体相比,AAV血清型倾向于与基于AAV1的变体簇集,该变异是原代小鼠神经元中最为富集的。
图7A和图7B是AAV1变体(图7A)或AAV2变体(图7B)的图。在图7A中,标记了衣壳序列中缺少任何插入肽的野生型AAV1。数据表明,与野生型AAV1相比,许多插入的肽序列导致变体的富集。在图7B中,标记了衣壳序列中缺少任何插入肽的野生型AAV2。数据表明,与野生型AAV2相比,许多插入的肽序列导致细胞核中变体的富集。
图8描绘了两个图,显示了富集的AAV变体,如通过从靶细胞分离的RNA的逆转录和条形码的扩增(左侧图)或通过从处理的细胞分离细胞核和对编码插入衣壳基因的肽的插入核苷酸测序(右侧图)。数据表明,两种分析方法都获得了非常相似的结果。左图和右图分别按照出现的顺序(每幅图从上到下)公开了SEQ ID NOS:199-203。
图9显示了用不同报告基因构建体转导的HEK293细胞的显微照片。图A显示了用仅包含EGFP报告基因的AAV变体转导的HEK293细胞,而图B显示了用包含与EGFP基因融合的SV40核定位序列(NLS)的构建体转导HEK293细胞时的结果,导致报告基因在核中积累。图C显示了用包含KASH连接的EGFP序列的AAV构建体转导的HEK293细胞的结果,图D显示了用包含mCherry报告基因的AAV构建体转导的HEK293细胞。图E显示了AAV构建体包含与SV40 NLS融合的mCherry时的结果,图F显示了当mCherry与KASH融合时的结果。
图10A和图10B是来自小鼠脑组织的免疫组织化学显微照片,描绘了注射后包含EGFP-H2B融合物的AAV变体文库的核定位神经元报告基因表达(皮层、海马、丘脑)。图C显示了小鼠脑组织,描绘了注射后包含mClover3-H2B融合体的AAV变体文库的核定位神经元报告基因表达(皮层、海马、丘脑)。图D和E显示了小鼠脑组织,描绘了注射后包含EGFP-KASH融合的AAV变体文库的核包膜局部神经元报告基因表达(皮层、海马、丘脑)。图F显示了小鼠脑组织,描绘了注射后包含mRuby3-H2B融合体的AAV变体文库的核定位神经元报告基因表达(皮层、海马、丘脑)。图F中的图像是固定大脑切片中的天然荧光。
图11描绘了从用包含EGFP-H2B报告蛋白的AAV变体处理的小鼠的神经元组织中分离的细胞核的FACS分析。在仅注射制剂缓冲液(制剂)的小鼠中,检查的脑组织没有表现出任何EGFP荧光(图中描绘的是皮质组织)。相比的下,对于从用AAV变体治疗的小鼠中分离的细胞核,可以在胸脊髓(占总事件的7.68%)、丘脑(占总事件的16.53%)和皮层(占总事件的6.54%)中检测到报告蛋白信号。
图12描绘了从用包含mClover3报告蛋白构建体或EGFP-KASH报告蛋白的AAV变体处理的小鼠分离的细胞核的FACS分析。对于这两种类型的AAV变体,在mClover3的丘脑(占总事件的14.72%)和EGFP-KASH的皮层(4.88%)中都看到了报告蛋白信号。
图13描绘了从用包含mRuby3报告蛋白构建体的AAV变体处理的小鼠分离的细胞核的FACS分析,其中如图所示在皮质中检测到报告蛋白信号(总事件的7.62%)。
图14描绘了当报告蛋白基因由hSynl启动子(神经元特异性)驱动时从非CNS组织分离的细胞核的FACS分析。图A显示了来自用包含EGFP-H2B构建体的AAV变体处理的小鼠的肝脏组织的信号与制剂缓冲液的比较,而图B显示了心脏组织中的相同比较。没有观察到来自hSyn1启动子的脱靶表达。
图15A、图15B和图15C描绘了一系列图,支持了与模拟(图A)相比,当包含由肝脏特异性TTR启动子驱动的EGFP-H2B构建体的AAV变体文库被以不同剂量(3x103(图B);1x104(图C);3x104(图D);1x105(图E);3x105(图F)和1x106(图G))引入到体外HepG2细胞时EGFP报告蛋白信号明确的剂量响应。
图16描绘了在用AAV变体文库注射动物后从肝组织分离的NHP(非人灵长类动物)细胞核中检测到的报告蛋白信号(图A)。图B显示了肝脏组织的免疫组织化学分析,表明在男性和女性NHP的肝脏中都检测到核定位报告蛋白信号(细胞核的棕色染色)。
图17A和图17B显示了前2500倍富集的AAV变体的分布,根据肽插入是在哪个亲本血清型中进行的。数据是从分选和测序中获得的。与小鼠(图C)和体内NHP肝组织(图D)相比,从HepG2(图A)和体外原代人肝细胞(图B)中分离出的EGFP阳性细胞核。从图中可以看出,当遭受不同选择压力时,成功的AAV变体的亲本血清型存在显著差异。
图18展示高度富集AAV变体的取样及自第二轮NHP肝组织筛选鉴定的插入肽序列(“肽”,SEQ ID NO 1至32)。如可见,变体是基于插入至AAV1、AAV2、AAV3B、AAV9、AAV6及AAV5血清型中,其中肽序列被插入至各指定血清型中的以下氨基酸位置中:AAV1(590)、AAV2(588)、AAV3B(589)、AAV5(578)、AAV6(454)、AAV8(591)、AAV9(589)。数据显示了经由第二轮筛选的个体变体富集,如通过分析以下各项所量测的:自肝组织分离的AAV文库衍生的带条形码的mRNA转录物(“第2轮mRNA”)、基于EGFP-H2B报道子信号使用FACS分离的细胞核测序的病毒基因组DNA(“第2轮细胞核”)、在第2轮自总肝脏基因组DNA测序的病毒基因组DNA(“第2轮总gDNA”)及在第1轮自总肝脏基因组DNA测序的病毒基因组DNA(“第1轮总gDNA”)。还显示了当由瞬时转染至HEK293细胞中产生时AAV变体的相对产率。通过圆的大小来指示相比于注射之前文库中的百分比,个体变体在自组织分离时的富集程度。举例而言,与起始文库相比,具有插入肽序列QGALAQV(SEQ ID NO:8)的AAV3B血清型变体在自NHP组织分离时,mRNA条形码频率的log2倍数富集为6.1。圆的颜色暗度也与右下方所示的标度有关,其展示针对特定变体跨越多个动物及组织冲压的效能相对变化性。
图19为在感染Neuro2A细胞之后回收的AAV文库变体的气泡图。log2倍数变化表示与所施用文库中的变体频率相比,在感染及回收表达于经转导Neuro2A细胞中的转录物之后,变体频率的变化。显示了野生型血清型的效能以及图29A-D中列出的变体1-43(SEQ IDNO:68-110)的效能。
图20为在感染原代小鼠皮质神经元之后回收的AAV文库变体的气泡图。log2倍数变化表示与所施用文库中的变体频率相比,在感染及回收表达于经转导神经元中的转录物之后,变体频率的变化。显示了野生型血清型的效能以及图29A-D中列出的变体1-43(SEQID NO:68-110)的效能。
图21为在感染衍生自人类诱导多能干细胞的iCell人类神经元之后回收的AAV文库变体的气泡图。log2倍数变化表示与所施用文库中的变体频率相比,在感染及回收表达于经转导神经元中的转录物之后,变体频率的变化。显示了野生型血清型的效能以及图29A-D中列出的变体1-43(SEQ ID NO:68-110)的效能。
图22为在脑室内施用AAV变体文库之后自C57BL/6J小鼠CNS组织回收的AAV文库变体的气泡图。分析中包括的组织区域为纹状体、海马区、小脑、丘脑、下丘脑、中脑、脑干、运动皮质、躯体感觉皮质、其余皮质、颈部脊髓、胸部脊髓及腰部脊髓。log2倍数变化表示与所施用文库中的变体频率相比,在感染及回收表达于经转导神经元中的转录物之后,变体频率的变化。显示了野生型血清型的效能以及图29A-D中列出的变体1-43(SEQ ID NO:68-110)的效能。
图23为在鞘内施用AAV变体文库之后从非人类灵长类动物CNS组织回收的AAV文库变体的气泡图。此分析中包括的组织区域为海马区、内嗅皮质、颞叶皮质、额叶皮质及顶叶皮层。log2倍数变化表示与所施用文库中的变体频率相比,在感染及回收来自组织的病毒基因组DNA之后,变体频率的变化。显示了野生型血清型的效能以及图29A-D中列出的变体1-43(SEQ ID NO:68-110)的效能。
图24为在鞘内施用AAV变体文库之后自非人类灵长类动物CNS组织回收的AAV文库变体的气泡图。此分析中包括的组织区域为脑桥、髓质、小脑及运动皮质。log2倍数变化表示与所施用文库中的变体频率相比,在感染及回收来自组织的病毒基因组DNA之后,变体频率的变化。显示了野生型血清型的效能以及图29A-D中列出的变体1-43(SEQ ID NO:68-110)的效能。
图25为在鞘内施用AAV变体文库之后自非人类灵长类动物脊髓回收的AAV文库变体的气泡图。log2倍数变化表示与所施用文库中的变体频率相比,在感染及回收来自组织的病毒基因组DNA之后,变体频率的变化。显示了野生型血清型的效能以及图29A-D中列出的变体1-43(SEQ ID NO:68-110)的效能。
图26为在鞘内施用AAV变体文库之后自非人类灵长类动物CNS组织回收的AAV文库变体的气泡图。此分析中包括的组织区域为海马区、内嗅皮质、颞叶皮质、额叶皮质及顶叶皮层。log2倍数变化表示与所施用文库中的变体频率相比,在感染及回收表达于经转导神经元中的转录物之后,变体频率的变化。显示了野生型血清型的效能以及图29A-D中列出的变体1-43(SEQ ID NO:68-110)的效能。
图27为在鞘内施用AAV变体文库之后从非人类灵长类动物CNS组织回收的AAV文库变体的气泡图。此分析中包括的组织区域为脑桥、髓质、小脑、黑质及运动皮质。log2倍数变化表示与所施用文库中的变体频率相比,在感染及回收表达于经转导神经元中的转录物之后,变体频率的变化。显示了野生型血清型的效能以及图29中列出的变体1-43(SEQ ID NO:68-110)的效能。
图28为在鞘内施用AAV变体文库之后自非人类灵长类动物脊髓回收的AAV文库变体的气泡图。log2倍数变化表示与所施用文库中的变体频率相比,在感染及回收表达于经转导神经元中的转录物之后,变体频率的变化。显示了野生型血清型的效能以及图29中列出的变体1-43(SEQ ID NO:68-110)的效能。
图29A、图29B、图29C及图29D展示高度富集AAV变体及自第二轮NHP CNS组织筛选鉴定的插入肽序列(“肽”,SEQ ID NO 68-110)。变体是基于插入至AAV1、AAV2、AAV3B及AAV9血清型中,其中肽序列是插入至各指定血清型中的以下氨基酸位置中:AAV1(590)、AAV2(588)、AAV3B(589)、AAV9(589)。各变体左侧的数字(1至43(SEQ ID NO:68-110))对应于用于在图19至28中绘制的数目。数据显示个体变体经由第二轮筛选在多个细胞系或物种中的富集,如通过自细胞或CNS组织分离的AAV文库带条形码的mRNA转录物或载体基因组DNA的定量所量测。通过圆的大小来指示相比于注射之前文库中的百分比,各个体变体在自细胞或组织分离时的富集程度。圆的颜色暗度亦与图29D右下方所示的标度有关,其展示针对特定变体跨越多个拷贝、动物和/或组织冲压的效能相对变化性。
图30为用于带条形码的AAV变体的汇集评估的载体基因组盒的示意图。盒含有RNA聚合酶II启动子,其定量带条形码的转录物于靶细胞群体,例如神经元或肝细胞中的表达。另外,存在RNA聚合酶III启动子(例如hU6),其驱动所有细胞类型中的广泛表达。这些启动子的组合使得能够对个体靶细胞类型及块体组织两者中的AAV变体转导排序。
图31展示图29A-D中的AAV变体(变体2、3、4、5、6、9、10、11、12、13、14、16、18、19、20、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、49)亚组的汇集评估的结果。对照血清型包括野生型AAV9、PHP.B及AAV2_HSPGKO。在Neuro2A细胞(ATCC CCL-131)、原代小鼠皮质神经元(Gibco)及衍生自人类诱导多能干细胞的iCell人类神经元中体外评估带条形码的AAV变体。图30中所述的AAV表达盒用于汇集评估,并标记来自pol II神经元特异性hSyn1启动子及pol III hU6遍在启动子的独特条形码定量。热度图中的值表示衍生自各AAV变体的NGS读段的百分比,且舍入为百分比的最接近十分位。这些结果是通过用于感染的池(pool)中各AAV变体的频率标准化。各AAV变体的亲本血清型根据随附图例着色。
图32展示带条形码的AAV变体(变体2、3、4、5、6、9、10、11、12、13、14、16、18、19、20、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、49)及对照血清型野生型AAV9、PHP.B及AAV2_HSPGKO于iCell人类星形胶质细胞及衍生自人类诱导多能干细胞的内皮细胞中的体外评估。图30中所述的载体基因组表达盒用于汇集评估,针对pol III hU6遍在启动子呈现数据,未进行hSyn1条形码量测,因为启动子在非神经元细胞类型中具有极小活性。热度图中的值表示衍生自各AAV变体的NGS读段的百分比,且舍入为百分比的最接近十分位。这些结果是通过用于感染的汇集物中各AAV变体的频率标准化。各AAV变体的亲本血清型根据随附图例着色。
图33展示在向C57BL/6J小鼠单侧脑室内施用之后,带条形码的AAV变体(变体2、3、4、5、6、9、10、11、12、13、14、16、18、19、20、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、49)及对照血清型野生型AAV9、PHP.B及AAV2_HSPGKO的体内评估。数据是根据以下CNS区域汇总:脑干(脑干、中脑)、小脑、皮质(运动皮质、感觉皮质、其余皮质)、深部脑区(海马区、下丘脑、纹状体、丘脑)及脊髓(颈部、胸部及腰部)。图30中所述的AAV表达盒用于汇集评估,标记来自pol II神经元特异性hSyn1启动子及pol III hU6遍在启动子的独特条形码定量。热度图中的值表示衍生自各AAV变体的NGS读段的百分比,且舍入为百分比的最接近十分位。这些结果是通过施用的汇集物中各AAV变体的频率标准化。各AAV变体的亲本血清型根据随附图例着色。
图34展示在向史泊格-多利大鼠单侧脑室内施用之后,带条形码的AAV变体(变体2、3、4、5、6、9、10、11、12、13、14、16、18、19、20、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、49)及对照血清型野生型AAV9、PHP.B及AAV2_HSPGKO的体内评估。数据是根据以下CNS区域汇总:脑干(脑干、中脑)、小脑、皮质(运动皮质、感觉皮质、其余皮质)、深部脑区(海马区、下丘脑、纹状体、丘脑)及脊髓(颈部、胸部及腰部)。图30中所述的AAV表达盒用于汇集评估,标记来自pol II神经元特异性hSyn1启动子及pol III hU6遍在启动子的独特条形码定量。热度图中的值表示衍生自各AAV变体的NGS读段的百分比,且舍入为百分比的最接近十分位。这些结果是通过施用的汇集物中各AAV变体的频率标准化。各AAV变体的亲本血清型根据随附图例着色。
图35展示在向非人类灵长类动物(食蟹猕猴)鞘内施用之后,带条形码的AAV变体(变体2、3、4、5、6、9、10、11、12、13、14、16、18、19、20、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、49)及对照血清型野生型AAV9、PHP.B及AAV2_HSPGKO的体内评估。所示的数据来自对分离自NHP组织的总RNA的分析。数据是根据以下CNS区域汇总:脑干(髓质、中脑、脑桥、黑质)、小脑(小脑、小脑蚓部)、皮质(内嗅皮质、额叶皮质、额眶回、梭状回、眶外侧回、眶内侧回、运动皮质、海马回、顶叶皮质、顶叶视觉皮质、扣带后回、感觉皮质、躯体感觉皮质、颞叶皮质、视觉皮质)、深部脑区(杏仁核、尾核、海马区、下丘脑、壳核、丘脑)及脊髓(颈部、胸部及腰部)。图30中所述的AAV表达盒用于汇集评估,标记来自pol II神经元特异性hSyn1启动子及pol III hU6遍在启动子的独特条形码定量。热度图中的值表示衍生自各AAV变体的NGS读段的百分比,且舍入为百分比的最接近十分位。这些结果是通过施用的汇集物中各AAV变体的频率标准化。各AAV变体的亲本血清型根据随附图例着色。
图36展示在向非人类灵长类动物(食蟹猕猴)鞘内施用之后,带条形码的AAV变体及对照血清型野生型AAV9、PHP.B及AAV2_HSPGKO的体内评估。所示的数据来自对分离自NHP组织的基因组DNA的分析。数据是根据以下CNS区域汇总:脑干(髓质、脑桥、黑质)、小脑、皮质(内嗅皮质、额叶皮质、运动皮质、顶叶皮质、躯体感觉皮质、颞叶皮质)、深部脑区(尾核、海马区、下丘脑、壳核、丘脑)及脊髓(颈部、胸部及腰部)。图30中所述的AAV表达盒用于汇集评估,标记来自pol II神经元特异性hSyn1启动子及pol III hU6遍在启动子的独特条形码定量。热度图中的值表示衍生自各AAV变体的NGS读段的百分比,且舍入为百分比的最接近十分位。这些结果是通过施用的汇集物中各AAV变体的频率标准化。各AAV变体的亲本血清型根据随附图例着色。
图37展示在向非人类灵长类动物(食蟹猕猴)鞘内施用之后,带条形码的AAV变体及对照血清型野生型AAV9、PHP.B及AAV2_HSPGKO的体内评估。所示的数据来自对分离自NHP组织的总RNA的分析。数据是根据以下CNS区域汇总:脑干(髓质、中脑、脑桥、黑质)、小脑(小脑、小脑蚓部)及皮质(内嗅皮质、额叶皮质、额眶回、梭状回、眶外侧回、眶内侧回、运动皮质、海马回、顶叶皮质、顶叶视觉皮质、扣带后回、感觉皮质、躯体感觉皮质、颞叶皮质、视觉皮质)。绘制的结果展示相比于野生型AAV9,各血清型的读段的标准化百分比的倍数增加。
图38展示在向非人类灵长类动物(食蟹猕猴)鞘内施用之后,带条形码的AAV变体及对照血清型野生型AAV9、PHP.B及AAV2_HSPGKO的体内评估。所示的数据来自对分离自NHP组织的总RNA的分析。数据是根据以下CNS区域汇总:深部脑区(杏仁核、尾核、海马区、下丘脑、壳核、丘脑)及脊髓(颈部、胸部及腰部)。绘制的结果展示相比于野生型AAV9,各血清型的读段的标准化百分比的倍数增加。
图39展示在向非人类灵长类动物(食蟹猕猴)鞘内施用之后,带条形码的AAV变体及对照血清型野生型AAV9、PHP.B及AAV2_HSPGKO的体内评估。所示的数据来自对分离自NHP组织的基因组DNA的分析。数据是根据以下CNS区域汇总:脑干(髓质、脑桥、黑质)、小脑及皮质(内嗅皮质、额叶皮质、运动皮质、顶叶皮质、躯体感觉皮质、颞叶皮质)。绘制的结果展示相比于野生型AAV9,各血清型的读段的标准化百分比的倍数增加。
图40展示在向非人类灵长类动物(食蟹猕猴)鞘内施用之后,带条形码的AAV变体及对照血清型野生型AAV9、PHP.B及AAV2_HSPGKO的体内评估。所示的数据来自对分离自NHP组织的基因组DNA的分析。数据是根据以下CNS区域汇总:深部脑区(尾核、海马区、下丘脑、壳核、丘脑)及脊髓(颈部、胸部及腰部)。绘制的结果展示相比于野生型AAV9,各血清型的读段的标准化百分比的倍数增加。
图41展示跨越不同物种的血清型效能的概述。展示的数据是针对hSyn1条形码RNA分析,并根据非人类灵长类动物CNS中的效能对血清型排序。
图42展示跨越不同物种的血清型效能的概述。展示的数据是针对hU6条形码RNA分析,并根据非人类灵长类动物CNS中的效能对血清型排序。
发明详述
本公开提供了开发与天然AAV血清型相比具有所需特征的AAV衣壳的方法和组合物。这些衣壳可用于例如将基因组工程化分子和基因治疗分子递送至靶细胞、细胞系或组织(例如,体外或体内)以治疗有需要的受试者。
许多组织是高度异质的并且含有限制腺相关病毒(AAV)转导的生物屏障。功能选择策略能够从能够转导组织内特定细胞类型的文库中选择AAV变体。此外,选择压力被设计成鉴定在介导进入后步骤和驱动转基因表达方面表现出色的变体。为了建立适用于所有物种和组织的功能选择策略,在AAV病毒基因组中引入了几种修饰。在本文中,我们描述了生成AAV变体文库的方法和功能选择能够转导所需组织、细胞和/或细胞器的变体的方法。这些方法适于开发适用于所有物种、细胞类型和靶细胞器的AAV变体。
概述
除非另有说明,本文公开的方法的实践以及组合物的制备和使用采用分子生物学、生物化学、染色质结构和分析、计算化学、细胞培养、重组DNA和相关领域中的常规技术,这些在本领域技术人员的技能范围内。这些技术在文献中有充分的解释。例如参见Sambrook等人,MOLECULAR CLONING:A LABORATORY MANUAL,第二版,Cold Spring HarborLaboratory Press,1989和第三版,2001;Ausubel等人,CURRENT PROTOCOLS IN MOLECULARBIOLOGY,John Wiley&Sons,New York,1987和定期更新;METHODS IN ENZYMOLOGY系列,Academic Press,San Diego;Wolffe,CHROMATIN STRUCTURE AND FUNCTION,第三版,Academic Press,San Diego,1998;METHODS IN ENZYMOLOGY,Vol.304,“Chromatin”(P.M.Wassarman和A.P.Wolffe编),Academic Press,San Diego,1999;和METHODS INMOLECULAR BIOLOGY,Vol.119,“Chromatin Protocols”(P.B.Becker编)Humana Press,Totowa,1999。
定义
术语“此处”是指整个申请。
除非本文另有定义,否则本申请中使用的科学和技术术语应具有本发明所属领域的普通技术人员通常理解的含义。通常,与本文所述的化合物、组合物和方法相关使用的命名法是本领域熟知和常用的那些。
应当理解,本文描述的任何实施方案,包括在本公开的不同方面和说明书的不同部分(包括仅在实施例中描述的实施方案)下描述的那些,可以与本发明的一个或多个其他实施方案组合,除非明确排除或不适合。实施例的组合不限于通过多个从属权利要求要求保护的那些特定组合。
以上所有内容以及本申请中提及的任何其他出版物、专利和公开的专利申请通过引用特别地并入本文。如有冲突,以本说明书,包括其具体定义为准。
贯穿本说明书,词语“包括”或诸如“包含”或“含有”等变化形式将被理解为暗示包括所陈述的整数(或组分)或者整数(或组分)组,但不包括排除任何其他整数(或组分)或者整数(或组分)组。
在整个说明书中,在组合物被描述为具有、包括或包含(或其变化形式)特定组分的情况下,预期组合物也可基本上由所述组分组成,或由所述组分组成。类似地,在方法或过程被描述为具有、包括或包含特定过程步骤的情况下,该过程也可基本上由或由所述过程步骤组成。此外,应当理解,只要本文描述的组合物和方法保持可操作,则步骤的顺序或执行某些动作的顺序是无关紧要的。此外,可以同时进行两个或更多个步骤或动作。
术语“包括”用于表示“包括但不限于”。“包括”和“包括但不限于”可互换使用。
如本文所用,“大约”或“大致”是指在由本领域普通技术人员确定的特定值的可接受误差范围内,这将部分取决于如何测量或确定该值,即测量系统的局限性。
在描述要素的上下文中(尤其是在以下权利要求的上下文中),术语“一个/种”和“所述”和“该”以及类似指代的使用应被解释为涵盖单数和复数,除非本文另有说明或与上下文明显矛盾。
本文所用的术语“或”应理解为“和/或”,除非上下文另有明确说明。
除非本文另有说明,否则本文对数值范围的记载仅旨在用作单独提及落入该范围内的每个单独数值的简便方法,并且每个单独数值都被并入说明书中,就好像它在本文中被单独记载一样。除非本文另有说明或与上下文明显矛盾,否则本文所述的所有方法都可以任何合适的顺序进行。除非另有说明,否则本文提供的任何和所有示例或示例性语言(例如,“诸如”)的使用仅旨在更好地阐明实施方式,并且不对权利要求的范围构成限制。说明书中的任何语言都不应被解释为将任何未要求保护的元素视为必不可少的。
术语“核酸”、“多核苷酸”和“寡核苷酸”可互换使用,是指线性或环状构象、单链或双链形式的脱氧核糖核苷酸或核糖核苷酸聚合物。出于本公开的目的,这些术语不应被解释为对聚合物长度的限制。该术语可包括天然核苷酸的已知类似物,以及在碱基、糖和/或磷酸部分(例如,硫代磷酸酯骨架)中修饰的核苷酸。通常,具体核苷酸的类似物具有相同的碱基配对特异性;即A的类似物将与T碱基配对。
术语“多肽”、“肽”和“蛋白质”可互换使用,指氨基酸残基的聚合物。该术语也适用于氨基酸聚合物,其中一个或多个氨基酸是相应的天然存在氨基酸的化学类似物或修饰衍生物。
“结合”是指大分子之间(例如,蛋白质和核酸之间)的序列特异性、非共价相互作用。并非所有结合相互作用的组成部分都需要序列特异性(例如,与DNA骨架中的磷酸残基接触),只要相互作用作为一个整体是序列特异性的即可。这种相互作用的特征通常是解离常数(Kd)为10-6M-1或更低。“亲和力”是指结合强度:增加的结合亲和力与较低的Kd相关。“非特异性结合”是指在任何感兴趣的分子(例如工程化核酸酶)和不依赖于靶序列的大分子(例如DNA)之间发生的非共价相互作用。
“结合蛋白”是能够与另一分子非共价结合的蛋白质。结合蛋白可以结合例如DNA分子(DNA结合蛋白)、RNA分子(RNA结合蛋白)和/或蛋白分子(蛋白结合蛋白)。在蛋白质结合蛋白质的情况下,它可以与自身结合(形成同二聚体、同三聚体等)和/或它可以与不同蛋白质的一个或多个分子结合。结合蛋白可以具有多于一种类型的结合活性。例如,锌指蛋白具有DNA结合、RNA结合和蛋白质结合活性。在RNA指导的核酸酶系统的情况下,RNA指导与核酸酶成分(Cas9或Cfp1)是异源的,两者都可以被改造。
“DNA结合分子”是可以结合DNA的分子。这种DNA结合分子可以是多肽、蛋白质的结构域、较大蛋白质内的结构域或多核苷酸。在一些实施方案中,多核苷酸是DNA,而在其他实施方案中,多核苷酸是RNA。在一些实施方案中,DNA结合分子是核酸酶的蛋白质结构域(例如FokI结构域),而在其他实施方案中,DNA结合分子是RNA引导的核酸酶(例如Cas9或Cpf1)的引导RNA组分。
“DNA结合蛋白”(或结合域)是以序列特异性方式结合DNA的蛋白质或更大蛋白质内的域,例如通过一个或多个锌指或通过与锌指蛋白或TALE中的一个或多个RVD相互作用。术语锌指DNA结合蛋白通常缩写为锌指蛋白或ZFP。
“锌指DNA结合蛋白”(或结合域)是一种蛋白质或较大蛋白质内的域,其通过一个或多个锌指以序列特异性方式结合DNA,锌指是结合域内的氨基酸序列区域,其结构通过锌离子的配位而稳定。术语锌指DNA结合蛋白通常缩写为锌指蛋白或ZFP。
“TALE DNA结合域”或“TALE”是包含一个或多个TALE重复结构域/单元的多肽。所述重复结构域参与TALE与其同源靶DNA序列的结合。单个“重复单元”(也称为“重复”)的长度通常为33-35个氨基酸,并且与天然存在的TALE蛋白内的其他TALE重复序列至少表现出一些序列同源性。参见例如美国专利第8,586,526号,其全部内容通过引用并入本文。
“TtAgo”是被认为参与基因沉默的原核Argonaute蛋白。TtAgo来源于细菌嗜热栖热菌(Thermus thermophilus)。参见例如Swarts等人,出处同前;G.Sheng等人(2013)Proc.Natl.Acad.Sci.U.S.A.111,652)。“TtAgo系统”是被TtAgo酶切割所需的所有元件,包括例如引导DNA。
“切割”是指DNA分子的共价骨架的断裂。切割可通过多种方法引发,包括但不限于磷酸二酯键的酶促或化学水解。单链切割和双链切割都是可能的,并且双链切割可以作为两个不同的单链切割事件的结果而发生。DNA切割可导致产生平末端或交错末端。在某些实施方案中,融合多肽用于靶向双链DNA切割。
如本文所用,术语“编辑”是指其中核苷酸碱基被修饰从而将点突变引入DNA链的过程。在DNA中引入点突变必然会在从编辑过的DNA转录的任何mRNA中重现所述变化。腺嘌呤和胞苷脱氨酶从它们各自的核苷酸靶点上去除氨基,将它们分别转化为肌苷和尿苷。在DNA修复或复制过程中,肌苷被聚合酶识别为鸟嘌呤,尿苷被聚合酶识别为胸腺嘧啶,导致在已编辑的双链DNA中A:T碱基对转化为G:C碱基对,或C:G碱基对转化为T:A碱基对。
术语“序列”是指任何长度的核苷酸序列,可以是DNA或RNA;可以是线性的、环状的或分支的,并且可以是单链的或双链的。术语“转基因”是指插入基因组的核苷酸序列。转基因可以是任何长度,例如长度在2和100,000,000个核苷酸之间(或其间或以上的任何整数值)、长度在约100和100,000个核苷酸之间(或其间的任何整数)、长度在约2000和20,000个核苷酸之间(或其间的任何值)或约5到15kb之间(或其间的任何值)。
“染色体”是包含细胞基因组的全部或部分的染色质复合物。细胞的基因组通常以其核型表征,它是构成细胞基因组的所有染色体的集合。细胞的基因组可包含一条或多条染色体。
“附加体”是复制的核酸、核蛋白复合物或包含不是细胞染色体核型的一部分的核酸的其他结构。附加体的例子包括质粒、小环和某些病毒基因组。本文所述的肝脏特异性构建体可以附加体形式维持,或者可以稳定地整合到细胞中。
“外源”分子是通常不存在于细胞中但可以通过一种或多种遗传、生物化学或其他方法引入细胞中的分子。“细胞中的正常存在”是根据细胞的特定发育阶段和环境条件确定的。因此,例如,仅在肌肉胚胎发育期间存在的分子对于成体肌肉细胞而言是外源分子。类似地,热休克诱导的分子对于非热休克细胞而言是外源性分子。外源分子可包括例如功能异常的内源分子的功能版本或功能正常的内源分子的功能障碍版本。
外源分子可以是小分子,例如通过组合化学过程产生的小分子,或大分子,例如蛋白质、核酸、碳水化合物、脂质、糖蛋白、脂蛋白、多糖、上述分子的任何修饰的衍生物,或包含一种或多种上述分子的任何复合物,等等。核酸包括DNA和RNA,可以是单链或双链;可以是线性的、分支的或圆形的;并且可以是任意长度。核酸包括那些能够形成双链体的核酸,以及形成三链体的核酸。参见例如美国专利号5,176,996和5,422,251。蛋白质包括但不限于DNA结合蛋白、转录因子、染色质重塑因子、甲基化DNA结合蛋白、聚合酶、甲基化酶、去甲基化酶、乙酰化酶、去乙酰化酶、激酶、磷酸酶、连接酶、去泛素化酶、整合酶、重组酶、连接酶、拓扑异构酶、旋转酶和解旋酶。
外源分子可以是与内源分子相同类型的分子,例如外源蛋白质或核酸。例如,外源核酸可包含感染性病毒基因组、引入细胞的质粒或附加体、或通常不存在于细胞中的染色体。将外源分子引入细胞的方法是本领域技术人员已知的,包括但不限于脂质介导的转移(即脂质粒,包括中性和阳离子脂质)、电穿孔、直接注射、细胞融合、颗粒轰击、磷酸钙共沉淀、DEAE-葡聚糖介导的转移和病毒载体介导的转移。外源分子也可以是与内源分子相同类型的分子,但源自与细胞源自的不同物种。例如,可以将人核酸序列引入最初源自小鼠或仓鼠的细胞系。
相比的下,“内源性”分子是在特定环境条件下在特定发育阶段通常存在于特定细胞中的分子。例如,内源性核酸可包含染色体、线粒体、叶绿体或其他细胞器的基因组,或天然存在的附加体核酸。额外的内源分子可以包括蛋白质,例如转录因子和酶。
如本文所用,术语“外源核酸的产物”包括多核苷酸和多肽产物,例如转录产物(多核苷酸,例如RNA)和翻译产物(多肽)。
术语“异源的”是指源自与与其进行比较的实体的其余部分的基因型不同的实体。例如,通过基因工程技术引入源自不同物种的质粒或载体的多核苷酸是异源多核苷酸。从其天然编码序列中取出并与未发现天然与的连接的编码序列可操作地连接的启动子是异源启动子。因此,例如,包含编码异源基因产物的异源核酸序列的rAAV是包含通常不包含在天然存在的野生型AAV中的多核苷酸的rAAV,并且编码的异源基因产物是通常不由天然存在的野生型AAV编码的基因产物。
术语“融合(fusion/fused)”分子或其变化形式是指其中两个或更多个亚基分子连接的分子,优选共价连接。亚基分子可为相同化学类型的分子,或可为不同化学类型的分子。融合分子的实例包括但不限于融合蛋白(例如蛋白质DNA结合域与裂解域之间的融合)、与裂解域可操作地缔合的多核苷酸DNA结合域(例如sgRNA)之间的融合及融合核酸(例如编码融合蛋白的核酸)。
融合蛋白在细胞中的表达可由将融合蛋白递送至细胞或通过将编码融合蛋白的多核苷酸递送至细胞而产生,其中所述多核苷酸经转录,且转录物经翻译以产生融合蛋白。反式剪接、多肽裂解及多肽连接也可涉及蛋白质在细胞中的表达。将多核苷酸及多肽递送至细胞的方法呈现于本发明中的其他地方。
出于本发明的目的,“基因”包括编码基因产物(参见下文)的DNA区,以及调节基因产物产生的所有DNA区,无论此类调节序列是否邻近于编码序列和/或转录序列。因此,基因包括(但不一定限于)启动子序列、终止子、翻译调节序列(诸如核糖体结合位点及内部核糖体入口位点)、增强子、沉默子、绝缘子、边界元件、复制起点、基质附着位点及基因座控制区。
“基因表达”是指基因中所含的信息转换为基因产物。基因产物可为基因的直接转录产物(例如mRNA、tRNA、rRNA、反义RNA、核糖核酸酶、结构RNA或任何其他类型的RNA),或由mRNA翻译产生的蛋白质。基因产物亦包括通过诸如加帽、聚腺苷酸化、甲基化及编辑的方法修饰的RNA,及通过例如甲基化、乙酰化、磷酸化、泛素化、ADP核糖基化、豆蔻酰化及糖基化修饰的蛋白质。
基因表达的“调节”是指基因活性的变化。表达调节可包括但不限于基因活化及基因抑制。基因组编辑(例如切割、改变、失活、随机突变)可用于调节表达。基因失活是指相比于不包括如本文所述的ZFP、TALE或CRISPR/Cas系统的细胞而言,基因表达的任何降低。因此,基因失活可为部分或完全的。
“所关注区域”为细胞染色质的任何区域,诸如基因或在基因内或附近的非编码序列,其中期望结合外源分子。结合可出于靶向DNA裂解和/或靶向重组的目的。所关注区域可存在于例如染色体、游离体、细胞器基因组(例如线粒体、叶绿体)或感染性病毒基因组中。所关注区域可在基因的编码区内;在经转录的非编码区域诸如前导序列、尾随序列或内含子内;或在未经转录的区域内,在编码区上游或下游。所关注区域的长度可小至单个核苷酸对或多达2,000个核苷酸对,或核苷酸对的任何整数值。
“报道基因”或“报道序列”是指产生在分析中易于量测的蛋白质产物(“报道蛋白”)的任何序列。分析可以、但未必是常规的。适合的报道基因包括但不限于编码介导抗生素抗性(例如氨苄青霉素抗性、新霉素抗性、G418抗性、嘌呤霉素抗性)的蛋白质的序列、编码着色或荧光或发光蛋白质(例如绿色荧光蛋白、增强型绿色荧光蛋白、红色荧光蛋白、荧光素酶)及介导增强的细胞生长和/或基因扩增的蛋白质(例如二氢叶酸还原酶)的序列。表位标签包括例如FLAG、His、myc、Tap、HA或任何可检测氨基酸序列的一或多个拷贝。“表达标签”包括编码报道子的序列,所述报道子可操作地连接于所需基因序列以监测所关注基因的表达。
“真核”细胞包括但不限于真菌细胞(诸如酵母)、植物细胞、动物细胞、哺乳动物细胞及人类细胞(例如T细胞),包括干细胞(多能及多潜能)。
如本文所用,术语“条形码”是指独特寡核苷酸序列(例如5、6、7、8、9、10、12、15、20、25、30、50、75、100个核苷酸),其具有用作鉴定其所掺入的核酸序列的手段的特测序列。条形码系用作区分或鉴定文库中的各成员(例如变体)的手段。
术语“可操作连接”及“可操作地连接”针对两种或更多种组分(诸如序列元件)的并列可互换使用,其中所述组分被安排成所述两种组分均正常起作用,且使得组分中的至少一个可介导施加于其他组分中的至少一个的功能成为可能。举例来说,若转录调节序列诸如启动子响应于一或多种转录调节因子的存在或不存在而控制编码序列的转录水平,则所述转录调节序列以可操作方式连接于编码序列。转录调节序列一般以顺式与编码序列可操作地连接,但不必与其直接相邻。举例而言,增强子是一种以可操作方式连接编码序列的转录调节序列,尽管它们并不毗邻。
蛋白质、多肽或核酸的“功能片段”是这样的蛋白质、多肽或核酸,其序列与全长蛋白质、多肽或核酸不同,但保留与所述全长蛋白质、多肽或核酸相同的功能。功能片段可具有比对应的天然分子更多、更少或与其相同数目的残基,和/或可含有一或多个氨基酸或核苷酸取代。测定核酸或蛋白质功能(例如编码功能、与另一核酸杂交的能力、酶活性分析)的方法是本领域中熟知的。
多核苷酸“载体”或“构建体”能够将基因序列转移至靶细胞。通常,“载体构建体”、“表达载体”、“表达构建体”、“表达盒”及“基因转移载体”意谓能够导引所关注基因的表达且可将基因序列转移至靶细胞的任何核酸构建体。因此,该术语包括克隆和表达载体以及整合载体。
术语“受试者”及“患者”可互换使用,是指哺乳动物,包括但不限于人类患者及非人类灵长类动物,以及实验动物,诸如兔、狗、猫、大鼠、小鼠及其他动物。因此,如本文所用的术语“受试者”或“患者”意谓可施用本发明的表达盒的任何哺乳动物患者或受试者。本发明的受试者包括患有病症的那些受试者。
如本文所用的术语“治疗(treating/treatment)”是指降低症状的严重度和/或频率、消除症状和/或根本病因、预防出现症状和/或其根本病因及改善或补救损伤。癌症、单基因疾病及移植物抗宿主疾病为可使用本文所述的组合物及方法治疗的病况的非限制性实例。
如本文所用的术语“有效量”为足以实现有益或所需临床结果的量。有效量可以按一或多次给药来施用。出于本发明的目的,化合物(例如感染性rAAV病毒粒子)的有效量为足以减轻、改善、稳定、逆转、预防特定疾病状态(例如肌肉疾病)(和/或与其相关的症状)、减缓或延迟其进展的量。因此,感染性rAAV病毒颗粒的有效量为能够将异源核酸有效递送至受试者的靶细胞(或多个靶细胞)的感染性rAAV病毒颗粒的量。可使用本技术中充分理解的技术,例如RT-PCR、蛋白质印迹法、ELISA、荧光或其他报道子读出等技术检测细胞或组织中由异源核酸序列编码的基因产物(RNA、蛋白质)而在临床前确定有效量。可通过例如使用本领域中已知的方法,例如本文所述以及本领域中已知的6分钟行走测试、左心室射血分数、手持式肌力测定法、Vignos量表及类似方法检测疾病发作或进展的变化而在临床上确定有效量。
“染色质”为包含细胞基因组的核蛋白结构。细胞染色质包含核酸,主要为DNA,及蛋白质,包括组蛋白及非组蛋白染色体蛋白质。大部分真核细胞染色质以核小体形式存在,其中核小体核心包含与八聚体相关的大约150个碱基对的DNA,该八聚体包含组蛋白H2A、H2B、H3及H4各两个;且接头DNA(取决于生物体,长度可变)在核小体核心之间延伸。组蛋白H1的分子一般与接头DNA相关联。出于本发明的目的,术语“染色质”意欲涵盖所有类型的细胞核蛋白(原核及真核)。细胞染色质包括染色体及游离型染色质。
术语“病毒基因组”是指侧接有顺式作用的核酸序列的核酸序列,所述顺式作用的核酸序列介导将核酸包装至病毒衣壳中。对于例如AAV及细小病毒,众所周知位于病毒基因组的5'及3'端的“反向末端重复序列”(ITR)具有此功能,且ITR可介导将异源,例如非野生型病毒基因组包装至病毒衣壳中。
术语“元件”是指某物的单独或独特部分,例如在较长核酸序列内的具有单独功能的核酸序列。术语“调节元件”及“表达控制元件”在本文中可互换使用,是指可影响可操作地连接的编码序列在特定宿主生物体中的表达的核酸分子。这些术语被广泛使用,涵盖促进或调节转录的所有元件,包括启动子、RNA聚合酶及转录因子的基本相互作用所需的核心元件、上游元件、增强子及反应元件(参见例如Lewin,“Genes V”(Oxford UniversityPress,Oxford)第847-873页)。原核生物中的例示性调节元件包括启动子、操纵子序列及核糖体结合位点。用于真核细胞中的调节元件可包括但不限于转录及翻译控制序列,诸如启动子、增强子、剪接信号、聚腺苷酸化信号、终止子、蛋白质降解信号、内部核糖体进入元件(IRES)、2A序列等,其提供和/或调控宿主细胞中编码序列的表达和/或所编码多肽的产生。
如本文所用,术语“变体”是指具有与参考多核苷酸或多肽基本上类似的序列的多核苷酸或多肽。在多核苷酸的情况下,与参考多核苷酸相比,变体可在5'端、3'端和/或一或多个内部位点处具有一或多个核苷酸的缺失、取代、添加。变体与参考多核苷酸之间的序列类似性和/或差异可使用本领域中已知的常规技术(例如聚合酶链反应(PCR)及杂交技术)检测。变体多核苷酸也包括合成衍生的多核苷酸,诸如例如通过使用定点诱变产生的多核苷酸。一般而言,如通过本领域熟练技术人员已知的序列比对程序所测定的,多核苷酸(包括但不限于DNA)的变体可与参考多核苷酸具有至少约50%、约55%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或更大序列同一性。在多肽的情况下,与参考多肽相比,变体可具有一或多个氨基酸的缺失、取代、添加。变体与参考多肽之间的序列相似性和/或差异可使用本领域熟练技术人员已知的常规技术(例如蛋白质印迹)检测。一般而言,如通过本领域的熟练技术人员已知的序列比对程序所测定的,多肽的变体与参考多肽可以具有至少约60%、约65%、约70%、约75%、约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或更大的序列同一性。在一些情况下,术语“变体”也可用于描述包含变体衣壳序列的AAV。
术语“AAV”或“腺相关病毒”是指病毒的细小病毒属(Parvoviridae)内的依赖细小病毒(Dependoparvovirus)。举例而言,AAV可为衍生自天然存在的“野生型”病毒的AAV、衍生自被包装到衍生自由天然存在的cap基因编码的衣壳蛋白的衣壳中的rAAV基因组和/或被包装到衍生自由非天然衣壳cap基因编码的衣壳蛋白的衣壳中的rAAV基因组的AAV。出于本文中的本发明的目的,术语“AAV”为腺相关病毒的缩写,包括但不限于该病毒自身及其衍生物。除非另有指示,否则该术语是指所有亚型或血清型,以及能够复制型及重组形式两者。术语“AAV”包括但不限于AAV1型(AAV-1或AAVl)、AAV2型(AAV-2或AAV2)、AAV 3A型(AAV-3A或AAV3A)、AAV 3B型(AAV-3B或AAV3B)、AAV 4型、(AAV-4或AAV4)、AAV 5型(AAV-5或AAV5)、AAV 6型(AAV-6或AAV6)、AAV 7型(AAV-7或AAV7)、AAV 8型(AAV-8或AAV8)、AAV 9型(AAV-9或AAV9)、AAV 10型(AAV-10或AAV10或AAVrhlO)、禽类AAV、牛类AAV、犬类AAV、山羊类AAV、马类AAV、灵长类AAV、非灵长类AAV及绵羊类AAV。“灵长类AAV”是指感染灵长类动物的AAV,“非灵长类AAV”是指感染非灵长类哺乳动物的AAV,“牛类AAV”是指感染牛类哺乳动物的AAV,等等。
各种血清型的AAV的基因组序列,以及天然末端重复序列(TR)、Rep蛋白及衣壳亚基的序列是本领域中已知的。此类序列可发现于文献中或诸如GenBank的公共数据库中。参见例如GenBank登录号NC_002077.1(AAVl)、AF063497.1(AAVl)、NC 001401.2(AAV2)、AF043303.1(AAV2)、J01901.1(AAV2)、U48704.1(AAV3A)、NC_001729.1(AAV3A)、AF028705.1(AAV3B)、NC_001829.1(AAV4)、U89790.1(AAV4)、NC_006152.1(AA5)、AF085716.1(AAV-5)、AF028704.1(AAV6)、NC_006260.1(AAV7)、AF513851.1(AAV7)、AF513852.1(AAV8)NC006261.1(AAV-8)、AY530579.1(AAV9)、AAT46337(AAV10)及AAO88208(AAVrhlO);其关于教导AAV核酸及氨基酸序列的公开内容以引用的方式并入本文中。也参见例如Srivistava等人(1983)J.Virology 45:555;Morini等人(1998)J.Virology 71:6823;Chiorini等人(1999)J.Virology 73:1309;Bantel-Schaal等人(1999)J.Virology 73:939;Xiao等人(1999)J.Virology 73:3994;Muramatsu等人(1996)Virology 221:208;Shade等人(1986)J.Virol.58:921;Gao等人(2002)Proc.Nat.Acad.Sci.USA 99:11854;Moris等人(2004)Virology 33:375-383;国际专利公开号WO 00/28061、WO 99/61601、WO 98/11244;及美国专利第6,156,303号。
术语“rAAV”是指“重组AAV”。在一些实施方案中,重组AAV具有其中部分或所有rep及cap基因已经被异源序列取代的AAV基因组。若AAV病毒颗粒包含异源多核苷酸(亦即,除野生型AAV基因组以外的多核苷酸,例如待递送至靶细胞的转基因、核酸酶系统、待递送至靶细胞的RNAi药剂或CRISPR药剂等),则通常将其称为“重组AAV(rAAV)病毒颗粒”或“rAAV病毒颗粒”。一般而言,异源多核苷酸侧接有至少一个、通常是两个AAV反向末端重复序列(ITR)。
术语“cap基因”或“衣壳基因”是指编码形成或促进形成病毒的衣壳或蛋白质外壳的衣壳蛋白的核酸序列。在AAV的情况下,衣壳蛋白可为VP1、VP2或VP3。对于其他细小病毒,衣壳蛋白的名称及数目可不同。
术语“rep基因”是指编码病毒复制及生产所需的非结构蛋白(rep78、rep68、rep52及rep40)的核酸序列。
术语“包装”是指引起AAV颗粒的装配及衣壳化的一系列细胞内事件。AAV“rep”及“cap”基因是指编码腺相关病毒的复制及衣壳化蛋白质的多核苷酸序列。AAV rep及cap在本文中被称作AAV“包装基因”。
术语AAV的“辅助病毒”是指允许AAV(例如,野生型AAV)由哺乳动物细胞复制及包装的病毒。AAV的各种此类辅助病毒是本领域中已知的,包括腺病毒、疱疹病毒及痘病毒(诸如牛痘)。腺病毒涵盖多个不同亚组,但亚组C的腺病毒5型最常用。已知人类、非人类哺乳动物及禽类来源的多种腺病毒,并可从保藏机构(诸如ATCC)获得。疱疹家族的病毒包括例如单纯疱疹病毒(HSV)及Epstein-Bar病毒(EBV)以及巨细胞病毒(CMV)及假狂犬病病毒(PRV);它们也可获自保藏机构诸如ATCC。
术语“辅助病毒功能”是指在辅助病毒基因组中编码的、允许AAV复制及包装(结合本文所述的其他复制及包装需求)的功能。如本文所述,“辅助病毒功能”可以多种方式提供,包括通过提供辅助病毒或通过以反式向生产者细胞提供例如编码必需功能的多核苷酸序列。举例而言,将包含编码一或多种腺病毒蛋白质的核苷酸序列的质粒或其他表达载体与rAAV载体一起转染至生产者细胞中。
术语“感染性”病毒或病毒颗粒为包含能够组装的病毒衣壳且能够将多核苷酸组分递送至病毒物种对其具向性的细胞中的病毒或病毒颗粒。该术语未必暗示病毒的任何复制能力。用于计数感染性病毒颗粒的分析描述于在本发明中的其他地方及本领域中。病毒感染性可表示为感染性病毒颗粒与总病毒颗粒的比。确定感染性病毒颗粒与总病毒颗粒的比的方法为本领域中已知的。参见例如Grainger等人(2005)Mol.Ther.11:S337(描述TCID50感染滴度分析);及Zolotukhin等人(1999)Gene Ther.6:973。
如本文所用的术语“向性”(tropism)是指被特定宿主物种的细胞或宿主物种内的特定细胞类型的病毒(例如AAV)优先靶向。举例而言,相对于仅可感染肺及肌肉细胞的病毒,可感染心脏、肺、肝及肌肉的细胞的病毒具有更广(亦即,增加)的向性。向性亦可包括病毒对宿主的特定细胞表面分子类型的依赖性。举例而言,一些病毒可仅感染具有表面糖胺聚糖的细胞,而其他病毒可仅感染具有唾液酸的细胞(此类相关性可使用缺乏特定类别分子的各种细胞系作为病毒感染的潜在宿主细胞来测试)。在一些情况下,病毒向性描述了病毒的相对偏好。举例而言,第一病毒可能能够感染所有细胞类型,但感染具有表面糖胺聚糖的那些细胞要成功得多。若第二病毒也偏好相同特征(例如第二病毒感染具有表面糖胺聚糖的那些细胞同样更加成功),则可将第二病毒视为与第一病毒具有相似(或相同)的向性,即使绝对转导效率并不相似。举例而言,第二病毒可能比第一病毒更高效地感染测试的每一给定的细胞类型,但若相对偏好相似(或相同),则仍可将第二病毒视为与第一病毒具有相似(或相同)的向性。在一些实施方式中,相对于天然存在的病毒颗粒,包含个体变体AAV衣壳蛋白的病毒颗粒的向性不改变。在一些实施方式中,相对于天然存在的病毒颗粒,包含个体变体AAV衣壳蛋白的病毒颗粒的向性扩大(即变宽)。在一些实施方式中,相对于天然存在的病毒颗粒,包含个体变体AAV衣壳蛋白的病毒颗粒的向性变小。
术语“有复制能力的”病毒(例如有复制能力的AAV)是指在表型上为野生型的病毒,其为感染性的,并且也能够在被感染细胞中(即在辅助病毒或辅助病毒功能存在下)复制。在AAV的情况下,复制能力一般需要存在功能性AAV包装基因。一般而言,由于缺乏一或多种AAV包装基因,如本文所述的rAAV载体在哺乳动物细胞中(尤其在人类细胞中)时不能复制的。通常,此类rAAV载体缺乏任何AAV包装基因序列,以使得由于AAV包装基因与进入的rAAV载体之间的重组产生有复制能力的AAV的可能性降至最低。在许多实施方式中,如本文所述的rAAV载体制剂为含有很少量(若存在的话)有复制能力的AAV(rcAAV,也称为RCA)(例如小于约1个rcAAV/102个rAAV颗粒、小于约1个rcAAV/104个rAAV颗粒、小于约1个rcAAV/10个rAAV颗粒、小于约1个rcAAV/1012个rAAV颗粒或无rcAAV)的制剂。
“文库”可以是大量线性核酸、质粒、病毒颗粒或病毒载体等的形式。文库将包括至少两种核酸、质粒、病毒颗粒、病毒载体等。
AAV变体的文库
在一个方面,本文所公开的主题涉及开发编码相比于天然AAV血清型具有所需特征的AAV衣壳蛋白的文库。因此,本文描述了用于产生相比于天然AAV血清型具有所需特征的AAV衣壳的AAV变体的文库。在一些实施方式中,所述所需特征为相比于天然AAV血清型而言增强的细胞或组织向性。在一些实施方式中,所述所需特征为避免预先存在的宿主抗体反应。在一些实施方式中,所述所需特征为降低的免疫原性以免引起宿主反应。
在一些实施方式中,本发明的文库的各成员包含a)编码AAV变体衣壳蛋白的核酸序列,该AAV变体衣壳蛋白包含插入至变体衣壳蛋白的高变环和/或表面暴露环中的肽;及以下中的一种或多种:b)所述核酸序列中位于a)的AAV变体衣壳蛋白中的肽插入位点侧翼的一或多个沉默突变;c)编码定位信号的核酸;d)包含条形码的核酸;及e)编码报道蛋白的核酸。
在一些实施方式中,本发明的文库的各成员包含a)编码AAV变体衣壳蛋白的核酸序列,该AAV变体衣壳蛋白包含插入至变体衣壳蛋白的高变环和/或表面暴露环中的肽;及以下中的两种或更多种:b)所述核酸序列中位于a)的AAV变体衣壳蛋白中的肽插入位点侧翼的一或多个沉默突变;c)编码定位信号的核酸;d)包含条形码的核酸;及e)编码报道蛋白的核酸。
在一些实施方式中,本发明的文库的各成员包含a)编码AAV变体衣壳蛋白的核酸序列,该AAV变体衣壳蛋白包含插入至变体衣壳蛋白的高变环和/或表面暴露环中的肽;及以下中的三种或更多种:b)所述核酸序列中位于a)的AAV变体衣壳蛋白中的肽插入位点侧翼的一或多个沉默突变;c)编码定位信号的核酸;d)包含条形码的核酸;及e)编码报道蛋白的核酸。
在一些实施方式中,本发明的文库的各成员包含a)编码AAV变体衣壳蛋白的核酸序列,该AAV变体衣壳蛋白包含插入至变体衣壳蛋白的高变环和/或表面暴露环中的肽;及b)所述核酸序列中位于a)的AAV变体衣壳蛋白中的肽插入位点侧翼的一或多个沉默突变;c)编码定位信号的核酸;d)包含条形码的核酸;及e)编码报道蛋白的核酸。
在一些实施方式中,本发明的文库的各成员包含a)AAV变体衣壳蛋白,其包含插入至变体衣壳蛋白的高变环和/或表面暴露环中的肽;及以下中的一种或多种:b)编码a)的AAV变体衣壳蛋白的核酸中位于所述肽插入位点侧翼的核酸序列内的一或多个沉默突变;c)编码定位信号的核酸;d)包含条形码的核酸;及e)编码报道蛋白的核酸。
在一些实施方式中,本发明的文库的各成员包含a)AAV变体衣壳蛋白,其包含插入至变体衣壳蛋白的高变环和/或表面暴露环中的肽;及以下中的两种或更多种:b)编码a)的AAV变体衣壳蛋白的核酸中位于所述肽插入位点侧翼的核酸序列内的一或多个沉默突变;c)编码定位信号的核酸;d)包含条形码的核酸;及e)编码报道蛋白的核酸。
在一些实施方式中,本发明的文库的各成员包含a)AAV变体衣壳蛋白,其包含插入至变体衣壳蛋白的高变环和/或表面暴露环中的肽;及以下中的三种或更多种:b)编码a)的AAV变体衣壳蛋白的核酸中位于所述肽插入位点侧翼的核酸序列内的一或多个沉默突变;c)编码定位信号的核酸;d)包含条形码的核酸;及e)编码报道蛋白的核酸。
在一些实施方式中,本发明的文库的各成员包含a)AAV变体衣壳蛋白,其包含插入至变体衣壳蛋白的高变环和/或表面暴露环中的肽;b)编码a)的AAV变体衣壳蛋白的核酸中位于所述肽插入位点侧翼的核酸序列内的一或多个沉默突变;c)编码定位信号的核酸;d)包含条形码的核酸;及e)编码报道蛋白的核酸。
在一些实施方式中,文库的各成员包含编码定位信号的核酸。在一些实施方式中,文库的各成员包含编码定位信号的核酸。在一些实施方式中,文库的各成员含有包含条形码的核酸。在一些实施方式中,文库的各成员含有包含两个或更多个条形码的核酸。在一些实施方式中,文库的各成员包含编码报道蛋白的核酸。
在以上实施方式的任一个中,编码AAV变体衣壳蛋白的核酸、编码定位信号的核酸、包含条形码的核酸和/或编码报道蛋白的核酸存在于分开的核酸分子上。在一些实施方式中,编码AAV变体衣壳蛋白的核酸、编码定位信号的核酸、包含条形码的核酸和/或编码报道蛋白的核酸存在于单个核酸分子上。在一些实施方式中,编码AAV变体衣壳蛋白的核酸,及编码定位信号的核酸、包含条形码的核酸和/或编码报道蛋白的核酸以任何次序彼此连接。在一些实施方式中,文库的各成员按此顺序包含5'ITR序列、包含条形码的核酸、编码报道蛋白的核酸、编码AAV变体衣壳蛋白的核酸及3'ITR序列。
在一些实施方式中,AAV变体衣壳蛋白衍生自AAV1、AAV2、AAV3B、AAV5、AAV6、AAV8及AAV9。在一些实施方式中,AAV变体衣壳蛋白衍生自表征不太充分的AAV血清型,包括但不限于AAV3、AAV4、AAV7、AAV11、AAVrh10、AAVrh39及AAVrh74。在一些实施方式中,AAV变体的文库包含衍生自单一AAV血清型的AAV变体衣壳蛋白。在一些实施方式中,AAV变体的文库包含衍生自2、3、4、5、6、7、8、9、10、11、12、13、14、15种或更多种AAV血清型的AAV变体衣壳蛋白。在一些实施方式中,一旦产生了各个血清型文库,衍生自2、3、4、5、6、7、8、9、10、11、12、13、14、15种或更多种AAV血清型的AAV变体衣壳蛋白可以组合。在一些实施方式中,通过修饰编码来自相同汇集物中的2、3、4、5、6、7、8、9、10、11、12、13、14、15种或更多种血清型的AAV衣壳蛋白的核酸来产生组合文库。
在一些实施方式中,将突变(例如插入、缺失和/或取代)引入至编码衣壳蛋白中的暴露环的DNA序列中。在一些实施方式中,将肽插入至AAV衣壳中的暴露环(例如高变区)中。在一些实施方式中,所述肽包含6、7、8、9、10、11、12、13、14、15或更多个氨基酸。在一些实施方式中,HI环被靶向(突变),而在其他实施方式中,DE环被靶向(突变)。在一些实施方式中,在两种环中进行突变(例如插入、缺失和/或取代)。在其他实施方式中,将突变(例如插入、缺失和/或取代)引入至表面环的VR区中,包括VR-I、VR-II、VR-III、VR-IV、VR-V、VR-VI、VR-VII、VR-VIII及或VR-IX。在其他实施方式中,在VR-I、VR-VIII及或VR-IV中进行突变(例如插入、缺失和/或取代)。在一些实施方式中,将突变(例如插入、缺失和/或取代)引入至AAV衣壳蛋白VP1、VP2或VP3中,或任何组合的两种衣壳蛋白中,或所有三种衣壳蛋白中。在一些实施方式中,将突变引入至VP1中。在一些实施方式中,将突变引入至VP2中。在一些实施方式中,将突变引入至VP3中。在一些实施方式中,将突变引入至VP1及VP2中。在一些实施方式中,将突变引入至VP1及VP3中。在一些实施方式中,将突变引入至VP2及VP3中。在一些实施方式中,将突变引入至VP1、VP2及VP3中。在一些实施方式中,在编码衣壳蛋白的基因中的单一位点处引入单一突变(例如插入、缺失和/或取代),而在其他实施方式中,在编码衣壳蛋白的基因中引入超过1、2、3、4、5、6、7、10、20、30、40、50、100个或更多个(包括1与100之间的任何数目或更多个)突变(例如插入、缺失和/或取代)。
在一些例示性实施方式中,将肽引入至衣壳蛋白的可变区VR-I、VR-IV或VR-VIII中。在一些实施方式中,将肽引入衣壳蛋白的位置450与600之间的位置处。在一些实施方式中,若衣壳蛋白对应于AAV1,则将肽引入位置590处。在一些实施方式中,若AAV6衣壳被修饰,则将肽引入至位置454或590中。在一些实施方式中,若AAV2衣壳被修饰,则将肽引入位置588处。在一些实施方式中,若使用AAV3B衣壳,则将肽引入至位置589中。在一些实施方式中,若使用AAV5衣壳,则将肽引入至位置578中。在一些实施方式中,若使用AAV8衣壳,则将肽引入至位置591中。在一些实施方式中,若使用AAV9衣壳,则将肽引入至位置266、455和/或589中。应理解,可选择衣壳蛋白中的其他位点用于插入。
在本文公开的AAV文库的一些实施方案中,包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV1血清型的衣壳蛋白的氨基酸位置590处。在本文公开的AAV文库的一些实施方案中,在AAV1血清型的衣壳蛋白的氨基酸位置590处插入包含SEQ ID NO:68-110中任一项的氨基酸序列的肽。在本文公开的AAV文库的一些实施方案中,插入在AAV1血清型的衣壳蛋白590位的肽包含选自由SEQ ID NO:68至SEQ ID NO:75中任一项组成的组的氨基酸序列。在本文公开的AAV文库的一些实施方案中,在AAV1血清型的衣壳蛋白的第590位插入的肽包含氨基酸序列SEQ ID NO:71。在本文公开的AAV文库的一些实施方案中,插入在AAV1血清型的衣壳蛋白的第590位的肽包含选自由SEQ ID NO:1、SEQ ID NO:2和SEQ IDNO:3中任一项组成的组的氨基酸序列。
在本文公开的AAV文库的一些实施方案中,包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV6血清型的衣壳蛋白的氨基酸位置454处。在本文公开的AAV文库的一些实施方案中,在AAV6血清型的衣壳蛋白的氨基酸位置454处插入包含SEQ ID NO:68-110中任一项的氨基酸序列的肽。在本文公开的AAV文库的一些实施方案中,在AAV6血清型的衣壳蛋白的氨基酸位置590处插入包含SEQ ID NO:1-32中任一项的氨基酸序列的肽。在本文公开的AAV文库的一些实施方案中,在AAV6血清型的衣壳蛋白的氨基酸位置590处插入包含SEQ ID NO:68-110中任一项的氨基酸序列的肽。在本文公开的AAV文库的一些实施方案中,插入在AAV6血清型的衣壳蛋白的454位处的肽包含选自由SEQ ID NO:19至SEQ IDNO:27中任一项组成的组的氨基酸序列。在本文公开的AAV文库的一些实施方案中,插入在AAV6血清型的衣壳蛋白的590位处的肽包含选自由SEQ ID NO:19至SEQ ID NO:27中任一项组成的组的氨基酸序列。
在本文公开的AAV文库的一些实施方案中,包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV2血清型的衣壳蛋白的氨基酸位置588处。在本文公开的AAV文库的一些实施方案中,在AAV2血清型的衣壳蛋白的氨基酸位置588处插入包含SEQ ID NO:68-110中任一项的氨基酸序列的肽。在本文公开的AAV文库的一些实施方案中,插入在AAV2血清型的衣壳蛋白的588位处的肽包含选自由SEQ ID NO:90至SEQ ID NO:110中任一项组成的组的氨基酸序列。在本文公开的AAV文库的一些实施方案中,插入在AAV2血清型的衣壳蛋白的588位处的肽包含选自由SEQ ID NO:95、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:106、SEQ ID NO:91和SEQ ID NO:102的氨基酸序列。在本文公开的AAV文库的一些实施方案中,插入在AAV2血清型的衣壳蛋白的588位处的肽包含选自由SEQ ID NO:4-7中任一项组成的组的氨基酸序列。
在本文公开的AAV文库的一些实施方案中,包含SEQ ID NO:1-32中任一项的氨基酸序列的肽插入在AAV3B血清型的衣壳蛋白的氨基酸位置589处。在本文公开的AAV文库的一些实施方案中,包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV3B血清型的衣壳蛋白的氨基酸位置589处。在本文公开的AAV文库的一些实施方案中,插入在AAV3B血清型的衣壳蛋白的589位处的肽包含选自由SEQ ID NO:76-85中任一项组成的组的氨基酸序列。在本文公开的AAV文库的一些实施方式中,插入在AAV3B血清型的衣壳蛋白的589位处的肽包含选自SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:76和SEQ ID NO:83中任一项的氨基酸序列。。在本文公开的AAV文库的一些实施方案中,插入在AAV3B血清型的衣壳蛋白的位置589处的肽包含选自SEQ ID NO:8至SEQ ID NO:11中的任一个的氨基酸序列。
在本文公开的AAV文库的一些实施方案中,在AAV5血清型的衣壳蛋白的氨基酸位置578处插入包含SEQ ID NO:1-32中任一项的氨基酸序列的肽。在本文公开的AAV文库的一些实施方案中,在AAV5血清型的衣壳蛋白的氨基酸位置578处插入包含SEQ ID NO:68-110中任一项的氨基酸序列的肽。在本文公开的AAV文库的一些实施方案中,插入在AAV5血清型的衣壳蛋白的578位处的肽包含选自由SEQ ID NO:28至SEQ ID NO:32中任一项组成的组的氨基酸序列。
在本文公开的AAV文库的一些实施方案中,包含SEQ ID NO:1-32中任一项的氨基酸序列的肽插入在AAV8血清型的衣壳蛋白的氨基酸位置591处。在本文公开的AAV文库的一些实施方案中,在AAV8血清型的衣壳蛋白的氨基酸位置591处插入包含SEQ ID NO:68-110中任一项的氨基酸序列的肽。
在本文公开的AAV文库的一些实施方案中,包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置266处。在本文公开的AAV文库的一些实施方案中,在AAV9血清型的衣壳蛋白的氨基酸位置266处插入包含SEQ ID NO:68-110中任一项的氨基酸序列的肽。在本文公开的AAV文库的一些实施方案中,在AAV9血清型的衣壳蛋白的氨基酸位置455处插入包含SEQ ID NO:1-32中任一项的氨基酸序列的肽。在本文公开的AAV文库的一些实施方案中,在AAV9血清型的衣壳蛋白的氨基酸位置455处插入包含SEQ ID NO:68-110中任一项的氨基酸序列的肽。在本文公开的AAV文库的一些实施方案中,在AAV9血清型的衣壳蛋白的氨基酸位置589处插入包含SEQ ID NO:1-32中任一项的氨基酸序列的肽。在本文公开的AAV文库的一些实施方案中,在AAV9血清型的衣壳蛋白的氨基酸位置589处插入包含SEQ ID NO:68-110中任一项的氨基酸序列的肽。在本文公开的AAV文库的一些实施方案中,插入在AAV9血清型的衣壳蛋白的266位处的肽包含选自由SEQ IDNO:12至SEQ ID NO:18中任一项组成的组的氨基酸序列。在本文公开的AAV文库的一些实施方案中,插入在AAV9血清型的衣壳蛋白的266位处的肽包含选自由SEQ ID NO:86至SEQ IDNO:89中任一项组成的组的氨基酸序列。在本文公开的AAV文库的一些实施方案中,插入在AAV9血清型的衣壳蛋白的266位处的肽包含氨基酸序列SEQ ID NO:89。在本文公开的AAV文库的一些实施方案中,插入在AAV9血清型的衣壳蛋白的455位处的肽包含选自SEQ ID NO:12至SEQ ID NO:18中任一项的氨基酸序列。在本文公开的AAV文库的一些实施方案中,在AAV9血清型的衣壳蛋白的455位处插入的肽包含选自SEQ ID NO:86至SEQ ID NO:89中任一项的氨基酸序列。在本文公开的AAV文库的一些实施方案中,插入到AAV9血清型的衣壳蛋白的455位处的肽包含SEQ ID NO:89的氨基酸序列。在本文公开的AAV文库的一些实施方案中,插入在AAV9血清型的衣壳蛋白的455位处的肽包含选自SEQ ID NO:12至SEQ ID NO:18中任一项的氨基酸序列。在本文公开的AAV文库的一些实施方案中,插入在AAV9血清型的衣壳蛋白的位置589处的肽包含选自SEQ ID NO:86至SEQ ID NO:89中任一项的氨基酸序列。在本文公开的AAV文库的一些实施方案中,插入在AAV9血清型的衣壳蛋白的位置589处的肽包含SEQ ID NO:89的氨基酸序列。
在一些实施方式中,被插入肽的长度为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或更多个氨基酸。在一些实施方式中,所述肽的长度为7个氨基酸。在一些实施方式中,所述肽的长度为10个氨基酸。在一些实施方式中,所述肽的长度为15个氨基酸。在一些实施方式中,在通过PCR扩增位于插入位点3'的衣壳蛋白基因的片段期间引入所述肽。因此,在一些实施方式中,所述衣壳基因使用PCR多样化。在一些实施方式中,引入的序列是在扩增位于插入位点3'的衣壳蛋白基因的片段期间引入的。
在一些实施方式中,将沉默突变引入至衣壳蛋白基因中位于引入所述肽的区域侧翼的区域中,以使得所有衣壳蛋白血清型基因在这些侧翼区域中具有相同核苷酸序列。所述侧翼区域可在肽插入位点的任一侧上包括10个或更多个、20个或更多个、30个或更多个、40个或更多个、50个或更多个、100个或更多个、150个或更多个或者200个或更多个核苷酸。以此方式,相同因为序列可用于所有血清型文库的PCR扩增及下一代测序(NGS)。这样允许更快地筛选基于2、3、4、5、6、7、8、9、10、11、12、13、14、15种或更多种血清型的文库。在一些实施方式中,引入2、3、4、5、6、7、8、9、10、11、12、13、14、15个或更多个沉默突变,以使侧翼序列与两个共同序列(一个在多样化区域的5'端,一个在多样化区域的3'端)进行比对。在一些实施方式中,若衣壳蛋白对应于AAV1,则在位置571、612及617的一个或多个处引入沉默突变。在一些实施方式中,若衣壳蛋白对应于AAV2,则在位置568、569、572、573、574、610、611、613、615、616及617中的一个或多个处引入沉默突变。在一些实施方式中,若衣壳蛋白对应于AAV3B,则在位置569、570、571、573、574、575、612、614、615及616中的一个或多个处引入沉默突变。在一些实施方式中,若衣壳蛋白对应于AAV8,则在位置573、575、576、577、614及619中的一个或多个处引入沉默突变。在一些实施方式中,若衣壳蛋白对应于AAV9,则在位置571、572、573、574、575、611、612、615、616及617中的一个或多个处引入沉默突变。应理解,可选择衣壳蛋白中的其他位点用于插入。
在一些实施方式中,文库中的各AAV变体的有效负载或基因组进一步包含报道基因。在一些实施方式中,由报道子编码的蛋白质为荧光的。例示性的非限制性报道基因包括EGFP、mCherry、mClover3及mRuby3。其他例示性的非限制性报道基因包括mApple、iRFP、tdTomato、mVenus、YFP、RFP、萤火虫荧光素酶及纳米荧光素酶(nanoluciferase)。
在一些实施方式中,衣壳基因及报道基因处于分别的启动子的控制下。在一些实施方式中,衣壳基因及报道基因各自独立地与启动子可操作方式连接。
在一些实施方式中,报道基因被细胞类型和/或组织特异性启动子控制。在一些实施方式中,报道基因与细胞类型和/或组织特异性启动子可操作地连接。在一些实施方式中,报道基因与细胞类型特异性RNA聚合酶II启动子可操作地连接。例示性的细胞类型和/或组织特异性启动子包括仅在神经元中表达的人类突触蛋白启动子(hSyn1),或在肝细胞中表达的甲状腺素转运蛋白启动子(TTR)。用于本发明方法及组合物中的其他非限制性细胞类型和/或组织特异性启动子包括细胞角蛋白18及19(上皮细胞特异性,Zheng及Baum(2008)Methods Mol Biol 434:205-219)、unc45b或unc-45肌球蛋白伴随蛋白B(肌肉特异性,Rudeck等人(2016)Genesis 54(8):431-8)、心脏肌钙蛋白T(cTnT)(心肌细胞特异性,Ma等人(2004)Am J Physiol Cell Physiol 286(3):556-64)、胶质原纤维酸性蛋白(GFAP)(星形胶质细胞特异性,Lee等人(2008)Glia 56(5):481-93)、髓鞘碱性蛋白(MBP)(寡突神经胶质细胞特异性,Wei等人(2003)Gene 313:161-7)、甲基CpG-结合蛋白2(Mecp2)(神经元特异性,Adachi等人(2005)Hum Mol Genetics 14(23):3709-22),及其他大脑或眼部特异性rAAV相容性微型启动子(MiniPromoters)(Leeuw等人(2016)Molecular Brain 9(1):52)。
在一些实施方式中,文库中各AAV变体的有效负载或基因组进一步包含编码定位信号的核酸。在一些实施方式中,报道基因与编码定位信号的核酸融合。在一些实施方式中,报道基因与结构域融合以增加报道子向细胞器中的移动。在一些实施方式中,报道基因与结构域融合以增加报道子向细胞核中的移动。在一些实施方式中,报道基因与编码核定位信号(NLS)(例如SV40大T-抗原核定位信号)的核酸融合。NLS的非限制性实例包括衍生自以下的NLS序列:SV40病毒大T-抗原的NLS;来自核质蛋白的NLS;c-myc NLS;hRNPA1 M9NLS;来自输入蛋白-α的IBB结构域;肌瘤T蛋白NLS;人类p53 NLS;小鼠c-ab1 IV NLS;流感病毒NS1 NLS;肝炎病毒δ抗原NLS;小鼠Mx1蛋白NLS;人类聚(ADP-核糖)聚合酶NLS;及类固醇激素受体(人)糖皮质激素NLS。其他NLS是本领域中已知的。在一些实施方式中,报道蛋白与定位至核包膜(例如KASH结构域)的蛋白质融合。在一些实施方式中,报道蛋白与组蛋白结合域(例如组蛋白2B结合域,H2B)融合。其他非限制性组蛋白包括H1、H2A、H3及H4家族中的那些。应理解,与报道基因的N端及C端融合均支持核定位。在一些实施方式中,报道蛋白与超过一个定位信号融合。在一些实施方式中,多个定位信号为串联的。在一些实施方式中,报道蛋白在其N端处与一或多个定位信号融合且在其C端处与一或多个定位信号融合。
在一些实施方式中,将包含条形码的核酸添加至文库中各AAV变体的有效负载或基因组。在一些实施方式中,条形码以生物信息学方式连接被引入变体衣壳蛋白中的肽。在一些实施方式中,合成包含编码插入肽的变体DNA序列的DNA序列,以进一步包含随机或指定的条形码。条形码可包含5、6、7、8、9、10、11、12、13、14、15、16、17、18个或更多个核苷酸。在一些实施方式中,包含条形码的核酸选自序列SEQ ID NO:111-154或155-198中的任一个。在一些实施方式中,包含条形码的核酸选自SEQ ID NO:111-154。在一些实施方式中,包含条形码的核酸选自SEQ ID NO:155-198。在一些实施方式中,包含条形码的核酸包含选自序列SEQ ID NO:111-154中任一个的序列。在一些实施方式中,包含条形码的核酸包含选自序列SEQ ID NO:155-198中任一个的序列。合成的DNA也可包含限制位点及或用于通过Gibson组装进行分子克隆的核酸序列。在一些实施方式中,内含子包括于表达盒中,以确认被测序的转录物衍生自mRNA而不是衍生自载体基因组DNA。在其他实施方式中,AAV有效负载或基因组通过Gibson组装进行组装,其中衣壳基因的3'端连接至插入位点处的随机或指定插入序列,且条形码连接polyA序列及5'ITR。在一些实施方式中,跨越条形码及衣壳蛋白基因中的插入的可变区进行
Figure BDA0003419732690000601
测序(或任何其他测序技术),以通过生物信息学方式连接这两个随机序列。在进一步的实施方式中,报道子构建体、报道子特异性启动子、衣壳蛋白特异性启动子及衣壳蛋白基因的5'端经组装以产生最终的有效负载构建体。在一些实施方式中,相对于cap基因,所述表达盒呈有义定向。
【1】在一些实施方式中,文库的各成员含有包含超过一个条形码序列的核酸。在一些实施方式中,文库的各成员包含两个或更多个各自包含条形码序列的核酸。在一些实施方式中,文库的各成员含有包含第一条形码的第一核酸及包含第二条形码的第二核酸。在一些实施方式中,包含第一条形码的第一核酸及包含第二条形码的第二核酸不同。在一些实施方式中,包含第一条形码序列的第一核酸包含选自序列SEQ ID NO:111-154中任一个的序列。在一些实施方式中,第一条形码序列选自序列SEQ ID NO:111-154中的任一个。在一些实施方式中,包含第二条形码序列的第二核酸包含选自序列SEQ ID NO:155-198中任一个的序列。在一些实施方式中,包含第二条形码序列的第二核酸选自序列SEQ ID NO:155-198中的任一个。在一些实施方式中,包含第一条形码的第一核酸及包含第二条形码的第二核酸中的每一个独立地与启动子可操作连接。在一些实施方式中,与包含第一条形码的第一核酸可操作地连接的启动子及与包含第二条形码的第二核酸可操作地连接的启动子各自独立地为RNA Pol II启动子。在一些实施方式中,与包含第一条形码的第一核酸可操作地连接的启动子及与包含第二条形码的第二核酸可操作地连接的启动子各自独立地为RNA Pol III启动子(例如选自U6启动子、H1启动子及7SK启动子的启动子)。在一些实施方式中,与包含第一条形码的第一核酸可操作地连接的启动子可操作地与RNA Pol II启动子连接,并且与包含第二条形码的第二核酸可操作地连接的启动子是RNA Pol III启动子(例如选自下述的启动子:人类突触蛋白启动子(hSyn1)、甲状腺素转运蛋白启动子(TTR)、细胞角蛋白18、细胞角蛋白19、unc-45肌球蛋白伴随蛋白B(unc45b)启动子、心脏肌钙蛋白T(cTnT)启动子、胶质原纤维酸性蛋白(GFAP)启动子、髓鞘碱性蛋白(MBP)启动子及甲基CpG-结合蛋白2(Mecp2)启动子。
在一些实施方式中,合成一小段DNA,其包含随机产生或指定的条形码及随机产生或指定的衣壳蛋白变体区域,以及用于Gibson组装的两个区域。随后,对多样化区域3'的衣壳蛋白序列进行扩增。在其他实施例中,进行Gibson组装反应,其中5'ITR及聚腺苷酸化序列与条形码在5'端上融合,且第二Gibson组装区域与衣壳蛋白基因的3'端及用于衣壳蛋白基因的polyA信号及3'ITR融合。在其他实施方式中,跨越条形码及变体衣壳蛋白序列进行
Figure BDA0003419732690000611
测序。在进一步的实施方式中,进行限制酶消化。在进一步的实施方式中,进行PCR扩增步骤,其中制备报道子、定位信号、启动子及衣壳蛋白基因的5'端。或者,包含报道子、定位信号、启动子及衣壳基因的5'端的片段可在供体质粒中预组装,用BsaI消化,并经凝胶纯化。在进一步的实施方式中,进行golden gate克隆步骤以产生最终构建体。
在一些实施方式中,合成两个DNA片段。片段A包含Gibson组装区域#1、限制酶位点、可变衣壳区域及与用作PCR引物的衣壳基因同源的区域。片段B包含Gibson组装区域#2、随机条形码、限制酶位点及Gibson组装区域#1。随后,进行PCR程序,其中使用步骤1中合成的片段A作为PCR引物来扩增衣壳基因的3'序列。在进一步的实审方式中,通过Gibson组装产生中间AAV构建体,其中所述构建体按5'-3'方向包含5'ITR、SV40 poly A信号、条形码、两个限制性核酸内切酶位点、变体衣壳序列、衣壳蛋白的3'区域、用于衣壳表达构建体的polyA序列及3'ITR。在进一步的实施方式中,跨越条形码及变体衣壳序列进行
Figure BDA0003419732690000621
测序。在进一步的实施方式中,进行限制酶消化。在进一步的实施方式中,进行PCR扩增步骤,其中制备报道子、定位信号、启动子及衣壳基因的5'端。或者,包含报道子、定位信号、启动子及衣壳基因的5'端的片段可在供体质粒中预组装,用BsaI消化,且经凝胶纯化。在其他实施例中,进行golden gate克隆步骤以产生最终构建体。
在一些实施方式中,各插入肽可由各自具有不同序列(由于密码子简并性)的多个核酸分子编码。各核酸序列连接独特条形码,以使得在两个或更多个变体经鉴定具有相同的插入肽序列、但其中插入肽由不同核酸序列编码时能够验证插入肽的效能(例如富集)。
在一些实施方式中,条形码经由标准克隆技术连接报道基因、polyA序列及5'ITR。在其他实施例中,编码肽的变体序列经由标准技术插入至衣壳基因中,然后添加特异性启动子,并添加衣壳基因的5'端。接着在两个独立反应中进行
Figure BDA0003419732690000622
测序(或任何其他高度可靠的测序技术),其中对条形码及插入的核苷酸序列进行测序。最后,进行OXFORD
Figure BDA0003419732690000623
测序(或任何其他长读段测序技术,例如
Figure BDA0003419732690000624
SMRT测序),以使得长读段长度序列包含条形码及插入的核苷酸序列两者。
在一些实施方式中,产生“查找”表,其将各条形码将已插入衣壳基因中的各核苷酸序列联系起来。
本发明的文库可包含102、103、104、105、106、107或108个或更多个独特AAV变体。在一些实施方式中,文库可包含102-103、103-104、104-105、105-106、106-107或107-108个独特AAV变体。
AAV变体的任何前述文库均可用于本文所公开的方法中。
鉴定AAV衣壳变体的方法
本发明提供了开发相比于天然AAV血清型具有所需特征的AAV衣壳的方法及组合物。这些衣壳适用于例如将基因组工程化分子及基因治疗分子递送至靶细胞、细胞系或组织(例如体外或体内),以治疗有需要的受试者。在一些实施方式中,衣壳用于将有效负载递送至所需组织、细胞或细胞器。
在另一方面中,本文公开了AAV衣壳蛋白的定向进化及鉴定相比于天然AAV血清型而言具有所需特征的AAV衣壳变体的方法。
在一些实施方式中,鉴定相比于天然AAV血清型而言具有所需特征的AAV衣壳变体的方法包含:(i)在体外或体内使细胞、细胞系或组织与本文所公开的AAV变体的任一文库接触,(ii)使该文库中的AAV变体转导所述细胞、细胞系或组织;(iii)从所述细胞、细胞系或组织回收所述AAV变体;及(iv)鉴定具有所需特征的AAV衣壳变体。
在一些实施方式中,鉴定相比于天然AAV血清型而言具有所需特征的AAV衣壳变体的方法包含:(i)将编码肽的多个核酸插入至编码AAV衣壳蛋白的高变环和/或表面暴露环的核酸群体中,以产生编码AAV变体衣壳蛋白的核酸的文库;(ii)将该文库中编码AAV变体衣壳蛋白的各核酸与以下中的一种或多种连接:(a)包含条形码的核酸,(b)编码报道蛋白的核酸,及(c)编码定位信号的核酸,以形成有效负载构建体;(iii)通过反式提供腺病毒辅助及AAV rep功能而在生产者细胞中生成AAV变体的文库;(iv)纯化AAV变体的文库;(v)在体外或体内使细胞、细胞系或组织与所述AAV变体的文库接触;(vi)从靶细胞、细胞系或组织回收AAV变体;及(vii)鉴定具有所需特征的AAV衣壳变体。
在一些实施方式中,鉴定相比于天然AAV血清型而言具有所需特征的AAV衣壳变体的方法包含:(i)将编码肽的多个核酸插入至编码AAV衣壳蛋白的高变环和/或表面暴露环的核酸群体中,以产生编码AAV变体衣壳蛋白的核酸的文库;(ii)将该文库中编码AAV变体衣壳蛋白的各核酸与以下中的两种或更多种连接:(a)包含条形码的核酸,(b)编码报道蛋白的核酸,及(c)编码定位信号的核酸,以形成有效负载构建体;(iii)通过反式提供腺病毒辅助及AAV rep功能而在生产者细胞中生成AAV变体的文库;(iv)纯化AAV变体的文库;(v)在体外或体内使细胞、细胞系或组织与AAV变体的文库接触;(vi)从靶细胞、细胞系或组织回收AAV变体;及(vii)鉴定具有所需特征的AAV衣壳变体。
在一些实施方式中,鉴定相比于天然AAV血清型而言具有所需特征的AAV衣壳变体的方法包含:(i)将编码肽的多个核酸插入至编码AAV衣壳蛋白的高变环和/或表面暴露环的核酸群体中,以产生编码AAV变体衣壳蛋白的核酸的文库;(ii)将该文库中编码AAV变体衣壳蛋白的各核酸与下述连接:(a)包含条形码的核酸,(b)编码报道蛋白的核酸,及(c)编码定位信号的核酸,以形成有效负载构建体;(iii)通过反式提供腺病毒辅助及AAV rep功能而在生产者细胞中制造AAV变体的文库;(iv)纯化AAV变体的文库;(v)在体外或体内使细胞、细胞系或组织与AAV变体的文库接触;(vi)从靶细胞、细胞系或组织回收AAV变体;及(vii)鉴定具有所需特征的AAV衣壳变体。
在一些实施方式中,AAV衣壳蛋白定向进化以鉴定相比于天然AAV血清型而言具有所需特征的AAV衣壳变体的步骤包括:(i)将肽插入至来自一或多种AAV血清型的衣壳蛋白中的高变环和/或表面暴露环中,从而对于各AAV血清型产生经修饰变体衣壳的文库;(ii)在生产者细胞中包装变体AAV,其中腺病毒辅助及AAV rep功能系以反式提供;(iii)纯化病毒衣壳文库汇集物;(iv)体外或体内施用所示汇集物;(v)从靶组织或细胞系回收AAV变体;(vi)下一代测序以测定工程化变体衣壳序列的一致性;(vii)重复轮次的体外或体内选择,其中从靶组织或细胞系分离变体;及(viii)全面评估富集的变体。
在一些实施方式中,所需特征为相比于天然AAV血清型而言增强的细胞或组织向性。这些方法也可适于选择逃避预先存在的宿主抗体反应的AAV衣壳变体和/或开发将不引起宿主反应的AAV变体。
在一些实施方式中,选择例如来自AAV1、AAV2、AAV3B、AAV5、AAV6、AAV8及AAV9的衣壳蛋白用于起始点。在一些实施方式中,选择来自表征不太充分的AAV血清型的衣壳蛋白,包括但不限于AAV3、AAV4、AAV7、AAV11、AAVrh10、AAVrh39及AAVrh74。在一些实施方式中,AAV变体的文库包含衍生自单一AAV血清型的AAV变体衣壳蛋白。在一些实施方式中,AAV变体的文库包含衍生自2、3、4、5、6、7、8、9、10、11、12、13、14、15种或更多种AAV血清型的AAV变体衣壳蛋白。在一些实施方式中,一旦产生了个体血清型文库,便组合衍生自2、3、4、5、6、7、8、9、10、11、12、13、14、15种或更多种AAV血清型的AAV变体衣壳蛋白。在一些实施方式中,通过修饰编码来自相同汇集物中的2、3、4、5、6、7、8、9、10、11、12、13、14、15种或更多种血清型的AAV衣壳蛋白的核酸来产生组合文库。
在一些实施方式中,定向进化包含对AAV衣壳进行突变(例如插入、缺失和/或取代)。在一些实施方式中,将突变(例如插入、缺失和/或取代)引入至编码衣壳蛋白中的暴露环的DNA序列中。在一些实施方式中,定向进化包含将肽插入至AAV衣壳中的暴露环(例如高变区)中。
在一些实施方式中,文库在HEK293细胞中包装,其中辅助功能(例如E2A、E4、VA、E1A及E1B)以反式提供。在一些实施方式中,AAV rep功能包含rep78、rep 68、rep 52及rep40基因。在一些实施方式中,rep基因以反式提供。在一些实施方式中,rep78和/或rep68基因的起始密码子从ACG变为ATG,以增加含有反向末端重复序列(ITR)的衣壳文库构建体的复制,由此提高AAV文库制造产率。在一些实施方式中,Cap基因作为有效负载提供至制造的AAV。在一些实施方式中,衣壳基因受p40启动子控制,以使其仅在辅助病毒功能存在下在HEK293细胞中生产期间表达。
在一些实施方式中,在细胞中选择文库。在一些实施方式中,个体血清型文库被组合以产生包含2、3、4、5、6、7、8、9、10、11、12、13、14、15种或更多种血清型的单一文库,其中各AAV变体还包含插入至AAV变体衣壳中的肽。在一些实施方式中,使用单一血清型文库,其中该血清型文库中的各AAV包含插入至AAV变体衣壳中的肽。在一些实施方式中,细胞用文库处理,然后监测报道基因在细胞的细胞质中或所关注细胞器中的表达。在一些实施方式中,所关注细胞器为细胞核。在一些实施方式中,包含AAV有效负载或基因组(如由报道基因的表达所证明)的细胞器从细胞分离。在一些实施方式中,细胞器为细胞核。在一些实施方式中,从细胞器(例如细胞核)提取核酸。在一些实施方式中,提取的核酸为RNA,而在一些实施方式中,提取的核酸为DNA。在一些实施方式中,对提取的RNA进行反转录以产生cDNA,接着使用对带条形码的区域具有特异性的引物对其进行扩增及测序。在一些实施方式中,使用对引入的可变序列具有特异性的引物对提取的DNA进行扩增及测序。在一些实施方式中,在细胞中选择后观测到特定AAV变体的富集。
在一些实施方式中,使用的细胞包括但不限于来自下述的细胞:CNS、心脏、肺脏、气管、食道、肌肉、骨骼、软骨、胃、胰脏、肠、肝脏、膀胱、肾脏、尿管、尿道、子宫、输卵管、卵巢、睾丸、前列腺、眼部、血液、淋巴或口腔黏膜。
在一些实施方式中,细胞包括但不限于神经元、神经胶质细胞、星形胶质细胞、少突胶质细胞、小神经胶质细胞、雪旺细胞、室管膜细胞、肝细胞、星状脂肪储存细胞、枯否氏细胞、肝内皮细胞、上皮细胞、心肌细胞、平滑肌细胞、T细胞、B细胞、造血干细胞和胚胎干细胞。
在一些实施方式中,在动物中选择文库。在一些实施方式中,个体血清型文库经组合以产生包含2、3、4、5、6、7、8、9、10、11、12、13、14、15种或更多种血清型的单一文库,其中各AAV也包含插入至AAV变体衣壳中的肽。在一些实施方式中,使用单一血清型文库,其中该血清型文库中的各AAV包含插入至AAV变体衣壳中的肽。在一些实施方式中,经由静脉内、颅内或鞘内注射,或通过一些其他途径(例如经鼻、肝、脑室内、脑池内、玻璃体内、耳蜗内等)注射来用文库处理动物。在足以使AAV通行至所需组织或器官的时间(例如7、10、14、18、21、24、28、30天或更久)后,处死动物,收获所关注组织/器官。在一些实施方式中,对组织中的细胞监测在细胞的细胞质中或所关注细胞器中报道基因的表达。在一些实施方式中,所关注细胞器为细胞核。在一些实施方式中,包含AAV有效负载(如由报道基因的表达所证明)的细胞器从组织分离。在一些实施方式中,所述细胞器为细胞核。在一些实施方式中,从细胞器(例如细胞核)提取核酸。在一些实施方式中,提取的核酸为RNA,而在一些实施方式中,提取的核酸为DNA。在一些实施方式中,对提取的RNA进行反转录以产生cDNA,接着使用对带条形码的区域具有特异性的引物对其进行扩增及测序。在一些实施方式中,使用对引入的可变序列具有特异性的引物对提取的DNA进行扩增及测序。在一些实施方式中,在体内选择后观测到特定AAV变体的富集。
在这些实施例中任一个中,在细胞中或体内选择AAV变体可进行1、2、3、4、5轮或更多轮,在各情况下汇集获自前一轮的AAV变体或合成经富集的变体亚组并在细胞中或体内重新选择。
在一些实施方式中,在所需数目的选择轮次后,分析变体。在一些实施方式中,个体变体用于将转基因体内递送至所需细胞或器官。在分析变体的递送能力之后,选择最佳候选物以供将来使用。
在一些实施方式中,文库的各成员含有包含两个条形码序列的核酸。在一些实施方式中,文库的各成员含有包含第一条形码的第一核酸及包含第二条形码的第二核酸。在一些实施方式中,包含第一条形码的第一核酸及包含第二条形码的第二核酸不同。在一些实施方式中,包含第一条形码的第一核酸包含选自序列SEQ ID NO:111-154中任一个的序列,或选自序列SEQ ID NO:111-154中任一个。在本文所公开的方法、AAV变体文库、AAV变体或核酸的一些实施方式中,包含第二条形码的第二核酸包含选自序列SEQ ID NO:155-198中任一个的序列,或选自序列SEQ ID NO:155-198中任一个。在一些实施方式中,包含第一条形码的第一核酸包含选自序列SEQ ID NO:111-154中任一个的序列,或选自序列SEQ IDNO:111-154中任一个,且包含第二条形码的第二核酸包含选自序列SEQ ID NO:155-198中任一个的序列,或选自序列SEQ ID NO:155-198中任一个。在一些实施方式中,包含第一条形码的第一核酸及包含第二条形码的第二核酸中均独立地以可操作方式连接启动子。在一些实施方式中,该启动子对于第一条形码及第二条形码中的每一个不同。在一些实施方式中,包含第一条形码的第一核酸及第二核酸中的每一个独立地处于不同启动子的控制下。在一些实施方式中,以可操作方式连接包含第一条形码的第一核酸的启动子及以可操作方式连接包含第二条形码的第二核酸的启动子各自独立地为RNA Pol II启动子(例如人类突触蛋白启动子(hSyn1)、甲状腺素转运蛋白启动子(TTR)、细胞角蛋白18、细胞角蛋白19、unc-45肌球蛋白伴随蛋白B(unc45b)启动子、心肌肌钙蛋白T(cTnT)启动子、胶质原纤维酸性蛋白(GFAP)启动子、髓鞘碱性蛋白(MBP)启动子或甲基CpG-结合蛋白2(Mecp2)启动子)。在一些实施方式中,以可操作方式连接包含第一条形码的第一核酸的启动子及以可操作方式连接包含第二条形码的第二核酸的启动子各自独立地为RNA Pol III启动子(例如U6启动子、H1启动子或7SK启动子)。在一些实施方式中,以可操作方式连接包含第一条形码的第一核酸的启动子为RNA Pol II启动子,且以可操作方式连接包含第二条形码的第二核酸的启动子为RNA Pol III启动子。在一些实施方式中,包含条形码的核酸进一步包含报道基因、核定位信号及聚腺苷酸化信号。
AAV变体
本文描述用于开发相比于天然AAV血清型而言具有所需特征的AAV衣壳的AAV变体。在一些实施方式中,所需特征为相比于天然AAV血清型而言增强的细胞或组织向性。在一些实施方式中,所需特征为躲避预先存在的宿主抗体反应。在一些实施方式中,所需特征为降低的免疫原性以免引起宿主反应。
在一些实施方式中,本发明的AAV变体包含:a)编码AAV变体衣壳蛋白的核酸序列,该AAV变体衣壳蛋白包含插入至所述变体衣壳蛋白的高变环和/或表面暴露环中的肽;及以下中的一种或多种:b)所述核酸序列中位于a)的AAV变体衣壳蛋白中的肽插入位点侧翼的一或多个沉默突变;c)编码定位信号的核酸;d)包含条形码的核酸;及e)编码报道蛋白的核酸。
在一些实施方式中,本发明的AAV变体包含:a)编码AAV变体衣壳蛋白的核酸序列,该AAV变体衣壳蛋白包含插入至变体衣壳蛋白的高变环和/或表面暴露环中的肽;及以下中的两种或更多种:b)所述核酸序列中位于a)的AAV变体衣壳蛋白中的肽插入位点侧翼的一或多个沉默突变;c)编码定位信号的核酸;d)包含条形码的核酸;及e)编码报道蛋白的核酸。
在一些实施方式中,本发明的AAV变体包含:a)编码AAV变体衣壳蛋白的核酸序列,该AAV变体衣壳蛋白包含插入至变体衣壳蛋白的高变环和/或表面暴露环中的肽;及以下中的三种或更多种:b)所述核酸序列中位于a)的AAV变体衣壳蛋白中的肽插入位点侧翼的一或多个沉默突变;c)编码定位信号的核酸;d)包含条形码的核酸;及e)编码报道蛋白的核酸。
在一些实施方式中,本发明的AAV变体包含:a)编码AAV变体衣壳蛋白的核酸序列,该AAV变体衣壳蛋白包含插入至变体衣壳蛋白的高变环和/或表面暴露环中的肽;b)所述核酸序列中位于a)的AAV变体衣壳蛋白中的肽插入位点侧翼的一或多个沉默突变;c)编码定位信号的核酸;d)包含条形码的核酸;及e)编码报道蛋白的核酸。
在一些实施方式中,本发明的AAV变体包含:a)AAV变体衣壳蛋白,其包含插入至变体衣壳蛋白的高变环和/或表面暴露环中的肽;及以下中的一种或多种:b)编码a)的AAV变体衣壳蛋白的核酸中位于所述肽插入位点侧翼的核酸序列中的一或多个沉默突变;c)编码定位信号的核酸;d)包含条形码的核酸;及e)编码报道蛋白的核酸。
在一些实施方式中,本发明的AAV变体包含:a)AAV变体衣壳蛋白,其包含插入至变体衣壳蛋白的高变环和/或表面暴露环中的肽;及以下中的两种或更多种:b)编码a)的AAV变体衣壳蛋白的核酸中位于所述肽插入位点侧翼的核酸序列中的一或多个沉默突变;c)编码定位信号的核酸;d)包含条形码的核酸;及e)编码报道蛋白的核酸。
在一些实施方式中,本发明的AAV变体包含:a)AAV变体衣壳蛋白,其包含插入至变体衣壳蛋白的高变环和/或表面暴露环中的肽;及以下中的三种或更多种:b)编码a)的AAV变体衣壳蛋白的核酸中位于所述肽插入位点侧翼的核酸序列中的一或多个沉默突变;c)编码定位信号的核酸;d)包含条形码的核酸;及e)编码报道蛋白的核酸。
在一些实施方式中,本发明的AAV变体包含:a)AAV变体衣壳蛋白,其包含插入至变体衣壳蛋白的高变环和/或表面暴露环中的肽;b)编码a)的AAV变体衣壳蛋白的核酸中位于所述肽插入位点侧翼的核酸序列中的一或多个沉默突变;c)编码定位信号的核酸;d)包含条形码的核酸;及e)编码报道蛋白的核酸。
在任何实施方式中,编码AAV变体衣壳蛋白的核酸、编码定位信号的核酸、包含条形码的核酸和/或编码报道蛋白的核酸存在于分开的核酸分子上。在一些实施方式中,编码AAV变体衣壳蛋白的核酸、编码定位信号的核酸、包含条形码的核酸和/或编码报道蛋白的核酸存在于单一核酸分子上。在一些实施方式中,编码AAV变体衣壳蛋白的核酸,及编码定位信号的核酸、包含条形码的核酸和/或编码报道蛋白的核酸以任何顺序彼此连接。在一些实施方式中,文库的各成员按顺序包含5'ITR序列、包含条形码的核酸、编码报道蛋白的核酸、编码AAV变体衣壳蛋白的核酸及3'ITR序列。
AAV变体的各种组分(例如AAV变体衣壳蛋白、插入的肽、肽插入位点侧翼的沉默突变、定位信号、条形码、报道蛋白、启动子或相关核酸序列等)公开于本文中的其他地方。
在另一方面中,本发明提供编码本文所公开的AAV变体的核酸分子。在一些实施方式中,所述核酸分子包含a)编码AAV变体衣壳蛋白的核酸序列,该AAV变体衣壳蛋白包含插入至变体衣壳蛋白的高变环和/或表面暴露环中的肽;及以下中的一种或多种:b)编码变体衣壳蛋白的核酸序列,该变体衣壳蛋白在其高变环和/或表面暴露环中肽插入位点侧翼的核苷酸序列中包含一或多个沉默突变;c)编码定位信号的核酸序列;d)包含条形码的核酸序列;及e)编码报道蛋白的核酸序列。
在一些实施方式中,本发明提供了一种核酸分子,其包含以下中的两种或更多种:a)编码AAV变体衣壳蛋白的核酸序列,该AAV变体衣壳蛋白包含插入至变体衣壳蛋白的高变环和/或表面暴露环中的肽;及以下中的两种或更多种:b)编码变体衣壳蛋白的核酸序列,该变体衣壳蛋白在其高变环和/或表面暴露环中肽插入位点侧翼的核苷酸序列中包含一或多个沉默突变;c)编码定位信号的核酸序列;d)包含条形码的核酸序列;及e)编码报道蛋白的核酸序列。
在一些实施方式中,本发明提供了一种核酸分子,其包含a)编码AAV变体衣壳蛋白的核酸序列,该AAV变体衣壳蛋白包含插入至变体衣壳蛋白的高变环和/或表面暴露环中的肽;及以下中的三种或更多种:b)编码变体衣壳蛋白的核酸序列,该变体衣壳蛋白在其高变环和/或表面暴露环中肽插入位点侧翼的核苷酸序列中包含一或多个沉默突变;c)编码定位信号的核酸序列;d)包含条形码的核酸序列;及e)编码报道蛋白的核酸序列。
在一些实施方式中,本发明提供了一种核酸分子,其包含a)编码AAV变体衣壳蛋白的核酸序列,该AAV变体衣壳蛋白包含插入至变体衣壳蛋白的高变环和/或表面暴露环中的肽;b)编码变体衣壳蛋白的核酸序列,该变体衣壳蛋白在其高变环和/或表面暴露环中肽插入位点侧翼的核苷酸序列中包含一或多个沉默突变;c)编码定位信号的核酸序列;d)包含条形码的核酸序列;及e)编码报道蛋白的核酸序列。
在一些实施方式中,条形码核酸序列包含超过一个条形码序列。在一些实施方式中,条形码核酸序列包含两个或更多个条形码序列。在一些实施方式中,条形码核酸序列含有包含第一条形码的第一核酸及包含第二条形码的第二核酸。在一些实施方式中,包含第一条形码的第一核酸及包含第二条形码的第二核酸不同。在一些实施方式中,包含第一条形码序列的第一核酸包含选自序列SEQ ID NO:111-154中任一个的序列。在一些实施方式中,第一条形码序列选自序列SEQ ID NO:111-154中任一个。在一些实施方式中,包含第二条形码序列的第二核酸包含选自序列SEQ ID NO:155-198中任一个的序列。在一些实施方式中,包含第二条形码序列的第二核酸选自序列SEQ ID NO:155-198中任一个。在一些实施方式中,包含第一条形码的第一核酸及包含第二条形码的第二核酸中的每一个独立地可操作连接启动子。在一些实施方式中,以可操作方式连接包含第一条形码的第一核酸的启动子及以可操作方式连接包含第二条形码的第二核酸的启动子各自独立地为RNA Pol II启动子。在一些实施方式中,以可操作方式连接包含第一条形码的第一核酸的启动子及以可操作方式连接包含第二条形码的第二核酸的启动子各自独立地为RNA Pol III启动子(例如选自U6启动子、H1启动子及7SK启动子中的启动子)。在一些实施方式中,以可操作方式连接包含第一条形码的第一核酸的启动子以可操作方式连接RNA Pol II启动子,且以可操作方式连接包含第二条形码的第二核酸的启动子为RNA Pol III启动子(例如选自以下组的启动子:人类突触蛋白启动子(hSyn1)、甲状腺素转运蛋白启动子(TTR)、细胞角蛋白18、细胞角蛋白19、unc-45肌球蛋白伴随蛋白B(unc45b)启动子、心肌肌钙蛋白T(cTnT)启动子、胶质原纤维酸性蛋白(GFAP)启动子、髓鞘碱性蛋白(MBP)启动子及甲基CpG-结合蛋白2(Mecp2)启动子。
在一些实施方案中,AAV变体选自以下任一种:(i)AAV血清型是AAV1,并且所述肽插入在衣壳蛋白的氨基酸位置590处,(ii)AAV血清型是AAV6,并且所述肽插入在衣壳蛋白的氨基酸位置454或590处,(iii)AAV血清型为AAV2,并且所述肽插入在衣壳蛋白的氨基酸位置588处,(iv)AAV血清型为AAV3B,并且所述肽插入在衣壳蛋白的氨基酸位置589处,(v)AAV血清型为AAV5,并且所述肽插入在衣壳蛋白的氨基酸位置578处,(vi)AAV血清型为AAV8,并且所述肽插入在衣壳蛋白的氨基酸位置591处,或(vii)AAV血清型为AAV9,并且所述肽插入在衣壳蛋白的氨基酸位置266、455或589处,其中所述位置对应于该AAV血清型中VP1的编号。
在本文公开的AAV变体的一些实施方案中,包含SEQ ID NO.1-32中任一所示的氨基酸序列的肽被插入在AAV1血清型的衣壳蛋白的氨基酸位置590处。在本文公开的AAV变体的一些实施方案中,包含SEQ ID NO.68-110中任一所示的氨基酸序列的肽被插入在AAV1血清型的衣壳蛋白的氨基酸位置590处。在本文公开的AAV变体的一些实施方案中,插入在AAV1血清型的衣壳蛋白的位置590处的肽包含选自SEQ ID NO:68至SEQ ID NO:75中任一所示的氨基酸序列。在本文公开的AAV变体的一些实施方案中,插入在AAV1血清型的衣壳蛋白的位置590处的肽包含氨基酸序列SEQ ID NO:71。在本文公开的AAV变体的一些实施方案中,插入在AAV1血清型的衣壳蛋白的位置590处的肽包含选自由SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3中任一个组成的组的氨基酸序列。
在本文公开的AAV变体的一些实施方案中,包含SEQ ID NO.1-32任一所示的氨基酸序列的肽插入在AAV6血清型的衣壳蛋白的氨基酸位置454处。在本文公开的AAV变体的一些实施方案中,包含SEQ ID NO.68-110任一所示的氨基酸序列的肽插入在AAV6血清型的衣壳蛋白的氨基酸位置454处。在本文公开的AAV变体的一些实施方案中,包含SEQ ID NO.1-32任一所示的氨基酸序列的肽插入在AAV6血清型的衣壳蛋白的氨基酸位置590处。在本文公开的AAV变体的一些实施方案中,包含SEQ ID NO.68-110任一所示的氨基酸序列的肽插入在AAV6血清型的衣壳蛋白的氨基酸位置590处。在本文公开的AAV变体的一些实施方案中,插入在AAV6血清型的衣壳蛋白的位置454处的肽包含选自由SEQ ID NO:19到SEQ IDNO:27中任一个组成的组的氨基酸序列。在本文公开的AAV变体的一些实施方案中,插入在AAV6血清型的衣壳蛋白的位置590处的肽包含选自由SEQ ID NO:19到SEQ ID NO:27中任一个组成的组的氨基酸序列。
在本文公开的AAV变体的一些实施方案中,包含SEQ ID NO.1-32任一所示的氨基酸序列的肽插入在AAV2血清型的衣壳蛋白的氨基酸位置588处。在本文公开的AAV变体的一些实施方案中,包含SEQ ID NO.68-110任一所示的氨基酸序列的肽插入在AAV2血清型的衣壳蛋白的氨基酸位置588处。在本文公开的AAV变体的一些实施方案中,插入在AAV2血清型的衣壳蛋白的位置588处的肽包含选自由SEQ ID NO:90到SEQ ID NO:110中任一个组成的组的氨基酸序列。在本文公开的AAV变体的一些实施方案中,插入在AAV2血清型的衣壳蛋白的位置588处的肽包含选自由SEQ ID NO:95、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:106、SEQ ID NO:91和SEQ ID NO:102中任一个组成的组的氨基酸序列。在本文公开的AAV变体的一些实施方案中,插入在AAV2血清型的衣壳蛋白的位置588处的肽包含选自由SEQ ID NO:4-7中任一个组成的组的氨基酸序列。
在本文公开的AAV变体的一些实施方案中,包含SEQ ID NO.1-32任一所示的氨基酸序列的肽插入在AAV3B血清型的衣壳蛋白的氨基酸位置589处。在本文公开的AAV变体的一些实施方案中,包含SEQ ID NO.68-110任一所示的氨基酸序列的肽插入在AAV3B血清型的衣壳蛋白的氨基酸位置589处。在本文公开的AAV变体的一些实施方案中,插入在AAV3B血清型的衣壳蛋白的位置589处的肽包含选自由SEQ ID NO:76-85中任一个组成的组的氨基酸序列。在本文公开的AAV变体的一些实施方案中,插入在AAV3B血清型的衣壳蛋白的位置589处的肽包含选自由SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:77、SEQ ID NO:79、SEQ IDNO:76和SEQ ID NO:83中任一个组成的组的氨基酸序列。在本文公开的AAV变体的一些实施方案中,插入在AAV3B血清型的衣壳蛋白的位置589处的肽包含选自由SEQ ID NO:8到SEQID NO:11中任一个组成的组的氨基酸序列。
在本文公开的AAV变体的一些实施方案中,包含SEQ ID NO.1-32中任一所示的氨基酸序列的肽被插入在AAV5血清型的衣壳蛋白的氨基酸位置578处。在本文公开的AAV变体的一些实施方案中,包含SEQ ID NO.68-110中任一所示的氨基酸序列的肽被插入在AAV5血清型的衣壳蛋白的氨基酸位置578处。在本文公开的AAV变体的一些实施方案中,插入在AAV5血清型的衣壳蛋白的位置578处的肽包含选自SEQ ID NO:28至SEQ ID NO:32中任一所示的氨基酸序列。
在本文公开的AAV变体的一些实施方案中,包含SEQ ID NO.1-32中任一所示的氨基酸序列的肽被插入在AAV8血清型的衣壳蛋白的氨基酸位置591处。在本文公开的AAV变体的一些实施方案中,包含SEQ ID NO.68-110中任一所示的氨基酸序列的肽被插入在AAV8血清型的衣壳蛋白的氨基酸位置591处。
在本文公开的AAV变体的一些实施方案中,包含SEQ ID NO.1-32中任一所示的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置266处。在本文公开的AAV变体的一些实施方案中,包含SEQ ID NO.68-110中任一所示的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置266处。在本文公开的AAV变体的一些实施方案中,包含SEQID NO.1-32中任一所示的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置455处。在本文公开的AAV变体的一些实施方案中,包含SEQ ID NO.68-110中任一所示的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置455处。在本文公开的AAV变体的一些实施方案中,包含SEQ ID NO.1-32中任一所示的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置589处。在本文公开的AAV变体的一些实施方案中,包含SEQ IDNO.68-110中任一所示的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置589处。在本文公开的AAV变体的一些实施方案中,插入在AAV9血清型的衣壳蛋白的位置266处的肽包含选自SEQ ID NO:12至SEQ ID NO:18中任一所示的氨基酸序列。在本文公开的AAV变体的一些实施方案中,插入在AAV9血清型的衣壳蛋白的位置266处的肽包含选自SEQID NO:86至SEQ ID NO:89中任一所示的氨基酸序列。在本文公开的AAV变体的一些实施方案中,插入在AAV9血清型的衣壳蛋白的位置266处的肽包含SEQ ID NO:89的氨基酸序列。在本文公开的AAV变体的一些实施方案中,插入在AAV9血清型的衣壳蛋白的位置455处的肽包含选自SEQ ID NO:12至SEQ ID NO:18中任一所示的氨基酸序列。在本文公开的AAV变体的一些实施方案中,插入在AAV9血清型的衣壳蛋白的位置455处的肽包含选自SEQ ID NO:86至SEQ ID NO:89中任一所示的氨基酸序列。在本文公开的AAV变体的一些实施方案中,插入在AAV9血清型的衣壳蛋白的位置455处的肽包含SEQ ID NO:89的氨基酸序列。在本文公开的AAV变体的一些实施方案中,插入在AAV9血清型的衣壳蛋白的位置589处的肽包含选自SEQ ID NO:12至SEQ ID NO:18中任一所示的氨基酸序列。在本文公开的AAV变体的一些实施方案中,插入在AAV9血清型的衣壳蛋白的位置589处的肽包含选自SEQ ID NO:86至SEQID NO:89中任一所示的氨基酸序列。在本文公开的AAV变体的一些实施方案中,插入在AAV9血清型的衣壳蛋白的位置589处的肽包含SEQ ID NO:89的氨基酸序列。
在一些实施方式中,AAV3B变体含有包含选自下组的任一序列的肽:EQFRNLA(SEQID NO:78)、TDFRSPQ(SEQ ID NO:80)、TGAFSST(SEQ ID NO:77)、FNSPVIQ(SEQ ID NO:79)、PYASITG(SEQ ID NO:76)和YGSRSVD(SEQ ID NO:83)。在一些实施方式中,AAV3B变体包含选自下述序列的肽序列:EQFRNLA(SEQ ID NO:78)、TDFRSPQ(SEQ ID NO:80)、TGAFSST(SEQ IDNO:77)、FNSPVIQ(SEQ ID NO:79)、PYASITG(SEQ ID NO:76)和YGSRSVD(SEQ ID NO:83)。
在一些实施方式中,AAV1变体含有包含序列SVVVSSDSSKRPNL(SEQ ID NO:71)的肽。在一些实施方式中,AAV1变体包含肽序列SVVVSSDSSKRPNL(SEQ ID NO:71)。
在一些实施方式中,AAV2变体含有包含选自下述序列的任一序列的肽:RPLTAND(SEQ ID NO:95)、PRDTFNG(SEQ ID NO:94)、PLRMVNE(SEQ ID NO:96)、ENFSKVA(SEQ ID NO:101)、LGNGKMTVQP(SEQ ID NO:103)、GRNTVGLSSA(SEQ ID NO:106)、TSNSRTE(SEQ ID NO:91)和RDALSGLRPE(SEQ ID NO:102)。在一些实施方式中,AAV2变体包含选自下述的肽序列:RPLTAND(SEQ ID NO:95)、PRDTFNG(SEQ ID NO:94)、PLRMVNE(SEQ ID NO:96)、ENFSKVA(SEQID NO:101)、LGNGKMTVQP(SEQ ID NO:103)、GRNTVGLSSA(SEQ ID NO:106)、TSNSRTE(SEQ IDNO:91)和RDALSGLRPE(SEQ ID NO:102)。在一些实施方式中,AAV2变体含有包含选自下述的任一序列的肽:RPLTAND(SEQ ID NO:95)、PRDTFNG(SEQ ID NO:94)和PLRMVNE(SEQ ID NO:96)。在一些实施方式中,AAV2变体含有包含选自下述的任一序列的肽:ENFSKVA(SEQ IDNO:101)、LGNGKMTVQP(SEQ ID NO:103)、GRNTVGLSSA(SEQ ID NO:106)、TSNSRTE(SEQ IDNO:91)和RDALSGLRPE(SEQ ID NO:102)。在一些实施方式中,AAV2变体包含选自下述的肽序列:RPLTAND(SEQ ID NO:95)、PRDTFNG(SEQ ID NO:94)和PLRMVNE(SEQ ID NO:96)。在一些实施方式中,AAV2变体包含选自下述的肽序列:ENFSKVA(SEQ ID NO:101)、LGNGKMTVQP(SEQID NO:103)、GRNTVGLSSA(SEQ ID NO:106)、TSNSRTE(SEQ ID NO:91)和RDALSGLRPE(SEQ IDNO:102)。
在一些实施方式中,AAV9变体含有包含序列NIPKAYG(SEQ ID NO:89)的肽。在一些实施方式中,AAV9变体包含肽序列NIPKAYG(SEQ ID NO:89)。
在一些实施方式中,AAV3B变体含有包含氨基酸序列EQFRNLA(SEQ ID NO:78)的肽。在一些实施方式中,AAV3B变体含有包含氨基酸序列TDFRSPQ(SEQ ID NO:80)的肽。在一些实施方式中,AAV3B变体含有包含氨基酸序列TGAFSST(SEQ ID NO:77)的肽。在一些实施方式中,AAV3B变体含有包含氨基酸序列FNSPVIQ(SEQ ID NO:79)的肽。在一些实施方式中,AAV3B变体含有包含氨基酸序列PYASITG(SEQ ID NO:76)的肽。在一些实施方式中,AAV3B变体含有包含氨基酸序列YGSRSVD(SEQ ID NO:83)的肽。
在一些实施方式中,AAV2变体含有包含氨基酸序列RPLTAND(SEQ ID NO:95)的肽。在一些实施方式中,AAV2变体含有包含氨基酸序列PRDTFNG(SEQ ID NO:94)的肽。在一些实施方式中,肽包含氨基酸序列PLRMVNE(SEQ ID NO:96)。在一些实施方式中,AAV2变体含有包含氨基酸序列ENFSKVA(SEQ ID NO:101)的肽。在一些实施方式中,AAV2变体含有包含氨基酸序列LGNGKMTVQP(SEQ ID NO:103)的肽。在一些实施方式中,AAV2变体含有包含氨基酸序列GRNTVGLSSA(SEQ ID NO:106)的肽。在一些实施方式中,AAV2变体含有包含氨基酸序列TSNSRTE(SEQ ID NO:91)的肽。在一些实施方式中,AAV2变体含有包含氨基酸序列RDALSGLRPE(SEQ ID NO:102)的肽。
在一些实施方式中,AAV1变体含有包含选自下述的氨基酸序列的肽:KSPQSKV(SEQID NO:1)、SDLRSKV(SEQ ID NO:2)和TTTVRKV(SEQ ID NO:3)。在一些实施方式中,AAV1变体包含选自下述的肽:KSPQSKV(SEQ ID NO:1)、SDLRSKV(SEQ ID NO:2)和TTTVRKV(SEQ IDNO:3)。
在一些实施方式中,AAV1变体含有包含选自下述的氨基酸序列的肽:AALRDIR(SEQID NO:68)、PAIKTYS(SEQ ID NO:69)、TGDRISSRTL(SEQ ID NO:70)、SVVVSSDSSKRPRNL(SEQID NO:71)、VGARLSA(SEQ ID NO:72)、IEKPNTSTKK(SEQ ID NO:73)、DTVRSKN(SEQ ID NO:74)和KELNKAR(SEQ ID NO:75)。在一些实施方式中,AAV1变体包含选自下述的肽:AALRDIR(SEQ ID NO:68)、PAIKTYS(SEQ ID NO:69)、TGDRISSRTL(SEQ ID NO:70)、SVVVSSDSSKRPRNL(SEQ ID NO:71)、VGARLSA(SEQ ID NO:72)、IEKPNTSTKK(SEQ ID NO:73)、DTVRSKN(SEQ IDNO:74)和KELNKAR(SEQ ID NO:75)。
在一些实施方式中,AAV2变体含有包含选自下述的氨基酸序列的肽:GRSDMAG(SEQID NO:4)、LLSSERS(SEQ ID NO:5)、EQRPNVS(SEQ ID NO:6)和TRQISSD(SEQ ID NO:7)。在一些实施方式中,AAV2变体包含选自下述的肽:GRSDMAG(SEQ ID NO:4)、LLSSERS(SEQ ID NO:5)、EQRPNVS(SEQ ID NO:6)和TRQISSD(SEQ ID NO:7)。
在一些实施方式中,AAV2变体含有包含选自下述的氨基酸序列的肽:MTLTRQE(SEQID NO:90)、TSNSRTE(SEQ ID NO:91)、EVRGGPS(SEQ ID NO:92)、VISDRSS(SEQ ID NO:93)、PRDTFNG(SEQ ID NO:94)、RPLTAND(SEQ ID NO:95)、PLRMVNE(SEQ ID NO:96)、DVGIRPS(SEQID NO:97)、KDSTAFG(SEQ ID NO:98)、YPGRNPD(SEQ ID NO:99)、ISDTRIS(SEQ ID NO:100)、ENFSKVA(SEQ ID NO:101)、RDALSGLRPE(SEQ ID NO:102)、LGNGKMTVQP(SEQ ID NO:103)、VSNPLNQ(SEQ ID NO:104)、LNERGLG(SEQ ID NO:105)、GRNTVGLSSA(SEQ ID NO:106)、VGHAGNP(SEQ ID NO:107)、SRAGTVP(SEQ ID NO:108)、GLVAKLP(SEQ ID NO:109)和AESLRTP(SEQ ID NO:110)。在一些实施方式中,AAV2变体包含选自下述的肽:MTLTRQE(SEQ ID NO:90)、TSNSRTE(SEQ ID NO:91)、EVRGGPS(SEQ ID NO:92)、VISDRSS(SEQ ID NO:93)、PRDTFNG(SEQ ID NO:94)、RPLTAND(SEQ ID NO:95)、PLRMVNE(SEQ ID NO:96)、DVGIRPS(SEQ ID NO:97)、KDSTAFG(SEQ ID NO:98)、YPGRNPD(SEQ ID NO:99)、ISDTRIS(SEQ ID NO:100)、ENFSKVA(SEQ ID NO:101)、RDALSGLRPE(SEQ ID NO:102)、LGNGKMTVQP(SEQ ID NO:103)、VSNPLNQ(SEQ ID NO:104)、LNERGLG(SEQ ID NO:105)、GRNTVGLSSA(SEQ ID NO:106)、VGHAGNP(SEQ ID NO:107)、SRAGTVP(SEQ ID NO:108)、GLVAKLP(SEQ ID NO:109)和AESLRTP(SEQ ID NO:110)。
在一些实施方式中,AAV3B变体含有包含选自下述的氨基酸序列的肽:QGALAQV(SEQ ID NO:8)、YPSSNTP(SEQ ID NO:9)、MLNPRTE(SEQ ID NO:10)和QMRTRDE(SEQ ID NO:11)。在一些实施方式中,AAV3B变体包含选自下述的肽:QGALAQV(SEQ ID NO:8)、YPSSNTP(SEQ ID NO:9)、MLNPRTE(SEQ ID NO:10)和QMRTRDE(SEQ ID NO:11)。
在一些实施方式中,AAV3B变体含有包含选自下述的氨基酸序列的肽:PYASITG(SEQ ID NO:76)、TGAFSST(SEQ ID NO:77)、EQFRNLA(SEQ ID NO:78)、FNSPVIQ(SEQ ID NO:79)、TDFRSPQ(SEQ ID NO:80)、MYSLMKD(SEQ ID NO:81)、LYLSSAS(SEQ ID NO:82)、YGSRSVD(SEQ ID NO:83)、LYSHQVS(SEQ ID NO:84)和ISTHSPP(SEQ ID NO:85)。在一些实施方式中,AAV3B变体包含选自下述的肽:PYASITG(SEQ ID NO:76)、TGAFSST(SEQ ID NO:77)、EQFRNLA(SEQ ID NO:78)、FNSPVIQ(SEQ ID NO:79)、TDFRSPQ(SEQ ID NO:80)、MYSLMKD(SEQ ID NO:81)、LYLSSAS(SEQ ID NO:82)、YGSRSVD(SEQ ID NO:83)、LYSHQVS(SEQ ID NO:84)和ISTHSPP(SEQ ID NO:85)。
在一些实施方式中,AAV9变体含有包含下述的氨基酸序列的肽:MPGRAPI(SEQ IDNO:12)、LGRLTAN(SEQ ID NO:13)、SYSTSRS(SEQ ID NO:14)、TRPSSTN(SEQ ID NO:15)、VPQSSSR(SEQ ID NO:16)、VSRSYPA(SEQ ID NO:17)和QRARPDT(SEQ ID NO:18)。在一些实施方式中,AAV9变体包含选自下述的肽:MPGRAPI(SEQ ID NO:12)、LGRLTAN(SEQ ID NO:13)、SYSTSRS(SEQ ID NO:14)、TRPSSTN(SEQ ID NO:15)、VPQSSSR(SEQ ID NO:16)、VSRSYPA(SEQID NO:17)及QRARPDT(SEQ ID NO:18)。
在一些实施方式中,AAV9变体含有包含选自下述的氨基酸序列的肽:RQPTTIP(SEQID NO:86)、RSTSSLL(SEQ ID NO:87)、FRLSSPQ(SEQ ID NO:88)及NIPKAYG(SEQ ID NO:89)。在一些实施方式中,AAV9变体包含选自下述的肽:RQPTTIP(SEQ ID NO:86)、RSTSSLL(SEQID NO:87)、FRLSSPQ(SEQ ID NO:88)和NIPKAYG(SEQ ID NO:89)。
在一些实施方式中,AAV6变体含有包含选自下述的氨基酸序列的肽:SQLTPHS(SEQID NO:19)、LGSHLPS(SEQ ID NO:20)、YTLSSGQ(SEQ ID NO:21)、SSRIPPD(SEQ ID NO:22)、WTETIPR(SEQ ID NO:23)、HGLQGVA(SEQ ID NO:24)、TMRVSDQ(SEQ ID NO:25)、GSSKVVM(SEQID NO:26)和SALDRGV(SEQ ID NO:27)。在一些实施方式中,AAV6变体包含选自下述的肽:SQLTPHS(SEQ ID NO:19)、LGSHLPS(SEQ ID NO:20)、YTLSSGQ(SEQ ID NO:21)、SSRIPPD(SEQID NO:22)、WTETIPR(SEQ ID NO:23)、HGLQGVA(SEQ ID NO:24)、TMRVSDQ(SEQ ID NO:25)、GSSKVVM(SEQ ID NO:26)和SALDRGV(SEQ ID NO:27)。
在一些实施方式中,AAV5变体含有包含选自下述的氨基酸序列的肽:KELGTQR(SEQID NO:28)、RSSDVQR(SEQ ID NO:29)、PSAPKTF(SEQ ID NO:30)、HTKRSEY(SEQ ID NO:31)和IKGSNLP(SEQ ID NO:32)。在一些实施方式中,AAV5变体包含选自下述的肽:KELGTQR(SEQID NO:28)、RSSDVQR(SEQ ID NO:29)、PSAPKTF(SEQ ID NO:30)、HTKRSEY(SEQ ID NO:31)及IKGSNLP(SEQ ID NO:32)。
本文描述了使用本发明的方法鉴定的插入肽,所示肽赋予AAV变体以相比于天然AAV血清型而言所需的特征。在一些实施方式中,所需特征为相比于天然AAV血清型而言增强的细胞或组织向性。在一些实施方式中,本发明的插入肽允许AAV变体逃避已有的宿主抗体反应。在一些实施方式中,本发明的插入肽使得AAV变体的免疫原性较低,从而其将不引起宿主反应。在一些实施方式中,插入肽能够将AAV载体导引至特定靶细胞或组织。
插入肽的长度可为4、5、6、7、8、9、10、11、12、13、14、15、20、25、30个或更多个氨基酸,或这些值中任何两个之间的范围。在一些实施方式中,所述肽的长度为7个氨基酸。在一些实施方式中,所述肽的长度为10个氨基酸。在一些实施方式中,肽的长度为15个氨基酸。
在一些实施方式中,插入肽包含SEQ ID No.1-32中所示的氨基酸序列的至少4个连续氨基酸。在一些实施方式中,所述肽包含SEQ ID No.1-32中所示的氨基酸序列的至少5个连续氨基酸。在一些实施方式中,所述肽包含SEQ ID No.1-32中所示的氨基酸序列的至少6个连续氨基酸。在一些实施方式中,所述肽包含SEQ ID No.1-32中所示的氨基酸序列。在一些实施方式中,所述肽包含与SEQ ID No.1-32中所示的氨基酸序列具有至少约60%、约65%、约70%、约75%、约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或更大序列同一性的氨基酸序列。在一些实施方式中,插入肽包含SEQ ID No.68-110中所示的氨基酸序列的至少4个连续氨基酸。在一些实施方式中,所述肽包含SEQ ID No.68-110中所示的氨基酸序列的至少5个连续氨基酸。在一些实施方式中,所述肽包含SEQ ID No.68-110中所示的氨基酸序列的至少6个连续氨基酸。在一些实施方式中,所述肽包含SEQ ID No.68-110中所示的氨基酸序列。在一些实施方式中,所述肽包含与SEQ ID No.68-110中所示的氨基酸序列具有至少约60%、约65%、约70%、约75%、约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或更大序列同一性的氨基酸序列。
在一些实施方式中,所述肽包含选自下述的任一序列:EQFRNLA(SEQ ID NO:78)、TDFRSPQ(SEQ ID NO:80)、TGAFSST(SEQ ID NO:77)、FNSPVIQ(SEQ ID NO:79)、PYASITG(SEQID NO:76)和YGSRSVD(SEQ ID NO:83)。在一些实施方式中,所述肽序列选自由以下序列组成的组:EQFRNLA(SEQ ID NO:78)、TDFRSPQ(SEQ ID NO:80)、TGAFSST(SEQ ID NO:77)、FNSPVIQ(SEQ ID NO:79)、PYASITG(SEQ ID NO:76)和YGSRSVD(SEQ ID NO:83)。在一些实施方式中,所述肽包含序列SVVVSSDSSKRPNL(SEQ ID NO:71)。在一些实施方式中,所述肽序列为SVVVSSDSSKRPNL(SEQ ID NO:71)。在一些实施方式中,所述肽包含选自下述的任一序列:RPLTAND(SEQ ID NO:95)、PRDTFNG(SEQ ID NO:94)、PLRMVNE(SEQ ID NO:96)、ENFSKVA(SEQID NO:101)、LGNGKMTVQP(SEQ ID NO:103)、GRNTVGLSSA(SEQ ID NO:106)、TSNSRTE(SEQ IDNO:91)和RDALSGLRPE(SEQ ID NO:102)。在一些实施方式中,所述肽序列选自下述序列:RPLTAND(SEQ ID NO:95)、PRDTFNG(SEQ ID NO:94)、PLRMVNE(SEQ ID NO:96)、ENFSKVA(SEQID NO:101)、LGNGKMTVQP(SEQ ID NO:103)、GRNTVGLSSA(SEQ ID NO:106)、TSNSRTE(SEQ IDNO:91)和RDALSGLRPE(SEQ ID NO:102)。在一些实施方式中,所述肽包含序列NIPKAYG(SEQID NO:89)。在一些实施方式中,所述肽序列为NIPKAYG(SEQ ID NO:89)。
在一些实施方式中,所述肽包含选自下述的氨基酸序列:EQFRNLA(SEQ ID NO:78)、TDFRSPQ(SEQ ID NO:80)、TGAFSST(SEQ ID NO:77)、FNSPVIQ(SEQ ID NO:79)、PYASITG(SEQ ID NO:76)、YGSRSVD(SEQ ID NO:83)、SVVVSSDSSKRPNL(SEQ ID NO:71)、RPLTAND(SEQID NO:95)、PRDTFNG(SEQ ID NO:94)和PLRMVNE(SEQ ID NO:96)。在一些实施方式中,所述肽序列选自下述:EQFRNLA(SEQ ID NO:78)、TDFRSPQ(SEQ ID NO:80)、TGAFSST(SEQ ID NO:77)、FNSPVIQ(SEQ ID NO:79)、PYASITG(SEQ ID NO:76)、YGSRSVD(SEQ ID NO:83)、SVVVSSDSSKRPNL(SEQ ID NO:71)、RPLTAND(SEQ ID NO:95)、PRDTFNG(SEQ ID NO:94)和PLRMVNE(SEQ ID NO:96)。
在一些实施方式中,所述肽包含选自下述的氨基酸序列:ENFSKVA(SEQ ID NO:101)、LGNGKMTVQP、GRNTVGLSSA(SEQ ID NO:103)、TSNSRTE(SEQ ID NO:91)、RDALSGLRPE(SEQ ID NO:102)和NIPKAYG(SEQ ID NO:89)。在一些实施方式中,所述肽序列选自下述:EQFRNLA(SEQ ID NO:78)、TDFRSPQ(SEQ ID NO:80)、TGAFSST(SEQ ID NO:77)、FNSPVIQ(SEQID NO:79)、PYASITG(SEQ ID NO:76)、YGSRSVD(SEQ ID NO:83)、SVVVSSDSSKRPNL(SEQ IDNO:71)、RPLTAND(SEQ ID NO:95)、PRDTFNG(SEQ ID NO:94)和PLRMVNE(SEQ ID NO:96)。
在一些实施方式中,所述肽包含氨基酸序列EQFRNLA(SEQ ID NO:78)。在一些实施方式中,所述肽包含氨基酸序列TDFRSPQ(SEQ ID NO:80)。在一些实施方式中,所述肽包含氨基酸序列TGAFSST(SEQ ID NO:77)。在一些实施方式中,所述肽包含氨基酸序列FNSPVIQ(SEQ ID NO:79)。在一些实施方式中,所述肽包含氨基酸序列PYASITG(SEQ ID NO:76)。在一些实施方式中,所述肽包含氨基酸序列YGSRSVD(SEQ ID NO:83)。在一些实施方式中,所述肽包含氨基酸序列RPLTAND(SEQ ID NO:95)。在一些实施方式中,所述肽包含氨基酸序列PRDTFNG(SEQ ID NO:94)。在一些实施方式中,所述肽包含氨基酸序列PLRMVNE(SEQ ID NO:96)。在一些实施方式中,所述肽包含氨基酸序列ENFSKVA(SEQ ID NO:101)。在一些实施方式中,所述肽包含氨基酸序列LGNGKMTVQP(SEQ ID NO:103)。在一些实施方式中,所述肽包含氨基酸序列GRNTVGLSSA(SEQ ID NO:106)。在一些实施方式中,所述肽包含氨基酸序列TSNSRTE(SEQ ID NO:91)。在一些实施方式中,所述肽包含氨基酸序列RDALSGLRPE(SEQ IDNO:102)。
在一些实施方式中,所述肽包含选自下述的氨基酸序列:KSPQSKV(SEQ ID NO:1)、SDLRSKV(SEQ ID NO:2)和TTTVRKV(SEQ ID NO:3)。在一些实施方式中,所述肽选自下述:KSPQSKV(SEQ ID NO:1)、SDLRSKV(SEQ ID NO:2)和TTTVRKV(SEQ ID NO:3)。
在一些实施方式中,所述肽包含选自下述的氨基酸序列:AALRDIR(SEQ ID NO:68)、PAIKTYS(SEQ ID NO:69)、TGDRISSRTL(SEQ ID NO:70)、SVVVSSDSSKRPRNL(SEQ ID NO:71)、VGARLSA(SEQ ID NO:72)、IEKPNTSTKK(SEQ ID NO:73)、DTVRSKN(SEQ ID NO:74)和KELNKAR(SEQ ID NO:75)。在一些实施方式中,所述肽选自下述:AALRDIR(SEQ ID NO:68)、PAIKTYS(SEQ ID NO:69)、TGDRISSRTL(SEQ ID NO:70)、SVVVSSDSSKRPRNL(SEQ ID NO:71)、VGARLSA(SEQ ID NO:72)、IEKPNTSTKK(SEQ ID NO:73)、DTVRSKN(SEQ ID NO:74)和KELNKAR(SEQ ID NO:75)。
在一些实施方式中,所述肽包含选自下述的氨基酸序列:GRSDMAG(SEQ ID NO:4)、LLSSERS(SEQ ID NO:5)、EQRPNVS(SEQ ID NO:6)和TRQISSD(SEQ ID NO:7)。在一些实施方式中,所述肽选自下组:GRSDMAG(SEQ ID NO:4)、LLSSERS(SEQ ID NO:5)、EQRPNVS(SEQ IDNO:6)和TRQISSD(SEQ ID NO:7)。
在一些实施方式中,所述肽包含选自下述的氨基酸序列:MTLTRQE(SEQ ID NO:90)、TSNSRTE(SEQ ID NO:91)、EVRGGPS(SEQ ID NO:92)、VISDRSS(SEQ ID NO:93)、PRDTFNG(SEQ ID NO:94)、RPLTAND(SEQ ID NO:95)、PLRMVNE(SEQ ID NO:96)、DVGIRPS(SEQ ID NO:97)、KDSTAFG(SEQ ID NO:98)、YPGRNPD(SEQ ID NO:99)、ISDTRIS(SEQ ID NO:100)、ENFSKVA(SEQ ID NO:101)、RDALSGLRPE(SEQ ID NO:102)、LGNGKMTVQP(SEQ ID NO:103)、VSNPLNQ(SEQ ID NO:104)、LNERGLG(SEQ ID NO:105)、GRNTVGLSSA(SEQ ID NO:106)、VGHAGNP(SEQ ID NO:107)、SRAGTVP(SEQ ID NO:108)、GLVAKLP(SEQ ID NO:109)及AESLRTP(SEQ ID NO:110)。在一些实施方式中,所述肽选自下组:MTLTRQE(SEQ ID NO:90)、TSNSRTE(SEQ ID NO:91)、EVRGGPS(SEQ ID NO:92)、VISDRSS(SEQ ID NO:93)、PRDTFNG(SEQ ID NO:94)、RPLTAND(SEQ ID NO:95)、PLRMVNE(SEQ ID NO:96)、DVGIRPS(SEQ ID NO:97)、KDSTAFG(SEQ ID NO:98)、YPGRNPD(SEQ ID NO:99)、ISDTRIS(SEQ ID NO:100)、ENFSKVA(SEQ IDNO:101)、RDALSGLRPE(SEQ ID NO:102)、LGNGKMTVQP(SEQ ID NO:103)、VSNPLNQ(SEQ IDNO:104)、LNERGLG(SEQ ID NO:105)、GRNTVGLSSA(SEQ ID NO:106)、VGHAGNP(SEQ ID NO:107)、SRAGTVP(SEQ ID NO:108)、GLVAKLP(SEQ ID NO:109)及AESLRTP(SEQ ID NO:110)。
在一些实施方式中,所述肽包含选自下述的氨基酸序列:QGALAQV(SEQ ID NO:8)、YPSSNTP(SEQ ID NO:9)、MLNPRTE(SEQ ID NO:10)和QMRTRDE(SEQ ID NO:11)。在一些实施方式中,所述肽选自下组:QGALAQV(SEQ ID NO:8)、YPSSNTP(SEQ ID NO:9)、MLNPRTE(SEQID NO:10)和QMRTRDE(SEQ ID NO:11)。
在一些实施方式中,所述肽包含选自下组的氨基酸序列:PYASITG(SEQ ID NO:76)、TGAFSST(SEQ ID NO:77)、EQFRNLA(SEQ ID NO:78)、FNSPVIQ(SEQ ID NO:79)、TDFRSPQ(SEQ ID NO:80)、MYSLMKD(SEQ ID NO:81)、LYLSSAS(SEQ ID NO:82)、YGSRSVD(SEQ ID NO:83)、LYSHQVS(SEQ ID NO:84)及ISTHSPP(SEQ ID NO:85)。在一些实施方式中,所述肽选自下组:PYASITG(SEQ ID NO:76)、TGAFSST(SEQ ID NO:77)、EQFRNLA(SEQ ID NO:78)、FNSPVIQ(SEQ ID NO:79)、TDFRSPQ(SEQ ID NO:80)、MYSLMKD(SEQ ID NO:81)、LYLSSAS(SEQID NO:82)、YGSRSVD(SEQ ID NO:83)、LYSHQVS(SEQ ID NO:84)及ISTHSPP(SEQ ID NO:85)。
在一些实施方式中,所述肽包含选自下组的氨基酸序列:MPGRAPI(SEQ ID NO:12)、LGRLTAN(SEQ ID NO:13)、SYSTSRS(SEQ ID NO:14)、TRPSSTN(SEQ ID NO:15)、VPQSSSR(SEQ ID NO:16)、VSRSYPA(SEQ ID NO:17)及QRARPDT(SEQ ID NO:18)。在一些实施方式中,所述肽选自下组:MPGRAPI(SEQ ID NO:12)、LGRLTAN(SEQ ID NO:13)、SYSTSRS(SEQ ID NO:14)、TRPSSTN(SEQ ID NO:15)、VPQSSSR(SEQ ID NO:16)、VSRSYPA(SEQ ID NO:17)及QRARPDT(SEQ ID NO:18)。
在一些实施方式中,所述肽包含选自下组的氨基酸序列:RQPTTIP(SEQ ID NO:86)、RSTSSLL(SEQ ID NO:87)、FRLSSPQ(SEQ ID NO:88)及NIPKAYG(SEQ ID NO:89)。在一些实施方式中,所述肽选自下组:RQPTTIP(SEQ ID NO:86)、RSTSSLL(SEQ ID NO:87)、FRLSSPQ(SEQ ID NO:88)及NIPKAYG(SEQ ID NO:89)。
在一些实施方式中,所述肽包含选自下组的氨基酸序列:SQLTPHS(SEQ ID NO:19)、LGSHLPS(SEQ ID NO:20)、YTLSSGQ(SEQ ID NO:21)、SSRIPPD(SEQ ID NO:22)、WTETIPR(SEQ ID NO:23)、HGLQGVA(SEQ ID NO:24)、TMRVSDQ(SEQ ID NO:25)、GSSKVVM(SEQ ID NO:26)和SALDRGV(SEQ ID NO:27)。在一些实施方式中,所述肽选自下组:SQLTPHS(SEQ ID NO:19)、LGSHLPS(SEQ ID NO:20)、YTLSSGQ(SEQ ID NO:21)、SSRIPPD(SEQ ID NO:22)、WTETIPR(SEQ ID NO:23)、HGLQGVA(SEQ ID NO:24)、TMRVSDQ(SEQ ID NO:25)、GSSKVVM(SEQ ID NO:26)和SALDRGV(SEQ ID NO:27)。
在一些实施方式中,所述肽包含选自下组的氨基酸序列:KELGTQR(SEQ ID NO:28)、RSSDVQR(SEQ ID NO:29)、PSAPKTF(SEQ ID NO:30)、HTKRSEY(SEQ ID NO:31)和IKGSNLP(SEQ ID NO:32)。在一些实施方式中,所述肽选自下组:KELGTQR(SEQ ID NO:28)、RSSDVQR(SEQ ID NO:29)、PSAPKTF(SEQ ID NO:30)、HTKRSEY(SEQ ID NO:31)和IKGSNLP(SEQ ID NO:32)。
在一些实施方式中,本公开提供了一种包含插入的肽的衣壳蛋白,其中所述肽插入在(i)AAV1衣壳蛋白的氨基酸位置590、(ii)AAV6衣壳蛋白的氨基酸位置454或590、(iii)AAV2衣壳蛋白的氨基酸位置588、(iv)AAV3B衣壳蛋白的氨基酸位置589、(v)AAV5衣壳蛋白的氨基酸位置578、(vi)AAV8衣壳蛋白的氨基酸位置591、或(vi)AAV9衣壳蛋白的氨基酸位置266、455或589,其中所述位置对应于所述AAV血清型中的VP1的编号。
在本文公开的衣壳蛋白的一些实施方案中,包含SEQ ID NO:1-32中任一个的氨基酸序列的肽插入在AAV1血清型的衣壳蛋白的氨基酸位置590。在本文公开的衣壳蛋白的一些实施方式中,包含SEQ ID NO:68-110中任一个的氨基酸序列的肽被插入在AAV1血清型的衣壳蛋白的氨基酸位置590。在本文公开的衣壳蛋白的一些实施方式中,在AAV1血清型的衣壳蛋白的位置590处插入的肽包含选自由SEQ ID NO:68至SEQ ID NO:75中的任一个组成的组的氨基酸序列。在本文公开的衣壳蛋白的一些实施方案中,在AAV1血清型的衣壳蛋白的位置590处插入的肽包含氨基酸序列SEQ ID NO:71。在本文公开的衣壳蛋白的一些实施方案中,在AAV1血清型的衣壳蛋白的位置590处插入的肽包含选自由SEQ ID NO:1、SEQ IDNO:2和SEQ ID NO:3中的任一个组成的组的氨基酸序列。
在本文公开的衣壳蛋白的一些实施方案中,包含SEQ ID NO:1-32中任一个的氨基酸序列的肽插入在AAV6血清型的衣壳蛋白的氨基酸位置454处。在本文公开的衣壳蛋白的一些实施方案中,包含SEQ ID NO:68-110中任一个的氨基酸序列的肽插入在AAV6血清型的衣壳蛋白的氨基酸位置454处。在本文公开的衣壳蛋白的一些实施方案中,包含SEQ ID NO:1-32中任一项的氨基酸序列的肽插入在AAV6血清型的衣壳蛋白的氨基酸位置590处。在本文公开的衣壳蛋白的一些实施方式中,包含SEQ ID NO:68-110中任一个的氨基酸序列的肽插入在AAV6血清型的衣壳蛋白的氨基酸位置590处。在本文公开的衣壳蛋白的一些实施方式中,在AAV6血清型的衣壳蛋白的位置454处插入的肽包含选自SEQ ID NO:19至SEQ IDNO:27中任一个的氨基酸序列。在本文公开的衣壳蛋白的一些实施方式中,在AAV6血清型的衣壳蛋白的位置590处插入的肽包含选自SEQ ID NO:19至SEQ ID NO:27中任一个的氨基酸序列。
在本文公开的衣壳蛋白的一些实施方案中,包含SEQ ID NO:1-32中任一个的氨基酸序列的肽插入在AAV2血清型的衣壳蛋白的氨基酸位置588处。在本文公开的衣壳蛋白的一些实施方式中,包含SEQ ID NO:68-110中任一个的氨基酸序列的肽插入在AAV2血清型的衣壳蛋白的氨基酸位置588处。在本文公开的衣壳蛋白的一些实施方式中,在AAV2血清型的衣壳蛋白的位置588处插入的肽包含选自由SEQ ID NO:90至SEQ ID NO:110中任一个组成的组的氨基酸序列。在本文公开的衣壳蛋白的一些实施方式中,在AAV2血清型的衣壳蛋白的位置588处插入的肽包含选自下述任一个的氨基酸序列:SEQ ID NO:95、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:106、SEQ ID NO:91和SEQ IDNO:102。在本文公开的衣壳蛋白的一些实施方式中,在AAV2血清型的衣壳蛋白的位置588处插入的肽包含选自由SEQ ID NO:4-7中任一个组成的组的氨基酸序列。
在本文公开的衣壳蛋白的一些实施方式中,包含SEQ ID NO:1-32中任一个的氨基酸序列的肽被插入AAV3B血清型的衣壳蛋白的氨基酸位置589处。在本文公开的衣壳蛋白的一些实施方式中,包含SEQ ID NO:68-110中任一个的氨基酸序列的肽被插入AAV3B血清型的衣壳蛋白的氨基酸位置589处。在本文公开的衣壳蛋白的一些实施方式中,在AAV3B血清型的衣壳蛋白的位置589处插入的肽包含选自由SEQ ID NO:76-85中任一个组成的组的氨基酸序列。在本文公开的衣壳蛋白的一些实施方式中,在AAV3B血清型的衣壳蛋白的位置589处插入的肽包含选自下组中任一个的氨基酸序列:SEQ ID NO:78、SEQ ID NO:80、SEQID NO:77、SEQ ID NO:79、SEQ ID NO:76和SEQ ID NO:83。在本文公开的衣壳蛋白的一些实施方式中,在AAV3B血清型的衣壳蛋白的位置589处插入的肽包含选自由SEQ ID NO:8至SEQID NO:11中任一个组成的组的氨基酸序列。
在本文公开的衣壳蛋白的一些实施方案中,包含SEQ ID NO:1-32中任一个的氨基酸序列的肽插入AAV5血清型的衣壳蛋白的氨基酸位置578处。在本文公开的衣壳蛋白的一些实施方式中,包含SEQ ID NO:68-110中任一个的氨基酸序列的肽插入AAV5血清型的衣壳蛋白的氨基酸位置578处。在本文公开的衣壳蛋白的一些实施方式中,在AAV5血清型的衣壳蛋白的位置578处插入的肽包含选自由SEQ ID NO:28至SEQ ID NO:32中任一个组成的组的氨基酸序列。
在本文公开的衣壳蛋白的一些实施方案中,包含SEQ ID NO:1-32中任一项的氨基酸序列的肽插入AAV8血清型的衣壳蛋白的氨基酸位置591处。在本文公开的衣壳蛋白的一些实施方式中,包含SEQ ID NO:68-110中任一个的氨基酸序列的肽被插入AAV8血清型的衣壳蛋白的氨基酸位置591处。
在本文公开的衣壳蛋白的一些实施方案中,包含SEQ ID NO:1-32中任一项的氨基酸序列的肽插入AAV9血清型的衣壳蛋白的氨基酸位置266处。在本文公开的衣壳蛋白的一些实施方式中,包含SEQ ID NO:68-110中任一个的氨基酸序列的肽插入AAV9血清型的衣壳蛋白的氨基酸位置266处。在本文公开的衣壳蛋白的一些实施方案中,包含SEQ ID NO:1-32中任一项的氨基酸序列的肽插入AAV9血清型的衣壳蛋白的氨基酸位置455处。在本文公开的衣壳蛋白的一些实施方式中,包含SEQ ID NO:68-110中任一项的氨基酸序列的肽插入AAV9血清型的衣壳蛋白的氨基酸位置455处。在本文公开的衣壳蛋白的一些实施方案中,包含SEQ ID NO:1-32中任一项的氨基酸序列的肽插入AAV9血清型的衣壳蛋白的氨基酸位置589处。在本文公开的衣壳蛋白的一些实施方式中,包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入AAV9血清型的衣壳蛋白的氨基酸位置589处。在本文公开的衣壳蛋白的一些实施方式中,在AAV9血清型的衣壳蛋白的位置266处插入的肽包含选自由SEQ ID NO:12至SEQ ID NO:18中任一个组成的组的氨基酸序列。在本文公开的衣壳蛋白的一些实施方式中,在AAV9血清型的衣壳蛋白的位置266处插入的肽包含选自SEQ ID NO:86至SEQ IDNO:89中任一个的氨基酸序列。在本文公开的衣壳蛋白的一些实施方案中,在AAV9血清型的衣壳蛋白的位置266处插入的肽包含SEQ ID NO:89的氨基酸序列。在这里公开的衣壳蛋白的一些实施方式中,在AAV9血清型的衣壳蛋白的位置455处插入的肽包含选自由SEQ IDNO:12到SEQ ID NO:18中任一个组成的组的氨基酸序列。在本文公开的衣壳蛋白的一些实施方式中,在AAV9血清型的衣壳蛋白的位置455处插入的肽包含选自由SEQ ID NO:86到SEQID NO:89中任一个组成的组的氨基酸序列。在本文公开的衣壳蛋白的一些实施方式中,在AAV9血清型的衣壳蛋白的位置455处插入的肽包含SEQ ID NO:89的氨基酸序列。在本文公开的衣壳蛋白的一些实施方式中,在AAV9血清型的衣壳蛋白的位置455处插入的肽包含选自由SEQ ID NO:12到SEQ ID NO:18中任一个组成的组的氨基酸序列。在本文公开的衣壳蛋白的一些实施方式中,在AAV9血清型的衣壳蛋白的位置589处插入的肽包含选自由SEQ IDNO:86至SEQ ID NO:89中任一个组成的组的氨基酸序列。在本文公开的衣壳蛋白的一些实施方式中,在AAV9血清型的衣壳蛋白的位置589处插入的肽包含SEQ ID NO:89的氨基酸序列。
本文还公开了包含如本文所公开的插入肽的AAV衣壳蛋白。在一些实施方式中,所述衣壳蛋白为VP1、VP2或VP3。在一些实施方式中,所述肽被插入在衣壳蛋白的残基450与600之间的位置处。在一些实施方式中,所述肽被插入在(i)AAV1衣壳蛋白的位置590处,(ii)AAV6衣壳蛋白的位置454或590处,(iii)AAV2衣壳蛋白的位置588处,(iv)AAV3B衣壳蛋白的位置589处,(v)AAV5衣壳蛋白的位置578处,(vi)AAV8衣壳蛋白的位置591处,或(vii)AAV9衣壳蛋白的位置266、455或589处,其中所述位置对应于所述AAV血清型中VP1的编号。在一些实施方式中,所述肽被插入在AAV1衣壳蛋白的位置590处。在一些实施方式中,所述肽被插入在AAV6衣壳蛋白的位置454或590处。在一些实施方式中,所述肽被插入在AAV2衣壳蛋白的位置588处。在一些实施方式中,所述肽被插入在AAV3B衣壳蛋白的位置589处。在一些实施方式中,所述肽被插入在AAV5衣壳蛋白的位置578处。在一些实施方式中,所述肽被插入在AAV8衣壳蛋白的位置591处。在一些实施方式中,所述肽被插入在AAV9衣壳蛋白的位置266、455或589处。应理解,可选择衣壳蛋白中的其他位点用于插入。还应理解,所述氨基酸序列可插入VP2或VP3的对应位置处。
本文还公开了编码本文所公开的肽、衣壳蛋白和AAV变体的核酸序列。
另外,本文公开了包含本文所公开的插入肽的AAV载体。在一些实施方式中,所述肽为AAV载体的衣壳蛋白的一部分。
【2】在一些实施方式中,本发明的插入肽具有针对靶细胞或组织的细胞或组织向性。在一些实施方式中,所述靶细胞或组织包括但不限于来自下述的细胞:CNS、心脏、肺脏、气管、食道、肌肉、骨骼、软骨、胃、胰脏、肠、肝脏、膀胱、肾脏、尿管、尿道、子宫、输卵管、卵巢、睾丸、前列腺、眼部、血液、淋巴或口腔黏膜。在一些实施方式中,靶细胞或组织来自肝脏。在一些实施方式中,靶细胞或组织来自CNS。在一些实施方式中,靶细胞包括但不限于神经元、神经胶质细胞、星形胶质细胞、少突胶质细胞、小神经胶质细胞、雪旺细胞、室管膜细胞、肝细胞、星状脂肪储存细胞、枯否氏细胞、肝内皮细胞、上皮细胞、心肌细胞、平滑肌细胞、T细胞、B细胞、造血干细胞和胚胎干细胞。
包含本发明的插入肽的载体可用于将核酸递送至靶细胞或组织。在一个方面中,本发明提供将核酸递送至靶细胞或组织的方法,其包含施用包含所述核酸的AAV载体,其中所述AAV载体包含本发明的靶向蛋白。在一些实施方式中,所述靶细胞或组织包括但不限于来自下述的细胞:CNS、心脏、肺脏、气管、食道、肌肉、骨骼、软骨、胃、胰脏、肠、肝脏、膀胱、肾脏、尿管、尿道、子宫、输卵管、卵巢、睾丸、前列腺、眼部、血液、淋巴或口腔黏膜。在一些实施方式中,所述靶细胞或组织来自肝脏。在一些实施方式中,所述靶细胞或组织来自CNS。在一些实施方式中,所述靶细胞包括但不限于神经元、神经胶质细胞、星形胶质细胞、少突胶质细胞、小神经胶质细胞、雪旺细胞、室管膜细胞、肝细胞、星状脂肪储存细胞、枯否氏细胞、肝内皮细胞、上皮细胞、心肌细胞、平滑肌细胞、T细胞、B细胞、造血干细胞和胚胎干细胞。
DNA结合分子/结构域
本文描述了包含特异性结合任何所关注基因或基因座中的目标位点的DNA结合分子/结构域的组合物。任何DNA结合分子/结构域可用于本文公开的组合物及方法,包括但不限于锌指DNA结合域、TALE DNA结合域、CRISPR/Cas核酸酶的DNA结合部分(导引或sgRNA)或来自大范围核酸酶的DNA结合域。在本文所述的方法及组合物中,应理解,术语“Cas”包括Cas9及Cfp1蛋白两者。因此,如本文所用,“CRISPR/Cas系统”是指CRISPR/Cas和/或CRISPR/Cfp1系统,包括核酸酶、切口酶和/或转录因子系统。
在一些实施方式中,可使用其他Cas蛋白。一些例示性Cas蛋白包括Cas9、Cpf1(亦称为Cas12a)、C2c1、C2c2(亦称为Cas13a)、C2c3、Cas1、Cas2、Cas4、CasX及CasY;且包括其工程化及天然变体(Burstein等人(2017)Nature 542:237-241),例如HF1/spCas9(Kleinstiver等人(2016)Nature 529:490-495;Cebrian-Serrano及Davies(2017)MammGenome(2017)28(7):247-261);分裂Cas9系统(Zetsche等人(2015)Nat Biotechnol 33(2):139-142)、基于内含肽-外显肽系统的反式剪接Cas9(Troung等人(2015)Nucl AcidRes 43(13):6450-8);mini-SaCas9(Ma等人(2018)ACS Synth Biol 7(4):978-985)。因此,在本文所述的方法及组合物中,应理解,术语“Cas”包括所有Cas变体蛋白质(天然及工程化)。因此,如本文所用,“CRISPR/Cas系统”是指任何CRISPR/Cas系统,包括核酸酶、切口酶和/或转录因子系统。
系统
本文所述的DNA编辑复合物(或其组分分子)可通过如本文所述的方法及组合物递送至靶细胞。递送可以是递送至分离的细胞(其继而可施用于活的受试者,以用于离体细胞疗法)或活的受试者。将基因编辑分子递送至细胞及受试者是本领域中已知的。
适合的细胞包括但不限于真核及原核细胞和/或细胞系。此类细胞或由此类细胞产生的细胞系的非限制性实例包括T细胞、COS、CHO(例如CHO-S、CHO-K1、CHO-DG44、CHO-DUXB11、CHO-DUKX、CHOK1SV)、VERO、MDCK、WI38、V79、B14AF28-G3、BHK、HaK、NS0、SP2/0-Ag14、HeLa、HEK293(例如HEK293-F、HEK293-H、HEK293-T)及perC6细胞,以及昆虫细胞,诸如草地贪夜蛾(Spodoptera fugiperda,Sf),或真菌细胞,诸如酵母属(Saccharomyces)、毕赤酵母属(Pichia)及裂殖酵母属(Schizosaccharomyces)。在某些实施方式中,细胞系为CHO-K1、MDCK或HEK293细胞系。适合的细胞也包括干细胞,诸如胚胎干细胞、诱导的多能干细胞(iPS细胞)、造血干细胞、神经元干细胞及间充质干细胞。
如本文所述的DNA编辑复合物也可使用含有编码所述组分(例如融合分子)中的一种或多种的序列的本发明载体来递送。另外,也可经由这些载体递送额外核酸(例如供体)。此外,显而易见的是这些载体中任一个可按需要包含一或多个DNA结合蛋白编码序列和/或额外核酸。因此,当一或多种如本文所述的DNA结合蛋白(以及需要时额外的DNA)被引入至细胞中时,它们可在相同载体或不同载体上进行。当使用多个载体时,各载体可视需要包含编码一或多种DNA结合蛋白及额外核酸的序列。常规的基于病毒及非病毒的基因转移方法可用于在细胞(例如哺乳动物细胞)及目标组织中引入编码工程化DNA结合蛋白的核酸及视需要共引入额外核苷酸序列。此类方法也可用于将核酸体外施用(例如编码DNA结合蛋白和/或供体)至细胞。在某些实施方式中,施用核酸以用于体内或离体基因疗法用途。
包装细胞被用于形成能够感染宿主细胞的病毒颗粒。此类细胞包括HEK293细胞,其包装腺病毒或AAV。基因疗法中所用的病毒载体通常由将核酸载体包装于病毒颗粒中的生产者细胞系产生。载体通常含有包装及后续整合至宿主(若可行)中所需的最少病毒序列,其他病毒序列被编码待表达的蛋白质的表达盒取代。缺少的病毒功能由包装细胞系以反式供应。例如基因疗法中所用的AAV载体通常仅具有来自AAV基因组的反向末端重复(ITR)序列,其为包装及整合至宿主基因组中所需。将病毒DNA包装于含有编码其他AAV基因(亦即rep及cap)但缺乏ITR序列的辅助质粒的细胞系中。细胞系也用腺病毒作为辅助病毒感染。辅助病毒促进AAV载体复制及由辅助质粒进行的AAV基因表达。由于缺乏ITR序列,故辅助质粒不会被大量包装。腺病毒污染可通过例如腺病毒相比于AAV更敏感的热处理来减少。在一些实施方式中,杆状病毒系统被用于产生AAV(参见例如Smith等人(2009)Mol Ther434:37-54)。
在许多基因疗法应用中,需要在针对特定组织类型的高程度特异性的情况下递送基因疗法载体。因此,病毒载体可通过将配体以与病毒外壳蛋白的融合蛋白形式在病毒的外表面上表达而被修饰成对于给定细胞类型具有特异性。配体被选择为对于已知存在于所关注细胞类型上的受体具有亲和力。例如,Han等人(1995)Proc.Natl.Acad.Sci.USA92:9747-9751报道莫罗尼鼠类白血病病毒可经修饰以表达与gp70融合的人类调蛋白,且重组病毒感染表达人类表皮生长因子受体的某些人类乳腺癌细胞。此原理可扩展至其他病毒-靶细胞对,其中靶细胞表达受体且病毒表达包含针对所述细胞表面受体的配体的融合蛋白。例如,丝状噬菌体可经工程化以展示对于几乎任何所选细胞受体具有特异性结合亲和力的抗体片段(例如FAB或Fv)。尽管以上描述主要适用于病毒载体,但相同原理可适用于非病毒载体。此类载体可被工程化以含有有利于被特定靶细胞摄入的特定摄入序列。
用于CRISPR/Cas系统的递送方法可包含上文所述的那些方法。例如,在动物模型中,体外转录的Cas编码mRNA或重组Cas蛋白可使用玻璃针直接注入至基因组编辑动物的单细胞期胚胎中。为了体外在细胞中表达Cas及导引RNA,通常经由脂转染或电穿孔将编码其的质粒转染至细胞中。另外,重组Cas蛋白可与体外转录的导引RNA复合,其中Cas-导引RNA核糖核蛋白被所关注细胞摄入(Kim等人(2014)Genome Res 24(6):1012)。出于治疗目的,可通过病毒及非病毒技术的组合来递送Cas及导引RNA。例如,编码Cas的mRNA可经由纳米颗粒递送来递送,而导引RNA及任何所需转基因或修复模板通过AAV递送(Yin等人(2016)NatBiotechnol 34(3):328)。
基因疗法载体可通过向个体患者(受试者)施用,通常通过全身施用(例如静脉内、腹膜内、肌肉内、皮下或颅内输注)或局部施用而体内递送,如下文所述。或者,载体可离体递送至细胞,诸如自个体患者外植的细胞(例如淋巴细胞、骨髓抽出物、组织切片)或通用供体造血干细胞,之后通常在针对已并入载体的细胞选择之后将细胞再植入患者中。
用于诊断、研究、移植或用于基因疗法(例如经由将经转染细胞再输注至宿主生物体中)的离体细胞转染是本领域技术人员所熟知。在一些实施方式中,从受试者生物体中分离细胞,将细胞用DNA结合蛋白核酸(基因或cDNA)转染,并再输注回至受试者生物体(例如患者)中。适合于离体转染的各种细胞类型是本领域技术人员熟知的(参见例如Freshney等人,Culture of Animal Cells,A Manual of Basic Technique(第3版1994)及其中所引用的关于如何从患者分离及培养细胞的讨论的参考文献)。
在一个实施方式中,干细胞在离体操作中用于细胞转染及基因疗法。使用干细胞的优势为其可体外分化为其他细胞类型,或可引入哺乳动物(诸如细胞的供体)中,在此它们将植入在骨髓中。使用诸如GM-CSF、IFN-γ及TNF-α的细胞因子将CD34+细胞体外分化为临床上重要的免疫细胞类型的方法是已知的(参见Inaba等人(1992)J.Exp.Med.176:1693-1702)。
含有治疗性DNA结合蛋白(或编码这些蛋白质的核酸)的如本文所述的载体亦可直接施用至生物体,用于体内转导细胞。施用可通过通常用于使分子与血液或组织细胞最终接触的途径中的任一种进行,包括但不限于注射、输注、局部施用及电穿孔。施用此类核酸的适合方法是本领域技术人员可以获得和熟知的,尽管超过一种途径可用于施用特定组合物,但一种特定途径可通常提供比另一途径更直接且更有效的反应。
医药学上可接受的载体部分地由所施用的特定组合物以及用于施用所述组合物的特定方法所决定。因此,有多种医药组合物的适合配方可供使用,如下文所述(参见例如Remington's Pharmaceutical Sciences,第17版,1989)。
如上所指出,所公开方法及组合物可用于任何类型的细胞,包括但不限于任何类型的原核细胞、真菌细胞、古细菌细胞、植物细胞、昆虫细胞、动物细胞、脊椎动物细胞、哺乳动物细胞及人类细胞,包括T细胞及干细胞。适用于蛋白质表达的细胞系是本领域技术人员已知的,包括但不限于COS、CHO(例如CHO-S、CHO-K1、CHO-DG44、CHO-DUXB11)、VERO、MDCK、WI38、V79、B14AF28-G3、BHK、HaK、NS0、SP2/0-Ag14、HeLa、HEK293(例如HEK293-F、HEK293-H、HEK293-T)、perC6、昆虫细胞(诸如草地贪夜蛾(Sf)),及真菌细胞(诸如酵母属、毕赤酵母属及裂殖酵母属)。也可使用这些细胞系的后代、变体及衍生物。
应用
工程化AAV衣壳可用于体内及离体基因疗法及基因组编辑的许多不同应用。本文所公开的AAV变体通过使用定向进化产生,其中定向进化涉及在施用后使用细胞及体内选择。在一些实施方式中,相比于通过包含对应亲本AAV衣壳蛋白或野生型AAV的AAV病毒颗粒对细胞、组织或细胞器进行的转导,本文所公开的变体衣壳蛋白当存在于AAV病毒颗粒中时赋予增加的细胞、组织或细胞器转导。举例而言,在一些实施方式中,相比于包含对应亲本AAV衣壳蛋白或野生型AAV衣壳蛋白的AAV病毒颗粒,本文所公开的变体衣壳蛋白当存在于AAV病毒颗粒中时赋予更高效的细胞、组织或细胞器转导,例如相比于包含亲本AAV衣壳蛋白或野生型AAV的AAV病毒颗粒,所述细胞、组织或细胞器摄入更多的包含变体AAV衣壳蛋白的AAV病毒颗粒。在一些此类实施方式中,相比于通过野生型AAV病毒颗粒或包含对应亲本AAV衣壳蛋白的rAAV的细胞、组织或细胞器转导,AAV变体病毒颗粒或变体rAAV展现细胞、组织或细胞器转导有至少2倍、至少5倍、至少10倍、至少15倍、至少20倍、至少25倍、至少30倍、至少40倍、至少50倍或大于50倍增加。在一些实施方式中,所述细胞或组织包括但不限于来自下述的细胞或组织:CNS、心脏、肺脏、气管、食道、肌肉、骨骼、软骨、胃、胰脏、肠、肝脏、膀胱、肾脏、尿管、尿道、子宫、输卵管、卵巢、睾丸、前列腺、眼部、血液、淋巴或口腔黏膜。在一些实施方式中,所述细胞或组织来自肝脏。在一些实施方式中,所述细胞或组织来自CNS。在一些实施方式中,所述靶细胞包括但不限于神经元、神经胶质细胞、星形胶质细胞、少突胶质细胞、小神经胶质细胞、雪旺细胞、室管膜细胞、肝细胞、星状脂肪储存细胞、枯否氏细胞、肝内皮细胞、上皮细胞、心肌细胞、平滑肌细胞、T细胞、B细胞、造血干细胞和胚胎干细胞。在一些实施方式中,相比于通过野生型AAV1、AAV2、AAV3B、AAV4、AAV5、AAV6、AAV8或AAV9病毒颗粒对细胞、组织或细胞器的转导,所述AAV变体病毒颗粒或变体rAAV展现对细胞、组织或细胞器的转导增加至少2倍、至少5倍、至少10倍、至少15倍、至少20倍、至少25倍、至少30倍、至少40倍、至少50倍、至少100倍、至少1000倍或大于1000倍。在某些此类实施方式中,相比于包含对应亲本AAV衣壳蛋白或野生型AAV衣壳蛋白的AAV病毒颗粒,本文所公开的变体衣壳蛋白当存在于AAV病毒颗粒中时赋予更广泛的灵长类动物CNS细胞转导。在一些实施方式中,变体AAV病毒颗粒转导包含对应亲本AAV衣壳蛋白的病毒颗粒不会转导的细胞类型,因此相比于对应亲本AAV病毒颗粒,其转导CNS中更多类型的细胞。在一些实施方式中,AAV变体病毒颗粒优先转导CNS细胞,例如,相比于另一细胞而言,rAAV病毒颗粒以2倍、5倍、10倍、15倍、20倍、25倍、50倍或大于50倍的特异性感染CNS细胞。在一些实施方式中,被转导的CNS细胞为神经元或神经胶质细胞,包括但不限于星形胶质细胞、少突神经胶质细胞、小神经胶质细胞、施万细胞或室管膜细胞。
【3】在某些此类实施方式中,相比于包含对应亲本AAV衣壳蛋白或野生型AAV衣壳蛋白的AAV病毒颗粒,本文所公开的变体衣壳蛋白当存在于AAV病毒颗粒中时赋予更广泛的灵长类动物肝细胞转导。在一些实施方式中,变体AAV病毒颗粒转导不被包含对应亲本AAV衣壳蛋白的病毒颗粒所转导的细胞类型,因此相比于对应亲本AAV病毒颗粒,其转导肝脏中更多类型的细胞。在一些实施方式中,AAV变体病毒颗粒优先转导肝细胞,例如,相比于另一细胞,rAAV病毒颗粒以2倍、5倍、10倍、15倍、20倍、25倍、50倍或大于50倍的特异性感染肝细胞。在一些实施方式中,被转导的肝细胞为(但不限于)肝细胞、星状脂肪储存细胞、枯否氏细胞或肝内皮细胞。
可通过本领域中用于测量基因表达的任何数目的方法在体外或体内容易地评估CNS或肝细胞转导的增加,例如转导效率增加、更广泛转导、更优先转导等。举例而言,AAV可包装有含有包含报道基因(例如荧光蛋白)的表达盒的基因组,处于遍在的或细胞类型和/或组织特异性的启动子的控制下或与之可操作地连接,并通过以例如荧光显微法检测荧光蛋白来评估转导程度。作为另一实例,AAV可包装有包含带条形码的核酸序列的基因组,并通过以例如PCR检测核酸序列来评估转导程度。作为另一实例,AAV可包装有含有包含用于治疗疾病的治疗性基因的表达盒的基因组,并通过在施用该AAV的需要治疗的受试者中检测疾病的治疗来评估转导程度。
可通过本文所述的组合物及方法治疗和/或预防的例示性遗传疾病包括但不限于软骨发育不全、色盲、酸性麦芽糖酶缺乏症、腺苷脱胺酶缺乏症(OMIM编号102700)、肾上腺脑白质营养不良、艾卡迪综合症(aicardi syndrome)、α-1抗胰蛋白酶缺乏症、α-地中海贫血症、雄激素不敏感综合症、阿帕特综合症(apert syndrome)、致心律失常性右室发育不良、毛细血管扩张性共济失调、巴特综合症(barth syndrome)、β-地中海贫血症、蓝色橡皮疱痣综合症、卡纳万氏病(canavan disease)、慢性肉芽肿病(CGD)、猫叫综合症(cri duchat syndrome)、囊肿性纤维化、德尔肯氏病(dercum's disease)、外胚层发育不良、范康尼氏贫血(fanconi anemia)、进行性骨化性纤维发育不良、X脆折综合症、半乳糖血症、高歇氏病(Gaucher's disease)、全身型神经节苷脂贮积病(例如GM1)、血色沉着病、β-血球蛋白的第6密码子中的血红蛋白C突变(HbC)、血友病、亨廷顿氏病(Huntington's disease)、贺勒侯症群(Hurler Syndrome)、低磷酸酶症、克氏综合症(Klinefelter syndrome)、克拉贝氏病(Krabbes Disease)、兰-吉二氏综合症(Langer-Giedion Syndrome)、白血球黏着缺乏症(LAD,OMIM编号116920)、脑白质营养不良、长QT综合症、马凡氏综合症(Marfansyndrome)、牟比士综合症(Moebius syndrome)、黏多糖病(MPS)、甲髌综合症、肾原性尿崩症、神经纤维瘤、尼曼-匹克病(Neimann-Pick disease)、成骨不全、苯酮尿症(PKU)、卟啉症、普拉德-威利综合症(Prader-Willi syndrome)、早老症、普洛提斯综合症(Proteussyndrome)、视网膜母细胞瘤、雷特氏综合症(Rett syndrome)、鲁-泰二氏综合症(Rubinstein-Taybi syndrome)、圣菲利波综合症(Sanfilippo syndrome)、严重复合免疫缺乏症(SCID)、舒瓦克曼综合症(Shwachman syndrome)、镰状细胞疾病(镰状细胞贫血)、史-马二氏综合症(Smith-Magenis syndrome)、斯蒂克勒综合症(Stickler syndrome)、泰-萨克斯病(Tay-Sachs disease)、血小板减少桡骨缺失(TAR)综合症、崔契尔柯林斯综合症(Treacher Collins syndrome)、三染色体症、结节性硬化症、特纳氏综合症(Turner'ssyndrome)、尿素循环障碍、逢希伯-兰道病(von Hippel-Landau disease)、瓦登伯革氏综合症(Waardenburg syndrome)、威廉姆斯综合症(Williams syndrome)、威尔森氏病(Wilson's disease)、韦-奥氏综合症(Wiskott-Aldrich syndrome)、X连锁淋巴增生综合症(XLP,OMIM编号308240)。
可通过靶向DNA碱基编辑治疗的额外例示性疾病包括获得性免疫缺乏症、溶酶体贮积病(例如高歇氏病(Gaucher's disease)、GM1、法布立病(Fabry disease)及泰-萨克斯病(Tay-Sachs disease))、黏多糖病(例如亨特氏病(Hunter's disease)、赫尔勒氏病(Hurler's disease))、血红素病(例如镰状细胞疾病、HbC、α-地中海贫血症、β-地中海贫血)及血友病。
此类方法也允许治疗宿主感染(病毒性或细菌性)(例如通过阻断病毒或细菌受体的表达,由此预防宿主生物体中的感染和/或扩散)。可靶向的病毒或病毒受体的非限制性实例包括单纯疱疹病毒(HSV)(诸如HSV-1及HSV-2)、水痘带状疱疹病毒(VZV)、埃-巴二氏病毒(Epstein-Barr virus,EBV)及巨细胞病毒(CMV)、HHV6及HHV7。肝炎病毒家族包括甲型肝炎病毒(HAV)、乙型肝炎病毒(HBV)、丙型肝炎病毒(HCV)、丁型肝炎病毒(HDV)、E型肝炎病毒(HEV)及G型肝炎病毒(HGV)。可靶向的其他病毒或其受体包括但不限于小核糖核酸病毒科(Picornaviridae)(例如脊髓灰白质炎病毒等);杯状病毒科(Caliciviridae);披膜病毒科(Togaviridae)(例如风疹病毒、登革病毒等);黄病毒科(Flaviviridae);冠状病毒科(Coronaviridae);呼肠孤病毒科(Reoviridae);双股核醣酸病毒科(Birnaviridae);弹状病毒科(Rhabodoviridae)(例如狂犬病病毒等);丝状病毒科(Filoviridae);副黏液病毒科(Paramyxoviridae)(例如腮腺炎病毒、麻疹病毒、呼吸道合胞病毒等);正黏液病毒科(Orthomyxoviridae)(例如A、B及C型流感病毒等);布尼亚病毒科(Bunyaviridae);沙粒病毒科(Arenaviridae);逆转录病毒科(Retroviradae);慢病毒(例如HTLV-I、HTLV-II;HIV-1(亦称为HTLV-III、LAV、ARV、hTLR等)、HIV-II);猿猴免疫缺乏病毒(SIV)、人类乳头状瘤病毒(HPV)、流感病毒及蜱传脑炎病毒。关于这些及其他病毒的描述,参见例如Virology,第3版(W.K.Joklik编1988);Fundamental Virology,第2版(B.N.Fields及D.M.Knipe编1991)。HIV受体例如包括CCR-5及CXCR-4。
由本发明AAV变体递送的基因产物可用于改变与肌肉疾病及创伤直接或间接关联的基因产物水平或基因产物活性。经本发明AAV变体转导的骨骼肌、心肌或平滑肌也可用作生物工厂,以产生及分泌治疗蛋白,用于在远程器官中以反式治疗疾病。基因产物与遗传疾病直接或间接关联的基因包括例如编码以下基因产物中任一种的基因:肌缩蛋白,包括小型及微型肌缩蛋白(DMD;例如GenBank登录号NP 003997.1);肌联蛋白(TTN);肌联蛋白帽(TCAP)cc-肌聚糖(SGCA)、β-肌聚糖(SGCB)、γ-肌聚糖(SGCG)或δ-肌聚糖(SGCD);α-1-抗胰蛋白酶(Al-AT);肌凝蛋白重链6(MYH6);肌凝蛋白重链7(MYH7);肌凝蛋白重链11(MYH11);肌凝蛋白轻链2(ML2);肌凝蛋白轻链3(ML3);肌凝蛋白轻链激酶2(MYLK2);肌凝蛋白结合蛋白C(MYBPC3);肌间线蛋白(DES);发动蛋白2(DNM2);层黏连蛋白cc2(LAMA2);核纤层蛋白A/C(LMNA);核纤层蛋白B(LMNB);核纤层蛋白B受体(LBR);质膜修复蛋白(dysferlin,DYSF);伊默菌素(emerin,EMD);胰岛素;凝血因子,包括但不限于因子VIII及因子IX;红细胞生成素(EPO);脂蛋白脂肪酶(LPL);肌质网状Ca2++-ATP酶(SERCA2A)、S100钙结合蛋白Al(S100A1);肌微管素(MTM);DM1蛋白激酶(DMPK;例如GenBank登录号NG_009784.1);肝糖磷酸化酶L(PYGL);肌肉相关性肝糖磷酸化酶(PYGM;例如GenBank登录号NP 005600.1);肝糖合酶1(GYS1);肝糖合酶2(GYS2);cc-半乳糖苷酶A(GLA;例如GenBank登录号NP_000160.1;SEQ ID NO:67);a-N-乙酰半乳糖胺酶(NAGA);酸性cc-葡糖苷酶(GAA;例如Genbank登录号NP_000143.2;SEQ ID NO:68)、神经磷脂酶磷酸二酯酶1(SMPD1);溶酶体酸脂肪酶(LIP A);胶原蛋白I型al链(COL1 Al);胶原蛋白I型o2链(COL1A2);胶原蛋白III型al链(COL3A1);胶原蛋白V类型al链(COL5A1);胶原蛋白V类型a2链(COL5A2);胶原蛋白VI型al链(COL6A1);胶原蛋白VI型o2链(COL6A2);胶原蛋白VI型a3链(COL6A3);原胶原-离氨酸2-侧氧基戊二酸酯5-双加氧酶(PLOD1);溶酶体酸脂肪酶(LIP A);共济蛋白(FXN;例如Genbank登录号NP_000135.2);肌肉抑制素(MSTN);β-Ν-乙酰基己糖苷酶A(HEXA);β-Ν-乙酰基己醣胺酶B(HEXB);β-葡糖脑苷脂酶(GBA);单磷酸腺苷脱胺酶1(AMPD1);β-血球蛋白(HBB);艾杜糖苷(IDUA);2-硫酸艾杜糖醛(IDS);肌钙蛋白1(TNNI3);肌钙蛋白T2(TNNT2);肌钙蛋白C(TNNC1);肌旋蛋白1(TPM1);肌旋蛋白3(TPM3);N-乙酰基-a-胺基葡糖苷酶(NAGLU);N-磺基葡糖胺磺基水解酶(SGSH);乙酰肝素-a-胺基葡糖苷N-乙酰转移酶(HGSNAT);整合素a7(IGTA7);整合素a9(IGTA9);葡糖胺(N-乙酰基)-6-硫酸酯酶(GNS);半乳胺糖(N-乙酰基)-6-硫酸酯酶(GALNS);β-半乳糖苷酶(GLB1);β-葡萄糖醛酸苷酶(GUSB);玻尿酸胺基葡糖苷酶1(HYALl);酸性神经酰胺酶(ASAHl);半乳糖神经酰胺酶(GALC);组织蛋白酶A(CTSA);组织蛋白酶D(CTSA);组织蛋白酶K(CTSK);GM2神经节苷脂活化剂(GM2A);芳基硫酸酯酶A(ARSA);芳基硫酸酯酶B(ARSB);甲酰基甘氨酸生成酶(SUMF1);神经胺糖酸酶1(NEU1);N-乙酰葡糖胺-1-磷酸酯转移酶a(GNPTA);N-乙酰葡糖胺-1-磷酸酯转移酶β(GNPTB);N-乙酰葡糖胺-1-磷酸酯转移酶γ(GNPTG);黏脂蛋白-1(MCOLN1);NPC细胞内转运体1(NPC1);NPC细胞内转运体2(NPC2);蜡样质脂褐质沈积症5(CLN5);蜡样质脂褐质沈积症6(CLN6);蜡样质脂褐质沈积症8(CLN8);棕榈酰基蛋白质硫酯酶1(PPT1);三肽基肽酶1(TPP1);battenin(CLN3);DNAJ热休克蛋白家族40成员C5(DNAJC5);主要易化子超家族域包含8(MFSD8);甘露糖苷酶a 2B类成员1(MAN2B1);甘露糖苷酶β(MANBA);天冬胺酰葡糖胺苷酶(AGA);cc-L-岩藻糖苷酶(FUCA1);胱氨酸素,溶酶体半胱氨酸转运体(cystinosin,CTNS);唾液酸转运蛋白;溶质载体家族2成员10(SLC2A10);溶质载体家族17成员5(SLC17A5);溶质载体家族6成员19(SLC6A19);溶质载体家族22成员5(SLC22A5);溶质载体家族37成员4(SLC37A4);溶酶体相关膜蛋白2(LAMP2);钠电压门控通道a亚基4(SCN4A);钠电压门控通道β亚基4(SCN4B);钠电压门控通道a亚基5(SCN5A);钠电压门控通道a亚基4(SCN4A);钙电压门控通道亚基ale(CACNA1C);钙电压门控通道亚基eels(CACNA1S);磷酸甘油酸激酶1(PGK1);磷酸甘油酸变位酶2(PGAM2);淀粉-a-l,6-葡糖苷酶,4-cc-葡聚糖转移酶(AGL);钾电压门控通道ISK相关亚家族成员1(KCNE1);钾电压门控通道ISK相关亚家族成员2(KCNE2);钾电压门控通道亚家族J成员2(KCNJ2);钾电压门控通道亚家族J成员5(KCNJ5);钾电压门控通道亚家族H成员2(KCNH2);钾电压门控通道KQT样亚家族成员1(KCNQ1);超极化活化环状核苷酸闸控钾通道4(HCN4);氯离子电压门控通道1(CLCN1);肉碱棕榈酰基转移酶1A(CPT1 A);利阿诺定(ryanodine)受体1(RYR1);利阿诺定受体2(RYR2);桥接积分器1(BIN1);LARGE木糖基及葡萄糖醛酸基转移酶1(LARGE1);对接蛋白7(DOK7);fukutin(FKTN);fukutin相关蛋白(FKRP);硒蛋白N(SELENON);蛋白质O-甘露糖基转移酶1(POMT1);蛋白质O-甘露糖基转移酶2(POMT2);蛋白质O-键联甘露糖N-乙酰胺基葡萄糖转移酶1(POMGNT1);蛋白质O-键联甘露糖N-乙酰胺基葡萄糖转移酶2(POMGNT2);蛋白质-O-甘露糖激酶(POMK);类异戊二烯合酶域含有(ISPD);网蛋白(PLEC);胆碱能受体烟碱ε亚基(CHRNE);胆碱O-乙酰转移酶(CHAT);胆碱激酶β(CHKB);不对称乙酰胆碱酯酶的胶原蛋白样尾亚基(COLQ);突触的受体相关蛋白(RAPSN);四个半LIM域1(FHLl);β-1,4-葡萄糖醛酸基转移酶1(B4GAT1);β-1-N-乙酰基半乳糖胺基转移酶2(B3GALNT2);营养不良聚糖蛋白1(DAG1);跨膜蛋白5(TMEM5);跨膜蛋白43(TMEM43);SECIS结合蛋白2(SECISBP2);葡糖胺(UDP-N-乙酰基)-2-表异构酶/N-乙酰甘露糖胺激酶(GNE);anoctamin 5(AN05);结构维持染色体可挠性铰链域含有1(SMCHD1);乳酸脱氢酶A(LDHA);乳酸脱氢酶B(LHDB);钙蛋白酶3(CAPN3);窖蛋白3(CAV3);三联基元含有32(TRIM32);CCHC型锌指核酸结合蛋白(CNBP);伴肌动蛋白(NEB);肌动蛋白,ccl,骨胳肌(ACTA1);肌动蛋白,ccl,心肌(ACTC1),辅肌动蛋白cc2(ACTN2);poly(A)结合蛋白核1(PABPNl);含LEM域蛋白3(LEMD3);锌金属蛋白酶STE24(ZMPSTE24);微粒体三酸甘油酯转移蛋白(MTTP);胆碱能受体烟碱ccl亚基;生育酚转移酶蛋白(TTPA);驱动蛋白家族成员21A(KIF21 A);配对样同源盒2a(PHOX2A);硫酸乙酰肝素蛋白聚糖2(HSPG2);基质相互作用分子1(STIM1);notch 1(NOTCH1);notch 3(NOTCH3);小肌营养蛋白a(DTNA);蛋白激酶AMP活化,非催化j2(PRKAG2);富半胱氨酸及甘氨酸蛋白3(CSRP3);黏着斑蛋白(VCL);雷帕霉素靶蛋白2(MyoZ2);肌钯蛋白(MYPN);连接蛋白2(JPH2);受磷蛋白(PLN);钙网蛋白3(CALR3);连接蛋白F-肌动蛋白-结合蛋白(NEXN);LIM域结合3(LDB3);无眼4(EYA4);亨廷顿蛋白(HTT);雄激素受体(AR);蛋白质酪氨酸磷酸酯非受体11型(PTPNl l);连接斑珠蛋白(JUP);桥粒斑蛋白(DSP);桥粒斑菲素蛋白2(PKP2);桥粒芯蛋白2(DSG2);桥粒胶蛋白2(DSC2);连环蛋白cc3(CTNNA3);NK2同源盒5(NKX2-5);A-激酶锚定蛋白9(AKAP9);A-激酶锚定蛋白10(AKAP10);鸟嘌呤核苷酸-结合蛋白a-抑制活性多肽2(GNAI2);锚蛋白2(ANK2);syntropbincc-1(SNTA1);调钙蛋白1(CALM1);调钙蛋白2(CALM2);HTRA丝氨酸肽酶1(HTRA1);原纤维蛋白1(FBN1);原纤维蛋白2(FBN2);木糖基转移酶1(XYLT1);木糖基转移酶2(XYLT2);tafazzin(TAZ);尿黑酸1,2-双加氧酶(HGD);葡萄糖-6-磷酸酶催化亚基(G6PC);1,4-α-葡聚糖酶1(GBEl);磷酸果糖激酶,肌肉(PFKM);磷酸化酶激酶调节亚基α1(PHKA1);磷酸化酶激酶调节亚基α2(PHKA2);磷酸化酶激酶调节亚基β(PHKB);磷酸化酶激酶催化亚基γ2(PHKG2);磷酸甘油酸变位酶2(PGAM2);胱硫醚-β-合酶(CBS);亚甲基四氢叶酸还原酶(MTHFR);5-甲基四氢叶酸-高半胱氨酸甲基转移酶(MTR);5-甲基四氢叶酸-高半胱氨酸甲基转移酶还原酶(MTRR);甲基丙二酸尿症及高胱氨酸尿症,cblD型(MMADHC);粒线体DNA,包括但不限于粒线体编码的NADH:泛醌氧化还原酶核亚基1(MT-ND1);粒线体编码的NADH:泛醌氧化还原酶核亚基5(MT-ND5);粒线体编码的tRNA麸氨酸(MT-TE);粒线体编码的tRNA组氨酸(MT-TH);粒线体编码的tRNA白氨酸1(MT-TLl);线粒体编码的tRNA离氨酸(MT-TK);线粒体编码的tRNA丝氨酸1(MT-TS1);线粒体编码的tRNA缬氨酸(MT-TV);促分裂原活化蛋白激酶1(MAP2K1);B-Raf原癌基因,丝氨酸/苏氨酸激酶(BRAF);raf-1原癌基因,丝氨酸/苏氨酸激酶(RAF1);生长因子,包括但不限于胰岛素生长因子1(IGF-1);转化生长因子β3(TGF3);转化生长因子β受体,I型(TGF Rl);转化生长因子β受体,II型(TGF R2)、成纤维细胞生长因子2(FGF2)、成纤维细胞生长因子4(FGF4)、血管内皮生长因子A(VEGF-A)、血管内皮生长因子B(VEGF-B);血管内皮生长因子C(VEGF-C)、血管内皮生长因子D(VEGF-D)、血管内皮生长因子受体1(VEGFR1)及血管内皮生长因子受体2(VEGFR2);白介素;免疫黏附素;细胞因子;及抗体。在一些实施方式中,递送编码作为免疫调节剂的产物的基因。例示性的免疫调节基因包括细胞因子、趋化因子及对它们和/或它们的受体具有特异性的融合蛋白或抗体,例如抗IL-6融合蛋白利纳西普(Rilonacept)1、补体因子H特异性抗体兰帕米珠单抗(lampamizumab)等。
在一些实施方式中,递送编码位点特异性核酸内切酶的基因。例示性的核酸内切酶包括天然存在的限制酶等。在一些实施方式中,递送的核酸内切酶包括锌指核酸酶、TALENs、megaTALs、大范围核酸酶、CRISPR/Cas系统,包括Cas9、CasX、CasY等。此类位点特异性核酸酶可经工程化以切割基因组内的特定位置,并且非同源末端连接可随后修复断裂,同时插入或缺失若干核苷酸(也称为“插入或缺失(INDELs)”)。此类位点特异性核酸内切酶接着将蛋白质抛出框架且有效地敲除该基因。
在本文所公开的变体rAAV载体的一些实施方式中,编码所关注基因产物的核苷酸序列可操作地连接组成型启动子。适合的组成型启动子包括例如巨细胞病毒启动子(CMV)(Stinski等人(1985)Journal of Virology 55(2):431-441)、CMV早期增强子/鸡β-肌动蛋白(CBA)启动子/兔β-珠蛋白内含子(CAG)(Miyazaki等人(1989)Gene 79(2):269-277、CBSB(Jacobson等人(2006)Molecular Therapy 13(6):1074-1084)、人类延长因子la启动子(EFI a)(Kim等人(1990)Gene 91(2):217-223)、人类磷酸甘油酸激酶启动子(PGK)(Singer-Sam等人(1984)Gene 32(3):409-417、粒线体重链启动子(Loderio等人(2012)Proc Natl Acad Sci USA 109(17):6513-6518)、泛素启动子(Wulff等人(1990)FEBSLetters 261:101-105)。在其他实施方式中,编码所关注基因产物的核苷酸序列可操作地连接诱导型启动子。在一些情况下,编码所关注基因产物的核苷酸序列可操作地连接组织特异性或细胞类型特异性调节元件。举例而言,在一些情况下,编码所关注基因产物的核苷酸序列可操作地连接肝脏特异性调节元件(例如肝脏特异性启动子),例如赋予可操作地连接的基因在肝细胞中的选择性表达的调节元件。适合的肝脏特异性调节元件包括例如白蛋白启动子、α1-抗胰蛋白酶及甲状腺素转运蛋白启动子(TTR)。在一些情况下,所关注基因可操作地连接CNS特异性启动子或调节元件。适合的CNS特异性启动子包括但不限于GFAP启动子(星形胶质细胞)、SYN1启动子(神经元)及NSE/RU5'启动子(成熟神经元)。在一些情况下,所关注基因可操作地连接配体反应性启动子或分子开关(例如TetR系统(Berens及Hillen(2003)Eur J Biochem 270:3109-3121)。
如上所指出,本文所述的组合物及方法可用于基因修饰、基因校正及基因破坏。
本文所述的组合物及方法亦可应用于基于干细胞的疗法,包括但不限于引起下述的编辑:校正体细胞突变;破坏显性负等位基因;破坏病原体进入细胞或生产性感染所需的基因;增强的组织工程化,例如通过编辑促进功能组织分化或形成的基因活性;和/或破坏促进功能性组织分化或形成的基因活性;阻断或诱导分化,例如通过编辑阻断分化的基因,该分化促进干细胞沿特定谱系路径向下分化。用于此程序的细胞类型包括但不限于T细胞、B细胞、造血干细胞及胚胎干细胞。另外,可使用诱导的多能干细胞(iPSC),其也将由患者自身的体细胞产生。因此,这些干细胞或其衍生物(分化的细胞类型或组织)可潜在地移植至任何人中,而不管其起源或组织兼容相容性如何。
所述组合物及方法也可用于体细胞疗法,从而允许产生已经被修饰以增强其生物特性的细胞储备。此类细胞可输注给多个患者中,而与细胞的供体来源及其与受者的组织相容性无关。
除了治疗应用以外,本文所述的DNA编辑复合物也可用于细胞系工程化及构建疾病模型。
实施例
实施例1:文库构建
概述:本文所公开的方法及组合物适用于设计及鉴定可用于多种应用的AAV衣壳,包括特异性递送至组织、细胞或细胞器,及发现能够避开在使用AAV给药的患者中可能存在的抗AAV中和性抗体的AAV衣壳。所述方法描述了将随机序列(文库)插入至AAV衣壳蛋白的表面暴露环和/或高变区之一中,以赋予AAV以新颖和/或改良的属性。所述方法还包括将随机序列插入至许多天然存在的AAV血清型的衣壳蛋白中,产生若干用于筛选的AAV文库。接着将这些AAV变体的文库注射至动物内或用于感染细胞系。为了帮助鉴定能够增强所需组织、细胞或细胞器的转导的AAV变体,AAV变体的基因组可包含用于追踪AAV的递送及转基因表达的荧光报道蛋白。在一些实施方式中,报道蛋白连接条形码,该条形码与插入至衣壳基因中的随机序列在生物信息学上相关。在一些实施方式中,对AAV文库进行体内选择,其中所需组织和/或细胞中的细胞核在暴露于AAV变体文库之后进行分离。然后可通过相关联条形码的测序,或通过从表达报道基因的细胞纯化AAV有效负载核酸并测序来鉴定插入序列。所选AAV核酸序列可随后经分析以确定包含所述插入序列的亲本AAV血清型并确定所插入的氨基酸本身。该方法可重复2轮、3轮或更多轮,其中自第一轮分离的AAV变体经汇集或合成并用于注射第二组动物或另一组细胞,以进一步增强经分离AAV变体的特异性及效能的可信度。
构建:通过将肽插入至衣壳蛋白的暴露环中来构建衣壳文库。在AAV1、2、3B、5、6、8及9的衣壳蛋白中制备包含编码7、10或15个氨基酸肽的插入的文库。AAV衣壳序列各自以合成方式(ATUM)制备。在插入编码所述肽的序列之前,将沉默突变引入至编码邻近于插入位点的衣壳蛋白的区域中。以此方式,相同引物组(例如DO112_MiCap1_VRVIII_Fwd及DO113_MiCap1_VRVIII_Rev)可用于所有文库(参见图1)。另外,通过沉默诱变来消除分子克隆必需的限制酶位点,包括HindIII、AgeI及BsaI。下表1展示了引入突变的区域中的各衣壳基因的野生型序列。突变核苷酸以黑体指示。所得序列可经保守NGS引物对扩增。
类似方法用于设计衣壳基因中的其他可变区或表面暴露环侧翼的保守引物结合位点。合成的完整衣壳基因核苷酸序列包括以下:
表1:VR-VIII插入区域侧翼的引物结合位点的沉默突变位置
Figure BDA0003419732690001071
Figure BDA0003419732690001081
AAV1合成VP1衣壳基因(SEQ ID No:45)
ATGGCTGCCGATGGTTATCTTCCAGATTGGCTCGAGGACAACCTCTCTGAGGGCATTCGCGAGTGGTGGGACTTGAAACCTGGAGCCCCGAAGCCCAAAGCCAACCAGCAAAAGCAGGACGACGGCCGGGGTCTGGTGCTTCCTGGCTACAAGTACCTCGGACCCTTCAACGGACTCGACAAGGGGGAGCCCGTCAACGCGGCGGACGCAGCGGCCCTCGAGCACGACAAGGCCTACGACCAGCAGCTCAAAGCGGGTGACAATCCGTACCTGCGGTATAACCACGCCGACGCCGAGTTTCAGGAGCGTCTGCAAGAAGATACGTCTTTTGGGGGCAACCTCGGGCGAGCAGTCTTCCAGGCCAAGAAGCGGGTTCTCGAACCTCTCGGTCTGGTTGAGGAAGGCGCTAAGACGGCTCCTGGAAAGAAACGTCCGGTAGAGCAGTCGCCACAAGAGCCAGACTCCTCCTCGGGCATCGGCAAGACAGGCCAGCAGCCCGCTAAAAAGAGACTCAATTTTGGTCAGACTGGCGACTCAGAGTCAGTCCCCGATCCACAACCTCTCGGAGAACCTCCAGCAACCCCCGCTGCTGTGGGACCTACTACAATGGCTTCAGGCGGTGGCGCACCAATGGCAGACAATAACGAAGGCGCCGACGGAGTGGGTAATGCCTCAGGAAATTGGCATTGCGATTCCACATGGCTGGGCGACAGAGTCATCACCACCAGCACCCGCACCTGGGCCTTGCCCACCTACAATAACCACCTCTACAAGCAAATCTCCAGTGCTTCAACGGGGGCCAGCAACGACAACCACTACTTCGGCTACAGCACCCCCTGGGGGTATTTTGATTTCAACAGATTCCACTGCCACTTTTCACCACGTGACTGGCAGCGACTCATCAACAACAATTGGGGATTCCGGCCCAAGAGACTCAACTTCAAACTCTTCAACATCCAAGTCAAGGAGGTCACGACGAATGATGGCGTCACAACCATCGCTAATAACCTTACCAGCACGGTTCAAGTCTTCTCGGACTCGGAGTACCAGCTTCCGTACGTCCTCGGCTCTGCGCACCAGGGCTGCCTCCCTCCGTTCCCGGCGGACGTGTTCATGATTCCGCAATACGGCTACCTGACGCTCAACAATGGCAGCCAAGCCGTGGGACGTTCATCCTTTTACTGCCTGGAATATTTCCCTTCTCAGATGCTGAGAACGGGCAACAACTTTACCTTCAGCTACACCTTTGAGGAAGTGCCTTTCCACAGCAGCTACGCGCACAGCCAGAGCCTGGACCGGCTGATGAATCCTCTCATCGACCAGTACCTGTATTACCTGAACAGAACTCAAAATCAGTCCGGAAGTGCCCAAAACAAGGACTTGCTGTTTAGCCGTGGATCTCCAGCTGGCATGTCTGTTCAGCCCAAAAACTGGCTACCTGGACCCTGTTACCGGCAGCAGCGCGTTTCTAAAACAAAAACAGACAACAACAACAGCAATTTTACCTGGACTGGTGCTTCAAAATATAACCTCAATGGGCGTGAATCCATCATCAACCCTGGCACTGCTATGGCCTCACACAAAGACGACGAAGACAAGTTCTTTCCCATGAGCGGTGTCATGATTTTTGGAAAAGAGAGCGCCGGAGCTTCAAACACTGCATTGGACAATGTCATGATTACAGACGAAGAGGAAATTAAAGCCACTAACCCCGTGGCCACCGAAAGATTTGGGACCGTGGCAGTCAATTTCCAGAGCAGCAGCACAGACCCTGCGACCGGAGATGTGCATGCTATGGGAGCATTACCTGGCATGGTGTGGCAAGATAGAGACGTATACCTGCAGGGTCCTATTTGGGCCAAAATTCCTCACACAGATGGACACTTTCACCCGTCTCCTCTTATGGGCGGCTTTGGACTCAAGAACCCGCCTCCTCAGATCCTCATCAAAAACACGCCTGTTCCTGCGAATCCTCCGGCGGAGTTTTCAGCTACAAAGTTTGCTTCATTCATCACCCAATACTCCACAGGACAAGTGAGCGTGGAGATTGAATGGGAGCTGCAGAAAGAAAACAGCAAGCGCTGGAATCCCGAAGTGCAGTACACATCCAATTATGCAAAATCTGCCAACGTTGATTTTACTGTGGACAACAATGGACTTTATACTGAGCCTCGCCCCATTGGCACCCGTTACCTTACCCGTCCCCTGTAA
AAV2合成VP1衣壳基因(SEQ ID No:46)
ATGGCTGCCGATGGTTATCTTCCAGATTGGCTCGAGGACACTCTCTCTGAAGGAATAAGACAGTGGTGGAAGCTCAAACCTGGCCCACCACCACCAAAGCCCGCAGAGCGGCATAAGGACGACAGCAGGGGTCTTGTGCTTCCTGGGTACAAGTACCTCGGACCCTTCAACGGACTCGACAAGGGAGAGCCGGTCAACGAGGCAGACGCCGCGGCCCTCGAGCACGACAAAGCCTACGACCGGCAGCTCGACAGCGGAGACAACCCGTACCTCAAGTACAACCACGCCGACGCGGAGTTTCAGGAGCGCCTTAAAGAAGATACGTCTTTTGGGGGCAACCTCGGACGAGCAGTCTTCCAGGCGAAAAAGAGGGTTCTTGAACCTCTGGGCCTGGTTGAGGAACCTGTTAAGACGGCTCCGGGAAAAAAGAGGCCGGTAGAGCACTCTCCTGTGGAGCCAGACTCCTCCTCGGGAACCGGAAAGGCGGGCCAGCAGCCTGCAAGAAAAAGACTCAATTTTGGTCAGACTGGCGACGCAGACTCAGTACCTGACCCCCAGCCTCTCGGACAGCCACCAGCAGCCCCCTCTGGTCTGGGAACTAATACGATGGCTACAGGCAGTGGCGCACCAATGGCAGACAATAACGAGGGCGCCGACGGAGTGGGTAATTCCTCGGGAAATTGGCATTGCGATTCCACATGGATGGGCGACAGAGTCATCACCACCAGCACCCGAACCTGGGCCCTGCCCACCTACAACAACCACCTCTACAAACAAATTTCCAGCCAATCAGGAGCCTCGAACGACAATCACTACTTTGGCTACAGCACCCCCTGGGGGTATTTTGATTTCAACAGATTCCACTGCCACTTTTCACCACGTGACTGGCAAAGACTCATCAACAACAACTGGGGATTCCGACCCAAGAGACTCAACTTCAAGCTCTTTAACATTCAAGTCAAAGAGGTCACGCAGAATGACGGTACGACGACGATTGCCAATAACCTTACCAGCACGGTTCAGGTGTTTACTGACTCGGAGTACCAGCTCCCGTACGTCCTCGGCTCGGCGCATCAAGGCTGCCTCCCTCCGTTCCCGGCGGACGTCTTCATGGTGCCACAGTATGGATACCTCACCCTGAACAACGGGAGTCAGGCAGTAGGACGCTCTTCATTTTACTGCCTGGAGTACTTTCCTTCTCAGATGCTGCGTACCGGAAACAACTTTACCTTCAGCTACACTTTTGAGGACGTTCCTTTCCACAGCAGCTACGCTCACAGCCAGAGTCTGGACCGTCTCATGAATCCTCTCATCGACCAGTACCTGTATTACCTGAGCAGAACAAACACTCCAAGTGGAACCACCACGCAGTCAAGGCTTCAGTTTTCTCAGGCCGGAGCGAGTGACATTCGGGACCAGTCTAGGAACTGGCTTCCTGGACCCTGTTACCGGCAGCAGCGAGTATCAAAGACATCTGCGGATAACAACAACAGTGAATACTCGTGGACTGGAGCTACCAAGTACCACCTCAATGGCAGAGACTCTCTGGTGAATCCGGGCCCGGCCATGGCAAGCCACAAGGACGATGAAGAAAAGTTTTTTCCTCAGAGCGGGGTTCTCATCTTTGGGAAGCAAGGCTCAGAGAAAACAAATGTGGACATTGAAAAGGTCATGATTACAGACGAAGAGGAAATCAGGACAACTAACCCCGTGGCCACCGAACAGTATGGTTCTGTATCTACCAACCTCCAGAGAGGCAACAGACAAGCAGCTACCGCAGATGTCAACACACAAGGCGTTCTTCCAGGCATGGTCTGGCAGGACAGAGACGTATACCTGCAGGGTCCTATTTGGGCAAAGATTCCACACACGGACGGACATTTTCACCCCTCTCCCCTCATGGGTGGATTCGGACTTAAACACCCTCCTCCACAGATTCTCATCAAGAACACCCCGGTACCTGCGAATCCTTCGACCACCTTCAGTGCGGCAAAGTTTGCTTCCTTCATCACACAGTACTCCACGGGACAGGTCAGCGTGGAGATTGAATGGGAGCTGCAGAAGGAAAACAGCAAACGCTGGAATCCCGAAATTCAGTACACTTCCAACTACAACAAGTCTGTTAATGTGGACTTTACTGTGGACACTAATGGCGTGTATTCAGAGCCTCGCCCCATTGGCACCAGATACCTGACTCGTAATCTGTAA
AAV3B合成VP1衣壳基因(SEQ ID No:47)
ATGGCTGCTGACGGTTATCTTCCAGATTGGCTCGAGGACAACCTTTCTGAAGGCATTCGTGAGTGGTGGGCTCTGAAACCTGGAGTCCCTCAACCCAAAGCGAACCAACAACACCAGGACAACCGTCGGGGTCTTGTGCTTCCGGGTTACAAATACCTCGGACCCGGTAACGGACTCGACAAAGGAGAGCCGGTCAACGAGGCGGACGCGGCAGCCCTCGAACACGACAAAGCCTACGACCAGCAGCTCAAGGCCGGTGACAACCCGTACCTCAAGTACAACCACGCCGACGCCGAGTTTCAGGAGCGTCTTCAAGAAGATACGTCTTTTGGGGGCAACCTTGGCAGAGCAGTCTTCCAGGCCAAAAAGAGGATCCTTGAGCCTCTTGGTCTGGTTGAGGAAGCAGCTAAAACGGCTCCTGGAAAGAAGAGGCCTGTAGATCAGTCTCCTCAGGAACCGGACTCATCATCTGGTGTTGGCAAATCGGGCAAACAGCCTGCCAGAAAAAGACTCAATTTTGGTCAGACTGGCGACTCAGAGTCAGTCCCAGACCCTCAACCTCTCGGAGAACCACCAGCAGCCCCCACAAGTTTGGGATCTAATACAATGGCTTCAGGCGGTGGCGCACCAATGGCAGACAATAACGAGGGTGCCGATGGAGTGGGTAATTCCTCAGGAAATTGGCATTGCGATTCCCAATGGCTGGGCGACAGAGTCATCACCACCAGCACCCGAACCTGGGCCCTGCCCACTTACAACAACCATCTCTACAAGCAAATCTCCAGCCAATCAGGAGCTTCAAACGACAACCACTACTTTGGCTACAGCACCCCCTGGGGGTATTTTGATTTCAACAGATTCCACTGCCACTTCTCACCACGTGACTGGCAGCGACTCATTAACAACAACTGGGGATTCCGGCCCAAGAAACTCAGCTTCAAGCTCTTCAACATCCAAGTTAAAGAGGTCACGCAGAACGATGGCACGACGACTATTGCCAATAACCTTACCAGCACGGTTCAAGTGTTTACGGACTCGGAGTATCAGCTCCCGTACGTGCTCGGGTCGGCGCACCAAGGCTGCCTCCCTCCGTTCCCGGCGGACGTCTTCATGGTCCCTCAGTATGGATACCTCACCCTGAACAACGGAAGTCAAGCGGTGGGACGCTCATCCTTTTACTGCCTGGAGTACTTCCCTTCGCAGATGCTAAGGACTGGAAATAACTTCCAATTCAGCTATACCTTCGAGGATGTACCTTTTCACAGCAGCTACGCTCACAGCCAGAGTTTGGATCGCTTGATGAATCCTCTCATCGACCAGTACCTGTATTACCTGAACAGAACGCAAGGAACAACCTCTGGAACAACCAACCAATCACGGCTGCTTTTTAGCCAGGCTGGGCCTCAGTCTATGTCTTTGCAGGCCAGAAATTGGCTACCTGGACCCTGTTACCGGCAGCAGAGACTTTCAAAGACTGCTAACGACAACAACAACAGTAACTTTCCTTGGACAGCGGCCAGCAAATATCATCTCAATGGCCGCGACTCGCTGGTGAATCCAGGACCAGCTATGGCCAGTCACAAGGACGATGAAGAAAAATTTTTCCCTATGCACGGCAATCTAATATTTGGCAAAGAAGGGACAACGGCAAGTAACGCAGAATTAGATAATGTAATGATTACGGATGAAGAAGAGATTCGTACCACTAACCCCGTGGCCACCGAACAGTATGGAACTGTGGCAAATAACTTGCAGAGCTCAAATACAGCTCCCACGACTAGAACTGTCAATGATCAGGGGGCCTTACCTGGCATGGTGTGGCAAGATCGTGACGTATACCTGCAGGGTCCTATTTGGGCAAAGATTCCTCACACGGATGGACACTTTCATCCTTCTCCTCTGATGGGAGGCTTTGGACTGAAACATCCGCCTCCTCAAATCATGATCAAAAATACTCCGGTACCGGCAAATCCTCCGACGACTTTCAGCCCGGCCAAGTTTGCTTCATTTATCACTCAGTACTCCACTGGACAGGTCAGCGTGGAGATTGAATGGGAGCTGCAGAAAGAAAACAGCAAACGTTGGAATCCAGAGATTCAGTACACTTCCAACTACAACAAGTCTGTTAATGTGGACTTTACTGTAGACACTAATGGTGTTTATAGTGAACCTCGCCCTATTGGAACCCGGTATCTCACACGAAACTTGTGA
AAV5合成VP1衣壳基因(SEQ ID No:48)
ATGTCTTTTGTTGATCACCCTCCAGATTGGTTGGAAGAAGTTGGTGAAGGTCTTCGCGAGTTTTTGGGCCTTGAAGCGGGCCCACCGAAACCAAAACCCAATCAGCAGCATCAAGATCAAGCCCGTGGTCTTGTGCTGCCTGGTTATAACTATCTCGGACCCGGAAACGGACTCGATCGAGGAGAGCCTGTCAACAGGGCAGACGAGGTCGCGCGAGAGCACGACATCTCGTACAACGAGCAGCTTGAGGCGGGAGACAACCCCTACCTCAAGTACAACCACGCGGACGCCGAGTTTCAGGAGAAGCTCGCCGACGACACATCCTTCGGGGGAAACCTCGGAAAGGCAGTCTTTCAGGCCAAGAAAAGGGTTCTCGAACCTTTTGGCCTGGTTGAAGAGGGTGCTAAGACGGCCCCTACCGGAAAGCGGATAGACGACCACTTTCCAAAAAGAAAGAAGGCTCGGACCGAAGAGGACTCCAAGCCTTCCACCTCGTCAGACGCCGAAGCTGGACCCAGCGGATCCCAGCAGCTGCAAATCCCAGCCCAACCAGCCTCAAGTTTGGGAGCTGATACAATGTCTGCGGGAGGTGGCGGCCCATTGGGCGACAATAACCAAGGTGCCGATGGAGTGGGCAATGCCTCGGGAGATTGGCATTGCGATTCCACGTGGATGGGGGACAGAGTCGTCACCAAGTCCACCCGAACCTGGGTGCTGCCCAGCTACAACAACCACCAGTACCGAGAGATCAAAAGCGGCTCCGTCGACGGAAGCAACGCCAACGCCTACTTTGGATACAGCACCCCCTGGGGGTACTTTGACTTTAACCGCTTCCACAGCCACTGGAGCCCCCGAGACTGGCAAAGACTCATCAACAACTACTGGGGCTTCAGACCCCGGTCCCTCAGAGTCAAAATCTTCAACATTCAAGTCAAAGAGGTCACGGTGCAGGACTCCACCACCACCATCGCCAACAACCTCACCTCCACCGTCCAAGTGTTTACGGACGACGACTACCAGCTGCCCTACGTCGTCGGCAACGGGACCGAGGGATGCCTGCCGGCCTTCCCTCCGCAGGTCTTTACGCTGCCGCAGTACGGTTACGCGACGCTGAACCGCGACAACACAGAAAATCCCACCGAGAGGAGCAGCTTCTTCTGCCTAGAGTACTTTCCCAGCAAGATGCTGAGAACGGGCAACAACTTTGAGTTTACCTACAACTTTGAGGAGGTGCCCTTCCACTCCAGCTTCGCTCCCAGTCAGAACCTGTTCAAGCTGGCCAACCCGCTGGTGGACCAGTACTTGTACCGCTTCGTGAGCACAAATAACACTGGCGGAGTCCAGTTCAACAAGAACCTGGCCGGGAGATACGCCAACACCTACAAAAACTGGTTCCCGGGGCCCATGGGCCGAACCCAGGGCTGGAACCTGGGCTCCGGGGTCAACCGCGCCAGTGTCAGCGCCTTCGCCACGACCAATAGGATGGAGCTCGAGGGCGCGAGTTACCAGGTGCCCCCGCAGCCGAACGGCATGACCAACAACCTCCAGGGCAGCAACACCTATGCCCTGGAGAACACTATGATCTTCAACAGCCAGCCGGCGAACCCGGGCACCACCGCCACGTACCTCGAGGGCAACATGCTCATCACCAGCGAGAGCGAGACGCAGCCGGTGAACCGCGTGGCGTACAACGTCGGCGGGCAGATGGCCACCAACAACCAGAGCTCCACCACTGCCCCCGCGACCGGCACGTACAACCTCCAGGAAATCGTGCCCGGCAGCGTGTGGATGGAGAGGGACGTGTACCTCCAAGGACCCATCTGGGCCAAGATCCCAGAGACGGGGGCGCACTTTCACCCCTCTCCGGCCATGGGCGGATTCGGACTCAAACACCCACCGCCCATGATGCTCATCAAGAACACGCCTGTGCCCGGAAATATCACCAGCTTCTCGGACGTGCCCGTCAGCAGCTTCATCACCCAGTACAGCACCGGGCAGGTCACCGTGGAGATGGAGTGGGAGCTCAAGAAGGAAAACTCCAAGAGGTGGAACCCAGAGATCCAGTACACAAACAACTACAACGACCCCCAGTTTGTGGACTTTGCCCCGGACAGCACCGGGGAATACAGAACCACCAGACCTATCGGAACCCGATACCTTACCCGACCCCTTTAA
AAV6合成VP1衣壳基因(SEQ ID No:49)
ATGGCTGCCGATGGTTATCTTCCAGATTGGCTCGAGGACAACCTCTCTGAGGGCATTCGCGAGTGGTGGGACTTGAAACCTGGAGCCCCGAAACCCAAAGCCAACCAGCAAAAGCAGGACGACGGCCGGGGTCTGGTGCTTCCTGGCTACAAGTACCTCGGACCCTTCAACGGACTCGACAAGGGGGAGCCCGTCAACGCGGCGGATGCAGCGGCCCTCGAGCACGACAAGGCCTACGACCAGCAGCTCAAAGCGGGTGACAATCCGTACCTGCGGTATAACCACGCCGACGCCGAGTTTCAGGAGCGTCTGCAAGAAGATACGTCTTTTGGGGGCAACCTCGGGCGAGCAGTCTTCCAGGCCAAGAAGAGGGTTCTCGAACCTTTTGGTCTGGTTGAGGAAGGTGCTAAGACGGCTCCTGGAAAGAAACGTCCGGTAGAGCAGTCGCCACAAGAGCCAGACTCCTCCTCGGGCATTGGCAAGACAGGCCAGCAGCCCGCTAAAAAGAGACTCAATTTTGGTCAGACTGGCGACTCAGAGTCAGTCCCCGACCCACAACCTCTCGGAGAACCTCCAGCAACCCCCGCTGCTGTGGGACCTACTACAATGGCTTCAGGCGGTGGCGCACCAATGGCAGACAATAACGAAGGCGCCGACGGAGTGGGTAATGCCTCAGGAAATTGGCATTGCGATTCCACATGGCTGGGCGACAGAGTCATCACCACCAGCACCCGAACATGGGCCTTGCCCACCTATAACAACCACCTCTACAAGCAAATCTCCAGTGCTTCAACGGGGGCCAGCAACGACAACCACTACTTCGGCTACAGCACCCCCTGGGGGTATTTTGATTTCAACAGATTCCACTGCCATTTCTCACCACGTGACTGGCAGCGACTCATCAACAACAATTGGGGATTCCGGCCCAAGAGACTCAACTTCAAGCTCTTCAACATCCAAGTCAAGGAGGTCACGACGAATGATGGCGTCACGACCATCGCTAATAACCTTACCAGCACGGTTCAAGTCTTCTCGGACTCGGAGTACCAGTTGCCGTACGTCCTCGGCTCTGCGCACCAGGGCTGCCTCCCTCCGTTCCCGGCGGACGTGTTCATGATTCCGCAGTACGGCTACCTAACGCTCAACAATGGCAGCCAGGCAGTGGGACGGTCATCCTTTTACTGCCTGGAATATTTCCCATCGCAGATGCTGAGAACGGGCAATAACTTTACCTTCAGCTACACCTTCGAGGACGTGCCTTTCCACAGCAGCTACGCGCACAGCCAGAGCCTGGACCGGCTGATGAATCCTCTCATCGACCAGTACCTGTATTACCTGAACAGAACTCAGAATCAGTCCGGAAGTGCCCAAAACAAGGACTTGCTGTTTAGCCGGGGCTCTCCAGCTGGCATGTCTGTTCAGCCCAAAAACTGGCTACCTGGACCCTGTTACCGGCAGCAGCGCGTTTCTAAAACAAAAACAGACAACAACAACAGCAACTTTACCTGGACTGGTGCTTCAAAATATAACCTTAATGGGCGTGAATCTATAATCAACCCTGGCACTGCTATGGCCTCACACAAAGACGACAAAGACAAGTTCTTTCCCATGAGCGGTGTCATGATTTTTGGAAAGGAGAGCGCCGGAGCTTCAAACACTGCATTGGACAATGTCATGATCACAGACGAAGAGGAAATCAAAGCCACTAACCCCGTGGCCACCGAAAGATTTGGGACTGTGGCAGTCAATCTCCAGAGCAGCAGCACAGACCCTGCGACCGGAGATGTGCATGTTATGGGAGCCTTACCTGGAATGGTGTGGCAAGACAGAGACGTATACCTGCAGGGTCCTATTTGGGCCAAAATTCCTCACACGGATGGACACTTTCACCCGTCTCCTCTCATGGGCGGCTTTGGACTTAAGCACCCGCCTCCTCAGATCCTCATCAAAAACACGCCTGTTCCTGCGAATCCTCCGGCAGAGTTTTCGGCTACAAAGTTTGCTTCATTCATCACCCAGTATTCCACAGGACAAGTGAGCGTGGAGATTGAATGGGAGCTGCAGAAAGAAAACAGCAAACGCTGGAATCCCGAAGTGCAGTATACATCTAACTATGCAAAATCTGCCAACGTTGATTTCACTGTGGACAACAATGGACTTTATACTGAGCCTCGCCCCATTGGCACCCGTTACCTCACCCGTCCCCTGTAA
AAV8合成VP1衣壳基因(SEQ ID No:50)
ATGGCTGCCGATGGTTATCTTCCAGATTGGCTCGAGGACAACCTCTCTGAGGGCATTCGCGAGTGGTGGGCGCTGAAACCTGGAGCCCCGAAGCCCAAAGCCAACCAGCAAAAGCAGGACGACGGCCGGGGTCTGGTGCTTCCTGGCTACAAGTACCTCGGACCCTTCAACGGACTCGACAAGGGGGAGCCCGTCAACGCGGCGGACGCAGCGGCCCTCGAGCACGACAAGGCCTACGACCAGCAGCTGCAGGCGGGTGACAATCCGTACCTGCGGTATAACCACGCCGACGCCGAGTTTCAGGAGCGTCTGCAAGAAGATACGTCTTTTGGGGGCAACCTCGGGCGAGCAGTCTTCCAGGCCAAGAAGCGGGTTCTCGAACCTCTCGGTCTGGTTGAGGAAGGCGCTAAGACGGCTCCTGGAAAGAAGAGGCCGGTAGAGCCATCACCCCAGCGTTCTCCAGACTCCTCTACGGGCATCGGCAAGAAAGGCCAACAGCCCGCCAGAAAAAGACTCAATTTTGGTCAGACTGGCGACTCAGAGTCAGTTCCAGACCCTCAACCTCTCGGAGAACCTCCAGCAGCGCCCTCTGGTGTGGGACCTAATACAATGGCTGCAGGCGGTGGCGCACCAATGGCAGACAATAACGAAGGCGCCGACGGAGTGGGTAGTTCCTCGGGAAATTGGCATTGCGATTCCACATGGCTGGGCGACAGAGTCATCACCACCAGCACCCGAACCTGGGCCCTGCCCACCTACAACAACCACCTCTACAAGCAAATCTCCAACGGGACATCGGGAGGAGCCACCAACGACAACACCTACTTCGGCTACAGCACCCCCTGGGGGTATTTTGATTTCAACAGATTCCACTGCCACTTTTCACCACGTGACTGGCAGCGACTCATCAACAACAACTGGGGATTCCGGCCCAAGAGACTCAGCTTCAAGCTCTTCAACATCCAGGTCAAGGAGGTCACGCAGAATGAAGGCACCAAGACCATCGCCAATAACCTCACCAGCACCATCCAGGTGTTTACGGACTCGGAGTACCAGCTGCCGTACGTTCTCGGCTCTGCCCACCAGGGCTGCCTCCCTCCGTTCCCGGCGGACGTGTTCATGATTCCCCAGTACGGCTACCTAACACTCAACAACGGTAGTCAGGCCGTGGGACGCTCCTCCTTCTACTGCCTGGAATACTTTCCTTCGCAGATGCTGAGAACCGGCAACAACTTCCAGTTTACTTACACCTTCGAGGACGTGCCTTTCCACAGCAGCTACGCCCACAGCCAGAGCTTGGACCGGCTGATGAATCCTCTCATCGACCAGTACCTGTATTACCTGTCTCGGACTCAAACAACAGGAGGCACGGCAAATACGCAGACTCTGGGCTTCAGCCAAGGTGGGCCTAATACAATGGCCAATCAGGCAAAGAACTGGCTGCCTGGACCCTGTTACCGGCAGCAGCGCGTCTCAACGACAACCGGGCAAAACAACAATAGCAACTTTGCCTGGACTGCTGGGACCAAATACCATCTGAATGGAAGAAATTCATTGGCTAATCCTGGCATCGCTATGGCAACACACAAAGACGACGAGGAGCGTTTTTTTCCCAGTAACGGGATCCTGATTTTTGGCAAACAAAATGCTGCCAGAGACAATGCGGATTACAGCGATGTCATGCTCACCAGCGAGGAAGAAATCAAAACCACTAACCCCGTGGCCACCGAAGAATACGGTATCGTGGCAGATAACTTGCAGCAGCAAAACACGGCTCCTCAAATTGGAACTGTCAACAGCCAGGGGGCCTTACCCGGTATGGTCTGGCAGAACCGGGACGTATACCTGCAGGGTCCTATTTGGGCCAAGATTCCTCACACGGACGGCAACTTCCACCCGTCTCCGCTGATGGGCGGCTTTGGCCTGAAACATCCTCCGCCTCAGATCCTGATCAAGAACACGCCTGTACCTGCGGATCCTCCGACCACCTTCAACCAGTCAAAGCTGAACTCTTTCATCACGCAATACAGCACCGGACAGGTCAGCGTGGAGATTGAATGGGAGCTGCAGAAGGAAAACAGCAAGCGCTGGAACCCCGAGATCCAGTACACCTCCAACTACTACAAATCTACAAGTGTGGACTTTGCTGTTAATACAGAAGGCGTGTACTCTGAACCCCGCCCCATTGGCACCCGTTACCTCACCCGTAATCTGTAA
AAV9合成VP1衣壳基因(SEQ ID No:51)
ATGGCTGCCGATGGTTATCTTCCAGATTGGCTCGAGGACAACCTTAGTGAAGGAATTCGCGAGTGGTGGGCTTTGAAACCTGGAGCCCCTCAACCCAAGGCAAATCAACAACATCAAGACAACGCTCGAGGTCTTGTGCTTCCGGGTTACAAATACCTTGGACCCGGCAACGGACTCGACAAGGGGGAGCCGGTCAACGCAGCAGACGCGGCGGCCCTCGAGCACGACAAGGCCTACGACCAGCAGCTCAAGGCCGGAGACAACCCGTACCTCAAGTACAACCACGCCGACGCCGAGTTCCAGGAGCGGCTCAAAGAAGATACGTCTTTTGGGGGCAACCTCGGGCGAGCAGTCTTCCAGGCCAAAAAGAGGCTTCTTGAACCTCTTGGTCTGGTTGAGGAAGCGGCTAAGACGGCTCCTGGAAAGAAGAGGCCTGTAGAGCAGTCTCCTCAGGAACCGGACTCCTCCGCGGGTATTGGCAAATCGGGTGCACAGCCCGCTAAAAAGAGACTCAATTTTGGTCAGACTGGCGACACAGAGTCAGTCCCAGACCCTCAACCAATCGGAGAACCTCCCGCAGCCCCCTCAGGTGTGGGATCTCTTACAATGGCTTCAGGTGGTGGCGCACCAGTGGCAGACAATAACGAAGGTGCCGATGGAGTGGGTAGTTCCTCGGGAAATTGGCATTGCGATTCCCAATGGCTGGGCGACAGAGTCATCACCACCAGCACCCGAACCTGGGCCCTGCCCACCTACAACAATCACCTCTACAAGCAAATCTCCAACAGCACATCTGGAGGATCTTCAAATGACAACGCCTACTTCGGCTACAGCACCCCCTGGGGGTATTTTGATTTCAACAGATTCCACTGCCATTTCTCACCACGTGACTGGCAGCGACTCATCAACAACAACTGGGGATTCCGGCCTAAGCGACTCAACTTCAAGCTCTTCAACATTCAGGTCAAAGAGGTTACGGACAACAATGGAGTCAAGACCATCGCCAATAACCTTACCAGCACGGTCCAGGTCTTCACGGACTCAGACTATCAGCTCCCGTACGTGCTCGGGTCGGCTCACGAGGGCTGCCTCCCTCCGTTCCCGGCGGACGTTTTCATGATTCCTCAGTACGGGTATCTGACGCTTAATGATGGAAGCCAGGCCGTGGGTCGTTCGTCCTTTTACTGCCTGGAATATTTCCCGTCGCAAATGCTAAGAACGGGTAACAACTTCCAGTTCAGCTACGAGTTTGAGAACGTACCTTTCCATAGCAGCTACGCTCACAGCCAAAGCCTGGACCGACTAATGAATCCACTCATCGACCAGTACCTGTATTACCTGTCAAAGACTATTAACGGTTCTGGACAGAATCAACAAACGCTAAAATTCAGTGTGGCCGGACCCAGCAACATGGCTGTCCAGGGAAGAAACTACATACCTGGACCCTGTTACCGGCAGCAGCGTGTCTCAACCACTGTGACTCAAAACAACAACAGCGAATTTGCTTGGCCTGGAGCTTCTTCTTGGGCTCTCAATGGACGTAATAGCTTGATGAATCCTGGACCTGCTATGGCCAGCCACAAAGAAGGAGAGGACCGTTTCTTTCCTTTGTCTGGATCTTTAATTTTTGGCAAACAAGGAACTGGAAGAGACAACGTGGATGCGGACAAAGTCATGATAACCAACGAAGAAGAAATTAAAACTACTAACCCCGTGGCCACCGAATCCTATGGACAAGTGGCCACAAACCACCAGAGTGCCCAAGCACAGGCGCAGACCGGCTGGGTTCAAAACCAAGGAATACTTCCGGGTATGGTTTGGCAGGACAGAGACGTATACCTGCAGGGTCCTATTTGGGCCAAAATTCCTCACACGGACGGCAACTTTCACCCTTCTCCGCTGATGGGAGGGTTTGGAATGAAGCACCCGCCTCCTCAGATCCTCATCAAAAACACACCTGTACCTGCGGATCCTCCAACGGCCTTCAACAAGGACAAGCTGAACTCTTTCATCACCCAGTATTCTACTGGCCAAGTCAGCGTGGAGATTGAATGGGAGCTGCAGAAGGAAAACAGCAAGCGCTGGAACCCGGAGATCCAGTACACTTCCAACTATTACAAGTCTAATAATGTTGAATTTGCTGTTAATACTGAAGGTGTATATAGTGAACCCCGCCCCATTGGCACCAGATACCTGACTCGTAATCTGTAA
AAV1 VP1衣壳蛋白(SEQ ID No:206)
MAADGYLPDWLEDNLSEGIREWWDLKPGAPKPKANQQKQDDGRGLVLPGYKYLGPFNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLRYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRVLEPLGLVEEGAKTAPGKKRPVEQSPQEPDSSSGIGKTGQQPAKKRLNFGQTGDSESVPDPQPLGEPPATPAAVGPTTMASGGGAPMADNNEGDGVGNASGNWHCDSTWLGDRVITTSTRTWALPTYNNHLYKQISSASTGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTTNDGVTTIANNLTSTVQVFSDSEYQLPYVLGSAHQGCLPPFPADVFMIPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEEVPFHSSYAHSQSLDRLMNPLIDQYLYYLNRTQNQSGSAQNKDLLFSRGSPAGMSVQPKNWLPGPCYRQQRVSKTKTDNNNSNFTWTGASKYNLNGRESIINPGTAMASHKDDEDKFFPMSGVMIFGKESAGASNTALDNVMITDEEEIKATNPVATERFGTVAVNFQSSSTDPATGDVHAMGALPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKNPPPQILIKNTPVPANPPAEFSATKFASFITQYSTGQVSVEIEWELQKENSKRWNPEVQYTSNYAKSANVDFTVDNNGLYTEPRPIGTRYLTRPL
AAV2 VP1衣壳蛋白(SEQ ID No:207)
MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGNRQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL
AAV3B VP1衣壳蛋白(SEQ ID No:208)
MAADGYLPDWLEDNLSEGIREWWALKPGVPQPKANQQHQDNRRGLVLPGYKYLGPGNGLDKGEPVNEADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRILEPLGLVEEAAKTAPGKKRPVDQSPQEPDSSSGVGKSGKQPARKRLNFGQTGDSESVPDPQPLGEPPAAPTSLGSNTMASGGGAPMADNNEGADGVGNSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKKLSFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLNRTQGTTSGTTNQSRLLFSQAGPQSMSLQARNWLPGPCYRQQRLSKTANDNNNSNFPWTAASKYHLNGRDSLVNPGPAMASHKDDEEKFFPMHGNLIFGKEGTTASNAELDNVMITDEEEIRTTNPVATEQYGTVANNLQSSNTAPTTRTVNDQGALPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQIMIKNTPVPANPPTTFSPAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL
AAV5 VP1衣壳蛋白(SEQ ID No:209)
MSFVDHPPDWLEEVGEGLREFLGLEAGPPKPKPNQQHQDQARGLVLPGYNYLGPGNGLDRGEPVNRADEVAREHDISYNEQLEAGDNPYLKYNHADAEFQEKLADDTSFGGNLGKAVFQAKKRVLEPFGLVEEGAKTAPTGKRIDDHFPKRKKARTEEDSKPSTSSDAEAGPSGSQQLQIPAQPASSLGADTMSAGGGGPLGDNNQGADGVGNASGDWHCDSTWMGDRVVTKSTRTWVLPSYNNHQYREIKSGSVDGSNANAYFGYSTPWGYFDFNRFHSHWSPRDWQRLINNYWGFRPRSLRVKIFNIQVKEVTVQDSTTTIANNLTSTVQVFTDDDYQLPYVVGNGTEGCLPAFPPQVFTLPQYGYATLNRDNTENPTERSSFFCLEYFPSKMLRTGNNFEFTYNFEEVPFHSSFAPSQNLFKLANPLVDQYLYRFVSTNNTGGVQFNKNLAGRYANTYKNWFPGPMGRTQGWNLGSGVNRASVSAFATTNRMELEGASYQVPPQPNGMTNNLQGSNTYALENTMIFNSQPANPGTTATYLEGNMLITSESETQPVNRVAYNVGGQMATNNQSSTTAPATGTYNLQEIVPGSVWMERDVYLQGPIWAKIPETGAHFHPSPAMGGFGLKHPPPMMLIKNTPVPGNITSFSDVPVSSFITQYSTGQVTVEMEWELKKENSKRWNPEIQYTNNYNDPQFVDFAPDSTGEYRTTRPIGTRYLTRPL
AAV6 VP1衣壳蛋白(SEQ ID No:210)
MAADGYLPDWLEDNLSEGIREWWDLKPGAPKPKANQQKQDDGRGLVLPGYKYLGPFNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLRYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRVLEPFGLVEEGAKTAPGKKRPVEQSPQEPDSSSGIGKTGQQPAKKRLNFGQTGDSESVPDPQPLGEPPATPAAVGPTTMASGGGAPMADNNEGADGVGNASGNWHCDSTWLGDRVITTSTRTWALPTYNNHLYKQISSASTGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTTNDGVTTIANNLTSTVQVFSDSEYQLPYVLGSAHQGCLPPFPADVFMIPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLNRTQNQSGSAQNKDLLFSRGSPAGMSVQPKNWLPGPCYRQQRVSKTKTDNNNSNFTWTGASKYNLNGRESIINPGTAMASHKDDKDKFFPMSGVMIFGKESAGASNTALDNVMITDEEEIKATNPVATERFGTVAVNLQSSSTDPATGDVHVMGALPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPPAEFSATKFASFITQYSTGQVSVEIEWELQKENSKRWNPEVQYTSNYAKSANVDFTVDNNGLYTEPRPIGTRYLTRPL
AAV8 VP1衣壳蛋白(SEQ ID No:211)
MAADGYLPDWLEDNLSEGIREWWALKPGAPKPKANQQKQDDGRGLVLPGYKYLGPFNGLDKGEPVNAADAAALEHDKAYDQQLQAGDNPYLRYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRVLEPLGLVEEGAKTAPGKKRPVEPSPQRSPDSSTGIGKKGQQPARKRLNFGQTGDSESVPDPQPLGEPPAAPSGVGPNTMAAGGGAPMADNNEGADGVGSSSGNWHCDSTWLGDRVITTSTRTWALPTYNNHLYKQISNGTSGGATNDNTYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLSFKLFNIQVKEVTQNEGTKTIANNLTSTIQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMIPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFQFTYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTQTTGGTANTQTLGFSQGGPNTMANQAKNWLPGPCYRQQRVSTTTGQNNNSNFAWTAGTKYHLNGRNSLANPGIAMATHKDDEERFFPSNGILIFGKQNAARDNADYSDVMLTSEEEIKTTNPVATEEYGIVADNLQQQNTAPQIGTVNSQGALPGMVWQNRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGLKHPPPQILIKNTPVPADPPTTFNQSKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSTSVDFAVNTEGVYSEPRPIGTRYLTRNL
AAV9 VP1衣壳蛋白(SEQ ID No:212)
MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRLLEPLGLVEEAAKTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLSKTINGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHQSAQAQAQTGWVQNQGILPGMVWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL
NGS引物的例示性选择描绘于下表中,其中可变区以引物名称指示。
表2:用于下一代测序分析的引物
Figure BDA0003419732690001251
Gibson组装被用于产生衣壳文库,其中引入的肽由用于扩增右侧片段的引物编码(参见图2)。扩增来自衣壳基因序列(“Cap”)的两个PCR产物增(左侧及右侧片段),它们具有重叠的区域,能够促进使用Gibson组装程序组装为质粒骨架(参见例如Gibson等人(2009)Nat Meth 6(5):343-345)。具体而言,用于右侧片段的引物(“RF Fwd”)包含随机核苷酸序列,其编码成为引物的一部分的插入肽。此引物也包含编码重叠区域的序列,因此右侧片段扩增产物将与扩增的左侧片段重叠。最后,RF Fwd引物包含与编码衣壳的序列的右侧片段具有同源性的同源性区域。
各AAV血清型的肽插入位置不同(编号开始于VP1起始密码子)。下表2展示衣壳蛋白内发生肽插入的氨基酸位置。应注意,在AAV6衣壳中构建了两个文库,其中将片段插入至位置454或590处。还应注意,构建了基于AAV9衣壳的三个文库,其中片段被插入至位置266、455或589处。
表3:肽的插入位点
血清型 插入位点(aa位置)
AAV1 590
AAV2 588
AAV3B 589
AAV5 578
AAV6 454
AAV6 590
AAV8 591
AAV9 266
AAV9 455
AAV9 589
将Gibson组装反应物转化到电感受态大肠杆菌内,并纯化所得的质粒文库。在低转染复数下将所述质粒DNA文库转染至HEK293细胞中,以保留衣壳基因型与表型之间的关联。
接着制造文库以产生病毒衣壳文库用于测试。野生型AAV包含编码“Rep”蛋白Rep78、Rep68、Rep52及Rep40的基因序列,这些Rep蛋白是病毒核酸复制及在腺病毒辅助功能存在下将病毒核酸包装成病毒颗粒所必需的。本文所述的AAV文库不含与病毒ITR及“Cap”呈顺式的“Rep”,因此,为了实现将文库有效包装至病毒衣壳中,在病毒制造期间以反式提供复制基因(“rep”)及腺病毒辅助功能(例如E2A、E4、VA、E1A及E1B)。举例而言,构建在病毒制造期间以反式提供Rep的辅助质粒。使用以下引物从标准AAV辅助质粒扩增Rep基因(NC_001401,核苷酸191-2252):
表4:用于扩增Rep基因的引物
Figure BDA0003419732690001271
这些引物分别添加XbaI及SphI位点并扩增整个Rep基因。然后扩增的Rep片段通过限制性消化及连接到pUC19的多个克隆位点内的XbaI及SphI位点进行克隆,产生pRepInTrans。使用以下引物通过定点诱变引入额外修饰,以将VP1 ACG起始密码子转化为ATG,从而产生pRepInTrans-ATG。
表5:用于Rep基因修饰的引物
Figure BDA0003419732690001272
引入ACG至ATG的修饰以经由较大Rep78/68表现来增加衣壳构建体的复制,并因此提高AAV文库制造产率。移除Rep使得AAV为复制缺陷型,这是在常常带有AAV辅助病毒包括单纯疱疹病毒的非人类灵长类动物中进行选择的一个重要特征(参见Morton等人(2008)ILAR J 49(2):137-44)。另外,移除Rep优于简单的基因敲除,该基因敲除使得仍有可能与以反式提供的Rep质粒重组,由此可能重组有复制能力AAV。
AAV文库接着通过瞬时转染包装于HEK293生产系统中,并使用氯化铯密度梯度超速离心纯化(关于例示性过程,参见Xiao及Samulski(1998)J Virol 40:241-247)。
此技术的目标是开发可用于所有物种、组织、细胞类型及组织加工条件的方法。因此,AAV被设计成携带上文所述的衣壳文库以及某些类型的鉴定标记,所述鉴定标记将单一AAV中的变体衣壳基因的序列与AAV携带的独特的条形码标识符相关联,从而后续对条形码的独立测序将能够鉴定连接的衣壳突变。另外,单一AAV也将携有某些类型的报道基因,使得可监测及选择将AAV颗粒成功递送至其预期目标(例如器官(例如肝脏或CNS),及器官内的特定细胞类型(例如肝细胞或神经元))。
另外,在本实施例中,报道基因包括定位信号,从而细胞一旦被变体AAV衣壳转导,报道子就被定位在细胞核。首先,在EGFP或mCherry的N末端处引入SV40大T-抗原(PKKKRKV,SEQ ID NO:64)。第二种方法使用与EGFP或mCherry的C末端融合的KASH结构域。KASH结构域将蛋白质定位在核包膜,实际上将报道子系栓至细胞核且防止扩散出核孔复合物。第三种方法将组蛋白H2B基因融合至EGFP、mClover3或mRuby3报道子的C末端(参见图3A及B)。选择用于驱动荧光报道子表达的hSyn1(突触蛋白)启动子,其对神经元中的表达具有特异性。其他启动子可用于其他被靶向组织或细胞,包括肝脏特异性甲状腺素转运蛋白启动子。基本概念为使包含变体AAV衣壳的序列在靶组织、细胞或细胞器中与报道子物理性连接。以此方式,一旦被AAV颗粒成功转导后,靶组织、细胞或细胞器便可使用荧光蛋白分离,从而使用者可接着确定何种衣壳变体允许AAV颗粒转导至靶组织、细胞或细胞器中。
在一些实例中,将条形码插入至包含变体衣壳蛋白的各AAV基因组中,以使得使用者在文库已经过体内选择后通过条形码的独立测序分析来鉴定衣壳蛋白中的突变(参见下文)。潜在概念为使包含变体AAV衣壳的序列物理性地与报道子在靶组织、细胞或细胞器中连接。以此方式,靶组织、细胞或细胞器可以在经AAV颗粒成功转导后通过使用荧光蛋白分离,从而使用者可接着确定何种衣壳变体允许将AAV颗粒转导至目标组织、细胞或细胞器中。在一些实例中,各肽编码序列由全部编码相同肽的多个不同核酸序列合成。各核酸序列连接独特条形码,以使得可在两种或更多种变体经鉴定具有相同肽序列、但变体包含不同的编码该肽的核酸序列时能够验证该肽变体的效能(例如富集)。
对于通过DNA合成及后续分子克隆步骤产生的文库,以计算方式设计所有条形码及肽编码序列。重要的是,省去包含将用于后续克隆的限制酶识别位点的序列。序列被设计成具有40-60%GC含量,没有长度大于3的均聚物,且序列之间的类似性(编辑距离)极小。
为了以生物信息学方式将各条形码与各突变衣壳序列连接,进行两种方法。
方法1采用
Figure BDA0003419732690001291
测序。首先,将条形码插入至表达构建体中,如图4A及B中所概述。为了插入条形码序列,将5'Gibson组装区域#1合成为与衣壳基因中的可变区连接的DNA片段,该DNA片段继而与3'Gibson组装区域#2连接(参见图4A,步骤1)。因此,合成序列包含可变条形码区域及可变衣壳序列。其亦包含条形码序列与可变序列之间的两个限制性核酸酶位点。II型限制位点BsaI用于促进最终构建体的无痕组装。进行独立PCR程序,其中扩增衣壳基因的3'序列(步骤2)。随后,通过Gibson组装产生中间AAV构建体,该构建体按5'至3'次序包含5'ITR、SV40 poly A信号、条形码、两个限制性核酸内切酶位点、变体衣壳序列、衣壳蛋白的3'区域、用于衣壳表达构建体的polyA序列及3'ITR(步骤3)。在替代方法(图4C)中,修改步骤1-3。在步骤1中,合成两个DNA片段。片段A包含Gibson组装区域#1、BsaI位点、可变衣壳区域及与用作PCR引物的衣壳基因同源的区域。片段B包含Gibson组装区域#2、随机条形码、BsaI位点及Gibson组装区域#1。随后,进行PCR程序,其中使用步骤1中合成的片段A作为PCR引物来扩增衣壳基因的3'序列。随后,通过Gibson组装产生中间AAV构建体,其中构建体按5'至3'次序包含5'ITR、SV40 poly A信号、条形码、两个限制性核酸内切酶位点、变体衣壳序列、衣壳蛋白的3'区域、用于衣壳表达构建体的polyA序列及3'ITR(步骤3)。对于图4A/B及4C/D中所述的两种方法,步骤4-7是等同的。进行配对末端
Figure BDA0003419732690001301
测序以沿两个方向跨越条形码及变体衣壳序列(步骤4)。产生的序列因此将具体条形码序列与衣壳基因中的具体变体序列连接。步骤4的
Figure BDA0003419732690001302
测序指示在合成期间指定的条形码与变体序列之间99.6%正确匹配。步骤5包含用BsaI限制酶进行消化。步骤6为PCR扩增步骤,其中制备了H2B、EGFP、细胞类型特异性启动子(例如hSyn1)、p40启动子及衣壳基因的5'端。或者,H2B、EGFP、细胞类型特异性启动子(例如hSyn1)、p40启动子及衣壳基因的5'端可在分开的供体质粒中制备,用BsaI消化,并经凝胶纯化。步骤7为组装最终构建体的无痕golden gate克隆步骤。最终文库样品的Sanger测序表明88个个体克隆全部显示条形码与变体衣壳序列之间的正确的指定连接。
方法2采用
Figure BDA0003419732690001303
及OXFORD
Figure BDA0003419732690001304
测序两者。首先,经由图2中所示的方法组装AAV衣壳文库,其中使用引物将可变序列添加至衣壳基因中。随后,将衣壳基因文库克隆至包含报道基因及随机条形码序列的载体中(参见图5)。为了将各随机条形码序列与各变体衣壳序列连接,进行两种类型的测序分析。标准
Figure BDA0003419732690001305
测序对于短核酸段(大约300bp)高度精确,而OXFORD
Figure BDA0003419732690001306
测序可得到长得多的序列读段。然而,OXFORD
Figure BDA0003419732690001307
测序具有大约12%的错误率并且会在读取序列中产生插入缺失,因此其本身不适合用于此目的。因此,首先进行两组
Figure BDA0003419732690001308
测序反应:一组测序条形码区域,一组测序可变衣壳序列。之后,完成OXFORD
Figure BDA0003419732690001309
测序反应以提供跨越整个AAV病毒基因组的长读取长度。尽管精确性比不上
Figure BDA00034197326900013010
测序,但Nanopore测序提供长读取长度数据,其准许将已知的条形码序列与已知的变体衣壳序列相匹配。
此两种方法的结果均为使各条形码与各变体衣壳序列产生匹配的“查找”表。一旦从靶细胞、组织或细胞器分离出AAV,便仅对核酸条形码测序,因为通过使用查找表,便可知晓变体衣壳的序列。
在原代小鼠皮质神经元(Gibco)中体外测试文库。文库为各血清型的所有AAV变体的混合物。细胞用AAV变体在每个细胞3×103、1×104、3×104、1×105及3×105个载体基因组的剂量范围内处理,并如下所述地分离EGFP阳性细胞核。分开来说,自感染的神经元分离总RNA,并遵循标准方案用于逆转录为cDNA,其中使用对AAV mRNA转录物具有特异性的引物DO441_AAVSpecific_RT:5'GGTTACAAATAAAGCAATAGCATCAC(SEQ ID NO:65)。所得cDNA条形码接着通过
Figure BDA0003419732690001311
测序,用NGS引物DO439_RNABarcode_Fwd:5'ACACGACGCTCTTCCGATCTNNNNGCATCACAAATTTCACAAATAAAGC(SEQ ID NO:66)及DO440_RNABarcode_Rev:5'GACGTGTGCTCTTCCGATCTNNNNGCCGTGTCCGAGGGTACTAAG(SEQ ID NO:67)进行测序,以定量变体的效能。回收的AAV变体样品的结果展示于图6中,其中log2倍数变化表示自转导细胞分离的变体相比于其于施用文库中的频率的富集。图6的X轴表示变体效能跨越样品拷贝的相对变化性。从中可以看出,变体效能通常基于亲本血清型而簇集,其中包含插入至AAV1中的肽的变体为最富集及变化最小的。图7A展示单独绘制的AAV1血清型变体,也指示了野生型AAV1血清型(衣壳序列中无插入氨基酸)的效能。从中可以看出,相比于野生型AAV1血清型,有大量变体显示增加的富集。类似地,图7B展示单独绘制的基于肽插入至AAV2中的变体,指示野生型AAV2的相对效能。所述方法产生相比于野生型序列而言展示转基因表达富集的AAV2变体。也进行了比较以查看鉴定经富集的AAV变体的不同方法是否产生类似结果。图8展示基于RNA分离、cDNA合成及条形码定量评估的变体效能与通过分离EGFP阳性细胞核及可变衣壳区域测序评估的效能类似。另外,在Neuro2A细胞(ATCC CCL-131)及衍生自人类诱导多能干细胞(NCR-100-010-001,Cellular Dynamics International)的iCell神经元中评估文库效能。个体变体效能在呈现不同选择压力的细胞系之间不同。本文所述的评估变体效能的方法为始终适用及成功的。变体为如下:
表6评估的AAV变体
AAV变体 SEQ ID NO
KSPHPSV(AAV1) SEQ ID NO:199
IKSNLTY(AAV1) SEQ ID NO:200
STSPHAPSKE(AAV2) SEQ ID NO:201
HATPQFDPSQ(AAV6) SEQ ID NO:202
SALGLQAKAY(AAV9) SEQ ID NO:203
实施例2:在小鼠中体内选择变体AAV文库
构建这些AAV文库的目标为鉴定将允许递送AAV至任何物种的任何组织、细胞或细胞器的AAV衣壳变体。
CNS递送。此技术的一种潜在用途为将基因组编辑、转基因及基因表达调节剂递送至特定细胞类型。因此,对于此具体应用而言重要的是鉴定不仅将靶向特定组织内的特定细胞,也能行进至细胞内的细胞核并介导转基因表达的AAV变体。另外,相比于从组织分离特定全细胞体,从组织分离细胞核更为直截了当。细胞核在组织之间具有均一形态,易于针对DNA含量进行染色,以促进FACS分析(例如DAPI或Hoescht染料)。举例而言,神经元具有极伸长的细胞体,并且难以自脑组织中完整分离。另外,大脑内的一些组分,诸如脂褐质及髓鞘碱性蛋白可为自体荧光的,与依赖于报道基因的荧光信号的分析混淆(参见例如Hainsworth等人(2017)Neuropathol Appl Neurobiol 44(4):417-426)。因此,如图3A及图3B中所示,采用不同方法将AAV基因组中的报道基因定位至细胞核,包括将其融合核定位序列(SV40 NLS)、核包膜结合蛋白域(KASH)及组蛋白结合域(H2B)以掺入至核染色质中。
制备构建体以测试向HEK293细胞中的递送。将仅包含报道子而无核定位序列(EGFP及mCherry)的构建体与其中报道子已与SV40 NLS或KASH结构域融合的构建体进行比较(参见图9)。所有构建体均在细胞中展示荧光,同时NLS标记的构建体展示细胞核内的定位且连接KASH的构建体显示报道子结合至核包膜。然而,在自HEK293转导的细胞分离细胞核后,只有连接KASH的构建体显示信号的保留。细胞核分离之后的信号损失很可能是因为相对于非系栓构建体中的核孔截断值(60kDa)而言报道蛋白的尺寸较小(27kDa)。在不存在活细胞的情况下,用于报道子的核输入的主动转运机制丧失,报道子可扩散出细胞核。通过将报道子融合至H2B结构域进行进一步测试,也观测到在分离的细胞核中信号的稳定保留。所有H2B构建体高效驱动报道子掺入至核染色质中,该核染色质在细胞核分离及细胞及组织的冷冻/解冻处理之后均保持稳定。
基本上如Krishnaswami等人的方案(描述于Kelder等人(2016)Nat Protoc 11(3):499中)中所述地从经培养的细胞及组织分离细胞核。简言的,用无菌剃刀片切下2-3mm3的组织切片。若使用经培养的细胞,则收集细胞且以每毫升大约1×106个细胞再悬浮于冷PBS中。使用杜恩斯匀浆机(dounce homogenizer)在包含蔗糖、MgCl2、KCL及NuPAGE样品还原剂(Thermo)的Tris缓冲液中对组织或细胞进行匀浆。还包括0.1%Triton及Hoescht33352(Molecular Probes)。接着使用40或70微米Flowmi细胞过滤器(Flowmi)过滤匀浆物,以移除剩余组织片段或细胞核的高阶聚集体。
在C57BL/6J小鼠中评估包含处于神经元特异性hSynapsin1启动子控制下的EGFP-H2B、mClover3-H2B、mRuby3-H2B及EGFP-KASH的AAV衣壳文库构建体。AAV衣壳文库是通过标准技术制造的,并通过尾静脉静脉内注射以2×1011个载体基因组/只小鼠(n=3只/组)的剂量施用。在施用测试物品之后两周将小鼠处死,将大脑左半球保存于4%低聚甲醛中,用于针对所表达的报道子的免疫组织化学研究,以通过本领域中已知的技术来确认核定位。将右半球速冻,用于经转导的神经元细胞核的FACS分选。来自免疫组织化学研究的影像验证了各构建体在组织中的核定位(参见图10A及10B),尽管对于mRuby3构建体,使用了核定位的mRuby3天然荧光的直接可视化。
如上文所述从冷冻的中枢神经系统小鼠组织分离细胞核,在细胞核分离期间用Hoescht染料染色,并通过使用Sony SH800细胞分选仪根据制造商的说明针对EGFP、mClover3、mRuby3或EGFP-KASH信号进行分选。对于FACS分选,在样品压力5下以半纯度模式使用70微米芯片。FACS图门控于单峰,以防止分选附着的细胞核的二重峰、三重峰或更高阶分组。将样品分选至包含蔗糖及MgCl2的Tris缓冲液,pH 7.5中。
使用Roche High Pure Viral核酸试剂盒,根据制造商的方案从分选的细胞分离DNA。
FACS图(图11)表明EGFP阳性细胞核可从注射了包含EGFP-H2B构建体的文库的小鼠的中枢神经组织分离。另外,可在用mClover3构建体治疗的小鼠的丘脑中及用EGFP-KASH文库治疗的小鼠的皮质中检测到信号(图12及13)。重要的是,当向小鼠注射EGFP-H2B文库(其中EGFP-H2B系由神经元特异性hSynapsin启动子驱动)时,不能在肝脏或心脏组织中检测到高于背景的报道子信号,参见图14。
实施例3:非人类灵长类动物中的体内选择
肝递送:本文所述的方法及组合物也用于从文库鉴定靶向肝的AAV变体。在这些实验中,使用肝特异性启动子甲状腺素转运蛋白(TTR)表达报道基因。因此修饰文库构建体以包含TTR启动子替代hSynapsin启动子。首先在细胞中体外测试文库,在其中可见剂量反应。以一定范围的感染复数(MOI)用AAV文库转导HepG2细胞(ATCC HB-8065),然后如上地分选细胞核以测量来自报道基因的荧光。结果(参见图15A-C)展现剂量反应,其概述于下表7中:
表7:HepG2细胞中的剂量反应
Figure BDA0003419732690001341
Figure BDA0003419732690001351
也在非人类的灵长类动物肝细胞(BioIVT)中进行剂量反应实验,其中也观测到剂量反应(参见下表8)。
表8:NHP肝细胞中的剂量反应
MOI EGFP阳性%
模拟物 0.6
3e3 1.3
3e4 3.8
3e5 12.4
以类似方式,在原代人类肝细胞(Corning)中测量剂量反应,数据展示于下表9中。
表9:原代人类肝细胞中的剂量反应
MOI EGFP阳性%
模拟物 0.4
5e4 6.7
1e5 20.0
2e5 35.4
4e5 47.3
8e5 50.2
也使用文库在C57BL/6J小鼠中评估文库变体效能,其中报道基因由TTR启动子驱动。通过标准技术生产AAV衣壳文库,并通过尾静脉静脉内注射以2E11个载体基因组/只小鼠(n=3只雄性及n=3只雌性)的剂量施用。在施用测试物品之后两周,处死小鼠且移除肝脏以评估表达的EGFP转基因的靶向。
也在非人类的灵长类动物(食蟹猕猴)中进行选择,以分离将对于人类肝脏转导具有最大相关性的AAV变体。
在第1轮选择中,以5E12个载体基因组/公斤的剂量注射包含来自所有不同血清型的AAV变体的文库汇集物。在此第一轮中,将数百万个独特变体注射至一只雄性及一只雌性NHP中。15天后,处死这些NHP并分析肝脏。生成从NHP肝脏回收的成功AAV变体汇集物并测序。所述AAV变体接着用于生成包含大约500,000个独特变体的单一文库。接着将它们以1.6E13个载体基因组/公斤的剂量静脉内注射至新NHP对中。28天后,将NHP处死并分析其肝脏。分析的终点为与所施用的文库配方相比,个体AAV变体在肝组织中富集;表达AAV变体编码的EGFP的肝细胞核中的富集;及mRNA条形码测序以确定AAV衣壳变体的富集。
如上文所述从肝脏分离细胞核,并通过FACS分选EGFP阳性肝细胞核。结果(图16,图A)显示EGFP信号可以很容易地以高于背景的水平检测到。从各NHP的各个体肝叶的三个样品分离的EGFP阳性细胞核的数目展示于下表10中。另外,进行EGFP的免疫组织化学检测(图16,图B),以证实报道基因的核定位。
表10:从雄性及雌性NHP肝组织分离的AAV变体的数目。
Figure BDA0003419732690001361
Figure BDA0003419732690001371
有趣的是,在施加独特选择压力之后分离的前2500个AAV变体的比较表明以最大程度富集的AAV变体的亲本血清型有显著差异(图17A及B)。HepG2及原代人类肝细胞经体外评估,而小鼠及NHP经体内评估。这些显著物种特异性差异支持更接近人类的动物模型,例如NHP中的AAV选择。
基于大约100种AAV变体在NHP mRNA、NHP EGFP阳性肝细胞核及NHP肝总基因组DNA中的一致富集倍数,选择其用于深入分析。排除的变体包括在HEK293 AAV生产中具有低产率及在通过纳米孔测序对条形码作图的置信度低的变体。也进行聚类分析,以选择响应于选择压力包含独特物理化学特性(例如重复性氨基酸基元或强疏水性)的AAV变体。
来自此初始分析的前32个序列展示于图18及表11中。该分析展示亲本血清型以及在非人类的灵长类动物中选择之后观测到的肝脏中的倍数富集。也显示了插入至衣壳环中的肽的序列。重要的是,追踪在HEK293 AAV生产系统中产生各AAV变体的能力,以保证可有效地产生通过本文所述的方法鉴定的任何AAV。因此,在一些实施方式中,插入肽序列及AAV亲本血清型可为表11中所示的那些中任一种。
表11
Figure BDA0003419732690001372
Figure BDA0003419732690001381
CNS递送:进行额外实验以使用本文所述的方法鉴定对CNS的转导改善的AAV变体。对于这些实验,hSynapsin启动子(hSyn1)用于表达报道基因及mRNA条形码。在非人类的灵长类动物(食蟹猕猴)中进行选择,以分离将对于人类CNS转导具有最大相关性的AAV变体。
在非人类的灵长类动物第1轮选择中,包含基于血清型AAV1、AAV2、AAV3B、AAV6、AAV8及AAV9的AAV变体的文库汇集物通过腰椎鞘内穿刺以1E13个载体基因组的总剂量注射。在此第一轮中,将数百万个独特变体注射至一只雄性及一只雌性NHP中。15天后,处死所述NHP并分析CNS组织以评估AAV变体效能。
使用上文所述的方法1合成在第1轮CNS非人类的灵长类动物选择中具有高倍数富集的AAV变体亚组,以产生用于第2轮选择的文库。第2轮文库的总大小为10,818个变体。各AAV变体使用编码相同肽的三种不同核苷酸序列合成。各核苷酸序列连接由hSyn1启动子驱动的独特mRNA条形码,以对神经元中的转基因表达排序。包括三个重复序列使得能够提高评估变体效能方面的置信度,因为三个序列中的每一者可在生物信息学分析期间独立处理。
首先如实施例1中所述在Neuro2A细胞(ATCC CCL-131)(图19)、原代小鼠皮质神经元(Gibco)(图20)及衍生自人类诱导多能干细胞的iCell人类神经元(NCR-100-010-001,Cellular Dynamics International)(图21)中体外评估预进行第2轮选择以靶向CNS而制备的文库。
随后通过以每只小鼠1.59E11个载体基因组的剂量单侧脑室内注射10微升体积而在C57BL/6J小鼠中评估第2轮文库(n=3只雄性及n=3只雌性)。在施用测试物品之后28天处死小鼠,取出CNS组织以评估文库效能(图22)。在经注射的半球对侧的脑区上完成分析,以避免同与注射道相关的转导混淆。
最后,将第2轮文库以每只动物4.37E13 vg的剂量鞘内施用至两只雄性及一只雌性食蟹猕猴。28天后,处死所述NHP且分析CNS组织。大脑以3mm冠状切片厚度进行切片。各切片沿中矢面切成对半。自大脑左半球切片获得冲压样品(3mm),用于分析载体基因组DNA。将右半球置于RNAlater中并冷冻大约24小时以保持RNA完整性。在储存之后,对各个脑区取样,收集3mm冲出物。将脊髓分成颈段、胸段及腰段以用于分析。
通过分析载体基因组DNA频率(图23-25)以及通过定量从特异性表达于神经元中的文库mRNA转录物逆转录的cDNA(图26-28)来评估文库AAV变体效能。这两个数据组分别被称为DNA分析及RNA分析。非人类的灵长类动物CNS组织的下一代测序分析鉴定了展现优于亲本野生型血清型的转导的高效能AAV变体。基于它们在不同量度上的效能,包括在DNA及RNA分析两者中的富集,选择这些高效能变体的亚组用于进一步评估。此亚组的变体效能的概述展示于图29A-29D中。分析展示了亲本血清型以及在非人类的灵长类动物中选择之后观测到的组织中的倍数富集。也显示了插入至衣壳环中的肽的肽序列。将变体编号为1-43(SEQ ID NO.:68-110,参见表12),此编号用于在图19至28的气泡图中以注释其相对于文库的其余部分的效能。在一些实施方式中,插入肽及AAV亲本血清型可以是表12中所示的任何一种。
表12
Figure BDA0003419732690001401
Figure BDA0003419732690001411
实施例4:评估文库筛选中鉴定的表现最佳的AAV变体
在非人类的灵长类动物中两轮选择之后,在肝脏及CNS组织中鉴定高度富集变体的亚组(分别为图18及29)。不直接继续进行仅一或两种变体的个体评估,而是产生带条形码的表达盒,以使得能够进行肝脏及CNS中的许多表现最佳的变体的面对面直接比较。在此方法中,确定地知晓连接至各AAV的条形码,因为在汇集之前分开制造及滴定各AAV变体。通过含有驱动EGFP-H2B转基因表达的细胞类型特异性RNA聚合酶II启动子(例如甲状腺素转运蛋白或hSynapsin1)及独特条形码核苷酸序列的载体基因组(图30)生成各AAV。还包括第二RNA聚合酶III启动子(例如hU6),以独立评估载体效能。hU6启动子广泛表达于所有细胞类型中,因此能够评估所有细胞及组织类型中的表达。此外,hU6转录物局限于细胞核,其为单细胞核测序方法的优势。以计算方式设计表13中所列的所有条形码,以将转录偏差的可能降至最低。
表13:用于经汇集的AAV变体评估的独特条形码
Figure BDA0003419732690001412
Figure BDA0003419732690001421
Figure BDA0003419732690001431
应用此表达盒以评估从文库筛选鉴定的一亚组高效能CNS向性AAV变体(列于图29A-D中)的实例展示于图31中。除了此研究中开发的工程化血清型以外,还包括若干对照血清型:AAV9、PHP.B及AAV2_HSPGKO。本领域中已经广泛评估了AAV9的CNS转导特性,包括在人类临床试验中(Lowes等人Pediatr Neurol.2019;98:39-45),因此其为效能的主要基准。PHP.B为先前显示在C57BL/6J小鼠中展现高效力的工程化AAV9血清型(Deverman等人NatBiotechnol.2016;34(2):204-9),这些特性并不扩展至非人类的灵长类动物(Hordeaux等人Mol Ther.2018年3月;26(3):664-668)。AAV2_HSPGKO为AAV2的变体,其具有两个突变(R585A及R588A),消除了与硫酸乙酰肝素蛋白聚糖(HSPG)的结合(Opie等人Virol.2003年6月;77(12):6995-7006)。先前也已经在非人类的灵长类动物中评估了此血清型(Naidoo等人Mol Ther.2018年10月3日;26(10):2418-2430)。在此实验中,在Neuro2A细胞、原代小鼠皮质神经元及衍生自人类诱导多能干细胞的iCell人类神经元中体外评估带条形码的AAV变体。在HEK293T细胞中产生病毒,使用CsCl密度梯度纯化,并通过实时qPCR根据本领域中已知的方法滴定。然后每个单独生产的带条形码的病毒混合在一起,以形成用于下游评估的单一汇集物(pool),该汇集物中各变体的频率系通过下一代测序(NGS)来评估。图30中所述的载体基因组盒用于汇集评估,以使得能够自hSyn1 Pol II启动子及hU6 Pol III启动子定量独特的带条形码的转录物。带条形码的病毒汇集物用于以每个细胞3×105、1×105、3×104、1×104、3×103及1×103个载体基因组拷贝感染细胞。在72小时(Neuro2A)、48小时(原代小鼠皮质神经元)或96小时(hiPSC衍生的人类神经元)之后,提取总RNA并使用分别靶向hSyn1及hU6转录物的基因特异性引物逆转录AAV转录物。接着应用下一代测序来定量衍生自各AAV变体的NGS读段的百分比。这些百分比通过用于感染的汇集物中各AAV变体的频率来标准化。结果展示了效能分布,其中基于AAV1及AAV2的若干AAV变体在所有三种细胞类型中都展现高效能。一般而言,基于AAV3B的AAV变体的效能较低。相同细胞类型中获得的第2轮文库数据成功地预测了所观察的变体效能的趋势(图19、20、21)。另外,这些数据展示双重pol II hSyn1及pol III hU6条形码量测方法的成功应用。在例如Neuro2A的均质细胞系中,hSyn1与hU6测量值之间的一致性高。在原代小鼠皮质神经元及hiPSC源性神经元中,神经元亚型的异质性较大,使得两个测量值的差异较大。然而,总体上这两个测量值仍相关。
实施例5:针对非神经元细胞的转导体外评估CNS向性变体
针对非神经元细胞类型的转导在体外评估相同亚组的CNS向性AAV变体及对照(图32)。在此实验中,针对衍生自人类诱导多能干细胞的iCell人星形胶质细胞及衍生自人类诱导多能干细胞的iCell人内皮细胞的转导评估带条形码的AAV变体。上文实施例4中所述的相同AAV带条形码的汇集物测试物品及方法与以下规格一起使用。对于hiPSC衍生的星形胶质细胞中的评估,每个细胞3×105、1×105、3×104、1×104、3×103及1×103个载体基因组拷贝用于感染。对于hiPSC衍生的内皮细胞中的评估,每个细胞3×105、1×105及3×104个载体基因组拷贝用于感染。星形胶质细胞及内皮细胞均在感染后72小时收集。提取总RNA并使用靶向hU6转录物的基因特异性引物逆转录AAV转录物,未探测到hSyn1转录物,因为hSyn1启动子在非神经元细胞类型中具有极小活性。接着应用下一代测序来定量衍生自各AAV变体的NGS读段的百分比。通过用于感染的汇集物中各AAV变体的频率将这些百分比标准化。在hiPSC衍生的星形胶质细胞中,结果展示了效能分布,其中基于AAV2的若干AAV变体展现高效能。一般而言,基于AAV1及AAV9的AAV变体的效能较低。在hiPSC衍生的内皮细胞中,结果展示了效能分布,其中基于AAV1及AAV2的若干AAV变体展现高效能。一般而言,基于AAV3B及AAV9的AAV变体的效能较低。
实施例6:在小鼠及大鼠中体内评估CNS向性AAV变体
进一步针对C57BL/6J小鼠及史泊格-多利大鼠(Sprague-Dawley rat)中的中枢神经系统的转导体内评估相同亚组的CNS向性AAV变体(图33及34)。评估啮齿动物中的转导,以完成覆盖通常用于治疗剂开发的物种的AAV效能彻底评估。对于C57BL/6J小鼠中的评估,通过单侧脑室内注射至左侧脑室中来施用10微升体积的1E11个载体基因组(n=3只雄性及n=3只雌性)。对于史泊格-多利大鼠中的评估,通过单侧脑室内注射至左侧脑室中来施用20微升体积的2E11个载体基因组(n=3只雄性及n=3只雌性)。在施用测试物品之后32天处死动物并解剖CNS组织。对于被注射半球对侧的脑区完成分析,以避免同与注射道相关的转导混淆。从CNS组织提取总RNA,并使用分别靶向hSyn1及hU6转录物的基因特异性引物逆转录AAV转录物。接着应用下一代测序来定量衍生自各AAV变体的NGS读段的百分比。通过施用的汇集物中各AAV变体的频率将这些百分比系标准化。
在C57BL/6J小鼠中,在神经元细胞中表达的转录物的hSyn1条形码测量展示了效能分布,其中相对于AAV9基准,本文所公开的许多基于肽插入至AAV1及AAV2中的AAV变体展现高效能。如所预期,PHP.B对照血清型在C57BL/6J小鼠中具有高效能。一般而言,基于AAV9及AAV3B的AAV变体的效能较低。在C57BL/6J小鼠中,在所有细胞类型中表达的转录物的hU6条形码测量展示了效能分布,其中相对于AAV9基准,本文所公开的许多基于肽插入至AAV2及尤其是AAV1中的AAV变体展现高效能。一般而言,基于AAV9及AAV3B的AAV变体的效能较低。图33。
在史泊格-多利大鼠中,在神经元细胞中表达的转录物的hSyn1条形码测量展示效能分布,其中相对于AAV9基准,本文所公开的基于肽插入至AAV1及AAV2中的许多AAV变体展现高效能。如所预期,相比于在C57BL/6J小鼠中,PHP.B对照血清型在史泊格-多利大鼠中的效能变差。一般而言,基于AAV9及AAV3B的AAV变体的效能较低。在史泊格-多利大鼠中,在所有细胞类型中表达的转录物的hU6条形码测量展示效能分布,其中相对于AAV9基准,本文所公开的基于肽插入至AAV1及AAV2中的许多AAV变体展现高效能。一般而言,基于AAV9及AAV3B的AAV变体的效能较低。图34。
实施例7:在非人类的灵长类动物中体内评估CNS向性AAV变体
我们接下来进一步针对非人类的灵长类动物(食蟹猕猴)中中枢神经系统的转导体内评估相同亚组的CNS向性AAV变体。在上文所述的各种评估中,评估食蟹猕猴中的转导对于临床翻译至人类特别重要,因为非人类灵长类动物最佳例示了人类CNS的遗传学及生理学。将AAV变体的汇集物以每只动物5.2×1013个载体基因组(vg)的剂量鞘内施用至一只雄性及一只雌性食蟹猕猴。对于鞘内施用,应用螺纹导管在颈位及胸位更接近大脑地沉积测试物品。在施用测试物品之后57天处死动物。大脑以3mm冠状切片厚度进行切片。各切片沿中矢面切成对半。自大脑左半球切片获得冲压样品(3mm),用于分析AAV基因组DNA。将右半球置于RNAlater中并冷冻大约24小时以保持RNA完整性。在储存之后,对各个脑区取样,收集3mm冲出物。将脊髓分成颈段、胸段及腰段以用于分析。分别从CNS组织提取基因组DNA及总RNA,后续分析分别被称为DNA分析及RNA分析。对于DNA分析,分别通过PCR扩增独特条形码hSyn1及hU6中的每一种。应用下一代测序定量衍生自各AAV变体的NGS读段的百分比。应注意,对于DNA分析,不存在通过启动子提供的细胞限制,因此,预期hSyn1及hU6条形码以相等的可能性扩增。对于RNA分析,使用分别靶向hSyn1(神经元)及hU6(所有细胞类型)转录物的基因特异性引物逆转录AAV转录物。接着应用下一代测序定量衍生自各AAV变体的NGS读段的百分比。对于DNA及RNA分析,这些百分比均通过施用的汇集物中各AAV变体的频率标准化。
在食蟹猕猴中,基于神经元细胞中表达的转录物的hSyn1条形码量测的RNA分析结果(图35)展示效能分布,其中相对于AAV9基准,本文所公开的许多基于肽插入至AAV3B、AAV2及AAV1中的AAV变体展现高效能。一般而言,基于AAV9的AAV变体的效能较低。在食蟹猕猴中,在所有细胞类型中表达的转录物的hU6条形码量测展示效能分布,其中相对于AAV9基准,本文所公开的许多基于肽插入至AAV3B、AAV2及AAV1中的AAV变体展现高效能。一般而言,基于AAV9的AAV变体的效能较低。本文所公开的血清型相比于AAV9基准的倍数增加绘制于图37及38中。
在食蟹猕猴中,基于CNS组织中AAV载体基因组的hSyn1及hU6条形码量测的DNA分析结果(图36)展示效能分布,其中相对于野生型AAV9基准,跨越所有血清型的许多AAV变体,包括基于AAV9的工程化变体展现极高效能。本文所公开的血清型相比于AAV9基准的倍数增加绘制于图39及40中。
尽管RNA分析指示哪些AAV变体在神经元及所有CNS细胞中提供最高生产性转基因表达水平,但值得注意的是DNA分析表明有另外的AAV极高度富集于脑组织中。
跨越所有细胞培养及体内评估的血清型效能概述绘制于图41及图42中。结果展示跨物种的转导差异,突出显示了在非人类的灵长类动物中进行血清型筛选及评估的价值。
本文中提及的所有专利、专利申请及出版物均在此以全文引用的方式并入。
尽管已出于清晰理解的目的而通过图示和举例的方式提供了本公开内容的一些细节,但本领域技术人员十分清楚可在不脱离本发明的精神或范畴的情况下实施各种更改及修改。因此,前述描述及实施例不应视为限制性的。
本发明的特定实施方式阐述于以下编号段落中:
1.鉴定与天然AAV血清型相比具有所需特性的AAV衣壳变体的方法,包括:
(i)将细胞、细胞系或组织与AAV变体的文库接触,其中所述文库的每个成员包含:
a)编码AAV变体衣壳蛋白的核酸,所述变体衣壳蛋白包含插入其高变和/或表面暴露的环内的肽;和
下述一个或多个:
b)核酸序列中在a)所述AAV变体衣壳蛋白中的肽插入位点侧翼的一个或多个沉默突变;
c)编码定位信号的核酸;
d)包含条形码的核酸;和
e)编码报告蛋白的核酸;
(ii)允许所述文库中的AAV变体转导所述细胞、细胞系或组织;
(iii)从所述细胞、细胞系或组织中回收AAV变体;和
(iv)鉴定具有所需特性的AAV衣壳变体。
2.鉴定与天然AAV血清型相比具有所需特性的AAV衣壳变体的方法,其中包括:
(i)将细胞、细胞系或组织与AAV变体的文库接触,其中所述文库的每个成员包含:
a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入其高变和/或表面暴露的环内的肽;和
下述一个或多个:
b)所述肽插入位点侧翼的核酸序列中在编码a)所述AAV变体衣壳蛋白的合适中的一个或多个沉默突变;
c)编码定位信号的核酸;
d)包含条形码的核酸;和
e)编码报告蛋白的核酸;
(ii)允许所述文库中的AAV变体转导所述细胞、细胞系或组织;
(iii)从所述细胞、细胞系或组织中回收AAV变体;和
(iv)鉴定具有所述所需特性的AAV衣壳变体。
3.根据实施方式1所述的方法,其中所述文库的每个成员包括在a)的AAV变体衣壳蛋白中的肽插入位点侧翼的核酸序列中的一个或多个沉默突变。
4.根据实施方式2所述的方法,其中所述文库的每个成员在肽插入位点侧翼所述核酸序列中编码AAV变体衣壳蛋白的核酸中的一个或多个沉默突变。
5.根据实施方式1-4中任一项所述的方法,其中所述文库的每个成员包括编码定位信号的核酸。
6.根据实施方式1-5中任一项所述的方法,其中所述文库的每个成员包含含有条形码的核酸。
7.根据实施方式1-6中任一项所述的方法,其中所述文库的每个成员包含编码报告蛋白的核酸。
8.根据实施方式1-7中任一项所述的方法,其中编码AAV变体衣壳蛋白的核酸、以及编码定位信号的核酸、包含条形码的核酸和/或编码报告蛋白的核酸位于分开的核酸分子中。
9.根据实施方式1-7中任一项所述的方法,其中编码AAV变体衣壳蛋白的核酸、编码定位信号的核酸、包含条形码的核酸和编码报告蛋白的核酸位于一个核酸分子中。
10.根据实施方式9的方法,其中编码AAV变体衣壳蛋白的核酸、以及编码定位信号的核酸、包含条形码的核酸和编码报告蛋白的核酸彼此以任何顺序连接。
11.根据实施方式10所述的方法,其中所述文库的每个成员按此顺序包含:5’ITR序列,包含条形码的核酸,编码报告蛋白的核酸,编码AAV变体衣壳蛋白的核酸,以及3’ITR序列。
12.根据实施方式1-11中任一项所述的方法,其中AAV变体文库包括衍生自两种或更多种AAV血清型的AAV变体衣壳蛋白。
13.根据实施方式1-12中任一项所述的方法,其中所述AAV变体文库的AAV血清型选自:AAV1、AAV2、AAV3B、AAV5、AAV6、AAV8、AAV9、AAV3、AAV4、AAV7、AAV11、AAVrh10、AAVrh39和AAVrh74。
14.根据实施方式1-13中任一项所述的方法,其中编码报告蛋白的核酸和编码AAV变体衣壳的核酸各自独立地与启动子可操作连接。
15.根据实施方式1-14中任一项所述的方法,其中所述所需特征是增强的细胞或组织嗜性。
16.鉴定与天然AAV血清型相比具有所需特性的AAV衣壳变体的方法,其中包括:
(i)将编码肽的多个核酸插入编码AAV衣壳蛋白的高变和/或表面暴露的环的核酸群内,以产生编码AAV变体衣壳蛋白的核酸文库;
(ii)将所述文库中编码AAV变体衣壳蛋白的每个核酸与下述一个或多个连接:
(a)包含条形码的核酸,
(b)编码报告蛋白的核酸,和
(c)编码定位信号的核酸;
(iii)通过反式提供腺病毒辅助和AAV rep功能,在生产者细胞中制备AAV变体文库;
(iv)所述纯化AAV变体文库;
(v)将细胞、细胞系或组织与所述AAV变体文库接触;
(vi)从所述靶细胞、细胞系或组织中回收AAV变体;和
(vii)鉴定具有所述所需特性的AAV衣壳变体。
17.根据实施方式16的方法,其中编码所述文库中的AAV变体衣壳蛋白的每个核酸与包含条形码的核酸连接。
18.根据实施方式1-17中任一项所述的方法,其中所述文库的每个成员包含含有所述第一条形码的第一核酸和含有第二条形码的第二核酸。
19.根据实施方式18所述的方法,其中包含所述第一条形码的第一核酸和包含所述第二条形码的第二核酸是不同的。
20.根据实施方式18或19所述的方法,其中包含所述第一条形码的第一核酸包含选自序列SEQ ID NO:111-154中任一序列的序列。
21.根据实施方式18或19的方法,其中含有第一条形码的第一核酸选自序列SEQID NO:111-154中的任一序列。
22.根据实施方式18或19的方法,其中含有第二条形码的第二核酸包括选自序列SEQ ID NO:155-198中任一序列的序列。
23.根据实施方式18或19的方法,其中含有第二条形码的第二核酸选自序列SEQID NO:155-198中的任一序列。
24.根据实施方式18-23中任一项所述的方法,其中含有第一条形码的第一核酸和含有第二条形码的第二核酸都独立地与启动子可操作连接。
25.根据实施方式24所述的方法,其中与包含所述第一条形码的第一核酸可操作地连接的启动子和与包含所述第二条形码的第二核酸可操作地连接的启动子各自独立地是RNA Pol II启动子。
26.根据实施方式24所述的方法,其中与包含所述第一条形码的第一核酸可操作地连接的启动子和与包含所述第二条形码的第二核酸可操作地连接的启动子各自独立地是RNA Pol III启动子。
27.根据实施方式24所述的方法,其中与包含所述第一条形码的第一核酸可操作地连接的启动子是RNA Pol II启动子,并且与包含所述第二条形码的第二核酸可操作地连接的启动子是RNA Pol III启动子。
28.根据实施方式25-27中任一项所述的方法,其中每个RNA Pol II启动子独立地选自:人突触蛋白启动子(hSyn1)、甲状腺素运载蛋白启动子(TTR)、细胞角蛋白18、细胞角蛋白19、unc-45肌球蛋白伴侣B(unc45b)启动子、心肌肌钙蛋白T(cTnT)启动子、胶质纤维酸性蛋白(GFAP)启动子、髓鞘碱性蛋白(MBP)启动子和甲基CpG结合蛋白2(Mecp2)启动子。
29.根据实施方式26-27中任一项所述的方法,其中每个RNA Pol III启动子独立地选自U6启动子、H1启动子和7SK启动子。
30.根据实施方式16-29中任一项所述的方法,其中编码所述文库中的AAV变体衣壳蛋白的每个核酸与编码报告蛋白的核酸连接。
31.根据实施方式16-30中任一项所述的方法,其中编码所述文库中的AAV变体衣壳蛋白的每个核酸与编码定位信号的核酸连接。
32.根据实施方式16-31中任一项所述的方法,其中编码AAV变体衣壳蛋白的每个核酸还在肽插入位点侧翼的核酸序列中包含一个或多个沉默突变。
33.根据实施方式16-32中任一项所述的方法,其中步骤(iv)还包括基于两个或更多个AAV血清型来组合变体AAV文库,以生成单个汇集物。
34.根据实施方式16-33中任一项所述的方法,其中编码AAV衣壳蛋白的高变和/或表面暴露的环的核酸序列的群体包含衍生自两个或更多个AAV血清型的序列。
35.根据实施方式16-34中任一项所述的方法,其中所述AAV血清型选自:AAV1、AAV2、AAV3B、AAV5、AAV6、AAV8、AAV9、AAV3、AAV4、AAV7、AAV11、AAVrh10、AAVrh39和AAVrh74。
36.根据实施方式16-35中任一项所述的方法,其中所述辅助功能包括E2A、E4、VA、E1A和E1B中的一种或多种。
37.根据实施方式16-36中任一项所述的方法,其中AAV rep功能包括rep78、rep68、rep 52和rep40基因。
38.根据实施方式37所述的方法,其中rep78和/或rep68基因的起始密码子从ACG修饰成ATG。
39.根据实施方式16-38中任一项所述的方法,其中生产者细胞是HEK293细胞。
40.根据实施方式16-39中任一项所述的方法,其中编码AAV变体衣壳蛋白的核酸、包含条形码的核酸、编码报告蛋白的核酸和/或编码定位信号的核酸以任何顺序彼此连接。
41.根据实施方式16-40中任一项所述的方法,其中所述文库的每个成员按下述顺序包含:5’ITR序列、包含条形码的核酸、编码报告蛋白的核酸、编码AAV变体衣壳蛋白的核酸和3’ITR序列。
42.根据实施方式16-41中任一项所述的方法,其中编码报告蛋白的核酸和编码AAV变体衣壳的核酸各自独立地与启动子可操作连接。
43.根据实施方式16-42中任一项所述的方法,其中所述所需特征是增强的细胞或组织嗜性。
44.根据实施方式1-43中任一项所述的方法,其中所述肽的长度为4-15个氨基酸。
45.根据实施方式1-44中任一项所述的方法,其中所述肽的长度为6-15个氨基酸。
46.根据实施方式45所述的方法,其中所述肽的长度为7、10或15个氨基酸。
47.根据实施方式46所述的方法,其中所述肽的长度为7个氨基酸。
48.根据实施方式1-47中任一项所述的方法,其中所述肽被插入选自下述的区域中:衣壳蛋白的VR-I、VR-II、VR-III、VR-IV、VR-V、VR-VI、VR-VII、VR-VIII和VR-IX区域。
49.根据实施方式48所述的方法,其中所述肽被插入所述衣壳蛋白的VR-I内。
50.根据实施方式48所述的方法,其中所述肽被插入所述衣壳蛋白的VR-IV内。
51.根据实施方式48所述的方法,其中所述肽被插入所述衣壳蛋白的VR-VIII内。
52.根据实施方式1-49中任一项所述的方法,其中所述肽被插入衣壳蛋白VP1、VP2或VP3内。
53.根据实施方式1-50中任一项所述的方法,其中所述肽被插入衣壳蛋白的氨基酸残基450和600之间的位置。
54.根据实施方式1-51中任一项所述的方法,其中
(i)所述AAV血清型是AAV1,所述肽被插入衣壳蛋白的氨基酸位置590处,
(ii)所述AAV血清型是AAV6,所述肽被插入衣壳蛋白的氨基酸位置454或590处,
(iii)所述AAV血清型是AAV2,所述肽被插入衣壳蛋白的氨基酸位置588处,
(iv)所述AAV血清型是AAV3B,所述肽被插入衣壳蛋白的氨基酸位置589处,
(v)所述AAV血清型是AAV5,所述肽被插入衣壳蛋白的氨基酸位置578处,
(vi)所述AAV血清型是AAV8,所述肽被插入衣壳蛋白的氨基酸位置591处,或
(vii)所述AAV血清型是AAV9,所述肽被插入衣壳蛋白的氨基酸位置266、455或589处,
其中各位置对应于所述AAV血清型中VP1的编号。
55.根据实施方式1-54中任一项所述的方法,其中所述报告蛋白是荧光蛋白。
56.根据实施方式55所述的方法,其中所述报告蛋白选自:EGFP、mCherry、mClover3、mRuby3、mApple、iRFP、tdTomato、mVenus、YFP、RFP、萤火虫荧光素酶和nanoluciferase。
57.根据实施方式1-56中任一项所述的方法,其中编码AAV变体衣壳蛋白的核酸可操作地连接p40启动子。
58.根据实施方式1-57中任一项所述的方法,其中编码报告蛋白的核酸可操作地连接细胞类型和/或组织特异性启动子。
59.根据实施方式58所述的方法,其中所述细胞类型和/或组织特异性启动子选自:人突触蛋白启动子(hSyn1)、甲状腺素运载蛋白启动子(TTR)、细胞角蛋白18、细胞角蛋白19、unc-45肌球蛋白伴侣B(unc45b)启动子、心肌肌钙蛋白T(cTnT)启动子、胶质纤维酸性蛋白(GFAP)启动子、髓鞘碱性蛋白(MBP)启动子和甲基CpG结合蛋白2(Mecp2)启动子。
60.根据实施方式59所述的方法,其中所述细胞类型和/或组织特异性启动子是hSyn1启动子。
61.根据实施方式60所述的方法,其中所述细胞类型和/或组织特异性启动子是TTR启动子。
62.根据实施方式1-61中任一项所述的方法,其中所述报告蛋白与定位信号融合。
63.根据实施方式62所述的方法,其中所述定位信号在N-端、C-端或N-端和C端与所述报告蛋白融合。
64.根据实施方式1-63中任一项所述的方法,其中所述定位信号是核定位信号(NLS)、核包膜结合结构域或组蛋白结合结构域。
65.根据实施方式64所述的方法,其中所述NLS是SV40 NLS。
66.根据实施方式64所述的方法,其中所述核包膜结合结构域是KASH结构域。
67.根据实施方式64所述的方法,其中所述组蛋白结合结构域是H2B。
68.根据实施方式1-67中任一项所述的方法,其中包含所述条形码的核酸长为5-18个核苷酸。
69.根据实施方式1-68中任一项所述的方法,其中包含所述条形码的核酸包括选自序列SEQ ID NO:111-154中任一序列的序列。
70.根据实施方式1-68中任一项所述的方法,其中包含所述条形码的核酸包括选自序列SEQ ID NO:155-198中任一序列的序列。
71.根据实施方式1-68中任一项所述的方法,其中包含所述条形码的核酸选自序列SEQ ID NO:111-154中的任何一种。
72.根据实施方式1-68中任一项所述的方法,其中包含所述条形码的核酸选自序列SEQ ID NO:155-198中的任何一种。
73.根据实施方式1-72中任一项所述的方法,其中通过所述相关的一个或多个条形码测序来鉴定具有所需特性的AAV衣壳变体。
74.根据实施方式1-73中任一项所述的方法,其中通过AAV基因组的纯化和测序鉴定具有所需特性的AAV衣壳变体。
75.根据实施方式1-74中任一项所述的方法,其中所述细胞、细胞系或组织选自CNS、心脏、肺、气管、食道、肌肉、骨、软骨、胃、胰腺、肠道、肝脏、膀胱、肾、输尿管、尿道、子宫、输卵管、卵巢、睾丸、前列腺、眼、血液、淋巴和口腔粘膜。
76.根据实施方式1-74中任一项所述的方法,其中所述细胞选自:神经元、神经胶质细胞、星形胶质细胞、少突胶质细胞、小神经胶质细胞、施万细胞、室管膜细胞、肝细胞、星状脂肪储存细胞、枯否氏细胞、肝内皮细胞、上皮细胞、心肌细胞、平滑肌细胞、T细胞、B细胞、造血干细胞和胚胎干细胞。
77.AAV变体的文库,其中所述文库的每个成员包含:
a)编码AAV变体衣壳蛋白的核酸序列,所述变体衣壳蛋白包含插入其高变和/或表面暴露的环内的肽;和
下述一种或多种:
b)在a)的AAV变体衣壳蛋白内所述肽插入位点侧翼的核酸序列中的一个或多个沉默突变;
c)编码定位信号的核酸;
d)包含条形码的核酸;和
e)编码报告蛋白的核酸。
78.AAV变体的文库,其中所述文库的每个成员包含:
a)AAV变体衣壳蛋白,其包含插入其高变和/或表面暴露的环内的肽;和
下述一种或多种:
b)在编码a)的AAV变体衣壳蛋白的核酸内所述肽插入位点侧翼的核酸序列中的一个或多个沉默突变;
c)编码定位信号的核酸;
d)包含条形码的核酸;和
e)编码报告蛋白的核酸。
79.根据实施方式77所述的文库,其中所述文库的每个成员包含在a)的AAV变体衣壳蛋白内所述肽插入位点侧翼的核酸序列中的一个或多个沉默突变。
80.根据实施方式78所述的文库,其中所述文库的每个成员包含在编码a)的AAV变体衣壳蛋白的核酸内所述肽插入位点侧翼的核酸序列中的一个或多个沉默突变。
81.根据实施方式77-80中任一项所述的文库,其中所述文库的每个成员包括编码定位信号的核酸。
82.根据实施方式77-81中任一项所述的文库,其中所述文库的每个成员包含含有条形码的核酸。
83.根据实施方式77-82中任一项所述的文库,其中所述文库的每个成员包含含有第一条形码的第一核酸和含有第二条形码的第二核酸。
84.根据实施方式83所述的文库,其中包含所述第一条形码的第一核酸和包含所述第二条形码的第二核酸是不同的。
85.根据实施方式84所述的文库,其中包含第一条形码序列的第一核酸包含选自序列SEQ ID NO:111-154中任一序列的序列。
86.根据实施方式84所述的文库,其中包含第一条形码序列的第一核酸选自序列SEQ ID NO:111-154中任一序列的序列。
87.根据实施方式84所述的文库,其中包含第二条形码序列的第二核酸包含选自序列SEQ ID NO:155-198中任一序列的序列。
88.根据实施方式84的文库,其中包含第二条形码序列的第二核酸选自序列SEQID NO:155-198中的任何一种。
89.根据实施方式83-88中任一项所述的文库,其中含有第一条形码的第一核酸和含有第二条形码的第二核酸中的每一个独立地与启动子可操作地连接。
90.根据实施方式89所述的文库,其中与含有第一条形码的第一核酸可操作地连接的启动子和与含有第二条形码的第二核酸可操作地连接的启动子各自独立地是RNA PolII启动子。
91.根据实施方式89的文库,其中与含有第一条形码的第一核酸可操作地连接的启动子和与含有第二条形码的第二核酸可操作地连接的启动子各自独立地是RNA Pol III启动子。
92.根据实施方式89的文库,其中与含有第一条形码的第一核酸可操作地连接的启动子与RNA Pol II启动子可操作地连接,并且与含有第二条形码的第二核酸可操作地连接的启动子是RNA Pol III启动子。
93.根据实施方式90-91中任一项的文库,其中RNA Pol II启动子选自:人突触蛋白启动子(hSyn1)、甲状腺素运载蛋白启动子(TTR)、细胞角蛋白18、细胞角蛋白19、unc-45肌球蛋白伴侣B(unc45b)启动子、心肌肌钙蛋白T(cTnT)启动子、胶质纤维酸性蛋白(GFAP)启动子、髓鞘碱性蛋白(MBP)启动子和甲基CpG结合蛋白2(Mecp2)启动子。
94.根据实施方式91-93中任一项的文库,其中RNA Pol III启动子选自U6启动子、H1启动子和7SK启动子。
95.根据实施方式77-94中任一项的文库,其中所述文库的每个成员包含编码报告蛋白的核酸。
96.根据实施方式77-95中任一项所述的文库,其中编码AAV变体衣壳蛋白的核酸、编码定位信号的核酸、包含条形码的核酸和/或编码报告蛋白的核酸位于分开的核酸分子中。
97.根据实施方式77-95中任一项所述的文库,其中编码AAV变体衣壳蛋白的核酸、编码定位信号的核酸、包含条形码的核酸和/或编码报告蛋白的核酸位于一个核酸分子中。
98.根据实施方式97所述的文库,其中编码AAV变体衣壳蛋白的核酸、编码定位信号的核酸、包含条形码的核酸和/或编码报告蛋白的核酸以任何顺序彼此连接。
99.根据实施方式97的文库,其中所述文库的每个成员按下述顺序包括:5’ITR序列,包含条形码的核酸,编码报告蛋白的核酸,编码AAV变体衣壳蛋白的核酸,以及3’ITR序列。
100.根据实施方式77-99中任一项所述的文库,其中所述AAV变体衍生自下述一种或多种:AAV1、AAV2、AAV3B、AAV5、AAV6、AAV8、AAV9、AAV3、AAV4、AAV7、AAV11、AAVrh10、AAVrh39和AAVrh74。
101.根据实施方式100所述的文库,其中所述AAV变体文库包括衍生自两个或更多个AAV血清型的AAV变体衣壳蛋白。
102.根据实施方式77-101中任一项所述的文库,其中所述肽的长度为4-15个氨基酸。
103.根据实施方式102所述的文库,其中所述肽的长度为6-15个氨基酸。
104.根据实施方式103的文库,其中所述肽的长度为7、10或15个氨基酸。
105.根据实施方式104所述的文库,其中所述肽的长度为7个氨基酸。
106.根据实施方式77-105中任一项所述的文库,其中所述肽包含SEQ ID NO:1-32中任一所示氨基酸序列的至少4个连续氨基酸。
107.根据实施方式106所述的文库,其中所述肽包含SEQ ID NO:1-32中任一所示的氨基酸序列。
108.根据实施方式77-106中任一项所述的文库,其中所述肽包含SEQ ID NO:68-110中任一所示氨基酸序列的至少4个连续氨基酸。
109.根据实施方式108的文库,其中所示肽包含SEQ ID NO:68-110中任一所示的氨基酸序列。
110.根据实施方式77-109中任一项所述的文库,其中所述肽被插入选自下述的区域内:所示衣壳蛋白的VR-1、VR-II、VR-III、VR-IV、VR-V、VR-VI、VR-VII、VR-VIII和VR-IX区域。
111.根据实施方式110所述的文库,其中所述肽被插入所述衣壳蛋白的VR-I内。
112.根据实施方式110所述的文库,其中所述肽被插入所述衣壳蛋白的VR-IV内。
113.根据实施方式110所述的文库,其中所述肽被插入所述衣壳蛋白的VR-VIII内。
114.根据实施方式77-113中任一项所述的文库,其中所述肽被插入所述衣壳蛋白VP1、VP2或VP3中。
115.根据实施方式77-114中任一项所述的文库,其中所述肽被插入所述衣壳蛋白的氨基酸残基450和600之间的位置。
116.根据实施方式77-115中任一项所述的文库,其中
(i)所述AAV血清型是AAV1,所述肽被插入衣壳蛋白的氨基酸位置590处,
(ii)所述AAV血清型是AAV6,所述肽被插入衣壳蛋白的氨基酸位置454或590处,
(iii)所述AAV血清型是AAV2,所述肽被插入衣壳蛋白的氨基酸位置588处,
(iv)所述AAV血清型是AAV3B,所述肽被插入衣壳蛋白的氨基酸位置589处,
(v)所述AAV血清型是AAV5,所述肽被插入衣壳蛋白的氨基酸位置578处,
(vi)所述AAV血清型是AAV8,所述肽被插入衣壳蛋白的氨基酸位置591处,或
(vii)所述AAV血清型是AAV9,所述肽被插入衣壳蛋白的氨基酸位置266、455或589处,
其中各位置对应于所述AAV血清型中VP1的编号。
117.根据实施方式77-116中任一项所述的文库,其中所述报告蛋白是荧光蛋白。
118.根据实施方式117所述的文库,其中所述报告蛋白选自:EGFP、mCherry、mClover3、mRuby3、mApple、iRFP、tdTomato、mVenus、YFP、RFP、萤火虫荧光素酶和nanoluciferase。
119.根据实施方式77-118中任一项所述的文库,其中编码AAV变体衣壳蛋白的核酸与p40启动子可操作地连接。
120.根据实施方式77-119中任一项的文库,其中编码报告蛋白的核酸与细胞类型和/或组织特异性启动子可操作地连接。
121.根据实施方式120所述的文库,其中所述细胞类型和/或组织特异性启动子选自:人突触蛋白启动子(hSyn1)、甲状腺素运载蛋白启动子(TTR)、细胞角蛋白18、细胞角蛋白19、unc-45肌球蛋白伴侣B(unc45b)启动子、心肌肌钙蛋白T(cTnT)启动子、胶质纤维酸性蛋白(GFAP)启动子、髓鞘碱性蛋白(MBP)启动子和甲基CpG结合蛋白2(Mecp2)启动子。
122.根据实施方式121所述的文库,其中所述细胞类型和/或组织特异性启动子是hSyn1启动子。
123.根据实施方式121的文库,其中所述细胞类型和/或组织特异性启动子是TTR启动子。
124.根据实施方式77-123中任一项的文库,其中所述报告蛋白与所述定位信号相融合。
125.根据实施方式124所述的文库,其中所述定位信号在N-末端、C-末端或N-末端和C末端一起与所述报告蛋白相融合。
126.根据实施方式77-125中任一项所述的文库,其中所述定位信号是核定位信号(NLS)、核包膜结合结构域或组蛋白结合结构域。
127.根据实施方式126所述的文库,其中所述NLS是SV40 NLS。
128.根据实施方式126所述的文库,其中所述核包膜结合结构域是KASH结构域。
129.根据实施方式126所述的文库,其中所述组蛋白结合结构域是H2B。
130.根据实施方式77-129中任一项的文库,其中包含所述条形码的核酸长为5-18个核苷酸。
131.根据实施方式77-130中任一项所述的文库,其中包含所述条形码的核酸包括选自序列SEQ ID NO:111-154中任一项的序列。
132.根据实施方式77-130中任一项所述的文库,其中包含所述条形码的核酸包括选自序列SEQ ID NO:155-198中任一项的序列。
133.根据实施方式77-132中任一项的文库,其中包含所述条形码的核酸选自序列SEQ ID NO:111-154中的任何一个。
134.根据实施方式77-132中任一项的文库,其中包含所述条形码的核酸选自序列SEQ ID NO:155-198中的任何一个。
135.一种AAV变体,其中包含:
a)编码AAV变体衣壳蛋白的核酸序列,其中所述变体衣壳蛋白含有插入到其高变和/或表面暴露的环内的肽;和
下述一种或多种:
b)所述核酸序列中在a)的AAV变体衣壳蛋白内的肽插入位点侧翼的一个或多个沉默突变;
c)编码定位信号的核酸;
d)包含条形码的核酸;和
e)编码报告蛋白的核酸。
136.一种AAV变体,其中包含:
a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入其高变和/或表面暴露的环内的肽;和
下述一种或多种:
b)在所述肽插入位点侧翼的核酸序列中,在编码a)的AAV变体衣壳蛋白的核酸中的一个或多个沉默突变;
c)编码定位信号的核酸;
d)包含条形码的核酸;和
e)编码报告蛋白的核酸。
137.根据实施方式135所述的变体,其中所述变体包含a)的AAV变体衣壳蛋白内所述肽插入位点侧翼的核酸序列中的一个或多个沉默突变。
138.根据实施方式136的变体,其中所述变体在肽插入位点侧翼的核酸序列中编码a)的AAV变体衣壳蛋白的核酸中包含一个或多个沉默突变。
139.根据实施方式135-136中任一项所述的变体,其中所述变体包含编码定位信号的核酸。
140.根据实施方式135-139中任一项所述的变体,其中所述变体包含含有条形码的核酸。
141.根据实施方式138-139中任一项所述的变体,其中所述变体包含含有第一条形码的第一核酸和含有第二条形码的第二核酸。
142.根据实施方式141所述的变体,其中含有第一条形码的第一核酸和含有第二条形码的第二核酸不同。
143.根据实施方式142的变体,其中包含第一条形码序列的第一核酸包含选自序列SEQ ID NO:111-154中任一个的序列。
144.根据实施方式142的变体,其中包含第一条形码序列的第一核酸选自序列SEQID NO:111-154中的任一个。
145.根据实施方式142的变体,其中包含第二条形码序列的第二核酸包含选自序列SEQ ID NO:155-198中任一个的序列。
146.根据实施方式142的变体,其中包含第二条形码序列的第二核酸选自序列SEQID NO:155-198中的任一个。
147.根据实施方式142-146中任一项所述的变体,其中包含所述第一条形码的所述第一核酸和包含所述第二条形码的所述第二核酸中的每一个独立地可操作地连接至启动子。
148.根据实施方式147的变体,其中与含有第一条形码的第一核酸可操作地连接的启动子和与含有第二条形码的第二核酸可操作地连接的启动子各自独立地是RNA PolII启动子。
149.根据实施方式147的变体,其中与含有第一条形码的第一核酸可操作地连接的启动子和与含有第二条形码的第二核酸可操作地连接的启动子各自独立地是RNA PolIII启动子。
150.实施方式147的变体,其中与含有第一条形码的第一核酸可操作地连接的启动子与RNA Pol II启动子可操作地连接,并且与含有第二条形码的第二核酸可操作地连接的启动子是RNA Pol III启动子。
151.根据实施方式148-150中任一项所述的变体,其中所述RNA Pol II启动子选自:人突触蛋白启动子(hSyn1)、甲状腺素运载蛋白启动子(TTR)、细胞角蛋白18、细胞角蛋白19、unc-45肌球蛋白伴侣B(unc45b)启动子、心肌肌钙蛋白T(cTnT)启动子、神经胶质纤维酸性蛋白(GFAP)启动子、髓鞘碱性蛋白(MBP)启动子和甲基CpG结合蛋白2(Mecp2)启动子。
152.根据实施方式149-151中任一项所述的变体,其中所述RNA Pol III启动子选自由U6启动子、H1启动子和7SK启动子组成的组。
153.根据实施方式135-152中任一项所述的变体,其中所述变体包含编码报告蛋白的核酸。
154.根据实施方式135-153中任一项所述的变体,其中所述编码AAV变体衣壳蛋白的核酸,和所述编码定位信号的核酸,包含条形码的核酸,和/或编码报告蛋白的核酸位于分开的核酸分子中。
155.实施方式135-154中任一项的变体,其中编码AAV变体衣壳蛋白的核酸、编码定位信号的核酸、包含条形码的核酸和/或编码报告蛋白的核酸位于一个核酸分子中。
156.实施方式155的变体,其中编码AAV变体衣壳蛋白的核酸和编码定位信号的核酸、包含条形码的核酸和/或编码报告蛋白的核酸以任何顺序彼此连接。
157.根据实施方式156所述的变体,其中所述变体以下述顺序包含:5’ITR序列、包含条形码的核酸、编码报告蛋白的核酸、编码AAV变体衣壳蛋白的核酸和3’ITR序列。
158.根据实施方式135-157中任一项所述的变体,其中所述AAV变体源自于:AAV1、AAV2、AAV3B、AAV5、AAV6、AAV8、AAV9、AAV3、AAV4、AAV7、AAV11、AAVrh10、AAVrh39和AAVrh74。
159.根据实施方式135-158中任一项所述的变体,其中所述肽具有4-15个氨基酸的长度。
160.根据实施方式159所述的变体,其中所述肽具有6-15个氨基酸的长度。
161.根据实施方式160所述的变体,其中所述肽具有7、10或15个氨基酸的长度。
162.根据实施方式161所述的变体,其中所述肽具有7个氨基酸的长度。
163.根据实施方式135-162中任一项所述的变体,其中所述插入的肽包含SEQ IDNO:1-32中任一所示的氨基酸序列的至少4个连续氨基酸。
164.根据实施方式163所述的变体,其中所述肽包含在SEQ ID NO:1-32中任一所示的氨基酸序列。
165.根据实施方式135-162中任一项所述的变体,其中所述插入的肽包含SEQ IDNO:68-110中任一所示的氨基酸序列的至少4个连续氨基酸。
166.根据实施方式165所述的变体,其中所述肽包含在SEQ ID NO:68-110中任一所示的氨基酸序列。
167.根据实施方式135-166中任一项所述的变体,其中所述肽被插入选自由所述衣壳蛋白的VR-I、VR-II、VR-III、VR-IV、VR-V、VR-VI、VR-VII、VR-VIII和VR-IX区域。
168.根据实施方式167所述的变体,其中所述肽被插入到所述衣壳蛋白的VR-I中。
169.根据实施方式167所述的变体,其中所述肽被插入到所述衣壳蛋白的VR-IV中。
170.根据实施方式168所述的变体,其中所述肽被插入到所述衣壳蛋白的VR-VIII中。
171.根据实施方式135-170中任一项所述的变体,其中所述肽被插入到所述衣壳蛋白VP1、VP2或VP3中。
172.根据实施方式135-171中任一项所述的变体,其中所述肽被插入在所述衣壳蛋白的氨基酸残基450和600之间的位置处。
173.根据实施方式135-172中任一项所述的变体,其中:
(i)所述AAV血清型是AAV1并且所述肽被插入在所述衣壳蛋白的氨基酸位置590处,
(ii)所述AAV血清型是AAV6并且所述肽被插入在所述衣壳蛋白的氨基酸位置454或590处,
(iii)所述AAV血清型是AAV2并且所述肽被插入在所述衣壳蛋白的氨基酸位置588处,
(iv)所述AAV血清型是AAV3B并且所述肽被插入在所述衣壳蛋白的氨基酸位置589处,
(v)所述AAV血清型是AAV5并且所述肽被插入在所述衣壳蛋白的氨基酸位置578处,
(vi)所述AAV血清型是AAV8并且所述肽被插入在所述衣壳蛋白的氨基酸位置591处,或
(vii)所述AAV血清型是AAV9并且所述肽被插入在所述衣壳蛋白的氨基酸位置266、455或589处,
其中各所述位置对应于所述AAV血清型中VP1的编号。
174.根据实施方式135-173中任一项所述的变体,其中所述报告蛋白是荧光蛋白。
175.根据实施方式174所述的变体,其中所述报告蛋白选自:EGFP、mCherry、mClover3、mRuby3、mApple、iRFP、tdTomato、mVenus、YFP、RFP、萤火虫荧光素酶和nanoluciferase。
176.根据实施方式135-175中任一项所述的变体,其中所述编码AAV变体衣壳蛋白的核酸与p40启动子可操作地连接。
177.根据实施方式138-176中任一项所述的变体,其中所述编码报告蛋白的核酸与细胞类型和/或组织特异性启动子可操作地连接。
178.根据实施方式177所述的变体,其中所述细胞类型和/或组织特异性启动子选自:人突触蛋白启动子(hSyn1)、甲状腺素运载蛋白启动子(TTR)、细胞角蛋白18、细胞角蛋白19、unc-45肌球蛋白伴侣B(unc45b)启动子、心肌肌钙蛋白T(cTnT)启动子、神经胶质纤维酸性蛋白(GFAP)启动子、髓鞘碱性蛋白(MBP)启动子和甲基CpG结合蛋白2(Mecp2)启动子。
179.根据实施方式178所述的变体,其中所述细胞类型和/或组织特异性启动子是hSyn1启动子。
180.根据实施方式178所述的变体,其中所述细胞类型和/或组织特异性启动子是TTR启动子。
181.根据实施方式135-180中任一项所述的变体,其中所述报告蛋白与所述定位信号融合。
182.根据实施方式181所述的变体,其中所述定位信号在N-末端、C-末端或N-末端和C-末端融合至所述报告蛋白。
183.根据实施方式135-182中任一项所述的变体,其中所述定位信号是核定位信号(NLS)、核包膜结合域或组蛋白结合域。
184.根据实施方式183所述的变体,其中所述NLS是SV40 NLS。
185.根据实施方式183所述的变体,其中所述核包膜结合域是KASH域。
186.根据实施方式183所述的变体,其中所述组蛋白结合域是H2B。
187.根据实施方式135-186中任一项所述的变体,其中包含所述条形码的核酸的长度为5-18个核苷酸。
188.根据实施方式135-187中任一项所述的变体,其中包含所述条形码的核酸包含选自序列SEQ ID NO:111-154中任一项的序列。
189.根据实施方式188所述的变体,其中包含所述条形码的核酸选自序列SEQ IDNO:111-154中的任一个。
190.根据实施方式135-187中任一项所述的变体,其中包含所述条形码的核酸包含选自序列SEQ ID NO:155-198中任一项的序列。
191.根据实施方式190所述的变体,其中包含所述条形码的核酸选自序列SEQ IDNO:155-198中的任一个。
192.根据实施方式135-191中任一项所述的变体,其中所述AAV变体源自AAV1。
193.根据实施方式192所述的变体,其中所述变体包含含有选自SEQ ID NO:68至SEQ ID NO:75中任一项的氨基酸序列的肽。
194.根据实施方式192所述的变体,其中所述变体包含含有选自SEQ ID NO:1、SEQID NO:2和SEQ ID NO:3的氨基酸序列的肽:。
195.根据实施方式192所述的变体,其中所述变体包含含有氨基酸序列SEQ IDNO:71的肽。
196.根据实施方式135-191中任一项所述的变体,其中所述AAV变体源自AAV2。
197.根据实施方式196所述的变体,其中所述变体包含含有选自由SEQ ID NO:90至SEQ ID NO:110中任一项组成的组的氨基酸序列的肽。
198.实施方式196所述的变体,其中所述变体包含含有选自下组的任一序列的肽:SEQ ID NO:95、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:106、SEQ ID NO:91和SEQ ID NO:102。
199.根据实施方式196所述的变体,其中所述变体包含含有选自SEQ ID NO:4-7中任一项的氨基酸序列的肽。
200.根据实施方式135-191中任一项所述的变体,其中所述AAV变体源自AAV3B。
201.根据实施方式200所述的变体,其中所述变体包含含有选自下组的任一序列的肽:SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:76和SEQ IDNO:83。
202.根据实施方式200所述的变体,其中所述变体包含含有选自SEQ ID NO:8至SEQ ID NO:11中任一项的氨基酸序列的肽。
203.根据实施方式135-191中任一项所述的变体,其中所述AAV变体源自AAV5。
204.根据实施方式203所述的变体,其中所述变体包含含有选自SEQ ID NO:28至SEQ ID NO:32中任一项的氨基酸序列的肽。
205.根据实施方式135-191中任一项所述的变体,其中所述AAV变体源自AAV6。
206.根据实施方式205所述的变体,其中所述变体包含含有选自由SEQ ID NO:19至SEQ ID NO:27中任一项组成的组的氨基酸序列的肽。
207.根据实施方式135-191中任一项所述的变体,其中所述AAV变体源自AAV9。
208.根据实施方式207所述的变体,其中所述变体包含含有选自SEQ ID NO:12至SEQ ID NO:18中任一项的氨基酸序列的肽。
209.根据实施方式207所述的变体,其中所述变体包含含有选自SEQ ID NO:86至SEQ ID NO:89中任一项的氨基酸序列的肽。
210.根据实施方式207所述的变体,其中所述变体包含含有序列SEQ ID NO:89的肽。
211.一种核酸分子,其中包含:
a)编码AAV变体衣壳蛋白的核酸序列,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽;和
以下一种或多种:
b)编码变体衣壳蛋白的核酸序列,所述核酸序列在该变体衣壳蛋白的高变和/或表面暴露的环中肽插入位点侧翼的核苷酸序列中包含一个或多个沉默突变;
c)编码定位信号的核酸序列;
d)包含条形码的核酸序列;和
e)编码报告蛋白的核酸序列。
212.根据实施方式211所述的核酸分子,其中编码AAV变体衣壳蛋白的核酸序列在a)的AAV变体衣壳蛋白中肽插入位点侧翼的核酸序列中包含一个或多个沉默突变。
213.根据实施方式212所述的核酸分子,其中所述核酸分子包含编码定位信号的核酸。
214.根据实施方式212所述的核酸分子,其中所述核酸分子包含含有条形码的核酸。
215.根据实施方式211-214所述的核酸分子,其中所述核酸分子包含含有第一条形码的第一核酸和含有第二条形码的第二核酸。
216.根据实施方式215所述的核酸分子,其中含有第一条形码的第一核酸和含有第二条形码的第二核酸不同。
217.根据实施方式216所述的核酸分子,其中含有第一条形码序列的第一核酸包含选自序列SEQ ID NO:111-154中任一个的序列。
218.根据实施方式217所述的核酸分子,其中含有第一条形码序列的第一核酸选自序列SEQ ID NO:111-154中的任一个。
219.根据实施方式216所述的核酸分子,其中含有第二条形码序列的第二核酸包含选自序列SEQ ID NO:155-198中任一个的序列。
220.根据实施方式217所述的核酸分子,其中含有第二条形码序列的第二核酸选自序列SEQ ID NO:155-198中的任一个。
221.根据实施方式215-220中任一项所述的核酸分子,其中含有第一条形码的第一核酸和含有第二条形码的第二核酸中的每一个独立地与启动子可操作地连接。
222.根据实施方式221所述的核酸分子,其中与含有第一条形码的第一核酸可操作地连接的启动子和与含有第二条形码的第二核酸可操作地连接的启动子各自独立地是RNA Pol II启动子。
223.根据实施方式221所述的核酸分子,其中与含有第一条形码的第一核酸可操作地连接的启动子和与含有第二条形码的第二核酸可操作地连接的启动子各自独立地是RNA Pol III启动子。
224.根据实施方式221所述的核酸分子,其中与含有第一条形码的第一核酸可操作地连接的启动子与含有第二条形码的第二核酸可操作地连接的启动子是RNA Pol III启动子。
225.根据实施方式222-224中任一项的核酸分子,其中所述RNA Pol II启动子选自下组:人突触蛋白启动子(hSyn1)、甲状腺素运载蛋白启动子(TTR)、细胞角蛋白18、细胞角蛋白19、unc-45肌球蛋白伴侣B(unc45b)启动子、心肌肌钙蛋白T(cTnT)启动子、神经胶质纤维酸性蛋白(GFAP)启动子、髓鞘碱性蛋白(MBP)启动子和甲基CpG结合蛋白2(Mecp2)启动子。
226.根据实施方式223-224中任一项所述的核酸分子,其中所述RNA Pol III启动子选自由U6启动子、H1启动子和7SK启动子组成的组。
227.根据实施方式211-226中任一项所述的核酸分子,其中所述核酸分子包含编码报告蛋白的核酸。
228.根据实施方式211-227中任一项所述的核酸分子,其中所述AAV变体源自以下中的一种或多种:AAV1、AAV2、AAV3B、AAV5、AAV6、AAV8、AAV9、AAV3、AAV4、AAV7、AAV11、AAVrh10、AAVrh39和AAVrh74。
229.根据实施方式211-228中任一项所述的核酸分子,其中该插入的肽具有4-15个氨基酸的长度。
230.根据实施方式229所述的核酸分子,其中所述插入的肽包含SEQ ID NO:1-32中任一所示的氨基酸序列的至少4个连续氨基酸。
231.根据实施方式229所述的核酸分子,其中所述插入的肽包含SEQ ID NO:68-110中任一所示的氨基酸序列的至少4个连续氨基酸。
232.根据实施方式211-231中任一项所述的核酸分子,其中所述编码报告蛋白的核酸与细胞类型和/或组织特异性启动子可操作地连接。
233.根据实施方式232所述的核酸分子,其中所述细胞类型和/或组织特异性启动子是hSyn1启动子。
234.根据实施方式211-233任一项所述的核酸分子,其中包含所述条形码的核酸包含选自序列SEQ ID NO:111-154中任一项的序列。
235.根据实施方式211-233任一项所述的核酸分子,其中包含所述条形码的核酸包含选自序列SEQ ID NO:155-198中任一项的序列。
236.根据实施方式135-210中任一项所述的AAV变体用于将转基因递送至靶细胞或组织的用途。
237.一种AAV载体,其包含编码肽的核酸分子,所述肽包含SEQ ID NO:1-32中任一所示的氨基酸序列的至少4个连续氨基酸。
238.根据实施方式237所述的AAV载体,其中所述核酸编码包含SEQ ID NO:1-32中任一所示的氨基酸序列的肽。
239.根据实施方式237或238所述的AAV载体,其中所述核酸编码具有SEQ ID NO:1-32中任一个的序列的肽。
240.一种AAV载体,其包含编码肽的核酸分子,所述肽包含SEQ ID NO:68-110中任一所示的氨基酸序列的至少4个连续氨基酸。
241.根据实施方式240所述的AAV载体,其中所述核酸编码包含SEQ ID NO:68-110中任一所示的氨基酸序列的肽。
242.根据实施方式240或241所述的AAV载体,其中所述核酸编码具有SEQ ID NO:68-110中任一项的序列的肽。
243.根据实施方式240所述的AAV载体,其中所述核酸编码包含SEQ ID NO:71、76-80、83、89、91、94-96、101-103和106中任一所示的氨基酸序列的肽。
244.根据实施方式237-243中任一项所述的AAV载体,其中所述肽是衣壳蛋白的一部分。
245.根据实施方式244所述的AAV载体,其中所述衣壳蛋白是VP1、VP2或VP3。
246.根据实施方式237-245中任一项所述的AVV载体,其中所述肽被插入在所述衣壳蛋白的氨基酸残基450和600之间的位置处。
247.根据实施方式246所述的AAV载体,其中所述肽被插入到
(i)AAV1衣壳蛋白的氨基酸位置590处,
(ii)AAV6衣壳蛋白的氨基酸位置454或590处,
(iii)AAV2衣壳蛋白的氨基酸位置588处,
(iv)AAV3B衣壳蛋白的氨基酸位置589处,
(v)AAV5衣壳蛋白的氨基酸位置578处,
(vi)AAV8衣壳蛋白的氨基酸位置591处,或
(vi)AAV9衣壳蛋白的氨基酸位置266、455或589处,
其中所述位置对应于所述AAV血清型中VP1的编号。
248.一种药物组合物,其包含实施方式237-247中任一项所述的AAV载体和药学上可接受的载体。
249.一种肽,其包含SEQ ID NO:1-32中任一所示的氨基酸序列。
250.一种肽,其包含SEQ ID NO:68-110中任一所示的氨基酸序列。
251.一种肽,其包含SEQ ID NO:71、76-80、83、89、91、94-96、101-103和106中任一所示的氨基酸序列。
252.一种肽,其包含SEQ ID NO:71、76-80、83和94-96中任一所示的氨基酸序列。
253.一种肽,其包含SEQ ID NO:89、91、101-103和106中任一所示的氨基酸序列。
254.一种肽,其包含SEQ ID NO:68至SEQ ID NO:75中任一所示的氨基酸序列。
255.一种肽,其包含SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3中任一所示的氨基酸序列。
256.一种肽,其包含SEQ ID NO:71中所示的氨基酸序列。
257.一种肽,其包含SEQ ID NO:90至SEQ ID NO:110中任一所示的氨基酸序列。
258.一种肽,其包含SEQ ID NO:95、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:106、SEQ ID NO:91和SEQ ID NO:102中任一所示的氨基酸序列。
259.一种肽,其包含SEQ ID NO:4-7中任一所示的氨基酸序列。
260.一种肽,其包含SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:76和SEQ ID NO:83中任一所示的氨基酸序列.
261.一种肽,其包含SEQ ID NO:8至SEQ ID NO:11中任一所示的氨基酸序列。
262.一种肽,其包含SEQ ID NO:28至SEQ ID NO:32中任一所示的氨基酸序列。
263.一种肽,其包含SEQ ID NO:19至SEQ ID NO:27中任一所示的氨基酸序列。
264.一种肽,其包含SEQ ID NO:12至SEQ ID NO:18中任一所示的氨基酸序列。
265.一种肽,其包含SEQ ID NO:86至SEQ ID NO:89中任一所示的氨基酸序列。
266.一种肽,其包含SEQ ID NO:89中所示的氨基酸序列。
267.根据实施方式249-266中任一项所述的肽,其中所述肽是AAV载体的一部分。
268.根据实施方式267所述的肽,其中所述肽是AAV载体的衣壳蛋白的一部分。
269.一种编码实施方式249-268中任一项所述的肽的核酸分子。
270.一种衣壳蛋白,其包含含有SEQ ID NO:1-32中任一所示的氨基酸序列的至少4个连续氨基酸的肽。
271.一种衣壳蛋白,其包含含有SEQ ID NO:68-110中任一所示的氨基酸序列的至少4个连续氨基酸的肽。
272.根据实施方式270所述的衣壳蛋白,其中所述肽包含在SEQ ID NO:1-32中任一所示的氨基酸序列。
273.根据实施方式271所述的衣壳蛋白,其中所述肽包含SEQ ID NO:68-110中任一所示的氨基酸序列。
274.根据实施方式270所述的衣壳蛋白,其包含SEQ ID NO:1-32中任一所示的氨基酸序列。
275.根据实施方式271所述的衣壳蛋白,其包含SEQ ID NO:68-110中任一所示的氨基酸序列。
276.根据实施方式271所述的衣壳蛋白,其中所述肽包含SEQ ID NO:71、76-80、83、89、91、94-96、101-103和106中任一所示的氨基酸序列。
277.根据实施方式271所述的衣壳蛋白,其中所述肽包含SEQ ID NO:71、76-80、83和94-96中任一所示的氨基酸序列。
278.根据实施方式271所述的衣壳蛋白,其中所述肽包含SEQ ID NO:89、91、101-103和106中任一所示的氨基酸序列。
279.根据实施方式271所述的衣壳蛋白,其中所述肽包含SEQ ID NO:68至SEQ IDNO:75中任一所示的氨基酸序列。
280.根据实施方式270所述的衣壳蛋白,其中所述肽包含SEQ ID NO:1、SEQ IDNO:2和SEQ ID NO:3中任一所示的氨基酸序列。
281.根据实施方式271所述的衣壳蛋白,其中所述肽包含在SEQ ID NO:71中所示的氨基酸序列。
282.根据实施方式271所述的衣壳蛋白,其中所述肽包含SEQ ID NO:90至SEQ IDNO:110中任一所示的氨基酸序列。
283.根据实施方式271所述的衣壳蛋白,其中所述肽包含SEQ ID NO:95、SEQ IDNO:94、SEQ ID NO:96、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:106、SEQ ID NO:91和SEQ ID NO:102中任一所示的氨基酸序列。
284.根据实施方式270所述的衣壳蛋白,其中所述肽包含SEQ ID NO:4-7中任一所示的氨基酸序列。
285.根据实施方式271所述的衣壳蛋白,其中所述肽包含SEQ ID NO:78、SEQ IDNO:80、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:76和SEQ ID NO:83中任一所示的氨基酸序列。
286.根据实施方式270所述的衣壳蛋白,其中所述肽包含SEQ ID NO:8至SEQ IDNO:11中任一所示的氨基酸序列。
287.根据实施方式270所述的衣壳蛋白,其中所述肽包含SEQ ID NO:28至SEQ IDNO:32中任一所示的氨基酸序列。
288.根据实施方式270所述的衣壳蛋白,其中所述肽包含SEQ ID NO:19至SEQ IDNO:27中任一所示的氨基酸序列。
289.根据实施方式270所述的衣壳蛋白,其中所述肽包含SEQ ID NO:12至SEQ IDNO:18中任一所示的氨基酸序列。
290.实施方式271的衣壳蛋白,其中所述肽包含SEQ ID NO:86至SEQ ID NO:89中任一所示的氨基酸序列。
291.根据实施方式271所述的衣壳蛋白,其中所述肽包含SEQ ID NO:89中所示的氨基酸序列。
292.一种编码实施方式269-291中任一项所述的衣壳蛋白的核酸分子。
293.一种将核酸递送至受试者的靶细胞或组织的方法,包括:施用包含根据实施方式237-247中任一项的AAV载体的组合物。
294.根据实施方式293所述的方法,其中所述衣壳蛋白包含SEQ ID NO:1-32中任一所示的氨基酸序列。
295.根据实施方式293所述的方法,其中所述衣壳蛋白包含SEQ ID NO:68-110中任一所示的氨基酸序列。
296.根据实施方式293-295中任一项所述的方法,其中所述靶细胞、细胞系或组织选自CNS、心脏、肺、气管、食道、肌肉、骨、软骨、胃、胰腺、肠、肝脏、膀胱、肾脏、输尿管、尿道、子宫、输卵管、卵巢、睾丸、前列腺、眼睛、血液、淋巴和口腔粘膜。
297.根据实施方式293-295中任一项所述的方法,其中所述靶细胞选自神经元、神经胶质细胞、星形胶质细胞、少突胶质细胞、小神经胶质细胞、雪旺细胞、室管膜细胞、肝细胞、星状脂肪储存细胞、枯否氏细胞、肝内皮细胞、上皮细胞、心肌细胞、平滑肌细胞、T细胞、B细胞、造血干细胞和胚胎干细胞。
298.根据实施方式296所述的方法,其中所述靶细胞或组织来自肝脏。
299.根据实施方式296所述的方法,其中所述靶细胞或组织来自CNS。
300.一种药物组合物,其包含实施方式135-211中任一项所述的变体和药学上可接受的载体。
301.根据实施方式116所述的文库,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV1血清型的衣壳蛋白的氨基酸位置590处。
302.根据实施方式116所述的文库,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV1血清型的衣壳蛋白的氨基酸位置590处。
303.根据实施方式302所述的文库,其中所述肽包含SEQ ID NO:68-75中任一项的氨基酸序列。
304.根据实施方式302所述的文库,其中所述肽包含氨基酸序列SEQ ID NO:71。
305.根据实施方式301所述的文库,其中所述肽包含选自由SEQ ID NO:1、SEQ IDNO:2和SEQ ID NO:3中任一项组成的组的氨基酸序列。
306.根据实施方式116所述的文库,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV6血清型的衣壳蛋白的氨基酸位置454处。
307.根据实施方式116所述的文库,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV6血清型的衣壳蛋白的氨基酸位置454处。
308.根据实施方式116所述的文库,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV6血清型的衣壳蛋白的氨基酸位置590处。
309.根据实施方式116所述的文库,其中包含SEQ ID NO:68-110任一项的氨基酸序列的肽被插入在AAV6血清型的衣壳蛋白的氨基酸位置590处。
310.根据实施方式306和308中任一项所述的文库,其中所述肽包含SEQ ID NO:19至SEQ ID NO:27中任一项的氨基酸序列。
311.根据实施方式116所述的文库,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV2血清型的衣壳蛋白的氨基酸位置588处。
312.根据实施方式116所述的文库,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV2血清型的衣壳蛋白的氨基酸位置588处。
313.根据实施方式312所述的文库,其中所述肽包含选自由SEQ ID NO:90至SEQID NO:110中任一项组成的组的氨基酸序列。
314.根据实施方式312所述的文库,其中所述肽包含选自由SEQ ID NO:95、SEQ IDNO:94、SEQ ID NO:96、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:106、SEQ ID NO:91和SEQ ID NO:102中任一项组成的组的氨基酸序列。
315.根据实施方式311所述的文库,其中所述肽包含选自由SEQ ID NO:4-7中任一项组成的组的氨基酸序列。
316.根据实施方式116所述的文库,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV3B血清型的衣壳蛋白的氨基酸位置589处。
317.根据实施方式116所述的文库,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV3B血清型的衣壳蛋白的氨基酸位置589处。
318.根据实施方式317所述的文库,其中所述肽包含选自由SEQ ID NO:76-85中任一项组成的组的氨基酸序列。
319.根据实施方式317所述的文库,其中所述肽包含选自由SEQ ID NO:78、SEQ IDNO:80、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:76和SEQ ID NO:83中任一项组成的组的氨基酸序列。
320.根据实施方式316所述的文库,其中所述肽包含选自由SEQ ID NO:8至SEQ IDNO:11中任一项组成的组的氨基酸序列。
321.根据实施方式116所述的文库,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV5血清型的衣壳蛋白的氨基酸位置578处。
322.根据实施方式116所述的文库,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入AAV5血清型的衣壳蛋白的氨基酸位置578处。
323.根据实施方式321所述的文库,其中所述肽包含选自由SEQ ID NO:28至SEQID NO:32中任一项组成的组的氨基酸序列。
324.根据实施方式116所述的文库,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV8血清型的衣壳蛋白的氨基酸位置591处。
325.根据实施方式116所述的文库,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV8血清型的衣壳蛋白的氨基酸位置591处。
326.根据实施方式116所述的文库,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置266处。
327.根据实施方式116所述的文库,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置266处。
328.根据实施方式116所述的文库,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置455处。
329.根据实施方式116所述的文库,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置455处。
330.根据实施方式116所述的文库,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置589处。
331.根据实施方式116所述的文库,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置589处。
332.根据实施方式326、328和330中任一项所述的文库,其中所述肽包含选自由SEQ ID NO:12至SEQ ID NO:18中任一项组成的组的氨基酸序列。
333.根据实施方式327、329和331中任一项所述的文库,其中所述肽包含选自由SEQ ID NO:86至SEQ ID NO:89中任一项组成的组的氨基酸序列。
334.根据实施方式327、329和331中任一项所述的文库,其中所述肽包含SEQ IDNO:89的序列。
335.根据实施方式173所述的AAV变体,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV1血清型的衣壳蛋白的氨基酸位置590处。
336.根据实施方式173所述的AAV变体,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV1血清型的衣壳蛋白的氨基酸位置590处。
337.根据实施方式336所述的AAV变体,其中所述肽包含选自由SEQ ID NO:68至SEQ ID NO:75中任一项组成的组的氨基酸序列。
338.根据实施方式336所述的AAV变体,其中所述肽包含氨基酸序列SEQ ID NO:71。
339.根据实施方式335所述的AAV变体,其中所述肽包含选自由SEQ ID NO:1、SEQID NO:2和SEQ ID NO:3中任一项组成的组的氨基酸序列。
340.根据实施方式173所述的AAV变体,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV6血清型的衣壳蛋白的氨基酸位置454处。
341.根据实施方式173所述的AAV变体,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV6血清型的衣壳蛋白的氨基酸位置454处。
342.根据实施方式173所述的AAV变体,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV6血清型的衣壳蛋白的氨基酸位置590处。
343.根据实施方式173所述的AAV变体,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV6血清型的衣壳蛋白的氨基酸位置590处。
344.根据实施方式340和342中任一项所述的AAV变体,其中所述肽包含选自由SEQID NO:19至SEQ ID NO:27中任一项组成的组的氨基酸序列。
345.根据实施方式173所述的AAV变体,其中包含SEQ ID NO:1-32的氨基酸序列的肽被插入在AAV2血清型的衣壳蛋白的氨基酸位置588处。
346.根据实施方式173所述的AAV变体,其中包含SEQ ID NO:68-110的氨基酸序列的肽被插入在AAV2血清型的衣壳蛋白的氨基酸位置588处。
347.根据实施方式346所述的AAV变体,其中所述肽包含选自由SEQ ID NO:90至SEQ ID NO:110中任一项组成的组的氨基酸序列。
348.根据实施方式346所述的AAV变体,其中所述肽包含选自由SEQ ID NO:95、SEQID NO:94、SEQ ID NO:96、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:106、SEQ ID NO:91和SEQ ID NO:102中任一项组成的组的氨基酸序列。
349.根据实施方式345所述的AAV变体,其中所述肽包含选自由SEQ ID NO:4-7中任一项组成的组的氨基酸序列。
350.根据实施方式173所述的AAV变体,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV3B血清型的衣壳蛋白的氨基酸位置589处。
351.根据实施方式173所述的AAV变体,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV3B血清型的衣壳蛋白的氨基酸位置589处。
352.根据实施方式351所述的AAV变体,其中所述肽包含选自由SEQ ID NO:78、SEQID NO:80、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:76和SEQ ID NO:83中任一项组成的组的氨基酸序列。
353.根据实施方式350所述的AAV变体,其中所述肽包含选自由SEQ ID NO:8至SEQID NO:11中任一项组成的组的氨基酸序列。
354.根据实施方式173所述的AAV变体,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV5血清型的衣壳蛋白的氨基酸位置578处。
355.根据实施方式173所述的AAV变体,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV5血清型的衣壳蛋白的氨基酸位置578处。
356.根据实施方式354所述的AAV变体,其中所述肽包含选自由SEQ ID NO:28至SEQ ID NO:32中任一项组成的组的氨基酸序列。
357.根据实施方式173所述的AAV变体,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV8血清型的衣壳蛋白的氨基酸位置591处。
358.根据实施方式173所述的AAV变体,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV8血清型的衣壳蛋白的氨基酸位置591处。
359.根据实施方式173所述的AAV变体,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置266处。
360.根据实施方式173所述的AAV变体,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置266处。
361.根据实施方式173所述的AAV变体,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置455处。
362.根据实施方式173所述的AAV变体,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置455处。
363.根据实施方式173所述的AAV变体,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置589处。
364.根据实施方式173所述的AAV变体,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置589处。
365.根据实施方式359、361和363中任一项所述的AAV变体,其中所述肽包含选自由SEQ ID NO:12至SEQ ID NO:18中任一项组成的组的氨基酸序列。
366.根据实施方式360、362和364中任一项所述的AAV变体,其中所述肽包含选自由SEQ ID NO:86至SEQ ID NO:89中任一项组成的组的氨基酸序列。
367.根据实施方式360、362和364中任一项所述的AAV变体,其中所述肽包含SEQID NO:89的序列。
368.根据实施方式247所述的AAV载体,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV1血清型的衣壳蛋白的氨基酸位置590处。
369.根据实施方式247所述的AAV载体,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV1血清型的衣壳蛋白的氨基酸位置590处。
370.根据实施方式369所述的AAV载体,其中所述肽包含选自由SEQ ID NO:68至SEQ ID NO:75中任一项组成的组的氨基酸序列。
371.根据实施方式369所述的AAV载体,其中所述肽包含氨基酸序列SEQ ID NO:71。
372.根据实施方式368所述的AAV载体,其中所述肽包含选自由SEQ ID NO:1、SEQID NO:2和SEQ ID NO:3中任一项组成的组的氨基酸序列。
373.根据实施方式247所述的AAV载体,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV6血清型的衣壳蛋白的氨基酸位置454处。
374.根据实施方式247所述的AAV载体,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV6血清型的衣壳蛋白的氨基酸位置454处。
375.根据实施方式247所述的AAV载体,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV6血清型的衣壳蛋白的氨基酸位置590处。
376.根据实施方式247所述的AAV载体,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV6血清型的衣壳蛋白的氨基酸位置590处。
377.根据实施方式373和375中任一项所述的AAV载体,其中所述肽包含选自由SEQID NO:19至SEQ ID NO:27中任一项组成的组的氨基酸序列。
378.根据实施方式247所述的AAV载体,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV2血清型的衣壳蛋白的氨基酸位置588处。
379.根据实施方式247所述的AAV载体,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV2血清型的衣壳蛋白的氨基酸位置588处。
380.根据实施方式379所述的AAV载体,其中所述肽包含选自由SEQ ID NO:90至SEQ ID NO:110中任一项组成的组的氨基酸序列。
381.根据实施方式379所述的AAV载体,其中所述肽包含选自由SEQ ID NO:95、SEQID NO:94、SEQ ID NO:96、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:106、SEQ ID NO:91和SEQ ID NO:102中任一项组成的组的氨基酸序列。
382.根据实施方式378所述的AAV载体,其中所述肽包含选自由SEQ ID NO:4-7中任一项组成的组的氨基酸序列。
383.根据实施方式247所述的AAV载体,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV3B血清型的衣壳蛋白的氨基酸位置589处。
384.根据实施方式247所述的AAV载体,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV3B血清型的衣壳蛋白的氨基酸位置589处。
385.根据实施方式384所述的AAV载体,其中所述肽包含选自由SEQ ID NO:78、SEQID NO:80、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:76和SEQ ID NO:83中任一项组成的组的氨基酸序列。
386.实施方式383的AAV载体,其中所述肽包含选自由SEQ ID NO:8至SEQ ID NO:11中任一项组成的组的氨基酸序列。
387.根据实施方式247所述的AAV载体,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV5血清型的衣壳蛋白的氨基酸位置578处。
388.根据实施方式247所述的AAV载体,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV5血清型的衣壳蛋白的氨基酸位置578处。
389.根据实施方式387所述的AAV载体,其中所述肽包含选自由SEQ ID NO:28至SEQ ID NO:32中任一项组成的组的氨基酸序列。
390.根据实施方式247所述的AAV载体,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV8血清型的衣壳蛋白的氨基酸位置591处。
391.根据实施方式247所述的AAV载体,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV8血清型的衣壳蛋白的氨基酸位置591处。
392.根据实施方式247所述的AAV载体,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置266处。
393.根据实施方式247所述的AAV载体,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置266处。
394.根据实施方式247所述的AAV载体,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置455处。
395.根据实施方式247所述的AAV载体,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置455处。
396.根据实施方式247所述的AAV载体,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置589处。
397.根据实施方式247所述的AAV载体,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置589处。
398.根据实施方式392、394和396中任一项所述的AAV载体,其中所述肽包含选自由SEQ ID NO:12至SEQ ID NO:18中任一项组成的组的氨基酸序列。
399.根据实施方式393、395和397中任一项所述的AAV载体,其中所述肽包含选自由SEQ ID NO:86至SEQ ID NO:89中任一项组成的组的氨基酸序列。
400.根据实施方式393、395和397中任一项所述的AAV载体,其中所述肽包含SEQID NO:89的序列。
401.一种包含插入肽的衣壳蛋白,其中所述肽被插入于:
(i)AAV1衣壳蛋白的氨基酸位置590处,
(ii)AAV6衣壳蛋白的氨基酸位置454或590处,
(iii)AAV2衣壳蛋白的氨基酸位置588处,
(iv)AAV3B衣壳蛋白的氨基酸位置589处,
(v)AAV5衣壳蛋白的氨基酸位置578处,
(vi)AAV8衣壳蛋白的氨基酸位置591处,或
(vi)AAV9衣壳蛋白的氨基酸位置266、455或589处,
其中所述位置对应于AAV血清型中VP1的编号。
402.根据实施方式401所述的衣壳蛋白,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV1血清型衣壳蛋白的氨基酸位置590处。
403.根据实施方式401所述的衣壳蛋白,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV1血清型衣壳蛋白的氨基酸位置590处。
404.根据实施方式403所述的衣壳蛋白,其中所述肽包含选自由SEQ ID NO:68至SEQ ID NO:75中任一项组成的组的氨基酸序列。
405.根据实施方式403所述的衣壳蛋白,其中所述肽包含氨基酸序列SEQ ID NO:71。
406.根据实施方式402所述的衣壳蛋白,其中所述肽包含选自由SEQ ID NO:1、SEQID NO:2和SEQ ID NO:3中任一项组成的组的氨基酸序列。
407.根据实施方式401所述的衣壳蛋白,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV6血清型的衣壳蛋白的氨基酸位置454处。
408.根据实施方式401所述的衣壳蛋白,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV6血清型的衣壳蛋白的氨基酸位置454处。
409.根据实施方式401所述的衣壳蛋白,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV6血清型的衣壳蛋白的氨基酸位置590处。
410.根据实施方式401所述的衣壳蛋白,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV6血清型的衣壳蛋白的氨基酸位置590处。
411.根据实施方式407和409中任一项所述的衣壳蛋白,其中所述肽包含选自由SEQ ID NO:19至SEQ ID NO:27中任一项组成的组的氨基酸序列。
412.根据实施方式401所述的衣壳蛋白,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV2血清型的衣壳蛋白的氨基酸位置588处。
413.根据实施方式401所述的衣壳蛋白,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV2血清型的衣壳蛋白的氨基酸位置588处。
414.根据实施方式413所述的衣壳蛋白,其中所述肽包含选自由SEQ ID NO:90至SEQ ID NO:110中任一项组成的组的氨基酸序列。
415.根据实施方式413所述的衣壳蛋白,其中所述肽包含选自由SEQ ID NO:95、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:106、SEQ IDNO:91和SEQ ID NO:102中任一项组成的组的氨基酸序列。
416.根据实施方式412所述的衣壳蛋白,其中所述肽包含选自由SEQ ID NO:4-7中任一项组成的组的氨基酸序列。
417.根据实施方式401所述的衣壳蛋白,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV3B血清型的衣壳蛋白的氨基酸位置589处。
418.根据实施方式401所述的衣壳蛋白,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV3B血清型的衣壳蛋白的氨基酸位置589处。
419.根据实施方式418所述的衣壳蛋白,其中所述肽包含选自由SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:76和SEQ ID NO:83中任一项组成的组的氨基酸序列。
420.根据实施方式417所述的衣壳蛋白,其中所述肽包含选自由SEQ ID NO:8至SEQ ID NO:11中任一项组成的组的氨基酸序列。
421.根据实施方式401所述的衣壳蛋白,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽插入在AAV5血清型的衣壳蛋白的氨基酸位置578处。
422.根据实施方式401所述的衣壳蛋白,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽插入在AAV5血清型的衣壳蛋白的氨基酸位置578处。
423.根据实施方式421所述的衣壳蛋白,其中所述肽包含选自由SEQ ID NO:28至SEQ ID NO:32中任一项组成的组的氨基酸序列。
424.根据实施方式401的衣壳蛋白,其中包含SEQ ID NO:1-32的氨基酸序列的肽插入在AAV8血清型的衣壳蛋白的氨基酸位置591处。
425.根据实施方式401所述的衣壳蛋白,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽插入在AAV8血清型的衣壳蛋白的氨基酸位置591处。
426.根据实施方式401所述的衣壳蛋白,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽插入在AAV9血清型的衣壳蛋白的氨基酸位置266处。
427.根据实施方式401所述的衣壳蛋白,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽插入在AAV9血清型的衣壳蛋白的氨基酸位置266处。
428.根据实施方式401所述的衣壳蛋白,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽插入在AAV9血清型的衣壳蛋白的氨基酸位置455处。
429.根据实施方式401所述的衣壳蛋白,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽插入在AAV9血清型的衣壳蛋白的氨基酸位置455处。
430.根据实施方式401所述的衣壳蛋白,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽插入在AAV9血清型的衣壳蛋白的氨基酸位置589处。
431.根据实施方式401所述的衣壳蛋白,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽插入在AAV9血清型的衣壳蛋白的氨基酸位置589处。
432.根据实施方式426、428和430中任一项所述的衣壳蛋白,其中所述肽包含选自由SEQ ID NO:12至SEQ ID NO:18中任一项组成的组的氨基酸序列。
433.根据实施方式427、429和431中任一项所述的衣壳蛋白,其中所述肽包含选自由SEQ ID NO:86至SEQ ID NO:89中任一项组成的组的氨基酸序列。
434.根据实施方式427、429和431中任一项所述的衣壳蛋白,其中所述肽包含SEQID NO:89的序列。
435.一种编码实施方式401至434中任一项所述的衣壳蛋白的核酸分子。
序列表
<110> SANGAMO THERAPEUTICS, INC.
<120> AAV工程化
<130> 000222-0002-WO1
<140>
<141>
<150> 62/939,094
<151> 2019-11-22
<150> 62/915,386
<151> 2019-10-15
<150> 62/839,421
<151> 2019-04-26
<160> 205
<170> PatentIn version 3.5
<210> 1
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 1
Lys Ser Pro Gln Ser Lys Val
1 5
<210> 2
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 2
Ser Asp Leu Arg Ser Lys Val
1 5
<210> 3
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 3
Thr Thr Thr Val Arg Lys Val
1 5
<210> 4
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 4
Gly Arg Ser Asp Met Ala Gly
1 5
<210> 5
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 5
Leu Leu Ser Ser Glu Arg Ser
1 5
<210> 6
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 6
Glu Gln Arg Pro Asn Val Ser
1 5
<210> 7
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 7
Thr Arg Gln Ile Ser Ser Asp
1 5
<210> 8
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 8
Gln Gly Ala Leu Ala Gln Val
1 5
<210> 9
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 9
Tyr Pro Ser Ser Asn Thr Pro
1 5
<210> 10
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 10
Met Leu Asn Pro Arg Thr Glu
1 5
<210> 11
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 11
Gln Met Arg Thr Arg Asp Glu
1 5
<210> 12
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 12
Met Pro Gly Arg Ala Pro Ile
1 5
<210> 13
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 13
Leu Gly Arg Leu Thr Ala Asn
1 5
<210> 14
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 14
Ser Tyr Ser Thr Ser Arg Ser
1 5
<210> 15
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 15
Thr Arg Pro Ser Ser Thr Asn
1 5
<210> 16
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 16
Val Pro Gln Ser Ser Ser Arg
1 5
<210> 17
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 17
Val Ser Arg Ser Tyr Pro Ala
1 5
<210> 18
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 18
Gln Arg Ala Arg Pro Asp Thr
1 5
<210> 19
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 19
Ser Gln Leu Thr Pro His Ser
1 5
<210> 20
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 20
Leu Gly Ser His Leu Pro Ser
1 5
<210> 21
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 21
Tyr Thr Leu Ser Ser Gly Gln
1 5
<210> 22
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 22
Ser Ser Arg Ile Pro Pro Asp
1 5
<210> 23
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 23
Trp Thr Glu Thr Ile Pro Arg
1 5
<210> 24
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 24
His Gly Leu Gln Gly Val Ala
1 5
<210> 25
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 25
Thr Met Arg Val Ser Asp Gln
1 5
<210> 26
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 26
Gly Ser Ser Lys Val Val Met
1 5
<210> 27
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 27
Ser Ala Leu Asp Arg Gly Val
1 5
<210> 28
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 28
Lys Glu Leu Gly Thr Gln Arg
1 5
<210> 29
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 29
Arg Ser Ser Asp Val Gln Arg
1 5
<210> 30
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 30
Pro Ser Ala Pro Lys Thr Phe
1 5
<210> 31
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 31
His Thr Lys Arg Ser Glu Tyr
1 5
<210> 32
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 32
Ile Lys Gly Ser Asn Leu Pro
1 5
<210> 33
<211> 19
<212> DNA
<213> 腺相关病毒
<400> 33
taaccctgtg gccaccgaa 19
<210> 34
<211> 21
<212> DNA
<213> 腺相关病毒
<400> 34
gacgtgtacc tgcagggtcc c 21
<210> 35
<211> 19
<212> DNA
<213> 腺相关病毒
<400> 35
caatcccgtg gctacggag 19
<210> 36
<211> 21
<212> DNA
<213> 腺相关病毒
<400> 36
gatgtgtacc ttcaggggcc c 21
<210> 37
<211> 19
<212> DNA
<213> 腺相关病毒
<400> 37
caatcctgtg gcaacagag 19
<210> 38
<211> 21
<212> DNA
<213> 腺相关病毒
<400> 38
gacgtgtacc ttcaaggacc t 21
<210> 39
<211> 19
<212> DNA
<213> 腺相关病毒
<400> 39
taaccccgtg gccaccgaa 19
<210> 40
<211> 21
<212> DNA
<213> 腺相关病毒
<400> 40
gacgtatacc tgcagggtcc t 21
<210> 41
<211> 19
<212> DNA
<213> 腺相关病毒
<400> 41
taaccctgtg gctacagag 19
<210> 42
<211> 21
<212> DNA
<213> 腺相关病毒
<400> 42
gacgtgtacc tgcagggtcc c 21
<210> 43
<211> 19
<212> DNA
<213> 腺相关病毒
<400> 43
taacccggta gcaacggag 19
<210> 44
<211> 21
<212> DNA
<213> 腺相关病毒
<400> 44
gatgtgtacc tgcaaggacc c 21
<210> 45
<211> 2211
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成多核苷酸"
<400> 45
atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60
gagtggtggg acttgaaacc tggagccccg aagcccaaag ccaaccagca aaagcaggac 120
gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180
aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aagcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300
caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaagaagc gggttctcga acctctcggt ctggttgagg aaggcgctaa gacggctcct 420
ggaaagaaac gtccggtaga gcagtcgcca caagagccag actcctcctc gggcatcggc 480
aagacaggcc agcagcccgc taaaaagaga ctcaattttg gtcagactgg cgactcagag 540
tcagtccccg atccacaacc tctcggagaa cctccagcaa cccccgctgc tgtgggacct 600
actacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660
gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720
accaccagca cccgcacctg ggccttgccc acctacaata accacctcta caagcaaatc 780
tccagtgctt caacgggggc cagcaacgac aaccactact tcggctacag caccccctgg 840
gggtattttg atttcaacag attccactgc cacttttcac cacgtgactg gcagcgactc 900
atcaacaaca attggggatt ccggcccaag agactcaact tcaaactctt caacatccaa 960
gtcaaggagg tcacgacgaa tgatggcgtc acaaccatcg ctaataacct taccagcacg 1020
gttcaagtct tctcggactc ggagtaccag cttccgtacg tcctcggctc tgcgcaccag 1080
ggctgcctcc ctccgttccc ggcggacgtg ttcatgattc cgcaatacgg ctacctgacg 1140
ctcaacaatg gcagccaagc cgtgggacgt tcatcctttt actgcctgga atatttccct 1200
tctcagatgc tgagaacggg caacaacttt accttcagct acacctttga ggaagtgcct 1260
ttccacagca gctacgcgca cagccagagc ctggaccggc tgatgaatcc tctcatcgac 1320
cagtacctgt attacctgaa cagaactcaa aatcagtccg gaagtgccca aaacaaggac 1380
ttgctgttta gccgtggatc tccagctggc atgtctgttc agcccaaaaa ctggctacct 1440
ggaccctgtt accggcagca gcgcgtttct aaaacaaaaa cagacaacaa caacagcaat 1500
tttacctgga ctggtgcttc aaaatataac ctcaatgggc gtgaatccat catcaaccct 1560
ggcactgcta tggcctcaca caaagacgac gaagacaagt tctttcccat gagcggtgtc 1620
atgatttttg gaaaagagag cgccggagct tcaaacactg cattggacaa tgtcatgatt 1680
acagacgaag aggaaattaa agccactaac cccgtggcca ccgaaagatt tgggaccgtg 1740
gcagtcaatt tccagagcag cagcacagac cctgcgaccg gagatgtgca tgctatggga 1800
gcattacctg gcatggtgtg gcaagataga gacgtatacc tgcagggtcc tatttgggcc 1860
aaaattcctc acacagatgg acactttcac ccgtctcctc ttatgggcgg ctttggactc 1920
aagaacccgc ctcctcagat cctcatcaaa aacacgcctg ttcctgcgaa tcctccggcg 1980
gagttttcag ctacaaagtt tgcttcattc atcacccaat actccacagg acaagtgagc 2040
gtggagattg aatgggagct gcagaaagaa aacagcaagc gctggaatcc cgaagtgcag 2100
tacacatcca attatgcaaa atctgccaac gttgatttta ctgtggacaa caatggactt 2160
tatactgagc ctcgccccat tggcacccgt taccttaccc gtcccctgta a 2211
<210> 46
<211> 2208
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成多核苷酸"
<400> 46
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420
ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480
aaggcgggcc agcagcctgc aagaaaaaga ctcaattttg gtcagactgg cgacgcagac 540
tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600
aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660
gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780
tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccctggggg 840
tattttgatt tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900
aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960
aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020
caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaaggc 1080
tgcctccctc cgttcccggc ggacgtcttc atggtgccac agtatggata cctcaccctg 1140
aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200
cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260
cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320
tacctgtatt acctgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380
cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440
ccctgttacc ggcagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500
tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560
ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620
atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680
gacgaagagg aaatcaggac aactaacccc gtggccaccg aacagtatgg ttctgtatct 1740
accaacctcc agagaggcaa cagacaagca gctaccgcag atgtcaacac acaaggcgtt 1800
cttccaggca tggtctggca ggacagagac gtatacctgc agggtcctat ttgggcaaag 1860
attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920
caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980
ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca ggtcagcgtg 2040
gagattgaat gggagctgca gaaggaaaac agcaaacgct ggaatcccga aattcagtac 2100
acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2160
tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208
<210> 47
<211> 2211
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成多核苷酸"
<400> 47
atggctgctg acggttatct tccagattgg ctcgaggaca acctttctga aggcattcgt 60
gagtggtggg ctctgaaacc tggagtccct caacccaaag cgaaccaaca acaccaggac 120
aaccgtcggg gtcttgtgct tccgggttac aaatacctcg gacccggtaa cggactcgac 180
aaaggagagc cggtcaacga ggcggacgcg gcagccctcg aacacgacaa agcctacgac 240
cagcagctca aggccggtga caacccgtac ctcaagtaca accacgccga cgccgagttt 300
caggagcgtc ttcaagaaga tacgtctttt gggggcaacc ttggcagagc agtcttccag 360
gccaaaaaga ggatccttga gcctcttggt ctggttgagg aagcagctaa aacggctcct 420
ggaaagaaga ggcctgtaga tcagtctcct caggaaccgg actcatcatc tggtgttggc 480
aaatcgggca aacagcctgc cagaaaaaga ctcaattttg gtcagactgg cgactcagag 540
tcagtcccag accctcaacc tctcggagaa ccaccagcag cccccacaag tttgggatct 600
aatacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaggg tgccgatgga 660
gtgggtaatt cctcaggaaa ttggcattgc gattcccaat ggctgggcga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acttacaaca accatctcta caagcaaatc 780
tccagccaat caggagcttc aaacgacaac cactactttg gctacagcac cccctggggg 840
tattttgatt tcaacagatt ccactgccac ttctcaccac gtgactggca gcgactcatt 900
aacaacaact ggggattccg gcccaagaaa ctcagcttca agctcttcaa catccaagtt 960
aaagaggtca cgcagaacga tggcacgacg actattgcca ataaccttac cagcacggtt 1020
caagtgttta cggactcgga gtatcagctc ccgtacgtgc tcgggtcggc gcaccaaggc 1080
tgcctccctc cgttcccggc ggacgtcttc atggtccctc agtatggata cctcaccctg 1140
aacaacggaa gtcaagcggt gggacgctca tccttttact gcctggagta cttcccttcg 1200
cagatgctaa ggactggaaa taacttccaa ttcagctata ccttcgagga tgtacctttt 1260
cacagcagct acgctcacag ccagagtttg gatcgcttga tgaatcctct catcgaccag 1320
tacctgtatt acctgaacag aacgcaagga acaacctctg gaacaaccaa ccaatcacgg 1380
ctgcttttta gccaggctgg gcctcagtct atgtctttgc aggccagaaa ttggctacct 1440
ggaccctgtt accggcagca gagactttca aagactgcta acgacaacaa caacagtaac 1500
tttccttgga cagcggccag caaatatcat ctcaatggcc gcgactcgct ggtgaatcca 1560
ggaccagcta tggccagtca caaggacgat gaagaaaaat ttttccctat gcacggcaat 1620
ctaatatttg gcaaagaagg gacaacggca agtaacgcag aattagataa tgtaatgatt 1680
acggatgaag aagagattcg taccactaac cccgtggcca ccgaacagta tggaactgtg 1740
gcaaataact tgcagagctc aaatacagct cccacgacta gaactgtcaa tgatcagggg 1800
gccttacctg gcatggtgtg gcaagatcgt gacgtatacc tgcagggtcc tatttgggca 1860
aagattcctc acacggatgg acactttcat ccttctcctc tgatgggagg ctttggactg 1920
aaacatccgc ctcctcaaat catgatcaaa aatactccgg taccggcaaa tcctccgacg 1980
actttcagcc cggccaagtt tgcttcattt atcactcagt actccactgg acaggtcagc 2040
gtggagattg aatgggagct gcagaaagaa aacagcaaac gttggaatcc agagattcag 2100
tacacttcca actacaacaa gtctgttaat gtggacttta ctgtagacac taatggtgtt 2160
tatagtgaac ctcgccctat tggaacccgg tatctcacac gaaacttgtg a 2211
<210> 48
<211> 2175
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成多核苷酸"
<400> 48
atgtcttttg ttgatcaccc tccagattgg ttggaagaag ttggtgaagg tcttcgcgag 60
tttttgggcc ttgaagcggg cccaccgaaa ccaaaaccca atcagcagca tcaagatcaa 120
gcccgtggtc ttgtgctgcc tggttataac tatctcggac ccggaaacgg actcgatcga 180
ggagagcctg tcaacagggc agacgaggtc gcgcgagagc acgacatctc gtacaacgag 240
cagcttgagg cgggagacaa cccctacctc aagtacaacc acgcggacgc cgagtttcag 300
gagaagctcg ccgacgacac atccttcggg ggaaacctcg gaaaggcagt ctttcaggcc 360
aagaaaaggg ttctcgaacc ttttggcctg gttgaagagg gtgctaagac ggcccctacc 420
ggaaagcgga tagacgacca ctttccaaaa agaaagaagg ctcggaccga agaggactcc 480
aagccttcca cctcgtcaga cgccgaagct ggacccagcg gatcccagca gctgcaaatc 540
ccagcccaac cagcctcaag tttgggagct gatacaatgt ctgcgggagg tggcggccca 600
ttgggcgaca ataaccaagg tgccgatgga gtgggcaatg cctcgggaga ttggcattgc 660
gattccacgt ggatggggga cagagtcgtc accaagtcca cccgaacctg ggtgctgccc 720
agctacaaca accaccagta ccgagagatc aaaagcggct ccgtcgacgg aagcaacgcc 780
aacgcctact ttggatacag caccccctgg gggtactttg actttaaccg cttccacagc 840
cactggagcc cccgagactg gcaaagactc atcaacaact actggggctt cagaccccgg 900
tccctcagag tcaaaatctt caacattcaa gtcaaagagg tcacggtgca ggactccacc 960
accaccatcg ccaacaacct cacctccacc gtccaagtgt ttacggacga cgactaccag 1020
ctgccctacg tcgtcggcaa cgggaccgag ggatgcctgc cggccttccc tccgcaggtc 1080
tttacgctgc cgcagtacgg ttacgcgacg ctgaaccgcg acaacacaga aaatcccacc 1140
gagaggagca gcttcttctg cctagagtac tttcccagca agatgctgag aacgggcaac 1200
aactttgagt ttacctacaa ctttgaggag gtgcccttcc actccagctt cgctcccagt 1260
cagaacctgt tcaagctggc caacccgctg gtggaccagt acttgtaccg cttcgtgagc 1320
acaaataaca ctggcggagt ccagttcaac aagaacctgg ccgggagata cgccaacacc 1380
tacaaaaact ggttcccggg gcccatgggc cgaacccagg gctggaacct gggctccggg 1440
gtcaaccgcg ccagtgtcag cgccttcgcc acgaccaata ggatggagct cgagggcgcg 1500
agttaccagg tgcccccgca gccgaacggc atgaccaaca acctccaggg cagcaacacc 1560
tatgccctgg agaacactat gatcttcaac agccagccgg cgaacccggg caccaccgcc 1620
acgtacctcg agggcaacat gctcatcacc agcgagagcg agacgcagcc ggtgaaccgc 1680
gtggcgtaca acgtcggcgg gcagatggcc accaacaacc agagctccac cactgccccc 1740
gcgaccggca cgtacaacct ccaggaaatc gtgcccggca gcgtgtggat ggagagggac 1800
gtgtacctcc aaggacccat ctgggccaag atcccagaga cgggggcgca ctttcacccc 1860
tctccggcca tgggcggatt cggactcaaa cacccaccgc ccatgatgct catcaagaac 1920
acgcctgtgc ccggaaatat caccagcttc tcggacgtgc ccgtcagcag cttcatcacc 1980
cagtacagca ccgggcaggt caccgtggag atggagtggg agctcaagaa ggaaaactcc 2040
aagaggtgga acccagagat ccagtacaca aacaactaca acgaccccca gtttgtggac 2100
tttgccccgg acagcaccgg ggaatacaga accaccagac ctatcggaac ccgatacctt 2160
acccgacccc tttaa 2175
<210> 49
<211> 2211
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成多核苷酸"
<400> 49
atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60
gagtggtggg acttgaaacc tggagccccg aaacccaaag ccaaccagca aaagcaggac 120
gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180
aagggggagc ccgtcaacgc ggcggatgca gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aagcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300
caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaagaaga gggttctcga accttttggt ctggttgagg aaggtgctaa gacggctcct 420
ggaaagaaac gtccggtaga gcagtcgcca caagagccag actcctcctc gggcattggc 480
aagacaggcc agcagcccgc taaaaagaga ctcaattttg gtcagactgg cgactcagag 540
tcagtccccg acccacaacc tctcggagaa cctccagcaa cccccgctgc tgtgggacct 600
actacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660
gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720
accaccagca cccgaacatg ggccttgccc acctataaca accacctcta caagcaaatc 780
tccagtgctt caacgggggc cagcaacgac aaccactact tcggctacag caccccctgg 840
gggtattttg atttcaacag attccactgc catttctcac cacgtgactg gcagcgactc 900
atcaacaaca attggggatt ccggcccaag agactcaact tcaagctctt caacatccaa 960
gtcaaggagg tcacgacgaa tgatggcgtc acgaccatcg ctaataacct taccagcacg 1020
gttcaagtct tctcggactc ggagtaccag ttgccgtacg tcctcggctc tgcgcaccag 1080
ggctgcctcc ctccgttccc ggcggacgtg ttcatgattc cgcagtacgg ctacctaacg 1140
ctcaacaatg gcagccaggc agtgggacgg tcatcctttt actgcctgga atatttccca 1200
tcgcagatgc tgagaacggg caataacttt accttcagct acaccttcga ggacgtgcct 1260
ttccacagca gctacgcgca cagccagagc ctggaccggc tgatgaatcc tctcatcgac 1320
cagtacctgt attacctgaa cagaactcag aatcagtccg gaagtgccca aaacaaggac 1380
ttgctgttta gccggggctc tccagctggc atgtctgttc agcccaaaaa ctggctacct 1440
ggaccctgtt accggcagca gcgcgtttct aaaacaaaaa cagacaacaa caacagcaac 1500
tttacctgga ctggtgcttc aaaatataac cttaatgggc gtgaatctat aatcaaccct 1560
ggcactgcta tggcctcaca caaagacgac aaagacaagt tctttcccat gagcggtgtc 1620
atgatttttg gaaaggagag cgccggagct tcaaacactg cattggacaa tgtcatgatc 1680
acagacgaag aggaaatcaa agccactaac cccgtggcca ccgaaagatt tgggactgtg 1740
gcagtcaatc tccagagcag cagcacagac cctgcgaccg gagatgtgca tgttatggga 1800
gccttacctg gaatggtgtg gcaagacaga gacgtatacc tgcagggtcc tatttgggcc 1860
aaaattcctc acacggatgg acactttcac ccgtctcctc tcatgggcgg ctttggactt 1920
aagcacccgc ctcctcagat cctcatcaaa aacacgcctg ttcctgcgaa tcctccggca 1980
gagttttcgg ctacaaagtt tgcttcattc atcacccagt attccacagg acaagtgagc 2040
gtggagattg aatgggagct gcagaaagaa aacagcaaac gctggaatcc cgaagtgcag 2100
tatacatcta actatgcaaa atctgccaac gttgatttca ctgtggacaa caatggactt 2160
tatactgagc ctcgccccat tggcacccgt tacctcaccc gtcccctgta a 2211
<210> 50
<211> 2217
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成多核苷酸"
<400> 50
atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60
gagtggtggg cgctgaaacc tggagccccg aagcccaaag ccaaccagca aaagcaggac 120
gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180
aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240
cagcagctgc aggcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300
caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaagaagc gggttctcga acctctcggt ctggttgagg aaggcgctaa gacggctcct 420
ggaaagaaga ggccggtaga gccatcaccc cagcgttctc cagactcctc tacgggcatc 480
ggcaagaaag gccaacagcc cgccagaaaa agactcaatt ttggtcagac tggcgactca 540
gagtcagttc cagaccctca acctctcgga gaacctccag cagcgccctc tggtgtggga 600
cctaatacaa tggctgcagg cggtggcgca ccaatggcag acaataacga aggcgccgac 660
ggagtgggta gttcctcggg aaattggcat tgcgattcca catggctggg cgacagagtc 720
atcaccacca gcacccgaac ctgggccctg cccacctaca acaaccacct ctacaagcaa 780
atctccaacg ggacatcggg aggagccacc aacgacaaca cctacttcgg ctacagcacc 840
ccctgggggt attttgattt caacagattc cactgccact tttcaccacg tgactggcag 900
cgactcatca acaacaactg gggattccgg cccaagagac tcagcttcaa gctcttcaac 960
atccaggtca aggaggtcac gcagaatgaa ggcaccaaga ccatcgccaa taacctcacc 1020
agcaccatcc aggtgtttac ggactcggag taccagctgc cgtacgttct cggctctgcc 1080
caccagggct gcctccctcc gttcccggcg gacgtgttca tgattcccca gtacggctac 1140
ctaacactca acaacggtag tcaggccgtg ggacgctcct ccttctactg cctggaatac 1200
tttccttcgc agatgctgag aaccggcaac aacttccagt ttacttacac cttcgaggac 1260
gtgcctttcc acagcagcta cgcccacagc cagagcttgg accggctgat gaatcctctc 1320
atcgaccagt acctgtatta cctgtctcgg actcaaacaa caggaggcac ggcaaatacg 1380
cagactctgg gcttcagcca aggtgggcct aatacaatgg ccaatcaggc aaagaactgg 1440
ctgcctggac cctgttaccg gcagcagcgc gtctcaacga caaccgggca aaacaacaat 1500
agcaactttg cctggactgc tgggaccaaa taccatctga atggaagaaa ttcattggct 1560
aatcctggca tcgctatggc aacacacaaa gacgacgagg agcgtttttt tcccagtaac 1620
gggatcctga tttttggcaa acaaaatgct gccagagaca atgcggatta cagcgatgtc 1680
atgctcacca gcgaggaaga aatcaaaacc actaaccccg tggccaccga agaatacggt 1740
atcgtggcag ataacttgca gcagcaaaac acggctcctc aaattggaac tgtcaacagc 1800
cagggggcct tacccggtat ggtctggcag aaccgggacg tatacctgca gggtcctatt 1860
tgggccaaga ttcctcacac ggacggcaac ttccacccgt ctccgctgat gggcggcttt 1920
ggcctgaaac atcctccgcc tcagatcctg atcaagaaca cgcctgtacc tgcggatcct 1980
ccgaccacct tcaaccagtc aaagctgaac tctttcatca cgcaatacag caccggacag 2040
gtcagcgtgg agattgaatg ggagctgcag aaggaaaaca gcaagcgctg gaaccccgag 2100
atccagtaca cctccaacta ctacaaatct acaagtgtgg actttgctgt taatacagaa 2160
ggcgtgtact ctgaaccccg ccccattggc acccgttacc tcacccgtaa tctgtaa 2217
<210> 51
<211> 2211
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成多核苷酸"
<400> 51
atggctgccg atggttatct tccagattgg ctcgaggaca accttagtga aggaattcgc 60
gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120
aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180
aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300
caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420
ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480
aaatcgggtg cacagcccgc taaaaagaga ctcaattttg gtcagactgg cgacacagag 540
tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600
cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660
gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctgggcga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780
tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840
tgggggtatt ttgatttcaa cagattccac tgccatttct caccacgtga ctggcagcga 900
ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960
caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa ccttaccagc 1020
acggtccagg tcttcacgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080
gagggctgcc tccctccgtt cccggcggac gttttcatga ttcctcagta cgggtatctg 1140
acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct ggaatatttc 1200
ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta 1260
cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa tccactcatc 1320
gaccagtacc tgtattacct gtcaaagact attaacggtt ctggacagaa tcaacaaacg 1380
ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct 1440
ggaccctgtt accggcagca gcgtgtctca accactgtga ctcaaaacaa caacagcgaa 1500
tttgcttggc ctggagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct 1560
ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct 1620
ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata 1680
accaacgaag aagaaattaa aactactaac cccgtggcca ccgaatccta tggacaagtg 1740
gccacaaacc accagagtgc ccaagcacag gcgcagaccg gctgggttca aaaccaagga 1800
atacttccgg gtatggtttg gcaggacaga gacgtatacc tgcagggtcc tatttgggcc 1860
aaaattcctc acacggacgg caactttcac ccttctccgc tgatgggagg gtttggaatg 1920
aagcacccgc ctcctcagat cctcatcaaa aacacacctg tacctgcgga tcctccaacg 1980
gccttcaaca aggacaagct gaactctttc atcacccagt attctactgg ccaagtcagc 2040
gtggagattg aatgggagct gcagaaggaa aacagcaagc gctggaaccc ggagatccag 2100
tacacttcca actattacaa gtctaataat gttgaatttg ctgttaatac tgaaggtgta 2160
tatagtgaac cccgccccat tggcaccaga tacctgactc gtaatctgta a 2211
<210> 52
<211> 45
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成引物"
<220>
<221> 修饰的碱基
<222> (21)..(24)
<223> a, c, t, g, 未知的或其他
<400> 52
acacgacgct cttccgatct nnnnagagtc atcaccacca gcacc 45
<210> 53
<211> 45
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成引物"
<220>
<221> 修饰的碱基
<222> (21)..(24)
<223> a, c, t, g, 未知的或其他
<400> 53
gacgtgtgct cttccgatct nnnngaaatc aaaatacccc caggg 45
<210> 54
<211> 48
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成引物"
<220>
<221> 修饰的碱基
<222> (21)..(24)
<223> a, c, t, g, 未知的或其他
<400> 54
acacgacgct cttccgatct nnnnatcgac cagtacctgt attacctg 48
<210> 55
<211> 43
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成引物"
<220>
<221> 修饰的碱基
<222> (21)..(24)
<223> a, c, t, g, 未知的或其他
<400> 55
gacgtgtgct cttccgatct nnnntgccgg taacagggtc cag 43
<210> 56
<211> 43
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成引物"
<220>
<221> 修饰的碱基
<222> (21)..(24)
<223> a, c, t, g, 未知的或其他
<400> 56
acacgacgct cttccgatct nnnntaaccc cgtggccacc gaa 43
<210> 57
<211> 46
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成引物"
<220>
<221> 修饰的碱基
<222> (21)..(24)
<223> a, c, t, g, 未知的或其他
<400> 57
gacgtgtgct cttccgatct nnnnaggacc ctgcaggtat acgtct 46
<210> 58
<211> 45
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成引物"
<220>
<221> 修饰的碱基
<222> (21)..(24)
<223> a, c, t, g, 未知的或其他
<400> 58
acacgacgct cttccgatct nnnngtgaac cgcgtggcgt acaac 45
<210> 59
<211> 46
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成引物"
<220>
<221> 修饰的碱基
<222> (21)..(24)
<223> a, c, t, g, 未知的或其他
<400> 59
gacgtgtgct cttccgatct nnnngggtcc ttggaggtac acgtcc 46
<210> 60
<211> 33
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成引物"
<400> 60
gtactctaga gtcctgtatt agaggtcacg tga 33
<210> 61
<211> 61
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成引物"
<400> 61
tgctgcatgc tgtaccgaat taacatgttt attggtacga tcagagagag tgtcctcgag 60
c 61
<210> 62
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成引物"
<400> 62
accccgccat ggtggctgcg cgtt 24
<210> 63
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成引物"
<400> 63
aacgcgcagc caccatggcg gggt 24
<210> 64
<211> 7
<212> PRT
<213> 猿猴病毒40
<400> 64
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 65
<211> 26
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成引物"
<400> 65
ggttacaaat aaagcaatag catcac 26
<210> 66
<211> 49
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成引物"
<220>
<221> 修饰的碱基
<222> (21)..(24)
<223> a, c, t, g, 未知的或其他
<400> 66
acacgacgct cttccgatct nnnngcatca caaatttcac aaataaagc 49
<210> 67
<211> 45
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成引物"
<220>
<221> 修饰的碱基
<222> (21)..(24)
<223> a, c, t, g, 未知的或其他
<400> 67
gacgtgtgct cttccgatct nnnngccgtg tccgagggta ctaag 45
<210> 68
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 68
Ala Ala Leu Arg Asp Ile Arg
1 5
<210> 69
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 69
Pro Ala Ile Lys Thr Tyr Ser
1 5
<210> 70
<211> 10
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 70
Thr Gly Asp Arg Ile Ser Ser Arg Thr Leu
1 5 10
<210> 71
<211> 15
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 71
Ser Val Val Val Ser Ser Asp Ser Ser Lys Arg Pro Arg Asn Leu
1 5 10 15
<210> 72
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 72
Val Gly Ala Arg Leu Ser Ala
1 5
<210> 73
<211> 10
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 73
Ile Glu Lys Pro Asn Thr Ser Thr Lys Lys
1 5 10
<210> 74
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 74
Asp Thr Val Arg Ser Lys Asn
1 5
<210> 75
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 75
Lys Glu Leu Asn Lys Ala Arg
1 5
<210> 76
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 76
Pro Tyr Ala Ser Ile Thr Gly
1 5
<210> 77
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 77
Thr Gly Ala Phe Ser Ser Thr
1 5
<210> 78
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 78
Glu Gln Phe Arg Asn Leu Ala
1 5
<210> 79
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 79
Phe Asn Ser Pro Val Ile Gln
1 5
<210> 80
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 80
Thr Asp Phe Arg Ser Pro Gln
1 5
<210> 81
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 81
Met Tyr Ser Leu Met Lys Asp
1 5
<210> 82
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 82
Leu Tyr Leu Ser Ser Ala Ser
1 5
<210> 83
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 83
Tyr Gly Ser Arg Ser Val Asp
1 5
<210> 84
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 84
Leu Tyr Ser His Gln Val Ser
1 5
<210> 85
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 85
Ile Ser Thr His Ser Pro Pro
1 5
<210> 86
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 86
Arg Gln Pro Thr Thr Ile Pro
1 5
<210> 87
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 87
Arg Ser Thr Ser Ser Leu Leu
1 5
<210> 88
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 88
Phe Arg Leu Ser Ser Pro Gln
1 5
<210> 89
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 89
Asn Ile Pro Lys Ala Tyr Gly
1 5
<210> 90
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 90
Met Thr Leu Thr Arg Gln Glu
1 5
<210> 91
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 91
Thr Ser Asn Ser Arg Thr Glu
1 5
<210> 92
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 92
Glu Val Arg Gly Gly Pro Ser
1 5
<210> 93
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 93
Val Ile Ser Asp Arg Ser Ser
1 5
<210> 94
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 94
Pro Arg Asp Thr Phe Asn Gly
1 5
<210> 95
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 95
Arg Pro Leu Thr Ala Asn Asp
1 5
<210> 96
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 96
Pro Leu Arg Met Val Asn Glu
1 5
<210> 97
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 97
Asp Val Gly Ile Arg Pro Ser
1 5
<210> 98
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 98
Lys Asp Ser Thr Ala Phe Gly
1 5
<210> 99
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 99
Tyr Pro Gly Arg Asn Pro Asp
1 5
<210> 100
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 100
Ile Ser Asp Thr Arg Ile Ser
1 5
<210> 101
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 101
Glu Asn Phe Ser Lys Val Ala
1 5
<210> 102
<211> 10
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 102
Arg Asp Ala Leu Ser Gly Leu Arg Pro Glu
1 5 10
<210> 103
<211> 10
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 103
Leu Gly Asn Gly Lys Met Thr Val Gln Pro
1 5 10
<210> 104
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 104
Val Ser Asn Pro Leu Asn Gln
1 5
<210> 105
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 105
Leu Asn Glu Arg Gly Leu Gly
1 5
<210> 106
<211> 10
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 106
Gly Arg Asn Thr Val Gly Leu Ser Ser Ala
1 5 10
<210> 107
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 107
Val Gly His Ala Gly Asn Pro
1 5
<210> 108
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 108
Ser Arg Ala Gly Thr Val Pro
1 5
<210> 109
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 109
Gly Leu Val Ala Lys Leu Pro
1 5
<210> 110
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 110
Ala Glu Ser Leu Arg Thr Pro
1 5
<210> 111
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 111
aaatcacctg ac 12
<210> 112
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 112
tgattcttct ac 12
<210> 113
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 113
ggccactggt tg 12
<210> 114
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 114
aatctatcgc ct 12
<210> 115
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 115
agacgatcaa gg 12
<210> 116
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 116
gtgtagtgat cg 12
<210> 117
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 117
tggtagtttc ca 12
<210> 118
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 118
gatcagttgc gg 12
<210> 119
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 119
cttgggacac ac 12
<210> 120
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 120
gatgcggcct cg 12
<210> 121
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 121
cgcatcctcg tt 12
<210> 122
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 122
acgatgtcta cg 12
<210> 123
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 123
gtgttccacc tg 12
<210> 124
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 124
ggagggagct gg 12
<210> 125
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 125
cataactctt gc 12
<210> 126
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 126
tgacagtctc gc 12
<210> 127
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 127
ctaccaggat tc 12
<210> 128
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 128
acacatgatg gc 12
<210> 129
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 129
ggtgctcgca at 12
<210> 130
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 130
gattgcaccg ca 12
<210> 131
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 131
aacggaggct gc 12
<210> 132
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 132
gggagagttc cg 12
<210> 133
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 133
cgggtagccg aa 12
<210> 134
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 134
tgacctaatt gg 12
<210> 135
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 135
gggtgaagga tt 12
<210> 136
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 136
ctgtgagaga ag 12
<210> 137
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 137
acttggttcc gc 12
<210> 138
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 138
gttggctgta cc 12
<210> 139
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 139
tgtaagctgt ag 12
<210> 140
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 140
agctaccctg ga 12
<210> 141
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 141
ccaaacaagc gt 12
<210> 142
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 142
gcttgcccat cc 12
<210> 143
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 143
cattccgggt ta 12
<210> 144
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 144
ctttgccggt ac 12
<210> 145
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 145
catcaactgt gc 12
<210> 146
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 146
gcacagccga at 12
<210> 147
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 147
atgcatcggt ca 12
<210> 148
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 148
gaaccagaat gc 12
<210> 149
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 149
cggacggtat gg 12
<210> 150
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 150
tcctatgaac aa 12
<210> 151
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 151
tgggagtaga gg 12
<210> 152
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 152
gctcaacgat cg 12
<210> 153
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 153
ggactaggat at 12
<210> 154
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 154
ccattgtggg aa 12
<210> 155
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 155
cttgtcgata ag 12
<210> 156
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 156
gtggtaagca cg 12
<210> 157
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 157
aactggctcc ca 12
<210> 158
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 158
tgcgatcgta ca 12
<210> 159
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 159
cagaggatag ct 12
<210> 160
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 160
gaggagtctc at 12
<210> 161
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 161
agttcccacg ga 12
<210> 162
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 162
cccttcagca gt 12
<210> 163
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 163
cgtactccgc ga 12
<210> 164
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 164
tcaccgacgt gg 12
<210> 165
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 165
caacggtctt cc 12
<210> 166
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 166
gtaacagtcc gg 12
<210> 167
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 167
gtcgaggata cc 12
<210> 168
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 168
tgcgatgtga tg 12
<210> 169
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 169
taacccgccg aa 12
<210> 170
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 170
cgaccaacga ca 12
<210> 171
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 171
ctgctgccat ca 12
<210> 172
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 172
ctagtacacg cg 12
<210> 173
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 173
taggtgctag tg 12
<210> 174
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 174
tcctcccagg at 12
<210> 175
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 175
taggcggcat ta 12
<210> 176
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 176
cttaggctag ct 12
<210> 177
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 177
cgacgtgcga ta 12
<210> 178
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 178
accattccat cg 12
<210> 179
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 179
tggaaaggcc ta 12
<210> 180
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 180
gggaacattg ga 12
<210> 181
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 181
aagtgaacgc gc 12
<210> 182
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 182
agcaacgttg ta 12
<210> 183
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 183
aagtgacgga cc 12
<210> 184
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 184
agtaacgccc gt 12
<210> 185
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 185
tgggctatga ca 12
<210> 186
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 186
ctgcagtgaa gt 12
<210> 187
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 187
attctgttcg ca 12
<210> 188
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 188
cttcctcacc tc 12
<210> 189
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 189
gagagtcgaa ac 12
<210> 190
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 190
agtcgtgaat cg 12
<210> 191
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 191
ggtgacaaca at 12
<210> 192
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 192
gcctagtagc at 12
<210> 193
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 193
acagaagcgc ct 12
<210> 194
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 194
ctagttgagt tc 12
<210> 195
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 195
aagttcagga ta 12
<210> 196
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 196
ttgcctctat tc 12
<210> 197
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 197
tgaacgtcta ag 12
<210> 198
<211> 12
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<400> 198
cgctatcacg ca 12
<210> 199
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 199
Lys Ser Pro His Pro Ser Val
1 5
<210> 200
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 200
Ile Lys Ser Asn Leu Thr Tyr
1 5
<210> 201
<211> 10
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 201
Ser Thr Ser Pro His Ala Pro Ser Lys Glu
1 5 10
<210> 202
<211> 10
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 202
His Ala Thr Pro Gln Phe Asp Pro Ser Gln
1 5 10
<210> 203
<211> 10
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成肽"
<400> 203
Ser Ala Leu Gly Leu Gln Ala Lys Ala Tyr
1 5 10
<210> 204
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成引物"
<400> 204
ttggtagaga tgttcgttta gagg 24
<210> 205
<211> 90
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /备注="人工序列的描述:合成寡核苷酸"
<220>
<221> 修饰的碱基
<222> (25)..(69)
<223> a, c, t, g, 未知的或其他
<220>
<221> misc_feature
<222> (25)..(69)
<223> /备注="此区域涵盖12-45个核苷酸"
<400> 205
cctctaaacg aacatctcta ccaannnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 60
nnnnnnnnnt actttggcta cagcacccct 90

Claims (435)

1.鉴定与天然AAV血清型相比具有所需特性的AAV衣壳变体的方法,包括:
(i)将细胞、细胞系或组织与AAV变体的文库接触,其中所述文库的每个成员包含:
a)编码AAV变体衣壳蛋白的核酸,所述变体衣壳蛋白包含插入其高变和/或表面暴露的环内的肽;和
下述一个或多个:
b)核酸序列中在a)所述AAV变体衣壳蛋白中的肽插入位点侧翼的一个或多个沉默突变;
c)编码定位信号的核酸;
d)包含条形码的核酸;和
e)编码报告蛋白的核酸;
(ii)允许所述文库中的AAV变体转导所述细胞、细胞系或组织;
(iii)从所述细胞、细胞系或组织中回收AAV变体;和
(iv)鉴定具有所需特性的AAV衣壳变体。
2.鉴定与天然AAV血清型相比具有所需特性的AAV衣壳变体的方法,其中包括:
(i)将细胞、细胞系或组织与AAV变体的文库接触,其中所述文库的每个成员包含:
a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入其高变和/或表面暴露的环内的肽;和
下述一个或多个:
b)所述肽插入位点侧翼的核酸序列中在编码a)所述AAV变体衣壳蛋白的合适中的一个或多个沉默突变;
c)编码定位信号的核酸;
d)包含条形码的核酸;和
e)编码报告蛋白的核酸;
(ii)允许所述文库中的AAV变体转导所述细胞、细胞系或组织;
(iii)从所述细胞、细胞系或组织中回收AAV变体;和
(iv)鉴定具有所述所需特性的AAV衣壳变体。
3.根据权利要求1所述的方法,其中所述文库的每个成员包括在a)的AAV变体衣壳蛋白中的肽插入位点侧翼的核酸序列中的一个或多个沉默突变。
4.根据权利要求2所述的方法,其中所述文库的每个成员在肽插入位点侧翼所述核酸序列中编码AAV变体衣壳蛋白的核酸中的一个或多个沉默突变。
5.根据权利要求1-4中任一项所述的方法,其中所述文库的每个成员包括编码定位信号的核酸。
6.根据权利要求1-5中任一项所述的方法,其中所述文库的每个成员包含含有条形码的核酸。
7.根据权利要求1-6中任一项所述的方法,其中所述文库的每个成员包含编码报告蛋白的核酸。
8.根据权利要求1-7中任一项所述的方法,其中编码AAV变体衣壳蛋白的核酸、以及编码定位信号的核酸、包含条形码的核酸和/或编码报告蛋白的核酸位于分开的核酸分子中。
9.根据权利要求1-7中任一项所述的方法,其中编码AAV变体衣壳蛋白的核酸、编码定位信号的核酸、包含条形码的核酸和编码报告蛋白的核酸位于一个核酸分子中。
10.根据权利要求9的方法,其中编码AAV变体衣壳蛋白的核酸、以及编码定位信号的核酸、包含条形码的核酸和编码报告蛋白的核酸彼此以任何顺序连接。
11.根据权利要求10所述的方法,其中所述文库的每个成员按此顺序包含:5’ITR序列,包含条形码的核酸,编码报告蛋白的核酸,编码AAV变体衣壳蛋白的核酸,以及3’ITR序列。
12.根据权利要求1-11中任一项所述的方法,其中AAV变体文库包括衍生自两种或更多种AAV血清型的AAV变体衣壳蛋白。
13.根据权利要求1-12中任一项所述的方法,其中所述AAV变体文库的AAV血清型选自:AAV1、AAV2、AAV3B、AAV5、AAV6、AAV8、AAV9、AAV3、AAV4、AAV7、AAV11、AAVrh10、AAVrh39和AAVrh74。
14.根据权利要求1-13中任一项所述的方法,其中编码报告蛋白的核酸和编码AAV变体衣壳的核酸各自独立地与启动子可操作连接。
15.根据权利要求1-14中任一项所述的方法,其中所述所需特征是增强的细胞或组织嗜性。
16.鉴定与天然AAV血清型相比具有所需特性的AAV衣壳变体的方法,其中包括:
(i)将编码肽的多个核酸插入编码AAV衣壳蛋白的高变和/或表面暴露的环的核酸群内,以产生编码AAV变体衣壳蛋白的核酸文库;
(ii)将所述文库中编码AAV变体衣壳蛋白的每个核酸与下述一个或多个连接:
(a)包含条形码的核酸,
(b)编码报告蛋白的核酸,和
(c)编码定位信号的核酸;
(iii)通过反式提供腺病毒辅助和AAV rep功能,在生产者细胞中制备AAV变体文库;
(iv)所述纯化AAV变体文库;
(v)将细胞、细胞系或组织与所述AAV变体文库接触;
(vi)从所述靶细胞、细胞系或组织中回收AAV变体;和
(vii)鉴定具有所述所需特性的AAV衣壳变体。
17.根据权利要求16的方法,其中编码所述文库中的AAV变体衣壳蛋白的每个核酸与包含条形码的核酸连接。
18.根据权利要求1-17中任一项所述的方法,其中所述文库的每个成员包含含有所述第一条形码的第一核酸和含有第二条形码的第二核酸。
19.根据权利要求18所述的方法,其中包含所述第一条形码的第一核酸和包含所述第二条形码的第二核酸是不同的。
20.根据权利要求18或19所述的方法,其中包含所述第一条形码的第一核酸包含选自序列SEQ ID NO:111-154中任一序列的序列。
21.根据权利要求18或19的方法,其中含有第一条形码的第一核酸选自序列SEQ IDNO:111-154中的任一序列。
22.根据权利要求18或19的方法,其中含有第二条形码的第二核酸包括选自序列SEQID NO:155-198中任一序列的序列。
23.根据权利要求18或19的方法,其中含有第二条形码的第二核酸选自序列SEQ IDNO:155-198中的任一序列。
24.根据权利要求18-23中任一项所述的方法,其中含有第一条形码的第一核酸和含有第二条形码的第二核酸都独立地与启动子可操作连接。
25.根据权利要求24所述的方法,其中与包含所述第一条形码的第一核酸可操作地连接的启动子和与包含所述第二条形码的第二核酸可操作地连接的启动子各自独立地是RNAPol II启动子。
26.根据权利要求24所述的方法,其中与包含所述第一条形码的第一核酸可操作地连接的启动子和与包含所述第二条形码的第二核酸可操作地连接的启动子各自独立地是RNAPol III启动子。
27.根据权利要求24所述的方法,其中与包含所述第一条形码的第一核酸可操作地连接的启动子是RNA Pol II启动子,并且与包含所述第二条形码的第二核酸可操作地连接的启动子是RNA Pol III启动子。
28.根据权利要求25-27中任一项所述的方法,其中每个RNA Pol II启动子独立地选自:人突触蛋白启动子(hSyn1)、甲状腺素运载蛋白启动子(TTR)、细胞角蛋白18、细胞角蛋白19、unc-45肌球蛋白伴侣B(unc45b)启动子、心肌肌钙蛋白T(cTnT)启动子、胶质纤维酸性蛋白(GFAP)启动子、髓鞘碱性蛋白(MBP)启动子和甲基CpG结合蛋白2(Mecp2)启动子。
29.根据权利要求26-27中任一项所述的方法,其中每个RNA Pol III启动子独立地选自U6启动子、H1启动子和7SK启动子。
30.根据权利要求16-29中任一项所述的方法,其中编码所述文库中的AAV变体衣壳蛋白的每个核酸与编码报告蛋白的核酸连接。
31.根据权利要求16-30中任一项所述的方法,其中编码所述文库中的AAV变体衣壳蛋白的每个核酸与编码定位信号的核酸连接。
32.根据权利要求16-31中任一项所述的方法,其中编码AAV变体衣壳蛋白的每个核酸还在肽插入位点侧翼的核酸序列中包含一个或多个沉默突变。
33.根据权利要求16-32中任一项所述的方法,其中步骤(iv)还包括基于两个或更多个AAV血清型来组合变体AAV文库,以生成单个汇集物。
34.根据权利要求16-33中任一项所述的方法,其中编码AAV衣壳蛋白的高变和/或表面暴露的环的核酸序列的群体包含衍生自两个或更多个AAV血清型的序列。
35.根据权利要求16-34中任一项所述的方法,其中所述AAV血清型选自:AAV1、AAV2、AAV3B、AAV5、AAV6、AAV8、AAV9、AAV3、AAV4、AAV7、AAV11、AAVrh10、AAVrh39和AAVrh74。
36.根据权利要求16-35中任一项所述的方法,其中所述辅助功能包括E2A、E4、VA、E1A和E1B中的一种或多种。
37.根据权利要求16-36中任一项所述的方法,其中AAV rep功能包括rep78、rep 68、rep 52和rep40基因。
38.根据权利要求37所述的方法,其中rep78和/或rep68基因的起始密码子从ACG修饰成ATG。
39.根据权利要求16-38中任一项所述的方法,其中生产者细胞是HEK293细胞。
40.根据权利要求16-39中任一项所述的方法,其中编码AAV变体衣壳蛋白的核酸、包含条形码的核酸、编码报告蛋白的核酸和/或编码定位信号的核酸以任何顺序彼此连接。
41.根据权利要求16-40中任一项所述的方法,其中所述文库的每个成员按下述顺序包含:5’ITR序列、包含条形码的核酸、编码报告蛋白的核酸、编码AAV变体衣壳蛋白的核酸和3’ITR序列。
42.根据权利要求16-41中任一项所述的方法,其中编码报告蛋白的核酸和编码AAV变体衣壳的核酸各自独立地与启动子可操作连接。
43.根据权利要求16-42中任一项所述的方法,其中所述所需特征是增强的细胞或组织嗜性。
44.根据权利要求1-43中任一项所述的方法,其中所述肽的长度为4-15个氨基酸。
45.根据权利要求1-44中任一项所述的方法,其中所述肽的长度为6-15个氨基酸。
46.根据权利要求45所述的方法,其中所述肽的长度为7、10或15个氨基酸。
47.根据权利要求46所述的方法,其中所述肽的长度为7个氨基酸。
48.根据权利要求1-47中任一项所述的方法,其中所述肽被插入选自下述的区域中:衣壳蛋白的VR-I、VR-II、VR-III、VR-IV、VR-V、VR-VI、VR-VII、VR-VIII和VR-IX区域。
49.根据权利要求48所述的方法,其中所述肽被插入所述衣壳蛋白的VR-I内。
50.根据权利要求48所述的方法,其中所述肽被插入所述衣壳蛋白的VR-IV内。
51.根据权利要求48所述的方法,其中所述肽被插入所述衣壳蛋白的VR-VIII内。
52.根据权利要求1-49中任一项所述的方法,其中所述肽被插入衣壳蛋白VP1、VP2或VP3内。
53.根据权利要求1-50中任一项所述的方法,其中所述肽被插入衣壳蛋白的氨基酸残基450和600之间的位置。
54.根据权利要求1-51中任一项所述的方法,其中
(i)所述AAV血清型是AAV1,所述肽被插入衣壳蛋白的氨基酸位置590处,
(ii)所述AAV血清型是AAV6,所述肽被插入衣壳蛋白的氨基酸位置454 或590处,
(iii)所述AAV血清型是AAV2,所述肽被插入衣壳蛋白的氨基酸位置588处,
(iv)所述AAV血清型是AAV3B,所述肽被插入衣壳蛋白的氨基酸位置589处,
(v)所述AAV血清型是AAV5,所述肽被插入衣壳蛋白的氨基酸位置578处,
(vi)所述AAV血清型是AAV8,所述肽被插入衣壳蛋白的氨基酸位置591处,或
(vii)所述AAV血清型是AAV9,所述肽被插入衣壳蛋白的氨基酸位置266、455或589处,
其中各位置对应于所述AAV血清型中VP1的编号。
55.根据权利要求1-54中任一项所述的方法,其中所述报告蛋白是荧光蛋白。
56.根据权利要求55所述的方法,其中所述报告蛋白选自:EGFP、mCherry、mClover3、mRuby3、mApple、iRFP、tdTomato、mVenus、YFP、RFP、萤火虫荧光素酶和nanoluciferase。
57.根据权利要求1-56中任一项所述的方法,其中编码AAV变体衣壳蛋白的核酸可操作地连接p40启动子。
58.根据权利要求1-57中任一项所述的方法,其中编码报告蛋白的核酸可操作地连接细胞类型和/或组织特异性启动子。
59.根据权利要求58所述的方法,其中所述细胞类型和/或组织特异性启动子选自:人突触蛋白启动子(hSyn1)、甲状腺素运载蛋白启动子(TTR)、细胞角蛋白18、细胞角蛋白19、unc-45肌球蛋白伴侣B(unc45b)启动子、心肌肌钙蛋白T(cTnT)启动子、胶质纤维酸性蛋白(GFAP)启动子、髓鞘碱性蛋白(MBP)启动子和甲基CpG结合蛋白2(Mecp2)启动子。
60.根据权利要求59所述的方法,其中所述细胞类型和/或组织特异性启动子是hSyn1启动子。
61.根据权利要求60所述的方法,其中所述细胞类型和/或组织特异性启动子是TTR启动子。
62.根据权利要求1-61中任一项所述的方法,其中所述报告蛋白与定位信号融合。
63.根据权利要求62所述的方法,其中所述定位信号在N-端、C-端或N-端和C端与所述报告蛋白融合。
64.根据权利要求1-63中任一项所述的方法,其中所述定位信号是核定位信号(NLS)、核包膜结合结构域或组蛋白结合结构域。
65.根据权利要求64所述的方法,其中所述NLS是SV40 NLS。
66.根据权利要求64所述的方法,其中所述核包膜结合结构域是KASH结构域。
67.根据权利要求64所述的方法,其中所述组蛋白结合结构域是H2B。
68.根据权利要求1-67中任一项所述的方法,其中包含所述条形码的核酸长为5-18个核苷酸。
69.根据权利要求1-68中任一项所述的方法,其中包含所述条形码的核酸包括选自序列SEQ ID NO:111-154中任一序列的序列。
70.根据权利要求1-68中任一项所述的方法,其中包含所述条形码的核酸包括选自序列SEQ ID NO:155-198中任一序列的序列。
71.根据权利要求1-68中任一项所述的方法,其中包含所述条形码的核酸选自序列SEQID NO:111-154中的任何一种。
72.根据权利要求1-68中任一项所述的方法,其中包含所述条形码的核酸选自序列SEQID NO:155-198中的任何一种。
73.根据权利要求1-72中任一项所述的方法,其中通过所述相关的一个或多个条形码测序来鉴定具有所需特性的AAV衣壳变体。
74.根据权利要求1-73中任一项所述的方法,其中通过AAV基因组的纯化和测序鉴定具有所需特性的AAV衣壳变体。
75.根据权利要求1-74中任一项所述的方法,其中所述细胞、细胞系或组织选自CNS、心脏、肺、气管、食道、肌肉、骨、软骨、胃、胰腺、肠道、肝脏、膀胱、肾、输尿管、尿道、子宫、输卵管、卵巢、睾丸、前列腺、眼、血液、淋巴和口腔粘膜。
76.根据权利要求1-74中任一项所述的方法,其中所述细胞选自:神经元、神经胶质细胞、星形胶质细胞、少突胶质细胞、小神经胶质细胞、施万细胞、室管膜细胞、肝细胞、星状脂肪储存细胞、枯否氏细胞、肝内皮细胞、上皮细胞、心肌细胞、平滑肌细胞、T细胞、B细胞、造血干细胞和胚胎干细胞。
77.AAV变体的文库,其中所述文库的每个成员包含:
a)编码AAV变体衣壳蛋白的核酸序列,所述变体衣壳蛋白包含插入其高变和/或表面暴露的环内的肽;和
下述一种或多种:
b)在a)的AAV变体衣壳蛋白内所述肽插入位点侧翼的核酸序列中的一个或多个沉默突变;
c)编码定位信号的核酸;
d)包含条形码的核酸;和
e)编码报告蛋白的核酸。
78.AAV变体的文库,其中所述文库的每个成员包含:
a)AAV变体衣壳蛋白,其包含插入其高变和/或表面暴露的环内的肽;和
下述一种或多种:
b)在编码a)的AAV变体衣壳蛋白的核酸内所述肽插入位点侧翼的核酸序列中的一个或多个沉默突变;
c)编码定位信号的核酸;
d)包含条形码的核酸;和
e)编码报告蛋白的核酸。
79.根据权利要求77所述的文库,其中所述文库的每个成员包含在a)的AAV变体衣壳蛋白内所述肽插入位点侧翼的核酸序列中的一个或多个沉默突变。
80.根据权利要求78所述的文库,其中所述文库的每个成员包含在编码a)的AAV变体衣壳蛋白的核酸内所述肽插入位点侧翼的核酸序列中的一个或多个沉默突变。
81.根据权利要求77-80中任一项所述的文库,其中所述文库的每个成员包括编码定位信号的核酸。
82.根据权利要求77-81中任一项所述的文库,其中所述文库的每个成员包含含有条形码的核酸。
83.根据权利要求77-82中任一项所述的文库,其中所述文库的每个成员包含含有第一条形码的第一核酸和含有第二条形码的第二核酸。
84.根据权利要求83所述的文库,其中包含所述第一条形码的第一核酸和包含所述第二条形码的第二核酸是不同的。
85.根据权利要求84所述的文库,其中包含第一条形码序列的第一核酸包含选自序列SEQ ID NO:111-154中任一序列的序列。
86.根据权利要求84所述的文库,其中包含第一条形码序列的第一核酸选自序列SEQID NO:111-154中任一序列的序列。
87.根据权利要求84所述的文库,其中包含第二条形码序列的第二核酸包含选自序列SEQ ID NO:155-198中任一序列的序列。
88.根据权利要求84的文库,其中包含第二条形码序列的第二核酸选自序列SEQ IDNO:155-198中的任何一种。
89.根据权利要求83-88中任一项所述的文库,其中含有第一条形码的第一核酸和含有第二条形码的第二核酸中的每一个独立地与启动子可操作地连接。
90.根据权利要求89所述的文库,其中与含有第一条形码的第一核酸可操作地连接的启动子和与含有第二条形码的第二核酸可操作地连接的启动子各自独立地是RNA Pol II启动子。
91.根据权利要求89的文库,其中与含有第一条形码的第一核酸可操作地连接的启动子和与含有第二条形码的第二核酸可操作地连接的启动子各自独立地是RNA Pol III启动子。
92.根据权利要求89的文库,其中与含有第一条形码的第一核酸可操作地连接的启动子与RNA Pol II启动子可操作地连接,并且与含有第二条形码的第二核酸可操作地连接的启动子是RNA Pol III启动子。
93.根据权利要求90-91中任一项的文库,其中RNA Pol II启动子选自:人突触蛋白启动子(hSyn1)、甲状腺素运载蛋白启动子(TTR)、细胞角蛋白18、细胞角蛋白19、unc-45肌球蛋白伴侣B(unc45b)启动子、心肌肌钙蛋白T(cTnT)启动子、胶质纤维酸性蛋白(GFAP)启动子、髓鞘碱性蛋白(MBP)启动子和甲基CpG结合蛋白2(Mecp2)启动子。
94.根据权利要求91-93中任一项的文库,其中RNA Pol III启动子选自U6启动子、H1启动子和7SK启动子。
95.根据权利要求77-94中任一项的文库,其中所述文库的每个成员包含编码报告蛋白的核酸。
96.根据权利要求77-95中任一项所述的文库,其中编码AAV变体衣壳蛋白的核酸、编码定位信号的核酸、包含条形码的核酸和/或编码报告蛋白的核酸位于分开的核酸分子中。
97.根据权利要求77-95中任一项所述的文库,其中编码AAV变体衣壳蛋白的核酸、编码定位信号的核酸、包含条形码的核酸和/或编码报告蛋白的核酸位于一个核酸分子中。
98.根据权利要求97所述的文库,其中编码AAV变体衣壳蛋白的核酸、编码定位信号的核酸、包含条形码的核酸和/或编码报告蛋白的核酸以任何顺序彼此连接。
99.根据权利要求97的文库,其中所述文库的每个成员按下述顺序包括:5’ITR序列,包含条形码的核酸,编码报告蛋白的核酸,编码AAV变体衣壳蛋白的核酸,以及3’ITR序列。
100.根据权利要求77-99中任一项所述的文库,其中所述AAV变体衍生自下述一种或多种:AAV1、AAV2、AAV3B、AAV5、AAV6、AAV8、AAV9、AAV3、AAV4、AAV7、AAV11、AAVrh10、AAVrh39和AAVrh74。
101.根据权利要求100所述的文库,其中所述AAV变体文库包括衍生自两个或更多个AAV血清型的AAV变体衣壳蛋白。
102.根据权利要求77-101中任一项所述的文库,其中所述肽的长度为4-15个氨基酸。
103.根据权利要求102所述的文库,其中所述肽的长度为6-15个氨基酸。
104.根据权利要求103所述的文库,其中所述肽的长度为7、10或15个氨基酸。
105.根据权利要求104所述的文库,其中所述肽的长度为7个氨基酸。
106.根据权利要求77-105中任一项所述的文库,其中所述肽包含SEQ ID NO:1-32中任一所示氨基酸序列的至少4个连续氨基酸。
107.根据权利要求106所述的文库,其中所述肽包含SEQ ID NO:1-32中任一所示的氨基酸序列。
108.根据权利要求77-106中任一项所述的文库,其中所述肽包含SEQ ID NO:68-110中任一所示氨基酸序列的至少4个连续氨基酸。
109.根据权利要求108的文库,其中所示肽包含SEQ ID NO:68-110中任一所示的氨基酸序列。
110.根据权利要求77-109中任一项所述的文库,其中所述肽被插入选自下述的区域内:所示衣壳蛋白的VR-1、VR-II、VR-III、VR-IV、VR-V、VR-VI、VR-VII、VR-VIII和VR-IX区域。
111.根据权利要求110所述的文库,其中所述肽被插入所述衣壳蛋白的VR-I内。
112.根据权利要求110所述的文库,其中所述肽被插入所述衣壳蛋白的VR-IV内。
113.根据权利要求110所述的文库,其中所述肽被插入所述衣壳蛋白的VR-VIII内。
114.根据权利要求77-113中任一项所述的文库,其中所述肽被插入所述衣壳蛋白VP1、VP2或VP3中。
115.根据权利要求77-114中任一项所述的文库,其中所述肽被插入所述衣壳蛋白的氨基酸残基450和600之间的位置。
116.根据权利要求77-115中任一项所述的文库,其中
(i)所述AAV血清型是AAV1,所述肽被插入衣壳蛋白的氨基酸位置590处,
(ii)所述AAV血清型是AAV6,所述肽被插入衣壳蛋白的氨基酸位置454或590处,
(iii)所述AAV血清型是AAV2,所述肽被插入衣壳蛋白的氨基酸位置588处,
(iv)所述AAV血清型是AAV3B,所述肽被插入衣壳蛋白的氨基酸位置589处,
(v)所述AAV血清型是AAV5,所述肽被插入衣壳蛋白的氨基酸位置578处,
(vi)所述AAV血清型是AAV8,所述肽被插入衣壳蛋白的氨基酸位置591处,或
(vii)所述AAV血清型是AAV9,所述肽被插入衣壳蛋白的氨基酸位置266、455或589处,
其中各位置对应于所述AAV血清型中VP1的编号。
117.根据权利要求77-116中任一项所述的文库,其中所述报告蛋白是荧光蛋白。
118.根据权利要求117所述的文库,其中所述报告蛋白选自:EGFP、mCherry、mClover3、mRuby3、mApple、iRFP、tdTomato、mVenus、YFP、RFP、萤火虫荧光素酶和nanoluciferase。
119.根据权利要求77-118中任一项所述的文库,其中编码AAV变体衣壳蛋白的核酸与p40启动子可操作地连接。
120.根据权利要求77-119中任一项所述的文库,其中编码报告蛋白的核酸与细胞类型和/或组织特异性启动子可操作地连接。
121.根据权利要求120所述的文库,其中所述细胞类型和/或组织特异性启动子选自:人突触蛋白启动子(hSyn1)、甲状腺素运载蛋白启动子(TTR)、细胞角蛋白18、细胞角蛋白19、unc-45肌球蛋白伴侣B(unc45b)启动子、心肌肌钙蛋白T(cTnT)启动子、胶质纤维酸性蛋白(GFAP)启动子、髓鞘碱性蛋白(MBP)启动子和甲基CpG结合蛋白2(Mecp2)启动子。
122.根据权利要求121所述的文库,其中所述细胞类型和/或组织特异性启动子是hSyn1启动子。
123.根据权利要求121所述的文库,其中所述细胞类型和/或组织特异性启动子是TTR启动子。
124.根据权利要求77-123中任一项所述的文库,其中所述报告蛋白与所述定位信号相融合。
125.根据权利要求124所述的文库,其中所述定位信号在N-末端、C-末端或N-末端和C末端一起与所述报告蛋白相融合。
126.根据权利要求77-125中任一项所述的文库,其中所述定位信号是核定位信号(NLS)、核包膜结合结构域或组蛋白结合结构域。
127.根据权利要求126所述的文库,其中所述NLS是SV40 NLS。
128.根据权利要求126所述的文库,其中所述核包膜结合结构域是KASH结构域。
129.根据权利要求126所述的文库,其中所述组蛋白结合结构域是H2B。
130.根据权利要求77-129中任一项所述的文库,其中包含所述条形码的核酸长为5-18个核苷酸。
131.根据权利要求77-130中任一项所述的文库,其中包含所述条形码的核酸包括选自序列SEQ ID NO:111-154中任一项的序列。
132.根据权利要求77-130中任一项所述的文库,其中包含所述条形码的核酸包括选自序列SEQ ID NO:155-198中任一项的序列。
133.根据权利要求77-132中任一项所述的文库,其中包含所述条形码的核酸选自序列SEQ ID NO:111-154中的任何一个。
134.根据权利要求77-132中任一项所述的文库,其中包含所述条形码的核酸选自序列SEQ ID NO:155-198中的任何一个。
135.一种AAV变体,其中包含:
a)编码AAV变体衣壳蛋白的核酸序列,其中所述变体衣壳蛋白含有插入到其高变和/或表面暴露的环内的肽;和
下述一种或多种:
b)所述核酸序列中在a)的AAV变体衣壳蛋白内的肽插入位点侧翼的一个或多个沉默突变;
c)编码定位信号的核酸;
d)包含条形码的核酸;和
e)编码报告蛋白的核酸。
136.一种AAV变体,其中包含:
a)AAV变体衣壳蛋白,所述变体衣壳蛋白包含插入其高变和/或表面暴露的环内的肽;和
下述一种或多种:
b)在所述肽插入位点侧翼的核酸序列中,在编码a)的AAV变体衣壳蛋白的核酸中的一个或多个沉默突变;
c)编码定位信号的核酸;
d)包含条形码的核酸;和
e)编码报告蛋白的核酸。
137.根据权利要求135所述的变体,其中所述变体包含a)的AAV变体衣壳蛋白内所述肽插入位点侧翼的核酸序列中的一个或多个沉默突变。
138.根据权利要求136所述的变体,其中所述变体在肽插入位点侧翼的核酸序列中编码a)的AAV变体衣壳蛋白的核酸中包含一个或多个沉默突变。
139.根据权利要求135-136中任一项所述的变体,其中所述变体包含编码定位信号的核酸。
140.根据权利要求135-139中任一项所述的变体,其中所述变体包含含有条形码的核酸。
141.根据权利要求138-139中任一项所述的变体,其中所述变体包含含有第一条形码的第一核酸和含有第二条形码的第二核酸。
142.根据权利要求141所述的变体,其中含有第一条形码的第一核酸和含有第二条形码的第二核酸不同。
143.根据权利要求142所述的变体,其中包含第一条形码序列的第一核酸包含选自序列SEQ ID NO:111-154中任一个的序列。
144.根据权利要求142所述的变体,其中包含第一条形码序列的第一核酸选自序列SEQID NO:111-154中的任一个。
145.根据权利要求142所述的变体,其中包含第二条形码序列的第二核酸包含选自序列SEQ ID NO:155-198中任一个的序列。
146.根据权利要求142所述的变体,其中包含第二条形码序列的第二核酸选自序列SEQID NO:155-198中的任一个。
147.根据权利要求142-146中任一项所述的变体,其中包含所述第一条形码的所述第一核酸和包含所述第二条形码的所述第二核酸中的每一个独立地可操作地连接至启动子。
148.根据权利要求147所述的变体,其中与含有第一条形码的第一核酸可操作地连接的启动子和与含有第二条形码的第二核酸可操作地连接的启动子各自独立地是RNAPol II启动子。
149.根据权利要求147所述的变体,其中与含有第一条形码的第一核酸可操作地连接的启动子和与含有第二条形码的第二核酸可操作地连接的启动子各自独立地是RNAPolIII启动子。
150.根据权利要求147所述的变体,其中与含有第一条形码的第一核酸可操作地连接的启动子与RNA Pol II启动子可操作地连接,并且与含有第二条形码的第二核酸可操作地连接的启动子是RNA Pol III启动子。
151.根据权利要求148-150中任一项所述的变体,其中所述RNA Pol II启动子选自:人突触蛋白启动子(hSyn1)、甲状腺素运载蛋白启动子(TTR)、细胞角蛋白18、细胞角蛋白19、unc-45肌球蛋白伴侣B(unc45b)启动子、心肌肌钙蛋白T(cTnT)启动子、神经胶质纤维酸性蛋白(GFAP)启动子、髓鞘碱性蛋白(MBP)启动子和甲基CpG结合蛋白2(Mecp2)启动子。
152.根据权利要求149-151中任一项所述的变体,其中所述RNA Pol III启动子选自由U6启动子、H1启动子和7SK启动子组成的组。
153.根据权利要求135-152中任一项所述的变体,其中所述变体包含编码报告蛋白的核酸。
154.根据权利要求135-153中任一项所述的变体,其中所述编码AAV变体衣壳蛋白的核酸,和所述编码定位信号的核酸,包含条形码的核酸,和/或编码报告蛋白的核酸位于分开的核酸分子中。
155.根据权利要求135-154中任一项所述的变体,其中编码AAV变体衣壳蛋白的核酸、编码定位信号的核酸、包含条形码的核酸和/或编码报告蛋白的核酸位于一个核酸分子中。
156.根据权利要求155所述的变体,其中编码AAV变体衣壳蛋白的核酸和编码定位信号的核酸、包含条形码的核酸和/或编码报告蛋白的核酸以任何顺序彼此连接。
157.根据权利要求156所述的变体,其中所述变体以下述顺序包含:5’ITR序列、包含条形码的核酸、编码报告蛋白的核酸、编码AAV变体衣壳蛋白的核酸和3’ITR序列。
158.根据权利要求135-157中任一项所述的变体,其中所述AAV变体源自于:AAV1、AAV2、AAV3B、AAV5、AAV6、AAV8、AAV9、AAV3、AAV4、AAV7、AAV11、AAVrh10、AAVrh39和AAVrh74。
159.根据权利要求135-158中任一项所述的变体,其中所述肽具有4-15个氨基酸的长度。
160.根据权利要求159所述的变体,其中所述肽具有6-15个氨基酸的长度。
161.根据权利要求160所述的变体,其中所述肽具有7、10或15个氨基酸的长度。
162.根据权利要求161所述的变体,其中所述肽具有7个氨基酸的长度。
163.根据权利要求135-162中任一项所述的变体,其中所述插入的肽包含SEQ ID NO:1-32中任一所示的氨基酸序列的至少4个连续氨基酸。
164.根据权利要求163所述的变体,其中所述肽包含在SEQ ID NO:1-32中任一所示的氨基酸序列。
165.根据权利要求135-162中任一项所述的变体,其中所述插入的肽包含SEQ ID NO:68-110中任一所示的氨基酸序列的至少4个连续氨基酸。
166.根据权利要求165所述的变体,其中所述肽包含在SEQ ID NO:68-110中任一所示的氨基酸序列。
167.根据权利要求135-166中任一项所述的变体,其中所述肽被插入选自由所述衣壳蛋白的VR-I、VR-II、VR-III、VR-IV、VR-V、VR-VI、VR-VII、VR-VIII和VR-IX区域。
168.根据权利要求167所述的变体,其中所述肽被插入到所述衣壳蛋白的VR-I中。
169.根据权利要求167所述的变体,其中所述肽被插入到所述衣壳蛋白的VR-IV中。
170.根据权利要求168所述的变体,其中所述肽被插入到所述衣壳蛋白的VR-VIII中。
171.根据权利要求135-170中任一项所述的变体,其中所述肽被插入到所述衣壳蛋白VP1、VP2或VP3中。
172.根据权利要求135-171中任一项所述的变体,其中所述肽被插入在所述衣壳蛋白的氨基酸残基450和600之间的位置处。
173.根据权利要求135-172中任一项所述的变体,其中:
(i)所述AAV血清型是AAV1并且所述肽被插入在所述衣壳蛋白的氨基酸位置590处,
(ii)所述AAV血清型是AAV6并且所述肽被插入在所述衣壳蛋白的氨基酸位置454或590处,
(iii)所述AAV血清型是AAV2并且所述肽被插入在所述衣壳蛋白的氨基酸位置588处,
(iv)所述AAV血清型是AAV3B并且所述肽被插入在所述衣壳蛋白的氨基酸位置589处,
(v)所述AAV血清型是AAV5并且所述肽被插入在所述衣壳蛋白的氨基酸位置578处,
(vi)所述AAV血清型是AAV8并且所述肽被插入在所述衣壳蛋白的氨基酸位置591处,或
(vii)所述AAV血清型是AAV9并且所述肽被插入在所述衣壳蛋白的氨基酸位置266、455或589处,
其中各所述位置对应于所述AAV血清型中VP1的编号。
174.根据权利要求135-173中任一项所述的变体,其中所述报告蛋白是荧光蛋白。
175.根据权利要求174所述的变体,其中所述报告蛋白选自:EGFP、mCherry、mClover3、mRuby3、mApple、iRFP、tdTomato、mVenus、YFP、RFP、萤火虫荧光素酶和nanoluciferase。
176.根据权利要求135-175中任一项所述的变体,其中所述编码AAV变体衣壳蛋白的核酸与p40启动子可操作地连接。
177.根据权利要求138-176中任一项所述的变体,其中所述编码报告蛋白的核酸与细胞类型和/或组织特异性启动子可操作地连接。
178.根据权利要求177所述的变体,其中所述细胞类型和/或组织特异性启动子选自:人突触蛋白启动子(hSyn1)、甲状腺素运载蛋白启动子(TTR)、细胞角蛋白18、细胞角蛋白19、unc-45肌球蛋白伴侣B(unc45b)启动子、心肌肌钙蛋白T(cTnT)启动子、神经胶质纤维酸性蛋白(GFAP)启动子、髓鞘碱性蛋白(MBP)启动子和甲基CpG结合蛋白2(Mecp2)启动子。
179.根据权利要求178所述的变体,其中所述细胞类型和/或组织特异性启动子是hSyn1启动子。
180.根据权利要求178所述的变体,其中所述细胞类型和/或组织特异性启动子是TTR启动子。
181.根据权利要求135-180中任一项所述的变体,其中所述报告蛋白与所述定位信号融合。
182.根据权利要求181所述的变体,其中所述定位信号在N-末端、C-末端或N-末端和C-末端融合至所述报告蛋白。
183.根据权利要求135-182中任一项所述的变体,其中所述定位信号是核定位信号(NLS)、核包膜结合域或组蛋白结合域。
184.根据权利要求183所述的变体,其中所述NLS是SV40 NLS。
185.根据权利要求183所述的变体,其中所述核包膜结合域是KASH域。
186.根据权利要求183所述的变体,其中所述组蛋白结合域是H2B。
187.根据权利要求135-186中任一项所述的变体,其中包含所述条形码的核酸的长度为5-18个核苷酸。
188.根据权利要求135-187中任一项所述的变体,其中包含所述条形码的核酸包含选自序列SEQ ID NO:111-154中任一项的序列。
189.根据权利要求188所述的变体,其中包含所述条形码的核酸选自序列SEQ ID NO:111-154中的任一个。
190.根据权利要求135-187中任一项所述的变体,其中包含所述条形码的核酸包含选自序列SEQ ID NO:155-198中任一项的序列。
191.根据权利要求190所述的变体,其中包含所述条形码的核酸选自序列SEQ ID NO:155-198中的任一个。
192.根据权利要求135-191中任一项所述的变体,其中所述AAV变体源自AAV1。
193.根据权利要求192所述的变体,其中所述变体包含含有选自SEQ ID NO:68至SEQID NO:75中任一项的氨基酸序列的肽。
194.根据权利要求192所述的变体,其中所述变体包含含有选自SEQ ID NO:1、SEQ IDNO:2和SEQ ID NO:3的氨基酸序列的肽:。
195.根据权利要求192所述的变体,其中所述变体包含含有氨基酸序列SEQ ID NO:71的肽。
196.根据权利要求135-191中任一项所述的变体,其中所述AAV变体源自AAV2。
197.根据权利要求196所述的变体,其中所述变体包含含有选自由SEQ ID NO:90至SEQID NO:110中任一项组成的组的氨基酸序列的肽。
198.根据权利要求196所述的变体,其中所述变体包含含有选自下组的任一序列的肽:SEQ ID NO:95、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:106、SEQ ID NO:91和SEQ ID NO:102。
199.根据权利要求196所述的变体,其中所述变体包含含有选自SEQ ID NO:4-7中任一项的氨基酸序列的肽。
200.根据权利要求135-191中任一项所述的变体,其中所述AAV变体源自AAV3B。
201.根据权利要求200所述的变体,其中所述变体包含含有选自下组的任一序列的肽:SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:76和SEQ ID NO:83。
202.根据权利要求200所述的变体,其中所述变体包含含有选自SEQ ID NO:8至SEQ IDNO:11中任一项的氨基酸序列的肽。
203.根据权利要求135-191中任一项所述的变体,其中所述AAV变体源自AAV5。
204.根据权利要求203所述的变体,其中所述变体包含含有选自SEQ ID NO:28至SEQID NO:32中任一项的氨基酸序列的肽。
205.根据权利要求135-191中任一项所述的变体,其中所述AAV变体源自AAV6。
206.根据权利要求205所述的变体,其中所述变体包含含有选自由SEQ ID NO:19至SEQID NO:27中任一项组成的组的氨基酸序列的肽。
207.根据权利要求135-191中任一项所述的变体,其中所述AAV变体源自AAV9。
208.根据权利要求207所述的变体,其中所述变体包含含有选自SEQ ID NO:12至SEQID NO:18中任一项的氨基酸序列的肽。
209.根据权利要求207所述的变体,其中所述变体包含含有选自SEQ ID NO:86至SEQID NO:89中任一项的氨基酸序列的肽。
210.根据权利要求207所述的变体,其中所述变体包含含有序列SEQ ID NO:89的肽。
211.一种核酸分子,其中包含:
a)编码AAV变体衣壳蛋白的核酸序列,所述变体衣壳蛋白包含插入到其高变和/或表面暴露的环中的肽;和
以下一种或多种:
b)编码变体衣壳蛋白的核酸序列,所述核酸序列在该变体衣壳蛋白的高变和/或表面暴露的环中肽插入位点侧翼的核苷酸序列中包含一个或多个沉默突变;
c)编码定位信号的核酸序列;
d)包含条形码的核酸序列;和
e)编码报告蛋白的核酸序列。
212.根据权利要求211所述的核酸分子,其中编码AAV变体衣壳蛋白的核酸序列在a)的AAV变体衣壳蛋白中肽插入位点侧翼的核酸序列中包含一个或多个沉默突变。
213.根据权利要求212所述的核酸分子,其中所述核酸分子包含编码定位信号的核酸。
214.根据权利要求212所述的核酸分子,其中所述核酸分子包含含有条形码的核酸。
215.根据权利要求211-214所述的核酸分子,其中所述核酸分子包含含有第一条形码的第一核酸和含有第二条形码的第二核酸。
216.根据权利要求215所述的核酸分子,其中含有第一条形码的第一核酸和含有第二条形码的第二核酸不同。
217.根据权利要求216所述的核酸分子,其中含有第一条形码序列的第一核酸包含选自序列SEQ ID NO:111-154中任一个的序列。
218.根据权利要求217所述的核酸分子,其中含有第一条形码序列的第一核酸选自序列SEQ ID NO:111-154中的任一个。
219.根据权利要求216所述的核酸分子,其中含有第二条形码序列的第二核酸包含选自序列SEQ ID NO:155-198中任一个的序列。
220.根据权利要求217所述的核酸分子,其中含有第二条形码序列的第二核酸选自序列SEQ ID NO:155-198中的任一个。
221.根据权利要求215-220中任一项所述的核酸分子,其中含有第一条形码的第一核酸和含有第二条形码的第二核酸中的每一个独立地与启动子可操作地连接。
222.根据权利要求221所述的核酸分子,其中与含有第一条形码的第一核酸可操作地连接的启动子和与含有第二条形码的第二核酸可操作地连接的启动子各自独立地是RNAPol II启动子。
223.根据权利要求221所述的核酸分子,其中与含有第一条形码的第一核酸可操作地连接的启动子和与含有第二条形码的第二核酸可操作地连接的启动子各自独立地是RNAPol III启动子。
224.根据权利要求221所述的核酸分子,其中与含有第一条形码的第一核酸可操作地连接的启动子与含有第二条形码的第二核酸可操作地连接的启动子是RNA Pol III启动子。
225.根据权利要求222-224中任一项的核酸分子,其中所述RNAPol II启动子选自下组:人突触蛋白启动子(hSyn1)、甲状腺素运载蛋白启动子(TTR)、细胞角蛋白18、细胞角蛋白19、unc-45肌球蛋白伴侣B(unc45b)启动子、心肌肌钙蛋白T(cTnT)启动子、神经胶质纤维酸性蛋白(GFAP)启动子、髓鞘碱性蛋白(MBP)启动子和甲基CpG结合蛋白2(Mecp2)启动子。
226.根据权利要求223-224中任一项所述的核酸分子,其中所述RNA Pol III启动子选自由U6启动子、H1启动子和7SK启动子组成的组。
227.根据权利要求211-226中任一项所述的核酸分子,其中所述核酸分子包含编码报告蛋白的核酸。
228.根据权利要求211-227中任一项所述的核酸分子,其中所述AAV变体源自以下中的一种或多种:AAV1、AAV2、AAV3B、AAV5、AAV6、AAV8、AAV9、AAV3、AAV4、AAV7、AAV11、AAVrh10、AAVrh39和AAVrh74。
229.根据权利要求211-228中任一项所述的核酸分子,其中该插入的肽具有4-15个氨基酸的长度。
230.根据权利要求229所述的核酸分子,其中所述插入的肽包含SEQ ID NO:1-32中任一所示的氨基酸序列的至少4个连续氨基酸。
231.根据权利要求229所述的核酸分子,其中所述插入的肽包含SEQ ID NO:68-110中任一所示的氨基酸序列的至少4个连续氨基酸。
232.根据权利要求211-231中任一项所述的核酸分子,其中所述编码报告蛋白的核酸与细胞类型和/或组织特异性启动子可操作地连接。
233.根据权利要求232所述的核酸分子,其中所述细胞类型和/或组织特异性启动子是hSyn1启动子。
234.根据权利要求211-233任一项所述的核酸分子,其中包含所述条形码的核酸包含选自序列SEQ ID NO:111-154中任一项的序列。
235.根据权利要求211-233任一项所述的核酸分子,其中包含所述条形码的核酸包含选自序列SEQ ID NO:155-198中任一项的序列。
236.根据权利要求135-210中任一项所述的AAV变体用于将转基因递送至靶细胞或组织的用途。
237.一种AAV载体,其包含编码肽的核酸分子,所述肽包含SEQ ID NO:1-32中任一所示的氨基酸序列的至少4个连续氨基酸。
238.根据权利要求237所述的AAV载体,其中所述核酸编码包含SEQ ID NO:1-32中任一所示的氨基酸序列的肽。
239.根据权利要求237或238所述的AAV载体,其中所述核酸编码具有SEQ ID NO:1-32中任一个的序列的肽。
240.一种AAV载体,其包含编码肽的核酸分子,所述肽包含SEQ ID NO:68-110中任一所示的氨基酸序列的至少4个连续氨基酸。
241.根据权利要求240所述的AAV载体,其中所述核酸编码包含SEQ ID NO:68-110中任一所示的氨基酸序列的肽。
242.根据权利要求240或241所述的AAV载体,其中所述核酸编码具有SEQ ID NO:68-110中任一项的序列的肽。
243.根据权利要求240所述的AAV载体,其中所述核酸编码包含SEQ ID NO:71、76-80、83、89、91、94-96、101-103和106中任一所示的氨基酸序列的肽。
244.根据权利要求237-243中任一项所述的AAV载体,其中所述肽是衣壳蛋白的一部分。
245.根据权利要求244所述的AAV载体,其中所述衣壳蛋白是VP1、VP2或VP3。
246.根据权利要求237-245中任一项所述的AVV载体,其中所述肽被插入在所述衣壳蛋白的氨基酸残基450和600之间的位置处。
247.根据权利要求246所述的AAV载体,其中所述肽被插入到
(i)AAV1衣壳蛋白的氨基酸位置590处,
(ii)AAV6衣壳蛋白的氨基酸位置454或590处,
(iii)AAV2衣壳蛋白的氨基酸位置588处,
(iv)AAV3B衣壳蛋白的氨基酸位置589处,
(v)AAV5衣壳蛋白的氨基酸位置578处,
(vi)AAV8衣壳蛋白的氨基酸位置591处,或
(vi)AAV9衣壳蛋白的氨基酸位置266、455或589处,
其中所述位置对应于所述AAV血清型中VP1的编号。
248.一种药物组合物,其包含权利要求237-247中任一项所述的AAV载体和药学上可接受的载体。
249.一种肽,其包含SEQ ID NO:1-32中任一所示的氨基酸序列。
250.一种肽,其包含SEQ ID NO:68-110中任一所示的氨基酸序列。
251.一种肽,其包含SEQ ID NO:71、76-80、83、89、91、94-96、101-103和106中任一所示的氨基酸序列。
252.一种肽,其包含SEQ ID NO:71、76-80、83和94-96中任一所示的氨基酸序列。
253.一种肽,其包含SEQ ID NO:89、91、101-103和106中任一所示的氨基酸序列。
254.一种肽,其包含SEQ ID NO:68至SEQ ID NO:75中任一所示的氨基酸序列。
255.一种肽,其包含SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO: 3中任一所示的氨基酸序列。
256.一种肽,其包含SEQ ID NO:71中所示的氨基酸序列。
257.一种肽,其包含SEQ ID NO:90至SEQ ID NO:110中任一所示的氨基酸序列。
258.一种肽,其包含SEQ ID NO:95、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:101、SEQID NO:103、SEQ ID NO:106、SEQ ID NO:91和SEQ ID NO:102中任一所示的氨基酸序列。
259.一种肽,其包含SEQ ID NO:4-7中任一所示的氨基酸序列。
260.一种肽,其包含SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:77、SEQ ID NO:79、SEQID NO:76和SEQ ID NO:83中任一所示的氨基酸序列。
261.一种肽,其包含SEQ ID NO:8至SEQ ID NO:11中任一所示的氨基酸序列。
262.一种肽,其包含SEQ ID NO:28至SEQ ID NO:32中任一所示的氨基酸序列。
263.一种肽,其包含SEQ ID NO:19至SEQ ID NO:27中任一所示的氨基酸序列。
264.一种肽,其包含SEQ ID NO:12至SEQ ID NO:18中任一所示的氨基酸序列。
265.一种肽,其包含SEQ ID NO:86至SEQ ID NO:89中任一所示的氨基酸序列。
266.一种肽,其包含SEQ ID NO:89中所示的氨基酸序列。
267.根据权利要求249-266中任一项所述的肽,其中所述肽是AAV载体的一部分。
268.根据权利要求267所述的肽,其中所述肽是AAV载体的衣壳蛋白的一部分。
269.一种编码权利要求249-268中任一项所述的肽的核酸分子。
270.一种衣壳蛋白,其包含含有SEQ ID NO:1-32中任一所示的氨基酸序列的至少4个连续氨基酸的肽。
271.一种衣壳蛋白,其包含含有SEQ ID NO:68-110中任一所示的氨基酸序列的至少4个连续氨基酸的肽。
272.根据权利要求270所述的衣壳蛋白,其中所述肽包含在SEQ ID NO:1-32中任一所示的氨基酸序列。
273.根据权利要求271所述的衣壳蛋白,其中所述肽包含SEQ ID NO:68-110中任一所示的氨基酸序列。
274.根据权利要求270所述的衣壳蛋白,其包含SEQ ID NO:1-32中任一所示的氨基酸序列。
275.根据权利要求271所述的衣壳蛋白,其包含SEQ ID NO:68-110中任一所示的氨基酸序列。
276.根据权利要求271所述的衣壳蛋白,其中所述肽包含SEQ ID NO:71、76-80、83、89、91、94-96、101-103和106中任一所示的氨基酸序列。
277.根据权利要求271所述的衣壳蛋白,其中所述肽包含SEQ ID NO:71、76-80、83和94-96中任一所示的氨基酸序列。
278.根据权利要求271所述的衣壳蛋白,其中所述肽包含SEQ ID NO:89、91、101-103和106中任一所示的氨基酸序列。
279.根据权利要求271所述的衣壳蛋白,其中所述肽包含SEQ ID NO:68至SEQ ID NO:75中任一所示的氨基酸序列。
280.根据权利要求270所述的衣壳蛋白,其中所述肽包含SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3中任一所示的氨基酸序列。
281.根据权利要求271所述的衣壳蛋白,其中所述肽包含在SEQ ID NO:71中所示的氨基酸序列。
282.根据权利要求271所述的衣壳蛋白,其中所述肽包含SEQ ID NO:90至SEQ ID NO:110中任一所示的氨基酸序列。
283.根据权利要求271所述的衣壳蛋白,其中所述肽包含SEQ ID NO:95、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:106、SEQ ID NO:91和SEQID NO:102中任一所示的氨基酸序列。
284.根据权利要求270所述的衣壳蛋白,其中所述肽包含SEQ ID NO:4-7中任一所示的氨基酸序列。
285.根据权利要求271所述的衣壳蛋白,其中所述肽包含SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:76和SEQ ID NO:83中任一所示的氨基酸序列。
286.根据权利要求270所述的衣壳蛋白,其中所述肽包含SEQ ID NO:8至SEQ ID NO:11中任一所示的氨基酸序列。
287.根据权利要求270所述的衣壳蛋白,其中所述肽包含SEQ ID NO:28至SEQ ID NO:32中任一所示的氨基酸序列。
288.根据权利要求270所述的衣壳蛋白,其中所述肽包含SEQ ID NO:19至SEQ ID NO:27中任一所示的氨基酸序列。
289.根据权利要求270所述的衣壳蛋白,其中所述肽包含SEQ ID NO:12至SEQ ID NO:18中任一所示的氨基酸序列。
290.根据权利要求271的衣壳蛋白,其中所述肽包含SEQ ID NO:86至SEQ ID NO:89中任一所示的氨基酸序列。
291.根据权利要求271所述的衣壳蛋白,其中所述肽包含SEQ ID NO:89中所示的氨基酸序列。
292.一种编码权利要求269-291中任一项所述的衣壳蛋白的核酸分子。
293.一种将核酸递送至受试者的靶细胞或组织的方法,包括:施用包含根据权利要求237-247中任一项的AAV载体的组合物。
294.根据权利要求293所述的方法,其中所述衣壳蛋白包含SEQ ID NO:1-32中任一所示的氨基酸序列。
295.根据权利要求293所述的方法,其中所述衣壳蛋白包含SEQ ID NO:68-110中任一所示的氨基酸序列。
296.根据权利要求293-295中任一项所述的方法,其中所述靶细胞、细胞系或组织选自CNS、心脏、肺、气管、食道、肌肉、骨、软骨、胃、胰腺、肠、肝脏、膀胱、肾脏、输尿管、尿道、子宫、输卵管、卵巢、睾丸、前列腺、眼睛、血液、淋巴和口腔粘膜。
297.根据权利要求293-295中任一项所述的方法,其中所述靶细胞选自神经元、神经胶质细胞、星形胶质细胞、少突胶质细胞、小神经胶质细胞、雪旺细胞、室管膜细胞、肝细胞、星状脂肪储存细胞、枯否氏细胞、肝内皮细胞、上皮细胞、心肌细胞、平滑肌细胞、T细胞、B细胞、造血干细胞和胚胎干细胞。
298.根据权利要求296所述的方法,其中所述靶细胞或组织来自肝脏。
299.根据权利要求296所述的方法,其中所述靶细胞或组织来自CNS。
300.一种药物组合物,其包含权利要求135-211中任一项所述的变体和药学上可接受的载体。
301.根据权利要求116所述的文库,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV1血清型的衣壳蛋白的氨基酸位置590处。
302.根据权利要求116所述的文库,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV1血清型的衣壳蛋白的氨基酸位置590处。
303.根据权利要求302所述的文库,其中所述肽包含SEQ ID NO:68-75中任一项的氨基酸序列。
304.根据权利要求302所述的文库,其中所述肽包含氨基酸序列SEQ ID NO:71。
305.根据权利要求301所述的文库,其中所述肽包含选自由SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3中任一项组成的组的氨基酸序列。
306.根据权利要求116所述的文库,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV6血清型的衣壳蛋白的氨基酸位置454处。
307.根据权利要求116所述的文库,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV6血清型的衣壳蛋白的氨基酸位置454处。
308.根据权利要求116所述的文库,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV6血清型的衣壳蛋白的氨基酸位置590处。
309.根据权利要求116所述的文库,其中包含SEQ ID NO:68-110任一项的氨基酸序列的肽被插入在AAV6血清型的衣壳蛋白的氨基酸位置590处。
310.根据权利要求306和308中任一项所述的文库,其中所述肽包含SEQ ID NO:19至SEQ ID NO:27中任一项的氨基酸序列。
311.根据权利要求116所述的文库,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV2血清型的衣壳蛋白的氨基酸位置588处。
312.根据权利要求116所述的文库,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV2血清型的衣壳蛋白的氨基酸位置588处。
313.根据权利要求312所述的文库,其中所述肽包含选自由SEQ ID NO:90至SEQ IDNO:110中任一项组成的组的氨基酸序列。
314.根据权利要求312所述的文库,其中所述肽包含选自由SEQ ID NO:95、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:106、SEQ ID NO:91和SEQID NO:102中任一项组成的组的氨基酸序列。
315.根据权利要求311所述的文库,其中所述肽包含选自由SEQ ID NO:4-7中任一项组成的组的氨基酸序列。
316.根据权利要求116所述的文库,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV3B血清型的衣壳蛋白的氨基酸位置589处。
317.根据权利要求116所述的文库,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV3B血清型的衣壳蛋白的氨基酸位置589处。
318.根据权利要求317所述的文库,其中所述肽包含选自由SEQ ID NO:76-85中任一项组成的组的氨基酸序列。
319.根据权利要求317所述的文库,其中所述肽包含选自由SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:76和SEQ ID NO:83中任一项组成的组的氨基酸序列。
320.根据权利要求316所述的文库,其中所述肽包含选自由SEQ ID NO:8至SEQ ID NO:11中任一项组成的组的氨基酸序列。
321.根据权利要求116所述的文库,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV5血清型的衣壳蛋白的氨基酸位置578处。
322.根据权利要求116所述的文库,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入AAV5血清型的衣壳蛋白的氨基酸位置578处。
323.根据权利要求321所述的文库,其中所述肽包含选自由SEQ ID NO:28至SEQ IDNO:32中任一项组成的组的氨基酸序列。
324.根据权利要求116所述的文库,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV8血清型的衣壳蛋白的氨基酸位置591处。
325.根据权利要求116所述的文库,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV8血清型的衣壳蛋白的氨基酸位置591处。
326.根据权利要求116所述的文库,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置266处。
327.根据权利要求116所述的文库,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置266处。
328.根据权利要求116所述的文库,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置455处。
329.根据权利要求116所述的文库,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置455处。
330.根据权利要求116所述的文库,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置589处。
331.根据权利要求116所述的文库,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置589处。
332.根据权利要求326、328和330中任一项所述的文库,其中所述肽包含选自由SEQ IDNO:12至SEQ ID NO:18中任一项组成的组的氨基酸序列。
333.根据权利要求327、329和331中任一项所述的文库,其中所述肽包含选自由SEQ IDNO:86至SEQ ID NO:89中任一项组成的组的氨基酸序列。
334.根据权利要求327、329和331中任一项所述的文库,其中所述肽包含SEQ ID NO:89的序列。
335.根据权利要求173所述的AAV变体,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV1血清型的衣壳蛋白的氨基酸位置590处。
336.根据权利要求173所述的AAV变体,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV1血清型的衣壳蛋白的氨基酸位置590处。
337.根据权利要求336所述的AAV变体,其中所述肽包含选自由SEQ ID NO:68至SEQ IDNO:75中任一项组成的组的氨基酸序列。
338.根据权利要求336所述的AAV变体,其中所述肽包含氨基酸序列SEQ ID NO:71。
339.根据权利要求335所述的AAV变体,其中所述肽包含选自由SEQ ID NO:1、SEQ IDNO:2和SEQ ID NO:3中任一项组成的组的氨基酸序列。
340.根据权利要求173所述的AAV变体,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV6血清型的衣壳蛋白的氨基酸位置454处。
341.根据权利要求173所述的AAV变体,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV6血清型的衣壳蛋白的氨基酸位置454处。
342.根据权利要求173所述的AAV变体,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV6血清型的衣壳蛋白的氨基酸位置590处。
343.根据权利要求173所述的AAV变体,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV6血清型的衣壳蛋白的氨基酸位置590处。
344.根据权利要求340和342中任一项所述的AAV变体,其中所述肽包含选自由SEQ IDNO:19至SEQ ID NO:27中任一项组成的组的氨基酸序列。
345.根据权利要求173所述的AAV变体,其中包含SEQ ID NO:1-32的氨基酸序列的肽被插入在AAV2血清型的衣壳蛋白的氨基酸位置588处。
346.根据权利要求173所述的AAV变体,其中包含SEQ ID NO:68-110的氨基酸序列的肽被插入在AAV2血清型的衣壳蛋白的氨基酸位置588处。
347.根据权利要求346所述的AAV变体,其中所述肽包含选自由SEQ ID NO:90至SEQ IDNO:110中任一项组成的组的氨基酸序列。
348.根据权利要求346所述的AAV变体,其中所述肽包含选自由SEQ ID NO:95、SEQ IDNO:94、SEQ ID NO:96、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:106、SEQ ID NO:91和SEQ ID NO:102中任一项组成的组的氨基酸序列。
349.根据权利要求345所述的AAV变体,其中所述肽包含选自由SEQ ID NO:4-7中任一项组成的组的氨基酸序列。
350.根据权利要求173所述的AAV变体,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV3B血清型的衣壳蛋白的氨基酸位置589处。
351.根据权利要求173所述的AAV变体,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV3B血清型的衣壳蛋白的氨基酸位置589处。
352.根据权利要求351所述的AAV变体,其中所述肽包含选自由SEQ ID NO:78、SEQ IDNO:80、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:76和SEQ ID NO:83中任一项组成的组的氨基酸序列。
353.根据权利要求350所述的AAV变体,其中所述肽包含选自由SEQ ID NO:8至SEQ IDNO:11中任一项组成的组的氨基酸序列。
354.根据权利要求173所述的AAV变体,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV5血清型的衣壳蛋白的氨基酸位置578处。
355.根据权利要求173所述的AAV变体,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV5血清型的衣壳蛋白的氨基酸位置578处。
356.根据权利要求354所述的AAV变体,其中所述肽包含选自由SEQ ID NO:28至SEQ IDNO:32中任一项组成的组的氨基酸序列。
357.根据权利要求173所述的AAV变体,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV8血清型的衣壳蛋白的氨基酸位置591处。
358.根据权利要求173所述的AAV变体,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV8血清型的衣壳蛋白的氨基酸位置591处。
359.根据权利要求173所述的AAV变体,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置266处。
360.根据权利要求173所述的AAV变体,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置266处。
361.根据权利要求173所述的AAV变体,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置455处。
362.根据权利要求173所述的AAV变体,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置455处。
363.根据权利要求173所述的AAV变体,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置589处。
364.根据权利要求173所述的AAV变体,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置589处。
365.根据权利要求359、361和363中任一项所述的AAV变体,其中所述肽包含选自由SEQID NO:12至SEQ ID NO:18中任一项组成的组的氨基酸序列。
366.根据权利要求360、362和364中任一项所述的AAV变体,其中所述肽包含选自由SEQID NO:86至SEQ ID NO:89中任一项组成的组的氨基酸序列。
367.根据权利要求360、362和364中任一项所述的AAV变体,其中所述肽包含SEQ IDNO:89的序列。
368.根据权利要求247所述的AAV载体,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV1血清型的衣壳蛋白的氨基酸位置590处。
369.根据权利要求247所述的AAV载体,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV1血清型的衣壳蛋白的氨基酸位置590处。
370.根据权利要求369所述的AAV载体,其中所述肽包含选自由SEQ ID NO:68至SEQ IDNO:75中任一项组成的组的氨基酸序列。
371.根据权利要求369所述的AAV载体,其中所述肽包含氨基酸序列SEQ ID NO:71。
372.根据权利要求368所述的AAV载体,其中所述肽包含选自由SEQ ID NO:1、SEQ IDNO:2和SEQ ID NO:3中任一项组成的组的氨基酸序列。
373.根据权利要求247所述的AAV载体,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV6血清型的衣壳蛋白的氨基酸位置454处。
374.根据权利要求247所述的AAV载体,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV6血清型的衣壳蛋白的氨基酸位置454处。
375.根据权利要求247所述的AAV载体,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV6血清型的衣壳蛋白的氨基酸位置590处。
376.根据权利要求247所述的AAV载体,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV6血清型的衣壳蛋白的氨基酸位置590处。
377.根据权利要求373和375中任一项所述的AAV载体,其中所述肽包含选自由SEQ IDNO:19至SEQ ID NO:27中任一项组成的组的氨基酸序列。
378.根据权利要求247所述的AAV载体,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV2血清型的衣壳蛋白的氨基酸位置588处。
379.根据权利要求247所述的AAV载体,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV2血清型的衣壳蛋白的氨基酸位置588处。
380.根据权利要求379所述的AAV载体,其中所述肽包含选自由SEQ ID NO:90至SEQ IDNO:110中任一项组成的组的氨基酸序列。
381.根据权利要求379所述的AAV载体,其中所述肽包含选自由SEQ ID NO:95、SEQ IDNO:94、SEQ ID NO:96、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:106、SEQ ID NO:91和SEQ ID NO:102中任一项组成的组的氨基酸序列。
382.根据权利要求378所述的AAV载体,其中所述肽包含选自由SEQ ID NO:4-7中任一项组成的组的氨基酸序列。
383.根据权利要求247所述的AAV载体,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV3B血清型的衣壳蛋白的氨基酸位置589处。
384.根据权利要求247所述的AAV载体,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV3B血清型的衣壳蛋白的氨基酸位置589处。
385.根据权利要求384所述的AAV载体,其中所述肽包含选自由SEQ ID NO:78、SEQ IDNO:80、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:76和SEQ ID NO:83中任一项组成的组的氨基酸序列。
386.根据权利要求383的AAV载体,其中所述肽包含选自由SEQ ID NO:8至SEQ ID NO:11中任一项组成的组的氨基酸序列。
387.根据权利要求247所述的AAV载体,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV5血清型的衣壳蛋白的氨基酸位置578处。
388.根据权利要求247所述的AAV载体,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV5血清型的衣壳蛋白的氨基酸位置578处。
389.根据权利要求387所述的AAV载体,其中所述肽包含选自由SEQ ID NO:28至SEQ IDNO:32中任一项组成的组的氨基酸序列。
390.根据权利要求247所述的AAV载体,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV8血清型的衣壳蛋白的氨基酸位置591处。
391.根据权利要求247所述的AAV载体,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV8血清型的衣壳蛋白的氨基酸位置591处。
392.根据权利要求247所述的AAV载体,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置266处。
393.根据权利要求247所述的AAV载体,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置266处。
394.根据权利要求247所述的AAV载体,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置455处。
395.根据权利要求247所述的AAV载体,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置455处。
396.根据权利要求247所述的AAV载体,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置589处。
397.根据权利要求247所述的AAV载体,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV9血清型的衣壳蛋白的氨基酸位置589处。
398.根据权利要求392、394和396中任一项所述的AAV载体,其中所述肽包含选自由SEQID NO:12至SEQ ID NO:18中任一项组成的组的氨基酸序列。
399.根据权利要求393、395和397中任一项所述的AAV载体,其中所述肽包含选自由SEQID NO:86至SEQ ID NO:89中任一项组成的组的氨基酸序列。
400.根据权利要求393、395和397中任一项所述的AAV载体,其中所述肽包含SEQ IDNO:89的序列。
401.一种包含插入肽的衣壳蛋白,其中所述肽被插入于:
(i)AAV1衣壳蛋白的氨基酸位置590处,
(ii)AAV6衣壳蛋白的氨基酸位置454或590处,
(iii)AAV2衣壳蛋白的氨基酸位置588处,
(iv)AAV3B衣壳蛋白的氨基酸位置589处,
(v)AAV5衣壳蛋白的氨基酸位置578处,
(vi)AAV8衣壳蛋白的氨基酸位置591处,或
(vi)AAV9衣壳蛋白的氨基酸位置266、455或589处,
其中所述位置对应于AAV血清型中VP1的编号。
402.根据权利要求401所述的衣壳蛋白,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV1血清型衣壳蛋白的氨基酸位置590处。
403.根据权利要求401所述的衣壳蛋白,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV1血清型衣壳蛋白的氨基酸位置590处。
404.根据权利要求403所述的衣壳蛋白,其中所述肽包含选自由SEQ ID NO:68至SEQID NO:75中任一项组成的组的氨基酸序列。
405.根据权利要求403所述的衣壳蛋白,其中所述肽包含氨基酸序列SEQ ID NO:71。
406.根据权利要求402所述的衣壳蛋白,其中所述肽包含选自由SEQ ID NO:1、SEQ IDNO:2和SEQ ID NO:3中任一项组成的组的氨基酸序列。
407.根据权利要求401所述的衣壳蛋白,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV6血清型的衣壳蛋白的氨基酸位置454处。
408.根据权利要求401所述的衣壳蛋白,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV6血清型的衣壳蛋白的氨基酸位置454处。
409.根据权利要求401所述的衣壳蛋白,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV6血清型的衣壳蛋白的氨基酸位置590处。
410.根据权利要求401所述的衣壳蛋白,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV6血清型的衣壳蛋白的氨基酸位置590处。
411.根据权利要求407和409中任一项所述的衣壳蛋白,其中所述肽包含选自由SEQ IDNO:19至SEQ ID NO:27中任一项组成的组的氨基酸序列。
412.根据权利要求401所述的衣壳蛋白,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV2血清型的衣壳蛋白的氨基酸位置588处。
413.根据权利要求401所述的衣壳蛋白,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV2血清型的衣壳蛋白的氨基酸位置588处。
414.根据权利要求413所述的衣壳蛋白,其中所述肽包含选自由SEQ ID NO:90至SEQID NO:110中任一项组成的组的氨基酸序列。
415.根据权利要求413所述的衣壳蛋白,其中所述肽包含选自由SEQ ID NO:95、SEQ IDNO:94、SEQ ID NO:96、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:106、SEQ ID NO:91和SEQ ID NO:102中任一项组成的组的氨基酸序列。
416.根据权利要求412所述的衣壳蛋白,其中所述肽包含选自由SEQ ID NO:4-7中任一项组成的组的氨基酸序列。
417.根据权利要求401所述的衣壳蛋白,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽被插入在AAV3B血清型的衣壳蛋白的氨基酸位置589处。
418.根据权利要求401所述的衣壳蛋白,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽被插入在AAV3B血清型的衣壳蛋白的氨基酸位置589处。
419.根据权利要求418所述的衣壳蛋白,其中所述肽包含选自由SEQ ID NO:78、SEQ IDNO:80、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:76和SEQ ID NO:83中任一项组成的组的氨基酸序列。
420.根据权利要求417所述的衣壳蛋白,其中所述肽包含选自由SEQ ID NO:8至SEQ IDNO:11中任一项组成的组的氨基酸序列。
421.根据权利要求401所述的衣壳蛋白,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽插入在AAV5血清型的衣壳蛋白的氨基酸位置578处。
422.根据权利要求401所述的衣壳蛋白,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽插入在AAV5血清型的衣壳蛋白的氨基酸位置578处。
423.根据权利要求421所述的衣壳蛋白,其中所述肽包含选自由SEQ ID NO:28至SEQID NO:32中任一项组成的组的氨基酸序列。
424.根据权利要求401的衣壳蛋白,其中包含SEQ ID NO:1-32的氨基酸序列的肽插入在AAV8血清型的衣壳蛋白的氨基酸位置591处。
425.根据权利要求401所述的衣壳蛋白,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽插入在AAV8血清型的衣壳蛋白的氨基酸位置591处。
426.根据权利要求401所述的衣壳蛋白,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽插入在AAV9血清型的衣壳蛋白的氨基酸位置266处。
427.根据权利要求401所述的衣壳蛋白,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽插入在AAV9血清型的衣壳蛋白的氨基酸位置266处。
428.根据权利要求401所述的衣壳蛋白,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽插入在AAV9血清型的衣壳蛋白的氨基酸位置455处。
429.根据权利要求401所述的衣壳蛋白,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽插入在AAV9血清型的衣壳蛋白的氨基酸位置455处。
430.根据权利要求401所述的衣壳蛋白,其中包含SEQ ID NO:1-32中任一项的氨基酸序列的肽插入在AAV9血清型的衣壳蛋白的氨基酸位置589处。
431.根据权利要求401所述的衣壳蛋白,其中包含SEQ ID NO:68-110中任一项的氨基酸序列的肽插入在AAV9血清型的衣壳蛋白的氨基酸位置589处。
432.根据权利要求426、428和430中任一项所述的衣壳蛋白,其中所述肽包含选自由SEQ ID NO:12至SEQ ID NO:18中任一项组成的组的氨基酸序列。
433.根据权利要求427、429和431中任一项所述的衣壳蛋白,其中所述肽包含选自由SEQ ID NO:86至SEQ ID NO:89中任一项组成的组的氨基酸序列。
434.根据权利要求427、429和431中任一项所述的衣壳蛋白,其中所述肽包含SEQ IDNO:89的序列。
435.一种编码权利要求401至434中任一项所述的衣壳蛋白的核酸分子。
CN202080044908.6A 2019-04-26 2020-04-24 Aav工程化 Pending CN114269926A (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201962839421P 2019-04-26 2019-04-26
US62/839,421 2019-04-26
US201962915386P 2019-10-15 2019-10-15
US62/915,386 2019-10-15
US201962939094P 2019-11-22 2019-11-22
US62/939,094 2019-11-22
PCT/US2020/029964 WO2020219988A2 (en) 2019-04-26 2020-04-24 Engineering aav

Publications (1)

Publication Number Publication Date
CN114269926A true CN114269926A (zh) 2022-04-01

Family

ID=70740764

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080044908.6A Pending CN114269926A (zh) 2019-04-26 2020-04-24 Aav工程化

Country Status (11)

Country Link
US (1) US11981967B2 (zh)
EP (1) EP3959226A2 (zh)
JP (1) JP2022530457A (zh)
KR (1) KR20220012249A (zh)
CN (1) CN114269926A (zh)
AU (1) AU2020261435A1 (zh)
CA (1) CA3137961A1 (zh)
IL (1) IL287406A (zh)
SG (1) SG11202111616RA (zh)
TW (1) TW202106700A (zh)
WO (1) WO2020219988A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116621935A (zh) * 2022-12-08 2023-08-22 广州派真生物技术有限公司 腺相关病毒突变体及其应用

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3856913A4 (en) 2018-09-26 2022-10-26 California Institute Of Technology ADENO-ASSOCIATED VIRUS COMPOSITIONS FOR TARGETED GENE THERAPY
EP4149955A1 (en) 2020-05-13 2023-03-22 Voyager Therapeutics, Inc. Redirection of tropism of aav capsids
US20230384310A1 (en) * 2020-10-01 2023-11-30 Sangamo Therapeutics, Inc. Methods of detecting anti-aav antibodies
IL303498A (en) * 2020-12-09 2023-08-01 Scribe Therapeutics Inc AAV vectors for gene editing
CA3242085A1 (en) * 2021-12-23 2023-06-29 Francisco Leon Methods and compositions for treating barth syndrome
US20230340627A1 (en) * 2022-04-05 2023-10-26 Bio-Rad Laboratories, Inc. Analysis of viral particles by digital assay
WO2024120528A1 (en) * 2022-12-08 2024-06-13 Huidagene Therapeutics (Singapore) Pte. Ltd. Improved system for producing rna-packaged aav particles

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5422251A (en) 1986-11-26 1995-06-06 Princeton University Triple-stranded nucleic acids
US5176996A (en) 1988-12-20 1993-01-05 Baylor College Of Medicine Method for making synthetic oligonucleotides which bind specifically to target sites on duplex DNA molecules, by forming a colinear triplex, the synthetic oligonucleotides and methods of use
US20030215422A1 (en) 1996-09-11 2003-11-20 John A. Chiorini Aav4 vector and uses thereof
US6156303A (en) 1997-06-11 2000-12-05 University Of Washington Adeno-associated virus (AAV) isolates and AAV vectors derived therefrom
JP4060531B2 (ja) 1998-05-28 2008-03-12 アメリカ合衆国 Aav5ベクターおよびその使用
CA2349838C (en) 1998-11-05 2011-06-07 The Trustees Of The University Of Pennsylvania Adeno-associated virus serotype 1 nucleic acid sequences, vectors and host cells containing same
WO2001055387A1 (en) * 2000-01-31 2001-08-02 Human Genome Sciences, Inc. Nucleic acids, proteins, and antibodies
US20080148432A1 (en) * 2005-12-21 2008-06-19 Mark Scott Abad Transgenic plants with enhanced agronomic traits
EP2489726A3 (en) * 2005-01-12 2012-11-28 Monsanto Technology LLC Genes and uses for plant improvement
US8586526B2 (en) 2010-05-17 2013-11-19 Sangamo Biosciences, Inc. DNA-binding proteins and uses thereof
EA030101B1 (ru) * 2012-01-18 2018-06-29 Унилевер Н.В. Композиция шампуня и способ обработки волос
WO2017196432A1 (en) * 2016-05-12 2017-11-16 La Jolla Institute For Allergy And Immunology Compositions and methods for diagnosing and treating neurodegenerative disease
WO2018189244A1 (en) * 2017-04-11 2018-10-18 Ruprecht-Karls-Universität Heidelberg Adeno-associated virus library

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116621935A (zh) * 2022-12-08 2023-08-22 广州派真生物技术有限公司 腺相关病毒突变体及其应用
CN116621935B (zh) * 2022-12-08 2024-01-26 广州派真生物技术有限公司 腺相关病毒突变体及其应用

Also Published As

Publication number Publication date
WO2020219988A3 (en) 2020-12-03
KR20220012249A (ko) 2022-02-03
IL287406A (en) 2021-12-01
US20200370137A1 (en) 2020-11-26
TW202106700A (zh) 2021-02-16
JP2022530457A (ja) 2022-06-29
US11981967B2 (en) 2024-05-14
SG11202111616RA (en) 2021-11-29
AU2020261435A1 (en) 2021-11-25
EP3959226A2 (en) 2022-03-02
CA3137961A1 (en) 2020-10-29
WO2020219988A2 (en) 2020-10-29

Similar Documents

Publication Publication Date Title
CN114269926A (zh) Aav工程化
US11613766B2 (en) Adeno-associated virus variant capsids and methods of use thereof
US20230048732A1 (en) High throughput engineering of functional aav capsids
CN111718420B (zh) 一种用于基因治疗的融合蛋白及其应用
US20230049066A1 (en) Novel aav3b variants that target human hepatocytes in the liver of humanized mice
WO2020187268A1 (zh) 一种增强基因编辑的融合蛋白及其应用
US12037362B2 (en) Hybrid recombinant adeno-associated virus serotype between AAV9 and AAVrh74 with reduced liver tropism
WO2020187272A1 (zh) 一种用于基因治疗的融合蛋白及其应用
US20210107948A1 (en) Hybrid Recombinant Adeno-Associated Virus Serotype Between AAV9 and AAVrh74 with Reduced Liver Tropism
CA3220800A1 (en) Capsid variants and methods of using the same
CA3220810A1 (en) Capsid variants and methods of using the same
KR20230003554A (ko) 낮은 전사 활성을 갖는 프로모터를 사용하여 뉴클레아제 발현 및 표적-외 활성을 감소시키기 위한 조성물 및 방법
CN117377500A (zh) 具有改善的组织向性的腺相关病毒载体衣壳

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination