CN116209769A - 新型aav衣壳和含有新型aav衣壳的组合物 - Google Patents

新型aav衣壳和含有新型aav衣壳的组合物 Download PDF

Info

Publication number
CN116209769A
CN116209769A CN202180070175.8A CN202180070175A CN116209769A CN 116209769 A CN116209769 A CN 116209769A CN 202180070175 A CN202180070175 A CN 202180070175A CN 116209769 A CN116209769 A CN 116209769A
Authority
CN
China
Prior art keywords
seq
acid sequence
aav
aavrh91
capsid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180070175.8A
Other languages
English (en)
Inventor
J·M·威尔逊
K·纳姆比亚
王强
J·A·西德兰
R·A·马丁诺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Pennsylvania Penn
Original Assignee
University of Pennsylvania Penn
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Pennsylvania Penn filed Critical University of Pennsylvania Penn
Publication of CN116209769A publication Critical patent/CN116209769A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0008Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
    • A61K48/0016Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition wherein the nucleic acid is delivered as a 'naked' nucleic acid, i.e. not combined with an entity such as a cationic lipid
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/0012Galenical forms characterised by the site of application
    • A61K9/0019Injectable compositions; Intramuscular, intravenous, arterial, subcutaneous administration; Compositions to be administered through the skin in an invasive manner
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0075Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the delivery route, e.g. oral, subcutaneous
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14145Special targeting system for viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14151Methods of production or purification of viral material
    • C12N2750/14152Methods of production or purification of viral material relating to complementing cells and packaging systems for producing virus or viral particles
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14171Demonstrated in vivo effect

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • Wood Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Virology (AREA)
  • Biophysics (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Dermatology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

本文提供了新型AAV衣壳和包括所述新型AAV衣壳的重组AAV载体。在一个实施例中,与现有技术的AAV相比,采用新型AAV衣壳的载体显示所选靶组织的转导增加。

Description

新型AAV衣壳和含有新型AAV衣壳的组合物
背景技术
腺相关病毒(AAV)载体是用于若干种临床适应症的安全且有效的基因转移媒剂。基于AAV载体的治疗方法已被美国食品和药物管理局(US Food and DrugAdministration)和其它全球监管机构批准用于治疗莱伯氏先天性黑蒙(Lebercongenital amaurosis)、脂蛋白脂肪酶缺乏和脊髓性肌萎缩。这些获批的基因疗法产品利用从天然来源分离的AAV衣壳作为递送媒剂。AAV衣壳基因的序列和结构多样性导致在病毒进化枝之间观察到的病毒嗜性、抗原性和包装效率的变异性。发现具有一系列组织嗜性的新型衣壳对于推进和扩展基因疗法平台是必要的。
在过去的二十年中,通过修改衣壳蛋白以赋予特定组织类型增加的嗜性或逃避抗AAV中和抗体的AAV工程化已成为衣壳开发的主要途径。然而,从如从不同动物培养的组织、血液或病毒制剂等自然来源中分离AAV仍然是用于鉴定适合临床应用的新型AAV的主要方法。抗AAV抗体已在多种哺乳动物来源中发现,表明AAV储库庞大。
由于AAV的低免疫原性和非致病性,AAV是基因疗法最有效的候选载体之一。然而,尽管允许有效的基因转移,但目前在临床中使用的AAV载体可能会受到对病毒的预先存在的免疫力和限制的组织嗜性的阻碍。需要新的和更有效的AAV载体。
发明内容
一方面,本文提供了一种将转基因递送到受试者的中枢神经系统(CNS)的一个或多个靶细胞的方法,所述方法包括向所述受试者施用包括AAVrh91衣壳和包括所述转基因的载体基因组的重组腺相关病毒(AAV)载体,所述转基因可操作地连接到调控序列,所述调控序列引导所述转基因在所述CNS的所述靶细胞中的表达。在某些实施例中,所述CNS的所述靶细胞是实质细胞、脉络丛细胞、室管膜细胞、星形胶质细胞和/或神经元,任选地皮质、海马体和/或纹状体的神经元。在某些实施例中,转基因编码分泌的基因产物。在某些实施例中,AAV载体通过鞘内,任选地通过小脑延髓池内(ICM)注射递送。在某些实施例中,AAV载体通过脑实质内施用递送。
一方面,本文提供了一种用于在鞘内施用包括转基因的AAV载体后改善所述转基因向受试者的肝脏的递送的方法,所述方法包括通过ICM注射向所述受试者施用包括AAVrh91衣壳和包括所述转基因的载体基因组的重组AAV载体,所述转基因可操作地连接到调控序列,所述调控序列引导所述转基因在所述肝脏的靶细胞中的表达,其中肝脏的转导水平相对于使用具有AAV1、AAV9和/或AAV6.2衣壳的AAV载体实现的转导水平得到提高。
一方面,本文提供了一种用于在向受试者全身施用AAV载体后使肝脏脱靶和/或降低肝脏毒性的方法,所述方法包括通过静脉内注射向所述受试者施用包括AAVrh91衣壳和包括转基因的载体基因组的重组AAV载体,所述转基因可操作地连接到调控序列,所述调控序列引导所述转基因在所述肝脏的细胞中的表达,其中在施用所述AAV载体后观察到的所述肝脏的转导水平和/或肝脏毒性相对于具有AAV1、AAV8和/或AAV9衣壳的AAV载体降低。在某些实施例中,所述AAVrh91衣壳包括衣壳蛋白,所述衣壳蛋白包括SEQ ID NO:2的氨基酸序列。在某些实施例中,所述AAVrh91衣壳包括衣壳蛋白,所述衣壳蛋白通过SEQ ID NO:1或3的核苷酸序列或与SEQ ID NO:1或3的核苷酸序列共享至少90%、至少95%、至少97%、至少98%或至少99%的序列的表达产生。在某些实施例中,所述AAVrh91衣壳包括衣壳蛋白,其中所述衣壳蛋白由SEQ ID NO:1或3的核苷酸序列编码。在某些实施例中,所述AAVrh91衣壳包括衣壳蛋白,所述衣壳蛋白包括:(1)AAVrh91 vp1蛋白的异质群体,所述AAVrh91 vp1蛋白选自以下:通过从编码SEQ ID NO:2的1至736的预测的氨基酸序列的核酸序列表达产生的vp1蛋白、由SEQ ID NO:1或3产生的vp1蛋白、或由与SEQ ID NO:1或3至少70%相同的核酸序列产生的vp1蛋白,所述核酸序列编码SEQ ID NO:2的1至736的所述预测的氨基酸序列,AAVrh91 vp2蛋白的异质群体,所述AAVrh91 vp2蛋白选自以下:通过从编码SEQ ID NO:2的至少约氨基酸138至736的预测的氨基酸序列的核酸序列表达产生的vp2蛋白、由包括SEQ ID NO:1或3的至少核苷酸412至2208的序列产生的vp2蛋白、或由与SEQ ID NO:1或3的至少核苷酸412至2208至少70%相同的核酸序列产生的vp2蛋白,所述核酸序列编码SEQ IDNO:2的至少约氨基酸138至736的预测的氨基酸序列,AAVrh91 vp3蛋白的异质群体,所述AAVrh91 vp3蛋白选自以下:通过从编码SEQ ID NO:2的至少约氨基酸203至736的预测的氨基酸序列的核酸序列表达产生的vp3蛋白、由包括SEQ ID NO:1或3的至少核苷酸607至2208的序列产生的vp3蛋白、或由与SEQ ID NO:1或3的至少核苷酸607至2208至少70%相同的核酸序列产生的vp3蛋白,所述核酸序列编码SEQ ID NO:2的至少约氨基酸203至736的预测的氨基酸序列;和/或(2)作为编码SEQ ID NO:2的所述氨基酸序列的核酸序列的产物的vp1蛋白的异质群体,作为编码SEQ ID NO:2的至少约氨基酸138至736的所述氨基酸序列的核酸序列的产物的vp2蛋白的异质群体,以及作为编码SEQ ID NO:2的至少氨基酸203至736的核酸序列的产物的vp3蛋白的异质群体,其中:所述vp1、vp2和vp3蛋白含有具有氨基酸修饰的亚群体,所述氨基酸修饰包括SEQ ID NO:2中的天冬酰胺-甘氨酸对中的至少两个高度脱酰胺化的天冬酰胺(N),并且任选地进一步包括包含其它脱酰胺化的氨基酸的亚群体,其中脱酰胺化引起氨基酸变化。
一方面,本文提供了一种可用于产生重组AAV的重组AAV产生系统,其中所述产生系统包括:(a)编码在位置418、547、584、588、598和/或642中的一个或多个位置处具有氨基酸取代(当与SEQ ID NO:2比对时)的AAV衣壳蛋白的核苷酸序列;(b)适合于包装到AAV衣壳中的核酸分子,所述核酸分子包括至少一个AAV反向末端重复序列(ITR)和编码基因产物的非AAV核酸序列,所述基因产物可操作地连接到引导所述产物在宿主细胞中的表达的序列;以及(c)足够的AAV rep功能和辅助功能,以允许将所述核酸分子包装到所述AAV衣壳中。在某些实施例中,(a)的所述核苷酸序列编码在所列举的位置中的一个或多个位置处具有取代的进化枝A衣壳蛋白。在某些实施例中,(a)的所述核苷酸序列编码在所列举的位置中的一个或多个位置处具有氨基酸取代的AAV1、AAVhu48R3、AAVhu48、AAVhu44、AAV.VR-355、AAV.VR-195、AAV6或AAV6.2衣壳蛋白。在某些实施例中,(a)的所述核苷酸序列编码具有一个或多个选自以下的氨基取代的衣壳蛋白的氨基酸序列:位置418处的Asp、位置547处的Asn、位置584处的Leu、位置588处的Asn、位置598处的Val和位置642处的His。在某些实施例中,(a)的所述核苷酸序列编码在Glu418、Ser547、Phe584、Ser588、Ala598和/或Asn642处具有氨基酸取代的SEQ ID NO:8(AAV1)的氨基酸序列,并且其中经编码的氨基酸序列与SEQIN NO:8至少95%相同或至少99%相同。在某些实施例中,(a)的所述核苷酸序列编码具有一个或多个选自以下的氨基取代的SEQ ID NO:8(AAV1)的氨基酸序列:位置418处的Asp、位置547处的Asn、位置584处的Leu、位置588处的Asn、位置598处的Val和位置642处的His,并且其中经编码的氨基酸序列与SEQ IN NO:8至少95%相同或至少99%相同。在某些实施例中,产生系统包括人胚肾293细胞。
一方面,本文提供了一种产生重组AAV的方法,所述方法包括培养含有以下的宿主细胞的步骤:(a)编码在位置418、547、584、588、598和642中的一个或多个位置处具有氨基酸取代(当与SEQ ID NO:2比对时)的AAV衣壳蛋白的核酸分子;(b)功能性rep基因;(c)包括AAV 5’ITR、AAV 3’ITR和转基因的迷你基因;以及(d)足够的辅助功能,以允许将所述迷你基因包装到AAV衣壳中。在某些实施例中,相对于未修饰的衣壳蛋白,所产生的重组AAV具有提高的产量和/或改变的细胞或组织嗜性。在某些实施例中,相对于未修饰的衣壳蛋白,所产生的重组AAV以更高水平转导CNS的细胞。在某些实施例中,(a)的所述所述核苷酸序列编码在所列举的位置中的一个或多个位置处具有取代的进化枝A衣壳蛋白。在某些实施例中,(a)的所述核苷酸序列编码具有所列举的取代中的一个或多个取代的AAV1、AAVhu48R3、AAVhu48、AAVhu44、AAV.VR-355、AAV.VR-195、AAV6或AAV6.2衣壳。在某些实施例中,(a)的所述核苷酸序列编码具有一个或多个选自以下的氨基取代的衣壳蛋白的氨基酸序列:位置418处的Asp、位置547处的Asn、位置584处的Leu、位置588处的Asn、位置598处的Val和位置642处的His。在某些实施例中,(a)的所述核苷酸序列编码在Glu418、Ser547、Phe584、Ser588、Ala598和/或Asn642处具有氨基酸取代的SEQ ID NO:8(AAV1)的氨基酸序列,并且其中经编码的氨基酸序列与SEQ IN NO:8至少95%相同或至少99%相同。在某些实施例中,(a)的所述核苷酸序列编码具有一个或多个选自以下的氨基取代的SEQ ID NO:8(AAV1)的氨基酸序列:位置418处的Asp、位置547处的Asn、位置584处的Leu、位置588处的Asn、位置598处的Val和位置642处的His,并且其中经编码的氨基酸序列与SEQ IN NO:8至少95%相同或至少99%相同。
一方面,本文提供了一种用于将转基因递送到受试者的中枢神经系统(CNS)的一个或多个靶细胞的重组AAV载体,其中所述重组AAV载体包括AAVrh91衣壳和包括所述转基因的载体基因组,所述转基因可操作地连接到调控序列,所述调控序列引导所述转基因在所述CNS的所述靶细胞中的表达。在某些实施例中,所述CNS的所述靶细胞是实质细胞、脉络丛细胞、室管膜细胞、星形胶质细胞和/或神经元,任选地皮质、海马体和/或纹状体的神经元。在某些实施例中,转基因编码分泌的基因产物。在某些实施例中,AAV载体通过鞘内,任选地通过小脑延髓池内(ICM)注射施用。在某些实施例中,AAV载体通过脑实质内施用递送。
一方面,本文提供了一种用于在鞘内施用包括转基因的AAV载体后将所述转基因递送到受试者的肝脏的重组AAV载体,其中所述重组AAV载体包括AAVrh91衣壳和包括所述转基因的载体基因组,所述转基因可操作地连接到调控序列,所述调控序列引导所述转基因在所述肝脏的靶细胞中的表达,其中所述肝脏的交易水平相对于使用具有AAV1、AAV9和/或AAV6.2衣壳的AAV载体实现的交易水平得到提高。
一方面,本文提供了一种用于在向受试者全身施用AAV载体后使肝脏脱靶和/或降低肝脏毒性的重组AAV载体,其中所述重组AAV载体包括AAVrh91衣壳和包括转基因的载体基因组,所述转基因可操作地连接到调控序列,所述调控序列引导所述转基因在所述肝脏的细胞中的表达,其中在施用所述AAV载体后观察到的所述肝脏的转导水平和/或肝脏毒性相对于具有AAV1、AAV8和/或AAV9衣壳的AAV载体降低。
这些组合物和方法的其它方面和优点在以下具体实施方式中进一步描述。
附图说明
图1示出了用于AAV-SGA工作流程的图。从恒河猴组织样品分离基因组DNA并且针对AAV衣壳基因的存在进行筛选。对AAV阳性DNA进行终点稀释且进行另一轮PCR。根据泊松分布,在不超过30%的孔中产生PCR产物的DNA稀释液在80%的时间内每个阳性PCR含有一个可扩增的DNA模板。使用Illumina MiSeq 2×150或2×250配对末端测序平台对阳性扩增子进行测序,并使用SPAdes组装器从头组装所得读段。
图2是示出了新型AAV天然分离物和代表性进化枝对照的DNA基因组序列的相邻连接系统发生的图。
图3A-图3D示出了AAVrh91(SEQ ID NO:1)、AAVrh91eng(SEQ ID NO:3)、AAV6.2(SEQ ID NO:5)和AAV1(SEQ ID NO:7)衣壳的核酸序列的比对。
图4A-图4B示出了AAVrh91(SEQ ID NO:2)、AAV6.2(SEQ ID NO:6)和AAV1(SEQ IDNO:8)衣壳的氨基酸序列的比对。
图5A-图5B示出了Huh7(图15A)和HEK293细胞(图15B)的体外转导分析以评估载体产量。AAV.CB7.CI.ffLuc转基因表达通过荧光素酶活性测定来测定。将载体以1×1010GC/mL的浓度施用于细胞。n=3。数据表示为平均值和SD;*p<0.01。
图6A-图6B示出了纯化后载体产量的分析。(图6A)基于衣壳的平均载体产量。(图6B)基于转基因的进化枝A衣壳载体产量。数据表示为平均值和SEM;*p<0.01。
图7A-图7C示出了AAVrh91载体制剂的质谱法分析结果。
图8A-图8D示出了注射后14天小鼠组织中的eGFP转基因生物分布。(图8A和图8B)以每只小鼠1×1012GC的剂量向C57BL/6小鼠IV注射含有CB7.CI.eGFP.WPRE.RBG的AAV衣壳(n=5)。(图8C中并且图8D)以每只小鼠1×1011GC的剂量向C57BL/6小鼠脑室内ICV注射含有CB7.CI.eGFP.WPRE.RBG的各种AAV衣壳(以6.9×1010GC/小鼠给药的进化枝A载体)(n=5)。值表示为平均值±SD;*p<0.01,**p<0.001。
图9A-图9B示出了IM递送AAV载体后骨骼肌中β-半乳糖苷酶表达的分析。向小鼠施用3×109GC的具有各种衣壳并含有pAAV.CMV.LacZ转基因的载体。在第20天,收集肌肉组织,并通过X-gal染色(较深染色)评估转基因表达。
图10示出了IM递送各种AAV载体后血清中mAb的含量。向B6小鼠施用1×1011GC的载体,所述载体在tMCK启动子下表达3D6抗体。
图11示出了表达3D6或LacZ转基因的载体的产率(相对于AAV8)。
图12示出了NHP中汇集的带条形码的载体研究的实验设计(图13A-图13D中示出的数据)。五个新型衣壳和五个对照(AAVrh.90、AAVrh91、AAVrh.92、AAVrh.93、AAVrh91.93、AAV8、AAV6.2、AAVrh32.33、AAV7和AAV9)用具有独特6bp条形码的改良的ATG耗尽GFP转基因包装。将载体以等量汇集并在食蟹猴体内IV或ICM注射(总剂量:2×1013GC/kg IV和3×1013GC ICM)。IV注射的动物在基线时对AAV6、AAV8和AAVrh32.33呈血清阴性,并且针对AAV7和AAV9的中和抗体滴度分别为1:5和1:10。
图13A-图13D是示出了在IV递送(图13A和图13B)和ICM递送(图13C和图13D)后带条形码的衣壳的RNA表达分析的图。IV施用–2×1013GC/kg总剂量,第30天尸检。ICM施用–3×1013GC/动物,第30天尸检。每个组织RNA样品中的条形码频率被归一化为注射输入材料中的频率,使得每个条码在混合物中具有等效的表示(10%)。十个载体的输入量范围为8.5-12%。值表示为平均值±SEM,**p<0.001。
图14示出了在14dpi下在小鼠中IV递送AAVrh91和AAV6.2载体后的GFP表达显微镜分析。以1×1012GC/小鼠的剂量向C57BL/6小鼠IV注射含有pAAV.CB7.CI.eGFP.WPRE.RBG转基因的载体,n=5。通过直接荧光示出了GFP转基因表达的来自肝脏、心脏、脑和肌肉的代表性图像。
图15示出了在14dpi下在小鼠中ICV递送后的新型AAV载体的GFP表达显微分析。向C57BL/6小鼠ICV注射含有pAAV.CB7.CI.eGFP.WPRE.RBG转基因的载体,n=5。示出了进化枝A载体转导的室管膜细胞和脉络丛的GFP荧光的代表性图像。比例尺:100μm。
图16A-图16C示出了恒河猴CNS组织中ICM递送后GFP转基因表达的免疫组织化学。通过ICM注射向动物施用含有pAAV.CB7.CI.eGFP.WPRE.rBG转基因的1.6×1013GC载体。在28-31dpi下评估脑(图16A)、侧脑室(图16B)和脊髓(图16C)中的载体的转导。每组n=2。右上角的动物ID。比例尺:100μm。
图17示出了恒河猴肝脏和心脏组织中ICM递送后GFP转基因表达的免疫组织化学。通过ICM注射向动物施用含有pAAV.CB7.CI.eGFP.WPRE.rBG转基因的1.6×1013GC载体。在28-31dpi下评估肝脏和心脏中的载体转导。每组n=2。右上角的动物ID。比例尺:100μm。
图18A-图18E示出了在NHP中ICM递送后新型载体AAVrh91的细胞嗜性分析。通过ICM注射向动物给予含有pAAV.CB7.CI.eGFP.WPRE.rBG转基因的1.6×1013GC载体。在28-31dpi下评估载体转导。每个衣壳n=2NHP。在图18A和图18B中鉴定的脑切片中星形胶质细胞(图18C)和神经元(图18D)中相对于AAV9的平均GFP表达的定量。(图18E)脑的子区域中AAVrh91和AAV9神经元转导的定量。Ctx.:皮质,Fr.:额叶,Temp.:颞叶,Par.:顶叶,Occ.:枕叶,Str.:纹状体,Thal.:丘脑,Hip.:海马体。在ICM递送后AAVrh91在NHP脑中转导的神经元和星形胶质细胞比例高于AAV9。
图19A-图19C示出了将AAVrh91、AAV1和AAV9衣壳ICM递送到NHP后载体转基因的生物分布。向动物施用含有pAAV.CB7.CI.eGFP.WPRE.rBG转基因的1.6×1013GC载体。每个衣壳n=2NHP。载体的生物分布通过qPCR 28-31dpi在脑的皮质(图19A)和非皮质区域(图19B)以及脊髓(图19C)中进行评估。值报告为平均值和SEM。动物:AAVrh91(1409201和1407088)、AAV1(RA3654和RA3583)、AAV9(1408266和1409029)。
图20示出了图19A-图19C中报告的所有CNS组织中按动物分组的平均GC水平。*p<0.05,**p<0.01,****p<0.0001。动物:AAVrh91(1409201和1407088)、AAV1(RA3654和RA3583)、AAV9(1408266和1409029)。
图21A-图21B示出了人群体中AAVrh91的血清阳性率。对50个随机人血清样品评估了针对AAV2、AAV8、AAVrh32.33和AAVrh91的抗衣壳中和抗体(NAb)。(图21A)NAb对各种衣壳的血清阳性率和(图21B)NAb应答的量值。
图22A-图22F示出了C57BL/6J小鼠IV施用后AAV1、AAV8、AAV9和AAVrh91的生物分布。向成年C57BL/6J小鼠(n=5/组)IV注射1011或1012GC/小鼠的表达来自CB7启动子的GFP的AAV1、AAV8、AAV9或AAVrh91。在载体施用后21天对小鼠进行尸检。采集肝脏(图22A)、脾脏(图22B)、心脏(图22C)、骨骼肌(腓肠肌;图22D)、脑(图22E)和脊髓(图22F)用于通过qPCR评估载体基因组拷贝和载体衍生的RNA转录物。
图23A-图23D示出了与恒河猴中的AAV9相比,用AAVrh91增强的心脏和骨骼肌基因表达和减少的肝脏基因表达。向恒河猴IV注射5×1013GC/kg的AAV9或AAVrh91.CB7.eGFP(n=3/组)。在载体施用后第21天对动物进行尸检。(图23A)DNA和(图23B)RNA被提取并且通过qPCR对载体衍生序列进行定量。GFP蛋白表达通过ELISA(图23C)或IHC确定,其中对图像进行定量(图23D)。
图24A-图24C示出了用AAVrh91在恒河猴的大多数肌肉群体中增强了骨骼肌转导。向恒河猴IV注射5×1013GC/kg的AAV9或AAVrh91.CB7.eGFP(n=3/组)。在施用载体后第21天对动物进行尸检,并且采集来自13个骨骼肌群体的样品。(图24A)DNA和图24B)RNA被提取并且通过qPCR对载体衍生序列进行定量。GFP蛋白表达通过ELISA(图24C)确定。对于每个肌肉群体,左边的一组点是AAV9,并且右边的一组点是AAVrh91。
图25示出了在用AAV9和AAVrh91 IV施用后的肝变性和单个细胞坏死。向恒河猴IV注射5×1013GC/kg的AAV9或AAVrh91.CB7.eGFP(n=3/组)。
图26A-图26B示出了在用AAV9和AAVrh91 IV注射后恒河猴的临床病理学评估。向恒河猴IV注射5×1013GC/kg的AAV9或AAVrh91.CB7.eGFP(n=3/组)。用于评估(图26A)ALT、AST、碱性磷酸酶、GGT、总胆红素(图26B)、凝血酶原时间(PT)、APTT和血小板计数的血液样品在研究的整个生命阶段采集。在载体施用后第21天对动物进行尸检。
图27A-图27B示出了在用AAV9和AAVrh91 ICM注射后恒河猴的临床病理学评估。向恒河猴ICM注射3×1013GC/kg的AAV9或AAVrh91.CB7.eGFP(n=3/组)。用于评估(图27A)AST、ALT、碱性磷酸酶、GGT、总胆红素(图27B)、凝血酶原时间(PT)、APTT、血小板计数、CSF白细胞计数的血液样品在研究的整个生命阶段采集。在载体施用后第14天对动物进行尸检。
图28A-图28C示出了用AAV9和AAVrh91 ICM施用后的生物分布。向恒河猴ICM注射3×1013GC/kg的AAV9或AAVrh91.CB7.eGFP。在第14天进行尸检。
图29A-图29I示出了DRG中GFP阳性感觉神经元的定量。向恒河猴ICM注射3×1013GC/kg的AAV9或AAVrh91.CB7.eGFP(n=3/组)。(图29A)进行免疫组织化学以检测组织切片中的GFP,并且使用成像软件评估载玻片。颈段DRG的分析数据示出为GFP+细胞/mm2(图29B和图29C)和%GFP阳性区域(图29D和图29E)。腰段DRG的分析数据示出为GFP+细胞/mm2(图29F和图29G)和%GFP阳性区域(图29H和图29I)。
图30A-图30G示出了脊髓段中GFP阳性运动神经元的定量。向恒河猴ICM注射3×1013GC/kg的AAV9或AAVrh91.CB7.eGFP(n=3/组)。(图30A)进行免疫组织化学以检测组织切片中的GFP,并且使用成像软件评估载玻片。在颈段腹角(图30B和图30C)、胸段腹角(图30D和图30E)和腰段腹角(图30F和图30G)中对GFP阳性神经元进行手动计数。
图31A-图31C示出了枕叶皮质神经元中的GFP阳性细胞的定量。向恒河猴ICM注射3×1013GC/kg的AAV9或AAVrh91.CB7.eGFP(n=3/组)。(图31A)进行免疫组织化学以检测组织切片中的GFP,并且使用成像软件评估载玻片。对GFP阳性神经元进行手动计数(图31B和图31C)。
图32示出了在用AAV9和AAVrh91 ICM施用后的神经传导速度评估。向恒河猴ICM注射3×1013GC/kg的AAV9或AAVrh91.CB7.2.10mAb(n=3/组)。在基线和生命阶段期间进行评估。
图33A-图33B示出了在用AAV9和AAVrh91 ICM施用后CSF和血清中的转基因浓度。向恒河猴ICM注射3×1013GC/kg的AAV9或AAVrh91.CB7.2.10mAb(n=3/组)。监测血清(图33A)和CSF(图33B)的2.10mAb表达。
图34A-图34B示出了用AAV9和AAVrh91 ICM施用后的生物分布。向恒河猴ICM注射3×1013GC/kg的AAV9或AAVrh91.CB7.2.10mAb(n=3/组)。在载体施用后第90天进行尸检。
图35A-图35F示出了AAVrh91与AAV1衣壳之间的结构差异。使用cryoEM将AAVrh91的结构解析到分辨率为
Figure BDA0004175913010000091
并且与已发布的AAV1(6JCR)结构进行比较。VP3中两个衣壳之间不同的氨基酸位于位置(图35A)418、(图35B)547、(图35C)584、(图35D)588、(图35E)598和(图35F)642处,并且在其结构上下文中示出。指定位置处的氨基酸为黑色,并且所有其它氨基酸为灰色。与指定残基形成紧密接触的氨基酸接收文本标签。每个残基的链内和链间接触以字母名称A或B示出。35A示出了在其结构上下文中的AAVrh91 Asp 418氨基酸残基,如与相同位置的AAV1 Glu 418相比。与位置418处的残基非常接近的氨基酸Arg 308、Lys 310和Glu 686也被标记。位置418处的氨基酸为黑色,并且所有其它氨基酸为灰色。所有标记的氨基酸都位于同一多肽链上,并且与位置418处的残基形成链内接触。图35B示出了在其结构上下文中的AAVrh91 Asn 547氨基酸残基,如与相同位置的AAV1 Ser 547相比。位置547处的氨基酸为黑色,并且所有其它氨基酸为灰色。图35C示出了在其结构上下文中的AAVrh91 Leu584氨基酸残基,如与相同位置的AAV1 Phe 584相比。与位置584处的残基非常接近的氨基酸Arg 485、Arg 488、Lys 528、Glu 531、Phe 534、Thr 574和Glu575也被标记。位置584处的氨基酸为黑色,并且所有其它氨基酸为灰色。链间接触以字母名称A或B示出。位置584处的氨基酸用A标记,并且用B标记的周围残基可见于相邻的多肽链上。图35D示出了在三重尖峰结构尖端处的上下文中的AAVrh91 Asn 588氨基酸残基,如与相同位置的AAV1 Ser 588相比。位置588处的氨基酸为黑色,并且所有其它氨基酸为灰色。图35E示出了在其结构上下文中的AAVrh91 Val 598氨基酸残基,如与相同位置的AAV1 Ala 598相比。与位置598处的残基非常接近的氨基酸Tyr 484、Val 580、Val 596、Met 599和Leu 602也被标记。位置598处的氨基酸为黑色,并且所有其它氨基酸为灰色。每个残基的链内和链间接触以字母名称A或B示出。用A标记的氨基酸与位置598处的氨基酸在同一多肽链上,并且用B标记的氨基酸在相邻链上。图35F示出了在其结构上下文中的AAVrh91 His 642氨基酸残基,如与相同位置的AAV1 Asn 642相比。与位置642处的残基非常接近的氨基酸Tyr 349、Tyr414、Glu 417和Lys 641也被标记。位置642处的氨基酸为黑色,并且所有其它氨基酸为灰色。所有标记的氨基酸都位于同一多肽链上,并且与位置642处的残基形成链内接触。
图36A-图36B示出了具有AAVrh91编码序列和工程化AAVrh91编码序列(AAVrh91eng)的反式质粒的AAV载体产量比较。对于每个构建体,质粒被重新转化,并且随机挑选四个克隆用于12孔板中的单独三重转染。载体产量通过两种方法确定——(图36A)用于产生滴度的qPCR(图36B)用于感染滴度的Huh7转导。每个实验进行了两次——重复1和重复2。
图37A-图37C示出了具有另外调控元件的反式质粒的AAV载体产量比较。生成了包含WPRE和/或bGH polyA的反式质粒(图37A)。载体产量通过两种方法确定——用于产生滴度的qPCR(图37B)和用于感染滴度的Huh7(图37C)。每个实验进行了两次——重复1和重复2。
具体实施方式
通过使用AAV单基因组扩增来探索AAV在其天然哺乳动物宿主中的遗传变异,所述技术用于从病毒群体内准确分离单个AAV基因组(图1)。本文描述从恒河猴组织中分离出新的AAV序列,所述序列可以归类为各种进化枝。所描述的新型衣壳序列用于产生基因递送载体。在静脉内(IV)和脑室内(ICV)递送后在小鼠中以及在IV和大池内(ICM)递送后在NHP中评估了天然分离物衍生的AAV载体的生物学特性。与原型进化枝成员对照相比时,结果确定了新AAV变体的进化枝特异性和可变转导模式。
本文提供了重组AAVrh91载体,其具有AAVrh91衣壳和在调控序列的控制下编码转基因的核酸,所述调控序列在递送到受试者后引导其表达。rAAVrh91衣壳含有独立具有SEQID NO:2的氨基酸序列的蛋白质。提供含有这些载体的组合物。本文所描述的方法涉及使用rAAV靶向所关注的组织以治疗各种病状。
在某些实施例中,本文提供了载体,所述载体包括非常适合将转基因递送到中枢神经系统的AAVrh91衣壳。在某些实施例中,期望鞘内递送,包含例如通过ICM递送递送到脑。在某些实施例中,包括AAVrh91衣壳的载体非常适合将转基因递送到平滑肌。在某些实施例中,包括AAVrh91衣壳的载体非常适合将转基因递送到心脏组织。在其它实施例中,包括AAVrh91衣壳的载体非常适合递送到骨骼(横纹)肌。在某些实施例中,AAVrh91载体可以全身递送或通过适合靶向这些组织的施用途径靶向递送。在某些实施例中,向CNS施用AAVrh91载体也导致转基因递送到一个或多个外周器官(包含例如心脏和/或肝脏)。
除非另外定义,否则本文所使用的技术和科学术语具有与本发明所属领域的普通技术人员通常所理解和参照公开的文本相同的含义,这些术语为本领域的技术人员提供了本申请中使用的许多术语的通用指南。以下定义仅出于清楚起见而提供且并不打算限制所要求的发明。如本文所用,术语“一个/一种(a/an)”是指一个或多个/一种或多种,例如,“一个宿主细胞”应理解为表示一个或多个宿主细胞。如此,术语“一个/种(a或an)”、“一个或多个/一种或多种”和“至少一个/至少一种”在本文可互换地使用。如本文所使用的,除非另有说明,否则术语“约”意指相对于给定参考的10%的变化性。虽然说明书中的各个实施例是使用“包括”语言来呈现的,但是在其它情况下,也意图使用“由…组成”或“基本上由…组成”的语言来解释和描述相关的实施例。
关于以下描述,希望在另一个实施例中,本文描述的每种组合物适用于本发明的方法。另外,还预期在另一个实施例中,本文所描述的用于所述方法中的组合物中的每种组合物本身也是本发明的实施例。
“重组AAV”或“rAAV”是含有两个元件的DNA酶抗性病毒颗粒,所述两个元件即AAV衣壳和至少含有包装在AAV衣壳内的非AAV编码序列的载体基因组。除非另有说明,否则此术语可以与短语“rAAV载体”互换地使用。rAAV是“复制缺陷型病毒”或“病毒载体”,因为其缺少任何功能性AAV rep基因或功能性AAV cap基因并且不能产生子代。在某些实施例中,仅AAV序列是AAV反向末端重复序列(ITR),通常定位在载体基因组的5'和3'最端处,以允许定位在ITR之间的基因和调控序列包装在AAV衣壳内。
如本文所使用的,“载体基因组”是指包装在形成病毒颗粒的rAAV衣壳内部的核酸序列。此类核酸序列含有AAV反向末端重复序列(ITR)。在本文的实例中,载体基因组至少含有从5'至3'的AAV 5'ITR、编码序列和AAV 3'ITR。在某些实施例中,可以选择来自AAV2(与所述衣壳来源不同的AAV)的ITR或非全长ITR。在某些实施例中,ITR来自与在产生或反式补充AAV期间提供rep功能的AAV来源相同的AAV。进一步地,可以使用其它ITR。进一步地,载体基因组含有引导基因产物表达的调控序列。在本文中更详细地讨论载体基因组的合适组分。载体基因组在本文中有时被称作“迷你基因”。
术语“表达盒”是指包括转基因序列和其调控序列(例如启动子、增强子、polyA)的核酸分子,所述表达盒可以被包装到病毒载体(例如病毒颗粒)的衣壳中。通常,这种用于产生病毒载体的表达盒含有转基因序列,所述转基因序列的两侧是病毒基因组的包装信号和其它表达控制序列,例如本文所述的那些。例如,对于AAV病毒载体,包装信号是5'反向末端重复序列(ITR)和3'ITR。在某些实施例中,术语“转基因”可以与“表达盒”互换使用。在其它实施例中,术语“转基因”仅仅是指所选基因的编码序列。
rAAV由AAV衣壳和载体基因组构成。AAV衣壳是vp1的异质群体、vp2的异质群体和vp3蛋白的异质群体的组装。如本文所使用的,当用于指vp衣壳蛋白时,术语“异质”或其任何语法变型是指由不相同的元件组成的群体,例如具有带有不同的经修饰的氨基酸序列的vp1、vp2或vp3单体(蛋白质)。
如本文所使用的,与vp1、vp2和vp3蛋白(可替代地被称为同种型)结合使用的术语“异质群体”是指衣壳内的vp1、vp2和vp3蛋白的氨基酸序列中的差异。AAV衣壳含有具有来自预测的氨基酸残基的修饰的vp1蛋白内、vp2蛋白内和vp3蛋白内的亚群体。这些亚群体至少包含某些脱酰胺化的天冬酰胺(N或Asn)残基。例如,某些亚群体包括天冬酰胺-甘氨酸对中的至少一个、两个、三个或四个高度脱酰胺的天冬酰胺(N)位置,并且任选地进一步包括其它脱酰胺的氨基酸,其中脱酰胺化引起氨基酸变化和其它任选的修饰。
如本文所使用的,除非另有说明,否则vp蛋白的“亚群体”是指一组vp蛋白,所述一组vp蛋白具有至少一个限定的共同特性,并且由至少一个组成员到少于参考组的所有成员组成。例如,除非另有说明,否则vp1蛋白的“亚群体”可以是至少一种(1)vp1蛋白,并且少于组装的AAV衣壳中的所有vp1蛋白。除非另有说明,否则vp3蛋白的“亚群体”可以是少于组装的AAV衣壳中的所有vp3蛋白的一种(1)vp3蛋白。例如,vp1蛋白可以为vp蛋白的亚群体;vp2蛋白可以为vp蛋白的单独亚群体,并且vp3为组装的AAV衣壳中的vp蛋白的仍另外的亚群体。在另一个实例中,vp1、vp2和vp3蛋白可以含有具有不同修饰的亚群体,例如,至少一种、两种、三种或四种高度脱酰胺化的天冬酰胺,例如在天冬酰胺-甘氨酸对处。参见2019年2月27日提交的PCT/US19/019804和2019年2月27日提交的PCT/US19/019861,其各自通过引用并入本文中。
除非另有说明,否则高度脱酰胺化是指与在参考氨基酸位置处的预测的氨基酸序列相比,在参考的氨基酸位置处被至少45%脱酰胺化、至少50%脱酰胺化、至少60%脱酰胺化、至少65%脱酰胺化、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少99%或至多约100%脱酰胺化。此类百分比可以使用2D凝胶、质谱技术或其它合适的技术来确定。
在不希望受理论束缚的情况下,AAV衣壳中的vp蛋白中的至少高度脱酰胺化的残基的脱酰胺化被认为本质上主要是非酶促的,这是由衣壳蛋白内的功能基团引起的,所述功能基团使所选天冬酰胺脱酰胺化,并在较小程度上使谷氨酰胺残基脱酰胺化。大多数脱酰胺化vp1蛋白的有效衣壳组装表明这些事件在衣壳组装之后发生,或者单独单体(vp1、vp2或vp3)中的脱酰胺化在结构上具有良好的耐受性,并且在很大程度上不会影响组装动力学。VP1-独特(VP1-u)区(约aa 1-137)中的广泛的脱酰胺化通常被认为在细胞进入之前定位在内部,这表明VP脱酰胺化可以在衣壳组装之前发生。
在不希望受理论束缚的情况下,N的脱酰胺化可以通过其C端残基的骨架氮原子对Asn的侧链酰胺基碳原子进行亲核攻击而发生。据信形成了中间闭环的琥珀酰亚胺残基。然后,琥珀酰亚胺残基进行快速水解以产生最终产物天冬氨酸(Asp)或异天冬氨酸(IsoAsp)。因此,在某些实施例中,天冬酰胺(N或Asn)的脱酰胺化产生Asp或IsoAsp,其可以通过琥珀酰亚胺中间体相互转化,例如如下文所展示的。
Figure BDA0004175913010000131
如本文所提供的,VP1、VP2或VP3中的每个脱酰胺化的N可以独立地是天冬氨酸(Asp)、异天冬氨酸(isoAsp)、天冬氨酸和/或Asp和isoAsp的互相转化的共混物或其组合。可以存在任何合适比率的α-和异天冬氨酸。例如,在某些实施例中,比率可以为10:1至1:10天冬氨酸:异天冬氨酸、约50:50天冬氨酸:异天冬氨酸、或约1:3天冬氨酸:异天冬氨酸或另一所选比率。
在某些实施例中,一种或多种谷氨酰胺(Q)可以脱酰胺化为谷氨酸(Glu),即α-谷氨酸、γ-谷氨酸(Glu)或α-和γ-谷氨酸的共混物,其可以通过常见的戊二酰亚胺中间体相互转化。可以存在任何合适比率的α-和γ-谷氨酸。例如,在某些实施例中,比率可以为10:1至1:10α:γ、约50:50α:γ、或约1:3α:γ或另一所选比率。
Figure BDA0004175913010000141
因此,rAAV包含vp1、vp2和/或vp3蛋白的rAAV衣壳内具有脱酰胺化的氨基酸的亚群体,至少包含至少一个包括至少一种高度脱酰胺化的天冬酰胺的亚群体。另外,其它修饰可以包含异构化,特别是在所选天冬氨酸(D或Asp)残基位置处。在仍其它实施例中,修饰可以包含在Asp位置处的酰胺化。
在某些实施例中,AAV衣壳含有具有至少1个、至少2个、至少3个、至少4个、至少5个至至少约25个脱酰胺化的氨基酸残基位置的vp1、vp2和vp3的亚群体,与vp蛋白的经编码的氨基酸序列相比,所述vp1、vp2和vp3的至少1%至10%、至少10%至25%、至少25%至50%、至少50%至70%、至少70%至100%、至少75%至100%、至少80%-100%或至少90-100%被脱酰胺化。这些中的大多数可以是N残基。然而,Q残基也可以被脱酰胺化。
如本文所使用的,“经编码的氨基酸序列”是指基于被翻译成氨基酸的参考的核酸序列的已知DNA密码子的翻译而预测的氨基酸。下表展示了DNA密码子和二十种常见氨基酸,分别示出了单字母代码(SLC)和三个字母代码(3LC)。
Figure BDA0004175913010000142
Figure BDA0004175913010000151
在某些实施例中,rAAV具有含有vp1、vp2和vp3蛋白的AAV衣壳,所述蛋白具有包括在本文中提供的表中列出的位置处的两个、三个、四个、五个或更多个脱酰胺化的残基的组合的亚群体,并通过引用并入本文中。
rAAV中的脱酰胺化可以使用2D凝胶电泳和/或质谱和/或蛋白质建模技术来确定。在线色谱可以使用Acclaim PepMap柱和与Q Exactive HF和NanoFlex源(赛默飞世尔科技公司(Thermo Fisher Scientific))耦合的Thermo UltiMate 3000RSLC系统(赛默飞世尔科技公司)执行。MS数据是使用用于Q Exactive HF的数据依赖性前20种方法获取的,所述方法从调查扫描(200-2000m/z)中动态选择最丰富的尚未测序的前体离子。测序通过高能碰撞解离片段化进行,其中通过预测性自动增益控制确定的靶值为1e5离子,并且以4m/z的窗口进行前体分离。在m/z 200下以120,000的分辨率获取调查扫描。HCD光谱的分辨率可以在m/z 200下设置为30,000,其中最大离子注入时间为50毫秒,并且归一化碰撞能量为30。S-透镜RF水平可以设置为50,以使来自消化的肽所占据的m/z区达到最佳传输。可以从片段选择中排除具有单个、未分配或六个和更高电荷状态的前体离子。BioPharma Finder 1.0软件(赛默飞世尔科技公司)可以用于分析所获取的数据。对于肽作图,使用单进入蛋白FASTA数据库进行搜索,其中脲基甲基化设置为固定的修饰;并将氧化、脱酰胺化和磷酸化设置为可变修饰、10-ppm质量准确度、高蛋白酶特异性和置信度水平为0.8的MS/MS光谱。合适的蛋白酶的实例可以包含例如胰蛋白酶或胰凝乳蛋白酶。脱酰胺化的肽的质谱鉴定相对简单,因为脱酰胺化向完整分子的质量添加了+0.984Da(-OH基团与-NH2基团之间的质量差)。特定肽的脱酰胺化百分比通过将脱酰胺化的肽的质量面积除以脱酰胺化的和天然的肽的面积之和来确定。考虑到可能的脱酰胺化位点的数量,在不同位点处被脱酰胺化的同量异位物种可以在单个峰中共迁移。因此,源自具有多个潜在的脱酰胺化位点的肽的片段离子可以用于定位或区分多个脱酰胺化位点。在这些情况下,观察到的同位素图案内的相对强度可以用于特异性确定不同的脱酰胺化的肽异构体的相对丰度。此方法假设所有异构物种的片段化效率是相同的,并且在脱酰胺化位点上是独立的。本领域的技术人员将理解的是,可以使用这些说明性方法的多种变型。例如,合适的质谱仪可以包含例如四极杆飞行时间质谱仪(QTOF),如Waters Xevo或Agilent 6530,或Orbitrap仪器,如Orbitrap Fusion或Orbitrap Velos(赛默飞世尔科技公司)。合适的液相色谱系统包含例如来自沃特世(Waters)的Acquity UPLC系统或Agilent系统(1100或1200系列)。合适的数据分析软件可以包含例如MassLynx(沃特世)、Pinpoint和Petfinder(赛默飞世尔科技公司)、Mascot(矩阵科学公司(Matrix Science))、Peaks DB(生物信息学解决方案公司(BioinformaticsSolutions))。可以在例如X.Jin等人,于2017年6月16日在线公开的《人类基因疗法方法(HuGene Therapy Methods)》,第28卷,第5期,第255-267页中描述仍其它技术。
除脱酰胺化之外,可能发生不会导致一个氨基酸转化为不同的氨基酸残基的其它修饰。这种修饰可以包含乙酰化残基、异构化、磷酸化或氧化。
脱酰胺化的调节:在某些实施例中,AAV被修饰成改变天冬酰胺-甘氨酸对中的甘氨酸,以降低脱酰胺化。在其它实施例中,将天冬酰胺改变为不同的氨基酸,例如以较慢速率进行脱酰胺化的谷氨酰胺;或改变为缺乏酰胺基的氨基酸(例如,含有酰胺基的谷氨酰胺和天冬酰胺);和/或改变为缺乏胺基的氨基酸(例如,含有胺基的赖氨酸、精氨酸和组氨酸)。如本文所使用的,缺乏酰胺或胺侧基的氨基酸是指例如甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、丝氨酸、苏氨酸、胱氨酸、苯丙氨酸、酪氨酸或色氨酸和/或脯氨酸。如所描述的修饰可以在经编码的AAV氨基酸序列中存在的天冬酰胺-甘氨酸对中的一个、两个或三个天冬酰胺-甘氨酸对中。在某些实施例中,在所有四个天冬酰胺-甘氨酸对中没有进行此类修饰。因此,一种用于降低具有较低脱酰胺化速率的AAV和/或经工程化的AAV变体的脱酰胺化的方法。另外地或可替代地,可以将一种或多种其它酰胺氨基酸改变为非酰胺氨基酸以降低AAV的脱酰胺化。在某些实施例中,本文所描述的突变AAV衣壳含有天冬酰胺-甘氨酸对中的突变,使得甘氨酸变为丙氨酸或丝氨酸。突变AAV衣壳可以含有一个、两个或三个突变体,其中参考AAV天然地含有四个NG对。在某些实施例中,AAV衣壳可以含有一个、两个、三个或四个此类突变体,其中参考AAV天然地含有五个NG对。在某些实施例中,突变AAV衣壳含有NG对中的仅单个突变。在某些实施例中,突变AAV衣壳含有两个不同的NG对中的突变。在某些实施例中,突变AAV衣壳含有定位在AAV衣壳中的结构上分开的位置中的两个不同的NG对中的突变。在某些实施例中,突变不在VP1-独特区中。在某些实施例中,突变之一不在VP1-独特区中。任选地,突变AAV衣壳不含有NG对中的修饰,但是含有突变以最小化或消除定位在NG对的外部的一个或多个天冬酰胺或谷氨酰胺中的脱酰胺化。
在某些实施例中,提供了一种增加rAAV载体的效力的方法,所述方法包括使AAV衣壳工程化,这消除了野生型AAV衣壳中的NG中的一个或多个NG。在某些实施例中,“NG”的“G”的编码序列被工程化为编码另一种氨基酸。在下文的某些实例中,“S”或“A”被取代。然而,可以选择其它合适的氨基酸编码序列。
这些氨基酸修饰可以通过常规的基因工程技术进行。例如,可以产生含有经过修饰的AAV vp密码子的核酸序列,其中修饰天冬酰胺-甘氨酸中编码甘氨酸的密码子中的一到三个密码子以编码除甘氨酸之外的氨基酸。在某些实施例中,含有经过修饰的天冬酰胺密码子的核酸序列可以在天冬酰胺-甘氨酸对中的一到三个天冬酰胺-甘氨酸对处被工程化,使得经过修饰的密码子编码除天冬酰胺之外的氨基酸。每个经过修饰的密码子可以编码不同的氨基酸。可替代地,改变的密码子中的一个或多个密码子可以编码相同的氨基酸。在某些实施例中,这些经过修饰的AAVrh91核酸序列可以用于产生具有比天然AAVrh91衣壳脱酰胺化程度更低的衣壳的突变rAAV。此类突变rAAV可以具有降低的免疫原性和/或增加储存时的稳定性,特别是以悬浮液形式储存时的稳定性。
本文还提供了编码具有降低的脱酰胺化的AAV衣壳的核酸序列。设计编码此AAV衣壳的核酸序列在本领域的技术范围内,包含DNA(基因组或cDNA)或RNA(例如,mRNA)。此类核酸序列可以被密码子优化以在所选系统(即,细胞类型)中进行表达并且可以通过各种方法设计。可以使用在线可用的方法(例如,GeneArt)、公开的方法或提供密码子优化服务的公司(例如,DNA2.0)(加利福尼亚州门洛帕克市(Menlo Park,CA))来执行此优化。例如,在国际专利公开第WO 2015/012924号中描述了一种密码子优化方法,其通过引用整体并入本文中。还参见例如美国专利公开第2014/0032186号和美国专利公开第2006/0136184号。适合的是,修饰产物的开放阅读框(ORF)的全长。然而,在一些实施例中,仅ORF的片段可以被改变。通过使用这些方法中的一种方法,可以将频率应用于任何给定的多肽序列,并产生编码多肽的经密码子优化的编码区的核酸片段。许多选项可用于对密码子进行实际改变或者可用于合成如本文所描述地设计的密码子优化的编码区。此类改变或合成可以使用本领域普通技术人员已熟知的标准和常规分子生物学操作来进行。在一种方法中,通过标准方法合成各自长度为80-90个核苷酸且跨越希望的序列的长度的一系列互补寡核苷酸对。这些寡核苷酸对被合成为使得在退火时它们形成80-90个碱基对的双链片段,这些双链片段含有黏性末端,例如在该对中的各寡核苷酸被合成来延伸超过与该对中另一寡核苷酸互补的区域3个、4个、5个、6个、7个、8个、9个、10个或更多个碱基。每对寡核苷酸的单链末端被设计为用另一对寡核苷酸的单链末端退火。允许这些寡核苷酸对退火,并且然后允许约五至六个这些双链片段经由粘性单链末端一起退火,并且随后它们连接在一起并克隆到标准细菌克隆载体中,例如可获自加利福尼亚州卡尔斯巴德英杰公司(Invitrogen Corporation,Carlsbad,Calif)的
Figure BDA0004175913010000181
载体。然后通过标准方法对构建体进行测序。制备由连接在一起的80至90个碱基对片段的5至6个片段(即约500个碱基对的片段)组成的这些构建体中的若干构建体,以使得整个希望的序列以一系列质粒构建体表示。然后用适当的限制性酶切割这些质粒的插入物并且将其连接在一起以形成最终构建体。然后将最终构建体克隆到标准细菌克隆载体中,并进行测序。另外的方法对于技术人员而言将立即是清楚的。另外,基因合成易于商购获得。
在某些实施例中,提供了AAV衣壳,所述AAV衣壳具有含有多个高度脱酰胺化的“NG”位置的AAV衣壳同种型(即,VP1、VP2、VP3)的异质群体。在某些实施例中,高度脱酰胺化的位置在下文参考预测的全长VP1氨基酸序列鉴定的位置中。在其它实施例中,衣壳基因被修饰成使得参考的“NG”被消融,并且突变体“NG”被工程化到另一个位置中。
如本文所用,术语“靶细胞”和“靶组织”可以指打算被受试者AAV载体转导的任何细胞或组织。所述术语可以指肌肉、肝脏、肺、气道上皮、中枢神经系统、神经元、眼睛(眼细胞)或心脏中的任何一种或多种。在一个实施例中,靶组织为肝脏。在另一个实施例中,靶组织为心脏。在另一个实施例中,靶组织为脑。在某些实施例中,靶细胞是一种或多种CNS细胞类型,包含但不限于星形胶质细胞、神经元、室管膜细胞和脉络丛细胞。在另一个实施例中,靶组织为肌肉。
如本文所用,术语“哺乳动物受试者”或“受试者”包含需要本文所述的治疗或预防方法的任何哺乳动物,尤其包含人类。需要此类治疗或预防的其它哺乳动物包含狗、猫或其它驯养动物、马、家畜、实验动物,包含非人类灵长类动物等。受试者可以是男性或女性。
如本文所使用的,rAAV的“原液”是指rAAV的群体。尽管由于脱酰胺化,rAAV的衣壳蛋白具有异质性,但是原液中的rAAV被期望共用相同的载体基因组。原液可以包含具有衣壳的rAAV,所述衣壳具有例如所选AAV衣壳蛋白和所选产生系统的特有的异质脱酰胺化模式。原液可以从单个产生系统中产生,或者从产生系统的多次运行中汇集。可以选择各种产生系统,包含但不限于本文所描述的产生系统。
如本文所使用,术语“宿主细胞”可以指rAAV由质粒产生的包装细胞系。在替代方案中,术语“宿主细胞”可以指需要转基因表达的靶细胞。
A.AAV衣壳
本文提供了一种新型AAV衣壳蛋白,其具有SEQ ID NO:2所示的vp1序列。AAV衣壳由三个重叠编码序列组成,由于使用替代起始密码子,所述编码序列的长度不同。这些可变蛋白被称为VP1、VP2和VP3,其中VP1是最长的且VP3是最短的。AAV颗粒由比率为约1:1:10(VP1:VP2:VP3)的所有三种衣壳蛋白组成。VP3包含在N端的VP1和VP2中,是构建颗粒的主要结构成分。可使用若干不同编号系统来指代衣壳蛋白。为方便起见,如本文所用,使用VP1编号来指代AAV序列,所述编号从VP1的第一个残基的aa 1开始。但是,本文所述的衣壳蛋白包含VP1、VP2和VP3(在本文中可与vp1、vp2和vp3互换使用)。衣壳的可变蛋白的编号如下:
核苷酸(nt)
AAVrh91:vp1-nt 1至2208;vp2-nt 412至2208;vp3-SEQ ID NO:1的nt 607至2208
AAVrh91eng:vp1-nt 1至2208;vp2-nt 412至2208;vp3-SEQ ID NO:3的nt 607至2208
本文所描述的衣壳的核酸序列比对示出于图3A-图3D。
氨基酸(aa)
AAVrh91和AAVrh91eng:aa vp1–1至736;vp2–aa 138至736;vp3–SEQ ID NO:2的aa203至736。
本文所描述的衣壳的氨基酸序列比对示出于图4A-图4B。
本文包含包括AAVrh91(SEQ ID NO:2)的vp1、vp2和vp3中的至少一个的rAAV。本文还提供了包括由AAVrh91(SEQ ID NO:1)或AAVrh91eng(SEQ ID NO:3)的vp1、vp2和vp3中的至少一个编码的AAV衣壳的rAAV。
在一个实施例中,提供了一种组合物,其包含重组腺相关病毒(rAAV)的混合群体,所述rAAV中的每个rAAV包括:(a)包括约60个由vp1蛋白、vp2蛋白和vp3蛋白构成的衣壳蛋白的AAV衣壳,其中vp1、vp2和vp3蛋白为:由编码所选AAV vp1氨基酸序列的核酸序列产生的vp1蛋白的异质群体、由编码所选AAV vp2氨基酸序列的核酸序列产生的vp2蛋白的异质群体、由编码所选AAV vp3氨基酸序列的核酸序列产生的vp3蛋白的异质群体,其中:vp1、vp2和vp3蛋白含有具有氨基酸修饰的亚群体,所述氨基酸修饰包括AAV衣壳中的天冬酰胺-甘氨酸对中的至少两个高度脱酰胺化的天冬酰胺(N),并且任选地进一步包括包含其它脱酰胺化的氨基酸的亚群体,其中所述脱酰胺化引起氨基酸变化;以及(b)AAV衣壳中的载体基因组,所述载体基因组包括核酸分子,所述核酸分子包括AAV反向末端重复序列和非AAV核酸序列,所述非AAV核酸序列编码可操作地连接到序列的产物,所述序列引导所述产物在宿主细胞中的表达。
在某些实施例中,所述脱酰胺化的天冬酰胺被脱酰胺化为天冬氨酸、异天冬氨酸、相互转化的天冬氨酸/异天冬氨酸对或其组合。在某些实施例中,所述衣壳进一步包括一种或多种脱酰胺化的谷氨酰胺,所述一种或多种脱酰胺化的谷氨酰胺被脱酰胺化为(α)-谷氨酸、γ-谷氨酸、相互转化的(α)-谷氨酸/γ-谷氨酸对或其组合。
在某些实施例中,提供了新型分离的AAVrh91衣壳。SEQ ID NO:1中提供了编码AAVrh91衣壳的核酸序列并且SEQ ID NO:2中提供了经编码的氨基酸序列。本文提供了包括AAVrh91(SEQ ID NO:2)的vp1、vp2和vp3中的至少一个的rAAV。本文还提供了包括由AAVrh91(SEQ ID NO:1)的vp1、vp2和vp3中的至少一个编码的AAV衣壳的rAAV。在又另一个实施例中,SEQ ID NO:3中提供了编码AAVrh91氨基酸序列的核酸序列并且SEQ ID NO:2中提供了经编码的氨基酸序列。本文还提供了包括由AAVrh91eng(SEQ ID NO:3)的vp1、vp2和vp3中的至少一个编码的AAV衣壳的rAAV。在某些实施例中,vp1、vp2和/或vp3是AAVrh91(SEQ ID NO:2)的全长衣壳蛋白。在其它实施例中,vp1、vp2和/或vp3具有N末端和/或C末端截短(例如截短约1至约10个氨基酸)。
在另外的方面,提供了一种重组腺相关病毒(rAAV),所述rAAV包括:(A)AAVrh91衣壳,所述AAVrh91衣壳包括以下中的一种或多种:(1)AAVrh91衣壳蛋白,其包括:AAVrh91vp1蛋白的异质群体,所述AAVrh91 vp1蛋白选自以下:通过从编码SEQ ID NO:2的1至736的预测的氨基酸序列的核酸序列表达产生的vp1蛋白、由SEQ ID NO:1产生的vp1蛋白、或由与SEQ ID NO:1至少70%相同的核酸序列产生的vp1蛋白,所述核酸序列编码SEQ ID NO:2的1至736的所述预测的氨基酸序列,AAVrh91 vp2蛋白的异质群体,所述AAVrh91 vp2蛋白选自以下:通过从编码SEQ ID NO:2的至少约氨基酸138至736的预测的氨基酸序列的核酸序列表达产生的vp2蛋白、由包括SEQ ID NO:1的至少核苷酸412至2208的序列产生的vp2蛋白、或由与SEQ ID NO:1的至少核苷酸412至2208至少70%相同的核酸序列产生的vp2蛋白,所述核酸序列编码SEQ ID NO:2的至少约氨基酸138至736的所述预测的氨基酸序列,AAVrh91vp3蛋白的异质群体,所述AAVrh91 vp3蛋白选自以下:通过从编码SEQ ID NO:2的至少约氨基酸203至736的预测的氨基酸序列的核酸序列表达产生的vp3蛋白、由包括SEQ ID NO:1的至少核苷酸607至2208的序列产生的vp3蛋白、或由与SEQ ID NO:1的至少核苷酸607至2208至少70%相同的核酸序列产生的vp3蛋白,所述核酸序列编码SEQ ID NO:1的至少约氨基酸203至736的所述预测的氨基酸序列;和/或(2)作为编码SEQ ID NO:2的所述氨基酸序列的核酸序列的产物的vp1蛋白的异质群体,作为编码SEQ ID NO:2的至少约氨基酸138至736的所述氨基酸序列的核酸序列的产物的vp2蛋白的异质群体,以及作为编码SEQ ID NO:2的至少氨基酸203到736的核酸序列的产物的vp3蛋白的异质群体,其中:所述vp1、vp2和vp3蛋白含有具有氨基酸修饰的亚群体,所述氨基酸修饰包括SEQ ID NO:2中的天冬酰胺-甘氨酸对中的至少两个高度脱酰胺化的天冬酰胺(N),并且任选地进一步包括包含其它脱酰胺化的氨基酸的亚群体,其中脱酰胺化引起氨基酸变化;以及(B)所述AAVrh91衣壳中的载体基因组,所述载体基因组包括核酸分子,所述核酸分子包括AAV反向末端重复序列和非AAV核酸序列,所述非AAV核酸序列编码可操作地连接到序列的产物,所述序列引导所述产物在宿主细胞中的表达。
在又另一方面,提供了一种重组腺相关病毒(rAAV),所述rAAV包括:(A)AAVrh91衣壳,所述AAVrh91衣壳包括以下中的一种或多种:(1)AAVrh91衣壳蛋白,其包括:AAVrh91vp1蛋白的异质群体,所述AAVrh91 vp1蛋白选自以下:通过从编码SEQ ID NO:2的1至736的预测的氨基酸序列的核酸序列表达产生的vp1蛋白、由SEQ ID NO:3产生的vp1蛋白、或由与SEQ ID NO:3至少70%相同的核酸序列产生的vp1蛋白,所述核酸序列编码SEQ ID NO:2的1至736的所述预测的氨基酸序列,AAVrh91 vp2蛋白的异质群体,所述AAVrh91 vp2蛋白选自以下:通过从编码SEQ ID NO:2的至少约氨基酸138至736的预测的氨基酸序列的核酸序列表达产生的vp2蛋白、由包括SEQ ID NO:3的至少核苷酸412至2208的序列产生的vp2蛋白、或由与SEQ ID NO:3的至少核苷酸412至2208至少70%相同的核酸序列产生的vp2蛋白,所述核酸序列编码SEQ ID NO:2的至少约氨基酸138至736的所述预测的氨基酸序列,AAVrh91vp3蛋白的异质群体,所述AAVrh91 vp3蛋白选自以下:通过从编码SEQ ID NO:2的至少约氨基酸203至736的预测的氨基酸序列的核酸序列表达产生的vp3蛋白、由包括SEQ ID NO:3的至少核苷酸607至2208的序列产生的vp3蛋白、或由与SEQ ID NO:3的至少核苷酸607至2208至少70%相同的核酸序列产生的vp3蛋白,所述核酸序列编码SEQ ID NO:3的至少约氨基酸203至736的所述预测的氨基酸序列;和/或(2)作为编码SEQ ID NO:2的所述氨基酸序列的核酸序列的产物的vp1蛋白的异质群体,作为编码SEQ ID NO:2的至少约氨基酸138至736的所述氨基酸序列的核酸序列的产物的vp2蛋白的异质群体,以及作为编码SEQ ID NO:2的至少氨基酸203至736的核酸序列的产物的vp3蛋白的异质群体,其中:所述vp1、vp2和vp3蛋白含有具有氨基酸修饰的亚群体,所述氨基酸修饰包括SEQ ID NO:2中的天冬酰胺-甘氨酸对中的至少两个高度脱酰胺化的天冬酰胺(N),并且任选地进一步包括包含其它脱酰胺化的氨基酸的亚群体,其中脱酰胺化引起氨基酸变化;以及(B)所述AAVrh91衣壳中的载体基因组,所述载体基因组包括核酸分子,所述核酸分子包括AAV反向末端重复序列和非AAV核酸序列,所述非AAV核酸序列编码可操作地连接到序列的产物,所述序列引导所述产物在宿主细胞中的表达。
在某些实施例中,所述AAVrh91 vp1、vp2和vp3蛋白含有具有氨基酸修饰的亚群体,所述氨基酸修饰包括SEQ ID NO:2中的天冬酰胺-甘氨酸对中的至少两个高度脱酰胺化的天冬酰胺(N),并且任选地进一步包括包含其它脱酰胺化的氨基酸的亚群体,其中脱酰胺化引起氨基酸变化。相对于SEQ ID NO:2的编号,在N-G对N57、N383和/或N512处观察到高水平的脱酰胺化。在其它残基中也观察到脱酰胺化,如下文和图7B和图7C所示。在某些实施例中,AAVrh91可以具有其它脱酰胺化的残基,例如通常少于10%和/或可以具有其它修饰,所述其它修饰包含磷酸化(例如,在存在的情况下,范围为约2至约30%、或约2至约20%、或约2至约10%)(例如,在S149处)或氧化(例如,在约W22、约M211、W247、M403、M435、M471、W478、W503、~M537、约M541、约M559、约M599、M635和/或W695中的一个或多个处)。任选地,W可以氧化成犬尿氨酸。
表-AAVrh91脱酰胺化
Figure BDA0004175913010000221
在某些实施例中,在提供的如使用胰蛋白酶使用质谱所测定的范围内,在上表中鉴定的位置中的一个或多个位置中修饰AAVrh91衣壳。在某些实施例中,如本文所述地修饰一个或多个位置或N之后的甘氨酸。残基数量基于本文所提供的AAVrh91序列。参见SEQ IDNO:2。
在某些实施例中,AAVrh91衣壳包括:作为编码SEQ ID NO:2的所述氨基酸序列的核酸序列的产物的vp1蛋白的异质群体,作为编码SEQ ID NO:2的至少约氨基酸138至736的所述氨基酸序列的核酸序列的产物的vp2蛋白的异质群体,以及作为编码SEQ ID NO:2的至少氨基酸203到736的核酸序列的产物的vp3蛋白的异质群体。
在某些实施例中,SEQ ID NO:1中提供了编码AAVrh91 vp1衣壳蛋白的核酸序列。在其它实施例中,可以选择与SEQ ID NO:1具有70%至99.9%同一性、或与SEQ ID NO:1100%相同的核酸序列以表达AAVrh91衣壳蛋白。在某些其它实施例中,核酸序列与SEQ IDNO:1至少约75相同、至少80%相同、至少85%、至少90%、至少95%、至少97%相同、至少99%或100%相同。然而,可以选择编码SEQ ID NO:2的氨基酸序列的其它核酸序列用于产生rAAV衣壳。在某些实施例中,核酸序列具有SEQ ID NO:1的核酸序列或与编码SEQ ID NO:2的SEQ ID NO:1至少70%至99.9%相同、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少99%或100%相同的序列。在某些实施例中,核酸序列具有SEQ ID NO:1的核酸序列或与SEQ ID NO:1的约nt 412至约nt 2208至少70%至99.9%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少99%或100%相同的序列,所述序列编码SEQ ID NO:2的vp2衣壳蛋白(约aa 138至736)。在某些实施例中,核酸序列具有SEQ IDNO:1的约nt 607至约nt 2208的核酸序列或与SEQ ID NO:1的nt 607至约nt 2208至少70%至99.9%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少99%或100%相同的序列,所述序列编码SEQ ID NO:2的vp3衣壳蛋白(约aa 203至736)。
在某些实施例中,SEQ ID NO:3中提供了编码AAVrh91 vp1衣壳蛋白的核酸序列。在其它实施例中,可以选择与SEQ ID NO:3具有70%至99.9%同一性、或与SEQ ID NO:3100%相同的核酸序列以表达AAVrh91衣壳蛋白。在某些其它实施例中,核酸序列与SEQ IDNO:3至少约75相同、至少80%相同、至少85%、至少90%、至少95%、至少97%相同、至少99%至99.9%相同或100%相同。然而,可以选择编码SEQ ID NO:2的氨基酸序列的其它核酸序列用于产生rAAV衣壳。在某些实施例中,核酸序列具有SEQ ID NO:3的核酸序列或与编码SEQ ID NO:2的SEQ ID NO:3至少70%至99.9%相同、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少99%或100%相同的序列。在某些实施例中,核酸序列具有SEQ ID NO:3的核酸序列或与SEQ ID NO:3的约nt 412至约nt 2208至少70%至99.9%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少99%或100%相同的序列,所述序列编码SEQ ID NO:2的vp2衣壳蛋白(约aa 138至736)。在某些实施例中,核酸序列具有SEQ ID NO:3的约nt 607至约nt 2208的核酸序列或与SEQ ID NO:3的nt 607至约nt2208至少70%至99.9%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少99%相同或100%相同的序列,所述序列编码SEQ ID NO:2的vp3衣壳蛋白(约aa 203至736)。
本发明还涵盖编码AAVrh91衣壳序列(SEQ ID NO:2)和突变体AAVrh91的核酸序列,其中已经改变一个或多个残基以降低脱酰胺化或本文所鉴定的其它修饰。此类核酸序列可以用于产生突变AAVrh91衣壳。
在某些实施例中,本文中提供了一种核酸分子,所述核酸分子具有SEQ ID NO:1的序列或与SEQ ID NO:1至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少99%或100%相同的序列,所述序列编码具有如本文所描述的修饰(例如,脱酰胺化的氨基酸)的SEQ ID NO:2的vp1氨基酸序列。在某些实施例中,本文中提供了一种核酸分子,所述核酸分子具有SEQ ID NO:3的序列或与SEQ ID NO:3至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少99%或100%相同的序列,所述序列编码具有如本文所描述的修饰(例如,脱酰胺化的氨基酸)的SEQ ID NO:2的vp1氨基酸序列。在某些实施例中,vp1氨基酸序列在SEQ ID NO:2中重现。在某些实施例中,提供了具有本文所描述的核酸序列的质粒。此类质粒包含编码AAVrh91的vp1、vp2和vp3中的至少一个的核酸序列(SEQ ID NO:1)或与SEQ ID NO:1的vp1、vp2和/或vp3序列具有至少95%、至少96%、至少97%、至少98%或至少99%同一性的序列。在另外的实施例中,质粒包含非AAV序列。在某些实施例中,质粒包括WPRE和/或bGH-polyA信号。还提供了含有本文所描述的质粒的培养宿主细胞。
本文还提供了AAV衣壳蛋白,其通过引入一个或多个氨基酸取代进行修饰,以例如改善衣壳功能/基因向靶细胞的递送和/或通过增加产量来改善AAV载体的制造。如所描述的,衣壳之间的差异会导致载体包装的差异。例如,尽管VP1蛋白序列只有1.1%的差异,但发现,基于载体产量,AAVrh91载体以显著高于基于AAV6.2的载体的水平包装转基因。AAVrh91还以高于AAV1的水平包装转基因。
如所描述的,衣壳结构的比较导致鉴定AAVrh91和AAV1衣壳之间不同的残基位置。残基中的六个残基位于AAVrh91 vp3蛋白中——Asp418、Asn547、Leu584、Asn588、Val598和His642。修饰包含其它进化枝A载体的AAV载体以包含这些氨基酸取代或相对于AAVrh91衣壳中鉴定的保守氨基酸取代可以产生具有改善特性的新型衣壳,包含改变的嗜性和提高的产量。因此,在某些实施例中,本文提供了具有衣壳蛋白的AAV,所述衣壳蛋白已被修饰成包含一个或多个选自以下的氨基取代:位置418处的Asp、位置547处的Asn、位置584处的Leu、位置588处的Asn、位置598处的Val和位置642处的His。在某些实施例中,衣壳蛋白被修饰成包含位置584处(例如,来自Leu)的Leu以增加载体的制造产量。在某些实施例中,位置598处的Ala或Val取代提高了载体的制造产量。在某些实施例中,衣壳蛋白被修饰成包含在选自位置418、547、584、588、598和642的一个或多个残基处的氨基酸取代。氨基酸取代可以是保守氨基酸取代,即用另一个残基替代AAV衣壳蛋白中的氨基酸残基,所述另一个残基预期具有与在AAVrh91衣壳蛋白的位置418、547、584、588、598和/或642处位观察到的取代类似的特性。在某些实施例中,衣壳蛋白被修饰成包含位置584处的Leu和位置547处的Asn。位置的编号可以通过将衣壳蛋白序列与AAVrh91氨基酸序列(SEQ ID NO:2)或AAV1氨基酸序列(SEQ ID NO:8)进行比对来确定。在某些实施例中,被修饰的衣壳蛋白是AAV1衣壳蛋白。在另外的实施例中,被修饰的衣壳蛋白具有与SEQ ID NO:8至少95%相同或至少99%相同的序列。在其它实施例中,被修饰的衣壳是进化枝A AAV衣壳蛋白。在另外的实施例中,被修饰的衣壳蛋白是AAVhu48R3、AAVhu48、AAVhu44、AAV.VR-355、AAV.VR-195、AAV6或AAV6.2衣壳蛋白。
如本文所使用的,“保守氨基酸替代”或“保守氨基酸取代”是指氨基酸改变、替代或取代为具有类似生化特性(例如电荷、疏水性和大小)的不同氨基酸,这是本领域的从业者熟知的。还参见例如FRENCH等人什么是保守取代?(What is a conservativesubstitution?)《分子进化杂志(Journal of Molecular Evolution)》,1983年3月,第19卷,第2期,第171–175页以及YAMPOLSKY等人蛋白质中氨基酸的交换性(TheExchangeability of Amino Acids in Proteins),《遗传学(Genetics)》.2005年8月;170(4):1459–1472,所述文献中的每个文献通过引用整体并入本文。
当提及核酸或其片段时,术语“基本同源性”或“基本类似性”表示当与另一个核酸(或其互补链)的适当核苷酸插入或缺失进行最佳比对时,至少约95至99%的比对序列具有核苷酸序列同一性。优选地,同源性在全长序列、或其开放阅读框或长度为至少15个核苷酸的另一个合适的片段上。本文描述了合适片段的实例。
在核酸序列的上下文中,术语“百分比(%)同一性”、“序列同一性”、“百分比序列同一性”或“百分比相同的”是指两个序列中的残基在比对以获得对应性时是相同的。期望序列同一性比较的长度可以超过基因组的全长、基因编码序列的全长或至少约500到5000个核苷酸的片段。然而,也可能期望较小片段之间的同一性,例如至少约九个核苷酸,通常至少约20到24个核苷酸、至少约28到32个核苷酸、至少约36个或更多个核苷酸。
可以容易地确定蛋白质全长、多肽、约32个氨基酸、约330个氨基酸或其肽片段或对应核酸序列编码序列上的氨基酸序列的百分比同一性。合适的氨基酸片段的长度可以是至少约8个氨基酸并且可以是至多约700个氨基酸。通常,当提及两种不同序列之间的“同一性”、“同源性”或“类似性”时,参考“比对”序列来确定“同一性”、“同源性”或“类似性”。“比对”序列或“比对”是指与参考序列相比,通常含有对丢失的或另外的碱基或氨基酸的校正的多个核酸序列或蛋白质(氨基酸)序列。
同一性可以通过制备序列的比对并通过使用本领域已知的或可商购获得的各种算法和/或计算机程序[例如,BLAST、ExPASy;ClustalO;FASTA;使用例如Needleman-Wunsch算法、Smith-Waterman算法]确定。使用多种公开或可商购获得的多序列比对程序中的任一种进行比对。序列比对程序可供用于氨基酸序列,例如“Clustal Omega”、“Clustal X”、“MAP”、“PIMA”、“MSA”、“BLOCKMAKER”、“MEME”以及“Match-Box”程序。总体上,任何这些程序均以默认设置使用,尽管本领域技术人员可以根据需要改变这些设置。可替代地,本领域技术人员可以利用另一种算法或计算机程序,所述算法或计算机程序提供至少与通过参考算法和程序所提供的一样水平的同一性或比对。参见例如,J.D.Thomson等人,《核酸研究(Nucl.Acids.Res.)》,“多个序列比对的全面比较(A comprehensive comparison ofmultiple sequence alignments)”,27(13):2682-2690(1999)。
多个序列比对程序也可用于核酸序列。此类程序的实例包含“Clustal Omega”、“Clustal W”、“CAP Sequence Assembly”、“BLAST”、“MAP”和“MEME”,所述程序可通过因特网上的Web服务器进行访问。此类程序的其它来源是本领域技术人员已知的。可替代地,也使用了载体NTI实用程序。本领域已知的许多算法可以用于测量核苷酸序列同一性,包含上述程序中包含的那些。作为另一个实例,可以使用GCG 6.1版本的程序FastaTM比较多核苷酸序列。FastaTM提供了查询序列与搜索序列之间最佳重叠区的比对和序列同一性百分比。例如,核酸序列之间的序列同一性百分比可以是使用如GCG 6.1版本中所提供的采用其默认参数(字号6和评分矩阵的NOPAM系数)的FastaTM所确定的,所述程序通过引用并入本文中。
B.rAAV载体和组合物
另一方面,本文描述了利用本文所描述的AAV衣壳序列(包含其片段)的分子,用于产生可用于将异源基因或其它核酸序列递送到靶细胞的病毒载体。在一个实施例中,可用于本文所描述的组合物和方法的载体至少含有编码如本文所描述的AAV衣壳的序列,例如AAVrh91衣壳或其片段。在另一个实施例中,有用的载体至少含有编码所选AAV血清型rep蛋白或其片段的序列。任选地,此类载体可以含有AAV cap和rep蛋白。在提供AAV rep和cap两者的载体中,AAV rep和AAV cap序列可以均属于一种血清型来源例如,都是AAVrh91来源。可替代地,可以使用其中rep序列来自不同于提供cap序列的野生型AAV的AAV的载体。在一个实施例中,rep和cap序列由单独来源(例如,单独的载体或宿主细胞和载体)表达。在另一个实施例中,这些rep序列使用相同读框融合到不同AAV血清型的cap序列以形成嵌合AAV载体,如美国专利第7,282,199号中描述的AAV2/8,所述美国专利通过引用并入本文。任选地,载体进一步含有迷你基因,所述迷你基因包括两侧是AAV 5'ITR和AAV 3'ITR的所选转基因。在另一个实施例中,AAV是自互补AAV(sc-AAV)(参见以引用的方式并入本文中的US2012/0141422)。自互补载体包装一个反向重复基因组,它可以折叠成dsDNA,而无需DNA合成或多个载体基因组之间的碱基配对。由于scAAV不需要在表达之前将单股DNA(ssDNA)基因组转化为双股DNA(dsDNA),因此其为更有效的载体。然而,这种效率的代价是载体编码能力的一半损失,ScAAV可用于小蛋白编码基因(至多约55kd)和任何目前可用的基于RNA的疗法。
假型载体可用于本文,其中一种AAV的衣壳被异源衣壳蛋白替代。为了说明性目的,在如下文所描述的实例中使用如本文所描述的利用AAVrh91衣壳的AAV载体和AAV2ITR。参见上文所引用的Mussolino等人。除非另外规定,否则本文所述的AAV ITR和其它所选AAV成分可个别地选自任何AAV血清型,包含但不限于AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9或其它已知和未知的AAV血清型。在一个理想的实施例中,使用AAV血清型2的ITR。然而,可选择来自其它合适血清型的ITR。这些ITR或其它AAV成分可以使用本领域技术人员可用的技术从AAV血清型中容易地分离。此类AAV可以从学术、商业或公共来源分离或获得(例如,维吉尼亚州马纳萨斯的美国典型培养物保藏中心(the American TypeCulture Collection,Manassas,VA))。可替代地,AAV序列可以通过合成或其它适合的方式通过参考公开的序列(如在文献中或在如例如GenBank、PubMed等数据库中可获得的公开的序列)而获得。
本文所描述的rAAV还包括载体基因组。载体基因组至少由如下所述的非AAV或异源核酸序列(转基因)和其调控序列以及5'和3'AAV反向末端重复序列(ITR)组成。这种迷你基因被包装到衣壳蛋白中并且递送到所选靶细胞。
转基因是与转基因侧翼的载体序列异源的核酸序列,其编码所关注的多肽、蛋白质或其它产物。核酸编码序列以允许转基因在靶细胞中转录、翻译和/或表达的方式与调控组分可操作地连接。异源核酸序列(转基因)可以源自任何生物体。AAV可以包括一种或多种转基因。
在某些实施例中,本文提供了包含转基因的rAAVrh91载体,所述转基因包括编码促红细胞生成素(EPO)的序列。在某些实施例中,转基因编码犬或猫EPO基因。此类重组载体适用于例如治疗以循环红细胞量减少为特征的受试者的慢性肾病和其它病症的方案。
在某些实施例中,本文提供了包含转基因的rAAVrh91载体,所述转基因包括编码抗神经生长因子(NGF)抗体的序列。在某些实施例中,转基因编码犬或猫抗NGF抗体。此类重组载体适用于例如治疗受试者的骨关节炎疼痛的方案。
在某些实施例中,本文提供了包含转基因的rAAVrh91载体,所述转基因包括编码胰高血糖素样肽1(GLP-1)的序列。在某些实施例中,转基因编码犬或猫GLP-1。此类重组载体适用于例如治疗受试者的II型糖尿病的方案。
在某些实施例中,本文提供了包含转基因的rAAVrh91载体,所述转基因包括编码胰岛素的序列。在某些实施例中,转基因编码犬或猫胰岛素。此类重组载体适用于例如治疗受试者的I型糖尿病或II型糖尿病的方案。
在某些实施例中,本文提供了包含转基因的rAAVrh91载体,所述转基因包括CLN(蜡样质脂褐质沉积症,神经元)基因。在某些实施例中,转基因编码棕榈酰蛋白硫酯酶1-PPT1(CLN1)。在某些实施例中,转基因编码三肽基肽酶1–TPP1(CLN2)。在某些实施例中,转基因编码CLN3(CLN3)。在某些实施例中,转基因编码DNAJC5(CLN4)。在某些实施例中,转基因编码CLN5(CLN5)。在某些实施例中,转基因编码CLN6(CLN6)。在某些实施例中,转基因编码MFSD8(CLN7)。在某些实施例中,转基因编码CLN8(CLN8)。在某些实施例中,转基因编码CTSD(CLN10)。在某些实施例中,转基因编码GRN(CLN11)。在某些实施例中,转基因编码ATP13A2(CLN12)。在某些实施例中,转基因编码ATP13A2(CLN13.)。此类重组载体适用于例如治疗受试者的贝敦氏症(Batten disease)或神经元蜡样脂褐质沉积症(NCL)的方案。
在某些实施例中,本文提供了包含转基因的rAAVrh91载体,所述转基因包括编码PTEN诱导的激酶1,一种由PINK1基因编码的线粒体丝氨酸/苏氨酸蛋白激酶,的序列。此类重组载体适用于例如治疗年轻发病的帕金森病(Parkinson disease)的方案。
在某些实施例中,本文提供了包含转基因的rAAVrh91载体,所述转基因包括编码IgE、IL-32或IL-4/IL-13受体的白细胞介素-4受体α(IL-4Rα)亚基拮抗剂的序列,包含例如,抗体和受体-IgG融合蛋白。在某些实施例中,转基因编码犬或猫IgE、IL-32或IL-4Rα亚基的拮抗剂。此类重组载体适用于例如治疗受试者的特应性皮炎的方案。
转基因序列的组合物将取决于将投入的所得载体的用途。例如,一种类型的转基因序列包含报道序列,所述报道序列在表达时产生可检测的信号。此类报告序列包含但不限于:编码β-内酰胺酶、β-半乳糖苷酶(LacZ)、碱性磷酸酶、胸苷激酶、绿色荧光蛋白(GFP)、增强型GFP(EGFP)、氯霉素乙酰转移酶(CAT)、荧光素酶的DNA序列、包含例如CD2、CD4、CD8的膜结合蛋白、流感血凝素蛋白以及本领域熟知的其它蛋白、以及包括与来自尤其血凝素或Myc的抗原标签结构域适当融合的膜结合蛋白的融合蛋白,其中存在针对所述其它蛋白的高亲和力抗体或可以通过常规方法产生所述高亲和力抗体。
当与驱动其表达的调控元件相关时,这些编码序列提供可通过常规手段检测的信号,包含酶、射线照相、比色、荧光或其它光谱测定、荧光激活细胞分选测定和免疫测定,所述免疫测定包含酶联免疫吸附测定(ELISA)、放射免疫测定(RIA)和免疫组化。例如,在标志物序列是LacZ基因的情况下,通过测定β-半乳糖苷酶活性来检测携带信号的载体的存在。在转基因是绿色荧光蛋白或荧光素酶的情况下,携带信号的载体可以通过在发光计中的颜色或光产生来目测测量。
然而,期望的是,转基因是编码可用于生物学和医学的产物如蛋白质、肽、RNA、酶、显性失活突变体或催化性RNA的非标志物序列。期望的RNA分子包含tRNA、dsRNA、核糖体RNA、催化性RNA、siRNA、小发夹RNA、反式剪接RNA和反义RNA。有用的RNA序列的一个实例是抑制或消除所治疗动物中靶向核酸序列的表达的序列。通常,合适的靶序列包含肿瘤靶标和病毒疾病。关于此类靶标的实例,参见下文在与免疫原相关的部分中识别的肿瘤靶标和病毒。
转基因可以用于校正或改善基因缺陷,所述基因缺陷可以包含正常基因以低于正常水平表达的缺陷或不表达功能基因产物的缺陷。可替代地,转基因可以向细胞提供不天然表达于所述细胞类型或宿主中的产物。优选类型的转基因序列编码在宿主细胞中表达的治疗性蛋白质或多肽。本发明进一步包含使用多种转基因。在某些情况下,可以使用不同的转基因来编码蛋白质的每个亚基或编码不同的肽或蛋白质。当编码例如免疫球蛋白、血小板衍生的生长因子或肌营养不良蛋白的蛋白质亚基的DNA的大小很大时,这是所希望的。为了使细胞产生多亚基蛋白质,用含有不同亚基中的每一种的重组病毒感染细胞。可替代地,蛋白质的不同亚基可以由相同的转基因编码。在这种情况下,单个转基因包含编码每个亚基的DNA,其中每个亚基的DNA被内部核酶进入位点(IRES)分开。当编码每个亚基的DNA的大小很小时,例如编码亚基和IRES的DNA的总尺寸小于五千碱基,这是所希望的。作为IRES的替代方案,DNA可以通过编码2A肽的序列分开,所述2A肽在翻译后事件中自切割。参见例如M.L.Donnelly等人,《普通病毒学杂志(J.Gen.Virol.)》,78(Pt 1):13-21(1997年1月);Furler,S.等人,《基因疗法(Gene Ther.)》,8(11):864-873(2001年6月);Klump H.等人,《基因疗法》,8(10):811-817(2001年5月)。这种2A肽明显小于IRES,这非常适合在空间是限制因子时使用。更常见的是,当转基因较大,由多个亚单位组成,或两个转基因共同递送时,携带所需转基因或亚单位的rAAV被共同施用以允许其在体内连环化以形成单个载体基因组。在这种实施例中,第一AAV可以携带表达单个转基因的表达盒,并且第二AAV可以携带表达不同的转基因以在宿主细胞中共表达的表达盒。然而,所选择的转基因可以编码任何生物活性产物或其它产物,例如研究所期望的产物。
合适的转基因或基因产物的实例包含与家族性高胆固醇血症、肌营养不良、囊性纤维化以及罕见病或孤儿病相关的那些。此类罕见病的实例可以包含脊髓性肌萎缩症(SMA)、亨廷顿氏病(Huntingdon's Disease)、雷特综合征(Rett Syndrome)(例如,甲基CpG结合蛋白2(MeCP2);UniProtKB-P51608)、肌萎缩侧索硬化症(ALS)、杜氏肌营养不良(Duchenne Type Muscular dystrophy)、弗里德里希共济失调(Friedrichs Ataxia)(例如,共济蛋白)、与2型脊髓小脑性共济失调(SCA2)/ALS相关的ATXN2;与ALS相关的TDP-43、颗粒蛋白前体(PRGN)(与非阿尔茨海默氏病的大脑变性相关,包含额颞叶痴呆(FTD)、进行性非流利性失语症(PNFA)和语义性痴呆)、CDKL5缺乏症、安格曼综合征(Angelmansyndrome)、N-聚糖酶1缺乏症、阿尔茨海默氏病(Alzheimer's disease)、脆性X综合征、尼曼皮克病(Neimann Pick disease)(包含A型和B型(ASMD或酸性鞘磷脂酶缺乏症)以及c型(NPC))、粘多糖贮积症(MPS)、沃尔曼病(Wolman disease)、泰-萨克斯病(Tay-Sachsdisease)等。参见例如,www.orpha.net/consor/cgi-bin/Disease_Search_List.php;rarediseases.info.nih.gov/diseases。
由转基因编码的有用治疗产品包含激素以及生长和分化因子,包含但不限于胰岛素、胰高血糖素、胰高血糖素样肽1(GLP-1)、生长激素(GH)、甲状旁腺激素(PTH)、生长激素释放因子(GRF)、卵泡刺激素(FSH)、促黄体激素(LH)、人绒毛膜促性腺激素(hCG)、血管内皮生长因子(VEGF)、血管生成素、血管生成抑制素、粒细胞集落刺激因子(GCSF)、促红细胞生成素(EPO)、结缔组织生长因子(CTGF)、碱性成纤维细胞生长因子(bFGF)、酸性成纤维细胞生长因子(aFGF)、表皮生长因子(EGF)、转化生长因子α(TGFα)、血小板衍生生长因子(PDGF)、胰岛素生长因子I和II(IGF-I和IGF-II)、转化生长因子β超家族中的任一种,包含TGFβ、激活素、抑制素或骨形态发生蛋白(BMP)BMP 1-15中的任一种、生长因子的调蛋白/神经调节蛋白/ARIA/神经分化因子(NDF)家族中的任一种、神经生长因子(NGF)、脑源性神经营养因子(BDNF)、神经营养蛋白NT-3和NT-4/5、睫状神经营养因子(CNTF)、胶质细胞源性神经营养因子(GDNF)、溶酶体酸性脂肪酶(LIPA或LAL)、神经营养素、凝集素、信号素/脑衰蛋白家族中的任一种、纺锤蛋白-1和纺锤蛋白-2、肝细胞生长因子(HGF)、蝶素、头蛋白、音猬因子和酪氨酸羟化酶。其它有用的转基因编码导致粘多糖贮积症(MPS)的溶酶体酶,包含α-L-艾杜糖醛酸酶(MPSI)、艾杜糖醛酸硫酸酯酶(MPSII)、乙酰肝素N-硫酸酯酶(sulfaminidase)(MPS IIIA,Sanfilippo A)、α-N-乙酰基-葡糖胺苷酶(MPS IIIB,Sanfilippo B)、乙酰辅酶A:α-氨基葡萄糖苷乙酰转移酶(MPS IIIC,Sanfilippo C)、N-乙酰氨基葡萄糖6-硫酸酯酶(MPS IIID,Sanfilippo D)、半乳糖6-硫酸酯酶(MPS IV A,Morquio A)、β-半乳糖苷酶(MPS IVB,Morquio B)、N-乙酰基-半乳糖胺4-硫酸酯酶(MPSVI,马罗托-拉米(Maroteaux-Lamy))、β-葡萄糖醛酸酶(MPS VII,Sly)和透明质酸酶(MPSIX)。
其它有用的转基因产物包含调控免疫系统的蛋白质,所述免疫系统包含但不限于:如血小板生成素(TPO)等细胞因子和淋巴因子、白细胞介素(IL)IL-1到IL-25(包含IL-2、IL-4、IL-12和IL-18)、单核细胞趋化蛋白、白血病抑制因子、粒细胞-巨噬细胞集落刺激因子、Fas配体、肿瘤坏死因子α和β、干扰素α、β和γ、干细胞因子、flk-2/flt3配体。由免疫系统产生的基因产物也可用于本发明。这些包含但不限于免疫球蛋白IgG、IgM、IgA、IgD和IgE、嵌合免疫球蛋白、人源化抗体、单链抗体、T细胞受体、嵌合T细胞受体、单链T细胞受体、MHC I类和II类分子以及经过工程化的免疫球蛋白和MHC分子。有用的基因产物还包含补体调控蛋白,如补体调控蛋白、膜辅因子蛋白(MCP)、衰变加速因子(DAF)、CR1、CF2和CD59。
仍其它有用的基因产物包含用于激素、生长因子、细胞因子、淋巴因子、调控蛋白和免疫系统蛋白的受体中的任一种。本发明涵盖用于胆固醇调控的受体,包含低密度脂蛋白(LDL)受体、高密度脂蛋白(HDL)受体、极低密度脂蛋白(VLDL)受体和清除剂受体。本发明还涵盖基因产物,如类固醇激素受体超家族的成员,包含糖皮质激素受体和雌激素受体、维生素D受体和其它核受体。另外,有用的基因产物包含转录因子,如jun、fos、max、mad、血清响应因子(SRF)、AP-1、AP2、myb、MyoD和肌生成素、含ETS盒的蛋白质、TFE3、E2F、ATF1、ATF2、ATF3、ATF4、ZF5、NFAT、CREB、HNF-4、C/EBP、SP1、CCAAT盒结合蛋白、干扰素调节因子(IRF-1)、威尔姆斯肿瘤蛋白(Wilms tumor protein)、ETS结合蛋白、STAT、GATA盒结合蛋白(例如,GATA-3)和带翼螺旋蛋白的叉头家族。
其它有用的基因产物包含氨基甲酰合成酶I、鸟氨酸转氨甲酰酶、精氨酸琥珀酸合成酶、精氨酸琥珀酸裂解酶、精氨酸酶、富马酰乙酰乙酸水解酶、苯丙氨酸羟化酶、α-1抗胰蛋白酶、葡萄糖-6-磷酸酶、胆色素原脱氨酶、因子VIII、因子IX、胱硫醚β-合成酶、支链酮酸脱羧酶、白蛋白、异戊酰coA脱氢酶、丙酰CoA羧化酶、甲基丙二酰CoA变位酶、戊二酰CoA脱氢酶、胰岛素、β-葡萄糖苷酶、丙酮酸羧化酶、肝磷酸化酶、磷酸化酶激酶、甘氨酸脱羧酶、H蛋白、T蛋白、囊性纤维化跨膜调节(CFTR)序列和肌营养不良蛋白序列或其功能片段。仍其它有用的基因产物还包含如可以用于酶替代疗法的酶,所述酶替代疗法可用于由于酶活性不足而导致的多种病状。例如,可以将含有甘露糖-6-磷酸的酶用于溶酶体贮积病的疗法中(例如,合适的基因包含编码β-葡糖醛酸酶(GUSB)的基因)。在另一实例中,基因产物为泛素蛋白质连接酶E3A(UBE3A)。仍适用的基因产物包含UDP葡萄糖醛酸基转移酶家族1成员A1(UGT1A1)。
其它有用的基因产物包含非天然存在的多肽,如具有含有插入、缺失或氨基酸取代的非天然存在的氨基酸序列的嵌合或杂合多肽。例如,单链工程化的免疫球蛋白可用于某些免疫功能低下的患者。其它类型的非天然存在的基因序列包含反义分子和催化核酸,如核酶,其可以用于减少靶标的过度表达。
减少和/或调节基因表达对于治疗由细胞过度增殖表征的过度增殖性病状(如癌症和牛皮癣)是特别期望的。靶多肽包含与正常细胞相比在过度增殖性细胞中专门产生或以更高水平产生的那些多肽。靶抗原包含由癌基因如myb、myc、fyn和易位基因bcr/abl、ras、src、P53、neu、trk和EGRF编码的多肽。除作为靶抗原的癌基因产物之外,用于抗癌治疗和保护方案的靶多肽包含由B细胞淋巴瘤产生的抗体的可变区和T细胞淋巴瘤的T细胞受体的可变区,在一些实施例中,所述可变区还被用作自身免疫疾病的靶抗原。其它肿瘤相关多肽也可以用作靶多肽,如在肿瘤细胞中以较高水平存在的多肽,包含由单克隆抗体17-1A识别的多肽和叶酸结合多肽。
其它合适的治疗性多肽和蛋白质包含可以用于通过为针对与自身免疫相关的靶标赋予广泛基础的保护性免疫应答而治疗患有自身免疫性疾病和病症的个体的多肽和蛋白质,所述靶标包含细胞受体和产生自身定向抗体的细胞。T细胞介导的自身免疫性疾病包含类风湿关节炎(RA)、多发性硬化症(MS)、干燥综合征(
Figure BDA0004175913010000331
syndrome)、结节病、胰岛素依赖型糖尿病(IDDM)、自身免疫性甲状腺炎、反应性关节炎、强直性脊柱炎、硬皮病、多发性肌炎、皮肌炎、牛皮癣、韦格纳氏肉芽肿病(Wegner's granulomatosis)、克罗恩氏病(Crohn's disease)和溃疡性结肠炎。这些疾病中的每种疾病由与内源性抗原结合并引发与自身免疫性疾病相关的炎性级联的T细胞受体(TCR)表征。
仍其它有用的基因产物包含用于治疗血友病的基因产物,所述血友病包含血友病B(包含因子IX)和血友病A(包含因子VIII及其变体,如异二聚体和B缺失结构域的轻链和重链;美国专利第6,200,560号和美国专利第6,221,349号)。在一些实施例中,迷你基因包括因子VIII重链的前57个碱基对,所述重链编码10个氨基酸信号序列以及人生长激素(hGH)聚腺苷酸化序列。在替代性实施例中,迷你基因进一步包括A1和A2结构域以及来自B结构域的N端的5个氨基酸和/或B结构域的C端的85个氨基酸以及A3、C1和C2结构域。在又其它实施例中,在单个迷你基因中提供了编码因子VIII重链和轻链的核酸,所述单个迷你基因由编码B结构域的14个氨基酸的42个核酸分开[美国专利第6,200,560号]。
可以通过rAAV递送的另外的说明性基因包含但不限于与糖原贮积病或1A型缺乏症(GSD1)相关的葡萄糖-6-磷酸酶;与PEPCK缺乏症相关的磷酸烯醇丙酮酸羧激酶(PEPCK);细胞周期蛋白依赖性激酶样5(CDKL5),其也被称为与癫痫发作和严重的神经发育障碍相关的丝氨酸/苏氨酸激酶9(STK9);(NGLY1)N-聚糖酶1;与半乳糖血症相关的半乳糖-1磷酸尿嘧啶转移酶;与苯丙酮尿症(PKU)相关的苯丙氨酸羟化酶(PAH);与原发性高草酸尿症1型相关的基因产物,包含羟基酸氧化酶1(GO/HAO1)和AGXT,与枫糖尿病相关的支链α-酮酸脱氢酶;包含BCKDH、BCKDH-E2、BAKDH-E1a和BAKDH-E1b;与1型酪氨酸血症相关的延胡索酰乙酰乙酸水解酶;与甲基丙二酸血症相关的甲基丙二酰辅酶A变位酶;与中链乙酰辅酶A缺乏症相关的中链酰基辅酶A脱氢酶;与鸟氨酸转氨甲酰酶缺乏症相关的鸟氨酸转氨甲酰酶(OTC);与瓜氨酸血症相关的精氨酸琥珀酸合成酶(ASS1);卵磷脂胆固醇酰基转移酶(LCAT)缺乏症;甲基丙二酸血症(MMA);与尼曼-皮克病(C1型)相关的NPC1;丙酸血症(PA);与转甲状腺素蛋白(TTR)相关遗传性淀粉样变性相关的TTR;与家族性高胆固醇血症(FH)相关的低密度脂蛋白受体(LDLR)蛋白,LDLR变体,如WO 2015/164778中描述的那些变体;PCSK9;与痴呆相关的ApoE和ApoC蛋白;与克里格勒-纳贾尔病(Crigler-Najjar disease)相关的UDP-葡萄糖醛糖基转移酶;与严重联合免疫缺陷病相关的腺苷脱氨酶;与痛风和莱施-奈恩综合征(Lesch-Nyan syndrome)相关的次黄嘌呤鸟嘌呤磷酸核糖基转移酶;与生物素酶缺乏症相关的生物素酶;与法布里病(Fabry disease)相关的α-半乳糖苷酶A(a-Gal A);与GM1神经节苷脂病相关的β-半乳糖苷酶(GLB1);与威尔逊氏病(Wilson's Disease)相关的ATP7B;与戈谢病(Gaucher disease)2和3型相关的β-葡糖脑苷脂酶;与泽尔韦格氏综合征(Zellweger syndrome)相关的过氧化物酶体膜蛋白70kDa;与异染性脑白质营养不良相关的芳基硫酸酯酶A(ARSA);与克拉伯病(Krabbe disease)相关的半乳糖脑苷脂酶(GALC);与庞贝病(Pompe disease)相关的α-葡糖苷酶(GAA);与尼曼-皮克病A型相关的鞘磷脂酶(SMPD1)基因;与成人II型瓜氨酸血症(CTLN2)相关的精氨琥珀酸合酶;与脲循环病症相关的氨基甲酰磷酸合酶1(CPS1);与脊髓性肌萎缩症相关的存活运动神经元(SMN)蛋白;与法伯脂肪肉芽肿病(Farber lipogranulomatosis)相关的神经酰胺酶;与GM2神经节苷脂病和泰伊-萨克斯二氏病和山霍夫氏病(Tay-Sachs and Sandhoff diseases)相关的b-己糖胺酶;与天冬氨酰葡糖尿症相关的天冬氨酰葡糖胺酶;与岩藻糖苷贮积症相关的α岩藻糖苷酶;与α甘露糖苷贮积症相关的α-甘露糖苷酶;与急性间歇性卟啉症(AIP)相关的胆色素原脱氨酶;用于治疗α-1抗胰蛋白酶缺乏症(肺气肿)的α-1抗胰蛋白酶;用于治疗因地中海贫血或肾衰竭引起的贫血的促红细胞生成素;用于治疗缺血性疾病的血管内皮生长因子、血管生成素-1和成纤维细胞生长因子;用于治疗如例如在动脉粥样硬化、血栓形成或栓塞中所看见的阻塞的血管的血栓调节蛋白和组织因子途径抑制剂;用于治疗帕金森氏病的芳香族氨基酸脱羧酶(AADC)和酪氨酸羟化酶(TH);与受磷蛋白、肌浆(内质)网腺苷三磷酸酶2(SERCA2)呈反义或为其突变体形式的β肾上腺素能受体;和用于治疗充血性心力衰竭的心脏腺苷酸环化酶;用于治疗各种癌症的肿瘤抑制基因,如p53;用于治疗炎性和免疫病症以及癌症的细胞因子,如各种白细胞介素之一;用于治疗肌营养不良的肌营养不良蛋白或迷你肌营养不良蛋白以及肌萎缩相关蛋白或迷你肌萎缩相关蛋白;以及用于治疗糖尿病的胰岛素或GLP-1。
在某些实施例中,可以在基因编辑系统中使用rAAV,所述系统可以涉及一种rAAV或多种rAAV原液的共同施用。例如,rAAV可以被工程化以递送SpCas9、SaCas9、ARCUS、Cpf1(也称为Cas12a)、CjCas9和其它合适的基因编辑构建体。
在某些实施例中,本文提供了基于rAAV的基因编辑核酸酶系统。基因编辑核酸酶靶向疾病相关基因中的位点,即所关注的基因。
在某些实施例中,基于AAV的基因编辑核酸酶系统包括rAAV,所述rAAV包括AAVrh91衣壳和包封在其中的载体基因组,其中包括AAV 5'反向末端重复序列(ITR)的载体基因组,包括编码基因编辑核酸酶的核酸序列的表达盒,所述基因编辑核酸酶识别并切割所关注的基因中的识别位点,其中所述基因编辑核酸酶编码序列可操作地连接到表达控制序列,所述表达控制序列引导其在包括所关注的基因和AAV 3'ITR的细胞中的表达。本文还提供了使用基于rAAV的基因编辑核酸酶系统的治疗方法。
在一些实施例中,基于rAAV的基因编辑大范围核酸酶系统用于治疗疾病、病症、综合征和/或病状。在一些实施例中,基因编辑核酸酶靶向所关注的基因,其中所关注的基因具有一个或多个基因突变、缺失、插入和/或与疾病、病症、综合征和/或病状相关和/或涉及其的缺陷。在一些实施例中,病症选自但不限于心血管病症、肝病症、内分泌病症或代谢病症、肌肉骨骼病症、神经病症和/或肾病症。
可替代地或另外,本发明的载体可以含有本发明的AAV序列和编码肽、多肽或蛋白质的转基因,所述肽、多肽或蛋白质诱导针对选定免疫原的免疫应答。例如,免疫原可以选自多种病毒科。需要针对其产生免疫反应的理想病毒科的实例包含小核糖核酸病毒科,其包含鼻病毒属,其造成约50%的普通感冒病例;肠道病毒属,其包含脊髓灰质炎病毒、柯萨奇病毒、埃可病毒和人类肠道病毒,如甲型肝炎病毒;和主要在非人类动物中引起口蹄疫的口蹄疫病毒属。在病毒的小核糖核酸病毒家族内,靶抗原包含VP1、VP2、VP3、VP4和VPG。另一病毒家族包含杯状病毒家族,所述家族涵盖诺瓦克(Norwalk)病毒群,其为流行性胃肠炎的重要病原体。另一个期望用于靶向抗原以在人类和非人类动物中诱导免疫反应的病毒家族是披膜病毒科,其包含甲病毒属,其包含辛德毕斯病毒、罗斯河病毒和委内瑞拉、东方和西方马脑炎,以及风疹病毒属,包含风疹病毒。黄病毒科包含登革热、黄热病、日本脑炎、圣路易斯脑炎和蜱传脑炎病毒。其它靶抗原可以来自丙型肝炎或冠状病毒家族,其包含许多非人类病毒,如传染性支气管炎病毒(家禽)、猪传染性胃肠炎病毒(猪)、猪血凝性脑脊髓炎病毒(猪)、猫传染性腹膜炎病毒(猫)、猫肠道冠状病毒(猫)、犬冠状病毒(狗)和人类呼吸道冠状病毒,它们可能导致普通感冒和/或非-甲、乙或丙型肝炎。在冠状病毒科中,靶抗原包含E1(也称为M或基质蛋白)、E2(也称为S或纤突蛋白)、E3(也称为HE或血凝素-依尔替糖(elterose))糖蛋白(并非在所有冠状病毒中都存在)或N(核衣壳)。其它抗原可以靶向弹状病毒科,其包含水疱病毒属(例如水泡性口炎病毒)和一般狂犬病毒属(例如狂犬病)。在弹状病毒科中,合适的抗原可以来源于G蛋白或N蛋白。包含马堡病毒和埃博拉病毒等出血热病毒的丝状病毒科可能是合适的抗原来源。副粘病毒科包含副流感病毒1型、副流感病毒3型、牛副流感病毒3型、腮腺炎病毒属(腮腺炎病毒)、副流感病毒2型、副流感病毒4型、新城疫病毒(鸡)、牛瘟、麻疹病毒(其包含麻疹和犬瘟热)和肺病毒属,其包含呼吸道合胞病毒。流感病毒分类在正粘病毒科内,并且是合适的抗原来源(例如HA蛋白、N1蛋白)。布尼亚病毒科包含布尼亚病毒属(加利福尼亚脑炎、拉克罗斯(La Crosse))、白蛉病毒属(裂谷热)、汉坦病毒(普马拉病毒(puremala)是一种出血热病毒)、内罗病毒(内罗毕绵羊病)和各种未指定的布尼亚病毒。沙粒病毒科提供了抗LCM和拉沙热病毒的抗原来源。呼肠孤病毒家族包含呼肠孤病毒属、轮状病毒(其可引起儿童急性肠胃炎)、轮状病毒和科罗拉多蜱传热病毒属(cultivirus)(科罗拉多蜱传热、莱邦博病(Lebombo)(人类)、马脑病、蓝舌病)。
逆转录病毒家族包含致癌病毒亚-科,其涵盖人类和兽医疾病,如猫白血病病毒、HTLVI和HTLVII、慢病毒(其包含人类免疫缺陷病毒(HIV)、猿猴免疫缺陷病毒(SIV)、猫免疫缺陷病毒(FIV)、马传染性贫血病毒和泡沫病毒)。在HIV与SIV之间,已描述许多合适的抗原并且可以容易地选择。合适的HIV和SIV抗原的实例包含但不限于gag、pol、Vif、Vpx、VPR、Env、Tat和Rev蛋白以及其各种片段。另外,已描述对这些抗原的多种修饰。出于此目的的合适抗原是本领域的技术人员已知的。例如,可选择编码gag、pol、Vif和Vpr、Env、Tat和Rev的序列,以及其它蛋白质。参见例如美国专利5,972,596中所描述的经修饰的gag蛋白。还参见以下描述的HIV和SIV蛋白:D.H.Barouch等人,《病毒学杂志(J.Virol.)》,75(5):2462-2467(2001年3月)以及R.R.Amara等人,《科学(Science)》,292:69-74(2001年4月6日)。这些蛋白质或其亚单位可单独递送,或经由单独载体或从单一载体组合递送。
乳多泡病毒科包含亚科多瘤病毒(BKU和JCU病毒)和乳头瘤病毒亚-科(与癌症或乳头状瘤的恶性进展相关)。腺病毒科包含引起呼吸道疾病和/或肠炎的病毒(EX、AD7、ARD、O.B.)。细小病毒家科猫细小病毒(猫肠炎)、猫泛白细胞减少症病毒、犬细小病毒和猪细小病毒。疱疹病毒科包含α疱疹病毒亚-科,其涵盖单纯疱疹病毒属(HSVI、HSVII)、水痘病毒属(假性狂犬病、水痘带状疱疹);和亚科β疱疹病毒,其包含巨细胞病毒属(HCMV、鼠巨细胞病毒属);和γ疱疹病毒亚-科,其包含淋巴隐病毒属、EBV(伯基特氏淋巴瘤(Burkittslymphoma))、传染性鼻气管炎、马立克氏病(Marek's disease)病毒和猴病毒属。痘病毒科包含脊痘病毒亚-科,其涵盖正痘病毒属(天花(Variola/Smallpox)和牛痘(Vaccinia/Cowpox))、副痘病毒属、禽痘病毒属、山羊痘病毒属、兔痘病毒属、猪痘病毒属和昆虫痘病毒亚-科。肝炎病毒科包含乙型肝炎病毒。一种可能是合适的抗原来源的未分类病毒是丁型肝炎病毒。其它病毒来源可包含禽传染性法氏囊病病毒和猪呼吸和生殖综合征病毒。甲病毒科包含马动脉炎病毒和各种脑炎病毒。
本发明还可以涵盖适用于使人类或非人类动物免疫其它病原体的免疫原,所述病原体包含感染人类和非人类脊椎动物的细菌、真菌、寄生微生物或多细胞寄生虫,或来自癌细胞或肿瘤细胞。细菌病原体的实例包含致病性革兰氏-阳性球菌,包含肺炎双球菌;葡萄球菌;和链球菌。病原性革兰氏-阴性球菌包含脑膜炎球菌;淋球菌。致病性肠道革兰氏-阴性杆菌包含肠杆菌科(enterobacteriaceae);假单胞菌属(pseudomonas)、不动杆菌属(acinetobacteria)和艾肯氏菌属(eikenella);类鼻疽属(melioidosis);沙门氏菌属(salmonella);志贺氏菌属(shigella);嗜血杆菌属(haemophilus);莫拉氏菌属(moraxella);杜克雷嗜血杆菌属(H.Ducreyi)(导致软下疳);布鲁氏菌属(brucella);土拉弗朗西斯菌(Franisella tularensis)(导致土拉菌病);耶尔森氏菌属(yersinia)(巴氏杆菌属(pasteurella));念珠状链杆菌(streptobacillus moniliformis)和螺旋菌属(spirillum);革兰氏阳性杆菌包含单核细胞增生李斯特菌(listeria monocytogenes);猪红斑丹毒丝菌(erysipelothrix rhusiopathiae);白喉棒状杆菌(Corynebacteriumdiphtheria)(白喉(diphtheria));霍乱;炭疽杆菌(B.anthracis)(炭疽(anthrax));杜诺凡病(donovanosis)(腹股沟肉芽肿);和巴尔通体病(bartonellosis)。由致病性厌氧菌引起的疾病包含破伤风;肉毒杆菌;其它梭菌;结核;麻风;和其它分枝杆菌。致病性螺旋体病包含梅毒;密螺旋体病:雅司病(yaws)、斑点病和地方性梅毒;以及钩端螺旋体病。其它由高等致病性细菌和致病性真菌引起的感染包含放线菌病;诺卡氏菌病;隐球菌病、芽生菌病、组织胞浆菌病和球孢子菌病;念珠菌病、曲霉病和毛霉菌病;孢子丝菌病;副球孢子菌病、球孢菌病、圆环孢菌病、足菌肿和染色体病;和皮肤癣菌病。立克次体感染包含斑疹伤寒、落基山斑疹热、Q热和立克次体痘。支原体和衣原体感染的实例包含:肺炎支原体;性病淋巴肉芽肿;鹦鹉热;和围产期衣原体感染。致病性真核生物涵盖致病性原生动物和蠕虫,并且由此产生的感染包含:阿米巴病(amebiasis);疟疾;利什曼病(leishmaniasis);锥虫病;弓形体病;卡氏肺孢子虫(Pneumocystis carinii);特里坎斯(Trichans);刚地弓形虫(Toxoplasma gondii);巴贝斯虫病(babesiosis);贾第鞭毛虫病(giardiasis);旋毛虫病;丝虫病;血吸虫病;线虫病;吸虫(trematodes)或吸虫(flukes);和绦虫(cestode/tapeworm)感染。
许多这些生物体和/或由此产生的毒素已被疾病控制中心[(CDC),美国卫生和公众服务部]鉴定为有可能用于生物攻击的药剂。例如,这些生物药剂中的一些包含炭疽芽孢杆菌(Bacillus anthracis)(炭疽)、肉毒杆菌(Clostridium botulinum)和其毒素(肉毒中毒)、鼠疫耶尔森菌(Yersinia pestis)(鼠疫)、大天花(天花)、土拉弗朗西斯菌(土拉菌病)和病毒性出血热,所有这些目前都归类为A类药剂;立克次体(Coxiella burnetti)(Q热);布鲁氏菌种(Brucella species)(布鲁氏菌病(brucellosis))、鼻疽伯克霍尔德氏菌(Burkholderia mallei)(鼻疽病)、蓖麻(Ricinus communis)和其毒素(蓖麻毒素)、产气荚膜芽胞梭菌(Clostridium perfringens)和其毒素(ε毒素)、葡萄球菌种和其毒素(肠毒素B),所有这些目前都归类为B类药剂;以及尼潘病毒(Nipan virus)和汉坦病毒(hantavirus),目前被归类为C类药剂。此外,被如此分类或不同分类的其它生物体可以在未来被识别和/或用于这样的目的。将容易理解的是,本文所描述的病毒载体和其它构建体可用于从这些生物体、病毒、其毒素或其它副产物递送抗原,这将预防和/或治疗感染或与这些生物药剂有关的其它不良反应。
施用本发明的载体以递送针对T细胞可变区的免疫原引发包含CTL的免疫应答以消除那些T细胞。在类风湿性关节炎(RA)中,已经表征了与所述疾病相关的T细胞受体(TCR)的若干特定可变区。这些TCR包含V-3、V-14、V-17和Vα-17。因此,编码这些多肽中的至少一种的核酸序列的递送将引发免疫反应,所述免疫反应将靶向涉及RA的T细胞。在多发性硬化症(MS)中,已表征涉及所述疾病的TCR的若干特定可变区。这些TCR包含V-7和Vα-10。因此,编码这些多肽中的至少一种的核酸序列的递送将引发免疫反应,所述免疫反应将靶向涉及MS的T细胞。在硬皮病中,已表征涉及所述疾病的TCR的若干特定可变区。这些TCR包含V-6、V-8、V-14和Vα-16、Vα-3C、Vα-7、Vα-14、Vα-15、Vα-16、Vα-28和Vα-12。因此,编码这些多肽中的至少一种的核酸分子的递送将引发免疫反应,所述免疫反应将靶向涉及硬皮病的T细胞。
在一个实施例中,选择转基因以提供光遗传疗法。在光遗传疗法中,人工光感受器是通过将光激活通道或泵基因递送到剩余视网膜回路中的存活细胞类型来构建的。这特别适用于已经失去大量光感受器功能,但其双极细胞回路至神经节细胞和视神经保持完整的患者。在一个实施例中,异源核酸序列(转基因)为视蛋白。视蛋白序列可以来源于任何合适的单细胞或多细胞生物,包含人类、藻类和细菌。在一个实施例中,视蛋白为视紫红质、光视蛋白、L/M波长(红色/绿色)-视蛋白或短波长(S)视蛋白(蓝色)。在另一个实施例中,视蛋白为通道视紫红质或盐细菌视紫红质。
在另一个实施例中,选择转基因用于基因增强疗法,即提供缺失或缺陷基因的替代拷贝。在此实施例中,本领域技术人员可以容易地选择转基因以提供必要的替代基因。在一个实施例中,缺失/缺陷的基因与眼部病症有关。在另一个实施例中,转基因为NYX、GRM6、TRPM1L或GPR179,并且眼部病症为先天性静止性夜盲症。参见如Zeitz等人,《美国人类遗传学杂志(Am J Hum Genet.)》2013年1月10日;92(1):67-75.电子版2012年12月13日,所述文献通过引用并入本文。在另一个实施例中,转基因为RPGR。
在另一个实施例中,选择转基因用于基因抑制疗法,即,一种或多种天然基因的表达在转录或翻译水平下被中断或抑制。这可以使用短发夹RNA(shRNA)或所属领域中众所周知的其它技术实现。参见例如Sun等人,《国际癌症杂志(Int J Cancer.)》2010年2月1日;126(3):764-74以及O'Reilly M等人《美国人类遗传学杂志》2007年7月;81(1):127-35,所述文献通过引入并入本文。在此实施例中,本领域的技术人员可以基于需要沉默的基因容易地选择转基因。
在另一个实施例中,转基因包括多于一个转基因。这可以使用携带两个或更多个异源序列的单一载体,或使用各自携带一个或多个异源序列的两个或更多个AAV来实现。在一个实施例中,AAV用于基因抑制(或敲低)和基因增强协同疗法。在敲低/增强协同疗法中,所关注的基因的缺陷拷贝被沉默并提供非突变拷贝。在一个实施例中,这使用两个或更多个共同施用的载体实现。参见Millington-Ward等人,《分子疗法(Molecular Therapy)》,2011年4月,19(4):642-649,其以引用的方式并入本文中。转基因可由本领域的技术人员基于所需结果容易地选择。
在另一个实施例中,选择转基因用于基因校正疗法。这可以使用例如锌指核酸酶(ZFN)诱导的DNA双股断裂结合外源DNA供体底物来实现。参见例如Ellis等人,《基因疗法》(电子版2012年1月)20:35-42,其以引用的方式并入本文中。转基因可由本领域的技术人员基于所需结果容易地选择。
在一个实施例中,本文所述的衣壳可用于美国临时专利申请号61/153,470、62/183,825、62/254,225和62/287,511中描述的CRISPR-Cas双载体系统,这些申请各自以引用的方式并入本文中。衣壳还可用于递送归巢核酸内切酶或其它大范围核酸酶。
在另一个实施例中,本文有用的转基因包含报告序列,其在表达时产生可检测信号。此类报告序列包含但不限于编码以下者的DNA序列:β-内酰胺酶、β-半乳糖苷酶(LacZ)、碱性磷酸酶、胸苷激酶、绿色荧光蛋白(GFP)、红色荧光蛋白(RFP)、氯霉素乙酰转移酶(CAT)、荧光素酶、膜结合蛋白(包含例如CD2、CD4、CD8)、流感血凝素蛋白和本领域熟知的其它蛋白,针对其存在或可通过常规方法产生高亲和力抗体,以及融合蛋白,包括适当地与尤其来自血凝素或Myc的抗原标签域融合的膜结合蛋白。
当与驱动其表达的调控元件相关时,这些编码序列提供可通过常规手段检测的信号,包含酶、射线照相、比色、荧光或其它光谱测定、荧光激活细胞分选测定和免疫测定,所述免疫测定包含酶联免疫吸附测定(ELISA)、放射免疫测定(RIA)和免疫组化。例如,在标志物序列是LacZ基因的情况下,通过测定β-半乳糖苷酶活性来检测携带信号的载体的存在。在转基因是绿色荧光蛋白或荧光素酶的情况下,携带信号的载体可以通过在发光计中的颜色或光产生来目测测量。
期望地,转基因编码可用于生物学和医学的产物,如蛋白质、肽、RNA、酶或催化性RNA。理想的RNA分子包含shRNA、tRNA、dsRNA、核糖体RNA、催化RNA和反义RNA。适用的RNA序列的一个实例是消除经治疗动物中的靶核酸序列表达的序列。
调控序列包含常规控制元件,其以允许其在用载体转染或感染如本文所描述产生的病毒的细胞中转录、翻译和/或表达的方式可操作地连接到转基因。如本文所使用的,“可操作地连接的”序列包含与所关注的基因邻接的表达控制序列和以反式或在远处起作用以控制所关注的基因的表达控制序列。
术语“异源性”当结合蛋白质或核酸使用时指示蛋白质或核酸包括在自然界中未发现彼此间的相同关系的两个或更多个序列或子序列。例如,核酸通常是重组地产生的,具有来自不相关基因的布置成产生新的功能性核酸的两个或更多个序列。例如,在一个实施例中,核酸具有来自一个基因的布置成引导编码序列从不同基因表达的启动子。因此,关于编码序列,启动子是异源性的。
表达控制序列包含适当的转录起始、终止、启动子和增强子序列;有效的RNA加工信号,如剪接和聚腺苷酸化(polyA)信号;稳定细胞质mRNA的序列;增强翻译效率的序列(即,Kozak共有序列);增强蛋白质稳定性的序列;以及当需要时,增强经编码的产物的分泌的序列。大量表达控制序列(包含启动子)在本领域中已知并且可以被利用。
可用于本文提供的构建体中的调控序列还可含有内含子,理想地位于启动子/增强子序列与基因之间。一个期望的内含子序列源自SV-40,并且是被称为SD-SA的100bp的小内含子剪接供体/剪接受体。另一合适的序列包含土拔鼠肝炎病毒转录后元件。(参见例如L.Wang和I.Verma,1999《美国国家科学院院刊(Proc.Natl.Acad.Sci.,USA)》,96:3906-3910)。PolyA信号可以源自许多适合的物种,包含但不限于人和牛SV-40。
适用于本文所述的方法的rAAV的另一调控组分为内部核糖体进入位点(IRES)。IRES序列或其它适合的系统可以用于由单个基因转录物产生多于一种多肽。IRES(或其它适合的序列)用于产生含有多于一条多肽链的蛋白质,或用于表达来自同一细胞或在同一细胞内的两种不同的蛋白质。示例性IRES是脊髓灰质炎病毒内部核糖体进入序列,其支持光感受器、RPE和神经节细胞中的转基因表达。优选地,IRES位于rAAV载体的转基因的3'。
在一个实施例中,表达盒或载体基因组包括启动子(或启动子的功能片段)。用于rAAV中的启动子可选自多种可在所需靶细胞中表达所选转基因的组成性或诱导性启动子。在一个实施例中,靶细胞是眼细胞。启动子可以来源于任何物种,包含人类。理想地,在一个实施例中,启动子具有“细胞特异性”。术语“细胞特异性”意指为重组载体选择的特定启动子可以引导所选转基因在特定细胞组织中的表达。在一个实施例中,启动子对转基因在肌肉细胞中的表达具有特异性。在另一个实施例中,启动子对肺中的表达具有特异性。在另一个实施例中,启动子对转基因在肝细胞中的表达具有特异性。在另一个实施例中,启动子对转基因在气道上皮中的表达具有特异性。在另一个实施例中,启动子对转基因在神经元中的表达具有特异性。在另一个实施例中,启动子对转基因在心脏中的表达具有特异性。
表达盒通常含有启动子序列作为表达控制序列的一部分例如,位于选定5'ITR序列与免疫球蛋白构建体编码序列之间。在一个实施例中,肝脏中的表达是合乎需要的。因此,在一个实施例中,使用肝特异性启动子。可以在本文所描述的载体中使用组织特异性启动子、组成型启动子、可调控启动子[参见例如WO 2011/126808和WO 2013/04943]或对生理学线索有应答的启动子。在另一个实施例中,肌肉中的表达是合乎需要的。因此,在一个实施例中,使用肌肉特异性启动子。在一个实施例中,启动子是基于MCK的启动子,如dMCK(509-bp)或tMCK(720-bp)启动子(参见例如Wang等人,《基因疗法》2008年11月;15(22):1489-99.doi:10.1038/gt.2008.104.电子版2008年6月19日,所述文献通过引用并入本文)。另一适用的启动子是SPc5-12启动子(参见Rasowo等人,《欧洲科学杂志(EuropeanScientific Journal)》2014年6月版第10卷,第18期,其以引用的方式并入本文中)。在一个实施例中,启动子为CMV启动子。在另一个实施例中,启动子为TBG启动子。在另一个实施例中,使用CB7启动子或CAG启动子。CB7是具有巨细胞病毒增强子元件的鸡β-肌动蛋白启动子。可替代地,可以使用其它肝脏特异性启动子[参见例如,肝脏特异性基因启动子数据库(The Liver Specific Gene Promoter Database),冷泉港实验室(Cold Spring Harbor),rulai.schl.edu/LSPD,α-1抗胰蛋白酶(A1AT);人白蛋白,Miyatake等人,《病毒学杂志》,71:5124 32(1997),humAlb;以及乙型肝炎病毒核心启动子,Sandig等人,《基因疗法》,3:1002 9(1996)]。TTR最小增强子/启动子、α-抗胰蛋白酶启动子、LSP(845nt)25(需要无内含子scAAV)。
一种或多种启动子可以选自不同的来源,例如人巨细胞病毒(CMV)立即早期增强子/启动子、SV40早期增强子/启动子、JC多瘤病毒启动子、髓鞘碱性蛋白(MBP)或神经胶质原纤维酸性蛋白(GFAP)启动子、单纯疱疹病毒(HSV-1)潜伏期相关启动子(LAP)、劳氏肉瘤病毒(RSV)长末端重复(LTR)启动子、神经元特异性启动子(NSE)、血小板源性生长因子(PDGF)启动子、hSYN、黑色素浓缩激素(MCH)启动子、CBA、基质金属蛋白启动子(MPP)和鸡β-肌动蛋白启动子。
表达盒可以含有至少一种增强子,即CMV增强子。仍其它增强子元件可以包含例如载脂蛋白增强子、斑马鱼增强子、GFAP增强子元件和脑特异性增强子(如在WO 2013/1555222中描述的)、土拨鼠肝炎后转录后(WPRE)调控元件。另外或可替代地,可以选择其它例如杂合人巨细胞病毒(HCMV)-立即早期(IE)-PDGR启动子或其它启动子-增强子元件。本文适用的其它增强子序列包含IRBP增强子(Nicoud 2007,《基因医学杂志(J Gene Med.)》2007年12月;9(12):1015-23)、立即早期巨细胞病毒增强子、源自免疫球蛋白基因或SV40增强子的一种、小鼠近端启动子中鉴别的顺式作用元件等。
除启动子之外,表达盒和/或载体可以含有其它合适的转录起始、终止、增强子序列、如剪接和聚腺苷酸化(polyA)信号等有效RNA加工信号;稳定胞质mRNA的序列;增强翻译效率的序列(即,Kozak共有序列);增强蛋白稳定性的序列;以及当需要时,增强经编码的产物的分泌的序列。多种合适的polyA是已知的。在一个实例中,polyA是兔β珠蛋白,如127bp兔β珠蛋白聚腺苷酸化信号(GenBank编号V00882.1)。在其它实施例中,选择SV40 polyA信号。在某些实施例中,poly A是牛生长激素聚腺苷酸化(bGH-polyA)信号。
可选择其它合适的polyA序列。在某些实施例中,包含内含子。一个合适的内含子是鸡β-肌动蛋白内含子。在一个实施例中,内含子为875bp(GenBank编号X00182.1)在另一个实施例中,使用可购自普洛麦格公司(Promega)的嵌合内含子。然而,可选择其它合适的内含子。在一个实施例中,包含间隔子以使得载体基因组与天然AAV载体基因组的大小大致相同(例如,在4.1与5.2kb之间)。在一个实施例中,包含间隔子以使得载体基因组为约4.7kb。参见Wu等人,基因组大小对AAV载体包装的影响(Effect of Genome Size on AAVVector Packaging),《分子疗法(Mol Ther.)》2010年1月;18(1):80-86,所述参考文献通过引用并入本文。
这些和其它常见载体和调控元件的选择是常规的并且许多此类序列是可用的。参见例如Sambrook等人和其中所引用的参考文献,例如第3.18-3.26和16.17-16.27页,以及Ausubel等人,当前分子生物学实验指南(Current Protocols in Molecular Biology)》,纽约约翰威立父子出版公司(John Wiley&Sons,New York),1989。当然,并非所有载体和表达控制序列都将同样好地起作用以表达如本文所述的所有转基因。然而,本领域的技术人员可以在不脱离本发明的范围的情况下在这些和其它表达控制序列中进行选择。
在某些实施例中,表达盒含有作为miR-183靶序列的至少一个miRNA靶序列。在某些实施例中,载体基因组或表达盒含有miR-183靶序列,其包含AGTGAATTCTACCAGTGCCATA(SEQ ID NO:13),其中与miR-183种子序列互补的序列加下划线。在某些实施例中,载体基因组或表达盒含有与miR-183种子序列100%互补的序列的多于一个拷贝(例如,两个或三个拷贝)。在某些实施例中,miR-183靶序列的长度为约7个核苷酸到约28个核苷酸并且包含与miR-183种子序列至少100%互补的至少一个区。在某些实施例中,miR-183靶序列含有与SEQ ID NO:13部分互补的序列,并且因此当与SEQ ID NO:13比对时,存在一个或多个错配。在某些实施例中,当与SEQ ID NO:13比对时,miR-183靶序列包括具有至少1、2、3、4、5、6、7、8、9或10个错配的序列,其中所述错配可以是不连续的。在某些实施例中,miR-183靶序列包含具有100%互补性的区,所述区还包括miR-183靶序列的长度的至少30%。在某些实施例中,具有100%互补性的区域包含与miR-183种子序列具有100%互补性的序列。在某些实施例中,miR-183靶序列的其余部分与miR-183具有至少约80%至约99%的互补性。在某些实施例中,表达盒或载体基因组包含miR-183靶序列,所述靶序列包括截短的SEQ ID NO:13,即在SEQ ID NO:13的5'端或3'端中的任一端或两个端处缺乏至少1、2、3、4、5、6、7、8、9或10个核苷酸的序列。在某些实施例中,表达盒或载体基因组包括转基因和一个miR-183靶序列。在又其它实施例中,表达盒或载体基因组包括至少两个、三个或四个miR-183靶序列。
在某些实施例中,表达盒含有作为miR-182靶序列的至少一个miRNA靶序列。在某些实施例中,载体基因组或表达盒含有miR-182靶序列,其包含AGTGTGAGTTCTACCATTGCCAAA(SEQ ID NO:14)。在某些实施例中,载体基因组或表达盒含有与miR-182种子序列100%互补的序列的多于一个拷贝(例如,两个或三个拷贝)。在某些实施例中,miR-182靶序列的长度为约7个核苷酸到约28个核苷酸并且包含与miR-182种子序列至少100%互补的至少一个区。在某些实施例中,miR-182靶序列含有与SEQ ID NO:14部分互补的序列,并且因此当与SEQ ID NO:14比对时,存在一个或多个错配。在某些实施例中,当与SEQ ID NO:14比对时,miR-183靶序列包括具有至少1、2、3、4、5、6、7、8、9或10个错配的序列,其中所述错配可以是不连续的。在某些实施例中,miR-182靶序列包含具有100%互补性的区,所述区还包括miR-182靶序列的长度的至少30%。在某些实施例中,具有100%互补性的区包含与miR-182种子序列具有100%互补性的序列。在某些实施例中,miR-182靶序列的其余部分与miR-182具有至少约80%至约99%的互补性。在某些实施例中,表达盒或载体基因组包含miR-182靶序列,所述靶序列包括截短的SEQ ID NO:14,即在SEQ ID NO:14的5'端或3'端中的任一端或两个端处缺乏至少1、2、3、4、5、6、7、8、9或10个核苷酸的序列。在某些实施例中,表达盒或载体基因组包括转基因和一个miR-182靶序列。在其它实施例中,表达盒或载体基因组包括至少两个、三个或四个miR-182靶序列。
本文所使用的术语“串联重复序列”是指存在两个或更多个连续的miRNA靶序列。这些miRNA靶序列可以是连续的,即一个接一个地直接定位,使得一个靶序列的3'端直接位于下一个靶序列的5'端的上游,没有中间序列,或者反之亦然。在另一个实施例中,miRNA靶序列中的两个或更多个miRNA靶序列由短间隔子序列隔开。
如本文所使用的,“间隔子”是任何所选核酸序列,例如,长度为1个、2个、3个、4个、5个、6个、7个、8个、9个或10个核苷酸的定位在两个或更多个连续miRNA靶序列之间的核酸序列。在某些实施例中,间隔子的长度为1个到8个核苷酸、长度为2个到7个核苷酸、长度为3个到6个核苷酸、长度为四个核苷酸、4个到9个核苷酸、3个到7个核苷酸或更大的值。合适地,间隔子是非编码序列。在某些实施例中,间隔子可以具有四(4)个核苷酸。在某些实施例中,间隔子是GGAT。在某些实施例中,间隔子是六(6)个核苷酸。在某些实施例中,间隔子是CACGTG或GCATGC。
在某些实施例中,串联重复序列含有相同的miRNA靶序列中的两个、三个、四个或更多个。在某些实施例中,串联重复序列含有至少两个不同的miRNA靶序列、至少三个不同的miRNA靶序列或至少四个不同的miRNA靶序列等。在某些实施例中,串联重复序列可含有相同miRNA靶序列中的两个或三个和不同的第四miRNA靶序列。
在某些实施例中,表达盒中可以有至少两组不同的串联重复序列。例如,3'UTR可以含有紧邻转基因下游的串联重复序列、UTR序列和两个或更多个更接近UTR的3'端的串联重复序列。在另一个实例中,5'UTR可以含有一个、两个或更多个miRNA靶序列。在另一个实例中,3'可以含有串联重复序列,并且5'UTR可以含有至少一个miRNA靶序列。
在某些实施例中,表达盒含有两个、三个、四个或更多个串联重复序列,所述串联重复序列在转基因的终止密码子的约0个到20个核苷酸内开始。在其它实施例中,表达盒含有距转基因的终止密码子至少100个到约4000个核苷酸的miRNA串联重复序列。
参见2019年12月20日提交的PCT/US19/67872,其通过引用并入本文并且要求于2018年12月21日提交的美国临时专利申请第62/783,956号的优先权,所述申请通过引用特此并入。于2020年5月12日提交的美国临时专利申请第63/023,593号、于2020年6月12日提交的美国临时专利申请第63/038,488号以及于2020年6月24日提交的美国临时专利申请第63/043,562号还通过引用并入。
在另一个实施例中,提供一种产生重组腺相关病毒的方法。合适的重组腺相关病毒(AAV)通过培养宿主细胞产生,所述宿主细胞含有编码如本文所述的AAV衣壳蛋白或其片段的核酸序列;功能性rep基因;至少由AAV反向末端重复序列(ITR)和编码所需转基因的异源核酸序列构成的迷你基因;和允许将迷你基因包装至AAV衣壳蛋白中的足够辅助功能。在宿主细胞中培养以将AAV迷你基因包装在AAV衣壳中所需的组分可以反式形式提供到宿主细胞。可替代地,所需组分(例如,迷你基因、rep序列、cap序列和/或辅助功能)中的任何一种或多种组分可以由稳定的宿主细胞提供,所述宿主细胞已经使用本领域技术人员已知的方法被工程化为含有所需组分中的一种或多种。已经描述了产生衣壳的方法、其编码序列以及产生rAAV病毒载体的方法。参见例如Gao等人,《美国国家科学院院刊》100(10),6081-6086(2003)以及US 2013/0045186A1,所述文献通过引用并入本文。
本文还提供了用本文所描述的rAAV转导的宿主细胞。最适合的是,此类稳定宿主细胞将含有在诱导型启动子的控制下所需组分。然而,所需组分可以在组成型启动子的控制下。合适的诱导型和组成型启动子的实例提供于下文适用于转基因的调控元件的论述中。在仍另一个替代方案中,所选的稳定宿主细胞可以含有在组成型启动子控制下的所选组分以及在一个或多个诱导型启动子控制下的其它所选组分。例如,可以产生源自293个细胞的稳定宿主细胞,(所述宿主细胞含有在组成型启动子控制下的E1辅助功能),但是所述宿主细胞含有在诱导型启动子控制下的rep和/或cap蛋白。本领域技术人员还可以产生其它仍稳定的宿主细胞。在另一个实施例中,宿主细胞包括如本文所述的核酸分子。在某些实施例中,与已知衣壳相比,所描述的新型载体具有改进的产量(即更高的产量)。例如,与AAV1和AAV6相比,AAVrh91载体的产量表现出提高。
用于产生本文所描述的rAAV所需的迷你基因、rep序列、cap序列和辅助功能可以以转移其上携带的序列的任何遗传元件的形式递送到包装宿主细胞。可以通过任何适合的方法(包含本文所述的方法)递送所选基因元件。用于构建本发明的任何实施例的方法对核酸操作技术人员是已知的并且包含基因工程、重组工程以及合成技术。参见例如Sambrook等人,《分子克隆:实验室手册(Molecular Cloning:A Laboratory Manual)》,纽约冷泉港的冷泉港出版社(Cold Spring Harbor Press,Cold Spring Harbor,NY)。类似地,产生rAAV病毒粒子的方法是众所周知的并且对合适的方法的选择不是对本发明的限制。参见例如K.Fisher等人,1993《病毒学杂志》,70:520-532以及美国专利5,478,745等。这些出版物通过引用并入本文中。
C.药物组合物和施用
在一个实施例中,任选地通过常规方法评估如上所详述用于靶细胞的含有所需转基因和启动子的重组AAV的污染,且接着调配成意图向有需要的受试者施用的药物组合物。此类调配物涉及使用药学上和/或生理学上可接受的媒剂或载体,如缓冲生理盐水或其它缓冲剂,例如HEPES,以将pH维持在适当生理水平,和任选地其它药剂、医药剂、稳定剂、缓冲剂、载体、佐剂、稀释剂等。对于注射,载体将通常是液体。示例性生理上可接受的载体包含无菌、无热原水和无菌、无热原磷酸盐缓冲盐水。美国专利公开第7,629,322号中提供了各种此类已知载体,所述美国专利公开通过引用并入本文。在一个实施例中,载体是等渗氯化钠溶液。在另一个实施例中,载体是平衡盐溶液。在一个实施例中,载体包含吐温。如果病毒要长期存储,则其可以在甘油或吐温20的存在下冷冻。在另一个实施例中,药学上可接受的载体包括表面活性剂,例如全氟辛烷(Perfluoron液体)。在适合人类受试者输注的缓冲液/载体中调配载体。缓冲液/载体应包含防止rAAV粘附到输液管道上但不干扰rAAV体内结合活性的组分。
在本文所描述的方法的某些实施例中,向受试者肌肉内(IM)施用上文所描述的药物组合物。在其它实施例中,药物组合物是通过静脉内(IV)施用的。在其它实施例中,药物组合物是通过脑室内(ICV)注射施用的。在其它实施例中,药物组合物是通过小脑延髓池内(ICM)注射施用的。在其它实施例中,药物组合物是通过脑实质内注射施用的。可以用于本文所描述的方法的其它施用形式包含但不限于直接递送到期望器官(例如眼睛),包含视网膜下或玻璃体内递送、口服、吸入、鼻内、气管内、静脉内、肌肉内、皮下、皮内和其它亲本施用途径。如果期望,可以组合施用途径。
如本文所使用的,术语“鞘内递送”或“鞘内施用”是指通过注射到椎管中,更具体地注射到蛛网膜下腔中使得其到达脑脊液(CSF)的施用途径。鞘内递送可以包含腰椎穿刺、心室内(包含脑室内(ICV))、枕骨下/脑池内和/或C1-2穿刺。例如,可以通过腰椎穿刺引入材料以在整个蛛网膜下腔扩散。在另一个实例中,可以向小脑延髓池中注射。
如本文所使用的,术语“脑池内递送”或“脑池内施用”是指直接进入到小脑延髓池(cisterna magna cerebellomedularis)的脑脊液中,更具体地是通过枕骨下穿刺或通过直接注射到小脑延髓池(cisterna magna)中或通过永久定位的管的施用途径。
组合物可以以约0.1μL到约10mL的体积递送,包含所述范围内的所有数字,这取决于待治疗区域的大小、所使用的病毒滴度、施用途径以及所述方法的期望效果。在一个实施例中,体积为约50μL。在另一个实施例中,体积为约70μL。在另一个实施例中,体积为约100μL。在另一个实施例中,体积为约125μL。在另一个实施例中,体积为约150μL。在另一个实施例中,体积为约175μL。在又另一个实施例中,体积为约200μL。在另一个实施例中,体积为约250μL。在另一个实施例中,体积为约300μL。在另一个实施例中,体积为约450μL。在另一个实施例中,体积为约500μL。在另一个实施例中,体积为约600μL。在另一个实施例中,体积为约750μL。在另一个实施例中,体积为约850μL。在另一个实施例中,体积为约1000μL。在另一个实施例中,体积为约1.5mL。在另一个实施例中,体积为约2mL。在另一个实施例中,体积为约2.5mL。在另一个实施例中,体积为约3mL。在另一个实施例中,体积为约3.5mL。在另一个实施例中,体积为约4mL。在另一个实施例中,体积为约5mL。在另一个实施例中,体积为约5.5mL。在另一个实施例中,体积为约6mL。在另一个实施例中,体积为约6.5mL。在另一个实施例中,体积为约7mL。在另一个实施例中,体积为约8mL。在另一个实施例中,体积为约8.5mL。在另一个实施例中,体积为约9mL。在另一个实施例中,体积为约9.5mL。在另一个实施例中,体积为约10mL。
携带在调控序列控制下编码期望的转基因的核酸序列的重组腺相关病毒的有效浓度期望地在约107与1014个载体基因组/毫升(vg/mL)(也称为基因组拷贝/毫升(GC/mL))范围内。在一个实施例中,rAAV载体基因组通过实时PCR测量。在另一个实施例中,rAAV载体基因组通过数字PCR测量。参见Lock等人,通过液滴数字PCR绝对测定单链和自互补腺相关病毒载体基因组滴度(Absolute determination of single-stranded and self-complementary adeno-associated viral vector genome titers by droplet digitalPCR),《人类基因疗法方法》.2014年4月;25(2):115-25.doi:10.1089/hgtb.2013.131.电子版2014年2月14日,所述文献通过引用并入本文。在另一实施例中,测量rAAV感染单位,如S.K.McLaughlin等人,1988《病毒学杂志》,62:1963中所描述的,所述文献通过引用并入本文。
优选地,浓度为约1.5×109vg/mL至约1.5×1013vg/mL,并且更优选为约1.5×109vg/mL至约1.5×1011vg/mL。在一个实施例中,有效浓度为约1.4×108vg/mL。在一个实施例中,有效浓度为约3.5×1010vg/mL。在另一个实施例中,有效浓度为约5.6×1011vg/mL。在另一个实施例中,有效浓度为约5.3×1012vg/mL。在又另一个实施例中,有效浓度为约1.5×1012vg/mL。在另一个实施例中,有效浓度为约1.5×1013vg/mL。本文所述的所有范围均包括端点。
在一个实施例中,剂量为约1.5×109vg/kg体重至约1.5×1013vg/kg,并且更优选为约1.5×109vg/kg至约1.5×1011vg/kg。在一个实施例中,剂量为约1.4×108vg/kg。在一个实施例中,剂量为约3.5×1010vg/kg。在另一个实施例中,剂量为约5.6×1011vg/kg。在另一个实施例中,剂量为约5.3×1012vg/kg。在又另一个实施例中,剂量为约1.5×1012vg/kg。在另一个实施例中,剂量为约1.5×1013vg/kg。在另一个实施例中,剂量为约3.0×1013vg/kg。在另一个实施例中,剂量为约1.0×1014vg/kg。本文所述的所有范围均包括端点。
在一个实施例中,有效剂量(递送的总基因组拷贝数)为约107至1013个载体基因组。在一个实施例中,总剂量为约108个基因组拷贝。在一个实施例中,总剂量为约109个基因组拷贝。在一个实施例中,总剂量为约1010个基因组拷贝。在一个实施例中,总剂量为约1011个基因组拷贝。在一个实施例中,总剂量为约1012个基因组拷贝。在一个实施例中,总剂量为约1013个基因组拷贝。在一个实施例中,总剂量为约1014个基因组拷贝。在一个实施例中,总剂量为约1015个基因组拷贝。
需要利用最低有效病毒浓度以便降低不合需要的影响(例如毒性)的风险。在这些范围内的其它剂量和施用体积可以由主治医师考虑正在治疗的受试者(优选地人类)的身体状态、所述受试者的年龄、特定病症以及所述病症(如果是进行性的)的发展程度来选择。例如,静脉内递送可能需要大约1.5X 1013vg/kg的剂量。
D.方法
另一方面,提供了一种转导靶细胞或组织的方法。在一个实施例中,所述方法包含施用具有如本文所描述的AAVrh91衣壳的rAAV。如下文实例所示,发明人已经表明,称为AAVrh91的AAV有效地转导心脏(平滑肌)、CNS细胞和骨骼(横纹)肌。如本文所描述的,具有AAVrh91衣壳的载体能够转导多种细胞和组织类型,并且表现出依赖于施用途径的独特嗜性。在某些实施例中,所述方法包含全身施用AAVrh91载体。在某些实施例中,AAVrh91载体通过适合靶向特定细胞或组织类型的施用途径递送。例如,在鞘内施用后,AAVrh91载体在如肺和胰腺等组织中的转基因表达水平高于AAV6.2。同样,在鞘内施用后观察到AAVrh91相对于AAV6.2在肌肉组织中的表达增强。
在某些实施例中,本文提供了转导CNS细胞(例如,神经元、内皮细胞、神经胶质细胞和室管膜细胞中的一种或多种)的方法,所述方法包括施用具有AAVrh91衣壳的rAAV。在一个实施例中,采用静脉内施用。在另一个实施例中,采用ICV施用。在又另一个实施例中,采用ICM施用。在某些实施例中,本文提供了一种将转基因递送到CNS细胞的方法,所述CNS细胞包含但不限于脊髓、海马体、运动皮质、小脑和运动神经元中的任何一种。所述方法包含使细胞与具有AAVrh91衣壳的rAAV接触,其中所述rAAV包括转基因。另一方面,提供了具有AAVrh91衣壳的rAAV将转基因递送到CNS的用途。在某些实施例中,提供了具有AAVrh91衣壳的rAAV将转基因递送到室管膜细胞或脉络丛的用途。在某些实施例中,室管膜细胞和/或脉络丛的转导导致CNS中的转基因分泌水平的提高。
在某些实施例中,AAVrh91将转基因以比用具有AAV1或AAV6.2衣壳的载体观察到的水平更高的水平递送到CNS细胞。在某些实施例中,在室管膜细胞、神经元和/或星形胶质细胞中的一种或多种中观察到更高的转导水平。在某些实施例中,提供了具有AAVrh91衣壳的rAAV将转基因递送到脑实质的用途。本文提供了AAVrh91载体以比使用AAV9载体实现的转导水平更高的水平靶向如星形胶质细胞等脑细胞的用途。在某些实施例中,在包含额叶和颞叶皮质的脑的尾切片中实现了更高的转导水平。在某些实施例中,例如相对于AAV9,AAVrh91载体在皮质、海马体和/或纹状体中实现更高的神经元转导水平。
如本文所讨论的,包括本文所描述的AAV衣壳的载体能够以高水平转导心脏组织。本文提供了将转基因递送到心脏细胞的方法。所述方法包含使心脏细胞与具有AAVrh91衣壳的rAAV接触,其中所述rAAV包括转基因。另一方面,提供了具有AAVrh91衣壳的rAAV将转基因递送到心脏的用途。在某些实施例中,将转基因递送到心脏细胞的方法包括全身递送(例如,IV施用)具有AAVrh91衣壳的rAVV。
在某些实施例中,本文提供了转导骨骼肌的方法,所述方法包括施用具有AAVrh91衣壳的rAAV。与AAV9相比,AAVrh91具有类似(如果没有增加)的骨骼肌转导。在某些实施例中,所述方法包括将AAVrh91衣壳递送到骨骼(横纹)肌。在某些实施例中,提供了将转基因递送到骨骼肌的方法。所述方法包含使骨骼肌与具有AAVrh91衣壳的rAAV接触,其中所述rAAV包括转基因。在某些实施例中,递送转基因骨骼肌的方法包括全身递送(例如,IV施用)具有AAVrh91衣壳的rAAV。
在某些实施例中,AAVrh91载体被描述为用于减少受试者肝脏中脱靶表达的转导。因此,为了避免潜在的肝脏毒性或降低与AAV靶向肝组织相关的肝脏毒性,使用了AAVrh91。在某些实施例中,在全身注射,特别是静脉内施用后观察到肝脏毒性降低。在某些实施例中,毒性的降低是相对于递送具有另一个衣壳的载体,如具有AAV9衣壳的载体。
单基因组扩增
AAV基因组传统上使用基于PCR的方法与全哺乳动物基因组DNA分离:引物用于检测在大部分不同VP1(衣壳)基因两侧的保守区。然后将PCR产物克隆到质粒主链中并且使用桑格方法对单独的克隆进行测序。传统的基于PCR和分子克隆的病毒分离方法对于恢复新的AAV基因组有效,但所恢复的基因组可能受PCR介导的重组和聚合酶错误的影响。此外,与先前使用的桑格技术相比,当前可用的下一代测序技术允许以空前未有的准确度对病毒基因组测序。本文提供一种从病毒群体内准确分离单个AAV基因组的新型、更高通量、基于PCR和下一代测序的方法。此方法,AAV-单基因组扩增(AAV-SGA)可用于提高对哺乳动物宿主体内的AAV多样性的了解。此外,它允许鉴别适用作基因疗法的载体的新型衣壳。
AAV-SGA已经过验证和优化,以有效地从包含基因组群体的样品中恢复单个AAV序列。此技术先前已用于从人类和非人类灵长类动物宿主内分离单个HIV和HCV基因组。对通过衣壳检测PCR筛选出AAV阳性的基因组DNA样品进行终点稀释。根据泊松分布(置信度为80%),PCR扩增产生小于30%阳性反应的稀释度含有单个可扩增AAV基因组。此程序允许病毒基因组的PCR扩增,降低由聚合酶的模板转换引起的PCR介导的重组的机率。AAV-SGAPCR扩增子使用Illumina MiSeq平台使用2×150或2×250双端测序进行测序。此方法允许对全长AAV VP1序列进行准确的从头组装,而无需担心来自包含具有高度同源性区域的多个病毒的单个样品的测序读段的收敛。
AAV-SGA技术已成功从恒河猴组织中分离出多种新型AAV衣壳序列。已经从单个样品中鉴定出来自不同AAV进化枝的多种病毒;这表明宿主组织中可以存在AAV的群体。例如,从单个肝组织样品中分离出与进化枝D、E和外围“边缘”病毒具有序列相似性的衣壳。
先前尚未描述过SGA在AAV发现中的应用。所述方法解决了可能导致无效AAV基因组序列的模板转换和聚合酶错误问题。此外,当从与单个分离株相同的宿主样品中重复回收相同的序列时,分离出的基因组的质量是不言而喻的。
提供以下实例以说明本发明的各种实施例。实例并不打算以任何方式限制本发明。
E.实例
实例1:材料和方法
AAV序列的检测和分离
非人灵长类组织来源
来自宾夕法尼亚大学群落的恒河猴是人工饲养的,并且源自中国或印度。
新型AAV分离
提取基因组DNA(QIAmp DNA迷你试剂盒,凯杰公司(QIAGEN))并且通过使用PCR策略从NHP肝脏组织样本中扩增3.1-kb全长Cap片段来分析AAV DNA的存在。使用AAV Rep基因保守区内的5'引物(AV1NS,5'-GCTGCGTCAACTGGACCAATGAGAAC-3')(SEQ ID NO:9)与位于AAV Cap基因下游保守区的3'引物(AV2CAS,5'-CGCAGAGACCAAAGTTCAACTGAAACGA-3')(SEQID NO:10)来扩增全长AAV Cap扩增子。Q5高保真热启动DNA聚合酶(新英格兰生物实验室(New England Biolabs))用于使用以下循环条件扩增AAV DNA:98℃持续30秒;98℃持续10秒,59℃持续10s,72℃持续93秒,50个循环;以及72℃延伸持续120秒。
对PCR反应呈阳性的模板基因组DNA样品进行AAV-单基因组扩增(AAV-SGA)。在96孔板中对基因组DNA进行终点稀释,使得使用上述相同引物的96次PCR反应中的少于29次产生扩增产物。根据泊松分布,在不超过30%的孔中产生PCR产物的DNA稀释液在超过80%的时间内每个阳性PCR含有一个可扩增的AAV DNA模板。使用Illumina MiSeq 2×150或2×250配对末端测序平台对来自阳性PCR反应的AAV DNA扩增子进行测序,并使用SPAdes组装程序(cab.spbu.ru/software/spades)从头组装所得读段。使用NCBI BLASTn(blast.ncbi.nlm.nih.gov)和载体NTI AlignX软件(赛默飞世尔科技公司)进行序列分析。
AAV产生和滴度测定
用于体外分析的AAV载体是通过三重转染方法在HEK293细胞中产生的。使用先前所描述的1细胞堆栈规模HEK293三重转染方法的改编方案,以6孔板规模产生载体。基于减少的培养区域进行了以下修改:1)使用的质粒比例为2:1:0.1(辅助质粒:反式质粒:顺式质粒,按质量计);并且2)在采集时,除冷冻/解冻外没有进行其它处理(Lock,M.等人,《人基因疗法(Human gene therapy)》,2010.21:第1259-71页)。载体与CB7.ffluciferase.rBG转基因一起包装。收集细胞裂解物,并且使用针对转基因盒中编码的兔β-珠蛋白聚腺苷酸化信号的引物和探针,通过TaqMan qPCR扩增(加利福尼亚州福斯特城的应用生物系统公司(Applied Biosystems,Foster City,CA))滴定DNA酶I和蛋白酶K抗性载体基因组。
体外转导测定
三重转染和载体裂解物采集后,用新鲜的完全培养基连续稀释1×1010GC/mL的每个载体,然后用于转导在一天前分别以1×105个细胞/孔或1.5×106个细胞/孔接种的Huh7或HEK293细胞。在D-萤光素处理(威斯康星州麦迪逊市的普洛麦格公司)后用发光计(佛蒙特州威努斯基的伯腾公司(Biotek,Winooski,VT))检测萤光素酶活性。
啮齿类动物中新型AAV衣壳的体内表征
动物
所有动物方案均经宾夕法尼亚大学的机构动物护理和使用委员会(theInstitutional Animal Care and Use Committee of the University ofPennsylvania)批准。从杰克逊实验室(Jackson Laboratory)购买C56BL/6J小鼠。对于GFP报告基因实验,对成年(6-8周大)雄性进行注射。动物被圈养在每笼二到五只动物的标准笼中。笼子、水瓶和垫料基材在屏障设施中进行高压灭菌,且每周更换一次笼子。保持自动控制的12小时光暗循环。每个黑暗期从晚上7:00(±30分钟)开始。随意提供辐射的实验室啮齿动物食物。
测试品和研究设计
小鼠通过侧尾静脉以静脉内(IV)0.1mL接受每只小鼠1×1012Gc的每种载体,或以每只小鼠含1×1011GC的5uL剂量脑室内(ICV)注射到脑的侧脑室。每组向三或五只小鼠给药。
注射后14天通过吸入CO2对小鼠实施安乐死。收集组织,在干冰上快速冷冻以进行生物分布分析,或在10%中性福尔马林中浸泡固定,在蔗糖中冷冻保存,在OCT中冷冻,并用低温恒温器切片用于GFP直接观察。用于内皮细胞转导分析的组织在尸体剖检后进行石蜡包埋。
报告基因可视化
为了观察直接GFP荧光,将组织样品在福尔马林中固定约24小时,在PBS中短暂洗涤,在含15%和30%蔗糖的PBS中依次平衡直至达到最大密度,且接着在OCT包埋培养基中冷冻以制备冷冻切片。切片安装在含有DAPI(宾夕法尼亚州哈特菲尔德市的电子显微镜科学公司(Electron Microscopy Sciences,Hatfield,PA))作为核复染剂的Fluoromount G中。
对石蜡包埋的组织样品进行GFP免疫组织化学。切片用乙醇和二甲苯脱蜡,在10mM柠檬酸盐缓冲液(pH 6.0)中煮沸6分钟以进行抗原修复,依次用2%H2O2处理15分钟,用抗生物素蛋白/生物素封闭试剂各处理15分钟(载体实验室(Vector Laboratories)),以及用封闭缓冲液(含1%驴血清的PBS+0.2%Triton)处理10分钟。随后将其与一级抗体一起温育1小时,并且在封闭缓冲液中与生物素标记的二级抗体一起温育45分钟(杰克逊免疫研究公司(Jackson Immunoresearch))。使用一级抗体鸡抗GFP(Abcam ab13970)和兔抗CD31(Abcam ab28364)内皮细胞标记。按照制造商说明书使用Vectastain Elite ABC试剂盒(载体实验室),以DAB作为底物,将结合的抗体可视化为棕色沉淀物。
对于免疫荧光,在用含1%驴血清的PBS+0.2%Triton进行抗原修复后,使石蜡切片脱蜡并封闭15分钟,随后与在封闭缓冲液中稀释的一级(1小时)和荧光标记的二级抗体(45分钟,杰克逊免疫研究公司)连续温育。使用的抗体是鸡抗GFP(Abcam ab13970)、兔抗CD31(Abcam ab28364)和小鼠抗NF-200(克隆RT97,Millipore CBL212)。将一级抗体混合在一起,且分别通过FITC和TRITC标记的二抗检测GFP和NF-200抗体。根据制造商的方案(载体实验室),使用VectaFluorTMExcel Amplified
Figure BDA0004175913010000531
488抗兔IgG试剂盒增强了针对CD31的兔抗体的信号。使用先前演示的方案对骨骼肌组织切片进行基于X-gal染色的LacZ基因表达检测(Bell,P.等人,《组织化学和细胞生物学(Histochemistry and Cell Biology)》,2005.124:第77-85页)。荧光和明场显微镜图像是用Nikon Eclipse TiE显微镜拍摄的。
带条形码的载体转基因的非人灵长类动物转导评估
测试品和研究设计
五种新型衣壳和五种对照衣壳(AAVrh.90、AAVrh91、AAVrh.92、AAVrh.93、AAVrh91.93、AAV8、AAV6.2、AAVrh32.33、AAV7和AAV9)用于包装经修饰的ATG耗尽身互补的eGFP(dGFP)转基因。每个独特的衣壳制剂都含有dGFP转基因,在载体基因组的多聚腺苷酸化序列之前具有相应的独特6bp条形码。转基因含有CB8启动子和SV40聚腺苷酸化序列(AAVsc.CB8.dGFP.barcode.SV40)。如先前所描述的,AAV载体由宾夕法尼亚大学载体核心公司(Penn Vector Core)生产和滴定(参见例如Lock,M.等人(2010)《人类基因疗法(Hum.Gene Ther.)》21:1259-71)。HEK293细胞进行三次转染,然后收集细胞培养上清液,浓缩,并用碘克沙醇梯度纯化。如先前所描述的,使用靶向SV40 polyA序列的引物,通过液滴数字PCR滴定纯化的载体(参见例如Lock,M.等人(2014)《人类基因疗法方法》25:115-25)。
将十个纯化的载体以相等的基因组拷贝量汇集,用于注射到两只不同的动物中:通过IV递送递送的总剂量为2×1013GC/kg,并且通过小脑延髓池内(ICM)递送递送到鞘内空间的总剂量为3×1013GC/动物。在注射后30天处死动物,并在RNAlater(凯杰公司)中收集所有组织用于下游转基因RNA表达分析。
动物
所有动物手术均经宾夕法尼亚大学的机构动物护理和使用委员会批准。猕猴(食蟹猴)由Bristol Meyers Squibb(USA)捐赠。动物被安置在宾夕法尼亚州费城市的费城儿童医院的实验室动物护理评估和认证协会认可的非人类灵长类动物研究计划设施的不锈钢挤压式后笼中。动物接受了各种富集,如食物款待、视觉和听觉刺激、操纵和社会互动。
一只10岁的雄性8kg动物被用于ICM研究。一只6岁的雄性6.98kg动物被用于IV研究。对此动物进行了AAV中和抗体的存在的筛选,且基线时AAV6、AAV8和AAVrh32.33呈血清阴性。在基线时,此动物针对AAV7和AAV9的中和抗体滴度分别为1:5和1:10。
ICM注射程序
将麻醉的猕猴以侧卧位放置在X射线台上,头部向前弯曲。使用无菌技术将21G-27G、1至1.5英寸Quincke脊髓针(Becton Dickinson,Franklin Lakes,NJ,USA)推进至枕下空间,直至观察到CSF流动。收集1mL CSF用于基线分析。针的正确放置通过荧光透视法(OEC9800C形臂;GE Healthcare,Little Chalfont,UK)进行验证,以避免潜在的脑干损伤。CSF收集后,将Luer通路延长装置或小口径T端口延长装置导管连接到脊髓针上,以促进180mg/mL碘海醇造影剂(GE Healthcare,Little Chalfont,UK)的给药。在验证针头位置后,将装有测试品的注射器(体积等于1mL加上注射器体积和接头死区)连接到柔性接头并注射30±5秒。将针移除并且直接对穿刺部位施加压力。
IV注射程序
通过输液泵(Harvard Apparatus,Holliston,MA)以1mL/min的速率将10mL载体测试品施用至猕猴的外周静脉。
转基因表达分析
根据制造商说明书(生命技术公司(Life Technologies)),使用TRIzol从所有RNALater处理的组织中提取全组织RNA。根据制造商的方案(瑞士巴塞尔的罗氏公司(Roche,Basel,Switzerland))用DNA酶I处理提取的RNA。使用RNeasy迷你试剂盒(凯杰公司)纯化RNA。使用应用生物系统公司高容量cDNA逆转录酶试剂盒(生命技术公司)进行cDNA的逆转录合成。靶向侧接6bp独特条形码的区域的引物用于PCR扩增117bp扩增子((正向引物:GGCGAACAGCGGACACCGATATGAA(SEQ ID NO:11),反向引物:GGCTCTCGTCGCGTGAGAATGAGAA(SEQ ID NO:12))并且Q5高保真热启动DNA聚合酶(新英格兰生物实验室)用于使用以下循环条件进行反应:98℃持续30秒;98℃持续10秒,72℃持续17秒,25个循环;以及72℃延伸持续120秒。使用MiSeq Standard 2×150bp测序平台(因美纳公司(Illumina))对扩增子进行测序。
使用来自表达分析包(github.com/ExpressionAnalysis/ea-utils)、cutadapt(cutadapt.readthedocs.io/en/stable/)、fastx工具包(hannonlab.cshl.edu/fastx_toolkit/)和R版本3.3.1.(cran.r-project.org/bin/windows/base/old/3.3.1/)的fastq-join程序分析条形码读段。来自组织样品的条形码表达计数数据被标准化为来自每个动物的测序注射载体材料的条形码计数,并且来自每个组织样品的条形码比例使用GraphPad Prism版本7.04绘制。
NHP中的ICM AAVrh91转导表征研究
动物和研究设计
所有动物手术均经宾夕法尼亚大学的机构动物护理和使用委员会批准。动物被安置在宾夕法尼亚州费城市的费城儿童医院的实验室动物护理评估和认证协会认可的非人类灵长类动物研究计划设施的不锈钢挤压式后笼中。动物接受了各种富集,如食物款待、视觉和听觉刺激、操纵和社会互动。
AAVrh91、AAV1、AAV8和AAV9衣壳与表达来自鸡β肌动蛋白(CB7)启动子(AAV.CB7.CI.eGFP.WPRE.rBG)的增强型绿色荧光蛋白(eGFP)的质粒一起使用先前描述的方法进行包装(参见例如Lock,M.等人(2010)《人类基因疗法》21:1259-71以及Lock,M.等人(2014)《人类基因疗法方法》25:115-25)。将1.557×1013GC剂量ICM注射到每只动物中。ICM注射方法描述于上文。注射后28-31天处死动物,并且在干冰上采集组织用于DNA载体生物分布研究。在非临床一般毒性研究期间,根据神经系统(脑、脊髓、神经和眼睛)采样和处理的推荐实践,使用脑模具收集整个脑、修剪并切片。Pardo等人(2012).STP立场文件。还收集组织,用福尔马林固定,并用石蜡包埋以用于组织病理学分析。
载体转导的组织学分析
对于GFP免疫组织化学(IHC),切片用乙醇和二甲苯脱蜡,在10mM柠檬酸盐缓冲液(pH 6.0)中煮沸,持续6分钟以进行抗原修复,依次用2%H2O2处理15分钟,用抗生物素蛋白/生物素封闭试剂各处理15分钟(载体实验室),以及用封闭缓冲液(含1%驴血清的PBS+0.2%Triton)处理10分钟。随后将其与抗GFP的山羊抗体(诺伟思生物制品公司(NovusBiologicals),NB100-1770,1:500)一起在4℃下在封闭缓冲液中温育过夜,并在PBS中洗涤后,与生物素标记的二级抗山羊抗体一起在封闭缓冲液中温育45分钟(杰克逊免疫研究公司,1:500)。在PBS中洗涤后,按照制造商说明书应用Vectastain Elite ABC试剂盒(载体实验室),以DAB作为底物,将结合的抗体可视化为棕色沉淀物。
对于免疫荧光(IF),将石蜡切片类似地预处理,但没有H2O2和抗生物素蛋白/生物素封闭。组合以下一级抗体,并且将切片在37℃下温育1小时:山羊抗GFP(诺伟思生物制品公司,NB100-1770;1:300-500)、豚鼠抗NeuN(密理博公司,ABN90;1:500)、鸡抗GFAP(艾博抗公司,ab4674;1:1000)。这在PBS中洗涤后,与荧光染料标记的二级抗体(FITC抗山羊、Cy5抗豚鼠、TRITC抗GFAP;杰克逊免疫研究公司,室温下1小时,1:200)一起温育。在PBS中洗涤后,将切片固定在含有DAPI的Fluoromount G(电子显微镜科学公司)中以对细胞核进行复染。
载体生物分布
使用QIAamp DNA迷你试剂盒(凯杰公司)提取组织基因组DNA,并使用Taqman试剂(应用生物系统公司,生命科技公司)与靶向载体的EGFP序列的引物/探针通过实时PCR对AAV载体基因组进行定量。
中枢神经系统组织(CNS)中的细胞转导定量分析
IF载玻片如上文所描述的制备并且使用Aperio VERSA扫描系统进行扫描。首先以低倍率(1.25倍)扫描整个载波片以限定所关注的区域。在最初的1.25倍扫描后,使用四个不同的通道DAPI、FITC、TRITC和Cy5以20倍放大倍率扫描载玻片。使用通过Visiopharm图像分析软件v.2019.07开发的共染色检测算法,从最终的20倍扫描中对转导的神经元和星形胶质细胞进行定量。
用于AAVrh91的冷冻电子显微镜(cryoEM)
AAVrh91上的CryoEM在马萨诸塞大学医学院Cryo-EM核心设施处进行。将3μl载体在未经稀释(3.37×1013GC/ml)的情况下添加到具有2nm厚连续碳膜的发光R2/1铜网格(Quantifoil公司(Quantifoil))中。在22℃和95%相对湿度下用滤纸印迹7-8秒后,使用Vitrobot Mark IV(赛默飞世尔科技公司)在液体乙烷浆液中冷冻网格。获得了冰厚度略有不同的两个网格。使用在200kV下操作的Talos Arctica电子显微镜(赛默飞世尔科技公司)通过加坦K3直接检测器(美国普莱森顿的加坦公司(Gatan,Pleasanton,USA))在网格1上收集1584个影片,并且在网格2上收集3675个影片。使用SerialEM软件获取数据。像素大小为
Figure BDA0004175913010000561
(箱=0.5),并且总剂量为
Figure BDA0004175913010000564
其中每个影片有26帧。图像是在-0.5至-1.5μm的范围内散焦收集的。
AAVrh91结构确定、模型构建和改进
对于网格1和网格2,使用MotionCor2的Relion 3.0实施方案对影片进行运动校正,并且将最终像素大小合并为
Figure BDA0004175913010000563
运动校正后,使用ctffind4估计显微照片的散焦,并且使用Relion 3.0对其进行处理。然后将网格1的所有经处理图像和来自网格2的3664个经处理图像组合成总共5248个图像的单个数据集。从此集合中挑选并且分选了大约1,000个颗粒以进行二维(2D)分类。最好的类别被用作用于自动挑选的模板。通过一轮2D分类对来自自动挑选的总共283,818个颗粒进行分选,以去除假阳性和次优颗粒,从而产生254,442个颗粒。初始模型是通过使用瑞莱昂公司(Relion)的从头模型生成以C1对称性产生的。通过具有C1对称性和角度采样的三维(3D)分类将颗粒进一步分类为五类。针对总共173,558个颗粒选择三个最佳类别。使用这些颗粒,以C1对称性执行3D自动细化,应用二十面体对称性,并且执行另一轮应用二十面体对称性的3D自动细化。然后对细后的颗粒进行CTF细化和颗粒抛光。基于0.143的傅里叶壳相关性金标准截止值,最终3D自动细化和后处理将AAVrh91的结构生成为
Figure BDA0004175913010000571
初始模型是根据先前发布的AAV1(6JCR)结构生成的。这些模型适合电子密度并且进行修改以反映COOT中的AAVrh91序列。在初始构建步骤之后,使用PHENIX软件包中包含的phenix.real_space_refinement程序根据电子密度图改进了模型。生成了具有二十面体非晶体对称性的完整模型。使用刚体拟合、全局最小化、局部网格搜索和各向异性位移参数(ADP)细化在二级结构和非晶体对称性(NCS)约束下进行了细化。
AAV衣壳上氨基酸修饰的质谱法(MS)分析
试剂
碳酸氢铵、二硫苏糖醇(DTT)、碘乙酰胺(IAM)购自西格玛公司(Sigma)(密苏里州圣路易斯(St.Louis,MO))。乙腈、甲酸和三氟乙酸(TFA)、8M盐酸胍(GndHCl)和胰蛋白酶购自赛默飞世尔科技公司(伊利诺伊州罗克福德(Rockford,IL))。
胰蛋白酶消化
制备1M DTT和1.0M碘乙酰胺的储备溶液。使衣壳蛋白变性,并在存在10mM DTT和2M GndHCl的情况下在90℃下还原10分钟。允许样品冷却至室温,接着在黑暗中在室温下用30mM IAM使其烷基化30分钟。通过添加1mL DTT淬灭烷基化反应。以将最终GndHCl浓度稀释至200mM的体积向变性的蛋白质溶液中添加20mM碳酸氢铵,pH 7.5-8。添加胰蛋白酶溶液,使胰蛋白酶与蛋白质的比率达到1:20,并在37℃下温育4小时。在消化之后,将TFA添加到最终0.5%,以淬灭消化反应。
LC–MS/MS
使用Acclaim PepMap柱(长15cm,内径300-μm)和与具有NanoFlex源的Q ExactiveHF(赛默飞世尔科技公司)耦合的Thermo UltiMate 3000RSLC系统(赛默飞世尔科技公司)进行在线色谱。在在线分析期间,将柱温调节至35℃。使用流动相A(含0.1%甲酸的MilliQ水)和流动相B(含0.1%甲酸的乙腈)的梯度分离肽。梯度在15分钟内从4%B运行到6%B,接着在25分钟内运行到10%B(共40分钟),接着在46分钟内运行到30%B(共86分钟)。将样品直接装载到柱。柱尺寸为75cm×15um I.D.,并装有2微米的C18培养基(Acclaim PepMap)。由于装载、导入和洗涤步骤,LC-MS/MS运行的总时间约为2小时。
MS数据是使用用于Q Exactive HF的数据依赖性前20种方法获取的,所述方法从调查扫描(200-2000m/z)中动态选择最丰富的尚未测序的前体离子。测序通过高能碰撞解离片段化进行,其中通过预测性自动增益控制确定的目标值为1e5离子,并且以4m/z的窗口进行前体分离。在m/z 200下以120,000的分辨率获取调查扫描。HCD光谱的分辨率在m/z200下设置为30,000,其中最大离子注入时间为50毫秒,并且归一化碰撞能量为30。S-透镜RF水平设置为50,以使来自消化的肽所占据的m/z区达到最佳传输。从片段化选择中排除具有单个、未分配或六个和更高电荷状态的前体离子。
数据处理
BioPharma Finder 1.0软件(赛默飞世尔科技公司)用于分析所有获得的数据。对于肽作图,使用单进入蛋白FASTA数据库进行搜索,其中脲基甲基化设置为固定的修饰;并将氧化、脱酰胺化和磷酸化设置为可变修饰、10ppm质量准确度、高蛋白酶特异性和置信水平为0.8的MS/MS光谱。通过将修饰肽的质量面积除以修饰肽和天然肽的面积总和来确定肽的修饰百分比。考虑到可能的修饰位点的数量,在不同位点处被修饰的同量异位物质可以在单个峰中共迁移。因此,源自具有多个潜在的修饰位点的肽的片段离子可以用于定位或区分多个修饰位点。在这些情况下,观察到的同位素图案内的相对强度可以用于特异性确定不同的修饰肽异构体的相对丰度。此方法假设所有异构物种的片段化效率是相同的,并且在修饰位点上是独立的。这种方法允许定义特定的修饰站点以及所涉及的潜在组合。
统计分析
所有统计分析均使用Prism(美国加利福尼亚州圣地亚哥的GraphPad软件公司(GraphPad Software,San Diego,CA,USA))7.04版完成。两组之间的比较使用未配对的斯图登氏t测试(Student's t-test)进行,并且多组之间的比较使用单向方差分析(ANOVA、克鲁斯卡尔-沃利斯测试(Kruskal-Wallis test)和邓恩多重比较测试(Dunn's multiplecomparison's test))进行。
组织病理学
对测试制品不知情的经委员会认证的兽医病理学家确定了病理严重程度评分,定义为0为无病变,1为轻微(<10%),2为轻度(10%至25%),3为中度(25%至50%),4为显著(50%至95%),并且5为重度(>95%)。评分基于苏木精和伊红(H&E)染色组织的显微评估,并且表示平均高倍显微镜场中受病变影响的组织比例。
载体基因组拷贝和转基因RNA分析
将组织样品在尸检时快速冷冻,并且使用QIAamp DNA迷你试剂盒(加利福尼亚州瓦伦西亚的凯杰公司)提取DNA。从100mg组织中分离出DNA酶处理的总RNA。通过分光光度法对RNA进行定量,并且使用随机引物将等分试样逆转录成cDNA。通过实时PCR对提取的DNA中的载体GC和提取的RNA中的相关核酸酶HAO1转录物表达进行检测和定量。简而言之,使用分别针对载体的polyA序列和转基因特异性序列设计的引物/探针对载体GC和RNA水平进行定量。
GFP蛋白表达的定量
将膈膜、心脏、肾脏、肝脏、肺、骨骼肌(包含肱二头肌、股二头肌、三角肌、桡侧腕伸肌、腓肠肌、臀大肌、肋间肌、胸大肌、腹直肌、比目鱼肌、胫骨前肌、斜方肌、股外肌)和脾脏的样品均质化,并且根据制造商的说明,通过酶联免疫吸附测定(ELISA;abcam ab171581)测定GFP蛋白水平。简而言之,将组织样品在500μl 1X细胞提取缓冲液中均质化,离心,并且提取上清液。将每个样品的稀释上清液一式两份添加到ELISA板中,并且根据制造商的说明进行测定。上清液的蛋白质浓度也通过二喹啉甲酸(BCA)测定(PierceTMBCA蛋白质测定试剂盒,赛默飞世尔)测定。GFP蛋白水平归一化为每个样品的总蛋白质水平(每pg蛋白质的μgGFP表达)。
免疫组织化学
将组织样品固定在10%中性缓冲福尔马林中,按照标准方案进行石蜡包埋,并且用于通过免疫组织化学测定eGFP表达。将切片通过乙醇和二甲苯系列脱蜡,在10mM柠檬酸盐缓冲剂(pH 6.0)中煮沸,持续6分钟以进行抗原修复,并且用2%H2O2(15分钟)、亲和素/生物素封闭试剂(各15分钟;载体实验室)和封闭缓冲液(含1%驴血清的PBS+0.2%Triton X-100,持续10分钟)依次封闭,随后将其与抗GFP的一级抗体(山羊抗体NB100-1770,诺伟思生物制品公司,以1:500稀释)一起在4℃下温育过夜。将切片与在封闭缓冲液中稀释的生物素化抗兔二级抗体(以1:500稀释,45分钟;杰克逊免疫研究公司)一起温育。使用3,3'-二氨基联苯胺(DAB)作为底物的Vectastain Elite ABC试剂盒(载体实验室)能够将结合的抗体可视化为棕色沉淀物。
通过IHC图像分析对GFP表达进行定量
从心脏、肝脏和腓肠肌骨骼肌的抗GFP抗体免疫标记切片对GFP表达进行定量。在Aperio AT2扫描仪(徕卡生物系统有限公司(Leica Biosystems))上扫描每只动物至多三个免疫标记切片,并且使用ImageJ软件(版本1.53c)选择五至十个所关注的区域用于GFP信号的定量。GFP信号背景是使用原始对照建立的;对超过背景的GFP信号进行定量,然后将其归一化为切片面积。
AAVrh91在人群体中的血清阳性率
从Lee Biosolutions公司(Lee Biosolutions)(密苏里州马里兰高地)获取100个随机人血清样品。如先前所描述的,测定了针对AAV2、AAV8、AAV9、AAVrh32.33和AAVrh91的NAb滴度(Calcedo等人,2009)。
实例2:AAV-单基因组扩增(AAV-SGA)
腺相关病毒(AAV)是单股DNA细小病毒,无致病性且免疫原性较弱,这使其成为基因疗法的有效候选载体。自从发现第一代AAV(AAV1-6)以来,实验室一直在努力从各种高等灵长类动物物种中分离出大量病毒。此处鉴定的第二代AAV是使用基于批量PCR的技术分离的,所述技术使用针对特异于灵长类动物源性AAV基因组的保守区的引物。使用AAV-SGA探索了AAV在其天然哺乳动物宿主中的遗传变异(图1)。
AAV-SGA是一种强大的技术,可用于从混合群体中高精度分离单个病毒基因组。在本研究中,使用AAV-SGA从恒河猴组织样本中鉴定了新的AAV基因组。新病毒分离株具有遗传多样性,并且可分类成进化枝D、E和边缘进化枝(图2)。
载体产量和体外转导分析
所有新型衣壳序列用于产生基因递送载体。每个衣壳VP1序列被克隆到含有标准AAV2 Rep基因的反式质粒中。此反式质粒与含有载体转基因的各种顺式质粒以及腺病毒辅助质粒组合用于HEK293细胞三重转染载体产生方法。在DNA酶I处理后,通过液滴数字PCR测量纯化的载体滴度,以确定载体衣壳化转基因的数量。
使用在普遍存在的启动子(CB7)控制下含有萤火虫荧光素酶转基因的载体,测试了新型衣壳在两种人细胞类型中的体外转导能力:Huh7,一种肝源性细胞系和HEK293,一种肾源性细胞系。所述载体主要以比HEK293细胞更高的效率转导Huh7细胞。在Huh7细胞中,AAV6.2和AAV7都显示出比它们的新型衣壳对应物显著更高的荧光素酶活性,即转导水平的直接读数(图5A)。所有衣壳在所用剂量下均以类似的低水平转导HEK293细胞(图5B)。
新型衣壳以与其进化枝对照类似的效率包装转基因,AAVrh91除外(图6A)。基于AAVrh91的载体产生的载体产量显著高于基于AAV6的载体。在考虑包装的转基因类型对AAVrh91和AAV1衣壳中载体产生的影响时,观察到与含有相同转基因的AAV1制剂相比,AAVrh91制剂的滴度相同或高一至两倍,但由于重复次数少,无法在所有组中进行统计显著性测试(图6B)。
如先前所描述的,分析了AAVrh91衣壳的脱酰胺化和其它修饰(参见PCT/US19/019804和PCT/US19/2019/019861)。如图7A、图7B和图7C所示,结果表明,AAVrh91具有三个高度脱酰胺化的氨基酸(N57、N383和N512),它们对应于天冬酰胺-甘氨酸对中的天冬酰胺(SEQ ID NO:2的AAVrh91的编号)。在残基N303、N497和N691以及S149的磷酸化中始终观察到较低的脱酰胺化百分比。
啮齿类动物中新型AAV衣壳的体内的转导
接下来,描述了小鼠中的五个新衣壳的组织嗜性。所有衣壳作为基因递送载体产生,其含有普遍存在的启动子CB7或CMV以及增强型绿色荧光蛋白(eGFP)或β-半乳糖苷酶(LacZ)报告转基因,用于在三个小鼠实验中进行测试。
为了测试载体的全身转导能力,通过静脉内(IV)尾静脉施用途径(ROA)给成年C57BL/6小鼠注射。载体含有CB7.eGFP转基因,并且以每只小鼠1012个基因组拷贝(GC)的剂量注射。肝脏、心脏、脑和骨骼肌的免疫荧光显微镜示出AAVrh91和AAV6.2载体的eGFP表达有类似趋势(图14)。
为了绕过BBB并促进CNS组织中的转导,通过ICV ROA将每个CB7.eGFP载体注射到成年C57BL/6小鼠的含CSF的侧脑室中。除进化枝A载体外,所有衣壳以每只小鼠1×1011GC的剂量施用。进化枝A载体以每只小鼠6.9×1010GC的剂量施用。由于AAV6.2的低制造率,无法为此组实现足够的载体浓度。
注射后十四天,测定了载体基因组在肝脏、心脏、骨骼肌以及最重要的脑中的生物分布(图8D)。平均而言,AAV6.2和AAV7的脑GC水平分别高于其新型衣壳对应物AAVrh91、AAVrh93和AAVrh91.93;然而,这些数据在统计上并不显著。还观察到,与对照衣壳AAV6.2相比,在递送后AAVrh91的更多GC逃逸到外围,如可见于肝脏中的更多数量的AAVrh91载体基因组所指示的(图8D)。
通过直接荧光定性分析了ICV注射的脑中的转基因表达,并且观察了新型衣壳与对照之间的可变转导水平。进化枝A载体AAVrh91和AAV6.2示出脉络丛和心室室管膜细胞的显著转导(图15)。
最后,测试了通过肌肉内ROA用于转导骨骼肌细胞的载体递送。对于这项研究,以每只成年C57BL/6小鼠3×109GC的剂量注射了含有CMV.LacZ转基因的载体。β-半乳糖苷酶检测后的组织显微镜检查显示进化枝A载体AAVrh91、AAV1和AAV6的一致强烈的肌细胞转导。相反,在这个剂量下,AAV8表现出肌肉组织的不良转导(图9B)。通过AAVrh91的IM递送也导致血清中高水平的可检测mAb(图10)。图11示出了mAb和LacZ载体的各种制备的产率。对于这两种转基因,与AAV1和AAV6相比,AAVrh91的产率更高。
总体而言,这些研究表明,新型AAVrh91衣壳能够在小鼠体内转导各种细胞和组织类型,并且表现出依赖于ROA的独特嗜性。
实例3:使用带条形码的转基因系统对非人灵长类动物中新型AAV天然分离物的转导评估
AAV载体在临床应用中已被证明是安全且有效的基因转移媒剂,但它们可能会受到预先存在的病毒免疫力的阻碍,并且可能具有受限的组织嗜性。证明了带条形码的转基因方法可有效地同时比较多个AAV血清型对单个动物的各种组织的转导。这种技术减少了使用的动物数量,并防止了与外来转基因相关的免疫应答。因此,在转录物的polyA信号之前,将新型衣壳和其相应原型进化枝成员对照(AAV6.2、AAV7、AAV8、AAVrh32.33和AAV9)制成含有经修饰的eGFP转基因和独特的六碱基对条形码的载体(图12)。通过删除ATG序列基序来修饰转基因,以防止多肽翻译和随后对外来蛋白质的免疫应答。将载体以等量汇集并在食蟹猴体内IV或ICM注射(总剂量:2×1013GC/kg IV和3×1013GC ICM)以评估新型衣壳的全身和中枢神经系统转导模式。所有表达数据都归一化为实际输入比率,以控制汇集比例的这种轻微变化。
使用两种不同的ROA将汇集的载体施用于两只食蟹猴。为了测定新型AAV衣壳的全身转导,向第一只动物静脉内注射了总剂量为2×1013GC/kg的汇集的载体混合物。另外利用鞘内(IT)递送方法通过小脑延髓池内(ICM)注射将3×1013GC的载体剂量递送到第二个NHP的CSF中,以直接靶向CNS组织。递送载体后三十天,通过提取转基因RNA并且随后对与每个样品的每个载体相对于注射材料相对应的条形码频率进行定量,根据每只动物的各种组织分析转基因表达。
有趣的是,在肺和胰腺组织中,AAVrh91的转基因表达水平高于AAV6.2(图13A)。还观察到AAVrh91转导肌肉组织的水平高于AAV6.2,但这不如其在胰腺或肺中的转导增强那么显著。由于此动物在注射时具有低水平的预先存在的针对AAV7和AAV9的中和抗体(滴度分别为1:5和1:10),所有组织中进化枝D和F衣壳的条形码频率极低。平均而言,所有条形码中只有0.3-7%来自AAV7、AAV9、AAVrh93和AAVrh91.93转基因。
在通过ICM ROA施用载体的动物中,进化枝A载体AAVrh91和AAV6.2在CNS组织和外周组织中表现出高的相对转导频率,表明一部分载体在ICM递送后进入全身循环(图13C和图13D)。此动物还具有低水平的预先存在的针对AAV7、AAV8和AAV9的血清中和抗体,滴度分别为1:10、1:5和1:5。
这些研究使能够有效地评估新型AAV衣壳在单个NHP中的相对组织嗜性,并且强调AAVrh91作为全身和CNS靶向基因疗法应用的潜在载体。
实例4:AAVrh91在鞘内递送后表现出强烈的CNS转导特征
使用分子带条形码的转基因方法测定整体AAV载体组织转导是筛选各种器官中相对表达水平的有效方法。然而,评估组织内的细胞嗜性在技术上可能是复杂的,因为可能有许多不同的转导相同细胞的载体。另外,当汇集多个载体时,单个载体的剂量可以降低到亚临床水平,这使得难以评估衣壳在翻译应用中的效用。
为了全面评估AAVrh91载体在CNS内的细胞嗜性,通过三重转染法在HEK293细胞中生成了含有CB7.eGFP转基因的载体,并且通过ICM注射向恒河猴注射1.6×1013GC载体。含有相同转基因的AAV1和AAV9载体也作为对照施用于两个另外的组,因为这两种载体都得到了充分研究;AAV1与AAVrh91属于同一进化枝,并且AAV9是当前的黄金标准CNS嗜性载体。因此,试图比较翻译相关模型生物体中三种衣壳的转导效率。
ICM注射后大约四周,通过GFP免疫组织化学评估了转基因表达。观察到脑额叶、颞叶和枕叶皮质中AAVrh91载体介导的基因表达水平普遍高于AAV9的水平(图16A)。产生CSF的侧脑室室管膜细胞也被两个进化枝A载体AAVrh91和AAV1强烈转导。相反,无法在施用AAV9载体的动物中看到这种细胞类型的显著转导(图16B)。脊髓运动神经元中的GFP表达同样被所有三种载体转导,其中存在于腰段中的GFP染色更强烈(图16C)。有趣的是,在施用AAVrh91和AAV1的动物的肝脏和心脏组织中观察到显著的GFP表达染色,表明一部分载体从CSF进入全身循环。这些外周组织的转导在AAV9动物中较弱(图17)。
接下来,使用免疫荧光细胞定量分析评估了AAVrh91与AAV1和AAV9相比的细胞嗜性。哺乳动物的脑由两种主要细胞类型构成:神经元和胶质细胞。使用胶质纤维酸性蛋白(GFAP)和神经元核蛋白(NeuN)标记物,能够分别对脑组织切片中的星形胶质细胞(主要类型的胶质细胞)和神经元进行染色(图18A和图18B)。对用DAPI核染色剂染色并转导GFP以及GFAP或NeuN的细胞进行定量,以确定存在于脑中的转导星形胶质细胞和神经元的数量。
发现平均而言,在脑的大部分区域中,AAVrh91转导星形胶质细胞的速率比AAV9高大约2-4倍,其中从头部到尾部区域的转导显著增加。在尾切片8B、9和12-1中,AAV1转导星形胶质细胞的水平比AAV9高约2倍,但在主要含有额叶和颞叶皮质的切片2、5和7中,水平与AAV9更类似(图18C)。相反,AAVrh91与AAV9神经元转导之间的差异较小,其中前者的转导水平比后者高1.5-2.5倍(图18D)。当按特定脑区域分层时,观察到总体上类似的趋势,其中皮质、海马体和纹状体中约1%的神经元由AAVrh91转导,并且0.25-0.7%由AAV9转导。有趣的是,与被评估的其余脑区域相比,丘脑具有高得多的这两种载体的转导水平(图18D)。
通过qPCR测定所有组中载体基因组的生物分布。发现AAVrh91在从CNS筛选的大多数组织中具有最高的GC水平。AAV9转导组织在大多数组织中的GC数量减少了大约一个对数,脊髓除外,所述脊髓在所有组中显示出相当的GC存在(图19A-图19C)。当考虑GC在所有筛选的CNS组织中的平均生物分布时,接受AAVrh91和AAV1的动物的转导水平显著高于接受AAV9载体的动物(图20)。
有趣的是,接受进化枝A GFP表达载体的四只动物在尸检时显示了DRG和外周神经病理学,这表明了AAV介导的DRG毒性。发现AAVrh91和AAV1转导水平最高的动物在各种外周神经、DRG、脊髓区域和肝脏中具有总体较高等级的病理学。值得注意的是,一种AAV1给药的NHP,RA3654,在研究第21天表现出轻微的临床发现:后腿和后肢共济失调中有意识的本体感受缺陷。在施用皮质类固醇(泼尼松龙(prednisolone))后,这些临床发现在研究的剩余时间(第22-30天)得到解决。
上文所描述的研究提供了对从天然来源分离并且作为体外和体内基因转移载体进行测试的新型AAV衣壳的综合分析。新型衣壳在表面暴露的HVR以及结构内部的VP1和VP2独特区域中与对照衣壳具有氨基酸序列变异。这种序列的多样性可以允许与宿主细胞受体的差异结合,从而导致不同衣壳之间的组织嗜性发生变化。另外,VP1和VP2独特区域内的序列差异可能导致载体转运的差异,因为这些区域归因于与介导转基因递送到细胞核的各种细胞质组分相互作用。使用衣壳诱变技术的进一步研究可以阐明氨基酸变异对AAV嗜性和转运的影响。
新型衣壳与对照之间的差异也可能导致载体包装的差异。有趣的是,尽管VP1蛋白序列只有1.1%的差异,但发现基于载体产量,AAVrh91载体包装转基因的水平显著高于基于AAV6.2的载体。还发现AAVrh91包装转基因的水平高于AAV1。
AAV9是研究最深入的AAV衣壳之一,因为它可用作CNS嗜性载体,并且被认为是CNS基因疗法的金标准。在小鼠中,它已被证明能够在静脉内递送后以高效率穿过BBB并且转导脑和脊髓的细胞。此外,还有许多研究表明,在小型和大型动物模型中,在IT递送到CSF后,所述AAV9在局部CNS转导方面的有效性,但它在脑中的转导是弥漫性的。在此,已经确定了有效靶向灵长类动物CNS的新型AAV衣壳AAVrh91。其独特的室管膜细胞转导表型可以在治疗需要分泌型转基因的病症方面大有用途,因为这种细胞类型可以将转基因释放到CSF中,然后将在整个脑室系统中循环。虽然还使用AAV1观察到这种室管膜细胞转导模式,但AAVrh91具有更高的整体脑转导水平并且具有更好的制造概况。有趣的是,观察到与AAV9组相比,AAVrh91和AAV1组的肝脏和心脏组织中转导细胞的频率更高。AAVrh91还表现出至少与AAV9相当的有效实质转导。总体而言,由于在大多数测试的脑区域中GC生物分布和转导水平高于AAV9,因此应强烈考虑将AAVrh91用于IT递送治疗性转基因以代替AAV9进行转化基因疗法研究。
实例5:AAVrh91在人群体中的血清阳性率
使用至多100个随机人血清样品评估了抗衣壳NAb在人群体中针对AAVrh91的血清阳性率(图21A)。还在相同样品中的至少50个样品中评估了AAV2、AAV8、AAV9和AAVrh32.33的NAb以进行比较。在此评估的人样品中,AAVrh91的血清阳性率(37%)与AAV8的血清阳性率(42%)类似,但与AAV9的血清阳性率(60%)相比降低。当调查NAb应答的量值时,AAVrh91阳性的样品很少处于低阳性范围(NAb滴度为1/5-1/10)。相比之下,NAb对其它衣壳的应答量值分布更为分散,报告的低阳性范围样品增加(图21B)。
实例6:全身施用后AAVrh91的生物分布
试图将AAVrh91衣壳的生物学特性表征为AAV载体,随后对动物模型进行全身施用。在IV递送后在小鼠和恒河猴体内观察到可变的组织转导特性。
与AAV1、AAV8和AAV9相比,全身施用后AAVrh91在小鼠体内的生物分布
为了评估AAVrh91在小型动物模型中的生物分布和转导概况,向C57BL/6J小鼠IV施用1011或1012GC表达来自CB7启动子的eGFP的载体。小鼠也被施用相同剂量的AAV1、AAV8和AAV9载体。在载体施用后21天对小鼠进行尸检,并且采集肝脏、心脏和骨骼肌(腓肠肌)。分离DNA和RNA后,分别评估样品的载体基因组拷贝和载体衍生的RNA转录水平(图22A-图22F)。
对于所有评估的组织(肝脏、心脏和骨骼肌),评估的所有四种衣壳的载体基因组拷贝存在剂量依赖性增加。AAV8载体的施用引起最高的载体基因组拷贝和肝脏中的转基因表达。有趣的是,与AAV1相比,在高剂量(1012GC/动物)下,肝脏中AAVrh91基因组拷贝的数量似乎有所减少,这表明这种衣壳可能从肝脏中脱靶。在AAV9和AAVrh91载体的转基因RNA水平中未检测到剂量效应。
在心脏和骨骼肌中,观察到AAVrh91的基因组拷贝高于评估的其它载体。虽然AAVrh91在心脏中的表达不如AAV9高,但它与AAV8类似。有趣的是,骨骼肌中AAV1、AAV9和AAVrh91的转基因表达类似。组织样品也在尸检时采集,用于通过荧光评估GFP表达。转基因蛋白表达与跨肝脏、心脏和骨骼肌(腓肠肌)的RNA水平相关。
全身施用后恒河猴中AAVrh91的评估
为了评估在大型动物模型中全身施用后AAVrh91的生物分布和转导概况,向三只恒河猴施用了5×1013GC/kg的AAVrh91.CB7.eGFP。向另外三只恒河猴施用相同剂量的AAV9,以直接比较AAVrh91与当前最佳同类载体的全身生物分布。
IV载体施用后,监测所有NHP的临床病理学变化(图26A和图28B)。虽然所记录的变化均未达到统计学显著性,但第3天的ALT、AST和总胆红素有所升高,这在施用AAV9的动物中更高。从第7天起,这些升高迅速恢复到基线水平,其中在第14天,在施用AAVrh91的NHP中,ALT和AST发生了较小的升高。许多动物的总胆红素水平也在第14天第二次达到峰值,其中一只接受AAV9的动物上升到5.8mg/dl(18-017)。这只动物确实出现黄疸,并且皮下施用了流体,但在其它方面稳定。总胆红素的二次升高可能是由于肝脏中GFP的表达以及随后对非自身蛋白的应答。分布在第3天评估的两个衣壳上的凝血时间(PT和APTT)都有轻微延长,并且在施用AAVrh91的动物中可见血小板计数有所下降。
在载体施用后21天对NHP进行尸检并且采集组织。为了减少由于采样问题引起的变异,评估了每个组织的大量样品,隔膜、肾脏和脾脏除外,其中每个NHP只评估了一个样品。从心脏评估左心室和右心室,从每个衣壳的三个NHP评估肝脏的三个叶(左、中、右)、左肺和右肺以及13块骨骼肌(肱二头肌、股二头肌、三角肌、桡侧腕伸肌、腓肠肌、臀大肌、肋间肌、胸大肌、腹直肌、比目鱼肌、胫骨前肌、斜方肌、股外侧肌)的样品。
AAV9和AAVrh91在全身注射后似乎具有相当类似的载体生物分布特征,其中在肝脏中检测到的载体基因组最多(图23A)。虽然衣壳之间的差异没有统计学意义,但施用AAV9的NHP在肝脏中的载体基因组拷贝高出2.5倍(平均81.6GC/二倍体基因组与施用AAVrh91的NHP的32.6GC/二倍体基因组)。虽然其它外周器官(心脏、肾脏、肺、骨骼肌和脾脏)中的基因组拷贝比肝脏中的基因组拷贝低至多两个对数,但AAVrh91的值略高于AAV9的值。
为了进一步评估转基因在静脉内施用后的表达位置,评估了转基因RNA拷贝和GFP蛋白表达(图23B、图23C和图23D)。虽然AAV9在肾脏、肝脏、肺和脾脏中具有更高的转基因RNA水平,但AAVrh91在隔膜、心脏和骨骼肌中的RNA水平超过了AAV9(图23B)。当通过ELISA(图23C)或通过如IHC检测的GFP表达的图像定量(图23D)评估GFP蛋白表达时,保留了这些趋势。接受AAV9载体并在第14天血清总胆红素水平显著升高的动物18-017具有一致低的载体基因组拷贝、转基因RNA水平和肝脏中几乎不存在的GFP蛋白表达。这表明对非自身转基因的免疫应答导致转基因表达耗尽和转导的肝细胞清除。组织病理学显示,在动物18-017和18-022(2/3,AAV9)中观察到最严重的肝脏毒性(肝细胞变性和单个细胞坏死)。当跨组比较时,相对于接受AAVrh91载体(最小至轻度)的动物,接受AAV9载体(中度至显著)的动物的肝脏毒性严重程度增加(图25)。
针对每个NHP采集的13个骨骼肌样品中的每个骨骼肌样品中的载体基因组拷贝、转基因RNA水平和GFP表达的进一步分析表明了AAVrh91基因转移和转基因表达的一致性。虽然与AAV9相比,在施用AAVrh91后评估的跨骨骼肌组的载体基因组拷贝持续增加0.5-4.6倍,但合并数据的差异未达到统计学显著性(图24A)。转基因RNA(图24B)和GFP表达(图24C)的可变性增加也没有使AAVrh91增强转基因表达的趋势达到统计学显著性。
这些在小型和大型动物模型中进行的研究提供了对新型AAV衣壳AAVrh91的综合分析,所述衣壳是从自然来源中分离出来的,并且作为基因转移载体进行了评估。在小鼠和恒河猴中,与AAV9相比,AAVrh91具有类似(如果没有增加)的骨骼肌转导。还观察到AAVrh91载体在肝脏中表达的转基因少于评估的其它AAV衣壳。AAVrh91衣壳对肝脏的这种潜在脱靶可能表明AAVrh91载体在全身注射后的肝脏毒性方面优于衣壳,导致肝脏中转基因的表达较少。
实例7:向非人类灵长类动物ICM施用后AAVrh91的生物分布
进行了另外的研究以评估在向恒河猴小脑延髓池内(ICM)施用后用AAVrh91衣壳进行的转基因递送。
在第一项研究中,将3×1013GC/kg携带eGFP转基因AAVrh91.CB7.eGFP或AAV9.CB7.eGFP的载体递送到NHP(n=3/组)。在施用后第14天进行尸检。在基线和第14天时的尸检前进行神经传导速度评估(图32)。生物分布和转导概况的比较示出于图28A-图28C所示。进行免疫组织化学以对脑(图31A-图31C)、脊髓(图30A-图30G)和背根神经节(DRG)(图29A-图29I)中的GFP阳性神经元进行定量。在施用AAVrh91的NHP中,在DRG中观察到较少的转基因表达(与AAV9相比)(图29A-图29I)。这些发现表明,通过ICM途径递送AAVrh91基因可能与比AAV9更低的DRG毒性相关。
在进一步的研究中,将3×1013GC/kg携带抗体转基因(2.10A mAb)AAVrh91.CB7.2.10A或AAV9.CB7.2.10A的载体递送到NHP(n=3/组)。监测血清和CSF的2.10A mAb表达(图33A和图33B)。在载体施用后第90天进行尸检,并且收集组织用于分析载体生物分布(图34A和图34B)。
实例8:比较AAVrh91和AAV1衣壳的冷冻-EM结构数据
为了提供对AAVrh91载体改进特性的机制见解,使用冷冻电子显微镜以
Figure BDA0004175913010000671
分辨率解析此载体的结构。将结构与先前发布的AAV1,临床试验中使用最广泛的进化支A载体,的结构进行了比较。AAVrh91在11个氨基酸位置处与AAV1不同,其中6个位于衣壳的VP3蛋白中并暴露在表面。参见图35A-图35F。
结果
AAVrh91中的Asp 418和AAV1中的Glu 418是位于AAV衣壳内表面上的溶剂暴露残基,紧邻其它带电残基Arg 308、Lys 310和Glu 686(图35A)。Asp和Glu都是在中性pH下带负电荷的酸性残基,并且可以看出在两种结构中采用类似的确认。没有观察到位置418周围带电残基的结构变化。总体而言,从Glu 418到Asp 418的变化非常保守,并且对衣壳功能的影响可能可忽略不计。
AAVrh91中的Asn 547和AAV1中的Ser 547是位于AAV衣壳外表面上HVR VII中的溶剂暴露残基,并且不靠近其它氨基酸(图35B)。两者都是在中性pH下不带电的极性氨基酸,但具有不同的官能团。Asn在其侧链上含有羰基和胺基官能团,并且Ser含有单个羟基。这些残基在衣壳外部上的溶剂暴露意味着所述残基可与细胞受体相互作用,但迄今为止还没有为此位置处的残基定义AAV结构-功能关系。总体而言,这种变化也是保守的,但氨基酸之间官能团的差异有可能影响衣壳功能。
AAVrh91中的Leu 584和AAV1中的Phe 584是位于AAV衣壳外表面上HVR VIII中的溶剂暴露残基,紧邻全都位于相邻链上的Arg 485、Arg 488、Lys 528、Glu 531、Phe534、Thr574和Glu575(图35C)。Leu是小的疏水性氨基酸,并且Phe是大的疏水性氨基酸。除了Phe534(疏水性)和Thr 574(极性)外,紧邻位置584的残基全都是带电氨基酸。在AAVrh91中,与AAV1中较大的Phe相比,较小的Leu残基对这些近端带电残基的破坏性较小。减少对这个带电袋的破坏可能会增加衣壳稳定性。鉴于此位置处链间接触的普遍存在,位置584处从Phe到Leu的变化可能部分解释了观察到的AAVrh91相对于AAV1的制造产量增加。
AAVrh91中的Asn 588和AAV1中的Ser 588是位于AAV衣壳外表面上HVR VIII中的溶剂暴露残基,位于AAV的三重尖峰结构的尖端处,并且不靠近其它氨基酸(图35D)。如上所述,这两个残基都是在中性pH下不带电的极性氨基酸,但具有可能影响衣壳/受体相互作用的不同官能团。位置588很重要,因为它是蛋白质工程化工作中用于肽插入以改变AAV嗜性的常见位置。这是因为其突出的位置和高水平的溶剂暴露增加了与细胞受体相互作用的可能性。由于其增强的暴露,这种Ser到Asn突变比在位置547处观察到的相同突变更有可能影响衣壳功能。
AAVrh91中的Val 598和AAV1中的Ala 598也位于HVR VIII中,但不在高度溶剂暴露的位置。相反,这些小的疏水残基与相邻残基Tyr 484、Val 580、Val 596、Met 599和Leu602一起参与疏水性袋的形成(图35E)。这些残基位于AAV三重轴的中心,三个VP3蛋白在此聚集在一起,并且与相邻肽链有许多接触。可见于AAV1的位置598处的Ala是最小的疏水性氨基酸,而AAVrh91中的Val 598稍大且更具疏水性。Val残基似乎比其较小的Ala对应物更好地填充此疏水性袋内的空间,这可能会提高衣壳稳定性。考虑到此疏水性袋的中心位置和其链间接触的数量,位置598处的Ala/Val取代最有可能解释用AAVrh91观察到的制造优势。
AAVrh91中的His 642和AAV1中的Asn 642是位于AAV衣壳内表面上的溶剂暴露残基,靠近极性残基Tyr349和Tyr414以及带电残基Glu417和Lys641(图35F)。His是在中性pH下带正电荷的碱性残基,并且Asn是在中性pH下不带电的极性残基。位置642处的Asn/His取代不会在周围的亲水性残基中引起任何可观察到的结构变化。总体而言,从Asn 642到His642的变化导致局部正电荷增加,但它在衣壳内部的位置并且对周围衣壳结构的影响最小表明这种变化不会显著改变衣壳功能。
实例9:AAVrh91载体产生优化
利用多种策略来改变AAVrh91的反式产生质粒,以提高AAVrh91载体产量。
一种策略是工程化AAVrh91衣壳基因序列,包含优化密码子使用。产生的序列(rh91M113、AAVrh91eng、SEQ ID NO:3)不同于113个核苷酸处的天然AAVrh91编码序列,但编码相同的氨基酸序列。对于每个版本,重新转化质粒并且随机挑选四个克隆在12孔板中进行单独的三重转染。载体产量通过两种方法确定:用于产生滴度的qPCR(图36A)和用于感染滴度的Huh7转导(图36B)。观察到rh91M113在使用这两种测量的重复实验中提高了产量,但差异不是统计学上显著的(没有一个p值小于0.05)。
第二种策略是向反式质粒中添加调控元件。生成包含土拨鼠肝炎病毒转录后调控元件(WPRE)和牛生长激素聚腺苷酸化(bGH polyA)信号之一或两者的质粒(图37A)。使用上文所描述的方法评估载体产量。结果表明,包含调控元件(WPRE和bGH polyA、单独的WPRE和单独的bGH polyA)可以提高载体产量(图37B和图37C)。
(序列表自由文本)
针对含有在数字标识符<223>下的自由文本的序列提供以下信息。
Figure BDA0004175913010000691
Figure BDA0004175913010000701
本说明书中引用的所有文献均通过引用并入本文。于2019年4月29日提交的美国临时专利申请第62/840,1840号;于2019年10月10日提交的美国临时专利申请第62/913,314号;于2019年10月21日提交的美国临时专利申请第62/924,095号;于2020年8月14日提交的美国临时专利申请第63/065,616号;于2020年11月4日提交的美国临时专利申请第63/109,734号;以及于2020年4月20日提交的国际专利申请第PCT/US2020/030266号连同其序列表通过引用整体并入。随此提交的标记为“21-9545PCT_ST25”的序列表及其中的序列和文本通过引用并入。虽然已经参考特定实施例描述了本发明,但是应当理解,可以在不脱离本发明的精神的情况下进行修改。此类修改旨在落入所附权利要求的范围内。
序列表
<110> 宾夕法尼亚大学信托人
<120> 新型AAV衣壳和含有新型AAV衣壳的组合物
<130> 21-9545.PCT
<150> US 63/065,616
<151> 2020-08-14
<150> US 63/109,734
<151> 2020-11-04
<160> 14
<170> PatentIn 3.5版
<210> 1
<211> 2211
<212> DNA
<213> 腺相关病毒rh.91
<220>
<221> CDS
<222> (1)..(2211)
<400> 1
atg gct gcc gat ggt tat ctt cca gat tgg ctc gag gac aac ctc tct 48
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
gag ggc att cgc gag tgg tgg gcg ctg aaa cct gga gcc ccg aaa ccc 96
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
aaa gcc aac cag caa aag cag gac gac ggc cgg ggt ctg gtg ctt cct 144
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
ggc tac aag tac ctc gga ccc ttc aac gga ctc gac aag ggg gag ccc 192
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
gtc aac gcg gcg gac gca gcg gcc ctc gag cac gac aag gcc tac gac 240
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
cag cag ctc aaa gcg ggt gac aat ccg tac ctg cgg tat aac cac gcc 288
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
gac gcc gag ttt cag gag cgt ctg caa gaa gat acg tct ttt ggg ggc 336
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
aac ctc ggg cga gca gtc ttc cag gcc aag aag cgg gtt ctc gaa cct 384
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
ttt ggt ctg gtt gag gaa gca gct aag acg gct cct gga aag aaa cgt 432
Phe Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
ccg gta gag cag tcg ccc caa gaa cca gac tcc tcc tcg ggc att ggc 480
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
aaa tca ggc cag cag ccc gcc aaa aag aga ctc aat ttc ggt cag act 528
Lys Ser Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
ggc gac tca gag tca gtc ccc gac cct caa cct ctc gga gaa cct cca 576
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
gaa acc ccc gct gct gtg gga cct act aca atg gct tca ggc ggt ggc 624
Glu Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
gca cca atg gca gac aat aac gaa ggc gcc gac gga gtg ggt aat gcc 672
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
tca gga aat tgg cat tgc gat tcc aca tgg ctg ggc gac aga gtc atc 720
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
acc acc agc acc cga acc tgg gcc ctt cct acc tac aac aac cac ctc 768
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
tac aag caa atc tcc agc gct tca acg ggg gcc agt aac gac aac cac 816
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
tac ttt ggc tac agc acc ccc tgg ggg tat ttt gat ttc aac aga ttc 864
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
cac tgc cac ttc tca cca cgt gac tgg cag cga ctc att aac aac aac 912
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
tgg gga ttc cgg ccc aag aga ctc aac ttc aag ctc ttc aac atc cag 960
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
gtc aag gag gtc acg acg aat gat ggc gtc aca acc atc gct aat aac 1008
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
ctt acc agc acg gtt caa gtg ttc tcg gac tcg gag tac cag ctg ccg 1056
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
tac gtc ctc ggt tct gcg cac cag ggc tgc ctc cct ccg ttc ccg gcg 1104
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
gac gta ttc atg att cct cag tac ggc tac cta acg ctc aac aat ggc 1152
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
agc cag gcc gta gga cgt tca tcc ttt tat tgc ctg gaa tat ttc cca 1200
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
tct caa atg ctg aga acg ggc aac aac ttt acc ttc agc tac acc ttt 1248
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
gaa gat gtg cct ttc cac agc agt tac gcg cac agc cag agc ctg gac 1296
Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
agg cta atg aat cct cta atc gac cag tac ctg tat tac cta aac aga 1344
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
act cag aat caa tcc gga agt gca caa aac aag gac ttg ctg ttt agc 1392
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
cgg ggg tct cca gct ggc atg tct gtt cag ccc aaa aac tgg cta ccc 1440
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
ggg ccc tgt tac cga cag cag cgt gtt tct aaa aca aaa aca gac aac 1488
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
aac aac agc aac ttt acc tgg act ggt gcc tcc aaa tac aat ctg aac 1536
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
gga cgt gaa tcc atc att aac cct ggc acc gct atg gca tcc cac aag 1584
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
gac gac gaa gac aaa ttt ttt ccc atg agc ggt gtt atg att ttt ggc 1632
Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
aaa gaa aat gca gga gca tca aac act gca tta gac aat gtt atg att 1680
Lys Glu Asn Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
aca gat gaa gag gaa att aaa gct acc aac ccc gtg gcc acc gag aga 1728
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
ttt gga act gtg gca gtc aat ctc caa agc agc aat aca gac cct gca 1776
Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Asn Thr Asp Pro Ala
580 585 590
aca gga gac gtg cat gtc atg ggg gct tta cct ggc atg gtg tgg caa 1824
Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
gac aga gac gtg tac ctg cag ggt ccc att tgg gcc aag att cct cac 1872
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
acg gat gga cac ttt cac ccg tct cct ctt atg ggc ggc ttt gga ctt 1920
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
aag cac ccg cct cct cag atc ctc atc aaa aac acg cct gtt cct gcg 1968
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
aat cct ccg gca gag ttt tcg gct aca aag ttt gct tca ttc atc acc 2016
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
cag tac tcc aca gga caa gtg agc gtg gaa att gaa tgg gag ctg cag 2064
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
aaa gaa aac agt aag cgc tgg aat cct gaa gtg cag tac acc tcc aac 2112
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
tac gcg aaa tct gcc aac gtt gat ttc act gtg gac aac aat gga ctt 2160
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
tat act gag cct cgc ccc att ggc acc cgt tac ctt acc cgt ccc ctt 2208
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
taa 2211
<210> 2
<211> 736
<212> PRT
<213> 腺相关病毒rh.91
<400> 2
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Phe Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Ser Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Glu Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Asn Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Asn Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 3
<211> 2211
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<220>
<221> CDS
<222> (1)..(2211)
<400> 3
atg gct gct gac ggt tat ctt cca gat tgg ctc gag gac aac ctt tct 48
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
gaa ggc att cgt gag tgg tgg gct ctg aaa cct gga gcc cct aaa ccc 96
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
aaa gcg aac caa caa aag cag gac gac ggc cgg ggt ctt gtg ctt ccg 144
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
ggt tac aaa tac ctc gga ccc ttc aac gga ctc gac aaa gga gag ccg 192
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
gtc aac gcg gcg gac gcg gca gcc ctc gaa cac gac aaa gct tac gac 240
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
cag cag ctc aag gcc ggt gac aac ccg tac ctc cgg tac aac cac gcc 288
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
gac gcc gag ttt cag gag cgt ctt caa gaa gat acg tct ttt ggg ggc 336
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
aac ctt ggc aga gca gtc ttc cag gcc aaa aag agg gtt ctt gag cct 384
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
ttt ggt ctg gtt gag gaa gca gct aaa acg gct cct gga aag aag agg 432
Phe Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
cct gta gag cag tct cct cag gaa ccg gac tca tca tct ggt att ggc 480
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
aaa tcg ggc cag cag cct gcc aaa aaa aga cta aat ttc ggt cag act 528
Lys Ser Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
ggc gac tca gag tca gtc ccc gac cct caa cct ctc gga gaa cct cca 576
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
gaa acc ccc gct gct gtg gga cct act aca atg gct tca ggc ggt ggc 624
Glu Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
gca cca atg gca gac aat aac gaa ggc gcc gac gga gtg ggt aat gcc 672
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
tca gga aat tgg cat tgc gat tcc aca tgg ctg ggc gac aga gtc atc 720
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
acc acc agc acc cga acc tgg gcc ctt cct acc tac aac aac cac ctc 768
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
tac aag caa atc tcc agc gct tca acg ggg gcc agt aac gac aac cac 816
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
tac ttt ggc tac agc acc ccc tgg ggg tat ttt gat ttc aac aga ttc 864
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
cac tgc cac ttc tca cca cgt gac tgg cag cga ctc att aac aac aac 912
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
tgg gga ttc cgg ccc aag aga ctc aac ttc aag ctc ttc aac atc cag 960
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
gtc aag gag gtc acg acg aat gat ggc gtc aca acc atc gct aat aac 1008
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
ctt acc agc acg gtt caa gtg ttc tcg gac tcg gag tac cag ctg ccg 1056
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
tac gtc ctc ggt tct gcg cac cag ggc tgc ctc cct ccg ttc ccg gcg 1104
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
gac gta ttc atg att cct cag tat gga tac ctc acc ctg aac aac gga 1152
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
agt caa gcg gtg gga cgc tca tcc ttt tac tgc ctg gag tac ttc cct 1200
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
tcg cag atg cta agg act gga aat aac ttc acc ttc agc tat acc ttc 1248
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
gag gat gta cct ttt cac agc agc tac gct cac agc cag agt ttg gat 1296
Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
cgc ttg atg aat cct ctt att gat cag tat ctg tac tac ctg aac aga 1344
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
acg caa aat caa tct gga agt gca caa aac aag gac ctg ctt ttt agc 1392
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
cgg ggg tct cct gct ggc atg tct gtt cag ccc aaa aat tgg cta cct 1440
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
ggg ccc tgc tac cgg caa cag aga gtt tca aag act aaa aca gac aac 1488
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
aac aac agt aac ttt acc tgg aca ggt gcc agc aaa tat aat ctc aat 1536
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
ggc cgc gaa tcg atc att aat cca gga acc gct atg gcc agt cac aag 1584
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
gac gat gaa gac aaa ttt ttc cct atg agc ggc gtt atg ata ttt ggc 1632
Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
aaa gaa aat gca gga gca agt aac act gca tta gat aat gta atg att 1680
Lys Glu Asn Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
acg gat gaa gaa gag att aaa gct acc aat cct gtg gca aca gag aga 1728
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
ttt gga act gtg gca gtc aac ttg cag agc tca aat aca gac ccc gca 1776
Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Asn Thr Asp Pro Ala
580 585 590
act gga gac gtc cat gtc atg ggg gcc tta cct ggc atg gtg tgg caa 1824
Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
gat cgt gac gtg tac ctt caa gga cct atc tgg gca aag att cct cac 1872
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
acg gat gga cac ttt cat cct tct cct ctg atg gga ggc ttt gga ctg 1920
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
aaa cat ccg cct cct caa atc ctc atc aaa aat act ccg gta ccg gca 1968
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
aat cct ccg gca gag ttc agc gct aca aag ttt gct tca ttt atc act 2016
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
cag tac tcc act gga cag gtc agc gtg gaa att gag tgg gag cta cag 2064
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
aaa gaa aac agc aaa cgt tgg aat cca gag gtg cag tac act tcc aac 2112
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
tac gcg aag tct gcc aat gtg gac ttt act gta gac aac aat ggt ctt 2160
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
tat act gaa cct cgc cct att gga acc cgg tat ctc aca cga ccc ttg 2208
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
taa 2211
<210> 4
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 4
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Phe Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Ser Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Glu Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Asn Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Asn Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 5
<211> 2211
<212> DNA
<213> 人工序列
<220>
<223> AAV6突变体
<220>
<221> CDS
<222> (1)..(2211)
<400> 5
atg gct gcc gat ggt tat ctt cca gat tgg ctc gag gac aac ctc tct 48
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
gag ggc att cgc gag tgg tgg gac ttg aaa cct gga gcc ccg aaa ccc 96
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
aaa gcc aac cag caa aag cag gac gac ggc cgg ggt ctg gtg ctt cct 144
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
ggc tac aag tac ctc gga ccc ttc aac gga ctc gac aag ggg gag ccc 192
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
gtc aac gcg gcg gat gca gcg gcc ctc gag cac gac aag gcc tac gac 240
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
cag cag ctc aaa gcg ggt gac aat ccg tac ctg cgg tat aac cac gcc 288
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
gac gcc gag ttt cag gag cgt ctg caa gaa gat acg tct ttt ggg ggc 336
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
aac ctc ggg cga gca gtc ttc cag gcc aag aag agg gtt ctc gaa cct 384
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
ctt ggt ctg gtt gag gaa ggt gct aag acg gct cct gga aag aaa cgt 432
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
ccg gta gag cag tcg cca caa gag cca gac tcc tcc tcg ggc att ggc 480
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
aag aca ggc cag cag ccc gct aaa aag aga ctc aat ttt ggt cag act 528
Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
ggc gac tca gag tca gtc ccc gac cca caa cct ctc gga gaa cct cca 576
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
gca acc ccc gct gct gtg gga cct act aca atg gct tca ggc ggt ggc 624
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
gca cca atg gca gac aat aac gaa ggc gcc gac gga gtg ggt aat gcc 672
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
tca gga aat tgg cat tgc gat tcc aca tgg ctg ggc gac aga gtc atc 720
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
acc acc agc acc cga aca tgg gcc ttg ccc acc tat aac aac cac ctc 768
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
tac aag caa atc tcc agt gct tca acg ggg gcc agc aac gac aac cac 816
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
tac ttc ggc tac agc acc ccc tgg ggg tat ttt gat ttc aac aga ttc 864
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
cac tgc cat ttc tca cca cgt gac tgg cag cga ctc atc aac aac aat 912
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
tgg gga ttc cgg ccc aag aga ctc aac ttc aag ctc ttc aac atc caa 960
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
gtc aag gag gtc acg acg aat gat ggc gtc acg acc atc gct aat aac 1008
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
ctt acc agc acg gtt caa gtc ttc tcg gac tcg gag tac cag ttg ccg 1056
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
tac gtc ctc ggc tct gcg cac cag ggc tgc ctc cct ccg ttc ccg gcg 1104
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
gac gtg ttc atg att ccg cag tac ggc tac cta acg ctc aac aat ggc 1152
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
agc cag gca gtg gga cgg tca tcc ttt tac tgc ctg gaa tat ttc cca 1200
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
tcg cag atg ctg aga acg ggc aat aac ttt acc ttc agc tac acc ttc 1248
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
gag gac gtg cct ttc cac agc agc tac gcg cac agc cag agc ctg gac 1296
Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
cgg ctg atg aat cct ctc atc gac cag tac ctg tat tac ctg aac aga 1344
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
act cag aat cag tcc gga agt gcc caa aac aag gac ttg ctg ttt agc 1392
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
cgg ggg tct cca gct ggc atg tct gtt cag ccc aaa aac tgg cta cct 1440
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
gga ccc tgt tac cgg cag cag cgc gtt tct aaa aca aaa aca gac aac 1488
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
aac aac agc aac ttt acc tgg act ggt gct tca aaa tat aac ctt aat 1536
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
ggg cgt gaa tct ata atc aac cct ggc act gct atg gcc tca cac aaa 1584
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
gac gac aaa gac aag ttc ttt ccc atg agc ggt gtc atg att ttt gga 1632
Asp Asp Lys Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
aag gag agc gcc gga gct tca aac act gca ttg gac aat gtc atg atc 1680
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
aca gac gaa gag gaa atc aaa gcc act aac ccc gtg gcc acc gaa aga 1728
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
ttt ggg act gtg gca gtc aat ctc cag agc agc agc aca gac cct gcg 1776
Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
acc gga gat gtg cat gtt atg gga gcc tta cct gga atg gtg tgg caa 1824
Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
gac aga gac gta tac ctg cag ggt cct att tgg gcc aaa att cct cac 1872
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
acg gat gga cac ttt cac ccg tct cct ctc atg ggc ggc ttt gga ctt 1920
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
aag cac ccg cct cct cag atc ctc atc aaa aac acg cct gtt cct gcg 1968
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
aat cct ccg gca gag ttt tcg gct aca aag ttt gct tca ttc atc acc 2016
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
cag tat tcc aca gga caa gtg agc gtg gag att gaa tgg gag ctg cag 2064
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
aaa gaa aac agc aaa cgc tgg aat ccc gaa gtg cag tat aca tct aac 2112
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
tat gca aaa tct gcc aac gtt gat ttc act gtg gac aac aat gga ctt 2160
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
tat act gag cct cgc ccc att ggc acc cgt tac ctc acc cgt ccc ctg 2208
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
taa 2211
<210> 6
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 6
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Lys Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 7
<211> 2211
<212> DNA
<213> 腺相关病毒1
<220>
<221> CDS
<222> (1)..(2211)
<400> 7
atg gct gcc gat ggt tat ctt cca gat tgg ctc gag gac aac ctc tct 48
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
gag ggc att cgc gag tgg tgg gac ttg aaa cct gga gcc ccg aag ccc 96
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
aaa gcc aac cag caa aag cag gac gac ggc cgg ggt ctg gtg ctt cct 144
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
ggc tac aag tac ctc gga ccc ttc aac gga ctc gac aag ggg gag ccc 192
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
gtc aac gcg gcg gac gca gcg gcc ctc gag cac gac aag gcc tac gac 240
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
cag cag ctc aaa gcg ggt gac aat ccg tac ctg cgg tat aac cac gcc 288
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
gac gcc gag ttt cag gag cgt ctg caa gaa gat acg tct ttt ggg ggc 336
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
aac ctc ggg cga gca gtc ttc cag gcc aag aag cgg gtt ctc gaa cct 384
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
ctc ggt ctg gtt gag gaa ggc gct aag acg gct cct gga aag aaa cgt 432
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
ccg gta gag cag tcg cca caa gag cca gac tcc tcc tcg ggc atc ggc 480
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
aag aca ggc cag cag ccc gct aaa aag aga ctc aat ttt ggt cag act 528
Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
ggc gac tca gag tca gtc ccc gat cca caa cct ctc gga gaa cct cca 576
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
gca acc ccc gct gct gtg gga cct act aca atg gct tca ggc ggt ggc 624
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
gca cca atg gca gac aat aac gaa ggc gcc gac gga gtg ggt aat gcc 672
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
tca gga aat tgg cat tgc gat tcc aca tgg ctg ggc gac aga gtc atc 720
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
acc acc agc acc cgc acc tgg gcc ttg ccc acc tac aat aac cac ctc 768
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
tac aag caa atc tcc agt gct tca acg ggg gcc agc aac gac aac cac 816
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
tac ttc ggc tac agc acc ccc tgg ggg tat ttt gat ttc aac aga ttc 864
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
cac tgc cac ttt tca cca cgt gac tgg cag cga ctc atc aac aac aat 912
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
tgg gga ttc cgg ccc aag aga ctc aac ttc aaa ctc ttc aac atc caa 960
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
gtc aag gag gtc acg acg aat gat ggc gtc aca acc atc gct aat aac 1008
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
ctt acc agc acg gtt caa gtc ttc tcg gac tcg gag tac cag ctt ccg 1056
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
tac gtc ctc ggc tct gcg cac cag ggc tgc ctc cct ccg ttc ccg gcg 1104
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
gac gtg ttc atg att ccg caa tac ggc tac ctg acg ctc aac aat ggc 1152
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
agc caa gcc gtg gga cgt tca tcc ttt tac tgc ctg gaa tat ttc cct 1200
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
tct cag atg ctg aga acg ggc aac aac ttt acc ttc agc tac acc ttt 1248
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
gag gaa gtg cct ttc cac agc agc tac gcg cac agc cag agc ctg gac 1296
Glu Glu Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
cgg ctg atg aat cct ctc atc gac caa tac ctg tat tac ctg aac aga 1344
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
act caa aat cag tcc gga agt gcc caa aac aag gac ttg ctg ttt agc 1392
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
cgt ggg tct cca gct ggc atg tct gtt cag ccc aaa aac tgg cta cct 1440
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
gga ccc tgt tat cgg cag cag cgc gtt tct aaa aca aaa aca gac aac 1488
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
aac aac agc aat ttt acc tgg act ggt gct tca aaa tat aac ctc aat 1536
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
ggg cgt gaa tcc atc atc aac cct ggc act gct atg gcc tca cac aaa 1584
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
gac gac gaa gac aag ttc ttt ccc atg agc ggt gtc atg att ttt gga 1632
Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
aaa gag agc gcc gga gct tca aac act gca ttg gac aat gtc atg att 1680
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
aca gac gaa gag gaa att aaa gcc act aac cct gtg gcc acc gaa aga 1728
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
ttt ggg acc gtg gca gtc aat ttc cag agc agc agc aca gac cct gcg 1776
Phe Gly Thr Val Ala Val Asn Phe Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
acc gga gat gtg cat gct atg gga gca tta cct ggc atg gtg tgg caa 1824
Thr Gly Asp Val His Ala Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
gat aga gac gtg tac ctg cag ggt ccc att tgg gcc aaa att cct cac 1872
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
aca gat gga cac ttt cac ccg tct cct ctt atg ggc ggc ttt gga ctc 1920
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
aag aac ccg cct cct cag atc ctc atc aaa aac acg cct gtt cct gcg 1968
Lys Asn Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
aat cct ccg gcg gag ttt tca gct aca aag ttt gct tca ttc atc acc 2016
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
caa tac tcc aca gga caa gtg agt gtg gaa att gaa tgg gag ctg cag 2064
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
aaa gaa aac agc aag cgc tgg aat ccc gaa gtg cag tac aca tcc aat 2112
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
tat gca aaa tct gcc aac gtt gat ttt act gtg gac aac aat gga ctt 2160
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
tat act gag cct cgc ccc att ggc acc cgt tac ctt acc cgt ccc ctg 2208
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
taa 2211
<210> 8
<211> 736
<212> PRT
<213> 腺相关病毒1
<400> 8
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Glu Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Phe Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Ala Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys Asn Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 9
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 引物序列
<400> 9
gctgcgtcaa ctggaccaat gagaac 26
<210> 10
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 引物序列
<400> 10
cgcagagacc aaagttcaac tgaaacga 28
<210> 11
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物序列
<400> 11
ggcgaacagc ggacaccgat atgaa 25
<210> 12
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物序列
<400> 12
ggctctcgtc gcgtgagaat gagaa 25
<210> 13
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> miRNA靶序列
<400> 13
agtgaattct accagtgcca ta 22
<210> 14
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> miRNA靶序列
<400> 14
agtgtgagtt ctaccattgc caaa 24

Claims (41)

1.一种将转基因递送到受试者的中枢神经系统(CNS)的一个或多个靶细胞的方法,所述方法包括向所述受试者施用包括AAVrh91衣壳和包括所述转基因的载体基因组的重组腺相关病毒(AAV)载体,所述转基因可操作地连接到调控序列,所述调控序列引导所述转基因在所述CNS的所述靶细胞中的表达。
2.根据权利要求1所述的方法,其中所述CNS的所述靶细胞是实质细胞、脉络丛细胞、室管膜细胞、星形胶质细胞和/或神经元,任选地皮质、海马体和/或纹状体的神经元。
3.根据权利要求1或2所述的方法,其中所述转基因编码分泌的基因产物。
4.根据权利要求1至3中任一项所述的方法,其中所述AAV载体通过鞘内,任选地通过小脑延髓池内(ICM)注射递送。
5.根据权利要求1至3中任一项所述的方法,其中所述AAV载体通过实质内施用递送。
6.一种用于在鞘内施用包括转基因的AAV载体后改善所述转基因向受试者的肝脏的递送的方法,所述方法包括通过ICM注射向所述受试者施用包括AAVrh91衣壳和包括所述转基因的载体基因组的重组AAV载体,所述转基因可操作地连接到调控序列,所述调控序列引导所述转基因在所述肝脏的靶细胞中的表达,其中所述肝脏的转导水平相对于使用具有AAV1、AAV9和/或AAV6.2衣壳的AAV载体实现的转导水平得到提高。
7.一种用于在向受试者全身施用AAV载体后使肝脏脱靶和/或降低肝脏毒性的方法,所述方法包括通过静脉内注射向所述受试者施用包括AAVrh91衣壳和包括转基因的载体基因组的重组AAV载体,所述转基因可操作地连接到调控序列,所述调控序列引导所述转基因在所述肝脏的细胞中的表达,其中在施用所述AAV载体后观察到的所述肝脏的转导水平和/或肝脏毒性相对于具有AAV1、AAV8和/或AAV9衣壳的AAV载体降低。
8.根据权利要求1至7中任一项所述的方法,其中所述AAVrh91衣壳包括衣壳蛋白,所述衣壳蛋白包括SEQ ID NO:2的氨基酸序列。
9.根据权利要求1至8中任一项所述的方法,其中所述AAVrh91衣壳包括衣壳蛋白,所述衣壳蛋白通过SEQ ID NO:1或3的核苷酸序列或与SEQ ID NO:1或3的核苷酸序列共享至少90%、至少95%、至少97%、至少98%或至少99%的序列的表达产生。
10.根据权利要求1至9中任一项所述的方法,其中所述AAVrh91衣壳包括衣壳蛋白,其中所述衣壳蛋白由SEQ ID NO:1或3的核苷酸序列编码。
11.根据权利要求1至10中任一项所述的方法,其中所述AAVrh91衣壳包括衣壳蛋白,所述衣壳蛋白包括:
(1)AAVrh91 vp1蛋白的异质群体,所述AAVrh91 vp1蛋白选自以下:通过从编码SEQ IDNO:2的1至736的预测的氨基酸序列的核酸序列表达产生的vp1蛋白、由SEQ ID NO:1或3产生的vp1蛋白、或由与SEQ ID NO:1或3至少70%相同的核酸序列产生的vp1蛋白,所述核酸序列编码SEQ ID NO:2的1至736的所述预测的氨基酸序列,
AAVrh91 vp2蛋白的异质群体,所述AAVrh91 vp2蛋白选自以下:通过从编码SEQ IDNO:2的至少约氨基酸138至736的预测的氨基酸序列的核酸序列表达产生的vp2蛋白、由包括SEQ ID NO:1或3的至少核苷酸412至2208的序列产生的vp2蛋白、或由与SEQ ID NO:1或3的至少核苷酸412至2208至少70%相同的核酸序列产生的vp2蛋白,所述核酸序列编码SEQID NO:2的至少约氨基酸138至736的预测的氨基酸序列,
AAVrh91 vp3蛋白的异质群体,所述AAVrh91 vp3蛋白选自以下:通过从编码SEQ IDNO:2的至少约氨基酸203至736的预测的氨基酸序列的核酸序列表达产生的vp3蛋白、由包括SEQ ID NO:1或3的至少核苷酸607至2208的序列产生的vp3蛋白、或由与SEQ ID NO:1或3的至少核苷酸607至2208至少70%相同的核酸序列产生的vp3蛋白,所述核酸序列编码SEQID NO:2的至少约氨基酸203至736的预测的氨基酸序列;和/或
(2)作为编码SEQ ID NO:2的所述氨基酸序列的核酸序列的产物的vp1蛋白的异质群体,作为编码SEQ ID NO:2的至少约氨基酸138至736的所述氨基酸序列的核酸序列的产物的vp2蛋白的异质群体,以及作为编码SEQ ID NO:2的至少氨基酸203至736的核酸序列的产物的vp3蛋白的异质群体,其中:所述vp1、vp2和vp3蛋白含有具有氨基酸修饰的亚群体,所述氨基酸修饰包括SEQ ID NO:2中的天冬酰胺-甘氨酸对中的至少两个高度脱酰胺化的天冬酰胺(N),并且任选地进一步包括包含其它脱酰胺化的氨基酸的亚群体,其中脱酰胺化引起氨基酸变化。
12.根据权利要求11所述的方法,其中编码所述衣壳蛋白的所述核酸序列是SEQ IDNO:1或3、或与SEQ ID NO:1或3至少80%或至少99%相同的编码SEQ ID NO:2的所述氨基酸序列的序列。
13.根据权利要求11或12所述的方法,其中所述核酸序列与SEQ ID NO:1或3至少80%相同。
14.一种用于产生重组AAV的重组AAV产生系统,其中所述产生系统包括:
(a)编码在位置418、547、584、588、598和/或642中的一个或多个位置处具有氨基酸取代(当与SEQ ID NO:2比对时)的AAV衣壳蛋白的核苷酸序列;
(b)适合于包装到AAV衣壳中的核酸分子,所述核酸分子包括至少一个AAV反向末端重复序列(ITR)和编码基因产物的非AAV核酸序列,所述基因产物可操作地连接到引导所述产物在宿主细胞中的表达的序列;以及
(c)足够的AAV rep功能和辅助功能,以允许将所述核酸分子包装到所述AAV衣壳中。
15.根据权利要求15所述的系统,其中(a)的所述核苷酸序列编码在所列举的位置中的一个或多个位置处具有取代的进化枝A衣壳蛋白。
16.根据权利要求14或15所述的系统,其中(a)的所述核苷酸序列编码在所列举的位置中的一个或多个位置处具有氨基酸取代的AAV1、AAVhu48R3、AAVhu48、AAVhu44、AAV.VR-355、AAV.VR-195、AAV6或AAV6.2衣壳蛋白。
17.根据权利要求14至16中任一项所述的系统,其中(a)的所述核苷酸序列编码具有一个或多个选自以下的氨基取代的衣壳蛋白的氨基酸序列:位置418处的Asp、位置547处的Asn、位置584处的Leu、位置588处的Asn、位置598处的Val和位置642处的His。
18.根据权利要求14至16中任一项所述的系统,其中(a)的所述核苷酸序列编码在Glu418、Ser547、Phe584、Ser588、Ala598和/或Asn642处具有氨基酸取代的SEQ ID NO:8(AAV1)的氨基酸序列,并且其中经编码的氨基酸序列与SEQ IN NO:8至少95%相同或至少99%相同。
19.根据权利要求14至16中任一项所述的系统,其中(a)的所述核苷酸序列编码具有一个或多个选自以下的氨基取代的SEQ ID NO:8(AAV1)的氨基酸序列:位置418处的Asp、位置547处的Asn、位置584处的Leu、位置588处的Asn、位置598处的Val和位置642处的His,并且其中经编码的氨基酸序列与SEQ IN NO:8至少95%相同或至少99%相同。
20.根据权利要求14至19中任一项所述的系统,其中所述产生系统包括人胚肾293细胞。
21.一种产生重组AAV的方法,所述方法包括培养含有以下的宿主细胞的步骤:(a)编码在位置418、547、584、588、598和642中的一个或多个位置处具有氨基酸取代(当与SEQ IDNO:2比对时)的AAV衣壳蛋白的核酸分子;(b)功能性rep基因;(c)包括AAV 5’ITR、AAV 3’ITR和转基因的迷你基因;以及(d)足够的辅助功能,以允许将所述迷你基因包装到AAV衣壳中。
22.根据权利要求21所述的方法,其中相对于未修饰的衣壳蛋白,所产生的重组AAV具有提高的产量和/或改变的细胞或组织嗜性。
23.根据权利要求21或22所述的方法,其中相对于未修饰的衣壳蛋白,所产生的重组AAV以更高水平转导CNS的细胞。
24.根据权利要求21至23中任一项所述的方法,其中(a)的核苷酸序列编码在所列举的位置中的一个或多个位置处具有取代的进化枝A衣壳蛋白。
25.根据权利要求21至24中任一项所述的方法,其中(a)的所述核苷酸序列编码具有所列举的取代中的一个或多个取代的AAV1、AAVhu48R3、AAVhu48、AAVhu44、AAV.VR-355、AAV.VR-195、AAV6或AAV6.2衣壳。
26.根据权利要求21至25中任一项所述的方法,其中(a)的所述核苷酸序列编码具有一个或多个选自以下的氨基取代的衣壳蛋白的氨基酸序列:位置418处的Asp、位置547处的Asn、位置584处的Leu、位置588处的Asn、位置598处的Val和位置642处的His。
27.根据权利要求21至26中任一项所述的方法,其中(a)的所述核苷酸序列编码在Glu418、Ser547、Phe584、Ser588、Ala598和/或Asn642处具有氨基酸取代的SEQ ID NO:8(AAV1)的氨基酸序列,并且其中经编码的氨基酸序列与SEQ IN NO:8至少95%相同或至少99%相同。
28.根据权利要求21至27中任一项所述的方法,其中(a)的所述核苷酸序列编码具有一个或多个选自以下的氨基取代的SEQ ID NO:8(AAV1)的所述氨基酸序列:位置418处的Asp、位置547处的Asn、位置584处的Leu、位置588处的Asn、位置598处的Val和位置642处的His,并且其中经编码的氨基酸序列与SEQ IN NO:8至少95%相同或至少99%相同。
29.一种用于将转基因递送到受试者的中枢神经系统(CNS)的一个或多个靶细胞的重组AAV载体,其中所述重组AAV载体包括AAVrh91衣壳和包括所述转基因的载体基因组,所述转基因可操作地连接到调控序列,所述调控序列引导所述转基因在所述CNS的所述靶细胞中的表达。
30.根据权利要求29所述的重组AAV载体,其中所述CNS的所述靶细胞是实质细胞、脉络丛细胞、室管膜细胞、星形胶质细胞和/或神经元,任选地皮质、海马体和/或纹状体的神经元。
31.根据权利要求29或所述的重组AAV载体,其中所述转基因编码分泌的基因产物。
32.根据权利要求28至30中任一项所述的重组AAV载体,其中所述AAV载体通过鞘内,任选地通过小脑延髓池内(ICM)注射施用。
33.根据权利要求28至31中任一项所述的重组AAV载体,其中所述AAV载体通过实质内施用递送。
34.一种用于在鞘内施用包括转基因的AAV载体后将所述转基因递送到受试者的肝脏的重组AAV载体,其中所述重组AAV载体包括AAVrh91衣壳和包括所述转基因的载体基因组,所述转基因可操作地连接到调控序列,所述调控序列引导所述转基因在所述肝脏的靶细胞中的表达,其中所述肝脏的交易水平相对于使用具有AAV1、AAV9和/或AAV6.2衣壳的AAV载体实现的交易水平得到提高。
35.一种用于在向受试者全身施用AAV载体后使肝脏脱靶和/或降低肝脏毒性的重组AAV载体,其中所述重组AAV载体包括AAVrh91衣壳和包括转基因的载体基因组,所述转基因可操作地连接到调控序列,所述调控序列引导所述转基因在所述肝脏的细胞中的表达,其中在施用所述AAV载体后观察到的所述肝脏的转导水平和/或肝脏毒性相对于具有AAV1、AAV8和/或AAV9衣壳的AAV载体降低。
36.根据权利要求34或35中任一项所述的重组AAV载体,其中AAV衣壳包括衣壳蛋白,所述衣壳蛋白包括SEQ ID NO:2(AAVrh91)的氨基酸序列。
37.根据权利要求34至36中任一项所述的重组AAV载体,其中所述AAV衣壳包括衣壳蛋白,所述衣壳蛋白通过SEQ ID NO:1或3的核苷酸序列或与SEQ ID NO:1或3具有至少90%、至少95%、至少97%、至少98%或至少99%同一性的序列的表达产生,并且将包括异源核酸序列的载体基因组包装到所述衣壳中。
38.根据权利要求34至37中任一项所述的重组AAV载体,其中所述AAV衣壳包括衣壳蛋白,其中所述衣壳蛋白由SEQ ID NO:1或3的核苷酸序列编码。
39.根据权利要求34至38中任一项所述的重组AAV载体,其中所述AAV衣壳包括AAV衣壳蛋白,所述AAV衣壳蛋白包括以下:
(1)AAVrh91 vp1蛋白的异质群体,所述AAVrh91 vp1蛋白选自以下:通过从编码SEQ IDNO:2的1至736的预测的氨基酸序列的核酸序列表达产生的vp1蛋白、由SEQ ID NO:1或3产生的vp1蛋白、或由与SEQ ID NO:1或3至少70%相同的核酸序列产生的vp1蛋白,所述核酸序列编码SEQ ID NO:2的1至736的所述预测的氨基酸序列,
AAVrh91 vp2蛋白的异质群体,所述AAVrh91 vp2蛋白选自以下:通过从编码SEQ IDNO:2的至少约氨基酸138至736的预测的氨基酸序列的核酸序列表达产生的vp2蛋白、由包括SEQ ID NO:1或3的至少核苷酸412至2208的序列产生的vp2蛋白、或由与SEQ ID NO:1或3的至少核苷酸412至2208至少70%相同的核酸序列产生的vp2蛋白,所述核酸序列编码SEQID NO:2的至少约氨基酸138至736的预测的氨基酸序列,
AAVrh91 vp3蛋白的异质群体,所述AAVrh91 vp3蛋白选自以下:通过从编码SEQ IDNO:2的至少约氨基酸203至736的预测的氨基酸序列的核酸序列表达产生的vp3蛋白、由包括SEQ ID NO:1或3的至少核苷酸607至2208的序列产生的vp3蛋白、或由与SEQ ID NO:1或3的至少核苷酸607至2208至少70%相同的核酸序列产生的vp3蛋白,所述核酸序列编码SEQID NO:2的至少约氨基酸203至736的预测的氨基酸序列;和/或
(2)作为编码SEQ ID NO:2的所述氨基酸序列的核酸序列的产物的vp1蛋白的异质群体,作为编码SEQ ID NO:2的至少约氨基酸138至736的所述氨基酸序列的核酸序列的产物的vp2蛋白的异质群体,以及作为编码SEQ ID NO:2的至少氨基酸203至736的核酸序列的产物的vp3蛋白的异质群体,其中:所述vp1、vp2和vp3蛋白含有具有氨基酸修饰的亚群体,所述氨基酸修饰包括SEQ ID NO:2中的天冬酰胺-甘氨酸对中的至少两个高度脱酰胺化的天冬酰胺(N),并且任选地进一步包括包含其它脱酰胺化的氨基酸的亚群体,其中脱酰胺化引起氨基酸变化。
40.根据权利要求39中任一项所述的重组AAV载体,其中编码所述蛋白质的所述核酸序列是SEQ ID NO:1或3、或与SEQ ID NO:1或3至少80%或至少99%相同的编码SEQ ID NO:2的所述氨基酸序列的序列。
41.根据权利要求39或40中任一项所述的重组AAV载体,其中所述核酸序列与SEQ IDNO:1或3至少80%相同。
CN202180070175.8A 2020-08-14 2021-08-13 新型aav衣壳和含有新型aav衣壳的组合物 Pending CN116209769A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202063065616P 2020-08-14 2020-08-14
US63/065616 2020-08-14
US202063109734P 2020-11-04 2020-11-04
US63/109734 2020-11-04
PCT/US2021/045945 WO2022036220A1 (en) 2020-08-14 2021-08-13 Novel aav capsids and compositions containing same

Publications (1)

Publication Number Publication Date
CN116209769A true CN116209769A (zh) 2023-06-02

Family

ID=77595666

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180070175.8A Pending CN116209769A (zh) 2020-08-14 2021-08-13 新型aav衣壳和含有新型aav衣壳的组合物

Country Status (11)

Country Link
US (1) US20230287451A1 (zh)
EP (1) EP4196170A1 (zh)
JP (1) JP2023537625A (zh)
KR (1) KR20230051208A (zh)
CN (1) CN116209769A (zh)
AU (1) AU2021325954A1 (zh)
CA (1) CA3188956A1 (zh)
IL (1) IL300410A (zh)
MX (1) MX2023001863A (zh)
TW (1) TW202221127A (zh)
WO (1) WO2022036220A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20240207452A1 (en) 2021-04-23 2024-06-27 The Trustees Of The University Of Pennsylvania Novel compositions with brain-specific targeting motifs and compositions containing same
IL315256A (en) * 2022-03-03 2024-10-01 The Trustees Of The Univ Of Pennsylvania AAV vectors for delivery of GLP-1 receptor agonist fusions
WO2024015966A2 (en) * 2022-07-15 2024-01-18 The Trustees Of The University Of Pennsylvania Recombinant aav having aav clade d and clade e capsids and compositions containing same
CN117801116A (zh) * 2022-09-30 2024-04-02 上海玮美基因科技有限责任公司 一种融合型新型腺相关病毒及其应用
WO2024130067A2 (en) 2022-12-17 2024-06-20 The Trustees Of The University Of Pennsylvania Recombinant aav mutant vectors with cardiac and skeletal muscle-specific targeting motifs and compositions containing same
WO2024130070A2 (en) 2022-12-17 2024-06-20 The Trustees Of The University Of Pennsylvania Recombinant aav capsids with cardiac- and skeletal muscle- specific targeting motifs and uses thereof

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6174666B1 (en) 1992-03-27 2001-01-16 The United States Of America As Represented By The Department Of Health And Human Services Method of eliminating inhibitory/instability regions from mRNA
US5478745A (en) 1992-12-04 1995-12-26 University Of Pittsburgh Recombinant viral vector system
US6221349B1 (en) 1998-10-20 2001-04-24 Avigen, Inc. Adeno-associated vectors for expression of factor VIII by target cells
US6200560B1 (en) 1998-10-20 2001-03-13 Avigen, Inc. Adeno-associated virus vectors for expression of factor VIII by target cells
NZ578982A (en) 2001-11-13 2011-03-31 Univ Pennsylvania A method of detecting and/or identifying adeno-associated virus (AAV) sequences and isolating novel sequences identified thereby
ES2975413T3 (es) 2001-12-17 2024-07-05 Univ Pennsylvania Secuencias de serotipo 8 de virus adenoasociado (AAV), vectores que las contienen y usos de las mismas
EP1486567A1 (en) * 2003-06-11 2004-12-15 Deutsches Krebsforschungszentrum Stiftung des öffentlichen Rechts Improved adeno-associated virus (AAV) vector for gene therapy
US8005620B2 (en) 2003-08-01 2011-08-23 Dna Twopointo Inc. Systems and methods for biopolymer engineering
EP2434420A3 (en) 2003-08-01 2012-07-25 Dna Twopointo Inc. Systems and methods for biopolymer engineering
EP2287323A1 (en) 2009-07-31 2011-02-23 Association Institut de Myologie Widespread gene delivery to the retina using systemic administration of AAV vectors
CA2793633A1 (en) 2010-03-29 2011-10-13 The Trustees Of The University Of Pennsylvania Pharmacologically induced transgene ablation system
FR2977562B1 (fr) 2011-07-06 2016-12-23 Gaztransport Et Technigaz Cuve etanche et thermiquement isolante integree dans une structure porteuse
WO2013155222A2 (en) 2012-04-10 2013-10-17 The Regents Of The University Of California Brain-specific enhancers for cell-based therapy
WO2015012924A2 (en) 2013-04-29 2015-01-29 The Trustees Of The University Of Pennsylvania Tissue preferential codon modified expression cassettes, vectors containing same, and use thereof
JP6741590B2 (ja) 2014-04-25 2020-08-19 ザ・トラステイーズ・オブ・ザ・ユニバーシテイ・オブ・ペンシルベニア コレステロールレベルを低下させるためのldlr変異体および組成物中でのそれらの使用

Also Published As

Publication number Publication date
EP4196170A1 (en) 2023-06-21
JP2023537625A (ja) 2023-09-04
WO2022036220A1 (en) 2022-02-17
US20230287451A1 (en) 2023-09-14
AU2021325954A1 (en) 2023-03-02
IL300410A (en) 2023-04-01
MX2023001863A (es) 2023-06-13
CA3188956A1 (en) 2022-02-17
KR20230051208A (ko) 2023-04-17
TW202221127A (zh) 2022-06-01

Similar Documents

Publication Publication Date Title
CN113853209A (zh) 新型aav衣壳和含有其的组合物
JP7406783B2 (ja) パルボウイルスベクターの高められた送達のための改変キャプシドタンパク質
CN116209769A (zh) 新型aav衣壳和含有新型aav衣壳的组合物
US20210123073A1 (en) Novel adeno-associated virus (aav) vectors, aav vectors having reduced capsid deamidation and uses therefor
EA038695B1 (ru) Способы и композиции для переноса генов по сосудистой сети
CN112543766A (zh) 抗体逃避性病毒载体
CN117042787A (zh) Aav衣壳和含有aav衣壳的组合物
JP7371954B2 (ja) ヒト肝臓への遺伝子導入のためのアデノ随伴ウイルスビリオン
JP7142815B2 (ja) ヒト肝臓への遺伝子導入のためのアデノ随伴ウイルスビリオン
JP2021097617A (ja) オルニチントランスカルバミラーゼ欠損症の治療用アデノ随伴ウイルスビリオン
WO2022224372A1 (ja) オルニチントランスカルバミラーゼ欠損症の治療用アデノ随伴ウイルスビリオン
EP4410987A1 (en) An aav9 capsid variant for targeted gene transfer

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination