CN117957325A - 衣壳变体及其使用方法 - Google Patents

衣壳变体及其使用方法 Download PDF

Info

Publication number
CN117957325A
CN117957325A CN202280057207.5A CN202280057207A CN117957325A CN 117957325 A CN117957325 A CN 117957325A CN 202280057207 A CN202280057207 A CN 202280057207A CN 117957325 A CN117957325 A CN 117957325A
Authority
CN
China
Prior art keywords
seq
gly
capsid polypeptide
compared
mutation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280057207.5A
Other languages
English (en)
Inventor
S·拉潘
H·莱维汀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dino Treatment Co
Original Assignee
Dino Treatment Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dino Treatment Co filed Critical Dino Treatment Co
Publication of CN117957325A publication Critical patent/CN117957325A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0091Purification or manufacturing processes for gene therapy compositions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14145Special targeting system for viral vectors

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Virology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

本公开部分地涉及可用于递送有效载荷的变体衣壳多肽。

Description

衣壳变体及其使用方法
相关申请的交叉引用
本申请要求于2021年6月23日提交的美国临时申请第63/214,021号的优先权,该申请在此通过引用整体并入本文。
序列表
本申请含有已经以ASCII格式电子提交的序列表,并且在此通过引用整体并入本文。创建于2022年6月15日的所述ASCII副本命名为257394_000902_ST25.txt并且大小为72,149字节。
背景技术
依赖性细小病毒,例如腺相关依赖性细小病毒,例如腺相关病毒(AAV),作为用于将各种有效载荷递送至细胞(包括在人类受试者中)的载体而受到关注。
发明内容
本公开部分地提供了改进的变体依赖性细小病毒衣壳蛋白(例如AAV2变体衣壳多肽)、如VP1、VP2和/或VP3,产生依赖性细小病毒的方法,用于其的组合物,以及由其产生的病毒颗粒。在一些实施例中,与衣壳蛋白中没有突变的病毒颗粒相比,所产生的病毒颗粒具有增加的肝脏转导。
在一些实施例中,本公开部分地涉及包含编码如本文所提供的变体衣壳蛋白的序列的核酸。在一些实施例中,依赖性细小病毒是腺相关依赖性细小病毒(AAV)。在一些实施例中,AAV是AAV2,例如变体AAV2。
在一些实施例中,本公开部分地涉及本文所述的衣壳多肽。
在一些实施例中,本公开部分地涉及一种变体衣壳多肽,其包含与SEQ ID NO:2或SEQ ID NO:3的VP1、VP2或VP3序列具有至少70、75、80、85、90、91、92、93、94、95、96、97、98、99%或100%同一性的多肽。在一些实施例中,多肽包含SEQ ID NO:1的变体,其中变体衣壳多肽包含对应于在与SEQ ID NO:1相比的35、36、37、38、39、42、51、61、70、449、450、451、452、455、456、458、459或其任意组合中的一个或多个位置处的突变的突变,任选地其中突变包括插入、缺失或取代。
在一些实施例中,本公开部分地涉及包含本文所述的核酸的依赖性细小病毒颗粒。
在一些实施例中,本公开部分地涉及包含本文所述的核酸的载体,例如质粒。
在一些实施例中,本公开部分地涉及核酸分子,该核酸分子包含SEQ ID NO:4或5的序列,其片段,或其与其具有至少70、75、80、85、90、91、92、93、94、95、96、97、98、99或100%序列同一性的变体。
在一些实施例中,本公开部分地涉及包含本文所述的核酸(例如,包含编码衣壳多肽,如VP1的序列的核酸)的依赖性细小病毒颗粒,其中编码序列包含如本文所提供的改变或突变。
在一些实施例中,本公开部分地涉及包含本文所述的核酸(例如包含编码衣壳多肽(例如VP1多肽)的序列的核酸)的载体,其中编码序列包含如本文所提供的改变或突变。
在一些实施例中,本公开部分地涉及细胞、无细胞体系或其他翻译体系,其包含本文所述的核酸或载体,该核酸或载体例如包含编码衣壳多肽(如VP1)的序列,其中衣壳多肽编码序列在编码序列中包含如本文所提供的改变或突变。在一些实施例中,细胞、无细胞体系或其他翻译体系包含本文所述的依赖性细小病毒颗粒,例如,其中该颗粒包含核酸,该核酸包含编码衣壳多肽(如VP1多肽)的序列,其中编码序列包含如本文所提供的改变或突变。
在一些实施例中,本公开部分地涉及包含本文所述的多肽的细胞、无细胞体系或其他翻译体系,其中多肽编码序列包含如本文所提供的改变或突变。在一些实施例中,细胞、无细胞体系或其他翻译体系包含本文所述的依赖性细小病毒颗粒,例如,其中该颗粒包含核酸,该核酸包含编码VP1多肽的序列,其中VP1编码序列包含如本文所提供的相应的改变或突变。
在一些实施例中,本公开部分地涉及一种将有效载荷递送至细胞的方法,该方法包括使细胞与包含本文所述的核酸的依赖性细小病毒颗粒接触。在一些实施例中,本公开部分地涉及一种将有效载荷递送至细胞的方法,该方法包括使细胞与包含本文所述的衣壳多肽的依赖性细小病毒颗粒接触。
在一些实施例中,本公开部分地涉及一种制备依赖性细小病毒颗粒的方法,该方法包括:提供细胞、无细胞体系或其他翻译体系,其包含本文所述的核酸(例如,包含编码如本文所提供的AAV2衣壳变体的序列的核酸);以及在适合于产生依赖性细小病毒颗粒的条件下培养细胞、无细胞体系或其他翻译体系,从而制备依赖性细小病毒颗粒。在一些实施例中,本公开部分地涉及一种制备本文所述的依赖性细小病毒颗粒的方法。
在一些实施例中,本公开部分地涉及一种制备依赖性细小病毒颗粒的方法,该方法包括:提供细胞、无细胞体系或其他翻译体系,其包含本文所述的多肽;以及在适合于产生依赖性细小病毒颗粒的条件下培养细胞、无细胞体系或其他翻译体系,从而制备依赖性细小病毒颗粒。在一些实施例中,本公开部分地涉及一种制备本文所述的依赖性细小病毒颗粒的方法。
在一些实施例中,本公开部分地涉及在细胞、无细胞体系或其他翻译体系中制备的依赖性细小病毒颗粒,其中该细胞、无细胞体系或其他翻译体系包含编码依赖性细小病毒的核酸,该依赖性细小病毒包含如本文所提供的衣壳变体。
在一些实施例中,本公开部分地涉及一种治疗受试者的疾病或病症的方法,该方法包括以有效治疗疾病或病症的量向受试者施用本文所述的依赖性细小病毒颗粒。
进一步参考以下编号的实施例描述本发明。
附图说明
图1A至1C。示例性AAV血清型比对的图示。仅存在于VP1多肽中的氨基酸以正常文本显示;仅存在于VP1和VP2多肽中的氨基酸以粗体显示;存在于VP1、VP2和VP3多肽中的氨基酸加下划线。
图2。针对来自实例2中描述的NHP研究中的肝脏组织样本的变体的单核RNA测序结果,报告了每个变体的独特转导事件的数量。所有结果均归一化为输入测试品中每个变体的量。标记为“VAR-09-n”的变体对应于表2中的“VAR-n”;“AAV2”是包含野生型AAV2衣壳多肽的病毒颗粒;“AAV5”是包含野生型AAV5衣壳多肽的病毒颗粒;“AAV9”是包含野生型AAV9衣壳多肽的病毒颗粒。
列举的实施例
1.一种变体衣壳多肽,其包含与SEQ ID NO:2或SEQ ID NO:3的VP1、VP2或VP3序列具有至少70、75、80、85、90、91、92、93、94、95、96、97、98、99%或100%同一性的多肽。
2.根据实施例1所述的变体衣壳多肽,其中变体是与SEQ ID NO:2或SEQ ID NO:3的多肽相同的血清型。
3.根据实施例1所述的变体衣壳多肽,其中变体与SEQ ID NO:2或SEQ ID NO:3的多肽相比是不同的血清型。
4.根据前述实施例中任一项所述的变体衣壳多肽,其中多肽包含SEQ ID NO:1的变体,其中变体衣壳多肽包含对应于在与SEQ ID NO:1相比的35、36、37、38、39、42、51、61、70、449、450、451、452、455、456、458、459或其任意组合中的一个或多个位置处的突变的突变,任选地其中突变包括插入、缺失或取代。
5.根据前述实施例中任一项所述的变体衣壳多肽,其中衣壳多肽包含对应于在与SEQ ID NO:1相比的位置35处的突变的突变,例如包含在对应于与SEQ ID NO:1相比的位置35的位置处的天冬酰胺。
6.根据前述实施例中任一项所述的变体衣壳多肽,其中衣壳多肽包含对应于在与SEQ ID NO:1相比的位置36处的突变的突变,例如包含在对应于与SEQ ID NO:1相比的位置36的位置处的谷氨酰胺。
7.根据前述实施例中任一项所述的变体衣壳多肽,其中衣壳多肽包含对应于在与SEQ ID NO:1相比的位置37处的突变的突变,例如包含在对应于与SEQ ID NO:1相比的位置37的位置处的谷氨酰胺。
8.根据前述实施例中任一项所述的变体衣壳多肽,其中衣壳多肽包含对应于在与SEQ ID NO:1相比的位置38处的突变的突变,例如包含在对应于与SEQ ID NO:1相比的位置38的位置处的赖氨酸。
9.根据前述实施例中任一项所述的变体衣壳多肽,其中衣壳多肽包含对应于在与SEQ ID NO:1相比的位置39处的突变的突变,例如包含在对应于与SEQ ID NO:1相比的位置39的位置处的谷氨酰胺。
10.根据前述实施例中任一项所述的变体衣壳多肽,其中衣壳多肽包含对应于在与SEQ ID NO:1相比的位置42处的突变的突变,例如包含在对应于与SEQ ID NO:1相比的位置42的位置处的丙氨酸。
11.根据前述实施例中任一项所述的变体衣壳多肽,其中衣壳多肽包含对应于在与SEQ ID NO:1相比的位置51处的突变的突变,例如包含在对应于与SEQ ID NO:1相比的位置51的位置处的天冬酰胺。
12.根据前述实施例中任一项所述的变体衣壳多肽,其中衣壳多肽包含对应于在与SEQ ID NO:1相比的位置61处的突变的突变,例如包含在对应于与SEQ ID NO:1相比的位置61的位置处的精氨酸。
13.根据前述实施例中任一项所述的变体衣壳多肽,其中衣壳多肽包含对应于在与SEQ ID NO:1相比的位置70处的突变的突变,例如包含在对应于与SEQ ID NO:1相比的位置70的位置处的谷氨酸。
14.根据前述实施例中任一项所述的变体衣壳多肽,其中衣壳多肽包含对应于在与SEQ ID NO:1相比的位置449处的突变的突变,例如包含在对应于与SEQ ID NO:1相比的位置449的位置处的谷氨酰胺。
15.根据前述实施例中任一项所述的变体衣壳多肽,其中衣壳多肽包含对应于在与SEQ ID NO:1相比的位置450处的突变的突变,例如包含在对应于与SEQ ID NO:1相比的位置450的位置处的丝氨酸。
16.根据前述实施例中任一项所述的变体衣壳多肽,其中衣壳多肽包含对应于在与SEQ ID NO:1相比的位置451处的突变的突变,例如包含在对应于与SEQ ID NO:1相比的位置451的位置处的甘氨酸。
17.根据前述实施例中任一项所述的变体衣壳多肽,其中衣壳多肽包含对应于在与SEQ ID NO:1相比的位置452处的突变的突变,例如包含在对应于与SEQ ID NO:1相比的位置452的位置处的甘氨酸。
18.根据前述实施例中任一项所述的变体衣壳多肽,其中衣壳多肽包含对应于在与SEQ ID NO:1相比的位置455处的突变的突变,例如包含在对应于与SEQ ID NO:1相比的位置455的位置处的丙氨酸。
19.根据前述实施例中任一项所述的变体衣壳多肽,其中衣壳多肽包含对应于在与SEQ ID NO:1相比的位置456处的突变的突变,例如包含在对应于与SEQ ID NO:1相比的位置456的位置处的丙氨酸。
20.根据前述实施例中任一项所述的变体衣壳多肽,其中衣壳多肽包含对应于在与SEQ ID NO:1相比的位置458处的突变的突变,例如包含在对应于与SEQ ID NO:1相比的位置458的位置处的天冬氨酸。
21.根据前述实施例中任一项所述的变体衣壳多肽,其中衣壳多肽包含对应于在与SEQ ID NO:1相比的位置459处的突变的突变,例如包含在对应于与SEQ ID NO:1相比的位置459的位置处的谷氨酰胺。
22.根据前述实施例中任一项所述的变体衣壳多肽,其中衣壳多肽包含对应于在与SEQ ID NO:1相比的选自35至70的任一位置或其任意组合处的突变的突变。
23.根据前述实施例中任一项所述的变体衣壳多肽,其中衣壳多肽包含对应于在与SEQ ID NO:1相比的选自449至459的任一位置或其任意组合处的突变的突变。
24.根据前述实施例中任一项所述的变体衣壳多肽,其中衣壳多肽包含对应于在与SEQ ID NO:1相比的位置35、36、37、38、39、42、51、61和70处的至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个或所有突变的突变。
25.根据前述实施例中任一项所述的变体衣壳多肽,其中衣壳多肽包含对应于在与SEQ ID NO:1相比的位置449、450、451、452、455、456、458和459处的至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个或所有突变的突变。
26.根据前述实施例中任一项所述的变体衣壳多肽,其中衣壳多肽包含与SEQ IDNO:1相比的A35N、E36Q、R37Q、H38K、K39Q、S42A、K51N、K61R和A70E中的至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个或所有突变。
27.根据前述实施例中任一项所述的变体衣壳多肽,其中所述衣壳多肽包含与SEQID NO:1相比的N449Q、T450S、P451G、S452G、T455A、T456A、S458D和R459Q中的至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个或所有突变。
28.一种变体衣壳多肽,其包含:(a)SEQ ID NO:2或SEQ ID NO:3中任一者的多肽;(b)包含SEQ ID NO:2或SEQ ID NO:3中任一者的VP2或VP3序列;(c)包含与其具有至少90%、至少95%、至少96%、至少97%、至少98%或至少99%同一性的序列的多肽,其中相对于SEQ ID NO:1,所述序列包含与SEQ ID NO:2或SEQ ID NO:3中任一者相关的突变差异中的至少一者(例如,一者、两者、三者或更多者,例如全部);或(d)相对于(a)或(b)的多肽,具有至少1个、但不超过20个、不超过19个、不超过18个、不超过17个、不超过16个、不超过15个、不超过14个、不超过13个、不超过12个、不超过12个、不超过11个、不超过10个、不超过9个、不超过8个、不超过7个、不超过6个、不超过5个、不超过4个、不超过3个或不超过2个氨基酸突变的多肽,其中相对于SEQ ID NO:1,所述多肽包含与SEQ ID NO:2或SEQ ID NO:3中任一者相关的突变差异中的至少一者(例如,一者、两者、三者或更多者,例如全部)。
29.一种包含VP1、VP2或VP3或其任意组合的变体衣壳多肽,其各自与SEQ ID NO:2或SEQ ID NO:3的多肽至少或约95、96、97、98或99%相同,任选地其中所述变体衣壳多肽包含与SEQ ID NO:2和/或SEQ ID NO:3相关的突变差异中的全部。
30.一种包含VP1、VP2或VP3或其任意组合的变体衣壳多肽,其各自具有与SEQ IDNO:2或SEQ ID NO:3的多肽相比的约1至约20个突变,任选地其中所述变体衣壳多肽包含与SEQ ID NO:2和/或SEQ ID NO:3相关的突变差异中的全部。
31.一种包含VP1、VP2或VP3或其任意组合的变体衣壳多肽,其各自具有与SEQ IDNO:2或SEQ ID NO:3的多肽相比的约1至约10个突变,任选地其中所述变体衣壳多肽包含与SEQ ID NO:2和/或SEQ ID NO:3相关的突变差异中的全部。
32.一种包含VP1、VP2或VP3或其任意组合的变体衣壳多肽,其各自具有与SEQ IDNO:2或SEQ ID NO:3的多肽相比的约1至约5个突变,任选地其中所述变体衣壳多肽包含与SEQ ID NO:2和/或SEQ ID NO:3相关的突变差异中的全部。
33.一种变体衣壳多肽,其包含SEQ ID NO:2或SEQ ID NO:3的VP1、VP2或VP3序列。
34.一种变体衣壳多肽,其由SEQ ID NO:2或SEQ ID NO:3的VP1、VP2或VP3序列组成。
35.根据前述实施例中任一项所述的变体衣壳多肽,其中变体衣壳多肽为VP1多肽、VP2多肽或VP3多肽。
36.一种核酸分子,其编码根据实施例1至35中任一项所述的衣壳变体多肽。
37.根据实施例36所述的核酸分子,其中核酸分子包含SEQ ID NO:4或SEQ ID NO:5的序列,其片段,或其与其具有至少70、75、80、85、90、91、92、93、94、95、96、97、98、99或100%序列同一性的变体。
38.根据实施例37所述的核酸分子,其中其片段编码VP2衣壳多肽或VP3衣壳多肽。
39.一种病毒颗粒(例如,腺相关病毒(“AAV”)颗粒),其包含根据实施例1至35中任一项所述的变体衣壳多肽或包含由根据实施例36至38中任一项所述的核酸分子编码的变体衣壳多肽。
40.根据实施例39所述的病毒颗粒,其包含核酸,该核酸包含有效载荷(例如,异源转基因)和一个或多个调控元件。
41.一种病毒颗粒,其包含根据实施例1至35中任一项所述的变体衣壳多肽或包含由根据实施例36至38中任一项所述的核酸分子编码的变体衣壳多肽,其中该病毒颗粒相对于野生型AAV2(例如,包含SEQ ID NO:1的或由SEQ ID NO:6编码的衣壳多肽的病毒颗粒)表现出增加的肝脏(例如肝细胞)转导,例如,如在小鼠或在NHP中测量的,例如,如本文所述。
42.根据实施例36至38中任一项所述的核酸分子,其中核酸分子是双链或单链的,并且其中核酸分子是线性或环状的,例如其中核酸分子为质粒。
43.一种产生包含变体衣壳多肽的病毒颗粒的方法,所述方法包括将根据实施例36至38或42中任一项所述的核酸分子引入细胞(例如HEK293细胞)中,以及从中收获所述病毒颗粒。
44.一种将有效载荷(例如,核酸)递送至细胞的方法,该方法包括使细胞与依赖性细小病毒颗粒接触,该依赖性细小病毒颗粒包含根据实施例1至35中任一项所述的变体衣壳多肽和有效载荷,或使该细胞与根据实施例39至41中任一项所述的病毒颗粒接触。
45.根据实施例44所述的方法,其中细胞为肝脏细胞,例如肝细胞。
46.一种将有效载荷(例如,核酸)递送至受试者的方法,该方法包括向受试者施用包含根据实施例1至35中任一项所述的变体衣壳多肽以及有效载荷的依赖性细小病毒颗粒,或向受试者施用根据实施例39至41中任一项所述的病毒颗粒。
47.根据实施例45所述的方法,其中病毒颗粒将有效载荷递送至肝脏,例如递送至肝细胞。
48.根据实施例1至35中任一项所述的变体衣壳多肽、根据实施例39至41中任一项所述的病毒颗粒或根据实施例43至47中任一项所述的方法,其中该病毒颗粒(例如,包含变体衣壳多肽的病毒颗粒)与包含由SEQ ID NO:1编码的衣壳多肽的病毒颗粒相比,以有效载荷的增加的转导或增加的表达将有效载荷递送至肝脏(例如,递送至肝细胞),任选地其中全身性、例如静脉内递送病毒颗粒。
49.根据实施例47所述的变体衣壳多肽、病毒颗粒或方法,其中与包含SEQ ID NO:1的衣壳多肽的病毒颗粒相比,转导的增加是至少2倍、4倍、8倍、16倍、32倍、64倍、100倍、或150倍、200倍或250倍,任选地其中所述增加是在病毒颗粒的全身性、例如静脉内施用之后。
50.一种治疗受试者的疾病或病症的方法,该方法包括以有效治疗疾病或病症的量向受试者施用依赖性细小病毒颗粒,其中该依赖性细小病毒颗粒是包含根据实施例1至35中任一项所述的变体衣壳多肽的颗粒,或包含由根据实施例36至38或42中任一项所述的核酸分子编码的变体衣壳多肽,或是根据实施例39至41中任一项所述的病毒颗粒,任选地其中所述增加是在病毒颗粒的全身性、例如静脉内施用之后。
51.一种细胞、无细胞体系或其他翻译体系,其包含根据实施例1至35中任一项所述的衣壳多肽、根据实施例36至38或42中任一项所述的核酸分子、或根据实施例39至41中任一项所述的病毒颗粒。
52.一种制备依赖性细小病毒(例如,腺相关依赖性细小病毒(AAV)颗粒的方法,所述方法包括:
提供细胞、无细胞体系或其他翻译体系,其包含根据实施例36至38或42中任一项所述的核酸;并且
在适合于产生依赖性细小病毒颗粒的条件下培养细胞、无细胞体系或其他翻译体系,
从而制备依赖性细小病毒颗粒。
53.根据实施例52所述的方法,其中细胞、无细胞体系或其他翻译体系包含第二核酸分子,并且所述第二核酸分子的至少一部分被包装在依赖性细小病毒颗粒中。
54.根据实施例52所述的方法,其中第二核酸包含有效载荷,例如编码治疗产品的异源核酸序列。
55.根据实施例52至54中任一项所述的方法,其中根据实施例36至38或42中任一项所述的核酸分子介导依赖性细小病毒颗粒的产生,该依赖性细小病毒颗粒不包含根据实施例36至38或42中任一项所述的核酸或其片段。
56.根据实施例52至55中任一项所述的方法,其中根据实施例36至38或42中任一项所述的核酸分子以相比由其他类似生产体系中的编码SEQ ID NO:1(例如,SEQ ID NO:6)的核酸介导的生产水平的至少10%、至少20%、至少50%、至少100%、至少200%或更高的水平介导依赖性细小病毒颗粒的产生。
57.一种组合物,例如药物组合物,其包含根据实施例39至41中任一项所述的病毒颗粒或通过根据实施例43或52至56中任一项所述的方法产生的病毒颗粒,以及药学上可接受的载体。
58.根据实施例1至35中任一项所述的变体衣壳多肽、根据实施例36至38或42中任一项所述的核酸分子、或根据实施例39至41中任一项所述的病毒颗粒,其用于治疗受试者的疾病或病症。
59.根据实施例1至35中任一项所述的变体衣壳多肽、根据实施例36至38或42中任一项所述的核酸分子、或根据实施例39至41中任一项所述的病毒颗粒,其用于制造用于治疗受试者的疾病或病症的药物。
具体实施方式
本公开部分地涉及变体衣壳多肽和编码其的核酸分子,其可以并入并用于产生依赖性细小病毒颗粒。在一些实施例中,与没有变体衣壳多肽的依赖性细小病毒颗粒相比,颗粒具有增加的肝脏转导,该肝脏转导可用于以肝脏中更高的转导效率将所关注的转基因或分子递送至肝脏。因此,本文提供变体衣壳多肽、编码其的核酸分子、包含变体衣壳多肽的病毒颗粒、以及使用其的方法。
定义
一个/种(a/an)、该/所述(the):如本文所使用的,除非上下文另有明确指示,否则单数形式“一个/种(a/an)”和“该/所述(the)”包含复数指示物。
约、大约:如本文所使用的,术语“约”和“大约”通常意指在给定测量的性质或精度的情况下测量的量的可接受的误差程度。示例性的误差程度在给定值或值范围的百分之15(%)内,通常在10%内,并且更通常在5%内。
依赖性细小病毒衣壳:如本文所使用的,术语“依赖性细小病毒衣壳”是指包含依赖性细小病毒多肽的组装的病毒衣壳。在一些实施例中,依赖性细小病毒衣壳是功能性依赖性细小病毒衣壳,例如,完全折叠和/或组装、有能力感染靶细胞、或保持稳定(例如,折叠/组装和/或有能力感染靶细胞)至少持续阈值时间。
依赖性细小病毒颗粒:如本文所使用的,术语“依赖性细小病毒颗粒”是指包含依赖性细小病毒多肽和包装的核酸(例如包含有效载荷、依赖性细小病毒基因组的一种或多种组分(例如,完整的依赖性细小病毒基因组),或两者)的组装的病毒衣壳。在一些实施例中,依赖性细小病毒颗粒是功能性依赖性细小病毒颗粒,例如,包含所需的有效载荷、完全折叠和/或组装、有能力感染靶细胞、或保持稳定(例如,折叠/组装和/或有能力感染靶细胞)至少持续阈值时间。
依赖性细小病毒X颗粒/衣壳:如本文所使用的,术语“依赖性细小病毒X颗粒/衣壳”是指包含至少一种衍生自天然存在的依赖性细小病毒X物种的多肽或多肽编码核酸序列的依赖性细小病毒颗粒/衣壳。例如,依赖性细小病毒B颗粒是指包含至少一种衍生自天然存在的依赖性细小病毒B序列的多肽或多肽编码核酸序列的依赖性细小病毒颗粒。如此上下文中所使用的,衍生自意指与所讨论的序列具有至少70、75、80、85、90、91、92、93、94、95、96、97、98、99或100%同一性。相应地,如本文所使用的,AAVX颗粒/衣壳是指包含至少一种衍生自天然存在的AAV X血清型的多肽或多肽编码核酸序列的AAV颗粒/衣壳。例如,AAV2颗粒是指包含至少一种衍生自天然存在的AAV2序列的多肽或多肽编码核酸序列的AAV颗粒。
外源:如本文所使用的,术语“外源”是指存在于环境中(例如,存在于核酸、多肽或细胞中)的特征、序列或组分,其在所述环境中并非天然存在。例如,包含编码多肽的ORF的核酸序列可以包含外源起始密码子或新起始密码子(例如,翻译起始密码子),如本文所提供的。以这种方式使用术语外源意指编码在该位置包含所讨论的起始密码子的多肽的ORF不是天然存在的,例如不存在于AAV2中,例如不存在于SEQ ID NO:6中。在一些实施例中,外源起始密码子可以替换内源起始密码子。在一些实施例中,外源起始密码子可以替换不被宿主细胞识别为起始密码子的密码子。技术人员将容易理解,当在第一ORF中提供序列时,序列(例如,起始密码子)可以是外源的(例如,它自然地不包含所讨论的位点的起始密码子),但在第二ORF中可能不是外源的(例如,它自然地包含所讨论的位点的该特定起始密码子)。
功能性:如本文所使用的,关于依赖性细小病毒衣壳的多肽组分(例如,Cap(例如,VP1、VP2和/或VP3)或Rep),术语“功能性”是指提供该多肽组分的天然存在形式(例如,当存在于宿主细胞中时)的活性的至少50、60、70、80、90或100%的多肽。例如,功能性VP1多肽可以稳定地折叠并组装成依赖性细小病毒衣壳(例如,其有能力用于包装和/或分泌)。如本文所使用的,关于依赖性细小病毒衣壳或颗粒,“功能性”是指包含一种或多种以下生产特征的衣壳或颗粒:包含所需的有效载荷、完全折叠和/或组装、有能力感染靶细胞,或保持稳定(例如,折叠/组装和/或有能力感染靶细胞)至少持续阈值时间。
核酸:如本文所使用的,在其最广泛意义上,术语“核酸”是指并入或可以并入寡核苷酸链中的任何化合物和/或物质。在一些实施例中,核酸是经由磷酸二酯键并入或可以经由磷酸二酯键并入寡核苷酸链中的化合物和/或物质。如将从上下文显而易见,在一些实施例中,“核酸”是指个别核酸单体(例如,核苷酸和/或核苷);在一些实施例中,“核酸”是指包含个别核酸单体的寡核苷酸链或包含许多个别核酸单体的较长的多核苷酸链。在一些实施例中,“核酸”为RNA或包括RNA;在一些实施例中,“核酸”为DNA或包括DNA。在一些实施例中,核酸是一个或多个天然核酸残基、包括一个或多个天然核酸残基或由一个或多个天然核酸残基组成。在一些实施例中,核酸是一个或多个核酸类似物、包括一个或多个核酸类似物或由一个或多个核酸类似物组成。在一些实施例中,核酸是一个或多个经修饰、合成或非天然存在的核苷酸,包括一个或多个经修饰、合成或非天然存在的核苷酸,或由一个或多个经修饰、合成或非天然存在的核苷酸组成。在一些实施例中,核酸类似物与核酸的不同之处在于其不利用磷酸二酯主链。例如,在一些实施例中,核酸是一个或多个“肽核酸”、包括一个或多个“肽核酸”或由一个或多个“肽核酸”组成,其在本领域中是已知的并且在主链中具有代替磷酸二酯键的肽键,被视为处于本发明的范围内。或者或另外,在一些实施例中,核酸具有一个或多个硫代磷酸酯和/或5'-N-氨基亚磷酸酯键而非磷酸二酯键。在一些实施例中,核酸具有对如RNA或蛋白质等功能性基因产物进行编码的核苷酸序列。在一些实施例中,核酸为部分或完全单链的;在一些实施例中,核酸为部分或完全双链的。
起始密码子:如本文所使用的,术语“起始密码子”是指被宿主细胞识别为起始翻译位点的任何密码子(例如,介导可检测的翻译起始的位点)。不希望受理论束缚,起始密码子的强度不同,其中强起始密码子更强烈地促进翻译起始,而弱起始密码子不太强烈地促进翻译起始。规范起始密码子是ATG,它编码氨基酸甲硫氨酸,但许多非规范起始密码子也能被宿主细胞识别。
变体:如本文所使用的,“变体衣壳多肽”是指与参考序列(例如SEQ ID NO:1)不同的多肽。变体可以例如包含突变(例如取代、缺失或插入)。在一些实施例中,变体与参考序列是约或至少70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同。在一些实施例中,参考序列是包含SEQ ID NO:1的多肽。
衣壳多肽和编码其的核酸
本公开部分地涉及包含编码变体衣壳多肽的序列的核酸,该变体衣壳多肽与参考序列相比包含突变(插入、缺失或取代)。在一些实施例中,参考序列是SEQ ID NO:1。本公开部分地涉及变体衣壳多肽,与SEQ ID NO:1相比,该变体衣壳多肽包含具有一个或多个突变的SEQ ID NO:1。本公开进一步部分地涉及变体衣壳多肽,其包含用对应于本文所述的突变的一个或多个突变修饰的除了SEQ ID NO:1之外的参考序列。与参考序列相比,突变可以是例如插入、缺失或取代。在一些实施例中,参考序列是SEQ ID NO:1。
在一些实施例中,变体衣壳多肽包含与SEQ ID NO:2或SEQ ID NO:3的VP1、VP2或VP3序列具有至少70、75、80、85、90、91、92、93、94、95、96、97、98、99%或100%同一性的多肽,例如,如本文所述。
在一些实施例中,变体衣壳多肽包含SEQ ID NO:1的变体,其中变体衣壳多肽包含对应于在与SEQ ID NO:1相比的35、36、37、38、39、42、51、61、70、449、450、451、452、455、456、458、459或其任意组合中的一个或多个位置处的突变的突变,任选地其中突变包括插入、缺失或取代,例如,如本文所述。
在一些实施例中,变体衣壳多肽包含对应于在与SEQ ID NO:1相比的位置35、36、37、38、39、42、51、61、70、449、450、451、452、455、456、458、459或其任意组合处的突变的突变。
在一些实施例中,变体衣壳多肽包含对应于在与SEQ ID NO:1相比的位置35处的突变的突变。
在一些实施例中,变体衣壳多肽包含对应于在与SEQ ID NO:1相比的位置36处的突变的突变。
在一些实施例中,变体衣壳多肽包含对应于在与SEQ ID NO:1相比的位置37处的突变的突变。
在一些实施例中,变体衣壳多肽包含对应于在与SEQ ID NO:1相比的位置38处的突变的突变。
在一些实施例中,变体衣壳多肽包含对应于在与SEQ ID NO:1相比的位置39处的突变的突变。
在一些实施例中,变体衣壳多肽包含对应于在与SEQ ID NO:1相比的位置42处的突变的突变。
在一些实施例中,变体衣壳多肽包含对应于在与SEQ ID NO:1相比的位置51处的突变的突变。
在一些实施例中,变体衣壳多肽包含对应于在与SEQ ID NO:1相比的位置61处的突变的突变。
在一些实施例中,变体衣壳多肽包含对应于在与SEQ ID NO:1相比的位置70处的突变的突变。
在一些实施例中,变体衣壳多肽包含对应于在与SEQ ID NO:1相比的位置449处的突变的突变。
在一些实施例中,变体衣壳多肽包含对应于在与SEQ ID NO:1相比的位置450处的突变的突变。
在一些实施例中,变体衣壳多肽包含对应于在与SEQ ID NO:1相比的位置451处的突变的突变。
在一些实施例中,变体衣壳多肽包含对应于在与SEQ ID NO:1相比的位置452处的突变的突变。
在一些实施例中,变体衣壳多肽包含对应于在与SEQ ID NO:1相比的位置455处的突变的突变。
在一些实施例中,变体衣壳多肽包含对应于在与SEQ ID NO:1相比的位置456处的突变的突变。
在一些实施例中,变体衣壳多肽包含对应于在与SEQ ID NO:1相比的位置458处的突变的突变。
在一些实施例中,变体衣壳多肽包含对应于在与SEQ ID NO:1相比的位置459处的突变的突变。
在一些实施例中,取代是天然存在的氨基酸。在一些实施例中,取代是天冬酰胺。在一些实施例中,位置35处的取代是根据SEQ ID NO:1的A35N。在一些实施例中,在对应于SEQ ID NO:1的A35的位置处的取代是在除SEQ ID NO:1之外的参考衣壳序列中在对应于SEQ ID NO:1的A35的位置处的天冬酰胺的取代,例如,如本文所述。
在一些实施例中,变体衣壳多肽包含对应于在与SEQ ID NO:1相比的位置36处的突变的突变。在一些实施例中,取代是天然存在的氨基酸。在一些实施例中,取代是谷氨酰胺。在一些实施例中,位置36处的取代是根据SEQ ID NO:1的E36Q。在一些实施例中,在对应于SEQ ID NO:1的E36的位置处的取代是在除SEQ ID NO:1之外的参考衣壳序列中在对应于SEQ ID NO:1的E36的位置处的谷氨酰胺的取代,例如,如本文所述。
在一些实施例中,变体衣壳多肽包含对应于在与SEQ ID NO:1相比的位置37处的突变的突变。在一些实施例中,取代是天然存在的氨基酸。在一些实施例中,取代是谷氨酰胺。在一些实施例中,位置37处的取代是根据SEQ ID NO:1的R37Q。在一些实施例中,在对应于SEQ ID NO:1的R37的位置处的取代是在除SEQ ID NO:1之外的参考衣壳序列中在对应于SEQ ID NO:1的R37的位置处的谷氨酰胺的取代,例如,如本文所述。
在一些实施例中,变体衣壳多肽包含对应于在与SEQ ID NO:1相比的位置38处的突变的突变。在一些实施例中,取代是天然存在的氨基酸。在一些实施例中,取代是赖氨酸。在一些实施例中,位置38处的取代是根据SEQ ID NO:1的H38K。在一些实施例中,在对应于SEQ ID NO:1的H38的位置处的取代是在除SEQ ID NO:1之外的参考衣壳序列中在对应于SEQ ID NO:1的H38的位置处的赖氨酸的取代,例如,如本文所述。
在一些实施例中,变体衣壳多肽包含对应于在与SEQ ID NO:1相比的位置39处的突变的突变。在一些实施例中,取代是天然存在的氨基酸。在一些实施例中,取代是谷氨酰胺。在一些实施例中,位置38处的取代是根据SEQ ID NO:1的K39Q。在一些实施例中,在对应于SEQ ID NO:1的K39的位置处的取代是在除SEQ ID NO:1之外的参考衣壳序列中在对应于SEQ ID NO:1的K39的位置处的谷氨酰胺的取代,例如,如本文所述。
在一些实施例中,变体衣壳多肽包含对应于在与SEQ ID NO:1相比的位置42处的突变的突变。在一些实施例中,取代是天然存在的氨基酸。在一些实施例中,取代是丙氨酸。在一些实施例中,位置42处的取代是根据SEQ ID NO:1的S42A。在一些实施例中,在对应于SEQ ID NO:1的S42的位置处的取代是在除SEQ ID NO:1之外的参考衣壳序列中在对应于SEQ ID NO:1的S42的位置处的丙氨酸的取代,例如,如本文所述。
在一些实施例中,变体衣壳多肽包含对应于在与SEQ ID NO:1相比的位置51处的突变的突变。在一些实施例中,取代是天然存在的氨基酸。在一些实施例中,取代是天冬酰胺。在一些实施例中,位置51处的取代是根据SEQ ID NO:1的K51N。在一些实施例中,在对应于SEQ ID NO:1的K51的位置处的取代是在除SEQ ID NO:1之外的参考衣壳序列中在对应于SEQ ID NO:1的K51的位置处的天冬酰胺的取代,例如,如本文所述。
在一些实施例中,变体衣壳多肽包含对应于在与SEQ ID NO:1相比的位置61处的突变的突变。在一些实施例中,取代是天然存在的氨基酸。在一些实施例中,取代是精氨酸。在一些实施例中,位置61处的取代是根据SEQ ID NO:1的K61R。在一些实施例中,在对应于SEQ ID NO:1的K61的位置处的取代是在除SEQ ID NO:1之外的参考衣壳序列中在对应于SEQ ID NO:1的K61的位置处的精氨酸的取代,例如,如本文所述。
在一些实施例中,变体衣壳多肽包含对应于在与SEQ ID NO:1相比的位置70处的突变的突变。在一些实施例中,取代是天然存在的氨基酸。在一些实施例中,取代是谷氨酸。在一些实施例中,位置70处的取代是根据SEQ ID NO:1的A70E。在一些实施例中,在对应于SEQ ID NO:1的A70的位置处的取代是在除SEQ ID NO:1之外的参考衣壳序列中在对应于SEQ ID NO:1的A70的位置处的谷氨酸的取代,例如,如本文所述。
在一些实施例中,变体衣壳多肽包含对应于在与SEQ ID NO:1相比的位置449处的突变的突变。在一些实施例中,取代是天然存在的氨基酸。在一些实施例中,取代是谷氨酰胺。在一些实施例中,位置449处的取代是根据SEQ ID NO:1的N449Q。在一些实施例中,在对应于SEQ ID NO:1的N449的位置处的取代是在除SEQ ID NO:1之外的参考衣壳序列中在对应于SEQ ID NO:1的N449的位置处的谷氨酰胺的取代,例如,如本文所述。
在一些实施例中,变体衣壳多肽包含对应于在与SEQ ID NO:1相比的位置450处的突变的突变。在一些实施例中,取代是天然存在的氨基酸。在一些实施例中,取代是丝氨酸。在一些实施例中,位置450处的取代是根据SEQ ID NO:1的T450S。在一些实施例中,在对应于SEQ ID NO:1的T450的位置处的取代是在除SEQ ID NO:1之外的参考衣壳序列中在对应于SEQ ID NO:1的T450的位置处的丝氨酸的取代,例如,如本文所述。
在一些实施例中,变体衣壳多肽包含对应于在与SEQ ID NO:1相比的位置451处的突变的突变。在一些实施例中,取代是天然存在的氨基酸。在一些实施例中,取代是甘氨酸。在一些实施例中,位置451处的取代是根据SEQ ID NO:1的P451G。在一些实施例中,在对应于SEQ ID NO:1的P451的位置处的取代是在除SEQ ID NO:1之外的参考衣壳序列中在对应于SEQ ID NO:1的P451的位置处的甘氨酸的取代,例如,如本文所述。
在一些实施例中,变体衣壳多肽包含对应于在与SEQ ID NO:1相比的位置452处的突变的突变。在一些实施例中,取代是天然存在的氨基酸。在一些实施例中,取代是甘氨酸。在一些实施例中,位置452处的取代是根据SEQ ID NO:1的S452G。在一些实施例中,在对应于SEQ ID NO:1的S452的位置处的取代是在除SEQ ID NO:1之外的参考衣壳序列中在对应于SEQ ID NO:1的S452的位置处的甘氨酸的取代,例如,如本文所述。
在一些实施例中,变体衣壳多肽包含对应于在与SEQ ID NO:1相比的位置455处的突变的突变。在一些实施例中,取代是天然存在的氨基酸。在一些实施例中,取代是丙氨酸。在一些实施例中,位置455处的取代是根据SEQ ID NO:1的T455A。在一些实施例中,在对应于SEQ ID NO:1的T455的位置处的取代是在除SEQ ID NO:1之外的参考衣壳序列中在对应于SEQ ID NO:1的T455的位置处的丙氨酸的取代,例如,如本文所述。
在一些实施例中,变体衣壳多肽包含对应于在与SEQ ID NO:1相比的位置456处的突变的突变。在一些实施例中,取代是天然存在的氨基酸。在一些实施例中,取代是丙氨酸。在一些实施例中,位置456处的取代是根据SEQ ID NO:1的T456A。在一些实施例中,在对应于SEQ ID NO:1的T456的位置处的取代是在除SEQ ID NO:1之外的参考衣壳序列中在对应于SEQ ID NO:1的T456的位置处的丙氨酸的取代,例如,如本文所述。
在一些实施例中,变体衣壳多肽包含对应于在与SEQ ID NO:1相比的位置458处的突变的突变。在一些实施例中,取代是天然存在的氨基酸。在一些实施例中,取代是天冬氨酸。在一些实施例中,位置458处的取代是根据SEQ ID NO:1的S458D。在一些实施例中,在对应于SEQ ID NO:1的S458的位置处的取代是在除SEQ ID NO:1之外的参考衣壳序列中在对应于SEQ ID NO:1的S458的位置处的天冬氨酸的取代,例如,如本文所述。
在一些实施例中,变体衣壳多肽包含对应于在与SEQ ID NO:1相比的位置459处的突变的突变。在一些实施例中,取代是天然存在的氨基酸。在一些实施例中,取代是谷氨酰胺。在一些实施例中,位置459处的取代是根据SEQ ID NO:1的R459Q。在一些实施例中,在对应于SEQ ID NO:1的R459的位置处的取代是在除SEQ ID NO:1之外的参考衣壳序列中在对应于SEQ ID NO:1的R459的位置处的谷氨酰胺的取代,例如,如本文所述。
在一些实施例中,变体衣壳多肽包含对应于在与SEQ ID NO:1相比(对应于)的选自35至70的任一位置或其任意组合处的突变的突变,例如,如本文所述。在一些实施例中,变体衣壳多肽包含对应于在与SEQ ID NO:1相比(对应于)的选自35至70的任一位置或其任意组合处的至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个或至少9个突变的突变。
在一些实施例中,变体衣壳多肽包含对应于在与SEQ ID NO:1相比(对应于)的选自449至459的任一位置或其任意组合处的突变的突变,例如,如本文所述。在一些实施例中,变体衣壳多肽包含对应于在与SEQ ID NO:1相比(对应于)的选自449至459的任一位置或其任意组合处的至少2个、至少3个、至少4个、至少5个、至少6个、至少7个或至少8个突变的突变。
在一些实施例中,变体衣壳多肽包含对应于在与SEQ ID NO:1相比的位置35、36、37、38、39、42、51、61和70处的突变的突变,例如,如本文所述。在一些实施例中,衣壳多肽包含对应于在与SEQ ID NO:1相比的位置35、36、37、38、39、42、51、61和70处的突变的一个或多个突变(例如,至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个或所有突变),例如,如本文所述。在一些实施例中,衣壳多肽包含对应于在与SEQ ID NO:1相比的位置35、36、37、38、39、42、51、61和70处的突变的至少2个突变,例如,如本文所述。在一些实施例中,衣壳多肽包含对应于在与SEQ ID NO:1相比的位置35、36、37、38、39、42、51、61和70处的突变的至少3个突变,例如,如本文所述。在一些实施例中,衣壳多肽包含对应于在与SEQID NO:1相比的位置35、36、37、38、39、42、51、61和70处的突变的至少4个突变,例如,如本文所述。在一些实施例中,衣壳多肽包含对应于在与SEQ ID NO:1相比的位置35、36、37、38、39、42、51、61和70处的突变的至少5个突变,例如,如本文所述。在一些实施例中,衣壳多肽包含对应于在与SEQ ID NO:1相比的位置35、36、37、38、39、42、51、61和70处的突变的至少6个突变,例如,如本文所述。在一些实施例中,衣壳多肽包含对应于在与SEQ ID NO:1相比的位置35、36、37、38、39、42、51、61和70处的突变的至少7个突变,例如,如本文所述。在一些实施例中,衣壳多肽包含对应于在与SEQ ID NO:1相比的位置35、36、37、38、39、42、51、61和70处的突变的至少8个突变,例如,如本文所述。
在一些实施例中,变体衣壳多肽包含对应于在与SEQ ID NO:1相比的位置449、450、451、452、455、456、458和459处的突变的突变,例如,如本文所述。在一些实施例中,衣壳多肽包含对应于在与SEQ ID NO:1相比的位置449、450、451、452、455、456、458和459处的突变的一个或多个突变(例如至少2个、至少3个、至少4个、至少5个、至少6个、至少7个或所有突变),例如,如本文所述。在一些实施例中,衣壳多肽包含对应于在与SEQ ID NO:1相比的位置449、450、451、452、455、456、458和459处的突变的至少2个突变,例如,如本文所述。在一些实施例中,衣壳多肽包含对应于在与SEQ ID NO:1相比的位置449、450、451、452、455、456、458和459处的突变的至少3个突变,例如,如本文所述。在一些实施例中,衣壳多肽包含对应于在与SEQ ID NO:1相比的位置449、450、451、452、455、456、458和459处的突变的至少4个突变,例如,如本文所述。在一些实施例中,衣壳多肽包含对应于在与SEQ ID NO:1相比的位置449、450、451、452、455、456、458和459处的突变的至少5个突变,例如,如本文所述。在一些实施例中,衣壳多肽包含对应于在与SEQ ID NO:1相比的位置449、450、451、452、455、456、458和459处的突变的至少6个突变,例如,如本文所述。在一些实施例中,衣壳多肽包含对应于在与SEQ ID NO:1相比的位置449、450、451、452、455、456、458和459处的突变的至少7个突变,例如,如本文所述。
在一些实施例中,变体衣壳多肽包含与SEQ ID NO:1相比的A35N、E36Q、R37Q、H38K、K39Q、S42A、K51N、K61R和A70E的突变。
在一些实施例中,衣壳多肽包含对应于与SEQ ID NO:1相比的A35N、E36Q、R37Q、H38K、K39Q、S42A、K51N、K61R和A70E的突变的一个或多个突变(例如,至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个或所有突变)。在一些实施例中,衣壳多肽包含对应于与SEQ ID NO:1相比的A35N、E36Q、R37Q、H38K、K39Q、S42A、K51N、K61R和A70E的突变的至少2个突变。在一些实施例中,衣壳多肽包含对应于与SEQ ID NO:1相比的A35N、E36Q、R37Q、H38K、K39Q、S42A、K51N、K61R和A70E的突变的至少3个突变。在一些实施例中,衣壳多肽包含对应于与SEQ ID NO:1相比的A35N、E36Q、R37Q、H38K、K39Q、S42A、K51N、K61R和A70E的突变的至少4个突变。在一些实施例中,衣壳多肽包含对应于与SEQ ID NO:1相比的A35N、E36Q、R37Q、H38K、K39Q、S42A、K51N、K61R和A70E的突变的至少5个突变。在一些实施例中,衣壳多肽包含对应于与SEQ ID NO:1相比的A35N、E36Q、R37Q、H38K、K39Q、S42A、K51N、K61R和A70E的突变的至少6个突变。在一些实施例中,衣壳多肽包含对应于与SEQ ID NO:1相比的A35N、E36Q、R37Q、H38K、K39Q、S42A、K51N、K61R和A70E的突变的至少7个突变。在一些实施例中,衣壳多肽包含对应于与SEQ ID NO:1相比的A35N、E36Q、R37Q、H38K、K39Q、S42A、K51N、K61R和A70E的突变的至少8个突变。
在一些实施例中,变体衣壳多肽包含与SEQ ID NO:1相比的N449Q、T450S、P451G、S452G、T455A、T456A、S458D和R459Q的突变。
在一些实施例中,衣壳多肽包含对应于与SEQ ID NO:1相比的N449Q、T450S、P451G、S452G、T455A、T456A、S458D和R459Q的突变的一个或多个突变(例如至少2个、至少3个、至少4个、至少5个、至少6个、至少7个或所有突变)。在一些实施例中,衣壳多肽包含对应于与SEQ ID NO:1相比的N449Q、T450S、P451G、S452G、T455A、T456A、S458D和R459Q的突变的至少2个突变。在一些实施例中,衣壳多肽包含对应于与SEQ ID NO:1相比的N449Q、T450S、P451G、S452G、T455A、T456A、S458D和R459Q的突变的至少3个突变。在一些实施例中,衣壳多肽包含对应于与SEQ ID NO:1相比的N449Q、T450S、P451G、S452G、T455A、T456A、S458D和R459Q的突变的至少4个突变。在一些实施例中,衣壳多肽包含对应于与SEQ ID NO:1相比的N449Q、T450S、P451G、S452G、T455A、T456A、S458D和R459Q的突变的至少5个突变。在一些实施例中,衣壳多肽包含对应于与SEQ ID NO:1相比的N449Q、T450S、P451G、S452G、T455A、T456A、S458D和R459Q的突变的至少6个突变。在一些实施例中,衣壳多肽包含对应于与SEQID NO:1相比的N449Q、T450S、P451G、S452G、T455A、T456A、S458D和R459Q的突变的至少7个突变。
在一些实施例中,本公开提供了衣壳多肽(和编码所述衣壳多肽的核酸),该衣壳多肽包含与表2的任何变体衣壳多肽相关的突变差异中的至少1个,或者包含对应于与表2的任何变体衣壳多肽相关的突变差异的至少1个突变。在一些实施例中,本公开提供了衣壳多肽(和编码所述衣壳多肽的核酸),该衣壳多肽包含与表2的任何变体衣壳多肽相关的至少2个突变差异,或者包含对应于与表2的任何变体衣壳多肽相关的2个突变差异的至少2个突变。在一些实施例中,本公开提供了衣壳多肽(和编码所述衣壳多肽的核酸),该衣壳多肽包含与表2的任何变体衣壳多肽相关的至少3个突变差异,或者包含对应于与表2的任何变体衣壳多肽相关的3个突变差异的至少3个突变。在一些实施例中,本公开提供了衣壳多肽(和编码所述衣壳多肽的核酸),该衣壳多肽包含与表2的任何变体衣壳多肽相关的至少4个突变差异,或者包含对应于与表2的任何变体衣壳多肽相关的4个突变差异的至少4个突变。在一些实施例中,本公开提供了衣壳多肽(和编码所述衣壳多肽的核酸),该衣壳多肽包含与表2的任何变体衣壳多肽相关的至少5个突变差异,或者包含对应于与表2的任何变体衣壳多肽相关的5个突变差异的至少5个突变。在一些实施例中,本公开提供了衣壳多肽(和编码所述衣壳多肽的核酸),该衣壳多肽包含与表2的任何变体衣壳多肽相关的至少6个突变差异,或者包含对应于与表2的任何变体衣壳多肽相关的6个突变差异的至少6个突变。在一些实施例中,本公开提供了衣壳多肽(和编码所述衣壳多肽的核酸),该衣壳多肽包含与表2的任何变体衣壳多肽相关的至少7个突变差异,或者包含对应于与表2的任何变体衣壳多肽相关的7个突变差异的至少7个突变。在一些实施例中,本公开提供了衣壳多肽(和编码所述衣壳多肽的核酸),该衣壳多肽包含与表2的任何变体衣壳多肽相关的至少8个突变差异,或者包含对应于与表2的任何变体衣壳多肽相关的8个突变差异的至少8个突变。在一些实施例中,本公开提供了衣壳多肽(和编码所述衣壳多肽的核酸),该衣壳多肽包含与表2的任何变体衣壳多肽相关的至少9个突变差异,或者包含对应于与表2的任何变体衣壳多肽相关的9个突变差异的至少9个突变。在一些实施例中,本公开提供了衣壳多肽(和编码所述衣壳多肽的核酸),该衣壳多肽包含与表2的任何变体衣壳多肽相关的全部突变差异,或者包含对应于与表2的任何变体衣壳多肽相关的突变差异中的全部的突变。
在任何上述方面,应当理解,在上述的变体衣壳多肽中,在指定了与表2的任何变体衣壳多肽的突变差异相关或对应的多个突变差异的情况下,该突变可以选自与该变体衣壳多肽相关的突变差异中的任一者。因此,例如,对于具有4个突变差异的变体(出于该实例的目的,每个突变差异用字母“A”、“B”、“C”和“D”标记),当变体衣壳包含突变差异中的1个时,它可以是A、B、C或D;同样地,当变体衣壳包含突变差异中的2个时,这两个可以是例如A和B、A和C、A和D、B和C、B和D、或C和D;同样地,当变体包含突变差异中的3个时,这3个可以是例如A和B和C、A和B和D、A和C和D、或B和C和D;同样地,当变体包含突变差异中的4个时,这4个可以是例如A和B和C和D。技术人员将理解表2的每个变体衣壳多肽的2-8或2-9个突变差异的可能组合的表(最多为表2的变体衣壳多肽的突变差异的总数)可以使用常规技术产生,并且VAR-1或VAR-2中的每一者的此类表以其整体并入本文。此类表可以例如使用来自Python中的“itertools”包的“combinations”方法来生成,此类方法在此通过引用整体并入本文。
在一些实施例中,变体衣壳多肽包含:(a)SEQ ID NO:2或SEQ ID NO:3中任一者的多肽;(b)包含SEQ ID NO:2或SEQ ID NO:3中任一者的VP2或VP3序列;(c)包含与其具有至少90%、至少95%、至少96%、至少97%、至少98%或至少99%同一性的序列的多肽,其中相对于SEQ ID NO:1,所述序列包含与SEQ ID NO:2或SEQ ID NO:3中任一者相关的突变差异中的至少一者(例如,一者、两者、三者或更多者,例如全部);或(d)相对于(a)或(b)的多肽,具有至少1个、但不超过9个、不超过8个、不超过7个、不超过6个、不超过5个、不超过3个或不超过2个氨基酸突变的多肽,其中相对于SEQ ID NO:1,所述多肽包含与SEQ ID NO:2或SEQID NO:3中任一者相关的突变差异中的至少一者(例如,一者、两者、三者或更多者,例如全部)。
在一些实施例中,核酸分子编码如本文提供的衣壳多肽。在一些实施例中,核酸分子编码衣壳多肽,该衣壳多肽与如本文提供的衣壳多肽至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同。
在一些实施例中,提供的衣壳多肽包含与如本文提供的衣壳多肽至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的衣壳多肽。
在一些实施例中,衣壳多肽或用于%同一性目的的参考多肽包含SEQ ID NO:2或SEQ ID NO:3的序列。
在一些实施例中,变体衣壳多肽包含VP1、VP2或VP3或其任意组合,其各自与SEQID NO:2或SEQ ID NO:3的多肽至少或约95、96、97、98或99%相同,任选地其中所述变体衣壳多肽包含与SEQ ID NO:2和/或SEQ ID NO:3相关的突变差异中的全部。
在一些实施例中,变体衣壳多肽包含VP1、VP2或VP3或其任意组合,其各自具有与SEQ ID NO:2或SEQ ID NO:3的多肽相比的约1至约20个突变,任选地其中所述变体衣壳多肽包含与SEQ ID NO:2和/或SEQ ID NO:3相关的突变差异中的全部。
在一些实施例中,变体衣壳多肽包含VP1、VP2或VP3或其任意组合,其各自具有与SEQ ID NO:2或SEQ ID NO:3的多肽相比的约1至约10个突变,任选地其中所述变体衣壳多肽包含与SEQ ID NO:2和/或SEQ ID NO:3相关的突变差异中的全部。
在一些实施例中,变体衣壳多肽包含VP1、VP2或VP3或其任意组合,其各自具有与SEQ ID NO:2或SEQ ID NO:3的多肽相比的约1至约5个突变,任选地其中所述变体衣壳多肽包含与SEQ ID NO:2和/或SEQ ID NO:3相关的突变差异中的全部。
在一些实施例中,变体衣壳多肽包含SEQ ID NO:2或SEQ ID NO:3的VP1、VP2或VP3序列。在一些实施例中,变体衣壳多肽由SEQ ID NO:2或SEQ ID NO:3的VP1、VP2或VP3序列组成。
在一些实施例中,变体衣壳多肽包含VP1多肽、VP2多肽或VP3多肽。
在一些实施例中,衣壳多肽是VP1衣壳多肽。在实施例中,衣壳多肽是VP2衣壳多肽。在实施例中,衣壳多肽是VP3衣壳多肽。就参考序列SEQ ID NO:1而言,VP1衣壳多肽包含SEQ ID NO:1的氨基酸1-735。就参考序列SEQ ID NO:1而言,VP2衣壳多肽包含SEQ ID NO:1的氨基酸138-735。就参考序列SEQ ID NO:1而言,VP3衣壳多肽包含SEQ ID NO:1的氨基酸203-735。
在一些实施例中,衣壳多肽或用于%同一性目的的参考多肽包含SEQ ID NO:2或3的序列。在一些实施例中,衣壳多肽或用于%同一性目的的参考多肽包含SEQ ID NO:2的序列。在一些实施例中,衣壳多肽或用于%同一性目的的参考多肽包含SEQ ID NO:3的序列。
在一些实施例中,核酸分子或用于%同一性目的的参考核酸分子包含SEQ ID NO:4或5的核苷酸序列。在一些实施例中,核酸分子或用于%同一性目的的参考核酸分子包含SEQ ID NO:4的核苷酸序列。在一些实施例中,核酸分子或用于%同一性目的的参考核酸分子包含SEQ ID NO:5的核苷酸序列。
在一些实施例中,核酸分子或用于%同一性目的的参考核酸分子包含SEQ ID NO:4或5的核苷酸序列,该核苷酸序列编码SEQ ID NO:2或3的序列。在一些实施例中,核酸分子或用于%同一性目的的参考核酸分子包含SEQ ID NO:4的核苷酸序列,该核苷酸序列编码SEQ ID NO:2的序列。在一些实施例中,核酸分子或用于%同一性目的的参考核酸分子包含SEQ ID NO:5的核苷酸序列,该核苷酸序列编码SEQ ID NO:3的序列。
在一些实施例中,衣壳多肽或用于%同一性目的的参考多肽包含SEQ ID NO:2或3的序列,该序列由SEQ ID NO:4或5的核苷酸序列编码。在一些实施例中,衣壳多肽或用于%同一性目的的参考多肽包含SEQ ID NO:2的序列。在一些实施例中,衣壳多肽或用于%同一性目的的参考多肽包含SEQ ID NO:2的序列,该序列由SEQ ID NO:4的核苷酸序列编码。在一些实施例中,编码包含SEQ ID NO:2的序列的衣壳多肽的核酸,具有SEQ ID NO:4的序列。在一些实施例中,衣壳多肽或用于%同一性目的的参考多肽包含SEQ ID NO:3的序列。在一些实施例中,衣壳多肽或用于%同一性目的的参考多肽包含SEQ ID NO:3的序列,该序列由SEQ ID NO:5的核苷酸序列编码。在一些实施例中,编码包含SEQ ID NO:3的序列的衣壳多肽的核酸,具有SEQ ID NO:5的序列。
在一些实施例中,核酸分子包含与本文所述的核酸分子(例如与SEQ ID NO:4或SEQ ID NO:5中的任一者)至少80%、至少85%、至少90%、至少91%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同的序列。在一些实施例中,核酸或其片段编码VP2衣壳多肽或VP3衣壳多肽。
在一些实施例中,衣壳多肽包含如下序列:该序列包括与VAR-1和/或VAR-2中的任一者(例如,如表2所示)相关的突变中的一个、两个、三个、四个、五个、六个(如果存在)、七个(如果存在)、八个(如果存在)或九个(如果存在)。在一些实施例中,衣壳多肽包含如下序列:该序列包括对应于与VAR-1和/或VAR-2中的任一者(例如,如表2所示)相关的突变的一个、两个、三个、四个、五个、六个(如果存在)、七个(如果存在)、八个(如果存在)或九个(如果存在)突变。在一些实施例中,衣壳多肽在其他方面与参考衣壳多肽序列(例如,如本文所述,例如与SEQ ID NO:1)至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同。在一些实施例中,衣壳多肽在其他方面与参考衣壳多肽序列(例如,如本文所述,例如与SEQ ID NO:1)100%相同。
在一些实施例中,衣壳多肽包含如下序列:该序列包括与VAR-1和/或VAR-2中任一者相关的突变差异中的全部(例如,如表2所示),并且该序列进一步包括相对于SEQ ID NO:1的不超过30个、不超过20个、不超过10个、不超过9个、不超过8个、不超过7个、不超过6个、不超过5个、不超过4个、不超过3个、不超过2个或不超过1个另外的突变。
在一些实施例中,衣壳多肽包含如下序列:该序列包括对应于与VAR-1和/或VAR-2中任一者相关的突变差异中的全部(例如,如表2所示)的突变,并且该序列进一步包括相对于除了SEQ ID NO:1之外的参考序列的不超过30个、不超过20个、不超过10个、不超过9个、不超过8个、不超过7个、不超过6个、不超过5个、不超过4个、不超过3个、不超过2个或不超过1个另外的突变,例如,如本文所述。
表1列出了关于包含变体衣壳多肽的示例性变体依赖性细小病毒颗粒的信息,其关于所述非限制性示例性变体的肝脏转导和生物分布特性以及生产特征。表2中提供了衣壳多肽和编码其的核酸分子的示例性序列。
表1.如实例1中所述的测量的包含变体衣壳多肽的示例性变体依赖性细小病毒(例如AVV)颗粒的转导(在静脉内(“IV”)施用后)、病毒产生和生物分布。取代被标记为n###N,其中“N”是最终氨基酸,“n”是参考氨基酸并且“###”是SEQ ID NO:1的参考氨基酸位置;缺失被标记为n###-,其中“-”表示在参考序列SEQ ID NO:1的位置“###”处“n”的缺失;插入被标记为###_Naa_###_(n)y,其中“###”是参考序列SEQ ID NO:1中插入发生在其之间的氨基酸位置,“Naa”是指插入的长度(具有“N”个氨基酸)并且“(n)y”提供插入的序列)。每个个别突变差异(例如,在行内,在第7列中的引号(‘’)中的每个突变)和此类个别突变差异的组合有时在本文中被称为“与VAR-X相关的突变”,其中VAR-X是“名称列”中列出的变体标识符。
表4.相对于包含野生型AAV2的衣壳多肽(例如SEQ ID NO:1的衣壳多肽)或野生型AAV5的衣壳多肽(例如,SEQ ID NO:7的衣壳多肽)的比较病毒颗粒,根据实例2对非人灵长类动物IV施用后测量的包含VAR-1和VAR-2的衣壳多肽的病毒颗粒的肝脏生物分布和转导。所有生物分布和转导值均为相对于通过相同施用途径递送的指定比较物的log2。
/>
表2.本文所述的衣壳变体的氨基酸序列、代表性核酸序列以及与SEQ ID NO:1相比的突变差异。
/>
/>
/>
/>
/>
/>
在一些实施例中,核酸分子编码与如表2所提供的VP1、VP2或VP3序列具有至少70、75、80、85、90、91、92、93、94、95、96、97、98、99%或100%同一性的衣壳多肽,并且任选地包括与表2的变体衣壳多肽中的一者相关的突变中的至少一者,例如全部。在一些实施例中,核酸分子编码与SEQ ID NO:2的VP1、VP2或VP3序列具有至少70、75、80、85、90、91、92、93、94、95、96、97、98、99%或100%同一性的衣壳多肽,并且任选地包括与表2的VAR-2相关的突变中的至少一者,例如全部。在一些实施例中,核酸分子编码与SEQ ID NO:3的VP1、VP2或VP3序列具有至少70、75、80、85、90、91、92、93、94、95、96、97、98、99%或100%同一性的衣壳多肽,并且任选地包括与表2的VAR-1相关的突变中的至少一者,例如全部。
在实施例中,核酸分子包括编码本文所述的变体衣壳多肽的序列。
变体衣壳(对应位置)
本文所述的衣壳多肽序列的突变是相对于参考序列(例如SEQ ID NO:1)内的位置和/或位置处的氨基酸来描述的。因此,在一些实施例中,本文所述的衣壳多肽是参考序列(例如,SEQ ID NO:1)的变体衣壳多肽,例如包括包含与参考衣壳多肽序列(例如,参考衣壳多肽VP1、VP2和/或VP3序列),例如SEQ ID NO:1(或其中包含的VP2或VP3序列)至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%同一性的衣壳多肽并且包括本文所述的一个或多个突变,例如与根据表2的VAR-1和/或VAR-2中的任一者相关的突变。
本领域技术人员应当理解,且不受理论的束缚,参考序列内的每个氨基酸位置对应于其他参考衣壳多肽(如衍生自具有不同血清型的依赖性细小病毒的衣壳多肽)的序列内的位置。在一些实施例中,参考衣壳多肽是AAV2衣壳多肽。使用本领域已知的序列比对工具来鉴定此类对应位置。特别优选的序列比对工具是Clustal Omega(Sievers F.等人,Mol.Syst.Biol.7:359,2011,DOI:10.1038/msb.2011.75,其通过引用整体并入本文)。示例性参考衣壳多肽的比对显示于图1A至1C中。因此,在一些实施例中,本发明的变体衣壳多肽包括参考衣壳多肽的变体,该参考衣壳多肽的变体在对应于相对于不同的参考衣壳多肽的本文所述的突变的位置的位置处,在此类参考衣壳多肽中,包含本文所述的一个或多个突变。因此,例如,相对于SEQ ID NO:1描述为XnnnY的突变(其中X是SEQ ID NO:1中位置nnn处存在的氨基酸并且Y是该位置处的氨基酸突变,例如本文所述的),本公开提供了变体衣壳多肽,该变体衣壳多肽包含与除了SEQ ID NO:1(或其中包含的VP2或VP3序列)的参考衣壳多肽序列(例如,参考衣壳多肽VP1、VP2和/或VP3序列)至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%同一性,例如,如本文所述,并且该变体衣壳多肽进一步包含在对应于SEQ ID NO:1的位置nnn的位置处的所公开的突变(例如,在新的变体衣壳多肽序列中对应于SEQ ID NO:1的位置nnn的位置处包含Y)。如上所述,使用序列比对工具,如例如上述clustal omega工具来确定此类对应位置。图1A至1C中提供了示例性已知AAV血清型的对应氨基酸位置的实例。在一些实施例中,变体是AAV2衣壳多肽的变体,其可被称为“变体AAV2衣壳多肽”。
因此,在实施例中,本公开提供了衣壳多肽序列,其是除SEQ ID NO:1之外的参
考序列(例如,除如本文所述的SEQ ID NO:1之外的参考序列)的变体,其包括对应于本文所述的突变的一个或多个突变。在实施例中,此类变体包括对应于与根据表2的VAR-1和/或VAR-2中任一者相关的所有突变的突变。
如本文所使用的,如用于涉及序列(如氨基酸或核酸序列)中的位置的术语“对应于”,可以用于涉及整个衣壳多肽或多核苷酸序列,如包含VP1、VP2和VP3多肽的衣壳多肽的全长序列,或编码其的核酸分子。在一些实施例中,术语“对应于”可用于涉及衣壳多肽的区域或结构域。例如,对应于参考衣壳多肽的VP1部分中的位置的位置可以对应于变体衣壳多肽的多肽的VP1部分。因此,当比对两个序列以确定位置是否对应于另一个位置时,可以使用全长多肽或者可以使用结构域(区域)来确定位置是否对应于特定位置。在一些实施例中,区域是VP1多肽。在一些实施例中,区域是VP2多肽。在一些实施例中,区域是VP3多肽。在一些实施例中,当参考多肽是AAV的某种血清型的野生型序列(例如,全长或区域)时,变体多肽可以是具有与参考序列(例如,全长或区域)相比在此类对应位置处进行的突变的相同血清型。在一些实施例中,变体衣壳多肽与参考序列相比是不同的血清型。
本文所述的变体衣壳多肽任选地是本领域已知的参考衣壳血清型的变体(例如,包含参考衣壳多肽)。此类参考AAV血清型(和相关参考衣壳多肽)的非限制性实例包括:AAV1、AAVrh10、AAV-DJ、AAV-DJ8、AAV5、AAVPHP.B(PHP.B)、AAVPHP.A(PHP.A)、AAVG2B-26、AAVG2B-13、AAVTH1.1-32、AAVTH1.1-35、AAVPHP.B2(PHP.B2)、AAVPHP.B3(PHP.B3)、AAVPHP.N/PHP.B-DGT、AAVPHP.B-EST、AAVPHP.B-GGT、AAVPHP.B-ATP、AAVPHP.B-ATT-T、AAVPHP.B-DGT-T、AAVPHP.B-GGT-T、AAVPHP.B-SGS、AAVPHP.B-AQP、AAVPHP.B-QQP、AAVPHP.B-SNP(3)、AAVPHP.B-SNP、AAVPHP.B-QGT、AAVPHP.B-NQT、AAVPHP.B-EGS、AAVPHP.B-SGN、AAVPHP.B-EGT、AAVPHP.B-DST、AAVPHP.B-DST、AAVPHP.B-STP、AAVPHP.B-PQP、AAVPHP.B-SQP、AAVPHP.B-QLP、AAVPHP.B-TMP、AAVPHP.B-TTP、AAVPHP.S/G2A12、AAVG2A15/G2A3(G2A3)、AAVG2B4(G2B4)、AAVG2B5(G2B5)、PHP.S、AAV2、AAV2G9、AAV3、AAV3a、AAV3b、AAV3-3、AAV4、AAV4-4、AAV6、AAV6.1、AAV6.2、AAV6.1.2、AAV7、AAV7.2、AAV8、AAV9.11、AAV9.13、AAV9、AAV9 K449R(或K449R AAV9)、AAV9.16、AAV9.24、AAV9.45、AAbiodisV9.47、AAV9.61、AAV9.68、AAV9.84、AAV9.9、AAV10、AAV11、AAV12、AAV16.3、AAV24.1、AAV27.3、AAV42.12、AAV42-1b、AAV42-2、AAV42-3a、AAV42-3b、AAV42-4、AAV42-5a、AAV42-5b、AAV42-6b、AAV42-8、AAV42-10、AAV42-11、AAV42-12、AAV42-13、AAV42-15、
{GOODW-23044-CNPT/01912824v1}33AAV42-aa、AAV43-1、AAV43-12、AAV43-20、AAV43-21、AAV43-23、AAV43-25、AAV43-5、AAV44.1、AAV44.2、AAV44.5、AAV223.1、AAV223.2、AAV223.4、AAV223.5、AAV223.6、AAV223.7、AAV1-7/rh.48、AAV1-8/rh.49、AAV2-15/rh.62、AAV2-3/rh.61、AAV2-4/rh.50、AAV2-5/rh.51、AAV3.1/hu.6、AAV3.1/hu.9、AAV3-9/rh.52、AAV3-11/rh.53、AAV4-8/r11.64、AAV4-9/rh.54、AAV4-19/rh.55、AAV5-3/rh.57、AAV5-22/rh.58、AAV7.3/hu.7、AAV16.8/hu.10、AAV16.12/hu.11、AAV29.3/bb.1、AAV29.5/bb.2、AAV106.1/hu.37、AAV114.3/hu.40、AAV127.2/hu.41、AAV127.5/hu.42、AAV128.3/hu.44、AAV130.4/hu.48、AAV145.1/hu.53、AAV145.5/hu.54、AAV145.6/hu.55、AAV161.10/hu.60、AAV161.6/hu.61、AAV33.12/hu.17、AAV33.4/hu.15、AAV33.8/hu.16、AAV52/hu.19、AAV52.1/hu.20、AAV58.2/hu.25、AAVA3.3、AAVA3.4、AAVA3.5、AAVA3.7、AAVC1、AAVC2、AAVC5、AAVF3、AAVF5、AAVH2、AAVrh.72、AAVhu.8、AAVrh.68、AAVrh.70、AAVpi.1、AAVpi.3、AAVpi.2、AAVrh.60、AAVrh.44、AAVrh.65、AAVrh.55、AAVrh.47、AAVrh.69、AAVrh.45、AAVrh.59、AAVhu.12、AAVH6、AAVH-1/hu.1、AAVH-5/hu.3、AAVLG-10/rh.40、AAVLG-4/rh.38、AAVLG-9/hu.39、AAVN721-8/rh.43、AAVCh.5、AAVCh.5R1、AAVcy.2、AAVcy.3、AAVcy.4、AAVcy.5、AAVCy.5R1、AAVCy.5R2、AAVCy.5R3、AAVCy.5R4、AAVcy.6、AAVhu.1、AAVhu.2、AAVhu.3、AAVhu.4、AAVhu.5、AAVhu.6、AAVhu.7、AAVhu.9、AAVhu.10、AAVhu.11、AAVhu.13、AAVhu.15、AAVhu.16、AAVhu.17、AAVhu.18、AAVhu.20、AAVhu.21、AAVhu.22、AAVhu.23.2、AAVhu.24、AAVhu.25、AAVhu.27、AAVhu.28、AAVhu.29、AAVhu.29R、AAVhu.31、AAVhu.32、AAVhu.34、AAVhu.35、AAVhu.37、AAVhu.39、AAVhu.40、AAVhu.41、AAVhu.42、AAVhu.43、AAVhu.44、AAVhu.44R1、AAVhu.44R2、AAVhu.44R3、AAVhu.45、AAVhu.46、AAVhu.47、AAVhu.48、AAVhu.48R1、AAVhu.48R2、AAVhu.48R3、AAVhu.49、AAVhu.51、AAVhu.52、AAVhu.54、AAVhu.55、AAVhu.56、AAVhu.57、AAVhu.58、AAVhu.60、AAVhu.61、AAVhu.63、AAVhu.64、AAVhu.66、AAVhu.67、AAVhu.14/9、AAVhu.t 19、AAVrh.2、AAVrh.2R、AAVrh.8、AAVrh.8R、AAVrh.10、AAVrh.12、AAVrh.13、AAVrh.13R、AAVrh.14、AAVrh.17、AAVrh.18、AAVrh.19、AAVrh.20、AAVrh.21、AAVrh.22、AAVrh.23、AAVrh.24、AAVrh.25、AAVrh.31、AAVrh.32、AAVrh.33、AAVrh.34、AAVrh.35、AAVrh.36、AAVrh.37、AAVrh.37R2、AAVrh.38、AAVrh.39、AAVrh.40、AAVrh.46、AAVrh.48、AAVrh.48.1、AAVrh.48.1.2、AAVrh.48.2、AAVrh.49、AAVrh.51、AAVrh.52、AAVrh.53、AAVrh.54、AAVrh.56、AAVrh.57、AAVrh.58、AAVrh.61、AAVrh.64、AAVrh.64R1、AAVrh.64R2、AAVrh.67、AAVrh.73、AAVrh.74(也称为AAVrh74)、AAVrh8R、AAVrh8R A586R突变体、AAVrh8R R533A突变体、AAAV、BAAV、山羊AAV、牛AAV、AAVhE1.1、AAVhEr1.5、AAVhER1.14、AAVhEr1.8、AAVhEr1.16、AAVhEr1.18、AAVhEr1.35、AAVhEr1.7、AAVhEr1.36、AAVhEr2.29、AAVhEr2.4、AAVhEr2.16、AAVhEr2.30、AAVhEr2.31、AAVhEr2.36、AAVhER1.23、AAVhEr3.1、AAV2.5T、AAV-PAEC、AAV-LK01、AAV-LK02、AAV-LK03、AAV-LK04、AAV-LK05、AAV-LK06、AAV-LK07、AAV-LK08、AAV-LK09、AAV-LK10、AAV-LK11、AAV-LK12、AAV-LK13、AAV-LK14、AAV-LK15、AAV-LK16、AAV-LK17、AAV-LK18、AAV-LK19、AAV-PAEC2、AAV-PAEC4、AAV-PAEC6、AAV-PAEC7、AAV-PAEC8、AAV-PAEC11、AAV-PAEC12、AAV-2-pre-miRNA-101、AAV-8h、AAV-8b、AAV-h、AAV-b、AAV SM 10-2、AAV Shuffle 100-1、AAVShuffle 100-3、AAV Shuffle 100-7、AAV Shuffle 10-2、AAV Shuffle 10-6、AAV Shuffle10-8、AAV Shuffle 100-2、AAV SM 10-1、AAV SM 10-8、AAV SM 100-3、AAV SM 100-10、BNP61 AAV、BNP62 AAV、BNP63AAV、AAVrh.50、AAVrh.43、AAVrh.62、AAVrh.48、AAVhu.19、AAVhu.11、AAVhu.53、AAV4-8/rh.64、AAVLG-9/hu.39、AAV54.5/hu.23、AAV54.2/hu.22、AAV54.7/hu.24、AAV54.1/hu.21、AAV54.4R/hu.27、AAV46.2/hu.28、AAV46.6/hu.29、AAV128.1/hu.43、真型AAV(ttAAV)、UPENN AAV 10、日本AAV 10血清型、AAV CBr-7.1、AAVCBr-7.10、AAV CBr-7.2、AAV CBr-7.3、AAV CBr-7.4、AAV CBr-7.5、AAV CBr-7.7、AAV CBr-7.8、AAV CBr-B7.3、AAV CBr-B7.4、AAV CBr-E1、AAV CBr-E2、AAV CBr-E3、AAV CBr-E4、AAVCBr-E5、AAV CBr-e5、AAV CBr-E6、AAV CBr-E7、AAV CBr-E8、AAV CHt-1、AAV CHt-2、AAVCHt-3、AAV CHt-6.1、AAV CHt-6.10、AAV CHt-6.5、AAV CHt-6.6、AAV CHt-6.7、AAV CHt-6.8、AAV CHt-P1、AAV CHt-P2、AAV CHt-P5、AAV CHt-P6、AAV CHt-P8、AAV CHt-P9、AAVCKd-1、AAV CKd-10、AAV CKd-2、AAV CKd-3、AAV CKd-4、AAV CKd-6、AAV CKd-7、AAV CKd-8、AAV CKd-B1、AAV CKd-B2、AAV CKd-B3、AAV CKd-B4、AAV CKd-B5、AAV CKd-B6、AAV CKd-B7、AAV CKd-B8、AAV CKd-H1、AAV CKd-H2、AAV CKd-H3、AAV CKd-H4、AAV CKd-H5、AAV CKd-H6、AAV CKd-N3、AAV CKd-N4、AAV CKd-N9、AAV CLg-F1、AAV CLg-F2、AAV CLg-F3、AAV CLg-F4、AAV CLg-F5、AAV CLg-F6、AAV CLg-F7、AAV CLg-F8、AAV CLv-1、AAV CLv1-1、AAV Clv1-10、AAV CLv1-2、AAV CLv-12、AAV CLv1-3、AAV CLv-13、AAV CLv1-4、AAV Clv1-7、AAV Clv1-8、AAV Clv1-9、AAV CLv-2、AAV CLv-3、AAV CLv-4、AAV CLv-6、AAV CLv-8、AAV CLv-D1、AAVCLv-D2、AAV CLv-D3、AAV CLv-D4、AAV CLv-D5、AAV CLv-D6、AAV CLv-D7、AAV CLv-D8、AAVCLv-E1、AAV CLv-K1、AAV CLv-K3、AAV CLv-K6、AAV CLv-L4、AAV CLv-L5、AAV CLv-L6、AAVCLv-M1、AAV CLv-M11、AAV CLv-M2、AAV CLv-M5、AAV CLv-M6、AAV CLv-M7、AAV CLv-M8、AAVCLv-M9、AAV CLv-R1、AAV CLv-R2、AAV CLv-R3、AAV CLv-R4、AAV CLv-R5、AAV CLv-R6、AAVCLv-R7、AAV CLv-R8、AAV CLv-R9、AAV CSp-1、AAV CSp-10、AAV CSp-11、AAV CSp-2、AAVCSp-3、AAV CSp-4、AAV CSp-6、AAV CSp-7、AAV CSp-8、AAV CSp-8.10、AAV CSp-8.2、AAVCSp-8.4、AAV CSp-8.5、AAV CSp-8.6、AAV CSp-8.7、AAV CSp-8.8、AAV CSp-8.9、AAV CSp-9、AAV.hu.48R3、AAV.VR-355、AAV3B、AAV4、AAV5、AAVF1/HSC1、AAVF11/HSC11、AAVF12/HSC12、AAVF13/HSC13、AAVF14/HSC14、AAVF15/HSC15、AAVF16/HSC16、AAVF17/HSC17、AAVF2/HSC2、AAVF3/HSC3、AAVF4/HSC4、AAVF5/HSC5、AAVF6/HSC6、AAVF7/HSC7、AAVF8/HSC8、和/或AAVF9/HSC9、7m8、Spark100、AAVMYO及其变体。
在一些实施例中,参考AAV衣壳序列包含AAV2序列。在一些实施例中,参考AAV衣壳序列包含AAV5序列。在一些实施例中,参考AAV衣壳序列包含AAV8序列。在一些实施例中,参考AAV衣壳序列包含AAV9序列。在一些实施例中,参考AAV衣壳序列包含AAVrh74序列。尽管不希望受理论束缚,但应当理解,参考AAV衣壳序列包含VP1区域。在某些实施例中,参考AAV衣壳序列包含VP1、VP2和/或VP3区域,或其任意组合。参考VP1序列可以被认为与参考AAV衣壳序列同义。
SEQ ID NO:1(野生型AAV2)的示例性参考序列如下:
MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADG VGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDW QRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMV PQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRT NTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMA SHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGNRQAATADVNTQGV LPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTG QVSVEIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL(SEQ ID NO:1)。
除非另有说明,否则SEQ ID NO:1是参考序列。在上述序列中,VP1、VP2和VP3中发现的序列加下划线(例如,VP3衣壳多肽包括对应于SEQ ID NO:1的氨基酸203-735的氨基酸,例如由其组成),VP1和VP2两者中发现的序列以粗体显示(例如,VP2衣壳多肽包括对应于SEQ ID NO:1的氨基酸138-735的序列,例如由其组成),并且没有加下划线或粗体的序列仅在VP1中发现(例如,VP1衣壳多肽包括对应于SEQ ID NO:1的氨基酸1-735的氨基酸,例如由其组成)。
编码SEQ ID NO:1的示例性核酸序列是SEQ ID NO:6:
ATGGCTGCCGATGGTTATCTTCCAGATTGGCTCGAGGACACTCTCTCTGAAGGAATAAGACAGTGGTGGAAGCTCAAACCTGGCCCACCACCACCAAAGCCCGCAGAGCGGCATAAGGACGACAGCAGGGGTCTTGTGCTTCCTGGGTACAAGTACCTCGGACCCTTCAACGGACTCGACAAGGGAGAGCCGGTCAACGAGGCAGACGCCGCGGCCCTCGAGCACGACAAAGCCTACGACCGGCAGCTCGACAGCGGAGACAACCCGTACCTCAAGTACAACCACGCCGACGCGGAGTTTCAGGAGCGCCTTAAAGAAGATACGTCTTTTGGGGGCAACCTCGGACGAGCAGTCTTCCAGGCGAAAAAGAGGGTTCTTGAACCTCTGGGCCTGGTTGAGGAACCTGTTAAGACGGCTCCGGGAAAAAAGAGGCCGGTAGAGCACTCTCCTGTGGAGCCAGACTCCTCCTCGGGAACCGGAAAGGCGGGCCAGCAGCCTGCAAGAAAAAGATTGAATTTTGGTCAGACTGGAGACGCAGACTCAGTACCTGACCCCCAGCCTCTCGGACAGCCACCAGCAGCCCCCTCTGGTCTGGGAACTAATACGATGGCTACAGGCAGTGGCGCACCAATGGCAGACAATAACGAGGGCGCCGACGGAGTGGGTAATTCCTCGGGAAATTGGCATTGCGATTCCACATGGATGGGCGACAGAGTCATCACCACCAGCACCCGAACCTGGGCCCTGCCCACCTACAACAACCACCTCTACAAACAAATTTCCAGCCAATCAGGAGCCTCGAACGACAATCACTACTTTGGCTACAGCACCCCTTGGGGGTATTTTGACTTCAACAGATTCCACTGCCACTTTTCACCACGTGACTGGCAAAGACTCATCAACAACAACTGGGGATTCCGACCCAAGAGACTCAACTTCAAGCTCTTTAACATTCAAGTCAAAGAGGTCACGCAGAATGACGGTACGACGACGATTGCCAATAACCTTACCAGCACGGTTCAGGTGTTTACTGACTCGGAGTACCAGCTCCCGTACGTCCTCGGCTCGGCGCATCAAGGATGCCTCCCGCCGTTCCCAGCAGACGTCTTCATGGTGCCACAGTATGGATACCTCACCCTGAACAACGGGAGTCAGGCAGTAGGACGCTCTTCATTTTACTGCCTGGAGTACTTTCCTTCTCAGATGCTGCGTACCGGAAACAACTTTACCTTCAGCTACACTTTTGAGGACGTTCCTTTCCACAGCAGCTACGCTCACAGCCAGAGTCTGGACCGTCTCATGAATCCTCTCATCGACCAGTACCTGTATTACTTGAGCAGAACAAACACTCCAAGTGGAACCACCACGCAGTCAAGGCTTCAGTTTTCTCAGGCCGGAGCGAGTGACATTCGGGACCAGTCTAGGAACTGGCTTCCTGGACCCTGTTACCGCCAGCAGCGAGTATCAAAGACATCTGCGGATAACAACAACAGTGAATACTCGTGGACTGGAGCTACCAAGTACCACCTCAATGGCAGAGACTCTCTGGTGAATCCGGGCCCGGCCATGGCAAGCCACAAGGACGATGAAGAAAAGTTTTTTCCTCAGAGCGGGGTTCTCATCTTTGGGAAGCAAGGCTCAGAGAAAACAAATGTGGACATTGAAAAGGTCATGATTACAGACGAAGAGGAAATCAGGACAACCAATCCCGTGGCTACGGAGCAGTATGGTTCTGTATCTACCAACCTCCAGAGAGGCAACAGACAAGCAGCTACCGCAGATGTCAACACACAAGGCGTTCTTCCAGGCATGGTCTGGCAGGACAGAGATGTGTACCTTCAGGGGCCCATCTGGGCAAAGATTCCACACACGGACGGACATTTTCACCCCTCTCCCCTCATGGGTGGATTCGGACTTAAACACCCTCCTCCACAGATTCTCATCAAGAACACCCCGGTACCTGCGAATCCTTCGACCACCTTCAGTGCGGCAAAGTTTGCTTCCTTCATCACACAGTACTCCACGGGACAGGTCAGCGTGGAGATCGAGTGGGAGCTGCAGAAGGAAAACAGCAAACGCTGGAATCCCGAAATTCAGTACACTTCCAACTACAACAAGTCTGTTAATGTGGACTTTACTGTGGACACTAATGGCGTGTATTCAGAGCCTCGCCCCATTGGCACCAGATACCTGACTCGTAATCTGTAA(SEQ ID NO:6)。
野生型AAV5的示例性参考序列,SEQ ID NO:7(野生型AAV5)如下:
MSFVDHPPDWLEEVGEGLREFLGLEAGPPKPKPNQQHQDQARGLVLPGYNYLGPGNGLDRGEPVNRADEVAREHDISYNEQLEAGDNPYLKYNHADAEFQEKLADDTSFGGNLGKAVFQAKKRVLEPFGLVEEGAKTAPTGKRIDDHFPKRKKARTEEDSKPSTSSDAEAGPSGSQQLQIPAQPASSLGADTMSAGGGGPLGDNNQGADGVGNASGDWHC DSTWMGDRVVTKSTRTWVLPSYNNHQYREIKSGSVDGSNANAYFGYSTPWGYFDFNRFHSHWSPRDWQRLINNYWG FRPRSLRVKIFNIQVKEVTVQDSTTTIANNLTSTVQVFTDDDYQLPYVVGNGTEGCLPAFPPQVFTLPQYGYATLN RDNTENPTERSSFFCLEYFPSKMLRTGNNFEFTYNFEEVPFHSSFAPSQNLFKLANPLVDQYLYRFVSTNNTGGVQ FNKNLAGRYANTYKNWFPGPMGRTQGWNLGSGVNRASVSAFATTNRMELEGASYQVPPQPNGMTNNLQGSNTYALE NTMIFNSQPANPGTTATYLEGNMLITSESETQPVNRVAYNVGGQMATNNQSSTTAPATGTYNLQEIVPGSVWMERD VYLQGPIWAKIPETGAHFHPSPAMGGFGLKHPPPMMLIKNTPVPGNITSFSDVPVSSFITQYSTGQVTVEMEWELK KENSKRWNPEIQYTNNYNDPQFVDFAPDSTGEYRTTRPIGTRYLTRPL(SEQ ID NO:7)。
在上述序列中,VP1、VP2和VP3中发现的序列加下划线(例如,VP3衣壳多肽包括对应于SEQ ID NO:7的氨基酸193-724的氨基酸,例如由其组成),VP1和VP2两者中发现的序列以粗体显示(例如,VP2衣壳多肽包括对应于SEQ ID NO:7的氨基酸137-724的序列,例如由其组成),并且没有加下划线或粗体的序列仅在VP1中发现(例如,VP1衣壳多肽包括对应于SEQ ID NO:7的氨基酸1-724的氨基酸,例如由其组成)。
编码SEQ ID NO:7的示例性核酸序列是SEQ ID NO:8:
ATGTCTTTTGTTGATCACCCTCCAGATTGGTTGGAAGAAGTTGGTGAAGGTCTTCGCGAGTTTTTGGGCCTTGAAGCGGGCCCACCGAAACCAAAACCCAATCAGCAGCATCAAGATCAAGCCCGTGGTCTTGTGCTGCCTGGTTATAACTATCTCGGACCCGGAAACGG
GCTCGATCGAGGAGAGCCTGTCAACAGGGCAGACGAGGTCGCGCGAGAGCACGAC
ATCTCGTACAACGAGCAGCTTGAGGCGGGAGACAACCCCTACCTCAAGTACAACCA
CGCGGACGCCGAGTTTCAGGAGAAGCTCGCCGACGACACATCCTTCGGGGGAAAC
CTCGGAAAGGCAGTCTTTCAGGCCAAGAAAAGGGTTCTCGAACCTTTTGGCCTGGT
TGAAGAGGGTGCTAAGACGGCCCCTACCGGAAAGCGGATAGACGACCACTTTCCAA
AAAGAAAGAAGGCTCGGACCGAAGAGGACTCCAAGCCTTCCACCTCGTCAGACGC
CGAAGCTGGACCCAGCGGATCCCAGCAGCTGCAAATCCCAGCCCAACCAGCCTCA
AGTTTGGGAGCTGATACAATGTCTGCGGGAGGTGGCGGCCCATTGGGCGACAATAA
CCAAGGTGCCGATGGAGTGGGCAATGCCTCGGGAGATTGGCATTGCGATTCCACGT
GGATGGGGGACAGAGTCGTCACCAAGTCCACCCGAACCTGGGTGCTGCCCAGCTAC
AACAACCACCAGTACCGAGAGATCAAAAGCGGCTCCGTCGACGGAAGCAACGCCA
ACGCCTACTTTGGATACAGCACCCCCTGGGGGTACTTTGACTTTAACCGCTTCCACA
GCCACTGGAGCCCCCGAGACTGGCAAAGACTCATCAACAACTACTGGGGCTTCAGA
CCCCGGTCCCTCAGAGTCAAAATCTTCAACATTCAAGTCAAAGAGGTCACGGTGCA
GGACTCCACCACCACCATCGCCAACAACCTCACCTCCACCGTCCAAGTGTTTACGG
ACGACGACTACCAGCTGCCCTACGTCGTCGGCAACGGGACCGAGGGATGCCTGCCG
GCCTTCCCTCCGCAGGTCTTTACGCTGCCGCAGTACGGTTACGCGACGCTGAACCG
CGACAACACAGAAAATCCCACCGAGAGGAGCAGCTTCTTCTGCCTAGAGTACTTTC
CCAGCAAGATGCTGAGAACGGGCAACAACTTTGAGTTTACCTACAACTTTGAGGAG
GTGCCCTTCCACTCCAGCTTCGCTCCCAGTCAGAACCTGTTCAAGCTGGCCAACCC
GCTGGTGGACCAGTACTTGTACCGCTTCGTGAGCACAAATAACACTGGCGGAGTCC
AGTTCAACAAGAACCTGGCCGGGAGATACGCCAACACCTACAAAAACTGGTTCCCG
GGGCCCATGGGCCGAACCCAGGGCTGGAACCTGGGCTCCGGGGTCAACCGCGCCA
GTGTCAGCGCCTTCGCCACGACCAATAGGATGGAGCTCGAGGGCGCGAGTTACCAG
GTGCCCCCGCAGCCGAACGGCATGACCAACAACCTCCAGGGCAGCAACACCTATGC
CCTGGAGAACACTATGATCTTCAACAGCCAGCCGGCGAACCCGGGCACCACCGCCA
CGTACCTCGAGGGCAACATGCTCATCACCAGCGAGAGCGAGACGCAGCCGGTGAA
CCGCGTGGCGTACAACGTCGGCGGGCAGATGGCCACCAACAACCAGAGCTCCACC
ACTGCCCCCGCGACCGGCACGTACAACCTCCAGGAAATCGTGCCCGGCAGCGTGTG
GATGGAGAGGGACGTGTACCTCCAAGGACCCATCTGGGCCAAGATCCCAGAGACG
GGGGCGCACTTTCACCCCTCTCCGGCCATGGGCGGATTCGGACTCAAACACCCACC
GCCCATGATGCTCATCAAGAACACGCCTGTGCCCGGAAATATCACCAGCTTCTCGGA
CGTGCCCGTCAGCAGCTTCATCACCCAGTACAGCACCGGGCAGGTCACCGTGGAGA
TGGAGTGGGAGCTCAAGAAGGAAAACTCCAAGAGGTGGAACCCAGAGATCCAGTA
CACAAACAACTACAACGACCCCCAGTTTGTGGACTTTGCCCCGGACAGCACCGGGGAATACAGAACCACCAGACCTATCGGAACCCGATACCTTACCCGACCCCTTTAA(SEQ ID NO:8)。
野生型AAV8的示例性参考序列,SEQ ID NO:9(野生型AAV8)如下:MAADGYLPDWLEDNLSEGIREWWALKPGAPKPKANQQKQDDGRGLVLPGYKYLGPFNGLDKGEPVNAADAAALEHDKAYDQQLQAGDNPYLRYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRVLEPLGLVEEGAKTAPGKKRPVEPSPQRSPDSSTGIGKKGQQPARKRLNFGQTGDSESVPDPQPLGEPPAAPSGVGPNTMAAGGGAPMADNNEGADGVGSSSGNWHCDSTWLGDRVI TTSTRTWALPTYNNHLYKQISNGTSGGATNDNTYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLSFK LFNIQVKEVTQNEGTKTIANNLTSTIQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMIPQYGYLTLNNGSQAVGRS SFYCLEYFPSQMLRTGNNFQFTYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTQTTGGTANTQTLGFSQGG PNTMANQAKNWLPGPCYRQQRVSTTTGQNNNSNFAWTAGTKYHLNGRNSLANPGIAMATHKDDEERFFPSNGILIF GKQNAARDNADYSDVMLTSEEEIKTTNPVATEEYGIVADNLQQQNTAPQIGTVNSQGALPGMVWQNRDVYLQGPIW AKIPHTDGNFHPSPLMGGFGLKHPPPQILIKNTPVPADPPTTFNQSKLNSFITQYSTGQVSVEIEWELQKENSKRW NPEIQYTSNYYKSTSVDFAVNTEGVYSEPRPIGTRYLTRNL(SEQ ID NO:9)。
在上述序列中,VP1、VP2和VP3中发现的序列加下划线(例如,VP3衣壳多肽包括对应于SEQ ID NO:9的氨基酸204-738的氨基酸,例如由其组成),VP1和VP2两者中发现的序列以粗体显示(例如,VP2衣壳多肽包括对应于SEQ ID NO:9的氨基酸138-738的序列,例如由其组成),并且没有加下划线或粗体的序列仅在VP1中发现(例如,VP1衣壳多肽包括对应于SEQ ID NO:9的氨基酸1-738的氨基酸,例如由其组成)。
编码SEQ ID NO:9的示例性核酸序列是SEQ ID NO:10:
ATGGCTGCCGATGGTTATCTTCCAGATTGGCTCGAGGACAACCTCTCTGAGGGCATTCGCGAGTGGTGGGCGCTGAAACCTGGAGCCCCGAAGCCCAAAGCCAACCAGCAAAAGCAGGACGACGGCCGGGGTCTGGTGCTTCCTGGCTACAAGTACCTCGGACCCTTCAACGGACTCGACAAGGGGGAGCCCGTCAACGCGGCGGACGCAGCGGCCCTCGAGCACGACAAGGCCTACGACCAGCAGCTGCAGGCGGGTGACAATCCGTACCTGCGGTATAACCACGCCGACGCCGAGTTTCAGGAGCGTCTGCAAGAAGATACGTCTTTTGGGGGCAACCTCGGGCGAGCAGTCTTCCAGGCCAAGAAGCGGGTTCTCGAACCTCTCGGTCTGGTTGAGGAAGGCGCTAAGACGGCTCCTGGAAAGAAGAGACCGGTAGAGCCATCACCCCAGCGTTCTCCAGACTCCTCTACGGGCATCGGCAAGAAAGGCCAACAGCCCGCCAGAAAAAGACTCAATTTTGGTCAGACTGGCGACTCAGAGTCAGTTCCAGACCCTCAACCTCTCGGAGAACCTCCAGCAGCGCCCTCTGGTGTGGGACCTAATACAATGGCTGCAGGCGGTGGCGCACCAATGGCAGACAATAACGAAGGCGCCGACGGAGTGGGTAGTTCCTCGGGAAATTGGCATTGCGATTCCACATGGCTGGGCGACAGAGTCATCACCACCAGCACCCGAACCTGGGCCCTGCCCACCTACAACAACCACCTCTACAAGCAAATCTCCAACGGGACATCGGGAGGAGCCACCAACGACAACACCTACTTCGGCTACAGCACCCCCTGGGGGTATTTTGACTTTAACAGATTCCACTGCCACTTTTCACCACGTGACTGGCAGCGACTCATCAACAACAACTGGGGATTCCGGCCCAAGAGACTCAGCTTCAAGCTCTTCAACATCCAGGTCAAGGAGGTCACGCAGAATGAAGGCACCAAGACCATCGCCAATAACCTCACCAGCACCATCCAGGTGTTTACGGACTCGGAGTACCAGCTGCCGTACGTTCTCGGCTCTGCCCACCAGGGCTGCCTGCCTCCGTTCCCGGCGGACGTGTTCATGATTCCCCAGTACGGCTACCTAACACTCAACAACGGTAGTCAGGCCGTGGGACGCTCCTCCTTCTACTGCCTGGAATACTTTCCTTCGCAGATGCTGAGAACCGGCAACAACTTCCAGTTTACTTACACCTTCGAGGACGTGCCTTTCCACAGCAGCTACGCCCACAGCCAGAGCTTGGACCGGCTGATGAATCCTCTGATTGACCAGTACCTGTACTACTTGTCTCGGACTCAAACAACAGGAGGCACGGCAAATACGCAGACTCTGGGCTTCAGCCAAGGTGGGCCTAATACAATGGCCAATCAGGCAAAGAACTGGCTGCCAGGACCCTGTTACCGCCAACAACGCGTCTCAACGACAACCGGGCAAAACAACAATAGCAACTTTGCCTGGACTGCTGGGACCAAATACCATCTGAATGGAAGAAATTCATTGGCTAATCCTGGCATCGCTATGGCAACACACAAAGACGACGAGGAGCGTTTTTTTCCCAGTAACGGGATCCTGATTTTTGGCAAACAAAATGCTGCCAGAGACAATGCGGATTACAGCGATGTCATGCTCACCAGCGAGGAAGAAATCAAAACCACTAACCCTGTGGCTACAGAGGAATACGGTATCGTGGCAGATAACTTGCAGCAGCAAAACACGGCTCCTCAAATTGGAACTGTCAACAGCCAGGGGGCCTTACCCGGTATGGTCTGGCAGAACCGGGACGTGTACCTGCAGGGTCCCATCTGGGCCAAGATTCCTCACACGGACGGCAACTTCCACCCGTCTCCGCTGATGGGCGGCTTTGGCCTGAAACATCCTCCGCCTCAGATCCTGATCAAGAACACGCCTGTACCTGCGGATCCTCCGACCACCTTCAACCAGTCAAAGCTGAACTCTTTCATCACGCAATACAGCACCGGACAGGTCAGCGTGGAAATTGAATGGGAGCTGCAGAAGGAAAACAGCAAGCGCTGGAACCCCGAGATCCAGTACACCTCCAACTACTACAAATCTACAAGTGTGGACTTTGCTGTTAATACAGAAGGCGTGTACTCTGAACCCCGCCCCATTGGCACCCGTTACCTCACCCGTAATCTGTAA(SEQ ID NO:10)。
野生型AAV9的示例性参考序列,SEQ ID NO:11(野生型AAV9)如下:
MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRLLEPLGLVEEAAKTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMASGGGAPVADNNEGADG VGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPR DWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVF MIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLS KTINGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAM ASHKEGEDRFFPLSGSLIFGKQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHQSAQAQAQTGWVQNQG ILPGMVWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYST GQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL(SEQ ID NO:11)。
在上述序列中,VP1、VP2和VP3中发现的序列加下划线(例如,VP3衣壳多肽包括对应于SEQ ID NO:11的氨基酸203-736的氨基酸,例如由其组成),VP1和VP2两者中发现的序列以粗体显示(例如,VP2衣壳多肽包括对应于SEQ ID NO:11的氨基酸138-736的序列,例如由其组成),并且没有加下划线或粗体的序列仅在VP1中发现(例如,VP1衣壳多肽包括对应于SEQ ID NO:11的氨基酸1-736的氨基酸,例如由其组成)。
编码SEQ ID NO:11的示例性核酸序列是SEQ ID NO:12:
ATGGCTGCCGATGGTTATCTTCCAGATTGGCTCGAGGACAACCTTAGTGAAGGTATTCGCGAGTGGTGGGCTTTGAAACCTGGAGCCCCTCAACCCAAGGCAAATCAACAACATCAAGACAACGCTCGAGGTCTTGTGCTTCCGGGTTACAAATACCTTGGACCCGGCAACGGACTCGACAAGGGGGAGCCGGTCAACGCAGCAGACGCGGCGGCCCTCGAGCACGACAAGGCCTACGACCAGCAGCTCAAGGCCGGAGACAACCCGTACCTCAAGTACAACCACGCCGACGCCGAGTTCCAGGAGCGGCTCAAAGAAGATACGTCTTTTGGGGGCAACCTCGGGCGAGCAGTCTTCCAGGCCAAAAAGAGGCTTCTTGAACCTCTTGGTCTGGTTGAGGAAGCGGCTAAGACGGCTCCTGGAAAGAAGAGGCCTGTAGAGCAGTCTCCTCAGGAACCGGACTCCTCCGCGGGTATTGGCAAATCGGGTGCACAGCCCGCTAAAAAGAGACTCAATTTCGGTCAGACTGGCGACACAGAGTCAGTCCCAGACCCTCAACCAATCGGAGAACCTCCCGCAGCCCCCTCAGGTGTGGGATCTCTTACAATGGCTTCAGGTGGTGGCGCACCAGTGGCAGACAATAACGAAGGTGCCGATGGAGTGGGTAGTTCCTCGGGAAATTGGCATTGCGATTCCCAATGGCTGGGGGACAGAGTCATCACCACCAGCACCCGAACCTGGGCCCTGCCCACCTACAACAATCACCTCTACAAGCAAATCTCCAACAGCACATCTGGAGGATCTTCAAATGACAACGCCTACTTCGGCTACAGCACCCCCTGGGGGTATTTTGACTTCAACAGATTCCACTGCCACTTCTCACCACGTGACTGGCAGCGACTCATCAACAACAACTGGGGATTCCGGCCTAAGCGACTCAACTTCAAGCTCTTCAACATTCAGGTCAAAGAGGTTACGGACAACAATGGAGTCAAGACCATCGCCAATAACCTTACCAGCACGGTCCAGGTCTTCACGGACTCAGACTATCAGCTCCCGTACGTGCTCGGGTCGGCTCACGAGGGCTGCCTCCCGCCGTTCCCAGCGGACGTTTTCATGATTCCTCAGTACGGGTATCTGACGCTTAATGATGGAAGCCAGGCCGTGGGTCGTTCGTCCTTTTACTGCCTGGAATATTTCCCGTCGCAAATGCTAAGAACGGGTAACAACTTCCAGTTCAGCTACGAGTTTGAGAACGTACCTTTCCATAGCAGCTACGCTCACAGCCAAAGCCTGGACCGACTAATGAATCCACTCATCGACCAATACTTGTACTATCTCTCAAAGACTATTAACGGTTCTGGACAGAATCAACAAACGCTAAAATTCAGTGTGGCCGGACCCAGCAACATGGCTGTCCAGGGAAGAAACTACATACCTGGACCCAGCTACCGACAACAACGTGTCTCAACCACTGTGACTCAAAACAACAACAGCGAATTTGCTTGGCCTGGAGCTTCTTCTTGGGCTCTCAATGGACGTAATAGCTTGATGAATCCTGGACCTGCTATGGCCAGCCACAAAGAAGGAGAGGACCGTTTCTTTCCTTTGTCTGGATCTTTAATTTTTGGCAAACAAGGAACTGGAAGAGACAACGTGGATGCGGACAAAGTCATGATAACCAACGAAGAAGAAATTAAAACTACTAACCCGGTAGCAACGGAGTCCTATGGACAAGTGGCCACAAACCACCAGAGTGCCCAAGCACAGGCGCAGACCGGCTGGGTTCAAAACCAAGGAATACTTCCGGGTATGGTTTGGCAGGACAGAGATGTGTACCTGCAAGGACCCATTTGGGCCAAAATTCCTCACACGGACGGCAACTTTCACCCTTCTCCGCTGATGGGAGGGTTTGGAATGAAGCACCCGCCTCCTCAGATCCTCATCAAAAACACACCTGTACCTGCGGATCCTCCAACGGCCTTCAACAAGGACAAGCTGAACTCTTTCATCACCCAGTATTCTACTGGCCAAGTCAGCGTGGAGATCGAGTGGGAGCTGCAGAAGGAAAACAGCAAGCGCTGGAACCCGGAGATCCAGTACACTTCCAACTATTACAAGTCTAATAATGTTGAATTTGCTGTTAATACTGAAGGTGTATATAGTGAACCCCGCCCCATTGGCACCAGATACCTGACTCGTAATCTGTAA(SEQ ID NO:12)。
野生型AAVrh74的示例性参考序列,SEQ ID NO:13(野生型AAVrh74)如下:MAADGYLPDWLEDNLSEGIREWWDLKPGAPKPKANQQKQDNGRGLVLPGYKYLGPFNGLDKGEPVNAADAAALEHDKAYDQQLQAGDNPYLRYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRVLEPLGLVESPVKTAPGKKRPVEPSPQRSPDSSTGIGKKGQQPAKKRLNFGQTGDSESVPDPQPIGEPPAGPSGLGSGTMAAGGGAPMADNNEGADGVGSSSGNWHCDST WLGDRVITTSTRTWALPTYNNHLYKQISNGTSGGSTNDNTYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFR PKRLNFKLFNIQVKEVTQNEGTKTIANNLTSTIQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMIPQYGYLTLNNG SQAVGRSSFYCLEYFPSQMLRTGNNFEFSYNFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTQSTGGTAGTQQ LLFSQAGPNNMSAQAKNWLPGPCYRQQRVSTTLSQNNNSNFAWTGATKYHLNGRDSLVNPGVAMATHKDDEERFFP SSGVLMFGKQGAGKDNVDYSSVMLTSEEEIKTTNPVATEQYGVVADNLQQQNAAPIVGAVNSQGALPGMVWQNRDV YLQGPIWAKIPHTDGNFHPSPLMGGFGLKHPPPQILIKNTPVPADPPTTFNQAKLASFITQYSTGQVSVEIEWELQ KENSKRWNPEIQYTSNYYKSTNVDFAVNTEGTYSEPRPIGTRYLTRNL(SEQ ID NO:13)。
SEQ ID NO:14(替代野生型AAVrh74)的替代示例性参考序列如下:
MAADGYLPDWLEDNLSEGIREWWDLKPGAPKPKANQQKQDNGRGLVLPGYKYLGPFNGLDKGEPVNAADAAALEHDKAYDQQLQAGDNPYLRYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRVLEPLGLVESPVKTAPGKKRPVEPSPQRSPDSSTGIGKKGQQPAKKRLNFGQTGDSESVPDPQPIGEPPAGPSGLGSGTMAAGGGAPMADNNEGAD GVGSSSGNWHCDSTWLGDRVITTSTRTWALPTYNNHLYKQISNGTSGGSTNDNTYFGYSTPWGYFDFNRFHCHFSP RDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNEGTKTIANNLTSTIQVFTDSEYQLPYVLGSAHQGCLPPFPADV FMIPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFEFSYNFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYL SRTQSTGGTAGTQQLLFSQAGPNNMSAQAKNWLPGPCYRQQRVSTTLSQNNNSNFAWTGATKYHLNGRDSLVNPGV AMATHKDDEERFFPSSGVLMFGKQGAGKDNVDYSSVMLTSEEEIKTTNPVATEQYGVVADNLQQQNAAPIVGAVNS QGALPGMVWQNRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGLKHPPPQILIKNTPVPADPPTTFTKAKLASFITQY STGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSTNVDFAVNTEGTYSEPRPIGTRYLTRNL(SEQ ID NO:14)。
在上述序列(SEQ ID NO:13或SEQ ID NO:14)中,VP1、VP2和VP3中发现的序列加下划线(例如,VP3衣壳多肽包括对应于SEQ ID NO:13的氨基酸204-738的氨基酸,例如由其组成),VP1和VP2两者中发现的序列以粗体显示(例如,VP2衣壳多肽包括对应于SEQ ID NO:13的氨基酸138-738的序列,例如由其组成),并且没有加下划线或粗体的序列仅在VP1中发现(例如,VP1衣壳多肽包括对应于SEQ ID NO:13的氨基酸1-738的氨基酸,例如由其组成)。
编码SEQ ID NO:13的示例性核酸序列是SEQ ID NO:15。
ATGGCTGCCGATGGTTATCTTCCAGATTGGCTCGAGGACAACCTCTCTGAGGGCATTCGCGAGTGGTGGGACCTGAAACCTGGAGCCCCGAAACCCAAAGCCAACCAGCAAAAGCAGGACAACGGCCGGGGTCTGGTGCTTCCTGGCTACAAGTACCTCGGACCCTTCAACGGACTCGACAAGGGGGAGCCCGTCAACGCGGCGGACGCAGCGGCCCTCGAGCACGACAAGGCCTACGACCAGCAGCTCCAAGCGGGTGACAATCCGTACCTGCGGTATAATCACGCCGACGCCGAGTTTCAGGAGCGTCTGCAAGAAGATACGTCTTTTGGGGGCAACCTCGGGCGCGCAGTCTTCCAGGCCAAAAAGCGGGTTCTCGAACCTCTGGGCCTGGTTGAATCGCCGGTTAAGACGGCTCCTGGAAAGAAGAGGCCGGTAGAGCCATCACCCCAGCGCTCTCCAGACTCCTCTACGGGCATCGGCAAGAAAGGCCAGCAGCCCGC
AAAAAAGAGACTCAATTTTGGGCAGACTGGCGACTCAGAGTCAGTCCCCGACCCTC
AACCAATCGGAGAACCACCAGCAGGCCCCTCTGGTCTGGGATCTGGTACAATGGCT
GCAGGCGGTGGCGCTCCAATGGCAGACAATAACGAAGGCGCCGACGGAGTGGGTA
GTTCCTCAGGAAATTGGCATTGCGATTCCACATGGCTGGGCGACAGAGTCATCACCA
CCAGCACCCGCACCTGGGCCCTGCCCACCTACAACAACCACCTCTACAAGCAAATC
TCCAACGGGACCTCGGGAGGAAGCACCAACGACAACACCTACTTCGGCTACAGCA
CCCCCTGGGGGTATTTTGACTTCAACAGATTCCACTGCCACTTTTCACCACGTGACT
GGCAGCGACTCATCAACAACAACTGGGGATTCCGGCCCAAGAGGCTCAACTTCAA
GCTCTTCAACATCCAAGTCAAGGAGGTCACGCAGAATGAAGGCACCAAGACCATCG
CCAATAACCTTACCAGCACGATTCAGGTCTTTACGGACTCGGAATACCAGCTCCCGT
ACGTGCTCGGCTCGGCGCACCAGGGCTGCCTGCCTCCGTTCCCGGCGGACGTCTTC
ATGATTCCTCAGTACGGGTACCTGACTCTGAACAATGGCAGTCAGGCTGTGGGCCG
GTCGTCCTTCTACTGCCTGGAGTACTTTCCTTCTCAAATGCTGAGAACGGGCAACAA
CTTTGAATTCAGCTACAACTTCGAGGACGTGCCCTTCCACAGCAGCTACGCGCACA
GCCAGAGCCTGGACCGGCTGATGAACCCTCTCATCGACCAGTACTTGTACTACCTGT
CCCGGACTCAAAGCACGGGCGGTACTGCAGGAACTCAGCAGTTGCTATTTTCTCAG
GCCGGGCCTAACAACATGTCGGCTCAGGCCAAGAACTGGCTACCCGGTCCCTGCTA
CCGGCAGCAACGTGTCTCCACGACACTGTCGCAGAACAACAACAGCAACTTTGCCT
GGACGGGTGCCACCAAGTATCATCTGAATGGCAGAGACTCTCTGGTGAATCCTGGC
GTTGCCATGGCTACCCACAAGGACGACGAAGAGCGATTTTTTCCATCCAGCGGAGT
CTTAATGTTTGGGAAACAGGGAGCTGGAAAAGACAACGTGGACTATAGCAGCGTGA
TGCTAACCAGCGAGGAAGAAATAAAGACCACCAACCCAGTGGCCACAGAACAGTA
CGGCGTGGTGGCCGATAACCTGCAACAGCAAAACGCCGCTCCTATTGTAGGGGCCG
TCAATAGTCAAGGAGCCTTACCTGGCATGGTGTGGCAGAACCGGGACGTGTACCTG
CAGGGTCCCATCTGGGCCAAGATTCCTCATACGGACGGCAACTTTCATCCCTCGCCG
CTGATGGGAGGCTTTGGACTGAAGCATCCGCCTCCTCAGATCCTGATTAAAAACAC
ACCTGTTCCCGCGGATCCTCCGACCACCTTCAATCAGGCCAAGCTGGCTTCTTTCAT
CACGCAGTACAGTACCGGCCAGGTCAGCGTGGAGATCGAGTGGGAGCTGCAGAAG
GAGAACAGCAAACGCTGGAACCCAGAGATTCAGTACACTTCCAACTACTACAAATC
TACAAATGTGGACTTTGCTGTCAATACTGAGGGTACTTATTCCGAGCCTCGCCCCATTGGCACCCGTTACCTCACCCGTAATCTGTAA(SEQ ID NO:15)。
本公开涉及由衣壳(Cap)基因编码的结构衣壳蛋白(包括VP1、VP2和VP3)。这些衣壳蛋白形成病毒载体(如AAV)的外部蛋白质结构壳(即衣壳)。由Cap多核苷酸合成的VP衣壳蛋白通常包含甲硫氨酸作为肽序列中的第一个氨基酸(Met1),其与对应Cap核苷酸序列中的起始密码子(AUG或ATG)相关。然而,在多肽合成之后或在多肽合成期间,第一个甲硫氨酸(Met1)残基或通常任何第一个氨基酸(AA1)通常会被蛋白质加工酶(如Met-氨基肽酶)切割。这种“Met/AA剪切”过程通常与多肽序列中第二个氨基酸(例如丙氨酸、缬氨酸、丝氨酸、苏氨酸等)的对应乙酰化相关。Met剪切通常发生在VP1和VP3衣壳蛋白上,但也可能发生在VP2衣壳蛋白上。在Met/AA剪切不完全的情况下,可以产生包含病毒衣壳的一种或多种(一种、两种或三种)VP衣壳蛋白的混合物,其中一些包括Met1/AA1氨基酸(Met+/AA+)并且其中一些由于Met/AA剪切(Met-/AA-)而缺乏Met1/AA1氨基酸。有关衣壳蛋白中Met/AA剪切的进一步讨论,请参见Jin等人Direct Liquid Chromatography/Mass Spectrometry Analysisfor Complete Characterization of Recombinant Adeno-Associated Virus CapsidProteins.Hum Gene Ther Methods.2017年10月28日(5):255-267;Hwang等人N-TerminalAcetylation of Cellular Proteins Creates Specific DegradationSignals.Science.2010年2月19日.327(5968):973-977;其内容各自均通过引用整体并入本文。根据本公开,提及衣壳多肽不限于剪切的(Met-/AA-)或未剪切的(Met+/AA+),并且在上下文中还指独立的衣壳多肽、由衣壳蛋白的混合物组成的病毒衣壳、和/或编码、描述、产生或导致本公开的衣壳多肽的多核苷酸序列(或其片段)。直接提及“衣壳多肽”(如VP1、VP2或VP3)还包括VP衣壳蛋白,该衣壳蛋白包含Met1/AA1氨基酸(Met+/AA+)以及对应的VP衣壳多肽,该衣壳蛋白由于Met/AA剪切(Met-/AA-)而缺乏Met1/AA1氨基酸。进一步根据本公开,对分别包含或编码包含Met1/AA1氨基酸(Met+/AA+)的一种或多种衣壳多肽的特定SEQ IDNO:(无论是蛋白质还是核酸)的提及应当理解为教导缺乏Met1/AA1氨基酸的VP衣壳多肽,因为当审查序列时,很容易看出仅仅缺乏第一个列出的氨基酸(无论是否是Met1/AA1)的任何序列。作为非限制性实例,提及长度为736个氨基酸并且包括由AUG/ATG起始密码子编码的“Met1”氨基酸(Met+)的VP1多肽序列也被理解为教导如下VP1多肽序列:长度为735个氨基酸,并且不包括736个氨基酸Met+序列中的“Met1”氨基酸(Met-)。作为第二个非限制性实例,提及长度为736个氨基酸并且包括由任何NNN起动密码子编码的“AA1”氨基酸(AA1+)的VP1多肽序列也可以被理解为教导如下VP1多肽序列:长度为735个氨基酸,并且不包括736个氨基酸AA1+序列中的“AA1”氨基酸(AA1-)。提及由VP衣壳蛋白形成的病毒衣壳(如提及特定的AAV衣壳血清型),可以并入包含Met1/AA1氨基酸(Met+/AA1+)的VP衣壳蛋白、由于Met/AA1剪切缺乏Met1/AA1氨基酸(Met-/AA1-)的对应VP衣壳蛋白及其组合(Met+/AA1+和Met-/AA1-)。作为非限制性实例,AAV衣壳血清型可包括VP1(Met+/AA1+)、VP1(Met-/AA1-)、或VP1(Met+/AA1+)和VP1(Met-/AA1-)的组合。AAV衣壳血清型还可以包括VP3(Met+/AA1+)、VP3(Met-/AA1-)、或VP3(Met+/AA1+)和VP3(Met-/AA1-)的组合;并且还可以包括VP2(Met+/AA1)和VP2(Met-/AA1-)的类似任选组合。
在一些实施例中,参考AAV衣壳序列包括与上述序列中的任一者具有50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
在一些实施例中,参考AAV衣壳序列由与上述序列中的任一者具有50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列编码。在某些实施例中,参考序列不是AAV衣壳序列,而是不同的载体(例如,慢病毒、质粒等)。
在一些实施例中,本公开的核酸(例如,编码本文所述的变体衣壳多肽)包含常规的控制元件或序列,其以允许在用核酸(例如,包含所述核酸的质粒载体)转染或用包含所述核酸的病毒感染的细胞中转录、翻译和/或表达的方式可操作地连接至核酸分子。如本文所使用的,“可操作地连接的”序列包含与所关注的基因邻接的表达控制序列和以反式或在远处起作用以控制所关注的基因的表达控制序列。
表达控制序列包括有效的RNA加工信号,如剪接和多聚腺苷酸化(多聚A)信号;适当的转录起始、终止、启动子和增强子序列;稳定细胞质mRNA的序列;增强蛋白质稳定性的序列;提高翻译效率的序列(例如Kozak共识序列);以及在一些实施例中,增强所编码的转基因产物的分泌的序列。表达控制序列,包括天然的、组成型的、诱导型的和/或组织特异性的启动子,是本领域已知的并且可以与本文公开的组合物和方法一起使用。
在一些实施例中,可以使用转基因的天然启动子。不希望受理论束缚,天然启动子可以模拟转基因的天然表达,或提供时间、发育或组织特异性表达,或响应于特定转录刺激的表达。在一些实施例中,转基因可以可操作地连接至其他天然表达控制元件,如增强子元件、多聚腺苷酸化位点或Kozak共识序列,例如以模拟天然表达。
在一些实施例中,转基因可操作地连接至组织特异性启动子,例如在一种或多种肝脏细胞类型中特异性活性的启动子。
在一些实施例中,携带转基因的载体,例如质粒,还可以包括选择性标志物或报告基因。此类选择性报告基因或标志物基因可用于发出细菌细胞中载体(例如质粒)存在的信号。载体的其他组分,例如质粒,可以包括复制起点。这些和其他启动子和载体元件的选择是常规的并且许多此类序列是可用的(参见,例如,Sambrook等人,以及其中引用的参考文献)。
在一些实施例中,与具有野生型衣壳多肽(SEQ ID NO:1)的病毒颗粒相比,存在于病毒颗粒中的衣壳多肽增加肝脏转导。在一些实施例中,与具有野生型衣壳多肽(SEQ IDNO:1)的病毒颗粒相比,存在于病毒颗粒中的衣壳多肽相比病毒颗粒的肝脏生物分布将肝脏转导增加到更大的程度,例如至少2倍。
在一些实施例中,衣壳多肽是分离的或纯化的多肽(例如,从细胞、其他生物组分或污染物中分离或纯化)。在一些实施例中,变体多肽存在于依赖性细小病毒颗粒中,例如本文所述的。在一些实施例中,变体衣壳多肽存在于细胞、无细胞体系或翻译体系中,例如本文所述的。
在一些实施例中,衣壳多肽存在于依赖性细小病毒B(例如,AAV2)颗粒中。在一些实施例中,衣壳颗粒具有增加的肝脏转导。
在一些实施例中,依赖性细小病毒颗粒包含与本文所提供的氨基酸序列(例如,SEQ ID NO:2-3)具有至少80、85、90、91、92、93、94、95、96、97、98、99或100%同一性的氨基酸序列。在一些实施例中,变体衣壳多肽包含与本文所提供的变体衣壳多肽的氨基酸序列相差不超过30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个氨基酸的氨基酸序列。
在一些实施例中,另外的改变改善了依赖性细小病毒颗粒的生产特征或其制备方法。在一些实施例中,另外的改变改善或改变依赖性细小病毒颗粒的另一特征,例如趋向性。
VP1核酸和多肽
本公开进一步部分地涉及包含编码本文所提供的依赖性细小病毒(例如,依赖性细小病毒B,例如AAV2)多肽的序列的核酸,以及由其编码的VP1多肽。在一些实施例中,多肽包含SEQ ID NO:2或3的序列。
依赖性细小病毒颗粒
本公开还部分地涉及包含本文所述的或通过本文所述的方法产生的核酸或多肽的依赖性细小病毒颗粒(例如,功能性依赖性细小病毒颗粒)。
依赖性细小病毒是单链DNA细小病毒,其仅在细胞中生长,在该细胞中某些功能例如由共感染的辅助病毒提供。已知依赖性细小病毒的几个物种,包括依赖性细小病毒A和依赖性细小病毒B,其包括本领域已知的作为腺相关病毒(AAV)的血清型。至少十三种AAV的血清型已被表征。AAV的一般信息和评论可以在例如Carter,Handbook of Parvoviruses,第1卷,第169-228页(1989)以及Berns,Virology,第1743-1764页,Raven Press,(New York,1990)中发现。AAV血清型,以及在某种程度上,依赖性细小病毒物种在结构和功能上显著相关。(参见例如,Blacklowe,Parvoviruses and Human Disease的第165-174页,J.R.Pattison编辑,(1988);以及Rose,Comprehensive Virology 3:1-61(1974))。例如,所有AAV血清型都明显表现出非常相似的由同源rep基因介导的复制特性;并且都带有三种相关的衣壳蛋白。此外,异源双链体分析揭示了沿基因组长度的血清型之间的广泛的交叉杂交,进一步表明了相互关联性。依赖性细小病毒基因组在末端还包含对应于“反向末端重复序列”(ITR)的自退火片段。
天然存在的依赖性细小病毒(例如AAV血清型)的基因组结构非常相似。例如,AAV的基因组是线性、单链DNA分子,其长度大约5,000个核苷酸(nt)或更少。反向末端重复序列(ITR)位于非结构复制(Rep)蛋白和结构衣壳(Cap)蛋白的独特编码核苷酸序列两侧。三种不同的病毒颗粒(VP)蛋白形成衣壳。末端145nt是自身互补的并且被组织成使得可以形成T形发夹的能量稳定的分子内双链体。这些发夹结构用作病毒DNA复制的起点,从而用作用于细胞DNA聚合酶复合物的引物。Rep基因编码Rep蛋白:Rep78、Rep68、Rep52和Rep40。Rep78和Rep68由p5启动子转录,并且Rep52和Rep40由p19启动子转录。cap基因编码VP蛋白VP1、VP2和VP3。cap基因由p40启动子转录。
在一些实施例中,本公开的依赖性细小病毒颗粒包含核酸,该核酸包含本文所提供的衣壳多肽。在一些实施例中,颗粒包含如本文所提供的多肽。
在一些实施例中,本公开的依赖性细小病毒颗粒可以是AAV2颗粒。在一些实施例中,AAV2颗粒包含如本文所提供的衣壳多肽或编码其的核酸分子。
增加的肝脏转导特征
本公开部分地涉及核酸、多肽、细胞、无细胞体系、翻译体系、病毒颗粒以及与制备其相关的方法以产生与具有SEQ ID NO:1的野生型序列的病毒颗粒相比具有增加的肝脏转导(例如肝细胞细胞转导)的颗粒。本公开部分地涉及核酸、多肽、细胞、无细胞体系、翻译体系、病毒颗粒以及与制备其相关的方法以产生与具有SEQ ID NO:7的野生型序列的病毒颗粒相比具有增加的肝脏转导(例如增加的肝细胞细胞转导)的颗粒。在一些实施例中,包含变体衣壳多肽的病毒颗粒的使用导致肝脏中(例如,在肝细胞中)转基因的肝脏转导增加(例如,在肝细胞中),并且因此导致转基因的肝脏中(例如,在肝细胞中)转基因的表达增加。在实施例中,增加的转导是如通过对从所关注组织的细胞分离的病毒RNA进行定量NGS测序来测量的,例如,如实例1中所述。
在一些实施例中,肝脏转导的增加在log2标度上是野生型衣壳蛋白的约1至5倍,例如2至3倍好。在实施例中,增加的肝脏转导是包含野生型衣壳蛋白的病毒颗粒的约或至少6.5倍好。在实施例中,增加的肝脏转导是包含野生型衣壳蛋白的病毒颗粒的约或至少9倍好。在一些实施例中,在病毒颗粒或其组合物的全身性(例如静脉内)施用后表现出增加的肝脏转导。在一些实施例中,增加的肝脏转导包括肝细胞的转导。在一些实施例中,增加的转导是如通过对从所关注组织的细胞分离的病毒RNA进行定量NGS测序来测量的,例如,如实例1中所述。
在一些实施例中,肝脏(例如肝细胞)转导的增加在log2标度上,是具有参考序列衣壳多肽(例如具有野生型衣壳多肽SEQ ID NO:1)的病毒颗粒的约1-10倍好(例如,约5-10倍好,例如,约7-10倍好)。在一些实施例中,增加的肝脏(例如肝细胞)转导是包含SEQ IDNO:1的野生型衣壳蛋白的病毒颗粒和/或包含SEQ ID NO:7的野生型衣壳蛋白的病毒颗粒的约或至少6.5倍好。在实施例中,增加的肝脏(例如肝细胞)转导是包含SEQ ID NO:1的野生型衣壳蛋白的病毒颗粒和/或包含SEQ ID NO:7的野生型衣壳蛋白的病毒颗粒的约或至少9倍好。在实施例中,增加的转导是如通过对从所关注组织的细胞分离的病毒RNA进行定量NGS测序来测量的,例如,如实例1中所述。
在一些实施例中,与包含SEQ ID NO:1的衣壳多肽的病毒颗粒相比,如本文所述的变体衣壳多肽、如本文所述的病毒颗粒或本文所述的任何方法以有效载荷的增加的转导或增加的表达将有效载荷递送至肝脏,例如肝细胞。
在一些实施例中,与包含SEQ ID NO:1和/或SEQ ID NO:7的衣壳多肽的病毒颗粒相比,如本文所述的变体衣壳多肽、如本文所述的病毒颗粒或本文所述的任何方法以肝脏(例如肝细胞)中的增加的转导将有效载荷递送至肝脏(例如肝细胞),并且其中与包含SEQID NO:1和/或SEQ ID NO:7的衣壳多肽的病毒颗粒相比,转导的增加是至少1倍、2倍、4倍、5倍、6倍、7倍或8倍。在一些实施例中,转导包括肝细胞的转导。在实施例中,增加的肝脏(例如肝细胞)转导是如通过对从总体肝脏组织分离的病毒RNA进行定量NGS测序来测量的,例如,如实例1中所述。
在一些实施例中,与包含SEQ ID NO:1和/或SEQ ID NO:7的衣壳多肽的病毒颗粒相比,包含本文所述的变体衣壳多肽的病毒颗粒的使用导致包含所述变体衣壳多肽的病毒颗粒的肝脏生物分布增加以及肝脏中的转基因的肝脏转导增加,并且因此导致转基因的肝脏中的转基因的表达增加。在一些实施例中,相对肝脏转导的增加比相对肝脏生物分布的增加程度更大,例如至少2倍。在实施例中,增加的肝脏生物分布是如通过对从总体肝脏组织分离的病毒DNA进行定量NGS测序来测量的,例如,如实例1中所述。在一些实施例中,增加是在病毒颗粒或其组合物的全身性(例如静脉内)施用之后。
制备本文所述的组合物的方法
本公开部分地涉及一种制备依赖性细小病毒颗粒(例如本文所述的依赖性细小病毒颗粒)的方法。在一些实施例中,一种制备依赖性细小病毒颗粒的方法包括:提供细胞、无细胞体系或其他翻译体系,其包含编码本文提供的变体衣壳多肽,或本文提供的多肽(例如,变体衣壳多肽)的所述的核酸;以及在适合于产生依赖性细小病毒颗粒的条件下培养细胞、无细胞体系或其他翻译体系,从而制备依赖性细小病毒颗粒。
在一些实施例中,提供包含本文所述的核酸的细胞包括将核酸引入细胞,例如用核酸转染或转化细胞。本公开的核酸可以位于可以递送至宿主细胞的任何遗传元件(载体)的一部分,例如裸DNA、质粒、噬菌体、转座子、粘粒、附加体、非病毒递送媒介物中的蛋白质(例如,基于脂质的载体)、病毒等,其转移其上所携带的序列。此类载体可以通过任何合适的方法,包括转染、脂质体递送、电穿孔、膜融合技术、病毒感染、高速DNA包被的团粒和原生质体融合来递送。本领域技术人员拥有构建本发明的任何实施例的核酸操作中的知识和技能,并且所述技能包括基因工程、重组工程和合成技术。参见,例如,Sambrook等人,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Press,Cold SpringHarbor,NY。
在一些实施例中,本公开的载体包含编码如本文所提供的依赖性细小病毒变体衣壳多肽或其片段的序列。在一些实施例中,本公开的载体包含编码依赖性细小病毒rep蛋白或其片段的序列。在一些实施例中,此类载体可以含有依赖性细小病毒cap和rep蛋白两者。在其中提供AAV rep和cap两者的载体中,依赖性细小病毒rep和依赖性细小病毒cap序列可以均具有相同的依赖性细小病毒物种或血清型来源,如AAV2。可替代地,本实施例还提供了载体,在该载体中rep序列来自与提供cap序列的依赖性细小病毒物种或血清型不同的物种或血清型。在一些实施例中,rep和cap序列由单独来源(例如单独的载体,或宿主细胞基因组和载体)表达。在一些实施例中,rep序列与不同依赖性细小病毒物种或血清型的cap序列框内融合以形成嵌合的依赖性细小病毒载体。在一些实施例中,本发明的载体进一步含有有效载荷,例如包含选定转基因的小基因,例如侧接依赖性细小病毒5’ITR和依赖性细小病毒3’ITR。
本文所述的载体,例如质粒,可用于多种目的,但特别适合用于产生包含依赖性细小病毒序列或其片段以及在一些实施例中的有效载荷的重组依赖性细小病毒颗粒。
一方面,本公开提供了一种制备依赖性细小病毒颗粒(例如,依赖性细小病毒B颗粒,例如,AAV2颗粒)或其部分的方法。在一些实施例中,该方法包括:培养含有编码如本文所提供的依赖性细小病毒变体衣壳蛋白或其片段的核酸序列的宿主细胞;功能性rep基因;有效载荷,例如,包含依赖性细小病毒反向末端重复序列(ITR)和转基因的小基因;以及足够的辅助功能以促进有效载荷(例如小基因)包装到依赖性细小病毒衣壳中。在宿主细胞中培养以将有效载荷,例如小基因包装至依赖性细小病毒衣壳中所需的组分可以以反式形式提供至宿主细胞。在一些实施例中,可通过宿主细胞提供所需组分(例如,有效载荷(例如小基因)、rep序列、cap序列和/或辅助功能)中的任一种或多种,该宿主细胞使用本领域的技术人员已知的方法已被工程化以稳定地包含所需组分中的一种或多种。在一些实施例中,已被工程化以稳定地包含所需组分的宿主细胞包含在诱导型启动子控制下的所需组分。在一些实施例中,所需组分可以在组成型启动子的控制下。本文提供了合适的诱导型和组成型启动子的实例,并且另外的实例是本领域技术人员已知的。在一些实施例中,已被工程化以稳定地包含一种或多种组分的选定的宿主细胞可以包含在组成型启动子控制下的组分和在一种或多种诱导型启动子控制下的另一组分。例如,可以从293细胞(例如,其包含在组成型启动子控制下的辅助功能)生成已被工程化以稳定地包含所需组分的宿主细胞,该293细胞包含在一种或多种诱导型启动子控制下的rep和/或cap蛋白。
产生本公开的依赖性细小病毒颗粒所需的有效载荷(例如小基因)、rep序列、cap序列和辅助功能可以以转移其上携带的序列的任何遗传元件的形式(例如,以载体或载体组合的形式)递送至包装宿主细胞。可以通过任何合适的方法(包括本文所述的方法)递送遗传元件。用于构建本公开的遗传元件、载体和其他核酸的方法是本领域技术人员已知的,并且包括基因工程、重组工程和合成技术。参见,例如,Sambrook等人,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Press,Cold Spring Harbor,NY。类似地,产生rAAV病毒粒子的方法是众所周知的并且对合适的方法的选择不是对本发明的限制。参见,例如,K.Fisher等人,J.Virol,70:520-532(1993)和美国专利5,478,745。除非另有说明,否则本文所述的依赖性细小病毒ITR和其他选定的依赖性细小病毒组分可以容易地选自任何依赖性细小病毒物种和血清型,例如AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV9。ITR或其他依赖性细小病毒组分可以使用本领域技术人员可用的技术从依赖性细小病毒物种或血清型中容易地分离。依赖性细小病毒物种和血清型可以从学术、商业或公共来源分离或获得(例如,美国典型培养物保藏中心(the American Type Culture Collection),Manassas,VA)。在一些实施例中,依赖性细小病毒序列可以通过合成或其他合适的方式通过参考公开的序列(如在文献中或在如例如GenBank或PubMed的数据库中可获得的公开的序列)而获得。
本公开的依赖性细小病毒颗粒(例如,包括变体衣壳多肽和例如有效载荷)可以使用允许产生依赖性细小病毒或生物产品并且可以维持在培养物中的任何无脊椎动物细胞类型来产生。在一些实施例中,昆虫细胞可用于产生本文所述的组合物或用于制备本文所述的依赖性细小病毒颗粒的方法中。例如,所使用的昆虫细胞系可以来自草地贪夜蛾(如Sf9、SF21、SF900+)、果蝇细胞系、蚊子细胞系(例如,白纹伊蚊衍生的细胞系)、家养蚕细胞系(例如,家蚕细胞系)、粉纹夜蛾细胞系(如High Five细胞)或鳞翅目细胞系(如暗巫夜蛾细胞系)。在一些实施例中,昆虫细胞对杆状病毒感染敏感,包括High Five、Sf9、Se301、SeIZD2109、SeUCR1、SP900+、Sf21、BTI-TN-5B1-4、MG-1、Tn368、HzAml、BM-N、Ha2302、Hz2E5和Ao38。
在一些实施例中,本公开的方法可以用允许依赖性细小病毒的复制或生物产品的产生并且可以维持在培养物中的任何哺乳动物细胞类型进行。在一些实施例中,所使用的哺乳动物细胞可以是HEK293、HeLa、CHO、NS0、SP2/0、PER.C6、Vero、RD、BHK、HT 1080、A549、Cos-7、ARPE-19或MRC-5细胞。
在昆虫细胞中表达蛋白质(例如,重组或异源蛋白质,例如依赖性细小病毒多肽)的方法已有充分记载,将核酸(如载体,例如昆虫细胞相容性载体)引入此类细胞的方法以及将此类细胞维持在培养物中的方法也是如此。参见,例如,METHODS IN MOLECULARBIOLOGY,Richard编辑,Humana Press,N J(1995);O'Reilly等人,BACULOVIRUSEXPRESSION VECTORS,A LABORATORY MANUAL,Oxford Univ.Press(1994);Samulski等人,J.Vir.63:3822-8(1989);Kajigaya等人,Proc.Nat'l.Acad.Sci.USA 88:4646-50(1991);Ruffing等人,J.Vir.66:6922-30(1992);Kirnbauer等人,Vir.219:37-44(1996);Zhao等人,Vir.272:382-93(2000);以及Samulski等人,美国专利第6,204,059号。在一些实施例中,昆虫细胞中编码依赖性细小病毒多肽(例如,依赖性细小病毒基因组)的核酸构建体是昆虫细胞相容性载体。如本文所使用的,“昆虫细胞相容性载体”是指能够有效转化或转染昆虫或昆虫细胞的核酸分子。示例性生物载体包括质粒、线性核酸分子和重组病毒。可以使用任何载体,只要它是昆虫细胞相容的即可。载体可以整合到昆虫细胞的基因组中或保留在染色体外。载体可以永久或暂时存在,例如作为附加型载体。可以通过本领域已知的任何方式引入载体。此类方式包括但不限于细胞的化学处理、电穿孔或感染。在一些实施例中,载体是杆状病毒、病毒载体或质粒。
在一些实施例中,编码依赖性细小病毒多肽的核酸序列可操作地连接至调控表达控制序列以在特定细胞类型如Sf9或HEK细胞中表达。本领域技术人员已知的用于在昆虫宿主细胞或哺乳动物宿主细胞中表达外源基因的技术可以与本公开的组合物和方法一起使用。用于昆虫细胞中多肽的分子工程和表达的方法描述于例如Summers和Smith.AManualof Methods for Baculovirus Vectors and Insect Culture Procedures,TexasAgricultural Experimental Station Bull.第7555号,College Station,Tex.(1986);Luckow.1991.于Prokop等人,Cloning and Expression of Heterologous Genes inInsect Cells with Baculovirus Vectors'Recombinant DNA Technology andApplications,97-152(1986);King,L.A.和R.D.Possee,The baculovirus expressionsystem,Chapman and Hall,United Kingdom(1992);O'Reilly,D.R.,L.K.Miller,V.A.Luckow,Baculovirus Expression Vectors:A Laboratory Manual,New York(1992);W.H.Freeman和Richardson,C.D.,Baculovirus Expression Protocols,Methods inMolecular Biology,第39卷(1995);美国专利第4,745,051号;US2003148506;和WO 03/074714。适合于编码依赖性细小病毒多肽的核苷酸序列的转录的启动子包括多面体、p10、p35或IE-1启动子并且还考虑了上述参考文献中描述的其他启动子。
在一些实施例中,提供包含本文所述的核酸的细胞包括获取包含该核酸的细胞。
培养细胞、无细胞体系和其他翻译体系的方法是本领域技术人员已知的。在一些实施例中,培养细胞包括向细胞提供合适的培养基并将细胞和培养基孵育持续适合实现病毒颗粒产生的时间。
在一些实施例中,制备依赖性细小病毒颗粒的方法进一步包括纯化步骤,该纯化步骤包括将依赖性细小病毒颗粒从一种或多种其他组分(例如,从细胞或培养基组分)分离。
在一些实施例中,依赖性细小病毒颗粒的产生包括以下项中的一者或多者(例如,全部):依赖性细小病毒多肽的表达、依赖性细小病毒衣壳的组装、依赖性细小病毒基因组的表达(例如,复制),以及将依赖性细小病毒基因组包装到依赖性细小病毒衣壳中以产生依赖性细小病毒颗粒。在一些实施例中,依赖性细小病毒颗粒的产生进一步包括依赖性细小病毒颗粒的分泌。
在一些实施例中,并且如本文别处所述,编码变体衣壳多肽的核酸分子位于依赖性细小病毒基因组中。在一些实施例中,并且如本文别处所述,将编码变体衣壳多肽的核酸分子与依赖性细小病毒基因组一起包装到依赖性细小病毒颗粒中,作为制备本文所述的依赖性细小病毒颗粒的方法的一部分。在其他实施例中,编码变体衣壳多肽的核酸分子不被包装到通过本文所述的方法制备的依赖性细小病毒颗粒中。
在一些实施例中,制备本文所述的依赖性细小病毒颗粒的方法产生包含有效载荷(例如,本文所述的有效载荷)和变体衣壳多肽的依赖性细小病毒颗粒。在一些实施例中,有效载荷包含第二核酸(例如,除了依赖性细小病毒基因组之外),并且依赖性细小病毒颗粒的产生包括将第二核酸包装到依赖性细小病毒颗粒中。在一些实施例中,用于制备依赖性细小病毒颗粒的方法中的细胞、无细胞体系或其他翻译体系包含第二核酸。在一些实施例中,第二核酸包含外源序列(例如,对依赖性细小病毒、细胞或将施用依赖性细小病毒颗粒的靶细胞或受试者是外源的)。在一些实施例中,外源序列编码外源多肽。在一些实施例中,外源序列编码治疗产品。
在一些实施例中,本文所述的核酸或多肽通过本领域技术人员已知的方法产生。本公开的核酸、多肽及其片段可以通过任何合适的方式,包括重组生产、化学合成或其他合成方式来产生。此类产生方法在本领域技术人员的知识范围内并且不限制本发明。
应用
本公开部分地涉及包含本文所述的核酸、多肽或颗粒的组合物。本公开进一步部分地涉及利用本文所述的组合物、核酸、多肽或颗粒的方法。基于本公开将显而易见,本文公开的核酸、多肽、颗粒和方法具有多种用途。
本公开部分地涉及包含本文所述的核酸(例如编码变体衣壳多肽的核酸)的载体。许多类型的载体是本领域技术人员已知的。在一些实施例中,载体包含质粒。在一些实施例中,载体是分离的载体,例如从细胞或其他生物组分中去除的载体。
本公开部分地涉及细胞、无细胞体系或其他翻译体系,其包含本文所述的核酸或载体,例如包含编码变体衣壳多肽的核酸分子的核酸或载体。在一些实施例中,细胞、无细胞体系或其他翻译体系能够产生包含变体衣壳多肽的依赖性细小病毒颗粒。在一些实施例中,细胞、无细胞体系或其他翻译体系包含核酸,该核酸包含依赖性细小病毒基因组或足以促进包含变体衣壳多肽的依赖性细小病毒颗粒产生的依赖性细小病毒基因组的组分。
在一些实施例中,细胞、无细胞体系或其他翻译体系进一步包含促进依赖性细小病毒颗粒产生和/或分泌的一种或多种非依赖性细小病毒核酸序列。所述序列在本文中被称为辅助序列。在一些实施例中,辅助序列包含来自另一种病毒,例如腺病毒或疱疹病毒的一个或多个基因。在一些实施例中,辅助序列的存在对于依赖性细小病毒颗粒的产生和/或分泌是必需的。在一些实施例中,细胞、无细胞体系或其他翻译体系包含含有一个或多个辅助序列的载体,例如质粒。
在一些实施例中,细胞、无细胞体系或其他翻译体系包含第一核酸和第二核酸,其中第一核酸包含编码一个或多个依赖性细小病毒基因(例如,Cap基因、Rep基因或完整的依赖性细小病毒基因组)的序列和辅助序列,并且其中第二核酸包含有效载荷。在一些实施例中,细胞、无细胞体系或其他翻译体系包含第一核酸和第二核酸,其中第一核酸包含编码一个或多个依赖性细小病毒基因(例如,Cap基因、Rep基因或完整的依赖性细小病毒基因组)的序列和有效载荷,并且其中第二核酸包含辅助序列。在一些实施例中,细胞、无细胞体系或其他翻译体系包含第一核酸和第二核酸,其中第一核酸包含辅助序列和有效载荷,并且其中第二核酸包含编码一个或多个依赖性细小病毒基因(例如,Cap基因、Rep基因或完整的依赖性细小病毒基因组)的序列。在一些实施例中,细胞、无细胞体系或其他翻译体系包含第一核酸、第二核酸和第三核酸,其中第一核酸包含编码一个或多个依赖性细小病毒基因(例如,Cap基因、Rep基因或完整的依赖性细小病毒基因组)的序列,第二核酸包含辅助序列,并且第三核酸包含有效载荷。
在一些实施例中,第一核酸、第二核酸和任选的第三核酸位于单独的分子中,例如单独的一个或多个载体和基因组DNA。在一些实施例中,第一核酸、第二核酸和任选的第三核酸中的一个、两个或全部被整合(例如,稳定整合)到细胞的基因组中。
本公开的细胞可以通过用本文所述的核酸转染合适的细胞来产生。在一些实施例中,制备包含如本文所提供的变体衣壳多肽的依赖性细小病毒颗粒的方法或改进制备依赖性细小病毒颗粒的方法包括提供本文所述的细胞。在一些实施例中,提供细胞包括用本文所述的一种或多种核酸转染合适的细胞。
适合于与本文所述的核酸和载体一起使用的许多类型和种类的细胞是本领域已知的。在一些实施例中,细胞是人类细胞。在一些实施例中,细胞是永生化细胞或来自本领域已知的细胞系的细胞。在一些实施例中,细胞是HEK293细胞。
病毒颗粒和递送有效载荷的方法
本公开部分地涉及一种将有效载荷递送至细胞(例如受试者中或样本中的细胞)的方法。在一些实施例中,将有效载荷递送至细胞的方法包括使细胞与包含变体衣壳多肽(例如,本文所述)的依赖性细小病毒颗粒接触,该变体衣壳多肽包含有效载荷。在一些实施例中,依赖性细小病毒颗粒是本文所述的依赖性细小病毒颗粒并且包含本文所述的有效载荷。在一些实施例中,细胞是肝脏细胞。
本公开进一步部分地涉及包含本文所述的衣壳多肽的病毒颗粒。在实施例中,病毒颗粒包含本文所述的衣壳多肽和核酸表达构建体。在实施例中,病毒颗粒的核酸表达构建体包含有效载荷。
在一些实施例中,有效载荷包含转基因。在一些实施例中,转基因是与转基因侧翼的载体序列异源的核酸序列,其编码所关注的多肽、RNA(例如,miRNA或siRNA)或其他产物。转基因的核酸可以以足以促进转基因在宿主细胞中转录、翻译和/或表达的方式与调控组分可操作地连接。
转基因可以是任何多肽或RNA编码序列,并且选定的转基因将取决于预期的用途。在一些实施例中,转基因包含报告序列,其在表达时产生可检测信号。此类报告序列包括但不限于编码比色报告基因(例如,β-内酰胺酶、β-半乳糖苷酶(LacZ)、碱性磷酸酶)的DNA序列、细胞分裂报告基因(例如,胸苷激酶)、荧光或发光报告基因(例如,绿色荧光蛋白(GFP)或荧光素酶)、抗性传递序列(例如氯霉素乙酰转移酶(CAT))、或膜结合蛋白,包括针对其的高亲和力抗体存在或可以通过常规方式产生,例如包含抗原标签,例如血凝素或Myc。
在一些实施例中,可操作地与驱动其表达的调控元件连接的报告序列提供可通过常规方式检测的信号,该常规方式包括酶、放射照相、比色、荧光或其他光谱测定、荧光活化细胞分选测定和免疫学测定,其包括酶联免疫吸附测定(ELISA)、放射免疫测定(RIA)和免疫组织化学。在一些实施例中,转基因编码可用于生物学和医学的产物,如RNA、蛋白质、肽、酶、显性失活突变体。在一些实施例中,RNA包括tRNA、核糖体RNA、dsRNA、催化RNA、小发夹RNA、siRNA、反式剪接RNA和反义RNA。在一些实施例中,RNA抑制或消除所治疗的受试者(例如,人或动物受试者)中靶核酸序列的表达。
在一些实施例中,转基因可用于纠正或改善基因缺陷。在一些实施例中,基因缺陷包括正常基因以低于正常水平表达的缺陷或功能性基因产物不表达的缺陷。在一些实施例中,转基因编码在宿主细胞中表达的治疗性蛋白或多肽。在一些实施例中,依赖性细小病毒颗粒可以包含或递送多个转基因,例如以纠正或改善由多亚基蛋白引起的基因缺陷。在一些实施例中,不同的转基因(例如,各自位于/递送于不同的依赖性细小病毒颗粒中,或位于/递送于单个依赖性细小病毒颗粒中)可用于编码蛋白质的每个亚基,或用于编码不同的肽或蛋白质,例如,当编码蛋白质亚基的DNA的大小较大时,例如对于免疫球蛋白、血小板衍生生长因子或肌营养不良蛋白。在一些实施例中,蛋白质的不同亚基可以由相同转基因编码,例如,编码每个亚基的单个转基因,其中每个亚基的DNA被内部核酶进入位点(IRES)或酶促切割序列(例如,弗林蛋白酶切割位点)分离。在一些实施例中,DNA可以由编码2A肽的序列分离,该2A肽在翻译后事件中自切割。参见,例如,Donnelly等人,J.Gen.Virol.,78(Pt1):13-21(1997年1月);Furler等人,Gene Ther.,8(11):864-873(2001年6月);Klump等人,Gene Ther 8(10):811-817(2001年5月)。
在一些实施例中,提供了包含基因组的病毒颗粒,其中基因组包含核酸表达构建体。核酸表达构建体可以包括有效载荷(例如包含异源转基因的有效载荷)和一个或多个调控元件。
在一些实施例中,调控元件包括启动子。在一些实施例中,启动子是在哺乳动物细胞,例如人类细胞、例如在所关注的人类细胞类型中具有活性的普遍存在的或组成型启动子。在一些实施例中,细胞类型是肝脏细胞,如例如肝细胞、肝星状细胞等。普遍存在的启动子的实例包括但不限于:CAG启动子(来自巨细胞病毒早期增强子元件的杂交体、鸡β肌动蛋白启动子,例如鸡β肌动蛋白基因的第一外显子和第一内含子,以及兔β珠蛋白基因的剪接受体)、鸡β肌动蛋白启动子、CBA启动子、人EF1-α启动子及其片段。在一些实施例中,启动子是组织特异性启动子,例如在肝脏组织或肝脏的细胞中特异性的启动子。肝脏特异性启动子的实例包括但不限于TBG启动子、hAAT启动子、CK8启动子和SPc5-12启动子。在实施例中,启动子序列的长度在100与1000个核苷酸之间。在实施例中,启动子序列的长度为约100、约200、约300、约400、约500、约600、约700、约800、约900或约1000个核苷酸。如前一句中所使用的,“约”是指所列举的长度的50个核苷酸以内的值。本领域技术人员可以容易地选择合适的调控元件,例如启动子,如但不限于本文所述的那些。
在一些实施例中,核酸表达构建体包含内含子。内含子可以位于启动子与异源转基因之间。在一些方面,内含子位于表达构建体上异源转基因的5’处,例如紧邻异源转基因的5’处或异源转基因的5’处的100个或更少的核苷酸处。在一些方面,内含子是衍生自人b-珠蛋白和Ig重链的嵌合内含子(也称为b-珠蛋白剪接供体/免疫球蛋白重链剪接受体内含子,或b-珠蛋白/IgG嵌合内含子;Reed,R.,等人Genes and Development,1989,通过引用整体并入本文)。在其他方面,内含子是VH4内含子或SV40内含子。
如本文所提供的,在一些实施例中,提供了包含有效载荷的病毒颗粒,其中该有效载荷包含含有异源转基因的核酸。在一些实施例中,异源转基因编码RNA干扰剂,例如siRNA、shRNA或其他干扰核酸。
在一些实施例中,有效载荷包括编码治疗性多肽的异源转基因。在一些方面,异源转基因是人类基因或其片段。在一些方面,治疗性多肽是人类蛋白。在一些实施例中,病毒颗粒的异源转基因编码可用于治疗疾病的分子,并且将病毒颗粒施用至有此需要的患者以治疗所述疾病。在一些方面,有效载荷包含有效治疗慢性肝病的分子,如例如RNA干扰核苷酸(例如,抑制APOL-1的shRNA、siRNA或miRNA)。根据本公开的疾病(和异源转基因或由所述异源转基因编码的分子)的实例包括:MPSI(α-L-艾杜糖醛酸酶(IDUA));MPS II-亨特综合征(艾杜糖醛酸-2-硫酸酯酶(IDS));蜡样脂褐质沉积症-贝敦氏症(CLN1、CLN2、CLN10、CLN13、CLN5、CLN11、CLN4、CNL14、CLN3、CLN6、CLN7、CLN8、CLN12);MPS Illa-Sanfilippo A型综合征(硫酸肝素硫酸酯酶(也称为N-磺基葡萄糖胺磺基氢化酶(SGSH));MPS IIIB-Sanfilippo b型综合征(N-乙酰基-α-D-氨基葡萄糖苷酶(NAGLU));MPS VI-Maroteaux-Lamy综合征(芳基硫酸酯酶B);MPS IV A-Morquio综合征A型(GALNS);MPS IV B-Morquio综合征B型(GLB1);成骨不全症I型、II型、III型或IV型(COL1Al和/或COL1A2);遗传性血管性水肿(SERPING1、C1NH);成骨不全症V型(IFITM5);成骨不全症VI型(SERPINF1);成骨不全症VII型(CRTAP);成骨不全症VIII型(LEPRE1和/或P3H1);成骨不全症IX型(PPIB);戈谢病I型、II型和III型(葡糖脑苷脂酶;GBAl);帕金森病(葡糖脑苷脂酶;GBAl和/或多巴胺脱羧酶);Pompe(酸性麦芽糖酶;GAA;hGAA);异染性脑白质营养不良(芳基硫酸酯酶A);MPS VII-Sly综合征(β-葡萄糖醛酸酶);MPS VIII(葡萄糖胺-6-硫酸硫酸酯酶);MPS IX(透明质酸酶);枫糖尿病(BCKDHA、BCKDHB、和/或DBT);Niemann-Pick病(鞘磷脂酶);帕金森病(抗-α突触核蛋白RNAi);阿尔茨海默病(抗突变体APP RNAi);没有鞘磷脂酶缺乏的Niemann-Pick病(编码胆固醇代谢酶的NPC1或NPC基因);泰伊-萨克斯二氏病(β-己糖胺酶的α亚基);Sandhoff病(β-己糖胺酶的α和β亚基);Fabry病(α-半乳糖苷酶缺乏);岩藻糖苷贮积症(岩藻糖苷酶(FUCAl));α-甘露糖苷贮积症(α-甘露糖苷酶);β-甘露糖苷贮积症(β-甘露糖苷酶);Wolman病(胆固醇酯氢化酶);Dravet综合征(SCN1A、SCN1B、SCN2A、GABRG2);帕金森病(神经秩蛋白);帕金森病(神经胶质衍生生长因子(GDGF));帕金森病(酪氨酸羟化酶);帕金森病(谷氨酸脱羧酶;FGF-2;BDGF);脊髓性肌肉萎缩症(SMN、包括SMN1或SMN2);弗里德希氏共济失调(共济蛋白);肌萎缩性侧索硬化症(ALS)(SOD1抑制剂,例如,抗-SOD1 RNAi);糖原贮积病la(葡萄糖-6-磷酸酶);XLMTM(MTMl);Crigler Najjar(UGTlAl);CPVT(CASQ2);脊髓小脑性共济失调(ATXN2;ATXN3或其他ATXN基因;抗-突变体Machado-Joseph病/SCA3等位基因RNAi);Rett综合征(MECP2或其片段);全色盲(CNGB3、CNGA3、GNAT2、PDE6C);Choroidermia(CDM);Danon病(LAMP2);囊性纤维化(CFTR或其片段);杜氏肌营养不良(迷你-/微小-杜氏肌营养不良蛋白基因);SARS-Cov-2感染(抗-SARS-Cov-2 RNAi、SARS-Cov-2基因组片段或S蛋白(包括变体));肢带型肌营养不良症2C型-γ-肌聚糖病(人-α-肌糖);晚期心力衰竭(SERCA2a);类风湿性关节炎(TNFR:Fc融合;抗-TNF抗体或其片段);莱伯氏先天性黑蒙症(GAA);X-连锁肾上腺脑白质营养不良(ABCD1);肢带型肌营养不良症2C型-γ-肌聚糖病(γ-肌糖);安吉尔曼综合征(UBE3A);视网膜色素变性症(hMERTK);年龄相关黄斑退化(sFLT01);Phelan-McDermid综合征(SHANK3;22q13.3替换);贝克肌萎缩症和散发性包涵体肌炎(羟基脲卵泡抑素344);帕金森病(GDNF);异染性脑白质营养不良-MLD(cuARSA);丙型肝炎(抗-HCV RNAi);肢带型肌营养不良症2D型(hSGCA);人类免疫缺陷病毒感染;(PG9DP);急性间歇性卟啉症(PBGD);莱伯氏遗传性视神经病变(PIND4v2);α-1抗胰蛋白酶缺乏症(αIAT);X-连锁视网膜劈裂症(RS1);无脉络膜症(hCHM);巨轴突神经病变(GAN);乙型血友病(因子IX);纯合子FH(hLDLR);Dysferlin肌病(DYSF);全色盲(CNGA3或CNGB3);进行性核上性麻痹(MAPT;抗-Tau;抗-MAPT RNAi);鸟氨酸氨甲酰基转移酶缺乏症(OTC);甲型血友病(因子VIII);年龄相关黄斑退化(AMD)、包括湿性AMD(抗VEGF抗体或RNAi);X-连锁视网膜色素变性症(RPGR);肌强直性营养不良1型(DMPK;抗-DMPK RNAi、包括抗-CTG三核苷酸重复RNAi);肌强直性营养不良2型(CNBP);面肩胛肱型肌营养不良症(D4Z4DNA);眼咽肌营养不良症(PABPN1;突变PABPN1抑制剂(例如,RNAi));黏多糖贮积症VI型(hARSB);莱伯遗传性视神经病变(ND4);X-连锁肌管型肌病(MTMl);Crigler-Najjar综合征(UGTlAl);视网膜色素变性症(hPDE6B);黏多糖贮积症3B型(hNAGLU);杜氏肌营养不良(GALGT2);阿尔茨海默病(NGF;ApoE4;ApoE2;ApoE3;抗-ApoE RNAi);家族性脂蛋白脂酶缺乏症(LPL);α-1抗胰蛋白酶缺乏症(hAAT);莱伯氏先天性黑蒙症2(hRPE65v2);贝敦氏症;婴儿神经元蜡样质脂褐质沉积症(CLN2);亨廷顿氏病(HTT;抗-HTT RNAi);脆性X染色体综合征(FMR1);莱伯氏遗传性视神经病变(PlND4v2);芳香氨基酸脱羧酶缺乏症(hAADC);视网膜色素变性症(hMERKTK);和视网膜色素变性症(RLBPl)。在一些实施例中,异源转基因编码治疗性多肽。在一些方面,异源转基因是人类基因或其片段。在一些方面,治疗性多肽是人类蛋白。在一些方面,异源转基因编码抗体或其片段(例如抗体轻链、抗体重链、Fab或scFv)。由异源转基因编码的抗体或其片段的实例包括但不限于:抗Ab抗体(例如索拉珠单抗、GSK933776和仑卡奈单抗)、抗sortilin(例如AL-001)、抗Tau(例如ABBV-8E12、UCB-0107和NI-105)、抗SEMA4D(例如VX15/2503)、抗α突触核蛋白(例如普尼珠单抗、NI-202和MED-1341)、抗SOD1(例如NI-204)、抗CGRP受体(例如艾普奈珠单抗、瑞玛奈珠单抗或伽奈珠单抗(galcanezumab))、抗VEGF(例如塞瓦珠单抗、雷珠单抗、贝伐珠单抗和布洛赛珠单抗(brolucizumab))、抗EpoR(例如LKA-651)、抗ALKl(例如,阿伐苏单抗)、抗C5(例如,特度鲁单抗、瑞武丽珠单抗和依库丽单抗)、抗CD105(例如,卡妥昔单抗)、抗CClQ(例如,ANX-007)、抗TNFa(例如,阿达木单抗、英夫利昔单抗和戈利木单抗)、抗RGMa(例如,依来努单抗)、抗TTR(例如,NI-301和PRX-004)、抗CTGF(例如,帕姆雷芦单抗(pamrevlumab))、抗IL6R(例如,萨特利珠单抗、托珠单抗和萨利霉素)、抗IL6(例如西妥昔单抗、克拉扎珠单抗、西鲁单抗、奥洛珠单抗和吉瑞利单抗(gerilimzumab))、抗IL4R(例如,度普利尤单抗)、抗IL17A(例如,依奇珠单抗和苏金单抗)、抗IL5R(例如瑞利珠单抗)、抗IL-5(例如,贝那利珠单抗和美泊利珠单抗)、抗IL13(例如,曲罗芦单抗)、抗IL12/IL23(例如,优特克单抗)、抗CD 19(例如,伊奈利珠单抗)、抗IL31RA(例如奈莫利珠单抗)、抗ITGF7 mAb(例如依曲利组单抗)、抗SOSTmAb(例如罗莫单抗)、抗IgE(例如奥马珠单抗)、抗TSLP(例如奈莫利珠单抗)、抗pKal mAb(例如拉那鲁单抗)、抗ITGA4(例如,那他珠单抗)、抗ITGA4B7(例如,维多珠单抗)、抗BLyS(例如,贝利木单抗)、抗PD-1(例如,纳武单抗和帕博利珠单抗)、抗RANKL(例如,地诺单抗)、抗PCSK9(例如,阿利库单抗和依洛尤单抗)、抗ANGPTL3(例如,依维苏单抗*)、抗OxPL(例如,E06)、抗fD(例如,兰帕利珠单抗)或抗MMP9(例如,安地卡昔单抗),任选地其中重链(Fab和Fc区)和轻链通过自切割弗林蛋白酶(F)/F2A或弗林蛋白酶(F)/T2A、IRES位点或柔性接头分离,例如,确保重链和轻链多肽的等量表达。
在一些实施例中,病毒颗粒包含编码基因组编辑系统的异源转基因。实例包括CRISPR基因组编辑系统(例如,CRISPR基因组编辑系统的一种或多种组分,如例如引导RNA分子和/或RNA引导的核酸酶,如Cas酶,如Cas9、Cpf1等)、锌指核酸酶基因组编辑系统、TALEN基因组编辑系统或大范围核酸酶基因组编辑系统。在实施例中,基因组编辑系统靶向哺乳动物(例如人类),基因组靶序列。在实施例中,病毒颗粒包含编码可靶向转录调控因子的异源转基因。实例包括基于CRISPR的转录调控因子(例如,基于CRISPR的转录调控因子中的一种或多种组分,例如引导RNA分子和/或酶失活的RNA引导的核酸酶/转录因子(“TF”)融合蛋白,如dCas9-TF融合、dCpf1-TF融合等)、锌指转录因子融合蛋白、TALEN转录调控因子或大范围核酸酶转录调控因子。
在一些实施例中,治疗性分子或体系的组分由多于一种独特的病毒颗粒(例如,包括多于一种独特的病毒颗粒的群体)递送。在其他实施例中,治疗分子或治疗分子或体系的组分由单个独特的病毒颗粒(例如,包括单个独特的病毒颗粒的群体)递送。
转基因也可以编码任何生物活性产物或其他产物,例如研究所需的产物。本领域技术人员可以容易地选择合适的转基因,如但不限于本文所述的那些。
由转基因编码的蛋白质的其他实例包括但不限于:集落刺激因子(CSF);血液因子,如β-珠蛋白、血红蛋白、组织纤溶酶原活化剂和凝血因子;白细胞介素;可溶性受体,如可溶性TNF-α受体、可溶性VEGF受体、可溶性白细胞介素受体(例如,可溶性IL-1受体和可溶性II型IL-1受体)、或可溶性受体的配体结合片段;生长因子,如角质细胞生长因子(KGF)、干细胞因子(SCF)或成纤维细胞生长因子(FGF,如碱性FGF和酸性FGF);酶;趋化因子;酶活化剂,如组织纤溶酶原活化剂;血管生成剂,如血管内皮生长因子、神经胶质瘤衍生的生长因子、血管生成素或血管生成素-2;抗血管生成剂,如可溶性VEGF受体;蛋白质疫苗;神经活性肽,如神经生长因子(NGF)或催产素;溶栓剂;组织因子;巨噬细胞活化因子;金属蛋白酶的组织抑制剂;或IL-1受体拮抗剂。
因此,本文提供了包含衣壳多肽的病毒颗粒,该衣壳多肽包含:(a)SEQ ID NO:2的VP1、VP2或VP3序列,(b)包含VAR-1的突变集并且与SEQ ID NO:1具有大于80%(例如,大于90%、大于91%、大于92%、大于93%、大于94%、大于95%、大于96%、大于97%、大于98%、大于99%)同一性的VP1、VP2或VP3序列,或(c)包含VAR-1的突变集并相对于SEQ ID NO:1具有至少1、2、3、4、5、6、7、8、9或10个另外的突变,但少于40、39、38、37、36、35、34、33、32或31个另外的突变的VP1、VP2或VP3序列。在实施例中,衣壳多肽包含SEQ ID NO:2的VP1、VP2和VP3序列。在实施例中,病毒颗粒包含核酸分子,该核酸分子包含异源转基因,例如编码针对肝脏疾患的产物的异源转基因。在实施例中,病毒颗粒的核酸分子进一步包含一个或多个调控元件,例如包含启动子,例如可操作地连接至异源转基因并在所关注的组织中调节来自异源转基因的表达的启动子。在实施例中,病毒颗粒的核酸分子进一步包含以下中的一者或多者:(a)依赖性细小病毒ITR、(b)内含子、(c)增强子或阻遏子序列、(d)填充序列和(e)多聚A序列。
因此,本文提供了包含衣壳多肽的病毒颗粒,该衣壳多肽包含:(a)SEQ ID NO:3的VP1、VP2或VP3序列,(b)包含VAR-2的突变集并且与SEQ ID NO:1具有大于80%(例如,大于90%、大于91%、大于92%、大于93%、大于94%、大于95%、大于96%、大于97%、大于98%、大于99%)同一性的VP1、VP2或VP3序列,或(c)包含VAR-1的突变集并相对于SEQ ID NO:1具有至少1、2、3、4、5、6、7、8、9或10个另外的突变,但少于40、39、38、37、36、35、34、33、32或31个另外的突变的VP1、VP2或VP3序列。在实施例中,衣壳多肽包含SEQ ID NO:3的VP1、VP2和VP3序列。在实施例中,病毒颗粒包含核酸分子,该核酸分子包含异源转基因,例如编码针对肝脏疾患的产物的异源转基因。在实施例中,病毒颗粒的核酸分子进一步包含一个或多个调控元件,例如包含启动子,例如可操作地连接至异源转基因并在所关注的组织中调节来自异源转基因的表达的启动子。在实施例中,病毒颗粒的核酸分子进一步包含以下中的一者或多者:(a)依赖性细小病毒ITR、(b)内含子、(c)增强子或阻遏子序列、(d)填充序列和(e)多聚A序列。
本公开进一步部分地涉及一种将有效载荷递送至受试者(例如动物或人类受试者)的方法。在一些实施例中,向受试者递送有效载荷的方法包括向受试者施用包含含有有效载荷的变体多肽(例如本文所述)的依赖性细小病毒颗粒,例如以足以递送有效载荷的量和时间。在一些实施例中,依赖性细小病毒颗粒是本文所述的依赖性细小病毒颗粒并且包含本文所述的有效载荷。在一些实施例中,颗粒将有效载荷递送至肝脏。在一些实施例中,与没有变体衣壳多肽的颗粒相比或与野生型衣壳多肽相比,向肝脏的递送增加。
治疗方法
本公开部分地涉及一种治疗受试者(例如动物或人类受试者)的疾病或病症的方法。如本文所使用的,术语“治疗疾病或病症”是指治疗明显的疾病或病症,例如,当受试者已经患有该疾病或病症的一种或多种症状时,或者是指治疗预先显现的疾病或病症,例如,当受试者被鉴定为患有疾病或病症但尚未表现出该疾病或病症的一种或多种症状时。可以通过例如基因测试来鉴定预先显现的病症。在一些实施例中,治疗受试者的疾病或病症的方法包括向受试者施用包含本文所述的变体多肽例如包含本文所述的有效载荷的依赖性细小病毒颗粒。在一些实施例中,以有效治疗疾病或病症的量和/或时间施用包含变体多肽且包含本文所述的有效载荷的依赖性细小病毒颗粒。在一些实施例中,有效载荷是治疗产品。在一些实施例中,有效载荷是核酸,例如编码外源多肽的核酸。
包含本文所述的变体多肽或通过本文所述的方法产生的依赖性细小病毒颗粒可用于表达一种或多种治疗性蛋白以治疗各种疾病或疾患。在一些实施例中,疾病或疾患是癌症,例如,如上皮癌、肉瘤、白血病、淋巴瘤等癌症;或自身免疫性疾病,例如多发性硬化症。癌的非限制性实例包括:食道癌;支气管癌;结肠癌;结直肠癌;胃癌;肝细胞癌;基底细胞癌、鳞状细胞癌(各种组织);膀胱癌,包括移行细胞癌;肺癌,包括小细胞肺癌和非小细胞肺癌;肾上腺皮质癌;汗腺癌;皮脂腺癌;甲状腺癌;胰腺癌;乳腺癌;卵巢癌;前列腺癌;腺癌;乳头状癌;乳头状腺癌;囊腺癌;髓样癌;肾细胞癌;子宫癌;睾丸癌;成骨癌;导管原位癌或胆管癌;绒毛膜癌;精原细胞瘤;胚胎癌;威尔姆斯肿瘤;宫颈癌;上皮癌;和鼻咽癌。肉瘤的非限制性实例包括:纤维肉瘤、粘液肉瘤、脂肪肉瘤、血管肉瘤、内皮肉瘤、淋巴管肉瘤、软骨肉瘤、脊索瘤、成骨性肉瘤、骨肉瘤、淋巴管内皮肉瘤、滑膜瘤、间皮瘤、尤文氏肉瘤、平滑肌肉瘤、横纹肌肉瘤和其他软组织肉瘤。实体瘤的非限制性实例包括:室管膜瘤、松果体瘤、血管母细胞瘤、听神经瘤、少突胶质细胞瘤、神经胶质瘤、星形细胞瘤、成神经管细胞瘤、颅咽管瘤、脑血管瘤、黑素瘤、神经母细胞瘤和视网膜母细胞瘤。白血病的非限制性实例包括:慢性骨髓增殖综合征;T细胞CLL幼淋巴细胞白血病、急性髓性白血病;慢性淋巴细胞白血病,包括B细胞CLL、毛细胞白血病;和急性淋巴细胞白血病。淋巴瘤的实例包括但不限于:B细胞淋巴瘤,如伯基特氏淋巴瘤;和霍奇金淋巴瘤。在一些实施例中,疾病或疾患是遗传性疾患。在一些实施例中,遗传性疾患是镰刀型细胞贫血症、糖原贮积病(GSD,例如I、II、III、IV、V、VI、VII、VIII、IX、X、XI、XII、XIII和XIV型GSD)、囊性纤维化、溶酶体酸性脂肪酶(LAL)缺乏症1、泰伊-萨克斯二氏病、苯丙酮尿症、粘多糖症、半乳糖血症、肌营养不良症(例如杜氏肌营养不良症)、血友病(如血友病A(经典血友病)或血友病B(圣诞节病))、威尔逊氏病、法布里病、戈谢病遗传性血管性水肿(HAE)和α1抗胰蛋白酶缺乏症。其他疾病或疾患的实例在上文“递送有效载荷的方法”部分中提供。
在一些实施例中,疾病或病症是肝脏的疾病。在一些实施例中,疾病或病症是慢性肝脏疾病。
在一些实施例中,向受试者施用包含变体多肽且包含有效载荷(例如转基因)的依赖性细小病毒颗粒诱导受试者中有效载荷(例如转基因)的表达。在一些实施例中,在肝脏中诱导表达。在一些实施例中,与具有野生型衣壳蛋白的类似颗粒相比,肝脏中的产生增加。在受试者(例如受试者的血清)中表达的有效载荷(例如转基因,例如异源蛋白质,例如治疗性多肽)的量可以变化。例如,在一些实施例中,有效载荷(例如转基因的蛋白质或RNA产物),可以以至少约9μg/ml、至少约10μg/ml、至少约50μg/ml、至少约100μg/ml、至少约200μg/ml、至少约300μg/ml、至少约400μg/ml、至少约500μg/ml、至少约600μg/ml、至少约700μg/ml、至少约800μg/ml、至少约900μg/ml或至少约1000μg/ml的量在受试者的血清中表达。在一些实施例中,有效载荷(例如转基因的蛋白质或RNA产物),以约9μg/ml、约10μg/ml、约50μg/ml、约100μg/ml、约200μg/ml、约300μg/ml、约400μg/ml、约500μg/ml、约600μg/ml、约700μg/ml、约800μg/ml、约900μg/ml、约1000μg/ml、约1500μg/ml、约2000μg/ml、约2500μg/ml、或这些值中任意两个之间的范围的量在受试者的血清中表达。
本文公开的序列可以按照同一性百分比来描述。技术人员将理解,此类特征涉及两个或更多个序列的比对。比对可以使用多种公开或可商购获得的多序列比对程序中的任一种来进行,如可经由互联网访问的“Clustal W”。作为另一个实例,可以使用GCG版本6.1的程序FASTA来比较核酸序列。FASTA提供了查询序列与搜索序列之间最佳重叠区的比对和序列同一性百分比。例如,核酸序列之间的同一性百分比可以使用FASTA及其默认参数来确定,如GCG版本6.1中提供的,该版本通过引用并入本文。类似的程序可用于氨基酸序列,例如“Clustal X”程序。可以使用的另外的序列比对工具由(蛋白质序列比对;(http://www.ebi.ac.uk/Tools/psa/emboss_needle/))和(核酸比对;http://www.ebi.ac.uk/Tools/psa/emboss_needle/nucleotide.html))提供。通常,以默认设置可以使用这些程序中的任何程序,尽管本领域技术人员可以根据需要改变这些设置。可替代地,本领域技术人员可以利用另一种算法或计算机程序,所述算法或计算机程序提供至少与参考算法和程序所提供的同一性或比对水平相同的同一性或比对。本文公开的序列可以进一步根据编辑距离来描述。将一个序列改变为另一序列的序列编辑(即单个碱基或核苷酸的添加、取代或缺失)的最小数量是两个序列之间的编辑距离。在一些实施例中,两个序列之间的距离被计算为莱文斯坦距离。
本文引用的所有出版物、专利申请、专利和其他出版物和参考文献(例如,序列数据库参考号)均通过引用整体并入本文。例如,本文提及的所有GenBank、Unigene和Entrez序列,例如在本文任何表中的序列,均通过引用并入本文。除非另有说明,否则本文指定的序列登录号,包括在本文任何表中的序列登录号,是指截至2020年8月21日的当前数据库条目。当一个基因或蛋白质引用多个序列登录号时,涵盖所有序列变体。
本发明通过以下实例进一步说明。提供实例仅用于说明目的,并且不应被解释为以任何方式限制本发明的范围或内容。
实例
实例1
文库创建
设计野生型AAV2的2.5E5衣壳变体的文库并将其克隆到质粒中以创建编码衣壳变体的质粒的文库。如前所述,编码每个变体的衣壳和独特衣壳变体条形码标识符的AAV变体基因组的文库被克隆到三个ITR质粒主链中(Ogden等人2019)。每个质粒主链都包含独特的基因组标识符,可以经由不同的施用途径分析生物分布和转导效率。经由贴壁HEK293T的瞬时三重转染,然后进行碘克沙醇梯度纯化来产生文库。
文库的体外评价
如下所述准备数据。为了测量每个变体的包装效率(或“生产”),使用两轮PCR制备来自质粒中的载体基因组和产生的AAV文库的条形码,用于Illumina测序。通过将产生的载体池中每个变体的条形码测序水平与用于创建载体池的输入质粒文库中每个变体的条形码序列水平进行比较来表达每个变体的产生效率(针对输入质粒文库中的存在进行归一化)。载体文库中变体频率的测量值还可以通过输入载体文库中的变体频率对生物分布和转导测量值进行下游归一化。产生效率报告于表1中,并且每个报告值均被报告为相对于野生型AAV2产生的log2产生。
非人类灵长类动物中的文库的体内评价
所有NHP实验均按照机构政策和NIH指南进行。选择体重为2.4-2.9kg、对抗AAV2中和抗体血清反应阴性(基于体外NAb测定,血清NAb滴度<1:20)的一只年轻成年雄性食蟹猴(Macaca fascicularis)和一只年轻成年雌性食蟹猴进行研究。在施用测试品之前,收集血液、房水(50μL)和玻璃体液(最多50μL)的样本。用氯胺酮和右美托咪定麻醉动物,并接受载体文库的玻璃体内注射(IVT;在50μL中的4.8E11 vg/眼)、前房内注射(IC;在50μL中的8.5E11 vg/眼)和静脉内注射(IV;1.8-2.5E13 vg/kg)。在生命期间,经由间接检眼镜检查和裂隙灯活组织显微镜检查来监测动物的眼部炎症迹象,并根据动物设施的标准操作程序(SOP)和兽医的建议根据需要经每周IM注射类固醇(甲泼尼龙,40-80mg)和局部类固醇(Durezol)以及阿托品进行治疗。注射后1h、4h和24h以及每周收集血清样本。注射后4周处死动物并收集组织用于生物分布和转导分析。除眼部组织外,表3还显示了收集的其他组织样本的列表。将所有样本收集到(Sigma-Aldrich)中并在室温孵育过夜,之后将排干并将样本冷冻在-80℃。此外,尸检时收集房水、玻璃体液、血清和脑脊液的样本,并保存在-80℃。
表3.收集的组织的列表。
为了进行生物分布和转导分析,使用Trizol/氯仿和异丙醇沉淀从组织样本中提取总DNA和RNA。RNA样本用TURBO DNA酶(Invitrogen)处理。使用Protoscript II逆转录酶(NEB)进行逆转录,其中引物对载体转基因具有特异性,并包含独特的分子标识符(UMI)。还制备了缺乏逆转录酶的对照反应(-RT对照)。用Luna Universal Probe qPCR Master Mix(NEB)使用对转基因构建体具有特异性的引物和探针进行生物分布和转导的定量。最后,通过使用与Illumina NGS平台兼容的引物扩增转基因条形码区域来制备用于下一代测序的样本,并使用NextSeq 550(Illumina)对样本进行测序。
测序后,从具有预期扩增子结构的read中提取条形码标签,并记录每个条形码的丰度(read数或UMI数)。分析仅限于输入质粒样本中存在的并且在变体序列中不包含错误的一组条形码,如通过针对输入质粒样本的变体区域的单独测序测定进行测量的。
为了聚合包装复制,对来自复制病毒产生样本的read计数进行了求和。为了聚合转导样本,对来自同一组织的样本的UMI计数进行了求和。
使用贝叶斯模型以聚合产生、生物分布和/或转导样本作为输入来计算病毒包装、组织的生物分布和转导。简而言之,使用概率编程和随机变分推理来模拟实际测试病毒颗粒与其设计的序列之间的测量过程和解耦来源(例如交叉包装、模板切换和DNA合成中的错误),并且来计算病毒产生、生物分布和转导(在各种组织样本中)以及错误率。输出是相对于野生型(WT)AAV2的计算的分布的log2转换的平均值。因此,正值表示所测量的特性比WT更好的性能,并且负值表示比WT性能更差。肝脏组织中的转导和生物分布报告于表1中。
实例2
经由贴壁HEK293T的瞬时三重转染,然后进行碘克沙醇梯度纯化,单独产生包含表2(序列)中提供的变体衣壳的病毒颗粒。每个变体衣壳都是由编码独特条形码的基因组和在普遍存在的启动子控制下的荧光报告基因产生的。如上所述评估产生效率。合并等量(vg)的每种病毒颗粒并以实例1中所用的剂量注射到非人灵长类动物(例如食蟹猴或非洲绿猴)中。例如,如实例1中所述评估病毒特性,包括生物分布和组织转导。
经由贴壁HEK293T的瞬时三重转染,然后进行碘克沙醇梯度纯化,单独产生包含衣壳(大约100个独特变体和野生型比较物)的选择的病毒颗粒,包括表2(序列)中提供的那些。最终合并的测试品内各个变体的代表性尽可能平衡在10倍范围内。每个变体衣壳都是由编码独特条形码的基因组和在普遍存在的启动子(cbh)控制下的荧光报告基因产生的。总之,每个变体都是用包含8个独特条形码的单独基因组产生的,提供了研究中生物重复的测量。所有NHP实验均按照机构政策和NIH指南进行。选择体重2.8-3kg的两只年轻成年雄性食蟹猴(Macaca fascicularis),一只抗AAV2中和抗体血清反应阴性(基于体外NAb测定,血清NAb滴度<1:20)和一只抗AAV2中和抗体血清反应阳性(1:128),以用于研究。在施用测试品之前,收集血液、房水(50μL)和玻璃体液(最多50μL)的样本。用氯胺酮和右美托咪定麻醉动物并接受载体文库的静脉内注射(IV;2E12vg/kg)。经由玻璃体内和前房内注射递送单独条形码变体的另外的文库。在生命期间,经由间接检眼镜检查和裂隙灯活组织显微镜检查来监测动物的眼部炎症迹象,并根据动物设施的标准操作程序(SOP)和兽医的建议根据需要经每周IM注射类固醇(甲泼尼龙,80mg)和局部类固醇(Durezol)以及阿托品进行治疗。注射后4周处死动物并收集组织用于生物分布和转导分析。解剖后对眼部组织和表3中描述的组织进行称重并在干冰上快速冷冻。如实例1中所述处理组织并评估生物分布/转导。结果如表4所示,并且结果衍生自来自两只测试动物中的每一者的至少4个肝脏组织碎片(总共至少8个样本)。来自该中通量实验的数据证实了来自实例1中描述的文库实验的发现,并且证明本文所述的病毒颗粒,如包含VAR-1或VAR-2的衣壳多肽的病毒颗粒,相对于野生型AAV5和野生型AAV2两者,表现出增强的肝脏转导。因此,这些衣壳多肽和包含这些衣壳多肽的病毒颗粒作为基因疗法载体,用于针对肝脏疾患的治疗或在肝脏组织的选择性和增强的转导是有益的情况下具有增强的实用性。
来自肝脏样本的单核RNA测序
来自实例2中所述的动物的总体肝脏样本是冷冻的。在-20℃解剖10mg肝脏样本切片,并在缓冲液(1.5mL 2X ST缓冲液[200uL 1M Tris-HCl pH 7.5(最终20mM);580uL5MNaCl(最终292mM);20uL 1M CaCl2(最终2mM);420uL 1M MgCl2(最终42mM);8.78mLN.F.H2O)]、90uL 10% Tween-20(最终0.03%)、3uL 10% BSA(最终0.01%)、15uL 40U/uL鼠RNA酶抑制剂(最终0.2U/uL)、1.392mL N.F.H2O)中在冰上切碎10
分钟,并且然后杜恩斯均质化以释放细胞核。均质化后,将样本(2ml)立即转移至含有2ml 9.5%+1x PBS+RNA酶抑制剂的15ml falcon管中。将样本混合并首先通过70微米过滤器过滤,并且然后通过40微米过滤器过滤。将一小部分(5ul)过滤的样本按1:4稀释于1xPBS+2% BSA+碘化丙啶(PI)中进行计数。将样本(现在约4ml)平均分入四个预涂有2%BSA+1xPBS+RNA酶抑制剂的1.5ml Protein Lobind离心管中。将样本在4℃、200RCF下离心5min。弃去上清液,并将沉淀物重悬于5% BSA+1xPBS+RNA酶抑制剂+PI中。然后在WOLF分选机上对细胞核进行分选。对样本进行门控用于对PI染色呈阳性的完整细胞核。通过用PI曲线下面积作为双峰的替代物进行门控,丢弃双峰。将FACS净化的细胞核在4℃、200RFC下离心5分钟。将沉淀物重悬于2%BSA+1xPBS+RNA酶抑制剂中并计数。根据10x封装的需要调整最终细胞核浓度。10x封装和文库制备:然后,我们按照制造商的标准说明使用10Xchromium平台进行单细胞封装。按照10x方案进行逆转录。使用具有掺入了Dyno病毒转录物特异性正向引物的10X特征条形码cDNA扩增试剂盒进行cDNA扩增。cDNA扩增后,根据10x标准方案,使用cDNA文库的一部分生成基因表达文库。同一cDNA文库的一小部分用于通过PCR扩增病毒基因组的条形码区域来生成目标文库。与Nextera Handle或TruSeq Handle结合的引物与病毒转录物特异性引物结合用于靶向扩增。当使用TruSeq-Handle引物进行扩增时,在靶向扩增后立即进行凝胶提取步骤,以从较大的线性扩增背景中选择出所关注的产物。一旦纯化靶向的扩增产物后,我们进行预索引和索引PCR,并使用Illumina Next Seq测序仪对文库进行测序。接下来,我们对来自从NHP肝脏组织中分离的细胞核的数据进行测序。我们将来自组织样本的单核RNA测序数据绘制在UMAP图(莱顿聚类)上以显示主要细胞簇,并将数据投射到根据MacParland等人(Nat.Commun.,20189(1):4383.doi:10.1038/s41467-018-06318-7,通过引用并入本文)的注释的肝脏细胞类型参考数据集上以鉴定肝细胞。图2绘制了结果。相对于所有野生型AAV2、AAV5和AAV9病毒颗粒,包含VAR-1或VAR-2的衣壳多肽的病毒颗粒两者均显示肝细胞的转导增加。VAR-1证明比野生型AAV2和AAV9在肝细胞转导方面提高了大约2.5倍,并且比野生型AAV5在肝细胞转导方面提高了15倍以上。VAR-2证明比野生型AAV2和AAV9在肝细胞转导方面提高了大约3倍,并且比野生型AAV5在肝细胞转导方面提高了18倍以上。总而言之,这些结果证明,包含本文所述的衣壳多肽的病毒颗粒具有改进的总体组织中的肝脏转导以及改进的靶向肝细胞(肝脏靶向基因疗法中所关注的细胞类型)的能力。
参考文献:
Ogden PJ,Kelsic ED,Sinai S,Church GM.Comprehensive AAV capsid fitnesslandscape reveals a viral gene and enables machine-guided design.Science.2019年11月29日;366(6469):1139-1143.doi:10.1126/science.aaw2900.PMID:31780559;PMCID:PMC7197022。
序列表
<110> 迪诺治疗公司
<120> 衣壳变体及其使用方法
<130> 257394.000902
<150> 63/214,021
<151> 2021-06-23
<160> 15
<170> PatentIn版本3.5
<210> 1
<211> 735
<212> PRT
<213> 人工序列
<220>
<223> 合成序列
<400> 1
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr
580 585 590
Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp
595 600 605
Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr
610 615 620
Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys
625 630 635 640
His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn
645 650 655
Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln
660 665 670
Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys
675 680 685
Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr
690 695 700
Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr
705 710 715 720
Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 2
<211> 735
<212> PRT
<213> 人工序列
<220>
<223> 合成序列
<400> 2
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Gln Ser Gly Gly Gly Thr Ala Ala Gln Asp Gln Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr
580 585 590
Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp
595 600 605
Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr
610 615 620
Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys
625 630 635 640
His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn
645 650 655
Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln
660 665 670
Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys
675 680 685
Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr
690 695 700
Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr
705 710 715 720
Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 3
<211> 735
<212> PRT
<213> 人工序列
<220>
<223> 合成序列
<400> 3
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Asn Gln Gln Lys Gln Asp Asp Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Asn Tyr Leu Gly Pro Phe Asn Gly Leu Asp Arg Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Glu Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr
580 585 590
Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp
595 600 605
Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr
610 615 620
Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys
625 630 635 640
His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn
645 650 655
Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln
660 665 670
Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys
675 680 685
Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr
690 695 700
Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr
705 710 715 720
Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 4
<211> 2208
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<400> 4
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420
ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480
aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540
tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600
aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660
gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780
tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840
tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900
aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960
aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020
caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080
tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140
aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200
cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260
cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320
tacctgtatt acttgagcag aacacagagc ggcggtggaa ccgccgccca ggatcagctt 1380
cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440
ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500
tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560
ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620
atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680
gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740
accaacctcc agagaggcaa cagacaagca gctaccgcag atgtcaacac acaaggcgtt 1800
cttccaggca tggtctggca ggacagagat gtgtaccttc aggggcccat ctgggcaaag 1860
attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920
caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980
ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca ggtcagcgtg 2040
gagatcgagt gggagctgca gaaggaaaac agcaaacgct ggaatcccga aattcagtac 2100
acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2160
tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208
<210> 5
<211> 2208
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<400> 5
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccaaccaaca aaaacaagac 120
gacgctaggg gtcttgtgct tcctgggtac aattacctcg gacccttcaa cggactcgac 180
cgtggagagc cggtcaacga ggcagacgag gcggccctcg agcacgacaa agcctacgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420
ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480
aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540
tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600
aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660
gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780
tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840
tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900
aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960
aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020
caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080
tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140
aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200
cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260
cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320
tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380
cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440
ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500
tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560
ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620
atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680
gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740
accaacctcc agagaggcaa cagacaagca gctaccgcag atgtcaacac acaaggcgtt 1800
cttccaggca tggtctggca ggacagagat gtgtaccttc aggggcccat ctgggcaaag 1860
attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920
caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980
ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca ggtcagcgtg 2040
gagatcgagt gggagctgca gaaggaaaac agcaaacgct ggaatcccga aattcagtac 2100
acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2160
tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208
<210> 6
<211> 2208
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<400> 6
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420
ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480
aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540
tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600
aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660
gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780
tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840
tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900
aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960
aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020
caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080
tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140
aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200
cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260
cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320
tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380
cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440
ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500
tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560
ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620
atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680
gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740
accaacctcc agagaggcaa cagacaagca gctaccgcag atgtcaacac acaaggcgtt 1800
cttccaggca tggtctggca ggacagagat gtgtaccttc aggggcccat ctgggcaaag 1860
attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920
caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980
ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca ggtcagcgtg 2040
gagatcgagt gggagctgca gaaggaaaac agcaaacgct ggaatcccga aattcagtac 2100
acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2160
tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208
<210> 7
<211> 724
<212> PRT
<213> 人工序列
<220>
<223> 合成序列
<400> 7
Met Ser Phe Val Asp His Pro Pro Asp Trp Leu Glu Glu Val Gly Glu
1 5 10 15
Gly Leu Arg Glu Phe Leu Gly Leu Glu Ala Gly Pro Pro Lys Pro Lys
20 25 30
Pro Asn Gln Gln His Gln Asp Gln Ala Arg Gly Leu Val Leu Pro Gly
35 40 45
Tyr Asn Tyr Leu Gly Pro Gly Asn Gly Leu Asp Arg Gly Glu Pro Val
50 55 60
Asn Arg Ala Asp Glu Val Ala Arg Glu His Asp Ile Ser Tyr Asn Glu
65 70 75 80
Gln Leu Glu Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp
85 90 95
Ala Glu Phe Gln Glu Lys Leu Ala Asp Asp Thr Ser Phe Gly Gly Asn
100 105 110
Leu Gly Lys Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro Phe
115 120 125
Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg Ile
130 135 140
Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp Ser
145 150 155 160
Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser Gln
165 170 175
Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp Thr
180 185 190
Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly Ala
195 200 205
Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr Trp
210 215 220
Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu Pro
225 230 235 240
Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val Asp
245 250 255
Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr
260 265 270
Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp Gln
275 280 285
Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg Val
290 295 300
Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser Thr
305 310 315 320
Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp
325 330 335
Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly Cys
340 345 350
Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly Tyr
355 360 365
Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser Ser
370 375 380
Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly Asn
385 390 395 400
Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser Ser
405 410 415
Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val Asp
420 425 430
Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val Gln
435 440 445
Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn Trp
450 455 460
Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser Gly
465 470 475 480
Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met Glu
485 490 495
Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met Thr
500 505 510
Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met Ile
515 520 525
Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu Glu
530 535 540
Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn Arg
545 550 555 560
Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser Ser
565 570 575
Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val Pro
580 585 590
Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp
595 600 605
Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala Met
610 615 620
Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys Asn
625 630 635 640
Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val Ser
645 650 655
Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met Glu
660 665 670
Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln
675 680 685
Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro Asp
690 695 700
Ser Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr Leu
705 710 715 720
Thr Arg Pro Leu
<210> 8
<211> 2175
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<400> 8
atgtcttttg ttgatcaccc tccagattgg ttggaagaag ttggtgaagg tcttcgcgag 60
tttttgggcc ttgaagcggg cccaccgaaa ccaaaaccca atcagcagca tcaagatcaa 120
gcccgtggtc ttgtgctgcc tggttataac tatctcggac ccggaaacgg gctcgatcga 180
ggagagcctg tcaacagggc agacgaggtc gcgcgagagc acgacatctc gtacaacgag 240
cagcttgagg cgggagacaa cccctacctc aagtacaacc acgcggacgc cgagtttcag 300
gagaagctcg ccgacgacac atccttcggg ggaaacctcg gaaaggcagt ctttcaggcc 360
aagaaaaggg ttctcgaacc ttttggcctg gttgaagagg gtgctaagac ggcccctacc 420
ggaaagcgga tagacgacca ctttccaaaa agaaagaagg ctcggaccga agaggactcc 480
aagccttcca cctcgtcaga cgccgaagct ggacccagcg gatcccagca gctgcaaatc 540
ccagcccaac cagcctcaag tttgggagct gatacaatgt ctgcgggagg tggcggccca 600
ttgggcgaca ataaccaagg tgccgatgga gtgggcaatg cctcgggaga ttggcattgc 660
gattccacgt ggatggggga cagagtcgtc accaagtcca cccgaacctg ggtgctgccc 720
agctacaaca accaccagta ccgagagatc aaaagcggct ccgtcgacgg aagcaacgcc 780
aacgcctact ttggatacag caccccctgg gggtactttg actttaaccg cttccacagc 840
cactggagcc cccgagactg gcaaagactc atcaacaact actggggctt cagaccccgg 900
tccctcagag tcaaaatctt caacattcaa gtcaaagagg tcacggtgca ggactccacc 960
accaccatcg ccaacaacct cacctccacc gtccaagtgt ttacggacga cgactaccag 1020
ctgccctacg tcgtcggcaa cgggaccgag ggatgcctgc cggccttccc tccgcaggtc 1080
tttacgctgc cgcagtacgg ttacgcgacg ctgaaccgcg acaacacaga aaatcccacc 1140
gagaggagca gcttcttctg cctagagtac tttcccagca agatgctgag aacgggcaac 1200
aactttgagt ttacctacaa ctttgaggag gtgcccttcc actccagctt cgctcccagt 1260
cagaacctgt tcaagctggc caacccgctg gtggaccagt acttgtaccg cttcgtgagc 1320
acaaataaca ctggcggagt ccagttcaac aagaacctgg ccgggagata cgccaacacc 1380
tacaaaaact ggttcccggg gcccatgggc cgaacccagg gctggaacct gggctccggg 1440
gtcaaccgcg ccagtgtcag cgccttcgcc acgaccaata ggatggagct cgagggcgcg 1500
agttaccagg tgcccccgca gccgaacggc atgaccaaca acctccaggg cagcaacacc 1560
tatgccctgg agaacactat gatcttcaac agccagccgg cgaacccggg caccaccgcc 1620
acgtacctcg agggcaacat gctcatcacc agcgagagcg agacgcagcc ggtgaaccgc 1680
gtggcgtaca acgtcggcgg gcagatggcc accaacaacc agagctccac cactgccccc 1740
gcgaccggca cgtacaacct ccaggaaatc gtgcccggca gcgtgtggat ggagagggac 1800
gtgtacctcc aaggacccat ctgggccaag atcccagaga cgggggcgca ctttcacccc 1860
tctccggcca tgggcggatt cggactcaaa cacccaccgc ccatgatgct catcaagaac 1920
acgcctgtgc ccggaaatat caccagcttc tcggacgtgc ccgtcagcag cttcatcacc 1980
cagtacagca ccgggcaggt caccgtggag atggagtggg agctcaagaa ggaaaactcc 2040
aagaggtgga acccagagat ccagtacaca aacaactaca acgaccccca gtttgtggac 2100
tttgccccgg acagcaccgg ggaatacaga accaccagac ctatcggaac ccgatacctt 2160
acccgacccc tttaa 2175
<210> 9
<211> 738
<212> PRT
<213> 人工序列
<220>
<223> 合成序列
<400> 9
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro
180 185 190
Pro Ala Ala Pro Ser Gly Val Gly Pro Asn Thr Met Ala Ala Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser
210 215 220
Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ala Thr Asn Asp
260 265 270
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn
305 310 315 320
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala
325 330 335
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln
340 345 350
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Thr Tyr
405 410 415
Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
Ser Arg Thr Gln Thr Thr Gly Gly Thr Ala Asn Thr Gln Thr Leu Gly
450 455 460
Phe Ser Gln Gly Gly Pro Asn Thr Met Ala Asn Gln Ala Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Thr Gly
485 490 495
Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Ala Gly Thr Lys Tyr His
500 505 510
Leu Asn Gly Arg Asn Ser Leu Ala Asn Pro Gly Ile Ala Met Ala Thr
515 520 525
His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Asn Gly Ile Leu Ile
530 535 540
Phe Gly Lys Gln Asn Ala Ala Arg Asp Asn Ala Asp Tyr Ser Asp Val
545 550 555 560
Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr
565 570 575
Glu Glu Tyr Gly Ile Val Ala Asp Asn Leu Gln Gln Gln Asn Thr Ala
580 585 590
Pro Gln Ile Gly Thr Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val
595 600 605
Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
610 615 620
Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe
625 630 635 640
Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val
645 650 655
Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ser Lys Leu Asn Ser Phe
660 665 670
Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu
675 680 685
Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr
690 695 700
Ser Asn Tyr Tyr Lys Ser Thr Ser Val Asp Phe Ala Val Asn Thr Glu
705 710 715 720
Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
725 730 735
Asn Leu
<210> 10
<211> 2217
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<400> 10
atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60
gagtggtggg cgctgaaacc tggagccccg aagcccaaag ccaaccagca aaagcaggac 120
gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180
aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240
cagcagctgc aggcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300
caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaagaagc gggttctcga acctctcggt ctggttgagg aaggcgctaa gacggctcct 420
ggaaagaaga gaccggtaga gccatcaccc cagcgttctc cagactcctc tacgggcatc 480
ggcaagaaag gccaacagcc cgccagaaaa agactcaatt ttggtcagac tggcgactca 540
gagtcagttc cagaccctca acctctcgga gaacctccag cagcgccctc tggtgtggga 600
cctaatacaa tggctgcagg cggtggcgca ccaatggcag acaataacga aggcgccgac 660
ggagtgggta gttcctcggg aaattggcat tgcgattcca catggctggg cgacagagtc 720
atcaccacca gcacccgaac ctgggccctg cccacctaca acaaccacct ctacaagcaa 780
atctccaacg ggacatcggg aggagccacc aacgacaaca cctacttcgg ctacagcacc 840
ccctgggggt attttgactt taacagattc cactgccact tttcaccacg tgactggcag 900
cgactcatca acaacaactg gggattccgg cccaagagac tcagcttcaa gctcttcaac 960
atccaggtca aggaggtcac gcagaatgaa ggcaccaaga ccatcgccaa taacctcacc 1020
agcaccatcc aggtgtttac ggactcggag taccagctgc cgtacgttct cggctctgcc 1080
caccagggct gcctgcctcc gttcccggcg gacgtgttca tgattcccca gtacggctac 1140
ctaacactca acaacggtag tcaggccgtg ggacgctcct ccttctactg cctggaatac 1200
tttccttcgc agatgctgag aaccggcaac aacttccagt ttacttacac cttcgaggac 1260
gtgcctttcc acagcagcta cgcccacagc cagagcttgg accggctgat gaatcctctg 1320
attgaccagt acctgtacta cttgtctcgg actcaaacaa caggaggcac ggcaaatacg 1380
cagactctgg gcttcagcca aggtgggcct aatacaatgg ccaatcaggc aaagaactgg 1440
ctgccaggac cctgttaccg ccaacaacgc gtctcaacga caaccgggca aaacaacaat 1500
agcaactttg cctggactgc tgggaccaaa taccatctga atggaagaaa ttcattggct 1560
aatcctggca tcgctatggc aacacacaaa gacgacgagg agcgtttttt tcccagtaac 1620
gggatcctga tttttggcaa acaaaatgct gccagagaca atgcggatta cagcgatgtc 1680
atgctcacca gcgaggaaga aatcaaaacc actaaccctg tggctacaga ggaatacggt 1740
atcgtggcag ataacttgca gcagcaaaac acggctcctc aaattggaac tgtcaacagc 1800
cagggggcct tacccggtat ggtctggcag aaccgggacg tgtacctgca gggtcccatc 1860
tgggccaaga ttcctcacac ggacggcaac ttccacccgt ctccgctgat gggcggcttt 1920
ggcctgaaac atcctccgcc tcagatcctg atcaagaaca cgcctgtacc tgcggatcct 1980
ccgaccacct tcaaccagtc aaagctgaac tctttcatca cgcaatacag caccggacag 2040
gtcagcgtgg aaattgaatg ggagctgcag aaggaaaaca gcaagcgctg gaaccccgag 2100
atccagtaca cctccaacta ctacaaatct acaagtgtgg actttgctgt taatacagaa 2160
ggcgtgtact ctgaaccccg ccccattggc acccgttacc tcacccgtaa tctgtaa 2217
<210> 11
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 合成序列
<400> 11
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 12
<211> 2211
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<400> 12
atggctgccg atggttatct tccagattgg ctcgaggaca accttagtga aggtattcgc 60
gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120
aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180
aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300
caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420
ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480
aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540
tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600
cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660
gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780
tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840
tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcagcga 900
ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960
caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa ccttaccagc 1020
acggtccagg tcttcacgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080
gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta cgggtatctg 1140
acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct ggaatatttc 1200
ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta 1260
cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa tccactcatc 1320
gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa tcaacaaacg 1380
ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct 1440
ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa caacagcgaa 1500
tttgcttggc ctggagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct 1560
ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct 1620
ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata 1680
accaacgaag aagaaattaa aactactaac ccggtagcaa cggagtccta tggacaagtg 1740
gccacaaacc accagagtgc ccaagcacag gcgcagaccg gctgggttca aaaccaagga 1800
atacttccgg gtatggtttg gcaggacaga gatgtgtacc tgcaaggacc catttgggcc 1860
aaaattcctc acacggacgg caactttcac ccttctccgc tgatgggagg gtttggaatg 1920
aagcacccgc ctcctcagat cctcatcaaa aacacacctg tacctgcgga tcctccaacg 1980
gccttcaaca aggacaagct gaactctttc atcacccagt attctactgg ccaagtcagc 2040
gtggagatcg agtgggagct gcagaaggaa aacagcaagc gctggaaccc ggagatccag 2100
tacacttcca actattacaa gtctaataat gttgaatttg ctgttaatac tgaaggtgta 2160
tatagtgaac cccgccccat tggcaccaga tacctgactc gtaatctgta a 2211
<210> 13
<211> 738
<212> PRT
<213> 人工序列
<220>
<223> 合成序列
<400> 13
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asn Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Ser Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro
180 185 190
Pro Ala Gly Pro Ser Gly Leu Gly Ser Gly Thr Met Ala Ala Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser
210 215 220
Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp
260 265 270
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn
305 310 315 320
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala
325 330 335
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln
340 345 350
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr
405 410 415
Asn Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
Ser Arg Thr Gln Ser Thr Gly Gly Thr Ala Gly Thr Gln Gln Leu Leu
450 455 460
Phe Ser Gln Ala Gly Pro Asn Asn Met Ser Ala Gln Ala Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser
485 490 495
Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His
500 505 510
Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr
515 520 525
His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Ser Gly Val Leu Met
530 535 540
Phe Gly Lys Gln Gly Ala Gly Lys Asp Asn Val Asp Tyr Ser Ser Val
545 550 555 560
Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr
565 570 575
Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln Gln Gln Asn Ala Ala
580 585 590
Pro Ile Val Gly Ala Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val
595 600 605
Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
610 615 620
Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe
625 630 635 640
Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val
645 650 655
Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ala Lys Leu Ala Ser Phe
660 665 670
Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu
675 680 685
Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr
690 695 700
Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Glu
705 710 715 720
Gly Thr Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
725 730 735
Asn Leu
<210> 14
<211> 738
<212> PRT
<213> 人工序列
<220>
<223> 合成序列
<400> 14
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asn Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Ser Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro
180 185 190
Pro Ala Gly Pro Ser Gly Leu Gly Ser Gly Thr Met Ala Ala Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser
210 215 220
Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp
260 265 270
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn
305 310 315 320
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala
325 330 335
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln
340 345 350
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr
405 410 415
Asn Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
Ser Arg Thr Gln Ser Thr Gly Gly Thr Ala Gly Thr Gln Gln Leu Leu
450 455 460
Phe Ser Gln Ala Gly Pro Asn Asn Met Ser Ala Gln Ala Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser
485 490 495
Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His
500 505 510
Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr
515 520 525
His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Ser Gly Val Leu Met
530 535 540
Phe Gly Lys Gln Gly Ala Gly Lys Asp Asn Val Asp Tyr Ser Ser Val
545 550 555 560
Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr
565 570 575
Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln Gln Gln Asn Ala Ala
580 585 590
Pro Ile Val Gly Ala Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val
595 600 605
Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
610 615 620
Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe
625 630 635 640
Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val
645 650 655
Pro Ala Asp Pro Pro Thr Thr Phe Thr Lys Ala Lys Leu Ala Ser Phe
660 665 670
Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu
675 680 685
Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr
690 695 700
Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Glu
705 710 715 720
Gly Thr Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
725 730 735
Asn Leu
<210> 15
<211> 2217
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<400> 15
atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60
gagtggtggg acctgaaacc tggagccccg aaacccaaag ccaaccagca aaagcaggac 120
aacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180
aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240
cagcagctcc aagcgggtga caatccgtac ctgcggtata atcacgccga cgccgagttt 300
caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgcgc agtcttccag 360
gccaaaaagc gggttctcga acctctgggc ctggttgaat cgccggttaa gacggctcct 420
ggaaagaaga ggccggtaga gccatcaccc cagcgctctc cagactcctc tacgggcatc 480
ggcaagaaag gccagcagcc cgcaaaaaag agactcaatt ttgggcagac tggcgactca 540
gagtcagtcc ccgaccctca accaatcgga gaaccaccag caggcccctc tggtctggga 600
tctggtacaa tggctgcagg cggtggcgct ccaatggcag acaataacga aggcgccgac 660
ggagtgggta gttcctcagg aaattggcat tgcgattcca catggctggg cgacagagtc 720
atcaccacca gcacccgcac ctgggccctg cccacctaca acaaccacct ctacaagcaa 780
atctccaacg ggacctcggg aggaagcacc aacgacaaca cctacttcgg ctacagcacc 840
ccctgggggt attttgactt caacagattc cactgccact tttcaccacg tgactggcag 900
cgactcatca acaacaactg gggattccgg cccaagaggc tcaacttcaa gctcttcaac 960
atccaagtca aggaggtcac gcagaatgaa ggcaccaaga ccatcgccaa taaccttacc 1020
agcacgattc aggtctttac ggactcggaa taccagctcc cgtacgtgct cggctcggcg 1080
caccagggct gcctgcctcc gttcccggcg gacgtcttca tgattcctca gtacgggtac 1140
ctgactctga acaatggcag tcaggctgtg ggccggtcgt ccttctactg cctggagtac 1200
tttccttctc aaatgctgag aacgggcaac aactttgaat tcagctacaa cttcgaggac 1260
gtgcccttcc acagcagcta cgcgcacagc cagagcctgg accggctgat gaaccctctc 1320
atcgaccagt acttgtacta cctgtcccgg actcaaagca cgggcggtac tgcaggaact 1380
cagcagttgc tattttctca ggccgggcct aacaacatgt cggctcaggc caagaactgg 1440
ctacccggtc cctgctaccg gcagcaacgt gtctccacga cactgtcgca gaacaacaac 1500
agcaactttg cctggacggg tgccaccaag tatcatctga atggcagaga ctctctggtg 1560
aatcctggcg ttgccatggc tacccacaag gacgacgaag agcgattttt tccatccagc 1620
ggagtcttaa tgtttgggaa acagggagct ggaaaagaca acgtggacta tagcagcgtg 1680
atgctaacca gcgaggaaga aataaagacc accaacccag tggccacaga acagtacggc 1740
gtggtggccg ataacctgca acagcaaaac gccgctccta ttgtaggggc cgtcaatagt 1800
caaggagcct tacctggcat ggtgtggcag aaccgggacg tgtacctgca gggtcccatc 1860
tgggccaaga ttcctcatac ggacggcaac tttcatccct cgccgctgat gggaggcttt 1920
ggactgaagc atccgcctcc tcagatcctg attaaaaaca cacctgttcc cgcggatcct 1980
ccgaccacct tcaatcaggc caagctggct tctttcatca cgcagtacag taccggccag 2040
gtcagcgtgg agatcgagtg ggagctgcag aaggagaaca gcaaacgctg gaacccagag 2100
attcagtaca cttccaacta ctacaaatct acaaatgtgg actttgctgt caatactgag 2160
ggtacttatt ccgagcctcg ccccattggc acccgttacc tcacccgtaa tctgtaa 2217

Claims (43)

1.一种变体衣壳多肽,其包含与SEQ ID NO:2或SEQ ID NO:3的VP1、VP2或VP3序列具有至少70、75、80、85、90、91、92、93、94、95、96、97、98、99%或100%同一性的多肽。
2.根据权利要求1所述的变体衣壳多肽,其中变体是与SEQ ID NO:2或SEQ ID NO:3的多肽相同的血清型。
3.根据权利要求1所述的变体衣壳多肽,其中变体与SEQ ID NO:2或SEQ ID NO:3的多肽相比是不同的血清型。
4.根据前述权利要求中任一项所述的变体衣壳多肽,其中所述多肽包含SEQ ID NO:1的变体,其中所述变体衣壳多肽包含对应于在与SEQ ID NO:1相比的35、36、37、38、39、42、51、61、70、449、450、451、452、455、456、458、459或其任意组合中的一个或多个位置处的突变的突变,任选地其中所述突变包括插入、缺失或取代。
5.根据前述权利要求中任一项所述的变体衣壳多肽,其中所述衣壳多肽包含:
对应于在与SEQ ID NO:1相比的位置35处的突变的突变,例如包含在对应于与SEQ IDNO:1相比的位置35的位置处的天冬酰胺;
对应于在与SEQ ID NO:1相比的位置36处的突变的突变,例如包含在对应于与SEQ IDNO:1相比的位置36的位置处的谷氨酰胺;
对应于在与SEQ ID NO:1相比的位置38处的突变的突变,例如包含在对应于与SEQ IDNO:1相比的位置38的位置处的谷氨酰胺;
对应于在与SEQ ID NO:1相比的位置37处的突变的突变,例如包含在对应于与SEQ IDNO:1相比的位置37的位置处的谷氨酰胺;
对应于在与SEQ ID NO:1相比的位置39处的突变的突变,例如包含在对应于与SEQ IDNO:1相比的位置39的位置处的谷氨酰胺;
对应于在与SEQ ID NO:1相比的位置42处的突变的突变,例如包含在对应于与SEQ IDNO:1相比的位置42的位置处的丙氨酸;
对应于在与SEQ ID NO:1相比的位置51处的突变的突变,例如包含在对应于与SEQ IDNO:1相比的位置51的位置处的天冬酰胺;
对应于在与SEQ ID NO:1相比的位置61处的突变的突变,例如包含在对应于与SEQ IDNO:1相比的位置61的位置处的精氨酸;
对应于在与SEQ ID NO:1相比的位置70处的突变的突变,例如包含在对应于与SEQ IDNO:1相比的位置70的位置处的谷氨酸;
对应于在与SEQ ID NO:1相比的位置449处的突变的突变,例如包含在对应于与SEQ IDNO:1相比的位置449的位置处的谷氨酰胺;
对应于在与SEQ ID NO:1相比的位置450处的突变的突变,例如包含在对应于与SEQ IDNO:1相比的位置450的位置处的丝氨酸;
对应于在与SEQ ID NO:1相比的位置451处的突变的突变,例如包含在对应于与SEQ IDNO:1相比的位置451的位置处的甘氨酸;
对应于在与SEQ ID NO:1相比的位置452处的突变的突变,例如包含在对应于与SEQ IDNO:1相比的位置452的位置处的甘氨酸;
对应于在与SEQ ID NO:1相比的位置455处的突变的突变,例如包含在对应于与SEQ IDNO:1相比的位置455的位置处的丙氨酸;
对应于在与SEQ ID NO:1相比的位置456处的突变的突变,例如包含在对应于与SEQ IDNO:1相比的位置456的位置处的丙氨酸;
对应于在与SEQ ID NO:1相比的位置458处的突变的突变,例如包含在对应于与SEQ IDNO:1相比的位置458的位置处的天冬氨酸;或者
对应于在与SEQ ID NO:1相比的位置459处的突变的突变,例如包含在对应于与SEQ IDNO:1相比的位置459的位置处的谷氨酰胺。
6.根据前述权利要求中任一项所述的变体衣壳多肽,其中所述衣壳多肽包含对应于在与SEQ ID NO:1相比的选自35至70的任一位置或其任意组合处的突变的突变。
7.根据前述权利要求中任一项所述的变体衣壳多肽,其中所述衣壳多肽包含对应于在与SEQ ID NO:1相比的选自449至459的任一位置或其任意组合处的突变的突变。
8.根据前述权利要求中任一项所述的变体衣壳多肽,其中所述衣壳多肽包含对应于在与SEQ ID NO:1相比的位置35、36、37、38、39、42、51、61和70处的至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个或所有突变的突变。
9.根据前述权利要求中任一项所述的变体衣壳多肽,其中所述衣壳多肽包含对应于在与SEQ ID NO:1相比的位置449、450、451、452、455、456、458和459处的至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个或所有突变的突变。
10.根据前述权利要求中任一项所述的变体衣壳多肽,其中所述衣壳多肽包含与SEQID NO:1相比的A35N、E36Q、R37Q、H38K、K39Q、S42A、K51N、K61R和A70E中的至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个或所有突变。
11.根据前述权利要求中任一项所述的变体衣壳多肽,其中所述衣壳多肽包含在与SEQID NO:1相比的N449Q、T450S、P451G、S452G、T455A、T456A、S458D和R459Q中的至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个或所有突变。
12.一种变体衣壳多肽,其包含:(a)SEQ ID NO:2或SEQ ID NO:3中任一者的多肽;(b)包含SEQ ID NO:2或SEQ ID NO:3中任一者的VP2或VP3序列;(c)包含与其具有至少90%、至少95%、至少96%、至少97%、至少98%或至少99%同一性的序列的多肽,其中相对于SEQID NO:1,所述序列包含与SEQ ID NO:2或SEQ ID NO:3中任一者相关的突变差异中的至少一者(例如,一者、两者、三者或更多者,例如全部);或(d)相对于(a)或(b)的所述多肽,具有至少1个、但不超过20个、不超过19个、不超过18个、不超过17个、不超过16个、不超过15个、不超过14个、不超过13个、不超过12个、不超过12个、不超过11个、不超过10个、不超过9个、不超过8个、不超过7个、不超过6个、不超过5个、不超过4个、不超过3个或不超过2个氨基酸突变的多肽,其中相对于SEQ ID NO:1,所述多肽包含与SEQ ID NO:2或SEQ ID NO:3中任一者相关的突变差异中的至少一者(例如,一者、两者、三者或更多者,例如全部)。
13.一种包含VP1、VP2或VP3或其任意组合的变体衣壳多肽,其各自与SEQ ID NO:2或SEQ ID NO:3的多肽至少或约95、96、97、98或99%相同,任选地其中所述变体衣壳多肽包含与SEQ ID NO:2和/或SEQ ID NO:3相关的突变差异中的全部。
14.一种包含VP1、VP2或VP3或其任意组合的变体衣壳多肽,其各自具有与SEQ ID NO:2或SEQ ID NO:3的多肽相比的约1至约20个突变,任选地其中所述变体衣壳多肽包含与SEQID NO:2和/或SEQ ID NO:3相关的突变差异中的全部。
15.一种包含VP1、VP2或VP3或其任意组合的变体衣壳多肽,其各自具有与SEQ ID NO:2或SEQ ID NO:3的多肽相比的约1至约10个突变,任选地其中所述变体衣壳多肽包含与SEQID NO:2和/或SEQ ID NO:3相关的突变差异中的全部。
16.一种包含VP1、VP2或VP3或其任意组合的变体衣壳多肽,其各自具有与SEQ ID NO:2或SEQ ID NO:3的多肽相比的约1至约5个突变,任选地其中所述变体衣壳多肽包含与SEQID NO:2和/或SEQ ID NO:3相关的突变差异中的全部。
17.一种变体衣壳多肽,其包含SEQ ID NO:2或SEQ ID NO:3的VP1、VP2或VP3序列。
18.一种变体衣壳多肽,其由SEQ ID NO:2或SEQ ID NO:3的VP1、VP2或VP3序列组成。
19.根据前述权利要求中任一项所述的变体衣壳多肽,其中所述变体衣壳多肽为VP1多肽、VP2多肽或VP3多肽。
20.一种核酸分子,其编码根据权利要求1至19中任一项所述的衣壳变体多肽。
21.根据权利要求20所述的核酸分子,其中所述核酸分子包含SEQ ID NO:4或SEQ IDNO:5的序列,其片段,或其与其具有至少70、75、80、85、90、91、92、93、94、95、96、97、98、99或100%序列同一性的变体。
22.根据权利要求21所述的核酸分子,其中所述其片段编码VP2衣壳多肽或VP3衣壳多肽。
23.一种病毒颗粒(例如,腺相关病毒(“AAV”)颗粒),其包含根据权利要求1至19中任一项所述的变体衣壳多肽或包含由根据权利要求20至22中任一项所述的核酸分子编码的变体衣壳多肽。
24.根据权利要求23所述的病毒颗粒,其包含核酸,所述核酸包含有效载荷(例如,异源转基因)和一个或多个调控元件。
25.一种病毒颗粒,其包含根据权利要求1至19中任一项所述的变体衣壳多肽或包含由根据权利要求20至22中任一项所述的核酸分子编码的变体衣壳多肽,其中所述病毒颗粒相对于野生型AAV2(例如,包含SEQ ID NO:1的或由SEQ ID NO:6编码的衣壳多肽的病毒颗粒)表现出增加的肝脏(例如肝细胞)转导,例如,如在小鼠或在NHP中测量的,例如,如本文所述。
26.根据权利要求20至22中任一项所述的核酸分子,其中所述核酸分子是双链或单链的,并且其中所述核酸分子是线性或环状的,例如其中所述核酸分子为质粒。
27.一种产生包含变体衣壳多肽的病毒颗粒的方法,所述方法包括将根据权利要求20至22或26中任一项所述的核酸分子引入细胞(例如HEK293细胞)中,以及从中收获所述病毒颗粒。
28.一种将有效载荷(例如,核酸)递送至细胞的方法,所述方法包括使所述细胞与依赖性细小病毒颗粒接触,所述依赖性细小病毒颗粒包含根据权利要求1至19中任一项所述的变体衣壳多肽和有效载荷,或使所述细胞与根据权利要求23至25中任一项所述的病毒颗粒接触。
29.根据权利要求28所述的方法,其中所述细胞为肝脏细胞,例如肝细胞。
30.一种将有效载荷(例如,核酸)递送至受试者的方法,所述方法包括向所述受试者施用包含根据权利要求1至19中任一项所述的变体衣壳多肽和所述有效载荷的依赖性细小病毒颗粒,或向所述受试者施用根据权利要求23至25中任一项所述的病毒颗粒。
31.根据权利要求31所述的方法,其中所述病毒颗粒将所述有效载荷递送至肝脏,例如递送至肝细胞。
32.根据权利要求1至19中任一项所述的变体衣壳多肽、根据权利要求23至25中任一项所述的病毒颗粒或根据权利要求27至32中任一项所述的方法,其中所述病毒颗粒(例如,包含所述变体衣壳多肽的所述病毒颗粒)与包含由SEQ ID NO:1编码的衣壳多肽的病毒颗粒相比,以所述有效载荷的增加的转导或增加的表达将所述有效载荷递送至肝脏(例如,递送至肝细胞),任选地其中全身性、例如静脉内递送所述病毒颗粒。
33.根据权利要求33所述的变体衣壳多肽、病毒颗粒或方法,其中与包含SEQ ID NO:1的衣壳多肽的病毒颗粒相比,转导的增加是至少2倍、4倍、8倍、16倍、32倍、64倍、100倍、或150倍、200倍或250倍,任选地其中所述增加是在所述病毒颗粒的全身性、例如静脉内施用之后。
34.一种治疗受试者的疾病或病症的方法,所述方法包括以有效治疗所述疾病或病症的量向所述受试者施用依赖性细小病毒颗粒,其中所述依赖性细小病毒颗粒是包含根据权利要求1至19中任一项所述的变体衣壳多肽的颗粒,或包含由根据权利要求20至22或26中任一项所述的核酸分子编码的变体衣壳多肽,或是根据权利要求23至25中任一项所述的病毒颗粒,任选地其中所述增加是在所述病毒颗粒的全身性、例如静脉内施用之后。
35.一种细胞、无细胞体系或其他翻译体系,其包含根据权利要求1至19中任一项所述的衣壳多肽、根据权利要求20至22或26中任一项所述的核酸分子、或根据权利要求23至25中任一项所述的病毒颗粒。
36.一种制备依赖性细小病毒(例如,腺相关依赖性细小病毒(AAV)颗粒的方法,所述方法包括:
提供细胞、无细胞体系或其他翻译体系,其包含根据权利要求20至22或26中任一项所述的核酸;以及
在适合于产生所述依赖性细小病毒颗粒的条件下培养所述细胞、无细胞体系或其他翻译体系,
从而制备所述依赖性细小病毒颗粒。
37.根据权利要求37所述的方法,其中所述细胞、无细胞体系或其他翻译体系包含第二核酸分子,并且所述第二核酸分子的至少一部分被包装在所述依赖性细小病毒颗粒中。
38.根据权利要求37所述的方法,其中第二核酸包含有效载荷,例如编码治疗产品的异源核酸序列。
39.根据权利要求37至39中任一项所述的方法,其中根据权利要求20至22或26中任一项所述的核酸分子介导依赖性细小病毒颗粒的产生,所述依赖性细小病毒颗粒不包含根据权利要求20至22或26中任一项所述的核酸或其片段。
40.根据权利要求52至55中任一项所述的方法,其中根据权利要求20至22或26中任一项所述的核酸分子以相比由其他类似生产体系中的编码SEQ ID NO:1(例如,SEQ ID NO:6)的核酸介导的生产水平的至少10%、至少20%、至少50%、至少100%、至少200%或更高的水平介导依赖性细小病毒颗粒的产生。
41.一种组合物,例如药物组合物,其包含根据权利要求23至25中任一项所述的病毒颗粒或通过根据权利要求27或36至40中任一项所述的方法产生的病毒颗粒,以及药学上可接受的载体。
42.根据权利要求1至19中任一项所述的变体衣壳多肽、根据权利要求20至22或26中任一项所述的核酸分子、或根据权利要求23至25中任一项所述的病毒颗粒,其用于治疗受试者的疾病或病症。
43.根据权利要求1至19中任一项所述的变体衣壳多肽、根据权利要求20至22或26中任一项所述的核酸分子、或根据权利要求23至25中任一项所述的病毒颗粒,其用于制造用于治疗受试者的疾病或病症的药物。
CN202280057207.5A 2021-06-23 2022-06-22 衣壳变体及其使用方法 Pending CN117957325A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163214021P 2021-06-23 2021-06-23
US63/214,021 2021-06-23
PCT/US2022/034529 WO2022271829A1 (en) 2021-06-23 2022-06-22 Capsid variants and methods of using the same

Publications (1)

Publication Number Publication Date
CN117957325A true CN117957325A (zh) 2024-04-30

Family

ID=84544796

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280057207.5A Pending CN117957325A (zh) 2021-06-23 2022-06-22 衣壳变体及其使用方法

Country Status (5)

Country Link
EP (1) EP4359550A1 (zh)
CN (1) CN117957325A (zh)
AU (1) AU2022296534A1 (zh)
CA (1) CA3222914A1 (zh)
WO (1) WO2022271829A1 (zh)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060166363A1 (en) * 2004-01-27 2006-07-27 Sergei Zolotukhin Modified baculovirus expression system for production of pseudotyped rAAV vector
WO2015191508A1 (en) * 2014-06-09 2015-12-17 Voyager Therapeutics, Inc. Chimeric capsids
CA3040483A1 (en) * 2016-10-13 2018-04-19 University Of Massachusetts Aav capsid designs
JP2021522840A (ja) * 2018-05-15 2021-09-02 プレジデント アンド フェローズ オブ ハーバード カレッジ 改善された遺伝子送達特性を示すウイルスベクター
WO2020242984A1 (en) * 2019-05-24 2020-12-03 Regeneron Pharmaceuticals, Inc. Modified viral particles and uses thereof

Also Published As

Publication number Publication date
WO2022271829A1 (en) 2022-12-29
EP4359550A1 (en) 2024-05-01
AU2022296534A1 (en) 2024-01-25
CA3222914A1 (en) 2022-12-29

Similar Documents

Publication Publication Date Title
JP7452953B2 (ja) 1色覚および他の疾患の治療のためのプロモーター、発現カセット、ベクター、キット、ならびに方法
WO2003018820A2 (en) Mutant recombinant adeno-associated viruses related applications
JP2022549380A (ja) 遺伝性難聴の処置のためのアデノ随伴ウイルス(aav)システム
US20230357324A1 (en) Improved dependoparvovirus production compositions and methods
JP2001520047A (ja) 組換えaavベクターと共に使用するための転写活性化された逆方向末端反復(itr)
KR20240045198A (ko) 캡시드 변이체 및 이의 사용 방법
CN117957325A (zh) 衣壳变体及其使用方法
CN117957324A (zh) 衣壳变体及其使用方法
CN117979953A (zh) 衣壳变体及其使用方法
CN117940573A (zh) 衣壳变体及其使用方法
CN117940446A (zh) 衣壳变体及其使用方法
WO2022256561A1 (en) Capsid variants and methods of using the same
WO2023201368A2 (en) Capsid variants and methods of using the same
KR20240023638A (ko) 곤충 세포에서의 아데노-연관 바이러스 벡터의 생산
WO2024059667A2 (en) Capsid variants and methods of using the same
WO2023201366A2 (en) Capsid variants and methods of using the same
WO2023201364A2 (en) Capsid variants and methods of using the same
WO2024081746A2 (en) Engineered nucleic acid regulatory elements and methods and uses thereof
CN117836421A (zh) 在昆虫细胞中制备腺相关病毒载体
CN117377500A (zh) 具有改善的组织向性的腺相关病毒载体衣壳
US20220242917A1 (en) Compositions and methods for producing adeno-associated viral vectors

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication