CN115803441A - 用于恢复pah基因功能的腺相关病毒组合物和其使用方法 - Google Patents

用于恢复pah基因功能的腺相关病毒组合物和其使用方法 Download PDF

Info

Publication number
CN115803441A
CN115803441A CN202180048044.XA CN202180048044A CN115803441A CN 115803441 A CN115803441 A CN 115803441A CN 202180048044 A CN202180048044 A CN 202180048044A CN 115803441 A CN115803441 A CN 115803441A
Authority
CN
China
Prior art keywords
amino acid
seq
capsid protein
protein corresponding
gly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180048044.XA
Other languages
English (en)
Inventor
J.B.赖特
D.L.苏基亚西安
T.B.圣马丁
O.弗兰科尼
A.B.西摩尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cognate3 LLC
Original Assignee
Cognate3 LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cognate3 LLC filed Critical Cognate3 LLC
Publication of CN115803441A publication Critical patent/CN115803441A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0066Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/44Oxidoreductases (1)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • C12Y114/16Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with reduced pteridine as one donor, and incorporation of one atom of oxygen (1.14.16)
    • C12Y114/16001Phenylalanine 4-monooxygenase (1.14.16.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14151Methods of production or purification of viral material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14151Methods of production or purification of viral material
    • C12N2750/14152Methods of production or purification of viral material relating to complementing cells and packaging systems for producing virus or viral particles
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/008Vector systems having a special element relevant for transcription cell type or tissue specific enhancer/promoter combination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/42Vector systems having a special element relevant for transcription being an intron or intervening sequence for splicing and/or stability of RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/50Vector systems having a special element relevant for transcription regulating RNA stability, not being an intron, e.g. poly A signal

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Public Health (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Epidemiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Virology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Immunology (AREA)
  • Cell Biology (AREA)
  • Mycology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

本文提供了可以在细胞中恢复苯丙氨酸羟化酶(PAH)基因功能的重组腺相关病毒(rAAV)组合物,以及用于使用所述rAAV组合物治疗与PAH基因功能降低相关的疾病(例如,PKU)的方法。还提供了用于制备所述腺相关病毒组合物的核酸、载体、包装系统和方法。

Description

用于恢复PAH基因功能的腺相关病毒组合物和其使用方法
相关申请交叉引用
本申请要求于2020年5月27日提交的美国临时专利申请序列号63/030,341以及于2020年11月23日提交的美国临时专利申请序列号63/117,252的优先权,所述美国临时专利申请序列的全部公开内容通过引用并入本文。
序列表
本申请含有序列表,所述序列表已以ASCII格式、以电子方式提交并以全文引用的方式特此并入(所述ASCII副本创建于2021年5月24日,命名为“404217-HMW-040WO-183161_SL.txt”并且大小为213,352个字节)。
背景技术
苯丙酮尿症(PKU)是一种常染色体隐性遗传病症,其中大多数病例是由苯丙氨酸羟化酶(PAH)基因的突变引起的。PAH基因编码在多聚化后催化L-苯丙氨酸(Phe)至L-酪氨酸(Tyr)的羟基化的肝酶。PAH活性的减少或丧失导致苯丙氨酸累积并将所述苯丙氨酸转化为苯丙酮酸盐(也称为苯酮)。苯丙氨酸代谢的这种异常损害神经元成熟和髓鞘的合成,从而导致智力低下、癫痫发作和其它严重的医学问题。
目前,PKU无法治愈。护理标准是通过最小化含有大量苯丙氨酸的食物来进行饮食管理。从出生开始就用低苯丙氨酸配方进行饮食管理可在很大程度上预防病症的神经性后果的发展。然而,即使在低蛋白饮食下,儿童仍然患有生长迟缓,并且成人经常患有骨质疏松症和维生素缺乏症。此外,坚持终生饮食治疗是困难的,特别是在学龄后。
最近出现了新的治疗策略,所述治疗策略包含大量中性氨基酸(LNAA)补充剂、辅因子四氢生物蝶呤疗法、酶替代疗法和经基因修饰的益生菌疗法。然而,这些策略存在缺陷。LNAA补充剂仅适用于不遵循低Phe饮食的成人。辅因子四氢生物蝶呤只能用于一些轻型PKU。通过施用例如苯丙氨酸解氨酶(PAL)等PAH的替代物的酶替代可以导致降低功效和/或引起副作用的免疫应答。关于经基因修饰的益生菌疗法,表达PAL的大肠杆菌(E.coli)的致病性一直是人们所关注的。
基因疗法提供了治愈PKU的独特机会。包含慢病毒载体的逆转录病毒载体能够将核酸整合到宿主细胞基因组中。然而,由于这些载体非靶向插入到基因组中,因此所述这些载体可能引发安全性问题。例如,存在载体破坏肿瘤抑制基因或激活癌基因从而引起恶性肿瘤的风险。实际上,在通过用γ逆转录病毒载体转导CD34+骨髓前体的用于治疗X连锁重度联合免疫缺损(SCID)的临床试验中,十名患者中有四名患者换上了白血病(Hacein-Bey-Abina等人,《临床研究杂志(J Clin Invest.)》(2008)118(9):3132-42)。
还推测了基于核酸酶的基因编辑技术,如大范围核酸酶、锌指核酸酶(ZFN)、转录活化子样效应子核酸酶(TALEN)和成簇的规律间隔的短回文重复序列(CRISPR)技术,可以用于校正PKU患者中的PAH基因中的缺陷。然而,由于人基因组中的位点在序列上类似于预期靶位点的潜在脱靶突变,因此这些技术中的每一项技术都引发了安全性问题。
因此,本领域中需要改进的基因疗法组合物和方法可以有效且安全地恢复PKU患者中的PAH基因功能。
发明内容
本文提供了可以在细胞中恢复PAH基因功能的重组腺相关病毒(rAAV)组合物,以及用于使用所述rAAV组合物治疗与PAH基因功能降低相关的疾病(例如,PKU)的方法。还提供了用于制备所述腺相关病毒组合物的核酸、载体、包装系统和方法。本文所提供的rAAV组合物特别有利,因为其可以有效地编辑受试者中细胞(例如,肝细胞)的基因组,以在肝特异性启动子的控制下表达PAH,并且由此为PKU患者提供潜在的治愈方法。
因此,在一个方面,本公开提供了一种重组腺相关病毒(rAAV),其包括:
(a)AAV衣壳,所述AAV衣壳包括AAV衣壳蛋白;以及
(b)rAAV基因组,所述rAAV基因组包括:(i)用于编辑PAH基因中的靶基因座的编辑元件,所述编辑元件包括与转录调节元件可操作地连接的PAH编码序列的至少一部分;(ii)与所述靶基因座的第一基因组区5'具有同源性的所述编辑元件的5'同源臂核苷酸序列位置5';以及(iii)与所述靶基因座的第二基因组区3'具有同源性的位于所述编辑元件的3'的3'同源臂核苷酸序列。
在某些实施例中,所述编辑元件包括PAH编码序列。在某些实施例中,所述PAH编码序列编码SEQ ID NO:33中所示的氨基酸序列。在某些实施例中,所述PAH编码序列包括SEQID NO:53中所示的核苷酸序列。在某些实施例中,所述PAH编码序列以沉默方式改变。在某些实施例中,所述PAH编码序列包括与SEQ ID NO:28、63或83中所示的核苷酸序列至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核苷酸序列。在某些实施例中,所述PAH编码序列包括SEQ ID NO:28中所示的核苷酸序列。在某些实施例中,所述PAH编码序列包括SEQ ID NO:63中所示的核苷酸序列。在某些实施例中,所述PAH编码序列包括SEQ ID NO:83中所示的核苷酸序列。
在某些实施例中,所述转录调节元件能够介导肝细胞、肾细胞或脑、脑垂体、肾上腺、胰腺、膀胱、胆囊、结肠、小肠或乳腺中的细胞中的转录。在某些实施例中,所述转录调节元件对于所述PAH基因是内源性的。在某些实施例中,所述转录调节元件对于所述PAH基因是外源性的。在某些实施例中,所述转录调节元件是肝特异性的,任选地其中所述转录调节元件包括选自由以下组成的组的一个或多个元件:人白蛋白启动子、人运甲状腺素蛋白(TTR)启动子、人ApoE/C-I肝控制区(HCR)1或2、人ApoH启动子、人SERPINA1(hAAT)启动子和其肝特异性调节模块。在某些实施例中,所述转录调节元件包括与选自由SEQ ID NO:25、26、27或69组成的组的序列至少90%相同的核苷酸序列。在某些实施例中,所述转录调节元件包括与SEQ ID NO:27中所示的核苷酸序列至少90%相同的核苷酸序列。在某些实施例中,所述转录调节元件包括SEQ ID NO:27中所示的核苷酸序列。在某些实施例中,所述转录调节元件的核苷酸序列由SEQ ID NO:27中所示的核苷酸序列组成。
在某些实施例中,所述编辑元件进一步包括位于所述PAH编码序列的5'和所述转录调节元件的3'的内含子元件。在某些实施例中,所述内含子元件是外源性内含子元件,任选地其中所述外源性内含子元件是SV40内含子元件。在某些实施例中,所述SV40内含子元件包括与SEQ ID NO:29中所示的核苷酸序列至少90%相同的核苷酸序列。在某些实施例中,所述SV40内含子元件包括SEQ ID NO:29中所示的核苷酸序列。在某些实施例中,所述SV40内含子元件由SEQ ID NO:29中所示的核苷酸序列组成。
在某些实施例中,所述编辑元件进一步包括所述PAH编码序列的聚腺苷酸化序列3'。在某些实施例中,所述聚腺苷酸化序列是外源性聚腺苷酸化序列,任选地其中所述外源性聚腺苷酸化序列是SV40聚腺苷酸化序列。在某些实施例中,所述SV40聚腺苷酸化序列包括与SEQ ID NO:31中所示的核苷酸序列至少90%相同的核苷酸序列。在某些实施例中,所述SV40聚腺苷酸化序列包括SEQ ID NO:31中所示的核苷酸序列。在某些实施例中,所述SV40聚腺苷酸化序列由SEQ ID NO:31中所示的核苷酸序列组成。
在某些实施例中,所述靶基因座的核苷酸5'在PAH基因的内含子中。在某些实施例中,所述靶基因座的核苷酸5'在PAH基因的内含子1中。在某些实施例中,所述靶基因座的核苷酸3'在PAH基因的内含子中。在某些实施例中,所述靶基因座的核苷酸3'在PAH基因的内含子1中。
在某些实施例中,所述PAH基因是人PAH基因。在某些实施例中,所述人PAH基因是野生型的。在某些实施例中,所述人PAH基因是变体PAH基因。
在某些实施例中,所述编辑元件包括选自由SEQ ID NO:25、26、27、28、29、31、50、51、52、69或70组成的组的核苷酸序列。
在某些实施例中,所述5'同源臂核苷酸序列与所述第一基因组区至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同。在某些实施例中,所述3'同源臂核苷酸序列与所述第二基因组区至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同。在某些实施例中,所述第一基因组区位于第一编辑窗口中,并且所述第二基因组区位于第二编辑窗口中。在某些实施例中,所述第一编辑窗口由与SEQ IDNO:37中所示的核苷酸序列相对应的人基因组的区组成。在某些实施例中,所述第二编辑窗口由与SEQ ID NO:38中所示的核苷酸序列相对应的人基因组的区组成。在某些实施例中,所述第一基因组区由与SEQ ID NO:37中所示的核苷酸序列相对应的人基因组的区组成。在某些实施例中,所述第二基因组区由与SEQ ID NO:38中所示的核苷酸序列相对应的人基因组的区组成。在某些实施例中,所述5'和3'同源臂核苷酸序列中的每一个独立地具有约100至约2000个核苷酸的长度。在某些实施例中,所述5'同源臂包括与SEQ ID NO:23中所示的核苷酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列。在某些实施例中,所述5'同源臂包括SEQ ID NO:23中所示的核苷酸序列。在某些实施例中,所述5'同源臂的核苷酸序列由SEQ ID NO:23中所示的核苷酸序列组成。在某些实施例中,所述3'同源臂包括与SEQ ID NO:24中所示的核苷酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列。在某些实施例中,所述3'同源臂包括SEQ ID NO:24中所示的核苷酸序列。在某些实施例中,所述3'同源臂的核苷酸序列由SEQ ID NO:24中所示的核苷酸序列组成。
在某些实施例中,所述rAAV基因组包括与SEQ ID NO:43中所示的核苷酸序列至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列。在某些实施例中,所述rAAV基因组包括SEQ ID NO:43中所示的核苷酸序列。
在某些实施例中,所述rAAV基因组进一步包括所述5'同源臂核苷酸序列的5'反向末端重复序列(5'ITR)核苷酸序列5',以及所述3'同源臂核苷酸序列的3'反向末端重复序列(3'ITR)核苷酸序列3'。在某些实施例中,所述5'ITR核苷酸序列与SEQ ID NO:14中所示的核苷酸序列至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同,并且所述3'ITR核苷酸序列与SEQ ID NO:18中所示的核苷酸序列至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同。
在某些实施例中,所述rAAV基因组包括SEQ ID NO:73和/或74中所示的核苷酸序列。在某些实施例中,所述rAAV基因组包括SEQ ID NO:75和/或76中所示的核苷酸序列。
在某些实施例中,所述rAAV基因组包括与SEQ ID NO:45中所示的核苷酸序列至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列。在某些实施例中,所述rAAV基因组包括SEQ ID NO:45中所示的核苷酸序列。在某些实施例中,所述rAAV基因组的核苷酸序列由SEQ ID NO:45中所示的核苷酸序列组成。
在某些实施例中,所述AAV衣壳蛋白包括与由SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸203-736构成的氨基酸序列至少95%相同的氨基酸序列。在某些实施例中,所述衣壳蛋白中与SEQ ID NO:16的氨基酸206相对应的氨基酸是C;所述衣壳蛋白中与SEQ ID NO:16的氨基酸296相对应的氨基酸是H;所述衣壳蛋白中与SEQ ID NO:16的氨基酸312相对应的氨基酸是Q;所述衣壳蛋白中与SEQ ID NO:16的氨基酸346相对应的氨基酸是A;所述衣壳蛋白中与SEQ ID NO:16的氨基酸464相对应的氨基酸是N;所述衣壳蛋白中与SEQ ID NO:16的氨基酸468相对应的氨基酸是S;所述衣壳蛋白中与SEQ ID NO:16的氨基酸501相对应的氨基酸是I;所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R;所述衣壳蛋白中与SEQ ID NO:16的氨基酸590相对应的氨基酸是R;所述衣壳蛋白中与SEQ ID NO:16的氨基酸626相对应的氨基酸是G或Y;所述衣壳蛋白中与SEQ ID NO:16的氨基酸681相对应的氨基酸是M;所述衣壳蛋白中与SEQ ID NO:16的氨基酸687相对应的氨基酸是R;所述衣壳蛋白中与SEQ ID NO:16的氨基酸690相对应的氨基酸是K;所述衣壳蛋白中与SEQ ID NO:16的氨基酸706相对应的氨基酸是C;或者所述衣壳蛋白中与SEQ IDNO:16的氨基酸718相对应的氨基酸是G。在某些实施例中:
(a)所述衣壳蛋白中与SEQ ID NO:16的氨基酸626相对应的氨基酸是G,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸718相对应的氨基酸是G;
(b)所述衣壳蛋白中与SEQ ID NO:16的氨基酸296相对应的氨基酸是H,所述衣壳蛋白中与SEQ ID NO:16的氨基酸464相对应的氨基酸是N,所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸681相对应的氨基酸是M;
(c)所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸687相对应的氨基酸是R;
(d)所述衣壳蛋白中与SEQ ID NO:16的氨基酸346相对应的氨基酸是A,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R;或者
(e)所述衣壳蛋白中与SEQ ID NO:16的氨基酸501相对应的氨基酸是I,所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R,并且所述衣壳蛋白中与SEQ IDNO:16的氨基酸706相对应的氨基酸是C。
在某些实施例中,所述衣壳蛋白包括由SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸203-736构成的氨基酸序列。
在某些实施例中,所述AAV衣壳蛋白包括与由SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸138-736构成的氨基酸序列至少95%相同的氨基酸序列。在某些实施例中,所述衣壳蛋白中与SEQ ID NO:16的氨基酸151相对应的氨基酸是R;所述衣壳蛋白中与SEQ ID NO:16的氨基酸160相对应的氨基酸是D;所述衣壳蛋白中与SEQ ID NO:16的氨基酸206相对应的氨基酸是C;所述衣壳蛋白中与SEQ ID NO:16的氨基酸296相对应的氨基酸是H;所述衣壳蛋白中与SEQ ID NO:16的氨基酸312相对应的氨基酸是Q;所述衣壳蛋白中与SEQ ID NO:16的氨基酸346相对应的氨基酸是A;所述衣壳蛋白中与SEQ ID NO:16的氨基酸464相对应的氨基酸是N;所述衣壳蛋白中与SEQ ID NO:16的氨基酸468相对应的氨基酸是S;所述衣壳蛋白中与SEQ ID NO:16的氨基酸501相对应的氨基酸是I;所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R;所述衣壳蛋白中与SEQ ID NO:16的氨基酸590相对应的氨基酸是R;所述衣壳蛋白中与SEQ ID NO:16的氨基酸626相对应的氨基酸是G或Y;所述衣壳蛋白中与SEQ ID NO:16的氨基酸681相对应的氨基酸是M;所述衣壳蛋白中与SEQ ID NO:16的氨基酸687相对应的氨基酸是R;所述衣壳蛋白中与SEQ ID NO:16的氨基酸690相对应的氨基酸是K;所述衣壳蛋白中与SEQ ID NO:16的氨基酸706相对应的氨基酸是C;或者所述衣壳蛋白中与SEQ ID NO:16的氨基酸718相对应的氨基酸是G。在某些实施例中,
(a)所述衣壳蛋白中与SEQ ID NO:16的氨基酸626相对应的氨基酸是G,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸718相对应的氨基酸是G;
(b)所述衣壳蛋白中与SEQ ID NO:16的氨基酸296相对应的氨基酸是H,所述衣壳蛋白中与SEQ ID NO:16的氨基酸464相对应的氨基酸是N,所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸681相对应的氨基酸是M;
(c)所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸687相对应的氨基酸是R;
(d)所述衣壳蛋白中与SEQ ID NO:16的氨基酸346相对应的氨基酸是A,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R;或者
(e)所述衣壳蛋白中与SEQ ID NO:16的氨基酸501相对应的氨基酸是I,所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R,并且所述衣壳蛋白中与SEQ IDNO:16的氨基酸706相对应的氨基酸是C。
在某些实施例中,所述衣壳蛋白包括由SEQ ID NO:2、3、4、5、6、7、9、10、11、12、13、15、16或17的氨基酸138-736构成的氨基酸序列。
在某些实施例中,所述AAV衣壳蛋白包括与由SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736构成的氨基酸序列至少95%相同的氨基酸序列。在某些实施例中,所述衣壳蛋白中与SEQ ID NO:16的氨基酸2相对应的氨基酸是T;所述衣壳蛋白中与SEQ IDNO:16的氨基酸65相对应的氨基酸是I;所述衣壳蛋白中与SEQ ID NO:16的氨基酸68相对应的氨基酸是V;所述衣壳蛋白中与SEQ ID NO:16的氨基酸77相对应的氨基酸是R;所述衣壳蛋白中与SEQ ID NO:16的氨基酸119相对应的氨基酸是L;所述衣壳蛋白中与SEQ ID NO:16的氨基酸151相对应的氨基酸是R;所述衣壳蛋白中与SEQ ID NO:16的氨基酸160相对应的氨基酸是D;所述衣壳蛋白中与SEQ ID NO:16的氨基酸206相对应的氨基酸是C;所述衣壳蛋白中与SEQ ID NO:16的氨基酸296相对应的氨基酸是H;所述衣壳蛋白中与SEQ ID NO:16的氨基酸312相对应的氨基酸是Q;所述衣壳蛋白中与SEQ ID NO:16的氨基酸346相对应的氨基酸是A;所述衣壳蛋白中与SEQ ID NO:16的氨基酸464相对应的氨基酸是N;所述衣壳蛋白中与SEQ ID NO:16的氨基酸468相对应的氨基酸是S;所述衣壳蛋白中与SEQ ID NO:16的氨基酸501相对应的氨基酸是I;所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R;所述衣壳蛋白中与SEQ ID NO:16的氨基酸590相对应的氨基酸是R;所述衣壳蛋白中与SEQ ID NO:16的氨基酸626相对应的氨基酸是G或Y;所述衣壳蛋白中与SEQ ID NO:16的氨基酸681相对应的氨基酸是M;所述衣壳蛋白中与SEQ IDNO:16的氨基酸687相对应的氨基酸是R;所述衣壳蛋白中与SEQ ID NO:16的氨基酸690相对应的氨基酸是K;所述衣壳蛋白中与SEQ ID NO:16的氨基酸706相对应的氨基酸是C;或者所述衣壳蛋白中与SEQ ID NO:16的氨基酸718相对应的氨基酸是G。在某些实施例中:
(a)所述衣壳蛋白中与SEQ ID NO:16的氨基酸2相对应的氨基酸是T,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸312相对应的氨基酸是Q;
(b)所述衣壳蛋白中与SEQ ID NO:16的氨基酸65相对应的氨基酸是I,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸626相对应的氨基酸是Y;
(c)所述衣壳蛋白中与SEQ ID NO:16的氨基酸77相对应的氨基酸是R,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸690相对应的氨基酸是K;
(d)所述衣壳蛋白中与SEQ ID NO:16的氨基酸119相对应的氨基酸是L,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸468相对应的氨基酸是S;
(e)所述衣壳蛋白中与SEQ ID NO:16的氨基酸626相对应的氨基酸是G,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸718相对应的氨基酸是G;
(f)所述衣壳蛋白中与SEQ ID NO:16的氨基酸296相对应的氨基酸是H,所述衣壳蛋白中与SEQ ID NO:16的氨基酸464相对应的氨基酸是N,所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸681相对应的氨基酸是M;
(g)所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸687相对应的氨基酸是R;
(h)所述衣壳蛋白中与SEQ ID NO:16的氨基酸346相对应的氨基酸是A,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R;或者
(i)所述衣壳蛋白中与SEQ ID NO:16的氨基酸501相对应的氨基酸是I,所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R,并且所述衣壳蛋白中与SEQ IDNO:16的氨基酸706相对应的氨基酸是C。
在某些实施例中,所述衣壳蛋白包括由SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736构成的氨基酸序列。
在某些实施例中,当在标准AAV施用条件下在不存在外源性核酸酶的情况下向植入人肝细胞的小鼠施用所述AAV时,所述编辑元件到所述靶基因座中的整合效率为至少1%。在某些实施例中,当在标准AAV施用条件下在不存在外源性核酸酶的情况下向植入人肝细胞的小鼠施用所述AAV时,所述编辑元件整合到所述靶基因座中的等位基因频率为至少0.5%。
在另一方面,本公开提供了一种药物组合物,其包括本文所公开的rAAV。
在另一方面,本公开提供了一种多核苷酸,其包括SEQ ID NO:43、45、51或52中所示的核酸序列。
在另一方面,本公开提供了一种用于治疗患有苯丙酮尿症(PKU)的受试者的方法,所述方法包括向所述受试者施用有效量的本文所公开的rAAV或药物组合物。在某些实施例中,所述rAAV或药物组合物是静脉内施用的。在某些实施例中,PKU与PAH基因突变相关。在某些实施例中,所述受试者是人受试者。
在另一方面,本公开提供了一种用于制备rAAV的包装系统,其中所述包装系统包括:(a)第一核苷酸序列,所述第一核苷酸序列编码一个或多个AAV Rep蛋白;(b)第二核苷酸序列,所述第二核苷酸序列编码本文所公开的衣壳蛋白;以及(c)第三核苷酸序列,所述第三核苷酸序列包括本文所公开的rAAV的rAAV基因组序列。在某些实施例中,所述包装系统包括包含所述第一核苷酸序列和所述第二核苷酸序列的第一载体,以及包括所述第三核苷酸序列的第二载体。在某些实施例中,所述包装系统进一步包括包含一个或多个辅助病毒基因的第四核苷酸序列。在某些实施例中,所述第四核苷酸序列包括在第三载体内。在某些实施例中,所述第四核苷酸序列包括来自选自由以下组成的组的病毒的一个或多个基因:腺病毒、疱疹病毒、牛痘病毒和巨细胞病毒(CMV)。在某些实施例中,所述第一载体、所述第二载体和/或所述第三载体是质粒。
在另一方面,本公开提供了一种用于重组制备rAAV的方法,所述方法包括在借以产生所述rAAV的条件下将本文所公开的包装系统引入到细胞中。
本文所公开的rAAV、药物组合物或多核苷酸,其用作药剂。本文所公开的rAAV、药物组合物或多核苷酸,其用于治疗PKU。本文所公开的rAAV、药物组合物或多核苷酸,其用于治疗患有PKU的受试者的方法中,所述方法包括向所述受试者施用有效量的所述rAAV、所述药物组合物或所述多核苷酸。
附图说明
图1是示出如本文所公开的rAAV的基因转移和基因编辑机制的示意图。
图2A-2D是示出PAH-006m(图2A)、PAH-006m-LP-1(图2B)、PAH-032h(图2C)和hPAH-hI1C-032-LP1-SD3(图2D)的质粒图谱的示意图。
图3是示出PAH-006m对PAHenu2小鼠的血液Phe水平影响的图。
图4是示出施用PAH-006m后小鼠PAH基因座的中靶插入的图。
图5是示出相对于小鼠GAPDH,PAH-006m对mRNA表达的影响的图。
图6是示出如通过物种特异性ddPCR编辑测定测量的在施用PAH-032h后的
Figure BDA0004038382540000111
小鼠中的中靶插入的图。
图7是示出如通过定量下一代测序测定测量的FRG小鼠中的人肝细胞的编辑的图。
图8A-8C是示出PAH-006m-LP-1随着时间的推移对PAHenu2小鼠中血液Phe浓度的影响的图。图8A示出了完整数据集,而图8B示出了具有减小的y轴线刻度的特定时间范围内的数据,以便示出剂量水平之间的差异。图8C示出了如通过下一代测序测量的PAH-006m-LP-1在PAHenu2小鼠中的中靶整合。
图9A-9L是示出基因转移/基因编辑载体PAH-006m-LP-1和游离型转基因表达载体的功效的图。图9A和9B是示出分别包装在AAVHSC15衣壳中的游离型转基因表达载体和PAH-006m-LP-1对以指定剂量给药后至多12周的PAHenu2小鼠的血清Phe水平的影响的图。图9C和9D是示出分别包装在AAVHSC15衣壳中的游离型转基因表达载体和PAH-006m-LP-1对以指定剂量给药后至多12周的PAHenu2小鼠的血清Tyr水平的影响的图。图9E和9F是示出分别包装在AAVHSC15衣壳中的游离型转基因表达载体和PAH-006m-LP-1在指定剂量下对PAHenu2小鼠中每ug基因组DNA检测到的载体基因组水平的影响的图。图9G和9H是示出分别包装在AAVHSC15衣壳中的游离型转基因表达载体和PAH-006m-LP-1在指定剂量下对PAHenu2小鼠中检测到的每10ng总RNA的mRNA表达水平的影响的图。图9I是示出如所指示的在包装在AAVHSC15中的载体给药后12周时通过ddPCR跨各种剂量检测到的每个等位基因的病毒基因组数所呈现的中靶整合水平的图。图9J是示出如所指示的在包装在AAVHSC15中的载体给药后12周时跨如所指示的各种剂量检测到的中靶插入频率的图。图9K和9L是示出部分肝切除术(PHx)对血清Phe水平的影响的结果的PAHenu2小鼠用如所指示的载体和剂量给药后第42周(图9K)或第40周(图9L)的时间过程的图。在给药后约2周进行PHx或假手术。
图10A-10P是示出小鼠特异性基因转移/基因编辑AAV载体(PAH-006m-LP-1;“小鼠设计”)与人特异性基因转移/基因编辑AAV载体(hPAH-hI1C-032-LP1-SD3;“人设计”)在4周(图10A-10H)或10周龄(图10I-10P)的PAHenu2小鼠中按如所指示的剂量施用包装在如所指示的AAVHSC15衣壳中的载体之间的剂量范围差异的图。
图11A-11K是示出PAHenu2小鼠的年龄对单剂量小鼠特异性基因转移/基因编辑AAV载体(PAH-006m-LP-1;“小鼠设计”)或人特异性基因转移/基因编辑AAV载体(hPAH-hI1C-032-LP1-SD3;“人设计”)的应答的影响的图。对于表2中所示的各种给药组,随时间推移检查血清Phe和Tyr水平(图11A-11D)以及载体基因组和mRNA水平(图11E-11K)。
图12A-12C是示出PAHenu2小鼠以1E14 vg/kg的剂量施用包装在AAVHSC15衣壳中的小鼠特异性基因转移/基因编辑AAV载体(PAH-006m-LP-1)的整合随时间推移的动力学和持久性的图。图12A和12B是分别示出包装在AAVHSC15衣壳中的PAH-006m-LP-1随时间推移对PAHenu2小鼠中每ug基因组DNA检测到的载体基因组水平和每10ng总RNA检测到的mRNA表达水平的影响的图。图12C是示出包装在AAVHSC15衣壳中的PAH-006m-LP-1给药后的不同时间点检测到的中靶插入频率的图。图12D和12E是示出在注射后至多42周,以1E14 vg/kg的剂量施用包装在AAVHSC15衣壳中的PAH-006m-LP-1的PAHenu2小鼠中对血清Phe(图12D)和Tyr(图12E)的影响的图。
图13A和13B是示出包装在AAVHSC15中的hPAH-hI1C-032-LP1-SD3在指定剂量和时间点下分别对从HuLiv小鼠分离的人肝细胞中每ug基因组DNA检测到的载体基因组水平和每10ng总RNA检测到的mRNA表达水平的影响的图。图13C是示出包装在AAVHSC15中的hPAH-hI1C-032-LP1-SD3在以指定剂量给药后的不同时间点在从HuLiv小鼠分离的人肝细胞中检测到的中靶插入频率的图。
图14A-14D是示出在从施用包装在AAVHSC15衣壳中的人特异性基因转移/基因编辑载体hPAH-hI1C-032-LP1-SD3的HuLiv小鼠分离的基因组DNA中检测到的预测脱靶整合位点的整合量的图。
具体实施方式
本文提供了可以在细胞中恢复PAH基因功能的重组腺相关病毒(rAAV)组合物,以及用于使用所述rAAV组合物治疗与PAH基因功能降低相关的疾病(例如,PKU)的方法。还提供了用于制备所述腺相关病毒组合物的核酸、载体、包装系统和方法。
I.定义
如本文所使用的,术语“重组腺相关病毒”或“rAAV”是指包括缺乏功能性rep和帽基因的基因组的AAV。
如本文所使用的,术语“PAH基因”是指苯丙氨酸羟化酶(PAH)基因,包含但不限于PAH基因的编码区、外显子、内含子、5'UTR、3'UTR和转录调节区。人PAH基因通过Entrez基因ID 5053鉴定。PAH mRNA的示例性核苷酸序列提供为SEQ ID NO:53。PAH多肽的示例性氨基酸序列提供为SEQ ID NO:33。在某些实施例中,PAH基因是变体PAH基因。变体PAH基因是本领域技术人员已知的并且与参考人基因组相比可以包括一个或多个核苷酸差异。在某些实施例中,变体PAH基因是在一般群体中观察到的常见变体。例如,变体rs1522296包括来自chr12:103310787处的人基因组构建Hg38中的基因组位置处的参考人基因组的单核苷酸差异。此变体在>30%的全球群体中可见,并且与PAH表达变化或疾病风险均无已知关联。
如本文所使用的,术语“rAAV基因组”是指能够通过同源重组将编辑元件(例如,一个或多个核苷酸或核苷酸间键)整合到靶基因座中以校正PAH基因中的遗传缺陷的重组AAV基因组。在某些实施例中,靶基因座在人PAH基因中。技术人员将理解,包括5'同源臂、编辑元件和3'同源臂的rAAV基因组的一部分可以相对于靶基因座(例如,人PAH基因)呈有义或反义定向。
如本文所使用的,术语“编辑元件”是指当整合在靶基因座处时修饰靶基因座的rAAV基因组的一部分。编辑元件可以在靶基因座处介导一个或多个核苷酸的插入、缺失或取代。
如本文所使用的,术语“靶基因座”是指通过编辑元件修饰的染色体的区或核苷酸间键(例如,人PAH基因的区或核苷酸间键)。
如本文所使用的,术语“同源臂”是指位于与侧接靶基因座的基因组基本上相同的编辑元件的5'或3'的rAAV基因组的一部分。在某些实施例中,靶基因座在人PAH基因中,并且同源臂包括与侧接靶基因座的基因组基本上相同的序列。
如本文所使用的,术语“AAV衣壳蛋白”是指AAV VP1、VP2或VP3衣壳蛋白。如本文所使用的,术语“进化枝F衣壳蛋白”是指包括分别与在本文的SEQ ID NO:1的氨基酸1-736、138-736和203-736中所示的VP1、VP2或VP3氨基酸序列具有至少90%同一性的氨基酸序列的AAV VP1、VP2或VP3衣壳蛋白。
如本文所使用的,两个核苷酸序列之间或两个氨基酸序列之间的“同一性百分比”是藉由将所比对的序列对之间的匹配数目乘以100并除以所比对的区的长度(包含内部间隙)来计算。同一性评分仅对完美匹配进行计数,并且不考虑氨基酸彼此之间的相似性程度。应注意,长度中仅包含内部间隙,不包含序列端处的间隙。
如本文所使用的,术语“与PAH基因突变相关的疾病或病症”是指由PAH基因的突变引起、由其加重或与其基因相关的任何疾病或病症。在某些实施例中,与PAH基因突变相关的疾病或病症是苯丙酮尿症(PKU)。
如本文所使用的,术语“以沉默方式改变”是指在不改变由编码序列或经填充子插入的编码序列编码的多肽的氨基酸序列的情况下,基因的编码序列或经填充子插入的编码序列的变化(例如通过核苷酸取代)。密码子改变可以通过本领域已知的任何方法进行(例如,如在Mauro和Chappell(2014)《分子医学进展(Trends Mol Med.)》20(11):604-13中所描述的,所述文献以全文引用的方式并入本文)。此类沉默改变是有利的,因为其降低了rAAV基因组整合到与靶基因同源的其它基因或假基因的基因座中的可能性。此类沉默改变还减少编辑元件与靶基因之间的同源性,由此减少由编辑元件而非同源臂介导的不期望的整合。
如本文所使用的,术语“编码序列”是指互补DNA(cDNA)的编码多肽的部分,其开始于起始密码子并且终止于终止密码子。基因可以由于替代性剪接和/或替代性翻译起始而具有一个或多个编码序列。编码序列可以是野生型的或者是以沉默方式改变的。示例性野生型PAH编码序列在SEQ IDNO:53中示出。
如本文所使用的,术语“聚腺苷酸化序列”是指当转录成RNA时构成聚腺苷酸化信号序列的DNA序列。聚腺苷酸化序列可以是天然的(例如,来自PAH基因)或外源性的。外源性聚腺苷酸化序列可以是哺乳动物或病毒性聚腺苷酸化序列(例如,SV40聚腺苷酸化序列)。
如本文所使用的,术语“内含子元件”是指调节(例如,控制、增加或减少)转基因的表达的顺式作用核苷酸序列,例如,DNA序列。在某些实施例中,内含子元件是经修饰的内含子,例如,合成内含子序列。在某些实施例中,内含子元件是外源性内含子元件,并且源自对其可调节的转基因是外源性的内含子。在某些实施例中,内含子元件包括经修饰的剪接受体和/或剪接供体,从而产生更稳健的剪接活性。虽然不希望受理论的束缚,但假设内含子可以增加转基因表达,例如,通过减少转录沉默和增强mRNA从细胞核向细胞质的输出。技术人员将理解,可以设计合成内含子序列以通过引入本领域已知的任何共有剪接基序来介导RNA剪接(例如,在Sibley等人,(2016)《自然评论:遗传学》,17,407-21中,所述文献通过引用整体并入本文)。示例性内含子序列在Lu等人,(2013)《分子疗法(Molecular Therapy)》21(5):954-63以及Lu等人,(2017)《人类基因疗法(Hum.Gene Ther.)》28(1):125-34中提供,所述文献通过引用整体并入本文。
如本文所使用的,术语“转录调节元件”或“TRE”是指顺式作用核苷酸序列,例如,DNA序列,其通过RNA聚合酶调节(例如,控制、增加或减少)可操作连接的核苷酸序列的转录以形成RNA分子。TRE依靠一种或多种反式作用分子,如转录因子来调接转录。因此,一个TRE在其与不同的反式作用分子接触时(例如当其位于不同类型的细胞中时)可以不同方式调节转录。TRE可以包括一种或多种启动子元件和/或增强子元件。所属领域的技术人员将了解,基因中的启动子和增强子元件可在位置上靠近,并且术语“启动子”可指包括启动子元件和增强子元件的序列。因此,术语“启动子”不排除序列中的增强子元件。启动子和增强子元件无需来源于相同基因或物种,并且每个启动子或增强子元件的序列可与基因组中的对应内源性序列一致或大体上一致。
如本文所用,术语“可操作地连接”用于描述TRE与待转录的编码序列之间的连接。通常,使基因表达处于包括一种或多种启动子和/或增强子元件的TRE的控制下。如果编码序列的转录由TRE控制或影响,那么编码序列“可操作地连接”于TRE。TRE的启动子和增强子元件可自编码序列呈任何定向和/或距离,只要获得所需转录活性即可。在某些实施例中,TRE位于编码序列的上游。
在本公开中,PAH基因中的核苷酸位置是相对于起始密码子的第一核苷酸指定的。起始密码子的第一核苷酸是位置1;起始密码子的第一核苷酸的5'处的核苷酸具有负数;起始密码子的第一核苷酸的3'处的核苷酸具有正数。如本文所使用的,人PAH基因的核苷酸1是NCBI参考序列:NG_008690.1的核苷酸5,473,并且人PAH基因的核苷酸-1是NCBI参考序列:NG_008690.1的核苷酸5,472。
在本公开中,相对于涵盖起始密码子的第一核苷酸的外显子指定PAH基因中的外显子和内含子是NCBI参考序列:NG_008690.1的核苷酸5473。涵盖起始密码子的第一核苷酸的外显子是外显子1。外显子3'到外显子1为5'到3':外显子2、外显子3等。内含子3'到外显子1为5'到3':内含子1、内含子2等。因此,PAH基因自5'至3'包括:外显子1、内含子1、外显子2、内含子2、外显子3等。如本文所使用的,人PAH基因的外显子1是NCBI参考序列:NG_008690.1的核苷酸5001-5532,并且人PAH基因的内含子1是NCBI参考序列:NG_008690.1的核苷酸5533-9704。
如本文所使用的,术语“整合”是指通过rAAV基因组与靶基因座之间的同源重组将编辑元件引入靶基因座(例如,PAH基因的)中。编辑元件的整合可以导致(例如,PAH基因的)靶基因座中的一个或多个核苷酸的取代、插入和/或缺失。
如本文所使用的,术语“编辑元件到靶基因座中的整合效率”是指在其中已发生编辑元件整合到靶基因座中的经转导群体中的细胞的百分比。
如本文所使用的,术语“编辑元件整合到靶基因座中的等位基因频率”是指其中已发生编辑元件整合到靶基因座中的经转导细胞的群体中的等位基因的百分比。
如本文所使用的,术语“标准AAV施用条件”是指在肝细胞切除后植入小鼠中的人肝细胞的转导,其中AAV以每公斤体重1×1013个载体基因组的剂量静脉内施用。
如本文所使用的,在向受试者施用AAV的情形下,术语“有效量”是指达到所期望的预防或治疗效果的AAV的量。
如本文所使用的,在提及如IDS蛋白的表达水平等可测量值时,术语“约”或“大约”涵盖给定值或范围的±20%或±10%、±5%、±1%或±0.1%的变化,如适用于执行本文所公开的方法。
II.腺相关病毒组合物
在一个方面,本文提供了可用于在PAH基因功能降低或有缺陷的细胞中恢复PAH表达的新型rAAV组合物。此类rAAV组合物在编辑受试者的细胞基因组(例如,肝细胞)以在肝特异性启动子的控制下表达PAH方面是高度有效的,并且不需要通过外源性核酸酶(例如,大范围核酸酶、锌指核酸酶、转录激活子样核酸酶(TALEN)或Cas9等RNA向导的核酸酶)的作用在靶基因座处切割基因组以促进此类编辑。因此,在某些实施例中,本文所公开的rAAV组合物不包括或不需要外源性核酸酶或编码外源性核酸酶的核苷酸序列。
在某些实施例中,本文所公开的rAAV包括:(a)AAV衣壳,所述AAV衣壳包括AAV衣壳蛋白(例如,AAV进化枝F衣壳蛋白);以及(b)rAAV基因组,所述rAAV基因组包括:(i)用于编辑PAH基因中的靶基因座的编辑元件,所述编辑元件包括与转录调节元件可操作地连接的PAH编码序列的至少一部分;(ii)与所述靶基因座的第一基因组区5'具有同源性的所述编辑元件的5'同源臂核苷酸序列位置5';以及(iii)与所述靶基因座的第二基因组区3'具有同源性的位于所述编辑元件的3'的3'同源臂核苷酸序列。在某些实施例中,本文所公开的rAAV具有通过游离型表达和通过编辑元件插入到PAH基因中的靶基因座处的基因组中两者来表达PAH转基因的潜力(参见图1)。在某些实施例中,本文所公开的rAAV允许在肝生长期间维持PAH的表达,在此期间可能丧失游离型表达。因此,rAAV组合物特别可用于治疗青少年PKU。
来自本领域已知的任何衣壳的衣壳蛋白可以用于本文所公开的rAAV组合物,包含但不限于来自AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8或AAV9血清型的衣壳蛋白。例如,在某些实施例中,衣壳蛋白包括与由SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸203-736构成的氨基酸序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的氨基酸序列。在某些实施例中,衣壳蛋白包括与由SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸203-736构成的氨基酸序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,其中:所述衣壳蛋白中与SEQ ID NO:16的氨基酸206相对应的氨基酸是C;所述衣壳蛋白中与SEQ ID NO:16的氨基酸296相对应的氨基酸是H;所述衣壳蛋白中与SEQ ID NO:16的氨基酸312相对应的氨基酸是Q;所述衣壳蛋白中与SEQ IDNO:16的氨基酸346相对应的氨基酸是A;所述衣壳蛋白中与SEQ ID NO:16的氨基酸464相对应的氨基酸是N;所述衣壳蛋白中与SEQ ID NO:16的氨基酸468相对应的氨基酸是S;所述衣壳蛋白中与SEQ ID NO:16的氨基酸501相对应的氨基酸是I;所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R;所述衣壳蛋白中与SEQ ID NO:16的氨基酸590相对应的氨基酸是R;所述衣壳蛋白中与SEQ ID NO:16的氨基酸626相对应的氨基酸是G或Y;所述衣壳蛋白中与SEQ ID NO:16的氨基酸681相对应的氨基酸是M;所述衣壳蛋白中与SEQ IDNO:16的氨基酸687相对应的氨基酸是R;所述衣壳蛋白中与SEQ ID NO:16的氨基酸690相对应的氨基酸是K;所述衣壳蛋白中与SEQ ID NO:16的氨基酸706相对应的氨基酸是C;或者所述衣壳蛋白中与SEQ ID NO:16的氨基酸718相对应的氨基酸是G。在某些实施例中,所述衣壳蛋白中与SEQ ID NO:16的氨基酸626相对应的氨基酸是G,并且所述衣壳蛋白中与SEQ IDNO:16的氨基酸718相对应的氨基酸是G。在某些实施例中,所述衣壳蛋白中与SEQ ID NO:16的氨基酸296相对应的氨基酸是H,所述衣壳蛋白中与SEQ ID NO:16的氨基酸464相对应的氨基酸是N,所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸681相对应的氨基酸是M。在某些实施例中,所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸687相对应的氨基酸是R。在某些实施例中,所述衣壳蛋白中与SEQ ID NO:16的氨基酸346相对应的氨基酸是A,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R。在某些实施例中,所述衣壳蛋白中与SEQ ID NO:16的氨基酸501相对应的氨基酸是I,所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸706相对应的氨基酸是C。在某些实施例中,所述衣壳蛋白包括由SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸203-736构成的氨基酸序列。
例如,在某些实施例中,衣壳蛋白包括与由SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸138-736构成的氨基酸序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的氨基酸序列。在某些实施例中,衣壳蛋白包括与由SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸138-736构成的氨基酸序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,其中:所述衣壳蛋白中与SEQ ID NO:16的氨基酸151相对应的氨基酸是R;所述衣壳蛋白中与SEQ ID NO:16的氨基酸160相对应的氨基酸是D;所述衣壳蛋白中与SEQ ID NO:16的氨基酸206相对应的氨基酸是C;所述衣壳蛋白中与SEQ ID NO:16的氨基酸296相对应的氨基酸是H;所述衣壳蛋白中与SEQ ID NO:16的氨基酸312相对应的氨基酸是Q;所述衣壳蛋白中与SEQ ID NO:16的氨基酸346相对应的氨基酸是A;所述衣壳蛋白中与SEQ ID NO:16的氨基酸464相对应的氨基酸是N;所述衣壳蛋白中与SEQ ID NO:16的氨基酸468相对应的氨基酸是S;所述衣壳蛋白中与SEQ ID NO:16的氨基酸501相对应的氨基酸是I;所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R;所述衣壳蛋白中与SEQ ID NO:16的氨基酸590相对应的氨基酸是R;所述衣壳蛋白中与SEQ ID NO:16的氨基酸626相对应的氨基酸是G或Y;所述衣壳蛋白中与SEQ ID NO:16的氨基酸681相对应的氨基酸是M;所述衣壳蛋白中与SEQ ID NO:16的氨基酸687相对应的氨基酸是R;所述衣壳蛋白中与SEQ ID NO:16的氨基酸690相对应的氨基酸是K;所述衣壳蛋白中与SEQ ID NO:16的氨基酸706相对应的氨基酸是C;或者所述衣壳蛋白中与SEQ ID NO:16的氨基酸718相对应的氨基酸是G。在某些实施例中,所述衣壳蛋白中与SEQ ID NO:16的氨基酸626相对应的氨基酸是G,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸718相对应的氨基酸是G。在某些实施例中,所述衣壳蛋白中与SEQ ID NO:16的氨基酸296相对应的氨基酸是H,所述衣壳蛋白中与SEQ ID NO:16的氨基酸464相对应的氨基酸是N,所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸681相对应的氨基酸是M。在某些实施例中,所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸687相对应的氨基酸是R。在某些实施例中,所述衣壳蛋白中与SEQ ID NO:16的氨基酸346相对应的氨基酸是A,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R。在某些实施例中,所述衣壳蛋白中与SEQ ID NO:16的氨基酸501相对应的氨基酸是I,所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸706相对应的氨基酸是C。在某些实施例中,所述衣壳蛋白包括由SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸138-736构成的氨基酸序列。
例如,在某些实施例中,衣壳蛋白包括与由SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736构成的氨基酸序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的氨基酸序列。在某些实施例中,衣壳蛋白包括与由SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736构成的氨基酸序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,其中:所述衣壳蛋白中与SEQ ID NO:16的氨基酸2相对应的氨基酸是T;所述衣壳蛋白中与SEQ ID NO:16的氨基酸65相对应的氨基酸是I;所述衣壳蛋白中与SEQ ID NO:16的氨基酸68相对应的氨基酸是V;所述衣壳蛋白中与SEQ ID NO:16的氨基酸77相对应的氨基酸是R;所述衣壳蛋白中与SEQ ID NO:16的氨基酸119相对应的氨基酸是L;所述衣壳蛋白中与SEQ ID NO:16的氨基酸151相对应的氨基酸是R;所述衣壳蛋白中与SEQ ID NO:16的氨基酸160相对应的氨基酸是D;所述衣壳蛋白中与SEQ ID NO:16的氨基酸206相对应的氨基酸是C;所述衣壳蛋白中与SEQ ID NO:16的氨基酸296相对应的氨基酸是H;所述衣壳蛋白中与SEQ ID NO:16的氨基酸312相对应的氨基酸是Q;所述衣壳蛋白中与SEQ ID NO:16的氨基酸346相对应的氨基酸是A;所述衣壳蛋白中与SEQ ID NO:16的氨基酸464相对应的氨基酸是N;所述衣壳蛋白中与SEQ ID NO:16的氨基酸468相对应的氨基酸是S;所述衣壳蛋白中与SEQ ID NO:16的氨基酸501相对应的氨基酸是I;所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R;所述衣壳蛋白中与SEQ ID NO:16的氨基酸590相对应的氨基酸是R;所述衣壳蛋白中与SEQ ID NO:16的氨基酸626相对应的氨基酸是G或Y;所述衣壳蛋白中与SEQ ID NO:16的氨基酸681相对应的氨基酸是M;所述衣壳蛋白中与SEQ ID NO:16的氨基酸687相对应的氨基酸是R;所述衣壳蛋白中与SEQ ID NO:16的氨基酸690相对应的氨基酸是K;所述衣壳蛋白中与SEQ ID NO:16的氨基酸706相对应的氨基酸是C;或者所述衣壳蛋白中与SEQ ID NO:16的氨基酸718相对应的氨基酸是G。在某些实施例中,所述衣壳蛋白中与SEQ ID NO:16的氨基酸2相对应的氨基酸是T,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸312相对应的氨基酸是Q。在某些实施例中,所述衣壳蛋白中与SEQ ID NO:16的氨基酸65相对应的氨基酸是I,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸626相对应的氨基酸是Y。在某些实施例中,所述衣壳蛋白中与SEQID NO:16的氨基酸77相对应的氨基酸是R,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸690相对应的氨基酸是K。在某些实施例中,所述衣壳蛋白中与SEQ ID NO:16的氨基酸119相对应的氨基酸是L,并且所述衣壳蛋白中与SEQ IDNO:16的氨基酸468相对应的氨基酸是S。在某些实施例中,所述衣壳蛋白中与SEQ ID NO:16的氨基酸626相对应的氨基酸是G,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸718相对应的氨基酸是G。在某些实施例中,所述衣壳蛋白中与SEQ ID NO:16的氨基酸296相对应的氨基酸是H,所述衣壳蛋白中与SEQ IDNO:16的氨基酸464相对应的氨基酸是N,所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸681相对应的氨基酸是M。在某些实施例中,所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸687相对应的氨基酸是R。在某些实施例中,所述衣壳蛋白中与SEQ ID NO:16的氨基酸346相对应的氨基酸是A,并且所述衣壳蛋白中与SEQ IDNO:16的氨基酸505相对应的氨基酸是R。在某些实施例中,所述衣壳蛋白中与SEQ ID NO:16的氨基酸501相对应的氨基酸是I,所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸706相对应的氨基酸是C。在某些实施例中,所述衣壳蛋白包括由SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736构成的氨基酸序列。
在某些实施例中,AAV衣壳包括以下中的两种或更多种:(a)包括由SEQ ID NO:1、2、3、4、6、7、10、11、12、13、15、16或17的氨基酸203-736构成的氨基酸序列的衣壳蛋白;(b)包括由SEQ ID NO:1、2、3、4、5、6、7、9、10、11、12、13、15、16或17的氨基酸138-736构成的氨基酸序列衣壳蛋白;以及(c)包括由SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736构成的氨基酸序列的衣壳蛋白。在某些实施例中,AAV衣壳包括:(a)具有由SEQ ID NO:1、2、3、4、6、7、10、11、12、13、15、16或17的氨基酸203-736组成的氨基酸序列的衣壳蛋白;(b)具有由SEQ ID NO:1、2、3、4、5、6、7、9、10、11、12、13、15、16或17的氨基酸138-736组成的氨基酸序列的衣壳蛋白;以及(c)具有由SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736组成的氨基酸序列的衣壳蛋白。
在某些实施例中,AAV衣壳包括以下中的一种或多种:(a)包括与SEQ ID NO:8的氨基酸203-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的衣壳蛋白;(b)包括与SEQ ID NO:8的氨基酸138-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的衣壳蛋白;以及(c)包括与SEQ ID NO:8的氨基酸1-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的衣壳蛋白。在某些实施例中,AAV衣壳包括以下中的一种或多种:(a)包括由SEQ IDNO:8的氨基酸203-736构成的氨基酸序列的衣壳蛋白;(b)包括由SEQ IDNO:8的氨基酸138-736构成的氨基酸序列的衣壳蛋白;以及(c)包括由SEQ ID NO:8的氨基酸1-736构成的氨基酸序列的衣壳蛋白。在某些实施例中,AAV衣壳包括以下中的两种或更多种:(a)包括由SEQ IDNO:8的氨基酸203-736构成的氨基酸序列的衣壳蛋白;(b)包括由SEQ ID NO:8的氨基酸138-736构成的氨基酸序列的衣壳蛋白;以及(c)包括由SEQ ID NO:8的氨基酸1-736构成的氨基酸序列的衣壳蛋白。在某些实施例中,AAV衣壳包括:(a)具有由SEQ ID NO:8的氨基酸203-736组成的氨基酸序列的衣壳蛋白;(b)具有由SEQ ID NO:8的氨基酸138-736组成的氨基酸序列的衣壳蛋白;以及(c)具有由SEQ ID NO:8的氨基酸1-736组成的氨基酸序列的衣壳蛋白。
在某些实施例中,AAV衣壳包括以下中的一种或多种:(a)包括与SEQ ID NO:11的氨基酸203-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的衣壳蛋白;(b)包括与SEQ ID NO:11的氨基酸138-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的衣壳蛋白;以及(c)包括与SEQ ID NO:11的氨基酸1-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的衣壳蛋白。在某些实施例中,AAV衣壳包括以下中的一种或多种:(a)包括由SEQIDNO:11的氨基酸203-736构成的氨基酸序列的衣壳蛋白;(b)包括由SEQ IDNO:11的氨基酸138-736构成的氨基酸序列的衣壳蛋白;以及(c)包括由SEQ ID NO:11的氨基酸1-736构成的氨基酸序列的衣壳蛋白。在某些实施例中,AAV衣壳包括以下中的两种或更多种:(a)包括由SEQ ID NO:11的氨基酸203-736构成的氨基酸序列的衣壳蛋白;(b)包括由SEQ ID NO:11的氨基酸138-736构成的氨基酸序列的衣壳蛋白;以及(c)包括由SEQ IDNO:11的氨基酸1-736构成的氨基酸序列的衣壳蛋白。在某些实施例中,AAV衣壳包括:(a)具有由SEQ ID NO:11的氨基酸203-736组成的氨基酸序列的衣壳蛋白;(b)具有由SEQ ID NO:11的氨基酸138-736组成的氨基酸序列的衣壳蛋白;以及(c)具有由SEQ ID NO:11的氨基酸1-736组成的氨基酸序列的衣壳蛋白。
在某些实施例中,AAV衣壳包括以下中的一种或多种:(a)包括与SEQ ID NO:13的氨基酸203-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的衣壳蛋白;(b)包括与SEQ ID NO:13的氨基酸138-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的衣壳蛋白;以及(c)包括与SEQ ID NO:13的氨基酸1-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的衣壳蛋白。在某些实施例中,AAV衣壳包括以下中的一种或多种:(a)包括由SEQIDNO:13的氨基酸203-736构成的氨基酸序列的衣壳蛋白;(b)包括由SEQ IDNO:13的氨基酸138-736构成的氨基酸序列的衣壳蛋白;以及(c)包括由SEQ ID NO:13的氨基酸1-736构成的氨基酸序列的衣壳蛋白。在某些实施例中,AAV衣壳包括以下中的两种或更多种:(a)包括由SEQ ID NO:13的氨基酸203-736构成的氨基酸序列的衣壳蛋白;(b)包括由SEQ ID NO:13的氨基酸138-736构成的氨基酸序列的衣壳蛋白;以及(c)包括由SEQ IDNO:13的氨基酸1-736构成的氨基酸序列的衣壳蛋白。在某些实施例中,AAV衣壳包括:(a)具有由SEQ ID NO:13的氨基酸203-736组成的氨基酸序列的衣壳蛋白;(b)具有由SEQ ID NO:13的氨基酸138-736组成的氨基酸序列的衣壳蛋白;以及(c)具有由SEQ ID NO:13的氨基酸1-736组成的氨基酸序列的衣壳蛋白。
在某些实施例中,AAV衣壳包括以下中的一种或多种:(a)包括与SEQ ID NO:16的氨基酸203-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的氨基酸序列的衣壳蛋白;(b)包括与SEQ IDNO:16的氨基酸138-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的氨基酸序列的衣壳蛋白;以及(c)包括与SEQ ID NO:16的氨基酸1-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的氨基酸序列的衣壳蛋白。在某些实施例中,AAV衣壳包括以下中的一种或多种:(a)包括由SEQ ID NO:16的氨基酸203-736构成的氨基酸序列的衣壳蛋白;(b)包括由SEQ ID NO:16的氨基酸138-736构成的氨基酸序列的衣壳蛋白;以及(c)包括由SEQ ID NO:16的氨基酸1-736构成的氨基酸序列的衣壳蛋白。在某些实施例中,AAV衣壳包括以下中的两种或更多种:(a)包括由SEQ ID NO:16的氨基酸203-736构成的氨基酸序列的衣壳蛋白;(b)包括由SEQ ID NO:16的氨基酸138-736构成的氨基酸序列的衣壳蛋白;以及(c)包括由SEQ ID NO:16的氨基酸1-736构成的氨基酸序列的衣壳蛋白。在某些实施例中,AAV衣壳包括:(a)具有由SEQ ID NO:16的氨基酸203-736组成的氨基酸序列的衣壳蛋白;(b)具有由SEQ ID NO:16的氨基酸138-736组成的氨基酸序列的衣壳蛋白;以及(c)具有由SEQ ID NO:16的氨基酸1-736组成的氨基酸序列的衣壳蛋白。
可用于本文所公开的AAV组合物中的rAAV基因组通常包括:(i)用于编辑PAH基因中的靶基因座的编辑元件,所述编辑元件包括与转录调节元件可操作地连接的PAH编码序列的至少一部分;(ii)与所述靶基因座的第一基因组区5'具有同源性的所述编辑元件的5'同源臂核苷酸序列位置5';以及(iii)与所述靶基因座的第二基因组区3'具有同源性的位于所述编辑元件的3'的3'同源臂核苷酸序列。在某些实施例中,所述rAAV基因组包括所述5'同源臂核苷酸序列的5'反向末端重复序列(5'ITR)核苷酸序列5',以及所述3'同源臂核苷酸序列的3'反向末端重复序列(3'ITR)核苷酸序列3'。
本文所公开的rAAV基因组中使用的编辑元件可以在靶基因座处介导一个或多个核苷酸的插入、缺失或取代。
在某些实施例中,当通过在靶基因座处的同源重组正确整合时,编辑元件将包括PAH编码序列的至少一部分的核苷酸序列插入到PAH基因中。在某些实施例中,编辑元件包括PAH编码序列(例如,完整的PAH编码序列)。
在某些实施例中,PAH编码序列编码野生型PAH多肽(例如,具有SEQ ID NO:33中所示的氨基酸序列)。在某些实施例中,PAH编码序列是野生型的(例如,包括SEQ ID NO:53中所示的核苷酸序列)。在某些实施例中,PAH编码序列以沉默方式改变为与野生型PAH基因相对应的外显子小于100%(例如,小于95%、90%、85%、80%、75%、70%、65%、60%、55%或50%)相同。在某些实施例中,PAH编码序列包括与SEQ ID NO:28、63或83中所示的核苷酸序列至少78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核苷酸序列或由所述核苷酸序列组成。在某些实施例中,PAH编码序列包括SEQ ID NO:28中所示的核苷酸序列。在某些实施例中,PAH编码序列由SEQ ID NO:28中所示的核苷酸序列组成。在某些实施例中,PAH编码序列包括SEQ ID NO:63中所示的核苷酸序列。在某些实施例中,PAH编码序列由SEQ ID NO:63中所示的核苷酸序列组成。在某些实施例中,PAH编码序列包括SEQ ID NO:83中所示的核苷酸序列。在某些实施例中,PAH编码序列由SEQ ID NO:83中所示的核苷酸序列组成。
在某些实施例中,可用于本文所公开的AAV组合物中的rAAV基因组包括与PAH编码序列的至少一部分可操作地连接的转录调节元件(TRE)。在某些实施例中,可用于本文所公开的AAV组合物中的rAAV基因组从5'至3'包括:TRE和PAH编码序列的至少一部分。
rAAV基因组可以用于在任何哺乳动物细胞(例如,人细胞)中表达PAH。因此,TRE可以在任何哺乳动物细胞(例如,人细胞)中具有活性。在某些实施例中,TRE在广泛的人细胞中具有活性。此类TRE可以包括组成型启动子和/或增强子元件,所述组成型启动子和/或增强子元件包含巨细胞病毒(CMV)启动子/增强子(例如,包括与SEQ ID NO:54、55或56至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列)、SV40启动子、鸡ACTB启动子(例如,包括与SEQ ID NO:47或57至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列)、JeT启动子(例如,包括与SEQ ID NO:58至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列)、smCBA启动子(例如,包括与SEQ ID NO:59至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列)、人延伸因子1α(EF1α)启动子(例如,包括与SEQ ID NO:39至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列)、包括转录因子结合位点的小鼠微小病毒(MVM)内含子(例如,包括与SEQ ID NO:61至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列)、人磷酸甘油酸激酶(PGK1)启动子、人泛素C(Ubc)启动子、人β肌动蛋白启动子、人神经元特异性烯醇化酶(ENO2)启动子、人β-葡萄糖醛酸酶(GUSB)启动子、兔β-珠蛋白元件(例如,包括与SEQ ID NO:41或62至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列)、人钙调蛋白1(CALM1)启动子(例如,包括与SEQ ID NO:44至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列)和/或人甲基-CpG结合蛋白2(MeCP2)启动子。这些TRE中的任一个可以以任何顺序组合以驱动有效转录。例如,rAAV基因组可以包括CMV增强子、CBA启动子和来自兔β-珠蛋白基因的外显子3的剪接受体,统称为CAG启动子(例如,包括与SEQ IDNO:42或64至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列)。例如,rAAV基因组可以包括CMV增强子和CBA启动子的杂合体,随后是剪接供体和剪接受体,统称为CASI启动子区(例如,包括与SEQ ID NO:48或65至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列)。
可替代地,TRE可以是组织特异性TRE,即,其在特定组织和/或器官中是活性的。组织特异性TRE包括一个或多个组织特异性启动子和/或增强子元件,和任选地一个或多个组成型启动子和/或增强子元件。所属领域的技术人员将理解,可通过所属领域中熟知的方法从组织中特异性表达的基因分离组织特异性启动子和/或增强子元件。
在某些实施例中,TRE是肝特异性的(例如,肝细胞特异性的)。示例性肝特异性TRE可以包括选自由以下组成的组的一个或多个元件:人白蛋白启动子、人运甲状腺素蛋白(TTR)启动子(例如,包括与SEQ ID NO:66至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列)、人APOE/C-I肝对照区(HCR)1或2(例如,包括与SEQ ID NO:25或68至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列)、人APOH启动子和人SERPINA1(hAAT)启动子(例如,包括与SEQ ID NO:26、69或70至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列)或其肝特异性调节模块(例如,包括与SEQ ID NO:71至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列)。在某些实施例中,hAAT启动子区包括与SEQ ID NO:72至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列。更多肝特异性启动子元件公开于WO 2009/130208和Kramer等人,《分子疗法(Molecular Therapy)》(2003)7,375–385,所述文献通过引用整体并入本文。
在某些实施例中,TRE是肾特异性的(例如,肾上皮细胞特异性的)。示例性肾特异性TRE可以包括选自由以下组成的组的一个或多个元件:人肾病蛋白启动子、人甲状旁腺激素受体启动子、人尿调素启动子和人SLC12A1启动子。在某些实施例中,TRE是脑特异性的(例如,神经元特异性、神经胶质细胞特异性、星形胶质细胞特异性、少突胶质细胞特异性、小胶质细胞特异性和/或中枢神经系统特异性)。示例性脑特异性TRE可以包括选自由人胶质原纤维酸性蛋白(GFAP)启动子和人突触蛋白1(SYN1)启动子组成的组的一个或多个元件。更多的脑特异性启动子元件公开于WO2016/100575A1中,其以全文引用的方式并入本文中。
在某些实施例中,rAAV基因组包括两个或更多个TRE,任选地包括上文所公开的TRE中的至少一种。所属领域的技术人员将理解,这些TRE中的任一个可以任何顺序组合,并且组成型TRE和组织特异性TRE的组合可驱动有效和组织特异性转录。例如,在某些实施例中,rAAV基因组包括人HCR1(例如,包括与SEQ ID NO:25或68至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列)和人EF-1α启动子(例如,包括与SEQ ID NO:39至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列),任选地其中所述人HCR1是所述人EF-1α启动子的5'。在某些实施例中,rAAV基因组包括与SEQ ID NO:60中所示的序列核苷酸至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列。
类似地,两种或更多种组织特异性TRE的组合可以驱动有效和组织特异性转录。例如,在某些实施例中,rAAV基因组包括人HCR1(例如,包括与SEQ ID NO:25至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列)和hAAT启动子(例如,包括与SEQ ID NO:26至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列),任选地其中所述人HCR1是所述hAAT启动子的5'。在某些实施例中,rAAV基因组包括与SEQ ID NO:27中所示的核苷酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列。在某些实施例中,rAAV基因组包括人HCR1(例如,包括SEQ ID NO:25中所示的核苷酸序列)和hAAT启动子(例如,包括SEQ ID NO:26中所示的核苷酸序列),任选地其中所述人HCR1是所述hAAT启动子的5'。在某些实施例中,rAAV基因组包括SEQ ID NO:27中所示的核苷酸序列。
在某些实施例中,rAAV基因组包括hAAT启动子(例如,包括与SEQ IDNO:71至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列)和人TTR启动子(例如,包括与SEQID NO:66至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列)的肝特异性调节模块,任选地其中所述肝特异性调节模块是所述人TTR启动子的5'。在某些实施例中,rAAV基因组包括与SEQ ID NO:67中所示的核苷酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列。在某些实施例中,rAAV基因组包括hAAT启动子(例如,包括SEQ ID NO:71中所示的核苷酸序列)和人TTR启动子(例如,包括SEQ ID NO:66中所示的核苷酸序列)的肝特异性调节模块,任选地其中所述肝特异性调节模块是所述人TTR启动子的5'。在某些实施例中,rAAV基因组包括SEQ ID NO:67中所示的核苷酸序列。
在某些实施例中,rAAV基因组进一步包括PAH编码序列的至少一部分的内含子元件5'。此类内含子元件可以增加转基因表达,例如,通过减少转录沉默和增强mRNA从细胞核向细胞质的输出。在某些实施例中,rAAV基因组包括5'至3':TRE、内含子元件以及PAH编码序列的至少一部分。
内含子元件可以包括PAH基因的天然内含子序列的至少一部分,或者内含子元件可以是外源性内含子元件(例如,至少包括来自不同物种的内含子序列或来自相同物种的不同基因,和/或合成内含子序列)。在某些实施例中,内含子元件是包括来自不同物种的内含子序列的至少一部分的外源性内含子元件。在某些实施例中,内含子元件是包括来自相同物种的不同基因的内含子序列的至少一部分的外源性内含子元件。在某些实施例中,内含子元件是包括合成内含子序列的外源性内含子元件。在某些实施例中,内含子元件是包括至少来自不同物种的内含子序列或来自相同物种的不同基因的组合和/或合成内含子序列的外源性内含子元件。
技术人员将理解,可以设计内含子元件以通过引入本领域已知的任何共有剪接基序来介导RNA剪接(例如,在Sibley等人,(2016)《自然评论:遗传学》,17,407-21中,所述文献通过引用整体并入本文)。示例性内含子序列在Lu等人,(2013)《分子疗法》21(5):954-63以及Lu等人,(2017)《人类基因疗法》28(1):125-34中提供,所述文献通过引用整体并入本文。
在某些实施例中,rAAV基因组包含外源性内含子元件。例如,在某些实施例中,rAAV基因组包括SV40内含子元件(例如,包括与SEQ ID NO:29至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列)或小鼠微小病毒(MVM)内含子(例如,包括与SEQ ID NO:61至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列)。在某些实施例中,rAAV基因组包括SV40内含子元件(例如,包括SEQ ID NO:29中所示的核苷酸序列)或小鼠微小病毒(MVM)内含子元件(例如,包括SEQ ID NO:61中所示的核苷酸序列)。
在某些实施例中,本文所公开的rAAV基因组进一步包括转录终止子(例如,聚腺苷酸化序列)。在某些实施例中,转录终止子是PAH编码序列的至少一部分的3'。转录终止子可以是有效终止转录的任何序列,并且本领域技术人员将理解,此类序列可以从在细胞中表达的任何基因中分离,其中期望转录PAH编码序列的至少一部分。在某些实施例中,转录终止子包括聚腺苷酸化序列。在某些实施例中,聚腺苷酸化序列与人PAH基因的内源性聚腺苷酸化序列相同或基本上相同。在某些实施例中,聚腺苷酸化序列是外源性聚腺苷酸化序列。在某些实施例中,聚腺苷酸化序列是SV40聚腺苷酸化序列(例如,包括与SEQ ID NO:31、34或35至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列,或与其互补的核苷酸序列)。在某些实施例中,聚腺苷酸化序列包括SEQ ID NO:31中所示的核苷酸序列。在某些实施例中,聚腺苷酸化序列由SEQ ID NO:31中所示的核苷酸序列组成。
在某些实施例中,rAAV基因组从5'至3'包括:TRE、内含子元件、PAH编码序列的至少一部分和聚腺苷酸化序列。在某些实施例中,TRE与SEQ IDNO:25-27、30、36、39、40-42、44、46-49、54-60或62-72中的任一个具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100序列同一性;内含子元件与SEQ ID NO:29或61具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100序列同一性;PAH编码序列的至少一部分与SEQ IDNO:28具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100序列同一性;和/或聚腺苷酸化序列与SEQ ID NO:31、34或35中的任一个具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100序列同一性。在某些实施例中,TRE包括选自由SEQ ID NO:25-27、30、36、39、40-42、44、46-49、54-60和62-72组成的组的核苷酸序列;内含子元件包括选自由SEQID NO:29和61组成的组的核苷酸序列;PAH编码序列的至少一部分包括SEQ ID NO:28中所示的核苷酸序列;和/或聚腺苷酸化序列包括选自由SEQ ID NO:31、34和35组成的组的核苷酸序列。
在某些实施例中,TRE包括SEQ ID NO:25、26或27中所示的核苷酸序列或由其组成;内含子元件包括SEQ ID NO:29中所示的核苷酸序列或由其组成;PAH编码序列的至少一部分包括SEQ ID NO:28中所示的核苷酸序列或由其组成;和/或聚腺苷酸化序列包括SEQID NO:31中所示的核苷酸序列或由其组成。在某些实施例中,TRE从5'至3'包括SEQ ID NO:25中所示的核苷酸序列;以及SEQ ID NO:26中所示的核苷酸序列(例如,TRE包括SEQ IDNO:27中所示的核苷酸序列);内含子元件包括SEQ ID NO:29中所示的核苷酸序列;PAH编码序列的至少一部分包括SEQ ID NO:28中所示的核苷酸序列;和/或聚腺苷酸化序列包括SEQID NO:31中所示的核苷酸序列。
本文所公开的rAAV基因组中使用的同源臂可以指向PAH基因或基因组附近的基因的任何区。同源臂的精确的同一性和定位由编辑元件和/或靶基因座的同一性确定。
本文所公开的rAAV基因组中采用的同源臂与侧接靶基因座(例如,PAH基因中的靶基因座)的基因组基本上相同。在某些实施例中,5'同源臂与靶基因座的第一基因组区5'具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或99.5%)核苷酸序列同一性。在某些实施例中,5'同源臂与第一基因组区具有100%核苷酸序列同一性。在某些实施例中,3'同源臂与靶基因座的第二基因组区3'具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或99.5%)核苷酸序列同一性。在某些实施例中,3'同源臂与第二基因组区具有100%核苷酸序列同一性。在某些实施例中,5'和3'同源臂各自分别与侧接靶基因座(例如,PAH基因中的靶基因座)的第一基因组区和第二基因组区至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或99.5%)相同。在某些实施例中,5'和3'同源臂各自分别与侧接靶基因座(例如,PAH基因中的靶基因座)的第一基因组区和第二基因组区100%相同。在某些实施例中,5'同源臂和/或3'同源臂的核苷酸序列与侧接靶基因座的基因组的对应区中的差异包括核苷酸序列中的非编码差异、基本上由核苷酸序列中的非编码差异组成或由核苷酸序列中的非编码差异组成。
技术人员将理解,同源臂不需要与侧接靶基因座的基因组序列100%相同,以便能够通过同源重组介导编辑元件整合到所述靶基因座中。例如,同源臂可以包括人群体中的一个或多个遗传变异,和/或设计用于改善表达水平或特异性的一个或多个修饰(例如,核苷酸取代、插入或缺失)。人遗传变异包括遗传变异和靶基因组所特有的从头变异,并且涵盖简单的核苷酸多态性、插入、缺失、重排、倒位、复制、微重复序列和其组合。此类变异是本领域已知的,并且可以例如在dnSNP的数据库中发现(参见Sherry等人,《核酸研究(NucleicAcids Res.)》2001;29(1):308-11)、基因组变体的数据库(参见《核酸研究》2014;42(数据库问题):D986-92)、ClinVar(参见《核酸研究》2014;42(数据库问题):D980–D985)、Genbank(参见《核酸研究》2016;44(数据库问题):D67–D72)、ENCODE(genome.ucsc.edu/encode/terms.html)、JASPAR(参见《核酸研究》2018;46(D1):D260–D266)以及PROMO(参见Messeguer等人,《生物信息学(Bioinformatics)》2002;18(2):333-334;Farré等人,《核酸研究》2003;31(13):3651-3653),所述文献中的每一个通过引用并入本文。技术人员将进一步理解,在同源臂与侧接靶基因座的基因组序列不是100%相同的情况下,同源臂与基因组之间的同源重组可以改变侧接靶基因座的基因组序列,使得其变得与所使用的同源臂的序列相同。
在某些实施例中,靶基因座的第一基因组区5'位于第一编辑窗口中,其中所述第一编辑窗口由与SEQ ID NO:37中所示的核苷酸序列相对应的人基因组的区组成。在某些实施例中,靶基因座的第二基因组区3'位于第二编辑窗口中,其中所述第二编辑窗口由与SEQID NO:38中所示的核苷酸序列相对应的人基因组的区组成。在某些实施例中,靶基因座的第一基因组区5'位于第一编辑窗口中,其中所述第一编辑窗口由与SEQ ID NO:37中所示的核苷酸序列相对应的人基因组的区组成;并且靶基因座的第二基因组区3'位于第二编辑窗口中,其中所述第二编辑窗口由与SEQ ID NO:38中所示的核苷酸序列相对应的人基因组的区组成。
在某些实施例中,第一编辑窗口和第二编辑窗口不同。在某些实施例中,第一编辑窗口位于第二编辑窗口的5'。在某些实施例中,第一基因组区由比第一基因组区所在的第一编辑窗口的序列短的序列组成。在某些实施例中,第一基因组区由第一基因组区所在的第一编辑窗口的序列组成。在某些实施例中,第二基因组区由比第二基因组区所在的第二编辑窗口的序列短的序列组成。在某些实施例中,第二基因组区由第二基因组区所在的第二编辑窗口的序列组成。
在某些实施例中,第一编辑窗口和第二编辑窗口相同。在某些实施例中,靶基因座是编辑窗口中的核苷酸间键或核苷酸序列,其中第一基因组区由靶基因座的编辑窗口5'的第一部分组成,并且第二基因组区由靶基因座的编辑窗口3'的第二部分组成。在某些实施例中,编辑窗口的第一部分由从编辑窗口的5'端到与靶基因座相邻的核苷酸5'的序列组成。在某些实施例中,编辑窗口的第二部分由从与靶基因座相邻的核苷酸3'到编辑窗口的3'端的序列组成。在某些实施例中,编辑窗口的第一部分由从编辑窗口的5'端到与靶基因座相邻的核苷酸5'的序列组成,并且编辑窗口的第二部分由从与靶基因座相邻的核苷酸3'到编辑窗口的3'端的序列组成。在某些实施例中,第一编辑窗口由与SEQ ID NO:37或38中所示的核苷酸序列相对应的人基因组的区组成。在某些实施例中,编辑窗口的第一部分和第二部分具有基本上相等的长度(例如,较短部分的长度与较长部分的长度的比率大于0.5、0.55、0.6、0.65、0.7、0.75、0.8、0.85、0.9、0.95、0.96、0.97、0.98或0.99)。
在某些实施例中,5'同源臂的长度为约50至约4000个核苷酸(例如,约100至约3000个、约200至约2000个、约500至约1000个核苷酸)。在某些实施例中,5'同源臂的长度为约800个核苷酸。在某些实施例中,5'同源臂的长度为约100个核苷酸。在某些实施例中,3'同源臂的长度为约50至约4000个核苷酸(例如,约100至约3000个、约200至约2000个、约500至约1000个核苷酸)。在某些实施例中,3'同源臂的长度为约800个核苷酸。在某些实施例中,3'同源臂的长度为约100个核苷酸。在某些实施例中,5'和3'同源臂中的每一个的长度独立地为约50至约4000个核苷酸(例如,约100至约3000个、约200至约2000个、约500至约1000个核苷酸)。在某些实施例中,5'和3'同源臂中的每一个的长度独立地为约800个核苷酸。
在某些实施例中,5'和3'同源臂的长度为基本上相等的核苷酸。在某些实施例中,5'和3'同源臂的长度为不对称的核苷酸。在某些实施例中,核苷酸长度的不对称由长度为至多90%的5'和3'同源臂之间的差异,如长度为至多80%、70%、60%、50%、40%、30%、20%或10%差异限定。
在某些实施例中,5'同源臂与SEQ ID NO:37中所示的核苷酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或99.5%)核苷酸序列同一性。在某些实施例中,5'同源臂进一步包括人群体中的一个或多个遗传变异。在某些实施例中,5'同源臂包括SEQ IDNO:23中所示的核苷酸序列。在某些实施例中,5'同源臂由SEQID NO:23中所示的核苷酸序列组成。
在某些实施例中,3'同源臂与SEQ ID NO:38中所示的核苷酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或99.5%)核苷酸序列同一性。在某些实施例中,3'同源臂进一步包括人群体中的一个或多个遗传变异。在某些实施例中,3'同源臂包括SEQ IDNO:24中所示的核苷酸序列。在某些实施例中,3'同源臂由SEQID NO:24中所示的核苷酸序列组成。
在某些实施例中,5'同源臂和3'同源臂各自分别与SEQ ID NO:37和38中所示的核苷酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或99.5%)核苷酸序列同一性。在某些实施例中,5'同源臂和3'同源臂各自分别与SEQID NO:23和24中所示的核苷酸序列具有至少约90%(例如,至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或99.5%)核苷酸序列同一性。在某些实施例中,5'同源臂和3'同源臂分别包括SEQ ID NO:37和38、23和24、37和24或23和38中所示的核苷酸序列。在某些实施例中,5'同源臂和3'同源臂分别由SEQ IDNO:37和38、23和24、37和24或23和38中所示的核苷酸序列组成。
在某些实施例中,rAAV基因组包括与SEQ ID NO:43至少80%(例如,至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或99.5%)相同的核苷酸序列。在某些实施例中,rAAV基因组包括SEQID NO:43中所示的核苷酸序列。在某些实施例中,rAAV基因组由SEQ ID NO:43中所示的核苷酸序列组成。
在某些实施例中,本文所公开的rAAV基因组进一步包括TRE的5'反向末端重复序列(5'ITR)核苷酸序列5',以及PAH编码序列的3'反向末端重复序列(3'ITR)核苷酸序列3'。来自任何AAV血清型或其变体的ITR序列可以用于本文所公开的rAAV基因组中。5'和3'ITR可以来自相同血清型的AAV或来自不同血清型的AAV。用于本文所公开的rAAV基因组中的示例性ITR在本文的SEQ ID NO:14、18、19、20、21和32中示出。
在某些实施例中,5'ITR或3'ITR来自AAV2。在某些实施例中,5'ITR和3'ITR两者来自AAV2。在某些实施例中,5'ITR核苷酸序列与SEQ ID NO:14具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性,或者3'ITR核苷酸序列与SEQ ID NO:18具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性。在某些实施例中,5'ITR核苷酸序列与SEQ IDNO:14具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性,并且3'ITR核苷酸序列与SEQ ID NO:18具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性。在某些实施例中,rAAV基因组包括SEQ ID NO:43中所示的核苷酸序列,5'ITR核苷酸序列具有SEQ ID NO:14的序列,并且3'ITR核苷酸序列具有SEQ ID NO:18的序列。
在某些实施例中,5'ITR或3'ITR来自AAV5。在某些实施例中,5'ITR和3'ITR两者来自AAV5。在某些实施例中,5'ITR核苷酸序列与SEQ ID NO:20具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性,或者3'ITR核苷酸序列与SEQ ID NO:21具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性。在某些实施例中,5'ITR核苷酸序列与SEQ IDNO:20具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性,以及3'ITR核苷酸序列与SEQ ID NO:21具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性。在某些实施例中,rAAV基因组包括SEQ ID NO:43中的任一个所示的核苷酸序列,5'ITR核苷酸序列具有SEQID NO:20的序列,并且3'ITR核苷酸序列具有SEQ ID NO:21的序列。
在某些实施例中,5'ITR核苷酸序列和3'ITR核苷酸序列基本上彼此互补(例如,除了5'或3'ITR中在1个、2个、3个、4个或5个核苷酸位置处的错配外,彼此互补)。
在某些实施例中,5'ITR或3'ITR被修饰以降低或消除被Rep蛋白分解(“不可分解的ITR”)。在某些实施例中,不可分解的ITR包括在末端分解位点的核苷酸序列中的插入、缺失或取代。在rAAV基因组在受感染的细胞中复制后,此类修饰允许形成AAV的自互补的双链DNA基因组。示例性不可分解的ITR序列是本领域中已知的(参见例如美国专利第7,790,154号和第9,783,824号中所提供的序列,所述美国专利以全文引用的方式并入本文)。在某些实施例中,5'ITR包括与SEQ ID NO:19至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列。在某些实施例中,5'ITR由与SEQ ID NO:19至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列组成。在某些实施例中,5'ITR由SEQ ID NO:19中所示的核苷酸序列组成。在某些实施例中,3'ITR包括与SEQ ID NO:32至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列。在某些实施例中,5'ITR由与SEQ ID NO:32至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列组成。在某些实施例中,3'ITR由SEQ ID NO:32中所示的核苷酸序列组成。在某些实施例中,5'ITR由SEQ ID NO:19中所示的核苷酸序列组成,并且3'ITR由SEQ IDNO:32中所示的核苷酸序列组成。在某些实施例中,5'ITR由SEQ ID NO:19中所示的核苷酸序列组成,并且3'ITR由SEQ ID NO:32中所示的核苷酸序列组成。
在某些实施例中,5'ITR侧接源自野生型AAV2基因组序列的另外的核苷酸序列。在某些实施例中,5'ITR侧接源自与AAV2基因组中的野生型AAV2 ITR相邻的野生型AAV2序列的另外的46bp序列。在某些实施例中,另外的46bp序列是rAAV基因组中5'ITR的3'。在某些实施例中,46bp序列由SEQ ID NO:74中所示的核苷酸序列组成。
在某些实施例中,3'ITR侧接源自野生型AAV2基因组序列的另外的核苷酸序列。在某些实施例中,3'ITR侧接源自与AAV2基因组中的野生型AAV2 ITR相邻的野生型AAV2序列的另外的37bp序列。参见例如,Savy等人,《人类基因疗法方法(Human Gene TherapyMethods)》(2017)28(5):277-289,所述文献通过引用以其整体并入本文)。在某些实施例中,另外的37bp序列是rAAV基因组中3'ITR的5'。在某些实施例中,37bp序列由SEQ ID NO:73中所示的核苷酸序列组成。
在某些实施例中,5'同源臂与SEQ ID NO:37中所示的核苷酸序列具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%核苷酸序列同一性。在某些实施例中,5'同源臂进一步包括人群体中的一个或多个遗传变异。在某些实施例中,5'同源臂包括SEQ ID NO:23中所示的核苷酸序列。在某些实施例中,5'同源臂由SEQ ID NO:23中所示的核苷酸序列组成。
在某些实施例中,3'同源臂与SEQ ID NO:38中所示的核苷酸序列具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%核苷酸序列同一性。在某些实施例中,3'同源臂进一步包括人群体中的一个或多个遗传变异。在某些实施例中,3'同源臂包括SEQ ID NO:24中所示的核苷酸序列。在某些实施例中,3'同源臂由SEQ ID NO:24中所示的核苷酸序列组成。
在某些实施例中,rAAV基因组从5'至3'包括:5'同源臂、5'ITR、TRE、内含子元件、PAH编码序列的至少一部分、聚腺苷酸化序列、3'ITR和/或3'同源臂。在某些实施例中,5'同源臂与SEQ ID NO:37或23具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100序列同一性;5'ITR与SEQ ID NO:14、19或20具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100序列同一性;TRE与SEQ ID NO:25、26、27、30、36、39、40、41、42、44、46、47、48、49、54、55、56、57、58、59、60、62、64、65、66、67、68、69、70、72或72具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100序列同一性;内含子元件与SEQ ID NO:29或61具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100序列同一性;PAH编码序列的至少一部分与SEQ ID NO:28具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100序列同一性;聚腺苷酸化序列与SEQ ID NO:31、34或35具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100序列同一性;3'ITR与SEQ ID NO:18、21或32具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100序列同一性;和/或3'同源臂与SEQ ID NO:38或24具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100序列同一性。
在某些实施例中,5'同源臂包括选自由SEQ ID NO:37和23组成的组的核苷酸序列;5'ITR包括选自由SEQ ID NO:14、19或20组成的组的核苷酸序列;TRE包括选自由SEQ IDNO:25-27、30、36、39、40-42、44、46-49、54-60和62-72组成的组的核苷酸序列;内含子包括选自由SEQ ID NO:29和61组成的组的核苷酸序列;PAH编码序列的至少一部分包括SEQ IDNO:28中所示的核苷酸序列;聚腺苷酸化序列包括选自由SEQ ID NO:31、34和35组成的组的核苷酸序列;3ITR包括选自由SEQ ID NO:18、21和32组成的组的核苷酸序列;和/或3'同源臂包括选自由SEQ ID NO:38和24组成的组的核苷酸序列。
在某些实施例中,5'同源臂包括SEQ ID NO:23中所示的核苷酸序列或由其组成;5'ITR包括SEQ ID NO:14中所示的核苷酸序列或由其组成;TRE包括SEQ ID NO:25、26或27中所示的核苷酸序列或由其组成;内含子元件包括SEQ ID NO:29中所示的核苷酸序列或由其组成;PAH编码序列的至少一部分包括SEQ ID NO:28中所示的核苷酸序列或由其组成;聚腺苷酸化序列包括SEQ ID NO:31中所示的核苷酸序列或由其组成;3'ITR包括SEQ ID NO:18中所示的核苷酸序列或由其组成;和/或5'同源臂包括SEQ ID NO:24中所示的核苷酸序列或由其组成。
在某些实施例中,rAAV基因组从5'至3'包括:包括SEQ ID NO:23中所示的核苷酸序列的5'同源臂;包括SEQ ID NO:14中所示的核苷酸序列的5'ITR;从5'至3'包括SEQ IDNO:25中所示的核苷酸序列,以及SEQ ID NO:26中所示的核苷酸序列的TRE(例如,TRE包括SEQ ID NO:27中所示的核苷酸序列);包括SEQ ID NO:29中所示的核苷酸序列的内含子元件;包括SEQ ID NO:28中所示的核苷酸序列的PAH编码序列的至少一部分;包括SEQ ID NO:31中所示的核苷酸序列的聚腺苷酸化序列;包括SEQ ID NO:18中所示的核苷酸序列的3'ITR;以及包括SEQ ID NO:24中所示的核苷酸序列的5'同源臂。
在某些实施例中,rAAV基因组包括与SEQ ID NO:45至少80%(例如,至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%)相同的核苷酸序列。在某些实施例中,rAAV基因组包括SEQ ID NO:45中所示的核苷酸序列。在某些实施例中,rAAV基因组由SEQ ID NO:45中所示的核苷酸序列组成。
在另一方面,本文提供了包括与SEQ ID NO:28、43、45、51或52中所示的核酸序列至少80%(例如,至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%)相同的核酸序列的多核苷酸。在某些实施例中,多核苷酸包括SEQ ID NO:43、45、51或52中所示的核酸序列或由其组成。
在另一方面,本公开提供了药物组合物,其包括如本文所公开的AAV和药学上可接受的赋形剂、佐剂、稀释剂、媒剂或载体或其组合。“药学上可接受的载体”包含任何在与组合物的活性成分组合时使所述成分保留生物活性并不引起破坏性生理学反应(如不希望的免疫反应)的材料。药学上可接受的载体包含水、磷酸盐缓冲盐水、乳液(如油/水乳液)和湿润剂。包括此类载体的组合物通过熟知的常规方法调配,如以下所示的方法:《雷明顿氏医药科学(Remington's Pharmaceutical Sciences)》,当前版,宾夕法尼亚州伊斯顿的马克出版公司(Mack Publishing Co.,Easton Pa.)18042,美国;A.Gennaro(2000)“《雷明顿:药物科学与实践(Remington:The Science and Practice of Pharmacy)》”第20版,利平科特威廉斯和威尔金斯出版公司(Lippincott,Williams,&Wilkins);《药物剂型和药物递送系统(Pharmaceutical Dosage Forms and Drug Delivery Systems)》(1999)H.C.Ansel等人编辑,第7版,利平科特·威廉斯和威尔金斯出版社;以及《药物赋形剂手册(Handbook ofPharmaceutical Excipients)》(2000)A.H.Kibbe等人编辑,第3版,美国药剂师协会(Amer.Pharmaceutical Assoc)。
在另一方面,本公开提供了多核苷酸,其包括编码人PAH蛋白或其片段的编码序列,其中所述编码序列已以沉默方式改变以与野生型人PAH基因小于100%(例如,小于99%、98%、97%、96%、95%、90%、85%、80%、75%、70%、65%、60%、55%或50%)相同。在某些实施例中,多核苷酸包括SEQ ID NO:28中所示的核苷酸序列。多核苷酸可以包括DNA、RNA、经修饰的DNA、修饰的RNA或其组合。在某些实施例中,多核苷酸是表达载体。
本文所公开的AAV组合物特别有利,因为其能够在体内和体外两者中高效编辑细胞中的PAH基因。在某些实施例中,当在标准AAV施用条件下,在不存在外源性核酸酶的情况下,向植入人肝细胞的小鼠施用AAV时,编辑元件到靶基因座中的整合效率为至少1%(例如,至少2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或95%)。在某些实施例中,当在标准AAV施用条件下,在不存在外源性核酸酶的情况下,向植入人肝细胞的小鼠施用AAV时,编辑元件整合到靶基因座中的等位基因频率为至少0.5%(例如,至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或95%)。
可以采用确定PAH基因的编辑效率的任何方法。在某些实施例中,将单个细胞与转导细胞的群体分离,并且使用可以鉴定正确整合到PAH基因的靶基因座中的编辑元件的存在的PCR引物进行单细胞PCR。此类方法可以进一步包括使用选择性地扩增未经修饰的靶基因座的PCR引物对相同细胞的单细胞PCR。以此方式,可以确定细胞的基因型。例如,如果单细胞PCR示出细胞具有经编辑的靶基因座和未经修饰的靶基因座两者,则细胞将被视为经编辑的PAH基因的杂合子。
另外地或可替代地,在某些实施例中,可以使用仅检测经编辑的PAH等位基因的引物和探针,对从转导细胞的群体提取的DNA进行线性扩增介导的PCR(LAM-PCR)、定量PCR(qPCR)或数字液滴PCR(ddPCR)。此类方法可以进一步包括另外的qPCR或ddPCR(在同一反应或单独反应中),以确定样品中的总基因组的数目和未经编辑的PAH等位基因的数目。这些数目可以用于确定编辑元件整合到靶基因座中的等位基因频率。
另外地或可替代地,在某些实施例中,可以通过使用与侧接靶基因座的PAH基因的区结合的引物的PCR,或者通过使用结合rAAV基因组内的区(例如,包括与基因座非天然的外源性序列的区)的引物的LAM-PCR从转导细胞的群体中提取的DNA扩增PAH基因座。所得PCR扩增子可以使用单分子下一代测序(NGS)技术单独测序,以确定转导细胞的群体中存在的经编辑的和未经编辑的PAH等位基因的相对数目。这些数目可以用于确定编辑元件整合到靶基因座中的等位基因频率。
在另一方面,本公开提供了药物组合物,其包括如本文所公开的AAV和药学上可接受的赋形剂、佐剂、稀释剂、媒剂或载体或其组合。“药学上可接受的载体”包含任何在与组合物的活性成分组合时使所述成分保留生物活性并不引起破坏性生理学反应(如不希望的免疫反应)的材料。药学上可接受的载体包含水、磷酸盐缓冲盐水、乳液(如油/水乳液)和湿润剂。包括此类载体的组合物通过熟知的常规方法调配,如以下所示的方法:《雷明顿氏医药科学(Remington's Pharmaceutical Sciences)》,当前版,宾夕法尼亚州伊斯顿的马克出版公司(Mack Publishing Co.,Easton Pa.)18042,美国;A.Gennaro(2000)“《雷明顿:药物科学与实践》”第20版,利平科特威廉斯和威尔金斯出版公司;《药物剂型和药物递送系统》(1999)H.C.Ansel等人编辑,第7版,利平科特·威廉斯和威尔金斯出版社;以及《药物赋形剂手册》(2000)A.H.Kibbe等人编辑,第3版,美国药剂师协会。
III.使用方法
在另一方面,本公开提供了用于恢复细胞中PAH基因功能的方法。所述方法通常包括用如本文所公开的rAAV转导细胞。此类方法在编辑细胞中的PAH基因功能方面是高效的,并且不需要通过外源性核酸酶(例如,大范围核酸酶、锌指核酸酶、转录激活子样核酸酶(TALEN)或Cas9等RNA向导的核酸酶)的作用在靶基因座处切割基因组以促进此类校正。因此,在某些实施例中,本文所公开的方法涉及用如本文所公开的rAAV转导细胞,而不共转导或共施用外源性核酸酶或编码外源性核酸酶的核苷酸序列。
本文所公开的方法可以应用于携带PAH基因中的突变的任何细胞。本领域技术人员将理解,主动表达PAH的细胞是特别感兴趣的。因此,在某些实施例中,所述方法应用于肝、肾、脑、脑垂体、肾上腺、胰腺、膀胱、胆囊、结肠、小肠或乳腺中的细胞。在某些实施例中,所述方法应用于肝细胞和/或肾细胞。
本文所公开的方法可体外进行以用于研究目的或可离体或体内进行以用于治疗目的。
在某些实施例中,待转导的细胞在哺乳动物受试者中并以可有效转导受试者中的细胞的量向受试者施用AAV。因此,在某些实施例中,本公开提供了用于治疗患有与PAH基因突变相关的疾病或病症的受试者的方法,所述方法通常包括向所述受试者施用有效量的如本文所公开的rAAV。受试者可以是人受试者或含有人肝细胞的啮齿动物受试者(例如,小鼠)。合适的小鼠受试者包含但不限于人肝细胞(例如,人肝细胞)已植入其中的小鼠。与PAH基因突变相关的任何疾病或病症都可以使用本文所公开的方法进行治疗。合适的疾病或病症包含但不限于苯丙酮尿症。在某些实施例中,在不共转导或共施用外源性核酸酶或编码外源性核酸酶的核苷酸序列的情况下转导细胞。
本文所公开的方法特别有利,因为其能够在体内和体外两者中高效编辑细胞中的PAH基因。在某些实施例中,当在标准AAV施用条件下,在不存在外源性核酸酶的情况下,向植入人肝细胞的小鼠施用AAV时,编辑元件到靶基因座中的整合效率为至少1%(例如,至少2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或95%)。在某些实施例中,当在标准AAV施用条件下,在不存在外源性核酸酶的情况下,向植入人肝细胞的小鼠施用AAV时,编辑元件整合到靶基因座中的等位基因频率为至少0.5%(例如,至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或95%)。
本文所公开的方法可体外进行以用于研究目的或可离体或体内进行以用于治疗目的。
在某些实施例中,待转导的细胞在哺乳动物受试者中并以可有效转导受试者中的细胞的量向受试者施用AAV。因此,在某些实施例中,本公开提供了用于治疗患有与PAH基因突变相关的疾病或病症的受试者的方法,所述方法通常包括向所述受试者施用有效量的如本文所公开的rAAV。受试者可以是人受试者、非人灵长类动物受试者(例如,食蟹猴)或具有PAH突变的啮齿动物受试者(例如,小鼠)。与PAH基因突变相关的任何疾病或病症都可以使用本文所公开的方法进行治疗。合适的疾病或病症包含但不限于苯丙酮尿症(PKU)。
在某些实施例中,前述方法采用rAAV,其包括:(a)包括由SEQ ID NO:16的氨基酸203-736构成的氨基酸序列的AAV衣壳蛋白,和包括5'至3'以下遗传元件的rAAV基因组:5'同源臂(例如,包括SEQ ID NO:23中所示的核苷酸序列的5'同源臂)、5'ITR(例如,包括SEQID NO:14中所示的核苷酸序列的5'ITR)、转录调节元件(例如,包括SEQ ID NO:27中所示的核苷酸序列的TRE)、内含子元件(例如,包括SEQ ID NO:29中所示的核苷酸序列的内含子元件)、PAH编码序列的至少一部分(例如,包括SEQ ID NO:28中所示的核苷酸序列的PAH编码序列)、聚腺苷酸化序列(例如,SEQ IDNO:31的SV40聚腺苷酸化序列)、3'ITR(例如,包括SEQID NO:18中所示的核苷酸序列的3'ITR)以及3'同源臂(例如,包括SEQ ID NO:24中所示的核苷酸序列的3'同源臂);(b)包括由SEQ ID NO:16的氨基酸138-736构成的氨基酸序列的AAV衣壳蛋白,和包括5'至3'以下遗传元件的rAAV基因组:5'同源臂(例如,包括SEQ ID NO:23中所示的核苷酸序列的5'同源臂)、5'ITR(例如,包括SEQ ID NO:14中所示的核苷酸序列的5'ITR)、转录调节元件(例如,包括SEQ ID NO:27中所示的核苷酸序列的TRE)、内含子元件(例如,包括SEQ ID NO:29中所示的核苷酸序列的内含子元件)、PAH编码序列的至少一部分(例如,包括SEQ ID NO:28中所示的核苷酸序列的PAH编码序列)、聚腺苷酸化序列(例如,SEQ ID NO:31的SV40聚腺苷酸化序列)、3'ITR(例如,包括SEQ ID NO:18中所示的核苷酸序列的3'ITR)以及3'同源臂(例如,包括SEQ ID NO:24中所示的核苷酸序列的3'同源臂);和/或(c)包括SEQ ID NO:16的氨基酸序列的AAV衣壳蛋白,和包括5'至3'以下遗传元件的rAAV基因组:5'同源臂(例如,包括SEQ IDNO:23中所示的核苷酸序列的5'同源臂)、5'ITR(例如,包括SEQ ID NO:14中所示的核苷酸序列的5'ITR)、转录调节元件(例如,包括SEQ ID NO:27中所示的核苷酸序列的TRE)、内含子元件(例如,包括SEQ ID NO:29中所示的核苷酸序列的内含子元件)、PAH编码序列的至少一部分(例如,包括SEQ ID NO:28中所示的核苷酸序列的PAH编码序列)、聚腺苷酸化序列(例如,SEQ ID NO:31的SV40聚腺苷酸化序列)、3'ITR(例如,包括SEQ ID NO:18中所示的核苷酸序列的3'ITR)以及3'同源臂(例如,包括SEQ IDNO:24中所示的核苷酸序列的3'同源臂)。
在某些实施例中,用本文中所公开的AAV组合物转导细胞可如本文所提供来进行或通过所属领域中的技术人员已知的任何转导方法来进行。在某些实施例中,细胞可以以50,000;100,000;150,000;200,000;250,000;300,000;350,000;400,000;450,000;或500,000的感染复数(MOI)或提供细胞的最佳转导的任何MOI与AAV接触。
可以通过任何适当的途径向受试者施用本文所公开的AAV组合物,所述途径包含但不限于静脉内、腹膜内、皮下、肌肉内、鼻内、局部或皮内途径。在某些实施例中,将组合物调配成用于通过静脉内注射或皮下注射施用。
IV.AAV包装系统
在另一方面,本公开提供用于本文中所公开的重组腺相关病毒(rAAV)的重组制备的包装系统。此类包装系统通常包括:编码一个或多个AAV Rep蛋白的第一核苷酸;编码如本文所公开的AAV中的任何AAV的衣壳蛋白的第二核苷酸;以及包括如本文所公开的rAAV基因组中的任何rAAV基因组的第三核苷酸序列,其中所述包装系统在细胞中是操作性的以将rAAV基因组围封在衣壳中以形成AAV。
在某些实施例中,包装系统包括第一载体,其包括编码一个或多个AAV Rep蛋白的第一核苷酸序列和编码AAV衣壳蛋白的第二核苷酸序列,以及第二载体,其包括有包括rAAV基因组的第三核苷酸序列。如在如本文中所描述的包装系统的上下文中所使用,“载体”是指作为用于将核酸引入到细胞中的媒剂的核酸分子(例如,质粒、病毒、粘粒、人工染色体等)。
任何AAV Rep蛋白均可用于本文中所公开的包装系统中。在包装系统的某些实施例中,Rep核苷酸序列编码AAV2 Rep蛋白。合适的AAV2 Rep蛋白包含(但不限于)Rep 78/68或Rep 68/52。在包装系统的某些实施例中,编码AAV2 Rep蛋白的核苷酸序列包括编码与SEQ ID NO:22的AAV2 Rep氨基酸序列具有最小序列同一性百分比的蛋白质的核苷酸序列,其中跨AAV2 Rep蛋白的氨基酸序列长度的最小序列同一性百分比为至少70%(例如,至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%)。在包装系统的某些实施例中,AAV2 Rep蛋白具有SEQ ID NO:22中所示的氨基酸序列。
在包装系统的某些实施例中,包装系统进一步包括第四核苷酸序列,所述第四核苷酸序列包括一个或多个辅助病毒基因。在包装系统的某些实施例中,包装系统进一步包括包含第四核苷酸序列的第三载体,例如,辅助病毒载体,所述第四核苷酸序列包括一个或多个辅助病毒基因。第三载体可为独立的第三载体、与第一载体整合在一起或与第二载体整合在一起。
在包装系统的某些实施例中,辅助病毒选自由以下组成的群组:腺病毒、疱疹病毒(包含单纯性疱疹病毒(HSV))、痘病毒(如痘苗病毒)、巨细胞病毒(CMV)和杆状病毒。在其中辅助病毒是腺病毒的某些包装系统实施例中,腺病毒基因组包括一种或多种选自由以下组成的群组的腺病毒RNA基因:El、E2、E4和VA。在其中辅助病毒是HSV的某些包装系统实施例中,HSV基因组包含选自由以下组成的群组的HSV基因中的一个或多个:UL5/8/52、ICPO、ICP4、ICP22和UL30/UL42。
在包装系统的某些实施例中,第一载体、第二载体和/或第三载体包含在一个或多个质粒内。在某些实施例中,第一载体和第三载体包含于第一质粒内。在某些实施例中,第二载体和第三载体包含于第二质粒内。
在包装系统的某些实施例中,第一、第二和/或第三载体包含于一种或多种重组辅助病毒内。在某些实施例中,第一载体和第三载体包含于重组辅助病毒内。在某些实施例中,第二载体和第三载体包含于重组辅助病毒内。
在另外的方面,本公开提供一种用于如本文中所描述的AAV的重组制备的方法,其中所述方法包含在可操作以将rAAV基因组包裹于衣壳中以形成如本文中所描述的rAAV的条件下,用如本文中所描述的包装系统转染或转导细胞。用于rAAV的重组制备的示例性方法包含短暂转染(例如,用含有如本文所描述的第一载体和第二载体以及任选地第三载体的一种或多种转染质粒)、病毒感染(例如,用一种或多种重组辅助病毒,如腺病毒、痘病毒(如牛痘病毒)、疱疹病毒(包含HSV、巨细胞病毒或杆状病毒,其含有如本文所描述的第一载体和第二载体以及任选地第三载体)和稳定的生产细胞系转染或感染(例如,用稳定的生产细胞,如哺乳动物或昆虫细胞,其含有如本文所描述的编码一个或多个AAV Rep蛋白的Rep核苷酸序列和/或编码一个或多个AAV衣壳蛋白的Cap核苷酸序列,并且其中以质粒或重组辅助病毒形式递送如本文所描述的rAAV基因组)。
因此,本公开提供了一种用于制备重组AAV(rAAV)的包装系统,其中所述包装系统包括编码一个或多个AAV Rep蛋白的第一核苷酸序列;编码本文所描述的AAV中的任一个AAV的衣壳蛋白的第二核苷酸序列;包括本文所描述的AAV中的任一个AAV的rAAV基因组序列的第三核苷酸序列;以及任选地包括一个或多个辅助病毒基因的第四核苷酸序列。
V.实例
这些实例以说明性方式而非限制性方式提供。
实施例1:hPAH校正载体设计
小鼠特异性PAH基因编辑载体PAH-006m
小鼠特异性基因编辑AAV载体PAH-006m在图2A中示出。此载体被设计成使用对小鼠序列特异性的左同源臂和右同源臂将人PAH编码序列整合到小鼠PAH基因基因座中。PAH-006m从5'至3'包括以下遗传元件:5'ITR元件;5'同源臂;以沉默方式改变的人PAH编码序列;SV40聚腺苷酸化序列;3'同源臂;以及3'ITR元件。这些元件的序列在表1中示出。PAH-006m不包括异源启动子。
小鼠特异性PAH基因转移/基因编辑载体PAH-006m-LP-1
小鼠特异性基因转移/基因编辑AAV载体PAH-006m-LP-1在图2B中示出。此载体被设计成使用小鼠左同源臂和右同源臂将人PAH编码序列整合到小鼠PAH基因基因座中,并且还允许在不存在基因组整合的情况下在异源肝特异性启动子的控制下在细胞中表达人PAH。PAH-006m-LP-1从5'至3'包括以下遗传元件:5'ITR元件;5'同源臂;包含人载脂蛋白肝控制区(HCR)元件、人α-1-抗胰蛋白酶(hAAT)启动子元件和hAAT外显子1的转录调节元件;SV40元件;以沉默方式改变的人PAH编码序列;SV40聚腺苷酸化序列;3'同源臂;以及3'ITR元件。这些元件的序列在表1中示出。
人特异性PAH基因编辑载体PAH-032h
人特异性基因编辑AAV载体PAH-032h在图2C中示出。此载体被设计成使用对人序列特异性的左同源臂和右同源臂将人PAH编码序列整合到人PAH基因基因座中。PAH-032h从5'至3'包括以下遗传元件:5'ITR元件;5'同源臂;剪接受体;2A元件;以沉默方式改变的人PAH编码序列;SV40聚腺苷酸化序列;3'同源臂;以及3'ITR元件。这些元件的序列在表1中示出。PAH-032h不包括异源启动子。
人特异性PAH基因转移/基因编辑载体hPAH-hI1C-032-LP1-SD3
人特异性基因转移/基因编辑AAV载体hPAH-hI1C-032-LP1-SD3在图2D中示出。此载体被设计成使用人左同源臂和右同源臂将人PAH编码序列整合到人PAH基因基因座中,并且还允许在不存在基因组整合的情况下在异源肝特异性启动子的控制下在细胞中表达人PAH。hPAH-hI1C-032-LP1-SD3从5'至3'包括以下遗传元件:5'ITR元件;5'同源臂;包含人载脂蛋白肝控制区(HCR)元件、人α-1-抗胰蛋白酶(hAAT)启动子元件和hAAT外显子1的转录调节元件;SV40元件;以沉默方式改变的人PAH编码序列;SV40聚腺苷酸化序列;3'同源臂;以及3'ITR元件。这些元件的序列在表1中示出。
表1:PAH校正载体PAH-006m、PAH-006m-LP-1、PAH-032h和hPAH-hI1C-032-LP1-SD3中的选定遗传元件
Figure BDA0004038382540000471
“-”表示不存在此元件
实例2:小鼠模型中hPAH校正载体的分析
材料和方法
PAHenu2小鼠模型:
PAHenu2小鼠模型用于通过测量载体基因组、靶基因插入百分比、hPAH mRNA表达和Phe/Tyr浓度来创建包装在AAVHSC15衣壳中的PAH校正载体的剂量应答。
PAHenu2小鼠系通过生殖系乙基亚硝基脲诱变产生,随后进行Phe清除筛选以分离缺乏PAH活性的突变型小鼠系(参见McDonald JD等人,《美国国家科学院院刊(PNAS)》1990;87:1965–1967,所述文献以全文引用的方式并入本文中)。其在编码PAH活性位点的区中具有纯合子错义突变(外显子7中的F263S),从而导致PAH的活性消除。外显子7内的突变在患有PAH缺乏症的人中是常见的,尽管人中的PAH缺乏症通常在化合物杂合背景中表达。PAHenu2小鼠的血液Phe水平始终高于1200μmol/L。
Figure BDA0004038382540000481
小鼠人肝异种移植模型:
含有人肝组织的Fah-/-/Rag2-/-/Il2rg-/-(FRG)小鼠(Azuma等人,(2007)《自然生物技术(Nat.Biotechnol.)》25(8):903-910)在跨一系列剂量施用包装在AAVHSC15衣壳中的校正载体之后,用于测量载体基因组的体内转导、人DNA靶基因插入和hPAH在人肝组织中的mRNA表达。
Figure BDA0004038382540000482
人肝异种移植物模型是携带Fah-/-、IL2rg-/-和Rag2-/-的三重基因敲除的免疫功能不全的小鼠品系。由于IL2rg-/-和Rag2-/-敲除,这些小鼠缺乏B细胞、T细胞和NK细胞,从而导致接受用人细胞移植。Fah-/-基因型使这些小鼠依赖于肝保护性药物2-(2-硝基-4-三氟甲基苯甲酰基)-1,3-环己烷二酮(NTBC),从而使得停用所述肝保护性药物会导致肝细胞损失和动物在4-8周内死亡。
为了在FRG小鼠中产生人源化肝,在移植人原代肝细胞的同时停用NTBC。由于人肝细胞具有完整的FAH基因,因此仅鼠肝细胞受影响,从而导致小鼠肝室逐渐再填充人肝细胞。人再填充肝示出>90%的人肝细胞和恢复的肝功能(Azuma等人,(2007)《自然生物技术》25(8):903-910)。
中靶插入-ddPCR连接测定:
为了确定在PAH基因座处的每个等位基因的靶插入水平,采用使用液滴数字PCR(ddPCR)的测定。在此测定中,通过测量hPAH转基因与基因组靶之间的遗传连接来确定靶插入。连接是测量两个序列在同一DNA链上的频率。确定与未连接的载体和基因组序列连接的量可以用于测量插入效率,所述插入效率以每等位基因的插入百分比报告。
为了通过连接测量靶插入,使用两个引物和探针组,一个靶向以沉默方式改变的hPAH有效负载,并且第二个靶向同源臂之外的Pah基因组序列。每个探针由FAM或HEX通道中的荧光团组成,使得当DNA在分割的液滴中分析时,可以通过其发射特征来对每个液滴进行评分,从而产生三个可能的信号之一:FAM阳性(仅以沉默方式改变的hPAH有效负载);HEX阳性(仅基因组);以及HEX+FAM阳性(含有以沉默方式改变的hPAH有效负载和基因组序列)。通过测定由于概率而含有超过预期的有效负载和基因组序列两者的液滴的比例,除以所测试的Pah等位基因的总数目来测量靶插入。
由于载体与基因组的相对浓度可能跨剂量和模型而异,因此确保每个测量结果在载体和靶基因组序列两者的检测线性范围内是重要的。因此,在测量靶插入之前,跨1ng、5ng、10ng、100ng的样品输入浓度范围测量载体和靶基因组的相对丰度。载体与基因组的比率用于确定样品输入浓度,其中载体和基因组均落入ddPCR的检测限内,所述检测限介于0.25-5000个分子/μl之间。
中靶插入-下一代测序(NGS)测定:
使用此方法以使用跨越人PAH编辑构建体的左整合位点和右整合位点的测定计算靶插入。两个扩增子中的每一个扩增子共享位于侧接每个同源臂的基因组DNA上的其相应的向外引物,而向内引物对于未经编辑的等位基因或对于经编辑的等位基因而言是唯一的。通过计算覆盖同源臂与插入的基因或未经编辑的野生型序列之间的连接的序列的数目,来计算每个野生型(WT)和经编辑的序列的数目。具有覆盖插入部位的左侧和右侧两者的单独测定提供了插入的冗余定量。通过使用此NGS方法,可以检测每等位基因总数的靶插入百分比,并且另外,可以收集整个插入位点的序列,从而能够检测从头突变(例如,不正确的插入和缺失事件以及ITR整合)。
对于左整合位点和右整合位点,使用11步标准来解释未插入的和插入的扩增效率的差异。每个控制面板由比率如下的经纯化的未插入的扩增子和经编辑的扩增子组成:0%经编辑的、1%、2%、5%、10%、50%、60%、90%、95%、98%、99%和100%经编辑的对照序列。靶插入效率计算如下:对未插入和插入的基因组基因座特异性的测序读段进行计算,并且通过(插入读段计数/总读段计数*100%)计算靶插入并且与标准曲线拟合。当通过两个独立测定测量每个样品的编辑定量时,每个独立测定跨越相对的同源臂到天然基因组中,从而确定每个测量结果之间的一致性。
中靶准确性-下一代测序(NGS)测定:
为了确定靶基因插入是否伴随整合位点处的从头突变,对跨越同源臂的左侧和右侧之外的基因组序列和进入到靶插入位点中的PCR扩增子进行测序。每个样品共测序了四个扩增子。评估跨越每个同源臂的插入特异性扩增子(hPAH依赖性PCR)或跨越每个同源臂的WT/未插入的等位基因(无hPAH插入)。
为了鉴定测定的检测限,通过混合两个在0%、0.1%、0.5%、1%、2%、5%、10%、50和100%下变化为一个碱基(T至G变异)的右同源臂扩增子来构建基于扩增子的控制面板。扩增子控制面板经历了相同的处理步骤。基于从标准曲线调用的定量变体,在非随机位置处以0.1-0.25%的频率观察到假阳性变体。几乎所有位置的测序覆盖度均高于10,000。根据以下标准,变体被视为是真正的阳性:(1)在>0.5%变体频率和通过滤波器下;(2)在两个技术测序重复中出现;以及(3)在给定可比较的序列深度和质量的WT等位基因中未观察到。
结果
使用含有靶向小鼠PAH基因座的同源臂的小鼠特异性校正载体PAH-006m,在PAHenu2小鼠中进行研究。PAH-006m不含肝特异性启动子,并且因此,表达由内源性启动子元件驱动。向每组三只雄性小鼠施用包装在AAVHSC15衣壳或调配物缓冲液中的1E+14vg/kgPAH-006m,并且每周测量血液Phe水平,持续12周。在12周时间点,处死小鼠以测量在PAH基因座处的靶插入和mRNA表达水平。
在包装在AAVHSC15衣壳中的PAH-006m施用后2周,血液Phe水平降低至正常水平,如在图3中所示出的。在12周研究期间,血液Phe的减少维持在<360μM的水平。
使用如上述材料和方法中所述的ddPCR连接测定测量在PAH基因座处的中靶插入水平。在12周时间点时,在肝中检测到3-7%的靶插入/等位基因的范围,如在图4中所示出的。还测量(相对于小鼠GAPDH)以沉默方式改变的hPAH mRNA的水平,并且在图5中示出。检测到以沉默方式改变的hPAH mRNA的表达(PAH/GAPDH mRNA比率为0.38±0.06)。值得注意的是,发现每个等位基因的中靶插入水平与mRNA表达水平直接相关(R平方0.82;P<0.02)。
为了确定在人肝中是否可以实现类似水平的中靶插入和mRNA表达,在含有人肝异种移植物的
Figure BDA0004038382540000501
小鼠中进行实验。小鼠用包装在AAVHSC15衣壳中的1E+14vg/kg PAH-032h的单次IV剂量处理。PAH-032h不含肝特异性启动子,并且因此,表达由内源性人启动子元件驱动,这类似于构建体PAH-006m。
在来自
Figure BDA0004038382540000511
小鼠的肝细胞中评估源自以沉默方式改变的hPAH的hPAH mRNA的表达。通过RT-ddPCR测量表达,并且以与GAPDH的比率表达以允许跨人和小鼠肝细胞进行比较。在从
Figure BDA0004038382540000512
小鼠模型分离的人肝细胞中,在施用包装在AAVHSC15衣壳中的PAH-032h后6周,表达源自以沉默方式改变的hPAH的hPAH mRNA(hPAH/GAPDH mRNA比率=0.57±0.11)。小鼠肝细胞中以沉默方式改变的hPAH mRNA的水平显著更低(PAH/GAPDH mRNA比率=0.13±0.08,相对于人p<0.003),并且可以通过在所使用的制剂(大约15-20%的人)中存在污染的人肝细胞来完全解释。通过测量每个样品中人和小鼠GAPDH基因的相对丰度来计算人样品中的小鼠细胞和小鼠样品中的小鼠细胞的比例。
Figure BDA0004038382540000513
小鼠中的单独研究中完成对人特异性靶插入到人PAH基因座的确认,其中在用包装在AAVHSC15衣壳中的PAH-032h的处理的人细胞中实现了中靶插入水平(使用连接ddPCR方法的约6%;图6)和源自以沉默方式改变的hPAH的hPAH mRNA的水平(hPAH/GAPDHmRNA比率=0.45±0.26)。使用NGS测定来表征靶基因插入效率,其中整合的定量基于分别覆盖左同源臂和右同源臂两者的两个单独的测量结果,其中覆盖度延伸到基因组靶向整合位点并且超过每个同源臂的端部,如上文材料和方法中所描述的。使用未经出来的野生型基因组DNA检测此实验的假阳性率。用正交测定(连接ddPCR和NGS)确认hPAH整合到PAH基因座中,报道整合效率为6%。这些结果在图7中示出。
图6和图7示出了从经处理的FRG小鼠分离的肝细胞中的靶向插入频率。图6示出了如通过本文所描述的物种特异性ddPCR编辑测定测量的,将包装在AAVHSC15衣壳中的人靶向PAH-032h校正载体插入到小鼠和人PAH基因座中。使用小鼠特异性PAH基因座探针与同源插入位点的探针之间的阳性对照连接。在图6中,An.1HS是指动物1智人(Homo sapiens)细胞,An.1MM是指动物1小家鼠(Mus musculus)细胞,An.1MM Pos.是指动物1小家鼠阳性对照,An.2HS是指动物2智人细胞,An.2MM是指动物2小家鼠细胞,并且An.2MM Pos.是指动物2小家鼠阳性对照。图7示出了如通过跨越左同源臂和右同源臂的定量NGS测定测量的人肝细胞的编辑。编辑效率通过对野生型特异性序列特异性的编辑的读段计数测量。与PAH-032h载体混合的未经处理的人DNA充当阴性对照。
从这些研究可以得出结论:(1)在将包装在AAVHSC15衣壳中的小鼠构建体PAH-006m施用到PAHenu2小鼠中之后,血液Phe浓度降低到治疗相关性阈值(≤360μM);(2)在包装在AAVHSC15衣壳中的PAHenu2小鼠中的小鼠特异性构建体PAH-006m与
Figure BDA0004038382540000521
小鼠的人肝组织中的人特异性构建体PAH-032h两者之间跨物种观察到相似的mRNA表达水平;(3)在将包装在AAVHSC15衣壳中的人特异性构建体PAH-032h施用到
Figure BDA0004038382540000522
小鼠中之后,在小鼠肝细胞中未观察到显著的靶插入(使用小鼠特异性测定),从而证明人同源臂的序列/物种特异性;以及(4)在PAHenu2小鼠(4-7%)的小鼠特异性构建体PAH-006m与FRG小鼠(约6%)的人特异性构建体PAH-032h之间跨物种实现了每个等位基因的中靶整合的相似水平。
实例3:PAH-006m-LP-1在PAHenu2小鼠中的体内功效
评估PAH-006m-LP-1载体降低小鼠中血液Phe水平的能力,并与hPAH mRNA表达和小鼠PAH基因座处的靶插入相关。具体地,四只PAHenu2小鼠接受了剂量范围覆盖约2-log的包装在AAVHSC15衣壳中的鼠特异性PAH-006m-LP-1载体的单次静脉内施用,其中剂量水平为5E+12、1E+13、1E+14和2E+14vg/kg(分别为GE 5E12、“GE 1E13”、“GE 1E14”和“GE2E14”)。另外,含有表达hPAH但没有同源臂的AAV基因转移构建体的控制臂以1E+13vg/kg的剂量(“GT(+)对照1E13”)施用。还向四只PAHenu2小鼠施用调配物缓冲液作为阴性对照(“FB”)。在实验过程中测量血液Phe浓度。
在2周时间点处死以1E+14vg/kg给药的动物的子集,以测量肝中靶基因插入的水平。每个等位基因检测到5±2%的靶基因插入水平。第41周小鼠的血液Phe浓度在图8A中示出。图8A示出了完整数据集,而图8B示出了直到12周的数据,其中y轴线尺度减小以允许更清楚地看到剂量水平之间的差异。在施用所有剂量水平后一周,血液Phe浓度降低至正常水平,其中1E+14和2E+14剂量导致最低水平。
对以5E12 vg/kg(“5E+12”)、1E13 vg/kg(“1E+13”)和1E14 vg/kg(“1E+14”)给药的动物进行中靶分析,如所指示的(图8C)。如在实例2中所描述的,通过下一代测序测量中靶整合。基于具有整合的序列的数目除以序列的总数目(具有或不具有整合事件)计算整合速率。在图8C中,除“1E+14vg/kg-3周”外,所有数据均在给药后第43周收集,其中数据在给药后第3周收集。如所示出的,在给药后第3周和第43周,在用包装在AAVHSC15衣壳中的1E14vg/kg PAH-006m-LP-1载体给药的动物中检测到了中靶整合。
实例4:非人灵长类动物和人肝细胞中PAH-032h的体外编辑特异性
在PAH基因座处,食蟹猴展示出与PAH-032h的人同源臂序列的94.2%序列同一性。为了确定PAH-032h对人PAH基因座的特异性,评估了PAH-032h编辑原代食蟹猴和原代人肝细胞的混合物中的PAH基因座的能力。用包装在AAVHSC15衣壳中的1.5E+5vg/细胞的PAH-032h载体处理来自单个食蟹猴和单个人供体的总共5E+5肝细胞。使用对人经编辑的等位基因特异性的引物和对非人灵长类动物经编辑的等位基因特异性的引物,通过PCR评估PAH基因座的编辑。这些PCR引物被设计成示出存在或不存在整合,并且不是定量的。因此,在阳性对照DNA中跨稀释的标准曲线确定PCR效率的测量结果。此PCR测定具有经编辑的等位基因(2.618E-5amol)的15个拷贝的检测下限。
观察到有效负载靶向整合到人肝细胞的PAH基因座中。相比之下,未检测到有效负载整合到同源食猴基因座中。这些结果表明,在这些测定中,人同源臂对于人PAH基因座是特异性的。
实例5:基因转移/基因编辑载体与游离型转基因表达载体之间的比较
为了研究整合转基因表达和游离型转基因表达的剂量应答,使用包装在AAVHSC15衣壳中的小鼠特异性基因转移/基因编辑AAV载体、PAH-006m-LP-1和游离型转基因表达AAV载体(含有与PAH-006m-LP-1相同的转录调节元件,但缺乏同源臂)进行头对头比较。两个载体的有效载荷之间的唯一差异是PAH-006m-LP-1的PAH编码序列中存在两个沉默核苷酸变化。将五只雄性4周龄PAHenu2小鼠静脉内施用1E12 vg/kg(“1E+12”)、5E12 vg/kg(“5E+12”)、1E13 vg/kg(“1E+13”)、5E13 vg/kg(“5E+13”)或1E14 vg/kg(“1E+14”)剂量的小鼠特异性基因转移/基因编辑载体或游离型转基因表达载体,在每种情况下均包装在AAVHSC15或调配物缓冲液对照(FB)中。对于包装在AAVHSC15中的游离型转基因表达载体,在正式滴定程序之后,将所用批次的滴度相应地调整为7.8E11 vg/kg(“7.8E+11”)、3.9E12vg/kg(“3.9E+12vg/kg”)、7.8E12 vg/kg(“7.8E+12”)、3.9E13 vg/kg(“3.9E+13”)和7.8E13 vg/kg(“7.8E+13”)。发现用PAH-006m-LP-1给药的小鼠中的靶向整合是可检测且稳定的。还发现表型校正与整合水平之间的剂量应答。
图9A和9B示出了如上文所描述的给药的小鼠中的血清Phe水平的12周时间过程。如所示出的,在接收包装在AAVHSC15衣壳中的游离型转基因表达载体的小鼠中观察到血清Phe中的降低(图9A)或包装在AAVHSC15衣壳中的基因转移/基因编辑载体(图9B)。在接收包装在AAVHSC15衣壳中的游离型转基因表达载体的小鼠中也观察到血液Tyr浓度,Phe的下游代谢物的对应增加(图9C)或包装在AAVHSC15衣壳中的基因转移/基因编辑载体(图9D)。
图9E和9F示出了用游离型转基因表达载体(图9E)或PAH-006m-LP1(图9F)给药的PAHenu2小鼠中的载体基因组水平,在每种情况下均以指定剂量包装在AAVHSC15衣壳中。使用定量PCR使用编码序列特异性引物和相对于输入基因组DNA靶标的探针测量每ug DNA的载体基因组。对于PAH-006m-LP-1和游离型转基因表达载体两者,观察到载体基因组拷贝数和mRNA两者中的剂量应答。PAH-006m-LP-1的载体拷贝数(图9F)跨所有剂量均高于游离型转基因表达载体(图9E)。观察到转基因与整合载体之间的VG/ug差异,并且可以反映自互补载体与单链载体之间的稳定性差异。
图9G和9H示出了用游离型转基因表达载体(图9G)或PAH-006m-LP1(图9H)给药的PAHenu2小鼠中的PAH转基因mRNA表达水平,在每种情况下均以指定剂量包装在AAVHSC15衣壳中。使用相对于总RNA的编码序列特异性引物和探针,通过定量RT-PCR测量mRNA水平。如所示出的,与接受包装在AAVHSC15衣壳中的游离型转基因表达载体的小鼠相比,发现mRNA表达具有剂量响应性,并且发现在接收包装在AAVHSC15衣壳中的PAH-006m-LP-1的小鼠中表达水平略高。
为了评估PAHenu2小鼠中靶基因座整合的数量和保真度,执行了两种方法以检测整合事件:ddPCR和下一代测序。
使用如实例2中所描述的ddPCR连接测定测量在PAH基因座处的中靶整合水平。图9I示出了对于所指示的不同剂量的PAH-006m-LP1和游离型转基因表达载体对照,在施用后第12周时的中靶整合量(在病毒基因组中通过ddPCR检测的每个PAH等位基因中测量)。如所示出的,在接受包装在AAVHSC15衣壳中的PAH-006m-LP1的小鼠中观察到通过ddPCR检测到的靶向整合的剂量应答(图9I;第2组、第3组、第4组、第5组和第6组)。相比之下,在接收包装在AAVHSC15衣壳中的游离型转基因表达载体的小鼠中,通过ddPCR未检测到靶向整合(图9I;第11组)。
图9J示出了用包装在AAVHSC15中的指定剂量的PAH-006m-LP1给药后第12周检测到的中靶载体插入的频率(使用实例2中所描述的NGS方法)。如所示出的,在接受包装在AAVHSC15衣壳中的PAH-006m-LP1的小鼠中观察到通过NGS检测到的靶向整合的剂量反应。相比之下,在接受包装在AAVHSC15衣壳中的游离型转基因表达载体的小鼠中,通过NGS未检测到靶向整合。发现在大于5E13 vg/kg的剂量下,整合水平具有剂量响应性并且高于2%。
为了评估在增殖细胞群体中的整合转基因表达和游离型转基因表达的效果,将10周龄的PAHenu2小鼠静脉内施用5E12 vg/kg、2E13 vg/kg、6E13vg/kg或1E15 vg/kg剂量的小鼠特异性基因转移/基因编辑载体或游离型转基因表达载体,在每种情况下均包装在AAVHSC15或调配物缓冲液对照(FB)中。对于包装在AAVHSC15中的游离型转基因表达载体,在正式滴定程序之后,将所使用批次的滴度相应地调整为3.92E12 vg/kg(“3.92E+12”)、1.57E13 vg/kg(“1.57E+13vg/kg”)、4.71E13 vg/kg(“4.71E+13”)和7.84E13vg/kg(“7.84E+13”)。给药后约2周,小鼠经受了70%部分肝切除术(PHx)以诱导快速肝细胞循环,或进行假手术(假手术)。图9K和9L示出了这些小鼠中血清Phe水平在直到第42周(图9K)或第40周(图9L)的时间过程。如所示出的,在用游离型转基因表达载体处理的小鼠中(图9K),血清Phe水平在第1周和第2周时降低。在2周时间点的肝切除术后,5E12 vg/kg和2E13 vg/kg剂量水平下的Phe水平在加速肝再生期间增加。用2E13 vg/kg游离型转基因表达载体处理的假手术动物未示出此应答的丧失,从而表明经游离型转基因表达载体处理的肝切除小鼠中的血清Phe水平的增加可能是由于在肝切除术后发生的肝加速生长条件下的载体稀释。用基因转移/基因编辑载体处理的小鼠(图9L)示出在部分肝切除的小鼠中在整个肝生长加速期间,Phe水平稳定降低。此结果可以指示在靶小鼠Pah基因座处的整合的益处。
实例6:小鼠特异性载体与人特异性载体之间的比较
为了研究小鼠特异性基因转移/基因编辑AAV载体(PAH-006m-LP-1;“小鼠设计”)与人特异性基因转移/基因编辑AAV载体(hPAH-hI1C-032-LP1-SD3;“人设计”)之间的剂量范围差异,在头对头研究中使用上述载体。将四至五只雄性,4周龄(图10A-10H)或10周龄(图10I-10P)PAHenu2小鼠静脉内施用小鼠设计载体(图10A、10C、10E、10G、10I、10K、10M和10O)或人设计载体(图10B、10D、10F、10H、10J、10L、10N和10P)的1E12 vg/kg、5E12 vg/kg、1E13 vg/kg或5E13 vg/kg,在每种情况下均包装在AAVHSC15或调配物缓冲液对照(FB)中。
人设计载体包括人同源臂序列,并且由于序列差异,预期不会通过同源重组整合到小鼠基因组中,因此人设计载体充当这些实验中的仅游离型对照。如所示出的,用包装在AAVHSC15衣壳中的人设计载体给药的4周龄小鼠(图10B)表现出血清Phe减少的改善,类似于施用小鼠设计载体的小鼠(图10A)。在用包装在AAVHSC15衣壳中的人设计载体给药的4周龄小鼠(图10D)和用小鼠设计载体给药的小鼠(图10C)中也观察到血液Tyr浓度的对应增加。如在图10E和10F中所示出的,对于用包装在AAVHSC15衣壳中的人设计载体(图10F)或小鼠设计载体(图10E)给药的4周龄小鼠的肝中检测到的载体基因组水平观察到剂量应答。对于用包装在AAVHSC15衣壳中的人设计载体(图10H)或小鼠设计载体(图10G)给药的4周龄小鼠的肝中检测到的mRNA水平也观察到剂量应答。
在10周龄时,用包装在AAVHSC15衣壳中的人设计载体给药的小鼠(图10I)发现与用小鼠设计载体给药的小鼠相比(图10H),血清Phe水平具有相似的降低。在用包装在AAVHSC15衣壳中的人设计载体给药的10周龄小鼠(图10K)和用小鼠设计载体给药的小鼠(图10J)中也观察到血液Tyr浓度的对应增加。如在图10M和10N中所示出的,对于在用包装在AAVHSC15衣壳中的人设计载体(图10N)或小鼠设计载体(图10M)给药的10周龄小鼠的肝中检测到的载体基因组水平观察到剂量应答。对于用包装在AAVHSC15衣壳中的人设计载体(图10P)或小鼠设计载体(图10O)给药的10周龄小鼠的肝中检测到的mRNA水平也观察到剂量应答。
实例7:单剂量小鼠特异性载体或人特异性载体的效应
为了评估PAHenu2小鼠的年龄对单剂量小鼠特异性基因转移/基因编辑AAV载体(PAH-006m-LP-1;“小鼠设计”)或人特异性基因转移/基因编辑AAV载体(hPAH-hI1C-032-LP1-SD3;“人设计”)的响应的作用,选择在2周龄、4周龄和10周龄的小鼠。这允许比较儿童肝生长(2周龄和4周龄小鼠)与成年(10周龄小鼠)的肝的作用。在2周龄、4周龄或10周龄时,将包装在AAVHSC15中的小鼠设计载体或包装在AAVHSC15中的人设计载体的单一1E14 vg/kg剂量静脉内施用于PAHenu2小鼠。在每个年龄组中,总共向四至五只雄性小鼠施用相应的经包装的载体。将调配物缓冲液作为对照施用。由于人设计载体不整合到小鼠Pah基因座中,因此其提供了对照以证明游离型表达对不同年龄的小鼠的作用。在此实例中,在正式滴定程序之后,将所使用批次的滴度相应地调整为小鼠设计为9.07E13 vg/kg,并且人设计为1.06E14 vg/kg。所研究的各种给药队列如在表2中所示。
表2:给药队列
Figure BDA0004038382540000571
如表2所示,在施用后第43周处死第1-4组,并在施用后第42周处死第8-11组和第15组。对于第1-4组、第8-11组和第15组,随着时间的推移检查血清Phe和Tyr水平(图11A-11D)。图11E-11K示出了在表2中所指示的尸检时间点处在小鼠的肝中检测到的载体基因组水平和mRNA水平。未测量第5-7组小鼠的肝中的mRNA水平。
在用小鼠设计载体处理的小鼠中,血清Phe水平在载体施用后的一周内降低至正常水平(图11A)。对于经处理的4周龄和10周龄小鼠(第3组和第4组),Phe水平的降低维持直到第43周,从而证明了对处理应答的长期持久性。对于2周龄小鼠,结果是可变的。在4周龄和10周龄小鼠中观察到血清Tyr浓度的相应增加直到第43周(图11C)。图11E示出了在用小鼠设计载体处理的2周龄、4周龄和10周龄小鼠的肝中检测到的载体基因组水平。图11I示出了在用小鼠设计载体处理的2周龄、4周龄和10周龄小鼠的肝中检测到的mRNA水平。
在用人设计载体处理的小鼠中,血清Phe水平在施用载体后一周时间点降低(图11B)。对于经处理的4周龄和10周龄小鼠(第10组和第11组),Phe水平的降低维持直到第43周,从而表明对处理的应答的长期持久性。在经处理的2周龄小鼠(第9组)中,Phe水平维持在≤360μM的临床相关水平直到第30周。在第9组(直到第30周)、第10组(直到第42周)和第11组(直到第42周)中观察到血清Tyr浓度的对应增加(图11D)。这些数据表明,包装在AAVHSC15中的人设计载体的1E14 vg/kg剂量足以在幼年小鼠的肝生长期间提供持续的功效,并且所述效应在施用后维持至少30周。图11F示出了在用人设计载体处理的2周龄、4周龄和10周龄小鼠的肝中检测到的载体基因组水平。图11J示出了在用人设计载体处理的2周龄、4周龄和10周龄小鼠的肝中检测到的mRNA水平。
图11G和11H示出了在用小鼠设计载体处理的2周龄小鼠(图11G;第5-7组)和用人设计载体处理的2周龄小鼠(图11H;第12-14组)中,载体基因组水平在施用后维持至多8周。图11K示出了用人设计载体处理的2周龄小鼠的mRNA水平在施用后维持至多8周。
实例8:成年PAHenu2小鼠整合的动力学和持久性
为了确定随时间推移的载体整合的动力学和持久性,以1E14 vg/kg的剂量向10周龄雄性PAHenu2小鼠施用包装在AAVHSC15衣壳中的小鼠特异性基因转移/基因编辑AAV载体(PAH-006m-LP-1)。在给药后第1周、第2周、第4周、第8周和第16周处死六个队列(每个队列五只小鼠)。通过在不同时间点监测血清Phe水平随时间的变化、载体基因组水平随时间的变化、PAH转基因mRNA表达水平随时间的变化以及靶向整合水平随时间的变化来研究整合的动力学。发现载体基因组水平、PAH转基因mRNA表达水平和整合频率对着时间的推移是稳定的(图12A-12C)。
图12A和12B示出了以1E14 vg/kg的剂量施用包装在AAVHSC15衣壳中的PAH-006m-LP-1的PAHenu2小鼠中载体基因组水平(图12A)和PAH转基因mRNA表达水平(图12B)的时间进程。发现载体基因组和mRNA水平随着时间的推移能够稳定至多42周。使用定量PCR使用编码序列特异性引物和相对于输入基因组DNA靶标的探针测量载体基因组水平。使用编码序列特异性引物和相对于总RNA的探针,通过定量RT-PCR进行表达的测量。
开发了长读段下一代测序(NGS)方法以定量整合等位基因相对于未整合等位基因。由于同源臂的长度需要读通整合序列并进入到基因组DNA中,因此选择长读段测序。所述方法能够区分给定样品中存在的整合等位基因、野生型等位基因和载体基因组。使用对i)基因组区特异性的三个引物;ii)对整合的等位基因特异性的区;以及iii)对野生型等位基因特异性的区进行PCR。通过使用源自经处理的动物的肝的DNA在PAH区处竞争性地扩增野生型等位基因和整合等位基因来确定中靶载体整合的频率。扩增产物的长读段测序覆盖同源臂,其跨基因组序列、整合序列和载体基因组序列是相同的。也被长读段测序覆盖的邻接序列确定读段的来源是否来自野生型基因组、整合基因组还是载体基因组。将包含基因组DNA和以沉默方式改变的hPAH转基因两者的邻接序列计算为整合等位基因,而将仅包含基因组DNA不包含靶整合位点中的以沉默方式改变的hPAH转基因的序列计算为野生型等位基因。将整合序列的百分比计算为映射到整合参考的读段数除以映射到整合参考的读段、映射到野生型参考的读段以及映射到载体基因组多联体的读段的总数。图12C示出了以1E14 vg/kg的剂量施用包装在AAVHSC15衣壳中的PAH-006m-LP-1的PAHenu2小鼠中的靶向整合频率的时间过程。在给药后一周检测到中靶整合,在约2周时达到峰值水平,并且直到第42周保持一致。
图12D和12E是示出在注射后至多42周,以1E14 vg/kg的剂量施用包装在AAVHSC15衣壳中的PAH-006m-LP-1的PAHenu2小鼠中对血清Phe(图12D)和Tyr(图12E)的影响的图。
实例9:hPAH-hI1C-032-LP1-SD3的体内功效
为了确定随着时间的推移人特异性基因转移/基因编辑载体的整合的动力学和持久性,以7E13 vg/kg(第1组和第3组)或2E14 vg/kg(第2组和第4组)的剂量向雄性人源化肝FRG小鼠(“HuLiv”小鼠;参见实例2)施用包装在AAVHSC15衣壳中的人特异性转基因/基因编辑载体hPAH-hI1C-032-LP1-SD3,并在给药后第4周(第1组和第2组)或第12周(第3组和第4组)处死(每个队列六只雄性小鼠)。向对照FRG小鼠施用调配物缓冲液,并在施用后第4周(第5组)或第12周(第6组)处死。
图13A和13B示出了在以所指示的剂量施用包装在AAVHSC15中的hPAH-hI1C-032-LP1-SD3后第4周和第12周,在从HuLiv小鼠分离的人肝细胞中检测到的载体基因组水平和mRNA水平。如所示出的,发现人肝细胞中的载体基因组(图13A)和mRNA表达(图13B)的水平在至多12周的时间内是剂量响应性的并且是稳定的。使用定量PCR使用编码序列特异性引物和相对于输入基因组DNA靶标的探针测量载体基因组水平。使用编码序列特异性引物和相对于总RNA的探针,通过定量RT-PCR进行表达的测量。图13C示出了在以所指示的剂量施用包装在AAVHSC15中的hPAH-hI1C-032-LP1-SD3后第4周和第12周,在从HuLiv小鼠分离的人肝细胞中检测到的中靶整合的频率。如所示出的,发现人肝细胞中的中靶整合水平是剂量响应性的,并且随着时间的推移稳定至多12周。使用实例8中所描述的长读段NGS方法进行靶向整合的测量。
鉴于同源重组可以由载体的同源臂与基因组中的脱靶位置之间的序列相似性的短延伸驱动,开发基于PCR的测定以特异性地测试整合到含有与同源臂相似的序列的基因组区中。所述方法以生物信息学方式预测了在用含有对人PAH基因座特异性的同源臂的载体转导的人细胞中最有可能经历脱靶同源重组的区。基于与同源臂的最高序列相似性选择这些预测区。基于PCR的方法被设计成特异性地测试转导的样品在预测区中的任何脱靶整合的发生。使用此基于PCR的方法,能够检测到1:10000个DNA分子水平的整合。
预测的脱靶整合位点是基于两个标准选择的:最小序列长度为35bp;以及相对于同源臂的最小序列同一性为60%。通过针对基因组参考联盟人类构建38的生物信息比对,鉴定出符合这些标准的基因组的六个区。设计允许在这6个区中的5个区处的特异性扩增以进行脱靶整合的PCR引物。发现区3处于高度重复区中,并且由于无法产生特异性引物,因此不再进一步分析。作为阳性对照(“Pos”),对于每个特异性区,将掺入到基因组DNA中的特异性对照DNA运行至1:10,000的稀释度,从而表示基于PCR的方法的0.01%和检测限。对于每个预测区,独立地测试在任一方向(从同源性区向内(“In”)或向外(“Out”))靶向同源重组的整合特异性引物对,以查询脱靶整合。如果在样品中鉴定出正确大小的不同PCR条带,则将脱靶整合定义为阳性。
图14A-14D示出了通过上文所描述的基于PCR的方法确定的对分离自10周龄雄性人源化肝FRG小鼠的基因组DNA样品进行的预测脱靶整合的结果,所述小鼠以7E13 vg/kg(图14A和14C)或2E14 vg/kg(图14B和14D)的剂量施用了包装在AAVHSC15衣壳中的人特异性基因转移/基因编辑载体hPAH-hI1C-032-LP1-SD3,并在给药后第4周(图14A和14B)或第12周(图14C和14D)处死(每个队列六只雄性小鼠)。如图所示,在预测的脱靶整合位点处未检测到整合。
***
本发明不应限于本文所描述的具体实施例的范围。实际上,根据前文的描述和附图,除了所描述的修改之外,本发明的各种修改对于所属领域技术的人员来说也将变得显而易见。此类修改旨在落入所附权利要求的范围内。
本文所引用的全部参考文献(例如,出版物或专利或专利申请)均通过引用并且出于所有目的整体并入本文,其程度如同每个单独的参考文献(例如,出版物或专利或专利申请)出于所有目的被具体地或单独地指示通过引用整体并入一样。其它实施例处于以下权利要求内。
序列表
<110> 同源药物公司(HOMOLOGY MEDICINES, INC.)
<120> 用于恢复PAH基因功能的腺相关病毒组合物和其使用方法
<130> 404217-HMW-040WO (183161)
<150> US 63/030,341
<151> 2020-05-27
<150> US 63/117,252
<151> 2020-11-23
<160> 86
<170> PatentIn 3.5版
<210> 1
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 腺相关病毒9
<400> 1
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 2
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> AAV分离株
<400> 2
Met Thr Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Gln Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 3
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> AAV分离株
<400> 3
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Gly Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Gly Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 4
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> AAV分离株
<400> 4
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Ile Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Tyr Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 5
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> AAV分离株
<400> 5
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Asp
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 6
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> AAV分离株
<400> 6
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Leu Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Ser Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 7
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> AAV分离株
<400> 7
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Arg Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 8
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> AAV分离株
<400> 8
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Val Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 9
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> AAV分离株
<400> 9
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Arg Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 10
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> AAV分离株
<400> 10
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Cys Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 11
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> AAV分离株
<400> 11
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Arg Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Lys Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 12
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> AAV分离株
<400> 12
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro His Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Asn
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Met Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 13
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> AAV分离株
<400> 13
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 14
<211> 145
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 14
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcct 145
<210> 15
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> AAV分离株
<400> 15
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Arg Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 16
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> AAV分离株
<400> 16
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Ala Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 17
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> AAV分离株
<400> 17
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Ile Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Cys Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 18
<211> 145
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 18
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgcag agagggagtg gccaa 145
<210> 19
<211> 106
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 19
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtgg 106
<210> 20
<211> 167
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 20
ctctcccccc tgtcgcgttc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60
agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120
cgcgacaggg gggagagtgc cacactctca agcaaggggg ttttgta 167
<210> 21
<211> 167
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 21
tacaaaacct ccttgcttga gagtgtggca ctctcccccc tgtcgcgttc gctcgctcgc 60
tggctcgttt gggggggtgg cagctcaaag agctgccaga cgacggccct ctggccgtcg 120
cccccccaaa cgagccagcg agcgagcgaa cgcgacaggg gggagag 167
<210> 22
<211> 621
<212> PRT
<213> 人工序列
<220>
<223> AAV2 Rep
<400> 22
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
165 170 175
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
275 280 285
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
305 310 315 320
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
465 470 475 480
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
485 490 495
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
500 505 510
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
515 520 525
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
530 535 540
Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys
545 550 555 560
Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu
565 570 575
Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr
580 585 590
Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp
595 600 605
Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
610 615 620
<210> 23
<211> 960
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 23
gcttcaggag cagttgtgcg aatagctgga gaacaccagg ctggatttaa acccagatcg 60
ctcttacatt tgctctttac ctgctgtgct cagcgttcac gtgccctcta gctgtagttt 120
tctgaagtca gcgcacagca aggcagtgtg cttagaggtt aacagaaggg aaaacaacaa 180
caacaaaaat ctaaatgaga atcctgactg tttcagctgg gggtaagggg ggcggattat 240
tcatataatt gttataccag acggtcgcag gcttagtcca attgcagaga actcgcttcc 300
caggcttctg agagtcccgg aagtgcctaa acctgtctaa tcgacggggc ttgggtggcc 360
cgtcgctccc tggcttcttc cctttaccca gggcgggcag cgaagtggtg cctcctgcgt 420
cccccacacc ctccctcagc ccctcccctc cggcccgtcc tgggcaggtg acctggagca 480
tccggcaggc tgccctggcc tcctgcgtca ggacaacgcc cacgaggggc gttactgtgc 540
ggagatgcac cacgcaagag acaccctttg taactctctt ctcctcccta gtgcgaggtt 600
aaaaccttca gccccacgtg ctgtttgcaa acctgcctgt acctgaggcc ctaaaaagcc 660
agagacctca ctcccgggga gccagcatgt ccactgcggt cctggaaaac ccaggcttgg 720
gcaggaaact ctctgacttt ggacaggtga gccacggcag cctgagctgc tcagttaggg 780
gaatttgggc ctccagagaa agagatctga agactgctgg tgcttcctgg tttcataagc 840
tcagtaagaa gtctgaattc gttggaagct gatgagaata tccaggaagt caacagacaa 900
atgtcctcaa caattgtttc taagtaggag aacatctgtc ctcggtggct ttcacaggaa 960
<210> 24
<211> 910
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 24
ctgggatggg atgtggaatc cttctagatt tcttttgtaa tatttataaa gtgctctcag 60
caaggtatca aaatggcaaa attgtgagta actatcctcc tttcattttg ggaagaagat 120
gaggcatgaa gagaattcag acagaaactt actcagacca ggggaggcag aaactaagca 180
gagaggaaaa tgaccaagag ttagccctgg gcatggaatg tgaaagaacc ctaaacgtga 240
cttggaaata atgcccaagg tatattccat tctccgggat ttgttggcat tttcttgagg 300
tgaagaattg cagaatacat tctttaatgt gacctacata tttacccatg ggaggaagtc 360
tgctcctgga ctcttgagat tcagtcataa agcccaggcc agggaaataa tgtaagtctg 420
caggcccctg tcatcagtag gattagggag aagagttctc agtagaaaac agggaggctg 480
gagagaaaag aatggttaat gttaacgtta atataactag aaagactgca gaacttagga 540
ctgattttta tttgaatcct taaaaaaaaa atttcttatg aaaatagtac atggctctta 600
ggagacagaa cttattgtac agaggaacag cgtgagagtc agagtgatcc cagaacaggt 660
cctggctcca tcctgcacat agttttggtg ctgctggcaa tacggtcccc acaactgtgg 720
gaaggggtta ggggcaggga tctcatcagg aaagcatagg ggtttaaagt tctttataga 780
gcacttagaa gattgagaat ccacaaatta tattaataac aaacaaagta gtgtcgtgtt 840
atatagtaaa tgtgaatttg cagacacatt tagggaaaag ttataattaa aaaaataggc 900
tgtatatata 910
<210> 25
<211> 192
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 25
ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60
tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc 120
cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt 180
agtgtgagag gg 192
<210> 26
<211> 255
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 26
aatgactcct ttcggtaagt gcagtggaag ctgtacactg cccaggcaaa gcgtccgggc 60
agcgtaggcg ggcgactcag atcccagcca gtggacttag cccctgtttg ctcctccgat 120
aactggggtg accttggtta atattcacca gcagcctccc ccgttgcccc tctggatcca 180
ctgcttaaat acggacgagg acagggccct gtctcctcag cttcaggcac caccactgac 240
ctgggacagt gaatc 255
<210> 27
<211> 448
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 27
ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60
tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc 120
cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt 180
agtgtgagag gggaatgact cctttcggta agtgcagtgg aagctgtaca ctgcccaggc 240
aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact tagcccctgt 300
ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct cccccgttgc 360
ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct cagcttcagg 420
caccaccact gacctgggac agtgaatc 448
<210> 28
<211> 1356
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 28
atgtccaccg ctgtgctgga gaaccctggg ctggggagga aactgtcaga cttcgggcag 60
gagacttcat acattgagga taactgtaac cagaatggcg ccatctctct gatcttcagc 120
ctgaaggagg aagtgggcgc cctggcaaag gtgctgcgcc tgtttgagga gaacgacgtg 180
aatctgaccc acatcgagtc ccggccttct agactgaaga aggacgagta cgagttcttt 240
acccacctgg ataagcggtc cctgccagcc ctgacaaaca tcatcaagat cctgaggcac 300
gacatcggag caaccgtgca cgagctgtct cgggacaaga agaaggatac cgtgccctgg 360
ttccctcgga caatccagga gctggataga tttgccaacc agatcctgtc ttacggagca 420
gagctggacg cagatcaccc tggcttcaag gacccagtgt atcgggcccg gagaaagcag 480
tttgccgata tcgcctacaa ttataggcac ggacagccaa tccctcgcgt ggagtatatg 540
gaggaggaga agaagacctg gggcacagtg ttcaagaccc tgaagagcct gtacaagaca 600
cacgcctgct acgagtataa ccacatcttc cccctgctgg agaagtattg tggctttcac 660
gaggacaata tccctcagct ggaggacgtg agccagttcc tgcagacctg cacaggcttt 720
aggctgaggc cagtggcagg actgctgagc tcccgggact tcctgggagg actggccttc 780
agagtgtttc actgcaccca gtacatcagg cacggctcca agccaatgta tacaccagag 840
cccgacatct gtcacgagct gctgggccac gtgcccctgt ttagcgatag atccttcgcc 900
cagttttccc aggagatcgg actggcatct ctgggagcac ctgacgagta catcgagaag 960
ctggccacca tctattggtt cacagtggag tttggcctgt gcaagcaggg cgatagcatc 1020
aaggcctacg gagcaggact gctgtctagc ttcggcgagc tgcagtattg tctgtccgag 1080
aagccaaagc tgctgcccct ggagctggag aagaccgcca tccagaacta caccgtgaca 1140
gagttccagc ccctgtacta tgtggccgag tcttttaacg atgccaagga gaaggtgaga 1200
aatttcgccg ccacaatccc taggcccttc agtgtgcgtt acgaccctta tacccagagg 1260
atcgaggtgc tggataatac acagcagctg aagatcctgg ctgactcaat caatagcgaa 1320
atcggaatcc tgtgctccgc cctgcagaaa atcaaa 1356
<210> 29
<211> 93
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 29
ctctaaggta aatataaaat ttttaagtgt ataatgtgtt aaactactga ttctaattgt 60
ttctctcttt tagattccaa cctttggaac tga 93
<210> 30
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 30
ctgacctctt ctcttcctcc cacagg 26
<210> 31
<211> 198
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 31
gatccagaca tgataagata cattgatgag tttggacaaa ccacaactag aatgcagtga 60
aaaaaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac cattataagc 120
tgcaataaac aagttaacaa caacaattgc attcatttta tgtttcaggt tcagggggag 180
gtgtgggagg ttttttaa 198
<210> 32
<211> 143
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 32
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgcag agagggagtg gcc 143
<210> 33
<211> 452
<212> PRT
<213> 智人(Homo sapiens)
<400> 33
Met Ser Thr Ala Val Leu Glu Asn Pro Gly Leu Gly Arg Lys Leu Ser
1 5 10 15
Asp Phe Gly Gln Glu Thr Ser Tyr Ile Glu Asp Asn Cys Asn Gln Asn
20 25 30
Gly Ala Ile Ser Leu Ile Phe Ser Leu Lys Glu Glu Val Gly Ala Leu
35 40 45
Ala Lys Val Leu Arg Leu Phe Glu Glu Asn Asp Val Asn Leu Thr His
50 55 60
Ile Glu Ser Arg Pro Ser Arg Leu Lys Lys Asp Glu Tyr Glu Phe Phe
65 70 75 80
Thr His Leu Asp Lys Arg Ser Leu Pro Ala Leu Thr Asn Ile Ile Lys
85 90 95
Ile Leu Arg His Asp Ile Gly Ala Thr Val His Glu Leu Ser Arg Asp
100 105 110
Lys Lys Lys Asp Thr Val Pro Trp Phe Pro Arg Thr Ile Gln Glu Leu
115 120 125
Asp Arg Phe Ala Asn Gln Ile Leu Ser Tyr Gly Ala Glu Leu Asp Ala
130 135 140
Asp His Pro Gly Phe Lys Asp Pro Val Tyr Arg Ala Arg Arg Lys Gln
145 150 155 160
Phe Ala Asp Ile Ala Tyr Asn Tyr Arg His Gly Gln Pro Ile Pro Arg
165 170 175
Val Glu Tyr Met Glu Glu Glu Lys Lys Thr Trp Gly Thr Val Phe Lys
180 185 190
Thr Leu Lys Ser Leu Tyr Lys Thr His Ala Cys Tyr Glu Tyr Asn His
195 200 205
Ile Phe Pro Leu Leu Glu Lys Tyr Cys Gly Phe His Glu Asp Asn Ile
210 215 220
Pro Gln Leu Glu Asp Val Ser Gln Phe Leu Gln Thr Cys Thr Gly Phe
225 230 235 240
Arg Leu Arg Pro Val Ala Gly Leu Leu Ser Ser Arg Asp Phe Leu Gly
245 250 255
Gly Leu Ala Phe Arg Val Phe His Cys Thr Gln Tyr Ile Arg His Gly
260 265 270
Ser Lys Pro Met Tyr Thr Pro Glu Pro Asp Ile Cys His Glu Leu Leu
275 280 285
Gly His Val Pro Leu Phe Ser Asp Arg Ser Phe Ala Gln Phe Ser Gln
290 295 300
Glu Ile Gly Leu Ala Ser Leu Gly Ala Pro Asp Glu Tyr Ile Glu Lys
305 310 315 320
Leu Ala Thr Ile Tyr Trp Phe Thr Val Glu Phe Gly Leu Cys Lys Gln
325 330 335
Gly Asp Ser Ile Lys Ala Tyr Gly Ala Gly Leu Leu Ser Ser Phe Gly
340 345 350
Glu Leu Gln Tyr Cys Leu Ser Glu Lys Pro Lys Leu Leu Pro Leu Glu
355 360 365
Leu Glu Lys Thr Ala Ile Gln Asn Tyr Thr Val Thr Glu Phe Gln Pro
370 375 380
Leu Tyr Tyr Val Ala Glu Ser Phe Asn Asp Ala Lys Glu Lys Val Arg
385 390 395 400
Asn Phe Ala Ala Thr Ile Pro Arg Pro Phe Ser Val Arg Tyr Asp Pro
405 410 415
Tyr Thr Gln Arg Ile Glu Val Leu Asp Asn Thr Gln Gln Leu Lys Ile
420 425 430
Leu Ala Asp Ser Ile Asn Ser Glu Ile Gly Ile Leu Cys Ser Ala Leu
435 440 445
Gln Lys Ile Lys
450
<210> 34
<211> 122
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 34
aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca 60
aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct 120
ta 122
<210> 35
<211> 133
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 35
tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat aagctgcaat 60
aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg 120
gaggtttttt aaa 133
<210> 36
<211> 1676
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 36
ggcattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60
catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120
acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180
ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240
aagtgtatca tatgccaagt ccgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300
ggcattatgc ccagtacatg accttacggg actttcctac ttggcagtac atctacgtat 360
tagtcatcgc tattaccatg gtcgaggtga gccccacgtt ctgcttcact ctccccatct 420
cccccccctc cccaccccca attttgtatt tatttatttt ttaattattt tgtgcagcga 480
tgggggcggg gggggggggg gggcgcgcgc caggcggggc ggggcggggc gaggggcggg 540
gcggggcgag gcggagaggt gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc 600
cttttatggc gaggcggcgg cggcggcggc cctataaaaa gcgaagcgcg cggcgggcgg 660
gagtcgctgc gcgctgcctt cgccccgtgc cccgctccgc cgccgcctcg cgccgcccgc 720
cccggctctg actgaccgcg ttactcccac aggtgagcgg gcgggacggc ccttctcctc 780
cgggctgtaa ttagcgcttg gtttaatgac ggcttgtttc ttttctgtgg ctgcgtgaaa 840
gccttgaggg gctccgggag ggccctttgt gcggggggag cggctcgggg ggtgcgtgcg 900
tgtgtgtgtg cgtggggagc gccgcgtgcg gctccgcgct gcccggcggc tgtgagcgct 960
gcgggcgcgg cgcggggctt tgtgcgctcc gcagtgtgcg cgaggggagc gcggccgggg 1020
gcggtgcccc gcggtgcggg gggggctgcg aggggaacaa aggctgcgtg cggggtgtgt 1080
gcgtgggggg gtgagcaggg ggtgtgggcg cgtcggtcgg gctgcaaccc cccctgcacc 1140
cccctccccg agttgctgag cacggcccgg cttcgggtgc ggggctccgt acggggcgtg 1200
gcgcggggct cgccgtgccg ggcggggggt ggcggcaggt gggggtgccg ggcggggcgg 1260
ggccgcctcg ggccggggag ggctcggggg aggggcgcgg cggcccccgg agcgccggcg 1320
gctgtcgagg cgcggcgagc cgcagccatt gccttttatg gtaatcgtgc gagagggcgc 1380
agggacttcc tttgtcccaa atctgtgcgg agccgaaatc tgggaggcgc cgccgcaccc 1440
cctctagcgg gcgcggggcg aagcggtgcg gcgccggcag gaaggaaatg ggcggggagg 1500
gccttcgtgc gtcgccgcgc cgccgtcccc ttctccctct ccagcctcgg ggctgtccgc 1560
ggggggacgg ctgccttcgg gggggacggg gcagggcggg gttcggcttc tggcgtgtga 1620
ccggcggctc tagagcctct gctaaccatg ttcatgcctt cttctttttc ctacag 1676
<210> 37
<211> 960
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 37
gcttcaggag cagttgtgcg aatagctgga gaacaccagg ctggatttaa acccagatcg 60
ctcttacatt tgctctttac ctgctgtgct cagcgttcac gtgccctcta gctgtagttt 120
tctgaagtca gcgcacagca aggcagtgtg cttagaggtt aacagaaggg aaaacaacaa 180
caacaaaaat ctaaatgaga atcctgactg tttcagctgg gggtaagggg ggcggattat 240
tcatataatt gttataccag acggtcgcag gcttagtcca attgcagaga actcgcttcc 300
caggcttctg agagtcccgg aagtgcctaa acctgtctaa tcgacggggc ttgggtggcc 360
cgtcgctccc tggcttcttc cctttaccca gggcgggcag cgaagtggtg cctcctgcgt 420
cccccacacc ctccctcagc ccctcccctc cggcccgtcc tgggcaggtg acctggagca 480
tccggcaggc tgccctggcc tcctgcgtca ggacaacgcc cacgaggggc gttactgtgc 540
ggagatgcac cacgcaagag acaccctttg taactctctt ctcctcccta gtgcgaggtt 600
aaaaccttca gccccacgtg ctgtttgcaa acctgcctgt acctgaggcc ctaaaaagcc 660
agagacctca ctcccgggga gccagcatgt ccactgcggt cctggaaaac ccaggcttgg 720
gcaggaaact ctctgacttt ggacaggtga gccacggcag cctgagctgc tcagttaggg 780
gaatttgggc ctccagagaa agagatccga agactgctgg tgcttcctgg tttcataagc 840
tcagtaagaa gtctgaattc gttggaagct gatgagaata tccaggaagt caacagacaa 900
atgtcctcaa caattgtttc taagtaggag aacatctgtc ctcggtggct ttcacaggaa 960
<210> 38
<211> 911
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 38
ctgggatggg atgtggaatc cttctagatt tcttttgtaa tatttataaa gtgctctcag 60
caaggtatca aaatggcaaa attgtgagta actatcctcc tttcattttg ggaagaagat 120
gaggcatgaa gagaattcag acagaaactt actcagacca ggggaggcag aaactaagca 180
gagaggaaaa tgaccaagag ttagccctgg gcatggaatg tgaaagaacc ctaaacgtga 240
cttggaaata atgcccaagg tatattccat tctccgggat ttgttggcat tttcttgagg 300
tgaagaattg cagaatacat tctttaatgt gacctacata tttacccatg ggaggaagtc 360
tgctcctgga ctcttgagat tcagtcataa agcccaggcc agggaaataa tgtaagtctg 420
caggcccctg tcatcagtag gattagggag aagagttctc agtagaaaac agggaggctg 480
gagagaaaag aatggttaat gttaacgtta atataactag aaagactgca gaacttagga 540
ctgattttta tttgaatcct taaaaaaaaa aatttcttat gaaaatagta catggctctt 600
aggagacaga acttattgta cagaggaaca gcgtgagagt cagagtgatc ccagaacagg 660
tcctggctcc atcctgcaca tagttttggt gctgctggca atacggtccc cacaactgtg 720
ggaaggggtt aggggcaggg atctcatcag gaaagcatag gggtttaaag ttctttatag 780
agcacttaga agattgagaa tccacaaatt atattaataa caaacaaagt agtgtcgtgt 840
tatatagtaa atgtgaattt gcagacacat ttagggaaaa gttataatta aaaaaatagg 900
ctgtatatat a 911
<210> 39
<211> 1168
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 39
cgtgaggctc cggtgcccgt cagtgggcag agcgcacatc gcccacagtc cccgagaagt 60
tggggggagg ggtcggcaat tgaaccggtg cctagagaag gtggcgcggg gtaaactggg 120
aaagtgatgt cgtgtactgg ctccgccttt ttcccgaggg tgggggagaa ccgtatataa 180
gtgcagtagt cgccgtgaac gttctttttc gcaacgggtt tgccgccaga acacaggtaa 240
gtgccgtgtg tggttcccgc gggcctggcc tctttacggg ttatggccct tgcgtgcctt 300
gaattacttc cacctggctc cagtacgtga ttcttgatcc cgagctggag ccaggggcgg 360
gccttgcgct ttaggagccc cttcgcctcg tgcttgagtt gaggcctggc ctgggcgctg 420
gggccgccgc gtgcgaatct ggtggcacct tcgcgcctgt ctcgctgctt tcgataagtc 480
tctagccatt taaaattttt gatgacctgc tgcgacgctt tttttctggc aagatagtct 540
tgtaaatgcg ggccaggatc tgcacactgg tatttcggtt tttggggccg cgggcggcga 600
cggggcccgt gcgtcccagc gcacatgttc ggcgaggcgg ggcctgcgag cgcggccacc 660
gagaatcgga cgggggtagt ctcaagctgg ccggcctgct ctggtgcctg gcctcgcgcc 720
gccgtgtatc gccccgccct gggcggcaag gctggcccgg tcggcaccag ttgcgtgagc 780
ggaaagatgg ccgcttcccg gccctgctcc agggggctca aaatggagga cgcggcgctc 840
gggagagcgg gcgggtgagt cacccacaca aaggaaaggg gcctttccgt cctcagccgt 900
cgcttcatgt gactccacgg agtaccgggc gccgtccagg cacctcgatt agttctggag 960
cttttggagt acgtcgtctt taggttgggg ggaggggttt tatgcgatgg agtttcccca 1020
cactgagtgg gtggagactg aagttaggcc agcttggcac ttgatgtaat tctccttgga 1080
atttgccctt tttgagtttg gatcttggtt cattctcaag cctcagacag tggttcaaag 1140
tttttttctt ccatttcagg tgtcgtga 1168
<210> 40
<211> 72
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 40
agatctggca gcggagaggg cagaggaagt cttctaacat gcggtgacgt ggaggagaat 60
cccggcccta gg 72
<210> 41
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 41
cctctgctaa ccatgttcat gccttcttct ttttcctaca gctcctgggc aacgtgctgg 60
ttattgtgct gtctcatcat tttggcaaag aattc 95
<210> 42
<211> 1873
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 42
gatcttcaat attggccatt agccatatta ttcattggtt atatagcata aatcaatatt 60
ggctattggc cattgcatac gttgtatcta tatcataata tgtacattta tattggctca 120
tgtccaatat gaccgccatg ttggcattga ttattgacta gttattaata gtaatcaatt 180
acggggtcat tagttcatag cccatatatg gagttccgcg ttacataact tacggtaaat 240
ggcccgcctg gctgaccgcc caacgacccc cgcccattga cgtcaataat gacgtatgtt 300
cccatagtaa cgccaatagg gactttccat tgacgtcaat gggtggagta tttacggtaa 360
actgcccact tggcagtaca tcaagtgtat catatgccaa gtccgccccc tattgacgtc 420
aatgacggta aatggcccgc ctggcattat gcccagtaca tgaccttacg ggactttcct 480
acttggcagt acatctacgt attagtcatc gctattacca tggtcgaggt gagccccacg 540
ttctgcttca ctctccccat ctcccccccc tccccacccc caattttgta tttatttatt 600
ttttaattat tttgtgcagc gatgggggcg gggggggggg gggggcgcgc gccaggcggg 660
gcggggcggg gcgaggggcg gggcggggcg aggcggagag gtgcggcggc agccaatcag 720
agcggcgcgc tccgaaagtt tccttttatg gcgaggcggc ggcggcggcg gccctataaa 780
aagcgaagcg cgcggcgggc gggagtcgct gcgacgctgc cttcgccccg tgccccgctc 840
cgccgccgcc tcgcgccgcc cgccccggct ctgactgacc gcgttactcc cacaggtgag 900
cgggcgggac ggcccttctc ctccgggctg taattagcgc ttggtttaat gacggcttgt 960
ttcttttctg tggctgcgtg aaagccttga ggggctccgg gagggccctt tgtgcggggg 1020
ggagcggctc ggggggtgcg tgcgtgtgtg tgtgcgtggg gagcgccgcg tgcggcccgc 1080
gctgcccggc ggctgtgagc gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt 1140
gcgcgagggg agcgcggccg ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa 1200
caaaggctgc gtgcggggtg tgtgcgtggg ggggtgagca gggggtgtgg gcgcggcggt 1260
cgggctgtaa cccccccctg cacccccctc cccgagttgc tgagcacggc ccggcttcgg 1320
gtgcggggct ccgtacgggg cgtggcgcgg ggctcgccgt gccgggcggg gggtggcggc 1380
aggtgggggt gccgggcggg gcggggccgc ctcgggccgg ggagggctcg ggggaggggc 1440
gcggcggccc ccggagcgcc ggcggctgtc gaggcgcggc gagccgcagc cattgccttt 1500
tatggtaatc gtgcgagagg gcgcagggac ttcctttgtc ccaaatctgt gcggagccga 1560
aatctgggag gcgccgccgc accccctcta gcgggcgcgg ggcgaagcgg tgcggcgccg 1620
gcaggaagga aatgggcggg gagggccttc gtgcgtcgcc gcgccgccgt ccccttctcc 1680
ctctccagcc tcggggctgt ccgcgggggg acggctgcct tcggggggga cggggcaggg 1740
cggggttcgg cttctggcgt gtgaccggcg gctctagagc ctctgctaac catgttcatg 1800
ccttcttctt tttcctacag ctcctgggca acgtgctggt tattgtgctg tctcatcatt 1860
ttggcaaaga att 1873
<210> 43
<211> 4046
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 43
gcttcaggag cagttgtgcg aatagctgga gaacaccagg ctggatttaa acccagatcg 60
ctcttacatt tgctctttac ctgctgtgct cagcgttcac gtgccctcta gctgtagttt 120
tctgaagtca gcgcacagca aggcagtgtg cttagaggtt aacagaaggg aaaacaacaa 180
caacaaaaat ctaaatgaga atcctgactg tttcagctgg gggtaagggg ggcggattat 240
tcatataatt gttataccag acggtcgcag gcttagtcca attgcagaga actcgcttcc 300
caggcttctg agagtcccgg aagtgcctaa acctgtctaa tcgacggggc ttgggtggcc 360
cgtcgctccc tggcttcttc cctttaccca gggcgggcag cgaagtggtg cctcctgcgt 420
cccccacacc ctccctcagc ccctcccctc cggcccgtcc tgggcaggtg acctggagca 480
tccggcaggc tgccctggcc tcctgcgtca ggacaacgcc cacgaggggc gttactgtgc 540
ggagatgcac cacgcaagag acaccctttg taactctctt ctcctcccta gtgcgaggtt 600
aaaaccttca gccccacgtg ctgtttgcaa acctgcctgt acctgaggcc ctaaaaagcc 660
agagacctca ctcccgggga gccagcatgt ccactgcggt cctggaaaac ccaggcttgg 720
gcaggaaact ctctgacttt ggacaggtga gccacggcag cctgagctgc tcagttaggg 780
gaatttgggc ctccagagaa agagatctga agactgctgg tgcttcctgg tttcataagc 840
tcagtaagaa gtctgaattc gttggaagct gatgagaata tccaggaagt caacagacaa 900
atgtcctcaa caattgtttc taagtaggag aacatctgtc ctcggtggct ttcacaggaa 960
ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 1020
tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc 1080
cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt 1140
agtgtgagag gggaatgact cctttcggta agtgcagtgg aagctgtaca ctgcccaggc 1200
aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact tagcccctgt 1260
ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct cccccgttgc 1320
ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct cagcttcagg 1380
caccaccact gacctgggac agtgaatcct ctaaggtaaa tataaaattt ttaagtgtat 1440
aatgtgttaa actactgatt ctaattgttt ctctctttta gattccaacc tttggaactg 1500
accgccacca tgtccaccgc tgtgctggag aaccctgggc tggggaggaa actgtcagac 1560
ttcgggcagg agacttcata cattgaggat aactgtaacc agaatggcgc catctctctg 1620
atcttcagcc tgaaggagga agtgggcgcc ctggcaaagg tgctgcgcct gtttgaggag 1680
aacgacgtga atctgaccca catcgagtcc cggccttcta gactgaagaa ggacgagtac 1740
gagttcttta cccacctgga taagcggtcc ctgccagccc tgacaaacat catcaagatc 1800
ctgaggcacg acatcggagc aaccgtgcac gagctgtctc gggacaagaa gaaggatacc 1860
gtgccctggt tccctcggac aatccaggag ctggatagat ttgccaacca gatcctgtct 1920
tacggagcag agctggacgc agatcaccct ggcttcaagg acccagtgta tcgggcccgg 1980
agaaagcagt ttgccgatat cgcctacaat tataggcacg gacagccaat ccctcgcgtg 2040
gagtatatgg aggaggagaa gaagacctgg ggcacagtgt tcaagaccct gaagagcctg 2100
tacaagacac acgcctgcta cgagtataac cacatcttcc ccctgctgga gaagtattgt 2160
ggctttcacg aggacaatat ccctcagctg gaggacgtga gccagttcct gcagacctgc 2220
acaggcttta ggctgaggcc agtggcagga ctgctgagct cccgggactt cctgggagga 2280
ctggccttca gagtgtttca ctgcacccag tacatcaggc acggctccaa gccaatgtat 2340
acaccagagc ccgacatctg tcacgagctg ctgggccacg tgcccctgtt tagcgataga 2400
tccttcgccc agttttccca ggagatcgga ctggcatctc tgggagcacc tgacgagtac 2460
atcgagaagc tggccaccat ctattggttc acagtggagt ttggcctgtg caagcagggc 2520
gatagcatca aggcctacgg agcaggactg ctgtctagct tcggcgagct gcagtattgt 2580
ctgtccgaga agccaaagct gctgcccctg gagctggaga agaccgccat ccagaactac 2640
accgtgacag agttccagcc cctgtactat gtggccgagt cttttaacga tgccaaggag 2700
aaggtgagaa atttcgccgc cacaatccct aggcccttca gtgtgcgtta cgacccttat 2760
acccagagga tcgaggtgct ggataataca cagcagctga agatcctggc tgactcaatc 2820
aatagcgaaa tcggaatcct gtgctccgcc ctgcagaaaa tcaaatgaga attcaaggcc 2880
tctcgagcct ctagaactat agtgagtcgt attacgtaga tccagacatg ataagataca 2940
ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa 3000
tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 3060
acaattgcat tcattttatg tttcaggttc agggggaggt gtgggaggtt ttttaagctt 3120
tacgtacgat cgtcgactgg gatgggatgt ggaatccttc tagatttctt ttgtaatatt 3180
tataaagtgc tctcagcaag gtatcaaaat ggcaaaattg tgagtaacta tcctcctttc 3240
attttgggaa gaagatgagg catgaagaga attcagacag aaacttactc agaccagggg 3300
aggcagaaac taagcagaga ggaaaatgac caagagttag ccctgggcat ggaatgtgaa 3360
agaaccctaa acgtgacttg gaaataatgc ccaaggtata ttccattctc cgggatttgt 3420
tggcattttc ttgaggtgaa gaattgcaga atacattctt taatgtgacc tacatattta 3480
cccatgggag gaagtctgct cctggactct tgagattcag tcataaagcc caggccaggg 3540
aaataatgta agtctgcagg cccctgtcat cagtaggatt agggagaaga gttctcagta 3600
gaaaacaggg aggctggaga gaaaagaatg gttaatgtta acgttaatat aactagaaag 3660
actgcagaac ttaggactga tttttatttg aatccttaaa aaaaaaattt cttatgaaaa 3720
tagtacatgg ctcttaggag acagaactta ttgtacagag gaacagcgtg agagtcagag 3780
tgatcccaga acaggtcctg gctccatcct gcacatagtt ttggtgctgc tggcaatacg 3840
gtccccacaa ctgtgggaag gggttagggg cagggatctc atcaggaaag cataggggtt 3900
taaagttctt tatagagcac ttagaagatt gagaatccac aaattatatt aataacaaac 3960
aaagtagtgt cgtgttatat agtaaatgtg aatttgcaga cacatttagg gaaaagttat 4020
aattaaaaaa ataggctgta tatata 4046
<210> 44
<211> 913
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 44
ggcatcctaa aaaatattca gtggaaacgt aaaaacatta aagactgatt aaacatcgca 60
gcatgacaca gatttagcaa ctgagcataa ataatttgac tcggatactg ctccaaaatc 120
cgaagaggac caatttcttc caggaggaca actacctcgt cctctgcaga cccctctcct 180
cggcagctga aggagtgtgg ccaatctgcc tccacctccc cgcggacccc ctactctcag 240
gacctcctgc agcaccccaa actggaagtg gccgctgcag acccaaggac gaggggcacg 300
cgggagccgg cagccctagt ggagcggttg gagatgttga ggtgggaggg tcacccaggt 360
ggggtgaggc tggggtaggt agcggagtga acggcttccg aagctctggg ccgcccccag 420
gttggactaa gcaggcgctc tgtcttcgcc cccgcccagg gtgggcgtct cctgaggact 480
ccccgccaca cctgacccga gaccgcgcgc ccagcctaga acgcttcccc gacccagcgt 540
agggccgccg cgactggcgg gcgagggtcg gcgggaggcc tggcgaaccc gggggcggga 600
ccaggcgggc aaggcccggc tgccgcagcg ccgctctgcg cgaggcggct ccgccgcggc 660
ggagggatac ggcgcaccat atatatatcg cggggcgcag actcgcgctc cggcagtggt 720
gctgggagtg tcgtggacgc cgtgccgtta ctcgtagtca ggcggcggcg caggcggcgg 780
cggcggcata gcgcacagcg cgccttagca gcagcagcag cagcagcggc atcggaggta 840
cccccgccgt cgcagccccc gcgctggtgc agccaccctc gctccctctg ctcttcctcc 900
cttcgctcgc acc 913
<210> 45
<211> 4452
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 45
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag gtcctgcata tgcggccgct tcaggagcag ttgtgcgaat agctggagaa 240
caccaggctg gatttaaacc cagatcgctc ttacatttgc tctttacctg ctgtgctcag 300
cgttcacgtg ccctctagct gtagttttct gaagtcagcg cacagcaagg cagtgtgctt 360
agaggttaac agaagggaaa acaacaacaa caaaaatcta aatgagaatc ctgactgttt 420
cagctggggg taaggggggc ggattattca tataattgtt ataccagacg gtcgcaggct 480
tagtccaatt gcagagaact cgcttcccag gcttctgaga gtcccggaag tgcctaaacc 540
tgtctaatcg acggggcttg ggtggcccgt cgctccctgg cttcttccct ttacccaggg 600
cgggcagcga agtggtgcct cctgcgtccc ccacaccctc cctcagcccc tcccctccgg 660
cccgtcctgg gcaggtgacc tggagcatcc ggcaggctgc cctggcctcc tgcgtcagga 720
caacgcccac gaggggcgtt actgtgcgga gatgcaccac gcaagagaca ccctttgtaa 780
ctctcttctc ctccctagtg cgaggttaaa accttcagcc ccacgtgctg tttgcaaacc 840
tgcctgtacc tgaggcccta aaaagccaga gacctcactc ccggggagcc agcatgtcca 900
ctgcggtcct ggaaaaccca ggcttgggca ggaaactctc tgactttgga caggtgagcc 960
acggcagcct gagctgctca gttaggggaa tttgggcctc cagagaaaga gatctgaaga 1020
ctgctggtgc ttcctggttt cataagctca gtaagaagtc tgaattcgtt ggaagctgat 1080
gagaatatcc aggaagtcaa cagacaaatg tcctcaacaa ttgtttctaa gtaggagaac 1140
atctgtcctc ggtggctttc acaggaaccc taaaatgggc aaacattgca agcagcaaac 1200
agcaaacaca cagccctccc tgcctgctga ccttggagct ggggcagagg tcagagacct 1260
ctctgggccc atgccacctc caacatccac tcgacccctt ggaatttcgg tggagaggag 1320
cagaggttgt cctggcgtgg tttaggtagt gtgagagggg aatgactcct ttcggtaagt 1380
gcagtggaag ctgtacactg cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag 1440
atcccagcca gtggacttag cccctgtttg ctcctccgat aactggggtg accttggtta 1500
atattcacca gcagcctccc ccgttgcccc tctggatcca ctgcttaaat acggacgagg 1560
acagggccct gtctcctcag cttcaggcac caccactgac ctgggacagt gaatcctcta 1620
aggtaaatat aaaattttta agtgtataat gtgttaaact actgattcta attgtttctc 1680
tcttttagat tccaaccttt ggaactgacc gccaccatgt ccaccgctgt gctggagaac 1740
cctgggctgg ggaggaaact gtcagacttc gggcaggaga cttcatacat tgaggataac 1800
tgtaaccaga atggcgccat ctctctgatc ttcagcctga aggaggaagt gggcgccctg 1860
gcaaaggtgc tgcgcctgtt tgaggagaac gacgtgaatc tgacccacat cgagtcccgg 1920
ccttctagac tgaagaagga cgagtacgag ttctttaccc acctggataa gcggtccctg 1980
ccagccctga caaacatcat caagatcctg aggcacgaca tcggagcaac cgtgcacgag 2040
ctgtctcggg acaagaagaa ggataccgtg ccctggttcc ctcggacaat ccaggagctg 2100
gatagatttg ccaaccagat cctgtcttac ggagcagagc tggacgcaga tcaccctggc 2160
ttcaaggacc cagtgtatcg ggcccggaga aagcagtttg ccgatatcgc ctacaattat 2220
aggcacggac agccaatccc tcgcgtggag tatatggagg aggagaagaa gacctggggc 2280
acagtgttca agaccctgaa gagcctgtac aagacacacg cctgctacga gtataaccac 2340
atcttccccc tgctggagaa gtattgtggc tttcacgagg acaatatccc tcagctggag 2400
gacgtgagcc agttcctgca gacctgcaca ggctttaggc tgaggccagt ggcaggactg 2460
ctgagctccc gggacttcct gggaggactg gccttcagag tgtttcactg cacccagtac 2520
atcaggcacg gctccaagcc aatgtataca ccagagcccg acatctgtca cgagctgctg 2580
ggccacgtgc ccctgtttag cgatagatcc ttcgcccagt tttcccagga gatcggactg 2640
gcatctctgg gagcacctga cgagtacatc gagaagctgg ccaccatcta ttggttcaca 2700
gtggagtttg gcctgtgcaa gcagggcgat agcatcaagg cctacggagc aggactgctg 2760
tctagcttcg gcgagctgca gtattgtctg tccgagaagc caaagctgct gcccctggag 2820
ctggagaaga ccgccatcca gaactacacc gtgacagagt tccagcccct gtactatgtg 2880
gccgagtctt ttaacgatgc caaggagaag gtgagaaatt tcgccgccac aatccctagg 2940
cccttcagtg tgcgttacga cccttatacc cagaggatcg aggtgctgga taatacacag 3000
cagctgaaga tcctggctga ctcaatcaat agcgaaatcg gaatcctgtg ctccgccctg 3060
cagaaaatca aatgagaatt caaggcctct cgagcctcta gaactatagt gagtcgtatt 3120
acgtagatcc agacatgata agatacattg atgagtttgg acaaaccaca actagaatgc 3180
agtgaaaaaa atgctttatt tgtgaaattt gtgatgctat tgctttattt gtaaccatta 3240
taagctgcaa taaacaagtt aacaacaaca attgcattca ttttatgttt caggttcagg 3300
gggaggtgtg ggaggttttt taagctttac gtacgatcgt cgactgggat gggatgtgga 3360
atccttctag atttcttttg taatatttat aaagtgctct cagcaaggta tcaaaatggc 3420
aaaattgtga gtaactatcc tcctttcatt ttgggaagaa gatgaggcat gaagagaatt 3480
cagacagaaa cttactcaga ccaggggagg cagaaactaa gcagagagga aaatgaccaa 3540
gagttagccc tgggcatgga atgtgaaaga accctaaacg tgacttggaa ataatgccca 3600
aggtatattc cattctccgg gatttgttgg cattttcttg aggtgaagaa ttgcagaata 3660
cattctttaa tgtgacctac atatttaccc atgggaggaa gtctgctcct ggactcttga 3720
gattcagtca taaagcccag gccagggaaa taatgtaagt ctgcaggccc ctgtcatcag 3780
taggattagg gagaagagtt ctcagtagaa aacagggagg ctggagagaa aagaatggtt 3840
aatgttaacg ttaatataac tagaaagact gcagaactta ggactgattt ttatttgaat 3900
ccttaaaaaa aaaatttctt atgaaaatag tacatggctc ttaggagaca gaacttattg 3960
tacagaggaa cagcgtgaga gtcagagtga tcccagaaca ggtcctggct ccatcctgca 4020
catagttttg gtgctgctgg caatacggtc cccacaactg tgggaagggg ttaggggcag 4080
ggatctcatc aggaaagcat aggggtttaa agttctttat agagcactta gaagattgag 4140
aatccacaaa ttatattaat aacaaacaaa gtagtgtcgt gttatatagt aaatgtgaat 4200
ttgcagacac atttagggaa aagttataat taaaaaaata ggctgtatat atacctgcag 4260
gtctagatac gtagataagt agcatggcgg gttaatcatt aactacaagg aacccctagt 4320
gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa 4380
ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag cgcgcagaga 4440
gggagtggcc aa 4452
<210> 46
<211> 380
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 46
ggcattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60
catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120
acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180
ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240
aagtgtatca tatgccaagt ccgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300
ggcattatgc ccagtacatg accttacggg actttcctac ttggcagtac atctacgtat 360
tagtcatcgc tattaccatg 380
<210> 47
<211> 1246
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 47
tcgaggtgag ccccacgttc tgcttcactc tccccatctc ccccccctcc ccacccccaa 60
ttttgtattt atttattttt taattatttt gtgcagcgat gggggcgggg gggggggggg 120
ggcgcgcgcc aggcggggcg gggcggggcg aggggcgggg cggggcgagg cggagaggtg 180
cggcggcagc caatcagagc ggcgcgctcc gaaagtttcc ttttatggcg aggcggcggc 240
ggcggcggcc ctataaaaag cgaagcgcgc ggcgggcggg agtcgctgcg cgctgccttc 300
gccccgtgcc ccgctccgcc gccgcctcgc gccgcccgcc ccggctctga ctgaccgcgt 360
tactcccaca ggtgagcggg cgggacggcc cttctcctcc gggctgtaat tagcgcttgg 420
tttaatgacg gcttgtttct tttctgtggc tgcgtgaaag ccttgagggg ctccgggagg 480
gccctttgtg cggggggagc ggctcggggg gtgcgtgcgt gtgtgtgtgc gtggggagcg 540
ccgcgtgcgg ctccgcgctg cccggcggct gtgagcgctg cgggcgcggc gcggggcttt 600
gtgcgctccg cagtgtgcgc gaggggagcg cggccggggg cggtgccccg cggtgcgggg 660
ggggctgcga ggggaacaaa ggctgcgtgc ggggtgtgtg cgtggggggg tgagcagggg 720
gtgtgggcgc gtcggtcggg ctgcaacccc ccctgcaccc ccctccccga gttgctgagc 780
acggcccggc ttcgggtgcg gggctccgta cggggcgtgg cgcggggctc gccgtgccgg 840
gcggggggtg gcggcaggtg ggggtgccgg gcggggcggg gccgcctcgg gccggggagg 900
gctcggggga ggggcgcggc ggcccccgga gcgccggcgg ctgtcgaggc gcggcgagcc 960
gcagccattg ccttttatgg taatcgtgcg agagggcgca gggacttcct ttgtcccaaa 1020
tctgtgcgga gccgaaatct gggaggcgcc gccgcacccc ctctagcggg cgcggggcga 1080
agcggtgcgg cgccggcagg aaggaaatgg gcggggaggg ccttcgtgcg tcgccgcgcc 1140
gccgtcccct tctccctctc cagcctcggg gctgtccgcg gggggacggc tgccttcggg 1200
ggggacgggg cagggcgggg ttcggcttct ggcgtgtgac cggcgg 1246
<210> 48
<211> 1061
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 48
tagggaggtc ctgcacgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 60
cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac 120
tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca 180
agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg 240
gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt 300
agtcatcgct attaccatgg tcgaggtgag ccccacgttc tgcttcactc tccccatctc 360
ccccccctcc ccacccccaa ttttgtattt atttattttt taattatttt gtgcagcgat 420
gggggcgggg gggggggggg gcgcgcgcca ggcggggcgg ggcggggcga ggggcggggc 480
ggggcgaggc ggagaggtgc ggcggcagcc aatcagagcg gcgcgctccg aaagtttcct 540
tttatggcga ggcggcggcg gcggcggccc tataaaaagc gaagcgcgcg gcgggcggga 600
gtcgctgcgc gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc 660
cggctctgac tgaccgcgtt actaaaacag gtaagtccgg cctccgcgcc gggttttggc 720
gcctcccgcg ggcgcccccc tcctcacggc gagcgctgcc acgtcagacg aagggcgcag 780
cgagcgtcct gatccttccg cccggacgct caggacagcg gcccgctgct cataagactc 840
ggccttagaa ccccagtatc agcagaagga cattttagga cgggacttgg gtgactctag 900
ggcactggtt ttctttccag agagcggaac aggcgaggaa aagtagtccc ttctcggcga 960
ttctgcggag ggatctccgt ggggcggtga acgccgatga tgcctctact aaccatgttc 1020
atgttttctt tttttttcta caggtcctgg gtgacgaaca g 1061
<210> 49
<211> 953
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 49
aattcggtac cctagttatt aatagtaatc aattacgggg tcattagttc atagcccata 60
tatggagttc cgcgttacat aacttacggt aaatggcccg cctggctgac cgcccaacga 120
cccccgccca ttgacgtcaa taatgacgta tgttcccata gtaacgccaa tagggacttt 180
ccattgacgt caatgggtgg actatttacg gtaaactgcc cacttggcag tacatcaagt 240
gtatcatatg ccaagtacgc cccctattga cgtcaatgac ggtaaatggc ccgcctggca 300
ttatgcccag tacatgacct tatgggactt tcctacttgg cagtacatct acgtattagt 360
catcgctatt accatggtcg aggtgagccc cacgttctgc ttcactctcc ccatctcccc 420
cccctcccca cccccaattt tgtatttatt tattttttaa ttattttgtg cagcgatggg 480
ggcggggggg gggggggggc gcgcgccagg cggggcgggg cggggcgagg ggcggggcgg 540
ggcgaggcgg agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa agtttccttt 600
tatggcgagg cggcggcggc ggcggcccta taaaaagcga agcgcgcggc gggcgggagt 660
cgctgcgacg ctgccttcgc cccgtgcccc gctccgccgc cgcctcgcgc cgcccgcccc 720
ggctctgact gaccgcgtta ctcccacagg tgagcgggcg ggacggccct tctcctccgg 780
gctgtaatta gcgcttggtt taatgacggc ttgtttcttt tctgtggctg cgtgaaagcc 840
ttgaggggct ccgggagcta gagcctctgc taaccatgtt catgccttct tctttttcct 900
acagctcctg ggcaacgtgc tggttattgt gctgtctcat cattttggca aag 953
<210> 50
<211> 541
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 50
ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60
tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc 120
cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt 180
agtgtgagag gggaatgact cctttcggta agtgcagtgg aagctgtaca ctgcccaggc 240
aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact tagcccctgt 300
ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct cccccgttgc 360
ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct cagcttcagg 420
caccaccact gacctgggac agtgaatcct ctaaggtaaa tataaaattt ttaagtgtat 480
aatgtgttaa actactgatt ctaattgttt ctctctttta gattccaacc tttggaactg 540
a 541
<210> 51
<211> 1908
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 51
ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60
tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc 120
cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt 180
agtgtgagag gggaatgact cctttcggta agtgcagtgg aagctgtaca ctgcccaggc 240
aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact tagcccctgt 300
ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct cccccgttgc 360
ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct cagcttcagg 420
caccaccact gacctgggac agtgaatcct ctaaggtaaa tataaaattt ttaagtgtat 480
aatgtgttaa actactgatt ctaattgttt ctctctttta gattccaacc tttggaactg 540
accgccacca tgtccaccgc tgtgctggag aaccctgggc tggggaggaa actgtcagac 600
ttcgggcagg agacttcata cattgaggat aactgtaacc agaatggcgc catctctctg 660
atcttcagcc tgaaggagga agtgggcgcc ctggcaaagg tgctgcgcct gtttgaggag 720
aacgacgtga atctgaccca catcgagtcc cggccttcta gactgaagaa ggacgagtac 780
gagttcttta cccacctgga taagcggtcc ctgccagccc tgacaaacat catcaagatc 840
ctgaggcacg acatcggagc aaccgtgcac gagctgtctc gggacaagaa gaaggatacc 900
gtgccctggt tccctcggac aatccaggag ctggatagat ttgccaacca gatcctgtct 960
tacggagcag agctggacgc agatcaccct ggcttcaagg acccagtgta tcgggcccgg 1020
agaaagcagt ttgccgatat cgcctacaat tataggcacg gacagccaat ccctcgcgtg 1080
gagtatatgg aggaggagaa gaagacctgg ggcacagtgt tcaagaccct gaagagcctg 1140
tacaagacac acgcctgcta cgagtataac cacatcttcc ccctgctgga gaagtattgt 1200
ggctttcacg aggacaatat ccctcagctg gaggacgtga gccagttcct gcagacctgc 1260
acaggcttta ggctgaggcc agtggcagga ctgctgagct cccgggactt cctgggagga 1320
ctggccttca gagtgtttca ctgcacccag tacatcaggc acggctccaa gccaatgtat 1380
acaccagagc ccgacatctg tcacgagctg ctgggccacg tgcccctgtt tagcgataga 1440
tccttcgccc agttttccca ggagatcgga ctggcatctc tgggagcacc tgacgagtac 1500
atcgagaagc tggccaccat ctattggttc acagtggagt ttggcctgtg caagcagggc 1560
gatagcatca aggcctacgg agcaggactg ctgtctagct tcggcgagct gcagtattgt 1620
ctgtccgaga agccaaagct gctgcccctg gagctggaga agaccgccat ccagaactac 1680
accgtgacag agttccagcc cctgtactat gtggccgagt cttttaacga tgccaaggag 1740
aaggtgagaa atttcgccgc cacaatccct aggcccttca gtgtgcgtta cgacccttat 1800
acccagagga tcgaggtgct ggataataca cagcagctga agatcctggc tgactcaatc 1860
aatagcgaaa tcggaatcct gtgctccgcc ctgcagaaaa tcaaatga 1908
<210> 52
<211> 2156
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 52
ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60
tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc 120
cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt 180
agtgtgagag gggaatgact cctttcggta agtgcagtgg aagctgtaca ctgcccaggc 240
aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact tagcccctgt 300
ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct cccccgttgc 360
ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct cagcttcagg 420
caccaccact gacctgggac agtgaatcct ctaaggtaaa tataaaattt ttaagtgtat 480
aatgtgttaa actactgatt ctaattgttt ctctctttta gattccaacc tttggaactg 540
accgccacca tgtccaccgc tgtgctggag aaccctgggc tggggaggaa actgtcagac 600
ttcgggcagg agacttcata cattgaggat aactgtaacc agaatggcgc catctctctg 660
atcttcagcc tgaaggagga agtgggcgcc ctggcaaagg tgctgcgcct gtttgaggag 720
aacgacgtga atctgaccca catcgagtcc cggccttcta gactgaagaa ggacgagtac 780
gagttcttta cccacctgga taagcggtcc ctgccagccc tgacaaacat catcaagatc 840
ctgaggcacg acatcggagc aaccgtgcac gagctgtctc gggacaagaa gaaggatacc 900
gtgccctggt tccctcggac aatccaggag ctggatagat ttgccaacca gatcctgtct 960
tacggagcag agctggacgc agatcaccct ggcttcaagg acccagtgta tcgggcccgg 1020
agaaagcagt ttgccgatat cgcctacaat tataggcacg gacagccaat ccctcgcgtg 1080
gagtatatgg aggaggagaa gaagacctgg ggcacagtgt tcaagaccct gaagagcctg 1140
tacaagacac acgcctgcta cgagtataac cacatcttcc ccctgctgga gaagtattgt 1200
ggctttcacg aggacaatat ccctcagctg gaggacgtga gccagttcct gcagacctgc 1260
acaggcttta ggctgaggcc agtggcagga ctgctgagct cccgggactt cctgggagga 1320
ctggccttca gagtgtttca ctgcacccag tacatcaggc acggctccaa gccaatgtat 1380
acaccagagc ccgacatctg tcacgagctg ctgggccacg tgcccctgtt tagcgataga 1440
tccttcgccc agttttccca ggagatcgga ctggcatctc tgggagcacc tgacgagtac 1500
atcgagaagc tggccaccat ctattggttc acagtggagt ttggcctgtg caagcagggc 1560
gatagcatca aggcctacgg agcaggactg ctgtctagct tcggcgagct gcagtattgt 1620
ctgtccgaga agccaaagct gctgcccctg gagctggaga agaccgccat ccagaactac 1680
accgtgacag agttccagcc cctgtactat gtggccgagt cttttaacga tgccaaggag 1740
aaggtgagaa atttcgccgc cacaatccct aggcccttca gtgtgcgtta cgacccttat 1800
acccagagga tcgaggtgct ggataataca cagcagctga agatcctggc tgactcaatc 1860
aatagcgaaa tcggaatcct gtgctccgcc ctgcagaaaa tcaaatgaga attcaaggcc 1920
tctcgagcct ctagaactat agtgagtcgt attacgtaga tccagacatg ataagataca 1980
ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa 2040
tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 2100
acaattgcat tcattttatg tttcaggttc agggggaggt gtgggaggtt ttttaa 2156
<210> 53
<211> 1356
<212> DNA
<213> 智人(Homo sapiens)
<400> 53
atgtccactg cggtcctgga aaacccaggc ttgggcagga aactctctga ctttggacag 60
gaaacaagct atattgaaga caactgcaat caaaatggtg ccatatcact gatcttctca 120
ctcaaagaag aagttggtgc attggccaaa gtattgcgct tatttgagga gaatgatgta 180
aacctgaccc acattgaatc tagaccttct cgtttaaaga aagatgagta tgaatttttc 240
acccatttgg ataaacgtag cctgcctgct ctgacaaaca tcatcaagat cttgaggcat 300
gacattggtg ccactgtcca tgagctttca cgagataaga agaaagacac agtgccctgg 360
ttcccaagaa ccattcaaga gctggacaga tttgccaatc agattctcag ctatggagcg 420
gaactggatg ctgaccaccc tggttttaaa gatcctgtgt accgtgcaag acggaagcag 480
tttgctgaca ttgcctacaa ctaccgccat gggcagccca tccctcgagt ggaatacatg 540
gaggaagaaa agaaaacatg gggcacagtg ttcaagactc tgaagtcctt gtataaaacc 600
catgcttgct atgagtacaa tcacattttt ccacttcttg aaaagtactg tggcttccat 660
gaagataaca ttccccagct ggaagacgtt tctcaattcc tgcagacttg cactggtttc 720
cgcctccgac ctgtggctgg cctgctttcc tctcgggatt tcttgggtgg cctggccttc 780
cgagtcttcc actgcacaca gtacatcaga catggatcca agcccatgta tacccccgaa 840
cctgacatct gccatgagct gttgggacat gtgcccttgt tttcagatcg cagctttgcc 900
cagttttccc aggaaattgg ccttgcctct ctgggtgcac ctgatgaata cattgaaaag 960
ctcgccacaa tttactggtt tactgtggag tttgggctct gcaaacaagg agactccata 1020
aaggcatatg gtgctgggct cctgtcatcc tttggtgaat tacagtactg cttatcagag 1080
aagccaaagc ttctccccct ggagctggag aagacagcca tccaaaatta cactgtcacg 1140
gagttccagc ccctgtatta cgtggcagag agttttaatg atgccaagga gaaagtaagg 1200
aactttgctg ccacaatacc tcggcccttc tcagttcgct acgacccata cacccaaagg 1260
attgaggtct tggacaatac ccagcagctt aagattttgg ctgattccat taacagtgaa 1320
attggaatcc tttgcagtgc cctccagaaa ataaag 1356
<210> 54
<211> 173
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 54
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 60
aaaatcaacg ggactttcca aaatgtcgta ataaccccgc cccgttgacg caaatgggcg 120
gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac cgt 173
<210> 55
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 55
ccaaaatcaa cgggactttc caaaatgtcg taataacccc gccccgttga cgcaaatggg 60
cggtaggcgt gtacggtggg aggtctatat aagcagagct 100
<210> 56
<211> 380
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 56
ggcattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60
catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120
acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180
ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240
aagtgtatca tatgccaagt ccgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300
ggcattatgc ccagtacatg accttacggg actttcctac ttggcagtac atctacgtat 360
tagtcatcgc tattaccatg 380
<210> 57
<211> 1246
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 57
tcgaggtgag ccccacgttc tgcttcactc tccccatctc ccccccctcc ccacccccaa 60
ttttgtattt atttattttt taattatttt gtgcagcgat gggggcgggg gggggggggg 120
ggcgcgcgcc aggcggggcg gggcggggcg aggggcgggg cggggcgagg cggagaggtg 180
cggcggcagc caatcagagc ggcgcgctcc gaaagtttcc ttttatggcg aggcggcggc 240
ggcggcggcc ctataaaaag cgaagcgcgc ggcgggcggg agtcgctgcg cgctgccttc 300
gccccgtgcc ccgctccgcc gccgcctcgc gccgcccgcc ccggctctga ctgaccgcgt 360
tactcccaca ggtgagcggg cgggacggcc cttctcctcc gggctgtaat tagcgcttgg 420
tttaatgacg gcttgtttct tttctgtggc tgcgtgaaag ccttgagggg ctccgggagg 480
gccctttgtg cggggggagc ggctcggggg gtgcgtgcgt gtgtgtgtgc gtggggagcg 540
ccgcgtgcgg ctccgcgctg cccggcggct gtgagcgctg cgggcgcggc gcggggcttt 600
gtgcgctccg cagtgtgcgc gaggggagcg cggccggggg cggtgccccg cggtgcgggg 660
ggggctgcga ggggaacaaa ggctgcgtgc ggggtgtgtg cgtggggggg tgagcagggg 720
gtgtgggcgc gtcggtcggg ctgcaacccc ccctgcaccc ccctccccga gttgctgagc 780
acggcccggc ttcgggtgcg gggctccgta cggggcgtgg cgcggggctc gccgtgccgg 840
gcggggggtg gcggcaggtg ggggtgccgg gcggggcggg gccgcctcgg gccggggagg 900
gctcggggga ggggcgcggc ggcccccgga gcgccggcgg ctgtcgaggc gcggcgagcc 960
gcagccattg ccttttatgg taatcgtgcg agagggcgca gggacttcct ttgtcccaaa 1020
tctgtgcgga gccgaaatct gggaggcgcc gccgcacccc ctctagcggg cgcggggcga 1080
agcggtgcgg cgccggcagg aaggaaatgg gcggggaggg ccttcgtgcg tcgccgcgcc 1140
gccgtcccct tctccctctc cagcctcggg gctgtccgcg gggggacggc tgccttcggg 1200
ggggacgggg cagggcgggg ttcggcttct ggcgtgtgac cggcgg 1246
<210> 58
<211> 201
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 58
gaattcgggc ggagttaggg cggagccaat cagcgtgcgc cgttccgaaa gttgcctttt 60
atggctgggc ggagaatggg cggtgaacgc cgatgattat ataaggacgc gccgggtgtg 120
gcacagctag ttccgtcgca gccgggattt gggtcgcggt tcttgtttgt ggatccctgt 180
gatcgtgatc atcacttgtg a 201
<210> 59
<211> 953
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 59
aattcggtac cctagttatt aatagtaatc aattacgggg tcattagttc atagcccata 60
tatggagttc cgcgttacat aacttacggt aaatggcccg cctggctgac cgcccaacga 120
cccccgccca ttgacgtcaa taatgacgta tgttcccata gtaacgccaa tagggacttt 180
ccattgacgt caatgggtgg actatttacg gtaaactgcc cacttggcag tacatcaagt 240
gtatcatatg ccaagtacgc cccctattga cgtcaatgac ggtaaatggc ccgcctggca 300
ttatgcccag tacatgacct tatgggactt tcctacttgg cagtacatct acgtattagt 360
catcgctatt accatggtcg aggtgagccc cacgttctgc ttcactctcc ccatctcccc 420
cccctcccca cccccaattt tgtatttatt tattttttaa ttattttgtg cagcgatggg 480
ggcggggggg gggggggggc gcgcgccagg cggggcgggg cggggcgagg ggcggggcgg 540
ggcgaggcgg agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa agtttccttt 600
tatggcgagg cggcggcggc ggcggcccta taaaaagcga agcgcgcggc gggcgggagt 660
cgctgcgacg ctgccttcgc cccgtgcccc gctccgccgc cgcctcgcgc cgcccgcccc 720
ggctctgact gaccgcgtta ctcccacagg tgagcgggcg ggacggccct tctcctccgg 780
gctgtaatta gcgcttggtt taatgacggc ttgtttcttt tctgtggctg cgtgaaagcc 840
ttgaggggct ccgggagcta gagcctctgc taaccatgtt catgccttct tctttttcct 900
acagctcctg ggcaacgtgc tggttattgt gctgtctcat cattttggca aag 953
<210> 60
<211> 1766
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 60
gtaaatttta tggaatgtga atcataattc aatttttcaa catgcgttag gagggacatt 60
tcaaactctt ttttacccta gactttccta ccatcaccca gagtatccag ccaggagggg 120
aggggctaga gacaccagaa gtttagcagg gaggagggcg tagggattcg gggaatgaag 180
ggatgggatt cagactaggg ccaggaccca gggatggaga gaaagagatg agagtggttt 240
gggggcttgg tgacttagag aacagagctg caggctcaga ggcacacagg agtttctggg 300
ctcaccctgc ccccttccaa cccctcagtt cccatcctcc agcagctgtt tgtgtgctgc 360
ctctgaagtc cacactgaac aaacttcagc ctactcatgt ccctaaaatg ggcaaacatt 420
gcaagcagca aacagcaaac acacagccct ccctgcctgc tgaccttgga gctggggcag 480
aggtcagaga cctctctggg cccatgccac ctccaacatc cactcgaccc cttggaattt 540
cggtggagag gagcagaggt tgtcctggcg tggtttaggt agtgtgagag ggcttaagcg 600
tgaggctccg gtgcccgtca gtgggcagag cgcacatcgc ccacagtccc cgagaagttg 660
gggggagggg tcggcaattg aaccggtgcc tagagaaggt ggcgcggggt aaactgggaa 720
agtgatgtcg tgtactggct ccgccttttt cccgagggtg ggggagaacc gtatataagt 780
gcagtagtcg ccgtgaacgt tctttttcgc aacgggtttg ccgccagaac acaggtaagt 840
gccgtgtgtg gttcccgcgg gcctggcctc tttacgggtt atggcccttg cgtgccttga 900
attacttcca cctggctcca gtacgtgatt cttgatcccg agctggagcc aggggcgggc 960
cttgcgcttt aggagcccct tcgcctcgtg cttgagttga ggcctggcct gggcgctggg 1020
gccgccgcgt gcgaatctgg tggcaccttc gcgcctgtct cgctgctttc gataagtctc 1080
tagccattta aaatttttga tgacctgctg cgacgctttt tttctggcaa gatagtcttg 1140
taaatgcggg ccaggatctg cacactggta tttcggtttt tggggccgcg ggcggcgacg 1200
gggcccgtgc gtcccagcgc acatgttcgg cgaggcgggg cctgcgagcg cggccaccga 1260
gaatcggacg ggggtagtct caagctggcc ggcctgctct ggtgcctggc ctcgcgccgc 1320
cgtgtatcgc cccgccctgg gcggcaaggc tggcccggtc ggcaccagtt gcgtgagcgg 1380
aaagatggcc gcttcccggc cctgctccag ggggctcaaa atggaggacg cggcgctcgg 1440
gagagcgggc gggtgagtca cccacacaaa ggaaaggggc ctttccgtcc tcagccgtcg 1500
cttcatgtga ctccacggag taccgggcgc cgtccaggca cctcgattag ttctggagct 1560
tttggagtac gtcgtcttta ggttgggggg aggggtttta tgcgatggag tttccccaca 1620
ctgagtgggt ggagactgaa gttaggccag cttggcactt gatgtaattc tccttggaat 1680
ttgccctttt tgagtttgga tcttggttca ttctcaagcc tcagacagtg gttcaaagtt 1740
tttttcttcc atttcaggtg tcgtga 1766
<210> 61
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 61
gtaagggttt aagggatggt tggttggtgg ggtattaatg tttaattacc tggagcacct 60
gcctgaaatc actttttttc ag 82
<210> 62
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 62
cctctgctaa ccatgttcat gccttcttct ttttcctaca gctcctgggc aacgtgctgg 60
ttattgtgct gtctcatcat tttggcaaag aattc 95
<210> 63
<211> 1356
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 63
atgtccaccg ctgtgctgga gaaccctggg ctggggagga aactgtcaga cttcgggcag 60
gagacttcat acattgagga taactgtaac cagaatggcg ccatctctct gatcttcagc 120
ctgaaggagg aagtgggcgc cctggcaaag gtgctgcgcc tgtttgagga gaacgacgtg 180
aatctgaccc acatcgagtc ccggccttct agactgaaga aggacgagta cgagttcttt 240
acccacctgg ataagcggtc cctgccagcc ctgacaaaca tcatcaagat cctgaggcac 300
gacatcggag caaccgtgca cgagctgtct cgggacaaga agaaggatac cgtgccctgg 360
ttccctcgga caatccagga gctggataga tttgccaacc agatcctgtc ttacggagca 420
gagctggacg cagatcaccc tggcttcaag gacccagtgt atcgggcccg gagaaagcag 480
tttgccgata tcgcctacaa ttataggcac ggacagccaa tccctcgcgt ggagtatatg 540
gaggaggaga agaagacctg gggcacagtg ttcaagaccc tgaagagcct gtacaagaca 600
cacgcctgct acgagtataa ccacatcttc cccctgctgg agaagtattg tggctttcac 660
gaggacaata tccctcagct ggaggacgtg agccagttcc tgcagacctg cacaggcttt 720
aggctgaggc cagtggcagg actgctgagc tcccgggact tcctgggagg actggccttc 780
agagtgtttc actgcaccca gtacatcagg cacggctcca agccaatgta tacaccagag 840
cccgacatct gtcacgagct gctgggccac gtgcccctgt ttagcgatag atccttcgcc 900
cagttttccc aggagatcgg actggcatct ctgggagcac ctgacgagta catcgagaag 960
ctggccacca tctattggtt cacagtggag tttggcctgt gcaagcaggg cgatagcatc 1020
aaggcctacg gagcaggact gctgtctagc ttcggcgagc tgcagtattg tctgtccgag 1080
aagccaaagc tgctgcccct ggagctggag aagaccgcca tccagaacta caccgtgaca 1140
gagttccagc ccctgtacta tgtggccgag tcttttaacg atgccaagga gaaggtgaga 1200
aatttcgccg ccacaatccc taggcccttc agcgtgcggt acgaccctta tacccagagg 1260
atcgaggtgc tggataatac acagcagctg aagatcctgg ctgactcaat caatagcgaa 1320
atcggaatcc tgtgctccgc cctgcagaaa atcaaa 1356
<210> 64
<211> 1873
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 64
gatcttcaat attggccatt agccatatta ttcattggtt atatagcata aatcaatatt 60
ggctattggc cattgcatac gttgtatcta tatcataata tgtacattta tattggctca 120
tgtccaatat gaccgccatg ttggcattga ttattgacta gttattaata gtaatcaatt 180
acggggtcat tagttcatag cccatatatg gagttccgcg ttacataact tacggtaaat 240
ggcccgcctg gctgaccgcc caacgacccc cgcccattga cgtcaataat gacgtatgtt 300
cccatagtaa cgccaatagg gactttccat tgacgtcaat gggtggagta tttacggtaa 360
actgcccact tggcagtaca tcaagtgtat catatgccaa gtccgccccc tattgacgtc 420
aatgacggta aatggcccgc ctggcattat gcccagtaca tgaccttacg ggactttcct 480
acttggcagt acatctacgt attagtcatc gctattacca tggtcgaggt gagccccacg 540
ttctgcttca ctctccccat ctcccccccc tccccacccc caattttgta tttatttatt 600
ttttaattat tttgtgcagc gatgggggcg gggggggggg gggggcgcgc gccaggcggg 660
gcggggcggg gcgaggggcg gggcggggcg aggcggagag gtgcggcggc agccaatcag 720
agcggcgcgc tccgaaagtt tccttttatg gcgaggcggc ggcggcggcg gccctataaa 780
aagcgaagcg cgcggcgggc gggagtcgct gcgacgctgc cttcgccccg tgccccgctc 840
cgccgccgcc tcgcgccgcc cgccccggct ctgactgacc gcgttactcc cacaggtgag 900
cgggcgggac ggcccttctc ctccgggctg taattagcgc ttggtttaat gacggcttgt 960
ttcttttctg tggctgcgtg aaagccttga ggggctccgg gagggccctt tgtgcggggg 1020
ggagcggctc ggggggtgcg tgcgtgtgtg tgtgcgtggg gagcgccgcg tgcggcccgc 1080
gctgcccggc ggctgtgagc gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt 1140
gcgcgagggg agcgcggccg ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa 1200
caaaggctgc gtgcggggtg tgtgcgtggg ggggtgagca gggggtgtgg gcgcggcggt 1260
cgggctgtaa cccccccctg cacccccctc cccgagttgc tgagcacggc ccggcttcgg 1320
gtgcggggct ccgtacgggg cgtggcgcgg ggctcgccgt gccgggcggg gggtggcggc 1380
aggtgggggt gccgggcggg gcggggccgc ctcgggccgg ggagggctcg ggggaggggc 1440
gcggcggccc ccggagcgcc ggcggctgtc gaggcgcggc gagccgcagc cattgccttt 1500
tatggtaatc gtgcgagagg gcgcagggac ttcctttgtc ccaaatctgt gcggagccga 1560
aatctgggag gcgccgccgc accccctcta gcgggcgcgg ggcgaagcgg tgcggcgccg 1620
gcaggaagga aatgggcggg gagggccttc gtgcgtcgcc gcgccgccgt ccccttctcc 1680
ctctccagcc tcggggctgt ccgcgggggg acggctgcct tcggggggga cggggcaggg 1740
cggggttcgg cttctggcgt gtgaccggcg gctctagagc ctctgctaac catgttcatg 1800
ccttcttctt tttcctacag ctcctgggca acgtgctggt tattgtgctg tctcatcatt 1860
ttggcaaaga att 1873
<210> 65
<211> 1061
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 65
tagggaggtc ctgcacgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 60
cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac 120
tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca 180
agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg 240
gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt 300
agtcatcgct attaccatgg tcgaggtgag ccccacgttc tgcttcactc tccccatctc 360
ccccccctcc ccacccccaa ttttgtattt atttattttt taattatttt gtgcagcgat 420
gggggcgggg gggggggggg gcgcgcgcca ggcggggcgg ggcggggcga ggggcggggc 480
ggggcgaggc ggagaggtgc ggcggcagcc aatcagagcg gcgcgctccg aaagtttcct 540
tttatggcga ggcggcggcg gcggcggccc tataaaaagc gaagcgcgcg gcgggcggga 600
gtcgctgcgc gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc 660
cggctctgac tgaccgcgtt actaaaacag gtaagtccgg cctccgcgcc gggttttggc 720
gcctcccgcg ggcgcccccc tcctcacggc gagcgctgcc acgtcagacg aagggcgcag 780
cgagcgtcct gatccttccg cccggacgct caggacagcg gcccgctgct cataagactc 840
ggccttagaa ccccagtatc agcagaagga cattttagga cgggacttgg gtgactctag 900
ggcactggtt ttctttccag agagcggaac aggcgaggaa aagtagtccc ttctcggcga 960
ttctgcggag ggatctccgt ggggcggtga acgccgatga tgcctctact aaccatgttc 1020
atgttttctt tttttttcta caggtcctgg gtgacgaaca g 1061
<210> 66
<211> 170
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 66
cgatgctcta atctctctag acaaggttca tatttgtatg ggttacttat tctctctttg 60
ttgactaagt caataatcag aatcagcagg tttgcagtca gattggcagg gataagcagc 120
ctagctcagg agaagtgagt ataaaagccc caggctggga gcagccatca 170
<210> 67
<211> 254
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 67
gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg 60
ggctaagtcc acctcgagcc atggcgatgc tctaatctct ctagacaagg ttcatatttg 120
tatgggttac ttattctctc tttgttgact aagtcaataa tcagaatcag caggtttgca 180
gtcagattgg cagggataag cagcctagct caggagaagt gagtataaaa gccccaggct 240
gggagcagcc atca 254
<210> 68
<211> 592
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 68
gtaaatttta tggaatgtga atcataattc aatttttcaa catgcgttag gagggacatt 60
tcaaactctt ttttacccta gactttccta ccatcaccca gagtatccag ccaggagggg 120
aggggctaga gacaccagaa gtttagcagg gaggagggcg tagggattcg gggaatgaag 180
ggatgggatt cagactaggg ccaggaccca gggatggaga gaaagagatg agagtggttt 240
gggggcttgg tgacttagag aacagagctg caggctcaga ggcacacagg agtttctggg 300
ctcaccctgc ccccttccaa cccctcagtt cccatcctcc agcagctgtt tgtgtgctgc 360
ctctgaagtc cacactgaac aaacttcagc ctactcatgt ccctaaaatg ggcaaacatt 420
gcaagcagca aacagcaaac acacagccct ccctgcctgc tgaccttgga gctggggcag 480
aggtcagaga cctctctggg cccatgccac ctccaacatc cactcgaccc cttggaattt 540
cggtggagag gagcagaggt tgtcctggcg tggtttaggt agtgtgagag gg 592
<210> 69
<211> 205
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 69
aatgactcct ttcggtaagt gcagtggaag ctgtacactg cccaggcaaa gcgtccgggc 60
agcgtaggcg ggcgactcag atcccagcca gtggacttag cccctgtttg ctcctccgat 120
aactggggtg accttggtta atattcacca gcagcctccc ccgttgcccc tctggatcca 180
ctgcttaaat acggacgagg acagg 205
<210> 70
<211> 423
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 70
gctctaaccc actctgatct cccagggcgg cagtaagtct tcagcatcag gcattttggg 60
gtgactcagt aaatggtaga tcttgctacc agtggaacag ccactaagga ttctgcagtg 120
agagcagagg gccagctaag tggtactctc ccagagactg tctgactcac gccaccccct 180
ccaccttgga cacaggacgc tgtggtttct gagccaggta caatgactcc tttcggtaag 240
tgcagtggaa gctgtacact gcccaggcaa agcgtccggg cagcgtaggc gggcgactca 300
gatcccagcc agtggactta gcccctgttt gctcctccga taactggggt gaccttggtt 360
aatattcacc agcagcctcc cccgttgccc ctctggatcc actgcttaaa tacggacgag 420
gac 423
<210> 71
<211> 72
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 71
gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg 60
ggctaagtcc ac 72
<210> 72
<211> 913
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 72
tagggaggtc ctgcacagaa ggggaggagg gggcagcagc tgtctgacca ctgttggtct 60
tgcaacttgt gtccccaggt taatttttaa aaagcagtca aaagtccaag tggcccttgg 120
cagcatttac tctctctgtt tgctctggtt aataatctca ggagcacaaa cattcctgga 180
ggcaggagaa gaaatcaaca tcctggactt atcctctggg cctctcccca cccccaggat 240
tgtaactgaa atgcttcact ggtgctcctt ttgttttaag gcattggatc ttcatagcta 300
ctgatcgtgc ccaagcacac agtatctgca gcaaccactt aggcctccag gaatgtggtg 360
accattgacc ctaattcatt ccccttcatg gatcctatgt aaccatcctc caaaaagagc 420
tttcgcaaac tcaaataaac acaggaaagg aagaccttct tatctttgag agtatatgtt 480
tagccctata gctctaaccc actctgatct cccagggcgg cagtaagtct tcagcatcag 540
gcattttggg gtgactcagt aaatggtaga tcttgctacc agtggaacag ccactaagga 600
ttctgcagtg agagcagagg gccagctaag tggtactctc ccagagactg tctgactcac 660
gccaccccct ccaccttgga cacaggacgc tgtggtttct gagccaggta caatgactcc 720
tttcggtaag tgcagtggaa gctgtacact gcccaggcaa agcgtccggg cagcgtaggc 780
gggcgactca gatcccagcc agtggactta gcccctgttt gctcctccga taactggggt 840
gaccttggtt aatattcacc agcagcctcc cccgttgccc ctctggatcc actgcttaaa 900
tacggacgag gac 913
<210> 73
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 73
gtagataagt agcatggcgg gttaatcatt aactaca 37
<210> 74
<211> 46
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 74
ggaggggtgg agtcgtgacg tgaattacgt catagggtta gggagg 46
<210> 75
<211> 182
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 75
gtagataagt agcatggcgg gttaatcatt aactacaagg aacccctagt gatggagttg 60
gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga 120
cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc 180
aa 182
<210> 76
<211> 191
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 76
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag g 191
<210> 77
<211> 3230
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 77
agcattagct tccatttatg cagtgtaaat ggtgagaaca gccccgactg aatacccaga 60
gcatcatctc gtctgtgtca ttcatgcaca taacatatct cagcgaggtg gcccttctgt 120
cctctttgca gagacccagc caccatacta gtacctagag aactggctgg atttcagccc 180
cgatacctcc gggcttttgc tcatgttcgc ctcatagggt catctgggtg gttgcctaag 240
gaaaagtatg tcatggagac taacttgctt ggcattgaat aaaaggtgag ttgagagtgg 300
agcgtgttta aattgcaatc ctgcctctat ttctgtgctt gcagggaaca gtcatcctta 360
attgctatcc tccatcatca tcatgattat ttctggtttt tctctggttg cggagaatcc 420
atactccagg tattccaatg tctcagcatt gccaggcctg tctgagcgtc aggatgtagg 480
tagtctgggc tctctgcctt ctattcttgt ccaggatact ctgccaaaag aatcatgttg 540
tggctgccac ccctcccaca aagcctcccg cttgggtcag tccaggactg gagttgggta 600
tggactgttc atgtctatcc actgctacgt cagggcaaca cccactgaga gtgaccttgt 660
agactgcagt gggagacacc cttcaaaacc tctcctctcc tgtcctgaga gccaggttaa 720
aaccatcagc cccgcatcct gagtgcaaac ttttcctaac cctgctgcta agctagacac 780
ctcacttact gagagccagc atgtccaccg ctgtgctgga gaaccctggg ctggggagga 840
aactgtcaga cttcgggcag gagacttcat acattgagga taactgtaac cagaatggcg 900
ccatctctct gatcttcagc ctgaaggagg aagtgggcgc cctggcaaag gtgctgcgcc 960
tgtttgagga gaacgacgtg aatctgaccc acatcgagtc ccggccttct agactgaaga 1020
aggacgagta cgagttcttt acccacctgg ataagcggtc cctgccagcc ctgacaaaca 1080
tcatcaagat cctgaggcac gacatcggag caaccgtgca cgagctgtct cgggacaaga 1140
agaaggatac cgtgccctgg ttccctcgga caatccagga gctggataga tttgccaacc 1200
agatcctgtc ttacggagca gagctggacg cagatcaccc tggcttcaag gacccagtgt 1260
atcgggcccg gagaaagcag tttgccgata tcgcctacaa ttataggcac ggacagccaa 1320
tccctcgcgt ggagtatatg gaggaggaga agaagacctg gggcacagtg ttcaagaccc 1380
tgaagagcct gtacaagaca cacgcctgct acgagtataa ccacatcttc cccctgctgg 1440
agaagtattg tggctttcac gaggacaata tccctcagct ggaggacgtg agccagttcc 1500
tgcagacctg cacaggcttt aggctgaggc cagtggcagg actgctgagc tcccgggact 1560
tcctgggagg actggccttc agagtgtttc actgcaccca gtacatcagg cacggctcca 1620
agccaatgta tacaccagag cccgacatct gtcacgagct gctgggccac gtgcccctgt 1680
ttagcgatag atccttcgcc cagttttccc aggagatcgg actggcatct ctgggagcac 1740
ctgacgagta catcgagaag ctggccacca tctattggtt cacagtggag tttggcctgt 1800
gcaagcaggg cgatagcatc aaggcctacg gagcaggact gctgtctagc ttcggcgagc 1860
tgcagtattg tctgtccgag aagccaaagc tgctgcccct ggagctggag aagaccgcca 1920
tccagaacta caccgtgaca gagttccagc ccctgtacta tgtggccgag tcttttaacg 1980
atgccaagga gaaggtgaga aatttcgccg ccacaatccc taggcccttc agcgtgcggt 2040
acgaccctta tacccagagg atcgaggtgc tggataatac acagcagctg aagatcctgg 2100
ctgactcaat caatagcgaa atcggaatcc tgtgctccgc cctgcagaaa atcaaatgag 2160
aattcaaggc ctctcgagcc tctagaacta tagtgagtcg tattacgtag atccagacat 2220
gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 2280
tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 2340
agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 2400
tttttaagct ttacgtacga tcgtcgagca gctgttgtcc tggagaacgg agtcctgagc 2460
agaaaactct cagactttgg gcaggtaagc ctgttgggct tccactgcta ggagagaatt 2520
ggttccccac atgtgaaagc agtctgggaa atgctggtat ttccagtctc ctaaggctac 2580
taagaaatat gactttattt agaggcgagg aaaatgccca ggaagtcaac tgatgagact 2640
agtcttaaca agttgaggat acagaaagtt ggggatctga gctgctacca acatctgtgt 2700
gtctttgggt ggctcattgg tatcctctgc ctattggctt tatcttctgt acactgaaag 2760
gaaatggctg gtccttagtc acctggggtg ggagtcccta tctctccagg gatacttatt 2820
caatcctttc ttctgggtat caaaatgaca agcttgtaag aaactgtcct ctttcggctt 2880
tcaggaggtg atgtcgcatg aagagaattt gggggggggg acttactcag aaccaaggag 2940
ggagaaatta aacagagagg gaaatgaaca ggagttagcc cggagcctga agcaccttgg 3000
ggattatgct gggggtggag ggaatccatt gtcctcccta gggagggctt gcagaacatg 3060
ttcttttctg tgatatttgt actttcccca gattgcaaat catggtttgt acactgagat 3120
tcagtctctg gaggtaatat gccttttcta gcttttcctt ggacaggact aaggggttga 3180
gggttgcctg gagtcagaga aattaactgt gttaaagaag gttgatatga 3230
<210> 78
<211> 3637
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 78
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag gtcctgcata tgcggccgca gcattagctt ccatttatgc agtgtaaatg 240
gtgagaacag ccccgactga atacccagag catcatctcg tctgtgtcat tcatgcacat 300
aacatatctc agcgaggtgg cccttctgtc ctctttgcag agacccagcc accatactag 360
tacctagaga actggctgga tttcagcccc gatacctccg ggcttttgct catgttcgcc 420
tcatagggtc atctgggtgg ttgcctaagg aaaagtatgt catggagact aacttgcttg 480
gcattgaata aaaggtgagt tgagagtgga gcgtgtttaa attgcaatcc tgcctctatt 540
tctgtgcttg cagggaacag tcatccttaa ttgctatcct ccatcatcat catgattatt 600
tctggttttt ctctggttgc ggagaatcca tactccaggt attccaatgt ctcagcattg 660
ccaggcctgt ctgagcgtca ggatgtaggt agtctgggct ctctgccttc tattcttgtc 720
caggatactc tgccaaaaga atcatgttgt ggctgccacc cctcccacaa agcctcccgc 780
ttgggtcagt ccaggactgg agttgggtat ggactgttca tgtctatcca ctgctacgtc 840
agggcaacac ccactgagag tgaccttgta gactgcagtg ggagacaccc ttcaaaacct 900
ctcctctcct gtcctgagag ccaggttaaa accatcagcc ccgcatcctg agtgcaaact 960
tttcctaacc ctgctgctaa gctagacacc tcacttactg agagccagca tgtccaccgc 1020
tgtgctggag aaccctgggc tggggaggaa actgtcagac ttcgggcagg agacttcata 1080
cattgaggat aactgtaacc agaatggcgc catctctctg atcttcagcc tgaaggagga 1140
agtgggcgcc ctggcaaagg tgctgcgcct gtttgaggag aacgacgtga atctgaccca 1200
catcgagtcc cggccttcta gactgaagaa ggacgagtac gagttcttta cccacctgga 1260
taagcggtcc ctgccagccc tgacaaacat catcaagatc ctgaggcacg acatcggagc 1320
aaccgtgcac gagctgtctc gggacaagaa gaaggatacc gtgccctggt tccctcggac 1380
aatccaggag ctggatagat ttgccaacca gatcctgtct tacggagcag agctggacgc 1440
agatcaccct ggcttcaagg acccagtgta tcgggcccgg agaaagcagt ttgccgatat 1500
cgcctacaat tataggcacg gacagccaat ccctcgcgtg gagtatatgg aggaggagaa 1560
gaagacctgg ggcacagtgt tcaagaccct gaagagcctg tacaagacac acgcctgcta 1620
cgagtataac cacatcttcc ccctgctgga gaagtattgt ggctttcacg aggacaatat 1680
ccctcagctg gaggacgtga gccagttcct gcagacctgc acaggcttta ggctgaggcc 1740
agtggcagga ctgctgagct cccgggactt cctgggagga ctggccttca gagtgtttca 1800
ctgcacccag tacatcaggc acggctccaa gccaatgtat acaccagagc ccgacatctg 1860
tcacgagctg ctgggccacg tgcccctgtt tagcgataga tccttcgccc agttttccca 1920
ggagatcgga ctggcatctc tgggagcacc tgacgagtac atcgagaagc tggccaccat 1980
ctattggttc acagtggagt ttggcctgtg caagcagggc gatagcatca aggcctacgg 2040
agcaggactg ctgtctagct tcggcgagct gcagtattgt ctgtccgaga agccaaagct 2100
gctgcccctg gagctggaga agaccgccat ccagaactac accgtgacag agttccagcc 2160
cctgtactat gtggccgagt cttttaacga tgccaaggag aaggtgagaa atttcgccgc 2220
cacaatccct aggcccttca gcgtgcggta cgacccttat acccagagga tcgaggtgct 2280
ggataataca cagcagctga agatcctggc tgactcaatc aatagcgaaa tcggaatcct 2340
gtgctccgcc ctgcagaaaa tcaaatgaga attcaaggcc tctcgagcct ctagaactat 2400
agtgagtcgt attacgtaga tccagacatg ataagataca ttgatgagtt tggacaaacc 2460
acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa tttgtgatgc tattgcttta 2520
tttgtaacca ttataagctg caataaacaa gttaacaaca acaattgcat tcattttatg 2580
tttcaggttc agggggaggt gtgggaggtt ttttaagctt tacgtacgat cgtcgagcag 2640
ctgttgtcct ggagaacgga gtcctgagca gaaaactctc agactttggg caggtaagcc 2700
tgttgggctt ccactgctag gagagaattg gttccccaca tgtgaaagca gtctgggaaa 2760
tgctggtatt tccagtctcc taaggctact aagaaatatg actttattta gaggcgagga 2820
aaatgcccag gaagtcaact gatgagacta gtcttaacaa gttgaggata cagaaagttg 2880
gggatctgag ctgctaccaa catctgtgtg tctttgggtg gctcattggt atcctctgcc 2940
tattggcttt atcttctgta cactgaaagg aaatggctgg tccttagtca cctggggtgg 3000
gagtccctat ctctccaggg atacttattc aatcctttct tctgggtatc aaaatgacaa 3060
gcttgtaaga aactgtcctc tttcggcttt caggaggtga tgtcgcatga agagaatttg 3120
ggggggggga cttactcaga accaaggagg gagaaattaa acagagaggg aaatgaacag 3180
gagttagccc ggagcctgaa gcaccttggg gattatgctg ggggtggagg gaatccattg 3240
tcctccctag ggagggcttg cagaacatgt tcttttctgt gatatttgta ctttccccag 3300
attgcaaatc atggtttgta cactgagatt cagtctctgg aggtaatatg ccttttctag 3360
cttttccttg gacaggacta aggggttgag ggttgcctgg agtcagagaa atttgtgtta 3420
aagaaggttg atatgaaacc tgcaggtcta gatacgtaga taagtagcat ggcgggttaa 3480
tcattaacta caaggaaccc ctagtgatgg agttggccac tccctctctg cgcgctcgct 3540
cgctcactga ggccgggcga ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct 3600
cagtgagcga gcgagcgcgc agagagggag tggccaa 3637
<210> 79
<211> 3776
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 79
agcattagct tccatttatg cagtgtaaat ggtgagaaca gccccgactg aatacccaga 60
gcatcatctc gtctgtgtca ttcatgcaca taacatatct cagcgaggtg gcccttctgt 120
cctctttgca gagacccagc caccatacta gtacctagag aactggctgg atttcagccc 180
cgatacctcc gggcttttgc tcatgttcgc ctcatagggt catctgggtg gttgcctaag 240
gaaaagtatg tcatggagac taacttgctt ggcattgaat aaaaggtgag ttgagagtgg 300
agcgtgttta aattgcaatc ctgcctctat ttctgtgctt gcagggaaca gtcatcctta 360
attgctatcc tccatcatca tcatgattat ttctggtttt tctctggttg cggagaatcc 420
atactccagg tattccaatg tctcagcatt gccaggcctg tctgagcgtc aggatgtagg 480
tagtctgggc tctctgcctt ctattcttgt ccaggatact ctgccaaaag aatcatgttg 540
tggctgccac ccctcccaca aagcctcccg cttgggtcag tccaggactg gagttgggta 600
tggactgttc atgtctatcc actgctacgt cagggcaaca cccactgaga gtgaccttgt 660
agactgcagt gggagacacc cttcaaaacc tctcctctcc tgtcctgaga gccaggttaa 720
aaccatcagc cccgcatcct gagtgcaaac ttttcctaac cctgctgcta agctagacac 780
cccacttact gagagccagc ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac 840
acacagccct ccctgcctgc tgaccttgga gctggggcag aggtcagaga cctctctggg 900
cccatgccac ctccaacatc cactcgaccc cttggaattt cggtggagag gagcagaggt 960
tgtcctggcg tggtttaggt agtgtgagag gggaatgact cctttcggta agtgcagtgg 1020
aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag 1080
ccagtggact tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca 1140
ccagcagcct cccccgttgc ccctctggat ccactgctta aatacggacg aggacagggc 1200
cctgtctcct cagcttcagg caccaccact gacctgggac agtgaatcct ctaaggtaaa 1260
tataaaattt ttaagtgtat aatgtgttaa actactgatt ctaattgttt ctctctttta 1320
gattccaacc tttggaactg accgccacca tgtccaccgc tgtgctggag aaccctgggc 1380
tggggaggaa actgtcagac ttcgggcagg agacttcata cattgaggat aactgtaacc 1440
agaatggcgc catctctctg atcttcagcc tgaaggagga agtgggcgcc ctggcaaagg 1500
tgctgcgcct gtttgaggag aacgacgtga atctgaccca catcgagtcc cggccttcta 1560
gactgaagaa ggacgagtac gagttcttta cccacctgga taagcggtcc ctgccagccc 1620
tgacaaacat catcaagatc ctgaggcacg acatcggagc aaccgtgcac gagctgtctc 1680
gggacaagaa gaaggatacc gtgccctggt tccctcggac aatccaggag ctggatagat 1740
ttgccaacca gatcctgtct tacggagcag agctggacgc agatcaccct ggcttcaagg 1800
acccagtgta tcgggcccgg agaaagcagt ttgccgatat cgcctacaat tataggcacg 1860
gacagccaat ccctcgcgtg gagtatatgg aggaggagaa gaagacctgg ggcacagtgt 1920
tcaagaccct gaagagcctg tacaagacac acgcctgcta cgagtataac cacatcttcc 1980
ccctgctgga gaagtattgt ggctttcacg aggacaatat ccctcagctg gaggacgtga 2040
gccagttcct gcagacctgc acaggcttta ggctgaggcc agtggcagga ctgctgagct 2100
cccgggactt cctgggagga ctggccttca gagtgtttca ctgcacccag tacatcaggc 2160
acggctccaa gccaatgtat acaccagagc ccgacatctg tcacgagctg ctgggccacg 2220
tgcccctgtt tagcgataga tccttcgccc agttttccca ggagatcgga ctggcatctc 2280
tgggagcacc tgacgagtac atcgagaagc tggccaccat ctattggttc acagtggagt 2340
ttggcctgtg caagcagggc gatagcatca aggcctacgg agcaggactg ctgtctagct 2400
tcggcgagct gcagtattgt ctgtccgaga agccaaagct gctgcccctg gagctggaga 2460
agaccgccat ccagaactac accgtgacag agttccagcc cctgtactat gtggccgagt 2520
cttttaacga tgccaaggag aaggtgagaa atttcgccgc cacaatccct aggcccttca 2580
gtgtgcgtta cgacccttat acccagagga tcgaggtgct ggataataca cagcagctga 2640
agatcctggc tgactcaatc aatagcgaaa tcggaatcct gtgctccgcc ctgcagaaaa 2700
tcaaatgaga attcaaggcc tctcgagcct ctagaactat agtgagtcgt attacgtaga 2760
tccagacatg ataagataca ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa 2820
aaaatgcttt atttgtgaaa tttgtgatgc tattgcttta tttgtaacca ttataagctg 2880
caataaacaa gttaacaaca acaattgcat tcattttatg tttcaggttc agggggaggt 2940
gtgggaggtt ttttaagctt tacgtacgat cgtcgagcag ctgttgtcct ggagaacgga 3000
gtcctgagca gaaaactctc agactttggg caggtaagcc tgttgggctt ccactgctag 3060
gagagaattg gttccccaca tgtgaaagca gtctgggaaa tgctggtatt tccagtctcc 3120
taaggctact aagaaatatg actttattta gaggcgagga aaatgcccag gaagtcaact 3180
gatgagacta gtcttaacaa gttgaggata cagaaagttg gggatctgag ctgctaccaa 3240
catctgtgtg tctttgggtg gctcattggt atcctctgcc tattggcttt atcttctgta 3300
cactgaaagg aaatggctgg tccttagtca cctggggtgg gagtccctat ctctccaggg 3360
atacttattc aatcctttct tctgggtatc aaaatgacaa gcttgtaaga aactgtcctc 3420
tttcggcttt caggaggtga tgtcgcatga agagaatttg ggggggggga cttactcaga 3480
accaaggagg gagaaattaa acagagaggg aaatgaacag gagttagccc ggagcctgaa 3540
gcaccttggg gattatgctg ggggtggagg gaatccattg tcctccctag ggagggcttg 3600
cagaacatgt tcttttctgt gatatttgta ctttccccag attgcaaatc atggtttgta 3660
cactgagatt cagtctctgg aggtaatatg ccttttctag cttttccttg gacaggacta 3720
aggggttgag ggttgcctgg agtcagagaa atttgtgtta aagaaggttg atatga 3776
<210> 80
<211> 4186
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 80
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag gtcctgcata tgcggccgca gcattagctt ccatttatgc agtgtaaatg 240
gtgagaacag ccccgactga atacccagag catcatctcg tctgtgtcat tcatgcacat 300
aacatatctc agcgaggtgg cccttctgtc ctctttgcag agacccagcc accatactag 360
tacctagaga actggctgga tttcagcccc gatacctccg ggcttttgct catgttcgcc 420
tcatagggtc atctgggtgg ttgcctaagg aaaagtatgt catggagact aacttgcttg 480
gcattgaata aaaggtgagt tgagagtgga gcgtgtttaa attgcaatcc tgcctctatt 540
tctgtgcttg cagggaacag tcatccttaa ttgctatcct ccatcatcat catgattatt 600
tctggttttt ctctggttgc ggagaatcca tactccaggt attccaatgt ctcagcattg 660
ccaggcctgt ctgagcgtca ggatgtaggt agtctgggct ctctgccttc tattcttgtc 720
caggatactc tgccaaaaga atcatgttgt ggctgccacc cctcccacaa agcctcccgc 780
ttgggtcagt ccaggactgg agttgggtat ggactgttca tgtctatcca ctgctacgtc 840
agggcaacac ccactgagag tgaccttgta gactgcagtg ggagacaccc ttcaaaacct 900
ctcctctcct gtcctgagag ccaggttaaa accatcagcc ccgcatcctg agtgcaaact 960
tttcctaacc ctgctgctaa gctagacacc ccacttactg agagccagcc cctaaaatgg 1020
gcaaacattg caagcagcaa acagcaaaca cacagccctc cctgcctgct gaccttggag 1080
ctggggcaga ggtcagagac ctctctgggc ccatgccacc tccaacatcc actcgacccc 1140
ttggaatttc ggtggagagg agcagaggtt gtcctggcgt ggtttaggta gtgtgagagg 1200
ggaatgactc ctttcggtaa gtgcagtgga agctgtacac tgcccaggca aagcgtccgg 1260
gcagcgtagg cgggcgactc agatcccagc cagtggactt agcccctgtt tgctcctccg 1320
ataactgggg tgaccttggt taatattcac cagcagcctc ccccgttgcc cctctggatc 1380
cactgcttaa atacggacga ggacagggcc ctgtctcctc agcttcaggc accaccactg 1440
acctgggaca gtgaatcctc taaggtaaat ataaaatttt taagtgtata atgtgttaaa 1500
ctactgattc taattgtttc tctcttttag attccaacct ttggaactga ccgccaccat 1560
gtccaccgct gtgctggaga accctgggct ggggaggaaa ctgtcagact tcgggcagga 1620
gacttcatac attgaggata actgtaacca gaatggcgcc atctctctga tcttcagcct 1680
gaaggaggaa gtgggcgccc tggcaaaggt gctgcgcctg tttgaggaga acgacgtgaa 1740
tctgacccac atcgagtccc ggccttctag actgaagaag gacgagtacg agttctttac 1800
ccacctggat aagcggtccc tgccagccct gacaaacatc atcaagatcc tgaggcacga 1860
catcggagca accgtgcacg agctgtctcg ggacaagaag aaggataccg tgccctggtt 1920
ccctcggaca atccaggagc tggatagatt tgccaaccag atcctgtctt acggagcaga 1980
gctggacgca gatcaccctg gcttcaagga cccagtgtat cgggcccgga gaaagcagtt 2040
tgccgatatc gcctacaatt ataggcacgg acagccaatc cctcgcgtgg agtatatgga 2100
ggaggagaag aagacctggg gcacagtgtt caagaccctg aagagcctgt acaagacaca 2160
cgcctgctac gagtataacc acatcttccc cctgctggag aagtattgtg gctttcacga 2220
ggacaatatc cctcagctgg aggacgtgag ccagttcctg cagacctgca caggctttag 2280
gctgaggcca gtggcaggac tgctgagctc ccgggacttc ctgggaggac tggccttcag 2340
agtgtttcac tgcacccagt acatcaggca cggctccaag ccaatgtata caccagagcc 2400
cgacatctgt cacgagctgc tgggccacgt gcccctgttt agcgatagat ccttcgccca 2460
gttttcccag gagatcggac tggcatctct gggagcacct gacgagtaca tcgagaagct 2520
ggccaccatc tattggttca cagtggagtt tggcctgtgc aagcagggcg atagcatcaa 2580
ggcctacgga gcaggactgc tgtctagctt cggcgagctg cagtattgtc tgtccgagaa 2640
gccaaagctg ctgcccctgg agctggagaa gaccgccatc cagaactaca ccgtgacaga 2700
gttccagccc ctgtactatg tggccgagtc ttttaacgat gccaaggaga aggtgagaaa 2760
tttcgccgcc acaatcccta ggcccttcag tgtgcgttac gacccttata cccagaggat 2820
cgaggtgctg gataatacac agcagctgaa gatcctggct gactcaatca atagcgaaat 2880
cggaatcctg tgctccgccc tgcagaaaat caaatgagaa ttcaaggcct ctcgagcctc 2940
tagaactata gtgagtcgta ttacgtagat ccagacatga taagatacat tgatgagttt 3000
ggacaaacca caactagaat gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct 3060
attgctttat ttgtaaccat tataagctgc aataaacaag ttaacaacaa caattgcatt 3120
cattttatgt ttcaggttca gggggaggtg tgggaggttt tttaagcttt acgtacgatc 3180
gtcgagcagc tgttgtcctg gagaacggag tcctgagcag aaaactctca gactttgggc 3240
aggtaagcct gttgggcttc cactgctagg agagaattgg ttccccacat gtgaaagcag 3300
tctgggaaat gctggtattt ccagtctcct aaggctacta agaaatatga ctttatttag 3360
aggcgaggaa aatgcccagg aagtcaactg atgagactag tcttaacaag ttgaggatac 3420
agaaagttgg ggatctgagc tgctaccaac atctgtgtgt ctttgggtgg ctcattggta 3480
tcctctgcct attggcttta tcttctgtac actgaaagga aatggctggt ccttagtcac 3540
ctggggtggg agtccctatc tctccaggga tacttattca atcctttctt ctgggtatca 3600
aaatgacaag cttgtaagaa actgtcctct ttcggctttc aggaggtgat gtcgcatgaa 3660
gagaatttgg ggggggggac ttactcagaa ccaaggaggg agaaattaaa cagagaggga 3720
aatgaacagg agttagcccg gagcctgaag caccttgggg attatgctgg gggtggaggg 3780
aatccattgt cctccctagg gagggcttgc agaacatgtt cttttctgtg atatttgtac 3840
tttccccaga ttgcaaatca tggtttgtac actgagattc agtctctgga ggtaatatgc 3900
cttttctagc ttttccttgg acaggactaa ggggttgagg gttgcctgga gtcagagaaa 3960
tttgtgttaa agaaggttga tatgaaacct gcaggtctag atacgtagat aagtagcatg 4020
gcgggttaat cattaactac aaggaacccc tagtgatgga gttggccact ccctctctgc 4080
gcgctcgctc gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc 4140
gggcggcctc agtgagcgag cgagcgcgca gagagggagt ggccaa 4186
<210> 81
<211> 3713
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 81
gcttcaggag cagttgtgcg aatagctgga gaacaccagg ctggatttaa acccagatcg 60
ctcttacatt tgctctttac ctgctgtgct cagcgttcac gtgccctcta gctgtagttt 120
tctgaagtca gcgcacagca aggcagtgtg cttagaggtt aacagaaggg aaaacaacaa 180
caacaaaaat ctaaatgaga atcctgactg tttcagctgg gggtaagggg ggcggattat 240
tcatataatt gttataccag acggtcgcag gcttagtcca attgcagaga actcgcttcc 300
caggcttctg agagtcccgg aagtgcctaa acctgtctaa tcgacggggc ttgggtggcc 360
cgtcgctccc tggcttcttc cctttaccca gggcgggcag cgaagtggtg cctcctgcgt 420
cccccacacc ctccctcagc ccctcccctc cggcccgtcc tgggcaggtg acctggagca 480
tccggcaggc tgccctggcc tcctgcgtca ggacaacgcc cacgaggggc gttactgtgc 540
ggagatgcac cacgcaagag acaccctttg taactctctt ctcctcccta gtgcgaggtt 600
aaaaccttca gccccacgtg ctgtttgcaa acctgcctgt acctgaggcc ctaaaaagcc 660
agagacctca ctcccgggga gccagcatgt ccactgcggt cctggaaaac ccaggcttgg 720
gcaggaaact ctctgacttt ggacaggtga gccacggcag cctgagctgc tcagttaggg 780
gaatttgggc ctccagagaa agagatctga agactgctgg tgcttcctgg tttcataagc 840
tcagtaagaa gtctgaattc gttggaagct gatgagaata tccaggaagt caacagacaa 900
atgtcctcaa caattgtttc taagtaggag aacatctgtc ctcggtggct ttcacaggaa 960
aagcttctga cctcttctct tcctcccaca gggcggtacc agatctggca gcggagaggg 1020
cagaggaagt cttctaacat gcggtgacgt ggaggagaat cccggcccta ggggtacctc 1080
caccgctgtg ctggagaacc ctgggctggg gaggaaactg tcagacttcg ggcaggagac 1140
ttcatacatt gaggataact gtaaccagaa tggcgccatc tctctgatct tcagcctgaa 1200
ggaggaagtg ggcgccctgg caaaggtgct gcgcctgttt gaggagaacg acgtgaatct 1260
gacccacatc gagtcccggc cttctagact gaagaaggac gagtacgagt tctttaccca 1320
cctggataag cggtccctgc cagccctgac aaacatcatc aagatcctga ggcacgacat 1380
cggagcaacc gtgcacgagc tgtctcggga caagaagaag gataccgtgc cctggttccc 1440
tcggacaatc caggagctgg atagatttgc caaccagatc ctgtcttacg gagcagagct 1500
ggacgcagat caccctggct tcaaggaccc agtgtatcgg gcccggagaa agcagtttgc 1560
cgatatcgcc tacaattata ggcacggaca gccaatccct cgcgtggagt atatggagga 1620
ggagaagaag acctggggca cagtgttcaa gaccctgaag agcctgtaca agacacacgc 1680
ctgctacgag tataaccaca tcttccccct gctggagaag tattgtggct ttcacgagga 1740
caatatccct cagctggagg acgtgagcca gttcctgcag acctgcacag gctttaggct 1800
gaggccagtg gcaggactgc tgagctcccg ggacttcctg ggaggactgg ccttcagagt 1860
gtttcactgc acccagtaca tcaggcacgg ctccaagcca atgtatacac cagagcccga 1920
catctgtcac gagctgctgg gccacgtgcc cctgtttagc gatagatcct tcgcccagtt 1980
ttcccaggag atcggactgg catctctggg agcacctgac gagtacatcg agaagctggc 2040
caccatctat tggttcacag tggagtttgg cctgtgcaag cagggcgata gcatcaaggc 2100
ctacggagca ggactgctgt ctagcttcgg cgagctgcag tattgtctgt ccgagaagcc 2160
aaagctgctg cccctggagc tggagaagac cgccatccag aactacaccg tgacagagtt 2220
ccagcccctg tactatgtgg ccgagtcttt taacgatgcc aaggagaagg tgagaaattt 2280
cgccgccaca atccctaggc ccttcagcgt gcggtacgac ccttataccc agaggatcga 2340
ggtgctggat aatacacagc agctgaagat cctggctgac tcaatcaata gcgaaatcgg 2400
aatcctgtgc tccgccctgc agaaaatcaa aggtaagcct atccctaacc ctctcctcgg 2460
tctcgattct acgtgatctt gtggaaagga cgaaacaccg gggaattcaa ggcctctcga 2520
gcctctagaa tccccgagac gtttcgtctc gggatcacta tagtgagtcg tattacgtac 2580
acagtgcagg ggaaagaata gtagagatcc agacatgata agatacattg atgagtttgg 2640
acaaaccaca actagaatgc agtgaaaaaa atgctttatt tgtgaaattt gtgatgctat 2700
tgctttattt gtaaccatta taagctgcaa taaacaagtt aacaacaaca attgcattca 2760
ttttatgttt caggttcagg gggaggtgtg ggaggttttt taactgggat gggatgtgga 2820
atccttctag atttcttttg taatatttat aaagtgctct cagcaaggta tcaaaatggc 2880
aaaattgtga gtaactatcc tcctttcatt ttgggaagaa gatgaggcat gaagagaatt 2940
cagacagaaa cttactcaga ccaggggagg cagaaactaa gcagagagga aaatgaccaa 3000
gagttagccc tgggcatgga atgtgaaaga accctaaacg tgacttggaa ataatgccca 3060
aggtatattc cattctccgg gatttgttgg cattttcttg aggtgaagaa ttgcagaata 3120
cattctttaa tgtgacctac atatttaccc atgggaggaa gtctgctcct ggactcttga 3180
gattcagtca taaagcccag gccagggaaa taatgtaagt ctgcaggccc ctgtcatcag 3240
taggattagg gagaagagtt ctcagtagaa aacagggagg ctggagagaa aagaatggtt 3300
aatgttaacg ttaatataac tagaaagact gcagaactta ggactgattt ttatttgaat 3360
ccttaaaaaa aaaatttctt atgaaaatag tacatggctc ttaggagaca gaacttattg 3420
tacagaggaa cagcgtgaga gtcagagtga tcccagaaca ggtcctggct ccatcctgca 3480
catagttttg gtgctgctgg caatacggtc cccacaactg tgggaagggg ttaggggcag 3540
ggatctcatc aggaaagcat aggggtttaa agttctttat agagcactta gaagattgag 3600
aatccacaaa ttatattaat aacaaacaaa gtagtgtcgt gttatatagt aaatgtgaat 3660
ttgcagacac atttagggaa aagttataat taaaaaaata ggctgtatat ata 3713
<210> 82
<211> 4139
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 82
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag gtcctgcata tgcggccgct tcaggagcag ttgtgcgaat agctggagaa 240
caccaggctg gatttaaacc cagatcgctc ttacatttgc tctttacctg ctgtgctcag 300
cgttcacgtg ccctctagct gtagttttct gaagtcagcg cacagcaagg cagtgtgctt 360
agaggttaac agaagggaaa acaacaacaa caaaaatcta aatgagaatc ctgactgttt 420
cagctggggg taaggggggc ggattattca tataattgtt ataccagacg gtcgcaggct 480
tagtccaatt gcagagaact cgcttcccag gcttctgaga gtcccggaag tgcctaaacc 540
tgtctaatcg acggggcttg ggtggcccgt cgctccctgg cttcttccct ttacccaggg 600
cgggcagcga agtggtgcct cctgcgtccc ccacaccctc cctcagcccc tcccctccgg 660
cccgtcctgg gcaggtgacc tggagcatcc ggcaggctgc cctggcctcc tgcgtcagga 720
caacgcccac gaggggcgtt actgtgcgga gatgcaccac gcaagagaca ccctttgtaa 780
ctctcttctc ctccctagtg cgaggttaaa accttcagcc ccacgtgctg tttgcaaacc 840
tgcctgtacc tgaggcccta aaaagccaga gacctcactc ccggggagcc agcatgtcca 900
ctgcggtcct ggaaaaccca ggcttgggca ggaaactctc tgactttgga caggtgagcc 960
acggcagcct gagctgctca gttaggggaa tttgggcctc cagagaaaga gatctgaaga 1020
ctgctggtgc ttcctggttt cataagctca gtaagaagtc tgaattcgtt ggaagctgat 1080
gagaatatcc aggaagtcaa cagacaaatg tcctcaacaa ttgtttctaa gtaggagaac 1140
atctgtcctc ggtggctttc acaggaaaag cttctgacct cttctcttcc tcccacaggg 1200
cggtaccaga tctggcagcg gagagggcag aggaagtctt ctaacatgcg gtgacgtgga 1260
ggagaatccc ggccctaggg gtacctccac cgctgtgctg gagaaccctg ggctggggag 1320
gaaactgtca gacttcgggc aggagacttc atacattgag gataactgta accagaatgg 1380
cgccatctct ctgatcttca gcctgaagga ggaagtgggc gccctggcaa aggtgctgcg 1440
cctgtttgag gagaacgacg tgaatctgac ccacatcgag tcccggcctt ctagactgaa 1500
gaaggacgag tacgagttct ttacccacct ggataagcgg tccctgccag ccctgacaaa 1560
catcatcaag atcctgaggc acgacatcgg agcaaccgtg cacgagctgt ctcgggacaa 1620
gaagaaggat accgtgccct ggttccctcg gacaatccag gagctggata gatttgccaa 1680
ccagatcctg tcttacggag cagagctgga cgcagatcac cctggcttca aggacccagt 1740
gtatcgggcc cggagaaagc agtttgccga tatcgcctac aattataggc acggacagcc 1800
aatccctcgc gtggagtata tggaggagga gaagaagacc tggggcacag tgttcaagac 1860
cctgaagagc ctgtacaaga cacacgcctg ctacgagtat aaccacatct tccccctgct 1920
ggagaagtat tgtggctttc acgaggacaa tatccctcag ctggaggacg tgagccagtt 1980
cctgcagacc tgcacaggct ttaggctgag gccagtggca ggactgctga gctcccggga 2040
cttcctggga ggactggcct tcagagtgtt tcactgcacc cagtacatca ggcacggctc 2100
caagccaatg tatacaccag agcccgacat ctgtcacgag ctgctgggcc acgtgcccct 2160
gtttagcgat agatccttcg cccagttttc ccaggagatc ggactggcat ctctgggagc 2220
acctgacgag tacatcgaga agctggccac catctattgg ttcacagtgg agtttggcct 2280
gtgcaagcag ggcgatagca tcaaggccta cggagcagga ctgctgtcta gcttcggcga 2340
gctgcagtat tgtctgtccg agaagccaaa gctgctgccc ctggagctgg agaagaccgc 2400
catccagaac tacaccgtga cagagttcca gcccctgtac tatgtggccg agtcttttaa 2460
cgatgccaag gagaaggtga gaaatttcgc cgccacaatc cctaggccct tcagcgtgcg 2520
gtacgaccct tatacccaga ggatcgaggt gctggataat acacagcagc tgaagatcct 2580
ggctgactca atcaatagcg aaatcggaat cctgtgctcc gccctgcaga aaatcaaagg 2640
taagcctatc cctaaccctc tcctcggtct cgattctacg tgatcttgtg gaaaggacga 2700
aacaccgggg aattcaaggc ctctcgagcc tctagaatcc ccgagacgtt tcgtctcggg 2760
atcactatag tgagtcgtat tacgtacaca gtgcagggga aagaatagta gagatccaga 2820
catgataaga tacattgatg agtttggaca aaccacaact agaatgcagt gaaaaaaatg 2880
ctttatttgt gaaatttgtg atgctattgc tttatttgta accattataa gctgcaataa 2940
acaagttaac aacaacaatt gcattcattt tatgtttcag gttcaggggg aggtgtggga 3000
ggttttttaa ctgggatggg atgtggaatc cttctagatt tcttttgtaa tatttataaa 3060
gtgctctcag caaggtatca aaatggcaaa attgtgagta actatcctcc tttcattttg 3120
ggaagaagat gaggcatgaa gagaattcag acagaaactt actcagacca ggggaggcag 3180
aaactaagca gagaggaaaa tgaccaagag ttagccctgg gcatggaatg tgaaagaacc 3240
ctaaacgtga cttggaaata atgcccaagg tatattccat tctccgggat ttgttggcat 3300
tttcttgagg tgaagaattg cagaatacat tctttaatgt gacctacata tttacccatg 3360
ggaggaagtc tgctcctgga ctcttgagat tcagtcataa agcccaggcc agggaaataa 3420
tgtaagtctg caggcccctg tcatcagtag gattagggag aagagttctc agtagaaaac 3480
agggaggctg gagagaaaag aatggttaat gttaacgtta atataactag aaagactgca 3540
gaacttagga ctgattttta tttgaatcct taaaaaaaaa atttcttatg aaaatagtac 3600
atggctctta ggagacagaa cttattgtac agaggaacag cgtgagagtc agagtgatcc 3660
cagaacaggt cctggctcca tcctgcacat agttttggtg ctgctggcaa tacggtcccc 3720
acaactgtgg gaaggggtta ggggcaggga tctcatcagg aaagcatagg ggtttaaagt 3780
tctttataga gcacttagaa gattgagaat ccacaaatta tattaataac aaacaaagta 3840
gtgtcgtgtt atatagtaaa tgtgaatttg cagacacatt tagggaaaag ttataattaa 3900
aaaaataggc tgtatatata ctagatacgt agataagtag cctgcaggtc tagatacgta 3960
gataagtagc atggcgggtt aatcattaac tacaaggaac ccctagtgat ggagttggcc 4020
actccctctc tgcgcgctcg ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc 4080
ccgggctttg cccgggcggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaa 4139
<210> 83
<211> 1353
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 83
tccaccgctg tgctggagaa ccctgggctg gggaggaaac tgtcagactt cgggcaggag 60
acttcataca ttgaggataa ctgtaaccag aatggcgcca tctctctgat cttcagcctg 120
aaggaggaag tgggcgccct ggcaaaggtg ctgcgcctgt ttgaggagaa cgacgtgaat 180
ctgacccaca tcgagtcccg gccttctaga ctgaagaagg acgagtacga gttctttacc 240
cacctggata agcggtccct gccagccctg acaaacatca tcaagatcct gaggcacgac 300
atcggagcaa ccgtgcacga gctgtctcgg gacaagaaga aggataccgt gccctggttc 360
cctcggacaa tccaggagct ggatagattt gccaaccaga tcctgtctta cggagcagag 420
ctggacgcag atcaccctgg cttcaaggac ccagtgtatc gggcccggag aaagcagttt 480
gccgatatcg cctacaatta taggcacgga cagccaatcc ctcgcgtgga gtatatggag 540
gaggagaaga agacctgggg cacagtgttc aagaccctga agagcctgta caagacacac 600
gcctgctacg agtataacca catcttcccc ctgctggaga agtattgtgg ctttcacgag 660
gacaatatcc ctcagctgga ggacgtgagc cagttcctgc agacctgcac aggctttagg 720
ctgaggccag tggcaggact gctgagctcc cgggacttcc tgggaggact ggccttcaga 780
gtgtttcact gcacccagta catcaggcac ggctccaagc caatgtatac accagagccc 840
gacatctgtc acgagctgct gggccacgtg cccctgttta gcgatagatc cttcgcccag 900
ttttcccagg agatcggact ggcatctctg ggagcacctg acgagtacat cgagaagctg 960
gccaccatct attggttcac agtggagttt ggcctgtgca agcagggcga tagcatcaag 1020
gcctacggag caggactgct gtctagcttc ggcgagctgc agtattgtct gtccgagaag 1080
ccaaagctgc tgcccctgga gctggagaag accgccatcc agaactacac cgtgacagag 1140
ttccagcccc tgtactatgt ggccgagtct tttaacgatg ccaaggagaa ggtgagaaat 1200
ttcgccgcca caatccctag gcccttcagc gtgcggtacg acccttatac ccagaggatc 1260
gaggtgctgg ataatacaca gcagctgaag atcctggctg actcaatcaa tagcgaaatc 1320
ggaatcctgt gctccgccct gcagaaaatc aaa 1353
<210> 84
<211> 800
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 84
agcattagct tccatttatg cagtgtaaat ggtgagaaca gccccgactg aatacccaga 60
gcatcatctc gtctgtgtca ttcatgcaca taacatatct cagcgaggtg gcccttctgt 120
cctctttgca gagacccagc caccatacta gtacctagag aactggctgg atttcagccc 180
cgatacctcc gggcttttgc tcatgttcgc ctcatagggt catctgggtg gttgcctaag 240
gaaaagtatg tcatggagac taacttgctt ggcattgaat aaaaggtgag ttgagagtgg 300
agcgtgttta aattgcaatc ctgcctctat ttctgtgctt gcagggaaca gtcatcctta 360
attgctatcc tccatcatca tcatgattat ttctggtttt tctctggttg cggagaatcc 420
atactccagg tattccaatg tctcagcatt gccaggcctg tctgagcgtc aggatgtagg 480
tagtctgggc tctctgcctt ctattcttgt ccaggatact ctgccaaaag aatcatgttg 540
tggctgccac ccctcccaca aagcctcccg cttgggtcag tccaggactg gagttgggta 600
tggactgttc atgtctatcc actgctacgt cagggcaaca cccactgaga gtgaccttgt 660
agactgcagt gggagacacc cttcaaaacc tctcctctcc tgtcctgaga gccaggttaa 720
aaccatcagc cccgcatcct gagtgcaaac ttttcctaac cctgctgcta agctagacac 780
ctcacttact gagagccagc 800
<210> 85
<211> 800
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 85
agcattagct tccatttatg cagtgtaaat ggtgagaaca gccccgactg aatacccaga 60
gcatcatctc gtctgtgtca ttcatgcaca taacatatct cagcgaggtg gcccttctgt 120
cctctttgca gagacccagc caccatacta gtacctagag aactggctgg atttcagccc 180
cgatacctcc gggcttttgc tcatgttcgc ctcatagggt catctgggtg gttgcctaag 240
gaaaagtatg tcatggagac taacttgctt ggcattgaat aaaaggtgag ttgagagtgg 300
agcgtgttta aattgcaatc ctgcctctat ttctgtgctt gcagggaaca gtcatcctta 360
attgctatcc tccatcatca tcatgattat ttctggtttt tctctggttg cggagaatcc 420
atactccagg tattccaatg tctcagcatt gccaggcctg tctgagcgtc aggatgtagg 480
tagtctgggc tctctgcctt ctattcttgt ccaggatact ctgccaaaag aatcatgttg 540
tggctgccac ccctcccaca aagcctcccg cttgggtcag tccaggactg gagttgggta 600
tggactgttc atgtctatcc actgctacgt cagggcaaca cccactgaga gtgaccttgt 660
agactgcagt gggagacacc cttcaaaacc tctcctctcc tgtcctgaga gccaggttaa 720
aaccatcagc cccgcatcct gagtgcaaac ttttcctaac cctgctgcta agctagacac 780
cccacttact gagagccagc 800
<210> 86
<211> 800
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 86
gcagctgttg tcctggagaa cggagtcctg agcagaaaac tctcagactt tgggcaggta 60
agcctgttgg gcttccactg ctaggagaga attggttccc cacatgtgaa agcagtctgg 120
gaaatgctgg tatttccagt ctcctaaggc tactaagaaa tatgacttta tttagaggcg 180
aggaaaatgc ccaggaagtc aactgatgag actagtctta acaagttgag gatacagaaa 240
gttggggatc tgagctgcta ccaacatctg tgtgtctttg ggtggctcat tggtatcctc 300
tgcctattgg ctttatcttc tgtacactga aaggaaatgg ctggtcctta gtcacctggg 360
gtgggagtcc ctatctctcc agggatactt attcaatcct ttcttctggg tatcaaaatg 420
acaagcttgt aagaaactgt cctctttcgg ctttcaggag gtgatgtcgc atgaagagaa 480
tttggggggg gggacttact cagaaccaag gagggagaaa ttaaacagag agggaaatga 540
acaggagtta gcccggagcc tgaagcacct tggggattat gctgggggtg gagggaatcc 600
attgtcctcc ctagggaggg cttgcagaac atgttctttt ctgtgatatt tgtactttcc 660
ccagattgca aatcatggtt tgtacactga gattcagtct ctggaggtaa tatgcctttt 720
ctagcttttc cttggacagg actaaggggt tgagggttgc ctggagtcag agaaatttgt 780
gttaaagaag gttgatatga 800

Claims (86)

1.一种重组腺相关病毒(rAAV),其包括:
(a)AAV衣壳,所述AAV衣壳包括AAV衣壳蛋白;以及
(b)rAAV基因组,所述rAAV基因组包括:(i)用于编辑PAH基因中的靶基因座的编辑元件,所述编辑元件包括与转录调节元件可操作地连接的PAH编码序列的至少一部分;(ii)与所述靶基因座的第一基因组区5'具有同源性的所述编辑元件的5'同源臂核苷酸序列位置5';以及(iii)与所述靶基因座的第二基因组区3'具有同源性的位于所述编辑元件的3'的3'同源臂核苷酸序列。
2.根据权利要求1所述的rAAV,其中所述编辑元件包括PAH编码序列。
3.根据权利要求2所述的rAAV,其中所述PAH编码序列编码SEQ IDNO:33中所示的氨基酸序列。
4.根据权利要求1或2所述的rAAV,其中所述PAH编码序列包括SEQ ID NO:53中所示的核苷酸序列。
5.根据权利要求2所述的rAAV,其中所述PAH编码序列以沉默方式改变。
6.根据权利要求5所述的rAAV,其中所述PAH编码序列包括与SEQ IDNO:28中所示的核苷酸序列至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核苷酸序列。
7.根据权利要求5或6所述的rAAV,其中所述PAH编码序列包括SEQ ID NO:28中所示的核苷酸序列。
8.根据权利要求5或6所述的rAAV,其中所述PAH编码序列包括SEQ ID NO:83中所示的核苷酸序列。
9.根据权利要求1至8中任一项所述的rAAV,其中所述转录调节元件能够介导肝细胞、肾细胞或脑、脑垂体、肾上腺、胰腺、膀胱、胆囊、结肠、小肠或乳腺中的细胞中的转录。
10.根据权利要求1至9中任一项所述的rAAV,其中所述转录调节元件对于所述PAH基因是内源性的。
11.根据权利要求1至9中任一项所述的rAAV,其中所述转录调节元件对于所述PAH基因是外源性的。
12.根据权利要求11所述的rAAV,其中所述转录调节元件是肝特异性的,任选地其中所述转录调节元件包括选自由以下组成的组的一个或多个元件:人白蛋白启动子、人运甲状腺素蛋白(TTR)启动子、人ApoE/C-I肝控制区(HCR)1或2、人ApoH启动子、人SERPINA1(hAAT)启动子和其肝特异性调节模块。
13.根据权利要求11或12所述的rAAV,其中所述转录调节元件包括与选自由SEQ IDNO:25、26、27和69组成的组的序列至少90%相同的核苷酸序列。
14.根据权利要求11至13中任一项所述的rAAV,其中所述转录调节元件包括与SEQ IDNO:27中所示的核苷酸序列至少90%相同的核苷酸序列。
15.根据权利要求11至14中任一项所述的rAAV,其中所述转录调节元件包括SEQ IDNO:27中所示的核苷酸序列。
16.根据权利要求11至15中任一项所述的rAAV,其中所述转录调节元件的核苷酸序列由SEQ ID NO:27中所示的核苷酸序列组成。
17.根据权利要求1至16中任一项所述的rAAV,其中所述编辑元件进一步包括位于所述PAH编码序列的5'和所述转录调节元件的3'的内含子元件。
18.根据权利要求17所述的rAAV,其中所述内含子元件是外源性内含子元件,任选地其中所述外源性内含子元件是SV40内含子元件。
19.根据权利要求18所述的rAAV,其中所述SV40内含子元件包括与SEQ ID NO:29中所示的核苷酸序列至少90%相同的核苷酸序列。
20.根据权利要求18或19所述的rAAV,其中所述SV40内含子元件包括SEQ ID NO:29中所示的核苷酸序列。
21.根据权利要求18至20中任一项所述的rAAV,其中所述SV40内含子元件的核苷酸序列由SEQ ID NO:29中所示的核苷酸序列组成。
22.根据权利要求1至21中任一项所述的rAAV,其中所述编辑元件进一步包括所述PAH编码序列的聚腺苷酸化序列3'。
23.根据权利要求22所述的rAAV,其中所述聚腺苷酸化序列是外源性聚腺苷酸化序列,任选地其中所述外源性聚腺苷酸化序列是SV40聚腺苷酸化序列。
24.根据权利要求23所述的rAAV,其中所述SV40聚腺苷酸化序列包括与SEQ ID NO:31中所示的核苷酸序列至少90%相同的核苷酸序列。
25.根据权利要求23或24所述的rAAV,其中所述SV40聚腺苷酸化序列包括SEQ ID NO:31中所示的核苷酸序列。
26.根据权利要求23至25中任一项所述的rAAV,其中所述SV40聚腺苷酸化序列的核苷酸序列由SEQ ID NO:31中所示的核苷酸序列组成。
27.根据权利要求1至26中任一项所述的rAAV,其中所述靶基因座的核苷酸5'在PAH基因的内含子中。
28.根据权利要求1至27中任一项所述的rAAV,其中所述靶基因座的核苷酸5'在PAH基因的内含子1中。
29.根据权利要求1至28中任一项所述的rAAV,其中所述靶基因座的核苷酸3'在PAH基因的内含子中。
30.根据权利要求1至29中任一项所述的rAAV,其中所述靶基因座的核苷酸3'在PAH基因的内含子1中。
31.根据权利要求1至30中任一项所述的rAAV,其中所述PAH基因是人PAH基因。
32.根据权利要求31所述的rAAV,其中所述人PAH基因是野生型的。
33.根据权利要求31或32所述的rAAV,其中所述人PAH基因是变体PAH基因。
34.根据权利要求1至33中任一项所述的rAAV,其中所述编辑元件包括选自由SEQ IDNO:25、26、27、28、29、31、50、51、52、69或70组成的组的核苷酸序列。
35.根据权利要求1至34中任一项所述的rAAV,其中所述5'同源臂核苷酸序列与所述第一基因组区至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同。
36.根据权利要求1至35中任一项所述的rAAV,其中所述3'同源臂核苷酸序列与所述第二基因组区至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同。
37.根据权利要求1至36中任一项所述的rAAV,其中所述第一基因组区位于第一编辑窗口中,并且所述第二基因组区位于第二编辑窗口中。
38.根据权利要求37所述的rAAV,其中所述第一编辑窗口由与SEQ IDNO:37中所示的核苷酸序列相对应的人基因组的区组成。
39.根据权利要求37或38所述的rAAV,其中所述第二编辑窗口由与SEQ ID NO:38中所示的核苷酸序列相对应的人基因组的区组成。
40.根据权利要求1至39中任一项所述的rAAV,其中所述第一基因组区由与SEQ ID NO:37中所示的核苷酸序列相对应的人基因组的区组成。
41.根据权利要求1至40中任一项所述的rAAV,其中所述第二基因组区由与SEQ ID NO:38中所示的核苷酸序列相对应的人基因组的区组成。
42.根据权利要求1至41中任一项所述的rAAV,其中所述5'和3'同源臂核苷酸序列中的每一个独立地具有约100至约2000个核苷酸的长度。
43.根据权利要求1至42中任一项所述的rAAV,其中所述5'同源臂包括与SEQ ID NO:23中所示的核苷酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列。
44.根据权利要求1至43中任一项所述的rAAV,其中所述5'同源臂包括SEQ ID NO:23中所示的核苷酸序列。
45.根据权利要求1至44中任一项所述的rAAV,其中所述5'同源臂的核苷酸序列由SEQID NO:23中所示的核苷酸序列组成。
46.根据权利要求1至45中任一项所述的rAAV,其中所述3'同源臂包括与SEQ ID NO:24中所示的核苷酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列。
47.根据权利要求1至46中任一项所述的rAAV,其中所述3'同源臂包括SEQ ID NO:24中所示的核苷酸序列。
48.根据权利要求1至47中任一项所述的rAAV,其中所述3'同源臂的核苷酸序列由SEQID NO:24中所示的核苷酸序列组成。
49.根据权利要求1至48中任一项所述的rAAV,其中所述rAAV基因组包括与SEQ ID NO:43中所示的核苷酸序列至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核苷酸序列。
50.根据权利要求1至49中任一项所述的rAAV,其中所述rAAV基因组包括SEQ ID NO:43中所示的核苷酸序列。
51.根据权利要求1至50中任一项所述的rAAV,其中所述rAAV基因组进一步包括所述5'同源臂核苷酸序列的5'反向末端重复序列(5'ITR)核苷酸序列5',以及所述3'同源臂核苷酸序列的3'反向末端重复序列(3'ITR)核苷酸序列3'。
52.根据权利要求51所述的rAAV,其中所述5'ITR核苷酸序列与SEQ ID NO:14中所示的核苷酸序列至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同,和/或所述3'ITR核苷酸序列与SEQ ID NO:18中所示的核苷酸序列至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同。
53.根据权利要求1至52中任一项所述的rAAV,其中所述rAAV基因组包括SEQ ID NO:73和/或74中所示的核苷酸序列。
54.根据权利要求1至53中任一项所述的rAAV,其中所述rAAV基因组包括SEQ ID NO:75和/或76中所示的核苷酸序列。
55.根据权利要求1至54中任一项所述的rAAV,其中所述rAAV基因组包括与SEQ ID NO:45中所示的核苷酸序列至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核苷酸序列。
56.根据权利要求1至55中任一项所述的rAAV,其中所述rAAV基因组包括SEQ ID NO:45中所示的核苷酸序列。
57.根据权利要求1至56中任一项所述的rAAV,其中所述AAV衣壳蛋白包括与由SEQ IDNO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸203-736构成的氨基酸序列至少95%相同的氨基酸序列。
58.根据权利要求57所述的rAAV,其中:所述衣壳蛋白中与SEQ ID NO:16的氨基酸206相对应的氨基酸是C;所述衣壳蛋白中与SEQ ID NO:16的氨基酸296相对应的氨基酸是H;所述衣壳蛋白中与SEQ ID NO:16的氨基酸312相对应的氨基酸是Q;所述衣壳蛋白中与SEQ IDNO:16的氨基酸346相对应的氨基酸是A;所述衣壳蛋白中与SEQ ID NO:16的氨基酸464相对应的氨基酸是N;所述衣壳蛋白中与SEQ ID NO:16的氨基酸468相对应的氨基酸是S;所述衣壳蛋白中与SEQ ID NO:16的氨基酸501相对应的氨基酸是I;所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R;所述衣壳蛋白中与SEQ ID NO:16的氨基酸590相对应的氨基酸是R;所述衣壳蛋白中与SEQ ID NO:16的氨基酸626相对应的氨基酸是G或Y;所述衣壳蛋白中与SEQ ID NO:16的氨基酸681相对应的氨基酸是M;所述衣壳蛋白中与SEQ IDNO:16的氨基酸687相对应的氨基酸是R;所述衣壳蛋白中与SEQ ID NO:16的氨基酸690相对应的氨基酸是K;所述衣壳蛋白中与SEQ ID NO:16的氨基酸706相对应的氨基酸是C;或者所述衣壳蛋白中与SEQ ID NO:16的氨基酸718相对应的氨基酸是G。
59.根据权利要求58所述的rAAV,其中:
(a)所述衣壳蛋白中与SEQ ID NO:16的氨基酸626相对应的氨基酸是G,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸718相对应的氨基酸是G;
(b)所述衣壳蛋白中与SEQ ID NO:16的氨基酸296相对应的氨基酸是H,所述衣壳蛋白中与SEQ ID NO:16的氨基酸464相对应的氨基酸是N,所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸681相对应的氨基酸是M;
(c)所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸687相对应的氨基酸是R;
(d)所述衣壳蛋白中与SEQ ID NO:16的氨基酸346相对应的氨基酸是A,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R;或者
(e)所述衣壳蛋白中与SEQ ID NO:16的氨基酸501相对应的氨基酸是I,所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸706相对应的氨基酸是C。
60.根据权利要求58所述的rAAV,其中所述衣壳蛋白包括由SEQ IDNO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸203-736构成的氨基酸序列。
61.根据权利要求1至60中任一项所述的rAAV,其中所述AAV衣壳蛋白包括与由SEQ IDNO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸138-736构成的氨基酸序列至少95%相同的氨基酸序列。
62.根据权利要求61所述的rAAV,其中:所述衣壳蛋白中与SEQ ID NO:16的氨基酸151相对应的氨基酸是R;所述衣壳蛋白中与SEQ ID NO:16的氨基酸160相对应的氨基酸是D;所述衣壳蛋白中与SEQ ID NO:16的氨基酸206相对应的氨基酸是C;所述衣壳蛋白中与SEQ IDNO:16的氨基酸296相对应的氨基酸是H;所述衣壳蛋白中与SEQ ID NO:16的氨基酸312相对应的氨基酸是Q;所述衣壳蛋白中与SEQ ID NO:16的氨基酸346相对应的氨基酸是A;所述衣壳蛋白中与SEQ ID NO:16的氨基酸464相对应的氨基酸是N;所述衣壳蛋白中与SEQ ID NO:16的氨基酸468相对应的氨基酸是S;所述衣壳蛋白中与SEQ ID NO:16的氨基酸501相对应的氨基酸是I;所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R;所述衣壳蛋白中与SEQ ID NO:16的氨基酸590相对应的氨基酸是R;所述衣壳蛋白中与SEQ ID NO:16的氨基酸626相对应的氨基酸是G或Y;所述衣壳蛋白中与SEQ ID NO:16的氨基酸681相对应的氨基酸是M;所述衣壳蛋白中与SEQ ID NO:16的氨基酸687相对应的氨基酸是R;所述衣壳蛋白中与SEQ ID NO:16的氨基酸690相对应的氨基酸是K;所述衣壳蛋白中与SEQ ID NO:16的氨基酸706相对应的氨基酸是C;或者所述衣壳蛋白中与SEQ ID NO:16的氨基酸718相对应的氨基酸是G。
63.根据权利要求62所述的rAAV,其中:
(a)所述衣壳蛋白中与SEQ ID NO:16的氨基酸626相对应的氨基酸是G,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸718相对应的氨基酸是G;
(b)所述衣壳蛋白中与SEQ ID NO:16的氨基酸296相对应的氨基酸是H,所述衣壳蛋白中与SEQ ID NO:16的氨基酸464相对应的氨基酸是N,所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸681相对应的氨基酸是M;
(c)所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸687相对应的氨基酸是R;
(d)所述衣壳蛋白中与SEQ ID NO:16的氨基酸346相对应的氨基酸是A,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R;或者
(e)所述衣壳蛋白中与SEQ ID NO:16的氨基酸501相对应的氨基酸是I,所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸706相对应的氨基酸是C。
64.根据权利要求62所述的rAAV,其中所述衣壳蛋白包括由SEQ IDNO:1、2、3、4、5、6、7、9、10、11、12、13、15、16或17的氨基酸138-736构成的氨基酸序列。
65.根据权利要求1至64中任一项所述的rAAV,其中所述AAV衣壳蛋白包括与由SEQ IDNO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736构成的氨基酸序列至少95%相同的氨基酸序列。
66.根据权利要求65所述的rAAV,其中:所述衣壳蛋白中与SEQ ID NO:16的氨基酸2相对应的氨基酸是T;所述衣壳蛋白中与SEQ ID NO:16的氨基酸65相对应的氨基酸是I;所述衣壳蛋白中与SEQ ID NO:16的氨基酸68相对应的氨基酸是V;所述衣壳蛋白中与SEQ IDNO:16的氨基酸77相对应的氨基酸是R;所述衣壳蛋白中与SEQ ID NO:16的氨基酸119相对应的氨基酸是L;所述衣壳蛋白中与SEQ ID NO:16的氨基酸151相对应的氨基酸是R;所述衣壳蛋白中与SEQ ID NO:16的氨基酸160相对应的氨基酸是D;所述衣壳蛋白中与SEQ ID NO:16的氨基酸206相对应的氨基酸是C;所述衣壳蛋白中与SEQ ID NO:16的氨基酸296相对应的氨基酸是H;所述衣壳蛋白中与SEQ ID NO:16的氨基酸312相对应的氨基酸是Q;所述衣壳蛋白中与SEQ ID NO:16的氨基酸346相对应的氨基酸是A;所述衣壳蛋白中与SEQ ID NO:16的氨基酸464相对应的氨基酸是N;所述衣壳蛋白中与SEQ ID NO:16的氨基酸468相对应的氨基酸是S;所述衣壳蛋白中与SEQ IDNO:16的氨基酸501相对应的氨基酸是I;所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R;所述衣壳蛋白中与SEQ ID NO:16的氨基酸590相对应的氨基酸是R;所述衣壳蛋白中与SEQ ID NO:16的氨基酸626相对应的氨基酸是G或Y;所述衣壳蛋白中与SEQ ID NO:16的氨基酸681相对应的氨基酸是M;所述衣壳蛋白中与SEQ ID NO:16的氨基酸687相对应的氨基酸是R;所述衣壳蛋白中与SEQ ID NO:16的氨基酸690相对应的氨基酸是K;所述衣壳蛋白中与SEQ ID NO:16的氨基酸706相对应的氨基酸是C;或者所述衣壳蛋白中与SEQ ID NO:16的氨基酸718相对应的氨基酸是G。
67.根据权利要求66所述的rAAV,其中:
(a)所述衣壳蛋白中与SEQ ID NO:16的氨基酸2相对应的氨基酸是T,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸312相对应的氨基酸是Q;
(b)所述衣壳蛋白中与SEQ ID NO:16的氨基酸65相对应的氨基酸是I,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸626相对应的氨基酸是Y;
(c)所述衣壳蛋白中与SEQ ID NO:16的氨基酸77相对应的氨基酸是R,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸690相对应的氨基酸是K;
(d)所述衣壳蛋白中与SEQ ID NO:16的氨基酸119相对应的氨基酸是L,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸468相对应的氨基酸是S;
(e)所述衣壳蛋白中与SEQ ID NO:16的氨基酸626相对应的氨基酸是G,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸718相对应的氨基酸是G;
(f)所述衣壳蛋白中与SEQ ID NO:16的氨基酸296相对应的氨基酸是H,所述衣壳蛋白中与SEQ ID NO:16的氨基酸464相对应的氨基酸是N,所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸681相对应的氨基酸是M;
(g)所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸687相对应的氨基酸是R;
(h)所述衣壳蛋白中与SEQ ID NO:16的氨基酸346相对应的氨基酸是A,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R;或者
(i)所述衣壳蛋白中与SEQ ID NO:16的氨基酸501相对应的氨基酸是I,所述衣壳蛋白中与SEQ ID NO:16的氨基酸505相对应的氨基酸是R,并且所述衣壳蛋白中与SEQ ID NO:16的氨基酸706相对应的氨基酸是C。
68.根据权利要求66所述的rAAV,其中所述衣壳蛋白包括由SEQ IDNO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736构成的氨基酸序列。
69.根据权利要求1至68中任一项所述的rAAV,其中当在标准AAV施用条件下在不存在外源性核酸酶的情况下向植入人肝细胞的小鼠施用所述AAV时,所述编辑元件到所述靶基因座中的整合效率为至少1%。
70.根据权利要求1至69中任一项所述的rAAV,其中当在标准AAV施用条件下在不存在外源性核酸酶的情况下向植入人肝细胞的小鼠施用所述AAV时,所述编辑元件整合到所述靶基因座中的等位基因频率为至少0.5%。
71.一种药物组合物,其包括根据权利要求1至70中任一项所述的rAAV。
72.一种多核苷酸,其包括SEQ ID NO:43、45、51或52中所示的核酸序列。
73.一种用于治疗患有苯丙酮尿症(PKU)的受试者的方法,所述方法包括向所述受试者施用有效量的根据权利要求1至70中任一项所述的rAAV、根据权利要求71所述的药物组合物或根据权利要求72所述的多核苷酸。
74.根据权利要求73所述的方法,其中所述rAAV、药物组合物或核酸是静脉内施用的。
75.根据权利要求73或74所述的方法,其中PKU与PAH基因突变相关。
76.根据权利要求73至75中任一项所述的方法,其中所述受试者是人受试者。
77.一种用于制备rAAV的包装系统,其中所述包装系统包括:
(a)第一核苷酸序列,所述第一核苷酸序列编码一个或多个AAV Rep蛋白;
(b)第二核苷酸序列,所述第二核苷酸序列编码根据权利要求1至70中任一项所述的rAAV的衣壳蛋白;以及
(c)第三核苷酸序列,所述第三核苷酸序列包括根据权利要求1至70中任一项所述的rAAV的rAAV基因组序列。
78.根据权利要求77所述的包装系统,其中所述包装系统包括包含所述第一核苷酸序列和所述第二核苷酸序列的第一载体,以及包括所述第三核苷酸序列的第二载体。
79.根据权利要求77或78所述的包装系统,其进一步包括包含一个或多个辅助病毒基因的第四核苷酸序列。
80.根据权利要求79所述的包装系统,其中所述第四核苷酸序列包括在第三载体内。
81.根据权利要求77至80中任一项所述的包装系统,其中所述第四核苷酸序列包括来自选自由以下组成的组的病毒的一个或多个基因:腺病毒、疱疹病毒、牛痘病毒和巨细胞病毒(CMV)。
82.根据权利要求77至81中任一项所述的包装系统,其中所述第一载体、所述第二载体和/或所述第三载体是质粒。
83.一种用于重组制备rAAV的方法,所述方法包括在借以产生所述rAAV的条件下将根据权利要求77至82中任一项所述的包装系统引入到细胞中。
84.根据权利要求1至70中任一项所述的rAAV、根据权利要求71所述的药物组合物或根据权利要求72所述的多核苷酸,其用作药剂。
85.根据权利要求1至70中任一项所述的rAAV、根据权利要求71所述的药物组合物或根据权利要求72所述的多核苷酸,其用于治疗PKU。
86.根据权利要求1至70中任一项所述的rAAV、根据权利要求71所述的药物组合物或根据权利要求72所述的多核苷酸,其用于治疗患有PKU的受试者的方法中,所述方法包括向所述受试者施用有效量的所述rAAV、所述药物组合物或所述多核苷酸。
CN202180048044.XA 2020-05-27 2021-05-27 用于恢复pah基因功能的腺相关病毒组合物和其使用方法 Pending CN115803441A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202063030341P 2020-05-27 2020-05-27
US63/030,341 2020-05-27
US202063117252P 2020-11-23 2020-11-23
US63/117,252 2020-11-23
PCT/US2021/070615 WO2021243364A1 (en) 2020-05-27 2021-05-27 Adeno-associated virus compositions for restoring pah gene function and methods of use thereof

Publications (1)

Publication Number Publication Date
CN115803441A true CN115803441A (zh) 2023-03-14

Family

ID=78722956

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180048044.XA Pending CN115803441A (zh) 2020-05-27 2021-05-27 用于恢复pah基因功能的腺相关病毒组合物和其使用方法

Country Status (13)

Country Link
US (1) US20210393804A1 (zh)
EP (1) EP4158040A1 (zh)
JP (1) JP2023528371A (zh)
KR (1) KR20230029650A (zh)
CN (1) CN115803441A (zh)
AU (1) AU2021279048A1 (zh)
BR (1) BR112022023908A2 (zh)
CA (1) CA3180219A1 (zh)
CO (1) CO2022018370A2 (zh)
MX (1) MX2022014881A (zh)
PE (1) PE20230433A1 (zh)
TW (1) TW202208632A (zh)
WO (1) WO2021243364A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116656740A (zh) * 2023-05-30 2023-08-29 浙江大学 一种腺相关病毒基因治疗载体及其在制备治疗苯丙酮尿症的药物中的应用

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230399657A1 (en) * 2022-05-17 2023-12-14 Homology Medicines, Inc. Liver de-targeted recombinant aav capsid proteins

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040142416A1 (en) * 2002-04-30 2004-07-22 Laipis Philip J. Treatment for phenylketonuria
JP2012080085A (ja) * 2010-09-10 2012-04-19 Nichia Chem Ind Ltd 支持体及びそれを用いた発光装置
WO2018035388A1 (en) * 2016-08-17 2018-02-22 The Broad Institute, Inc. Novel crispr enzymes and systems
BR112020006672A2 (pt) * 2017-10-02 2020-09-24 American Gene Technologies International Inc. vetores com combinações de promotor e acentuador para tratar fenilcetonúria
PE20212076A1 (es) * 2018-02-01 2021-10-26 Homology Medicines Inc Composiciones de virus adeno-asociado para restaurar la funcion del gen pah y metodos de uso de las mismas

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116656740A (zh) * 2023-05-30 2023-08-29 浙江大学 一种腺相关病毒基因治疗载体及其在制备治疗苯丙酮尿症的药物中的应用

Also Published As

Publication number Publication date
TW202208632A (zh) 2022-03-01
US20210393804A1 (en) 2021-12-23
KR20230029650A (ko) 2023-03-03
EP4158040A1 (en) 2023-04-05
CO2022018370A2 (es) 2023-03-07
CA3180219A1 (en) 2021-12-02
MX2022014881A (es) 2023-01-04
PE20230433A1 (es) 2023-03-08
AU2021279048A1 (en) 2023-01-05
WO2021243364A1 (en) 2021-12-02
BR112022023908A2 (pt) 2023-01-31
JP2023528371A (ja) 2023-07-04

Similar Documents

Publication Publication Date Title
US11951183B2 (en) Adeno-associated virus compositions for PAH gene transfer and methods of use thereof
CN113302201A (zh) 重组病毒载体和用于产生所述重组病毒载体的核酸
Ponnazhagan et al. Suppression of human alpha-globin gene expression mediated by the recombinant adeno-associated virus 2-based antisense vectors.
CN115803441A (zh) 用于恢复pah基因功能的腺相关病毒组合物和其使用方法
WO2019152841A1 (en) Adeno-associated virus compositions for pah gene transfer and methods of use thereof
US20220325302A1 (en) Adeno-associated virus compositions for restoring pah gene function and methods of use thereof
KR20210144696A (ko) 라민병증 치료용 조성물 및 치료 방법
KR20200056428A (ko) 변이체 RNAi
CN112639108A (zh) 治疗非综合征性感觉神经性听力损失的方法
CN112449605A (zh) 反式剪接分子
US20030017597A1 (en) Hybrid vectors for gene therapy
US11891619B2 (en) Adeno-associated virus compositions for restoring F8 gene function and methods of use thereof
KR20230041965A (ko) Slc26a4-연관 청력손실을 치료하기 위한 조성물 및 방법
CN115484975A (zh) 用于ids基因转移的腺相关病毒组合物和其使用方法
IL298544A (en) Adeno-associated virus preparations for restoring pah gene function and methods of using them
CN115427568A (zh) Rp1相关视网膜变性的基于单倍型的治疗
KR20150129001A (ko) 프로모터 조성물
CN117136238A (zh) 包括填充多核苷酸序列的载体
EA043850B1 (ru) Aav-опосредованная экспрессия с использованием синтетического промотора и энхансера
CZ20002906A3 (cs) Rekombinantní nukleová kyselina obsahující negativní regulační elementy pro nervově specifickou exresi transgenu a její použití

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination