CN114502575A - 用于arsa基因转移的腺相关病毒组合物和其使用方法 - Google Patents

用于arsa基因转移的腺相关病毒组合物和其使用方法 Download PDF

Info

Publication number
CN114502575A
CN114502575A CN202080054069.6A CN202080054069A CN114502575A CN 114502575 A CN114502575 A CN 114502575A CN 202080054069 A CN202080054069 A CN 202080054069A CN 114502575 A CN114502575 A CN 114502575A
Authority
CN
China
Prior art keywords
amino acid
seq
capsid protein
protein corresponding
gly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080054069.6A
Other languages
English (en)
Inventor
T.B.圣马丁
A.B.西摩尔
H.鲁宾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cognate3 LLC
Original Assignee
Cognate3 LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cognate3 LLC filed Critical Cognate3 LLC
Publication of CN114502575A publication Critical patent/CN114502575A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • A01K67/0276Knock-out vertebrates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • A61P25/28Drugs for disorders of the nervous system for treating neurodegenerative disorders of the central nervous system, e.g. nootropic agents, cognition enhancers, drugs for treating Alzheimer's disease or other forms of dementia
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/075Animals genetically altered by homologous recombination inducing loss of function, i.e. knock out
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/0306Animal model for genetic diseases
    • A01K2267/0318Animal model for neurodegenerative disease, e.g. non- Alzheimer's
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • C12Y301/06Sulfuric ester hydrolases (3.1.6)
    • C12Y301/06001Arylsulfatase (3.1.6.1)

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Neurosurgery (AREA)
  • Public Health (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Microbiology (AREA)
  • Neurology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Epidemiology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Hospice & Palliative Care (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Virology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Psychiatry (AREA)
  • Environmental Sciences (AREA)
  • Animal Husbandry (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

本文提供一种腺相关病毒(AAV)组合物,其可在细胞中表达芳基硫酸酯酶A(ARSA)多肽,由此恢复ARSA基因功能。还提供使用所述AAV组合物的方法,和用于制备所述AAV组合物的包装系统。

Description

用于ARSA基因转移的腺相关病毒组合物和其使用方法
相关申请的交叉引用
本申请案要求2019年6月10日提交的美国临时申请案第62/859,539号、2019年6月25日提交的美国临时申请案第62/866,374号、2019年10月15日提交的美国临时申请案第62/915,523号、2020年1月13日提交的美国临时申请案第62/960,487号、2020年3月10日提交的美国临时申请案第62/987,858号及2020年4月16日提交的美国临时申请案第63/010,970号的权益,其各自以全文引用的方式并入本文中。
序列表
本申请案含有序列表,其已以ASCII格式、以电子方式提交并以全文引用的方式并入本文中(所述ASCII副本创建于2020年4月16日,命名为“705151_HMW-030-6_ST25.txt”并且大小为295,995个字节)。
技术领域
背景技术
异染性脑白质营养不良(Metachromatic leukodystrophy,MLD)是一种具有较高的未满足的医学需求的致死性溶酶体贮积症。此神经退化性疾病以三种形式(婴儿晚期、青少年及成年人)存在并且由溶酶体酶芳基硫酸酯酶-A(ARSA)不足引起。ARSA位于称为溶酶体的细胞结构中,其在溶酶体中有助于分解硫苷脂。此酶的不足可引起脑部、脊髓和周边器官中硫苷脂的大量积聚,这导致髓鞘的严重损伤,髓鞘是神经纤维的主要保护层髓鞘产生细胞中的硫苷脂积聚引起整个神经系统(包括脑部、脊髓以及连接脑部及脊髓与肌肉及检测感觉(如触觉、疼痛、热及声音)的感觉细胞的神经)中的白质的进行性损坏。因此,MLD的特征在于中枢神经系统并且接着周围神经系统的进行性轴突髓鞘脱失。这引起获得性功能和/或技能的丧失、张力减退、共济失调、癫痫、失明、听力丧失和过早地死亡。
在患有异染性脑白质营养不良的人中,白质损伤引起心智功能及运动技能,如行走能力的进行性退化。受影响的个体还出现四肢感觉丧失、失禁、癫痫、麻痹、无法说话、失明和听力丧失。最终,此类个体丧失对其周围环境的感知并变得无反应。尽管神经问题是异染性脑白质营养不良的主要特征,但已报告硫苷脂积聚对其它器官和组织的影响,最常涉及胆囊。
可藉由几种治疗来管理MLD。例如,用于减少MLD的病征和症状以及缓解相关疼痛的药物。已表明造血干细胞移植可通过引入健康细胞以帮助替代患病细胞来推迟MLD的进展。其它治疗包括用于促进肌肉及关节灵活性以及保持活动范围的物理、职业及言语疗法。然而,尚未能治愈MLD。
大部分患有MLD的个体具有芳基硫酸酯酶A(ARSA)基因的突变,并且已鉴别超过110种不同的引起MLD的ARSA突变。每100人中便发现1人具有携带者突变,并且在美国每40,000名活新生儿中便有1名或在全世界每160,000名活新生儿中便有1名受影响。
基因疗法提供治愈MLD的独特机会。逆转录病毒载体(包括慢病毒载体)能够将核酸整合到宿主细胞基因组中,由于其对基因组的非靶向插入而产生安全性问题。例如,存在载体破坏肿瘤抑制基因或激活癌基因从而引起恶性肿瘤的风险。实际上,在藉由用γ逆转录病毒载体转导CD34+骨髓前体来进行的用于治疗X连锁重度联合免疫缺损(SCID)的临床试验中,十名患者中的四名产生白血病(Hacein-Bey-Abina等人,《临床研究杂志(J ClinInvest.)》(2008)118(9):3132-42)。另一方面,非整合载体通常在体内经历表达量不足或表达持续时间不足。
因此,所属领域中需要改进的基因疗法组合物和方法,其可有效及安全地恢复MLD患者中的ARSA基因功能。
发明内容
本文中提供可恢复细胞中的ARSA基因功能的腺相关病毒(AAV)组合物,以及使用其治疗与ARSA基因功能降低相关的疾病(例如MLD)的方法。还提供用于制备腺相关病毒组合物的包装系统。
因此,在一个方面中,本公开提供一种用于在细胞中表达芳基硫酸酯酶A(ARSA)多肽的方法,所述方法包含用重组腺相关病毒(rAAV)转导细胞,所述重组腺相关病毒包含:(a)AAV衣壳,其包含AAV衣壳蛋白(例如进化枝F衣壳蛋白);和(b)转移基因组,其包含可操作地连接于以沉默方式改变的ARSA编码序列的转录调节元件。
在某些实施例中,细胞为神经元和/或神经胶质细胞。在某些实施例中,细胞为中枢神经系统和/或周围神经系统的神经元和/或神经胶质细胞。在某些实施例中,细胞为选自由以下组成的群组的中枢神经系统区域的细胞:脊髓、运动皮质、感觉皮质、海马、壳核、小脑(任选地,小脑核)和其任何组合。在某些实施例中,细胞为选自由以下组成的群组的细胞:运动神经元、星形胶质细胞、少突胶质细胞、中枢神经系统中的大脑皮质的细胞、周围神经系统的感觉神经元、施万细胞(Schwann cell)和其任何组合。在某些实施例中,细胞是在哺乳动物受试者中,并且以有效转导受试者中的细胞的量向受试者施用AAV。
在另一方面中,本公开提供一种用于治疗患有异染性脑白质营养不良(MLD)的受试者的方法,所述方法包含向受试者施用有效量的rAAV,其包含:(a)AAV衣壳,其包含AAV衣壳蛋白(例如进化枝F衣壳蛋白);和(b)转移基因组,其包含可操作地连接于以沉默方式改变的ARSA编码序列的转录调节元件。
在某些实施例中,以沉默方式改变的ARSA编码序列编码SEQ ID NO:23中所阐述的氨基酸序列。在某些实施例中,以沉默方式改变的ARSA编码序列包含SEQ ID NO:14、62或72中所阐述的核苷酸序列。
在某些实施例中,转录调节元件包含选自由以下组成的群组的一种或多种元件:巨细胞病毒(CMV)增强子元件、鸡β-肌动蛋白(CBA)启动子、小型鸡β-肌动蛋白(SmCBA)启动子、钙调蛋白1(CALM1)启动子、蛋白脂质蛋白质1(PLP1)启动子、胶质细胞原纤维酸性蛋白(GFAP)启动子、突触蛋白2(SYN2)启动子、金属硫蛋白3(MT3)启动子和其任何组合。在某些实施例中,转录调节元件包含与选自由以下组成的群组的序列至少90%一致的核苷酸序列:SEQ ID NO:25、32、36、54、55和58。在某些实施例中,转录调节元件包含选自由以下组成的群组的核苷酸序列:SEQ ID NO:25、32、36、54、55和58。在某些实施例中,转录调节元件自5'到3'包含SEQ ID NO:58、25和32中所阐述的核苷酸序列。在某些实施例中,转录调节元件包含SEQ ID NO:36中所阐述的核苷酸序列。
在某些实施例中,转移基因组还包含位于以沉默方式改变的ARSA编码序列3'的聚腺苷酸化序列。在某些实施例中,聚腺苷酸化序列是外源性聚腺苷酸化序列。在某些实施例中,外源性聚腺苷酸化序列是SV40聚腺苷酸化序列。在某些实施例中,SV40聚腺苷酸化序列包含SEQ ID NO:42中所阐述的核苷酸序列。
在某些实施例中,转移基因组还包含填充序列。在某些实施例中,转移基因组还包含位于以沉默方式改变的ARSA编码序列3'的填充序列。在某些实施例中,填充序列位于聚腺苷酸化序列3'。
在某些实施例中,转移基因组包含选自由以下组成的群组的序列:SEQ ID NO:41、44、46、65、67和75。
在某些实施例中,转移基因组还包含基因组5'的5'反向末端重复(5'ITR)核苷酸序列和基因组3'的3'反向末端重复(3'ITR)核苷酸序列。在某些实施例中,5'ITR核苷酸序列与SEQ ID NO:18具有至少95%序列一致性,并且3'ITR核苷酸序列与SEQ ID NO:19具有至少95%序列一致性。在某些实施例中,5'ITR核苷酸序列与SEQ ID NO:26具有至少95%序列一致性,并且3'ITR核苷酸序列与SEQ ID NO:27具有至少95%序列一致性。在某些实施例中,5'ITR核苷酸序列与SEQ ID NO:18具有至少95%序列一致性,并且3'ITR核苷酸序列与SEQ ID NO:57具有至少95%序列一致性。
在某些实施例中,转移基因组包含选自由以下组成的群组的核苷酸序列:SEQ IDNO:47、48、49、68、69和76。
在某些实施例中,异染性脑白质营养不良与芳基硫酸酯酶A(ARSA)基因突变相关。在某些实施例中,受试者是人类受试者。
在某些实施例中,衣壳蛋白包含与SEQ ID NO:2、3、4、6、7、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列具有至少95%序列一致性的氨基酸序列。在某些实施例中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸206的氨基酸为C;衣壳蛋白中对应于SEQ IDNO:16的氨基酸296的氨基酸为H;衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸为Q;衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸为A;衣壳蛋白中对应于SEQ IDNO:16的氨基酸464的氨基酸为N;衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸为S;衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸为I;衣壳蛋白中对应于SEQ IDNO:16的氨基酸505的氨基酸为R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸590的氨基酸为R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸为G或Y;衣壳蛋白中对应于SEQID NO:16的氨基酸681的氨基酸为M;衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸为R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸为K;衣壳蛋白中对应于SEQID NO:16的氨基酸706的氨基酸为C;或衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸为G。
在某些实施例中,(a)衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸为G,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸为G;(b)衣壳蛋白中对应于SEQID NO:16的氨基酸296的氨基酸为H,衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸为N,衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸为M;(c)衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸为R;(d)衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸为A,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R;或(e)衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸为I,衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且衣壳蛋白中对应于SEQID NO:16的氨基酸706的氨基酸为C。
在某些实施例中,衣壳蛋白包含SEQ ID NO:2、3、4、6、7、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列。
在某些实施例中,衣壳蛋白包含与SEQ ID NO:2、3、4、5、6、7、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列具有至少95%序列一致性的氨基酸序列。在某些实施例中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸151的氨基酸为R;衣壳蛋白中对应于SEQID NO:16的氨基酸160的氨基酸为D;衣壳蛋白中对应于SEQ ID NO:16的氨基酸206的氨基酸为C;衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸为H;衣壳蛋白中对应于SEQID NO:16的氨基酸312的氨基酸为Q;衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸为A;衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸为N;衣壳蛋白中对应于SEQID NO:16的氨基酸468的氨基酸为S;衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸为I;衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R;衣壳蛋白中对应于SEQID NO:16的氨基酸590的氨基酸为R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸为G或Y;衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸为M;衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸为R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸为K;衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸为C;或衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸为G。
在某些实施例中,(a)衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸为G,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸为G;(b)衣壳蛋白中对应于SEQID NO:16的氨基酸296的氨基酸为H,衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸为N,衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸为M;(c)衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸为R;(d)衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸为A,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R;或(e)衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸为I,衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且衣壳蛋白中对应于SEQID NO:16的氨基酸706的氨基酸为C。
在某些实施例中,衣壳蛋白包含SEQ ID NO:2、3、4、5、6、7、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列。
在某些实施例中,衣壳蛋白包含与SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列具有至少95%序列一致性的氨基酸序列。在某些实施例中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸2的氨基酸为T;衣壳蛋白中对应于SEQID NO:16的氨基酸65的氨基酸为I;衣壳蛋白中对应于SEQ ID NO:16的氨基酸68的氨基酸为V;衣壳蛋白中对应于SEQ ID NO:16的氨基酸77的氨基酸为R;衣壳蛋白中对应于SEQ IDNO:16的氨基酸119的氨基酸为L;衣壳蛋白中对应于SEQ ID NO:16的氨基酸151的氨基酸为R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸160的氨基酸为D;衣壳蛋白中对应于SEQ IDNO:16的氨基酸206的氨基酸为C;衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸为H;衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸为Q;衣壳蛋白中对应于SEQ IDNO:16的氨基酸346的氨基酸为A;衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸为N;衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸为S;衣壳蛋白中对应于SEQ IDNO:16的氨基酸501的氨基酸为I;衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸590的氨基酸为R;衣壳蛋白中对应于SEQ IDNO:16的氨基酸626的氨基酸为G或Y;衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸为M;衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸为R;衣壳蛋白中对应于SEQID NO:16的氨基酸690的氨基酸为K;衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸为C;或衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸为G。
在某些实施例中,(a)衣壳蛋白中对应于SEQ ID NO:16的氨基酸2的氨基酸为T,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸为Q;(b)衣壳蛋白中对应于SEQID NO:16的氨基酸65的氨基酸为I,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸为Y;(c)衣壳蛋白中对应于SEQ ID NO:16的氨基酸77的氨基酸为R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸为K;(d)衣壳蛋白中对应于SEQ ID NO:16的氨基酸119的氨基酸为L,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸为S;(e)衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸为G,并且衣壳蛋白中对应于SEQ IDNO:16的氨基酸718的氨基酸为G;(f)衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸为H,衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸为N,衣壳蛋白中对应于SEQID NO:16的氨基酸505的氨基酸为R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸为M;(g)衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸为R;(h)衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸为A,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R;或(i)衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸为I,衣壳蛋白中对应于SEQID NO:16的氨基酸505的氨基酸为R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸为C。
在某些实施例中,衣壳蛋白包含SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列。
在另一方面中,本公开提供rAAV,其包含:(a)AAV衣壳,其包含AAV衣壳蛋白(例如进化枝F衣壳蛋白);和(b)转移基因组,其包含可操作地连接于以沉默方式改变的ARSA编码序列的转录调节元件。
在某些实施例中,以沉默方式改变的ARSA编码序列编码SEQ ID NO:23中所阐述的氨基酸序列。在某些实施例中,以沉默方式改变的ARSA编码序列包含SEQ ID NO:14中所阐述的核苷酸序列。在某些实施例中,以沉默方式改变的ARSA编码序列包含SEQ ID NO:62或72中所阐述的核苷酸序列。
在某些实施例中,转录调节元件包含选自由以下组成的群组的一种或多种元件:巨细胞病毒(CMV)增强子元件、鸡β-肌动蛋白(CBA)启动子、小型鸡β-肌动蛋白(SmCBA)启动子、钙调蛋白1(CALM1)启动子、蛋白脂质蛋白质1(PLP1)启动子、胶质细胞原纤维酸性蛋白(GFAP)启动子、突触蛋白2(SYN2)启动子、金属硫蛋白3(MT3)启动子和其任何组合。在某些实施例中,转录调节元件包含与选自由以下组成的群组的序列至少90%一致的核苷酸序列:SEQ ID NO:25、32、36、54、55和58。在某些实施例中,转录调节元件包含选自由以下组成的群组的核苷酸序列:SEQ ID NO:25、32、36、54、55和58。在某些实施例中,转录调节元件自5'到3'包含SEQ ID NO:58、25和32中所阐述的核苷酸序列。在某些实施例中,转录调节元件包含SEQ ID NO:36中所阐述的核苷酸序列。
在某些实施例中,转移基因组还包含位于以沉默方式改变的ARSA编码序列3'的聚腺苷酸化序列。在某些实施例中,聚腺苷酸化序列是外源性聚腺苷酸化序列。在某些实施例中,外源性聚腺苷酸化序列是SV40聚腺苷酸化序列。在某些实施例中,SV40聚腺苷酸化序列包含SEQ ID NO:42中所阐述的核苷酸序列。
在某些实施例中,转移基因组包含选自由以下组成的群组的序列:SEQ ID NO:41、44、46、65、67和75。
在某些实施例中,转移基因组还包含基因组5'的5'反向末端重复(5'ITR)核苷酸序列和基因组3'的3'反向末端重复(3'ITR)核苷酸序列。在某些实施例中,5'ITR核苷酸序列与SEQ ID NO:18具有至少95%序列一致性,并且3'ITR核苷酸序列与SEQ ID NO:19具有至少95%序列一致性。
在某些实施例中,转移基因组包含选自由以下组成的群组的核苷酸序列:SEQ IDNO:47、48、49、68、69和76。在某些实施例中,转移基因组的核苷酸序列由选自由以下组成的群组的核苷酸序列组成:SEQ ID NO:47、48、49、68、69及76。在某些实施例中,转移基因组的核苷酸序列由SEQ ID NO:48中所阐述的核苷酸序列组成。
在某些实施例中,衣壳蛋白包含与SEQ ID NO:2、3、4、6、7、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列具有至少95%序列一致性的氨基酸序列。在某些实施例中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸206的氨基酸为C;衣壳蛋白中对应于SEQ IDNO:16的氨基酸296的氨基酸为H;衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸为Q;衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸为A;衣壳蛋白中对应于SEQ IDNO:16的氨基酸464的氨基酸为N;衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸为S;衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸为I;衣壳蛋白中对应于SEQ IDNO:16的氨基酸505的氨基酸为R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸590的氨基酸为R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸为G或Y;衣壳蛋白中对应于SEQID NO:16的氨基酸681的氨基酸为M;衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸为R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸为K;衣壳蛋白中对应于SEQID NO:16的氨基酸706的氨基酸为C;或衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸为G。
在某些实施例中,(a)衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸为G,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸为G;(b)衣壳蛋白中对应于SEQID NO:16的氨基酸296的氨基酸为H,衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸为N,衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸为M;(c)衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸为R;(d)衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸为A,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R;或(e)衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸为I,衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且衣壳蛋白中对应于SEQID NO:16的氨基酸706的氨基酸为C。
在某些实施例中,衣壳蛋白包含SEQ ID NO:2、3、4、6、7、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列。
在某些实施例中,衣壳蛋白包含与SEQ ID NO:2、3、4、5、6、7、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列具有至少95%序列一致性的氨基酸序列。在某些实施例中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸151的氨基酸为R;衣壳蛋白中对应于SEQID NO:16的氨基酸160的氨基酸为D;衣壳蛋白中对应于SEQ ID NO:16的氨基酸206的氨基酸为C;衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸为H;衣壳蛋白中对应于SEQID NO:16的氨基酸312的氨基酸为Q;衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸为A;衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸为N;衣壳蛋白中对应于SEQID NO:16的氨基酸468的氨基酸为S;衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸为I;衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R;衣壳蛋白中对应于SEQID NO:16的氨基酸590的氨基酸为R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸为G或Y;衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸为M;衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸为R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸为K;衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸为C;或衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸为G。
在某些实施例中,(a)衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸为G,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸为G;(b)衣壳蛋白中对应于SEQID NO:16的氨基酸296的氨基酸为H,衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸为N,衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸为M;(c)衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸为R;(d)衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸为A,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R;或(e)衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸为I,衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且衣壳蛋白中对应于SEQID NO:16的氨基酸706的氨基酸为C。
在某些实施例中,衣壳蛋白包含SEQ ID NO:2、3、4、5、6、7、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列。
在某些实施例中,衣壳蛋白包含与SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列具有至少95%序列一致性的氨基酸序列。在某些实施例中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸2的氨基酸为T;衣壳蛋白中对应于SEQID NO:16的氨基酸65的氨基酸为I;衣壳蛋白中对应于SEQ ID NO:16的氨基酸68的氨基酸为V;衣壳蛋白中对应于SEQ ID NO:16的氨基酸77的氨基酸为R;衣壳蛋白中对应于SEQ IDNO:16的氨基酸119的氨基酸为L;衣壳蛋白中对应于SEQ ID NO:16的氨基酸151的氨基酸为R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸160的氨基酸为D;衣壳蛋白中对应于SEQ IDNO:16的氨基酸206的氨基酸为C;衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸为H;衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸为Q;衣壳蛋白中对应于SEQ IDNO:16的氨基酸346的氨基酸为A;衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸为N;衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸为S;衣壳蛋白中对应于SEQ IDNO:16的氨基酸501的氨基酸为I;衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸590的氨基酸为R;衣壳蛋白中对应于SEQ IDNO:16的氨基酸626的氨基酸为G或Y;衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸为M;衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸为R;衣壳蛋白中对应于SEQID NO:16的氨基酸690的氨基酸为K;衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸为C;或衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸为G。
在某些实施例中,(a)衣壳蛋白中对应于SEQ ID NO:16的氨基酸2的氨基酸为T,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸为Q;(b)衣壳蛋白中对应于SEQID NO:16的氨基酸65的氨基酸为I,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸为Y;(c)衣壳蛋白中对应于SEQ ID NO:16的氨基酸77的氨基酸为R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸为K;(d)衣壳蛋白中对应于SEQ ID NO:16的氨基酸119的氨基酸为L,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸为S;(e)衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸为G,并且衣壳蛋白中对应于SEQ IDNO:16的氨基酸718的氨基酸为G;(f)衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸为H,衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸为N,衣壳蛋白中对应于SEQID NO:16的氨基酸505的氨基酸为R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸为M;(g)衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸为R;(h)衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸为A,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R;或(i)衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸为I,衣壳蛋白中对应于SEQID NO:16的氨基酸505的氨基酸为R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸为C。
在某些实施例中,衣壳蛋白包含SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列。
在另一方面中,本公开提供一种药物组合物,其包含本文中所描述的rAAV。
在另一方面中,本公开提供一种多核苷酸,其包含SEQ ID NO:14、62和72中所阐述的核酸序列。
在另一方面中,本公开提供一种用于制备rAAV的包装系统,其中所述包装系统包含(a)第一核苷酸序列,其编码一种或多种AAV Rep蛋白;(b)第二核苷酸序列,其编码如权利要求41至71中任一项所述的AAV的衣壳蛋白;和(c)第三核苷酸序列,其包含如权利要求41至71中任一项所述的AAV的rAAV基因组序列。
在某些实施例中,包装系统包含有包含第一核苷酸序列和第二核苷酸序列的第一载体,以及包含第三核苷酸序列的第二载体。
在某些实施例中,包装系统还包含有包含一种或多种辅助病毒基因的第四核苷酸序列。在某些实施例中,第四核苷酸序列包含于第三载体内。在某些实施例中,第四核苷酸序列包含一种或多种来自选自由以下组成的群组的病毒的基因:腺病毒、疱疹病毒、痘苗病毒和巨细胞病毒(CMV)。
在某些实施例中,第一载体、第二载体和/或第三载体为质粒。
在另一方面中,本公开提供一种用于rAAV的重组制备的方法,所述方法包含在可产生rAAV的条件下将本文中所描述的包装系统引入细胞中。
在另一方面中,本公开提供本文中所描述的rAAV,其用于如本文中所描述的用于在细胞中表达芳基硫酸酯酶A(ARSA)多肽的方法中。
在另一方面中,本公开提供本文中所描述的rAAV,其用于如本文中所描述的用于治疗患有异染性脑白质营养不良(MLD)的受试者的方法中。
附图说明
图1A、1B、1C和1D分别为T-001、pHMI-5000、pHMI-5003和pHMI-hARSA1-TC-002载体的载体图。
图2A、2B和2C。图2A为展示在用媒剂对照物或包装于AAVHSC15衣壳中的pHMI-5000处理的ARSA(-/-)小鼠中,使用抗LAMP-1抗体藉由免疫组织化学研究的来源于LAMP-1免疫反应性的总像素强度的定量的图(dWM:背部白质;vWM:腹部白质;和vGM:腹部灰质)。图2B为展示随时间推移,在对照组小鼠(WT/Het)和ARSA(-/-)小鼠的脑中测量到的C18:0硫苷脂含量的图。图2C为展示在用4e13 vg/kg的剂量(剂量-4)的包装于AAVHSC15衣壳中的pHMI-hARSA1-TC-002或媒剂对照物处理的ARSA(-/-)小鼠中的硫苷脂含量的变化(以与年龄匹配野生型对照物相比的倍数形式)的图。图2D为图的集合,其展示在用4e13 vg/kg或6e13 vg/kg的剂量的包装于AAVHSC15衣壳中的pHMI-5000或媒剂对照物处理的ARSA(-/-)小鼠的前脑、中脑和后脑中的C18:0及C18:1硫苷脂同种型含量的变化(以与年龄匹配野生型对照物相比的倍数形式)。图2E为图的集合,其展示在用4e13 vg/kg的剂量的包装于AAVHSC15衣壳中的pHMI-5000或媒剂对照物处理的ARSA(-/-)小鼠的前脑、中脑和后脑中的C18:0及C18:1硫苷脂同种型含量的变化(以与年龄匹配野生型对照物相比的倍数形式)。图2F为图的集合,其展示在用4e13 vg/kg的剂量的包装于AAVHSC15衣壳中的pHMI-5000或媒剂对照物处理的ARSA(-/-)小鼠的前脑、中脑和后脑中的C24:0及C24:1硫苷脂同种型含量的变化(以与年龄匹配野生型对照物相比的倍数形式)。图2G为图的集合,其展示在用4e13 vg/kg的剂量的包装于AAVHSC15衣壳中的pHMI-5000或媒剂对照物处理的ARSA(-/-)小鼠的前脑、中脑和后脑中的总硫苷脂同种型含量的变化(以与年龄匹配野生型对照物相比的倍数形式)。
图3A和3B。图3A为展示在对照组小鼠(WT/Het)和ARSA(-/-)小鼠中,在四周时测量的髓鞘和淋巴细胞蛋白质(MAL)mRNA转录物的含量的图。图3B为展示与年龄匹配野生型小鼠和用媒剂处理的ARSA(-/-)小鼠相比,在用4e13 vg/kg的剂量(剂量-4)的包装于AAVHSC15衣壳中的pHMI-5000处理的ARSA(-/-)小鼠中检测到的MAL转录物的含量的图。图3C为展示在施用4e13 vg/kg的包装于AAVHSC15衣壳中的pHMI-5000或媒剂对照物之后第12或52周,在野生型小鼠或ARSA(-/-)小鼠中检测到的MAL转录物拷贝数的图。
图4为展示ARSA(-/-)小鼠的脑中的以每个转导的细胞计的载体基因组的数目与以每ng cDNA计的hARSA的拷贝数之间的相关性的曲线。
图5为展示在静脉内施用包装于AAV9或AAVHSC15衣壳中的转移载体pHMI-5000(在每种情况下以2e13 vg/kg的剂量施用)之后,ARSA(-/-)小鼠的脑中的以每个转导的细胞计的载体基因组的数目的图。
图6为展示在静脉内施用包装于AAV9或AAVHSC15衣壳中并以所指示的剂量施用的转移载体pHMI-5000之后,在ARSA(-/-)小鼠的脑中测量到的正常人类ARSA酶活性水平的百分比的图。
图7为展示在静脉内施用包装于AAV9或AAVHSC15中的转移载体pHMI-5000(在每种情况下以4e13 vg/kg的剂量)之后,ARSA(-/-)小鼠的脑中以每个细胞计的载体基因组的数目的图。
图8为展示在静脉内(IV)或鞘内(IT)施用包装于AAVHSC15中的转移载体pHMI-5000之后,后脑及中脑中的正常人类ARSA酶活性的百分比的图。
图9A、9B、9C和9D。图9A为展示在以所指示的剂量向ARSA(-/-)小鼠静脉内施用包装于AAVHSC15衣壳中的转移载体pHMI-5000之后,在脑中实现的正常hARSA活性的百分比的图。图9B为展示在以所指示的剂量静脉内施用包装于AAVHSC15衣壳中的转移载体pHMI-5000之后,ARSA(-/-)小鼠的大脑中的以每个细胞计的载体基因组的数目的图。图9C为展示在给药后12周的过程中,给药4e13 vg/kg的包装于AAVHSC15衣壳中的pHMI-5000的新生ARSA(-/-)小鼠中的hARSA酶活性水平的图。图9D为展示给药4e13 vg/kg的包装于AAVHSC15衣壳中的pHMI-5000的成年ARSA(-/-)小鼠的大脑中的ARSA酶活性水平(经由hARSA转录物分析)的图。图9E为展示在施用单次静脉内4e13 vg/kg的剂量的包装于AAVHSC15衣壳中的pHMI-5000的ARSA(-/-)小鼠的脑中,以每ug基因组DNA计的载体基因组的数目的图。图9F为展示在施用单次静脉内4e13 vg/kg的剂量的包装于AAVHSC15衣壳中的pHMI-5000的ARSA(-/-)小鼠的脑中,以每ng RNA计的ARSA转录物的拷贝数的图。
图10A和10B分别为TC-013.pHMIA2和TC-015.pKITR载体的载体图。
图11为展示在施用转移载体pHMI-5000(CBA启动子)、TC-013.pHMIA2(CALM1启动子)和TC-015.pKITR(smCBA启动子)(在每种情况下包装于AAVHSC15衣壳中并以4e13 vg/kg的剂量静脉内施用)的小鼠ARSA(-/-)小鼠的脑中,以每个细胞计的转导的病毒基因组的数目的图。
图12为展示在施用转移载体pHMI-5000(CBA启动子)和TC-015.pKITR(smCBA启动子)(在每种情况下包装于AAVHSC15衣壳中并以4e13 vg/kg的剂量静脉内施用)的小鼠ARSA(-/-)小鼠的脑中检测到的正常人类ARSA酶活性的百分比的图。
图13为免疫印迹的照片,其展示使用抗hARSA抗体的小鼠的脑中hARSA的表达。向ARSA(-/-)小鼠施用转移载体pHMI-5000(CBA启动子)和TC-015.pKITR(smCBA启动子),在每种情况下包装于AAVHSC15衣壳中并分别以4e13 vg/kg和8e13 vg/kg的剂量静脉内施用(对于每种载体,n=5只小鼠)。
图14为转移载体pHMI-5004的载体图。
图15为转移载体pHMI-5005的载体图。
图16为展示用所指示的剂量的包装于AAVHSC15衣壳中的pHMI-5005处理或用媒剂对照物处理的非人类灵长类动物中的丙氨酸氨基转移酶(ALT)含量的图。
图17为展示给药包装于AAVHSC15衣壳中的pHMI-5005的非人类灵长类动物的中枢神经系统(CNS)和脑脊髓液(CSF)中的ARSA活性的图。
具体实施方式
本文中提供可恢复细胞中的ARSA基因功能的腺相关病毒(AAV)组合物,以及使用其治疗与ARSA基因功能降低相关的疾病(例如MLD)的方法。还提供用于制备腺相关病毒组合物的包装系统。
I.定义
如本文所用,术语“复制缺陷型腺相关病毒”是指包含缺少Rep和Cap基因的基因组的AAV。
如本文所用,术语“ARSA基因”是指芳基硫酸酯酶A基因。由国家生物技术信息中心(National Center for Biotechnology Information;NCBI)基因ID 410鉴别人类ARSA基因。ARSA mRNA的示例性核苷酸序列提供为SEQ ID NO:14。ARSA多肽的示例性氨基酸序列提供为SEQ ID NO:23。
如本文所用,术语“转移基因组”是指包含可操作地连接于外源性转录调节元件的编码序列的重组AAV基因组,所述外源性转录调节元件在转移基因组被引入细胞中时介导编码序列的表达。在某些实施例中,转移基因组未整合在细胞的染色体DNA中。所属领域的技术人员将了解,转移基因组中的包含可操作地连接于ARSA编码序列的转录调节元件的部分相对于ARSA编码序列的转录方向可为有义或反义定向。
如本文所用,术语“进化枝F衣壳蛋白”是指分别与在本文SEQ ID NO:1的氨基酸1-736、138-736和203-736中所阐述的VP1、VP2或VP3氨基酸序列具有至少90%一致性的AAVVP1、VP2或VP3衣壳蛋白。
如本文所用,两个核苷酸序列之间或两个氨基酸序列之间的“一致性百分比”是藉由将所比对的序列对之间的匹配数目乘以100并除以所比对的区域的长度(包括内部空位)来计算。一致性评分仅对完美匹配进行计数,并且不考虑氨基酸彼此之间的相似性程度。长度中仅包括内部空位,而不包括序列末端处的空位。
如本文所用,术语“与ARSA基因突变相关的疾病或病症”是指由ARSA基因的突变引起、由ARSA基因的突变加剧或在遗传学上与ARSA基因的突变相关的任何疾病或病症。在某些实施例中,与ARSA基因突变相关的疾病或病症为异染性脑白质营养不良(MLD)。
如本文所用,术语“编码序列”是指互补DNA(cDNA)的编码多肽的部分,其开始于起始密码子并且终止于终止密码子。基因可由于替代性剪接、替代性翻译起始和群体内的变化而具有一个或多个编码序列。编码序列可以是野生型或密码子改变型。示例性野生型ARSA编码序列阐述于SEQ ID NO:24中。
如本文所用,术语“以沉默方式改变”是指在不改变由编码序列或经填充子插入的编码序列编码的多肽的氨基酸序列的情况下,基因的编码序列或经填充子插入的编码序列的变化(例如通过核苷酸取代)。此类沉默变化的有利之处在于,其可提高编码序列的翻译效率,和/或在编码序列被转导到细胞中时防止与内源性基因的对应序列重组。
在本公开中,相对于起始密码子的第一核苷酸指定ARSA基因中的核苷酸位置。起始密码子的第一核苷酸是位置1;位于起始密码子的第一核苷酸5'的核苷酸具有负数;位于起始密码子的第一核苷酸3'的核苷酸具有正数。人类ARSA基因的示例性核苷酸1为NCBI参考序列的核苷酸374:NG_009260.2(区域:5028-10426),并且人类ARSA基因的示例性核苷酸3为NCBI参考序列的核苷酸376:NG_009260.2(区域:5028-10426)。与起始密码子5'相邻的核苷酸是核苷酸-1。
在本公开中,相对于涵盖起始密码子的第一核苷酸的外显子指定ARSA基因中的外显子和内含子,所述第一核苷酸为NCBI参考序列之核苷酸374:NG_009260.2(区域:5028-10426)。涵盖起始密码子的第一核苷酸的外显子是外显子1。外显子3'到外显子1为5'到3':外显子2、外显子3等。内含子3'到外显子1为5'到3':内含子1、内含子2等。因此,ARSA基因自5'到3'包含:外显子1、内含子1、外显子2、内含子2、外显子3等。人类ARSA基因的示例性外显子1为NCBI参考序列的核苷酸374-597:NG_009260.2(区域:5028-10426)。人类ARSA基因的示例性内含子1为NCBI参考序列的核苷酸598-746:NG_009260.2(区域:5028-10426)。
如本文所用,术语“转录调节元件”或“TRE”是指顺式作用核苷酸序列,例如DNA序列,其藉由RNA聚合酶调控(例如控制、增加或减少)可操作地连接的核苷酸序列的转录以形成RNA分子。TRE依靠一种或多种反式作用分子,如转录因子来调控转录。因此,一个TRE在其与不同的反式作用分子接触时(例如当其位于不同类型的细胞中时)可以不同方式调控转录。TRE可包含一种或多种启动子元件和/或增强子元件。所属领域的技术人员将了解,基因中的启动子和增强子元件可在位置上靠近,并且术语“启动子”可指包含启动子元件和增强子元件的序列。因此,术语“启动子”不排除序列中的增强子元件。启动子和增强子元件无需来源于相同基因或物种,并且每个启动子或增强子元件的序列可与基因组中的对应内源性序列一致或大体上一致。
如本文所用,术语“可操作地连接”用于描述TRE与待转录的编码序列之间的连接。通常,使基因表达处于包含一种或多种启动子和/或增强子元件的TRE的控制下。如果编码序列的转录由TRE控制或影响,那么编码序列“可操作地连接”于TRE。TRE的启动子和增强子元件可自编码序列呈任何定向和/或距离,只要获得所需转录活性即可。在某些实施例中,TRE位于编码序列的上游。
如本文所用,术语“核糖体跳跃元件”是指编码短肽序列的核苷酸序列,其能够引起由一个mRNA分子的翻译产生两个肽链。在某些实施例中,核糖体跳跃元件编码包含X1X2EX3NPGP的共有基元之肽,其中X1为D或G,X2为V或I,并且X3为任何氨基酸(SEQ ID NO:34)。在某些实施例中,核糖体跳跃元件编码明脉扁刺蛾(Thosea asigna)病毒2A肽(T2A)、猪捷申病毒(porcine teschovirus)-1 2A肽(P2A)、口蹄疫病毒2A肽(F2A)、马鼻炎A病毒2A肽(E2A)、细胞质多角体病毒2A肽(BmCPV 2A)或家蚕(B.mori)2A肽的软化病病毒(BmIFV2A)。T2A肽和P2A肽的示例性氨基酸序列分别阐述于SEQ ID NO:37和38中。T2A元件和P2A元件的示例性核苷酸序列分别阐述于SEQ ID NO:66和63中。在某些实施例中,核糖体跳跃元件编码在N端还包含Gly-Ser-Gly的序列的肽,任选地其中Gly-Ser-Gly的序列由GGCAGCGGA的核苷酸序列编码。尽管不希望受理论约束,但假设核糖体跳跃元件通过以下发挥功能:终止第一肽链的翻译和再起始第二肽链的翻译;或由核糖体跳跃元件编码的肽序列中的肽键通过编码的肽的内在蛋白酶活性进行裂解,或环境(例如胞质溶胶)中的另一种蛋白酶。
如本文所用,术语“核糖体跳跃肽”是指由核糖体跳跃元件编码的肽。
如本文所用,术语“聚腺苷酸化序列”是指当转录成RNA时构成聚腺苷酸化信号序列的DNA序列。聚腺苷酸化序列可以是原生的(例如来自ARSA基因)或外源的。外源性聚腺苷酸化序列可以是哺乳动物或病毒性聚腺苷酸化序列(例如SV40聚腺苷酸化序列)。
如本文所用,“外源性聚腺苷酸化序列”是指与ARSA基因(例如人类ARSA基因)的内源性聚腺苷酸化序列不一致或大体上一致的聚腺苷酸化序列。在某些实施例中,外源性聚腺苷酸化序列为相同物种(例如人类)中的非ARSA基因的聚腺苷酸化序列。在某些实施例中,外源性聚腺苷酸化序列为不同物种(例如病毒)的聚腺苷酸化序列。
如本文所用,在向受试者施用AAV的情形下,术语“有效量”是指达到所期望的预防或治疗效果的AAV的量。
II.腺相关病毒组合物
在一个方面中,本文中提供新颖重组AAV(例如复制缺陷型AAV)组合物,其适用于在具有降低的或以其它方式缺乏ARSA基因功能的细胞中表达ARSA多肽。在某些实施例中,本文中所公开的rAAV包含:AAV衣壳,其包含衣壳蛋白(例如进化枝F衣壳蛋白);和转移基因组,其包含可操作地连接于ARSA编码序列(例如以沉默方式改变的ARSA编码序列)的转录调节元件,从而实现经AAV转导的细胞中的ARSA的染色体外表达。
来自所属领域中已知的任何衣壳的衣壳蛋白可用于本文中所公开的rAAV组合物中,包括(但不限于)来自AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8或AAV9血清型的衣壳蛋白。例如,在某些实施例中,衣壳蛋白包含与SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的氨基酸序列。在某些实施例中,衣壳蛋白包含与SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的氨基酸序列,其中:衣壳蛋白中对应于SEQ ID NO:16的氨基酸206的氨基酸为C;衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸为H;衣壳蛋白中对应于SEQID NO:16的氨基酸312的氨基酸为Q;衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸为A;衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸为N;衣壳蛋白中对应于SEQID NO:16的氨基酸468的氨基酸为S;衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸为I;衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R;衣壳蛋白中对应于SEQID NO:16的氨基酸590的氨基酸为R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸为G或Y;衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸为M;衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸为R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸为K;衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸为C;或衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸为G。在某些实施例中,衣壳蛋白中对应于SEQ IDNO:16的氨基酸626的氨基酸为G,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸为G。在某些实施例中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸为H,衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸为N,衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸为M。在某些实施例中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸为R。在某些实施例中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸为A,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R。在某些实施例中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸为I,衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸为C。在某些实施例中,衣壳蛋白包含SEQ ID NO:2、3、4、6、7、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列。
例如,在某些实施例中,衣壳蛋白包含与SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、15 16或17的氨基酸138-736的氨基酸序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的氨基酸序列。在某些实施例中,衣壳蛋白包含与SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的氨基酸序列,其中:衣壳蛋白中对应于SEQ ID NO:16的氨基酸151的氨基酸为R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸160的氨基酸为D;衣壳蛋白中对应于SEQID NO:16的氨基酸206的氨基酸为C;衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸为H;衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸为Q;衣壳蛋白中对应于SEQID NO:16的氨基酸346的氨基酸为A;衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸为N;衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸为S;衣壳蛋白中对应于SEQID NO:16的氨基酸501的氨基酸为I;衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸590的氨基酸为R;衣壳蛋白中对应于SEQID NO:16的氨基酸626的氨基酸为G或Y;衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸为M;衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸为R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸为K;衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸为C;或衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸为G。在某些实施例中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸为G,并且衣壳蛋白中对应于SEQID NO:16的氨基酸718的氨基酸为G。在某些实施例中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸为H,衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸为N,衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸为M。在某些实施例中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸为R。在某些实施例中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸为A,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R。在某些实施例中,衣壳蛋白中对应于SEQ IDNO:16的氨基酸501的氨基酸为I,衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸为C。在某些实施例中,衣壳蛋白包含SEQ ID NO:2、3、4、5、6、7、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列。
例如,在某些实施例中,衣壳蛋白包含与SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的氨基酸序列。在某些实施例中,衣壳蛋白包含与SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的氨基酸序列,其中:衣壳蛋白中对应于SEQ ID NO:16的氨基酸2的氨基酸为T;衣壳蛋白中对应于SEQ ID NO:16的氨基酸65的氨基酸为I;衣壳蛋白中对应于SEQ ID NO:16的氨基酸68的氨基酸为V;衣壳蛋白中对应于SEQ ID NO:16的氨基酸77的氨基酸为R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸119的氨基酸为L;衣壳蛋白中对应于SEQ ID NO:16的氨基酸151的氨基酸为R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸160的氨基酸为D;衣壳蛋白中对应于SEQ ID NO:16的氨基酸206的氨基酸为C;衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸为H;衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸为Q;衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸为A;衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸为N;衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸为S;衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸为I;衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸590的氨基酸为R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸为G或Y;衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸为M;衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸为R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸为K;衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸为C;或衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸为G。在某些实施例中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸2的氨基酸为T,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸为Q。在某些实施例中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸65的氨基酸为I,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸为Y。在某些实施例中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸77的氨基酸为R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸为K。在某些实施例中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸119的氨基酸为L,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸为S。在某些实施例中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸为G,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸为G。在某些实施例中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸为H,衣壳蛋白中对应于SEQID NO:16的氨基酸464的氨基酸为N,衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸为M。在某些实施例中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且衣壳蛋白中对应于SEQ IDNO:16的氨基酸687的氨基酸为R。在某些实施例中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸为A,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R。在某些实施例中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸为I,衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸为C。在某些实施例中,衣壳蛋白包含SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列。
在某些实施例中,AAV衣壳包含以下中的两个或更多个:(a)包含SEQ ID NO:2、3、4、6、7、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列的衣壳蛋白;(b)包含SEQID NO:2、3、4、5、6、7、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列的衣壳蛋白;和(c)包含SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列的衣壳蛋白。在某些实施例中,AAV衣壳包含:(a)具有由SEQ ID NO:2、3、4、6、7、10、11、12、13、15、16或17的氨基酸203-736组成的氨基酸序列的衣壳蛋白;(b)具有由SEQID NO:2、3、4、5、6、7、9、10、11、12、13、15、16或17的氨基酸138-736组成的氨基酸序列的衣壳蛋白;和(c)具有由SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736组成的氨基酸序列的衣壳蛋白。
在某些实施例中,AAV衣壳包含以下中的一种或多种:(a)包含与SEQ ID NO:8的氨基酸序列203-736具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的氨基酸序列的衣壳蛋白;(b)包含与SEQ ID NO:8的氨基酸序列138-736具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的氨基酸序列的衣壳蛋白;和(c)包含与SEQ ID NO:8的氨基酸序列1-736具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的氨基酸序列的衣壳蛋白。在某些实施例中,AAV衣壳包含以下中的一种或多种:(a)包含SEQ ID NO:8的氨基酸203-736的氨基酸序列的衣壳蛋白;(b)包含SEQ ID NO:8的氨基酸138-736的氨基酸序列的衣壳蛋白;和(c)包含SEQ ID NO:8的氨基酸1-736的氨基酸序列的衣壳蛋白。在某些实施例中,AAV衣壳包含以下中的两种或更多种:(a)包含SEQ ID NO:8的氨基酸203-736的氨基酸序列的衣壳蛋白;(b)包含SEQ ID NO:8的氨基酸138-736的氨基酸序列的衣壳蛋白;和(c)包含SEQ IDNO:8的氨基酸1-736的氨基酸序列的衣壳蛋白。在某些实施例中,AAV衣壳包含:(a)具有由SEQ ID NO:8的氨基酸203-736组成的氨基酸序列的衣壳蛋白;(b)具有由SEQ ID NO:8的氨基酸138-736组成的氨基酸序列的衣壳蛋白;和(c)具有由SEQ ID NO:8的氨基酸1-736组成的氨基酸序列的衣壳蛋白。
在某些实施例中,AAV衣壳包含以下中的一种或多种:(a)包含与SEQ ID NO:11的氨基酸序列203-736具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的氨基酸序列的衣壳蛋白;(b)包含与SEQ ID NO:11的氨基酸序列138-736具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的氨基酸序列的衣壳蛋白;和(c)包含与SEQ ID NO:11的氨基酸序列1-736具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的氨基酸序列的衣壳蛋白。在某些实施例中,AAV衣壳包含以下中的一种或多种:(a)包含SEQ ID NO:11的氨基酸203-736的氨基酸序列的衣壳蛋白;(b)包含SEQ ID NO:11的氨基酸138-736的氨基酸序列的衣壳蛋白;和(c)包含SEQ ID NO:11的氨基酸1-736的氨基酸序列的衣壳蛋白。在某些实施例中,AAV衣壳包含以下中的两种或更多种:(a)包含SEQ ID NO:11的氨基酸203-736的氨基酸序列的衣壳蛋白;(b)包含SEQ ID NO:11的氨基酸138-736的氨基酸序列的衣壳蛋白;和(c)包含SEQ IDNO:11的氨基酸1-736的氨基酸序列的衣壳蛋白。在某些实施例中,AAV衣壳包含:(a)具有由SEQ ID NO:11的氨基酸203-736组成的氨基酸序列的衣壳蛋白;(b)具有由SEQ ID NO:11的氨基酸138-736组成的氨基酸序列的衣壳蛋白;和(c)具有由SEQ ID NO:11的氨基酸1-736组成的氨基酸序列的衣壳蛋白。
在某些实施例中,AAV衣壳包含以下中的一种或多种:(a)包含与SEQ ID NO:13的氨基酸序列203-736具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的氨基酸序列的衣壳蛋白;(b)包含与SEQ ID NO:13的氨基酸序列138-736具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的氨基酸序列的衣壳蛋白;和(c)包含与SEQ ID NO:13的氨基酸序列1-736具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的氨基酸序列的衣壳蛋白。在某些实施例中,AAV衣壳包含以下中的一种或多种:(a)包含SEQ ID NO:13的氨基酸203-736的氨基酸序列的衣壳蛋白;(b)包含SEQ ID NO:13的氨基酸138-736的氨基酸序列的衣壳蛋白;和(c)包含SEQ ID NO:13的氨基酸1-736的氨基酸序列的衣壳蛋白。在某些实施例中,AAV衣壳包含以下中的两种或更多种:(a)包含SEQ ID NO:13的氨基酸203-736的氨基酸序列的衣壳蛋白;(b)包含SEQ ID NO:13的氨基酸138-736的氨基酸序列的衣壳蛋白;和(c)包含SEQ IDNO:13的氨基酸1-736的氨基酸序列的衣壳蛋白。在某些实施例中,AAV衣壳包含:(a)具有由SEQ ID NO:13的氨基酸203-736组成的氨基酸序列的衣壳蛋白;(b)具有由SEQ ID NO:13的氨基酸138-736组成的氨基酸序列的衣壳蛋白;和(c)具有由SEQ ID NO:13的氨基酸1-736组成的氨基酸序列的衣壳蛋白。
在某些实施例中,AAV衣壳包含以下中的一种或多种:(a)包含与SEQ ID NO:16的氨基酸序列203-736具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的氨基酸序列的衣壳蛋白;(b)包含与SEQ ID NO:16的氨基酸序列138-736具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的氨基酸序列的衣壳蛋白;和(c)包含与SEQ ID NO:16的氨基酸序列1-736具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的氨基酸序列的衣壳蛋白。在某些实施例中,AAV衣壳包含以下中的一种或多种:(a)包含SEQ ID NO:16的氨基酸203-736的氨基酸序列的衣壳蛋白;(b)包含SEQ ID NO:16的氨基酸138-736的氨基酸序列的衣壳蛋白;和(c)包含SEQ ID NO:16的氨基酸1-736的氨基酸序列的衣壳蛋白。在某些实施例中,AAV衣壳包含以下中的两种或更多种:(a)包含SEQ ID NO:16的氨基酸203-736的氨基酸序列的衣壳蛋白;(b)包含SEQ ID NO:16的氨基酸138-736的氨基酸序列的衣壳蛋白;和(c)包含SEQ IDNO:16的氨基酸1-736的氨基酸序列的衣壳蛋白。在某些实施例中,AAV衣壳包含:(a)具有由SEQ ID NO:16的氨基酸203-736组成的氨基酸序列的衣壳蛋白;(b)具有由SEQ ID NO:16的氨基酸138-736组成的氨基酸序列的衣壳蛋白;和(c)具有由SEQ ID NO:16的氨基酸1-736组成的氨基酸序列的衣壳蛋白。
适用于本文中所公开的AAV组合物中的转移基因组通常包含可操作地连接于ARSA编码序列的转录调节元件(TRE)。在某些实施例中,转移基因组包含TRE和ARSA编码序列5'的5'反向末端重复(5'ITR)核苷酸序列,以及TRE和ARSA编码序列3'的3'反向末端重复(3'ITR)核苷酸序列。
在某些实施例中,ARSA编码序列包含ARSA基因的全部或大体上全部编码序列。在某些实施例中,转移基因组包含编码SEQ ID NO:23的核苷酸序列并可任选地还包含位于ARSA编码序列3'的外源性聚腺苷酸化序列。在某些实施例中,编码SEQ ID NO:23的核苷酸序列为野生型的(例如具有SEQ ID NO:24中所阐述的序列)。在某些实施例中,编码SEQ IDNO:23的核苷酸序列是以沉默方式改变(例如具有SEQ ID NO:14、62或72中所阐述的序列)。
在某些实施例中,ARSA编码序列编码包含ARSA蛋白质的全部或大体上全部氨基酸序列的多肽。在某些实施例中,ARSA编码序列编码野生型ARSA蛋白质(例如人类ARSA蛋白质)的氨基酸序列。在某些实施例中,ARSA编码序列编码突变型ARSA蛋白质(例如人类ARSA蛋白质)的氨基酸序列,其中突变型ARSA多肽为野生型ARSA多肽的功能等效物,即,可充当野生型ARSA多肽。在某些实施例中,功能上等效的ARSA多肽还包含至少一种未在野生型ARSA多肽中发现的特征,例如抵抗蛋白质降解的能力。
在某些实施例中,适用于本文中所公开的AAV组合物中的转移基因组通常包含转录调节元件(TRE),其可操作地连接于编码ARSA和/或SUMF1的编码序列。硫酸酯酶修饰因子1(SUMF1)基因编码一种酶,所述酶通过使底物硫酸酯酶中的半胱胺酸残基氧化成活性位点3-氧代丙氨酸残基(其亦称为C-α-甲酰甘氨酸)来催化硫酸酯的水解。与SUMF1相关的疾病包括多种硫酸酯酶缺乏症和异染性脑白质营养不良。
在某些实施例中,SUMF1编码序列包含SUMF1基因的全部或大体上全部编码序列。在某些实施例中,转移基因组包含编码SEQ ID NO:29的核苷酸序列并可任选地还包含位于SUMF1编码序列3'的外源性聚腺苷酸化序列。在某些实施例中,编码SEQ ID NO:29的核苷酸序列为野生型(例如具有SEQ ID NO:64中所阐述的序列)。在某些实施例中,编码SEQ IDNO:29的核苷酸序列是以沉默方式改变。
在某些实施例中,SUMF1编码序列编码包含SUMF1蛋白质的全部或大体上全部氨基酸序列的多肽。在某些实施例中,SUMF1编码序列编码野生型SUMF1蛋白质(例如人类SUMF1蛋白质(hSUMF1))的氨基酸序列。在某些实施例中,SUMF1编码序列编码突变型SUMF1蛋白质(例如人类SUMF1蛋白质)的氨基酸序列,其中突变型SUMF1多肽为野生型SUMF1多肽的功能等效物,即,可充当野生型SUMF1多肽。在某些实施例中,功能上等效的SUMF1多肽还包含至少一种未在野生型SUMF1多肽中发现的特征,例如抵抗蛋白质降解的能力。
在某些实施例中,转移基因组被设计成表达hARSA和hSUMF1并包含核苷酸序列,所述核苷酸序列包含编码hARSA的第一编码序列和编码hSUMF1的第二编码序列。在某些实施例中,编码hARSA的第一编码序列和编码hSUMF1的第二编码序列是由核糖体跳跃元件分离。可使用所属领域中已知的任何核糖体跳跃元件,例如本文中其它地方描述的核糖体跳跃元件。在某些实施例中,包含编码hARSA的第一编码序列和编码hSUMF1的第二编码序列的核苷酸序列包含SEQ ID NO:30中所阐述的核苷酸序列。
在某些实施例中,适用于本文中所公开的AAV组合物中的转移基因组通常包含转录调节元件(TRE),其可操作地连接于编码ARSA和/或SapB的编码序列。鞘脂激活蛋白原(PSAP)基因编码高保守性前原蛋白,所述前原蛋白被蛋白水解处理以产生四种主要裂解产物,包括鞘脂激活蛋白A、B、C和D。前体蛋白质的每个结构域的长度为大致80个氨基酸残基,其中半胱胺酸残基和糖基化位点的放置几乎相同。鞘脂激活蛋白A-D主要位于溶酶体隔室,其在溶酶体隔室中促进具有短寡糖基团的鞘糖脂的分解代谢。前体蛋白质以分泌蛋白质和整合膜蛋白质两者的形式存在并且具有神经营养活性。此基因中的突变与戈谢病(Gaucherdisease)和异染性脑白质营养不良相关。已表明鞘脂激活蛋白B(SapB)可刺激半乳糖-脑甘脂硫酸酯由ARSA进行的水解、GM1神经节苷脂由β-半乳糖苷酶进行的水解和球形三酰神经酰胺由α-半乳糖苷酶A进行的水解。已表明SapB与鞘脂水解酶的底物形成溶解复合物。
在某些实施例中,SapB编码序列包含SapB基因的全部或大体上全部编码序列。在某些实施例中,转移基因组包含编码SEQ ID NO:33的核苷酸序列并可任选地还包含位于SapB编码序列3'的外源性聚腺苷酸化序列。在某些实施例中,编码SEQ ID NO:33的核苷酸序列为野生型(例如具有SEQ ID NO:73中所阐述的序列)。在某些实施例中,编码SEQ IDNO:33的核苷酸序列是以沉默方式改变。
在某些实施例中,SapB编码序列编码包含SapB蛋白质的全部或大体上全部氨基酸序列的多肽。在某些实施例中,SapB编码序列编码野生型SapB蛋白质(例如人类SapB蛋白质(hSapB))的氨基酸序列。在某些实施例中,SapB编码序列编码突变型SapB蛋白质(例如人类SapB蛋白质)的氨基酸序列,其中突变型SapB多肽为野生型SapB多肽的功能等效物,即,可充当野生型SapB多肽。在某些实施例中,功能上等效的SapB多肽还包含至少一种未在野生型SapB多肽中发现的特征,例如抵抗蛋白质降解的能力。
在某些实施例中,转移基因组被设计成表达hARSA和hSapB并包含核苷酸序列,所述核苷酸序列包含编码hARSA的第一编码序列和编码hSapB的第二编码序列。在某些实施例中,编码hARSA的第一编码序列和编码hSapB的第二编码序列是由核糖体跳跃元件分离。可使用所属领域中已知的任何核糖体跳跃元件,例如本文中其它地方描述的核糖体跳跃元件。在某些实施例中,包含编码hARSA的第一编码序列和编码hSapB的第二编码序列的核苷酸序列包含SEQ ID NO:74中所阐述的核苷酸序列。
转移基因组可用于表达任何哺乳动物细胞(例如人类细胞)中的ARSA、SUMF1和/或SapB。因此,TRE可在任何哺乳动物细胞(例如人类细胞)中具有活性。在某些实施例中,TRE在广泛的人类细胞中具有活性。此类TRE可包含组成型启动子和/或增强子元件,包括巨细胞病毒(CMV)启动子/强化子(例如包含与SEQ ID NO:58至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致的核苷酸序列)、SV40启动子、鸡β肌动蛋白(CBA)启动子(例如包含与SEQ ID NO:59或25至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致的核苷酸序列)、smCBA启动子(例如包含与SEQ ID NO:55至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致的核苷酸序列)、人类延长因子1α(EF1α)启动子(例如包含与SEQ ID NO:40至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致的核苷酸序列)、包含转录因子结合位点的小鼠细小病毒(MVM)内含子(例如包含与SEQ ID NO:35至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致的核苷酸序列)、人类磷酸甘油酸激酶(PGK1)启动子、人类泛蛋白C(Ubc)启动子、人类β肌动蛋白启动子、人类神经元特异性烯醇酶(ENO2)启动子、人类β-葡糖苷酸酶(GUSB)启动子、兔β-球蛋白元件(例如包含与SEQ ID NO:60至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致的核苷酸序列)、人类钙调蛋白1(CALM1)启动子(例如包含与SEQ ID NO:54至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致的核苷酸序列)和/或人类甲基-CpG结合蛋白质2(MeCP2)启动子。这些TRE中的任一个可以任何顺序组合以驱动有效转录。例如,转移基因组可包含CMV增强子、CBA启动子和来自兔β-球蛋白基因的外显子3的剪接受体,统称为CAG启动子(例如包含与SEQ ID NO:28至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致的核苷酸序列)。例如,转移基因组可包含CMV增强子和CBA启动子的杂交物,接着为剪接供体和剪接受体,统称为CASI启动子区域(例如包含与SEQ ID NO:63至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致的核苷酸序列)。
或者,TRE可为组织特异性TRE,即,其在特定组织和/或器官中具有活性。组织特异性TRE包含一个或多个组织特异性启动子和/或增强子元件,和任选地一个或多个组成型启动子和/或增强子元件。所属领域的技术人员将理解,可通过所属领域中熟知的方法从组织中特异性表达的基因分离组织特异性启动子和/或增强子元件。
在某些实施例中,TRE为脑特异性(例如神经元特异性、神经胶质细胞特异性、星形胶质细胞特异性、少突胶质细胞特异性、微神经胶质细胞特异性和/或中枢神经系统特异性)。示例性脑特异性TRE可包含一个或多个来自(但不限于)人类胶质细胞原纤维酸性蛋白(GFAP)启动子、人类突触蛋白1(SYN1)启动子、人类突触蛋白2(SYN2)启动子、人类金属硫蛋白3(MT3)启动子和/或人类蛋白脂质蛋白质1(PLP1)启动子的元件。更多的脑特异性启动子元件公开于WO 2016/100575A1中,其以全文引用的方式并入本文中。
在某些实施例中,转移基因组包含两个或更多个TRE,任选地包含以上所公开的TRE中的至少一个。所属领域的技术人员将理解,这些TRE中的任一个可以任何顺序组合,并且组成型TRE和组织特异性TRE的组合可驱动有效和组织特异性转录。
在某些实施例中,转移载体还包含非编码填充序列(例如包含与SEQ ID NO:39至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致的核苷酸序列)。非编码填充序列可用于将载体的尺寸保持在适当的限制内以用于有效DNA包装,并且因此可用于提高DNA包装的功效。所属领域的技术人员将认识到,填充序列的性质可对载体的功能具有影响,并且因此将选择最合适的填充序列来使用。
在某些实施例中,转移载体还包含位于ARSA编码序列5'或插入ARSA编码序列中的内含子。此类内含子可增加转基因表达,例如藉由减少转录沉默和增强从细胞核到细胞质的mRNA输出。在某些实施例中,转移基因组从5'到3'包含:非编码外显子、内含子和ARSA编码序列。在某些实施例中,将内含子序列插入ARSA编码序列中,任选地其中在连接两个原生外显子的核苷酸间键处插入内含子。在某些实施例中,在连接原生外显子1与外显子2的核苷酸间键处插入内含子。
内含子可包含ARSA基因的原生内含子序列、来自不同物种的内含子序列或来自相同物种的不同基因和/或合成内含子序列。所属领域的技术人员将了解,合成内含子序列可被设计成藉由引入所属领域中已知的任何共有剪接基元来介导RNA剪接(例如Sibley等人,(2016)《自然综述遗传学(Nature Reviews Genetics)》,17,407-21,其以全文引用的方式并入本文中)。示例性内含子序列提供于Lu等人(2013)《分子疗法(Molecular Therapy)》21(5):954-63,和Lu等人(2017)《人类基因疗法(Hum.Gene Ther.)》,28(1):125-34中,其以全文引用的方式并入本文中。在某些实施例中,转移基因组包含SV40内含子(例如包含与SEQID NO:31至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致的核苷酸序列)或小鼠细小病毒(MVM)内含子(例如包含与SEQ ID NO:35至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致的核苷酸序列)。在某些实施例中,转移基因组包含SV40内含子(例如包含SEQ ID NO:31中所阐述的核苷酸序列)或小鼠细小病毒(MVM)内含子(例如包含SEQ ID NO:35中所阐述的核苷酸序列)。在某些实施例中,转移基因组包含嵌合内含子序列,其包含鸡和兔序列的组合,部分包含未转录的鸡ACTB(cACTB)启动子、全部cACTB外显子1、部分cACTB内含子1、部分兔HBB2(rHBB2)内含子2和部分rHBB2外显子3(例如SEQ ID NO:32)。在某些实施例中,转移基因组包含嵌合内含子序列(例如包含与SEQ IDNO:32至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致的核苷酸序列)。在某些实施例中,转移基因组包含嵌合内含子序列(例如包含SEQ ID NO:32中所阐述的核苷酸序列)。
在某些实施例中,转移基因组包含TRE,其包含CMV增强子、CBA启动子和嵌合内含子序列(例如包含与SEQ ID NO:36至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致的核苷酸序列)。在某些实施例中,转移基因组包含有包含SEQ ID NO:36的TRE。
在某些实施例中,本文中所公开的转移基因组还包含转录终止子(例如聚腺苷酸化序列)。在某些实施例中,转录终止子位于ARSA编码序列的3'。转录终止子可为任何有效终止转录的序列并且所属领域的技术人员将理解,可从任何表达于需要ARSA编码序列的转录的细胞中的基因分离此类序列。在某些实施例中,转录终止子包含聚腺苷酸化序列。在某些实施例中,聚腺苷酸化序列与人类ARSA基因的内源性聚腺苷酸化序列一致或大体上一致。在某些实施例中,聚腺苷酸化序列是外源性聚腺苷酸化序列。在某些实施例中,聚腺苷酸化序列是SV40聚腺苷酸化序列(例如包含SEQ ID NO:31、42、43或45中所阐述的核苷酸序列,或与其互补的核苷酸序列)。在某些实施例中,聚腺苷酸化序列包含SEQ ID NO:42中所阐述的序列。
在某些实施例中,转移基因组从5'到3'包含:TRE、ARSA编码序列和聚腺苷酸化序列。在某些实施例中,TRE与SEQ ID NO:25、32、36、54、55和/或58中的任一个具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性;ARSA编码序列与SEQ IDNO:14、24、62或72具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性;和/或聚腺苷酸化序列与SEQ ID NO:42、43和45中的任一个具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性。
在某些实施例中,TRE包含SEQ ID NO:36中所阐述的序列;ARSA编码序列包含SEQID NO:14中所阐述的序列;和/或聚腺苷酸化序列包含SEQ ID NO:42中所阐述的序列。在某些实施例中,TRE从5'到3'包含SEQ ID NO:58中所阐述的序列、SEQ ID NO:25中所阐述的序列和SEQ ID NO:32中所阐述的序列。
在某些实施例中,TRE包含SEQ ID NO:54中所阐述的序列;ARSA编码序列包含SEQID NO:62中所阐述的序列;和/或聚腺苷酸化序列包含SEQ ID NO:42中所阐述的序列。在某些实施例中,TRE包含SEQ ID NO:55中所阐述的序列;ARSA编码序列包含SEQ ID NO:62中所阐述的序列;和/或聚腺苷酸化序列包含SEQ ID NO:42中所阐述的序列。
在某些实施例中,TRE包含SEQ ID NO:36中所阐述的序列;ARSA编码序列包含SEQID NO:72中所阐述的序列;和/或聚腺苷酸化序列包含SEQ ID NO:42中所阐述的序列。在某些实施例中,TRE从5'到3'包含SEQ ID NO:58中所阐述的序列、SEQ ID NO:25中所阐述的序列和SEQ ID NO:32中所阐述的序列。
在某些实施例中,转移基因组还包含hSUMF1编码序列。在某些实施例中,转移基因组从5'到3'包含:TRE、ARSA编码序列、2A元件和hSUMF1编码序列。在某些实施例中,TRE与SEQ ID NO:25、32、36、54、55和/或58具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性;ARSA编码序列与SEQ ID NO:62具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性;2A组件与SEQ ID NO:63具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性;并且hSUMF1序列与SEQ ID NO:64具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性。在某些实施例中,还包含hSUMF1编码序列的转移基因组从5'到3'包含:包含SEQ IDNO:54或55中所阐述的序列的TRE、包含SEQ ID NO:62中所阐述的序列的hARSA编码序列、包含SEQ ID NO:63中所阐述的序列的2A元件和包含SEQ ID NO:64中所阐述的序列的hSUMF1编码序列。在某些实施例中,hARSA-2A-hSUMF1编码序列包含SEQ ID NO:30中所阐述的序列。
在某些实施例中,转移基因组还包含hSapB编码序列。在某些实施例中,转移基因组从5'到3'包含:TRE、ARSA编码序列、2A元件和hSapB编码序列。在某些实施例中,TRE与SEQID NO:25、32、36、54、55和/或58具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性;ARSA编码序列与SEQ ID NO:72具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性;2A元件与SEQ ID NO:63具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性;并且hSapB序列与SEQ IDNO:73具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性。在某些实施例中,还包含hSapB编码序列的转移基因组从5'到3'包含:包含SEQ ID NO:36中所阐述的序列的TRE、包含SEQ ID NO:72中所阐述的序列的hARSA编码序列、包含SEQ ID NO:63中所阐述的序列的2A元件和包含SEQ ID NO:74中所阐述的序列的hSapB编码序列。在某些实施例中,hARSA-2A-hSapB编码序列包含SEQ ID NO:74中所阐述的序列。
在某些实施例中,转移基因组包含与SEQ ID NO:41、44、46、65、67或75至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致的序列。在某些实施例中,转移基因组包含SEQ ID NO:41、44、46、65、67或75中所阐述的核苷酸序列。在某些实施例中,转移基因组的核苷酸序列由SEQ ID NO:41、44、46、65、67或75中所阐述的核苷酸序列组成。在某些实施例中,转移基因组包含SEQ ID NO:44中所阐述的核苷酸序列。在某些实施例中,转移基因组的核苷酸序列由SEQ ID NO:44中所阐述的核苷酸序列组成。
在某些实施例中,本文中所公开的转移基因组还包含TRE5'的5'反向末端重复(5'ITR)核苷酸序列,和ARSA编码序列3'的3'反向末端重复(3'ITR)核苷酸序列。来自任何AAV血清型或其变体的ITR序列均可用于本文中所公开的转移基因组中。5'和3'ITR可来自相同血清型的AAV或不同血清型的AAV。用于本文中所公开的转移基因组中的示例性ITR阐述于本文中的SEQ ID NO:18-21、26和27中。
在某些实施例中,5'ITR或3'ITR来自AAV2。在某些实施例中,5'ITR和3'ITR均来自AAV2。在某些实施例中,5'ITR核苷酸序列与SEQ ID NO:18具有至少90%(例如至少95%、至少96%、至少97%、至少98%、至少99%或100%)序列一致性,或3'ITR核苷酸序列与SEQ IDNO:19具有至少90%(例如至少95%、至少96%、至少97%、至少98%、至少99%或100%)序列一致性。在某些实施例中,5'ITR核苷酸序列与SEQ ID NO:18具有至少90%(例如至少95%、至少96%、至少97%、至少98%、至少99%或100%)序列一致性,并且3'ITR核苷酸序列与SEQ ID NO:19具有至少90%(例如至少95%、至少96%、至少97%、至少98%、至少99%或100%)序列一致性。在某些实施例中,转移基因组包含SEQ ID NO:41、44、46、65、67或75中的任一个中所阐述的核苷酸序列,5'ITR核苷酸序列具有SEQ ID NO:18的序列,并且3'ITR核苷酸序列具有SEQ ID NO:19的序列。
在某些实施例中,5'ITR或3'ITR来自AAV5。在某些实施例中,5'ITR和3'ITR均来自AAV5。在某些实施例中,5'ITR核苷酸序列与SEQ ID NO:20具有至少90%(例如至少95%、至少96%、至少97%、至少98%、至少99%或100%)序列一致性,或3'ITR核苷酸序列与SEQ IDNO:21具有至少90%(例如至少95%、至少96%、至少97%、至少98%、至少99%或100%)序列一致性。在某些实施例中,5'ITR核苷酸序列与SEQ ID NO:20具有至少90%(例如至少95%、至少96%、至少97%、至少98%、至少99%或100%)序列一致性,并且3'ITR核苷酸序列与SEQ ID NO:21具有至少90%(例如至少95%、至少96%、至少97%、至少98%、至少99%或100%)序列一致性。在某些实施例中,转移基因组包含SEQ ID NO:46-50中的任一个中所阐述的核苷酸序列、具有SEQ ID NO:20的序列的5'ITR核苷酸序列和具有SEQ ID NO:21的序列的3'ITR核苷酸序列。
在某些实施例中,5'ITR核苷酸序列和3'ITR核苷酸序列彼此大体上互补(例如除在5'或3'ITR中的1、2、3、4或5个核苷酸位置处的失配以外彼此互补)。
在某些实施例中,5'ITR或3'ITR被修饰以降低或消除被Rep蛋白解析(resolution)(“不可解析的ITR”)。在某些实施例中,不可解析的ITR包含在末端解析位点的核苷酸序列中的插入、缺失或取代。此类修饰允许在转移基因组在感染的细胞中复制后形成AAV的自身互补型双链DNA基因组。示例性不可解析的ITR序列是所属领域中已知的(参见例如美国专利案第7,790,154号和第9,783,824号中提供的序列,其以全文引用的方式并入本文中)。在某些实施例中,5'ITR包含与SEQ ID NO:26至少95%、96%、97%、98%或99%一致的核苷酸序列。在某些实施例中,5'ITR由与SEQ ID NO:26至少95%、96%、97%、98%或99%一致的核苷酸序列组成。在某些实施例中,5'ITR由SEQ ID NO:26中所阐述的核苷酸序列组成。在某些实施例中,3'ITR包含与SEQ ID NO:27至少95%、96%、97%、98%或99%一致的核苷酸序列。在某些实施例中,5'ITR由与SEQ ID NO:27至少95%、96%、97%、98%或99%一致的核苷酸序列组成。在某些实施例中,3'ITR由SEQ ID NO:27中所阐述的核苷酸序列组成。在某些实施例中,5'ITR由SEQ ID NO:26中所阐述的核苷酸序列组成,并且3'ITR由SEQ ID NO:27中所阐述的核苷酸序列组成。在某些实施例中,5'ITR由SEQ ID NO:26中所阐述的核苷酸序列组成,并且3'ITR由SEQ ID NO:19中所阐述的核苷酸序列组成。
在某些实施例中,3'ITR由来源于野生型AAV2基因组序列的其它核苷酸序列侧接。在某些实施例中,3'ITR由来源于与野生型AAV2 ITR相邻的野生型AAV2序列的另一个37bp序列侧接。参见例如Savy等人,《人类基因疗法方法(Human Gene Therapy Methods)》(2017)28(5):277-289(其以全文引用的方式并入本文中)。在某些实施例中,另外的37bp序列位于3'ITR内部。在某些实施例中,37bp序列由SEQ ID NO:56中所阐述的序列组成。在某些实施例中,3'ITR包含与SEQ ID NO:57至少95%、96%、97%、98%或99%一致的核苷酸序列。在某些实施例中,3'ITR包含SEQ ID NO:57中所阐述的核苷酸序列。在某些实施例中,3'ITR的核苷酸序列由与SEQ ID NO:57至少95%、96%、97%、98%或99%一致的核苷酸序列组成。在某些实施例中,3'ITR的核苷酸序列由SEQ ID NO:57中所阐述的核苷酸序列组成。
在某些实施例中,转移基因组从5'到3'包含:5'ITR;内部组件,其从5'到3'包含:TRE、任选地非编码外显子和内含子、ARSA编码序列和聚腺苷酸化序列,如本文中所公开;不可解析的ITR;与内部元件互补的核苷酸序列;和3'ITR。此类转移基因组可在感染之后和复制之前形成AAV的自互补、双链DNA基因组。
在某些实施例中,转移基因组从5'到3'包含:5'ITR、TRE、ARSA编码序列、聚腺苷酸化序列和3'ITR。在某些实施例中,5'ITR与SEQ ID:18、20或26具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性;TRE与SEQ ID NO:25、32、36、54、55和/或58中的任一个具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性;ARSA编码序列与SEQ ID NO:14、24、62或72具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性;聚腺苷酸化序列与SEQ ID NO:42、43和45中的任一个具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性;和/或3'ITR与SEQ ID:19、21、27或57具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性。在某些实施例中,5'ITR包含选自由SEQ ID NO:18、20和26组成的群组的核苷酸序列或由其组成;TRE包含选自由以下组成的群组的核苷酸序列:SEQ IDNO:25、32、36、54、55和/或58;ARSA编码序列包含SEQ ID NO:14、24、62或72中所阐述的序列;聚腺苷酸化序列包含选自由SEQ ID NO:42、43和45组成的群组的核苷酸序列;和/或3'ITR包含选自由SEQ ID NO:19、21、27或57组成的群组的核苷酸序列或由其组成。
在某些实施例中,5'ITR包含SEQ ID NO:18中所阐述的序列或由其组成;TRE包含SEQ ID NO:36中所阐述的序列;ARSA编码序列包含SEQ ID NO:14、24、62或72中所阐述的序列;聚腺苷酸化序列包含SEQ ID NO:42中所阐述的序列;和/或3'ITR包含SEQ ID NO:19中所阐述的序列或由其组成。
在某些实施例中,转移基因组包含与SEQ ID NO:47、48、49、68、69或76至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致的序列。在某些实施例中,转移基因组包含SEQ ID NO:47、48、49、68、69或76中所阐述的核苷酸序列。在某些实施例中,转移基因组的核苷酸序列由SEQ ID NO:47、48、49、68、69或76中所阐述的核苷酸序列组成。在某些实施例中,转移基因组包含SEQ ID NO:48中所阐述的核苷酸序列。在某些实施例中,转移基因组的核苷酸序列由SEQ ID NO:48中所阐述的核苷酸序列组成。
在某些实施例中,rAAV包含:(a)AAV衣壳蛋白,其包含SEQ ID NO:16的氨基酸203-736的氨基酸序列,和转移基因组,其从5'到3'包含以下基因元件:5'ITR元件(例如SEQ IDNO:18的5'ITR)、增强子元件(例如SEQ ID NO:58的增强子元件)、启动子序列(例如SEQ IDNO:25的启动子序列)、嵌合内含子序列(例如SEQ ID NO:32的嵌合内含子序列)、以沉默方式改变的人类ARSA编码序列(例如SEQ ID NO:14的hARSA编码序列)、SV40聚腺苷酸化序列(例如SEQ ID NO:42的SV40聚腺苷酸化序列)和3'ITR元件(例如SEQ ID NO:19的3'ITR);(b)AAV衣壳蛋白,其包含SEQ ID NO:16的氨基酸138-736的氨基酸序列,和转移基因组,其从5'到3'包含以下基因元件:5'ITR元件(例如SEQ ID NO:18的5'ITR)、增强子元件(例如SEQ ID NO:58的增强子元件)、启动子序列(例如SEQ ID NO:25的启动子序列)、嵌合内含子序列(例如SEQ ID NO:32的嵌合内含子序列)、以沉默方式改变的人类ARSA编码序列(例如SEQ ID NO:14的hARSA编码序列)、SV40聚腺苷酸化序列(例如SEQ ID NO:42的SV40聚腺苷酸化序列)和3'ITR元件(例如SEQ ID NO:19的3'ITR);和/或(c)AAV衣壳蛋白,其包含SEQID NO:16的氨基酸序列,和转移基因组,其从5'到3'包含以下基因元件:5'ITR元件(例如SEQ ID NO:18的5'ITR)、增强子元件(例如SEQ ID NO:58的增强子元件)、启动子序列(例如SEQ ID NO:25的启动子序列)、嵌合内含子序列(例如SEQ ID NO:32的嵌合内含子序列)、以沉默方式改变的人类ARSA编码序列(例如SEQ ID NO:14的hARSA编码序列)、SV40聚腺苷酸化序列(例如SEQ ID NO:42的SV40聚腺苷酸化序列)和3'ITR元件(例如SEQ ID NO:19的3'ITR)。
在某些实施例中,rAAV包含:(a)AAV衣壳蛋白,其包含SEQ ID NO:16的氨基酸203-736的氨基酸序列,和转移基因组,其包含SEQ ID NO:41、44、46、47、48、49、65、67、68、69、75或76中的任一个中所阐述的核苷酸序列;(b)AAV衣壳蛋白,其包含SEQ ID NO:16的氨基酸138-736的氨基酸序列,和转移基因组,其包含SEQ ID NO:41、44、46、47、48、49、65、67、68、69、75或76中的任一个中所阐述的核苷酸序列;和/或(c)AAV衣壳蛋白,其包含SEQ ID NO:16的氨基酸序列,和转移基因组,其包含SEQ ID NO:41、44、46、47、48、49、65、67、68、69、75或76中的任一个中所阐述的核苷酸序列。
在另一方面中,本文中提供多核苷酸,其包含与SEQ ID NO:41、44、46、47、48、49、65、67、68、69、75或76中所阐述的核酸序列至少80%(例如至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%)一致的核酸序列。在某些实施例中,多核苷酸包含SEQ ID NO:41、44、46、47、48、49、65、67、68、69、75或76中所阐述的核酸序列。在某些实施例中,多核苷酸由SEQ ID NO:41、44、46、47、48、49、65、67、68、69、75或76中所阐述的核酸序列组成。在某些实施例中,多核苷酸包含SEQ ID NO:44或48中所阐述的核酸序列。在某些实施例中,多核苷酸由SEQ ID NO:44或48中所阐述的核酸序列组成。
本文中亦提供多核苷酸,其包含与SEQ ID NO:14、62或72中所阐述的核酸序列至少80%(例如至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%)一致的核酸序列。在某些实施例中,多核苷酸包含SEQ ID NO:14、62或72中所阐述的核酸序列。在某些实施例中,多核苷酸由SEQ ID NO:14、62或72中所阐述的核酸序列组成。在某些实施例中,多核苷酸包含SEQ ID NO:14中所阐述的核酸序列。在某些实施例中,多核苷酸由SEQ IDNO:14中所阐述的核酸序列组成。
在另一方面中,本公开提供一种药物组合物,其包含如本文中所公开的AAV和药学上可接受的赋形剂、佐剂、稀释剂、媒剂或载剂或其组合。“药学上可接受的载剂”包括任何在与组合物的活性成分组合时使所述成分保留生物活性并不引起破坏性生理学反应(如不希望的免疫反应)的材料。药学上可接受的载剂包括水、磷酸盐缓冲盐水、乳液(如油/水乳液)和湿润剂。包含此类载剂的组合物通过熟知的常规方法调配,如以下中所阐述的那些方法:《雷明顿氏医药科学(Remington's Pharmaceutical Sciences)》,当前版,马克出版公司(Mack Publishing Co.),宾夕法尼亚州伊斯顿(Easton Pa.)18042,USA;A.Gennaro(2000)《雷明顿:药剂学之科学及实践(Remington:The Science and Practice ofPharmacy)》,第20版,Lippincott,Williams,&Wilkins;《医药剂型及药物递送系统(Pharmaceutical Dosage Forms and Drug Delivery Systems)》(1999)H.C.Ansel等人,第7版,Lippincott,Williams,&Wilkins;及《医药赋形剂手册(Handbook ofPharmaceutical Excipients)》(2000)A.H.Kibbe等人,第3版,Amer.PharmaceuticalAssoc中所阐述的方法。
在另一方面中,本公开提供多核苷酸,其包含编码人类ARSA蛋白质或其片段的编码序列,其中所述编码序列已以沉默方式改变以与野生型人类ARSA基因具有小于100%(例如小于95%、90%、85%、80%、75%、70%、65%、60%、55%或50%)一致性。在某些实施例中,多核苷酸包含SEQ ID NO:14、62或72中所阐述的序列。在某些实施例中,多核苷酸由SEQID NO:14、62或72中所阐述的序列组成。多核苷酸可包含DNA、RNA、修饰的DNA、修饰的RNA或其组合。在某些实施例中,多核苷酸为表达载体。
III.使用方法
在另一方面中,本公开提供用于在细胞中表达ARSA多肽的方法。所述方法通常包含用如本文中所公开的rAAV转导细胞。此类方法在恢复ARSA表达方面是高效的。因此,在某些实施例中,本文中所公开的方法涉及用如本文中所公开的rAAV转导细胞。
本文中所公开的方法可应用于任何在ARSA基因中具有突变的细胞。所属领域中的技术人员将了解,对需要活性内源性ARSA的细胞尤其感兴趣。因此,在某些实施例中,将所述方法应用于任何损失内源性ARSA活性的细胞。在某些实施例中,将所述方法应用于神经元和/或神经胶质细胞。在某些实施例中,尤其感兴趣的是需要活性内源性ARSA的神经元和/或神经胶质细胞。在某些实施例中,将所述方法应用于中枢神经系统的细胞和/或周围神经系统的细胞。在某些实施例中,尤其感兴趣的是需要活性内源性ARSA的中枢神经系统和/或周围神经系统的细胞。在某些实施例中,尤其感兴趣的是前脑、中脑、后脑、脊髓和其任何组合中的细胞。在某些实施例中,尤其感兴趣的是选自由以下组成的群组的中枢神经系统区域的细胞:脊髓、运动皮质、感觉皮质、丘脑、海马、壳核、小脑(例如小脑核)和其任何组合。在某些实施例中,尤其感兴趣的是脑中的脑桥和髓质、脊髓的上升束和其任何组合中的细胞。在某些实施例中,尤其感兴趣的是选自由以下组成的群组的中枢神经系统区域中的需要活性内源性ARSA的细胞:脊髓、运动皮质、感觉皮质、丘脑、海马、壳核、小脑(例如小脑核)和其任何组合。在某些实施例中,尤其感兴趣的是中枢神经系统(CNS)中的运动神经元和星形胶质细胞分布、CNS中的少突胶质细胞(上升纤维)、CNS中的大脑皮质的细胞群体以及周围神经系统(PNS)中之感觉神经元。在某些实施例中,尤其感兴趣的是少突胶质细胞,如脊髓的背束中的细胞。在某些实施例中,尤其感兴趣的是中枢神经系统中的神经胶质分布,包括(但不限于)星形胶质细胞、少突胶质细胞、施万细胞和其任何组合。在某些实施例中,尤其感兴趣的是运动神经元、星形胶质细胞、少突胶质细胞、中枢神经系统中的大脑皮质的细胞、周围神经系统中的感觉神经元、周围神经系统中的神经胶质细胞(例如施万细胞)和其任何组合。
本文中所公开的方法可体外进行以用于研究目的或可离体或体内进行以用于治疗目的。
在某些实施例中,待转导的细胞在哺乳动物受试者中并以可有效转导受试者中的细胞的量向受试者施用AAV。因此,在某些实施例中,本公开提供一种用于治疗患有与ARSA基因突变相关的疾病或病症的受试者的方法,所述方法通常包含向受试者施用有效量的如本文中所公开的rAAV。受试者可为具有ARSA突变的人类受试者、非人类灵长类动物受试者(例如食蟹猕猴)或啮齿动物受试者(例如小鼠)。可使用本文中所公开的方法治疗任何与ARSA基因突变相关的疾病或病症。合适的疾病或病症包括(但不限于)异染性脑白质营养不良。
在某些实施例中,前述方法使用包含以下的rAAV:(a)AAV衣壳蛋白,其包含SEQ IDNO:16的氨基酸203-736的氨基酸序列,和转移基因组,其从5'到3'包含以下基因元件:5'ITR元件(例如SEQ ID NO:18的5'ITR)、增强子元件(例如SEQ ID NO:58的增强子元件)、启动子序列(例如SEQ ID NO:25的启动子序列)、嵌合内含子序列(例如SEQ ID NO:32的嵌合内含子序列)、以沉默方式改变的人类ARSA编码序列(例如SEQ ID NO:14的hARSA编码序列)、SV40聚腺苷酸化序列(例如SEQ ID NO:42的SV40聚腺苷酸化序列)和3'ITR元件(例如SEQ ID NO:19的3'ITR);(b)AAV衣壳蛋白,其包含SEQ ID NO:16的氨基酸138-736的氨基酸序列,和转移基因组,其从5'到3'包含以下基因元件:5'ITR元件(例如SEQ ID NO:18的5'ITR)、增强子元件(例如SEQ ID NO:58的增强子元件)、启动子序列(例如SEQ ID NO:25的启动子序列)、嵌合内含子序列(例如SEQ ID NO:32的嵌合内含子序列)、以沉默方式改变的人类ARSA编码序列(例如SEQ ID NO:14的hARSA编码序列)、SV40聚腺苷酸化序列(例如SEQ IDNO:42的SV40聚腺苷酸化序列)和3'ITR元件(例如SEQ ID NO:19的3'ITR);和/或(c)AAV衣壳蛋白,其包含SEQ ID NO:16的氨基酸序列,和转移基因组,其从5'到3'包含以下基因元件:5'ITR元件(例如SEQ ID NO:18的5'ITR)、增强子元件(例如SEQ ID NO:58的增强子元件)、启动子序列(例如SEQ ID NO:25的启动子序列)、嵌合内含子序列(例如SEQ ID NO:32的嵌合内含子序列)、以沉默方式改变的人类ARSA编码序列(例如SEQ ID NO:14的hARSA编码序列)、SV40聚腺苷酸化序列(例如SEQ ID NO:42的SV40聚腺苷酸化序列)和3'ITR元件(例如SEQ ID NO:19的3'ITR)。
在某些实施例中,前述方法使用包含以下的rAAV:(a)AAV衣壳蛋白,其包含SEQ IDNO:16的氨基酸203-736的氨基酸序列,和转移基因组,其包含SEQ ID NO:41、44、46、47、48、49、65、67、68、69、75或76中的任一个中所阐述的核苷酸序列;(b)AAV衣壳蛋白,其包含SEQID NO:16的氨基酸138-736的氨基酸序列,和转移基因组,其包含SEQ ID NO:41、44、46、47、48、49、65、67、68、69、75或76中的任一个中所阐述的核苷酸序列;和/或(c)AAV衣壳蛋白,其包含SEQ ID NO:16的氨基酸序列,和转移基因组,其包含SEQ ID NO:41、44、46、47、48、49、65、67、68、69、75或76中的任一个中所阐述的核苷酸序列。
本文中所公开的方法的有利之处尤其在于其能够体内和体外在细胞中以高效率表达ARSA蛋白质。在某些实施例中,ARSA蛋白质的表达量为在ARSA基因中不具有突变的相同类型的细胞中的内源性ARSA蛋白质的表达量的至少10%、20%、30%、40%、50%、60%、70%、80%、90%或100%。在某些实施例中,ARSA蛋白质的表达量比在ARSA基因中不具有突变的相同类型的细胞中的内源性ARSA蛋白质的表达量高至少1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2、3、4、5、6、7、8、9或10倍。可使用任何用于测定ARSA蛋白质的表达量的方法,包括(但不限于)ELISA、免疫印迹法(Western blotting)、免疫染色和质谱。
在某些实施例中,用本文中所公开的AAV组合物转导细胞可如本文所提供来进行或通过所属领域中的技术人员已知的任何转导方法来进行。在某些实施例中,可使细胞在以下感染倍率(MOI)下与AAV接触:50,000;100,000;150,000;200,000;250,000;300,000;350,000;400,000;450,000;或500,000,或任何提供细胞的最佳转导的MOI。
可通过任何适当的途径向受试者施用本文中所公开的AAV组合物,包括(但不限于)静脉内、鞘内、腹膜内、皮下、肌内、鼻内、局部或皮内途径。在某些实施例中,将组合物调配成用于通过静脉内注射或皮下注射施用。
IV.AAV包装系统
在另一方面中,本公开提供用于本文中所公开的重组腺相关病毒(rAAV)的重组制备的包装系统。此类包装系统通常包含:第一核苷酸,其编码一种或多种AAV Rep蛋白;第二核苷酸,其编码如本文中所公开的AAV中的任一个的衣壳蛋白;和第三核苷酸序列,其包含如本文中所公开的rAAV基因组中的任一个,其中包装系统在细胞中具有操作性以用于将转移基因组包裹在衣壳中以形成AAV。
在某些实施例中,包装系统包含第一载体,其包含编码一种或多种AAV Rep蛋白的第一核苷酸序列和编码AAV衣壳蛋白的第二核苷酸序列,以及第二载体,其包含有包含rAAV基因组的第三核苷酸序列。如在如本文中所描述的包装系统的情形中所使用,“载体”是指一种核酸分子,其为用于将核酸引入细胞的媒剂(例如质粒、病毒、粘质体、人工染色体等)。
任何AAV Rep蛋白均可用于本文中所公开的包装系统中。在包装系统的某些实施例中,Rep核苷酸序列编码AAV2 Rep蛋白。合适的AAV2 Rep蛋白包括(但不限于)Rep 78/68或Rep 68/52。在包装系统的某些实施例中,编码AAV2 Rep蛋白的核苷酸序列包含编码与SEQ ID NO:22的AAV2 Rep氨基酸序列具有最小序列一致性百分比的蛋白质的核苷酸序列,其中跨越AAV2 Rep蛋白的氨基酸序列的长度,最小序列一致性百分比为至少70%(例如至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%)。在包装系统的某些实施例中,AAV2 Rep蛋白具有SEQ ID NO:22中所阐述的氨基酸序列。
在包装系统的某些实施例中,包装系统还包含第四核苷酸序列,其包含一种或多种辅助病毒基因。在包装系统的某些实施例中,包装系统还包含第三载体,例如辅助病毒载体,其包含有包含一种或多种辅助病毒基因的第四核苷酸序列。第三载体可为独立的第三载体、与第一载体整合在一起或与第二载体整合在一起。
在包装系统的某些实施例中,辅助病毒选自由以下组成的群组:腺病毒、疱疹病毒(包含单纯性疱疹病毒(HSV))、痘病毒(如痘苗病毒)、巨细胞病毒(CMV)和杆状病毒。在包装系统的某些实施例中,其中辅助病毒是腺病毒,腺病毒基因组包含一种或多种选自由以下组成的群组的腺病毒RNA基因:El、E2、E4和VA。在包装系统的某些实施例中,其中辅助病毒是HSV,HSV基因组包含选自由以下组成的群组的HSV基因中的一个或多个:UL5/8/52、ICPO、ICP4、ICP22和UL30/UL42。
在包装系统的某些实施例中,第一、第二和/或第三载体包含于一种或多种质粒内。在某些实施例中,第一载体和第三载体包含于第一质粒内。在某些实施例中,第二载体和第三载体包含于第二质粒内。
在包装系统的某些实施例中,第一、第二和/或第三载体包含于一种或多种重组辅助病毒内。在某些实施例中,第一载体和第三载体包含于重组辅助病毒内。在某些实施例中,第二载体和第三载体包含于重组辅助病毒内。
在另一方面中,本公开提供一种用于如本文中所描述的AAV的重组制备的方法,其中所述方法包含在可操作以将rAAV基因组包裹于衣壳中以形成如本文中所描述的rAAV的条件下,用如本文中所描述的包装系统转染或转导细胞。用于rAAV的重组制备的示例性方法包括短暂转染(例如用一种或多种含有如本文中所描述的第一和第二以及任选地第三载体的转染质粒)、病毒感染(例如用一种或多种重组辅助病毒,如腺病毒、痘病毒(如痘苗病毒)、疱疹病毒(包括HSV、巨细胞病毒或杆状病毒,其含有如本文中所描述的第一和第二以及任选地第三载体)和稳定的生产细胞系转染或感染(例如用稳定的生产细胞,如哺乳动物或昆虫细胞,其含有如本文中所描述的编码一种或多种AAV Rep蛋白的Rep核苷酸序列和/或编码一种或多种衣壳蛋白的Cap核苷酸序列,并且其中以质粒或重组辅助病毒形式传递如本文中所描述的转移基因组)。
因此,本公开提供用于制备重组AAV(rAAV)的包装系统,其中所述包装系统包含第一核苷酸序列,其编码一种或多种AAV Rep蛋白;第二核苷酸序列,其编码本文中所描述的AAV中的任一个的衣壳蛋白;第三核苷酸序列,其包含本文中所描述的AAV中的任一个的rAAV基因组序列;和任选地第四核苷酸序列,其包含一种或多种辅助病毒基因。
V.实例
本文中所公开的重组AAV载体活体外和活体内介导高效基因转移。以下实例说明使用如本文中所公开的基于AAV的载体进行的ARSA基因(其在某些人类疾病(如异染性脑白质营养不良)中突变)的表达的有效恢复。这些实例以说明性方式而非限制性方式提供。
实例1:人类ARSA转移载体
此实例提供用于被载体转导的细胞(例如人类细胞或小鼠细胞)中的人类ARSA(hARSA)的表达的人类ARSA转移载体T-001、pHMI-5000、pHMI-5003和pHMI-hARSA1-TC-002。
a)T-001
如图1A中所示,ARSA转移载体TC-001从5'到3'包含以下基因元件:5'ITR元件、转录调节元件,其包含CMV增强子元件、鸡β-肌动蛋白启动子和嵌合内含子序列;野生型人类ARSA编码序列;SV40聚腺苷酸化序列;以及3'ITR元件。这些元件的序列阐述于表1中。此载体能够在被载体转导的细胞(例如人类细胞或小鼠细胞)中表达人类ARSA蛋白质。
b)pHMI-5000
如图1B中所示,ARSA转移载体pHMI-5000从5'到3'包含以下基因元件:5'ITR元件;转录调节元件,其包含CMV增强子元件、鸡β-肌动蛋白启动子和嵌合内含子序列;以沉默方式改变的人类ARSA编码序列;SV40聚腺苷酸化序列;以及3'ITR元件。这些元件的序列阐述于表1中。此载体能够在被载体转导的细胞(例如人类细胞或小鼠细胞)中表达人类ARSA蛋白质。
c)pHMI-5003
如图1C中所示,ARSA转移载体pHMI-5003从5'到3'包含以下基因元件:5'ITR元件;转录调节元件,其包含CMV增强子元件、鸡β-肌动蛋白启动子和嵌合内含子序列;以沉默方式改变的人类ARSA编码序列;SV40聚腺苷酸化序列;非编码填充序列,以及3'ITR元件。这些元件的序列阐述于表1中。此载体能够在被载体转导的细胞(例如人类细胞或小鼠细胞)中表达人类ARSA蛋白质。
d)pHMI-hARSA1-TC-002
如图1D中所示,ARSA转移载体pHMI-hARSA1-TC-002从5'到3'包含与pHMI-5000相同的基因元件。这些元件的序列阐述于表1中。pHMI-hARSA1-TC-002与pHMI-5000之间的差异位于载体主链序列中。此载体能够在被载体转导的细胞(例如人类细胞或小鼠细胞)中表达人类ARSA蛋白质。
表1:人类ARSA转移载体T-001、pHMI-5000、pHMI-5003和pHMI-hARSA1-TC-002中的基因元件
Figure BDA0003490018140000441
本文中所公开的载体可包装于AAV衣壳中,如(但不限于)AAVHSC5、AAVHSC7、AAVHSC15或AAVHSC17衣壳。可将包装的病毒颗粒施用于野生型动物或ARSA缺失型动物。
实例2:ARSA(-/-)小鼠模型中的ARSA基因转移
为了研究小鼠中ARSA基因转移的作用,产生ARSA(-/-)小鼠模型。ARSA(-/-)小鼠模型为通过将新霉素卡匣插入小鼠ARSA基因的外显子4而产生的ARSA基因剔除小鼠(参见Hess等人,《美国国家科学院院刊(Proc.Natl.Acad.Sci.U.S.A.)》1996,93(25):14821-14826,其以全文引用的方式并入本文中)。与人类相比,ARSA(-/-)小鼠发展类似的但程度较轻的异染性脑白质营养不良(MLD)。ARSA(-/-)小鼠未展示广泛的髓鞘脱失的证据。
可使用各种生物标记研究MLD。例如,可测量脑中硫苷脂的含量。已报告少突胶质细胞(C24:0)和神经元(C18:0)硫苷脂的增加,其中积聚随动物年龄而增加。可测量髓鞘和淋巴细胞蛋白质(MAL)mRNA转录物的含量。MAL由少突胶质细胞和施万细胞表达,使神经胶质-轴突接合区稳定并与MLD的病变有关。已报告ARSA(-/-)小鼠中的MAL转录物的含量降低。溶酶体相关膜蛋白质(LAMP-1)为另一种可用于研究MLD的生物标记。已使用抗LAMP-1抗体,通过对ARSA(-/-)和野生型小鼠中的脊髓组织进行免疫组织化学来研究LAMP-1免疫反应性,表明ARSA(-/-)小鼠中的LAMP-1免疫反应性提高。图2A展示来源于通过对来自ARSA(-/-)小鼠的脊髓组织进行免疫组织化学(IHC)而研究的LAMP-1免疫反应性的总像素强度的定量。在用媒剂对照物或包装于AAVHSC15衣壳中的pHMI-5000处理的ARSA(-/-)小鼠中使用抗LAMP-1抗体进行IHC。如图2A中所示,在给药(4e13 vg/kg的包装于AAVHSC15衣壳中的pHMI-5000)后第12周时,检测到与给药媒剂对照物的ARSA(-/-)动物相比显著降低的LAMP-1含量。
将脑组织称重并在Precellys珠粒均质器中,在250uL水中均质化,并且移出均质物的10uL等分试样以用于Pierce BCA蛋白质分析定量。将760uL乙腈添加到各均质物中并将混合物第二次均质化。均质物在14,000×g下离心15分钟并移出离心机澄清的上清液并在75%乙腈中稀释5倍以用于RapidFire-MS分析法。使用C19:0硫苷脂(Matreya目录号1888)作为内标并用Sciex API4000三重四极杆质谱仪以MRM模式与C18:0、C18:1、C24:0和C24:1硫苷脂一起监测。各样品与8种不同浓度的C19:0硫苷脂IS一起注射8次以产生各样品的独特标准曲线,使用其计算各分析物的浓度。图2B展示随时间推移,对照组小鼠(WT/Het)和ARSA(-/-)小鼠的脑中的C18:0硫苷脂含量。对照组为野生型动物(ARSA(+/+))与杂合动物(ARSA(+/-))的混合。如图2B中所示,ARSA(-/-)小鼠的脑中的C18:0硫苷脂含量随时间推移而累积,而对照组小鼠的脑中的C18:0硫苷脂含量随时间推移而保持基本不变。由两只对照组小鼠和两只ARSA(-/-)小鼠的分析产生图2B中的数据。为了研究ARSA缺失型小鼠中ARSA基因递送对硫苷脂积聚的作用,用4e13 vg/kg的包装于AAVHSC15衣壳中的pHMI-hARSA1-TC-002处理ARSA(-/-)小鼠(图2C)。如图2C中所示,与用媒剂对照物处理的ARSA(-/-)小鼠相比,在给药后七个月时观察到被处理的ARSA(-/-)小鼠中的脑部硫苷脂含量的显著降低。
在用4e13 vg/kg和6e13 vg/kg的包装于AAVHSC15衣壳中的pHMI-5000或媒剂对照物处理后七个月时测定ARSA(-/-)小鼠的前脑、中脑和后脑中的C18:0及C18:1硫苷脂同种型含量(图2D)。硫苷脂同种型含量呈现为与相同年龄的野生型对照动物相比的倍数。如图2D中所示,与用媒剂对照物处理的ARSA(-/-)小鼠相比,在给药后七个月时观察到被处理的ARSA(-/-)小鼠的所有三个脑部区域中的脑部硫苷脂含量的显著降低。所使用的方法和材料与上述相同。使用非配对T测试(unpaired T-test)分析数据。
在用4e13 vg/kg的包装于AAVHS15衣壳中的pHMI-5000或媒剂对照物处理后第52周测定ARSA(-/-)小鼠的前脑、中脑和后脑中的C18:0和C18:1硫苷脂同种型含量(图2E)、C24:0及C24:1硫苷脂同种型含量(图2F)以及总硫苷脂同种型含量(图2G)。所使用的方法和材料与上述相同。使用非配对T测试(unpaired T-test)分析数据。
图3A展示对照组小鼠(WT/Het)和ARSA(-/-)小鼠中,在四周时MAL转录物的含量。对照组为野生型动物(ARSA(+/+))与杂合动物(ARSA(+/-))的混合。用Trizol提取,接着进行Qiagen RNEasy管柱纯化来制备小鼠总RNA。RNA用作使用赛默飞世尔高容量cDNA试剂盒(ThermoFisher High Capacity cDNA Kit)进行的cDNA合成的模板以产生转录物。使用液滴式数字PCR和对小鼠髓鞘以及淋巴细胞蛋白质(MAL)具有特异性的引子/探针集合评估MAL转录物,其中针对小鼠HPRT1标准化拷贝数。如所展示,在四周时,与杂合小鼠相比,ARSA(-/-)小鼠中的MAL转录物的含量降低。由五只对照组小鼠和六只ARSA(-/-)小鼠的分析产生图3中的数据。为了研究ARSA缺失型小鼠中ARSA基因传递对MAL转录物含量的影响,用4e13vg/kg的包装于AAVHSC15衣壳中的pHMI-5000处理ARSA(-/-)小鼠(图3B)。如图3B中所示,与野生型小鼠和用媒剂处理的ARSA(-/-)小鼠相比,在给药后三个月时观察到被处理的ARSA(-/-)小鼠中的MAL转录物含量的显著增加。
测定用4e13 vg/kg的包装于AAVHSC15衣壳中的pHMI-5000处理的ARSA(-/-)小鼠中的MAL转录物拷贝数的水平(图3C)。图3C展示在野生型小鼠中或在被施用媒剂对照物或4e13 vg/kg的包装于AAVHSC15衣壳中的pHMI-5000的ARSA(-/-)小鼠中,在给药后第12或52周时检测到的MAL转录物的拷贝数。所使用的方法和材料与上述相同。使用非配对T测试(unpaired T-test)分析数据。在图3C中,各动物组之间的统计显著性如下:12周媒剂对比被处理的动物,p=0.0012;12周处理的对比野生型动物,p<0.0001;52周媒剂对比被处理的动物,p=0.0004;以及52周处理的对比野生型动物,不显著。
为了研究是否可获得hARSA活性的治疗水平,向ARSA(-/-)小鼠施用包装于AAV9衣壳中的转移载体T-001(参见PCT公开案第WO2002/052052号,其以全文引用的方式并入本文中)。从未处理的对照ARSA(-/-)小鼠和被施用包装于AAV9衣壳中的转移载体T-001的ARSA(-/-)小鼠获得的脑薄片的抗ARSA免疫反应性表明,在2e13载体基因组/公斤体重(vg/kg)的剂量下获得达到治疗水平(10%)的hARSA酶活性。处被处理的ARSA(-/-)小鼠获得的脑薄片的抗ARSA免疫反应性亦展示脑中的ARSA酶活性的剂量依赖性增加。
实例3:ARSA(-/-)小鼠模型中的ARSA基因转移
此实例提供与人类ARSA转移载体pHMI-5000的用途相关的实验数据。如本文中所描述,转移载体pHMI-5000包含以沉默方式改变的人类ARSA编码序列,表明其呈现显著改进的ARSA蛋白质的表达。
图4为展示脑部中以每个被转导的细胞计的载体基因组的数目与以每ng cDNA计的hARSA的拷贝数之间的相关性的曲线。使用来自Qiagen的QIAamp Fast DNA Tissue试剂盒制备小鼠基因组DNA。藉由液滴式数字PCR和对经密码子优化的人类ARSA载体基因组的编码区具有特异性的引子/探针集合测定VG计数,其中针对内源性小鼠基因组序列进行标准化。如本文中所描述制备小鼠总RNA并使用液滴式数字PCR以及用于测定VG计数的相同引子/探针集合评估ARSA转录物,其中针对小鼠GUSB标准化拷贝数。如所示出,对于使用包装于AAVHSC15衣壳中的转移载体pHMI-5000转导的细胞,所检测到的以每个被转导的细胞计的载体基因组的数目与以每ng cDNA计的hARSA的拷贝数强相关(R2=0.9332)。
发现在AAVHSC15与AAV9衣壳介导的传递之间的比较中,AAVHSC15在脑部中显著优于AAV9。图5展示在2e13 vg/kg的包装于AAV9或AAVHSC15衣壳中的转移载体pHMI-5000的剂量下,脑中的以每个被转导的细胞计的载体基因组的数目。如所示出,与AAV9衣壳相比,当转移载体pHMI-5000包装于AAVHSC15衣壳中时,观察到高十倍的以每个细胞计的载体基因组计数。图6展示对于以所指示的剂量施用的包装于AAV9或AAVHSC15衣壳中的转移载体pHMI-5000,所测量的正常人类ARSA酶活性水平的百分比。图7展示在以4e13 vg/kg施用包装于AAV9或AAVHSC15中的转移载体pHMI-5000的小鼠中,以每个被转导的脑细胞计的载体基因组的数目。
与包装于AAV9衣壳中的pHMI-5000相比,包装于AAVHSC15衣壳中的pHMI-5000表明更强并且更广泛的脑部和脊髓表达概况。抗ARSA免疫反应性实验表明,在3e13 vg/kg的剂量下,在各种情况下,与静脉内施用包装于AAV9衣壳中的pHMI-5000的小鼠相比,在静脉内施用包装于AAVHSC15衣壳中的pHMI-5000的小鼠的脑薄片中检测到显著更高的量。
为了评估投药途径对脑中hARSA的生物分布的影响,分别在4e13vg/kg和4e12 vg/kg的剂量下经由静脉内(IV)和鞘内(IT)途径施用包装于AAVHSC15衣壳中的转移载体pHMI-5000。在向ARSA(-/-)小鼠静脉内施用包装于AAVHSC15中的pHMI-5000之后,在重要的中枢神经系统区域中存在抗ARSA免疫反应性。广泛检测到抗小鼠ARSA(mARSA)或人类ARSA(hARSA),包括(但不限于)运动和感觉皮质、海马(CA3区域)、壳核和小脑。在包装于AAVHSC15中的转移载体pHMI-5000的IV或IT投药之后,后脑和中脑中的正常人类ARSA酶活性的百分比的定量展示于图8中。
在持续4周以4e13 vg/kg施用包装于AAVHSC15衣壳中的pHMI-5000的ARSA(-/-)小鼠中,在脑部的重要生理学区域以及中枢神经系统(CNS)的整个后尾轴中检测到hARSA的生物相关分布。使用抗hARSA抗体检测hARSA,并且在脊髓、运动皮质、丘脑、海马和小脑核中检测到。亦在以下中检测到hARSA:CNS中的运动神经元和星形胶质细胞分布;CNS中的少突胶质细胞(在上升纤维中大量检测到);CNS中的大脑皮质的细胞群;以及周围神经系统(PNS)中的感觉神经元和施万细胞。最早可在处理后第2周检测到类似的生物学分布。
在以2e13 vg/kg施用包装于AAVHSC15衣壳中的pHMI-5000的小鼠中,观察到与在以4e13 vg/kg或更高的剂量进行投药的小鼠中所发现相同的组织学分布。在此等实验中,以溶酶体特有的点状模式在细胞质中检测到hARSA。
如图9A和9B中所示,在给药后第4周,被处理的ARSA(-/-)小鼠的大脑中的人类ARSA酶活性的生理学水平得到恢复。使用来自ARSA(-/-)小鼠的脑溶解物评估hARSA酶活性。剂量范围发现研究表明,hARSA酶活性与包装于AAVHSC15衣壳中的转移载体pHMI-5000的静脉内投药的剂量相关。在被处理的动物中,但未在媒剂对照性动物中检测到酶活性。对于所测试的剂量,酶活性水平(约40-145%)显著高于治疗目标(约10-15%),如先前在临床上测定(参见Patil和Maegawa,《药物设计和发展与疗法(Drug Des.Devel.Ther.)》2013,7:729-745)。图9A展示通过以所指示的剂量向ARSA(-/-)小鼠施用包装于AAVHSC15衣壳中的转移载体pHMI-5000而实现的正常hARSA活性的百分比。如所示出,获得hARSA活性的剂量依赖性反应。图9B展示以所指示的剂量施用包装于AAVHSC15衣壳中的转移载体pHMI-5000的ARSA(-/-)小鼠的脑中以每个细胞计的载体基因组的数目。对于1e13 vg/kg、4e13 vg/kg和6e13 vg/kg剂量,n=5只小鼠。对于2e13 vg/kg剂量,n=4只小鼠。所有小鼠为5周龄并且均是雄性。在图9C中,使用比色芳基硫酸酯酶A特异性分析法评估ARSA酶活性,所述分析法测量由可溶性底物对硝基儿茶酚-硫酸酯(pNCS)引起的硫酸酯的裂解。使用芳基硫酸酯酶A特异性免疫沉淀步骤消除由竞争酶引起的硫酸酯的非特异性裂解。通过各两位正常人类男性和女性的额叶皮质中的ARSA酶活性的分析来测定脑中的正常人类ARSA酶活性。人类额叶皮质样品购自BioiVT并且在每个ARSA酶活性分析盘上与测试样品一起一式三份地操作。数据表示为以每小时每mg蛋白质计的脱硫酸化pNCS的平均量(以ng为单位)的百分比。图9C展示最早在处理后第1周并且直到处理后第12周,单次静脉内4e13 vg/kg剂量的包装于AAVHSC15衣壳中的pHMI-5000引起在新生ARSA(-/-)小鼠的大脑中检测到hARSA酶活性,其水平超过既定人类治疗目标(10-15%)(如虚线所指示)。在给药后第1、2、3、4和12周收集材料。对于每个时间点,n=6只小鼠,3只雄性和3只雌性,8周龄。
在图9D中,用Trizol提取,接着进行Qiagen RNEasy管柱纯化来制备小鼠总RNA。RNA用作使用赛默飞世尔高容量cDNA试剂盒进行的cDNA合成的模板以产生转录物。使用液滴式数字PCR个对经密码子优化的人类ARSA转录物具有特异性的引子/探针集合评估ARSA转录物,其中针对小鼠GUSB标准化拷贝数。图9D展示最早在处理后第1周,单次静脉内4e13vg/kg剂量的包装于AAVHSC15衣壳中的pHMI-5000引起在成年ARSA(-/-)小鼠的大脑中检测到正常水平的hARSA酶活性(经由hARSA转录物分析法)。在给药后第2到3周观察到hARSA酶活性的峰值水平,接着稳定的平线区持续到处理后第52周(以超过既定人类治疗目标(10-15%)的水平)。在给药后第1、2、3、4、8、12、26和52周收集材料。图9E显示在施用单次静脉内4e13 vg/kg的剂量的包装于AAVHSC15衣壳中的pHMI-5000的ARSA(-/-)小鼠的大脑中,以每ug基因组DNA计的载体基因组的数目。在给药后第1、2、3、8、12、26和52周收集材料。图9F展示在施用单次静脉内4e13 vg/kg的剂量的包装于AAVHSC15衣壳中的pHMI-5000的ARSA(-/-)小鼠的大脑中,以每ng RNA计的ARSA转录物的拷贝数。在给药后第4、8、12、26和52周收集材料。
实例4:人类ARSA转移载体
此实例提供用于在被载体转导的细胞(例如人类细胞或小鼠细胞)中的hARSA的表达的人类ARSA转移载体TC-013.pHMIA2和TC-015.pKITR。除表达hARSA以外,这些载体被设计成还表达人类SUMF1。hARSA和hSUMF1的编码序列由2A元件分离。在某些实施例中,核糖体跳跃元件(例如2A元件)编码在N端还包含Gly-Ser-Gly的序列的肽,任选地其中Gly-Ser-Gly的序列由GGCAGCGGA的核苷酸序列编码。尽管不希望受理论约束,但假设核糖体跳跃元件通过以下发挥功能:终止第一肽链的翻译和再起始第二肽链的翻译;或由核糖体跳跃元件编码的肽序列中的肽键通过编码的肽的内在蛋白酶活性进行裂解,或环境(例如胞质溶胶)中的另一种蛋白酶。
a)TC-013.pHMIA2
如图10A中所示,ARSA转移载体TC-013.pHMIA2从5'到3'包含以下基因元件:5'ITR元件、包含CALM1启动子的转录调节元件;以沉默方式改变的人类ARSA编码序列;2A元件;以沉默方式改变的人类SUMF1编码序列;以及3'ITR元件。这些元件的序列阐述于表2中。此载体能够在被载体转导的细胞(例如人类细胞或小鼠细胞)中表达人类ARSA蛋白质和人类SUMF1蛋白质。
b)TC-015.pKITR
如图10B中所示,ARSA转移载体TC-015.pKITR从5'到3'包含以下基因元件:5'ITR元件、包含smCBA启动子的转录调节元件;以沉默方式改变的人类ARSA编码序列;2A元件;以沉默方式改变的人类SUMF1编码序列;以及3'ITR元件。这些元件的序列阐述于表2中。此载体能够在被载体转导的细胞(例如人类细胞或小鼠细胞)中表达人类ARSA蛋白质和人类SUMF1蛋白质。
表2:人类ARSA转移载体TC-013.pHMIA2和TC-015.pKITR中的基因元件
Figure BDA0003490018140000511
本文中所公开的载体可包装于AAV衣壳中,如(但不限于)AAVHSC5、AAVHSC7、AAVHSC15或AAVHSC17衣壳。可将包装的病毒颗粒施用于野生型动物或ARSA缺失型动物。
为了评估脑中启动子对hARSA表达的影响,将转移载体pHMI-5000、TC-013.pHMIA2和TC-015.pKITR包装于AAVHSC15衣壳中并且静脉内施用ARSA(-/-)小鼠。在以4e13 vg/kg的剂量施用pHMI-5000载体(鸡β-肌动蛋白(CBA)启动子)和以8e13 vg/kg的剂量施用TC-015.pKITR(smCBA启动子)的情况下在脑中检测到hARSA表达和酶活性,其中以每个细胞计数计的病毒基因组类似。与所测试的其它启动子相比,CBA启动子在最低剂量下引起hARSA的最高表达。图11展示pHMI-5000(CBA启动子)、TC-013.pHMIA2(CALM1启动子)和TC-015.pKITR(smCBA启动子)的以每个细胞计的被转导的病毒基因组的数目,在每种情况下包装于AAVHSC15衣壳中并以4e13 vg/kg的剂量施用(对于每种载体,n=5只小鼠)。图12展示所检测的pHMI-5000(CBA启动子)和TC-015.pKITR(smCBA启动子)的正常人类ARSA酶活性的百分比,在每种情况下包装于AAVHSC15衣壳中并以4e13 vg/kg的剂量施用(对于每种载体,n=5只小鼠)。图13展示对于包装于AAVHSC15衣壳中并以4e13 vg/kg的剂量施用的pHMI-5000(CBA启动子)和包装于AAVHSC15衣壳中并以8e13 vg/kg的剂量施用的TC-015.pKITR(smCBA启动子),在免疫印迹法中,可在使用抗hARSA抗体的小鼠的脑中检测到hARSA的表达(对于每种载体,n=5只小鼠)。
实例5:人类ARSA转移载体
此实例提供用于在被载体转导的细胞(例如人类细胞或小鼠细胞)中的hARSA的表达的人类ARSA转移载体pHMI-5004。除表达hARSA以外,此载体被设计成还表达人类鞘脂激活蛋白B(SapB)。hARSA和SapB的编码序列由2A元件分离。
如图14中所示,ARSA转移载体pHMI-5004从5'到3'包含以下基因元件:5'ITR元件;转录调节元件,其包含CMV增强子元件、鸡β-肌动蛋白启动子和嵌合内含子序列;以沉默方式改变的人类ARSA编码序列;2A元件;野生型人类SapB编码序列;以及3'ITR元件。这些元件的序列阐述于表3中。此载体能够在被载体转导的细胞(例如人类细胞或小鼠细胞)中表达人类ARSA和/或SapB蛋白质。
表3:人类ARSA转移载体pHMI-5004中的基因元件
基因元件 SEQ ID NO:
5'ITR元件 18
增强子元件 58
启动子序列 25
内含子序列 32
转录调节元件 36
人类ARSA编码序列 72
2A元件 63
人类SapB编码序列 73
hARSA-2A-hSapB序列 74
SV40聚腺苷酸化序列 42
3'ITR元件 19
转移基因组(从启动子到聚腺苷酸化序列) 75
转移基因组(从5'ITR到3'ITR) 76
完全载体序列 77
实例6:非人类灵长类动物中的ARSA基因转移
为了研究非人类灵长类动物中单次剂量的AAVHSC介导的ARSA基因传递的作用,根据表4和5中所阐述的实验设计向六只雄性未处理的幼年食蟹猕猴给药。
表4:用于非人类灵长类动物研究的实验设计
Figure BDA0003490018140000531
表5:用于非人类灵长类动物研究的实验设计
动物 重量(kg) 治疗 途径 剂量(vg/kg) Vg/动物
18C42 1.38 媒剂 IV 0 0
18C17 1.55 媒剂 IV 0 0
18C21 1.28 AAVHSC15-pHMI-5005 IV 4e13 5.12e13
18C27 1.28 AAVHSC15-pHMI-5005 IV 4e13 5.12e13
18C13 1.9 AAVHSC15-pHMI-5005 CM 4e12 7.6e12
18C7 1.74 AAVHSC15-pHMI-5005 CM 4e12 6.96e12
如图15中所示,ARSA转移载体pHMI-5005从5'到3'包含以下基因元件:5'ITR元件;转录调节元件,其包含CMV增强子元件、鸡β-肌动蛋白启动子和嵌合内含子序列;以沉默方式改变的人类ARSA编码序列;V5标签;以及3'ITR元件。这些元件的序列阐述于表6中。此载体能够在被载体转导的细胞(例如人类细胞或小鼠细胞)中表达人类ARSA蛋白质。
表6:人类ARSA转移载体pHMI-5005中的基因元件
基因元件 SEQ ID NO:
5'ITR元件 18
增强子元件 58
启动子序列 25
内含子序列 32
转录调节元件 36
人类ARSA编码序列 14
V5标签 78
SV40聚腺苷酸化序列 42
3'ITR元件 19
转移基因组(从启动子到聚腺苷酸化序列) 79
转移基因组(从5'ITR到3'ITR) 80
完全载体序列 81
pHMI-5005是被V5标记的ARSA转移载体。根据表4和5中所阐述的实验设计向非人类灵长类动物(NHP)施用包装于AAVHSC15衣壳中的pHMI-5005。在第0天,经由经头部/隐静脉进行1-2分钟缓慢推注静脉内注射(IV)或直接注射到小脑延髓池(CM)中来进行投药。每天两次针对死亡和濒死迹象来进行存活率检查。在每天上午以及在给药当天在完成给药之后(15min)和给药后4小时进行临床观察。在即将给药之前以及在给药后第1、2和4周获得用于血液学和临床化学的血液。在第28和29天的尸检时,在脑脊髓液(CSF)和血液收集之后,向动物灌注1.0L低温生理食盐水以去除血球。在尸检时收集脑、肝脏、脊髓(子宫颈和腰)、子宫颈和腰背根神经节(DRG)、三叉神经节、肾脏、坐骨神经、外周淋巴结、脾、心脏、肺和睪丸。
对于生物分析,在即将给药之前以及在第1、2和4周收集血清以用于V5 Elisa(0.5mL全血,处理成血清/分成两个等分试样)。在给药前收集0.5mL CSF(来自第3组CM给药组动物)和在尸检时收集1-2mL(对于所有动物)。在尸检之前,从全血收集15mL外周血液单核细胞(PBMC)。
图16展示在施用包装于AAVHSC15衣壳中的pHMI-5005的NHP中,丙氨酸氨基转移酶(ALT)的含量升高。升高的ALT在给药后第14天恢复到基线水平。
在给药后第28和29天处死接受单次静脉内剂量的4e13 vg/kg的包装于AAVHSC15中的pHMI-5005的NHP(第2组动物)。在经处死的第2组动物的中枢神经系统(CNS)和脑脊髓液(CSF)中检测人类ARSA酶活性水平(图17)。如图17中所示,检测到高于治疗阈值(野生型人类脑含量的15%)的hARSA活性水平,如由虚线所指示。动物18C27(第2组)的CNS和周围神经系统(PNS)中的免疫荧光染色证实存在hARSA(经由V5标签检测)并且存在于包括背根神经节、脊椎运动神经元和小脑的特定区域中。
***
本发明不应限于本文所描述的具体实施例的范围。实际上,根据前文的描述和附图,除了所描述的修改之外,本发明的各种修改对于所属领域技术的人员来说也将变得显而易见。此类修改旨在落入所附权利要求书的范围内。
本文所引用的全部参考文献(例如,出版物或专利或专利申请)均以全文引用的方式并且出于所有目的并入本文中,其程度如同每个单独的参考文献(例如,出版物或专利或专利申请)出于所有目的被特别地或单独地指出以全文引用的方式并入一样。其它实施例处于所附权利要求书内。
序列表
<110> HOMOLOGY MEDICINES, INC.
<120> 用于ARSA基因转移的腺相关病毒组合物和其使用方法
<130> 706508: HMW-030PC
<150> US 62/859,539
<151> 2019-06-10
<150> US 62/866,374
<151> 2019-06-25
<150> US 62/915,523
<151> 2019-10-15
<150> US 62/960,487
<151> 2020-01-13
<150> US 62/987,858
<151> 2020-03-10
<150> US 63/010,970
<151> 2020-04-16
<160> 81
<170> PatentIn version 3.5
<210> 1
<211> 736
<212> PRT
<213> 腺相关AAV9
<400> 1
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 2
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> AAV分离株
<400> 2
Met Thr Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Gln Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 3
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> AAV分离株
<400> 3
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Gly Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Gly Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 4
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> AAV分离株
<400> 4
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Ile Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Tyr Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 5
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> AAV分离株
<400> 5
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Asp
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 6
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> AAV分离株
<400> 6
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Leu Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Ser Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 7
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> AAV分离株
<400> 7
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Arg Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 8
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> AAV分离株
<400> 8
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Val Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 9
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> AAV分离株
<400> 9
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Arg Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 10
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> AAV分离株
<400> 10
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Cys Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 11
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> AAV分离株
<400> 11
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Arg Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Lys Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 12
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> AAV分离株
<400> 12
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro His Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Asn
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Met Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 13
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> AAV分离株
<400> 13
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 14
<211> 1527
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 14
atgtctatgg gggctcctcg ctccctgctg ctggcactgg ccgccgggct ggctgtcgca 60
agaccaccta atatcgtcct gatttttgca gacgatctgg gatacggcga cctgggatgc 120
tatggccacc caagctccac cacacccaac ctggaccagc tggcagcagg aggcctgcgg 180
ttcaccgact tctacgtgcc agtgagcctg tgcaccccct ccagagccgc cctgctgaca 240
ggcaggctgc cagtgcgcat gggcatgtat cctggcgtgc tggtgccatc tagcaggggc 300
ggcctgccac tggaggaggt gaccgtggca gaggtgctgg cagccagagg ctacctgaca 360
ggaatggccg gcaagtggca cctgggagtg ggaccagagg gagccttcct gccccctcac 420
cagggcttcc accggtttct gggcatccct tattctcacg accagggccc atgccagaac 480
ctgacctgtt ttccaccagc aacaccatgc gacggaggat gtgatcaggg cctggtgcca 540
atcccactgc tggcaaatct gagcgtggag gcacagcctc catggctgcc tggcctggag 600
gcaagataca tggccttcgc ccacgacctg atggcagatg cacagcggca ggatagacct 660
ttctttctgt actatgcctc ccaccacacc cactatccac agttcagcgg ccagtccttt 720
gccgagaggt ccggaagggg accattcggc gactctctga tggagctgga tgccgccgtg 780
ggcaccctga tgacagcaat cggcgacctg ggcctgctgg aggagacact ggtcatcttc 840
accgccgata acggccctga gacaatgcgg atgtctagag gcggatgcag cggcctgctg 900
agatgtggca agggaaccac atacgaggga ggcgtgcgcg agcctgccct ggcattttgg 960
ccaggacaca tcgcacctgg agtgacccac gagctggcct cctctctgga cctgctgcca 1020
acactggccg ccctggcagg agcacctctg ccaaatgtga ccctggacgg cttcgatctg 1080
agcccactgc tgctgggaac cggcaagtcc cctaggcagt ctctgttctt ttacccctcc 1140
tatcctgatg aggtgcgggg cgtgtttgcc gtgagaaccg gcaagtacaa ggcccacttc 1200
tttacacagg gctctgccca cagcgacacc acagcagatc cagcatgcca cgccagctcc 1260
tctctgaccg cacacgagcc acctctgctg tacgacctgt ccaaggatcc cggcgagaac 1320
tataatctgc tgggaggagt ggcaggagca acccctgagg tgctgcaggc cctgaagcag 1380
ctgcagctgc tgaaggcaca gctggacgca gcagtgacat tcggcccaag ccaggtggcc 1440
agaggcgagg atcccgccct gcagatctgt tgccaccccg gctgcacccc aagacctgcc 1500
tgttgccatt gccccgaccc acacgcc 1527
<210> 15
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> AAV分离株
<400> 15
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Arg Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 16
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> AAV分离株
<400> 16
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Ala Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 17
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> AAV分离株
<400> 17
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Ile Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Cys Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 18
<211> 145
<212> DNA
<213> 人工序列
<220>
<223> AAV2 5' ITR
<400> 18
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcct 145
<210> 19
<211> 145
<212> DNA
<213> 人工序列
<220>
<223> AAV2 3' ITR
<400> 19
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgcag agagggagtg gccaa 145
<210> 20
<211> 167
<212> DNA
<213> 人工序列
<220>
<223> AAV5 5' ITR
<400> 20
ctctcccccc tgtcgcgttc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60
agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120
cgcgacaggg gggagagtgc cacactctca agcaaggggg ttttgta 167
<210> 21
<211> 167
<212> DNA
<213> 人工序列
<220>
<223> AAV5 3' ITR
<400> 21
tacaaaacct ccttgcttga gagtgtggca ctctcccccc tgtcgcgttc gctcgctcgc 60
tggctcgttt gggggggtgg cagctcaaag agctgccaga cgacggccct ctggccgtcg 120
cccccccaaa cgagccagcg agcgagcgaa cgcgacaggg gggagag 167
<210> 22
<211> 621
<212> PRT
<213> 人工序列
<220>
<223> AAV2 Rep
<400> 22
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
165 170 175
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
275 280 285
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
305 310 315 320
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
465 470 475 480
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
485 490 495
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
500 505 510
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
515 520 525
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
530 535 540
Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys
545 550 555 560
Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu
565 570 575
Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr
580 585 590
Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp
595 600 605
Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
610 615 620
<210> 23
<211> 509
<212> PRT
<213> 智人
<400> 23
Met Ser Met Gly Ala Pro Arg Ser Leu Leu Leu Ala Leu Ala Ala Gly
1 5 10 15
Leu Ala Val Ala Arg Pro Pro Asn Ile Val Leu Ile Phe Ala Asp Asp
20 25 30
Leu Gly Tyr Gly Asp Leu Gly Cys Tyr Gly His Pro Ser Ser Thr Thr
35 40 45
Pro Asn Leu Asp Gln Leu Ala Ala Gly Gly Leu Arg Phe Thr Asp Phe
50 55 60
Tyr Val Pro Val Ser Leu Cys Thr Pro Ser Arg Ala Ala Leu Leu Thr
65 70 75 80
Gly Arg Leu Pro Val Arg Met Gly Met Tyr Pro Gly Val Leu Val Pro
85 90 95
Ser Ser Arg Gly Gly Leu Pro Leu Glu Glu Val Thr Val Ala Glu Val
100 105 110
Leu Ala Ala Arg Gly Tyr Leu Thr Gly Met Ala Gly Lys Trp His Leu
115 120 125
Gly Val Gly Pro Glu Gly Ala Phe Leu Pro Pro His Gln Gly Phe His
130 135 140
Arg Phe Leu Gly Ile Pro Tyr Ser His Asp Gln Gly Pro Cys Gln Asn
145 150 155 160
Leu Thr Cys Phe Pro Pro Ala Thr Pro Cys Asp Gly Gly Cys Asp Gln
165 170 175
Gly Leu Val Pro Ile Pro Leu Leu Ala Asn Leu Ser Val Glu Ala Gln
180 185 190
Pro Pro Trp Leu Pro Gly Leu Glu Ala Arg Tyr Met Ala Phe Ala His
195 200 205
Asp Leu Met Ala Asp Ala Gln Arg Gln Asp Arg Pro Phe Phe Leu Tyr
210 215 220
Tyr Ala Ser His His Thr His Tyr Pro Gln Phe Ser Gly Gln Ser Phe
225 230 235 240
Ala Glu Arg Ser Gly Arg Gly Pro Phe Gly Asp Ser Leu Met Glu Leu
245 250 255
Asp Ala Ala Val Gly Thr Leu Met Thr Ala Ile Gly Asp Leu Gly Leu
260 265 270
Leu Glu Glu Thr Leu Val Ile Phe Thr Ala Asp Asn Gly Pro Glu Thr
275 280 285
Met Arg Met Ser Arg Gly Gly Cys Ser Gly Leu Leu Arg Cys Gly Lys
290 295 300
Gly Thr Thr Tyr Glu Gly Gly Val Arg Glu Pro Ala Leu Ala Phe Trp
305 310 315 320
Pro Gly His Ile Ala Pro Gly Val Thr His Glu Leu Ala Ser Ser Leu
325 330 335
Asp Leu Leu Pro Thr Leu Ala Ala Leu Ala Gly Ala Pro Leu Pro Asn
340 345 350
Val Thr Leu Asp Gly Phe Asp Leu Ser Pro Leu Leu Leu Gly Thr Gly
355 360 365
Lys Ser Pro Arg Gln Ser Leu Phe Phe Tyr Pro Ser Tyr Pro Asp Glu
370 375 380
Val Arg Gly Val Phe Ala Val Arg Thr Gly Lys Tyr Lys Ala His Phe
385 390 395 400
Phe Thr Gln Gly Ser Ala His Ser Asp Thr Thr Ala Asp Pro Ala Cys
405 410 415
His Ala Ser Ser Ser Leu Thr Ala His Glu Pro Pro Leu Leu Tyr Asp
420 425 430
Leu Ser Lys Asp Pro Gly Glu Asn Tyr Asn Leu Leu Gly Gly Val Ala
435 440 445
Gly Ala Thr Pro Glu Val Leu Gln Ala Leu Lys Gln Leu Gln Leu Leu
450 455 460
Lys Ala Gln Leu Asp Ala Ala Val Thr Phe Gly Pro Ser Gln Val Ala
465 470 475 480
Arg Gly Glu Asp Pro Ala Leu Gln Ile Cys Cys His Pro Gly Cys Thr
485 490 495
Pro Arg Pro Ala Cys Cys His Cys Pro Asp Pro His Ala
500 505
<210> 24
<211> 1527
<212> DNA
<213> 智人
<400> 24
atgtccatgg gggcaccgcg gtccctcctc ctggccctgg ctgctggcct ggccgttgcc 60
cgtccgccca acatcgtgct gatctttgcc gacgacctcg gctatgggga cctgggctgc 120
tatgggcacc ccagctctac cactcccaac ctggaccagc tggcggcggg agggctgcgg 180
ttcacagact tctacgtgcc tgtgtctctg tgcacaccct ctagggccgc cctcctgacc 240
ggccggctcc cggttcggat gggcatgtac cctggcgtcc tggtgcccag ctcccggggg 300
ggcctgcccc tggaggaggt gaccgtggcc gaagtcctgg ctgcccgagg ctacctcaca 360
ggaatggccg gcaagtggca ccttggggtg gggcctgagg gggccttcct gcccccccat 420
cagggcttcc atcgatttct aggcatcccg tactcccacg accagggccc ctgccagaac 480
ctgacctgct tcccgccggc cactccttgc gacggtggct gtgaccaggg cctggtcccc 540
atcccactgt tggccaacct gtccgtggag gcgcagcccc cctggctgcc cggactagag 600
gcccgctaca tggctttcgc ccatgacctc atggccgacg cccagcgcca ggatcgcccc 660
ttcttcctgt actatgcctc tcaccacacc cactaccctc agttcagtgg gcagagcttt 720
gcagagcgtt caggccgcgg gccatttggg gactccctga tggagctgga tgcagctgtg 780
gggaccctga tgacagccat aggggacctg gggctgcttg aagagacgct ggtcatcttc 840
actgcagaca atggacctga gaccatgcgt atgtcccgag gcggctgctc cggtctcttg 900
cggtgtggaa agggaacgac ctacgagggc ggtgtccgag agcctgcctt ggccttctgg 960
ccaggtcata tcgctcccgg cgtgacccac gagctggcca gctccctgga cctgctgcct 1020
accctggcag ccctggctgg ggccccactg cccaatgtca ccttggatgg ctttgacctc 1080
agccccctgc tgctgggcac aggcaagagc cctcggcagt ctctcttctt ctacccgtcc 1140
tacccagacg aggtccgtgg ggtttttgct gtgcggactg gaaagtacaa ggctcacttc 1200
ttcacccagg gctctgccca cagtgatacc actgcagacc ctgcctgcca cgcctccagc 1260
tctctgactg ctcatgagcc cccgctgctc tatgacctgt ccaaggaccc tggtgagaac 1320
tacaacctgc tggggggtgt ggccggggcc accccagagg tgctgcaagc cctgaaacag 1380
cttcagctgc tcaaggccca gttagacgca gctgtgacct tcggccccag ccaggtggcc 1440
cggggcgagg accccgccct gcagatctgc tgtcatcctg gctgcacccc ccgcccagct 1500
tgctgccatt gcccagatcc ccatgcc 1527
<210> 25
<211> 278
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 25
tcgaggtgag ccccacgttc tgcttcactc tccccatctc ccccccctcc ccacccccaa 60
ttttgtattt atttattttt taattatttt gtgcagcgat gggggcgggg gggggggggg 120
ggcgcgcgcc aggcggggcg gggcggggcg aggggcgggg cggggcgagg cggagaggtg 180
cggcggcagc caatcagagc ggcgcgctcc gaaagtttcc ttttatggcg aggcggcggc 240
ggcggcggcc ctataaaaag cgaagcgcgc ggcgggcg 278
<210> 26
<211> 106
<212> DNA
<213> 人工序列
<220>
<223> 5' ITR
<400> 26
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtgg 106
<210> 27
<211> 143
<212> DNA
<213> 人工序列
<220>
<223> 3' ITR
<400> 27
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgcag agagggagtg gcc 143
<210> 28
<211> 1873
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 28
gatcttcaat attggccatt agccatatta ttcattggtt atatagcata aatcaatatt 60
ggctattggc cattgcatac gttgtatcta tatcataata tgtacattta tattggctca 120
tgtccaatat gaccgccatg ttggcattga ttattgacta gttattaata gtaatcaatt 180
acggggtcat tagttcatag cccatatatg gagttccgcg ttacataact tacggtaaat 240
ggcccgcctg gctgaccgcc caacgacccc cgcccattga cgtcaataat gacgtatgtt 300
cccatagtaa cgccaatagg gactttccat tgacgtcaat gggtggagta tttacggtaa 360
actgcccact tggcagtaca tcaagtgtat catatgccaa gtccgccccc tattgacgtc 420
aatgacggta aatggcccgc ctggcattat gcccagtaca tgaccttacg ggactttcct 480
acttggcagt acatctacgt attagtcatc gctattacca tggtcgaggt gagccccacg 540
ttctgcttca ctctccccat ctcccccccc tccccacccc caattttgta tttatttatt 600
ttttaattat tttgtgcagc gatgggggcg gggggggggg gggggcgcgc gccaggcggg 660
gcggggcggg gcgaggggcg gggcggggcg aggcggagag gtgcggcggc agccaatcag 720
agcggcgcgc tccgaaagtt tccttttatg gcgaggcggc ggcggcggcg gccctataaa 780
aagcgaagcg cgcggcgggc gggagtcgct gcgacgctgc cttcgccccg tgccccgctc 840
cgccgccgcc tcgcgccgcc cgccccggct ctgactgacc gcgttactcc cacaggtgag 900
cgggcgggac ggcccttctc ctccgggctg taattagcgc ttggtttaat gacggcttgt 960
ttcttttctg tggctgcgtg aaagccttga ggggctccgg gagggccctt tgtgcggggg 1020
ggagcggctc ggggggtgcg tgcgtgtgtg tgtgcgtggg gagcgccgcg tgcggcccgc 1080
gctgcccggc ggctgtgagc gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt 1140
gcgcgagggg agcgcggccg ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa 1200
caaaggctgc gtgcggggtg tgtgcgtggg ggggtgagca gggggtgtgg gcgcggcggt 1260
cgggctgtaa cccccccctg cacccccctc cccgagttgc tgagcacggc ccggcttcgg 1320
gtgcggggct ccgtacgggg cgtggcgcgg ggctcgccgt gccgggcggg gggtggcggc 1380
aggtgggggt gccgggcggg gcggggccgc ctcgggccgg ggagggctcg ggggaggggc 1440
gcggcggccc ccggagcgcc ggcggctgtc gaggcgcggc gagccgcagc cattgccttt 1500
tatggtaatc gtgcgagagg gcgcagggac ttcctttgtc ccaaatctgt gcggagccga 1560
aatctgggag gcgccgccgc accccctcta gcgggcgcgg ggcgaagcgg tgcggcgccg 1620
gcaggaagga aatgggcggg gagggccttc gtgcgtcgcc gcgccgccgt ccccttctcc 1680
ctctccagcc tcggggctgt ccgcgggggg acggctgcct tcggggggga cggggcaggg 1740
cggggttcgg cttctggcgt gtgaccggcg gctctagagc ctctgctaac catgttcatg 1800
ccttcttctt tttcctacag ctcctgggca acgtgctggt tattgtgctg tctcatcatt 1860
ttggcaaaga att 1873
<210> 29
<211> 374
<212> PRT
<213> 智人
<400> 29
Met Ala Ala Pro Ala Leu Gly Leu Val Cys Gly Arg Cys Pro Glu Leu
1 5 10 15
Gly Leu Val Leu Leu Leu Leu Leu Leu Ser Leu Leu Cys Gly Ala Ala
20 25 30
Gly Ser Gln Glu Ala Gly Thr Gly Ala Gly Ala Gly Ser Leu Ala Gly
35 40 45
Ser Cys Gly Cys Gly Thr Pro Gln Arg Pro Gly Ala His Gly Ser Ser
50 55 60
Ala Ala Ala His Arg Tyr Ser Arg Glu Ala Asn Ala Pro Gly Pro Val
65 70 75 80
Pro Gly Glu Arg Gln Leu Ala His Ser Lys Met Val Pro Ile Pro Ala
85 90 95
Gly Val Phe Thr Met Gly Thr Asp Asp Pro Gln Ile Lys Gln Asp Gly
100 105 110
Glu Ala Pro Ala Arg Arg Val Thr Ile Asp Ala Phe Tyr Met Asp Ala
115 120 125
Tyr Glu Val Ser Asn Thr Glu Phe Glu Lys Phe Val Asn Ser Thr Gly
130 135 140
Tyr Leu Thr Glu Ala Glu Lys Phe Gly Asp Ser Phe Val Phe Glu Gly
145 150 155 160
Met Leu Ser Glu Gln Val Lys Thr Asn Ile Gln Gln Ala Val Ala Ala
165 170 175
Ala Pro Trp Trp Leu Pro Val Lys Gly Ala Asn Trp Arg His Pro Glu
180 185 190
Gly Pro Asp Ser Thr Ile Leu His Arg Pro Asp His Pro Val Leu His
195 200 205
Val Ser Trp Asn Asp Ala Val Ala Tyr Cys Thr Trp Ala Gly Lys Arg
210 215 220
Leu Pro Thr Glu Ala Glu Trp Glu Tyr Ser Cys Arg Gly Gly Leu His
225 230 235 240
Asn Arg Leu Phe Pro Trp Gly Asn Lys Leu Gln Pro Lys Gly Gln His
245 250 255
Tyr Ala Asn Ile Trp Gln Gly Glu Phe Pro Val Thr Asn Thr Gly Glu
260 265 270
Asp Gly Phe Gln Gly Thr Ala Pro Val Asp Ala Phe Pro Pro Asn Gly
275 280 285
Tyr Gly Leu Tyr Asn Ile Val Gly Asn Ala Trp Glu Trp Thr Ser Asp
290 295 300
Trp Trp Thr Val His His Ser Val Glu Glu Thr Leu Asn Pro Lys Gly
305 310 315 320
Pro Pro Ser Gly Lys Asp Arg Val Lys Lys Gly Gly Ser Tyr Met Cys
325 330 335
His Arg Ser Tyr Cys Tyr Arg Tyr Arg Cys Ala Ala Arg Ser Gln Asn
340 345 350
Thr Pro Asp Ser Ser Ala Ser Asn Leu Gly Phe Arg Cys Ala Ala Asp
355 360 365
Arg Leu Pro Thr Met Asp
370
<210> 30
<211> 2718
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 30
atgagcatgg gcgcccccag aagcctgtta cttgctttag ctgctggcct tgcagtggca 60
aggcccccta acatcgtgct gatctttgca gatgacttgg gatatgggga tcttggttgt 120
tatggccacc catcaagcac aactcccaat ctggatcagt tggctgcagg aggtctgagg 180
tttacagact tttatgttcc agtctccctg tgcactcctt ctcgggctgc cctgcttact 240
gggaggctcc ctgtgagaat gggtatgtac cctggagtgt tggtcccatc cagcagggga 300
gggctgcccc tggaagaggt gacagtggca gaggtgctgg cagcacgagg ctatctgact 360
ggcatggcag gcaagtggca cctgggtgta gggccagagg gtgctttcct gcctccccat 420
cagggctttc ataggtttct gggaatccca tactctcatg accaaggacc ctgccagaac 480
ctcacctgtt tcccccctgc aacaccatgt gatgggggct gtgatcaagg tctggttcct 540
ataccactgc ttgctaatct ttcagtggaa gctcaaccac cctggctgcc tggcttggag 600
gctagataca tggccttcgc acatgatctg atggcagatg cccagagaca agataggcct 660
ttcttcctct actatgcatc tcaccacacc cactatcctc agttctcagg ccaatcattt 720
gctgagcgta gtggcagggg cccatttggg gacagtttga tggaactgga tgccgcagtt 780
ggtaccctca tgacagcaat aggggactta ggtttgctgg aggaaacatt ggtaattttc 840
acagctgata atggccctga gacaatgaga atgtctaggg gaggctgctc tggtcttctg 900
aggtgtggta aagggactac atatgaggga ggagtgaggg aaccagctct tgccttttgg 960
ccaggtcaca tagcccctgg agttacacat gaactagctt cttccctgga cttgcttcct 1020
acactggcag ccctggcagg tgcccctctc cctaatgtaa ctttagatgg atttgacctc 1080
tctccactac ttttagggac agggaaaagt ccaaggcagt ccttattctt ctatccttcc 1140
tacccagatg aggtgagggg tgtttttgcc gtgaggactg ggaaatacaa agctcatttt 1200
tttacccagg gatcagctca ttcagacacc acagctgatc ctgcctgtca tgccagcagt 1260
agcttgacag cacatgagcc tcccttactg tatgacctga gcaaggaccc aggggagaac 1320
tataacctgc ttgggggggt tgctggggcc accccagaag tgcttcaggc actaaagcag 1380
ctgcaactgc ttaaagcaca gttggatgct gcagtgacct ttggcccttc ccaggtggcc 1440
agaggcgagg atcccgccct gcagatctgc tgccacccag gctgcacacc cagacctgcc 1500
tgctgtcact gccccgaccc acacgccggc agcggagcta ctaacttcag cctgctgaag 1560
caggctggag acgtggagga gaaccctgga cctatggctg ccccagccct ggggctggtg 1620
tgtggcagat gccctgagct gggcctggtg ctgcttctcc tgctgctgag cctcctgtgt 1680
ggtgctgctg gctctcagga agcagggaca ggagcaggag caggttctct ggctggctca 1740
tgcggttgtg ggacccccca gaggccaggg gctcatgggt cctctgcagc tgcccacagg 1800
tactcaaggg aagcaaatgc ccctggcccc gtacctgggg aaaggcaact tgctcactcc 1860
aagatggttc ctatccctgc aggagttttt actatgggaa ctgatgaccc tcagatcaag 1920
caggatggtg aagcaccagc taggagagtc acaattgatg ccttctatat ggatgcctat 1980
gaagtgtcaa acacagaatt tgagaaattt gtaaacagca ctggatacct tacagaggct 2040
gagaaatttg gtgacagttt tgtttttgaa ggcatgctaa gtgagcaggt gaagaccaat 2100
atccaacagg cagtggctgc agccccctgg tggctgcctg ttaaaggagc caattggaga 2160
cacccagagg gaccagactc aactatcctc cacaggcctg accaccctgt gctgcatgtg 2220
tcctggaatg atgcagtggc atactgcacc tgggctggga aaaggttacc aacagaggca 2280
gaatgggagt attcctgccg gggtggactg cacaacagac tgttcccctg gggcaataag 2340
ctgcaaccta aaggacagca ttatgccaat atttggcagg gagagttccc agtcacaaac 2400
actggtgagg atggcttcca gggaactgcc cctgtggatg ctttcccacc caatggctat 2460
gggttgtaca atatagttgg gaatgcctgg gagtggactt ctgactggtg gacggtccat 2520
cacagtgtgg aagagacact gaacccaaag gggcccccct caggcaagga cagagtcaag 2580
aaaggtggct cttatatgtg tcacagaagc tattgctaca gatataggtg tgctgcaaga 2640
agtcagaaca cccctgacag ctcagctagc aatctgggat ttagatgtgc agcagataga 2700
ctccccacca tggactga 2718
<210> 31
<211> 93
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 31
ctctaaggta aatataaaat ttttaagtgt ataatgtgtt aaactactga ttctaattgt 60
ttctctcttt tagattccaa cctttggaac tga 93
<210> 32
<211> 1017
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 32
ggagtcgctg cgcgctgcct tcgccccgtg ccccgctccg ccgccgcctc gcgccgcccg 60
ccccggctct gactgaccgc gttactccca caggtgagcg ggcgggacgg cccttctcct 120
ccgggctgta attagcgctt ggtttaatga cggcttgttt cttttctgtg gctgcgtgaa 180
agccttgagg ggctccggga gggccctttg tgcgggggga gcggctcggg gggtgcgtgc 240
gtgtgtgtgt gcgtggggag cgccgcgtgc ggctccgcgc tgcccggcgg ctgtgagcgc 300
tgcgggcgcg gcgcggggct ttgtgcgctc cgcagtgtgc gcgaggggag cgcggccggg 360
ggcggtgccc cgcggtgcgg ggggggctgc gaggggaaca aaggctgcgt gcggggtgtg 420
tgcgtggggg ggtgagcagg gggtgtgggc gcgtcggtcg ggctgcaacc ccccctgcac 480
ccccctcccc gagttgctga gcacggcccg gcttcgggtg cggggctccg tacggggcgt 540
ggcgcggggc tcgccgtgcc gggcgggggg tggcggcagg tgggggtgcc gggcggggcg 600
gggccgcctc gggccgggga gggctcgggg gaggggcgcg gcggcccccg gagcgccggc 660
ggctgtcgag gcgcggcgag ccgcagccat tgccttttat ggtaatcgtg cgagagggcg 720
cagggacttc ctttgtccca aatctgtgcg gagccgaaat ctgggaggcg ccgccgcacc 780
ccctctagcg ggcgcggggc gaagcggtgc ggcgccggca ggaaggaaat gggcggggag 840
ggccttcgtg cgtcgccgcg ccgccgtccc cttctccctc tccagcctcg gggctgtccg 900
cggggggacg gctgccttcg ggggggacgg ggcagggcgg ggttcggctt ctggcgtgtg 960
accggcggct ctagagcctc tgctaaccat gttcatgcct tcttcttttt cctacag 1017
<210> 33
<211> 79
<212> PRT
<213> 智人
<400> 33
Gly Asp Val Cys Gln Asp Cys Ile Gln Met Val Thr Asp Ile Gln Thr
1 5 10 15
Ala Val Arg Thr Asn Ser Thr Phe Val Gln Ala Leu Val Glu His Val
20 25 30
Lys Glu Glu Cys Asp Arg Leu Gly Pro Gly Met Ala Asp Ile Cys Lys
35 40 45
Asn Tyr Ile Ser Gln Tyr Ser Glu Ile Ala Ile Gln Met Met Met His
50 55 60
Met Gln Pro Lys Glu Ile Cys Ala Leu Val Gly Phe Cys Asp Glu
65 70 75
<210> 34
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> 合成多核苷酸
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> Xaa为D或G
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa为V或I
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa为任何氨基酸
<400> 34
Xaa Xaa Glu Xaa Asn Pro Gly Pro
1 5
<210> 35
<211> 92
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 35
aagaggtaag ggtttaaggg atggttggtt ggtggggtat taatgtttaa ttacctggag 60
cacctgcctg aaatcacttt ttttcaggtt gg 92
<210> 36
<211> 1676
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 36
ggcattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60
catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120
acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180
ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240
aagtgtatca tatgccaagt ccgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300
ggcattatgc ccagtacatg accttacggg actttcctac ttggcagtac atctacgtat 360
tagtcatcgc tattaccatg gtcgaggtga gccccacgtt ctgcttcact ctccccatct 420
cccccccctc cccaccccca attttgtatt tatttatttt ttaattattt tgtgcagcga 480
tgggggcggg gggggggggg gggcgcgcgc caggcggggc ggggcggggc gaggggcggg 540
gcggggcgag gcggagaggt gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc 600
cttttatggc gaggcggcgg cggcggcggc cctataaaaa gcgaagcgcg cggcgggcgg 660
gagtcgctgc gcgctgcctt cgccccgtgc cccgctccgc cgccgcctcg cgccgcccgc 720
cccggctctg actgaccgcg ttactcccac aggtgagcgg gcgggacggc ccttctcctc 780
cgggctgtaa ttagcgcttg gtttaatgac ggcttgtttc ttttctgtgg ctgcgtgaaa 840
gccttgaggg gctccgggag ggccctttgt gcggggggag cggctcgggg ggtgcgtgcg 900
tgtgtgtgtg cgtggggagc gccgcgtgcg gctccgcgct gcccggcggc tgtgagcgct 960
gcgggcgcgg cgcggggctt tgtgcgctcc gcagtgtgcg cgaggggagc gcggccgggg 1020
gcggtgcccc gcggtgcggg gggggctgcg aggggaacaa aggctgcgtg cggggtgtgt 1080
gcgtgggggg gtgagcaggg ggtgtgggcg cgtcggtcgg gctgcaaccc cccctgcacc 1140
cccctccccg agttgctgag cacggcccgg cttcgggtgc ggggctccgt acggggcgtg 1200
gcgcggggct cgccgtgccg ggcggggggt ggcggcaggt gggggtgccg ggcggggcgg 1260
ggccgcctcg ggccggggag ggctcggggg aggggcgcgg cggcccccgg agcgccggcg 1320
gctgtcgagg cgcggcgagc cgcagccatt gccttttatg gtaatcgtgc gagagggcgc 1380
agggacttcc tttgtcccaa atctgtgcgg agccgaaatc tgggaggcgc cgccgcaccc 1440
cctctagcgg gcgcggggcg aagcggtgcg gcgccggcag gaaggaaatg ggcggggagg 1500
gccttcgtgc gtcgccgcgc cgccgtcccc ttctccctct ccagcctcgg ggctgtccgc 1560
ggggggacgg ctgccttcgg gggggacggg gcagggcggg gttcggcttc tggcgtgtga 1620
ccggcggctc tagagcctct gctaaccatg ttcatgcctt cttctttttc ctacag 1676
<210> 37
<211> 16
<212> PRT
<213> 人工序列
<220>
<223> T2A肽
<400> 37
Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro
1 5 10 15
<210> 38
<211> 16
<212> PRT
<213> 人工序列
<220>
<223> P2A肽
<400> 38
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
1 5 10 15
<210> 39
<211> 540
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 39
cctgcaggct caccagtgtt tgtgactggg aactctccct gccaaatatt ggcataatgc 60
tgtcctttag gttgcagctt attgccccag gggaacagtc tgttgtgcag tccaccccgg 120
caggaatact cccattctgc ctctgttggt aaccttttcc cagcccaggt gcagtatgcc 180
actgcatcat tccaggacac atgcagcaca gggtggtcag gcctgtggag gatagttgag 240
tctggtccct ctgggtgtct ccaattggct cctttaacag gcagccacca gggggctgca 300
gccactgcct gttggatatt ggtcttcacc tgctcactta gcatgccttc aaaaacaaaa 360
ctgtcaccaa atttctcagc ctctgtaagg tatccagtgc tgtttacaaa tttctcaaat 420
tctgtgtttg acacttcata ggcatccata tagaaggcat caattgtgac tctcctagct 480
ggtgcttcac catcctgctt gatctgaggg tcatcagttc ccatagtaaa aactcctgca 540
<210> 40
<211> 1168
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 40
cgtgaggctc cggtgcccgt cagtgggcag agcgcacatc gcccacagtc cccgagaagt 60
tggggggagg ggtcggcaat tgaaccggtg cctagagaag gtggcgcggg gtaaactggg 120
aaagtgatgt cgtgtactgg ctccgccttt ttcccgaggg tgggggagaa ccgtatataa 180
gtgcagtagt cgccgtgaac gttctttttc gcaacgggtt tgccgccaga acacaggtaa 240
gtgccgtgtg tggttcccgc gggcctggcc tctttacggg ttatggccct tgcgtgcctt 300
gaattacttc cacctggctc cagtacgtga ttcttgatcc cgagctggag ccaggggcgg 360
gccttgcgct ttaggagccc cttcgcctcg tgcttgagtt gaggcctggc ctgggcgctg 420
gggccgccgc gtgcgaatct ggtggcacct tcgcgcctgt ctcgctgctt tcgataagtc 480
tctagccatt taaaattttt gatgacctgc tgcgacgctt tttttctggc aagatagtct 540
tgtaaatgcg ggccaggatc tgcacactgg tatttcggtt tttggggccg cgggcggcga 600
cggggcccgt gcgtcccagc gcacatgttc ggcgaggcgg ggcctgcgag cgcggccacc 660
gagaatcgga cgggggtagt ctcaagctgg ccggcctgct ctggtgcctg gcctcgcgcc 720
gccgtgtatc gccccgccct gggcggcaag gctggcccgg tcggcaccag ttgcgtgagc 780
ggaaagatgg ccgcttcccg gccctgctcc agggggctca aaatggagga cgcggcgctc 840
gggagagcgg gcgggtgagt cacccacaca aaggaaaggg gcctttccgt cctcagccgt 900
cgcttcatgt gactccacgg agtaccgggc gccgtccagg cacctcgatt agttctggag 960
cttttggagt acgtcgtctt taggttgggg ggaggggttt tatgcgatgg agtttcccca 1020
cactgagtgg gtggagactg aagttaggcc agcttggcac ttgatgtaat tctccttgga 1080
atttgccctt tttgagtttg gatcttggtt cattctcaag cctcagacag tggttcaaag 1140
tttttttctt ccatttcagg tgtcgtga 1168
<210> 41
<211> 3416
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 41
ggcattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60
catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120
acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180
ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240
aagtgtatca tatgccaagt ccgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300
ggcattatgc ccagtacatg accttacggg actttcctac ttggcagtac atctacgtat 360
tagtcatcgc tattaccatg gtcgaggtga gccccacgtt ctgcttcact ctccccatct 420
cccccccctc cccaccccca attttgtatt tatttatttt ttaattattt tgtgcagcga 480
tgggggcggg gggggggggg gggcgcgcgc caggcggggc ggggcggggc gaggggcggg 540
gcggggcgag gcggagaggt gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc 600
cttttatggc gaggcggcgg cggcggcggc cctataaaaa gcgaagcgcg cggcgggcgg 660
gagtcgctgc gcgctgcctt cgccccgtgc cccgctccgc cgccgcctcg cgccgcccgc 720
cccggctctg actgaccgcg ttactcccac aggtgagcgg gcgggacggc ccttctcctc 780
cgggctgtaa ttagcgcttg gtttaatgac ggcttgtttc ttttctgtgg ctgcgtgaaa 840
gccttgaggg gctccgggag ggccctttgt gcggggggag cggctcgggg ggtgcgtgcg 900
tgtgtgtgtg cgtggggagc gccgcgtgcg gctccgcgct gcccggcggc tgtgagcgct 960
gcgggcgcgg cgcggggctt tgtgcgctcc gcagtgtgcg cgaggggagc gcggccgggg 1020
gcggtgcccc gcggtgcggg gggggctgcg aggggaacaa aggctgcgtg cggggtgtgt 1080
gcgtgggggg gtgagcaggg ggtgtgggcg cgtcggtcgg gctgcaaccc cccctgcacc 1140
cccctccccg agttgctgag cacggcccgg cttcgggtgc ggggctccgt acggggcgtg 1200
gcgcggggct cgccgtgccg ggcggggggt ggcggcaggt gggggtgccg ggcggggcgg 1260
ggccgcctcg ggccggggag ggctcggggg aggggcgcgg cggcccccgg agcgccggcg 1320
gctgtcgagg cgcggcgagc cgcagccatt gccttttatg gtaatcgtgc gagagggcgc 1380
agggacttcc tttgtcccaa atctgtgcgg agccgaaatc tgggaggcgc cgccgcaccc 1440
cctctagcgg gcgcggggcg aagcggtgcg gcgccggcag gaaggaaatg ggcggggagg 1500
gccttcgtgc gtcgccgcgc cgccgtcccc ttctccctct ccagcctcgg ggctgtccgc 1560
ggggggacgg ctgccttcgg gggggacggg gcagggcggg gttcggcttc tggcgtgtga 1620
ccggcggctc tagagcctct gctaaccatg ttcatgcctt cttctttttc ctacagctcc 1680
tgggcaacgt gctggttatt gtgctgtctc atcattttgg caaagaattc cgccaccatg 1740
tccatggggg caccgcggtc cctcctcctg gccctggctg ctggcctggc cgttgcccgt 1800
ccgcccaaca tcgtgctgat ctttgccgac gacctcggct atggggacct gggctgctat 1860
gggcacccca gctctaccac tcccaacctg gaccagctgg cggcgggagg gctgcggttc 1920
acagacttct acgtgcctgt gtctctgtgc acaccctcta gggccgccct cctgaccggc 1980
cggctcccgg ttcggatggg catgtaccct ggcgtcctgg tgcccagctc ccgggggggc 2040
ctgcccctgg aggaggtgac cgtggccgaa gtcctggctg cccgaggcta cctcacagga 2100
atggccggca agtggcacct tggggtgggg cctgaggggg ccttcctgcc cccccatcag 2160
ggcttccatc gatttctagg catcccgtac tcccacgacc agggcccctg ccagaacctg 2220
acctgcttcc cgccggccac tccttgcgac ggtggctgtg accagggcct ggtccccatc 2280
ccactgttgg ccaacctgtc cgtggaggcg cagcccccct ggctgcccgg actagaggcc 2340
cgctacatgg ctttcgccca tgacctcatg gccgacgccc agcgccagga tcgccccttc 2400
ttcctgtact atgcctctca ccacacccac taccctcagt tcagtgggca gagctttgca 2460
gagcgttcag gccgcgggcc atttggggac tccctgatgg agctggatgc agctgtgggg 2520
accctgatga cagccatagg ggacctgggg ctgcttgaag agacgctggt catcttcact 2580
gcagacaatg gacctgagac catgcgtatg tcccgaggcg gctgctccgg tctcttgcgg 2640
tgtggaaagg gaacgaccta cgagggcggt gtccgagagc ctgccttggc cttctggcca 2700
ggtcatatcg ctcccggcgt gacccacgag ctggccagct ccctggacct gctgcctacc 2760
ctggcagccc tggctggggc cccactgccc aatgtcacct tggatggctt tgacctcagc 2820
cccctgctgc tgggcacagg caagagccct cggcagtctc tcttcttcta cccgtcctac 2880
ccagacgagg tccgtggggt ttttgctgtg cggactggaa agtacaaggc tcacttcttc 2940
acccagggct ctgcccacag tgataccact gcagaccctg cctgccacgc ctccagctct 3000
ctgactgctc atgagccccc gctgctctat gacctgtcca aggaccctgg tgagaactac 3060
aacctgctgg ggggtgtggc cggggccacc ccagaggtgc tgcaagccct gaaacagctt 3120
cagctgctca aggcccagtt agacgcagct gtgaccttcg gccccagcca ggtggcccgg 3180
ggcgaggacc ccgccctgca gatctgctgt catcctggct gcaccccccg cccagcttgc 3240
tgccattgcc cagatcccca tgcctgagat tctagagtcg agccgcggac tagtaacttg 3300
tttattgcag cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa 3360
gcattttttt cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atctta 3416
<210> 42
<211> 122
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 42
aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca 60
aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct 120
ta 122
<210> 43
<211> 133
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 43
tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat aagctgcaat 60
aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg 120
gaggtttttt aaa 133
<210> 44
<211> 3416
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 44
ggcattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60
catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120
acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180
ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240
aagtgtatca tatgccaagt ccgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300
ggcattatgc ccagtacatg accttacggg actttcctac ttggcagtac atctacgtat 360
tagtcatcgc tattaccatg gtcgaggtga gccccacgtt ctgcttcact ctccccatct 420
cccccccctc cccaccccca attttgtatt tatttatttt ttaattattt tgtgcagcga 480
tgggggcggg gggggggggg gggcgcgcgc caggcggggc ggggcggggc gaggggcggg 540
gcggggcgag gcggagaggt gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc 600
cttttatggc gaggcggcgg cggcggcggc cctataaaaa gcgaagcgcg cggcgggcgg 660
gagtcgctgc gcgctgcctt cgccccgtgc cccgctccgc cgccgcctcg cgccgcccgc 720
cccggctctg actgaccgcg ttactcccac aggtgagcgg gcgggacggc ccttctcctc 780
cgggctgtaa ttagcgcttg gtttaatgac ggcttgtttc ttttctgtgg ctgcgtgaaa 840
gccttgaggg gctccgggag ggccctttgt gcggggggag cggctcgggg ggtgcgtgcg 900
tgtgtgtgtg cgtggggagc gccgcgtgcg gctccgcgct gcccggcggc tgtgagcgct 960
gcgggcgcgg cgcggggctt tgtgcgctcc gcagtgtgcg cgaggggagc gcggccgggg 1020
gcggtgcccc gcggtgcggg gggggctgcg aggggaacaa aggctgcgtg cggggtgtgt 1080
gcgtgggggg gtgagcaggg ggtgtgggcg cgtcggtcgg gctgcaaccc cccctgcacc 1140
cccctccccg agttgctgag cacggcccgg cttcgggtgc ggggctccgt acggggcgtg 1200
gcgcggggct cgccgtgccg ggcggggggt ggcggcaggt gggggtgccg ggcggggcgg 1260
ggccgcctcg ggccggggag ggctcggggg aggggcgcgg cggcccccgg agcgccggcg 1320
gctgtcgagg cgcggcgagc cgcagccatt gccttttatg gtaatcgtgc gagagggcgc 1380
agggacttcc tttgtcccaa atctgtgcgg agccgaaatc tgggaggcgc cgccgcaccc 1440
cctctagcgg gcgcggggcg aagcggtgcg gcgccggcag gaaggaaatg ggcggggagg 1500
gccttcgtgc gtcgccgcgc cgccgtcccc ttctccctct ccagcctcgg ggctgtccgc 1560
ggggggacgg ctgccttcgg gggggacggg gcagggcggg gttcggcttc tggcgtgtga 1620
ccggcggctc tagagcctct gctaaccatg ttcatgcctt cttctttttc ctacagctcc 1680
tgggcaacgt gctggttatt gtgctgtctc atcattttgg caaagaattc cgccaccatg 1740
tctatggggg ctcctcgctc cctgctgctg gcactggccg ccgggctggc tgtcgcaaga 1800
ccacctaata tcgtcctgat ttttgcagac gatctgggat acggcgacct gggatgctat 1860
ggccacccaa gctccaccac acccaacctg gaccagctgg cagcaggagg cctgcggttc 1920
accgacttct acgtgccagt gagcctgtgc accccctcca gagccgccct gctgacaggc 1980
aggctgccag tgcgcatggg catgtatcct ggcgtgctgg tgccatctag caggggcggc 2040
ctgccactgg aggaggtgac cgtggcagag gtgctggcag ccagaggcta cctgacagga 2100
atggccggca agtggcacct gggagtggga ccagagggag ccttcctgcc ccctcaccag 2160
ggcttccacc ggtttctggg catcccttat tctcacgacc agggcccatg ccagaacctg 2220
acctgttttc caccagcaac accatgcgac ggaggatgtg atcagggcct ggtgccaatc 2280
ccactgctgg caaatctgag cgtggaggca cagcctccat ggctgcctgg cctggaggca 2340
agatacatgg ccttcgccca cgacctgatg gcagatgcac agcggcagga tagacctttc 2400
tttctgtact atgcctccca ccacacccac tatccacagt tcagcggcca gtcctttgcc 2460
gagaggtccg gaaggggacc attcggcgac tctctgatgg agctggatgc cgccgtgggc 2520
accctgatga cagcaatcgg cgacctgggc ctgctggagg agacactggt catcttcacc 2580
gccgataacg gccctgagac aatgcggatg tctagaggcg gatgcagcgg cctgctgaga 2640
tgtggcaagg gaaccacata cgagggaggc gtgcgcgagc ctgccctggc attttggcca 2700
ggacacatcg cacctggagt gacccacgag ctggcctcct ctctggacct gctgccaaca 2760
ctggccgccc tggcaggagc acctctgcca aatgtgaccc tggacggctt cgatctgagc 2820
ccactgctgc tgggaaccgg caagtcccct aggcagtctc tgttctttta cccctcctat 2880
cctgatgagg tgcggggcgt gtttgccgtg agaaccggca agtacaaggc ccacttcttt 2940
acacagggct ctgcccacag cgacaccaca gcagatccag catgccacgc cagctcctct 3000
ctgaccgcac acgagccacc tctgctgtac gacctgtcca aggatcccgg cgagaactat 3060
aatctgctgg gaggagtggc aggagcaacc cctgaggtgc tgcaggccct gaagcagctg 3120
cagctgctga aggcacagct ggacgcagca gtgacattcg gcccaagcca ggtggccaga 3180
ggcgaggatc ccgccctgca gatctgttgc caccccggct gcaccccaag acctgcctgt 3240
tgccattgcc ccgacccaca cgcctaagat tctagagtcg agccgcggac tagtaacttg 3300
tttattgcag cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa 3360
gcattttttt cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atctta 3416
<210> 45
<211> 198
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 45
gatccagaca tgataagata cattgatgag tttggacaaa ccacaactag aatgcagtga 60
aaaaaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac cattataagc 120
tgcaataaac aagttaacaa caacaattgc attcatttta tgtttcaggt tcagggggag 180
gtgtgggagg ttttttaa 198
<210> 46
<211> 3416
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 46
ggcattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60
catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120
acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180
ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240
aagtgtatca tatgccaagt ccgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300
ggcattatgc ccagtacatg accttacggg actttcctac ttggcagtac atctacgtat 360
tagtcatcgc tattaccatg gtcgaggtga gccccacgtt ctgcttcact ctccccatct 420
cccccccctc cccaccccca attttgtatt tatttatttt ttaattattt tgtgcagcga 480
tgggggcggg gggggggggg gggcgcgcgc caggcggggc ggggcggggc gaggggcggg 540
gcggggcgag gcggagaggt gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc 600
cttttatggc gaggcggcgg cggcggcggc cctataaaaa gcgaagcgcg cggcgggcgg 660
gagtcgctgc gcgctgcctt cgccccgtgc cccgctccgc cgccgcctcg cgccgcccgc 720
cccggctctg actgaccgcg ttactcccac aggtgagcgg gcgggacggc ccttctcctc 780
cgggctgtaa ttagcgcttg gtttaatgac ggcttgtttc ttttctgtgg ctgcgtgaaa 840
gccttgaggg gctccgggag ggccctttgt gcggggggag cggctcgggg ggtgcgtgcg 900
tgtgtgtgtg cgtggggagc gccgcgtgcg gctccgcgct gcccggcggc tgtgagcgct 960
gcgggcgcgg cgcggggctt tgtgcgctcc gcagtgtgcg cgaggggagc gcggccgggg 1020
gcggtgcccc gcggtgcggg gggggctgcg aggggaacaa aggctgcgtg cggggtgtgt 1080
gcgtgggggg gtgagcaggg ggtgtgggcg cgtcggtcgg gctgcaaccc cccctgcacc 1140
cccctccccg agttgctgag cacggcccgg cttcgggtgc ggggctccgt acggggcgtg 1200
gcgcggggct cgccgtgccg ggcggggggt ggcggcaggt gggggtgccg ggcggggcgg 1260
ggccgcctcg ggccggggag ggctcggggg aggggcgcgg cggcccccgg agcgccggcg 1320
gctgtcgagg cgcggcgagc cgcagccatt gccttttatg gtaatcgtgc gagagggcgc 1380
agggacttcc tttgtcccaa atctgtgcgg agccgaaatc tgggaggcgc cgccgcaccc 1440
cctctagcgg gcgcggggcg aagcggtgcg gcgccggcag gaaggaaatg ggcggggagg 1500
gccttcgtgc gtcgccgcgc cgccgtcccc ttctccctct ccagcctcgg ggctgtccgc 1560
ggggggacgg ctgccttcgg gggggacggg gcagggcggg gttcggcttc tggcgtgtga 1620
ccggcggctc tagagcctct gctaaccatg ttcatgcctt cttctttttc ctacagctcc 1680
tgggcaacgt gctggttatt gtgctgtctc atcattttgg caaagaattc cgccaccatg 1740
tctatggggg ctcctcgctc cctgctgctg gcactggccg ccgggctggc tgtcgcaaga 1800
ccacctaata tcgtcctgat ttttgcagac gatctgggat acggcgacct gggatgctat 1860
ggccacccaa gctccaccac acccaacctg gaccagctgg cagcaggagg cctgcggttc 1920
accgacttct acgtgccagt gagcctgtgc accccctcca gagccgccct gctgacaggc 1980
aggctgccag tgcgcatggg catgtatcct ggcgtgctgg tgccatctag caggggcggc 2040
ctgccactgg aggaggtgac cgtggcagag gtgctggcag ccagaggcta cctgacagga 2100
atggccggca agtggcacct gggagtggga ccagagggag ccttcctgcc ccctcaccag 2160
ggcttccacc ggtttctggg catcccttat tctcacgacc agggcccatg ccagaacctg 2220
acctgttttc caccagcaac accatgcgac ggaggatgtg atcagggcct ggtgccaatc 2280
ccactgctgg caaatctgag cgtggaggca cagcctccat ggctgcctgg cctggaggca 2340
agatacatgg ccttcgccca cgacctgatg gcagatgcac agcggcagga tagacctttc 2400
tttctgtact atgcctccca ccacacccac tatccacagt tcagcggcca gtcctttgcc 2460
gagaggtccg gaaggggacc attcggcgac tctctgatgg agctggatgc cgccgtgggc 2520
accctgatga cagcaatcgg cgacctgggc ctgctggagg agacactggt catcttcacc 2580
gccgataacg gccctgagac aatgcggatg tctagaggcg gatgcagcgg cctgctgaga 2640
tgtggcaagg gaaccacata cgagggaggc gtgcgcgagc ctgccctggc attttggcca 2700
ggacacatcg cacctggagt gacccacgag ctggcctcct ctctggacct gctgccaaca 2760
ctggccgccc tggcaggagc acctctgcca aatgtgaccc tggacggctt cgatctgagc 2820
ccactgctgc tgggaaccgg caagtcccct aggcagtctc tgttctttta cccctcctat 2880
cctgatgagg tgcggggcgt gtttgccgtg agaaccggca agtacaaggc ccacttcttt 2940
acacagggct ctgcccacag cgacaccaca gcagatccag catgccacgc cagctcctct 3000
ctgaccgcac acgagccacc tctgctgtac gacctgtcca aggatcccgg cgagaactat 3060
aatctgctgg gaggagtggc aggagcaacc cctgaggtgc tgcaggccct gaagcagctg 3120
cagctgctga aggcacagct ggacgcagca gtgacattcg gcccaagcca ggtggccaga 3180
ggcgaggatc ccgccctgca gatctgttgc caccccggct gcaccccaag acctgcctgt 3240
tgccattgcc ccgacccaca cgcctaagat tctagagtcg agccgcggac tagtaacttg 3300
tttattgcag cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa 3360
gcattttttt cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atctta 3416
<210> 47
<211> 3949
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 47
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag gtcctgcaga tcttcaatat tggccattag ccatattatt cattggttat 240
atagcataaa tcaatattgg ctattggcca ttgcatacgt tgtatctata tcataatatg 300
tacatttata ttggctcatg tccaatatga ccgccatgtt ggcattgatt attgactagt 360
tattaatagt aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt 420
acataactta cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg 480
tcaataatga cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg 540
gtggagtatt tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt 600
ccgcccccta ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg 660
accttacggg actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg 720
gtcgaggtga gccccacgtt ctgcttcact ctccccatct cccccccctc cccaccccca 780
attttgtatt tatttatttt ttaattattt tgtgcagcga tgggggcggg gggggggggg 840
gggcgcgcgc caggcggggc ggggcggggc gaggggcggg gcggggcgag gcggagaggt 900
gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc cttttatggc gaggcggcgg 960
cggcggcggc cctataaaaa gcgaagcgcg cggcgggcgg gagtcgctgc gcgctgcctt 1020
cgccccgtgc cccgctccgc cgccgcctcg cgccgcccgc cccggctctg actgaccgcg 1080
ttactcccac aggtgagcgg gcgggacggc ccttctcctc cgggctgtaa ttagcgcttg 1140
gtttaatgac ggcttgtttc ttttctgtgg ctgcgtgaaa gccttgaggg gctccgggag 1200
ggccctttgt gcggggggag cggctcgggg ggtgcgtgcg tgtgtgtgtg cgtggggagc 1260
gccgcgtgcg gctccgcgct gcccggcggc tgtgagcgct gcgggcgcgg cgcggggctt 1320
tgtgcgctcc gcagtgtgcg cgaggggagc gcggccgggg gcggtgcccc gcggtgcggg 1380
gggggctgcg aggggaacaa aggctgcgtg cggggtgtgt gcgtgggggg gtgagcaggg 1440
ggtgtgggcg cgtcggtcgg gctgcaaccc cccctgcacc cccctccccg agttgctgag 1500
cacggcccgg cttcgggtgc ggggctccgt acggggcgtg gcgcggggct cgccgtgccg 1560
ggcggggggt ggcggcaggt gggggtgccg ggcggggcgg ggccgcctcg ggccggggag 1620
ggctcggggg aggggcgcgg cggcccccgg agcgccggcg gctgtcgagg cgcggcgagc 1680
cgcagccatt gccttttatg gtaatcgtgc gagagggcgc agggacttcc tttgtcccaa 1740
atctgtgcgg agccgaaatc tgggaggcgc cgccgcaccc cctctagcgg gcgcggggcg 1800
aagcggtgcg gcgccggcag gaaggaaatg ggcggggagg gccttcgtgc gtcgccgcgc 1860
cgccgtcccc ttctccctct ccagcctcgg ggctgtccgc ggggggacgg ctgccttcgg 1920
gggggacggg gcagggcggg gttcggcttc tggcgtgtga ccggcggctc tagagcctct 1980
gctaaccatg ttcatgcctt cttctttttc ctacagctcc tgggcaacgt gctggttatt 2040
gtgctgtctc atcattttgg caaagaattc cgccaccatg tccatggggg caccgcggtc 2100
cctcctcctg gccctggctg ctggcctggc cgttgcccgt ccgcccaaca tcgtgctgat 2160
ctttgccgac gacctcggct atggggacct gggctgctat gggcacccca gctctaccac 2220
tcccaacctg gaccagctgg cggcgggagg gctgcggttc acagacttct acgtgcctgt 2280
gtctctgtgc acaccctcta gggccgccct cctgaccggc cggctcccgg ttcggatggg 2340
catgtaccct ggcgtcctgg tgcccagctc ccgggggggc ctgcccctgg aggaggtgac 2400
cgtggccgaa gtcctggctg cccgaggcta cctcacagga atggccggca agtggcacct 2460
tggggtgggg cctgaggggg ccttcctgcc cccccatcag ggcttccatc gatttctagg 2520
catcccgtac tcccacgacc agggcccctg ccagaacctg acctgcttcc cgccggccac 2580
tccttgcgac ggtggctgtg accagggcct ggtccccatc ccactgttgg ccaacctgtc 2640
cgtggaggcg cagcccccct ggctgcccgg actagaggcc cgctacatgg ctttcgccca 2700
tgacctcatg gccgacgccc agcgccagga tcgccccttc ttcctgtact atgcctctca 2760
ccacacccac taccctcagt tcagtgggca gagctttgca gagcgttcag gccgcgggcc 2820
atttggggac tccctgatgg agctggatgc agctgtgggg accctgatga cagccatagg 2880
ggacctgggg ctgcttgaag agacgctggt catcttcact gcagacaatg gacctgagac 2940
catgcgtatg tcccgaggcg gctgctccgg tctcttgcgg tgtggaaagg gaacgaccta 3000
cgagggcggt gtccgagagc ctgccttggc cttctggcca ggtcatatcg ctcccggcgt 3060
gacccacgag ctggccagct ccctggacct gctgcctacc ctggcagccc tggctggggc 3120
cccactgccc aatgtcacct tggatggctt tgacctcagc cccctgctgc tgggcacagg 3180
caagagccct cggcagtctc tcttcttcta cccgtcctac ccagacgagg tccgtggggt 3240
ttttgctgtg cggactggaa agtacaaggc tcacttcttc acccagggct ctgcccacag 3300
tgataccact gcagaccctg cctgccacgc ctccagctct ctgactgctc atgagccccc 3360
gctgctctat gacctgtcca aggaccctgg tgagaactac aacctgctgg ggggtgtggc 3420
cggggccacc ccagaggtgc tgcaagccct gaaacagctt cagctgctca aggcccagtt 3480
agacgcagct gtgaccttcg gccccagcca ggtggcccgg ggcgaggacc ccgccctgca 3540
gatctgctgt catcctggct gcaccccccg cccagcttgc tgccattgcc cagatcccca 3600
tgcctgagat tctagagtcg agccgcggac tagtaacttg tttattgcag cttataatgg 3660
ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc 3720
tagttgtggt ttgtccaaac tcatcaatgt atcttaggtc tagatacgta gataagtagc 3780
atggcgggtt aatcattaac tacaaggaac ccctagtgat ggagttggcc actccctctc 3840
tgcgcgctcg ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg 3900
cccgggcggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaa 3949
<210> 48
<211> 3949
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 48
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag gtcctgcaga tcttcaatat tggccattag ccatattatt cattggttat 240
atagcataaa tcaatattgg ctattggcca ttgcatacgt tgtatctata tcataatatg 300
tacatttata ttggctcatg tccaatatga ccgccatgtt ggcattgatt attgactagt 360
tattaatagt aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt 420
acataactta cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg 480
tcaataatga cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg 540
gtggagtatt tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt 600
ccgcccccta ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg 660
accttacggg actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg 720
gtcgaggtga gccccacgtt ctgcttcact ctccccatct cccccccctc cccaccccca 780
attttgtatt tatttatttt ttaattattt tgtgcagcga tgggggcggg gggggggggg 840
gggcgcgcgc caggcggggc ggggcggggc gaggggcggg gcggggcgag gcggagaggt 900
gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc cttttatggc gaggcggcgg 960
cggcggcggc cctataaaaa gcgaagcgcg cggcgggcgg gagtcgctgc gcgctgcctt 1020
cgccccgtgc cccgctccgc cgccgcctcg cgccgcccgc cccggctctg actgaccgcg 1080
ttactcccac aggtgagcgg gcgggacggc ccttctcctc cgggctgtaa ttagcgcttg 1140
gtttaatgac ggcttgtttc ttttctgtgg ctgcgtgaaa gccttgaggg gctccgggag 1200
ggccctttgt gcggggggag cggctcgggg ggtgcgtgcg tgtgtgtgtg cgtggggagc 1260
gccgcgtgcg gctccgcgct gcccggcggc tgtgagcgct gcgggcgcgg cgcggggctt 1320
tgtgcgctcc gcagtgtgcg cgaggggagc gcggccgggg gcggtgcccc gcggtgcggg 1380
gggggctgcg aggggaacaa aggctgcgtg cggggtgtgt gcgtgggggg gtgagcaggg 1440
ggtgtgggcg cgtcggtcgg gctgcaaccc cccctgcacc cccctccccg agttgctgag 1500
cacggcccgg cttcgggtgc ggggctccgt acggggcgtg gcgcggggct cgccgtgccg 1560
ggcggggggt ggcggcaggt gggggtgccg ggcggggcgg ggccgcctcg ggccggggag 1620
ggctcggggg aggggcgcgg cggcccccgg agcgccggcg gctgtcgagg cgcggcgagc 1680
cgcagccatt gccttttatg gtaatcgtgc gagagggcgc agggacttcc tttgtcccaa 1740
atctgtgcgg agccgaaatc tgggaggcgc cgccgcaccc cctctagcgg gcgcggggcg 1800
aagcggtgcg gcgccggcag gaaggaaatg ggcggggagg gccttcgtgc gtcgccgcgc 1860
cgccgtcccc ttctccctct ccagcctcgg ggctgtccgc ggggggacgg ctgccttcgg 1920
gggggacggg gcagggcggg gttcggcttc tggcgtgtga ccggcggctc tagagcctct 1980
gctaaccatg ttcatgcctt cttctttttc ctacagctcc tgggcaacgt gctggttatt 2040
gtgctgtctc atcattttgg caaagaattc cgccaccatg tctatggggg ctcctcgctc 2100
cctgctgctg gcactggccg ccgggctggc tgtcgcaaga ccacctaata tcgtcctgat 2160
ttttgcagac gatctgggat acggcgacct gggatgctat ggccacccaa gctccaccac 2220
acccaacctg gaccagctgg cagcaggagg cctgcggttc accgacttct acgtgccagt 2280
gagcctgtgc accccctcca gagccgccct gctgacaggc aggctgccag tgcgcatggg 2340
catgtatcct ggcgtgctgg tgccatctag caggggcggc ctgccactgg aggaggtgac 2400
cgtggcagag gtgctggcag ccagaggcta cctgacagga atggccggca agtggcacct 2460
gggagtggga ccagagggag ccttcctgcc ccctcaccag ggcttccacc ggtttctggg 2520
catcccttat tctcacgacc agggcccatg ccagaacctg acctgttttc caccagcaac 2580
accatgcgac ggaggatgtg atcagggcct ggtgccaatc ccactgctgg caaatctgag 2640
cgtggaggca cagcctccat ggctgcctgg cctggaggca agatacatgg ccttcgccca 2700
cgacctgatg gcagatgcac agcggcagga tagacctttc tttctgtact atgcctccca 2760
ccacacccac tatccacagt tcagcggcca gtcctttgcc gagaggtccg gaaggggacc 2820
attcggcgac tctctgatgg agctggatgc cgccgtgggc accctgatga cagcaatcgg 2880
cgacctgggc ctgctggagg agacactggt catcttcacc gccgataacg gccctgagac 2940
aatgcggatg tctagaggcg gatgcagcgg cctgctgaga tgtggcaagg gaaccacata 3000
cgagggaggc gtgcgcgagc ctgccctggc attttggcca ggacacatcg cacctggagt 3060
gacccacgag ctggcctcct ctctggacct gctgccaaca ctggccgccc tggcaggagc 3120
acctctgcca aatgtgaccc tggacggctt cgatctgagc ccactgctgc tgggaaccgg 3180
caagtcccct aggcagtctc tgttctttta cccctcctat cctgatgagg tgcggggcgt 3240
gtttgccgtg agaaccggca agtacaaggc ccacttcttt acacagggct ctgcccacag 3300
cgacaccaca gcagatccag catgccacgc cagctcctct ctgaccgcac acgagccacc 3360
tctgctgtac gacctgtcca aggatcccgg cgagaactat aatctgctgg gaggagtggc 3420
aggagcaacc cctgaggtgc tgcaggccct gaagcagctg cagctgctga aggcacagct 3480
ggacgcagca gtgacattcg gcccaagcca ggtggccaga ggcgaggatc ccgccctgca 3540
gatctgttgc caccccggct gcaccccaag acctgcctgt tgccattgcc ccgacccaca 3600
cgcctaagat tctagagtcg agccgcggac tagtaacttg tttattgcag cttataatgg 3660
ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc 3720
tagttgtggt ttgtccaaac tcatcaatgt atcttaggtc tagatacgta gataagtagc 3780
atggcgggtt aatcattaac tacaaggaac ccctagtgat ggagttggcc actccctctc 3840
tgcgcgctcg ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg 3900
cccgggcggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaa 3949
<210> 49
<211> 4500
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 49
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag gtcctgcata tgcggccgcg atcttcaata ttggccatta gccatattat 240
tcattggtta tatagcataa atcaatattg gctattggcc attgcatacg ttgtatctat 300
atcataatat gtacatttat attggctcat gtccaatatg accgccatgt tggcattgat 360
tattgactag ttattaatag taatcaatta cggggtcatt agttcatagc ccatatatgg 420
agttccgcgt tacataactt acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc 480
gcccattgac gtcaataatg acgtatgttc ccatagtaac gccaataggg actttccatt 540
gacgtcaatg ggtggagtat ttacggtaaa ctgcccactt ggcagtacat caagtgtatc 600
atatgccaag tccgccccct attgacgtca atgacggtaa atggcccgcc tggcattatg 660
cccagtacat gaccttacgg gactttccta cttggcagta catctacgta ttagtcatcg 720
ctattaccat ggtcgaggtg agccccacgt tctgcttcac tctccccatc tcccccccct 780
ccccaccccc aattttgtat ttatttattt tttaattatt ttgtgcagcg atgggggcgg 840
gggggggggg ggggcgcgcg ccaggcgggg cggggcgggg cgaggggcgg ggcggggcga 900
ggcggagagg tgcggcggca gccaatcaga gcggcgcgct ccgaaagttt ccttttatgg 960
cgaggcggcg gcggcggcgg ccctataaaa agcgaagcgc gcggcgggcg ggagtcgctg 1020
cgcgctgcct tcgccccgtg ccccgctccg ccgccgcctc gcgccgcccg ccccggctct 1080
gactgaccgc gttactccca caggtgagcg ggcgggacgg cccttctcct ccgggctgta 1140
attagcgctt ggtttaatga cggcttgttt cttttctgtg gctgcgtgaa agccttgagg 1200
ggctccggga gggccctttg tgcgggggga gcggctcggg gggtgcgtgc gtgtgtgtgt 1260
gcgtggggag cgccgcgtgc ggctccgcgc tgcccggcgg ctgtgagcgc tgcgggcgcg 1320
gcgcggggct ttgtgcgctc cgcagtgtgc gcgaggggag cgcggccggg ggcggtgccc 1380
cgcggtgcgg ggggggctgc gaggggaaca aaggctgcgt gcggggtgtg tgcgtggggg 1440
ggtgagcagg gggtgtgggc gcgtcggtcg ggctgcaacc ccccctgcac ccccctcccc 1500
gagttgctga gcacggcccg gcttcgggtg cggggctccg tacggggcgt ggcgcggggc 1560
tcgccgtgcc gggcgggggg tggcggcagg tgggggtgcc gggcggggcg gggccgcctc 1620
gggccgggga gggctcgggg gaggggcgcg gcggcccccg gagcgccggc ggctgtcgag 1680
gcgcggcgag ccgcagccat tgccttttat ggtaatcgtg cgagagggcg cagggacttc 1740
ctttgtccca aatctgtgcg gagccgaaat ctgggaggcg ccgccgcacc ccctctagcg 1800
ggcgcggggc gaagcggtgc ggcgccggca ggaaggaaat gggcggggag ggccttcgtg 1860
cgtcgccgcg ccgccgtccc cttctccctc tccagcctcg gggctgtccg cggggggacg 1920
gctgccttcg ggggggacgg ggcagggcgg ggttcggctt ctggcgtgtg accggcggct 1980
ctagagcctc tgctaaccat gttcatgcct tcttcttttt cctacagctc ctgggcaacg 2040
tgctggttat tgtgctgtct catcattttg gcaaagaatt ccgccaccat gtctatgggg 2100
gctcctcgct ccctgctgct ggcactggcc gccgggctgg ctgtcgcaag accacctaat 2160
atcgtcctga tttttgcaga cgatctggga tacggcgacc tgggatgcta tggccaccca 2220
agctccacca cacccaacct ggaccagctg gcagcaggag gcctgcggtt caccgacttc 2280
tacgtgccag tgagcctgtg caccccctcc agagccgccc tgctgacagg caggctgcca 2340
gtgcgcatgg gcatgtatcc tggcgtgctg gtgccatcta gcaggggcgg cctgccactg 2400
gaggaggtga ccgtggcaga ggtgctggca gccagaggct acctgacagg aatggccggc 2460
aagtggcacc tgggagtggg accagaggga gccttcctgc cccctcacca gggcttccac 2520
cggtttctgg gcatccctta ttctcacgac cagggcccat gccagaacct gacctgtttt 2580
ccaccagcaa caccatgcga cggaggatgt gatcagggcc tggtgccaat cccactgctg 2640
gcaaatctga gcgtggaggc acagcctcca tggctgcctg gcctggaggc aagatacatg 2700
gccttcgccc acgacctgat ggcagatgca cagcggcagg atagaccttt ctttctgtac 2760
tatgcctccc accacaccca ctatccacag ttcagcggcc agtcctttgc cgagaggtcc 2820
ggaaggggac cattcggcga ctctctgatg gagctggatg ccgccgtggg caccctgatg 2880
acagcaatcg gcgacctggg cctgctggag gagacactgg tcatcttcac cgccgataac 2940
ggccctgaga caatgcggat gtctagaggc ggatgcagcg gcctgctgag atgtggcaag 3000
ggaaccacat acgagggagg cgtgcgcgag cctgccctgg cattttggcc aggacacatc 3060
gcacctggag tgacccacga gctggcctcc tctctggacc tgctgccaac actggccgcc 3120
ctggcaggag cacctctgcc aaatgtgacc ctggacggct tcgatctgag cccactgctg 3180
ctgggaaccg gcaagtcccc taggcagtct ctgttctttt acccctccta tcctgatgag 3240
gtgcggggcg tgtttgccgt gagaaccggc aagtacaagg cccacttctt tacacagggc 3300
tctgcccaca gcgacaccac agcagatcca gcatgccacg ccagctcctc tctgaccgca 3360
cacgagccac ctctgctgta cgacctgtcc aaggatcccg gcgagaacta taatctgctg 3420
ggaggagtgg caggagcaac ccctgaggtg ctgcaggccc tgaagcagct gcagctgctg 3480
aaggcacagc tggacgcagc agtgacattc ggcccaagcc aggtggccag aggcgaggat 3540
cccgccctgc agatctgttg ccaccccggc tgcaccccaa gacctgcctg ttgccattgc 3600
cccgacccac acgcctaaga ttctagagtc gagccgcgga ctagtaactt gtttattgca 3660
gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa agcatttttt 3720
tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttacct gcaggctcac 3780
cagtgtttgt gactgggaac tctccctgcc aaatattggc ataatgctgt cctttaggtt 3840
gcagcttatt gccccagggg aacagtctgt tgtgcagtcc accccggcag gaatactccc 3900
attctgcctc tgttggtaac cttttcccag cccaggtgca gtatgccact gcatcattcc 3960
aggacacatg cagcacaggg tggtcaggcc tgtggaggat agttgagtct ggtccctctg 4020
ggtgtctcca attggctcct ttaacaggca gccaccaggg ggctgcagcc actgcctgtt 4080
ggatattggt cttcacctgc tcacttagca tgccttcaaa aacaaaactg tcaccaaatt 4140
tctcagcctc tgtaaggtat ccagtgctgt ttacaaattt ctcaaattct gtgtttgaca 4200
cttcataggc atccatatag aaggcatcaa ttgtgactct cctagctggt gcttcaccat 4260
cctgcttgat ctgagggtca tcagttccca tagtaaaaac tcctgcaggt ctagatacgt 4320
agataagtag catggcgggt taatcattaa ctacaaggaa cccctagtga tggagttggc 4380
cactccctct ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg 4440
cccgggcttt gcccgggcgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa 4500
<210> 50
<211> 6612
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 50
cgccagggtt ttcccagtca cgacgttgta aaacgacggc cagtgccaag cttgcatgcc 60
tgcatttggc cactccctct ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg 120
tcgcccgacg cccgggcttt gcccgggcgg cctcagtgag cgagcgagcg cgcagagagg 180
gagtggccaa ctccatcact aggggttcct ggaggggtgg agtcgtgacg tgaattacgt 240
catagggtta gggaggtcct gcagatcttc aatattggcc attagccata ttattcattg 300
gttatatagc ataaatcaat attggctatt ggccattgca tacgttgtat ctatatcata 360
atatgtacat ttatattggc tcatgtccaa tatgaccgcc atgttggcat tgattattga 420
ctagttatta atagtaatca attacggggt cattagttca tagcccatat atggagttcc 480
gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat 540
tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc 600
aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 660
caagtccgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt 720
acatgacctt acgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 780
ccatggtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac 840
ccccaatttt gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg 900
ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg gcggggcggg gcgaggcgga 960
gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa gtttcctttt atggcgaggc 1020
ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg ggcgggagtc gctgcgcgct 1080
gccttcgccc cgtgccccgc tccgccgccg cctcgcgccg cccgccccgg ctctgactga 1140
ccgcgttact cccacaggtg agcgggcggg acggcccttc tcctccgggc tgtaattagc 1200
gcttggttta atgacggctt gtttcttttc tgtggctgcg tgaaagcctt gaggggctcc 1260
gggagggccc tttgtgcggg gggagcggct cggggggtgc gtgcgtgtgt gtgtgcgtgg 1320
ggagcgccgc gtgcggctcc gcgctgcccg gcggctgtga gcgctgcggg cgcggcgcgg 1380
ggctttgtgc gctccgcagt gtgcgcgagg ggagcgcggc cgggggcggt gccccgcggt 1440
gcgggggggg ctgcgagggg aacaaaggct gcgtgcgggg tgtgtgcgtg ggggggtgag 1500
cagggggtgt gggcgcgtcg gtcgggctgc aaccccccct gcacccccct ccccgagttg 1560
ctgagcacgg cccggcttcg ggtgcggggc tccgtacggg gcgtggcgcg gggctcgccg 1620
tgccgggcgg ggggtggcgg caggtggggg tgccgggcgg ggcggggccg cctcgggccg 1680
gggagggctc gggggagggg cgcggcggcc cccggagcgc cggcggctgt cgaggcgcgg 1740
cgagccgcag ccattgcctt ttatggtaat cgtgcgagag ggcgcaggga cttcctttgt 1800
cccaaatctg tgcggagccg aaatctggga ggcgccgccg caccccctct agcgggcgcg 1860
gggcgaagcg gtgcggcgcc ggcaggaagg aaatgggcgg ggagggcctt cgtgcgtcgc 1920
cgcgccgccg tccccttctc cctctccagc ctcggggctg tccgcggggg gacggctgcc 1980
ttcggggggg acggggcagg gcggggttcg gcttctggcg tgtgaccggc ggctctagag 2040
cctctgctaa ccatgttcat gccttcttct ttttcctaca gctcctgggc aacgtgctgg 2100
ttattgtgct gtctcatcat tttggcaaag aattccgcca ccatgtccat gggggcaccg 2160
cggtccctcc tcctggccct ggctgctggc ctggccgttg cccgtccgcc caacatcgtg 2220
ctgatctttg ccgacgacct cggctatggg gacctgggct gctatgggca ccccagctct 2280
accactccca acctggacca gctggcggcg ggagggctgc ggttcacaga cttctacgtg 2340
cctgtgtctc tgtgcacacc ctctagggcc gccctcctga ccggccggct cccggttcgg 2400
atgggcatgt accctggcgt cctggtgccc agctcccggg ggggcctgcc cctggaggag 2460
gtgaccgtgg ccgaagtcct ggctgcccga ggctacctca caggaatggc cggcaagtgg 2520
caccttgggg tggggcctga gggggccttc ctgccccccc atcagggctt ccatcgattt 2580
ctaggcatcc cgtactccca cgaccagggc ccctgccaga acctgacctg cttcccgccg 2640
gccactcctt gcgacggtgg ctgtgaccag ggcctggtcc ccatcccact gttggccaac 2700
ctgtccgtgg aggcgcagcc cccctggctg cccggactag aggcccgcta catggctttc 2760
gcccatgacc tcatggccga cgcccagcgc caggatcgcc ccttcttcct gtactatgcc 2820
tctcaccaca cccactaccc tcagttcagt gggcagagct ttgcagagcg ttcaggccgc 2880
gggccatttg gggactccct gatggagctg gatgcagctg tggggaccct gatgacagcc 2940
ataggggacc tggggctgct tgaagagacg ctggtcatct tcactgcaga caatggacct 3000
gagaccatgc gtatgtcccg aggcggctgc tccggtctct tgcggtgtgg aaagggaacg 3060
acctacgagg gcggtgtccg agagcctgcc ttggccttct ggccaggtca tatcgctccc 3120
ggcgtgaccc acgagctggc cagctccctg gacctgctgc ctaccctggc agccctggct 3180
ggggccccac tgcccaatgt caccttggat ggctttgacc tcagccccct gctgctgggc 3240
acaggcaaga gccctcggca gtctctcttc ttctacccgt cctacccaga cgaggtccgt 3300
ggggtttttg ctgtgcggac tggaaagtac aaggctcact tcttcaccca gggctctgcc 3360
cacagtgata ccactgcaga ccctgcctgc cacgcctcca gctctctgac tgctcatgag 3420
cccccgctgc tctatgacct gtccaaggac cctggtgaga actacaacct gctggggggt 3480
gtggccgggg ccaccccaga ggtgctgcaa gccctgaaac agcttcagct gctcaaggcc 3540
cagttagacg cagctgtgac cttcggcccc agccaggtgg cccggggcga ggaccccgcc 3600
ctgcagatct gctgtcatcc tggctgcacc ccccgcccag cttgctgcca ttgcccagat 3660
ccccatgcct gagattctag agtcgagccg cggactagta acttgtttat tgcagcttat 3720
aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg 3780
cattctagtt gtggtttgtc caaactcatc aatgtatctt aggtctagat acgtagataa 3840
gtagcatggc gggttaatca ttaactacaa ggaaccccta gtgatggagt tggccactcc 3900
ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg 3960
ctttgcccgg gcggcctcag tgagcgagcg agcgcgcaga gagggagtgg ccaaagatcc 4020
ccgggtaccg agctcgaatt cgtaatcatg tcatagctgt ttcctgtgtg aaattgttat 4080
ccgctcacaa ttccacacaa catacgagcc ggaagcataa agtgtaaagc ctggggtgcc 4140
taatgagtga gctaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga 4200
aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt 4260
attggcgaac ttttgctgag ttgaaggatc agatcacgca tcttcccgac aacgcagacc 4320
gttccgtggc aaagcaaaag ttcaaaatca gtaaccgtca gtgccgataa gttcaaagtt 4380
aaacctggtg ttgataccaa cattgaaacg ctgatcgaaa acgcgctgaa aaacgctgct 4440
gaatgtgcga gcttcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct 4500
gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga 4560
taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc 4620
cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg 4680
ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg 4740
aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt 4800
tctcccttcg ggaagcgtgg cgctttctca atgctcacgc tgtaggtatc tcagttcggt 4860
gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg 4920
cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact 4980
ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt 5040
cttgaagtgg tggcctaact acggctacac tagaaggaca gtatttggta tctgcgctct 5100
gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac 5160
cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc 5220
tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg atccgtcgag 5280
aggtctgcct cgtgaagaag gtgttgctga ctcataccag gcctgaatcg ccccatcatc 5340
cagccagaaa gtgagggagc cacggttgat gagagctttg ttgtaggtgg accagttggt 5400
gattttgaac ttttgctttg ccacggaacg gtctgcgttg tcgggaagat gcgtgatctg 5460
atccttcaac tcagcaaaag ttcgatttat tcaacaaagc cacgttgtgt ctcaaaatct 5520
ctgatgttac attgcacaag ataaaaatat atcatcatga acaataaaac tgtctgctta 5580
cataaacagt aatacaaggg gtgttatgag ccatattcaa cgggaaacgt cttgctcgaa 5640
gccgcgatta aattccaaca tggatgctga tttatatggg tataaatggg ctcgcgataa 5700
tgtcgggcaa tcaggtgcga caatctatcg attgtatggg aagcccgatg cgccagagtt 5760
gtttctgaaa catggcaaag gtagcgttgc caatgatgtt acagatgaga tggtcagact 5820
aaactggctg acggaattta tgcctcttcc gaccatcaag cattttatcc gtactcctga 5880
tgatgcatgg ttactcacca ctgcgatccc cgggaaaaca gcattccagg tattagaaga 5940
atatcctgat tcaggtgaaa atattgttga tgcgctggca gtgttcctgc gccggttgca 6000
ttcgattcct gtttgtaatt gtccttttaa cagcgatcgc gtatttcgtc tcgctcaggc 6060
gcaatcacga atgaataacg gtttggttga tgcgagtgat tttgatgacg agcgtaatgg 6120
ctggcctgtt gaacaagtct ggaaagaaat gcataagctt ttgccattct caccggattc 6180
agtcgtcact catggtgatt tctcacttga taaccttatt tttgacgagg ggaaattaat 6240
aggttgtatt gatgttggac gagtcggaat cgcagaccga taccaggatc ttgccatcct 6300
atggaactgc ctcggtgagt tttctccttc attacagaaa cggctttttc aaaaatatgg 6360
tattgataat cctgatatga ataaattgca gtttcatttg atgctcgatg agtttttcta 6420
atcagaattg gttaattggt tgtaacactg gcagagcatt acgctgactt gacgggacgg 6480
cggctttgtt gaataaatcg cattcgccat tcaggctgcg caactgttgg gaagggcgat 6540
cggtgcgggc ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat 6600
taagttgggt aa 6612
<210> 51
<211> 5792
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 51
gtcaggtggc acttttcggg gaaatgtggc atgcctgcat ttggccactc cctctctgcg 60
cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg 120
ggcggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca tcactagggg 180
ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag ggttagggag gtcctgcaga 240
tcttcaatat tggccattag ccatattatt cattggttat atagcataaa tcaatattgg 300
ctattggcca ttgcatacgt tgtatctata tcataatatg tacatttata ttggctcatg 360
tccaatatga ccgccatgtt ggcattgatt attgactagt tattaatagt aatcaattac 420
ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg 480
cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc 540
catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac 600
tgcccacttg gcagtacatc aagtgtatca tatgccaagt ccgcccccta ttgacgtcaa 660
tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttacggg actttcctac 720
ttggcagtac atctacgtat tagtcatcgc tattaccatg gtcgaggtga gccccacgtt 780
ctgcttcact ctccccatct cccccccctc cccaccccca attttgtatt tatttatttt 840
ttaattattt tgtgcagcga tgggggcggg gggggggggg gggcgcgcgc caggcggggc 900
ggggcggggc gaggggcggg gcggggcgag gcggagaggt gcggcggcag ccaatcagag 960
cggcgcgctc cgaaagtttc cttttatggc gaggcggcgg cggcggcggc cctataaaaa 1020
gcgaagcgcg cggcgggcgg gagtcgctgc gcgctgcctt cgccccgtgc cccgctccgc 1080
cgccgcctcg cgccgcccgc cccggctctg actgaccgcg ttactcccac aggtgagcgg 1140
gcgggacggc ccttctcctc cgggctgtaa ttagcgcttg gtttaatgac ggcttgtttc 1200
ttttctgtgg ctgcgtgaaa gccttgaggg gctccgggag ggccctttgt gcggggggag 1260
cggctcgggg ggtgcgtgcg tgtgtgtgtg cgtggggagc gccgcgtgcg gctccgcgct 1320
gcccggcggc tgtgagcgct gcgggcgcgg cgcggggctt tgtgcgctcc gcagtgtgcg 1380
cgaggggagc gcggccgggg gcggtgcccc gcggtgcggg gggggctgcg aggggaacaa 1440
aggctgcgtg cggggtgtgt gcgtgggggg gtgagcaggg ggtgtgggcg cgtcggtcgg 1500
gctgcaaccc cccctgcacc cccctccccg agttgctgag cacggcccgg cttcgggtgc 1560
ggggctccgt acggggcgtg gcgcggggct cgccgtgccg ggcggggggt ggcggcaggt 1620
gggggtgccg ggcggggcgg ggccgcctcg ggccggggag ggctcggggg aggggcgcgg 1680
cggcccccgg agcgccggcg gctgtcgagg cgcggcgagc cgcagccatt gccttttatg 1740
gtaatcgtgc gagagggcgc agggacttcc tttgtcccaa atctgtgcgg agccgaaatc 1800
tgggaggcgc cgccgcaccc cctctagcgg gcgcggggcg aagcggtgcg gcgccggcag 1860
gaaggaaatg ggcggggagg gccttcgtgc gtcgccgcgc cgccgtcccc ttctccctct 1920
ccagcctcgg ggctgtccgc ggggggacgg ctgccttcgg gggggacggg gcagggcggg 1980
gttcggcttc tggcgtgtga ccggcggctc tagagcctct gctaaccatg ttcatgcctt 2040
cttctttttc ctacagctcc tgggcaacgt gctggttatt gtgctgtctc atcattttgg 2100
caaagaattc cgccaccatg tctatggggg ctcctcgctc cctgctgctg gcactggccg 2160
ccgggctggc tgtcgcaaga ccacctaata tcgtcctgat ttttgcagac gatctgggat 2220
acggcgacct gggatgctat ggccacccaa gctccaccac acccaacctg gaccagctgg 2280
cagcaggagg cctgcggttc accgacttct acgtgccagt gagcctgtgc accccctcca 2340
gagccgccct gctgacaggc aggctgccag tgcgcatggg catgtatcct ggcgtgctgg 2400
tgccatctag caggggcggc ctgccactgg aggaggtgac cgtggcagag gtgctggcag 2460
ccagaggcta cctgacagga atggccggca agtggcacct gggagtggga ccagagggag 2520
ccttcctgcc ccctcaccag ggcttccacc ggtttctggg catcccttat tctcacgacc 2580
agggcccatg ccagaacctg acctgttttc caccagcaac accatgcgac ggaggatgtg 2640
atcagggcct ggtgccaatc ccactgctgg caaatctgag cgtggaggca cagcctccat 2700
ggctgcctgg cctggaggca agatacatgg ccttcgccca cgacctgatg gcagatgcac 2760
agcggcagga tagacctttc tttctgtact atgcctccca ccacacccac tatccacagt 2820
tcagcggcca gtcctttgcc gagaggtccg gaaggggacc attcggcgac tctctgatgg 2880
agctggatgc cgccgtgggc accctgatga cagcaatcgg cgacctgggc ctgctggagg 2940
agacactggt catcttcacc gccgataacg gccctgagac aatgcggatg tctagaggcg 3000
gatgcagcgg cctgctgaga tgtggcaagg gaaccacata cgagggaggc gtgcgcgagc 3060
ctgccctggc attttggcca ggacacatcg cacctggagt gacccacgag ctggcctcct 3120
ctctggacct gctgccaaca ctggccgccc tggcaggagc acctctgcca aatgtgaccc 3180
tggacggctt cgatctgagc ccactgctgc tgggaaccgg caagtcccct aggcagtctc 3240
tgttctttta cccctcctat cctgatgagg tgcggggcgt gtttgccgtg agaaccggca 3300
agtacaaggc ccacttcttt acacagggct ctgcccacag cgacaccaca gcagatccag 3360
catgccacgc cagctcctct ctgaccgcac acgagccacc tctgctgtac gacctgtcca 3420
aggatcccgg cgagaactat aatctgctgg gaggagtggc aggagcaacc cctgaggtgc 3480
tgcaggccct gaagcagctg cagctgctga aggcacagct ggacgcagca gtgacattcg 3540
gcccaagcca ggtggccaga ggcgaggatc ccgccctgca gatctgttgc caccccggct 3600
gcaccccaag acctgcctgt tgccattgcc ccgacccaca cgcctaagat tctagagtcg 3660
agccgcggac tagtaacttg tttattgcag cttataatgg ttacaaataa agcaatagca 3720
tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt ttgtccaaac 3780
tcatcaatgt atcttaggtc tagatacgta gataagtagc atggcgggtt aatcattaac 3840
tacaaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg ctcgctcact 3900
gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg cccgggcggc ctcagtgagc 3960
gagcgagcgc gcagagaggg agtggccaaa gatccccggg taccgaggac gaattctcta 4020
gatatcgctc aatactgacc atttaaatca tacctgacct ccatagcaga aagtcaaaag 4080
cctccgaccg gaggcttttg acttgatcgg cacgtaagag gttccaactt tcaccataat 4140
gaaataagat cactaccggg cgtatttttt gagttatcga gattttcagg agctaaggaa 4200
gctaaaatga gccatattca acgggaaacg tcttgctcga ggccgcgatt aaattccaac 4260
atggatgctg atttatatgg gtataaatgg gctcgcgata atgtcgggca atcaggtgcg 4320
acaatctatc gattgtatgg gaagcccgat gcgccagagt tgtttctgaa acatggcaaa 4380
ggtagcgttg ccaatgatgt tacagatgag atggtcaggc taaactggct gacggaattt 4440
atgcctcttc cgaccatcaa gcattttatc cgtactcctg atgatgcatg gttactcacc 4500
actgcgatcc cagggaaaac agcattccag gtattagaag aatatcctga ttcaggtgaa 4560
aatattgttg atgcgctggc agtgttcctg cgccggttgc attcgattcc tgtttgtaat 4620
tgtcctttta acggcgatcg cgtatttcgt ctcgctcagg cgcaatcacg aatgaataac 4680
ggtttggttg gtgcgagtga ttttgatgac gagcgtaatg gctggcctgt tgaacaagtc 4740
tggaaagaaa tgcataagct tttgccattc tcaccggatt cagtcgtcac tcatggtgat 4800
ttctcacttg ataaccttat ttttgacgag gggaaattaa taggttgtat tgatgttgga 4860
cgagtcggaa tcgcagaccg ataccaggat cttgccatcc tatggaactg cctcggtgag 4920
ttttctcctt cattacagaa acggcttttt caaaaatatg gtattgataa tcctgatatg 4980
aataaattgc agtttcactt gatgctcgat gagtttttct gagggcccaa atgtaatcac 5040
ctggctcacc ttcgggtggg cctttctgcg ttgctggcgt ttttccatag gctccgcccc 5100
cctgacgagc atcacaaaaa tcgatgctca agtcagaggt ggcgaaaccc gacaggacta 5160
taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg 5220
ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc 5280
tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac 5340
gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac 5400
ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg 5460
aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga 5520
agaacagtat ttggtatctg cgctctgctg aagccagtta cctcggaaaa agagttggta 5580
gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc 5640
agattacgcg cagaaaaaaa ggatctcaag aagatccttt gattttctac cgaagaaagg 5700
cccacccgtg aaggtgagcc agtgagttga ttgcagtcca gttacgctgg agtctgaggc 5760
tcgtcctgaa tgatatcaag cttgaattcg tt 5792
<210> 52
<211> 6342
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 52
tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgatgctcaa gtcagaggtg 60
gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg 120
ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag 180
cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc 240
caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa 300
ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg 360
taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc 420
taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga agccagttac 480
ctcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt 540
ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg 600
attttctacc gaagaaaggc ccacccgtga aggtgagcca gtgagttgat tgcagtccag 660
ttacgctgga gtctgaggct cgtcctgaat gatatcaagc ttgaattcgt gtcaggtggc 720
acttttcggg gaaatgtggc atgcctgcat ttggccactc cctctctgcg cgctcgctcg 780
ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca 840
gtgagcgagc gagcgcgcag agagggagtg gccaactcca tcactagggg ttcctggagg 900
ggtggagtcg tgacgtgaat tacgtcatag ggttagggag gtcctgcata tgcggccgcg 960
atcttcaata ttggccatta gccatattat tcattggtta tatagcataa atcaatattg 1020
gctattggcc attgcatacg ttgtatctat atcataatat gtacatttat attggctcat 1080
gtccaatatg accgccatgt tggcattgat tattgactag ttattaatag taatcaatta 1140
cggggtcatt agttcatagc ccatatatgg agttccgcgt tacataactt acggtaaatg 1200
gcccgcctgg ctgaccgccc aacgaccccc gcccattgac gtcaataatg acgtatgttc 1260
ccatagtaac gccaataggg actttccatt gacgtcaatg ggtggagtat ttacggtaaa 1320
ctgcccactt ggcagtacat caagtgtatc atatgccaag tccgccccct attgacgtca 1380
atgacggtaa atggcccgcc tggcattatg cccagtacat gaccttacgg gactttccta 1440
cttggcagta catctacgta ttagtcatcg ctattaccat ggtcgaggtg agccccacgt 1500
tctgcttcac tctccccatc tcccccccct ccccaccccc aattttgtat ttatttattt 1560
tttaattatt ttgtgcagcg atgggggcgg gggggggggg ggggcgcgcg ccaggcgggg 1620
cggggcgggg cgaggggcgg ggcggggcga ggcggagagg tgcggcggca gccaatcaga 1680
gcggcgcgct ccgaaagttt ccttttatgg cgaggcggcg gcggcggcgg ccctataaaa 1740
agcgaagcgc gcggcgggcg ggagtcgctg cgcgctgcct tcgccccgtg ccccgctccg 1800
ccgccgcctc gcgccgcccg ccccggctct gactgaccgc gttactccca caggtgagcg 1860
ggcgggacgg cccttctcct ccgggctgta attagcgctt ggtttaatga cggcttgttt 1920
cttttctgtg gctgcgtgaa agccttgagg ggctccggga gggccctttg tgcgggggga 1980
gcggctcggg gggtgcgtgc gtgtgtgtgt gcgtggggag cgccgcgtgc ggctccgcgc 2040
tgcccggcgg ctgtgagcgc tgcgggcgcg gcgcggggct ttgtgcgctc cgcagtgtgc 2100
gcgaggggag cgcggccggg ggcggtgccc cgcggtgcgg ggggggctgc gaggggaaca 2160
aaggctgcgt gcggggtgtg tgcgtggggg ggtgagcagg gggtgtgggc gcgtcggtcg 2220
ggctgcaacc ccccctgcac ccccctcccc gagttgctga gcacggcccg gcttcgggtg 2280
cggggctccg tacggggcgt ggcgcggggc tcgccgtgcc gggcgggggg tggcggcagg 2340
tgggggtgcc gggcggggcg gggccgcctc gggccgggga gggctcgggg gaggggcgcg 2400
gcggcccccg gagcgccggc ggctgtcgag gcgcggcgag ccgcagccat tgccttttat 2460
ggtaatcgtg cgagagggcg cagggacttc ctttgtccca aatctgtgcg gagccgaaat 2520
ctgggaggcg ccgccgcacc ccctctagcg ggcgcggggc gaagcggtgc ggcgccggca 2580
ggaaggaaat gggcggggag ggccttcgtg cgtcgccgcg ccgccgtccc cttctccctc 2640
tccagcctcg gggctgtccg cggggggacg gctgccttcg ggggggacgg ggcagggcgg 2700
ggttcggctt ctggcgtgtg accggcggct ctagagcctc tgctaaccat gttcatgcct 2760
tcttcttttt cctacagctc ctgggcaacg tgctggttat tgtgctgtct catcattttg 2820
gcaaagaatt ccgccaccat gtctatgggg gctcctcgct ccctgctgct ggcactggcc 2880
gccgggctgg ctgtcgcaag accacctaat atcgtcctga tttttgcaga cgatctggga 2940
tacggcgacc tgggatgcta tggccaccca agctccacca cacccaacct ggaccagctg 3000
gcagcaggag gcctgcggtt caccgacttc tacgtgccag tgagcctgtg caccccctcc 3060
agagccgccc tgctgacagg caggctgcca gtgcgcatgg gcatgtatcc tggcgtgctg 3120
gtgccatcta gcaggggcgg cctgccactg gaggaggtga ccgtggcaga ggtgctggca 3180
gccagaggct acctgacagg aatggccggc aagtggcacc tgggagtggg accagaggga 3240
gccttcctgc cccctcacca gggcttccac cggtttctgg gcatccctta ttctcacgac 3300
cagggcccat gccagaacct gacctgtttt ccaccagcaa caccatgcga cggaggatgt 3360
gatcagggcc tggtgccaat cccactgctg gcaaatctga gcgtggaggc acagcctcca 3420
tggctgcctg gcctggaggc aagatacatg gccttcgccc acgacctgat ggcagatgca 3480
cagcggcagg atagaccttt ctttctgtac tatgcctccc accacaccca ctatccacag 3540
ttcagcggcc agtcctttgc cgagaggtcc ggaaggggac cattcggcga ctctctgatg 3600
gagctggatg ccgccgtggg caccctgatg acagcaatcg gcgacctggg cctgctggag 3660
gagacactgg tcatcttcac cgccgataac ggccctgaga caatgcggat gtctagaggc 3720
ggatgcagcg gcctgctgag atgtggcaag ggaaccacat acgagggagg cgtgcgcgag 3780
cctgccctgg cattttggcc aggacacatc gcacctggag tgacccacga gctggcctcc 3840
tctctggacc tgctgccaac actggccgcc ctggcaggag cacctctgcc aaatgtgacc 3900
ctggacggct tcgatctgag cccactgctg ctgggaaccg gcaagtcccc taggcagtct 3960
ctgttctttt acccctccta tcctgatgag gtgcggggcg tgtttgccgt gagaaccggc 4020
aagtacaagg cccacttctt tacacagggc tctgcccaca gcgacaccac agcagatcca 4080
gcatgccacg ccagctcctc tctgaccgca cacgagccac ctctgctgta cgacctgtcc 4140
aaggatcccg gcgagaacta taatctgctg ggaggagtgg caggagcaac ccctgaggtg 4200
ctgcaggccc tgaagcagct gcagctgctg aaggcacagc tggacgcagc agtgacattc 4260
ggcccaagcc aggtggccag aggcgaggat cccgccctgc agatctgttg ccaccccggc 4320
tgcaccccaa gacctgcctg ttgccattgc cccgacccac acgcctaaga ttctagagtc 4380
gagccgcgga ctagtaactt gtttattgca gcttataatg gttacaaata aagcaatagc 4440
atcacaaatt tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa 4500
ctcatcaatg tatcttacct gcaggctcac cagtgtttgt gactgggaac tctccctgcc 4560
aaatattggc ataatgctgt cctttaggtt gcagcttatt gccccagggg aacagtctgt 4620
tgtgcagtcc accccggcag gaatactccc attctgcctc tgttggtaac cttttcccag 4680
cccaggtgca gtatgccact gcatcattcc aggacacatg cagcacaggg tggtcaggcc 4740
tgtggaggat agttgagtct ggtccctctg ggtgtctcca attggctcct ttaacaggca 4800
gccaccaggg ggctgcagcc actgcctgtt ggatattggt cttcacctgc tcacttagca 4860
tgccttcaaa aacaaaactg tcaccaaatt tctcagcctc tgtaaggtat ccagtgctgt 4920
ttacaaattt ctcaaattct gtgtttgaca cttcataggc atccatatag aaggcatcaa 4980
ttgtgactct cctagctggt gcttcaccat cctgcttgat ctgagggtca tcagttccca 5040
tagtaaaaac tcctgcaggt ctagatacgt agataagtag catggcgggt taatcattaa 5100
ctacaaggaa cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac 5160
tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt gcccgggcgg cctcagtgag 5220
cgagcgagcg cgcagagagg gagtggccaa agatccccgg gtaccgagga cgaattctct 5280
agatatcgct caatactgac catttaaatc atacctgacc tccatagcag aaagtcaaaa 5340
gcctccgacc ggaggctttt gacttgatcg gcacgtaaga ggttccaact ttcaccataa 5400
tgaaataaga tcactaccgg gcgtattttt tgagttatcg agattttcag gagctaagga 5460
agctaaaatg agccatattc aacgggaaac gtcttgctcg aggccgcgat taaattccaa 5520
catggatgct gatttatatg ggtataaatg ggctcgcgat aatgtcgggc aatcaggtgc 5580
gacaatctat cgattgtatg ggaagcccga tgcgccagag ttgtttctga aacatggcaa 5640
aggtagcgtt gccaatgatg ttacagatga gatggtcagg ctaaactggc tgacggaatt 5700
tatgcctctt ccgaccatca agcattttat ccgtactcct gatgatgcat ggttactcac 5760
cactgcgatc ccagggaaaa cagcattcca ggtattagaa gaatatcctg attcaggtga 5820
aaatattgtt gatgcgctgg cagtgttcct gcgccggttg cattcgattc ctgtttgtaa 5880
ttgtcctttt aacggcgatc gcgtatttcg tctcgctcag gcgcaatcac gaatgaataa 5940
cggtttggtt ggtgcgagtg attttgatga cgagcgtaat ggctggcctg ttgaacaagt 6000
ctggaaagaa atgcataagc ttttgccatt ctcaccggat tcagtcgtca ctcatggtga 6060
tttctcactt gataacctta tttttgacga ggggaaatta ataggttgta ttgatgttgg 6120
acgagtcgga atcgcagacc gataccagga tcttgccatc ctatggaact gcctcggtga 6180
gttttctcct tcattacaga aacggctttt tcaaaaatat ggtattgata atcctgatat 6240
gaataaattg cagtttcact tgatgctcga tgagtttttc tgagggccca aatgtaatca 6300
cctggctcac cttcgggtgg gcctttctgc gttgctggcg tt 6342
<210> 53
<211> 6612
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 53
cgccagggtt ttcccagtca cgacgttgta aaacgacggc cagtgccaag cttgcatgcc 60
tgcatttggc cactccctct ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg 120
tcgcccgacg cccgggcttt gcccgggcgg cctcagtgag cgagcgagcg cgcagagagg 180
gagtggccaa ctccatcact aggggttcct ggaggggtgg agtcgtgacg tgaattacgt 240
catagggtta gggaggtcct gcagatcttc aatattggcc attagccata ttattcattg 300
gttatatagc ataaatcaat attggctatt ggccattgca tacgttgtat ctatatcata 360
atatgtacat ttatattggc tcatgtccaa tatgaccgcc atgttggcat tgattattga 420
ctagttatta atagtaatca attacggggt cattagttca tagcccatat atggagttcc 480
gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat 540
tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc 600
aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 660
caagtccgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt 720
acatgacctt acgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 780
ccatggtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac 840
ccccaatttt gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg 900
ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg gcggggcggg gcgaggcgga 960
gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa gtttcctttt atggcgaggc 1020
ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg ggcgggagtc gctgcgcgct 1080
gccttcgccc cgtgccccgc tccgccgccg cctcgcgccg cccgccccgg ctctgactga 1140
ccgcgttact cccacaggtg agcgggcggg acggcccttc tcctccgggc tgtaattagc 1200
gcttggttta atgacggctt gtttcttttc tgtggctgcg tgaaagcctt gaggggctcc 1260
gggagggccc tttgtgcggg gggagcggct cggggggtgc gtgcgtgtgt gtgtgcgtgg 1320
ggagcgccgc gtgcggctcc gcgctgcccg gcggctgtga gcgctgcggg cgcggcgcgg 1380
ggctttgtgc gctccgcagt gtgcgcgagg ggagcgcggc cgggggcggt gccccgcggt 1440
gcgggggggg ctgcgagggg aacaaaggct gcgtgcgggg tgtgtgcgtg ggggggtgag 1500
cagggggtgt gggcgcgtcg gtcgggctgc aaccccccct gcacccccct ccccgagttg 1560
ctgagcacgg cccggcttcg ggtgcggggc tccgtacggg gcgtggcgcg gggctcgccg 1620
tgccgggcgg ggggtggcgg caggtggggg tgccgggcgg ggcggggccg cctcgggccg 1680
gggagggctc gggggagggg cgcggcggcc cccggagcgc cggcggctgt cgaggcgcgg 1740
cgagccgcag ccattgcctt ttatggtaat cgtgcgagag ggcgcaggga cttcctttgt 1800
cccaaatctg tgcggagccg aaatctggga ggcgccgccg caccccctct agcgggcgcg 1860
gggcgaagcg gtgcggcgcc ggcaggaagg aaatgggcgg ggagggcctt cgtgcgtcgc 1920
cgcgccgccg tccccttctc cctctccagc ctcggggctg tccgcggggg gacggctgcc 1980
ttcggggggg acggggcagg gcggggttcg gcttctggcg tgtgaccggc ggctctagag 2040
cctctgctaa ccatgttcat gccttcttct ttttcctaca gctcctgggc aacgtgctgg 2100
ttattgtgct gtctcatcat tttggcaaag aattccgcca ccatgtctat gggggctcct 2160
cgctccctgc tgctggcact ggccgccggg ctggctgtcg caagaccacc taatatcgtc 2220
ctgatttttg cagacgatct gggatacggc gacctgggat gctatggcca cccaagctcc 2280
accacaccca acctggacca gctggcagca ggaggcctgc ggttcaccga cttctacgtg 2340
ccagtgagcc tgtgcacccc ctccagagcc gccctgctga caggcaggct gccagtgcgc 2400
atgggcatgt atcctggcgt gctggtgcca tctagcaggg gcggcctgcc actggaggag 2460
gtgaccgtgg cagaggtgct ggcagccaga ggctacctga caggaatggc cggcaagtgg 2520
cacctgggag tgggaccaga gggagccttc ctgccccctc accagggctt ccaccggttt 2580
ctgggcatcc cttattctca cgaccagggc ccatgccaga acctgacctg ttttccacca 2640
gcaacaccat gcgacggagg atgtgatcag ggcctggtgc caatcccact gctggcaaat 2700
ctgagcgtgg aggcacagcc tccatggctg cctggcctgg aggcaagata catggccttc 2760
gcccacgacc tgatggcaga tgcacagcgg caggatagac ctttctttct gtactatgcc 2820
tcccaccaca cccactatcc acagttcagc ggccagtcct ttgccgagag gtccggaagg 2880
ggaccattcg gcgactctct gatggagctg gatgccgccg tgggcaccct gatgacagca 2940
atcggcgacc tgggcctgct ggaggagaca ctggtcatct tcaccgccga taacggccct 3000
gagacaatgc ggatgtctag aggcggatgc agcggcctgc tgagatgtgg caagggaacc 3060
acatacgagg gaggcgtgcg cgagcctgcc ctggcatttt ggccaggaca catcgcacct 3120
ggagtgaccc acgagctggc ctcctctctg gacctgctgc caacactggc cgccctggca 3180
ggagcacctc tgccaaatgt gaccctggac ggcttcgatc tgagcccact gctgctggga 3240
accggcaagt cccctaggca gtctctgttc ttttacccct cctatcctga tgaggtgcgg 3300
ggcgtgtttg ccgtgagaac cggcaagtac aaggcccact tctttacaca gggctctgcc 3360
cacagcgaca ccacagcaga tccagcatgc cacgccagct cctctctgac cgcacacgag 3420
ccacctctgc tgtacgacct gtccaaggat cccggcgaga actataatct gctgggagga 3480
gtggcaggag caacccctga ggtgctgcag gccctgaagc agctgcagct gctgaaggca 3540
cagctggacg cagcagtgac attcggccca agccaggtgg ccagaggcga ggatcccgcc 3600
ctgcagatct gttgccaccc cggctgcacc ccaagacctg cctgttgcca ttgccccgac 3660
ccacacgcct aagattctag agtcgagccg cggactagta acttgtttat tgcagcttat 3720
aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg 3780
cattctagtt gtggtttgtc caaactcatc aatgtatctt aggtctagat acgtagataa 3840
gtagcatggc gggttaatca ttaactacaa ggaaccccta gtgatggagt tggccactcc 3900
ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg 3960
ctttgcccgg gcggcctcag tgagcgagcg agcgcgcaga gagggagtgg ccaaagatcc 4020
ccgggtaccg agctcgaatt cgtaatcatg tcatagctgt ttcctgtgtg aaattgttat 4080
ccgctcacaa ttccacacaa catacgagcc ggaagcataa agtgtaaagc ctggggtgcc 4140
taatgagtga gctaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga 4200
aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt 4260
attggcgaac ttttgctgag ttgaaggatc agatcacgca tcttcccgac aacgcagacc 4320
gttccgtggc aaagcaaaag ttcaaaatca gtaaccgtca gtgccgataa gttcaaagtt 4380
aaacctggtg ttgataccaa cattgaaacg ctgatcgaaa acgcgctgaa aaacgctgct 4440
gaatgtgcga gcttcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct 4500
gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga 4560
taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc 4620
cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg 4680
ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg 4740
aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt 4800
tctcccttcg ggaagcgtgg cgctttctca atgctcacgc tgtaggtatc tcagttcggt 4860
gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg 4920
cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact 4980
ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt 5040
cttgaagtgg tggcctaact acggctacac tagaaggaca gtatttggta tctgcgctct 5100
gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac 5160
cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc 5220
tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg atccgtcgag 5280
aggtctgcct cgtgaagaag gtgttgctga ctcataccag gcctgaatcg ccccatcatc 5340
cagccagaaa gtgagggagc cacggttgat gagagctttg ttgtaggtgg accagttggt 5400
gattttgaac ttttgctttg ccacggaacg gtctgcgttg tcgggaagat gcgtgatctg 5460
atccttcaac tcagcaaaag ttcgatttat tcaacaaagc cacgttgtgt ctcaaaatct 5520
ctgatgttac attgcacaag ataaaaatat atcatcatga acaataaaac tgtctgctta 5580
cataaacagt aatacaaggg gtgttatgag ccatattcaa cgggaaacgt cttgctcgaa 5640
gccgcgatta aattccaaca tggatgctga tttatatggg tataaatggg ctcgcgataa 5700
tgtcgggcaa tcaggtgcga caatctatcg attgtatggg aagcccgatg cgccagagtt 5760
gtttctgaaa catggcaaag gtagcgttgc caatgatgtt acagatgaga tggtcagact 5820
aaactggctg acggaattta tgcctcttcc gaccatcaag cattttatcc gtactcctga 5880
tgatgcatgg ttactcacca ctgcgatccc cgggaaaaca gcattccagg tattagaaga 5940
atatcctgat tcaggtgaaa atattgttga tgcgctggca gtgttcctgc gccggttgca 6000
ttcgattcct gtttgtaatt gtccttttaa cagcgatcgc gtatttcgtc tcgctcaggc 6060
gcaatcacga atgaataacg gtttggttga tgcgagtgat tttgatgacg agcgtaatgg 6120
ctggcctgtt gaacaagtct ggaaagaaat gcataagctt ttgccattct caccggattc 6180
agtcgtcact catggtgatt tctcacttga taaccttatt tttgacgagg ggaaattaat 6240
aggttgtatt gatgttggac gagtcggaat cgcagaccga taccaggatc ttgccatcct 6300
atggaactgc ctcggtgagt tttctccttc attacagaaa cggctttttc aaaaatatgg 6360
tattgataat cctgatatga ataaattgca gtttcatttg atgctcgatg agtttttcta 6420
atcagaattg gttaattggt tgtaacactg gcagagcatt acgctgactt gacgggacgg 6480
cggctttgtt gaataaatcg cattcgccat tcaggctgcg caactgttgg gaagggcgat 6540
cggtgcgggc ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat 6600
taagttgggt aa 6612
<210> 54
<211> 918
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 54
ggcatcctaa aaaatattca gtggaaacgt aaaaacatta aagactgatt aaacatcgca 60
gcatgacaca gatttagcaa ctgagcataa ataatttgac tcggatactg ctccaaaatc 120
cgaagaggac caatttcttc caggaggaca actacctcgt cctctgcaga cccctctcct 180
cggcagctga aggagtgtgg ccaatctgcc tccacctccc cgcggacccc ctactctcag 240
gacctcctgc agcaccccaa actggaagtg gccgctgcag acccaaggac gaggggcacg 300
cgggagccgg cagccctagt ggagcggttg gagatgttga ggtgggaggg tcacccaggt 360
ggggtgaggc tggggtaggt agcggagtga acggcttccg aagctctggg ccgcccccag 420
gttggactaa gcaggcgctc tgtcttcgcc cccgcccagg gtgggcgtct cctgaggact 480
ccccgccaca cctgacccga gaccgcgcgc ccagcctaga acgcttcccc gacccagcgt 540
agggccgccg cgactggcgg gcgagggtcg gcgggaggcc tggcgaaccc gggggcggga 600
ccaggcgggc aaggcccggc tgccgcagcg ccgctctgcg cgaggcggct ccgccgcggc 660
ggagggatac ggcgcaccat atatatatcg cggggcgcag actcgcgctc cggcagtggt 720
gctgggagtg tcgtggacgc cgtgccgtta ctcgtagtca ggcggcggcg caggcggcgg 780
cggcggcata gcgcacagcg cgccttagca gcagcagcag cagcagcggc atcggaggta 840
cccccgccgt cgcagccccc gcgctggtgc agccaccctc gctccctctg ctcttcctcc 900
cttcgctcgc accaagag 918
<210> 55
<211> 953
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 55
aattcggtac cctagttatt aatagtaatc aattacgggg tcattagttc atagcccata 60
tatggagttc cgcgttacat aacttacggt aaatggcccg cctggctgac cgcccaacga 120
cccccgccca ttgacgtcaa taatgacgta tgttcccata gtaacgccaa tagggacttt 180
ccattgacgt caatgggtgg actatttacg gtaaactgcc cacttggcag tacatcaagt 240
gtatcatatg ccaagtacgc cccctattga cgtcaatgac ggtaaatggc ccgcctggca 300
ttatgcccag tacatgacct tatgggactt tcctacttgg cagtacatct acgtattagt 360
catcgctatt accatggtcg aggtgagccc cacgttctgc ttcactctcc ccatctcccc 420
cccctcccca cccccaattt tgtatttatt tattttttaa ttattttgtg cagcgatggg 480
ggcggggggg gggggggggc gcgcgccagg cggggcgggg cggggcgagg ggcggggcgg 540
ggcgaggcgg agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa agtttccttt 600
tatggcgagg cggcggcggc ggcggcccta taaaaagcga agcgcgcggc gggcgggagt 660
cgctgcgacg ctgccttcgc cccgtgcccc gctccgccgc cgcctcgcgc cgcccgcccc 720
ggctctgact gaccgcgtta ctcccacagg tgagcgggcg ggacggccct tctcctccgg 780
gctgtaatta gcgcttggtt taatgacggc ttgtttcttt tctgtggctg cgtgaaagcc 840
ttgaggggct ccgggagcta gagcctctgc taaccatgtt catgccttct tctttttcct 900
acagctcctg ggcaacgtgc tggttattgt gctgtctcat cattttggca aag 953
<210> 56
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 56
gtagataagt agcatggcgg gttaatcatt aactaca 37
<210> 57
<211> 180
<212> DNA
<213> 人工序列
<220>
<223> 3' ITR
<400> 57
gtagataagt agcatggcgg gttaatcatt aactacaagg aacccctagt gatggagttg 60
gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga 120
cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc 180
<210> 58
<211> 380
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 58
ggcattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60
catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120
acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180
ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240
aagtgtatca tatgccaagt ccgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300
ggcattatgc ccagtacatg accttacggg actttcctac ttggcagtac atctacgtat 360
tagtcatcgc tattaccatg 380
<210> 59
<211> 1246
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 59
tcgaggtgag ccccacgttc tgcttcactc tccccatctc ccccccctcc ccacccccaa 60
ttttgtattt atttattttt taattatttt gtgcagcgat gggggcgggg gggggggggg 120
ggcgcgcgcc aggcggggcg gggcggggcg aggggcgggg cggggcgagg cggagaggtg 180
cggcggcagc caatcagagc ggcgcgctcc gaaagtttcc ttttatggcg aggcggcggc 240
ggcggcggcc ctataaaaag cgaagcgcgc ggcgggcggg agtcgctgcg cgctgccttc 300
gccccgtgcc ccgctccgcc gccgcctcgc gccgcccgcc ccggctctga ctgaccgcgt 360
tactcccaca ggtgagcggg cgggacggcc cttctcctcc gggctgtaat tagcgcttgg 420
tttaatgacg gcttgtttct tttctgtggc tgcgtgaaag ccttgagggg ctccgggagg 480
gccctttgtg cggggggagc ggctcggggg gtgcgtgcgt gtgtgtgtgc gtggggagcg 540
ccgcgtgcgg ctccgcgctg cccggcggct gtgagcgctg cgggcgcggc gcggggcttt 600
gtgcgctccg cagtgtgcgc gaggggagcg cggccggggg cggtgccccg cggtgcgggg 660
ggggctgcga ggggaacaaa ggctgcgtgc ggggtgtgtg cgtggggggg tgagcagggg 720
gtgtgggcgc gtcggtcggg ctgcaacccc ccctgcaccc ccctccccga gttgctgagc 780
acggcccggc ttcgggtgcg gggctccgta cggggcgtgg cgcggggctc gccgtgccgg 840
gcggggggtg gcggcaggtg ggggtgccgg gcggggcggg gccgcctcgg gccggggagg 900
gctcggggga ggggcgcggc ggcccccgga gcgccggcgg ctgtcgaggc gcggcgagcc 960
gcagccattg ccttttatgg taatcgtgcg agagggcgca gggacttcct ttgtcccaaa 1020
tctgtgcgga gccgaaatct gggaggcgcc gccgcacccc ctctagcggg cgcggggcga 1080
agcggtgcgg cgccggcagg aaggaaatgg gcggggaggg ccttcgtgcg tcgccgcgcc 1140
gccgtcccct tctccctctc cagcctcggg gctgtccgcg gggggacggc tgccttcggg 1200
ggggacgggg cagggcgggg ttcggcttct ggcgtgtgac cggcgg 1246
<210> 60
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 60
cctctgctaa ccatgttcat gccttcttct ttttcctaca gctcctgggc aacgtgctgg 60
ttattgtgct gtctcatcat tttggcaaag aattc 95
<210> 61
<211> 1061
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 61
tagggaggtc ctgcacgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 60
cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac 120
tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca 180
agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg 240
gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt 300
agtcatcgct attaccatgg tcgaggtgag ccccacgttc tgcttcactc tccccatctc 360
ccccccctcc ccacccccaa ttttgtattt atttattttt taattatttt gtgcagcgat 420
gggggcgggg gggggggggg gcgcgcgcca ggcggggcgg ggcggggcga ggggcggggc 480
ggggcgaggc ggagaggtgc ggcggcagcc aatcagagcg gcgcgctccg aaagtttcct 540
tttatggcga ggcggcggcg gcggcggccc tataaaaagc gaagcgcgcg gcgggcggga 600
gtcgctgcgc gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc 660
cggctctgac tgaccgcgtt actaaaacag gtaagtccgg cctccgcgcc gggttttggc 720
gcctcccgcg ggcgcccccc tcctcacggc gagcgctgcc acgtcagacg aagggcgcag 780
cgagcgtcct gatccttccg cccggacgct caggacagcg gcccgctgct cataagactc 840
ggccttagaa ccccagtatc agcagaagga cattttagga cgggacttgg gtgactctag 900
ggcactggtt ttctttccag agagcggaac aggcgaggaa aagtagtccc ttctcggcga 960
ttctgcggag ggatctccgt ggggcggtga acgccgatga tgcctctact aaccatgttc 1020
atgttttctt tttttttcta caggtcctgg gtgacgaaca g 1061
<210> 62
<211> 1527
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 62
atgagcatgg gcgcccccag aagcctgtta cttgctttag ctgctggcct tgcagtggca 60
aggcccccta acatcgtgct gatctttgca gatgacttgg gatatgggga tcttggttgt 120
tatggccacc catcaagcac aactcccaat ctggatcagt tggctgcagg aggtctgagg 180
tttacagact tttatgttcc agtctccctg tgcactcctt ctcgggctgc cctgcttact 240
gggaggctcc ctgtgagaat gggtatgtac cctggagtgt tggtcccatc cagcagggga 300
gggctgcccc tggaagaggt gacagtggca gaggtgctgg cagcacgagg ctatctgact 360
ggcatggcag gcaagtggca cctgggtgta gggccagagg gtgctttcct gcctccccat 420
cagggctttc ataggtttct gggaatccca tactctcatg accaaggacc ctgccagaac 480
ctcacctgtt tcccccctgc aacaccatgt gatgggggct gtgatcaagg tctggttcct 540
ataccactgc ttgctaatct ttcagtggaa gctcaaccac cctggctgcc tggcttggag 600
gctagataca tggccttcgc acatgatctg atggcagatg cccagagaca agataggcct 660
ttcttcctct actatgcatc tcaccacacc cactatcctc agttctcagg ccaatcattt 720
gctgagcgta gtggcagggg cccatttggg gacagtttga tggaactgga tgccgcagtt 780
ggtaccctca tgacagcaat aggggactta ggtttgctgg aggaaacatt ggtaattttc 840
acagctgata atggccctga gacaatgaga atgtctaggg gaggctgctc tggtcttctg 900
aggtgtggta aagggactac atatgaggga ggagtgaggg aaccagctct tgccttttgg 960
ccaggtcaca tagcccctgg agttacacat gaactagctt cttccctgga cttgcttcct 1020
acactggcag ccctggcagg tgcccctctc cctaatgtaa ctttagatgg atttgacctc 1080
tctccactac ttttagggac agggaaaagt ccaaggcagt ccttattctt ctatccttcc 1140
tacccagatg aggtgagggg tgtttttgcc gtgaggactg ggaaatacaa agctcatttt 1200
tttacccagg gatcagctca ttcagacacc acagctgatc ctgcctgtca tgccagcagt 1260
agcttgacag cacatgagcc tcccttactg tatgacctga gcaaggaccc aggggagaac 1320
tataacctgc ttgggggggt tgctggggcc accccagaag tgcttcaggc actaaagcag 1380
ctgcaactgc ttaaagcaca gttggatgct gcagtgacct ttggcccttc ccaggtggcc 1440
agaggcgagg atcccgccct gcagatctgc tgccacccag gctgcacacc cagacctgcc 1500
tgctgtcact gccccgaccc acacgcc 1527
<210> 63
<211> 57
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 63
gctactaact tcagcctgct gaagcaggct ggagacgtgg aggagaaccc tggacct 57
<210> 64
<211> 1122
<212> DNA
<213> 智人
<400> 64
atggctgccc cagccctggg gctggtgtgt ggcagatgcc ctgagctggg cctggtgctg 60
cttctcctgc tgctgagcct cctgtgtggt gctgctggct ctcaggaagc agggacagga 120
gcaggagcag gttctctggc tggctcatgc ggttgtggga ccccccagag gccaggggct 180
catgggtcct ctgcagctgc ccacaggtac tcaagggaag caaatgcccc tggccccgta 240
cctggggaaa ggcaacttgc tcactccaag atggttccta tccctgcagg agtttttact 300
atgggaactg atgaccctca gatcaagcag gatggtgaag caccagctag gagagtcaca 360
attgatgcct tctatatgga tgcctatgaa gtgtcaaaca cagaatttga gaaatttgta 420
aacagcactg gataccttac agaggctgag aaatttggtg acagttttgt ttttgaaggc 480
atgctaagtg agcaggtgaa gaccaatatc caacaggcag tggctgcagc cccctggtgg 540
ctgcctgtta aaggagccaa ttggagacac ccagagggac cagactcaac tatcctccac 600
aggcctgacc accctgtgct gcatgtgtcc tggaatgatg cagtggcata ctgcacctgg 660
gctgggaaaa ggttaccaac agaggcagaa tgggagtatt cctgccgggg tggactgcac 720
aacagactgt tcccctgggg caataagctg caacctaaag gacagcatta tgccaatatt 780
tggcagggag agttcccagt cacaaacact ggtgaggatg gcttccaggg aactgcccct 840
gtggatgctt tcccacccaa tggctatggg ttgtacaata tagttgggaa tgcctgggag 900
tggacttctg actggtggac ggtccatcac agtgtggaag agacactgaa cccaaagggg 960
cccccctcag gcaaggacag agtcaagaaa ggtggctctt atatgtgtca cagaagctat 1020
tgctacagat ataggtgtgc tgcaagaagt cagaacaccc ctgacagctc agctagcaat 1080
ctgggattta gatgtgcagc agatagactc cccaccatgg ac 1122
<210> 65
<211> 3739
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 65
ggcatcctaa aaaatattca gtggaaacgt aaaaacatta aagactgatt aaacatcgca 60
gcatgacaca gatttagcaa ctgagcataa ataatttgac tcggatactg ctccaaaatc 120
cgaagaggac caatttcttc caggaggaca actacctcgt cctctgcaga cccctctcct 180
cggcagctga aggagtgtgg ccaatctgcc tccacctccc cgcggacccc ctactctcag 240
gacctcctgc agcaccccaa actggaagtg gccgctgcag acccaaggac gaggggcacg 300
cgggagccgg cagccctagt ggagcggttg gagatgttga ggtgggaggg tcacccaggt 360
ggggtgaggc tggggtaggt agcggagtga acggcttccg aagctctggg ccgcccccag 420
gttggactaa gcaggcgctc tgtcttcgcc cccgcccagg gtgggcgtct cctgaggact 480
ccccgccaca cctgacccga gaccgcgcgc ccagcctaga acgcttcccc gacccagcgt 540
agggccgccg cgactggcgg gcgagggtcg gcgggaggcc tggcgaaccc gggggcggga 600
ccaggcgggc aaggcccggc tgccgcagcg ccgctctgcg cgaggcggct ccgccgcggc 660
ggagggatac ggcgcaccat atatatatcg cggggcgcag actcgcgctc cggcagtggt 720
gctgggagtg tcgtggacgc cgtgccgtta ctcgtagtca ggcggcggcg caggcggcgg 780
cggcggcata gcgcacagcg cgccttagca gcagcagcag cagcagcggc atcggaggta 840
cccccgccgt cgcagccccc gcgctggtgc agccaccctc gctccctctg ctcttcctcc 900
cttcgctcgc accaagaggt aagggtttaa gggatggttg gttggtgggg tattaatgtt 960
taattacctg gagcacctgc ctgaaatcac tttttttcag gttgggccac ccgccgccac 1020
catgagcatg ggcgccccca gaagcctgtt acttgcttta gctgctggcc ttgcagtggc 1080
aaggccccct aacatcgtgc tgatctttgc agatgacttg ggatatgggg atcttggttg 1140
ttatggccac ccatcaagca caactcccaa tctggatcag ttggctgcag gaggtctgag 1200
gtttacagac ttttatgttc cagtctccct gtgcactcct tctcgggctg ccctgcttac 1260
tgggaggctc cctgtgagaa tgggtatgta ccctggagtg ttggtcccat ccagcagggg 1320
agggctgccc ctggaagagg tgacagtggc agaggtgctg gcagcacgag gctatctgac 1380
tggcatggca ggcaagtggc acctgggtgt agggccagag ggtgctttcc tgcctcccca 1440
tcagggcttt cataggtttc tgggaatccc atactctcat gaccaaggac cctgccagaa 1500
cctcacctgt ttcccccctg caacaccatg tgatgggggc tgtgatcaag gtctggttcc 1560
tataccactg cttgctaatc tttcagtgga agctcaacca ccctggctgc ctggcttgga 1620
ggctagatac atggccttcg cacatgatct gatggcagat gcccagagac aagataggcc 1680
tttcttcctc tactatgcat ctcaccacac ccactatcct cagttctcag gccaatcatt 1740
tgctgagcgt agtggcaggg gcccatttgg ggacagtttg atggaactgg atgccgcagt 1800
tggtaccctc atgacagcaa taggggactt aggtttgctg gaggaaacat tggtaatttt 1860
cacagctgat aatggccctg agacaatgag aatgtctagg ggaggctgct ctggtcttct 1920
gaggtgtggt aaagggacta catatgaggg aggagtgagg gaaccagctc ttgccttttg 1980
gccaggtcac atagcccctg gagttacaca tgaactagct tcttccctgg acttgcttcc 2040
tacactggca gccctggcag gtgcccctct ccctaatgta actttagatg gatttgacct 2100
ctctccacta cttttaggga cagggaaaag tccaaggcag tccttattct tctatccttc 2160
ctacccagat gaggtgaggg gtgtttttgc cgtgaggact gggaaataca aagctcattt 2220
ttttacccag ggatcagctc attcagacac cacagctgat cctgcctgtc atgccagcag 2280
tagcttgaca gcacatgagc ctcccttact gtatgacctg agcaaggacc caggggagaa 2340
ctataacctg cttggggggg ttgctggggc caccccagaa gtgcttcagg cactaaagca 2400
gctgcaactg cttaaagcac agttggatgc tgcagtgacc tttggccctt cccaggtggc 2460
cagaggcgag gatcccgccc tgcagatctg ctgccaccca ggctgcacac ccagacctgc 2520
ctgctgtcac tgccccgacc cacacgccgg cagcggagct actaacttca gcctgctgaa 2580
gcaggctgga gacgtggagg agaaccctgg acctatggct gccccagccc tggggctggt 2640
gtgtggcaga tgccctgagc tgggcctggt gctgcttctc ctgctgctga gcctcctgtg 2700
tggtgctgct ggctctcagg aagcagggac aggagcagga gcaggttctc tggctggctc 2760
atgcggttgt gggacccccc agaggccagg ggctcatggg tcctctgcag ctgcccacag 2820
gtactcaagg gaagcaaatg cccctggccc cgtacctggg gaaaggcaac ttgctcactc 2880
caagatggtt cctatccctg caggagtttt tactatggga actgatgacc ctcagatcaa 2940
gcaggatggt gaagcaccag ctaggagagt cacaattgat gccttctata tggatgccta 3000
tgaagtgtca aacacagaat ttgagaaatt tgtaaacagc actggatacc ttacagaggc 3060
tgagaaattt ggtgacagtt ttgtttttga aggcatgcta agtgagcagg tgaagaccaa 3120
tatccaacag gcagtggctg cagccccctg gtggctgcct gttaaaggag ccaattggag 3180
acacccagag ggaccagact caactatcct ccacaggcct gaccaccctg tgctgcatgt 3240
gtcctggaat gatgcagtgg catactgcac ctgggctggg aaaaggttac caacagaggc 3300
agaatgggag tattcctgcc ggggtggact gcacaacaga ctgttcccct ggggcaataa 3360
gctgcaacct aaaggacagc attatgccaa tatttggcag ggagagttcc cagtcacaaa 3420
cactggtgag gatggcttcc agggaactgc ccctgtggat gctttcccac ccaatggcta 3480
tgggttgtac aatatagttg ggaatgcctg ggagtggact tctgactggt ggacggtcca 3540
tcacagtgtg gaagagacac tgaacccaaa ggggcccccc tcaggcaagg acagagtcaa 3600
gaaaggtggc tcttatatgt gtcacagaag ctattgctac agatataggt gtgctgcaag 3660
aagtcagaac acccctgaca gctcagctag caatctggga tttagatgtg cagcagatag 3720
actccccacc atggactga 3739
<210> 66
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 66
gagggcagag gaagtcttct aacatgcggt gacgtggagg agaatcccgg ccct 54
<210> 67
<211> 3686
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 67
aattcggtac cctagttatt aatagtaatc aattacgggg tcattagttc atagcccata 60
tatggagttc cgcgttacat aacttacggt aaatggcccg cctggctgac cgcccaacga 120
cccccgccca ttgacgtcaa taatgacgta tgttcccata gtaacgccaa tagggacttt 180
ccattgacgt caatgggtgg actatttacg gtaaactgcc cacttggcag tacatcaagt 240
gtatcatatg ccaagtacgc cccctattga cgtcaatgac ggtaaatggc ccgcctggca 300
ttatgcccag tacatgacct tatgggactt tcctacttgg cagtacatct acgtattagt 360
catcgctatt accatggtcg aggtgagccc cacgttctgc ttcactctcc ccatctcccc 420
cccctcccca cccccaattt tgtatttatt tattttttaa ttattttgtg cagcgatggg 480
ggcggggggg gggggggggc gcgcgccagg cggggcgggg cggggcgagg ggcggggcgg 540
ggcgaggcgg agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa agtttccttt 600
tatggcgagg cggcggcggc ggcggcccta taaaaagcga agcgcgcggc gggcgggagt 660
cgctgcgacg ctgccttcgc cccgtgcccc gctccgccgc cgcctcgcgc cgcccgcccc 720
ggctctgact gaccgcgtta ctcccacagg tgagcgggcg ggacggccct tctcctccgg 780
gctgtaatta gcgcttggtt taatgacggc ttgtttcttt tctgtggctg cgtgaaagcc 840
ttgaggggct ccgggagcta gagcctctgc taaccatgtt catgccttct tctttttcct 900
acagctcctg ggcaacgtgc tggttattgt gctgtctcat cattttggca aaggctagcg 960
ccgccaccat gagcatgggc gcccccagaa gcctgttact tgctttagct gctggccttg 1020
cagtggcaag gccccctaac atcgtgctga tctttgcaga tgacttggga tatggggatc 1080
ttggttgtta tggccaccca tcaagcacaa ctcccaatct ggatcagttg gctgcaggag 1140
gtctgaggtt tacagacttt tatgttccag tctccctgtg cactccttct cgggctgccc 1200
tgcttactgg gaggctccct gtgagaatgg gtatgtaccc tggagtgttg gtcccatcca 1260
gcaggggagg gctgcccctg gaagaggtga cagtggcaga ggtgctggca gcacgaggct 1320
atctgactgg catggcaggc aagtggcacc tgggtgtagg gccagagggt gctttcctgc 1380
ctccccatca gggctttcat aggtttctgg gaatcccata ctctcatgac caaggaccct 1440
gccagaacct cacctgtttc ccccctgcaa caccatgtga tgggggctgt gatcaaggtc 1500
tggttcctat accactgctt gctaatcttt cagtggaagc tcaaccaccc tggctgcctg 1560
gcttggaggc tagatacatg gccttcgcac atgatctgat ggcagatgcc cagagacaag 1620
ataggccttt cttcctctac tatgcatctc accacaccca ctatcctcag ttctcaggcc 1680
aatcatttgc tgagcgtagt ggcaggggcc catttgggga cagtttgatg gaactggatg 1740
ccgcagttgg taccctcatg acagcaatag gggacttagg tttgctggag gaaacattgg 1800
taattttcac agctgataat ggccctgaga caatgagaat gtctagggga ggctgctctg 1860
gtcttctgag gtgtggtaaa gggactacat atgagggagg agtgagggaa ccagctcttg 1920
ccttttggcc aggtcacata gcccctggag ttacacatga actagcttct tccctggact 1980
tgcttcctac actggcagcc ctggcaggtg cccctctccc taatgtaact ttagatggat 2040
ttgacctctc tccactactt ttagggacag ggaaaagtcc aaggcagtcc ttattcttct 2100
atccttccta cccagatgag gtgaggggtg tttttgccgt gaggactggg aaatacaaag 2160
ctcatttttt tacccaggga tcagctcatt cagacaccac agctgatcct gcctgtcatg 2220
ccagcagtag cttgacagca catgagcctc ccttactgta tgacctgagc aaggacccag 2280
gggagaacta taacctgctt gggggggttg ctggggccac cccagaagtg cttcaggcac 2340
taaagcagct gcaactgctt aaagcacagt tggatgctgc agtgaccttt ggcccttccc 2400
aggtggccag aggcgaggat cccgccctgc agatctgctg ccacccaggc tgcacaccca 2460
gacctgcctg ctgtcactgc cccgacccac acgccggcag cggagctact aacttcagcc 2520
tgctgaagca ggctggagac gtggaggaga accctggacc tatggctgcc ccagccctgg 2580
ggctggtgtg tggcagatgc cctgagctgg gcctggtgct gcttctcctg ctgctgagcc 2640
tcctgtgtgg tgctgctggc tctcaggaag cagggacagg agcaggagca ggttctctgg 2700
ctggctcatg cggttgtggg accccccaga ggccaggggc tcatgggtcc tctgcagctg 2760
cccacaggta ctcaagggaa gcaaatgccc ctggccccgt acctggggaa aggcaacttg 2820
ctcactccaa gatggttcct atccctgcag gagtttttac tatgggaact gatgaccctc 2880
agatcaagca ggatggtgaa gcaccagcta ggagagtcac aattgatgcc ttctatatgg 2940
atgcctatga agtgtcaaac acagaatttg agaaatttgt aaacagcact ggatacctta 3000
cagaggctga gaaatttggt gacagttttg tttttgaagg catgctaagt gagcaggtga 3060
agaccaatat ccaacaggca gtggctgcag ccccctggtg gctgcctgtt aaaggagcca 3120
attggagaca cccagaggga ccagactcaa ctatcctcca caggcctgac caccctgtgc 3180
tgcatgtgtc ctggaatgat gcagtggcat actgcacctg ggctgggaaa aggttaccaa 3240
cagaggcaga atgggagtat tcctgccggg gtggactgca caacagactg ttcccctggg 3300
gcaataagct gcaacctaaa ggacagcatt atgccaatat ttggcaggga gagttcccag 3360
tcacaaacac tggtgaggat ggcttccagg gaactgcccc tgtggatgct ttcccaccca 3420
atggctatgg gttgtacaat atagttggga atgcctggga gtggacttct gactggtgga 3480
cggtccatca cagtgtggaa gagacactga acccaaaggg gcccccctca ggcaaggaca 3540
gagtcaagaa aggtggctct tatatgtgtc acagaagcta ttgctacaga tataggtgtg 3600
ctgcaagaag tcagaacacc cctgacagct cagctagcaa tctgggattt agatgtgcag 3660
cagatagact ccccaccatg gactga 3686
<210> 68
<211> 4346
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 68
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag gtcctgcata tgcggccgcg gcatcctaaa aaatattcag tggaaacgta 240
aaaacattaa agactgatta aacatcgcag catgacacag atttagcaac tgagcataaa 300
taatttgact cggatactgc tccaaaatcc gaagaggacc aatttcttcc aggaggacaa 360
ctacctcgtc ctctgcagac ccctctcctc ggcagctgaa ggagtgtggc caatctgcct 420
ccacctcccc gcggaccccc tactctcagg acctcctgca gcaccccaaa ctggaagtgg 480
ccgctgcaga cccaaggacg aggggcacgc gggagccggc agccctagtg gagcggttgg 540
agatgttgag gtgggagggt cacccaggtg gggtgaggct ggggtaggta gcggagtgaa 600
cggcttccga agctctgggc cgcccccagg ttggactaag caggcgctct gtcttcgccc 660
ccgcccaggg tgggcgtctc ctgaggactc cccgccacac ctgacccgag accgcgcgcc 720
cagcctagaa cgcttccccg acccagcgta gggccgccgc gactggcggg cgagggtcgg 780
cgggaggcct ggcgaacccg ggggcgggac caggcgggca aggcccggct gccgcagcgc 840
cgctctgcgc gaggcggctc cgccgcggcg gagggatacg gcgcaccata tatatatcgc 900
ggggcgcaga ctcgcgctcc ggcagtggtg ctgggagtgt cgtggacgcc gtgccgttac 960
tcgtagtcag gcggcggcgc aggcggcggc ggcggcatag cgcacagcgc gccttagcag 1020
cagcagcagc agcagcggca tcggaggtac ccccgccgtc gcagcccccg cgctggtgca 1080
gccaccctcg ctccctctgc tcttcctccc ttcgctcgca ccaagaggta agggtttaag 1140
ggatggttgg ttggtggggt attaatgttt aattacctgg agcacctgcc tgaaatcact 1200
ttttttcagg ttgggccacc cgccgccacc atgagcatgg gcgcccccag aagcctgtta 1260
cttgctttag ctgctggcct tgcagtggca aggcccccta acatcgtgct gatctttgca 1320
gatgacttgg gatatgggga tcttggttgt tatggccacc catcaagcac aactcccaat 1380
ctggatcagt tggctgcagg aggtctgagg tttacagact tttatgttcc agtctccctg 1440
tgcactcctt ctcgggctgc cctgcttact gggaggctcc ctgtgagaat gggtatgtac 1500
cctggagtgt tggtcccatc cagcagggga gggctgcccc tggaagaggt gacagtggca 1560
gaggtgctgg cagcacgagg ctatctgact ggcatggcag gcaagtggca cctgggtgta 1620
gggccagagg gtgctttcct gcctccccat cagggctttc ataggtttct gggaatccca 1680
tactctcatg accaaggacc ctgccagaac ctcacctgtt tcccccctgc aacaccatgt 1740
gatgggggct gtgatcaagg tctggttcct ataccactgc ttgctaatct ttcagtggaa 1800
gctcaaccac cctggctgcc tggcttggag gctagataca tggccttcgc acatgatctg 1860
atggcagatg cccagagaca agataggcct ttcttcctct actatgcatc tcaccacacc 1920
cactatcctc agttctcagg ccaatcattt gctgagcgta gtggcagggg cccatttggg 1980
gacagtttga tggaactgga tgccgcagtt ggtaccctca tgacagcaat aggggactta 2040
ggtttgctgg aggaaacatt ggtaattttc acagctgata atggccctga gacaatgaga 2100
atgtctaggg gaggctgctc tggtcttctg aggtgtggta aagggactac atatgaggga 2160
ggagtgaggg aaccagctct tgccttttgg ccaggtcaca tagcccctgg agttacacat 2220
gaactagctt cttccctgga cttgcttcct acactggcag ccctggcagg tgcccctctc 2280
cctaatgtaa ctttagatgg atttgacctc tctccactac ttttagggac agggaaaagt 2340
ccaaggcagt ccttattctt ctatccttcc tacccagatg aggtgagggg tgtttttgcc 2400
gtgaggactg ggaaatacaa agctcatttt tttacccagg gatcagctca ttcagacacc 2460
acagctgatc ctgcctgtca tgccagcagt agcttgacag cacatgagcc tcccttactg 2520
tatgacctga gcaaggaccc aggggagaac tataacctgc ttgggggggt tgctggggcc 2580
accccagaag tgcttcaggc actaaagcag ctgcaactgc ttaaagcaca gttggatgct 2640
gcagtgacct ttggcccttc ccaggtggcc agaggcgagg atcccgccct gcagatctgc 2700
tgccacccag gctgcacacc cagacctgcc tgctgtcact gccccgaccc acacgccggc 2760
agcggagcta ctaacttcag cctgctgaag caggctggag acgtggagga gaaccctgga 2820
cctatggctg ccccagccct ggggctggtg tgtggcagat gccctgagct gggcctggtg 2880
ctgcttctcc tgctgctgag cctcctgtgt ggtgctgctg gctctcagga agcagggaca 2940
ggagcaggag caggttctct ggctggctca tgcggttgtg ggacccccca gaggccaggg 3000
gctcatgggt cctctgcagc tgcccacagg tactcaaggg aagcaaatgc ccctggcccc 3060
gtacctgggg aaaggcaact tgctcactcc aagatggttc ctatccctgc aggagttttt 3120
actatgggaa ctgatgaccc tcagatcaag caggatggtg aagcaccagc taggagagtc 3180
acaattgatg ccttctatat ggatgcctat gaagtgtcaa acacagaatt tgagaaattt 3240
gtaaacagca ctggatacct tacagaggct gagaaatttg gtgacagttt tgtttttgaa 3300
ggcatgctaa gtgagcaggt gaagaccaat atccaacagg cagtggctgc agccccctgg 3360
tggctgcctg ttaaaggagc caattggaga cacccagagg gaccagactc aactatcctc 3420
cacaggcctg accaccctgt gctgcatgtg tcctggaatg atgcagtggc atactgcacc 3480
tgggctggga aaaggttacc aacagaggca gaatgggagt attcctgccg gggtggactg 3540
cacaacagac tgttcccctg gggcaataag ctgcaaccta aaggacagca ttatgccaat 3600
atttggcagg gagagttccc agtcacaaac actggtgagg atggcttcca gggaactgcc 3660
cctgtggatg ctttcccacc caatggctat gggttgtaca atatagttgg gaatgcctgg 3720
gagtggactt ctgactggtg gacggtccat cacagtgtgg aagagacact gaacccaaag 3780
gggcccccct caggcaagga cagagtcaag aaaggtggct cttatatgtg tcacagaagc 3840
tattgctaca gatataggtg tgctgcaaga agtcagaaca cccctgacag ctcagctagc 3900
aatctgggat ttagatgtgc agcagataga ctccccacca tggactgaga tccagacatg 3960
ataagataca ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt 4020
atttgtgaaa tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa 4080
gttaacaaca acaattgcat tcattttatg tttcaggttc agggggaggt gtgggaggtt 4140
ttttaaacct gcaggtctag atacgtagat aagtagcatg gcgggttaat cattaactac 4200
aaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag 4260
gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc agtgagcgag 4320
cgagcgcgca gagagggagt ggccaa 4346
<210> 69
<211> 4492
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 69
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag gtcctgcata tgcggccgca cctaggtcat tctggcctcc ccctccctca 240
aggccagtca ttctggcctg tccttccccg aaggccagtc attctggcct ccccctcccc 300
caaggccagt cattctggcc ttcccctccc ttaaggccag agtactatcg attcacacaa 360
aaaaccaaca cactattgca atgaaaataa atttccttta ttaagcttaa ttcggtaccc 420
tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 480
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 540
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 600
atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 660
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 720
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 780
catggtcgag gtgagcccca cgttctgctt cactctcccc atctcccccc cctccccacc 840
cccaattttg tatttattta ttttttaatt attttgtgca gcgatggggg cggggggggg 900
gggggggcgc gcgccaggcg gggcggggcg gggcgagggg cggggcgggg cgaggcggag 960
aggtgcggcg gcagccaatc agagcggcgc gctccgaaag tttcctttta tggcgaggcg 1020
gcggcggcgg cggccctata aaaagcgaag cgcgcggcgg gcgggagtcg ctgcgacgct 1080
gccttcgccc cgtgccccgc tccgccgccg cctcgcgccg cccgccccgg ctctgactga 1140
ccgcgttact cccacaggtg agcgggcggg acggcccttc tcctccgggc tgtaattagc 1200
gcttggttta atgacggctt gtttcttttc tgtggctgcg tgaaagcctt gaggggctcc 1260
gggagctaga gcctctgcta accatgttca tgccttcttc tttttcctac agctcctggg 1320
caacgtgctg gttattgtgc tgtctcatca ttttggcaaa ggctagcgcc gccaccatga 1380
gcatgggcgc ccccagaagc ctgttacttg ctttagctgc tggccttgca gtggcaaggc 1440
cccctaacat cgtgctgatc tttgcagatg acttgggata tggggatctt ggttgttatg 1500
gccacccatc aagcacaact cccaatctgg atcagttggc tgcaggaggt ctgaggttta 1560
cagactttta tgttccagtc tccctgtgca ctccttctcg ggctgccctg cttactggga 1620
ggctccctgt gagaatgggt atgtaccctg gagtgttggt cccatccagc aggggagggc 1680
tgcccctgga agaggtgaca gtggcagagg tgctggcagc acgaggctat ctgactggca 1740
tggcaggcaa gtggcacctg ggtgtagggc cagagggtgc tttcctgcct ccccatcagg 1800
gctttcatag gtttctggga atcccatact ctcatgacca aggaccctgc cagaacctca 1860
cctgtttccc ccctgcaaca ccatgtgatg ggggctgtga tcaaggtctg gttcctatac 1920
cactgcttgc taatctttca gtggaagctc aaccaccctg gctgcctggc ttggaggcta 1980
gatacatggc cttcgcacat gatctgatgg cagatgccca gagacaagat aggcctttct 2040
tcctctacta tgcatctcac cacacccact atcctcagtt ctcaggccaa tcatttgctg 2100
agcgtagtgg caggggccca tttggggaca gtttgatgga actggatgcc gcagttggta 2160
ccctcatgac agcaataggg gacttaggtt tgctggagga aacattggta attttcacag 2220
ctgataatgg ccctgagaca atgagaatgt ctaggggagg ctgctctggt cttctgaggt 2280
gtggtaaagg gactacatat gagggaggag tgagggaacc agctcttgcc ttttggccag 2340
gtcacatagc ccctggagtt acacatgaac tagcttcttc cctggacttg cttcctacac 2400
tggcagccct ggcaggtgcc cctctcccta atgtaacttt agatggattt gacctctctc 2460
cactactttt agggacaggg aaaagtccaa ggcagtcctt attcttctat ccttcctacc 2520
cagatgaggt gaggggtgtt tttgccgtga ggactgggaa atacaaagct cattttttta 2580
cccagggatc agctcattca gacaccacag ctgatcctgc ctgtcatgcc agcagtagct 2640
tgacagcaca tgagcctccc ttactgtatg acctgagcaa ggacccaggg gagaactata 2700
acctgcttgg gggggttgct ggggccaccc cagaagtgct tcaggcacta aagcagctgc 2760
aactgcttaa agcacagttg gatgctgcag tgacctttgg cccttcccag gtggccagag 2820
gcgaggatcc cgccctgcag atctgctgcc acccaggctg cacacccaga cctgcctgct 2880
gtcactgccc cgacccacac gccggcagcg gagctactaa cttcagcctg ctgaagcagg 2940
ctggagacgt ggaggagaac cctggaccta tggctgcccc agccctgggg ctggtgtgtg 3000
gcagatgccc tgagctgggc ctggtgctgc ttctcctgct gctgagcctc ctgtgtggtg 3060
ctgctggctc tcaggaagca gggacaggag caggagcagg ttctctggct ggctcatgcg 3120
gttgtgggac cccccagagg ccaggggctc atgggtcctc tgcagctgcc cacaggtact 3180
caagggaagc aaatgcccct ggccccgtac ctggggaaag gcaacttgct cactccaaga 3240
tggttcctat ccctgcagga gtttttacta tgggaactga tgaccctcag atcaagcagg 3300
atggtgaagc accagctagg agagtcacaa ttgatgcctt ctatatggat gcctatgaag 3360
tgtcaaacac agaatttgag aaatttgtaa acagcactgg ataccttaca gaggctgaga 3420
aatttggtga cagttttgtt tttgaaggca tgctaagtga gcaggtgaag accaatatcc 3480
aacaggcagt ggctgcagcc ccctggtggc tgcctgttaa aggagccaat tggagacacc 3540
cagagggacc agactcaact atcctccaca ggcctgacca ccctgtgctg catgtgtcct 3600
ggaatgatgc agtggcatac tgcacctggg ctgggaaaag gttaccaaca gaggcagaat 3660
gggagtattc ctgccggggt ggactgcaca acagactgtt cccctggggc aataagctgc 3720
aacctaaagg acagcattat gccaatattt ggcagggaga gttcccagtc acaaacactg 3780
gtgaggatgg cttccaggga actgcccctg tggatgcttt cccacccaat ggctatgggt 3840
tgtacaatat agttgggaat gcctgggagt ggacttctga ctggtggacg gtccatcaca 3900
gtgtggaaga gacactgaac ccaaaggggc ccccctcagg caaggacaga gtcaagaaag 3960
gtggctctta tatgtgtcac agaagctatt gctacagata taggtgtgct gcaagaagtc 4020
agaacacccc tgacagctca gctagcaatc tgggatttag atgtgcagca gatagactcc 4080
ccaccatgga ctgagatcca gacatgataa gatacattga tgagtttgga caaaccacaa 4140
ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg tgatgctatt gctttatttg 4200
taaccattat aagctgcaat aaacaagtta acaacaacaa ttgcattcat tttatgtttc 4260
aggttcaggg ggaggtgtgg gaggtttttt aaacctgcag gtctagatac gtagataagt 4320
agcatggcgg gttaatcatt aactacaagg aacccctagt gatggagttg gccactccct 4380
ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggct 4440
ttgcccgggc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aa 4492
<210> 70
<211> 7537
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 70
aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc tcactcatta ggcaccccag 60
gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa ttgtgagcgg ataacaattt 120
cacacaggaa acagctatga ccatgattac gccaagctta gatccccggg taccgagctc 180
gaattcactg gccgtcgttt tacaacgtcg tgactgggaa aaccctggcg ttacccaact 240
taatcgcctt gcagcacatc cccctttcgc cagctggcgt aatagcgaag aggcccgcac 300
cgatcgccct tcccaacagt tgcgcagcct gaatggcgaa tggcgcctga tgcggtattt 360
tctccttacg catctgtgcg gtatttcaca ccgcatatgg tgcactctca gtacaatctg 420
ctctgatgcc gcatagttaa gccagccccg acacccgcca acacccgctg acgcgccctg 480
acgggcttgt ctgctcccgg catccgctta cagacaagct gtgaccgtct ccgggagctg 540
catgtgtcag aggttttcac cgtcatcacc gaaacgcgcg agacgaaagg gcctcgtgat 600
acgcctattt ttataggtta atgtcatgat aataatggtt tcttagacgt caggtggcac 660
ttttcgggga aatgtggcat gcctgcattt ggccactccc tctctgcgcg ctcgctcgct 720
cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg cggcctcagt 780
gagcgagcga gcgcgcagag agggagtggc caactccatc actaggggtt cctggagggg 840
tggagtcgtg acgtgaatta cgtcataggg ttagggaggt cctgcatatg cggccgcggc 900
atcctaaaaa atattcagtg gaaacgtaaa aacattaaag actgattaaa catcgcagca 960
tgacacagat ttagcaactg agcataaata atttgactcg gatactgctc caaaatccga 1020
agaggaccaa tttcttccag gaggacaact acctcgtcct ctgcagaccc ctctcctcgg 1080
cagctgaagg agtgtggcca atctgcctcc acctccccgc ggacccccta ctctcaggac 1140
ctcctgcagc accccaaact ggaagtggcc gctgcagacc caaggacgag gggcacgcgg 1200
gagccggcag ccctagtgga gcggttggag atgttgaggt gggagggtca cccaggtggg 1260
gtgaggctgg ggtaggtagc ggagtgaacg gcttccgaag ctctgggccg cccccaggtt 1320
ggactaagca ggcgctctgt cttcgccccc gcccagggtg ggcgtctcct gaggactccc 1380
cgccacacct gacccgagac cgcgcgccca gcctagaacg cttccccgac ccagcgtagg 1440
gccgccgcga ctggcgggcg agggtcggcg ggaggcctgg cgaacccggg ggcgggacca 1500
ggcgggcaag gcccggctgc cgcagcgccg ctctgcgcga ggcggctccg ccgcggcgga 1560
gggatacggc gcaccatata tatatcgcgg ggcgcagact cgcgctccgg cagtggtgct 1620
gggagtgtcg tggacgccgt gccgttactc gtagtcaggc ggcggcgcag gcggcggcgg 1680
cggcatagcg cacagcgcgc cttagcagca gcagcagcag cagcggcatc ggaggtaccc 1740
ccgccgtcgc agcccccgcg ctggtgcagc caccctcgct ccctctgctc ttcctccctt 1800
cgctcgcacc aagaggtaag ggtttaaggg atggttggtt ggtggggtat taatgtttaa 1860
ttacctggag cacctgcctg aaatcacttt ttttcaggtt gggccacccg ccgccaccat 1920
gagcatgggc gcccccagaa gcctgttact tgctttagct gctggccttg cagtggcaag 1980
gccccctaac atcgtgctga tctttgcaga tgacttggga tatggggatc ttggttgtta 2040
tggccaccca tcaagcacaa ctcccaatct ggatcagttg gctgcaggag gtctgaggtt 2100
tacagacttt tatgttccag tctccctgtg cactccttct cgggctgccc tgcttactgg 2160
gaggctccct gtgagaatgg gtatgtaccc tggagtgttg gtcccatcca gcaggggagg 2220
gctgcccctg gaagaggtga cagtggcaga ggtgctggca gcacgaggct atctgactgg 2280
catggcaggc aagtggcacc tgggtgtagg gccagagggt gctttcctgc ctccccatca 2340
gggctttcat aggtttctgg gaatcccata ctctcatgac caaggaccct gccagaacct 2400
cacctgtttc ccccctgcaa caccatgtga tgggggctgt gatcaaggtc tggttcctat 2460
accactgctt gctaatcttt cagtggaagc tcaaccaccc tggctgcctg gcttggaggc 2520
tagatacatg gccttcgcac atgatctgat ggcagatgcc cagagacaag ataggccttt 2580
cttcctctac tatgcatctc accacaccca ctatcctcag ttctcaggcc aatcatttgc 2640
tgagcgtagt ggcaggggcc catttgggga cagtttgatg gaactggatg ccgcagttgg 2700
taccctcatg acagcaatag gggacttagg tttgctggag gaaacattgg taattttcac 2760
agctgataat ggccctgaga caatgagaat gtctagggga ggctgctctg gtcttctgag 2820
gtgtggtaaa gggactacat atgagggagg agtgagggaa ccagctcttg ccttttggcc 2880
aggtcacata gcccctggag ttacacatga actagcttct tccctggact tgcttcctac 2940
actggcagcc ctggcaggtg cccctctccc taatgtaact ttagatggat ttgacctctc 3000
tccactactt ttagggacag ggaaaagtcc aaggcagtcc ttattcttct atccttccta 3060
cccagatgag gtgaggggtg tttttgccgt gaggactggg aaatacaaag ctcatttttt 3120
tacccaggga tcagctcatt cagacaccac agctgatcct gcctgtcatg ccagcagtag 3180
cttgacagca catgagcctc ccttactgta tgacctgagc aaggacccag gggagaacta 3240
taacctgctt gggggggttg ctggggccac cccagaagtg cttcaggcac taaagcagct 3300
gcaactgctt aaagcacagt tggatgctgc agtgaccttt ggcccttccc aggtggccag 3360
aggcgaggat cccgccctgc agatctgctg ccacccaggc tgcacaccca gacctgcctg 3420
ctgtcactgc cccgacccac acgccggcag cggagctact aacttcagcc tgctgaagca 3480
ggctggagac gtggaggaga accctggacc tatggctgcc ccagccctgg ggctggtgtg 3540
tggcagatgc cctgagctgg gcctggtgct gcttctcctg ctgctgagcc tcctgtgtgg 3600
tgctgctggc tctcaggaag cagggacagg agcaggagca ggttctctgg ctggctcatg 3660
cggttgtggg accccccaga ggccaggggc tcatgggtcc tctgcagctg cccacaggta 3720
ctcaagggaa gcaaatgccc ctggccccgt acctggggaa aggcaacttg ctcactccaa 3780
gatggttcct atccctgcag gagtttttac tatgggaact gatgaccctc agatcaagca 3840
ggatggtgaa gcaccagcta ggagagtcac aattgatgcc ttctatatgg atgcctatga 3900
agtgtcaaac acagaatttg agaaatttgt aaacagcact ggatacctta cagaggctga 3960
gaaatttggt gacagttttg tttttgaagg catgctaagt gagcaggtga agaccaatat 4020
ccaacaggca gtggctgcag ccccctggtg gctgcctgtt aaaggagcca attggagaca 4080
cccagaggga ccagactcaa ctatcctcca caggcctgac caccctgtgc tgcatgtgtc 4140
ctggaatgat gcagtggcat actgcacctg ggctgggaaa aggttaccaa cagaggcaga 4200
atgggagtat tcctgccggg gtggactgca caacagactg ttcccctggg gcaataagct 4260
gcaacctaaa ggacagcatt atgccaatat ttggcaggga gagttcccag tcacaaacac 4320
tggtgaggat ggcttccagg gaactgcccc tgtggatgct ttcccaccca atggctatgg 4380
gttgtacaat atagttggga atgcctggga gtggacttct gactggtgga cggtccatca 4440
cagtgtggaa gagacactga acccaaaggg gcccccctca ggcaaggaca gagtcaagaa 4500
aggtggctct tatatgtgtc acagaagcta ttgctacaga tataggtgtg ctgcaagaag 4560
tcagaacacc cctgacagct cagctagcaa tctgggattt agatgtgcag cagatagact 4620
ccccaccatg gactgagatc cagacatgat aagatacatt gatgagtttg gacaaaccac 4680
aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt 4740
tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc attttatgtt 4800
tcaggttcag ggggaggtgt gggaggtttt ttaaacctgc aggtctagat acgtagataa 4860
gtagcatggc gggttaatca ttaactacaa ggaaccccta gtgatggagt tggccactcc 4920
ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg 4980
ctttgcccgg gcggcctcag tgagcgagcg agcgcgcaga gagggagtgg ccaaagatcc 5040
ccgggtaccg agctcgaatt cactggccgt cgttttacaa cgtcgtgact gggaaaaccc 5100
tggcgttacc caacttaatc gccttgcagc acatccccct ttcgccagct ggcgtaatag 5160
cgaagaggcc cgcaccgatc gcccttccca acagttgcgc agcctgaatg gcgaatggcg 5220
cctgatgcgg tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatggtgcac 5280
tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 5340
cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 5400
cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 5460
aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 5520
gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 5580
aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 5640
ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 5700
ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 5760
agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 5820
tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 5880
tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 5940
ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 6000
gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 6060
acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 6120
tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 6180
gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 6240
actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 6300
aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 6360
cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 6420
tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 6480
cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 6540
tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 6600
ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 6660
ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 6720
cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 6780
aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgttcttct 6840
agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 6900
tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 6960
ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 7020
cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 7080
atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 7140
ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 7200
tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 7260
gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 7320
gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 7380
cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 7440
gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 7500
tcattaatgc agctggcacg acaggtttcc cgactgg 7537
<210> 71
<211> 6335
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 71
gtcaggtggc acttttcggg gaaatgtggc atgcctgcat ttggccactc cctctctgcg 60
cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg 120
ggcggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca tcactagggg 180
ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag ggttagggag gtcctgcata 240
tgcggccgca cctaggtcat tctggcctcc ccctccctca aggccagtca ttctggcctg 300
tccttccccg aaggccagtc attctggcct ccccctcccc caaggccagt cattctggcc 360
ttcccctccc ttaaggccag agtactatcg attcacacaa aaaaccaaca cactattgca 420
atgaaaataa atttccttta ttaagcttaa ttcggtaccc tagttattaa tagtaatcaa 480
ttacggggtc attagttcat agcccatata tggagttccg cgttacataa cttacggtaa 540
atggcccgcc tggctgaccg cccaacgacc cccgcccatt gacgtcaata atgacgtatg 600
ttcccatagt aacgccaata gggactttcc attgacgtca atgggtggac tatttacggt 660
aaactgccca cttggcagta catcaagtgt atcatatgcc aagtacgccc cctattgacg 720
tcaatgacgg taaatggccc gcctggcatt atgcccagta catgacctta tgggactttc 780
ctacttggca gtacatctac gtattagtca tcgctattac catggtcgag gtgagcccca 840
cgttctgctt cactctcccc atctcccccc cctccccacc cccaattttg tatttattta 900
ttttttaatt attttgtgca gcgatggggg cggggggggg gggggggcgc gcgccaggcg 960
gggcggggcg gggcgagggg cggggcgggg cgaggcggag aggtgcggcg gcagccaatc 1020
agagcggcgc gctccgaaag tttcctttta tggcgaggcg gcggcggcgg cggccctata 1080
aaaagcgaag cgcgcggcgg gcgggagtcg ctgcgacgct gccttcgccc cgtgccccgc 1140
tccgccgccg cctcgcgccg cccgccccgg ctctgactga ccgcgttact cccacaggtg 1200
agcgggcggg acggcccttc tcctccgggc tgtaattagc gcttggttta atgacggctt 1260
gtttcttttc tgtggctgcg tgaaagcctt gaggggctcc gggagctaga gcctctgcta 1320
accatgttca tgccttcttc tttttcctac agctcctggg caacgtgctg gttattgtgc 1380
tgtctcatca ttttggcaaa ggctagcgcc gccaccatga gcatgggcgc ccccagaagc 1440
ctgttacttg ctttagctgc tggccttgca gtggcaaggc cccctaacat cgtgctgatc 1500
tttgcagatg acttgggata tggggatctt ggttgttatg gccacccatc aagcacaact 1560
cccaatctgg atcagttggc tgcaggaggt ctgaggttta cagactttta tgttccagtc 1620
tccctgtgca ctccttctcg ggctgccctg cttactggga ggctccctgt gagaatgggt 1680
atgtaccctg gagtgttggt cccatccagc aggggagggc tgcccctgga agaggtgaca 1740
gtggcagagg tgctggcagc acgaggctat ctgactggca tggcaggcaa gtggcacctg 1800
ggtgtagggc cagagggtgc tttcctgcct ccccatcagg gctttcatag gtttctggga 1860
atcccatact ctcatgacca aggaccctgc cagaacctca cctgtttccc ccctgcaaca 1920
ccatgtgatg ggggctgtga tcaaggtctg gttcctatac cactgcttgc taatctttca 1980
gtggaagctc aaccaccctg gctgcctggc ttggaggcta gatacatggc cttcgcacat 2040
gatctgatgg cagatgccca gagacaagat aggcctttct tcctctacta tgcatctcac 2100
cacacccact atcctcagtt ctcaggccaa tcatttgctg agcgtagtgg caggggccca 2160
tttggggaca gtttgatgga actggatgcc gcagttggta ccctcatgac agcaataggg 2220
gacttaggtt tgctggagga aacattggta attttcacag ctgataatgg ccctgagaca 2280
atgagaatgt ctaggggagg ctgctctggt cttctgaggt gtggtaaagg gactacatat 2340
gagggaggag tgagggaacc agctcttgcc ttttggccag gtcacatagc ccctggagtt 2400
acacatgaac tagcttcttc cctggacttg cttcctacac tggcagccct ggcaggtgcc 2460
cctctcccta atgtaacttt agatggattt gacctctctc cactactttt agggacaggg 2520
aaaagtccaa ggcagtcctt attcttctat ccttcctacc cagatgaggt gaggggtgtt 2580
tttgccgtga ggactgggaa atacaaagct cattttttta cccagggatc agctcattca 2640
gacaccacag ctgatcctgc ctgtcatgcc agcagtagct tgacagcaca tgagcctccc 2700
ttactgtatg acctgagcaa ggacccaggg gagaactata acctgcttgg gggggttgct 2760
ggggccaccc cagaagtgct tcaggcacta aagcagctgc aactgcttaa agcacagttg 2820
gatgctgcag tgacctttgg cccttcccag gtggccagag gcgaggatcc cgccctgcag 2880
atctgctgcc acccaggctg cacacccaga cctgcctgct gtcactgccc cgacccacac 2940
gccggcagcg gagctactaa cttcagcctg ctgaagcagg ctggagacgt ggaggagaac 3000
cctggaccta tggctgcccc agccctgggg ctggtgtgtg gcagatgccc tgagctgggc 3060
ctggtgctgc ttctcctgct gctgagcctc ctgtgtggtg ctgctggctc tcaggaagca 3120
gggacaggag caggagcagg ttctctggct ggctcatgcg gttgtgggac cccccagagg 3180
ccaggggctc atgggtcctc tgcagctgcc cacaggtact caagggaagc aaatgcccct 3240
ggccccgtac ctggggaaag gcaacttgct cactccaaga tggttcctat ccctgcagga 3300
gtttttacta tgggaactga tgaccctcag atcaagcagg atggtgaagc accagctagg 3360
agagtcacaa ttgatgcctt ctatatggat gcctatgaag tgtcaaacac agaatttgag 3420
aaatttgtaa acagcactgg ataccttaca gaggctgaga aatttggtga cagttttgtt 3480
tttgaaggca tgctaagtga gcaggtgaag accaatatcc aacaggcagt ggctgcagcc 3540
ccctggtggc tgcctgttaa aggagccaat tggagacacc cagagggacc agactcaact 3600
atcctccaca ggcctgacca ccctgtgctg catgtgtcct ggaatgatgc agtggcatac 3660
tgcacctggg ctgggaaaag gttaccaaca gaggcagaat gggagtattc ctgccggggt 3720
ggactgcaca acagactgtt cccctggggc aataagctgc aacctaaagg acagcattat 3780
gccaatattt ggcagggaga gttcccagtc acaaacactg gtgaggatgg cttccaggga 3840
actgcccctg tggatgcttt cccacccaat ggctatgggt tgtacaatat agttgggaat 3900
gcctgggagt ggacttctga ctggtggacg gtccatcaca gtgtggaaga gacactgaac 3960
ccaaaggggc ccccctcagg caaggacaga gtcaagaaag gtggctctta tatgtgtcac 4020
agaagctatt gctacagata taggtgtgct gcaagaagtc agaacacccc tgacagctca 4080
gctagcaatc tgggatttag atgtgcagca gatagactcc ccaccatgga ctgagatcca 4140
gacatgataa gatacattga tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa 4200
tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat aagctgcaat 4260
aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg 4320
gaggtttttt aaacctgcag gtctagatac gtagataagt agcatggcgg gttaatcatt 4380
aactacaagg aacccctagt gatggagttg gccactccct ctctgcgcgc tcgctcgctc 4440
actgaggccg ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg 4500
agcgagcgag cgcgcagaga gggagtggcc aaagatcccc gggtaccgag gacgaattct 4560
ctagatatcg ctcaatactg accatttaaa tcatacctga cctccatagc agaaagtcaa 4620
aagcctccga ccggaggctt ttgacttgat cggcacgtaa gaggttccaa ctttcaccat 4680
aatgaaataa gatcactacc gggcgtattt tttgagttat cgagattttc aggagctaag 4740
gaagctaaaa tgagccatat tcaacgggaa acgtcttgct cgaggccgcg attaaattcc 4800
aacatggatg ctgatttata tgggtataaa tgggctcgcg ataatgtcgg gcaatcaggt 4860
gcgacaatct atcgattgta tgggaagccc gatgcgccag agttgtttct gaaacatggc 4920
aaaggtagcg ttgccaatga tgttacagat gagatggtca ggctaaactg gctgacggaa 4980
tttatgcctc ttccgaccat caagcatttt atccgtactc ctgatgatgc atggttactc 5040
accactgcga tcccagggaa aacagcattc caggtattag aagaatatcc tgattcaggt 5100
gaaaatattg ttgatgcgct ggcagtgttc ctgcgccggt tgcattcgat tcctgtttgt 5160
aattgtcctt ttaacggcga tcgcgtattt cgtctcgctc aggcgcaatc acgaatgaat 5220
aacggtttgg ttggtgcgag tgattttgat gacgagcgta atggctggcc tgttgaacaa 5280
gtctggaaag aaatgcataa gcttttgcca ttctcaccgg attcagtcgt cactcatggt 5340
gatttctcac ttgataacct tatttttgac gaggggaaat taataggttg tattgatgtt 5400
ggacgagtcg gaatcgcaga ccgataccag gatcttgcca tcctatggaa ctgcctcggt 5460
gagttttctc cttcattaca gaaacggctt tttcaaaaat atggtattga taatcctgat 5520
atgaataaat tgcagtttca cttgatgctc gatgagtttt tctgagggcc caaatgtaat 5580
cacctggctc accttcgggt gggcctttct gcgttgctgg cgtttttcca taggctccgc 5640
ccccctgacg agcatcacaa aaatcgatgc tcaagtcaga ggtggcgaaa cccgacagga 5700
ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc 5760
ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat 5820
agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 5880
cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 5940
aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 6000
gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 6060
agaagaacag tatttggtat ctgcgctctg ctgaagccag ttacctcgga aaaagagttg 6120
gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 6180
agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgattttc taccgaagaa 6240
aggcccaccc gtgaaggtga gccagtgagt tgattgcagt ccagttacgc tggagtctga 6300
ggctcgtcct gaatgatatc aagcttgaat tcgtt 6335
<210> 72
<211> 1527
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 72
atgtctatgg gggctcctcg ctccctgctg ctggcactgg ccgccgggct ggctgtcgca 60
agaccaccta atatcgtcct gatttttgca gacgatctgg gatacggcga cctgggatgc 120
tatggccacc caagctccac cacacccaac ctggaccagc tggcagcagg aggcctgcgg 180
ttcaccgact tctacgtgcc agtgagcctg tgcaccccct ccagagccgc cctgctgaca 240
ggcaggctgc cagtgcgcat gggcatgtat cctggcgtgc tggtgccatc tagcaggggc 300
ggcctgccac tggaggaggt gaccgtggca gaggtgctgg cagccagagg ctacctgaca 360
ggaatggccg gcaagtggca cctgggagtg ggaccagagg gagccttcct gccccctcac 420
cagggcttcc accggtttct gggcatccct tattctcacg accagggccc atgccagaac 480
ctgacctgtt ttccaccagc aacaccatgc gacggaggat gtgatcaggg cctggtgcca 540
atcccactgc tggcaaatct gagcgtggag gcacagcctc catggctgcc tggcctggag 600
gcaagataca tggccttcgc ccacgacctg atggcagatg cacagcggca ggatagacct 660
ttctttctgt actatgcctc ccaccacacc cactatccac agttcagcgg ccagtccttt 720
gccgagaggt ccggaagggg accattcggc gactctctga tggagctgga tgccgccgtg 780
ggcaccctga tgacagcaat cggcgacctg ggcctgctgg aggagacact ggtcatcttc 840
accgccgata acggccctga gacaatgcgg atgtctagag gcggatgcag cggcctgctg 900
agatgtggca agggaaccac atacgaggga ggcgtgcgcg agcctgccct ggcattttgg 960
ccaggacaca tcgcacctgg agtgacccac gagctggcct cctctctgga cctgctgcca 1020
acactggccg ccctggcagg agcacctctg ccaaatgtga ccctggacgg cttcgatctg 1080
agcccactgc tgctgggaac cggcaagtcc cctaggcagt ctctgttctt ttacccctcc 1140
tatcctgatg aggtgcgggg cgtgtttgcc gtgagaaccg gcaagtacaa ggcccacttc 1200
tttacacagg gctctgccca cagcgacacc acagcagatc cagcatgcca cgccagctcc 1260
tctctgaccg cacacgagcc acctctgctg tacgacctgt ccaaggatcc cggcgagaac 1320
tataatctgc tgggaggagt ggcaggagca acccctgagg tgctgcaggc cctgaagcag 1380
ctgcagctgc tgaaggcaca gctggacgca gcagtgacat tcggcccaag ccaggtggcc 1440
agaggcgagg atcccgccct gcagatctgc tgccacccag gctgcacacc cagacctgcc 1500
tgctgtcact gccccgaccc acacgcc 1527
<210> 73
<211> 237
<212> DNA
<213> 智人
<400> 73
ggggacgttt gccaggactg cattcagatg gtgactgaca tccagactgc tgtacggacc 60
aactccacct ttgtccaggc cttggtggaa catgtcaagg aggagtgtga ccgcctgggc 120
cctggcatgg ccgacatatg caagaactat atcagccagt attctgaaat tgctatccag 180
atgatgatgc acatgcaacc caaggagatc tgtgcgctgg ttgggttctg tgatgag 237
<210> 74
<211> 1833
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 74
atgtctatgg gggctcctcg ctccctgctg ctggcactgg ccgccgggct ggctgtcgca 60
agaccaccta atatcgtcct gatttttgca gacgatctgg gatacggcga cctgggatgc 120
tatggccacc caagctccac cacacccaac ctggaccagc tggcagcagg aggcctgcgg 180
ttcaccgact tctacgtgcc agtgagcctg tgcaccccct ccagagccgc cctgctgaca 240
ggcaggctgc cagtgcgcat gggcatgtat cctggcgtgc tggtgccatc tagcaggggc 300
ggcctgccac tggaggaggt gaccgtggca gaggtgctgg cagccagagg ctacctgaca 360
ggaatggccg gcaagtggca cctgggagtg ggaccagagg gagccttcct gccccctcac 420
cagggcttcc accggtttct gggcatccct tattctcacg accagggccc atgccagaac 480
ctgacctgtt ttccaccagc aacaccatgc gacggaggat gtgatcaggg cctggtgcca 540
atcccactgc tggcaaatct gagcgtggag gcacagcctc catggctgcc tggcctggag 600
gcaagataca tggccttcgc ccacgacctg atggcagatg cacagcggca ggatagacct 660
ttctttctgt actatgcctc ccaccacacc cactatccac agttcagcgg ccagtccttt 720
gccgagaggt ccggaagggg accattcggc gactctctga tggagctgga tgccgccgtg 780
ggcaccctga tgacagcaat cggcgacctg ggcctgctgg aggagacact ggtcatcttc 840
accgccgata acggccctga gacaatgcgg atgtctagag gcggatgcag cggcctgctg 900
agatgtggca agggaaccac atacgaggga ggcgtgcgcg agcctgccct ggcattttgg 960
ccaggacaca tcgcacctgg agtgacccac gagctggcct cctctctgga cctgctgcca 1020
acactggccg ccctggcagg agcacctctg ccaaatgtga ccctggacgg cttcgatctg 1080
agcccactgc tgctgggaac cggcaagtcc cctaggcagt ctctgttctt ttacccctcc 1140
tatcctgatg aggtgcgggg cgtgtttgcc gtgagaaccg gcaagtacaa ggcccacttc 1200
tttacacagg gctctgccca cagcgacacc acagcagatc cagcatgcca cgccagctcc 1260
tctctgaccg cacacgagcc acctctgctg tacgacctgt ccaaggatcc cggcgagaac 1320
tataatctgc tgggaggagt ggcaggagca acccctgagg tgctgcaggc cctgaagcag 1380
ctgcagctgc tgaaggcaca gctggacgca gcagtgacat tcggcccaag ccaggtggcc 1440
agaggcgagg atcccgccct gcagatctgc tgccacccag gctgcacacc cagacctgcc 1500
tgctgtcact gccccgaccc acacgccggc agcggagcta ctaacttcag cctgctgaag 1560
caggctggag acgtggagga gaaccctgga cctggggacg tttgccagga ctgcattcag 1620
atggtgactg acatccagac tgctgtacgg accaactcca cctttgtcca ggccttggtg 1680
gaacatgtca aggaggagtg tgaccgcctg ggccctggca tggccgacat atgcaagaac 1740
tatatcagcc agtattctga aattgctatc cagatgatga tgcacatgca acccaaggag 1800
atctgtgcgc tggttgggtt ctgtgatgag tga 1833
<210> 75
<211> 3698
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 75
ggcattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60
catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120
acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180
ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240
aagtgtatca tatgccaagt ccgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300
ggcattatgc ccagtacatg accttacggg actttcctac ttggcagtac atctacgtat 360
tagtcatcgc tattaccatg gtcgaggtga gccccacgtt ctgcttcact ctccccatct 420
cccccccctc cccaccccca attttgtatt tatttatttt ttaattattt tgtgcagcga 480
tgggggcggg gggggggggg gggcgcgcgc caggcggggc ggggcggggc gaggggcggg 540
gcggggcgag gcggagaggt gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc 600
cttttatggc gaggcggcgg cggcggcggc cctataaaaa gcgaagcgcg cggcgggcgg 660
gagtcgctgc gcgctgcctt cgccccgtgc cccgctccgc cgccgcctcg cgccgcccgc 720
cccggctctg actgaccgcg ttactcccac aggtgagcgg gcgggacggc ccttctcctc 780
cgggctgtaa ttagcgcttg gtttaatgac ggcttgtttc ttttctgtgg ctgcgtgaaa 840
gccttgaggg gctccgggag ggccctttgt gcggggggag cggctcgggg ggtgcgtgcg 900
tgtgtgtgtg cgtggggagc gccgcgtgcg gctccgcgct gcccggcggc tgtgagcgct 960
gcgggcgcgg cgcggggctt tgtgcgctcc gcagtgtgcg cgaggggagc gcggccgggg 1020
gcggtgcccc gcggtgcggg gggggctgcg aggggaacaa aggctgcgtg cggggtgtgt 1080
gcgtgggggg gtgagcaggg ggtgtgggcg cgtcggtcgg gctgcaaccc cccctgcacc 1140
cccctccccg agttgctgag cacggcccgg cttcgggtgc ggggctccgt acggggcgtg 1200
gcgcggggct cgccgtgccg ggcggggggt ggcggcaggt gggggtgccg ggcggggcgg 1260
ggccgcctcg ggccggggag ggctcggggg aggggcgcgg cggcccccgg agcgccggcg 1320
gctgtcgagg cgcggcgagc cgcagccatt gccttttatg gtaatcgtgc gagagggcgc 1380
agggacttcc tttgtcccaa atctgtgcgg agccgaaatc tgggaggcgc cgccgcaccc 1440
cctctagcgg gcgcggggcg aagcggtgcg gcgccggcag gaaggaaatg ggcggggagg 1500
gccttcgtgc gtcgccgcgc cgccgtcccc ttctccctct ccagcctcgg ggctgtccgc 1560
ggggggacgg ctgccttcgg gggggacggg gcagggcggg gttcggcttc tggcgtgtga 1620
ccggcggctc tagagcctct gctaaccatg ttcatgcctt cttctttttc ctacagctcc 1680
tgggcaacgt gctggttatt gtgctgtctc atcattttgg caaagaattc cgccaccatg 1740
tctatggggg ctcctcgctc cctgctgctg gcactggccg ccgggctggc tgtcgcaaga 1800
ccacctaata tcgtcctgat ttttgcagac gatctgggat acggcgacct gggatgctat 1860
ggccacccaa gctccaccac acccaacctg gaccagctgg cagcaggagg cctgcggttc 1920
accgacttct acgtgccagt gagcctgtgc accccctcca gagccgccct gctgacaggc 1980
aggctgccag tgcgcatggg catgtatcct ggcgtgctgg tgccatctag caggggcggc 2040
ctgccactgg aggaggtgac cgtggcagag gtgctggcag ccagaggcta cctgacagga 2100
atggccggca agtggcacct gggagtggga ccagagggag ccttcctgcc ccctcaccag 2160
ggcttccacc ggtttctggg catcccttat tctcacgacc agggcccatg ccagaacctg 2220
acctgttttc caccagcaac accatgcgac ggaggatgtg atcagggcct ggtgccaatc 2280
ccactgctgg caaatctgag cgtggaggca cagcctccat ggctgcctgg cctggaggca 2340
agatacatgg ccttcgccca cgacctgatg gcagatgcac agcggcagga tagacctttc 2400
tttctgtact atgcctccca ccacacccac tatccacagt tcagcggcca gtcctttgcc 2460
gagaggtccg gaaggggacc attcggcgac tctctgatgg agctggatgc cgccgtgggc 2520
accctgatga cagcaatcgg cgacctgggc ctgctggagg agacactggt catcttcacc 2580
gccgataacg gccctgagac aatgcggatg tctagaggcg gatgcagcgg cctgctgaga 2640
tgtggcaagg gaaccacata cgagggaggc gtgcgcgagc ctgccctggc attttggcca 2700
ggacacatcg cacctggagt gacccacgag ctggcctcct ctctggacct gctgccaaca 2760
ctggccgccc tggcaggagc acctctgcca aatgtgaccc tggacggctt cgatctgagc 2820
ccactgctgc tgggaaccgg caagtcccct aggcagtctc tgttctttta cccctcctat 2880
cctgatgagg tgcggggcgt gtttgccgtg agaaccggca agtacaaggc ccacttcttt 2940
acacagggct ctgcccacag cgacaccaca gcagatccag catgccacgc cagctcctct 3000
ctgaccgcac acgagccacc tctgctgtac gacctgtcca aggatcccgg cgagaactat 3060
aatctgctgg gaggagtggc aggagcaacc cctgaggtgc tgcaggccct gaagcagctg 3120
cagctgctga aggcacagct ggacgcagca gtgacattcg gcccaagcca ggtggccaga 3180
ggcgaggatc ccgccctgca gatctgctgc cacccaggct gcacacccag acctgcctgc 3240
tgtcactgcc ccgacccaca cgccggcagc ggagctacta acttcagcct gctgaagcag 3300
gctggagacg tggaggagaa ccctggacct ggggacgttt gccaggactg cattcagatg 3360
gtgactgaca tccagactgc tgtacggacc aactccacct ttgtccaggc cttggtggaa 3420
catgtcaagg aggagtgtga ccgcctgggc cctggcatgg ccgacatatg caagaactat 3480
atcagccagt attctgaaat tgctatccag atgatgatgc acatgcaacc caaggagatc 3540
tgtgcgctgg ttgggttctg tgatgagtga actagtaact tgtttattgc agcttataat 3600
ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat 3660
tctagttgtg gtttgtccaa actcatcaat gtatctta 3698
<210> 76
<211> 4231
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 76
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag gtcctgcaga tcttcaatat tggccattag ccatattatt cattggttat 240
atagcataaa tcaatattgg ctattggcca ttgcatacgt tgtatctata tcataatatg 300
tacatttata ttggctcatg tccaatatga ccgccatgtt ggcattgatt attgactagt 360
tattaatagt aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt 420
acataactta cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg 480
tcaataatga cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg 540
gtggagtatt tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt 600
ccgcccccta ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg 660
accttacggg actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg 720
gtcgaggtga gccccacgtt ctgcttcact ctccccatct cccccccctc cccaccccca 780
attttgtatt tatttatttt ttaattattt tgtgcagcga tgggggcggg gggggggggg 840
gggcgcgcgc caggcggggc ggggcggggc gaggggcggg gcggggcgag gcggagaggt 900
gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc cttttatggc gaggcggcgg 960
cggcggcggc cctataaaaa gcgaagcgcg cggcgggcgg gagtcgctgc gcgctgcctt 1020
cgccccgtgc cccgctccgc cgccgcctcg cgccgcccgc cccggctctg actgaccgcg 1080
ttactcccac aggtgagcgg gcgggacggc ccttctcctc cgggctgtaa ttagcgcttg 1140
gtttaatgac ggcttgtttc ttttctgtgg ctgcgtgaaa gccttgaggg gctccgggag 1200
ggccctttgt gcggggggag cggctcgggg ggtgcgtgcg tgtgtgtgtg cgtggggagc 1260
gccgcgtgcg gctccgcgct gcccggcggc tgtgagcgct gcgggcgcgg cgcggggctt 1320
tgtgcgctcc gcagtgtgcg cgaggggagc gcggccgggg gcggtgcccc gcggtgcggg 1380
gggggctgcg aggggaacaa aggctgcgtg cggggtgtgt gcgtgggggg gtgagcaggg 1440
ggtgtgggcg cgtcggtcgg gctgcaaccc cccctgcacc cccctccccg agttgctgag 1500
cacggcccgg cttcgggtgc ggggctccgt acggggcgtg gcgcggggct cgccgtgccg 1560
ggcggggggt ggcggcaggt gggggtgccg ggcggggcgg ggccgcctcg ggccggggag 1620
ggctcggggg aggggcgcgg cggcccccgg agcgccggcg gctgtcgagg cgcggcgagc 1680
cgcagccatt gccttttatg gtaatcgtgc gagagggcgc agggacttcc tttgtcccaa 1740
atctgtgcgg agccgaaatc tgggaggcgc cgccgcaccc cctctagcgg gcgcggggcg 1800
aagcggtgcg gcgccggcag gaaggaaatg ggcggggagg gccttcgtgc gtcgccgcgc 1860
cgccgtcccc ttctccctct ccagcctcgg ggctgtccgc ggggggacgg ctgccttcgg 1920
gggggacggg gcagggcggg gttcggcttc tggcgtgtga ccggcggctc tagagcctct 1980
gctaaccatg ttcatgcctt cttctttttc ctacagctcc tgggcaacgt gctggttatt 2040
gtgctgtctc atcattttgg caaagaattc cgccaccatg tctatggggg ctcctcgctc 2100
cctgctgctg gcactggccg ccgggctggc tgtcgcaaga ccacctaata tcgtcctgat 2160
ttttgcagac gatctgggat acggcgacct gggatgctat ggccacccaa gctccaccac 2220
acccaacctg gaccagctgg cagcaggagg cctgcggttc accgacttct acgtgccagt 2280
gagcctgtgc accccctcca gagccgccct gctgacaggc aggctgccag tgcgcatggg 2340
catgtatcct ggcgtgctgg tgccatctag caggggcggc ctgccactgg aggaggtgac 2400
cgtggcagag gtgctggcag ccagaggcta cctgacagga atggccggca agtggcacct 2460
gggagtggga ccagagggag ccttcctgcc ccctcaccag ggcttccacc ggtttctggg 2520
catcccttat tctcacgacc agggcccatg ccagaacctg acctgttttc caccagcaac 2580
accatgcgac ggaggatgtg atcagggcct ggtgccaatc ccactgctgg caaatctgag 2640
cgtggaggca cagcctccat ggctgcctgg cctggaggca agatacatgg ccttcgccca 2700
cgacctgatg gcagatgcac agcggcagga tagacctttc tttctgtact atgcctccca 2760
ccacacccac tatccacagt tcagcggcca gtcctttgcc gagaggtccg gaaggggacc 2820
attcggcgac tctctgatgg agctggatgc cgccgtgggc accctgatga cagcaatcgg 2880
cgacctgggc ctgctggagg agacactggt catcttcacc gccgataacg gccctgagac 2940
aatgcggatg tctagaggcg gatgcagcgg cctgctgaga tgtggcaagg gaaccacata 3000
cgagggaggc gtgcgcgagc ctgccctggc attttggcca ggacacatcg cacctggagt 3060
gacccacgag ctggcctcct ctctggacct gctgccaaca ctggccgccc tggcaggagc 3120
acctctgcca aatgtgaccc tggacggctt cgatctgagc ccactgctgc tgggaaccgg 3180
caagtcccct aggcagtctc tgttctttta cccctcctat cctgatgagg tgcggggcgt 3240
gtttgccgtg agaaccggca agtacaaggc ccacttcttt acacagggct ctgcccacag 3300
cgacaccaca gcagatccag catgccacgc cagctcctct ctgaccgcac acgagccacc 3360
tctgctgtac gacctgtcca aggatcccgg cgagaactat aatctgctgg gaggagtggc 3420
aggagcaacc cctgaggtgc tgcaggccct gaagcagctg cagctgctga aggcacagct 3480
ggacgcagca gtgacattcg gcccaagcca ggtggccaga ggcgaggatc ccgccctgca 3540
gatctgctgc cacccaggct gcacacccag acctgcctgc tgtcactgcc ccgacccaca 3600
cgccggcagc ggagctacta acttcagcct gctgaagcag gctggagacg tggaggagaa 3660
ccctggacct ggggacgttt gccaggactg cattcagatg gtgactgaca tccagactgc 3720
tgtacggacc aactccacct ttgtccaggc cttggtggaa catgtcaagg aggagtgtga 3780
ccgcctgggc cctggcatgg ccgacatatg caagaactat atcagccagt attctgaaat 3840
tgctatccag atgatgatgc acatgcaacc caaggagatc tgtgcgctgg ttgggttctg 3900
tgatgagtga actagtaact tgtttattgc agcttataat ggttacaaat aaagcaatag 3960
catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg gtttgtccaa 4020
actcatcaat gtatcttagg tctagatacg tagataagta gcatggcggg ttaatcatta 4080
actacaagga acccctagtg atggagttgg ccactccctc tctgcgcgct cgctcgctca 4140
ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga 4200
gcgagcgagc gcgcagagag ggagtggcca a 4231
<210> 77
<211> 6073
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 77
tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgatgctcaa gtcagaggtg 60
gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg 120
ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag 180
cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc 240
caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa 300
ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg 360
taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc 420
taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga agccagttac 480
ctcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt 540
ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg 600
attttctacc gaagaaaggc ccacccgtga aggtgagcca gtgagttgat tgcagtccag 660
ttacgctgga gtctgaggct cgtcctgaat gatatcaagc ttgaattcgt gtcaggtggc 720
acttttcggg gaaatgtggc atgcctgcat ttggccactc cctctctgcg cgctcgctcg 780
ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca 840
gtgagcgagc gagcgcgcag agagggagtg gccaactcca tcactagggg ttcctggagg 900
ggtggagtcg tgacgtgaat tacgtcatag ggttagggag gtcctgcaga tcttcaatat 960
tggccattag ccatattatt cattggttat atagcataaa tcaatattgg ctattggcca 1020
ttgcatacgt tgtatctata tcataatatg tacatttata ttggctcatg tccaatatga 1080
ccgccatgtt ggcattgatt attgactagt tattaatagt aatcaattac ggggtcatta 1140
gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc 1200
tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg 1260
ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg 1320
gcagtacatc aagtgtatca tatgccaagt ccgcccccta ttgacgtcaa tgacggtaaa 1380
tggcccgcct ggcattatgc ccagtacatg accttacggg actttcctac ttggcagtac 1440
atctacgtat tagtcatcgc tattaccatg gtcgaggtga gccccacgtt ctgcttcact 1500
ctccccatct cccccccctc cccaccccca attttgtatt tatttatttt ttaattattt 1560
tgtgcagcga tgggggcggg gggggggggg gggcgcgcgc caggcggggc ggggcggggc 1620
gaggggcggg gcggggcgag gcggagaggt gcggcggcag ccaatcagag cggcgcgctc 1680
cgaaagtttc cttttatggc gaggcggcgg cggcggcggc cctataaaaa gcgaagcgcg 1740
cggcgggcgg gagtcgctgc gcgctgcctt cgccccgtgc cccgctccgc cgccgcctcg 1800
cgccgcccgc cccggctctg actgaccgcg ttactcccac aggtgagcgg gcgggacggc 1860
ccttctcctc cgggctgtaa ttagcgcttg gtttaatgac ggcttgtttc ttttctgtgg 1920
ctgcgtgaaa gccttgaggg gctccgggag ggccctttgt gcggggggag cggctcgggg 1980
ggtgcgtgcg tgtgtgtgtg cgtggggagc gccgcgtgcg gctccgcgct gcccggcggc 2040
tgtgagcgct gcgggcgcgg cgcggggctt tgtgcgctcc gcagtgtgcg cgaggggagc 2100
gcggccgggg gcggtgcccc gcggtgcggg gggggctgcg aggggaacaa aggctgcgtg 2160
cggggtgtgt gcgtgggggg gtgagcaggg ggtgtgggcg cgtcggtcgg gctgcaaccc 2220
cccctgcacc cccctccccg agttgctgag cacggcccgg cttcgggtgc ggggctccgt 2280
acggggcgtg gcgcggggct cgccgtgccg ggcggggggt ggcggcaggt gggggtgccg 2340
ggcggggcgg ggccgcctcg ggccggggag ggctcggggg aggggcgcgg cggcccccgg 2400
agcgccggcg gctgtcgagg cgcggcgagc cgcagccatt gccttttatg gtaatcgtgc 2460
gagagggcgc agggacttcc tttgtcccaa atctgtgcgg agccgaaatc tgggaggcgc 2520
cgccgcaccc cctctagcgg gcgcggggcg aagcggtgcg gcgccggcag gaaggaaatg 2580
ggcggggagg gccttcgtgc gtcgccgcgc cgccgtcccc ttctccctct ccagcctcgg 2640
ggctgtccgc ggggggacgg ctgccttcgg gggggacggg gcagggcggg gttcggcttc 2700
tggcgtgtga ccggcggctc tagagcctct gctaaccatg ttcatgcctt cttctttttc 2760
ctacagctcc tgggcaacgt gctggttatt gtgctgtctc atcattttgg caaagaattc 2820
cgccaccatg tctatggggg ctcctcgctc cctgctgctg gcactggccg ccgggctggc 2880
tgtcgcaaga ccacctaata tcgtcctgat ttttgcagac gatctgggat acggcgacct 2940
gggatgctat ggccacccaa gctccaccac acccaacctg gaccagctgg cagcaggagg 3000
cctgcggttc accgacttct acgtgccagt gagcctgtgc accccctcca gagccgccct 3060
gctgacaggc aggctgccag tgcgcatggg catgtatcct ggcgtgctgg tgccatctag 3120
caggggcggc ctgccactgg aggaggtgac cgtggcagag gtgctggcag ccagaggcta 3180
cctgacagga atggccggca agtggcacct gggagtggga ccagagggag ccttcctgcc 3240
ccctcaccag ggcttccacc ggtttctggg catcccttat tctcacgacc agggcccatg 3300
ccagaacctg acctgttttc caccagcaac accatgcgac ggaggatgtg atcagggcct 3360
ggtgccaatc ccactgctgg caaatctgag cgtggaggca cagcctccat ggctgcctgg 3420
cctggaggca agatacatgg ccttcgccca cgacctgatg gcagatgcac agcggcagga 3480
tagacctttc tttctgtact atgcctccca ccacacccac tatccacagt tcagcggcca 3540
gtcctttgcc gagaggtccg gaaggggacc attcggcgac tctctgatgg agctggatgc 3600
cgccgtgggc accctgatga cagcaatcgg cgacctgggc ctgctggagg agacactggt 3660
catcttcacc gccgataacg gccctgagac aatgcggatg tctagaggcg gatgcagcgg 3720
cctgctgaga tgtggcaagg gaaccacata cgagggaggc gtgcgcgagc ctgccctggc 3780
attttggcca ggacacatcg cacctggagt gacccacgag ctggcctcct ctctggacct 3840
gctgccaaca ctggccgccc tggcaggagc acctctgcca aatgtgaccc tggacggctt 3900
cgatctgagc ccactgctgc tgggaaccgg caagtcccct aggcagtctc tgttctttta 3960
cccctcctat cctgatgagg tgcggggcgt gtttgccgtg agaaccggca agtacaaggc 4020
ccacttcttt acacagggct ctgcccacag cgacaccaca gcagatccag catgccacgc 4080
cagctcctct ctgaccgcac acgagccacc tctgctgtac gacctgtcca aggatcccgg 4140
cgagaactat aatctgctgg gaggagtggc aggagcaacc cctgaggtgc tgcaggccct 4200
gaagcagctg cagctgctga aggcacagct ggacgcagca gtgacattcg gcccaagcca 4260
ggtggccaga ggcgaggatc ccgccctgca gatctgctgc cacccaggct gcacacccag 4320
acctgcctgc tgtcactgcc ccgacccaca cgccggcagc ggagctacta acttcagcct 4380
gctgaagcag gctggagacg tggaggagaa ccctggacct ggggacgttt gccaggactg 4440
cattcagatg gtgactgaca tccagactgc tgtacggacc aactccacct ttgtccaggc 4500
cttggtggaa catgtcaagg aggagtgtga ccgcctgggc cctggcatgg ccgacatatg 4560
caagaactat atcagccagt attctgaaat tgctatccag atgatgatgc acatgcaacc 4620
caaggagatc tgtgcgctgg ttgggttctg tgatgagtga actagtaact tgtttattgc 4680
agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt 4740
ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttagg tctagatacg 4800
tagataagta gcatggcggg ttaatcatta actacaagga acccctagtg atggagttgg 4860
ccactccctc tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac 4920
gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 4980
aagatccccg ggtaccgagg acgaattctc tagatatcgc tcaatactga ccatttaaat 5040
catacctgac ctccatagca gaaagtcaaa agcctccgac cggaggcttt tgacttgatc 5100
ggcacgtaag aggttccaac tttcaccata atgaaataag atcactaccg ggcgtatttt 5160
ttgagttatc gagattttca ggagctaagg aagctaaaat gagccatatt caacgggaaa 5220
cgtcttgctc gaggccgcga ttaaattcca acatggatgc tgatttatat gggtataaat 5280
gggctcgcga taatgtcggg caatcaggtg cgacaatcta tcgattgtat gggaagcccg 5340
atgcgccaga gttgtttctg aaacatggca aaggtagcgt tgccaatgat gttacagatg 5400
agatggtcag gctaaactgg ctgacggaat ttatgcctct tccgaccatc aagcatttta 5460
tccgtactcc tgatgatgca tggttactca ccactgcgat cccagggaaa acagcattcc 5520
aggtattaga agaatatcct gattcaggtg aaaatattgt tgatgcgctg gcagtgttcc 5580
tgcgccggtt gcattcgatt cctgtttgta attgtccttt taacggcgat cgcgtatttc 5640
gtctcgctca ggcgcaatca cgaatgaata acggtttggt tggtgcgagt gattttgatg 5700
acgagcgtaa tggctggcct gttgaacaag tctggaaaga aatgcataag cttttgccat 5760
tctcaccgga ttcagtcgtc actcatggtg atttctcact tgataacctt atttttgacg 5820
aggggaaatt aataggttgt attgatgttg gacgagtcgg aatcgcagac cgataccagg 5880
atcttgccat cctatggaac tgcctcggtg agttttctcc ttcattacag aaacggcttt 5940
ttcaaaaata tggtattgat aatcctgata tgaataaatt gcagtttcac ttgatgctcg 6000
atgagttttt ctgagggccc aaatgtaatc acctggctca ccttcgggtg ggcctttctg 6060
cgttgctggc gtt 6073
<210> 78
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> 合成核酸序列
<400> 78
ggaaaaccaa taccaaaccc tctattagga ttggactcaa ca 42
<210> 79
<211> 3458
<212> DNA
<213> 人工序列
<220>
<223> 合成核酸序列
<400> 79
ggcattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60
catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120
acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180
ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240
aagtgtatca tatgccaagt ccgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300
ggcattatgc ccagtacatg accttacggg actttcctac ttggcagtac atctacgtat 360
tagtcatcgc tattaccatg gtcgaggtga gccccacgtt ctgcttcact ctccccatct 420
cccccccctc cccaccccca attttgtatt tatttatttt ttaattattt tgtgcagcga 480
tgggggcggg gggggggggg gggcgcgcgc caggcggggc ggggcggggc gaggggcggg 540
gcggggcgag gcggagaggt gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc 600
cttttatggc gaggcggcgg cggcggcggc cctataaaaa gcgaagcgcg cggcgggcgg 660
gagtcgctgc gcgctgcctt cgccccgtgc cccgctccgc cgccgcctcg cgccgcccgc 720
cccggctctg actgaccgcg ttactcccac aggtgagcgg gcgggacggc ccttctcctc 780
cgggctgtaa ttagcgcttg gtttaatgac ggcttgtttc ttttctgtgg ctgcgtgaaa 840
gccttgaggg gctccgggag ggccctttgt gcggggggag cggctcgggg ggtgcgtgcg 900
tgtgtgtgtg cgtggggagc gccgcgtgcg gctccgcgct gcccggcggc tgtgagcgct 960
gcgggcgcgg cgcggggctt tgtgcgctcc gcagtgtgcg cgaggggagc gcggccgggg 1020
gcggtgcccc gcggtgcggg gggggctgcg aggggaacaa aggctgcgtg cggggtgtgt 1080
gcgtgggggg gtgagcaggg ggtgtgggcg cgtcggtcgg gctgcaaccc cccctgcacc 1140
cccctccccg agttgctgag cacggcccgg cttcgggtgc ggggctccgt acggggcgtg 1200
gcgcggggct cgccgtgccg ggcggggggt ggcggcaggt gggggtgccg ggcggggcgg 1260
ggccgcctcg ggccggggag ggctcggggg aggggcgcgg cggcccccgg agcgccggcg 1320
gctgtcgagg cgcggcgagc cgcagccatt gccttttatg gtaatcgtgc gagagggcgc 1380
agggacttcc tttgtcccaa atctgtgcgg agccgaaatc tgggaggcgc cgccgcaccc 1440
cctctagcgg gcgcggggcg aagcggtgcg gcgccggcag gaaggaaatg ggcggggagg 1500
gccttcgtgc gtcgccgcgc cgccgtcccc ttctccctct ccagcctcgg ggctgtccgc 1560
ggggggacgg ctgccttcgg gggggacggg gcagggcggg gttcggcttc tggcgtgtga 1620
ccggcggctc tagagcctct gctaaccatg ttcatgcctt cttctttttc ctacagctcc 1680
tgggcaacgt gctggttatt gtgctgtctc atcattttgg caaagaattc cgccaccatg 1740
tctatggggg ctcctcgctc cctgctgctg gcactggccg ccgggctggc tgtcgcaaga 1800
ccacctaata tcgtcctgat ttttgcagac gatctgggat acggcgacct gggatgctat 1860
ggccacccaa gctccaccac acccaacctg gaccagctgg cagcaggagg cctgcggttc 1920
accgacttct acgtgccagt gagcctgtgc accccctcca gagccgccct gctgacaggc 1980
aggctgccag tgcgcatggg catgtatcct ggcgtgctgg tgccatctag caggggcggc 2040
ctgccactgg aggaggtgac cgtggcagag gtgctggcag ccagaggcta cctgacagga 2100
atggccggca agtggcacct gggagtggga ccagagggag ccttcctgcc ccctcaccag 2160
ggcttccacc ggtttctggg catcccttat tctcacgacc agggcccatg ccagaacctg 2220
acctgttttc caccagcaac accatgcgac ggaggatgtg atcagggcct ggtgccaatc 2280
ccactgctgg caaatctgag cgtggaggca cagcctccat ggctgcctgg cctggaggca 2340
agatacatgg ccttcgccca cgacctgatg gcagatgcac agcggcagga tagacctttc 2400
tttctgtact atgcctccca ccacacccac tatccacagt tcagcggcca gtcctttgcc 2460
gagaggtccg gaaggggacc attcggcgac tctctgatgg agctggatgc cgccgtgggc 2520
accctgatga cagcaatcgg cgacctgggc ctgctggagg agacactggt catcttcacc 2580
gccgataacg gccctgagac aatgcggatg tctagaggcg gatgcagcgg cctgctgaga 2640
tgtggcaagg gaaccacata cgagggaggc gtgcgcgagc ctgccctggc attttggcca 2700
ggacacatcg cacctggagt gacccacgag ctggcctcct ctctggacct gctgccaaca 2760
ctggccgccc tggcaggagc acctctgcca aatgtgaccc tggacggctt cgatctgagc 2820
ccactgctgc tgggaaccgg caagtcccct aggcagtctc tgttctttta cccctcctat 2880
cctgatgagg tgcggggcgt gtttgccgtg agaaccggca agtacaaggc ccacttcttt 2940
acacagggct ctgcccacag cgacaccaca gcagatccag catgccacgc cagctcctct 3000
ctgaccgcac acgagccacc tctgctgtac gacctgtcca aggatcccgg cgagaactat 3060
aatctgctgg gaggagtggc aggagcaacc cctgaggtgc tgcaggccct gaagcagctg 3120
cagctgctga aggcacagct ggacgcagca gtgacattcg gcccaagcca ggtggccaga 3180
ggcgaggatc ccgccctgca gatctgttgc caccccggct gcaccccaag acctgcctgt 3240
tgccattgcc ccgacccaca cgccggaaaa ccaataccaa accctctatt aggattggac 3300
tcaacataag attctagagt cgagccgcgg actagtaact tgtttattgc agcttataat 3360
ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat 3420
tctagttgtg gtttgtccaa actcatcaat gtatctta 3458
<210> 80
<211> 3991
<212> DNA
<213> 人工序列
<220>
<223> 合成核酸序列
<400> 80
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag gtcctgcaga tcttcaatat tggccattag ccatattatt cattggttat 240
atagcataaa tcaatattgg ctattggcca ttgcatacgt tgtatctata tcataatatg 300
tacatttata ttggctcatg tccaatatga ccgccatgtt ggcattgatt attgactagt 360
tattaatagt aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt 420
acataactta cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg 480
tcaataatga cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg 540
gtggagtatt tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt 600
ccgcccccta ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg 660
accttacggg actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg 720
gtcgaggtga gccccacgtt ctgcttcact ctccccatct cccccccctc cccaccccca 780
attttgtatt tatttatttt ttaattattt tgtgcagcga tgggggcggg gggggggggg 840
gggcgcgcgc caggcggggc ggggcggggc gaggggcggg gcggggcgag gcggagaggt 900
gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc cttttatggc gaggcggcgg 960
cggcggcggc cctataaaaa gcgaagcgcg cggcgggcgg gagtcgctgc gcgctgcctt 1020
cgccccgtgc cccgctccgc cgccgcctcg cgccgcccgc cccggctctg actgaccgcg 1080
ttactcccac aggtgagcgg gcgggacggc ccttctcctc cgggctgtaa ttagcgcttg 1140
gtttaatgac ggcttgtttc ttttctgtgg ctgcgtgaaa gccttgaggg gctccgggag 1200
ggccctttgt gcggggggag cggctcgggg ggtgcgtgcg tgtgtgtgtg cgtggggagc 1260
gccgcgtgcg gctccgcgct gcccggcggc tgtgagcgct gcgggcgcgg cgcggggctt 1320
tgtgcgctcc gcagtgtgcg cgaggggagc gcggccgggg gcggtgcccc gcggtgcggg 1380
gggggctgcg aggggaacaa aggctgcgtg cggggtgtgt gcgtgggggg gtgagcaggg 1440
ggtgtgggcg cgtcggtcgg gctgcaaccc cccctgcacc cccctccccg agttgctgag 1500
cacggcccgg cttcgggtgc ggggctccgt acggggcgtg gcgcggggct cgccgtgccg 1560
ggcggggggt ggcggcaggt gggggtgccg ggcggggcgg ggccgcctcg ggccggggag 1620
ggctcggggg aggggcgcgg cggcccccgg agcgccggcg gctgtcgagg cgcggcgagc 1680
cgcagccatt gccttttatg gtaatcgtgc gagagggcgc agggacttcc tttgtcccaa 1740
atctgtgcgg agccgaaatc tgggaggcgc cgccgcaccc cctctagcgg gcgcggggcg 1800
aagcggtgcg gcgccggcag gaaggaaatg ggcggggagg gccttcgtgc gtcgccgcgc 1860
cgccgtcccc ttctccctct ccagcctcgg ggctgtccgc ggggggacgg ctgccttcgg 1920
gggggacggg gcagggcggg gttcggcttc tggcgtgtga ccggcggctc tagagcctct 1980
gctaaccatg ttcatgcctt cttctttttc ctacagctcc tgggcaacgt gctggttatt 2040
gtgctgtctc atcattttgg caaagaattc cgccaccatg tctatggggg ctcctcgctc 2100
cctgctgctg gcactggccg ccgggctggc tgtcgcaaga ccacctaata tcgtcctgat 2160
ttttgcagac gatctgggat acggcgacct gggatgctat ggccacccaa gctccaccac 2220
acccaacctg gaccagctgg cagcaggagg cctgcggttc accgacttct acgtgccagt 2280
gagcctgtgc accccctcca gagccgccct gctgacaggc aggctgccag tgcgcatggg 2340
catgtatcct ggcgtgctgg tgccatctag caggggcggc ctgccactgg aggaggtgac 2400
cgtggcagag gtgctggcag ccagaggcta cctgacagga atggccggca agtggcacct 2460
gggagtggga ccagagggag ccttcctgcc ccctcaccag ggcttccacc ggtttctggg 2520
catcccttat tctcacgacc agggcccatg ccagaacctg acctgttttc caccagcaac 2580
accatgcgac ggaggatgtg atcagggcct ggtgccaatc ccactgctgg caaatctgag 2640
cgtggaggca cagcctccat ggctgcctgg cctggaggca agatacatgg ccttcgccca 2700
cgacctgatg gcagatgcac agcggcagga tagacctttc tttctgtact atgcctccca 2760
ccacacccac tatccacagt tcagcggcca gtcctttgcc gagaggtccg gaaggggacc 2820
attcggcgac tctctgatgg agctggatgc cgccgtgggc accctgatga cagcaatcgg 2880
cgacctgggc ctgctggagg agacactggt catcttcacc gccgataacg gccctgagac 2940
aatgcggatg tctagaggcg gatgcagcgg cctgctgaga tgtggcaagg gaaccacata 3000
cgagggaggc gtgcgcgagc ctgccctggc attttggcca ggacacatcg cacctggagt 3060
gacccacgag ctggcctcct ctctggacct gctgccaaca ctggccgccc tggcaggagc 3120
acctctgcca aatgtgaccc tggacggctt cgatctgagc ccactgctgc tgggaaccgg 3180
caagtcccct aggcagtctc tgttctttta cccctcctat cctgatgagg tgcggggcgt 3240
gtttgccgtg agaaccggca agtacaaggc ccacttcttt acacagggct ctgcccacag 3300
cgacaccaca gcagatccag catgccacgc cagctcctct ctgaccgcac acgagccacc 3360
tctgctgtac gacctgtcca aggatcccgg cgagaactat aatctgctgg gaggagtggc 3420
aggagcaacc cctgaggtgc tgcaggccct gaagcagctg cagctgctga aggcacagct 3480
ggacgcagca gtgacattcg gcccaagcca ggtggccaga ggcgaggatc ccgccctgca 3540
gatctgttgc caccccggct gcaccccaag acctgcctgt tgccattgcc ccgacccaca 3600
cgccggaaaa ccaataccaa accctctatt aggattggac tcaacataag attctagagt 3660
cgagccgcgg actagtaact tgtttattgc agcttataat ggttacaaat aaagcaatag 3720
catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg gtttgtccaa 3780
actcatcaat gtatcttagg tctagatacg tagataagta gcatggcggg ttaatcatta 3840
actacaagga acccctagtg atggagttgg ccactccctc tctgcgcgct cgctcgctca 3900
ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga 3960
gcgagcgagc gcgcagagag ggagtggcca a 3991
<210> 81
<211> 6654
<212> DNA
<213> 人工序列
<220>
<223> 合成核酸序列
<400> 81
cgccagggtt ttcccagtca cgacgttgta aaacgacggc cagtgccaag cttgcatgcc 60
tgcatttggc cactccctct ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg 120
tcgcccgacg cccgggcttt gcccgggcgg cctcagtgag cgagcgagcg cgcagagagg 180
gagtggccaa ctccatcact aggggttcct ggaggggtgg agtcgtgacg tgaattacgt 240
catagggtta gggaggtcct gcagatcttc aatattggcc attagccata ttattcattg 300
gttatatagc ataaatcaat attggctatt ggccattgca tacgttgtat ctatatcata 360
atatgtacat ttatattggc tcatgtccaa tatgaccgcc atgttggcat tgattattga 420
ctagttatta atagtaatca attacggggt cattagttca tagcccatat atggagttcc 480
gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat 540
tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc 600
aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 660
caagtccgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt 720
acatgacctt acgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 780
ccatggtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac 840
ccccaatttt gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg 900
ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg gcggggcggg gcgaggcgga 960
gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa gtttcctttt atggcgaggc 1020
ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg ggcgggagtc gctgcgcgct 1080
gccttcgccc cgtgccccgc tccgccgccg cctcgcgccg cccgccccgg ctctgactga 1140
ccgcgttact cccacaggtg agcgggcggg acggcccttc tcctccgggc tgtaattagc 1200
gcttggttta atgacggctt gtttcttttc tgtggctgcg tgaaagcctt gaggggctcc 1260
gggagggccc tttgtgcggg gggagcggct cggggggtgc gtgcgtgtgt gtgtgcgtgg 1320
ggagcgccgc gtgcggctcc gcgctgcccg gcggctgtga gcgctgcggg cgcggcgcgg 1380
ggctttgtgc gctccgcagt gtgcgcgagg ggagcgcggc cgggggcggt gccccgcggt 1440
gcgggggggg ctgcgagggg aacaaaggct gcgtgcgggg tgtgtgcgtg ggggggtgag 1500
cagggggtgt gggcgcgtcg gtcgggctgc aaccccccct gcacccccct ccccgagttg 1560
ctgagcacgg cccggcttcg ggtgcggggc tccgtacggg gcgtggcgcg gggctcgccg 1620
tgccgggcgg ggggtggcgg caggtggggg tgccgggcgg ggcggggccg cctcgggccg 1680
gggagggctc gggggagggg cgcggcggcc cccggagcgc cggcggctgt cgaggcgcgg 1740
cgagccgcag ccattgcctt ttatggtaat cgtgcgagag ggcgcaggga cttcctttgt 1800
cccaaatctg tgcggagccg aaatctggga ggcgccgccg caccccctct agcgggcgcg 1860
gggcgaagcg gtgcggcgcc ggcaggaagg aaatgggcgg ggagggcctt cgtgcgtcgc 1920
cgcgccgccg tccccttctc cctctccagc ctcggggctg tccgcggggg gacggctgcc 1980
ttcggggggg acggggcagg gcggggttcg gcttctggcg tgtgaccggc ggctctagag 2040
cctctgctaa ccatgttcat gccttcttct ttttcctaca gctcctgggc aacgtgctgg 2100
ttattgtgct gtctcatcat tttggcaaag aattccgcca ccatgtctat gggggctcct 2160
cgctccctgc tgctggcact ggccgccggg ctggctgtcg caagaccacc taatatcgtc 2220
ctgatttttg cagacgatct gggatacggc gacctgggat gctatggcca cccaagctcc 2280
accacaccca acctggacca gctggcagca ggaggcctgc ggttcaccga cttctacgtg 2340
ccagtgagcc tgtgcacccc ctccagagcc gccctgctga caggcaggct gccagtgcgc 2400
atgggcatgt atcctggcgt gctggtgcca tctagcaggg gcggcctgcc actggaggag 2460
gtgaccgtgg cagaggtgct ggcagccaga ggctacctga caggaatggc cggcaagtgg 2520
cacctgggag tgggaccaga gggagccttc ctgccccctc accagggctt ccaccggttt 2580
ctgggcatcc cttattctca cgaccagggc ccatgccaga acctgacctg ttttccacca 2640
gcaacaccat gcgacggagg atgtgatcag ggcctggtgc caatcccact gctggcaaat 2700
ctgagcgtgg aggcacagcc tccatggctg cctggcctgg aggcaagata catggccttc 2760
gcccacgacc tgatggcaga tgcacagcgg caggatagac ctttctttct gtactatgcc 2820
tcccaccaca cccactatcc acagttcagc ggccagtcct ttgccgagag gtccggaagg 2880
ggaccattcg gcgactctct gatggagctg gatgccgccg tgggcaccct gatgacagca 2940
atcggcgacc tgggcctgct ggaggagaca ctggtcatct tcaccgccga taacggccct 3000
gagacaatgc ggatgtctag aggcggatgc agcggcctgc tgagatgtgg caagggaacc 3060
acatacgagg gaggcgtgcg cgagcctgcc ctggcatttt ggccaggaca catcgcacct 3120
ggagtgaccc acgagctggc ctcctctctg gacctgctgc caacactggc cgccctggca 3180
ggagcacctc tgccaaatgt gaccctggac ggcttcgatc tgagcccact gctgctggga 3240
accggcaagt cccctaggca gtctctgttc ttttacccct cctatcctga tgaggtgcgg 3300
ggcgtgtttg ccgtgagaac cggcaagtac aaggcccact tctttacaca gggctctgcc 3360
cacagcgaca ccacagcaga tccagcatgc cacgccagct cctctctgac cgcacacgag 3420
ccacctctgc tgtacgacct gtccaaggat cccggcgaga actataatct gctgggagga 3480
gtggcaggag caacccctga ggtgctgcag gccctgaagc agctgcagct gctgaaggca 3540
cagctggacg cagcagtgac attcggccca agccaggtgg ccagaggcga ggatcccgcc 3600
ctgcagatct gttgccaccc cggctgcacc ccaagacctg cctgttgcca ttgccccgac 3660
ccacacgccg gaaaaccaat accaaaccct ctattaggat tggactcaac ataagattct 3720
agagtcgagc cgcggactag taacttgttt attgcagctt ataatggtta caaataaagc 3780
aatagcatca caaatttcac aaataaagca tttttttcac tgcattctag ttgtggtttg 3840
tccaaactca tcaatgtatc ttaggtctag atacgtagat aagtagcatg gcgggttaat 3900
cattaactac aaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc 3960
gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc 4020
agtgagcgag cgagcgcgca gagagggagt ggccaaagat ccccgggtac cgagctcgaa 4080
ttcgtaatca tgtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac 4140
aacatacgag ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc 4200
acattaattg cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg 4260
cattaatgaa tcggccaacg cgcggggaga ggcggtttgc gtattggcga acttttgctg 4320
agttgaagga tcagatcacg catcttcccg acaacgcaga ccgttccgtg gcaaagcaaa 4380
agttcaaaat cagtaaccgt cagtgccgat aagttcaaag ttaaacctgg tgttgatacc 4440
aacattgaaa cgctgatcga aaacgcgctg aaaaacgctg ctgaatgtgc gagcttcttc 4500
cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc 4560
tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat 4620
gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt 4680
ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg 4740
aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc 4800
tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt 4860
ggcgctttct caatgctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa 4920
gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta 4980
tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa 5040
caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa 5100
ctacggctac actagaagga cagtatttgg tatctgcgct ctgctgaagc cagttacctt 5160
cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt 5220
ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat 5280
cttttctacg gggtctgacg ctcagtggaa cgatccgtcg agaggtctgc ctcgtgaaga 5340
aggtgttgct gactcatacc aggcctgaat cgccccatca tccagccaga aagtgaggga 5400
gccacggttg atgagagctt tgttgtaggt ggaccagttg gtgattttga acttttgctt 5460
tgccacggaa cggtctgcgt tgtcgggaag atgcgtgatc tgatccttca actcagcaaa 5520
agttcgattt attcaacaaa gccacgttgt gtctcaaaat ctctgatgtt acattgcaca 5580
agataaaaat atatcatcat gaacaataaa actgtctgct tacataaaca gtaatacaag 5640
gggtgttatg agccatattc aacgggaaac gtcttgctcg aagccgcgat taaattccaa 5700
catggatgct gatttatatg ggtataaatg ggctcgcgat aatgtcgggc aatcaggtgc 5760
gacaatctat cgattgtatg ggaagcccga tgcgccagag ttgtttctga aacatggcaa 5820
aggtagcgtt gccaatgatg ttacagatga gatggtcaga ctaaactggc tgacggaatt 5880
tatgcctctt ccgaccatca agcattttat ccgtactcct gatgatgcat ggttactcac 5940
cactgcgatc cccgggaaaa cagcattcca ggtattagaa gaatatcctg attcaggtga 6000
aaatattgtt gatgcgctgg cagtgttcct gcgccggttg cattcgattc ctgtttgtaa 6060
ttgtcctttt aacagcgatc gcgtatttcg tctcgctcag gcgcaatcac gaatgaataa 6120
cggtttggtt gatgcgagtg attttgatga cgagcgtaat ggctggcctg ttgaacaagt 6180
ctggaaagaa atgcataagc ttttgccatt ctcaccggat tcagtcgtca ctcatggtga 6240
tttctcactt gataacctta tttttgacga ggggaaatta ataggttgta ttgatgttgg 6300
acgagtcgga atcgcagacc gataccagga tcttgccatc ctatggaact gcctcggtga 6360
gttttctcct tcattacaga aacggctttt tcaaaaatat ggtattgata atcctgatat 6420
gaataaattg cagtttcatt tgatgctcga tgagtttttc taatcagaat tggttaattg 6480
gttgtaacac tggcagagca ttacgctgac ttgacgggac ggcggctttg ttgaataaat 6540
cgcattcgcc attcaggctg cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc 6600
tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaa 6654

Claims (83)

1.一种用于在细胞中表达芳基硫酸酯酶A(ARSA)多肽的方法,所述方法包含用重组腺相关病毒(rAAV)转导所述细胞,所述重组腺相关病毒包含:
(a)AAV衣壳,其包含AAV衣壳蛋白;和
(b)转移基因组,其包含可操作地连接于以沉默方式改变的ARSA编码序列的转录调节元件。
2.根据权利要求1所述的方法,其中所述细胞是神经元和/或神经胶质细胞,任选地其中所述细胞是中枢神经系统和/或周围神经系统的神经元和/或神经胶质细胞。
3.根据权利要求1所述的方法,其中所述细胞为选自由以下组成的群组的中枢神经系统区域的细胞:脊髓、运动皮质、感觉皮质、海马、壳核、小脑,任选地小脑核,和其任何组合。
4.根据权利要求1所述的方法,其中所述细胞为选自由以下组成的群组的细胞:运动神经元、星形胶质细胞、少突胶质细胞、中枢神经系统中的大脑皮质的细胞、周围神经系统的感觉神经元、施万细胞(Schwann cell)和其任何组合。
5.根据权利要求1至4中任一项所述的方法,其中所述细胞在哺乳动物受试者中并且以有效转导所述受试者中的所述细胞的量向所述受试者施用所述AAV。
6.一种用于治疗患有异染性脑白质营养不良(MLD)的受试者的方法,所述方法包含向所述受试者施用有效量的rAAV,所述rAAV包含:
(a)AAV衣壳,其包含衣壳蛋白;和
(b)转移基因组,其包含可操作地连接于以沉默方式改变的ARSA编码序列的转录调节元件。
7.根据前述权利要求中任一项所述的方法,其中所述以沉默方式改变的ARSA编码序列编码SEQ ID NO:23中所阐述的氨基酸序列。
8.根据权利要求7所述的方法,其中所述以沉默方式改变的ARSA编码序列包含SEQ IDNO:14、62或72中所阐述的核苷酸序列。
9.根据前述权利要求中任一项所述的方法,其中所述转录调节元件包含选自由以下组成的群组的一种或多种元件:巨细胞病毒(CMV)增强子元件、鸡β-肌动蛋白(CBA)启动子、小型鸡β-肌动蛋白(SmCBA)启动子、钙调蛋白1(CALM1)启动子、蛋白脂质蛋白质1(PLP1)启动子、胶质细胞原纤维酸性蛋白(GFAP)启动子、突触蛋白2(SYN2)启动子、金属硫蛋白3(MT3)启动子和其任何组合。
10.根据前述权利要求中任一项所述的方法,其中所述转录调节元件包含与选自由以下组成的群组的序列至少90%一致的核苷酸序列:SEQ ID NO:25、32、36、54、55和58。
11.根据前述权利要求中任一项所述的方法,其中所述转录调节元件包含选自由以下组成的群组的核苷酸序列:SEQ ID NO:25、32、36、54、55和58。
12.根据前述权利要求中任一项所述的方法,其中所述转录调节元件从5'到3'包含SEQID NO:58、25和32中所阐述的核苷酸序列。
13.根据前述权利要求中任一项所述的方法,其中所述转录调节元件包含SEQ ID NO:36中所阐述的核苷酸序列。
14.根据前述权利要求中任一项所述的方法,其中所述转移基因组还包含位于所述以沉默方式改变的ARSA编码序列3'的聚腺苷酸化序列。
15.根据权利要求14所述的方法,其中所述聚腺苷酸化序列为外源性聚腺苷酸化序列。
16.根据权利要求15所述的方法,其中所述外源性聚腺苷酸化序列为SV40聚腺苷酸化序列。
17.根据权利要求16所述的方法,其中所述SV40聚腺苷酸化序列包含SEQ ID NO:42中所阐述的核苷酸序列。
18.根据前述权利要求中任一项所述的方法,其中所述转移基因组还包含填充序列。
19.根据前述权利要求中任一项所述的方法,其中所述转移基因组还包含位于所述以沉默方式改变的ARSA编码序列3'的填充序列。
20.根据权利要求18或19所述的方法,其中所述填充序列位于所述聚腺苷酸化序列3'。
21.根据前述权利要求中任一项所述的方法,其中所述转移基因组包含选自由以下组成的群组的序列:SEQ ID NO:41、44、46、65、67、75和79。
22.根据前述权利要求中任一项所述的方法,其中所述转移基因组还包含所述基因组5'的5'反向末端重复(5'ITR)核苷酸序列,和所述基因组3'的3'反向末端重复(3'ITR)核苷酸序列。
23.根据权利要求22所述的方法,其中所述5'ITR核苷酸序列与SEQ ID NO:18具有至少95%序列一致性,并且所述3'ITR核苷酸序列与SEQ ID NO:19具有至少95%序列一致性。
24.根据权利要求22所述的方法,其中所述5'ITR核苷酸序列与SEQ ID NO:26具有至少95%序列一致性,并且所述3'ITR核苷酸序列与SEQ ID NO:27具有至少95%序列一致性。
25.根据权利要求22所述的方法,其中所述5'ITR核苷酸序列与SEQ ID NO:18具有至少95%序列一致性,并且所述3'ITR核苷酸序列与SEQ ID NO:57具有至少95%序列一致性。
26.根据前述权利要求中任一项所述的方法,其中所述转移基因组包含选自由以下组成的群组的核苷酸序列:SEQ ID NO:47、48、49、68、69、76和80。
27.根据权利要求5至25中任一项所述的方法,其中异染性脑白质营养不良与芳基硫酸酯酶A(ARSA)基因突变相关。
28.根据权利要求6至27中任一项所述的方法,其中所述受试者是人类受试者。
29.根据前述权利要求中任一项所述的方法,其中所述衣壳蛋白包含与SEQ ID NO:2、3、4、6、7、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列具有至少95%序列一致性的氨基酸序列。
30.根据权利要求29所述的方法,其中:所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸206的氨基酸为C;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸为H;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸为Q;所述衣壳蛋白中对应于SEQ IDNO:16的氨基酸346的氨基酸为A;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸为N;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸为S;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸为I;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸590的氨基酸为R;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸为G或Y;所述衣壳蛋白中对应于SEQID NO:16的氨基酸681的氨基酸为M;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸为R;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸为K;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸为C;或所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸为G。
31.根据权利要求30所述的方法,其中:
(a)所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸为G,并且所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸为G;
(b)所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸为H,所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸为N,所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸为M;
(c)所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸为R;
(d)所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸为A,并且所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R;或
(e)所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸为I,所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸为C。
32.根据权利要求30所述的方法,其中所述衣壳蛋白包含SEQ ID NO:2、3、4、6、7、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列。
33.根据前述权利要求中任一项所述的方法,其中所述衣壳蛋白包含与SEQ ID NO:2、3、4、5、6、7、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列具有至少95%序列一致性的氨基酸序列。
34.根据权利要求33所述的方法,其中:所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸151的氨基酸为R;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸160的氨基酸为D;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸206的氨基酸为C;所述衣壳蛋白中对应于SEQ IDNO:16的氨基酸296的氨基酸为H;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸为Q;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸为A;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸为N;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸为S;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸为I;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R;所述衣壳蛋白中对应于SEQ IDNO:16的氨基酸590的氨基酸为R;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸为G或Y;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸为M;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸为R;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸为K;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸为C;或所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸为G。
35.根据权利要求34所述的方法,其中:
(a)所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸为G,并且所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸为G;
(b)所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸为H,所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸为N,所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸为M;
(c)所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸为R;
(d)所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸为A,并且所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R;或
(e)所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸为I,所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸为C。
36.根据权利要求34所述的方法,其中所述衣壳蛋白包含SEQ ID NO:2、3、4、5、6、7、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列。
37.根据前述权利要求中任一项所述的方法,其中所述衣壳蛋白包含与SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列具有至少95%序列一致性的氨基酸序列。
38.根据权利要求37所述的方法,其中:所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸2的氨基酸为T;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸65的氨基酸为I;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸68的氨基酸为V;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸77的氨基酸为R;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸119的氨基酸为L;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸151的氨基酸为R;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸160的氨基酸为D;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸206的氨基酸为C;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸为H;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸为Q;所述衣壳蛋白中对应于SEQ IDNO:16的氨基酸346的氨基酸为A;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸为N;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸为S;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸为I;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸590的氨基酸为R;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸为G或Y;所述衣壳蛋白中对应于SEQID NO:16的氨基酸681的氨基酸为M;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸为R;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸为K;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸为C;或所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸为G。
39.根据权利要求38所述的方法,其中:
(a)所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸2的氨基酸为T,并且所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸为Q;
(b)所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸65的氨基酸为I,并且所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸为Y;
(c)所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸77的氨基酸为R,并且所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸为K;
(d)所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸119的氨基酸为L,并且所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸为S;
(e)所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸为G,并且所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸为G;
(f)所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸为H,所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸为N,所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸为M;
(g)所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸为R;
(h)所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸为A,并且所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R;或
(i)所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸为I,所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸为C。
40.根据权利要求38所述的方法,其中所述衣壳蛋白包含SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列。
41.一种rAAV,其包含:
(a)AAV衣壳,其包含AAV衣壳蛋白;和
(b)转移基因组,其包含可操作地连接于以沉默方式改变的ARSA编码序列的转录调节元件。
42.根据权利要求41所述的rAAV,其中所述以沉默方式改变的ARSA编码序列编码SEQID NO:23中所阐述的氨基酸序列。
43.根据权利要求42所述的rAAV,其中所述以沉默方式改变的ARSA编码序列包含SEQID NO:14中所阐述的核苷酸序列。
44.根据权利要求42所述的rAAV,其中所述以沉默方式改变的ARSA编码序列包含SEQID NO:62或72中所阐述的核苷酸序列。
45.根据权利要求41至44中任一项所述的rAAV,其中所述转录调节元件包含选自由以下组成的群组的一种或多种元件:巨细胞病毒(CMV)增强子元件、鸡β-肌动蛋白(CBA)启动子、小型鸡β-肌动蛋白(SmCBA)启动子、钙调蛋白1(CALM1)启动子、蛋白脂质蛋白质1(PLP1)启动子、胶质细胞原纤维酸性蛋白(GFAP)启动子、突触蛋白2(SYN2)启动子、金属硫蛋白3(MT3)启动子和其任何组合。
46.根据权利要求45所述的rAAV,其中所述转录调节元件包含与选自由以下组成的群组的序列至少90%一致的核苷酸序列:SEQ ID NO:25、32、36、54、55和58。
47.根据权利要求45所述的rAAV,其中所述转录调节元件包含选自由以下组成的群组的核苷酸序列:SEQ ID NO:25、32、36、54、55和58。
48.根据权利要求45所述的rAAV,其中所述转录调节元件从5'到3'包含SEQ ID NO:58、25和32中所阐述的核苷酸序列。
49.根据权利要求45所述的rAAV,其中所述转录调节元件包含SEQ ID NO:36中所阐述的核苷酸序列。
50.根据权利要求41至49中任一项所述的rAAV,其中所述转移基因组还包含位于所述以沉默方式改变的ARSA编码序列3'的聚腺苷酸化序列。
51.根据权利要求50所述的rAAV,其中所述聚腺苷酸化序列是外源性聚腺苷酸化序列。
52.根据权利要求51所述的rAAV,其中所述外源性聚腺苷酸化序列是SV40聚腺苷酸化序列。
53.根据权利要求52所述的rAAV,其中所述SV40聚腺苷酸化序列包含SEQ ID NO:42中所阐述的核苷酸序列。
54.根据权利要求41至53中任一项所述的rAAV,其中所述转移基因组包含选自由以下组成的群组的序列:SEQ ID NO:41、44、46、65、67、75和79。
55.根据权利要求41至54中任一项所述的rAAV,其中所述转移基因组还包含所述基因组5'的5'反向末端重复(5'ITR)核苷酸序列,和所述基因组3'的3'反向末端重复(3'ITR)核苷酸序列。
56.根据权利要求55所述的rAAV,其中所述5'ITR核苷酸序列与SEQ ID NO:18具有至少95%序列一致性,并且所述3'ITR核苷酸序列与SEQ ID NO:19具有至少95%序列一致性。
57.根据权利要求41至55中任一项所述的rAAV,其中所述转移基因组包含选自由以下组成的群组的核苷酸序列:SEQ ID NO:47、48、49、68、69、76和80。
58.根据权利要求41至55中任一项所述的rAAV,其中所述转移基因组的核苷酸序列由选自由以下组成的群组的核苷酸序列组成:SEQ ID NO:47、48、49、68、69、76和80。
59.根据权利要求41至58中任一项所述的rAAV,其中所述转移基因组的核苷酸序列由SEQ ID NO:48中所阐述的核苷酸序列组成。
60.根据权利要求41至59中任一项所述的rAAV,其中所述衣壳蛋白包含与SEQ ID NO:2、3、4、6、7、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列具有至少95%序列一致性的氨基酸序列。
61.根据权利要求60所述的rAAV,其中:所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸206的氨基酸为C;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸为H;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸为Q;所述衣壳蛋白中对应于SEQ IDNO:16的氨基酸346的氨基酸为A;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸为N;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸为S;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸为I;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸590的氨基酸为R;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸为G或Y;所述衣壳蛋白中对应于SEQID NO:16的氨基酸681的氨基酸为M;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸为R;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸为K;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸为C;或所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸为G。
62.根据权利要求61所述的rAAV,其中:
(a)所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸为G,并且所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸为G;
(b)所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸为H,所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸为N,所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸为M;
(c)所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸为R;
(d)所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸为A,并且所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R;或
(e)所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸为I,所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸为C。
63.根据权利要求61所述的rAAV,其中所述衣壳蛋白包含SEQ ID NO:2、3、4、6、7、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列。
64.根据权利要求41至63中任一项所述的rAAV,其中所述衣壳蛋白包含与SEQ ID NO:2、3、4、5、6、7、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列具有至少95%序列一致性的氨基酸序列。
65.根据权利要求64所述的rAAV,其中:所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸151的氨基酸为R;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸160的氨基酸为D;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸206的氨基酸为C;所述衣壳蛋白中对应于SEQ IDNO:16的氨基酸296的氨基酸为H;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸为Q;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸为A;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸为N;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸为S;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸为I;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R;所述衣壳蛋白中对应于SEQ IDNO:16的氨基酸590的氨基酸为R;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸为G或Y;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸为M;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸为R;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸为K;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸为C;或所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸为G。
66.根据权利要求65所述的rAAV,其中:
(a)所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸为G,并且所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸为G;
(b)所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸为H,所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸为N,所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸为M;
(c)所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸为R;
(d)所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸为A,并且所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R;或
(e)所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸为I,所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸为C。
67.根据权利要求65所述的rAAV,其中所述衣壳蛋白包含SEQ ID NO:2、3、4、5、6、7、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列。
68.根据权利要求41至67中任一项所述的rAAV,其中所述衣壳蛋白包含与SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列具有至少95%序列一致性的氨基酸序列。
69.根据权利要求68所述的rAAV,其中:所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸2的氨基酸为T;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸65的氨基酸为I;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸68的氨基酸为V;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸77的氨基酸为R;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸119的氨基酸为L;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸151的氨基酸为R;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸160的氨基酸为D;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸206的氨基酸为C;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸为H;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸为Q;所述衣壳蛋白中对应于SEQ IDNO:16的氨基酸346的氨基酸为A;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸为N;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸为S;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸为I;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸590的氨基酸为R;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸为G或Y;所述衣壳蛋白中对应于SEQID NO:16的氨基酸681的氨基酸为M;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸为R;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸为K;所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸为C;或所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸为G。
70.根据权利要求69所述的rAAV,其中:
(a)所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸2的氨基酸为T,并且所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸为Q;
(b)所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸65的氨基酸为I,并且所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸为Y;
(c)所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸77的氨基酸为R,并且所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸为K;
(d)所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸119的氨基酸为L,并且所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸为S;
(e)所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸为G,并且所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸为G;
(f)所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸为H,所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸为N,所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸为M;
(g)所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸为R;
(h)所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸为A,并且所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R;或
(i)所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸为I,所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸为R,并且所述衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸为C。
71.根据权利要求69所述的rAAV,其中所述衣壳蛋白包含SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列。
72.一种药物组合物,其包含根据权利要求41至71中任一项所述的rAAV。
73.一种多核苷酸,其包含SEQ ID NO:14、62和72中所阐述的核酸序列。
74.一种用于制备rAAV的包装系统,其中所述包装系统包含
(a)第一核苷酸序列,其编码一种或多种AAV Rep蛋白;
(b)第二核苷酸序列,其编码根据权利要求41至71中任一项所述的AAV的衣壳蛋白;和
(c)第三核苷酸序列,其包含根据权利要求41至71中任一项所述的AAV的rAAV基因组序列。
75.根据权利要求74所述的包装系统,其中所述包装系统包含有包含所述第一核苷酸序列和所述第二核苷酸序列的第一载体,以及包含所述第三核苷酸序列的第二载体。
76.根据权利要求74或75所述的包装系统,其还包含第四核苷酸序列,所述第四核苷酸序列包含一种或多种辅助病毒基因。
77.根据权利要求76所述的包装系统,其中所述第四核苷酸序列包含于第三载体内。
78.根据权利要求74至77中任一项所述的包装系统,其中所述第四核苷酸序列包含一种或多种来自选自由以下组成的群组的病毒的基因:腺病毒、疱疹病毒、痘苗病毒和巨细胞病毒(CMV)。
79.根据权利要求74至78中任一项所述的包装系统,其中所述第一载体、第二载体和/或所述第三载体为质粒。
80.一种用于rAAV的重组制备的方法,所述方法包含在借以产生所述rAAV的条件下将根据权利要求74至79中任一项所述的包装系统引入细胞中。
81.根据权利要求41至71中任一项所述的rAAV、根据权利要求72所述的药物组合物或根据权利要求73所述的多核苷酸,其用作药剂。
82.根据权利要求41至71中任一项所述的rAAV、根据权利要求72所述的药物组合物或根据权利要求73所述的多核苷酸,其用于治疗MLD。
83.根据权利要求41至71中任一项所述的rAAV、根据权利要求72所述的药物组合物或根据权利要求73所述的多核苷酸,其用于治疗患有MLD的受试者的方法,所述方法包含向所述受试者施用有效量的所述rAAV、所述药物组合物或所述多核苷酸。
CN202080054069.6A 2019-06-10 2020-06-09 用于arsa基因转移的腺相关病毒组合物和其使用方法 Pending CN114502575A (zh)

Applications Claiming Priority (13)

Application Number Priority Date Filing Date Title
US201962859539P 2019-06-10 2019-06-10
US62/859,539 2019-06-10
US201962866374P 2019-06-25 2019-06-25
US62/866,374 2019-06-25
US201962915523P 2019-10-15 2019-10-15
US62/915,523 2019-10-15
US202062960487P 2020-01-13 2020-01-13
US62/960,487 2020-01-13
US202062987858P 2020-03-10 2020-03-10
US62/987,858 2020-03-10
US202063010970P 2020-04-16 2020-04-16
US63/010,970 2020-04-16
PCT/US2020/036846 WO2020251954A1 (en) 2019-06-10 2020-06-09 Adeno-associated virus compositions for arsa gene transfer and methods of use thereof

Publications (1)

Publication Number Publication Date
CN114502575A true CN114502575A (zh) 2022-05-13

Family

ID=73782242

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080054069.6A Pending CN114502575A (zh) 2019-06-10 2020-06-09 用于arsa基因转移的腺相关病毒组合物和其使用方法

Country Status (15)

Country Link
US (1) US20220204991A1 (zh)
EP (1) EP3980447A4 (zh)
JP (1) JP2022536338A (zh)
KR (1) KR20220035107A (zh)
CN (1) CN114502575A (zh)
AU (1) AU2020292256B2 (zh)
BR (1) BR112021024855A2 (zh)
CA (1) CA3142932A1 (zh)
CL (1) CL2021003295A1 (zh)
CO (1) CO2021016797A2 (zh)
IL (1) IL288863A (zh)
MX (1) MX2021015076A (zh)
PE (1) PE20220233A1 (zh)
TW (1) TW202112807A (zh)
WO (1) WO2020251954A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023225481A1 (en) * 2022-05-16 2023-11-23 Genzyme Corporation Methods of treating metachromatic leukodystrophy
WO2024026494A1 (en) 2022-07-29 2024-02-01 Regeneron Pharmaceuticals, Inc. Viral particles retargeted to transferrin receptor 1
WO2024036250A2 (en) * 2022-08-10 2024-02-15 Homology Medicines, Inc. Adeno-associated virus compositions for arsa gene transfer and methods of use thereof

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106661591A (zh) * 2014-05-02 2017-05-10 建新公司 用于视网膜及cns基因疗法的aav载体
CN107532177A (zh) * 2015-03-24 2018-01-02 加利福尼亚大学董事会 腺相关病毒变体及其使用方法
US20180021364A1 (en) * 2015-01-16 2018-01-25 Voyager Therapeutics, Inc. Central nervous system targeting polynucleotides
CN107828820A (zh) * 2010-10-27 2018-03-23 学校法人自治医科大学 用于向神经系统细胞导入基因的腺相关病毒粒子
CN108367055A (zh) * 2015-05-15 2018-08-03 明尼苏达大学董事会 用于治疗性递送到中枢神经系统的腺相关物

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9839696B2 (en) * 2010-04-30 2017-12-12 City Of Hope Recombinant adeno-associated vectors for targeted treatment
KR20230065367A (ko) * 2018-02-01 2023-05-11 호몰로지 메디슨, 인크. Pah 유전자 전달을 위한 아데노-연관 바이러스 조성물 및 이의 사용 방법
CA3129321A1 (en) * 2019-02-15 2020-08-20 Generation Bio Co. Modulation of rep protein activity in closed-ended dna (cedna) production
MX2021013420A (es) * 2019-05-03 2022-02-03 Univ Pennsylvania Composiciones utiles en el tratamiento de leucodistrofia metacromatica.

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107828820A (zh) * 2010-10-27 2018-03-23 学校法人自治医科大学 用于向神经系统细胞导入基因的腺相关病毒粒子
CN106661591A (zh) * 2014-05-02 2017-05-10 建新公司 用于视网膜及cns基因疗法的aav载体
US20180021364A1 (en) * 2015-01-16 2018-01-25 Voyager Therapeutics, Inc. Central nervous system targeting polynucleotides
CN107532177A (zh) * 2015-03-24 2018-01-02 加利福尼亚大学董事会 腺相关病毒变体及其使用方法
CN108367055A (zh) * 2015-05-15 2018-08-03 明尼苏达大学董事会 用于治疗性递送到中枢神经系统的腺相关物

Also Published As

Publication number Publication date
US20220204991A1 (en) 2022-06-30
MX2021015076A (es) 2022-06-02
WO2020251954A1 (en) 2020-12-17
IL288863A (en) 2022-02-01
AU2020292256B2 (en) 2023-01-19
BR112021024855A2 (pt) 2022-05-03
TW202112807A (zh) 2021-04-01
AU2020292256A1 (en) 2022-01-06
KR20220035107A (ko) 2022-03-21
CO2021016797A2 (es) 2022-01-17
CA3142932A1 (en) 2020-12-17
EP3980447A4 (en) 2023-07-26
EP3980447A1 (en) 2022-04-13
JP2022536338A (ja) 2022-08-15
PE20220233A1 (es) 2022-02-07
CL2021003295A1 (es) 2022-09-23

Similar Documents

Publication Publication Date Title
AU2020260491B2 (en) Gene therapies for lysosomal disorders
AU2020205228B2 (en) Gene therapies for lysosomal disorders
AU2023214366B2 (en) Gene therapies for lysosomal disorders
AU2022204199A1 (en) Gene editing of deep intronic mutations
RU2758489C2 (ru) Композиции и способы для экспрессии нескольких биологически активных полипептидов с одного вектора для лечения заболеваний сердца и других патологий
KR20220006527A (ko) 리소좀 장애에 대한 유전자 요법
CN114502575A (zh) 用于arsa基因转移的腺相关病毒组合物和其使用方法
KR20210150486A (ko) 리소좀 장애에 대한 유전자 요법
KR20230066360A (ko) 신경퇴행성 장애를 위한 유전자 요법
AU2024202693A1 (en) Gene Therapy For Ocular Disorders
KR20220078607A (ko) 융합 단백질들을 이용한 tcr 재프로그래밍을 위한 조성물 및 방법들
KR20200107990A (ko) 신경 생존 인자를 포함하는 컨스트럭트 및 이의 용도
KR20230051529A (ko) 리소좀 장애에 대한 유전자 요법
KR20180002706A (ko) Smad7 유전자 전달 치료법
KR20210150487A (ko) 리소좀 장애를 위한 유전자 요법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20220513

WD01 Invention patent application deemed withdrawn after publication