CN111886021A - 用于pah基因转移的腺伴随病毒组合物及其使用方法 - Google Patents

用于pah基因转移的腺伴随病毒组合物及其使用方法 Download PDF

Info

Publication number
CN111886021A
CN111886021A CN201980019659.2A CN201980019659A CN111886021A CN 111886021 A CN111886021 A CN 111886021A CN 201980019659 A CN201980019659 A CN 201980019659A CN 111886021 A CN111886021 A CN 111886021A
Authority
CN
China
Prior art keywords
amino acid
seq
capsid protein
protein corresponding
gly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980019659.2A
Other languages
English (en)
Inventor
A.B.西摩
S.S.阿梅德
J.B.怀特
S.N.多利夫
H.鲁宾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cognate3 LLC
Original Assignee
Cognate3 LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cognate3 LLC filed Critical Cognate3 LLC
Publication of CN111886021A publication Critical patent/CN111886021A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0066Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/44Oxidoreductases (1)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0058Nucleic acids adapted for tissue specific expression, e.g. having tissue specific promoters as part of a contruct
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P3/00Drugs for disorders of the metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • C12Y114/16Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with reduced pteridine as one donor, and incorporation of one atom of oxygen (1.14.16)
    • C12Y114/16001Phenylalanine 4-monooxygenase (1.14.16.1)
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/94Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving narcotics or drugs or pharmaceuticals, neurotransmitters or associated receptors
    • G01N33/9406Neurotransmitters
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/075Animals genetically altered by homologous recombination inducing loss of function, i.e. knock out
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/0306Animal model for genetic diseases
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14151Methods of production or purification of viral material
    • C12N2750/14152Methods of production or purification of viral material relating to complementing cells and packaging systems for producing virus or viral particles
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/42Vector systems having a special element relevant for transcription being an intron or intervening sequence for splicing and/or stability of RNA

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • General Engineering & Computer Science (AREA)
  • Epidemiology (AREA)
  • Microbiology (AREA)
  • Hematology (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Diabetes (AREA)
  • Obesity (AREA)
  • Biophysics (AREA)
  • General Chemical & Material Sciences (AREA)
  • Virology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Urology & Nephrology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Cell Biology (AREA)
  • Food Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • General Physics & Mathematics (AREA)

Abstract

本文提供了腺伴随病毒(AAV)组合物,其可以在细胞中表达苯丙氨酸羟化酶(PAH)多肽,从而恢复PAH基因功能。还提供了使用AAV组合物的方法以及用于制备AAV组合物的包装系统。

Description

用于PAH基因转移的腺伴随病毒组合物及其使用方法
相关申请
本申请要求于2018年2月1日提交的美国临时专利申请序列号62/625,150的优先权,其全部公开内容通过引用并入本文。
电子提交的序列表的引用
ASCII文本文件中的电子提交序列表的内容(名称:HMT-025PC_SeqList_ST25.txt;大小:34214字节;以及创建日期:2019年1月27日)通过引用完整并入本文。
发明背景
苯丙酮尿(PKU)是常染色体隐性遗传病症,其中大多数病例是由苯丙氨酸羟化酶(PAH)基因中的突变引起的。PAH基因编码一种在多聚化时催化L-苯丙氨酸(Phe)到L-酪氨酸(Tyr)的羟基化的肝酶。PAH活性的降低或丧失导致苯丙氨酸积累和其转化为苯丙酮酸(也称为苯酮)。苯丙氨酸代谢异常损害神经元成熟和髓磷脂的合成,导致智力低下、癫痫发作和其他严重的医学问题。
当前,尚无PKU的治愈。护理的标准是通过使含大量苯丙氨酸的食物最小化来进行饮食管理。用低苯丙氨酸配方从出生起的饮食管理在很大程度上阻止该病症的智力残疾。然而,即使依靠低苯丙氨酸饮食,儿童仍遭受生长迟缓,并且成年人常常患有骨质疏松症和维生素缺乏。此外,坚持终生饮食治疗是困难的,尤其是在儿童达到学龄后。
最近出现了新的治疗策略,包括大的中性氨基酸(LNAA)补充、辅因子四氢生物蝶呤疗法、酶替代疗法和经遗传修饰的益生菌疗法。但是,这些策略存在缺点。LNAA补充仅适用于不坚持低Phe饮食的成年人。辅因子四氢生物蝶呤只能以某些温和的PKU形式使用。通过施用PAH的替代物,例如苯丙氨酸氨裂合酶(ammonia-lyase,PAL)进行酶替代可导致免疫应答,其降低功效和/或引起副作用。对于经遗传修饰的益生菌疗法,表达PAL的大肠杆菌(E.coli)的致病性已引起关注。
基因疗法提供了治愈PKU的独特机会。逆转录病毒载体,包括慢病毒载体,能够将核酸整合到宿主细胞基因组中,由于其非靶向性插入基因组而引起安全性问题。例如,存在载体破坏肿瘤抑制基因或激活癌基因,从而引起恶性疾病的风险。确实,在一项通过用γ-逆转录病毒载体转导CD34+骨髓前体来治疗X连锁严重联合免疫缺陷症(SCID)的临床试验中,十分之四的患者形成白血病(Hacein-Bey-Abina et al.,J Clin Invest.(2008)118(9):3132-42)。另一方面,非整合型载体通常在体内遭受表达水平不足或表达持续时间不足。
因此,本领域需要可以在PKU患者中有效且安全地恢复PAH基因功能的改进的基因疗法组合物和方法。
发明概述
本文提供了可以在细胞中恢复PAH基因功能的腺伴随病毒(AAV)组合物,以及使用该组合物治疗与PAH基因功能降低相关的疾病(例如PKU)的方法。还提供了用于制备腺伴随病毒组合物的包装系统。
因此,一方面,本公开提供了一种在细胞中表达PAH多肽的方法,该方法包括用复制缺陷型腺伴随病毒(AAV)转导所述细胞,该复制缺陷型腺伴随病毒包含:
(a)包含AAV进化枝F衣壳蛋白的AAV衣壳;和
(b)包含与PAH编码序列可操作连接的转录调节元件的转移基因组。
在某些实施方案中,细胞是肝细胞、肾细胞或脑、垂体、肾上腺、胰腺、膀胱、胆囊、结肠、小肠或乳房中的细胞。在某些实施方案中,所述细胞在哺乳动物受试者中,并且以有效转导所述受试者中的所述细胞的量对所述受试者施用所述AAV。
在另一方面,本公开提供了用于治疗患有与PAH基因突变相关的疾病或病症的受试者的方法,所述方法包括对所述受试者施用有效量的复制缺陷型腺伴随病毒(AAV),其包含:
(a)包含AAV进化枝F衣壳蛋白的AAV衣壳;和
(b)包含与PAH编码序列可操作连接的转录调节元件的转移基因组。
在某些实施方案中,所述疾病或病症是苯丙酮尿。在某些实施方案中,所述受试者是人类受试者。
在另一方面,本公开提供了复制缺陷型腺伴随病毒(AAV),其包括:
(a)包含AAV进化枝F衣壳蛋白的AAV衣壳;和
(b)包含与PAH编码序列可操作连接的转录调节元件的转移基因组。
以下实施方案适用于前述各个方面。
在某些实施方案中,所述PAH编码序列编码SEQ ID NO:23所示的氨基酸序列。在某些实施方案中,所述PAH编码序列包含SEQ ID NO:24所示的核苷酸序列。在某些实施方案中,将所述PAH编码序列沉默改变。在某些实施方案中,所述PAH编码序列包含SEQ ID NO:25所示的核苷酸序列。
在某些实施方案中,所述转录调节元件能够介导肝细胞、肾细胞或脑、垂体、肾上腺、胰腺、膀胱、胆囊、结肠、小肠或乳房中的细胞中的转录。在某些实施方案中,转录调节元件能够介导肝细胞或肾细胞中的转录。在某些实施方案中,转录调节元件包含选自下组的一种或多种元件:CAG启动子、人EF-1α启动子、人肝控制区1(HCR1)、人α1-抗胰蛋白酶(hAAT)启动子、hAAT启动子的肝特异性调节模块、SV40内含子和小鼠细小病毒(MVM)内含子。在某些实施方案中,转录调节元件包含与选自SEQ ID NO:28-30和32-41的序列至少90%相同的核苷酸序列。在某些实施方案中,转录调节元件包含选自SEQ ID NO:28-30和32-41的核苷酸序列。在某些实施方案中,所述转录调节元件从5’至3’包含SEQ ID NO:29、30和31所示的核苷酸序列。在某些实施方案中,所述转录调节元件包含SEQ ID NO:32所示的核苷酸序列。
在某些实施方案中,所述转移基因组进一步包含与所述PAH编码序列可操作连接的内含子。在某些实施方案中,所述内含子包含与SEQ ID NO:31或35所示的序列至少90%相同的核苷酸序列。在某些实施方案中,所述内含子包含SEQ ID NO:31或35所示的核苷酸序列。在某些实施方案中,所述转移基因组从5’至3’包含:非编码外显子、所述内含子和所述PAH编码序列。
在某些实施方案中,所述转移基因组进一步包含所述PAH编码序列3’的聚腺苷酸化序列。在某些实施方案中,聚腺苷酸化序列是外源聚腺苷酸化序列。在某些实施方案中,外源聚腺苷酸化序列是SV40聚腺苷酸化序列。在某些实施方案中,SV40聚腺苷酸化序列包含选自由SEQ ID NO:42、43和45组成的组的序列。
在某些实施方案中,所述转移基因组包含选自SEQ ID NO:46-50、61、64、67、74、76、78、80、82、84、86和89的序列。
在某些实施方案中,所述转移基因组进一步包含所述基因组5’的5’反向末端重复(5’ITR)核苷酸序列和所述基因组3’的3’反向末端重复(3’ITR)核苷酸序列。在某些实施方案中,所述5’ITR核苷酸序列与SEQ ID NO:18具有至少95%的序列同一性,并且所述3’ITR核苷酸序列与SEQ ID NO:19具有至少95%的序列同一性。在某些实施方案中,所述5’ITR核苷酸序列与SEQ ID NO:20具有至少95%的序列同一性,并且所述3’ITR核苷酸序列与SEQID NO:21具有至少95%的序列同一性。在某些实施方案中,所述5’ITR核苷酸序列与SEQ IDNO:26具有至少95%的序列同一性,并且所述3’ITR核苷酸序列与SEQ ID NO:27具有至少95%的序列同一性。
在某些实施方案中,所述转移基因组包含选自SEQ ID NO:51-55、62、65、68、75、77、79、81、83、85、87和90的核苷酸序列。在某些实施方案中,所述转移基因组由选自SEQ IDNO:51-55、62、65、68、75、77、79、81、83、85、87和90的核苷酸序列组成。在某些实施方案中,所述转移基因组由SEQ ID NO:52所示的核苷酸序列组成。
在某些实施方案中,所述AAV进化枝F衣壳蛋白包含与SEQ ID NO:2、3、4、6、7、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列具有至少95%的序列同一性的氨基酸序列。在某些实施方案中,所述衣壳蛋白中与SEQ ID NO:2的氨基酸206对应的氨基酸为C;所述衣壳蛋白中与SEQ ID NO:2的氨基酸296对应的氨基酸为H;所述衣壳蛋白中与SEQ IDNO:2的氨基酸312对应的氨基酸为Q;所述衣壳蛋白中与SEQ ID NO:2的氨基酸346对应的氨基酸为A;所述衣壳蛋白中与SEQ ID NO:2的氨基酸464对应的氨基酸为N;所述衣壳蛋白中与SEQ ID NO:2的氨基酸468对应的氨基酸为S;所述衣壳蛋白中与SEQ ID NO:2的氨基酸501对应的氨基酸为I;所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸590对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸626对应的氨基酸为G或Y;所述衣壳蛋白中与SEQ ID NO:2的氨基酸681对应的氨基酸为M;所述衣壳蛋白中与SEQ ID NO:2的氨基酸687对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸690对应的氨基酸为K;所述衣壳蛋白中与SEQ ID NO:2的氨基酸706对应的氨基酸为C;或,所述衣壳蛋白中与SEQ ID NO:2的氨基酸718对应的氨基酸为G。
在某些实施方案中,(a)所述衣壳蛋白中与SEQ ID NO:2的氨基酸626对应的氨基酸为G,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸718对应的氨基酸为G;
(b)所述衣壳蛋白中与SEQ ID NO:2的氨基酸296对应的氨基酸为H,所述衣壳蛋白中与SEQ ID NO:2的氨基酸464对应的氨基酸为N,所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸681对应的氨基酸为M;
(c)所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸687对应的氨基酸为R;
(d)所述衣壳蛋白中与SEQ ID NO:2的氨基酸346对应的氨基酸为A,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R;或
(e)所述衣壳蛋白中与SEQ ID NO:2的氨基酸501对应的氨基酸为I,所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸706对应的氨基酸为C。
在某些实施方案中,衣壳蛋白包含SEQ ID NO:2、3、4、6、7、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列。
在某些实施方案中,AAV进化枝F衣壳蛋白包含与SEQ ID NO:2、3、4、5、6、7、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列具有至少95%的序列同一性的氨基酸序列。在某些实施方案中,所述衣壳蛋白中与SEQ ID NO:2的氨基酸151对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸160对应的氨基酸为D;所述衣壳蛋白中与SEQ IDNO:2的氨基酸206对应的氨基酸为C;所述衣壳蛋白中与SEQ ID NO:2的氨基酸296对应的氨基酸为H;所述衣壳蛋白中与SEQ ID NO:2的氨基酸312对应的氨基酸为Q;所述衣壳蛋白中与SEQ ID NO:2的氨基酸346对应的氨基酸为A;所述衣壳蛋白中与SEQ ID NO:2的氨基酸464对应的氨基酸为N;所述衣壳蛋白中与SEQ ID NO:2的氨基酸468对应的氨基酸为S;所述衣壳蛋白中与SEQ ID NO:2的氨基酸501对应的氨基酸为I;所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸590对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸626对应的氨基酸为G或Y;所述衣壳蛋白中与SEQ ID NO:2的氨基酸681对应的氨基酸为M;所述衣壳蛋白中与SEQ ID NO:2的氨基酸687对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸690对应的氨基酸为K;所述衣壳蛋白中与SEQ ID NO:2的氨基酸706对应的氨基酸为C;或,所述衣壳蛋白中与SEQ ID NO:2的氨基酸718对应的氨基酸为G。
在某些实施方案中,(a)所述衣壳蛋白中与SEQ ID NO:2的氨基酸626对应的氨基酸为G,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸718对应的氨基酸为G;
(b)所述衣壳蛋白中与SEQ ID NO:2的氨基酸296对应的氨基酸为H,所述衣壳蛋白中与SEQ ID NO:2的氨基酸464对应的氨基酸为N,所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸681对应的氨基酸为M;
(c)所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸687对应的氨基酸为R;
(d)所述衣壳蛋白中与SEQ ID NO:2的氨基酸346对应的氨基酸为A,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R;或
(e)所述衣壳蛋白中与SEQ ID NO:2的氨基酸501对应的氨基酸为I,所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸706对应的氨基酸为C。
在某些实施方案中,衣壳蛋白包含SEQ ID NO:2、3、4、5、6、7、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列。
在某些实施方案中,AAV进化枝F衣壳蛋白包含与SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列具有至少95%的序列同一性的氨基酸序列。在某些实施方案中,所述衣壳蛋白中与SEQ ID NO:2的氨基酸2对应的氨基酸为T;所述衣壳蛋白中与SEQ ID NO:2的氨基酸65对应的氨基酸为I;所述衣壳蛋白中与SEQ IDNO:2的氨基酸68对应的氨基酸为V;所述衣壳蛋白中与SEQ ID NO:2的氨基酸77对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸119对应的氨基酸为L;所述衣壳蛋白中与SEQ ID NO:2的氨基酸151对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸160对应的氨基酸为D;所述衣壳蛋白中与SEQ ID NO:2的氨基酸206对应的氨基酸为C;所述衣壳蛋白中与SEQ ID NO:2的氨基酸296对应的氨基酸为H;所述衣壳蛋白中与SEQ ID NO:2的氨基酸312对应的氨基酸为Q;所述衣壳蛋白中与SEQ ID NO:2的氨基酸346对应的氨基酸为A;所述衣壳蛋白中与SEQ ID NO:2的氨基酸464对应的氨基酸为N;所述衣壳蛋白中与SEQID NO:2的氨基酸468对应的氨基酸为S;所述衣壳蛋白中与SEQ ID NO:2的氨基酸501对应的氨基酸为I;所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸590对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸626对应的氨基酸为G或Y;所述衣壳蛋白中与SEQ ID NO:2的氨基酸681对应的氨基酸为M;所述衣壳蛋白中与SEQ ID NO:2的氨基酸687对应的氨基酸为R;所述衣壳蛋白中与SEQID NO:2的氨基酸690对应的氨基酸为K;所述衣壳蛋白中与SEQ ID NO:2的氨基酸706对应的氨基酸为C;或,所述衣壳蛋白中与SEQ ID NO:2的氨基酸718对应的氨基酸为G。
在某些实施方案中,(a)所述衣壳蛋白中与SEQ ID NO:2的氨基酸2对应的氨基酸为T,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸312对应的氨基酸为Q;
(b)所述衣壳蛋白中与SEQ ID NO:2的氨基酸65对应的氨基酸为I,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸626对应的氨基酸为Y;
(c)所述衣壳蛋白中与SEQ ID NO:2的氨基酸77对应的氨基酸为R,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸690对应的氨基酸为K;
(d)所述衣壳蛋白中与SEQ ID NO:2的氨基酸119对应的氨基酸为L,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸468对应的氨基酸为S;
(e)所述衣壳蛋白中与SEQ ID NO:2的氨基酸626对应的氨基酸为G,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸718对应的氨基酸为G;
(f)所述衣壳蛋白中与SEQ ID NO:2的氨基酸296对应的氨基酸为H,所述衣壳蛋白中与SEQ ID NO:2的氨基酸464对应的氨基酸为N,所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸681对应的氨基酸为M;
(g)所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸687对应的氨基酸为R;
(h)所述衣壳蛋白中与SEQ ID NO:2的氨基酸346对应的氨基酸为A,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R;或
(i)所述衣壳蛋白中与SEQ ID NO:2的氨基酸501对应的氨基酸为I,所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸706对应的氨基酸为C。
在某些实施方案中,衣壳蛋白包含SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列。
在另一方面,本公开提供了包含本文公开的AAV的药物组合物。
在另一方面,本公开提供了用于重组制备AAV的包装系统,其中该包装系统包括:
(a)编码一种或多种AAV Rep蛋白的Rep核苷酸序列;
(b)编码如本文公开的一种或多种AAV进化枝F衣壳蛋白的Cap核苷酸序列;和
(c)如本文公开的转移基因组,其中所述包装系统在细胞中起作用以将所述转移基因组封闭在衣壳中以形成所述AAV。
在某些实施方案中,所述包装系统包括包含所述Rep核苷酸序列和所述Cap核苷酸序列的第一载体和包含所述转移基因组的第二载体。在某些实施方案中,Rep核苷酸序列编码AAV2 Rep蛋白。在某些实施方案中,AAV2 Rep蛋白是78/68或Rep 68/52。在某些实施方案中,AAV2 Rep蛋白包含与SEQ ID NO:22的AAV2 Rep氨基酸序列具有最小百分比序列同一性的氨基酸序列,其中跨越编码所述AAV2 Rep蛋白的氨基酸序列长度,所述最小百分比序列同一性是至少70%。
在某些实施方案中,包装系统还包含第三载体,其中第三载体是辅助病毒载体。在某些实施方案中,辅助病毒载体是独立的第三载体。在某些实施方案中,辅助病毒载体与第一载体整合。在某些实施方案中,辅助病毒载体与第二载体整合。在某些实施方案中,第三载体包含编码辅助病毒蛋白的基因。
在某些实施方案中,所述辅助病毒选自腺病毒、疱疹病毒、牛痘病毒和巨细胞病毒(CMV)。在某些实施方案中,辅助病毒是腺病毒。在某些实施方案中,所述腺病毒基因组包含一种或多种选自E1、E2、E4和VA的腺病毒RNA基因。在某些实施方案中,辅助病毒是单纯疱疹病毒(HSV)。在某些实施方案中,所述HSV基因组包含选自UL5/8/52、ICPO、ICP4、ICP22和UL30/UL42的一种或多种HSV基因。
在某些实施方案中,所述第一载体和所述第三载体被包含在第一转染质粒内。在某些实施方案中,所述第二载体和所述第三载体的核苷酸被包含在第二转染质粒内。在某些实施方案中,将所述第一载体和所述第三载体的核苷酸克隆到重组辅助病毒中。在某些实施方案中,将所述第二载体和所述第三载体的核苷酸克隆到重组辅助病毒中。
在另一方面,本公开提供了用于重组制备AAV的方法,该方法包括在用于将转移基因组封闭在衣壳中以形成AAV的起作用的条件下将如本文所述的包装系统导入细胞中。
附图简述
图1A、1B、1C、1D和1E分别是pHMI-hPAH-TC-004、pHMI-hPAH-TC-025、pHMI-hPAH-TC-010、pHMI-hPAH-TC-011和pHMI-hPAH-TC-012载体的载体图。
图2是Western印迹的图像,其显示了来自pCOH-WT-PAH(“WT PAH”)、pCOH-CO-PAH(“CO PAH pCOH”)和pHMI-CO-PAH(“CO PAH pHMI”)载体的人PAH的表达。用1μg载体转染5x105个HEK 293细胞。转染后48小时收集细胞的裂解物。用抗PAH抗体(Sigma HPA031642)通过Western印迹检测人PAH的表达。如由抗GAPDH抗体(Millipore MAB 374)检测的GAPDH蛋白的量显示为上样对照。
图3A和3B是显示两只pah-/-小鼠(“小鼠H1”和“小鼠H5”)的血清中Phe水平的图,每只小鼠通过尾静脉以静脉内施用每kg体重5x1013包装在AAVHSC衣壳中的rAAV-CBA-mPAH载体的载体基因组。在时间过程中收集血清样品。用BioAssay Systems ELISA试剂盒EPHE-100(图3A)或质谱法(图3B)测量Phe水平。
图4是显示在主要器官中检测到的每106个细胞的载体基因组数目的图和表。以每kg体重5x1013个载体基因组的剂量将包装在AAVHSC衣壳中的rAAV-CBA-mPAH载体经尾静脉静脉内注射到pah-/-小鼠中。施用后4周收集小鼠的器官。通过以下方法测量每106个细胞的载体基因组数目:(1)使用用载体质粒的系列稀释产生的标准曲线,通过Taqman PCR测量样品中载体基因组的重量/体积浓度;(2)根据载体的序列计算单个载体基因组的质量;(3)计算样品中载体基因组的数目/体积浓度;(4)使用从小鼠组织中分离的基因组DNA的计算量的系列稀释生成的标准曲线,通过载脂蛋白B基因的Taqman PCR测量同一样品中基因组DNA的重量/体积浓度;(5)根据ApoB的拷贝计算样品中细胞基因组的数目/体积浓度;并且(6)通过将载体基因组的数目/体积浓度除以细胞基因组的数目/体积浓度,并将结果乘以106,计算出每106个细胞的载体基因组数目。
图5A和5B是显示施用rAAV-CBA-mPAH载体的pah-/-小鼠血清中天冬氨酸转氨酶(AST)和丙氨酸转氨酶(ALT)水平的图。以每kg体重5x1013个载体基因组的剂量将包装在AAVHSC衣壳中的rAAV-CBA-mPAH载体经尾静脉静脉内注射到pah-/-小鼠中。施用后4周收集血清样品。分别使用Sigma MAK055和Sigma MAK052试剂盒通过ELISA测定AST(图5A)和ALT(图5B)的水平。
图6A-6H是显示施用指定剂量的pHMI-hPAH-TC-004、pHMI-hPAH-TC-025、pHMI-hPAH-TC-010、pHMI-hPAH-TC-011或pHMI-hPAH-TC-012载体的雄性(图6A,6B,6E,和6F)或雌性(图6C,6D,6G和6H)的小鼠的血清中的苯丙氨酸(图6A,6C,6E和6G)或酪氨酸(图6B,6D,6F和6H)水平的图。
图6I-6J是显示对施用指示剂量的pHMI-hPAH-TC-025载体的雄性(图6I)或雌性(图6J)小鼠血清中苯丙氨酸水平的长期疗效的图。
图7A-7D是显示在施用指定剂量的pHMI-hPAH-TC-025载体的雄性(图7A和7B)或雌性(图7C和7D)小鼠的血清中苯丙氨酸(图7A和7C)或酪氨酸(图7B和7D)的水平的图。
图8A、8B、8C分别是pHMI-hPAH-TC-009、pHMI-hPAH-TC-013和pHMI-hPAH-TC-017载体的载体图。
图9A-9B描绘了Huh7细胞(图9A)和HEK293细胞(图9B)中来自指定AAV载体的人PAH表达的Western印迹的定量。
图10A-10C是显示已经施用指示的AAV载体的小鼠中血清苯丙氨酸水平的图。图10A是显示雄性Pah-/-PAHenu2小鼠随时间的血清Phe水平的图。图10B是显示雌性Pah-/-PAHenu2小鼠随时间的血清Phe水平的图。图10C是显示研究中雄性和雌性小鼠的平均基线血清Phe水平的图(每组55只小鼠;****表示p<0.05)。
图11A、11B、11C、11D、11E和11F分别是pHMI-hPAH-TC-018、pHMI-hPAH-TC-019、pHMI-hPAH-TC-020、pHMI-hPAH-TC-021、pHMI-hPAH-TC-022和pHMI-hPAH-TC-023载体的载体图。
图12描绘了在CBA启动子的控制下,从用指定的AAV载体转染的HEK293细胞中人PAH表达的Western印迹的定量。
图13是显示施用指定的AAV载体的雄性Pah-/-PAHenu2小鼠随时间的血清苯丙氨酸水平的图。
发明详述
本公开提供了可以在细胞中恢复PAH基因功能的腺伴随病毒(AAV)组合物。还提供了用于制备腺伴随病毒组合物的包装系统。
I.定义
如本文所用,术语“复制缺陷型腺伴随病毒”是指包含缺少Rep和Cap基因的基因组的AAV。
如本文所用,术语“PAH基因”是指苯丙氨酸羟化酶基因。人PAH基因由Entrez基因ID 5053鉴定。PAH mRNA的示例性核苷酸序列提供为SEQ ID NO:24。PAH多肽的示例性氨基酸序列提供为SEQ ID NO:23。
如本文所用,术语“转移基因组”是指重组AAV基因组,其包含可操作地连接至外源转录调节元件的编码序列,当将转移基因组引入细胞时,所述外源转录调节元件介导编码序列的表达。在某些实施方案中,转移基因组不整合在细胞的染色体DNA中。熟练技术人员将理解,包含与PAH编码序列可操作地连接的转录调节元件的转移基因组的部分相对于PAH编码序列的转录方向可以处于有义或反义方向。
如本文所用,术语“进化枝F衣壳蛋白”是指与本文中分别以SEQ ID NO:1的氨基酸1-736、138-736和203-736所示的VP1、VP2或VP3氨基酸序列具有至少90%同一性的AAVVP1、VP2或VP3衣壳蛋白。
如本文所用,两个核苷酸序列之间或两个氨基酸序列之间的同一性通过比对中相同核苷酸或氨基酸的数目除以较长核苷酸或氨基酸序列的全长来确定。
如本文所用,术语“与PAH基因突变相关的疾病或病症”是指由PAH基因的突变引起,加剧或与PAH基因的突变遗传相关的任何疾病或病症。在某些实施方案中,与PAH基因突变有关的疾病或病症是苯丙酮尿(PKU)。
如本文所用,术语“编码序列”是指互补DNA(cDNA)中编码多肽的部分,其从起始密码子开始并且终止于终止密码子。由于可变剪接、可变翻译起始和群体内的变异,基因可具有一个或多个编码序列。编码序列可以是野生型或密码子改变的。示例性的野生型PAH编码序列以SEQ ID NO:24所示。
如本文所用,术语“沉默改变”是指在不改变由编码序列或填充物插入的编码序列编码的多肽的氨基酸序列的情况下改变基因的编码序列或填充物插入的编码序列(例如,通过核苷酸取代)。此类沉默改变是有利的,因为它可以提高编码序列的翻译效率。
在本公开中,相对于起始密码子的第一个核苷酸规定PAH基因中的核苷酸位置。起始密码子的第一个核苷酸在位置1;起始密码子的第一个核苷酸5’的核苷酸具有负数;起始密码子的第一个核苷酸3’的核苷酸具有正数。人PAH基因的示例性核苷酸1是NCBI参考序列:NG_008690.1的核苷酸5,473,并且人PAH基因的示例性核苷酸3是NCBI参考序列:NG_008690.1的核苷酸5,475。与起始密码子5’相邻的核苷酸是核苷酸-1。
在本公开中,相对于涵盖起始密码子的第一个核苷酸的外显子规定PAH基因中的外显子和内含子,所述起始密码子的第一个核苷酸是NCBI参考序列:NG_008690.1的核苷酸5473。涵盖起始密码子第一个核苷酸的外显子是外显子1。外显子1的3’的外显子从5’至3’是:外显子2,外显子3等。内含子1的3’的内含子从5’至3’是:内含子1,内含子2等。因此,PAH基因从5’至3’包含:外显子1、内含子1、外显子2、内含子2、外显子3等。人PAH基因的示例性外显子1是NCBI参考序列:NG_008690.1的核苷酸5001-5532。人PAH基因的示例性内含子1是NCBI参考序列:NG_008690.1的核苷酸5533-9704。
如本文所用,术语“转录调节元件”或“TRE”是指调节(例如控制,增加或减少)RNA聚合酶对可操作的核苷酸序列的转录以形成RNA分子的顺式作用核苷酸序列,例如DNA序列。TRE依靠于一个或多个反式作用分子,例如转录因子来调节转录。因此,当一个TRE与不同的反式作用分子接触时,例如,当它在不同类型的细胞中时,它可以以不同的方式调节转录。TRE可包含一种或多种启动子元件和/或增强子元件。熟练技术人员将理解,基因中的启动子和增强子元件可以在位置上接近,并且术语“启动子”可以指包含启动子元件和增强子元件的序列。因此,术语“启动子”不排除序列中的增强子元件。启动子和增强子元件不需要源自相同的基因或物种,并且每个启动子或增强子元件的序列可以与基因组中的相应内源序列相同或基本相同。
如本文所用,术语“可操作连接”用于描述TRE与待转录的编码序列之间的连接。通常,基因表达置于包含一种或多种启动子和/或增强子元件的TRE的控制之下。若编码序列的转录受TRE控制或影响,则编码序列“可操作连接”至TRE。只要获得期望的转录活性,TRE的启动子和增强子元件可以处于任何方向和/或与编码序列的距离。在某些实施方案中,TRE在编码序列的上游。
如本文所用,术语“聚腺苷酸化序列”是指当转录成RNA时构成聚腺苷酸化信号序列的DNA序列。聚腺苷酸化序列可以是天然的(例如,来自PAH基因)或外源的。外源聚腺苷酸化序列可以是哺乳动物或病毒性聚腺苷酸化序列(例如,SV40聚腺苷酸化序列)。
如本文所用,“外源聚腺苷酸化序列”是指不与PAH基因(例如人PAH基因)的内源性聚腺苷酸化序列相同或基本上相同的聚腺苷酸化序列。在某些实施方案中,外源聚腺苷酸化序列是相同物种(例如人)中非PAH基因的聚腺苷酸化序列。在某些实施方案中,外源聚腺苷酸化序列是不同物种(例如病毒)的聚腺苷酸化序列。
如本文所用,在向受试者施用AAV的上下文中,术语“有效量”是指达到期望的预防或治疗作用的AAV的量。
II.腺伴随病毒组合物
在一方面,本文提供了新颖的复制缺陷型AAV组合物,其可用于在具有降低或其它方面缺陷的PAH基因功能的细胞中表达PAH多肽。在某些实施方案中,本文公开的AAV包含:包含AAV进化枝F衣壳蛋白的AAV衣壳;和转移基因组,其包含与PAH编码序列可操作连接的转录调节元件,从而允许PAH在染色体外表达。
任何AAV进化枝F衣壳蛋白或其衍生物可用于本文公开的AAV组合物中。例如,在某些实施方案中,AAV进化枝F衣壳蛋白包含与SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的氨基酸序列。在某些实施方案中,AAV进化枝F衣壳蛋白包含与SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,其中:所述衣壳蛋白中与SEQ ID NO:2的氨基酸206对应的氨基酸为C;所述衣壳蛋白中与SEQ ID NO:2的氨基酸296对应的氨基酸为H;所述衣壳蛋白中与SEQ ID NO:2的氨基酸312对应的氨基酸为Q;所述衣壳蛋白中与SEQ IDNO:2的氨基酸346对应的氨基酸为A;所述衣壳蛋白中与SEQ ID NO:2的氨基酸464对应的氨基酸为N;所述衣壳蛋白中与SEQ ID NO:2的氨基酸468对应的氨基酸为S;所述衣壳蛋白中与SEQ ID NO:2的氨基酸501对应的氨基酸为I;所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸590对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸626对应的氨基酸为G或Y;所述衣壳蛋白中与SEQ IDNO:2的氨基酸681对应的氨基酸为M;所述衣壳蛋白中与SEQ ID NO:2的氨基酸687对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸690对应的氨基酸为K;所述衣壳蛋白中与SEQ ID NO:2的氨基酸706对应的氨基酸为C;或,所述衣壳蛋白中与SEQ ID NO:2的氨基酸718对应的氨基酸为G。在某些实施方案中,所述衣壳蛋白中与SEQ ID NO:2的氨基酸626对应的氨基酸为G,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸718对应的氨基酸为G。在某些实施方案中,所述衣壳蛋白中与SEQ ID NO:2的氨基酸296对应的氨基酸为H,所述衣壳蛋白中与SEQ ID NO:2的氨基酸464对应的氨基酸为N,所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸681对应的氨基酸为M。在某些实施方案中,所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸687对应的氨基酸为R。在某些实施方案中,所述衣壳蛋白中与SEQ ID NO:2的氨基酸346对应的氨基酸为A,并且所述衣壳蛋白中与SEQ IDNO:2的氨基酸505对应的氨基酸为R。在某些实施方案中,所述衣壳蛋白中与SEQ ID NO:2的氨基酸501对应的氨基酸为I,所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸706对应的氨基酸为C。在某些实施方案中,AAV进化枝F衣壳蛋白包含SEQ ID NO:2、3、4、6、7、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列。
例如,在某些实施方案中,AAV进化枝F衣壳蛋白包含与SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的氨基酸序列。在某些实施方案中,AAV进化枝F衣壳蛋白与SEQ IDNO:2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,其中:所述衣壳蛋白中与SEQ IDNO:2的氨基酸151对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸160对应的氨基酸为D;所述衣壳蛋白中与SEQ ID NO:2的氨基酸206对应的氨基酸为C;所述衣壳蛋白中与SEQ ID NO:2的氨基酸296对应的氨基酸为H;所述衣壳蛋白中与SEQ ID NO:2的氨基酸312对应的氨基酸为Q;所述衣壳蛋白中与SEQ ID NO:2的氨基酸346对应的氨基酸为A;所述衣壳蛋白中与SEQ ID NO:2的氨基酸464对应的氨基酸为N;所述衣壳蛋白中与SEQ ID NO:2的氨基酸468对应的氨基酸为S;所述衣壳蛋白中与SEQ ID NO:2的氨基酸501对应的氨基酸为I;所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R;所述衣壳蛋白中与SEQID NO:2的氨基酸590对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸626对应的氨基酸为G或Y;所述衣壳蛋白中与SEQ ID NO:2的氨基酸681对应的氨基酸为M;所述衣壳蛋白中与SEQ ID NO:2的氨基酸687对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸690对应的氨基酸为K;所述衣壳蛋白中与SEQ ID NO:2的氨基酸706对应的氨基酸为C;或,所述衣壳蛋白中与SEQ ID NO:2的氨基酸718对应的氨基酸为G。在某些实施方案中,所述衣壳蛋白中与SEQ ID NO:2的氨基酸626对应的氨基酸为G,并且所述衣壳蛋白中与SEQID NO:2的氨基酸718对应的氨基酸为G。在某些实施方案中,所述衣壳蛋白中与SEQ ID NO:2的氨基酸296对应的氨基酸为H,所述衣壳蛋白中与SEQ ID NO:2的氨基酸464对应的氨基酸为N,所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸681对应的氨基酸为M。在某些实施方案中,所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸687对应的氨基酸为R。在某些实施方案中,所述衣壳蛋白中与SEQ ID NO:2的氨基酸346对应的氨基酸为A,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R。在某些实施方案中,所述衣壳蛋白中与SEQ ID NO:2的氨基酸501对应的氨基酸为I,所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸706对应的氨基酸为C。在一些实施方案中,AAV进化枝F衣壳蛋白包含SEQ ID NO:2、3、4、5、6、7、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列。
例如,在某些实施方案中,AAV进化枝F衣壳蛋白包含与SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的氨基酸序列。在某些实施方案中,AAV进化枝F衣壳蛋白包含与SEQID NO:2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,其中:所述衣壳蛋白中与SEQ IDNO:2的氨基酸2对应的氨基酸为T;所述衣壳蛋白中与SEQ ID NO:2的氨基酸65对应的氨基酸为I;所述衣壳蛋白中与SEQ ID NO:2的氨基酸68对应的氨基酸为V;所述衣壳蛋白中与SEQ ID NO:2的氨基酸77对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸119对应的氨基酸为L;所述衣壳蛋白中与SEQ ID NO:2的氨基酸151对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸160对应的氨基酸为D;所述衣壳蛋白中与SEQ ID NO:2的氨基酸206对应的氨基酸为C;所述衣壳蛋白中与SEQ ID NO:2的氨基酸296对应的氨基酸为H;所述衣壳蛋白中与SEQ ID NO:2的氨基酸312对应的氨基酸为Q;所述衣壳蛋白中与SEQ IDNO:2的氨基酸346对应的氨基酸为A;所述衣壳蛋白中与SEQ ID NO:2的氨基酸464对应的氨基酸为N;所述衣壳蛋白中与SEQ ID NO:2的氨基酸468对应的氨基酸为S;所述衣壳蛋白中与SEQ ID NO:2的氨基酸501对应的氨基酸为I;所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸590对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸626对应的氨基酸为G或Y;所述衣壳蛋白中与SEQ IDNO:2的氨基酸681对应的氨基酸为M;所述衣壳蛋白中与SEQ ID NO:2的氨基酸687对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸690对应的氨基酸为K;所述衣壳蛋白中与SEQ ID NO:2的氨基酸706对应的氨基酸为C;或,所述衣壳蛋白中与SEQ ID NO:2的氨基酸718对应的氨基酸为G。在某些实施方案中,所述衣壳蛋白中与SEQ ID NO:2的氨基酸2对应的氨基酸为T,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸312对应的氨基酸为Q。在某些实施方案中,所述衣壳蛋白中与SEQ ID NO:2的氨基酸65对应的氨基酸为I,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸626对应的氨基酸为Y。在某些实施方案中,所述衣壳蛋白中与SEQ ID NO:2的氨基酸77对应的氨基酸为R,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸690对应的氨基酸为K。在某些实施方案中,所述衣壳蛋白中与SEQ ID NO:2的氨基酸119对应的氨基酸为L,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸468对应的氨基酸为S。在某些实施方案中,所述衣壳蛋白中与SEQ ID NO:2的氨基酸626对应的氨基酸为G,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸718对应的氨基酸为G。在某些实施方案中,所述衣壳蛋白中与SEQ ID NO:2的氨基酸296对应的氨基酸为H,所述衣壳蛋白中与SEQ ID NO:2的氨基酸464对应的氨基酸为N,所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸681对应的氨基酸为M。在某些实施方案中,所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R,并且所述衣壳蛋白中与SEQID NO:2的氨基酸687对应的氨基酸为R。在某些实施方案中,所述衣壳蛋白中与SEQ ID NO:2的氨基酸346对应的氨基酸为A,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R。在某些实施方案中,所述衣壳蛋白中与SEQ ID NO:2的氨基酸501对应的氨基酸为I,所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸706对应的氨基酸为C。在某些实施方案中,AAV进化枝F衣壳蛋白包含SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、15、15、16或17的氨基酸1-736的氨基酸序列。
在某些实施方案中,AAV衣壳包含以下两种或更多种:(a)进化枝F衣壳蛋白,其包含SEQ ID NO:2、3、4、6、7、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列;(b)进化枝F衣壳蛋白,其包含SEQ ID NO:2、3、4、5、6、7、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列;和(c)进化枝F衣壳蛋白,其包含SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列。在某些实施方案中,AAV衣壳包含:(a)进化枝F衣壳蛋白,其具有由SEQ ID NO:2、3、4、6、7、10、11、12、13、15、16或17的氨基酸203-736组成的氨基酸序列;(b)进化枝F衣壳蛋白,其具有由SEQ ID NO:2、3、4、5、6、7、9、10、11、12、13、15、16或17的氨基酸138-736组成的氨基酸序列;和(c)进化枝F衣壳蛋白,其具有由SEQID NO:2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736组成的氨基酸序列。
在某些实施方案中,AAV衣壳包含以下一种或多种:(a)进化枝F衣壳蛋白,其包含与SEQ ID NO:8的氨基酸203-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的氨基酸序列;(b)进化枝F衣壳蛋白,其包含与SEQ ID NO:8的氨基酸138-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的氨基酸序列;和(c)进化枝F衣壳蛋白,其包含与SEQ ID NO:8的氨基酸1-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的氨基酸序列。在某些实施方案中,AAV衣壳包含以下一种或多种:(a)进化枝F衣壳蛋白,其包含SEQ ID NO:8的氨基酸203-736的氨基酸序列;(b)进化枝F衣壳蛋白,其包含SEQ ID NO:8的氨基酸138-736的氨基酸序列;和(c)进化枝F衣壳蛋白,其包含SEQ ID NO:8的氨基酸1-736的氨基酸序列。在某些实施方案中,AAV衣壳包含以下两种或更多种:(a)进化枝F衣壳蛋白,其包含SEQ ID NO:8的氨基酸203-736的氨基酸序列;(b)进化枝F衣壳蛋白,其包含SEQ ID NO:8的氨基酸138-736的氨基酸序列;和(c)进化枝F衣壳蛋白,其包含SEQ ID NO:8的氨基酸1-736的氨基酸序列。在某些实施方案中,AAV衣壳包含:(a)进化枝F衣壳蛋白,其具有由SEQ ID NO:8的氨基酸203-736组成的氨基酸序列;(b)进化枝F衣壳蛋白,其具有由SEQ ID NO:8的氨基酸138-736组成的氨基酸序列;和(c)进化枝F衣壳蛋白,其具有由SEQ ID NO:8的氨基酸1-736组成的氨基酸序列。
在某些实施方案中,AAV衣壳包含以下一种或多种:(a)进化枝F衣壳蛋白,其包含与SEQ ID NO:11的氨基酸203-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的氨基酸序列;(b)进化枝F衣壳蛋白,其包含与SEQ ID NO:11的氨基酸138-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的氨基酸序列;和(c)进化枝F衣壳蛋白,其包含与SEQ ID NO:11的氨基酸1-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的氨基酸序列。在某些实施方案中,AAV衣壳包含以下一种或多种:(a)进化枝F衣壳蛋白,其包含SEQ ID NO:11的氨基酸203-736的氨基酸序列;(b)进化枝F衣壳蛋白,其包含SEQ ID NO:11的氨基酸138-736的氨基酸序列;和(c)进化枝F衣壳蛋白,其包含SEQ IDNO:11的氨基酸1-736的氨基酸序列。在某些实施方案中,AAV衣壳包含以下两种或更多种:(a)进化枝F衣壳蛋白,其包含SEQ ID NO:11的氨基酸203-736的氨基酸序列;(b)进化枝F衣壳蛋白,其包含SEQ ID NO:11的氨基酸138-736的氨基酸序列;和(c)进化枝F衣壳蛋白,其包含SEQ ID NO:11的氨基酸1-736的氨基酸序列。在某些实施方案中,AAV衣壳包含:(a)进化枝F衣壳蛋白,其具有由SEQ ID NO:11的氨基酸203-736组成的氨基酸序列;(b)进化枝F衣壳蛋白,其具有由SEQ ID NO:11的氨基酸138-736组成的氨基酸序列;和(c)进化枝F衣壳蛋白,其具有由SEQ ID NO:11的氨基酸1-736组成的氨基酸序列。
在某些实施方案中,AAV衣壳包含以下一种或多种:(a)进化枝F衣壳蛋白,其包含与SEQ ID NO:13的氨基酸203-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的氨基酸序列;(b)进化枝F衣壳蛋白,其包含与SEQ ID NO:13的氨基酸138-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的氨基酸序列;和(c)进化枝F衣壳蛋白,其包含与SEQ ID NO:13的氨基酸1-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的氨基酸序列。在某些实施方案中,AAV衣壳包含以下一种或多种:(a)进化枝F衣壳蛋白,其包含SEQ ID NO:13的氨基酸203-736的氨基酸序列;(b)进化枝F衣壳蛋白,其包含SEQ ID NO:13的氨基酸138-736的氨基酸序列;和(c)进化枝F衣壳蛋白,其包含SEQ IDNO:13的氨基酸1-736的氨基酸序列。在某些实施方案中,AAV衣壳包含以下两种或更多种:(a)进化枝F衣壳蛋白,其包含SEQ ID NO:13的氨基酸203-736的氨基酸序列;(b)进化枝F衣壳蛋白,其包含SEQ ID NO:13的氨基酸138-736的氨基酸序列;和(c)进化枝F衣壳蛋白,其包含SEQ ID NO:13的氨基酸1-736的氨基酸序列。在某些实施方案中,AAV衣壳包含:(a)进化枝F衣壳蛋白,其具有由SEQ ID NO:13的氨基酸203-736组成的氨基酸序列;(b)进化枝F衣壳蛋白,其具有由SEQ ID NO:13的氨基酸138-736组成的氨基酸序列;和(c)进化枝F衣壳蛋白,其具有由SEQ ID NO:13的氨基酸1-736组成的氨基酸序列。
在某些实施方案中,AAV衣壳包含以下一种或多种:(a)进化枝F衣壳蛋白,其包含与SEQ ID NO:16的氨基酸203-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的氨基酸序列;(b)进化枝F衣壳蛋白,其包含与SEQ ID NO:16的氨基酸138-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的氨基酸序列;和(c)进化枝F衣壳蛋白,其包含与SEQ ID NO:16的氨基酸1-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的氨基酸序列。在某些实施方案中,AAV衣壳包含以下一种或多种:(a)进化枝F衣壳蛋白,其包含SEQ ID NO:16的氨基酸203-736的氨基酸序列;(b)进化枝F衣壳蛋白,其包含SEQ ID NO:16的氨基酸138-736的氨基酸序列;和(c)进化枝F衣壳蛋白,其包含SEQ IDNO:16的氨基酸1-736的氨基酸序列。在某些实施方案中,AAV衣壳包含以下两种或更多种:(a)进化枝F衣壳蛋白,其包含SEQ ID NO:16的氨基酸203-736的氨基酸序列;(b)进化枝F衣壳蛋白,其包含SEQ ID NO:16的氨基酸138-736的氨基酸序列;和(c)进化枝F衣壳蛋白,其包含SEQ ID NO:16的氨基酸1-736的氨基酸序列。在某些实施方案中,AAV衣壳包含:(a)进化枝F衣壳蛋白,其具有由SEQ ID NO:16的氨基酸203-736组成的氨基酸序列;(b)进化枝F衣壳蛋白,其具有由SEQ ID NO:16的氨基酸138-736组成的氨基酸序列;和(c)进化枝F衣壳蛋白,其具有由SEQ ID NO:16的氨基酸1-736组成的氨基酸序列。
可用于本文公开的AAV组合物中的转移基因组通常包含可操作地连接至PAH编码序列的转录调节元件(TRE)。在某些实施方案中,转移基因组包含TRE和PAH编码序列5’的5’反向末端重复(5’ITR)核苷酸序列和TRE和PAH编码序列3’的3’反向末端重复(3’ITR)核苷酸序列。
在某些实施方案中,PAH编码序列包含PAH基因的整个或基本上整个编码序列。在某些实施方案中,转移基因组包含编码SEQ ID NO:23的核苷酸序列,并且可以任选地进一步包含PAH编码序列3’的外源聚腺苷酸化序列。在某些实施方案中,编码SEQ ID NO:23的核苷酸序列是野生型的(例如,具有SEQ ID NO:24所示的序列)。在某些实施方案中,编码SEQID NO:23的核苷酸序列被密码子改变(例如,具有SEQ ID NO:25所示的序列)。在某些实施方案中,编码SEQ ID NO:23的核苷酸序列被密码子改变(例如,具有SEQ ID NO:69、70、71、72或73所示的序列)。
在某些实施方案中,PAH编码序列编码包含PAH蛋白的整个或基本上整个氨基酸序列的多肽。在某些实施方案中,PAH编码序列编码野生型PAH蛋白(例如人PAH蛋白)的氨基酸序列。在某些实施方案中,PAH编码序列编码突变体PAH蛋白(例如人PAH蛋白)的氨基酸序列,其中突变体PAH多肽是野生型PAH多肽的功能等同物,即,可以发挥野生型PAH多肽功能。在某些实施方案中,功能上等同的PAH多肽进一步包含在野生型PAH多肽中未发现的至少一种特征,例如,稳定PAH蛋白(例如,二聚体或四聚体)的能力或抗蛋白降解的能力。
转移基因组可用于在任何哺乳动物细胞(例如人细胞)中表达PAH。因此,TRE可以在任何哺乳动物细胞(例如人细胞)中具有活性。在某些实施方案中,TRE在一大批人类细胞中具有活性。此类TRE可包含组成性启动子和/或增强子元件,包括巨细胞病毒(CMV)启动子/增强子(例如,包含与SEQ ID NO:58至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列)、SV40启动子,鸡β肌动蛋白(CBA)启动子(例如,包含与SEQ ID NO:59至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列)、人类延伸因子1α(EF1α)启动子(例如,包含与SEQ ID NO:40至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列)、包含转录因子结合位点的小鼠细小病毒(MVM)内含子(例如,包含与SEQ ID NO:35至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列)、人磷酸甘油酸激酶(PGK1)启动子、人泛素C(Ubc)启动子、人β肌动蛋白启动子、人神经元特异性烯醇化酶(ENO2)启动子、人β-葡糖醛酸糖苷酶(GUSB)启动子、兔β-珠蛋白元件(例如,包含与SEQ IDNO:60至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列)和/或人甲基CpG结合蛋白2(MeCP2)启动子。这些TRE中的任何一个都可以按任何顺序组合以驱动有效的转录。例如,转移基因组可包含CMV增强子、CBA启动子和来自兔β-珠蛋白基因外显子3的剪接受体,统称为CAG启动子(例如,包含与SEQ ID NO:28至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列)。例如,转移基因组可以包含CMV增强子和CBA启动子的杂合物,然后是剪接供体和剪接受体,统称为CASI启动子区域(例如,包含与SEQ ID NO:63至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列)。
或者,TRE可以是组织特异性的TRE,即它在特定的组织和/或器官中有活性。组织特异性TRE包含一种或多种组织特异性启动子和/或增强子元件,以及任选地一种或多种组成型启动子和/或增强子元件。熟练技术人员将理解,可以通过本领域熟知的方法从组织中特异性表达的基因中分离组织特异性启动子和/或增强子元件。在某些实施方案中,TRE是肝特异性的(例如,肝细胞特异性的)。示例性的肝特异性TRE可包含一种或多种选自下组的元件:人白蛋白启动子、人转甲状腺素蛋白(TTR)启动子(例如,包含与SEQ ID NO:34至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列)、人APOE/C-I肝控制区(HCR)1或2(例如,包含与SEQ ID NO:29或37至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列)、人APOH启动子和人SERPINA1(hAAT)启动子(例如,包含与SEQ ID NO:30或38至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列)或其肝特异性调节模块(例如,包含与SEQ ID NO:33至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列)。在某些实施方案中,hAAT启动子区包含与SEQ ID NO:66至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的核苷酸序列。更多的肝特异性启动子元件在WO 2009/130208和Kramer et al.(Molecular Therapy(2003)7,375–385)中公开,其通过引用完整并入本文。
在某些实施方案中,TRE是肾特异性的(例如,肾上皮细胞特异性的)。示例性的肾特异性TRE可以包含一种或多种选自下组的元件:人肾素(nephrin)启动子、人甲状旁腺激素受体启动子、人尿调节蛋白启动子和人SLC12A1启动子。在某些实施方案中,TRE是脑特异性的(例如神经元特异性、神经胶质细胞特异性、星形胶质细胞特异性、少突胶质细胞特异性、小胶质细胞特异性和/或中枢神经系统特异性)。示例性的脑特异性TRE可以包含一种或多种选自下组的元件:人胶质原纤维酸性蛋白(GFAP)启动子和人突触蛋白1(SYN1)启动子。更多的脑特异性启动子元件在WO 2016/100575A1中公开,其通过引用整体并入本文。
在某些实施方案中,转移基因组包含两个或更多个TRE,任选地包含以上公开的至少一种TRE。本领域技术人员将理解,这些TRE中的任何一个都可以以任何顺序组合,并且组成型TRE和组织特异性TRE的组合可以驱动有效且组织特异性的转录。例如,在某些实施方案中,转移基因组包含人HCR1(例如,包含与SEQ ID NO:29或37至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核苷酸序列)和人EF-1α启动子(例如,包含与SEQID NO:40至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核苷酸序列),任选地其中人HCR1在人EF-1α启动子的5’。在某些实施方案中,转移基因组包含与SEQID NO:41所示序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核苷酸序列。在某些实施方案中,转移基因组包含人HCR1(例如,包含SEQ ID NO:29或37所示的核苷酸序列)和人EF-1α启动子(例如,包含SEQ ID NO:40所示的核苷酸序列),任选地其中人HCR1在人EF-1α启动子的5’。在某些实施方案中,转移基因组包含SEQ ID NO:41所示的序列。
类似地,两个或更多个组织特异性TRE的组合可以驱动有效且组织特异性的转录。例如,在某些实施方案中,转移基因组包含人HCR1(例如,包含与SEQ ID NO:29至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核苷酸序列)和hAAT启动子(例如,包含与SEQ ID NO:30至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核苷酸序列),任选地其中人HCR1在hAAT启动子的5’。在某些实施方案中,转移基因组包含与SEQ ID NO:32所示序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核苷酸序列。在某些实施方案中,转移基因组包含人HCR1(例如,包含SEQ IDNO:29所示的核苷酸序列)和hAAT启动子(例如,包含SEQ ID NO:30所示的核苷酸序列),任选地其中人HCR1在hAAT启动子的5’。在某些实施方案中,转移基因组包含SEQ ID NO:32所示的核苷酸序列。
在某些实施方案中,转移基因组包含hAAT启动子的肝特异性调节模块(例如,包含与SEQ ID NO:33至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核苷酸序列)和人TTR启动子(例如,包含与SEQ ID NO:34至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核苷酸序列),任选地其中肝特异性调节模块在人TTR启动子的5’。在某些实施方案中,转移基因组包含与SEQ ID NO:36所示的序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核苷酸序列。在某些实施方案中,转移基因组包含hAAT启动子的肝特异性调节模块(例如,包含SEQ ID NO:33所示的核苷酸序列)和人TTR启动子(例如,包含SEQ ID NO:34所示的核苷酸序列),任选地其中肝特异性调节模块在人TTR启动子的5’。在某些实施方案中,转移基因组包含SEQ ID NO:36所示的核苷酸序列。
在某些实施方案中,转移基因组包含人HCR1(例如,包含与SEQ ID NO:29或37至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核苷酸序列)和hAAT启动子(例如,包含与SEQ ID NO:30或38至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核苷酸序列),任选地其中人HCR1在hAAT启动子的5’。在某些实施方案中,转移基因组包含与SEQ ID NO:39所示序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核苷酸序列。在某些实施方案中,转移基因组包含人HCR1(例如,包含SEQ ID NO:29或37所示的核苷酸序列)和hAAT启动子(例如,包含SEQ ID NO:30或38所示的核苷酸序列),任选地其中人HCR1在hAAT启动子的5’。在某些实施方案中,转移基因组包含SEQ ID NO:39所示的核苷酸序列。
在某些实施方案中,转移载体进一步包含PAH编码序列5’或插入PAH编码序列中的内含子。此类内含子可以例如通过减少转录沉默并且增强mRNA从细胞核到细胞质的输出来增加转基因表达。在某些实施方案中,转移基因组从5’至3’包含:非编码外显子、内含子和PAH编码序列。在某些实施方案中,将内含子序列插入PAH编码序列中,任选地,其中将内含子插入连接两个天然外显子的核苷酸间键处。在某些实施方案中,将内含子插入连接天然外显子1和外显子2的核苷酸间键处。
内含子可包含PAH基因的天然内含子序列、来自不同物种的内含子序列或来自相同物种的不同基因和/或合成内含子序列。技术人员将理解,可以通过引入本领域已知的任何共有剪接基序来设计合成内含子序列以介导RNA剪接(例如,在Sibley et al.,(2016)Nature Reviews Genetics,17,407-21中,其通过引用完整并入本文)。Lu et al.(2013)Molecular Therapy 21(5):954-63和Lu et al.(2017)Hum.Gene Ther.28(1):125-34中提供了示例性的内含子序列,其通过引用完整并入本文。在某些实施方案中,转移基因组包含SV40内含子(例如,包含与SEQ ID NO:31至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核苷酸序列)或小鼠细小病毒(MVM)内含子(例如,包含与SEQ IDNO:35至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核苷酸序列)。在某些实施方案中,转移基因组包含SV40内含子(例如,包含SEQ ID NO:31所示的核苷酸序列)或小鼠细小病毒(MVM)内含子(例如,包含SEQ ID NO:35所示的核苷酸序列)。
在某些实施方案中,本文公开的转移基因组进一步包含转录终止子(例如,聚腺苷酸化序列)。在某些实施方案中,转录终止子在PAH编码序列的3’。转录终止子可以是有效终止转录的任何序列,并且技术人员将理解,可以从期望PAH编码序列转录的细胞中表达的任何基因中分离出此类序列。在某些实施方案中,转录终止子包含聚腺苷酸化序列。在某些实施方案中,聚腺苷酸化序列与人PAH基因的内源性聚腺苷酸化序列相同或基本相同。在某些实施方案中,聚腺苷酸化序列是外源聚腺苷酸化序列。在某些实施方案中,聚腺苷酸化序列是SV40聚腺苷酸化序列(例如,包含SEQ ID NO:42、43或45所示的核苷酸序列,或与其互补的核苷酸序列)。在某些实施方案中,聚腺苷酸化序列包括SEQ ID NO:43所示的序列。
在某些实施方案中,转移基因组从5’至3’包含:TRE、任选地非编码外显子和内含子、PAH编码序列和聚腺苷酸化序列。在某些实施方案中,TRE与SEQ ID NO:28-30和32-41中的任何一个具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性;内含子与SEQ ID NO:31或35具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性;PAH编码序列与SEQ ID NO:25具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性;和/或聚腺苷酸化序列与SEQ ID NO:42、43和45中的任何一个具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。在某些实施方案中,TRE包含选自SEQ ID NO:28-30和32-41的核苷酸序列;内含子包含选自SEQ ID NO:31和35的核苷酸序列;PAH编码序列包含SEQ ID NO:25所示的序列;和/或聚腺苷酸化序列包含选自SEQ ID NO:42、43和45的核苷酸序列。在某些实施方案中,TRE包含SEQ ID NO:28所示的序列;PAH编码序列包含SEQ ID NO:25所示的序列;和/或聚腺苷酸化序列包含SEQ ID NO:42所示的序列。在某些实施方案中,TRE从5’至3’包含SEQ ID NO:29所示的序列和SEQ ID NO:30所示的序列(例如,TRE包含SEQ ID NO:32所示的序列);内含子包含SEQ ID NO:31所示的序列;PAH编码序列包含SEQ ID NO:25所示的序列;和/或聚腺苷酸化序列包含SEQ ID NO:43所示的序列。在某些实施方案中,TRE从5’至3’包含SEQ ID NO:33所示的序列和SEQ ID NO:34所示的序列(例如,TRE包含SEQ ID NO:36所示的序列);内含子包含SEQ ID NO:35所示的序列;PAH编码序列包含SEQ ID NO:25所示的序列;和/或聚腺苷酸化序列包含SEQ ID NO:45所示的序列。在某些实施方案中,TRE从5’至3’包含SEQ ID NO:37所示的序列和SEQ ID NO:38所示的序列(例如,TRE包含SEQ ID NO:39所示的序列);内含子包含SEQ ID NO:35所示的序列;PAH编码序列包含SEQ ID NO:25所示的序列;和/或聚腺苷酸化序列包含SEQ ID NO:45所示的序列。在某些实施方案中,TRE从5’至3’包含SEQ ID NO:37所示的序列和SEQ ID NO:40所示的序列(例如,TRE包含SEQ ID NO:41所示的序列);和/或聚腺苷酸化序列包括SEQ ID NO:45所示的序列。
在某些实施方案中,转移基因组包含与SEQ ID NO:46、47、48、49、50、61、64、67、74、76、78、80、82、84、86或89至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的序列。在某些实施方案中,转移基因组包含核苷酸SEQ ID NO:46、47、48、49、50、61、64、67、74、76、78、80、82、84、86或89所示的序列。在某些实施方案中,转移基因组由SEQ ID NO:46、47、48、49、50、61、64、67、74、76、78、80、82、84、86或89所示的核苷酸序列组成。在一些实施方案中,转移基因组由SEQ ID NO:47所示的核苷酸序列组成。
在某些实施方案中,本文公开的转移基因组进一步包含TRE的5’的5’反向末端重复(5’ITR)核苷酸序列和PAH编码序列的3’的3’反向末端重复(3’ITR)核苷酸序列。来自任何AAV血清型或其变体的ITR序列可以用于本文公开的转移基因组中。5’和3’ITR可以来自相同血清型的AAV或来自不同血清型的AAV。在本文公开的转移基因组中使用的示例性ITR在本文的SEQ ID NO:18-21、26和27中列出。
在某些实施方案中,5’ITR或3’ITR来自AAV2。在某些实施方案中,5’ITR和3’ITR均来自AAV2。在某些实施方案中,5’ITR核苷酸序列与SEQ ID NO:18具有至少90%(例如,至少95%、至少96%、至少97%、至少98%、至少99%或100%)序列同一性或3’ITR核苷酸序列与SEQ ID NO:19具有至少90%(例如,至少95%、至少96%、至少97%、至少98%、至少99%或100%)序列同一性。在某些实施方案中,5’ITR核苷酸序列与SEQ ID NO:18具有至少90%(例如,至少95%、至少96%、至少97%、至少98%、至少99%或100%)序列同一性并且3’ITR核苷酸序列与SEQ ID NO:19具有至少90%(例如,至少95%、至少96%、至少97%、至少98%、至少99%或100%)序列同一性。在某些实施方案中,转移基因组包含SEQ ID NO:46-50、61、64、67、74、76、78、80、82、84、86和89中任一项所示的核苷酸序列、具有SEQ ID NO:18的序列的5’ITR核苷酸序列和具有SEQ ID NO:19的序列的3’ITR核苷酸序列。
在某些实施方案中,5’ITR或3’ITR来自AAV5。在某些实施方案中,5’ITR和3’ITR均来自AAV5。在某些实施方案中,5’ITR核苷酸序列与SEQ ID NO:20具有至少90%(例如,至少95%、至少96%、至少97%、至少98%、至少99%或100%)序列同一性或3’ITR核苷酸序列与SEQ ID NO:21具有至少90%(例如,至少95%、至少96%、至少97%、至少98%、至少99%或100%)序列同一性。在某些实施方案中,5’ITR核苷酸序列与SEQ ID NO:20具有至少90%(例如,至少95%、至少96%、至少97%、至少98%、至少99%或100%)序列同一性并且3’ITR核苷酸序列与SEQ ID NO:21具有至少90%(例如,至少95%、至少96%、至少97%、至少98%、至少99%或100%)序列同一性。在某些实施方案中,转移基因组包含SEQ ID NO:46-50中任一项所示的核苷酸序列、具有SEQ ID NO:20的序列的5’ITR核苷酸序列和具有SEQID NO:21的序列的3’ITR核苷酸序列。
在某些实施方案中,5’ITR核苷酸序列和3’ITR核苷酸序列彼此基本互补(例如,除了在5’或3’ITR中的1、2、3、4或5个核苷酸位置处的错配外彼此互补)。
在某些实施方案中,通过Rep蛋白(“非可解析的ITR”)修饰5’ITR或3’ITR以降低或消除解析。在某些实施方案中,非可解析的ITR在末端解析位点的核苷酸序列中包含插入、缺失或取代。此类修饰允许在转移基因组在感染的细胞中复制后形成AAV的自互补双链DNA基因组。示例性的非可解析的ITR序列在本领域中是已知的(参见例如美国专利号7,790,154和9,783,824中提供的那些,其通过引用整体并入本文)。在某些实施方案中,5’ITR包含与SEQ ID NO:26至少95%、96%、97%、98%或99%相同的核苷酸序列。在某些实施方案中,5’ITR由与SEQ ID NO:26至少95%,96%,97%,98%或99%相同的核苷酸序列组成。在某些实施方案中,5’ITR由SEQ ID NO:26所示的核苷酸序列组成。在某些实施方案中,3’ITR包含与SEQ ID NO:27至少95%、96%、97%、98%或99%相同的核苷酸序列。在某些实施方案中,5’ITR由与SEQ ID NO:27至少95%,96%,97%,98%或99%相同的核苷酸序列组成。在某些实施方案中,3’ITR由SEQ ID NO:27所示的核苷酸序列组成。在某些实施方案中,5’ITR由SEQ ID NO:26所示的核苷酸序列组成,并且3’ITR由SEQ ID NO:27所示的核苷酸序列组成。在某些实施方案中,5’ITR由SEQ ID NO:26所示的核苷酸序列组成,并且3’ITR由SEQ IDNO:19所示的核苷酸序列组成。
在某些实施方案中,3’ITR侧翼有衍生自野生型AAV2基因组序列的另外的核苷酸序列。在某些实施方案中,3’ITR侧翼有衍生自与野生型AAV2 ITR相邻的野生型AAV2序列的另外37bp序列。参见,例如Savy et al.,Human Gene Therapy Methods(2017)28(5):277-289(其在此通过引用完整并入本文)。在某些实施方案中,另外的37bp序列在3’ITR内部。在某些实施方案中,37bp序列由SEQ ID NO:56所示的序列组成。在某些实施方案中,3’ITR包含与SEQ ID NO:57至少95%、96%、97%、98%或99%相同的核苷酸序列。在某些实施方案中,3’ITR包含SEQ ID NO:57所示的核苷酸序列。在某些实施方案中,3’ITR的核苷酸序列由与SEQ ID NO:57至少95%、96%、97%、98%或99%相同的核苷酸序列组成。在某些实施方案中,3’ITR的核苷酸序列由SEQ ID NO:57所示的核苷酸序列组成。
在某些实施方案中,转移基因组从5’至3’包含:5’ITR;内部元件,其从5’至3’包含:TRE,任选地非编码外显子和内含子、PAH编码序列和聚腺苷酸化序列,如本文所公开的;非可解析的ITR;与内部元件互补的核苷酸序列;和3’ITR。此类转移基因组可以在感染之后并且在复制之前形成AAV的自互补双链DNA基因组。
在某些实施方案中,转移基因组从5’至3’包含:5’ITR,TRE,任选地非编码外显子和内含子、PAH编码序列、聚腺苷酸化序列和3’ITR。在某些实施方案中,5’ITR与SEQ ID:18、20或26具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性;TRE与SEQ ID NO:28-30和32-41中的任何一个具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性;内含子与SEQ ID NO:31或35具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性;PAH编码序列与SEQ ID NO:25具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性;聚腺苷酸化序列与SEQ ID NO:42、43和45中的任何一个具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性;和/或3’ITR与SEQ ID:19、21或27具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性,在某些实施方案中,5’ITR包含选自SEQ ID NO:18、20和26的核苷酸序列或由选自SEQ ID NO:18、20和26的核苷酸序列组成;TRE包含选自SEQ ID NO:28-30和32-41的核苷酸序列;内含子包含选自SEQ IDNO:31和35的核苷酸序列;PAH编码序列包含SEQ ID NO:25所示的序列;聚腺苷酸化序列包含选自SEQ ID NO:42、43和45的核苷酸序列;和/或3’ITR包含选自SEQ ID NO:19、21和27的核苷酸序列或由选自SEQ ID NO:19、21和27的核苷酸序列组成。在某些实施方案中,5’ITR包含SEQ ID NO:18所示的序列或由SEQ ID NO:18所示的序列组成;TRE包含SEQ ID NO:28所示的序列;PAH编码序列包含SEQ ID NO:25所示的序列;聚腺苷酸化序列包含SEQ ID NO:42所示的序列;和/或3’ITR包含SEQ ID NO:19所示的序列或由SEQ ID NO:19所示的序列组成。在某些实施方案中,5'ITR包含SEQ ID NO:26所示的序列或由SEQ ID NO:26所示的序列组成;TRE从5’至3’包含SEQ ID NO:29所示的序列和SEQ ID NO:30所示的序列(例如TRE包含SEQ ID NO:32所示的序列);内含子包含SEQ ID NO:31所示的序列;PAH编码序列包含SEQID NO:25所示的序列;聚腺苷酸化序列包含SEQ ID NO:43所示的序列和/或3'ITR包含SEQID NO:27所示的序列或由SEQ ID NO:27所示的序列组成。在某些实施方案中,5'ITR包含SEQ ID NO:18所示的序列或由SEQ ID NO:18所示的序列组成;TRE从5’至3’包含SEQ IDNO:33所示的序列和SEQ ID NO:34所示的序列(例如TRE包含SEQ ID NO:36所示的序列);内含子包含SEQ ID NO:35所示的序列;PAH编码序列包含SEQ ID NO:25所示的序列;聚腺苷酸化序列包含SEQ ID NO:45所示的序列;和/或3'ITR包含SEQ ID NO:19所示的序列或由SEQID NO:19所示的序列组成。在某些实施方案中,5'ITR包含SEQ ID NO:18所示的序列或由SEQ ID NO:18所示的序列组成;TRE从5’至3’包含SEQ ID NO:37所示的序列和SEQ ID NO:38所示的序列(例如TRE包含SEQ ID NO:39所示的序列);内含子包含SEQ ID NO:35所示的序列;PAH编码序列包含SEQ ID NO:25所示的序列;聚腺苷酸化序列包含SEQ ID NO:45所示的序列;和/或3'ITR包含SEQ ID NO:19所示的序列或由SEQ ID NO:19所示的序列组成。在某些实施方案中,5'ITR包含SEQ ID NO:18所示的序列或由SEQ ID NO:18所示的序列组成;TRE从5’至3’包含SEQ ID NO:37所示的序列和SEQ ID NO:40所示的序列(例如TRE包含SEQID NO:41所示的序列);聚腺苷酸化序列包含SEQ ID NO:45所示的序列;和/或3'ITR包含SEQ ID NO:19所示的序列或由SEQ ID NO:19所示的序列组成。
在某些实施方案中,转移基因组包含与SEQ ID NO:51、52、53、54、55、62、65、68、75、77、79、81、83、85、87或90至少80%(例如,至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%)相同的序列。在某些实施方案中,转移基因组包含SEQ ID NO:51、52、53、54、55、62、65、68、75、77、79、81、83、85、87或90所示的序列。在某些实施方案中,转移基因组包含SEQ ID NO:52所示的序列。在某些实施方案中,转移基因组由SEQ ID NO:51、52、53、54、55、62、65、68、75、77、79、81、83、85、87或90所示的序列组成。在某些实施方案中,转移基因组由SEQ ID NO:52所示的序列组成。
在某些实施方案中,复制缺陷型AAV包含:(a)包含SEQ ID NO:16的氨基酸203-736的氨基酸序列的AAV衣壳蛋白和转移基因组,其5’至3’包含以下遗传元件:5’ITR元件(例如SEQ ID NO:26的5’ITR)、人HCR1(例如SEQ ID NO:29的HCR1)、hAAT启动子(例如SEQ ID NO:30的hAAT启动子)、SV40内含子(例如SEQ ID NO:31的SV40内含子)、沉默改变的人PAH编码序列(例如SEQ ID NO:25的PAH编码序列)、SV40聚腺苷酸化序列(例如,SEQ ID NO:43的SV40聚腺苷酸化序列)和3’ITR元件(例如SEQ ID NO:27的3’ITR);(b)包含SEQ ID NO:16的氨基酸138-736的氨基酸序列的AAV衣壳蛋白和转移基因组,其5’至3’包含以下遗传元件:5’ITR元件(例如5'SEQ ID NO:26的ITR)、人HCR1(例如SEQ ID NO:29的HCR1)、hAAT启动子(例如SEQ ID NO:30的hAAT启动子)、SV40内含子(例如SEQ ID NO:31的SV40内含子)、沉默改变的人PAH编码序列(例如SEQ ID NO:25的PAH编码序列)、SV40聚腺苷酸化序列(例如SEQID NO:43的SV40聚腺苷酸化序列)和3'ITR元件(例如SEQ ID NO:27的3'ITR和/或(c)包含SEQ ID NO:16氨基酸序列的AAV衣壳蛋白和转移基因组,其5’至3’包含以下遗传元件:5’ITR元件(例如SEQ ID NO:26的5’ITR)、人HCR1(例如SEQ ID NO:29的HCR1)、hAAT启动子(例如SEQ ID NO:30的hAAT启动子)、SV40内含子(例如,SEQ ID NO:31的SV40内含子)、沉默改变的人PAH编码序列(例如SEQ ID NO:25的PAH编码序列)、SV40聚腺苷酸化序列(例如SEQID NO:43的SV40聚腺苷酸化序列)和3’ITR元件(例如SEQ ID NO:27的3’ITR)。
在某些实施方案中,复制缺陷型AAV包含:(a)包含SEQ ID NO:16的氨基酸203-736的氨基酸序列的AAV衣壳蛋白和转移基因组,其包含SEQ ID NO:24、25、46、47、48、49、50、51、52、53、54、55、61、62、64、65、67、68、74、75、76、77、78、79、80、81、82、83、84、85、86、87、89或90的任一项所示的核苷酸序列;(b)包含SEQ ID NO:16的氨基酸138-736的氨基酸序列的AAV衣壳蛋白和转移基因组,其包含SEQ ID NO:24、25、46、47、48、49、50、51、52、53、54、55、61、62、64、65、67、68、74、75、76、77、78、79、80、81、82、83、84、85、86、87、89或90的任一项所示的核苷酸序列;和/或(c)包含SEQ ID NO:16的氨基酸序列的AAV衣壳蛋白和转移基因组,其包含SEQ ID NO:24、25、46、47、48、49、50、51、52、53、54、55、61、62、64、65、67、68、74、75、76、77、78、79、80、81、82、83、84、85、86、87、89或90的任一项所示的核苷酸序列。
在另一方面,本文提供了包含核酸序列的多核苷酸,该核酸序列与SEQ ID NO:88、91或92所示的核酸序列是至少80%(例如,至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%)相同的。在某些实施方案中,多核苷酸包含SEQ ID NO:88、91或92所示的核酸序列。在某些实施方案中,多核苷酸包含SEQ ID NO:92所示的核酸序列。在某些实施方案中,多核苷酸由SEQ ID NO:88、91或92所示的核酸序列组成。在某些实施方案中,多核苷酸由SEQ ID NO:92所示的核酸序列组成。
另一方面,本公开提供了药物组合物,其包含如本文所公开的AAV以及药学上可接受的赋形剂、佐剂、稀释剂、媒介物或载体或其组合。“药学上可接受的载体”包括当与组合物的活性成分组合时允许该成分保留生物活性并且不引起破坏性生理反应,例如非预期的免疫反应的任何物质。药学上可接受的载体包括水、磷酸盐缓冲盐水、乳剂(例如油/水乳剂)和润湿剂。包含此类载体的组合物是通过众所周知的常规方法配制的,例如在Remington’s Pharmaceutical Sciences,当前版,Mack Publishing Co.,EastonPa.18042,USA;A.Gennaro(2000)“Remington:The Science and Practice of Pharmacy”,第20版,Lippincott,Williams,&Wilkins;Pharmaceutical Dosage Forms and DrugDelivery Systems(1999)H.C.Ansel编,第7版,Lippincott,Williams,&Wilkins;和Handbook of Pharmaceutical Excipients(2000)A.H.Kibbe et al,第3版Amer.Pharmaceutical Assoc中列出的那些。
在另一方面,本公开提供了包含编码人PAH蛋白或其片段的编码序列的多核苷酸,其中该编码序列已经被密码子改变为与野生型人PAH基因具有小于100%(例如,小于95%、90%、85%、80%、75%、70%、65%、60%、55%或50%)同一性。在某些实施方案中,多核苷酸包含SEQ ID NO:25所示的序列。在某些实施方案中,多核苷酸包含SEQ ID NO:25所示的序列的核苷酸4至1359。多核苷酸可包含DNA、RNA、经修饰的DNA、经修饰的RNA或其组合。在某些实施方案中,多核苷酸是表达载体。
III.使用方法
在另一方面,本公开提供了用于在细胞中表达PAH多肽的方法。该方法通常包括用如本文公开的复制缺陷型AAV转导细胞。此类方法在恢复PAH表达方面非常有效。因此,在某些实施方案中,本文公开的方法涉及用如本文公开的复制缺陷型AAV转导细胞。
本文公开的方法可以应用于在PAH基因中含有突变的任何细胞。技术人员将认识到,在Phe代谢中有活性的细胞是特别令人感兴趣的。因此,在某些实施方案中,该方法应用于肝、肾、脑、垂体、肾上腺、胰腺、膀胱、胆囊、结肠、小肠或乳房中的细胞。在某些实施方案中,该方法应用于肝细胞和/或肾细胞。
本文公开的方法可以出于研究目的在体外进行或者可以出于治疗目的离体或体内进行。
在某些实施方案中,待转导的细胞在哺乳动物受试者中,并且以有效转导该受试者中的细胞的量向该受试者施用AAV。因此,在某些实施方案中,本公开提供了用于治疗患有与PAH基因突变相关的疾病或病症的受试者的方法,该方法通常包括向受试者施用有效量的如本文所公开的复制缺陷型AAV。受试者可以是具有PAH突变的人类受试者、非人类灵长类动物受试者(例如,食蟹猴)或啮齿动物受试者(例如,小鼠),或含有PAH突变体人肝细胞的非人类灵长类动物受试者(例如,食蟹猴)或啮齿动物受试者(例如小鼠)。合适的小鼠受试者包括但不限于已植入人肝细胞(例如人肝细胞)的小鼠。可以使用本文公开的方法治疗与PAH基因突变有关的任何疾病或病症。合适的疾病或病症包括但不限于苯丙酮尿。
在某些实施方案中,前述方法采用复制缺陷型AAV,其包含:(a)包含SEQ ID NO:16的氨基酸203-736的氨基酸序列的AAV衣壳蛋白以及转移基因组,其5’至3’包含以下遗传元件:5’ITR元件(例如SEQ ID NO:26的5’ITR)、人HCR1(例如SEQ ID NO:29的HCR1)、hAAT启动子(例如SEQ ID NO:30的hAAT启动子)、SV40内含子(例如,SEQ ID NO:31的SV40内含子)、沉默改变的人PAH编码序列(例如,SEQ ID NO:25的PAH编码序列)、SV40聚腺苷酸化序列(例如,SEQ ID NO:43的SV40聚腺苷酸化序列)和3’ITR元件(例如,SEQ ID NO:27的3’ITR);(b)包含SEQ ID NO:16的氨基酸138-736的氨基酸序列的AAV衣壳蛋白以及转移基因组,其5’至3’包含以下遗传元件:5’ITR元件(例如SEQ ID NO:26的5’ITR)、人HCR1(例如SEQ ID NO:29的HCR1)、hAAT启动子(例如SEQ ID NO:30的hAAT启动子)、SV40内含子(例如SEQ ID NO:31的SV40内含子)、沉默改变的人PAH编码序列(例如SEQ ID NO:25的PAH编码序列)、SV40聚腺苷酸化序列(例如SEQ ID NO:43的SV40聚腺苷酸化序列)和3'ITR元件(例如SEQ ID NO:27的3'ITR);和/或(c)包含SEQ ID NO:16的氨基酸序列的AAV衣壳蛋白以及转移基因组,其5’至3’包含以下遗传元件:5’ITR元件(例如SEQ ID NO:26的5’ITR)、人HCR1(例如SEQ ID NO:29的HCR1)、hAAT启动子(例如SEQ ID NO:30的hAAT启动子)、SV40内含子(例如,SEQ ID NO:31的SV40内含子)、沉默改变的人PAH编码序列(例如SEQ ID NO:25的PAH编码序列)、SV40聚腺苷酸化序列(例如SEQ ID NO:43的SV40聚腺苷酸化序列)和3’ITR元件(例如SEQ ID NO:27的3’ITR)。
在某些实施方案中,前述方法采用复制缺陷型AAV,其包含:(a)包含SEQ ID NO:16的氨基酸203-736的氨基酸序列的AAV衣壳蛋白以及转移基因组,其包含SEQ ID NO:24、25、46、47、48、49、50、51、52、53、54、55、61、62、64、65、67、68、74、75、76、77、78、79、80、81、82、83、84、85、86、87、89或90的任一项所示的核苷酸序列;(b)包含SEQ ID NO:16的氨基酸138-736的氨基酸序列的AAV衣壳蛋白以及转移基因组,其包含SEQ ID NO:24、25、46、47、48、49、50、51、52、53、54、55、61、62、64、65、67、68、74、75、76、77、78、79、80、81、82、83、84、85、86、87、89或90的任一项所示的核苷酸序列;和/或(c)包含SEQ ID NO:16的氨基酸序列的AAV衣壳蛋白以及转移基因组,其包含SEQ ID NO:24、25、46、47、48、49、50、51、52、53、54、55、61、62、64、65、67、68、74、75、76、77、78、79、80、81、82、83、84、85、86、87、89或90的任一项所示的核苷酸序列。
本文公开的方法特别有利之处在于,它们能够在体内和体外在细胞中高效表达PAH蛋白。在某些实施方案中,PAH蛋白的表达水平是PAH基因中没有突变的同一类型细胞中的内源性PAH蛋白表达水平的至少10%、20%、30%、40%、50%、60%、70%、80%、90%或100%。在某些实施方案中,PAH蛋白的表达水平比PAH基因中没有突变的同一类型细胞中的内源性PAH蛋白表达水平高至少1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2、3、4、5、6、7、8、9或10倍。可以使用任何确定PAH蛋白表达水平的方法,包括但不限于ELISA、Western印迹法、免疫染色和质谱法。
在某些实施方案中,可以如本文提供的或通过本领域普通技术人员已知的任何转导方法进行用本文公开的AAV组合物转导细胞。在某些实施方案中,可以以50,000;100,000;150,000;200,000;250,000;300,000;350,000;400,000;450,000;或500,000的感染复数(MOI),或任何提供最佳细胞转导的MOI使细胞与AAV接触。
本文公开的AAV组合物可以通过任何合适的途径施用于受试者,所述途径包括但不限于静脉内、腹膜内、皮下、肌内、鼻内、局部或皮内途径。在某些实施方案中,将组合物配制成用于通过静脉内注射或皮下注射施用。
IV.AAV包装系统
在另一方面,本公开提供了用于重组制备本文公开的复制缺陷型AAV的包装系统。此类包装系统通常包括:编码一种或多种AAV Rep蛋白的Rep核苷酸序列;编码如本文公开的一种或多种AAV进化枝F衣壳蛋白的Cap核苷酸序列;和如本文所公开的用于表达PAH基因的转移基因组,其中包装系统在细胞中起作用以将转移基因组封闭在衣壳中以形成AAV。
在某些实施方案中,包装系统包括包含Rep核苷酸序列和Cap核苷酸序列的第一载体,以及包含转移基因组的第二载体。如本文所述的包装系统的上下文中所用,“载体”是指核酸分子,其是用于将核酸引入细胞的媒介物(例如,质粒、病毒、粘粒、人工染色体,等等)。
在本文公开的包装系统中可以采用任何AAV Rep蛋白。在包装系统的某些实施方案中,Rep核苷酸序列编码AAV2 Rep蛋白。合适的AAV2 Rep蛋白包括但不限于Rep 78/68或Rep 68/52。在包装系统的某些实施方案中,编码AAV2 Rep蛋白的核苷酸序列包含编码与SEQ ID NO:22的AAV2 Rep氨基酸序列具有最小百分比同一性的蛋白质的核苷酸序列,其中最小百分比序列同一性在AAV2 Rep蛋白的氨基酸序列的整个长度上为至少70%(例如,至少75%,至少80%,至少85%,至少90%,至少95%,至少98%,至少99%或100%)。在包装系统的某些实施方案中,AAV2 Rep蛋白具有SEQ ID NO:22所示的氨基酸序列。
在包装系统的某些实施方案中,包装系统进一步包含第三载体,例如辅助病毒载体。第三载体可以是独立的第三载体、与第一载体整合或与第二载体整合。在某些实施方案中,第三载体包含编码辅助病毒蛋白的基因。
在包装系统的某些实施方案中,辅助病毒选自腺病毒、疱疹病毒(包括单纯疱疹病毒(HSV))、痘病毒(例如牛痘病毒)、巨细胞病毒(CMV)和杆状病毒。在包装系统的某些实施方案中,在辅助病毒是腺病毒的情况下,腺病毒基因组包含一种或多种选自E1、E2、E4和VA的腺病毒RNA基因。在包装系统的某些实施方案中,在辅助病毒是HSV的情况下,HSV基因组包含一种或多种选自UL5/8/52、ICPO、ICP4、ICP22和UL30/UL42的HSV基因。
在包装系统的某些实施方案中,第一、第二和/或第三载体包含在一个或多个转染质粒内。在某些实施方案中,第一载体和第三载体包含在第一转染质粒内。在某些实施方案中,第二载体和第三载体包含在第二转染质粒内。
在包装系统的某些实施方案中,第一、第二和/或第三载体包含在一种或多种重组辅助病毒中。在某些实施方案中,第一载体和第三载体包含在重组辅助病毒中。在某些实施方案中,第二载体和第三载体包含在重组辅助病毒中。
在另一方面,本公开提供了用于重组制备如本文所述的AAV的方法,其中所述方法包括在用于将转移基因组封闭在衣壳中以形成如本文所述的AAV的起作用的条件下用如所述的包装系统转染或转导细胞。用于重组制备AAV的示例性方法包括瞬时转染(例如,用一种或多种含有如本文所述的第一和第二以及任选地第三载体的转染质粒)、病毒感染(例如,用一种或多种重组辅助病毒,如腺病毒、痘病毒(如牛痘病毒)、疱疹病毒(包括HSV、巨细胞病毒或杆状病毒,其含有如本文所述的第一和第二以及任选地第三载体),以及稳定的生产细胞系转染或感染(例如,用稳定的生产细胞,例如哺乳动物或昆虫细胞,其含有编码一种或多种AAV Rep蛋白的Rep核苷酸序列和/或编码一种或多种如本文所述的AAV进化枝F衣壳蛋白的Cap核苷酸序列,以及用如本文所述的转移基因组,其以转染质粒或重组辅助病毒的形式递送)。
V.实施例
本文公开的重组AAV载体在体外和体内介导高效基因转移。以下实施例证明了使用如本文公开的基于AAV的载体有效恢复PAH基因的表达,该PAH基因在某些人类疾病如苯丙酮尿中被突变。这些实施例作为说明而非限制提供。
实施例1:人PAH转移载体
本实施例提供了人PAH转移载体pHMI-hPAH-TC-004、pHMI-hPAH-TC-025、pHMI-hPAH-TC-010、pHMI-hPAH-TC-011和pHMI-hPAH-TC-012,用于在人或小鼠细胞中表达人PAH。
a)pHMI-hPAH-TC-004
如图1A所示,PAH转移载体pHMI-hPAH-TC-004从5’至3’包含以下遗传元件:5’ITR元件、CAG启动子、沉默改变的人PAH编码序列、SV40聚腺苷酸化序列和3’ITR元件。这些元件的序列在表1中列出。该载体能够在转导有载体的细胞(例如人细胞或小鼠细胞)中表达人PAH蛋白。
表1:人PAH转移载体pHMI-hPAH-TC-004中的遗传元件
遗传元件 SEQ ID NO
5'ITR元件 18
CAG启动子 28
密码子改变的人PAH编码序列 25
SV40聚腺苷酸化序列 42
3'ITR元件 19
转移基因组(从启动子至聚腺苷酸化序列) 46
转移基因组(从5'ITR至3'ITR) 51
b)pHMI-hPAH-TC-025
如图1B所示,PAH转移载体pHMI-hPAH-TC-025从5’至3’包含以下遗传元件:截短的5’ITR元件、人肝控制区1(HCR1)、人α1-抗胰蛋白酶(hAAT)启动子、SV40内含子、沉默改变的人PAH编码序列、SV40聚腺苷酸化序列和经修饰的3’ITR元件。这些元件的序列在表2中列出。截短的5’ITR允许载体在转导入细胞后形成双链AAV基因组。该载体能够在转导有载体的人肝细胞中表达人PAH蛋白。
表2:人PAH转移载体pHMI-hPAH-TC-025中的遗传元件
遗传元件 SEQ ID NO
截短的5'ITR元件 26
人HCR1 29
人α1-抗胰蛋白酶(hAAT)启动子 30
SV40内含子 31
转录调节区,其包含人HCR1和hAAT启动子 32
密码子改变的人PAH编码序列 25
SV40聚腺苷酸化序列 43
经修饰的3'ITR元件 27
转移基因组(从HCR1至聚腺苷酸化序列) 47
转移基因组(从5'ITR至3'ITR) 52
转移载体的完全序列 92
c)pHMI-hPAH-TC-010
如图1C所示,PAH转移载体pHMI-hPAH-TC-010从5’至3’包含以下遗传元件:5’ITR元件、hAAT启动子的肝特异性调节模块、人TTR启动子、经修饰的小鼠细小病毒(MVM)内含子、沉默改变的人PAH编码序列、SV40聚腺苷酸化序列和3’ITR元件。这些元件的序列在表3中列出。该载体能够在转导有载体的细胞(例如人细胞或小鼠细胞)中表达人PAH蛋白,特别是在肝细胞中高水平表达。
表3:人PAH转移载体pHMI-hPAH-TC-010中的遗传元件
Figure BDA0002684444070000381
d)pHMI-hPAH-TC-011
如图1D所示,PAH转移载体pHMI-hPAH-TC-011从5’至3’包含以下遗传元件:5’ITR元件、人HCR1、人α1-抗胰蛋白酶(hAAT)启动子、经修饰的MVM内含子、沉默改变的人PAH编码序列、SV40聚腺苷酸化序列和3’ITR元件。这些元件的序列在表4中列出。该载体能够在转导有载体的人肝细胞中表达人PAH蛋白。
表4:人PAH转移载体pHMI-hPAH-TC-011中的遗传元件
Figure BDA0002684444070000382
Figure BDA0002684444070000391
e)pHMI-hPAH-TC-012
如图1E所示,PAH转移载体pHMI-hPAH-TC-012从5’至3’包含以下遗传元件:5’ITR元件、人肝控制区1(HCR1)、经修饰的人EF-1α启动子、沉默改变的人PAH编码序列、SV40聚腺苷酸化序列和3’ITR元件。这些元件的序列在表5中列出。该载体能够在转导有载体的人肝细胞中表达人PAH蛋白。
表5:人PAH转移载体pHMI-hPAH-TC-012中的遗传元件
Figure BDA0002684444070000392
如通过比较表达载体pCOH-WT-PAH、pCOH-CO-PAH和pHMI-CO-PAH所证明的,沉默改变显著改善PAH蛋白的表达。pCOH-WT-PAH载体包含与SEQ ID NO:24所示的野生型PAH编码序列可操作连接的CAG启动子。pCOH-CO-PAH和pHMI-CO-PAH载体各自包含与SEQ ID NO:25所示的密码子改变的人PAH编码序列可操作连接的CAG启动子。pCOH-CO-PAH和pHMI-CO-PAH载体高度相似。将每种载体转染到天然缺乏PAH的HEK 293细胞中。如图2所示,VG-GT-CO-PAH(“CO-hPAH”)引起人PAH的表达水平比VG-GT-PAH(“WT-hPAH”)高几倍。
本文公开的载体可以包装在AAV进化枝F衣壳,例如AAVHSC5、AAVHSC7、AAVHSC15或AAVHSC17衣壳中。可以将包装的病毒颗粒施用于野生型动物、PAH缺陷动物或具有从由PAH突变引起的苯丙酮尿患者获得的人肝细胞的重组动物。可以通过收集肝脏样品并定量PAH阳性细胞(例如,具有来自载体的独特核苷酸序列的细胞,表达野生型PAH蛋白的细胞或与未接受PAH表达载体的对照组动物的细胞中相比具有更高PAH活性的细胞)的百分比来测量基因转移效率。苯丙氨酸代谢的恢复(其表明PAH表达载体的功效)可以通过测量血液中的Phe水平并观察小鼠的毛色来评估。可以通过测量血清中的天冬氨酸转氨酶(AST)和丙氨酸转氨酶(ALT)的水平来评估病毒颗粒施用的安全性。
实施例2:小鼠模型中的小鼠PAH基因转移
本实施例提供了小鼠PAH转移载体rAAV-CBA-mPAH,其与实施例1中所述的人PAH转移载体pHMI-hPAH-TC-004类似,只是用野生型小鼠PAH编码序列代替密码子改变的人PAH编码序列。该载体能够在转导有载体的细胞(例如人细胞或小鼠细胞)中表达小鼠PAH蛋白。
简而言之,将Pah-/-(PAHenu2)小鼠饲养在透明的聚碳酸酯笼中,在隔离器中具有接触垫。给动物任意提供Picolab Mouse Diet 5058。任意提供用1N HCl酸化至目标pH为2.5-3.0的泉水或自来水。在补充有35mM NaCl、1%蔗糖和0.05%Pluronic F-68的PBS(含Ca和Mg)中制备包装在AAVHSC15衣壳中的载体。通过尾静脉静脉内注射制剂。
在施用PAH转移载体之后(0周:在施用之前),每周通过面静脉穿刺或尾剪断收集血液样品。使样品在室温下凝结至少30分钟,在环境温度下以最小1000xg离心10分钟,并提取血清样品。血清样品贮存于-70℃。通过串联质谱法测量血清苯丙氨酸和酪氨酸水平。
为了收集组织样品,用盐水对动物进行心脏灌注。将肝(尾状叶)、肾(左)、脑、心脏和肌肉(四头肌)组织在液氮中速冻并贮存于-70℃。将速冻的组织在研钵和研杵中的液氮中研磨成粉末,并分成等分试样,以通过qPCR测试PAH表达,以得到载体基因组生物分布。
通过测量治疗动物中的天冬氨酸转氨酶(AST)和丙氨酸转氨酶(ALT)水平来评估rAAV-CBA-mPAH载体的安全性。剂量前和施用病毒颗粒后1周收集血清样品。通过SigmaMAK055和Sigma MAK052 ELISA试剂盒测量AST和ALT的水平。
与野生型小鼠相比,pah-/-小鼠表现出苯丙酮尿,并且具有更浅的毛色。如图3A和3B所示,rAAV-CBA-mPAH载体的施用导致在一周内血清中Phe水平的显著降低,并且Phe水平保持较低,达四周。毛色在一周内也从棕色变成黑色。
在组织样品中也观察到了mPAH的表达。如图4所示,在许多器官中可检测到rAAV-CBA-mPAH载体的DNA,其中每106个细胞的病毒基因组数在肝、心脏和肾中最高。
关于AAV施用的安全性,施用后AST和ALT水平仍然较低(图5A和5B),表明rAAV-CBA-mPAH载体对肝脏无毒。
实施例3:在小鼠模型中的人PAH基因转移
本实施例证明了在实施例1中描述的PAH转移载体在小鼠模型中有效逆转由PAH基因缺乏引起的表型。小鼠模型、AAV包装和制剂以及检查基因转移效率的方法与实施例2中描述的相同。
为了检查五个PAH转移载体在逆转表型中的功效,对于雄性小鼠每kg体重单剂量2.6×1013个载体基因组,或对于雌性小鼠每kg体重6×1013个载体基因组的剂量。pah-/-小鼠表现出血清中苯丙氨酸(Phe)水平升高和酪氨酸(Tyr)水平降低。如图6A-6H所示,五个载体中任一种的施用导致在一周内Phe水平显著降低和Tyr水平升高。该功效在雄性小鼠中持续至少12周,并且在雌性小鼠中持续至少6周。除了pHMI-hPAH-TC-004外,在检查的时间期间,所有载体均维持血清Phe水平的完全降低。
为了检查pHMI-hPAH-TC-025在逆转由PAH基因缺乏引起的表型中的长期功效,对雄性小鼠施用每kg体重单剂量2.6×1013个载体基因组,或者对雌性小鼠施用每kg体重单剂量6×1013个载体基因组。如图6I和6J所示,pHMI-hPAH-TC-025载体的施用导致在1周内Phe水平的显著降低。此种降低在雄性小鼠中持续至少48周,并且在雌性小鼠中持续至少46周。另外,在施用AAV后两周内,施用pHMI-hPAH-TC-004的小鼠的毛色从棕色变为黑色。相对于未施用AAV载体的小鼠,通过ddPCR在注射后4周收集的这些小鼠的肝脏样品中观察到PAHmRNA的增加。通过质谱法还检测到肝脏样品中PAH酶活性的增加。
进一步评估了不同剂量的pHMI-hPAH-TC-025载体的功效。对雄性和雌性小鼠施用每kg体重单剂量2.6×1011、2.6×1012或2.6×1013个载体基因组,并测量Phe和Tyr的血清水平。如图7A-7D所示,每kg体重2.6×1013个载体基因组的剂量比两个较低剂量更显著降低Phe水平并提高Tyr水平,并在雄性和雌性受试者中检测时间期间维持血清Phe水平的完全降低。
实施例3:另外的人PAH转移载体
本实施例提供了用于在人或小鼠细胞中表达人PAH的人PAH转移载体pHMI-hPAH-TC-009、pHMI-hPAH-TC-013和pHMI-hPAH-TC-017。载体图分别显示在图8A、8B和8C中。
a)pHMI-hPAH-TC-009
如图8A所示,PAH转移载体pHMI-hPAH-TC-009从5’至3’包含以下遗传元件:5’ITR元件、CMV增强子、CBA启动子、兔β-珠蛋白元件、人PAH编码序列、聚腺苷酸化序列和3’ITR元件。这些元件的序列在表6中列出。该载体能够在转导有载体的细胞(例如人细胞或小鼠细胞)中表达人PAH蛋白。
表6:人PAH转移载体pHMI-hPAH-TC-009中的遗传元件
遗传元件 SEQ ID NO
5'ITR元件 18
CMV增强子 58
CBA启动子 59
兔β-珠蛋白元件 60
密码子改变的人PAH编码序列 25
聚腺苷酸化序列 45
3'ITR元件 19
转移基因组(从CMV至聚腺苷酸化序列) 61
转移基因组(从5'ITR至3'ITR) 62
b)pHMI-hPAH-TC-013
如图8B所示,PAH转移载体pHMI-hPAH-TC-013从5’至3’包含以下遗传元件:5’ITR元件、CASI启动子区域(包括CMV增强子、CASI启动子和泛素C增强子元件(hUBC外显子))、人PAH编码序列、聚腺苷酸化序列和3’ITR元件。这些元件的序列在表7中列出。该载体能够在转导有载体的细胞(例如人细胞或小鼠细胞)中表达人PAH蛋白。
表7:人PAH转移载体pHMI-hPAH-TC-013中的遗传元件
遗传元件 SEQ ID NO
5'ITR元件 18
CASI启动子区 63
人PAH编码序列 25
聚腺苷酸化序列 45
3'ITR元件 19
转移基因组(从启动子区至聚腺苷酸化序列) 64
转移基因组(从5'ITR至3'ITR) 65
f)pHMI-hPAH-TC-017
如图8C所示,PAH转移载体pHMI-hPAH-TC-017从5’至3’包含以下遗传元件:5’ITR元件、hAAT启动子区域(包括ABMP增强子(与肝中高度表达的9号染色体上的基因相邻的增强子区域,ATG的5’)、TTR增强子、hAAT启动子和MVM内含子)、人PAH编码序列、聚腺苷酸化序列和3’ITR元件。这些元件的序列在表8中列出。该载体能够在转导有载体的细胞(例如人细胞或小鼠细胞)中表达人PAH蛋白。
表8:人PAH转移载体pHMI-hPAH-TC-017中的遗传元件
Figure BDA0002684444070000431
Figure BDA0002684444070000441
对实施例中描述的载体测试在两种不同细胞系中的表达。将5x 105个HEK293细胞(肾;非肝)和5x 105个Huh7细胞(肝脏)分别用各1μg的下列载体转染:pHMI-hPAH-TC-004(PAH-004);pHMI-hPAH-TC-009(PAH-009);pHMI-hPAH-TC-010(PAH-010);pHMI-hPAH-TC-011(PAH-011);pHMI-hPAH-TC-012(PAH-012);pHMI-hPAH-TC-013(PAH-013);pHMI-hPAH-TC-025(LP1);pHMI-hPAH-TC-017(PAH-017)。转染后48小时收集细胞的裂解物。通过用抗PAH抗体(Sigma HPA031642)进行Western印迹法来检测人PAH的表达。如通过抗GAPDH抗体(Millipore MAB 374)检测到的GAPDH蛋白的量用作上样对照。将所有载体的PAH表达水平相对于pHMI-hPAH-TC-004表达水平标准化;从多个独立转染中收集数据并绘制在图9中。图9A显示了Huh7细胞中指定载体的标准化PAH表达水平。图9B显示了HEK293细胞中指定载体的标准化PAH表达水平。
图10A和10B是分别显示雄性和雌性纯合Pah-/-PAHenu2小鼠随时间的血清苯丙氨酸水平的图。分别以2e13 vg/kg和6e13 vg/kg的剂量对雄性和雌性小鼠给药包装在AAVHSC15衣壳中的pHMI-hPAH-TC-010(hPAH-TC-010)、pHMI-hPAH-TC-025(hPAH-TC-025)、pHMI-hPAH-TC-004(hPAH-TC-004)、pHMI-hPAH-TC-011(hPAH-TC-011)或pHMI-hPAH-TC-012(hPAH-TC-012)载体。每周一次,然后在施用后每两周收集血清样品。通过LC-MS/MS评估血清苯丙氨酸浓度。图10C是显示研究中的雄性和雌性纯合Pah-/-PAHenu2小鼠的平均基线血清苯丙氨酸水平的图。数据代表每组总共55只小鼠。
如图10所示,某些载体的施用导致施用一周内Phe水平的显著降低,并且此种降低持续至少45周。图10证明了在小鼠模型中,某些PAH转移载体有效地逆转由PAH基因缺乏引起的表型。小鼠模型、AAV包装和制剂以及检查基因转移效率的方法与本文实施例2中描述的那些相同。AAV载体的大小如下:pHMI-hPAH-TC-010(hPAH-TC-010):2391bp;pHMI-hPAH-TC-025(hPAH-TC-025):2351bp;pHMI-hPAH-TC-004(hPAH-TC-004):3781bp;pHMI-hPAH-TC-011(hPAH-TC-011):3158bp;和pHMI-hPAH-TC-012(hPAH-TC-012):3799bp。
实施例4:另外的人PAH转移载体
本实施例使用PAH转移载体pHMI-hPAH-TC-018、pHMI-hPAH-TC-019、pHMI-hPAH-TC-020、pHMI-hPAH-TC-021、pHMI-hPAH-TC-022和pHMI-hPAH-TC-023检查PAH基因CpG含量对PAH蛋白表达的影响。载体图分别显示在图11A、11B、11C、11D、11E和11F中。这些PAH转移载体包含表9中列出的序列和元件。
表9:PAH转移载体中的遗传元件
Figure BDA0002684444070000451
对本实施例中描述的载体测试HEK293细胞中的表达,但在CBA启动子的控制下。将5x 105个HEK293细胞用各1ug以下载体转染:pHMI-hPAH-TC-004(PAH-TC-004);pHMI-hPAH-TC-009(PAH-TC-009);pHMI-hPAH-TC-018(PAH-TC-018);pHMI-hPAH-TC-019(PAH-TC-019);pHMI-hPAH-TC-020(PAH-TC-020);pHMI-hPAH-TC-021(PAH-TC-021);pHMI-hPAH-TC-022(PAH-TC-022);pHMI-hPAH-TC-023(PAH-TC-023)。转染后48小时收集细胞的裂解物。通过用抗PAH抗体(Sigma HPA031642)进行Western印迹法来检测人PAH的表达。通过抗GAPDH抗体(Millipore MAB 374)检测到的GAPDH蛋白的量用作上样对照。将所有载体的PAH表达水平相对于pHMI-hPAH-TC-004表达水平标准化;数据绘制在图12中。
图13是显示雄性纯合Pah-/-PAHenu2小鼠的血清苯丙氨酸水平随时间的图。已经以2e13 vg/kg对雄性小鼠给药包装在AAVHSC15衣壳中的pHMI-hPAH-TC-018(hPAH-TC-018);pHMI-hPAH-TC-019(hPAH-TC-019);pHMI-hPAH-TC-020(hPAH-TC-020);pHMI-hPAH-TC-021(hPAH-TC-021);pHMI-hPAH-TC-022(hPAH-TC-022);pHMI-hPAH-TC-023(hPAH-TC-023);和pHMI-hPAH-TC-025(hPAH-TC-025)载体。施用后每周收集血清样品。通过LC-MS/MS评估血清苯丙氨酸浓度。
如图13所示,某些载体的施用导致施用一周内Phe水平的显著降低,并且此种降低持续至少25周。小鼠模型、AAV包装和制剂以及检查基因转移效率的方法与本文实施例2中先前描述的那些相同。载体的CpG含量如下:pHMI-hPAH-TC-018(hPAH-TC-018):2;pHMI-hPAH-TC-019(hPAH-TC-019):7;pHMI-hPAH-TC-020(hPAH-TC-020):22;pHMI-hPAH-TC-021(hPAH-TC-021):10;pHMI-hPAH-TC-022(hPAH-TC-022):7;pHMI-hPAH-TC-023(hPAH-TC-023):23;和pHMI-hPAH-TC-025(hPAH-TC-025):60。
实施例5:备选的ITR人PAH转移载体
本实施例提供了用于在人或小鼠细胞中表达人PAH的人PAH转移载体pHMI-01004和pHMI-01008。载体图分别显示在图14A和14B中。这些PAH转移载体包含表10中列出的序列和元件。
表10:PAH转移载体pHMI-01004和pHMI-01008中的遗传元件
Figure BDA0002684444070000461
Figure BDA0002684444070000471
***
本发明不限于本文所述的具体实施方案的范围。实际上,根据前面的描述和附图,除了描述的内容之外,本发明的各种修改对于本领域技术人员而言将变得明显。此类修改旨在落入所附权利要求书的范围内。
本文引用的所有参考文献(例如出版物、专利或专利申请)以全部目的通过引用整体并入本文,其程度就像每个单独的参考文献(例如出版物、专利或专利申请)具体且个别指出通过引用完整并入本文用于所有目的一样。其他实施方案在所附权利要求书之内。
序列表
<110> 同源药物公司
<120> 用于PAH基因转移的腺伴随病毒组合物及其使用方法
<130> 610061: HMT-025PC
<150> US 62/625,150
<151> 2018-02-01
<160> 92
<170> PatentIn version 3.5
<210> 1
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 腺伴随AAV9
<400> 1
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 2
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 新的AAV隔离群
<400> 2
Met Thr Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Gln Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 3
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 新的AAV隔离群
<400> 3
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Gly Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Gly Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 4
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 新的AAV隔离群
<400> 4
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Ile Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Tyr Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 5
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 新的AAV隔离群
<400> 5
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Asp
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 6
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 新的AAV隔离群
<400> 6
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Leu Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Ser Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 7
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 新的AAV隔离群
<400> 7
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Arg Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 8
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 新的AAV隔离群
<400> 8
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Val Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 9
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 新的AAV隔离群
<400> 9
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Arg Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 10
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 新的AAV隔离群
<400> 10
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Cys Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 11
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 新的AAV隔离群
<400> 11
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Arg Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Lys Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 12
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 新的AAV隔离群
<400> 12
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro His Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Asn
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Met Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 13
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 新的AAV隔离群
<400> 13
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 14
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> splice acceptor
<400> 14
ctgacctctt ctcttcctcc cacagg 26
<210> 15
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 新的AAV隔离群
<400> 15
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Arg Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 16
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 新的AAV隔离群
<400> 16
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Ala Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 17
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 新的AAV隔离群
<400> 17
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Ile Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Cys Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 18
<211> 145
<212> DNA
<213> 人工序列
<220>
<223> AAV2 5' ITR
<400> 18
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcct 145
<210> 19
<211> 145
<212> DNA
<213> 人工序列
<220>
<223> AAV2 3' ITR
<400> 19
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgcag agagggagtg gccaa 145
<210> 20
<211> 167
<212> DNA
<213> 人工序列
<220>
<223> AAV5 5' ITR
<400> 20
ctctcccccc tgtcgcgttc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60
agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120
cgcgacaggg gggagagtgc cacactctca agcaaggggg ttttgta 167
<210> 21
<211> 167
<212> DNA
<213> 人工序列
<220>
<223> AAV5 3' ITR
<400> 21
tacaaaacct ccttgcttga gagtgtggca ctctcccccc tgtcgcgttc gctcgctcgc 60
tggctcgttt gggggggtgg cagctcaaag agctgccaga cgacggccct ctggccgtcg 120
cccccccaaa cgagccagcg agcgagcgaa cgcgacaggg gggagag 167
<210> 22
<211> 621
<212> PRT
<213> 人工序列
<220>
<223> AAV2 Rep
<400> 22
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
165 170 175
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
275 280 285
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
305 310 315 320
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
465 470 475 480
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
485 490 495
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
500 505 510
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
515 520 525
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
530 535 540
Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys
545 550 555 560
Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu
565 570 575
Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr
580 585 590
Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp
595 600 605
Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
610 615 620
<210> 23
<211> 452
<212> PRT
<213> 智人
<400> 23
Met Ser Thr Ala Val Leu Glu Asn Pro Gly Leu Gly Arg Lys Leu Ser
1 5 10 15
Asp Phe Gly Gln Glu Thr Ser Tyr Ile Glu Asp Asn Cys Asn Gln Asn
20 25 30
Gly Ala Ile Ser Leu Ile Phe Ser Leu Lys Glu Glu Val Gly Ala Leu
35 40 45
Ala Lys Val Leu Arg Leu Phe Glu Glu Asn Asp Val Asn Leu Thr His
50 55 60
Ile Glu Ser Arg Pro Ser Arg Leu Lys Lys Asp Glu Tyr Glu Phe Phe
65 70 75 80
Thr His Leu Asp Lys Arg Ser Leu Pro Ala Leu Thr Asn Ile Ile Lys
85 90 95
Ile Leu Arg His Asp Ile Gly Ala Thr Val His Glu Leu Ser Arg Asp
100 105 110
Lys Lys Lys Asp Thr Val Pro Trp Phe Pro Arg Thr Ile Gln Glu Leu
115 120 125
Asp Arg Phe Ala Asn Gln Ile Leu Ser Tyr Gly Ala Glu Leu Asp Ala
130 135 140
Asp His Pro Gly Phe Lys Asp Pro Val Tyr Arg Ala Arg Arg Lys Gln
145 150 155 160
Phe Ala Asp Ile Ala Tyr Asn Tyr Arg His Gly Gln Pro Ile Pro Arg
165 170 175
Val Glu Tyr Met Glu Glu Glu Lys Lys Thr Trp Gly Thr Val Phe Lys
180 185 190
Thr Leu Lys Ser Leu Tyr Lys Thr His Ala Cys Tyr Glu Tyr Asn His
195 200 205
Ile Phe Pro Leu Leu Glu Lys Tyr Cys Gly Phe His Glu Asp Asn Ile
210 215 220
Pro Gln Leu Glu Asp Val Ser Gln Phe Leu Gln Thr Cys Thr Gly Phe
225 230 235 240
Arg Leu Arg Pro Val Ala Gly Leu Leu Ser Ser Arg Asp Phe Leu Gly
245 250 255
Gly Leu Ala Phe Arg Val Phe His Cys Thr Gln Tyr Ile Arg His Gly
260 265 270
Ser Lys Pro Met Tyr Thr Pro Glu Pro Asp Ile Cys His Glu Leu Leu
275 280 285
Gly His Val Pro Leu Phe Ser Asp Arg Ser Phe Ala Gln Phe Ser Gln
290 295 300
Glu Ile Gly Leu Ala Ser Leu Gly Ala Pro Asp Glu Tyr Ile Glu Lys
305 310 315 320
Leu Ala Thr Ile Tyr Trp Phe Thr Val Glu Phe Gly Leu Cys Lys Gln
325 330 335
Gly Asp Ser Ile Lys Ala Tyr Gly Ala Gly Leu Leu Ser Ser Phe Gly
340 345 350
Glu Leu Gln Tyr Cys Leu Ser Glu Lys Pro Lys Leu Leu Pro Leu Glu
355 360 365
Leu Glu Lys Thr Ala Ile Gln Asn Tyr Thr Val Thr Glu Phe Gln Pro
370 375 380
Leu Tyr Tyr Val Ala Glu Ser Phe Asn Asp Ala Lys Glu Lys Val Arg
385 390 395 400
Asn Phe Ala Ala Thr Ile Pro Arg Pro Phe Ser Val Arg Tyr Asp Pro
405 410 415
Tyr Thr Gln Arg Ile Glu Val Leu Asp Asn Thr Gln Gln Leu Lys Ile
420 425 430
Leu Ala Asp Ser Ile Asn Ser Glu Ile Gly Ile Leu Cys Ser Ala Leu
435 440 445
Gln Lys Ile Lys
450
<210> 24
<211> 1359
<212> DNA
<213> 智人
<400> 24
atgtccactg cggtcctgga aaacccaggc ttgggcagga aactctctga ctttggacag 60
gaaacaagct atattgaaga caactgcaat caaaatggtg ccatatcact gatcttctca 120
ctcaaagaag aagttggtgc attggccaaa gtattgcgct tatttgagga gaatgatgta 180
aacctgaccc acattgaatc tagaccttct cgtttaaaga aagatgagta tgaatttttc 240
acccatttgg ataaacgtag cctgcctgct ctgacaaaca tcatcaagat cttgaggcat 300
gacattggtg ccactgtcca tgagctttca cgagataaga agaaagacac agtgccctgg 360
ttcccaagaa ccattcaaga gctggacaga tttgccaatc agattctcag ctatggagcg 420
gaactggatg ctgaccaccc tggttttaaa gatcctgtgt accgtgcaag acggaagcag 480
tttgctgaca ttgcctacaa ctaccgccat gggcagccca tccctcgagt ggaatacatg 540
gaggaagaaa agaaaacatg gggcacagtg ttcaagactc tgaagtcctt gtataaaacc 600
catgcttgct atgagtacaa tcacattttt ccacttcttg aaaagtactg tggcttccat 660
gaagataaca ttccccagct ggaagacgtt tctcaattcc tgcagacttg cactggtttc 720
cgcctccgac ctgtggctgg cctgctttcc tctcgggatt tcttgggtgg cctggccttc 780
cgagtcttcc actgcacaca gtacatcaga catggatcca agcccatgta tacccccgaa 840
cctgacatct gccatgagct gttgggacat gtgcccttgt tttcagatcg cagctttgcc 900
cagttttccc aggaaattgg ccttgcctct ctgggtgcac ctgatgaata cattgaaaag 960
ctcgccacaa tttactggtt tactgtggag tttgggctct gcaaacaagg agactccata 1020
aaggcatatg gtgctgggct cctgtcatcc tttggtgaat tacagtactg cttatcagag 1080
aagccaaagc ttctccccct ggagctggag aagacagcca tccaaaatta cactgtcacg 1140
gagttccagc ccctgtatta cgtggcagag agttttaatg atgccaagga gaaagtaagg 1200
aactttgctg ccacaatacc tcggcccttc tcagttcgct acgacccata cacccaaagg 1260
attgaggtct tggacaatac ccagcagctt aagattttgg ctgattccat taacagtgaa 1320
attggaatcc tttgcagtgc cctccagaaa ataaagtaa 1359
<210> 25
<211> 1359
<212> DNA
<213> 人工序列
<220>
<223> 沉默改变的PAH编码序列
<400> 25
atgtccaccg ctgtgctgga gaaccctggg ctggggagga aactgtcaga cttcgggcag 60
gagacttcat acattgagga taactgtaac cagaatggcg ccatctctct gatcttcagc 120
ctgaaggagg aagtgggcgc cctggcaaag gtgctgcgcc tgtttgagga gaacgacgtg 180
aatctgaccc acatcgagtc ccggccttct agactgaaga aggacgagta cgagttcttt 240
acccacctgg ataagcggtc cctgccagcc ctgacaaaca tcatcaagat cctgaggcac 300
gacatcggag caaccgtgca cgagctgtct cgggacaaga agaaggatac cgtgccctgg 360
ttccctcgga caatccagga gctggataga tttgccaacc agatcctgtc ttacggagca 420
gagctggacg cagatcaccc tggcttcaag gacccagtgt atcgggcccg gagaaagcag 480
tttgccgata tcgcctacaa ttataggcac ggacagccaa tccctcgcgt ggagtatatg 540
gaggaggaga agaagacctg gggcacagtg ttcaagaccc tgaagagcct gtacaagaca 600
cacgcctgct acgagtataa ccacatcttc cccctgctgg agaagtattg tggctttcac 660
gaggacaata tccctcagct ggaggacgtg agccagttcc tgcagacctg cacaggcttt 720
aggctgaggc cagtggcagg actgctgagc tcccgggact tcctgggagg actggccttc 780
agagtgtttc actgcaccca gtacatcagg cacggctcca agccaatgta tacaccagag 840
cccgacatct gtcacgagct gctgggccac gtgcccctgt ttagcgatag atccttcgcc 900
cagttttccc aggagatcgg actggcatct ctgggagcac ctgacgagta catcgagaag 960
ctggccacca tctattggtt cacagtggag tttggcctgt gcaagcaggg cgatagcatc 1020
aaggcctacg gagcaggact gctgtctagc ttcggcgagc tgcagtattg tctgtccgag 1080
aagccaaagc tgctgcccct ggagctggag aagaccgcca tccagaacta caccgtgaca 1140
gagttccagc ccctgtacta tgtggccgag tcttttaacg atgccaagga gaaggtgaga 1200
aatttcgccg ccacaatccc taggcccttc agcgtgcggt acgaccctta tacccagagg 1260
atcgaggtgc tggataatac acagcagctg aagatcctgg ctgactcaat caatagcgaa 1320
atcggaatcc tgtgctccgc cctgcagaaa atcaaatga 1359
<210> 26
<211> 106
<212> DNA
<213> 人工序列
<220>
<223> 截短的AAV2 5'ITR
<400> 26
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtgg 106
<210> 27
<211> 143
<212> DNA
<213> 人工序列
<220>
<223> 经修饰的AAV2 3'ITR
<400> 27
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgcag agagggagtg gcc 143
<210> 28
<211> 1873
<212> DNA
<213> 人工序列
<220>
<223> CAG启动子
<400> 28
gatcttcaat attggccatt agccatatta ttcattggtt atatagcata aatcaatatt 60
ggctattggc cattgcatac gttgtatcta tatcataata tgtacattta tattggctca 120
tgtccaatat gaccgccatg ttggcattga ttattgacta gttattaata gtaatcaatt 180
acggggtcat tagttcatag cccatatatg gagttccgcg ttacataact tacggtaaat 240
ggcccgcctg gctgaccgcc caacgacccc cgcccattga cgtcaataat gacgtatgtt 300
cccatagtaa cgccaatagg gactttccat tgacgtcaat gggtggagta tttacggtaa 360
actgcccact tggcagtaca tcaagtgtat catatgccaa gtccgccccc tattgacgtc 420
aatgacggta aatggcccgc ctggcattat gcccagtaca tgaccttacg ggactttcct 480
acttggcagt acatctacgt attagtcatc gctattacca tggtcgaggt gagccccacg 540
ttctgcttca ctctccccat ctcccccccc tccccacccc caattttgta tttatttatt 600
ttttaattat tttgtgcagc gatgggggcg gggggggggg gggggcgcgc gccaggcggg 660
gcggggcggg gcgaggggcg gggcggggcg aggcggagag gtgcggcggc agccaatcag 720
agcggcgcgc tccgaaagtt tccttttatg gcgaggcggc ggcggcggcg gccctataaa 780
aagcgaagcg cgcggcgggc gggagtcgct gcgacgctgc cttcgccccg tgccccgctc 840
cgccgccgcc tcgcgccgcc cgccccggct ctgactgacc gcgttactcc cacaggtgag 900
cgggcgggac ggcccttctc ctccgggctg taattagcgc ttggtttaat gacggcttgt 960
ttcttttctg tggctgcgtg aaagccttga ggggctccgg gagggccctt tgtgcggggg 1020
ggagcggctc ggggggtgcg tgcgtgtgtg tgtgcgtggg gagcgccgcg tgcggcccgc 1080
gctgcccggc ggctgtgagc gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt 1140
gcgcgagggg agcgcggccg ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa 1200
caaaggctgc gtgcggggtg tgtgcgtggg ggggtgagca gggggtgtgg gcgcggcggt 1260
cgggctgtaa cccccccctg cacccccctc cccgagttgc tgagcacggc ccggcttcgg 1320
gtgcggggct ccgtacgggg cgtggcgcgg ggctcgccgt gccgggcggg gggtggcggc 1380
aggtgggggt gccgggcggg gcggggccgc ctcgggccgg ggagggctcg ggggaggggc 1440
gcggcggccc ccggagcgcc ggcggctgtc gaggcgcggc gagccgcagc cattgccttt 1500
tatggtaatc gtgcgagagg gcgcagggac ttcctttgtc ccaaatctgt gcggagccga 1560
aatctgggag gcgccgccgc accccctcta gcgggcgcgg ggcgaagcgg tgcggcgccg 1620
gcaggaagga aatgggcggg gagggccttc gtgcgtcgcc gcgccgccgt ccccttctcc 1680
ctctccagcc tcggggctgt ccgcgggggg acggctgcct tcggggggga cggggcaggg 1740
cggggttcgg cttctggcgt gtgaccggcg gctctagagc ctctgctaac catgttcatg 1800
ccttcttctt tttcctacag ctcctgggca acgtgctggt tattgtgctg tctcatcatt 1860
ttggcaaaga att 1873
<210> 29
<211> 192
<212> DNA
<213> 智人
<400> 29
ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60
tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc 120
cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt 180
agtgtgagag gg 192
<210> 30
<211> 205
<212> DNA
<213> 智人
<400> 30
aatgactcct ttcggtaagt gcagtggaag ctgtacactg cccaggcaaa gcgtccgggc 60
agcgtaggcg ggcgactcag atcccagcca gtggacttag cccctgtttg ctcctccgat 120
aactggggtg accttggtta atattcacca gcagcctccc ccgttgcccc tctggatcca 180
ctgcttaaat acggacgagg acagg 205
<210> 31
<211> 93
<212> DNA
<213> 猿病毒40
<400> 31
ctctaaggta aatataaaat ttttaagtgt ataatgtgtt aaactactga ttctaattgt 60
ttctctcttt tagattccaa cctttggaac tga 93
<210> 32
<211> 398
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hPAH-TC-025转录调节区
<400> 32
ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60
tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc 120
cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt 180
agtgtgagag gggaatgact cctttcggta agtgcagtgg aagctgtaca ctgcccaggc 240
aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact tagcccctgt 300
ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct cccccgttgc 360
ccctctggat ccactgctta aatacggacg aggacagg 398
<210> 33
<211> 72
<212> DNA
<213> 智人
<400> 33
gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg 60
ggctaagtcc ac 72
<210> 34
<211> 170
<212> DNA
<213> 智人
<400> 34
cgatgctcta atctctctag acaaggttca tatttgtatg ggttacttat tctctctttg 60
ttgactaagt caataatcag aatcagcagg tttgcagtca gattggcagg gataagcagc 120
ctagctcagg agaagtgagt ataaaagccc caggctggga gcagccatca 170
<210> 35
<211> 92
<212> DNA
<213> 人工序列
<220>
<223> 经修饰的MVM内含子
<400> 35
aagaggtaag ggtttaaggg atggttggtt ggtggggtat taatgtttaa ttacctggag 60
cacctgcctg aaatcacttt ttttcaggtt gg 92
<210> 36
<211> 254
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hPAH-TC-010转录调节区
<400> 36
gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg 60
ggctaagtcc acctcgagcc atggcgatgc tctaatctct ctagacaagg ttcatatttg 120
tatgggttac ttattctctc tttgttgact aagtcaataa tcagaatcag caggtttgca 180
gtcagattgg cagggataag cagcctagct caggagaagt gagtataaaa gccccaggct 240
gggagcagcc atca 254
<210> 37
<211> 592
<212> DNA
<213> 智人
<400> 37
gtaaatttta tggaatgtga atcataattc aatttttcaa catgcgttag gagggacatt 60
tcaaactctt ttttacccta gactttccta ccatcaccca gagtatccag ccaggagggg 120
aggggctaga gacaccagaa gtttagcagg gaggagggcg tagggattcg gggaatgaag 180
ggatgggatt cagactaggg ccaggaccca gggatggaga gaaagagatg agagtggttt 240
gggggcttgg tgacttagag aacagagctg caggctcaga ggcacacagg agtttctggg 300
ctcaccctgc ccccttccaa cccctcagtt cccatcctcc agcagctgtt tgtgtgctgc 360
ctctgaagtc cacactgaac aaacttcagc ctactcatgt ccctaaaatg ggcaaacatt 420
gcaagcagca aacagcaaac acacagccct ccctgcctgc tgaccttgga gctggggcag 480
aggtcagaga cctctctggg cccatgccac ctccaacatc cactcgaccc cttggaattt 540
cggtggagag gagcagaggt tgtcctggcg tggtttaggt agtgtgagag gg 592
<210> 38
<211> 423
<212> DNA
<213> 智人
<400> 38
gctctaaccc actctgatct cccagggcgg cagtaagtct tcagcatcag gcattttggg 60
gtgactcagt aaatggtaga tcttgctacc agtggaacag ccactaagga ttctgcagtg 120
agagcagagg gccagctaag tggtactctc ccagagactg tctgactcac gccaccccct 180
ccaccttgga cacaggacgc tgtggtttct gagccaggta caatgactcc tttcggtaag 240
tgcagtggaa gctgtacact gcccaggcaa agcgtccggg cagcgtaggc gggcgactca 300
gatcccagcc agtggactta gcccctgttt gctcctccga taactggggt gaccttggtt 360
aatattcacc agcagcctcc cccgttgccc ctctggatcc actgcttaaa tacggacgag 420
gac 423
<210> 39
<211> 1021
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hPAH-TC-011转录调节区
<400> 39
gtaaatttta tggaatgtga atcataattc aatttttcaa catgcgttag gagggacatt 60
tcaaactctt ttttacccta gactttccta ccatcaccca gagtatccag ccaggagggg 120
aggggctaga gacaccagaa gtttagcagg gaggagggcg tagggattcg gggaatgaag 180
ggatgggatt cagactaggg ccaggaccca gggatggaga gaaagagatg agagtggttt 240
gggggcttgg tgacttagag aacagagctg caggctcaga ggcacacagg agtttctggg 300
ctcaccctgc ccccttccaa cccctcagtt cccatcctcc agcagctgtt tgtgtgctgc 360
ctctgaagtc cacactgaac aaacttcagc ctactcatgt ccctaaaatg ggcaaacatt 420
gcaagcagca aacagcaaac acacagccct ccctgcctgc tgaccttgga gctggggcag 480
aggtcagaga cctctctggg cccatgccac ctccaacatc cactcgaccc cttggaattt 540
cggtggagag gagcagaggt tgtcctggcg tggtttaggt agtgtgagag ggcttaaggc 600
tctaacccac tctgatctcc cagggcggca gtaagtcttc agcatcaggc attttggggt 660
gactcagtaa atggtagatc ttgctaccag tggaacagcc actaaggatt ctgcagtgag 720
agcagagggc cagctaagtg gtactctccc agagactgtc tgactcacgc caccccctcc 780
accttggaca caggacgctg tggtttctga gccaggtaca atgactcctt tcggtaagtg 840
cagtggaagc tgtacactgc ccaggcaaag cgtccgggca gcgtaggcgg gcgactcaga 900
tcccagccag tggacttagc ccctgtttgc tcctccgata actggggtga ccttggttaa 960
tattcaccag cagcctcccc cgttgcccct ctggatccac tgcttaaata cggacgagga 1020
c 1021
<210> 40
<211> 1168
<212> DNA
<213> 人工序列
<220>
<223> 经修饰的人EF-1alpha启动子
<400> 40
cgtgaggctc cggtgcccgt cagtgggcag agcgcacatc gcccacagtc cccgagaagt 60
tggggggagg ggtcggcaat tgaaccggtg cctagagaag gtggcgcggg gtaaactggg 120
aaagtgatgt cgtgtactgg ctccgccttt ttcccgaggg tgggggagaa ccgtatataa 180
gtgcagtagt cgccgtgaac gttctttttc gcaacgggtt tgccgccaga acacaggtaa 240
gtgccgtgtg tggttcccgc gggcctggcc tctttacggg ttatggccct tgcgtgcctt 300
gaattacttc cacctggctc cagtacgtga ttcttgatcc cgagctggag ccaggggcgg 360
gccttgcgct ttaggagccc cttcgcctcg tgcttgagtt gaggcctggc ctgggcgctg 420
gggccgccgc gtgcgaatct ggtggcacct tcgcgcctgt ctcgctgctt tcgataagtc 480
tctagccatt taaaattttt gatgacctgc tgcgacgctt tttttctggc aagatagtct 540
tgtaaatgcg ggccaggatc tgcacactgg tatttcggtt tttggggccg cgggcggcga 600
cggggcccgt gcgtcccagc gcacatgttc ggcgaggcgg ggcctgcgag cgcggccacc 660
gagaatcgga cgggggtagt ctcaagctgg ccggcctgct ctggtgcctg gcctcgcgcc 720
gccgtgtatc gccccgccct gggcggcaag gctggcccgg tcggcaccag ttgcgtgagc 780
ggaaagatgg ccgcttcccg gccctgctcc agggggctca aaatggagga cgcggcgctc 840
gggagagcgg gcgggtgagt cacccacaca aaggaaaggg gcctttccgt cctcagccgt 900
cgcttcatgt gactccacgg agtaccgggc gccgtccagg cacctcgatt agttctggag 960
cttttggagt acgtcgtctt taggttgggg ggaggggttt tatgcgatgg agtttcccca 1020
cactgagtgg gtggagactg aagttaggcc agcttggcac ttgatgtaat tctccttgga 1080
atttgccctt tttgagtttg gatcttggtt cattctcaag cctcagacag tggttcaaag 1140
tttttttctt ccatttcagg tgtcgtga 1168
<210> 41
<211> 1766
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hPAH-TC-012转录调节区
<400> 41
gtaaatttta tggaatgtga atcataattc aatttttcaa catgcgttag gagggacatt 60
tcaaactctt ttttacccta gactttccta ccatcaccca gagtatccag ccaggagggg 120
aggggctaga gacaccagaa gtttagcagg gaggagggcg tagggattcg gggaatgaag 180
ggatgggatt cagactaggg ccaggaccca gggatggaga gaaagagatg agagtggttt 240
gggggcttgg tgacttagag aacagagctg caggctcaga ggcacacagg agtttctggg 300
ctcaccctgc ccccttccaa cccctcagtt cccatcctcc agcagctgtt tgtgtgctgc 360
ctctgaagtc cacactgaac aaacttcagc ctactcatgt ccctaaaatg ggcaaacatt 420
gcaagcagca aacagcaaac acacagccct ccctgcctgc tgaccttgga gctggggcag 480
aggtcagaga cctctctggg cccatgccac ctccaacatc cactcgaccc cttggaattt 540
cggtggagag gagcagaggt tgtcctggcg tggtttaggt agtgtgagag ggcttaagcg 600
tgaggctccg gtgcccgtca gtgggcagag cgcacatcgc ccacagtccc cgagaagttg 660
gggggagggg tcggcaattg aaccggtgcc tagagaaggt ggcgcggggt aaactgggaa 720
agtgatgtcg tgtactggct ccgccttttt cccgagggtg ggggagaacc gtatataagt 780
gcagtagtcg ccgtgaacgt tctttttcgc aacgggtttg ccgccagaac acaggtaagt 840
gccgtgtgtg gttcccgcgg gcctggcctc tttacgggtt atggcccttg cgtgccttga 900
attacttcca cctggctcca gtacgtgatt cttgatcccg agctggagcc aggggcgggc 960
cttgcgcttt aggagcccct tcgcctcgtg cttgagttga ggcctggcct gggcgctggg 1020
gccgccgcgt gcgaatctgg tggcaccttc gcgcctgtct cgctgctttc gataagtctc 1080
tagccattta aaatttttga tgacctgctg cgacgctttt tttctggcaa gatagtcttg 1140
taaatgcggg ccaggatctg cacactggta tttcggtttt tggggccgcg ggcggcgacg 1200
gggcccgtgc gtcccagcgc acatgttcgg cgaggcgggg cctgcgagcg cggccaccga 1260
gaatcggacg ggggtagtct caagctggcc ggcctgctct ggtgcctggc ctcgcgccgc 1320
cgtgtatcgc cccgccctgg gcggcaaggc tggcccggtc ggcaccagtt gcgtgagcgg 1380
aaagatggcc gcttcccggc cctgctccag ggggctcaaa atggaggacg cggcgctcgg 1440
gagagcgggc gggtgagtca cccacacaaa ggaaaggggc ctttccgtcc tcagccgtcg 1500
cttcatgtga ctccacggag taccgggcgc cgtccaggca cctcgattag ttctggagct 1560
tttggagtac gtcgtcttta ggttgggggg aggggtttta tgcgatggag tttccccaca 1620
ctgagtgggt ggagactgaa gttaggccag cttggcactt gatgtaattc tccttggaat 1680
ttgccctttt tgagtttgga tcttggttca ttctcaagcc tcagacagtg gttcaaagtt 1740
tttttcttcc atttcaggtg tcgtga 1766
<210> 42
<211> 122
<212> DNA
<213> 猿病毒40
<400> 42
aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca 60
aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct 120
ta 122
<210> 43
<211> 133
<212> DNA
<213> 猿病毒40
<400> 43
tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat aagctgcaat 60
aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg 120
gaggtttttt aaa 133
<210> 44
<400> 44
000
<210> 45
<211> 198
<212> DNA
<213> 猿病毒40
<400> 45
gatccagaca tgataagata cattgatgag tttggacaaa ccacaactag aatgcagtga 60
aaaaaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac cattataagc 120
tgcaataaac aagttaacaa caacaattgc attcatttta tgtttcaggt tcagggggag 180
gtgtgggagg ttttttaa 198
<210> 46
<211> 3392
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hPAH-TC-004转移基因组
<400> 46
gatcttcaat attggccatt agccatatta ttcattggtt atatagcata aatcaatatt 60
ggctattggc cattgcatac gttgtatcta tatcataata tgtacattta tattggctca 120
tgtccaatat gaccgccatg ttggcattga ttattgacta gttattaata gtaatcaatt 180
acggggtcat tagttcatag cccatatatg gagttccgcg ttacataact tacggtaaat 240
ggcccgcctg gctgaccgcc caacgacccc cgcccattga cgtcaataat gacgtatgtt 300
cccatagtaa cgccaatagg gactttccat tgacgtcaat gggtggagta tttacggtaa 360
actgcccact tggcagtaca tcaagtgtat catatgccaa gtccgccccc tattgacgtc 420
aatgacggta aatggcccgc ctggcattat gcccagtaca tgaccttacg ggactttcct 480
acttggcagt acatctacgt attagtcatc gctattacca tggtcgaggt gagccccacg 540
ttctgcttca ctctccccat ctcccccccc tccccacccc caattttgta tttatttatt 600
ttttaattat tttgtgcagc gatgggggcg gggggggggg gggggcgcgc gccaggcggg 660
gcggggcggg gcgaggggcg gggcggggcg aggcggagag gtgcggcggc agccaatcag 720
agcggcgcgc tccgaaagtt tccttttatg gcgaggcggc ggcggcggcg gccctataaa 780
aagcgaagcg cgcggcgggc gggagtcgct gcgacgctgc cttcgccccg tgccccgctc 840
cgccgccgcc tcgcgccgcc cgccccggct ctgactgacc gcgttactcc cacaggtgag 900
cgggcgggac ggcccttctc ctccgggctg taattagcgc ttggtttaat gacggcttgt 960
ttcttttctg tggctgcgtg aaagccttga ggggctccgg gagggccctt tgtgcggggg 1020
ggagcggctc ggggggtgcg tgcgtgtgtg tgtgcgtggg gagcgccgcg tgcggcccgc 1080
gctgcccggc ggctgtgagc gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt 1140
gcgcgagggg agcgcggccg ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa 1200
caaaggctgc gtgcggggtg tgtgcgtggg ggggtgagca gggggtgtgg gcgcggcggt 1260
cgggctgtaa cccccccctg cacccccctc cccgagttgc tgagcacggc ccggcttcgg 1320
gtgcggggct ccgtacgggg cgtggcgcgg ggctcgccgt gccgggcggg gggtggcggc 1380
aggtgggggt gccgggcggg gcggggccgc ctcgggccgg ggagggctcg ggggaggggc 1440
gcggcggccc ccggagcgcc ggcggctgtc gaggcgcggc gagccgcagc cattgccttt 1500
tatggtaatc gtgcgagagg gcgcagggac ttcctttgtc ccaaatctgt gcggagccga 1560
aatctgggag gcgccgccgc accccctcta gcgggcgcgg ggcgaagcgg tgcggcgccg 1620
gcaggaagga aatgggcggg gagggccttc gtgcgtcgcc gcgccgccgt ccccttctcc 1680
ctctccagcc tcggggctgt ccgcgggggg acggctgcct tcggggggga cggggcaggg 1740
cggggttcgg cttctggcgt gtgaccggcg gctctagagc ctctgctaac catgttcatg 1800
ccttcttctt tttcctacag ctcctgggca acgtgctggt tattgtgctg tctcatcatt 1860
ttggcaaaga attccgccac catgtccacc gctgtgctgg agaaccctgg gctggggagg 1920
aaactgtcag acttcgggca ggagacttca tacattgagg ataactgtaa ccagaatggc 1980
gccatctctc tgatcttcag cctgaaggag gaagtgggcg ccctggcaaa ggtgctgcgc 2040
ctgtttgagg agaacgacgt gaatctgacc cacatcgagt cccggccttc tagactgaag 2100
aaggacgagt acgagttctt tacccacctg gataagcggt ccctgccagc cctgacaaac 2160
atcatcaaga tcctgaggca cgacatcgga gcaaccgtgc acgagctgtc tcgggacaag 2220
aagaaggata ccgtgccctg gttccctcgg acaatccagg agctggatag atttgccaac 2280
cagatcctgt cttacggagc agagctggac gcagatcacc ctggcttcaa ggacccagtg 2340
tatcgggccc ggagaaagca gtttgccgat atcgcctaca attataggca cggacagcca 2400
atccctcgcg tggagtatat ggaggaggag aagaagacct ggggcacagt gttcaagacc 2460
ctgaagagcc tgtacaagac acacgcctgc tacgagtata accacatctt ccccctgctg 2520
gagaagtatt gtggctttca cgaggacaat atccctcagc tggaggacgt gagccagttc 2580
ctgcagacct gcacaggctt taggctgagg ccagtggcag gactgctgag ctcccgggac 2640
ttcctgggag gactggcctt cagagtgttt cactgcaccc agtacatcag gcacggctcc 2700
aagccaatgt atacaccaga gcccgacatc tgtcacgagc tgctgggcca cgtgcccctg 2760
tttagcgata gatccttcgc ccagttttcc caggagatcg gactggcatc tctgggagca 2820
cctgacgagt acatcgagaa gctggccacc atctattggt tcacagtgga gtttggcctg 2880
tgcaagcagg gcgatagcat caaggcctac ggagcaggac tgctgtctag cttcggcgag 2940
ctgcagtatt gtctgtccga gaagccaaag ctgctgcccc tggagctgga gaagaccgcc 3000
atccagaact acaccgtgac agagttccag cccctgtact atgtggccga gtcttttaac 3060
gatgccaagg agaaggtgag aaatttcgcc gccacaatcc ctaggccctt cagcgtgcgg 3120
tacgaccctt atacccagag gatcgaggtg ctggataata cacagcagct gaagatcctg 3180
gctgactcaa tcaatagcga aatcggaatc ctgtgctccg ccctgcagaa aatcaaatga 3240
atcgattcta gagtcgagcc gcggactagt aacttgttta ttgcagctta taatggttac 3300
aaataaagca atagcatcac aaatttcaca aataaagcat ttttttcact gcattctagt 3360
tgtggtttgt ccaaactcat caatgtatct ta 3392
<210> 47
<211> 2042
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hPAH-TC-025转移基因组
<400> 47
ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60
tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc 120
cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt 180
agtgtgagag gggaatgact cctttcggta agtgcagtgg aagctgtaca ctgcccaggc 240
aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact tagcccctgt 300
ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct cccccgttgc 360
ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct cagcttcagg 420
caccaccact gacctgggac agtgaatcct ctaaggtaaa tataaaattt ttaagtgtat 480
aatgtgttaa actactgatt ctaattgttt ctctctttta gattccaacc tttggaactg 540
accgccacca tgtccaccgc tgtgctggag aaccctgggc tggggaggaa actgtcagac 600
ttcgggcagg agacttcata cattgaggat aactgtaacc agaatggcgc catctctctg 660
atcttcagcc tgaaggagga agtgggcgcc ctggcaaagg tgctgcgcct gtttgaggag 720
aacgacgtga atctgaccca catcgagtcc cggccttcta gactgaagaa ggacgagtac 780
gagttcttta cccacctgga taagcggtcc ctgccagccc tgacaaacat catcaagatc 840
ctgaggcacg acatcggagc aaccgtgcac gagctgtctc gggacaagaa gaaggatacc 900
gtgccctggt tccctcggac aatccaggag ctggatagat ttgccaacca gatcctgtct 960
tacggagcag agctggacgc agatcaccct ggcttcaagg acccagtgta tcgggcccgg 1020
agaaagcagt ttgccgatat cgcctacaat tataggcacg gacagccaat ccctcgcgtg 1080
gagtatatgg aggaggagaa gaagacctgg ggcacagtgt tcaagaccct gaagagcctg 1140
tacaagacac acgcctgcta cgagtataac cacatcttcc ccctgctgga gaagtattgt 1200
ggctttcacg aggacaatat ccctcagctg gaggacgtga gccagttcct gcagacctgc 1260
acaggcttta ggctgaggcc agtggcagga ctgctgagct cccgggactt cctgggagga 1320
ctggccttca gagtgtttca ctgcacccag tacatcaggc acggctccaa gccaatgtat 1380
acaccagagc ccgacatctg tcacgagctg ctgggccacg tgcccctgtt tagcgataga 1440
tccttcgccc agttttccca ggagatcgga ctggcatctc tgggagcacc tgacgagtac 1500
atcgagaagc tggccaccat ctattggttc acagtggagt ttggcctgtg caagcagggc 1560
gatagcatca aggcctacgg agcaggactg ctgtctagct tcggcgagct gcagtattgt 1620
ctgtccgaga agccaaagct gctgcccctg gagctggaga agaccgccat ccagaactac 1680
accgtgacag agttccagcc cctgtactat gtggccgagt cttttaacga tgccaaggag 1740
aaggtgagaa atttcgccgc cacaatccct aggcccttca gcgtgcggta cgacccttat 1800
acccagagga tcgaggtgct ggataataca cagcagctga agatcctggc tgactcaatc 1860
aatagcgaaa tcggaatcct gtgctccgcc ctgcagaaaa tcaaatgaat gctttatttg 1920
tgaaatttgt gatgctattg ctttatttgt aaccattata agctgcaata aacaagttaa 1980
caacaacaat tgcattcatt ttatgtttca ggttcagggg gaggtgtggg aggtttttta 2040
aa 2042
<210> 48
<211> 1927
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hPAH-TC-010转移基因组
<400> 48
gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg 60
ggctaagtcc acctcgagcc atggcgatgc tctaatctct ctagacaagg ttcatatttg 120
tatgggttac ttattctctc tttgttgact aagtcaataa tcagaatcag caggtttgca 180
gtcagattgg cagggataag cagcctagct caggagaagt gagtataaaa gccccaggct 240
gggagcagcc atcagctagc gccggcaaga ggtaagggtt taagggatgg ttggttggtg 300
gggtattaat gtttaattac ctggagcacc tgcctgaaat cacttttttt caggttgggc 360
caccatgtcc accgctgtgc tggagaaccc tgggctgggg aggaaactgt cagacttcgg 420
gcaggagact tcatacattg aggataactg taaccagaat ggcgccatct ctctgatctt 480
cagcctgaag gaggaagtgg gcgccctggc aaaggtgctg cgcctgtttg aggagaacga 540
cgtgaatctg acccacatcg agtcccggcc ttctagactg aagaaggacg agtacgagtt 600
ctttacccac ctggataagc ggtccctgcc agccctgaca aacatcatca agatcctgag 660
gcacgacatc ggagcaaccg tgcacgagct gtctcgggac aagaagaagg ataccgtgcc 720
ctggttccct cggacaatcc aggagctgga tagatttgcc aaccagatcc tgtcttacgg 780
agcagagctg gacgcagatc accctggctt caaggaccca gtgtatcggg cccggagaaa 840
gcagtttgcc gatatcgcct acaattatag gcacggacag ccaatccctc gcgtggagta 900
tatggaggag gagaagaaga cctggggcac agtgttcaag accctgaaga gcctgtacaa 960
gacacacgcc tgctacgagt ataaccacat cttccccctg ctggagaagt attgtggctt 1020
tcacgaggac aatatccctc agctggagga cgtgagccag ttcctgcaga cctgcacagg 1080
ctttaggctg aggccagtgg caggactgct gagctcccgg gacttcctgg gaggactggc 1140
cttcagagtg tttcactgca cccagtacat caggcacggc tccaagccaa tgtatacacc 1200
agagcccgac atctgtcacg agctgctggg ccacgtgccc ctgtttagcg atagatcctt 1260
cgcccagttt tcccaggaga tcggactggc atctctggga gcacctgacg agtacatcga 1320
gaagctggcc accatctatt ggttcacagt ggagtttggc ctgtgcaagc agggcgatag 1380
catcaaggcc tacggagcag gactgctgtc tagcttcggc gagctgcagt attgtctgtc 1440
cgagaagcca aagctgctgc ccctggagct ggagaagacc gccatccaga actacaccgt 1500
gacagagttc cagcccctgt actatgtggc cgagtctttt aacgatgcca aggagaaggt 1560
gagaaatttc gccgccacaa tccctaggcc cttcagcgtg cggtacgacc cttataccca 1620
gaggatcgag gtgctggata atacacagca gctgaagatc ctggctgact caatcaatag 1680
cgaaatcgga atcctgtgct ccgccctgca gaaaatcaaa tgaatcgtag atccagacat 1740
gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 1800
tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 1860
agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 1920
tttttaa 1927
<210> 49
<211> 2694
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hPAH-TC-011
<400> 49
gtaaatttta tggaatgtga atcataattc aatttttcaa catgcgttag gagggacatt 60
tcaaactctt ttttacccta gactttccta ccatcaccca gagtatccag ccaggagggg 120
aggggctaga gacaccagaa gtttagcagg gaggagggcg tagggattcg gggaatgaag 180
ggatgggatt cagactaggg ccaggaccca gggatggaga gaaagagatg agagtggttt 240
gggggcttgg tgacttagag aacagagctg caggctcaga ggcacacagg agtttctggg 300
ctcaccctgc ccccttccaa cccctcagtt cccatcctcc agcagctgtt tgtgtgctgc 360
ctctgaagtc cacactgaac aaacttcagc ctactcatgt ccctaaaatg ggcaaacatt 420
gcaagcagca aacagcaaac acacagccct ccctgcctgc tgaccttgga gctggggcag 480
aggtcagaga cctctctggg cccatgccac ctccaacatc cactcgaccc cttggaattt 540
cggtggagag gagcagaggt tgtcctggcg tggtttaggt agtgtgagag ggcttaaggc 600
tctaacccac tctgatctcc cagggcggca gtaagtcttc agcatcaggc attttggggt 660
gactcagtaa atggtagatc ttgctaccag tggaacagcc actaaggatt ctgcagtgag 720
agcagagggc cagctaagtg gtactctccc agagactgtc tgactcacgc caccccctcc 780
accttggaca caggacgctg tggtttctga gccaggtaca atgactcctt tcggtaagtg 840
cagtggaagc tgtacactgc ccaggcaaag cgtccgggca gcgtaggcgg gcgactcaga 900
tcccagccag tggacttagc ccctgtttgc tcctccgata actggggtga ccttggttaa 960
tattcaccag cagcctcccc cgttgcccct ctggatccac tgcttaaata cggacgagga 1020
cgctagcgcc ggcaagaggt aagggtttaa gggatggttg gttggtgggg tattaatgtt 1080
taattacctg gagcacctgc ctgaaatcac tttttttcag gttgggccac catgtccacc 1140
gctgtgctgg agaaccctgg gctggggagg aaactgtcag acttcgggca ggagacttca 1200
tacattgagg ataactgtaa ccagaatggc gccatctctc tgatcttcag cctgaaggag 1260
gaagtgggcg ccctggcaaa ggtgctgcgc ctgtttgagg agaacgacgt gaatctgacc 1320
cacatcgagt cccggccttc tagactgaag aaggacgagt acgagttctt tacccacctg 1380
gataagcggt ccctgccagc cctgacaaac atcatcaaga tcctgaggca cgacatcgga 1440
gcaaccgtgc acgagctgtc tcgggacaag aagaaggata ccgtgccctg gttccctcgg 1500
acaatccagg agctggatag atttgccaac cagatcctgt cttacggagc agagctggac 1560
gcagatcacc ctggcttcaa ggacccagtg tatcgggccc ggagaaagca gtttgccgat 1620
atcgcctaca attataggca cggacagcca atccctcgcg tggagtatat ggaggaggag 1680
aagaagacct ggggcacagt gttcaagacc ctgaagagcc tgtacaagac acacgcctgc 1740
tacgagtata accacatctt ccccctgctg gagaagtatt gtggctttca cgaggacaat 1800
atccctcagc tggaggacgt gagccagttc ctgcagacct gcacaggctt taggctgagg 1860
ccagtggcag gactgctgag ctcccgggac ttcctgggag gactggcctt cagagtgttt 1920
cactgcaccc agtacatcag gcacggctcc aagccaatgt atacaccaga gcccgacatc 1980
tgtcacgagc tgctgggcca cgtgcccctg tttagcgata gatccttcgc ccagttttcc 2040
caggagatcg gactggcatc tctgggagca cctgacgagt acatcgagaa gctggccacc 2100
atctattggt tcacagtgga gtttggcctg tgcaagcagg gcgatagcat caaggcctac 2160
ggagcaggac tgctgtctag cttcggcgag ctgcagtatt gtctgtccga gaagccaaag 2220
ctgctgcccc tggagctgga gaagaccgcc atccagaact acaccgtgac agagttccag 2280
cccctgtact atgtggccga gtcttttaac gatgccaagg agaaggtgag aaatttcgcc 2340
gccacaatcc ctaggccctt cagcgtgcgg tacgaccctt atacccagag gatcgaggtg 2400
ctggataata cacagcagct gaagatcctg gctgactcaa tcaatagcga aatcggaatc 2460
ctgtgctccg ccctgcagaa aatcaaatga atcgtagatc cagacatgat aagatacatt 2520
gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt 2580
tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac 2640
aattgcattc attttatgtt tcaggttcag ggggaggtgt gggaggtttt ttaa 2694
<210> 50
<211> 3335
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hPAH-TC-012
<400> 50
gtaaatttta tggaatgtga atcataattc aatttttcaa catgcgttag gagggacatt 60
tcaaactctt ttttacccta gactttccta ccatcaccca gagtatccag ccaggagggg 120
aggggctaga gacaccagaa gtttagcagg gaggagggcg tagggattcg gggaatgaag 180
ggatgggatt cagactaggg ccaggaccca gggatggaga gaaagagatg agagtggttt 240
gggggcttgg tgacttagag aacagagctg caggctcaga ggcacacagg agtttctggg 300
ctcaccctgc ccccttccaa cccctcagtt cccatcctcc agcagctgtt tgtgtgctgc 360
ctctgaagtc cacactgaac aaacttcagc ctactcatgt ccctaaaatg ggcaaacatt 420
gcaagcagca aacagcaaac acacagccct ccctgcctgc tgaccttgga gctggggcag 480
aggtcagaga cctctctggg cccatgccac ctccaacatc cactcgaccc cttggaattt 540
cggtggagag gagcagaggt tgtcctggcg tggtttaggt agtgtgagag ggcttaagcg 600
tgaggctccg gtgcccgtca gtgggcagag cgcacatcgc ccacagtccc cgagaagttg 660
gggggagggg tcggcaattg aaccggtgcc tagagaaggt ggcgcggggt aaactgggaa 720
agtgatgtcg tgtactggct ccgccttttt cccgagggtg ggggagaacc gtatataagt 780
gcagtagtcg ccgtgaacgt tctttttcgc aacgggtttg ccgccagaac acaggtaagt 840
gccgtgtgtg gttcccgcgg gcctggcctc tttacgggtt atggcccttg cgtgccttga 900
attacttcca cctggctcca gtacgtgatt cttgatcccg agctggagcc aggggcgggc 960
cttgcgcttt aggagcccct tcgcctcgtg cttgagttga ggcctggcct gggcgctggg 1020
gccgccgcgt gcgaatctgg tggcaccttc gcgcctgtct cgctgctttc gataagtctc 1080
tagccattta aaatttttga tgacctgctg cgacgctttt tttctggcaa gatagtcttg 1140
taaatgcggg ccaggatctg cacactggta tttcggtttt tggggccgcg ggcggcgacg 1200
gggcccgtgc gtcccagcgc acatgttcgg cgaggcgggg cctgcgagcg cggccaccga 1260
gaatcggacg ggggtagtct caagctggcc ggcctgctct ggtgcctggc ctcgcgccgc 1320
cgtgtatcgc cccgccctgg gcggcaaggc tggcccggtc ggcaccagtt gcgtgagcgg 1380
aaagatggcc gcttcccggc cctgctccag ggggctcaaa atggaggacg cggcgctcgg 1440
gagagcgggc gggtgagtca cccacacaaa ggaaaggggc ctttccgtcc tcagccgtcg 1500
cttcatgtga ctccacggag taccgggcgc cgtccaggca cctcgattag ttctggagct 1560
tttggagtac gtcgtcttta ggttgggggg aggggtttta tgcgatggag tttccccaca 1620
ctgagtgggt ggagactgaa gttaggccag cttggcactt gatgtaattc tccttggaat 1680
ttgccctttt tgagtttgga tcttggttca ttctcaagcc tcagacagtg gttcaaagtt 1740
tttttcttcc atttcaggtg tcgtgagcca ccatgtccac cgctgtgctg gagaaccctg 1800
ggctggggag gaaactgtca gacttcgggc aggagacttc atacattgag gataactgta 1860
accagaatgg cgccatctct ctgatcttca gcctgaagga ggaagtgggc gccctggcaa 1920
aggtgctgcg cctgtttgag gagaacgacg tgaatctgac ccacatcgag tcccggcctt 1980
ctagactgaa gaaggacgag tacgagttct ttacccacct ggataagcgg tccctgccag 2040
ccctgacaaa catcatcaag atcctgaggc acgacatcgg agcaaccgtg cacgagctgt 2100
ctcgggacaa gaagaaggat accgtgccct ggttccctcg gacaatccag gagctggata 2160
gatttgccaa ccagatcctg tcttacggag cagagctgga cgcagatcac cctggcttca 2220
aggacccagt gtatcgggcc cggagaaagc agtttgccga tatcgcctac aattataggc 2280
acggacagcc aatccctcgc gtggagtata tggaggagga gaagaagacc tggggcacag 2340
tgttcaagac cctgaagagc ctgtacaaga cacacgcctg ctacgagtat aaccacatct 2400
tccccctgct ggagaagtat tgtggctttc acgaggacaa tatccctcag ctggaggacg 2460
tgagccagtt cctgcagacc tgcacaggct ttaggctgag gccagtggca ggactgctga 2520
gctcccggga cttcctggga ggactggcct tcagagtgtt tcactgcacc cagtacatca 2580
ggcacggctc caagccaatg tatacaccag agcccgacat ctgtcacgag ctgctgggcc 2640
acgtgcccct gtttagcgat agatccttcg cccagttttc ccaggagatc ggactggcat 2700
ctctgggagc acctgacgag tacatcgaga agctggccac catctattgg ttcacagtgg 2760
agtttggcct gtgcaagcag ggcgatagca tcaaggccta cggagcagga ctgctgtcta 2820
gcttcggcga gctgcagtat tgtctgtccg agaagccaaa gctgctgccc ctggagctgg 2880
agaagaccgc catccagaac tacaccgtga cagagttcca gcccctgtac tatgtggccg 2940
agtcttttaa cgatgccaag gagaaggtga gaaatttcgc cgccacaatc cctaggccct 3000
tcagcgtgcg gtacgaccct tatacccaga ggatcgaggt gctggataat acacagcagc 3060
tgaagatcct ggctgactca atcaatagcg aaatcggaat cctgtgctcc gccctgcaga 3120
aaatcaaatg aatcgtagat ccagacatga taagatacat tgatgagttt ggacaaacca 3180
caactagaat gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct attgctttat 3240
ttgtaaccat tataagctgc aataaacaag ttaacaacaa caattgcatt cattttatgt 3300
ttcaggttca gggggaggtg tgggaggttt tttaa 3335
<210> 51
<211> 3783
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hPAH-TC-004转移基因组 (从5' ITR至3' ITR)
<400> 51
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag gtcctgcaga tcttcaatat tggccattag ccatattatt cattggttat 240
atagcataaa tcaatattgg ctattggcca ttgcatacgt tgtatctata tcataatatg 300
tacatttata ttggctcatg tccaatatga ccgccatgtt ggcattgatt attgactagt 360
tattaatagt aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt 420
acataactta cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg 480
tcaataatga cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg 540
gtggagtatt tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt 600
ccgcccccta ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg 660
accttacggg actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg 720
gtcgaggtga gccccacgtt ctgcttcact ctccccatct cccccccctc cccaccccca 780
attttgtatt tatttatttt ttaattattt tgtgcagcga tgggggcggg gggggggggg 840
gggcgcgcgc caggcggggc ggggcggggc gaggggcggg gcggggcgag gcggagaggt 900
gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc cttttatggc gaggcggcgg 960
cggcggcggc cctataaaaa gcgaagcgcg cggcgggcgg gagtcgctgc gacgctgcct 1020
tcgccccgtg ccccgctccg ccgccgcctc gcgccgcccg ccccggctct gactgaccgc 1080
gttactccca caggtgagcg ggcgggacgg cccttctcct ccgggctgta attagcgctt 1140
ggtttaatga cggcttgttt cttttctgtg gctgcgtgaa agccttgagg ggctccggga 1200
gggccctttg tgcggggggg agcggctcgg ggggtgcgtg cgtgtgtgtg tgcgtgggga 1260
gcgccgcgtg cggcccgcgc tgcccggcgg ctgtgagcgc tgcgggcgcg gcgcggggct 1320
ttgtgcgctc cgcagtgtgc gcgaggggag cgcggccggg ggcggtgccc cgcggtgcgg 1380
ggggggctgc gaggggaaca aaggctgcgt gcggggtgtg tgcgtggggg ggtgagcagg 1440
gggtgtgggc gcggcggtcg ggctgtaacc cccccctgca cccccctccc cgagttgctg 1500
agcacggccc ggcttcgggt gcggggctcc gtacggggcg tggcgcgggg ctcgccgtgc 1560
cgggcggggg gtggcggcag gtgggggtgc cgggcggggc ggggccgcct cgggccgggg 1620
agggctcggg ggaggggcgc ggcggccccc ggagcgccgg cggctgtcga ggcgcggcga 1680
gccgcagcca ttgcctttta tggtaatcgt gcgagagggc gcagggactt cctttgtccc 1740
aaatctgtgc ggagccgaaa tctgggaggc gccgccgcac cccctctagc gggcgcgggg 1800
cgaagcggtg cggcgccggc aggaaggaaa tgggcgggga gggccttcgt gcgtcgccgc 1860
gccgccgtcc ccttctccct ctccagcctc ggggctgtcc gcggggggac ggctgccttc 1920
gggggggacg gggcagggcg gggttcggct tctggcgtgt gaccggcggc tctagagcct 1980
ctgctaacca tgttcatgcc ttcttctttt tcctacagct cctgggcaac gtgctggtta 2040
ttgtgctgtc tcatcatttt ggcaaagaat tccgccacca tgtccaccgc tgtgctggag 2100
aaccctgggc tggggaggaa actgtcagac ttcgggcagg agacttcata cattgaggat 2160
aactgtaacc agaatggcgc catctctctg atcttcagcc tgaaggagga agtgggcgcc 2220
ctggcaaagg tgctgcgcct gtttgaggag aacgacgtga atctgaccca catcgagtcc 2280
cggccttcta gactgaagaa ggacgagtac gagttcttta cccacctgga taagcggtcc 2340
ctgccagccc tgacaaacat catcaagatc ctgaggcacg acatcggagc aaccgtgcac 2400
gagctgtctc gggacaagaa gaaggatacc gtgccctggt tccctcggac aatccaggag 2460
ctggatagat ttgccaacca gatcctgtct tacggagcag agctggacgc agatcaccct 2520
ggcttcaagg acccagtgta tcgggcccgg agaaagcagt ttgccgatat cgcctacaat 2580
tataggcacg gacagccaat ccctcgcgtg gagtatatgg aggaggagaa gaagacctgg 2640
ggcacagtgt tcaagaccct gaagagcctg tacaagacac acgcctgcta cgagtataac 2700
cacatcttcc ccctgctgga gaagtattgt ggctttcacg aggacaatat ccctcagctg 2760
gaggacgtga gccagttcct gcagacctgc acaggcttta ggctgaggcc agtggcagga 2820
ctgctgagct cccgggactt cctgggagga ctggccttca gagtgtttca ctgcacccag 2880
tacatcaggc acggctccaa gccaatgtat acaccagagc ccgacatctg tcacgagctg 2940
ctgggccacg tgcccctgtt tagcgataga tccttcgccc agttttccca ggagatcgga 3000
ctggcatctc tgggagcacc tgacgagtac atcgagaagc tggccaccat ctattggttc 3060
acagtggagt ttggcctgtg caagcagggc gatagcatca aggcctacgg agcaggactg 3120
ctgtctagct tcggcgagct gcagtattgt ctgtccgaga agccaaagct gctgcccctg 3180
gagctggaga agaccgccat ccagaactac accgtgacag agttccagcc cctgtactat 3240
gtggccgagt cttttaacga tgccaaggag aaggtgagaa atttcgccgc cacaatccct 3300
aggcccttca gcgtgcggta cgacccttat acccagagga tcgaggtgct ggataataca 3360
cagcagctga agatcctggc tgactcaatc aatagcgaaa tcggaatcct gtgctccgcc 3420
ctgcagaaaa tcaaatgaat cgattctaga gtcgagccgc ggactagtaa cttgtttatt 3480
gcagcttata atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt 3540
ttttcactgc attctagttg tggtttgtcc aaactcatca atgtatctta ggtctagata 3600
cgtagataag tagcatggcg ggttaatcat taactacaag gaacccctag tgatggagtt 3660
ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg 3720
acgcccgggc tttgcccggg cggcctcagt gagcgagcga gcgcgcagag agggagtggc 3780
caa 3783
<210> 52
<211> 2356
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hPAH-TC-025转移基因组 (从5' ITR至3' ITR)
<400> 52
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggaatt cacgcgtgga 120
tctgaattca attcacgcgt ggtacctccc taaaatgggc aaacattgca agcagcaaac 180
agcaaacaca cagccctccc tgcctgctga ccttggagct ggggcagagg tcagagacct 240
ctctgggccc atgccacctc caacatccac tcgacccctt ggaatttcgg tggagaggag 300
cagaggttgt cctggcgtgg tttaggtagt gtgagagggg aatgactcct ttcggtaagt 360
gcagtggaag ctgtacactg cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag 420
atcccagcca gtggacttag cccctgtttg ctcctccgat aactggggtg accttggtta 480
atattcacca gcagcctccc ccgttgcccc tctggatcca ctgcttaaat acggacgagg 540
acagggccct gtctcctcag cttcaggcac caccactgac ctgggacagt gaatcctcta 600
aggtaaatat aaaattttta agtgtataat gtgttaaact actgattcta attgtttctc 660
tcttttagat tccaaccttt ggaactgacc gccaccatgt ccaccgctgt gctggagaac 720
cctgggctgg ggaggaaact gtcagacttc gggcaggaga cttcatacat tgaggataac 780
tgtaaccaga atggcgccat ctctctgatc ttcagcctga aggaggaagt gggcgccctg 840
gcaaaggtgc tgcgcctgtt tgaggagaac gacgtgaatc tgacccacat cgagtcccgg 900
ccttctagac tgaagaagga cgagtacgag ttctttaccc acctggataa gcggtccctg 960
ccagccctga caaacatcat caagatcctg aggcacgaca tcggagcaac cgtgcacgag 1020
ctgtctcggg acaagaagaa ggataccgtg ccctggttcc ctcggacaat ccaggagctg 1080
gatagatttg ccaaccagat cctgtcttac ggagcagagc tggacgcaga tcaccctggc 1140
ttcaaggacc cagtgtatcg ggcccggaga aagcagtttg ccgatatcgc ctacaattat 1200
aggcacggac agccaatccc tcgcgtggag tatatggagg aggagaagaa gacctggggc 1260
acagtgttca agaccctgaa gagcctgtac aagacacacg cctgctacga gtataaccac 1320
atcttccccc tgctggagaa gtattgtggc tttcacgagg acaatatccc tcagctggag 1380
gacgtgagcc agttcctgca gacctgcaca ggctttaggc tgaggccagt ggcaggactg 1440
ctgagctccc gggacttcct gggaggactg gccttcagag tgtttcactg cacccagtac 1500
atcaggcacg gctccaagcc aatgtataca ccagagcccg acatctgtca cgagctgctg 1560
ggccacgtgc ccctgtttag cgatagatcc ttcgcccagt tttcccagga gatcggactg 1620
gcatctctgg gagcacctga cgagtacatc gagaagctgg ccaccatcta ttggttcaca 1680
gtggagtttg gcctgtgcaa gcagggcgat agcatcaagg cctacggagc aggactgctg 1740
tctagcttcg gcgagctgca gtattgtctg tccgagaagc caaagctgct gcccctggag 1800
ctggagaaga ccgccatcca gaactacacc gtgacagagt tccagcccct gtactatgtg 1860
gccgagtctt ttaacgatgc caaggagaag gtgagaaatt tcgccgccac aatccctagg 1920
cccttcagcg tgcggtacga cccttatacc cagaggatcg aggtgctgga taatacacag 1980
cagctgaaga tcctggctga ctcaatcaat agcgaaatcg gaatcctgtg ctccgccctg 2040
cagaaaatca aatgaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac 2100
cattataagc tgcaataaac aagttaacaa caacaattgc attcatttta tgtttcaggt 2160
tcagggggag gtgtgggagg ttttttaaag catgctgggg agagatcgat ctgaggaacc 2220
cctagtgatg gagttggcca ctccctctct gcgcgctcgc tcgctcactg aggccgggcg 2280
accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg agcgagcgcg 2340
cagagaggga gtggcc 2356
<210> 53
<211> 2323
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hPAH-TC-010转移基因组 (从5' ITR至3' ITR)
<400> 53
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag gtcctgcagg gggaggctgc tggtgaatat taaccaaggt caccccagtt 240
atcggaggag caaacagggg ctaagtccac ctcgagccat ggcgatgctc taatctctct 300
agacaaggtt catatttgta tgggttactt attctctctt tgttgactaa gtcaataatc 360
agaatcagca ggtttgcagt cagattggca gggataagca gcctagctca ggagaagtga 420
gtataaaagc cccaggctgg gagcagccat cagctagcgc cggcaagagg taagggttta 480
agggatggtt ggttggtggg gtattaatgt ttaattacct ggagcacctg cctgaaatca 540
ctttttttca ggttgggcca ccatgtccac cgctgtgctg gagaaccctg ggctggggag 600
gaaactgtca gacttcgggc aggagacttc atacattgag gataactgta accagaatgg 660
cgccatctct ctgatcttca gcctgaagga ggaagtgggc gccctggcaa aggtgctgcg 720
cctgtttgag gagaacgacg tgaatctgac ccacatcgag tcccggcctt ctagactgaa 780
gaaggacgag tacgagttct ttacccacct ggataagcgg tccctgccag ccctgacaaa 840
catcatcaag atcctgaggc acgacatcgg agcaaccgtg cacgagctgt ctcgggacaa 900
gaagaaggat accgtgccct ggttccctcg gacaatccag gagctggata gatttgccaa 960
ccagatcctg tcttacggag cagagctgga cgcagatcac cctggcttca aggacccagt 1020
gtatcgggcc cggagaaagc agtttgccga tatcgcctac aattataggc acggacagcc 1080
aatccctcgc gtggagtata tggaggagga gaagaagacc tggggcacag tgttcaagac 1140
cctgaagagc ctgtacaaga cacacgcctg ctacgagtat aaccacatct tccccctgct 1200
ggagaagtat tgtggctttc acgaggacaa tatccctcag ctggaggacg tgagccagtt 1260
cctgcagacc tgcacaggct ttaggctgag gccagtggca ggactgctga gctcccggga 1320
cttcctggga ggactggcct tcagagtgtt tcactgcacc cagtacatca ggcacggctc 1380
caagccaatg tatacaccag agcccgacat ctgtcacgag ctgctgggcc acgtgcccct 1440
gtttagcgat agatccttcg cccagttttc ccaggagatc ggactggcat ctctgggagc 1500
acctgacgag tacatcgaga agctggccac catctattgg ttcacagtgg agtttggcct 1560
gtgcaagcag ggcgatagca tcaaggccta cggagcagga ctgctgtcta gcttcggcga 1620
gctgcagtat tgtctgtccg agaagccaaa gctgctgccc ctggagctgg agaagaccgc 1680
catccagaac tacaccgtga cagagttcca gcccctgtac tatgtggccg agtcttttaa 1740
cgatgccaag gagaaggtga gaaatttcgc cgccacaatc cctaggccct tcagcgtgcg 1800
gtacgaccct tatacccaga ggatcgaggt gctggataat acacagcagc tgaagatcct 1860
ggctgactca atcaatagcg aaatcggaat cctgtgctcc gccctgcaga aaatcaaatg 1920
aatcgtagat ccagacatga taagatacat tgatgagttt ggacaaacca caactagaat 1980
gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct attgctttat ttgtaaccat 2040
tataagctgc aataaacaag ttaacaacaa caattgcatt cattttatgt ttcaggttca 2100
gggggaggtg tgggaggttt tttaagcttg tttaaacgta cgtagataag tagcatggcg 2160
ggttaatcat taactacaag gaacccctag tgatggagtt ggccactccc tctctgcgcg 2220
ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg 2280
cggcctcagt gagcgagcga gcgcgcagag agggagtggc caa 2323
<210> 54
<211> 3090
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hPAH-TC-011转移基因组 (从5' ITR至3' ITR)
<400> 54
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag gtcctgcagt aaattttatg gaatgtgaat cataattcaa tttttcaaca 240
tgcgttagga gggacatttc aaactctttt ttaccctaga ctttcctacc atcacccaga 300
gtatccagcc aggaggggag gggctagaga caccagaagt ttagcaggga ggagggcgta 360
gggattcggg gaatgaaggg atgggattca gactagggcc aggacccagg gatggagaga 420
aagagatgag agtggtttgg gggcttggtg acttagagaa cagagctgca ggctcagagg 480
cacacaggag tttctgggct caccctgccc ccttccaacc cctcagttcc catcctccag 540
cagctgtttg tgtgctgcct ctgaagtcca cactgaacaa acttcagcct actcatgtcc 600
ctaaaatggg caaacattgc aagcagcaaa cagcaaacac acagccctcc ctgcctgctg 660
accttggagc tggggcagag gtcagagacc tctctgggcc catgccacct ccaacatcca 720
ctcgacccct tggaatttcg gtggagagga gcagaggttg tcctggcgtg gtttaggtag 780
tgtgagaggg cttaaggctc taacccactc tgatctccca gggcggcagt aagtcttcag 840
catcaggcat tttggggtga ctcagtaaat ggtagatctt gctaccagtg gaacagccac 900
taaggattct gcagtgagag cagagggcca gctaagtggt actctcccag agactgtctg 960
actcacgcca ccccctccac cttggacaca ggacgctgtg gtttctgagc caggtacaat 1020
gactcctttc ggtaagtgca gtggaagctg tacactgccc aggcaaagcg tccgggcagc 1080
gtaggcgggc gactcagatc ccagccagtg gacttagccc ctgtttgctc ctccgataac 1140
tggggtgacc ttggttaata ttcaccagca gcctcccccg ttgcccctct ggatccactg 1200
cttaaatacg gacgaggacg ctagcgccgg caagaggtaa gggtttaagg gatggttggt 1260
tggtggggta ttaatgttta attacctgga gcacctgcct gaaatcactt tttttcaggt 1320
tgggccacca tgtccaccgc tgtgctggag aaccctgggc tggggaggaa actgtcagac 1380
ttcgggcagg agacttcata cattgaggat aactgtaacc agaatggcgc catctctctg 1440
atcttcagcc tgaaggagga agtgggcgcc ctggcaaagg tgctgcgcct gtttgaggag 1500
aacgacgtga atctgaccca catcgagtcc cggccttcta gactgaagaa ggacgagtac 1560
gagttcttta cccacctgga taagcggtcc ctgccagccc tgacaaacat catcaagatc 1620
ctgaggcacg acatcggagc aaccgtgcac gagctgtctc gggacaagaa gaaggatacc 1680
gtgccctggt tccctcggac aatccaggag ctggatagat ttgccaacca gatcctgtct 1740
tacggagcag agctggacgc agatcaccct ggcttcaagg acccagtgta tcgggcccgg 1800
agaaagcagt ttgccgatat cgcctacaat tataggcacg gacagccaat ccctcgcgtg 1860
gagtatatgg aggaggagaa gaagacctgg ggcacagtgt tcaagaccct gaagagcctg 1920
tacaagacac acgcctgcta cgagtataac cacatcttcc ccctgctgga gaagtattgt 1980
ggctttcacg aggacaatat ccctcagctg gaggacgtga gccagttcct gcagacctgc 2040
acaggcttta ggctgaggcc agtggcagga ctgctgagct cccgggactt cctgggagga 2100
ctggccttca gagtgtttca ctgcacccag tacatcaggc acggctccaa gccaatgtat 2160
acaccagagc ccgacatctg tcacgagctg ctgggccacg tgcccctgtt tagcgataga 2220
tccttcgccc agttttccca ggagatcgga ctggcatctc tgggagcacc tgacgagtac 2280
atcgagaagc tggccaccat ctattggttc acagtggagt ttggcctgtg caagcagggc 2340
gatagcatca aggcctacgg agcaggactg ctgtctagct tcggcgagct gcagtattgt 2400
ctgtccgaga agccaaagct gctgcccctg gagctggaga agaccgccat ccagaactac 2460
accgtgacag agttccagcc cctgtactat gtggccgagt cttttaacga tgccaaggag 2520
aaggtgagaa atttcgccgc cacaatccct aggcccttca gcgtgcggta cgacccttat 2580
acccagagga tcgaggtgct ggataataca cagcagctga agatcctggc tgactcaatc 2640
aatagcgaaa tcggaatcct gtgctccgcc ctgcagaaaa tcaaatgaat cgtagatcca 2700
gacatgataa gatacattga tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa 2760
tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat aagctgcaat 2820
aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg 2880
gaggtttttt aagcttgttt aaacgtacgt agataagtag catggcgggt taatcattaa 2940
ctacaaggaa cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac 3000
tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt gcccgggcgg cctcagtgag 3060
cgagcgagcg cgcagagagg gagtggccaa 3090
<210> 55
<211> 3731
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hPAH-TC-012转移基因组 (从5' ITR至3' ITR)
<400> 55
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag gtcctgcagt aaattttatg gaatgtgaat cataattcaa tttttcaaca 240
tgcgttagga gggacatttc aaactctttt ttaccctaga ctttcctacc atcacccaga 300
gtatccagcc aggaggggag gggctagaga caccagaagt ttagcaggga ggagggcgta 360
gggattcggg gaatgaaggg atgggattca gactagggcc aggacccagg gatggagaga 420
aagagatgag agtggtttgg gggcttggtg acttagagaa cagagctgca ggctcagagg 480
cacacaggag tttctgggct caccctgccc ccttccaacc cctcagttcc catcctccag 540
cagctgtttg tgtgctgcct ctgaagtcca cactgaacaa acttcagcct actcatgtcc 600
ctaaaatggg caaacattgc aagcagcaaa cagcaaacac acagccctcc ctgcctgctg 660
accttggagc tggggcagag gtcagagacc tctctgggcc catgccacct ccaacatcca 720
ctcgacccct tggaatttcg gtggagagga gcagaggttg tcctggcgtg gtttaggtag 780
tgtgagaggg cttaagcgtg aggctccggt gcccgtcagt gggcagagcg cacatcgccc 840
acagtccccg agaagttggg gggaggggtc ggcaattgaa ccggtgccta gagaaggtgg 900
cgcggggtaa actgggaaag tgatgtcgtg tactggctcc gcctttttcc cgagggtggg 960
ggagaaccgt atataagtgc agtagtcgcc gtgaacgttc tttttcgcaa cgggtttgcc 1020
gccagaacac aggtaagtgc cgtgtgtggt tcccgcgggc ctggcctctt tacgggttat 1080
ggcccttgcg tgccttgaat tacttccacc tggctccagt acgtgattct tgatcccgag 1140
ctggagccag gggcgggcct tgcgctttag gagccccttc gcctcgtgct tgagttgagg 1200
cctggcctgg gcgctggggc cgccgcgtgc gaatctggtg gcaccttcgc gcctgtctcg 1260
ctgctttcga taagtctcta gccatttaaa atttttgatg acctgctgcg acgctttttt 1320
tctggcaaga tagtcttgta aatgcgggcc aggatctgca cactggtatt tcggtttttg 1380
gggccgcggg cggcgacggg gcccgtgcgt cccagcgcac atgttcggcg aggcggggcc 1440
tgcgagcgcg gccaccgaga atcggacggg ggtagtctca agctggccgg cctgctctgg 1500
tgcctggcct cgcgccgccg tgtatcgccc cgccctgggc ggcaaggctg gcccggtcgg 1560
caccagttgc gtgagcggaa agatggccgc ttcccggccc tgctccaggg ggctcaaaat 1620
ggaggacgcg gcgctcggga gagcgggcgg gtgagtcacc cacacaaagg aaaggggcct 1680
ttccgtcctc agccgtcgct tcatgtgact ccacggagta ccgggcgccg tccaggcacc 1740
tcgattagtt ctggagcttt tggagtacgt cgtctttagg ttggggggag gggttttatg 1800
cgatggagtt tccccacact gagtgggtgg agactgaagt taggccagct tggcacttga 1860
tgtaattctc cttggaattt gccctttttg agtttggatc ttggttcatt ctcaagcctc 1920
agacagtggt tcaaagtttt tttcttccat ttcaggtgtc gtgagccacc atgtccaccg 1980
ctgtgctgga gaaccctggg ctggggagga aactgtcaga cttcgggcag gagacttcat 2040
acattgagga taactgtaac cagaatggcg ccatctctct gatcttcagc ctgaaggagg 2100
aagtgggcgc cctggcaaag gtgctgcgcc tgtttgagga gaacgacgtg aatctgaccc 2160
acatcgagtc ccggccttct agactgaaga aggacgagta cgagttcttt acccacctgg 2220
ataagcggtc cctgccagcc ctgacaaaca tcatcaagat cctgaggcac gacatcggag 2280
caaccgtgca cgagctgtct cgggacaaga agaaggatac cgtgccctgg ttccctcgga 2340
caatccagga gctggataga tttgccaacc agatcctgtc ttacggagca gagctggacg 2400
cagatcaccc tggcttcaag gacccagtgt atcgggcccg gagaaagcag tttgccgata 2460
tcgcctacaa ttataggcac ggacagccaa tccctcgcgt ggagtatatg gaggaggaga 2520
agaagacctg gggcacagtg ttcaagaccc tgaagagcct gtacaagaca cacgcctgct 2580
acgagtataa ccacatcttc cccctgctgg agaagtattg tggctttcac gaggacaata 2640
tccctcagct ggaggacgtg agccagttcc tgcagacctg cacaggcttt aggctgaggc 2700
cagtggcagg actgctgagc tcccgggact tcctgggagg actggccttc agagtgtttc 2760
actgcaccca gtacatcagg cacggctcca agccaatgta tacaccagag cccgacatct 2820
gtcacgagct gctgggccac gtgcccctgt ttagcgatag atccttcgcc cagttttccc 2880
aggagatcgg actggcatct ctgggagcac ctgacgagta catcgagaag ctggccacca 2940
tctattggtt cacagtggag tttggcctgt gcaagcaggg cgatagcatc aaggcctacg 3000
gagcaggact gctgtctagc ttcggcgagc tgcagtattg tctgtccgag aagccaaagc 3060
tgctgcccct ggagctggag aagaccgcca tccagaacta caccgtgaca gagttccagc 3120
ccctgtacta tgtggccgag tcttttaacg atgccaagga gaaggtgaga aatttcgccg 3180
ccacaatccc taggcccttc agcgtgcggt acgaccctta tacccagagg atcgaggtgc 3240
tggataatac acagcagctg aagatcctgg ctgactcaat caatagcgaa atcggaatcc 3300
tgtgctccgc cctgcagaaa atcaaatgaa tcgtagatcc agacatgata agatacattg 3360
atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt tgtgaaattt 3420
gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt aacaacaaca 3480
attgcattca ttttatgttt caggttcagg gggaggtgtg ggaggttttt taagcttgtt 3540
taaacgtacg tagataagta gcatggcggg ttaatcatta actacaagga acccctagtg 3600
atggagttgg ccactccctc tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag 3660
gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc gcgcagagag 3720
ggagtggcca a 3731
<210> 56
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 来自wtAAV2的37 bp额外的 3' ITR序列
<400> 56
gtagataagt agcatggcgg gttaatcatt aactaca 37
<210> 57
<211> 180
<212> DNA
<213> 人工序列
<220>
<223> 具有额外的37 bp序列的3'ITR
<400> 57
gtagataagt agcatggcgg gttaatcatt aactacaagg aacccctagt gatggagttg 60
gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga 120
cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc 180
<210> 58
<211> 380
<212> DNA
<213> 人工序列
<220>
<223> CMV增强子
<400> 58
ggcattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60
catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120
acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180
ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240
aagtgtatca tatgccaagt ccgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300
ggcattatgc ccagtacatg accttacggg actttcctac ttggcagtac atctacgtat 360
tagtcatcgc tattaccatg 380
<210> 59
<211> 1246
<212> DNA
<213> 人工序列
<220>
<223> CBA启动子
<400> 59
tcgaggtgag ccccacgttc tgcttcactc tccccatctc ccccccctcc ccacccccaa 60
ttttgtattt atttattttt taattatttt gtgcagcgat gggggcgggg gggggggggg 120
ggcgcgcgcc aggcggggcg gggcggggcg aggggcgggg cggggcgagg cggagaggtg 180
cggcggcagc caatcagagc ggcgcgctcc gaaagtttcc ttttatggcg aggcggcggc 240
ggcggcggcc ctataaaaag cgaagcgcgc ggcgggcggg agtcgctgcg cgctgccttc 300
gccccgtgcc ccgctccgcc gccgcctcgc gccgcccgcc ccggctctga ctgaccgcgt 360
tactcccaca ggtgagcggg cgggacggcc cttctcctcc gggctgtaat tagcgcttgg 420
tttaatgacg gcttgtttct tttctgtggc tgcgtgaaag ccttgagggg ctccgggagg 480
gccctttgtg cggggggagc ggctcggggg gtgcgtgcgt gtgtgtgtgc gtggggagcg 540
ccgcgtgcgg ctccgcgctg cccggcggct gtgagcgctg cgggcgcggc gcggggcttt 600
gtgcgctccg cagtgtgcgc gaggggagcg cggccggggg cggtgccccg cggtgcgggg 660
ggggctgcga ggggaacaaa ggctgcgtgc ggggtgtgtg cgtggggggg tgagcagggg 720
gtgtgggcgc gtcggtcggg ctgcaacccc ccctgcaccc ccctccccga gttgctgagc 780
acggcccggc ttcgggtgcg gggctccgta cggggcgtgg cgcggggctc gccgtgccgg 840
gcggggggtg gcggcaggtg ggggtgccgg gcggggcggg gccgcctcgg gccggggagg 900
gctcggggga ggggcgcggc ggcccccgga gcgccggcgg ctgtcgaggc gcggcgagcc 960
gcagccattg ccttttatgg taatcgtgcg agagggcgca gggacttcct ttgtcccaaa 1020
tctgtgcgga gccgaaatct gggaggcgcc gccgcacccc ctctagcggg cgcggggcga 1080
agcggtgcgg cgccggcagg aaggaaatgg gcggggaggg ccttcgtgcg tcgccgcgcc 1140
gccgtcccct tctccctctc cagcctcggg gctgtccgcg gggggacggc tgccttcggg 1200
ggggacgggg cagggcgggg ttcggcttct ggcgtgtgac cggcgg 1246
<210> 60
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 兔beta-珠蛋白元件
<400> 60
cctctgctaa ccatgttcat gccttcttct ttttcctaca gctcctgggc aacgtgctgg 60
ttattgtgct gtctcatcat tttggcaaag aattc 95
<210> 61
<211> 3301
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hPAH-TC-009转移基因组
<400> 61
tggcattgat tattgactag ttattaatag taatcaatta cggggtcatt agttcatagc 60
ccatatatgg agttccgcgt tacataactt acggtaaatg gcccgcctgg ctgaccgccc 120
aacgaccccc gcccattgac gtcaataatg acgtatgttc ccatagtaac gccaataggg 180
actttccatt gacgtcaatg ggtggagtat ttacggtaaa ctgcccactt ggcagtacat 240
caagtgtatc atatgccaag tccgccccct attgacgtca atgacggtaa atggcccgcc 300
tggcattatg cccagtacat gaccttacgg gactttccta cttggcagta catctacgta 360
ttagtcatcg ctattaccat ggtcgaggtg agccccacgt tctgcttcac tctccccatc 420
tcccccccct ccccaccccc aattttgtat ttatttattt tttaattatt ttgtgcagcg 480
atgggggcgg gggggggggg ggggcgcgcg ccaggcgggg cggggcgggg cgaggggcgg 540
ggcggggcga ggcggagagg tgcggcggca gccaatcaga gcggcgcgct ccgaaagttt 600
ccttttatgg cgaggcggcg gcggcggcgg ccctataaaa agcgaagcgc gcggcgggcg 660
ggagtcgctg cgcgctgcct tcgccccgtg ccccgctccg ccgccgcctc gcgccgcccg 720
ccccggctct gactgaccgc gttactccca caggtgagcg ggcgggacgg cccttctcct 780
ccgggctgta attagcgctt ggtttaatga cggcttgttt cttttctgtg gctgcgtgaa 840
agccttgagg ggctccggga gggccctttg tgcgggggga gcggctcggg gggtgcgtgc 900
gtgtgtgtgt gcgtggggag cgccgcgtgc ggctccgcgc tgcccggcgg ctgtgagcgc 960
tgcgggcgcg gcgcggggct ttgtgcgctc cgcagtgtgc gcgaggggag cgcggccggg 1020
ggcggtgccc cgcggtgcgg ggggggctgc gaggggaaca aaggctgcgt gcggggtgtg 1080
tgcgtggggg ggtgagcagg gggtgtgggc gcgtcggtcg ggctgcaacc ccccctgcac 1140
ccccctcccc gagttgctga gcacggcccg gcttcgggtg cggggctccg tacggggcgt 1200
ggcgcggggc tcgccgtgcc gggcgggggg tggcggcagg tgggggtgcc gggcggggcg 1260
gggccgcctc gggccgggga gggctcgggg gaggggcgcg gcggcccccg gagcgccggc 1320
ggctgtcgag gcgcggcgag ccgcagccat tgccttttat ggtaatcgtg cgagagggcg 1380
cagggacttc ctttgtccca aatctgtgcg gagccgaaat ctgggaggcg ccgccgcacc 1440
ccctctagcg ggcgcggggc gaagcggtgc ggcgccggca ggaaggaaat gggcggggag 1500
ggccttcgtg cgtcgccgcg ccgccgtccc cttctccctc tccagcctcg gggctgtccg 1560
cggggggacg gctgccttcg ggggggacgg ggcagggcgg ggttcggctt ctggcgtgtg 1620
accggcggct ctagagcctc tgctaaccat gttcatgcct tcttcttttt cctacagctc 1680
ctgggcaacg tgctggttat tgtgctgtct catcattttg gcaaagaatt ccgccaccat 1740
gtccaccgct gtgctggaga accctgggct ggggaggaaa ctgtcagact tcgggcagga 1800
gacttcatac attgaggata actgtaacca gaatggcgcc atctctctga tcttcagcct 1860
gaaggaggaa gtgggcgccc tggcaaaggt gctgcgcctg tttgaggaga acgacgtgaa 1920
tctgacccac atcgagtccc ggccttctag actgaagaag gacgagtacg agttctttac 1980
ccacctggat aagcggtccc tgccagccct gacaaacatc atcaagatcc tgaggcacga 2040
catcggagca accgtgcacg agctgtctcg ggacaagaag aaggataccg tgccctggtt 2100
ccctcggaca atccaggagc tggatagatt tgccaaccag atcctgtctt acggagcaga 2160
gctggacgca gatcaccctg gcttcaagga cccagtgtat cgggcccgga gaaagcagtt 2220
tgccgatatc gcctacaatt ataggcacgg acagccaatc cctcgcgtgg agtatatgga 2280
ggaggagaag aagacctggg gcacagtgtt caagaccctg aagagcctgt acaagacaca 2340
cgcctgctac gagtataacc acatcttccc cctgctggag aagtattgtg gctttcacga 2400
ggacaatatc cctcagctgg aggacgtgag ccagttcctg cagacctgca caggctttag 2460
gctgaggcca gtggcaggac tgctgagctc ccgggacttc ctgggaggac tggccttcag 2520
agtgtttcac tgcacccagt acatcaggca cggctccaag ccaatgtata caccagagcc 2580
cgacatctgt cacgagctgc tgggccacgt gcccctgttt agcgatagat ccttcgccca 2640
gttttcccag gagatcggac tggcatctct gggagcacct gacgagtaca tcgagaagct 2700
ggccaccatc tattggttca cagtggagtt tggcctgtgc aagcagggcg atagcatcaa 2760
ggcctacgga gcaggactgc tgtctagctt cggcgagctg cagtattgtc tgtccgagaa 2820
gccaaagctg ctgcccctgg agctggagaa gaccgccatc cagaactaca ccgtgacaga 2880
gttccagccc ctgtactatg tggccgagtc ttttaacgat gccaaggaga aggtgagaaa 2940
tttcgccgcc acaatcccta ggcccttcag cgtgcggtac gacccttata cccagaggat 3000
cgaggtgctg gataatacac agcagctgaa gatcctggct gactcaatca atagcgaaat 3060
cggaatcctg tgctccgccc tgcagaaaat caaatgaatc gtagatccag acatgataag 3120
atacattgat gagtttggac aaaccacaac tagaatgcag tgaaaaaaat gctttatttg 3180
tgaaatttgt gatgctattg ctttatttgt aaccattata agctgcaata aacaagttaa 3240
caacaacaat tgcattcatt ttatgtttca ggttcagggg gaggtgtggg aggtttttta 3300
a 3301
<210> 62
<211> 3701
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hPAH-TC-009转移基因组
<400> 62
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag gtcctgcaga tctggcattg attattgact agttattaat agtaatcaat 240
tacggggtca ttagttcata gcccatatat ggagttccgc gttacataac ttacggtaaa 300
tggcccgcct ggctgaccgc ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt 360
tcccatagta acgccaatag ggactttcca ttgacgtcaa tgggtggagt atttacggta 420
aactgcccac ttggcagtac atcaagtgta tcatatgcca agtccgcccc ctattgacgt 480
caatgacggt aaatggcccg cctggcatta tgcccagtac atgaccttac gggactttcc 540
tacttggcag tacatctacg tattagtcat cgctattacc atggtcgagg tgagccccac 600
gttctgcttc actctcccca tctccccccc ctccccaccc ccaattttgt atttatttat 660
tttttaatta ttttgtgcag cgatgggggc gggggggggg ggggggcgcg cgccaggcgg 720
ggcggggcgg ggcgaggggc ggggcggggc gaggcggaga ggtgcggcgg cagccaatca 780
gagcggcgcg ctccgaaagt ttccttttat ggcgaggcgg cggcggcggc ggccctataa 840
aaagcgaagc gcgcggcggg cgggagtcgc tgcgcgctgc cttcgccccg tgccccgctc 900
cgccgccgcc tcgcgccgcc cgccccggct ctgactgacc gcgttactcc cacaggtgag 960
cgggcgggac ggcccttctc ctccgggctg taattagcgc ttggtttaat gacggcttgt 1020
ttcttttctg tggctgcgtg aaagccttga ggggctccgg gagggccctt tgtgcggggg 1080
gagcggctcg gggggtgcgt gcgtgtgtgt gtgcgtgggg agcgccgcgt gcggctccgc 1140
gctgcccggc ggctgtgagc gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt 1200
gcgcgagggg agcgcggccg ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa 1260
caaaggctgc gtgcggggtg tgtgcgtggg ggggtgagca gggggtgtgg gcgcgtcggt 1320
cgggctgcaa ccccccctgc acccccctcc ccgagttgct gagcacggcc cggcttcggg 1380
tgcggggctc cgtacggggc gtggcgcggg gctcgccgtg ccgggcgggg ggtggcggca 1440
ggtgggggtg ccgggcgggg cggggccgcc tcgggccggg gagggctcgg gggaggggcg 1500
cggcggcccc cggagcgccg gcggctgtcg aggcgcggcg agccgcagcc attgcctttt 1560
atggtaatcg tgcgagaggg cgcagggact tcctttgtcc caaatctgtg cggagccgaa 1620
atctgggagg cgccgccgca ccccctctag cgggcgcggg gcgaagcggt gcggcgccgg 1680
caggaaggaa atgggcgggg agggccttcg tgcgtcgccg cgccgccgtc cccttctccc 1740
tctccagcct cggggctgtc cgcgggggga cggctgcctt cgggggggac ggggcagggc 1800
ggggttcggc ttctggcgtg tgaccggcgg ctctagagcc tctgctaacc atgttcatgc 1860
cttcttcttt ttcctacagc tcctgggcaa cgtgctggtt attgtgctgt ctcatcattt 1920
tggcaaagaa ttccgccacc atgtccaccg ctgtgctgga gaaccctggg ctggggagga 1980
aactgtcaga cttcgggcag gagacttcat acattgagga taactgtaac cagaatggcg 2040
ccatctctct gatcttcagc ctgaaggagg aagtgggcgc cctggcaaag gtgctgcgcc 2100
tgtttgagga gaacgacgtg aatctgaccc acatcgagtc ccggccttct agactgaaga 2160
aggacgagta cgagttcttt acccacctgg ataagcggtc cctgccagcc ctgacaaaca 2220
tcatcaagat cctgaggcac gacatcggag caaccgtgca cgagctgtct cgggacaaga 2280
agaaggatac cgtgccctgg ttccctcgga caatccagga gctggataga tttgccaacc 2340
agatcctgtc ttacggagca gagctggacg cagatcaccc tggcttcaag gacccagtgt 2400
atcgggcccg gagaaagcag tttgccgata tcgcctacaa ttataggcac ggacagccaa 2460
tccctcgcgt ggagtatatg gaggaggaga agaagacctg gggcacagtg ttcaagaccc 2520
tgaagagcct gtacaagaca cacgcctgct acgagtataa ccacatcttc cccctgctgg 2580
agaagtattg tggctttcac gaggacaata tccctcagct ggaggacgtg agccagttcc 2640
tgcagacctg cacaggcttt aggctgaggc cagtggcagg actgctgagc tcccgggact 2700
tcctgggagg actggccttc agagtgtttc actgcaccca gtacatcagg cacggctcca 2760
agccaatgta tacaccagag cccgacatct gtcacgagct gctgggccac gtgcccctgt 2820
ttagcgatag atccttcgcc cagttttccc aggagatcgg actggcatct ctgggagcac 2880
ctgacgagta catcgagaag ctggccacca tctattggtt cacagtggag tttggcctgt 2940
gcaagcaggg cgatagcatc aaggcctacg gagcaggact gctgtctagc ttcggcgagc 3000
tgcagtattg tctgtccgag aagccaaagc tgctgcccct ggagctggag aagaccgcca 3060
tccagaacta caccgtgaca gagttccagc ccctgtacta tgtggccgag tcttttaacg 3120
atgccaagga gaaggtgaga aatttcgccg ccacaatccc taggcccttc agcgtgcggt 3180
acgaccctta tacccagagg atcgaggtgc tggataatac acagcagctg aagatcctgg 3240
ctgactcaat caatagcgaa atcggaatcc tgtgctccgc cctgcagaaa atcaaatgaa 3300
tcgtagatcc agacatgata agatacattg atgagtttgg acaaaccaca actagaatgc 3360
agtgaaaaaa atgctttatt tgtgaaattt gtgatgctat tgctttattt gtaaccatta 3420
taagctgcaa taaacaagtt aacaacaaca attgcattca ttttatgttt caggttcagg 3480
gggaggtgtg ggaggttttt taagcttgtt taaacgtacg tagataagta gcatggcggg 3540
ttaatcatta actacaagga acccctagtg atggagttgg ccactccctc tctgcgcgct 3600
cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg 3660
gcctcagtga gcgagcgagc gcgcagagag ggagtggcca a 3701
<210> 63
<211> 1061
<212> DNA
<213> 人工序列
<220>
<223> CASI启动子区
<400> 63
tagggaggtc ctgcacgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 60
cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac 120
tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca 180
agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg 240
gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt 300
agtcatcgct attaccatgg tcgaggtgag ccccacgttc tgcttcactc tccccatctc 360
ccccccctcc ccacccccaa ttttgtattt atttattttt taattatttt gtgcagcgat 420
gggggcgggg gggggggggg gcgcgcgcca ggcggggcgg ggcggggcga ggggcggggc 480
ggggcgaggc ggagaggtgc ggcggcagcc aatcagagcg gcgcgctccg aaagtttcct 540
tttatggcga ggcggcggcg gcggcggccc tataaaaagc gaagcgcgcg gcgggcggga 600
gtcgctgcgc gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc 660
cggctctgac tgaccgcgtt actaaaacag gtaagtccgg cctccgcgcc gggttttggc 720
gcctcccgcg ggcgcccccc tcctcacggc gagcgctgcc acgtcagacg aagggcgcag 780
cgagcgtcct gatccttccg cccggacgct caggacagcg gcccgctgct cataagactc 840
ggccttagaa ccccagtatc agcagaagga cattttagga cgggacttgg gtgactctag 900
ggcactggtt ttctttccag agagcggaac aggcgaggaa aagtagtccc ttctcggcga 960
ttctgcggag ggatctccgt ggggcggtga acgccgatga tgcctctact aaccatgttc 1020
atgttttctt tttttttcta caggtcctgg gtgacgaaca g 1061
<210> 64
<211> 2630
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hPAH-TC-013转移基因组
<400> 64
tagggaggtc ctgcacgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 60
cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac 120
tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca 180
agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg 240
gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt 300
agtcatcgct attaccatgg tcgaggtgag ccccacgttc tgcttcactc tccccatctc 360
ccccccctcc ccacccccaa ttttgtattt atttattttt taattatttt gtgcagcgat 420
gggggcgggg gggggggggg gcgcgcgcca ggcggggcgg ggcggggcga ggggcggggc 480
ggggcgaggc ggagaggtgc ggcggcagcc aatcagagcg gcgcgctccg aaagtttcct 540
tttatggcga ggcggcggcg gcggcggccc tataaaaagc gaagcgcgcg gcgggcggga 600
gtcgctgcgc gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc 660
cggctctgac tgaccgcgtt actaaaacag gtaagtccgg cctccgcgcc gggttttggc 720
gcctcccgcg ggcgcccccc tcctcacggc gagcgctgcc acgtcagacg aagggcgcag 780
cgagcgtcct gatccttccg cccggacgct caggacagcg gcccgctgct cataagactc 840
ggccttagaa ccccagtatc agcagaagga cattttagga cgggacttgg gtgactctag 900
ggcactggtt ttctttccag agagcggaac aggcgaggaa aagtagtccc ttctcggcga 960
ttctgcggag ggatctccgt ggggcggtga acgccgatga tgcctctact aaccatgttc 1020
atgttttctt tttttttcta caggtcctgg gtgacgaaca ggccaccatg tccaccgctg 1080
tgctggagaa ccctgggctg gggaggaaac tgtcagactt cgggcaggag acttcataca 1140
ttgaggataa ctgtaaccag aatggcgcca tctctctgat cttcagcctg aaggaggaag 1200
tgggcgccct ggcaaaggtg ctgcgcctgt ttgaggagaa cgacgtgaat ctgacccaca 1260
tcgagtcccg gccttctaga ctgaagaagg acgagtacga gttctttacc cacctggata 1320
agcggtccct gccagccctg acaaacatca tcaagatcct gaggcacgac atcggagcaa 1380
ccgtgcacga gctgtctcgg gacaagaaga aggataccgt gccctggttc cctcggacaa 1440
tccaggagct ggatagattt gccaaccaga tcctgtctta cggagcagag ctggacgcag 1500
atcaccctgg cttcaaggac ccagtgtatc gggcccggag aaagcagttt gccgatatcg 1560
cctacaatta taggcacgga cagccaatcc ctcgcgtgga gtatatggag gaggagaaga 1620
agacctgggg cacagtgttc aagaccctga agagcctgta caagacacac gcctgctacg 1680
agtataacca catcttcccc ctgctggaga agtattgtgg ctttcacgag gacaatatcc 1740
ctcagctgga ggacgtgagc cagttcctgc agacctgcac aggctttagg ctgaggccag 1800
tggcaggact gctgagctcc cgggacttcc tgggaggact ggccttcaga gtgtttcact 1860
gcacccagta catcaggcac ggctccaagc caatgtatac accagagccc gacatctgtc 1920
acgagctgct gggccacgtg cccctgttta gcgatagatc cttcgcccag ttttcccagg 1980
agatcggact ggcatctctg ggagcacctg acgagtacat cgagaagctg gccaccatct 2040
attggttcac agtggagttt ggcctgtgca agcagggcga tagcatcaag gcctacggag 2100
caggactgct gtctagcttc ggcgagctgc agtattgtct gtccgagaag ccaaagctgc 2160
tgcccctgga gctggagaag accgccatcc agaactacac cgtgacagag ttccagcccc 2220
tgtactatgt ggccgagtct tttaacgatg ccaaggagaa ggtgagaaat ttcgccgcca 2280
caatccctag gcccttcagc gtgcggtacg acccttatac ccagaggatc gaggtgctgg 2340
ataatacaca gcagctgaag atcctggctg actcaatcaa tagcgaaatc ggaatcctgt 2400
gctccgccct gcagaaaatc aaatgaatcg tagatccaga catgataaga tacattgatg 2460
agtttggaca aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg 2520
atgctattgc tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt 2580
gcattcattt tatgtttcag gttcaggggg aggtgtggga ggttttttaa 2630
<210> 65
<211> 3011
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hPAH-TC-013转移基因组
<400> 65
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag gtcctgcacg ttacataact tacggtaaat ggcccgcctg gctgaccgcc 240
caacgacccc cgcccattga cgtcaataat gacgtatgtt cccatagtaa cgccaatagg 300
gactttccat tgacgtcaat gggtggagta tttacggtaa actgcccact tggcagtaca 360
tcaagtgtat catatgccaa gtacgccccc tattgacgtc aatgacggta aatggcccgc 420
ctggcattat gcccagtaca tgaccttatg ggactttcct acttggcagt acatctacgt 480
attagtcatc gctattacca tggtcgaggt gagccccacg ttctgcttca ctctccccat 540
ctcccccccc tccccacccc caattttgta tttatttatt ttttaattat tttgtgcagc 600
gatgggggcg gggggggggg ggggcgcgcg ccaggcgggg cggggcgggg cgaggggcgg 660
ggcggggcga ggcggagagg tgcggcggca gccaatcaga gcggcgcgct ccgaaagttt 720
ccttttatgg cgaggcggcg gcggcggcgg ccctataaaa agcgaagcgc gcggcgggcg 780
ggagtcgctg cgcgctgcct tcgccccgtg ccccgctccg ccgccgcctc gcgccgcccg 840
ccccggctct gactgaccgc gttactaaaa caggtaagtc cggcctccgc gccgggtttt 900
ggcgcctccc gcgggcgccc ccctcctcac ggcgagcgct gccacgtcag acgaagggcg 960
cagcgagcgt cctgatcctt ccgcccggac gctcaggaca gcggcccgct gctcataaga 1020
ctcggcctta gaaccccagt atcagcagaa ggacatttta ggacgggact tgggtgactc 1080
tagggcactg gttttctttc cagagagcgg aacaggcgag gaaaagtagt cccttctcgg 1140
cgattctgcg gagggatctc cgtggggcgg tgaacgccga tgatgcctct actaaccatg 1200
ttcatgtttt cttttttttt ctacaggtcc tgggtgacga acaggccacc atgtccaccg 1260
ctgtgctgga gaaccctggg ctggggagga aactgtcaga cttcgggcag gagacttcat 1320
acattgagga taactgtaac cagaatggcg ccatctctct gatcttcagc ctgaaggagg 1380
aagtgggcgc cctggcaaag gtgctgcgcc tgtttgagga gaacgacgtg aatctgaccc 1440
acatcgagtc ccggccttct agactgaaga aggacgagta cgagttcttt acccacctgg 1500
ataagcggtc cctgccagcc ctgacaaaca tcatcaagat cctgaggcac gacatcggag 1560
caaccgtgca cgagctgtct cgggacaaga agaaggatac cgtgccctgg ttccctcgga 1620
caatccagga gctggataga tttgccaacc agatcctgtc ttacggagca gagctggacg 1680
cagatcaccc tggcttcaag gacccagtgt atcgggcccg gagaaagcag tttgccgata 1740
tcgcctacaa ttataggcac ggacagccaa tccctcgcgt ggagtatatg gaggaggaga 1800
agaagacctg gggcacagtg ttcaagaccc tgaagagcct gtacaagaca cacgcctgct 1860
acgagtataa ccacatcttc cccctgctgg agaagtattg tggctttcac gaggacaata 1920
tccctcagct ggaggacgtg agccagttcc tgcagacctg cacaggcttt aggctgaggc 1980
cagtggcagg actgctgagc tcccgggact tcctgggagg actggccttc agagtgtttc 2040
actgcaccca gtacatcagg cacggctcca agccaatgta tacaccagag cccgacatct 2100
gtcacgagct gctgggccac gtgcccctgt ttagcgatag atccttcgcc cagttttccc 2160
aggagatcgg actggcatct ctgggagcac ctgacgagta catcgagaag ctggccacca 2220
tctattggtt cacagtggag tttggcctgt gcaagcaggg cgatagcatc aaggcctacg 2280
gagcaggact gctgtctagc ttcggcgagc tgcagtattg tctgtccgag aagccaaagc 2340
tgctgcccct ggagctggag aagaccgcca tccagaacta caccgtgaca gagttccagc 2400
ccctgtacta tgtggccgag tcttttaacg atgccaagga gaaggtgaga aatttcgccg 2460
ccacaatccc taggcccttc agcgtgcggt acgaccctta tacccagagg atcgaggtgc 2520
tggataatac acagcagctg aagatcctgg ctgactcaat caatagcgaa atcggaatcc 2580
tgtgctccgc cctgcagaaa atcaaatgaa tcgtagatcc agacatgata agatacattg 2640
atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt tgtgaaattt 2700
gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt aacaacaaca 2760
attgcattca ttttatgttt caggttcagg gggaggtgtg ggaggttttt taagcttgtt 2820
taaacgtacg tagataagta gcatggcggg ttaatcatta actacaagga acccctagtg 2880
atggagttgg ccactccctc tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag 2940
gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc gcgcagagag 3000
ggagtggcca a 3011
<210> 66
<211> 913
<212> DNA
<213> 人工序列
<220>
<223> hAAT启动子区
<400> 66
tagggaggtc ctgcacagaa ggggaggagg gggcagcagc tgtctgacca ctgttggtct 60
tgcaacttgt gtccccaggt taatttttaa aaagcagtca aaagtccaag tggcccttgg 120
cagcatttac tctctctgtt tgctctggtt aataatctca ggagcacaaa cattcctgga 180
ggcaggagaa gaaatcaaca tcctggactt atcctctggg cctctcccca cccccaggat 240
tgtaactgaa atgcttcact ggtgctcctt ttgttttaag gcattggatc ttcatagcta 300
ctgatcgtgc ccaagcacac agtatctgca gcaaccactt aggcctccag gaatgtggtg 360
accattgacc ctaattcatt ccccttcatg gatcctatgt aaccatcctc caaaaagagc 420
tttcgcaaac tcaaataaac acaggaaagg aagaccttct tatctttgag agtatatgtt 480
tagccctata gctctaaccc actctgatct cccagggcgg cagtaagtct tcagcatcag 540
gcattttggg gtgactcagt aaatggtaga tcttgctacc agtggaacag ccactaagga 600
ttctgcagtg agagcagagg gccagctaag tggtactctc ccagagactg tctgactcac 660
gccaccccct ccaccttgga cacaggacgc tgtggtttct gagccaggta caatgactcc 720
tttcggtaag tgcagtggaa gctgtacact gcccaggcaa agcgtccggg cagcgtaggc 780
gggcgactca gatcccagcc agtggactta gcccctgttt gctcctccga taactggggt 840
gaccttggtt aatattcacc agcagcctcc cccgttgccc ctctggatcc actgcttaaa 900
tacggacgag gac 913
<210> 67
<211> 2600
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hPAH-TC-017转移基因组
<400> 67
tagggaggtc ctgcacagaa ggggaggagg gggcagcagc tgtctgacca ctgttggtct 60
tgcaacttgt gtccccaggt taatttttaa aaagcagtca aaagtccaag tggcccttgg 120
cagcatttac tctctctgtt tgctctggtt aataatctca ggagcacaaa cattcctgga 180
ggcaggagaa gaaatcaaca tcctggactt atcctctggg cctctcccca cccccaggat 240
tgtaactgaa atgcttcact ggtgctcctt ttgttttaag gcattggatc ttcatagcta 300
ctgatcgtgc ccaagcacac agtatctgca gcaaccactt aggcctccag gaatgtggtg 360
accattgacc ctaattcatt ccccttcatg gatcctatgt aaccatcctc caaaaagagc 420
tttcgcaaac tcaaataaac acaggaaagg aagaccttct tatctttgag agtatatgtt 480
tagccctata gctctaaccc actctgatct cccagggcgg cagtaagtct tcagcatcag 540
gcattttggg gtgactcagt aaatggtaga tcttgctacc agtggaacag ccactaagga 600
ttctgcagtg agagcagagg gccagctaag tggtactctc ccagagactg tctgactcac 660
gccaccccct ccaccttgga cacaggacgc tgtggtttct gagccaggta caatgactcc 720
tttcggtaag tgcagtggaa gctgtacact gcccaggcaa agcgtccggg cagcgtaggc 780
gggcgactca gatcccagcc agtggactta gcccctgttt gctcctccga taactggggt 840
gaccttggtt aatattcacc agcagcctcc cccgttgccc ctctggatcc actgcttaaa 900
tacggacgag gacgctagcg ccggcaagag gtaagggttt aagggatggt tggttggtgg 960
ggtattaatg tttaattacc tggagcacct gcctgaaatc actttttttc aggttggtta 1020
attaaggatc cgccaccatg tccaccgctg tgctggagaa ccctgggctg gggaggaaac 1080
tgtcagactt cgggcaggag acttcataca ttgaggataa ctgtaaccag aatggcgcca 1140
tctctctgat cttcagcctg aaggaggaag tgggcgccct ggcaaaggtg ctgcgcctgt 1200
ttgaggagaa cgacgtgaat ctgacccaca tcgagtcccg gccttctaga ctgaagaagg 1260
acgagtacga gttctttacc cacctggata agcggtccct gccagccctg acaaacatca 1320
tcaagatcct gaggcacgac atcggagcaa ccgtgcacga gctgtctcgg gacaagaaga 1380
aggataccgt gccctggttc cctcggacaa tccaggagct ggatagattt gccaaccaga 1440
tcctgtctta cggagcagag ctggacgcag atcaccctgg cttcaaggac ccagtgtatc 1500
gggcccggag aaagcagttt gccgatatcg cctacaatta taggcacgga cagccaatcc 1560
ctcgcgtgga gtatatggag gaggagaaga agacctgggg cacagtgttc aagaccctga 1620
agagcctgta caagacacac gcctgctacg agtataacca catcttcccc ctgctggaga 1680
agtattgtgg ctttcacgag gacaatatcc ctcagctgga ggacgtgagc cagttcctgc 1740
agacctgcac aggctttagg ctgaggccag tggcaggact gctgagctcc cgggacttcc 1800
tgggaggact ggccttcaga gtgtttcact gcacccagta catcaggcac ggctccaagc 1860
caatgtatac accagagccc gacatctgtc acgagctgct gggccacgtg cccctgttta 1920
gcgatagatc cttcgcccag ttttcccagg agatcggact ggcatctctg ggagcacctg 1980
acgagtacat cgagaagctg gccaccatct attggttcac agtggagttt ggcctgtgca 2040
agcagggcga tagcatcaag gcctacggag caggactgct gtctagcttc ggcgagctgc 2100
agtattgtct gtccgagaag ccaaagctgc tgcccctgga gctggagaag accgccatcc 2160
agaactacac cgtgacagag ttccagcccc tgtactatgt ggccgagtct tttaacgatg 2220
ccaaggagaa ggtgagaaat ttcgccgcca caatccctag gcccttcagc gtgcggtacg 2280
acccttatac ccagaggatc gaggtgctgg ataatacaca gcagctgaag atcctggctg 2340
actcaatcaa tagcgaaatc ggaatcctgt gctccgccct gcagaaaatc aaatgaatcg 2400
tagatccaga catgataaga tacattgatg agtttggaca aaccacaact agaatgcagt 2460
gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc tttatttgta accattataa 2520
gctgcaataa acaagttaac aacaacaatt gcattcattt tatgtttcag gttcaggggg 2580
aggtgtggga ggttttttaa 2600
<210> 68
<211> 2981
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hPAH-TC-017转移基因组
<400> 68
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag gtcctgcaca gaaggggagg agggggcagc agctgtctga ccactgttgg 240
tcttgcaact tgtgtcccca ggttaatttt taaaaagcag tcaaaagtcc aagtggccct 300
tggcagcatt tactctctct gtttgctctg gttaataatc tcaggagcac aaacattcct 360
ggaggcagga gaagaaatca acatcctgga cttatcctct gggcctctcc ccacccccag 420
gattgtaact gaaatgcttc actggtgctc cttttgtttt aaggcattgg atcttcatag 480
ctactgatcg tgcccaagca cacagtatct gcagcaacca cttaggcctc caggaatgtg 540
gtgaccattg accctaattc attccccttc atggatccta tgtaaccatc ctccaaaaag 600
agctttcgca aactcaaata aacacaggaa aggaagacct tcttatcttt gagagtatat 660
gtttagccct atagctctaa cccactctga tctcccaggg cggcagtaag tcttcagcat 720
caggcatttt ggggtgactc agtaaatggt agatcttgct accagtggaa cagccactaa 780
ggattctgca gtgagagcag agggccagct aagtggtact ctcccagaga ctgtctgact 840
cacgccaccc cctccacctt ggacacagga cgctgtggtt tctgagccag gtacaatgac 900
tcctttcggt aagtgcagtg gaagctgtac actgcccagg caaagcgtcc gggcagcgta 960
ggcgggcgac tcagatccca gccagtggac ttagcccctg tttgctcctc cgataactgg 1020
ggtgaccttg gttaatattc accagcagcc tcccccgttg cccctctgga tccactgctt 1080
aaatacggac gaggacgcta gcgccggcaa gaggtaaggg tttaagggat ggttggttgg 1140
tggggtatta atgtttaatt acctggagca cctgcctgaa atcacttttt ttcaggttgg 1200
ttaattaagg atccgccacc atgtccaccg ctgtgctgga gaaccctggg ctggggagga 1260
aactgtcaga cttcgggcag gagacttcat acattgagga taactgtaac cagaatggcg 1320
ccatctctct gatcttcagc ctgaaggagg aagtgggcgc cctggcaaag gtgctgcgcc 1380
tgtttgagga gaacgacgtg aatctgaccc acatcgagtc ccggccttct agactgaaga 1440
aggacgagta cgagttcttt acccacctgg ataagcggtc cctgccagcc ctgacaaaca 1500
tcatcaagat cctgaggcac gacatcggag caaccgtgca cgagctgtct cgggacaaga 1560
agaaggatac cgtgccctgg ttccctcgga caatccagga gctggataga tttgccaacc 1620
agatcctgtc ttacggagca gagctggacg cagatcaccc tggcttcaag gacccagtgt 1680
atcgggcccg gagaaagcag tttgccgata tcgcctacaa ttataggcac ggacagccaa 1740
tccctcgcgt ggagtatatg gaggaggaga agaagacctg gggcacagtg ttcaagaccc 1800
tgaagagcct gtacaagaca cacgcctgct acgagtataa ccacatcttc cccctgctgg 1860
agaagtattg tggctttcac gaggacaata tccctcagct ggaggacgtg agccagttcc 1920
tgcagacctg cacaggcttt aggctgaggc cagtggcagg actgctgagc tcccgggact 1980
tcctgggagg actggccttc agagtgtttc actgcaccca gtacatcagg cacggctcca 2040
agccaatgta tacaccagag cccgacatct gtcacgagct gctgggccac gtgcccctgt 2100
ttagcgatag atccttcgcc cagttttccc aggagatcgg actggcatct ctgggagcac 2160
ctgacgagta catcgagaag ctggccacca tctattggtt cacagtggag tttggcctgt 2220
gcaagcaggg cgatagcatc aaggcctacg gagcaggact gctgtctagc ttcggcgagc 2280
tgcagtattg tctgtccgag aagccaaagc tgctgcccct ggagctggag aagaccgcca 2340
tccagaacta caccgtgaca gagttccagc ccctgtacta tgtggccgag tcttttaacg 2400
atgccaagga gaaggtgaga aatttcgccg ccacaatccc taggcccttc agcgtgcggt 2460
acgaccctta tacccagagg atcgaggtgc tggataatac acagcagctg aagatcctgg 2520
ctgactcaat caatagcgaa atcggaatcc tgtgctccgc cctgcagaaa atcaaatgaa 2580
tcgtagatcc agacatgata agatacattg atgagtttgg acaaaccaca actagaatgc 2640
agtgaaaaaa atgctttatt tgtgaaattt gtgatgctat tgctttattt gtaaccatta 2700
taagctgcaa taaacaagtt aacaacaaca attgcattca ttttatgttt caggttcagg 2760
gggaggtgtg ggaggttttt taagcttgtt taaacgtacg tagataagta gcatggcggg 2820
ttaatcatta actacaagga acccctagtg atggagttgg ccactccctc tctgcgcgct 2880
cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg 2940
gcctcagtga gcgagcgagc gcgcagagag ggagtggcca a 2981
<210> 69
<211> 1359
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hPAH-TC-018 PAH序列
<400> 69
atgtccactg ctgtgctgga gaacccaggc ctgggcagga agttgagtga ctttgggcag 60
gagacctcct acatagaaga caattgcaat cagaatgggg ccatctctct gatcttcagc 120
cttaaagagg aggtgggtgc tctggcaaaa gtgctcagac tctttgagga gaatgatgtg 180
aatctcaccc acattgaatc caggcccagc agactcaaaa aggatgaata tgaattcttc 240
acccacttgg acaaaaggtc cttacctgcc cttacaaata tcatcaaaat tttgagacat 300
gacatagggg caactgtaca tgaactgagt agagataaaa aaaaagacac agtcccctgg 360
ttccccagga ccatccagga attggacagg tttgcaaacc agatactgag ctatggtgct 420
gagttggatg ctgatcaccc aggcttcaag gaccctgtgt acagagcaag gagaaagcag 480
tttgctgaca ttgcctacaa ttacaggcac ggccaaccca ttcctagagt cgagtacatg 540
gaagaagaga agaaaacctg gggcactgtc ttcaagaccc tgaagtcact gtacaagaca 600
catgcctgct atgaatacaa ccacatattt ccactcctag agaaatactg tggattccat 660
gaggacaata taccccaatt ggaggatgtc tcacagtttc tgcagacttg tacaggtttt 720
aggctgaggc cagtggctgg gcttctcagc agcagggact tcctgggtgg actggccttc 780
agggtgtttc actgtacaca atacatcaga catggtagca aaccaatgta tactcctgaa 840
ccagacatct gccatgagct gcttgggcat gtgcctctgt tttcagacag gtcctttgct 900
cagttctcac aagagattgg gctagcttca ctgggagctc cagatgagta tattgaaaaa 960
ctggcaacaa tttactggtt tacagtggag tttggacttt gtaagcaggg agactccatc 1020
aaggcctatg gtgcaggatt gttgtcttcc tttggggaac tgcaatattg tctctctgaa 1080
aagcctaagt tgctaccact ggagcttgag aagactgcca ttcagaacta cacagtgact 1140
gaattccagc ccctctacta tgttgcagag tctttcaatg atgccaagga gaaggttagg 1200
aactttgctg caacaatccc cagacctttc agtgtgaggt atgaccccta cactcagaga 1260
attgaagttc tggataacac ccagcagctg aaaattctgg cagatagtat caactctgag 1320
attggaatcc tgtgttctgc cctgcagaag atcaagtga 1359
<210> 70
<211> 1359
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hPAH-TC-019 PAH序列
<400> 70
atgtccactg ctgtgctgga gaacccaggc ctgggcagga agttgagtga ctttgggcag 60
gagacctcct acatagaaga caattgcaat cagaatgggg ccatctctct gatcttcagc 120
cttaaagagg aggtgggtgc tctggcaaaa gtgctcagac tgtttgagga gaatgatgtg 180
aatctcaccc acattgaatc caggcccagc agactcaaaa aggatgaata tgaattcttc 240
acccacttgg acaaaaggtc cttacctgcc cttacaaata tcatcaaaat tttgagacat 300
gacatagggg caactgtaca tgaactgagt agagataaaa aaaaagacac agtcccctgg 360
ttccccagga ccatccagga attggacagg tttgcaaacc agatactgag ctatggtgct 420
gagttggatg ctgatcaccc aggcttcaag gaccctgtgt acagagcaag gagaaagcag 480
tttgctgaca ttgcctacaa ttacaggcac ggccaaccca ttcctagagt cgagtacatg 540
gaagaagaga agaaaacctg gggcactgtc ttcaagaccc tgaagtcact gtacaagaca 600
catgcctgct atgaatacaa ccacatattt ccactcctag agaaatactg tggattccat 660
gaggacaata taccccaatt ggaggatgtc tcacagtttc tgcagacttg tacaggtttt 720
aggctgaggc cagtggctgg gctcctcagc agcagggact tcctgggtgg actggccttt 780
cgagttttcc actgtactca gtatatcaga catggctcca agcctatgta taccccagaa 840
cctgacatct gccatgaact gcttgggcat gtgcctctct tttcagaccg ttcctttgcc 900
cagttttctc aggagattgg actagccagc ctaggtgcac cagatgagta cattgagaag 960
ttagcaacca tttactggtt cacagtggag ttcggtctct gcaagcaagg ggactcaata 1020
aaggcctatg gagcaggcct cctgtcaagt tttggagaac tccaatactg cctatctgag 1080
aagcctaaat tattaccctt ggaactagaa aaaactgcaa tacagaacta cacagtgact 1140
gagtttcagc cactctacta tgtggcagag tcctttaatg atgccaaaga aaaggtccga 1200
aattttgctg caacaattcc caggcccttc tctgttcgct atgatccata cacccaaaga 1260
attgaagtcc tagataacac ccagcagctg aaaatcctgg cagacagtat caactctgaa 1320
attggaatcc tctgttctgc cctgcagaag atcaagtga 1359
<210> 71
<211> 1359
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hPAH-TC-020 PAH序列
<400> 71
atgtccactg ctgtgctgga gaacccaggc ctgggcagga agttgagtga ctttgggcag 60
gagacctcct acatagaaga caattgcaat cagaatgggg ccatctctct gatcttcagc 120
cttaaagagg aggtgggtgc tctggcaaaa gtgctcagac tctttgagga gaatgatgtg 180
aatctcaccc acattgaatc caggcccagc agactcaaaa aggatgaata tgaattcttc 240
acccacttgg acaaaaggtc cttacctgcc cttacaaata tcatcaaaat tttgagacat 300
gacatagggg caactgtaca tgaactgagt agagataaaa aaaaagacac agtcccctgg 360
ttccccagga ccatccagga attggacagg tttgcaaacc agatactgag ctatggtgct 420
gagttggatg ctgatcaccc aggcttcaag gaccctgtgt acagagcaag gagaaagcag 480
tttgctgaca ttgcctacaa ttacaggcac ggccaaccca ttcctagagt cgagtacatg 540
gaagaagaga agaaaacctg gggcactgtc ttcaagaccc tgaagtcact gtacaagaca 600
catgcctgct atgaatacaa ccacatattt ccactcctag agaaatactg tggattccat 660
gaggacaata taccccaatt ggaggatgtc tcacagtttc tgcagacttg tacaggtttt 720
aggctgaggc cagtggctgg gcttctcagc agcagggact tcctgggtgg actggccttc 780
agggtgtttc actgtacaca atacatcaga catggtagca aaccaatgta tactcctgaa 840
ccagacatct gccatgagct gcttgggcat gtgcctctgt tcagcgacag aagctttgct 900
cagtttagcc aggagattgg gctggccagc ctgggcgccc ctgatgagta tatcgagaaa 960
ctggccacaa tctactggtt cacagtggag ttcggcctgt gcaagcaggg cgactcaatc 1020
aaggcctatg gcgccggcct gctgagcagc ttcggcgaac tgcagtactg cctgagcgag 1080
aagcccaagc tgctgccact ggagctggag aaaaccgcca tccagaacta cacagtgaca 1140
gagttccagc ctctgtacta tgtggccgag agcttcaacg atgccaagga gaaggtgagg 1200
aattttgccg ccactatccc caggcctttc tccgtgagat atgaccccta cacccagcga 1260
atcgaggtgc tggacaatac ccagcagctg aagatcctgg ccgattccat caactctgag 1320
atcggcattc tgtgtagcgc cctgcagaag attaagtga 1359
<210> 72
<211> 1359
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hPAH-TC-021 PAH序列
<400> 72
atgtccactg ctgtgctgga gaacccaggc ctgggaagga agctgagtga ctttggccag 60
gagacctcct acatagagga caactgcaat cagaacgggg ccatcagcct gatcttcagc 120
cttaaagagg aggtaggcgc tctggcaaaa gtgctcagac tctttgagga gaatgatgtg 180
aatctcaccc acattgaatc caggcccagc agactcaaaa aggatgaata tgaatttttc 240
acccacttgg acaaaaggtc cttacctgcc cttacaaata tcatcaaaat tttgagacat 300
gacatagggg caactgtaca tgaactgagt agagataaaa aaaaagacac agtcccctgg 360
ttccccagga ccatacagga attggacagg tttgcaaacc agatactgag ctatggtgct 420
gaattggatg ctgatcaccc aggcttcaag gaccctgtgt acagagcacg aagaaagcag 480
tttgctgaca ttgcctacaa ttacaggcac ggccaaccca ttcctagagt cgagtacatg 540
gaagaagaaa agaaaacctg gggcactgtg ttcaagaccc tgaagtcact gtacaagaca 600
catgcctgct atgaatacaa ccacatattt ccactcctag agaaatactg tggattccat 660
gaggacaaca taccccaatt ggaggatgtg tcacagtttc tgcagacttg tacaggtttt 720
aggctgaggc cagtggcagg gcttctcagc agcagggact tcctgggtgg actggccttc 780
agggtgtttc actgtacaca gtacatcaga catggtagca aaccaatgta tactcctgaa 840
ccagacatct gccatgagct gcttgggcat gtgcctctgt tttcagacag gtcctttgct 900
caattctcac aggagattgg actagccagc ctaggtgcac cagatgagta cattgagaag 960
ttagcaacca tttactggtt cacagtggag ttcggccttt gcaagcaagg ggactcaata 1020
aaggcctatg gagcaggcct cctgtcaagt tttggagaac tacaatactg cctatctgag 1080
aagcctaaat tattaccctt ggaactagag aaaactgcaa tacagaacta cacagtgact 1140
gagtttcagc cactctacta tgtggccgag tccttcaatg atgccaaaga aaaggtccga 1200
aattttgctg caacaattcc caggcctttc tctgttcgct atgatcctta cacccaaaga 1260
attgaagtcc tagataacac ccagcagctg aagatcctgg ctgatagcat aaacagcgaa 1320
attggaatcc tctgttctgc cctgcagaag atcaagtga 1359
<210> 73
<211> 1359
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hPAH-TC-022 PAH序列
<400> 73
atgtccactg ctgtgctgga gaacccaggc ctgggcagga agttgagtga ctttgggcag 60
gagacctcct acatagaaga caattgcaat cagaatgggg ccatctctct gatcttcagc 120
cttaaagagg aggtgggtgc tctggcaaaa gtgctcagac tctttgagga gaatgatgtg 180
aatctcaccc acattgaatc caggcccagc agactcaaaa aggatgaata tgaattcttc 240
acccacttgg acaaaaggtc cttacctgcc cttacaaata tcatcaaaat tttgagacat 300
gacatagggg caactgtaca tgaactgagt agagataaaa aaaaagacac agtcccctgg 360
ttccccagga ccatccagga attggacagg tttgcaaacc agatactgag ctatggtgct 420
gagttggatg ctgatcaccc aggcttcaag gaccctgtgt acagagcaag gagaaagcag 480
tttgctgaca ttgcctacaa ttacaggcac ggccaaccca ttcctagagt cgagtacatg 540
gaagaagaga agaaaacctg gggcactgtc ttcaagaccc tgaagtcact gtacaagaca 600
catgcctgct atgaatacaa ccacatattt ccactcctag agaaatactg tggattccat 660
gaggacaata taccccaatt ggaggatgtc tcacagtttc tgcagacttg tacaggtttt 720
aggctgaggc cagtggctgg gcttctcagc agcagggact tcctgggtgg actggccttt 780
cgagttttcc actgtactca gtatatcaga catggctcca agcccatgta taccccagaa 840
cctgacatct gccatgaact gcttgggcat gtgcctctgt tttcagaccg ttcctttgcc 900
cagttttctc aggagattgg actagccagc ctaggtgcac cagatgagta cattgagaag 960
ttagcaacca tttactggtt cacagtggag ttcggccttt gcaagcaagg ggactcaata 1020
aaggcctatg gagcaggcct cctgtcaagt tttggagaac tacaatactg cctatctgag 1080
aagcctaaat tattaccctt ggaactagaa aaaactgcaa tacagaacta cacagtgact 1140
gagtttcagc cactctacta tgtggcagag tcctttaatg atgccaaaga aaaggtccga 1200
aattttgctg caacaattcc caggcctttc tctgttcgct atgatccata cacccaaaga 1260
attgaagtcc tagataacac ccagcagctg aaaatcctgg cagacagcat caactctgaa 1320
attggaatcc tctgttctgc cctgcagaag atcaagtga 1359
<210> 74
<211> 2111
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hPAH-TC-018转移基因组
<400> 74
ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60
tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc 120
cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt 180
agtgtgagag gggaatgact cctttcggta agtgcagtgg aagctgtaca ctgcccaggc 240
aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact tagcccctgt 300
ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct cccccgttgc 360
ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct cagcttcagg 420
caccaccact gacctgggac agtgaatcct ctaaggtaaa tataaaattt ttaagtgtat 480
aatgtgttaa actactgatt ctaattgttt ctctctttta gattccaacc tttggaactg 540
accgccacca tgtccactgc tgtgctggag aacccaggcc tgggcaggaa gttgagtgac 600
tttgggcagg agacctccta catagaagac aattgcaatc agaatggggc catctctctg 660
atcttcagcc ttaaagagga ggtgggtgct ctggcaaaag tgctcagact ctttgaggag 720
aatgatgtga atctcaccca cattgaatcc aggcccagca gactcaaaaa ggatgaatat 780
gaattcttca cccacttgga caaaaggtcc ttacctgccc ttacaaatat catcaaaatt 840
ttgagacatg acataggggc aactgtacat gaactgagta gagataaaaa aaaagacaca 900
gtcccctggt tccccaggac catccaggaa ttggacaggt ttgcaaacca gatactgagc 960
tatggtgctg agttggatgc tgatcaccca ggcttcaagg accctgtgta cagagcaagg 1020
agaaagcagt ttgctgacat tgcctacaat tacaggcacg gccaacccat tcctagagtc 1080
gagtacatgg aagaagagaa gaaaacctgg ggcactgtct tcaagaccct gaagtcactg 1140
tacaagacac atgcctgcta tgaatacaac cacatatttc cactcctaga gaaatactgt 1200
ggattccatg aggacaatat accccaattg gaggatgtct cacagtttct gcagacttgt 1260
acaggtttta ggctgaggcc agtggctggg cttctcagca gcagggactt cctgggtgga 1320
ctggccttca gggtgtttca ctgtacacaa tacatcagac atggtagcaa accaatgtat 1380
actcctgaac cagacatctg ccatgagctg cttgggcatg tgcctctgtt ttcagacagg 1440
tcctttgctc agttctcaca agagattggg ctagcttcac tgggagctcc agatgagtat 1500
attgaaaaac tggcaacaat ttactggttt acagtggagt ttggactttg taagcaggga 1560
gactccatca aggcctatgg tgcaggattg ttgtcttcct ttggggaact gcaatattgt 1620
ctctctgaaa agcctaagtt gctaccactg gagcttgaga agactgccat tcagaactac 1680
acagtgactg aattccagcc cctctactat gttgcagagt ctttcaatga tgccaaggag 1740
aaggttagga actttgctgc aacaatcccc agacctttca gtgtgaggta tgacccctac 1800
actcagagaa ttgaagttct ggataacacc cagcagctga aaattctggc agatagtatc 1860
aactctgaga ttggaatcct gtgttctgcc ctgcagaaga tcaagtgact cgagatccag 1920
acatgataag atacattgat gagtttggac aaaccacaac tagaatgcag tgaaaaaaat 1980
gctttatttg tgaaatttgt gatgctattg ctttatttgt aaccattata agctgcaata 2040
aacaagttaa caacaacaat tgcattcatt ttatgtttca ggttcagggg gaggtgtggg 2100
aggtttttta a 2111
<210> 75
<211> 2426
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hPAH-TC-018转移基因组
<400> 75
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggaatt cacgcgtgga 120
tctgaattca attcacgcgt ggtacctccc taaaatgggc aaacattgca agcagcaaac 180
agcaaacaca cagccctccc tgcctgctga ccttggagct ggggcagagg tcagagacct 240
ctctgggccc atgccacctc caacatccac tcgacccctt ggaatttcgg tggagaggag 300
cagaggttgt cctggcgtgg tttaggtagt gtgagagggg aatgactcct ttcggtaagt 360
gcagtggaag ctgtacactg cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag 420
atcccagcca gtggacttag cccctgtttg ctcctccgat aactggggtg accttggtta 480
atattcacca gcagcctccc ccgttgcccc tctggatcca ctgcttaaat acggacgagg 540
acagggccct gtctcctcag cttcaggcac caccactgac ctgggacagt gaatcctcta 600
aggtaaatat aaaattttta agtgtataat gtgttaaact actgattcta attgtttctc 660
tcttttagat tccaaccttt ggaactgacc gccaccatgt ccactgctgt gctggagaac 720
ccaggcctgg gcaggaagtt gagtgacttt gggcaggaga cctcctacat agaagacaat 780
tgcaatcaga atggggccat ctctctgatc ttcagcctta aagaggaggt gggtgctctg 840
gcaaaagtgc tcagactctt tgaggagaat gatgtgaatc tcacccacat tgaatccagg 900
cccagcagac tcaaaaagga tgaatatgaa ttcttcaccc acttggacaa aaggtcctta 960
cctgccctta caaatatcat caaaattttg agacatgaca taggggcaac tgtacatgaa 1020
ctgagtagag ataaaaaaaa agacacagtc ccctggttcc ccaggaccat ccaggaattg 1080
gacaggtttg caaaccagat actgagctat ggtgctgagt tggatgctga tcacccaggc 1140
ttcaaggacc ctgtgtacag agcaaggaga aagcagtttg ctgacattgc ctacaattac 1200
aggcacggcc aacccattcc tagagtcgag tacatggaag aagagaagaa aacctggggc 1260
actgtcttca agaccctgaa gtcactgtac aagacacatg cctgctatga atacaaccac 1320
atatttccac tcctagagaa atactgtgga ttccatgagg acaatatacc ccaattggag 1380
gatgtctcac agtttctgca gacttgtaca ggttttaggc tgaggccagt ggctgggctt 1440
ctcagcagca gggacttcct gggtggactg gccttcaggg tgtttcactg tacacaatac 1500
atcagacatg gtagcaaacc aatgtatact cctgaaccag acatctgcca tgagctgctt 1560
gggcatgtgc ctctgttttc agacaggtcc tttgctcagt tctcacaaga gattgggcta 1620
gcttcactgg gagctccaga tgagtatatt gaaaaactgg caacaattta ctggtttaca 1680
gtggagtttg gactttgtaa gcagggagac tccatcaagg cctatggtgc aggattgttg 1740
tcttcctttg gggaactgca atattgtctc tctgaaaagc ctaagttgct accactggag 1800
cttgagaaga ctgccattca gaactacaca gtgactgaat tccagcccct ctactatgtt 1860
gcagagtctt tcaatgatgc caaggagaag gttaggaact ttgctgcaac aatccccaga 1920
cctttcagtg tgaggtatga cccctacact cagagaattg aagttctgga taacacccag 1980
cagctgaaaa ttctggcaga tagtatcaac tctgagattg gaatcctgtg ttctgccctg 2040
cagaagatca agtgactcga gatccagaca tgataagata cattgatgag tttggacaaa 2100
ccacaactag aatgcagtga aaaaaatgct ttatttgtga aatttgtgat gctattgctt 2160
tatttgtaac cattataagc tgcaataaac aagttaacaa caacaattgc attcatttta 2220
tgtttcaggt tcagggggag gtgtgggagg ttttttaaag catgctgggg agagatcgat 2280
ctgaggaacc cctagtgatg gagttggcca ctccctctct gcgcgctcgc tcgctcactg 2340
aggccgggcg accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg 2400
agcgagcgcg cagagaggga gtggcc 2426
<210> 76
<211> 2111
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hPAH-TC-019转移基因组
<400> 76
ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60
tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc 120
cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt 180
agtgtgagag gggaatgact cctttcggta agtgcagtgg aagctgtaca ctgcccaggc 240
aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact tagcccctgt 300
ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct cccccgttgc 360
ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct cagcttcagg 420
caccaccact gacctgggac agtgaatcct ctaaggtaaa tataaaattt ttaagtgtat 480
aatgtgttaa actactgatt ctaattgttt ctctctttta gattccaacc tttggaactg 540
accgccacca tgtccactgc tgtgctggag aacccaggcc tgggcaggaa gttgagtgac 600
tttgggcagg agacctccta catagaagac aattgcaatc agaatggggc catctctctg 660
atcttcagcc ttaaagagga ggtgggtgct ctggcaaaag tgctcagact gtttgaggag 720
aatgatgtga atctcaccca cattgaatcc aggcccagca gactcaaaaa ggatgaatat 780
gaattcttca cccacttgga caaaaggtcc ttacctgccc ttacaaatat catcaaaatt 840
ttgagacatg acataggggc aactgtacat gaactgagta gagataaaaa aaaagacaca 900
gtcccctggt tccccaggac catccaggaa ttggacaggt ttgcaaacca gatactgagc 960
tatggtgctg agttggatgc tgatcaccca ggcttcaagg accctgtgta cagagcaagg 1020
agaaagcagt ttgctgacat tgcctacaat tacaggcacg gccaacccat tcctagagtc 1080
gagtacatgg aagaagagaa gaaaacctgg ggcactgtct tcaagaccct gaagtcactg 1140
tacaagacac atgcctgcta tgaatacaac cacatatttc cactcctaga gaaatactgt 1200
ggattccatg aggacaatat accccaattg gaggatgtct cacagtttct gcagacttgt 1260
acaggtttta ggctgaggcc agtggctggg ctcctcagca gcagggactt cctgggtgga 1320
ctggcctttc gagttttcca ctgtactcag tatatcagac atggctccaa gcctatgtat 1380
accccagaac ctgacatctg ccatgaactg cttgggcatg tgcctctctt ttcagaccgt 1440
tcctttgccc agttttctca ggagattgga ctagccagcc taggtgcacc agatgagtac 1500
attgagaagt tagcaaccat ttactggttc acagtggagt tcggtctctg caagcaaggg 1560
gactcaataa aggcctatgg agcaggcctc ctgtcaagtt ttggagaact ccaatactgc 1620
ctatctgaga agcctaaatt attacccttg gaactagaaa aaactgcaat acagaactac 1680
acagtgactg agtttcagcc actctactat gtggcagagt cctttaatga tgccaaagaa 1740
aaggtccgaa attttgctgc aacaattccc aggcccttct ctgttcgcta tgatccatac 1800
acccaaagaa ttgaagtcct agataacacc cagcagctga aaatcctggc agacagtatc 1860
aactctgaaa ttggaatcct ctgttctgcc ctgcagaaga tcaagtgact cgagatccag 1920
acatgataag atacattgat gagtttggac aaaccacaac tagaatgcag tgaaaaaaat 1980
gctttatttg tgaaatttgt gatgctattg ctttatttgt aaccattata agctgcaata 2040
aacaagttaa caacaacaat tgcattcatt ttatgtttca ggttcagggg gaggtgtggg 2100
aggtttttta a 2111
<210> 77
<211> 2426
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hPAH-TC-019转移基因组
<400> 77
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggaatt cacgcgtgga 120
tctgaattca attcacgcgt ggtacctccc taaaatgggc aaacattgca agcagcaaac 180
agcaaacaca cagccctccc tgcctgctga ccttggagct ggggcagagg tcagagacct 240
ctctgggccc atgccacctc caacatccac tcgacccctt ggaatttcgg tggagaggag 300
cagaggttgt cctggcgtgg tttaggtagt gtgagagggg aatgactcct ttcggtaagt 360
gcagtggaag ctgtacactg cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag 420
atcccagcca gtggacttag cccctgtttg ctcctccgat aactggggtg accttggtta 480
atattcacca gcagcctccc ccgttgcccc tctggatcca ctgcttaaat acggacgagg 540
acagggccct gtctcctcag cttcaggcac caccactgac ctgggacagt gaatcctcta 600
aggtaaatat aaaattttta agtgtataat gtgttaaact actgattcta attgtttctc 660
tcttttagat tccaaccttt ggaactgacc gccaccatgt ccactgctgt gctggagaac 720
ccaggcctgg gcaggaagtt gagtgacttt gggcaggaga cctcctacat agaagacaat 780
tgcaatcaga atggggccat ctctctgatc ttcagcctta aagaggaggt gggtgctctg 840
gcaaaagtgc tcagactgtt tgaggagaat gatgtgaatc tcacccacat tgaatccagg 900
cccagcagac tcaaaaagga tgaatatgaa ttcttcaccc acttggacaa aaggtcctta 960
cctgccctta caaatatcat caaaattttg agacatgaca taggggcaac tgtacatgaa 1020
ctgagtagag ataaaaaaaa agacacagtc ccctggttcc ccaggaccat ccaggaattg 1080
gacaggtttg caaaccagat actgagctat ggtgctgagt tggatgctga tcacccaggc 1140
ttcaaggacc ctgtgtacag agcaaggaga aagcagtttg ctgacattgc ctacaattac 1200
aggcacggcc aacccattcc tagagtcgag tacatggaag aagagaagaa aacctggggc 1260
actgtcttca agaccctgaa gtcactgtac aagacacatg cctgctatga atacaaccac 1320
atatttccac tcctagagaa atactgtgga ttccatgagg acaatatacc ccaattggag 1380
gatgtctcac agtttctgca gacttgtaca ggttttaggc tgaggccagt ggctgggctc 1440
ctcagcagca gggacttcct gggtggactg gcctttcgag ttttccactg tactcagtat 1500
atcagacatg gctccaagcc tatgtatacc ccagaacctg acatctgcca tgaactgctt 1560
gggcatgtgc ctctcttttc agaccgttcc tttgcccagt tttctcagga gattggacta 1620
gccagcctag gtgcaccaga tgagtacatt gagaagttag caaccattta ctggttcaca 1680
gtggagttcg gtctctgcaa gcaaggggac tcaataaagg cctatggagc aggcctcctg 1740
tcaagttttg gagaactcca atactgccta tctgagaagc ctaaattatt acccttggaa 1800
ctagaaaaaa ctgcaataca gaactacaca gtgactgagt ttcagccact ctactatgtg 1860
gcagagtcct ttaatgatgc caaagaaaag gtccgaaatt ttgctgcaac aattcccagg 1920
cccttctctg ttcgctatga tccatacacc caaagaattg aagtcctaga taacacccag 1980
cagctgaaaa tcctggcaga cagtatcaac tctgaaattg gaatcctctg ttctgccctg 2040
cagaagatca agtgactcga gatccagaca tgataagata cattgatgag tttggacaaa 2100
ccacaactag aatgcagtga aaaaaatgct ttatttgtga aatttgtgat gctattgctt 2160
tatttgtaac cattataagc tgcaataaac aagttaacaa caacaattgc attcatttta 2220
tgtttcaggt tcagggggag gtgtgggagg ttttttaaag catgctgggg agagatcgat 2280
ctgaggaacc cctagtgatg gagttggcca ctccctctct gcgcgctcgc tcgctcactg 2340
aggccgggcg accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg 2400
agcgagcgcg cagagaggga gtggcc 2426
<210> 78
<211> 2111
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hPAH-TC-020转移基因组
<400> 78
ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60
tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc 120
cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt 180
agtgtgagag gggaatgact cctttcggta agtgcagtgg aagctgtaca ctgcccaggc 240
aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact tagcccctgt 300
ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct cccccgttgc 360
ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct cagcttcagg 420
caccaccact gacctgggac agtgaatcct ctaaggtaaa tataaaattt ttaagtgtat 480
aatgtgttaa actactgatt ctaattgttt ctctctttta gattccaacc tttggaactg 540
accgccacca tgtccactgc tgtgctggag aacccaggcc tgggcaggaa gttgagtgac 600
tttgggcagg agacctccta catagaagac aattgcaatc agaatggggc catctctctg 660
atcttcagcc ttaaagagga ggtgggtgct ctggcaaaag tgctcagact ctttgaggag 720
aatgatgtga atctcaccca cattgaatcc aggcccagca gactcaaaaa ggatgaatat 780
gaattcttca cccacttgga caaaaggtcc ttacctgccc ttacaaatat catcaaaatt 840
ttgagacatg acataggggc aactgtacat gaactgagta gagataaaaa aaaagacaca 900
gtcccctggt tccccaggac catccaggaa ttggacaggt ttgcaaacca gatactgagc 960
tatggtgctg agttggatgc tgatcaccca ggcttcaagg accctgtgta cagagcaagg 1020
agaaagcagt ttgctgacat tgcctacaat tacaggcacg gccaacccat tcctagagtc 1080
gagtacatgg aagaagagaa gaaaacctgg ggcactgtct tcaagaccct gaagtcactg 1140
tacaagacac atgcctgcta tgaatacaac cacatatttc cactcctaga gaaatactgt 1200
ggattccatg aggacaatat accccaattg gaggatgtct cacagtttct gcagacttgt 1260
acaggtttta ggctgaggcc agtggctggg cttctcagca gcagggactt cctgggtgga 1320
ctggccttca gggtgtttca ctgtacacaa tacatcagac atggtagcaa accaatgtat 1380
actcctgaac cagacatctg ccatgagctg cttgggcatg tgcctctgtt cagcgacaga 1440
agctttgctc agtttagcca ggagattggg ctggccagcc tgggcgcccc tgatgagtat 1500
atcgagaaac tggccacaat ctactggttc acagtggagt tcggcctgtg caagcagggc 1560
gactcaatca aggcctatgg cgccggcctg ctgagcagct tcggcgaact gcagtactgc 1620
ctgagcgaga agcccaagct gctgccactg gagctggaga aaaccgccat ccagaactac 1680
acagtgacag agttccagcc tctgtactat gtggccgaga gcttcaacga tgccaaggag 1740
aaggtgagga attttgccgc cactatcccc aggcctttct ccgtgagata tgacccctac 1800
acccagcgaa tcgaggtgct ggacaatacc cagcagctga agatcctggc cgattccatc 1860
aactctgaga tcggcattct gtgtagcgcc ctgcagaaga ttaagtgact cgagatccag 1920
acatgataag atacattgat gagtttggac aaaccacaac tagaatgcag tgaaaaaaat 1980
gctttatttg tgaaatttgt gatgctattg ctttatttgt aaccattata agctgcaata 2040
aacaagttaa caacaacaat tgcattcatt ttatgtttca ggttcagggg gaggtgtggg 2100
aggtttttta a 2111
<210> 79
<211> 2426
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hPAH-TC-020转移基因组
<400> 79
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggaatt cacgcgtgga 120
tctgaattca attcacgcgt ggtacctccc taaaatgggc aaacattgca agcagcaaac 180
agcaaacaca cagccctccc tgcctgctga ccttggagct ggggcagagg tcagagacct 240
ctctgggccc atgccacctc caacatccac tcgacccctt ggaatttcgg tggagaggag 300
cagaggttgt cctggcgtgg tttaggtagt gtgagagggg aatgactcct ttcggtaagt 360
gcagtggaag ctgtacactg cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag 420
atcccagcca gtggacttag cccctgtttg ctcctccgat aactggggtg accttggtta 480
atattcacca gcagcctccc ccgttgcccc tctggatcca ctgcttaaat acggacgagg 540
acagggccct gtctcctcag cttcaggcac caccactgac ctgggacagt gaatcctcta 600
aggtaaatat aaaattttta agtgtataat gtgttaaact actgattcta attgtttctc 660
tcttttagat tccaaccttt ggaactgacc gccaccatgt ccactgctgt gctggagaac 720
ccaggcctgg gcaggaagtt gagtgacttt gggcaggaga cctcctacat agaagacaat 780
tgcaatcaga atggggccat ctctctgatc ttcagcctta aagaggaggt gggtgctctg 840
gcaaaagtgc tcagactctt tgaggagaat gatgtgaatc tcacccacat tgaatccagg 900
cccagcagac tcaaaaagga tgaatatgaa ttcttcaccc acttggacaa aaggtcctta 960
cctgccctta caaatatcat caaaattttg agacatgaca taggggcaac tgtacatgaa 1020
ctgagtagag ataaaaaaaa agacacagtc ccctggttcc ccaggaccat ccaggaattg 1080
gacaggtttg caaaccagat actgagctat ggtgctgagt tggatgctga tcacccaggc 1140
ttcaaggacc ctgtgtacag agcaaggaga aagcagtttg ctgacattgc ctacaattac 1200
aggcacggcc aacccattcc tagagtcgag tacatggaag aagagaagaa aacctggggc 1260
actgtcttca agaccctgaa gtcactgtac aagacacatg cctgctatga atacaaccac 1320
atatttccac tcctagagaa atactgtgga ttccatgagg acaatatacc ccaattggag 1380
gatgtctcac agtttctgca gacttgtaca ggttttaggc tgaggccagt ggctgggctt 1440
ctcagcagca gggacttcct gggtggactg gccttcaggg tgtttcactg tacacaatac 1500
atcagacatg gtagcaaacc aatgtatact cctgaaccag acatctgcca tgagctgctt 1560
gggcatgtgc ctctgttcag cgacagaagc tttgctcagt ttagccagga gattgggctg 1620
gccagcctgg gcgcccctga tgagtatatc gagaaactgg ccacaatcta ctggttcaca 1680
gtggagttcg gcctgtgcaa gcagggcgac tcaatcaagg cctatggcgc cggcctgctg 1740
agcagcttcg gcgaactgca gtactgcctg agcgagaagc ccaagctgct gccactggag 1800
ctggagaaaa ccgccatcca gaactacaca gtgacagagt tccagcctct gtactatgtg 1860
gccgagagct tcaacgatgc caaggagaag gtgaggaatt ttgccgccac tatccccagg 1920
cctttctccg tgagatatga cccctacacc cagcgaatcg aggtgctgga caatacccag 1980
cagctgaaga tcctggccga ttccatcaac tctgagatcg gcattctgtg tagcgccctg 2040
cagaagatta agtgactcga gatccagaca tgataagata cattgatgag tttggacaaa 2100
ccacaactag aatgcagtga aaaaaatgct ttatttgtga aatttgtgat gctattgctt 2160
tatttgtaac cattataagc tgcaataaac aagttaacaa caacaattgc attcatttta 2220
tgtttcaggt tcagggggag gtgtgggagg ttttttaaag catgctgggg agagatcgat 2280
ctgaggaacc cctagtgatg gagttggcca ctccctctct gcgcgctcgc tcgctcactg 2340
aggccgggcg accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg 2400
agcgagcgcg cagagaggga gtggcc 2426
<210> 80
<211> 2111
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hPAH-TC-021转移基因组
<400> 80
ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60
tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc 120
cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt 180
agtgtgagag gggaatgact cctttcggta agtgcagtgg aagctgtaca ctgcccaggc 240
aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact tagcccctgt 300
ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct cccccgttgc 360
ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct cagcttcagg 420
caccaccact gacctgggac agtgaatcct ctaaggtaaa tataaaattt ttaagtgtat 480
aatgtgttaa actactgatt ctaattgttt ctctctttta gattccaacc tttggaactg 540
accgccacca tgtccactgc tgtgctggag aacccaggcc tgggaaggaa gctgagtgac 600
tttggccagg agacctccta catagaggac aactgcaatc agaacggggc catcagcctg 660
atcttcagcc ttaaagagga ggtaggcgct ctggcaaaag tgctcagact ctttgaggag 720
aatgatgtga atctcaccca cattgaatcc aggcccagca gactcaaaaa ggatgaatat 780
gaatttttca cccacttgga caaaaggtcc ttacctgccc ttacaaatat catcaaaatt 840
ttgagacatg acataggggc aactgtacat gaactgagta gagataaaaa aaaagacaca 900
gtcccctggt tccccaggac catacaggaa ttggacaggt ttgcaaacca gatactgagc 960
tatggtgctg aattggatgc tgatcaccca ggcttcaagg accctgtgta cagagcacga 1020
agaaagcagt ttgctgacat tgcctacaat tacaggcacg gccaacccat tcctagagtc 1080
gagtacatgg aagaagaaaa gaaaacctgg ggcactgtgt tcaagaccct gaagtcactg 1140
tacaagacac atgcctgcta tgaatacaac cacatatttc cactcctaga gaaatactgt 1200
ggattccatg aggacaacat accccaattg gaggatgtgt cacagtttct gcagacttgt 1260
acaggtttta ggctgaggcc agtggcaggg cttctcagca gcagggactt cctgggtgga 1320
ctggccttca gggtgtttca ctgtacacag tacatcagac atggtagcaa accaatgtat 1380
actcctgaac cagacatctg ccatgagctg cttgggcatg tgcctctgtt ttcagacagg 1440
tcctttgctc aattctcaca ggagattgga ctagccagcc taggtgcacc agatgagtac 1500
attgagaagt tagcaaccat ttactggttc acagtggagt tcggcctttg caagcaaggg 1560
gactcaataa aggcctatgg agcaggcctc ctgtcaagtt ttggagaact acaatactgc 1620
ctatctgaga agcctaaatt attacccttg gaactagaga aaactgcaat acagaactac 1680
acagtgactg agtttcagcc actctactat gtggccgagt ccttcaatga tgccaaagaa 1740
aaggtccgaa attttgctgc aacaattccc aggcctttct ctgttcgcta tgatccttac 1800
acccaaagaa ttgaagtcct agataacacc cagcagctga agatcctggc tgatagcata 1860
aacagcgaaa ttggaatcct ctgttctgcc ctgcagaaga tcaagtgact cgagatccag 1920
acatgataag atacattgat gagtttggac aaaccacaac tagaatgcag tgaaaaaaat 1980
gctttatttg tgaaatttgt gatgctattg ctttatttgt aaccattata agctgcaata 2040
aacaagttaa caacaacaat tgcattcatt ttatgtttca ggttcagggg gaggtgtggg 2100
aggtttttta a 2111
<210> 81
<211> 2426
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hPAH-TC-021转移基因组
<400> 81
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggaatt cacgcgtgga 120
tctgaattca attcacgcgt ggtacctccc taaaatgggc aaacattgca agcagcaaac 180
agcaaacaca cagccctccc tgcctgctga ccttggagct ggggcagagg tcagagacct 240
ctctgggccc atgccacctc caacatccac tcgacccctt ggaatttcgg tggagaggag 300
cagaggttgt cctggcgtgg tttaggtagt gtgagagggg aatgactcct ttcggtaagt 360
gcagtggaag ctgtacactg cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag 420
atcccagcca gtggacttag cccctgtttg ctcctccgat aactggggtg accttggtta 480
atattcacca gcagcctccc ccgttgcccc tctggatcca ctgcttaaat acggacgagg 540
acagggccct gtctcctcag cttcaggcac caccactgac ctgggacagt gaatcctcta 600
aggtaaatat aaaattttta agtgtataat gtgttaaact actgattcta attgtttctc 660
tcttttagat tccaaccttt ggaactgacc gccaccatgt ccactgctgt gctggagaac 720
ccaggcctgg gaaggaagct gagtgacttt ggccaggaga cctcctacat agaggacaac 780
tgcaatcaga acggggccat cagcctgatc ttcagcctta aagaggaggt aggcgctctg 840
gcaaaagtgc tcagactctt tgaggagaat gatgtgaatc tcacccacat tgaatccagg 900
cccagcagac tcaaaaagga tgaatatgaa tttttcaccc acttggacaa aaggtcctta 960
cctgccctta caaatatcat caaaattttg agacatgaca taggggcaac tgtacatgaa 1020
ctgagtagag ataaaaaaaa agacacagtc ccctggttcc ccaggaccat acaggaattg 1080
gacaggtttg caaaccagat actgagctat ggtgctgaat tggatgctga tcacccaggc 1140
ttcaaggacc ctgtgtacag agcacgaaga aagcagtttg ctgacattgc ctacaattac 1200
aggcacggcc aacccattcc tagagtcgag tacatggaag aagaaaagaa aacctggggc 1260
actgtgttca agaccctgaa gtcactgtac aagacacatg cctgctatga atacaaccac 1320
atatttccac tcctagagaa atactgtgga ttccatgagg acaacatacc ccaattggag 1380
gatgtgtcac agtttctgca gacttgtaca ggttttaggc tgaggccagt ggcagggctt 1440
ctcagcagca gggacttcct gggtggactg gccttcaggg tgtttcactg tacacagtac 1500
atcagacatg gtagcaaacc aatgtatact cctgaaccag acatctgcca tgagctgctt 1560
gggcatgtgc ctctgttttc agacaggtcc tttgctcaat tctcacagga gattggacta 1620
gccagcctag gtgcaccaga tgagtacatt gagaagttag caaccattta ctggttcaca 1680
gtggagttcg gcctttgcaa gcaaggggac tcaataaagg cctatggagc aggcctcctg 1740
tcaagttttg gagaactaca atactgccta tctgagaagc ctaaattatt acccttggaa 1800
ctagagaaaa ctgcaataca gaactacaca gtgactgagt ttcagccact ctactatgtg 1860
gccgagtcct tcaatgatgc caaagaaaag gtccgaaatt ttgctgcaac aattcccagg 1920
cctttctctg ttcgctatga tccttacacc caaagaattg aagtcctaga taacacccag 1980
cagctgaaga tcctggctga tagcataaac agcgaaattg gaatcctctg ttctgccctg 2040
cagaagatca agtgactcga gatccagaca tgataagata cattgatgag tttggacaaa 2100
ccacaactag aatgcagtga aaaaaatgct ttatttgtga aatttgtgat gctattgctt 2160
tatttgtaac cattataagc tgcaataaac aagttaacaa caacaattgc attcatttta 2220
tgtttcaggt tcagggggag gtgtgggagg ttttttaaag catgctgggg agagatcgat 2280
ctgaggaacc cctagtgatg gagttggcca ctccctctct gcgcgctcgc tcgctcactg 2340
aggccgggcg accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg 2400
agcgagcgcg cagagaggga gtggcc 2426
<210> 82
<211> 2111
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hPAH-TC-022转移基因组
<400> 82
ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60
tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc 120
cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt 180
agtgtgagag gggaatgact cctttcggta agtgcagtgg aagctgtaca ctgcccaggc 240
aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact tagcccctgt 300
ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct cccccgttgc 360
ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct cagcttcagg 420
caccaccact gacctgggac agtgaatcct ctaaggtaaa tataaaattt ttaagtgtat 480
aatgtgttaa actactgatt ctaattgttt ctctctttta gattccaacc tttggaactg 540
accgccacca tgtccactgc tgtgctggag aacccaggcc tgggcaggaa gttgagtgac 600
tttgggcagg agacctccta catagaagac aattgcaatc agaatggggc catctctctg 660
atcttcagcc ttaaagagga ggtgggtgct ctggcaaaag tgctcagact ctttgaggag 720
aatgatgtga atctcaccca cattgaatcc aggcccagca gactcaaaaa ggatgaatat 780
gaattcttca cccacttgga caaaaggtcc ttacctgccc ttacaaatat catcaaaatt 840
ttgagacatg acataggggc aactgtacat gaactgagta gagataaaaa aaaagacaca 900
gtcccctggt tccccaggac catccaggaa ttggacaggt ttgcaaacca gatactgagc 960
tatggtgctg agttggatgc tgatcaccca ggcttcaagg accctgtgta cagagcaagg 1020
agaaagcagt ttgctgacat tgcctacaat tacaggcacg gccaacccat tcctagagtc 1080
gagtacatgg aagaagagaa gaaaacctgg ggcactgtct tcaagaccct gaagtcactg 1140
tacaagacac atgcctgcta tgaatacaac cacatatttc cactcctaga gaaatactgt 1200
ggattccatg aggacaatat accccaattg gaggatgtct cacagtttct gcagacttgt 1260
acaggtttta ggctgaggcc agtggctggg cttctcagca gcagggactt cctgggtgga 1320
ctggcctttc gagttttcca ctgtactcag tatatcagac atggctccaa gcccatgtat 1380
accccagaac ctgacatctg ccatgaactg cttgggcatg tgcctctgtt ttcagaccgt 1440
tcctttgccc agttttctca ggagattgga ctagccagcc taggtgcacc agatgagtac 1500
attgagaagt tagcaaccat ttactggttc acagtggagt tcggcctttg caagcaaggg 1560
gactcaataa aggcctatgg agcaggcctc ctgtcaagtt ttggagaact acaatactgc 1620
ctatctgaga agcctaaatt attacccttg gaactagaaa aaactgcaat acagaactac 1680
acagtgactg agtttcagcc actctactat gtggcagagt cctttaatga tgccaaagaa 1740
aaggtccgaa attttgctgc aacaattccc aggcctttct ctgttcgcta tgatccatac 1800
acccaaagaa ttgaagtcct agataacacc cagcagctga aaatcctggc agacagcatc 1860
aactctgaaa ttggaatcct ctgttctgcc ctgcagaaga tcaagtgact cgagatccag 1920
acatgataag atacattgat gagtttggac aaaccacaac tagaatgcag tgaaaaaaat 1980
gctttatttg tgaaatttgt gatgctattg ctttatttgt aaccattata agctgcaata 2040
aacaagttaa caacaacaat tgcattcatt ttatgtttca ggttcagggg gaggtgtggg 2100
aggtttttta a 2111
<210> 83
<211> 2426
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hPAH-TC-022转移基因组
<400> 83
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggaatt cacgcgtgga 120
tctgaattca attcacgcgt ggtacctccc taaaatgggc aaacattgca agcagcaaac 180
agcaaacaca cagccctccc tgcctgctga ccttggagct ggggcagagg tcagagacct 240
ctctgggccc atgccacctc caacatccac tcgacccctt ggaatttcgg tggagaggag 300
cagaggttgt cctggcgtgg tttaggtagt gtgagagggg aatgactcct ttcggtaagt 360
gcagtggaag ctgtacactg cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag 420
atcccagcca gtggacttag cccctgtttg ctcctccgat aactggggtg accttggtta 480
atattcacca gcagcctccc ccgttgcccc tctggatcca ctgcttaaat acggacgagg 540
acagggccct gtctcctcag cttcaggcac caccactgac ctgggacagt gaatcctcta 600
aggtaaatat aaaattttta agtgtataat gtgttaaact actgattcta attgtttctc 660
tcttttagat tccaaccttt ggaactgacc gccaccatgt ccactgctgt gctggagaac 720
ccaggcctgg gcaggaagtt gagtgacttt gggcaggaga cctcctacat agaagacaat 780
tgcaatcaga atggggccat ctctctgatc ttcagcctta aagaggaggt gggtgctctg 840
gcaaaagtgc tcagactctt tgaggagaat gatgtgaatc tcacccacat tgaatccagg 900
cccagcagac tcaaaaagga tgaatatgaa ttcttcaccc acttggacaa aaggtcctta 960
cctgccctta caaatatcat caaaattttg agacatgaca taggggcaac tgtacatgaa 1020
ctgagtagag ataaaaaaaa agacacagtc ccctggttcc ccaggaccat ccaggaattg 1080
gacaggtttg caaaccagat actgagctat ggtgctgagt tggatgctga tcacccaggc 1140
ttcaaggacc ctgtgtacag agcaaggaga aagcagtttg ctgacattgc ctacaattac 1200
aggcacggcc aacccattcc tagagtcgag tacatggaag aagagaagaa aacctggggc 1260
actgtcttca agaccctgaa gtcactgtac aagacacatg cctgctatga atacaaccac 1320
atatttccac tcctagagaa atactgtgga ttccatgagg acaatatacc ccaattggag 1380
gatgtctcac agtttctgca gacttgtaca ggttttaggc tgaggccagt ggctgggctt 1440
ctcagcagca gggacttcct gggtggactg gcctttcgag ttttccactg tactcagtat 1500
atcagacatg gctccaagcc catgtatacc ccagaacctg acatctgcca tgaactgctt 1560
gggcatgtgc ctctgttttc agaccgttcc tttgcccagt tttctcagga gattggacta 1620
gccagcctag gtgcaccaga tgagtacatt gagaagttag caaccattta ctggttcaca 1680
gtggagttcg gcctttgcaa gcaaggggac tcaataaagg cctatggagc aggcctcctg 1740
tcaagttttg gagaactaca atactgccta tctgagaagc ctaaattatt acccttggaa 1800
ctagaaaaaa ctgcaataca gaactacaca gtgactgagt ttcagccact ctactatgtg 1860
gcagagtcct ttaatgatgc caaagaaaag gtccgaaatt ttgctgcaac aattcccagg 1920
cctttctctg ttcgctatga tccatacacc caaagaattg aagtcctaga taacacccag 1980
cagctgaaaa tcctggcaga cagcatcaac tctgaaattg gaatcctctg ttctgccctg 2040
cagaagatca agtgactcga gatccagaca tgataagata cattgatgag tttggacaaa 2100
ccacaactag aatgcagtga aaaaaatgct ttatttgtga aatttgtgat gctattgctt 2160
tatttgtaac cattataagc tgcaataaac aagttaacaa caacaattgc attcatttta 2220
tgtttcaggt tcagggggag gtgtgggagg ttttttaaag catgctgggg agagatcgat 2280
ctgaggaacc cctagtgatg gagttggcca ctccctctct gcgcgctcgc tcgctcactg 2340
aggccgggcg accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg 2400
agcgagcgcg cagagaggga gtggcc 2426
<210> 84
<211> 2111
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hPAH-TC-023转移基因组
<400> 84
ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60
tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc 120
cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt 180
agtgtgagag gggaatgact cctttcggta agtgcagtgg aagctgtaca ctgcccaggc 240
aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact tagcccctgt 300
ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct cccccgttgc 360
ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct cagcttcagg 420
caccaccact gacctgggac agtgaatcct ctaaggtaaa tataaaattt ttaagtgtat 480
aatgtgttaa actactgatt ctaattgttt ctctctttta gattccaacc tttggaactg 540
accgccacca tgtccactgc ggtcctggaa aacccaggct tgggcaggaa actctctgac 600
tttggacagg aaacaagcta tattgaagac aactgcaatc aaaatggtgc catatcactg 660
atcttctcac tcaaagaaga agttggtgca ttggccaaag tattgcgctt atttgaggag 720
aatgatgtaa acctgaccca cattgaatct agaccttctc gtttaaagaa agatgagtat 780
gaatttttca cccatttgga taaacgtagc ctgcctgctc tgacaaacat catcaagatc 840
ttgaggcatg acattggtgc cactgtccat gagctttcac gagataagaa gaaagacaca 900
gtgccctggt tcccaagaac cattcaagag ctggacagat ttgccaatca gattctcagc 960
tatggagcgg aactggatgc tgaccaccct ggttttaaag atcctgtgta ccgtgcaaga 1020
cggaagcagt ttgctgacat tgcctacaac taccgccatg ggcagcccat ccctcgagtg 1080
gaatacatgg aggaagaaaa gaaaacatgg ggcacagtgt tcaagactct gaagtccttg 1140
tataaaaccc atgcttgcta tgagtacaat cacatttttc cacttcttga aaagtactgt 1200
ggcttccatg aagataacat tccccagctg gaagacgttt ctcaattcct gcagacttgc 1260
actggtttcc gcctccgacc tgtggctggc ctgctttcct ctcgggattt cttgggtggc 1320
ctggccttcc gagtcttcca ctgcacacag tacatcagac atggatccaa gcccatgtat 1380
acccccgaac ctgacatctg ccatgagctg ttgggacatg tgcccttgtt ttcagatcgc 1440
agctttgccc agttttccca ggaaattggc cttgcctctc tgggtgcacc tgatgaatac 1500
attgaaaagc tcgccacaat ttactggttt actgtggagt ttgggctctg caaacaagga 1560
gactccataa aggcatatgg tgctgggctc ctgtcatcct ttggtgaatt acagtactgc 1620
ttatcagaga agccaaagct tctccccctg gagctggaga agacagccat ccaaaattac 1680
actgtcacgg agttccagcc cctgtattac gtggcagaga gttttaatga tgccaaggag 1740
aaagtaagga actttgctgc cacaatacct cggcccttct cagttcgcta cgacccatac 1800
acccaaagga ttgaggtctt ggacaatacc cagcagctta agattttggc tgattccatt 1860
aacagtgaaa ttggaatcct ttgcagtgcc ctccagaaaa taaagtaact cgagatccag 1920
acatgataag atacattgat gagtttggac aaaccacaac tagaatgcag tgaaaaaaat 1980
gctttatttg tgaaatttgt gatgctattg ctttatttgt aaccattata agctgcaata 2040
aacaagttaa caacaacaat tgcattcatt ttatgtttca ggttcagggg gaggtgtggg 2100
aggtttttta a 2111
<210> 85
<211> 2426
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hPAH-TC-023转移基因组
<400> 85
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggaatt cacgcgtgga 120
tctgaattca attcacgcgt ggtacctccc taaaatgggc aaacattgca agcagcaaac 180
agcaaacaca cagccctccc tgcctgctga ccttggagct ggggcagagg tcagagacct 240
ctctgggccc atgccacctc caacatccac tcgacccctt ggaatttcgg tggagaggag 300
cagaggttgt cctggcgtgg tttaggtagt gtgagagggg aatgactcct ttcggtaagt 360
gcagtggaag ctgtacactg cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag 420
atcccagcca gtggacttag cccctgtttg ctcctccgat aactggggtg accttggtta 480
atattcacca gcagcctccc ccgttgcccc tctggatcca ctgcttaaat acggacgagg 540
acagggccct gtctcctcag cttcaggcac caccactgac ctgggacagt gaatcctcta 600
aggtaaatat aaaattttta agtgtataat gtgttaaact actgattcta attgtttctc 660
tcttttagat tccaaccttt ggaactgacc gccaccatgt ccactgcggt cctggaaaac 720
ccaggcttgg gcaggaaact ctctgacttt ggacaggaaa caagctatat tgaagacaac 780
tgcaatcaaa atggtgccat atcactgatc ttctcactca aagaagaagt tggtgcattg 840
gccaaagtat tgcgcttatt tgaggagaat gatgtaaacc tgacccacat tgaatctaga 900
ccttctcgtt taaagaaaga tgagtatgaa tttttcaccc atttggataa acgtagcctg 960
cctgctctga caaacatcat caagatcttg aggcatgaca ttggtgccac tgtccatgag 1020
ctttcacgag ataagaagaa agacacagtg ccctggttcc caagaaccat tcaagagctg 1080
gacagatttg ccaatcagat tctcagctat ggagcggaac tggatgctga ccaccctggt 1140
tttaaagatc ctgtgtaccg tgcaagacgg aagcagtttg ctgacattgc ctacaactac 1200
cgccatgggc agcccatccc tcgagtggaa tacatggagg aagaaaagaa aacatggggc 1260
acagtgttca agactctgaa gtccttgtat aaaacccatg cttgctatga gtacaatcac 1320
atttttccac ttcttgaaaa gtactgtggc ttccatgaag ataacattcc ccagctggaa 1380
gacgtttctc aattcctgca gacttgcact ggtttccgcc tccgacctgt ggctggcctg 1440
ctttcctctc gggatttctt gggtggcctg gccttccgag tcttccactg cacacagtac 1500
atcagacatg gatccaagcc catgtatacc cccgaacctg acatctgcca tgagctgttg 1560
ggacatgtgc ccttgttttc agatcgcagc tttgcccagt tttcccagga aattggcctt 1620
gcctctctgg gtgcacctga tgaatacatt gaaaagctcg ccacaattta ctggtttact 1680
gtggagtttg ggctctgcaa acaaggagac tccataaagg catatggtgc tgggctcctg 1740
tcatcctttg gtgaattaca gtactgctta tcagagaagc caaagcttct ccccctggag 1800
ctggagaaga cagccatcca aaattacact gtcacggagt tccagcccct gtattacgtg 1860
gcagagagtt ttaatgatgc caaggagaaa gtaaggaact ttgctgccac aatacctcgg 1920
cccttctcag ttcgctacga cccatacacc caaaggattg aggtcttgga caatacccag 1980
cagcttaaga ttttggctga ttccattaac agtgaaattg gaatcctttg cagtgccctc 2040
cagaaaataa agtaactcga gatccagaca tgataagata cattgatgag tttggacaaa 2100
ccacaactag aatgcagtga aaaaaatgct ttatttgtga aatttgtgat gctattgctt 2160
tatttgtaac cattataagc tgcaataaac aagttaacaa caacaattgc attcatttta 2220
tgtttcaggt tcagggggag gtgtgggagg ttttttaaag catgctgggg agagatcgat 2280
ctgaggaacc cctagtgatg gagttggcca ctccctctct gcgcgctcgc tcgctcactg 2340
aggccgggcg accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg 2400
agcgagcgcg cagagaggga gtggcc 2426
<210> 86
<211> 2042
<212> DNA
<213> 人工序列
<220>
<223> pHMI-01004转移基因组
<400> 86
ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60
tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc 120
cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt 180
agtgtgagag gggaatgact cctttcggta agtgcagtgg aagctgtaca ctgcccaggc 240
aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact tagcccctgt 300
ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct cccccgttgc 360
ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct cagcttcagg 420
caccaccact gacctgggac agtgaatcct ctaaggtaaa tataaaattt ttaagtgtat 480
aatgtgttaa actactgatt ctaattgttt ctctctttta gattccaacc tttggaactg 540
accgccacca tgtccaccgc tgtgctggag aaccctgggc tggggaggaa actgtcagac 600
ttcgggcagg agacttcata cattgaggat aactgtaacc agaatggcgc catctctctg 660
atcttcagcc tgaaggagga agtgggcgcc ctggcaaagg tgctgcgcct gtttgaggag 720
aacgacgtga atctgaccca catcgagtcc cggccttcta gactgaagaa ggacgagtac 780
gagttcttta cccacctgga taagcggtcc ctgccagccc tgacaaacat catcaagatc 840
ctgaggcacg acatcggagc aaccgtgcac gagctgtctc gggacaagaa gaaggatacc 900
gtgccctggt tccctcggac aatccaggag ctggatagat ttgccaacca gatcctgtct 960
tacggagcag agctggacgc agatcaccct ggcttcaagg acccagtgta tcgggcccgg 1020
agaaagcagt ttgccgatat cgcctacaat tataggcacg gacagccaat ccctcgcgtg 1080
gagtatatgg aggaggagaa gaagacctgg ggcacagtgt tcaagaccct gaagagcctg 1140
tacaagacac acgcctgcta cgagtataac cacatcttcc ccctgctgga gaagtattgt 1200
ggctttcacg aggacaatat ccctcagctg gaggacgtga gccagttcct gcagacctgc 1260
acaggcttta ggctgaggcc agtggcagga ctgctgagct cccgggactt cctgggagga 1320
ctggccttca gagtgtttca ctgcacccag tacatcaggc acggctccaa gccaatgtat 1380
acaccagagc ccgacatctg tcacgagctg ctgggccacg tgcccctgtt tagcgataga 1440
tccttcgccc agttttccca ggagatcgga ctggcatctc tgggagcacc tgacgagtac 1500
atcgagaagc tggccaccat ctattggttc acagtggagt ttggcctgtg caagcagggc 1560
gatagcatca aggcctacgg agcaggactg ctgtctagct tcggcgagct gcagtattgt 1620
ctgtccgaga agccaaagct gctgcccctg gagctggaga agaccgccat ccagaactac 1680
accgtgacag agttccagcc cctgtactat gtggccgagt cttttaacga tgccaaggag 1740
aaggtgagaa atttcgccgc cacaatccct aggcccttca gcgtgcggta cgacccttat 1800
acccagagga tcgaggtgct ggataataca cagcagctga agatcctggc tgactcaatc 1860
aatagcgaaa tcggaatcct gtgctccgcc ctgcagaaaa tcaaatgaat gctttatttg 1920
tgaaatttgt gatgctattg ctttatttgt aaccattata agctgcaata aacaagttaa 1980
caacaacaat tgcattcatt ttatgtttca ggttcagggg gaggtgtggg aggtttttta 2040
aa 2042
<210> 87
<211> 2356
<212> DNA
<213> 人工序列
<220>
<223> pHMI-01004转移基因组
<400> 87
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggaatt cacgcgtgga 120
tctgaattca attcacgcgt ggtacctccc taaaatgggc aaacattgca agcagcaaac 180
agcaaacaca cagccctccc tgcctgctga ccttggagct ggggcagagg tcagagacct 240
ctctgggccc atgccacctc caacatccac tcgacccctt ggaatttcgg tggagaggag 300
cagaggttgt cctggcgtgg tttaggtagt gtgagagggg aatgactcct ttcggtaagt 360
gcagtggaag ctgtacactg cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag 420
atcccagcca gtggacttag cccctgtttg ctcctccgat aactggggtg accttggtta 480
atattcacca gcagcctccc ccgttgcccc tctggatcca ctgcttaaat acggacgagg 540
acagggccct gtctcctcag cttcaggcac caccactgac ctgggacagt gaatcctcta 600
aggtaaatat aaaattttta agtgtataat gtgttaaact actgattcta attgtttctc 660
tcttttagat tccaaccttt ggaactgacc gccaccatgt ccaccgctgt gctggagaac 720
cctgggctgg ggaggaaact gtcagacttc gggcaggaga cttcatacat tgaggataac 780
tgtaaccaga atggcgccat ctctctgatc ttcagcctga aggaggaagt gggcgccctg 840
gcaaaggtgc tgcgcctgtt tgaggagaac gacgtgaatc tgacccacat cgagtcccgg 900
ccttctagac tgaagaagga cgagtacgag ttctttaccc acctggataa gcggtccctg 960
ccagccctga caaacatcat caagatcctg aggcacgaca tcggagcaac cgtgcacgag 1020
ctgtctcggg acaagaagaa ggataccgtg ccctggttcc ctcggacaat ccaggagctg 1080
gatagatttg ccaaccagat cctgtcttac ggagcagagc tggacgcaga tcaccctggc 1140
ttcaaggacc cagtgtatcg ggcccggaga aagcagtttg ccgatatcgc ctacaattat 1200
aggcacggac agccaatccc tcgcgtggag tatatggagg aggagaagaa gacctggggc 1260
acagtgttca agaccctgaa gagcctgtac aagacacacg cctgctacga gtataaccac 1320
atcttccccc tgctggagaa gtattgtggc tttcacgagg acaatatccc tcagctggag 1380
gacgtgagcc agttcctgca gacctgcaca ggctttaggc tgaggccagt ggcaggactg 1440
ctgagctccc gggacttcct gggaggactg gccttcagag tgtttcactg cacccagtac 1500
atcaggcacg gctccaagcc aatgtataca ccagagcccg acatctgtca cgagctgctg 1560
ggccacgtgc ccctgtttag cgatagatcc ttcgcccagt tttcccagga gatcggactg 1620
gcatctctgg gagcacctga cgagtacatc gagaagctgg ccaccatcta ttggttcaca 1680
gtggagtttg gcctgtgcaa gcagggcgat agcatcaagg cctacggagc aggactgctg 1740
tctagcttcg gcgagctgca gtattgtctg tccgagaagc caaagctgct gcccctggag 1800
ctggagaaga ccgccatcca gaactacacc gtgacagagt tccagcccct gtactatgtg 1860
gccgagtctt ttaacgatgc caaggagaag gtgagaaatt tcgccgccac aatccctagg 1920
cccttcagcg tgcggtacga cccttatacc cagaggatcg aggtgctgga taatacacag 1980
cagctgaaga tcctggctga ctcaatcaat agcgaaatcg gaatcctgtg ctccgccctg 2040
cagaaaatca aatgaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac 2100
cattataagc tgcaataaac aagttaacaa caacaattgc attcatttta tgtttcaggt 2160
tcagggggag gtgtgggagg ttttttaaag catgctgggg agagatcgat ctgaggaacc 2220
cctagtgatg gagttggcca ctccctctct gcgcgctcgc tcgctcactg aggccgggcg 2280
accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg agcgagcgcg 2340
cagagaggga gtggcc 2356
<210> 88
<211> 5041
<212> DNA
<213> 人工序列
<220>
<223> pHMI-01004完整序列
<400> 88
agaaaaactc atcgagcatc aaatgaaatt gcaatttatt catatcagga ttatcaatac 60
catatttttg aaaaagccgt ttctgtaatg aaggagaaaa ctcaccgagg cagttccata 120
ggatggcaag atcctggtat cggtctgcga ttccgactcg tccaacatca atacaaccta 180
ttaatttccc ctcgtcaaaa ataaggttat caagtgagaa atcaccatga gtgacgactg 240
aatccggtga gaatggcaaa agtttatgca tttctttcca gacttgttca acaggccagc 300
cattacgctc gtcatcaaaa tcactcgcat caaccaaacc gttattcatt cgtgattgcg 360
cctgagcgag gcgaaatacg cgatcgctgt taaaaggaca attacaaaca ggaatcgagt 420
gcaaccggcg caggaacact gccagcgcat caacaatatt ttcacctgaa tcaggatatt 480
cttctaatac ctggaacgct gtttttccgg ggatcgcagt ggtgagtaac catgcatcat 540
caggagtacg gataaaatgc ttgatggtcg gaagtggcat aaattccgtc agccagttta 600
gtctgaccat ctcatctgta acatcattgg caacgctacc tttgccatgt ttcagaaaca 660
actctggcgc atcgggcttc ccatacaagc gatagattgt cgcacctgat tgcccgacat 720
tatcgcgagc ccatttatac ccatataaat cagcatccat gttggaattt aatcgcggcc 780
tcgacgtttc ccgttgaata tggctcatat tcttcctttt tcaatattat tgaagcattt 840
atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa 900
taggggtcag tgttacaacc aattaaccaa ttctgaacat tatcgcgagc ccatttatac 960
ctgaatatgg ctcataacac cccttgtttg cctggcggca gtagcgcggt ggtcccacct 1020
gaccccatgc cgaactcaga agtgaaacgc cgtagcgccg atggtagtgt ggggactccc 1080
catgcgagag tagggaactg ccaggcatca aataaaacga aaggctcagt cgaaagactg 1140
ggcctttcgc ccaaaccata tgattgacat gctagtttta cgattaccgt tcatcgccct 1200
gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgacctttgg 1260
tcgcccggcc tcagtgagcg agcgagcgcg cagagaggga gtggaattca cgcgtggatc 1320
tgaattcaat tcacgcgtgg tacctcccta aaatgggcaa acattgcaag cagcaaacag 1380
caaacacaca gccctccctg cctgctgacc ttggagctgg ggcagaggtc agagacctct 1440
ctgggcccat gccacctcca acatccactc gaccccttgg aatttcggtg gagaggagca 1500
gaggttgtcc tggcgtggtt taggtagtgt gagaggggaa tgactccttt cggtaagtgc 1560
agtggaagct gtacactgcc caggcaaagc gtccgggcag cgtaggcggg cgactcagat 1620
cccagccagt ggacttagcc cctgtttgct cctccgataa ctggggtgac cttggttaat 1680
attcaccagc agcctccccc gttgcccctc tggatccact gcttaaatac ggacgaggac 1740
agggccctgt ctcctcagct tcaggcacca ccactgacct gggacagtga atcctctaag 1800
gtaaatataa aatttttaag tgtataatgt gttaaactac tgattctaat tgtttctctc 1860
ttttagattc caacctttgg aactgaccgc caccatgtcc accgctgtgc tggagaaccc 1920
tgggctgggg aggaaactgt cagacttcgg gcaggagact tcatacattg aggataactg 1980
taaccagaat ggcgccatct ctctgatctt cagcctgaag gaggaagtgg gcgccctggc 2040
aaaggtgctg cgcctgtttg aggagaacga cgtgaatctg acccacatcg agtcccggcc 2100
ttctagactg aagaaggacg agtacgagtt ctttacccac ctggataagc ggtccctgcc 2160
agccctgaca aacatcatca agatcctgag gcacgacatc ggagcaaccg tgcacgagct 2220
gtctcgggac aagaagaagg ataccgtgcc ctggttccct cggacaatcc aggagctgga 2280
tagatttgcc aaccagatcc tgtcttacgg agcagagctg gacgcagatc accctggctt 2340
caaggaccca gtgtatcggg cccggagaaa gcagtttgcc gatatcgcct acaattatag 2400
gcacggacag ccaatccctc gcgtggagta tatggaggag gagaagaaga cctggggcac 2460
agtgttcaag accctgaaga gcctgtacaa gacacacgcc tgctacgagt ataaccacat 2520
cttccccctg ctggagaagt attgtggctt tcacgaggac aatatccctc agctggagga 2580
cgtgagccag ttcctgcaga cctgcacagg ctttaggctg aggccagtgg caggactgct 2640
gagctcccgg gacttcctgg gaggactggc cttcagagtg tttcactgca cccagtacat 2700
caggcacggc tccaagccaa tgtatacacc agagcccgac atctgtcacg agctgctggg 2760
ccacgtgccc ctgtttagcg atagatcctt cgcccagttt tcccaggaga tcggactggc 2820
atctctggga gcacctgacg agtacatcga gaagctggcc accatctatt ggttcacagt 2880
ggagtttggc ctgtgcaagc agggcgatag catcaaggcc tacggagcag gactgctgtc 2940
tagcttcggc gagctgcagt attgtctgtc cgagaagcca aagctgctgc ccctggagct 3000
ggagaagacc gccatccaga actacaccgt gacagagttc cagcccctgt actatgtggc 3060
cgagtctttt aacgatgcca aggagaaggt gagaaatttc gccgccacaa tccctaggcc 3120
cttcagcgtg cggtacgacc cttataccca gaggatcgag gtgctggata atacacagca 3180
gctgaagatc ctggctgact caatcaatag cgaaatcgga atcctgtgct ccgccctgca 3240
gaaaatcaaa tgaatgcttt atttgtgaaa tttgtgatgc tattgcttta tttgtaacca 3300
ttataagctg caataaacaa gttaacaaca acaattgcat tcattttatg tttcaggttc 3360
agggggaggt gtgggaggtt ttttaaagca tgctggggag agatcgatct gaggaacccc 3420
tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag gccgggcgac 3480
caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgca 3540
gagagggagt ggcccatatg cggtaccaga attcgggtct agacgtcaaa agggcgacac 3600
aaaatttatt ctaaatgcat aataaatact gataacatct tatagtttgt attatatttt 3660
gtattatcgt tgacatgtat aattttgata tcaaaaactg attttccctt tattattttc 3720
gagatttatt ttcttaattc tctttaacaa actagaaata ttgtatatac aaaaaatcat 3780
aaataataga tgaatagttt aattataggt gttcatcaat cgaaaaagca acgtatctta 3840
tttaaagtgc gttgcttttt tctcatttat aaggttaaat aattctcata tatcaagcaa 3900
agtgacaggc gcccttaaat attctgacaa atgctctttc cctaaactcc ccccataaaa 3960
aaacccgccg aagcgggttt ttacgttatt tgcggattaa cgattactcg ttatcagaac 4020
cgcccagggg gcccgagctt aagactggcc gtcgttttac aacacagaaa gagtttgtag 4080
aaacgcaaaa aggccatccg tcaggggcct tctgcttagt ttgatgcctg gcagttccct 4140
actctcgcct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg 4200
agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc 4260
aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt 4320
gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag 4380
tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc 4440
cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc 4500
ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt cggtgtaggt 4560
cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt 4620
atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc 4680
agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa 4740
gtggtgggct aactacggct acactagaag aacagtattt ggtatctgcg ctctgctgaa 4800
gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg 4860
tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga 4920
agatcctttg atcttttcta cggggtctga cgctcagtgg aacgacgcgc gcgtaactca 4980
cgttaaggga ttttggtcat gagcttgcgc cgtcccgtca agtcagcgta atgctctgct 5040
t 5041
<210> 89
<211> 2042
<212> DNA
<213> 人工序列
<220>
<223> pHMI-01008转移基因组
<400> 89
ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60
tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc 120
cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt 180
agtgtgagag gggaatgact cctttcggta agtgcagtgg aagctgtaca ctgcccaggc 240
aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact tagcccctgt 300
ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct cccccgttgc 360
ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct cagcttcagg 420
caccaccact gacctgggac agtgaatcct ctaaggtaaa tataaaattt ttaagtgtat 480
aatgtgttaa actactgatt ctaattgttt ctctctttta gattccaacc tttggaactg 540
accgccacca tgtccaccgc tgtgctggag aaccctgggc tggggaggaa actgtcagac 600
ttcgggcagg agacttcata cattgaggat aactgtaacc agaatggcgc catctctctg 660
atcttcagcc tgaaggagga agtgggcgcc ctggcaaagg tgctgcgcct gtttgaggag 720
aacgacgtga atctgaccca catcgagtcc cggccttcta gactgaagaa ggacgagtac 780
gagttcttta cccacctgga taagcggtcc ctgccagccc tgacaaacat catcaagatc 840
ctgaggcacg acatcggagc aaccgtgcac gagctgtctc gggacaagaa gaaggatacc 900
gtgccctggt tccctcggac aatccaggag ctggatagat ttgccaacca gatcctgtct 960
tacggagcag agctggacgc agatcaccct ggcttcaagg acccagtgta tcgggcccgg 1020
agaaagcagt ttgccgatat cgcctacaat tataggcacg gacagccaat ccctcgcgtg 1080
gagtatatgg aggaggagaa gaagacctgg ggcacagtgt tcaagaccct gaagagcctg 1140
tacaagacac acgcctgcta cgagtataac cacatcttcc ccctgctgga gaagtattgt 1200
ggctttcacg aggacaatat ccctcagctg gaggacgtga gccagttcct gcagacctgc 1260
acaggcttta ggctgaggcc agtggcagga ctgctgagct cccgggactt cctgggagga 1320
ctggccttca gagtgtttca ctgcacccag tacatcaggc acggctccaa gccaatgtat 1380
acaccagagc ccgacatctg tcacgagctg ctgggccacg tgcccctgtt tagcgataga 1440
tccttcgccc agttttccca ggagatcgga ctggcatctc tgggagcacc tgacgagtac 1500
atcgagaagc tggccaccat ctattggttc acagtggagt ttggcctgtg caagcagggc 1560
gatagcatca aggcctacgg agcaggactg ctgtctagct tcggcgagct gcagtattgt 1620
ctgtccgaga agccaaagct gctgcccctg gagctggaga agaccgccat ccagaactac 1680
accgtgacag agttccagcc cctgtactat gtggccgagt cttttaacga tgccaaggag 1740
aaggtgagaa atttcgccgc cacaatccct aggcccttca gcgtgcggta cgacccttat 1800
acccagagga tcgaggtgct ggataataca cagcagctga agatcctggc tgactcaatc 1860
aatagcgaaa tcggaatcct gtgctccgcc ctgcagaaaa tcaaatgaat gctttatttg 1920
tgaaatttgt gatgctattg ctttatttgt aaccattata agctgcaata aacaagttaa 1980
caacaacaat tgcattcatt ttatgtttca ggttcagggg gaggtgtggg aggtttttta 2040
aa 2042
<210> 90
<211> 2393
<212> DNA
<213> 人工序列
<220>
<223> pHMI-01008转移基因组
<400> 90
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggaatt cacgcgtgga 120
tctgaattca attcacgcgt ggtacctccc taaaatgggc aaacattgca agcagcaaac 180
agcaaacaca cagccctccc tgcctgctga ccttggagct ggggcagagg tcagagacct 240
ctctgggccc atgccacctc caacatccac tcgacccctt ggaatttcgg tggagaggag 300
cagaggttgt cctggcgtgg tttaggtagt gtgagagggg aatgactcct ttcggtaagt 360
gcagtggaag ctgtacactg cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag 420
atcccagcca gtggacttag cccctgtttg ctcctccgat aactggggtg accttggtta 480
atattcacca gcagcctccc ccgttgcccc tctggatcca ctgcttaaat acggacgagg 540
acagggccct gtctcctcag cttcaggcac caccactgac ctgggacagt gaatcctcta 600
aggtaaatat aaaattttta agtgtataat gtgttaaact actgattcta attgtttctc 660
tcttttagat tccaaccttt ggaactgacc gccaccatgt ccaccgctgt gctggagaac 720
cctgggctgg ggaggaaact gtcagacttc gggcaggaga cttcatacat tgaggataac 780
tgtaaccaga atggcgccat ctctctgatc ttcagcctga aggaggaagt gggcgccctg 840
gcaaaggtgc tgcgcctgtt tgaggagaac gacgtgaatc tgacccacat cgagtcccgg 900
ccttctagac tgaagaagga cgagtacgag ttctttaccc acctggataa gcggtccctg 960
ccagccctga caaacatcat caagatcctg aggcacgaca tcggagcaac cgtgcacgag 1020
ctgtctcggg acaagaagaa ggataccgtg ccctggttcc ctcggacaat ccaggagctg 1080
gatagatttg ccaaccagat cctgtcttac ggagcagagc tggacgcaga tcaccctggc 1140
ttcaaggacc cagtgtatcg ggcccggaga aagcagtttg ccgatatcgc ctacaattat 1200
aggcacggac agccaatccc tcgcgtggag tatatggagg aggagaagaa gacctggggc 1260
acagtgttca agaccctgaa gagcctgtac aagacacacg cctgctacga gtataaccac 1320
atcttccccc tgctggagaa gtattgtggc tttcacgagg acaatatccc tcagctggag 1380
gacgtgagcc agttcctgca gacctgcaca ggctttaggc tgaggccagt ggcaggactg 1440
ctgagctccc gggacttcct gggaggactg gccttcagag tgtttcactg cacccagtac 1500
atcaggcacg gctccaagcc aatgtataca ccagagcccg acatctgtca cgagctgctg 1560
ggccacgtgc ccctgtttag cgatagatcc ttcgcccagt tttcccagga gatcggactg 1620
gcatctctgg gagcacctga cgagtacatc gagaagctgg ccaccatcta ttggttcaca 1680
gtggagtttg gcctgtgcaa gcagggcgat agcatcaagg cctacggagc aggactgctg 1740
tctagcttcg gcgagctgca gtattgtctg tccgagaagc caaagctgct gcccctggag 1800
ctggagaaga ccgccatcca gaactacacc gtgacagagt tccagcccct gtactatgtg 1860
gccgagtctt ttaacgatgc caaggagaag gtgagaaatt tcgccgccac aatccctagg 1920
cccttcagcg tgcggtacga cccttatacc cagaggatcg aggtgctgga taatacacag 1980
cagctgaaga tcctggctga ctcaatcaat agcgaaatcg gaatcctgtg ctccgccctg 2040
cagaaaatca aatgaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac 2100
cattataagc tgcaataaac aagttaacaa caacaattgc attcatttta tgtttcaggt 2160
tcagggggag gtgtgggagg ttttttaaag catgctgggg agagatcgat ctggtagata 2220
agtagcatgg cgggttaatc attaactaca aggaacccct agtgatggag ttggccactc 2280
cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg 2340
gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg gcc 2393
<210> 91
<211> 5078
<212> DNA
<213> 人工序列
<220>
<223> pHMI-01008完整序列
<400> 91
agaaaaactc atcgagcatc aaatgaaatt gcaatttatt catatcagga ttatcaatac 60
catatttttg aaaaagccgt ttctgtaatg aaggagaaaa ctcaccgagg cagttccata 120
ggatggcaag atcctggtat cggtctgcga ttccgactcg tccaacatca atacaaccta 180
ttaatttccc ctcgtcaaaa ataaggttat caagtgagaa atcaccatga gtgacgactg 240
aatccggtga gaatggcaaa agtttatgca tttctttcca gacttgttca acaggccagc 300
cattacgctc gtcatcaaaa tcactcgcat caaccaaacc gttattcatt cgtgattgcg 360
cctgagcgag gcgaaatacg cgatcgctgt taaaaggaca attacaaaca ggaatcgagt 420
gcaaccggcg caggaacact gccagcgcat caacaatatt ttcacctgaa tcaggatatt 480
cttctaatac ctggaacgct gtttttccgg ggatcgcagt ggtgagtaac catgcatcat 540
caggagtacg gataaaatgc ttgatggtcg gaagtggcat aaattccgtc agccagttta 600
gtctgaccat ctcatctgta acatcattgg caacgctacc tttgccatgt ttcagaaaca 660
actctggcgc atcgggcttc ccatacaagc gatagattgt cgcacctgat tgcccgacat 720
tatcgcgagc ccatttatac ccatataaat cagcatccat gttggaattt aatcgcggcc 780
tcgacgtttc ccgttgaata tggctcatat tcttcctttt tcaatattat tgaagcattt 840
atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa 900
taggggtcag tgttacaacc aattaaccaa ttctgaacat tatcgcgagc ccatttatac 960
ctgaatatgg ctcataacac cccttgtttg cctggcggca gtagcgcggt ggtcccacct 1020
gaccccatgc cgaactcaga agtgaaacgc cgtagcgccg atggtagtgt ggggactccc 1080
catgcgagag tagggaactg ccaggcatca aataaaacga aaggctcagt cgaaagactg 1140
ggcctttcgc ccaaaccata tgattgacat gctagtttta cgattaccgt tcatcgccct 1200
gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgacctttgg 1260
tcgcccggcc tcagtgagcg agcgagcgcg cagagaggga gtggaattca cgcgtggatc 1320
tgaattcaat tcacgcgtgg tacctcccta aaatgggcaa acattgcaag cagcaaacag 1380
caaacacaca gccctccctg cctgctgacc ttggagctgg ggcagaggtc agagacctct 1440
ctgggcccat gccacctcca acatccactc gaccccttgg aatttcggtg gagaggagca 1500
gaggttgtcc tggcgtggtt taggtagtgt gagaggggaa tgactccttt cggtaagtgc 1560
agtggaagct gtacactgcc caggcaaagc gtccgggcag cgtaggcggg cgactcagat 1620
cccagccagt ggacttagcc cctgtttgct cctccgataa ctggggtgac cttggttaat 1680
attcaccagc agcctccccc gttgcccctc tggatccact gcttaaatac ggacgaggac 1740
agggccctgt ctcctcagct tcaggcacca ccactgacct gggacagtga atcctctaag 1800
gtaaatataa aatttttaag tgtataatgt gttaaactac tgattctaat tgtttctctc 1860
ttttagattc caacctttgg aactgaccgc caccatgtcc accgctgtgc tggagaaccc 1920
tgggctgggg aggaaactgt cagacttcgg gcaggagact tcatacattg aggataactg 1980
taaccagaat ggcgccatct ctctgatctt cagcctgaag gaggaagtgg gcgccctggc 2040
aaaggtgctg cgcctgtttg aggagaacga cgtgaatctg acccacatcg agtcccggcc 2100
ttctagactg aagaaggacg agtacgagtt ctttacccac ctggataagc ggtccctgcc 2160
agccctgaca aacatcatca agatcctgag gcacgacatc ggagcaaccg tgcacgagct 2220
gtctcgggac aagaagaagg ataccgtgcc ctggttccct cggacaatcc aggagctgga 2280
tagatttgcc aaccagatcc tgtcttacgg agcagagctg gacgcagatc accctggctt 2340
caaggaccca gtgtatcggg cccggagaaa gcagtttgcc gatatcgcct acaattatag 2400
gcacggacag ccaatccctc gcgtggagta tatggaggag gagaagaaga cctggggcac 2460
agtgttcaag accctgaaga gcctgtacaa gacacacgcc tgctacgagt ataaccacat 2520
cttccccctg ctggagaagt attgtggctt tcacgaggac aatatccctc agctggagga 2580
cgtgagccag ttcctgcaga cctgcacagg ctttaggctg aggccagtgg caggactgct 2640
gagctcccgg gacttcctgg gaggactggc cttcagagtg tttcactgca cccagtacat 2700
caggcacggc tccaagccaa tgtatacacc agagcccgac atctgtcacg agctgctggg 2760
ccacgtgccc ctgtttagcg atagatcctt cgcccagttt tcccaggaga tcggactggc 2820
atctctggga gcacctgacg agtacatcga gaagctggcc accatctatt ggttcacagt 2880
ggagtttggc ctgtgcaagc agggcgatag catcaaggcc tacggagcag gactgctgtc 2940
tagcttcggc gagctgcagt attgtctgtc cgagaagcca aagctgctgc ccctggagct 3000
ggagaagacc gccatccaga actacaccgt gacagagttc cagcccctgt actatgtggc 3060
cgagtctttt aacgatgcca aggagaaggt gagaaatttc gccgccacaa tccctaggcc 3120
cttcagcgtg cggtacgacc cttataccca gaggatcgag gtgctggata atacacagca 3180
gctgaagatc ctggctgact caatcaatag cgaaatcgga atcctgtgct ccgccctgca 3240
gaaaatcaaa tgaatgcttt atttgtgaaa tttgtgatgc tattgcttta tttgtaacca 3300
ttataagctg caataaacaa gttaacaaca acaattgcat tcattttatg tttcaggttc 3360
agggggaggt gtgggaggtt ttttaaagca tgctggggag agatcgatct ggtagataag 3420
tagcatggcg ggttaatcat taactacaag gaacccctag tgatggagtt ggccactccc 3480
tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc 3540
tttgcccggg cggcctcagt gagcgagcga gcgcgcagag agggagtggc ccatatgcgg 3600
taccagaatt cgggtctaga cgtcaaaagg gcgacacaaa atttattcta aatgcataat 3660
aaatactgat aacatcttat agtttgtatt atattttgta ttatcgttga catgtataat 3720
tttgatatca aaaactgatt ttccctttat tattttcgag atttattttc ttaattctct 3780
ttaacaaact agaaatattg tatatacaaa aaatcataaa taatagatga atagtttaat 3840
tataggtgtt catcaatcga aaaagcaacg tatcttattt aaagtgcgtt gcttttttct 3900
catttataag gttaaataat tctcatatat caagcaaagt gacaggcgcc cttaaatatt 3960
ctgacaaatg ctctttccct aaactccccc cataaaaaaa cccgccgaag cgggttttta 4020
cgttatttgc ggattaacga ttactcgtta tcagaaccgc ccagggggcc cgagcttaag 4080
actggccgtc gttttacaac acagaaagag tttgtagaaa cgcaaaaagg ccatccgtca 4140
ggggccttct gcttagtttg atgcctggca gttccctact ctcgccttcc gcttcctcgc 4200
tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg 4260
cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag 4320
gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 4380
gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 4440
gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 4500
ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc 4560
atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg 4620
tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt 4680
ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca 4740
gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtgggctaac tacggctaca 4800
ctagaagaac agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag 4860
ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca 4920
agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg 4980
ggtctgacgc tcagtggaac gacgcgcgcg taactcacgt taagggattt tggtcatgag 5040
cttgcgccgt cccgtcaagt cagcgtaatg ctctgctt 5078
<210> 92
<211> 6020
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hPAH-TC-025完整序列
<400> 92
aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg 60
ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt tgagtgagct 120
gataccgctc gccgcagccg aacgaccgag cgcagcgagt cagtgagcga ggaagcggaa 180
gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc cgattcatta atgcagcagc 240
tggcgtaata gcgaagaggc ccgcaccgat cgcccttccc aacagttgcg cagcctgaat 300
ggcgaatgga attccagacg attgagcgtc aaaatgtagg tatttccatg agcgtttttc 360
ctgttgcaat ggctggcggt aatattgttc tggatattac cagcaaggcc gatagtttga 420
gttcttctac tcaggcaagt gatgttatta ctaatcaaag aagtattgcg acaacggtta 480
atttgcgtga tggacagact cttttactcg gtggcctcac tgattataaa aacacttctc 540
aggattctgg cgtaccgttc ctgtctaaaa tccctttaat cggcctcctg tttagctccc 600
gctctgattc taacgaggaa agcacgttat acgtgctcgt caaagcaacc atagtacgcg 660
ccctgtagcg gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca 720
cttgccagcg ccctagcgcc cgctcctttc gctttcttcc cttcctttct cgccacgttc 780
gccggctttc cccgtcaagc tctaaatcgg gggctccctt tagggttccg atttagtgct 840
ttacggcacc tcgaccccaa aaaacttgat tagggtgatg gttcacgtag tgggccatcg 900
ccctgataga cggtttttcg ccctttgacg ttggagtcca cgttctttaa tagtggactc 960
ttgttccaaa ctggaacaac actcaaccct atctcggtct attcttttga tttataaggg 1020
attttgccga tttcggccta ttggttaaaa aatgagctga tttaacaaaa atttaacgcg 1080
aattttaaca aaatattaac gcttacaatt taaatatttg cttatacaat cttcctgttt 1140
ttggggcttt tctgattatc aaccggggta catatgattg acatgctagt tttacgatta 1200
ccgttcatcg ccctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt 1260
cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggaa 1320
ttcacgcgtg gatctgaatt caattcacgc gtggtacctc cctaaaatgg gcaaacattg 1380
caagcagcaa acagcaaaca cacagccctc cctgcctgct gaccttggag ctggggcaga 1440
ggtcagagac ctctctgggc ccatgccacc tccaacatcc actcgacccc ttggaatttc 1500
ggtggagagg agcagaggtt gtcctggcgt ggtttaggta gtgtgagagg ggaatgactc 1560
ctttcggtaa gtgcagtgga agctgtacac tgcccaggca aagcgtccgg gcagcgtagg 1620
cgggcgactc agatcccagc cagtggactt agcccctgtt tgctcctccg ataactgggg 1680
tgaccttggt taatattcac cagcagcctc ccccgttgcc cctctggatc cactgcttaa 1740
atacggacga ggacagggcc ctgtctcctc agcttcaggc accaccactg acctgggaca 1800
gtgaatcctc taaggtaaat ataaaatttt taagtgtata atgtgttaaa ctactgattc 1860
taattgtttc tctcttttag attccaacct ttggaactga ccgccaccat gtccaccgct 1920
gtgctggaga accctgggct ggggaggaaa ctgtcagact tcgggcagga gacttcatac 1980
attgaggata actgtaacca gaatggcgcc atctctctga tcttcagcct gaaggaggaa 2040
gtgggcgccc tggcaaaggt gctgcgcctg tttgaggaga acgacgtgaa tctgacccac 2100
atcgagtccc ggccttctag actgaagaag gacgagtacg agttctttac ccacctggat 2160
aagcggtccc tgccagccct gacaaacatc atcaagatcc tgaggcacga catcggagca 2220
accgtgcacg agctgtctcg ggacaagaag aaggataccg tgccctggtt ccctcggaca 2280
atccaggagc tggatagatt tgccaaccag atcctgtctt acggagcaga gctggacgca 2340
gatcaccctg gcttcaagga cccagtgtat cgggcccgga gaaagcagtt tgccgatatc 2400
gcctacaatt ataggcacgg acagccaatc cctcgcgtgg agtatatgga ggaggagaag 2460
aagacctggg gcacagtgtt caagaccctg aagagcctgt acaagacaca cgcctgctac 2520
gagtataacc acatcttccc cctgctggag aagtattgtg gctttcacga ggacaatatc 2580
cctcagctgg aggacgtgag ccagttcctg cagacctgca caggctttag gctgaggcca 2640
gtggcaggac tgctgagctc ccgggacttc ctgggaggac tggccttcag agtgtttcac 2700
tgcacccagt acatcaggca cggctccaag ccaatgtata caccagagcc cgacatctgt 2760
cacgagctgc tgggccacgt gcccctgttt agcgatagat ccttcgccca gttttcccag 2820
gagatcggac tggcatctct gggagcacct gacgagtaca tcgagaagct ggccaccatc 2880
tattggttca cagtggagtt tggcctgtgc aagcagggcg atagcatcaa ggcctacgga 2940
gcaggactgc tgtctagctt cggcgagctg cagtattgtc tgtccgagaa gccaaagctg 3000
ctgcccctgg agctggagaa gaccgccatc cagaactaca ccgtgacaga gttccagccc 3060
ctgtactatg tggccgagtc ttttaacgat gccaaggaga aggtgagaaa tttcgccgcc 3120
acaatcccta ggcccttcag cgtgcggtac gacccttata cccagaggat cgaggtgctg 3180
gataatacac agcagctgaa gatcctggct gactcaatca atagcgaaat cggaatcctg 3240
tgctccgccc tgcagaaaat caaatgaatg ctttatttgt gaaatttgtg atgctattgc 3300
tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt 3360
tatgtttcag gttcaggggg aggtgtggga ggttttttaa agcatgctgg ggagagatcg 3420
atctgaggaa cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac 3480
tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt gcccgggcgg cctcagtgag 3540
cgagcgagcg cgcagagagg gagtggcccc cccccccccc ccccccggcg attctcttgt 3600
ttgctccaga ctctcaggca atgacctgat agcctttgta gagacctctc aaaaatagct 3660
accctctccg gcatgaattt atcagctaga acggttgaat atcatattga tggtgatttg 3720
actgtctccg gcctttctca cccgtttgaa tctttaccta cacattactc aggcattgca 3780
tttaaaatat atgagggttc taaaaatttt tatccttgcg ttgaaataaa ggcttctccc 3840
gcaaaagtat tacagggtca taatgttttt ggtacaaccg atttagcttt atgctctgag 3900
gctttattgc ttaattttgc taattctttg ccttgcctgt atgatttatt ggatgttgga 3960
atcgcctgat gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcatatggt 4020
gcactctcag tacaatctgc tctgatgccg catagttaag ccagccccga cacccgccaa 4080
cacccgctga cgcgccctga cgggcttgtc tgctcccggc atccgcttac agacaagctg 4140
tgaccgtctc cgggagctgc atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga 4200
gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt 4260
cttagacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt 4320
tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat 4380
aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt 4440
ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg 4500
ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga 4560
tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc 4620
tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac 4680
actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg 4740
gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca 4800
acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg 4860
gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg 4920
acgagcgtga caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg 4980
gcgaactact tactctagct tcccggcaac aattaataga ctggatggag gcggataaag 5040
ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg 5100
gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct 5160
cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac 5220
agatcgctga gataggtgcc tcactgatta agcattggta actgtcagac caagtttact 5280
catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga 5340
tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt 5400
cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct 5460
gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc 5520
taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgtcc 5580
ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc 5640
tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg 5700
ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt 5760
cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg 5820
agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 5880
gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt 5940
atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 6000
gggggcggag cctatggaaa 6020

Claims (104)

1.一种在细胞中表达PAH多肽的方法,该方法包括用复制缺陷型腺伴随病毒(AAV)转导所述细胞,该复制缺陷型腺伴随病毒包含:
(a)包含AAV进化枝F衣壳蛋白的AAV衣壳;和
(b)包含与PAH编码序列可操作连接的转录调节元件的转移基因组。
2.权利要求1的方法,其中所述细胞是肝细胞、肾细胞或脑、垂体、肾上腺、胰腺、膀胱、胆囊、结肠、小肠或乳房中的细胞。
3.权利要求1或2的方法,其中所述细胞在哺乳动物受试者中,并且以有效转导所述受试者中的所述细胞的量对所述受试者施用所述AAV。
4.用于治疗患有与PAH基因突变相关的疾病或病症的受试者的方法,所述方法包括对所述受试者施用有效量的复制缺陷型腺伴随病毒(AAV),其包含:
(a)包含AAV进化枝F衣壳蛋白的AAV衣壳;和
(b)包含与PAH编码序列可操作连接的转录调节元件的转移基因组。
5.权利要求4的方法,其中所述疾病或病症是苯丙酮尿。
6.权利要求4或5的方法,其中所述受试者是人类受试者。
7.前述权利要求中任一项的方法,其中所述PAH编码序列编码SEQ ID NO:23所示的氨基酸序列。
8.权利要求7的方法,其中所述PAH编码序列包含SEQ ID NO:24所示的核苷酸序列。
9.权利要求7的方法,其中将所述PAH编码序列沉默改变。
10.权利要求9的方法,其中所述PAH编码序列包含SEQ ID NO:25所示的核苷酸序列。
11.前述权利要求中任一项的方法,其中所述转录调节元件能够介导肝细胞、肾细胞或脑、垂体、肾上腺、胰腺、膀胱、胆囊、结肠、小肠或乳房中的细胞中的转录。
12.权利要求11的方法,其中所述转录调节元件包含选自下组的一种或多种元件:CAG启动子、人EF-1α启动子、人肝控制区1(HCR1)、人α1-抗胰蛋白酶(hAAT)启动子、hAAT启动子的肝特异性调节模块、SV40内含子和小鼠细小病毒(MVM)内含子。
13.权利要求12的方法,其中所述转录调节元件包含与选自SEQ ID NO:28-30和32-41的序列至少90%相同的核苷酸序列。
14.权利要求13的方法,其中所述转录调节元件包含选自SEQ ID NO:28-30和32-41的核苷酸序列。
15.权利要求14的方法,其中所述转录调节元件从5’至3’包含SEQ ID NO:29、30和31所示的核苷酸序列。
16.权利要求15的方法,其中所述转录调节元件包含SEQ ID NO:32所示的核苷酸序列。
17.前述权利要求中任一项的方法,其中所述转移基因组进一步包含与所述PAH编码序列可操作连接的内含子。
18.权利要求17的方法,其中所述内含子包含与SEQ ID NO:31或35所示的序列至少90%相同的核苷酸序列。
19.权利要求18的方法,其中所述内含子包含SEQ ID NO:31或35所示的核苷酸序列。
20.权利要求17-19中任一项的方法,其中所述转移基因组从5’至3’包含:非编码外显子、所述内含子和所述PAH编码序列。
21.前述权利要求中任一项的方法,其中所述转移基因组进一步包含所述PAH编码序列3’的聚腺苷酸化序列。
22.权利要求21的方法,其中所述聚腺苷酸化序列是外源聚腺苷酸化序列。
23.权利要求22的方法,其中所述外源聚腺苷酸化序列是SV40聚腺苷酸化序列。
24.权利要求23的方法,其中所述SV40聚腺苷酸化序列包括选自SEQ ID NO:42、43和45的序列。
25.前述权利要求中任一项的方法,其中所述转移基因组包含选自SEQ ID NO:46-50、61、64、67、74、76、78、80、82、84、86和89的序列。
26.前述权利要求中任一项的方法,其中所述转移基因组进一步包含所述基因组5’的5’反向末端重复(5’ITR)核苷酸序列和所述基因组3’的3’反向末端重复(3’ITR)核苷酸序列。
27.权利要求26的方法,其中所述5’ITR核苷酸序列与SEQ ID NO:18具有至少95%的序列同一性,并且所述3’ITR核苷酸序列与SEQ ID NO:19具有至少95%的序列同一性。
28.权利要求26的方法,其中所述5’ITR核苷酸序列与SEQ ID NO:20具有至少95%的序列同一性,并且所述3’ITR核苷酸序列与SEQ ID NO:21具有至少95%的序列同一性。
29.权利要求26的方法,其中所述5’ITR核苷酸序列与SEQ ID NO:26具有至少95%的序列同一性,并且所述3’ITR核苷酸序列与SEQ ID NO:27具有至少95%的序列同一性。
30.前述权利要求中任一项的方法,其中所述转移基因组包含选自SEQ ID NO:51-55、62、65、68、75、77、79、81、83、85、87和90的核苷酸序列。
31.前述权利要求中任一项的方法,其中所述转移基因组由选自SEQ ID NO:51-55、62、65、68、75、77、79、81、83、85、87和90的核苷酸序列组成。
32.前述权利要求中任一项的方法,其中所述转移基因组由SEQ ID NO:52所示的核苷酸序列组成。
33.前述权利要求中任一项的方法,其中所述AAV进化枝F衣壳蛋白包含与SEQ ID NO:2、3、4、6、7、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列具有至少95%的序列同一性的氨基酸序列。
34.权利要求33的方法,其中:所述衣壳蛋白中与SEQ ID NO:2的氨基酸206对应的氨基酸是C;所述衣壳蛋白中与SEQ ID NO:2的氨基酸296对应的氨基酸为H;所述衣壳蛋白中与SEQ ID NO:2的氨基酸312对应的氨基酸为Q;所述衣壳蛋白中与SEQ ID NO:2的氨基酸346对应的氨基酸为A;所述衣壳蛋白中与SEQ ID NO:2的氨基酸464对应的氨基酸为N;所述衣壳蛋白中与SEQ ID NO:2的氨基酸468对应的氨基酸为S;所述衣壳蛋白中与SEQ ID NO:2的氨基酸501对应的氨基酸为I;所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸590对应的氨基酸为R;所述衣壳蛋白中与SEQID NO:2的氨基酸626对应的氨基酸为G或Y;所述衣壳蛋白中与SEQ ID NO:2的氨基酸681对应的氨基酸为M;所述衣壳蛋白中与SEQ ID NO:2的氨基酸687对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸690对应的氨基酸为K;所述衣壳蛋白中与SEQ ID NO:2的氨基酸706对应的氨基酸为C;或者,所述衣壳蛋白中与SEQ ID NO:2的氨基酸718对应的氨基酸为G。
35.权利要求34的方法,其中:
(a)所述衣壳蛋白中与SEQ ID NO:2的氨基酸626对应的氨基酸为G,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸718对应的氨基酸为G;
(b)所述衣壳蛋白中与SEQ ID NO:2的氨基酸296对应的氨基酸为H,所述衣壳蛋白中与SEQ ID NO:2的氨基酸464对应的氨基酸为N,所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸681对应的氨基酸为M。
(c)所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸687对应的氨基酸为R;
(d)所述衣壳蛋白中与SEQ ID NO:2的氨基酸346对应的氨基酸为A,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R;或
(e)所述衣壳蛋白中与SEQ ID NO:2的氨基酸501对应的氨基酸为I,所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸706对应的氨基酸为C。
36.权利要求34的方法,其中所述衣壳蛋白包含SEQ ID NO:2、3、4、6、7、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列。
37.前述权利要求中任一项的方法,其中所述AAV进化枝F衣壳蛋白包含与SEQ ID NO:2、3、4、5、6、7、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列具有至少95%的序列同一性的氨基酸序列。
38.权利要求37的方法,其中:所述衣壳蛋白中与SEQ ID NO:2的氨基酸151对应的氨基酸是R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸160对应的氨基酸为D;所述衣壳蛋白中与SEQ ID NO:2的氨基酸206对应的氨基酸为C;所述衣壳蛋白中与SEQ ID NO:2的氨基酸296对应的氨基酸为H;所述衣壳蛋白中与SEQ ID NO:2的氨基酸312对应的氨基酸为Q;所述衣壳蛋白中与SEQ ID NO:2的氨基酸346对应的氨基酸为A;所述衣壳蛋白中与SEQ ID NO:2的氨基酸464对应的氨基酸为N;所述衣壳蛋白中与SEQ ID NO:2的氨基酸468对应的氨基酸为S;所述衣壳蛋白中与SEQ ID NO:2的氨基酸501对应的氨基酸为I;所述衣壳蛋白中与SEQID NO:2的氨基酸505对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸590对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸626对应的氨基酸为G或Y;所述衣壳蛋白中与SEQ ID NO:2的氨基酸681对应的氨基酸为M;所述衣壳蛋白中与SEQ ID NO:2的氨基酸687对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸690对应的氨基酸为K;所述衣壳蛋白中与SEQ ID NO:2的氨基酸706对应的氨基酸为C;或者,所述衣壳蛋白中与SEQ ID NO:2的氨基酸718对应的氨基酸为G。
39.权利要求38的方法,其中:
(a)所述衣壳蛋白中与SEQ ID NO:2的氨基酸626对应的氨基酸为G,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸718对应的氨基酸为G;
(b)所述衣壳蛋白中与SEQ ID NO:2的氨基酸296对应的氨基酸为H,所述衣壳蛋白中与SEQ ID NO:2的氨基酸464对应的氨基酸为N,所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸681对应的氨基酸为M;
(c)所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸687对应的氨基酸为R;
(d)所述衣壳蛋白中与SEQ ID NO:2的氨基酸346对应的氨基酸为A,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R;或
(e)所述衣壳蛋白中与SEQ ID NO:2的氨基酸501对应的氨基酸为I,所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸706对应的氨基酸为C。
40.权利要求38的方法,其中所述衣壳蛋白包含SEQ ID NO:2、3、4、5、6、7、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列。
41.前述权利要求中任一项的方法,其中所述AAV进化枝F衣壳蛋白包含与SEQ ID NO:2、3、4、5、6、7、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列具有至少95%序列同一性的氨基酸序列。
42.权利要求41的方法,其中:所述衣壳蛋白中与SEQ ID NO:2的氨基酸2对应的氨基酸为T;所述衣壳蛋白中与SEQ ID NO:2的氨基酸65对应的氨基酸为I;所述衣壳蛋白中与SEQID NO:2的氨基酸68对应的氨基酸为V;所述衣壳蛋白中与SEQ ID NO:2的氨基酸77对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸119对应的氨基酸为L;所述衣壳蛋白中与SEQ ID NO:2的氨基酸151对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸160对应的氨基酸为D;所述衣壳蛋白中与SEQ ID NO:2的氨基酸206对应的氨基酸为C;所述衣壳蛋白中与SEQ ID NO:2的氨基酸296对应的氨基酸为H;所述衣壳蛋白中与SEQ ID NO:2的氨基酸312对应的氨基酸为Q;所述衣壳蛋白中与SEQ ID NO:2的氨基酸346对应的氨基酸为A;所述衣壳蛋白中与SEQ ID NO:2的氨基酸464对应的氨基酸为N;所述衣壳蛋白中与SEQID NO:2的氨基酸468对应的氨基酸为S;所述衣壳蛋白中与SEQ ID NO:2的氨基酸501对应的氨基酸为I;所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸590对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸626对应的氨基酸为G或Y;所述衣壳蛋白中与SEQ ID NO:2的氨基酸681对应的氨基酸为M;所述衣壳蛋白中与SEQ ID NO:2的氨基酸687对应的氨基酸为R;所述衣壳蛋白中与SEQID NO:2的氨基酸690对应的氨基酸为K;所述衣壳蛋白中与SEQ ID NO:2的氨基酸706对应的氨基酸为C;或,所述衣壳蛋白中与SEQ ID NO:2的氨基酸718对应的氨基酸为G。
43.权利要求42的方法,其中:
(a)所述衣壳蛋白中与SEQ ID NO:2的氨基酸2对应的氨基酸为T,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸312对应的氨基酸为Q;
(b)所述衣壳蛋白中与SEQ ID NO:2的氨基酸65对应的氨基酸为I,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸626对应的氨基酸为Y;
(c)所述衣壳蛋白中与SEQ ID NO:2的氨基酸77对应的氨基酸为R,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸690对应的氨基酸为K;
(d)所述衣壳蛋白中与SEQ ID NO:2的氨基酸119对应的氨基酸为L,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸468对应的氨基酸为S;
(e)所述衣壳蛋白中与SEQ ID NO:2的氨基酸626对应的氨基酸为G,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸718对应的氨基酸为G;
(f)所述衣壳蛋白中与SEQ ID NO:2的氨基酸296对应的氨基酸为H,所述衣壳蛋白中与SEQ ID NO:2的氨基酸464对应的氨基酸为N,所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸681对应的氨基酸为M;
(g)所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸687对应的氨基酸为R;
(h)所述衣壳蛋白中与SEQ ID NO:2的氨基酸346对应的氨基酸为A,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R;或
(i)所述衣壳蛋白中与SEQ ID NO:2的氨基酸501对应的氨基酸为I,所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸706对应的氨基酸为C。
44.权利要求42的方法,其中所述衣壳蛋白包含SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列。
45.一种复制缺陷型腺伴随病毒(AAV),其包含:
(a)包含AAV进化枝F衣壳蛋白的AAV衣壳;和
(b)包含与PAH编码序列可操作连接的转录调节元件的转移基因组。
46.权利要求45的AAV,其中所述PAH编码序列编码SEQ ID NO:23所示的氨基酸序列。
47.权利要求46的AAV,其中所述PAH编码序列包含SEQ ID NO:24所示的核苷酸序列。
48.权利要求46的AAV,其中所述PAH编码序列是密码子改变的,并且包含SEQ ID NO:25和69-73所示的序列。
49.权利要求46的AAV,其中所述PAH编码序列是密码子改变的,并且包含SEQ ID NO:25所示的序列。
50.权利要求45-49中任一项的AAV,其中所述转录调节元件能够介导肝细胞、肾细胞或脑、垂体、肾上腺、胰腺、膀胱、胆囊、结肠、小肠或乳房中的细胞中的转录。
51.权利要求50的AAV,其中所述转录调节元件包含选自下组的一种或多种元件:CAG启动子、人EF-1α启动子、人HCR1、人α1-抗胰蛋白酶(hAAT)启动子、hAAT启动子的肝特异性调节模块、SV40内含子和小鼠细小病毒(MVM)内含子。
52.权利要求51的AAV,其中所述转录调节元件包含与选自SEQ ID NO:28-30和32-41的序列至少90%相同的核苷酸序列。
53.权利要求52的AAV,其中所述转录调节元件包含选自SEQ ID NO:28-30和32-41的核苷酸序列。
54.权利要求53的AAV,其中所述转录调节元件从5’至3’包含SEQ ID NO:29、30和31所示的核苷酸序列。
55.权利要求54的AAV,其中所述转录调节元件包含SEQ ID NO:32所示的核苷酸序列。
56.权利要求45-55中任一项的AAV,其中所述转移基因组进一步包含与所述PAH编码序列可操作连接的内含子。
57.权利要求56的AAV,其中所述内含子包含与SEQ ID NO:31或35所示的序列至少90%相同的核苷酸序列。
58.权利要求57的AAV,其中所述内含子包含SEQ ID NO:31或35所示的核苷酸序列。
59.权利要求56-58中任一项的AAV,其中所述转移基因组从5’至3’包含:非编码外显子、所述内含子和所述PAH编码序列。
60.权利要求45-59中任一项的AAV,其中所述转移基因组进一步包含所述PAH编码序列3’的聚腺苷酸化序列。
61.权利要求60的AAV,其中所述聚腺苷酸化序列是外源聚腺苷酸化序列。
62.权利要求61的AAV,其中所述外源聚腺苷酸化序列是SV40聚腺苷酸化序列。
63.权利要求62的AAV,其中所述SV40聚腺苷酸化序列包括选自SEQ ID NO:42、43和45的序列。
64.权利要求45-63中任一项的AAV,其中所述转移基因组包含选自SEQ ID NO:46-50、61、64、67、74、76、78、80、82、84、86和89的序列。
65.权利要求45-64中任一项的AAV,其中所述转移基因组进一步包含所述基因组5’的5’反向末端重复(5’ITR)核苷酸序列和所述基因组3’的3’反向末端重复(3’ITR)核苷酸序列。
66.权利要求65的AAV,其中所述5’ITR核苷酸序列与SEQ ID NO:18具有至少95%的序列同一性,并且所述3’ITR核苷酸序列与SEQ ID NO:19具有至少95%的序列同一性。
67.权利要求65的AAV,其中所述5’ITR核苷酸序列与SEQ ID NO:20具有至少95%的序列同一性,并且所述3’ITR核苷酸序列与SEQ ID NO:21具有至少95%的序列同一性。
68.权利要求65的AAV,其中所述5’ITR核苷酸序列与SEQ ID NO:26具有至少95%的序列同一性,并且所述3’ITR核苷酸序列与SEQ ID NO:27具有至少95%的序列同一性。
69.权利要求45-68中任一项的AAV,其中所述转移基因组包含选自SEQ ID NO:51-55、62、65、68、75、77、79、81、83、85、87和90的核苷酸序列。
70.权利要求45-69中任一项的AAV,其中所述转移基因组由选自SEQ ID NO:51-55、62、65、68、75、77、79、81、83、85、87和90的核苷酸序列组成。
71.权利要求45-70中任一项的AAV,其中所述转移基因组由SEQ ID NO:52所示的核苷酸序列组成。
72.权利要求44-71中任一项的AAV,其中所述AAV进化枝F衣壳蛋白包含与SEQ ID NO:2、3、4、6、7、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列具有至少95%的序列同一性的氨基酸序列。
73.权利要求72的AAV,其中:所述衣壳蛋白中与SEQ ID NO:2的氨基酸206对应的氨基酸为C;所述衣壳蛋白中与SEQ ID NO:2的氨基酸296对应的氨基酸为H;所述衣壳蛋白中与SEQ ID NO:2的氨基酸312对应的氨基酸为Q;所述衣壳蛋白中与SEQ ID NO:2的氨基酸346对应的氨基酸为A;所述衣壳蛋白中与SEQ ID NO:2的氨基酸464对应的氨基酸为N;所述衣壳蛋白中与SEQ ID NO:2的氨基酸468对应的氨基酸为S;所述衣壳蛋白中与SEQ ID NO:2的氨基酸501对应的氨基酸为I;所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸590对应的氨基酸为R;所述衣壳蛋白中与SEQID NO:2的氨基酸626对应的氨基酸为G或Y;所述衣壳蛋白中与SEQ ID NO:2的氨基酸681对应的氨基酸为M;所述衣壳蛋白中与SEQ ID NO:2的氨基酸687对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸690对应的氨基酸为K;所述衣壳蛋白中与SEQ ID NO:2的氨基酸706对应的氨基酸为C;或,所述衣壳蛋白中与SEQ ID NO:2的氨基酸718对应的氨基酸为G。
74.权利要求73的AAV,其中:
(a)所述衣壳蛋白中与SEQ ID NO:2的氨基酸626对应的氨基酸为G,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸718对应的氨基酸为G;
(b)所述衣壳蛋白中与SEQ ID NO:2的氨基酸296对应的氨基酸为H,所述衣壳蛋白中与SEQ ID NO:2的氨基酸464对应的氨基酸为N,所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸681对应的氨基酸为M;
(c)所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸687对应的氨基酸为R;
(d)所述衣壳蛋白中与SEQ ID NO:2的氨基酸346对应的氨基酸为A,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R;或
(e)所述衣壳蛋白中与SEQ ID NO:2的氨基酸501对应的氨基酸为I,所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸706对应的氨基酸为C。
75.权利要求73的AAV,其中所述衣壳蛋白包含SEQ ID NO:2、3、4、6、7、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列。
76.权利要求45-75中任一项的AAV,其中所述AAV进化枝F衣壳蛋白包含与SEQ ID NO:2、3、4、5、6、7、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列具有至少95%的序列同一性的氨基酸序列。
77.权利要求76的AAV,其中:所述衣壳蛋白中与SEQ ID NO:2的氨基酸151对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸160对应的氨基酸为D;所述衣壳蛋白中与SEQ ID NO:2的氨基酸206对应的氨基酸为C;所述衣壳蛋白中与SEQ ID NO:2的氨基酸296对应的氨基酸为H;所述衣壳蛋白中与SEQ ID NO:2的氨基酸312对应的氨基酸为Q;所述衣壳蛋白中与SEQ ID NO:2的氨基酸346对应的氨基酸为A;所述衣壳蛋白中与SEQ ID NO:2的氨基酸464对应的氨基酸为N;所述衣壳蛋白中与SEQ ID NO:2的氨基酸468对应的氨基酸为S;所述衣壳蛋白中与SEQ ID NO:2的氨基酸501对应的氨基酸为I;所述衣壳蛋白中与SEQID NO:2的氨基酸505对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸590对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸626对应的氨基酸为G或Y;所述衣壳蛋白中与SEQ ID NO:2的氨基酸681对应的氨基酸为M;所述衣壳蛋白中与SEQ ID NO:2的氨基酸687对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸690对应的氨基酸为K;所述衣壳蛋白中与SEQ ID NO:2的氨基酸706对应的氨基酸为C;或,所述衣壳蛋白中与SEQID NO:2的氨基酸718对应的氨基酸为G。
78.权利要求77的AAV,其中:
(a)所述衣壳蛋白中与SEQ ID NO:2的氨基酸626对应的氨基酸为G,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸718对应的氨基酸为G;
(b)所述衣壳蛋白中与SEQ ID NO:2的氨基酸296对应的氨基酸为H,所述衣壳蛋白中与SEQ ID NO:2的氨基酸464对应的氨基酸为N,所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸681对应的氨基酸为M;
(c)所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸687对应的氨基酸为R;
(d)所述衣壳蛋白中与SEQ ID NO:2的氨基酸346对应的氨基酸为A,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R;或
(e)所述衣壳蛋白中与SEQ ID NO:2的氨基酸501对应的氨基酸为I,所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸706对应的氨基酸为C。
79.权利要求77的AAV,其中所述衣壳蛋白包含SEQ ID NO:2、3、4、5、6、7、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列。
80.权利要求45-79中任一项的AAV,其中所述AAV进化枝F衣壳蛋白包含与SEQ ID NO:2、3、4、5、6、7、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列具有至少95%序列同一性的氨基酸序列。
81.权利要求80的AAV,其中:所述衣壳蛋白中与SEQ ID NO:2的氨基酸2对应的氨基酸为T;所述衣壳蛋白中与SEQ ID NO:2的氨基酸65对应的氨基酸为I;所述衣壳蛋白中与SEQID NO:2的氨基酸68对应的氨基酸为V;所述衣壳蛋白中与SEQ ID NO:2的氨基酸77对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸119对应的氨基酸为L;所述衣壳蛋白中与SEQ ID NO:2的氨基酸151对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸160对应的氨基酸为D;所述衣壳蛋白中与SEQ ID NO:2的氨基酸206对应的氨基酸为C;所述衣壳蛋白中与SEQ ID NO:2的氨基酸296对应的氨基酸为H;所述衣壳蛋白中与SEQ ID NO:2的氨基酸312对应的氨基酸为Q;所述衣壳蛋白中与SEQ ID NO:2的氨基酸346对应的氨基酸为A;所述衣壳蛋白中与SEQ ID NO:2的氨基酸464对应的氨基酸为N;所述衣壳蛋白中与SEQID NO:2的氨基酸468对应的氨基酸为S;所述衣壳蛋白中与SEQ ID NO:2的氨基酸501对应的氨基酸为I;所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸590对应的氨基酸为R;所述衣壳蛋白中与SEQ ID NO:2的氨基酸626对应的氨基酸为G或Y;所述衣壳蛋白中与SEQ ID NO:2的氨基酸681对应的氨基酸为M;所述衣壳蛋白中与SEQ ID NO:2的氨基酸687对应的氨基酸为R;所述衣壳蛋白中与SEQID NO:2的氨基酸690对应的氨基酸为K;所述衣壳蛋白中与SEQ ID NO:2的氨基酸706对应的氨基酸为C;或,所述衣壳蛋白中与SEQ ID NO:2的氨基酸718对应的氨基酸为G。
82.权利要求81的AAV,其中:
(a)所述衣壳蛋白中与SEQ ID NO:2的氨基酸2对应的氨基酸为T,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸312对应的氨基酸为Q;
(b)所述衣壳蛋白中与SEQ ID NO:2的氨基酸65对应的氨基酸为I,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸626对应的氨基酸为Y;
(c)所述衣壳蛋白中与SEQ ID NO:2的氨基酸77对应的氨基酸为R,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸690对应的氨基酸为K;
(d)所述衣壳蛋白中与SEQ ID NO:2的氨基酸119对应的氨基酸为L,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸468对应的氨基酸为S;
(e)所述衣壳蛋白中与SEQ ID NO:2的氨基酸626对应的氨基酸为G,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸718对应的氨基酸为G;
(f)所述衣壳蛋白中与SEQ ID NO:2的氨基酸296对应的氨基酸为H,所述衣壳蛋白中与SEQ ID NO:2的氨基酸464对应的氨基酸为N,所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸681对应的氨基酸为M;
(g)所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸687对应的氨基酸为R;
(h)所述衣壳蛋白中与SEQ ID NO:2的氨基酸346对应的氨基酸为A,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R;或
(i)所述衣壳蛋白中与SEQ ID NO:2的氨基酸501对应的氨基酸为I,所述衣壳蛋白中与SEQ ID NO:2的氨基酸505对应的氨基酸为R,并且所述衣壳蛋白中与SEQ ID NO:2的氨基酸706对应的氨基酸为C。
83.权利要求81的AAV,其中所述衣壳蛋白包含SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列。
84.药物组合物,其包含权利要求45-83中任一项的AAV。
85.用于重组制备复制缺陷型AAV的包装系统,其中该包装系统包含:
(a)编码一种或多种AAV Rep蛋白的Rep核苷酸序列;
(b)编码如权利要求72-83中任一项所述的一种或多种AAV进化枝F衣壳蛋白的Cap核苷酸序列;和
(c)如权利要求45-71中任一项所述的转移基因组,其中所述包装系统在细胞中起作用以将所述转移基因组封闭在所述衣壳中以形成所述AAV。
86.权利要求85的包装系统,其中所述包装系统包括包含所述Rep核苷酸序列和所述Cap核苷酸序列的第一载体和包含所述转移基因组的第二载体。
87.权利要求85或86的包装系统,其中所述Rep核苷酸序列编码AAV2Rep蛋白。
88.权利要求87的包装系统,其中所述AAV2 Rep蛋白是78/68或Rep68/52。
89.权利要求87或88的包装系统,其中所述AAV2Rep蛋白包含与SEQ ID NO:22的AAV2Rep氨基酸序列具有最小百分比序列同一性的氨基酸序列,其中跨越编码所述AAV2 Rep蛋白的氨基酸序列长度,所述最小百分比序列同一性是至少70%。
90.权利要求85-89中任一项的包装系统,其进一步包含第三载体,其中所述第三载体是辅助病毒载体。
91.权利要求90的包装系统,其中所述辅助病毒载体是独立的第三载体。
92.权利要求90的包装系统,其中所述辅助病毒载体与所述第一载体是整合的。
93.权利要求90的包装系统,其中所述辅助病毒载体与所述第二载体是整合的。
94.权利要求90-93中任一项的包装系统,其中所述第三载体包含编码辅助病毒蛋白的基因。
95.权利要求90-94中任一项的包装系统,其中所述辅助病毒选自腺病毒、疱疹病毒、牛痘病毒和巨细胞病毒(CMV)。
96.权利要求95的包装系统,其中所述辅助病毒是腺病毒。
97.权利要求96的包装系统,其中所述腺病毒基因组包含一种或多种选自E1、E2、E4和VA的腺病毒RNA基因。
98.权利要求95的包装系统,其中所述辅助病毒是单纯疱疹病毒(HSV)。
99.权利要求98的包装系统,其中所述HSV基因组包含选自UL5/8/52、ICPO、ICP4、ICP22和UL30/UL42的一种或多种HSV基因。
100.权利要求90-99中任一项的包装系统,其中所述第一载体和所述第三载体被包含在第一转染质粒内。
101.权利要求90-99中任一项的包装系统,其中所述第二载体和所述第三载体的核苷酸被包含在第二转染质粒内。
102.权利要求90-99中任一项的包装系统,其中将所述第一载体和所述第三载体的核苷酸克隆到重组辅助病毒中。
103.权利要求90-99中任一项的包装系统,其中将所述第二载体和所述第三载体的核苷酸克隆到重组辅助病毒中。
104.重组制备复制缺陷型AAV的方法,该方法包括在用于将转移基因组封闭在衣壳中以形成AAV的起作用的条件下将权利要求85-103中任一项的包装系统导入细胞中。
CN201980019659.2A 2018-02-01 2019-02-01 用于pah基因转移的腺伴随病毒组合物及其使用方法 Pending CN111886021A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862625150P 2018-02-01 2018-02-01
US62/625,150 2018-02-01
PCT/US2019/016351 WO2019152841A1 (en) 2018-02-01 2019-02-01 Adeno-associated virus compositions for pah gene transfer and methods of use thereof

Publications (1)

Publication Number Publication Date
CN111886021A true CN111886021A (zh) 2020-11-03

Family

ID=67478560

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980019659.2A Pending CN111886021A (zh) 2018-02-01 2019-02-01 用于pah基因转移的腺伴随病毒组合物及其使用方法

Country Status (14)

Country Link
EP (1) EP3746113A4 (zh)
JP (2) JP7066861B2 (zh)
KR (2) KR20230065367A (zh)
CN (1) CN111886021A (zh)
AU (1) AU2019215150A1 (zh)
BR (1) BR112020015511A2 (zh)
CA (1) CA3089824A1 (zh)
CL (1) CL2020001992A1 (zh)
CO (1) CO2020010783A2 (zh)
EA (1) EA202091844A1 (zh)
IL (2) IL295830A (zh)
MX (1) MX2020008085A (zh)
PE (1) PE20210341A1 (zh)
WO (1) WO2019152841A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116656740A (zh) * 2023-05-30 2023-08-29 浙江大学 一种腺相关病毒基因治疗载体及其在制备治疗苯丙酮尿症的药物中的应用

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2017301600B2 (en) 2016-07-26 2022-08-04 Biomarin Pharmaceutical Inc. Novel adeno-associated virus capsid proteins
JP2021522811A (ja) 2018-05-09 2021-09-02 ビオマリン プハルマセウトイカル インコーポレイテッド フェニルケトン尿症の治療方法
TW202005978A (zh) 2018-05-14 2020-02-01 美商拜奧馬林製藥公司 新穎肝靶向腺相關病毒載體
PE20220233A1 (es) * 2019-06-10 2022-02-07 Homology Medicines Inc Composiciones de virus adenoasociados para la transferencia del gen de arsa y metodos de uso de las mismas
TW202140791A (zh) * 2020-01-13 2021-11-01 美商霍蒙拉奇醫藥公司 治療苯酮尿症之方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040142416A1 (en) * 2002-04-30 2004-07-22 Laipis Philip J. Treatment for phenylketonuria
CN107295802A (zh) * 2014-09-24 2017-10-24 希望之城 用于高效基因组编辑的腺相关病毒载体变异体和其方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU3663699A (en) * 1998-04-24 1999-11-16 University Of Florida Materials and methods for gene therapy
US20030198620A1 (en) * 2002-04-16 2003-10-23 Keiya Ozawa Method of treating amino acid metabolic disorders using recombinant adeno-associated virus virions
US20100316623A1 (en) * 2009-04-23 2010-12-16 Andrew Turner Phenylalanine hydroxylase fusion protein and methods for treating phenylketonuria
US9839696B2 (en) * 2010-04-30 2017-12-12 City Of Hope Recombinant adeno-associated vectors for targeted treatment
DK2675902T3 (da) * 2011-02-17 2019-06-03 Univ Pennsylvania Sammensætninger og fremgangsmåder til at ændre vævsspecificitet og forbedre aav9-medieret genoverførsel
WO2015061491A1 (en) * 2013-10-22 2015-04-30 Shire Human Genetic Therapies, Inc. Mrna therapy for phenylketonuria
US11382941B2 (en) * 2016-12-30 2022-07-12 The Trustees Of The University Of Pennsylvania Gene therapy for treating Phenylketonuria

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040142416A1 (en) * 2002-04-30 2004-07-22 Laipis Philip J. Treatment for phenylketonuria
CN107295802A (zh) * 2014-09-24 2017-10-24 希望之城 用于高效基因组编辑的腺相关病毒载体变异体和其方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116656740A (zh) * 2023-05-30 2023-08-29 浙江大学 一种腺相关病毒基因治疗载体及其在制备治疗苯丙酮尿症的药物中的应用

Also Published As

Publication number Publication date
KR20200127187A (ko) 2020-11-10
IL276215B (en) 2022-10-01
MX2020008085A (es) 2020-12-10
IL276215B2 (en) 2023-02-01
KR102528641B1 (ko) 2023-05-03
PE20210341A1 (es) 2021-02-23
IL295830A (en) 2022-10-01
EP3746113A1 (en) 2020-12-09
JP2022105105A (ja) 2022-07-12
JP2021512601A (ja) 2021-05-20
BR112020015511A2 (pt) 2021-01-26
IL276215A (en) 2020-09-30
EP3746113A4 (en) 2022-03-09
WO2019152841A1 (en) 2019-08-08
EA202091844A1 (ru) 2021-02-03
CO2020010783A2 (es) 2020-11-20
JP7433360B2 (ja) 2024-02-19
JP7066861B2 (ja) 2022-05-13
CL2020001992A1 (es) 2021-02-12
KR20230065367A (ko) 2023-05-11
CA3089824A1 (en) 2019-08-08
AU2019215150A1 (en) 2020-09-24

Similar Documents

Publication Publication Date Title
KR102528641B1 (ko) Pah 유전자 전달을 위한 아데노-연관 바이러스 조성물 및 이의 사용 방법
AU2018229561B2 (en) Recombinant adenoviruses and use thereof
CN111593073B (zh) 双报告基因骨架载体、四质粒假病毒包装系统、包装新冠肺炎假病毒
RU2762257C2 (ru) Генная терапия для лечения гемофилии a
KR20180086266A (ko) 척수성 근위축증의 치료에 유용한 아데노-관련 바이러스 벡터
KR100880509B1 (ko) 재조합 단백질의 대량 생산을 위한 신규한 벡터, 발현세포주 및 이를 이용한 재조합 단백질의 생산 방법
KR20200054278A (ko) 세포의 유전적 변형을 위한 비-통합 dna 벡터
CN109069668B (zh) 用于眼病的基因疗法
KR20210103469A (ko) 재조합 바이러스 벡터 및 이를 생산하기 위한 핵산
CN101213203A (zh) 在转录后水平调节核酸表达的方法和组合物
KR20210030965A (ko) 다논병을 치료하기 위한 유전자 요법 벡터
US11129890B1 (en) Non-integrating HIV-1 comprising mutant RT/IN proteins and the SARS-CoV-2 spike protein
CN113692225B (zh) 经基因组编辑的鸟类
KR20220016485A (ko) 미엘린 단백질 제로 프로모터를 갖는 aav 벡터, 및 샤르코-마리-투스 질환과 같은 슈반 세포-관련 질환을 치료하기 위한 이의 용도
CN112088015A (zh) 人乳头瘤病毒疫苗及其用途
CN115803441A (zh) 用于恢复pah基因功能的腺相关病毒组合物和其使用方法
KR20200128703A (ko) B형 간염 백신 및 이의 용도
CN113874512A (zh) 诱导毛细胞分化的组合物和方法
US20210130818A1 (en) Compositions and Methods for Enhancement of Homology-Directed Repair Mediated Precise Gene Editing by Programming DNA Repair with a Single RNA-Guided Endonuclease
CN113166779A (zh) 调控的基因编辑系统
TW202302857A (zh) 多臂黏液瘤(myxoma)病毒
KR102504463B1 (ko) 아데노바이러스 벡터를 포함하는 폐암 진단용 조성물 및 이의 용도
RU2817770C2 (ru) Интеграция конструкций нуклеиновой кислоты в эукариотические клетки с транспозазой из oryzias
KR20150021839A (ko) 암특이적 유전자를 표적하는 트랜스-스플라이싱 라이보자임의 조절 유도체를 포함하는 재조합 아데노바이러스 및 이의 용도
CA2395490A1 (en) Repressible sterility of animals

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40040028

Country of ref document: HK