CN115516100A - 靶向肌肉疾病中肌肉的优化基因疗法 - Google Patents

靶向肌肉疾病中肌肉的优化基因疗法 Download PDF

Info

Publication number
CN115516100A
CN115516100A CN202080097838.0A CN202080097838A CN115516100A CN 115516100 A CN115516100 A CN 115516100A CN 202080097838 A CN202080097838 A CN 202080097838A CN 115516100 A CN115516100 A CN 115516100A
Authority
CN
China
Prior art keywords
gne
raav
muscle
promoter
variant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080097838.0A
Other languages
English (en)
Inventor
P·T·马丁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Research Institute at Nationwide Childrens Hospital
Original Assignee
Research Institute at Nationwide Childrens Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Research Institute at Nationwide Childrens Hospital filed Critical Research Institute at Nationwide Childrens Hospital
Publication of CN115516100A publication Critical patent/CN115516100A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4707Muscular dystrophy
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P21/00Drugs for disorders of the muscular or neuromuscular system
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/075Animals genetically altered by homologous recombination inducing loss of function, i.e. knock out
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/0306Animal model for genetic diseases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/106Plasmid DNA for vertebrates
    • C12N2800/107Plasmid DNA for vertebrates for mammalian
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/20Vectors comprising a special translation-regulating system translation of more than one cistron
    • C12N2840/203Vectors comprising a special translation-regulating system translation of more than one cistron having an IRES

Abstract

本公开提供了基因治疗载体,诸如腺相关病毒(AAV),其经过优化以用于将转基因递送至肌肉。优化的载体含有:组成型或肌肉特异性启动子,分别用于递送全身或骨骼肌/心肌特异性转基因表达,并与转基因cDNA结合,用正常基因拷贝替换肌肉疾病中发现的基因突变;内部核糖体进入位点(IRES),以允许从同一转录物中产生第二种蛋白质;以及肌肉生长因子,用于建立新的肌肉生长和力量。例如,本公开提供了基因治疗载体,诸如重组腺相关病毒(rAAV),其被设计成用于治疗GNE肌病,其中rAAV单独或与肌肉生长因子或肌肉转分化因子结合表达UDP‑GlcNAc‑差向异构酶/ManNAc‑6。所提供的AAV取代了突变的GNE基因表达,同时表达了刺激肌肉生长的蛋白质。

Description

靶向肌肉疾病中肌肉的优化基因疗法
本申请要求于2019年12月20日提交的美国临时专利申请第62/951,564号的优先权,该申请的全部内容通过引用并入本文。
以电子方式提交的材料通过引用并入
本申请含有作为本公开内容的单独部分的计算机可读形式的序列表,该序列表通过引用以其整体并入本文且标识如下:创建于2020年12月21日的名称为“54649_Sqlisting.txt”的一份233,379字节的文件。
技术领域
本公开提供了基因治疗载体,诸如腺相关病毒(AAV),其经过优化以用于将转基因递送至肌肉。优化的载体含有:组成型或肌肉特异性启动子,分别用于递送全身或骨骼肌/心肌特异性转基因表达,并与转基因cDNA结合,用正常基因拷贝替换肌肉疾病中发现的基因突变;内部核糖体进入位点(IRES),以允许从同一转录物中产生第二种蛋白质;以及肌肉生长因子,用于建立新的肌肉生长和力量。转基因和肌肉生长因子基因由同一mRNA表达,由于成纤维细胞生长因子1A基因序列中内部核糖体进入位点(或IRES)的存在,该mRNA表达两种蛋白质,这允许第二种蛋白质由单个mRNA制成。
背景技术
GNE肌病是一种成人发病的常染色体隐性遗传病,其特征是进行性肌肉无力,可导致丧失行走能力和丧失独立生活能力。顾名思义,GNE肌病是由GNE基因功能丧失致病变异或突变引起的。这种疾病也被称为遗传性包涵体肌病、保留股四头肌肌病、远端型肌病伴镶边空泡和野中广务(Nonaka)肌病。GNE基因编码双功能UDP-GlcNAc-差向异构酶/ManNAc-6激酶,其酶活性在唾液酸生物合成途径中是必不可少的。
唾液酸是酸性单糖,可修饰糖蛋白和糖脂上的非还原末端碳水化合物链,在不同过程中诸如细胞粘附和细胞相互作用发挥重要作用。唾液酸与健康和疾病有关,并且存在于调节它们的细胞功能的蛋白质的末端糖链中。UDP-N-乙酰氨基葡萄糖2-差向异构酶/N-乙酰甘露糖激酶(GNE)是唾液酸生物合成的关键酶。此外,已经证明当肌纤维受损或再生时会诱导GNE表达,并且GNE在肌肉再生中起作用。携带突变的GNE基因的成肌细胞表现出它们的差向异构酶活性的降低,因此携带纯合差向异构酶突变的细胞也仅表现出总膜结合唾液酸的显著降低。(Pogoryleva等人,《罕见病孤儿杂志(Orphanet J Rare Dis.)》13:70,2018)。
GNE肌病导致腿部和手臂肌肉无力和消瘦。首发症状通常发生在年轻人身上(通常在生命中的第三个十年),但在一些患者中也已观察到较晚发作。GNE肌病的诊断应主要考虑在成年早期出现远端无力(足下垂)的患者(也可能出现其他症状)。该疾病缓慢进展至其他下肢和上肢肌肉,通常会明显保留股四头肌。在受影响肌肉的活检中发现的特征性发现包含“镶边”(自噬)空泡、各种蛋白质的聚集和纤维大小的变化。
尽管GNE基因的突变在2001年被证明会导致GNE肌病,但目前还没有针对这种疾病的有效疗法。开发缓释唾液酸疗法的尝试在3期临床试验中失败,目前正在研究ManNAc聚糖疗法。虽然开发用于GNE基因替代的基因治疗方法似乎很简单,但实际上它因GNE肌病研究中的许多未解决问题而变得复杂:首先,该疾病缺乏稳健且可重复的模型。虽然Noguchi和Nishino发表了几篇关于转基因GNED176VTg Gne-/-小鼠模型的论文,该模型显示了疾病病理学的清晰方面,但其他群体在随后的培育中未能看到相同的表型,这可能是奠基者转基因品系中遗传漂移的结果(参见Nishino等人,《神经病学.神经外科学.精神病学杂志(J.Neurol.Neurosurg,Psychiatry)》86(4):385-392)。GNEM712T变异敲入小鼠模型显示在生命的最初几周内因肾脏疾病而过早死亡,这是一种在GNE肌病患者中不存在的临床表型。尽管具有相同的基因突变,但培育出相同模型的其他品系根本没有表现出任何表型。其次是缺乏来自罕见且地理多样化的患者群体的可测量的自然史数据。第三,由于疾病进展较晚,仅通过基因置换的GNE肌病试验很难显示临床效果,这只会减缓或阻止疾病进展。
缺乏GNE活性的细胞可以通过添加唾液酸(SA)或通过添加ManNAc来挽救,后者也可以通过在疾病中未发生突变的GlcNAc-6激酶活性转化为GNE活性的最终产物ManNAc-6磷酸盐。一些聚糖疗法已在GNED176VTgGne-/-小鼠和GneM712T敲入小鼠中显示出疗效。这已产生了两组临床试验,一组使用缓释SA(第3阶段完成)(Lochmuller等人,《神经病学(Neurology)》92(18):e2109-e17,2019)和一组使用ManNAc(第1阶段完成)(Xu等人,《分子遗传学和代谢(Mol.Genet.Metab.)》,12291-2:126-34,2017)。虽然SA和ManNAc在小鼠中显示出显著的治疗效果,但在GNE肌病患者的3期临床试验中,缓释SA疗法(ACE-ER)没有达到临床里程碑[16]。对于任何临床测量,与安慰剂相比没有显著变化。
GNE肌病患者中聚糖治疗缺乏疗效使得基因治疗成为非常有吸引力的替代方案。然而,仍然存在一个主要问题,即人类疾病进展缓慢且多变,并且缺乏稳健的短期临床里程碑。例如,当前的3期临床试验持续时间为48周[16]。在这段时间里,患者群体的任何强度测量值与治疗前基线相比都没有显著下降,尽管一些测量值确实呈下降趋势。
本文提供的GNE治疗方法的目标是创建串联基因疗法——利用肌肉特异性IRES来创建表达正常GNE基因和已知肌肉生长因子的双顺反子基因治疗载体。这样的AAV载体既能纠正GNE肌病的遗传缺陷,又能增加肌肉力量,从而逆转而不是仅仅阻止肌肉力量临床指标的下降。建立新的肌肉和肌肉力量,同时通过添加正常GNE基因来预防进一步疾病的疗法将对GNE肌病患者有更大的益处,并将提供一种更容易证明临床改进的方法。
鉴于该疾病的病理生理学,最近的临床试验评估了唾液酸或ManNAc(唾液酸的前体)在GNE肌病患者中的使用以及早期基因治疗试验。例如,携带野生型人GNE cDNA的AAV8病毒载体已被证明可以转导培养的鼠肌肉细胞和人GNE肌病衍生的肌肉细胞,并在这些细胞中表达转基因(Mitrani-Rosenbaum等人,《神经肌内失调(Neuromuscul.Disord.)》,22(11):1015-24,2012)。现有技术中的基因疗法仅侧重于递送野生型GNE基因,并未利用本文公开的双功能双顺反子技术。
本公开提供了增加肌肉力量的基因疗法,同时它们提供了用于基因置换的转基因以防止进一步的肌肉损伤或促进肌肉生长。例如,提供GNE基因置换的基因治疗载体可能是在短于5年的时间内证明GNE肌病临床有效性的唯一方法之一,这是因为疾病进展的自然史缓慢且不断变化。它也将是在所有GNE肌病患者中显示出临床疗效的唯一方法之一,其中许多患者虽然在诊断后不久就失去了行走能力,但仍然可以显示出显著的手臂功能,例如自我进食功能,从而仍能够通过这种疗法使该功能得到保留或改善。因为这种疾病是一种肌病而不是营养不良,所以肌肉一旦修复,就应永久保留在原位。
发明内容
本公开提供了基因治疗载体,诸如腺相关病毒(AAV),其经过优化以用于将转基因递送至肌肉。优化的载体包含:组成型或肌肉特异性启动子,分别用于递送全身或骨骼肌/心肌肉特异性转基因表达,并与转基因cDNA结合,用正常基因拷贝(或替代的基因置换)替换肌肉疾病中发现的基因突变;内部核糖体进入位点(IRES),以允许从同一转录物中产生第二种蛋白质;以及肌肉生长因子,用于建立新的肌肉生长和力量。转基因和肌肉生长因子基因由同一mRNA表达,由于成纤维细胞生长因子1A基因序列中内部核糖体进入位点(或IRES)的存在,该mRNA表达两种蛋白质,这允许第二种蛋白质由单个mRNA制成。例如,本公开提供了被设计成用于治疗GNE肌病的基因治疗载体。AAV表达GNE基因,该GNE基因单独或与诸如卵泡抑素(FST)、肝素结合修饰的胰岛素样生长因子1(HB-IGF)、天然IGF1或SMAD7等肌肉生长因子结合来编码双功能UDP-GlcNAc-差向异构酶/ManNAc-6激酶酶。在这种情况下,所提供的AAV将GNE肌病患者中突变的GNE基因表达替换为正常的GNE基因,同时表达刺激肌肉生长和力量的蛋白质,这可以抵消甚至逆转疾病的进程。串联载体的独特之处在于它同时提供了两种必要的治疗元素——1,一种基因替代疗法,用于预防表达细胞或组织时产生另一种疾病;以及2,一种肌肉生长疗法,用于通过建立新的肌肉生长和力量来逆转疾病。对于肌营养不良症和肌病,肌肉组织的损失是由导致该疾病的基因突变引起的。这里提出的疗法不仅将通过重新引入疾病基因的非突变版本来阻止此类患者的疾病,而且通过共同表达肌肉生长因子来建立和逆转持续的肌肉损失。这种生长因子可能会使组织中的肌肉数量增加一倍,但也会使这些疾病引起的无力感增加一倍(从而产生逆转)。
本公开还提供了用于治疗肌营养不良症(例如,杜氏肌营养不良症、肢带肌营养不良症2L(LGMD2A)和先天性肌营养不良症1a(MDC1A))的替代的基因治疗载体。AAV表达了GALGT2(B4GALNT2)基因,该GNE基因单独或与诸如卵泡抑素(FST)、肝素结合修饰的胰岛素样生长因子1(HB-IGF)、天然IGF1或SMAD7等肌肉生长因子结合来编码GalNAc转移酶(β1,4–N-乙酰半乳糖胺半乳糖基转移酶)。这是一种替代的基因疗法,因为该疗法不是替换突变基因,而是提供将复杂糖分子转移到特定蛋白质(例如肌营养不良聚糖)上的酶。
本文提供了具有包含组成型或肌肉特异性启动子的基因组的AAV,该启动子驱动编码目的转基因的核苷酸序列与编码肌肉生长因子的核苷酸序列组合表达,所述肌肉生长因子例如为诱导肌肉生长和肌肉特异性IRES(例如FGF IRES)的蛋白质,或肌肉转分化因子(例如myoD)。该基因治疗方法可用于治疗任何需要基因置换并需要增加肌肉生长或肌肉力量的疾病,例如GNE肌病、肢带肌营养不良症、先天性肌营养不良症1A和杜氏肌营养不良症。
本公开提供的多核苷酸包含:a)启动子元件,例如组成型或肌肉特异性启动子;b)转基因;c)内部核糖体进入位点(IRES);以及d)编码肌肉生长因子或肌肉转分化因子的核苷酸序列(即第二转基因)。例如,组成型或肌肉特异性启动子与转基因可操作地连接和/或IRES与编码肌肉生长因子或肌肉转分化因子的核苷酸序列可操作地连接。元件连接到单个mRNA的事实使得由单个AAV介导的基因治疗产品提供了两种功能。由于AAV生产的巨大费用以及AAV给药的安全问题,将单个AAV载体与两种基因疗法一起使用将大大优于通过将两种单基因AAV基因疗法混合在一起获得相同的结果,其中必须制造两倍(或更多)量的AAV并将其递送给患者才能达到相同的结果。
本公开还提供了多核苷酸,其包含:a)一种或多种组成型或肌肉特异性启动子元件;以及b)GNE cDNA序列或GALGT2 cDNA序列。例如,多核苷酸包含:a)更多组成型或肌肉特异性启动子元件;b)GNE cDNA序列;c)内部核糖体进入位点(IRES);以及和d)诱导肌肉生长或将细胞分化成肌肉细胞的多核苷酸序列。在一些实施方案中,肌肉特异性控制元件与GNEcDNA序列可操作地连接和/或IRES与诱导肌肉生长的多核苷酸可操作地连接。在另外的示例中,多核苷酸包含:a)更多组成型或肌肉特异性启动子元件;b)GALGT2 cDNA序列;c)内部核糖体进入位点(IRES);以及d)诱导肌肉生长或将细胞分化成肌肉细胞的多核苷酸序列。
GNE肌病是一种成人发病、进展缓慢的肌肉疾病。为了在合理的时间范围内展示治疗效果,并为在诊断时已经受到肌肉无力影响的患者提供最大的益处,需要一种基因疗法,其不仅可以纠正GNE基因功能的遗传缺陷,还可以建立新的肌肉质量。已知卵泡抑素、IGF1、SMAD7和HB-IGF可显著刺激小鼠、猕猴和/或人类的肌肉生长。卵泡抑素部分地通过竞争性抑制和Smad2/3信号传导压制利用肌肉生长抑制素来抑制压制性生长信号传导来做到这一点,而IGF1部分地通过激活肌肉IGF1受体和激活Akt/mTOR信号传导来做到这一点。本文提供了由来自FGF1A的IRES序列用GNE表达的双顺反子AAV,众所周知,FGF1A在骨骼肌组织中是最有效的。使用肌肉特异性IRES是卵泡抑素的理想选择,因为它通过局部表达来促进最佳肌肉生长,而使用CMV启动子进行GNE表达将是理想的,因为GNE通常在所有组织中表达。
本文提供了具有基因组的AAV,该基因组包含驱动GNE cDNA序列或GALGT2 cDNA序列表达的启动子元件,例如组成型启动子或肌肉特异性启动子。特别地,本公开提供了具有被设计用于促进GNE基因置换的基因组的rAAV。在这些AAV中,基因组包含:a)一种或多种肌肉特异性启动子元件和b)GNE cDNA序列。在另一方面,本公开提供了具有被设计用于促进GALGT2替代基因治疗(替代基因的表达)的基因组的rAAV。
例如,本公开提供了包含多核苷酸的rAAV基因组,所述多核苷酸包含:编码野生型人GNE基因,例如变体2GNE野生型人cDNA(SEQ ID NO:1)的核苷酸序列;以及诸如CMV启动子(SEQ ID NO:3)、MCK启动子(SEQ ID NO:4)、MHCK7启动子(SEQ ID NO:5)或迷你CMV启动子(SEQ ID NO:7)等肌肉特异性启动子;或人GNE启动子序列(SEQ ID NO:6)。在一些实施方案中,在外显子1和2之间发现有人GNE启动子元件以驱动包含SEQ ID NO:1的核酸序列的变体2(722个氨基酸)GNE cDNA的表达(从而允许内源性天然基因表达)。
本公开还提供了多核苷酸,其包含:a)一种或多种组成型或肌肉特异性启动子元件;以及b)GALGT2 cDNA序列(SEQ ID NO:36)。例如,多核苷酸包含:a)更多组成型或肌肉特异性启动子元件;b)GALGT2 cDNA序列;c)内部核糖体进入位点(IRES);以及d)诱导肌肉生长或将细胞分化成肌肉细胞的多核苷酸序列。在一些实施方案中,肌肉特异性控制元件与GALGT2 cDNA序列可操作地连接和/或IRES与诱导肌肉生长的多核苷酸可操作地连接。
例如,本公开还提供了包含多核苷酸的rAAV基因组,该多核苷酸包含:编码野生型人GALGT2基因(SEQ ID NO:36)的核苷酸序列;以及诸如MCK启动子(SEQ ID NO:4)或MHCK7启动子(SEQ ID NO:5)等肌肉特异性启动子。
本公开还提供了具有被设计为包含第二转基因的基因组的rAAV,该第二转基因将诱导肌肉生长或将细胞分化或转化为肌肉。例如,rAAV具有:包含GNE cDNA或GALGT2 cDNA序列的基因组、来自已知在骨骼肌中起作用的成纤维细胞生长因子1A基因的内部核糖体进入位点(IRES)、GNE cDNA或GALGT2 cDNA序列中的3',随后是编码已知可诱导肌肉生长的基因例如卵泡抑素(诸如卵泡抑素344(FS344))或IGF1的变体(诸如HB-IGF1)的核苷酸序列,然后是poly A序列或SMAD7。FGF IRES包含其片段的SEQ ID NO:30的核苷酸序列。FGF IRES的示例性片段包含SEQ ID NO:8的核苷酸序列,其在本文中也称为“迷你IRES”。
本公开内容涉及基因治疗载体,例如AAV,用于将野生型人GNE基因表达到骨骼肌,以减少或替代有缺陷的GNE基因。本发明的基因治疗载体也可以是在单个rAAV基因组中表达野生型人GNE基因和诱导肌肉生长的基因如卵泡抑素、IGF1或SMAD7的AAV。
本公开提供了包含a)一个或多个启动子元件例如组成型或肌肉特异性启动子和b)GNE cDNA序列的多核苷酸。本公开提供的多核苷酸包含:a)多个启动子元件,例如组成型肌肉特异性启动子;b)GNE cDNA序列或GALGT2 cDNA序列;c)内部核糖体进入位点(IRES);以及d)编码肌肉生长因子或肌肉转分化因子的核苷酸序列。GNE cDNA是编码UDP-GlcNAc-差向异构酶/ManNAc-6的核酸序列。在示例性实施方案中,GNE cDNA是编码UDP-GlcNAc-差向异构酶/ManNAc-6激酶的野生型变体2GNE cDNA。变体2野生型GNE cDNA序列示为SEQ IDNO:1的核酸序列。本公开还提供了包含在外显子1和2之间发现的GNE启动子元件以驱动同一变体2(722个氨基酸)GNE cDNA表达的多核苷酸。GNE启动子序列如SEQ ID NO:6所示。GALGT2 cDNA是编码GalNAc转移酶的核酸序列。GALGT2 cDNA序列如SEQ ID NO:36的核酸序列所示。GalNAc转移酶氨基酸序列如SEQ ID NO:37所示。
在一些方面,本公开提供了一种多核苷酸,其包含GNE cDNA序列或GALGT2 cDNA序列和编码诱导肌肉生长的蛋白质例如卵泡抑素、胰岛素样生长因子1(IGF1)变体或SMAD7的核苷酸序列。例如,卵泡抑素是由SEQ ID NO:9的核苷酸序列编码的卵泡抑素344。另一种示例性的卵泡抑素是由SEQ ID NO:28的核苷酸序列编码的卵泡抑素317。此外,IGF1变体是由SEQ ID NO:11的核苷酸序列编码的HB-IGF。SMAD7由SEQ ID NO:39的核苷酸序列编码。
在一些方面,本公开提供了一种多核苷酸,其包含GNE cDNA序列或GALGT2 cDNA序列和编码诱导细胞分化为肌肉的蛋白质(转分化因子),例如myoD(SEQ ID NO:31)的序列。
在一些方面,多核苷酸包含内部核糖体进入位点(IRES),例如来自成纤维细胞生长因子1A基因的IRES(FGF IRES)。FGF IRES核苷酸序列如SEQ ID NO:30或其片段所示。FGFIRES能够实现小型化,例如如SEQ ID NO:8所示的迷你FGR IRES。
本公开的另一方面提供了组合物,其包含:包含SEQ ID NO:12-26和36中任一项的核苷酸序列内的基因组的核酸分子;具有SEQ ID NO:12-26和36的核酸序列内的基因组的rAAV;或包含SEQ ID NO:12-26和36中任一项的核酸序列内的基因组的rAAV颗粒。本文公开的任何方法都可以通过这些组合物执行。
所公开的AAV包含:包含CMV启动子和变体2野生型人GNE cDNA的基因组,例如图1A中提供的基因组或SEQ ID NO:12中列出的基因组。
所公开的AAV包含:包含MCK启动子和变体2野生型人GNE cDNA的基因组,例如图1B中提供的基因组或SEQ ID NO:13中列出的基因组。
所公开的AAV包含:包含MHCK启动子和变体2野生型人GNE cDNA的基因组,例如图1C中提供的基因组或SEQ ID NO:14中列出的基因组。
所公开的AAV包含:包含GNE启动子和变体2野生型人GNE cDNA的基因组,例如图1D中提供的基因组或SEQ ID NO:15中列出的基因组。
所公开的AAV包含:包含MHCK7启动子、变体2野生型GNE cDNA、编码迷你FGF1IRES的核酸序列和编码卵泡抑素344的核酸序列的基因组,例如图1E中提供的基因组或SEQ IDNO:16中列出的基因组。
所公开的AAV包含:包含MHCK7启动子、变体2野生型GNE cDNA、编码迷你FGF1IRES的核酸序列和编码HB-IGF1的核酸序列的基因组,例如图1F中提供的基因组或SEQ ID NO:17中列出的基因组。
所公开的AAV包含:包含CMV启动子、变体2野生型GNE cDNA、编码FGF1 IRES的核酸序列和编码卵泡抑素344的核酸序列的基因组,例如图1G中提供的基因组或SEQ ID NO:18中列出的基因组。
所公开的AAV包含:包含CMV启动子、变体2野生型GNE cDNA、编码迷你FGF1 IRES的核酸序列和编码HB-IGF1的核酸序列的基因组,例如图1H中提供的基因组或SEQ ID NO:19中列出的基因组。
所公开的AAV包含:包含MCK启动子、变体2野生型GNE cDNA、编码迷你FGF1 IRES的核酸序列和编码卵泡抑素344的核酸序列的基因组,例如图1I中提供的基因组或SEQ IDNO:20中列出的基因组。
所公开的AAV包含:包含MCK启动子、变体2野生型GNE cDNA、编码迷你FGF1 IRES的核酸序列和编码HB-IGF1的核酸序列的基因组,例如图1J中提供的基因组或SEQ ID NO:21中列出的基因组。
所公开的AAV包含:包含GNE启动子、变体2野生型GNE cDNA、编码迷你FGF1 IRES的核酸序列和编码卵泡抑素344的核酸序列的基因组,例如图1K中提供的基因组或SEQ IDNO:22中列出的基因组。
所公开的AAV包含:包含GNE启动子、变体2野生型GNE cDNA、编码迷你FGF1 IRES的核酸序列和编码HB-IGF1的核酸序列的基因组,例如图1L中提供的基因组或SEQ ID NO:23中列出的基因组。
所公开的AAV包含:包含迷你CMV启动子和变体2野生型GNE cDNA的基因组,例如图1M中提供的基因组或SEQ ID NO:24中列出的基因组。
所公开的AAV包含:包含迷你CMV启动子、变体2野生型GNE cDNA、编码FGF1 IRES的核酸序列和编码卵泡抑素344的核酸序列的基因组,例如图1N中提供的基因组或SEQ IDNO:25中列出的基因组。
所公开的AAV包含:包含迷你CMV启动子、变体2野生型GNE cDNA、编码FGF1 IRES的核酸序列和编码HB-IGF1的核酸序列的基因组,例如图1O中提供的基因组或SEQ ID NO:26中列出的基因组。
所公开的AAV包含:包含MHCK7启动子、变体2野生型GNE cDNA、编码FGF1 IRES的核酸序列和编码SMAD7的核酸序列的基因组,例如图1P中提供的基因组。
所公开的AAV包含:包含MHCK7启动子、变体2野生型GNE cDNA、编码迷你FGF1IRES的核酸序列和编码SMAD7的核酸序列的基因组,例如图1Q中提供的基因组。
所公开的AAV包含:包含CMV启动子、变体2野生型GNE cDNA、编码FGF1 IRES的核酸序列和编码SMAD7的核酸序列的基因组,例如图1R中提供的基因组。
所公开的AAV包含:包含CMV启动子、变体2野生型GNE cDNA、编码迷你FGF1 IRES的核酸序列和编码SMAD7的核酸序列的基因组,例如图1S中提供的基因组。
所公开的AAV包含:包含MCK启动子、变体2野生型GNE cDNA、编码FGF1 IRES的核酸序列和编码SMAD7的核酸序列的基因组,例如图1T中提供的基因组。
所公开的AAV包含:包含MCK启动子、变体2野生型GNE cDNA、编码迷你FGF1 IRES的核酸序列和编码SMAD7的核酸序列的基因组,例如图1U中提供的基因组。
所公开的AAV包含:包含GNE启动子、变体2野生型GNE cDNA、编码FGF1 IRES的核酸序列和编码SMAD7的核酸序列的基因组,例如图1V中提供的基因组。
所公开的AAV包含:包含GNE启动子、变体2野生型GNE cDNA、编码迷你FGF1 IRES的核酸序列和编码SMAD7的核酸序列的基因组,例如图1W中提供的基因组。
所公开的AAV包含:包含迷你CMV启动子、变体2野生型GNE cDNA、编码FGF1 IRES的核酸序列和编码SMAD7的核酸序列的基因组,例如图1X中提供的基因组。
所公开的AAV包含:包含迷你CMV启动子、变体2野生型GNE cDNA、编码迷你FGF1IRES的核酸序列和编码SMAD7的核酸序列的基因组,例如图1Y中提供的基因组。
所公开的AAV包含:包含MCK启动子、GALGT2 cDNA、编码FGF1 IRES的核酸序列和编码卵泡抑素344的核酸序列的基因组,例如图1Z中提供的基因组或SEQ ID NO:38中列出的基因组。
所公开的AAV包含:包含MCK启动子、GALGT2 cDNA、编码FGF1 IRES的核酸序列和编码HB-IGF1的核酸序列的基因组,例如图1AA中提供的基因组。
所公开的AAV包含:包含MCK启动子、GALGT2 cDNA、编码FGF1 IRES的核酸序列和编码SMAD7的核酸序列的基因组,例如图1BB中提供的基因组。
本公开提供了在有需要的人类受试者中治疗GNE肌病的方法,其包含施用本文公开的重组腺病毒相关(rAAV)或AAV的步骤。治疗GNE肌病的方法包含:减少、抑制或减缓GNE的肌肉无力症状、肌肉萎缩的进展的方法和/或增加有需要的受试者的肌肉力量的方法。有需要的受试者可能会减缓GNE肌病的肌肉无力症状。有需要的受试者可能在GNE基因中有突变。
本公开提供了在有需要的人类受试者中治疗肌营养不良症,包括杜氏肌营养不良症(Duchene muscular dystrophy)、LGMD2A和MDC1A的方法,该方法包含施用本文公开的重组腺病毒相关(rAAV)或AAV的步骤。治疗肌营养不良症的方法包括:减少、抑制或减缓肌肉无力症状、肌肉萎缩的进展的方法和/或增加有需要的受试者的肌肉力量的方法。有需要的受试者可能会减缓GNE肌病的肌肉无力症状。有需要的受试者可能在GNE基因中有突变。
在本公开的任何方法中,rAAV的剂量可以通过肌肉内、腹膜内、静脉内、动脉内、口服、口腔、鼻、肺、颅内、骨内、眼内、直肠或阴道给药途径给药。例如,给药途径是全身性的,例如通过注射、输注或植入。例如,rAAV的剂量通过输注在大约一小时内给药。此外,rAAV的剂量是通过四肢外周静脉,例如臂外周静脉或腿部外周静脉的静脉内途径给药。或者,可以在大约30分钟、或大约1.5小时、或大约2小时、或大约2.5小时或大约3小时内给予注射。
在本公开的任何方法中,给药的rAAV是血清型AAVrh7.4。本公开的rAAV载体可以是任何AAV血清型,例如血清型AAVrh.74、Anc80、AAV1、AAV2、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAVrh10、AAV11、AAV12、AAV13、AAVTT、AAV7m8和它们的衍生物。
在一个方面,本公开提供了一种rAAV,其包含肌肉特异性控制元件核苷酸序列和编码UDP-N-乙酰氨基葡糖2-差向异构酶/N-乙酰甘露糖胺激酶的核苷酸序列。例如,核苷酸序列编码功能性UDP-N-乙酰氨基葡糖2-差向异构酶/N-乙酰甘露糖胺激酶,其中该核苷酸与SEQ ID NO:1具有例如至少65%、至少70%、至少75%、至少80%、81%、82%、83%、84%、85%、86%、87%、88%或89%,更通常至少90%、91%、92%、93%或94%,甚至更通常至少95%、96%、97%、98%、99%或100%的序列同一性,其中所编码的蛋白质保留激酶活性。另外,核苷酸序列编码包含氨基酸序列的功能性蛋白质,其中该氨基酸序列与SEQ ID NO:2具有例如至少65%、至少70%、至少75%、至少80%、81%、82%、83%、84%、85%、86%、87%、88%或89%,更通常至少90%、91%、92%、93%或94%,甚至更通常至少95%、96%、97%、98%、99%或100%的序列同一性,并且保留激酶活性。
在另一方面,本公开提供了一种rAAV,其包含肌肉特异性控制元件核苷酸序列和编码GalNAc转移酶的核苷酸序列。例如,核苷酸序列编码功能性GalNAc转移酶,其中该核苷酸与SEQ ID NO:36具有例如至少65%、至少70%、至少75%、至少80%、81%、82%、83%、84%、85%、86%、87%、88%或89%,更通常至少90%、91%、92%、93%或94%,甚至更通常至少95%、96%、97%、98%、99%或100%的序列同一性,其中所编码的蛋白质保留转移酶活性。另外,核苷酸序列编码包含氨基酸序列的功能性蛋白质,其中该氨基酸序列与SEQ IDNO:37具有例如至少65%、至少70%、至少75%、至少80%、81%、82%、83%、84%、85%、86%、87%、88%或89%,更通常至少90%、91%、92%、93%或94%,甚至更通常至少95%、96%、97%、98%、99%或100%的序列同一性,并且保留转移酶活性。
在另一方面,本公开提供了一种rAAV,其包含肌肉特异性控制元件核苷酸序列和编码卵泡抑素例如卵泡抑素344或卵泡抑素317的核苷酸序列。例如,核苷酸序列编码功能性卵泡抑素,其中该核苷酸与SEQ ID NO:9或28具有例如至少65%、至少70%、至少75%、至少80%、81%、82%、83%、84%、85%、86%、87%、88%或89%,更通常至少90%、91%、92%、93%或94%,甚至更通常至少95%、96%、97%、98%、99%或100%的序列同一性,其中所编码的蛋白质保留卵泡抑素活性。另外,核苷酸序列编码包含氨基酸序列的功能性蛋白质,其中该氨基酸序列与SEQ ID NO:10或29具有例如至少65%、至少70%、至少75%、至少80%、81%、82%、83%、84%、85%、86%、87%、88%或89%,更通常至少90%、91%、92%、93%或94%,甚至更通常至少95%、96%、97%、98%、99%或100%的序列同一性,并且保留卵泡抑素活性,卵泡抑素活性是指卵泡抑素与激活素结合,从而拮抗激活素活性。卵泡抑素通过竞争性抑制和Smad2/3信号传导压制利用肌肉生长抑制素来抑制压制性生长信号传导而发挥作用。
在一个实施例中,本公开提供了一种rAAV,其包含肌肉特异性启动子元件核苷酸序列和编码IGF变体例如HB-IGF的核苷酸序列。例如,核苷酸序列编码IGF变体,其中该核苷酸与SEQ ID NO:11具有例如至少65%、至少70%、至少75%、至少80%、81%、82%、83%、84%、85%、86%、87%、88%或89%,更通常至少90%、91%、92%、93%或94%,甚至更通常至少95%、96%、97%、98%、99%或100%的序列同一性,其中所编码的蛋白质保留IGF活性。另外,核苷酸序列编码包含氨基酸序列的功能性蛋白质,其中该氨基酸序列与SEQ IDNO:27具有例如至少65%、至少70%、至少75%、至少80%、81%、82%、83%、84%、85%、86%、87%、88%或89%,更通常至少90%、91%、92%、93%或94%,甚至更通常至少95%、96%、97%、98%、99%或100%的序列同一性,并且保留IGF-1活性。IGF-1活性是指IGF-1通过激活肌肉IGFR和Akt/mTOR信号传导来结合并激活IGF受体(IGFR)和/或胰岛素受体IGF-1。IGF-1活性包含刺激细胞生长和增殖(例如肌肉细胞生长)和抑制程序性细胞死亡。本公开还提供了一种rAAV,其中核苷酸序列包含在严格条件下与SEQ ID NO:11的核酸序列或其互补序列杂交并编码功能性IGF变体的核苷酸序列。
本公开还提供了一种rAAV,其中核苷酸序列包含在严格条件下与SEQ ID NO:9或28的核酸序列或其互补序列杂交并编码功能性卵泡抑素的核苷酸序列。
本公开还提供了一种rAAV,其中核苷酸序列包含在严格条件下与SEQ ID NO:11的核酸序列或其互补序列杂交并编码功能性IGF的核苷酸序列。
术语“严格”用于指本领域通常理解为严格的条件。杂交的严格性主要由温度、离子强度、以及如甲酰胺等变性剂的浓度决定。用于杂交和洗涤的严格条件的实例是0.015M氯化钠、65℃到68℃下的0.0015M柠檬酸钠,0.015M氯化钠、0.0015M柠檬酸钠和42℃下的50%甲酰胺。参见Sambrook等人《分子克隆:实验室手册(Molecular Cloning:ALaboratory Manual)》,第2版,冷泉港实验室,(纽约冷泉港,1989)。还可以使用更严格的条件(例如更高的温度、更低的离子强度、更高的甲酰胺或其他变性剂),然而,杂交速率将受到影响。在涉及脱氧寡核苷酸杂交的情况下,另外的示例性严格杂交条件包括在37℃(对于14碱基寡聚物)、48℃(对于17碱基寡聚物)、55℃(对于20碱基寡聚物)和60℃(对于23碱基寡聚物)下在6×SSC 0.05%焦磷酸钠中洗涤。
为了减少非特异性和/或背景杂交,可以在杂交和洗涤缓冲液中包含其他试剂。例子是0.1%牛血清白蛋白、0.1%聚乙烯吡咯烷酮、0.1%焦磷酸钠、0.1%十二烷基硫酸钠、NaDodSO4、(SDS)、ficoll、Denhardt溶液、超声处理鲑鱼精子DNA(或其他非互补DNA)和葡聚糖硫酸盐,尽管也可以使用其他合适的试剂。可以改变这些添加剂的浓度和类型,而基本上不影响杂交条件的严格性。杂交实验通常在pH 6.8-7.4下进行,然而,在典型的离子强度条件下,杂交速率几乎与pH无关。参见Anderson等人,《核酸杂交:一种实用的方法(NucleicAcid Hybridisation:A Practical Approach)》,第四章,IRL出版社(英国牛津)。本领域技术人员可以调节杂交条件以适应这些变量并允许不同序列相关性的DNA形成杂交体。
术语“肌肉特异性启动子元件”是指调节对肌肉组织中表达特异的编码序列的表达的核苷酸序列。这些控制元素包含增强子和启动子。本公开提供了具有包含一种或多种肌肉特异性控制元件MCKH7启动子、MCK启动子或MCK增强子的基因组的多核苷酸或AAV。GNE启动子可以是人野生型GNE基因的启动子。其他启动子元件,例如CMV、迷你CMV和GNE启动子,允许在几乎所有组织中表达,并将被称为“组成型启动子”。
术语“组成型启动子元件”是指允许其相关基因连续转录的不受调控的启动子。组成型启动子元件的示例包含hACTB、hEF-1α、CAG、CMV、单纯疱疹病毒胸苷激酶(HSV-TK)、SP1、C-FOS或C-MYC启动子。
术语“可操作地连接”是指调节元件核苷酸序列(例如启动子核苷酸序列)的定位,以通过所述调节元件赋予所述核苷酸序列的表达。
例如,肌肉特异性启动子元件是SEQ ID NO:5所示的MHCK7启动子核苷酸序列,或肌肉特异性启动子元件是SEQ ID NO:3所示的CMV启动子核酸序列,或肌肉特异性启动子元件是SEQ ID NO:4所示的MCK核苷酸序列,或肌肉特异性启动子元件是SEQ ID NO:6所示的GNE启动子核苷酸序列,或肌肉特异性启动子元件是SEQ ID NO:7所示的迷你CMV核苷酸序列。此外,在本公开的任何rAAV载体中,肌肉特异性启动子元件核苷酸序列可操作地连接到GNE cDNA序列。(SEQ ID NO:1)。
在另一方面,本公开提供了包含在质粒中的rAAV构建体,其包含SEQ ID NO:12-26和38中任一个的核苷酸序列或与SEQ ID NO:12-26中任一个的核苷酸序列具有至少80%、85%、90%、95%、96%、97%、98%或99%的同一性的核苷酸序列。。
本公开还提供了包含任何本发明的rAAV载体的药物组合物(或有时在本文中简称为“组合物”)。
在另一个实施方案中,本公开提供了产生rAAV颗粒的方法,其包含培养已用本发明的任何rAAV载体转染的细胞,并从转染细胞的上清液中回收rAAV颗粒。本公开还提供了包含任何公开的重组AAV载体的病毒颗粒。
在任何治疗GNE肌病的方法中,受试者细胞中GNE基因表达水平在给药rAAV后增加。细胞中GNE基因的表达是通过在给药rAAV之前和之后通过蛋白质印迹、免疫组织化学或酶在各种组织(例如肌肉、心脏、肝脏、肾脏、大脑、结肠试验)中测量UDP-N-乙酰氨基葡萄糖2-差向异构酶/N-乙酰甘露糖胺激酶水平来检测的。
附图说明
图1A-1BB提供了本文提供的AAV基因组的示意图。
图2提供了包含图1A所示的rAAVrh74.CMV.GNE(变体2)(SEQ ID NO:12)基因组的质粒序列。
图3提供了包含图1B所示的rAAVrh74.MCK.GNE(变体2)(SEQ ID NO:13)基因组的质粒序列。
图4提供了包含图1C所示的rAAVrh74.MHCK7.GNE(变体2)(SEQ ID NO:14)基因组的质粒序列。
图5提供了包含图1D所示的rAAVrh74.GNE启动子.GNE(变体2)(SEQ ID NO:15)基因组的质粒序列。
图6提供了包含图1E所示的rAAVrh74.MHCK7.GNE(变体2).FGF1IRES.FS344(SEQID NO:16)基因组的质粒序列。
图7提供了包含图1F所示的rAAVrh74.MHCK7.GNE(变体2).FGF1IRES.HB-IGF1(SEQID NO:17)基因组的质粒序列。
图8提供了包含图1G所示的rAAVrh74.CVM.GNE(变体2).FGF1IRES.FS344(SEQ IDNO:18)基因组的质粒序列。
图9提供了包含图1H所示的rAAVrh74.CMV.GNE(变体2).FGF1IRES.HB-IGF1(SEQID NO:19)基因组的质粒序列。
图10提供了包含图1I所示的rAAVrh74.MCK.GNE(变体2).FGF1IRES.FS344(SEQ IDNO:20)的基因组的质粒序列。
图11提供了包含图1J所示的rAAVrh74.MCK.GNE(变体2).FGF1IRES.HB-IGF1(SEQID NO:21)基因组的质粒序列。
图12提供了包含图1K所示的rAAVrh74.GNE启动子.GNE(变体2).FGF1IRES.FS344(SEQ ID NO:22)基因组的质粒序列。
图13提供了包含图1L所示的rAAVrh74.GNE启动子.GNE(变体2).FGF1IRES.HB-IGFI(SEQ ID NO:23)基因组的质粒序列。
图14提供了包含图1M所示的rAAVrh74.迷你CMV.GNE(SEQ ID NO:24)的基因组的质粒序列。
图15提供了包含图1N所示的rAAVrh74.迷你CMV.GNE(变体2).FGF1IRES.FS344(SEQ ID NO:25)基因组的质粒序列。
图16提供了包含图1O所示的rAAVrh74.迷你CMV.GNE(变体2).FGF1IRES.HB-IGF1(SEQ ID NO:26)基因组的质粒序列。
图17提供了包含图1Z所示的rAAVrh74.MCK.GALGT2.FGF1IRES.FS344基因组的质粒序列(SEQ ID NO:38)。
图18示出了GNED176V TgGne-/-小鼠中肌肉内注射rAAVrh74.MCK.GNE或IP注射rAAVrh74.LSP.GNE后肝脏和肌肉的唾液酸染色。条形为100μm。
图19提供了来自具有Cas9-CRISPR Gne外显子3缺失/loxP重组实验的创始小鼠的基因分型数据。创始CR10646-8和-9在GNE外显子3中包含基因组缺失。
图20提供了用rAAV.CMV.GNE.迷你IRES.GFP对Gne缺陷型Lec3 CHO细胞的染色,以显示使用迷你IRES序列的第二种蛋白质的表达。GFP显示内源性荧光,而Gne显示免疫染色,DAPI在三重曝光中作为细胞核的染色剂。
图21提供了用rAAV.miniCMV.GNE转染后Gne缺陷型Lec3 CHO细胞的染色。全长(FL)IRES.GFP使用全长IRES序列显示第二种蛋白质的表达。GFP显示内源性荧光,而Gne显示免疫染色,DAPI在三重曝光中作为细胞核的染色剂。
图22演示了使用rAAVrh74肌肉内注射IGF1、HB-IGF1或FST344后的肌肉生长。胫骨前肌(TA,左)注射了1x10 11vg(载体基因组),腓肠肌(Gastroc,右)注射了5x10 11vg表达胰岛素样生长因子1(IGF1,肌肉形式Ea)的AAV、HB-IGF1或卵泡抑素(FST)形式344。在注射后2个月解剖肌肉并称重,与单独注射缓冲液相比,TA中的HB-IGF1和FST344以及Gastroc中的FST344显著增加。误差是每组n=12块肌肉的SEM。*p<0.05,***p<0.001。
图23表明CMV.GNE.IRES.GFP允许在Lec3 Gne缺陷型CHO细胞的膜上诱导唾液酸表达,而IRES允许表达第二种蛋白质,在这种情况下是GFP。内源性GFP表达显示在绿色通道中,而唾液酸的MAA染色显示为红色。正常CHO细胞具有MAA染色,因为它们具有正常的Gne功能,而Lec3细胞通常不表达MAA,因为它们没有功能性Gne。由于IRES的存在,CMV.GNE.IRES.GFP的引入允许Lec3细胞中的功能性GNE表达以及第二种蛋白质GFP的表达。三重曝光中显示的DAPI显示染成蓝色的细胞核。
图24表明,因为IRES序列的存在双顺反子向量,所以转染MCK.GALGT2.IRES.FS344(或FST)的肌肉细胞(C2C12细胞)可以在相同的细胞中表达GALGT2(染绿)和FST(染红)。通过使用时间匹配的图像,在没有双顺反子DNA的情况下模拟物转染的C2细胞显示出任何一种蛋白质的低表达或无表达。
图25证明了用rAAVrh74.CMV.GNE感染后Lec3细胞中MAA信号的变化。与辣根过氧化物酶(HRP)偶联的怀槐凝集素(Maackia amurensis agglutinin,MAA)用于在96孔ELISA板测定中测定CHO或Lec3细胞中的唾液酸表达,使用HRP活性的比色测定作为输出。相对于CHO细胞,在Opti-MEM中生长3天的Lec3细胞显示出MAA结合减少,并且这种结合可能是通过添加rAAVrh74.CMV.GNE两天来部分挽救。对于每组n=2,误差是SD。MOI,感染复数,OD,光密度,**p<0.01。
图26展示了在用pAAV.CMV.GNE转染CHO细胞、Lec3细胞和Lec3细胞中的GNE酶活性。裂解细胞,每个样品使用0.3mg总蛋白来测量UDP-GlcNAc差向异构酶活性。使用比色测定法测量ManNAc,并将样品与ManNAc标准曲线进行比较。与缺乏功能性Gne酶的Lec3细胞相比,CHO细胞显示出显著更高的UDP-GlcNAc差向异构酶活性。用pAAV.CMV.GNE转染的Lec3细胞显示出超过CHO细胞水平的GNE酶活性。对于每组n=2,误差是SD。**p<0.01,***p<0.001。
图27展示了bistronic GALGT2和卵泡抑素344(FST)基因治疗在mdx小鼠中的功效。图27A展示了用1x10 11vg rAAVrh74.MCK.GALGT2.IRES.FST或单基因载体rAAVrh74.MCK.FST TA以相同剂量进行TA肌肉注射导致肌肉大小增加,测量为相对于总体量的肌肉重量(毫克/克)。对于每组n=4,误差是SD。*p<0.05,**p<0.01。图27B提供了在注射后用针对FST和WFA的抗体(以识别由GALGT2制造的GalNAc)染色的TA肌肉的图像。
具体实施方式
本公开提供了基因治疗载体,诸如腺相关病毒(AAV),其经过优化以用于将转基因递送至肌肉。优化的载体包含:组成型或肌肉特异性启动子,分别用于递送全身或骨骼肌/心肌肉特异性转基因表达,并与转基因cDNA结合,用正常基因拷贝替换肌肉疾病中发现的基因突变;内部核糖体进入位点(IRES),以允许从同一转录物中产生第二种蛋白质;以及肌肉生长因子,用于建立新的肌肉生长和力量。转基因和肌肉生长因子基因由同一mRNA表达,由于成纤维细胞生长因子1A基因序列中内部核糖体进入位点(或IRES)的存在,该mRNA表达两种蛋白质,这允许第二种蛋白质由单个mRNA制成。
本公开提供了基因治疗载体,诸如腺相关病毒(AAV),其被设计成用于治疗GNE肌病。AAV单独或与卵泡抑素或IGF1联合表达UDP-GlcNAc-差向异构酶/ManNAc-6。所提供的AAV取代了突变的GNE基因表达,同时表达了刺激肌肉生长的蛋白质。将防止产生另外疾病的基因置换功能(直接基因置换或用替代基因功能置换)与建立新的肌肉质量和力量的肌肉生长或肌肉转分化疗法(将建立新的肌肉质量和力量)相结合的策略,不仅有可能阻止疾病进程,而且还可以通过在阻止疾病发病机制的同时刺激新的肌肉生长和力量来逆转该疾病进程。
本文提供的基因治疗载体在于:1)提供用于基因置换或作为替代基因治疗的转基因;以及2)提供编码诱导肌肉生长或增加肌肉力量的生长因子的基因。这种基因疗法由单个基因疗法基因组编码,例如单个AAV基因组。这种联合疗法不仅有可能阻止疾病进程,而且可以通过在阻止疾病发病机制的同时刺激新的肌肉生长和力量来逆转该疾病进程。
所提供的基因疗法可用于治疗GNE肌病、杜氏(Duchenne muscular dystrophies,DMD)肌营养不良症和贝克肌营养不良症(Becker muscular dystrophies,BMD)和肢带肌营养不良症(limb girdle muscular dystrophies,LGMD),例如LGMD2A(CAPN3、LGMD2C(SGCG)、LGMD2D(SGCA)、LGMD2E(SGCB)、LGMD2F(SGCD)、LGMD2G(TCAP)、LGMD2H(TRIM32)、LGMD2I(FKRP)、LGMD2K(POMT1)、LGMD2L(ANO5)、LGMD2M(FKTN)、LGMD2O(POMT2)、LGMD2P(DAG1)、LGMD2R(DES)、LGMD2T(GMPPB)、LGMD2U(ISPD)、LGMD2X(BVES)、LGMD2Y(TOR1AIP1)、LGMD2Z(POGLUT1)、LGMD1A(TTID、MYOT)、LGMD1B(LMNA)、LGMD1C(Cav3)、LGMD1D(DES)、LGMD1F(TNPO3)、LGMD1G(HNRPDL)和MDC1A。在不同情况下,第一转基因(例如GALGT2或B4GALNT2)可用于疾病中缺失基因的基因置换或替代的基因置换,而第二转基因则是肌肉生长因子(例如FS344、HB-IGF1、IGF1或SMAD7),用于通过建立新的肌肉生长和力量来逆转疾病症状。本公开的基因疗法也可用于以使用替代基因代替基因置换作为第一转基因来预防疾病的方式来治疗疾病,并且适用于来自第二转基因放置的肌肉生长不是来自肌肉生长因子而是来自肌肉转分化因子(例如,MyoD)的疗法,其中肌肉是通过脂肪或成纤维细胞转化为肌肉而不是通过肌肉生长因子载体来构建的。
在一些实施方案中,提供了具有可用空间的构建体,AAV基因组包含第二IRES和第三转基因以同时提供三种基因疗法。
AAV具有包含肌肉特异性启动子的基因组,该启动子驱动编码目的转基因的核苷酸序列与编码肌肉生长因子的核苷酸序列组合表达,所述肌肉生长因子例如为诱导肌肉生长和肌肉特异性IRES(例如FGF IRES)的蛋白质。该基因治疗方法可用于治疗任何需要基因置换并需要增加肌肉生长或肌肉力量的疾病,例如GNE肌病、肢带肌营养不良症和杜氏肌营养不良症。
生长因子和转分化因子
诱导肌肉生长或增加肌肉力量的生长因子包含:IGF、HB-IGF、Pax7、HGF(肝细胞生长因子)、HGH(人类生长激素)、FGF19(成纤维细胞生长因子19)、FGF21(成纤维细胞生长因子21)、VEGF(血管内皮生长因子)、IL6(白细胞介素6)、IL15(白细胞介素15)和SMAD7(母亲DPP同源物7(mothers against decapentaplegic homolog 7,MADH7))。
诱导肌肉生长或增加肌肉力量的生长因子还包含卵泡抑素。卵泡抑素是一种分泌蛋白,可抑制GDF-11/BMP-11等TGF-β家族成员的活性。卵泡抑素344是一种卵泡抑素前体,它经过肽裂解形成包含C末端酸性区域的循环卵泡抑素315同源异构体。它与肌肉生长抑制素前肽一起在一个复合物中循环,该复合物包含另外两种蛋白质,即卵泡抑素相关基因(FLRG)和GDF相关血清蛋白(GASP-1)。卵泡抑素317是另一种卵泡抑素前体,它经过肽裂解形成膜结合的卵泡抑素288同源异构体。
卵泡抑素344前体的DNA和氨基酸序列分别列于SEQ ID NO:9和10。卵泡抑素288同源异构体缺乏C末端酸性区域,对肝素-硫酸盐-蛋白多糖表现出很强的亲和力,是一种有效的垂体促卵泡激素抑制剂,存在于卵巢的卵泡液中,并且对卵巢的颗粒细胞具有很高的亲和力。睾丸也会产生卵泡抑素288。卵泡抑素317前体的DNA和氨基酸序列分别列于SEQ IDNO:28和29。缺乏卵泡抑素会导致出生时肌肉质量减少。
Shimasaki等人的美国专利号5,041,538中提供了卵泡抑素的实例;美国专利号5,942,420、6,410,232、6,537,966和6,953,662中提供了其他卵泡抑素样蛋白;FLRG(SEQ IDNO:33,对应的核苷酸序列是SEQ ID NO:32)由Hill等人提出,《生物化学杂志(J.Biol.Chem.)》,277(43):40735-40741(2002)];GASP-1(SEQ ID NO:35,相应的核苷酸序列是SEQ ID NO:34)由Hill等人提出,《分子内分泌学(Mol Endocrinol)》,17:1144-1154(2003)。
已知SMAD7通过与活性TGF-β复合物结合来抑制TGF-β激活的信号传导反应,从而导致TGF-β信号传导减少。肌肉生长抑制素和TGF-β信号传导诱导SMAD7表达,建立负反馈回路以抑制TGF-β信号传导。具体而言,已知SMAD7利用该负反馈回路调节肌细胞生成(Kollias等人,《分子细胞生物学(Mol.Cell Biol.)》,26(16):6248-6260,2006。编码SMAD7蛋白的核苷酸序列如SEQ ID NO:39(Genbank登录号NM_005904.4)所示,氨基酸序列如SEQID NO:40(Genbank登录号NP_005895)所示。
转分化因子是将非肌肉细胞转化或诱导分化为肌肉的试剂。例如,已知MyoD可将多种细胞类型转化为肌肉,包括真皮成纤维细胞、软骨细胞、平滑肌、视网膜色素上皮细胞、脂肪细胞,以及黑色素瘤、神经母细胞瘤、骨肉瘤和肝癌细胞(Abraham&Tapscott,《基因株进展(Curr.Opin.Genet.Dev.23(5):568-573(2013))。转分化因子的示例:Myocd(心肌素)、Mef2C(肌细胞增强因子2C)、Mef2B(肌细胞增强因子2B)、Mkl1(MKL[巨核细胞白血病]Myocd样1)、Gata4(GATA结合蛋白4)、Gata5(GATA结合蛋白5)、Gata6(GATA结合蛋白6)、Ets1(E26禽白血病癌基因1、5'结构域)。
GNE肌病
GNE肌病的特征在于进行性肌肉萎缩和无力。发病年龄通常在生命的第三个十年,从胫骨前肌(TA)和腘绳肌无力开始,到诊断后的第二个十年,患者常常需要坐轮椅。患者最终可能需要日常生活功能方面的帮助,例如进食。肌肉活检通常显示有镶边空泡和包涵体。GNE肌病是由GNE基因突变引起的,该基因编码双功能UDP-GlcNAc差向异构酶/ManNAc-6激酶。所有唾液酸(SA)的合成都需要GNE功能。SA生物合成途径最终产生CMP-SA,唾液酸转移酶利用CMP-SA将SA转移到所有哺乳动物细胞中的糖蛋白和糖脂上。
GNE肌病的发病率最近估计在百万分之1到6之间,这是一种罕见的疾病。然而,有一些奠基者效应突变导致GNE肌病在某些人群中发生率更高,例如日本血统患者(新命名法中的D176V、D207V)和中东血统患者(新命名法中的M712T、M743T)。在一项针对1000名伊朗犹太人的研究中,发现疾病突变携带者的频率为十一分之一。患者中GNE活性的部分降低导致SA表达减少但并非不存在。
IGF1R信号传导减弱已被证明是GNE肌病模型中肌肉干细胞死亡的基础,这使得IGF1成为基因治疗设计中可能的理想生长因子元件。预计这些串联基因载体不仅可以抑制疾病进展(GNE基因置换的功能),还可以诱导新的肌肉生长(从而增加肌肉力量)并可能防止干细胞死亡。这些载体是非常独特的,因为GNE肌病患者在几十年内会失去肌肉和力量,而所提供的AAV预计不仅会减缓这种进展,而且实际上会逆转它。所提供的双功能AAV将能够显示出临床疗效,因为这种疾病表现出很高的临床变异性(在患者疾病突变之间,甚至在具有同一疾病突变的患者之间)并且因为它正在缓慢进展(几十年来发生重大临床变化)。
GNE肌病突变
在任何提供的方法中,受试者患有GNE肌病。例如,受试者的GNE基因发生突变,导致UDP-N-乙酰氨基葡糖2-差向异构酶/N-乙酰甘露糖胺激酶的表达降低。通过判断GNE基因的两个等位基因中是否存在致病性(主要是错义)突变来确认受试者的GNE肌病诊断。表1提供了GNE基因中与GNE肌病相关的已知突变,如下所示。要求保护的方法的对象可以包含该表中列出的突变。
在表1中,粗体字表示cDNA或蛋白质截短变体。斜体印刷+深灰色突出显示“轻度”变体。问号(?)表示无法从参考文献中提取准确的术语。DNA编号系统基于cDNA序列。核苷酸编号使用+1作为参考序列中ATG翻译起始密码子的A,起始密码子为密码子1。
Figure BDA0003823927920000191
Figure BDA0003823927920000201
Figure BDA0003823927920000211
Figure BDA0003823927920000221
Figure BDA0003823927920000231
Figure BDA0003823927920000241
Figure BDA0003823927920000251
Figure BDA0003823927920000261
Figure BDA0003823927920000271
Figure BDA0003823927920000281
Figure BDA0003823927920000291
1先前使用的hGNE1(NP_005467.1)和优选的新hGNE2(NP_001121699.1)[Huizing等人,2014b]中提供了氨基酸取代。对于某些变体,提供了从参考文献中提取的更新命名法。
2在mRNA变体1命名法中提供了核苷酸变体(NM_001128227.2;最长的mRNA剪接形式;编码hGNE2蛋白)。
3根据基因组序列的外显子编号(NC_000009.12)并如图1所示。in=内含子。
4有关GNE蛋白结构域的详细信息,请参阅文本;ep=UDP-GlcNAc 2-差向异构酶结构域;ep-NES=核输出信号;ep-AR:变构区;UF=未知功能;kin=ManNAc激酶结构域;UF差向异构酶。
5结合致病性评分,具有预测剪接效应的内含子变体被列为“剪接”,而没有预测剪接效应的内含子变体被列为“剪接?”。
6摘自文献参考。
GNE小鼠模型
Gne是小鼠的必需基因;删除会导致胚胎(E)在第8.5天和第9.5天之间的胚胎致死率。最著名的GNE肌病模型是由Malicdan等人制作的,《人类分子遗传学(Hum Mol Genet.)》16(22):2669-82,2007)。该模型在小鼠Gne-/-背景中组成性地表达了突变的人GNED207V转基因(Tg)。据报道,到30周时,GNED207V TgGne-/-小鼠的寿命显著缩短,攀爬杆和恒速跑步机行走的分数降低,血清CK活性和Aβ1-42肽的肌肉产生适度升高。到42周时,肌肉表现出带有嗜刚果红包涵体的镶边空泡,以及在人GNE肌病患者中未发现的呼吸和心肌病理。不幸的是,随着这些小鼠的繁殖,这些表型中的大多数已经从生产线中丢失,因此我们和其他人在第64周时无法找到肌肉病状或肌肉缺陷的证据。
第二个模型是M712T(现在称为M743T)伊朗奠基者GNE突变的敲入,显示出由于肾脏疾病导致的围产期致死率(通过P3),(Galeno等人,《临床检查杂志(Clin.Invest.)》117(6):1585-94,2007)。同样,其他人发现可以培育这种纯合敲入系以产生没有表型的动物亚群(Sela等人,《神经肌肉医学(Neuromuscular Med.)》15(1):180-91,2013)。因此,由于所用模型的高表型变异性,该疾病的所有临床前数据的稳健性都受到质疑。
由于所有当前的GNE肌病小鼠模型都显示出复杂且多变的表型,因此所有临床前数据都非常复杂。GNEM743T敲入模型显示出由于肾脏并发症导致的早期死亡,这可以被ManNAc抵消。相同敲入的其他菌株没有表现出表型。在早期研究中,GNED207V TgGne-/-小鼠模型在一岁时显示出明显的疾病表型,目前还活着的小鼠不能重复这些表型。由于Gne缺乏会导致小鼠在E8.5到E9.5的胚胎死亡,因此纯基因缺失小鼠没有用,尽管包括我们在内的多个小组正在制造更精确的基因缺失小鼠。
小鼠模型在本文实例3中描述。该小鼠模型是使用Cas9-CRISPR生成的,最终将允许生成的代液氧(floxed)等位基因进入小鼠Gne基因的外显子3,并且该等位基因的引入足以允许Cre介导的缺失,从而产生GNE肌病样表型。由于Gne在小鼠中是必不可少的,导致E8.5和E9之间的致死率,因此在成年小鼠中创建代液氧等位基因以删除该基因应该允许使用Cre介导的删除来创建强大的全身或肌肉特异性表型.反过来,这允许更多可重复的治疗效果证明。
肌营养不良症
肌营养不良症(MD)是一组遗传病。该组的特征在于控制运动的骨骼肌的进行性无力和退化。某些形式的MD在婴儿期或儿童期发展,而其它形式的MD直到中年或以后才可出现。病症在肌肉无力的分布和程度(某些形式的MD也影响心肌)、发病年龄、进展速度和遗传模式方面不同。
MD的一种形式是杜氏肌营养不良症(DMD)。它是肌营养不良症在儿童中最常见的严重形式,每5000名新生男性中就有1人患病。遗传特征遵循X连锁隐性模式。DMD是由DMD基因的突变导致在骨骼肌和心肌以及胃肠道和视网膜中不存在肌营养不良蛋白(427KDa)引起的。肌营养不良蛋白不仅保护肌膜免于离心收缩,而且还锚定靠近肌膜的许多信号传导蛋白。DMD的临床症状通常在3至5岁之间首次出现,步态改变和运动技能降低通常会决定诊断评估。DMD会无法抑制地恶化下去,到12岁时就失去了行走能力。从病史上看,患者在第二个十年后期死于呼吸系统并发症,但改进的支持性护理——特别是明智地使用夜间通气支持——已将预期寿命延长了近十年。寿命的延长的同时表现出心脏功能几乎普遍下降,伴随扩张型心肌病的并发症。这带来了进一步的临床挑战,并且需要以前不存在的鉴别和医疗干预。DMD中也可能存在非进行性认知功能障碍。尽管在DMD中进行了数百项临床试验,但皮质类固醇治疗仍然是唯一一直证明有效的治疗方法。目前对DMD的护理标准涉及使用泼尼松(prednisone)或地氟扎可(deflazacort),它们能够以显著副作用为代价将行走能力延长数年,并且对生存有任何影响的证据是有限的。
另一种类型的MD是先天性肌营养不良症1A(MCD1A)。MCD1A属于一组在出生或婴儿期发病的神经肌肉疾病,其特征是肌张力减退、肌肉无力和肌肉萎缩。MCD1A代表了30-40%的先天性肌营养不良症,具有一些区域差异。患病率估计为1/30,000。该疾病在出生时或生命的最初几个月出现四肢和躯干肌张力减退和肌肉无力。也可能发生呼吸和喂养障碍。运动发育延迟和受限(只有在帮助下才能坐着或站立)。婴儿早期表现为脊柱强直、脊柱侧弯和呼吸功能不全。典型的拉长的肌病面容会出现面部受累,并且可能会出现眼肌麻痹症。癫痫发作也是可能的,尽管它们发生在不到三分之一的受试者中。智力发育是正常的。MCD1A是由编码α-2层粘连蛋白链的LAMA2基因突变引起的。传播是常染色体隐性遗传。目前的治疗是对症的。它由多学科方法组成,包括物理治疗师、职业治疗师和语言治疗师,目标是优化每个受试者的能力。癫痫发作或其他神经系统并发症需要特殊治疗。MDC1A的预后非常严重,因为大部分受影响的儿童未达到青春期。目前,只能通过细心的多学科(尤其是骨科和呼吸科)管理来改善预后。
另一种类型的MD是肢带型肌营养不良症(LGMD)。LGMD是一种罕见的病症,并且不同的人在发病年龄、肌肉无力区域、心脏和呼吸系统受累、进展速度和严重程度方面表现不同。LGMD可能始于儿童期、青春期、青年期或甚至更晚。两性都受到同等的影响。LGMD导致肩部和骨盆带无力,大腿和手臂附近的肌肉有时也会随着时间的推移而感到无力。腿部无力通常先于手臂出现。面部肌肉通常不受影响。随着病症的进展,人们可能会出现行走问题,并且随着时间的推移可能需要使用轮椅。肩部和手臂肌肉的受累可能导致难以将手臂举过头顶和举起物体。在某些类型的LGMD中,心脏和呼吸肌可能受累。
至少有19种LGMD形式,这些形式根据其相关的遗传缺陷进行分类。
类型 遗传模式 基因或染色体
LGMD1A 常染色体显性遗传 肌收缩蛋白基因
LGMD1B 常染色体显性遗传 核纤层蛋白A/C基因
LGMD1C 常染色体显性遗传 小窝蛋白基因
LGMD1D 常染色体显性遗传 7号染色体
LGMD1E 常染色体显性遗传 结蛋白基因
LGMD1F 常染色体显性遗传 7号染色体
LGMD1G 常染色体显性遗传 4号染色体
LGMD1H 常染色体显性遗传 3号染色体
LGMD2A 常染色体隐性遗传 钙蛋白酶3基因
LGMD2B 常染色体隐性遗传 dysferlin基因
LGMD2C 常染色体隐性遗传 γ-肌聚糖
LGMD2D 常染色体隐性遗传 α-肌聚糖基因
LGMD2E 常染色体隐性遗传 β-肌聚糖基因
LGMD2F 常染色体隐性遗传 δ-肌聚糖基因
LGMD2G 常染色体隐性遗传 Telethonin基因
LGMD2H 常染色体隐性遗传 TRIM32
LGMD2I 常染色体隐性遗传 FKRP基因
LGMD2J 常染色体隐性遗传 肌巨蛋白基因
LGMD2K 常染色体隐性遗传 POMT1基因
LGMD2L 常染色体隐性遗传 Anoctamin 5基因
LGMD2M 常染色体隐性遗传 Fukutin基因
LGMD2N 常染色体隐性遗传 POMT2基因
LGMD2O 常染色体隐性遗传 POMGnT1基因
LGMD2Q 常染色体隐性遗传 凝集素基因
针对LGMD的专门测试现在可以通过由国家诊断计划国家委员会(NationalCommissioning Group;NCG)制定的国家诊断计划获得。
GALGT2基因(也称为B4GALNT2)编码β1-4-N-乙酰基-D-半乳糖胺(βGalNAc)糖基转移酶。已经在三种不同的肌营养不良模型中研究了GALGT2过表达:DMD、LGMD2D和MDC1A[Xu等人,《美国病理学杂志(Am.J.Pathol.)》,175:235-247(2009);Xu等人,美国病理学杂志(Am.J.Pathol.)》,171:181-199(2007);Xu等人,《神经肌肉障碍(Neuromuscul.Disord.)》,17:209-220(2007);Martin等人,《美国生理学杂志:细胞生理学(Am.J.Physiol.Cell.Physiol.)》,296:C476-488(2009);以及和Nguyen等人,《美国国家科学研究院院报(Proc.Natl.Acad.Sci.USA)》,99:5616-5621(2002)]。。据报道,骨骼肌中的GALGT2过表达可诱导α肌营养不良聚糖与β1-4-N-乙酰基-D-半乳糖胺(GalNAc)碳水化合物的糖基化,从而产生CT碳水化合物抗原(Neu5Ac/Gcα2-3[GalNAcβ1-4]Gal3Galβα1-4GlcNAcβ-)。GALGT2糖基转移酶及其产生的CT碳水化合物通常局限于成人、非人灵长类动物、啮齿动物和所有其他尚未研究的哺乳动物骨骼肌中的神经肌肉和肌腱接头[Martin等人,《神经细胞学杂志(J.Neurocytol.)》,32:915-929(2003)]。据报道,骨骼肌中GALGT2的过表达会刺激突触外膜的异位糖基化,从而刺激正常突触蛋白的支架的异位过表达,这些蛋白质是各种形式的肌营养不良症中缺失的蛋白质的直系同源物或同系物,包括肌营养不良蛋白替代物(例如,utrophin,Plectin1)和层粘连蛋白α2替代物(层粘连蛋白α5和集聚蛋白)[Xu等人,2009,同上;Xu等人,《病理学杂志(J.Path.)》,2007,同上;Xu等人,《神经肌肉障碍(Neuromuscul.Disord.)》,2007,同上;Nguyen等人,同上;Chicoine等人,《分子疗法(Mol.Ther)》22:713-724,(2014)。作为一个组,据报道GALGT2对此类替代物的诱导可增强肌纤维膜的完整性并防止抗肌萎缩蛋白缺陷肌肉和野生型肌肉中的肌肉损伤[Martin等人,同上]。据报道,骨骼肌中的GALGT2过表达可预防肌肉损伤和抑制肌肉疾病。这在用于DMD的mdx小鼠模型中是正确的[Xu等人,《神经肌肉障碍(Neuromuscul.Disord.)》,2007,同上;Martin等人(2009),同上;Nguyen等人,同上],其中注意到与微肌营养不良蛋白基因转移相当的改进,即使只有一半数量的纤维被转导[Martin等人(2009),同上]。。值得注意的是,据报道,GALGT2基因转移在先天性肌营养不良症1A的dyW模型[Xu等人,美国病理学杂志(Am.J.Path.)》,2007年,同上]和2D型肢带型肌营养不良症的Sgca-/-小鼠模型[Xu等人,2009,同上]中具有预防作用。
AAV基因治疗
本公开提供了表达GNE基因的基因治疗载体,例如rAAV载体,以及治疗GNE肌病的方法。
如本文所使用的,术语“AAV”是腺相关病毒(Adeno-associated virus)的标准缩写。腺相关病毒是一种仅在细胞中生成的单链DNA细小病毒,其中某些功能由共感染辅助病毒提供。目前已经表征了十三种AAV血清型。AAV的基本信息和综述可以在例如Carter,1989,《细小病毒手册(Handbook of Parvoviruses)》,第1卷,第169到228页和Berns,1990,《病毒学(Virology)》,第1743到1764页,Raven出版社,(纽约)中找到。然而,完全可以预期这些相同的原理将可应用于额外AAV血清型,这是由于众所周知的是,各种血清型在结构和功能上均紧密相关,甚至在基因水平下亦是如此。(参见例如,Blacklowe,1988,《细小病毒和人类疾病(Parvoviruses and Human Disease)》,第165至174页,J.R.Pattison编;以及Rose,《综合病毒学(Comprehensive Virology)》3:1-61(1974))。例如,所有AAV血清型均明显地展现出非常类似的由同源rep基因介导的复制特性;并且全部具有三种相关的衣壳蛋白,如在AAV2中表达的那些蛋白。相关性程度还进一步由异源双链体分析所表明,所述异源双链体分析显示血清型之间沿基因组长度具有广泛的交叉杂交;并且在末端处存在相似的自退火片段,所述自退火片段对应于“反向末端重复序列”(ITR)。类似的感染性模式还表明每种血清型的复制功能处于类似的调节控制下。
如本文所用的“AAV载体”是指包含一个或多个目的多核苷酸(或转基因)的载体,所述目的多核苷酸的侧翼是AAV末端重复序列(ITR)。当存在于已被对rep和cap基因产物进行编码和表达的载体转染的宿主细胞中时,这种AAV载体可以被复制并包装成传染性病毒颗粒。
“AAV病毒体”或“AAV病毒颗粒”或“AAV载体颗粒”是指由至少一种AAV衣壳蛋白和衣壳化的多核苷酸AAV载体构成的病毒颗粒。如果所述颗粒包含异源多核苷酸(即,除野生型AAV基因组以外的多核苷酸,如待递送给哺乳动物细胞的转基因),则其通常被称为“AAV载体颗粒”或简单地“AAV载体”。因此,AAV载体颗粒的产生必然包含产生AAV载体,如此AAV载体颗粒内含有载体。
AAV
腺相关病毒(AAV)是复制缺陷型细小病毒,其单链DNA基因组长约4.7kb,包括两个145个核苷酸的反向末端重复序列(ITR)。存在多种血清型AAV。AAV血清型的基因组的核苷酸序列是已知的。例如,AAV血清型2(AAV2)基因组的核苷酸序列在如由Ruffing等人《普通病毒学杂志(J Gen Virol)》75:3385-3392(1994)校正的Srivastava等人《病毒学杂志(JVirol)》45:555-564(1983)中提出。作为另一例子,AAV-1的完整基因组在GenBank登录号NC_002077中提供;AAV-3的完整基因组在GenBank登录号NC_1829中提供;AAV-4的完整基因组在GenBank登录号NC_001829中提供;AAV-5基因组在GenBank登录号AF085716中提供;AAV-6的完整基因组在GenBank登录号NC_00 1862中提供;至少部分AAV-7和AAV-8基因组分别在GenBank登录号AX753246和AX753249中提供(也参见涉及AAV-8的美国专利7,282,199和7,790,449);AAV-9基因组在Gao等人,《病毒学期刊》,78:6381-6388(2004)中提供;AAV-10基因组在《分子疗法(Mol.Ther.)》,13(1):67-76(2006)中提供;以及AAV-11基因组在《病毒学(Virology)》,330(2):375-383(2004)中提供。AAVrh.74血清型的克隆描述于Rodino-Klapac.等人,《转化医学阿志(Journal of translational medicine 5)》,45(2007)。指导病毒DNA复制(rep)、衣壳化/包装和宿主细胞染色体整合的顺式作用序列包含在ITR中。三个AAV启动子(其相对图谱位置命名为p5、p19和p40)驱动编码rep和cap基因的两个AAV内部开放阅读框的表达。两个rep启动子(p5和p19)与单个AAV内含子的差异剪接(例如在AAV2核苷酸2107和2227处)结合导致从rep基因产生四种rep蛋白(rep 78、rep 68、rep 52和rep40)。Rep蛋白具有多种酶特性,所述酶特性最终负责复制病毒基因组。cap基因由p40启动子表达,并且其编码三种衣壳蛋白VP1、VP2和VP3。替代性剪接及非共有翻译起始位点负责产生三种相关的衣壳蛋白。单一共有多腺苷酸化位点位于AAV基因组的图谱位置95处。AAV的生命周期和遗传学在Muzyczka,《当前微生物学和免疫学的话题(Current Topics inMicrobiology and Immunology)》,158:97-129(1992)中评论。
AAV具有独特的特征,这使其作为例如在基因治疗中将外源DNA递送到细胞的载体具有吸引力。培养中细胞的AAV感染是非细胞病变的,并且人和其它动物的自然感染是沉默的和无症状的。而且,AAV感染许多哺乳动物细胞,允许体内靶向许多不同组织的可能性。而且,AAV转导缓慢分裂和非分裂细胞,并且可以作为转录活性核附加体(染色体外元件)基本上持续这些细胞的寿命。AAV原病毒基因组作为质粒中的克隆DNA具有感染性,这使得重组基因组的构建成为可能。此外,由于指导AAV复制、基因组衣壳化和整合的信号包含在AAV基因组的ITR中,因此部分或全部内部约4.3kb的基因组(编码复制和结构衣壳蛋白,rep-cap)可以用如含有启动子、感兴趣的DNA和多腺苷酸化信号的基因盒等外源DNA替代。rep蛋白和cap蛋白可以以反式提供。AAV的另一个显著特征是其是极其稳定且强健的病毒。它易于承受用于灭活腺病毒的条件(56℃到65℃,持续数小时),使AAV的冷保存不太重要。甚至可以将AAV冻干。最后,AAV感染的细胞不耐受重复感染。
多项研究证明了肌肉中长期(>1.5年)重组AAV介导的蛋白质表达。参见Clark等人,《人类基因治疗(Hum Gene Ther)》,8:659-669(1997);Kessler等人,《美国国家科学研究院院报(Proc.Natl.Acad.Sci.USA)》,93:14082-14087(1996);以及Xiao等人,《病毒学杂志(J Virol)》,70:8098-8108(1996)。还参见Chao等人,《分子疗法(Mol Ther)》,2:619-623(2000)和Chao等人,《分子疗法(Mol Ther)》,4:217-222(2001)。此外,由于肌肉高度血管化,重组AAV转导导致肌肉注射后在体循环中出现转基因产物,如在Herzog等人,《美国国家科学研究院院报(Proc.Natl.Acad.Sci.USA)》,94:5804-5809(1997)和Murphy等人,《美国国家科学研究院院报(Proc.Natl.Acad.Sci.USA)》,94:13921-13926(1997)中所述。此外,Lewis等人,《病毒学杂志(J Virol)》,76:8769-8775(2002)证明骨骼肌纤维具有正确的抗体糖基化、折叠和分泌所必需的细胞因子,表明肌肉能够稳定表达分泌的蛋白质治疗剂。
本公开的重组AAV基因组包含本发明的核酸分子和侧接核酸分子的一个或多个AAV ITR。rAAV基因组中的AAV DNA可来自任何可衍生重组病毒的AAV血清型,包括但不限于AAV血清型AAVrh.74、AAVrh.10、AAV-1、AAV-2、AAV-3、AAV-4、AAV-5、AAV-6、AAV-7、AAV-8、AAV-9、AAV-10、AAV-11、AAV-12和AAV-13。在例如WO 01/83692中公开了假型rAAV的产生。还考虑了其它类型的rAAV变体,例如具有衣壳突变的rAAV。参见,例如,Marsic等人,《分子疗法(Molecular Therapy)》,22(11):1900-1909(2014)。如上文背景技术部分所述,各种AAV血清型的基因组的核苷酸序列是本领域已知的。为了启动骨骼肌肉特异性表达,可使用AAV1、AAV6、AAV8、AAV9、AAVrh10或AAVrh.74。
本公开的DNA质粒包含本公开的rAAV基因组。将DNA质粒转移到允许用AAV的辅助病毒(例如腺病毒、E1缺失的腺病毒或疱疹病毒)感染的细胞中,以将rAAV基因组装配成感染性病毒颗粒。产生rAAV颗粒的技术是本领域中的标准,其中将待包装的AAV基因组、rep和cap基因以及辅助病毒功能提供给细胞。rAAV的产生需要以下组分存在于单个细胞内(在本文中表示为包装细胞):rAAV基因组、与rAAV基因组分开(即不在其中)的AAV rep和cap基因,以及辅助病毒功能。AAV rep和cap基因可来自任何可衍生重组病毒的AAV血清型,并且可来自与rAAV基因组ITR不同的AAV血清型,包括但不限于AAV血清型AAV-1、AAV-2、AAV-3、AAV-4、AAV-5、AAV-6、AAV-7、AAVrh.74、AAVrh.10、AAV-8、AAV-9、AAV-10、AAV-11、AAV-12和AAV-13。假型rAAV的产生在例如WO 01/83692中公开,其通过引用整体并入本文。
产生包装细胞的方法是创建稳定表达AAV颗粒产生的所有必需组分的细胞系。例如,包含缺乏AAV rep和cap基因的rAAV基因组的质粒(或多个质粒)、与rAAV基因组分开的AAV rep和cap基因、以及如新霉素抗性基因等可选择的标记整合到细胞的基因组中。已经通过如GC拖尾等程序将AAV基因组引入细菌质粒中(Samulski等人,1982,《美国国家研究院院刊(Proc.Natl.Acad.S6.USA)》,79:2077-2081),添加含有限制性核酸内切酶切割位点的合成连接子(Laughlin等人,1983,《基因(Gene)》,23:65-73)或通过直接平末端连接(Senapathy和Carter,1984,《生物化学期刊(J.Biol.Chem.)》,259:4661-4666)。然后用如腺病毒等辅助病毒感染包装细胞系。这种方法的优点在于细胞为可选择的并且适合于大规模产生rAAV。合适方法的其它实例采用腺病毒或杆状病毒而非质体将rAAV基因组和/或rep及cap基因引入包装细胞。
rAAV产生的一般原理评论于例如Carter,1992,《生物技术当前述评(CurrentOpinions in Biotechnology)》,1533-539;及Muzyczka,1992,《微生物学及免疫学的当前课题(Curr.Topics in Microbial.and Immunol.)》,Topics in Microbial.andImmunol.)》,158:97-129)中评论。各种方法描述于Ratschin等人,《分子与细胞生物学(Mol.Cell.Biol.)》4:2072(1984);Hermonat等人,《美国国家研究院院刊》,81:6466(1984);Tratschin等人,《分子与细胞生物学》5:3251(1985);McLaughlin等人,《病毒学期刊》,62:1963(1988)以及Lebkowski等人,《分子与细胞生物学》,7:349(1988)。Samulski等人,《病毒学期刊》,63:3822-3828(1989);美国专利号5,173,414;WO 95/13365和对应美国专利号5,658,776;WO 95/13392;WO 96/17947;PCT/US98/18600;WO 97/09441(PCT/US96/14423);WO 97/08298(PCT/US96/13872);WO97/21825(PCT/US96/20777);WO 97/06243(PCT/FR96/01064);WO 99/11764;Perrin等人《疫苗(Vaccine)》13:1244-1250(1995);Paul等人《人类基因疗法(Human Gene Therapy)》4:609-615(1993);Clark等人《基因疗法(GeneTherapy)》3:1124-1132(1996);美国专利号5,786,211;美国专利号5,871,982;以及美国专利号6,258,595中。前述文献在此以全文引用的方式并入本文中,特别强调与rAAV产生有关的文献的那些部分。
因此,本公开提供产生感染性rAAV的包装细胞。在一个实施方案中,包装细胞可以是稳定转化的癌细胞,诸如HeLa细胞、293细胞和PerC.6细胞(同源293系)。在另一实施方案中,包装细胞是不为转化的癌细胞的细胞,例如低传代293细胞(用腺病毒E1转化的人胚肾细胞)、MRC-5细胞(人胚成纤维细胞)、WI-38细胞(人胚成纤维细胞)、Vero细胞(猴肾细胞)和FRhL-2细胞(恒河猴胚肺细胞)。
所提供的重组AAV(即,感染性衣壳化rAAV颗粒)包含rAAV基因组。在示例性实施方案中,两种rAAV的基因组缺乏AAV rep和cap DNA,即,在基因组的ITR之间不存在AAV rep或cap DNA。
在一个示例性实施方案中,所述重组AAV通过三重转染方法产生(Xiao等人,《病毒学杂志》72,2224-2232(1998)使用包含GNE基因和肌肉特异性启动子元件pNLRep2-Caprh74和pHelp的AAV载体质粒,rAAV包含GNE基因表达盒,其两侧是AAV2反向末端重复序列(ITR)。正是这个序列被衣壳化到AAVrh74病毒粒子中。该质粒含有GNE序列和肌肉特异性启动子的肌肉特异性启动子原件和核心启动子元件,以驱动基因表达。表达盒还含有SV40内含子(SD/SA)以促进高水平基因表达,并且牛生长激素多腺苷酸化信号用于有效的转录终止。
pNLREP2-Caprh74是AAV辅助质粒,其编码来自血清型rh74的4种野生型AAV2 rep蛋白和3种野生型AAV VP衣壳蛋白。
pHELP腺病毒辅助质粒为11,635bp,从Applied Viromics获得。质粒含有对AAV复制很重要的腺病毒基因组区域,即E2A、E4ORF6和VA RNA(腺病毒E1功能由293个细胞提供)。存在于该质粒中的腺病毒序列仅占腺病毒基因组的约40%,并且不含有对复制至关重要的顺式元件,例如腺病毒末端重复序列。因此,预计不会从这种生产系统产生感染性腺病毒。
rAAV可以通过本领域标准方法纯化,如通过柱色谱法或氯化铯梯度。从辅助病毒中纯化rAAV载体的方法是本领域已知的,并且包括在例如Clark等人,《人类基因疗法》,10(6):1031-1039(1999);Schenpp和Clark,《分子医学方法(Methods Mol.Med.)》,69 427-443(2002);美国专利号6,566,118和WO 98/09657。
在另一个实施方案中,本公开考虑包含本公开的rAAV的组合物。本公开的组合物包含rAAV和药学上可接受的载体。组合物还可包含其它成分,例如稀释剂和佐剂。可接受的载体、稀释剂和佐剂对接受者是无毒的,并且优选在所用的剂量和浓度下是惰性的,包括缓冲剂和表面活性剂,例如pluronics。
在本公开的方法中待施用的rAAV的滴度将根据例如特定rAAV、施用方式、治疗目标、个体以及靶向的一种或多种细胞类型而变化,并且可通过本领域标准的方法确定。rAAV的滴度范围可为每毫升约1×106、约1×107、约1×108、约1×109、约1×1010、约1×1011、约1×1012、约1×1013至约1×1014或更多DNase抗性颗粒(DRP)。剂量也可以病毒基因组(vg)为单位表达。确定衣壳载体基因组滴度的一种示例性方法使用定量PCR,例如(Pozsgai等人,《分子疗法》25(4):855-869,2017)中描述的方法。
本公开考虑体内或体外用rAAV转导靶细胞的方法。体内方法包含向有需要的动物(包括人类)给药有效剂量或有效多剂量的包含本公开的rAAV的组合物的步骤。如果在病症/疾病发展之前施用剂量,那么施用是预防性的。如果在病症/疾病发展之后施用剂量,那么施用是治疗性的。在本公开的实施例中,有效剂量是减轻(消除或降低)与正在医治的病症/疾病状态相关的至少一种症状、减缓或预防进展至病症/疾病状态、减缓或预防病症/疾病状态的进展、减少疾病的程度、导致疾病的缓解(部分或全部),和/或延长存活的剂量。预期用本公开的方法预防或医治的疾病的实例是GNE肌病。
本公开还考虑了组合疗法。如本文使用的组合包括同时医治和顺序医治两者。特别考虑本公开方法与标准医药医治(例如皮质类固醇)的组合,以及与新疗法的组合。
给药有效剂量的组合物可通过本领域标准的途径,包括但不限于肌内、肠胃外、静脉内、动脉内、口服、口腔、鼻、肺、颅内、骨内、眼内、直肠或阴道。考虑到感染和/或正在治疗的疾病状态以及将表达UDP-GlcNAc-差向异构酶/ManNAc-6激酶蛋白和卵泡抑素344、卵泡抑素317或胰岛素样生长因子1的一个或多个靶细胞/组织,本领域技术人员可选择和/或匹配本公开的rAAV的AAV组分(特别是AAV ITR和衣壳蛋白)的一个或多个施用途径和一种或多种血清型。
本公开提供有效剂量的rAAV和本公开组合物的局部施用和全身性施用。举例来说,全身性施用是施用到循环系统,使得整个身体受到影响。全身给药包括肠内给药,如通过胃肠道吸收和通过注射、输注或植入进行肠胃外给药。
特别地,本公开的rAAV的实际给药可通过使用将rAAV重组载体转运到动物的靶组织中的任何物理方法来实现。根据本公开的给药包括但不限于注射到肌肉和注射到血流。简单地将rAAV重新悬浮在磷酸盐缓冲溶液中已经被证明足以提供用于肌肉组织表达的媒介物,并且对可以与rAAV共同施用的载体或其它组分没有已知的限制(尽管通常应该避免降解DNA的组合物与rAAV使用)。可修饰rAAV的衣壳蛋白,使得rAAV靶向感兴趣的特定靶组织,例如肌肉。参见,例如,WO 02/053703,其公开内容以引用的方式并入本文中。药物组合物可制备成可通过透皮转运递送至肌肉的注射配方或局部配方。许多用于肌内注射和透皮转运两者的制剂先前已经被开发,并且可以用于本公开的实践中。rAAV可与任何药学上可接受的载剂一起使用,以便于施用和处理。
在本文公开的方法中待给药的rAAV的剂量将根据例如特定rAAV、给药方式、医治目标、个体和靶向的一种或多种细胞类型而变化,并且可通过本领域标准的方法确定。施用的每种rAAV的滴度范围可为从每毫升约1×106、约1×107、约1×108、约1×109、约1×1010、约1×1011、约1×1012、约1×1013、约1×1014、约2×1014或至约1×1015或更多DNase抗性颗粒(DRP)。剂量也可以病毒基因组(vg)为单位表示(即,分别地1×107vg、1×108vg、1×109vg、1×1010vg、1×1011vg、1×1012vg、1×1013vg、1×1014vg、2×1014vg、1×1015vg)。剂量也可以以每千克(kg)体重的病毒基因组(vg)为单位表示(即分别地1×1010vg/kg、1×1011vg/kg、1×1012vg/kg、1×1013vg/kg、1×1014vg/kg、1.25×1014vg/kg、1.5×1014vg/kg、1.75×1014vg/kg、2.0×1014vg/kg、2.25×1014vg/kg、2.5×1014vg/kg、2.75×1014vg/kg、3.0×1014vg/kg、3.25×1014vg/kg、3.5×1014vg/kg、3.75×1014vg/kg、4.0×1014vg/kg、1×1015vg/kg)。滴定AAV的方法描述于Clark等人,Hum.Gene Ther.,10:1031-1039(1999)。
为了肌内注射的目的,可采用佐剂,例如芝麻油或花生油或丙二醇水溶液,以及无菌水溶液。如果期望,那么可缓冲这类水溶液,并且首先用盐水或葡萄糖使液体稀释剂等渗。作为游离酸的rAAV溶液(DNA含有酸性磷酸酯基团)或药理学上可接受的盐可在适当地与表面活性剂(例如羟丙基纤维素)混合的水中制备。还可在甘油、液体聚乙二醇及其混合物和油中制备rAAV的分散液。在通常的储存和使用条件下,这些制剂含有防腐剂以预防微生物的生长。在这方面,采用的无菌含水介质都可通过本领域技术人员熟知的标准技术容易地获得。
适于可注射使用的药物载体、稀释剂或赋形剂包括无菌水溶液或分散液和用于临时制备无菌可注射溶液或分散液的无菌粉末。在所有情况下,所述形式必须是无菌的并且流动性必须达到存在流畅注射能力的程度。其必须在制造和储存条件下稳定,并且必须防止微生物如细菌和真菌的污染作用。载体可为溶剂或分散介质,其含有例如水、乙醇、多元醇(例如甘油、丙二醇、液体聚乙二醇等)、其合适的混合物和植物油。举例来说,通过使用例如卵磷脂的包衣、通过在分散液的情况下维持所需的粒度和通过使用表面活性剂,可维持适当的流动性。可通过各种抗细菌剂和抗真菌剂,例如对羟基苯甲酸酯、氯丁醇、苯酚、山梨酸、硫柳汞等来预防微生物的作用。在许多情况下,将优选包含等渗剂,例如糖或氯化钠。通过使用延迟吸收的试剂,例如单硬脂酸铝和明胶,可实现可注射组合物的延长吸收。
根据需要,通过将rAAV以所需量掺入带有上面列举的各种其它成分的适当溶剂中来制备无菌可注射溶液,然后过滤灭菌。通常,通过将灭菌的活性成分掺入无菌媒介物中来制备分散液,所述无菌载体含有基础分散介质和来自上面列举的那些的所需其它成分。在用于制备无菌可注射溶液的无菌粉末的情况下,优选的制备方法是真空干燥和冷冻干燥技术,其产生活性成分的粉末加上来自其先前无菌过滤溶液的任何附加期望成分。
用rAAV转导也可在体外进行。在一个实施方案中,从受试者中取出期望的靶肌肉细胞,用rAAV转导并且重新引入受试者。或者,可使用同基因或异基因肌肉细胞,其中这些细胞将不在受试者中产生不适当的免疫应答。
用于将转导细胞转导和重新引入受试者的合适方法是本领域已知的。在一个实施方案中,可通过将rAAV与肌肉细胞组合(例如在适当的培养基中)体外转导细胞,并且使用常规技术(例如Southern印迹和/或PCR),或通过使用选择标记物来筛选具有感兴趣的DNA的那些细胞。然后可将转导的细胞配制成药物组合物,并且通过各种技术将组合物引入受试者,例如通过肌内、静脉内、皮下和腹膜内注射,或通过使用例如导管来注射到平滑肌和心肌中。
用本公开的rAAV细胞转导导致UDP-GlcNAc-差向异构酶/ManNAc-6激酶蛋白的持续表达。因此,本公开提供了向动物,优选人类给药/递送表达UDP-GlcNAc-差向异构酶/ManNAc-6激酶蛋白的rAAV的方法。这些方法包括用一种或多种本公开的rAAV转导组织(包括但不限于如肌肉的组织、如肝脏和脑的器官,以及如唾液腺的腺体)。转导可用包含组织特异性控制元件的基因盒进行。例如,本公开的一个实施方案提供了转导由肌肉特异性启动子元件指导的肌肉细胞和肌肉组织的方法,所述控制元件包括但不限于:衍生自肌动蛋白和肌球蛋白基因家族,例如衍生自myoD基因家族的控制元件(参见Weintraub等人,《科学(Science)》,251:761-766(1991));肌细胞特异性增强子结合因子MEF-2(Cserjesi和Olson,《分子细胞生物学》11:4854-4862(1991));衍生自人类骨骼肌动蛋白基因(Muscat等人,《分子细胞生物学》,7:4089-4099(1987));心肌肌动蛋白基因的控制元件;肌肉肌酸激酶序列元件(参见Johnson等人,《分子细胞生物学》,9:3393-3399(1989))和鼠肌酸激酶增强子(MCK)元件;衍生自骨骼快速颤搐肌钙蛋白C基因、慢速颤搐心肌肌钙蛋白C基因和慢速颤搐肌钙蛋白I基因的控制元件:缺氧诱导的核因子(Semenza等人,《美国国家研究院院刊》,88:5680-5684(1991));类固醇诱导的包括糖皮质激素应答元件(GRE)的元件和启动子(参见Mader和White,《美国国家研究院院刊》90:5603-5607(1993));以及其它控制元件。
肌肉组织是体内DNA递送的有吸引力的靶标,因为其不是至关重要的器官并且易于接近。本公开考虑了来自转导的肌纤维的持续表达UDP-GlcNAc-差向异构酶/ManNAc-6激酶。
“肌肉细胞”或“肌肉组织”是指源自任何种类的肌肉的细胞或细胞群(例如,骨骼肌和平滑肌,例如来自消化道、膀胱、血管或心脏组织)。这类肌肉细胞可为分化的或未分化的,例如成肌细胞、肌细胞、肌管、心肌细胞和成心肌细胞。
术语“转导”是用来指经由本公开的复制缺陷型rAAV将GNE的编码区域体内或体外给药/递送到受体细胞,导致受体细胞表达UDP-GlcNAc-差向异构酶/ManNAc-6激酶。
提供以下实例是为了说明而不是为了限制。所描述的数值范围包括每个范围内的每个整数值,并且包括最低和最高的所述整数。
实例
实例1
编码GlcNAc差向异构酶/ManNAc激酶的构建体或GalNAc转移酶基因cDNA
编码UDP-GlcNAc-差向异构酶/ManNAc-6激酶的以下示例性DNA构建体如下产生:
rAAVrh74.CMV.GNE(变体2)在图1A中列出并由图2的多核苷酸(SEQ ID NO:12)编码。
rAAVrh74.MCK.GNE(变体2)在图1B中列出并由图3的多核苷酸(SEQ ID NO:13)编码。
rAAVrh74.MHCK7.GNE(变体2)在图1C中列出并由图4的多核苷酸(SEQ ID NO:14)编码。
rAAVrh74.GNE启动子.GNE(变体2)在图1D中列出并由图5的多核苷酸(SEQ ID NO:15)编码。
rAAVrh74.MHCK7.GNE(变体2).FGFIIRES.FS344在图1E中列出并由图6的多核苷酸(SEQ ID NO:16)编码。
rAAVrh74.MHCK7.GNE(变体2).FGF1 IRES.HB-IGF1在图1F中列出并由图7的多核苷酸(SEQ ID NO:17)编码。
rAAVrh74.CVM.GNE(变体2).FGF1IRES.FS344在图1G中列出并由图8的多核苷酸(SEQ ID NO:18)编码。
rAAVrh74.CMV.GNE(变体2).FGF1 IRES.HB-IGF1在图1H中列出并由图9的多核苷酸(SEQ ID NO:19)编码。
rAAVrh74.MCK.GNE(变体2).FGF1IRES.FS344在图1I中列出并由图10的多核苷酸(SEQ ID NO:20)编码。
rAAVrh74.MCK.GNE(变体2).FGF1 IRES.HB-IGF1在图1J中列出并由图11的多核苷酸(SEQ ID NO:21)编码。
rAAVrh74.GNE启动子.GNE(变体2).FGFIIRES.FS344在图1K中列出并由图12的多核苷酸(SEQ ID NO:22)编码。
rAAVrh74.GNE启动子.GNE(变体2).FGF1 IRES.HB-IGFI在图1L中列出并由图13的多核苷酸(SEQ ID NO:23)编码。
rAAVrh74.迷你CMV.GNE在图1M中列出并由图14的多核苷酸(SEQ ID NO:24)编码。
rAAVrh74.迷你CMV.GNE(变体2).FGF1IRES.FS344在图1N中列出并由图15的多核苷酸(SEQ ID NO:25)编码。
rAAVrh74,迷你CMV.GNE(变体2).FGF1.IRES.HB-IGF1在图1O中列出并由图16的多核苷酸(SEQ ID NO:26)编码。
此外,如下产生了编码GalNAc转移酶rAAVrh74.MCK.GALGT2.FGF1IRES.FS344的示例性DNA构建体,其在图1P中列出并由图17的多核苷酸(SEQ ID NO:38)编码。
所公开的质粒包含侧翼是AAV2反向末端重复序列(ITR)的人GNE cDNA或GATGT2表达盒,这些表达盒还可以包含FGFIIRES和诱导肌肉生长的第二转基因,例如卵泡抑素344或HB-IGF1。GlcNAc差向异构酶/ManNAc激酶蛋白或GalNAc转移酶蛋白的表达由CMV、MCK、MHCK7、迷你CMV或GNE启动子引导。CMV是巨细胞病毒启动子(SEQ ID NO:3)。MCK是肌肉肌酸激酶启动子(CK7样)(SEQ ID NO:4)。MHCK7是具有附加增强子的MCK启动子(SEQ ID NO:5)。迷你CMV是CMV启动子(SEQ ID NO:7)的较小版本。GNE变体2是GlcNAc差向异构酶/ManNAc激酶基因cDNA变体2,它编码从外显子3开始的722个氨基酸的蛋白质(NM_005476;SEQ ID NO:1)。GALGT2是GALGT2(或B4GALNT2)基因cDNA(基因库登录号#AJ517771;SEQ ID NO:36)。迷你FGF1IRES代表最小的FGFI内部核糖体进入位点(SEQ ID NO:8)。FS344是卵泡抑素344氨基酸形式(SEQ ID NO:10)。HB-IGF1是人肝素结合表皮生长因子样生长因子的信号肽和前原肽结构域,其与胰岛素样生长因子1(SEQ ID NO:11)的外显子1-4相连。GNE启动子(SEQID NO:6)代表紧邻外显子2的5'的指定序列元件,它应该用于驱动变体2GNE转录物的表达。
野生型人GNE是2.2kB cDNA,因此某些实施方案可能需要缩短的FGF1AIRES。这种缩短的FGF1AIREScan小至100bp,以使FST(1.3kB)适应AAV的4.7kB封装限制。缩短的CMV启动子(220bp而不是800bp)在本文中表示为迷你CMV,如果它在工作时出现问题,则需要使用更长的IRES序列。
GNE cDNA表达盒或GATGT2 cDNA表达盒具有卡那霉素抗性基因,以及实现更稳健的转录的优化的Kozak序列和优化的Kozak序列。rAAV载体是通过改进的交叉封装方法产生的,由此AAV 2型载体基因组可以封装成多种AAV衣壳血清型[Rabinowitz等人,《病毒学杂志》76(2):791-801(2002)]。。使用HEK293细胞使用标准的三质粒DNA/CaPO4沉淀方法完成生产。HEK293细胞维持在补充有10%胎牛血清(FBS)和青霉素和链霉素的DMEM中。生产质粒是:(i)编码治疗性蛋白质的质粒;(ii)编码cap血清型AAVrh74分离物的rep2-capX修饰的AAV辅助质粒;以及(iii)表达腺病毒E2A、E4 ORF6和VA I/II RNA基因的腺病毒5型辅助质粒(pAdhelper)。利用Prism 7500Taqman检测器系统(PE应用生物系统公司(PE AppliedBiosystems))使用基于qPCR的滴定方法来确定封装的载体基因组vg滴度。[Clark等人,《人类基因治疗》,10(6):1031-1039(1999)]。最终滴度(vg ml-1)通过定量逆转录酶PCR使用特定引物和探针利用Prism 7500实时检测器系统(PE应用生物系统公司(PE AppliedBiosystems),格兰德艾兰,纽约,美国)测定。等分的病毒保持在-80℃直到
用于制造要封装的AAV基因组的所有质粒除了用于封装基因组的ITR序列之外还包含卡那霉素抗性基因(KanR)。这使得编码AAV基因组的DNA在卡那霉素存在的情况下转化为细菌以产生大量DNA,这将杀死所有未转化的细菌。KanR没有被封装到用于治疗患者的AAV基因组中的AAV衣壳中,但它的存在使得在细菌中产生了DNA。
实例2
表达与测试
通过将AAV载体rAAV.CMV.GNE.迷你IRES.GFP和rAAV.迷你CMV.GNE.全长(FL)IRES.GFP转染到GNE缺陷型Lec3 CHO细胞(Lec3)中来测试AAV载体的载体基因组以证明实例1中描述的载体表达GFP和第二蛋白质。迷你IRES是IRES的进一步缩短版本,其示出为SEQID NO:7。如图20所示,载体基因组中迷你IRES的存在允许IRES下游的第二蛋白质(GFP)的表达。在图20中,GFP显示内源性荧光,而GNE表达通过免疫染色显示。如图21所示,全长IRES还允许表达第二基因(GFP)。如图23所示,当GNE引入Gne缺陷型Lec3细胞时,同时IRES产生第二蛋白质(在这种情况下为GFP),则GNE可以产生唾液酸。
图24显示出任何适当大小的转基因都可以作为基因置换或替代基因置换位于第一位置。用AAV载体rAAV.MCK.GALGT2.IRES.FS344转染C2C12细胞,该载体表达GALGT2,这是杜氏肌营养不良症中肌营养不良蛋白的替代基因。在同一细胞中观察到GALGT2(染成绿色)和FST(染成红色)的表达。包含IRES允许在相同细胞中产生肌肉生长因子,在这种情况下为卵泡抑素(FS344或FST)。
为了进一步分析,在肌肉细胞和GNE缺陷型CHO细胞(Lec3)中测试实例1中描述的任何AAV载体以证明它们的功能。AAV载体以不同的剂量添加,从10MOI(感染复数)到10,000MOI,以对数增量。AAV通常需要高MOI才能感染培养中的细胞,因为AAV在体内的作用要远好于体外。C2C12成肌细胞和C2C12肌管培养物以及CHO-K1(野生型)细胞和Lec3细胞(一种缺乏Gne活性的CHO细胞变体)由所提供的AAV载体感染。
在Gne缺陷小鼠中进行功能的体内测试,其中通过证明UDP-GlcNAc差向异构酶活性或通过测量游离或膜结合唾液酸来测试GNE基因校正。这些测量通过使用已知标准的气相色谱-质谱法或通过使用结合唾液酸的怀槐凝集素或Sambuca Nigra凝集素的定量凝集素染色来进行。Gne酶活性的测定,例如UDP-GlcNAc差向异构酶活性,也可以限定基因置换。FST和IGF1对肌肉生长的诱导通过以下方式测定:称重四肢肌肉并将它们与动物总重量进行比较(例如,参见图22);通过切片肌肉并使用薄切片的苏木精和伊红染色结合形态测量软件来测量骨骼肌纤维的面积和数量;以及通过肌肉力量的生理测量,包括例如胫骨前肌或趾长伸肌中的握力、行走和比力的离体测量。
对细胞进行MAA或SNA(与Cy3偶联)染色以评估唾液酸化,并使用GNE、FST或IGF1抗体来评估蛋白质共表达。如前所述,在较大的细胞培养物中感染相同的构建体,以通过蛋白质印迹和ELISA评估蛋白质表达。(Haidet等人,《美国国家研究院院刊》105(11):4318-22,2008;Hennebry等人,《分子内分泌学杂志(J.Endocrinolgy)》234:187-200,2008)。如前所述,通过免疫染色和蛋白质印迹评估信号转导的变化,特别是FST的磷-Smad 2水平降低和磷-Akt(对于IGF1)增加(Chandraskeharen等人,《肌肉神经(Muscle Nerve)》39(1):25-41,2008;Cramer等人,《分子细胞生物学》39(14),2019)。在所有情况下,通过qRT-PCR评估基因表达,通过qPCR评估AAV生物分布,如Xu等人之前所述(《分子疗法(Mol Ther.)》2019)。我们已经确定了肌肉生长(ns)的理想IGF1剪接形式。
实例1中描述的双顺反子载体允许GNE蛋白表达以及来自同一mRNA的卵泡抑素或IGF1蛋白表达。肌肉培养物的感染允许更大的IRES介导的双顺反子表达,因为FGF1AIRES在肌肉中显示出比在非肌肉细胞系中更大的影响。Lec3细胞中的GNE表达增加了唾液酸化,因为这些细胞缺乏Gne酶活性,这等于或超过正常CHO-K1细胞中的SA水平。
如图4所示,GNE的肌肉和肝脏特异性表达均有助于肌肉SA的表达。在GNED176VTgGne-/-小鼠中肌肉内注射rAAVrh74.MCK.GNE或腹腔注射rAAVrh74.LSP.GNE后对肝脏和肌肉进行唾液酸染色。肌肉和肝脏中的唾液酸染色显示在肌肉中肌肉特异性GNE基因治疗载体IM注射或肝脏中肝脏特异性GNE基因治疗载体IP递送6个月后的时间匹配图像中,两者的剂量均为5×1011vg。qRT-PCR显示MCK的肌肉表达增加了30倍,而肝脏中没有表达,同时LSP显示肝脏表达增加了8倍,肌肉(ns)中没有增加。6个月后,MCK增加肌肉SA,但LSP增加更多,可能是肝脏分泌的血清糖蛋白沉积在肌肉细胞外基质中。
为了证明使用rAAV载体转导肌肉细胞导致肌肉生长,C57Bl/6J小鼠的胫骨前(TA)肌肉注射了1×10 11vg(载体基因组),并且腓肠肌(Gastroc)肌肉注射了5×10 11vg表达胰岛素样生长因子1(IGF1,肌肉形式Ea)、HB-IGF1或卵泡抑素(FST)形式344的AAV。在注射后2个月解剖肌肉并称重,显示与单独注射缓冲液相比,TA中的HB-IGF1和FST344以及Gastroc中的FST344显著增加(参见图21)。
实例3
成年小鼠GNE功能的小鼠模型
通过将代液氧(floxed)Gne等位基因引入小鼠Gne基因的外显子3来生成GNE肌病小鼠模型,并且该等位基因的引入足以允许Cre介导的缺失,从而产生GNE肌病样表型。GNE肌病研究领域一直受到疾病模型不足的困扰。GNED176VTgGne-/-小鼠首次被报道是GNE肌病的良好迟发模型(Malicdan等人,《人类分子治疗》16(22):2669-82,2007;Malicdan等人,《自然医学(Nat.Med.)》15(6):690-5,2009),但在进一步繁殖后,这些小鼠失去了大部分表型,而GNEM712T(现为GNEM743T)的小鼠敲入波斯犹太人突变导致了致死性,部分是由于肾功能不全,而同一系的其他菌株根本没有表现出任何表型(Sela等人,《神经分子医学(Neuromolecular Medicine)》15(1):180-91,2013ll。由于Gne在小鼠中是必不可少的,导致E8.5和E9.5之间的致死性,因此在成年小鼠中创建代液氧等位基因以删除该基因应该允许使用Cre介导的删除来创建一个强大的全身或肌肉特异性表型。反过来,这允许更多可重复的治疗效果证明。
Cas9-CRISPR用于删除小鼠Gne基因的外显子3,该外显子是UDP-GlcNAc差向异构酶功能域开始的地方并且包含Gne基因的翻译起始位点。受精的卵母细胞被注射Cas9-CRISPR、相关的指导RNA和一个长DNA寡核苷酸,该长DNA寡核苷酸允许重组以产生一个新的两侧是loxP重组位点的外显子3。奠基者经过两代人的培育,然后由供应商(加州大学戴维斯分校的小鼠生物学项目)运送以进行后续分析。
在一个80只小鼠的注射会话中,由26只活小鼠中产生了两个Gne缺失外显子3缺失奠基者(尽管没有代液氧奠基者)(图19)。随后是另一轮160只小鼠的注射。如果成功,则使用rAAVrh74.CMV.Cre-GFP通过IV尾静脉注射系统地表达Cre,或将rAAVrh74.MCK.Cre-GFP仅用于删除骨骼肌(和心脏)中的Gne。这些实验提供了一种了解成年小鼠中Gne缺失如何导致疾病表型的方法。虽然qPCR结果显示在这些奠基者中不存在与外显子3接壤的代液氧等位基因,但它们仍可用于制造Gne-/-小鼠。这些小鼠还证明,使用的引导RNA确实能够实现Gne外显子3的Cas9-CRISPR缺失。
目前可获得用于检测疾病表型的测定法。例如,为了了解唾液酸化的丧失,MAA和SNA凝集素染色用于可视化唾液酸表达(使用内源性Cre-GFP来查看Cre在哪些细胞中表达),它们分别结合α2,3-和α2,6-连接的SA。qRT-PCR用于了解Gne基因表达的缺失(以及Cre-GFP基因表达的增加)。qPCR用于了解每个肌肉组织中每个细胞核中存在的载体基因组数量以及基因缺失的程度。有关方法,请参见Kim等人,《分子细胞神经学报(Mol.CellNeurosci.)》39(3):452-64,2008)和Xu等人,《分子疗法》,2019。GC-MS/MS方法也可用于测量总游离唾液酸和总糖蛋白缀合的N-和O-连接唾液酸,参见Yoon等人(《公共科学图书馆潮流(PLoS Currents)》2013)。最后,Gne酶活性,无论是UDP-GlcNAc差向异构酶活性还是ManNAc6激酶活性,都可用于测量功能基因置换的程度。
肌肉病状分析包括用苏木精和伊红、三色和刚果红对薄切片进行染色。测量内容包括包涵体的数量、肌纤维大小、中央核、肌纤维大小的变化、纤维化和非肌肉区域(消瘦),参见Chandraskehren等人,《肌肉神经(Muscle Nerve)》39(1):25-41,2008。如果发现包涵体,则使用电子显微镜评估它们的超微结构。肌肉功能是通过测量握力、行走(跑步机行走)、旷场测试和重复收缩期间(在TA和EDL中)的离体比力和力下降来测定的,参见(Chandraskehren等人,《肌肉神经(Muscle Nerve)》39(1):25-41,2008;Martin等人,《美国生理学杂志(Am.J.Physiol.Cell Physiol.)》,296:C476-88,2009)。
代液氧Gne小鼠在2个月大时进行模拟物注射(对照)或1×1014vg/kgAAV.CMV.Cre-GFP或AAV.MCK.Cre-GFP,在注射后1、2和4个月进行分析。每组注射6只小鼠(3只雄性和3只雌性),年龄匹配的模拟物注射小鼠和野生型小鼠用作对照。
如果上述实验没有在这些注射过程中产生任何代液氧小鼠奠基者,则两个Gne缺失奠基者在2g/kg/天的ManNAc情况下具有breto纯合性,这在GNEM743T模型和Gne-/-模型中挽救了唾液酸化和致死性。在这里,从受孕开始,小鼠在水中给予2-4g/kg/天的ManNAc。一旦幼崽断奶,就可以去除ManNAc并通过基因疗法进行测试,从而基本上创建了一个可诱导的Gne敲除模型。这些小鼠不允许肌肉特异性Gne缺失,但是可以在ManNAc退出时用AAV.CMV.GNE M712T或AAV.CMV.GNE D207V拯救这些小鼠,并在需要时测试肌肉特异性疾病。如果需要,还可以使用靶向小鼠和/或人GNE等位基因的微RNA或siRNA下调野生型或Gne+/-小鼠中的内源性Gne基因表达。虽然这样的实验会遇到与以前的转基因和敲入模型相同的问题,但给小鼠服用不同数量的GNE突变体的能力实现更多的控制。
实例4
体外AAV.GNE效力测定
MAA-HRP ELISA允许对表达Gne的CHO细胞和缺乏Gne的Lec3细胞之间的唾液酸水平进行比较,并且该测定应足以确定用不同浓度的AAV.GNE感染Lec3细胞后的AAV.GNE效力。
任何基因治疗临床开发计划都必须包含有效描述要使用的AAV载体的生物活性的效力测定,在这种情况下是AAV.GNE基因治疗载体的生物活性的效力测定。该测定将每年对AAV的临床批次进行一次,以证明活性并未丧失,并将进行该测定以证明用于患者的AAV在给药时具有必要的生物活性。
将不同量的AAV.GNE感染到Gne缺陷型Lec3(突变CHO)细胞(Hong等人,《生物化学杂志(J.Biol.Chem.)》278:53045-530454,2003),以使Lec3唾液酸化达到在等量正常CHO细胞中发现的确定量,从而证明AAV载体的生物活性效力。该过程是使用与a2,3-连接的唾液酸结合的怀槐凝集素(MAA)进行的(Song等人,286:31610-31622,2011)。这种测定可以应用于任何数量的含有GNE的基因治疗载体。
在MAA-HRP结合ELISA测定(ns)中,饲喂10%含血清培养基的Lec3细胞与正常CHO细胞没有差异,但在Opti-MEM培养基(一种确定的无血清培养基)中饲喂Lec3细胞3天,消除了大多数MAA结合,而CHO细胞保持其MAA信号(图25)。这是因为血清中的游离唾液酸(SA)被细胞吸收并结合到脂质和糖蛋白中,从而避开了Lec3细胞中的Gne缺乏的情况。这种避开只能通过从用于饲喂细胞的培养基中去除血清来撤销。例如,将rAAVrh74.CMV.GNE感染到以Opti-MEM喂养两天的Lec3细胞允许在105或106MOI(感染复数)剂量下部分恢复MAA结合信号(图25)。可能需要进行一些额外的优化工作(即AAV感染时间变化、Opti-MEM中Lec3细胞的时间变化或使用的AAV剂量变化)以扩大该测定中的信号差异。无论如何,该测定都能够通过向Lec3细胞添加不同量的AAV并将效力定义为恢复正常(或半正常)CHO细胞信号所需的剂量来确定AAV.GNE载体的效力。如图23所示。当将含有CMV.GNE的AAV质粒转染到Lec3细胞中并对GNE蛋白和MAA进行共染色时,我们发现表达GNE的Lec3细胞实际上分泌了唾液酸化糖蛋白细胞,在该唾液酸化糖蛋白细胞中,MAA可以结合在非GNE表达细胞上。因此,由于分泌的含SA蛋白质的反式效应,这种效力测定可能比使用GNE蛋白或基因水平作为标准的测定更敏感。为了测试该测定,将CHO细胞和Lec3细胞以10,000个细胞/孔转移到96孔ELISA板中,每种条件下使用的孔均一式三份。给细胞饲喂Opti-MEM一天,然后再饲喂细胞Opti-MEM,并允许在有或没有AAV的情况下再生长两天。在此期间,一些细胞被不同剂量的包含GNE cDNA的rAAV感染。请注意,任何AAV血清型均可用于这些检测。MOI的常规测量用于进行不同级别的AAV感染,包括1×104、5×104、1×105、5×105、1×106、5×106和1×107。值得注意的是,AAV在感染培养中生长的细胞方面效率不高。这与其强大的感染组织细胞的能力有很大不同。因此,需要使用相对较大浓度的病毒。然而,由于需要感染的细胞很少,因此该测定仍然每次测定仅使用非常少量的病毒。
感染后,将细胞在磷缓冲盐水(PBS)中洗涤,在4%多聚甲醛的PBS溶液中固定20分钟,然后在PBS中再次洗涤。然后将细胞在含有1%鱼明胶(不含唾液酸)的PBS中封闭1小时,与辣根过氧化物酶(MAA-HRP)连接的2mg/mL怀槐凝集素孵育1小时,然后洗涤3次,每次10分钟,每次均在PBS中进行。使用标准HRP活性(OPD)比色测定法检测结合的MAA-HRP,该测定法显色20分钟,然后在酸中淬灭10分钟。在SprectraMax读板器上在450nm处读取吸光度(颜色)。
用于确定本测定中使用的最佳MAA-HRP浓度的浓度曲线(2μg/mL)已生成。该MAA-HRP浓度产生CHO细胞的OD读数等于或高于1.0,而Lec3细胞的OD水平显著降低(例如,参见图25)。浓度曲线用于比较下列细胞的测量:未感染的低信号Lec3细胞;感染AAV.GNE的Lec3细胞,其应显示剂量反应性信号的增加;以及CHO细胞水平,其应具有高信号,这是我们完全生物活性的标准。在CHO细胞中发现的信号处获得该信号的MOI(或该信号的一半处,取决于重现性的难易程度)是定义为给予效力的剂量。这些测量重复至少6次,每个数据点使用三次测量,并确定重复测量的内部测定和测定间变异性。AAV浓度根据需要进行调整,以更严格地定义必要时提供全部效力所需的MOI。
当rAAV载体包含肌肉特异性启动子时,例如MCK和GNE cDNA序列,可以使用GNE缺失的成肌细胞系。其他“肌肉特异性”启动子,例如MHCK7,将在CHO细胞中起作用,但MCK不能。Gne缺陷的成肌细胞可以从其他NDF研究人员那里获得,或者如果有必要,可以通过使用Cas9-CRISPR删除人类细胞中的GNE来生成这样的细胞系。Gne缺陷型成肌细胞也可以使用Xia等人在《发育生物学(Dev.Biol.)》(242:58-73,2002)中描述的方法从Gne缺陷型小鼠培养的原代细胞中产生。来自正常野生型小鼠的阳性对照也可用于该测定。重要的是要了解,用于效力测定的细胞不必是人类细胞,只需将唾液酸定义为与对照相比由于Gne基因缺陷而缺失或大量减少的细胞即可。
实例5
体内AAV.GNE效力测定
野生型小鼠用于通过测量UDP-GlcNAc差向异构酶活性来定义组织中的AAV.GNE效力。任何基因治疗临床开发计划还必须含有效描述要在组织中使用的AAV.GNE载体的生物活性的效力测定。因为当酶过表达时GNE酶活性显示出来自CMP-Neu5Ac的产物抑制,所以唾液酸的测量将在正常水平下饱和并且不会进一步增加。因此,组织裂解物中UDP-GlcNAc差向异构酶活性的测量显示组织裂解物中的增加超过正常水平,这是评估总GNE活性的最佳方法之一。可用于测量小鼠和人体组织中GNE酶活性的UDP-GlcNAc差向异构酶测定是本文所述GNE基因治疗载体的体内效力测定。用AAV.GNE载体对野生型(C57Bl/6J)小鼠进行剂量反应研究,以评估使GNE酶活性提高一倍所需的载体基因组转导的剂量和水平,其定义为功能基因置换所需的量。即使在GNE疾病模型中没有概念验证研究的情况下,该信息也可用于帮助确定剂量。
在CHO细胞裂解物、Lec3细胞裂解物(缺乏Gne酶活性[2])和用pAAV.CMV.GNE质粒转染的Lec3细胞中对GNE酶活性(UDPGlcNAc差向异构酶活性)进行测量和比较。在CHO细胞中显示出GNE酶活性,而在Lec3细胞中几乎没有观察到GNE酶活性,并且在用pAAV.CMV.GNE转染的Lec3细胞中观察到超常的酶活性(图26)。GNE酶活性的体内测量优于唾液酸的MAA测定,这是因为该测定中没有反馈抑制,这将增加测定的线性读数。此外,进行UDP-GlcNAc差向异构酶测定需要显著更多的材料(数百万至数千万个CHO细胞,而不是用于MAA-HRPELISA的10,000个CHO细胞(图25))。因此,这种酶活性测定只能用于组织(而MAA结合可用于Lec3细胞ELISA)。这种UDP-GlcNAc差向异构酶测定也适用于小鼠组织(例如,肝脏)。
由于GNE基因和蛋白质在几乎所有器官中都有表达,因此在整个身体计划(肝、肾、脾、心脏、肺、结肠、脑)的组织中测量了改变的GNE酶活性(UDP-GlcNAc差向异构酶活性)。然而,整个身体计划中的骨骼肌(包括横膈膜、肱二头肌、肱三头肌、腓肠肌、股四头肌和胫骨前肌)是该分析的重点,因为肌肉病状会导致GNE肌病中的疾病。对来自6只小鼠(3只雄性和3只雌性)的组织裂解物进行分析,在考虑可能的性别差异的同时确定复现性。使用TissueLyser(4次30Hz脉冲,每次30秒)切割和匀化30-50mg组织,并在冰上摇动30分钟。裂解后,通过标准Bradford测定法测量蛋白质水平并将酶活性相对于总蛋白质标准化。
UDP-GlcNAc差向异构酶活性使用Morgan-Eslon DMAB(4-二甲氨基苯甲醛)比色法[6]进行测定,孵育时间为30分钟,其中ManNAc的产生将通过分光光度计在578nm处的产品吸光度来测量。每次测定将使用300μg总蛋白。由酶产生的ManNAc通过与ManNAc标准曲线进行比较来确定,该曲线经历相同的DMAB化学修饰方案,使用浓度为0、0.5、1、2.5、5、10、25、50和75μg/mL。接下来,在年龄和性别匹配的野生型小鼠中进行rAAVrh74.CMV.GNE静脉注射,以确定整个身体计划组织中内源性GNE酶活性加倍所需的剂量。随着AAV剂量的增加,预计GNE酶活性会线性增加。比较了1×1011vg/kg、1×1012vg/kg和1×1013vg/kg下的剂量。每个组织中的病毒量通过标准qPCR测量来量化,GNE基因表达的量将通过qRT-PCR测量,正如我们之前所做的(Xu等人,《分子疗法》)。如果有试剂可用,还可以通过蛋白质印迹比较蛋白质水平。
大多数研究人员通过测量引入组织中的GNE cDNA的量或GNE mRNA表达的诱导水平来定义GNE基因治疗载体的转导,但这些都不是GNE生物活性的功能测量。本文所述的测定GNE酶活性(UDP-GlcNAc差向异构酶活性)的测定法允许进行可靠的功能测量,该测量可以相对于测定中使用的总蛋白质的量标准化,并且该测定在小鼠之间是可重复的。还预计通过引入不同剂量的GNE基因治疗,将证明的是:使用该测定增加了GNE效力,并且将定义提供内源性GNE酶活性水平(即,在正常组织中发现的酶活性加倍)所需的最小剂量。该测定提供了确定所有器官中基因置换所需的功能性GNE过表达水平以及必须转导以完成此类变化的载体基因组数量所需的数据。
实例6
Bistronic GALGT2和卵泡抑素基因治疗的功能评估
mdx肌营养不良模型用于评估表达GALGT2和卵泡抑素344(FST)的bistronicrAAV基因治疗的功能。据报道,mdx小鼠骨骼肌中GALGT2过表达可预防肌肉损伤和抑制肌肉疾病(Xu等人,《神经肌内失调(Neuromuscul.Disord.)》,17;209-220(2007);马丁等人,《美国生理学杂志:细胞生理学(Am.J.Physiol.)》,296:C476-488(2009);Nguyen等人,《美国国家研究院院报》,99;5616-5621(2002),mdx小鼠中的GALGT2表达已诱导改善,即使只有一半数量的纤维被转导(Martin等人,(2009),同上)。
在本实验中,将2个月大的mdx与1×10 11vg rAAVrh74.MCK.GALGT2.IRES.FST或单基因载体(rAAVrh74.MCK.GALGT2或rAAVrh74.MCK.FST)以相同的剂量一起注射到TA。注射磷酸盐缓冲液(PBS)作为阴性对照。注射后两个月,对小鼠实施安乐死并称重肌肉(相对于总体重)。如图27A所示,单基因FST和双顺反子GALGT2/FST基因注射均导致肌肉大小增加,表明将FST基因放置在双顺反子载体的第二个位置导致在诱导肌肉生长方面具有显著的FST功能.
安乐死后,将TA肌肉切片,固定在丙酮中,并在注射后用FST和WFA抗体染色(以识别由GALGT2制造的GalNAc)。如图27B所示,注射双顺反子载体(rAAVrh74.MCK.GALGT2.IRES.FST)导致GALGT2和FST的功能性表达,GALGT2在肌肉膜上诱导糖基化(由WFA染色显示),而FST在高尔基体中表达,最终从高尔基体分泌到肌肉细胞外。请注意,表达GALGT2的肌纤维显示出正常的肌肉形态,没有肌肉营养不良的迹象,这是GALGT2基因过表达的一种已知功能。因此,这种单一的双顺反子AAV载体既可以抑制由GALGT2过表达引起的肌肉病状,又可以增加由FST基因表达引起的肌肉大小,从而实现双重功能治疗。
序列表
<110> 全国儿童医院研究所
<120> 针对肌肉疾病中肌肉的优化基因疗法
<130> 28335/54649
<150> US 62/951,564
<151> 2019-12-20
<160> 40
<170> PatentIn版本3.5
<210> 1
<211> 2169
<212> DNA
<213> 智人
<400> 1
atggagaaga atggaaataa ccgaaagctg cgggtttgtg ttgctacttg taaccgtgca 60
gattattcta aacttgcccc gatcatgttt ggcattaaaa ccgaacctga gttctttgaa 120
cttgatgttg tggtacttgg ctctcacctg atagatgact atggaaatac atatcgaatg 180
attgaacaag atgactttga cattaacacc aggctacaca caattgtgag gggagaagat 240
gaggcagcca tggtggagtc agtaggcctg gccctagtga agctgccaga tgtccttaat 300
cgcctgaagc ctgatatcat gattgttcat ggagacaggt ttgatgccct ggctctggcc 360
acatctgctg ccttgatgaa catccgaatc cttcacattg aaggtgggga agtcagtggg 420
accattgatg actctatcag acatgccata acaaaactgg ctcattatca tgtgtgctgc 480
acccgcagtg cagagcagca cctgatatcc atgtgtgagg accatgatcg catccttttg 540
gcaggctgcc cttcctatga caaacttctc tcagccaaga acaaagacta catgagcatc 600
attcgcatgt ggctaggtga tgatgtaaaa tctaaagatt acattgttgc actacagcac 660
cctgtgacca ctgacattaa gcattccata aaaatgtttg aattaacatt ggatgcactt 720
atctcattta acaagcggac cctagtcctg tttccaaata ttgacgcagg gagcaaagag 780
atggttcgag tgatgcggaa gaagggcatt gagcatcatc ccaactttcg tgcagttaaa 840
cacgtcccat ttgaccagtt tatacagttg gttgcccatg ctggctgtat gattgggaac 900
agcagctgtg gggttcgaga agttggagct tttggaacac ctgtgatcaa cctgggaaca 960
cgtcagattg gaagagaaac aggggagaat gttcttcatg tccgggatgc tgacacccaa 1020
gacaaaatat tgcaagcact gcaccttcag tttggtaaac agtacccttg ttcaaagata 1080
tatggggatg gaaatgctgt tccaaggatt ttgaagtttc tcaaatctat cgatcttcaa 1140
gagccactgc aaaagaaatt ctgctttcct cctgtgaagg agaatatctc tcaagatatt 1200
gaccatattc ttgaaactct aagtgccttg gccgttgatc ttggcgggac gaacctccga 1260
gttgcaatag tcagcatgaa gggtgaaata gttaagaagt atactcagtt caatcctaaa 1320
acctatgaag agaggattaa tttaatccta cagatgtgtg tggaagctgc agcagaagct 1380
gtaaaactga actgcagaat tttgggagta ggcatttcca caggtggccg tgtaaatcct 1440
cgggaaggaa ttgtgctgca ttcaaccaaa ctgatccaag agtggaactc tgtggacctt 1500
aggacccccc tttctgacac tttgcatctc cctgtgtggg tagacaatga tggcaactgt 1560
gctgccctgg cggaaaggaa atttggccaa ggaaagggac tggaaaactt tgttacactt 1620
atcacaggca caggaatcgg tggtggaatt atccatcagc atgaattgat ccacggaagc 1680
tccttctgtg ctgcagaact gggccacctt gttgtgtctc tggatgggcc tgattgttcc 1740
tgtggaagcc atgggtgcat tgaagcatac gcctctggaa tggccttgca gagggaggca 1800
aaaaagctcc atgatgagga cctgctcttg gtggaaggga tgtcagtgcc aaaagatgag 1860
gctgtgggtg cgctccatct catccaagct gcgaaacttg gcaatgcgaa ggcccagagc 1920
atcctaagaa cagctggaac agctttgggt cttggggttg tgaacatcct ccataccatg 1980
aatccctccc ttgtgatcct ctccggagtc ctggccagtc actatatcca cattgtcaaa 2040
gacgtcattc gccagcaggc cttgtcctcc gtgcaggacg tggatgtggt ggtttcggat 2100
ttggttgacc ccgccctgct gggtgctgcc agcatggttc tggactacac aacacgcagg 2160
atctactag 2169
<210> 2
<211> 753
<212> PRT
<213> 智人
<400> 2
Met Glu Thr Tyr Gly Tyr Leu Gln Arg Glu Ser Cys Phe Gln Gly Pro
1 5 10 15
His Glu Leu Tyr Phe Lys Asn Leu Ser Lys Arg Asn Lys Gln Ile Met
20 25 30
Glu Lys Asn Gly Asn Asn Arg Lys Leu Arg Val Cys Val Ala Thr Cys
35 40 45
Asn Arg Ala Asp Tyr Ser Lys Leu Ala Pro Ile Met Phe Gly Ile Lys
50 55 60
Thr Glu Pro Glu Phe Phe Glu Leu Asp Val Val Val Leu Gly Ser His
65 70 75 80
Leu Ile Asp Asp Tyr Gly Asn Thr Tyr Arg Met Ile Glu Gln Asp Asp
85 90 95
Phe Asp Ile Asn Thr Arg Leu His Thr Ile Val Arg Gly Glu Asp Glu
100 105 110
Ala Ala Met Val Glu Ser Val Gly Leu Ala Leu Val Lys Leu Pro Asp
115 120 125
Val Leu Asn Arg Leu Lys Pro Asp Ile Met Ile Val His Gly Asp Arg
130 135 140
Phe Asp Ala Leu Ala Leu Ala Thr Ser Ala Ala Leu Met Asn Ile Arg
145 150 155 160
Ile Leu His Ile Glu Gly Gly Glu Val Ser Gly Thr Ile Asp Asp Ser
165 170 175
Ile Arg His Ala Ile Thr Lys Leu Ala His Tyr His Val Cys Cys Thr
180 185 190
Arg Ser Ala Glu Gln His Leu Ile Ser Met Cys Glu Asp His Asp Arg
195 200 205
Ile Leu Leu Ala Gly Cys Pro Ser Tyr Asp Lys Leu Leu Ser Ala Lys
210 215 220
Asn Lys Asp Tyr Met Ser Ile Ile Arg Met Trp Leu Gly Asp Asp Val
225 230 235 240
Lys Ser Lys Asp Tyr Ile Val Ala Leu Gln His Pro Val Thr Thr Asp
245 250 255
Ile Lys His Ser Ile Lys Met Phe Glu Leu Thr Leu Asp Ala Leu Ile
260 265 270
Ser Phe Asn Lys Arg Thr Leu Val Leu Phe Pro Asn Ile Asp Ala Gly
275 280 285
Ser Lys Glu Met Val Arg Val Met Arg Lys Lys Gly Ile Glu His His
290 295 300
Pro Asn Phe Arg Ala Val Lys His Val Pro Phe Asp Gln Phe Ile Gln
305 310 315 320
Leu Val Ala His Ala Gly Cys Met Ile Gly Asn Ser Ser Cys Gly Val
325 330 335
Arg Glu Val Gly Ala Phe Gly Thr Pro Val Ile Asn Leu Gly Thr Arg
340 345 350
Gln Ile Gly Arg Glu Thr Gly Glu Asn Val Leu His Val Arg Asp Ala
355 360 365
Asp Thr Gln Asp Lys Ile Leu Gln Ala Leu His Leu Gln Phe Gly Lys
370 375 380
Gln Tyr Pro Cys Ser Lys Ile Tyr Gly Asp Gly Asn Ala Val Pro Arg
385 390 395 400
Ile Leu Lys Phe Leu Lys Ser Ile Asp Leu Gln Glu Pro Leu Gln Lys
405 410 415
Lys Phe Cys Phe Pro Pro Val Lys Glu Asn Ile Ser Gln Asp Ile Asp
420 425 430
His Ile Leu Glu Thr Leu Ser Ala Leu Ala Val Asp Leu Gly Gly Thr
435 440 445
Asn Leu Arg Val Ala Ile Val Ser Met Lys Gly Glu Ile Val Lys Lys
450 455 460
Tyr Thr Gln Phe Asn Pro Lys Thr Tyr Glu Glu Arg Ile Asn Leu Ile
465 470 475 480
Leu Gln Met Cys Val Glu Ala Ala Ala Glu Ala Val Lys Leu Asn Cys
485 490 495
Arg Ile Leu Gly Val Gly Ile Ser Thr Gly Gly Arg Val Asn Pro Arg
500 505 510
Glu Gly Ile Val Leu His Ser Thr Lys Leu Ile Gln Glu Trp Asn Ser
515 520 525
Val Asp Leu Arg Thr Pro Leu Ser Asp Thr Leu His Leu Pro Val Trp
530 535 540
Val Asp Asn Asp Gly Asn Cys Ala Ala Leu Ala Glu Arg Lys Phe Gly
545 550 555 560
Gln Gly Lys Gly Leu Glu Asn Phe Val Thr Leu Ile Thr Gly Thr Gly
565 570 575
Ile Gly Gly Gly Ile Ile His Gln His Glu Leu Ile His Gly Ser Ser
580 585 590
Phe Cys Ala Ala Glu Leu Gly His Leu Val Val Ser Leu Asp Gly Pro
595 600 605
Asp Cys Ser Cys Gly Ser His Gly Cys Ile Glu Ala Tyr Ala Ser Gly
610 615 620
Met Ala Leu Gln Arg Glu Ala Lys Lys Leu His Asp Glu Asp Leu Leu
625 630 635 640
Leu Val Glu Gly Met Ser Val Pro Lys Asp Glu Ala Val Gly Ala Leu
645 650 655
His Leu Ile Gln Ala Ala Lys Leu Gly Asn Ala Lys Ala Gln Ser Ile
660 665 670
Leu Arg Thr Ala Gly Thr Ala Leu Gly Leu Gly Val Val Asn Ile Leu
675 680 685
His Thr Met Asn Pro Ser Leu Val Ile Leu Ser Gly Val Leu Ala Ser
690 695 700
His Tyr Ile His Ile Val Lys Asp Val Ile Arg Gln Gln Ala Leu Ser
705 710 715 720
Ser Val Gln Asp Val Asp Val Val Val Ser Asp Leu Val Asp Pro Ala
725 730 735
Leu Leu Gly Ala Ala Ser Met Val Leu Asp Tyr Thr Thr Arg Arg Ile
740 745 750
Tyr
<210> 3
<211> 407
<212> DNA
<213> 智人
<400> 3
ctcgttacat aacttacggt aaatggcccg cctggctgac cgcccaacga cccccgccca 60
ttgacgtcaa taatgacgta tgttcccata gtaacgccaa tagggacttt ccattgacgt 120
caatgggtgg agtatttacg gtaaactgcc cacttggcag tacatcaagt gtatcatatg 180
ccaagtacgc cccctattga cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag 240
tacatgacct tatgggactt tcctacttgg cagtacatct acgtattagt catcgctatt 300
accatggtga tgcggttttg gcagtacatc aatgggcgtg gatagcggtt tgactcacgg 360
ggatttccaa gtctccaccc cattgacgtc aatgggagtt tgttttg 407
<210> 4
<211> 564
<212> DNA
<213> 智人
<400> 4
cagccactat gggtctaggc tgcccatgta aggaggcaag gcctggggac acccgagatg 60
cctggttata attaacccag acatgtggct gctccccccc cccaacacct gctgcctgag 120
cctcaccccc accccggtgc ctgggtctta ggctctgtac accatggagg agaagctcgc 180
tctaaaaata accctgtccc tggtgggctg tgggggactg agggcaggct gtaacaggct 240
tgggggccag ggcttatacg tgcctgggac tcccaaagta ttactgttcc atgttcccgg 300
cgaagggcca gctgtccccc gccagctaga ctcagcactt agtttaggaa ccagtgagca 360
agtcagccct tggggcagcc catacaaggc catggggctg ggcaagctgc acgcctgggt 420
ccggggtggg cacggtgccc gggcaacgag ctgaaagctc atctgctctc aggggcccct 480
ccctggggac agcccctcct ggctagtcac accctgtagg ctcctctata taacccaggg 540
gcacaggggc tgcccccggg tcac 564
<210> 5
<211> 810
<212> DNA
<213> 智人
<400> 5
gtttaaacaa gcttgcatgt ctaagctaga cccttcagat taaaaataac tgaggtaagg 60
gcctgggtag gggaggtggt gtgagacgct cctgtctctc ctctatctgc ccatcggccc 120
tttggggagg aggaatgtgc ccaaggacta aaaaaaggcc atggagccag aggggcgagg 180
gcaacagacc tttcatgggc aaaccttggg gccctgctgt ctagcatgcc ccactacggg 240
tctaggctgc ccatgtaagg aggcaaggcc tggggacacc cgagatgcct ggttataatt 300
aacccagaca tgtggctgcc cccccccccc caacacctgc tgcctctaaa aataaccctg 360
tccctggtgg atcccctgca tgcgaagatc ttcgaacaag gctgtggggg actgagggca 420
ggctgtaaca ggcttggggg ccagggctta tacgtgcctg ggactcccaa agtattactg 480
ttccatgttc ccggcgaagg gccagctgtc ccccgccagc tagactcagc acttagttta 540
ggaaccagtg agcaagtcag cccttggggc agcccataca aggccatggg gctgggcaag 600
ctgcacgcct gggtccgggg tgggcacggt gcccgggcaa cgagctgaaa gctcatctgc 660
tctcaggggc ccctccctgg ggacagcccc tcctggctag tcacaccctg taggctcctc 720
tatataaccc aggggcacag gggctgccct cattctacca ccacctccac agcacagaca 780
gacactcagg agccagccag cggcgcgccc 810
<210> 6
<211> 707
<212> DNA
<213> 智人
<400> 6
gcttgaggcc aggagctcga gtgctgcctg gacaacatag tgagaccctt gtctcaaaaa 60
caacagcaac ccaaagtctt atttatcttc aggagctgcg caagcccttt accaccgcca 120
cgtttctccc tggatgtccc taggcctcgg gactggctgg gagttccctg tagtggaggc 180
cgccgctgaa ctgattataa agatgagaga ggctctgcca tgccttggtc atcaattcac 240
actccaccag tgtcttctag cagtcacggc aagggttaac gtcagggacc gctgtggggt 300
ggccgcgcta cacgacagta tagttgcggt cctggtttat gaaataactg agggaacaag 360
aggcgcaaga aatccctcct tgggtgcaag accaaaacaa ctacccagcg ggaagactcg 420
ggcttcagtg cgtgtgtcgc cagtggagga ggacgcttcg gggcgggagc acaagctggc 480
aggacagccc cgcagcagct ccagcgcggc agaggccatg gaagatggtc cgctggtcag 540
caccctgcct gcgcctcaaa ataccgccgg gaaggtgggg gacggggacg ggagcagcca 600
atcacgcgag ctctctcggg tggcgtcagg gcgcgatcgc ggattcggca ctccgggtgg 660
gcgtggctgg gcgagcgagg agtggggaca aggtcgagcg acgagtc 707
<210> 7
<211> 228
<212> DNA
<213> 智人
<400> 7
tcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccggactc 60
acggggattt ccaagtctcc accccattga cgtcaatggg agtttgtttt ggcaccaaaa 120
tcaacgggac tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag 180
gcgtgtacgg tgggaggtct atataagcag agctcgttta gtgaaccg 228
<210> 8
<211> 119
<212> DNA
<213> 智人
<400> 8
ccttctgatg gtgaatggga actcccttcc tcctgcagca gcctgcctgc agctgtcctg 60
gtagaacagt gtggacattg cagaagctgt cactgcccca gaaagaaagc accccagag 119
<210> 9
<211> 1032
<212> DNA
<213> 智人
<400> 9
atggtccgcg cgaggcacca gccgggtggg ctttgcctcc tgctgctgct gctctgccag 60
ttcatggagg accgcagtgc ccaggctggg aactgctggc tccgtcaagc gaagaacggc 120
cgctgccagg tcctgtacaa gaccgaactg agcaaggagg agtgctgcag caccggccgg 180
ctgagcacct cgtggaccga ggaggacgtg aatgacaaca cactcttcaa gtggatgatt 240
ttcaacgggg gcgcccccaa ctgcatcccc tgtaaagaaa cgtgtgagaa cgtggactgt 300
ggacctggga aaaaatgccg aatgaacaag aagaacaaac cccgctgcgt ctgcgccccg 360
gattgttcca acatcacctg gaagggtcca gtctgcgggc tggatgggaa aacctaccgc 420
aatgaatgtg cactcctaaa ggcaagatgt aaagagcagc cagaactgga agtccagtac 480
caaggcagat gtaaaaagac ttgtcgggat gttttctgtc caggcagctc cacatgtgtg 540
gtggaccaga ccaataatgc ctactgtgtg acctgtaatc ggatttgccc agagcctgct 600
tcctctgagc aatatctctg tgggaatgat ggagtcacct actccagtgc ctgccacctg 660
agaaaggcta cctgcctgct gggcagatct attggattag cctatgaggg aaagtgtatc 720
aaagcaaagt cctgtgaaga tatccagtgc actggtggga aaaaatgttt atgggatttc 780
aaggttggga gaggccggtg ttccctctgt gatgagctgt gccctgacag taagtcggat 840
gagcctgtct gtgccagtga caatgccact tatgccagcg agtgtgccat gaaggaagct 900
gcctgctcct caggtgtgct actggaagta aagcactccg gatcttgcaa ctccatttcg 960
gaagacaccg aggaagagga ggaagatgaa gaccaggact acagctttcc tatatcttct 1020
attctagagt gg 1032
<210> 10
<211> 344
<212> PRT
<213> 智人
<400> 10
Met Val Arg Ala Arg His Gln Pro Gly Gly Leu Cys Leu Leu Leu Leu
1 5 10 15
Leu Leu Cys Gln Phe Met Glu Asp Arg Ser Ala Gln Ala Gly Asn Cys
20 25 30
Trp Leu Arg Gln Ala Lys Asn Gly Arg Cys Gln Val Leu Tyr Lys Thr
35 40 45
Glu Leu Ser Lys Glu Glu Cys Cys Ser Thr Gly Arg Leu Ser Thr Ser
50 55 60
Trp Thr Glu Glu Asp Val Asn Asp Asn Thr Leu Phe Lys Trp Met Ile
65 70 75 80
Phe Asn Gly Gly Ala Pro Asn Cys Ile Pro Cys Lys Glu Thr Cys Glu
85 90 95
Asn Val Asp Cys Gly Pro Gly Lys Lys Cys Arg Met Asn Lys Lys Asn
100 105 110
Lys Pro Arg Cys Val Cys Ala Pro Asp Cys Ser Asn Ile Thr Trp Lys
115 120 125
Gly Pro Val Cys Gly Leu Asp Gly Lys Thr Tyr Arg Asn Glu Cys Ala
130 135 140
Leu Leu Lys Ala Arg Cys Lys Glu Gln Pro Glu Leu Glu Val Gln Tyr
145 150 155 160
Gln Gly Arg Cys Lys Lys Thr Cys Arg Asp Val Phe Cys Pro Gly Ser
165 170 175
Ser Thr Cys Val Val Asp Gln Thr Asn Asn Ala Tyr Cys Val Thr Cys
180 185 190
Asn Arg Ile Cys Pro Glu Pro Ala Ser Ser Glu Gln Tyr Leu Cys Gly
195 200 205
Asn Asp Gly Val Thr Tyr Ser Ser Ala Cys His Leu Arg Lys Ala Thr
210 215 220
Cys Leu Leu Gly Arg Ser Ile Gly Leu Ala Tyr Glu Gly Lys Cys Ile
225 230 235 240
Lys Ala Lys Ser Cys Glu Asp Ile Gln Cys Thr Gly Gly Lys Lys Cys
245 250 255
Leu Trp Asp Phe Lys Val Gly Arg Gly Arg Cys Ser Leu Cys Asp Glu
260 265 270
Leu Cys Pro Asp Ser Lys Ser Asp Glu Pro Val Cys Ala Ser Asp Asn
275 280 285
Ala Thr Tyr Ala Ser Glu Cys Ala Met Lys Glu Ala Ala Cys Ser Ser
290 295 300
Gly Val Leu Leu Glu Val Lys His Ser Gly Ser Cys Asn Ser Ile Ser
305 310 315 320
Glu Asp Thr Glu Glu Glu Glu Glu Asp Glu Asp Gln Asp Tyr Ser Phe
325 330 335
Pro Ile Ser Ser Ile Leu Glu Trp
340
<210> 11
<211> 534
<212> DNA
<213> 智人
<400> 11
gaagctgctg ccgtcggtgg tgctgaagct ctttctggct gcagttctct cggcactggt 60
gactggcgag agcctggagc ggcttcggag agggctagct gctggaacca gcaacccgga 120
ccctcccact gtatccacgg accagctgct acccctagga ggcggccggg accggaaagt 180
ccgtgacttg caagaggcag atctggacct tttgagagtc actttatcct ccaagccaca 240
agcactggcc acaccaaaca aggaggagca cgggaaaaga aagaagaaag gcaaggggct 300
agggaagaag agggacccag gaccggagac gctctgcggg gctgagctgg tggatgctct 360
tcagttcgtg tgtggagaca ggggctttta tttcaacaag cccacagggt atggctccag 420
cagtcggagg gcgcctcaga caggcatcgt ggatgagtgc tgcttccgga gctgtgatct 480
aaggaggctg gagatgtatt gcgcacccct caagcctgcc aagtcagctt aggc 534
<210> 12
<211> 7277
<212> DNA
<213> 智人
<400> 12
acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg 60
aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact 120
cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga gcggatacat 180
atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc cccgaaaagt 240
gccacctgac gtctaagaaa ccattattat catgacatta acctataaaa ataggcgtat 300
cacgaggccc tttcgtctcg cgcgtttcgg tgatgacggt gaaaacctct gacacatgca 360
gctcccggag acggtcacag cttgtctgta agcggatgcc gggagcagac aagcccgtca 420
gggcgcgtca gcgtgtgttg gcgggtgtcg gggctggctt aactatgcgg catcagagca 480
gattgtactg agagtgcacc atatgcggtg tgaaataccg cacagatgcg taaggagaaa 540
ataccgcatc aggcgattcc aacatccaat aaatcataca ggcaaggcaa agaattagca 600
aaattaagca ataaagcctc agagcataaa gctaaatcgg ttgtaccaaa aacattatga 660
ccctgtaata cttttgcggg agaagccttt atttcaacgc aaggataaaa atttttagaa 720
ccctcatata ttttaaatgc aatgcctgag taatgtgtag gtaaagattc aaacgggtga 780
gaaaggccgg agacagtcaa atcaccatca atatgatatt caaccgttct agctgataaa 840
ttcatgccgg agagggtagc tatttttgag aggtctctac aaaggctatc aggtcattgc 900
ctgagagtct ggagcaaaca agagaatcga tgaacggtaa tcgtaaaact agcatgtcaa 960
tcatatgtac cccggttgat aatcagaaaa gccccaaaaa caggaagatt gtataagcaa 1020
atatttaaat tgtaagcgtt aatattttgt taaaattcgc gttaaatttt tgttaaatca 1080
gctcattttt taaccaatag gccgaaatcg gcaaaatccc ttataaatca aaagaataga 1140
ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 1200
actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 1260
caccctaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 1320
ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 1380
agaaagcgaa aggagcgggc gctagggcgc tggcaagtgt agcggtcacg ctgcgcgtaa 1440
ccaccacacc cgccgcgctt aatgcgccgc tacagggcgc gtactatggt tgctttgacg 1500
agcacgtata acgtgctttc ctcgttagaa tcagagcggg agctaaacag gaggccgatt 1560
aaagggattt tagacaggaa cggtacgcca gaatcctgag aagtgttttt ataatcagtg 1620
aggccaccga gtaaaagagt ctgtccatca cgcaaattaa ccgttgtcgc aatacttctt 1680
tgattagtaa taacatcact tgcctgagta gaagaactca aactatcggc cttgctggta 1740
atatccagaa caatattacc gccagccatt gcaacggaat cgccattcgc cattcaggct 1800
gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctgcgcgc 1860
tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt cgggcgacct ttggtcgccc 1920
ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aactccatca ctaggggttc 1980
cttgtagtta atgattaacc cgccatgcta cttatctacg tagccatgct ctaggtcgtt 2040
acataactta cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg 2100
tcaataatga cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg 2160
gtggagtatt tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt 2220
acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg 2280
accttatggg actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg 2340
gtgatgcggt tttggcagta catcaatggg cgtggatagc ggtttgactc acggggattt 2400
ccaagtctcc accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac 2460
tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg 2520
tgggaggtct atataagcag agctcgttta gtgaaccgtc agatcgcctg gagacgccat 2580
ccacgctgtt ttgacctcca tagaagacac cgggaccgat ccagcctccg gactctagag 2640
gatccggtac tcgaggaact gaaaaaccag aaagttaact ggtaagttta gtctttttgt 2700
cttttatttc aggtcccgga tccggtggtg gtgcaaatca aagaactgct cctcagtgga 2760
tgttgccttt acttctaggc ctgtacggaa gtgttacttc tgctctaaaa gctgcggaat 2820
tgtacccgcg gccggctagc cgccaccatg gagaagaatg gaaataaccg aaagctgcgg 2880
gtttgtgttg ctacttgtaa ccgtgcagat tattctaaac ttgccccgat catgtttggc 2940
attaaaaccg aacctgagtt ctttgaactt gatgttgtgg tacttggctc tcacctgata 3000
gatgactatg gaaatacata tcgaatgatt gaacaagatg actttgacat taacaccagg 3060
ctacacacaa ttgtgagggg agaagatgag gcagccatgg tggagtcagt aggcctggcc 3120
ctagtgaagc tgccagatgt ccttaatcgc ctgaagcctg atatcatgat tgttcatgga 3180
gacaggtttg atgccctggc tctggccaca tctgctgcct tgatgaacat ccgaatcctt 3240
cacattgaag gtggggaagt cagtgggacc attgatgact ctatcagaca tgccataaca 3300
aaactggctc attatcatgt gtgctgcacc cgcagtgcag agcagcacct gatatccatg 3360
tgtgaggacc atgatcgcat ccttttggca ggctgccctt cctatgacaa acttctctca 3420
gccaagaaca aagactacat gagcatcatt cgcatgtggc taggtgatga tgtaaaatct 3480
aaagattaca ttgttgcact acagcaccct gtgaccactg acattaagca ttccataaaa 3540
atgtttgaat taacattgga tgcacttatc tcatttaaca agcggaccct agtcctgttt 3600
ccaaatattg acgcagggag caaagagatg gttcgagtga tgcggaagaa gggcattgag 3660
catcatccca actttcgtgc agttaaacac gtcccatttg accagtttat acagttggtt 3720
gcccatgctg gctgtatgat tgggaacagc agctgtgggg ttcgagaagt tggagctttt 3780
ggaacacctg tgatcaacct gggaacacgt cagattggaa gagaaacagg ggagaatgtt 3840
cttcatgtcc gggatgctga cacccaagac aaaatattgc aagcactgca ccttcagttt 3900
ggtaaacagt acccttgttc aaagatatat ggggatggaa atgctgttcc aaggattttg 3960
aagtttctca aatctatcga tcttcaagag ccactgcaaa agaaattctg ctttcctcct 4020
gtgaaggaga atatctctca agatattgac catattcttg aaactctaag tgccttggcc 4080
gttgatcttg gcgggacgaa cctccgagtt gcaatagtca gcatgaaggg tgaaatagtt 4140
aagaagtata ctcagttcaa tcctaaaacc tatgaagaga ggattaattt aatcctacag 4200
atgtgtgtgg aagctgcagc agaagctgta aaactgaact gcagaatttt gggagtaggc 4260
atttccacag gtggccgtgt aaatcctcgg gaaggaattg tgctgcattc aaccaaactg 4320
atccaagagt ggaactctgt ggaccttagg accccccttt ctgacacttt gcatctccct 4380
gtgtgggtag acaatgatgg caactgtgct gccctggcgg aaaggaaatt tggccaagga 4440
aagggactgg aaaactttgt tacacttatc acaggcacag gaatcggtgg tggaattatc 4500
catcagcatg aattgatcca cggaagctcc ttctgtgctg cagaactggg ccaccttgtt 4560
gtgtctctgg atgggcctga ttgttcctgt ggaagccatg ggtgcattga agcatacgcc 4620
tctggaatgg ccttgcagag ggaggcaaaa aagctccatg atgaggacct gctcttggtg 4680
gaagggatgt cagtgccaaa agatgaggct gtgggtgcgc tccatctcat ccaagctgcg 4740
aaacttggca atgcgaaggc ccagagcatc ctaagaacag ctggaacagc tttgggtctt 4800
ggggttgtga acatcctcca taccatgaat ccctcccttg tgatcctctc cggagtcctg 4860
gccagtcact atatccacat tgtcaaagac gtcattcgcc agcaggcctt gtcctccgtg 4920
caggacgtgg atgtggtggt ttcggatttg gttgaccccg ccctgctggg tgctgccagc 4980
atggttctgg actacacaac acgcaggatc tactagcatg cactagtgcg gccgcgggga 5040
tccagacatg ataagataca ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa 5100
aaaatgcttt atttgtgaaa tttgtgatgc tattgcttta tttgtaacca ttataagctg 5160
caataaacaa gttaacaaca acaattgcat tcattttatg tttcaggttc agggggaggt 5220
gtgggaggtt ttttcggatc ctctagagtc gaaaactcta gagcatggct acgtagataa 5280
gtagcatggc gggttaatca ttaactacaa ggaaccccta gtgatggagt tggccactcc 5340
ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg 5400
ctttgcccgg gcggcctcag tgagcgagcg agcgcgcagc tgcattaatg aatcggccaa 5460
cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg 5520
ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg 5580
ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag 5640
gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac 5700
gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga 5760
taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt 5820
accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc 5880
tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc 5940
cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta 6000
agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat 6060
gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca 6120
gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct 6180
tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt 6240
acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct 6300
cagtggaacg aaaactcacg ttaagggatt ttggtcatga acaataaaac tgtctgctta 6360
cataaacagt aatacaaggg gtgttatgag ccatattcaa cgggaaacgt cttgctctag 6420
gccgcgatta aattccaaca tggatgctga tttatatggg tataaatggg ctcgcgataa 6480
tgtcgggcaa tcaggtgcga caatctatcg attgtatggg aagcccgatg cgccagagtt 6540
gtttctgaaa catggcaaag gtagcgttgc caatgatgtt acagatgaga tggtcagact 6600
aaactggctg acggaattta tgcctcttcc gaccatcaag cattttatcc gtactcctga 6660
tgatgcatgg ttactcacca ctgcgatccc cgggaaaaca gcattccagg tattagaaga 6720
atatcctgat tcaggtgaaa atattgttga tgcgctggca gtgttcctgc gccggttgca 6780
ttcgattcct gtttgtaatt gtccttttaa cagcgatcgc gtatttcgtc tcgctcaggc 6840
gcaatcacga atgaataacg gtttggttga tgcgagtgat tttgatgacg agcgtaatgg 6900
ctggcctgtt gaacaagtct ggaaagaaat gcataaactt ttgccattct caccggattc 6960
agtcgtcact catggtgatt tctcacttga taaccttatt tttgacgagg ggaaattaat 7020
aggttgtatt gatgttggac gagtcggaat cgcagaccga taccaggatc ttgccatcct 7080
atggaactgc ctcggtgagt tttctccttc attacagaaa cggctttttc aaaaatatgg 7140
tattgataat cctgatatga ataaattgca gtttcatttg atgctcgatg agtttttcta 7200
agaattcgtt cttcggggcg aaaactctca aggatcttac cgctgttgag atccagttcg 7260
atgtaaccca ctcgtgc 7277
<210> 13
<211> 7070
<212> DNA
<213> 智人
<400> 13
tgaagatcag ttgggtgcac gagtgggtta catcgaactg gatctcaaca gcggtaagat 60
ccttgagagt tttcgccccg aagaacgaat tcttagaaaa actcatcgag catcaaatga 120
aactgcaatt tattcatatc aggattatca ataccatatt tttgaaaaag ccgtttctgt 180
aatgaaggag aaaactcacc gaggcagttc cataggatgg caagatcctg gtatcggtct 240
gcgattccga ctcgtccaac atcaatacaa cctattaatt tcccctcgtc aaaaataagg 300
ttatcaagtg agaaatcacc atgagtgacg actgaatccg gtgagaatgg caaaagttta 360
tgcatttctt tccagacttg ttcaacaggc cagccattac gctcgtcatc aaaatcactc 420
gcatcaacca aaccgttatt cattcgtgat tgcgcctgag cgagacgaaa tacgcgatcg 480
ctgttaaaag gacaattaca aacaggaatc gaatgcaacc ggcgcaggaa cactgccagc 540
gcatcaacaa tattttcacc tgaatcagga tattcttcta atacctggaa tgctgttttc 600
ccggggatcg cagtggtgag taaccatgca tcatcaggag tacggataaa atgcttgatg 660
gtcggaagag gcataaattc cgtcagccag tttagtctga ccatctcatc tgtaacatca 720
ttggcaacgc tacctttgcc atgtttcaga aacaactctg gcgcatcggg cttcccatac 780
aatcgataga ttgtcgcacc tgattgcccg acattatcgc gagcccattt atacccatat 840
aaatcagcat ccatgttgga atttaatcgc ggcctagagc aagacgtttc ccgttgaata 900
tggctcataa caccccttgt attactgttt atgtaagcag acagttttat tgttcatgac 960
caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa 1020
aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc 1080
accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt 1140
aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg 1200
ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc 1260
agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt 1320
accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga 1380
gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct 1440
tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg 1500
cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca 1560
cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa 1620
cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt 1680
ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga 1740
taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga 1800
gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctgcgc 1860
gctcgctcgc tcactgaggc cgcccgggca aagcccgggc gtcgggcgac ctttggtcgc 1920
ccggcctcag tgagcgagcg agcgcgcaga gagggagtgg ccaactccat cactaggggt 1980
tccttgtagt taatgattaa cccgccatgc tacttatcta cgtagccatg ctctagacag 2040
ccactatggg tctaggctgc ccatgtaagg aggcaaggcc tggggacacc cgagatgcct 2100
ggttataatt aacccagaca tgtggctgct cccccccccc caacacctgc tgcctgagcc 2160
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 2220
taaaaataac cctgtccctg gtgggctgtg ggggactgag ggcaggctgt aacaggcttg 2280
ggggccaggg cttatacgtg cctgggactc ccaaagtatt actgttccat gttcccggcg 2340
aagggccagc tgtcccccgc cagctagact cagcacttag tttaggaacc agtgagcaag 2400
tcagcccttg gggcagccca tacaaggcca tggggctggg caagctgcac gcctgggtcc 2460
ggggtgggca cggtgcccgg gcaacgagct gaaagctcat ctgctctcag gggcccctcc 2520
ctggggacag cccctcctgg ctagtcacac cctgtaggct cctctatata acccaggggc 2580
acaggggctg cccccgggtc accaccacct ccacagcaca gacagacact caggagccag 2640
ccagccaggt aagtttagtc tttttgtctt ttatttcagg tcccggatcc ggtggtggtg 2700
caaatcaaag aactgctcct cagtggatgt tgcctttact tctaggcctg tacggaagtg 2760
ttacttctgc tctaaaagct gcggaattgt acccgcggcc ggctagccgc caccatggag 2820
aagaatggaa ataaccgaaa gctgcgggtt tgtgttgcta cttgtaaccg tgcagattat 2880
tctaaacttg ccccgatcat gtttggcatt aaaaccgaac ctgagttctt tgaacttgat 2940
gttgtggtac ttggctctca cctgatagat gactatggaa atacatatcg aatgattgaa 3000
caagatgact ttgacattaa caccaggcta cacacaattg tgaggggaga agatgaggca 3060
gccatggtgg agtcagtagg cctggcccta gtgaagctgc cagatgtcct taatcgcctg 3120
aagcctgata tcatgattgt tcatggagac aggtttgatg ccctggctct ggccacatct 3180
gctgccttga tgaacatccg aatccttcac attgaaggtg gggaagtcag tgggaccatt 3240
gatgactcta tcagacatgc cataacaaaa ctggctcatt atcatgtgtg ctgcacccgc 3300
agtgcagagc agcacctgat atccatgtgt gaggaccatg atcgcatcct tttggcaggc 3360
tgcccttcct atgacaaact tctctcagcc aagaacaaag actacatgag catcattcgc 3420
atgtggctag gtgatgatgt aaaatctaaa gattacattg ttgcactaca gcaccctgtg 3480
accactgaca ttaagcattc cataaaaatg tttgaattaa cattggatgc acttatctca 3540
tttaacaagc ggaccctagt cctgtttcca aatattgacg cagggagcaa agagatggtt 3600
cgagtgatgc ggaagaaggg cattgagcat catcccaact ttcgtgcagt taaacacgtc 3660
ccatttgacc agtttataca gttggttgcc catgctggct gtatgattgg gaacagcagc 3720
tgtggggttc gagaagttgg agcttttgga acacctgtga tcaacctggg aacacgtcag 3780
attggaagag aaacagggga gaatgttctt catgtccggg atgctgacac ccaagacaaa 3840
atattgcaag cactgcacct tcagtttggt aaacagtacc cttgttcaaa gatatatggg 3900
gatggaaatg ctgttccaag gattttgaag tttctcaaat ctatcgatct tcaagagcca 3960
ctgcaaaaga aattctgctt tcctcctgtg aaggagaata tctctcaaga tattgaccat 4020
attcttgaaa ctctaagtgc cttggccgtt gatcttggcg ggacgaacct ccgagttgca 4080
atagtcagca tgaagggtga aatagttaag aagtatactc agttcaatcc taaaacctat 4140
gaagagagga ttaatttaat cctacagatg tgtgtggaag ctgcagcaga agctgtaaaa 4200
ctgaactgca gaattttggg agtaggcatt tccacaggtg gccgtgtaaa tcctcgggaa 4260
ggaattgtgc tgcattcaac caaactgatc caagagtgga actctgtgga ccttaggacc 4320
cccctttctg acactttgca tctccctgtg tgggtagaca atgatggcaa ctgtgctgcc 4380
ctggcggaaa ggaaatttgg ccaaggaaag ggactggaaa actttgttac acttatcaca 4440
ggcacaggaa tcggtggtgg aattatccat cagcatgaat tgatccacgg aagctccttc 4500
tgtgctgcag aactgggcca ccttgttgtg tctctggatg ggcctgattg ttcctgtgga 4560
agccatgggt gcattgaagc atacgcctct ggaatggcct tgcagaggga ggcaaaaaag 4620
ctccatgatg aggacctgct cttggtggaa gggatgtcag tgccaaaaga tgaggctgtg 4680
ggtgcgctcc atctcatcca agctgcgaaa cttggcaatg cgaaggccca gagcatccta 4740
agaacagctg gaacagcttt gggtcttggg gttgtgaaca tcctccatac catgaatccc 4800
tcccttgtga tcctctccgg agtcctggcc agtcactata tccacattgt caaagacgtc 4860
attcgccagc aggccttgtc ctccgtgcag gacgtggatg tggtggtttc ggatttggtt 4920
gaccccgccc tgctgggtgc tgccagcatg gttctggact acacaacacg caggatctac 4980
tagcatgcac tagtgcggcc gcaataaaag atctttattt tcattagatc tgtgtgttgg 5040
ttttttgtgt gtctagagca tggctacgta gataagtagc atggcgggtt aatcattaac 5100
tacaaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg ctcgctcact 5160
gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg cccgggcggc ctcagtgagc 5220
gagcgagcgc gcagctggcg taatagcgaa gaggcccgca ccgatcgccc ttcccaacag 5280
ttgcgcagcc tgaatggcga atggcgattc cgttgcaatg gctggcggta atattgttct 5340
ggatattacc agcaaggccg atagtttgag ttcttctact caggcaagtg atgttattac 5400
taatcaaaga agtattgcga caacggttaa tttgcgtgat ggacagactc ttttactcgg 5460
tggcctcact gattataaaa acacttctca ggattctggc gtaccgttcc tgtctaaaat 5520
ccctttaatc ggcctcctgt ttagctcccg ctctgattct aacgaggaaa gcacgttata 5580
cgtgctcgtc aaagcaacca tagtacgcgc cctgtagcgg cgcattaagc gcggcgggtg 5640
tggtggttac gcgcagcgtg accgctacac ttgccagcgc cctagcgccc gctcctttcg 5700
ctttcttccc ttcctttctc gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg 5760
ggctcccttt agggttccga tttagtgctt tacggcacct cgaccccaaa aaacttgatt 5820
agggtgatgg ttcacgtagt gggccatcgc cctgatagac ggtttttcgc cctttgacgt 5880
tggagtccac gttctttaat agtggactct tgttccaaac tggaacaaca ctcaacccta 5940
tctcggtcta ttcttttgat ttataaggga ttttgccgat ttcggcctat tggttaaaaa 6000
atgagctgat ttaacaaaaa tttaacgcga attttaacaa aatattaacg cttacaattt 6060
aaatatttgc ttatacaatc ttcctgtttt tggggctttt ctgattatca accggggtac 6120
atatgattga catgctagtt ttacgattac cgttcatcga ttctcttgtt tgctccagac 6180
tctcaggcaa tgacctgata gcctttgtag agacctctca aaaatagcta ccctctccgg 6240
catgaattta tcagctagaa cggttgaata tcatattgat ggtgatttga ctgtctccgg 6300
cctttctcac ccgtttgaat ctttacctac acattactca ggcattgcat ttaaaatata 6360
tgagggttct aaaaattttt atccttgcgt tgaaataaag gcttctcccg caaaagtatt 6420
acagggtcat aatgtttttg gtacaaccga tttagcttta tgctctgagg ctttattgct 6480
taattttgct aattctttgc cttgcctgta tgatttattg gatgttggaa tcgcctgatg 6540
cggtattttc tccttacgca tctgtgcggt atttcacacc gcatatggtg cactctcagt 6600
acaatctgct ctgatgccgc atagttaagc cagccccgac acccgccaac acccgctgac 6660
gcgccctgac gggcttgtct gctcccggca tccgcttaca gacaagctgt gaccgtctcc 6720
gggagctgca tgtgtcagag gttttcaccg tcatcaccga aacgcgcgag acgaaagggc 6780
ctcgtgatac gcctattttt ataggttaat gtcatgataa taatggtttc ttagacgtca 6840
ggtggcactt ttcggggaaa tgtgcgcgga acccctattt gtttattttt ctaaatacat 6900
tcaaatatgt atccgctcat gagacaataa ccctgataaa tgcttcaata atattgaaaa 6960
aggaagagta tgagtattca acatttccgt gtcgccctta ttcccttttt tgcggcattt 7020
tgccttcctg tttttgctca cccagaaacg ctggtgaaag taaaagatgc 7070
<210> 14
<211> 7270
<212> DNA
<213> 智人
<400> 14
gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag 60
ttttcgcccc gaagaacgaa ttcttagaaa aactcatcga gcatcaaatg aaactgcaat 120
ttattcatat caggattatc aataccatat ttttgaaaaa gccgtttctg taatgaagga 180
gaaaactcac cgaggcagtt ccataggatg gcaagatcct ggtatcggtc tgcgattccg 240
actcgtccaa catcaataca acctattaat ttcccctcgt caaaaataag gttatcaagt 300
gagaaatcac catgagtgac gactgaatcc ggtgagaatg gcaaaagttt atgcatttct 360
ttccagactt gttcaacagg ccagccatta cgctcgtcat caaaatcact cgcatcaacc 420
aaaccgttat tcattcgtga ttgcgcctga gcgagacgaa atacgcgatc gctgttaaaa 480
ggacaattac aaacaggaat cgaatgcaac cggcgcagga acactgccag cgcatcaaca 540
atattttcac ctgaatcagg atattcttct aatacctgga atgctgtttt cccggggatc 600
gcagtggtga gtaaccatgc atcatcagga gtacggataa aatgcttgat ggtcggaaga 660
ggcataaatt ccgtcagcca gtttagtctg accatctcat ctgtaacatc attggcaacg 720
ctacctttgc catgtttcag aaacaactct ggcgcatcgg gcttcccata caatcgatag 780
attgtcgcac ctgattgccc gacattatcg cgagcccatt tatacccata taaatcagca 840
tccatgttgg aatttaatcg cggcctagag caagacgttt cccgttgaat atggctcata 900
acaccccttg tattactgtt tatgtaagca gacagtttta ttgttcatga ccaaaatccc 960
ttaacgtgag ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc 1020
ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc 1080
agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt 1140
cagcagagcg cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt 1200
caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc 1260
tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa 1320
ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac 1380
ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg 1440
gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga 1500
gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact 1560
tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa 1620
cgcggccttt ttacggttcc tggccttttg ctggcctttt gctcacatgt tctttcctgc 1680
gttatcccct gattctgtgg ataaccgtat taccgccttt gagtgagctg ataccgctcg 1740
ccgcagccga acgaccgagc gcagcgagtc agtgagcgag gaagcggaag agcgcccaat 1800
acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctgcg cgctcgctcg 1860
ctcactgagg ccgcccgggc aaagcccggg cgtcgggcga cctttggtcg cccggcctca 1920
gtgagcgagc gagcgcgcag agagggagtg gccaactcca tcactagggg ttccttgtag 1980
ttaatgatta acccgccatg ctacttatct acgtagccat gctctagagt ttaaacaagc 2040
ttgcatgtct aagctagacc cttcagatta aaaataactg aggtaagggc ctgggtaggg 2100
gaggtggtgt gagacgctcc tgtctctcct ctatctgccc atcggccctt tggggaggag 2160
gaatgtgccc aaggactaaa aaaaggccat ggagccagag gggcgagggc aacagacctt 2220
tcatgggcaa accttggggc cctgctgtct agcatgcccc actacgggtc taggctgccc 2280
atgtaaggag gcaaggcctg gggacacccg agatgcctgg ttataattaa cccagacatg 2340
tggctgcccc ccccccccca acacctgctg cctctaaaaa taaccctgtc cctggtggat 2400
cccctgcatg cgaagatctt cgaacaaggc tgtgggggac tgagggcagg ctgtaacagg 2460
cttgggggcc agggcttata cgtgcctggg actcccaaag tattactgtt ccatgttccc 2520
ggcgaagggc cagctgtccc ccgccagcta gactcagcac ttagtttagg aaccagtgag 2580
caagtcagcc cttggggcag cccatacaag gccatggggc tgggcaagct gcacgcctgg 2640
gtccggggtg ggcacggtgc ccgggcaacg agctgaaagc tcatctgctc tcaggggccc 2700
ctccctgggg acagcccctc ctggctagtc acaccctgta ggctcctcta tataacccag 2760
gggcacaggg gctgccctca ttctaccacc acctccacag cacagacaga cactcaggag 2820
cagccagcgg cgcgcccagg taagtttagt ctttttgtct tttatttcag gtcccggatc 2880
cggtggtggt gcaaatcaaa gaactgctcc tcagtggatg ttgcctttac ttctaggcct 2940
gtacggaagt gttacttctg ctctaaaagc tgcggaattg tacccgcggc cggctagccg 3000
ccaccatgga gaagaatgga aataaccgaa agctgcgggt ttgtgttgct acttgtaacc 3060
gtgcagatta ttctaaactt gccccgatca tgtttggcat taaaaccgaa cctgagttct 3120
ttgaacttga tgttgtggta cttggctctc acctgataga tgactatgga aatacatatc 3180
gaatgattga acaagatgac tttgacatta acaccaggct acacacaatt gtgaggggag 3240
aagatgaggc agccatggtg gagtcagtag gcctggccct agtgaagctg ccagatgtcc 3300
ttaatcgcct gaagcctgat atcatgattg ttcatggaga caggtttgat gccctggctc 3360
tggccacatc tgctgccttg atgaacatcc gaatccttca cattgaaggt ggggaagtca 3420
gtgggaccat tgatgactct atcagacatg ccataacaaa actggctcat tatcatgtgt 3480
gctgcacccg cagtgcagag cagcacctga tatccatgtg tgaggaccat gatcgcatcc 3540
ttttggcagg ctgcccttcc tatgacaaac ttctctcagc caagaacaaa gactacatga 3600
gcatcattcg catgtggcta ggtgatgatg taaaatctaa agattacatt gttgcactac 3660
agcaccctgt gaccactgac attaagcatt ccataaaaat gtttgaatta acattggatg 3720
cacttatctc atttaacaag cggaccctag tcctgtttcc aaatattgac gcagggagca 3780
aagagatggt tcgagtgatg cggaagaagg gcattgagca tcatcccaac tttcgtgcag 3840
ttaaacacgt cccatttgac cagtttatac agttggttgc ccatgctggc tgtatgattg 3900
ggaacagcag ctgtggggtt cgagaagttg gagcttttgg aacacctgtg atcaacctgg 3960
gaacacgtca gattggaaga gaaacagggg agaatgttct tcatgtccgg gatgctgaca 4020
cccaagacaa aatattgcaa gcactgcacc ttcagtttgg taaacagtac ccttgttcaa 4080
agatatatgg ggatggaaat gctgttccaa ggattttgaa gtttctcaaa tctatcgatc 4140
ttcaagagcc actgcaaaag aaattctgct ttcctcctgt gaaggagaat atctctcaag 4200
atattgacca tattcttgaa actctaagtg ccttggccgt tgatcttggc gggacgaacc 4260
tccgagttgc aatagtcagc atgaagggtg aaatagttaa gaagtatact cagttcaatc 4320
ctaaaaccta tgaagagagg attaatttaa tcctacagat gtgtgtggaa gctgcagcag 4380
aagctgtaaa actgaactgc agaattttgg gagtaggcat ttccacaggt ggccgtgtaa 4440
atcctcggga aggaattgtg ctgcattcaa ccaaactgat ccaagagtgg aactctgtgg 4500
accttaggac ccccctttct gacactttgc atctccctgt gtgggtagac aatgatggca 4560
actgtgctgc cctggcggaa aggaaatttg gccaaggaaa gggactggaa aactttgtta 4620
cacttatcac aggcacagga atcggtggtg gaattatcca tcagcatgaa ttgatccacg 4680
gaagctcctt ctgtgctgca gaactgggcc accttgttgt gtctctggat gggcctgatt 4740
gttcctgtgg aagccatggg tgcattgaag catacgcctc tggaatggcc ttgcagaggg 4800
aggcaaaaaa gctccatgat gaggacctgc tcttggtgga agggatgtca gtgccaaaag 4860
atgaggctgt gggtgcgctc catctcatcc aagctgcgaa acttggcaat gcgaaggccc 4920
agagcatcct aagaacagct ggaacagctt tgggtcttgg ggttgtgaac atcctccata 4980
ccatgaatcc ctcccttgtg atcctctccg gagtcctggc cagtcactat atccacattg 5040
tcaaagacgt cattcgccag caggccttgt cctccgtgca ggacgtggat gtggtggttt 5100
cggatttggt tgaccccgcc ctgctgggtg ctgccagcat ggttctggac tacacaacac 5160
gcaggatcta ctagcatgca ctagtgcggc cgcaataaaa gatctttatt ttcattagat 5220
ctgtgtgttg gttttttgtg tgtctagagc atggctacgt agataagtag catggcgggt 5280
taatcattaa ctacaaggaa cccctagtga tggagttggc cactccctct ctgcgcgctc 5340
gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt gcccgggcgg 5400
cctcagtgag cgagcgagcg cgcagctggc gtaatagcga agaggcccgc accgatcgcc 5460
cttcccaaca gttgcgcagc ctgaatggcg aatggcgatt ccgttgcaat ggctggcggt 5520
aatattgttc tggatattac cagcaaggcc gatagtttga gttcttctac tcaggcaagt 5580
gatgttatta ctaatcaaag aagtattgcg acaacggtta atttgcgtga tggacagact 5640
cttttactcg gtggcctcac tgattataaa aacacttctc aggattctgg cgtaccgttc 5700
ctgtctaaaa tccctttaat cggcctcctg tttagctccc gctctgattc taacgaggaa 5760
agcacgttat acgtgctcgt caaagcaacc atagtacgcg ccctgtagcg gcgcattaag 5820
cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg ccctagcgcc 5880
cgctcctttc gctttcttcc cttcctttct cgccacgttc gccggctttc cccgtcaagc 5940
tctaaatcgg gggctccctt tagggttccg atttagtgct ttacggcacc tcgaccccaa 6000
aaaacttgat tagggtgatg gttcacgtag tgggccatcg ccctgataga cggtttttcg 6060
ccctttgacg ttggagtcca cgttctttaa tagtggactc ttgttccaaa ctggaacaac 6120
actcaaccct atctcggtct attcttttga tttataaggg attttgccga tttcggccta 6180
ttggttaaaa aatgagctga tttaacaaaa atttaacgcg aattttaaca aaatattaac 6240
gcttacaatt taaatatttg cttatacaat cttcctgttt ttggggcttt tctgattatc 6300
aaccggggta catatgattg acatgctagt tttacgatta ccgttcatcg attctcttgt 6360
ttgctccaga ctctcaggca atgacctgat agcctttgta gagacctctc aaaaatagct 6420
accctctccg gcatgaattt atcagctaga acggttgaat atcatattga tggtgatttg 6480
actgtctccg gcctttctca cccgtttgaa tctttaccta cacattactc aggcattgca 6540
tttaaaatat atgagggttc taaaaatttt tatccttgcg ttgaaataaa ggcttctccc 6600
gcaaaagtat tacagggtca taatgttttt ggtacaaccg atttagcttt atgctctgag 6660
gctttattgc ttaattttgc taattctttg ccttgcctgt atgatttatt ggatgttgga 6720
atcgcctgat gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcatatggt 6780
gcactctcag tacaatctgc tctgatgccg catagttaag ccagccccga cacccgccaa 6840
cacccgctga cgcgccctga cgggcttgtc tgctcccggc atccgcttac agacaagctg 6900
tgaccgtctc cgggagctgc atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga 6960
gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt 7020
cttagacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt 7080
tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat 7140
aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt 7200
ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg 7260
ctgaagatca 7270
<210> 15
<211> 7187
<212> DNA
<213> 智人
<400> 15
gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag 60
ttttcgcccc gaagaacgaa ttcttagaaa aactcatcga gcatcaaatg aaactgcaat 120
ttattcatat caggattatc aataccatat ttttgaaaaa gccgtttctg taatgaagga 180
gaaaactcac cgaggcagtt ccataggatg gcaagatcct ggtatcggtc tgcgattccg 240
actcgtccaa catcaataca acctattaat ttcccctcgt caaaaataag gttatcaagt 300
gagaaatcac catgagtgac gactgaatcc ggtgagaatg gcaaaagttt atgcatttct 360
ttccagactt gttcaacagg ccagccatta cgctcgtcat caaaatcact cgcatcaacc 420
aaaccgttat tcattcgtga ttgcgcctga gcgagacgaa atacgcgatc gctgttaaaa 480
ggacaattac aaacaggaat cgaatgcaac cggcgcagga acactgccag cgcatcaaca 540
atattttcac ctgaatcagg atattcttct aatacctgga atgctgtttt cccggggatc 600
gcagtggtga gtaaccatgc atcatcagga gtacggataa aatgcttgat ggtcggaaga 660
ggcataaatt ccgtcagcca gtttagtctg accatctcat ctgtaacatc attggcaacg 720
ctacctttgc catgtttcag aaacaactct ggcgcatcgg gcttcccata caatcgatag 780
attgtcgcac ctgattgccc gacattatcg cgagcccatt tatacccata taaatcagca 840
tccatgttgg aatttaatcg cggcctagag caagacgttt cccgttgaat atggctcata 900
acaccccttg tattactgtt tatgtaagca gacagtttta ttgttcatga ccaaaatccc 960
ttaacgtgag ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc 1020
ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc 1080
agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt 1140
cagcagagcg cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt 1200
caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc 1260
tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa 1320
ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac 1380
ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg 1440
gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga 1500
gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact 1560
tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa 1620
cgcggccttt ttacggttcc tggccttttg ctggcctttt gctcacatgt tctttcctgc 1680
gttatcccct gattctgtgg ataaccgtat taccgccttt gagtgagctg ataccgctcg 1740
ccgcagccga acgaccgagc gcagcgagtc agtgagcgag gaagcggaag agcgcccaat 1800
acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctgcg cgctcgctcg 1860
ctcactgagg ccgcccgggc aaagcccggg cgtcgggcga cctttggtcg cccggcctca 1920
gtgagcgagc gagcgcgcag agagggagtg gccaactcca tcactagggg ttccttgtag 1980
ttaatgatta acccgccatg ctacttatct acgtagccat gctctagagt ttaaacaagc 2040
ttgaggccag gagctcgagt gctgcctgga caacatagtg agacccttgt ctcaaaaaca 2100
acagcaaccc aaagtcttat ttatcttcag gagctgcgca agccctttac caccgccacg 2160
tttctccctg gatgtcccta ggcctcggga ctggctggga gttccctgta gtggaggccg 2220
ccgctgaact gattataaag atgagagagg ctctgccatg ccttggtcat caattcacac 2280
tccaccagtg tcttctagca gtcacggcaa gggttaacgt cagggaccgc tgtggggtgg 2340
ccgcgctaca cgacagtata gttgcggtcc tggtttatga aataactgag ggaacaagag 2400
gcgcaagaaa tccctccttg ggtgcaagac caaaacaact acccagcggg aagactcggg 2460
cttcagtgcg tgtgtcgcca gtggaggagg acgcttcggg gcgggagcac aagctggcag 2520
gacagccccg cagcagctcc agcgcggcag aggccatgga agatggtccg ctggtcagca 2580
ccctgcctgc gcctcaaaat accgccggga aggtggggga cggggacggg agcagccaat 2640
cacgcgagct ctctcgggtg gcgtcagggc gcgatcgcgg attcggcact ccgggtgggc 2700
gtggctgggc gagcgaggag tggggacaag gtcgagcgac gagtcggcgc gcccaggtaa 2760
gtttagtctt tttgtctttt atttcaggtc ccggatccgg tggtggtgca aatcaaagaa 2820
ctgctcctca gtggatgttg cctttacttc taggcctgta cggaagtgtt acttctgctc 2880
taaaagctgc ggaattgtac ccgcggccgg ctagccgcca ccatggagaa gaatggaaat 2940
aaccgaaagc tgcgggtttg tgttgctact tgtaaccgtg cagattattc taaacttgcc 3000
ccgatcatgt ttggcattaa aaccgaacct gagttctttg aacttgatgt tgtggtactt 3060
ggctctcacc tgatagatga ctatggaaat acatatcgaa tgattgaaca agatgacttt 3120
gacattaaca ccaggctaca cacaattgtg aggggagaag atgaggcagc catggtggag 3180
tcagtaggcc tggccctagt gaagctgcca gatgtcctta atcgcctgaa gcctgatatc 3240
atgattgttc atggagacag gtttgatgcc ctggctctgg ccacatctgc tgccttgatg 3300
aacatccgaa tccttcacat tgaaggtggg gaagtcagtg ggaccattga tgactctatc 3360
agacatgcca taacaaaact ggctcattat catgtgtgct gcacccgcag tgcagagcag 3420
cacctgatat ccatgtgtga ggaccatgat cgcatccttt tggcaggctg cccttcctat 3480
gacaaacttc tctcagccaa gaacaaagac tacatgagca tcattcgcat gtggctaggt 3540
gatgatgtaa aatctaaaga ttacattgtt gcactacagc accctgtgac cactgacatt 3600
aagcattcca taaaaatgtt tgaattaaca ttggatgcac ttatctcatt taacaagcgg 3660
accctagtcc tgtttccaaa tattgacgca gggagcaaag agatggttcg agtgatgcgg 3720
aagaagggca ttgagcatca tcccaacttt cgtgcagtta aacacgtccc atttgaccag 3780
tttatacagt tggttgccca tgctggctgt atgattggga acagcagctg tggggttcga 3840
gaagttggag cttttggaac acctgtgatc aacctgggaa cacgtcagat tggaagagaa 3900
acaggggaga atgttcttca tgtccgggat gctgacaccc aagacaaaat attgcaagca 3960
ctgcaccttc agtttggtaa acagtaccct tgttcaaaga tatatgggga tggaaatgct 4020
gttccaagga ttttgaagtt tctcaaatct atcgatcttc aagagccact gcaaaagaaa 4080
ttctgctttc ctcctgtgaa ggagaatatc tctcaagata ttgaccatat tcttgaaact 4140
ctaagtgcct tggccgttga tcttggcggg acgaacctcc gagttgcaat agtcagcatg 4200
aagggtgaaa tagttaagaa gtatactcag ttcaatccta aaacctatga agagaggatt 4260
aatttaatcc tacagatgtg tgtggaagct gcagcagaag ctgtaaaact gaactgcaga 4320
attttgggag taggcatttc cacaggtggc cgtgtaaatc ctcgggaagg aattgtgctg 4380
cattcaacca aactgatcca agagtggaac tctgtggacc ttaggacccc cctttctgac 4440
actttgcatc tccctgtgtg ggtagacaat gatggcaact gtgctgccct ggcggaaagg 4500
aaatttggcc aaggaaaggg actggaaaac tttgttacac ttatcacagg cacaggaatc 4560
ggtggtggaa ttatccatca gcatgaattg atccacggaa gctccttctg tgctgcagaa 4620
ctgggccacc ttgttgtgtc tctggatggg cctgattgtt cctgtggaag ccatgggtgc 4680
attgaagcat acgcctctgg aatggccttg cagagggagg caaaaaagct ccatgatgag 4740
gacctgctct tggtggaagg gatgtcagtg ccaaaagatg aggctgtggg tgcgctccat 4800
ctcatccaag ctgcgaaact tggcaatgcg aaggcccaga gcatcctaag aacagctgga 4860
acagctttgg gtcttggggt tgtgaacatc ctccatacca tgaatccctc ccttgtgatc 4920
ctctccggag tcctggccag tcactatatc cacattgtca aagacgtcat tcgccagcag 4980
gccttgtcct ccgtgcagga cgtggatgtg gtggtttcgg atttggttga ccccgccctg 5040
ctgggtgctg ccagcatggt tctggactac acaacacgca ggatctacta gcatgcacta 5100
gtgcggccgc aataaaagat ctttattttc attagatctg tgtgttggtt ttttgtgtgt 5160
ctagagcatg gctacgtaga taagtagcat ggcgggttaa tcattaacta caaggaaccc 5220
ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga 5280
ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc 5340
agctggcgta atagcgaaga ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg 5400
aatggcgaat ggcgattccg ttgcaatggc tggcggtaat attgttctgg atattaccag 5460
caaggccgat agtttgagtt cttctactca ggcaagtgat gttattacta atcaaagaag 5520
tattgcgaca acggttaatt tgcgtgatgg acagactctt ttactcggtg gcctcactga 5580
ttataaaaac acttctcagg attctggcgt accgttcctg tctaaaatcc ctttaatcgg 5640
cctcctgttt agctcccgct ctgattctaa cgaggaaagc acgttatacg tgctcgtcaa 5700
agcaaccata gtacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc 5760
gcagcgtgac cgctacactt gccagcgccc tagcgcccgc tcctttcgct ttcttccctt 5820
cctttctcgc cacgttcgcc ggctttcccc gtcaagctct aaatcggggg ctccctttag 5880
ggttccgatt tagtgcttta cggcacctcg accccaaaaa acttgattag ggtgatggtt 5940
cacgtagtgg gccatcgccc tgatagacgg tttttcgccc tttgacgttg gagtccacgt 6000
tctttaatag tggactcttg ttccaaactg gaacaacact caaccctatc tcggtctatt 6060
cttttgattt ataagggatt ttgccgattt cggcctattg gttaaaaaat gagctgattt 6120
aacaaaaatt taacgcgaat tttaacaaaa tattaacgct tacaatttaa atatttgctt 6180
atacaatctt cctgtttttg gggcttttct gattatcaac cggggtacat atgattgaca 6240
tgctagtttt acgattaccg ttcatcgatt ctcttgtttg ctccagactc tcaggcaatg 6300
acctgatagc ctttgtagag acctctcaaa aatagctacc ctctccggca tgaatttatc 6360
agctagaacg gttgaatatc atattgatgg tgatttgact gtctccggcc tttctcaccc 6420
gtttgaatct ttacctacac attactcagg cattgcattt aaaatatatg agggttctaa 6480
aaatttttat ccttgcgttg aaataaaggc ttctcccgca aaagtattac agggtcataa 6540
tgtttttggt acaaccgatt tagctttatg ctctgaggct ttattgctta attttgctaa 6600
ttctttgcct tgcctgtatg atttattgga tgttggaatc gcctgatgcg gtattttctc 6660
cttacgcatc tgtgcggtat ttcacaccgc atatggtgca ctctcagtac aatctgctct 6720
gatgccgcat agttaagcca gccccgacac ccgccaacac ccgctgacgc gccctgacgg 6780
gcttgtctgc tcccggcatc cgcttacaga caagctgtga ccgtctccgg gagctgcatg 6840
tgtcagaggt tttcaccgtc atcaccgaaa cgcgcgagac gaaagggcct cgtgatacgc 6900
ctatttttat aggttaatgt catgataata atggtttctt agacgtcagg tggcactttt 6960
cggggaaatg tgcgcggaac ccctatttgt ttatttttct aaatacattc aaatatgtat 7020
ccgctcatga gacaataacc ctgataaatg cttcaataat attgaaaaag gaagagtatg 7080
agtattcaac atttccgtgt cgcccttatt cccttttttg cggcattttg ccttcctgtt 7140
tttgctcacc cagaaacgct ggtgaaagta aaagatgctg aagatca 7187
<210> 16
<211> 8423
<212> DNA
<213> 智人
<400> 16
gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag 60
ttttcgcccc gaagaacgaa ttcttagaaa aactcatcga gcatcaaatg aaactgcaat 120
ttattcatat caggattatc aataccatat ttttgaaaaa gccgtttctg taatgaagga 180
gaaaactcac cgaggcagtt ccataggatg gcaagatcct ggtatcggtc tgcgattccg 240
actcgtccaa catcaataca acctattaat ttcccctcgt caaaaataag gttatcaagt 300
gagaaatcac catgagtgac gactgaatcc ggtgagaatg gcaaaagttt atgcatttct 360
ttccagactt gttcaacagg ccagccatta cgctcgtcat caaaatcact cgcatcaacc 420
aaaccgttat tcattcgtga ttgcgcctga gcgagacgaa atacgcgatc gctgttaaaa 480
ggacaattac aaacaggaat cgaatgcaac cggcgcagga acactgccag cgcatcaaca 540
atattttcac ctgaatcagg atattcttct aatacctgga atgctgtttt cccggggatc 600
gcagtggtga gtaaccatgc atcatcagga gtacggataa aatgcttgat ggtcggaaga 660
ggcataaatt ccgtcagcca gtttagtctg accatctcat ctgtaacatc attggcaacg 720
ctacctttgc catgtttcag aaacaactct ggcgcatcgg gcttcccata caatcgatag 780
attgtcgcac ctgattgccc gacattatcg cgagcccatt tatacccata taaatcagca 840
tccatgttgg aatttaatcg cggcctagag caagacgttt cccgttgaat atggctcata 900
acaccccttg tattactgtt tatgtaagca gacagtttta ttgttcatga ccaaaatccc 960
ttaacgtgag ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc 1020
ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc 1080
agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt 1140
cagcagagcg cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt 1200
caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc 1260
tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa 1320
ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac 1380
ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg 1440
gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga 1500
gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact 1560
tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa 1620
cgcggccttt ttacggttcc tggccttttg ctggcctttt gctcacatgt tctttcctgc 1680
gttatcccct gattctgtgg ataaccgtat taccgccttt gagtgagctg ataccgctcg 1740
ccgcagccga acgaccgagc gcagcgagtc agtgagcgag gaagcggaag agcgcccaat 1800
acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctgcg cgctcgctcg 1860
ctcactgagg ccgcccgggc aaagcccggg cgtcgggcga cctttggtcg cccggcctca 1920
gtgagcgagc gagcgcgcag agagggagtg gccaactcca tcactagggg ttccttgtag 1980
ttaatgatta acccgccatg ctacttatct acgtagccat gctctagagt ttaaacaagc 2040
ttgcatgtct aagctagacc cttcagatta aaaataactg aggtaagggc ctgggtaggg 2100
gaggtggtgt gagacgctcc tgtctctcct ctatctgccc atcggccctt tggggaggag 2160
gaatgtgccc aaggactaaa aaaaggccat ggagccagag gggcgagggc aacagacctt 2220
tcatgggcaa accttggggc cctgctgtct agcatgcccc actacgggtc taggctgccc 2280
atgtaaggag gcaaggcctg gggacacccg agatgcctgg ttataattaa cccagacatg 2340
tggctgcccc ccccccccca acacctgctg cctctaaaaa taaccctgtc cctggtggat 2400
cccctgcatg cgaagatctt cgaacaaggc tgtgggggac tgagggcagg ctgtaacagg 2460
cttgggggcc agggcttata cgtgcctggg actcccaaag tattactgtt ccatgttccc 2520
ggcgaagggc cagctgtccc ccgccagcta gactcagcac ttagtttagg aaccagtgag 2580
caagtcagcc cttggggcag cccatacaag gccatggggc tgggcaagct gcacgcctgg 2640
gtccggggtg ggcacggtgc ccgggcaacg agctgaaagc tcatctgctc tcaggggccc 2700
ctccctgggg acagcccctc ctggctagtc acaccctgta ggctcctcta tataacccag 2760
gggcacaggg gctgccctca ttctaccacc acctccacag cacagacaga cactcaggag 2820
cagccagcgg cgcgcccagg taagtttagt ctttttgtct tttatttcag gtcccggatc 2880
cggtggtggt gcaaatcaaa gaactgctcc tcagtggatg ttgcctttac ttctaggcct 2940
gtacggaagt gttacttctg ctctaaaagc tgcggaattg tacccgcggc cggctagccg 3000
ccaccatgga gaagaatgga aataaccgaa agctgcgggt ttgtgttgct acttgtaacc 3060
gtgcagatta ttctaaactt gccccgatca tgtttggcat taaaaccgaa cctgagttct 3120
ttgaacttga tgttgtggta cttggctctc acctgataga tgactatgga aatacatatc 3180
gaatgattga acaagatgac tttgacatta acaccaggct acacacaatt gtgaggggag 3240
aagatgaggc agccatggtg gagtcagtag gcctggccct agtgaagctg ccagatgtcc 3300
ttaatcgcct gaagcctgat atcatgattg ttcatggaga caggtttgat gccctggctc 3360
tggccacatc tgctgccttg atgaacatcc gaatccttca cattgaaggt ggggaagtca 3420
gtgggaccat tgatgactct atcagacatg ccataacaaa actggctcat tatcatgtgt 3480
gctgcacccg cagtgcagag cagcacctga tatccatgtg tgaggaccat gatcgcatcc 3540
ttttggcagg ctgcccttcc tatgacaaac ttctctcagc caagaacaaa gactacatga 3600
gcatcattcg catgtggcta ggtgatgatg taaaatctaa agattacatt gttgcactac 3660
agcaccctgt gaccactgac attaagcatt ccataaaaat gtttgaatta acattggatg 3720
cacttatctc atttaacaag cggaccctag tcctgtttcc aaatattgac gcagggagca 3780
aagagatggt tcgagtgatg cggaagaagg gcattgagca tcatcccaac tttcgtgcag 3840
ttaaacacgt cccatttgac cagtttatac agttggttgc ccatgctggc tgtatgattg 3900
ggaacagcag ctgtggggtt cgagaagttg gagcttttgg aacacctgtg atcaacctgg 3960
gaacacgtca gattggaaga gaaacagggg agaatgttct tcatgtccgg gatgctgaca 4020
cccaagacaa aatattgcaa gcactgcacc ttcagtttgg taaacagtac ccttgttcaa 4080
agatatatgg ggatggaaat gctgttccaa ggattttgaa gtttctcaaa tctatcgatc 4140
ttcaagagcc actgcaaaag aaattctgct ttcctcctgt gaaggagaat atctctcaag 4200
atattgacca tattcttgaa actctaagtg ccttggccgt tgatcttggc gggacgaacc 4260
tccgagttgc aatagtcagc atgaagggtg aaatagttaa gaagtatact cagttcaatc 4320
ctaaaaccta tgaagagagg attaatttaa tcctacagat gtgtgtggaa gctgcagcag 4380
aagctgtaaa actgaactgc agaattttgg gagtaggcat ttccacaggt ggccgtgtaa 4440
atcctcggga aggaattgtg ctgcattcaa ccaaactgat ccaagagtgg aactctgtgg 4500
accttaggac ccccctttct gacactttgc atctccctgt gtgggtagac aatgatggca 4560
actgtgctgc cctggcggaa aggaaatttg gccaaggaaa gggactggaa aactttgtta 4620
cacttatcac aggcacagga atcggtggtg gaattatcca tcagcatgaa ttgatccacg 4680
gaagctcctt ctgtgctgca gaactgggcc accttgttgt gtctctggat gggcctgatt 4740
gttcctgtgg aagccatggg tgcattgaag catacgcctc tggaatggcc ttgcagaggg 4800
aggcaaaaaa gctccatgat gaggacctgc tcttggtgga agggatgtca gtgccaaaag 4860
atgaggctgt gggtgcgctc catctcatcc aagctgcgaa acttggcaat gcgaaggccc 4920
agagcatcct aagaacagct ggaacagctt tgggtcttgg ggttgtgaac atcctccata 4980
ccatgaatcc ctcccttgtg atcctctccg gagtcctggc cagtcactat atccacattg 5040
tcaaagacgt cattcgccag caggccttgt cctccgtgca ggacgtggat gtggtggttt 5100
cggatttggt tgaccccgcc ctgctgggtg ctgccagcat ggttctggac tacacaacac 5160
gcaggatcta ctagcatgcc ttctgatggt gaatgggaac tcccttcctc ctgcagcagc 5220
ctgcctgcag ctgtcctggt agaacagtgt ggacattgca gaagctgtca ctgccccaga 5280
aagaaagcac cccagagact agtatggtcc gcgcgaggca ccagccgggt gggctttgcc 5340
tcctgctgct gctgctctgc cagttcatgg aggaccgcag tgcccaggct gggaactgct 5400
ggctccgtca agcgaagaac ggccgctgcc aggtcctgta caagaccgaa ctgagcaagg 5460
aggagtgctg cagcaccggc cggctgagca cctcgtggac cgaggaggac gtgaatgaca 5520
acacactctt caagtggatg attttcaacg ggggcgcccc caactgcatc ccctgtaaag 5580
aaacgtgtga gaacgtggac tgtggacctg ggaaaaaatg ccgaatgaac aagaagaaca 5640
aaccccgctg cgtctgcgcc ccggattgtt ccaacatcac ctggaagggt ccagtctgcg 5700
ggctggatgg gaaaacctac cgcaatgaat gtgcactcct aaaggcaaga tgtaaagagc 5760
agccagaact ggaagtccag taccaaggca gatgtaaaaa gacttgtcgg gatgttttct 5820
gtccaggcag ctccacatgt gtggtggacc agaccaataa tgcctactgt gtgacctgta 5880
atcggatttg cccagagcct gcttcctctg agcaatatct ctgtgggaat gatggagtca 5940
cctactccag tgcctgccac ctgagaaagg ctacctgcct gctgggcaga tctattggat 6000
tagcctatga gggaaagtgt atcaaagcaa agtcctgtga agatatccag tgcactggtg 6060
ggaaaaaatg tttatgggat ttcaaggttg ggagaggccg gtgttccctc tgtgatgagc 6120
tgtgccctga cagtaagtcg gatgagcctg tctgtgccag tgacaatgcc acttatgcca 6180
gcgagtgtgc catgaaggaa gctgcctgct cctcaggtgt gctactggaa gtaaagcact 6240
ccggatcttg caactccatt tcggaagaca ccgaggaaga ggaggaagat gaagaccagg 6300
actacagctt tcctatatct tctattctag agtggtaagc ggccgcaata aaagatcttt 6360
attttcatta gatctgtgtg ttggtttttt gtgtgtctag agcatggcta cgtagataag 6420
tagcatggcg ggttaatcat taactacaag gaacccctag tgatggagtt ggccactccc 6480
tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc 6540
tttgcccggg cggcctcagt gagcgagcga gcgcgcagct ggcgtaatag cgaagaggcc 6600
cgcaccgatc gcccttccca acagttgcgc agcctgaatg gcgaatggcg attccgttgc 6660
aatggctggc ggtaatattg ttctggatat taccagcaag gccgatagtt tgagttcttc 6720
tactcaggca agtgatgtta ttactaatca aagaagtatt gcgacaacgg ttaatttgcg 6780
tgatggacag actcttttac tcggtggcct cactgattat aaaaacactt ctcaggattc 6840
tggcgtaccg ttcctgtcta aaatcccttt aatcggcctc ctgtttagct cccgctctga 6900
ttctaacgag gaaagcacgt tatacgtgct cgtcaaagca accatagtac gcgccctgta 6960
gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca 7020
gcgccctagc gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct 7080
ttccccgtca agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc 7140
acctcgaccc caaaaaactt gattagggtg atggttcacg tagtgggcca tcgccctgat 7200
agacggtttt tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc 7260
aaactggaac aacactcaac cctatctcgg tctattcttt tgatttataa gggattttgc 7320
cgatttcggc ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta 7380
acaaaatatt aacgcttaca atttaaatat ttgcttatac aatcttcctg tttttggggc 7440
ttttctgatt atcaaccggg gtacatatga ttgacatgct agttttacga ttaccgttca 7500
tcgattctct tgtttgctcc agactctcag gcaatgacct gatagccttt gtagagacct 7560
ctcaaaaata gctaccctct ccggcatgaa tttatcagct agaacggttg aatatcatat 7620
tgatggtgat ttgactgtct ccggcctttc tcacccgttt gaatctttac ctacacatta 7680
ctcaggcatt gcatttaaaa tatatgaggg ttctaaaaat ttttatcctt gcgttgaaat 7740
aaaggcttct cccgcaaaag tattacaggg tcataatgtt tttggtacaa ccgatttagc 7800
tttatgctct gaggctttat tgcttaattt tgctaattct ttgccttgcc tgtatgattt 7860
attggatgtt ggaatcgcct gatgcggtat tttctcctta cgcatctgtg cggtatttca 7920
caccgcatat ggtgcactct cagtacaatc tgctctgatg ccgcatagtt aagccagccc 7980
cgacacccgc caacacccgc tgacgcgccc tgacgggctt gtctgctccc ggcatccgct 8040
tacagacaag ctgtgaccgt ctccgggagc tgcatgtgtc agaggttttc accgtcatca 8100
ccgaaacgcg cgagacgaaa gggcctcgtg atacgcctat ttttataggt taatgtcatg 8160
ataataatgg tttcttagac gtcaggtggc acttttcggg gaaatgtgcg cggaacccct 8220
atttgtttat ttttctaaat acattcaaat atgtatccgc tcatgagaca ataaccctga 8280
taaatgcttc aataatattg aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc 8340
cttattccct tttttgcggc attttgcctt cctgtttttg ctcacccaga aacgctggtg 8400
aaagtaaaag atgctgaaga tca 8423
<210> 17
<211> 7928
<212> DNA
<213> 智人
<400> 17
gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag 60
ttttcgcccc gaagaacgaa ttcttagaaa aactcatcga gcatcaaatg aaactgcaat 120
ttattcatat caggattatc aataccatat ttttgaaaaa gccgtttctg taatgaagga 180
gaaaactcac cgaggcagtt ccataggatg gcaagatcct ggtatcggtc tgcgattccg 240
actcgtccaa catcaataca acctattaat ttcccctcgt caaaaataag gttatcaagt 300
gagaaatcac catgagtgac gactgaatcc ggtgagaatg gcaaaagttt atgcatttct 360
ttccagactt gttcaacagg ccagccatta cgctcgtcat caaaatcact cgcatcaacc 420
aaaccgttat tcattcgtga ttgcgcctga gcgagacgaa atacgcgatc gctgttaaaa 480
ggacaattac aaacaggaat cgaatgcaac cggcgcagga acactgccag cgcatcaaca 540
atattttcac ctgaatcagg atattcttct aatacctgga atgctgtttt cccggggatc 600
gcagtggtga gtaaccatgc atcatcagga gtacggataa aatgcttgat ggtcggaaga 660
ggcataaatt ccgtcagcca gtttagtctg accatctcat ctgtaacatc attggcaacg 720
ctacctttgc catgtttcag aaacaactct ggcgcatcgg gcttcccata caatcgatag 780
attgtcgcac ctgattgccc gacattatcg cgagcccatt tatacccata taaatcagca 840
tccatgttgg aatttaatcg cggcctagag caagacgttt cccgttgaat atggctcata 900
acaccccttg tattactgtt tatgtaagca gacagtttta ttgttcatga ccaaaatccc 960
ttaacgtgag ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc 1020
ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc 1080
agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt 1140
cagcagagcg cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt 1200
caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc 1260
tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa 1320
ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac 1380
ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg 1440
gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga 1500
gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact 1560
tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa 1620
cgcggccttt ttacggttcc tggccttttg ctggcctttt gctcacatgt tctttcctgc 1680
gttatcccct gattctgtgg ataaccgtat taccgccttt gagtgagctg ataccgctcg 1740
ccgcagccga acgaccgagc gcagcgagtc agtgagcgag gaagcggaag agcgcccaat 1800
acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctgcg cgctcgctcg 1860
ctcactgagg ccgcccgggc aaagcccggg cgtcgggcga cctttggtcg cccggcctca 1920
gtgagcgagc gagcgcgcag agagggagtg gccaactcca tcactagggg ttccttgtag 1980
ttaatgatta acccgccatg ctacttatct acgtagccat gctctagagt ttaaacaagc 2040
ttgcatgtct aagctagacc cttcagatta aaaataactg aggtaagggc ctgggtaggg 2100
gaggtggtgt gagacgctcc tgtctctcct ctatctgccc atcggccctt tggggaggag 2160
gaatgtgccc aaggactaaa aaaaggccat ggagccagag gggcgagggc aacagacctt 2220
tcatgggcaa accttggggc cctgctgtct agcatgcccc actacgggtc taggctgccc 2280
atgtaaggag gcaaggcctg gggacacccg agatgcctgg ttataattaa cccagacatg 2340
tggctgcccc ccccccccca acacctgctg cctctaaaaa taaccctgtc cctggtggat 2400
cccctgcatg cgaagatctt cgaacaaggc tgtgggggac tgagggcagg ctgtaacagg 2460
cttgggggcc agggcttata cgtgcctggg actcccaaag tattactgtt ccatgttccc 2520
ggcgaagggc cagctgtccc ccgccagcta gactcagcac ttagtttagg aaccagtgag 2580
caagtcagcc cttggggcag cccatacaag gccatggggc tgggcaagct gcacgcctgg 2640
gtccggggtg ggcacggtgc ccgggcaacg agctgaaagc tcatctgctc tcaggggccc 2700
ctccctgggg acagcccctc ctggctagtc acaccctgta ggctcctcta tataacccag 2760
gggcacaggg gctgccctca ttctaccacc acctccacag cacagacaga cactcaggag 2820
cagccagcgg cgcgcccagg taagtttagt ctttttgtct tttatttcag gtcccggatc 2880
cggtggtggt gcaaatcaaa gaactgctcc tcagtggatg ttgcctttac ttctaggcct 2940
gtacggaagt gttacttctg ctctaaaagc tgcggaattg tacccgcggc cggctagccg 3000
ccaccatgga gaagaatgga aataaccgaa agctgcgggt ttgtgttgct acttgtaacc 3060
gtgcagatta ttctaaactt gccccgatca tgtttggcat taaaaccgaa cctgagttct 3120
ttgaacttga tgttgtggta cttggctctc acctgataga tgactatgga aatacatatc 3180
gaatgattga acaagatgac tttgacatta acaccaggct acacacaatt gtgaggggag 3240
aagatgaggc agccatggtg gagtcagtag gcctggccct agtgaagctg ccagatgtcc 3300
ttaatcgcct gaagcctgat atcatgattg ttcatggaga caggtttgat gccctggctc 3360
tggccacatc tgctgccttg atgaacatcc gaatccttca cattgaaggt ggggaagtca 3420
gtgggaccat tgatgactct atcagacatg ccataacaaa actggctcat tatcatgtgt 3480
gctgcacccg cagtgcagag cagcacctga tatccatgtg tgaggaccat gatcgcatcc 3540
ttttggcagg ctgcccttcc tatgacaaac ttctctcagc caagaacaaa gactacatga 3600
gcatcattcg catgtggcta ggtgatgatg taaaatctaa agattacatt gttgcactac 3660
agcaccctgt gaccactgac attaagcatt ccataaaaat gtttgaatta acattggatg 3720
cacttatctc atttaacaag cggaccctag tcctgtttcc aaatattgac gcagggagca 3780
aagagatggt tcgagtgatg cggaagaagg gcattgagca tcatcccaac tttcgtgcag 3840
ttaaacacgt cccatttgac cagtttatac agttggttgc ccatgctggc tgtatgattg 3900
ggaacagcag ctgtggggtt cgagaagttg gagcttttgg aacacctgtg atcaacctgg 3960
gaacacgtca gattggaaga gaaacagggg agaatgttct tcatgtccgg gatgctgaca 4020
cccaagacaa aatattgcaa gcactgcacc ttcagtttgg taaacagtac ccttgttcaa 4080
agatatatgg ggatggaaat gctgttccaa ggattttgaa gtttctcaaa tctatcgatc 4140
ttcaagagcc actgcaaaag aaattctgct ttcctcctgt gaaggagaat atctctcaag 4200
atattgacca tattcttgaa actctaagtg ccttggccgt tgatcttggc gggacgaacc 4260
tccgagttgc aatagtcagc atgaagggtg aaatagttaa gaagtatact cagttcaatc 4320
ctaaaaccta tgaagagagg attaatttaa tcctacagat gtgtgtggaa gctgcagcag 4380
aagctgtaaa actgaactgc agaattttgg gagtaggcat ttccacaggt ggccgtgtaa 4440
atcctcggga aggaattgtg ctgcattcaa ccaaactgat ccaagagtgg aactctgtgg 4500
accttaggac ccccctttct gacactttgc atctccctgt gtgggtagac aatgatggca 4560
actgtgctgc cctggcggaa aggaaatttg gccaaggaaa gggactggaa aactttgtta 4620
cacttatcac aggcacagga atcggtggtg gaattatcca tcagcatgaa ttgatccacg 4680
gaagctcctt ctgtgctgca gaactgggcc accttgttgt gtctctggat gggcctgatt 4740
gttcctgtgg aagccatggg tgcattgaag catacgcctc tggaatggcc ttgcagaggg 4800
aggcaaaaaa gctccatgat gaggacctgc tcttggtgga agggatgtca gtgccaaaag 4860
atgaggctgt gggtgcgctc catctcatcc aagctgcgaa acttggcaat gcgaaggccc 4920
agagcatcct aagaacagct ggaacagctt tgggtcttgg ggttgtgaac atcctccata 4980
ccatgaatcc ctcccttgtg atcctctccg gagtcctggc cagtcactat atccacattg 5040
tcaaagacgt cattcgccag caggccttgt cctccgtgca ggacgtggat gtggtggttt 5100
cggatttggt tgaccccgcc ctgctgggtg ctgccagcat ggttctggac tacacaacac 5160
gcaggatcta ctagcatgcc ttctgatggt gaatgggaac tcccttcctc ctgcagcagc 5220
ctgcctgcag ctgtcctggt agaacagtgt ggacattgca gaagctgtca ctgccccaga 5280
aagaaagcac cccagagact ggccgcacca tgaagctgct gccgtcggtg gtgctgaagc 5340
tctttctggc tgcagttctc tcggcactgg tgactggcga gagcctggag cggcttcgga 5400
gagggctagc tgctggaacc agcaacccgg accctcccac tgtatccacg gaccagctgc 5460
tacccctagg aggcggccgg gaccggaaag tccgtgactt gcaagaggca gatctggacc 5520
ttttgagagt cactttatcc tccaagccac aagcactggc cacaccaaac aaggaggagc 5580
acgggaaaag aaagaagaaa ggcaaggggc tagggaagaa gagggaccca ggaccggaga 5640
cgctctgcgg ggctgagctg gtggatgctc ttcagttcgt gtgtggagac aggggctttt 5700
atttcaacaa gcccacaggg tatggctcca gcagtcggag ggcgcctcag acaggcatcg 5760
tggatgagtg ctgcttccgg agctgtgatc taaggaggct ggagatgtat tgcgcacccc 5820
tcaagcctgc caagtcagct taggcggccg caataaaaga tctttatttt cattagatct 5880
gtgtgttggt tttttgtgtg tctagagcat ggctacgtag ataagtagca tggcgggtta 5940
atcattaact acaaggaacc cctagtgatg gagttggcca ctccctctct gcgcgctcgc 6000
tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc 6060
tcagtgagcg agcgagcgcg cagctggcgt aatagcgaag aggcccgcac cgatcgccct 6120
tcccaacagt tgcgcagcct gaatggcgaa tggcgattcc gttgcaatgg ctggcggtaa 6180
tattgttctg gatattacca gcaaggccga tagtttgagt tcttctactc aggcaagtga 6240
tgttattact aatcaaagaa gtattgcgac aacggttaat ttgcgtgatg gacagactct 6300
tttactcggt ggcctcactg attataaaaa cacttctcag gattctggcg taccgttcct 6360
gtctaaaatc cctttaatcg gcctcctgtt tagctcccgc tctgattcta acgaggaaag 6420
cacgttatac gtgctcgtca aagcaaccat agtacgcgcc ctgtagcggc gcattaagcg 6480
cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg 6540
ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc 6600
taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa 6660
aacttgatta gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc 6720
ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac 6780
tcaaccctat ctcggtctat tcttttgatt tataagggat tttgccgatt tcggcctatt 6840
ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc 6900
ttacaattta aatatttgct tatacaatct tcctgttttt ggggcttttc tgattatcaa 6960
ccggggtaca tatgattgac atgctagttt tacgattacc gttcatcgat tctcttgttt 7020
gctccagact ctcaggcaat gacctgatag cctttgtaga gacctctcaa aaatagctac 7080
cctctccggc atgaatttat cagctagaac ggttgaatat catattgatg gtgatttgac 7140
tgtctccggc ctttctcacc cgtttgaatc tttacctaca cattactcag gcattgcatt 7200
taaaatatat gagggttcta aaaattttta tccttgcgtt gaaataaagg cttctcccgc 7260
aaaagtatta cagggtcata atgtttttgg tacaaccgat ttagctttat gctctgaggc 7320
tttattgctt aattttgcta attctttgcc ttgcctgtat gatttattgg atgttggaat 7380
cgcctgatgc ggtattttct ccttacgcat ctgtgcggta tttcacaccg catatggtgc 7440
actctcagta caatctgctc tgatgccgca tagttaagcc agccccgaca cccgccaaca 7500
cccgctgacg cgccctgacg ggcttgtctg ctcccggcat ccgcttacag acaagctgtg 7560
accgtctccg ggagctgcat gtgtcagagg ttttcaccgt catcaccgaa acgcgcgaga 7620
cgaaagggcc tcgtgatacg cctattttta taggttaatg tcatgataat aatggtttct 7680
tagacgtcag gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc 7740
taaatacatt caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa 7800
tattgaaaaa ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt 7860
gcggcatttt gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct 7920
gaagatca 7928
<210> 18
<211> 8430
<212> DNA
<213> 智人
<400> 18
acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg 60
aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact 120
cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga gcggatacat 180
atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc cccgaaaagt 240
gccacctgac gtctaagaaa ccattattat catgacatta acctataaaa ataggcgtat 300
cacgaggccc tttcgtctcg cgcgtttcgg tgatgacggt gaaaacctct gacacatgca 360
gctcccggag acggtcacag cttgtctgta agcggatgcc gggagcagac aagcccgtca 420
gggcgcgtca gcgtgtgttg gcgggtgtcg gggctggctt aactatgcgg catcagagca 480
gattgtactg agagtgcacc atatgcggtg tgaaataccg cacagatgcg taaggagaaa 540
ataccgcatc aggcgattcc aacatccaat aaatcataca ggcaaggcaa agaattagca 600
aaattaagca ataaagcctc agagcataaa gctaaatcgg ttgtaccaaa aacattatga 660
ccctgtaata cttttgcggg agaagccttt atttcaacgc aaggataaaa atttttagaa 720
ccctcatata ttttaaatgc aatgcctgag taatgtgtag gtaaagattc aaacgggtga 780
gaaaggccgg agacagtcaa atcaccatca atatgatatt caaccgttct agctgataaa 840
ttcatgccgg agagggtagc tatttttgag aggtctctac aaaggctatc aggtcattgc 900
ctgagagtct ggagcaaaca agagaatcga tgaacggtaa tcgtaaaact agcatgtcaa 960
tcatatgtac cccggttgat aatcagaaaa gccccaaaaa caggaagatt gtataagcaa 1020
atatttaaat tgtaagcgtt aatattttgt taaaattcgc gttaaatttt tgttaaatca 1080
gctcattttt taaccaatag gccgaaatcg gcaaaatccc ttataaatca aaagaataga 1140
ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 1200
actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 1260
caccctaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 1320
ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 1380
agaaagcgaa aggagcgggc gctagggcgc tggcaagtgt agcggtcacg ctgcgcgtaa 1440
ccaccacacc cgccgcgctt aatgcgccgc tacagggcgc gtactatggt tgctttgacg 1500
agcacgtata acgtgctttc ctcgttagaa tcagagcggg agctaaacag gaggccgatt 1560
aaagggattt tagacaggaa cggtacgcca gaatcctgag aagtgttttt ataatcagtg 1620
aggccaccga gtaaaagagt ctgtccatca cgcaaattaa ccgttgtcgc aatacttctt 1680
tgattagtaa taacatcact tgcctgagta gaagaactca aactatcggc cttgctggta 1740
atatccagaa caatattacc gccagccatt gcaacggaat cgccattcgc cattcaggct 1800
gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctgcgcgc 1860
tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt cgggcgacct ttggtcgccc 1920
ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aactccatca ctaggggttc 1980
cttgtagtta atgattaacc cgccatgcta cttatctacg tagccatgct ctaggtcgtt 2040
acataactta cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg 2100
tcaataatga cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg 2160
gtggagtatt tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt 2220
acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg 2280
accttatggg actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg 2340
gtgatgcggt tttggcagta catcaatggg cgtggatagc ggtttgactc acggggattt 2400
ccaagtctcc accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac 2460
tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg 2520
tgggaggtct atataagcag agctcgttta gtgaaccgtc agatcgcctg gagacgccat 2580
ccacgctgtt ttgacctcca tagaagacac cgggaccgat ccagcctccg gactctagag 2640
gatccggtac tcgaggaact gaaaaaccag aaagttaact ggtaagttta gtctttttgt 2700
cttttatttc aggtcccgga tccggtggtg gtgcaaatca aagaactgct cctcagtgga 2760
tgttgccttt acttctaggc ctgtacggaa gtgttacttc tgctctaaaa gctgcggaat 2820
tgtacccgcg gccggctagc cgccaccatg gagaagaatg gaaataaccg aaagctgcgg 2880
gtttgtgttg ctacttgtaa ccgtgcagat tattctaaac ttgccccgat catgtttggc 2940
attaaaaccg aacctgagtt ctttgaactt gatgttgtgg tacttggctc tcacctgata 3000
gatgactatg gaaatacata tcgaatgatt gaacaagatg actttgacat taacaccagg 3060
ctacacacaa ttgtgagggg agaagatgag gcagccatgg tggagtcagt aggcctggcc 3120
ctagtgaagc tgccagatgt ccttaatcgc ctgaagcctg atatcatgat tgttcatgga 3180
gacaggtttg atgccctggc tctggccaca tctgctgcct tgatgaacat ccgaatcctt 3240
cacattgaag gtggggaagt cagtgggacc attgatgact ctatcagaca tgccataaca 3300
aaactggctc attatcatgt gtgctgcacc cgcagtgcag agcagcacct gatatccatg 3360
tgtgaggacc atgatcgcat ccttttggca ggctgccctt cctatgacaa acttctctca 3420
gccaagaaca aagactacat gagcatcatt cgcatgtggc taggtgatga tgtaaaatct 3480
aaagattaca ttgttgcact acagcaccct gtgaccactg acattaagca ttccataaaa 3540
atgtttgaat taacattgga tgcacttatc tcatttaaca agcggaccct agtcctgttt 3600
ccaaatattg acgcagggag caaagagatg gttcgagtga tgcggaagaa gggcattgag 3660
catcatccca actttcgtgc agttaaacac gtcccatttg accagtttat acagttggtt 3720
gcccatgctg gctgtatgat tgggaacagc agctgtgggg ttcgagaagt tggagctttt 3780
ggaacacctg tgatcaacct gggaacacgt cagattggaa gagaaacagg ggagaatgtt 3840
cttcatgtcc gggatgctga cacccaagac aaaatattgc aagcactgca ccttcagttt 3900
ggtaaacagt acccttgttc aaagatatat ggggatggaa atgctgttcc aaggattttg 3960
aagtttctca aatctatcga tcttcaagag ccactgcaaa agaaattctg ctttcctcct 4020
gtgaaggaga atatctctca agatattgac catattcttg aaactctaag tgccttggcc 4080
gttgatcttg gcgggacgaa cctccgagtt gcaatagtca gcatgaaggg tgaaatagtt 4140
aagaagtata ctcagttcaa tcctaaaacc tatgaagaga ggattaattt aatcctacag 4200
atgtgtgtgg aagctgcagc agaagctgta aaactgaact gcagaatttt gggagtaggc 4260
atttccacag gtggccgtgt aaatcctcgg gaaggaattg tgctgcattc aaccaaactg 4320
atccaagagt ggaactctgt ggaccttagg accccccttt ctgacacttt gcatctccct 4380
gtgtgggtag acaatgatgg caactgtgct gccctggcgg aaaggaaatt tggccaagga 4440
aagggactgg aaaactttgt tacacttatc acaggcacag gaatcggtgg tggaattatc 4500
catcagcatg aattgatcca cggaagctcc ttctgtgctg cagaactggg ccaccttgtt 4560
gtgtctctgg atgggcctga ttgttcctgt ggaagccatg ggtgcattga agcatacgcc 4620
tctggaatgg ccttgcagag ggaggcaaaa aagctccatg atgaggacct gctcttggtg 4680
gaagggatgt cagtgccaaa agatgaggct gtgggtgcgc tccatctcat ccaagctgcg 4740
aaacttggca atgcgaaggc ccagagcatc ctaagaacag ctggaacagc tttgggtctt 4800
ggggttgtga acatcctcca taccatgaat ccctcccttg tgatcctctc cggagtcctg 4860
gccagtcact atatccacat tgtcaaagac gtcattcgcc agcaggcctt gtcctccgtg 4920
caggacgtgg atgtggtggt ttcggatttg gttgaccccg ccctgctggg tgctgccagc 4980
atggttctgg actacacaac acgcaggatc tactagcatg ccttctgatg gtgaatggga 5040
actcccttcc tcctgcagca gcctgcctgc agctgtcctg gtagaacagt gtggacattg 5100
cagaagctgt cactgcccca gaaagaaagc accccagaga ctagtatggt ccgcgcgagg 5160
caccagccgg gtgggctttg cctcctgctg ctgctgctct gccagttcat ggaggaccgc 5220
agtgcccagg ctgggaactg ctggctccgt caagcgaaga acggccgctg ccaggtcctg 5280
tacaagaccg aactgagcaa ggaggagtgc tgcagcaccg gccggctgag cacctcgtgg 5340
accgaggagg acgtgaatga caacacactc ttcaagtgga tgattttcaa cgggggcgcc 5400
cccaactgca tcccctgtaa agaaacgtgt gagaacgtgg actgtggacc tgggaaaaaa 5460
tgccgaatga acaagaagaa caaaccccgc tgcgtctgcg ccccggattg ttccaacatc 5520
acctggaagg gtccagtctg cgggctggat gggaaaacct accgcaatga atgtgcactc 5580
ctaaaggcaa gatgtaaaga gcagccagaa ctggaagtcc agtaccaagg cagatgtaaa 5640
aagacttgtc gggatgtttt ctgtccaggc agctccacat gtgtggtgga ccagaccaat 5700
aatgcctact gtgtgacctg taatcggatt tgcccagagc ctgcttcctc tgagcaatat 5760
ctctgtggga atgatggagt cacctactcc agtgcctgcc acctgagaaa ggctacctgc 5820
ctgctgggca gatctattgg attagcctat gagggaaagt gtatcaaagc aaagtcctgt 5880
gaagatatcc agtgcactgg tgggaaaaaa tgtttatggg atttcaaggt tgggagaggc 5940
cggtgttccc tctgtgatga gctgtgccct gacagtaagt cggatgagcc tgtctgtgcc 6000
agtgacaatg ccacttatgc cagcgagtgt gccatgaagg aagctgcctg ctcctcaggt 6060
gtgctactgg aagtaaagca ctccggatct tgcaactcca tttcggaaga caccgaggaa 6120
gaggaggaag atgaagacca ggactacagc tttcctatat cttctattct agagtggtaa 6180
gcggccgcgg ggatccagac atgataagat acattgatga gtttggacaa accacaacta 6240
gaatgcagtg aaaaaaatgc tttatttgtg aaatttgtga tgctattgct ttatttgtaa 6300
ccattataag ctgcaataaa caagttaaca acaacaattg cattcatttt atgtttcagg 6360
ttcaggggga ggtgtgggag gttttttcgg atcctctaga gtcgaaaact ctagagcatg 6420
gctacgtaga taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg 6480
agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg 6540
cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc agctgcatta 6600
atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc 6660
gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 6720
ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 6780
aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 6840
ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 6900
aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 6960
gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc 7020
tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 7080
tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 7140
gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 7200
cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 7260
cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 7320
agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 7380
caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 7440
ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgaacaataa 7500
aactgtctgc ttacataaac agtaatacaa ggggtgttat gagccatatt caacgggaaa 7560
cgtcttgctc taggccgcga ttaaattcca acatggatgc tgatttatat gggtataaat 7620
gggctcgcga taatgtcggg caatcaggtg cgacaatcta tcgattgtat gggaagcccg 7680
atgcgccaga gttgtttctg aaacatggca aaggtagcgt tgccaatgat gttacagatg 7740
agatggtcag actaaactgg ctgacggaat ttatgcctct tccgaccatc aagcatttta 7800
tccgtactcc tgatgatgca tggttactca ccactgcgat ccccgggaaa acagcattcc 7860
aggtattaga agaatatcct gattcaggtg aaaatattgt tgatgcgctg gcagtgttcc 7920
tgcgccggtt gcattcgatt cctgtttgta attgtccttt taacagcgat cgcgtatttc 7980
gtctcgctca ggcgcaatca cgaatgaata acggtttggt tgatgcgagt gattttgatg 8040
acgagcgtaa tggctggcct gttgaacaag tctggaaaga aatgcataaa cttttgccat 8100
tctcaccgga ttcagtcgtc actcatggtg atttctcact tgataacctt atttttgacg 8160
aggggaaatt aataggttgt attgatgttg gacgagtcgg aatcgcagac cgataccagg 8220
atcttgccat cctatggaac tgcctcggtg agttttctcc ttcattacag aaacggcttt 8280
ttcaaaaata tggtattgat aatcctgata tgaataaatt gcagtttcat ttgatgctcg 8340
atgagttttt ctaagaattc gttcttcggg gcgaaaactc tcaaggatct taccgctgtt 8400
gagatccagt tcgatgtaac ccactcgtgc 8430
<210> 19
<211> 7937
<212> DNA
<213> 智人
<400> 19
acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg 60
aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact 120
cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga gcggatacat 180
atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc cccgaaaagt 240
gccacctgac gtctaagaaa ccattattat catgacatta acctataaaa ataggcgtat 300
cacgaggccc tttcgtctcg cgcgtttcgg tgatgacggt gaaaacctct gacacatgca 360
gctcccggag acggtcacag cttgtctgta agcggatgcc gggagcagac aagcccgtca 420
gggcgcgtca gcgtgtgttg gcgggtgtcg gggctggctt aactatgcgg catcagagca 480
gattgtactg agagtgcacc atatgcggtg tgaaataccg cacagatgcg taaggagaaa 540
ataccgcatc aggcgattcc aacatccaat aaatcataca ggcaaggcaa agaattagca 600
aaattaagca ataaagcctc agagcataaa gctaaatcgg ttgtaccaaa aacattatga 660
ccctgtaata cttttgcggg agaagccttt atttcaacgc aaggataaaa atttttagaa 720
ccctcatata ttttaaatgc aatgcctgag taatgtgtag gtaaagattc aaacgggtga 780
gaaaggccgg agacagtcaa atcaccatca atatgatatt caaccgttct agctgataaa 840
ttcatgccgg agagggtagc tatttttgag aggtctctac aaaggctatc aggtcattgc 900
ctgagagtct ggagcaaaca agagaatcga tgaacggtaa tcgtaaaact agcatgtcaa 960
tcatatgtac cccggttgat aatcagaaaa gccccaaaaa caggaagatt gtataagcaa 1020
atatttaaat tgtaagcgtt aatattttgt taaaattcgc gttaaatttt tgttaaatca 1080
gctcattttt taaccaatag gccgaaatcg gcaaaatccc ttataaatca aaagaataga 1140
ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 1200
actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 1260
caccctaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 1320
ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 1380
agaaagcgaa aggagcgggc gctagggcgc tggcaagtgt agcggtcacg ctgcgcgtaa 1440
ccaccacacc cgccgcgctt aatgcgccgc tacagggcgc gtactatggt tgctttgacg 1500
agcacgtata acgtgctttc ctcgttagaa tcagagcggg agctaaacag gaggccgatt 1560
aaagggattt tagacaggaa cggtacgcca gaatcctgag aagtgttttt ataatcagtg 1620
aggccaccga gtaaaagagt ctgtccatca cgcaaattaa ccgttgtcgc aatacttctt 1680
tgattagtaa taacatcact tgcctgagta gaagaactca aactatcggc cttgctggta 1740
atatccagaa caatattacc gccagccatt gcaacggaat cgccattcgc cattcaggct 1800
gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctgcgcgc 1860
tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt cgggcgacct ttggtcgccc 1920
ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aactccatca ctaggggttc 1980
cttgtagtta atgattaacc cgccatgcta cttatctacg tagccatgct ctaggtcgtt 2040
acataactta cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg 2100
tcaataatga cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg 2160
gtggagtatt tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt 2220
acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg 2280
accttatggg actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg 2340
gtgatgcggt tttggcagta catcaatggg cgtggatagc ggtttgactc acggggattt 2400
ccaagtctcc accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac 2460
tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg 2520
tgggaggtct atataagcag agctcgttta gtgaaccgtc agatcgcctg gagacgccat 2580
ccacgctgtt ttgacctcca tagaagacac cgggaccgat ccagcctccg gactctagag 2640
gatccggtac tcgaggaact gaaaaaccag aaagttaact ggtaagttta gtctttttgt 2700
cttttatttc aggtcccgga tccggtggtg gtgcaaatca aagaactgct cctcagtgga 2760
tgttgccttt acttctaggc ctgtacggaa gtgttacttc tgctctaaaa gctgcggaat 2820
tgtacccgcg gccggctagc cgccaccatg gagaagaatg gaaataaccg aaagctgcgg 2880
gtttgtgttg ctacttgtaa ccgtgcagat tattctaaac ttgccccgat catgtttggc 2940
attaaaaccg aacctgagtt ctttgaactt gatgttgtgg tacttggctc tcacctgata 3000
gatgactatg gaaatacata tcgaatgatt gaacaagatg actttgacat taacaccagg 3060
ctacacacaa ttgtgagggg agaagatgag gcagccatgg tggagtcagt aggcctggcc 3120
ctagtgaagc tgccagatgt ccttaatcgc ctgaagcctg atatcatgat tgttcatgga 3180
gacaggtttg atgccctggc tctggccaca tctgctgcct tgatgaacat ccgaatcctt 3240
cacattgaag gtggggaagt cagtgggacc attgatgact ctatcagaca tgccataaca 3300
aaactggctc attatcatgt gtgctgcacc cgcagtgcag agcagcacct gatatccatg 3360
tgtgaggacc atgatcgcat ccttttggca ggctgccctt cctatgacaa acttctctca 3420
gccaagaaca aagactacat gagcatcatt cgcatgtggc taggtgatga tgtaaaatct 3480
aaagattaca ttgttgcact acagcaccct gtgaccactg acattaagca ttccataaaa 3540
atgtttgaat taacattgga tgcacttatc tcatttaaca agcggaccct agtcctgttt 3600
ccaaatattg acgcagggag caaagagatg gttcgagtga tgcggaagaa gggcattgag 3660
catcatccca actttcgtgc agttaaacac gtcccatttg accagtttat acagttggtt 3720
gcccatgctg gctgtatgat tgggaacagc agctgtgggg ttcgagaagt tggagctttt 3780
ggaacacctg tgatcaacct gggaacacgt cagattggaa gagaaacagg ggagaatgtt 3840
cttcatgtcc gggatgctga cacccaagac aaaatattgc aagcactgca ccttcagttt 3900
ggtaaacagt acccttgttc aaagatatat ggggatggaa atgctgttcc aaggattttg 3960
aagtttctca aatctatcga tcttcaagag ccactgcaaa agaaattctg ctttcctcct 4020
gtgaaggaga atatctctca agatattgac catattcttg aaactctaag tgccttggcc 4080
gttgatcttg gcgggacgaa cctccgagtt gcaatagtca gcatgaaggg tgaaatagtt 4140
aagaagtata ctcagttcaa tcctaaaacc tatgaagaga ggattaattt aatcctacag 4200
atgtgtgtgg aagctgcagc agaagctgta aaactgaact gcagaatttt gggagtaggc 4260
atttccacag gtggccgtgt aaatcctcgg gaaggaattg tgctgcattc aaccaaactg 4320
atccaagagt ggaactctgt ggaccttagg accccccttt ctgacacttt gcatctccct 4380
gtgtgggtag acaatgatgg caactgtgct gccctggcgg aaaggaaatt tggccaagga 4440
aagggactgg aaaactttgt tacacttatc acaggcacag gaatcggtgg tggaattatc 4500
catcagcatg aattgatcca cggaagctcc ttctgtgctg cagaactggg ccaccttgtt 4560
gtgtctctgg atgggcctga ttgttcctgt ggaagccatg ggtgcattga agcatacgcc 4620
tctggaatgg ccttgcagag ggaggcaaaa aagctccatg atgaggacct gctcttggtg 4680
gaagggatgt cagtgccaaa agatgaggct gtgggtgcgc tccatctcat ccaagctgcg 4740
aaacttggca atgcgaaggc ccagagcatc ctaagaacag ctggaacagc tttgggtctt 4800
ggggttgtga acatcctcca taccatgaat ccctcccttg tgatcctctc cggagtcctg 4860
gccagtcact atatccacat tgtcaaagac gtcattcgcc agcaggcctt gtcctccgtg 4920
caggacgtgg atgtggtggt ttcggatttg gttgaccccg ccctgctggg tgctgccagc 4980
atggttctgg actacacaac acgcaggatc tactagcatg ccttctgatg gtgaatggga 5040
actcccttcc tcctgcagca gcctgcctgc agctgtcctg gtagaacagt gtggacattg 5100
cagaagctgt cactgcccca gaaagaaagc accccagaga ctagggccgc accatgaagc 5160
tgctgccgtc ggtggtgctg aagctctttc tggctgcagt tctctcggca ctggtgactg 5220
gcgagagcct ggagcggctt cggagagggc tagctgctgg aaccagcaac ccggaccctc 5280
ccactgtatc cacggaccag ctgctacccc taggaggcgg ccgggaccgg aaagtccgtg 5340
acttgcaaga ggcagatctg gaccttttga gagtcacttt atcctccaag ccacaagcac 5400
tggccacacc aaacaaggag gagcacggga aaagaaagaa gaaaggcaag gggctaggga 5460
agaagaggga cccaggaccg gagacgctct gcggggctga gctggtggat gctcttcagt 5520
tcgtgtgtgg agacaggggc ttttatttca acaagcccac agggtatggc tccagcagtc 5580
ggagggcgcc tcagacaggc atcgtggatg agtgctgctt ccggagctgt gatctaagga 5640
ggctggagat gtattgcgca cccctcaagc ctgccaagtc agcttaggcg gccgcgggga 5700
tccagacatg ataagataca ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa 5760
aaaatgcttt atttgtgaaa tttgtgatgc tattgcttta tttgtaacca ttataagctg 5820
caataaacaa gttaacaaca acaattgcat tcattttatg tttcaggttc agggggaggt 5880
gtgggaggtt ttttcggatc ctctagagtc gaaaactcta gagcatggct acgtagataa 5940
gtagcatggc gggttaatca ttaactacaa ggaaccccta gtgatggagt tggccactcc 6000
ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg 6060
ctttgcccgg gcggcctcag tgagcgagcg agcgcgcagc tgcattaatg aatcggccaa 6120
cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg 6180
ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg 6240
ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag 6300
gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac 6360
gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga 6420
taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt 6480
accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc 6540
tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc 6600
cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta 6660
agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat 6720
gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca 6780
gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct 6840
tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt 6900
acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct 6960
cagtggaacg aaaactcacg ttaagggatt ttggtcatga acaataaaac tgtctgctta 7020
cataaacagt aatacaaggg gtgttatgag ccatattcaa cgggaaacgt cttgctctag 7080
gccgcgatta aattccaaca tggatgctga tttatatggg tataaatggg ctcgcgataa 7140
tgtcgggcaa tcaggtgcga caatctatcg attgtatggg aagcccgatg cgccagagtt 7200
gtttctgaaa catggcaaag gtagcgttgc caatgatgtt acagatgaga tggtcagact 7260
aaactggctg acggaattta tgcctcttcc gaccatcaag cattttatcc gtactcctga 7320
tgatgcatgg ttactcacca ctgcgatccc cgggaaaaca gcattccagg tattagaaga 7380
atatcctgat tcaggtgaaa atattgttga tgcgctggca gtgttcctgc gccggttgca 7440
ttcgattcct gtttgtaatt gtccttttaa cagcgatcgc gtatttcgtc tcgctcaggc 7500
gcaatcacga atgaataacg gtttggttga tgcgagtgat tttgatgacg agcgtaatgg 7560
ctggcctgtt gaacaagtct ggaaagaaat gcataaactt ttgccattct caccggattc 7620
agtcgtcact catggtgatt tctcacttga taaccttatt tttgacgagg ggaaattaat 7680
aggttgtatt gatgttggac gagtcggaat cgcagaccga taccaggatc ttgccatcct 7740
atggaactgc ctcggtgagt tttctccttc attacagaaa cggctttttc aaaaatatgg 7800
tattgataat cctgatatga ataaattgca gtttcatttg atgctcgatg agtttttcta 7860
agaattcgtt cttcggggcg aaaactctca aggatcttac cgctgttgag atccagttcg 7920
atgtaaccca ctcgtgc 7937
<210> 20
<211> 8223
<212> DNA
<213> 智人
<400> 20
tgaagatcag ttgggtgcac gagtgggtta catcgaactg gatctcaaca gcggtaagat 60
ccttgagagt tttcgccccg aagaacgaat tcttagaaaa actcatcgag catcaaatga 120
aactgcaatt tattcatatc aggattatca ataccatatt tttgaaaaag ccgtttctgt 180
aatgaaggag aaaactcacc gaggcagttc cataggatgg caagatcctg gtatcggtct 240
gcgattccga ctcgtccaac atcaatacaa cctattaatt tcccctcgtc aaaaataagg 300
ttatcaagtg agaaatcacc atgagtgacg actgaatccg gtgagaatgg caaaagttta 360
tgcatttctt tccagacttg ttcaacaggc cagccattac gctcgtcatc aaaatcactc 420
gcatcaacca aaccgttatt cattcgtgat tgcgcctgag cgagacgaaa tacgcgatcg 480
ctgttaaaag gacaattaca aacaggaatc gaatgcaacc ggcgcaggaa cactgccagc 540
gcatcaacaa tattttcacc tgaatcagga tattcttcta atacctggaa tgctgttttc 600
ccggggatcg cagtggtgag taaccatgca tcatcaggag tacggataaa atgcttgatg 660
gtcggaagag gcataaattc cgtcagccag tttagtctga ccatctcatc tgtaacatca 720
ttggcaacgc tacctttgcc atgtttcaga aacaactctg gcgcatcggg cttcccatac 780
aatcgataga ttgtcgcacc tgattgcccg acattatcgc gagcccattt atacccatat 840
aaatcagcat ccatgttgga atttaatcgc ggcctagagc aagacgtttc ccgttgaata 900
tggctcataa caccccttgt attactgttt atgtaagcag acagttttat tgttcatgac 960
caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa 1020
aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc 1080
accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt 1140
aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg 1200
ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc 1260
agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt 1320
accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga 1380
gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct 1440
tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg 1500
cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca 1560
cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa 1620
cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt 1680
ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga 1740
taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga 1800
gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctgcgc 1860
gctcgctcgc tcactgaggc cgcccgggca aagcccgggc gtcgggcgac ctttggtcgc 1920
ccggcctcag tgagcgagcg agcgcgcaga gagggagtgg ccaactccat cactaggggt 1980
tccttgtagt taatgattaa cccgccatgc tacttatcta cgtagccatg ctctagacag 2040
ccactatggg tctaggctgc ccatgtaagg aggcaaggcc tggggacacc cgagatgcct 2100
ggttataatt aacccagaca tgtggctgct cccccccccc caacacctgc tgcctgagcc 2160
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 2220
taaaaataac cctgtccctg gtgggctgtg ggggactgag ggcaggctgt aacaggcttg 2280
ggggccaggg cttatacgtg cctgggactc ccaaagtatt actgttccat gttcccggcg 2340
aagggccagc tgtcccccgc cagctagact cagcacttag tttaggaacc agtgagcaag 2400
tcagcccttg gggcagccca tacaaggcca tggggctggg caagctgcac gcctgggtcc 2460
ggggtgggca cggtgcccgg gcaacgagct gaaagctcat ctgctctcag gggcccctcc 2520
ctggggacag cccctcctgg ctagtcacac cctgtaggct cctctatata acccaggggc 2580
acaggggctg cccccgggtc accaccacct ccacagcaca gacagacact caggagccag 2640
ccagccaggt aagtttagtc tttttgtctt ttatttcagg tcccggatcc ggtggtggtg 2700
caaatcaaag aactgctcct cagtggatgt tgcctttact tctaggcctg tacggaagtg 2760
ttacttctgc tctaaaagct gcggaattgt acccgcggcc ggctagccgc caccatggag 2820
aagaatggaa ataaccgaaa gctgcgggtt tgtgttgcta cttgtaaccg tgcagattat 2880
tctaaacttg ccccgatcat gtttggcatt aaaaccgaac ctgagttctt tgaacttgat 2940
gttgtggtac ttggctctca cctgatagat gactatggaa atacatatcg aatgattgaa 3000
caagatgact ttgacattaa caccaggcta cacacaattg tgaggggaga agatgaggca 3060
gccatggtgg agtcagtagg cctggcccta gtgaagctgc cagatgtcct taatcgcctg 3120
aagcctgata tcatgattgt tcatggagac aggtttgatg ccctggctct ggccacatct 3180
gctgccttga tgaacatccg aatccttcac attgaaggtg gggaagtcag tgggaccatt 3240
gatgactcta tcagacatgc cataacaaaa ctggctcatt atcatgtgtg ctgcacccgc 3300
agtgcagagc agcacctgat atccatgtgt gaggaccatg atcgcatcct tttggcaggc 3360
tgcccttcct atgacaaact tctctcagcc aagaacaaag actacatgag catcattcgc 3420
atgtggctag gtgatgatgt aaaatctaaa gattacattg ttgcactaca gcaccctgtg 3480
accactgaca ttaagcattc cataaaaatg tttgaattaa cattggatgc acttatctca 3540
tttaacaagc ggaccctagt cctgtttcca aatattgacg cagggagcaa agagatggtt 3600
cgagtgatgc ggaagaaggg cattgagcat catcccaact ttcgtgcagt taaacacgtc 3660
ccatttgacc agtttataca gttggttgcc catgctggct gtatgattgg gaacagcagc 3720
tgtggggttc gagaagttgg agcttttgga acacctgtga tcaacctggg aacacgtcag 3780
attggaagag aaacagggga gaatgttctt catgtccggg atgctgacac ccaagacaaa 3840
atattgcaag cactgcacct tcagtttggt aaacagtacc cttgttcaaa gatatatggg 3900
gatggaaatg ctgttccaag gattttgaag tttctcaaat ctatcgatct tcaagagcca 3960
ctgcaaaaga aattctgctt tcctcctgtg aaggagaata tctctcaaga tattgaccat 4020
attcttgaaa ctctaagtgc cttggccgtt gatcttggcg ggacgaacct ccgagttgca 4080
atagtcagca tgaagggtga aatagttaag aagtatactc agttcaatcc taaaacctat 4140
gaagagagga ttaatttaat cctacagatg tgtgtggaag ctgcagcaga agctgtaaaa 4200
ctgaactgca gaattttggg agtaggcatt tccacaggtg gccgtgtaaa tcctcgggaa 4260
ggaattgtgc tgcattcaac caaactgatc caagagtgga actctgtgga ccttaggacc 4320
cccctttctg acactttgca tctccctgtg tgggtagaca atgatggcaa ctgtgctgcc 4380
ctggcggaaa ggaaatttgg ccaaggaaag ggactggaaa actttgttac acttatcaca 4440
ggcacaggaa tcggtggtgg aattatccat cagcatgaat tgatccacgg aagctccttc 4500
tgtgctgcag aactgggcca ccttgttgtg tctctggatg ggcctgattg ttcctgtgga 4560
agccatgggt gcattgaagc atacgcctct ggaatggcct tgcagaggga ggcaaaaaag 4620
ctccatgatg aggacctgct cttggtggaa gggatgtcag tgccaaaaga tgaggctgtg 4680
ggtgcgctcc atctcatcca agctgcgaaa cttggcaatg cgaaggccca gagcatccta 4740
agaacagctg gaacagcttt gggtcttggg gttgtgaaca tcctccatac catgaatccc 4800
tcccttgtga tcctctccgg agtcctggcc agtcactata tccacattgt caaagacgtc 4860
attcgccagc aggccttgtc ctccgtgcag gacgtggatg tggtggtttc ggatttggtt 4920
gaccccgccc tgctgggtgc tgccagcatg gttctggact acacaacacg caggatctac 4980
tagcatgcct tctgatggtg aatgggaact cccttcctcc tgcagcagcc tgcctgcagc 5040
tgtcctggta gaacagtgtg gacattgcag aagctgtcac tgccccagaa agaaagcacc 5100
ccagagacta gtatggtccg cgcgaggcac cagccgggtg ggctttgcct cctgctgctg 5160
ctgctctgcc agttcatgga ggaccgcagt gcccaggctg ggaactgctg gctccgtcaa 5220
gcgaagaacg gccgctgcca ggtcctgtac aagaccgaac tgagcaagga ggagtgctgc 5280
agcaccggcc ggctgagcac ctcgtggacc gaggaggacg tgaatgacaa cacactcttc 5340
aagtggatga ttttcaacgg gggcgccccc aactgcatcc cctgtaaaga aacgtgtgag 5400
aacgtggact gtggacctgg gaaaaaatgc cgaatgaaca agaagaacaa accccgctgc 5460
gtctgcgccc cggattgttc caacatcacc tggaagggtc cagtctgcgg gctggatggg 5520
aaaacctacc gcaatgaatg tgcactccta aaggcaagat gtaaagagca gccagaactg 5580
gaagtccagt accaaggcag atgtaaaaag acttgtcggg atgttttctg tccaggcagc 5640
tccacatgtg tggtggacca gaccaataat gcctactgtg tgacctgtaa tcggatttgc 5700
ccagagcctg cttcctctga gcaatatctc tgtgggaatg atggagtcac ctactccagt 5760
gcctgccacc tgagaaaggc tacctgcctg ctgggcagat ctattggatt agcctatgag 5820
ggaaagtgta tcaaagcaaa gtcctgtgaa gatatccagt gcactggtgg gaaaaaatgt 5880
ttatgggatt tcaaggttgg gagaggccgg tgttccctct gtgatgagct gtgccctgac 5940
agtaagtcgg atgagcctgt ctgtgccagt gacaatgcca cttatgccag cgagtgtgcc 6000
atgaaggaag ctgcctgctc ctcaggtgtg ctactggaag taaagcactc cggatcttgc 6060
aactccattt cggaagacac cgaggaagag gaggaagatg aagaccagga ctacagcttt 6120
cctatatctt ctattctaga gtggtaagcg gccgcaataa aagatcttta ttttcattag 6180
atctgtgtgt tggttttttg tgtgtctaga gcatggctac gtagataagt agcatggcgg 6240
gttaatcatt aactacaagg aacccctagt gatggagttg gccactccct ctctgcgcgc 6300
tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc 6360
ggcctcagtg agcgagcgag cgcgcagctg gcgtaatagc gaagaggccc gcaccgatcg 6420
cccttcccaa cagttgcgca gcctgaatgg cgaatggcga ttccgttgca atggctggcg 6480
gtaatattgt tctggatatt accagcaagg ccgatagttt gagttcttct actcaggcaa 6540
gtgatgttat tactaatcaa agaagtattg cgacaacggt taatttgcgt gatggacaga 6600
ctcttttact cggtggcctc actgattata aaaacacttc tcaggattct ggcgtaccgt 6660
tcctgtctaa aatcccttta atcggcctcc tgtttagctc ccgctctgat tctaacgagg 6720
aaagcacgtt atacgtgctc gtcaaagcaa ccatagtacg cgccctgtag cggcgcatta 6780
agcgcggcgg gtgtggtggt tacgcgcagc gtgaccgcta cacttgccag cgccctagcg 6840
cccgctcctt tcgctttctt cccttccttt ctcgccacgt tcgccggctt tccccgtcaa 6900
gctctaaatc gggggctccc tttagggttc cgatttagtg ctttacggca cctcgacccc 6960
aaaaaacttg attagggtga tggttcacgt agtgggccat cgccctgata gacggttttt 7020
cgccctttga cgttggagtc cacgttcttt aatagtggac tcttgttcca aactggaaca 7080
acactcaacc ctatctcggt ctattctttt gatttataag ggattttgcc gatttcggcc 7140
tattggttaa aaaatgagct gatttaacaa aaatttaacg cgaattttaa caaaatatta 7200
acgcttacaa tttaaatatt tgcttataca atcttcctgt ttttggggct tttctgatta 7260
tcaaccgggg tacatatgat tgacatgcta gttttacgat taccgttcat cgattctctt 7320
gtttgctcca gactctcagg caatgacctg atagcctttg tagagacctc tcaaaaatag 7380
ctaccctctc cggcatgaat ttatcagcta gaacggttga atatcatatt gatggtgatt 7440
tgactgtctc cggcctttct cacccgtttg aatctttacc tacacattac tcaggcattg 7500
catttaaaat atatgagggt tctaaaaatt tttatccttg cgttgaaata aaggcttctc 7560
ccgcaaaagt attacagggt cataatgttt ttggtacaac cgatttagct ttatgctctg 7620
aggctttatt gcttaatttt gctaattctt tgccttgcct gtatgattta ttggatgttg 7680
gaatcgcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac accgcatatg 7740
gtgcactctc agtacaatct gctctgatgc cgcatagtta agccagcccc gacacccgcc 7800
aacacccgct gacgcgccct gacgggcttg tctgctcccg gcatccgctt acagacaagc 7860
tgtgaccgtc tccgggagct gcatgtgtca gaggttttca ccgtcatcac cgaaacgcgc 7920
gagacgaaag ggcctcgtga tacgcctatt tttataggtt aatgtcatga taataatggt 7980
ttcttagacg tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt 8040
tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat aaatgcttca 8100
ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc ttattccctt 8160
ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga aagtaaaaga 8220
tgc 8223
<210> 21
<211> 7726
<212> DNA
<213> 智人
<400> 21
tgaagatcag ttgggtgcac gagtgggtta catcgaactg gatctcaaca gcggtaagat 60
ccttgagagt tttcgccccg aagaacgaat tcttagaaaa actcatcgag catcaaatga 120
aactgcaatt tattcatatc aggattatca ataccatatt tttgaaaaag ccgtttctgt 180
aatgaaggag aaaactcacc gaggcagttc cataggatgg caagatcctg gtatcggtct 240
gcgattccga ctcgtccaac atcaatacaa cctattaatt tcccctcgtc aaaaataagg 300
ttatcaagtg agaaatcacc atgagtgacg actgaatccg gtgagaatgg caaaagttta 360
tgcatttctt tccagacttg ttcaacaggc cagccattac gctcgtcatc aaaatcactc 420
gcatcaacca aaccgttatt cattcgtgat tgcgcctgag cgagacgaaa tacgcgatcg 480
ctgttaaaag gacaattaca aacaggaatc gaatgcaacc ggcgcaggaa cactgccagc 540
gcatcaacaa tattttcacc tgaatcagga tattcttcta atacctggaa tgctgttttc 600
ccggggatcg cagtggtgag taaccatgca tcatcaggag tacggataaa atgcttgatg 660
gtcggaagag gcataaattc cgtcagccag tttagtctga ccatctcatc tgtaacatca 720
ttggcaacgc tacctttgcc atgtttcaga aacaactctg gcgcatcggg cttcccatac 780
aatcgataga ttgtcgcacc tgattgcccg acattatcgc gagcccattt atacccatat 840
aaatcagcat ccatgttgga atttaatcgc ggcctagagc aagacgtttc ccgttgaata 900
tggctcataa caccccttgt attactgttt atgtaagcag acagttttat tgttcatgac 960
caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa 1020
aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc 1080
accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt 1140
aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg 1200
ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc 1260
agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt 1320
accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga 1380
gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct 1440
tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg 1500
cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca 1560
cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa 1620
cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt 1680
ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga 1740
taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga 1800
gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctgcgc 1860
gctcgctcgc tcactgaggc cgcccgggca aagcccgggc gtcgggcgac ctttggtcgc 1920
ccggcctcag tgagcgagcg agcgcgcaga gagggagtgg ccaactccat cactaggggt 1980
tccttgtagt taatgattaa cccgccatgc tacttatcta cgtagccatg ctctagacag 2040
ccactatggg tctaggctgc ccatgtaagg aggcaaggcc tggggacacc cgagatgcct 2100
ggttataatt aacccagaca tgtggctgct cccccccccc caacacctgc tgcctgagcc 2160
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 2220
taaaaataac cctgtccctg gtgggctgtg ggggactgag ggcaggctgt aacaggcttg 2280
ggggccaggg cttatacgtg cctgggactc ccaaagtatt actgttccat gttcccggcg 2340
aagggccagc tgtcccccgc cagctagact cagcacttag tttaggaacc agtgagcaag 2400
tcagcccttg gggcagccca tacaaggcca tggggctggg caagctgcac gcctgggtcc 2460
ggggtgggca cggtgcccgg gcaacgagct gaaagctcat ctgctctcag gggcccctcc 2520
ctggggacag cccctcctgg ctagtcacac cctgtaggct cctctatata acccaggggc 2580
acaggggctg cccccgggtc accaccacct ccacagcaca gacagacact caggagccag 2640
ccagccaggt aagtttagtc tttttgtctt ttatttcagg tcccggatcc ggtggtggtg 2700
caaatcaaag aactgctcct cagtggatgt tgcctttact tctaggcctg tacggaagtg 2760
ttacttctgc tctaaaagct gcggaattgt acccgcggcc ggctagccgc caccatggag 2820
aagaatggaa ataaccgaaa gctgcgggtt tgtgttgcta cttgtaaccg tgcagattat 2880
tctaaacttg ccccgatcat gtttggcatt aaaaccgaac ctgagttctt tgaacttgat 2940
gttgtggtac ttggctctca cctgatagat gactatggaa atacatatcg aatgattgaa 3000
caagatgact ttgacattaa caccaggcta cacacaattg tgaggggaga agatgaggca 3060
gccatggtgg agtcagtagg cctggcccta gtgaagctgc cagatgtcct taatcgcctg 3120
aagcctgata tcatgattgt tcatggagac aggtttgatg ccctggctct ggccacatct 3180
gctgccttga tgaacatccg aatccttcac attgaaggtg gggaagtcag tgggaccatt 3240
gatgactcta tcagacatgc cataacaaaa ctggctcatt atcatgtgtg ctgcacccgc 3300
agtgcagagc agcacctgat atccatgtgt gaggaccatg atcgcatcct tttggcaggc 3360
tgcccttcct atgacaaact tctctcagcc aagaacaaag actacatgag catcattcgc 3420
atgtggctag gtgatgatgt aaaatctaaa gattacattg ttgcactaca gcaccctgtg 3480
accactgaca ttaagcattc cataaaaatg tttgaattaa cattggatgc acttatctca 3540
tttaacaagc ggaccctagt cctgtttcca aatattgacg cagggagcaa agagatggtt 3600
cgagtgatgc ggaagaaggg cattgagcat catcccaact ttcgtgcagt taaacacgtc 3660
ccatttgacc agtttataca gttggttgcc catgctggct gtatgattgg gaacagcagc 3720
tgtggggttc gagaagttgg agcttttgga acacctgtga tcaacctggg aacacgtcag 3780
attggaagag aaacagggga gaatgttctt catgtccggg atgctgacac ccaagacaaa 3840
atattgcaag cactgcacct tcagtttggt aaacagtacc cttgttcaaa gatatatggg 3900
gatggaaatg ctgttccaag gattttgaag tttctcaaat ctatcgatct tcaagagcca 3960
ctgcaaaaga aattctgctt tcctcctgtg aaggagaata tctctcaaga tattgaccat 4020
attcttgaaa ctctaagtgc cttggccgtt gatcttggcg ggacgaacct ccgagttgca 4080
atagtcagca tgaagggtga aatagttaag aagtatactc agttcaatcc taaaacctat 4140
gaagagagga ttaatttaat cctacagatg tgtgtggaag ctgcagcaga agctgtaaaa 4200
ctgaactgca gaattttggg agtaggcatt tccacaggtg gccgtgtaaa tcctcgggaa 4260
ggaattgtgc tgcattcaac caaactgatc caagagtgga actctgtgga ccttaggacc 4320
cccctttctg acactttgca tctccctgtg tgggtagaca atgatggcaa ctgtgctgcc 4380
ctggcggaaa ggaaatttgg ccaaggaaag ggactggaaa actttgttac acttatcaca 4440
ggcacaggaa tcggtggtgg aattatccat cagcatgaat tgatccacgg aagctccttc 4500
tgtgctgcag aactgggcca ccttgttgtg tctctggatg ggcctgattg ttcctgtgga 4560
agccatgggt gcattgaagc atacgcctct ggaatggcct tgcagaggga ggcaaaaaag 4620
ctccatgatg aggacctgct cttggtggaa gggatgtcag tgccaaaaga tgaggctgtg 4680
ggtgcgctcc atctcatcca agctgcgaaa cttggcaatg cgaaggccca gagcatccta 4740
agaacagctg gaacagcttt gggtcttggg gttgtgaaca tcctccatac catgaatccc 4800
tcccttgtga tcctctccgg agtcctggcc agtcactata tccacattgt caaagacgtc 4860
attcgccagc aggccttgtc ctccgtgcag gacgtggatg tggtggtttc ggatttggtt 4920
gaccccgccc tgctgggtgc tgccagcatg gttctggact acacaacacg caggatctac 4980
tagcatgcct tctgatggtg aatgggaact cccttcctcc tgcagcagcc tgcctgcagc 5040
tgtcctggta gaacagtgtg gacattgcag aagctgtcac tgccccagaa agaaagcacc 5100
ccagagaggc cgcaccatga agctgctgcc gtcggtggtg ctgaagctct ttctggctgc 5160
agttctctcg gcactggtga ctggcgagag cctggagcgg cttcggagag ggctagctgc 5220
tggaaccagc aacccggacc ctcccactgt atccacggac cagctgctac ccctaggagg 5280
cggccgggac cggaaagtcc gtgacttgca agaggcagat ctggaccttt tgagagtcac 5340
tttatcctcc aagccacaag cactggccac accaaacaag gaggagcacg ggaaaagaaa 5400
gaagaaaggc aaggggctag ggaagaagag ggacccagga ccggagacgc tctgcggggc 5460
tgagctggtg gatgctcttc agttcgtgtg tggagacagg ggcttttatt tcaacaagcc 5520
cacagggtat ggctccagca gtcggagggc gcctcagaca ggcatcgtgg atgagtgctg 5580
cttccggagc tgtgatctaa ggaggctgga gatgtattgc gcacccctca agcctgccaa 5640
gtcagcttag gcggccgcaa taaaagatct ttattttcat tagatctgtg tgttggtttt 5700
ttgtgtgtct agagcatggc tacgtagata agtagcatgg cgggttaatc attaactaca 5760
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 5820
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 5880
gagcgcgcag ctggcgtaat agcgaagagg cccgcaccga tcgcccttcc caacagttgc 5940
gcagcctgaa tggcgaatgg cgattccgtt gcaatggctg gcggtaatat tgttctggat 6000
attaccagca aggccgatag tttgagttct tctactcagg caagtgatgt tattactaat 6060
caaagaagta ttgcgacaac ggttaatttg cgtgatggac agactctttt actcggtggc 6120
ctcactgatt ataaaaacac ttctcaggat tctggcgtac cgttcctgtc taaaatccct 6180
ttaatcggcc tcctgtttag ctcccgctct gattctaacg aggaaagcac gttatacgtg 6240
ctcgtcaaag caaccatagt acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt 6300
ggttacgcgc agcgtgaccg ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt 6360
cttcccttcc tttctcgcca cgttcgccgg ctttccccgt caagctctaa atcgggggct 6420
ccctttaggg ttccgattta gtgctttacg gcacctcgac cccaaaaaac ttgattaggg 6480
tgatggttca cgtagtgggc catcgccctg atagacggtt tttcgccctt tgacgttgga 6540
gtccacgttc tttaatagtg gactcttgtt ccaaactgga acaacactca accctatctc 6600
ggtctattct tttgatttat aagggatttt gccgatttcg gcctattggt taaaaaatga 6660
gctgatttaa caaaaattta acgcgaattt taacaaaata ttaacgctta caatttaaat 6720
atttgcttat acaatcttcc tgtttttggg gcttttctga ttatcaaccg gggtacatat 6780
gattgacatg ctagttttac gattaccgtt catcgattct cttgtttgct ccagactctc 6840
aggcaatgac ctgatagcct ttgtagagac ctctcaaaaa tagctaccct ctccggcatg 6900
aatttatcag ctagaacggt tgaatatcat attgatggtg atttgactgt ctccggcctt 6960
tctcacccgt ttgaatcttt acctacacat tactcaggca ttgcatttaa aatatatgag 7020
ggttctaaaa atttttatcc ttgcgttgaa ataaaggctt ctcccgcaaa agtattacag 7080
ggtcataatg tttttggtac aaccgattta gctttatgct ctgaggcttt attgcttaat 7140
tttgctaatt ctttgccttg cctgtatgat ttattggatg ttggaatcgc ctgatgcggt 7200
attttctcct tacgcatctg tgcggtattt cacaccgcat atggtgcact ctcagtacaa 7260
tctgctctga tgccgcatag ttaagccagc cccgacaccc gccaacaccc gctgacgcgc 7320
cctgacgggc ttgtctgctc ccggcatccg cttacagaca agctgtgacc gtctccggga 7380
gctgcatgtg tcagaggttt tcaccgtcat caccgaaacg cgcgagacga aagggcctcg 7440
tgatacgcct atttttatag gttaatgtca tgataataat ggtttcttag acgtcaggtg 7500
gcacttttcg gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa 7560
atatgtatcc gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga 7620
agagtatgag tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc 7680
ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa agatgc 7726
<210> 22
<211> 8340
<212> DNA
<213> 智人
<400> 22
gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag 60
ttttcgcccc gaagaacgaa ttcttagaaa aactcatcga gcatcaaatg aaactgcaat 120
ttattcatat caggattatc aataccatat ttttgaaaaa gccgtttctg taatgaagga 180
gaaaactcac cgaggcagtt ccataggatg gcaagatcct ggtatcggtc tgcgattccg 240
actcgtccaa catcaataca acctattaat ttcccctcgt caaaaataag gttatcaagt 300
gagaaatcac catgagtgac gactgaatcc ggtgagaatg gcaaaagttt atgcatttct 360
ttccagactt gttcaacagg ccagccatta cgctcgtcat caaaatcact cgcatcaacc 420
aaaccgttat tcattcgtga ttgcgcctga gcgagacgaa atacgcgatc gctgttaaaa 480
ggacaattac aaacaggaat cgaatgcaac cggcgcagga acactgccag cgcatcaaca 540
atattttcac ctgaatcagg atattcttct aatacctgga atgctgtttt cccggggatc 600
gcagtggtga gtaaccatgc atcatcagga gtacggataa aatgcttgat ggtcggaaga 660
ggcataaatt ccgtcagcca gtttagtctg accatctcat ctgtaacatc attggcaacg 720
ctacctttgc catgtttcag aaacaactct ggcgcatcgg gcttcccata caatcgatag 780
attgtcgcac ctgattgccc gacattatcg cgagcccatt tatacccata taaatcagca 840
tccatgttgg aatttaatcg cggcctagag caagacgttt cccgttgaat atggctcata 900
acaccccttg tattactgtt tatgtaagca gacagtttta ttgttcatga ccaaaatccc 960
ttaacgtgag ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc 1020
ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc 1080
agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt 1140
cagcagagcg cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt 1200
caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc 1260
tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa 1320
ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac 1380
ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg 1440
gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga 1500
gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact 1560
tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa 1620
cgcggccttt ttacggttcc tggccttttg ctggcctttt gctcacatgt tctttcctgc 1680
gttatcccct gattctgtgg ataaccgtat taccgccttt gagtgagctg ataccgctcg 1740
ccgcagccga acgaccgagc gcagcgagtc agtgagcgag gaagcggaag agcgcccaat 1800
acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctgcg cgctcgctcg 1860
ctcactgagg ccgcccgggc aaagcccggg cgtcgggcga cctttggtcg cccggcctca 1920
gtgagcgagc gagcgcgcag agagggagtg gccaactcca tcactagggg ttccttgtag 1980
ttaatgatta acccgccatg ctacttatct acgtagccat gctctagagt ttaaacaagc 2040
ttgaggccag gagctcgagt gctgcctgga caacatagtg agacccttgt ctcaaaaaca 2100
acagcaaccc aaagtcttat ttatcttcag gagctgcgca agccctttac caccgccacg 2160
tttctccctg gatgtcccta ggcctcggga ctggctggga gttccctgta gtggaggccg 2220
ccgctgaact gattataaag atgagagagg ctctgccatg ccttggtcat caattcacac 2280
tccaccagtg tcttctagca gtcacggcaa gggttaacgt cagggaccgc tgtggggtgg 2340
ccgcgctaca cgacagtata gttgcggtcc tggtttatga aataactgag ggaacaagag 2400
gcgcaagaaa tccctccttg ggtgcaagac caaaacaact acccagcggg aagactcggg 2460
cttcagtgcg tgtgtcgcca gtggaggagg acgcttcggg gcgggagcac aagctggcag 2520
gacagccccg cagcagctcc agcgcggcag aggccatgga agatggtccg ctggtcagca 2580
ccctgcctgc gcctcaaaat accgccggga aggtggggga cggggacggg agcagccaat 2640
cacgcgagct ctctcgggtg gcgtcagggc gcgatcgcgg attcggcact ccgggtgggc 2700
gtggctgggc gagcgaggag tggggacaag gtcgagcgac gagtcggcgc gcccaggtaa 2760
gtttagtctt tttgtctttt atttcaggtc ccggatccgg tggtggtgca aatcaaagaa 2820
ctgctcctca gtggatgttg cctttacttc taggcctgta cggaagtgtt acttctgctc 2880
taaaagctgc ggaattgtac ccgcggccgg ctagccgcca ccatggagaa gaatggaaat 2940
aaccgaaagc tgcgggtttg tgttgctact tgtaaccgtg cagattattc taaacttgcc 3000
ccgatcatgt ttggcattaa aaccgaacct gagttctttg aacttgatgt tgtggtactt 3060
ggctctcacc tgatagatga ctatggaaat acatatcgaa tgattgaaca agatgacttt 3120
gacattaaca ccaggctaca cacaattgtg aggggagaag atgaggcagc catggtggag 3180
tcagtaggcc tggccctagt gaagctgcca gatgtcctta atcgcctgaa gcctgatatc 3240
atgattgttc atggagacag gtttgatgcc ctggctctgg ccacatctgc tgccttgatg 3300
aacatccgaa tccttcacat tgaaggtggg gaagtcagtg ggaccattga tgactctatc 3360
agacatgcca taacaaaact ggctcattat catgtgtgct gcacccgcag tgcagagcag 3420
cacctgatat ccatgtgtga ggaccatgat cgcatccttt tggcaggctg cccttcctat 3480
gacaaacttc tctcagccaa gaacaaagac tacatgagca tcattcgcat gtggctaggt 3540
gatgatgtaa aatctaaaga ttacattgtt gcactacagc accctgtgac cactgacatt 3600
aagcattcca taaaaatgtt tgaattaaca ttggatgcac ttatctcatt taacaagcgg 3660
accctagtcc tgtttccaaa tattgacgca gggagcaaag agatggttcg agtgatgcgg 3720
aagaagggca ttgagcatca tcccaacttt cgtgcagtta aacacgtccc atttgaccag 3780
tttatacagt tggttgccca tgctggctgt atgattggga acagcagctg tggggttcga 3840
gaagttggag cttttggaac acctgtgatc aacctgggaa cacgtcagat tggaagagaa 3900
acaggggaga atgttcttca tgtccgggat gctgacaccc aagacaaaat attgcaagca 3960
ctgcaccttc agtttggtaa acagtaccct tgttcaaaga tatatgggga tggaaatgct 4020
gttccaagga ttttgaagtt tctcaaatct atcgatcttc aagagccact gcaaaagaaa 4080
ttctgctttc ctcctgtgaa ggagaatatc tctcaagata ttgaccatat tcttgaaact 4140
ctaagtgcct tggccgttga tcttggcggg acgaacctcc gagttgcaat agtcagcatg 4200
aagggtgaaa tagttaagaa gtatactcag ttcaatccta aaacctatga agagaggatt 4260
aatttaatcc tacagatgtg tgtggaagct gcagcagaag ctgtaaaact gaactgcaga 4320
attttgggag taggcatttc cacaggtggc cgtgtaaatc ctcgggaagg aattgtgctg 4380
cattcaacca aactgatcca agagtggaac tctgtggacc ttaggacccc cctttctgac 4440
actttgcatc tccctgtgtg ggtagacaat gatggcaact gtgctgccct ggcggaaagg 4500
aaatttggcc aaggaaaggg actggaaaac tttgttacac ttatcacagg cacaggaatc 4560
ggtggtggaa ttatccatca gcatgaattg atccacggaa gctccttctg tgctgcagaa 4620
ctgggccacc ttgttgtgtc tctggatggg cctgattgtt cctgtggaag ccatgggtgc 4680
attgaagcat acgcctctgg aatggccttg cagagggagg caaaaaagct ccatgatgag 4740
gacctgctct tggtggaagg gatgtcagtg ccaaaagatg aggctgtggg tgcgctccat 4800
ctcatccaag ctgcgaaact tggcaatgcg aaggcccaga gcatcctaag aacagctgga 4860
acagctttgg gtcttggggt tgtgaacatc ctccatacca tgaatccctc ccttgtgatc 4920
ctctccggag tcctggccag tcactatatc cacattgtca aagacgtcat tcgccagcag 4980
gccttgtcct ccgtgcagga cgtggatgtg gtggtttcgg atttggttga ccccgccctg 5040
ctgggtgctg ccagcatggt tctggactac acaacacgca ggatctacta gcatgccttc 5100
tgatggtgaa tgggaactcc cttcctcctg cagcagcctg cctgcagctg tcctggtaga 5160
acagtgtgga cattgcagaa gctgtcactg ccccagaaag aaagcacccc agagactagt 5220
atggtccgcg cgaggcacca gccgggtggg ctttgcctcc tgctgctgct gctctgccag 5280
ttcatggagg accgcagtgc ccaggctggg aactgctggc tccgtcaagc gaagaacggc 5340
cgctgccagg tcctgtacaa gaccgaactg agcaaggagg agtgctgcag caccggccgg 5400
ctgagcacct cgtggaccga ggaggacgtg aatgacaaca cactcttcaa gtggatgatt 5460
ttcaacgggg gcgcccccaa ctgcatcccc tgtaaagaaa cgtgtgagaa cgtggactgt 5520
ggacctggga aaaaatgccg aatgaacaag aagaacaaac cccgctgcgt ctgcgccccg 5580
gattgttcca acatcacctg gaagggtcca gtctgcgggc tggatgggaa aacctaccgc 5640
aatgaatgtg cactcctaaa ggcaagatgt aaagagcagc cagaactgga agtccagtac 5700
caaggcagat gtaaaaagac ttgtcgggat gttttctgtc caggcagctc cacatgtgtg 5760
gtggaccaga ccaataatgc ctactgtgtg acctgtaatc ggatttgccc agagcctgct 5820
tcctctgagc aatatctctg tgggaatgat ggagtcacct actccagtgc ctgccacctg 5880
agaaaggcta cctgcctgct gggcagatct attggattag cctatgaggg aaagtgtatc 5940
aaagcaaagt cctgtgaaga tatccagtgc actggtggga aaaaatgttt atgggatttc 6000
aaggttggga gaggccggtg ttccctctgt gatgagctgt gccctgacag taagtcggat 6060
gagcctgtct gtgccagtga caatgccact tatgccagcg agtgtgccat gaaggaagct 6120
gcctgctcct caggtgtgct actggaagta aagcactccg gatcttgcaa ctccatttcg 6180
gaagacaccg aggaagagga ggaagatgaa gaccaggact acagctttcc tatatcttct 6240
attctagagt ggtaagcggc cgcaataaaa gatctttatt ttcattagat ctgtgtgttg 6300
gttttttgtg tgtctagagc atggctacgt agataagtag catggcgggt taatcattaa 6360
ctacaaggaa cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac 6420
tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt gcccgggcgg cctcagtgag 6480
cgagcgagcg cgcagctggc gtaatagcga agaggcccgc accgatcgcc cttcccaaca 6540
gttgcgcagc ctgaatggcg aatggcgatt ccgttgcaat ggctggcggt aatattgttc 6600
tggatattac cagcaaggcc gatagtttga gttcttctac tcaggcaagt gatgttatta 6660
ctaatcaaag aagtattgcg acaacggtta atttgcgtga tggacagact cttttactcg 6720
gtggcctcac tgattataaa aacacttctc aggattctgg cgtaccgttc ctgtctaaaa 6780
tccctttaat cggcctcctg tttagctccc gctctgattc taacgaggaa agcacgttat 6840
acgtgctcgt caaagcaacc atagtacgcg ccctgtagcg gcgcattaag cgcggcgggt 6900
gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg ccctagcgcc cgctcctttc 6960
gctttcttcc cttcctttct cgccacgttc gccggctttc cccgtcaagc tctaaatcgg 7020
gggctccctt tagggttccg atttagtgct ttacggcacc tcgaccccaa aaaacttgat 7080
tagggtgatg gttcacgtag tgggccatcg ccctgataga cggtttttcg ccctttgacg 7140
ttggagtcca cgttctttaa tagtggactc ttgttccaaa ctggaacaac actcaaccct 7200
atctcggtct attcttttga tttataaggg attttgccga tttcggccta ttggttaaaa 7260
aatgagctga tttaacaaaa atttaacgcg aattttaaca aaatattaac gcttacaatt 7320
taaatatttg cttatacaat cttcctgttt ttggggcttt tctgattatc aaccggggta 7380
catatgattg acatgctagt tttacgatta ccgttcatcg attctcttgt ttgctccaga 7440
ctctcaggca atgacctgat agcctttgta gagacctctc aaaaatagct accctctccg 7500
gcatgaattt atcagctaga acggttgaat atcatattga tggtgatttg actgtctccg 7560
gcctttctca cccgtttgaa tctttaccta cacattactc aggcattgca tttaaaatat 7620
atgagggttc taaaaatttt tatccttgcg ttgaaataaa ggcttctccc gcaaaagtat 7680
tacagggtca taatgttttt ggtacaaccg atttagcttt atgctctgag gctttattgc 7740
ttaattttgc taattctttg ccttgcctgt atgatttatt ggatgttgga atcgcctgat 7800
gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcatatggt gcactctcag 7860
tacaatctgc tctgatgccg catagttaag ccagccccga cacccgccaa cacccgctga 7920
cgcgccctga cgggcttgtc tgctcccggc atccgcttac agacaagctg tgaccgtctc 7980
cgggagctgc atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga gacgaaaggg 8040
cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt cttagacgtc 8100
aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca 8160
ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 8220
aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt 8280
ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca 8340
<210> 23
<211> 7843
<212> DNA
<213> 智人
<400> 23
gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag 60
ttttcgcccc gaagaacgaa ttcttagaaa aactcatcga gcatcaaatg aaactgcaat 120
ttattcatat caggattatc aataccatat ttttgaaaaa gccgtttctg taatgaagga 180
gaaaactcac cgaggcagtt ccataggatg gcaagatcct ggtatcggtc tgcgattccg 240
actcgtccaa catcaataca acctattaat ttcccctcgt caaaaataag gttatcaagt 300
gagaaatcac catgagtgac gactgaatcc ggtgagaatg gcaaaagttt atgcatttct 360
ttccagactt gttcaacagg ccagccatta cgctcgtcat caaaatcact cgcatcaacc 420
aaaccgttat tcattcgtga ttgcgcctga gcgagacgaa atacgcgatc gctgttaaaa 480
ggacaattac aaacaggaat cgaatgcaac cggcgcagga acactgccag cgcatcaaca 540
atattttcac ctgaatcagg atattcttct aatacctgga atgctgtttt cccggggatc 600
gcagtggtga gtaaccatgc atcatcagga gtacggataa aatgcttgat ggtcggaaga 660
ggcataaatt ccgtcagcca gtttagtctg accatctcat ctgtaacatc attggcaacg 720
ctacctttgc catgtttcag aaacaactct ggcgcatcgg gcttcccata caatcgatag 780
attgtcgcac ctgattgccc gacattatcg cgagcccatt tatacccata taaatcagca 840
tccatgttgg aatttaatcg cggcctagag caagacgttt cccgttgaat atggctcata 900
acaccccttg tattactgtt tatgtaagca gacagtttta ttgttcatga ccaaaatccc 960
ttaacgtgag ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc 1020
ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc 1080
agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt 1140
cagcagagcg cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt 1200
caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc 1260
tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa 1320
ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac 1380
ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg 1440
gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga 1500
gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact 1560
tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa 1620
cgcggccttt ttacggttcc tggccttttg ctggcctttt gctcacatgt tctttcctgc 1680
gttatcccct gattctgtgg ataaccgtat taccgccttt gagtgagctg ataccgctcg 1740
ccgcagccga acgaccgagc gcagcgagtc agtgagcgag gaagcggaag agcgcccaat 1800
acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctgcg cgctcgctcg 1860
ctcactgagg ccgcccgggc aaagcccggg cgtcgggcga cctttggtcg cccggcctca 1920
gtgagcgagc gagcgcgcag agagggagtg gccaactcca tcactagggg ttccttgtag 1980
ttaatgatta acccgccatg ctacttatct acgtagccat gctctagagt ttaaacaagc 2040
ttgaggccag gagctcgagt gctgcctgga caacatagtg agacccttgt ctcaaaaaca 2100
acagcaaccc aaagtcttat ttatcttcag gagctgcgca agccctttac caccgccacg 2160
tttctccctg gatgtcccta ggcctcggga ctggctggga gttccctgta gtggaggccg 2220
ccgctgaact gattataaag atgagagagg ctctgccatg ccttggtcat caattcacac 2280
tccaccagtg tcttctagca gtcacggcaa gggttaacgt cagggaccgc tgtggggtgg 2340
ccgcgctaca cgacagtata gttgcggtcc tggtttatga aataactgag ggaacaagag 2400
gcgcaagaaa tccctccttg ggtgcaagac caaaacaact acccagcggg aagactcggg 2460
cttcagtgcg tgtgtcgcca gtggaggagg acgcttcggg gcgggagcac aagctggcag 2520
gacagccccg cagcagctcc agcgcggcag aggccatgga agatggtccg ctggtcagca 2580
ccctgcctgc gcctcaaaat accgccggga aggtggggga cggggacggg agcagccaat 2640
cacgcgagct ctctcgggtg gcgtcagggc gcgatcgcgg attcggcact ccgggtgggc 2700
gtggctgggc gagcgaggag tggggacaag gtcgagcgac gagtcggcgc gcccaggtaa 2760
gtttagtctt tttgtctttt atttcaggtc ccggatccgg tggtggtgca aatcaaagaa 2820
ctgctcctca gtggatgttg cctttacttc taggcctgta cggaagtgtt acttctgctc 2880
taaaagctgc ggaattgtac ccgcggccgg ctagccgcca ccatggagaa gaatggaaat 2940
aaccgaaagc tgcgggtttg tgttgctact tgtaaccgtg cagattattc taaacttgcc 3000
ccgatcatgt ttggcattaa aaccgaacct gagttctttg aacttgatgt tgtggtactt 3060
ggctctcacc tgatagatga ctatggaaat acatatcgaa tgattgaaca agatgacttt 3120
gacattaaca ccaggctaca cacaattgtg aggggagaag atgaggcagc catggtggag 3180
tcagtaggcc tggccctagt gaagctgcca gatgtcctta atcgcctgaa gcctgatatc 3240
atgattgttc atggagacag gtttgatgcc ctggctctgg ccacatctgc tgccttgatg 3300
aacatccgaa tccttcacat tgaaggtggg gaagtcagtg ggaccattga tgactctatc 3360
agacatgcca taacaaaact ggctcattat catgtgtgct gcacccgcag tgcagagcag 3420
cacctgatat ccatgtgtga ggaccatgat cgcatccttt tggcaggctg cccttcctat 3480
gacaaacttc tctcagccaa gaacaaagac tacatgagca tcattcgcat gtggctaggt 3540
gatgatgtaa aatctaaaga ttacattgtt gcactacagc accctgtgac cactgacatt 3600
aagcattcca taaaaatgtt tgaattaaca ttggatgcac ttatctcatt taacaagcgg 3660
accctagtcc tgtttccaaa tattgacgca gggagcaaag agatggttcg agtgatgcgg 3720
aagaagggca ttgagcatca tcccaacttt cgtgcagtta aacacgtccc atttgaccag 3780
tttatacagt tggttgccca tgctggctgt atgattggga acagcagctg tggggttcga 3840
gaagttggag cttttggaac acctgtgatc aacctgggaa cacgtcagat tggaagagaa 3900
acaggggaga atgttcttca tgtccgggat gctgacaccc aagacaaaat attgcaagca 3960
ctgcaccttc agtttggtaa acagtaccct tgttcaaaga tatatgggga tggaaatgct 4020
gttccaagga ttttgaagtt tctcaaatct atcgatcttc aagagccact gcaaaagaaa 4080
ttctgctttc ctcctgtgaa ggagaatatc tctcaagata ttgaccatat tcttgaaact 4140
ctaagtgcct tggccgttga tcttggcggg acgaacctcc gagttgcaat agtcagcatg 4200
aagggtgaaa tagttaagaa gtatactcag ttcaatccta aaacctatga agagaggatt 4260
aatttaatcc tacagatgtg tgtggaagct gcagcagaag ctgtaaaact gaactgcaga 4320
attttgggag taggcatttc cacaggtggc cgtgtaaatc ctcgggaagg aattgtgctg 4380
cattcaacca aactgatcca agagtggaac tctgtggacc ttaggacccc cctttctgac 4440
actttgcatc tccctgtgtg ggtagacaat gatggcaact gtgctgccct ggcggaaagg 4500
aaatttggcc aaggaaaggg actggaaaac tttgttacac ttatcacagg cacaggaatc 4560
ggtggtggaa ttatccatca gcatgaattg atccacggaa gctccttctg tgctgcagaa 4620
ctgggccacc ttgttgtgtc tctggatggg cctgattgtt cctgtggaag ccatgggtgc 4680
attgaagcat acgcctctgg aatggccttg cagagggagg caaaaaagct ccatgatgag 4740
gacctgctct tggtggaagg gatgtcagtg ccaaaagatg aggctgtggg tgcgctccat 4800
ctcatccaag ctgcgaaact tggcaatgcg aaggcccaga gcatcctaag aacagctgga 4860
acagctttgg gtcttggggt tgtgaacatc ctccatacca tgaatccctc ccttgtgatc 4920
ctctccggag tcctggccag tcactatatc cacattgtca aagacgtcat tcgccagcag 4980
gccttgtcct ccgtgcagga cgtggatgtg gtggtttcgg atttggttga ccccgccctg 5040
ctgggtgctg ccagcatggt tctggactac acaacacgca ggatctacta gcatgccttc 5100
tgatggtgaa tgggaactcc cttcctcctg cagcagcctg cctgcagctg tcctggtaga 5160
acagtgtgga cattgcagaa gctgtcactg ccccagaaag aaagcacccc agagaggccg 5220
caccatgaag ctgctgccgt cggtggtgct gaagctcttt ctggctgcag ttctctcggc 5280
actggtgact ggcgagagcc tggagcggct tcggagaggg ctagctgctg gaaccagcaa 5340
cccggaccct cccactgtat ccacggacca gctgctaccc ctaggaggcg gccgggaccg 5400
gaaagtccgt gacttgcaag aggcagatct ggaccttttg agagtcactt tatcctccaa 5460
gccacaagca ctggccacac caaacaagga ggagcacggg aaaagaaaga agaaaggcaa 5520
ggggctaggg aagaagaggg acccaggacc ggagacgctc tgcggggctg agctggtgga 5580
tgctcttcag ttcgtgtgtg gagacagggg cttttatttc aacaagccca cagggtatgg 5640
ctccagcagt cggagggcgc ctcagacagg catcgtggat gagtgctgct tccggagctg 5700
tgatctaagg aggctggaga tgtattgcgc acccctcaag cctgccaagt cagcttaggc 5760
ggccgcaata aaagatcttt attttcatta gatctgtgtg ttggtttttt gtgtgtctag 5820
agcatggcta cgtagataag tagcatggcg ggttaatcat taactacaag gaacccctag 5880
tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa 5940
aggtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga gcgcgcagct 6000
ggcgtaatag cgaagaggcc cgcaccgatc gcccttccca acagttgcgc agcctgaatg 6060
gcgaatggcg attccgttgc aatggctggc ggtaatattg ttctggatat taccagcaag 6120
gccgatagtt tgagttcttc tactcaggca agtgatgtta ttactaatca aagaagtatt 6180
gcgacaacgg ttaatttgcg tgatggacag actcttttac tcggtggcct cactgattat 6240
aaaaacactt ctcaggattc tggcgtaccg ttcctgtcta aaatcccttt aatcggcctc 6300
ctgtttagct cccgctctga ttctaacgag gaaagcacgt tatacgtgct cgtcaaagca 6360
accatagtac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag 6420
cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct tcccttcctt 6480
tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc ctttagggtt 6540
ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg atggttcacg 6600
tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt ccacgttctt 6660
taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg tctattcttt 6720
tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc tgatttaaca 6780
aaaatttaac gcgaatttta acaaaatatt aacgcttaca atttaaatat ttgcttatac 6840
aatcttcctg tttttggggc ttttctgatt atcaaccggg gtacatatga ttgacatgct 6900
agttttacga ttaccgttca tcgattctct tgtttgctcc agactctcag gcaatgacct 6960
gatagccttt gtagagacct ctcaaaaata gctaccctct ccggcatgaa tttatcagct 7020
agaacggttg aatatcatat tgatggtgat ttgactgtct ccggcctttc tcacccgttt 7080
gaatctttac ctacacatta ctcaggcatt gcatttaaaa tatatgaggg ttctaaaaat 7140
ttttatcctt gcgttgaaat aaaggcttct cccgcaaaag tattacaggg tcataatgtt 7200
tttggtacaa ccgatttagc tttatgctct gaggctttat tgcttaattt tgctaattct 7260
ttgccttgcc tgtatgattt attggatgtt ggaatcgcct gatgcggtat tttctcctta 7320
cgcatctgtg cggtatttca caccgcatat ggtgcactct cagtacaatc tgctctgatg 7380
ccgcatagtt aagccagccc cgacacccgc caacacccgc tgacgcgccc tgacgggctt 7440
gtctgctccc ggcatccgct tacagacaag ctgtgaccgt ctccgggagc tgcatgtgtc 7500
agaggttttc accgtcatca ccgaaacgcg cgagacgaaa gggcctcgtg atacgcctat 7560
ttttataggt taatgtcatg ataataatgg tttcttagac gtcaggtggc acttttcggg 7620
gaaatgtgcg cggaacccct atttgtttat ttttctaaat acattcaaat atgtatccgc 7680
tcatgagaca ataaccctga taaatgcttc aataatattg aaaaaggaag agtatgagta 7740
ttcaacattt ccgtgtcgcc cttattccct tttttgcggc attttgcctt cctgtttttg 7800
ctcacccaga aacgctggtg aaagtaaaag atgctgaaga tca 7843
<210> 24
<211> 6594
<212> DNA
<213> 智人
<400> 24
acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg 60
aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact 120
cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga gcggatacat 180
atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc cccgaaaagt 240
gccacctgac gtctaagaaa ccattattat catgacatta acctataaaa ataggcgtat 300
cacgaggccc tttcgtctcg cgcgtttcgg tgatgacggt gaaaacctct gacacatgca 360
gctcccggag acggtcacag cttgtctgta agcggatgcc gggagcagac aagcccgtca 420
gggcgcgtca gcgtgtgttg gcgggtgtcg gggctggctt aactatgcgg catcagagca 480
gattgtactg agagtgcacc atatgcggtg tgaaataccg cacagatgcg taaggagaaa 540
ataccgcatc aggcgattcc aacatccaat aaatcataca ggcaaggcaa agaattagca 600
aaattaagca ataaagcctc agagcataaa gctaaatcgg ttgtaccaaa aacattatga 660
ccctgtaata cttttgcggg agaagccttt atttcaacgc aaggataaaa atttttagaa 720
ccctcatata ttttaaatgc aatgcctgag taatgtgtag gtaaagattc aaacgggtga 780
gaaaggccgg agacagtcaa atcaccatca atatgatatt caaccgttct agctgataaa 840
ttcatgccgg agagggtagc tatttttgag aggtctctac aaaggctatc aggtcattgc 900
ctgagagtct ggagcaaaca agagaatcga tgaacggtaa tcgtaaaact agcatgtcaa 960
tcatatgtac cccggttgat aatcagaaaa gccccaaaaa caggaagatt gtataagcaa 1020
atatttaaat tgtaagcgtt aatattttgt taaaattcgc gttaaatttt tgttaaatca 1080
gctcattttt taaccaatag gccgaaatcg gcaaaatccc ttataaatca aaagaataga 1140
ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 1200
actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 1260
caccctaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 1320
ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 1380
agaaagcgaa aggagcgggc gctagggcgc tggcaagtgt agcggtcacg ctgcgcgtaa 1440
ccaccacacc cgccgcgctt aatgcgccgc tacagggcgc gtactatggt tgctttgacg 1500
agcacgtata acgtgctttc ctcgttagaa tcagagcggg agctaaacag gaggccgatt 1560
aaagggattt tagacaggaa cggtacgcca gaatcctgag aagtgttttt ataatcagtg 1620
aggccaccga gtaaaagagt ctgtccatca cgcaaattaa ccgttgtcgc aatacttctt 1680
tgattagtaa taacatcact tgcctgagta gaagaactca aactatcggc cttgctggta 1740
atatccagaa caatattacc gccagccatt gcaacggaat cgccattcgc cattcaggct 1800
gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctgcgcgc 1860
tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt cgggcgacct ttggtcgccc 1920
ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aactccatca ctaggggttc 1980
ctaggaagct ttcgttacat aacttacggt aaatggcccg cctggctgac cgcccaacga 2040
cccccggact cacggggatt tccaagtctc caccccattg acgtcaatgg gagtttgttt 2100
tggcaccaaa atcaacggga ctttccaaaa tgtcgtaaca actccgcccc attgacgcaa 2160
atgggcggta ggcgtgtacg gtgggaggtc tatataagca gagctcgttt agtgaaccgc 2220
tcgaccgggg tacccggccg gctagccgcc accatggaga agaatggaaa taaccgaaag 2280
ctgcgggttt gtgttgctac ttgtaaccgt gcagattatt ctaaacttgc cccgatcatg 2340
tttggcatta aaaccgaacc tgagttcttt gaacttgatg ttgtggtact tggctctcac 2400
ctgatagatg actatggaaa tacatatcga atgattgaac aagatgactt tgacattaac 2460
accaggctac acacaattgt gaggggagaa gatgaggcag ccatggtgga gtcagtaggc 2520
ctggccctag tgaagctgcc agatgtcctt aatcgcctga agcctgatat catgattgtt 2580
catggagaca ggtttgatgc cctggctctg gccacatctg ctgccttgat gaacatccga 2640
atccttcaca ttgaaggtgg ggaagtcagt gggaccattg atgactctat cagacatgcc 2700
ataacaaaac tggctcatta tcatgtgtgc tgcacccgca gtgcagagca gcacctgata 2760
tccatgtgtg aggaccatga tcgcatcctt ttggcaggct gcccttccta tgacaaactt 2820
ctctcagcca agaacaaaga ctacatgagc atcattcgca tgtggctagg tgatgatgta 2880
aaatctaaag attacattgt tgcactacag caccctgtga ccactgacat taagcattcc 2940
ataaaaatgt ttgaattaac attggatgca cttatctcat ttaacaagcg gaccctagtc 3000
ctgtttccaa atattgacgc agggagcaaa gagatggttc gagtgatgcg gaagaagggc 3060
attgagcatc atcccaactt tcgtgcagtt aaacacgtcc catttgacca gtttatacag 3120
ttggttgccc atgctggctg tatgattggg aacagcagct gtggggttcg agaagttgga 3180
gcttttggaa cacctgtgat caacctggga acacgtcaga ttggaagaga aacaggggag 3240
aatgttcttc atgtccggga tgctgacacc caagacaaaa tattgcaagc actgcacctt 3300
cagtttggta aacagtaccc ttgttcaaag atatatgggg atggaaatgc tgttccaagg 3360
attttgaagt ttctcaaatc tatcgatctt caagagccac tgcaaaagaa attctgcttt 3420
cctcctgtga aggagaatat ctctcaagat attgaccata ttcttgaaac tctaagtgcc 3480
ttggccgttg atcttggcgg gacgaacctc cgagttgcaa tagtcagcat gaagggtgaa 3540
atagttaaga agtatactca gttcaatcct aaaacctatg aagagaggat taatttaatc 3600
ctacagatgt gtgtggaagc tgcagcagaa gctgtaaaac tgaactgcag aattttggga 3660
gtaggcattt ccacaggtgg ccgtgtaaat cctcgggaag gaattgtgct gcattcaacc 3720
aaactgatcc aagagtggaa ctctgtggac cttaggaccc ccctttctga cactttgcat 3780
ctccctgtgt gggtagacaa tgatggcaac tgtgctgccc tggcggaaag gaaatttggc 3840
caaggaaagg gactggaaaa ctttgttaca cttatcacag gcacaggaat cggtggtgga 3900
attatccatc agcatgaatt gatccacgga agctccttct gtgctgcaga actgggccac 3960
cttgttgtgt ctctggatgg gcctgattgt tcctgtggaa gccatgggtg cattgaagca 4020
tacgcctctg gaatggcctt gcagagggag gcaaaaaagc tccatgatga ggacctgctc 4080
ttggtggaag ggatgtcagt gccaaaagat gaggctgtgg gtgcgctcca tctcatccaa 4140
gctgcgaaac ttggcaatgc gaaggcccag agcatcctaa gaacagctgg aacagctttg 4200
ggtcttgggg ttgtgaacat cctccatacc atgaatccct cccttgtgat cctctccgga 4260
gtcctggcca gtcactatat ccacattgtc aaagacgtca ttcgccagca ggccttgtcc 4320
tccgtgcagg acgtggatgt ggtggtttcg gatttggttg accccgccct gctgggtgct 4380
gccagcatgg ttctggacta cacaacacgc aggatctact agcatgcact agtgcggccg 4440
cggatctcag acatgataag atacattgat gagtttggac aaaccacaac tagaatgcag 4500
tgaaaaaaat gctttatttg tgaaatttgt gatgctattg ctttatttgt aaccattata 4560
agctgcaata aacaagttaa caacaacaat tgcattcatt ttatgtttca ggttcagggg 4620
gaggtgtggg aggtttttta ggtttaaacc ccactccctc tctgcgcgct cgctcgctca 4680
ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga 4740
gcgagcgagc gcgcagctgc attaatgaat cggccaacgc gcggggagag gcggtttgcg 4800
tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg 4860
gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa 4920
cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc 4980
gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc 5040
aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag 5100
ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct 5160
cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta 5220
ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc 5280
cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc 5340
agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt 5400
gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct gcgctctgct 5460
gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc 5520
tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca 5580
agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta 5640
agggattttg gtcatgaaca ataaaactgt ctgcttacat aaacagtaat acaaggggtg 5700
ttatgagcca tattcaacgg gaaacgtctt gctctaggcc gcgattaaat tccaacatgg 5760
atgctgattt atatgggtat aaatgggctc gcgataatgt cgggcaatca ggtgcgacaa 5820
tctatcgatt gtatgggaag cccgatgcgc cagagttgtt tctgaaacat ggcaaaggta 5880
gcgttgccaa tgatgttaca gatgagatgg tcagactaaa ctggctgacg gaatttatgc 5940
ctcttccgac catcaagcat tttatccgta ctcctgatga tgcatggtta ctcaccactg 6000
cgatccccgg gaaaacagca ttccaggtat tagaagaata tcctgattca ggtgaaaata 6060
ttgttgatgc gctggcagtg ttcctgcgcc ggttgcattc gattcctgtt tgtaattgtc 6120
cttttaacag cgatcgcgta tttcgtctcg ctcaggcgca atcacgaatg aataacggtt 6180
tggttgatgc gagtgatttt gatgacgagc gtaatggctg gcctgttgaa caagtctgga 6240
aagaaatgca taaacttttg ccattctcac cggattcagt cgtcactcat ggtgatttct 6300
cacttgataa ccttattttt gacgagggga aattaatagg ttgtattgat gttggacgag 6360
tcggaatcgc agaccgatac caggatcttg ccatcctatg gaactgcctc ggtgagtttt 6420
ctccttcatt acagaaacgg ctttttcaaa aatatggtat tgataatcct gatatgaata 6480
aattgcagtt tcatttgatg ctcgatgagt ttttctaaga attcgttctt cggggcgaaa 6540
actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc gtgc 6594
<210> 25
<211> 8340
<212> DNA
<213> 智人
<220>
<221> misc_feature
<222> (6)..(6)
<223> n是a、c、g或t
<220>
<221> misc_feature
<222> (15)..(15)
<223> n是a、c、g或t
<220>
<221> misc_feature
<222> (20)..(20)
<223> n是a、c、g或t
<400> 25
gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag 60
ttttcgcccc gaagaacgaa ttcttagaaa aactcatcga gcatcaaatg aaactgcaat 120
ttattcatat caggattatc aataccatat ttttgaaaaa gccgtttctg taatgaagga 180
gaaaactcac cgaggcagtt ccataggatg gcaagatcct ggtatcggtc tgcgattccg 240
actcgtccaa catcaataca acctattaat ttcccctcgt caaaaataag gttatcaagt 300
gagaaatcac catgagtgac gactgaatcc ggtgagaatg gcaaaagttt atgcatttct 360
ttccagactt gttcaacagg ccagccatta cgctcgtcat caaaatcact cgcatcaacc 420
aaaccgttat tcattcgtga ttgcgcctga gcgagacgaa atacgcgatc gctgttaaaa 480
ggacaattac aaacaggaat cgaatgcaac cggcgcagga acactgccag cgcatcaaca 540
atattttcac ctgaatcagg atattcttct aatacctgga atgctgtttt cccggggatc 600
gcagtggtga gtaaccatgc atcatcagga gtacggataa aatgcttgat ggtcggaaga 660
ggcataaatt ccgtcagcca gtttagtctg accatctcat ctgtaacatc attggcaacg 720
ctacctttgc catgtttcag aaacaactct ggcgcatcgg gcttcccata caatcgatag 780
attgtcgcac ctgattgccc gacattatcg cgagcccatt tatacccata taaatcagca 840
tccatgttgg aatttaatcg cggcctagag caagacgttt cccgttgaat atggctcata 900
acaccccttg tattactgtt tatgtaagca gacagtttta ttgttcatga ccaaaatccc 960
ttaacgtgag ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc 1020
ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc 1080
agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt 1140
cagcagagcg cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt 1200
caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc 1260
tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa 1320
ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac 1380
ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg 1440
gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga 1500
gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact 1560
tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa 1620
cgcggccttt ttacggttcc tggccttttg ctggcctttt gctcacatgt tctttcctgc 1680
gttatcccct gattctgtgg ataaccgtat taccgccttt gagtgagctg ataccgctcg 1740
ccgcagccga acgaccgagc gcagcgagtc agtgagcgag gaagcggaag agcgcccaat 1800
acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctgcg cgctcgctcg 1860
ctcactgagg ccgcccgggc aaagcccggg cgtcgggcga cctttggtcg cccggcctca 1920
gtgagcgagc gagcgcgcag agagggagtg gccaactcca tcactagggg ttccttgtag 1980
ttaatgatta acccgccatg ctacttatct acgtagccat gctctagagt ttaaacaagc 2040
ttgaggccag gagctcgagt gctgcctgga caacatagtg agacccttgt ctcaaaaaca 2100
acagcaaccc aaagtcttat ttatcttcag gagctgcgca agccctttac caccgccacg 2160
tttctccctg gatgtcccta ggcctcggga ctggctggga gttccctgta gtggaggccg 2220
ccgctgaact gattataaag atgagagagg ctctgccatg ccttggtcat caattcacac 2280
tccaccagtg tcttctagca gtcacggcaa gggttaacgt cagggaccgc tgtggggtgg 2340
ccgcgctaca cgacagtata gttgcggtcc tggtttatga aataactgag ggaacaagag 2400
gcgcaagaaa tccctccttg ggtgcaagac caaaacaact acccagcggg aagactcggg 2460
cttcagtgcg tgtgtcgcca gtggaggagg acgcttcggg gcgggagcac aagctggcag 2520
gacagccccg cagcagctcc agcgcggcag aggccatgga agatggtccg ctggtcagca 2580
ccctgcctgc gcctcaaaat accgccggga aggtggggga cggggacggg agcagccaat 2640
cacgcgagct ctctcgggtg gcgtcagggc gcgatcgcgg attcggcact ccgggtgggc 2700
gtggctgggc gagcgaggag tggggacaag gtcgagcgac gagtcggcgc gcccaggtaa 2760
gtttagtctt tttgtctttt atttcaggtc ccggatccgg tggtggtgca aatcaaagaa 2820
ctgctcctca gtggatgttg cctttacttc taggcctgta cggaagtgtt acttctgctc 2880
taaaagctgc ggaattgtac ccgcggccgg ctagccgcca ccatggagaa gaatggaaat 2940
aaccgaaagc tgcgggtttg tgttgctact tgtaaccgtg cagattattc taaacttgcc 3000
ccgatcatgt ttggcattaa aaccgaacct gagttctttg aacttgatgt tgtggtactt 3060
ggctctcacc tgatagatga ctatggaaat acatatcgaa tgattgaaca agatgacttt 3120
gacattaaca ccaggctaca cacaattgtg aggggagaag atgaggcagc catggtggag 3180
tcagtaggcc tggccctagt gaagctgcca gatgtcctta atcgcctgaa gcctgatatc 3240
atgattgttc atggagacag gtttgatgcc ctggctctgg ccacatctgc tgccttgatg 3300
aacatccgaa tccttcacat tgaaggtggg gaagtcagtg ggaccattga tgactctatc 3360
agacatgcca taacaaaact ggctcattat catgtgtgct gcacccgcag tgcagagcag 3420
cacctgatat ccatgtgtga ggaccatgat cgcatccttt tggcaggctg cccttcctat 3480
gacaaacttc tctcagccaa gaacaaagac tacatgagca tcattcgcat gtggctaggt 3540
gatgatgtaa aatctaaaga ttacattgtt gcactacagc accctgtgac cactgacatt 3600
aagcattcca taaaaatgtt tgaattaaca ttggatgcac ttatctcatt taacaagcgg 3660
accctagtcc tgtttccaaa tattgacgca gggagcaaag agatggttcg agtgatgcgg 3720
aagaagggca ttgagcatca tcccaacttt cgtgcagtta aacacgtccc atttgaccag 3780
tttatacagt tggttgccca tgctggctgt atgattggga acagcagctg tggggttcga 3840
gaagttggag cttttggaac acctgtgatc aacctgggaa cacgtcagat tggaagagaa 3900
acaggggaga atgttcttca tgtccgggat gctgacaccc aagacaaaat attgcaagca 3960
ctgcaccttc agtttggtaa acagtaccct tgttcaaaga tatatgggga tggaaatgct 4020
gttccaagga ttttgaagtt tctcaaatct atcgatcttc aagagccact gcaaaagaaa 4080
ttctgctttc ctcctgtgaa ggagaatatc tctcaagata ttgaccatat tcttgaaact 4140
ctaagtgcct tggccgttga tcttggcggg acgaacctcc gagttgcaat agtcagcatg 4200
aagggtgaaa tagttaagaa gtatactcag ttcaatccta aaacctatga agagaggatt 4260
aatttaatcc tacagatgtg tgtggaagct gcagcagaag ctgtaaaact gaactgcaga 4320
attttgggag taggcatttc cacaggtggc cgtgtaaatc ctcgggaagg aattgtgctg 4380
cattcaacca aactgatcca agagtggaac tctgtggacc ttaggacccc cctttctgac 4440
actttgcatc tccctgtgtg ggtagacaat gatggcaact gtgctgccct ggcggaaagg 4500
aaatttggcc aaggaaaggg actggaaaac tttgttacac ttatcacagg cacaggaatc 4560
ggtggtggaa ttatccatca gcatgaattg atccacggaa gctccttctg tgctgcagaa 4620
ctgggccacc ttgttgtgtc tctggatggg cctgattgtt cctgtggaag ccatgggtgc 4680
attgaagcat acgcctctgg aatggccttg cagagggagg caaaaaagct ccatgatgag 4740
gacctgctct tggtggaagg gatgtcagtg ccaaaagatg aggctgtggg tgcgctccat 4800
ctcatccaag ctgcgaaact tggcaatgcg aaggcccaga gcatcctaag aacagctgga 4860
acagctttgg gtcttggggt tgtgaacatc ctccatacca tgaatccctc ccttgtgatc 4920
ctctccggag tcctggccag tcactatatc cacattgtca aagacgtcat tcgccagcag 4980
gccttgtcct ccgtgcagga cgtggatgtg gtggtttcgg atttggttga ccccgccctg 5040
ctgggtgctg ccagcatggt tctggactac acaacacgca ggatctacta gcatgccttc 5100
tgatggtgaa tgggaactcc cttcctcctg cagcagcctg cctgcagctg tcctggtaga 5160
acagtgtgga cattgcagaa gctgtcactg ccccagaaag aaagcacccc agagactagt 5220
atggtccgcg cgaggcacca gccgggtggg ctttgcctcc tgctgctgct gctctgccag 5280
ttcatggagg accgcagtgc ccaggctggg aactgctggc tccgtcaagc gaagaacggc 5340
cgctgccagg tcctgtacaa gaccgaactg agcaaggagg agtgctgcag caccggccgg 5400
ctgagcacct cgtggaccga ggaggacgtg aatgacaaca cactcttcaa gtggatgatt 5460
ttcaacgggg gcgcccccaa ctgcatcccc tgtaaagaaa cgtgtgagaa cgtggactgt 5520
ggacctggga aaaaatgccg aatgaacaag aagaacaaac cccgctgcgt ctgcgccccg 5580
gattgttcca acatcacctg gaagggtcca gtctgcgggc tggatgggaa aacctaccgc 5640
aatgaatgtg cactcctaaa ggcaagatgt aaagagcagc cagaactgga agtccagtac 5700
caaggcagat gtaaaaagac ttgtcgggat gttttctgtc caggcagctc cacatgtgtg 5760
gtggaccaga ccaataatgc ctactgtgtg acctgtaatc ggatttgccc agagcctgct 5820
tcctctgagc aatatctctg tgggaatgat ggagtcacct actccagtgc ctgccacctg 5880
agaaaggcta cctgcctgct gggcagatct attggattag cctatgaggg aaagtgtatc 5940
aaagcaaagt cctgtgaaga tatccagtgc actggtggga aaaaatgttt atgggatttc 6000
aaggttggga gaggccggtg ttccctctgt gatgagctgt gccctgacag taagtcggat 6060
gagcctgtct gtgccagtga caatgccact tatgccagcg agtgtgccat gaaggaagct 6120
gcctgctcct caggtgtgct actggaagta aagcactccg gatcttgcaa ctccatttcg 6180
gaagacaccg aggaagagga ggaagatgaa gaccaggact acagctttcc tatatcttct 6240
attctagagt ggtaagcggc cgcaataaaa gatctttatt ttcattagat ctgtgtgttg 6300
gttttttgtg tgtctagagc atggctacgt agataagtag catggcgggt taatcattaa 6360
ctacaaggaa cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac 6420
tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt gcccgggcgg cctcagtgag 6480
cgagcgagcg cgcagctggc gtaatagcga agaggcccgc accgatcgcc cttcccaaca 6540
gttgcgcagc ctgaatggcg aatggcgatt ccgttgcaat ggctggcggt aatattgttc 6600
tggatattac cagcaaggcc gatagtttga gttcttctac tcaggcaagt gatgttatta 6660
ctaatcaaag aagtattgcg acaacggtta atttgcgtga tggacagact cttttactcg 6720
gtggcctcac tgattataaa aacacttctc aggattctgg cgtaccgttc ctgtctaaaa 6780
tccctttaat cggcctcctg tttagctccc gctctgattc taacgaggaa agcacgttat 6840
acgtgctcgt caaagcaacc atagtacgcg ccctgtagcg gcgcattaag cgcggcgggt 6900
gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg ccctagcgcc cgctcctttc 6960
gctttcttcc cttcctttct cgccacgttc gccggctttc cccgtcaagc tctaaatcgg 7020
gggctccctt tagggttccg atttagtgct ttacggcacc tcgaccccaa aaaacttgat 7080
tagggtgatg gttcacgtag tgggccatcg ccctgataga cggtttttcg ccctttgacg 7140
ttggagtcca cgttctttaa tagtggactc ttgttccaaa ctggaacaac actcaaccct 7200
atctcggtct attcttttga tttataaggg attttgccga tttcggccta ttggttaaaa 7260
aatgagctga tttaacaaaa atttaacgcg aattttaaca aaatattaac gcttacaatt 7320
taaatatttg cttatacaat cttcctgttt ttggggcttt tctgattatc aaccggggta 7380
catatgattg acatgctagt tttacgatta ccgttcatcg attctcttgt ttgctccaga 7440
ctctcaggca atgacctgat agcctttgta gagacctctc aaaaatagct accctctccg 7500
gcatgaattt atcagctaga acggttgaat atcatattga tggtgatttg actgtctccg 7560
gcctttctca cccgtttgaa tctttaccta cacattactc aggcattgca tttaaaatat 7620
atgagggttc taaaaatttt tatccttgcg ttgaaataaa ggcttctccc gcaaaagtat 7680
tacagggtca taatgttttt ggtacaaccg atttagcttt atgctctgag gctttattgc 7740
ttaattttgc taattctttg ccttgcctgt atgatttatt ggatgttgga atcgcctgat 7800
gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcatatggt gcactctcag 7860
tacaatctgc tctgatgccg catagttaag ccagccccga cacccgccaa cacccgctga 7920
cgcgccctga cgggcttgtc tgctcccggc atccgcttac agacaagctg tgaccgtctc 7980
cgggagctgc atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga gacgaaaggg 8040
cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt cttagacgtc 8100
aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca 8160
ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 8220
aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt 8280
ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca 8340
<210> 26
<211> 7539
<212> DNA
<213> 智人
<400> 26
gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag 60
ttttcgcccc gaagaacgaa ttcttagaaa aactcatcga gcatcaaatg aaactgcaat 120
ttattcatat caggattatc aataccatat ttttgaaaaa gccgtttctg taatgaagga 180
gaaaactcac cgaggcagtt ccataggatg gcaagatcct ggtatcggtc tgcgattccg 240
actcgtccaa catcaataca acctattaat ttcccctcgt caaaaataag gttatcaagt 300
gagaaatcac catgagtgac gactgaatcc ggtgagaatg gcaaaagttt atgcatttct 360
ttccagactt gttcaacagg ccagccatta cgctcgtcat caaaatcact cgcatcaacc 420
aaaccgttat tcattcgtga ttgcgcctga gcgagacgaa atacgcgatc gctgttaaaa 480
ggacaattac aaacaggaat cgaatgcaac cggcgcagga acactgccag cgcatcaaca 540
atattttcac ctgaatcagg atattcttct aatacctgga atgctgtttt cccggggatc 600
gcagtggtga gtaaccatgc atcatcagga gtacggataa aatgcttgat ggtcggaaga 660
ggcataaatt ccgtcagcca gtttagtctg accatctcat ctgtaacatc attggcaacg 720
ctacctttgc catgtttcag aaacaactct ggcgcatcgg gcttcccata caatcgatag 780
attgtcgcac ctgattgccc gacattatcg cgagcccatt tatacccata taaatcagca 840
tccatgttgg aatttaatcg cggcctagag caagacgttt cccgttgaat atggctcata 900
acaccccttg tattactgtt tatgtaagca gacagtttta ttgttcatga ccaaaatccc 960
ttaacgtgag ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc 1020
ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc 1080
agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt 1140
cagcagagcg cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt 1200
caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc 1260
tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa 1320
ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac 1380
ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg 1440
gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga 1500
gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact 1560
tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa 1620
cgcggccttt ttacggttcc tggccttttg ctggcctttt gctcacatgt tctttcctgc 1680
gttatcccct gattctgtgg ataaccgtat taccgccttt gagtgagctg ataccgctcg 1740
ccgcagccga acgaccgagc gcagcgagtc agtgagcgag gaagcggaag agcgcccaat 1800
acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctgcg cgctcgctcg 1860
ctcactgagg ccgcccgggc aaagcccggg cgtcgggcga cctttggtcg cccggcctca 1920
gtgagcgagc gagcgcgcag agagggagtg gccaactcca tcactagggg ttccttgtag 1980
ttaatgatta acccgccatg ctacttatct acgtagccat gctctagagt ttaaacaagc 2040
tttcgttaca taacttacgg taaatggccc gcctggctga ccgcccaacg acccccggac 2100
tcacggggat ttccaagtct ccaccccatt gacgtcaatg ggagtttgtt ttggcaccaa 2160
aatcaacggg actttccaaa atgtcgtaac aactccgccc cattgacgca aatgggcggt 2220
aggcgtgtac ggtgggaggt ctatataagc agagctcgtt tagtgaaccg ctcgaccggg 2280
gtacccggcc ggctagccgc caccatggag aagaatggaa ataaccgaaa gctgcgggtt 2340
tgtgttgcta cttgtaaccg tgcagattat tctaaacttg ccccgatcat gtttggcatt 2400
aaaaccgaac ctgagttctt tgaacttgat gttgtggtac ttggctctca cctgatagat 2460
gactatggaa atacatatcg aatgattgaa caagatgact ttgacattaa caccaggcta 2520
cacacaattg tgaggggaga agatgaggca gccatggtgg agtcagtagg cctggcccta 2580
gtgaagctgc cagatgtcct taatcgcctg aagcctgata tcatgattgt tcatggagac 2640
aggtttgatg ccctggctct ggccacatct gctgccttga tgaacatccg aatccttcac 2700
attgaaggtg gggaagtcag tgggaccatt gatgactcta tcagacatgc cataacaaaa 2760
ctggctcatt atcatgtgtg ctgcacccgc agtgcagagc agcacctgat atccatgtgt 2820
gaggaccatg atcgcatcct tttggcaggc tgcccttcct atgacaaact tctctcagcc 2880
aagaacaaag actacatgag catcattcgc atgtggctag gtgatgatgt aaaatctaaa 2940
gattacattg ttgcactaca gcaccctgtg accactgaca ttaagcattc cataaaaatg 3000
tttgaattaa cattggatgc acttatctca tttaacaagc ggaccctagt cctgtttcca 3060
aatattgacg cagggagcaa agagatggtt cgagtgatgc ggaagaaggg cattgagcat 3120
catcccaact ttcgtgcagt taaacacgtc ccatttgacc agtttataca gttggttgcc 3180
catgctggct gtatgattgg gaacagcagc tgtggggttc gagaagttgg agcttttgga 3240
acacctgtga tcaacctggg aacacgtcag attggaagag aaacagggga gaatgttctt 3300
catgtccggg atgctgacac ccaagacaaa atattgcaag cactgcacct tcagtttggt 3360
aaacagtacc cttgttcaaa gatatatggg gatggaaatg ctgttccaag gattttgaag 3420
tttctcaaat ctatcgatct tcaagagcca ctgcaaaaga aattctgctt tcctcctgtg 3480
aaggagaata tctctcaaga tattgaccat attcttgaaa ctctaagtgc cttggccgtt 3540
gatcttggcg ggacgaacct ccgagttgca atagtcagca tgaagggtga aatagttaag 3600
aagtatactc agttcaatcc taaaacctat gaagagagga ttaatttaat cctacagatg 3660
tgtgtggaag ctgcagcaga agctgtaaaa ctgaactgca gaattttggg agtaggcatt 3720
tccacaggtg gccgtgtaaa tcctcgggaa ggaattgtgc tgcattcaac caaactgatc 3780
caagagtgga actctgtgga ccttaggacc cccctttctg acactttgca tctccctgtg 3840
tgggtagaca atgatggcaa ctgtgctgcc ctggcggaaa ggaaatttgg ccaaggaaag 3900
ggactggaaa actttgttac acttatcaca ggcacaggaa tcggtggtgg aattatccat 3960
cagcatgaat tgatccacgg aagctccttc tgtgctgcag aactgggcca ccttgttgtg 4020
tctctggatg ggcctgattg ttcctgtgga agccatgggt gcattgaagc atacgcctct 4080
ggaatggcct tgcagaggga ggcaaaaaag ctccatgatg aggacctgct cttggtggaa 4140
gggatgtcag tgccaaaaga tgaggctgtg ggtgcgctcc atctcatcca agctgcgaaa 4200
cttggcaatg cgaaggccca gagcatccta agaacagctg gaacagcttt gggtcttggg 4260
gttgtgaaca tcctccatac catgaatccc tcccttgtga tcctctccgg agtcctggcc 4320
agtcactata tccacattgt caaagacgtc attcgccagc aggccttgtc ctccgtgcag 4380
gacgtggatg tggtggtttc ggatttggtt gaccccgccc tgctgggtgc tgccagcatg 4440
gttctggact acacaacacg caggatctac tagcatgcgg gcataccagt gtcagctgca 4500
cttgtagggg cccaagtgcc tcatgaccca ctcggcagcc ttcctctcca ggatccccaa 4560
ggctaggagg ccaacctact aacaggtggg tgggtatggt gtgtggtttc actcagttct 4620
tctcatgggg tttctctgag ctccattcat accagaaagg gagcaggaga gagaggacaa 4680
gtggatccaa cagccttcgc tccaggggaa tcagggcatc gcctcctttt ctgggaggac 4740
actcccttct gatggtgaat gggaactccc ttcctcctgc agcagcctgc ctgcagctgt 4800
cctggtagaa cagtgtggac attgcagaag ctgtcactgc cccagaaaga aagcacccca 4860
gagccaaggc aaagagtctt gaaagcgcca caagcagcag ctgctgagac tggccgcacc 4920
atgaagctgc tgccgtcggt ggtgctgaag ctctttctgg ctgcagttct ctcggcactg 4980
gtgactggcg agagcctgga gcggcttcgg agagggctag ctgctggaac cagcaacccg 5040
gaccctccca ctgtatccac ggaccagctg ctacccctag gaggcggccg ggaccggaaa 5100
gtccgtgact tgcaagaggc agatctggac cttttgagag tcactttatc ctccaagcca 5160
caagcactgg ccacaccaaa caaggaggag cacgggaaaa gaaagaagaa aggcaagggg 5220
ctagggaaga agagggaccc aggaccggag acgctctgcg gggctgagct ggtggatgct 5280
cttcagttcg tgtgtggaga caggggcttt tatttcaaca agcccacagg gtatggctcc 5340
agcagtcgga gggcgcctca gacaggcatc gtggatgagt gctgcttccg gagctgtgat 5400
ctaaggaggc tggagatgta ttgcgcaccc ctcaagcctg ccaagtcagc ttaggcggcc 5460
gcaataaaag atctttattt tcattagatc tgtgtgttgg ttttttgtgt gtctagagca 5520
tggctacgta gataagtagc atggcgggtt aatcattaac tacaaggaac ccctagtgat 5580
ggagttggcc actccctctc tgcgcgctcg ctcgctcact gaggccgggc gaccaaaggt 5640
cgcccgacgc ccgggctttg cccgggcggc ctcagtgagc gagcgagcgc gcagctggcg 5700
taatagcgaa gaggcccgca ccgatcgccc ttcccaacag ttgcgcagcc tgaatggcga 5760
atggcgattc cgttgcaatg gctggcggta atattgttct ggatattacc agcaaggccg 5820
atagtttgag ttcttctact caggcaagtg atgttattac taatcaaaga agtattgcga 5880
caacggttaa tttgcgtgat ggacagactc ttttactcgg tggcctcact gattataaaa 5940
acacttctca ggattctggc gtaccgttcc tgtctaaaat ccctttaatc ggcctcctgt 6000
ttagctcccg ctctgattct aacgaggaaa gcacgttata cgtgctcgtc aaagcaacca 6060
tagtacgcgc cctgtagcgg cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg 6120
accgctacac ttgccagcgc cctagcgccc gctcctttcg ctttcttccc ttcctttctc 6180
gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt agggttccga 6240
tttagtgctt tacggcacct cgaccccaaa aaacttgatt agggtgatgg ttcacgtagt 6300
gggccatcgc cctgatagac ggtttttcgc cctttgacgt tggagtccac gttctttaat 6360
agtggactct tgttccaaac tggaacaaca ctcaacccta tctcggtcta ttcttttgat 6420
ttataaggga ttttgccgat ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa 6480
tttaacgcga attttaacaa aatattaacg cttacaattt aaatatttgc ttatacaatc 6540
ttcctgtttt tggggctttt ctgattatca accggggtac atatgattga catgctagtt 6600
ttacgattac cgttcatcga ttctcttgtt tgctccagac tctcaggcaa tgacctgata 6660
gcctttgtag agacctctca aaaatagcta ccctctccgg catgaattta tcagctagaa 6720
cggttgaata tcatattgat ggtgatttga ctgtctccgg cctttctcac ccgtttgaat 6780
ctttacctac acattactca ggcattgcat ttaaaatata tgagggttct aaaaattttt 6840
atccttgcgt tgaaataaag gcttctcccg caaaagtatt acagggtcat aatgtttttg 6900
gtacaaccga tttagcttta tgctctgagg ctttattgct taattttgct aattctttgc 6960
cttgcctgta tgatttattg gatgttggaa tcgcctgatg cggtattttc tccttacgca 7020
tctgtgcggt atttcacacc gcatatggtg cactctcagt acaatctgct ctgatgccgc 7080
atagttaagc cagccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 7140
gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 7200
gttttcaccg tcatcaccga aacgcgcgag acgaaagggc ctcgtgatac gcctattttt 7260
ataggttaat gtcatgataa taatggtttc ttagacgtca ggtggcactt ttcggggaaa 7320
tgtgcgcgga acccctattt gtttattttt ctaaatacat tcaaatatgt atccgctcat 7380
gagacaataa ccctgataaa tgcttcaata atattgaaaa aggaagagta tgagtattca 7440
acatttccgt gtcgccctta ttcccttttt tgcggcattt tgccttcctg tttttgctca 7500
cccagaaacg ctggtgaaag taaaagatgc tgaagatca 7539
<210> 27
<211> 178
<212> PRT
<213> 智人
<400> 27
Met Lys Leu Leu Pro Ser Val Val Leu Lys Leu Phe Leu Ala Ala Val
1 5 10 15
Leu Ser Ala Leu Val Thr Gly Glu Ser Leu Glu Arg Leu Arg Arg Gly
20 25 30
Leu Ala Ala Gly Thr Ser Asn Pro Asp Pro Pro Thr Val Ser Thr Asp
35 40 45
Gln Leu Leu Pro Leu Gly Gly Gly Arg Asp Arg Lys Val Arg Asp Leu
50 55 60
Gln Glu Ala Asp Leu Asp Leu Leu Arg Val Thr Leu Ser Ser Lys Pro
65 70 75 80
Gln Ala Leu Ala Thr Pro Asn Lys Glu Glu His Gly Lys Arg Lys Lys
85 90 95
Lys Gly Lys Gly Leu Gly Lys Lys Arg Asp Pro Gly Pro Glu Thr Leu
100 105 110
Cys Gly Ala Glu Leu Val Asp Ala Leu Gln Phe Val Cys Gly Asp Arg
115 120 125
Gly Phe Tyr Phe Asn Lys Pro Thr Gly Tyr Gly Ser Ser Ser Arg Arg
130 135 140
Ala Pro Gln Thr Gly Ile Val Asp Glu Cys Cys Phe Arg Ser Cys Asp
145 150 155 160
Leu Arg Arg Leu Glu Met Tyr Cys Ala Pro Leu Lys Pro Ala Lys Ser
165 170 175
Ala Val
<210> 28
<211> 2549
<212> DNA
<213> 智人
<400> 28
gtccattgaa tcgcgcgggc ggccggcggc gagcgcgggg ctgcgccggg atcgctgcgc 60
cctccgccgc tggcctctgc gacgcgcgcc gctcgcccga gccacccgcc gccgcgccgg 120
ctccccgcgc cgctgcgctc ctcgccccgc gcctgccccc aggatggtcc gcgcgaggca 180
ccagccgggt gggctttgcc tcctgctgct gctgctctgc cagttcatgg aggaccgcag 240
tgcccaggct gggaactgct ggctccgtca agcgaagaac ggccgctgcc aggtcctgta 300
caagaccgaa ctgagcaagg aggagtgctg cagcaccggc cggctgagca cctcgtggac 360
cgaggaggac gtgaatgaca acacactctt caagtggatg attttcaacg ggggcgcccc 420
caactgcatc ccctgtaaag aaacgtgtga gaacgtggac tgtggacctg ggaaaaaatg 480
ccgaatgaac aagaagaaca aaccccgctg cgtctgcgcc ccggattgtt ccaacatcac 540
ctggaagggt ccagtctgcg ggctggatgg gaaaacctac cgcaatgaat gtgcactcct 600
aaaggcaaga tgtaaagagc agccagaact ggaagtccag taccaaggca gatgtaaaaa 660
gacttgtcgg gatgttttct gtccaggcag ctccacatgt gtggtggacc agaccaataa 720
tgcctactgt gtgacctgta atcggatttg cccagagcct gcttcctctg agcaatatct 780
ctgtgggaat gatggagtca cctactccag tgcctgccac ctgagaaagg ctacctgcct 840
gctgggcaga tctattggat tagcctatga gggaaagtgt atcaaagcaa agtcctgtga 900
agatatccag tgcactggtg ggaaaaaatg tttatgggat ttcaaggttg ggagaggccg 960
gtgttccctc tgtgatgagc tgtgccctga cagtaagtcg gatgagcctg tctgtgccag 1020
tgacaatgcc acttatgcca gcgagtgtgc catgaaggaa gctgcctgct cctcaggtgt 1080
gctactggaa gtaaagcact ccggatcttg caactgaatc tgcccgtaaa acctgagcca 1140
ttgattcttc agaactttct gcagtttttg acttcataga ttatgcttta aaaaaatttt 1200
tttaacttat tgcataacag cagatgccaa aaacaaaaaa agcatctcac tgcaagtcac 1260
ataaaaatgc aacgctgtaa tatggctgta tcagagggct ttgaaaacat acactgagct 1320
gcttctgcgc tgttgttgtc cgtatttaaa caacagctcc cctgtattcc cccatctagc 1380
catttcggaa gacaccgagg aagaggagga agatgaagac caggactaca gctttcctat 1440
atcttctatt ctagagtggt aaactctcta taagtgttca gtgttgacat agcctttgtg 1500
caaaaaaaaa aaaaaaaaaa aagaaaaaga aaaaaagaaa aatatattgt ccatactgta 1560
aataagtgta tgcttattta tttgggggga aaactataca ttaaaggacc tttgtcctaa 1620
agctctctcc caggccacct tgttactcat tggacacgga gaggcattca ttgtgaggtc 1680
tactggatga ggcccatagt tgagacttgt agacatttat ttatactgtg tcatgtttta 1740
taatttatac ataaaatgtc tggttgactg tataccttgt ttttgaagaa atttattcgt 1800
gaaaggaaga gcagttgtta tttattgtga ggtctcttgc ttgtaaagta aaagcttttt 1860
ttccttgtaa accatttaag tccattcctt actattcact cactcatctg tctcccttca 1920
tttcactgtt agactctttt ccactttcaa caaacttgca tgtcagtttc tgtcatgttt 1980
atttattgga ttctctgctg cctgatctgt acatacatga tccctcgggt tttgtttaca 2040
aggaaccttg actgaccaaa aggcattata actctgactc aaatacaagg tacagaagat 2100
aagcatcttt gaggaaactc ctacttcagt tcttttgtta tgatgaagac atttgtgaga 2160
gaggagatga ttagaattct agtaatgtac ttttaagatg ttacagatac aaagaaatga 2220
tgtgggtgtc aggagactaa aggatgttga aggctacaca ttcaaccttt tgttaggtgt 2280
ttcctttaag ctactcagct gtacctttta aattagttct ttttcaacca gtatatcact 2340
aaaagttata tcaaagcttt atcagttcaa gtttcttgct tttcataata cttttttctg 2400
atgcaatttt atattttcaa acatggcaag ttaaaatata aattcattta aatatatagt 2460
tttgtacttt tctaccatgt aaatgtgcaa tgtatataaa agttataatg tgtatttgta 2520
aataaatgat gagtgaaaaa ataaaaaaa 2549
<210> 29
<211> 317
<212> PRT
<213> 智人
<400> 29
Met Val Arg Ala Arg His Gln Pro Gly Gly Leu Cys Leu Leu Leu Leu
1 5 10 15
Leu Leu Cys Gln Phe Met Glu Asp Arg Ser Ala Gln Ala Gly Asn Cys
20 25 30
Trp Leu Arg Gln Ala Lys Asn Gly Arg Cys Gln Val Leu Tyr Lys Thr
35 40 45
Glu Leu Ser Lys Glu Glu Cys Cys Ser Thr Gly Arg Leu Ser Thr Ser
50 55 60
Trp Thr Glu Glu Asp Val Asn Asp Asn Thr Leu Phe Lys Trp Met Ile
65 70 75 80
Phe Asn Gly Gly Ala Pro Asn Cys Ile Pro Cys Lys Glu Thr Cys Glu
85 90 95
Asn Val Asp Cys Gly Pro Gly Lys Lys Cys Arg Met Asn Lys Lys Asn
100 105 110
Lys Pro Arg Cys Val Cys Ala Pro Asp Cys Ser Asn Ile Thr Trp Lys
115 120 125
Gly Pro Val Cys Gly Leu Asp Gly Lys Thr Tyr Arg Asn Glu Cys Ala
130 135 140
Leu Leu Lys Ala Arg Cys Lys Glu Gln Pro Glu Leu Glu Val Gln Tyr
145 150 155 160
Gln Gly Arg Cys Lys Lys Thr Cys Arg Asp Val Phe Cys Pro Gly Ser
165 170 175
Ser Thr Cys Val Val Asp Gln Thr Asn Asn Ala Tyr Cys Val Thr Cys
180 185 190
Asn Arg Ile Cys Pro Glu Pro Ala Ser Ser Glu Gln Tyr Leu Cys Gly
195 200 205
Asn Asp Gly Val Thr Tyr Ser Ser Ala Cys His Leu Arg Lys Ala Thr
210 215 220
Cys Leu Leu Gly Arg Ser Ile Gly Leu Ala Tyr Glu Gly Lys Cys Ile
225 230 235 240
Lys Ala Lys Ser Cys Glu Asp Ile Gln Cys Thr Gly Gly Lys Lys Cys
245 250 255
Leu Trp Asp Phe Lys Val Gly Arg Gly Arg Cys Ser Leu Cys Asp Glu
260 265 270
Leu Cys Pro Asp Ser Lys Ser Asp Glu Pro Val Cys Ala Ser Asp Asn
275 280 285
Ala Thr Tyr Ala Ser Glu Cys Ala Met Lys Glu Ala Ala Cys Ser Ser
290 295 300
Gly Val Leu Leu Glu Val Lys His Ser Gly Ser Cys Asn
305 310 315
<210> 30
<211> 427
<212> DNA
<213> 智人
<400> 30
gggcatacca gtgtcagctg cacttgtagg ggcccaagtg cctcatgacc cactcggcag 60
ccttcctctc caggatcccc aaggctagga ggccaaccta ctaacaggtg ggtgggtatg 120
gtgtgtggtt tcactcagtt cttctcatgg ggtttctctg agctccattc ataccagaaa 180
gggagcagga gagagaggac aagtggatcc aacagccttc gctccagggg aatcagggca 240
tcgcctcctt ttctgggagg acactccctt ctgatggtga atgggaactc ccttcctcct 300
cgagcagcct gcctgcagct gtcctggtag aacagtgtgg acattgcaga agctgtcact 360
gccccagaaa gaaagcaccc cagagccaag gcaaagagtc ttgaaagcgc cacaagcagc 420
tgctgag 427
<210> 31
<211> 319
<212> PRT
<213> 智人
<400> 31
Met Glu Leu Leu Ser Pro Pro Leu Arg Asp Val Asp Leu Thr Ala Pro
1 5 10 15
Asp Gly Ser Leu Cys Ser Phe Ala Thr Thr Asp Asp Phe Tyr Asp Asp
20 25 30
Pro Cys Phe Asp Ser Pro Asp Leu Arg Phe Phe Glu Asp Leu Asp Pro
35 40 45
Arg Leu Met His Val Gly Ala Leu Leu Lys Pro Glu Glu His Ser His
50 55 60
Phe Pro Ala Ala Val His Pro Ala Pro Gly Ala Arg Glu Asp Glu His
65 70 75 80
Val Arg Ala Pro Ser Gly His His Gln Ala Gly Arg Cys Leu Leu Trp
85 90 95
Ala Cys Lys Ala Cys Lys Arg Lys Thr Thr Asn Ala Asp Arg Arg Lys
100 105 110
Ala Ala Thr Met Arg Glu Arg Arg Arg Leu Ser Lys Val Asn Glu Ala
115 120 125
Phe Glu Thr Leu Lys Arg Cys Thr Ser Ser Asn Pro Asn Gln Arg Leu
130 135 140
Pro Lys Val Glu Ile Leu Arg Asn Ala Ile Arg Tyr Ile Glu Gly Leu
145 150 155 160
Gln Ala Leu Leu Arg Asp Gln Asp Ala Ala Pro Pro Gly Ala Ala Ala
165 170 175
Phe Tyr Ala Pro Gly Pro Leu Pro Pro Gly Arg Gly Gly Glu His Tyr
180 185 190
Ser Gly Asp Ser Asp Ala Ser Ser Pro Arg Ser Asn Cys Ser Asp Gly
195 200 205
Met Met Asp Tyr Ser Gly Pro Pro Ser Gly Ala Arg Arg Arg Asn Cys
210 215 220
Tyr Glu Gly Ala Tyr Tyr Asn Glu Ala Pro Ser Glu Pro Arg Pro Gly
225 230 235 240
Lys Ser Ala Ala Val Ser Ser Leu Asp Tyr Leu Ser Ser Ile Val Glu
245 250 255
Arg Ile Ser Thr Glu Ser Pro Ala Ala Pro Ala Leu Leu Leu Ala Asp
260 265 270
Val Pro Ser Glu Ser Pro Pro Arg Arg Gln Glu Ala Ala Ala Pro Ser
275 280 285
Glu Gly Glu Ser Ser Gly Asp Pro Thr Gln Ser Pro Asp Ala Ala Pro
290 295 300
Gln Cys Pro Ala Gly Ala Asn Pro Asn Pro Ile Tyr Gln Val Leu
305 310 315
<210> 32
<211> 2501
<212> DNA
<213> 智人
<400> 32
aagtcggtgc cgctgccgtc tctgcgttcg ccatgcgtcc cggggcgcca gggccactct 60
ggcctctgcc ctggggggcc ctggcttggg ccgtgggctt cgtgagctcc atgggctcgg 120
ggaaccccgc gcccggtggt gtttgctggc tccagcaggg ccaggaggcc acctgcagcc 180
tggtgctcca gactgatgtc acccgggccg agtgctgtgc ctccggcaac attgacaccg 240
cctggtccaa cctcacccac ccggggaaca agatcaacct cctcggcttc ttgggccttg 300
tccactgcct tccctgcaaa gattcgtgcg acggcgtgga gtgcggcccg ggcaaggcgt 360
gccgcatgct ggggggccgc ccgcgctgcg agtgcgcgcc cgactgctcg gggctcccgg 420
cgcggctgca ggtctgcggc tcagacggcg ccacctaccg cgacgagtgc gagctgcgcg 480
ccgcgcgctg ccgcggccac ccggacctga gcgtcatgta ccggggccgc tgccgcaagt 540
cctgtgagca cgtggtgtgc ccgcggccac agtcgtgcgt cgtggaccag acgggcagcg 600
cccactgcgt ggtgtgtcga gcggcgccct gccctgtgcc ctccagcccc ggccaggagc 660
tttgcggcaa caacaacgtc acctacatct cctcgtgcca catgcgccag gccacctgct 720
tcctgggccg ctccatcggc gtgcgccacg cgggcagctg cgcaggcacc cctgaggagc 780
cgccaggtgg tgagtctgca gaagaggaag agaacttcgt gtgagcctgc aggacaggcc 840
tgggcctggt gcccgaggcc ccccatcatc ccctgttatt tattgccaca gcagagtcta 900
atttatatgc cacggacact ccttagagcc cggattcgga ccacttgggg atcccagaac 960
ctccctgacg atatcctgga aggactgagg aagggaggcc tgggggccgg ctggtgggtg 1020
ggatagacct gcgttccgga cactgagcgc ctgatttagg gcccttctct aggatgcccc 1080
agcccctacc ctaagaccta ttgccgggga ggattccaca cttccgctcc tttggggata 1140
aacctattaa ttattgctac tatcaagagg gctgggcatt ctctgctggt aattcctgaa 1200
gaggcatgac tgcttttctc agccccaagc ctctagtctg ggtgtgtacg gagggtctag 1260
cctgggtgtg tacggagggt ctagcctggg tgagtacgga gggtctagcc tgggtgagta 1320
cggagggtct agcctgggtg agtacggagg gtctagcctg ggtgtgtatg gaggatctag 1380
cctgggtgag tatggagggt ctagcctggg tgagtatgga gggtctagcc tgggtgtgta 1440
tggagggtct agcctgggtg agtatggagg gtctagcctg ggtgtgtatg gagggtctag 1500
cctgggtgag tatggagggt ctagcctggg tgtgtacgga gggtctagtc tgagtgcgtg 1560
tggggacctc agaacactgt gaccttagcc cagcaagcca ggcccttcat gaaggccaag 1620
aaggctgcca ccattccctg ccagcccaag aactccagct tccccactgc ctctgtgtgc 1680
ccctttgcgt cctgtgaagg ccattgagaa atgcccagtg tgccccctgg gaaagggcac 1740
ggcctgtgct cctgacacgg gctgtgcttg gccacagaac cacccagcgt ctcccctgct 1800
gctgtccacg tcagttcatg aggcaacgtc gcgtggtctc agacgtggag cagccagcgg 1860
cagctcagag cagggcactg tgtccggcgg agccaagtcc actctggggg agctctggcg 1920
gggaccacgg gccactgctc acccactggc cccgaggggg gtgtagacgc caagactcac 1980
gcatgtgtga catccggagt cctggagccg ggtgtcccag tggcaccact aggtgcctgc 2040
tgcctccaca gtggggttca cacccagggc tccttggtcc cccacaacct gccccggcca 2100
ggcctgcaga cccagactcc agccagacct gcctcaccca ccaatgcagc cggggctggc 2160
gacaccagcc aggtgctggt cttgggccag ttctcccacg acggctcacc ctcccctcca 2220
tctgcgttga tgctcagaat cgcctacctg tgcctgcgtg taaaccacag cctcagacca 2280
gctatgggga gaggacaaca cggaggatat ccagcttccc cggtctgggg tgaggaatgt 2340
ggggagcttg ggcatcctcc tccagcctcc tccagccccc aggcagtgcc ttacctgtgg 2400
tgcccagaaa agtgccccta ggttggtggg tctacaggag cctcagccag gcagcccacc 2460
ccaccctggg gccctgcctc accaaggaaa taaagactca a 2501
<210> 33
<211> 263
<212> PRT
<213> 智人
<400> 33
Met Arg Pro Gly Ala Pro Gly Pro Leu Trp Pro Leu Pro Trp Gly Ala
1 5 10 15
Leu Ala Trp Ala Val Gly Phe Val Ser Ser Met Gly Ser Gly Asn Pro
20 25 30
Ala Pro Gly Gly Val Cys Trp Leu Gln Gln Gly Gln Glu Ala Thr Cys
35 40 45
Ser Leu Val Leu Gln Thr Asp Val Thr Arg Ala Glu Cys Cys Ala Ser
50 55 60
Gly Asn Ile Asp Thr Ala Trp Ser Asn Leu Thr His Pro Gly Asn Lys
65 70 75 80
Ile Asn Leu Leu Gly Phe Leu Gly Leu Val His Cys Leu Pro Cys Lys
85 90 95
Asp Ser Cys Asp Gly Val Glu Cys Gly Pro Gly Lys Ala Cys Arg Met
100 105 110
Leu Gly Gly Arg Pro Arg Cys Glu Cys Ala Pro Asp Cys Ser Gly Leu
115 120 125
Pro Ala Arg Leu Gln Val Cys Gly Ser Asp Gly Ala Thr Tyr Arg Asp
130 135 140
Glu Cys Glu Leu Arg Ala Ala Arg Cys Arg Gly His Pro Asp Leu Ser
145 150 155 160
Val Met Tyr Arg Gly Arg Cys Arg Lys Ser Cys Glu His Val Val Cys
165 170 175
Pro Arg Pro Gln Ser Cys Val Val Asp Gln Thr Gly Ser Ala His Cys
180 185 190
Val Val Cys Arg Ala Ala Pro Cys Pro Val Pro Ser Ser Pro Gly Gln
195 200 205
Glu Leu Cys Gly Asn Asn Asn Val Thr Tyr Ile Ser Ser Cys His Met
210 215 220
Arg Gln Ala Thr Cys Phe Leu Gly Arg Ser Ile Gly Val Arg His Ala
225 230 235 240
Gly Ser Cys Ala Gly Thr Pro Glu Glu Pro Pro Gly Gly Glu Ser Ala
245 250 255
Glu Glu Glu Glu Asn Phe Val
260
<210> 34
<211> 3417
<212> DNA
<213> 智人
<400> 34
agaggcgcca gcagcctgcc tgtgacaggc atcaggttag ctggctccca ctcgggtggc 60
gcgcccagga tataaatccg ggcgcgggcc cctgctgtgg ctcctctccc tgcacactca 120
ggagagggag cttccttcta aagacctttc ttttatctga agccgcacag cccggcaggc 180
tgtgctgact tggtggaggc agcagcggca gagcagcctg agcagcagcc tgagcaggaa 240
acctgctggg gtggggaggg caggtgtctg cagcccctga gaagaaggcc ctggtgggcc 300
ccagaccctg gcatcgtttc aggggaggtc tctagccgcc ccagcctgca ccatgtgggc 360
cccaaggtgt cgccggttct ggtctcgctg ggagcaggtg gcagcgctgc tgctgctgct 420
gctactgctc ggggtgcccc cgcgaagcct ggcgctgccg cccatccgct attcccacgc 480
cggcatctgc cccaacgaca tgaatcccaa cctctgggtg gacgcacaga gcacctgcag 540
gcgggagtgt gagacggacc aggagtgtga gacctatgag aagtgctgcc ccaacgtatg 600
tgggaccaag agctgcgtgg cggcccgcta catggacgtg aaagggaaga agggcccagt 660
gggcatgccc aaggaggcca catgtgacca cttcatgtgt ctgcagcagg gctctgagtg 720
tgacatctgg gatggccagc ccgtgtgtaa gtgcaaagac cgctgtgaga aggagcccag 780
ctttacctgc gcctcggacg gcctcaccta ctataaccgc tgctacatgg atgccgaggc 840
ctgctccaaa ggcatcacac tggccgttgt aacctgccgc tatcacttca cctggcccaa 900
caccagcccc ccaccacctg agaccaccat gcaccccacc acagcctccc cagagacccc 960
tgagctggac atggcggccc ctgcgctgct caacaaccct gtgcaccagt cggtcaccat 1020
gggtgagaca gtgagcttcc tctgtgatgt ggtgggccgg ccccggcctg agatcacctg 1080
ggagaagcag ttggaggatc gggagaatgt ggtcatgcgg cccaaccatg tgcgtggcaa 1140
cgtggtggtc accaacattg cccagctggt catctataac gcccagctgc aggatgctgg 1200
gatctacacc tgcacggccc ggaacgtggc tggggtcctg agggctgatt tcccgctgtc 1260
ggtggtcagg ggtcatcagg ctgcagccac ctcagagagc agccccaatg gcacggcttt 1320
cccggcggcc gagtgcctga agcccccaga cagtgaggac tgtggcgaag agcagacccg 1380
ctggcacttc gatgcccagg ccaacaactg cctgaccttc accttcggcc actgccaccg 1440
taacctcaac cactttgaga cctatgaggc ctgcatgctg gcctgcatga gcgggccgct 1500
ggccgcgtgc agcctgcccg ccctgcaggg gccctgcaaa gcctacgcgc ctcgctgggc 1560
ttacaacagc cagacgggcc agtgccagtc ctttgtctat ggtggctgcg agggcaatgg 1620
caacaacttt gagagccgtg aggcctgtga ggagtcgtgc cccttcccca gggggaacca 1680
gcgctgtcgg gcctgcaagc ctcggcagaa gctcgttacc agcttctgtc gcagcgactt 1740
tgtcatcctg ggccgagtct ctgagctgac cgaggagcct gactcgggcc gcgccctggt 1800
gactgtggat gaggtcctaa aggatgagaa aatgggcctc aagttcctgg gccaggagcc 1860
attggaggtc actctgcttc acgtggactg ggcatgcccc tgccccaacg tgaccgtgag 1920
cgagatgccg ctcatcatca tgggggaggt ggacggcggc atggccatgc tgcgccccga 1980
tagctttgtg ggcgcatcga gtgcccgccg ggtcaggaag cttcgtgagg tcatgcacaa 2040
gaagacctgt gacgtcctca aggagtttct tggcttgcac tgaagccccc cacccctccc 2100
tgccccctcc ctggccttct tccacctatc caccccaatg cctctcagca aactgggcga 2160
ggtcagatta gacaggcttg ggacagcagg gaaacatcaa ccgacgtgtc acagaaaaag 2220
ccacagaagg tctcagatca gcatctattc tttgggttca ataaggggtt catatctttt 2280
ttagctgagg gggacaagag gagaagtcag tggacacatg gaagttactc gtgaccacca 2340
gcttgctcag atattctcct cctcccctca ctggccccac acccctggct ctcccagtca 2400
ccctccccta gccagtctcc cagcaagggt ttaagagatg gccgctgtgt gctggtcaca 2460
ggaagtgttg aatggattgg cttgcaaagg gggtaggtgg ggagagatag gagggcccag 2520
ggactcatgg gacacctttc ccacagcctc ctcgattgct gtgagcagag gccactcgga 2580
gttaggggca tgggcaatag caagctggcg gcagagtcca gcccagcata tgacttgccc 2640
tgaatggaag ctgctgaaac gggtgccttt gggtggtggt cggcttgcct ctgaggccac 2700
cacggcacca gcagaatacg tatttcttct ccttggctgc actggtttgt cgatctagtt 2760
cagttcaact cagtggatgt tctctgaatg cttactgggt gccaggacca cagagagatg 2820
ttagtcactg cccagttctt agagccccaa cacagatacc ctcatcccag ggcccccaga 2880
cacacccctc cgctggactc acaactgtct ggagtttctg tctgatggat ggtgtgcttt 2940
catatgccac tggcttcctt ggacatagat cagacaaaag ccccgggatc tgtttggtag 3000
caggagaaat gaaggaagat gaaaaagcag gcagggaagg gggtagtaaa ggactgagag 3060
aggagggagg tggctggaga aggaaaagga acattgctcg atgctcccat ctggtggcgg 3120
cctcaggaac ccacgggaac ctggaaggag gctctttgtg agacctgggc aaaggatggg 3180
gcagctcgtc gatgattttt ttgtgtttcc aggcttcctg tgtgatcctg gccctccggc 3240
cgctagagag aggattggga aaccccactg tcagctctgc atctgccccc actaccctcc 3300
tctgccctat tctgtccctg cccctccaag ctgaagaagg tccttgtggg gcgtcctcat 3360
ttcttcctca aatataagga ggaagatacc aattaaaagc tcatagtatc aactgcc 3417
<210> 35
<211> 576
<212> PRT
<213> 智人
<400> 35
Met Trp Ala Pro Arg Cys Arg Arg Phe Trp Ser Arg Trp Glu Gln Val
1 5 10 15
Ala Ala Leu Leu Leu Leu Leu Leu Leu Leu Gly Val Pro Pro Arg Ser
20 25 30
Leu Ala Leu Pro Pro Ile Arg Tyr Ser His Ala Gly Ile Cys Pro Asn
35 40 45
Asp Met Asn Pro Asn Leu Trp Val Asp Ala Gln Ser Thr Cys Arg Arg
50 55 60
Glu Cys Glu Thr Asp Gln Glu Cys Glu Thr Tyr Glu Lys Cys Cys Pro
65 70 75 80
Asn Val Cys Gly Thr Lys Ser Cys Val Ala Ala Arg Tyr Met Asp Val
85 90 95
Lys Gly Lys Lys Gly Pro Val Gly Met Pro Lys Glu Ala Thr Cys Asp
100 105 110
His Phe Met Cys Leu Gln Gln Gly Ser Glu Cys Asp Ile Trp Asp Gly
115 120 125
Gln Pro Val Cys Lys Cys Lys Asp Arg Cys Glu Lys Glu Pro Ser Phe
130 135 140
Thr Cys Ala Ser Asp Gly Leu Thr Tyr Tyr Asn Arg Cys Tyr Met Asp
145 150 155 160
Ala Glu Ala Cys Ser Lys Gly Ile Thr Leu Ala Val Val Thr Cys Arg
165 170 175
Tyr His Phe Thr Trp Pro Asn Thr Ser Pro Pro Pro Pro Glu Thr Thr
180 185 190
Met His Pro Thr Thr Ala Ser Pro Glu Thr Pro Glu Leu Asp Met Ala
195 200 205
Ala Pro Ala Leu Leu Asn Asn Pro Val His Gln Ser Val Thr Met Gly
210 215 220
Glu Thr Val Ser Phe Leu Cys Asp Val Val Gly Arg Pro Arg Pro Glu
225 230 235 240
Ile Thr Trp Glu Lys Gln Leu Glu Asp Arg Glu Asn Val Val Met Arg
245 250 255
Pro Asn His Val Arg Gly Asn Val Val Val Thr Asn Ile Ala Gln Leu
260 265 270
Val Ile Tyr Asn Ala Gln Leu Gln Asp Ala Gly Ile Tyr Thr Cys Thr
275 280 285
Ala Arg Asn Val Ala Gly Val Leu Arg Ala Asp Phe Pro Leu Ser Val
290 295 300
Val Arg Gly His Gln Ala Ala Ala Thr Ser Glu Ser Ser Pro Asn Gly
305 310 315 320
Thr Ala Phe Pro Ala Ala Glu Cys Leu Lys Pro Pro Asp Ser Glu Asp
325 330 335
Cys Gly Glu Glu Gln Thr Arg Trp His Phe Asp Ala Gln Ala Asn Asn
340 345 350
Cys Leu Thr Phe Thr Phe Gly His Cys His Arg Asn Leu Asn His Phe
355 360 365
Glu Thr Tyr Glu Ala Cys Met Leu Ala Cys Met Ser Gly Pro Leu Ala
370 375 380
Ala Cys Ser Leu Pro Ala Leu Gln Gly Pro Cys Lys Ala Tyr Ala Pro
385 390 395 400
Arg Trp Ala Tyr Asn Ser Gln Thr Gly Gln Cys Gln Ser Phe Val Tyr
405 410 415
Gly Gly Cys Glu Gly Asn Gly Asn Asn Phe Glu Ser Arg Glu Ala Cys
420 425 430
Glu Glu Ser Cys Pro Phe Pro Arg Gly Asn Gln Arg Cys Arg Ala Cys
435 440 445
Lys Pro Arg Gln Lys Leu Val Thr Ser Phe Cys Arg Ser Asp Phe Val
450 455 460
Ile Leu Gly Arg Val Ser Glu Leu Thr Glu Glu Pro Asp Ser Gly Arg
465 470 475 480
Ala Leu Val Thr Val Asp Glu Val Leu Lys Asp Glu Lys Met Gly Leu
485 490 495
Lys Phe Leu Gly Gln Glu Pro Leu Glu Val Thr Leu Leu His Val Asp
500 505 510
Trp Ala Cys Pro Cys Pro Asn Val Thr Val Ser Glu Met Pro Leu Ile
515 520 525
Ile Met Gly Glu Val Asp Gly Gly Met Ala Met Leu Arg Pro Asp Ser
530 535 540
Phe Val Gly Ala Ser Ser Ala Arg Arg Val Arg Lys Leu Arg Glu Val
545 550 555 560
Met His Lys Lys Thr Cys Asp Val Leu Lys Glu Phe Leu Gly Leu His
565 570 575
<210> 36
<211> 1521
<212> DNA
<213> 智人
<400> 36
atgacttcgg gcggctcgag atttctgtgg ctcctcaaga tattggtcat aatcctggta 60
cttggcattg ttggatttat gttcggaagc atgttccttc aagcagtgtt cagcagcccc 120
aagccagaac tcccaagtcc tgccccgggt gtccagaagc tgaagcttct gcctgaggaa 180
cgtctcagga acctcttttc ctacgatgga atctggctgt tcccgaaaaa tcagtgcaaa 240
tgtgaagcca acaaagagca gggaggttac aactttcagg atgcctatgg ccagagcgac 300
ctcccagcgg tgaaagcgag gagacaggct gaatttgaac actttcagag gagagaaggg 360
ctgccccgcc cactgcccct gctggtccag cccaacctcc cctttgggta cccagtccac 420
ggagtggagg tgatgcccct gcacacggtt cccatcccag gcctccagtt tgaaggaccc 480
gatgcccccg tctatgaggt caccctgaca gcttctctgg ggacactgaa cacccttgct 540
gatgtcccag acagtgtggt gcagggcaga ggccagaagc agctgatcat ttctaccagt 600
gaccggaagc tgttgaagtt cattcttcag cacgtgacat acaccagcac ggggtaccag 660
caccagaagg tagacatagt gagtctggag tccaggtcct cagtggccaa gtttccagtg 720
accatccgcc atcctgtcat acccaagcta tacgaccctg gaccagagag gaagctcaga 780
aacctggtta ccattgctac caagactttc ctccgccccc acaagctcat gatcatgctc 840
cggagtattc gagagtatta cccagacttg accgtaatag tggctgatga cagccagaag 900
cccctggaaa ttaaagacaa ccacgtggag tattacacta tgccctttgg gaagggttgg 960
tttgctggta ggaacctggc catatctcag gtcaccacca aatacgttct ctgggtggac 1020
gatgattttc tcttcaacga ggagaccaag attgaggtgc tggtggatgt cctggagaaa 1080
acagaactgg acgtggtagg cggcagtgtg ctgggaaatg tgttccagtt taagttgttg 1140
ctggaacaga gtgagaatgg ggcctgcctt cacaagagga tgggattttt ccaacccctg 1200
gatggcttcc ccagctgcgt ggtgaccagt ggcgtggtca acttcttcct ggcccacacg 1260
gagcgactcc aaagagttgg ctttgatccc cgcctgcaac gagtggctca ctcagaattc 1320
ttcattgatg ggctagggac cctactcgtg gggtcatgcc cagaagtgat tataggtcac 1380
cagtctcggt ctccagtggt ggactcagaa ctggctgccc tagagaagac ctacaataca 1440
taccggtcca acaccctcac ccgggtccag ttcaagctgg ccctccacta cttcaagaac 1500
catctccaat gtgccgcata a 1521
<210> 37
<211> 506
<212> PRT
<213> 智人
<400> 37
Met Thr Ser Gly Gly Ser Arg Phe Leu Trp Leu Leu Lys Ile Leu Val
1 5 10 15
Ile Ile Leu Val Leu Gly Ile Val Gly Phe Met Phe Gly Ser Met Phe
20 25 30
Leu Gln Ala Val Phe Ser Ser Pro Lys Pro Glu Leu Pro Ser Pro Ala
35 40 45
Pro Gly Val Gln Lys Leu Lys Leu Leu Pro Glu Glu Arg Leu Arg Asn
50 55 60
Leu Phe Ser Tyr Asp Gly Ile Trp Leu Phe Pro Lys Asn Gln Cys Lys
65 70 75 80
Cys Glu Ala Asn Lys Glu Gln Gly Gly Tyr Asn Phe Gln Asp Ala Tyr
85 90 95
Gly Gln Ser Asp Leu Pro Ala Val Lys Ala Arg Arg Gln Ala Glu Phe
100 105 110
Glu His Phe Gln Arg Arg Glu Gly Leu Pro Arg Pro Leu Pro Leu Leu
115 120 125
Val Gln Pro Asn Leu Pro Phe Gly Tyr Pro Val His Gly Val Glu Val
130 135 140
Met Pro Leu His Thr Val Pro Ile Pro Gly Leu Gln Phe Glu Gly Pro
145 150 155 160
Asp Ala Pro Val Tyr Glu Val Thr Leu Thr Ala Ser Leu Gly Thr Leu
165 170 175
Asn Thr Leu Ala Asp Val Pro Asp Ser Val Val Gln Gly Arg Gly Gln
180 185 190
Lys Gln Leu Ile Ile Ser Thr Ser Asp Arg Lys Leu Leu Lys Phe Ile
195 200 205
Leu Gln His Val Thr Tyr Thr Ser Thr Gly Tyr Gln His Gln Lys Val
210 215 220
Asp Ile Val Ser Leu Glu Ser Arg Ser Ser Val Ala Lys Phe Pro Val
225 230 235 240
Thr Ile Arg His Pro Val Ile Pro Lys Leu Tyr Asp Pro Gly Pro Glu
245 250 255
Arg Lys Leu Arg Asn Leu Val Thr Ile Ala Thr Lys Thr Phe Leu Arg
260 265 270
Pro His Lys Leu Met Ile Met Leu Arg Ser Ile Arg Glu Tyr Tyr Pro
275 280 285
Asp Leu Thr Val Ile Val Ala Asp Asp Ser Gln Lys Pro Leu Glu Ile
290 295 300
Lys Asp Asn His Val Glu Tyr Tyr Thr Met Pro Phe Gly Lys Gly Trp
305 310 315 320
Phe Ala Gly Arg Asn Leu Ala Ile Ser Gln Val Thr Thr Lys Tyr Val
325 330 335
Leu Trp Val Asp Asp Asp Phe Leu Phe Asn Glu Glu Thr Lys Ile Glu
340 345 350
Val Leu Val Asp Val Leu Glu Lys Thr Glu Leu Asp Val Val Gly Gly
355 360 365
Ser Val Leu Gly Asn Val Phe Gln Phe Lys Leu Leu Leu Glu Gln Ser
370 375 380
Glu Asn Gly Ala Cys Leu His Lys Arg Met Gly Phe Phe Gln Pro Leu
385 390 395 400
Asp Gly Phe Pro Ser Cys Val Val Thr Ser Gly Val Val Asn Phe Phe
405 410 415
Leu Ala His Thr Glu Arg Leu Gln Arg Val Gly Phe Asp Pro Arg Leu
420 425 430
Gln Arg Val Ala His Ser Glu Phe Phe Ile Asp Gly Leu Gly Thr Leu
435 440 445
Leu Val Gly Ser Cys Pro Glu Val Ile Ile Gly His Gln Ser Arg Ser
450 455 460
Pro Val Val Asp Ser Glu Leu Ala Ala Leu Glu Lys Thr Tyr Asn Thr
465 470 475 480
Tyr Arg Ser Asn Thr Leu Thr Arg Val Gln Phe Lys Leu Ala Leu His
485 490 495
Tyr Phe Lys Asn His Leu Gln Cys Ala Ala
500 505
<210> 38
<211> 7887
<212> DNA
<213> 智人
<400> 38
tgaagatcag ttgggtgcac gagtgggtta catcgaactg gatctcaaca gcggtaagat 60
ccttgagagt tttcgccccg aagaacgaat tcttagaaaa actcatcgag catcaaatga 120
aactgcaatt tattcatatc aggattatca ataccatatt tttgaaaaag ccgtttctgt 180
aatgaaggag aaaactcacc gaggcagttc cataggatgg caagatcctg gtatcggtct 240
gcgattccga ctcgtccaac atcaatacaa cctattaatt tcccctcgtc aaaaataagg 300
ttatcaagtg agaaatcacc atgagtgacg actgaatccg gtgagaatgg caaaagttta 360
tgcatttctt tccagacttg ttcaacaggc cagccattac gctcgtcatc aaaatcactc 420
gcatcaacca aaccgttatt cattcgtgat tgcgcctgag cgagacgaaa tacgcgatcg 480
ctgttaaaag gacaattaca aacaggaatc gaatgcaacc ggcgcaggaa cactgccagc 540
gcatcaacaa tattttcacc tgaatcagga tattcttcta atacctggaa tgctgttttc 600
ccggggatcg cagtggtgag taaccatgca tcatcaggag tacggataaa atgcttgatg 660
gtcggaagag gcataaattc cgtcagccag tttagtctga ccatctcatc tgtaacatca 720
ttggcaacgc tacctttgcc atgtttcaga aacaactctg gcgcatcggg cttcccatac 780
aatcgataga ttgtcgcacc tgattgcccg acattatcgc gagcccattt atacccatat 840
aaatcagcat ccatgttgga atttaatcgc ggcctagagc aagacgtttc ccgttgaata 900
tggctcataa caccccttgt attactgttt atgtaagcag acagttttat tgttcatgac 960
caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa 1020
aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc 1080
accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt 1140
aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg 1200
ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc 1260
agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt 1320
accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga 1380
gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct 1440
tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg 1500
cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca 1560
cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa 1620
cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt 1680
ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga 1740
taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga 1800
gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctgcgc 1860
gctcgctcgc tcactgaggc cgcccgggca aagcccgggc gtcgggcgac ctttggtcgc 1920
ccggcctcag tgagcgagcg agcgcgcaga gagggagtgg ccaactccat cactaggggt 1980
tccttgtagt taatgattaa cccgccatgc tacttatcta cgtagccatg ctctagacag 2040
ccactatggg tctaggctgc ccatgtaagg aggcaaggcc tggggacacc cgagatgcct 2100
ggttataatt aacccagaca tgtggctgct cccccccccc aacacctgct gcctgagcct 2160
cacccccacc ccggtgcctg ggtcttaggc tctgtacacc atggaggaga agctcgctct 2220
aaaaataacc ctgtccctgg tgggctgtgg gggactgagg gcaggctgta acaggcttgg 2280
gggccagggc ttatacgtgc ctgggactcc caaagtatta ctgttccatg ttcccggcga 2340
agggccagct gtcccccgcc agctagactc agcacttagt ttaggaacca gtgagcaagt 2400
cagcccttgg ggcagcccat acaaggccat ggggctgggc aagctgcacg cctgggtccg 2460
gggtgggcac ggtgcccggg caacgagctg aaagctcatc tgctctcagg ggcccctccc 2520
tggggacagc ccctcctggc tagtcacacc ctgtaggctc ctctatataa cccaggggca 2580
caggggctgc ccccgggtca ccaccacctc cacagcacag acagacactc aggagccagc 2640
cagccaggta agtttagtct ttttgtcttt tatttcaggt cccggatccg gtggtggtgc 2700
aaatcaaaga actgctcctc agtggatgtt gcctttactt ctaggcctgt acggaagtgt 2760
tacttctgct ctaaaagctg cggaattgta cccgcggccg gctagccgcc accatgactt 2820
cgggcggctc gagatttctg tggctcctca agatattggt cataatcctg gtacttggca 2880
ttgttggatt tatgttcgga agcatgttcc ttcaagcagt gttcagcagc cccaagccag 2940
aactcccaag tcctgccccg ggtgtccaga agctgaagct tctgcctgag gaacgtctca 3000
ggaacctctt ttcctacgat ggaatctggc tgttcccgaa aaatcagtgc aaatgtgaag 3060
ccaacaaaga gcagggaggt tacaactttc aggatgccta tggccagagc gacctcccag 3120
cggtgaaagc gaggagacag gctgaatttg aacactttca gaggagagaa gggctgcccc 3180
gcccactgcc cctgctggtc cagcccaacc tcccctttgg gtacccagtc cacggagtgg 3240
aggtgatgcc cctgcacacg gttcccatcc caggcctcca gtttgaagga cccgatgccc 3300
ccgtctatga ggtcaccctg acagcttctc tggggacact gaacaccctt gctgatgtcc 3360
cagacagtgt ggtgcagggc agaggccaga agcagctgat catttctacc agtgaccgga 3420
agctgttgaa gttcattctt cagcacgtga catacaccag cacggggtac cagcaccaga 3480
aggtagacat agtgagtctg gagtccaggt cctcagtggc caagtttcca gtgaccatcc 3540
gccatcctgt catacccaag ctatacgacc ctggaccaga gaggaagctc agaaacctgg 3600
ttaccattgc taccaagact ttcctccgcc cccacaagct catgatcatg ctccggagta 3660
ttcgagagta ttacccagac ttgaccgtaa tagtggctga tgacagccag aagcccctgg 3720
aaattaaaga caatcacgtg gagtattaca ctatgccctt tgggaagggt tggtttgctg 3780
gtaggaacct ggccatatct caggtcacca ccaaatacgt tctctgggtg gacgatgatt 3840
ttctcttcaa cgaggagacc aagattgagg tgctggtgga tgtcctggag aaaacagaac 3900
tggacgtggt aggcggcagt gtgctgggaa atgtgttcca gtttaagttg ttgctggaac 3960
agagtgagaa tggggcctgc cttcacaaga ggatgggatt tttccaaccc ctggatggct 4020
tccccagctg cgtggtgacc agtggcgtgg tcaacttctt cctggcccac acggagcgac 4080
tccaaagagt tggctttgat ccccgcctgc aacgagtggc tcactcagaa ttcttcattg 4140
atgggctagg gaccctactc gtggggtcat gcccagaagt gattataggt caccagtctc 4200
ggtctccagt ggtggactca gaactggctg ccctagagaa gacctacaat acataccggt 4260
ccaacaccct cacccgggtc cagttcaagc tggccctcca ctacttcaag aaccatctcc 4320
aatgtgccgc ataagcatgc gggcatacca gtgtcagctg cacttgtagg ggcccaagtg 4380
cctcatgacc cactcggcag ccttcctctc caggatcccc aaggctagga ggccaaccta 4440
ctaacaggtg ggtgggtatg gtgtgtggtt tcactcagtt cttctcatgg ggtttctctg 4500
agctccattc ataccagaaa gggagcagga gagagaggac aagtggatcc aacagccttc 4560
gctccagggg aatcagggca tcgcctcctt ttctgggagg acactccctt ctgatggtga 4620
atgggaactc ccttcctcct gcagcagcct gcctgcagct gtcctggtag aacagtgtgg 4680
acattgcaga agctgtcact gccccagaaa gaaagcaccc cagagccaag gcaaagagtc 4740
ttgaaagcgc cacaagcagc agctgctgag actagtatgg tccgcgcgag gcaccagccg 4800
ggtgggcttt gcctcctgct gctgctgctc tgccagttca tggaggaccg cagtgcccag 4860
gctgggaact gctggctccg tcaagcgaag aacggccgct gccaggtcct gtacaagacc 4920
gaactgagca aggaggagtg ctgcagcacc ggccggctga gcacctcgtg gaccgaggag 4980
gacgtgaatg acaacacact cttcaagtgg atgattttca acgggggcgc ccccaactgc 5040
atcccctgta aagaaacgtg tgagaacgtg gactgtggac ctgggaaaaa atgccgaatg 5100
aacaagaaga acaaaccccg ctgcgtctgc gccccggatt gttccaacat cacctggaag 5160
ggtccagtct gcgggctgga tgggaaaacc taccgcaatg aatgtgcact cctaaaggca 5220
agatgtaaag agcagccaga actggaagtc cagtaccaag gcagatgtaa aaagacttgt 5280
cgggatgttt tctgtccagg cagctccaca tgtgtggtgg accagaccaa taatgcctac 5340
tgtgtgacct gtaatcggat ttgcccagag cctgcttcct ctgagcaata tctctgtggg 5400
aatgatggag tcacctactc cagtgcctgc cacctgagaa aggctacctg cctgctgggc 5460
agatctattg gattagccta tgagggaaag tgtatcaaag caaagtcctg tgaagatatc 5520
cagtgcactg gtgggaaaaa atgtttatgg gatttcaagg ttgggagagg ccggtgttcc 5580
ctctgtgatg agctgtgccc tgacagtaag tcggatgagc ctgtctgtgc cagtgacaat 5640
gccacttatg ccagcgagtg tgccatgaag gaagctgcct gctcctcagg tgtgctactg 5700
gaagtaaagc actccggatc ttgcaactcc atttcggaag acaccgagga agaggaggaa 5760
gatgaagacc aggactacag ctttcctata tcttctattc tagagtggta agcggccgca 5820
ataaaagatc tttattttca ttagatctgt gtgttggttt tttgtgtgtc tagagcatgg 5880
ctacgtagat aagtagcatg gcgggttaat cattaactac aaggaacccc tagtgatgga 5940
gttggccact ccctctctgc gcgctcgctc gctcactgag gccgggcgac caaaggtcgc 6000
ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgca gctggcgtaa 6060
tagcgaagag gcccgcaccg atcgcccttc ccaacagttg cgcagcctga atggcgaatg 6120
gcgattccgt tgcaatggct ggcggtaata ttgttctgga tattaccagc aaggccgata 6180
gtttgagttc ttctactcag gcaagtgatg ttattactaa tcaaagaagt attgcgacaa 6240
cggttaattt gcgtgatgga cagactcttt tactcggtgg cctcactgat tataaaaaca 6300
cttctcagga ttctggcgta ccgttcctgt ctaaaatccc tttaatcggc ctcctgttta 6360
gctcccgctc tgattctaac gaggaaagca cgttatacgt gctcgtcaaa gcaaccatag 6420
tacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc 6480
gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc 6540
acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt 6600
agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg 6660
ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt 6720
ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta 6780
taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt 6840
aacgcgaatt ttaacaaaat attaacgctt acaatttaaa tatttgctta tacaatcttc 6900
ctgtttttgg ggcttttctg attatcaacc ggggtacata tgattgacat gctagtttta 6960
cgattaccgt tcatcgattc tcttgtttgc tccagactct caggcaatga cctgatagcc 7020
tttgtagaga cctctcaaaa atagctaccc tctccggcat gaatttatca gctagaacgg 7080
ttgaatatca tattgatggt gatttgactg tctccggcct ttctcacccg tttgaatctt 7140
tacctacaca ttactcaggc attgcattta aaatatatga gggttctaaa aatttttatc 7200
cttgcgttga aataaaggct tctcccgcaa aagtattaca gggtcataat gtttttggta 7260
caaccgattt agctttatgc tctgaggctt tattgcttaa ttttgctaat tctttgcctt 7320
gcctgtatga tttattggat gttggaatcg cctgatgcgg tattttctcc ttacgcatct 7380
gtgcggtatt tcacaccgca tatggtgcac tctcagtaca atctgctctg atgccgcata 7440
gttaagccag ccccgacacc cgccaacacc cgctgacgcg ccctgacggg cttgtctgct 7500
cccggcatcc gcttacagac aagctgtgac cgtctccggg agctgcatgt gtcagaggtt 7560
ttcaccgtca tcaccgaaac gcgcgagacg aaagggcctc gtgatacgcc tatttttata 7620
ggttaatgtc atgataataa tggtttctta gacgtcaggt ggcacttttc ggggaaatgt 7680
gcgcggaacc cctatttgtt tatttttcta aatacattca aatatgtatc cgctcatgag 7740
acaataaccc tgataaatgc ttcaataata ttgaaaaagg aagagtatga gtattcaaca 7800
tttccgtgtc gcccttattc ccttttttgc ggcattttgc cttcctgttt ttgctcaccc 7860
agaaacgctg gtgaaagtaa aagatgc 7887
<210> 39
<211> 3341
<212> DNA
<213> 智人
<400> 39
attgcctgct tctccccacc cccaaattaa gttgcttagc aagggggaaa gaggcttttt 60
ccttcttcca acagcccagc cgaacgcctt tcgttttttg cccccgcgga ccttccatgt 120
aggaagccga ggctggcgag cccgacattc gggagccact gcgggggggc ctctttttgg 180
ggaggcgccg acgggggcag gctcggccgt ccccagggaa gcggcggccg ggttcctccg 240
gggcgcgccg gggccggaga gccgcgcagg gcgcgggccg cgcggggtgg ggcagccgga 300
gcgcaggccc ccgatccccg gcgggcgccc ccgggccccc gcgcgcgccc cggcctccgg 360
gagactggcg catgccacgg agcgcccctc gggccgccgc cgctcctgcc cgggcccctg 420
ctgctgctgc tgtcgcctgc gcctgctgcc ccaactcggc gcccgacttc ttcatggtgt 480
gcggaggtca tgttcgctcc ttagcaggca aacgactttt ctcctcgcct cctcgccccg 540
catgttcagg accaaacgat ctgcgctcgt ccggcgtctc tggaggagcc gtgcgcccgg 600
cggcgaggac gaggaggagg gcgcaggggg aggtggagga ggaggcgagc tgcggggaga 660
aggggcgacg gacagccgag cgcatggggc cggtggcggc ggcccgggca gggctggatg 720
ctgcctgggc aaggcggtgc gaggtgccaa aggtcaccac catccccacc cgccagccgc 780
gggcgccggc gcggccgggg gcgccgaggc ggatctgaag gcgctcacgc actcggtgct 840
caagaaactg aaggagcggc agctggagct gctgctccag gccgtggagt cccgcggcgg 900
gacgcgcacc gcgtgcctcc tgctgcccgg ccgcctggac tgcaggctgg gcccgggggc 960
gcccgccggc gcgcagcctg cgcagccgcc ctcgtcctac tcgctccccc tcctgctgtg 1020
caaagtgttc aggtggccgg atctcaggca ttcctcggaa gtcaagaggc tgtgttgctg 1080
tgaatcttac gggaagatca accccgagct ggtgtgctgc aacccccatc accttagccg 1140
actctgcgaa ctagagtctc ccccccctcc ttactccaga tacccgatgg attttctcaa 1200
accaactgca gactgtccag atgctgtgcc ttcctccgct gaaacagggg gaacgaatta 1260
tctggcccct ggggggcttt cagattccca acttcttctg gagcctgggg atcggtcaca 1320
ctggtgcgtg gtggcatact gggaggagaa gacgagagtg gggaggctct actgtgtcca 1380
ggagccctct ctggatatct tctatgatct acctcagggg aatggctttt gcctcggaca 1440
gctcaattcg gacaacaaga gtcagctggt gcagaaggtg cggagcaaaa tcggctgcgg 1500
catccagctg acgcgggagg tggatggtgt gtgggtgtac aaccgcagca gttaccccat 1560
cttcatcaag tccgccacac tggacaaccc ggactccagg acgctgttgg tacacaaggt 1620
gttccccggt ttctccatca aggctttcga ctacgagaag gcgtacagcc tgcagcggcc 1680
caatgaccac gagtttatgc agcagccgtg gacgggcttt accgtgcaga tcagctttgt 1740
gaagggctgg ggccagtgct acacccgcca gttcatcagc agctgcccgt gctggctaga 1800
ggtcatcttc aacagccggt agccgcgtgc ggaggggaca gagcgtgagc tgagcaggcc 1860
acacttcaaa ctactttgct gctaatattt tcctcctgag tgcttgcttt tcatgcaaac 1920
tctttggtcg tttttttttt gtttgttggt tggttttctt cttctcgtcc tcgtttgtgt 1980
tctgttttgt ttcgctcttt gagaaatagc ttatgaaaag aattgttggg ggtttttttg 2040
gaagaagggg caggtatgat cggcaggaca ccctgatagg aagaggggaa gcagaaatcc 2100
aagcaccacc aaacacagtg tatgaagggg ggcggtcatc atttcacttg tcaggagtgt 2160
gtgtgagtgt gagtgtgcgg ctgtgtgtgc acgcgtgtgc aggagcggca gatggggaga 2220
caacgtgctc tttgttttgt gtctcttatg gatgtcccca gcagagaggt ttgcagtccc 2280
aagcggtgtc tctcctgccc cttggacacg ctcagtgggg cagaggcagt acctgggcaa 2340
gctggcggct ggggtcccag cagctgccag gagcacggct ctgtccccag cctgggaaag 2400
cccctgcccc tcctctccct catcaaggac acgggcctgt ccacaggctt ctgagcagcg 2460
agcctgctag tggccgaacc agaaccaatt attttcatcc ttgtcttatt cccttcctgc 2520
cagcccctgc cattgtagcg tctttctttt ttggccatct gctcctggat ctccctgaga 2580
tgggcttccc aagggctgcc ggggcagccc cctcacagta ttgctcaccc agtgccctct 2640
cccctcagcc tctcccctgc ctgccctggt gacatcaggt ttttcccgga cttagaaaac 2700
cagctcagca ctgcctgctc ccatcctgtg tgttaagctc tgctattagg ccagcaagcg 2760
gggatgtccc tgggagggac atgcttagca gtccccttcc ctccaagaag gatttggtcc 2820
gtcataaccc aaggtaccat cctaggctga cacctaactc ttctttcatt tcttctacaa 2880
ctcatacact cgtatgatac ttcgacactg ttcttagctc aatgagcatg tttagacttt 2940
aacataagct atttttctaa ctacaaaggt ttaaatgaac aagagaagca ttctcattgg 3000
aaatttagca ttgtagtgct ttgagagaga aaggactcct gaaaaaaaac ctgagattta 3060
ttaaagaaaa aaatgtattt tatgttatat ataaatatat tattacttgt aaatataaag 3120
acgttttata agcatcatta tttatgtatt gtgcaatgtg tataaacaag aaaaataaag 3180
aaaagatgca ctttgcttta atataaatgc aaataacaaa tgccaaatta aaaaagataa 3240
acacaagatt ggtgtttttt tctatgggtg ttatcaccta gctgaatgtt tttctaaagg 3300
agtttatgtt ccattaaacg atttttaaaa tgtacacttg a 3341
<210> 40
<211> 426
<212> PRT
<213> 智人
<400> 40
Met Phe Arg Thr Lys Arg Ser Ala Leu Val Arg Arg Leu Trp Arg Ser
1 5 10 15
Arg Ala Pro Gly Gly Glu Asp Glu Glu Glu Gly Ala Gly Gly Gly Gly
20 25 30
Gly Gly Gly Glu Leu Arg Gly Glu Gly Ala Thr Asp Ser Arg Ala His
35 40 45
Gly Ala Gly Gly Gly Gly Pro Gly Arg Ala Gly Cys Cys Leu Gly Lys
50 55 60
Ala Val Arg Gly Ala Lys Gly His His His Pro His Pro Pro Ala Ala
65 70 75 80
Gly Ala Gly Ala Ala Gly Gly Ala Glu Ala Asp Leu Lys Ala Leu Thr
85 90 95
His Ser Val Leu Lys Lys Leu Lys Glu Arg Gln Leu Glu Leu Leu Leu
100 105 110
Gln Ala Val Glu Ser Arg Gly Gly Thr Arg Thr Ala Cys Leu Leu Leu
115 120 125
Pro Gly Arg Leu Asp Cys Arg Leu Gly Pro Gly Ala Pro Ala Gly Ala
130 135 140
Gln Pro Ala Gln Pro Pro Ser Ser Tyr Ser Leu Pro Leu Leu Leu Cys
145 150 155 160
Lys Val Phe Arg Trp Pro Asp Leu Arg His Ser Ser Glu Val Lys Arg
165 170 175
Leu Cys Cys Cys Glu Ser Tyr Gly Lys Ile Asn Pro Glu Leu Val Cys
180 185 190
Cys Asn Pro His His Leu Ser Arg Leu Cys Glu Leu Glu Ser Pro Pro
195 200 205
Pro Pro Tyr Ser Arg Tyr Pro Met Asp Phe Leu Lys Pro Thr Ala Asp
210 215 220
Cys Pro Asp Ala Val Pro Ser Ser Ala Glu Thr Gly Gly Thr Asn Tyr
225 230 235 240
Leu Ala Pro Gly Gly Leu Ser Asp Ser Gln Leu Leu Leu Glu Pro Gly
245 250 255
Asp Arg Ser His Trp Cys Val Val Ala Tyr Trp Glu Glu Lys Thr Arg
260 265 270
Val Gly Arg Leu Tyr Cys Val Gln Glu Pro Ser Leu Asp Ile Phe Tyr
275 280 285
Asp Leu Pro Gln Gly Asn Gly Phe Cys Leu Gly Gln Leu Asn Ser Asp
290 295 300
Asn Lys Ser Gln Leu Val Gln Lys Val Arg Ser Lys Ile Gly Cys Gly
305 310 315 320
Ile Gln Leu Thr Arg Glu Val Asp Gly Val Trp Val Tyr Asn Arg Ser
325 330 335
Ser Tyr Pro Ile Phe Ile Lys Ser Ala Thr Leu Asp Asn Pro Asp Ser
340 345 350
Arg Thr Leu Leu Val His Lys Val Phe Pro Gly Phe Ser Ile Lys Ala
355 360 365
Phe Asp Tyr Glu Lys Ala Tyr Ser Leu Gln Arg Pro Asn Asp His Glu
370 375 380
Phe Met Gln Gln Pro Trp Thr Gly Phe Thr Val Gln Ile Ser Phe Val
385 390 395 400
Lys Gly Trp Gly Gln Cys Tyr Thr Arg Gln Phe Ile Ser Ser Cys Pro
405 410 415
Cys Trp Leu Glu Val Ile Phe Asn Ser Arg
420 425

Claims (51)

1.一种多核苷酸,其包含
a)启动子元件,
b)转基因,
c)内部核糖体进入位点(IRES),和
d)编码肌肉生长因子或肌肉转分化因子的核苷酸序列。
2.根据权利要求1所述的多核苷酸,其中所述启动子元件与所述转基因可操作地连接。
3.根据权利要求1或2所述的多核苷酸,其中所述IRES与所述编码肌肉生长因子或肌肉转分化因子的核苷酸序列可操作地连接。
4.一种多核苷酸,其包含:
a)一种或多种启动子元件,和
b)GNE cDNA序列。
5.一种多核苷酸,其包含:
a)一种或多种启动子元件,
b)GNE cDNA序列或GALGT2 cDNA序列,
c)内部核糖体进入位点(IRES),和
d)编码肌肉生长因子或肌肉转分化因子的核苷酸序列。
6.根据权利要求4或5所述的多核苷酸,其中所述启动子元件与所述GNE cDNA序列或所述GALGT2 cDNA序列可操作地连接。
7.根据权利要求5或6所述的多核苷酸,其中所述IRES与所述编码肌肉生长因子或肌肉转分化因子的核苷酸序列可操作地连接。
8.根据权利要求1至7中任一项所述的多核苷酸,其中所述启动子元件是组成型启动子或肌肉特异性启动子。
9.根据权利要求1至8中任一项所述的多核苷酸,其中所述启动子元件是CMV启动子、MCK启动子、MHCK7启动子、迷你CMV启动子或GNE启动子。
10.根据权利要求4至9中任一项所述的多核苷酸,其中所述GNE cDNA序列是包含SEQID NO:1的核酸序列的变体2GNE野生型人GNE基因。
11.根据权利要求4至10中任一项所述的多核苷酸序列,进一步包含在外显子1和2之间发现的所述人GNE启动子元件以驱动所述GNE cDNA的表达。
12.根据权利要求5至10中任一项所述的多核苷酸序列,其中所述GALGT2 cDNA序列包含SEQ ID NO:36的核酸序列。
13.根据权利要求1至12中任一项所述的多核苷酸,其中所述内部核糖体进入位点(IRES)来自成纤维细胞生长因子1A基因。
14.根据权利要求13所述的多核苷酸,其中所述IRES包含SEQ ID NO:30的核苷酸序列或其片段。
15.根据权利要求13所述的多核苷酸,其中所述IRES包含SEQ ID NO:8的核苷酸序列。
16.根据权利要求1至15中任一项所述的多核苷酸,其中所述核苷酸序列编码卵泡抑素、SMAD7或胰岛素生长因子1(IGF1)变体。
17.根据权利要求16所述的多核苷酸,其中所述卵泡抑素是卵泡抑素344或卵泡抑素314。
18.根据权利要求16所述的多核苷酸,其中所述IGF1变体是HB-IGF1。
19.一种重组腺相关病毒(rAAV),其基因组包含权利要求1至18中任一项所述的多核苷酸序列,其中所述多核苷酸处于单个rAAV基因组中。
20.根据权利要求19所述的rAAV,其中所述基因组包含CMV启动子和变体2野生型人GNEcDNA。
21.根据权利要求19所述的rAAV,其中所述基因组包含MCK启动子和变体2野生型人GNEcDNA。
22.根据权利要求19所述的rAAV,其中所述基因组包含MHCK启动子和变体2野生型人GNE cDNA。
23.根据权利要求19所述的rAAV,其中所述基因组包含GNE启动子和变体2野生型人GNEcDNA。
24.根据权利要求19所述的rAAV,其中所述基因组包含迷你CMV启动子和变体2野生型人GNE cDNA。
25.根据权利要求19所述的rAAV,其中所述基因组包含MCK7启动子、变体2野生型人cDNA、FGF1 IRES和编码卵泡抑素344的核酸序列。
26.根据权利要求19所述的rAAV,其中所述基因组包含MHCK7启动子、变体2野生型人GNE cDNA、FGF1 IRES和编码HB-IGF1的核酸序列。
27.根据权利要求19所述的rAAV,其中所述基因组包含所述CMV启动子、变体2野生型人GNE cDNA、FGF1 IRES和编码卵泡抑素344的核酸序列。
28.根据权利要求19所述的rAAV,其中所述基因组包含所述CMV启动子、变体2野生型人GNE cDNA、FGF1 IRES和编码HB-IGF1的核酸序列。
29.根据权利要求19所述的rAAV,其中所述基因组包含所述MCK启动子、变体2野生型人GNE cDNA、FGF1 IRES和编码卵泡抑素344的核酸序列。
30.根据权利要求19所述的rAAV,其中所述基因组包含所述MCK启动子、变体2野生型人GNE cDNA、FGF1 IRES和编码HB-IGF1的核酸序列。
31.根据权利要求19所述的rAAV,其中所述基因组包含所述GNE启动子、变体2野生型人GNE cDNA、FGF1 IRES和编码卵泡抑素344的核酸序列。
32.根据权利要求19所述的rAAV,其中所述基因组包含所述GNE启动子、变体2野生型人GNE cDNA、FGF1 IRES和编码HB-IGF1的核酸序列。
33.根据权利要求19所述的rAAV,其中所述基因组包含所述迷你CMV启动子、变体2野生型人GNE cDNA、FGF1 IRES和编码卵泡抑素344的核酸序列。
34.根据权利要求19所述的rAAV,其中所述基因组包含所述迷你CMV启动子、变体2野生型人GNE cDNA、FGF1 IRES和编码HB-IGF1的核酸序列。
35.根据权利要求19所述的rAAV,其中所述基因组包含MHCK7启动子、变体2野生型人GNE cDNA、FGF1 IRES和编码SMAD7的核酸序列。
36.根据权利要求19所述的rAAV,其中所述基因组包含CMV启动子、变体2野生型人GNEcDNA、FGF1 IRES和编码SMAD7的核酸序列。
37.根据权利要求19所述的rAAV,其中所述基因组包含MCK启动子、变体2野生型人GNEcDNA、FGF1 IRES和编码SMAD7的核酸序列。
38.根据权利要求19所述的rAAV,其中所述基因组包含GNE启动子、变体2野生型人GNEcDNA、FGF1 IRES和编码SMAD7的核酸序列。
39.根据权利要求19所述的rAAV,其中所述基因组包含迷你CMV启动子、变体2野生型人GNE cDNA、FGF1 IRES和编码SMAD7的核酸序列。
40.根据权利要求19所述的rAAV,其中所述基因组包含所述MCK启动子、GALGT2cDNA、FGFR1 IRES和编码卵泡抑素344的核酸。
41.根据权利要求19所述的rAAV,其中所述基因组包含所述MCK启动子、GALGT2cDNA、FGFR1 IRES和编码HB-IGF1的核酸。
42.根据权利要求19所述的rAAV,其中所述基因组包含MCK启动子、GALGT2 cDNA、FGF1IRES和编码SMAD7的核酸序列。
43.根据权利要求19至42中任一项所述的rAAV,其中所述rAAV是血清型AAVrh.74。
44.一种rAAV颗粒,其包含根据权利要求19至43中任一项所述的rAAV。
45.一种治疗有需要的人类受试者的GNE肌病的方法,其包含施用根据权利要求19至39中任一项所述的rAAV或根据权利要求44所述的rAAV颗粒的步骤。
46.根据权利要求19至39中任一项所述的rAAV或根据权利要求44所述的rAAV颗粒在制备用于治疗GNE肌病的药物中的用途。
47.一种组合物,其包含根据权利要求19至39中任一项所述的rAAV或根据权利要求44所述的rAAV颗粒,所述组合物用于治疗GNE肌病。
48.一种治疗有需要的人类受试者的肌营养不良症的方法,其包含施用根据权利要求40至42中任一项所述的rAAV或根据权利要求44所述的rAAV颗粒的步骤。
49.根据权利要求40至42中任一项所述的rAAV或根据权利要求44所述的rAAV颗粒在制备用于治疗肌营养不良症的药物中的用途。
50.一种组合物,其包含根据权利要求40至42中任一项所述的rAAV或根据权利要求44所述的rAAV颗粒,所述组合物用于治疗肌营养不良症。
51.根据权利要求48至50中任一项所述的方法、用途或组合物,其中所述肌营养不良症是杜氏肌营养不良症、肢带肌营养不良症2D或先天性肌营养不良症1A。
CN202080097838.0A 2019-12-20 2020-12-21 靶向肌肉疾病中肌肉的优化基因疗法 Pending CN115516100A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962951564P 2019-12-20 2019-12-20
US62/951564 2019-12-20
PCT/US2020/066477 WO2021127655A1 (en) 2019-12-20 2020-12-21 Optimized gene therapy for targeting muscle in muscle diseases

Publications (1)

Publication Number Publication Date
CN115516100A true CN115516100A (zh) 2022-12-23

Family

ID=74181377

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080097838.0A Pending CN115516100A (zh) 2019-12-20 2020-12-21 靶向肌肉疾病中肌肉的优化基因疗法

Country Status (8)

Country Link
US (1) US20230227515A1 (zh)
EP (1) EP4077687A1 (zh)
JP (1) JP2023507794A (zh)
CN (1) CN115516100A (zh)
AU (1) AU2020408225A1 (zh)
CA (1) CA3165469A1 (zh)
IL (1) IL294072A (zh)
WO (1) WO2021127655A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023076972A1 (en) * 2021-10-27 2023-05-04 The University Of North Carolina At Chapel Hill Aav-idua vector for treatment of mps i

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5041538A (en) 1987-08-28 1991-08-20 The Salk Institute For Biological Studies Mammalian follistatin
US5173414A (en) 1990-10-30 1992-12-22 Applied Immune Sciences, Inc. Production of recombinant adeno-associated virus vectors
AU688428B2 (en) 1993-11-09 1998-03-12 Johns Hopkins University, The Generation of high titers of recombinant AAV vectors
PT728214E (pt) 1993-11-09 2004-11-30 Ohio Med College Linhas celulares estaveis capazes de expressar o gene de replicacao do virus adeno-associado
US5658785A (en) 1994-06-06 1997-08-19 Children's Hospital, Inc. Adeno-associated virus materials and methods
US5856152A (en) 1994-10-28 1999-01-05 The Trustees Of The University Of Pennsylvania Hybrid adenovirus-AAV vector and methods of use therefor
WO1996017947A1 (en) 1994-12-06 1996-06-13 Targeted Genetics Corporation Packaging cell lines for generation of high titers of recombinant aav vectors
FR2737730B1 (fr) 1995-08-10 1997-09-05 Pasteur Merieux Serums Vacc Procede de purification de virus par chromatographie
CA2625279A1 (en) 1995-08-30 1997-03-06 Genzyme Corporation Chromatographic purification of adenovirus and aav
EP1983057A3 (en) 1995-09-08 2009-01-07 Genzyme Corporation Improved AAV vectors for gene therapy
US5910434A (en) 1995-12-15 1999-06-08 Systemix, Inc. Method for obtaining retroviral packaging cell lines producing high transducing efficiency retroviral supernatant
KR20000068501A (ko) 1996-09-06 2000-11-25 트러스티스 오브 더 유니버시티 오브 펜실바니아 재조합 아데노-관련 바이러스 지정 유전자 요법을 위한 방법
JP2001513982A (ja) 1997-08-29 2001-09-11 ヒューマン ジノーム サイエンシーズ, インコーポレイテッド フォリスタチン−3
US6953662B2 (en) 1997-08-29 2005-10-11 Human Genome Sciences, Inc. Follistatin-3
US6566118B1 (en) 1997-09-05 2003-05-20 Targeted Genetics Corporation Methods for generating high titer helper-free preparations of released recombinant AAV vectors
EP1009808B1 (en) 1997-09-05 2012-12-05 Genzyme Corporation Methods for generating high titer helper-free preparations of recombinant aav vectors
US5942420A (en) 1997-11-17 1999-08-24 Millennium Biotherapeutics, Inc. Molecules of the follistatin-related protein family and uses therefor
US6258595B1 (en) 1999-03-18 2001-07-10 The Trustees Of The University Of Pennsylvania Compositions and methods for helper-free production of recombinant adeno-associated viruses
WO2001083692A2 (en) 2000-04-28 2001-11-08 The Trustees Of The University Of Pennsylvania Recombinant aav vectors with aav5 capsids and aav5 vectors pseudotyped in heterologous capsids
EP1294407A2 (en) * 2000-06-30 2003-03-26 Collateral Therapeutics Dual recombinant gene therapy compositions and methods of use
AU2002248297A1 (en) 2001-01-05 2002-07-16 Children's Hospital, Inc. Aav2 vectors and methods
EP3517134B1 (en) 2001-12-17 2024-01-17 The Trustees of the University of Pennsylvania Adeno-associated virus (aav) serotype 8 sequences, vectors containing same and uses therefor
EP1948247A4 (en) * 2005-11-15 2010-07-07 Univ Leland Stanford Junior COMPOSITIONS FOR COORDINATED VEGF AND PDGF EXPRESSION AND METHOD OF USE THEREOF
WO2013102904A1 (en) * 2012-01-05 2013-07-11 Hadasit Medical Research Services & Development Ltd. Methods and compositions for gene delivery
DE102012007232B4 (de) 2012-04-07 2014-03-13 Susanne Weller Verfahren zur Herstellung von rotierenden elektrischen Maschinen
JP2015092462A (ja) 2013-09-30 2015-05-14 Tdk株式会社 正極及びそれを用いたリチウムイオン二次電池
WO2015141521A1 (ja) 2014-03-21 2015-09-24 株式会社日立国際電気 基板処理装置、半導体装置の製造方法及び記録媒体
WO2016016119A1 (en) * 2014-07-26 2016-02-04 Consiglio Nazionale Delle Ricerche Compositions and methods for treatment of muscular dystrophy
JP6197169B2 (ja) 2014-09-29 2017-09-20 東芝メモリ株式会社 半導体装置の製造方法
CN116196389A (zh) * 2016-01-06 2023-06-02 康德生物医疗有限公司 用于预防和治疗杜氏肌肉萎缩症的方法和组合物

Also Published As

Publication number Publication date
CA3165469A1 (en) 2021-06-24
AU2020408225A1 (en) 2022-07-14
WO2021127655A1 (en) 2021-06-24
JP2023507794A (ja) 2023-02-27
EP4077687A1 (en) 2022-10-26
IL294072A (en) 2022-08-01
US20230227515A1 (en) 2023-07-20

Similar Documents

Publication Publication Date Title
AU2020260491B2 (en) Gene therapies for lysosomal disorders
AU2019202498B2 (en) AADC polynucleotides for the treatment of Parkinson&#39;s Disease
AU2020203826B2 (en) Compositions and Methods for Treating MPSI
AU2020260476B2 (en) Gene therapies for lysosomal disorders
KR20220022107A (ko) 유전자 전달을 위한 재조합 아데노-연관 바이러스 벡터
KR20210092755A (ko) 신경원성 세로이드 리포푸신증에 대한 유전자 요법
CN113005123A (zh) 用于神经变性疾病的基因疗法
KR20170121745A (ko) 선택적 스플라이싱의 앱타머 매개 조절에 의한 유전자 발현의 조절
AU2016343979A1 (en) Delivery of central nervous system targeting polynucleotides
KR20170026358A (ko) 리소좀 저장 장애의 치료를 위한 아데노연관 바이러스 벡터
CN114026115A (zh) 用于溶酶体病症的基因疗法
US20020076754A1 (en) Overcoming AAV vector size limitation through viral DNA hetero-dimerization
KR20210086645A (ko) Aav 삼중-플라스미드 시스템
CN114174324A (zh) 用于溶酶体病症的基因疗法
CN115516100A (zh) 靶向肌肉疾病中肌肉的优化基因疗法
KR20210151785A (ko) 비바이러스성 dna 벡터 및 fviii 치료제 발현을 위한 이의 용도
KR20230066360A (ko) 신경퇴행성 장애를 위한 유전자 요법
KR20230051529A (ko) 리소좀 장애에 대한 유전자 요법
RU2812852C2 (ru) Невирусные днк-векторы и варианты их применения для экспрессии терапевтического средства на основе фактора viii (fviii)
KR20210150487A (ko) 리소좀 장애를 위한 유전자 요법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination