CN1777676A - 与精神分裂症相关的电压门控离子通道基因及蛋白质 - Google Patents

与精神分裂症相关的电压门控离子通道基因及蛋白质 Download PDF

Info

Publication number
CN1777676A
CN1777676A CNA018224997A CN01822499A CN1777676A CN 1777676 A CN1777676 A CN 1777676A CN A018224997 A CNA018224997 A CN A018224997A CN 01822499 A CN01822499 A CN 01822499A CN 1777676 A CN1777676 A CN 1777676A
Authority
CN
China
Prior art keywords
polynucleotide
canion
polypeptide
sequence
equipotential
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA018224997A
Other languages
English (en)
Inventor
D·科恩
I·丘马科弗
A·-M·西蒙
H·阿布德雷希姆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Merck Biodevelopment SAS
Original Assignee
Genset SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Genset SA filed Critical Genset SA
Publication of CN1777676A publication Critical patent/CN1777676A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • A61P25/18Antipsychotics, i.e. neuroleptics; Drugs for mania or schizophrenia
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • A61P25/28Drugs for disorders of the nervous system for treating neurodegenerative disorders of the central nervous system, e.g. nootropic agents, cognition enhancers, drugs for treating Alzheimer's disease or other forms of dementia
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P9/00Drugs for disorders of the cardiovascular system
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/05Animals comprising random inserted nucleic acids (transgenic)

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Medicinal Chemistry (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Animal Behavior & Ethology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Neurology (AREA)
  • Neurosurgery (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Immunology (AREA)
  • Toxicology (AREA)
  • Wood Science & Technology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Cell Biology (AREA)
  • Psychiatry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Engineering & Computer Science (AREA)
  • Plant Pathology (AREA)
  • Hospice & Palliative Care (AREA)
  • Cardiology (AREA)
  • Microbiology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Physics & Mathematics (AREA)
  • Peptides Or Proteins (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及新型电压门控离子通道蛋白质CanIon的基因组DNA、cDNA和多肽序列。本发明还涉及CanIon基因的双等位标记。所述CanIon基因可用作治疗和诊断精神分裂症、双极情感障碍(bipolar disorder)和其它疾病和症状的生物靶标。

Description

与精神分裂症相关的电压门控离子通道基因及蛋白质
技术领域
本发明涉及电压门控离子通道基因和蛋白质及其在疾病中的作用。本发明涉及编码CanIon多肽的多核苷酸以及位于所述编码区5’-和3’-端的调节区。本发明还涉及CanIon基因编码的多肽。本发明同时提供了筛选CanIon通道调节剂(如拮抗剂)的方法以及使用这种调节剂治疗或预防各种疾病或症状的方法。本发明还涉及专门针对此类多肽故可用作诊断试剂的抗体。本发明进一步包括在基因分析中有用的CanIon基因的双等位基因标记。
背景技术
基础和临床研究人员使得他们能够对健康和患病中的脑及神经系统功能进行越来越深入的研究。关于中枢神经系统(CNS)疾病包括精神病和神经退化疾病有关的神经化学和遗传机理,业已提出了神经生物学及药理学的许多假设。然而,CNS疾病很复杂,病原学知之甚少以及症状重叠,特征显著,故而难以判断。所以,对进一步的治疗方案和药物开发的努力会更加复杂,并集中在多基因病因上,而且需要一些新尝的去验给疾病分类,为患有CNS疾病的病人提供更准确的诊断和预后信息。
CNS疾病包括的范围很广,和相应地范围很广的遗传原因。CNS病的例子包括神经退化性疾病、精神病(psychotic disorders)、情绪失常(mood disorders)、自闭病、药物成瘾和酗酒、癫痫、弱智及其它精神疾病(psychiatric diseases),包括认知能力(cognitive)、焦虑、饮食、冲动控制(impulse-control)及人格障碍(personality disorders)。可采用精神病诊断和统计手册(Diagnosis andStatistical Manual of Mental Disorders)第四版(DSM-IV)的分类给这些疾病作定义。
即使只考虑一个小亚组的CNS疾病,由于对精神分裂症和双极情感障碍缺乏足够的治疗方法和对此病的分子基础缺乏了解,很显然,需要在治疗发明上有新目标及改进的治疗方法。对于精神分裂症和双极情感障碍,所有用于治疗它们的现有已知分子都有副作用,而且只对症状起作用。故目前迫切需要没有伴随副作用、并针对涉及精神分裂症和双极情感障碍病源机制的目标的新分子。所以,有助发现和特征鉴定这些目标的工具是必要的和有用的。
电压门控离子通道
电压门控离子通道是大分子大家族的一部分,这些大分子的作用包括控制t保持跨越细胞膜的电势、分泌和信号转导。这些通道蛋白质参与控制神经元释放神经递质,并在许多细胞功能包括膜兴奋性、肌肉收缩和突触传递的调控中起着重要作用。Na+通道主要的α-亚基和Ca+通道主要的α-1亚基由大约2000个氨基酸组成并包括离子传导通路。生化分析揭示,具有生理学活性的离子通道由几种不同的亚基组成。有两种与Na+通道的α亚基、β-1和β-2亚基共纯化的辅助亚基。对Ca+通道还鉴定了具有调节作用的其它亚基(α-2、β、γ和δ)。α-2和β亚基似乎可增强Ca+通道α-1亚基的功能活性。K+通道的α亚基与β亚基的比例为1∶1,可导致K+通道复合体呈现(α)4(β)4化学计量(Terlau等,Naturwissenschaften 85:437-444(1998))。例如,Williams等Science 257:389-395(1992);Mori等Nature 350:398-402(1991);以及Koch等J.Biol.Chem.265(29)17786-17791(1990)中进一步讨论了钙和钠离子通道的基础结构和例子。Lee等FEBS Lett.445231:236(1999)进一步描述了与CanIon通道具有高度序列同源性水平的大鼠Ca+和Na+离子通道的核酸序列。
α亚基具有所有电压依赖的阳离子通道的序列特征,并利用了同样的结构基序,该基序包括一6-螺旋束的潜在跨膜域。在钠和钙通道中,这一基序在序列中都重复了4次,产生一24螺旋束。其氨基酸序列在物种之间(如人类和果蝇)和不同离子通道之间是高度保守的。
多基因家族中存在几种由分离基因编码的组织特异性药理学和电生理学上怀质不同的钙通道同种型,它们是由骨骼肌中,每个紧密结合的α、β和γ亚基的装配体联合其它4个装配体形成一种五聚体大分子。例如,神经元钙通道α-1亚类是至少7种不同名为α-1A-H基因的产物。免疫细胞化学研究显示了α-1钙通道亚基的不同分布。α-1A和α-1B主要在树突和突触前末稍表达,与α-1B相比,α-1A通常集中在大量的神经末稍中。在大鼠和人类的神经肌肉连接处,α-1A定位在突触前,而α-1B和α-1A都存在于轴突相关的施万细胞中。α-1E主要位于胞体中,某些情况下在近端树突中以及浦肯雅细胞的远端分支中。α-1C和α-1D位于胞体和中央神经元的近端树突中。
业已按照药理和/或电生理学特性将天然的钙通道分类。电压依赖的钙通道可分类为高电压活化(HVA)型,包括L-、N-、P-和Q-型;中间类型(IVA,R-型);和低电压活化(LVA,T-型)型。(Morena等,Annals NY Acad.Sci.102-117(1999)。
主要的亚类(α-1)属于一基因家族,当在异源表达系统中表达时,这一家族的成员可自身形成功能性通道。(Zhang等,Neuropharmacology 32(11):1075-1088(1993),纳入参考文献)。在天然细胞中,α-1亚基以多亚基复合体的形式和辅助亚基一起表达,其中辅助亚基可修饰α-1亚基的功能特性。在许多情况下,辅助亚基的共表达会影响这些通道的生物物理特性。特别是β亚基对α-1亚基有重要的影响;已显示β亚基可改变活化特征、稳态失活、失活动力学和峰电流。
多种形式α-1亚基的存在造成了这些通道的众多分子多样性。例如,已显示钙通道的不同剪接形式是差异性表达的,对丝氨酸-苏氨酸激酶的磷酸化有不同的敏感性(Hell等,Annals N.Y.Acad.Sci.747:282-293(1994))。已证明离子通道基因的突变与许多疾病有关,包括一些中枢神经系统疾病。Bulman等在Hum.Mol.Gen.6(10)1679-1685(1997)综述了造成许多外钠性紊乱(eposodic disorder)的离子通道突变的例子,这些疾病包括周期性瘫痪、外钠性共济失调(eposodicataxia)、偏头痛、长QT间期综合征和阵发性运动障碍(paroxysmal dyskenesia)。表A(引自Morena,同上)中列出了一些Ca+通道突变疾病。
表A
  疾病   钙通道亚基   模型
  家族性偏瘫性偏头痛(familialhemiplegic migraine)   α-1A   人
  2型外钠共济失调   α-1A   人
  6型脊髓小脑性共济失调   α-1A   人
  Tottering and Learner表型   α-1A   小鼠
  朗-伊综合征   α-1A,α-1B   人
  低钾血性周期性瘫痪   α-1S   人
  肌性发育不全   α-1S   小鼠
  Zucker糖尿病性肥胖表型   α-1C;α-1D   大鼠
  昏睡性表型   β-4   小鼠
  恶性体温过低   α-2/δ   人
  Stargazer   γ   小鼠
通常联用钙和钠通道调节剂治疗各种疾病和症状。例如,已证明钙和/或钠通道阻断剂可有效用于治疗或预防一种或多种与许多疾病或病症有关的症状,这些疾病或病症有各种心脏疾病和病症(如心绞痛和心律失常)、高血压、偏头痛、中风的神经影响、躁狂症、安定药诱导的迟发性运动障碍、双相极感障碍、疼痛、癫痫等。
已知不同离子通道之间神经系统存在显著功能差异。此外,功能差异还存在于同一离子通道基因的不同突变体以及同一离子通道的剪接变体之间。因此,尽管CNS疾病中牵涉到离子通道,但很难预测哪个离子通道是治疗性干涉特定疾病的有效靶标。已提出的一个问题牵涉到精神分裂症、双极情感障碍或有关疾病的离子通道基因。
本发明报告了这些需要以及其它需要。
发明概述
本发明涉及核酸分子,其包含编码称为CanIon的电压门控离子通道蛋白质的新型人基因的基因组序列。CanIon基因组序列还包括位于所述基因转录的蛋白质的上游(5’端)和下游(3’端)的调节序列,这些调节序列也是本发明的一部分内容。
本发明还提供编码CanIon蛋白质的完整cDNA序列以及相应的翻译产物。
与CanIon基因组或cDNA序列特异性杂交的寡核苷酸探针或引物、用所述引物和探针进行DNA扩增和检测方法也是本发明的一部分内容。
本发明的另一个目的包括含有上述任何核酸序列的重组载体,特别是含有CanIon调节序列或编码CanIon蛋白质的序列的重组载体,以及含有所述核酸序列或重组载体的细胞宿主和转基因非人动物。
本发明还涉及CanIon基因的双等位基因标记及其应用。
最后,本发明涉及可调节CanIon表达或活性的物质或分子的筛选方法,以及与CanIon多肽反应的物质或分子的筛选方法。同时提供了在这些方法中用于鉴定物质的方法。例如,提供了用CanIon通道拮抗剂治疗或预防精神分裂症或双极精神妨碍(bipolar)疾病或病症的方法。
因此,在一个方面,本发明提供了一种分离、纯化或重组的多核苷酸,它包含如SEQ ID NO:1-4或6所示的任何核苷酸序列,或任何这些序列的互补序列。
另一方面,本发明提供了一种分离、纯化或重组的多核苷酸,它包含SEQ ID NO4中至少50个核苷的毗邻链,其中所述多核苷酸编码具有生物学活性的CanIon多肽。
另一方面,本发明提供了一种分离、纯化或重组的多核苷酸,它编码的人CanIon多肽包含SEQ ID NO:5的氨基酸序列或其生物学活性片段。
在一个实施方案中,本文所描述的多核苷酸都附着在一固体支持物上。在另一实施方案中,所述多核苷酸包含一标记。
在另一方面,本发明提供了一种多核苷酸阵列,它包含至少一种本文所述的多核苷酸。在一个实施方案中,所述阵列是可寻址的。
在另一方面,本发明提供了一种重组载体,它包含与启动子可操作性连接的本文所述的多核苷酸。
在另一方面,本发明提供了一种多核苷酸,所述多核苷酸在细胞中的存在会造成CanIon基因表达水平的变化。在一个实施方案中,所述多核苷酸插入CanIon基因中,或插入CanIon基因组区域中。在一个实施方案中,所述多核苷酸插入CanIon基因启动子中。在一个实施方案中,所述多核苷酸是通过同源重组插入的,例如通过置换内源CanIon启动子或增强子区域的一个或多个元件而插入。
在另一方面,本发明提供了包含本文所述重组载体或多核苷酸的宿主细胞或非人的宿主动物。
在另一方面,本发明提供了一种哺乳动物宿主细胞或非人宿主哺乳动物,它包含敲除载体的同源重组而受到破坏的CanIon基因。在一个实施方案中,此宿主细胞含有本文所述的多核苷酸。
在另一方面,本发明提供了一种分离、纯化或重组的多肽,它包含如SEQ ID NO:5所示的氨基酸序列,或其生物学活性片段。
在另一方面,本发明提供了制造多肽的方法,所述方法包括a)提供含有编码如权利要求13所述多肽的多核苷酸的细胞群,所述多核苷酸与启动子可操作连接;b)在所述细胞中可制造所述多肽的条件下培养所述细胞群;以及c)体化所述细胞群产生的所述多肽。
在另一方面,本发明提供了使抗CanIon的抗体与CanIon多肽结合的方法,所述方法包括,在所述抗体可与所述多肽特异性结合的条件下使所述抗体与本文所描述的CanIon多肽接触。在另一方面,还提供了特异性识别CanIon蛋白质或表位的抗体或其免疫学活性片段。
在另一方面,本发明提供了检测细胞中CanIon基因的表达的方法,所述方法包括以下步骤:a)使所述细胞或所述细胞的提取物与以下之一物质接触:i)能在严格条件下与本文所述CanIon多核苷酸杂交的多核苷酸;或ii)能特异性结合本文所述CanIon多肽的多肽;以及b)检测所述多核苷酸与所述细胞或提取物的RNA之间杂交存在与否,或者检测所述多肽与所述细胞或提取物的蛋白质的结合存在与否;其中,检测到所述杂交或所述结合的存在,表明所述CanIon基因在所述细胞中被表达。在一个实施方案中,所述多核苷酸是引物,所述杂交是通过检测包含所述引物的序列扩增产物的存在而测得的。在另一个实施方案中所述多肽是抗体,例如,抗CanIon抗体。
在另一方面,本发明提供了鉴定候选CanIon多肽调节剂的方法,所述方法包括:a)使本文所述CanIon多肽与测试化合物接触;以及b)确定所述化合物是否与所述多肽是否特异性结合;其中,测到所述化合物与所述多肽特异性结合表明所述化合物是所述CanIon多肽的候选调节剂。
在一个实施方案中,此方法还包括在所述候选调节剂存在时测定所述CanIon多肽的生物学活性的变化,其中,当所述候选调节剂存在时与所述候选调节剂不存在时所述CanIon多肽生物学活性的变化说明此候选调节剂是所述CanIon多肽的调节剂。
在另一方面,本发明提供了鉴定CanIon多肽调节剂的方法,所述方法包括:a)使本文所述的CanIon多肽与测试化合物接触;和b)在所述化合物存在和不存在时检测所述多肽的活性;其中,当所述化合物存在时与所述化合物不存在时所检测到的所述活性的差异表明所述化合物是所述CanIon多肽的调节剂。
在本方法的一个实施方案中,所述多肽存在于细胞或细胞膜中,所述生物学活性包括电压门控通道活性。
在另一方面,本发明提供了一种制备药物组合物的方法,所述方法包括:a)用本文所描述的方法鉴定CanIon多肽的调节剂;以及b)将所述调节剂与生理学可接受的载体组合。还提供了使用所述药物组合物的方法。
还提供了这里所描述的CanIon调节剂、多肽、多核苷酸或抗体在药物制备中的应用,例如,治疗人体或治疗本文所述的疾病或症状。
还提供了在体外或体内使用和检测CanIon多核苷酸和多肽存在的试剂盒。
附图简述
图1是含有CanIon基因的染色体13q区域的BAC图谱。
图2是示范性计算机系统的框图。
图3是一个实施方案的流程图,步骤200将新的核苷或蛋白质序列与序列数据库进行比较,以确定新序列和数据库中序列的同源性水平。
图4是一个实施方案的流程图,计算机中的步骤250用来确定两个序列是否是同源的。
图5是一个实施方案的流程图,步骤300用来检测序列中某一特征的存在情况。
简要说明序列表中提供的序列
SEQ ID No 1含有CanIon的基因组序列,包含5’调节区(上游非转录区)和外显子1-7。
SEQ ID No 2含有CanIon的基因组序列,包含外显子8-27。
SEQ ID No 3含有CanIon的基因组序列,包含外显子28-44和3’调节区(下游非转录区)。
SEQ ID No 4含有CanIon的cDNA序列。
SEQ ID No 5含有由SEQ ID NO 4的cDNA编码的氨基酸序列。
SEQ ID No 6含有扩增子的核苷酸序列,包含双等位基因标记A18。
SEQ ID NO 7含有一个引物,它包含实施例2所述的附加PU 5’序列。
SEQ ID NO 8含有一个引物,它包含实施例2所述的附加RP 5’序列。
根据序列表的规则,以下代码被用于序列表以指明序列中双等位基因标记的位置并鉴定在多态性碱基中存在的各个等位基因。代码“r”在序列中表示多态性碱基的一个等位基因是鸟嘌呤,而另一个等位基因是腺嘌呤。代码“y”在序列中表示多态性碱基的一个等位基因是胸腺嘧啶,而另一个等位基因是胞嘧啶。代码“m”在序列中表示多态性碱基的一个等位基因是腺嘌呤,而另一个等位基因是胞嘧啶。代码“k”在序列中表示多态性碱基的一个等位基因是鸟嘌呤,而另一个等位基因是胸腺嘧啶。代码“s”在序列中表示多态性碱基的一个等位基因是鸟嘌呤,而另一个等位基因是胞嘧啶。代码“w”在序列中表示多态性碱基的一个等位基因是腺嘌呤,而另一个等位基因是胸腺嘧啶。各个双等位标记初始等位基因的核苷代码如下:
双等位标记            初始等位基因
5-124-273               A(例如)
某些情况下,双等位基因标记的多态性碱基会改变编码多肽中氨基酸的相同性。这在附加的序列表中用特征VARIANT表示,在多态性氨基酸位点用Xaa代替,并将Xaa定义为两个可互换的氨基酸。例如,如果双等基因位标记的一个等位基因是密码子CAC,它编码组氨酸,而此双等位基因标记的另一个等位基因是CAA,它编码谷氨酸,则编码多态的序列表将在此多态性氨基酸位置含Xaa。这时,Xaa被定义为组氨酸或谷氨酸。
在其它情况下,Xaa可表示由于核苷酸序列的双关性而多份不知道的氨基酸。这时用特征UNSURE表示,在未知的氨基酸位点用Xaa代替,并将Xaa定义为20种氨基酸或遗传密码暗示的有限数目的氨基酸中的任何一种。
详细描述
综合家族成员的精神分裂症和双极情感障碍、从双胞胎和收养研究所得的证据以及全球发病没有差异这些现象,都表明虽然环境危险因子在一定程度上是必要、充分或互相作用的原因,但精神分裂症和双极情感障碍主要还是遗传状况。例如,普通人群1%会发生精神分裂症,但若一个人的祖父母有精神分裂症,则他患此病的危险增大至约3%;若父母一方有精神分裂症,则他患病的危险增大至约10%;若父母双方都有精神分裂症,则他患病的危险增大至约40%。
鉴定涉及特定中枢神经系统疾病如精神分裂症等特定性状(trait)的基因,可通过目前用于基因作图的两种主要策略进行,它们是:连锁分析(linkage analysis)和相关性研究(association studies)。连锁分析需要研究其成员有多人患病的家族,这种研究现在用于检测单基因基因或寡基因固有性状。与之相反,相关性研究检查与性状阴性(T-)对照相比,无亲戚关系的性状(T+)个体的标记等位基因的频率,这种研究通常用于检测多基因遗传。
遗传连接或“连锁”根据对染色体上两个相邻序列在减数分裂过程中通过交换含有最少重组的一个序列的分析。要进行这种分析,已将诸如微卫星标记等染色体标记精确定位于基因组上。遗传连锁分析根据系统树、疾病的传递和标记的传递计算带有所用染色体标记的靶基因重组的概率。因此,如果某给定标记的特定等位基因与疾病一起传递的频率比带有该等位基因(重组水平在0和0.5之间)的机会要多,就可以推断在该标记附近可找到此靶基因。用这种技术可以确定一些表示家族性癌症遗传倾向性基因的位置。为了能包括在遗传连锁研究中,受该疾病遗传影响的家族成员必须符合“信息性”标准:每一代有数个成员患病(可获得其结构DNA),而且该家族最好有众多兄弟姐妹。
以前的连锁研究结果支持染色体13可能在13q32上隐藏有一个精神分裂症易感性基因座的假设(Blouin JL等,1998,Nature Genetics,20:70-73;Lin MW等,Hum.Genet.,99(3):417-420,1997;Brzustowicz等,Am.J.Hum.Genet.65:1096-1103(1999))。然而,尽管连锁分析是检测性状有关基因的有力方法,但其分辨率通常不可能超过兆碱基水平,通常需要进行互补研究以细化对最初用这种方法鉴定的区域的分析。
采用位于染色体13q31-q33区的27个公共序列标记位点(STSs)构建了覆盖染色体13q31-q33基因座的候选基因组区的细菌人工染色体(BAC)重叠群(contig),以便筛选一个7种基因组相当的专有BAC文库。从这些材料产生了新的STS,使得能构建该区的密集型物理图谱。通过原位染色体杂交确定BACs的大小并绘图,以供验证。最小的一组BACs已被鉴定并全部测序,产生几种重叠群导致一个4Mb以上的重叠群的最终构建物。此图谱的构建导致对CanIon基因的鉴定,定位于与精神分裂症明显连锁的基因组区域中。
CanIon氨基酸序列的特征是CACHANNEL,一种有7个元件的指纹,它为钙通道的α-1亚基提供了信号(Ref.PR00167,BLOCKs+数据库)。该指纹衍生自6个序列的最初排列对比:这些基序出自能够区别这些通道和其它阳离子通道的保守环区;基序1和2编码跨膜区段4和5以及5和6之间的部分(第一次内部重复);基序3相应于重复1的区段6和重复2的区段1之间的部分;基序4编码重复2的区段5和6之间的部分;基序5相应于重复3的区段6和重复4的区段1之间的部分;基序6和7编码区段4和5之间以及重复4区段的5和6之间的部分。
图1显示了覆盖所关注的包含CanIon基因的染色体13区域的BAC重叠群,并显示了与连锁研究中最为重要的遗传标记有关的CanIon基因在基因组上的位置。特别地,Blouin等(1998)用452微卫星标记物在54个复杂系谱上对精神分裂症的易感性基因座进行了基因组的广泛扫描。发现家族精神分裂症之间最显著的连锁在染色体13q32上标记D13S174附近。Brzustowics等(1999)估计在21个加拿大家族中微卫星标记物跨越染色体8和13。在每个分析模型中产生正的LOD记分的染色体13q区域中的标记物,采用了:常染色体显性和隐性以及狭义和广义的精神分裂症定义。在隐性-广义模型下,用标记物D13S793得到了最大的三点LOD记分:在重组部分(θ)为3.92,同质性下为0.1,和异质性下当α=0.65且θ=0时为4.42。参考图1,CanIon基因部分位于标记为‘区域E’的重叠群上,部分位于标记为C0001A10的重叠群上。CanIon基因侧接有两个在连锁研究中意义最为重要的标记。标记D13S174也位于重叠群C0001A10上,而标记D13S793大致位于距CanIon基因3.5Mb的着丝粒上。
目前迫切需要鉴定涉及精神分裂症、双极情感障碍以及其它CNS和心血管疾病和症状的基因。同时也需要鉴定涉及这些疾病的新离子通道。这些基因和蛋白质在治疗精神分裂症、双极情感障碍、或其它CNS症状以及其它诸如心脏病和高血压等症状中可能提供新的干预点,而且可以进一步研究和特征分析CanIon基因和其相关生物途径。认识这些基因和涉及这些疾病和症状的有关生物途径使研究人员能了解精神分裂症和双极情感障碍的病原,从而研究出针对这些病因的药物和治疗方案。例如,阻断CanIon通道的化合物可用于治疗任何疾病或症状,优选精神分裂症或双极情感障碍,以及疼痛病、癫痫和各种心血管疾病,如心律失常、心绞痛和高血压。也急切需要检测对精神分裂症、双极情感障碍和其它症状易感性以及预防或随访这些疾病演化的新方法。诊断工具可能也证明极其有用。的确,例如,早鉴定出有产生精神分裂症危险的人,就可以早期和/或预防性给药。而且,准确评估药物的效能以及病人对药物的耐受性可使临床医生提高精神分裂症和双极情感障碍治疗方案的效益/风险比。
本发明涉及与CanIon基因有关的多核苷酸和多肽。与CanIon的基因组或cDNA序列特异性杂交的寡核苷酸探针和引物也是本发明的一部分。本发明的另一个目的包括含有任何本发明所述核酸序列的重组载体,尤其是含有CanIon调节区或编码CanIon蛋白的序列的重组载体,以及含有所述核酸序列或重组载体的细胞宿主。本发明还包括能够调节CanIon基因或蛋白质表达或活性的分子的筛选方法,以及使用这些分子治疗或预防精神分裂症、双极感情障碍、或任何其它疾病或症状的方法。本发明还涉及特异性抗这种多肽的抗体,可用作诊断试剂。
本发明还涉及CanIon相关的双等位基因标记以及它们在遗传分析分析中的应用,这些方法包括家族连锁分析、人群连锁失平衡研究以及病例一对照人群的相关性研究。本发明一个重要的方面是,双等位基因标记使得能进行相关性研究以鉴定与复杂性状有关的基因的作用。
定义
在详细叙述本发明之前,下面给出一些定义说明和限定了阐述本发明所用的术语的含义和范围。
本文所用的术语“ CanIon基因”包括编码CanIon蛋白质的基因组、mRNA和cRNA序列,包括基因组DNA的非翻译调节区。
本文所用的术语“ 异源蛋白质”意指除CanIon蛋白质以外的任何蛋白质或多肽。例如,异源蛋白质可以是用CanIon调节区进行的另外一些实验中作为标记的一种化合物。
术语“ 分离的”要求物质与其来源环境(例如,若物质是天然存在的,即为其天然环境)分开。例如,天然存在于活动物中的多核苷酸或多肽不是分离的,但自天然系统中部分或全部共存物质分离出来的同一些多核苷酸或DNA或多肽是分离的。这些多核苷酸可以是载体的一部分和/或这些多核苷酸或多肽可以是组合物的一部分,由于载体或组合物不属于天然环境的一部分,故这些多核苷酸仍然是分离的。
例如,天然存在于有活动物中的多核苷酸不是分离的,但自天然系统中部分或全部共存物质分离出来的同一些多核苷酸或多肽是分离的。特别排除在定义“分离的”之外的是天然存在的染色体(如染色体扩散)、人工染色体文库、基因组文库及作为体外核酸制品或作为转染/转化宿主细胞制品存在的cDNA文库,其中宿主细胞是体外异质制品或作为单个克隆的异质群体而被接种。特别还将上述文库中其特定多核苷酸占载体分子中核酸插入片段数小于5%的文库排除在外。定义“分离的”还尤其不包括全细胞基因组DNA或全细胞RNA制品(包括用机械剪切或酶消化的所述全细胞制品)。“分离的”还特别不包括以上所述作为体外制品或通过电泳(包括印迹转移)分离的异质性混合物的全细胞制品,其中本发明的多核苷酸没有与电泳媒体中的异源多核苷酸作进一步分离(例如,从琼脂糖凝胶或尼龙印迹的异质性条带群切理一条条带作进一步分离)。
本文所用的术语“ 纯化的”不要求绝对纯;它只作为一个相对定义。初始材料或天然材料的纯化至少是一个数量级,优选使用两或三个数量级,最好是四或五个数量级。例如,从0.1%浓度到纯度至10%浓度是两个数量级。为了便于说明,已经将与cDNA文库分离的个体cDNA克隆用常规方法纯化至电泳均一性。由这些克隆所得的序列不能直接从文库或整个人的DNA制得。这些cDNA克隆不是天然存在的,而是通过局部纯化天然存在的物质(信使RNA)而制得。mRNA转化为cDNA文库涉及产生合成物质(cDNA),而纯的个体cDNA克隆可通过克隆选择从该合成文库分离得到。所以,从信使RNA产生cDNA文库以及然后从该文库分离个体克隆导致天然信使纯化大约104-106倍。
本文所用的术语“纯化的”还描述与其它化合物分离的本发明的多肽或多核苷酸,包括但不限于:多肽或多核苷酸、碳水化合物、脂质等。术语“纯化的”可用于指定与寡聚形式,如同质或异质二聚体、三聚体等分离的本发明的单聚多肽。术语“纯化的”也可用于指定与线性多核苷酸分离的共价连接的多核苷酸。当一个多核苷酸样品的至少大约50%,最好60-75%具有单一多核苷酸序列和构象(线性对共价封闭)时,该多核苷酸基本上是纯的。基本纯的多肽或多核苷酸通常分别约占多肽或多核苷酸样品的50%,最好为60-90%(重量/重量),更常见的是纯度约为95%,最好是99%以上。众所周知,多肽或多核苷酸纯度或均一度有许多方式测定,如先对样品进行琼脂糖或聚丙烯酰胺凝胶电泳,然后观察到凝胶染色后为单一条带。对于某些目的,采用高效液相层析法或本技术领域熟知的其它方法可获得高分辨率。作为另一个实施例,本发明的多肽或多核苷酸的纯度“至少”可表示为相对异质性多肽和多核苷酸(DNA、RNA或二者)的一种纯度百分比。作为一个优选实施例,本发明的多肽或多核苷酸分别相对异质性多肽或多核苷酸的纯度至少为10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、96%、98%、99%、100%。作为另一个优选实施例,此多肽或多核苷酸的纯度分别相对异质性多肽或多核苷酸为90%和100%之间小数位至第千位的任何一个数字的范围内变化(例如,多肽或多核苷酸的纯度至少99.995%),或表示为相对于除运载体中的化合物和分子以外的全部化合物和分子的重量/重量比。本发明权利要求以每个小数位至第千位表示一个纯度百分比的数字表示的各种纯度。
术语“ 多肽”指氨基酸的聚合物,不论其长度如何;所以,肽、寡肽和蛋白质都包括在多肽的定义中。该术语也不限于或不排除多肽的表达后修饰,例如,与糖基、乙酰基、磷酸基、脂类基团等共价连接的多肽明确包括在术语多肽中。在该定义内还包括含有一个或多个氨基酸类似物(例如,包括非天然存在的氨基酸、只在不相关生物系统中存在的氨基酸、来自哺乳动物系统经修饰的氨基酸等)的多肽、带有取代键以及本领域知道的其它修饰的多肽,无论是天然存在或非天然存在。
本文所用的术语“ 重组多肽”指人为设计和包括至少两个多肽序列的多肽,这两个多肽序列作为相邻多肽序列在初始天然环境中是找不到的,或者指由重组多核苷酸表达的多肽。
本文所用的术语“ 非人动物”指任何不是人的脊椎动物、鸟类,和更通常指哺乳动物,最好是灵长目动物、家禽,如猪、山羊、绵羊、驴和马、家兔或者啮齿目动物,最好是大鼠或小鼠。本文所用的术语“动物”用于指任何脊椎动物,最好是哺乳动物。术语“动物”和“哺乳动物”明确包括人,除非前面带有术语“非人动物”。
本文所用的术语“ 抗体”指由至少一个结合区(binding domain)组成的多肽或多肽群,其中抗体结合区通过抗体分子的可变区折叠而形成,与内表面的形状和电荷分布形成三维结合空间,该空间与抗原的抗原决定簇的特征互补,可以与抗原进行免疫反应。抗体包括重组蛋白质,其包括结合区,以及片段,而片段包括Fab、Fab’、F(ab)2和F(ab’)2片段。
本文所用的“ 抗原决定簇”是决定抗原—抗体反应特异性的抗原分子的一部分,在本发明指CanIon多肽。“表位”指多肽的抗原决定簇。一个表位在空间构象中可包括至少3个氨基酸,此空间构象对该表位是唯一的。通常,一个表位包括至少6个氨基酸,较常见包括至少8-10个氨基酸。确定组成表位的氨基酸的方法包括X射线结晶图;、二维核磁共振及表位作图法,例如Geysen等(1984年)、PCT公开号WO 84/03564及PCT公开号WO 84/03506所述的肽扫描法。
本说明书所用的术语“ 核苷酸序型”一般用于无差别地指多核苷酸或核酸。更准确地说,术语“核苷酸序列”包括核材料本身,故不限在生物化学特指的特异性DNA或RNA分子的序列信息(即在四个碱基字母中所选择的字母顺序)。
术语“ 核酸”、“ 寡核苷酸”及“ 多核苷酸”在本文可互换使用,包括RNA、DNA或RNA/DNA杂交序列,具有一个以上核苷酸单链或双链体形式。本文所用的术语“核苷酸”是形容词,描述包括任何长度单链或双链体形式的RNA、DNA或RNA/DNA杂交序列的分子。术语“核苷酸”在本文也用作名词,指单一核苷酸或多种核苷酸,意味着一个分子、或较大核酸分子中的一个单元,就寡核苷酸或多核苷酸内的核酸而言,其包括嘌呤或嘧啶、核糖或脱氧核糖分子、以及磷酸基团、或磷酸二酯键。虽然术语“核苷酸”本文也用于包括“修饰后的核苷酸”,其包括至少以下一种修饰:(a)另一连接基团,(b)嘌呤的类似型,(c)嘧啶的类似型,或(d)糖的类似型,类似连接基、嘌呤、嘧啶及糖的例子可参看PCT公开号WO 95/04064。本发明的多核苷酸序列可用任何已知方法制备,包括合成、重组、活体内产生、或其组合、以及用本技术领域已知的任何一种纯化方法。
可操作性连接”在调节序列如启动子指,所述调节元件相对于核酸处于正确位置和方向,以调控RNA聚合酶的启动和所述核酸的表达。本文所用的术语“可操作性连接”指多核苷酸元件以功能性关系相连接。例如,如果启动子或增强子影响编码序列的转录,它们就是操作性连接于一编码序列上。
术语“ 性状”和“ 表型”在本文可互换使用,指生机体任何看得见的、检测得到的或可测量的性质,如疾病征状或疾病的易感性。本文所用的术语“性状”或“表型”通常指疾病征状或疾病易感性、与治疗相关的有益应答或副作用。所述性状最好是,但不限于,精神分裂症或双极感情障碍之类的精神病、其它CNS或如癫痫或疼痛病等神经元疾病,以及心绞痛、高血压和心律失常等心血管疾病,以及任何这些疾病或症状的任何方面、特征或特性。
本文所用的术语“ 等位基因(allele)”指一核苷酸序列的变体。双等位基因多态性有两种型式。二倍体生物体的等位基因型可以是纯合或杂合的。
本文所用的术语“ 杂合性比例”是指人群中在某特定等位基因上为杂合的个体的发生率。在双等位基因系统中,杂合性比例平均等于2Pa(1-Pa),其中,Pa是最少见的等位基因的频率。为了用于遗传研究,遗传标记应有合适的杂合性水平以使得随机选择的个体有合理的杂合概率。
本文所用的术语“ 基因型”指存在于个体或样品中的等位基因的相同性。在本发明的上下文中,基因型宜指存在于个体或样品中的双等位标记的等位基因的描述。术语使样品或个体的双等位基因标记作“基因型分型”包括在双等位基因标记上确定个体携带的特异性等位基因或特异性核苷酸。
本文所用的术语“ 突变”指频率低于1%的不同基因组或个体之间的DNA序列差异。
本文所用的术语“ 单倍型”指个体或样品中存在的等位基因的组合。在本发明的上下文中,单倍型优先是指在一给定个体中发现的并可与某一表型相关联的双等位标记的等位基因的组合。
本文所用的术语“ 多态性”指不同基因组或个体之间发生的两种或多种变替基因组序列或等位基因。“多态的”指在一人群中可找到其特异性基因组序列的两种或多种变体的条件。“多态性位点”是变异发生的基因座。单一核苷酸多态性是在多态性位点上用另一个核苷酸取代一个核苷酸。删除一个核苷酸或插入一个核苷酸也会产生单一核苷酸多态性。在本发明的上下文中,“单一核苷酸多态性”宜指单一核苷酸取代。通常,在不同个体之间,多态性位点可以被两个不同核苷酸所占据。
术语“ 双等位基因多态性”和“ 双等位基因标记”在本文可互换使用,指人群中具有相当高频率的两个等位基因的单一核苷酸多态性。“双等位标记的等位基因”指存在于双等位标记位点上的核苷酸变体。通常,本发明双等位标记的较少见的等位基因的频率经验证大于1%,优选此频率大于10%,更优选此频至少20%(即杂合性比例至少为0.327,甚至更优选,此频率至少为30%(即杂合性比例至少为0.42)。较少见的等位基因频率为30%或更高的双等位标记被称为“高质量的双等位标记”。
就多核苷酸的中心而言,在这里用以下方式描述核苷酸在多核苷酸中的位置。当某多核苷酸有奇数个核苷酸时,与此多核苷酸的3’和5’端等距的核苷酸被认为是此多核苷酸的“中心”,且与此核苷酸直接毗邻的任何核苷酸也被认为在中心,或者,位于中心的核苷酸本身被认为是“在位于中心的1个核苷酸之内”。对于某多核苷酸中奇数个核苷酸,位于此多核苷酸中央的任何五个核苷酸被认为是在位于中心的2个核苷酸之内,依此类推。当某多核苷酸有偶数个核苷酸时,所述多核苷酸中央是一个键而不是核苷酸。因此,中央的两个核苷酸中任何一个都被认为“在位于中心的1个核苷酸之内”,同时,多核苷酸中央的任何4个核苷酸被认为“在位于中心的2个核苷酸之内”,依此类推。对于包含一个或多个核苷酸取代、插入或缺失的多态性,如果距此多态性的取代、插入或缺失的多核苷酸与此多核苷酸3’端的距离,和此多态性的取代、插入或缺失的多核苷酸与此多肽5’端的距离之间的差异,为0或1个核苷酸,则所述多态性、等位基因或双等位标记在此多核苷酸“中心”。如果差异为0-3,则此多态性被认为“在位于中心的1个核苷酸之内”。如果差异为0-5,则此多态性被认为“在位于中心的2个核苷酸之内”。如果所述差异为0-7,则此多态性被认为“在位于中心的3个核苷酸之内”,依此类推。
本文所用的术语“ 上游”指从特定参考点朝向多核苷酸5’端的位置,或者,对基因而言,从编码区到启动子方向的位置。
本文所用的术语“ 碱基配对”和“Watson & Crick碱基配对”在本文可互换使用,指由于序列相同性通过氢键相互结合的核苷酸,例如在双螺旋DNA中可以发现胸腺嘌呤或尿嘧啶残基通过两个氢键与腺嘌呤残基连接,而胞嘧啶残基通过三个氢键与鸟嘌呤残基连接(参看Stryer,L.,Biochemistry,第4版,1995年)。
本文所用的术语“ 互补”或“其互补物”指能够在整个互补区与另一种特定多核苷酸形成Watson & Crick碱基配对的多核苷酸序列。对本发明来说,当第一个多核苷酸的每个碱基与第二个多核苷酸的互补碱基配对时,就认为第一个多核苷酸与第二个多核苷酸互补。互补碱基通常是A和T(或A和U),或C和G。“互补物”在本文是“互补性多核苷酸”、“互补性核酸”和“互补性核苷酸序列”的同义词。这些术语适用于多核苷酸对,但只基于其序列而非基于两个多核苷酸实际结合的任何一组特定条件。
变体和片段
1-多核苷酸
本发明也涉及本文所述的多核苷酸变体和片段,特别是含有一个或多个本发明双等位标记的CanIon基因。
本文所用的术语多核苷酸变体是不同于参照多核苷酸的多核苷酸。多核苷酸变体可以是天然存在的变体,如天然存在的等位基因变体,或者它可以是天然存在的未知变体。这些非天然存在的多核苷酸变体可通过诱变技术制备,包括应用于多核苷酸、细胞或生物体的技术。通常差异是有限的,这样参照品和变体的核苷酸序列大致相似,许多区是相同的。
本发明的多核苷酸变体包括,但不限于,与选自核苷酸序列SEQ ID No 1-4的多核苷酸或者与具有选自核苷酸序列SEQ ID No 1-4的多核苷酸中至少12个连续核苷酸的多核苷酸片段的相同性至少是95%的核苷酸序列,与选自核苷酸序列SEQ ID No1-4的多核苷酸或者与选自核苷酸序列SEQ ID No 1-4的多核苷酸中至少12个连续核苷酸的多核苷酸片段的相同性优选至少是99%,相同性更优选至少是99.5%,相同性最优选至少是99.8%。
变体多核苷酸中的核苷酸变化可以是沉默变化,这意味着它们不会改变该多核苷酸编码的氨基酸。然而,核苷酸变化也可以导致由参照序列编码的多肽的氨基酸取代、加入、缺失、融合和截短。这些取代、缺失或加入可能涉及一个或多个核苷酸。可在编码或非编码区或二者内改变这些变体。编码区的变化可产生保守性或非保守性氨基酸取代、缺失或插入。
在本发明的上下文中,特别优选实施例是那些多核苷酸编码基本上保留与成熟CanIon蛋白质相同的生物功能或活性的多肽的实施例,或者是那些多核苷酸编码保持或增加一种特定生物活性,同时降低另一种生物活性的多肽的实施例。
多核苷酸片段是其序列与给定的核苷酸序列,最好是CanIon基因及其变化的核苷酸序列的一部分而非全部完全相同的多核苷酸。这种片段可以是CanIon基因内含子或外显子的一部分。它也可以是CanIon调节区的一部分。优选地,这种片段包括双等位标记A1-A17中至少一个或其互补物,或是与双等位标记A1-A17中一个或多个连锁失平衡的双等位标记。
这些片段可以“独立的(free-standing)”,即不属于其它多核苷酸,也不与其它多核苷酸融合,或它们可包含在一个较大多核苷酸内,形成此多核苷酸的一部分或一个区域。事实上,这些片段中有几段可存在于一个较大多核苷酸内。
这些片段可任选地由或基本上由一段连续的跨距长至少8、10、12、15、18、20、25、35、40、50、70、80、100、250、500或1000个核苷酸组成。一组优选的片段包括本文描述的CanIon基因的双等位标记A1-A17中至少一个或其互补物。
2-多肽
本发明还涉及本文所述的多肽变体、片段、类似物及衍生物,包括突变的CanIon蛋白质。
变体可能有以下变异:1)用保守性或非保守性氨基酸残基取代一个或多个氨基酸残基,而这些被取代的氨基酸残基可能或可能不是由遗传密码编码,或2)一个或多个氨基酸残基中包括一个取代基团,或3)突变CanIon与另一种化合物融合,如可提高多肽半衰期的化合物(例如聚乙二醇),或4)加入的氨基酸与突变CanIon融合,例如,前导或分泌序列或用来纯化突变CanIon的序列或前蛋白序列。这些变体也为本领域技术人员所知。
多肽片段是其序列与给定多肽序列,最好是CanIon基因及其变体编码的多肽的一部分而非全部完全相同的多肽。
对于本发明的多肽氨基酸序列中的氨基酸取代,可用“等价(equivalent)”氨基酸取代一个或多个氨基酸。本文所用的术语“等价”氨基酸用于指任何一个可被具有相似性质的其中一个氨基酸所取代的氨基酸,这样,肽化学领域的技术人员可预计该多肽的二级结构和亲水性质基本上无改变。通常,以下几组氨基酸表示等价变化:(1)Ala,Pro,Gly,Glu,Asp,Gln,Asn,Ser,Thr;(2)Cys,Ser,Tyr,Thr;(3)Val,Ile,Leu,Met,Ala,Phe;(4)Lys,Arg,His;(5)Phe,Tyr,Trp,His。
本发明的修饰过的CanIon肽分子的特定实施例包括,但不限于,抗蛋白水解的肽分子、其-CONH-肽键被(CH2NH)还原键、(NHCO)反键(retro inverso bond)、(CH2-O)亚甲氧键、(CH2-S)硫亚甲键、(CH2CH2)碳键、(C0-CH2)廿二烯酸亚甲基键、(CHOH-CH2)羟乙烯键、(N-N)键、E-alcene键或-CH=CH-键修饰和取代的肽。本发明还包括人CanIon多肽或其片段或变体,其中至少一个肽键按以上所述进行过修饰。
这些片段可以是“独立的(free-standing)”,即不属于其它多核苷酸,也不与其它多核苷酸融合,或它们可包含在一个较大多肽内,形成该多肽的一部分或一个区域。然而,一些片段可包含在一个较大的多肽内。
作为本发明多肽片段的代表性例子,这些片段长5、6、7、8、9或10至15、10至20、15至40、或30至55个氨基酸。优选是那些在CanIon蛋白质中含有至少1个氨基酸突变的片段。
核酸或多肽之间的相同性
术语“序列相同性百分比”和“同源性百分比”在本文可互换使用,指在多核苷酸和多肽之间所作的比较,将两个最优排列的序列在比较窗口中进行比较就可以确定“序列相同性百分比”和“同源性百分比”,其中在比较窗口中部分多核苷酸和多肽序列与参比序列(不包括插入或缺失)相比可包括插入或缺失(即缺口(gap)),使两个序列得到最优排列。计算百分比时确定两个序列具有相同的核酸碱基或氨基酸残基的位置数,得出匹配位置数,将匹配位置数除以比较窗口的总位置数,再将所得结果乘以100就得到序列相同性百分比。可用本技术领域已知的任何一种序列比较算法和程序来评估同源性。这些算法和程序包括,但不限于,TBLASTN、BLASTP、FASTA、TFASTA和CLUSTALW(Pearson and Lipman,1988年;Altschul等,1990年;Thompson等,1994年;Higgins等,1996年;Altschul等,1990年;Altschul等,1993年)。在特别优选实施例中,用本技术领域熟知的基本局部相似性搜索工具(BLAST)来评估蛋白质和核酸的序列同源性(例如,参见Karlin and Altschul,1990年;Altschul等,1990、1993、1997年)。具体地说,用5种特定BLAST程序实施以下任务:
(1)BLASTP和BLAST3将氨基酸查询序列与蛋白质序列数据库进行比较;
(2)BLASTN将核苷酸查询序列与核苷酸序列数据库进行比较;
(3)BLASTX将查询核苷酸序列(双链)的六框概念翻译产物与蛋白质序列数据库进行比较;
(4)TBLASTN将查询蛋白质序列与被翻译在所有六读框(six readingframe)(双链)中的核苷酸查询序列数据库进行比较;以及
(5)TBLASTX将核苷酸查询序列的六框翻译与核苷酸序列数据库的六框翻译进行比较。
BLAST程序通过鉴定查询氨基酸或核酸序列和最好获自蛋白质或核酸序列数据库的测试序列之间的相似节段,本文称之为“高分值区段对”(hig-scoring segmentpairs),来鉴定同源序列。最好借助分值矩阵来鉴定(即排列对比)高分值区段对,许多分值矩阵已为本领域所熟知。分值矩阵最好采用BLOSUM62矩阵(Gonnet等,1992年;Henikoff和Henikoff,1993年)。其次也可采用PAM或PAM250矩阵(参见Schwartz和Dayhoff,eds.,1978年)。BLAST程序可评价所有已鉴定的高分值区段对的统计学意义(statistical significance),最好选择能满足用户规定的有统计学意义阈值的区段,如用户规定的同源性百分比。最好用Karlin统计学意义方程式来评估高分值区段对的统计学意义(参见Karlin和Altschul,1990年)。
也可以用缺失参数或用户提供的修改参数来使用BLAST程序
严格的杂交条件
为了限定本发明这样一些杂交核酸,严格的杂交条件如下:
杂交步骤65℃在6xSSC缓冲液、5xDenhardt’s溶液、0.5%SDS及100μg/ml鲑鱼精子DNA存在下进行的。
杂交步骤后进行以下四步清洗:
—最好在65℃用2xSSC和0.1%SDS缓冲液洗5分钟两次;
—最好在65℃用2xSSC和0.1%SDS缓冲液洗一次30分钟;
—最好在65℃用0.1xSSC和0.1%SDS缓冲液洗一次10分钟。
这些杂交条件适合长度大约为20个核苷酸的核酸分子。按照本领域技术人员熟知的技术,以上所述的杂交条件也可根据所需核酸的长度作出修改,在此不再作叙述。例如,根据Hames和Higgins的书(1985年)所述技术可对适当的杂交条件作修改。
CanIon基因的基因组序列
本发明涉及CanIon基因组序列。本发明包括CanIon基因或CanIon基因组序列,该序列由或基本上由SEQ ID No 1-3序列、其互补序列以及其片段和变体组成,或包括SEQ ID No 1-3序列、其互补序列以及其片段和变体。这些多核苷酸可被纯化、分离或重组。
本发明还包括纯化的、分离的、或重组多核苷酸,其包含的核苷酸序列与SEQ IDNo 1-3核苷酸序列或其互补序列或其片段的序列相同性至少是70、75、80、85、90或95%。关于SEQ ID No 1-3核苷酸序列的核苷酸差异通常随机分布于整个核酸。然而,优选核酸是关于SEQ ID No 1-3核苷酸序列的核苷酸差异主要位于外显子包含的编码序列外部的核酸。这些核酸及其片段和变体可用作寡核苷酸引物或探针,以检测测试样品中存在CanIon基因拷贝,或用以扩增CanIon序列内的靶核苷酸序列。
本发明的另一个目的包括在上述规定的严格杂交条件下能与SEQ ID No 1-3核苷酸序列或其互补序列或其变体杂交的纯化的、分离的、或重组的核酸。在优选的实施
方案中,所述纯化的、分离的、或重组的核酸能与人CanIon基因特异性杂交,更优选的,所述核酸能够与人CanIon基因的核苷酸杂交但基本上不能与大鼠CanIon基因的核酸序列杂交。
特别优选的本发明的纯化的、分离的、或重组的多核苷酸,其包含一段连续的跨距SEQ.ID No1-3的至少12、15、18、20、25、30、35、40、50、60、70、80、90、100、150、200、500、1000、2000、3000、4000、5000或10000个核苷酸或其互补物的。应注意的是,本章节描述的多核苷酸也包括任何大小和序列的核酸片段。
CanIon基因组核酸包括44个外显子。SEQ ID NO 1-3中外显子的位置详细列在下面的表B中。
表B
  外显子  在SEQ ID NO 1中的位置   内含子  在SEQ ID NO 1中的位置
  开始   结束   开始   结束
  1   2001   2026   1   2027   19187
  2   19188   19334   2   19335   22995
  3   22996   23178   3   23179   39730
  4   39731   39814   4   39815   41336
  5   41337   41476   5   41477   41564
  6   41565   41693   6   41694   73012
  7   73013   73167
  外显子  在SEQ ID NC 2中的位置   内含子   在SEQ ID NO 2中的位置
  开始   结束   开始   结束
  8   43726   43868   7   43869   43997
  9   43998   44102   8   44103   52092
  10   52093   52179   9   52180   77567
  11   77568   77699   10   77700   98225
  12   98226   98393   11   98394   106566
  13   106567   106758   12   116759   144108
  14   144109   144246   13   144247   159793
  15   159794   159868   14   159869   191291
  16   191292   191428   15   191429   192966
  17   192967   193108   16   193109   211539
  18   211540   211613   17   211614   225005
  19   225006   225107   18   225108   225543
  20   225544   225613   19   225614   228449
  21   228450   228541   20   228542   228629
  22   228630   228752   21   228753   231288
  23   231289   231345   22   231346   231588
  24   231589   231709   23   231710   231812
  25   231813   231944   24   231945   232988
  26   232900   233067   25   233068   235354
  27   235355   235459
  外显子  在SEQ ID NO 3中的位置   内含子  在SEQ ID NO 3中的位置
  开始   结束   开始   结束
  28   2895   4001   26   4002   9610
  29   9611   9731   27   9732   9815
  30   9816   9914   28   9915   15775
  31   15776   15869   29   15870   16381
  32   16382   16488   30   16489   16696
  33   16697   16771   31   16772   17933
  34   17934   18053   32   18054   23643
  35   23644   23712   33   23913   24927
  36   24928   25076   34   25077   25912
  37   25913   26006   35   26007   30766
  38   30767   30899   36   30900   31560
  39   31561   31676   37   31677   34043
  40   34044   34201   38   34202   37492
  41   37493   37643   39   37644   39651
  42   39652   39801   40   39802   41562
  43   41563   41680   41   41681   44130
  44   44131   45841
因此,本发明包括纯化的、分离的、或重组的多核苷酸,此多核苷酸含有选自CanIon基因44个外显子中每一个的核苷酸序列以及与它们互补的各个序列。本发明还提供了纯化的、分离的、或重组的多核苷酸,此多核苷酸含有CanIon基因的至少两个外显子的组合,其中,所述多核苷酸排列在所述核酸中,从所述核酸的5’端到3’端,与SEQ ID NO 1-3的顺序相同。
内含子1指位于外显子1和外显子2之间的核苷酸序列,依此类推。所述内含子的位置详细列在表A中。因此,本发明包括纯化的、分离的、或重组的多核苷酸,此多核苷酸包括选自CanIon基因43个内含子的核苷酸序列,或与其互补的序列。
这一章节题为“CanIon基因组序列”,应注意的是,本章节所述的多核苷酸也可包含任何大小和序列的核酸片段,它们位于CanIon的基因组序列其中一侧或者在这些基因组序列中两个或多个之间。
CanIon cDNA序列
业已证明,CanIon基因表达导致产生至少一种mRNA,其核酸序列在SEQ ID No 4已有叙述。
本发明的另一个目的是纯化的、分离的或重组的核酸,其包括SEQ ID No 4核苷酸序列、其互补序列及其等位基因变体和片段。此外,本发明的优选多核苷酸包括纯化的、分离的、或重组的CanIon cDNA,该CanIon cDNA由或基本上由序列SEQ ID No4组成,或者包含序列SEQ ID NO 4。本发明特别优选的核酸包括纯化的、分离的、或重组的多核苷酸,该多核苷酸包括一段连续跨距SEQ.ID No4的至少12、15、18、20、25、30、35、40、50、60、70、80、90、100、150、200、500、1000、2000、3000、4000、5000或6000个核苷酸或其互补物。在优选的实施方案中,所述连续跨距包括CanIon相关的双等位标记;最好选自A12-A16。
本发明也涉及纯化的或分离的核酸,该核酸包括的多核苷酸与SEQ ID No 4多核苷酸的核苷酸相同性至少是95%,与SEQ ID No 4多核苷酸、或其互补序列、或其具有生物活性的片段的核苷酸相同性优选为99%,更优选为99.5%,最优选为99.8%。
本发明的又一个目的涉及纯化的、分离的或重组的核酸,其包括能在本文规定的严格杂交条件下与SEQ ID No 4多核苷酸、或其互补序列或其变体或其具有生物活性的片段杂交的多核苷酸。
本发明的另一个目的涉及编码CanIon多肽的纯化的、分离的或重组的多核苷酸,所述多肽包含连续跨距SEQ ID NO 5的至少6个氨基酸,其中所述连续跨距包含至少1、2、3、5或10个SEQ ID NO 5中位置277、338、574、678、680、683、691、692、695、696、697、894、1480、1481、1483、1484、1485、1630、1631、1632、1636、1660、1667、1707、1709上的氨基酸。还包括编码CanIon多肽的纯化的、分离的或重组的多核苷酸,所述多肽包括SEQ ID NO 5的氨基酸序列或它的衍生物或生物学活性片段,以及编码CanIon多肽的纯化的、分离的或重组核酸,与SEQ ID NO 5的氨基酸序列至少有80、85、90、95、98、99、99.5或99.8%相同性。
SEQ ID No 4的cDNA包括5’-UTR区,其始于SEQ ID No 4位置1的核苷酸,止于位置65的核苷酸。SEQ ID No 4的cDNA包括3’-UTR区,其始于SEQ ID No 4位置5283的核苷酸,止于位置6799的核苷酸。
因此,本发明涉及纯化的、分离的或重组的核酸,其包括CanIon cDNA其互补序列或其等位基因变体的5’-UTR核苷酸序列。本发明还涉及纯化的、分离的或重组的核酸,其包括CanIon cDNA、其互补序列或其等位基因变体的3’-UTR核苷酸序列。
这一章节题为“CanIon cDNA序列”,应注意的是,本章节所述的多核苷酸也包含任何大小和序列的核酸片段,它们位于CanIon基因组序列其中一侧或者在这些基因组序列中两个或序个之间。
编码区
SEQ ID No 4cDNA的相应mRNA中含有CanIon开放阅读框(open reading frame)。更准确地说,有效的CanIon编码序列(CDS)包括SEQ ID No 4核苷酸位置66(ATG密码子的第一个核苷酸)和核苷酸位置5282(TGA密码子的最后一个核苷酸)之间的区域。本发明也包括分离的、纯化的和重组的多核苷酸,其编码包含SEQ ID No 5的一段连续跨距,至少6个氨基酸的多肽,优选至少8或10个氨基酸,更优选至少12、15、20、25、30、40、50、100、200、300、400、500、、700或1000个氨基酸。
以上揭示的包含CanIon基因编码序列的多核苷酸当置于适当表达信号的调控下,可在所需宿主细胞或所需宿主生物体中表达。这些表达信号可以是包含在本发明CanIon基因的调节区中的表达信号,或者相反,这些信号也可以是外源调节性核序列。当这样一个多核苷酸置于合适的表达信号之下,也可被插入到载体中,以便表达和/或扩增。
CanIon调节序列
如上所述,CanIon基因的基因组序列在非编码5’侧翼区和非编码3’侧翼区含有调节序列,这些侧翼区邻接含有该基因44个外显子的CanIon编码区。
自5’和3’调节区衍生的多核苷酸可用于检测测试样品中是否存在CanIon核苷酸序列或其片段的至少一个拷贝。
可按下述方法评估包含在CanIon中的5’调节区的启动子活性。为了鉴定具有有关生物活性的SEQ ID No 1多核苷酸片段或变体,本领域技术人员可参考Sambrook等的书(Sambrook,1989年),书中叙述了携带标记基因(即β半乳糖苷酶、氯霉素乙酰转移酶等)的重组载体的应用,当在具有生物活性的SEQ ID No 1多核苷酸片段或变体调控下,可检测到标记基因的表达。将位于CanIon基因第一外显子上游的基因组序列克隆到合适的启动子报导载体,如从Clontech公司获得的pSEAP-碱基、pSEAP-增强子、pβgal-碱基、pβgal-增强子或pEGFP-1启动子报导载体中,或Promega公司的pGL2-碱基或pGL3-碱基无启动子萤光素酶报导基因载体中。简单地说,这些启动子报导基因载体中每个都包括多个位于报导基因上游的克隆位点,而这些报导基因编码容易测试的蛋白质,如分泌的碱性磷酸酶、萤光素酶、β半乳糖苷酶、或绿萤光蛋白质。将CanIon编码区上游的序列以两种方向插入到该报导基因上游的克隆位点,并导入合适的宿主细胞中。测定报导蛋白质的水平,并且与克隆位点无插入物的载体所得水平进行比较。与对照载体的水平相比,含有插入物的载体中表达水平有所提高,表明插入物存在启动子。若需要,可将上游序列克隆到含有增强子的载体中,以提高弱启动子序列的转录水平。在缺少插入物的载体中观察到显著水平的表达,表明启动子序列存在于已插入的上游序列中。
上游基因组DNA内的启动子序列可用常规技术,如外切核酸酶III或适当的限制性内切核酸酶消化技术,在上游DNA构建嵌套5’和/或3’缺失以作进一步限定。例如,Coles等于1998提出,可将产生的缺失片段插入到启动子报导基因载体中,以确定该缺失序列是否使启动子的活性下降或消失,具体可参考本文的引用文献。这样,就可以明确启动子的边界。若需要,可用定点诱变或接头扫描鉴定该启动子内的诱变或用二单个潜在调节位点以单独或联合除去启动子内潜在的转录因子结合位点。可通过将突变插入到启动子报导基因的克隆位点中确定这些突变对转录水平的影响。这类测试是本领域技术人员所熟知的,WO 97/17359、美国专利US5,374,544、欧洲专利EP 582796、美国专利US5,698,389、美国专利US 5,643,746、美国专利US 5,502,176及美国专利US5,266,488都有叙述,具体可参考本文的引用文献。
可通过与不同种类细胞和组织的CanIon启动子操作性连接的可检测的多核苷酸的表达水平,评估CanIon基因的启动子的强度和特异性。此可检测的多核苷酸可以是与预定寡核苷酸探针特异性杂交的多核苷酸,或者是编码一可检测蛋白质的多核苷酸,包括CanIon多肽或其片段或变体。这类试验是本领域技术人员所熟知的,美国专利US5,502,176和美国专利US5,266,488都有叙述,具体可参考本文的引用文献。以下对其中一些方法作详细讨论。
优选使用带有位于CanIon编码区5’端和3’端调节元件的多核苷酸,来调控感兴趣异源多核苷酸的转录和翻译活性。
所以,本发明也涉及含有多核苷酸的纯化的或分离的核酸,该多核苷酸选自5’和3’调节区、或其互补序列或其具有生物活性的片段或变体。在一实施例中,“5’调节区”位于SEQ ID No 1的位置1和2000之间的核苷酸序列。在另一实施例中,“3’调节区”位于SEQ ID No 3的位置45842和47841之间的核苷酸序列。
本发明还涉及含有多核苷酸的纯化的或分离的核酸,该多核苷酸与选自5’和3’调节区的多核苷酸的核苷酸相同性至少是95%,与选自5’和3’调节区的多核苷酸、或其互补序列、或其变体或其具有生物活性的片段的核苷酸相同性优选是99%,更优选是99.5%,最优选99.8%。
本发明的另一个目的包括含有多核苷酸的纯化的、分离的或重组的核酸,该多核苷酸在本文规定的严格杂交条件下能与选自5’和3’调节区的核苷酸序列、或其互补序列、或其变体或其具有生物活性的片段的多核苷酸杂交。
5’调节区的优选片段长大约1500或1000个核苷酸,优选约500个核苷酸,较优选约400个核苷酸,更加优选约300个核苷酸,最优选约200个核苷酸。
3’调节区的优选片段长至少50、100、150、200、300或400个碱基。
具有“生物活性”的SEQ ID No 1和3多核苷酸衍生物是包含所述多核苷酸片段的多核苷酸,或由所述多核苷酸片段组成的多核苷酸,其功能是在重组细胞宿主中作为表达重组多肽或重组多核苷酸的调节区。它也可用作增强子或阻抑物。
对本发明而言,如果所述调节性多核苷酸含有包含转录和翻译调节信息的核苷酸序列,而这些序列与编码所需多肽或所需多核苷酸的核苷酸序列操作性连接,则核酸或多核苷酸会起到表达重组多肽或重组多核苷酸的调节区作用。
本发明的调节性多核苷酸可用适当限制酶切割SEQ ID No 1和3的核苷酸序列来制备,如Sambrook等(1989年)提出的方法。此调节性多核苷酸也可通过用诸如Bal31等外切核酸酶消化SEQ ID No 1和3来制备(Wabiko等,1986年)。这些调节性多核苷酸还可通过核酸化学合成来制备,本说明书的其它章节会有所叙述。
本发明的调节性多核苷酸可以是重组表达载体的一部分,可用于在所需宿主细胞或宿主生物中表达编码序列。本说明书的其它章节将对本发明的重组表达载体进行叙述。
本发明的优选5’调节性多核苷酸包括CanIon cDNA、或其具有生物活性的片段或变体的5’非翻译区(5’-UTR)。
本发明的优选3’调节性多核苷酸包括CanIon cDNA、或其具有生物活性的片段或变体的3’非翻译区(3’-UTR)。
本发明的又一个目的包括纯化的或分离的核酸,所述核酸包括:
a)含有一调节性核苷酸序列的核酸,此调节性核苷酸序列选自:
(i)含有5’调节区多核苷酸或其互补序列的;
(ii)核苷酸序列,该序列含有与5’调节区核苷酸序列或其互补序列的核苷酸相同性至少为95%的多核苷酸的核苷酸序列;
(iii)含有在严格杂交条件下能与5’调节区核苷酸序列或其互补序列杂交的多核苷酸的核苷酸序列;以及
(iv)(i)、(ii)和(iii)中的多核苷酸的生物活性片段或变体;
b)编码所需多肽或感兴趣核酸的多核苷酸,其与上述(a)所限定的核酸操作性连接;
c)任选地,含有3’调节性性多核苷酸,最好是CanIon基因的3’调节性多核苷酸的核酸。
在上述核酸的一具体实施例中,所述核酸包括CanIon cDNA或其生物活性片段或变体的5’非翻译区(5’-UTR)。
在上述核酸的另一具体实施例中,所述核酸包括CanIon cDNA、或其生物活性片段或变体的3’非翻译区(3’-UTR)。
5’调节区的调节性性多核苷酸或其生物活性片段或变体是操作性连接在编码所需多肽的多核苷酸或多核苷酸的5’端。
3’调节区的调节性多核苷酸或其生物活性片段或变体最好可操作性连接在编码所需多肽的多核苷酸或多核苷酸的3’端。
由上述核酸编码的所需多肽可有各种性质或来源,包括原核生物或真核生物源的蛋白质。在CanIon调节区调控下表达的多肽中包括细菌、真菌或病毒抗原。也包括真核生物蛋白质,例如,“管家”蛋白质等胞内蛋白质、受体等膜结合蛋白质以及内源性介质等分泌蛋白质,如细胞因子。所需多肽可以是CanIon蛋白质,特别是SEQ IDNo 5氨基酸序列的蛋白质或其片段或变体。
由上述多核苷酸通常是RNA分子编码的所需核酸可能与所需编码性多核苷酸互补,例如与CanIon编码序列互补,因而可用作反义多核苷酸。
这样一种多核苷酸可包括在一重组表达载体中,以便在宿主细胞或宿主生物中表达所需多肽或所需核酸。本说明书在其它章节将对含有本文所述多核苷酸的适当重组表达载体再作叙述。
多核苷酸构建物(polynucleotide construct)
术语“多核苷酸构建物”和“重组多核苷酸”在本文可互换作用,指人为设计的线性或环状,纯化的或分离的多核苷酸,它们至少包含两个核苷酸序列,这两个核苷酸序列在它们原先的天然环境中未发现是连续的核苷酸序列。
能够操控CanIon基因在重组细胞宿主和转基因动物中的时间和空间表达的DNA构建物
为了在细胞水平和多细胞生物水平上研究缺少CanIon基因合成的生理和表型结果,本发明还包括DNA构建物和重组载体,它们能够有条件地表达CanIon基因组序列或cDNA的特异性等位基因以及该基因组序列或cDNA的拷贝,它们带有SEQ ID No1-4的CanIon核苷酸序列或其片段的一个或多个碱基的取代、缺失或插入,这些碱基的取代、缺失或插入位于外显子、内含子或调节序列内,但最好位于5’调节序列或CanIon基因组序列的外显子内或SEQ ID No 4 CanIon cDNA内。在一优选实施例中,CanIon序列包含本发明的双等位标记。在一优选实施例中,CanIon序列包含本发明的双等位标记优选双等位标记-A17之一。
本发明包括重组载体,其包含本发明所述的任何一个多核苷酸。更具体地说,本发明的多核苷酸构建物可包含在“CanIon基因的基因组序列”章节、“CanIon cDNA序列”章节、“编码区”章节、“寡核苷酸探针和引物”章节中所述的任何一个多核苷酸。
按Gossen等(1992和1995年)以及Furth等(1994年)所述那样,第一优选的DNA构建物基于控制CanIon基因表达、并来自大肠杆菌(大肠杆菌)转位子Tn10的抗四环素操纵子tet。这样一种DNA构建物含有7个来自Tn10的tet操纵子序列(tetop),融合于最小启动子或CanIon基因5’调节序列,所述最小启动子或所述CanIon基因调节序列可操作性连接于一感兴趣的多核苷酸,该多核苷酸编码有义或反义寡核苷酸或编码包括CanIon多肽或其肽片段的多肽。当同一个细胞也包括编码融合于单纯疱疹病毒的病毒蛋白质VP16活化区的野生型(tTA)或突变(rTA)阻抑物的核苷酸序列,并置于诸如HCMVIE1增强子/启动子或MMTV-LTR等启动子控制下,这种DNA构建物就会起到该感兴趣核苷酸序列的条件性表达系统的作用。事实上,本发明的优选DNA构建物包括含有tet操纵子序列的多核苷酸和含有编码tTA或rTA阻抑物的多核苷酸。
在一具体实施例中,该条件表达DNA构建物含有编码突变四环素阻抑物rTA的序列,该感兴趣多核苷酸的表达在缺乏四环素的情况下是沉默的,在四环素存在下才会被诱导。
可以进行同源重组的DNA构建物:置换型载体
第二个优选的DNA构建物从5’端至3’端包含有:(a)包含在CanIon基因组序列中的第一核苷酸序列;(b)包括阳性选择标记的核苷酸序列,如抗新霉素标记(neo);以及(c)包含在CanIon基因组序列中、位于第一CanIon核苷酸序列(a)下游基因组上的第二核苷酸序列。
在一优选实施例中,这种DNA构建物还包括位于核苷酸序列(a)上游或核苷酸序列(c)下游的阴性选择标记。该阴性选择标记最好包括胸腺嘧啶核苷激酶(tk)基因(Thomas等,1986年)、潮霉素β基因(Te Riele等,1990年)、hprt基因(Van der Lugt等,1991年;Reid等,1990年)、或白喉毒素A片段(Dt-A)基因(Nada等,1993年;Yagi等,1990年)。阳性选择标记最好位于CanIon外显子序列内,使编码CanIon蛋白质的序列被隔断。例如,Thomas等(1986、1987年)、Mansour等(1988年)以及Koller等(1992年)对这些置换型载体进行了叙述。
第一和第二核苷酸序列(a)和(c)一般可位于CanIon调节序列、内含子序列、外显子序列或含有调节和/或内含子和/或外显子序列的序列内,没什么差别。核苷酸序列(a)和(c)的大小在1至50kb范围内,优选1至10kb范围内,更优选2至6kb范围内,最优选2至4kb范围内。
可以进行同源重组的DNA构建物:Cre-Loxp系统
这些新的DNA构建物采用了P1噬菌体的位点特异性重组系统。P1噬菌体具有称为Cre的重组酶,它可与34碱基对Loxp位点特异性相互作用。Loxp位点由两个被8bp保守序列分隔的13bp的回文序列组成(Hoess等,1986年)。将Cre酶重组在两个具有相同取向的Loxp位点之间导致删除该DNA片段。
Gu等(1993和1994年)首先描述了将Cre-Loxp系统与同源重组技术结合使用。简单地说,待插入到基因组靶位置的感兴趣核苷酸序列带有取向相同并位于待从重组基因组切除下来的核苷酸序列两端的至少两个Loxp位点。此切割要求重组细胞宿主胞核内存在重组酶(Cre)。通过以下方法可在需要的时间引入重组酶:(a)如Araki等所述(1995年),将Cre酶直接注射到所需细胞,或如Baubonis等所述(1993年),以脂质转染法将酶导入细胞,在含有此酶的培养基中培养重组细胞宿主;(b)如Gu等(1993年)和Sauer等(1988年)所述,用包含Cre编码序列的载体转染细胞宿主,该Cre编码序列与重组细胞宿主中起作用的启动子可操作性连接,启动子任选为可诱导性启动子,所述载体被导入重组细胞宿主中;以及(c)如Gu等所述(1994年),在细胞宿主基因组中导入多核苷酸,该多核苷酸包含与重组细胞宿主中起作用的启动子可操作性连接的Cre编码序列,启动子任选为可诱导性启动子,所述多核苷酸通过随机插入或同源重组被插入到细胞宿主的基因组中。
在一具体实施例中,构建了含有通过同源重组插入到CanIon基因中的序列的载体,使得选择标记侧接同一取向的Loxp位点,以Cre酶处理可消除此选择标记同时保留通过同源重组插入的感兴趣的CanIon序列。此外,还需要两种选择标记:选择重组的阳性选择标记和选择同源重组的阴性选择标记。Zou等(1994年)叙述了使用Cre-Loxp系统的载体和方法。
因此,本发明第三个优选DNA构建物从5’端至3’端包括:(a)包含在CanIon基因组序列中的第一核苷酸序列;(b)包括编码阳性选择标记的多核苷酸的核苷酸序列,所述核苷酸序列还包括两个限定的重组酶识别的位点,如Loxp位点,以及两个被置于相同取向的位点的序列;以及(c)包含在CanIon基因组序列中并位于第一CanIon核苷酸序列(a)基因组下游的第二核苷酸序列。
限定的重组酶识别的位点如Loxp位点的序列最好位于核苷酸序列(b)内靠近要条件性切除的核苷酸序列的适当位置上。在一具体实施例中,两个Loxp位点各位于阳性选择标记序列的一侧,以便发生同源重组后在需要的时间进行切除。
在采用上述第三个DNA构造的方法的优选实施例中,如Gu等(1994年)所述,由于在重组宿主细胞的基因组中存在操作性连接于启动子序列的Cre酶的编码序列,此启动子序列优选可诱导性启动子,更优选组织特异性启动子序列,最优选具有可诱导性和组织特异性二者的启动子序列,在需要的时间切除靠近重组酶识别的两个位点(优选两个LoxP位点)的多核苷酸片段。
如Gu等(1994年)所述,在重组细胞宿主基因组内存在Cre酶可能是两种转基因动物交配的结果,第一种转基因动物带有CanIon衍生的感兴趣的序列、含有上述Loxp位点,第二种转基因动物带有操作性连接于适当启动子序列的Cre编码序列。
如Anton和Graham(1995年)以及Kanegae等(1995年)所述,用基于腺病毒并含有Cre基因的载体也可实现对Cre酶表达的空间和时间控制,使细胞转染或有生物在体内转染,运送Cre酶。
以上所述的DNA构建物可用于将本发明所需核苷酸序列,优选为CanIon基因组序列或CanIon cDNA序列,最优选CanIon基因组或cDNA序列的替换拷贝,导入靶基因组(targeted gene)的预定位置内,从而产生靶基因的替换拷贝(敲(knock-out)同源重组)或用另一个同源性足以产生同源重组的拷贝取代靶基因的拷贝(敲入(knock-in)同源重组)。在一具体实施例中,上述DNA构建物可用于导入包含本发明至少一个双等位标记,优选选自A1-A17的至少一个双等位标记的CanIon基因组序列或CanIoncDNA序列。
核反义DNA构建物
含有本发明载体的其它组合物包括核序列SEQ ID No 4的寡核苷酸片段,优选是包含CanIon基因起始密码子的片段,作为抑制相应CanIon基因表达的反义工具。使用本发明反义多核苷酸的优选方法是Sczakiel等(1995年)或PCT申请WO 95/24223所述的程序,具体可参考本文的引用文献。
最好在与CanIon mRNA的5’端互补的多核苷酸(长15-200bp)中选择反义工具。在一实施例中,采用了与所需靶基因不同部分互补的不同反义多核苷酸组合。
本发明的优选反义多核苷酸与含有翻译起始密码子ATG或剪接位点的CanIonmRNA序列互补。本发明的另一些优选反义多核苷酸与CanIon mRNA的剪接位点互补。
如Liu等(1994年)所述,本发明的反义多核苷酸宜带有被自切割核酶序列取代的3’聚腺苷酸化信号,这样,不需要3’端的聚腺苷酸就可以产生RNA聚合酶II转录物,这些反义多核苷酸不能从胞核输出。在一优选实施例中,这些CanIon反义多核苷酸在核酶盒中还包含组蛋白茎环结构,可稳定切割的转录物抵抗3’-5’核酸外切降解,Eckner等(1991年)叙述了这样一种结构。
寡核苷酸探针和引物
自CanIon基因衍生的多核苷酸可用于检测测试样品中存在的SEQ ID No 1-4和6核苷酸序列、或其片段、互补物或变体的至少一个拷贝。
本发明特别优选的探针和引物包括分离的、纯化的或重组的多核苷酸,该多核苷酸包含SEQ ID No 1-3一段连续跨距至少12、15、18、20、25、30、35、40、50、60、70、80、90、100、150、200、500、1000、2000、5000、10000或20000个核苷酸或其互补物。其它优选的本发明的探针和引物包括分离的、纯化的、或重组的多核苷酸,其中所述连续跨距包括选自A1-A17的双等位标记。
本发明的另一目的是纯化的、分离的、或重组的多核苷酸,该多核苷酸包含SEQID NO 4的核苷酸序列及其互补序列,以及它的等位变体和片段。此外,本发明优选的探针和引物包括纯化的、分离的、或重组的CanIon cDNA,该cDNA由或基本上由SEQ ID NO 4的序列构成,或包含SEQ ID NO 4的序列。特别优选的本发明的探针和引物包括分离的、纯化的、或重组的多核苷酸,此多核苷酸包括SEQ ID No 4的一段连续跨距至少12、15、18、20、25、30、35、40、50、60、70、80、90、100、150、200、500、1000、2000、3000、4000、5000或6000个核苷酸或其互补物。本发明的另一些优选探针和引物包括分离的、纯化的或重组的多核苷酸,此多核苷酸包含SEQID No 4的一段连续跨距至少12、15、18、20、25、30、35、40、50、60、70、80、90、100、150、200、500、1000、2000、3000、4000、5000或6000个核苷酸或其互补物,其中所述连续跨距包含选自A12和A16的双等位标记。
在另一些实施方案中,本发明的探针和引物包括分离的、纯化的或重组的多核苷酸,该多核苷酸包含SEQ ID No 6的一段连续跨距至少12、15、18、20、25、30、35、40、50、60、70、80、90、100、150、200、300或400个核苷酸或其互补物。在优选的实施方案中,所述SEQ ID NO 6的连续跨距包含双等位标记A18。
所以,本发明还涉及核酸探针,其特征在于它们能在上述规定的严格杂交条件下与选自SEQ ID No 1-3的人CanIon核苷酸序列或其互补物或其互补序列的核酸杂交。
在一实施例中,本发明包括分离的、纯化的或重组的多核苷酸,该多核苷酸由或基本上由一段连续跨距SEQ ID No 1-4和6之一的8至50个核苷酸组成及其互补物,其中所述跨距在所述序列中包含CanIon相关双等位标记;任选地,其中所述CanIon相关双等位标记选自A1-A18及其互补物,或者任选地与其连锁失平衡的双等位标记。任选地,其中所述连续跨距长18至35个核苷酸,而所述双等位标记可存在于所述多核苷酸中央的4个核苷酸内;任选地,所述多核苷酸由所述连续跨距组成,而所述连续跨距长25个核苷酸,所述双等位标记存在于所述多核苷酸中央;任选地,所述连续跨距的3’端存在于所述多核苷酸的3’端;以及任选地,所述连续跨距的3’端位于所述多核苷酸3’端,而所述双等位标记存在于所述多核苷酸3’端。在优选的实施方案中,所述探针包括,或者由或基本上选自以下序列:P1-P18及其互补序列的序列构成,。
在另一实施例中,本发明包括分离的、纯化的或重组的多核苷酸,该多核苷酸包含SEQ ID No 1-4的8至50个核苷酸及其互补物的连续跨距,或者由或基本上由SEQID No 1和3的8至50个核苷酸及其互补物的连续跨距组成,其中所述跨距的3’端位于所述多核苷酸3’端,而所述多核苷酸的3’端在所述序列中位于CanIon相关双等位标记上游20个核苷酸处;任选地,其中所述CanIon相关双等位标记选自A1-A18及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,其中所述多核苷酸的3’端在所述序列中位于所述CanIon相关双等位标记上游1个核苷酸处;且任选地,其中所述核苷酸基本上由选自D1-D18和E1-E18的序列组成。
在其它实施方案中,本发明包括分离的、纯化的或重组的多核苷酸,该多核苷酸包括选自B1-B17和C1-C17的序列,或者由或基本上由选自B1-B17和C1-C17的序列组成。
在又一实施例中,本发明包括用于杂交试验、测序试验以及基于酶的错配检测试验的多核苷酸,来测定SEQ ID No 1-4和6的CanIon相关双等位标记上的核苷酸或其互补物的相同性,以及包括用于扩增含有SEQ ID No 1-4和6的CanIon相关双等位标记或其互补物的多核苷酸片段;任选地,其中所述CanIon相关双等位标记选自A1-A18及其互补物,或者任选地,所述双等位标记与其连锁失平衡。
本发明涉及本发明的多核苷酸在测定CanIon相关双等位标记的核苷酸相同性中的应用,最好是在杂交试验、测序试验、微测序试验或基于酶的错配检测试验以及扩增包含CanIon相关双等位标记的多核苷酸的区段中的应用。
本发明的探针或引物长度在8和1000个核苷酸之间,或者长度具体为至少12、15、18、20、25、35、40、50、60、70、80、100、250、500或1000个核苷酸。更具体地说,这些探针和引物的长度在8、10、15、20或30至100个核苷酸的范围内。较好是10至50个核苷酸,更好是15至30个核苷酸。较短的探针或引物有缺乏对靶核酸序列特异性的趋势,通常需要较低温度才能与模板形成足够稳定的杂交复合物。较长的探针或引物的生产费用高,有时可自身杂交形成发夹结构。本领域技术人员可凭经验决定在一组特定测试条件下探针和引物的适当长度。优选的探针或引物由含有选自核苷酸序列P1-P18及其互补序列、B1-B17、C1-C17、D1-D18、E1-E18的多核苷酸的核酸构成,在表1、2和3中列出了它们各自在序列表中的位置。
稳定性杂交物的形成取决于DNA的熔解温度(Tm)。熔解温度又取决于探针或引物长度、溶液离子强度以及G+C含量。探针或引物的G+C含量越高,熔解温度越高,这是因为G:C对通过3个氢键连接,而A:T对只有2个氢键。本发明探针的GC含量通常在10%和75%之间的范围,优选在35%和60%之间的范围,更优选在40和55%之间的范围。
可用任何合适的方法制备这些引物和探针,例如包括适当序列的克隆和限制,进行直接化学合成,如Narang等(1979年)提出的磷酸二酯法、Brown等(1979年)提出的磷酸二酯法、Beaucage等(1981年)提出的亚磷酰胺二乙酯法以及欧洲专利EP 0 707592所述的固体载体法。
检测探针通常是核酸序列或不带电的核酸类似物,例如,国际专利申请WO92/20702公开的肽核酸、美国专利US5,185,444、5,034,506和5,142,047所述的吗啉基类似物。由于探针不能另外加入脱氧核苷酸三磷酸(dNTPs),致使探针是不延伸的。这些类似物本身通常是不可延伸的,而核酸探针经过修饰探针的3’端而成为不可延伸的,以致羟基不再能参与延伸。例如,探针3’端的作用是捕获或检测标记,因而会消耗或阻断羟基。此外,可简单地切除、置换或修饰3’羟基,1993年4月19日提交的美国专利申请号07/049,061叙述了一些修饰,这些修饰也使探针不可延伸。
若需要,可用光谱学、光化学、生物化学、免疫化学或化学方法引入任何一种本领域已知的可检测标记来标记本发明任何一个多核苷酸。例如,有用的标记包括放射活性物质(包括32P、35S、3H、125I)、萤光染料(包括5-溴脱氧尿苷、萤光素、乙酰氨基芴、毛地黄毒苷)或生物素。多核苷酸最好在其3’和5’端带上标记。法国专利FR-7810975中或Urdea等(1988年)或Sanchez-Pescador等(1988年)叙述了核酸片段的非放射活性标记的例子。另外,本发明的探针可能具有的结构特征使它们可以扩增信号,例如,Urdea等(1991年)或欧洲专利EP 0 225 807(Chiron)描述的分支(branched)DNA探针。
标记还可用于捕获引物,以利于固体载体上的引物或诸如扩增的DNA等引物延伸产物的固定。捕获标记附着在引物或探针上,是与固相试剂的特异性结合成员(例如生物素和链霉亲和素)形成结合对的特异性结合成员。所以,取决于多核苷酸或探针携带的标记类型,它可用来捕获或检测靶DNA。而且,应了解,本文所提供的多核苷酸、引物或探针本身可用作捕获标记。例如,若固相试剂的结合成员是核酸序列,可选择使它与引物或探针的互补部分结合,从而将引物或探针固定在固相上。若多核苷酸探针本身作为结合成员,本领域技术人员就会知道探针将含有与靶序列不互补的序列或“尾巴”。若多核苷酸引物本身作为捕获标记,引物至少有一部分可与固相上的核酸自由杂交。DNA标记技术已为技术人员所熟知。
本发明的探针有多种用途。它们较多用在基因组DNA的DNA杂交上。也可用这些探针检测PCR扩增产物。它们还可用来检测用其它技术在CanIon基因或mRNA中造成的错配。它们还可用于检测CanIon基因的表达,例如在Northern印迹中。
本发明任何一个多核苷酸、引物或探针可方便地固定在固体载体上。本领域技术人员所知的固体载体,包括反应盘的孔壁、试管、聚苯乙烯珠粒、磁珠、硝酸纤维素条带、膜、如胶乳颗粒等微粒、绵羊(或其它动物)红血细胞、耐久细胞(duracyt)等。固体载体不是关键的,可由本领域技术人员选取。因此胶乳颗粒、微粒、磁珠或非磁性珠、膜、塑料管、微滴定孔壁、玻璃或硅芯片、绵羊(或其它动物)红血细胞以及耐久细胞都是合适的固体载体。将核酸固定在固体载体上的适当方法,包括离子、疏水、共价相互作用等。本文所用的固体载体指任何不溶性材料,或通过后续反应可成不溶性。可根据其吸引和固定捕获试剂的内在能力挑选固体载体。此外,固体载体可保留能够吸引和固定捕获试剂的附加受体。附加受体可包括带电物质,其电荷与捕获试剂本身或与捕获试剂偶联的带电物质相反。另外,受体分子可以是固定(附着)在固体载体上并能够通过特异性结合反应固定捕获试剂的任何一种特异性结合物质。受体分子能使捕获试剂与固体载体材料在进行试验之前或在试验期间间接结合。所以固相可以是塑料、衍生塑料、磁性或非磁性金属、试管的玻璃或硅表面、微滴定孔、薄片、珠粒、微粒、芯片、绵羊(或其它适当动物)红血细胞、耐久细胞及本领域技术人员已知的其它构造。本发明的多核苷酸可单独附着或固定在固体载体上,或以至少2、5、8、10、12、15、20或25个本发明不同的多核苷酸组成的组合附着或固定在一个固体载体上。此外,本发明以外的多核苷酸也可作为本发明一个或多个多核苷酸而附在同一个固体载体上。
所以,本发明还包括检测样品中存在含有SEQ ID No 1-4和6核苷酸、其片段或变体以及其互补序列的核酸的方法,所述方法包括以下步骤:
a)使能够与包含在SEQ ID No 1-4和6核酸、其片段或变体以及其互补序列中的核苷酸序列杂交的一个核酸探针或多个核酸探针与待测样品接触;以及
b)检测探针和样品中的核酸之间形成的杂交复合物。
本发明还涉及检测样品中存在含有SEQ ID No 1-4和6核苷酸序列、其片段或变体以及其互补序列的核酸的试剂盒,所述试剂盒包括:
a)能够与包含在SEQ ID No 1-4和6核酸、其片段或变体以及其互补序列中的核苷酸序列杂交的一个核酸探针或多个核酸探针;以及
b)任选地,进行杂交反应所需的试剂。
在该检测方法和试剂盒的第一优选实施例中,所述一个核酸探针或多个核酸探针用可检测的分子标记。在所述方法和试剂盒的第二优选实施例中,所述核酸探针或多个核酸探针固定在底物上。在所述方法和试剂盒的第三优选实施例中,所述核酸探针或多个核酸探针含有选自P1-P18的核苷酸序列及其互补序列、B1-B17、C1-C17、D1-D18、E1-E18的任一序列,或含有选自A1-A18及其互补物的双等位标记。
寡核苷酸阵列
可用包含多个本发明寡核苷酸引物或探针的底物检测或扩增CanIon基因中的靶序列(targeted sequence),还可以检测CanIon基因编码或非编码序列中的突变。
本文列出的任何一个多核苷酸均可附在固体载体的重叠区或随机位置。此外,本发明的多核苷酸可附在有序阵列中,其中每个多核苷酸附在固体载体的不同区,与其它任何一个多核苷酸的附着位点不重叠。这样一个多核苷酸的有序阵列最好设计成“可寻址”,记录不同位置,而且可作为试验步骤的一部分被存取。可寻址多核苷酸阵列通常包含多个不同寡核苷酸探针,其与不同已知位置中的基质表面偶联。弄清每个多核苷酸位置的准确位置,使得这些“可寻址”阵列在杂交试验中特别有用。本发明的多核苷酸可用在本技术领域已知的任何可寻址阵列技术中。这些多核苷酸阵列的一个具体实施例称为GenechipsTM,美国专利US5,143,854、PCT申请WO 90/15070和WO 92/10092都有叙述。通常用将光蚀刻法(photolithographic methods)和固相寡核苷酸合成组合起来加入机械合成法或光引导合成法(light directed synthesis)产生这些阵列(Fodor等,1991年)。通过开发通常称为“超大规模固定聚合物合成”(VeryLarge Scale Immobilized Polymer synthesis”(VLSIPSTM)技术,其中探针一般固定在芯片固体表面上的高密度阵列内,将寡核苷酸阵列固定在固体载体上。美国专利US5,143,854和US5,412,087以及PCT申请WO 90/15070、WO 92/10092和WO 95/11995提供了VLSIPSTM技术的示范例,它们叙述了通过光引导合成技术等形成寡核苷酸阵列的方法。设计提供固定在固体载体上的核苷酸阵列的策略时,还开发了展示策略,以在芯片上排列和显示寡核苷酸阵列,尽可能得到最多的杂交模式和序列信息。PCT申请WO 94/12305、WO 94/11530、WO 97/29212和WO 97/31256揭示了这种展示策略的例子,具体可参考本文的引用文献。
在本发明寡核苷酸阵列的另一实施例中,最好用寡核苷酸探针矩阵检测CanIon基因特别是其调节区中发生的突变。为了这个特定目的,特别将探针设计成具有使其与携带已知突变(缺失、插入或取代一个或几个核苷酸)的基因杂交的核苷酸序列。例如,根据Huang等(1996年)或Samson等(1996年)所用的技术,通过已知突变,已鉴定到CanIon基因上发生的突变。
另一种用来检测CanIon基因中突变的技术是使用高密度DNA阵列。将构成高密度DNA阵列一单位元件的每个寡核苷酸探针设计成与CanIon基因组DNA或cDNA的一特异性序列相匹配。所以,然后用与靶基因序列互补的寡核苷酸组成的阵列来测定靶序列与野生基因序列的相同性,测定其含量,并检测靶序列和CanIon基因的参照野生基因序列之间的差异。在这样一种设计,称为4L平铺阵列(tiled array)中使用一套四个探针(A、C、G、T),优选15个核苷酸的寡聚物。在每套四个探针中,完全互补物的杂交能力比错配探针的杂交能力更强。因此使用含有4L探针,而整套探针含有在已知野生参照序列中所有可能的突变的平铺阵列,来扫描长度为L的靶核酸基因的突变。靶序列中的单碱基变化可能会干扰15-mer探针套的平铺阵列的杂交信号。结果使突变位置侧接的探针信号或“足迹”特征性消失。Chee等(1996年)对这种技术进行了叙述。
所以,本发明涉及含有至少一种作为探针和引物的上述多核苷酸的核酸分子阵列。优选地,本发明涉及含有作为探针和引物的至少两个上述多核苷酸的核酸分子阵列。
本发明进一步的目的包括核酸序列的阵列,与核酸序列含有至少一种选自P1-P18、B1-B17、C1-C17、D1-D18、E1-E18的序列、与它们互补的序列、其至少有8、10、12、15、18、20、25、30或40个连续核苷酸的片段的序列,以及至少一种含有选自A1-A18及其互补物的双等位标记的序列。
本发明还涉及核酸序列的阵列,此核酸序列含有至少两种选自P1-P18、B1-B17、C1-C17、D1-D18、E1-E18的序列、与它们互补的序列、其至少有8个连续核苷酸的片段的序列,以及至少两种含有选自A1-A18及其互补物的双等位标记的序列。
CanIon蛋白质和多肽片段
本文所用的术语“CanIon多肽”包括本发明的全部蛋白质和多肽。本发明的组成部分还有由本发明多核苷酸编码的多肽、以及含有这些多肽的融合多肽。本发明包括人的CanIon蛋白质,其包括由或基本上由SEQ ID No 5序列组成的或包含SEQ ID No5序列的分离的或纯化的CanIon蛋白质。
本发明涉及由选自SEQ ID NO 1-4和6的核苷酸序列、其互补序列或其
本发明包括分离的、纯化的以及重组的多肽,该多肽包含SEQ ID No 5的一段连续跨距长至少6个氨基酸,优选至少8至10个氨基酸,更优选至少12、15、20、25、30、40、50、100、150、200、300、400、500、700、1000、1200、1400、1600或1700个氨基酸。在另一优选实施例中,一段连续氨基酸序列包含突变或功能性突变位点,包括CanIon蛋白质序列中氨基酸的缺失、加入、置换或截短。
在优选的实施方案中,本发明包括分离的、纯化的、或重组的多肽,该多肽包含SEQ ID No 5的一段连续跨距至少6个氨基酸,优选至少8至10个氨基酸,更优选至少12、15、20、25、30、40、50、100、150、200、300、400、500、700、1000、1200、1400、1600或1700个氨基酸,其中所述连续跨距包含至少1、2、3、5或10个SEQ IDNO 5中位置277、338、574、678、680、683、691、692、695、696、697、894、1480、1481、1483、1484、1485、1630、1631、1632、1636、1660、1667、1707、1709上的氨基酸。优选地,所述SEQ ID NO 5的连续跨距包含位置277上的丙氨酸;位置338上的丝氨酸;位置574上的缬氨酸;位置678上的亮氨酸;位置680上的丝氨酸;位置683上的苏氨酸;位置691上的组氨酸;位置692上的丝氨酸;位置695上的丝氨酸;位置696上的丙氨酸;位置697上的异亮氨酸;位置894上的异亮氨酸;位置1480上的赖氨酸;位置1481上的精氨酸;位置1483上的谷氨酸;位置1484上的缬氨酸;位置1485上的异亮氨酸;位置1630上的天冬氨酸;位置1631上的丝氨酸;位置1632上的甲硫氨酸;位置1636上的苏氨酸;位置1660上的丙氨酸;位置1667上的苯丙氨酸;位置1707上的苏氨酸;和/或位置1709上的丙氨酸。还提供了编码任一这些多肽的多核苷酸。
本发明还包括纯化的、分离的、或重组的多肽,此多肽至少包含一段与SEQ ID No5的氨基酸序列或其片段有70、75、80、85、90、95、98或99%的氨基酸相同性的氨基酸序列。
CanIon蛋白质优选分离自人或哺乳类组织样品或由人或哺乳类基因表达。可用此领域已知的常规表达方法制造本发明的CanIon多肽。将编码所需多肽的多核苷酸与适合任何方便宿主的表达载体连接。可用真核生物和原核生物的宿主系统以及一些较常见的系统组合形成重组多肽。再将多肽与裂解细胞或培养基分离,然后纯化至应用所需的纯度。纯化可用本技术领域任何一种已知技术,例如,差别性提取、盐分馏、层析法、离心法等。例如,可参照用于各种蛋白质纯化方法的酶学方法。
另外,通过化学合成制备较短蛋白质片段。或者从人或非人动物的细胞或组织提取本发明的蛋白质。蛋白质的纯化方法是本领域技术人员所知的,包括使用去污剂或离液剂破碎粒子,然后用差别性提取,通过离子交换层析法、亲和层析法、密度沉降以及凝胶电泳分离多肽。
可采用包括SEQ ID No 4在内的CanIon cDAN表达CanIon蛋白质和多肽。用常规克隆技术将编码待表达的CanIon蛋白质或多肽的核酸操作性连接于表达载体的启动子。表达载体中的CanIon插入片段可包含CanIon蛋白质或其部分的全部编码序列。
表达载体是任何一种本技术领域已知的哺乳动物、酵母、昆虫或细菌表达系统。有许多供应商提供市售载体和表达系统,包括Genetics Institute(Cambridge,MA)、Stratagene(La Jolla,California)、Promega(Madison,Wisconsin)以及Invitrogen(San Diego,California)。若需要增强表达和有利于蛋白质的适当折叠,使密码子前后序列和该序列的密码配对对于导入表达载体的具体表达生物体最优化,Hatfield等的美国专利US5,082,767对此进行了解释,具体可参考本文的引用文献。
在一实施例中,CanIon cDAN的全部编码序列通过cDAN的聚腺苷酸化(poly A)信号可操作性连接于表达载体的启动子。此外,如果编码CanIon蛋白质一部分的核酸缺少用作起始位点的甲硫氨酸,就要用常规技术将起始甲硫氨酸导入该核酸的第一个密码子旁边。类似地,如果CanIon cDAN的插入片段缺少poly A信号,就要用以下方法将该序列加入到构建物:例如,用Bg1I和Sa1I限制性内切核酸酶从pSG5(Stratagene)剪切下poly A信号,并将该信号掺入哺乳动物表达载体pXT1(Stratagene)中。pXT1含有LTRs和莫洛尼鼠白血病病毒的gag基因的一部分。此构建物内的LTRs位置得以有效地进行稳定转染。此载体包括单纯疱疹胸苷激酶启动子和选择新霉素基因。按以下方法得到编码CanIon蛋白质或其部分的核酸:采用与CanIon cDAN或其部分互补的寡核苷酸引物,通过PCR技术扩增从含有SEQ ID No 5的CanIon cDAN以及含有掺入到相应cDAN 3’引物5’端的5’引物和Bg1II的Pst I限制性内切酶序列的细菌载体获得编码Canlon蛋白质或其部分的核酸,小心要确保编码CanIon蛋白质或其部分的序列与poly A信号置于适当的位置。将最终PCR反应所得的纯化片段用Pst I消化,用外切酶形成平端,用Bg1 II消化、纯化并与pXT1连接,这时该片段含有poly A信号,并用Bg1II消化。
在产品说明书列出的条件下用脂质转染试剂(Life Technologies,Inc.,GrandIsland,New York)将已连接的产品转染到小鼠NIH33T3细胞中。转染细胞在600ug/mlG418(Sigma,St.Louis,Missouri)生长后,选择阳性转染子。
以上步骤也可用于表达负责可检测表型的突变CanIon蛋白质或其部分。
用常规纯化技术纯化表达的蛋白质,如硫酸钠沉淀或基于大小或电荷的层析分离。也可用标准免疫层析技术纯化核酸插入片段编码的蛋白质。在这些步骤中,将含有表达的CanIon蛋白质或其部分的溶液如细胞提取物加到有抗CanIon蛋白质或其部分抗体的层析柱,以附着于层析基质上。表达的蛋白质可与免疫层析柱结合。之后,洗涤此柱,除去非特异性结合蛋白。再用标准技术使特异性结合的表达蛋白质层析柱释放下来,并回收。
为了证实CanIon蛋白质或其部分的表达,将含有编码CanIon蛋白质或其部分的插入片段的表达载体的宿主细胞的表达的蛋白质,与含有无插入片段的表达载体的宿主细胞表达的蛋白质进行比较。含有插入片段的表达载体的细胞样品存在一条带,而含有无插入片段的表达载体的细胞样品则没有此条带,这表明CanIon蛋白质或其部分得到表达。通常可以预测CanIon蛋白质或其部分的条带具有迁移性。然而,由于糖基化、遍在蛋白化(ubiquitination)或酶切割等修饰,条带所具有的迁移性可能与预测值不同。
以下叙述能够特异性识别表达的CanIon蛋白质或其部分的抗体。
如果不可能制备抗体,可将编码CanIon蛋白质或其部分的核酸导入设计采用嵌合多肽进行的纯化方案的表达载体中。在这样的策略中,将编码CanIon蛋白质或其部分的核酸与编码嵌合体另一半的基因一起读框内插入。嵌合体的另一半是β-球蛋白或镍结合多肽编码序列。采用具有抗β-球蛋白或结合镍的抗体的层析基质纯化该嵌合蛋白。在β-球蛋白或镍结合多肽与CanIon蛋白质及其部分之间构建了一蛋白酶切割位点。故通过蛋白酶消化可使嵌合体的两个多肽互相分离。
一种用于产生β-球蛋白嵌合蛋白质的表达载体是编码兔β-球蛋白的pSG5(Stratagene)。兔β-球蛋白基因的内含子II有利于剪切表达的转录物,而将聚腺苷酸化信号导入该构建物可提高表达水平。分子生物学的技术人员对这些技术非常熟悉。标准方法参见Davis等(1986年)叙述的方法,而Stratagene,Life Technologies,Inc.或Promega等公司也提供了其它方法。此外,还可用体外翻译系统如体外ExpressTM翻译试剂盒(Stratagene)从该构建物制备多肽。
结合本发明CanIon多肽的抗体
可使用任何一个CanIon多肽或整个蛋白质来制备能与所述表达的CanIon蛋白质或其片段特异性结合的抗体。
本发明的一种抗体组合物能够与SEQ ID No 5的CanIon蛋白质的变体特异性或选择性结合。特异性结合CanIon的抗体组合物在酶联免疫吸附试验(ELISA)、放射免疫试验(RIA)或其它基于抗体的结合试验中与CanIon蛋白质第一全长变体的结合亲和力必须比与CanIon蛋白质第二全长变体大至少5%、10%、15%、20%、25%、50%、100%。
在一优选实施例中,本发明涉及能够选择性结合含有表位的多肽的多克隆或单克隆抗体组合物,所述多肽包含SEQ.2d No.5的一段连续跨距至少6个,优选至少8至10个氨基酸,更优选至少12、15、20、25、30、40、50、100、150、200、300、400、500、700、1000、1200、1400、1600或1700个氨基酸,其中所述连续跨距包含至少1、2、3、5或10个SEQ ID NO 5中位置277、338、574、678、680、683、691、692、695、696、697、894、1480、1481、1483、1484、1485、1630、1631、1632、1636、1660、1667、1707、1709上的氨基酸。
可以用任何CanIon多肽或完整的蛋白质来产生能够特异性结合表达的CanIon蛋白质或其片段的抗体。
一个表位可包含至少3个空间构象氨基酸,该构象对该表位是唯一的。通常,一个表位包含至少6个这样的氨基酸,较常见至少8-10个这样的氨基酸。在优选实施例中,抗原表位包含的氨基酸数目是3和50之间的任何一个整数。通过常规方法可制备有表位功能的片段。可用Jmeson-Wolf抗原分析法确定表位,例如,用计算机程序PROTEAN以缺失参数来确定表位(Version 4.0Windows,DNASTAR,Inc.,1228South Park Street Madison,WI.)。
本发明还涉及纯化的或分离的抗体,其能够特异性结合突变的CanIon蛋白质、或其含有突变CanIon蛋白质表位的片段或变体。在另一优选实施例中,本发明涉及能够结合多肽的抗体,所述多肽含有至少10个CanIon蛋白质的连续氨基酸以及包含由引起突变的性状编码的至少一个氨基酸。
目前需要的是表达不同种动物的CanIon,不论是野生型或转基因的非人动物或哺乳动物,而不是与抗体结合的,不表达CanIon的动物(即本文所述的CanIon敲除动物)在制备抗体时特别有用。CanIon敲除动物将全部或大部分CanIon蛋白质暴露区识别为外来抗原,从而产生具有较宽CanIon表位阵列的抗体。而且,可用只带有10至30个氨基酸的较小多肽来获得与任何一种CanIon蛋白质的特异性结合。此外,一些动物产生类似抗原序列的CanIon,它们的体液免疫系统会优先识别动物的天然CanIon和此抗原序列之间的差异,并产生针对这些抗原序列中独特位点的抗体。这样一种技术在获得特异性结合任何一种CanIon蛋白质的抗体时特别有用。
按其中一种方案制备的抗体制剂可用于定量免疫试验中,这种试验可测定生物样品中带有抗原的物质的浓度;也可用它们半定量测定或定性鉴定生物样品中存在抗原。这些抗体还可用于杀伤表达此蛋白质的细胞或降低体内此蛋白质水平治疗性组合物中。
本发明的抗体可用本技术领域已知的放射活性、萤光或酶标记之一标记。
所以,本发明涉及一种特异性检测生物样品中存在的本发明CanIon多肽的方法,所述方法包括以下步骤:
a)使生物样品与多克隆或单克隆抗体接触,这些抗体特异性结合含有SEQ ID No5氨基酸序列的CanIon多肽、其肽片段或变体;以及
b)检测所形成的抗原/抗体复合物。
本发明还涉及在体外检测生物样品中存在的本发明CanIon多肽的诊断试剂盒,所述试剂盒包括:
a)多克隆或单克隆抗体,其特异性结合含有SEQ ID No 5氨基酸序列的CanIon多肽、其肽片段或变体,可任选地带有标记;
b)可检测所形成的抗原/抗体复合物的试剂,所述试剂任选地带有标记,或者本身能够被标记的试剂所识别,更特别是,在上述单克隆或多克隆抗体本身未被标记时。
所以,本发明涉及抗体和T细胞抗原受体(TCR),它们能结合本发明的多肽,更具体地说,能结合本发明多肽的表位,包括但不限于IgG(包括IgG1、IgG2、IgG3和IgG4)、IgA(包括IgA1和IgA2)、IgD、IgE、或IgM和IgY。在一优选实施例中,这种抗体是本发明的人抗原结合抗体片段,包括但不限于,Fab、Fab’、F(ab)2和F(ab’)2、Fd、单链Fvs(scFv)、单链抗体、二硫键Fvs(sdFv)以及包含VL或VH区的片段。抗体可来自任何一种动物,包括鸟类和哺乳动物,优选人、小鼠、兔、山羊、豚鼠、骆驼、马或鸡。
包括单链抗体在内的抗原结合抗体片段可只包括可变区,或以下区域的全部或部分的组合:铰链区、CH1、CH2和CH3区。本发明也包括可变区与铰链区、CH1、CH2和CH3区的任意组合。本发明还包括能与本发明多肽特异性结合的嵌合性、人源化、和人单克隆和多克隆抗体。本发明还包括抗本发明抗体的抗独特型抗体。
本发明的抗体可以具有单特异性、双特异性、三特异性或更大的多特异性。具有多特异性的抗体可以对本发明的不同多肽表位具有特异性或者既对本发明的多肽,又对异源组合物如异质性多肽或固体载体材料具有特异性。例如,参见WO 93/17715、WO 92/08802、WO 91/00360、WO 92/05793;Tutt,A.等,J.Immunol.147:60-69页,1991年;美国专利US5,573,920、4,474,893、5,601,819、4,714,681、4,925,648;Kostelny,S.A..等,J.Immunol.,148:1547-1553页,1992年。
通过本发明多肽的表位或带有表位的部分被抗体识别或与抗体特异性结合,可以说明或者确定本发明的抗体。就本发明的分泌性蛋白质而言,这些抗体可特异性结合本发明核酸编码的全长蛋白质、本发明核酸编码的成熟蛋白质(即通过切除信号裂而产生的蛋白质)、本发明核酸编码的信号肽、或者本发明的任何其它多肽。因此,可如本文所述那样确定表位或带有表位的多肽部分,如通过N未端和c未端位置、连续氨基酸残基的大小,或本文所述其它方式(包括序列表)。个体抗体不包括在特异性结合本发明的任何表位或多肽的抗体中。故本发明包括特异性结合本发明特定多肽的抗体,允许排除相同的抗体。
本发明还对本发明抗体的交叉反应性进行叙述和说明。本发明包括不能特异性结合本发明多肽的任何其它类似物、正交物、或同系物的抗体。本发明也包括一些抗体,这些抗体不能结合与本发明多肽的相同性小于95%、小于90%、小于85%、小于80%、小于75%、小于70%、小于65%、小于60%、小于55%、小于50%(用本技术领域或本文所述的方法计算)的多肽。本发明还包括只结合在严格杂交条件下(如以上所述)与本发明的多核苷酸杂交的多核苷酸编码的多肽、。本发明就其结合亲和力而言叙述了本发明的抗体。优选的结合亲和力包括具有解离常数或Kd小于5×10-6M、10-6M、5×10-7M、10-7M、5×10-8M、10-8M、5×10-9M、10-9M、5×10-10M、10-10M、5×10-11M、10-11M、5×10-12M、10-12M、5×10-13M、10-13M、5×10-14M、10-14M、5×10-15和10-15M的亲和力。
本发明的抗体可用于包括但不限于本技术领域已知的纯化、检测以及靶向本发明多肽的方法中,包括体内外诊断和治疗方法。例如,这些抗体可用在免疫试验中定性和定量测定生物样品中本发明多肽的水平。参见Harlow等,抗体:实验手册(ColdSpring Harbor Laboratory Press,第二版,1988年)(引用于本文的参考文献中)。
本发明的抗体可单独使用或与其它组合物结合使用。这些抗体也可在N或c未端重组融合于一异质性多肽或与多肽或其它组合物化学偶联(包括共价和非共价偶联)。例如,本发明的抗体可重组融合或偶联于在检测试验中用作标记的分子以及诸如异质性多肽、药物或毒素等效应分子。参见WO 92/08495、WO 91/14438/、WO 89/12624、美国专利US5,314,995以及欧洲专利EP 0 396 387。
可用本技术领域已知的任何一种合适的方法制备本发明的抗体。例如,将本发明的多肽或其抗原片段给予动物,诱导产生含有多克隆抗体的血清。术语“单克隆抗体”不限于通过杂交瘤技术制备的抗体。术语“抗体”指多肽或由至少一个结合结构域组成的多肽群,其中结合结构域通过抗体分子可变区的折叠形成具有内表面形状和电荷分布与抗原的抗原决定簇特征互补的三维结合空间而形成,从而与抗原发生免疫反应。术语“单克隆抗体”指衍生自一个克隆包括真核生物、原核生物或噬菌体克隆的抗体,而不是指其制备方法。可采用本领域已知的各种技术均制备单克隆抗体,包括杂交瘤、重组和噬菌体展示技术。
杂交瘤技术包括本领域已知的技术(参见Harlow等,1998年;Hammerlin等,1981年)(所述文献列于于本文的参考文献中)。例如,可通过用木瓜蛋白酶(制备Fab片段)或胃蛋白酶(制备F(ab’)2片段)等酶蛋白水解切割从杂交瘤产生的抗体制备Fab和F(ab’)2片段。
此外,可用重组DNA技术或用本技术领域已知的方法通过合成化学制备本发明的抗体。例如,可用本技术领域已知的各种噬菌体展示方法制备本发明的抗体。在噬菌体展示方法中,功能性抗体结构域展示在携带编码抗体功能域的多核苷酸序列的噬菌体颗粒表面。直接用抗原、通常为与固体表面或珠粒结合的或被捕获的抗原,选择文库或组合性抗体文库(例如人或小鼠)中具有所需结合性质的噬菌体。这些方法所用的噬菌体通常是丝状噬菌体,包括带有与噬菌体基因III或基因VIII蛋白质重组融合的Fab、Fv或二硫键稳定的Fv抗体结构域的fd和M13。以下文献叙述了用噬菌体展示方法制备本发明抗体的例子:Brinkman U.等(1995年)、Ames,R.S.等(1995年)、Kettleborough,C.A.等(1994年)、Persic,L.等(1997年)、Burton,D.R.等(1994年)、PCT/GB91/01134、WO 90/02809、WO 91/10737、WO 92/01047、WO 92/18619、WO 93/11236、WO 95/15982、WO 95/20401、以及美国专利US5,698,426、5,223,409、5,403,484、5,580,717、5,427,908、5,750,753、5,821,047、5,571,698、5,427,908、5,516,637、5,780,225、5,658,727和5,733,743(所述文献列于于本文的参考文献中)。
如上述文献所述,选择噬菌体后,可将抗体编码区与噬菌体分离,用于产生整个抗体,包括人抗体或其它任何所需抗原结合片段,和在任何所需宿主包括哺乳动物细胞、昆虫细胞、植物细胞、酵母和细菌中表达。例如,也可用本技术领域已知的方法重组制备Fab、Fab’F(ab)2和F(ab’)2片段,如以下文献所述的方法:WO 92/22324、Mullinax,R.L.等(1992年)、Sawai,H.等(1995年)以及Better,M.等(1988年)(所述文献列于于本文的参考文献中)。
美国专利US4,946,778和5,258,498、Huston等(1991年)、Shu,L.等(1993年以及Skerra,A.等(1988年)叙述了用于制备单链Fvs和抗体的技术的例子。对于某些应用,包括在人体内和体外检测试验等使用的抗体,最好用嵌合性人源化抗体或人抗体。嵌合性抗体的制备方法是本领域所知的,例如,参见Morrison(1985年)、Oi等(1986年)、Gillies,S.D.等(1989年)以及美国专利5,807,715。可用各种技术使抗体人源化,包括CDR-嫁接(欧洲专利EP 0239400、WO 91/09967、美国专利5,530,101和5,585,089)、镶饰(veneering)和重塑(resurfacing)(欧洲专利EP 0 592 106;和EP 0 519 596、Padlan E.A.,(1991年);Studnicka G.M.等(1994年)、RoguskaM.A.等(1994年)以及链改组(chain shuffling)(美国专利5,565,332)。可用本技术领域已知的各种技术,包括上述的噬菌体展示法制备人抗体。还可参看美国专利4,444,887、4,716,111、5,545,806和5,814,318及WO 98/46645、WO 98/50433、WO98/24893、WO 96/34096、WO 96/33735及WO 91/10741(所述文献列于于本文的参考文献中)。
本发明还包括与本发明多肽重组融合或化学偶联的抗体(包括共价和非共价偶联)。这些抗体可对本发明多肽以外的抗原具有特异性。例如,通过将本发明的多肽与针对特定细胞表面受体的特异性抗体融合或偶联,可用这些抗体将本发明的多肽体内靶向特定类型的细胞。利用本技术领域已知的方法还可将与本发明多肽融合或偶联的抗体用于体外免疫试验和纯化方法中。例如,参看上述Harbor等和WO 93/21232、欧洲专利EP 0439095、Naramura,M.等(1994年)、美国专利5,474,981、Gillies,S.O.等(1992年)、Fell,H.P.等(1991年)(所述文献列于于本文的参考文献中)。
本发明也包括组合物,其含有与抗体可变区以外的结构域融合或偶联的本发明多肽。例如,本发明的多肽可与抗体Fc区或其部分融合或偶联。与本发明多肽融合的抗体部分可包含铰链区、CH1区、CH2区和CH3区或全部区域或其部分的任意组合。本发明的多肽可与上述抗体部分融合或偶联,以便用本技术领域已知的方法提高多肽在体内的半衰期或用于免疫试验中。这些多肽也可与上述抗体部分融合或偶联形成多聚物。例如,通过Fc部分之间的二硫键可使与本发明多肽融合的Fc部分形成二聚物。将多肽与IgA和IgM部分融合可形成更高的多聚物。将本发明的多肽与抗体部分融合或偶联的方法是本领域熟知的。例如,参看美国专利5,336,603、5,622,929、5,359,046、5,349,053、5,447,851、5,112,946、欧洲专利EP 0307434、EP 0367166、WO 96/04388、WO 91/06570、Ashkenazi,A.等(1991年)、Zheng,X.X.等(1995年)以及Vil,H.等(1992年)(所述文献列于于本文的参考文献中)。
本发明还涉及作为本发明多肽的激动剂或拮抗剂的抗体。例如,本发明包括完全或部分破坏受体/配体与本发明多肽的相互作用的抗体。本发明包括受体特异性抗体和配体特异性抗体。本发明包括不阻止配体结合但阻止受体活化的受体特异性抗体。可用本文所述的技术或本领域技术人员已知的其它技术确定受体的活化(即发信号)。本发明也包括既阻止配体结合又阻止受体活化的受体特异性抗体。同样,本发明包括与配体结合、阻止此配体与受体结合的中和抗体,以及与配体结合从而阻止受体活化,但不阻止配体与受体结合的抗体。本发明还包括激活受体的抗体。这些抗体可用作受配体介导的受体活化所影响的全部或部分生物活性的激动剂。这些抗体可定为包括本文所述特异活性的生物活性的激动剂或拮抗剂。用本技术领域已知的方法可制备上述激动剂。例如,参看WO 96/40281、美国专利5,811,097;Deng,B.等(1998年)、Chen,Z.等(1998年)、Harrop,J.A.等(1998年)、Zhu,Z.等(1998年)、Yoon,D.Y.等(1998年)、Prat,M.等(1998年)、Pitard,V.等(1997年)、Liautard,J.等(1997年)、Carlson,N.G.等(1997年)、Taryman,R.E.等(1995年)、Muller,Y.A.等(1998年)、Bartunek,P.等(1996年)(所述文献列于于本文的参考文献中)。
如以上所述,利用本技术领域已知的技术可进而用本发明的多肽抗体产生“模拟”本发明多肽的抗独特型抗体。参看Greenspan和Bona,(1989年)、Nissinoff,(1991年)。例如,结合并竞争性抑制多肽多聚化或抑制本发明的多肽与配体结合的抗体,可用于产生“模拟”多肽多聚化或结合域的抗独特型抗体,导致这些抗体与多肽或其配体结合或中和它们。这种中和性抗独特型抗体可用来结合本发明的多肽或其配体/受体,从而阻抑其生物活性。
CanIon相关的双等位标记
本发明双等位标记的优点
与RFLP(限制性片段长度多态性)和VNTR(串联重复序列的可变数目)标记等其它遗传标记相比,本发明的CanIon相关双等位标记有很多重要的优点。
第一代标记是RFLPs,它是修饰限制性片段长度的变异。但用来鉴定和RFLPs分别的方法相对而言比较浪费材料、劳动力和时间。第二代遗传标记是VNTRs,可按小卫星或微卫星将其分类。小卫星是以5-50个重复单位出现的串联性重复的DNA序列,它们沿人类染色体区域分布长0.1-20kb。由于它们存在许多可能的等位基因,它们的信息量非常高。可通过Southern印迹给小卫星记分,以鉴定被测试个体的核酸样品中存在的串联重复的数目。然而,Southern印迹只可能分成104个可能的VNTRs。此外,开发和大量测定RFLP和VNTR标记很费钱费时。
可按RFLPs和VNTRs同样的方法使用单核苷酸多态性或双等位标记,但它们可提供一些优点。SNP集中位于人类基因组中并代表了变异最频繁的类型。估计沿人类基因组的3×109对碱基对分散了107以上数目的位点。因此,SNP以较高频率发生,且与RFLP或VNTR标记相比更加均一,这意味着很可能将在紧靠感兴趣基因座的附近发现这种标记。与VNTR标记相比,SNP不太变化,但会突变得更加稳定。
还有,特征性的单核苷酸多态性的不同形式,如本发明的双等位标记,通常也较容易鉴别因此很容易在常规基础上分型。双等位标记含有基于单核苷酸的等位基因且它们只有两个常见的等位基因,这使得可对它们进行高度平行检测和自动记分。本发明的双等位标记提供了快速、高通量测定大量个体基因型的可能性。
双等位标记集中于基因组中,富含信息并且可大量测定。这些优点加在一起使得双等位标记在遗传研究中极有价值。双等位标记可用于家族连锁研究、等位基因共享法、人群连锁失平衡研究、病例一对照人群或阳性性状和阴性性状人群的关联性研究。本发明一个重要的方面是,双等位标记使得人们可进行关联性研究以鉴定与复杂性状有关的基因。关联性研究检测了非相关病例和对照人群中标记等位基因的频率,且通常被用于检测多基因性状或散发性状。关联性研究可在一般人群中进行,不限于在患病家族的相关个体上进行研究(连锁研究)。可平行筛选不同基因中与疾病或对治疗反应直接相关的双等位标记。这种多基因研究方法是各种人类遗传研究的有力工具,因为它可提供必需的统计学力量以检测多种遗传因子对特定表型、药物反应、散发性状或有着复杂遗传病原学的疾病状态的协同作用。
本发明的候选基因
可采用不同的方法进行关联性研究:基因组宽(genome-wide)关联性研究、候选区域关联性研究和候选基因关联性研究。基因组宽关联性研究依赖于对平均分布并覆盖整个基因组的遗传标记的筛选。候选基因方法根据对遗传标记的研究,所述遗传标记特异性定位于可能与感兴趣性状的生物学途径有关的基因中。在本发明中,CanIon是候选基因。当可获得与某性状的生物学有关的信息时,候选基因分析显然提供了鉴定与该性状有关的基因和基因多态性的捷径。然而,应注意的是,本申请中揭示的所有双等位标记都可用作基因组宽关联性研究的一部分,或者作为候选区域关联性研究的一部分,这种用法在本发明和权利要求中特别提到。
CanIon相关双等位标记和与其有关的多核苷酸
本发明还涉及CanIon相关双等位标记。如本文所用,术语“CanIon相关双等位标记”是指与CanIon基因连锁失平衡的一组双等位标记。术语CanIon相关双等位标记包括称为A1-A17的双等位标记。
本发明的一部分双等位标记列在表2中。还在相关的SEQ ID NO 1-4和6中以单个碱基多态性为特征对它们进行了描述。使得含有一个CanIon双等位标记的多态性碱基的核酸被扩增的引物对列在实施例2的表1中。
17个CanIon相关双等位标记,A1-A17位于CanIon的基因组序列中。双等位标记A12和A16位于CanIon的外显子中。双等位标记A18在CanIon基因侧翼。
本发明还涉及纯化的和/或分离的含有CanIon相关双等位标记多态性碱基的核苷酸序列。在优选的实施方案中,所述双等位标记选自A1-A18及其互补物。序列长8-1000个碱基,优选含有至少8、10、12、15、18、20、25、35、40、50、60、70、80、100、250、500或1000个核苷酸序列的连续核苷酸,所述核苷酸序列选自SEQ IDNO1-4和6或其变体或其互补序列。这些核苷酸序列包含所述双等位标记的等位基因1或2的多态性碱基。任选地,所述双等位标记可在所述多核苷酸中心的6、5、4、3、2或1个核苷酸内,或在所述多核苷酸的中心。任选地,所述连续跨距的3’端可存在于所述多核苷酸的3’端。任选地,双等位标记可存在于所述多核苷酸的3’端。任选地,所述多核苷酸还可包括一标记。任选地,所述多核苷酸可附着在固体支持物上。在另一个实施方案中,以上定义的多核苷酸可单独使用或联合使用。
本发明还涉及纯化的和/或分离的核苷酸序列,该核苷酸序列含有8-1000个连续核苷酸,和/或优选地含有至少8、10、12、15、18、20、25、35、40、50、60、70、80、100、250、500或1000个核苷酸序列的连续核苷酸,所述核苷酸序列选自SEQ IDNO 1-4或其变体或其互补序列。任选地,所述多核苷酸的3’端可位于所述序列中可位于CanIon相关双等位标记上游至少2、4、6、8、10、12、15、18、20、25、50、100、250、500或1000个核苷酸内。任选的,所述CanIon相关双等位标记选自A1-A17。任选的,所述多核苷酸的3’端可位于所述序列中CanIon相关双等位标记上游至少2、4、6、8、10、12、15、18、20、25、50、100、250、500或1000个核苷酸处。任选地,所述多核苷酸的3’端可位于所述序列中CanIon相关双等位标记上游1个核苷酸处。任选地,所述多核苷酸还可包括一标记。任选地,所述多核苷酸可附着在固体支持物上。在另一个实施方案中,上述定义的多核苷酸可单独使用或联合使用。
在优选的实施方案中,包含表2所列双等位标记之一的多态性碱基的序列选自一核苷酸序列,该核苷酸序列含有一段多核苷酸的连续跨距、由该多核苷酸构成、含在该多核苷酸中、或含有该多核苷酸,该多核苷酸选自表1所列作为扩增子的序列的核酸,或其变体或其互补序列。
本发明还涉及编码CanIon蛋白质的核酸,其中所述核酸包含双等位标记多态性碱基,所述双等位标记选自A12-A16及其互补物。
本发明还包括用于鉴定CanIon相关双等位标记上一个或多个核苷酸的相同性的任何多核苷酸的应用或任何多核苷酸。此外,用于鉴定CanIon相关双等位标记上的一个或多个核苷酸相同性的本发明的多核苷酸,包括带有任何进一步限制的多核苷酸,其描述见本公开或以后的那些公开,无论是单独的或以任何形式组合的。任选地,所述CanIon相关双等位标记选自A1-A18及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,所述CanIon相关双等位标记选自A1-A17及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,所述CanIon相关双等位标记选自A12-A16及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,所述多核苷酸可包含本说明书中所揭示的序列;任选地,所述多核苷酸可由或基本上由本说明书所描述的任何多核苷酸构成;任选地,所述检测可在杂交试验、测序试验、微测序试验或基于酶的错配检测试验中进行;任选地,所述多核苷酸可附着在固体支持物、阵列或可寻址阵列上;任选地,所述多核苷酸可被标记。一种优选的多核苷酸可用于杂交试验以确定CanIon相关双等位标记上所述核苷酸的相同性。另一种优选的多核苷酸可用于测序试验或微测序试验以确定CanIon相关双等位标记上所述核苷酸的相同性。第三种优选的多核苷酸可用于基于酶的错配检测试验以确定CanIon相关双等位标记上所述核苷酸的相同性。第四种优选的多核苷酸可用于扩增含有CanIon相关双等位标记的多核苷酸区段。任选地,任何上述多核苷酸可附着在固体支持物、阵列,或可寻址阵列上;任选地,所述多核苷酸可被标记。
此外,本发明包括供用于扩增含有CanIon相关双等位标记的核苷酸区段的任何多核苷酸的用途或任何多核苷酸。此外,用于扩增含有CanIon相关双等位标记的核苷酸区段的本发明的多核苷酸,包括带有任何进一步限制的多核苷酸,其描述见本公开或以后的那些公开,无论是单独的或以任何形式组合的。任选地,所述CanIon相关双等位标记选自A1-A18及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,所述CanIon相关双等位标记选自A1-A17及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,所述CanIon相关双等位标记选自A12-A16及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,所述多核苷酸可包含本说明书中所揭示的序列;任选地,所述多核苷酸可由或基本上由本说明书所描述的任何多核苷酸构成;任选地,所述扩增可通过PCR或LCR进行。任选地,所述多核苷酸可附着在固体支持物、阵列或可寻址阵列上;任选地,所述多核苷酸可被标记。
为采用此领域已知的任何方法,可人已公开的序列设计用于含有本发明双等位标记的多核苷酸扩增或测序反应的引物。优选的一组引物是广泛使用的,与选自SEQ IDNO 1-4和6或其互补序列或其变体的序列相同的连续跨距的3’端存在于所述引物的3’端。这种构型使得所述引物的3’端可与所选核酸序列杂交并明显增加此引物扩增或测序反应的效率。可以设计等位基因特异性引物,这样双等位标记的多态性碱基便在所述连续跨距的3’端,此连续跨距位于该引物的3’端。这种等位基因特异性引物倾向于选择性地引导扩增或测序反应,只要将它们和含有存在于双等位标记上的两个等位基因之一的核酸样品一起使用。本发明引物的3’端可位于所述序列中CanIon相关双等位标记上游至少2、4、6、8、10、12、15、18、20、25、50、100、250、500或1000个核苷酸内,适合它们在测序、扩增或定位新序列或标记应用的在任何其它位置上。因此,另一组优选的扩增引物包括分离的多核苷酸,该多核苷酸基本上由选自SEQID NO 1-4和6或其互补序列或其变体的序列中8-50个核苷酸的连续跨距构成,其中,所述连续跨距的3’端位于所述多核苷酸的3’端,其中所述多核苷酸的3’端位于所述序列中CanIon相关双等位标记上游。优选地,那些扩增引物包含选自序列B1-B17和C1-C17的序列。其3’端位于CanIon双等位标记上游1个核苷酸处的引物在微量排序试验中有特殊用途。优选的微测序引物描述在表4中。任选地,所述CanIon相关双等位标记选自A1-A18及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,所述CanIon相关双等位标记选自A1-A17及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,所述CanIon相关双等位标记选自A12-A16及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,微测序引物选自核苷酸序列D1-D18和E1-E18。
为采用此领域已知的任何方法,尤其是可测试本文公开的标记是否存在的方法,可从公开的序列设计本发明的探针。用此领域已知的任何方法可设计一组优选用于本发明杂交试验的探针,这样它们在任何特定的试验条件下可选择性地结合双等位标记的一个等位基因,而不于另一个结合。优选的杂交探针包含所述双等位标记的等位基因1或等位基因2的多态性碱基。任选地,所述双等位标记可在所述杂交探针的中央6、5、4、3、2或1个核苷酸内,或者在所述探针中央。在一个优选的实施方案中,所述探针选自序列P1-P18的各个序列以及它们的互补序列的各个序列。
应注意,本发明的多核苷酸不限于具有围绕序列表所列多态性碱基的精确的侧接序列。当然,应懂得,围绕双等位标记的侧接序列可根据它们预期的用途伸长或缩短至合适的程度,本发明特别考虑了这种序列。连续跨距以外的侧翼区不必与实际产生在病人中的天然侧翼序列同源。特别考虑了,与所述核苷酸预期的用途相一致的核苷酸序列的加入。
可标记引物和探针或固定在如“寡核苷酸探针和引物”一节中所述的固体支持物上。
附着在固体支持物上的本发明的多核苷酸包括带有本文所述或以后那些公开所述的任何进一步限制的多核苷酸,无论是单独的或以任何形式组合的。任选地,所述多核苷酸可一个一个单独附着在一个固体支持物上,或者以至少2、5、8、10、12、15、20或25个本发明的不同多核苷酸为一组附着在一个固体支持物上。任选地,本发明的那些多核苷酸以外的多核苷酸可以像本发明的多核苷酸一样附着在相同的固体支持物上。任选地,当多个多核苷酸附着到一个固体支持物时,它们可附着在随机位置或排成整齐的阵列。任选地,所述整齐的阵列是可寻址的。
本发明还包括诊断试剂盒,它含有一种或多种本发明的多核苷酸和部分或全部必须的试剂,以及通过鉴定CanIon相关双等位标记上核苷酸的相相同性给受试者作基因型分析的说明书。该试剂盒的多核苷酸可任选地附着到固体支持物上,或者成为多核苷酸阵列或可寻址阵列的一部分。用此领域已知的方法该试剂盒可用来鉴定标记部位核苷酸的相同性,这些方法包括但不限于测序试验、微测序试验、杂交试验或基于酶的错配检测试验。
重新鉴定双等位标记的方法
许多方法都可用来筛选基因组片段的单核苷多态性,如与寡核苷酸探针差异性杂交、凝胶电泳测量迁移率的变化或扩增核酸的直接排序。优选的鉴定双等位标记的方法包括适当数量的非相关个体的基因组DNA片段的比较性测序。
在第一个实施方案中,将来自非相关个体的DNA样品合并在一起,然后扩增感兴趣的基因组DNA并测序。然后分析由此获得的核苷酸序列以鉴定显著的多态性。这种方法一个主要的优点是,将DNA样品合并在一起大大减少了必须进行的DNA扩增反应和测序反应的数量。此外,该方法足够敏感,因此,由此方法获得的双等位标记常常证明用于进行相关研究的较少见的等位基因有足够的频率。
在第二个实施方案中,所述DNA样品不合并在一起,因此扩增和测序是分开进行的。当需要鉴定双等位标记以在候选基因内进行相关研究时,这种方法通常是优选的。可对相关性较高的基因区域(如启动子区域或外显子区域)进行筛选有无双等位标记。在进行相关研究时,用这种方法获得的双等位标记可能显示出较低的信息度,例如,其较少见的等位基因的频率可小于约10%。然而,这种等位基因却带有足够的信息以进行相关研究,同时,在本发明的基因组分析研究中,带有较少信息的双等位标记在某些情况下可直接鉴定致病性突变,根据其外显率,这些突变可能是稀有突变。
以下是对本发明者为鉴定本发明的双等位标记所使用的优选方法的各种参数的描述。
基因组DNA样品
可产生本发明双等位标记的基因组DNA样品最好获自非相关的个体,这些个体对应于已知民族背景的异质性人群。可获得DNA样品的个体数目可有较大变化,优选约100-1000,更优选约50-200名个体。优选从至少约100名个体收集DNA样品以在给定人群中获得足够的多态性多样性,以便鉴定尽可能多的标记并产生统计学上显著的结果。
就可用于分析的基因组DNA的来源,任何试验样品都可被冷冻而没有任何特殊限制。这些试验样品包括可用于本文描述的本发明的方法进行测试的生物样品,其中包括人和动物的体液,如全血、血清、血浆、脑脊液、尿液、淋巴液和呼吸道、肠道和生殖道的各种外分泌物、泪液、唾液、乳汁、白血细胞、骨髓瘤等;生物液体,如细胞培养上清液;固定的组织标本,包括肿瘤和非肿瘤组织以及淋巴结组织;骨髓抽出物和固定的细胞标本。用于本发明的基因组DNA的优选来源是各个献血员的外周静脉血。从生物样品制备基因组DNA的技术是精通的技术人员熟知的。在实施例1中提供了优选实施方案的细节。此领域的技术人员可选择扩增合并或未合并的DNA样品。
DNA扩增
通过使用DNA扩增法有助于鉴定基因组DNA样品中的双等位标记。可将DNA样品合并或不合并进行扩增步骤。DNA扩增技术是此领域的技术人员熟知的。
可用于本发明内容的扩增技术包括但不限于EP-A-320308、WO 9320227和EP-A-439182中所描述的连接酶链式反应(LCR)、Guatelli J.C.等(1990)和ComptonJ.(1991)所描述的聚合酶链式反应(PCR、RT-PCR)和基于核酸序列的扩增技术(NASBA)、欧洲专利申请4544610号所描述的Q-β扩增、Walker等(1996)和EP A 684315所描述的链置换扩增以及PCT公布WO 9322461所描述的靶介导的扩增。
LCR和Gap LCR是指数扩增技术,两者都依赖于DNA连接酶以将毗邻的引物退火成为DNA分子。在连接酶链式反应(LCR)中,采用的探针对包括两个主要探针(primaryprobe)(第一和第二探针)和两个次要探针(secondary probe)(第三和第四探针),这些探针的用量都应超过靶子的摩尔量。第一探针与靶链的第一区段杂交,第二探针与靶链的第二区段杂交,由于第一区段和第二区段是邻接的,因此主要探针以5’磷酸-3’羟基关系相互邻接,这样连接酶可将这两个探针共价融合或连接到融合的产物中。此外,第三(次要)探针和第四(次要)探针可以同样的邻接方式分别与第一探针的一部分和第二探针的一部分杂交。当然,如果靶子最初是双链的,则次要探针也将首先与靶子的互补物链交。一旦主要探针连接的链与靶链分离,它将和第三和第四探针杂交,它们可被连接形成互补物:次要连接产物。重要的是应认识到,所述连接产物与靶子或其互补物在功能上是等价的。通过重复杂交和连接循环,可实现对靶序列的扩增。多元LCR的方法也有描述(WO 9320227)。缺口LCR(GLCR)是LCR的一种模式,其中的探针不是毗邻的,而是被2-3个碱基分隔。
为扩增mRNA,本发明提供了以下几种方法:在聚合酶链式反应(RT-PCR)之后将mRNA反转录成cDNA;或者如美国专利5,322,770所述在这两个步骤中使用一种酶;或者用Marshall等(1994)描述的不对称缺口LCR(RT-AGLCR)。AGLCR是对GLCR的修饰,它可扩增RNA。
PCR技术是用于本发明的优选扩增技术。此领域的技术人员熟悉各种PCR技术。为回顾PCR技术,可参见White(1997)题为“PCR Methods and Applications”的出版物(1991,冷泉港实验室出版社)。在这些PCR方法中,需在合适制备的核酸样品中加入待扩增的核酸序列每一侧的PCR引物,同时需要加入dNTPs和耐热的聚合酶,如Taq聚合酶、Pfu聚合酶或Vent聚合酶。样品中的核酸被变性,同时PCR引物与样品中互补的核酸序列特异性杂交。杂交的引物被延长。然后开始另一次变性、杂交和延伸循环。该循环被重复多次以产生扩增的片段,该片段含有引物位点之间的核酸序列。还有一些专利也描述了PCR,它们包括美国专利4,683,195;4,683,202;以及4,965,188,在此将其全文并入以供参考。
PCR技术是用来鉴定新的双等位标记的优选扩增技术。实施例2提供了适合本发明目的的PCR反应的典型例子。
本发明的一个方面是扩增人类CanIon基因的方法,尤其是扩增以下片段:测试样品中SEQ ID NO 1-3的基因组序列或SEQ ID NO 4的cDNA序列或其片段或变体的方法,优选使用PCR。该方法包括以下步骤:
a)使试验样品与含有一对上述扩增引物的扩增反应试剂接触,所述引物位于待扩增的多核苷酸区域两侧;以及
b)任选地检测扩增产物。
本发明还涉及用来扩增CanIon基因序列的试剂盒,特别涉及用来扩增测试样品中SEQ ID NO 1-3的部分基因组序列或SEQ ID NO 4的cDNA序列或其变体的试剂盒,其中所述的试剂盒包括:
a)一对位于待扩增的CanIon区域两侧的寡核苷酸引物;
b)任选地进行上述扩增反应所需的试剂。
在上述扩增方法和试剂盒的一个实施方案中,扩增产物是通过和标记的探针杂交而检测的,该探针含有与被扩增的区域互补的序列。在上述扩增方法和试剂盒的另一个实施方案中,引物包括选自核苷酸序列B1-B17、C1-C17、D1-D17和E1-E18的序列。
在本发明的第一个实施方案中,双等位标记是用本发明者创建的基因组序列信息鉴定的。被测序的基因组DNA片段被用来设计引物以扩增500bp的片段。这些500bp的片段是从基因组DNA扩增的并且对其双等位标记进行了扫描。可用OSP软件(Hillier L.和Green P.,1991)设计引物。所有引物在特异性靶碱基上游可含有常见的作为排序引物的寡核苷酸尾巴。此领域那些技术人员对于可用于这些目的的引物延伸是熟悉的。
用于扩增编码CanIon基因的基因组序列的优选引物,集中在该基因的启动子、外显子和剪切位点。如果双等位标记定位在该基因的这些功能区域内,则它们很可能成为致病性突变。本发明优选的扩增引物包括核苷酸序列B1-B17和C1-C17,它们将详细列在实施例2的表1中。(原文第57页)
扩增的基因组DNA的测序以及单一核苷酸多态性的鉴定
然后用熟练技术人员已知的并可获得的方法测序按上述产生的扩增产物。DNA测序的方法要么使用双脱氧介导的方法(Sanger法),要么使用了此领域一般技术人员都知道的Maxam-Gilbert法。例如,这些方法见Sambrook等(1989)描述。可供选择的方法还包括Chee等(1996)描述的高密度DNA探针阵列杂交。
较好地,可用染料-引物(dye-primer)循环测序方法对扩增的DNA进行自动双脱氧终止子测序。将测序反应的产物在测序凝胶上跑电泳,并用凝胶图象分析检测序列。多态性研究是根据在同一位置的不同碱基在电泳图中产生的叠加峰。由于各个双脱氧终止子都被不同的荧光分子标记,与一个双等位基因位点相对应的两个峰有不同的颜色,此颜色与序列上相同位置的两个不同的核苷酸相对应。然而,由于背景噪音这两种峰的出现可能是人为因素造成的。为排除这种人为因素,对这两条DNA链测序并比较各个峰。为确定是多态序列,必须检测两条链上的多态性。
上述过程使那些含有双等位标记的扩增产物得以鉴定。此测定通过测序100名个体的合并物将检测较小等位基因的双等位多态性频率限制在约为0.1,如通过测序已知等位基因频率的合并物所验证的那样。然而,超过90%的用这种合并法测得的较小等位基因的双等位多态性的频率高于0.25。因此,用这种方法选出的较小等位基因的双等位标记的频率至少为0.1,同时较大等位基因的频率小于0.9。优选较小等位基因的此频率至少为0.2,较大等位基因的频率小于0.8,更加优选较小等位基因的此频率至少为0.3,较大等位基因的频率小于0.7,这样杂合性速度大于0.18,较好大于0.32,最好大于0.42。
在另一个实施方案中,双等位标记是通过对各个DNA样品测序进行检测的,这种较小等位基因的双等位标记的频率可小于0.1。
本发明双等位标记的验证
上述多态性通过验证人群中两种等位基因的存在而评价它们作为遗传标记的用途。上述双等位标记的验证是通过用本发明的方法给一组个体作基因分型而实现并证明两种等位基因都存在的。微测序法是等位基因分型的优选方法。测定基因型的步骤的验证可在该组中各个个体的个体样品上进行,或者对一名以上个体的合并样品作基因分型。如果个体是所述等位基因的杂合子,则该组可少至只有一名个体。优选此组含有至少三名个体,最好是5或6名个体,这样一次验证试验就更有可能验证多个被测的双等位标记。然而,应注意,当在个体数少的组中进行验证试验时,如果取样错误而没有一名被测个体带有两个等位基因之一,则会导致假阴性结果。因此,与证明在序列的某特定位点存在真正的双等位标记相比,此验证过程在证明具体的最初结果是人为因素造成的时用处较小。本发明所有测定基因型、单倍体型、关联性和相互作用研究方法,都可任选地单独用已验证的双等位标记进行。
评价本发明双等位标记的频率
通过测定在双等位标记位置上出现最少见的等位基因的频率,可进一步评价已验证的双等位标记作为遗传标记的用途。这种较少见的等位基因的频率越高,则该双等位标记在关联性和相互作用研究中就越有用。对最少见的等位基因的测定是用本发明的方法确定一组个体的基因型并证明两个等位基因都存在而实现的。这种以基因分型步骤进行的频率测定可在该组中各个体的个体样品上进行,或者对一名以上个体的合并样品作基因分型而进行。所述组必须足够大以代表整个人群。较好的是该组包括至少20名个体,更好包括至少50名个体,最好包括至少100名个体。当然,组越大则频率测定的准确性就越高,因为这可降低取样误差。较少见等位基因的频率为30%或更高的双等位标记称为“高质量的双等位标记”。本发明所有的基因分型、单倍型、关联性和相互作用研究的方法都可任选地单独用高质量的双等位标记进行。
鉴定个体双等位标记基因型的方法
提供了就本发明的一个或多个双等位标记确定生物样品基因型的方法,所有这些方法都可在体外进行。这些测定基因型的方法包括用此领域已知的任何方法测定CanIon双等位标记位置上核苷酸的相同性。在测定已知与其给定性状有关的双等位标记的等位基因时,发现这些方法在关联性研究中可用来确定病例-对照(case-control)人群和个体的基因型,为此测定了存在于个体基因组中的双等位标记的两份拷贝,因此可将个体分为特定等位基因的纯合或杂合个体。
这些测定基因型的方法可个体核酸样品或合并的DNA样品上进行。
可用上述类似的方法测定基因型以鉴定双等位标记,或者用其它测定基因型的方法,比如下面描述的方法。在优选的实施方案中,对不同个体的扩增的基因组片段的比较,可用来鉴定新的双等位标记,而在诊断和关联性研究应用中微测序方法则可用来确定已知的双等位标记的基因型。
在本发明的一个实施方案中包括测定基因型的方法,该方法包括确定生物样品中CanIon相关双等位标记或其互补物上核苷酸的相同性;任选地,其中所述CanIon相关双等位标记选自A1-A18及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,其中所述CanIon相关双等位标记选自A1-A17及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,所述CanIon相关双等位标记选自A12-A16及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,其中所述生物样品来自单个个体;任选地,对所述双等位标记上所述核苷酸的相同性进行了检测以确定所述双等位标记两个拷贝在所述个体的基因组中的存在情况;任选地,其中所述生物样品来自多个个体;任选地,本发明测定基因型的方法包括在本说明书中所描述的具有一步限制的方法,或以后单独说明或合在一起说明的方法;任选地,所述方法是在体外进行的;任选地,在所述确定步骤之前还包括扩增含有该双等位标记的序列部分;任选地,其中所述扩增是通过PCR、LCR、或在宿主细胞中复制包含复制来源和所述片段的重组载体;任选地,其中所述确定步骤是通过杂交试验、测序试验、微测序试验或基于酶的错配检测试验进行的。
供测定基因型的核酸的来源
纯化或非纯化形式的任何核酸来源都可用作起始核酸,只要它含有或怀疑含有特定的所需核酸序列。DNA或RNA可如上所述的细胞、组织、体液等中提取。由于用于本发明基因型测定方法的核酸可来源于任何哺乳动物,从其取得核酸的试验受试者和个体通常理解为人。
含有双等位标记的DNA片段的扩增
提供了用来扩增含有一个或多个本发明双等位标记的核苷酸区段的方法和多核苷酸。应该知道,含有双等位标记的DNA片段的扩增可用于各种方法和各种目的,不限于基因型的测定。然而,许多测定基因型的方法,尽管不是所有的方法,需要对带有感兴趣的双等位标记的DNA区域事先进行扩增。这种方法特别增加了跨越该双等位标记或包括该位点的序列和位于远离于它或最接近它的序列的含量或总数。诊断试验也可能依赖于带有本发明双等位标记的DNA区段的扩增。DNA的扩增可用本领域已知的任何方法实现。扩增技术的描述见上面题为“DNA扩增”的章节中。
一些扩增方法特别适合检测单一核苷酸多态性,并可同时扩增靶序列和鉴定所述多态性核苷酸,这将在下面作进一步描述。
如上所述,通过鉴定双等位标记可设计出合适的寡核苷酸,可用作扩增含有本发明双等位标记的DNA片段的引物。可用本文所描述的最初用来发现新的双等位标记的引物进行扩增,或者用任何一组可扩增含有本发明双等位标记的DNA片段的引物。
在一些实施方案中,本发明提供了用来扩增含有一种或多种本发明双等位标记的DNA片段的引物。优选的扩增引物列在实施例2中。应该知道,所列引物仅仅是作为示范,其它任何可产生含有一种或多种本发明双等位标记的扩增产物的引物组都可以使用。
引物的间隔决定了待扩增的区段长度。在本发明中,带有双等位标记的扩增区段至少约25bp-35kbp。25-3000bp的扩增片段是典型的,50-1000bp的片段是优选的,100-600bp的片段是最优选地。应该知道,双等位标记的扩增引物可以是任何能特异性扩增带有所述标记的DNA片段的序列。扩增引物可被标记或被固定在“寡核苷酸探针和引物”一章中所描述的固体支持物上。
测定DNA样品中双等位标记基因型的方法
可用此领域已知的任何方法来鉴定存在于双等位标记位点上的核苷酸。由于本发明已经鉴定并描述了待检测的双等位标记的等位基因,对此领域技术人员而言,这种检测将十分简单,可用众多技术中的任何一种。许多测定基因型的方法需要对带有感兴趣的双等位标记的DNA区域进行预扩增。虽然目前优选对靶子或信号的扩增,但本发明测定基因型的方法还包括不需要进行扩增的超灵敏的检测方法。可采用此领域技术人员熟知的方法来检测双等位多态性,这些方法包括,如常规的斑点印迹分析法、Orita等(1989)描述的单链构象多态性分析(SSCP)、变性梯度凝胶电泳(DGGE)、异质双链体分析、错配剪切检测和其它如Shiffield等(1991)、white等(1992)、Grompe等(1989和1993)描述的常规技术。其它用来测定存在于特定多态性位点的核苷酸相同性的方法,采用了专门的如美国专利4,656,127所描述的外切核酸酶限制性核苷衍生物。
优选的方法包括用测序试验、基于酶的错配检测试验或杂交试验直接测定存在于双等位标记位点的核苷酸相同性。以下是一些优选方法的描述。特别优选的方法是微测序技术。术语“测序”用在这里通常是指双链体引物/模板复合物的聚合酶延伸,包括传统的测序和微测序。
1)测序试验
可通过测序的方法测定存在于多态性位点的核苷酸。在优选的实施方案中,在测序之前对DNA样品按上述方法进行PCR扩增。DNA测序方法描述见“扩增的基因组DNA的测序以及单一核苷酸多态性的鉴定”。
优选地,最好用染料-引物循环测序法对扩增的DNA进行自动双脱氧终止子测序反应。通过序列分析可鉴定存在于双等位标记位点的碱基。
2)微测序试验
在微测序方法中,用单一核苷酸引物延伸反应检测了靶DNA多态性位点的核苷酸。此方法包括合适的微测序引物,该引物恰在靶核酸中感兴趣的多态性碱基的上游杂交。用聚合酶来特异性延伸与该多态性位点的核苷酸互补的引物的3’端,该引物带有一个ddNTP(链终止子)。然后用任何合适的方法检测掺入的核苷酸的相同性。
通常,微测序反应是用荧光ddNTPs进行的,并通过在ABI377测序仪上电泳以分析延伸的微测序引物,从而可确定如EP 412883所述的掺入的核苷酸的相同性,在此将其全文并入以供参考。或者可使用毛细管电泳以同时进行大量试验。实施例4提供了可用于本发明中的典型微测序方法的例子。
可用不同的方法来标记并检测ddNTPs。Chen和Kwok(1997)和Chen等(1997)已经描述了基于荧光共振能量转移的均相检测法。在该方法中,当等位基因染料标记的双脱氧核苷三磷酸和改进的Taq聚合酶存在时,将含有多态性位点的扩增的基因组DNA片段和5’-荧光素标记的引物一起培育。染料标记的引物被存在于模板上的等位基因特异性染料-终止子延伸了一个碱基。在测定基因型的反应结束时,无需分离或纯化,可直接分析反应混合物中两种染料的荧光强度。所有这些步骤可在同一试管中进行,并实时监测荧光的变化情况。或者,可用MALDI-TOF质谱仪分析延伸的引物。通过加到微测序引物上的物质鉴定多态性位点上的碱基(参见Haff和Smirnov,1997)。
用已经建立的微测序法或其发展产生的方法,可实现微测序。可供选择的方法包括几种固相微测序技术。基础微测序方法和上面的描述相同,只是该方法以非均相试验进行,其中引物或靶分子被固定或捕获在固体支持物上。为简化引物分离和末端核苷酸加成分析,使寡核苷酸附着于固体支持物上或用亲和分离以及聚合酶延伸的方法进行修饰。可用许多不同的方法修饰合成寡核苷酸的5’端和内部核苷酸以进行不同的亲和分离方法,如生物素化。如果在寡核苷酸上使用单一的亲和基团,则可将该寡核苷酸可与掺入的终止子试剂分离。这样就不必进行物理分离或大小分离。如果采用多种亲和基团则可将一种以上的多核苷酸与终止子试剂分离并同时进行分析。这样在每次延伸反应中就可分析几种核酸或多个核酸序列信息。亲和基团不一定要在引导的寡核苷酸上,但可以在所述模板上。例如,可通过生物素化的DNA和包被链霉亲和素的微量滴定孔或包被亲和素的聚苯乙烯颗粒之间的相互反应以进行固定。用同样的方法,寡核苷酸或模板可以高密度模式附着于固体支持物。在这种固相微测序反应中,掺入的ddNTPs可以用放射性同位素标记(Syvanen,1994)或连接于荧光素(Livak和Hainer,1994)。对用放射性标记ddNTPs的检测可通过以闪烁为基础的技术实现。对连接有荧光素的ddNTPs的检测可根据与偶联碱性磷酸酶的抗荧光素抗体结合,然后与发色底物(如p-硝酸苯基磷酸)一起培育。其它可能的受体检测对包括:与二硝基苯基(DNP)和抗DNP碱性磷酸酶偶联物连接的ddNTP(Harju等,1993),或生物素化的ddNTP和与辣根过氧化物酶偶联链霉亲和素,以邻-苯二胺作为底物(WO 92/15712,在此将其全文并入以供参考)。作为另一种固相微测序方法,Nyren等(1993)描述了一种依据酶促发光无机磷酸盐检测试验(ELIDA)检测DNA聚合酶活性的方法。
Pastinen等(1997)描述了多元检测单一核苷酸多态性的方法,其中对寡核苷酸阵列应用了该固相微测序原理。下面进一步描述附着于固体支持物上的高密度DNA探针阵列(DNA芯片)。
在本发明的另一方面,提供了通过进行微测序试验以测定一种或多种本发明的双等位标记的基因型的多核苷酸和方法。优选的微测序引物包括D1-D18和E1-E18的核苷酸序列。应该知道,实施例4中列出的微测序引物仅仅是作为例子,任何3’端紧靠此种多态性核苷酸的引物都可使用。类似地,应该知道,可对本发明的任何双等位标记或双等位标记的任何组合进行微测序分析。本发明的一个方面是一种固体支持物,它含有一种或多种实施例4所列的微测序引物,或含有其至少8、12、15、20、25、30、40或50个连续核苷酸的片段,片段的长度与所述引物相一致且具有紧靠相应双等位标记上游的3’末端,以检测位于双等位标记位点的核苷酸的相同性。
3)基于聚合酶和连接酶的错配检测试验
在本发明一个方面提供了通过基于聚合酶和/或连接酶的错配检测试验,测定生物样品中一种或多个本发明双等位标记的等位基因的多核苷酸和方法。这些试验基于聚合酶和连接酶的专一性。聚合反应对扩增引物的3’端的正确碱基配对有特别严格的要求,而且与靶DNA序列杂交的两个寡核苷酸的结合对靠近连接位点的错配非常敏感,尤其是在3’端。在上面“含有双等位标记的DNA片段的扩增”一节中还描述了扩增含有本发明双等位标记的DNA片段的方法、引物和各种参数。
等位基因特异的扩增引物
通过等位基因特异的扩增也可实现对双等位标记的两个等位基因之间的区别,通过选择性策略,扩增了一个等位基因而不扩增另一个等位基因。就等位基因特异扩增而言,至少一对引物中的一个应与含有本发明双等位标记多态性碱基的CanIon基因区域充分互补,以便与其杂交并引发扩增反应。这种引物能够区别双等位标记的两个等位基因。
这是通过将多态性碱基置于一个扩增引物的3’端而实现。因为延伸是从该引物的3’端形成的,该位置上或其附近位置的错配对扩增有抑制作用。因此,在合适的扩增条件下,这些引物只引导在它们的互补等位基因上扩增。错配的精确位置的确定和相应的试验条件是此领域普通技术人员熟知的。
以连接/扩增为基础的方法
“寡核苷酸连接试验”(OLA)采用了两种寡核苷酸,设计它们能够与靶分子一条链的邻近序列杂交。其中一种寡核苷酸生物素化,另一种被可检测地标记。如果在靶分子中找到了精确互补的序列,则此寡核苷酸将杂交,这样它们的末端靠近产生可被捕获和检测的连接底物。OLA能够检测单一核苷酸多态性,并且如Nickerson等(1990)所述,与PCR联用是有益的。在此方法中,PCR被用来获得靶DNA的指数性扩增,然后用OLA对其进行检测。
其它特别适合检测单一核苷酸多态性的扩增方法包括LCR(连接酶链式反应)和缺口LCR(GLCR),这已在“DNA扩增”一节中描述过。LCR使用了两对探针以指数性扩增特定的靶标。选择每对寡核苷酸的序列以使其可与该靶标的同一链的邻近序列杂交。这种杂交形成了模板依赖性连接酶的底物。根据本发明,可用带有双等位标记位点同一链的近端序列和远端序列的寡核苷酸进行LCR。在一个实施方案中,将设计出包括所述双等位标记位点的两个寡核苷酸之一。在这一实施方案中,选择反应条件,这样,只有当靶分子含有或缺乏与该寡核苷酸上双等位标记互补的特异性核苷酸时这些寡核苷酸才可连接在一起。在另一个实施方案中,所述寡核苷酸不包括此双等位标记,这样当它们与靶分子杂交时,将产生如WO 90/01069所述的“缺口”,在此将其全文并入以供参考。然后用互补的dNTPs(通过DNA聚合酶介导)或通过另一对寡核苷酸将此缺口“填平”。因此,在每一循环结束时,每个单链在下一循环中完全能够作为靶子,并可获得所需序列的指数性等位基因特异性扩增。
连接酶/聚合酶介导的Genetic Bit AnalysisTM是另一种检测核酸分子中预选位点上核苷酸相同性的方法(WO 95/21271)。该方法包括将与预选位点的核苷酸互补的核苷三磷酸掺入到引物分子的末端,它们然后连接于第二种寡核苷酸。通过检测附着于反应的固相上的或通过检测溶液中的特异性标记可监测该反应。
4)杂交试验方法
优选的测定双等位标记位点上的核苷酸相同性的方法涉及核酸杂交。所述杂交探针(可方便地用于此类反应)优选包括本文定义的探针。可采用的杂交试验包括Southern杂交、Northern杂交,斑点印迹杂交和固相杂交(参见Sambrook等,1989)。
杂交是指两个单链核酸由于互补碱基配对形成双链体结构。杂交可在正确互补的核酸链之间发生,或在含有最小错配区域的核酸链之间发生。可设计与双等位标记的一种形式但不和另一种形式杂交,因此能区分不同等位基因形式的特异性探针。等位基因特异性探针通常是成对使用的,一个与含有来原等位基因的靶序列良好配对,另一个与含有另一等位基因的靶序列良好配对。杂交条件应足够严格,这样等位基因之间的杂交强度,更佳地是基本的二元反应就会有显著差异,因此一个探针只与该等位基因之一杂交。在严格的序列特异性杂交条件下,探针只与正确互补的靶序列杂交,这种条件是此领域熟知的(Sambrook等,1989)。严格条件需取决于序列且在不同情况下也是不同的。通常,在确定的离子强度和pH下,所选的严格条件比特定序列的解链温度(Tm)约低5℃。尽管这种杂交可在溶液中进行,但优选采用固相杂交试验。在杂交反应之前可扩增含有本发明的双等位标记的靶DNA。通过检测是否存在探针和靶DNA之间形成的稳定杂交双链体来确定样品中特异性等位基因的存在。杂交双链体的检测可用许多方法进行。各种检测试验模式是熟知的,它们采用与靶子或探针结合的可测标记使对杂交双链体的检测得以进行。通常,使杂交双链体与未杂交的核酸分离,然后检测与此双链体结合的标记。此领域的技术人员应该知道,可采用洗涤步骤以洗去多余的靶DNA或探针以及未结合的偶联物。此外,标准的非均一试验模式适合利用存在于引物和探针上的标记来检测此杂交。
最近开发的两项试验可使以杂交为基础的对等位基因的区别不需要分离或洗涤步骤(见Landegren U.等,1998)。此TaqMan试验利用了Taq DNA聚合酶的5’核酸酶活性来消化与积累的扩增产物特异性退火的DNA探针。TaqMan探针用通过荧光能量转移而相互作用的供体-受体染料对标记。通过扩增时预先提供的聚合酶对TaqMan探针的切割可将供体染料与淬灭的受体染料分离,大大增强了供体的荧光。在反应开始时加入检测两种等位基因变体所必须的所有试剂并实时监测结果(参见Livak等,1995)。在另一种以均相杂交为基础的方法中,使用了分子标记以区别等位基因。分子标记是发夹形的寡核苷酸探针,它可报告均相溶液中特异性核酸的存在。当它们和它们的靶子结合时,它们就会发生构象重组,这恢复了内部淬灭的荧光团的荧光(Tyagi等,1998)。
本文提供的多核苷酸可用来制造可用于检测生物样品中双等位标记的等位基因的杂交试验的探针。这些探针的特征是优选含有8-50个核苷酸,以及它们与含有本发明双等位标记的序列充分互补,而与它们杂交,且优选有足够的特异性以辨别只有一个核苷酸改变的靶序列。特别优选的探针长25个核苷酸。优选此双等位标记在多核苷酸探针中央4个核苷酸内。在特别优选的探针中,该双等位标记在所述多核苷酸的中心。优选的探针含有选自表1所列扩增子的核苷酸序列及其互补序列,或其片段,所述片段含有至少约8个连续核苷酸,较好10、15、20个,最好25、30、40、47或50个连续的核苷酸并包含多态性碱基。优选的探针含有选自P1-P18的核苷酸序列及其互补序列。在优选的实施方案中,多态性碱基在所述多核苷酸中央5、4、3、2、1个核苷酸内,最好在所述多核苷酸的中心。
本发明的探针优选被标记或被固定在固态支持物上。标记和固态支持物将进一步描述在“寡核苷酸探针和引物”一节中。这些探针可以是如“寡核苷酸探针和引物”中所述的不可延伸的探针。
通过测定与等位基因特异性探针的杂交,我们可以检测给定的样品中是否存在双等位标记的等位基因。“杂交试验”特别包括阵列模式的高通量平行杂交,这将在下面进行描述。
5)与可寻址的寡核苷酸阵列的杂交
基于寡核苷酸阵列的杂交试验取决于短的寡核苷酸与正确匹配和错配的靶序列变体之间杂交稳定性的差异。通过基础性结构,获得了对多态性信息的有效进入,含有在选定位置附着于固态支持物(如芯片)的寡核苷酸探针的高密度阵列的每张DNA芯片可包含数千至数百万个单独合成的DNA探针,这些探针以格子样的模式排列,和小到一角硬币大小。
此芯片技术已成功用于许多情况。例如,业已在BRCA1基因、啤酒八叠球菌(S.cerevisiae)突变品系和HIV-1病毒的蛋白酶基因中对突变进行了筛选(Hacia等,1996;Shoemaker等,1996;Kozal等,1996)。Affymetrix(GeneChipTM)、Hyseq(HyChip和HyGnostics)和Protogene实验室已经定制的基础上制造出用来检测双等位多态性的各种模式的芯片。
通常,这些方法都采用了与个体的靶核酸序列区段互补的多核苷酸探针阵列,靶序列包括多态性标记。EP 785280描述了一种用来检测单一核苷酸多态性的排铺策略(tiling strategy),在此将其全文并入以供参考。简单地说,所谓“排铺(tiling)”一般指合成一组多核苷酸探针,此组探针由与感兴趣的靶序列互补的序列以及预先选定的该序列的变体构成,即用一组基础核苷酸的一个或多个成员取代一个或多个给定的位点。排铺策略的进一步描述见PCT申请WO 95/11995中。在一具体方面,阵列是由特异性的已鉴定的双等位标记序列排铺成的。特别地,排铺成的阵列包括许多检测模块(detection block),每个模块对特定的双等位标记或一组双等位标记是特异的。例如,将检测模块排铺成包括许多探针,这些探针跨越包括特定多态性的序列区段。为确保探针与各个等位基因互补,探针按不同的双等位标记成对合成。除了多态性碱基不同的探针外,单取代的探针通常也可被排铺在检测模块内。这些单取代的探针含有的碱基等于或超过被残余核苷酸(选自A、T、G、C和U)取代的多态性两方向上确定数目的碱基。通常,排铺在检测模块内的探针将包括序列位置的取代,包括离双等位标记5个碱基内的位置。单取代的探针为排铺阵列提供了内部对照,以将实际的杂交与人为因素造成的杂交区分开。与靶序列杂交并洗涤阵列后,扫描该阵列以检测阵列上与靶序列杂交的位置。然后分析通过扫描阵列获得的杂交数据以鉴定样品中存在双等位标记的那个等位基因或哪些等位基因。杂交和扫描可按PCT申请WO 92/10092和WO 95/11995以及美国专利5,424,186的描述进行。
因此,在一些实施方案中,所述芯片可包含长约15个核苷酸片段的核酸序列阵列。在其它实施方案中,所述芯片可包含至少含有选自表1所列扩增子的序列以及与它互补的序列或其片段的阵列,所述片段含有至少约8个连续核苷酸,较好10、15、20个,最好25、30、40、47或50个连续的核苷酸并包括多态性碱基。在优选的实施方案中,多态性碱基在所述多核苷酸中央5、4、3、2、1个核苷酸内,最好在所述多核苷酸中心。在一些实施方案中,所述芯片可含有至少2、3、4、5、6、7、8或更多个本发明多核苷酸的阵列。固态支持物和附着于固态支持物的本发明的多核苷酸进一步描述见“寡核苷酸探针和引物”一节。
6)集成系统
另一种可用来分析多核苷酸的技术包括多组分集成系统,该系统微型化和分隔化诸如PCR和毛细管电泳反应等过程于一功能性装置内。这种技术的一个例子描述见美国专利5,589,136,在此将其全文并入以供参考,它描述了PCR扩增和毛细管电泳在芯片中的集成。
当使用微流体系统时可考虑使用集成系统。这些系统包括设计在玻璃、硅、石英或塑料晶片上的微通道模式,置于微芯片上。样品的移动受施加到微芯片不同区域的电力、电渗力或静水力控制,从而产生了功能性的带有不移动部分的显微阀门和泵。
为测定双等位标记的基因型,可将微流体系统和核酸扩增、微测序、毛细管电泳以及激光诱导的荧光检测等检测方法集合在一起。
使用本发明双等位标记进行遗传分析的方法
已有不同的方法可对复杂性状作遗传分析(参见Lander和Schork,1994)。用两种主要的方法研究了疾病易感性基因,这两种方法是:连锁法和关联法,在连锁法中用家族研究寻找一基因座和一假定的性状基因座之间的共分离的证据,在关联法中寻找一等位基因和一性状或造成性状的等位基因之间在统计学上显著相关的证据(Khoury等,1993)。通常,本发明的双等位标记可用于此领域已知的任何方法以证明基因型和表型之间在统计学上的显著相关。该双等位标记可用于参数性或是非参数性的连锁分析法。优选地,本发明的双等位标记用来通过关联性研究鉴定与可检测性状有关的基因,关联性研究是一种不需要使用患病家族并可鉴定与复杂性状和散发性状有关的基因的方法。
可以任何规模用本发明的双等位标记进行遗传分析。可以使用与候选基因相应的整套本发明的双等位标记或本发明双等位标记的任何亚组。此外,可以使用包括本发明双等位标记的任何一组遗传标记。WO 98/20165描述了一组双等位多态性,它可用作与本发明的双等位标记结合使用的遗传标记。如上所述,应注意的是,本发明的双等位标记可包括在人类基因组的任何完整或部分遗传图谱中。在本发明和权利要求书中特别要求了这些不同的用途。
连锁分析
连锁分析以建立遗传标记和特定性状在家族内各后代中的传递之间的相关性为基础。因此,连锁分析的目标是检测显示与谱系中感兴趣性状共分离的标记基因座。
参数性方法
当数据是获自连续后代时,就有机会研究成对基因座之间的连锁程度。对重组部分的估计可使基因座排序并被置于遗传图谱中。当基因座是遗传标记时就可建立遗传图谱,然后可以计算出标记和性状之间的连锁强度,并可用此强度来表示标记和造成那些性状的基因的相对位置(Weir,1996)。经典的连锁分析方法是差距评分(oddsscore)对数法(Lod)(参见Morton,1995;Ott,1991)。差距评分的计算需要详细规定疾病的遗传模式(参数性方法)。通常,用连锁分析鉴定的候选区域的长度在2-20Mb之间。一旦按上述方法鉴定了候选区域,就可用其它标记分析重组个体以进一步描绘候选区域。连锁分析研究通常有赖于最多5,000微卫星标记的使用,这就将连锁分析的理论上可达到的最大分辨率限制在平均约600kb。
已经成功运用连锁分析来绘制简单遗传性状的图谱,这些性状显示出清晰的孟德尔杂交模式并有高外显率(即等位基因α的阳性性状携带者的数目与人群中α携带者总数的比例)。然而,参数性连锁分析有许多缺点。首先,它会受到依赖于对适合各个被研究性状的遗传模式进行选择的限制。此外,如上所述,用连锁分析可得到的分辨率也是有限的,同时它需要进行互补研究以细化对2Mb-20Mb典型区域的分析,该区域最初是通过连锁分析鉴定的。此外,当用于复杂的遗传性状,参数性连锁分析被证明有困难,比如由于多基因和/或环境因素联合作用造成的性状。在差距评分分析中,很难充分建立这些因素的模型。这时,需要巨大努力和花费来征集对这些情况进行连锁分析所需的足够的患病家族成员,如Risch和Merikangas(1996)最近所描述的那样。
非参数性方法
所谓连锁分析的非参数性方法的优点在于,它们不需要特别规定疾病的遗传模式,就分析复杂性状而言它们更加有效。在非参数性方法中,通过显示患病亲属继承的该区域的相同拷贝比预期的多,我们试图证明染色体区域的遗传模式与随机孟德尔分离不一致。即便存在不完全外显率和多基因遗传,患病亲属应显示过份的“等位基因分摊”。在非参数性连锁分析中,可通过状态相同的等位基因(alleles identical bystate)(IBS)的数目或通过世系相同的等位基因(alleles identical by descent)(IBD)的数目来衡量两个个体中标记基因座的一致性程度。患病亲属配对分析(affected sibpair analysis)是众所周知的特别情况,并且是这些方法最简单的形式。
本发明的双等位标记可用于参数性和非参数性连锁分析。优选的双等位标记可用于非参数性方法,以用来绘制与复杂性状有关的基因的图谱。本发明的双等位标记可用在IBD-和IBS方法中以绘制影响复杂性状的基因的图谱。在这种研究中,通过利用高密度双等位标记,可将几个毗邻的双等位标记基因座合并以实现用多等位基因标记得到的效果(Zhao等,1998)。
人群关联性研究
本发明包括采用本发明的双等位标记鉴定CanIon基因是否与某可检测性状关联的方法。在本发明的一个实施方案中,包含检测双等位标记的等位基因或双等位标记单倍型和性状之间的关联性方法。此外,本发明还包括鉴定引起性状的等位基因与本发明的任何双等位标记的等位基因连锁失平衡的方法。
如上所述,可用来进行关联性研究的其它方法有:基因组宽(genome-wide)关联性研究、候选区域关联性研究和候选基因关联性研究。在优选的实施方案中,本发明的双等位标记被用来进行候选基因关联性研究。当可得到一些与所述性状的生物学有关的信息时,候选基因分析可清楚提供鉴定与特定性状相关的基因和基因多态性的简便方法。此外,本发明的双等位标记可加入人类基因组的遗传标记图中以进行基因组宽关联性研究。美国临时申请序列号60/082,614描述了产生双等位标记高密度图谱的方法。本发明的双等位标记还可加入基因组特定候选区域(例如特定的染色体或特定的染色体片段)的图谱中。
如上所述,关联性研究可在一般人群中进行,而不限于在患病家族的相关个体上进行研究。当关联性研究可分析散发或多因素性状时它将极有价值。此外,与连锁研究相比,关联性研究提出了更有力的精细绘图方法,能绘制出更加精细的引起性状的等位基因的图谱。基于系谱的研究仅仅缩小了引起性状的等位基因的位置范围。因此,可用本发明的双等位标记进行的关联性研究细化引起性状的等位基因在连锁分析方法所鉴定的候选区域中的位置。此外,一旦鉴定了感兴趣的染色体区段,如本发明的候选基因之类的候选基因在感兴趣的区域的存在可提供鉴定造成性状的等位基因的捷径。本发明的双等位标记可用来证明某一性状相关联的候选基因。本发明特别考虑了这种应用。
测定双等位标记的等位基因或双等位标记单倍型在人群中的频率
关联性研究探索了基因座之间若干组等位基因频率的关系。
测定人群中等位基因的频率
可用上述“鉴定个体双等位标记基因型的方法”一节所述的方法或任何适用于此目的的鉴定基因型的方法来测定人群中双等位标记的等位基因频率。鉴定基因型的合并样品或个体样品可用以测定双等位标记的等位基因在人群中的频率。一种减少所需的鉴定基因型数目的方法是使用合并的样品。使用合并的样品的一个主要的障碍在于合并时测定精确的DNA浓度的精确性和再现性。鉴定基因型的个体样品可提供较高的灵敏度、再现性和精确性;它是用于本发明的优选的方法。优选地,对各个个体分别测定基因型并用简单的基因计数来测定双等位标记的等位基因或单倍型在给定人群中的频率。
本发明还涉及评估人群中某等位基因频率的方法,所述方法包括:a)按本发明的方法鉴定所述人群的个体的所述双等位标记的基因型;b)测定所述人群中所述双等位标记的比例。此外,本发明的评估人群中某等位基因频率的方法包括带有进一步限制的方法,所述限制描述在本公开内容或以后的那些公开内容,无论是单独的或以任何形式组合的。任选地,所述CanIon相关双等位标记选自A1-A18及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,所述CanIon相关双等位标记选自A1-A17及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,所述CanIon相关双等位标记选自A12-A16及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,通过测定所述人群各个体基因组中存在的所述双等位标记两拷贝核苷酸的相同性,并计算该人群所述CanIon相关双等位标记上所述核苷酸的比例,可实现对人群中双等位标记的等位基因频率的测定;任选地,通过对来自所述人群代表性数目的个体或各个个体的合并的生物样品采用本发明的测定基因型的方法,并计算所述核苷酸占总数的比例,可实现对该比例的测定。
测定人群中单倍型的频率
当二倍体个体在一个以上基因座上是杂合性时不知道单倍型的配子期。利用家族的系统树信息有时可能推断出配子期(Perlin等,1994)。当得不到系统树信息时可使用不同的策略。一种可能的策略是通过分析排除多位点杂合二倍体,仅保留纯合子和单位点杂合子个体,但这种方法可能会在样品组合物中导致可能的偏差和低估低频率的单倍型。另一种可能的策略是独立研究各个染色体,例如,通过不对称PCR扩增(参见Newton等,1989;Wu等,1989)或在PCR扩增后通过有限稀释分离各个染色体(参见Ruano等,1990)。此外,通过对特定的等位基因进行双PCR扩增可测定样品中非常接近的双等位标记的单倍型(Sarkar,G.和Sommer S.S.,1991)。这些方法因为技术复杂、花费高、缺乏大范围的归纳或可能造成偏差而不是完全令人满意。为克服这些缺点,可使用Clark,A.G.(1990)介绍的推断PCR-扩增的DNA基因型的阶段的算法。简单地说,其原则是通过检测明确的个体(即完全的纯合子和单位点杂合子)开始填写样品中存在的单倍型的初步列表。然后筛选同一样品中其它个体中可能产生的已被识别的单倍型。对于每个阳性鉴定结果,在已被识别的单倍型列表中加入互补的单倍型,直到所有个体的阶段信息被分辨或被鉴定为未分辨的。这种方法为各个多杂合个体指定了单一的单倍型,而当有多个杂合位点时几种单倍型也是可能的。或者,我们可用估计人群的单倍型频率而不指定各个个体的单倍型的方法。优选地,可采用基于期望值-最大值(EM)算法的方法(Dempster等,1977),将得到在Hardy-Weinberg比例(随机配对)假说下的单倍型频率的最大可能性估算值(参见Excoffier L.和SlatkinM.,1995)。EM算法是一种归纳的最大可能性迭代估算方法,可用于数据不清楚和/或不完整时。EM算法被用来分辨杂合子成为单倍型。单倍型估计进一步的描述见“统计学方法”一节。也可以使用此领域已知的测定或估计人群中单倍型频率的其它方法。
本发明还包括估计人群中一组双等位标记的单倍型频率的方法,该方法包括以下步骤:a)按本发明的方法测定所述人群中各个个体至少一个CanIon相关的双等位标记的基因型;b)测定所述第二个双等位标记的基因型,方法是对于所述人群各个个体基因组中存在的所述第二个双等位标记的两个拷贝,测定所述第二个双等位标记上核苷酸的相同性;以及c)将单倍型测定方法应用于步骤a)和b)中测定的核苷酸的相同性,以获得所述频率的估算值。此外,本发明的估计单倍型频率的方法包括具有进一步限制的方法,这种限制描述在本公开内容或以后的那些公开内容中,无论是单独的或以任何形式组合的。任选地,其中所述CanIon相关双等位标记选自A1-A18及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,所述CanIon相关双等位标记选自A1-A17及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,所述CanIon相关双等位标记选自A12-A16及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,所述单倍型测定法是通过不对称PCR扩增、特定等位基因的双PCR扩增、Clark算法或期望值-最大值算法进行的。
连锁失平衡分析
连锁失平衡是两个或多个基因座上等位基因的非随机关联,它是绘制与疾病性状有关的基因图谱的有力工具(参见Ajioka R.S.等,1997)。由于双等位标记密集分布在人类基因组中,且与其它类型的遗传标记(如RFLP或VNTR标记)相比可大量测定它们的基因型,因此它们对基于连锁失平衡的遗传分析特别有用。
当先在人群中引入疾病突变时(通过新的突变或突变载体的迁入),它必然位在于一个染色体上并因此位于连锁标记的一个“背景”或“祖先”单倍型上。随后,这些标记和疾病突变之间发生完全失平衡:有人发现疾病突变仅存在于一特定的标记等位基因组中。通过随后的传代,在疾病突变和这些标记多态性之间发生重组,失平衡现象逐渐消失。消失的步距是重组频率的函数,这样,与疾病基因最接近的标记与那些较远的标记相比显然有较高的失平衡水平。当未受重组打断时,“祖先”单倍型和不同基因座的标记等位基因之间的连锁失平衡,不仅可以通过谱系而且可以通过人群追踪。连锁失平衡通常被看作是一个基因座的一个特定等位基因和第二个基因座的另一个特定等位基因之间的相关性。
预计疾病和标记基因座之间的失平衡模式或曲线显示最大值发生在疾病基因座上。因此,疾病等位基因和紧密连锁的遗传标记之间连锁失平衡的量,可产生有价值的有关于此疾病基因位置的信息。对于疾病基因座的精细图谱,了解一些存在于研究区域内标记之间的有关连锁失平衡模式的知识是有用的。如上所述,通过这种连锁失平衡分析得到的图谱分辨率比连锁研究高得多。与连锁失平衡分析联合的高密度双等位标记为精细作图提供了有力工具。用来计算连锁失平衡的其它方法描述见下面“统计学方法”一节。
基于人群的性状-标记关联性的病例-对照研究
如上所述,成对的特定等位基因在同一染色体上不同基因座的出现不是随机的,与随机的偏差称为连锁失平衡。关联性研究关心的是人群频率并依赖于连锁失平衡现象。如果某给定基因中的特定等位基因直接造成某特定性状,当与该性状阴性人群或随机对照人群中的频率相比时,其频率在患病(性状阳性)人群中将有统计学上的增加。作为存在连锁失平衡的结果,与阴性性状个体或随机对照相比,阳性性状个体中,携带有引起该性状的等位基因的单倍型中存在的所有其它等位基因的频率也会升高。因此,此性状和带有引起该性状的等位基因的任何连锁失平衡的等位基因(尤其是双等位标记的等位基因)之间的关联性,将足以提示该特定区域中存在性状相关的基因。可测定病例-对照人群双等位标记的基因型以鉴定引起性状的等位基因部位缩小的关联性。由于任何与给定的与某一性状关联的标记连锁失平衡的标记,将与此性状关联。连锁失平衡使得可以分析病例-对照人群中数目有限的遗传多态性(尤其是双等位标记)的相对频率,作为筛选所有可能的功能多态性以寻找引起该性状的等位基因的另一种方法。关联性研究比较了非相关的病例-对照人群中标记等位基因的频率,它是剖析复杂性状的有力工具。
病例-对照人群(包括标准)
基于人群的关联性研究不考虑家族遗传,但比较了病例-对照人群中一具体遗传标记或一组标记的普遍程度。它们是基于比较非相关病例(患病或阳性性状)个体和非相关对照(未患病、阴性性状或随机)个体的病例-对照研究。优选的对照组由未患病或阴性性状的个体构成。此外,对照组与病例人群在种族上是匹配的。此外,研究时,对照组和病例人群在已知的性状主要混淆因子上最好是匹配的(例如,对于年龄依赖的性状应做到年龄匹配)。理想的是,这两个样品中的个体以这样的方式配对:它们只在疾病状态上有差别。术语“阳性性状人群”、“病例人群”和“患病人群”在本文可以互换使用。
用关联性研究剖析复杂性状的一个重要步骤是病例-对照人群的选择(参见Lander和Schork,1994)。选择病例-对照人群的主要步骤是在给定性状或表型的临床定义。通过小心选择阳性性状和阴性性状表型组的个体,用本文提出的关联性方法可分析任何遗传性状。经常使用的标准有4个:临床表型、发病年龄、家族史和严重程度。连续或定量性状(如血压)的选择方法包括选择所研究性状的表型分布在两个极端的个体,这样包括具有不重叠表型的这些阳性性状和阴性性状人群个体。优选地,病例-对照人群包括表型上类似的人群。阳性和阴性性状人群包括表型相同的个体人群,各占研究人群总数的1-98%,较好为1-80%,再好为1-50%,更好为1-30%,最好为1-20%,优选在显示不重叠表型的个体中进行选择。两种选择表型之间的差别越大,检测到双等位标记关联性的概率就越大。选择那些差异很大但相对均一的表型可在关联性研究中进行有效的比较,以及可能检测到遗传水平的显著差异,只要被研究人群的样本大小足够在。
在优选的实施方案中,根据表型,征集有50-300名阳性性状个体,优选约100名个体的第一组。此研究中应包括类似数目的对照个体。
关联性分析
本发明还包括测定基因型和表型之间关联性的方法,该方法包括以下步骤:a)按本发明测定基因型的方法确定阳性性状人群中至少一个CanIon相关的双等位标记的频率;b)按本发明测定基因型的方法确定对照人群中所述CanIon相关的双等位标记的频率;以及c)确定所述基因型和所述表型之间是否存在统计学显著的关联性。此外,本发明的测定基因型和表型之间关联性的方法还包括带有进一步限制的方法,如本公开内容或以后的那些公开内容中所述,无论是单独的或以任何形式组合的。任选地,其中所述CanIon相关双等位标记选自A1-A18及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,所述CanIon相关双等位标记选自A1-A17及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,所述CanIon相关双等位标记选自A12-A16及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,所述对照人群可以是阴性性状人群或是随机人群;任选地,所述测定基因型的步骤a)和b)可在所述人群的每一个人的合并的生物样品一进行;任选地,所述测定基因型的步骤a)和b)都可在所述人群的每个人的生物样品上或其次样品上进行。
采用携带有候选基因区域衍生的双等位标记进行关联性研究的一般方法,是扫描两组个体(病例-对照人群)以测量并作统计学比较两组中本发明双等位标记的等位基因频率。
如果至少有一个或更多被分析的双等位标记与所鉴定性状在统计学上是显著相关的,我们就可假定:此关联的等位基因之-直接负责造成该性状(即相关的等位基因是造成该性状的等位基因),或者更可能,该相关等位基因与造成该性状的系统基因连锁失平衡。相关等位基因对候选基因功能的特征性质通常可进一步了解相关等位基因和性状之间的相互关系(因果或连锁失平衡)。如果有证据表明候选基因中的相关等位基因很可能不是造成该性状的等位基因但与实际造成该性状的等位基因连锁失平衡,则可通过测序附近的关联性标记发现造成该性状的等位基因,并可用发现的相互影响方式的多态性进行进一步的关联性研究。
关联性研究通常以两个连续步骤进行。第一阶段,检测阳性性状和对照人群中来自候选基因的减少数目的双等位标记的频率。第二阶段,用有关区域的高密度标记将负责给定性状的基因座的位置进一步细化。然而,如果被研究的候选基因的长度相对较小,如CanIon,则一个阶段就可能足以建立显著的相关性。
单倍型分析
如上所述,由于突变或迁入的结果在人群中第一次出现携带疾病等位基因的染色体时,该突变的等位基因必然位于具有一组连锁标记(祖先单倍型)的染色体上。这种单倍型可通过人群追踪并可分析它与某给定性状的统计学关联性。将单位点(等位基因)关联性研究和多位点关联性研究互补,也称为单倍型研究,可增加关联性研究的统计学力度。因此,单倍型关联性研究可用来明确祖先载体单倍型的频率和类型。单倍型分析的重量性在于它提高了涉及各个标记的分析的统计学力度。
在单倍型频率分析的第一阶段,确定了可能的单倍型的频率,这些单倍型是基于已鉴定的本发明双等位标记的各种组合的。然后比较单倍型频率以辨别阳性性状人群和对照个体。应该对阳性性状个体的数目进行分析以得到统计学上显著的结果(通常在30-300之间),采用优选数目的个体(50-150名)。研究中将同样考虑应用于一定数目的未患病个体(或随机对照)。第一次分析的结果提供了病例-对照人群的单倍型频率,对每个估算出的单倍型频率计算了p-值和差距率(odd ratio)。如果发现有统计学上显著的关联性,则可大致估算出携带给定单倍型的个体受所研究的性状影响的相对风险。
本发明的另一实施方案包括检测单倍型和表型之间关联性的方法,该方法包括以下步骤:a)按本发明估算单倍型频率的方法估计阳性性状人群中至少一种单倍型的频率;b)按本发明估算单倍型频率的方法估计对照人群中所述单倍型的频率;以及c)确定所述单倍型和所述表型之间是否存在统计学显著相关性。此外,本发明的测定单倍型和表型之间相关性的方法,还包括具有进一步限制的方法,其描述见本公开内容或以后的那些公开内容中,无论是单独的或以任何形式组合的。任选地,其中所述CanIon相关双等位标记选自A1-A18及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,所述CanIon相关双等位标记选自A1-A17及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,所述CanIon相关双等位标记选自A12-A16及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,所述对照人群可以是阴性性状人群或是随机人群;任选地,所述测定基因型的步骤a)和b)可在所述人群的每一个人的合并的生物样品上进行;任选地,所述方法还包括在步骤c)之前测定所述阳性性状人群和所述对照人群的单倍型的额外步骤。
相互作用分析
本发明的双等位标记也可用来鉴定与多基因相互反应而导致的可检测性状相关联的双等位标记的模式。非连锁基因座上的等位基因之间的遗传相互作用的分析,需要采用本文所述的技术测定个体的基因型。在选出的一组双等位标记中以合适的统计显著性水平进行的等位基因相互作用的分析,可被认为是单倍型分析。相互作用分析包括根据第一基因座某给定的单倍型将病例-对照人群分类,并用第二基因座对各个亚群进行单倍型分析。
下面将进一步描述关联性研究所用的统计学方法。
存在关联性时的连锁试验
本发明的双等位标记还可用于TDT(传递/失平衡试验)。TDT可同时检测连锁和关联,且不会受到人群分类的影响。TDT需要患病个体和他们的父母的数据或未患病胞亲而不是父母的数据(参见Spielmann S.等,1993;Schaid D.J.等,1996,SpielmannS.和Ewens W.J.,1998)。这种联合试验通常可降低单独分析产生的假阳性误差(false-positive error)。
统计学方法
通常,可以使用任何此领域已知的方法来测试性状和基因型是否显示统计学显著相关。
1)连锁分析中所用的方法
统计学方法和对连锁分析有用的计算机程序是此领域技术人员熟知的(参见Terwilliger J.D.和Ott J.,1994;Ott J.,1991)。
2)估计人群单倍型频率的方法
如上所述,当对基因型评分时,通常不可能区别杂合子,因此不易推断出单倍型的频率。当不知道配子期时,可从多基因座的基因型数据估计单倍型频率。可用此领域技术人员熟知的任何方法来估计单倍型频率(参见Lange K.,1997;Weir,B.S.,1996)。优选地,可用期望值-最大值(EM)算法(参见Dempster等,1997;Excoffier L.和Slatkin M.,1995)计算最大可能性单倍型频率。这种方法是一种迭代方法,其目标是当配子期未知时从多基因座的基因型数据得到单倍型频率的最大可能性估算值。单倍型估算通常是通过EM算法用(例如)EM-HAPLO程序(Hweley M.E.等,1994)或Arlequin程序(Schneider等,1997)进行的。EM算法是一种归纳的最大可能性迭代估算法,将在下面简要描述。
请注意在本发明“估计人群单倍型频率的方法”一节中,表型是指具有未知单倍型期的多基因座基因型。基因型是指具有已知单倍型期的多基因座基因型。
假设我们有按标记K分类的N个非相关个体的样品。观察到的数据是未知阶段的K-基因座表型,可用不同的表型F将其分类。此外,假设我们有可能的单倍型H(如果是双等位标记K,则我们有最大数目的可能的单倍型H=2K)。
对于带有可能的基因型cj的表型j,我们有
P j = Σ i = 1 c j P ( genotype ( i ) ) = Σ i = 1 c j P ( h k , h l ) · 等式1
其中Pj是表型jth表型的概率,P(hk,hl)是由单倍型hk和hl组成的基因型ith的概率。在随机匹配(即Hardy-Weinberg平衡)时,P(hk,hl)可表达为
P(hk,hl)=P(hk)2,其中hk=hl,和
P(hk,hl)=2P(hk)P(hl),其中hk≠hl                  等式2
E-M算法包括以下步骤:首先,用一组单倍型频率的初始值估算基因型频率。这些单倍型频率可表示为P1 (0)、P2 (0)、P3 (0)、……PH (0)。可从随机数目产生器或用此领域熟知的其它方法获得单倍型频率的初始值。这一步骤被成为期望值步骤。此方法的下一步骤称为最大值步骤,包括对基因型频率进行估算以重新计算单倍型频率。单倍型频率的第一次迭代估算值表示为P1 (1)、P2 (1)、P3 (1)、……PH (1)。通常,sth迭代时的期望值步骤包括根据以前迭代所得的单倍型频率计算将各个表型置于不同的可能基因型中的概率:
P ( h k , h l ) ( s ) = n j N [ P j ( h k , h l ) ( s ) P j ] 等式3
其中nj是具有表型jth的个体数目,P(hk,hl)(s)是表型j中基因型hk和hl的概率。在最大值步骤(等价于基因计数法(Smith,Ann.Hum.Genet.,21:254-276,1957))中,单倍型频率是根据基因型估算值重新估算的:
P t ( s + 1 ) = 1 2 Σ j = 1 F Σ i = 1 c j δ it P j ( h k , h l ) ( s ) 等式4
这里,δit是指示物变量,它计数基因型ith中存在的单倍型t的产生数;它可取0、1和2的值。
当达到以下标准时就可以终止E-M迭代。用最大可能性估算(MLE)理论,我们假定表型j以多项式分布。在每次迭代s时,我们可计算出可能性函数L。当两次串行迭代之间的概率的log值差异小于一些很小的数值时,优选10-7,实现了收敛性。
3)计算标记之间连锁失平衡的方法
可以用许多方法来计算任何两个遗传位点之间的连锁失平衡,实践中,连锁失平衡是通过将统计学相关检验应用于自人群采集的单倍型数据而衡量的。
按照Piazza公式可计算出等位基因的每种组合(ai,aj;ai,bj;bi,aj和bi,bj)的任何一对双等位标记之间的连锁失平衡,所述一对双等位标记包括至少一对本发明的双等位标记(Mi,Mj),它在标记Mi上具有等位基因(ai/bi),在标记Mj上具有等位基因(aj/bj),Piazza公式为:
Δaiaj=√θ4-√(θ4+θ3)(θ4+θ2),其中:
θ4=--=在Mi上没有等位基因ai且在Mj上没有等位基因aj的基因型频率
θ3=-+=在Mi上没有等位基因ai但在Mj上有等位基因aj的基因型频率
θ4=-+-=在Mi上有等位基因ai但在Mj上没有等位基因aj的基因型频率
也可按照如Weir(Weir B.S.,1996)所描述的对Δ(综合性基因型失平衡系数)的最大可能性估计(MLE),计算等位基因的每种组合(ai,aj;ai,bj;bi,aj和bi,bj)的一对双等位标记(Mi,Mj)之间的连锁失平衡(LD)。用于综合性连锁失平衡的MLE是:
Daiaj=(2n1+n2+n3+n4/2)/N-2(pr(ai).pr(aj))
其中n1=∑表型(ai/ai,aj/aj),n2=∑表型(ai/ai,bj/bj),n3=∑表型(ai/bi,aj/aj),n4=∑表型(ai/bi,aj/bj),N是样品中个体的数目。
这个公式可用于当只有基因型数据而没有单倍型数据时估计等位基因之间的连锁失平衡。
计算标记之间连锁失平衡的另一种方法如下。对一对满足Hardy-Weinberg平衡的双等位标记Mi(ai/bi)和Mj(aj/bj),我们可按照上述方法估计某给定人群中四种可能的单倍型的频率。
对ai和aj之间配子失平衡的估算是简单的:
Daiaj=pr(单倍型(aj,bj)-pr(ai).pr(aj)
其中pr(ai)是等位基因ai的概率,pr(aj)是等位基因aj的概率,pr(单倍型(aj,bj)按上述 等式3估算。
对一对双等位标记只需要测量一次失平衡以描述Mi和Mj之间的相关性。
然后按下述公式计算标准化值。
D’aiaj=Daiaj/max(-pr(ai).pr(aj),-pr(bi).pr(bj)),Daiaj<0
D’aiaj=Daiaj/max(pr(bi).pr(aj),pr(ai).pr(bj)),Daiaj<0
技术人员应该知道可以使用其它的连锁失平衡计算方法。
可通过测定50-1000名,优选75-200名,最好约100名非相关个体的基因型来确定具有足够杂合率的一组双等位标记间的连锁失平衡。
4)相关性检验
可用任何此领域已知的统计学检验以任何可接受的所需的统计学显著性阈值,来确定测定表型和基因型,此例中为双等位标记上的等位基因或由此类等位基因构成的单倍型之间相关性的统计学显著程度的方法。特定方法和显著性阈值的应用是此领域普通医师熟知的。
相关性检验是通过测定患病和对照人群中双等位标记的等位基因的频率并将这些频率与统计学检验进行比较,以确定频率是否有统计学上显著性差异而进行的,这种差异将表明性状和被研究的双等位标记的等位基因之间的相关性。类似地,单倍型分析是通过估算患病和对照人群中一组给定的双等位标记的所有可能的单倍型频率,并将这些频率与统计学检验进行比较,以确定该单倍型和被研究的表型(性状)之间是否有统计学上显著的差异而进行的。可使用任何可用于检测基因型和表型之间统计学显著相关性的的统计方法。所采用的优选的统计学检验是自由度为1的卡方测验。计算出P值(P值是等于或大于可能偶然发生的观察值的统计量的概率)。
统计学显著性
在优选的实施方案中,对于诊断目的,此种显著性是进一步诊断试验的肯定基础,或者是早期预防性治疗的初步起点,与双等位标记相关性有关的p值对单一个等位标记分析优选约为1×10-2或更小,更优选约为1×10-4或更小,对涉及两个或多个标记的单倍型分析,p值优选约为1×10-3或更小,更优选约为1×10-6或更小,最优选约为1×10-8或更小。这些值被认为可用于任何涉及一个或多个标记组合有关的性研究。
熟练技术人员可采用上面列出的数值作为起点以用本发明的双等位标记进行相关性研究。这样做可显示,本发明双等位标记的和性状之间的显著相关性并用于诊断和药物筛选目的。
表型改变
为确定上述第一阶段单倍型分析的统计显著性,进行进一步的分析是合适的,其中来自病例-对照个体的基因型数据被合并并根据所述性状表型将其打乱。将各个个体的基因型数据随机放在两组中,这两组有相同数目的个体和用来编译第一阶段所得数据的病例-对照人群。第二阶段的单倍型分析最好在人造组上进行,最好第一分析阶段的单倍型所包含的标记有最高的风险系数。这一试验至少被重复100-10000次。重复迭代可确定概率以得到偶然造成的试验单倍型。
统计学相关性的评估
为说明正误差问题,可用同样的病例-对照人群在随机遗传区域内进行类似的分析。用题为“Methods,Software And Apparati For IdentifyingGenomic RegionsHarboring A Gene Asociated With A Detectable Trait”,提交于1998年11月10日的美国序列号为60/107,986的待审美国临时专利申请中描述的方法比较随机区域候选区域的结果,在此将其全文并入以供参考。
5)危险因子的评估
通过差距比率(OR)和相对危险(RR)来确定危险因子(在遗传流行病学中,所述危险因素是在标记位置处存在或者缺乏特定等位基因或者单倍型标本)和疾病之间的联系。若P(R+)是对具有R的个体而言疾病发生的概率,P(R-)是无危险因素的个体的概率,那么相对风险就是两个概率的比率,即:
RP=P(R+)/P(R-)
在病例-对照研究中,由于取样设计,不能直接测量相对风险。但是,所述让步比提供对于低发病率的疾病相对风险的良好近似,并可以估算为:
OR = [ F + 1 - F + ] / [ F - ( 1 - F - ) ]
OR=(F+/(1-F+))/(F-/(1-F-))
F+是病例暴露于危险因素的频率,F-是对照暴露于危险因素的频率。F+和F-通过采用研究的等位基因或单倍型频率并根据基本的遗传模型(显性、隐性、附加等)来估算。
其一可以进一步估计特异危险性(AR),用于说明显示某给定的危险因素而改性状的个体在人群中的比例。这种措施在量化特定因子在病因学中的作用以及危险因素的公共健康影响方面是重要的。这种措施的公共健康相关性依赖于估计病例在人群中的比例。AR按如下所述确定:
AR=PE(RR-1)/(PE(RR-1)+1)
AR是归因于双等位标记等位基因或者双等位标记单倍型的危险。PE是很大程度上接触于人群中等位基因或者单倍型的频率。当研究的性状在一般人群中具有相对较低的发病率时,RR是相对危险与差距比率近似。
识别与本发明双等位标记连续失平衡的双等位标记
一旦在我们感兴趣的染色体组区域中识别出第一双等位标记,使用本发明的论述,本领域的普通技术人员可以容易地识别和这种第一标记不均衡联接的其它双等位标记。如上所述,和性状相关的第一标记不均衡联接的任何标记将和所述性状相关。因此,一旦证实指定双等位标记和性状之间的关联,发现和这种性状相关的其它双等位标记是有极大兴趣的,以提高这种具体区域中双等位标记的密度。在显示和所述性状最高相关性的标记和一套标记的附近将发现所述因果基因或者突变。
识别和给定标记不均衡联接的其它标记涉及:(a)放大来自许多个体的包含第一双等位标记的基因片段;(b)识别在染色体组中躲藏所述第一双等位标记的第二双等位标记;(c)进行所述第一双等位标记和第二双等位标记之间联接不均衡性的分析;(d)选择与所述第一标记连续失平衡的所述第二双等位标记。也可以考虑包括步骤(b)和(c)的亚综合(subcombination)。
在本文中说明了鉴定双等位标记并进行连续失平衡分析的方法,并可以由技术人员在无需过多实验下进行。然后,本发明涉及与所述双等位标记A1-A18连续失平衡,并预计它们在分别与某给定性状的相关性上呈现类似特性的双等位标记。
功能性突变的鉴定
通过比较性状阳性和对照个体的的CanIon基因序列,可以鉴定CanIon基因中负责可检测表型或性状的突变。一旦证实了与本发明的双等位标记阳性关联,可以扫描所鉴定的位点有无突变。在优选的实施方案中,以扫描CanIon基因中的功能性区域如外显子、剪切位点、启动子和其它调控区无突变。在优选实施方案中,比较性状阳性者和对照个体的CanIon基因序列。性状阳性个体宜携带显示为与所述性状相关联的单倍型,而性状阴性个体不携带与所述性状相关联的单倍型或者等位基因。所述可检测的性状或者表型可以包括各种改变的CanIon功能的表现。
突变检测程序基本上和双等位标记鉴定中所用的类似。用于检测这种突变的方法通常包括如下的步骤:
-扩增包含性状阳性患者和性状阴性对照的DNA样品中与所述性状有关的双等位标记或者一组双等位标记的CanIon基因区域;
-对扩增区域进行测序;
-比较性状阳性个体和对照个体的DNA序列;
-确定性状阳性患者的特异性突变。
在一个实施方案中,所述双等位标记选自A1-A18,及其互补物。优选通过筛选较大的病人和对照人群以及借助本文所述的基因分型程序(宜为在个体试验形式中采用的微测序技术)验证候选的多形性。当在病例和对照中与预期的关联结果一致的频率存在时,多形性认为是候选的突变。当它们与可检测表型显示有统计学上显著相关联性时,多形性认为是候选的“导致性状”的突变。
在基因诊断方法中本发明的双等位标记
本发明的CanIon核酸序列和双等位标记也可以用于开发诊断试验,所述诊断试验能够鉴定由于特定基因型而表达可检测性状的个体或者其基因型使他们在随后时间内处于发生可检测性状危险的个体。这种诊断可以用于许多疾病或症状的分期、监测、预后和/或预防或者治疗,所述疾病或症状包括精神分裂症、双极情感障碍、以及其它CNS紊乱,如癫痫和疼痛疾病、心血管疾病,如心脏病、高血压、心律失常,以及许多其它疾病和症状。
本发明的诊断技术可以采用各种方法来测定受试者是否具有与产生可检测性状的增高危险相关的双等位标记模式,或者所述个体是否由于特殊的突变而患有可检测的性状,所述方法包括能分析个体染色体的单倍型,如家族研究、单精子DNA分析或者体细胞杂交。
本发明提供确定个体是否有发生疾病的危险或者患由于CanIon基因突变或者多形性而致的疾病的诊断方法。本发明也提供确定个体是否容易患精神分裂症和双极情感障碍,或者本领域或本文中已知的其它和钙通道有关的症状的方法。
这些方法涉及从个体获得核酸样品,并确定所述核酸样品是否含有至少一种等位基因或者至少一种双等位标记单倍型,表明有发生该性状的危险或表明个体表面由于具有特殊的CanIon多形性或突变(导致性状的等位基因)所致的性状。
在这种诊断方法中,优选从个体获得核酸样品,采用在“测定DNA样品基因型的双等位标记的方法”中所述的方法对样品进行基因型测定。此诊断以单一双等位标记或者一组双等位标记为基础。
在各方法中,从受试者获得核酸样品,并测定一种或多种双等位标记A1-A18的双等位标记模式。
在一个实施方案中,在核酸样品上进行PCR扩增,来扩增其中与业经鉴定的可检测表型相关的多形性。对扩增产物进行测序,来确定所述该个体是否拥有一种或多种与可检测表型相关的CanIon多形性。用于产生扩增产物的引物可以包含表1中所列的引物。或者,对核酸样品如上所述进行微测序反应,来确定该个体是否拥有一种或多种与可检测表型相关的CanIon多形态,此表型由于CanIon基因中的突变或者多形性而引起。用于微测序反应中的引物可以是表4中所列的引物。在另一实施方案中,将所述核酸样品与一种或多种等位基因特异性寡核苷酸探针接触,这些探针可与可检测表型相关的一种或多种CanIon等位基因进行杂交。用于此杂交试验的探针可以包括表3中所列的探针。在另一实施方案中,当与该等位基因的特异性寡核苷酸一起用于扩增反应时,使核酸样品与能产生扩增产物的第二CanIon寡核苷酸接触。扩增反应中扩增产物的存在表明该个体具有一种或多种与可检测表型相关的CanIon等位基因。
在一优选实施方案中,可以测定存在于至少一个双等位标记的核苷酸及其互补物的身份,所述双等位标记选自A1-A18及其互补物,可检测的性状是精神分裂症和双极情感障碍。诊断试剂盒包括本发明的任一多肽。
由于在某些情况下利用它们引发预防性治疗或者允许个体携带显著的单倍型来预见警告信号如次要征兆,这种诊断方法极其有价值。
分析和预测对药物的反应或者药物副作用的诊断可以用于确定个体是否应服用具体的药物进行治疗。例如,若诊断表明个体对用某具体药物治疗可能呈正反应,那么可将此药给该个体服用。相反,若诊断表明个体可能对某具体药物的治疗呈负反应,可以给予另一种治疗。负反应可以定义为不存在具体的药物。此药物可以给个体服用。相反地,若诊断表明个体可能对具体药物治疗呈负反应,那么可以规定任选的治疗过程。负反应可以定义为不存在有效的反应或者存在毒副作用。
临床药物试验表示本发明标记的另一用途。使用上述方法可以识别对作用于精神分裂症或者双极情感障碍或者另一钙通道关联征兆的试剂或者对作用于精神分裂症或双极情感障碍或另一钙通道关联征兆的副作用发生反应的一种或多种标记暗示。因此,这种试剂在临床试验中可以筛选潜在的参与者,以鉴定那些对该药物最可能产生有利反应的个体,并排除那些可能引起副作用的个体。以那种方式,可以测量对药物产生正反应的个体中药物治疗的有效性,而不会因为包括了不可能在研究中产生正反应的个体而降低测量措施,且不会冒不适宜的安全问题的风险。
在尤其优选的实施方式中,可用本诊断方法分析的性状是精神分裂症或双极情感障碍。但是,本发明也包括本文所述预防、诊断、控制以及治疗的相关紊乱症,尤其是有关CNS症的方法中使用本发明双等位标记的预防、诊断、预后以及治疗方法。至于实施例,相关的症状可以包括精神病、情感障碍症、孤独症、药物依赖症和酗酒、疼痛症、癫痫症、精神发育不全以及其它精神病包括认知能力、焦虑、多食、冲动控制以及病态人格等,如Diagnosis and Statistical Mantal Disorder,第四版(DSM-IV)中所定义的。其它症状包括心脏血管疾病,如心绞痛、高血压或者心律失常。
重组载体
本文所用的术语“载体”指环状或线性DNA或RNA分子,这些分子可以是双链或单链,包含至少一个感兴趣的多核苷酸,被转移到细胞宿主或单细胞或多细胞生物体内。
本发明包括一个家族的重组载体,其含有衍生自CanIon基因组序列的调节性多核苷酸、和/或CanIon基因组序列或cDNA序列的编码多核苷酸。
本发明的重组载体通常包括本文所述的任何一种多核苷酸,包括调节序列、编码序列和多核苷酸构建物以及上述任何一种CanIon引物或探针。更具体地说,本发明的重组载体可包括“CanIon基因的基因组序列”部分、“CanIon cDNA序列”部分、“编码区”部分、“多核苷酸构建物”部分和“寡核苷酸探针和引物”部分所述的任何一个多核苷酸。
在第一个优选实施例中,用本发明的重组载体扩增插入的衍生自SEQ ID No 1-3或6的CanIon基因组序列或CanIon cDNA的多核苷酸,例如在合适细胞宿主中的SEQID No 4cDNA,每次重组载体复制时都会扩增这个多核苷酸。
本发明重组载体的第二优选实施例包括含有本发明的调节性多核苷酸或编码核酸或二者的表达载体。在一些实施例中,用表达载体表达CanIon多肽,然后可纯化并且,例如,用于配体筛选试验中或用作免疫原,以产生抗CanIon蛋白质的特异性抗体。在另一些实施例中,用此表达载体构建转基因动物及用于基因治疗。表达需要在载体中提供适当信号,所述信号包括各种调节元件,如来自病毒和哺乳动物的增强子/启动子,驱动感兴趣的基因在宿主细胞表达。本发明的表达载体通常包括显性药物选择标记,其用于建立表达产物的永久性稳定细胞克隆,这是因为它们是将药物选择标记表达与多肽表达相连接的元件。
更具体地说,本发明涉及表达载体,其包含编码CanIon蛋白质,最好是SEQ IDNo 5氨基酸序列的CanIon蛋白质或其变体或片段的核酸。
本发明涉及用于CanIon编码序列的重组表达载体,其中所述载体包含SEQ ID No4核酸。
包含含有CanIon相关双等位标记的核酸的重组载体也是本发明的一部分。在优选的实施方案中,所述双等位标记选自A1-A18及其互补物。
以下部分将详细叙述在本发明的载体中可找到的一些元件。
本发明还包括脊椎动物,最好是哺乳动物特别是人来源的源代、次代和固定化的同源重组宿主细胞,这些细胞被基因工程改造:a)将外源(异源)多核苷酸插入到靶基因的内源染色体DNA中,b)删除内源染色体DNA,和/或c)用外源多核苷酸取代内源染色体DNA。插入、删除、和/或取代多核苷酸序列可以是靶基因和/或调节区的编码序列,如可操作性连接于靶基因的启动子和增强子序列。
本发明也涉及体内外同源重组宿主细胞的制备方法,其中改变了在细胞中不能正常表达的靶基因的表达。这种改变最好能在正常生长条件下或适合产生靶基因编码的多肽的条件下引起靶基因表达。这种方法包括以下步骤:(a)用一种多核苷酸构建物体内外转染细胞,该多核苷酸构建物包括:(i)靶序列;(ii)调节序列和/或编码序列;以及(iii)若需要,不成对的剪接供体位点,从而产生一种转染细胞;以及(b)在适合同源重组的条件下体内外保持此转染细胞。
本发明还涉及改变体内外细胞靶基因表达的方法,其中此基因在细胞中不能正常表达,该方法包括以下步骤:(a)用一种多核苷酸构建物体内外转染细胞,该多核苷酸构建物包括:(i)靶序列;(ii)调节序列和/或编码序列;以及(iii)若需要,不成对的剪接供体位点,从而产生转染细胞;以及(b)在适合同源重组的条件下体内外保持此转染细胞,从而产生一种同源重组细胞;以及(c)在适合该基因表达的条件下体内外保持此同源重组细胞。
本发明又涉及通过改变内源靶基因在体内外细胞中的表达来制备本发明多肽的方法,其中此基因在细胞中不能正常表达,该方法包括以下步骤:(a)用一种多核苷酸构建物体外转染细胞,该多核苷酸构建物包括:(i)靶序列;(ii)调节序列和/或编码序列;以及(iii)若需要,不成对的剪接供体位点,从而产生转染细胞;(b)在适合同源重组的条件下体内外保持该转染细胞,从而产生一种同源重组细胞;以及(c)在适合此一基因表达的条件下体内外保持该同源重组细胞,从而制备此多肽。
本发明还涉及改变靶基因在不能正常表达该基因的细胞类型中的表达的多核苷酸构建物。当该多核苷酸构建物插入到靶细胞染色体DNA中时就会发生这种情况,其中此多核苷酸构建物包括:a)靶序列;b)调节序列和/或编码序列;以及c)若需要,不成对的剪接供体位点。本发明也包括上述多核苷酸构建物,其中此构建物还包括编码一多肽、而且与染色体DNA同源重组后与内源靶基因同在读框内的多核苷酸。
可用本领域已知的技术制备该组合物及其实施方法,可参考以下专利:美国专利6,054,288、6,048,729、6,048,724、6,048,524、5,994,127、5,968,502、5,965,125、5,869,239、5,817,789、5,783,385、5,733,761、5,641,670、5,580,734;国际专利WO96/29411、WO 94/12650;以及科学论文包括Koller等,Proc.Natl.Acad.Sci.USA 86:8932-8935页,(1989年)。
1.本发明表达载体的一般特征
本发明的重组载体包括,但不限于,YAC(酵母人工染色体)、BAC(细菌人工染色体)、噬菌体、噬菌粒、粘粒、质粒或者甚至是线性DNA分子(包括染色体、非染色体、半合成和合成DNA)。这样一种重组载体可包含转录单位,该转录单位含有以下组合:
(1)在基因表达中起调节作用的遗传元件,,例如,启动子或增强子。增强子是顺式作用DNA元件,通常长10至300bp,作用于启动子以提高转录。
(2)转录成mRNA,而且最后翻译为多肽的结构性或编码序列,,所述结构性或编码序列与(1)所述的调节元件可操作性连接;以及
(3)合适的转录起始和终止序列。用于酵母或真核生物的表达系统的结构单位最好包括能够被宿主细胞胞外分泌的翻译蛋白质的前导序列。此外,当重组蛋白质在没有前导序列或转运序列的情况下得到表达时,它可包含N未端残基。该残基可或不可能在以后从已表达的重组蛋白质切割下来时,都可以产生终产物。
重组表达载体通常含有复制起点、使宿主细胞转化的选择标记、以及衍生自高度表达的基因以指导下游结构序列转录的启动子。在适当阶段用翻译起始和终止序列,最好是能够指导已翻译的蛋白质分泌到质间隙或胞外介质的前导序列,装配异源结构序列。在一具体实施例中,此载体适合在哺乳动物宿主细胞中转染和表达所需序列,优选载体含有在所需宿主中复制的起点、合适的启动子和增强子、以及必需的核糖体结合位点、聚腺苷酸化信号、剪接供体和受体位点、转录终止序列和5’旁侧非转录序列。可用衍生自SV40病毒基因组的DNA序列,例如SV40起始点、早期启动子、增强子、剪接和聚腺苷酸化信号来提供所需的非转录遗传元件。
可用SEQ ID No 5的CanIon多肽或其片段或变体的体内表达,以纠正与宿主生物中天然基因表达或与无生物活性的CanIon蛋白质的产生有关的遗传缺陷。
所以,本发明还包括重组表达载体,此载体主要设计用于在需要治疗的病人体内导入适当遗传材料,而在体内产生SEQ ID No 5的CanIon多肽或其片段或变体。可将这种遗传材料体外导入预先从生物体中取出的细胞中,然后将经过修饰的细胞再直接导入所述生物体内的适当组织。
2.调节元件
启动子
选择用于本发明表达载体的适当启动子区,要考虑必须能表达的细胞宿主。用于调控感兴趣核酸序列表达的特定启动子被认为并不重要,只要它能够指导该核酸在靶细胞中表达。因此,若人细胞是靶细胞,最好将核酸编码区置于能够在人细胞中得到表达的启动子,例如人或病毒启动子的附近和控制下。
适当的启动子就它调控表达的核酸而言可以是外源或与含有要表达的编码序列的天然多核苷酸是内源性的。此外,启动子就已插入构建物启动子/编码序列的重组载体序列而言通常是外源性的。
例如,可用CAT(氯霉素转移酶)载体,最好用pKK232-8和pCM7载体从任何所需基因中选择启动子区。
优选细菌启动子是LacI、LacZ、T3或T7噬菌体RNA聚合酶启动子、gpt、λ-PR、PL和trp启动子(欧洲专利EP 0036776)、多角体蛋白启动子、或杆状病毒的p10蛋白启动子(Kit Novagen)(Smith等,1983年;O’Reilly等,1992年)、λ-PR启动子或者trc启动子。
真核生物的启动子包括CMV立即早期、HSV胸苷激酶、早期和晚期SV40、逆转录病毒的LTRs以及小鼠金属硫蛋白-L启动子。本领域普通技术人员懂得如何选择适当载体和启动子。
选择启动子在基因工程领域技术人员能力之内。例如,可参看Sambrook等(1989年)的书或Fuller等(1996年)所述的步骤。
其它调节元件
若采用cDNA插入,一般希望包含聚腺苷酸化信号,使基因转录作适当的聚腺苷酸化。认为聚腺苷酸化信号的性质对本发明的成功实施影响不大,可采用任何这样一个序列,如人生长激素和SV40聚腺苷酸化信号。终止子也被认为是表达盒的一个元件。这些元件可用来提高信息水平,以及使从表达盒到其它序列的连读减至最小。
3.选择性标记
这些标记赋予细胞一种可识别的变化,以便较易鉴定含有表达构建物的细胞。选择转化宿主细胞的选择账标记基因最好是二氢叶酸还原酶或抗真核细胞培养基新霉素、啤酒酵母或四环素的TRP1、抗大肠杆菌(大肠杆菌)的利福霉素或氨苄青霉素、或分枝菌的左聚糖蔗糖酶,后一种标记是负选择标记。
4.优选的载体
细菌载体
作为一种代表性但无限制作用的例子,在细菌应用上有用的表达载体可含有选择性标记和细菌复制起点,其衍生自包含pBR322遗传元件(ATCC 37017)的市售质粒。例如,这些市售载体包括pKK223-3(Pharmacia,Uppsala,瑞典)以及GEM1(PromegaBiotec,Madison,WI,美国)。
有许多其它合适的市售载体是本领域技术人员所知道的,如以下细菌载体:pQE70、pQE60、pQE-9(Qiagen)、pbs、pD10、phagescript、psiX174、pbluescript SK、pbsks、pNH8A、pNH16A、pNH18A、pNH46A(Stratagene);ptrc99a、pKK223-3、pKK233-3、pDR540、pRIT5(Pharmacia);pWLNEO、pSV2CAT、pOG44、pXT1、pSG(Stratagene);pSVK3、pBPV、pMSG、pSVL(Pharmacia);pQE-30(QIAexpress)。
噬菌体载体
P1噬菌体载体可包含在大约80至100kb范围的大插入片段。
Sternberg(1992和1994年)叙述了P1噬菌体载体如p158或p158/neo8的构建。可设计含有CanIon核苷酸序列的重组P1克隆,插入了40kb以上的大多核苷酸(Linton等1993年)。为了制备转基因实验用的P1DNA,优选方案是McCormick等(1994年)提出的方案。简单地说,将含有P1质粒的大肠杆菌(最好是NS3529株)在含有25μg/ml卡那霉素的适当肉汤培养基中培养过夜。用Qiagen质粒大抽试剂盒(Qiagen,Chatsworth,CA,美国)按照制造商的说明书通过碱裂解从大肠杆菌制备P1DNA。用试剂盒内的清洗和洗脱缓冲液在两根Qiagen-tip 500柱上从细菌裂解液中纯化得到P1DNA。进行苯酚/氯仿抽提,再用70%乙醇沉淀DNA。将DNA溶解在TE(10mMTris-HCl,pH 7.4,1mM EDTA)后,用光谱测量法评估DNA的浓度。
当目的是在转基因动物通常是转基因小鼠中表达含有CanIon核苷酸序列的P1克隆时,需要除去P1DNA片段的载体序列,例如,在P1多接头(polylinker)内的稀有切割位点(SfiI,NotI或SalI)上切割P1DNA。再用类似最初报道的用于将DNA与YACs分离的方法(Schedl等,1993年;Peterson等,1993年),从脉冲场琼脂糖凝胶上的载体序列纯化得到P1插入片段。在此阶段,若需要,可在MilliporeUltrafree-MC过滤装置(Millipore,Bedford,MA,美国,限为30,000分子量)上浓缩所得的纯化插入片段DNA,然后,在微透析膜(VS型,0.025μM,购自Millipore公司)上以含有100mM氯化钠、30μM精氨、70μM亚精氨的微注射缓冲液(10mMTris-HCl,pH 7.4;250μMEDTA)透析。在1%琼脂糖(Sea Kem GTG;FMC Bio-products)脉冲场凝胶上电泳,以及用溴化乙啶染色评估纯化的P1DNA插入片段的完整性。
杆状病毒载体
SEQ ID No 5的CanIon多核苷酸或其片段或变体表达所用的适当载体,是可在昆虫细胞和昆虫细胞系中增殖的杆状病毒载体。特别适便的宿主载体系统是pVL1392/1393杆状病毒转移载体(Pharmingen),这种载体用于转染衍生自草地夜蛾(Spodoptera frugiperda)的SF9细胞系(ATCC N°CRL 1711)。
其它用于SEQ ID No 5CanIon多肽或其片段或变体在杆状病毒表达系统中表达的适当载体包括Chai等(1993年)、Vlasaki等(1983年)以及Lenhardi等(1996年)所述的载体。
病毒载体
在一具体实施例中,此种载体衍生自腺病毒。本发明的优选腺病毒载体是Feldman和Steg(1996年)或Ohno等(1994年)所述的腺病毒载体。本发明该具体实施例的另外一些优选重组腺病毒是人腺病毒2或5型(Ad 2 or Ad 5)或来自动物的腺病毒(法国专利申请FR-93.05954)。
一般认为,逆转录病毒载体以及腺相关病毒是,选来用于体内转移外源多核苷酸给哺乳动物包括人的重组基因运送系统。这些载体能有效地将基因运送给细胞,转移的核酸稳定整合在宿主染色体DNA中。
本发明体内外逆转录病毒基因运送载体的制备或构建,特别优选的逆转录病毒包括选自水貂细胞病灶诱导病毒、小鼠肉瘤病毒、网状内皮组织增殖病毒和罗斯肉瘤病毒(Rous Sarcoma virus)等逆转录病毒。特别优选的小鼠白血病病毒包括4070A和1504A病毒,Abelson(美国典型培养物保藏所(ATCC)编号为VR-999)、Friend(ATCC编号为VR-245)、Gross(ATCC编号为VR-590)、Rauscher(ATCC编号为VR-998)以及莫洛尼小鼠白血病病毒(ATCC编号为VR-190;PCT申请WO 94/24298)。特别优选的罗斯肉瘤病毒包括Bryan高滴定度(high titer)(ATCC编号为VR-334、VR-657、VR-726、VR-659和VR-728)。Roth等(1996年)、PCT申请WO 93/25234、PCT申请号WO 94/06920、Roux等(1989年),Julan等,1992年以及Neda等(1991年)也叙述了其它优选的转录病毒载体。
本发明考虑的另一种病毒载体系统包括腺相关病毒(AAV)。腺相关病毒是天然产生的缺损性病毒,它需要另一种病毒如腺病毒或疱疹病毒作为有效复制和增殖性生命周期的辅助病毒(Muzyczka等,1992年)。它也是可将其DNA整合入不分裂细胞中的病毒,显示出整合稳定、频率高(Flotte等,1992年;Samulski等,1989年;McLaughlin等,1989年)。腺相关病毒的一个优点在于对原代细胞的转导较转化的细胞效率较低。
BAC载体
Shizuya等(1992年)开发了细菌人工染色体(BAC)克隆系统,可以在大肠杆菌中稳定保持基因组DNA的大片段(100-300kb)。优选的BAC载体包括Kim等(1996年)所述的pBeloBAC11载体。以这种载体用经酶部分消化大小选择的基因组DNA制备BAC文库,可使基因组DNA与载体中的BamHI或HindIII位点连接。T7和SP6RNA聚合酶转录起始位点位于这些克隆位点侧面,可用其产生RNA转录或PCR方法所需的末端探针。在大肠杆菌中构建BAC文库后,从宿主细胞纯化超螺旋环的BAC DNA。在测定大小和将BAC导入受体细胞之前要将这些环状分子转变成线性型式。此克隆位点侧接两个NotI位点,通过NotI消化从载体上切下克隆片段。另外,用市售酶λ终止酶处理BAC载体,导致独特cosN位点切断,使包含在pBeloBAC11载体中的DNA插入片段线性化,但这种切割方法会产生含有插入DNA和BAS序列的全长BAC克隆。
5.重组载体的输送
为了使本发明多核苷酸和多核苷酸构建物有效表达,必须将这些构建物运送入细胞。这种输送可在体外实现,如在转化细胞系的实验步骤中,或者在体内或活体外现,如在治疗某些疾病状态时。
一种机制是将表达构建物包裹在感患性病毒粒子内进行病毒感染。
本发明也考虑了几种将多核苷酸转移到培养的哺乳动物细胞中的非病毒方法,包括但不限于,磷酸钙沉淀(Graham等,1973年;Chen等,1987年)、DEAE-葡聚糖(Gopal,1985年)、电穿孔(Tur-Kaspa等,1986年;Potte等,1984年)、直接显微注射(Harland等,1985年)、DNA装载脂质体(Nicolau等,1982;Fraley等,1979年)以及受体介导的转染(Wu和Wu,1987和1988年)。其中一些技术在体内外已获得成功应用。
一旦将表达多核苷酸输入细胞,它可稳定地整合入受体细胞的基因组中。这种整合可能在关连位置(cognate location),而且与同源重组(基因取代)的方向一致,或者它可随机整合入非特定位置(基因增强)。在另外一些实施例中,核酸可以作为独立、附加型DNA片段稳定地保持在细胞中。这些核酸片段或“附加体”编码的序列得从充分保持和复制,独立于宿主细胞周期或与宿主细胞周期同步。
在一具体实施例中,将蛋白质或多肽体内送到脊椎动物细胞内的方法包括以下步骤:将含有生理上可接受运载体和操作性编码感兴趣多肽的裸多核苷酸制剂导入到含有该细胞的组织间隙,在那里裸多核苷酸被摄入细胞内,而具有生理效应。这种方法特别适用于体外转移,但也可用于体内。
PCT申请WO90/11092(Vical Inc.)和PCT申请WO 95/11307(Institut Pasteur,INSERM,Universitéd’Ottawa)以及Tacson等(1996年)和Huygen等(1996年)的论文叙述了用于体内外的包含“裸露”多核苷酸的组合物。
如Klein等(1987年)所述,本发明的另一实施例中,通过粒子轰击(生物弹)将包括本发明多核苷酸构建物的本发明裸露多核苷酸转移入细胞,所述粒子是被加速至高速的包被了DNA的显微发射物,使它们可穿过细胞膜,而不必杀死细胞就可进入细胞内。
在又一实施例中,将本发明的多核苷酸包裹在脂质体内(Ghosh和Bacchawat,1991年;Wong等,1980年;Nicolau等,1987年)。
在一具体实施例中,本发明提供在体内产生本文所述的CanIon蛋白质或多肽的组合物。该组合物含有操作性编码该多肽的裸露多核苷酸,它溶于生理上可接受的运载体溶液中,适合导入组织引起组织细胞表达所述蛋白质或多肽。
被注射到所需宿主生物体的载体量随注射部位而不同。作为指标性剂量,在动物体内,优选在哺乳动物体内例如小鼠体内,注射的载体是在0.1和100μg之间。
在本发明的另一个载体实施例中,将它在体外导入宿主细胞内,优选导入从待治疗动物采集的宿主细胞内,更优选为体细胞,如肌细胞。在后一步骤中,将已用编码所需CanIon多肽或其所需片段的载体转化的细胞重新导入动物体内,以便在体内局部或系统性地输送该重组蛋白质。
细胞宿主
本发明的另一个目的包括已经用本文所述多核苷酸之一,特别是含有CanIon调节性多核苷酸或选自SEQ ID No 1-4的CanIon多肽编码序列的多核苷酸或其片段或其变体,转化或转染的宿主细胞。本发明也包括已用上述重组载体之一转化(原核生物细胞)或转染(真核生物细胞)的宿主细胞。更具体地说,本发明的细胞宿主可包含“CanIon基因的基因组序列”部分、“CanIon cDNA序列”部分、“编码区”部分、“多核苷酸构建物”部分、“寡核苷酸探针和引物”部分所述的任何一个多核苷酸。
本发明的另一种重组细胞宿主包括本文所述的任何一种载体,特别是“重组载体”部分所述的任何一种载体。
以下是用作本发明表达载体受体的优选宿主细胞:
a)原核生物宿主细胞:大肠杆菌株(I.E.DH5-α株)、枯草芽孢杆菌、沙门杆菌、以及假单胞杆菌属、链霉菌属、葡萄球菌属等菌属。
b)真核生物宿主细胞:海拉细胞(Hela cells)(ATCC编号为CCL2、编号为CCL2.1、编号为CCL2.2)、Cv 1细胞(ATCC编号为CCL70)、COS细胞(ATCC编号为CRL1650、编号为CRL1651)、Sf-9细胞(ATCC编号为CRL1711)、C127细胞(ATCC编号为CRL-1804)、3T3(ATCC编号为CRL-6361)、CHO(ATCC编号为CCL-61)、人肾293(ATCC编号为45504、CRL-1573)以及BHK(ECACC编号为84100501、84111301)。
c)其它哺乳动物宿主细胞。
在哺乳动物细胞通常是人细胞中CanIon基因表达可能产生缺陷,或者它可先插入CanIon基因组或cDNA序列,再用本发明的CanIon多核苷酸取代动物细胞基因组中CanIon基因的相应部分。用上述特异性DNA构建物通过同源重组可产生这些基因变化。
一种可供使用的细胞宿主是哺乳动物合子,如小鼠合子。例如,小鼠合子用纯化的感兴趣DNA分子进行显微注射,例如,在含有100mM氯化钠、30μM精氨和70μM亚精氨的10mMpH 7.4Tris-HCl、250μMEDTA中浓度已调整至BAC插入片段为1ng/ml的、P1噬菌体插入片段为3ng/μl的纯化DNA分子。如Schedl等(1993年)所述,当要显微注射的DNA尺寸较大时,可使用多胺和高盐浓度,以避免该DNA发生机械断裂,。
可将本发明的任何一个多核苷酸,包括本文所述的DNA构建物,导入胚胎干(ES)细胞系内,最好导入小鼠胚胎干细胞系内。胚胎干细胞系衍生自预先植入的胚母细胞的内部细胞块中的多能、未定型(uncommitted)的细胞。以下是优选的胚胎干细胞系:ES-E14TG2a(ATCC编号为CRL-1821)、ES-D3(ATCC编号为CRL1934和CRL-11632)、YS001(ATCC编号为CRL-11776)、36.5(ATCC编号为CRL-11116)。为了使胚胎干细胞保持未定型状态,将它们在生长受抑制的饲养细胞存在下培养,饲养细胞可提供适当信号以保留这种胚胎表型以及起着胚胎干细胞粘附基质作用。优选的饲养细胞是从任何一种小鼠品系的13至14日胚胎组织建立的原代胚胎成纤维细胞,如Abbondanzo等(1993年)所述,将它们保持在培养中,如Robertson(1987年)所述,通过照射,或如Pease和Williams(1990年)所述,在LIF抑制浓度存在下,抑制它们的生长。
可用宿主细胞中的此构建物用常规方法产生该重组序列编码的基因产物。
转化适当宿主和当宿主生长至合适的细胞密度后,以变温或化学诱导等适当方法诱导选择的启动子,并使细胞多培养一段时期。
一般通过离心收细胞,以物理或化学方式裂解,保留所得粗提取物作进一步纯化。
可用任何一种适当方法裂解用于蛋白质的微生物细胞,包括冻融循环、超声波、机械破裂、或使用溶胞剂。这些方法是本领域技术人员熟知的。
转基因动物
本文所用的术语“转基因动物”或“宿主动物”指其基因组由于遗传和人工操纵而包含本发明核酸之一的动物。优选的动物是非人动物,包括属于选自鼠类(例如小鼠)、家鼠(例如大鼠)、以及家兔(例如家兔)的动物,它们的基因组通过人工和遗传方法插入了本发明的核酸而发生改变。在一实施例中,本发明包括非人宿主哺乳动物和含有本发明重组载体或用敲除的载体进行同源重组而受破坏的CanIon基因的动物。
本发明的转基因动物在它们的多个细胞中都含有克隆的重组或合成DNA序列,更具体地说,其中一个纯化的或分离的核酸含有CanIon编码序列、CanIon调节性多核苷酸、多核苷酸构建物或编码本文所述反义多核苷酸的DNA序列。
本发明的转基因动物通常包含本发明所述的一种多核苷酸、重组载体以及细胞宿主。更具体地说,本发明的转基因动物可包含“CanIon基因的基因组序列”部分、“CanIon cDNA序列”部分、“编码区”部分、“多核苷酸构建物”部分、“寡核苷酸探针和引物”部分、“重组载体”部分和“细胞宿主”部分所述的任何一种多核苷酸。
如本发明所述的其它转基因动物在它们的体细胞和/或种系细胞中包含一个多核苷酸,该多核苷酸含有选自A1-A18及其互补物的双等位标记。
在第一优选实施例中,这些转基因动物是优良实验模型,用于研究与细胞分化有关的多种病理学,特别是其基因组内插入了编码天然CanIon蛋白质或突变CanIon蛋白质的多核苷酸的一个或多个拷贝的转基因动物。
在第二优选实施例中,这些转基因动物可在CanIon基因的调节性多核苷酸的调控下表达感兴趣的所需多肽,导致感兴趣蛋白质合成的高产率,最后导致感兴趣蛋白质的组织特异性表达。
按照本领域技术人员所知的常规技术可设计本发明的转基因动物。关于转基因动物制备的详情,特别是转基因小鼠,可参考1989年10月授权的美国专利4,873,191、1995年11月7日授权的美国专利5,464,764、以及1998年8月4日授权的美国专利5,789,215,这些文献列于本文的参考文献中,公开了转基因小鼠的制备方法。
采用导致动物的基因组掺入了外源遗传物质的步骤,制备本发明的转基因动物。这些步骤包括获取遗传物质或其部分,该遗传材料或其部分编码CanIon编码序列、CanIon调节性多核苷酸、或编码本文所述CanIon反义多核苷酸的DNA序列。
将本发明的重组多核苷酸插入到胚细胞或胚胎干细胞系内。这种插入最好如Thomas等所述(1987年)用电穿孔进行。筛选要进行电穿孔的细胞(如通过选择标记选择、通过PCR或DNA印迹分析法选择),宜通过同源重组找到已经将外源重组多核苷酸整合入其基因组中的阳性细胞。Mansour等(1988年)叙述了可用睛本发明的阳性-阴性选择方法。
然后,按Bradley(1987年)所述分离阳性细胞、克隆并注入3.5日龄的小鼠胚泡中。再将这些胚泡插入雌性宿主动物,生长一段时期。
另外,按Wood等(1993年)或Nagy等(1993年)所述使阳性胚胎干细胞与2.5日龄8-16细胞期(桑椹期)的胚胎接触,胚胎干细胞被内化,集落扩展成胚泡含有产生种系的细胞。
测试雌性宿主的后代以确定哪只动物是转基因动物,例如哪只动物包含有插入的外源DNA序列,以及哪只动物是野生型。
所以,本发明还涉及含有本发明的核酸、重组载体或重组宿主细胞的转基因动物。
衍生自本发明转基因动物的重组细胞系
本发明的又一目的包括从本文所述的转基因动物获得的重组宿主细胞。在一实施例中,本发明包括衍生自非人宿主哺乳动物和动物的细胞,这些动物含有本发明重组载体或由于敲除载体进行同源重组而受破坏的CanIon基因。
从本发明转基因动物的任何组织获得的细胞可在体外建立重组细胞系,例如,如Chou(1989年)和Shay等(1991年)所述,用表达诸如SV40大T抗原等onc-基因的载体转染原代细胞培养物。
筛选CanIon调节剂和与相互作用化合物的方法
在许多实施方案中,本发明提供了可与CanIon多肽、通道和多核苷酸反应、结合或者活化或抑制CanIon多肽、通道和多核苷酸的表达或活性的化合物。此类化合物可以是任何有机或无机化合物,包括但不限于多肽、多核苷酸、脂类、碳水化合物、核苷酸、氨基酸或小分子抑制剂或活化剂。如本说明书其它地方所述,此类化合物对于治疗或预防许多疾病或症状都是有效的。优选地,CanIon活性或表达的抑制剂可用于治疗或预防精神疾病如精神分裂症或双极情感障碍。
筛选CanIon通道调节剂的方法
能够结合CanIon的化合物以及能够调节CanIon功能的化合物在治疗此类疾病中有重要用途。电压门控离子通道通常是作为药靶建立的,因为它们是药物可达到的,由许多基因编码,且通常作为多聚体蛋白质的装配体发挥作用,导致在功能和解剖学上高度特异。此外,由于离子通道的开放和关闭与电压敏感的氨基酸的移动导致构象状态和离子通道的变化有关,可设计状态依赖性分子,这种分子只与处在传导(激活)或非传导(失活)状态的通道结合。
此外,已经证明许多钙通道调节剂对于治疗或预防许多疾病和症状都是有效的。例如,已显示钙通道抑制剂可有效治疗各种心血管疾病和症状(如心绞痛、心律失常、高血压)以及CNS和神经疾病(如偏头痛、中风对神经的影响、癫狂、安定药诱导的迟发性运动障碍、精神分裂症、双极情感障碍、疼痛、癫痫等)。此外,已证明钙通道激动剂有许多用途,如减少局部麻醉的持续时间或削弱局部麻醉的效力。CanIon通道的拮抗剂和激动剂在治疗或预防这些以及其它疾病和症状时有类似的作用。例如,CanIon拮抗剂可用于治疗或预防精神分裂症或双极情感障碍。
由于电压门控离子通道的活化不需要激动剂的结合,所以宜筛选针对CanIon通道功能的化合物。可将包括功能方法和放射性配体结合方法的各种试验应用于表达天然或克隆通道的细胞(小泡或膜)或整个细胞试验。整个细胞功能试验可采用电生理学技术,如膜片箝。试验可能涉及任何类型的电压门控通道,优选L、N和T型通道。也可测量通过该通道的运动离子流,例如用荧光技术、末端放射性示踪技术或细胞生存力技术。
试验还可使用各种毒素、毒液或与通道结合并使通道开放或闭合的化合物(Denyer等,Drug Disc.Today3(7):323-332(1998),在此将其全文并入以供参考)。在一个实施方案中,本发明的试验包括使用大量已知的钙通道激动剂和拮抗剂之一,例如作为阳性或阴性对照。合适的已知钙通道拮抗剂的例子包括苯基烷基胺(如戊脉安)、benzothiazepines(如地尔硫卓)和二氢吡啶(如硝苯吡啶);钙通道激动剂包括FPL-64176和BAY K 8644;钠通道激动剂包括箭毒蛙碱;钠通道拮抗剂包括spiradoline、脉律定、U-54494A((≠/-)-顺-3,-二氯N-甲基-N-[2-(1-吡咯烷基)-环己基]-苯甲酰胺)。此类化合物也可用作“引导”化合物,即作为设计或发现特异性结合或调节CanIon通道的衍生分子的起始分子。
在优选的实施方案中,本发明的试验包括筛选候选物质的方法,该方法包括以下步骤:
a)提供(i)含有多肽的样品或宿主细胞,该多肽含有CanIon蛋白质或其片段,或者由或基本上由CanIon蛋白质或其片段构成,或者(ii)表达编码多肽的多核苷酸的宿主细胞,所述多肽含有CanIon蛋白质或其片段,或者由或基本上由CanIon蛋白质或其片段构成。
b)获得候选物质;
c)使所述宿主细胞与所述候选物质接触;
d)测定所述候选物质对CanIon活性的作用。
可按照熟知的方法实施候选物质对CanIon活性的作用的测定。优选地,候选物质对CanIon活性的作用是激动或拮抗作用。通常,如果转运离子(如Ca2+或Na+)的能力降低则该化合物抑制CanIon。如果转运离子的能力升高则该化合物刺激CanIon。
可用合适的方法测定CanIon的活性。在优选的实施方案中,是通过测量信号传递活动检测CanIon活性的。信号传递活动可包括分子特性或细胞参数的任何适当变化,信号传递活动的非限制性例子包括离子流量的变化,如Ca2+或Na+,或K+流的变化或产生,或者包括酶活性的变化。
一方面,可采用(例如)测量一个细胞或膜片箝中的全细胞电流的技术,通过测量CanIon通道的电生理学性质来监测离子流。在另一个实施例中,可使用荧光或放射性标记来检测已知的CanIon结合化合物的转移,或者检测通过细胞(如标记的Ca2+或Na+)中的离子流。可使用细胞生理参数的指示剂,如细胞生存力的荧光指示剂。在其它实施例中,可检测指示剂物理位置的改变,如采用荧光激活细胞分选以鉴定生理指示剂的排除或摄取。
本发明的试验所用的样品包含多肽或表达多肽的宿主细胞,所述多肽含有CanIon蛋白质或其片段,或者由或基本上由CanIon蛋白质或其片段构成,或者(ii)表达编码多肽的多核苷酸的宿主细胞,所述多肽含有CanIon蛋白质或其片段,或者由或基本上由CanIon蛋白质或其片段构成。优选地,本发明的CanIon试验包括使用表达功能性CanIon多肽的重组宿主细胞。宿主细胞可表达或包含CanIon通道的功能性α亚基,或者可表达或包含一个或多个其它的离子通道亚基,或者是含有CanIon的离子通道复合物。优选地,采用了具有低内源离子通道表达或具有低背景离子(尤其是Ca2+和/或Na+)电导的宿主细胞。
放射性配体结合
一方面,可通过鉴定与CanIon感兴趣的位点结合和最好具有所需的调节作用的高亲和配体,并检测试验化合物转移所述被标记的配体的能力,来筛选CanIon通道。Denyer等(同上)提供了用于电压门控(Ca2+、Na+和K+)通道试验的毒理学/药理学试剂的列表。该方法通常适合于检测与此相同位点结合的化合物,或者与此位点变构偶联(如标记的配体)但不提供关于所述化合物的激动性能或拮抗性能的信息的化合物。
基于细胞的荧光和放射性示踪试验
在另一试验中,CanIon的功能是用荧光-离子指示剂或放射性标记的离子,通过测量渗透性离子的胞内浓度进行监测的。
通常,离子通道如Na+通道在电压刺激后数毫秒内失活。Ca2+通道没有失活现象或者失活程度较低,并可因高K+去极化作用而开放。在基于细胞的荧光和放射性示踪试验中,CanIon通道通常可被毒素或任何试验化合物、或高K+去极化作用活化,这样此通道在延长的一段时间内可保持开放(多达数分钟)。
在基于荧光的试验中,可采用荧光素Ca2+染料(如Fluo-3、Calcium green-1、Molecular Probes,OR,美国)。可用等渗溶液使膜去极化以活化Ca2+通道,或者用毒素或其它化合物使Na+通道活化,在20-60秒内可在细胞中测得所产生的荧光瞬时移动。Denyer等(同上)进一步描述了荧光测量系统和装置。放射性示踪剂22Na+和14C-胍通常被用来分析Na+通道,而45Ca2+被用来分析Ca2+通道。在Denyer等(同上)所描述的优选实施方案中,采用Cytostar-T闪烁微板(Amersham International,U.K.)来进行基于CanIon细胞的高通量试验。
在其它试验中,通过用膜电势指示剂测量膜电势来监测Ca2+对离子通道的功能。生物膜的高电阻可使小的离子流通过质膜,从而引起膜电势的大变化。因此可方便地用电压试验来检测通过膜的总离子流。通常选择细胞系以使内源离子通道的影响最小。有许多可作为膜电势指示剂染料的染料,分成快反应和慢反应染料,以及基于FRET的电压敏感染料。(Aurora Biosciences,加利福尼亚州,美国;可参阅Gonzalez等,Drug Disc.Today 4(9):439(1999)。
细胞生存力
在细胞生存力试验中,离子通道的活性和离子流与细胞生存力直接相关。酵母细胞和哺乳动物细胞系统都可被用作离子通道试验的靶子。例如,使用了采用离子特异性K+摄取不足的酿酒酵母细胞系的酵母系统,其中感兴趣的功能性K+通道在该细胞系中表达,从而恢复K+的摄取并促使细胞存活。(Anderson等,Symp.Soc.Exp.Biol.48:85-97(1994)。这种Ca2+或Na+通道的试验可用来鉴定能够阻遏CanIon功能的化合物。也可使用哺乳动物细胞系统,比如用哺乳类成神经细胞瘤细胞和细胞生存力比色读出器进行的Na+通道试验。用Na+通道开启剂和Na+/K+泵抑制剂处理细胞以促进致死性胞内Na+超负荷。用能够阻遏此通道的试验化合物处理,将提高细胞的生存力,而用可提高通道开放的化合物处理将进一步促进细胞死亡。(Manger等,Anal.Biochem.214:190-194(1993)。
电生理学
电生理学电压膜片箝技术包括测量流过一个或多个通道的离子流。一个微电极被用来控制膜电压,同时通过细胞或膜片箝测量了电流。(Hamill,PfugersArch.391,85-100(1981)。因此可测量存在或不存在感兴趣的试验化合物时的离子电流。已经设计出了大规模筛选化合物的系统(Neurosearch A/S,Glostrup,Denmark;Olesen等,Vol tage gated ion channel modulators,7-8December,PhiladelphiaPA,USA(1995);Denyer等,同上)。
与CanIon多肽相互作用的物质的筛选方法
对本发明而言,配体意味着一种分子,如能够结合CanIon蛋白质或其片段或变体或调节编码CanIon多核苷酸或其片段或变体的蛋白质、肽、抗体或合成化合物。
在本发明的配体筛选方法中,使待测生物样本或已限定的分子作为CanIon蛋白质推定配体(putative ligand)与相应的纯化CanIon蛋白质接触,例如,与本文上述由重组细胞宿主产生的纯化的相应重组CanIon蛋白质接触,以便在该蛋白质和待测推定的配体分子之间形成复合物。
作为一个举例说明的例子,为了研究CanIon蛋白质或含有SEQ ID No5连续跨距至少6个氨基酸,优选长至少8至10个氨基酸,更优选长至少12、15、20、25、30、40、50、100、200、300、400、500或1000个氨基酸的片段,与药物或小分子的相互作用,例如,可采用Wang等(1997年)所述的通过组合化学方法、与高效液相层析法相连的微量透析,或用Bush等(1997年)所述的亲和毛细管电泳法等制备的分子,具体可参考本文的引用文献。
在另外一些方法中,可用以下试验鉴定,能与CanIon蛋白质或含有SEQ ID No.5的连续跨距至少6个氨基酸,优选长至少8至10个氨基酸,更优选长至少12、15、20、25、30、40、50、或100个氨基酸相互作用的肽药物、脂肪酸、脂蛋白或小分子。用可检测的标记来标记待测的结合分子,如萤光、放射活性、或酶标记,并使该分子在发生特异性结合的条件下与固定化的CanIon蛋白质或其片段接触。去掉非特异性结合分子后,用适当方法检测结合分子。
本发明的另一个目的包括与CanIon多肽相互作用的候选物质的筛选方法和试剂盒。
本发明涉及能与CanIon蛋白质或其片段或变体相互作用的物质的筛选方法。由于它们能够通过共价或非共价键与CanIon蛋白质或其片段或变体结合,所以这些物质可供体内外使用。
在体外,所述相互作用的分子可用作检测工具,来鉴定样品最好是生物样品中存在的CanIon蛋白质。
候选物质的筛选方法包括以下步骤:
a)提供包含CanIon蛋白质或片段,或者由或基本上由CanIon蛋白质或片段组成的多肽所述片段含有SEQ ID No.5的连续跨距至少6个氨基酸,优选长至少8至10个氨基酸,较优选长至少12、15、20、25、30、40、50、或100个氨基酸;
b)获得候选物质;
c)使所述多肽与所述候选物质接触;
d)检测在所述多肽与所述候选物质之间形成的复合物。
本发明还涉及能与CanIon多肽相互作用的候选物质的筛选试剂盒,其中所述试剂盒包括:
a)具有选自SEQ ID No 5的氨基酸序列,或含有SEQ ID No 5的至少6个氨基酸,优选长至少8至10个氨基酸,更优选长至少12、15、20、25、30、40、50、或100个氨基酸的肽片段的Camlon蛋白质;
b)任选的可用于检测CanIon蛋白质或某肽片段或其变体与候选物质之间形成的复合物的手段。
在上述试剂盒的优选实施例中,该检测手段包括抗CanIon蛋白质或其肽片段或其变体的单克隆或多克隆抗体。
可测试各种候选物质或分子与CanIon多肽的相互作用。这些物质或分子包括但不限于天然或合成的有机化合物或生物来源的分子,如多肽。当候选物质或分子包括多肽时,这个多肽可以是属于噬菌体随机肽文库的噬菌体克隆产生的表达产物,或者此多肽可以是克隆在适合于进行双杂交筛选试验的载体中的cDNA文库产生的表达产物。
本发明还涉及用于进行上述筛选方法的试剂盒。这些试剂盒宜包括CanIon多肽或其片段或变体,任选地包括用于检测CanIon多肽或其片段或变体与候选物质之间形成的复合物的检测工具。在一优选实施例中,此检测工具包括抗相应CanIon多肽或其片段或变体的单克隆或多克隆抗体。
A.从随机肽文库获得的候选配体
在筛选方法的具体实施例中,推定配体是包含在噬菌体载体中的DNA插入片段表达产物(Parmley和Smith,1988年)。特别是采用随机肽噬菌体文库。随机DNA插入片段编码长8至20个氨基酸的肽(Oldenburg K.R.等,1992年;Valadon P.等,1996年;Lucas A.H.,1994年;Westerink M.A.J.,1995年;Felici F.等,1991年)。根据该具体实施例,保留表达能与固定化CanIon蛋白质结合的蛋白质的重组噬菌体,随后可用抗CanIon蛋白质的多克隆或单克隆抗体免疫沉淀CanIon蛋白质与重组噬菌体之间形成的复合物。
一旦在重组噬菌体中构建了此配体文库,使噬菌体群与固定化CanIon蛋白质接触。然后,洗涤复合物制剂,除去非特异性结合的重组噬菌体。特异性结合CanIon蛋白质的噬菌体用缓冲液(酸性pH)洗脱或用杂交瘤产生的抗CanIon单克隆抗体作免疫沉淀,随后通过细菌(例如大肠杆菌)过度感染来扩增该噬菌体群。此选择步骤可重复多次,最好重复2至4次,以便选择更具特异性的重组噬菌体克隆。最后一步包括通过在感染细胞中的表达和分离使该噬菌体插入片段在另一个宿主/载体系统表达,或者对包含在所选重组噬菌体中的插入片段进行测序,选出重组噬菌体克隆来产生此肽。
B.通过竞争实验获得的候选配体
此外,在竞争实验中可鉴定能结合CanIon蛋白质或含有SEQ ID No 5的连续跨距至少6个氨基酸,优选长至少8至10个氨基酸,更优选长至少12、15、20、25、30、40、50、或100个氨基酸的片段的肽,药物或小分子。在这些试验中,将CanIon蛋白质或其片段固定在一表面上,如塑料平板上。在带有可检测标记的已知CanIon蛋白质配体存在下,增加肽、药物、或小分子的量,并与固定化CanIon蛋白质或其片段接触。例如,可用萤光、放射活性、或酶标记来标记CanIon配体,使其可被检测到。在测试分子存在下测定结合的带有可检测标记的已知配体量,以确定测试分子结合CanIon蛋白质或其片段的能力。当存在待测分子时,结合CanIon蛋白质的已知配体量下降,表明该测试分子能够结合CanIon蛋白质或其片段。
C.通过亲和层析法获得候选配体
能与CanIon蛋白质或含有SEQ ID No 5的连续跨距至少6个5氨基酸,优选长至少8至10个氨基酸,更优选长至少12、15、20、25、30、40、50、或100个氨基酸的片段相互反应的蛋白质或其他分子是候选配体。利用常规技术可将CanIon蛋白质或其片段附着于层析柱上,这些技术包括与适当的层析柱基质,如琼脂糖、AffiGel_、或其它本领域技术人员熟悉的基质化学偶联。在此方法的一些实施例中,此亲和层析柱含有嵌合蛋白质,其中CanIon蛋白质或其片段与谷胱甘肽S-转移酶(GST)融合。将上述细胞蛋白质的混合物或表达的蛋白质的合并物加到此亲和层析柱上。然后如Ramunsen等(1997年)所述在2-D电泳凝胶上分离附着于此核的Camlon蛋白或其片段相互反应的蛋白质或其他分子和分析,所述文献列于本文的参考文献中。此外,可用基于电泳的方法纯化保留在亲和层析柱上的蛋白质并测序。同样的方法可用于分离抗体、筛选噬菌体展示产物或筛选噬菌体展示的人抗体。
D.通过光生物传感方法获得候选配体
如Edwards和Leatherbarrow(1997年)以及Szabo等(1995年)所述,用光生物传感方法筛选能与CanIon蛋白质或其片段相互作用的蛋白质,所述片段含有SEQ IDNo 5的连续跨距氨基酸,优选长至少8至10个氨基酸,更优选长至少12、15、20、25、30、40、50、或100个氨基酸。所述文献列于本文的参考文献中。这种技术可实时检测分子之间的相互作用,而无需标记分子。这种技术基于表面胞质基因组共振现象(SPR)。简单地说,将待测候选配体分子附着于表面(如羟甲基葡聚糖基质)上。光束直射不包含待测样品的表面一侧,并自所述表面反射。SPR使反射光强度随角度和波长的具体组合而降低。候选配体分子的结合导致表面的折射率发生改变,检测这种改变作为SPR信号的变化。为了筛选能够与CanIon蛋白质或其片段相互作用的候选配体分子或物质,将CanIon蛋白质或其片段固定在一表面上。该表面包括待测试候选分子流经的细胞一侧。检测结合在CanIon蛋白质或其片段上的候选分子作为SPR信号的变化。待测候选分子可以是蛋白质、肽、碳水化合物、脂质、或用组合化学制备的小分子。实施这种技术时,通过将真核生物或原核生物的细胞或含有内源或重组表达CanIon蛋白质小泡的脂质固定在它们的表面上。
这种方法的主要优点是它可测定CanIon蛋白质和与CanIon蛋白质相互作用的分子之间的结合速率。故可用强结合常数或相反地用弱结合常数特异性选择与CanIon蛋白质或其片段相互作用的配体分子。
E.通过双杂交筛选试验获制得候选配体
设计了依赖于诱饵蛋白质(bait portein)与酵母Gal4蛋白质DNA结合区的融合的酵母双杂交系统用于研究体内蛋白质—蛋白质的相互作用(Fields和Song,1989年)。美国专利US5,667,973和US5,283,173(Fields等)叙述了这种技术,两项专利揭示的技术内容列于本文的参考文献中。
用双杂交试验筛选文库的一般步骤可按Harper等(1993年)或Cho等(1998年)或者Fromont-Racine等(1997)所提出的方法。
诱饵蛋白质或多肽包括CanIon多肽或片段,或者由或基本上由CanIon多肽或片段组成,所述片段含有SEQ ID No 5的连续跨距至少6个氨基酸,优选长至少8至10个氨基酸,更优选长至少12、15、20、25、30、40、50、或100个氨基酸。
更准确地说,将编码CanIon多肽或其片段或变体的核苷酸与编码GAL4蛋白质DNA结合区的多核苷酸融合,该融合核苷酸序列插入到适当表达载中,例如pAS2或pM3。
接着,在专门设计的载体中构建人cDNA文库,使人cDNA插入片段与载体中编码GAL4蛋白质转录区的核苷酸序列融合。所用的载体最好是pACT载体。由人cDNA文库的核苷酸插入片段编码的多肽称为“待捕”(“pray”)多肽。
第三载体含有可检测标记基因,如受一调节序列控制的β半乳糖苷酶基因或CAT基因,而该调节序列对结合含有转录活化结构域和,DNA结合域的完整Gal4蛋白质起反应。例如,可采用载体pG5EC。
也可采用两种不同酵母菌株。作为举例说明但不起限制作用的例子是以下两种不同酵母菌株:
-Y190,其表型是(MATa、Leu2-3、112ura3-12、trp1-901、his3-D200、ade2-101、gal4Dgal180D URA3 GAL-LacZ、LYS GAL-HIS3、cyhr);
-Y187,其表型是(MATa gal4 gal80 his3 trp1-901 ade2-101 ura3-52 leu2-3、
-112URA3GAL-lacZmet-),Y187是Y190的相反接合型。
简单地说,将20μg的pAS2/CanIon和20μg的pACT-cDNA文库一起转化入酵母菌株Y190中。在缺乏组氨酸、亮氨酸和色氨酸,但含有组氨酸合成抑制剂3-AT(50mM)的最低基础培养基上选择性培养此转化体。通过提升滤过试验(filter lift assay)筛选β半乳糖苷酶的阳性克隆。然后使双阳性克隆(His+、β-gal+)在缺乏组氨酸、亮氨酸但含有色氨酸和环己酰亚胺(10mg/ml)的平板上生长,选择丧失pAS2/CanIon质粒,但保留pACT-cDNA文库质粒的克隆。如Harper等(1993年)和Bram等(1993年)所述的Gal4融合那样,使所得Y190菌株与表达CanIon或无关调控蛋白质环孢素亲合素B、核纤层蛋白或SNF的Y187菌株交配;以及通过提升滤过试验筛选β半乳糖苷酶。与调控Gal4融合物交配后是βgal的酵母克隆被认为是假阳性。
在本发明双杂交方法的另一个实施例中,用Matchmaker双杂交系统2(产品号K1604-1,Clontech)评估CanIon或其片段或变异体与细胞蛋白质之间的相互作用。如本文引用的参考文献中Matchmaker双杂交系统2(产品号K1604-1,Clontech)内附手册所述,将编码CanIon蛋白质或其部分的核酸插入到一表达载体上,使它们与编码酵母转录激活剂GAL4的DNA结合区在读框内。将所需cDNA特别是人cDNA插入第二表达载体,使它们与编码GAL4活化区的DNA在读框内。将这两种表达质粒转化入酵母中,将该酵母菌接种在选择培养基上,选择每种表达载体上选择标记的表达以及HIS3基因依赖的GAL4表达。筛选能够在缺乏组氨酸的培养基上生长依赖于GAL4的lacZ表达的转化体。在组氨酸选择和lacZ试验中均呈阳性的那些细胞含有CanIon与由初始选择的cDNA插入片段编码的蛋白质或肽之间的相互作用。
与CanIon基因调节序列相互作用的物质的筛选方法
本发明还涉及能够与CanIon基因调节序列如启动子或增强子序列相互作用的物质或分子的筛选方法。
如本文参考文献中所引用的Clontech公司的Matchmaker单杂交系统试剂盒(产品号K1603-1)内附的使用手册所述,可用单杂交系统鉴定编码能够与CanIon基因的调节序列相互作用的蛋白质的核酸,更具体地说,选自5’或3’调节区的多核苷酸或其片段或变体的核苷酸,而变体最好含有本发明的双等位标记之一。简单地说,将靶核苷酸序列克隆在选择的报导序列上游,将产生的DNA构建物整合入酵母基因组中(酿酒酵母菌)。再用含有编码能结合于CanIon基因调节序列的候选蛋白质的cDNA与编码GAL4等酵母转录因子活化区的序列之间的融合蛋白的文库,转化其基因组中含有报导序列的酵母细胞。将该重组酵母细胞接种在液体培养基中,以选择表达报导序列的细胞。这样选出的重组酵母细胞含有能够结合CanIon基因中靶调节序列的融合蛋白。然后,给编码该融合蛋白的cDNA测序,并可将其克隆到体外表达或转录载体中。采用本领域技术人员熟悉的技术可确证编码的多肽与CanIon基因中靶调节序列的结合,如凝胶阻滞试验或DNA酶(DNAse)保护试验。
如Fried和Crothers(1981年)、Garner和Revzin(1981年)以及Dent和Latchman(1993年)所述,也可单独地进行凝胶阻滞试验以筛选能够与CanIon基因调节序列相互作用的候选分子,具体可参考本文的引用文献。这些技术基于与蛋白质结合的DNA片段比同样的非结合DNA片段移动得慢这一原理。简单地说,使靶核苷酸序列带上标记。再将已标记的靶核苷酸序列与细胞的含有转录因子的总胞核提取物或不同的待测候选分子接触。进行凝胶或毛细管电泳后通过移动阻滞检测CanIon基因的靶调节序列与候选分子或转录因子之间的相互作用。
调节CanIon基因表达的配体的筛选方法
本发明的又一个主题是调节CanIon基因表达的分子的筛选方法。这种筛选方法包括以下步骤:
a)培养在其自身启动子的调控下用编码CanIon蛋白质或其变体或片段的核苷酸序列转染原核生物或真核生物细胞;
b)使经过培养的细胞与待测分子接触;
c)定量测定CanIon蛋白质或其变体或片段的表达。
在一实施例中,编码CanIon蛋白质或其变体或片段的核苷酸序列包括双等位标记A12或A16及其互补物的至少一个等位基因。
使用本领域技术人员熟知的DNA重组技术,将编码CanIon蛋白质的DNA序列插入到表达载体的启动子序列下游处。作为一个举例的例子,CanIon基因的启动子序列包含在5’调节区的核酸中。
在mRNA水平或蛋白质水平上都可定量测定CanIon蛋白质的表达。对于后一种情况,例如,在ELISA或放射免疫试验中用多克隆或单克隆抗体定量测定已产生的CanIon蛋白质含量。
在一优选实施例中,用对CanIon特异性引物对定量测定cDNA的PCR扩增产物,而所述cDNA从培养的CanIon转染宿主细胞的全mRNA通过逆转录而制得,就可以定量测定CanIon mRNA。
本发明还涉及能够提高,或者相反,能够降低CanIon基因表达水平的物质或分子的筛选方法。这样一种方法使本领域技术人员可以选择对CanIon基因表达水平具有调节作用,而且可用作活性物质包含在治疗患有本文所述疾病的病人的药物组合物中。
所以,本发明的部分内容是能调节CanIon基因表达的候选物质或分子的筛选方法,该方法包括以下步骤:
—提供含有一种核酸的重组细胞宿主,其中所述核酸含有5’调节区的核苷酸序列或其位于编码可检测蛋白质的多核苷酸上游且具有生物活性的片段或其变体;
—获得候选物质;以及
—测定该候选物质调节编码该可检测蛋白质的多核苷酸表达水平的能力。
在另一实施例中,含有5’调节区的核苷酸序列或其具有生物活性的片段或变体的核酸也包括SEQ ID No 4的CanIon cDNA 5’非翻译(UTR)区,或其具有生物活性的片段或变体。
在编码可检测蛋白质的优选多核苷酸中,还可包括编码β-半乳糖苷酶、绿萤光蛋白质(GFP)以及氯霉素转移酶(CAT)的多核苷酸。
本发明也涉及本文所述筛选方法使用的试剂盒。这些试剂盒包括一重组载体,其使位于上游且操作性连接于编码可检测蛋白质或CanIon蛋白质或其片段或变体的5’调节区的核苷酸序列或其具有生物活性的片段或变体得到表达。
在另一个调节CanIon基因表达的候选物质或分子的筛选方法中,所述方法包括以下步骤:
a)提供含有一种核酸的重组细胞宿主,其中所述核酸含有SEQ ID No 4的CanIoncDNA的5’UTR序列,或其具有生物活性的片段或变体之一,此5’UTR序列或其具有生物活性的片段或变体可操作性连接于编码可检测蛋白质的多核苷酸上;
b)获得候选物质;以及
c)测定该候选物质调节编码可检测蛋白质的多核苷酸表达水平的能力。
在上述筛选方法的具体实施例中,该核酸含有选自SEQ ID No 4的CanIon cDNA的5’UTR序列或其具有生物活性的片段或变体的核苷酸序列,包括与CanIon 5’UTR序列的内源性启动子序列。
在上述筛选方法的另一具体实施例中,该核酸含有选自SEQ ID No 4的CanIoncDNA的5’UTR序列或其具有生物活性的片段或变体的核苷酸序列,包括本文所述CanIon 5’UTR序列的外源性启动子序列。
在又一个实施例中,该核酸含有CanIon cDNA或SEQ ID No 4的5’UTR序列或其具有生物活性的片段,包括选自A12或A16的双等位标记或其互补物。
本发明也包括调节CanIon基因表达的候选物质的筛选试剂盒,其中所述试剂盒包括一重组载体,其含有包括操作性连接于编码可检测蛋白质的多核苷酸的SEQ ID No4的CanIon cDNA的5’UTR序列,或者其具有生物活性的片段或变体之一的核酸。
如国际专利申请公开号WO 97/05277所述的方法可采用长探针通过溶液杂交分析CanIon表达水平和模式,具体可参考本文的引用文献。简单地说,将上述CanIon cDNA或CanIon基因组DNA或其片段插入紧靠噬菌体(T3、T7或SP6)RNA聚合酶启动子下游处的克隆位点,以产生反义RNA。CanIon插入片段最好含有基因组DNA序列或cDNA序列的至少100个或以上连续核苷酸。在含有经修饰的核糖核苷酸(即生物素-UTP和DIG-UTP)的核糖核苷酸存在下使该质粒线性化和转录。使过量的该双标记RNA与从所述细胞或组织分离的mRNA在溶液中杂交。杂交在标准严格杂交条件(40-50℃,含有80%甲酰胺、pH值7-80.4M氯化钠缓冲液中杂交16小时)下进行。用对单链RNA具有特异性的核糖核苷酸酯(即RNA酶CL3、T1、Phy M、U2或A)消化除去没有杂交的探针。存在的生物素-UTP修饰能够将杂交物捕获在包被有链霉亲和素的微滴定板上。存在的DIG修饰能够用与碱性磷酸酶偶联的抗DIG抗体通过ELISA检测或定量测定杂交物。
也可用阵列定量测定CanIon基因表达。本文所述的术语阵列意味着多个核酸的一维、二维或多维排列,而该多个核酸长度要足以特异性检测能够与其杂交的mRNA的表达。例如,此阵列可包含多个核酸,这些核酸衍生自其表达水平待评估的基因。这些阵列可包括CanIon基因组DNA、CanIon cDNA序列或其互补序列或其片段,特别是含有本发明至少一个双等位标记,优选双等位标记A1-A17至少一个的那些序列。这些片段最好长至少15个核苷酸。在其它实施例中,这些片段长至少25个核苷酸。在一些实施例中,这些片段长至少50个核苷酸。较优选的是,这些片段长至少100个核苷酸。在另一个优选实施例中,这些片段长至少100个核苷酸以上。在一些实施例中这些片段可以长500个核苷酸以上。
例如,按照Schena等(1995和1996年)所述的方法,用互补DNA显微阵列定量测定CanIon基因表达。以PCR扩增全长CanIon cDNA或其片段,用高速机器人(high-speed robotics)使它们从96孔微滴定板移到硅烷化显微镜玻片上重新排列。印刷阵列(printed arrays)在潮湿室中培养,使阵列元件重新复水,在0.2%SDS中洗一次,时间为1分钟,在水中洗两次,时间为1分钟,在硼氢化钠溶液中洗一次,时间为5分钟。在95℃将阵列浸在水中2分钟,转移到0.2%SDS浸1分钟,用水洗两次,风干,黑暗中储存于25℃。
分离细胞或组织的mRNA,或从市场购买,通过单轮逆转录制备探针。在60℃14×14mm玻璃盖玻片下使探针与1cm2微阵列杂交6-12小时。阵列在25℃低严格洗涤缓冲液(1×SSC/0.2%SDS)中洗5分钟,再在室温下高严格洗涤缓冲液(0.1×SSC/0.2%SDS)中洗10分钟。用设有定制过滤装置的萤光激光扫描装置在0.1×SSC溶液中扫描阵列。算出两次独立同杂交的平均比值,可以测定准确的差异表达。
也可用Pietu等(1996年)所述方法,用互补DNA阵列中全长CanIon cDNA或其片段定量分析CanIon基因表达。全长CanIon cDNA或其片段以PCR扩增,并点滴在膜上。然后,将各种组织或细胞来源的mRNA以放射活性核苷酸标记。在控制条件下进行杂交和洗涤后,用磷屏成像(phosphoimaging)或自动放射线照相术检测已杂交的mRNA。进行重复实验,并定量分析差异表达的mRNA。
此外,也可如Lockhart等(1996年)和Sosnowsky等(1997年)所述,通过高密度核苷酸阵列用CanIon基因组DNA、CanIon cDNA或其片段对表达进行分析。将序列具体是包含本发明双等位标记之一,优选包含选自A1A17的一个双等位标记的序列或其互补序列的15-20个核苷酸的寡核苷酸直接在芯片上合成(Lockhart等见上),或合成后置于芯片上(Sosnowski等见上)。此寡核苷酸最好长大约20个核苷酸。
从适当mRNA群合成以适当化合物如生物素、洋地黄毒苷或萤光染料标记的CanIon cDNA探针,然后使这些探针随机片段化为平均大小50至100个核苷酸的片段。然后使探针与该芯片杂交。按Lockhart等所述方法洗涤后,施加不同电场(Sosnowski等,1997年),检测和定量测定染料或标记化合物。进行重复杂交。对不同cDNA样品互相同靶寡核苷酸上cDNA探针产生的信号密度进行比较分析,表明CanIon mRNA的表达有差异。
抑制CanIon基因表达的方法
本发明其它治疗组合物的优点包括用CanIon核酸序列的寡核苷酸片段作为反义工具或三螺旋工具抑制相应CanIon基因的表达。Camlon核序列的优选片段含有双等位标记A1-A17之一的等位基团。
反义方法
本发明反义多核苷酸使用的优选方法是Sczakiel等(1995年)所述的步骤。
最好在与CanIon mRNA 5’端互补的多核苷酸(长15-200bp)中选择反义工具。在另一个实施例中,使用与所需靶基因不同部分互补的不同反义多核苷酸的组合。
本发明优选的反义多核苷酸与含有翻译起始密码子ATG或剪接供体或受体位点的CanIon mRNA序列互补。
反义核酸的长度和解链温度要足以形成胞内双链体,其稳定性足以抑制双链体中CanIon mRNA的表达。Green等(1986年)以及Izant和Weintraub(1984年)叙述了设计适合用于基因治疗的反义核酸的策略,具体可参考本文的引用文献。
在一些策略中,将CanIon编码区的取向与启动子的方向逆置,以便转录在细胞中正常转录的反向链,从而获得反义分子。用体外转录系统如采用T7或SP6聚合酶产生转录物的那些系统,转录该反义分子。另一种方法包括使含有反义序列的DNA与适当表达载体中的启动子操作性连接,体内转录CanIon反义核酸。
另外,Rossi等(1991年)、国际申请WO 94/23026、WO 95/04141、WO 92/18522以及欧洲申请EP 0 572 287 A2也叙述了适当的反义策略。
本发明采用的另一种反义技术包括使用核酶,所述核酶通过其互补多核苷酸尾部与靶序列结合,并且通过水解其靶位点(即“锤头核酶”(“hammerhead ribozymes”))切割相应的RNA。简单地说,锤头核酶的简化循环包括(1)通过互补反义序列使序列特异性结合于靶RNA;(2)定点水解靶链的可切割位点;以及(3)释放切割产物,产生另一个催化循环。的确,使用长链反义多核苷酸(长至少30个碱基)或带有长反义臂的核酶有优点。将这些反义核酶与亲脂基团共价键连续或用脂质体作为方便的载体,得到反义核酶的优选输送系统。按Sczakiel等(1995年)所述方法制备本发明的优选反义核酶,具体制备步骤可参照本文参考文献所引述的文章。
三螺旋方法
也可用CanIon基因组DNA抑制基于胞内三螺旋形成的CanIon基因的表达。
用三螺旋寡核苷酸抑制基因组的转录。它们特别适用于研究当细胞与特定基因有关时其活性的变化。
类似地,可用CanIon基因组DNA的一部分研究细胞内CanIon转录的抑制效应。传统上,认为同源嘌呤序列在三螺旋策略中是最有用的。然而,同源嘧啶序列也可抑制基因表达。这些同源嘧啶寡核苷酸结合于同源嘌呤:同源嘧啶序列的主沟槽(majorgroove)。故两种CanIon基因组DNA的序列也在本发明的范围内。
为了用三螺旋方法进行治疗,首先扫描CanIon基因组DNA的序列,以鉴定一段10-mer至20-mer的同源嘧啶或同源嘌呤序列,该序列可用在基于三螺旋的抑制CanIon表达的策略中。鉴定候选同源嘧啶或同源嘌呤序列后,将含有候选序列的各种含量寡核苷酸导入表达CanIon基因的组织培养细胞中,以评估它们抑制CanIon表达的效率。
可用本领域技术人员已知的各种方法将该寡核苷酸导入细胞中,包括但不限于磷酸钙沉淀、DEAE-葡聚糖、电穿孔、脂质体介导的转染或天然摄取。
用RNA印迹、RNA酶保护试验或基于PCR的策略等技术监测经处理细胞的细胞功能变化和CanIon表达的下降,从而鉴测经该寡核苷酸处理过的细胞中CanIon基因的转录水平。
如在反义方法中所述,用在上述反义方法中所述的技术以根据体外结果计算出的剂量将有效抑制组织培养细胞基因表达的寡核苷酸导入体内。
在一些实施例中,用α端基异构体取代该寡核苷酸单元的天然(β)端基异构体,赋予此寡核苷酸对核酶的更大抗性。此外,可使溴乙啶等嵌入剂附着于α寡核苷酸的3’端上,来稳定此三螺旋。要了解适合形成三螺旋的寡核苷酸的制备方法,可参看本文的引用文献Griffin等(1989年)。
药物组合物和制剂
调节CanIon的化合物
用本文所述方法可鉴定体内外能选择性调节CanIon活性的CanIon激动或拮抗化合物。因此,本发明包括治疗精神分裂症、双极情感障碍和本文所述其它疾病或症状患者的方法,该方法包括施用有效量的调节CanIon的化合物。优选的,所述化合物是选择性调节CanIon的化合物。例如,通过本发明方法鉴定的化合物包括对人CanIon肽具有结合特异性的抗体。还估计,CanIon类似物也可用于调节CanIon介导的活性以及与精神分裂症或双极情感障碍相关的有关生理状况。一般预计,本发明的基于CanIon在中枢神经系统疾病中作用的试验方法,可用于鉴定能够干扰本发明级联反应试验的化合物。在优选的实施方案中,对患有精神分裂症或双极情感障碍的患者的治疗是通过给予所述患者含有治疗有效量CanIon拮抗药的药物组合物进行的。
适应症
虽然CanIon与精神分裂症和双极情感障碍相关的基因组区连续,包括CanIon的适应症包括各种中枢神经系统疾病。神经系统疾病的遗传基础比较复杂,通常具有一些共同的症状。具体地说,如本文所述,适应症可包括精神分裂症和其它精神病、喜怒无常症、孤独症、药物成瘾和酗酒、癫痫精神发育不全疼痛疾病、及其它精神疾病,包括认知能力、焦虑、多食、冲动控制及人格障碍。疾病的定义可参考精神病的诊断和统计手册第四版(DSM-IV)此外许多心血管疾病包括心绞痛高血压和心律失常也可用Camlon调节剂、优选拮抗剂治疗。
药物制剂及给药途径
用本发明方法鉴定的化合物可单独或将它们与适当运载体或赋形剂混合而成的药物组合物以有效治疗剂量给予包括病人在内的哺乳动物,以治疗或减缓精神分裂症和双极情感障碍相关疾病。有效治疗剂量指足够使本文所述方法确定的症状缓解的化合物剂量。有效治疗剂量最好适合连续周期性服用或施用。制剂技术和直接应用的化合物的给药可参照最新版的“Remington’s药物科学”,Mack出版社,Easton,PA。
给药途径
给药的适当途径包括口服、经直肠、经粘膜、或肠内给药,经肠胃外输送,包括肌内、皮下、髓内注射以及胸内、直接心室内、静脉内、腹膜内、鼻内或眼内注射。中枢神经系统疾病的治疗化合物的一种特别有用的给药方法包括通过手术植入能在一段延长时间内输送该化合物的装置。特别考虑本发明药物的缓释制剂。
组合物/制剂
可用含有赋形剂和辅助剂的一种或多种生理上可接受的运载体以常规方式配制用于本发明的药物组合物和药剂。合适的制剂取决于所选择的给药途径。
本发明用于注射的药剂可配制成水溶液,最好是在生理上相容的缓冲液,如Hanks’s溶液、林格(Ringer’s)溶液,或者生理盐水,如磷酸盐或碳酸氢盐缓冲液。用于经粘膜给药时,可在制剂中使用能渗透屏障的适合渗透剂。这些渗透剂通常已为本领域所公知。
供口服的药物制剂包括明胶制成的推装(push-fit)胶囊、以及明胶和甘油或山梨醇等增塑剂制成的密封软胶囊。推装胶囊可含有活性成分和填充物,如乳糖,结合剂,如淀粉,和/或润滑剂,如滑石或硬脂酸镁,以及可任选地,稳定剂组成的混合物。在软胶囊中,可将活性化合物溶于或悬浮于适当液体中,如脂肪油、液体石蜡、或液体聚乙二醇。此外,还可加入稳定剂。所有供口服给药的制剂应配成适合给药的剂量。
以常规方式将口服组合物配制成片剂或锭剂形式。
本发明以吸入方式给药的化合物可借助适当的气体推进剂如二气化碳很容易从加压包或啧雾器以气溶胶形式输送。如果是加压气溶胶,可通过提供阀门(valve)来确定剂量单位以输送计好的量。例如用于吸入剂或吹入剂的明胶胶囊或药筒,可配制成含有化合物和乳糖或淀粉等适当粉未基质的粉末混合物。
也可配制经肠胃外注射例如药团注射(bolus injection)或连续静脉输注给药的化合物。供注射的制剂配成加入防腐剂的单位剂量形式,例如安瓿或多剂量容器中。组合物还可制成悬浮液、溶液或乳液水溶液等形式,并可含有配制剂,如悬浮剂、稳定剂和/或分散剂。
经肠胃外给药的药物制剂包括以水溶型式存在的活化化合物的水溶液。悬浮水溶液可包含增大悬浮液粘度的物质,如羟甲基纤维素钠、山梨醇、或葡聚糖。任选地,悬浮液还可包含适当的稳定剂或能增加化合物溶解性,从而可以制成高浓度溶液的试剂。
此外,活性成分使用前可以与适当运载体如无菌无热原的水形成粉末或冻干剂型。
除了上述制剂外,化合物也可配成贮存制剂。这样的长效制剂,可通过植入(如皮下或肌内)或通过肌内注射给药。例如,可使化合物与适当的聚合性或疏水性物质(如在可接受的油中作为乳剂)或离子交树脂一起配制,或作为微溶衍生物,如作为微溶盐。
另外,可用缓释系统输送化合物,如含有治疗药剂的固体疏水聚合物的半渗透基质。现已确定的缓释物质有很多种,它们已为本领域技术人员所公知。根据其化学性质,缓释胶囊释放化合物的时间为几星期,甚至长达100天以上。
根据治疗药剂的化学性质和生物稳定性,可采用另外一些稳定蛋白质的策略。
此药物组合物也可包含适当的固体或凝胶相运载体或赋形剂。这些运载体或赋形剂的例子包括但不限于碳酸钙、磷酸钙、各种糖类、淀粉、纤维素衍生物、明胶以及聚合物,如聚乙二醇。
有效剂量
适合本发明使用的药物组合物包括一些组合物,其中所包含的活性成分的有效量能够达到预期目的。更具体地说,有效治疗量是指能有效预防疾病发生或缓解接受治疗者的现有症状的量。确定有效量是本领域技术人员能力之内,特别是参照本发明详细叙述的内容。
可从细胞培养试验初步估计本发明方法使用的化合物的有效治疗量,可在动物模型中试用一个剂量。利用这些信息可更准确地确定人类使用的剂量。
有效治疗剂量指能够缓解病人症状的化合物量。用标准制药程序在细胞培养物或实验动物中可确定这些化合物的毒性和治疗效果,如确定LD50(对50%试验人群具有毒性剂量和ED50(对50%试验人群具有治疗效果的剂量)。毒性与治疗效果之间的剂量比率是治疗指数,它可表示为LD50与ED50之间的比值。优选治疗指数高的化合物。
从细胞培养试验和动物研究所得的数据可用于配制人用的剂量范围。这些化合物的剂量最好在包括ED50和,低毒或者无毒性的计算的浓度范围内。剂量可在这个范围内变化取决于所用的剂量及采用的给药途径。根源病人的状况由各个医生选择准确的制剂和给药途径(例如,参看Fingl等的“治疗的药理基础”第一章,1975年)。和计算机有关的实施方案
如本文所述,术语“本发明的核酸密码”包括的核苷酸序列基本上由以下组成,或者由以下任意一种组成:a)至少12、15、18、20、25、30、35、40、50、60、70、80、90、100、150、200、500、1000、2000、3000、4000、5000或10000个SEQ ID No1-3核苷酸的连续跨距;b)至少12、15、18、20、25、30、35、40、50、60、70、80、90、100、150、200、500、1000、2000、3000、4000、5000或6000个SEQ ID No 4核苷酸的连续跨距或者其互补物;c)至少12、15、18、20、25、30、35、40、50、60、70、80、90、100、150、200、500、1000、2000、3000、4000、5000或10000个SEQ ID Nos1-3核苷酸的连续跨距,其中,所述连续跨距包含选自A1-A17的双等位标记;d)至少12、15、18、20、25、30、35、40、50、60、70、80、90、100、150、200、300或400个SEQ ID No 6核苷酸的连续跨距;e)至少12、15、18、20、25、30、35、40、50、60、70、80、90、100、150、200、300或400个SEQ ID No 6核苷酸的连续跨距,其中,所述连续跨距包含双等位标记A18;以及f)与上述核苷酸序列任意一种互补的核苷酸序列。
所述“本发明的核酸密码”还包含与以下同源的核苷酸序列:a)至少12、15、18、20、25、30、35、40、50、60、70、80、90、100、150、200、500、1000、2000、3000、4000、5000或10000个SEQ ID No1-3核苷酸的连续跨距;b)至少12、15、18、20、25、30、35、40、50、60、70、80、90、100、150、200、500、1000、2000、3000、4000、5000或6000个SEQ ID No 4核苷酸的连续跨距;c)至少12、15、18、20、25、30、35、40、50、60、70、80、90、100、150、200、300或400个SEQ ID No6核苷酸的连续跨距;以及d)和上述任意一种序列互补的序列。同源序列是指相对于这些连续跨距,具有至少99%、98%、97%、96%、95%、90%、85%或75%的同源性的序列。可使用本文所述的方法确定同源性,所述方法包括具有默认参数或者具有修改参数的BLAST2N。同源序列也可以包括RNA序列,其中尿嘧啶代替了本发明核酸密码中的胸腺嘧啶。应认识到,本发明的核酸密码可以传统的单字母形式表示(见Stryer,Lubert.Biochemistry背页的内面,第3版.W.H Freeman & Co.,New York)或者以任何其它记录核苷酸在序列中身份的格式或密码表示。
如本文所述的,术语“本发明的多肽密码”包括含有至少6、8、10、12、15、20、25、30、40、50、100、150、200、300、400、500、700、1000、1200、1400、1600或1700个SEQ ID No5氨基酸的连续跨距的多肽序列。在优选的实施方案中,所述连续跨距包括SEQ ID No5第277、338、574、678、680、683、691、692、695、696、697、894、1481、1481、1483、1484、1485、1630、1631、1632、1636、1660、1667、1707、1709位的至少1、2、3、5、或10氨基酸。应认识到,本发明的多肽密码可以以传统的单字母形式或者三字母形式表示(见Stryer,Lubert.Biochemistry背页的内面,第3版.W.H Freeman & Co.,New York)或者任何其它记录序列中多肽身份的形式或密码表示。
本领域的技术人员可以理解,本发明的核苷酸密码和本发明的多肽密码可以在任何媒介上储存、记录以及操作,它们可以通过计算机读出或者存储。如本文所示,单词“记录”和“储存”是指用于将信息储存到计算机媒介上的过程。该领域技术人员可以方便地采用任何现有方法,将信息记录到计算机可读媒介上,产生包含本发明一种或多种核酸密码或者本发明一种或多种多肽密码的制品。本发明另一方面是其上已经记录了本发明至少2、5、10、15、20、25、30或50个核酸密码的计算机可读媒介。本发明另一方面是其上已经记录了本发明至少2、5、10、15、20、25、30或50个多肽密码的计算机可读媒介。
计算机可读媒介包括磁性可读媒介、光可读媒介、电子可读媒介和磁/光媒介。例如,所述计算机可读媒介可以是硬盘、软盘、磁带、CD-ROM、数字万能盘(DVD),随机存取存储器(RAM)或者只读存储器(ROM)以及其它本领域技术人员已知的其它媒介类型。
本发明的实施方案包括系统,具体是存储和操作本文所述的序列信息的计算机系统。在图2中以方块图的形式说明了计算机系统100的一个实施例。如本文所述,“计算机系统”是指用于分析本发明核酸密码的核苷酸序列或者本发明多肽密码的氨基酸序列的硬件、软件和数据存储部件。在一个实施方案中,所述计算机系统100是SunEnterprise 1000服务器(Sun Microsystems,Palo Alto,CA)。计算机系统100宜包括用于处理、存取和操作序列数据的处理器。处理器105可以是任何已知类型的中央处理器,如Intel Corporation的奔腾III,或者Sun、Motorola、Compaq或者International Business Machines的类似处理器。
计算机系统100宜为通用系统,它包括处理器105和存储数据的一个或多个内部数据存储部件110,以及一个或多个用于检索存储在所述数据存储部件上的数据的数据检索装置。该领域技术人员不难明白任意一种目前可以获得的计算机都是合适的。
在一个具体实施方案中,计算机系100包括连接于母线的处理器105和一个或多个内部数据存储装置110,所述母线连接于主存储器115(宜为RAM),装置110例如硬盘驱动器和/或其上记录了数据的其它计算机可读媒介。在一些实施方案中,计算机系统100还包括一个或多个数据检索装置118,用于读取存储在内部数据存储装置110上的数据。
数据检索器件118例如可以为软盘驱动器、高密度磁盘驱动器、磁带驱动器等、在一些实施方案中,内部数据存储装置110是包含控制逻辑和/或其上记录的数据的可移动式计算机可读媒介如软盘、高密度磁盘、磁带等。计算机系统100可以有利地包括或者通过从插入在数据检索器件中的数据存储部件读取控制逻辑和/或数据的合适软件来运行程序。
计算机系统100包括显示器120,用于向计算机用户显示输出。还应注意到计算机系统100可以和局域网或者广域网中的其它计算机系统125a-c连接,提供通向计算机系统100的集中入口通道。
用于存取和处理本发明核酸密码的核苷酸序列或者本发明多肽密码的氨基酸序列的软件(例如,检索工具、比较工具和模型工具等)在执行过程中可以驻留在主存储器115中。
在一些实施方案中,计算机系统100还可以包括序列比较器,比较器可参考存储在计算机可读媒介中的核苷酸或者多肽序列,比较上述存储在计算机可读媒介上的本发明的核酸密码或者本发明的多肽密码。“序列比较器”是指一种或多种在计算机系统100上执行的程序,用于将核苷酸序列或者多肽序列和其它核苷酸或者多肽序列和/或包括但不限于存储在数据存储装置中的肽、肽模拟物(peptidomimetics)和化学物质的化合物进行比较。例如,所述序列比较器可以参考存储在计算机可读媒介上的序列,比较存储在计算计可读媒介上的本发明核酸密码的核苷酸序列或者本发明多肽密码的氨基酸序列,来鉴定同源物、涉及生物功能的基序或者结构基序。本专利说明书中特别考虑了所的各种序列比较程序用于本发明这一方面。
图3是说明程序器200的一个实施方案的流程图,用于将新的核苷酸或者蛋白质序列与序列数据库进行比较,以确定新序列和数据库中的序列之间的同源程度。所述序列的数据库可以是存储在计算机系统100中的保密数据库,或通过Internet可以获得的公共数据库如GENBANK、PIR或SWISSPROT。
所述程序200开始于开始阶段201,然后移到阶段202,其中,待比较的新序列存储到计算机系统100的存储器中。如上所述,该存储器可以是任何类型存储器,包括RAM或者内部存储装置。
程序200然后转移到阶段204中,在这里,开放序列数据库,用于分析和比较。然后将程序200转移到阶段206,在这里,将存储在数据库中的第一序列读入计算机的存储中。然后,在阶段210中进行比较,来确定所述第一序列是否和第二序列相同。重点注意的是,这一步骤不限于进行所述新序列和数据库中第一序列之间的精确比较。对于比较两种核苷酸或者蛋白质序列来说,即使它们不相同,本领域的技术人员也知道那些熟知的方法。例如,可以将缺口引入一个序列中,以提高两种测试序列之间的同源水平。在比较过程中控制是否将缺口或其它特征引入测试序列中的参数,通常由计算机系统的用户输入。
一旦在阶段210进行了两种序列的比较,在决定阶段210就可作出两种序列是否.相同的判断。当然,术语“相同”不限于绝对相同的序列。在用户输入的同源参数范围内的序列在程序200中均可以标为“相同”。
若作出两种序列是相同的判断,将程序200移到阶段214,在这里,从数据库来的序列名称就会显示给用户。这一阶段通知用户,具有所示名称的序列完成了所输入的同源物限制。一旦所存储的序列的名称显示给用户,程序200移到决定阶段218,在此作出在数据库中是否存在更多序列的判断。若在数据库中不存在更多的序列,那么程序200移到阶段224,在此,指示器移到数据库中的下一个序列,使它可以与新的序列比较。以这种方式中,排列对比新序列与数据库中的每一个序列。
应注意到,若在决定阶段212已经作出了所述序列不同源的判断,那么程序200将立即移到决定阶段218,以确定数据库中是否存在任何可比较的其它序列。
因此,本发明一方面包括处理器、其上存储了本发明核酸密码或者本发明多肽密码的数据存储装置、具有和本发明核酸密码或者本发明多肽密码进行比较的参考核苷酸序列或多肽序列的可存储的数据存储装置,以及用于进行比较的比较器。序列比较器可以显示所比较序列之间的同源水平,或者鉴定本发明核酸密码和本发明多肽序列密码中的涉及生物功能的基序和结构基序,或者它可以鉴定和这些核酸密码和多肽密码比较的序列中的结构基序。在一些实施方案中,所述数据存储装置其上已经存储至少2、5、10、15、20、25、30或50个本发明核酸密码或本发明多肽密码的序列。
本发明另一方面是用于测定本发明核酸密码和参考核苷酸序列之间同源性水平的方法,所述方法包括如下步骤:通过使用能测定同源水平的计算机程序读出核酸密码和参考核苷酸序列,用该计算机程序确定此核酸密码与参考核苷酸序列之间的同源性。所述计算机程序可以是任何一种用于测定同源水平的计算机程序,包括那些本文中具体列举的,包括具有默认参数或修改参数的BLAST2N。该方法也可以通过使用上述的计算机系统读取本发明2、5、10、15、20、25、30或50个上述核酸密码并确定该核酸密码和参考核苷酸序列之间的同源性来进行。
图4说明计算机中程序250的一个实施方案的流程图,用于确定两种序列是否同源。程序250开始于开始阶段252,然后移到阶段254,在此,将待比较的第一序列存入存储器中。然后,在阶段256中将待比较的第二序列存入存储器中。然后,程序250移到阶段260,在此,读出第一序列中的第一字符,然后移到阶段262,在此读出第二序列的第一字符。应理解,若所述序列是核苷酸序列,那么所述字符通常为A、T、C、G或U中的一个。若所述序列是蛋白质序列,那么它应是以单字母表示的氨基酸密码,使第一和随后的序列可以方便地进行比较。
然后在决定阶段264中,作出两个字符是否相同的判断。若它们相同,那么程序250移到阶段268,在此,读取第一和第二序列中下一个字符。然后,作出下一个字符是否相同的判断。若它们相同,那么程序250继续这种循环,直到两个字符不相同。若作出接着的两个字符不相同的判断,程序250移到决定阶段274,来确定是否读取两序列中更多的字符。
若不读取多的字符,那么程序250移到阶段276,在此,将第一和第二序列之间同源水平显示给用户。通过计算第一序列中和序列总数不相同的序列之间字符的比例来确定同源水平。这样,若第一个100核苷酸序列的每个字符按第二序列中的每个字符排列,那么同源水平就为100%。
或者,计算机程序可以是比较本发明核酸密码的核苷酸序列和参考核苷酸序列,来确定在一个或多个位置上本发明核酸密码是否和参考核酸序列不同的计算机程序。任选地,该程序记录了本发明参考多肽或者核酸密码中任一序列的长度和插入、删除或者替换的核苷酸的身份。在一个实施方案中,此计算机程序可以是确定相对于参考核苷酸序列,本发明核酸密码的核苷酸序列是否包含一种或多种单一核苷酸多形性(SNP)的程序。这些单一核苷酸多形态可能各自包含单一碱基替换、插入或者删除。
本发明另一方面是测定本发明多肽密码和参考多肽序列之间同源水平的方法,该方法包括使用能测定同源水平的计算机程序读出多肽密码和参考多肽序列,并用计算机程序确定多肽密码和参考多肽序列之间的同源性。
因此,本发明的另一方面是确定本发明核酸密码在一个或多个核苷酸上不同于参考核苷酸序列的方法,该方法包括使用能鉴定核苷酸序列之间的差异的计算机程序读出核苷酸密码和参考核苷酸序列,并用计算机程序鉴定该核苷酸密码和参考核苷酸序列之间的差异。在一些实施方案中,此计算机程序是鉴定单一核苷酸多形性的程序。此方法可以通过上述计算机以及图4中所述的方法来进行。此方法的进行也可以使用计算机程序通过读取本发明和参考核苷酸序列的至少2、5、10、15、20、25、30或50个核酸密码,并用计算机程序鉴定该核酸密码和参考核苷酸序列之间的差异。
在其它实施方案中,计算机系统还包括用于鉴定本发明核酸密码的核苷酸序列或者本发明多肽密码的氨基酸序列中的特征的识别器。
“识别器”指一种或多种用于鉴定上述本发明核酸密码的核苷酸序列或者本发明多肽密码的氨基酸序列中某一特征的程序。在一个实施方案中,识别器可以包括能鉴定本发明cDNA密码中开放读框的程序。
图5是说明识别器程序300的一个实施方案的流程图,用于探测序列中存在的特征。程序300开始于开始阶段302,然后移到阶段304,在此,特待核查特征的第一序列存储到计算机系统100的存储器115中。然后,程序300移到阶段306,在此打开序列特征的数据库。这种数据库可以包括一列按特征命名归类的各个特征。例如,特征名可以是“起始密码子”属性可以为“ATG”。另一例子可以是特征名为“TAATAABox”其特征属性为“TAATAA”。这种数据库的例子由University of WisconsinGenetics Computer Group(www.gcg.com)制造。
一旦特征数据库在阶段306打开,程序300移到阶段308,在此,从所述数据库中读取第一特征。然后在阶段310作出第一特征和第一序列的属性比较。然后在阶段316作出第一序列中是否发现特征属性的判断。若发现了此属性,那么程序300移到阶段318,在此,将所发现的特征名显示给用户。
然后程序300移到决定阶段320,在此,确定在数据库中是否存在更多(move)的特征,若不存在更多的特征,那么程序300在终止阶段324终止。但是,若在数据库中存在更多的特征,那么程序300在阶段326中读取下一个序列的特征,并循环回到阶段310,在此将所述下一特征的属性和所述第一序列作比较。
应注意,若在决定阶段316,第一序列中没有发现此特征属性的话,程序300直接移到决定阶段320,以确定在数据库中是否存在任何更多的特征。
在另一实施方案中,识别器可以包括分子模型程序,用于确定本发明多肽密码的三维结构。在一些实施方案中,分子模型程序可鉴定靶序列,该靶序列与代表已知三维蛋白质结构中残基结构环境的轮廓最相容。(参见美国专利No.5,436,850)。在另一技术中,把某给定家族中蛋白质的三维结构相重叠,来明确该家属中结构上保守的区域。这种蛋白质模型技术也采用同源蛋白质已知的三维结构,来接近本发明多肽密码的结构。(参见例如美国专利No.5,557,535)。已常规采用了常规的同源模型技术来建立蛋白酶和抗体的模型。(Sowdhamini等,(1997))。当感兴趣的蛋白质和模板蛋白质的序列相同性不佳时,也可以采用相当的方法来开发三维蛋白质模型。在一些情况下,尽管具有很弱的序列相同性,蛋白质可折叠成类似的三维结构。例如,许多螺旋型细胞因子的三维结构可折叠成类似的三维布局,而不管序列同源性多弱。
现在,编织法(threading mtehod)的最新进展能在许多情况中鉴定类似的折叠模式,这些情况是靶和模板之间的结构相关性不能在序列水平探测到。在使用多序列编织(MST)进行折叠识别的混合法中,使用间距几何程序DRAGON从编织输出减去结构相等量,来构成低分辨率模型、并使用分子模型包如QUANTA来构成全原子成分(fullatomrepresentation)。
按照这种3-步方法,首先使用新型折叠识别算法MST来鉴定候选的模板,MST能将多个排列对比序列同时编织到一个或多个3-D结构中。第二步,将从MST输出获得的结构相等量转变为残基间的间距限制,并与二级结构预测获得的辅助信息一起输入间距几何程序DRAGON中。该程序以不偏倚的方式综合了约束条件,并迅速产生大量的低分辨率模型确证。第三步,将这些低分辨率模型确证转变为全原子(full-atom)模型,并用分子模型包QUANTA来使能量最化(见Aszodi等,(1997))。
然后此分子模型分析的结果可用于合理的药物设计技术中,来鉴定能调节本发明多肽密码活性的试剂。
因此,本发明另一方面是鉴定本发明核酸密码或者本发明多肽密码中特征的方法,该方法包括使用能鉴定其中特征的计算机程序读取核酸密码或者多肽密码,并用此计算机程序鉴定核酸密码或者多肽密码中的特征。在一个实施方式中,计算机程序包括能鉴定开放读框的计算机程序。在又一实施方案中,计算机程序鉴定多肽序列中的结构基序。在另一实施方案中,此计算机程序包括分子模型程序。所述方法可通过使用计算机程序读取一个序列或者至少2、5、10、15、20、25、30或50个本发明的核酸密码或本发明的多肽密码,并用该计算机程序鉴定核酸密码或者多肽密码中的特征。
本发明的核酸密码或者本发明的多肽密码可以在各种格式的各种数据处理程序中存储和操作。例如,它们可以作为文字处理文件的文本如Microsoft WORD或者WORDPERFECT或者作为ASCII文件存储到本领域技术人员熟悉的各种数据库程序中,如DB2、SYBASE或者ORACLE。此外,可以使用许多计算机程序和数据库作为序列比较器,识别器或者用于和本发明核酸密码或本发明多肽密码进行比较的参照核苷酸或多肽序列的来源。下表并不限制本发明,但是提供了使用本发明核酸密码或本发明多肽密码的程序和数据库的指南。可用的程序和数据库包括,但不限于:MacPattern(EMBL)、DiscoveryBase(Molecular Applications Group)、GeneMine(Molecular Applications Group)、Look(Molecular Applications Group)、MacLook(Molecular Applications Group)、BLAST和BlAST2(NCBI)、BLASTIN和BLASTX(Altshul等,1990)、FASTA(Pearson和Lipman,1998)、FASTDB(Brulag等,1990)、Catalyst(Molecular Simulations Inc.)、Catalyst/SHAPE(MolecularSimulations Inc.)、Cerius2.DBAccess(Molecular Simulations Inc.)、HypoGen(Molecular Simulations Inc.)、Insight II(Molecular Simulations Inc.)、Discover(Molecular Simulations Inc.)、CHARMm(Molecular Simulations Inc.)、Felix(Molecular Simulations Inc.)、DelPhi(Molecular Simulations Inc.)、QuanteMM(Molecular Simulations Inc.)、Homology(Molecnlar Simulations.Inc),Modeler(Molecular Simulations Inc ISIS(Molecular Simulations Inc.)、Quanta/Protein Design(Molecular Simulations Inc.)、WebLab(MolecularSimulations Inc.)、WebLeb Diversity Explorer(Molecular Simulations Inc.)、Gene Explorer(Molecular Simulations Inc.)、SeqFold(Molecular SimulationsInc.)、EMBL/Swissprotein数据库、MDL Avaiable Chemicals Directory数据库、MDL Drug Data Report数据库、Comprehensive Medicinal Chemistry数据库、Derwents’s World Drug Index数据库、BioByteMasterFile数据库、Genbank数据库以及Genseqn数据库。许多其它程序和数据库对于在本公开所给的领域中的任一技术人员来说是显而易见的。
使用上述程序可检测的基序包括编码亮氨酸拉链结构、螺旋-转角-螺旋基序、糖基化位点、遍在蛋白化位点,α-螺旋以及β片层的序列、编码指引编码蛋白质分泌的信号肽的信号序列、涉及转录调节的序列如同源框、酸延伸、酶活性位点、底物结合位点和酶切割位点。
在本申请中,引用了各种公报、专利和公开的专利申请。本申请参考的这些公报、专利和公开的专利申请的内容引用于本文的内容中,用于更加完善地说明本发明属于的技术条例。
实施例
实施例1
双等位标记-DNA提取物的鉴定
供体是无关且健康的。它们代表了足够的代表法国异质人群的多样性。从100个个体中提取DNA,并检测双等位标记。
在EDTA存在下,从各供者获取30ml外周静脉血。2000rpm。离心10分钟收集细胞(沉块)。用裂解液(50ml最终体积:10mMTris pH7.6,5mM MgCl2,10mM NaCl)溶解红细胞。以裂解液重悬浮细胞沉块后,离心该溶液(10分钟,2000rpm.)许多次,必须除去上清液中残留的红细胞。
42℃用3.7ml含有以下组分的裂解液将白细胞沉块裂解过夜:
-3ml TE 10-2(Tris-HCl 10mM,EDTA 2mM)/NaCl 0.4M
-200μl SDS 10%
-500μl K-蛋白酶(溶于TE 10-2/NaCl 0.4M中的2mg K-蛋白酶)
为了提取蛋白质,加入1ml饱和NaCl(6M)(1/3.5体积/体积)。剧烈搅拌之后,10000rpm.离心此溶液20分钟。
为了沉淀DNA,向上述上清液中加入2-3体积的100%乙醇,并2000rpm.离心此溶液30分钟。用70%乙醇淋洗DNA溶液3次,2000rpm.离心20分钟。37℃干燥沉淀物,重悬于1mlTE 10-1或1ml水中。通过测量260nm的OD值来估算DNA的浓度(1单位OD=50μg/ml DNA)。
为了确定DNA溶液中存在蛋白质,测定OD 260/OD 280比值。在以下所述的后续实施例中仅使用OD 260/OD 280比值为1.8-2的DNA制品。
通过混合各个体的相等量的DNA来构成合并物。
实施例2
双等位标记的鉴定:通过PCR扩增基因组DNA
在以上获得的DNA合并物上进行实施例1的DNA样品的特异性基因组序列的扩增。此外,类似地扩增了50个个体样品。
使用以下方案进行PCR试验:
最终体积                              25μl
DNA                                   2ng/μl
MgCl2                                 2mM
dNTP(每种)                            200μM
引物(每种)                            2.9ng/μl
Ampli Taq Gold DNA聚合酶              0.05单位/μl
PCR缓冲液(10x=0.1M trisHCl pH8.30.5M KCl)    1x
使用本文所公开的CanIon基因序列信息和OSP软件(Hiilier&Green,1991)设计了各对第一引物。这种第一对引物是长约20个的核苷酸,并具有表1中标为PU和RP栏所公开的序列。
表1
扩增子   在SEQ ID1中此扩增子的位置范围   引物名称 SEQ ID No1中扩增引物的位置范围   引物名称   SEQ ID No1中扩增引物的互补位置范围
  99-62626   12343   12810   B1   12343   12363   C1   12793   12810
  99-62632   13814   14296   B2   13814   13832   C2   14279   14296
  99-62633   24863   25396   B3   24863   24881   C3   25378   25396
  99-62611   69198   69650   B4   69198   69218   C4   69632   69650
  99-62605   73005   73483   B5   73005   73022   C5   73466   73483
  99-62635   79808   80334   B6   79808   79826   C6   80314   80334
扩增子   在SEQ ID2中此扩增子的位置范围   引物名称 SEQ ID No2中扩增引物的位置范围   引物名称   SEQ ID No2中扩增引物的互补位置范围
  99-79335   51031   51559   B7   51031   51051   C7   51539   51559
  99-79336   60925   61374   B8   60925   60945   C8   61354   61374
  99-79338   80271   80720   B9   80271   80290   C9   80700   80720
  99-79339   91037   91486   B10   91037   91056   C10   91466   91486
  99-79314   100285   100784   B11   100285   100305   C11   100764   100784
  99-79316   106568   107020   B12   106568   106585   C12   107000   107020
  99-79322   165864   166401   B13   165864   165884   C13   166381   166401
  99-79306   235713   236210   B14   235713   235732   C14   236190   236210
扩增子   在SEQ ID3中此扩增子的位置范围   引物名称 SEQ ID No3中扩增引物的位置范围   引物名称   SEQ ID No3中扩增引物的互补位置范围
  99-79310   31618   32100   B15   31618   31635   C15   32080   32100
  99-79311   42324   42723   B16   42324   42344   C16   42704   42723
扩增子   引物名称 SEQ ID No6中扩增引物的位置范围   引物名称   SEQ ID No6中扩增引物的互补位置范围
  99-62617   B17   1   20   C17   435   453
所述引物宜包含作为扩增目标的特异性碱基上激的共同寡核苷酸,用于测序。
引物PU包含以下额外的PU 5’序列:TGTAAAACGACGGCCAGT;引物RP包含以下RP’5序列:CAGGAAACAGCTATGACC。在SEQ ID No7中列出了包含额外PU’5序列的引物。在SEQ ID No8中列出了包含额外RP’5序列的引物。
按氨基磷酸酯(phosphoramidite)方法在GENSET UFPS 24.1合成仪上进行这些引物的合成。
在Genius II热循环仪上进行DNA扩增。95℃加热10分钟之后,进行40轮循环。每轮包括:95℃30秒,54℃1分钟,72℃30秒。对于最终延伸,72℃10分钟结束扩增。使用荧光计和作为嵌入剂(intercalant agent)(Molecular Probes)的Picogreen在96孔微量滴定板上测定获得的扩增产物的量。
实施例3
双等位标记的鉴定-对扩增的基因组DNA测试并鉴定多形性
在ABI 377测序仪上进行实施例2中获得的扩增DNA的测序。使用带有染色终止子循环测序程序的自动的双脱氧终止子测序反应来确定该扩增产物的序列。在测序凝胶上跑测序反应产物电泳,并用凝胶成像分析(ABI Prism DNA Sequencing Analysis软件(2.1.2版本))确定其序列。
进一步评估算序列数据,以检测扩增片段中双等位标记的存在。多形性检索依据电泳模式中上述同一位置存在不同的碱基而产生的重叠峰。
在扩增的17个片段中,检测到18个双等位标记。这些双等位标记的位置显示在表2中。
表2
扩增子 BM 标记名称          多形性   SEQ ID中BM位置
  all1   all2   No1   No4
  99-62626   A1   99-62626-168   12642
  99-62632   A2   99-62632-275   14088
  99-62633   A3   99-62633-409   24981
  99-62611   A4   99-62611-51   69248
  99-62605   A5   99-62605-56   73428
  99-62635   A6   99-62635-443   80250
扩增子 BM 标记名称         多形性   SEQ ID中BM位置
  all1   all2   No2   No4
  99-79335   A7   99-79335-60   51090
  99-79336   A8   99-79336-369   61293
  99-79338   A9   99-79338-332   80602
  99-79314   A10   99-79314-201   100485
  99-79314   A11   99-79314-225   100509
  99-79316   A12   99-79316-158   106725   1658
  99-7932   A13   99-7932-224   166087
  99-79322   A14   99-79322-473   166336
  99-79306   A15   99-79306-182   235894
扩增子 BM 标记名称         多形性   SEQ ID中BM位置
  all1   a112   No3   No4
  99-79310   A16   99-79310-29   31646
  99-79311   A17   99-79311-50   42373
扩增子 BM 标记名称         多形性   SEQ ID中BM位置
  all1   all2   No6
  99-62617   A18   99-62617-105   105
BM指“双等位标记”。All1和All2分别指该双等位标记中的等位基因1和等位基因2。
表3
  BM   标记名称   SEQ ID No1中探针的位置范围   探针
  A1   99-62626-168   12630   12654   P1
  A2   99-62632-275   14076   14100   P2
  A3   99-62633-409   24969   24993   P3
  A4   99-62611-51   69236   69260   P4
  A5   99-62605-56   73416   73440   P5
  A6   99-62635-443   80238   80262   P6
  BM   标记名称   SEQ ID No2中探针的位置范围   探针
  A7   99-79335-60   51078   51102   P7
  A8   99-79336-369   61281   61305   P8
  A9   99-79338-332   80590   80614   P9
  A10   99-79314-201   100473   100497   P10
  A11   99-79314-225   100497   100521   P11
  A12   99-79316-158   106713   106737   P12
  A13   99-7932-224   166075   166099   P13
  A14   99-79322-473   166324   166348   P14
  A15   99-79306-182   235882   235906   P15
  BM   标记名称   SEQ ID No 3中探针的位置范围   探针
  A16   99-79310-29   31634   31658   P16
  A17   99-79311-50   42361   42385   PP17
  BM   标记名称   SEQ ID No6中探针的位置范围   探针
  A18   99-62617-105   93   117   P18
实施例4
通过微量测序来验证多形性
进一步证实了实施例3中所鉴定的双等位标记,并通过微量测序来确定了它们的各自频率。对实施例1中所述的各个体DNA样品进行了微量测序。
如上所述,通过PCR进行了个体基因组DNA的扩增,使用相同的一套PCR引物检测该双等位标记(表1)。
在微量测序中使用的优选引物长约19个核苷酸,并恰好在所认为的多形性碱基
的上游杂交。本发明在微量测序中使用的引物在表4中作详细说明。
表4
标记名称   双等位标记 Mis.1   SEQ ID No1中微量测序引物Mis.1的位置范围   Mis.2   SEQ ID No1中微量测序引物Mis.2的互补位置
  99-62626-168   A1   D1   12623   12641   E1   12643   12661
  99-62632-275   A2   D2   14069   14087   E2   14089   14107
  99-62633-409   A3   D3   24962   24980   E3   24982   25000
  99-62611-51   A4   D4   69229   69247   E4   69249   69267
  99-62605-56   A5   D5   72409   73427   E5   73429   73447
  99-62635-443   A6   D6   80231   80249   E6   80251   80269
标记名称   双等位标记 Mis.1   SEQ ID No2中微量测序引物Mis.1的位置范围   Mis.2   SEQ ID No2中微量测序引物Mis.2的互补位置
  99-79335-60   A7   D7   51071   51089   E7   51091   51109
  99-79336-369   A8   D8   61274   61292   E8   61294   61312
  99-79338-332   A9   D9   80583   80601   E9   80603   80621
  99-79314-201   A10   D10   100466   100484   E10   100486   100504
  99-79314-225   A11   D11   100490   100508   E11   100510   100528
  99-79316-158   A12   D12   106706   106724   E12   106726   106744
  99-7932-224   A13   D13   166068   166086   E13   166088   166106
  99-79322-473   A14   D14   166317   166335   E14   166337   166335
  99-79306-182   A15   D15   235875   235893   E15   235895   235913
标记名称   双等位标记 Mis.1   SEQ ID No3中微量测序引物Mis.1的位置范围   Mis.2   SEQ ID No3中微量测序引物Mis.2的互补位置
  99-79310-29   A16   D16   E16   31647   31665
  99-79311-50   A17   D17   E17   42374   42392
标记名称   双等位标记 Mis.1   SEQ ID No6中微量测序引物Mis.1的位置范围   Mis.2   SEQ ID No6中微量测序引物Mis.2的互补位置
  99-62617-105   A18   D18   86   104   E18   106   124
Mis1和Mis2分别指微量测序引物,与CanIon基因的非编码链或者与CanIon基因的编码链杂交。
所述微量测序反应如下所述进行:
纯化扩增产物之后,按照厂商的推荐在20μl最终体积中加入10pmol微量测序寡核苷酸、1U Thermosequenase(Amersham E79000G)、1.25μl Thermosequenase缓冲液(260mM trisHCl pH9.5,65mM MgCl2)以及与各测试双等位标记的多形性位点处的核苷酸互补的两种相应的荧光ddNTPs(Perkin Elmer,Dye Terminator Set 401095)来制备微量测序反应混合物。94℃4分钟后,在Tetrad PTC-225热循环仪(MJ Research)中进行20轮PCR循环,每轮55℃15秒,72℃5秒、94℃10秒。然后,通过乙醇沉淀除去未结合的染色终止子。在甲醛-EDTA负载缓冲液中最后重悬所述样品,并在加载到聚丙烯酰胺测序凝胶上之前,95℃加热2分钟。使用ABI PRISM 377DNA测序仪收集数据,并用CanIon SCAN软件(Perkin Elmer)进行处理。
凝胶分析后,用软件自动处理数据,此软件能确定各扩增片段中存在的双等位标记的等位基因。
该软件评估这些因素:上述微量测序程序产生的信号强度是否弱、正常或者已饱和,或者信号是否不明确。此外,该软件能鉴定出显著的峰(根据形状和高度标准)。在显著的峰中,以它们的位置为基础,可鉴定出靶位点所对应的峰。当在同一位置处检测到两个显著的峰时,根据高度比率,将各样品分类为结合型或杂合型。
实施例5
制备针对CanIon蛋白质的抗体组合物
从含有编码CanIon蛋白质或者其部分的表达载体感染的或转化的细胞分离获得基本纯的蛋白质或者多肽。例如,通过Amicon过滤装置进行浓缩,调节最终制品中蛋白质的浓度到几微克/毫升的水平。然后,如下所述制备针对该蛋白质的单克隆或者多克隆抗体:
A.通过杂交瘤融合产生单克隆抗体
根据Kohler,G和Milstein,C(1975)的经典方法或其衍生方法,可从小鼠杂交瘤制备对CanIon蛋白质或者其部分中的抗原决定基的单克隆抗体。也可以参见Harlow,E和D.Lane,1988。
简而言之,用几微克CanIon蛋白质或者其部分在几星期内反复接种小鼠。然后,处死小鼠,并分离产生抗体的脾细胞。借助聚乙二醇将脾细胞和小鼠骨髓瘤细胞融合,并且通过在含氨基喋呤(HAT培养基)的选择性培养基上培养该系统来破坏过量的未融合细胞。稀释成功融合的细胞,并将等分稀释液接种于微量滴定板的孔中,继续培养生长。用免疫试验程序如ELISA(最早在Engvall(1980)中报道)及其衍生方法,检测诸孔上清液中的抗体来鉴定产生抗体的克隆细胞。选出的阳性克隆可以扩增,并收获它们的单克隆抗体产品。在Davis,L等人的molecular Biology Elsevier,New York.第21-2章中的Basic Methods中说明了单克隆抗体产生的详细程序。
B.免疫接种制备多克隆抗体产品
可通过用CanIon蛋白质或者其部分(可以是未修饰或修饰的以提高免疫原性)免疫接种合适的非人类动物,制备含有对CanIon蛋白质或者其部分的异源性表位的抗体的多克隆抗血清。合适的非人动物宜为非人哺乳动物,通常选自大鼠,小鼠,家兔、山羊或马。或者,可采用CanIon浓度丰富的粗制品来产生抗体。在存在本领域已知的合适佐剂(例如,氢氧化铝、RIBI等)下,将这种蛋白质、片段或者制品引入非人类哺乳动物中。除了蛋白质外,可以用能提高抗原性的试剂来预处理片段或制品,这种试剂是本领域已知的,包括例如甲基化牛血清白蛋白(mBSA)、牛血清白蛋白(mBSA)、乙型肝炎表面抗原和钥孔血兰蛋白(KLH)。按已知的程序,收集免疫接种动物的血清,进行处理和测试。若血清含有针对不需要的表位的多克隆抗体,可通过免疫亲和层析纯化该多克隆抗体。
有效的多克隆抗体制备受到抗原以及宿主种类有关的许多因素的影响。而且,宿主动物对接种部位、剂量的反应不相同,抗原剂量的不足或者过量可导致低滴度抗血清。多处皮内位点给予小剂量抗原(ng水平)看来最可靠。在本领域知道制备和加工多克隆抗血清(antisera)的技术,例如可参见Mayer和Walker(1987)。在Vaitukaitis,J等(1971)中可以找到家兔的有效免疫方案。
可以以有规律的间隔进行加强注射,当例如在琼脂中对已知抗原浓度进行免疫双扩散作半定量测定,当抗体滴度开始降低时,收获抗血清。例如,可见Ouchterlony,O等(1973)。抗体的平台浓度通常为每毫升血清0.1-0.2mg(约12μM)。通过绘制竞争性结合曲线可以确定抗血清对抗原的亲和力,如Fisher,D(1980)所述的那样。
按照单克隆或多克隆方案制备的抗体制品可用于定量免疫试验,确定生物样品中携带抗原的物质的浓度,它们也用于半定量或者定性鉴定生物样品中抗原的存在。所述抗体也可以用于杀伤表达该蛋白质的细胞或者降低该蛋白质体内含量的治疗组合物中。
虽然已经说明和描述了本发明的优选实施方案,但是应认识到,在不背离本发明的精神和范围下,本领域的技术人员可以作出各种改变。
参考文献:
Abbondanzo SJ等,1993,《酶学方法》Methods in Enzymology,Academic Press,New York,pp 803-823.
Ajioka R.S.等,Am.J.Hum.Genet.,60:1439-1447,1997.
Altschul等,1990,J.Mol.Biol.215(3):403-410.
Altschul等,1993,Nature Genetics 3:266-272.
Altschul等,1997,Nuc.Acids Res.25:3389-3402.
Ames,R.S.等J.Immunol.Methods 184:177-186(1995).
Anton M.等,1995,J.Virol.,69:4600-4606.
Araki K等(1995)Proc.Natl.Acad.Sci.USA.92(1):160-4.
Ashkenazi,A.等PNAS 88:10535-10539(1991).
Aszódi等,《蛋白质:结构,功能和遗传学》(Proteins:Structure,Function,and Genetics,增补本1:38-42(1997).
Ausubel等(1989)Current Protocols in Molecular Biology,Green PublishingAssociates and Wiley Interscience,N.Y
Bartunek,P.等Cytokine 8(1):14-20(1996).
Baubonis W.(1993)Nucleic Acids Res.21(9):2025-9.
Beaucage等,Tetrahedron Lett 1981,22:1859-1862.
Better,M.等Science 240:1041-1043(1988).
Bradley A.,1987,“嵌合小鼠的产生和分析”(Production and analysis ofchimaeric mice).E.J.Robertson(编著),Teratocarcinomas and embryonic stemcells:A practical approach.IRL Press,Oxford,pp.113.
Bram RJ等,1993,Mol.Cell Biol.,13:4760-4769.
Brinkman U.等J.Immunol.Methods 182:41-50(1995).
Brown EL,Belagaje R,Ryan MJ,Khorana  HG,Methods Enzymol1979;68:109-151.
Brutlag等Comp.App.Biosci.6:237-245,1990.
Brzustowicz等,Am.J.Hum.Genet.65:1096-1103(1999).
Bulman等,Hum.Mol.Gen.6(10)1679-1685(1997).
Burton,D.R.等Advances in Immunology 57:191-280(1994).
Bush等,1997,J.Chromatogr.,777:311-328.
Carlson,N.G.等J.Biol.Chem.272(17):11295-11301(1997).
Chai H.等(1993)Biotechnol.Appl.Biochem.18:259-273.
Chee等(1996)Science.274:610-614.
Chen和Kwok Nucleic Acids Research 25:347-3531997.
Chen等(1987)Mol.Cell.Biol.7:2745-2752.
Chen等Proc.Natl.Acad.Sci.USA 94/2010756-10761,1997.
Chen,Z.等Cancer Res.58(16):3668-3678(1998).
Cho RJ等,1998,Proc.Natl.Acad.Sci.USA,95(7):3752-3757.
Chou J.Y.,1989,Mol.Endocrinol.,3:1511-1514.
Clark A.G.(1990)Mol.Biol.Evol.7:111-122.
Coles R,Caswell R,Rubinsztein DC,Hum Mol Genet 1998;7:791-800.
Compton J.(1991)Nature.350(6313):91-92.
Davis L.G.,M.D.Dibner,和J.F.Battey,《分子生物学基础方法》(BasicMethods in Molecular Biology),ed.,Elsevier Press,NY,1986.
Dempster等,(1997)J.R.Stat.Soc.,39B:1-38.
Deng,B.等Blood 92(6):1981-1988(1998).
Dent DS & Latchman DS(1993)“DNA迁移率移位试验”(The DNA mobility shiftassay).《转录因素:实用方法》(Transcription Factors:A Practical Approach)(Latchman DS,ed.)pp1-26.Oxford:IRL Press.
Eckner R.等(1991)EMBO J.10:3513-3522.
Edwards等Leatherbarrow,Analytical Biochemistry,246,1-6(1997).
Engvall,E.,Meth.Enzymol.70:419(1980).
Excoffier L.和Slatkin M.(1995)Mol.Biol.Evol.,12(5):921-927.
Feldman和Steg,1996,Medecine/Sciences,synthese,12:47-55.
Felici F.,1991,J.Mol.Biol.,Vol.222:301-310.
Fell,H.P.等J.Immunol.146:2446-2452(1991).
Fields和Song,1989,Nature,340:245-246.
Fisher,D.,Chap.42《临床免疫性手册》Manual of Clinical Immunology,第二版(Rose和Friedman编著)Amer.Soc.For Microbiol.,Washington,D.C.(1980).
Flotte等(1992)Am.J.Respir.Cell Mol.Biol.7:349-356.
Fodor等(1991)Science 251:767-777.
Fraley等(1979)Proc.Natl.Acad.Sci.USA.76:3348-3352.
Fried M,Crothers DM,Nucleic Acids Res 1981;9:6505-6525.
Fromont-Racine M.等,1997,Nature Genetics,16(3):277-282.
Fuller S.A.等(1996)Immunology in Current Protocols in MolecularBiology,Ausubel等编,John Wiley & Sons,Inc.,USA.
Furth P.A.等(1994)Proc.Natl.Acad.Sci USA.91:9302-9306.
Garner MM,Revzin A,Nucleic Acids Res 1981;9:3047-3060.
Geysen H.Mario等1984.Proc.Natl.Acad.Sci.U.S.A.81:3998-4002.
Ghosh和Bacchawat,1991,“将脂质体靶向肝细胞”(Targeting of liposomesto hepatocytes),《肝疾病,用特异性受体和配体的靶向性诊断和治疗》LiverDiseases,Targeted diagnosis and therapy using specific rceptors and ligands.Wu等编.,Marcel Dekeker,New York,pp.87-104.
Gillies,S.D.等J.Immunol.Methods 125:191-202(1989).
Gillies,S.O.等PNAS 89:1428-1432(1992).
Gonnet等,1992,Science 256:1443-1445.
Gonzalez等,1992,Science 256:1443-1445.
Gopal(1985)Mol.Cell.Biol.,5:1188-1190.
Gossen M.等(1992)Proc.Natl.Acad.Sci.USA.89:5547-5551.
Gossen M.等(1995)Science.268:1766-1769.
Graham等(1973)Virology 52:456-457.
Green等,Ann.Rev.Biochem.55:569-597(1986).
Greenspan和Bona,FASEB J.7(5):437-444(1989).
Griffin等Science 245:967-971(1989).
Grompe,M.(1993)Nature Genetics.5:111-117.
Grompe,M.等(1989)Proc.Natl.Acad.Sci.U.S.A.86:5855-5892.
Gu H.等(1993)Cell 73:1155-1164.
Gu H.等(1994)Science 265:103-106.
Guatelli J C等Proc.Natl.Acad.Sci.USA.35:273-286.
Hacia JG,Brody LC,Chee MS,Fodor SP,Collins FS,Nat Genet1996;14(4):441-447.
Hall L.A.和Smirnov I.P.(1997)Genome Research,7:378-388.
Hames B.D.和Higgins S.J.(1985)《核酸杂交实用方法》(Nucleic AcidHybridization:A Practical Approach).Hames和Higgins,Pfugers Arch.391,85-100(1981).
Hammerling,等,《单克隆抗体和T-细胞杂交瘤》(MONOCLONAL ANTIBODIES ANDT-CELL HYBRIDOMAS)563-681(El sevier,N.Y.,1981).
Harju L,Weber T,Alexandrova L,Lukin M,Ranki M,Jalanko A,Clin Chem1993;39(11Pt 1):2282-2287.
Harland等(1985)J.Cell.Biol.101:1094-1095.
Harlow,E.,and D.Lane.1988.《抗体实验室手册》(Antibodies A LaboratoryManual).Cold Spring Harbor Laboratory.pp.53-242.
Harper JW等,1993,Cell,75:805-816.
Harrop,J.A.等J.Immunol.161(4):1786-1794(1998).
Hawley M.E.等(1994)Am.J.Phys.Anthropol.18:104.
Hell等,Annals N.Y.Acad.Sci.747:282-293(1994).
Henikoff和Henikoff,1993,Proteins 17:49-61.
Higgins等,1996,Methods Enzymol.266:383-402.
Hillier L.和Green P.Methods Appl.,1991,1:124-8.
Hoess等(1986)Nucleic Acids Res.14:2287-2300.
Huang L.等(1996)Cancer Res 56(5):1137-1141.
Huston等Methods in Enzymology 203:46-88(1991).
Huygen等(1996)Nature Medicine.2(8):893-898.
Izant JG,Weintraub H,Cell 1984Apr;36(4):1007-15.
Julan等(1992)J.Gen.Virol.73:3251-3255.
Kanegae Y.等,Nucl.Acids Res.23:3816-3821(1995).
Karlin和Altschul,1990,Proc.Natl.Acad.Sci.USA 87:2267-2268.
Kettleborough,C.A.等Eur.J.Immunol.24:952-958(1994)
Khoury J.等,《遗传流行病学基础》(Fundamentals of Genetic Epidemiology),Oxford University Press,NY,1993.
Kim U-J.等(1996)Genomics 34:213-218.
Klein等(1987)Nature.327:70-73.
Koch等,J.Biol.Chem.265(29):17786-17791(1990)
Kohler,G.和Milstein,C.,Nature 256:495(1975).
Koller等(1992)Annu.Rev.Immunol.10:705-730.
Kozal MJ,Shah N,Shen N,Yang R,Fucini R,Merigan TC,Richman DD,MorrisD,Hubbell E,Chee M,Gingeras TR,Nat Med 1996;2(7):753-759.
Landegren U.等(1998)Genome Research,8:769-776.
Lange K.(1997)《基因分析的数学和统计学方法》(Mathematical andStatistical Methods for Genetic Analysis).Springer,New York.
Lee等,FEBS Lett.445 231:236(1999).
Lenhard T.等(1996)Gene.169:187-190.
Liautard,J.等Cytokinde 9(4):233-241(1997).
Lin MW等,Hum.Genet.,99(3):417-430(1997).
Linton M.F.等(1993)J.Clin.Invest.92:3029-3037.
Liu Z.等(1994)Proc.Natl.Acad.Sci.USA.91:4528-4262.
Livak等,Nature Genetics,9:341-342,1995.
Livak KJ,Hainer JW,Hum Mutat 1994;3(4):379-385.
Lockhart等Nature Biotechnology 14:1675-1680,1996.
Lucas A.H.,1994,《B型血友病偶联物的进展和临床应用》(Development andCl inical Uses of Haempophi lus b Conjugate).
Manager等,Anal.Biochem.214:190-194(1993).
Mansour S.L.等(1988)Nature.336:348-352.
Marshall R.L.等(1994)PCR Methods and Applications.4:80-84.
McCormick等(1994)Genet.Anal.Tech.Appl.11:158-164.
McLaughl in B.A.等(1996)Am.J.Hum.Genet.59:561-569.
Morena等,Annals NY Acad.Sci.102-117(1999).
Mori等,Nature 350:198-402(1991).
Morrison,Science 229:1202(1985).
Morton N.E.,Am.J.Hum.Genet.,7:277-318,1955.
Muller,Y.A.等Structure 6(9):1153-1167(1998).
Mullinax,R.L.等BioTechniques 12(6):864-869(1992).
Muzyczka等(1992)Curr.Topics in Micro.and Immunol.158:97-129.
Nada S.等(1993)Cell 73:1125-1135.
Nagy A.等,1993,Proc.Natl.Acad.Sci.USA,90:8424-8428.
Naramura,M.等Immunol.Lett.39:91-99(1994).
Narang SA,Hsiung HM,Brousseau R,Methods Enzymol 1979;68:90-98.
Neda等(1991)J.Biol.Chem.266:14143-14146.
Newton等(1989)Nucleic Acids Res.17:2503-2516.
Nickerson D.A.等(1990)Proc.Natl.Acad.Sci.U.S.A.87:8923-8927.
Nicolau C.等,1987,Methods Enzymol.,149:157-76.
Nicolau等(1982)Biochim.Biophys.Acta.721:185-190.
Nissinoff,J.Immunol.147(8):2429-2438(1991).
Nyren P,Pettersson B,Uhlen M,Anal Biochem 1993;208(1):171-175.
O’Reilly等(1992)《杆状病毒表达载体:实验室手册》(Baculovirus ExpressionVectors:A Laboratory Manual)W.H.Freeman and Co.,New York.
Ohno等(1994)Science.265:781-784.
Oi等,BioTechniques 4:214(1986).
Oldenburg K.R.等,1992,Proc.Natl.Acad.Sci.,89:5393-5397.Olesen等,《电压门控离子通道调节剂》(Voltage gated ion channelmodulators),12月7-8,Philadelphia PA,USA(1995).
Orita等(1989)Proc.Natl.Acad.Sci.U.S.A.86:2776-2770.
Ott J.,Analysis of Human Genetic Linkage,John Hopkins University Press,Baltimore,1991.
Ouchterlony,O.等,Chap.19《免疫学实验手册》(Handbook of ExperimentalImmunology)D.Wier编Blackwell(1973).
Padlan E.A.,Molecular Immunology 28(4/5):489-498(1991).
Parmley和Smith,Gene,1988,73:305-318.
Pastinen等,Genome Research 1997;7:606-614.
Pearson和Lipman,1988,Proc.Natl.Acad.Sci.USA 85(8):2444-2448.
Pease S.ans William R.S.,1990,Exp.Cell.Res.,190:209-211.
Perlin等(1994)Am.J.Hum.Genet.55:777-787.
Persic,L.等Gene 1879-18(1997).
Peterson等,1993,Proc.Natl.Acad.Sci.USA,90:7593-7597.
Pietu等Genome Research 6:492-503,1996.
Pitard,V.等J.Immunol.Methods 205(2):177-190(1997).
Potter等(1984)Proc.Natl.Acad.Sci.U.S.A.81(22):7161-7165.
Prat,M.等J.Cell.Sci.111(Pt2):237-247(1998).
Ramunsen等,1997,Electrophoresis,18:588-598.
Reid L.H.等(1990)Proc.Natl.Acad.Sci.U.S.A.87:4299-4303.
Risch,N.和Merikangas,K.(Science,273:1516-1517,1996).
Robertson E.,1987,“胚胎衍生的干细胞系”(Embryo-derived stem cell lines).E.J.Robertson编.《畸胎癌和胚胎肝细胞:实用方法》(Teratocarcinomas andembrionic stem cells:a practical approach).IRL Press,Oxford,pp.71.
Roguska M.A.等PNAS 91:969-973),(1994).
Rossi等,Pharmacol.Ther.50:245-254,(1991).
Roth J.A.等(1996)Nature Medicine.2(9):985-991.
Roux等(1989)Proc.Natl.Acad.Sci.U.S.A.86:9079-9083.
Ruano等(1990)Proc.Natl.Acad.Sci.U.S.A.87:6296-6300.
Sambrook,J.,Fritsch,E.F.,and T.Maniatis.(1989)《分子克隆实验指南》(Molecular Cloning:A Laboratory Manual).第二版.Cold Spring HarborLaboratory,Cold Spring Harbor,New York.
Samson M,等(1996)Nature,382(6593):722-725.
Samulski等(1989)J.Virol.63:3822-3828.
Sanchez-Pescador R.(1988)J.Clin.Microbiol.26(10):1934-1938.
Sarkar,G.和Sommer S.S.(1991)Biotechniques.
Sauer B.等(1988)Proc.Natl.Acad.Sci.U.S.A.85:5166-5170.
Sawai,H.等AJRI 34:26-34(1995).
Schedl A.等,1993a,Nature,362:258-261.
Schedl等,1993b,Nucleic Acids Res.,21:4783-4787.
Schena等Science 270:467-470,1995.
Schena等,1996,Proc Natl Acad Sci USA,.93(20):10614-10619.
Schneider等(1997)《Arlequin:一种用于人群基因数据分析的软件》(Arlequin:A Software For Population Genetics Data Analysis).University of Geneva.
Schwartz和Dayhoff,编,1978,《检测距离关系的基质:蛋白质序列和结构图》(Matrices for Detecting Distance Relationships:Atlas of Protein Sequenceand Structure),Washington:National Biomedical Research Foundation.
Sczakiel G.等(1995)Trends Microbiol.3(6):213-217.
Shay J.W.等,1991,Biochem.Biophys.Acta,1072:1-7.
Sheffield,V.C.等(1991)Proc.Natl.Acad.Sci.U.S.A.49:699-706.
Shizuya等(1992)Proc.Natl.Acad.Sci.U.S.A.89:8794-8797.
Shoemaker DD,等,Nat Genet 1996;14(4):450-456.
Shu,L.等PNAS 90:7995-7999(1993).
Skerra,A.等Science 240:1038-1040.(1988).
Smith(1957)Ann.Hum.Genet.21:254-276.
Smith等(1983)Mol.Cell.Biol.3:2156-2165.
Sosnowski RG,等,Proc Natl Acad Sci USA 1997;94:1119-1123.
Sowdhamini等,Protein Engineering 10:207,215(1997).
Spielmann S.and Ewens W.J.,Am.J.Hum.Genet.,62:450-458,1998.
Spielmann S.等,Am.J.Hum.Genet.,52:506-516,1993.
Sternberg N.L.(1992)Trends Genet.8:1-16.
Sternberg N.L.(1994)Mamm.Genome.5:397-404.
Stryer,L.,Biochemistry,4th edition,1995.
Studnicka G.M.等Protein Engineering 7(6):805-814(1994).
Syvanen AC,Clin Chim Acta 1994;226(2):225-236.
Szabo A.等Curr Opin Struct Biol 5,699-705(1995).
Tacson等(1996)Nature Medicine.2(8):888-892.
Taryman,R.E.等Neuron 14(4):755-762(1995).
Te Riele等(1990)Nature.348:649-651.
Terlau等,Naturwi ssenschaften 85:437-444(1998).
Terwilliger J.D.和Ott J.,Handbook of Human Genetic Linkage,JohnHopkins University Press,London,1994.
Thomas K.R.等(1986)Cell.44:419-428.
Thomas K.R.等(1987)Cell.51:503-512.
Thompson等,1994,Nucleic Acids Res.22(2):4673-4680.
Tur-Kaspa等(1986)Mol.Cell.Biol.6:716-718.
Tyagi等(1998)Nature Biotechnology.16:49-53.
Urdea M.S.(1988)Nucleic Acids Research.11:4937-4957.
Urdea M.S.等(1991)Nucleic Acids Symp.Ser.24:197-200.
Vaitukaitis,J.等J.Clin.Endocrinol.Metab.33:988-991(1971).
Valadon P.,等,1996,J.Mol.Biol.,261:11-22.
Van der Lugt等(1991)Gene.105:263-267.
Vil,H.等PNAS 89:11337-11341(1992).
Vlasak R.等(1983)Eur.J.Biochem.135:123-126.
Wabiko等(1986)DNA.5(4):305-314.
Walker等(1996)Clin.Chem.42:9-13.
Wang等,1997,Chromatographia,44:205-208.
Weir,B.S.(1996)Genetic data Analysis II:Methods for discrete populationgenetic Data,Sinauer Assoc.,Inc.,Sunderland,MA,U.S.A.
Westerink M.A.J.,1995,Proc.Natl.Acad.Sci.,92:4021-4025.
White,M.B.等(1992)Genomics.12:301-306.
White,M.B.等(1997)Genomics.12:301-306.
Williams等,Science 257:389-395(1992).
Wong等(1980)Gene.10:87-94.
Wood S.A.等,1993,Proc.Natl.Acad.Sci.USA,90:4582-4585.
Wu和Wu(1987)J.Biol.Chem.262:4429-4432.
Wu和Wu(1988)Biochemistry.27:887-892.
Wu等(1989)Proc.Natl.Acad.Sci.U.S.A.86:2757.
Yagi T.等(1990)Proc.Natl.Acad.Sci.U.S.A.87:9918-9922.
Yoon,D.Y.等J.Immunol.160(7):3170-3179(1998).
Zhang等,Neuropharmacology 32(11):1075-1088(1993).
Zhao等,Am.J.Hum.Genet.,63:225-240,1998.
Zheng,X.X.等J.Immunol.154:5590-5600(1995).
Zhu,Z.等Cancer Res.58(15):3209-3214(1998).
Zou Y.R.等(1994)Curr.Biol.4:1099-1103.
序列表
<110>根瑟特公司(GENSET)
<120>与精神分裂症相关的电压门控离子通道基因及蛋白质
<130>93.WO1
<141>2001-12-04
<150>US 60/251,317
<151>2000-12-05
<160>8
<170>Patent.pm
<210>1
<211>82293
<212>DNA
<213>智人(Homo sapiens)
<220>
<221>misc_feature
<222>1..2000
<223>5’调节区
<220>
<221>exon
<222>2001..2026
<223>外显子1
<220>
<221>exon
<222>19188..19334
<223>外显子2
<220>
<221>exon
<222>22996..23178
<223>外显子3
<220>
<221>exon
<222>39731..39814
<223>外显子4
<220>
<221>exon
<222>41337..41476
<223>外显子5
<220>
<221>exon
<222>41565..41693
<223>外显子6
<220>
<221>exon
<222>73013..73167
<223>外显子7
<220>
<221>allele
<222>12642
<223>99-62626-168:多态性碱基A或T
<220>
<221>allele
<222>14088
<223>99-62632-275:多态性碱基A或G
<220>
<221>allele
<222>24981
<223>99-62633-409:多态性碱基A或T
<220>
<221>allele
<222>69248
<223>99-62611-51:多态性碱基A或C
<220>
<221>allele
<222>73428
<223>99-62605-56:多态性碱基A或G
<220>
<221>allele
<222>80250
<223>99-62635-443:多态性碱基A或G
<220>
<221>primer_bind
<222>12343..12363
<223>99-62626.rp
<220>
<221>primer_bind
<222>12793..12810
<223>99-62626.pu补体
<220>
<221>primer_bind
<222>13814..13832
<223>99-62632.pu
<220>
<221>primer_bind
<222>14279..14296
<223>99-62632.rp补体
<220>
<221>primer_bind
<222>24863..24881
<223>99-62633.rp
<220>
<221>primer_bind
<222>25378..25396
<223>99-62633.pu补体
<220>
<221>primer_bind
<222>69198..69218
<223>99-62611.pu
<220>
<221>primer_bind
<222>69632..69650
<223>99-62611.rp补体
<220>
<221>primer_bind
<222>73005..73022
<223>99-62605.rp
<220>
<221>primer_bind
<222>73466..73483
<223>99-62605.pu补体
<220>
<221>primer_bind
<222>79808..79826
<223>99-62635.pu
<220>
<221>primer_bind
<222>80314..80334
<223>99-62635.rp补体
<220>
<221>primer_bind
<222>12623..12641
<223>99-62626-168.mis
<220>
<221>primer_bind
<222>12643..12661
<223>99-62626-168.mis补体
<220>
<221>primer_bind
<222>14069..14087
<223>99-62632-275.mis
<220>
<221>primer_bind
<222>14089..14107
<223>99-62632-275.mis补体
<220>
<221>primer_bind
<222>24962..24980
<223>99-62633-409.mis
<220>
<221>primer_bind
<222>24982..25000
<223>99-62633-409.mis补体
<220>
<221>primer_bind
<222>69229..69247
<223>99-62611-51.mis
<220>
<221>primer_bind
<222>69249..69267
<223>99-62611-51.mis补体
<220>
<221>primer_bind
<222>73409..73427
<223>99-62605-56.mis
<220>
<221>primer_bind
<222>73429..73447
<223>99-62605-56.mis补体
<220>
<221>primer_bind
<222>80231..80249
<223>99-62635-443.mis
<220>
<221>primer_bind
<222>80251..80269
<223>99-62635-443.mis补体
<220>
<221>misc_binding
<222>12630..12654
<223>99-62626-168.探针
<220>
<221>misc_binding
<222>14076..14100
<223>99-62632-275.探针
<220>
<221>misc_binding
<222>24969..24993
<223>99-62633-409.探针
<220>
<221>misc_binding
<222>69236..69260
<223>99-62611-51.探针
<220>
<221>misc_binding
<222>73416..73440
<223>99-62605-56.探针
<220>
<221>misc_binding
<222>80238..80262
<223>99-62635-443.探针
<220>
<221>misc_feature
<222>2375,2377,4041..4042,5180,7138,7174,10118,12577,12637,12648,13556
     15322,15341,15357,15383,15409,15994,16064..16065,16077,16237
     16264,17751,19182,19424,20735,20840,21865,21885,21900,22814,23954
     24969,24985,25001,25005..25006,25017,25040,25057,26646,27478
     27496,29278,30793,31122,31125,34515,34541,34563,34572,34884,34915
     36809,36834,36944,37011,39862,39881,39895,39903,39921,39948
     39954..39955,41108,42572,43423,44122,53546,53634,55777,56140
     56160,56182,56185,56200,56206,56219,56234,56258,56268,56280,56290
     56324,56561,57259,58256,58297,58910,59321,60724,60743,68789,68803
     68871,69936,77190,77484,78780,78891,79343,80394,81773,81795,82232
<223>n=a,g,c或t
<400>1
catcaatgca ctccaggcta ggcaacggag ataggccttg tctctaaaaa taacaaagaa     60
aacaaaagaa gagagatact gagcaggtag aaggggtact atgatatttt ggatgtacct    120
gttttttaaa atgattgtct actccaatac acagtgaatc cctatgcatt ataggatgag    180
tgtgctggat tccatgactt ccttgaagcc catgaattct ctgagactgt ctccatcatc    240
attgggattg tttggctcat gagcatgaat tatagagact taacagaggt agttcaacca    300
aggacagaga aaggtctgaa atgcctgttg ggtgaggagt ggcactgaga ttagtaaaaa    360
atcactgcct tgaccacttc aaaacattat aaataaatgt ttaaatattt ccttaatata    420
atttactaac agataattcg aacgaatgtc aaggaataac acactatcat tcagctacca    480
tatatatata gctatatatt tcagtttgtg aaataaacta gtatttagaa caagcaattg    540
aaagccgcaa ataaagatga tgaaacaagt tggtaaatac tttttctaag caaactggtt    600
gtagatttag cattgtttaa attactgtca attttttctt atgaggagtg atttcatcat    660
ttgtttaaaa cctggctttt gacacagttt ttctgaagtc tttagaaatt tgaaaaatta    720
tctcgcatga ctctgtattt catgaaatac caatatttta acatttccct gtaaacaata    780
aaacgtacta atatggatta tgaatgtgaa caaattgtga atggactttt taagaaagta    840
gattaattaa atatctgtaa ccagaaaata catttttaaa atgtaggttt gtgtagtttt    900
acttctatac cttgccacat aacattttgt gatagacaaa tgctctttgt ttagaatttc    960
tcttgtagag aaagcttcat tcagttgttt ctttcccttt atttatatgc ctgtgtgcat   1020
gatgtctaaa tcactggtca ggagttccct ggggattttc gtatctgact acatggcaag   1080
attccagacc caaagtaaac ctttcagaga gtgggaatga gtgggaggat gtcgccctgg   1140
gcatggtgct taggaggcca gatttcccta aacctgctct gctgggagcc ctaggaagcc   1200
tcagatgcag tctgctgtcc aggtatactc acagggtatg gggtggggga ctgtcaattt   1260
ctgaatagac tttgtctcat ccacacgaca acatatttta attttaaagg cgaacgtcaa   1320
cctatttaga aaactataag tgtgactgat gcattcatta tttaataact ccggggtgaa   1380
acttgaggtg aacggtttca ccctttcata ctcaggaatg gaactagtcc tcggtaccgt   1440
gcacagtctg acctcacgct cgcacgctgg gctcccggcc tcctggcagt gcacttaagt   1500
gtaccccgcg tgtgcccggc ggactcccgt gcacaccgcc gccgtgctgt tgagtacgaa   1560
agacccccga gaggagctcg cagatgagag cctagctgtt gctgtgagac tgactgcggg   1620
tggcagccgg caagaaggaa ctgccagtac cgaccctggc gctccccacc aactgcggcg   1680
cagcctcctc tgcggtgccc gcccttcggc atcactgcag tccctgtagc aaagctaact   1740
ttaaaaattt aaataaaata ataatttttt aaaggcccga aaactccggc tcccacccct   1800
cccccagcct gcccggcggc ggcggcgctc agtgagtgac acggcgagcg tgagccgcgg   1860
ccccagccgg gccgagcgcg ctgcctgagc tgagccgccg taggtgaggg gcccgcgtcc   1920
ccgcccgccc tgggcgccgc gcctggcact gatcctgccg gtcgcccact gtcgccgccg   1980
ccgccgcccg cgggcaccat gacagctctg agcgctgggg ttacaggttg gtcaccgccg   2040
ccggtgcccg ggaggctgcg gcgcggccgg ctccgtgccc tgcgcccgag gcccgcgatg   2100
cgcgctcgtt agttccttgg ccggtccggg ccaggacggc tcaggggcgc tggggctgcg   2160
agaggggctg ctagaggggc tgcgggcggg ggccccgcgc gggggagggg tggggagggg   2220
cgcctccacc cgagagcggg gcggtggggt ccttgccggc ctggccgggg cgcgggagcc   2280
gcgatgcgcc ctccctattc ctgcgcgtgg gtgtcggggg cgcctgccgc gggatgcccc   2340
tgggctggct tgggaagccc agggccggcg acacntnggg cctgccccgc ctgggcatct   2400
agcaggtgtt ggggggcagg tggctgagga cgaggccact gggcatcact acagcgctgc   2460
acctgccccc tcggcaccag ggccgctgcc tgggtaaacc tctgggccaa cgcgcgggtg   2520
gggaggtggg ggtgggcagc ctggctccag caggtctccg cgggggctcc gcggccttgc   2580
cccaccccca tgctcctgtg gattgctcct tgctaaatgt cccttatgat attcattggc   2640
cttgttaagc agccgtcatt agggtggcta caccgaacgc aaaacagtgt cctgccaagc   2700
aacaccattt tgtcactgaa tctttaagac accagcaagg atggcctggc tgggatccct   2760
ctgggggccc agatcgcagt cattttgctg acttaatgtt cctctttcag gatggtgtga   2820
gaatgctgaa ctcagaccct tagtgcttga aataccttag aataaatctt tcagtttcag   2880
gtacaatttt tcagacactg tattattaag gatgtgtgaa tacacgctca ctttcaggcc   2940
tcagaaggtt ttactcttaa tctggtgttc gtgtggtcat cagctaggcc cgactgccct   3000
ggtggtgaaa tgtgggttga ggaccagtga ccttcgtgtt agtagttggt ggataacacc   3060
tctaataggg gatcaaaaat taacaggtgg cgattttgaa atatatatgt atgtatatat   3120
atatatatat gtgtgtgatt tgtatgttca taactacaac tgtgatttga tatggcctgg   3180
gagaggagcg gtttcactat ggtagttacc cctgaggcag atgcatctca ggactggctt   3240
tttaaattca aagataaggt ttccacagtt ctaaataaaa atcatggctt cccaaacatc   3300
tgcaacgaga aacatttact ccctaactgg ttggctgtca ttctgcgtgc ttttctagag   3360
tcgatttttc gttcttctgt agtatacttt gacctagcca ctgctaaaac cagacagtgt   3420
gaagacaaaa tccagctttg gagaaaaact taaaaagtga aaaggttcag ttggatcctc   3480
ttctgtgttc atagaagaca taatctgttt gcagaataaa tgtgccgtca ctgataagga   3540
ctatgctaaa atctctacag aactctagga gaaagcatgt cttataaaat agtggttgta   3600
cacttataac tttggatagg acttgcaaga tattcaaagg agaaatgtac ttaaaaaatg   3660
tacttaaaaa aagtctactc aaaatagtgt catttagttg caatttagtg aactgaagat   3720
ttgagtagca ttttcttctt cttgggtatg gcatttcttt gaaatggttt ccaggtgatt   3780
ttatcattcc ggcatgcttt gtgtgtgcat gtatgtgtat acacaaatgt acacatttgt   3840
tttatcattt atcgatgatg ttcagataat ttcagaattt ccatagctgt ataaatttat   3900
cccaggtcag agtcacatgt ggatttcaag tttgtgaatg aaaattcaca tctacacctc   3960
tatatcctaa gataagctaa gcactgggcc agaagctggg tggtgagtga gaaaaagaga   4020
taaactgaga gcctaagaat nnttcaggaa agacaaatat gtaagcaggt ggatatacag   4080
tgagatgtct tattttctag ttttgctgtg gaaactatga tagtgagctt aaacatatta   4140
agaatggtcc ccaaggccac acacggtggc tcatgcctat aatcccagca ctttgggagg   4200
ccaaggcagg cctattgctt gaacccaaga gtccagacca gcctgggcaa catggtgaaa   4260
ccccgtctct acaaaaaaaa aaaaaattca ccaagtgtag tggtgtacac ctgtagcccc   4320
agttacttgg gaggctgagg tggaaggatc gcgtgagccc agagatgtca aggctgcagc   4380
aggctatgat ggcaccactg tactctagaa tgggcgactg ggcacagagt gagactctgt   4440
ttaaaaataa aaaaagaatg cccctgtccc aaaatgttat caacatttta gagcttcact   4500
catgttatac aattctcgcc tgtctcaagg accagcacag attttcatac cttcaaactc   4560
tatgcaaatg cttaaatttt tttaattgat tttttgaatt ttaaagtaac caaagttgat   4620
agagatgata gaatgataga gaaaaaagag taaacagcta gttttaataa ccgaagacag   4680
atgaccacaa tatctgtgtg ttttttgtag tctttttaag ggcttgactt caggtagttg   4740
tcatcgtggc attggacaac ttttatactg tttttaccac tgaatattta ttataaatat   4800
ttaaaatatt tctatataat tttcttactt aaaaattgta aatggctgta taacaccata   4860
cccagtaaat acagcctcat atatttaacc atacctctat cattggacat ttgctgtttc   4920
cagtttttca tcattataaa cagtgtcctg atagttataa tgtagagatt tatttctatt   4980
ttatgttttt cagtataaat atccaaatat gtccatatct gtcacctatt tttccatatc   5040
ttcaaattgg tttcctgaaa aattcagatt ataatttatt tatgataaat ttccagtaat   5100
tatgtctttg aaaaaagaag tatctgaatt attatagaga tatattgtat gtctttaaat   5160
tgatttccta aagaattcan gattataatt ttgaataaat tgcttaatct gcttttgagg   5220
taaatctacc cttttacaaa aagtgttggt ggatcacatt ccctctttta cagaaataaa   5280
agaaggtaac ataataattt ggatgtttga cctttgtgct atataaaaac ttgaccttta   5340
caaaaatcac ctgaaaacca gatgctaaaa tatacctctt agagtaaagc caaaatagga   5400
atactataaa agttcaaagc tggaaaaaga aaaaaatcaa tgcaagttcc tttagaaaat   5460
tggctgttgt attcaggagt ctaattctgc tttttgcttt cctactcaga cttcaagtaa   5520
atgatcaaaa gggcttacat agtgagaaat ctgtaccccc acaggtaaag gaagaagagg   5580
atctttcttt cctaggctgc agaatccaag gcttttctgg tagattcagt atagatggaa   5640
caggactgat aggaaaagct aaagttcagt tcacaatttc ctttctaaga tcagtgtaca   5700
aaaaatacgg aagagagacc ctggaagagc cccttagtat gaaggagcga agttgaaagt   5760
tggaagcagg cttttgtaaa acagaattgc ttgtttctcc atgagatccc agggcaaggc   5820
agccataccg gaatatgttc tgaagacagg gactgacccc acaggtccag ggtgggggca   5880
ggggtaggcc tccgcagcag gagtggaaga attagaagta ggatagacca gaacactgaa   5940
gccaagagaa tcatttatga agagatcaag agtgagaatt atttccaatt atgcaaagaa   6000
aagagatgaa aagaggatgt tgtttggaga gagaatgata tagatggaag acagccaaca   6060
gagacacacc aataaatgtt tttcctgaca gagaggatca cagtgcatgg aacacagcca   6120
tgttttaaag tgagataaga ttcttttttt cttttagatt aaaaacaatc caaatcttca   6180
gatgaaaata agttatcatg taccaaaaca attaataaaa cttagccaac atctacatat   6240
agcctgataa aaactttgga tttgaaaacc aataaaaaga aaaatatttc accagcattg   6300
tgatcaaatg cttcagaaat tacttatcca caaagagaaa atttagatta atgttatact   6360
tcctctctaa aattatcagc aaacataaaa taacgtcctg aaaatctgta gtcctgaaaa   6420
atatcagtag acaattctct tacgttgtaa atgagtcaaa agtgaaaaat aaataggtga   6480
agaaatacat actaggcaag tgatatcagt aaaaaaaaat gaggtagaag tgtgtaaata   6540
tcagaaaaca gttcaaaaaa ttgtttgatt aaatgagaaa aaagaccgta aagtcataaa   6600
agttgctatc tttaatacat ttataactac aggcttccca tatataccaa cgatcagagc   6660
attatagtat gcacagtcaa aagcataatg ctggccgggc gcggtggctc acgcctgtaa   6720
tcccagcact ttgggaggcc gagatgggtg gatcacgagg tcaggagttt gagaccagcg   6780
tggccaacat ggtgaaaccc cgtccctgct aaaaatacaa aaaaattagc taggtgtgat   6840
ggtgggcacc tgtaatctca gctactcggg aggggaggct gaggcaggcg aatcatttga   6900
acccaggagg cagaggttgc agcgagccga gatcacgcat tacactctag cctgggcgac   6960
agggcaagac tccgtctcaa aaaaaaaaaa aaagtctgat gcttatttta ggggaaatgg   7020
aagcggaagc atgcccacag actcaatatc tttttaaaga gttttgtgac ctaaaatggt   7080
attgggagtc agcatttcat cttaagaagt acaaaaaaaa aagaaaaaaa aaagaaanga   7140
ggataaagtt ttaagaatga aaacatgaat gaanttcact atgacataga taaactctaa   7200
atctgatagc aaaaactgag agctacagca ttccaatctg ggaggaatat tgatctacag   7260
gtatatttaa ggtaaattag aatgccaaca aattggaatg atgacaagga ggttagtgaa   7320gaaatgcact ggagaaattg gatatacaat tccaagattg aagaactgga atcagattgc   7380
agtaatggaa atgaagaggt ggatggtaaa gatatatcca caaaaactaa tgctaccacg   7440
tcttagtgat ggaaggaaga gaatgaaagg gagtcctagg ttaaaaataa tttccgatca   7500
tcgagcttgg gtgattgtgc tattgtattc tattaagtct agttaaaaga aattgttacg   7560
gctttatctt tcagttaata gtatctacag ggtaaatcct ttgcttcatt cccttttcta   7620
gttgttttat tgttattttg aaattcacat gagattactt ccagaggcaa tatcgttttg   7680
cttcctttct ttgaaggcat tgaatggcaa tttaaaggtg tagtctagac tagaaaatca   7740
taacagaaac cccaacaaaa actcaaatat cttagttatc cttttataaa acaaaaattt   7800
aattcctgta tacaatgcaa gttagttatt ttaaaagtaa attctgaaga tttctgagga   7860
aagaatagaa tatcctgtat atacatacaa ttataaatca aaatttttgt ctcagacata   7920
ttttgcctgt gttgcttata attagactct cttattcttt tccacacaga gccatgacta   7980
tgcaatgtga actctctaag tgttctcttc tgagcatcta ggctagtgat gcctcattaa   8040
tttggaaaca gtgatgggag aggtgtgcag ggatcacctg aagatgtttt taaaaaaata   8100
caatgtcctg ttttccaccc ttaaagattc tgatttagta tgtctgaggt gaaggaggcc   8160
tcagcttgag tgtcttagtt agcttgggct gctgtaacaa atagcacaga ctaggtggct   8220
taaactccag actttggttt tatacagtct ggagactaag aagtccaaga tcaaggtgct   8280
ggctgattcc tgtgagggct gtcttcctgg tccacagacc attcagctgc ctccgttctt   8340
cttatagatt cgctagtccc attcatgggg tctccacctt catggcctca tgacctccca   8400
aaggccccac ctccaaatac attagagata agagcttcaa catatgactt gaggaaggca   8460
gaaccattca gtttatagtg ttgagaatgt ttctgaacct cccttgataa ttcatatgtt   8520
aagcagtctt taggaattac tattttaaac catccccttt tgagcaaatt tgtggattca   8580
tattgcaaaa tttaacaaac acaaaaacat aatctccctt tgatcttctg ttatgtttaa   8640
atatagtagc aaattttgaa aaccactgtt ttaaaccatc caccttcttt atctaacctt   8700
tacagattca tattataaga ttaaacaacc acaatcaaaa taagtatccc ctttctggtt   8760
tttcataata tataaatgat agtagcagct catcaaaata aaatatccaa cactggataa   8820
ttaatataga gtaggatata tactcagcac agggtaggac ggtggtggcc aggggctggg   8880
aggaggggaa aatggggagt tgttaattac tgggtagaac gtttcagtta tgcaagatga   8940
gtgagctcga gagatctgtg ttatgacatt gtgcctgtag ttaacatttt atagtgaatg   9000
taaaaatctg ttaagacagt tctcgtgtta aatgctccta ctacaatgaa acaaaaataa   9060
aaattactgt gatgtaggtg acaaaaatac gacccagttc cctctcatac tgcttgacag   9120
ttttagtttg ggcatgtagg tgcaatgaca gttttagttt gggcgtgcag ggtgcaatga   9180
caaaagggca ttggggcatt gtggtgtgta ctgaatccct ttagcaaacc caatcacttt   9240
aaaggccaga gaaaattcaa ttttcacaat taaaaaataa aacaaaacag aatccttgga   9300
gaagtaatga cagttttgga gtttttctag aaataaccag agaaaaataa cctgctgttt   9360
tactttggga tttaagaaat agacttataa aaagtgggga accatttttt atttctaatc   9420
agtaccttga caaaaggaaa acagaagagt ctgtttttgg agatggttct ttgaaacatt   9480
tgccttcccc tatgtggtca ccaccttggg tagcccttga agtctgctgg gactggacca   9540
tgcatgcaaa attctgtttt ttgcagagct acattattta gtgagggcca agacacagat   9600
gaatgagtac cccaaaagaa aagtggcagg tggcatttgg aggagagaga gagaaggaga   9660
gaggcagaaa gaaaaagaga aggaagaaca aagaaaacca ggcagccaaa tcagggtctt   9720
gacttttgta caaaattaga ttgaaaatca accacaacaa tccactacct gcaggggcag   9780
gggagtgggc cgctgttctg ttgtggagac acgcattgcc gctgtgatgc ccagggtgtc   9840
agttttttga tgctgtctta gttctcctgc taacatgttc tctgctgtgt tgctggggga   9900
gacgcaggac tccaggctaa gtttaagaga gaaaacatag agctgctgcc tttcctctga   9960
gcagaggcca gattacaggg aatgatgcat ccagctcatt gaagttcaca agctaaggat  10020
acgcggagga gaggcttgct tgagagggcc cggaaggact ggcattgtaa gtctagtggc  10080
aggcatgctc taatttggtt ttattactta gacgtggnaa taggcaggaa cttggagatt  10140
cccgtctctg ttctctggga aagaagactg ttctatttac aaagacttga aagggtcaga  10200
ctgaaagaag acatggacag caaagtattc ctggggtggc aatcagaaag acctggctcc  10260
ctcgtggttt atcacagcta accatgtgac ctcagacaag gcacttatct tctccaaaac  10320
tcagtttcac ctgtaaaatc agaataacag agagagagac acttacctca ttgaggcatg  10380
gtgagaaata ggtaacaatt agcctcacac ttaataaacc ctcagcaaat gttaggtgta  10440
acttgtttaa actgaaaatt tttttaatgt tttacttgtt tcaaagaaat tataaataaa  10500
acacatcatc tttgtgaaca tgtacagaag ttcgtgtttg tgaaatgtac aaaagttctt  10560
aaggttaaaa agtgaaagtc aaatgcttca ccatttctct ccctccctct gttctcccaa  10620
caaatagact acttggattc taaacttgct tccaattcat gtgggtctgg gcatgtttgc  10680
ctccaatttt taatctctgt agtgggaata atactaaaaa ctacttcaga gaggtgtcaa  10740
atgcttagaa tagtgcctgg catggagtaa gctttcaata atatttgttc tcatctttca  10800
agttaaaaaa atgagtacat aatgtctaag cttgcttcta ttctataatt atgcacagta  10860
gtttatggac tttcattcta ccctgagaaa tgatcaaatg cataaaaatc tgagcagtgt  10920
caagagtatt aatcactttt atcattggaa gtcactttgg atatcatcta ttgcaaagtc  10980
ccagacagag gagaaatctt ttctgcaaac tctaaaatgt gtagtcattc cctctgagag  11040
tatccataaa ggagtttacc accttttggg atattccaac atattatgat tggaaactta  11100
tagagtagat gttcttttta tcaaataaac agtcacctct tgataaactt ttgttagaga  11160
atttctattt tgtctgcatt ttccttgcta gaagaacaga gagcactaca aaacaaatca  11220
taacaactgt gttctgggct ttggattttg ggtatgacag aaaaactttc tcaatacata  11280
ccttttaatt gctcttgcac aatctctgta gaaaattaca tacattcttt tagccatgta  11340
tcataggtgg aatctatttt ttagttttca tattcttagc ctagtcagtc aagaaattac  11400
gagactaaaa ctaactctag gaagtgaaga aatctgtcat tttaggaaat ggagagatct  11460
gtctcttcac tacatggggt gagattatca aatgggagtt agtaaatatg tttttctcat  11520
tctttaccaa atttagagaa aaaaataatg aaggtataat agaatatttc taggattcat  11580
cctcaaggaa aaaggaataa taaatggata ataccttcag aaacttgaaa gggttattta  11640
gatagattta atgagaggtt tgatgatttc taccagaaaa aaattgacat ttttataagt  11700
gtgtggtgag aaaaatcata aagtgagtca gataataaaa atggattcaa tttcaggaga  11760
tgagaaatgt ctgtactatt tgcacaaaaa ataattgatg ccaagagttt gtaaacacca  11820
ggctatatga tttaaatata ttgaaaaagt cattttctca tttcctgtcc attctgtaat  11880
atacttaatt tttgattcaa tagttctgtc aggcacattg tcccgtcttg tctctgtgcc  11940
taagtttcct catctgtaaa atggttcttg tgaaaatgga atgacatagt gcatattctt  12000
ttttcttttt ttctttttga gacagagtct cactctgtca cccaggctga ggggcagtag  12060
tatgatcttg gctcattgca gcctctactt cccaggctca agtgagcctc ccacctcaga  12120
ctcctgagta gctgggacta caggtgcatg ccagtactcc cagctaattt tttgtatttt  12180
tttttttttt tgtagagatg ggttttctcc atgttgccca ggctggtctc gaactcctgg  12240
actcaagcga tccactgcct cagcttccct aaatgctagg attacaagtg ggagccacca  12300
cacatggcct gaaaatgtat gatattatta aacagactgg cacataataa cccctcaacc  12360
aacatttttg ttagaaggac tctgtttttg catgacagta aacgtaattt gggttgaaat  12420
caaccagtga gctcactatt ttaacatgga aactctcatg tatcccaaag cactttttca  12480
tggggtatat gtgtgtgtgc aagtgtgtgt gagctactga aggctatttt cctttggaga  12540
aagcattctg agtaggagat aacattcatt tttacangca acttctgttt ttaacacttt  12600
cccttaaatt gtcgtgatga ttgaaatctc aaggcangtc awtgagcnag cccctaaatg  12660
ggagacagca gagttgctgg attctggtct ggaaagtgcc cagtgcgtgt gagaggctgt  12720
ggaggccgtg agaggtgacc tcatggaggg agaggaagag cgtgagcatg caggacacag  12780
atgatctggg ctcagagaaa gaggggaagt tcatacactc aagatgcaca gagaggacac  12840
tcagctgggc agagggaggt gcaggtatca gtagctctga ggctcaaatg ggccctggga  12900
attggaggac ggcagagtgg gcagggatgg tgacacatga ggcaggtgga tggatgttgg  12960
ataacagata ataagacaaa aatatggggt attttttcct agttgaaacc atagcataaa  13020
atgtatgatg ctacattcat ttgctctgaa tggacatgtc ttctgtctga gaaggaactt  13080
agcaagcaaa attgacagtc aaactttaca gaaacaaggc catcttgctg ttaagcatcg  13140
ccttttgtcg tcaagttttc actgtggtgt attgaggtaa aactgaagat gtaaatgtgc  13200
atatagggaa aggacaggaa gctcttgttc aaatgtagat tttagtggtt tgttgttttg  13260
agttctgtgg ctattggaac taaaaagagg aagaaataaa aacatttgaa ataagaatta  13320
atattgtaat gcctacatta acaaattggt aacatcaaat acatgtgtct tcaaaatatg  13380
gggtaatgcc tttctcagat acaaatttaa cactgggaac ctaatctgga aagctgtgct  13440
tatatcagct caccttgtaa ggccttgcac gtataagcat gtaaatgagc tatgggacaa  13500
gaaagacaag gaaggggcac agatgtttga aggtagtgtt tacttacagt taggantttt  13560
ctgcacatgt gtatttattg acagaggatg atgttcacag aatatggcta gatttaaaaa  13620
atctggttac aaaaccatgt gtaagcagcc atttaaaaat aaatgtatgc atggaaaaat  13680
atatgtggca aagaaagtcc taaaagagat acaattcata tcctcttgga gagtaagcac  13740
cctaaagaaa attccacaag agaccataac taattacttc atctgcagcc ccttgttcgg  13800
tggcagacac aatgtatgtg ctcaacaaat tctttgcaaa aatgattgag tctctagaag  13860
tggaatccct gatggctttc atttttgttt cttattttgt ttatatagtt tttctaattt  13920
ttctacaaca aacctgtatt acttgtgtta atgaaaataa aataagaata gaattatttt  13980
cttctaactt aatttaaggt ttaagtattt gagatctagg caaagaaaga ccagtcagct  14040
ctcctggatt tttgcatgaa tctcattatg cccgatagca cagaaacrtg ttgggaatcc  14100
actgctcaat attccttgcc tagggaggta gtatggagcc agcagtaagg tactgaagga  14160
ataagaaaac cactagatgg acgttgaaga gaaagtgcgc cacactagag gctctctttt  14220
aattaatcag ctactctgcc tttaaataca gtatgttgtc ttccatgtca ggaacatgga  14280
gggaaaagac ctagtatgtt ttgttcaatg ttaaatccac gtcacttaac aaaatggtca  14340
ggatagtcaa aaaacaaaac aattatgcaa acatgaatga atgagaaact tctgctagca  14400
atgctggttg gtttcccaaa gacatgaaag tcagagtttg aggtgaagag tcccggagat  14460
gttattgaac attttctttt cttaatttcc ttctcaaact gtgccaggga tactaagcaa  14520
agagataaaa acccaccatt aagtgtgtat gtgtgtgtct gtgtctgcaa tagcgcggtt  14580
gataaacaat ttcacttgca ctcctaaaga ccccacagtt tatgcacaaa agttatcaga  14640
agagtggttg ttggtattga tgtattgaca accttaataa cacctaatga ttaaaaatga  14700
gtcaatgact tctgtcttct ttggggcttt ttagaatgaa atagatgctt tcattttata  14760
caagttgtat gtttatcttc tcacatcttt attcccaaat attaagtttt tcagttataa  14820
caaatcacac acatagacaa agtcttcatg agttaagtga gggaattagg aaagactgat  14880
gtgggattgg cattggataa caaagaggac atggcttgga taaagggttt gaattagttg  14940
agtaaaggtt gcaggatggt gaataatggt atgtttagcc aacctgagtg cagcatgtgg  15000
tatgagtgtg aaaggaaggg caggtacaaa tcagtgggac tcagggtcct ggaaacataa  15060
ggttaaataa agtaggcagt tcgtaagctt caagaatgcc ttcatattca gtgctgtata  15120
cccagcacat accgcagtgc ctgataccac agtggatgca taatatttgc tgtgtgaatg  15180
aatgaatgaa caaatgagtg agtgaatgag aaataagaag atacactgag gttttctggg  15240
ctacaaagga gacctacagt gtgtttggaa gctgattttt ttttatataa aagagggaac  15300
attttgaaag gcatcccaga cntgagggcc catggcctac ntagaaagga gtctagnaaa  15360
tggggatagg tgaaaaaggc cgnttgtaca tatatggaat gaatgagcna agaaaacaat  15420
ccactgctga gagtgggtgc aaagagaacc tgctgggcct tcccgctgca catggggaac  15480
ctgaagagtt tagagcagta gggtctggga catgagagga aggagaaaag caggatgcct  15540
ggctcatgtc gctctctcag gctgaatctt cattcatgat ggtgttggca ccgtcttcct  15600
acatctgcgg gggaagcagc accgatacct ctctaaatta gtagctggac acagatggta  15660
atggaaactg taacaacagg tgatcactta aggggttaag tagagaagac aggcaagaag  15720
ggcatgctgt gaaccataat ttggaagaca ggagaagatt caaaagactt taatactgaa  15780
cccaagagag ctgcaaggga aagaaatgac ccatagtgtt gcaagggcgc tgcagttaaa  15840
gaaaatggaa tattttaatt ttaatactgt gaagacgggg ctggaatgaa gtagggaaag  15900
tatataccaa tagaaatgaa attgctatca cagaatacaa aaactgggtc ttaaccattt  15960
aaaacagcaa tgaacatggg atgaatgagt ttcntgagtt gctataagct gtttctgagt  16020
aaaagattta ttaatggata cattgtgaac tgtgtagcct ctcnnccgat attgaantat  16080
ttaaatacca actactttta ataaatgtcg gaaacctttt gaaagccatg tttttcaaac  16140
tttgtgtact gtcttatgaa ggacactttg gtaaacagaa aaaagagata ttggcttata  16200
aaaacataat aatgataagg ctcagataca caggaancaa tttcctatca aaataataaa  16260
cttnacctag gatacttaaa tatccctact ggtttttatc agagaaataa taggtctgct  16320
gtatgcagtt ttattgattc aacatgaatg aaggcataaa acaatatttc tgtttgcaaa  16380
ggaaaattat tacaatcaac cacctcaaat taattttgaa ttcctcatgt gtttgtaact  16440
taaatttatt ttactacttg aatgctttat ataatattta atagtattaa attaaatcta  16500
gagatccagg agctagttgt tgagttttta tgtatgtgtg gattagccag gtatctttgg  16560
agcttagatc atttcttggg cactgtgaga tttagtggca cctgggagca ggtaaagtga  16620
aggtaaatgt gagtgacagc taatgtcatt cagttataat tgcactattt tggttggtca  16680
gatataacca aagtgggaat tttttaaaaa acaataaatt ctggacatgt atttttctag  16740
ataaacaaat ccataatcaa aaatgatttt tgctttaggt ggcgtattga taataaaggt  16800
gcatggaatt catatgccca ttgtctccac tgctcagtga aagaggaatt gtggacagat  16860
ctctaaaatt ccttatataa tctttgaagt gaaaccactc ttttacttgc tcctttgtat  16920
gtgtcatctt gaaggatttc taaaagattg tatctacact cagtatttgg gtggatagga  16980
gactgtcatt gaagaggcat ctcaaattga ggccaccaga tttccttccc cactaccagt  17040
acatcagaga aaaaaaaaac actttaaata ctctgtatac attaacatgg gatatcaaag  17100
agtcccaaac tccaattata taacataaat taattagtgc agcctactgc aaagcccata  17160
ttcaaactca atattcagag caataacagc ctggaaatac ccagcatgtc ttcaagccag  17220
ttagcttgtt ttcttctggg aataggaggt gaatccgtcc gttttcacac ttctataaag  17280
aaatacctga cgacgctggc taatttataa aggaaagagg tttaattgac tccattctgc  17340
atggctgggg aggcctcagg aaacttacaa tcatggtcga agacaccttc ttcacaaggc  17400
ggcaggagaa agagtgtgtg aagtaggaac tgtcaaacac ttataaaacc atcagatctt  17460
gtgagaactc actccctatc atgagaacag catgggggaa accgccacca taattcaacc  17520
cctctctcca cacgtgggga ttgtggggat tataattcaa gatgaaattt tggggggtgg  17580
gaggacacag ccaacccata tcaggagagt taggcagaga tacctgccca ggtagataaa  17640
ggagcacata gcgatgggga taggtgctca atacaggcaa tcagattcgg agctgctttg  17700
ttctgagttt ctgtgtttta ttctcttttc cagtaaaaac tgcatctgtg ngcgcgcgca  17760
cacacgcgcg cgcacacaca cacacacaca cacacacaca cacacactgc aaacatgttc  17820
ttgtactcca gtgaggacta agtggcaccc attgtgcttg gttaggtttc tttctctaga  17880
cccatggagc accagatagg agagccagtg aacccgcctg atgttaaaac tgcagtgcta  17940
cgttttcctg actcagcctc ttttttttgc ctgaagcgct cttttttttc tgttacccgc  18000
cttgagaaat tctcctaata gtctgcagct tcagcatggt caactctaaa ccccttacac  18060
attgtagtca aacagagctt attttaaatt tcaagtttgc ttggatggcc ttggtcaagt  18120
tattacctgc cttgaggcta gcttttctca tttttctcat gcatgtgtaa gaagatgagt  18180
tttttgtttt ttgttttttt ttggttaggg ctgttgtaaa gatcaaataa aatatcattg  18240
ctaagtgtcc caaacatagt atatgcccat agctgttagt tcctcacctt cctttaagac  18300
tcaatccagg tgctaatcaa atgggaagtc tcacagtcga ctcagggatc atcaggtacc  18360
acctgccttt ataacaattc ttctcacatt gtattgcact tatttgctat ttgtgtcctg  18420
agggctgaca tataatagcc ccccttcaag tgactgctga gttgtggaag gcagtagcaa  18480
tggccatagg gaggtaacgt ctatcacagg atgtagatgt ttcagaattg tggaaattta  18540
agcagttagc aggcatctca tctcccacct caatgtaatt tcatgaacaa tttacttcag  18600
agtagctgga agaatttaga taatcactgc attcataaaa caacatctcc atttagggga  18660
ggttcttccc ccattctttc tgacctccct cccctcccaa gttgggagat caacttgggg  18720
ctactgttgg aagtaagaga cgtctgtgaa tgtcgtatta aattaacact ggggaaacca  18780
tggggaagat ctgtgcattt catctgtatt actcagcagt gttctagcac aaagcacctc  18840
tatgtggaga cagctttagg tataagagca tacatctaaa aagattttcc caagaatatg  18900
tctgccctaa gaagcaaccc attttactct agctattcta aatagctagc ctctaaactg  18960
cttttgaagt acataaaata atccattgct ttgggagaaa aaaatcaagc ttctgttggt  19020
attaatttat ctcatccttt taaagtttct attttcatat gtttattata cactatggag  19080
tagaacacat atatgcctta caaataagta gatatatgtg gggaactcaa ttttttgatg  19140
agggcaagat ggtttagatg acaaatacaa cttttccttt tncccagact gtggttttgt  19200
gcttgctcac caaagctaac ctcagcatgc tcaaaaggaa gcagagttcc agggtggaag  19260
cccagccagt cactgacttt ggtcctgatg agtctctgtc ggataatgct gacatcctct  19320
ggattaacaa accagtaagt ttcttctttg agtatggaga agcatatgtg gatgtgagat  19380
aaatgtgatt gacaaattca aatatcatgt acctttggct tcgnaaatat ctgagctgca  19440
gtagaatatg gatgaggttc agagtctgga agtagagaac aatccaatga aatagtgaga  19500
tgtcgctatg agttactcac ataggaagat gcactgggta gtctgatccc ctcccctccc  19560
cacgctgtgc accctgtcct cagagtcaca tggtgtagag atgataccac ttctcaggct  19620
gatccaaagc tggggtccaa gatgagcaac ctgttctgaa tgaacctcct ttacttgttg  19680
tcaacgttcc tgaatccgtg agacaatatg cacatgtttg gaattaaagg tctccttctg  19740
atttgcaaaa tttgagtaaa aggtcaatga gataatggat ggtatctctg aagaactttg  19800
tcaccttcac cgcctaatta agttgatgag gatttgagaa gaactgctag gccaggcacg  19860
actgtgtgcc agaaagcata gtaaccagaa ctaagcctga caggcatgca tatccatgag  19920
tgctggaatc tcagctctgc aaaaccaagc aggatcaact tcttactcat ctcatggttg  19980
atgctgaagt aacaaaagga aatggcctgt tccctcttgc agtgcttgtc cttcccccaa  20040
ccatgataca cacatgatct gcttggactc tttgctgtcc ttcccagtct ctcttcctct  20100
aatctgccct ccaggttact ttccctgcct gctcacattt ctttctatat ttctattttt  20160
attcacatca cgcttctgct ttataatcat ggaagcatcc ctattacctt cattgcaaat  20220
taaaatacgt tagtgtgaca ttcctgcttc ttttcattca ggacctaacc tgtccagcaa  20280ctgctccttt cctgtgtcag cacactgtcc acttgagccc catcagcagc ctcctactcc  20340
tctaggctct ctggattgtt cacattgctt tccctgctcg tactgctccc tggccccagt  20400
gaccctttcc cagctcctct gatgagtcaa atcctcctca tccattagga ctggatgaga  20460
tgtcacctct ggcatcctcc tctgaaaggc ttatttccgc cacagacaga atgtacctct  20520
cttctctttc cacttagcct gttttatatt tgtatgtaaa tataaagtga tctgtaaata  20580
actgtatttt tatatgtatc atatattatg tgtatattta cattatatac attgtaggtc  20640
gtgtgtatat ttatataata tacatatatt tatggatcta ttgtcttagg tatatataca  20700
tgttatatac acatacatat aaacatataa caggnttata tgtatatcac atatatacac  20760
attacacata cacatatatg ttatatgtgt taacatatat gcatattacc cacacatata  20820
aaatatcatg tgtatataan catatataca tgtcgcatat gcatatacat atatattata  20880
tgtatgtata atgtgtacat atatttatat gtgcatgcat ataacatgta tatgtaatat  20940
gtatatatgt tatatacgtg agactataca tgatatatgt atattatgtc ttatctagaa  21000
catgttttat aatgttatat aatgtgacat gtttttgcct cttgcagtgc ttgtctttcc  21060
cctaaccatg atacatgcag gatctgcatg gactctttgt tgtccttccc agtctgtctt  21120
tctttctcta atctgccttc cagactacat gtgtttacat gtatgtgtat ttacatgaaa  21180
cataatatat acatacatat aacatgctat gtgtatatgc acacattata tatatgtatg  21240
tgtgtgtata tatatatata tatatatata tatatatata tatatatata atacattcat  21300
aggtgtttta cttcttggac tgcaaagcag gagtcagaag tgtgttgctt ccatattttg  21360
ttctccattc ccagcattct gacacatagt aggccttcat tcatacttag agaattgaat  21420
ggaatagaga atgaagcacc cctaactttt tcttagtgtc catcttatta cagagctttc  21480
tacaaactta tgaagaaggt agtataaaag atgtggcctt ggaggcactt actaaaatta  21540
ataattcttc attaaaatta tgtctttaaa ctaaaaacac ttttgttgtt gaagaactta  21600
tatttggaag ctcttttgta taattagatt ctttatgttg aaagtccaga tggggctaaa  21660
ttcacacacc aatgtttatt gaagtgcttc caaattgcat gaaaaataca tcaaccttta  21720
aagtaaactg aatcatcagt ggcttatgtg gtatggaatt agcagcaaaa tatcttcatg  21780
taaatattat aactgtcaga taaatattat aactcctcag ctgcaagtgt ctgagtctcc  21840
tgaaagttct gacagtcttt tctanttttt catcttgagt gtttngctag tatatatagn  21900
ctgcagaatc catctactac aagactaaaa tttttttcag agtattatat taaagaatta  21960
tcataatttc atatatgtcc cagatagtca ataaaaacgt atttggatta tgtttaagaa  22020
ttgtatacta attgattaac tggtaatatt aattgtggtg ggtttagcat ggagatgcag  22080
ttaagtattt ttttaatcct agatactagt tttcataaaa aaatattgag tatgagtgat  22140
tgtatgtcct gtatatatat tcatgttaac acacacttat ctttaattct ttcttcttat  22200
tttggggtta aagaaaatct tcagacagca gacatgcctg tagtgttgca cagaaagtta  22260
ttttgtggaa ttttgaaaga tgtctgggct aaatttgtat aaaatgtgtt ctccaaaata  22320
aagagaaaaa tctatgcatt tttttcaaat gtaggatgag accagatttt taaaaagttt  22380
ctttgtattt ttatacaaag gcattatata tcagatacaa atagaaagga aattctaaat  22440
atgggatgtg ttatatatca attcatttaa aaagcatttc ttaactacta tgataggccc  22500
ttgtgctaga tgctagggaa gttatggtaa atatagtatg cccctaattc taggtactta  22560
tagtacaaaa atgaaaaaaa agtaatggca catcaagttc ctatgtgact aaattacaaa  22620
cacatatttt aattgaacca gaatcttcct atattgtagt ctgatgccca ggaggttatc  22680
agatgtttgg gagagcctga tcaggttccg tctatgcttt gggtctttgt aacgcatggc  22740
cacagaaatg cctccacctt tctgtcttag tgtgtttatg tggaaaatag gtgccttgag  22800
aattaaatga tatnaaaaac gtgaaaatat ttgtagcaca ttatatgcac ttagatgtta  22860
gatttcttct tcttcacctc catattagta aactatttta acctcagtat tatgttttcc  22920
acttagtgtg gttcataata caagtttgag atatcagtta tggtgccgtg tagtaactct  22980
ggaccatcat tgcagtgggt tcactctttg ctgcgcatct gtgccatcat cagcgtcatt  23040
tctgtttgta tgaatacgcc aatgaccttc gagcactatc ctccacttca gtatgtgacc  23100
ttcactttgg atacattatt gatgtttctc tacacggcag agatgatagc aaaaatgcac  23160
atccggggca ttgtcaaggt gagcacttcc atgtcattta aactaagaac ctaaatgtgt  23220
tgaaagtctt aatcccttta atcatatttt cttgttcatt tcagtaaaac aaaacatcat  23280
tttatcttat acatatggaa gtccttttta aaaaggcata actccagaga ctgggagaaa  23340
ttgttgcatg agactatttt aaaagttaaa taaattttgt aagtcacaaa ctcttggaat  23400
atctgagaag gaacaagatg gtttgactaa tgactgtgtg aagtctcgag tagggttatt  23460
catgccactt agggctgagc ccacaaccca gcacaggggc tggcccagag aagcacctta  23520
ttatttgttg acttagggag tgcagaatca gagtcccatg atagagttag agcatgatat  23580
tattgcagca cgatgtcatt tacttgatgt gttttgaaaa tacaaaagga taaaaaaaaa  23640
aggacatgag atggaaaaaa tgtctggggc caaaaggaaa attatgtgtc atgtgaaatt  23700
agtaccaatt ggaaacaaaa tagatataaa atgttttaaa agggtaaaga aagggaaaga  23760
aaaggaagaa aatttctgtc actggatatc ttttccttcc atagcactaa tctttacata  23820
ggttaaacat atgtagatga tgctgtccct agagtattta aattgtacta tttggggaag  23880
cagtaatagg agtgcagatt ttagagtttg acaaatgaca gacgactcag atcttagttc  23940
tttcacttac tggnttgtat cagcatctca agttagctaa ttttggtgag aaagtgtttt  24000
attttgtaca aggattttga gaatctactg agacaatata taacacataa ttatttgtca  24060
atttcattgc ttccctttta tacataatta attgtgtgcc atccttgaaa gacagagatc  24120
acagacaatg cattaatagg ttcttgttta actttttatt gtggacttta aaaaatttac  24180
cccaaagtat attacagtta taatgtgaat ccctgtaact acacatcaac aattatcaat  24240
atttagccaa ttctgtttca ttttaaagca aatctgagaa accaagtcat ttcagaaata  24300
actccttttg tattggtgac tgataaaatt ttctcttttt ataaccacca taccattatc  24360
aaatataata atattttacg tatgataaaa tatttgtaac aagacttagc aataattcct  24420
taatgtaggc taatacttaa cccaccgttc atatttccta atattgtcac aaattttttt  24480
tatggttggt ttcttcaact caagactcag acaaggttta catagtatac ttgattgttt  24540
ttgttttcgt ttttgggagg gaggttcact tttgttgccc aggctggagt gcaatggcac  24600
gatctcagct cactgcaacc tctgcctcct gcattcaagc aattctcctg cctcagcctc  24660
ccaagtagct gggattacaa ggcctaagcc accaccccgg gctaattttg tattttcagt  24720
agagatgggg cttctccatg ttggtcttga actcccgacc tcaggtgatc tgcccgcctc  24780
ggcctcccac ttatgtttct taagtctcct ttaagtctct gtaagtccac taagtttcag  24840
cttttcacat cctgcaaaaa attttcctat gtcattgatc cattggaaga catgcgtctt  24900
ttgtcttgtg gaagattcta catttgagat ttggctgatt gcttccagat ggtgctcttg  24960
aatagtttnc tgtgtactcc wtgtncctct gaactgcttt ngtanntttt gaccagncaa  25020
tgcacacagg tgcttctttn cccacatggt cacctcnaaa atatgtcaga cttctggata  25080
tttgccagtc tgaagggtgg gaaacggtaa tccactgtag ttttaatttg catttccctt  25140
ttgagagtga ggttagatgg gattttatgt atcaagagcc atttttaagt tactattttt  25200
tcattcaatt ttggccactc tgtgtgtgtt agaagtatca gctgtttgtg atataagttg  25260
caattgtttt tcccagtttg ccattgtcat tggctttgtt tgtggttatt tgtaccatac  25320
acaattctta tccaaatcat ggacaaactt tctattgtct gcattttatg tcatacagga  25380
gagttttgta ggtttcctca tacagatttt gcacattctt ggttatattt atgctttggt  25440
attttattta atcattttgt tatttgtatg aggtcttcta ttacatgttc taacttgttc  25500
ttttaaatga aggctgttgg tttctataca ttaatattat attctgctac tttactaaat  25560
gttctagatt cttgtattag tcataatagt tttcctgcta attcttttga tgcttccata  25620
tgatcatatc atattcaaat aaagaaagat ttgtcttttt ctttgtaatt tttatgccct  25680
agttgctttt acttacttaa agtaaaataa atgaattgac taacactgcc ggtaaaattt  25740
taaatactag tagaggtagt gaacattttt attttgtttt gtttttggtt tatctagaac  25800
atctctagtg tttcttcatt aactagttca aaaaattggg atttgaagta tgtgtacatt  25860
attggattaa gtgaataaac tttaatttca cattttgaga gttgtagcac aactagcttt  25920
ttaatttgtc aaatgtttat ttttaatttg tcaaattatt attttttcct tagtgcttgt  25980
aagagaagag atttttaaat attgagttat ccttccattc cgataaagaa aaatccctac  26040
tgggtcaaca tacattttta ttctatttta atgtgttgtt ttgttatata tgttattatt  26100
ttccttattt taaatttggt ctaatctttg tcaggttttg atattagatt tttcatgtgt  26160
gtgggtggcg ggcatgtatg cacactataa aatagtctga gcactctcag aattgttttc  26220
actttaaaag tttggtatca gttcccggtg aaatcatctg gtcctgttgc gtttttgtgg  26280
gggttccttt gcagtatttc ctatttcttc tatggaaatt gtctgtttta tttttatttt  26340
tattttttat tttttgtttt ttttttgttt ttgtttttgt tttttcgaga tggagtctca  26400
ctcttgtcac ccaggctgga gtgcagtggt tcattttcgg ctcactgcaa cctctgtccc  26460
ccaggttcaa gcgattctcc tgccttagcc tcccgagtag ctgggactac aagcgtgtgc  26520
caccacgcct ggctaacttt ttgtgtgttt agtagagatg cggtttcact gtgttggcca  26580
ggatggtctc aatctcctga ccttgtgatc cacctgtctt ggcttcccaa agtgctggga  26640
ttacanggcg tgagccactg tggcagacct atgtcttcat tttttagtag agacaagatc  26700
ttgctctgtt gcccaggctg gagtgtagtg gtgtgatcat agctcactgc aacctccagc  26760
tcttgggatc aagagatctc ccacctcatc ctcccatgta gctgggacta caggtgtgtg  26820
ccaccatgtg tggctgattc ttaaaacttt ttttagagac agggtcttgc tatgttgccc  26880
aggctggtct ccaactccca gactcaagcg atcctcccac ctcggcctcc caaagtgctg  26940
ggattacagg cgtgagtcac agtgttcagt caaaactgtc tgtttcagac ttgcttggtc  27000
tattggggtc tatttggtga agtatatttt cttaggaaat tatcccctat ttattttgtt  27060
taattatttg gtaacataga cctgtgtaaa tagcttttct ttcctctgtt tgattttctc  27120
ctaattttgt atttttttgt tattttggtt agcattttgt tgtcatcagg ttggctagca  27180
gtattttttg tttgttccat tttgttttag gttagccaat tggtttgctc attttgttga  27240
ttttttttaa aaagaatcag cttaattaac ttattaattt ttgtttaatt tttttccttt  27300
aaaaatattt ttattatact ttaagttcta gggtacatgt gcataacatg caggtttgtt  27360
acatatgtat acatgtgcca tgttggtgtg ctgcacccat taacttgtca tttacattag  27420
gtatatttcc taatgctatc cctcctccct cccccgaccc catgacaggc cccggttntg  27480
tgatgttccc cttccntgtg tccaagtgca tttattagtt tctttctttg ctttatttgg  27540
tttactttat gggtctgttt ctaacttttc gaaggtgttt gtctcacatt ttcatttctt  27600
gagactctta aatctgctgc ttccttgcct cgtggttaaa atgttaacca caaggataat  27660
gttaaccagc agcataaaat gttactgctg agaatgtttt ttttccctcg aagtggcttg  27720
ctcttttctc ctgaatacgg aaagagactt tccctttatt gttcaagtca gcagctctat  27780
gagaatgtat gttatctttt tgttgatagt tacggatata ttttcctagt ttcatcatgt  27840
gatatttatt ttattgcatt gttttcagga ttccttttgt attctaatta taccaggatc  27900
tatggtttgg tctttccttt cctttgtttt ctttccatgt atttccctct gtttttatgt  27960
tttctacatt ctctttccct tgcttcactc ctcatgctgt cccctcactc ctctgtcccc  28020
tgtatttcac tcctctttct caaatacttt tttcatttct ttttcatcat ttcctgaaca  28080
gtttttgttc tttctttttt cagtctctta tcatttagac atcatttctg tgttttctta  28140
tttctagttt tgtgattctt ttggagcttc tatttgttta aatttctttt ggtcatgttg  28200
tcatattcga ttatagtctt catctgcttt gagtgtttat tttctgttta tacgtttatg  28260
tattatttta tttttacttt tattattttt tgagacagaa cctcgctctg tcacccaggc  28320
cggagtacag tggtgcaatc ttggctcact gcaacctcca ccttctgggt tcaagcaatt  28380
ctcctgcctc agcctcctga gtagctgaga ttacaggcac gcaccaccac acccggctaa  28440
tttttgtatt tttagtagag atggggtttc accacgttgg ccaggccagt ctcagactcc  28500
tgacctcagg tgattcgcct gccttggcct cccaaggtgc tgggattcca ggcgtgagcc  28560
accatgcccg gcctatgtat tatttcattc atcttattct gtaatgtttt tacaagggct  28620
tcatcatgat ccgtttgttt ggttgttctt cttgttgttc acatgaaatg ggagtttttc  28680
ccacacattg ggtagagtag cctctgcata ttgtcagtac gaggggtccc tccactgttg  28740
ttatcctgat gggtaaacat ggagcttttc tgtgtaccga ccgtcaggtt ctgagctctg  28800
ctgcctctgg actgctggcc caattatcga atatttctta cccactggcc ccagtgtccc  28860
tgccctactg aattgccatt ctaaacatgg ggctgtggtc tggaaagggt ttttgttggg  28920
tgtcctttgg agtttctaat attccattgc ctctgatctt tctgcagttt cttggggaca  28980
ttggtagtca tttgtttttg ttttgttcct ttgttttaca ttaacctgca acttgcagcc  29040
taccagttta catttctaca aatgttgcca tttattttaa ggttcacctt ctgagatatc  29100
tgctcagcat tccacacgta tttattagtg attttggggt tttggaaatc tactggttta  29160
tggaagaggt gggcatcctc catagcttca atgaacagat ttcaggatga ttccaaaatt  29220
gtctgtatct tccacaatgt ggctaggcta gtttttataa gcactaggtt tagataangc  29280
ataggttcag aaaactggaa cctgtctcag gaggccatct tgggagaaag ttggtcttgg  29340
gagaatgcta acatctctgt tattcacagt actcccctgg acgttgcccg gccctagctc  29400
acattctgtg tagttgcccg gccctagctc actagagggc catgaatggc cctgtcactt  29460
gtgtgtagtg gttattgggg ccatggcaac ctttgcccat gcattgaaag atctgaatat  29520
tctgggtgaa gcattttatg attgaaattg ccatgtgttg acttcttaag ggttccattt  29580
gaatgaaaca aataagtgac atgttcctac aagaaaactt ttgttttttt aagtcattaa  29640
ataaagactt agatttcaca tcactaaaat gatagtaggc attctgctag ttgtcacagt  29700
ctaatgataa aaagaacaga ggcatactta atatataaat tatatactca ttccaagtga  29760
acagagcagt gagagaacac aagttttaat aatgtaaatg ttagaagttg aatcaatagt  29820
taaaagagaa agaaatgact taggaccaaa tcgttttcaa aatgctgtaa attagccatt  29880
tccagtattt tcacatttcc atcaacattt gggtgatgag ctatttacta caaccaaaaa  29940
tttttttttt tattttcaat ctgtaagagg tgaaatttaa aatgaaaatc aaataaggtt  30000
ttctggtttt cattcagaaa taattggatc aaatacaact gtaatgcaat tttagtaata  30060
ttgcactgtt aacattatct tgaagtagtc agctcaactt catagctcag taaaactggt  30120
attctatgtt taaatgctag ctaacgtttt agttaaatat agttaaatat gaaatctgtt  30180
tatcctgaac caagctttaa atgtatcaac tcactaaatt tttaccatca tggcctctat  30240
tattgttaga gggtaataat tatatcagta agtactgtca ttttcatgat attaaatcta  30300
agccacagtt ttattatttt tatactacag acttcttcaa acatgcatgt cataacagat  30360
acagctcaaa gagtatattg ggcttgatat tattttctta tattcaaaac ttaaactttt  30420
aataagactt tattttagca aaatgtcctt tgtcacatta aatgtatgtt cctaatttat  30480
attttattag ctttgcattt ttgtatttgt aaatttgttt tgcttttata cttacatgag  30540
aaatttgtac atattgtagg tgtttaagtt acatcataat aaaaacacac tgtcacatcg  30600
aagttctata cctttcaggg gccctctcat attactcaag tttgagttac tatgctttct  30660
tcaactctac cataattttt aaaacttttg ttaagcactt gtctgctgaa aacctcatca  30720
tttttcatac tttttctacc ttaatacatt tgccaatagc actgcagtta tctctcaatt  30780
ctttagtccc ttncacccag aataatttgc aaatatgtgc tgcattttct cactaacatt  30840
taagcttgta ttttttcata cataaatagg aacgttatga atatacatgt tctattttaa  30900
tcttcaggtt acacttttca tagtaagttt tcacattgtt tggaacagag ttgtgcaaat  30960
atgaaatgtt taatattcac tgatttccaa ctaaaatatt tctaaggaat agtcaaattt  31020
agttattgag tgagcagtac ctgttagcca tgtgttctgg gtggaaaagt gtgtgtgagt  31080
tgatgtacac atatgccagt gatttgcgaa atgctaacct gntanttttt tttttttttt  31140
ttttttttga gacggagtct cgctctgtcg cccaggccgg actgcggact gcagtggcgc  31200
aatctcggct cactgcaagc tccgcttccc gggttcacgc cattctcctg cctcagcctc  31260
ccgagtagct gggactacag gcgcccgcca ccgcgcccgg ctaatttttt gtatttttag  31320
tagagacggg gtttcacctt gttagccagg atggtctcga tctcctgacc tcatgatcca  31380
cccgcctcgg cctcccaaag tgctgggatt acaggcgtga gccaccgcgc ctggccaacc  31440
tgttattttt taaagagtct tttccatgca taaaactatg ttagtccata agaaaatatt  31500
tatagaagca aaccaatgta ttttttgccc agctgtcatg cacagttctt taaaattata  31560
cctagccaat tttggcaatg ttatggtgta cctaagagtc atacctaatc gttaaagtag  31620
tgttatccaa tgatacctag tttataaaat tatgcacgac aaaccaaacc cagaaacttt  31680
attttttcaa aacaaacgtg tcaaagctgt ggcttcctag cattgcctac taagtttatt  31740
gacctagtaa tttgccaaat atattaaaat atgtataaat ataaatataa aatatgtaag  31800
atatgaaaat gtttaagata tttaagatat aaatgtaata taagaatgag ttatattctt  31860
aaacccaagt acagtttcca agttttcctt tagtcatcca gcaaccattt attgaacact  31920
tacaatgagc tcatctctgt ccttggagaa gggaaacaga caaaaccaag cagagctcct  31980
gtcctcagag aaaacctggt tcactctgtg ggacagactt agcacataca ggcactcttc  32040
attttcaaca tccaatatat ttctgaaaac atggtggata gcatattttc agaaaatagg  32100
cacttctctt tcactaattt atatgggaaa actaataatg tattagggga gctcgactga  32160
tttctccaaa tatcactgca ttaccatcta atacctatac aagtcaacct gcatatttct  32220
gcaaaataaa aagcatttaa aacatccctt acccaattat ttgcactaat caaaccacag  32280
tggatgtttt atatgtgccc aacaataaca ggaagtttct gttattaagt aaatttaaaa  32340
aatacattaa agtaccatcc accatatttt attgaattgt tgatatcatc aattgtaaaa  32400
aaaaatggca tcacttcaca gattcacggg tctctaagaa ataataaagg cttctaatta  32460
tactttgact gtaagatgta agattttaat tgaagcatca attagaagat gcatgctgaa  32520
tccagaattg tgcaactgtg ttggagcagg gtagggtgtg ttttagaatt ggtgaaatat  32580
gataaaatgg gcctgggttg gtaaactcaa tttttggatc ttttgaaagg ctaactttca  32640
ggggaaaggt aagacagagg aagatatcaa tgcactagta ttaaatagtt aagtaggtaa  32700
acaatgctgg tacaagattg ggcccaaaag gtgaacaaca gagatacacc tgcattgcac  32760
actatacctt tggcagaatc cactggcaac tttaatgtct ccattggcac acgtgcaaag  32820
tcattatggt ggttcttcta ggttcatagt gattctgggg caaacatttt ttgcagatat  32880
aaatagcaaa tattagtata atgagaatct acatagagag ggaccttctt tttttttatg  32940
aaagggcttt aatagtggtc tgtaaaagct atgggggagg caggcataaa aaagaaaaac  33000
accaaaactg tctgcttggg gatatcagag aagtcttgaa gaaagaggaa cgtgaaacaa  33060
tgccttgaag gatgagtaag tgtggtctgt ggcaggggtg atggaagtaa gatagaagta  33120
agggatctca cggagaaaga aaaggaatat gaggcacaaa ggagtggaac agcaaggtac  33180
atgccgagct caaagtagtc agaagtggca gatgggctgt gcacaggagg cagctggaga  33240
ggagtttgtg aaactagacc tggctgcatc atggagggcc cagcaggctc tgcaaggagt  33300
tctgactttg ttctgtggtc agtaaagatg catggaggat tttcatctga gagtggtaca  33360
atctgatttg tgtttgaata gttcactctg gaagttacat gctggatgca cagctgggga  33420
gagaaactga agcagaaagt ccttccagca agaaatgtct ttaacaattt ttgttggagg  33480
aatgcatttg ttttaagtgt tttccatctt ttataatatt cccaaagctt gaaggtgctt  33540
gcccatcaat tcccactcct caacagcttt cttctaattg cctccctaat tcctcttgct  33600
ggaagcattt tcactcacca aatccctaga ggtgaaaaga aactatttgg atgatacatg  33660
tctgtgttgt tgcagagcac ttcatgcatt gcagactgtg agttctttag accattctca  33720
gttgtctatt tcacatctgg caatagatac aagtaaaagt agcatgcatc ctttaagcac  33780
tgttgaagta atatataatg atgctaagac atagtgacag atgggccctg gaaacttggg  33840
acaataaatc ctgttctcat gaaactgtac cagtgcatat cattttgtca ctgcaaaata  33900
tatccctata aatgtgtttc ctttttctgc ttgttaaata cttgcatgat atgttgttac  33960
tttcttacct tatcgttgat tggcagtctt caagtgttta ccgttataaa aattgacata  34020
tacagctctt gaagcactcc tctcctcagc caccaaagtc ctgatttttg cgcatagctc  34080
aagcactctc tgccctccat ttcttgttga tggaacaaac aaattaaaac attttttcat  34140
atttaaggtg ttaaaatatc ttgagtacca ctgggcattc atatgtgtta gcttctggtt  34200
gcatatttta gaattgggtt gcaaatatta taacttgagc ctcaatacag tagaatttta  34260
aaggatctgg ccatgcttat aaatggaatc aaagcaactt tgactactat ggctagggct  34320
tctgacgata atttgataaa tgtgccagat acaaaacata atccaagatt gtattgcaaa  34380
gtgtcagatt tcaaggtctg cattctactt atttaaaagt attataaact tattgtgcct  34440
tagcaattat tgataatgat taatatgata gtaattttaa ttcctaccag ttcaattgta  34500
tttacaatca tggtnaatgt ataaaatatg taaaccgtaa nctgtatttg catggcatgt  34560
ttnagttctg cnttatgcaa actatgctaa tccaggaagt atccataagt catctcataa  34620
tctcatctgt gatctttcat ggttacaaag gagccagaaa ggaataattt ctttttagaa  34680
gcatataaat aatttcagtg aatagatgga tggatggatg cattcattaa gaaatattaa  34740
ctgacatctt gctgtataca ttgtatatta actgacatct tgctgtatac actgtatcta  34800
agacatggtt catgtaccta tctcatcatt catttaatat ctgctatatg tcacccactg  34860
tactgggtgc tgcaaacaca accnttaaat tatccgactt aaagtctcag ggtgnttact  34920
catcttcaga atacactcaa acatttacca tgagagatag acttcttttt ttttttctaa  34980
tgtaactcca gagaatacgt tcagagaaga tttaagtagg aaactcaaac ttcaccatca  35040
gatccaataa gttggagaga ccaaatataa attcatgaaa taaccaatat ggattacaaa  35100
ggcatattct gcgagtaaca caagatgcac attatttata tacatgagct gagttgtcag  35160
ttgttgcatg acgcctgagt taaggtgatc agaggaggct gtagtcagat cactctggaa  35220
ggaaaggttg gcacagactt ggcagaattt ttcgggaaga tggacagcat gaaaaacaat  35280
gaacattaaa aagccaaaga ttttttacaa atggaaaaat gctgagggtt gctggccttt  35340
gtatcttggg tcataactct gcttataaaa gatgtttatg aatattgaat gactcttgga  35400
aacatgagcc aaaaagtaat acatgaaact tatgcccaga ggattatttc catacttcac  35460
tgggaaaata aaaagaggtc aattctgatt gaccactgca taccatctag catgtgctga  35520
gcttgttggt gacacaggaa tgccactata tgtttctgaa aagtccaagg cagaagacat  35580
tccaaacaaa acaattaaat tacttcctat ggaaaagaaa gttttctaca ttacatggta  35640
gaatttttgc taagccagtt tttataactg aggtcgttcg aaattaagat gtttgtatgc  35700
ttctaatttc tgatcaccac tggtgcttct aaaatgattt aaaataattc attattttat  35760
atagtttgaa atgtagtgtg ggccagtttt acaacattaa tttccttagc aaagaaatca  35820
gaaacaaaaa ttcagtcaca tctgttattg atagcttttc attctgaatt ggtgaggccc  35880
caatttttaa atttaaattt atttttgcca actggagaag tgattttgtt aaagctaaaa  35940
tgtccaactt aaaaaaaaaa ttgaaaagct atttttaaaa atttaacatg taagcattgg  36000
tccaaaaaca tatcagaata cattgtgaaa agcatgtctc tcctccacct ttggctcctg  36060
gccattcact tgcccgcccc cctccccata acacaaaggg aagtatcact gtttatcctc  36120
atttgttaac attgtaaatg tacctcattg taatggtgaa ctctcattca atgttccacc  36180
gagtttaatt catttctaaa gcaaattatg agcaattaaa aagagggtaa ttgtagtgct  36240
gctacatata acattgttaa tgacaaaaat gaaataaaat agtaatactg ttttgaaaaa  36300
gtacaatata aattcatcct atttgggtgc ccgtgtactc aacgatctat aattactctt  36360
ttcctgccta atatgtactc attcattgct cccaatttta acatagttct ctgctgagtc  36420
cccataaaat ttcagttttc gtttttggaa ttctttgcct ttttaaaaac aagtgacaac  36480
tctgcctagt tcttaaaata aagatgaagt gatacttttc tttttttttc cctaacacac  36540
aagtaaaaaa catttgttca tttaataaaa gtccatttga aaatatacac ttttattttt  36600
cttcatgaca cttgtcaaca tataacataa tgaatatttt atattttatt tcattcagaa  36660
tgtaaattgc ttaaagacag aagcgtttgt tttgttcacc ctcgtatccc tagttcttga  36720
acactgccta ggttaaaggg atgcttatga gctgagggaa agaaggaagt aagggaggga  36780
gagagggagg aaggaatgaa gggcacaanc tttaaataat tcatcttcta ttanccttct  36840
tgggtattaa tcaaatttag gctcagaaaa agtcaatttt atatgggcta tgttatctgt  36900
atttagatta taattaattt acattttcaa ctgtgcaata tacnaggcaa gtatgatgct  36960
tatagttaaa gatcctctgt gagatcttta acacaactat taaaaaatgc nactataaaa  37020
aaagttgaag atgactataa aaaatcctta cgttatttgt tatatatgta acctttgtga  37080
tgcgtttatg tgtagcacat aaacaccagt agcatcggta gcatcctaag atgcagcttt  37140
tctcttcctt gggtataaat cttcatatga tgataatcac acaatttaat aaggccattg  37200
tccttcttgt cacccagagc caagcttcag agtttgcttt catatctctt ttgtgagtct  37260
tcccaaaccc aggagtcacc aagtttggtt gattaccttg cccctgaaaa cattatttgt  37320
ccgttcattt gggaattaac attggtttct ctaaactccc catagaatta atcttaccat  37380
ctttcccacc atgtttatag ctttaagtta ttttgcttta tatactagct ggatgtgttc  37440
acatctgttt ttctacaaga ctgttctttt ggttgttggt ggtggtgatg gtggtgtgtg  37500
tgtgtgtgtg tgtgtgtgtg tgttagctag gcattatata tcctctaatg taaaacaggc  37560
acttacccag tgttcattaa gttgagttta tacttcattt ttgggtcaaa taacttccat  37620
taagtgtttt atcatagtgt tagttttgca tacaccataa actatttcca gaaacctctc  37680
aaggagatat ttggatactt atttgttact aaaggtagag gcttatgtca atatcctgca  37740
acatgtttta tcatttgatt tgaaatcttg acattttatt tctattttca tttccctagc  37800
aggtttaatc agaggaggta atgatatatg tgactgaatt cagaattgac ttacatggat  37860
gattacagaa ttcatgattt aatgggatag tcctaaaaaa gcaaaggctt ttctgtttaa  37920
agtttctaat ttttaacctc atgaagtttt ctgttttatt attccaaagg cattttttaa  37980
attcccatgt tattaaagca ttctaatgtc agaatagata ccctattaaa aaatgaaagt  38040
ggtacatctt tatctttctt ttacatatgc aatcccaatt aaaattaaag tcaatatgtg  38100
ttttccttgc aaattaagac aagtttcttc ttcacttttt tttgttagtc ttgaattcta  38160
tttttattac actgtggtcc aagagaatgg ttgttttgat ttcagttatt ttgcattttc  38220
tgagagatgt tttatgtctg attaagtgtt gatgttagaa tatgtgctat gtgacaatga  38280
gaaaaaatgt atatatatat atgtgtatat atacatccac atatatacag tggaaagttc  38340
tgtagatgtc tatcaggtgc atttgatctt tgggggtttt tgccttaatg atctaatact  38400
gtcaaggtgt tgaaatctcc caatattatg cagaactgta agtctctttg aacatctcta  38460
agaacttgct ttataaattt gggtgttcct gtgtaaagtg catatatagt taggatagtt  38520
gggtcttttt ttattattat aaaaaatttg cagaatgtgc agttttgtta cacaggtata  38580
cacgtgccat ggtggtttgc tgcaccatca acctgtcatc tacgttaggt gtttctccta  38640
atgctatccc tctcctagcc ccccacctct tgacaggccc gtgtgtgatg ttcccctccc  38700
tgtgtccata tgttctcatt gttcgactcc cacttatgag tgagaacatg cagtgtttgg  38760
ttttctgttc ctgtgttagt ttggctgaga gtgatggttt ccagcttcat ccatgtccct  38820
tcaagaaaca tgaactcatc cttttttatg gctgcatagt attccatagt atattgggcc  38880
acattttctt taaccagttt atcattgatg ggcatttgga ttgattccaa gtctttgcta  38940
ttgtgaatag tgctgcaata aacatacgtg tgcatgtgtc cttgtactag aatgatttgt  39000
aatcctttgg gtatatatcc agtaatggga ttgctaggtc aaatggtatt tctggttcta  39060
gatccttgag gaatcgccac actgtctttc acaatggttg aactaattta cactcccacc  39120
aacagtgtaa aagtgttcct agttctctac atcctctcca gcatctgttg tttcctgact  39180
ttttaatgat caccattaaa ctggcgtgag atggtatctc attgtggttt tgatttgcat  39240
ttctctaatg accagtgatg atgagctttt tttcttcttc actttttaat cagcttgaag  39300
tgaatgcctt gttagttttc ctactaacgg tgctaaacct agcagtttta aagaccttcc  39360
tgttgaccac agtgcactct tggttcttgt aggcagggag ctggcttagg acctacatag  39420
catatttgga acaatggctt ctggttcttt aagtgttaga atttgtgtgg ctgagaaaaa  39480
aaaaatagtg atattttccc tttgcatgaa ttaaatattt tacctgcaaa gttgcttgtc  39540
ttttataaat tatttttctt ataagtaatg ctacttaaaa tgctaaactt attccttgtg  39600
aaagtctgtt ctattatgat acaaaaattg tagatagctt ttattgaaat aatatttgac  39660
attttcctcc acagattgtt ctttaaaata tttgctttgc ctaataatgc catgtaaaat  39720
ttatttttag ggggatagtt cctatgtgaa agatcgctgg tgtgtttttg atggatttat  39780
ggtcttttgc ctttgggttt ctttggtgct acaggtaatt aaatattttt taaattacaa  39840
gcaggtattc tccaaaatgg gnaattattt tgcattaaaa ngtctaaata gaaantatta  39900
canaaatata tatcaaatgt ngattgtgta attgcctaca acattttnat tttnnatttt  39960
tattttaaca gatgtgatta gtctgtttac tctgacatat ttgaaatttg aaaaattaat  40020
tttaattgat acgtaatact tgtatgtatt tatgggggac tgagtgatat ttgatgtata  40080
caaggtgtaa tgatcaaatc tgcataatta gcaattttat atcacctcaa acattttatt  40140
gttagaaaag tcaatagctg taatatctta attattgtca gttatgattg tgaattattt  40200
ctcaatcaga aacgaaaatc aatactatag aaaattatta gctgttaatc agatataaaa  40260
tatattccct gaaatgaagg aaacaatgtg gagcaatatt tctgtatttg taaataaaaa  40320
attgaactta aaaatttaaa gtctagtctc cccatatttg gataggtatt agccaacata  40380
aaatactata ttgcaaatat taaatgcttt attataagtg atggggaacg tacattaaaa  40440
agacttacag gacagatttg attggaaaat aagtagaatt aatttctgtg cattcattca  40500
gacatgattt tgccttttaa ttcaactaaa gttactatat tctattgatt tgatttgatc  40560
tgttttgatt tggttgtggt aagaatgcct aacatgaaat ctactgtttt aatgaatttt  40620
aattgtacaa taaattattg ttaactgtag gtacaatgtt gtacaggtct ctagagttca  40680
atcatctatt ctttatttaa aaattcagaa ttcaaaactt cacagcccat tctgccaact  40740
catcatagtg tttgttgata agctttcctt tcatattttt ataaagttca cctctcccac  40800
aatttaattt catcactcat atattttttt aatcagcttt gtcaggttga attgtttctc  40860
acattaatgt gttcttttcc atttaataac tattatgtga ttgacaaaca tttcaaatta  40920
ttattttgcc tgttagtaaa tagtgcaatt cttttttaat attttaaccc tttctctatt  40980
actttatttt ctagatattc aaaagcctcc actaaagaac gttattaaca agaaagacag  41040
catacttact atatattcta agttggcact tcttgtaact aaaaactgtc ttaacgaacg  41100
agacaggnaa atgaataaga ttaatgttgt tcttattagt ttatgtattt gtttctgtta  41160
agatagctat agcttcaaaa tatactcaaa agaaagtgga ttttggtgga aaataatgta  41220
tggctaaatt cagagtagag gtgcacctac ttatgctgct aacatctgta tgttccatga  41280
ctataagcaa tgctaaggga aaatccaacc tcatttaccc atcttttaat ttgtaggtgt  41340
ttgaaattgc tgatatagtt gatcagatgt caccttgggg catgttgcgg attccacggc  41400
cactgattat gatccgagca ttccggattt atttccgatt tgaactgcca aggaccagaa  41460
ttacaaatat tttaaagtga gcgctgcttt acaataagtt aagaggaaaa gtttatgaag  41520
ttttttgtaa gttttatgta ctttacctac ttttgtttct ctaggcgatc gggagaacaa  41580
atatggagtg tttccatttt tctacttttc tttctacttc tttatggaat tttaggagtt  41640
cagatgtttg gaacatttac ttatcactgt gttgtaaatg acacaaagcc agggtaagtt  41700
tatctattaa ctgcatttta atctagttga ttaacaaaga tatctctgta attttcataa  41760
gaataacctc tatgtcagat tttttaaaca gtgcttatgt cctctttgtt ctgtgtctct  41820
gcttcctcgg tattgttttt gtccaatttt tattttattt tattttattt tatttttgag  41880
atggagtctc gctctgtcat gaggctgggg tgcagtggcg cgatctcggt tcactgcaac  41940
ctccgcatcc cgggttcaag cgtttctcct tcctcagcct gccaagtagc tgggactaca  42000
ggcgtgcacc accatgcccg actaattttt gttttgtcca atttttaaag acaagtattc  42060
aagacaggac agattggaaa atgtaacctg gtggaaaagt agattaagca aatgcaaagt  42120
gtacatttag aaaccttagt gtggcaaaat ggggagtgtg ctaacataat aacataaacc  42180
tagagcttca ctgtggaagc ttttcatatt agaatgagtt acatgttcgg gaaaaaaagc  42240
tcatttttat tattatttac ttttgtcatc attccctaaa atagtttcct aaatgattat  42300
aacatcattt ctagactaaa cactattatc tgttgcattt gactgttgta gggttggtgg  42360
gtaagataga atgtatgtac tttaattacc tattatgtat tatgcaatag agcacctgcc  42420
tcttctactt ggctgatcat tgttaatata caactccagg gatgtgatgg caggagagag  42480
cagagtggga tgttggcccc tggatggtcc agaagtgtcc cattaggtgt tagctagata  42540
tagagtttgg ggttccaagc acaacccaga angtgcaaca gatatgacta tgccagattt  42600
cagggcagca gggattgggg ataatacaat tgattttata ccttatattc aaatcttcac  42660
ataggaattt gtctatttat aaatgaagaa ctcatccata aattaccgat tgaaaaatct  42720
tgattcaaat cttagaaatt agatttaaag cactttgtaa aattcaaaaa gagattacaa  42780
gcagccattc atcttcaaaa tatttttaat atatcaatat ctacttacaa accaattggg  42840
tatataagga tcattgagtt taaaaacatt gaaagggtta tgttgtgttt tctgcagttg  42900
gaggatttct ttttcataaa gtctatatac ttgtatatat acaaagtaaa taaaccacaa  42960
ataagtgaat atctctgtga gtatagacat catgataagc ttggctcaat tccaacactt  43020
tattttatga gtttgcataa attatttagg ttactcctca atgaagtaga ttaataacag  43080
gacatacttt ctagaggcat caggaagagc aaatgaggga atgaatgtaa agacaagcaa  43140
agtaaccagc acatagtaaa ggcattcact gtatgccagc tgtcattatt ttgttgtcat  43200
aaagagatac gtaaacacgc ttacatgctg aggtggtagg cataagtgta tcctccaaaa  43260
tagagataac atggttaaaa aaaaggaaag agcaataaag aagaccaaaa tttaaacttg  43320
taagagtgtg aaaggaaaac atctatgagt aactcatggc tatgttattt tactgacaaa  43380
gtaactaaat taattctgag tttatttcac atttataatg gtncatttaa ttattagtct  43440
ctcacagaaa taaatttaat aattgaattt ctaattcatg cacaaacagt atatgtatat  43500
tatgcaactc ctaataatta tataatgttc taaaaactaa aagtgaattt agttgtttgc  43560
tgttgcacca ccccaaagaa tgtcaactcc aaaaaggtag agattttgtt tccacgtgtt  43620
ttcagaccag gaggcatgtg caagtttcta ggaaaatatg aatgtattca gtaacttcaa  43680
aacatcagta taatttcact ggttaaatgt taaacagtaa agcataatct attagtcaag  43740
gccttaatta attttatttt tatttagaag gcatgcatct catacctact tagaaattta  43800
ccagaggggg ctgtgcacag tggctcacac ctgtaatctc agcactttag gaggctgagg  43860
agggtagata acctgaggtc aggagttcca gaccagcctg accaatacgg tgaaaccccc  43920
tctctactaa aaatatgaaa attagccggg catggtggca caggcacctg taatgccagg  43980
aggcacctgt gatcgggagg ctgagacaag agaattgctt gaatccagaa ggcggaggtt  44040
gcagtgagct gagatcgcgc cactgcactc cagcctggac cacagagcaa gactccgtct  44100
caaaaaaaaa aaaaaaaaaa angaaagaaa tttaccttag gttcacagaa gtgtggacag  44160
ataccatgcc ttccttgatt atccatagta ttatgttgaa gtaaagatct cattttttct  44220
tgttttttaa tataactttt atttttgcat gatgtgagtg aataatctat tcaaaattat  44280
ttttaaaaga aaaatactgt tgctactaac cccactccta atcttcatta ttattgttca  44340
aaatagcctt ggaaaataac tttttgataa ccattttctg gacatattat tattttcccc  44400
tattattgaa attatgtctc tactttaacc actttattga gattttggtg aatataaaaa  44460
tctttacata tttattatat atgtcttgag ggaactattt cctttttctg tcagaattaa  44520
atccagagag taagttattg catttattat tctacttcct gaaaattatg atccttctca  44580
aattaacttg tatatttctt atgaggtact tcctgaaaat aatgatcctc ctcaaattaa  44640
tttgtgtatt tcttatgagg tacgggtcaa gatgtagtct taacttagtg gttggaatgg  44700
acatcggtat cttaggagaa gctctcagta tttccgttaa gtgggatgtg agctgtagag  44760
ttttcaaagt gaggaagtta cctttaattc ctatagtgcc aagagttttt gatcattgat  44820
gtatgctaaa ttttgtccag tgcttttccg ttttgttcag ttaatgtaat gaattacatg  44880
attgactttt taaatagaaa ccaatcttgc atttctggta tattgctaat ttggtcatat  44940
tgtattcctc tttatacatt ggaagatttg atttgctaat gtttttgtta caaattattg  45000
catctttgtt cacaaggagc attattttta ggttttttaa attgaaatat ctttaccggg  45060
tcttgaaatc cgggtaatgc tgtcctcata aaacaagtgg aacatgtttc caagggttaa  45120
tataagattc atattctttc tttcttaaat gtttgataga attcatgagt aaaactcagg  45180
gcctgaaatt ttctttgtga gaacgttttt cattacaaat taaatgtatt caacttacag  45240
agctatggag ttgttatctt tcttgttctg ttaagttggt aaattttgct tttcaaagag  45300
cttacctatt tttataattt gtcaatattg cataatgttt atacaaatgc cctctgatta  45360
tcttttgaat gtctgattat ctttttaaca tctgtagaat agtggtaata agccattttt  45420
tcctgacatt gataatttgt acctttctct ccattttttt atgtcttctc aattgtatta  45480
ttcttttcac acacacacaa gaatctttgc cctatttaat gttctctatt gttagtctgt  45540
ttttcatgtt gattttttat cttcattatt tccttatttc tgctttttag tttttgtttt  45600
ctttttcatc tttcataaaa tgaaggtata tagacatctt ttaacatttt tctaatacaa  45660
taatttaaaa atataatttt cctctaagca ctgttttagc ctctaagcac tgttttagct  45720
gcatttccaa aatgttgata tgttgtattt ttattattat tcaattcaaa tatcttctaa  45780
tatatgtgat ttctcctttg acctgtaggt tatttagaag tgcattttta gaaggatgag  45840
attttctaaa aatgttattt gggtgcataa ttttattctg ttgtggtcag acaatagtcc  45900
ctgtgaaatt tcagcctttt gaaattcatt aggaatcatt ttaaggacca gtatatggtc  45960
tgaattggtg aaaattccat gagaatttga aaagaaaaaa gtgaaatctg cagtttttga  46020
gtataatatc tataaatgtc accaaagtca agttggctga taatttgttc tgggtatttc  46080
tatccttctt ggtttttaaa atcagggttg ttctagcaat tgctgagaga gtactattca  46140
attttctaga catgacagaa attttcaatc tctcttattt ttgtcagttt ttgctttcta  46200
taattttcaa ctttaattag gcgcataacg tgtcattgta tctttcagat gggctgacct  46260
ttttatcgtc atgaattttg aatttttttc ctaattagct tcgggatgcc agggtatatg  46320
atgggtcaag aacatgacgt ttcaaatttt tcagtaatca taactctaaa gtaatgtgta  46380
actctaaaat aatttatttt atttaatcat cttttatctt attaatcaat tgatttgttc  46440
ccacaattac ttacgtgtac tttagaccat tcctggattg acagtaaaag ggagcacatg  46500
acaaattctt agttttagag catgggctgc acaatcctga gcccagcctg gtggtgatga  46560
aattaagccc agtactaaga gcgtaaatga agaagaaact cagtagtaag agagtgtgga  46620
ccaactggtc agatgctcta atcagcaact ctcattccac tgtcaaaacc ttggagattt  46680
tgtatgtttt ttaaataggt gaagtgaatc aagtggtgcc taccaaattt attttgtcct  46740
ctgcatcagt gcgtggcata caacattaac aatgagaagc aactaactcc tataagctat  46800
tttgggggaa tagaggatgg tacaaatatc acaactttac agcaaatatt acaactcctt  46860
caaaacacag tttggcagtt tttaaaaaaa taaaaataaa agagttgatc aagctgggta  46920
cagtggcaca cacctgtaat ctcagcactt tgggagactg aggtgggatg atcacttgag  46980
cccaggagtt tgagactaga gtgagctatg attgcgtcac tgcactccag cctgggtgat  47040
agagtgagac ccagtctcta agaagtaaaa atgaaagaaa gaaaaaaagt tggacaggca  47100
cctgccacat ctcatttatt ccactccagg tatttaacca aaataaataa aaatgtatgt  47160
ccatagaaag atttacacat gaatgcccac agcaacttta ttcatagtac tccaaactgg  47220
tgacaaccca aatttccatc aacagataga taaactaatg atggtatatc catataataa  47280
atactgttta ataataataa ataatgaact attgatgtat acagcatctt ggataaatct  47340
caaaataatt atgatgactg aataaagcca gatttaaaaa gaggacatgt tctattattc  47400
catttacata aaattctaga aaatgcaaac ttatctttaa tgatagaaaa gaaatcagca  47460
gttgcctagt gataaaggtt gtggtgggaa ttaagggatt acaaaggggc ctcaagaaac  47520
ctttggggtt tattgacatg ttcattatct tgactgtgct tctgtacatg tgccaaaact  47580
tatcaaactg tacactttcg tatgtgcagt ttatgttatg tcagttacac ccactgaaac  47640
tgcttaaaat gtctcagtgt gaagtagaaa tctaattttt catatggtta agcaattgtg  47700
cctgcactat ttattgtgtg ctattaccca ctgagtttag tttcacctgt ctcattcact  47760
aattccctgt ctatacgtgg gtctgttcct gtggggctct gttgtgcttc actggtctat  47820
tggactacct ctttgccaat atcacactct gaaagtcttt cagattacaa tctggcttta  47880
cacatggggt catatttcca gctttcagct ttacatgggc tcaagacctg gtcttccgcc  47940
tcacatgggc attaaaaccc aggcattagc tcccattcat aacactatgt caactcatgt  48000
tccttctgtt cctactcatt tactgctttc cttcttatgt tttgacattt tggaatgcag  48060
gttttgtatt gtgagcctaa atgcggagtt tttaatgcta tctatttgtt tgtagtggaa  48120
ggagttgaat ttggtgtagt ccatcttgcc acaaccagga ctcacatcca tagctatttt  48180
tttttctatt tttgtctaag gtccttgagg acacgtatga gaaaggtaaa gaggatattg  48240
tgttatattc atctttttat ccttactacc tagtatccta acacagaata aataattagt  48300
aactatttat tgaaggcatg gttgagaaca tattctattt agacagataa tattaacatg  48360
atgacaaatt gataaagaag atgaaataaa aaagaaacag agaaaagtaa gttgctaaaa  48420
gcaggaaagg agaaatggct aaaaaataga aaaacaaagt ttaagcagaa agaagcagtg  48480
aattagttca tatacggagt aagaaaattg aagcaagtgg tgagtaaggg agttgactgt  48540
gtgggtgagg gaagagacaa atgcatggaa gaaaatctgt aggtagttgg atttattttt  48600
ttagtgtatg taggctgtag aatatgccta gattgttcta tgagtgaata tgaaaatgga  48660
aaaagatatt gtgtgggttg gagacaatca atatggagat gaagaacagg gaaatcttct  48720
ggataagaaa gcagctgtgt agtactgcag tgggtacaga ggctggcttc aaattaccgt  48780
tttattaaaa ccaagtcaga atgtgagagt tataaaactt gtaaatgcag ctagaagatc  48840
aggcattatg ctggcaaacg aaagctcata ttggcacata aatgatcgca gaaattgaga  48900
acagatacac gaatgtcttc tgaactcatg accctagagt tgcttcagta agtattcttt  48960
gctagttcca cgctgtattt ggtaccaaga aaagaatgat actgaaaaaa tgcatgaaaa  49020
catgccttgt gatctaaata ttagctccag ctcattactt tattctaaaa atgaagttca  49080
ccatgaaaaa tttcataaat gttgacagaa tgcttagtta cctgagacat agccattatg  49140
gtgaaatggc tgcatttttc tctttcccat atgtgtaaaa cctgcctagt agcatacaca  49200
cacacacaca cacacacaca cacacacatt tattttgtct tctttttatg tgactctttg  49260
tttactattt aagaagaaaa tgcttaacta gccacatggt agtaatgttg ctcataatca  49320
caactgttat agctttgata attcatttca agaatctatc aataatatct tttttgttgt  49380
tgtttttttg agacagactc tcactctgac acccaggctg gagtgcagtg gcatgatctc  49440
agcttactga aacatccatc tcccaggttc aagagattct cctgcttcag ccccccaagt  49500
agctgggact acaggcgtgt gccaccacac ccgggtaatt tttgtatttt tagcagagac  49560
agggcttcat catgttggcc aggctggtct cgaactcctg acctcaagag atctgcctgc  49620
ctcagcctcc caaagtgctg ggattaaagg cctgagccac catgtccagc cttattttta  49680
aaaaaaaatt tcagttcaat attactgcat tttaaagccc cacacataag cagaaaaact  49740
gtcagcacca ttttaccgtt actattagcc cagacataaa tgtagtttta ctcttagaga  49800
ctcaagaaat atccaaactc aaaataaaac agaaaatgtt aattgatttg aaaattttta  49860
aacttttctg tttccttttg tagcctctaa actatgactt tttttgctgc tataaagaca  49920
catgcacacg tatgtttatt gcagcactat tcacaatagc aaagacttgg aaccaaccca  49980
aatgtccaac aatgatagac tggattaaga aaatgtggca catatacacc atggaatact  50040
atgcagccat aaaaaatgat gagttcatgt ccttggtagg gacgtggatg aaattggaaa  50100
tcatcattct cagtaaacta tcgcaagaac aaaaaaccaa acaccgcata ttctcactca  50160
taggtgggaa ttgaacaatg agaacacatg gatacaggaa ggagaacatc acactctggg  50220
gactgttgtg gggtgggggg aggggggagg gatagcttta ggagatatac ctaatgctaa  50280
atgatgagtt aatgggtaca gcacaccagc atggcacatg tatacatatg taactaacct  50340
gcacattgtg cacatgtacc ctaaaactta aagtataata ataataaaat aaaataaaat  50400
aaaataaaat aaatttcaaa aaagtcaaaa aaagaattcc ctgtgtaaga acattcaaag  50460
tgaaaggagc atcataggga aaagacaaac cgtgaaagca gagaaatagg agacgccaca  50520
tcaagacacc accatgctta caagttggca ttttattctg aagaccataa tgaactgcca  50580
aagaagctga aacctaaaat aaaattattg tttttacata taaagatgat ttttcacatc  50640
tatatttatg atctcacctt ttaaatcagt atctactttt gaaaatgtac atgtaacctt  50700
caacatatac acagaaaata agataaacta atttatatag ttttgtttca atcctacaca  50760
attagagttg atttttactc catatttaga tttccagaat cccagctcat taatttaata  50820
tttattaagc ataaaagctt taagacctag aatgcatggg acgtggaatt aagcactagg  50880
gataaaagag gaagaaaaaa ataggtcatg tcctggagga gctcacactt gaggcagcca  50940
aagattaatt accttaggca ttgattagta ataataataa taattagtta gaaagtgtta  51000
tcagatgtca aaaaagagag aaaatgtgag ttttatagtc tttgtaaaga atatgacctt  51060
tgagcaaact ctagaattag gaatggagtg tttgaattgg aaattaaggc aggataatac  51120
ctttcagatg aaacaatgta atagagtact aggatgtata atagaatgct ggccccaaac  51180
tgggatggta gatttaagtt gtgagtttct ttctacaact gcagagtcca ttgaataaat  51240
acaactttat atattaaaat taaaaaaata aaaaaaaata aaaaaagaaa ttctgtcatt  51300
tggaataaca ggaatgaatc tagaggacat tatgctaagt gaaataagcc aggcacagaa  51360
agatcaatac tgcatgatct cacgcatatg tggaatccta accagttaat tcattgaagt  51420
agagaggaca atggtggtta tcaggggctg cggcgagaag gagatggagc tgcaagggaa  51480
tgaggagctg ctgatcaaag ggtacaaagt ttcagctagg cagtaagagt aagttttgag  51540
atccatgcac aacagggtga caatggtcaa taataatgcg ttatatatgt caacataact  51600
aagaaagtaa atttcaaatg tatcatcaca aaaaagttaa gtgatatgat ggatatatta  51660
attggcccga tgtaaccatt atgtcttgta tacatacatc aaaacatcac atggtgctgc  51720
attaaagtaa tacaattatg atttgtcaat taaaatacta ttatttaaaa aatgtattat  51780
acacatctcc gagtcacata ttaagctaag gtatgatggc tgtgttttca gcaatcagtg  51840
ttaccagcta ctgccgtgac ctcatttctc ttaatcattt aagagaaacg attaagagaa  51900
gttgttaaca attgttccaa gttctgccta attgatttgc atgtattata gcctaatcat  51960
gacagagatt tcagaccaga aacttgcata tcttgggttt catagttgac ctccagaact  52020
gattgtgttt aatatgtgag gcaaacaaga taaagaagca acacaatata tacagttttg  52080
cttttaaatg gaacttagtt cctgtaaggc ccaatagcag gaaatcttag ttatgtcttc  52140
agtagcagta ctagtaaagc tttagattct tctctgttaa tgaatggaga cctaaggcaa  52200
ttatgaaaag agtaatgaga tttgactaag caaagcagct catttcctaa agaaagttga  52260
ggagagcaat ggcttgtagc agaaacaggt gttgtgaaat accaactgtg atggcagaaa  52320
tctccccgaa gctggaacag gaatgtttaa aaatgagctg gcaggttaaa tagaaaagat  52380
gaagacttac ctgacacctt attatcattc ctgaaaaaga agggaaacat attcatagct  52440
cggtatcaaa taatgaaatc ttatttccaa gagtgagata attagaaaaa ctttaaggta  52500
agtaagtgta accattaaat atatgaaagt ttaatataga gagagcagga ttcaaacagg  52560
aactcaggaa catattcgcg atggctggac cactagcttt aagcccagag gttgggtgat  52620
cacacatcac agatgcccag gacaatcttg gcttatccct actgtttcaa agtaatcact  52680
aacagcctgt tattcgattt taaggaatct caatgtagac aatgcatttt atggtcacct  52740
tgcccagggg aagtttatag aacttggtat tttataaaat atcaccaaga gttgaattag  52800
agataatata aagttggatt tttttgcagt ttgctcttgc tggtccaaat acattttaca  52860
tttattaaaa taaatacatt aaaatttatc aactaaatta aaatttattt gtcacgtatt  52920
ctttagggta cttggcaaat aagtgaagta ttgtcttata aattttgttg acaaaataaa  52980
gaggtttttt catggaatgc tatgcagcca tgagaaagaa tgagactatg tcctttgtag  53040
caacatgaat gaagctggag gccgttatcc taagcaaact aacacaggaa gagaaaacca  53100
aataccgctt gttctcactt atgaatgaga gctaaacact gagtacatac agacacaaag  53160
aaggcaacaa cagacactgg agcctacctg agggtggagg atgagaggaa ggtgaggact  53220
gaaaaactac ctatcgggtg ctatgcttat tagctgagtg gcgaaacaat ctgtacgcca  53280
cgctcgcatg acacgcagtt tacctatata acaaacctgc acatgtatcc ctgaatctaa  53340
aataaaagtt aaaagaaaaa gaaatacaaa tggaaacata ctggaattta gagcattaat  53400
ttttaatttc taaggacttt atcaagagac agttttgtag aatatgtaaa atcataattg  53460
ccccaaattc atgcaacggt ctatgacgtc ttcttgattc ctatgtattt atttatttac  53520
atatgtttat tgacacaata gatgtnaagt atttttggag tacatatgat atttcgatac  53580
attgatgtaa ggcataataa tcaaatcagg gcaattggca tatccatcac ctgnaaacat  53640
ttttcttaat actgggaaca tttgaattat tctctactag ctattttgaa atatgtaata  53700
aattactgtt tactatagtc accctactga tttatcaaac gcttaggtct tatttatttt  53760
atctgactgt atttttgtac ccattcacca acctttcttc atccaaccct ggcctttacc  53820
cttccccttc tctggtaaca accaatctac tttctatctt cataagatcc acttacttaa  53880
ggcctaaata tgagtgagat catgtgatat ttgtctttct gtgcttggct tatttctttt  53940
aacataatga cctccagttc tgtccatgca gctgcaaacg tcaggatttc actcattttt  54000
atggctgaat agtattaaca ctgtgtgtgt gtatatatac atatcacatt ttctttatcc  54060
atttatccat tggtgggcag ttaggttgat tccgtatttg gctatttgga atagtgctgc  54120
agtcaacatg tgagtgctgc tatctcttaa atatatagat ttcctccctt ttggatatat  54180
acccaatagt gaaattgctg gatcatagag ttgttccatg tttagttttt ttcagtccgt  54240
actgtttttc acagtggctg tcagaatttg cattaccacc aacagtgtat gagtgttcct  54300
gtttctctac attctcacca gcactcactg tcttttttat aaaagccatt ttaacttggg  54360
gtgacatgat atttcactgt agcttttatt tgcatttccc tgatgattag tgatgttaac  54420
catttttata tacctacttg ccatttgtat gtcttctttt gagaaatgtc tattcagatt  54480
ttttgcccat ttcttaatca gattattaga tttttcccat tgagttattt gagttcttta  54540
tatattctgg ttattaatcc tttgtcagtt gaatcatttg cagacatttt cccttattct  54600
gtgggctgtc acttcaattt gttgattgtt tcctttgctg tgccgaagtt ttgagcttaa  54660
tgcaattcca tttatctatt tttgctttag ttgcctgtgc ttttcagatt ttgccccccc  54720
aaaaatttgc ccagtccagt gtcctggagc atttacccaa tgttttcttc taggagtttc  54780
atagattcag ttcttagatt taagtcttta atcctttatt atttgatttt tatatgatga  54840
gaggtaggag cataatttta ttcttctgca catggatatc catttttccc agcaccattt  54900
gttgaagaga ctgtcctttc cttaatgttc ttgatacctt tgtcaagaat gaattggctg  54960
taaaagcatg tatttatttc tgggttttct attccattcc attgggatat tttctgtttt  55020
tttaccagta ccatgctggt ttggttgcta tagctttgta gcatattttg aagtcagtta  55080
gtgtgatgcc tccagctttg ttctttttgc acgagattgc tttggctatt cagaatcttt  55140
tgtgttttaa tataaatttt aggatagttt tttatattcc tgtgaagaat gtcattggta  55200
ttttgataga gattgcattg aaactgtaga ttgcttcggg tagtgttgac attttaacaa  55260
tattgattct tccaattcat gagcatcgaa tatctttcca ttttttgtgt ccacttcaat  55320
ttctttcatc agagtgttat agttttcatt gtagagatct ttcacttctt tagtcacaat  55380
tattcctagg catttttaat tttttaataa atattgtaaa tggcattgct ttcttgattt  55440
atttttcaga ttgttcactg ttggtgtata taaatgctat taatttttgt atgttggttt  55500
tgtatcctgc aatttactga gtttgcttat catttctaac agtttttggt ggagtcttta  55560
ggattttcta agtgtaagat catgtcgtct gcaaatgagg ataattttat ttcttccttc  55620
ccaatttgga tgtcgtttat ttctttctct tatctgattg ctctggctag aacttccagt  55680
agtatgttga ataaatctga tgaaaatggg tgtcctgatc ttgttccaga tcttagcaga  55740
aaggctttca atttttccgc ctttggtatg atgttangcc atgggtttgt caaatatggt  55800
ctttattgtt ttgaggtata ccccttttat actcaatttt ttagtgtttt gataataaag  55860
acatgttgaa ttttaccaaa tgctttttct gcatctattg aaataataac atggtttttg  55920
ttcctggttt atttatgtaa tgtatcatgt ttattgattt ccatatgtta agccatcctt  55980
tcatttctgg gaggttaaat aatatgtcca gatggtaagt aagaaagcca ggattttaac  56040
tcaagtctaa cttccaagcc tatgtacgtt ttaccatttg agaaacttct gtattttaat  56100
tctacattca taaacctata gacatataga gatccacatn ccatatgtat aaactgtttn  56160
ataatatatg tagtataatt tnctnacatt aaagtttttn attaangtct ggtttctant  56220
ccctatgtat atgnttatgt ttcatgggat tcgacttnca tctaaatnct ataaactagn  56280
tgatatattn atatattttt agtactatct atatatctct tttnaaaatt gttctgcaca  56340
ttgatctcca agatgtgaac cacctgaggt gccagaaacc agcctttcat atgataataa  56400
tattaataaa gtaaatataa gaatatattt cagaataaat tgaactttca gatgaaaatt  56460
aataccagca tgatttttac cagaatagca aaaatgtttg tgagagtctt cagtatacca  56520
aaagaaaacc atgcagtttg aatgggggtc taaaaggaaa ngtaacttat tttgatccat  56580
cttttgatca tatgtttact tcccaaaaag aagataatgt aatattatag gttataagat  56640
tcttattttt agtggtaaat aacttttatt gaacaattgc tgtatgttat tttctcactt  56700
aatacttata acaacccgat aagttatgtt ccatttttac actgtatatt acagccaagg  56760
aaattgaagc tgagtaaagt taaacaaagt ggctgagatg aaacagcttg tatcagaagc  56820
aagactagac ccatttctcc ctcacactgc tttctatgct ttcagttgta acttgttcag  56880
tgtatgagat aaccttcctt caacatgtgt gtccaaaatg tttgaataaa atatttagtt  56940
ttcctttagt tacaaggagc ctattcttaa aagacaagtt ctcagtggga cgcatgagta  57000
agtggttaat tacgattgct tattttaaga ctgaattcta aaggcatgca ctggaacttc  57060
tgaacatcct ctgtgagtgt ggaatgagga gctctaccta ttctgtccct cacaaatagt  57120
gtttactgta gccgcctcca cagaatcgat atttactatc acttttgtat ctcaggttcc  57180
acccaaccag cttggttttc cccatgatag aaaccataat aagtatgcat aactacagca  57240
gcaccaagag taaattttng aaaattaatt tttaggatga aatctctttg gtaaagaaaa  57300
tcacctggca aaagttgtaa aaaatactga ttccaagcca catttgtgat tcgtattttt  57360
aggcaaggct gagattctca gaattggcca ggttagaaat caatcgttta aaattttagt  57420
tttgcaatta aactccaaaa gatatgttat agagtagaac acaaaattac atggcttttt  57480
aaaaaaatag accttgagtc ttcaaagaaa tgttagtctt ctagctagct gcttactgcc  57540
ctgcccaagg gtagcatgcc tgtcctcttc ccttaagact atttccccag aaatgtccaa  57600
ggagcaccag aggtaattag agcctcctgt ctttcctgca aagaggcagg tatgtctttg  57660
ttttctggga cggacaacca tctcaatttt atttatttag tgactcttac atgttcttat  57720
ttctagagat tgaattgggc tggtgtactt tgtggttgag tgtggttgga gtcgtcaggg  57780
gcattggcac ttttaaaatc cctcactgac tttacttttc gtgttcacat cattggggag  57840
tttgtaaatc cattctttca ttgctataaa gaaatacctg aaactggcag ggcacggtgg  57900
ctcatgcctg taatcccagc actttgagag gtcaagacgg gcagatgact tgagactagg  57960
agttcaagac caacctgggc aatatggtgg aaccccatct ctactgaaaa tacaagaaat  58020
agctgggaat ggtactgtgc acctgtgatc ccagctactt gggaggctga ggcacaagaa  58080
tcgttggagc cgggaggtga gggaggttgc agtgagccga gatcatgcca ctgcattcta  58140
gcctgggtca cagagtgaaa ctccatcgaa ggaaggaagg aaggaaggag agagagagag  58200
agagagagag agagagagag aggaagagag gaagagagga agaaagagaa agaaangaaa  58260
gaaaaaaaga gagaaagaaa gaaaaaagaa aggaaangaa aaagagaaag agaaagaaaa  58320
gaaagaaaga gaaagaaaga aagaaaaaga aagagaaaaa gaaaaactga gactgggtat  58380
cttatttctt ttattacatt tttgggtcct atatttgtat catacagaat gagttctgta  58440
tatttttcag atggaaaaga aatattgact taaaaggtac ctctcaaatc ttaatgtgta  58500
caataaactg gagatcgtgt taatgtagat tattttttca gaagatctgg aagaaagcct  58560
cagtttctga atttttaaca agctcaccag taatgtcaat gtttttggcc aaagaagaat  58620
attttgtcaa aaattcagta agtggaagag cctgtgtttc tttttctagt ttttctggct  58680
tgtaaacaaa gatgagagtt ttcatttacc aaagacagat atatgcaaag aaaacctaag  58740
aaagaagggc agctgccaga ttaaatgtga tggtttatgc acatcagctg cataaagata  58800
cctaataatt aagagaaaaa taattaactc tgtagtgcga cagtctgtca gagagctctt  58860
taaccaagtg aatcataaac attaactgca ctaggacaaa tttttatgan tgtgctgatg  58920
cacacagaag gacgcagcat cactgctgtg atattgcccc ctcaaaagta cattatagtc  58980
taaatttaac cataaagaga catcagtttt atgcgaagct caagatacac gtatctttca  59040
tgttctgtaa tttgtaatgt tgattttaag tagtctttag caccctaggg agcaagcatc  59100
tcctaataat ttttttcaga actttctggg taataaatgc catcctgttaaataagtatt   59160
ttctactttt tttcctgctt tgtatccatt tattcacttg tttgcttttt aaaaaatttt  59220
tactttaagt tgtgggatac atgggcagaa tgtgcaggtt tgctacctag gtatacatgt  59280
gccatggtgg tttgctgcac ctgtcaaccc atcatctatg nttttcagcc ccgcatgcat  59340
tagctatttg tcctaatgct ctccctcccc ctgcccctca ccccgcgaca gaccccagta  59400
tgtgttgtat gttctcattg ttcaactccc acttatgagt gagaacatgc gctgtttggt  59460
tttctgatcc tgtgttacgt ttgctgaagg tgatggcttc cagcttcatc catgtccctg  59520
caaaggatat gatctcattt ctttttatgg ctgcatagta ttccatggtg tatatgtccc  59580
acattttctt agtccagtct atccttgatg ggtatttggg tggttccgtg tctttgctat  59640
tgtaaatagt gttgcaagaa acatacgtgt acatgtatct ttatagtaga atgatgtcta  59700
ttcttttggg tgtataccca gtaatgggat tgctgtgtca aattttattt ctggttctag  59760
atccttgatg aatcatcaca ttgtcttcca cagtggttga actaatttac attcctacca  59820
acagtgtaaa agcgttccta tttctccaca tcctcgccag catttattgt ttcttgactt  59880
tttaataatc gccgttctga ctggtgtgag atggtactgc attgtggttt tggtttgcat  59940
ttccctagtg atcagtggtg ttgagctttt tttcatgttt tttggctgca taaatatctt  60000
cttttgagaa gagtctgttc atatcctttg ttcacttttt gatggggttg tttctttttt  60060
tcttgcaaat ttgtttacat ttcttatagg ttgtggatat tagacctttg tcagatgggt  60120
agattgcaaa aattttctcc tattctattc tgtaggttgc ctgttcactc tgatgatagt  60180
ttcttttgct gtgcataagc tctttagtac ttctagttta attagatccc atttgtctgt  60240
tttggctttt cttgccattg cttttagcat tttcatcatg aaatcactgt ccatgtctat  60300
gtcctgaata gtattgccta agttttcttc tagggttttt atggttatgg gtttaacatt  60360
taagtcttta atccatctcg atttaatttt tgtctaaggt ataaggggtc cagttttagt  60420
tttctgcaca tggctagcaa gttttctcag caccatttat taaataggga atcctttccc  60480
cactgcttgt ttttgtcagg tttgtcaaag atcagatggt tgtagatgcg tgatgtgatt  60540
tctgaggtct ctgttctgtt ccattggtct atatggctgt tttggtacca gtgccatgct  60600
gttttggtta ctctagcctt gtagtatagt ttgaagtcag gtagcatgat gcctccagct  60660
ttgttctttt tcctaaggat tgtcttggtt atacaggctc ttttttggtt ccatatgaaa  60720
tttnagggta gtttttttct aanttctgtg aagaatgtca atggtagttt gatgggaata  60780
gcattgaatc tataatttat tttgggcagt atggccattt tcatgatatt gattcttcct  60840
atccatgagg atggaatgtt tttccatttg tttgtgtcgt ctcttatttc cttgagcagt  60900
gatttgtagt tctccttgaa gaggtccttc acgtcctttg taagttgtat tcctaagtat  60960
tttattctct ttgtagcaat tgtgaatggg agttcattca tgatttggct ctctgcttgt  61020
gtatttttgg tgtataggaa tacttgtgat ttttgcacat ccattttgta tcctgagatt  61080
tgctgaagtt gcttatcagg ttaaggagtt ttcgggctga gatgatgggg ttttctaact  61140
atagaatcac gacatctgga aacagaaaat ttcacttcct ctcttcctat ttaaataccc  61200
tttatttctt tctcttgact gattgctctg gccagaacat ccaatactat gttgaatagg  61260
agtggtgaga gagggcatcc ttgtcttgtg ccagttttca aaaagaatgc ttccagcttt  61320
ttcccattca gtatgatact ggctgtgggt ttgtcacaaa tagcacttat tattttgaga  61380
tatgttccat caatacctag tttattgaaa gcttttaaca tgaagagttg ttgaatttta  61440
tcaaaggcct tttctgcatc tattgagaat catgtggctt ttgtctctgg ttctgtttat  61500
gtgatgaatt acgtttattg atttgtgtat gctgaaccag ccttacactt cagggatgaa  61560
gccgacttga ttgtggtggg taagcttttt gatgtgctgt tggattcggt ttgccagtat  61620
tttattgagg atttttgcat tgatgttcat cagggatatt ggcctgaagt tttatttttg  61680
ttgttgttgt gtctctgcca ggttttcgta tcgggatgat gctgacctca taaaatgagt  61740
taggaaggag tccctccttt tcaattcttt tggaatagtt tcagaaggaa tgataccagc  61800
tcctctttgt acctctggta gaatttggct gtgaatctgt ctggtcctgg gctttttttg  61860
gttggtaggc tattaattac tacctcaatt tcagaacttg ttattggttt atttagggag  61920
ccaacttctt gggagggtgc gtgtgtccaa gaatttatcc atttcttcta gattttctag  61980
tttatttagg tagacatgtt tatagtattc tgatggtatt ttgtatttct gtggggtcag  62040
tggtgatatc cccgttatca ttttttattg tgtctatttg attcttctct cttttcttct  62100
ttatcagttt agctagcagt ctgtctatct attttgttaa ttttttcaaa aactagctcc  62160
tgaattcatt aattttttga atggcttctt gtgtcactgt ctccttcaat tctgctctga  62220
tcttagttat ttcttgtctt ctgctagctt ttagattttt ttgctcttgc ttctctagtt  62280
cttttcattg tgatgttagg gtatccattt gagatatttc tagctttctg atgtgggcat  62340
ttagtactat aaatttcctt cttaacactg ctttagttcc cagatattct ggtacgttgt  62400
ctctttgttc tcattggttt caaagaactt cttgatttgt gccttaactt cattatttac  62460
tcaggagtca ttcagcagca ggttgttcaa tttccttgta attgtgttgt tttgagtgag  62520
tttcttaatc ctgagttcta atttgattgc actgtggtct gagagactgt ttgttatgag  62580
ttcagttctt ttgcatttgc tgagcagtgt tttacttcca attatgtggt tgattttaga  62640
ataagtgcca tgtcgcactg agaagaatgt atattctgtt gatttggggt tgagagttct  62700
atagatgtcc attaggtcca cttgatccag agctgagttc aagtcctgaa tatccttgtt  62760
aattttctgt ctcgttaatc tgtctaatat tgacagtggg gtgttaaatt ctcccactat  62820
tattttgtgg gagtctaagt ctctttgtgg atctctaaga acttgtttta tgaatctggg  62880
tgctcctgta ttgggtgcat atatatttag gatagttagc tcttcttgtt gaattgatcc  62940
ctttaccttt aagtaatgcc attctttgtc tttttttatc tttgtttgtt taaagtccgt  63000
tttctcagag gctaggattg caacccctga tttttttttt ttctttccat ttgcttggta  63060
ggtcttcctc catcccttta ttttgagcct atgtgtgtct ttgcacatga gattggtccc  63120
ctgaatacag cataccaatg gatcttaact ctttatccaa gttggagact gggtatttta  63180
taaagaagaa aggtttaatt ggctcatggt tctccaggct gtacaggaag catggcacca  63240
ggcacctgct cagcttctga tgaggcctca ggaagcttac aatcatggca gaaggcagac  63300
ggggagcagg cacatcacgt gacaagaatg aacacgagag agagatagtg gaggggaggt  63360
gccctacact tgtaaatgac cagatcccct gtgaactcag agcaggagct cattgatcac  63420
ctaggagttg gctcaagcca ttcatgaggg ttctgcccct gtgatccaat cacctcccac  63480
caggccccac ctccagcgct gaggagtata cttcgatgag atttgcgcaa ggacaaatat  63540
ccaaactata tcagggagtc gttagtatgt ctggccacct tgaaaggatg aaagcttatt  63600
ggagtggaaa aaaaattgcc tctctccagc catacaactc agtcaaacca cattcaatta  63660
acataaatat attttgacct ccaagtatgt aagaggtgat ttatattcac aatttctaat  63720
ttataataca gtttcataaa tttgatcttc acaagaaaga tgagcaaatt gctccttgcc  63780
aaagttaatt ggctgaatta ccaactgaag ttctgttatg cttggcccca aattctggtg  63840
gcccctttcc attatgtcaa ctggctctct ttacatatag attctcaccc tgtagtttcc  63900
agttcctaag gcaaaaggag aaaagttgct gcgtgaggat ctcttggccc agattttaaa  63960
agtcaaagac agtggactgc cttataacct caaacggttt cacatttcag tttggagctg  64020
atcagtgcat cctctgtgtc ctgatgctta acttttcttt tcttttcttt ttgaggtgga  64080
atctcactct gttgcccagg ctgtagttca gtggcatgat gttggctcag tgcaacctct  64140
acccgctggg ttcaagtgat tctcctgcct cagcctccca agtagctggg attacaggca  64200
tacgctacca aacctggcta atttttgtat ttttagtaga gatgggtttt actgtgttgg  64260
ccaggctggt ctcgaattcc tgaccttagg tgatccgccc gcctcggcct cccaaagtgc  64320
tgggattgca ggcgtgagcc actgcacccg accaactttt ctgatattat tttgaatatg  64380
ttcatgccct ctcattgcct tatcctaacc caactgcagt cttctggctt ctgtcaggtg  64440
cactgtccct tatccatact ggcaaagtag ttgagggagt caacttgggg aacatatatt  64500
attttaaaaa gctattcaga tataacaaga taactattta aaatattcct ttaaaataaa  64560
atcatgtact gcattgtcac ttaaatttca tagtcacaat atttgaaaaa atacttaatt  64620
ttaccatttt tatgcatgat ggctacaatt ctttacaact ttgcctacca accctttcag  64680
gaatgggtga aaggagtggg aaaatcatat taaaatactc agttttacaa cttatttcct  64740
agaaaaaatg tgccaggtta acttgtttat taaaagaggt gtgatgtcaa tattatttcc  64800
tgcttcagaa tatttatctt gttttgcagt tccactaaaa gtccaggcgg agccattgaa  64860
agttttccaa aatcaataaa taatttatct ctgcaaataa gactcttgct ttccagggtg  64920
ggattagtat tccaaagcat ccagcattag aattagctag accaattcat aggagtttat  64980
aattaatcct gaccagagga agctaaataa gagtgaaaat gaagtcagat gattgtctga  65040
agtgaagctg gaaggcggta acagccagac taagttttct gtaagtacat gcaatgacca  65100
ggaaaacctc tcaatctagg ggtcagcttt tagcaagata atgtgtcttg ctaaattttt  65160
atatctgcca caaaaggcaa gacaagcacc acgtaaggta tcaaaggcta tattcattat  65220
tctcttgagt gcaaaagagt ctgtgtctgt gtctatgtat gattgtgtgt gggtgtaatt  65280
ttctccatgg gtttatttag aattgtgttc ctctattttt gatgtatttc tagaacatac  65340
tatataaata aaaatgaagc cttacagatg caatcaaaaa caaaatgctc aagttgtata  65400
gtgttatctg ttgcatgtgg atttgttggg ctacttattt atttacatca ctgacaattt  65460
cttatggaat gccgacttca gaaatgtatt gtagcttgga ctctgcaaat gtcttttaca  65520
acaaatgggt caaatttcga taccaagaag tcatccttag cctgtttgtc tttagctttt  65580
taacaaaaaa aggtaataac aatgtaaaca aaattgctat gtataaattc ctatcatagg  65640
tatatgtttt gaaaatctag caagtaaatt tagtaataat ttattttgtg agtatctttt  65700
gacctttttt gtcctttctc acctactagg aacagtttat aatcagctca tgctgcatca  65760
gtcacagtat ccatttaggg tagcacgaat ccttgtcttt taccctaatc tataaatctc  65820
taacagtgta gtttaaaaat tgcttttgta tgataacaac tgcttgttaa caatccttgt  65880
atctcactaa acagctacac tcaccagaga aaaggtgaaa aggtctctct ctttctctct  65940
ctctttcttt ctgtcactct ctctctctca tatgcaaatg caggctctga cattttcact  66000
ttccagaatg ttatgctgtt tattccatcc ctagaactag tacgtgtgca tcctttaata  66060
atagtcactc caagcaacac cctattgcaa ggttttccca gtacccacca tctgccaccc  66120
gtagtcatag ttgatgtttc cgctttgaac ttcagttaac atcaggagca tatagatagc  66180
tcttaaagca ttcatcacac tctcctgtgg tcattccttt tttattctct ctcatactaa  66240
gcagtaaagt ccctgagtcc attttattcc ttttattcat ctccattcct agcatgctgt  66300
gtggcataga gtaggcttgt caaaaataat tattatgaat taataaacag acattcaaat  66360
acaattaagt gcccccctac gaatacagga aaatttttct gaaaagaggc taagtcatca  66420
taagcatagt catattcatt aatgacagtg attacagaag gccaacacta agtgcagtgc  66480
cagaagccat gatggtagtt ccatatctgt agagaaagac gatattgtga ataacgaaga  66540
gaggaatctt aacatgaagt cttaagctat tgcctttgtc gttggtgagt cttgtggtga  66600
gaggagaact atgcacagtg aagcatatgt tgaattatgg ggcacatgct tttgcttaag  66660
tatatccctt ttcttttata tgaaagcgtt atgaggtcct tctgggaatt gttttttaaa  66720
cagctggaaa gtttctcatt tttcagatga ggaaactgaa gctcaaatgt ttcaagtgaa  66780
tctcccaagg taattaagtt ggttaatcac cgaactgaga tgatcatctt tgtgttgtga  66840
tatacagctc agtgctctgc accgctagga gtggtgaata acttaaaacc acaggactct  66900
gaggtcctga ggtattgttt gtggccatta tcaacaattt tagtaacaag ttcagaacac  66960
attttcttag atctcaaact cctacaaaat gttatttgta aatagaatgt tttgttaaga  67020
attaaaaaca aacaagcaaa catatgctag gaggataatt gaaggctttt aaaaaaacaa  67080
ttagctgctc ccagggattc tagtactcat tttgatacat ggaagctact aaagccagaa  67140
atttaaaaca ttgaaaatca gtgccaattt gtggattatt acacttaaaa gtgcataaaa  67200
caacaggatc cacttattaa agagtttctg tagtttacaa ataaataatt caccatagat  67260
ttaaataatg gtagaaagac acattcattc attcattcat ttattcagaa aataattatt  67320
aaacatctac tatatattag gtttctccag agagaatata gaatagaata tattatatat  67380
atgtatgtgt atatacatat atgtatgttg gcttagctca aaagatatgt ctatagatac  67440
agatacagat ataaagagat ttactttaag gaattggctc atgtaatttt gtaggctgtt  67500
aagaccaaaa tcttcagggc agcctggaaa tttcagcaga agctgatgtg gcaggccaaa  67560
ggctctgcca aagatgtggt aggccagtga cctctccctg cagagaagtc aaaatctttc  67620
ctattaataa gatgagtccc actcacatta tggagggtaa catgctttac tcaaagtcta  67680
tcaatttaag tgttaatcac aactgtaaaa taccttcaca gcaacatcta gactggtgtt  67740
caaccaaaca gccaggcacc atactttagt caagttgata cataaattta actatcatag  67800
acgctgtgtc agggacttca tggaattgga aattacacta aggaacagtt gagtttggaa  67860
gacatccaat gaacagatga ccacacaaac atgaattgcc tttgtctcaa gtgccagaaa  67920
caaaaagtga gggtaccttg agaagttata gcagggaaac ctggcccagt ggaaggcact  67980
tggagtggct cccccgagaa aatgatagtt aagctggggc ctgaaggcta caaaaatggg  68040
gttaaccaaa gaaaacagga gagacttcca agtggaggag aagaccctgc attaggcagg  68100
agctgggaga aggccaacgt ggtcagacac tgggatactt gggggaaagg gggtacaaag  68160
gggtgtttga agtgtgggag gagccagatc cttcagtatc ttgcagacca tgttacaggt  68220
ttgccactgt taaggtagga cagtgattat gaagggtctc tccatatgct ttgtgccaaa  68280
tgtatcagaa aggctaagag tgggaggcag ggtggccagt gaggaggcca gataagagtg  68340
tgtgtagaga gggagatgga gagaatggaa ttagctcaaa agatattttg agaatatgtt  68400
ggagaacgtg acgattactt atgagggttg agggagaagt aggtatcaag catgattcta  68460
agacttcaag tttgctccac ggtttggaag ctggtcctgt ttgttatgac agggaactct  68520
ggtttaggat ttcaaattga ataagggacc tattgagctg gaggtacttg tggtgtagcc  68580
aagtggagaa atctaataag cagttggaca tgtagctcta agactctaca acgatgtaaa  68640
ggatgacaga gaattgagaa atcatgaaag tggatgagat tgcctgggag agttatcatg  68700
aaaagagaaa ggtcaaagac agagctcaga gcagctcatg actaaaggtc agctcacgac  68760
tagaggagat ggaaaagcag aatggcctna agaaatatgg acnaaaccag caccttcaaa  68820
gccagcagag ttgcatctgt gtcttcctcc catactcaca tctctctcca naccacagcc  68880
atgatcactg ttagtgattc atggagttag gttgggtcca cctggataat tcaggatcat  68940
ctcccaaatt taatgtcttt agccttaatc acacctataa ctttagttcc cttttgctat  69000
gcaacattat ctactcacag gttccatatg ttagaatggg gacatcttta ggggaccagt  69060
tttttctcta ccacaaaaac aacaattcag agcactgctg agaggtcaca gaagataaaa  69120
ctaaaatttt tctgattggg tatatcatat ggaagtgaac aaaagtaatt tcattgtctt  69180
ggagtcacag aaatgggcta aaaagttaaa agagggagat tacaagtaga tactttattc  69240
aagaaatmtg tgagtaagaa atgctggtct tgaaacccgt ttaaacatga gtggatattt  69300
attaccactg aaagaatcat tgtctatgtc caggattttc ctggtggggc aagaattcca  69360
tccaccccac ccccaactcc agagagtcac ttgttctcta tccaaagtac ctgagggaaa  69420
atgactacgg aaataattaa ggttaatgaa taaaaataaa ctctggaaga ttcttgttaa  69480
ctgaaaaaaa tgaaacaaag attaacaaat atatattctg aaactcttga cattcatttc  69540
aatttttaaa aacagtaatt accttgtggt tttagataca tgtgttccag ggcaattaat  69600
cttctaataa atgtgtttct aataaacatt tgctaataac ttgatgttgg taaaaatgtt  69660
tcaagcctgc tgcctctgaa gccaaagact tcaaaataat atctagtgag agttgtgctt  69720
aaaatgagta tcagcactaa tatgaaagaa aaagcaaata taataggaag aaaaaaggaa  69780
aaaatactct aatatttata aattaattta aaaaatcata atcattaaca gttgagtgat  69840
taacttattt ttggcaccat tctgagtgtt gcacattatc taatttaatc attaaaatgc  69900
ccctacaaag aatgcaataa ctatcctcat tttggnaagt gggataactg aggctataca  69960
cacagggctg gagtttcaat ctaggaaatc tacaactttc aaactgtcaa taacagtagg  70020
taacatctag cattgattgt ctatcaagta cctgttttat acaatttaca gatgtaaata  70080
cttacgtctc accccaggct tatgaggtag acgttttcac accattatgg attggaaaac  70140
taaagcatgc ttaagtcaca catgtaataa gtaggtcaga actcacagcc aagaagattg  70200
gctccaaagt ccaatttctt ctccaaatat ctgaaatatg atttttttgg aaactttttc  70260
atgtagacag agtgttatct tagacatttc tgctattgta tttttaaaag tatttggaat  70320
taaaaatata tgtaattttg atgggctagt agacccttcc ctctctgaac ttcaccttgc  70380
cttcaagagt aaatgaagaa ctaggtgatc catatagtat ctcttagctg catagttcta  70440
tgaacatgct aaagtttctt ctcctctttt aacaagtctt tattgttctg tttttacatg  70500
ctgggattta tgctacattg tattattgta atgattaata atcatttaga tcaagcatta  70560
tttgagtaca gtacttgcaa cacattaggt gctatgcaaa gtgcattact tggtttactt  70620
tacttaaccc tcacatgagc tttgctttta attatgatta ctctctgtac cttacagatg  70680
aggaagctga gcttagaggc ccttagagcc ttatttaagt cacacaacca gtaaatggca  70740
gagctgggat caaacccaga aagcctcact ctgaaactca gaagcccagt ctccttacca  70800
tcttactgtt atattgtagg taccaaatca ttgatgacaa gcatcgttga tgaggttaat  70860
agtatttgta ccacacattc tgaaacagag tcagatcaga ctgaagcaaa gatgaatcat  70920
ttggcctaca tgtaagaatg agaaatgggg agatatacac gatgtgtctg tctaaaataa  70980
tatctttctg acccacccaa ttgtggtaat ttccacaatt agagcctttc ccttgggttt  71040
tacagatggg gtccaaagga ccagcttaaa atatgactag agggagcaat gatttaacca  71100
cttatttcct gagaccagca gacagatgag ctcatctgct gctgacaaag ggcagaaccc  71160
taaaggaata gcttagggtg tttgaatcat gggtgaagtt tctggagctt tgtttatggc  71220
tgagaagtgg gcaaagtatc accagccatg gggtgtgtgt gtgtgtgtgt gtgtgtgtgt  71280
gtgtgtaaaa ctatgtacgt gtgtgtatgc gtggtggcag caaatagcta agggattgca  71340
caattaggtg tcagacttta gagaaagcat attataaaag ggatggaagc agcaactgaa  71400
cataagaagg tattaaagaa aaagagtcat ctggtaagtc tacctcaatt tggtcagaaa  71460
ctcacgtgac tgaggctgtc ttagggttgt tctccattta agaaattcct agaaacattg  71520
atgtagtggg aaattagtgt aacacaatta tggatttaga aggcttctga aatcatcaag  71580
cccagacttt ggcgtctgct caatctgtgt gggatacctc agatagcagc tatttggggt  71640
ccatttttaa ggtcaaccca gaatgagagt ctacagtcag cagtcctatg ttatctatac  71700
ttgctgtcag gaaagccatt acatatctaa atcctttata tcaagttgat atccaaccta  71760
ttcttaagaa ggataaaaat gggttatgtc attatccacc taaaggattc ttatattcct  71820
agagctatca ctaaatcacc tcataatctc tctttcctat gggatacctt gagttccttc  71880
catttctcct tatttgtctg gttatttcta aactagacac cttccaacac tcagaaggac  71940
aagtatcatt gatgagtttc gtagtattcg tactgcaaag aaaatgattt tcatcatgca  72000
acattgctta gaagtgggga agtaaaatgt gtgcccacag tgagacaaga attttgtgaa  72060
tcacaatgac tcctcagaca agttaacgtt ctttgcaaat ctgtagaaaa attccttcct  72120
ttgcttatct gggtctcagt ctgtaatggc aaaaaccgta atggtgatag tattcttata  72180
aagagctatt gtggggatga atcagatatc atttgagaat gtttaatatg taattaatgt  72240
tatgaatatc atttatggat tatgaatctt aaaactatat tcagatacac atacacaatt  72300
ttgcaaataa catcatatat atatatatat atatatatag agagagagag agagagagag  72360
agagagagag agagagagag agagagaaag tctctcaagg tctcatatat atattaccaa  72420
ttaccacagt tgggtgggcc agaaagatat gattttagac agacacgtca cgtatatctc  72480
ctcatttctc attcttatat gtaagccaaa tgatccatct tcgcttcagt cttaactgac  72540
tctatatttc aaagtgtgtg gtacaaatat tattaacctc atcaacaatg cttgtcatca  72600
gtgatttggt atctacaaca taagagcaag aaggtctctc aaggtctctc tttctctctc  72660
tctccctctc taaatatata tatatatata tatatatatt ctctttgctg tactcttaga  72720
tagatagata gatagataga tagatagata gatagaaaga gcaaaggtct ctcaaggtct  72780
tgctctgttg cccaggctag aatgcagtgg catgatcata gttcactgca acctcgaacc  72840
cctgggctca agggattctc ctgcctatgc ctcccaaagt gcaacgatta caggcatgag  72900
caacctcact tggccagata catagatatt aatgaagggt aattacatta ttcattgtaa  72960
tcaacattta tgattgttga aattgtctaa cactttcatg tgttgttcac aggaatgtaa  73020
cctggaatag tttagctatt ccagacacac actgctcacc agagctagaa gaaggctacc  73080
agtgcccacc tggatttaaa tgcatggacc ttgaagatct gggacttagc aggcaagagc  73140
tgggctacag tggctttaat gagataggtc tgtcttactg gtaaaatacg ttttaagttt  73200
ctattttgtg atgtttatga agtggacaga ataattaaat aattgatact aatattttga  73260
ctggctgtag tatagaagaa atacaaatat aaattttaat tctatgccta ttttataata  73320
tattctaccc gacagtgcgt agcatacaag ctgtgtatgt atatgggcag cagtgtttgt  73380
atggagttac agatctctca tttttgacta tttcgattct caataacrgc atttaagcat  73440
ttaaaaatat ttgtttgttg aacagggttc tgggttgttg actcaaagat aaacaaaatt  73500
tggtttcctt tcatatgtaa ctatgtaact ataccctaat aggcaaggta agtcttaaaa  73560
actgtaatac taggtattga tgagtgcatt agagctgaaa agtgctcctt gattagaata  73620
caattaatga actacttagt gaatatgcat caactaagta ataaatgtat gggaaatgct  73680
tgtgcatgag aactatgtgc tcaaatgtgt acattcttct tggcttgcct tattaagtcc  73740
taaaatgtgc cattacatac ataatgaaag aatttagcat ctgccattta gttgatatca  73800
ttgtattttt ataattccat gcaagttgcg catattatat tattaaagca aaaaatgtat  73860
aattccaaac aagtatttta tgccttgaga attgttatca gagtaatttt ttaaactaaa  73920
atttcttcaa gtgtcaggcc tgcgtgctaa accataaagt tacagctttt atatagaata  73980
tagtactgaa cgtgggctga tggtatcttt ttaaagtcag ttttgcaaat aacatctcag  74040
gttttcatct ttatgtttta gtatttcctc atattttatt tcaagcatta tagttagatg  74100
gcattcttcc atctcttttg accagtaata ttgtctccta tttcacaaaa atccagaagc  74160
caactgatgt gaagcaattt caattttcta tactctctta aacttatcca actttgtaat  74220
tagtcttaaa tccttccctc tgtctcaaaa gtacagaggc atcatgaatt ataccaataa  74280
cttttaggca tgaggaagaa atcacagatg tggtatggga ggcgagatgt atataggctg  74340
ataggctgtg cggaataagc ttcaggagtt ccaacagctg ggcatgacta gaatgcatgc  74400
cttatcagag tctgcagctc tttcttttag ggtctgagtg tatccatgtc ttctatggag  74460
agtggtcacc attccagggt taaggttgcc cttacagaaa ataacctcca attttttaaa  74520
atcatgtagc taaagcacct cataccctca ccgtttttaa tgcaacaatt gtacccaaat  74580
tcaaaatgca gcattatatt caagttgatt catctttctt cactctgact tacaatggct  74640
ttgcttaata tagggtagaa tctctttttg agagaaaaag tctccttgta ctgtgctgac  74700
ttgagaggac cagttctagg aggaaattgc cttggaggca gtcgccccct actaaagcaa  74760
ttatcttact atagctgtac tgttaattta tctcccaagg atttaagctc cttgaaaaca  74820
ggaagtgcat cttttcgtct tcaagtctcc agggcacagg gctatgcctg gctcacaggg  74880
agccctccat aaatatttac taataggctc aacaaagcgt atgtcttttt aattcattgg  74940
taaccaggca tgtttgtatg aggaggcaga gccacaatag agaatttagt tgttttcttg  75000
ttgttctttt gcctgatttt gtctgttttt gttggcaata ttcattattc ctcatgactc  75060
cttcctttct atacaggctt aatttcatcc gtttgcttat ttttcccaaa ttcatcatca  75120
ctgtatgact aattgttaga taatgaaatg ttgatcttgt accataacca aaacattttt  75180
aaatggtcgt tataatttag atcgaaattg atagctgctt cctgatatta tgtatctctg  75240
tagatacaca aactactata tttaaaagtt cttatggaaa caaaagacaa ttttttgccc  75300
aaaatgagga aaataaaata ttttattaga cacatgtgat catctcttca tgcatgcatt  75360
tgaatttaaa acataattag gtgcctaatt atgcatatga atttggctaa tatacttgaa  75420
tatgtaagta attatggtta gttaaaaagg agcccatttc cttttcttac taatcaaatt  75480
accattcaaa acatgaattt caattcactt ataaaatttc tggcagaagt agctttatgt  75540
ctcattaaga tttaacactg atgatgttga aaaattcaaa ttttaaaata tattaaaagc  75600
cagagtcatg gagtagaaaa aattacaagg aacccctgtt gtaagattga agagtaaaga  75660
catctttgcc tctttgtgtc cccaaaatca tccaaatatc aagaagattg agaaacagaa  75720
atgaaatttt catgtttaag aactctgaaa agctgtaact ataaaccaca tcacaggact  75780
gggcatctaa cagaaaactt cctgagaaga ttctgcctac tgtggatctc agacagcacc  75840
agcaggatag caatattcta agataatgca tgttcctgga ggaacacaac tgtctcatat  75900
ttgagtcagg gaatcagagc aaaggctgat tgtggaggct tactaggacc ccatgcagca  75960
tcacaaggca gaggccctca tttctgcagg cagttggtgg ggagatagag tggaggggac  76020
acaactgctt tgttgctgct gatctgggtt ggctagaatg ggataaaagc taaacggaag  76080
gttttcatgg ccactataac ttaggatgac ctggggaacc ttttaaaaca aacagattct  76140
caagcaccat cctcatgtca attaaatcac aaccttagag tgatccaagg aatagatggc  76200
ttttaaaggc tctccaggtg attaatttat gtgcatgcag agttatgaac cattggacta  76260
aagaaataca cacatagaca cacacacacc tgtattataa aaaccttcaa ttccatcttg  76320
atccattttg gttgttgtaa caaaatgtca cagaatcagt gtctcataac caagagaaat  76380
ttatttctca cagttctaga gtctgggaag tccaagagca agacagcagc agatttcatg  76440
cctggtgaag gctcacttcc tggttcatag aatggcacct tttcactgtg tcctcacgta  76500
gtagaagcag taagggttct ctcttgaacc tccttcataa ggttactaat accattaatg  76560
tgggctccac cttcatgatc taatcacacc caaaggtcct accttctggt agcatcaccc  76620
ccatgggggt tagaaattca acaaatgaat ttgggggaaa catcagcatt ctgtccattg  76680
cactatccta gaacattacc ctgttcctcc ccaaagtgaa acagtgacag acatctggtc  76740
taacaaaaat ttatttcaaa gatgagtcat aattgaaaga atgaggacca catctataaa  76800
aatgtacttt gaggtacttt taaaactgaa aaaaaatcat gatatataac tcataaaagc  76860
ttagtaggaa acagagcact gaattacaga ttcgaaggat gcagcttttc tcagtaagtg  76920
aacatagaac agtcaacact gagacacatc ttagtaaaat tgttggaaat caaagctaaa  76980
gaaaacattc attaggcatc cagaaaaaat aaggtcaagt tagctataag gaggtacatc  77040
agagaggcct gaaacttcat gtcaatatgg aactctagaa tgtaatggca caatgcttac  77100
aaattcttta gggaaagaat gggtcaagct ctttctgaat atttttgaag aggcaggaac  77160
atagagacta tattttgcat gaaatcttcn ttgaaaacat tcagttaatc aagaatttct  77220
tatcatgagc tagtctctag tatctatttg ttttaagaac aaagctaata taactgtagg  77280
atttacaaaa tacaatgtaa atattataaa ttatgaatat ctagaagaga taagatgaaa  77340
accgggggag atagtgtgat tatgttgata ttcttaacat tcacatttta gcagttaaaa  77400
aagtaacatt tatacaatat atgaaatgta taatagagat atgtgcatac ttgtcatgag  77460
atgagaatgc atgataaact cagnaaatta ctttctttag aaataactca aaaatccaaa  77520
taatattatc tatgaccacg tcccaaaaaa tcatttcaat atgagtaata atattggaat  77580
caattctttc taaatcttga taatagttct caaaagaaaa gtaacaaaca gtatattttt  77640
taacctctga atagagttat gctatttgct gtagcatgtt taaaattatt aggggcacat  77700
gactcctttg tggtaaagtt tgcttgaagc acagttgttc aaaagaatgg ccctggggtt  77760
tagatcatga ctccacttta tattagtgtg acagccttag gaaagtaatt aactctcttg  77820
cctcaatttc cccatctagg aaatggggta agtgatagac ctaccttata cagttaatgt  77880
aaagagcaac tgagaaacta cacttagagt acgtgtagcg tagaacaaac gcagaatgaa  77940
ctagaaattg ggatgcacgg gcaaaatatg aatgtatctc tgtgttattt gagggaaaat  78000
ggtgtaataa taagggaggg caggacatag atattttcac actcacacac tgcatctgat  78060
atgattccct ttgtttacag acattaacta tgcaggtttt ccagtatctt attcaaggga  78120
gaggcattgg ggcaggggca cggtgttttt tgtttgtttg tttgtttgtt tgagatggag  78180
tctcggtctg tcgcccaagc tggagtgcag tggcacaatt ttggctcact gcaaactttg  78240
cctcctgggt tcaagcagtt ctcctgcctc tgcctcccag ttagctggga ctacaggcgc  78300
ccatcaccat gcctggctaa tttttttgta tttttagtag agacggagtt tcaccgtgtt  78360
agccaggagg gtctcgatct cctgacctcg tgatccaccc gcctcggcct ccaaaagtgc  78420
tgggattaca ggcgtgagcc actgcacccg ccggggcacg gtgttcttaa ccttgcatct  78480
tgcctatgtt aactcatatc tcccatttca ttttattcca atcaatgact agcattctag  78540
aaggcaagtt tttggtgatg tttggtcttt attcatcaat tattcccctc ccctctcaca  78600
aatgtcctga cttctgtgct tgtaccaatc tctctagaat ctgatcaaca tttagcccgt  78660
gtcattgaat tttctagttt gatgaagcat catgcatatg tttaatttta tttatttatc  78720
catatacatt cgaatctgtg acccctggat tggagcctct ccctttcagc gcctttcaan  78780
caggtgctcc ttccacagag cctaagtaaa gcaccagctg gggcattgag cagaaggcac  78840
agccatgctg tgatgtgcag gggctccagc actaagtgat ttattttccg nacctcctct  78900
aattccctga gccacgtgac aactgagata ctagttattt ctgtctcttt cttccattta  78960
tgcacctttc catctttatt tctggatagc tttcctgtgg ctccttccta aggaccccca  79020
actgactcat ccctgctaag acattagccc gtgcactcaa gatatcacac actccccatg  79080
ttgcaagctt cctgagtagt agacataatc taaaggacat cttgcaaaat cgcaaaattt  79140
atttagcaga cattgagatt ccgtgattgc agtatgggtg gcaaggtggg taggaatcat  79200
acagtggtaa ggtttgggga ttgacaacat cctaaaagcc acactgtcga agtgacacaa  79260
aatcacagca acttacccta tttagaaaat gtgtcttccc ttttctgaat acttacccca  79320
ctttcagttc ctacttccgc tgnttcccac ttgctcataa acatatgaga cataaaagct  79380
gagacataaa agaggcgaca ctgtgatttt ctgtaataac actggaaatg aaattacaga  79440
agtttagagc tggaacagat aatgcagtca tacattttac ccacacaggt ggggatctga  79500
gagtcagagt gagtgggatt agaattacag agaactccgg gcagaggcag gctgaactca  79560
cttctccaga tttgcagatg tccaccatac ttgctgtttc caccaaaccg tcttacaact  79620
caaaatagtg tttaagaaga aaattcaaaa acaatttgca aagcttagtt ttattcctaa  79680
ttttctagtg gaatgttagc attatttccc tttagtgaaa tgctgatggg gaagaccgtt  79740
atccaaacag aggtgatgtg ccagttagaa agaaagcaac acaaaatata ccatatatgc  79800
gaaataaatc acagcaaaaa aacaccatcg aactggtgat tccttgtcat gaccttttaa  79860
aagaaagtaa aacatttggt acaagagatg agaacaaaac tattcaggtg gttatttgaa  79920
cccttcattc attgtacagt caggtaaaaa ataaaaaatg ttcagtttgg actaaacaac  79980
ttaatgaatg tcattggatg ataaaactca tcctgaaaag tcacttagga agtaaatcgc  80040
tatcatgcat tttttattag tctttagaat catcagaata aatgacaaaa gcccattttc  80100
aaaaaaatcc agaataaatg aaattcaact gaaacagctt atagcagagg aagcccacaa  80160
gcaagataaa ctatgaatca agacattctg aaaataacta atagaaaaga catacaacat  80220
atgcccttaa cactacacga gctgtatatr gtggatcact ttgcctgttc tatatattca  80280
aaagtcgaag gtaaagccag gaaataataa acactgtatt cttatggtga ctaattgtcc  80340
atcagacagt cgttactttt gtaattactg tcattactta ggacaactgt tggntatcat  80400
ttatcgattg catattatgt gcctggcacc agtgaaaagg ttttgcatcc attgtgtttt  80460
taatcctcaa aatcagccca tggggtatca ttatccctca gctgatgagt ggggagaatg  80520
agataagcaa gaatgaactc tcccagagcc tcttaccagc cgcatttgga agccatgtct  80580
tgctgccccg tgtgctgagg ctgaagcctg tgctcttgat ctacaaacta ctacgttacc  80640
agagtagcca gccatgagta accttcattc ctgtggcttg tcaggacacc tggtccatta  80700
taaagtctca ttatgatgat ggaagaaaca catcttccaa aagagtgacc tgccatagtg  80760
gcatatcctg caacatggtg acctccctct tgtcctgaag tctttagaca agtcttagaa  80820
aaaagaataa atgtgggctg ggcgtggtgg ctcaagcctg taatccaagc actttgggag  80880
gctgaggcag gcagatcacc tgaggtcagg aattcaagac cagcctgggc aacatagtga  80940
aatcctgtct ctacagaaat acaaaaatta gctgggcatg atggcgggtg ccagtaatcc  81000
cagctactcg ggaggctgag gcaggagaat cgcttgaatc tgggaggcag aggttacagt  81060
aagccgagat tgagccactg aactccagcc tgggcaacag agcaagactc tgtctcaaaa  81120
aataaataaa taaataaata aataaataaa taaataaata aataataaag agtaaatgtg  81180
aaggaatgtg acgtccactg caaactgatg gccccttaag gggttggtct ctggctttaa  81240
gtctagtccc ttgtattctg tattctgtga gacagagagt tggtgcataa tatatgttag  81300
ttgaatgaaa gaatataaat attaaacaat gtacctggga ggcaatgcag ttttataagc  81360
tactgagctg taaacatctg ggcaaggatt agagataatg ccagaaaaaa ttagtaaata  81420
ctacttttga tgtaaaatta ggtggtagac acatcatggc tagagatgtg ggagagaact  81480
tagcaagcaa aagaaaatat gctatttggt atattttagt aagttttgtg tgtatttgaa  81540
ctaaattcaa aatgccgtga taaggcatgt gtttgctata tgtaatgtat agctacatgc  81600
attaatttct gttgtgtatt tgaatttact ttctttgaga tatgaatatt taaatttgct  81660
ttctaaatta tcacaaatta accaacaaat ttatacaagg tgattttgga aatccacatt  81720
aattaatttc tttattagaa tgtgacataa acagtattta ccttattagt ttntctttac  81780
gaaaaaatta taaangcttt tctatatata tcctccttaa aatattagat aagaaaacta  81840
caagtcgtca gctccacagg agttaacatg tggattttgg atgctaagaa caaatttaag  81900
atgatgactt gtaatcttca tgaattgctt ttggcaacaa taaattaatt gggcctttca  81960
agaaaatgca gaaaactaag gtaaagggtg attgagtctt ccagatttcc tatattccca  82020
actcacttct gaagaacgta attatgagta ttgaaatttg ggactggtat tttttacaag  82080
aagaaatata ctgtagctgt tatttacttt tgtggtattt ttcttctttg aatttgggta  82140
gtattgacta taagctatgg actcagctcc ctgtgtgggt cataaatcag ttttattaaa  82200
tattgattta gaaatatcag ttattatttt cntcactggt ggagttctgt gcttcggact  82260
acccctgtat cttgctgaaa taggattgac aat                               82293
<210>2
<211>237961
<212>DNA
<213>智人(Homo sapiens)
<220>
<221>exon
<222>43726..43868
<223>外显子8
<220>
<221>exon
<222>43998..44102
<223>外显子9
<220>
<221>exon
<222>52093..52179
<223>外显子10
<220>
<221>exon
<222>77568..77699
<223>外显子11
<220>
<221>exon
<222>98226..98393
<223>外显子12
<220>
<221>exon
<222>106567..106758
<223>外显子13
<220>
<221>exon
<222>144109..144246
<223>外显子14
<220>
<221>exon
<222>159794..1 59868
<223>外显子15
<220>
<221>exon
<222>191292..191428
<223>外显子16
<220>
<221>exon
<222>192967..193108
<223>外显子17
<220>
<221>exon
<222>211540..211613
<223>外显子18
<220>
<221>exon
<222>225006..225107
<223>外显子19
<220>
<221>exon
<222>225544..225613
<223>外显子20
<220>
<221>exon
<222>228450..228541
<223>外显子21
<220>
<221>exon
<222>228630..228752
<223>外显子22
<220>
<221>exon
<222>231289..231345
<223>外显子23
<220>
<221>exon
<222>231589..231709
<223>外显子24
<220>
<221>exon
<222>231813..231944
<223>外显子25
<220>
<221>exon
<222>232900..233067
<223>外显子26
<220>
<221>exon
<222>235355..235459
<223>外显子27
<220>
<221>allele
<222>51090
<223>99-79335-60:多态性碱基C或T
<220>
<221>allele
<222>61293
<223>99-79336-369:多态性碱基A或G
<220>
<221>allele
<222>80602
<223>99-79338-332:多态性碱基C或T
<220>
<221>allele
<222>100485
<223>99-79314-201:多态性碱基G或T
<220>
<221>allele
<222>100509
<223>99-79314-225:多态性碱基A或G
<220>
<221>allele
<222>106725
<223>99-79316-158:多态性碱基C或T
<220>
<221>allele
<222>166087
<223>99-79322-224:多态性碱基G或T
<220>
<221>allele
<222>166336
<223>99-79322-473:多态性碱基A或G
<220>
<221>allele
<222>235894
<223>99-79306-182:多态性碱基C或T
<220>
<221>primer_bind
<222>51031..51051
<223>99-79335.pu
<220>
<221>primer_bind
<222>51539..51559
<223>99-79335.rp补体
<220>
<221>primer_bind
<222>60925..60945
<223>99-79336.pu
<220>
<221>primer_bind
<222>61354..61374
<223>99-79336.rp补体
<220>
<221>primer_bind
<222>80271..80290
<223>99-79338.pu
<220>
<221>primer_bind
<222>80700..80720
<223>99-79338.rp补体
<220>
<221>primer_bind
<222>91037..91056
<223>99-79339.pu
<220>
<221>primer_bind
<222>91466..91486
<223>99-79339.rp补体
<220>
<221>primer_bind
<222>100285..100305
<223>99-79314.pu
<220>
<221>primer_bind
<222>100764..100784
<223>99-79314.rp补体
<220>
<221>primer_bind
<222>106568..106585
<223>99-79316.pu
<220>
<221>primer_bind
<222>107000..107020
<223>99-79316.rp补体
<220>
<221>primer_bind
<222>165864..165884
<223>99-79322.pu
<220>
<221>primer_bind
<222>166381..166401
<223>99-79322.rp补体
<220>
<221>primer_bind
<222>235713..235732
<223>99-79306.pu
<220>
<221>primer_bind
<222>236190..236210
<223>99-79306.rp补体
<220>
<221>primer_bind
<222>51071..51089
<223>99-79335-60.mis
<220>
<221>primer_bind
<222>51091..51109
<223>99-79335-60.mis补体
<220>
<221>primer_bind
<222>61274..61292
<223>99-79336-369.mis
<220>
<221>primer_bind
<222>61294..61312
<223>99-79336-369.mis补体
<220>
<221>primer_bind
<222>80583..80601
<223>99-79338-332.mis
<220>
<221>primer_bind
<222>80603..80621
<223>99-79338-332.mis补体
<220>
<221>primer_bind
<222>100466..100484
<223>99-79314-201.mis
<220>
<221>primer_bind
<222>100486..100504
<223>99-79314-201.mis补体
<220>
<221>primer_bind
<222>100490..100508
<223>99-79314-225.mis
<220>
<221>primer_bind
<222>100510..100528
<223>99-79314-225.mis补体
<220>
<221>primer_bind
<222>106706..106724
<223>99-79316-158.mis
<220>
<221>primer_bind
<222>106726..106744
<223>99-79316-158.mis补体
<220>
<221>primer_bind
<222>166068..166086
<223>99-79322-224.mis
<220>
<221>primer_bind
<222>166088..166106
<223>99-79322-224.mis补体
<220>
<221>primer_bind
<222>166317..166335
<223>99-79322-473.mis
<220>
<221>primer_bind
<222>166337..166355
<223>99-79322-473.mis补体
<220>
<221>primer_bind
<222>235875..235893
<223>99-79306-182.mis
<220>
<221>primer_bind
<222>235895..235913
<223>99-79306-182.mis补体
<220>
<221>misc_binding
<222>51078..51102
<223>99-79335-60.探针
<220>
<221>misc_binding
<222>61281..61305
<223>99-79336-369.探针
<220>
<221>misc_binding
<222>80590..80614
<223>99-79338-332.探针
<220>
<221>misc_binding
<222>100473..100497
<223>99-79314-201.探针
<220>
<221>misc_binding
<222>100497..100521
<223>99-79314-225.探针
<220>
<221>misc_binding
<222>106713..106737
<223>99-79316-158.探针
<220>
<221>misc_binding
<222>166075..166099
<223>99-79322-224.探针
<220>
<221>misc_binding
<222>166324..166348
<223>99-79322-473.探针
<220>
<221>misc_binding
<222>235882..235906
<223>99-79306-182.探针
<220>
<221>misc_feature
<222>6485,14246,14248,14250,14252..14254,14256..14262,14969..14980
     17712,18786,19477,19496,21043..21064,21547,24607,24946,24974
     25072,25124,25136,25142,28843,31239,31372,37750..37751,40488
     46542..46557,49309,49326,49357,49395..49398,49400..49402
     49408..49409,56275..56280,61048,61050,61059,61856..61857
     61860..61861,64842,66307,66326..66327,69835..69840,70893,70905
     73279,76154,76354..76355,76371..76372,76407..76408,77095
     78933..78934,79363,89491..89492,95836,95838..95839,95841..95842
     95958,96966,97049,97067,97078,97292,98642,98712..98713,98716
     98740..98741,101368,101373..101374,101376,101378,101401..101403
     101406,110014,129061,129066,129973..129974,135336,135345,135359
     139924,147368..147369,147469,147507..147510,147767,151694,151729
     163111,164480,169764,173340,173390..173391,173398..173401,173407
     173414,173419,173426,174800,174894,175041,175486,176256,177240
     178864,181149,181154,181230,181287,183433,186606,186648,191065
     191267,193117,193203,193223,193380,194051,194053,194057,196577
     198388,198655,198828,198849,198862,199667,199693,199701,199704
     199747..199748,201117,201224,201226,201314,201410,202524,203887
     204396,204939,205891,205930,205998,206908,207363..207364,210938
     212018,214253..214254,217022,217333,219027,219909..219912,220924
     222620,222882,223870,224902..224903,224911,224914,226899,226915
     227232..227233,227415,228441,228446,229373,229471,233305,233405
     233512,233601,233629,236096,237468,237471..237472,237478..237482
     237486,237488..237490,237492,237495..237496,237498..237499
     237504..237507,237509
<223>n=a,g,c或t
<400>2
gatgttaaat aaggcgataa aatatgagga agaaaaatac ttttattcaa attataatgg     60
gatgtaaatt gaattttgtt gatgctgctg ctaaaaattg attcatcaga gttaaatgat    120
attaaagcat atttcatgct accatatgtg atatcagatg agaactttac aaataaatag    180
aaaacagaaa gttatatatc tacaaccatg atttattaca gaacgtatat ttttactgca    240
gtcataaaag aaaaagccca gtaaagacta atttgtaaaa tatgtaattg agatttataa    300
tgctttcaaa aaaaaaaaag caccaagggg tttttctgat gcatttatct tgatgtttac    360
tgttgccata ggaattactt attgattttt atgaaaacac atatggaaga gagaactaag    420
gcaatagaat tcaactaaaa gggcttcatc tatgataatt ctgtttgctc tgataaaaat    480
tcctttatca tggaacaagg aaaacctgac atatttttgt tgagtcgagg acaagatcaa    540
gaaacatcct atgaggaata tttgtgaaaa ctcttagcca aatgcaagga gttttatcct    600
tgtatcttga atcataagtg cccctaggtt acatgaaatg tgtgcttgag gatttttaaa    660
gggactgtct ttaggtttct caggttctca aatagggcca cagacttact taaactgaaa    720
ttaggtgtcc agatattctt cagaatgtta ggaagaaagg agtttaaagg cagaaattgc    780
aggcatgact ttttaaaaat aaggttgtcc attgtctgct gaaagatgtt taggagttct    840
tgttgaatgg atgagaaaag atagtgacta gaggagtttt tcatcagaca gtgaaaggaa    900
attttaaaag taaattttgg agagcataaa gtgatgattt atttcatgtt atatgtagaa    960
gacagtgttc attggaaata tctagtggat tccaagaaat tagcattttt atggttgtat   1020
tttaaacatt tataagttaa aaaagtaata cttcaaataa tgtaagagat ttaatgattt   1080
aagaaagtaa taaattctgc catatataat tccctccctc cttccctctc ttcctttctt   1140
ttctcatttc ttctcccctc tctgtaagtt tcatggtatg ttataacatg tttttcattc   1200
ttcccttact gatagacatt taagtggttt tcagtctttc cctgcaataa gtaatgctgt   1260
gttgaataca ggcatatata cattctgtgc tcatgtgtga ttatgcttta gaacagattc   1320
ctagaaacaa tttctgggtg aaatgatatg cacattttta atatgagata gctggcggtt   1380
tactttttta aaagataagg attcatagta ctgcctttat tgcgtgagtg aatttttata   1440
aatacaaggt attctttttc aatatgcata aatattgaag aaaaaaaata atgtaggcat   1500
ttcgtattcc gtactctgta ctcttctgaa cactggcagt ccattctctt cttgaatgta   1560
tgtattcatc ccattcttcc tggaatgcct ctctccattc tcttcttgaa tgtatgtgtt   1620
catcccattc ttcctggatt gcctctctcc taccgctccc cctaccccca tctcctgtga   1680
ctcacctgtc aggacctact caggtaagtt tcccctaatc tgccagcagc actcatctcc   1740
cttctgtctg aactgtgata gcaaggtttg tgcatcaaag tggacacttc gttacttcgt   1800
tctacatgtg tcccaccgtc tgggagtgtg tgtgtgtgtg tgcacacgtg cgtgcctgtg   1860
tgtgttttac ccttatgttc tggattcgtt cattagaccc agttgtctca ggtgggagca   1920
gagcctcagg cacttctttt gatgtctttt ctcgctctca ttgaactcgg tatatacttg   1980
aggactggct gatcacattt atgagaattt tatatttgat agattgcctt ttgaaaatca   2040
tcattctgca gaaatttagt aattgaaaat ttaaatcaaa ttcaaataca actctaggct   2100
ctaatttcac tgttcgtttg aatgtatgac ttctctgtta agccagatac tcacgtgaaa   2160
caaatgtgaa tagaatagca tggaaatcgt gtatggacag tcaaggaaac tttctctgct   2220
ggcgacagca gcctgcagaa cataattccc tggacactct atgaaatcaa atccgtttta   2280
tcaactaatc agttggagca aaaaataata atagtgttat ttaggaaagc cgtaacacag   2340
ctcttacctc aaggctaatg aagacctgac ccttgaactc taggggcttc catgttccag   2400
cttgtgagcc ctgctttgcc aaaaccctgc tgaagaggta agagcctcct tctctggaga   2460
gaaagccccc agcctttgac aaagtgcttc tagcctgagc catgtgggct atgaaaaaga   2520
agttggtcat cccgaggagt cactggacag tggagagagc ccatccattt ttctccttta   2580
ttcttcccta cccctcagct ctcactccct taggacttgg gattctggaa tcataaaagc   2640
aaaatattct aaatatacta aaacatgcta aataacttaa atatgctaaa taaaattaaa   2700
actaaaataa acgtattaga ataaatcatg aatggctaat aaatataagc tgccaccatt   2760
aaaacaaaaa taacaaccac taccacaatt gctactataa agattattat tgatcagctt   2820
tatttttagg taagtagaaa agtgagatgt atttctattt ttctgagaat gtaaccattc   2880
tgaaagaata ggagatactt tctcacagta agcagaagaa tgagatgtac tcataaataa   2940
tatattcaac aaacagttat tttgcactta ctctatatag gtactgaaaa tagaatgatg   3000
ttaataaata tgaacagccc tcaaacagag atattaaaat aaaacaagaa atgaaggtga   3060
aataaattta gaagaaacga tggatcatta acttgtagta gttcttacag ccatgtgctg   3120
gatgcaggca tccctgtctg agtgtgtgcg tgtgtacaga cattgtttcc aaactttttt   3180
actataactt tgttaaagtg aagcgtgagc actccacatt tgctgcaagt ctcacttccc   3240
ctatttcctt tatttctcac atttacgtaa cttgtctaac ctctgaaaca aatgttttta   3300
ttagttctgg taatgcaaaa taatctttag agaattacgt ttttattttt gcttttgtta   3360
aataagatct acagtagcat aagttaagtg tgccaccttc attttgtagc tggctaaata   3420
tttctgcttc ctgtgtactt ttctgaaaat ggctttaatt tgtcttattt ttgataatta   3480
gcttcaatta gtgcagaatt ctcctttggt attgattgga cataaaacct gagatatgtt   3540
cgttgtattc tggaatctat tactgccaat aacaagccta ccgtgagtcg aattttaagg   3600
ctttcctttt tttttttttt tttttttttt tggctttgtg aatttgggtt ttttttaaca   3660
tcgtttttct ctggtagttt ttaagattta ccctttgtct ttgctgtctt atggtcttag   3720
tatcctgtgc ctaggcatgg atttttattt tttatctact gtgaactcat tctctgcata   3780
tgagactcat gcctttcttc aattctggaa ggtttttagg tattatcttc tcaaaacagc   3840
tctcttctcc attctctcta ttctttgttt tctggaatac tgattaatat ttgtttttat   3900
catatttttt attctatcct ccatgtcttt aaatcgtgct ttctaacttc cctctatttt   3960
cttgacttct cttgttacca cacaatgggc gggttcagtt gcttggcagg tgggagtcca   4020
atgaccacaa ccaaggagga tttaaccaag ggatttcatt actggcaaca agtaagtaga   4080
acactgggga tagttcccaa agcagtgcct ccccagacac aggtggaaac agggctttgt   4140
gggggctgct tagctgagtc actgtgtgca gaggtggagt gcaggcaggc acagctgttg   4200
ttcatgcttc ttcatatgtt gcccatacag aaaatggcac ataagctctt ccctgggcag   4260
ggcatttagt atggtaaggt gaagaggtct ccaaagttca tctccagctc aggcatcccc   4320
ggatgcctgg gaccagtttt ttgtgtttgt tctttgtttt gcaggggctc ggcttcttcc   4380
tagaacactt ttaaacaacg gaaactcaag gtgcaacagt taaaagtgga tagttcttca   4440
cagtgtgtac ccaaaaaccc agggaccctg ggttacactc ttgatccttg attagttgca   4500
caaggaatct tctatcattc tccgtccctc caagagttgt ttacgtattt tcaagctcaa   4560
attctttgct gaactcttaa ttttctctca gtgtgtctag actgctattt atttatcgaa   4620
ttttcaattc caacatctat aatttttata cctaatattt ctatctaatt ctgtttcaaa   4680
cctgcctgtt cttttatctt agattcctgt tcttgctgtt ttctttctaa tcttttcttc   4740
atctcaccaa acattttaaa catgcttatt ttagaatttg tttctaatgc ttccatattt   4800
tctaactctc ctttacaata gttcattttc ttgtgtggtt tataatattg gctatgagct   4860
catttccact ggctatgagc tcatttttca ggggtactct ggcctgaact gtgactgggg   4920
ttgtgtttgc tgcagtttca tggatatcaa ccgttcttac tgatactcgt gttacttttg   4980
tggcttaaag aatatattaa tgtgttctca tgctgctaat aaagacatac ttgagactgg   5040
gtaatttata aagaaaaaga tttaatagat tcacagttcc acatggctgg ggaggcctca   5100
caatcatggc acaaggtgaa gaagtaaagg tatgtcttac ttggtggcag gcacatctta   5160
catgggggca ggcaagagag cctgtgcagg gaaactgccc tttataaaac cgtcagatct   5220
cgtgaggctt attcaccatc atgagaacag cacaggaaag actcgccccc atgattcaat   5280
tacctcccac tgaatccctc ccaggacaca tggggattat tatgggagct acaattcaag   5340
atgacatttg ggtggaaaca cagctaaacc atatcaggga aggagaggtc cttgaactat   5400
ttgcattatg ggggcactgt aaaattagac tacacacttc agttggccca ggtctggatt   5460
ctgatttctc tgaggagact cttttgcccc gcatggatct ggacagaagt caagcaacat   5520
tctgcttttt tctgagctgg aggccagggt tcttccagtc cagataaaat gcagaacaat   5580
cctttgtaac acccagcttt gtagagacac ctcagctcca acttactgtc ttatattagg   5640
tgcctcccaa ctcctctctc tattgggacc cagaagccct gaagatttat attgactcca   5700
agtacatctg tgaaccattt ggcttcagct gctgctcaca gctctgattt tatattctcc   5760
caaactctct gaccgctgga tagtttgctc atgtagcttt gagataattt atacattcaa   5820
aacttactct cttttatcta tttccttgtg ttgatttggc atagggtgag gagggtaagg   5880
gaaaaaggtg tctaaataag catagtccaa cacattgacc taaagcccat atatatatat   5940
gctgctaata acattatata tatgtatata tatattatat ataatttttt ttgaaacagt   6000
ctctctctgt cacccaggct ggagtgcagt ggcatgatct cagctcactg cagcctcctc   6060
ctcccgggtt caagcaattc tcatgcctca gcctcccaag tagctgggac tacaggcgtg   6120
agccaccacg cccggctaat ttttatattt ttagtagaga cagggtttca ccatttcggc   6180
caggctggtt tagaactcct gacctcaggt gatctgccca cctcagcctc ccaaagtgca   6240
gagattacag gtgtgagcca ctgtgtccag cctatgtttt tatattttta ggattcccat   6300
gtaatgatgc aattttcctt tctttgatat gatgcatcta tgattttata ttctaaatgt   6360
atttttatac ttatatataa aatgcatttt attaattaag cattagttct taaaagttgg   6420
tatttccttg aacttttaat tttacaaata ttccatttcg gtgttattat ttttagtatt   6480
ttttngctgc tgaatagtta tgccaacctc tgtgcagcct gggaagacaa cacatcagca   6540
gtcaatttgt gtaaagacaa aataatatta gagagcaaga gaatgagaca agactgcaaa   6600
tcagcaatga taattattga gtactgagaa caattccagt ggattaagat ttgggatgct   6660
taagcttctt aatattaatt gcagcaaata ttcaaatgct ttcactttcc atataagtac   6720
ttcagcaaat aagcaaaata tgaaataaaa accctaattc agaattacct aaatataaaa   6780
caagtaaatt gtcctaggca attcttacca tcttatgtcc agtaaaacaa taacctatat   6840
ttgtgcatac agatatatta tctcatttaa aaactagcgg tgattgtaaa tcttgacacc   6900
aaattgaagt tgaactgaaa gaggctttcc tgtaaagata cttaggatcc ttacattgta   6960
tgtaaggaaa gtcacctagt cctcacatca accccaggtg tgacatgtta ttaacttatt   7020
ctaatggtac agatgttgag atgcagagaa cagaagcagc tcttagggga cagagacagg   7080
gctcagtgat gattatattc acctgtcatg gggtagagct acaatagtga gtattctgtg   7140
gatggtccta tccagataaa agaaggaatt ggtttcagga catagtctgc atcttactag   7200
gtggggaatg ttggacaagt tacttaacct cttctgccct gtaaaatagg gataaaaatg   7260
gtacatatca cagagtgtca taggaagact aaagtagact attctcatcc tcacacctaa   7320
tgagttctca atatttaact gattataatt atctttacta gatacataat taattaaata   7380
aattaaggaa ttatagagca aatagtcata gggtcacaca gatagaaagt gggaaaaata   7440
ggagacaaac ctatgtctat attcattcca tggcattaga tttagattac ctccttttag   7500
tctggcaaaa cactcatgat tatacaatgt aatttaaaaa tatacagtac tttgctgggt   7560
gtggtggtgc atgcctgtgg tcccagctac ttgggaggct gaggtgggag gatggcttaa   7620
gcctgggaag cagaggttgc aatgagccga gatcacgcca ccgcactcta gcctgggctg   7680
tagaacgaga tactgtctca aaaaagaaaa aaaaatacag tactcacatt ttactttgct   7740
agtatatgct gtattcactg gtgtatgctc tcttgcatgg agactttcat tgggaataaa   7800
atgtttgaaa ctattttact atttcttgca ctgctttgag atactaccag caaagctatt   7860
tctaagctaa gacgctatgt cctggcagga cttctaaaga cttaaagcaa tgctgtagct   7920
gtgtatttac aactgactag agcagggatc agcaaaccat ggccagtggg tcaaatcctg   7980
cttactgcca gtttttgtaa acaaagtttt atcgcaactc cctgcccatt tgtttagaca   8040
tggtctgtgg ctgcttttct ccaacagcag aaaagttcag tagtttcaac agaaaccctg   8100
aggcccataa agcctaaaat gtttaccatc tggccattta cggaaagtta gccaaccccc   8160
agactagaat aaaggtagga aaaaccactc agcccaagct tcttttttga ttctatcttc   8220
ccacagctgc ctagaatcct ttgcagtctt tatcctagga ggctcagagg ctataacaca   8280
tctctaattt tgtctagatt tgtgagaatc catttctcac aaatccagtt ctggccctct   8340
ttccctgact cgatgttcct tgaactctaa acatgaattt ttaaaagaag gattacctgg   8400
gatgggtata tccctgaaag tcacctcctt tctgctgcct ctcacaaata cacaggctat   8460
gtgccttaaa cctgtcattc actttaagga atttttgaaa agtggataat aggttagaca   8520
taaaattcac tgaatctggg ttaaatttaa tcagtgagta ttctttagaa tggaagcatg   8580
agcctgaatg attaaagaaa ttgcttaaaa aattagaatc aaaatactaa atatcatccc   8640
ccccccaatg ttttagctag aaaaattact tgaaaatgag ccagagaagg agaaaaataa   8700
ttatcttaca gaaaactaat aaaaatacaa taaactatca tttatttaaa tacaataaac   8760
tatcatttgt taaaatacaa taaacatgca aaagcgctat cattgatagc acttttaatg   8820
tttaaataac ccactgatta ctttctctag tggattattt gcaagggtag agtaagaatc   8880
gttgcttctc tggacacata acccatttgc catgtgacat tgcctccctt ccaccaagaa   8940
gtggaatgta tttttcctcc ccttaaatct gatgcctata actttctttc cccttgagat   9000
aatggcagag tggcattgtg caagttttgg aactaaggtc ccacgaggcc ctgcggctct   9060
ctctcttgtt tatctgagta ctgccctaag atgaccatgg agagaagccc agtctagcct   9120
agaaaaggag aagaggccac atggagaact gaggtcagcc agccccagct gcttgacttc   9180
tgaacaaagc cttctccgac tatttggccc tgttagaccc agctgagatc agcagaagaa   9240
tcacccatct gaccctagcc caaattgcct tctgcagaac cacgggccaa taaatagcag   9300
atgctttaac ccaccatatt ttgcagtgat ttgttatatg gcaacatatc attgaaaaac   9360
cctcatttta ccaaagaagg ggggtcatga cattaagcaa ctacctaaac ccacaatgta   9420
aatggcaagt cagggattta gatgcaaatc attccaacta aaaatgtata ctctaaatca   9480
atgccctgta ctatactctg tattttccaa aaactaatta gattgtgtca tcagcatttc   9540
tgaagacaga ggtagtcgtc tgggaagtag agttttctca accagtattt tgcacttgtt   9600
gggatttttg agatcaggaa tgttttggaa aacctgagat gtgcagtcac atctctgagc   9660
agtgttttaa gtttattcat tcactcattc attcattcag caaatattta ttgagatcta   9720
ctatatgtta ggcactatgt ttaccactgg aaggcaggca ccaggtaagt acaaacacag   9780
aaactgagat ggatggcatt gcattttcat ttgattacaa atttattctt gcttataagt   9840
tgattaccta ccttattaag agctgatttg tttcaagttt tagaactcca attgtgtcct   9900
taaatttttg tctagcttaa aacatagtgc tagatttcaa gaagtaaatt gtcaaacagg   9960
tttgctgttt agtttttgta aaaaaggaaa cttgtaggca gaaacaaaaa ccaaaataaa  10020
taaaatctaa attatggtaa taactaaaga tagttgaggc attaacagag tttgactgaa  10080
ctctcaagtc tcaagcaaat ttctaaacta aactgttttc ttctgttaat cagtttaaaa  10140
gggaatacct tgtgctaatt tttcttggtg ttggtaacat taataaagct ctgtgaaatg  10200
aggccagaag gaacagaaat tgagtcaaaa taatgataac acctcttaca tattcttacc  10260
atcttgtctc ctagccacac acaccatgtt taaacctaaa aggagagaca cctggagggg  10320
ttaattagct tgcagctgtc tgtgactagt ctgcagagga taaaacggat atcagccgta  10380
agaaagcagc tagcactagc ctggatgatg aacaaagaaa agaagcagct gctgaggaaa  10440
agcacatttt gctgaccttt gaggagggct taagaggccc tttgccccct gaaaatggga  10500
cctgggaaga aagtcttgat ggcagacagt acaaaatcaa gggacagcag ctggctgttt  10560
tgtgtaaggg gcaaaattca agaggatttg tgaatcattg tgatttacag tgaccattaa  10620
ctattgtaat aaggagagaa aaatcaacat ccattcagtg cccacattgc aaattgccaa  10680
gcactggagg ggtactttca cctaggccaa caaacttaat aagcagagaa acccttcagt  10740
gttttggctc ctacagctca agtgtactag gttggcaagt ggaagttcct ttggtcatct  10800
ctgtttatac acttgtttga gatatttcat aaagtcagcc catttgttac tttatctgta  10860
gtatgtgctg tttcatgtgg aagatgcttg ccttttgata gtattccaaa ctgaccaacc  10920
ctgtacggat ttaagccact gagaagctat gaacagacag gtgaagtttt ggtattgcca  10980
ggaaccagct tgtccagaag tttaatcctt taaggaaaag gatagcaagc ccaatgcaac  11040
agcccttcat gctaaaaact ctcaataaat taagtattga tgggacgtat ctcaaaataa  11100
taagagctat ttgtgacaaa accacagcca atatcatact gaatgggcaa aaactggaag  11160
cattcgcttt gaaaactggc acaagacagg gatggcctct ctcaccactc ctattcaaca  11220
tagtgttgga agttctggcc agggcagtca ggcaggagaa agaaataaag ggtattcagt  11280
taggaagaga ggaagtcaaa ttgtccctgt ttgcagatga catgattgta tatctagaaa  11340
accccatcgt ctcagcccaa aatctcctta agctgatagg caacttcagc aaagtctcag  11400
gatacaaaat caatgtgcaa aaatcacaag cattcctata caccaataac agacagagag  11460
ccaaatcatg agtgaactcc cattcacaat tgcttcaaag agagtaaaat acctaggaat  11520
ctaacttaca agggatgtga aggagctctt caaggagaac tacaaaccac tgctagacaa  11580
ttgttaaaaa ctaaagttgt tggggaacaa attgtactta aaatatattt attgtgtaat  11640
ctgataaaat attttaaatt ctggtgttac aaagatttag tgtttctttt gttcttttta  11700
caaaacagaa acccactaaa atgttaactg attgacatta tattttttgc tttcgtcagt  11760
gttaaatact tgttgcacag tagtatgagt tgtttctatc atttactctt ctacaagcca  11820
gttgagacgt gttacgagga ctcaaaatat tctaattggc ggtgaccaaa tgtcatacaa  11880
ttatgaagta tacaagccat tctaaccttc acagtaaatt tttttaccct ctggttgcat  11940
acttaaatag aattatacta ataatgcata ttttctgagt gttaatgtca tgtgaaattg  12000
ctactaagtt aaacgttgct tcccatggtt ttctgggtga tgggtgttta ttctgcttat  12060
tcagtgcctc tctacataga ggaacctatc tcagtaactc ctatactact ctacaacaaa  12120
atggcagaag aaaagttacc catttgaaaa aataccttat tttccaaaca gaagtcttca  12180
gacaggcagt gcacaatatt tgccttccag aaaaggagat tgcataaatg cataacttac  12240
atgttagtac atgtgactgt ttccctgtct tatcctgaat gcatggaaag tcatgagact  12300
tatttttttc ttcctactgg attccattat aaaacctcta tttgtatagg ttataaattc  12360
taaccaataa ttgagcttac tatgttgagg ctgtaggcag aggataagat ttacatgtca  12420
gactttatgt tctgctcttt ggattaggct aattttcaaa agttattgac tgtaaaataa  12480
taatcatgca ctgaggaaat acaatattaa aataaatttt gaagaagatg gaattatagc  12540
aggggacctg tggaaataga atctaagaac atattgtaca tatgctgaat taatagagtt  12600
gcattgtgtc gttcacatag caaattcagt acagattgtt tgttaatgtc aacagattat  12660
gccgtaaaat ttgtaatttg tttggcaaat cttgacaatg ctgagacatt tattctagtt  12720
aatacaaatg gctaaggtct gtaattatga gttatttaag ctaagaaatt tggcaagttc  12780
attattcatc agtctctacc tactattcca aattaattga ctgttttata tactgataca  12840
attaatagta aactttttat attaagtata catatgtgaa ataaaatcat attattattg  12900
gattataaga tgttaataat ggtaagtcat gactgttatt ttgttgaagt gattttttag  12960
aatttttaaa ggtttattca acaaaataga gttatcttac ttaaaaatgg atgcttaggg  13020
ccaggcgcag tggctcacac ctgtaatccc agcactttgg gaggccaagg cgggcagtat  13080
cacctgaggt cacaagtttg agaccagcct ggccaacatg gtgaaaccct gtctctacta  13140
aaaatacaaa attagccggg catggtggtg ggcacctgta attccagcta cttgggaggc  13200
tgaggtagga gaattgtttg aacccgggag gcggaggttg cagtgagccg agatcatgcc  13260
actaaatttc aacctgggcg acagagtgag actctgtctc aaaaaaataa aaaataaaaa  13320
aacaacgctt agagattttt aaattaaatt agtttcaata cttctataat agttaaaaca  13380
agtggtttct atttaaatca caaatgatag aggttagaga tgaaactaaa catatgagat  13440
catcaagtcc aaccttctgc tacgatatta gacttcaaat ggaaagcaca tcaaacgtta  13500
accagatgat ttctttgata gtctgtttaa aaatattgaa ttaataaact ggaaacattt  13560
taaaaattgc tgttcttttg gaattaatat aaaaacatat actttaaagt aaggaatttt  13620
atactgatta agttatacac tgcttagcct agcatgtgta tgttatactt aaaaatgtgc  13680
attgtacatt gtcaaataat ttgcacacga tcatttacac atctgtattg ttcacattga  13740
cgtactttgt gtcatatata tttgtgcatt atcagttgat ttgcacattg cacaccagag  13800
tcacacagtt atagatctgt gtgaattccc tatattccac atgcatggac atgttcatat  13860
atacccacac aaatacaccc catgaaatga tatccagtta atgaatacaa aggtttttaa  13920
aggagaaatt cattagaaaa aaatcctata agcctctagt tttcccaatg aattaatcta  13980
agaatggata ttttattttt tccatgtttg acttgtaaag taaaacttta gtaataaaga  14040
gtgtctgcct tacagttcat atatttcttg aatttaaaaa actcaattac ataagaaata  14100
cattaattct tttctttaaa ctattaagac agcaaagtct tttttatgat tatctacaat  14160
tccggtcctc tctccggtat ctccaagata acatgattat gagtttaatg tatgacattt  14220
aaaactttga aactcacttt catatngntn tnnncnnnnn nntacataga atatatggag  14280
tgttgtttac atattattta tatgaataaa tatacaccta ctccaggtaa tttagtggtg  14340
actatcacgt attttatttg gtcattctac aattgattga tgccttttgt gtgtgtgtga  14400
ttactaatac tggagtatta atatacttgc atgagtctcc ttgtgtacca tgggaatagt  14460
tctgtatttg aaaatagaat tactgggtat gcacattttt aatttttaat atatacttcc  14520
aaattgttcc tgcatactcc caccagtact aagaatgtat ctgttttcct cttagcatgt  14580
caatatttga tataatgaaa cttgtaaatt ttagccaact aaatgagtgt gatttctatt  14640
cctttatagt aactgatgag gttataatca agttaagcat ttttttatat gtttattggc  14700
cactcaggtt tttttcttct acgaattgct ggttcacatg cttcgcccat tttccttctg  14760
gacttgtgtg tgtgtctttt tcttacatat attggtatat ttgacttttg tctattattt  14820
attttaaggt tataggattt tagagttaat gaaaggataa aatgctggag gcctagaatt  14880
cagaatcgta cataggattc taaacagaag ccatgttcta aataaggatt tggcttgtgg  14940
gacaaaagaa aaatgtggaa tttcacagnn nnnnnnnnnn acatttatgg gcaatagaga  15000
atcaagaatg actttgtcat aacatcggca tcattgaatg gtattgtcac ctataccatg  15060
atcaagaaat taacggtgtt gctctgcaga ctggcaaatc tcattgccct ttcttctaac  15120
cctgggaaag tattattaca atggaaaaag atatgcgaca agatattgta ttaatagggt  15180
gttagaatca aataaaagga gggatagatg tagtaagaga agcagatttt atagctatcc  15240
ccattccaag aataaaaaac aaaaaaataa taggcgagtt cattgtgggc atctgtcagg  15300
aacaaggaag gatagagctc tgaaagctga ctgcagtcac taacaaaaac ccttttgaga  15360
catattccaa gaacctgaaa aactggtaat ggacccttcc ttatactcgg tgtcttgaaa  15420
ggcagtaaac tgtctaatgg gatataaaaa tagagtcttt ttttcctccc ccactctaat  15480
attctcctat tttaaaaacc ttctttatat ggcactgcaa ataatagcac acagcaagaa  15540
ctgtactttg cagtattatt gagcatctca agtgtctgaa aggtacaaag ctaacaacca  15600
aatgacttca gaatggaaaa tgtcccagaa tttttaattt tccttctaaa acagaaatat  15660
aggggaagca aaaacaacct taatctaaaa tccagcttaa aatgacaacc agaggttttc  15720
tagcttatat tttatttcag aatgcttagc aaatttcttg actttgtatt aattttagtg  15780
agttgtaatt tgaggaaact catggttttc taagatcctt tatacctgaa aagttgtcgc  15840
atacgtgtaa gacttgcttt gttattgttg ttgtaaattg aatacctgaa ggtagatttt  15900
agtacactaa ataatcatga tgttcattct gtgctaatag gcaggaaaga tggacaatag  15960
aacttactgg gatgccagga agtgctctga tcacccagga gtgagacatg agatgggcag  16020
aaagaacaag attagttaac tatcatggga aacataagaa gaatttggct ttagggattg  16080
tgtgtttgag attgattttt aaaagaaaaa gacctattta aaaatccaca gatgcttagg  16140
gaatagaata gctatttttt taattcataa attttatatt ggttagtttt cacagcagtg  16200
aattatcaac tttatataaa agtaaaatga taatttgata tatttcctga tatgagtcca  16260
cattttcaga gccatctaaa ttcagccttg tttgttcatt atacatatat aagaaaatcc  16320
ttcttctatg caacaaatgg ctgtatataa aatatacatg acttgttgat ttaaaatctt  16380
ttaccttttt ttctcatcat aaaggtaaaa cacatgcatt tcataaatgt ttgaaaatgg  16440
gaacgtatgt accaaaaaaa tcacttcaaa atcatggttt acgtatcttc taaaaacatg  16500
taatcaaata taacaaagta tatttaggcc aatattttga ctatgataaa atcgctttga  16560
ttcagaaggt attgtgtttt ctgagtattt cattatttaa agcagaaggt ttcatctttc  16620
agaagtgtca ctccagcctg ggtgtcctgt gtggttgagt caaatcagtg cttccactat  16680
cagtaggttt ggcacaggat gaagcaagaa catcaaacta aaggggccaa gaacaatagg  16740
tgggagaggc tgcaggagga gcagagaggt cctgataatg aggttccctg actatagcag  16800
gttaggacta gacaagccct gtgaccaaca gaggaaagag tttctgagca ctttctatat  16860
ctggctgtac cttgggggac ttcctccatt ttgtctgggc tcatccacag tcctgctaag  16920
agattctgca aaatatactg cagttctcat tcatgtgccc cttgagatgc atttgagctg  16980
caggtatttt ccctccagtg gtacccagtt tattatttct agtccattca actcataaca  17040
acatccagca gcactttacc cacaggtggg tgtttattag gtttttattt cttttgtcca  17100
ggtttattga gtttgaagag taggcaggga tttctgtttt tatgagtcac ttgtcagctg  17160
taatgaagtc ttcttcacta aaaaaaagat gtgaggacaa tcttgcgcag tgtcataatt  17220
attctaaaaa tacatcatgc ttaattgtat ccacaaaggt tttaaaaatt taaacatcag  17280
ttttgagttt tagggctttc ttattggtga attatcaata attgtagtgc tttcttgaaa  17340
agttccctgg ggtggatttc cttagttgca tataattcta gcctcttcag cctactaagg  17400
ataaaaggga catgaagtac acatatctgg gaattaatta catttttctg ctcaagagcc  17460
aagtcatttt cagaaattga tgtcaaatag gtcttccata gctgaaagtg ctaggtgtct  17520
cttcacatag ttaagatttc cccctattca gaaatattag tttctgatga caatggaaaa  17580
ttccaaatgc agcagcttca ctgtgttcta ataatgttca tgcttaggga tcctgaaacc  17640
acttgcagta tgcctggtct agccacagca gggagccggc gcccatgcca gttcccagag  17700
ctgaccaccc cnaccgcagc cagcgtgtct ggctgtgcac catggccaga ctccatgctc  17760
actcactcat gcaccccgca ctgctcccca cctggctcaa ccttggtggg catgggatcc  17820
aggctggtag tgaaagtcaa atgctgcctg ccaggccggg tgggcagaac gagcccagcg  17880
ggtgagaaaa acttgggcaa acgtgccact ggctacagag gtttccggct ggtgaagtga  17940
caccctaagg attctgtgac aatgggaaaa ggggtaatga agggatagag cagattaagg  18000
aatttaaaac ccagttgagc aagtatatct gtaaataatg tacttttgta tactacaaaa  18060
ccacaaagaa aggatctccc tcctctatta tcacagggtc atcccggaag aactgacatt  18120
tcaatacgtt aaaaaataag tagataatgt ttttagcttt aaaaaaaagt ggaataatct  18180
atgcatatat aaagaataaa tgcacataac atttatgtgg gttatgtaag cagaggtaag  18240
cattataata aagcaaacac tgatgagcca ctggtgagga aacataacct tcctaaatct  18300
ctgaggcttt cagagtggct cttggcccat gtagaggtaa gggtgtgaaa gaacaggaag  18360
agagggcgtc catgtttgag aaaccacaaa atcacaggag tcgctaaagg agtagtttaa  18420
ttggttatat ggaggaaatc tggagtgatg ttagaagatg caattgacca gatcaggtgg  18480
atcacagagg ccatcctgag cagtacaata ggaaattaat cagggatccc ctatggttac  18540
cataccttat gggtttaaac caatgatgct tacgagggag aagttagctt ttctggacaa  18600
tgtccttggt gtgcactttt cagatggaga ttggcaagcc aatggctaag gagggtgaat  18660
cagatcaaaa ttcttccttg actttcatag catttccaga ggatgtctag tttatgagta  18720
aaatgtcttg ccttcatctc ataaaattat ctctatgtcc tcacctgtaa agatgttcta  18780
tatcanaaca ttattattta tacaaataat tatattttct taaaaagact tttttgtaca  18840
gtaaaataag tggaagcaaa cttaaatgat tcagaacaac tttctaaata tttgactaaa  18900
caatttcagg aaatagccat ttaatccctc gaaaacaaaa tttggcttcg gttaattttt  18960
agaaaatcct aagatgagga gatgaagcta aaaaaaatat attgaacact gtgcatttca  19020
ataaagaatt tacagaatag ctggaaaatt aaggttaagt atacaaggta attatatatt  19080
tatttttaaa atgaaaaggc atttaacaat ctaaaaacta catcaaatac attatattta  19140
gcatcatgaa actacttaat tatctgcacc tatcagtgaa gcattttttt tctcataaat  19200
ctgttctatg ataatctaca ggaagacata attttaaaat ttgtaaggat tagagtggat  19260
ggtcacctgg tcccaacctt tggaacattt gaaaagcaag gaacatataa actgaacatt  19320
aattttctcc ttgcaatgta tacaagaaat ttaaaaaaga attttccaga gtacaggtat  19380
aaaagggtat attcttgaca gggaatcaga gtgctgacag atggctaaga tttccatcca  19440
agaaaaattt gatgtttgaa cttaagaaaa tggaaanttt ctttgctgga cctcanataa  19500
tattttcagt aatgacagaa agtcaggaaa gatgaatgtg gaaacaaaat gttcttgaac  19560
acatgaaata aataggtaat ttagatacag tgggtggtgc cagtatgctc tgtaggtgaa  19620
gaataaatct ggaatcctag gaggtcgccc taaccagtga ggtctctctc acttatgaac  19680
ataaaatgtc tgggtactta ggactcctct aggcaataaa tgaccttcag ttagattgag  19740
ggctgatcga actgagaggg attagtacat aatttaatct atttgctaat tagcatgatg  19800
aattagacca ttgtcatctg ttgctgtgtg ggagaggaag aggacaaggc atttaagttt  19860
tgatgagaag gacatttatt gaatagcatt gtacacttta agagtggatt ctcatatatg  19920
atctaagtat cttagtctat agactaagtt tgattctttc ctttcattag tgacagagct  19980
acaactgtca cttgagtatt gggtgacttg acttctcttc caagtcgaac acactgcata  20040
acatggaaag aaggcaagga agaggagaat atatcttgtc ccatcactgg tcatttcagg  20100
ggagattttg gcactgaaga cagatcagga gcatatcaga taggaacaaa aaaaacaggc  20160
ttggtagctt aaaaggagga gtcaagtctt accaactctg aacactcacc tcagtagtga  20220
tgtttcattt ttaccctctt agggtaaaag agtctggtat ttctaagtat atgctttcta  20280
gtgtttgtgt ttactatatt taagaaacac cattagatca attcttatta atgattactt  20340
gatattaatc attatgatta gacactagtt taaaagcata gattagtttc attaaagact  20400
tttcttgaga gattatatat taaatgggtg gtgtacacat tcttactaag aaagttttct  20460
gctgtttata tcttaaatta atgtagaatt tctcccttaa tttctacata gaaacttagt  20520
atagataagc ttgtgcagtc agctgtgaat tcatctaggc ctactaccat ttcttcatct  20580
cctctaaaga ataaaatatg aactatcttg ttgaaattaa gtgctactag atctatactg  20640
ctagtgatcc tgtaatatca atacatgcat gcatacatac ataaatattt taagaaggaa  20700
aagaaatctg gttggaactg atgccttccc agtgagcctt tgctggctct tgacagtttt  20760
cgctctcttc tttaagggtg ttcagattat ctagactttc tagaattaat gattatttta  20820
tcgttttgac aatttttctt tctaagttaa aaccacattg gcattttgtg aatatgatca  20880
tatttctcat tttgaccaat ttttccctag cattacagtt cgttaattta ctggtaatta  20940
aataatgatt aaacatatta attaaacaaa taatgattat ttatttttgt attacgtttt  21000
attccttaaa gcctctctcc atcgttaacc cttttccttt gtnnnnnnnn nnnnnnnnnn  21060
nnnnaagccc ttccttagca tctcactgga ggtacgttca ggcagcatca ctttagtatc  21120
tcgccagcat tgtcctcttc ccgccagtgg gaaccaacta acaagtacac tctcaggtat  21180
gaacttaagt acaggcaagt caacagattt catatgcatc caaatgacac gttaaataca  21240
aagctttgct cacctgcctt tgtacaggag tctgctgctg ctgggtttta atgaaactta  21300
aaggctgaat caaagcctta ttagtgggag gatctttgac atgaaattct ttttgttcag  21360
tataatttgc attttgtatt catttgaaaa attgtcctgt gcatttgttc gaatatcgag  21420
aatagagaac tgagtgattc ctgggtttat gtgggtgata ttgtggaaat aagaggtgct  21480
gtggtatgta cagctagtcc ccaaatatga ttgtatttta ctagagatag agaattcaca  21540
gtgactngaa ctattcaggc tgtaaaatat aggaaccatc tgccatagaa taagcatatt  21600
aggaaaatgc cacctattcc tacattagtc tggcccttgc tccaaaattt cacatgtact  21660
catatgtttg ttttccgtgt ctctgattga tgcagctagc taatgcctaa tgacagtttt  21720
tttaatcatt ccctatatac atttttttat tttattatta tactttaagt tttagggtac  21780
atgtgcacaa tgtgcaggtt tgttacatat gtatacatgt gccatgttag tgtgctgcac  21840
ccattaactc gtcatttagc attaggccta tctccaaatg ctatccctcc cccctccccc  21900
caccccacaa cagtccccag tgtgtgatgt tcgccttcct gtgtccatgt gttctcattg  21960
ttcaattccc acctatgagt gagaacatgc ggtgtttgat tttttgtcct tgcgatagtt  22020
tgctgagaat gatggtttcc agcttcatcc atgtccctac aaaggacatg aactcttcat  22080
tttttatggc tgcatagtat tccatggtgt atatgtgcca cattttccta atccagtctc  22140
tcgttgttgg acatttgggt tggttccaag tctttgctat tgtgaatagt gccacaataa  22200
acatacatgt gcatgtgtct ttatagcagc atgatttata atcctttggg tatataccca  22260
gtaatgggat ggctgggtca aatggtattt ctagttctag atccctgagg aatcgccaca  22320
ccaacttcca caagggttga actagtttat agtcctacca acagtgtaaa agtgttcctg  22380
tttctccaca tcctctccag cacctgttct ttcctgacat tttaatgatt ggtgtgagat  22440
ggtatctcat tgtggttttg atttgcagtt ctctgatggc cagtgatgat gagcattttt  22500
tcatgtgttt tttggctgca taaatgtctt cttttgagaa gtgtctgttc atatccttca  22560
cccacttttt gatggggttg tttgtttttt tcttgtaaat ttgtttgagt tcattgtaga  22620
ttctggatat tagccgtttg tcagatgaaa aattttctcc cattttatag gttccctatt  22680
cactctgatg acggtttctt ttgctgtgca gaagctcttt agtttaatta aatcccattt  22740
gtcaattttg gcttttgttg ccattgcttt tggtgtttta gacatgaagt ctttgcccat  22800
gcctatgtcc tgaatggtat tgcctaggtt ttcctctagg gtttttatgg ttttaggtct  22860
aacacgtaag tctttaatcc atcttgaatt aatttttgta taaggtgtaa ggaagggatc  22920
cagtttcagc tttctacata tggctagcca gttttcccag caccatttat taaataggga  22980
atcctttccc catttcttgt ttttgtcagg tttgtcaaag aacagatggt tgtagatatg  23040
tggcattatt tctgagggct ctgttctgtt ccattgatct atatctctgt tttggtacca  23100
gtaccatgct gttttggtta ctgtagcctt gtagtatagt ttgaagtcag gtagcttgat  23160
gcctgcagct ttgctctttt ggcttaggat tgacttggtg atgcgggctc ttttttggtt  23220
ccatatgaac tttaaagtag ttttttccag ttctgtgaag aaagtcattg gtagcttgac  23280
cacatagttg gaagtaaagc actcctcagc aaatgtaaaa gaacagaaat tataacaaac  23340
tgtctctcag accacagtgc aatcaaacta gaactcagga ttaagaaact cactcaaaac  23400
cgctcaacta catggaaact gaacaacctg ctcctgaatg aatactgggt acataatgaa  23460
atgaaggcag aaataaagat gttctttgaa accaacgaga acaaagacac aacataccag  23520
aatctctggg acacattcaa agcagtgtgt agagggaaat ttatagcact aaatgcccac  23580
aagagaaagc aggaaagatc caaaattgac accctaacat cacaattaaa agaactagaa  23640
aagcaagagc aaacacattc aaaagctagc agaaggcaag aaatagctaa aatcagagca  23700
gaactgaagg aaatagagac acaaaaaacc tttcaaaaaa ttaatgaatc caggagctgg  23760
ttttttgaaa agatcaacaa aattgataga cctctaacaa gactaataaa gaagaaaaga  23820
gagaagaatc aaatagacgc aataaaaaat gataaagggg atatcaccac cgatcccaca  23880
gaaatgcaaa ctaccatcag agaatattac aaacacctct acgcaaataa actagaaaat  23940
ctagaagaaa tggataaatt cctcgacacg tacaccctcc caagactaaa ccaggaagaa  24000
gttgaatctc tgaatagacc aataacaggc tctgaaattg tggcaataat caatagctta  24060
ccaaccaaaa aaagtccggg accagatgga ttcacagccg aattctacca gaggtacaag  24120
gaggaactgg taccattcct tctgaaacta ttccaatcaa tagaaaaaga gggaatcctc  24180
cctaactcat tttatgaggc cagcatcatc ctgataccaa agccgggcag agacacaacc  24240
aaaaaagaga attttagacc aatatctttg atgaacattg atgcaaaaat cctcaataaa  24300
atactggcaa accgaatcca gcagcacatc aaaaagctta tccaccatga tcaggtgggc  24360
ttcatccctg ggatgcaagg ctggttcaac atacgcaaat caataaatgt aatccagcat  24420
ataaacagaa ccaaagacaa aaaccacatg attatctcaa tacatgcaga aaaggccttt  24480
gacaaaattc aacagccctt catgctaaaa actctcaata aattaggtat tgatgggacg  24540
tatctcaaaa taataagagc tatctatgac aaacccacag ccaatatcat actgaatggg  24600
caaaaantgg aagcattccc tttgaaaact ggcacaagac agggatgccc tctctcacca  24660
ctcctattca acataatgtt ggaagtcctg gccagggcaa ttaggcagga gaaggaaata  24720
aagggtattc aattaggaaa agaggaagtc aaattgtccc tgtttgcaga tgacatgatt  24780
atatatctag aaaaccccat tgtctcagcc caaaatctcc ttaagctgat aagcaacttc  24840
agcaaagtct caggatacaa aatcaatgtg caaaaatcac aagcattctt atacaccaat  24900
aacagacaaa cagagagcca aatcatgagt gaactcccat tcacanttgc ttcaaagaga  24960
ataaaatacc tagnaatcca acttacgagg gatgtgaagg acctcttcaa ggagaactac  25020
aaaccactgc tcaatgaaat aaaagaggat acaaacaaat ggaagaacat tncatgctca  25080
tgggtaggaa gaatcaatat cgtgaaaatg gccacactgc ccanggtaat ttacanattc  25140
antgccatcc ccatcaagag atttttttac acattccata tgtgaatatc ctattttctg  25200
attcagttct gactttattt ccattatatg tgaatgtgtt tctttactat ttttctatca  25260
gtttccttcc tggtcaattg actatatggg aaaatatttt atccattcaa tattcaaaaa  25320
tagtttattg aggacccact atgtgctagg catttgatca caacagtgaa aaacagagaa  25380
aaaatccttg ctttcatgga gtttacaaat tctaccaaag gaaacaggaa ataatgaaaa  25440
taagtaagta aaataaatag catgctacat agtaataagt gtcaaggaga aaaggaaagc  25500
agacaaagag aggggaaggt gtgagcagga attgcagttt cagataaggt ggccatgaag  25560
gtgtcccttc aaggaaaatg tagtagttgg gaaggggcaa gtcacatggc tctctgggga  25620
agagtgtgca gggcatcggg agcagccctt gcaaaggcct tgagaaggaa gcatgcccca  25680
tgctctcctc ctcatatgag gaggccaaca ggtcttgaat gaagctatgg agaaagagaa  25740
agggaatacg attggaaagg taacaaggaa tggatcacgt agagccttcc agggcaacgt  25800
aatgaccttg gctattcctt ttaaatgaga tggaaagccc gtggagcatt ttgagtagag  25860
gcgagacaaa actgatcagg acaactctgc ttgctgggca gagaatagaa tcaagggaag  25920
caatgacaga agagactgtc ctaagagtcc aggcgagaga tggcagtggc ttggacaaag  25980
gtggtagcag tggaggtcac agaagatgct gaatatagtg ttcatgttta ctttatggga  26040
tttactaaga gattggctgt gtgttaaaag gaaaagatca ttctaaagct tctggcctca  26100
gtgattagat agacttgcca ttaacttcca gaagagcatg tttgagggga aatatgagga  26160
tctcggtttc attacatgtt aagttccagt aatgtgatta gattgaaaat gctatagctg  26220
gtagaatttt ttcacttttt atgtcaaaac agaaaacatg attgaataat gaaaactaca  26280
catgctcaat ttttttaaaa ttgttttctt tgacacagta aaggatcaat gagacttgct  26340
taattcttgt caagaataca aagtcaacaa tggctgagat gaaaatattt tccataaagt  26400
aaaatgatca aatttgcaaa agcttggtta catgatgtga atttcactca aaccacaagg  26460
cattacacta gagtcttgct gaaatttaag acagactgtc ttaggaatta tttgccaata  26520
gacaaaatga atatggggtg gttgatgtgc tgaagtggcc aatgagcatg ctttgattga  26580
cagatgagga aatgtatccc tacattttat caaactatgt ggtgtctgat ttatatcact  26640
gaggtggcca ttcattatgg tcatgaactg tgaggtcaaa gcacttgcaa aaacttgcca  26700
aaatacttcc tattccagta ctaaatattt ctcatatttg tttgcctaga ataacaagat  26760
gcaggcttgg tagtcctttc aagaatgtga atttctttgg tatgtctgag tttagtaatg  26820
ttgaattgtg tgtgtgtgtg tattattctt aagactttgc ctgtatttta acattttatt  26880
tggtaaaaat agcattattt tggcaagatt tttaaagcct tgaaatggga caaattaaag  26940
tataatgctt tttcttgaga aataatttat tgctccatgt tgttgaatca taccattagt  27000
catgaaacca aaaccctata tttaaaaagt aacaatctca tattcaaagt atctcctttg  27060
aacatttcaa agaatcttaa gcaaatcttt atgtgacatt aaattgtaca ttttaccttg  27120
ttattttaga tctatgggtg gagttcattc ttcgggctaa gtgtaggtat gaagtgtgaa  27180
tttctgtgtc ttggtatgcc agtaacttag ggcaaggtta gtagagtggc ttttgtgaga  27240
aaaaaagagc tgttttatca gacatcagtt ggaactttgc cttgttttgt ttccctgaac  27300
cgtccaatct gcttcatata cttgtgtgaa atcctaaaat gtctgtatgt caataatttt  27360
tagttagcat attttttcca aacagacatc cttgtgaaca tcagccgttt ctgagaactg  27420
ggcccacgga ccatagctac tttgagtctc agtctatgta atagttgggg taaagtaagc  27480
tttaaagaga gaactcacaa cacaatggct caagcaagac acaagttgat ttctttctga  27540
agctgccatc ctgggtatgt gggtatttgg atgagctggg ccccatgaag tcatcccaaa  27600
gtgcaggcct ctgtggcatc tctgccaaac tcaacactta ctctccaagt ctgtccttgg  27660
cttctctatt tctagctggt ggaagggaag ggaaaaatga gtccagggaa ggagtttttg  27720
tagatggctt gggagttgca tacatcagga agaactttgt cacaaggcca caactccttg  27780
caggaaattc taggaaacat attccctcac tgagcagcca tgcgcccagg aagaagagaa  27840
gaatgagtct agagtcgcaa gcagcaatat ctactacagg cttaaataac caaaggacaa  27900
aatgcccagt ccattataaa tatattccaa aaatgaagcc atgaaatttg acttcattta  27960
ttgaagtcaa aacaaattta ttgttatgaa ctaatttctc tattttatat ttctcaaatg  28020
attacatttt taacacagaa caaagccata gttagaattt cagtaatcgt atggaatatc  28080
caaaaggtac acccaataca cccaaaagct aaaccagagt cactgctaaa ttttatattg  28140
ttctgattta cctaacagat tagtgaaaat aattaaaatc ttgctgcttt ttaaatttta  28200
aatatcggat tttggttaga actctaagaa tatttaaaac tatctttacc tactcttgtt  28260
ggacaatcat ttgaggagct aagagtgcag agaaggcaga gaaatgttct cctcaaccca  28320
agcaaaagca cagaagaact attgctaatc caaaatgcag gaaggaaatt tcacccctcc  28380
tcccttccct tttcttgggc tagtctgttt aactttaaaa gcagaatttt tgctctcaca  28440
aagtatacca gacaggaatt tgttcaaatt cctcaaaacc aagccaagaa aagtttcaga  28500
aagttcagac atgcatggca gagtggaaag aacatagtct gtggaggcga gcacggattc  28560
attggaatgc cgctccagac atccactctg ggtgaactca gggatgtgtt tagtctcatt  28620
aagccacagt cttttcattt ttaatgtaag agtgataaga acgacttgcc agtgtgttgg  28680
tggagaactg aaatagagaa aggcctggtg tgtaacagga tgtttctctc catctgtgta  28740
atctgtgaca gtcctaggaa gttcaaagtt atgactgttc tgggtttgtg gccaacagtt  28800
gtctgtggct tccatgggtt ggagctgtct aatggggccc agnccaccat cgctctgctc  28860
agaagctaat cataccaaaa catgaggttt ttctccaagc gacaaagagg ggctaagcac  28920
ccaaggatct ccataatagt agcaggaaaa tgaagctgag accttaccct gacttagaag  28980
ttcataacaa taatggcccc aaacaagatg ctcatgtcta ttggttgtgg ttaataatca  29040
tgcaacaaca tgaacttcaa acccagccta tgcttggctc ttccagggac tgaaggcatc  29100
tcagagcccc accccttacc tcagaaaccg caggaaggag cctgggttct cagagtccaa  29160
gaaaatgcac ctgataatag cacctgaact tcctccacac aaagaaagcc tgatagggac  29220
aggggattaa gcttgcatgg agggcaggat ccaacccaca gtagcacttc cttgccatgc  29280
gaccttagca aatggcttaa ctcgctttct gtatcagtaa aatggtgttt gtagtactaa  29340
ggtgtcagtg aggattaaat gagccaagcc tgacccacag caattcatga caagtctcag  29400
ccactttaat gaatgtgatg atattctaac gtttgggatg ctgaggtgga ggacgatggt  29460
gtcccacctc ctgcaaatgc catgtgaaca ctgaagctac acaagcaatg gctctaaagt  29520
caaagccagc atcaggactg gtataaaaga atcaccagga caagggcagg gcagagggga  29580
ggccaaagca gctttgtcag tgcctgcacg gctggaccta gaggaatttc tcgacataga  29640
gggtaaaaca acccattggc ccacatttct gaggaccgac gtgggagaag ggtcacatga  29700
ggccatgaaa tgggcatctg cagaggaaat ggaagccagt gtctggagac aagtggagcc  29760
attgagctag caatgcgtga tagatactgt gggaagggat gtggggaatg cagcacctct  29820
caagggaggt ggctgagtct ggcaatgagg gcctggggca tccttagtca gcaaagcagg  29880
tctgcagcct cgggagctct ggcagctggt gtgggtcacc aactggcctc gggcaccatt  29940
catggaaatt aatctggata gtcccctcct ggagaccctc caggatggca gatgagcaga  30000
ctggccggct ttcaaagtct gctgacctct ataattgtgg ctcttcacat ggtccaacac  30060
actcttccct tttacatgtg tttcctcttt gaatatttcc accagcccct ctccctgacc  30120
tctctctgct ttgttacttt cctttgccca tttaatctac attttatgtt ttgtccagat  30180
taacatacct gtgtttcatc tgccaggcac tggcccaggc cctaggaata tggtggtgac  30240
caacacagag tggctgcttt catggagttt acaatctaca aagggacaaa aaggataaac  30300
aactttaaac tttaaaattt ggacaaactt ttataaatac tgcatttttc caataaaatg  30360
agataaacaa tggtataacc tacattgtac agaatctgtg tctccctaaa attaaagctt  30420
tgagataaaa ggagacaaga ggtattgttg gacttgaatt tgtcgtgcaa ataagattaa  30480
aaccttgaat attagccttt tgattgttgt ctctttttgc agtatgaggt agttgtgaat  30540
tctaggtcaa aacataaggg ttaaaaggct ggaaaaatta aataggccaa atgaaagaat  30600
tgtcttgcta aaatgtctat gtagatgata aaatgtcctt gtgcctcttt aacttcaatg  30660
atttgtgctg gatattttat aagcgtccat taggcaatag caaatttatt caactataag  30720
agaattacga aacacaacta tcataggaga tacttatttc cttccaacca ataagtaacc  30780
accagtgatg agaaggcaga aagtgacaag attaaccaag taagagagtt ggatacaaca  30840
ttcaactcca tttcttcatg tcccaataag agacaacgtt tgacctgccc tctcattcct  30900
aatcttgttg aatgaatcta gtacagaggt tcataaaaac cgtcaggtat ataatgccgg  30960
attttgtcaa caaacaataa caataatttt ttctttaaaa attattccag gccaggccgg  31020
gtgcggtggc tcatgcctgt aatcccagca ctttgggagg ctgaggcggg cggatcacga  31080
ggtcaggaga tcaagaccag tctggccaac atggtgaaac ccccatctct actaaaaata  31140
caaaaatcag ctgggcgtgg tggcagggac ctgtagtcgc agctactcgg gaggctgagg  31200
caggagaatc actttaacac gggaggcgga gattgcagng agctgagatc cagccaccgc  31260
accctagcct ggcaacagag caagattccg tctcaaaaaa aaaaaaaaaa gaaaagaaaa  31320
aaattattcc aggccaggtg tggtggctca cacctgtaat cccaacactt tnggtggcca  31380
aggtgggtgg accgcttgag ctcaggactt caaggccagc ctgagcaaca tggcgaaacc  31440
tggtctctac aagaaataca aaaattaacc aggcgtggta gtgagtgcct gtagtcccag  31500
ctcctcatcc gcctgtaatc ccaggcggag attgaagtga gccgagatgg caccactgca  31560
ttccatcctg ggtgacagag ccaaaccctg tctcaaaaaa taacaaaata cacaccaggg  31620
cctgtcaggg ggtgggaggg aaggggaggg agagcatgag gacaaatacc tagtgcatgt  31680
ggggcttaaa acctagatga tgggtcaata ggtgcagcaa accatcatgc cacatgcata  31740
cctatgtaac aaacctgcac attctgcaca tgtatcccag aacttaaatt taaaaataaa  31800
ataaaaataa taacataata aaataacaaa aaagtcttta catctgaaat aagtgtactt  31860
aaaattaaaa ataaaattaa agtacaaaaa cttaaaataa aaatcatttt agatatttcc  31920
tcagatttaa atggaggtca ttgaagctca aacacctggc tgcaaagtga tttgtaagac  31980
gaacacctac actctacaaa aagacttatg aataccctgc attggttgat gaacaagaac  32040
agtgagttat accttctgaa tagtgaatta aataaaatac tattaaagtt ttaaataatt  32100
gccaattgct ccatatttct ctgcatgtta gagtttagct agtgtttcca gggatgattt  32160
ttctgtattc ctcccagtca ggaatagcca gtcagtatta ctccatcagc cacagcacaa  32220
atgtctgatt gctctcttga ggtcgttagc ccagatactt gctagaaagg tatgattgct  32280
ggccaaatga gctctggcct ggtgcagccg tcttgccaat gtgcctaatg agagcgcgga  32340
aagacatttt attccaggca taagcaggcc agatcacagc tgcccaaagc tctctggctt  32400
tgattaagtt tgttgtgcta ttatgtaatg ggtacttgaa ccatattccg tgaatgaccg  32460
ttttccttcc tctttcgcca ctattctaag tatgttgtct gtatctaatg ttgccttgca  32520
gttagttgtt aaaatcaagc agaaaagaaa acaggcaaat attaaaacgt aaatagaaaa  32580
agttgttggt ggggaaaatg acttataatg cattattctg acataatgtc ttggggtcca  32640
ccaggagaat cgccccatca caattcagcc tctctctgtg ctaatgacgg ccttttcatc  32700
ctgtgctgtt agtgatgcat aagccaaatt gtgaccaggc agactagacc acatgtaagc  32760
agagaaccac gtctttgtag acattaattt aaaactcgtt ctaatcaaat atgttcattt  32820
atctgtacta tttttgatct atatcttaaa tcaaaacgaa gcttttttga cttctggttt  32880
ctgtttctgc ttgtaaagag cttggaagtt atcaatcctg tcttcataac aagaaaaatg  32940
ctgagcacac tgaaagtcag taactggaaa tcaacagtgt tttaaaagtt aattggttac  33000
aattttctca tattcttctc tcacctctgt agagttctgg tctacattgg aaatgctgga  33060
aaagtaggaa tatacagtac agagctttct tggcagcata acttaataca tgaaaaatga  33120
tttttaattt tagtttaacc tttaaactgg aatctgtagc acattggaaa aaaaaaacct  33180
aaaccagttg aacaaatttc aattttaaac atgttttcag gctttggaag cttactgaag  33240
aatgtggata gcaaatacag gaaaaattct gtgaatattt ttattcacat atgtaaacgt  33300
gaagttataa gacagaacaa tttccccatg tacaagcttc aaatttttag cagttagtta  33360
acattttcta ttcagtttta accattaagt tgtaatatta ttacaaatga tattagaaca  33420
catctttgct tttagtgctg tattataaat atttaaatta atgacattca gtgtaaattt  33480
ggtatttatc gtaatacaaa taagaacttt atttttagtt aattccatgt gttatttgta  33540
tttcttatct cacatttatt taaaattaca tttggtccct atcactcagg tatgtttctt  33600
ccctcccacg tagacctaat cggatttttt aaaattggat tttaatctgc ctttataaac  33660
aaacgtcaat tatttatttc caatcttggt tgatcttttt attccgagat tatttactag  33720
ttcattcagc cttcctatta aaaataaata aataaataaa taattgctct tgtagctctt  33780
ctgaggtaga ctgaccaggt ctaccttatt gttaattttt gcattttcat ttttattgaa  33840
tatgtatgat gatgcagata tgaaccatgt gcatatctca gaataggagg aaaaatatct  33900
tagtactttt gccaaatgct tggttctaat ttttggacta ttatgaattt tttatgtcat  33960
aactattatc ttaacattat gcgaacttct agcccttttg cttcaatttc ctttgaaaag  34020
atttccttcc aataaatctt taaaatatgg gtgacaaaac taaaagaccc tcagaggaaa  34080
catatttctg gtatgacata ttttgtgtac tctttaggac aattgaaaag cttctaatta  34140
acatttcttt agcgccttag tggtgatcag cagtatcatc actgccctag tgcatccatg  34200
gaagttgagg tccagggtgt actgactcac acaggttacc taggtaagaa gtaatggatg  34260
actggaatgt taggaactgt aaatgacagc taactgtggc aaagcgtagg gttttgtttt  34320
tttttttctt gtcttgtctt ttttttttga gacagagtct tgctctgtcc ccgaggctgg  34380
agtgcggtgg tgtgatctcg gctcactgca ccctctgcct cccaggttca agcaattctc  34440
ctgcctcagc ctcccaagta gctgggatta caggtacatg ccaccaggcc tggataattt  34500
ttgtattttt agtagagaca aggtttcacc atgttggcca ggttggtctc aagctcctga  34560
cctcatgatc cacctgcctt ggcctcccga agtgctggaa ttacaggcat gagccactgc  34620
gcccggcctt tcttttcttc ttaagacaac taatggaaaa taaacttcca agaagctctt  34680
ttgacctgac ctcactgctc ctcaaaggca gaatgctgat tcacaggctg aggggtatct  34740
gaccaggttt ctttgctacc cttactctca gcctacctgg aaattgccga gcgcaggggg  34800
cgcagggagt gctgtagttg gcgtgtggac tgagcgtcct gggaactgtt ctgctgtagt  34860
acctacactt tcctgccaat gtcagcatcc ggcttgtcaa cacttctttt ccatttgtga  34920
atactatagt gaaagccttc acctctcctt tctttgaagt attctctgtt cagaacttgg  34980
aactttagaa attttctaca tttaaggaaa catatttcaa ctatgattct ttattactta  35040
taaaaaatta acttagaaga tatatgtaaa catgtgtatg gtttaaggta acaaagtgag  35100
tttaccaata tggcaagttg tgccaaaaga gtgcttaagt gtaaaaaaca aacaaagaaa  35160
ccaaaatcaa aattaaagta gctcaaaaac ataaagttta taaatatttt taaggcattt  35220
ataattttaa aaaagtcctt ttatgtttgt cccatgttct ggaatagcaa ataaaaaatg  35280
tggtttttgc tttattttgt tttattgcct tgatatgcca cgtggcaagc ctcaggctgg  35340
gtgtgtggag cacatgactt gagtgtgtgg acaagttgtg ttgaagatta ttattacagg  35400
cacaatgtta cagcacagtc tatcagggaa aaatacttaa gtttattttt ttgaggctga  35460
gcgtggtggc ttatgcctgt aatcccagct ccttgggagg ctgaggcaga aaattggttg  35520
aacccaggag gtgaaggctg cagtgagcca agactgtacc actgcactcc agcctgggtg  35580
acagggcgag actccatctc agaaaaagaa aaaaaggaaa ggaagaaaga aagagagaga  35640
aaaaaaagag aaagaaagga aggaaggagg gaaggaagga aggaaggaag gaaggaagga  35700
aggaaggaag gaaggaagga aggaaagaaa gaaagaagaa aaagaaaaag aaggaaggaa  35760
ggaaaagaag aggaagaaga agaaggaggg aaggaaggaa ggaggatcgg agggagaaaa  35820
catggtttac agaggtttta ttcactagga tggtaacatc ctcccaagta atttagttct  35880
agctgcttta tcgtttagta aatctctgca attcaggatg cacctttctt gctgttgctg  35940
gtctgctgat ccacatgatc ttatttcatg tatgtggatc atccagccac cgtgacaaat  36000
gttcattatg ttgagtccag atgtccacct taagagtaca cacccctcgc tgctgctttt  36060
tttttttaat tatgtcacac taaatacatt tactttatga taactactgt tggggtacaa  36120
tttactctta ccacagaacc agctctcagt taagaagaaa gtgctgagat ggtgtgggga  36180
aatttggtga agaaaaacat tatagtaagt tacagtcaat ctcactactg acctttggct  36240
aaaatttttt ttaatatgtg gctaaaatct gcataacaga tggtatatct gagtgaagag  36300
attattagag gatgagagaa actgagagtt caccaaaaat aaaaactaat aattgcaata  36360
tagattttgc catcaaaagt gacctcaaat gcaagtttgt agctgaattg aagaggtggc  36420
cactttgttc ttaatctggt ggctgctgct taggtttcat tgtagaggct actgagctgt  36480
tttgcaagtt tgtattatct gtctcatgat ccagacagaa ccagagtcta ccaacgtgga  36540
ttaagaatta gtctgttttc ttctgtgttt ttctatgaat atactgaatg tctcatcttg  36600
attcagaaga aaaacctgaa agcttaccca aaaacaaaca aacaaacaaa caaacaaaca  36660
aaaaaaaccc tgtgtgtggt ttgtcttggg acagttcaga aggcagtcat ttaatttcgt  36720
ttgggaacat tttgcactat ttatttcatt caaaatatgt taatttattt tcgattttaa  36780
ttaatgtact tttgtaatgg cttattccgc aagcagagat agcctccctt cccccaaatt  36840
ctaagatatg catgtataca gtcatcttac tacatagcag gaattttaaa aagaaataag  36900
cttttctttc cagtgcctag ttgttaaaac agcaaaatga taaaaattta tgtaatggta  36960
ctattgagct gtctactgtg tggcaaatac tttatacaaa taagcaatgt cttaggatct  37020
aggcttttag ccttcaaaaa tctttaaaga agaatgaaat gtcattttta agtcttgtat  37080
ttgatctcaa gtgaagagat tcaattcatt tcaaaaatac ttaatataaa ttatatgcta  37140
gaccctgtgc taggcactgc agggcaaaag ctgaagaatc agagaggctg tcaagttaga  37200
aaagtgtttc tcaattggca atttttccaa caagggccac tggtgaatgt ctacaagtat  37260
ttttggttgg gggttgcagg gactgttgga atttagtggg tagaggtcag gggtgtggct  37320
acacatcttg caatgcatag gacagacctt cccattaaag catcatccac ctgcagatgt  37380
cactagtacc aaacttacat tttgtgtagc ttcagcaagt tctctcttaa actattcatc  37440
gctctctttt ttcattagtt ctgcagttta ataagaatat tgccctatgg agcagttcta  37500
gcactttggg aggccgaggt gagtggatca cctgaggtca ggagttcgag gccagcctgg  37560
ccaacatgac gaaaccctgt ctctactaaa aatacaaaac ttagccaggc gtggtggcat  37620
gtgcctgtag tcccagctac ttggggaggc tgaggcagga gaatcacttg aatctggagg  37680
cagaggttgc agtgcgttga gatcaagcca ctgcactcca gcctgggtga cagagcaaga  37740
caccgtctcn naaaaaaaaa aaatagctgg agattaggca agttgtatat atgtaaacat  37800
aaaaagacag aaacaaataa aaaccaatat agcacaaccc accccatctt gaacaagttg  37860
tacttctaat catgcacatg tgaaaacatc aagctcttat ttgaccacca ttcaggattg  37920
aatatttagt cattgcaaat gtagttgagc aaataagtat ctatttggag tttaggatta  37980
ggatcataca cttccacagt taaatctact gactgacagt agacagttca ttgagacaca  38040
gatacagcat agtcatccat gtatagtggt tgagtaacgt gtaagtttct tttcccttcc  38100
aactgaaggg gatgctcaaa ctgagattta accaggacaa agtcaatcag cttctctctg  38160
aaaagggtga tgtctgatca gagtcagctg gaggatcaga aagagtcatt tagaaaagtc  38220
tgagggaaac tgatgatctt gagtaacaag aaagttgcca ttttgttcac cacagatgaa  38280
agtctattcc cagacagtaa atgaagccgg ataatcaggc caatttcata aacagtagat  38340
cagattggaa gagttaaagg accagataag aaaacaagca cctgtagcag gatgacccga  38400
gtaacacaaa ggatgattca cgcaaagggg gtgcaaggac taattctgca gactcctata  38460
gcttgttgtg ccttgcaagc ccaagagagg ttcccaaagg gactgaagcc tggcagcatc  38520
cagtgaatgg gctctagcat acctggtaag gagctgtctc agaagatggg gtgttccata  38580
tccctggagg ggttaaagtt caagaacatt gctgaggatc caaacactgg gagagagaaa  38640
gaaatggatg gtcataaaat aaatcctctt tgttctttta aaaattctga gtgtgggagt  38700
gaaggtgatt tttcagacca agcccttggg tactgactca ttcttattcc actgtctcgg  38760
gcttacatct ccaattctaa cttcccaact tctgtcatgg cagatcaggt attaccattg  38820
ttagaatagt actataggta ttttgtgttt ggagagaggt ttagtggtag gaccccaggt  38880
ttgtagtgtg ttgctagtta tcatcacaat tttatgaccc tctcacttga gagtggaatg  38940
acaatgtggt tatgtaacct aagactagaa gaaacaaatg ggagtactcc caaaacacaa  39000
atatctcacc tcttttttca tgggaaaaga gtcagcagaa gagggcaaag cggtaaataa  39060
aatcctaaag gtaatcaaaa cagatgggaa tataattttg ttcagagcta taaaaaatat  39120
cctctactat tctcaataca ggcagtgtgt agaaagtttc aaggttagta tttatcttct  39180
aaacatagac ttgtggtctt cttatttaat caattcaaac caccagtgga agaggtcaga  39240
aagaatgaat gaaatcagga gaactgatta tcatgagtat cattgttgtg attgcatttc  39300
ttgcacagct ttaatttgtg ccttgagagt ttggggtctg agaaagtagt gctattccaa  39360
gagctctcca gggatatttt tggaacaggc cttattgttc tctaaaaaat taatgcgtta  39420
tattcccagg tgctgttgta gcatcatttt tcatttaaca aaaatatggt cgtttagcca  39480
gaaattttag ttctataatt aaaatggact aaaaatattc tgtagcacat ctagaaaaaa  39540
tattttaaat gtatcaatgt tcttcctaga aattttccat gttggatcaa acagtagatg  39600
aagacttttc tgtgtgtata gcatgggttt ttatgtttat atatgagtgt gcaggtgttt  39660
taagagaatt ttgaaaatca gcaaagcaaa gtcaattcac tacaaaatag tttccaaatt  39720
atctgtgcag tattaatatt gaggaagaat taatcaaaaa gcaaatattt gagaaatgct  39780
ttcctatgtc tgtaggctac aaaatcattg tttaatttat caacaatctt tgagtgctcc  39840
tcagtgtctg gtacagaaat gaaagataca gttttaactt tagagtgctc acacctactg  39900
agggaaacaa acaaggtaga gaattcagta tgacgagtga catgagacag ttgaatggga  39960
ggctctctgg gagtactaag ggccattgcc tagtgtagct gagggcacag aggagctgag  40020
ctgggcagcc caggagtctg tcaagagggc cagagggaag cagtgcaggg ccagcagcga  40080
gagcgggact gtgcaaaaga agtttcagta gctacagttt ctttctcagg gtcctccact  40140
tcccaaagaa aatgaaagga acatacattt gatttttgtc agtttaaata ttggtcgacc  40200
attggaaaac catttttgaa aagtgatttc ttttgctatg tttggcaaag ccaggagtag  40260
taaagagatg aggaaggacc atcttcgtcc attgcctttg cctttgtaac tgttacttct  40320
tcacagcctt tctacccagt gtagttcacg tatgggaaac atttctttcc atcgtcagcg  40380
tcttcctggg gagtgttttg gttatacttt cacgaatgtc tcacctcttt gtgtcaacaa  40440
acccttctct ttgagctgta ctgtgggttt ctgtttcttt cctttttntc ctttgtccaa  40500
ttagaaaaaa aaatggagta gaagtttcaa ggctactagt tcaatgtgct cttttttact  40560
tgactccaaa tgacatcttg cttgcagatg tgattaagaa agatctggac agggagaggg  40620
aggataattt tcaatgttcc tctcaaattt aatcttatag tgacaagctc catattctac  40680
atgaaaatgc tcagttaata cagctattaa acttgaatgg tagataatag tggatttctg  40740
tagccactgt ttggtttcat tcaaaaacct agaggaaaat aagggatata cattataaat  40800
tgtttgttta atgttaaaaa tatgtttcat attcagtgca cataaagcaa aggtattgtc  40860
cagtgttagt acctatgaat catcaataaa aacagttgct tctgtttgct gttgacattt  40920
tatgtatgtg ttgttcctct ctgaaccttt ttcttaaaag tcaactttta agaaacttat  40980
aagtttactg tggagagcct atgaacagat gcatgagggg gcgcctgttc atatggataa  41040
gatagggcta taaatgccct tatcttgcca gggctcttct aggcctcttt agggttaagg  41100
catactccct tctgagaatt tgtgttgtaa ccggttgtct agcttcacgt cctgtttcta  41160
tggattgttt gtaaccagct tttgctgcaa ctgttactgc tgattaatac cttgctaatc  41220
ataggttatg gaaagactgt tttctgtttt aaggctctgt tagaaattgc tgatgcacac  41280
aatattgtaa attcttatct ctgtatactg tacttctgca tacagatatt atgttaaaga  41340
attacttcat ccccatgtga ccatctcact tcataatcaa atgactctaa atccctcact  41400
aaactacccc caccctcact aaacttaaca ataaatgctg gtatatccag tacgttggcg  41460
gcatcacagg accagaaggc agtgatcccc ctggacccag ctttcactaa aaaaaaaaaa  41520
aaaaaaaaaa agaaacaata aacttagcca ttataatccc tcagaaaaac attaactata  41580
tttaaggata ataagagaaa ataatctctt tttaacatac ttattgatac ataataattg  41640
tacatattta tggggtacct gtgatatttt gttttatgga taaaatgtgt aattatcaaa  41700
tcaagatatt taggatatcc ataacctcaa gcatttatca tttctatgtg ttgggaacat  41760
ttcaaggcct ctctgctagc tattttgaaa tacacaatac attgttgtta actataatca  41820
ccctcgtctg ccatggaaca ttacaactta ttccttctat ctaactctat gtttgtaccc  41880
attaataatt tctttttaaa gccccagtct caatcaagag aaatataaat agcatggtaa  41940
aaaaaaattt tttttgacct gatgatatgg gttcaatttc tggttctacc actttccacc  42000
ttggagacct tcattaacca gtgaccttca cttttctttt ctgtaagatg gtattgataa  42060
tatctgccct catccccact tcgccatttg cctagctaat aagacagaga tttccttagc  42120
atgttgtgtt aaagaggcta gaaactcaac atgctttaca aataccagct gtatgacaag  42180
gagttacagt accaatgtac aaaatatgat ttttaaaatg aaaggcagga catttatgaa  42240
gttatattct atagaaagta tattagcaca cattaatgca taataggcga taggactgca  42300
ctttgcttct ttctcttagc ttttctttcc agcctctttt tctcccttgt catcaagtct  42360
gcggctggac ttgccttctg ttctgcatgc cttggtgttt gctgttgctc tgattctgct  42420
ttctcatgca caggctcaaa gaaacagtga ggctgcccca acctgtgcaa ctctcctctt  42480
tgtttggata cttggtcata tgcacattct agtttaaatt tctgtgtaac taaaacatgt  42540
atgagtggag attggtttta tattctgtaa taataaaact tatttataga agtagaattt  42600
attgaggtac aaatgtttac cagttttatg aataacaact tatatttatt ttataaacaa  42660
cttcaatggt atatgtgtgt gtgttttctc acaaaagcat attgagcaat tattttcaat  42720
tttatagtca taaatgatac ctgaaatatc ttaagaacct accctgtgat ttacaggaat  42780
taagtcatta aatccttaca acacagtaaa gtctgtgtta tttcccattt tacagatgga  42840
gaaactaact acagaaagac tattaaagag gcaagatatc atcacagttg gatgtgtggg  42900
gctttgtacc agaatgactg agttaattcc agttccctta attattatct ttgcatcctc  42960
agacaagtca ctttatcttt atatgcttta gtttccctgt ctgtaaaaca tcttatagtg  43020
ttgttaggat taaacacatc ttttccctac atggcatttt aggttctctt aaccaatgtt  43080
aaaaaatcta tccacatatt tttagctttc ctttctttcc attactagaa gtactttcta  43140
tgaggtaatt ctcccagaaa atacaaagtc ctatttggtg attcactgcc ttacattctg  43200
gtgttcggta acaccatgga atccaaagac aagctccatc atatcaattg tggagcctga  43260
gatactttac tctccctgtg agaaagtgat ttcaaatgaa actcagttct cccatttatt  43320
tcattttggt taaaactata gcaggtgctt ttcagcttat tgaatgtgtt aggctccaag  43380
tggcaagctt aaatggtaca tatccttttt ttaattatac atatatatac ttggtttgac  43440
tgtttatttc cttttccaca ttattatttg catttaacag ctaaaggtat aatatcaaat  43500
tattttattg ttagatgttg aaattaccct ggcttgaagt cagaaacaac tttattaaaa  43560
ttttaagaga acagtaaaat gtgttgcatg tgattctaat caatttttga agcacttttg  43620
tcattgagaa aataagtatg gataaatatt gattgttttt ctggaaaatg ctttcttatt  43680
tcaaaagtca gctgtgactc agtctgtcct cctctgtcat gacaggaact agtatattca  43740
ccgtctatga ggccgcctca caggaaggct gggtgttcct catgtacaga gcaattgaca  43800
gctttccccg ttggcgttcc tacttctatt tcatcactct cattttcttc ctcgcctggc  43860
ttgtgaaggt actgcgaaga attgtactaa gaaagtctat gttctgtgat agttctgcag  43920
atcttttgtt tggttttggt tgccctctgc tttgtcattc ttagactttg gtaaatgtgg  43980
tttgtgattt ttttcagaac gtgtttattg ctgttatcat tgaaacattt gcagaaatca  44040
gagtacagtt tcaacaaatg tggggatcga gaagcagcac tacctcaaca gccaccaccc  44100
aggtacgcta tcagcaagag gatgttataa cccattcgag catgcacatg tctcaccctc  44160
accatcagtg gaccttgggg aagctcttgc atgatgggct tctatagtct gactcaggaa  44220
gctgtttaaa aatacagttg ccagtcaggc acagtggctc atgcttgtaa ttccagcact  44280
ttgggaggct gagggagagg gattgcttga gcccaggagt ttgagatcag cctaggtaat  44340
gtagcaagac cctgtctcta caaaaaaatt ttaaaaatta gccaagagta gtggcatgag  44400
cttgtagtcc cagctactca gtaggctgag atgggaggat cacttgagct caggaggtca  44460
aaggtacagt gagctgcaat cacaacactg caccccagcc tgggtgacag agcaagatcc  44520
tatccccaaa aaacataaaa gaaaataaaa taaaacaggt tcaaaggccc aaacacagaa  44580
caatcaaatc agagcttcca ggcagtgagg taatgacacc tatattttgt aacagctccg  44640
tgggtggttt tgatacaaaa ccaagatcgt caaccacatt tattacatac ctttgattct  44700
gacatcacaa atcctcaaat ggcttgtgga taaaatgcaa ccactatgga atttcttact  44760
tttatgggta tttattcatg tacttgcaag cctatgtaat gtctatgtgt aggattagaa  44820
ttttgtaatg gaaaatatat ttcattcaga acaaaccaca gtacaataaa ctatgaaaaa  44880
gatccctcaa ccccaaatgc atgtttgtga ttttttaaag aatccctata tattcagaag  44940
gattcccata agttccatag caatattgtt tccataaaac cataaggctc ctgagaattt  45000
gaaggtgggc tacagatttg ctaaaagcag cagggcagtt attacaaaag agggcaattc  45060
agatccaatg cctttgtttt tatttttggt tttgtttcac gtgtgtgttt ttgtggtgtt  45120
aaaaaaagga agggcagatt tgtgtatctt cttctagcgt gaatctttat aaaagagaga  45180
gaaaatataa attccagaat caggaataaa atgatataat gccttgtaat tattataata  45240
ttaaattcta aaggatattt aacaactttg taaacactta caaatactgt taagacaaag  45300
gtatctatca aggagccgag gtgtacaaat tttacttttg aaaaccctca agttgagctt  45360
ttaataatta tttgttaaaa tgcaattaaa cacactaatt tgggaaaagc ctggtggtgt  45420
tgaggcatct ttatgatgct gtaaaagtct gaattgtcca gtcaattcat tatagatgaa  45480
atagtgtcag tcttattcag tttttacaaa caactgttca aacttccatg aaaggttttt  45540
tgaatatgct atccaggtta tatcagaaat gccatgtaga aaagccttca agaaatcaac  45600
catagcaagt tctcatctcc tctctcctct ctttttgcaa actatgagag ataagaaagt  45660
tcccggtcca ttccgaggtg gcagcctcta gaaggacatg ttttcagtta tgactttgag  45720
acctaaatgg aatatggaac tatgatctca gcccttaact cacatgcagt gttcctggag  45780
atgacctaag attcctttaa aaccatagta tgtttatgga gtaactctca cgtataaaat  45840
cacagctgga aaaaatagtg tttggaagca ccaccaagtc aggcaatggt tctaatagaa  45900
agggaaatgt gaagagactt ggaacaaagt tgtacagaat cattttgatg caaaattgta  45960
cttaatcaag aggaataaat tggtaattca gaggtaatgc gtctagatat tcagcagtgg  46020
taatcataca gagaattgtg aaaaaccttc attaagaaaa atgctatagc tgaggacctg  46080
gttgctaagc aaccaaagct cctgctgtca gcctctgggt gaaacaccac tcaggcagcc  46140
tagcaacgag cttcaggccc cgcccaccct ggctagccac ttgcgagtgg gccctctgat  46200
gcttttatgt gtagagaagg gagagacata atttgccatg atgctattat gtttgtaaaa  46260
tatgaccaaa ttccgtgaac agggacttct cattcagtgg tttaaaacac tagatcacaa  46320
gttactaatt tgaaggaaat aaaataaaga tgattattat aatgcacaca gcttttcaaa  46380
catggaagta cattcttgcc tttctctagc atatggaaaa tttgcagttg ttaaatatag  46440
gctattctca tcaaaggact aaagggtcct gggcttgttg gacttgttga tgtctaagtc  46500
tgcagacttc ccataacagc catgtgtata gaaaatatgt gnnnnnnnnn nnnnnnntat  46560
atatatatat atatatatat atgcacattt tcagaacaaa gaaggggctt tctgttatat  46620
taggcagctc actaggaact ggctctgaca gggaccattt caagggaggc gaaaggaaat  46680
ctgtgatgag aactgtttct ttaaaataac gaagcaatat ttttcaattg aatggtcacc  46740
accaaatgcc tccaagacac agcataggaa caaattacag agacattaat gccaagggtc  46800
tttaggagac cataatataa catgtaactg gaaaacagaa ggaaaatgat gtagaaaatt  46860
tcaaattact aaatattgac tctggcctct gagagccttg tgatttcata cctgcctgat  46920
tcttagacgt gggtaactat tgccttgtgc tcagttgtgg attgggttga aggataagtg  46980
attcatacac ccatgatata ataccctgct ttgttaatcc actatagggt tacccaggcc  47040
acaacttttt agtgatgtcc catgactgga tgttgggatg tgcaggtgag ctgaaagacg  47100
aagtcctgag taccgtatct cactaaccca gacctttact cccattattt agatgcttta  47160
cttcagatac ctgttatgag ccccatggtc ctctgatcta gactagctca tgatggagat  47220
gagcttatcc caactttgcc ttgagtagaa ctcaaagaac tgctaaattt tagagccaca  47280
caaggctact tttctgttaa aatggtagga gacagaaagc aggcttctga cagtcaatac  47340
atatctaact tttataaatg aatcataatc caataggatc atattgaagg tttggtaaat  47400
aattaaatat tctgattgca caaagacagc aatcatttct gggtctgtta ttatctctga  47460
ttgagcactc ttgctgacat gtgttttctg aattaatatc ccctaattaa cagagaagac  47520
tgataaaggt agaactggtg tgggaagaat gggcactttt gagtttttct cctttgggtt  47580
tccatcaaca ttcttagaat atgggttata caatgcctaa agcaacttgt gcataaatgt  47640
tcagtgctgg gttaaaaagt agagaaaaaa tggatgaaaa gacacatgat ccaaaatgga  47700
aagaatttct cctccaaaaa gaaagctaca tataacttaa tgctcaaaga aaatacttta  47760
gcaaaaatgt gtttactgtg ttccaagacc atttatttcc tcatgaatat acatcattaa  47820
aatatgtgag aaaacaattc aattaatgca tttcagggaa gggtgcttct agcatggtgt  47880
aataatgagt gccttctaat aagaaaccat aataatagaa tagtacaatc atcataggaa  47940
accataaatg agaattaaat tttgtgaggt tgcatcattg aatatattat ttcgtaatga  48000
aatcaagcca ggtatccact ttcactattt tctgtcatag tgactattag ctattttttg  48060
aaaaaccata aattttcaaa gaatccaaag agcatgcaaa ttgcaaagta aattttagat  48120
tttctctgca ttactgtgta tgtggatgtg tgtgtgcctg tcttgagttt ggaattctaa  48180
ttcagctgct agtgattctc cattaccaag attctttctc ttaccactat ccattagata  48240
acctgttatt catgttgttg atgatgatga tattatgcct ataatggaac aatcccagaa  48300
gcatttttag ctactttaca aaccaaccga ccagttataa aactgtagca gttgcaaatg  48360
gacaggcctg agagaattct caaagttgaa atctccatgc gcttccaaat gattgtgcta  48420
agaggagagt gccatggaaa ttcatttgtg ttattggtga gattctacta attcagaaca  48480
tcttcttaca gtcactccca tatattgaga tctgcactag tctaatggct ttacaaactg  48540
tcttatttaa ttttcataat aatactgtga agtgggcact attaatgtct ccactttgca  48600
tgtaaaaaat gacaatgatt ggaaagttaa ttatctaacc caatgttata taactggcta  48660
gtggtaaaac tgggactcaa aaccaggttg ctcagctgca agagcctttt tattcagcat  48720
gagatgctac cacctttcaa tttagccatt acaagccctg ctgtcaacat gctgtctttg  48780
ttctggcctc atgttaactt ttcttttctt aaaaaagaca gtatttattg ctggctgaaa  48840
gggacattcg catacattgt tgccaagagt atgaattaaa acatcttttc cagaaaaccg  48900
tttggcaata tgtatccaaa agtaaaacat acatactatc tgaccaagaa agtccgcttt  48960
tagaaatgta tcctaagaaa aattgggggc agtagccaag ggcatatgtt tgaggatgtt  49020
tatgaggcat tatggcaatt ttttaaaaat ggaaacaatc ttagtctcta gcaataagtt  49080
atcgattata aattatgaaa ttggaataaa tgcaaaccat taaaataaga attgaacttt  49140
attgatgtga agatatgctg atgacatatt agtacaaaaa aagatcctat gtttgtctgt  49200
gggatgcagg tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtataatac ctggaatgtt  49260
aactgtaaaa tgttagtggt ggtgtctctg gggaatgggt ttaagctgnt tcttttgcaa  49320
ctcatncctc attttctaag cctttaatag taaaatnatt taattataga atgagaaagg  49380
aaaattacat cagtnnnntn nnaaaaanna aattaatgga cattctaaca gaaaccacgt  49440
atactagtta agttacattc agttgcaagg gacaaaaaag cccaaaataa gttgcttagg  49500
tgacgtatgc gatgaggaat cccattctct ctcatataaa gttggaggtg ctcattcagc  49560
atggtatggt tgtctgtgtt gccacggatc cagacacctt ccttcctgtt ccactttgca  49620
cagcccccat taccacagtc accttgtaga ctagcatggc tgctgtagct ctaaccctca  49680
catccatatc ccagagagca ggaagaagaa ggaaatacag gaaaagaggg tttctgcttg  49740
catcctatag tcctgtatgt agttacatgg tcaagctcag cttcaaaaaa agggcaagaa  49800
ctggcctttt ttcttggtag cctagtggcc ccatacagat tctctttgta aaacagggaa  49860
aagagataca aaggaaagac tggcagtccc tgccacgctc cccgcaagga tttgagtctc  49920
tgaggattct tggcttctgc tagctagccc agcttctgtc tcaaagatct actgtaatat  49980
taaccaatct aaatgttgta taattcaggg gattaaagag aaattgaacg tttttgcatt  50040
tcctttactt atttcataca aataagtgac cttgggagaa cacttttact gaaaattaaa  50100
ttgattcttt tgattttggt ctattgaaaa aaaaatttaa gagagaaaat tagtctgcta  50160
ctgatcaaag tcaatatatg ccccagggat cctttatgcc acaattagag agtataggat  50220
gtatcaacag agggttttta ttaataactg gtgactggca atgctggttt tgtcttttat  50280
ccttaaaatg aggcttccag aattttgaca gaaactttac aaggtcctat aacaggtttg  50340
catctccact gatgtctata ttctcagaat gagctattca ggaagaatat gcttgattca  50400
ccccaaaaag agtttttgca gtttattcta aagaaaatca gaatcctgta aatggacagc  50460
tgagatgagc aatttgcagt tggcatcttt gtcaaaggag ctttatgtaa atgtgcacct  50520
taattttgtc atttaaaaat acatatagga ggcagaagct gggggattgc ctgagctcag  50580
gagttcaaaa ccaccctgga caacaagctg aaaccctctg tctagtaaaa aaaaaaatac  50640
aaaaattagt tgggcattgt ggcgggtgcc tgtagtccca gctactcggg aggctgagac  50700
aggaaaattg cttgaacccg ggaggtggag gttggagtga gtggagatca cgcccctaca  50760
ctccagcctg ggcgacagag caggactcta tctcccccca aaaataaata aataataaaa  50820
atacatatag ggactgtgat ttttggcaac tgtctctcac cacctcactc attttataga  50880
aggcaagttt attttccaca aaggatctac caccactact accagggatt tgaaactcta  50940
attacaaatc ctaggtaatg ggatctttgc atcatctcat tcgtatttcc atcagcagtt  51000
accccttcga atacagggtc agactaacag gaggacataa ataagggtga caaaggaaac  51060
atttatttct gtaaaacagc gacctcaggy aggaatgaaa cagtgagcac ttgtagttag  51120
tatcattatt tagaaaaaca aaaatgttta attttgccct attcctacca tacacacata  51180
cacacacact cgctcctaag aactagaaag aaaaatatgt tagtgggaaa atacgtgaaa  51240
gtgggaaatg tcttccagct gggtgtaata ttgacacata ggtaatatgt gatgatacct  51300
aggagataat aggtacctag gagataataa cctaggtatc taattcaatg gatttcagat  51360
ttagtgggcc tgtagcatct tgaatttcat cacttgggtc tttaatccaa aagaaactac  51420
ttgttccctt cataatacgt acataaaatt tctgctgagc aggttaattg ctgcctagtt  51480
aaaataatta cacaaagtgt attaagcaat gtggcaatct tctaccatta aaataacacc  51540
agttctttcc ctatgccaca cgcacacttc ttattttatg gatcctgaga atatttttat  51600
taggtcagtg ctcctgttca gccttgaggg taagatacca tggtagtcca agccagggag  51660
tggaagactg tccactaaat aaaaataaaa atttgcaacc tatagtaaaa acacaccaga  51720
cacaatgctt ttaaattctg attttcattt tctcccagat ctaatagata tttatcaata  51780
taatggggat aaaatactaa agtatttctc ttgtggagaa gaatatttga gcaattatat  51840
gcaaagcata tgcaagacag aaagtgcctg acatagcaag tagtcaataa actcaagtta  51900
ttatcattgt tcttttttca ttcatttaag ctttcaatgt taaagaacta taattgaaat  51960
gacttcattc caaatataaa tccataagaa gacaaatttt tgataacata aaaatataca  52020
aagctggaga catagagttc tcaatgttcc atattaaatg tctctgactc atctcccttc  52080
tttgtcttga agatgtttca tgaagatgct gctggaggtt ggcagctggt agctgtggat  52140
gtcaacaagc cccagggacg cgccccagcc tgcctccagg tgcagtacaa tgacattttt  52200
aaaaatcgcc cagcaaaggt ctttgaattt tatttcatcc aagaaaatcc acagctcttt  52260
aagctctaga tttgtccaaa tttaaaatcc tgaagttaga gatggtattt cactccttcc  52320
tctattccca ggacctagct tttttttttt taacatacac aatagggatt tgataagttt  52380
ctgatggctg caggcatgta agagcatttc agtggtattg aatcaatgaa gaattttgtt  52440
gacatgtgaa atcttataaa aatattcttt accgaaggac tgagttatgt ggcagtgggc  52500
aaattcattg tttcatacct ccccgagtaa ctgggaaaaa tatgttaata catagtctct  52560
ctgtttttct gcatttggaa gctttcagag gaacataatg tagaggtgtt tctttagcaa  52620
agtgcactga tagcaaacat aaggattgca ggtggggcct gagagtcctc atgagataga  52680
ttctcacagt gattagaaga tggagtctca cgtccctgcc tgtgaacttt ctggaaaaac  52740
catcttctcc aagctgccat tgacaacaat atggataaca ataataacaa taaggcccaa  52800
taaactcctt tatctcttct tcagggggcc atactgacat cttctcttcc ttggtttccc  52860
ctccttgccc cctaaatatc agtaactcat tcaaaataat gtcaccttac caagagcagc  52920
acccctaact ttccataata ttttcacttt cattttccct ccaagcagcc cactcgtagg  52980
accggagaat tgattcttcc acctggagaa ttttattttc tttagccttt ttggttttca  53040
gtgacaaatc ctcttctcgc aaggggtggt ttccatagtt gtttatatcc tgccctcata  53100
atttggagaa gtgttcacat ctgccgtggg atgagactgt atctcttttc tttcttttgg  53160
gtctttctcc agatagggac ttcttatgca actcaaggat gggtacatga aaaataaaat  53220
tgtactctga gccattactg tgggctatgt ttatatggcc attttaccat agagttattt  53280
acttcttttt gtttctattt gtattgaggt gtgattaaca aataaaattg taaatactta  53340
aggtatacaa tgtgatgatt tgatatatgt acacagtgta aaacgattgt tgcaaccaag  53400
ctaattaaca cacccatcac cgcatatatt cagtagttac ctctgtgtgt gtggggtggg  53460
gggtaacact taagatctaa tctcctagca aatctcatgt atacaataca gtattattaa  53520
ccattaatga atcactttgt ttattagatc ctgagaactt ggccatcttt tgactgataa  53580
ctaatatctc cccatttcta ccccctgtcc ccagcccctg gtaaccacaa tcctactctc  53640
tgcttcaatg aatttgactt tttgagattc catatataaa tgagattatg cggtgtttgt  53700
ctttctgtgt ctagttcatt tcacttagca taacgtcctc caggcttatc catatagttg  53760
tcaatggcag gatttttttc tttattatgg ctgagtaata tttcattgta tgtctatacc  53820
acattttttt tatccattca tccatcagta gacacttagg ttgttccctg tcttgaccat  53880
tgtgaataac gctgcagtaa acacggggct gcagatgtct ctttgagata ctgatttcat  53940
ttcctttggg catatatcca gaagtgggat tgtgggatca tatggtagtt ctatttttaa  54000
ttttttggga aacctccata ctgcgtttca gaatggctct accaatttaa atccccacca  54060
acagtgtaaa agggttatct tttctttatg cctttgccaa atagttatct tttgtctttt  54120
tgatggtgac cattgtaaca gatatgaggt gatatctcaa tgtggtttaa atttgtattt  54180
ccctgataat tagggatcgt atgcactttt tcatatacct attggccatt catatgtctt  54240
ctttggaaaa aaatctactc agaatttgct catttataat cagattattt gcattttgtg  54300
tttgtttttg ttttttagtt tgggggcttt ttgttattga gttgtatgag ttctttgcat  54360
cttttgaata ttatctcctt ttcagaaata tggtgttcca attttcccct gttccataga  54420
ctgccttttc attttgttta ttgttagtta tttatttctg tcagtttaaa aaaatggagg  54480
gcaataagta gaaaagctta caatgaatat tgataagtat tattttgtgg tcctccttcc  54540
atcctatatt tgatgttgac tatgctgcta atataaaact actacaacta cctttactcc  54600
tactatcact actaatagta ataacaataa tgacaaagat tatagtacta gcttcttacc  54660
taaaaagcac ttttattgac attatttttt aatccatcaa ctgatattta ctgagtacca  54720
actatgtgct agacactaag atagtcttga aagaaacatg cacagtctcc acactcatag  54780
agcttacagt atgcttgaga gtgggaggga aaaaggcagc attgagctag caatcacaag  54840
agtgatgtgg gttttgaaag aagtaatgca agatgcaatg agaatatata aattggggtc  54900
cgctttgaga ggtcagggaa ggttttagtg cataatctta aaatcaaaac cttgagtaat  54960
tccagcattt tgggaggctg aggcaggcag atcacctgag gtcatgagtt tgagaccagc  55020
ctggccaaca tggtgaaacc ccatctctac taaaaatcca aatattaccc aggtgttgtg  55080
gtgcacgcct gtaatcccag ctacttggga ggctaaggca caagaatcac ttgaacccgg  55140
gaggtggagg ttgcagtgag ctgagattgt gccactgcaa tgtagcctgg gcaacagagt  55200
gagactctgt ctcaaaaaaa aaaaaaaaga gagagagaga atgaggaaaa gaatgactaa  55260
ggatgaggtt tactacaacc ctgtgatgta gaaagaccta catgcctggt cagccattta  55320
taggagaaag tgctgattca gagaacatag ggatgtgaat tacattcaac cagagggaga  55380
acccaggact aatggctggg tcttatggct cctagcccca tgctttatcc agctgaaaaa  55440
aatatgcaag taatcataag ttcgtgatag agaaataaac tatcagggct actctgagtg  55500
ccaaatcaga gtcgtatggt atccagagct ttaaaatcta ttaaatcctt gttaatagat  55560
gcctcaaggt ggccatctga aattaggagg caagtcagcc tccttatcac aaagatttga  55620
gaataacaag ggattaatga cagggtgaag tgtgatgaca aaatcgagca aggagatagt  55680
aaaataaaga ttggaatggt gtggggatag atgttgggct tgaagtgtat agatgtggca  55740
tctcagagac ccctatatga gatatgtgtt atgaatatag cagcatgctt atgacatctt  55800
atgaatgtga ctcatatgct tagaaactgg ggggaaaggg gtcaggtaat tcagtgtgac  55860
acaagtttca ttccactcaa cttcatgtgt ttggccctga ataaagcttt ccagaggcag  55920
caatgaagag tgcatggaag aaaagtggga tggccaagaa gttatctgtt tgtaccgggc  55980
aggagctgtg attagagaga gaatacattt ctatgtctca gcaagaaaat aattaattaa  56040
ttaaaagaaa agaattaagt aaaaatatat tgaagataaa atggtcctga aatacttgat  56100
ggctttcact aatgattaat gccatctaaa actgggtaac aggaaaactt tcatctcagt  56160
cttccactcc ctggcttgga ctaccatggt atcttaccct caaggctgaa caggagcata  56220
taccacttct ttttatttat ttatttattt atttatttat ttatttattt atttnnnnnn  56280
tttatttatt tattttttga gacggagtct cgctctgtcg cccaggctgg agtgcagtgg  56340
cgggatctcg gctcactgca agctccgcct cccgggttca cgccattctc ctgcctcagc  56400
ctcccaagta gctgggacta caggcgcccg ccactacgcc cggctaattt ttttgtattt  56460
ttagtagaga cggggtttca ccgttttagc cgggatggtc tcgatctcct gacctcgtga  56520
tccgcccgcc tcggcctccc aaagtgctgg gattacaggc gtgagccacc gcgcccggcc  56580
ctttttattt ttaaaacaag caaaatgtga acatgttctc ataaaaaatt aatatggaaa  56640
taaaattaaa aggaagagtt tacttgaaat cttctttcaa tgtatccttc ctcattcttc  56700
ttccaatgag taacttggag gttaatgttg agtcgattct tctcagactc ctgcatttat  56760
gcattttatc tcacatgaaa aagcatttct gcctccagga agcactgaca ttttcacaga  56820
atgtttcctc ttcctacacc acttccttct cactcatcct tcagaactca gctcaaacat  56880
cactttctta tcctcaaaaa ataagccagg tacctctgtt acatgttttc atatcatcct  56940
acacttttct tttatgtctg tcataatttt aataaaataa attaaggata taattagttg  57000
ttgatgtctg cttctccaac caggggaaat tccattactt tagagaccat accagtcatg  57060
gtcacttctg caactgtgct ttagacatga gagatgatca attatgttta ttaaccgaga  57120
acagtccagt gaaagaagga ggcagtacct tcttggctta tgaaagtact tatttgacct  57180
ctcgcttaga agctgctctg tttgtcctcc tggtcttgtc tgtaagaact agaaattgaa  57240
tagactgtgg caataacacc cttttccata cagaacactt atttctatat gcatgtcgtt  57300
ggagtctaaa gcaagcagta cacttggagt ttgcttccag aaagtgcctc gcagaggttg  57360
taggactttg gatatctctg gatagttttg ccaggatgtc tcctctaata tgtggtggca  57420
gagccttggc aggacataac cctgacttct gttatgtttc acctctttca gaactctttt  57480
catcttgtaa gcatataaga taaatttgtc ttatgtttag aaatatagtg ttaggaatag  57540
catcattgaa aagaacccaa actcattctt tttttttttt tttttttttt ttgagacaga  57600
gtctcactct cctgcccagg ctggaatcca gtggcacaat cttggctcat tgcaacctcc  57660
gcctcccagg ttcaagtgat tctcctgcct cagcctccag agtagctggg actacaggca  57720
tgcgccacca cgcctggctg atttttgtat ttttagtaga aaccgggttt caccatgttg  57780
gtcaggctgg tcttgaactc ctgacctcat gatccgccca cctcggcctc ccaaagtgct  57840
gggattacag gtgtgagcca ctgtgcccag ctgaacccaa actaattgta tgttaatgag  57900
aaaacagagt ttattggaat gaaacatttg aacggctgta ctttgtaatt ttgaaactgt  57960
tgaaataaat tagaaaaaat gaggtatcaa taatatctga gagacagcaa actgatgttt  58020
gagttcccat ttaactactg ggaactgttg attttgttca aagtgggact ttgtttttaa  58080
atttgaccca aagtttaaaa accagagtat tttacataaa aacccacacg tcctacccat  58140
cttgtaaaag agaatgatct ggcaataaag agctctcatt tccacctggc tagagttggc  58200
cagagctgag tggtggctgc cacatgagca gaggcagaga ggctttattg tgcctcagtt  58260
tcccaactct ccatattgtc tccacagcac tggaggtgag tgttttacct acccaagaat  58320
tcatacattt atttttctaa gagtagagaa agatttctct ttgtccgtga ctctatcgtg  58380
tggaaataaa taaacaagta ataaattcat aaatatataa atgtataaag atacacaaat  58440
gcatggatga atgaataaag aataaataca aggcatttta aaagcaccct gtgattacag  58500
aaaacaatga gaaatgaacc tagtatttta agaaaaaagt tattccgatg tgttaaatat  58560
gtaaccctaa gcctagtttt ctcattatgt tacttgctag gtctcaggag gcacttggtt  58620
gggtgactca cggaataaat gaaaataatg taactttaga tcacaaagat tatataataa  58680
caattagtcc acacatttca gtgattccaa aatagtattt tcatatattt tatgttttta  58740
acattttaaa atgttaaaat cataactcag cataattgga agctggctca agttctctta  58800
taaatgaaat gtactaaaaa atcaaaactg tctccattgg tattatgtat tatacttttc  58860
accatatttt ctactctgta tcctcatcca gttactataa gtaattaggt aatttaataa  58920
aacaagattg attaaggtgg cttaattttc ctcaccatta ttaaattaaa tacatgaagt  58980
aaccaatgct tctgtgatgc tgagtttttt acgagtaata atttattctc tctttctccc  59040
tctctctcta tgtgtgtgta tatatacaca aacatatata tacacacgtt tttatatata  59100
catatataag tgcatatgtg tgtatatgta tatgtgtata tacatatata tagaaacatt  59160
gctggcataa aactattagg attttatata tttcaatggg cagtgattct gatcacacat  59220
tagcaactaa ttttaaattg ttttcctaca ttcccacatg tgcacataca tattttacct  59280
tatatcaaat atttccatta ttatggtatt tgtttcctct tttcaaatat tgcttatgga  59340
gatagtcaat gaattagggc acataaaaga tcttcttact cttctacaga aaaaataggc  59400
tctattgagc catttgtgga ggagaatata ggcatctttt gtctgcagtt tgaaaccaca  59460
aatttatttt gtgttctgaa acacaaatta caattacaat catagctata attataatta  59520
gaataggaac catatgcagg catgcaagga aacgattcaa tctggtgccc ttgaagtgat  59580
ctttctgttt ttataataaa tgaaaatgca catacttgta aatttaactg caagaccaca  59640
agtttggagc aggaggacta gcagaaaggt attgttagct tggtaagtta tatgtggtga  59700
gctctttaac gccacttgtt aaaatttttt gttaatcaac ttaattatat taatttgtct  59760
aggacatttc tcatgtttat ccagttatta atgaaattta taccatgctt aataaggctg  59820
agtttaataa gatactgagc atggtaaatg tgtgcaattc ctaataaatt tatcctcacg  59880
ttaaaacgag taagcgaatg tcctagaacc cctgaaaaac cccctcccat cctctgtcat  59940
gcctgcaatg tctttctggc tctttctcat ctctgtgcat tgctgatgtg cttgtcactt  60000
aggggcccct cgtgcctgtt cctttttttt tttttttttt tttttttttt ttgagaagga  60060
gtctcgctct gtcatcaggc tggagtgcat tggtgcgatc tcggctcact gcaacctcta  60120
cctcccaggt tcaagcgatt ctcctgcctc agcctcctga gtagctgaga ctacaggcgc  60180
ccgccaccat gcccagctaa ttttttgtat tttagtagag acggggtttc accacgttgg  60240
ccaggatgat ctcgatcttc tgacctcgtg atctgcctgc cttttcctgt ttttggtcca  60300
tactgtgggg acaagatgac tcgtggtgaa aaagaaaagc ctaggaacat agataagcca  60360
agccccatac ctggtttctt ttcctttttg tgctacaact gcctaaatgc gcatctccca  60420
acatgacctc ctcacctctc ccttcttcct ccccagctac agatctcctt atcttcacct  60480
gatgcataga cacccaacac aacatcttgt tttgagacta cacgctattg tggtctgtta  60540
gagataagac tctggaaaca tatttcagct acactaccta ccagtggtac gcgacaggac  60600
acgtttatgg aaaatgggga tgagaatgca gttttcctgg gtttgagaga attattgagt  60660
atttatgact tagtaaagaa ttatttggaa ggaacagacc atctgctcaa agggaacatt  60720
gattgcaagt gtcattcggc ctttctctgc ctgtctctca ctctccgttt gagccacatg  60780
atttctgtct gtgagcctgc ctctgttttc tcaccttgaa cactggcttt attctgtttt  60840
gttttggttt gtttctctcc ttgcatatta cccaagtatg gctgattgtg actgggtgta  60900
atgacctccc aatcaaaagc cctaacgaga ctccccagaa aacacccaaa ggtgaaggtg  60960
cactgggaaa aaatgaagtt gcgtgggggc atcagaaaca ggaggcgtgg ccgggagcag  61020
caggtcagga gagtgcaaat ggaagganan gagcaggtnc tgctgaagcc aagtattgga  61080
tttccctgca gagcaaaccc aaagtcgttt gaaaccgccc tttttaatcc tctctgaaag  61140
ccttgcccca tctctgctgg aaccactact caaccaccct ccttagcttc atggaatggg  61200
aggagagagg acacaactct ttggccatac taagtggtga gacttgactg cagtacttac  61260
aactcaggga tcatttttcc tgtcaaactt ctraatctta taggacttga gaagtttatt  61320
aagagctaaa aaaataggct attacagtct cacctgaagc tcaaatcatg ctgtataaga  61380
tagtttcttt agagaaacac cacgtagtta ctataaactt acaaatggac aatttgtaaa  61440
ttggtgctat tttacaacat aatattaagt cgatttcctt gcatttaaaa aatacatatt  61500
ctgaaataat ttagaaacac agataaaaaa tacctatgtg tctgtcagaa ataataatag  61560
ctaatattta tggaccactc actgtgtgtt ttattaggta ttaaattatt taatgctcac  61620
agcaccataa aggtaggtac taatacgatc tgttttacaa aagaggaggt tgaggcacag  61680
acagcataag gaatttgatg aaggtcacat agttactgaa tggggatttc atctcaggca  61740
gtccacgtta tacttttaac tacttcattt tcacccctgt gtattaccct actgtgaaaa  61800
taacccagtt tcttcattca tttattcatt ccactatcga tggacattga gcttgnnttn  61860
nattgttttg ctattgcaga ccttctaaga cctttcttat ccgtgccttt gtatgcacac  61920
gtgagagagg tgttctaaca tatatagcta ggacagcaat ttctgggtta aaggatatga  61980
gcacctttga ctctctgaga tatggcagat ggctctccgg atgatagggc tattttgtat  62040
gccttctaga aacgtgtaag ggtgctcgtt gtctacatct tcatctgcac ttgatgttat  62100
caggctttta caccagatga cacgaaatgg tgtcctgtaa tgtaaatttg catctccctg  62160
atctccctga ttaatggatg ttgaacattt ttaggttcaa gggccacaca ttttcttttt  62220
tttttttttt ttttttttga gatggagtct tgctctgtcg cccaggctgg agtgcggtgg  62280
cgtgatcttg gctcactgaa agctccgcct cctgggttca cgccattctc ctgccccagc  62340
ctcccgagtt gctgggtcta caggtgcctg ccaccacgcc cggctaattt tttgtatttt  62400
tagaagagac ggggtttcac tgtgttagcc aggatggtct cgatctcctg actgtagatt  62460
gcttgtttat ctcatttgcc catttatctg ttgatttttc taagtgatgt tcaggaattc  62520
tgagtgtttc taaagggtat attgtttctt tctaaataaa aatttaagat attagatata  62580
aagacaaatc taaaatatta aatgcttgac acatgtgcct ttttcatctc tcccatgttt  62640
agtcaataag gcaattcttt tatgtggtat taaagaaacc gattagaaag ttgcttcgtt  62700
gtgtgcttaa gtgtgagtct tagaaaggtg aaaagttata attgactctt ttagcaccaa  62760
accaagcagg tatatagctg tttaaatact attttagcat aagccatagc tgtgggaagg  62820
gtcactccag tgcttgataa atagaagtct attcaattgg accctcattc ctcagcggct  62880
gctgtgacaa gccgttttcc cgctgctgct caggtaggag ttttcatctc ttgacacttt  62940
gacagatgtg gctgcacact tttgaaccat cttccaacac acccccgtgc tctattacca  63000
tgaggaaagt ctctgacaag agaatgaaag tacatatgca tgagacgtgg tacaatggat  63060
gtcagtttcc ctctggtagc atattccacc gcgtgcctcc tgtgaggaac agagggaggt  63120
aacaggtgct tgctgaaagt aggtcaaacg gtggcgaaat tattccttca gtgttttaat  63180
gctctttgaa aacatttcca ttgaaggcta agattgaggg gaggtggcct gtgtgatgtg  63240
agcatttcaa gtgacaaagt gacatcctag gcactcctga aactgtcttc ttcgtgaacc  63300
ttcccacaaa ctggcagatc atttcaagaa ttgatggagc ccatgagaat gtaggttccc  63360
tccagaacgc agctctctcc ccagcccatt cccacaaaga aactaggttt tccctgcatt  63420
tccagaaacc tccaaaccaa cccattatgc ttctcctttt gtcctctcca aattcaatct  63480
gatccttctt caattctgtc attacttcag tattttgata ttttttgact cattctctcc  63540
actccatctt catattcctg ccctcaaaat caggtcagtg cttcctcaac agagtgatct  63600
ctgattcctt gattatattt ggtcattttc ttttttgttt ctctttcttc tctattgctt  63660
cattcacgat aggcatttgc caaaaatttt ctgaattata cgtgattgta catatccagc  63720
tgcgttcacg tgcagaaaac atagcctcac acacagcaga cccaaattct tactctcccc  63780
ttaggcaggt gtcaaacgat acttccccca aatgctcacg catgcacgca aacagagaca  63840
cacagtcaaa aacacagcat gcatgtgtac acacacatac acactcatac aggctcacac  63900
atgcatgcag agacacacag tcaaaaacac agcatgcatg tgtacacaca cacactcata  63960
caggctcaca catgctcaca cgcacacaca cctcaaacac acacagtgac acagacacac  64020
acatgcacac tcgtgcacat acacatgcct acacacttat acatgctcat gcacgctcac  64080
acaactcaca tgtacataca cacacagtga cacacaatcg cagacacaca catgcacaca  64140
ggcacacaca catatctaca cgcacatgct catgcacaca cacttcacac gtacatacac  64200
acagtgacac acaatcacac gcacacacat atgcacacat gcatatggct acacacacgt  64260
gcatgctcac acacacctca caatgcacac tcacaaacgg tgacacactg acacacacac  64320
acatgcatgc acacagacat gcatacacac gcttatacac acacacacct cacgcatact  64380
cagtgacaca gtgacacaca gacatttaca tgcttatgca cacatgcaca cacacatgca  64440
caaacacact tgtacataat catgcatgct cacacataca cacgcacata cctcacacac  64500
acacatacac tcacacacag gcgcacacac attcattttc aatttctcag gggaatataa  64560
aacaactgct tggaggaaaa gtttgtagga aaaagtgaat ataaaaatgg ttatgcagta  64620
attacctgga ataaatatta aaaccaggaa aaataaaata gctacatgta gaaaggggta  64680
gctaaaatgc tacttgaaaa aggcctattg taattttgaa gtcagtggcc aaataaacta  64740
aacagagagg ccaattgtat aaatcctcag ttctaaatat cccatatata tttatttaaa  64800
tatatattca atatgtatct aatatatcct gattatattt cnaaataata attatattta  64860
gaatagacac cagatgacca ggcataggat aataaaaaat aagattaaaa tatcagtgtt  64920
atttttattt atttgtttat ctgtcttact ggcaattaaa cagttttgct tctttgattt  64980
ttaaacctca ctggaagaaa tatgcagaac attttaaaat tatttgcatg ccacattatc  65040
tcaaactaaa ttcctgtctc ctattatatt ttcatcctcc agtttgaatc agtcctataa  65100
ctcttgaatg tttacaatta tattaattag gagacatgtg ctaacttatg ccaagcattt  65160
ttaaaatgtc cattggagac aaatttccat caccaaagat ttgttgcatt gtcacctttg  65220
gcaaaaatga aggatgagtt tttctgtttg ttcgtttggt ttggttttgc aagtcttgat  65280
ctccaggtta aatacacagc cttctttaag acttaaaccc agggtttgaa agtgctgtgt  65340
attttctcag tgttcaacac aatctgcagt agaagggttt ggagcagcaa tatgatgcct  65400
tatgcactct aaagctgctg acaggtttag acataatcta aaatgtaagt cactttgtgt  65460
atcaggcagt tcagtccttc gcatttgttt taatgttttt cctaaatact ctaaatattt  65520
caaaatgagt ctttccttaa agattctaca tagctcaaaa ttattttatt tatgtatgca  65580
tttattaaat atcacaagtg aggtcctgca ttgcattaga aatgcagtgt attagaaagg  65640
acagctagct tcaattttga attcataatt tgtctcttga gtttaaaaca aaagttttgt  65700
gttcaactgc ccaccgttta atactaaaaa taaaagatga acataaaagt caatttgaag  65760
tgattctaga tgtaggaatt taattagctg tgggaatgtc aatgacatct caaaaccatc  65820
atggcgtcgt gtcacctgtc tagcagccct attgtagtcc ttcctgactt ctcactaact  65880
tacccatgaa gacaaagata aagaaaaact cacaacaata caggtaacta agaaagcacc  65940
ttttgtcaaa gtctgttgag attattcagt aactatgtgg ttggcggagt actagtgaga  66000
aaaatataaa acatcatgta tattcaaatt gtttaatcta atgcgtccat ccttttagga  66060
actcagtact gaagtctagg aacatcaggc taaaaaaaat aatggttgga tttttctact  66120
ctttctagac accagggaac atgagagaaa attattgtgg aaggactaat attcttattt  66180
ttattattac ctatgtccag ccaagtaagc aaggtcaaca cttcaccgtt gaaaagccaa  66240
gattttagca ttttcattct taatttttac tctagtattt cactgacact tgagtgtatg  66300
tcagaantca gagggtcatg aagaanngga cagccctggt gactgccaca ggctgagact  66360
tactgctgga acatgtatag tgaggcctcc tttgttgacc atcaccctgg gtcttcttgt  66420
gcccaaagca gaatggtgtg gcttcctgga ataggagatc atattacttg aagcaacaag  66480
attgtattgc ttgaactcta gtgtcctaat ttgttttact cactttgtat taatacatgc  66540
caaagatagg gaaggggatg aaagggtctt gggaccacca tctaggttac agcatccctc  66600
ttttaggagt ccttgctaag acacctcagg ggaaactgcc tttctgaagc ctggctcatg  66660
gtccagttaa ctatgtcaac agtaccaaca ttactttcat ttaatacagg agatagagaa  66720
atgtttcacc cccgaggcta ctttcctcag aaggaggcag aagatgctcc atggccaatt  66780
gagtacatgg aggaaattaa gttatatcaa aaattattgt tgaatctact atgaatccag  66840
ccttgcagga actgagtact gaagcttagg aacaccaggc taaaatatat atatatatat  66900
atatatatat atatgagctt tttctactct ttctggacac caaggaacat gaaagaaaag  66960
tgttgcggaa taactaatat tttttatttt tcttacccat gtccagccaa gtaagcaaag  67020
tgaacacttc attgttgaaa agccaagatt ttagcatgtt tattcttaat ttttcttcca  67080
agtcaataat gaagtcatgc aggggtattg agttcttaat ccataaatta taggttagtt  67140
aattgaaagg tttttgtaca tgtcatcatt tacttttcct ttctcctact aatccataaa  67200
tgtaggccac aaagtgtgag gaaaccagga gattttaagt agtgttctat aagatagttt  67260
aaattgtgaa tatccattat ggcattgtac tctaggaaat acatgttgtc ctaaattgaa  67320
gctttcataa agaaaatttc ccatgtttta aatcaattca agacagatga ttttattggg  67380
caggatatag gaaaagttct gttttaaata tttcttactt taactgatat atttgtatct  67440
ctgtagtctt agtggcagta tcccaatgcc cagaaatggc ttttgtgtgc tcctagtgct  67500
tagtaaggca tcatagctat gtgactgcca tggcattatg attgataagg agtctctaaa  67560
cagcagaaaa ggactatatg taatatatat gacccagact agagtaacaa agctaaacac  67620
cttagaaaag cccagaaaat agtctcccct tcccacaagg gttattattt atgatcaatg  67680
tatgagtttt caaataccct acagcagact cagagatgcc ataagagctg ggggagctgg  67740
gtggtgaaca atcaagttga agtccaggag tcctgactgt tagcattttc tgctttccat  67800
aatgtaaatg ctcccaccat ggccaatttc aagtcaccaa catgacatca gtaaacatga  67860
aggtggagag agatgtgatt gcagctccag cacaccacag ctggggcaag ctgcactccc  67920
actgcagtca gagatggcat atacatacat acatgtcata catgtctatg taaacacgtt  67980
gcaaaatttt gtttgcagaa agtggaattt ttgatgcctc catccaaagt acctagtttc  68040
caacatcact gtagagggaa agagagaggg agactttcga gaaggcacac cctttctcaa  68100
agtgacacat ccaaagtgat gcatcacttc catttctgtt ctggttgtga gaaccaatca  68160
cattgctcca cttcagtaat agtaagctga gtgatgtaga tgagctatat gccaggaaga  68220
ggaaaccagc ttggtaggta taatagcttt tgctaaacca caaggcatcc taaaacttaa  68280
tggcctggac agacactaac tcttgctcat gaatttgcgg atcagttgaa cagccctgct  68340
agtctgagcc aatctcagct gactacagct gagctcaccc ctgcctctgc ggtcagccac  68400
tcgtcagctg gcatctctga ttttgggtgt ggctcgccat taattggaat gaagagaatg  68460
gcagggccca tggccacctg gccaccatgc aacaggctag gctgcagggt tgatgtggtc  68520
gctcggggtt ccaagagcag caagagtaat ttctaataca caagtatttt ccaagtctct  68580
gcttacttca cctttgctac catctcactg accaaaataa gtcacatggc tgagtctgga  68640
gttggtgtgg aggatactgc caaggatgtg tggatacagg gaggtgaatt caattggagg  68700
ccactgggtt ttttcacaca ggctaagagg aatttgaaaa tcactggctt ggcatcataa  68760
tcaatcctgc ttagaggtga tttctttcac accagccatt actggtgctt tttccttctt  68820
gttaaaatct agtttgtgtt gtaaagtcaa gaggagctgg tgattgaaaa aaataacatc  68880
cacatgtgtt tgttgatttg tgatttcaca tctaacctta ctcttacaga gtagagtgaa  68940
agctatactc acatggccta gagataaagg gtctgtccag gattccctta ctcggctctc  69000
cattccaata aagagagcca gccactgata gggcgtggca gctggcaggg tgtccactga  69060
aatcataggc tcttggtacc tttgtggaga tggacatgtg gattcccttc tgtcctgact  69120
ctctaaggac gcatcaggaa cagacagatg ggaaaggcag tctctaagga tatccactgg  69180
ttatgttttc agtgttgata taagtgttac ctttttcata taaattcttt gtattggaca  69240
gaataattgt gtacattgat agtagaagta atgaatatcc agatgtcttc taaataaggg  69300
aagcaaaaga tgtcccactt gcaaatggga gatttatttt aggttttatg catttggtct  69360
tttacattgt gtccttgttc ttatgttcat ggctcatatg caagatggtt tctgagaatt  69420
tcatcatgta attgcattgt tctccaaata agtttatttc aaaatccaat taaaacacaa  69480
gttttagtac atggctgatg cagtattcag tggaggagac tttgttttac taagttgagt  69540
tgttttactc actcaagcag caatttaaag acagatttca tttctgagct gtactattca  69600
ttatcctaat ttatatttat tgcaacctct gagaccacta ttttgtctct ttgcctacag  69660
tcttcagaat ctttaagtta ctgtttcata ggaaaaatta ttggagaaat ttaatagaaa  69720
gagcttttat gaagtactta agcatttata ccacaaaaaa agataagata gctttagatc  69780
attttgaaag tttataaatg ttcacggtcc atttcaagat tactaatctc ttccnnnnnn  69840
acctgatttc ttatgttaca ccttcaggcc ttccctgtaa gcaactgact gcatctctac  69900
tttcaaatcc ttagagtgct ttccaagact gaaataatga gagttacaga gcacacggtg  69960
tccactgcag gctagactct acactgaagt ctcatttatt ttcgttttac agccaaaaga  70020
tgtagatgtc atcatactca tttcctctgt gagaaaactg agtcacagaa aggtgaaatc  70080
cagcacagag acaagattta aactcagttc atcctgtctt caaaattgat attccattaa  70140
accatggcaa tcttaaatct ttctgtgaaa aacagattgt cttcagcttt cagatttagg  70200
gttcatgtac ttataccttc tatccaacca caaatacttg gtgaggaagc tgctgtcact  70260
cttttttaat atatagagca atgttgactg atgaattttg actgtctgat acaaggcaag  70320
agactacctg gtttgggctc acaatgtcta agatgtttct atctctgtgg gcctagaaat  70380
ctacttagac tttctgagcc tgtttctcca tatgtaaaag gggatgcaaa agtatctacc  70440
tcacagagtt gttgaggatt aaagatgtta ttacatgagc aagcaacatc tttggaatga  70500
atcttggcac aaaccaagca ctccagaaaa cagtagctct tatttcaata atccatcctg  70560
ttggtgtcca ttttaattgc gtgagaagcc ctccccgtgt ttggcttaga cttccacagt  70620
ctcctgggag gtttgctttc atggcaggac tcagaatcaa tgcgggaaaa agtgaccttt  70680
cttgttgttc tgcttgaggt tggactcagt cccattgttc cagactcatt gtctcattac  70740
acttttggac acaaagcaag atgaaagcgt tggttgctgt tatgagtttt atatctgtag  70800
ttgtcaaagt tacagagacc ccacgttggc aagtcacctt gtgtggaacc ctatggtcag  70860
gtaccatttt gtagccctgg gcacttttat acnaatcatg tttcnataga aggtgatttg  70920
agctggtata caagacagtt tgagctggtg tctgtcaaaa tcgttgacaa tgctgtgtta  70980
gtttcctgtt gctgctgtaa caaataacca caaattcagt gacttaaaac cacacacatg  71040
tattctctta gaactctgca gttagaagtc caaaatggac ttccttaggc taaacacaag  71100
gtatcaacaa ggctgcattg ctttgggaga ctctggagaa gaaatggctt ccttgctttt  71160
ttcacatcct ggaggccacc tgcatttgca tttcttaact ttatgagagt ctgtaatgat  71220
gtctttataa tgcctccaaa tggttgcaaa actaacacat gcttttgttt ttatgaagcc  71280
aaacagattt agttgatttt tgaccatgga gttggggtat ggggacaagg ttggcagcca  71340
tttttatgtt agtgtagtcc aacatattac attccagcca gcatctgtgg tattctattc  71400
tagtcattat agacttttag aatcatgaaa ctgtgaagtt gcaaataatc ttataggtca  71460
cccagtgcag cctgctatta aggagtatcc cctacaacag tgcttctcaa aattcaacat  71520
gctcacgaat cacctgggaa ccgtgttaaa gatacagatt ctgattcagt aggcctggga  71580
tggggcctga gatcctgcat tcttaataat tgcttccagg ttgctgctgg tccagggacc  71640
acactttgag taacaatgct cattcctgac agataatgct gccttgggga ttaatctagt  71700
atagactctt tgtattttga aaattccagc tgtcatatac acagataagt aatttttgga  71760
tcaaagccaa actaaaaaca tatccaaaac tcctctgctt ttaaaaaatg taaaccaaaa  71820
tgacattgca attaaaggaa actttaaaaa atcaaatgtg tatgtggagt ctgaaggacc  71880
ttatattaaa atatataaat aaaaaagaat atgcacacac atatgtgaat ccacatatgt  71940
atgtactcac atacacatat actagagatg tatgtgttca tctgtctaca tagataggta  72000
gagggataga tcatgcatcc atattaaata atgcaattgt gaagacctca agtcatataa  72060
tattttgtgg tactgactca gctttaacat tttcctttat attaattttt attagaaaat  72120
aaaaaattga aaagtataaa tttggacttt cctgtagata caaggatgaa tctaaatgta  72180
atgtcatcag cctttttaca ttaaagaaac tgatagccag tttcaagcac tggctgaagt  72240
gaattgagtt gaagtgggcc atgccactag ctctaacttt aaagctggag ttactgattt  72300
taatatttaa atgtaggtac tgcacatatt tatcacctta attcttattt aatatttgaa  72360
agttactgct ttggagaaag tcagctaagc aatggtgatt atagtgtatc aaaatccatt  72420
gtaagtgatt attttaataa ctctgaacca acagggacat gtagacattc agacaaaaaa  72480
caacctaatt ataatgacag caccaaagtg aagctgtgac agttacaaaa ccaatttaaa  72540
agtttcctga cagccatggc taaaagcttt gtttggatct ttcagtaata acagtttact  72600
taagacataa atccacagct aaggaaaata gaaaaagaaa gttgtggctt ttctgccatg  72660
cagatgaaat ggaaatcagc agaaatattt ctaatagaac attatgctga aaggagtata  72720
gaaaaggaat aatagtaatg gaatttaact ctcacaatgc aagaaagact aaataacaat  72780
aaaaatttta atgagcatag aaatgtgcca gatgatttgc ctatctgtgt tatgaaggtc  72840
agtcatttct gcaagtaaat tgatgtgcat ataaacatgt tgattggcag ctctggaatt  72900
tgatttttgt attacctgta aaataaagtc aaagggaaac ggatatgcat caatagccac  72960
ggtgacagga agccttaata aaagtctact ttcccgatgt cactggcatg tctcaaatta  73020
ttagatcctt atcaatgtta cttacctcac tagactatgg gctgagtctg atatgcaaca  73080
taattaattc ttcaacctcg ggtaattaat ttctcattcc cgaacagaaa aatgcttgat  73140
tcacaaaatt gcattccttt tttctgtaaa cctttgtaga atatttgtaa gtgtaatcac  73200
tgttctaagc cctttacata tattgactca tttaaaatta ataacaagtc tttggagtag  73260
gtactatttt ctccacttna tcaatgagaa aacagaggtt taagtaactc ccctggggcc  73320
acagtgccag taagtggtgg agttacggct ccaggcagtt tggcccagag cacctgatgt  73380
aggataagga agaccccatg aaacacatac atagagtcat ggagacattg gcagtgctca  73440
gaagaggcag ttcttgttct cttaccccat tttagtaata acagtttgct taagacataa  73500
atccacagct aaggaaaata gctctttgag ctgcaaggac taaaggattc tcaggtcaga  73560
ccagacagta agggcatgtg ttaataaata cccagaagaa atgaaacctc agaaagagga  73620
tgtgtggtgg cgctagtccc tgggcagatg tggctcagtg gtgtgttgtt tgtgctcagt  73680
tcctttccat aggtctgctt ctctctcctc tttctgctgc ccagggcctt cagcctccac  73740
tctctccatt taagtattct ctaccccaca gtgggcagcg ggccccagaa tggactttaa  73800
atagactagg gtaaaatgac ttagtctctc tgaactgtgt gaaatgtgag taatatatct  73860
caccatatag agctatggtg gatattaaag tagataaaac aaataacatt tgaataatgt  73920
ggattatgac caagtcggat ttatccctgg gatacaagga tgattcaaca tatgcaaata  73980
aatgaatgtg atacatccta tcaacagaat gaaggataaa agctatatga tcatttcaat  74040
tcatgctaaa aaagcatttg gcaaaattca acatctcttc atggtaaaac ccctcagcaa  74100
aactggggat agaaggaaca tacatcaaca taataaaagc tatatatgac agacccacag  74160
ctagtatcat actgaatggg gaaaatctga aaagcctttc ctctaatacc tgcaacatga  74220
caaggatgcc cactatcacc tctgttattc aacatagtac tggaagtccc agctagaaaa  74280
ataggacaag agaaagatta aagggcatcc aaattggaac ggaagaagtc aaattatcct  74340
tgtttgcaga tgatatgatc ttatatttgg aaaaacctaa agactccaca aggaaactat  74400
aagaactgat gaacaaacct agtaatgttg caggatacaa aatcaacata caaaaattag  74460
tagcatttct ataagccaac agcaaacagt gtgaaaaaga aatcaagaaa gtaatcccat  74520
ttacggtagc tacaaataaa ataaaattcc ttgcaattaa ccaaaaaatt gaaggatctc  74580
cataatgaac actatcaaac agtgatgaaa gaaatcgaag aggacaccaa aaatggaaaa  74640
atattccata ttcatggatt ggaagaatca atattgttaa aatgttcata ctacccaaag  74700
cagtctacag atgcaattga atccttatca aaataccaat gatattcttc acagaaatag  74760
aaaaaaattc taaaattata tgaaaccaca gaagagccaa atctatccta aacaaattga  74820
acaaagctgg gggaatcaca ttacctgact tcaatttata attcaaagct acagtaatca  74880
aaacgccgtg gtactgccat aaaaacagac acatagacca acgaaacaga atagagaacc  74940
cagaaggaaa tccacacacc tacagtgaac tcatttttaa caaaggtgcc aagaacatac  75000
actggggaaa agagagttcc ttcaataaat ggtcctggac atccatatgc agaagaatga  75060
aactaacccc tatctctgta aggtacaaaa atcacatcaa aatggattaa agacttaaag  75120
ctatgacctc aaactatgaa attactacaa gaaaacactg gggaaaatct ccaggacatt  75180
ggactgggca aagattttat gagcaatacc cccataagca ccggcaacca aagcaaaaat  75240
ggacaaatgg gattacatca agttacaaag cttctgcaca gcaaaagata caattaacaa  75300
agtgaagaga caacacacag aattagagaa aatatttgca aactacccct ctgacaaagg  75360
attaataacc agaatatata aggacctgaa acaactctat aggaaaaatc taataatctg  75420
atcaaaaaat gggcaaaaga tttgaataga catttctcaa aagaagacat acaaatgaca  75480
caaacaggca tatgaaaagg tgttcaacat cattgatcat cagagaaatg caaatgaaaa  75540
ctacaatgag acatcatatc accccagtta aaatggttta tattcaaaag tcaggcaata  75600
ataaatgctg gtgaggatgc gaagaaaagg gaacccttct acactgttgg tgggaaggta  75660
aattagtaca atcactatgg agaacagttt gaacattcct caaaaaacta aaaattgagc  75720
tgctgtaatt tagcaatccc actgctgggc atatacccaa aagaaaggaa ataagtatat  75780
ctaagagaaa tcttcactcc catgtttgct gcagcactgt ttgcaataag atttggaagc  75840
aacctaagtg tccatcaaca gacgaataga taaagaaaat acagtacata tgcgtaatgg  75900
agcactattc aaccatagta aagaacaaga tccagtcatt tgtaacaaca tggatggaac  75960
tggagatcat tatgttaagc gaaataagcc aggcacagaa agacaaacat cacatgttct  76020
cacttatttg tgggatcaca aaatcaagat aatcaaactc atggacatag agagtagaga  76080
ttggttgcca gaggctgaga tgggtactgg ggggacgggg ggaggcaggg atggttaatg  76140
ggaacaaaaa aaantagaaa gaatagataa gacctactat ttgctagcat aatacagtga  76200
ctgcagtcaa taataataac tgtacatttt aaaataactt aaagagtgta acataatcat  76260
ttgtaactca aaggataccc cattctccat gatatgctta ttccccattg catgcctgta  76320
tcaaaacatc ttgtgtactc cataaatata tatnngtgta tatatatata nntttatgtg  76380
tgtgtgtata tatatatata tatatannca cttactatgt acccacaaat atttttaatg  76440
tgaataatat ggcctggaac atagtaaccg tttaatacat gataaccttt ataataatac  76500
tcattatggc caggcatggt ggctcatgcc tgtaatccca acactttggg aggccgaggc  76560
gggcggatca tgaggtcaga agatcgagac catcctggct aacgtggtga aaccctgtct  76620
ctactaaaaa tacaaaaaaa ttagccagac gtggtggcgg gcgcctgtag tcccagctac  76680
tcgggaggct gaagccggag aatgacgtga atccaggaag cagagcttgc agtgagccaa  76740
gatcacgcca ctgcactcta gcctgggcga gagagcgaga ctctttctca aaataataat  76800
aataataata aataatactc attatttttt aatgtttaat tatctttatc ttaatgtagg  76860
cagtagactt ggaccagact tgggttccag tattgagtcc atcttcaatc cctgtttgac  76920
agtgggaaag ttacttaacc tctttgagcc tcagtttcct tattagaata ggttcctagg  76980
gctgttatga gttaatttat gtaaagcacc tagaaaaact ccaggtagag agcaagtatg  77040
atgtacatgt cacttactag aagttgtagt aaaattttca acaaatattt atggnaagta  77100
ataagtaaaa aataaatctc aggtttctct tacttttcca gttgtataat aatcatctct  77160
aaaatatttt catctgcagt attctcccta aacacagaat aaagaaatac ttgttttgtg  77220
ttactagctt tttaaaagcc atttatccat acagtcagaa ttaaggataa atactaccca  77280
accaaccaat taaaaattaa gatgcaagcc atacacaaat gatatatgtt ttccattttt  77340
agtcaaaagt ctctgaaacc atcttcctag tcactgttta gctgcctgaa agaaaggttc  77400
ccttgcctgc ccagttcagc agtgtgggac atggatggct ttatcttgga agccctgttt  77460
tgcatagcag cacatcacaa aggtgctgtc agccaaggac taagtcaatt acacttaatc  77520
atgaggttta tttctttgtt aagagtctgt ctgtttcgcc ccctcagaaa atgatgcggt  77580
catccgtttt ccacatgttc atcctgagca tggtgaccgt ggacgtgatc gtggcggcta  77640
gcaactacta caaaggagaa aacttcagga ggcagtacga cgagttctac ctggcggagg  77700
taagcagctc tccaccgtgc agatcgctgg gcaaggagca ggtgaaccgc ggacagtgcc  77760
tcttagagat gcaaaagtga agtgtagcct gttcattact tgactttcac caaagctgaa  77820
tcattgtctg cttcttaagt ggttcctctg gtcacagtgt ggcctgattc atttcctgtc  77880
accgcgggcc tgagtcatct tcctcacagt atgtcacgtt gccagggtaa cccttttccc  77940
ctgggtctta ctctagaatc ttgctgtttt cctatccacc tcttattatc tctccctttc  78000
tcagcgtaca ttagtttgtt tcctactaag tacaagcagg cacagattca gaagatcata  78060
aataagctgg tcagctcagc aatacgtaga agagggctgg aaggacatat agagagatgg  78120
taatgataaa ttactcctct agaaacgggt gttacaacct acattaaaga caccaattaa  78180
aggtaggttt catgattaaa taagcatctc cctagcactc tacatatcat attacagttt  78240
tggaatagta cttcctattg ataaggtaat tttgttaata cctgattctt aaaatatttt  78300
aatttttatt tctttcaata agcattttgc atttatatta aagcatttta ataattttcc  78360
aagatctttg tttttttaat gtaaaaactt acctaaaata tatctcagaa ttcaatggtt  78420
acatatttac aaaaaaattg attgacaacg tagaaaccca ttcattgtgt gagtgaggta  78480
tacatacaca gttgtacaac gcttcaataa atccaaccta tgaaaaagta aactgaaaag  78540
acagaaaaaa gtcacaattt tattattttt accaaagcat ttttcacata aaaaaaatca  78600
atttgccata taattaagtg ttattacatt cctagaattc tctcagtaca tttaaaaatt  78660
gatttggtta ataaaaattt agtctaccca cgcacaagct tttctgaaaa agaattgatt  78720
gcatgtacct aacgagcata gacatctacg tggatatcaa gaaactttta agtagtcgct  78780
tctgaattct cctcttcatg gaagtatgtc tcctgaaaca aaataccgtt aatacaaaac  78840
ttttactggg ctacagtctc tgtgatgcaa catttgccca atggccacct ggtatatgga  78900
gcttacaatc tagcaaaaaa aaaaaaaaaa aanncaataa acaataagag ttttgtgcta  78960
tggagaacta atgacagggg ctgatgaaga aattatatcc agcccagcct ctgaaaaata  79020
ggtataattt tgctgaaaat ccagcacacg atgaatggat tgtcaataaa agcagagaga  79080
aggtcgggta tggtggctta cgcccgtaat cccagaactt tgggaggcca aggcgggtgg  79140
atcacgaggt caggagttcg agacaagcct ggccaacatg gtgaaacccc atctatacta  79200
aaaatacaaa aaattagctg ggtgtagtgt cgggcacctg taatcccagc tactctggag  79260
gctgaggcag gagaatcact tgaacctggg aggcggaggt tgcagtgagc caagagcgca  79320
ccactgaatt ccagccaggg tgacagagtg agactccatc tcnaaaaaaa aaaaaaaaag  79380
cagaaagaag cctagactga tactaatatt tgcaggtaaa tttctaacac agggaaagaa  79440
caatgaagga agcctcatca agttatttct gtttttccca ggaagtagga agcaaggtct  79500
gcatccagcc agatgatgag acagtgaagt gggaagttgg caaagaaagg ggagagggaa  79560
gaggtgcctg gggttaggca aaaaattaac aatacagcaa atgcaacatt aaagatccat  79620
ttaggactat ggatttacag tgataccaat tcagatagct ctgcgacttt ttagccctgt  79680
ataagaagag ggaaaagcaa catttaaatc aatccacctt tagggatttt tttcaggtta  79740
ggggaactga gaaacaaggg gaaaagatgg attgctggca aaggagttga aatgatgacc  79800
ctgtggtttc tgttggatgt ggaaatggga ggagaatgga ggagtgaagg tgaaggatca  79860
atggtctcta tatggttaaa ggacgggtac caccaaagtg atggaataat agaaccagaa  79920
gaggttatga tcagagagtg gagtccagga ttttacaatt ccagggtaat tctaagtaat  79980
gaaatataaa atctagggtg tcacgtgaat gtgggtggct taaacatatt gatggagtca  80040
aggcagaaat ggaaacgact gttgaagcta aggcgctggc tgagtcttca catggacatt  80100
gaagtcactc agagtgaggc cagttcttgg agagaagagt ggagtcaggg agcaaagtca  80160
cggggaatga gcgagtgact gatgaacaga ttgacagaag gacagaagac agctacaggg  80220
agagtgggtg acagcatggt ttaacctcat ggaatacgtt gcaaaggagt atcaaggagt  80280
aatggatggg cacctcttcc tcgtctacat gttctactag aaagggctgg aaagggctgc  80340
aggggtaact catgtatttg agagagaatc agttgaggca cagacagaaa gtagattctg  80400
ggaacagaga ttgataatgt agaggacatt atttaacgta ggagagactc aaagattagt  80460
tcaaggctct gaggagggag aagtgggaag atcgatgaga cagaagaatg atacaagagt  80520
aatagcatca gtaggtaaag atttgctggc aaaaatgcca ggaaacaaaa gcagaaatga  80580
ccacaagaga ttacagttat gyttatctct ctgggaggag gaatctgcat ctgctcctga  80640
gggaatcttg acattagaga ttacagtaac attgcttttg tgatctagca cagggtgggc  80700
aggtggtcac actaaatcag tcctggagca taagtgaata ggccctccac actggcaaca  80760
gcagggaagg gaattcttta gtaaatttta cctaactttt tcatgtacag aattgatcct  80820
ttcctaatgt gtttatgtat ggtagatgat ttatcctcat accttaagaa attccaacaa  80880
aatgtcaaat aattgaatgt tgtagagttg actggttact atttaagtgt attgtagagt  80940
ccaggggtag ttggtaaatc cttgtctttt ttctttttta tataatatta aaaataaaaa  81000
caacctcaac aacagacaga caggattgga tggtggaatt cagtatatat tatgtgtcca  81060
ataattgttg tcccctgaca ataataataa gaaagggtgt gggaggaaac tttgagaggt  81120
ggtggatatg tcaatggcat tgatggtaat ggtttcacag gggtacactt attcccaagt  81180
tcatcacatt ggtacattac atgaatgcag cttttaacat gtcattcatt cttttttttt  81240
tttttttttt ttttgagaca gagtctcgct ctgtcgccca ggctggagtg cagtggcggg  81300
atctcggctc actgcaagct ccgcctcccg ggttcacgcc attctcctgc ctcagcctcc  81360
caagtagctg ggactacagg cgcccgccac tacgcccggc taattttttg tatttttagt  81420
agagacgggg tttcaccgtt ttagccggga tggtctcgat ctcctgacct cgtgatccgc  81480
ccgcctcggc ctcccaaagt gctgggatta caggcgtgag ccaccgcgcc cggccacatg  81540
tcattcattc ttaacaaagc ggcaaatcag ttaaccagct aaaaactaac ttgaaatcct  81600
ggaaaaataa ataaataaat aaactaggta gtggtgattt tgttgactta aacaaccaga  81660
tagaccccat cagtgtactc ttgaactact taagcattct gaatttgttc cactctaggt  81720
tttggggttt ttttgttgtt gtttttgtct cctttttttt tttttttttt ttttgagaca  81780
gtcccactct gttgctcagg ctagagtgca gtggcaccat ctcggctccc tgcaacctct  81840
gcctcccaag ttccagtggt tctcttgcct tagcatccca agaagctggg ataacaggca  81900
cacccagcta atttttgtat ttctagtaga gatggggttt cgccatgtta gccaggctgg  81960
tctcaaactc ctgggctcga gcgatccatc catcttgacc tcccagagtg ctggaattac  82020
aggcgtgagc catcactcct ggccgttcca ctctgttttt gattttgtgt gtttgacttt  82080
ccccaagtat gtttcgtttt tattcagatt acattgccat ttctctttgt atcagaaact  82140
tatacatgag acaaagtgat ttgtttcaaa tgaatgtgaa aaagtcactt taattaaact  82200
tactttttca taatatattc tatttttata aagtttataa agatgtcttg agtttaggcc  82260
agggtttggc aaactctttc ttgcagaccc agatagtaaa cattttgcct tttgtagacc  82320
accctctctc tgtctcaact actcaactct gaaattgtac aaaagtgagt gtgtctcaga  82380
atggttgttt tccaataaaa ctttatttac aaaaatggat cttggtttaa gctatagaaa  82440
cagagagcaa tgtcaaataa ttgaatattg gattatattc aattatttaa aatacaaata  82500
aataataaca ttttgtgtta aagtcaaata ttttaatact gacaacaata aagctatgat  82560
ttttgggggg cccattatgt tctaagtgct ttaaaagaat tcattgtctc atttaattct  82620
caaaatagtt ataataacag caattcaagt ttatagacta taatgatgca gtatgtaagg  82680
caatagcatt atgtaatatt ttgaaaagtt tattttaaaa atggatcaca acaggtcatg  82740
agcttttaaa gaagttattt tttaagttcc cacatattcc agaataaatt atttagaaaa  82800
tctaaaataa agcactttac ccattaagag ccaactcaca gtctaaaaat caccctttaa  82860
gaataaatta agatacttag cttctgttgt gaagctgggg acttgttttg ttactttgga  82920
ttaattaacc tacatttaga attagttaag aaacaggaaa cagtttacct cttttgtagc  82980
ctatgcataa acagaaaaag gtaaagttta ttttcctctg taagaatttt aacttttcat  83040
tgtgatctaa gagaatatat tattattgca cattaaatca tatgttataa tgaacatgat  83100
tacattttaa aatatatatt attttcttaa gaaataaaat ataagcaata tttttcttat  83160
tattatatga atgtatttgt atccattaga ctgtacattt aacaaaattt atcagcacag  83220
cacaggagat taaaagcttt atcttctttt atctcaattc ttcttttgag aaactcacaa  83280
acagatggga gagatacaac aaggaaggca acggacctac agagaggccc aaagttagct  83340
ctgtgtcacc ccctagcatt atccccagct atgttctctg atttcctcta gacctatctg  83400
aatggggagc tcaatcctct tccacctcct ggtgttaagt attaatgagg acagtcatgt  83460
tttccaatga agccagaggg gagaaagaag tcctaggact ctgtgctaca taccccacag  83520
taaattaact agaactcctc ttaccctcaa ctctgtctat ccctcctacc cagcctactc  83580
ccatatctcc ccaacttgtc atcagccagg caggctcttc ccctgctact catgcacagc  83640
aattccactc cacccccaga cttgcatctt cacttgcttt ttgttcagca aaacaaaaag  83700
ctctgctatt aagaggatct agattcctca gaaaagaaag tatcatctat tacttaagcc  83760
ctcttagtcc cccacaggaa atatttattt taaatacatt cagagtttct ctgcaaagat  83820
ttcacatgga tataaaattt ttcatctcat ttcaattata aagtcagaga acagagagga  83880
agaagggcct agtatccttt cttacatggc agttgtgctt ggtgatgggg aatcagaggt  83940
aaataaagta aataagatat ggccatcgat gtgtgactct aaggacctct ttctactctt  84000
agaagctata gttctgtgag attatctggt gtaatcttga gtgaggtgta tacctaaaat  84060
ttgtggcaat aacatgattt atcaaagaaa ttttagtgac tctacaagaa gaaattaaga  84120
acaatttcca agtcagtgtt tgtctcaaca catcatatcc atatgagcag ttttagttat  84180
taaatccgtg tttccaatag atctaaaaat cattctctat tgtggtagac taaatatgta  84240
ttaagttgtc ttgtcggagg gaatgagtca taaactgcca aggtgctagt tcgctgagag  84300
aagttacagc ttgagagaat gttgtttcta aaacagatta ttgatgaagc aaaacgtgct  84360
gagactaaat taattttaca caaataagat ttgggcagga ttagacttat ttatgtcaga  84420
tacctatgat gtcagaagca accattagcc tttgtgtatt aatatgatta ttttgcagga  84480
ttctttttct atggttattt ttccttcttt ttgaaatttc tatcctttga aaatctgtga  84540
ctttctttta tttccttctt aattagaaag tatttcataa attcaacaca tagagaaaat  84600
attataacca atatttgtgt gtccgtcacc cagattttta aaaaattaat agtttttcat  84660
gtttgggtca ggtttttcaa tcagaaataa aacatcatta gtagagtaga agatccctgt  84720
gtaccacttc ttgatctcct ccttctccct aatccacaga gaactatatt catcatatca  84780
atgcatgctt tataatagta tgaagtatta aggtgccact ttttcaatcc tcattatatt  84840
tgggaaattg attcatgtcg attgaagcat gaatttattt gttctgcatg taagggcaat  84900
gggtatttca attgcttcca actttttgct gttgaaaaca atacttcagt aaacattgtc  84960
attagaattt ctgtgccaca tttgggagag ctctttctaa atatatacct agacttaaaa  85020
ttgtgaattt gtcagatatg ctcactttca actttgctaa atattgttaa attgaacttc  85080
aaagtgcttg tgtcaattta cattcctacc aggatatatg agcagctcta cttcatacta  85140
cttttttttg ttcaggattt ttaagtttct tacaatctca tataatcatt atagtcttaa  85200
tatacatttt cttggttacc atagagattt gacctttttt tcgtattctg tcagccctga  85260
atttcctctt ctataatttt gcctgtttaa tctgtaccct aattgatttt tcagttatct  85320
agtagtatgc agtgcagaca tctcccagcc ttcagcttgt cttttaactt ttatttgctg  85380
tcttttcttc aatagaagtt attaatttta acactgtaag atatagtcat ctttaatttt  85440
tgattcagtg ctttttgtgt cttatctata ccagagtcat taaagacatt ctcttatagt  85500
aaaggctaga gttttcaagt tgtgcttttt caattttaga ctccaataca tttggaatga  85560
gataaggact tgattttttc cccatatata aacaattgtc cttcgaagat tcattgaaaa  85620
ttcattcttt cctcactcct gtagtgcaat ttctgtcata tatcaggttt acacatgtgc  85680
acaattgtgt ttctggacac ctcagtctgt gtctatacat caaagcttta gttgataaca  85740
tgttgtcata agtgctatcc tttataataa accttgagat ctattagggc aagctactga  85800
tgttgatatt cttcttcaga tttgttttat ctgttcttgg tcttgctatt cttgctctac  85860
attatgaaaa tttaattcat tttagtaatg agattttaat tgatgttaag aacatctcta  85920
ttcagttatt ctaaccttcc ttagtgtttt ccaacaatgc tttataattt tctccaaagg  85980
tcttccacat tttttgttac attcatgcct acatatccta cagtttcttt tgtgaatgaa  86040
ataatttcaa ttacattttt attgatgtag gaataatatt aattttttat attgacctaa  86100
ttcatagcca gcaactttac tacaattggt tgtttgtgat catccataga cttgattgga  86160
atttctatgt agataattgt atcttctgaa attaaggttt tgtctttcca cgtctaatta  86220
tcatatctct gatttttttc ttcttttatt atccgggtgt gggtctctaa taaaatgttg  86280
aatagaggca gtgatagtgg acatgctggg tgtttttcta tattttgata cgaatgctta  86340
tgatttcatc attaatgtca tttgtaggtt tttatagatg cctttcatca tgttaataaa  86400
gctcacttct atttctaggt tgccaagagc atttctcatt atgagttgag tattcaatct  86460
tcttctacct atactgagct gactacacag actttccttt ttaatttctt agtgcagtat  86520
attagaataa tagatatttt gatactgaaa ctattttaga ttcctgaaac acttgatttt  86580
atagcattac ttttaataaa caaatccaat aagctgacat tatattagga attttcaatc  86640
ataaggatag tagttctgtg attttatttt cttttacatt gctagtctga ttttgttagg  86700
gaagttacac ttcctttcac aaatggaata gacatatttt tctctttttc tcttctgtga  86760
aagaatgaat aaagtccctc tggaacacca tctagggcta ttgtttgcag tgggatccct  86820
ggtggagaaa gggagaagag agatcttgat taatgactta ttttatggtt tgattattat  86880
ggtttgtcag tttcatggtt tattgcttgc tatttataga gtcattaatt ttaactaatg  86940
tctcacattt ccacagtttt ctctcaggat ttttataatc tctattgaaa ctgaatgtat  87000
aatccttttt gctgccaata ttgtttattt ataactttct tttttataga agtaaatgac  87060
ttctgatgct aactacctgg attttagacc aaacttcaca gcacagaggc acagtcctct  87120
acaagattac ccttactcga gatactaact gtaagctcag ggggttccag ggcctccctg  87180
acatatgaca tatcatatgg ctaatatggt tgatatgaca tatgacatat catatgacat  87240
atcaacaggc taaaaactcg ggggtttcca ctagccttct caagtttgat aatttgctag  87300
aatgactcac agaaatcagg aaagtgctat acttctgatt acatttttat taaagcaaaa  87360
aggttgcaaa tcagagccag ccaaaagaag agatgcagag agaaaggtct ggagagtcct  87420
acatgtgaaa cttgctgttt cctcttttca tggagtgagg acatatcacc ctctcagcac  87480
atggatgtga aacaatattc agagcgctga gaaccaggga agctcacctg agctttgtgc  87540
tgaggcttct gattgggatt tccttaggta ggcatgatcg ctggaatcac tggccatgca  87600
cacaaggttg gagtttctga catggccagt gctcatgaat gatctcattg ccataaacta  87660
ccagggtcac cataaataac aaagatacct atcaattggc aaattccaag gatgtagagg  87720
ctacttccca ggaacttgag gcaaaagcca gtaaaattct ttatttttca ttcaaagaac  87780
cagcttttag tttggttgac actaacagtt tctaatgtac ctgaaattat tggttcgttc  87840
ccaatatttt gaactattaa gtccctttat ttctttgttt tttaaatttc tcctctcacc  87900
tttattattt tctctttttc atttatctct ttggtcatct taaacttctt tgaaaattct  87960
tactggggtt ctctgggtgg aatataaatc attctattat aaagatacat gcatgcatat  88020
gttcatcgca gcactgttca caatagcaaa gacatggaat caacccaaat gtccatcagg  88080
gatagactgg ataaagaaaa tgtggtacgt atacactatg gaatactagg cagcgataaa  88140
aaggaacgag atcacatcct ttgcagggac atggatagat cgggaagcca tcatcctcag  88200
caaactaaca caggaacaga aaaccgaaca ctgcatgttc tcacttataa gtgggagctg  88260
gataatgaga acactgaata gctgaacatg gacacaggga gaacaacaac acacactggg  88320
gcctatcagg aggtgggggg aggggtagca tcaggataaa tagctaatgc atgtggggct  88380
taatacctag gtcatgggtt tataggtgca gcaaaccgcc atggcacaca tttacttatg  88440
taacaaacct gcatatcctg cacatatatc ctggaacttt aaatttaatt gaatttaatt  88500
taaaaaaata aaataatgaa aacaactaaa tgatggtgaa aaaaaagttt gacaaaatta  88560
attttactga gagtaaattc atagtttgaa ttttagaatt ttgttttctt tctcattaga  88620
tttatttaaa atctttgcat gctgcctcat ttggcttggg agattttctt atttctctct  88680
ccctccctct atgatcactt ctactttctt agggatattg cagttgcctt aaccttgacc  88740
ctggacccta ccatccagag ccaggttttt aagtgtcatt tggagaatgc tagccccttg  88800
atatgggtga tatcacagtt cttgtcacta gtctatattc cataaaatat cttgttctga  88860
tttttcagat aagctgataa tttctcctcc tgcctctgga ggcctgcagc tgcctataag  88920
gtcttagcct tgggtagttg gtctctgtcc tttccttagc agagaaaccc attctagtcc  88980
ctgtcttttc actatgaagg ttctcatctt taccttatct aaggtgcctt agtctcctca  89040
ccctatagga agcaattgag tccaacattg cctgattctt gacctagcat atgtttctgt  89100
tgcatttctg gtcaacaaag aggttaacct cgtttagaat tccttcctgc ctctttggtt  89160
tcctgttttt tcctttgatc acagtatgtt tgaaacagaa ggggtttcat aaatcatgaa  89220
ctcattttgc cgtcttgcag ggagtcctct tttctagaaa agtgatttct gcattcctct  89280
gaagacattt ggttttatga tatttgttaa aatgaagagt catttatttt ggccccaaca  89340
aaatctgaca cccacgtttg agttcattaa tcataaaaat tggccaaatg aagaaaataa  89400
tcaatcttgc catagcagca gtctttgaca ttattggtga gtttaatttc attttctggg  89460
aaacttcaag taaataggtt tcttctgaca nntacttttt ggggggtgtt tctaaaagat  89520
ctggacatta tcttgttagg taaaaatata atacaataat gacaatctgg acttctcaac  89580
catccatctc aaaatttgct ctttataaca tactgatata cactataagc taagagtagg  89640
tgatttacag acagctccag actgatacag gtaatcagta atcacttttt gttgttattg  89700
aatctgaatt tcatgtaaga gaatgggatt gcctgaactg attttcttgt gagctttgtc  89760
ctgtaatctt cctttgtgat aaatatgcat ttttttctca tgatatccat catgattctt  89820
tgaaattaga aaacagagac tgcaacacaa atattagata acacatttca aatatctttc  89880
cactcatggg caatgtccat ctctaccatt ttatctcata ggcctgtgtt tacgagatta  89940
gttaaactct gctgttgtta ctggtagagg gtctcgactg caagttgtcc aggttcttga  90000
cgttttgaat aaagaactgg acaaaacgca cagcaaagca aggaaagaaa gaagcaagga  90060
aagcagagat ttattgaaag tgaaagtaca cttcacagtg tgggagtgag cccaagcagc  90120
agctcaaggg ccccagatac agaatcttct caggtccaaa taccccctag aggtttccca  90180
ttggccacct acttggtgtt caccccatgt aaatgaagtg gttgcccgca atcagaggct  90240
gaggtgaagt tacgaagtta cattcctagg caagtgtctg gttgggaaaa gcaaccgatc  90300
agaggtactt tcaattatcc atctgccgca cagaaaaggt gggggtttgc aaagggagta  90360
gcccctggtc cttttgctac tcaggcatgg aaagttaggg tttttctttc aatttagttc  90420
taagaagtca gtgtgaaatg gacttaggtt ccctgcctcc agaccctatt ctcctgcctc  90480
attatggcga catcaaacca ggtatatcgg ttgagcatgc attctcaaca gggagtaaaa  90540
tcacctccaa aggggtgaaa atatgttctt agttgggggg tagaaaattc tctcttttat  90600
aatgcagatt gccttgtaga ccaaataacc aaagtagagt atgtaaaaag atatataata  90660
tggtagaggt atcaaaactc catgaggtgg tgattaagaa caaaatctct aaaagacttc  90720
ttagaagagg tgatttaaaa aaagattggg aaacactgct ttggggtatt tgtaagaaga  90780
aataaatatt tctcttcttt tctatgcatt gtttctaagt tttcttaaag taatgcaaaa  90840
aaaaagaaaa gtttattata ctcttacaaa ttttgtctta actcttaaaa agttaagttt  90900
taacttgtag gtactcacaa aggtggaatg cactgcagaa tatgaaacag aagaagggtc  90960
ccaatgagcc cttcttggtg caggggctgc agactgagga gggccaaagc agtggagggc  91020
tgccaggcta agagtgacaa atggaagcca ccgttccact tttccacagg ctgcctgctg  91080
aatgcctggg atttgcagaa agccttgaga ttggacacct gcacaggtga ctttggtggg  91140
agccctccag gcaactaggt tctgcagaga ccccagttgc cttctccctt ttagatggct  91200
cccagcatgc ccctggcaaa ttccaccctg tccagctacc atcaaggttg agttcactgc  91260
aataatctgg agctgcacat tgagaagtgg ttactagagc ttgcctccac tgcttctatt  91320
ttggttcttc tgaactatta tagtcctctg aatttaagtc ctgtaccaaa ccccataacc  91380
tacactgaaa tacttagtga tcatttaaac taatttgatt ttcctaatca ccttctttaa  91440
atcctgacac agttcttctc tatggcagga taacccatac cttcaagtta agttaggcat  91500
atttttatgt gcattgattt tccataaaat gttatcactt tggcatgaat atttcagaga  91560
gctagagtgt tggcttgtaa aagttaacaa attatgttca aagcaagcca tttgattcca  91620
agagaatctg gaatcaggaa ttctagggga aaatcagtga gactatagat atttaaatat  91680
aatcacataa caatttgcta aatcttttag tgccttttag tgtctttcaa aagaatatca  91740
ttttcccaca gagaaaattg taatgcaaac agatccagct gcatatttta ctataaatta  91800
tgctcattta aacagttcat tccatctgtc cttttgataa tatatgcagt tagtaaggtg  91860
attaattgta tgtatacata attagacaat ctattggaat atctttcagg cattcattag  91920
tagttttctt ttaaaaaaac actttaaaat ggatcaccac tctttttttt tggaatgaaa  91980
atctcagtct gaaaatacag gtgaagggag agatgatgta atgaatgcct attactgctt  92040
cctctgctaa tacagcaacc aggtcaggca tgtggatggg accttcatga cacatcaatt  92100
tcagtttctc ctgagattcc ctagtatcca taggagagaa aacaggttca agtcttcccc  92160
atatcattgc aaggccagaa ctaagaagcc tgtgctagag aggaagtacc tgtcgcagga  92220
cttgcagcaa agtctgagtc ctctggtccc ctgaggccac tgctcagggc agagagcctt  92280
tcatttcccg cagaggagct ggacctgcct gtatgctgct tgtggtccag gagcagtcca  92340
cagagtcctg tgggtctcag tgggccagga agggaagctc actagagact gaattactcc  92400
aggtggagaa gggggtcaat aaatgactcc actcatttct gggaaatcct gtcaccaaaa  92460
agccttcttc agatgttcag caaaggagct atggcttttc aggtctttcg cctccgtaaa  92520
ctatggtgcc ctctactacc cctcatttgc cactgcttaa gatagcataa aagacaaacg  92580
acaattacat caaaaacatg tatccatggt gaaggaaaga aaagttaact cacacacaaa  92640
gggagactca gaaactgagg atgaaactca gagaatcaag acaaatgtct agtctagaga  92700
tttcccaagc aagtagaatt gatgggcgag agaatccgtt gttgttgttg ttgttgttgt  92760
ctcaagaaaa agtaagcagg gcacaaaata caatttctgt aacttcaact aaaaatgtcc  92820
aaaaaatgag ttaaaaaagg gcatagtcct tgagagctag tttttaatat gggagatgaa  92880
gcaggaaaaa ataactcaaa aagtggtaga gatataataa taagggcaaa gtaaaatagc  92940
ctatccacac agctatgaat aataggagtc cctgaaggaa aaagcgaaca gatagaagaa  93000
aagttgtcat aaacaacgga agaaagctta cataaatgaa aaaaaaaaaa aaacataaat  93060
ctgcaaactg aaagagctca ctaaatttta gtgagattaa atgaaaatag atgcttactc  93120
atgtcctggt gaccttccta ggttgcaagc ataaagaagt aaccttgttc agcccctaaa  93180
caggctgaac ctaaacctga aaaagtaaaa taaatgtatt gtgcaatgga tgactcatct  93240
acaatactgg aaagtggaag gtaatgaatc aatatacata gactactgag agaatagaac  93300
tgcaactaca gaatctgaac acagacaaca tgttcatctg tcagtgttaa aaatgcattt  93360
tatatacaaa aggactaaga gagcataaaa ccctttgtat ttatttgaga aaactacttt  93420
aaagtgtgct aatcacaaga taagtaaatt gcaatctcaa tgactagaca aaagaagaga  93480
gaattgatgg gcattggatc tcaatagata ataataaata tgtcaaatag ggatctttga  93540
aaaaagagaa atgataacat taaagaaact agtaataaat ttgtaaatga tttcagcaaa  93600
accaggactt aggaaagggt gtgatatcaa aggagagtgg gatggtagaa gtgtactatg  93660
aagtttgcag atgtgtgggg tggagggatg agtgagccag caatttagtt gtgaagcaat  93720
aagaaaaaag cattggtttg atgtctaacc attgagaatt aagccaggag attagaaaaa  93780
ccaagtcgag cgtccaaatt aatgaatagg gaaagaaatt agcaaatagt tgaccaagtt  93840
aaaaaaagac aagataaggt taaaaatgaa acagcaatga cataaaatac acaggaagcg  93900
taagaccaag tataactttg gcacattttg tttgagcagg ttgaattttc ttatcaaaaa  93960
ccctagaaaa tctgagtatg tttaaacaca aaataaaaat tgtacactgc ttataggaag  94020
cacatacaaa gtggccctgc aaggtaacta aaaatcattt ctaccaaaca cttaaaatat  94080
taagacgttt taaatgttca gcagagtgtg caaaaaatta aggaaaattc ttgaggccaa  94140
aaattaaatg tgacgtgagt ccagaatacc aggtgggccc caaggcagtg gctgccctga  94200
ggacatttgc aaatccttgt gaccagaact tgcagttttc aggagtgtgt ccaggatgga  94260
agtgactaga ggcctgtgca aagtgaagag gcagaagaga ggccccacat aacatcagga  94320
aggaaaaatc ccatccctca gagggaaagg atgggatcat cattctggac cttgacccct  94380
ggcagatcaa aaatgttatc tctggccggg catggtggct cacgcctgta atcccagcac  94440
tttgggaggc cgaggtgggt ggatcacttg aggtcaggag ttcgagacca acctggccaa  94500
catggtgaaa ccccatctct actaaacata caaaaattag ccaggcatgg tggcatgtgc  94560
ctgtaattcc agctactcgg gaggctgagg caggagaatc acttgaacct gggaggcaga  94620
ggtcccagtg agctaagact gatcatgcca ctgcactcca gactgggtga cagagtaaga  94680
ctctgtctca gaaaaagaaa aaaaaaggtt atcatgttat ctgtactgaa ttgtgtaaga  94740
cagcctgccc actcgtgggg ttggagctca aaatcccatt acgtccagaa tctgagaaac  94800
agcagccaaa agttgattta agggggaccc aaatttctaa gatgacccag gttccctgga  94860
agaaccaatt ctttctggaa aaatatgtac cctaaatgca ggtcttgaaa atctagagac  94920
aatcaatgat ttcctggcaa aatacaaact gccaaattga tggatgagat aagaaacctg  94980
atctgaacag cactggacag ctttgctcca ccatcaccaa aaggcctgtg cccatgtggg  95040
tttcctggtg ctttctgtct acttttaaag gtgtgctaat tcttatttta tttcagaaat  95100
tttcatacaa aagataaaaa ctgtacagaa tgaatgataa agctagcata atcttagcca  95160
aaacctgata atgatataca agtaaaacta taggccaatt tcacataaaa cagtaactgt  95220
gaaaattata aataaaatat attacccaat aaaatccaac atgttagcat tatcatctag  95280
agtttttttc caaaaataaa taaatggtta acatcaggag cttttgtgtt atatttcatt  95340
gcctcagtga attaaaggtt aaatcctttg aaggagaata ggaagaaaag gaaagtcttt  95400
aaacatgata aaaattaatc accaagactc atttcaacca ctatatatga acgctgaaga  95460
aactttcatt gaaaacaagg agcaagttat ggattcctat tattaccatt ttgtatttag  95520
caaccattat ataactgtac ctttataact aatgcattca tatgattaac tccaaaataa  95580
atcttaaaaa tgaaataatc ttattttatt tccttatgaa attgtgcaca tttctataaa  95640
aatcgtgaga ctttatgaaa aatattagaa ttaatagaag aatctagtaa agtgggtaca  95700
gaaggtcaat atagagaaat caatagcttt tcttcccact ggaactaact gggtagaaat  95760
agtaaaaaag aaaaaataca tagatagata gagagagaga gagagaaaga aagataggat  95820
atttaggata tttatntnna nnaaacttat taaagaacgt aaaatccagt tcaaataaat  95880
aggaaaagag tgcattcctg gatatgaaga ctagtattaa tcttcttaaa gttctatttt  95940
atatgtaaaa ggtaaagnaa aaaaatcata aagttgtaga catatgtgaa catgtaaatt  96000
ttatgtttgt agcactaaca atatcaaagt tagaaaccag actgttggct agggaaaaaa  96060
tgtttgcagt atatatagca aagattattg tcctcaatac caacaactcc caaaacgcat  96120
aaggaacaca acataacacc atataatagt gtcaaggtta cggacagtaa catttaatta  96180
ctttaaaaag aaattaaagt gattaataaa catataaaca gatgagcaac aataagtttg  96240
attacactga tactggcatg gatttgagac aagataactt tcctgtattg ctgaagggca  96300
aatgatttct tataatattt tgaaagtaat cactttaata ttttctaaat ttaaaacaca  96360
ctaatctgtc tttgccccag caataccaac tttggaaatc tatttataga tatgaaagcc  96420
tcaataaata ctggtattga gggaggatgc ttagtgcagc ctttttattg aagtagcaat  96480
gtgcttaacc accttcctga tgattcctgc aaataccacc catcaatgaa ttagtagaga  96540
aaatgttgag ttacataaac attgaacact atgggaaatt atgcagctga taaataaaac  96600
ataggaccta tatcccttaa tctggaggga tatccacgat tgttagtgac tcagaaaaca  96660
agttgcagag tgatatataa tattcctgca tacccaaatc tttatcattc acagttcacg  96720
taactttagg taataccaag aatgcctatt tgtctttaga attttttttc tttccagagt  96780
aaatacctgt cacattattt ttaacaactt catagaactg tatgtaatat ttatacataa  96840
taagtgtata gaaagtatga acttgacaga ggacaatgac atctttaaaa ttagaaatag  96900
tgctttcata aattgtaaca attgttttta catctcatgt aaaaacatgt aattgcaagc  96960
ctgttnctgt gattgcatat gtgtggatga agaagcagat gatcaaggaa agaatataca  97020
tgacattaac atgaaatacc tgagaaacnt gggcaaagga gttcatncca cgtgtttngt  97080
ggacttaaga tcatttcaaa tttaaaatat attaccttgt tatgtttttt aaggagggaa  97140
atggcaatta aaattaaaaa gcaactagaa tctgcagaaa tggtagattt gagaagtgat  97200
gctaatttcc tcttcacatc taaattaact atctgcagtg cctttaatgt ttcatttctt  97260
aaaacactat tattaaaact gcattttccc cncatgttcc atatatgagt ggaagaaaat  97320
cccttctgat actccacatt agtctagaag aagagaagca aggtctgcta tattcctatc  97380
ttcaataaat catgtagtgt cttctcagag ggacatatta tgactaatcc cagtagtcac  97440
cctcatagtc tttaattaga agttaatctt ctattgcaaa ttttaattcc agctgcaatc  97500
tcctttacaa aatgaaaatt cttgttcata ggacatgtaa aggaaataac atgctgtctt  97560
tatgtgtgtg ttttataata ttgttatttg gaatagtaaa ttcatagaat gcatgtgaga  97620
gattaaaaga tcaaataaat gtgttaatat actaatattg atcattaatt ttattaatat  97680
taaagtaaca tattgattta tttgcataag cacacataga tcaattgctt ggtatgaaat  97740
ctcaatttct cttttgccat gtggcctaaa gcataaagga ataaatgata ttttaacttt  97800
taaattttag tttaattagg ttaataatat gtaagttgtt attttataat atgccatgta  97860
cattaaataa attttatctt aaaaaataca acatacaaaa aaattcagcc ttttgtgtac  97920
atagaaagtc tttaaataat aatggtttta aaataatatc aaatatagat aataaagaaa  97980
taatgccact cacaaacatt caaaatcata acatgttttt ataattgttt aagattgctt  98040
tggtctactg tgttctagtt ggtatgtttc aaatgcattc ttaaagtaaa atgtcattct  98100
tgaccttatg gggcacctta gtgtatatga tagtggcaaa aattcataca ctgacaaata  98160
tgtgaaataa tttagaataa attatagttc tgaatttcaa tttcaatgtt tctttgtttc  98220
tctaggtggc ttttacagta ctttttgatt tggaagcact tctgaagata tggtgtttgg  98280
gatttactgg atatattagc tcatctctcc acaaattcga actactactc gtaattggaa  98340
ctactcttca tgtataccca gatctttatc attcacaatt cacgtacttt caggtaataa  98400
aaataatgcc tatttgtctt tagaaattta tttatttcca gagtaaatac ctgtcacatt  98460
attttaacaa ccacatagaa ttatatataa tatttatata taataactat tatggtaaat  98520
atgaacttga gaaaggcaca atgacatctt acaaattaga aaagtgcatt cacaaattgt  98580
aacaatcgct ttttaaaact cctgaaaatt cacagaaaca atgtagatgt tttacttact  98640
tnttcctaaa ttagcagtat atagatacac atatttttat atatggataa catatatcca  98700
tacatgcgta tnnaantttt aaactacata agatgttggn ncaaacttta aagactagga  98760
aacattaatt taatcccaag tgtttctctt ccttgtcgat aaggctaagt gtttgctcaa  98820
caacggttta taatgaaaat attaaaggtt tataaaactt acctttacag attgtaatta  98880
ctcatacagt attatttata aatgcctgtt acttcatgat ggcacttata attcttattt  98940
aacttgtaat aattggatat ctttttttaa atgtgatata ttggatcaca ttgctttcta  99000
attatgcaat aaacagtaat tattagttac attctttgtt attattgaat atagcaacac  99060
gctcactgtc ctggtaaata cttagtcaaa atgataaaat atgtctacat ggtattctag  99120
tcaaaaacac ctcaaatgta gtcattttcc tgattcaaac ttggtcattt attttttatt  99180
ttattttatt ttattttata ttattttatt ttttatttta ttttatttta ttattattat  99240
actttaagtt ttagggtaca tgtgcacaat gtgcaggtta gttacatatg tatacatgtg  99300
ccatgctggt gtgctgcacc cactaactcg tcatctagca ttaggtatat ctcctaaagc  99360
tatccctgcc ccctcccccc accccacaac aggccccaga gtgtgatgtt ccccttcctg  99420
tgtccatgtg ttctcattgt tcaattccca cctatgagtg agaatatgcg gtgtttggtt  99480
ttttgttctt gcgatagttt actgagaatg atgatttcca atttcatcca cgtcccctac  99540
aaaggacatg aactcatcat tttttatggc tgcatagtat tccatggtgt atatgcgcca  99600
cattttctta atccagtcta tcattgttgg acatttgggt tggttccaag tctttcctat  99660
tgtgaagagt gccgcaataa acatacgtgt gcatgtgtct ttatagcagc atgatttata  99720
gtcctttggg tatataccca gtaatgggat ggctgggtca aatggtattt ctagttctag  99780
atccctgagg aatcgccaca ctgacttcca caagagttga actagtttac agtcccacca  99840
acagtgtaaa agtgttccta tttctccaca tcctctccag cacctgttgt ttcctgactt  99900
tttaatgatt gccattctaa ctggtgtgag atggtatctc attgtggttt tcatttgcgt  99960
ttctctgatg gccagtgatg gtgagcattt ttccatgtgt tttttggctg cataaatgtc 100020
ttcttttgag aagtgtctgt tcatgtcctt cgcatttata taatttatca tggaaacact 100080
agaatgtgca ttgattgttt tctaaataga tattgttaaa tatttgggaa ataaaatgac 100140
agtagaattt taaagaagta attttgagaa acaggactct aaccccttag gaaaaagaac 100200
atgcattgca actttattga ttttatttat tagtaatacc aaaatattat tttcagaaca 100260
atattcactt taactgccag atcacaggta actagacact tttagtacct gggggaaagg 100320
acatgcaaat ataattcaca aaaagtaaaa agcaaaaccc cctacaaacc caggcaaaaa 100380
gctgagccct tgtaatcaca gctaagcata ttgaaaccac agagggtttt catagttcaa 100440
gcgctcactt ccctcagcat ccgtggatgt aaatctctcc tcatktgttg agttatatcc 100500
tgaagcttrg ctatcataag tgacatggct ggggcaagag atatacatgt ttaaaactct 100560
tgatacaaaa tgtgctttcc aaacattcct gtgattataa gctcttgtgc actgctctct 100620
agattcacaa agttatcatg gccattgagt acctacctta gggcatcatt gcacataatt 100680
atagagaata tcctttatat caaaacaaca gcataccttt tttacaaagc tattaaagta 100740
gccaaattaa gaaaattggt gttgcctatt tcagcaaagg tacagtataa aatatattca 100800
gggccttaaa attgctatag tctctgacat gccatttttc agtaaaaagt tagaaaataa 100860
catttgtgtg caaaatattt attatagaat taatgagaga aaaaagaaaa ctgtttaaat 100920
gacaaacatt tgaggaatag cttaataagt cataacgcga atttaaccat aaaattataa 100980
ttgtgatgag ttttttataa cttagaaata tgactgtttt atttaaacga taaacagcat 101040
aaattatatt atatacataa ctacatatat gtatgtatat atttattata tacatatgta 101100
aaatacctat aaaatggaaa aaaatgacta gaaagaaacc aatttattac aaattattaa 101160
tcatctctag tttcctactc ttgtcatcat gtctgatttt cctactagtc tgttttttta 101220
caaaatatct aatattagcc tgcaaggctg taaccatttt atagatagac agatgataga 101280
tagatagata ggtagatgat agatagatag atagtagata gatagatagt agatagatag 101340
tcaaatcaca gtgaagtttg caatttcnag ttnngncntt gattttggat tattctgtaa 101400
nnngtnctgt ttaatttatg ttaatgatta ggtgattttc atttgtatct ctctatacat 101460
ggccatgctt ctctttttct aatgtattaa taatgaataa aaatgatctc agttaatttg 101520
tggctagaaa gtaaatctct tgagaaactt aggtgtcaca agggtttttg caaatttgca 101580
tgtggagaat ccactgtacc agacagagcg gctctttgta taaaggccta cattggtctt 101640
ccctattggt cctcacactt ctcatttcaa tcaacctttc tttactgtgt tggcaacaag 101700
tctttcctta gacaatttca tatttctcac atttaaatga agtaatgttt agtgcaaagt 101760
ggcttccttt aaaatattag ttatctgtta gactaactac tgaagttatt catgtattta 101820
ttcaagtgat atttctgagc ttctactatg tgtcagccac tgttccagat actgaagatg 101880
gagcagtgga caaagcagag aggattccca ttttatgaag ctgaaattct aaaggcaaac 101940
agttcacaaa gaagtacaca aaggaatgtg aagtacaagt actggaaatg tcttaaggaa 102000
gaagtgtgca gggtaaaaag catagagatt gtgtagtagg ggctatttta gattagttgt 102060
tcatagaagc cctctctgaa gaggtgaggt ttgagcagag actgaatgaa gtgaaggagc 102120
aaactgtaag gaggtctgag gggaagcatt ccaggtggag agaatcacac tgagcatgtc 102180
ctgaggtggg tgcatgattg atgtgttcaa ggaatagcac aaaggccagc gtggctgggc 102240
tgcaaccaat gcagggcagc atggcctgtg ggaaatcatc aggtcttgca aaacgctgtg 102300
gttcttacat atcggtatca tcctgatgat attgactggt gcgtcttgtg aatttcctgt 102360
gggtcgggca tcttgctgag tgcattgtct catttgtttc tcataacaag ccctaagata 102420
aggactgtat gtgtaaattg aggtctcaag aaatctgttg acttgcccaa gaccgcatac 102480
ctagcagatg atggagctaa atcttcttcc cggctgggcg cagtggctca cacctgtaat 102540
cccagcactt tgggaggccg aggcgggtgg atcacgaggt caggagatca agactatccc 102600
ggctaacatg gtgaaacccc gtctctacta aaaatacaaa aaattagcca ggcgtggtgg 102660
tgggcgcctg tagtcccagc tacttgggag gctgaggcag gagaatggtg tgaacccggg 102720
aggtggagct tgcagtgagc tgagattgcg ccactgctct ccagcctggg ccacagaggg 102780
agactccgtc tcacaaaaaa aaaaaaaaaa attcttccca agaacatgaa tttcagagtt 102840
catattctta actatgcaat ttctacagca tctcactaca aatcaacaga gtgaccttta 102900
agagaaggac tcagaaatgt gaccaggaaa atgtgtttca gagacaaaat gttctgaagt 102960
gcttatcttt gagagtatgg tttacttcat gttgtatctg taggaacaca aaatcaaaaa 103020
tctttatagg gtagatagag tgaaaaacct gctgatccct gaataaatga aaaggcacaa 103080
ttagactcac tgacagggat ttttcctttc taggaatgca ggtttaaccc tttgaaaatg 103140
ctgatcaaat caccaatgtg gaagtggtat taaatagttc catttttttc aagctgttta 103200
cagttaggta ctgaattatt tatgtccgaa aatagacaaa tctgataaaa atgtgaaatc 103260
tttccagatt attattctgg aaattaatac gaatgttaat actttaatag ttcttatgat 103320
aaagctgttt gcttgttctt tgtaaagatt atctgagagt aatatgtcct gatttgggaa 103380
tgtatgttaa gaattacagc aggatggccg ggtgcagtgg ctcacacctg taatcccagc 103440
actttgggag gccgaggcag gcggatcacg aggtcaggag atcgagacca tcctggctaa 103500
catggtgaaa ccccgtctct actaaaatta caaaaaaatt agctgggtgt ggtggtgggc 103560
gcctgtagtc ccagctactc gggaggctga ggcaggagaa tggtgtgaac ccgggaggtg 103620
gagcttgcag tgagccgaga tcgctccact acactccagc ctgggcgaca gagtgagact 103680
ccgtcacaaa aaaaaaaaaa gaaaagaaaa gaattacagc aggaaaaatt ggtagctgca 103740
ccatgtggta tgatgcttaa tttgaacaac ataatttctt acatatgttt aaaaattgca 103800
aattagcatg aaggaaacat gctttagtca ttttttttca attggtttac ttacatgctg 103860
taaaccatat catttgcatt ctgcagacaa taggaataag actgaccact gatacttcct 103920
gttaaatcaa agtaaatgca gtaaacgtgg tttcaggtat ggcaaaattc agaggccgat 103980
atggtgtcag gggctcagtg tatgtcttca cctacctttc ttctgttggt gtgtcggtgt 104040
cattcttaag ctggttttct ctatgtgaag gcaaagatgg ctcccaggag ctctgtaaga 104100
gtttgtgtga ctcttacagc agtacccgtt ggggattaaa aaaaaaaaaa aaagaaatag 104160
aacatttctt attaaaggca tccagcaaaa gccctgagga tgactcagat gactgtgaat 104220
actctggcca gatctggatc atgacgggtg gggagtcctt cttgcacctt tgtactaagg 104280
ctggggtagg aatgatttgc taaaggaaaa ccaggcagag ttgaagaagc cagaggcact 104340
ggaaagccaa aaagaaacaa atgttatttt agacatgtaa aaattaaaat ctaattttta 104400
aaaatgaatt ttctgtttct tactgtgttc taaatacact attcatcttt aacagacaac 104460
tcaatctctt attgacatca aaaaatcttg gatgatcatt gtataaacta tatttcattt 104520
atgccaagaa tgcaattttc ctatgttaat atctctgaat ttgggagctg ttataatcag 104580
tggtgtgtta tactttaatt ggcagcattt ttttatttct tagagctaca tacaaaattg 104640
gtgacatctt agacttaatg aaaagttgta tttttcacac tatatacttc agcttttaat 104700
tatgtactaa tttatacata ctaatcatat aaatatgtcc ttaaaagctg tgtctttgtg 104760
ttatactcgc tttgtaatag tagccattga atcctatttg tccaacacaa agtttggcac 104820
atagtaatca ataaaggttt gttaaacaaa tgagtgaata aatttgtcaa ttaattactt 104880
attttttttt gcaaatgtga gtatgcaaaa catctaaata tatctgtata tatttagatg 104940
tgtgtgtgtg tgtgtataca cagtcatgca tcatttaaca gcagagatac attttgagaa 105000
atgcattgtt aggcaatttt gttgtcgtgt gatcatagag tttacttaca caaacctaga 105060
tgtatagccc actatatacc taggctatat ggtatggcct attgctccta ggctacaaac 105120
ctgtacagtg tatgactaca ttgaatactg taggcaattg tcacacaaag gtaagtattt 105180
gtatatctaa acatagctaa atatagaaaa ggtaagtctt ataggaccac catcctatac 105240
gtggcccata cttgactcaa aagttatgcg atgcatgact aaaatatatg taaatatata 105300
cacacacaca tatacatgcg tgtatatata gagagagaat agttgagtac atataacaaa 105360
gatccaaaaa tacaaaactt acataagaca gaagtttatt tctctgcagc agttggtaag 105420
tatgcaggga aagcaggtgg ctgtgccccc catggtcacc cagcctgtcg ggttggacag 105480
gacctgtcgt attctatgca agccttctat ttctggtcca aaggggctac actatttgtt 105540
tccatttcca ggcaagagaa aggtatttta aaaaggattc agagaaagtt taacttaatg 105600
caccaaaact tgtacaaatc atttcctctc acattccgta ggtctgaacc cagtccactg 105660
gagacagcta gctgcaaggg agactggaat gtgtaggcta tagccccagg caaccacttg 105720
ctaggttaga attcggaaag ttctgttttt taaaggagga aagagaaaat ggatactggg 105780
ctgataatct caataagaag taaagattct tggcaaaagt ttgcttctct ttccatttcc 105840
ttgtgatttt ctaataatac ctaggaaaat attttatgag acagtgaata taactaatac 105900
aggttgagta tctgtatccc aaatgcttgg gaacagaagt gttttggctt tcgatgtttg 105960
tcagattttg gaatatttgt atgtatgtgc ataatgagat atcctgggaa tgggacccaa 106020
gtctaaacac aaaaattgtt tatgttttat aaacacctca aatacattcc ctgaaggtag 106080
ttgtatgcaa tattcttaat agttttttta tgcatgaaac aaagtgtgta tacattgaac 106140
catcataaag caaaggtgtc aggtgtagaa tttttcactt atggcctcat atcagcactc 106200
aaaaacttta aatttttgag cattttatgt tttaaattag gaatgttcaa cctgtattga 106260
attaaaggtt tccttgcata tttgaacgtt agaaaaatat taattttatt tcaacaatac 106320
gtactagtga atatcatttt gtataatcat ataatatgtt aaaacactta gttcatccat 106380
tcatttggga tttattgagc tagaccaatg gttattctat tgttaatttt agtcactaga 106440
tattcaaata gagaggtatg attttcataa agcactataa aataatattt tagtatgaat 106500
atatttaaga ttcagtgtaa ataaatgatc atatgtgtaa ataaatgttt ctctctccct 106560
tgataggttc tccgagtagt tcggctgatt aagatttcac ctgcattaga agactttgtg 106620
tacaagatat ttggtcctgg aaaaaagctt gggagtttgg ttgtatttac tgccagcctc 106680
ttgattgtta tgtcagcaat tagtttgcag atgttctgct ttgtygaaga actggacaga 106740
tttactacgt ttccgagggt aagagtttta aaaatgcagt aagttaaatt cattgttctt 106800
attttagtaa taatgattaa catcaaagta atttcacttt agtcattcag aagtattatc 106860
ctatttttga taacttggga taattagatt ttaatattta aaattgtctc ttctgcaggg 106920
tgcaggtgtt tgagaccatt ttcagcattg tcagattata tatcaattct aaaattctgg 106980
aaataatcta atagagttag atgctgaaac ctgaatgcta gggttcttag cacctataaa 107040
ttaaaataca gcagaatttt aaaataaagc ttgcattttt gtgttcaaga gagttaacat 107100
atttttaatg ttttataatt tatatattgt tatgttagtc agaatctaga aggaagcttt 107160
tgattttcaa taaaataaaa ttcataggct cttcagattt taaatgtctc tcagctttct 107220
cagtagaatt cacttaagct aaaaaggaag ttagaaatca atggatccat aaacaaaagt 107280
catgtaagag gtacagctct taaccagaag gaccttgaaa tttaactcta tgtggactta 107340
gaaacataaa aaaatacaat gaccagacaa ataatgtata tatttttacc ctaagttgaa 107400
atagtaaggc ctattatatg gtgtattagt ccattcttac actgatgata aagacatact 107460
cgatgaaact gggtaattta taaagaaaaa gaggtttaat ggactcacag ttccacgtgg 107520
ctggagaggc ctcacagtca tggtggaagg tgaaaggcac atcttacatg gtggcaggca 107580
agagagaatg agagccaagc taaaggggga aacctcttat aaaaccatca gatctcgtga 107640
gacttattca ctaccacaag agcagcaggg gggaaaccgc ccccatgatt caattatctc 107700
acacctggtc ccttccacaa cacatgggaa ttatgggagc tacaattcaa gatgacattt 107760
gggtggggac acagccaaac catatcatat gggaagaata atattggggt aaaaacaaca 107820
tatattttta aaagttaagc tttgacagca aaagggtctg tacttctaat ggatagctta 107880
gctttatttt agggattttt ttaaaaatcc tatgctaaat ttattatttt agctaccagt 107940
gttggaattc atccttttat aatgcagatt cttcattcat gtgccgccaa ggatttgtcg 108000
agtgccttta aagcatctgg tcatttaggt aatcatgggg acataagtcc tcaagaaatt 108060
ctcagttgag gggaggaacc agtaggtaag cacagggcac cacaggcctt gatgaaggca 108120
gacaccaggt gctctgggga cacagaggca aggccgattc ccaggcatgg aaaagtccag 108180
aaaggcttat gggaacaggt gactccaatg gctggatgta gccaaaggaa gtgcaaggga 108240
acggattccc atcacaggaa cagcatgtac taaatgtctg aggtgagcaa atccttcttc 108300
cagaacttag caagaaccat caatggtaag aggaggacaa aaggccaagg aactctgaag 108360
tcggttgaaa gtgtgatcgt atctgtcatg ccaaactcct atcaactcta gtagggaagg 108420
caccaggttc aagaggctga agaagagacc cagagccagc agatgagaca tggggtttca 108480
ttgagggctt acatacaggg gagggagtcc aatgctggct ggctggtcag gagaacaaga 108540
cctgcttgca aaatgcatgc aatttacata gcatttttac ttagcacact cccccagcaa 108600
cctccacatg gaaatcttaa ttcaccccag acttggggcc tcaattccct gtgtatagcc 108660
agtgttccac gggaggagat ggggactcag atgttcctca tcaacaagga gtcagtctct 108720
gggttggcca ctcctagatt ccctagctca gaacacacat tcaggtgtgt ctggcaagaa 108780
gggtcattct cggggtatgc ttgagttatt gctttcaggt gcacttacat acgatgttta 108840
agtgctgatg agagagggca agtagctagt gaggttgcag atgggtgaga taaggaggat 108900
gatggcaaag gttcctgcag aggtgggaga aggcagtatc cacagcaaga ggacaaagat 108960
tggccttaga caggtgttga gctgacaggt gtcgaggtga tcctcaggac agcaagccaa 109020
gctgaaagtt acaatcaaga ctttgttccc tcactgcaac agtacaggca ggaggcaaag 109080
gtaggcaccg ctctccagct ctccagcgtc cggaggtgtt ggttaagggt caggtggatc 109140
agcaggcatg ggggagggag ggctcttttc cttgctaagc agtcctgaac aaaaggttcc 109200
agccattcct gcacctaggg aggggaagca taaggaagga agggatagga gaagaaagga 109260
acggagccag catggaggaa agtgcctcat ctgggccctg atcaggaggc ctctgcacag 109320
aggcacctgg tctgggactg cagctatggc catgatccca gctggcctgg cagggcagag 109380
ctgagtcata aattgcaagt ccctccagaa atggcagtgc cctggtcatg caccatgtct 109440
agggtgggga tggcagtggt ccccgggagg tctcccaggc aaggccttgc catcaggtct 109500
gaatggatca cacataggat tttggccagg agcaggactc ctggaacgga ggctggaggg 109560
aggcaagcca aaatgatagc cacatcatta ggcccacctt ctctgggtct gccccttcac 109620
tgggtaaata aaaagatcag ctggccatct tttccatggg aacatgggga tggttattgt 109680
aagagttaaa gaggtaagaa acacaaaaag cagctcaaca gtaaaagaca gatttatttt 109740
ggagaataaa ctttagaggg gcttctggcc aattttgctc aggagcattc tctcttacag 109800
actaagggta tttaagggtg taggaagtgg ggagcttatc gcaggttcgg aatgtttcta 109860
tgtgagggaa agtttattgt ggggttggga ttgggatgtc tggttggagg ggaggctgtc 109920
tcagggttgg cgtgtttctg gtcagagggg gtttatctta gggttggaat gtttctggtg 109980
atgctgacat taggcattag gctgatgttt gggngcttga tttgggtgtt tttttaatca 110040
aagggaactt aaaatggtgg tgtttctcca agacgacgat ctcctgctct gtcaatccag 110100
tccctacagt tatagaaagg aagaggggtg gtatattctt tctggctact tcctgctgag 110160
tggagggtca gagggttctt tggtcttggg ttgattgtgg gagtaatgcc atctgtagat 110220
gtttttaggt aattgtgaga tgtccatgat cctgtcagtt aaaaaatctt tgaaaaaggt 110280
gaattaagcc aggtaagcac attagtccta ggcatattat taggagaggg cccaagaatg 110340
ggatggtcca tgttaggatt ttgtttctaa accaagaatg tatttggttg ttttggtatt 110400
cctttcacgt tttagccctt tcttcaagtt tttcagcagc atctcttact aggcctgatt 110460
ggttgagata gaagcaacat tcctcactca gtgagaggca gagaccccct ttttcagcca 110520
ttgtaagatc taatcccagt ctattttgga ggactgctcc aggcaaggag tctaattggt 110580
cttcgactct tataaggctt tgggctatat cttttaataa atcctgtagt tctgttgaaa 110640
gaactttaaa gtatgttaag gagttggcca gtctgcctgc tcccaatcca agcccggagg 110700
ttatacataa ggcagccatt aaaggaatga cttggatgct cctccttttt ctaacatact 110760
ggatgaatgg aacaggtgaa gattgattag gaggaactag tccaacggag ggagaaagat 110820
aaactagggt acaggttctg gtctagttgg tggggagaaa aagatatgtg ttggtaccgc 110880
ataaaaagaa cgagcctttg tcataatgca ggcggagata gggaaagaag ataagcaaat 110940
taaagatggg gtgttttttc tttcctgcgg ttttttactc caggtggaca aggaggaggc 111000
cagggagaca cccactatag tagagatata ggaagagtta ttttttacac atttaatgca 111060
atcggatgtt gcaccattga tattgagcca tggaaaaagt tgggcaccag gggcagcgca 111120
agttaggcag gaggcattgg ttgacggaga ggctgtaaac tagctggttg cagaaatgct 111180
ccatttgttt caggtgatac ttggtagtca acgtggctac tttgatggtc agaggggtgt 111240
ttaacaatga tagtgtgatt gcattggtta gatgttaagg accctacagg gaaatttccc 111300
tccgaggctg aaaagcaaag tgaggcttgt tgtaaaaggg gggtgtgtgt agttatgggc 111360
ccttcaatgg gagggtcttg gtgcttaagg cattgtagag agttgtaata ggtttgaaat 111420
attttgttgg cccgattggc cctggaagtg aaataatctc tgaacagggt gtcggctctc 111480
tcaaaaaagg aagctccttt tgggagttta taagttaggg ttatatttcc tgttcaaagg 111540
tcatgaagag gtgtaggaag ggctgtgtaa gctgaggaag acagcgataa gcatatccag 111600
cactctggag caaaggaaga gttagctttg cagcaagagg gattgtgtaa ggtttataga 111660
gcattctagt ttgagagcag tgaggagtgg ttttattggt gaggttgata tgattaggga 111720
atttatattg aaagaaacaa tcaaaaagag aaaaaagtta tttgggtagt agtaaagtcc 111780
tggaaagttc cttgaagcca taggtaccat agaacagtca gaaactgatt agcatgtata 111840
atgggagctt tgtaagggta ccactgaagg tctgtagcaa ggttggttag gaagcagtga 111900
aagtttggga gagaaagaga cataagcagc ttatgtggat ttctcttcct tttcctccag 111960
gatttaggtg aggcgaaggg aagtaggtcc tgtggagaca caagagaagg ctgaaggggt 112020
tttagatttg gttgtttgtg tatgtggtga agggaagtct gttttcttga gagaggtata 112080
atgaaaccag ttggggagtc cctggagttt tgctgccatg ggtgtagtaa ggatgatctg 112140
gtaaggtcct ttccatttag gtgtaaggag ggaattgggg ctaggactgg gatcttttat 112200
cagaacccag tctcctggct gtaggaaggg attagaggag ttggtgacaa gttgtggcag 112260
gtgtttgtca gcatattccc aaatgaaatg gcagatggta tgtacaagag gggaaatgag 112320
aggggttggc agaggtgggg cttgaccctg aggtggacca aaaggggcaa gtggtctccc 112380
atatgtgagt tcaaaggggc tgagcattaa aggtttatgt gagagcacct gaatttttag 112440
aagggctaaa ggcaaaagtg taaccgagtc tttatgtgtc tggagtgagt acctggtgag 112500
ggtgtttttt agaatgccat tcattttttc aaccttttct gaagattgag gtcgataggg 112560
gatgtgtagc ttccaggtaa tttgtagggc ttgtgaaagt gtttgagtaa tctgagaaat 112620
gaattcaggg ccattatcag attgaaaaga aagaggcacc ccaaacctgg ggatgatttc 112680
tgttattaat ttggaggtga cattagaggc tcgtttgttg gttgtgggaa aagcctcaag 112740
ccattccaaa aaggtatcaa ccagaactaa aagaaatcaa acccttttta ctgggggtat 112800
atgggtaaaa tcaatttgcc aatcctgtcc tggaaggtgt cccctggctt gatggattgg 112860
gaaagaagag tgtctagtgt tggaatgggg tgaagctttc tggcaaatag agcattgatg 112920
ggaaatggct tttaactgtt cctttatatc tggggttatg tgtttatggg aatttaagaa 112980
gtgttgtaga ggtgaatggc tagcatggaa gaggttgtga atgtcccgta aaagagttgt 113040
ttttttcagg gtcaggtagg actaatttgt tttgtatgaa tcagtttggg gggtttgaat 113100
tgtgcccctg ccatgattag ttgttgtgtt tggtgttctg gataaaagaa ggggatatgt 113160
tgtatgaagg gaaataagta ttggggaatt gggtgattgg ttgagacatg ttttgcccag 113220
tagtcagcct catggttccc taaagaaatg tggcttttgt ctgatgttct ttgccatgaa 113280
taactgcaac cttttctgga agtagaagtg cctttaatag aggatgaatg agctttccat 113340
taatgatagg ggttcctata actgtgagat agccccgctc cctccaaatt taggcattgg 113400
aatggatgat gttataagca tatttagaat tggtgtatta ttaacttgtg tgttttttgg 113460
tagggttagt gctcttatta gggcaactaa ttctgcttgt tgggcggatg tgcccaaagg 113520
caagggggca gcctctatca ctcttctaga tgggagagag tgggtatcat aacgctatcc 113580
ctcaatgatg gcatatcctg cttggagagg agggtttttt gatgcactgc catctataaa 113640
ccagtctggg gctcccttta tgtgagtgga agtaagatgg tgaaacatgg taggaggact 113700
ttcaattaga tcagagcatg agtattggtc aggatctaaa atcggtattg agggtaaaag 113760
agaggcggga ttaggtgggg agcatctatg aagagagata gcgggttgaa ggagggttaa 113820
atgtaaggct tgcatatgag aggatgagat gggggtgagc gcctatggct gaccatatct 113880
tgtagactgt gagaagaaaa tacctgaagg ggtttgtaga acatgagttt ttgtgtctca 113940
gagataatta gagaggctgt ggccaaaatt tttaagaaaa gggaccagat tttataaatg 114000
gggtctagtt gttttgaaaa atatgccact gttgagaagg agtctcccat aagttgggct 114060
aatagtccaa gggcctgatt atgagaactg tgtaaatata gatgaaaagg tcttaggagg 114120
tttggaatgt ctaaagcatg ggcctgcaat aaggcacgtt ttagatgaga aaaagcatga 114180
taaaggtctg gggtgggagt gagtggttgg tcaagatttc cttttgtgtg ttcataaagg 114240
ggtttagcaa taatggcaaa atttgctacc cataatcgga aatatcccac taatccaagg 114300
aaggaaagta agtccctttt cgttttagga aatgggattt gttgaacacc ttgctttcat 114360
gccaacagca tttctcgggt atttggagtt atgatcagtc ctaggtatga aactttcggt 114420
gaggttaatt gggccttcct tttggacacc aggtacccac attcagccaa aacatttaaa 114480
atcttggtgg tgtgttgaat acaatggtca agaaaggggc tgcaaaggag taaactgtcc 114540
acatattgca gcaaaatcct gggttgtaga ggtagttggg agaggtctaa ttgaagtgac 114600
tgaaatagtg atggctgtct ctaaaccccc aggggaggac agtccagatg agttgttggg 114660
agtagcctgt gtcagggttg gtccaagtga aagcataaag gttttgagag gagggatgta 114720
gagggatagt aaaaaaggtg tctttggcca ggtgcagggc tcatgcctgt aatcccagca 114780
ctttgagagg ctgaggtggg cggatcatga ggtcaggaga tggagaccat cctggccaac 114840
atggtggaac cctgtctcta ctaaaaacac aaaaattagc tgggtgtggt ggcgtgtgcc 114900
tgtaatccca gctactcagg aggctgaggc aggagaatca tttgaaccag ggagtcagag 114960
gttgcagtag attttgctac taaatgtact ataagaaaaa aaaaaaattc aaaaggacct 115020
tcaagtattt tcagaaattt ttaaattttg gagttgtgaa taaggactgt gggcctctat 115080
ttttaaaaaa tgcatttaag agtctgtact tctgtcccta caagtccgat tgtgcatcaa 115140
tgccccattg ctttttagct atgtgatact gggcaaatca ttctttacat ttttattctt 115200
cacaaccaag atgtaagccg aaatgtgttt ttttttcttc tgcattttgt gtattaaata 115260
atatacaaag atgacacaac tgggcttaga aagtatttct taaaagacta gattacagcc 115320
tatgtaatat atttgaaatt gataatatta tctgtataaa tggcaaggct gctttttaga 115380
tccattcctg acttagcccc tctatacttg ctctattttc cagctataat agtaatcaag 115440
tagtattaca ttttcagatc tccaattact caattgcacc attttgcctg attattttga 115500
ccatcataat gaaagcagct cggcctctcc caggccccct aatcagttat tcagcagctg 115560
acaatggtga cagcctgaac gtgtgaagtg actagaagga gtatattttt cctttcacat 115620
aaatgttact aaaggtgaaa tccatgaaga gtaataaaat tttacaagga aatgttaaaa 115680
aatattacaa ttacaaaagg ggtcattatc atccctaatc aaataaagca tcaccaattg 115740
gtcttacttg ccagatagaa aatcattcag gagagatgat taaaaacata ttttactcaa 115800
ggctagattt gtcgtcagac gcacatccct gggtttcttt tccctccctt ctctagacat 115860
tatccagtgg ttgagtgctt aaggtaggtt ggttaattac agtattagcc aaggcacagg 115920
acatgaccag aacaaatttt ctgcaagaaa aatcacatga tgtatcgcaa agtgaaatac 115980
agactttaaa aatcagcaat tgtctatgtt atcttgactt gggtccaggc cgtcttggag 116040
gctgcctccc agcaatgttt atagggctgc agaatggtgt gggaaaataa agtgtggaag 116100
cacatgggag gcttggggag ggcactcacc ctgaatctgc ttcagcacta tttaccaggt 116160
gtgtagtctt aggtgacact taatttgtct gagcttcatt catttttaaa atggtaatga 116220
tgtctatcaa acaggcatga taactaagag ccctacttac acatagtaag actttgaagc 116280
ttggagagct tgcataaccc acacaaagtt acacagctgg acagctggat ttgaagttgt 116340
ctactgctcc taccaactat tatccattag gtcacttcta gccaagcaaa cacactagaa 116400
agtgttcagt taggaaatac ttattgagtg ccaagaatat aaatattttg tcaatctgta 116460
cctggaagga aaggcctctg gaatagttca tcacaaactt cccagaggac ttcaggaaat 116520
caagaaaggt atagaggtat taacattttg gggcacagcc tgtgagtgtt aggaatgatc 116580
atgtcaggat cccaaaccag cacctgatag tctctgtgcc acagcagaaa cagcatttgt 116640
ctaagaagat cccacacatg agacaggtga aaggatgttc caagtgacag cttgtgaaga 116700
ggtgtttgaa tggagaatga gcaacaatgc tgaaccaaca caaacatctg tcatccttac 116760
atactgggtg aggctcagca tgccggattc cttttcccag tattgttcat tcctccagga 116820
tcctcattac cctccatcat tccccttacc ctatccaatc agaagcgtct gcataattcc 116880
gttgcaaaca ctttggctgc aagtaacaga aaacttgatt ccagttgact ttaagaataa 116940
ggaaatttat tccataaaat tcaagagatc aggtagcttt caggaagtca ggactggatc 117000
tttcactgaa attctcttaa ttgttgtttg aattgtcagt gttcccccaa aaatgtatgt 117060
tgatatccca actcccagaa cctcaaaata taactatatt tgaaatacag gtaatcaagt 117120
taaaatgaag taatcagggt ggaccctaat ccagtatgcc tgatgctttt atgaaaaggg 117180
aaagaacaga cacaaatatg cataagagga agatgatata gacccacagt atattagcct 117240
gttctcacat tgctataaag aaatacctga gactgggtaa ttacaaagaa gagaggttta 117300
attgctcccg gttctgcagg ttgtatagga agcatggcag catctgcttg gctcctgggg 117360
aaaccacaag aaacttacaa tcacagcaga aggcaaaggg gaagcaggca agtcttatat 117420
ggctggagca ggaggaaaag aaagagagag gaggtgctac acacttttaa gcaacctgat 117480
ttcatgatga ctcactcagt gtcatgagaa cagcactgag aagatggtgc tcaaccattc 117540
ctgagaaacc acccctataa tctaatcact cccatcaggc cccacctcca atattgggga 117600
ttacaattga acatgagatt tgggtgggga cacagatcta aactgtatga cacggggata 117660
tggccatggg actggaatgg catctacaag ccaaggaatg tcaaagaatg ctggcaaaca 117720
ccagaagccg taagatacaa gggaagattt ttttccctag agctgtcaga gcacagccct 117780
gctaacacct taattttaga cttctggcct ccatacctgt gagacaatac atttctgttg 117840
ttttaagcca ccaggtttgt ggagcttttt taccacagcc ctagcaaact catacagtga 117900
ccttctccat gggttgtctt cctatgttag caaaatggat gtgacatttc caggcttcct 117960
gatgacatct agaggaatat gtgggtcctc tgttcccagg cctcctcctt aggaccagga 118020
aaccttttct atcatccctt tccttccagc aaacttgctg tcatctctca ttggcaggat 118080
tgagtaacag ggtcattcct agaattaaaa ttactggctt tggttaatca catgggaagg 118140
agtagatgtt gtgaagacaa ctacttgggt cagacccaaa acctggacaa gatttctctc 118200
agctctgtct ccaaagctgc tcctatattc cccatgcaaa caaggtttgt aaatagacgt 118260
ggtagaaaga aagctggtgt ttaattcctt tcaccagaaa catctggacc ccagatcctt 118320
cccaagatgc ccaaataggt aggtacctgc aaagtagcta gcatagggct ggacacagag 118380
tagatcagtt atggattcct gctctccctg tttttatggt actggtcagt ttctatcaca 118440
taccattgac attacacatg ggtcttactg cctttgctag tctacaggta ccttgaggtt 118500
gagagcatgt gcattcctta cacctccaag agcacttaac actgtgcagt gggatctgta 118560
agcatcagta agtagagtca gaaaggaaga cagctaggac tctatcagta tataagccca 118620
agagatggag aagggatgct cgaattctac tcgatggaaa aacaaagaat gctatattga 118680
tagaatttaa taaaacaact ttgtcatctc aagccaataa ctttctgttc tagtttggac 118740
caaacagcta cactgctaaa tagaaataac aagatgaaat cctgatgtaa ggcaatatgc 118800
aacagttcct gttttgttgg gatgaatata ttgtatgagt acaatttaga tgaactattc 118860
attctggaac agcctgtaca ggtcctaaga cagattgcca taagcaagaa caaccacagt 118920
ctttctgtat caaaaacaaa ttgcatgttt ttccataatt gcctaacaaa agctcataag 118980
cagcttcagt aagattttac tcagtttttc ctccatttat tatagaaagc aactgcctct 119040
aaattactga aataaatgca gtaaacattc actgtccatc tttaaccagc tctgtatctt 119100
tattccttct gatttcccac taaaataata aacagacctc atatgtttag cggttgtata 119160
aatggggata gtttttattt ctaagtaata tattatcctc tataacacaa agtacttaaa 119220
ttttagtatg atttatttga tataggtttt cttaattttc attctctaaa tgttaattac 119280
ttgctctatt gagttttcac ttataaaata tgtccaaaac agttattgca cgatagaagc 119340
aacaaatgct ataaaacaca taattaaaaa ttaactttcc tttcctcttg ccaccaaaat 119400
gactagtcgt gcagttagtt gtattaaagg aattaccaaa aaatttgaag aaacaatttg 119460
ctccttaatt ttttaaatta tttgtcagat gtagtgagag tgtgtgacat ttttaataga 119520
ttcaaggttt attttaatat ttaaaactat tagttcaatt aatattgctg aaatctttaa 119580
tttttgttct gtctttcatg tatttttaat tttatcatga aatatttgat gtgcaaaaag 119640
atatgaataa taataaaaca tactcctctg tggccatact taacaaacac taaattgcaa 119700
tagacctgaa gtccctgggt gcctcttcct gatctctgtc ctctcactct cccatggaga 119760
atcacttttc tgattttgat gtgtgttttg ttaataaatt tctttatact tttaatgcat 119820
atatggacat caactgaaaa tcatatatct tttgtgtaat ttaaacttgc cttatatggt 119880
ctcattctgt actatttctc ctgctaattg cttttattgc tcaatattat gtttatgaga 119940
gttacctaaa tgagtacatg gagctgtatt ttatttattg tcattactgt ataaaaagca 120000
actacatatt atattgcata tataatacat tctttataca gacagaacac aatttatttt 120060
ttcattttcc tgtgcagtag gcagattcta agctgtcccc catgatatct ccgcacgagt 120120
gtccataccc tgcatcatcc cctacccttc gatactggta ggatttgtga atatgatggg 120180
ctgtcattcc tgtgaatagg ttgctaagca tttaatgttg agtcagtcat aaatagagat 120240
tgtcatgtgt gggcctgtcc taatcagagg tactggcctt ttcttagatt taaagcaaga 120300
aagggtcttc tgttggcttg cattaggaga tatacctaat gtaaatgatg agttaacggg 120360
tgcagcacac caacgtggca catgtataca tatgtaacaa acctgcacgt tgtgcacatg 120420
taccctagaa cttaaagtat aataaattaa taaataaatt aataaatagg aaaaaaaaag 120480
taagcctcca tgttgtgaag tgctgtgtgg ccaagaccct gggcaacagc catcaagaaa 120540
gcaggactct cagtcctgca accctaagga acaaccctct gataataacc caaatgaagt 120600
tagaagaaga ccgcaagctc cagatgagac caaagcccag ccagcatctt gatttccacc 120660
ttttgagact ctgagctgag agcacagtta tattacacca tgcccacatt ctgaccttca 120720
aaaactgtga agtaacaaat gagtgttaag ctgcttcgtt tgtggtaatt tgttacacat 120780
caatagaaaa gtaatgcatc caggtgttgg atgtttctaa atattgtaaa tccaaacagt 120840
actgctctga acatttttgt acattgattt gtgcacatgt gaaataattc tttttagggt 120900
atgtatctgg gaatagagtt gctgggtctt agaataaaca tatcctcatt tctcattggt 120960
attgataaac tttcattcca aagtagtttt accaatttat cctaagctat cagcagtata 121020
tgagagtatt ctctacttta ccactcagga acacttggtc tggtcaggct ttattttgct 121080
tgaaacactt agctcttcat ttagcctgaa ttgatttttg tggctgctgt gagagaggga 121140
acaattttat ttccatttgg ataaacaatt gccacagtac catttattga ccaatctatt 121200
catgccccct agttctgcat catatgccag ctgtgtcata acgtggttcc atatgtgagt 121260
gcccaagtca agaggcacag gctcccttgt catccccttt tgccattgaa ttttttttac 121320
tggatctgga tcaacctcct ctctgaggtt taaaaccaat aactatatag ctttgctcaa 121380
gtatctcagc agtctcctcc tttcaaaggt tcatgacttt gtaccttatc tctgacacaa 121440
cattaaaaac caaagtctag cagagatcgg aaattctcta gagaaactga cttttcttga 121500
ttcaagctac ttcttagctt ttggtccctg gagtttttaa ttattttctt ggactattca 121560
cctttaaaag gatgcttttt gcattttatc cagaatttcc tggggttttt gaatcatttt 121620
tttccataca ggatgagaaa ctgaggttca ctaataaatt tttgagaaga agaaacagta 121680
ctccatggac tctcagatgg atagactttt ttaaaaatta tactttaagt tctagggtac 121740
atgtgcataa cgtgcaggtt tgttacatat gtatacatgt gccatgttgg tgtgctgcac 121800
ccattaactc atcatttaca ttaggtatat ctcctaatgc tatccctccc acctcccccc 121860
accccatgac aggccctgga gtgtgatatt ccccaccctg tgtccaaatg ttctcattgt 121920
tcaattccca cctatcagtg agaacatgca gtgtttggtt ttctgtcctt gcgatagttt 121980
gctcagaatg atggtttcca gcttcatcca tgtccctaca aaggacatga actcatccat 122040
ttttatggct gcatagtatt ccatggtgta tacatgtgcc acattttctt aatccagtct 122100
atcattgttg gacacttggg ttggttccaa gtctttgcta ttgtgaatag tgccacaata 122160
aacatacgtg tgcatgtgtc tttatagcag catgatttat aatcctttgg gtatataccc 122220
agtaatggga gggctgggtc aaatggtatt tctagttcta gatccttgag gaatcgccac 122280
actgtcttcc acaatgattg aactagttta cagtcccacc aacagtgtaa aagtgttcct 122340
atttctctat atgcctccag cacctgttgt ttcctgactt tttaatgatc gccattctaa 122400
ctggtgtgag atggcatctc attgtggttt tgatttgcat ttctctgatg gccagtgatg 122460
atgagcattt tttcatgtgt cttttggctg cataaatgtc ttcttttgag aagtgtctgt 122520
tcatatcctt cgcccacttt ttgaaggagt tgtttgattt tttcttgtaa atttaagttc 122580
tttgtagatt ctggatatta gccctttgtc agatgggtag attgtaaaaa ttttctctca 122640
ttctgtaggt tgcctgttca ctctgatggt agtttctttt gctgtgcaga ggctctttag 122700
cttaattaga tcccatttgt ctattttggc tcctgttgcc attgcgttgg gtgttttact 122760
catgaagtcc ttgcccatgc ctatatcctg aatggtattg cctagatttt cttctagggt 122820
ttttatggtt ttaggtctaa catttaagtt tttaatccat cttgaattaa tttttgtata 122880
aggtgtaagg aagggatcca gtttcagctt tctacatatg gctagccagt tttcccagca 122940
ccatttatta aatagggaat cctttcccca tttcttgttt ttgtcaggtt tgtcaaagat 123000
cagatggttg tagatgtgtg gtattatttc tgagggctct gttctattcc attggtctat 123060
atctctgttt tggtaccagt accatgctgt tttggttact gtagccttat agtatagttt 123120
gaagtcaggt agcgtgatgc ctccagcttt gttcttttgg cttaggattg tcttggcaat 123180
gcgggctctt ttttggttcc atatgaactt taaagtagtt ttttccaatt ctgtgaagaa 123240
agtcattggt agcttgatgg cgatggcatt gaatctataa attaccttgg gcagtatggc 123300
cattttcatg gtattgatcc ttcctatcag atggataaga cttcagatgg atagactttt 123360
taaaatgagc atgatctagg gcaggccatc ccagtgtttg cctttactgt ccgcagcctc 123420
acagtctttt gcctttgttt gcattgagga tattgtgtcc tctttgaatg tcatagcctc 123480
agctttaccc tccctcagtc tgccacacca ctgaaaatca tctttcacaa aatatctgat 123540
atacccattt atgatgaaga taaataaatc atgttcttgg tttttcattc ataattctat 123600
caacattctt tatgcaacac agctaggaag catactgaca tgaacaaatg tactcactgc 123660
cctctttaac tatagcattg tcaagaaccc aaggaaggac tgaaacaact catcccatag 123720
tagaacacat aagaaagatc tcaagtaagc caaaggtgac atatgctaca atagatgtac 123780
tcagttctaa agtaatagca aagacatttg ggagagtatt ttaaaattct gggaatttac 123840
tgtgtgccta gcacttccaa atatcagctc atttaatgag agaaaaatat tgcttccaga 123900
gaaggaggtg tgcagagctt tataaagatt tgtctttagg ggtgaatata atttcaacag 123960
gtagagattt gggtcatggc attagatgaa ggcattccat ataagaaaaa ccaaatgagt 124020
aaattagaga catggagaat cacaggcatg gagggacata tgaccaaagg atggcagtag 124080
caatgggaaa ccagacatgg agggtcttca gtggttggaa ctgtgacaca agggagcttt 124140
tgaagatttt tactttattt tttttaattt tttttttctt ggagaatagc agaagagcta 124200
ttttgaggaa agttacactg gaagaaatgt tatttctatg aggaggtatt ttcattgaac 124260
aaaattcatt tttattgatg aaagacaaga atttatgatc agttgataaa tttcaggcat 124320
ctttggagat attttatatt tttttctgtg aggctgttac tgtgtcaaat ctttcacagt 124380
ttcataaaat tgagtctcat ctgaagcttt aggccagatt gttatccatg gttgagcatg 124440
actctgcaat agaaactaac aatttggctt attttaaagt gataccatga gatatatata 124500
tatatatata tagtttattg tcattgtctc cccccccaaa aaaaactgta aaattaattt 124560
tcattatttc ctttctacta taacattagg gttttttttt ccttgctcct gttggaattt 124620
atttttgtgg tgactcatct gtggcataat gatgaaatga taaaataata tcctgtgtac 124680
ttccttttag aggatgattc acataaaatt ggccatcttt tcctgctgtt gtatattaat 124740
atcattggtc cactgaactg caatgatcag aattatgact ttccttgaat aaagcatcct 124800
gtttcctacc cctaacccta gaagagtact ctttcaggga gaacctattt ttgcagctca 124860
tcttattttg gtagtttttc accaatcatc ttatttgcaa tttcccaact atttaattgt 124920
catcttacat taatattatt ttaataatca gactgttcca ttgttcaaat tttaaaaata 124980
aatgaaagtc attaatgaaa agtattgtct cattccatta taatgagctt cctcaagtat 125040
gttttcagtg atgaaaacat gaccgtgtta ttaaatattt tgtggattct tgcctacaaa 125100
aagaggacag ttcatacatt tgtgtctgta tgccttttag ctctactgca taaagaatgt 125160
cggtggaatt ttgaacaaca aaacaggcac atgatttatg tagtcttgcc tacaaaaaat 125220
acagtctgta atgagactct attgtcagtc tctcatggct acccacaatt tcctatcaat 125280
aaaacaggat aataatacat aacttagagg attggtagga agattaaagg aagtaacagg 125340
tgcaaagtag ttagcactgc gcctgccatg taaacaggca cttaacaagt agtagcagtt 125400
gtccttctta aatgcatgga aagcccatgt cttagcatgg catgctgaat tcctagcagc 125460
actgaggtag cccagcatcc aagggtaaat gactggagaa ttaatggaat ggtgggcact 125520
cagttttctg tgttgtatag aaagtttaaa actttaaaaa tagtccccaa ttccagttta 125580
ggagattatt tttaatcagt cttttgcgac tttccagaca aatgcaaaag gtaaaaaaaa 125640
atcatattac agaaaaataa gacaaaccga caagttattt ccagacgcgg aaatagctta 125700
tcattaacta ttacatatac ggaactaaac agagaccatt cacccaatga tatgtatatt 125760
cattctttct cttgggtata cccttcttgg atgtaacacc cagagtctta gtgtgccaga 125820
agactaaaat gcctacttct gcagaggact gtctctaaca ttttttctag gaatcaatgt 125880
tgaaatctta atttccagga agcatgatgg gataaagcat aatgtgtgta cgtgtgtgag 125940
catgcatctg gctgagcaca tgtgcatgca gatgggggtg gggaaggaga gagggacccc 126000
ccctaagcaa atggaagcta atgggctgca tcctataatc ttaaattgtg caatacaaaa 126060
ggaaaagcag agcaggtggg accagatgca gaaagaacct tagtagctag tttagatgga 126120
ggtctgcagt attgctgctg tggcttttgc tgttgcttct ttgtgttgtt attttagttt 126180
tcagaattcc ggagaaaaag gcaacaggca aaagataaaa atcctgcctc aatccaacag 126240
aaatgtactt gctaaattcc tgtgagaact ctgcaaagtt ggcaataaag aatgcatatt 126300
aatatgaacc accaaaaagt gaattctgtt aacattctag acaaatgtca catttgctgt 126360
ctcttgggat aaaccaagtc atttcaagtt gagtaaaatg aagtaaagcc agtgggatta 126420
tgcaaaggta cagcaaatga aaggaaaggc aacactctct tgaagagcga gggagaactt 126480
tcctgtatta ctcactagac aaagattatt atcttcatct tatagttgct gccaattcaa 126540
caataaataa aaagaaatgt ttattatatt tggccttgtt ctaacagaat ataatgtgtc 126600
cggcaataat tatatccagg tcaaataaat ttaatcaaaa tttaaagtaa ttaaaaataa 126660
aacaaattaa gatggaaaca aaaaatggca ctccaaaacc taaaaggctc atcatgagga 126720
cactcatgtt tcccagaatc ccggaccaag cgtgactaat ttttctagca aatatacact 126780
ttgatagaca aacatgttta tacaagttct acagtgatta tgaggtacca actagttcct 126840
agagaagcat aattattcct gatcaagtcc agaaagacat ttttctggat gttattaatc 126900
ttaatggtta ctatatgtga ttgcttttta tgtgtgagag tttacaagag ccttgaagaa 126960
aaatggagag atggatgggt atacacagag agagagaggt gcacacacac atagatatcc 127020
acatatatct aatataattc tcaaaacgac ttcattaagg aaaattatgg acgttataaa 127080
aaagaagcag tgaggaacag caccagaaat tgatgagaac caacaagaaa acatataagg 127140
ctacaataac tagaagtgca tgacttaggg ttcgcagaca gatgaatggg caaacacgca 127200
ttgctataaa gaaatacctg agactgagca atttctaaag caaagaggtt taattggctc 127260
accattctgc aggctgtaca ggaagtgtag caccagcgtc tgctccttgt gaggcctcag 127320
caagcttcca gtcatggcag aaggtgaaag gggagcaagc ggtttcacat ggcgagaaca 127380
gaaacaaaag agagaggagg cgccaactct ttcaaacaac cagatctcct gtgaatttag 127440
agcttagagc gagagctcac tcgttatcat agacagcacc aagccatttg tgagacagct 127500
gccccgtgac ctaaacacct cccagcaggc cccacctcca acactgggga tcacatttca 127560
acatgggatt tggaaaggac acacatgcaa accatatcac catatattca ctcaaacaac 127620
atgtaacaaa gtgtcacaat gaatgattaa aagacatatt aaacaagtta agttgggaat 127680
actaaagccc tctcatactg tgtccggaat tgttgggttc ttggtcttgc tgacttcaag 127740
aatgaagccg cagacccttg cggtgagtgt tacagttctt aaagatggtg tgtctagagt 127800
ttgttccttc tgatatttgg acgtgtccgg agtttctgcc ttctggtggg ttcctggtct 127860
cgctggcctc aggagtgaag ctgcagacct ctgtgatgag tgttacagtt cataaaggtg 127920
gcacatctgg agttgtttgt tcctcccgtc gggagttctt tgtccctcct ggtgggttcg 127980
tggtcttgct ggcttcagga gtgaagctgc agaccttcgt ggtgagtgtt acagttcata 128040
aaggtggcgc atctggagtt gttcgttcct cctgttggga gttgtttgtc cctcctggtg 128100
ggttcgttgt cttgctggct tcaggagtga cgctgcagac cttcgtggtg agtgttacag 128160
ttcataaagg cagcgcctct ggagttgttc attccttccg gtgggttcgt ggtctcgctg 128220
gcttcaggag tgaagccgca gacctttgcg gtgagtgttg cagctcataa agacagtgcg 128280
gacccaaaga gtgagcagca gcaagatgta ttgcaaagag caaaagaaca aagcttccac 128340
agcacggaag gggacccaag caggttgctg ctgctggctt gggtggtctg cttttattcc 128400
cttatctggc cccacccaca tcctgctgat tggtccattt tacagagcgc tgattggtcc 128460
attttacaga gtgctgattg gtgtgtttac aaatctttag ctagacacag agtgctgatt 128520
ggtgcattta caatcctttg gctagacaga aaagttctcc aagtccccac tcaacccaga 128580
agcccagcca gcttcatgtc tcaatactat gtatcaaaac attttcttga tgaattagag 128640
caaggatatt taaagaatga aaaatgtaga gaacaaaaag aaaataaaat cttaatcttg 128700
gatagtcaaa ggccacctaa gcctaacaga ataaaatcaa ttacaaagaa gaatgaattt 128760
gaatttttaa acaagtcaaa aataaccacc aaaaatattt tctaaacaaa atatgaaata 128820
caaccttaac ttaccatttc agtaagaaaa tgtcaaatgg acaagattta tttgctatat 128880
ttggtttttg ttatcaacaa tgcacactgc tggcaaggaa gcacagatac tgtgatatat 128940
tgcatgtggc agtgaaaatt tgtgtaactt ttctgagaat tggtttttta ttatataaaa 129000
tgacactaaa aagcatctta tcctttgatc ttctaattgc atttataaaa atctctccta 129060
nagaanagta acctgagatg catacaaaga ttgatcttca aaaaatgttt tttgttgcat 129120
tatttactgt tttgaaaatt ttgaaacagt ttttctgtcc aaccatagta gaatgactaa 129180
gtaaattttg aaatatagtg gtttatcatg caattatcaa aactatattt ttatagacta 129240
attagtgatg taagtcatga gtgagagaaa tggtgatgat aaaatatttt taaaaatttt 129300
accaaactat atttgcagct gaattcaatt ttgattcaag tacatttgta tgcctagaaa 129360
caaactgata gaatgtttaa attacaaaac aaaatatata cattttttgt tatatgtgta 129420
tatatatata tatatattta aaaaacctgt tgtttgaatt attttatgct tcatatattt 129480
tggtattttg agatttttta ctatgaaaat cttcaaaaat ggaaacaggt ggactgataa 129540
acaaatagat ataaaacctt actttatagt taaacatcag tgagaaaaaa actgtttttt 129600
aaatggcaag tacatgaaca ggtaaagttc taaaagaaag aaaatacaca cacacacgga 129660
catgctagtt atatttacaa taaaactaat ttaggttttt gacttgtaaa atattttatt 129720
aaagtaaaat aatttcaatt aagtgtttat tcataaacag ctatcaagtt tatttttaag 129780
gtattaaagt actaaataag cactattaga agtgtggctt tgaaatttat atctgcaaaa 129840
gaccacatca tttttgataa agctctttat ttgtgagctt agtgaagaga aatgagaaat 129900
caaagttgat tacacaggtt actttttcac atgataagag aaagatacag ggagggagga 129960
aggcaggaat tgnntgagat tttagaaaat ctcagattta aaacttttaa aaattaagta 130020
ttgggcatga ggaaatgagc agagaaaata gtagtcatat ttccacattt gtaaagagaa 130080
gaacaatagc caggcaaact ccatgtctga agtgtggttt attttaatat gcaaaacata 130140
agcatttctc tgaccaaagc tgctttctat ttaaagctaa atataaaaat attatttttg 130200
agcatagtat tgcgagaaca tagtgaaatt tcctatgtag attctgtgct gttttagtta 130260
cggaaatatt tttaattaat cctccattta acaatggggc atacatctgt gtttttcgaa 130320
gcactgtttt gtatatatta gtaattatca ttgcactgaa atgaaaatat caatttcatg 130380
tacaatttta tagcacatat ttgattgaca atgaaatgca tttaacttat aaaaatgtaa 130440
tatggctgac attagcaaaa tctcttatta agaaataggt cataagtact ccaagaaact 130500
tgacagtctg ttctatgaag agcattaatt caaaagtccc ctatttgcat aaatctccag 130560
gtctcatttt cacagctgtt tgttgtcagc tagacggttg cagttcaaca ttattttaac 130620
ataatcggtg ggaagtatac ctttcaacta aaaataccat gctctgcaag aaagattgtc 130680
aggggtaaaa tataagttca ttcagttgat cttgatattt ttccttaaaa taaatatttc 130740
taatacagga actttaagtc tcaaattact gaaatatttt tattattaaa atatattttg 130800
taattttata ttttcataaa aataaaaagg ttatgtgttc atacataaaa atgttaatca 130860
gtagagctta ttttagcaaa gagtaaaaaa tactgaggat atctattttt cattaatcag 130920
ccaagcatta tatggagtgc aatataggtg tgctggaaaa aagaggatta aaatttttag 130980
atattgctga gaatatgcat gtatgttctt tgttttatta attttaataa tggaaaggga 131040
tcagcaatta ttagatctta aatgtctttt acctgtaaca cccaagagca cagaaggaat 131100
caaagtcaag agatctcagc ctggatactg agcaacacca tttgctacct gtaagctgga 131160
gttcttgatt taaaccctat gtacttcagc tctccatctg cagtaggggc cattatatct 131220
acagtaatca cttcacaggg tcattgctaa gattatatta aataatggac aattaactac 131280
tgtgggaatt gcaaagcacc atacaaatgc tagtcctggt tcagtgcctg ttctcatatc 131340
atttcatctt agctgcaatg aaatcctagt acaaattcat gaccttgtcc agctgtcatt 131400
tatggtataa tacataaaag ttaacccaag catagccaag gaaagagaca attggacata 131460
cctacatata ttttcataac tagcaaaaag attcgctggt ttttgccaat gtgcttctgt 131520
tacttttttt ttcttttact cttgaaatta tatttaagtg tagactccac ttaaagtaat 131580
ttgctgctgg aataggcata atgttctgat gtctgctttg cttctaatta tgttcaagct 131640
cattttgaca tttaaggcca attacaaaag tctagattca gaagactttt ccttagtcat 131700
ctaaaatttg aacaataaac agtttttttc tcctctctct ttattcattt aagtggtatg 131760
cttggcaaca agcatatttt gggaattgta aaagcaaaat aaataatgtg ggttcatttt 131820
gaaaaaagaa ctacttggtc tttcttgcca acataaaagg cagtcacaga attaactgaa 131880
accaccagtt tcaactttat ttcctcctaa atcacaagga ataaggaatt attttacaga 131940
tacagtgata ttttaaacgc ctaagttcta ttaacataaa ggtaattgac ttcaacagat 132000
ctctaattcc aaaagagttc atacatagag agatatgtat aaaaatagct acaaaatctt 132060
tatcatttaa aagtcactca taattaaact ccccagacta ggaccctaca ccaaaattca 132120
gttagtgttc cattgcgttt taacatccag tcatgtgatg acttacgaca tagagcaaag 132180
cacttaattt acctgcctcc ttattttcag tcaatttgcc aactgcaatt tttactgttg 132240
attcagtaga agaccctgat gagttgacag caccaaaagg caattcatag catctattag 132300
taagaagtca ctgtagcttc tttgtttaac ttttataggt aagatctggc ttggaaaaat 132360
agactggaaa gtatattgta aaaaaaacaa aattttccaa ttgactgtca ttatcagtta 132420
atagattata gaatagtaga cctttatagc tggaagatat gtatcgtgta cttcaaagat 132480
gaaaggaaat aatgtctttg aaaacactgt caaattttca aaattatgta tctaaaagaa 132540
attccttaaa aaatagttta tcctttataa tttttgaact ttataaaaat ggaatcacac 132600
catatatgac caaacatttt aagtcataaa gaatacacag gaattctggg ccgggcacag 132660
tggctcacac ctgtaatccc agcactttgg gaagctgagg tgggtggatc acctgaggtc 132720
aggagttcaa gaccagcctg gccaacatgg tgaaaccccg tctctactaa aaaatacaaa 132780
agtcagccag gtgtggtggt aggcacctgt aatcccagct acttaggaga ctgaggcagg 132840
agaatcgttt gaacctggaa ggtggaggtt gcagtgagcc aagatcgtgc cattgcactc 132900
cagcctgggc gacaagagcg aaactctgtc tcaaaaaaaa gaaaacatag gaattccgga 132960
atttaaccac tgtgatagaa gttgcttttc cttgggacaa tatttttaag gcagatttca 133020
aaattattat ttcaactatt ctttatataa tgctttatta tttttaaagt attcacatat 133080
atgttatttt gattttcaaa acaatcttcg agtgacaatg ggattgcata tttgagaaag 133140
gctggtctca ggacggctga atgtttttcc caaagccgtt aagtaagtcg gtgacttaga 133200
ctcagacgct gtgaaagcag aggctgagta cttggttctt gacctcactg atctgctggc 133260
ttacagagca tcctggtctg catactcagc gattcaatct ctatcttaaa cgcagtccct 133320
cagccattcc ttctagaaag gtgatctctt tagagtgaga gcagtgatgg aggtggctga 133380
agttacacca gggggagcag ctttgaaaag ctcctggctg ataggcatgt actaatggga 133440
gcaggagctt tgttggcagt gtcgaagtcc ctttggaggc tgtgtgagga gggaacccat 133500
ttccctggga tatagctctc tccacagggc agctggatgg ctaggggcag ccatggagta 133560
tcagattcac ctaggaatcg atatttttcc tgagggtttc acaaaaaaag acagagagat 133620
ggaatttgaa gaactgggaa gagtgtgatt gaattggagg gatctgaaat aaagaaatag 133680
ctatggtcaa tggctctaac caacagtact atatttatac tccaaattcc aaatccacac 133740
tatgtgtatt taggtacaat ttagtttagc catagtaagt tgtggcttct ggagctttta 133800
tttaccatag gattttaaat acatttcatg tcatcttcat tggttttcct taacccctaa 133860
ttctccacaa gatcttcatc ccgtcagtta tgactttgcc aaccaatata ctttttagaa 133920
atgtaacccc aacattaggt acgaccagca tttactgtat atcaatatta tcctaaatat 133980
tgctgtagct ttgaatagct gaattaagtt ttaaataaaa gcaaaggaat tataaaacaa 134040
aatattaacg gattatgagg tcagtgggtt tttctgaaga taaaactatt ctactaatta 134100
ttgctgtttg ggaaaaatag aaacaaggag actgagtaaa tgaatcatta aggcaattaa 134160
aaacagaaga gaagtcactt ttgcactcag tgaataccat caaggcaagt cttctatttt 134220
agggctgtct tatagtaaga tataacaggg actctctcaa taaaaaggtt gagctactat 134280
ataaatcatc aagtagattt tattttgaaa gcaacttttt ttgtagagaa agagttcttg 134340
aaaccagtta aagatttaaa aagttgatac aagttatgtt gtaaaatcaa agttatatgt 134400
ggatgatacg agttgtattc cccaccacat tttaacattt ttagtgtata tatttttaaa 134460
tgaaaaaatg tacattttac acgtatttta gtacaaacag taaaaaaaaa gtcagaagta 134520
atttatcaaa acatatgttt acacaaaaac ttgtatataa atgttcataa cagcattatt 134580
cataatagcc aaaaggtgga aacaacccaa atatcaactg ataaataggt aaaatgtggt 134640
atatccatta ataaaatatt atttggcaac aaaagggaat gaagttccga tgcatactac 134700
aacatggatg acccctggcc acatattggg tgattccatt tatagaaaat atccagagta 134760
caaaaagcca tagagacaga aagtagatgt ctttgatttc caaaggctga gggagggagg 134820
aatggagaat gacagctaac aagtatgtag cttcttttgg ggataaagag aatgttctta 134880
aattagatag tggtaatggc tgcacaacca tgtgaataaa ctaaaaccca cttaatcgta 134940
cactttaaaa ggtgaacttt atggtatgca aattgtatct caaaaaccta tttcttttaa 135000
aagtcaaaaa aaatagtata gaccccttcc atagttcctt agtcctttcc attctagtcc 135060
ttagagttac aggtttattg tatacacttt caagcattta tatgcacaca aaagcatatc 135120
tatgtgcttg ggatatagca aagggatggt actatatatt ctacttactc tactttgacc 135180
aaaacccaag atgtttaacc attctacttt ttcttaatat ttgactatgt ttgaacttaa 135240
attgatatcc acacatacta aaataccaaa atatgcattg agtcatcaaa tttcaaaggt 135300
catccatgat attttttaag ggcttaaaac tccttngcat gatcnttcag cctgtttant 135360
tcagcatagg aaaataccct tgctttgcct tcacctaact ctaaggaagt ctattagaga 135420
tatttagggt cagaaatggg ttcttggggc ttgagagaga aaaggatctt ctgctattga 135480
tgatctggct ctgccatgac cctatggcat gggtcctcag tggccctgtg ggaagcctag 135540
tgtaggcaac atggcctagc ccacctatgt tgatgtttaa ggggtgctag gaacaaaaga 135600
gaagctgtgg aaacttttgc ttatccccct ttcttccctc tttggtggtc ttatttttat 135660
ccgacgctct taatctcaac ttataaccgg aaaatacagc accaaagcgt gagggcattt 135720
aggggaaaaa tgttatctgt tttggaagta atatcaagga agatcaggga caaatgcaga 135780
actggaagca aggactaagg ttggatttag caggatttcc tgaaagattg gatgtaggat 135840
gtgaggaaat gagatgaacc aaagatgtct tcagggtcat tggcctgaat aacttgaaga 135900
atagatttgc cattttcttg gctgggaagg agtgcagaaa gaacaggttt gaaagtgggg 135960
catgaggagt ttcatatgac acatcaaata cttgagattc ctgttatcta acatctgtcc 136020
aagtaaaaat gtggagttga ttctggaggt ggggctggaa atataactgt ggaagtcatc 136080
agaacataca agggatgtga aggcattaca atggatgaga tcaagcaggt agtgagtatt 136140
gagatataag aaaagatctg aggtcaagta ctggagctct gtaacattta gacattagga 136200
aattgaagag aaaccagcaa aggagcatgc aaagggctgg cattggattt tgtggctctg 136260
tagtgcagtg ctctggctct tttggtgact gaaagatgct tgttcactgc ttttctctgt 136320
gttttcaccc ggagcatccc tgtgacattt ctatatatat atatttattt atactctaag 136380
ttctagggta catgtgcaca acgtgcaggt ttgtacatat gtatacatgt gccatgttag 136440
tgtgctgcac ccattaactc gtcatttaca ttagctatat ctcctaatgc tatccctccc 136500
ccctcccccc accccacaac aggccccagt gtgtgatgtt ccccttcctg tgtccaagtg 136560
ttctcattgt tcaattccca cctatgagtg agaacatgcg gtgtttggtt ttttgtcctt 136620
gcgatagttt gctgagaatg atggtttcca gcttcatcca tgtccctaca aaggacatga 136680
actcatcatt ttttatggct gcatagtatt ccattgtgta tatgtgccac attttcttaa 136740
tccagtctat aattgttgga catttgggtt ggttccaagt ctttgctatt gtgaatagtg 136800
ccacagtaaa catatgtgtg catgtgtctt tatagcagca tgatttattt atttattttt 136860
tccaactctt ttttttatta tactttaaat tttagggtac atgtgcacaa tgtgcaggtt 136920
tgttacatat gtatatatat gccatgttgg tgtgctgtac ccattaactt gtcatttaca 136980
ttagctatat ctcctaatgc tatacctccc acctcccccc accccacaac aggccccagt 137040
gtgtgatgtt ccccttcctg tgtccatgtg ttctcattat tcagttccca cctatgagtg 137100
agaaagtgca gtgtttgact tttgtccttg tgatagtttg ctgagaatga tagtttccag 137160
cttcatccat gtccctacaa gggacatgaa ctcatcaatt ttatggctgc atagtattct 137220
atggtgtata tgtgccacat tttcttaatc cagtctatca ttgttggaca tttgggttgg 137280
ttccaagtct ttgctattgt gaatagtgcc acaataaaca tacatatgca tgtgtcttta 137340
tagcagaatg atttataatc ctgtgagtat atacccagta atgggatggc tgggtcaaat 137400
ggtaattcta gttctagatc cctgaggaat tgccacactg acttccacaa tggttgaact 137460
agtttgcagt cccaccaaca gtgtaaaagt gttcgtattt ctccacatcc tctccagcac 137520
ctgttgtttc ctgacttttt aatgatcgcc attctaactg gtgtgagata gtatctcatt 137580
atggttttga tttgcatttc tctgatggcc agtgatgatg agcatttttt catgtgtctg 137640
ttggctgcat aaatgtcttc ttttgaaaag tgtctgttca aatcctttgc ccactttttg 137700
atggggttgt ttgttttctt cttataattt gtttgagttc attgtagatt ctggatatta 137760
gccctttgtc agatgagtag attgcaaaaa ttttctccca ttctgtaagt tgcctgttca 137820
ctctgatggt agtttctttt gctgtgcaga agctctttag tttaattaga tcccatttgt 137880
caattttggg ttttgttgcc attccttttg gtgttttaga catgaagtct ttgcccatgc 137940
ctatgtcctg aatggtattg cctaggtttt cttctagggt tttcatggtt ttatgtctga 138000
catttaagtc tttattccat cttgaattaa tttttgcata agattcctca tacattcctg 138060
ttgtgctttc accctctact ctctggttct caccctgttc tcatatatcc aaggaagatg 138120
atacactcta attagaaaca acaactgaac tcagctcatt attttcaaaa tctttcttct 138180
ccattaggta aaaatcattg cagtctgttt attcaatatg ttttcttttc cacttaaatt 138240
ctgttcatgc agagactgat tcctgggaac atcaatgtgc tggcaacttt gactttgtaa 138300
tttccctttt gttgtcccac tcaactgcat ggctgatctc cattcatttg ttcacttcca 138360
gagcctactg ttggcaatct gatttttctt catagtttcc cattaaaatt cactagagat 138420
gcttttgatt tacttatttc ttccctggca gggtagagtt gcttgttcca gatcacctca 138480
tagcaaactg gaccattctc aagtaaactg ctcatccctg gtgcagttat cagcagggag 138540
gcatctgcag cattaacagt gattgacccg tatagtgatg tttaatatgt gataatgtta 138600
ctagcagcaa acaaaatagc acttgtaaac acagttgttt actcatactt acatgtatag 138660
gtttggactt gaggggtaaa atagcaaaat tacccaactc ccctgctaat aaaacctaag 138720
gaaatgaata aaatgacctg agaaaattat accagcataa ctacagtaag gaagagctac 138780
aatttcatgc cattttctcc gaatagcagc taggaggaaa gaaaagaaga gaaagatgaa 138840
ggaggaggaa aaggaaaggg tcgcggagga ggagaagaga atgagagaga acatgaatat 138900
tctaggctca tcccttaaga ctgtcttctg gaagaagtta agaagaaata aacttggaaa 138960
aacaacgaaa ccgtatactc aaattcccca atctgtgaag tctgtggcca aagggctatg 139020
cagagccctg gaaagtgata agaaccactc atgtatagaa gccacttgtt ccagaggcaa 139080
aataatccac tagatctcac catttttatt tttttcagct gaggaggctt gagagtgaag 139140
gcaaaatgtc ataccttctg aaaatgaatc atctcccatt ctgctacaaa aatgtagcat 139200
aatgaaaata tgaagagaca aaaacagaag cttcaagagt acaggaagct caggataaag 139260
aggggtgtcg aaagccccag gagttgtcct attcgcccat acagagaacc aaaaccaaca 139320
ggaggacatt gacttctccc tcacctggag tcagtggagt gggaatgatg gctggagaga 139380
ggccagtgaa tttggggaag tgaacactta ggactgatta gttctggctg caataaagat 139440
ttcctgaacc tacctgaatt gaagaaatat ctgaagcctg atatttcaag cataattgcc 139500
catacacagc ctcagctaat acttctctcc ctgtacccct ctcctcatac tgaaacagta 139560
aaacacagag aagaaaacct cgttgataaa ttgaaaaagg atgctaatga gtgggatgag 139620
atatctggaa taattctctg cccctgtatt agaaagaatg aaagatctag ataataatgt 139680
taaaagtgga aattttggca actgtggaac cagtctagaa agaaattagt tcaaattaaa 139740
acaggtagtg agaggacccc aagaataata tctatgagag taagaatcaa atggtttctg 139800
ggcaattgat ggtttaaaga aagaacatct gcaggatagt aagaagggtt tattctaaat 139860
gataagtgta atgtgtgaga atctggaagc tacttgagat agaagaaaga aagaatatat 139920
ttanttttcc caatgagaca tgtgagaaat agtcagaaaa tctcagcaaa aacaaaacca 139980
aaccaaagat tgtattaaaa aaaaatggct caaataacgt gagttaaatt ggcccagatt 140040
ctgagcaatt aatggaaagt aaggaaggtt ccatttaacc ttgaccattt actgtctaat 140100
agagtcttgg agggggaagt ataattttag aacattacct ggcccaagag tgagcaatgt 140160
tttcatagga aacattgact atcaacatat tgattatcaa cctgctgaga agcacggatg 140220
acccaattat gatagaaaaa caaaatgtaa atattgtcaa acttgaggat ataaatgtat 140280
acatgacacg agatggaaaa tgaaagcaga gagaagaggt gacctgacaa gtggcaatgg 140340
taataccttc atctcacact ggaaggggtc aagtctttct agtttgatgg aaaaagaaat 140400
cgagatttac atacaaattt gggagtggtt aagggaagtg gggagtgatg ttgtgcctga 140460
atgaaatctt cacatatcat agcagaagtc tatgtctaaa gtggataaat caagaaatcc 140520
taaataggga taggcataac gccatcagaa gtgaaaacaa aaaattcctg tctcattact 140580
tataccaaaa taaatttcag atttaaactg atttaaacag ccaattcagg ttcaacatgt 140640
ttaaaataat aaagcaagga aagtgtcaaa ctactgcata aaaccatggg taaatttatg 140700
tctaatcatg cagtgagaga agtcttttta agcaaaataa aaacacttaa aaggaatgac 140760
aaattagacc acactgaaat ttaaaactga tctttgcaaa aatataagaa atgtataggg 140820
gaaaatgcac tgaacataca tggcagataa aagatgggtt ttcttatttg taaagagttg 140880
gtggaaacca ataaagaaaa taaaatggtc aacagggcag aaaaatggaa taacatgcga 140940
ataggtagtt cagagaaaca acttcctctc tgccttcttt ccactgaaac tctactcctg 141000
tgcattactg aggtcagttg cttcattttc ccaaaactgt tcttgattca cccaagagga 141060
ctaaattggc tcttctctgt tgcccctcag tactttaacc atattttgct tacacaccaa 141120
agttactatt cttccctttc tttttatttt cttttttctt ttgagacagg atctcgctct 141180
gttgtccagg ctggagtgca gtggcacaat ctcagctcac tgaaacctcc gcctcccagg 141240
ttcaagcaat tcttcttcct cagcctcccg agtagctggg attacaggtg accatcacca 141300
caactggcta atttttgtat ttttagtaga gacggggttt caccatgttg gccaggctgg 141360
tctggaactc ctgacctcaa gtgatctgcc cgccttggcc tcccaaagtg ctgggattac 141420
aggcgtgagc catcatgccc agccagtatt cttccttttt gagaattgat cctgttcatc 141480
tttttcttcc cctctcaatt atacaattct taagggaaga aactatgtct tactccactc 141540
aatccccaat gcatcaaacc tttagtaacc actaataatc cttgtttgaa taaataaaga 141600
gcacaggccc tacggacaat gtaagtcagt aagtgcactt gagtcactat ctcaagcaca 141660
ctaccatttg aatttaaatt tctggataaa aatctccaca aaactgataa ggcacccttc 141720
aagcaagaca caagttaatt ttcagcctct aatagaagta tttgttggca ctacctttca 141780
ttggtttatt catttcagca gccataaaca cacagatccc attgtcacag aaagccttgt 141840
tcgcaaatat aatttagtgc atctcacaat atgagctttc aggtggttga gctgtgtgga 141900
aattcgattt ttttttctcc cgagactctg aaatgaaaag aggataaccc cagtgctctt 141960
gcccacatcg cttatctcac aacaacagat tacaatccca taactccacg ttcccaagca 142020
gctactgtgt tgatcaaatg taatgcaaca gatgagaaaa catcagctgg ttcatgccca 142080
agacagctga aaggtgcact tacattttta gtctccagat accaaaataa atctgttggg 142140
cttaatcatg agttgtcctg ctacttttgg ggaaagaaag ccatgtccag tgaaatttct 142200
tttatactgg caggcatttt gactcttcac ctattgctgt tgaatctcca ggatatgtac 142260
atgttttcac accgatacct tcattgaaga aaatacagca atctgatatt tttatgtgaa 142320
tcatctttgg aattcgtgtt cctcaccttt ggatacaata aatattcaag agaaaaaaaa 142380
tacaggaaaa aaataattgc cctcaatgat gagttctgaa atacttataa ggataagtga 142440
tgtgttgaaa aattctcaaa agcaatttta gaaggaataa tttttgcaga gagtggctgt 142500
ctcttgggca ccataacaag aaaaatagta tattgccctt ggtgatggtg cggtcaagta 142560
tcaataacaa cacgcttcat attttcatga acaaaacact tcttcataag gtaatgagat 142620
tatagaaaaa tcaactcaag gtaaaaataa ttactttgca catggacaaa ggataagtgg 142680
aagaacttat cttctagttc gtggttcatt taacaattaa ttgctccttt ttcaaatagg 142740
tccactgtgt tctgggcctt gaacagtgta cctctaagaa agtttgttat ccttactgaa 142800
ggaaattaca gttaggtcgc ttctcagcct tttggctaag atcaagtgtg aaaattatac 142860
ttagattact atgtaattag gcctggtaga tcctgggtag acttcactga atgcaggatg 142920
caatatttgg aaaagtactt actttggagt cctaatgcct gggtgctact tctattagtg 142980
ccagaaatta atagtgtgac tttgggataa tcacttaaca tctttgagcc tcattttcct 143040
tatcttcaaa aaaaaaaaaa aaagaaggaa tcagatgaaa tcatctttac cagattaggt 143100
ctatctttag gtcccccagt gtaactgggt ttctgtcttg gtctcagtcc atccttgcat 143160
tatcctggac tttatttatt ggaatcccaa tatctgagaa ttcaatttat gtctttatcg 143220
tactgaagtc tataaagatg tttttaaaga gtcactagac tccagtgggg caacttgctc 143280
cagatatcat catagtctca ttaaaaagta tttattgact actaatgtgt ataggataca 143340
tgagttggag actcacagat acacatatat ttaattagaa aaatatgtaa gaatgaaact 143400
agccaaagat attggcagaa agtgtgtgaa atttttagct tggctggcct ttgttggaat 143460
gctctatttt ttattttttt gtttgtttgt ttgttttttt ggtcttggct tcttccatga 143520
tcttgaccct gtgccttgaa acttttttta aatcatgaaa aatgtgtttg tcttcaagct 143580
gtccagtgtg gcaatatcac ttagaaatat ttctttttta aagagtccca tgtttttaat 143640
atgatagcta aaataatatg atagaaaggt accataaaaa taaaattata tgcctttata 143700
tgccttagac aagtgtaatt cactataaaa ataagtttct cttagcagca ggaacaaaga 143760
aaaagtaatc tgttgaaaat gttagatagc ttgctgaaag gaaaaaaatt aacggcaaaa 143820
accaaagatc ttgaatttgt ttctaatttg ctcaacagca tttactgcga acaaaactaa 143880
ttttaattca gggtaattat tttcttattc cacatcaaat agttaaatat cacattttta 143940
agatctttat tcttatatct ttcctatgtg ttgaatcaag actgttcttg ccctgatcag 144000
ataaaaatca ataatattga gatcaaagtc ttcaaacatc acatgctaat ttgaagttgt 144060
atgcaagcct aaagctagtg tgtaatacct ttgttctttt cctcttaggc atttatgtcc 144120
atgttccaga tcctcaccca ggaaggatgg gtggacgtaa tggaccaaac tctaaatgct 144180
gtgggacata tgtgggcacc cgtggttgcc atctatttca ttctctatca tctttttgcc 144240
actctggtga gttcagcatt tttttttcaa ttatatcttg gaatttataa tgggatgaac 144300
atcaacagat atttggccta ttgtcaattt caaaatggga gccaaaggac taatgcagac 144360
taatctggtt ggatgagatc cctccttcca ttctaagttt ctacacatca aagaactgct 144420
tgatttgtta agttagatat tttctccatc aggtaccagt gtttgtaaga gggaaaacaa 144480
gacagaacaa aatgaaaatc tcacatttac ataccaattt aagtatcccc aagcattcac 144540
acctagatga tctcaggatc aaaccggaac tccattatta ttttttttct catgtagaga 144600
cactgtcttc agtttcactg catcctcttc acagctgtaa ttaaactgaa gacagaagct 144660
atagacctca gggtgcagtc agttaattag aaatcagcac agtggttttg tgctatgtgc 144720
gactggaaaa aaacacatgg aaaaaaataa aacacattgc tgcaagtatt gtaaaagcac 144780
aagaaaactg aataccaaag tccagtaaga accgacttct gtcacacaag cagatttttc 144840
tcttcaatat acttccatta aaaacaaaga aaaaatgtta tgaaatgcag cctgtgactt 144900
actaaggaat gtaataccaa atgctcatct ctatgtaata aatttgttca tatttaagaa 144960
gcaaacctaa gttctaacat cacgttagaa gttccaagtt gaggactcaa atgtttccct 145020
ttatcaggaa tacaagaaat aaatacaact gctactattg tttttggcaa tatgtcttac 145080
agttacaaaa tatcttacaa tattattgct aatctttgga acacccgatt agatagtatt 145140
cccagttaac agatgataaa actgatactc agaagagttt agtaatttat ctgatgtcac 145200
atggaatgta aatatgacca gagtgttccc aggtctgtct gatctagatt tggtccttag 145260
tcttgcagct aattattatt gcttccctgg ataatgaagt ttaaagttgt ctgaaaaaat 145320
gtctttgtca aatcaaactt ctgccaaaga atcactcaca tcaaacaaat tacatataat 145380
ctctaaggtc agttttaatt ctaaatatct atgaatgaaa taagtccttg ataaactaga 145440
tataacttag aagttgtgtt tgctatagac agacagaggc tttcaaaact aagacatgtc 145500
caccaaaaag ttaatgagaa ttcattgtta catggtgtga agtcatgggc tcaaacagta 145560
gaactacata gacatagttt tggccttttt atacatggag ttgactttta aaagttacgc 145620
gaaagatagg aacattgtgc aataggaatg gaagcctggc ttgcaaagct gaatctggct 145680
gtgctggtgt ttgcacaaca cttagccctg gggtctttgc atcttccctt ccaggacctt 145740
taagcctgtg ccatttattc attcatccat tcatttacac atcatttatg cgttcaacta 145800
agtttattaa gctacttgtg tttaagttac tctaaaacta tggaattgct cagactgttg 145860
attgtgggtt aaatgcagga tagatttcat tgaaatcatc tatgtcaggg aatatcaatc 145920
taattatttt atagtaatca acctaatcat tttcctaata aagcaacaaa atggtttact 145980
ttcctcactg aaaatgtttc acactcagat atatgtttga ttcttaaatc agggacacaa 146040
aaaatgaaag ctggaagaaa aaactagcct attacattat ttagtaaagt aacatttttt 146100
caagtgaaaa ttctactggg gtcactaata taataaaata aaatattaaa actggtatat 146160
agccttcttg ggcaatctaa atcttcttta tgggctaaaa tatggcattg gttatagaac 146220
acttaaagtt catccaagga ctcctggggt tcacctgagg ctttaggaat ccacagagca 146280
caagatgaaa accaatctct aattctactc tttccactta ctgatttaag tatctaccca 146340
aaacatctgt tctaactttt ttattgcaat tttcaaacaa cagttataag ttaaaactga 146400
aaattgaaat aacttgttct tttattcaca ctttttaaaa gtctgtaagg caattgagaa 146460
ttcagaagtc tacatgttaa cgagaacagt ttggtaaatg tggtgtcgta caagactacg 146520
aaattggagg gcaaaaatcc agattcaggt tctagctctg ctggtcactc gatatctgat 146580
ttctgaagac tcacataact tccctgatct ctctgttgtt tgtatcggaa agtgaggata 146640
ataattcaca atacacccag tttccaaggt tgtcatgtat ctgcgagtta accctgtatt 146700
tctgaggatg ttttagagca ccagcactga gcccctttaa atgtagataa gacggtttgt 146760
gcatttaaag ccatatatta ataaatgtta aatttatatt atgttcagat atttttaatt 146820
tatgcaagta tcatttatta gggtatcatt tatgcccctt cctgaattaa tttccattct 146880
tcttctttct ctccttccct atacctcttc tcccaggcaa tgactctgat aattttaata 146940
taaattcatt ttccaatttt tagaacatat ttcactaaat ttaacattct gtcattcagt 147000
agaagactca gtttgtgtaa cactaaggag aaaaacaatt aaactataca catagaggat 147060
aaggtgcatc cctacttcag agtttttaaa aggtgaaagt aaatgtgcat cttaaaatca 147120
atgaaatgca gaggtttccc acacatatat gcatccatta aaaatatagt atttagggcc 147180
agcacggtgg ctcacgcctg taatcccagc actttgggag gctgaggcag gtggatcacc 147240
tgaggtcagg agttaaagat cagcctggcc aacatggtga aaccctatct ctactaaaaa 147300
tacaaaatat tagccaggca tggtggtgag cacctgtaag cccagctact caggatactg 147360
aggcaggnna gaatcacttg aatctgggag gtgggggttg cagtgagccg agatcatgct 147420
gttgtacccc agcctgggca acaacagtga aactccatct caaaaaaant atatatatat 147480
acacacacac agacacacac acacacnnnn gtgtgtgtgt atatatgtgt atatatgtat 147540
atatgtgtgt atatatgtat atatatgtgt gtgtatatat gtatatatat gtgtgtgtat 147600
atatatgtat acatatagta ttttaaactt aaggttacca tctaaataca ttttatgccc 147660
aaaattctga agattaatat taagttttct tagtttgcaa agcactgctc cagtcaactg 147720
atggccatcc ctaggggagt ggtctggtaa tacatacttc tctcccntat aagtccacgc 147780
tggggccaag ttatacatgg tcatgtgttt ccctccttat caattatttg tagcagcaat 147840
ttttagaaca aatggtatca aactcaacat atattctgca gttaaatttt tcactggcta 147900
tttttttctg agatcttttt atcttactcc acatgaagct aatttggtca ttgttataga 147960
gagccgtgtg gtactccgcg gactgtgaat atgccatatt tgtttatcag ttccctttct 148020
gatggctatt taggctgttt tccaaagttg tacttttata atgctgcaat acatttatgt 148080
atcgtgccca cttatgtgaa tttctctagg atatatgtcc aaaagtagaa tgcttagatc 148140
ttaggtactt cccaaattgc tctataccag ggacctgcaa gcccagatac caaatccagc 148200
ccaccacctg tattatacaa cctgtgagct aaaaatggtt tctataattt agtggttata 148260
caggtaccca cagaatatcc tcagtattgc ctcatgaccc tcaacgtcta aaatgtttac 148320
tgtctggacc tttaagaaaa cactgtggac tcctgctcta tagataaatt gtgctaattt 148380
accctcccaa gtgcaatagt tgagaattcc tgtgttctta cactctcact tagacgtcac 148440
attgtttgac atgtgaggtt ttggcaatct tatgagtgaa cactggtatc aattgggctt 148500
gcatttttgc atttccataa ttattaataa gggagcacct cttactatgt ttattgacca 148560
tcttttttgt gactcaattg tttgctttac ctattttcct aaaaacaaat ttgtcttaac 148620
tcatttattg gatatttgtt ggatattaat ctcttgacta ttacatgtgt tgcgaatatc 148680
ctctcttagg cagtattttg tcttccagtt tgtctgtgat gtcttttgac attctatata 148740
tttttatttc atttttagtt aacaaataat aattgtatat atagtagtcc tcctttgtcc 148800
ccaagggaaa ctttccaaga ttcccagtag atacctgaaa ccatggatag tacagaaccc 148860
tatatatact atgtgtttta ttatacatac ataactttga taaagtttaa tttgtaaatg 148920
aggcatagta agaaattaac aacaataata acaaaataga acagttatga caatatactg 148980
taataaaagt tatgtgaata cgcattctct ctctgtctcc atctctcctt ttcaaaatgt 149040
cttaatattt tcaggctgtg gctgaccaca gggaactgaa actacagaaa gtgagacagt 149100
ggataagggg ggggcctact gtatttatgg ggtacaacgt gatgttttga tacatgcata 149160
cattgtggaa tgatcaaatt aggtcaaaac tatcggtttt tcactgatgg tctgtattta 149220
ttttgacctc atgcttaagg aattctttcc cacctgaggt aatacaaata ttctcctata 149280
tcttcttcta attgtttaca atttttgctt ttcaccttta agtctttagc tcatctctac 149340
ttactagtta gatatagcat aagctagatg aaatatactg tttaaataaa actcaaatca 149400
atttttctca gatttatatg agaaactgca aggtttagaa tatttatttg atttatctga 149460
ttatgaagtc taacacaaaa aaggtaaact gttcaaactt ttaaatttct aaattatttt 149520
ttaaatgata tataatttaa taaaaggaaa cactatataa ctaaattaaa acaaagatta 149580
tcacttctat actacccaaa aaaagtctaa tactgaagtc acttccccag ttcacaaaaa 149640
attttgctta aaacatggtc agcagttgtt tctcttttcc tttgtaccct tagactaaca 149700
gttactgtaa tgggctttat gaagtgagtt caatttgatt tgatacagtt ttactgaacc 149760
tctactacca cgtgcaggta ctaacctacg tcctggccaa agtgggaaag agcttaattc 149820
atgtcctctt aggggctaca aataattgga aattagcaat aacgaacaca gacaggctaa 149880
ccaacaaaca aataaaacca gtggttccaa ggcctaaaga tgcaaatggt aagagaggca 149940
tgtgtacatt gctacttgct atgtgatcaa taaacatctg cttcccagtt gttcccaatc 150000
tgccttatga gaaatatcaa aagtagtggc agtgaaacag ctggagatag tctgtgggct 150060
aacatataaa cacatgcgtg agggtgacag gtctgtgtta cacacacatt gcatgcccct 150120
aaaaactaaa cttcacaagt taaaatattc cataagcctg tcttcagagc tgaacttacc 150180
ttaaaatgag catttttgtt taattgtatg tttcctttta caaaatgcta caacgcattt 150240
taacccaaat gggtgagaag ggaaaaaaaa agtagtctgt gtaaacatac aagctctgat 150300
gtgtcttttg ttcacaccga acagtggtgc catacaactt gatgagttcc tgatttagtc 150360
ttcccaggga caggcatgtg ccaagcagcg aaaaataaaa tgtgtggttg cagcttgttc 150420
tggaataaag aacagcaggc tatttcatca cccctggggg caccaatttt cagcccacaa 150480
tgaaaatcaa gctgaagtat atagcaaatg catattcata acctccatgt attgtccctt 150540
tcaaacatct ctctcttccg ccaggtatgt attctgtatt tctgtcctga ctgattgcag 150600
tttattgaat gcttgttaaa ttcatctttt tccccatctt tgccaatgat ttggggatag 150660
ggactatgga agacctaaca agttgaaaga ctccattttt cctgcaatgt ttttctgtct 150720
attactgttt caaaggaaag ccctgtgatg tgaatactga aaagaaagaa aatgtaatta 150780
agcgttcatt gtgggtagtc tttttgttac ctttgaagtg ctgaaattaa cacagcaatc 150840
tcttgatttt gcctcggtag tggcagcttg ctgagaatag tcatattttg ctgacacaaa 150900
tgggcattcc aaagtgtaaa ttaaataact tgattgtata gaattcattt aaaagtgcat 150960
ctgtgttgaa cgtatcccat tttacactgc gctgattaca tttgactttt tgttgaccca 151020
tataaaaagt gaaattgttt cataccacag gcggcaagac agcttaggat agggtgatta 151080
taaatggtaa acaggaaaag aaaaacacaa gagtgtggga cattgattcc tgctgtgttt 151140
ctagtgtata tttcaaaata atttaaagat aagaaattat taataaagtt cacagcaaag 151200
acgaaaataa gattaaaggt gaaatttcag ctaaagggac atctttaagc tatataaaag 151260
gaaaaaaatc ataaaattaa acttcataaa aagaaagaaa aatgaaaagg gaaagctata 151320
tagggtaagg tcatggctat ctgcagagtc agagagaatg taaaatagga tatgttgctg 151380
cagggagaga aattttcaac cagaaaatcc attgtgaatg acaaggctgc cctcttgcaa 151440
aaataaatca tacttttcag ctgtttgaat catgctaatc caaaagtctt attccgaggg 151500
aatgagaact acattatgtt ggacaaaatg atctgcatca caacaaaatt ggaagaaata 151560
attatacttg caaatgcaac tatttcagta atttattgaa tttgactgaa atttattgta 151620
gttaaataga aaaaaaataa atatatctgt ggtcacatgt ataaaactta aacagagcaa 151680
ataactacca cagncattaa ctgaggtgaa tctgggctgt ttcagaggna gaaaaaggaa 151740
gaggaggtat tagagaaaga ggagcgtcat aaagaatatt agagaaatca aacgcctgtg 151800
agaccctggt ccaggtacca gtttgaacct ggaaaattac gcttttgaaa tccactaagc 151860
tgaaaggtca aaatcctatt atatcattca taaatattct gagagagact tcccagactt 151920
cagcaggcct gataatgtgg cattttccac actgaatgca ttgtcaatgc taaacatacc 151980
ttagcaatgg gcattataat ctgagggaaa taaagaatta gatatctgaa atacattgtt 152040
attctccact ttttcattga catcactgat tcataatgta tcaatatcgg tcataaaatt 152100
aaaaagtgga tacatacatc agctgtatat tacacagtag gacaaatgct gtgttgcata 152160
ttaatatgat caaacgctat agacctgtta aaagtgccaa atagtaaatg catgaaaaaa 152220
tagatatttg gctttctttt ttacagcatt gtacaaacta aacaccactg tgttgaaagc 152280
atacatgtac ttagcagggt tcaagaggag atgaaaggtg gtgtcattag cctttttccc 152340
ctgaaattat atcattaaaa aaaaataggg acatagtata tcctgctgca gtataaattg 152400
aaatatcggg ccaggcgtgg tggctccccc tataatccca gcactttggg aggccgaggc 152460
gggtggatca cctgaggtcg ggaattccag accagcctga tcaacatggt aaaaccctgt 152520
gtctactaaa cacacaaaaa ttagcctggt gtggtggcag gcacctaaaa tcccagctac 152580
ttcggaggct gaagcaggag aaccacttga acccgggagg tagaggttgc agtgagctga 152640
gatcgcacca ctgcactcca gcctggggga cagagagaga ctctgcctca atcaatcaat 152700
caatcactca atagaaatat cacataaatc taaatattaa gaaataaata atgcaaagca 152760
aattagttgc ataatttaga acagtcaaag cacaaaggta aaagtgtttt atacatatga 152820
tgacactcct gtgatttaat gtggcaagtc cctgtaaaat tcctttatta catcaatacc 152880
gttttaatat gaacctgtaa atcacattta gtggctatag aaaaaccttt tggcacagca 152940
acatgtggta gtgtaggtaa acattagctg aaggtaatat gcagacatcg ctgtaatggg 153000
ttctgattac taatgagcat tacctcagct ttctgtaaaa acagaataaa tgagaacact 153060
cagagaactg aaaaatggtt cttcctttca gaatgagggc ttgtcaccca ctcccatgac 153120
tttccatacc atgtgttggc aagtgtctga cacccaggtc gacctgctct ttcagtccaa 153180
atccacattg cactgggttt gtaggaaaat actgtatcat tgataacata aattaaatat 153240
gatggacacc aagctgccat tcttccttca cttctaccct ttatcgcagt gcttattgtc 153300
accttattag agtctgtgag aaaagaaccg caaagtcatt ctcacctcct ggcaatcagc 153360
tacagactca ccctgcacct cctgaatctt ctgtttccat tgcaaagaca cagccaaagc 153420
cttgggtcag acttcagtca tctctcaccc ggagtgccag ttgccacctt atcacagtgc 153480
cctacatgcc agggacagtt tgatgaggat caatctgaaa gtccacattc aaatagggct 153540
tcagcggaaa cccaagcccc ctaccacaca catacatctt gaaccagttt ctgttttgta 153600
agtttgtgct tttgtcatgc cactgtcaaa ttaattgaaa aatgatgcct aaacaaagat 153660
atttgctgaa taaaattagg tttatgctac tttcaagcaa acttcaaact ttattatatt 153720
atttttaaat ttgttgcctc cccaagagtt tgttctaatt ctttaagttt gggccttcct 153780
gttgtgaagt cacgcagcgt tttcccagag aagccaaagc tcttccttta ggagtcttgc 153840
cttctcctat ccacagcaaa tatcaaatgc atctgccttg aggagtcagt gcagctggca 153900
tgccgtggct ctctctgtcc tgctctgagg gtggcttttc tctgtttatc ccaaggaaaa 153960
agtatatacc agtttcttgt ttaaccaatg taagaaaaca ttacatatct tttttttttt 154020
tttttttttt tttgagatgg agtctcgctc tgttgcccag gctggagtgc agtggcacga 154080
tctcggctca ctgcaagctc cgcctcccgg gttcacgcca ttctcctgcc tcagcctcct 154140
gagtaactgg gactacaggc acccgccacc acgcccggct aatttttttg tacttttagt 154200
agaaacgggg tttcaccatg ttagccagga tggtctcgat ctcctgacct cgtgatctgc 154260
cggccttggc ctcccaaagt gctgggatta caggcgtgag ccactgcacc cggctagaaa 154320
acattatata tctaataaca ttttgtcaaa ctgcacttaa ccttgtctag ttactatttc 154380
agtgagccag tttatttttt tgttttgttt gtttttagtt tttggagaca gggacttgct 154440
ctgccatcca ggcctagagt gcagtggcac attcacagct cactgcagcc tcgacctccc 154500
aggctcaaga aatcctccca cctcagcctc ctcccaagta gctggggcca caggcatgcg 154560
ccaccatgcc tgactaattt ttgttttttt ttttttttga gagacagggt tgcccaggct 154620
ggtctcaaat tcctggggtc aagcaatcct gcctcagctt cccaaactgc taggattaca 154680
cgcatgagtc accatgccca gctgagccag tttaaacttg ctgcattaca tgcattaaaa 154740
acaaaaacac acacacaaaa agccccagaa cttttaaaag gaaaaattta gcagaaagaa 154800
actgatgtca tcactttgtg attattccag cctccctctc ttatccgtga cctctgtggc 154860
actcaagacg cctgtccatc ctgccttcct ctccagcctc caaaccctct gcctggaagc 154920
cagactctgg ccagacttac tcaccaggcc ctcaccacac cacctggaat gcgttcctca 154980
cagctctttt ccaaaatcag tcttctcctt ggcatctgcg tggcttggga gagcatcctt 155040
ggctctctgt cattgtctca caatcttcga taagtagtgt tcggaaagtg cccccctggc 155100
ccatgtgccc agatgggctc tccaagtcta aatgcttcaa aatggtacag aactaaatgt 155160
gtgaatttat gatggggctt catttctggt cctccttctt cacacttgcg tggccgccct 155220
tcccatccgc tctccaattt tctttcacgt ttctgctttc tgagaagaaa taagactgat 155280
ttctgggatg gagcatgaga gagacagatg cagagagaga gagagacaaa gcgtgtttcc 155340
gtgggagatg cccacacacc tcacttggga gcatcggcag tgttggtacc cacacaggtg 155400
tgttttgaca tccaagactt gaccctaatt cttcttggaa cctgatgggg agagaacctt 155460
gctgggggcc ccacatgggc caggggcagc cagggcagag ttgggcagct gcctgagagt 155520
tctcggtgga gaggcccaga atatcccaca agaacaagtc tccgttagtt ccaagtggaa 155580
tgacagccct ttctgagttt ccctgagttg agagctaata catgtgttgt gggaacaaca 155640
gcccaagcca aaggccacgc ggaggccagg cgtggtgact cacacctgta atcctagcac 155700
tttgggaggc caagatccac ggatctcatg agctcaggag ttcaagacca gcctggtcaa 155760
ccttgtctct acaaaaaata caaaaaaaaa aaaaagtagc caggcatggt ggtaggtgcc 155820
tgtagtccca gctacttggg aggctgaggt gggaggatcg cttgagccca tgaggtggag 155880
gctgcatgag ttgagatcac accactgcac tccagcctgg gtgacaatgt gaggccctgt 155940
ctcaaaaaaa aaaaaaaaaa aaagaccagg tggagagtat agtggattaa atgggcccct 156000
acaaaagata ggaccatggc ttaacccaca gaacctatga acacgacctt attggaaaaa 156060
gagtctttgc agatgtaatt aaattaagga tcttgtgatg agatcatcct ggattatctg 156120
ggtgggccct aagtccaatg acaagcgtcc ttgtaagaca caaaagagca caagacacag 156180
agagaaagcc ttgtgactgg tgttagataa aggccaagtg actggtgtta acaaagccac 156240
aagccgaggg acagaggagg ccaccagcag ctggaagaga caagggagta ttctcccccg 156300
tggcctttgg agagagtgtg gtcttgccga caactcaatt ttggactctg gcctccagaa 156360
ttgtgatcaa ataaatgtct gttgtttgaa gctaccaact ccgtgcacgg tgttacagta 156420
ctctaggaag cgcatatgga ggacatcact gggaatcaga gctcttagct ttgggagctg 156480
agatggtggt caagtcagca gaaagaaagc cccaaacccc ctgtacagcc tcatcagttc 156540
ccctgatggg ggatggagga catattaccc agcttgtagt gggtaacctt gaccttaaac 156600
taccctaaaa agaaaaggag catttattca aatgtaactg agcttgaaag gactgaatgg 156660
aactgatgta gcaagataat gtttccagcc cccaacagaa atggagggat tgtgcaccaa 156720
attcaattca tttgtagaaa aaccaagaaa tttattttag ctttgcataa ctaattttat 156780
gtctgtatat tttcagacat tgtatagcta tactacatgt cagggttgct cggggagaat 156840
taaatgaaaa aaaagctgca atttgttgag ctattattac atttgtaata ttttacaaac 156900
gagagcacca aaactcactg tgggctggca gttgccacgt ggctcatagc tggcacagcc 156960
tgtttgctac ctgagctctc tgactccaag cacagtgctc tcttctatgt ctgcttaatt 157020
cagtgataaa catcactgca gtgagtgcaa tattgtattt atgtatcaga ccaggcagtg 157080
cctcacacat ccatggagtc cagtcaactg tttgtcaaat ttaatagaat aacatagcct 157140
tgctgtcctt aagtagcctg ccctctgtcc agtttggggg atataattaa gaataaaatc 157200
tcctgccaac ccacgaaacc tctccttaaa ggtagaggag agagagccca gttttattat 157260
tgaaaaagct ctaacgcagg ctgcaatgca catcactggc aatctgctaa agagatcacg 157320
gaggcagaaa atacctccct cttttatatc accgctttcc atacgtgttc tcaagataga 157380
aataactagt cctcaagtaa gaaggcttga cagcaccact tgttaaatat agtttatcct 157440
aaattcacct ggtaagtggg gtggccatct gtgggagctg attgccttta tccaaaggaa 157500
aattaaaact tctcatattt ccgtgacaag taggtaggtt tacaacttgg agccagatgt 157560
ctaaactccc accctctacg gagaagggga gacggaggct cttgtcttcc ttgatgttta 157620
cattacttca aggagacagc cctcaaggaa aacattcttt taggttgtag aactggtgag 157680
aagcttattt ggctcttaaa agtatttata tacatctcaa acagaaaggg aaagaattta 157740
caattccaag tcttataaag gaaatgctct aagaaaaggg aggcgaacag gatcccttcc 157800
gacccccctt tttttagatt catgtttgta ctttcactag agagagagga aacatgatta 157860
aattaggaca cagaacaatg cctgctccag tgcccaggtg tgagagaagg ggtataagat 157920
atcccctcct gcagaaggaa accagcaggt gaacatctca gaattcgggg tgagaaatca 157980
agacagggga aggtagactc tgcctctgat attactttct gtcgtcgagg tattgggaaa 158040
tgggctgaac atggagcaaa ctttaaaatg tccagtttgg aatgatgtct ggttcagaat 158100
aagcctgatg cccagttacc agtggtgtac cagtcatggt gatgttaata aaaaccctct 158160
ggtctagatc attctgtatc ttcttcaagt tatggtaaga ctccaaaggg catggctgtt 158220
gaaaagaagg gtgctggcat ttgtcccaag ccaagcatat cccatcataa tttaatcatg 158280
ttgatatact cattaaaatt gaaaaagagc tagccattaa cttctgcata ataacttctc 158340
tagcactggc tgaattatct caactttctg accttcatgc ttaaccacct aatattaaca 158400
aatgggaata attcattaag aagaaaactg aaaagaaaaa tatgagttag aaatgaaaaa 158460
gatgatcaag tgaatatggg acttaaaaaa attcaaagtt gaagagggac tacagcgtaa 158520
aatattttta aaaattatac tattttgttt tattttattt acctgttcta aaagaagcat 158580
acatttttta aaaactgaga aaatcataac attttttaaa agaggaaaaa ttgtattact 158640
ccaatacaca aaagcaagta ccattaatat ttctaaagta cctccttcaa gcattttctc 158700
tattactccg ttatatgcat agttgagctt ctaccatata tatatatata tatatatact 158760
cgtatttact gttataatgt gttttcaaca ccataaaaat tcaccagtgt attaggtatc 158820
tgttgctgtg taataaatta cccacacatt agaagcctac caggaaatag atgtttatta 158880
tctcaattag tttctcaagg ttgggaatct gagacaggct tagctgagtg tttctagttc 158940
aaagtgtcat gaggttgcag ttgagatgtt gtctacagct gcagtcacct tgaagtttta 159000
ctagggctgg agtgcctctt tccaagatgg gtcactccag tggctgttgg caggaggcct 159060
cagttcctca ccacatggac ctctccagag ggctgcttga gcatcctcac aacatagcac 159120
ctgcttccac agagcaggtg atctaggaga gaccaagggt aaagacacag tgtattttat 159180
tgcctagcct cataagtcac acacaattat ttctgcaacc tgctgatgac acaggccaga 159240
catattcagt gtggaaggga actacacaaa ggcatgaacc aggagtctag aacaacgctg 159300
gaggccatct tgaagagtag ctaccacatg ggaatttgta atggctgcat gtatcttatc 159360
acataaatct ctataactgt attgactatt catgcaaagt tggatgttat ttctaatatt 159420
tccttattac aaacaaccct ctaataagca cctgtgtata ttaagctttt catcaatagt 159480
tcagatcact tttttagaat attatcacac aagtgggatt gttgagttca aaaaaacctt 159540
tttcttaatt tcctttttaa gtaagttggt ttcataaagc aagttaacat attatttcaa 159600
tgaacgtatg cattttattt catgtatttg tgataaatac cttgaaatgc ctatgcaatg 159660
attcatcact gcatgtttat tttgcattta atgaattata tactcaatat attttaggta 159720
gctatattat acatataata ttttgatact tatggcatgt gggttttttc attgttattt 159780
caccatttta tagatcctcc tgagtttgtt tgttgctgtt attttggaca acttagaact 159840
tgatgaagac ctaaagaagc ttaaacaagt aagtagtgtg tgggggattt tttttaaaaa 159900
ggacaaaaaa ccaggggcaa accatttgct tataggcaat attaaaaatt tgagcttcaa 159960
agtaaaaata aaatgtaata aggctatcga aggtggtaaa atggtgttaa gtttaacttt 160020
tatctaatat taacaaggga aactttctat tactctataa atatcctagg aatagtttta 160080
ttatttttga ataaaagtaa aatgggcaga gtatagttaa ttggatttgg agactgttct 160140
ccttctgcca ttaaatgaag gttgtttgga aatgagatgc ctcaaggcca gattttgcat 160200
aattatatgt aatagtcttt atcatcatca taaaaatact acaatcaacc tgcctggtct 160260
ctagacacta aaggacaatt tagtctgggt gcccatagtg agtataagaa acagaataaa 160320
tgatcaaatg tggacccagt tatgtatgaa aacagacggg atgtcatcat ggtgaaagtt 160380
ataccccaga gaatgaaact agaaataggt gaatgctgtg ttcttaatgg caggaggatt 160440
acagctatcg tcaatcattc ctatagcttc tgttgcatgg aggatatttg gcttgaatat 160500
ttggctctat caaagagtac agaccctttg agaagaagag ctcgcaagag agtgggacaa 160560
tgggtggaac gttcttgtat caccctcccc aaaactgaga gaatagttga gatgttaact 160620
accaaactct acccaactgt tagaatgtta taatgttgac agaaccacac ctgttataat 160680
gttaacagaa ccatggctct gaaactttcc atttggaatt ataagcaggc cctccatatt 160740
cagaatttcc caaagctctc tatttttaac aaagcaaaaa gtataaccta tttaaatttt 160800
ttaatttttt ttaatctatc tcatgatcag gttaggcatt tcattttatt actcttacct 160860
ttaaagccta tgcttttaac agagggtatc aacaaggaaa aaaaaaaaca gaacaaacaa 160920
acaaaaaaaa attgttatga agattcctac ttggagcata ccaagaaagg ttttgagttc 160980
tttaccatcc tacagctacc caggcaaatg ggcatcttcc cggctctgct agagatgatt 161040
tcttccccgt cttttcactc tgtggcagca gtgatagatt cttcaaatga gagttgggac 161100
attcctttat gccatcaatg aaaatacttt gtgtggcttc tagttgcaga aaaaaatatc 161160
taataggtga attcaagatt gaaagtgacc agccatataa ttagacatga tcaataaaaa 161220
tctgctgctg tagaaccact ttagtccatg ctttacaaat ctggtattga gctgtcactt 161280
ttccttcatg ccatggttat tatgcacaga tatgtactat cctctgagac agtatgttac 161340
aatgtgtatt ctatagataa aatttaaaat atccaatttt ttttagctag tgctaccgcc 161400
aggttccata tgcttttaaa taaccatata attccagccc tcatttgtaa aataattttt 161460
ctgctggaaa gcaacaaaat aaacttgtat gtagcaattt tttcaggatt gtgaattcaa 161520
acctaaggat actttgcagt gttcattttt ttcaacattt taacttattt atatatacac 161580
gtatatgcat agcctactta aattttttgt catctttata tctagtggtc acaataggca 161640
tttcatatct gacccaaagt gaagaagcaa caataaaaag tcaggacttt aattggcatt 161700
gacattcttc ctgggctata aagttttaat aaactatatg gcccttcact ttgggtaaat 161760
gtcattattt ataaaatggc ttttaatcac ttgctagata ttagtgaagc tttgtgtttc 161820
tggaaattct gtatatcaga actggttatc caattgcact agcctacaat ttggaccata 161880
tactctgggt atttgggcat tgaaaactcc aatcataacg cagcaattcc atttttgtta 161940
gtacttttta cactattctt tattcatggt tggactgaaa ctatgtatct attaaattct 162000
tctattaatt tcatacttga aactcgttga acctgaaatt cattatagca aatattatta 162060
aactaagtta aagtgttcct ggttaacttt ctctcatttt tgtatgatta tgttttgttt 162120
tcagtagttt ttaacaacgg tgtcattttt tatgcccctg atttttctta ttttcagtga 162180
tcttggcctt taaggtaggg ctcatttgca tatttttaaa aacacacaca ttctcatgca 162240
ttcactttca tatacacatg tggtcatgtg gatacctgaa actttagact gtcttttaca 162300
gattctttta aaaaacaatg aaattggtac cctaaatatt tgtttcaatt gtccatgtac 162360
aaatccagtc cttaagattt aaacttatgt actctatttt tactactccc agatagagag 162420
tagagtggag gaaatgttca aaaaaagtat ttgattttct taatgtttca agtttcagaa 162480
agcgctatgc attccaaatt ccatctttgc tccgttcaaa ctttttgctt cttttaccac 162540
atctgcttgt atgtagattc tcatagctat ggtgacattg gttgaattct tgctcagtat 162600
caagtgtttt atgttttcac ttatttttca caacgaccca ttcaatgcag gtgttattat 162660
tatgtccatc ttacagatga ggaaactaag acatagagag gttaagtaac ttgctcaagg 162720
ttacacagcc aacaaatgtc ggagctagaa tttgaaccta ggcaatttgg accgaaagcc 162780
cacactctta acctctaaac tgtattgatt caaactaaag ctatataaag gccaaacatg 162840
agtcatgcat actggggagg gcactcatag gactatgaat tatttgttta taaataatga 162900
tgttgtagat aacaaaggca tcctcatatt caagtaactg ttagaatgaa ggacagtttc 162960
tgagaatagc ggtgaatgca gcaacccaat cgttaaaact attcacatta gttctttgtt 163020
tcctctcaaa actcagagga tctaatcaga gccactggag ttacagtctt gctgcgcgat 163080
ggcaaacgcc actcaaggtg ccactttgca natgatcttc ttggagtgat gatcctcctc 163140
agacgcctac ataacaggct tgcagcatag cagcatttta gtgactttaa tgtcttttat 163200
tatcgatatg tttttaactg tgttaatatg taaaagttgg ttcatagatt tttttcaaga 163260
gtaataaaaa ccagggcctg ttcgctctaa aatgggggtg ttggccaggc gcggtggctc 163320
acacctgtaa tcccagcact tggggaggct gaggtgggcg gatcacgagg tcaggagatc 163380
gagaccatcc tggctaacac ggtgaaatcc cgtctctact aaaaatacga aaaacaaaaa 163440
aattagctgc gcgtggtggc gggcacctgt agtcccagct acttgggagg ctgaggcagg 163500
agaatggcgt aaacccggga ggcggagctt gcagtgagcc aagatggcgc cactgtactc 163560
cagcctgggt gacagagcga gactccgtct caaataataa taacaataaa tgggggtgtt 163620
aacatgcaac actcagtagg gctcaacaga ggaagaggaa gcagccctca tacaggggag 163680
aggagaggcc gcccttaagc taagggtgtg agatggtggt agaaagtgaa aaggtactag 163740
tgaagaaatt ataatggaaa agaaggaaga agtgaagtag gaaaacacca gatatgaaat 163800
aaagagtatg actataactc agggataaag gtgcaggaat gtggccaaat ccagagttag 163860
gaatgtgagc aagtcagtgg ccaaaagtca aagcccacca gggcgttccc ctcagaagct 163920
ccctgagggc aggcatgggc tgcatgatgg attgtcggtg ggcccgtgtt ctcctggaag 163980
agaagcatgg cgctgtatgt cttttcccat tatttttcta tgcaacctcc gtgtgcatca 164040
gaggtggttt ctagccaagg actgctgagc tctaggcgtc ctcatgagaa gctatggtgt 164100
catttttaat acttcaggaa gctggaagag aattgtgcat tcacttaata taagcccgca 164160
cctgctaaat aaaatgtcaa gtttaatact tttagctgga aacctgaaaa ttctaagtgg 164220
cagcactgtt tccttaatac tatagttctg aagtgttttc atatatagtt tcctttaagc 164280
aaatttgttt aaagctacaa tgaatttctt attgcttaat cgaggcattt tggcaggaaa 164340
gaagtttggg ttttagaatc cagaggagaa agtaaaagga ctttttgcac agaaattttg 164400
agaggctctg gtgtgtttat tcccatcacc gcctctccaa gacatcacca gtgtgtgccg 164460
tgatggtcac ctctatggcn ttttcctttg tcacttccca caatcatgtt ccaaaaactc 164520
acctcaatca tataaccata tgaaattcct ctattgcctt ccctgtgtgt tatatatatg 164580
acacagctga ttgctaatag caatagggca gcgtaatctt ttcatagctg ccatcattta 164640
catgaccccc atattgaagt acgtagaaac catatttctc ttttcagcat ccccaaaagc 164700
caatacagag acctcggaaa aaaatatata tgtgtgtgtg tgtatatcta ttattacata 164760
tatgtaatat atgtaacata tatgtatatg tcatacatta aatacaaaaa tatattataa 164820
ttttgtatta catatatgta atatctatac atatatgtat atattaaata taaagattat 164880
atttataaat atatgtaata catgacataa attatacata atgtgtgtaa tatatgtaac 164940
agtatataaa aattatattt tttatattta gtatttatac acacatatat ataaaacatt 165000
gtttctgcat gacatttaaa aattggctaa aaatgagatt gtggtgagct gaggagattc 165060
ctgataaatc agttggtata gaggctacaa caaaaccctt gacctaaaac ttctctgaac 165120
agaagagttg atgactgtga agctcaagtg atgcaggaat gacactgggg aatgtacaca 165180
gagttttgca aggtttgaat atgaagagaa ttcttgcagc tttaatgatt tttgcaaatt 165240
tggtgaaaga cagatataaa gggttttctt ttaagtggta taaaattcat taagctttga 165300
gggaagaaaa aacccacaga aaagcctgag gggaggaatc atcgaaaagg gaagtatagg 165360
tagtctgttt agattaaatt cagagctgtg aaattgaaaa ctgtttaccc agccctgtat 165420
ccagtctcac ttgaatcctg gttccaattt aatgatgttt ggtctttgct agagtccact 165480
gcatagtgtt ggatagatat tatatattaa gaagctttcc tttcttattg actgtgactt 165540
ttttaaacaa aaaccataaa tatcttatat tctcttttgt taaagtatga gctctaggtg 165600
aatgtttttc tttagcctta agctgcatga tagttgattt tatgtgtcaa cttgactggg 165660
ctaagggatg cccagatagc tggtaaaaca ttgtttctgg gtgcatctgt cgggtggttc 165720
tggaaagatt tgcatttgaa ttggtagcct gagtaaagca gacctccttc cccaatgtcg 165780
ttaaaccact tccaaagctt tgaggtccca gatagaacaa aaaggtggag gaaagctgaa 165840
tttgctgtct gtctcattgc ctgcaccatg taaacaacct tctcctgccc tgaggaatcc 165900
tggttcttag gccttcaaaa tgttgccctg gcttccaaag gtctccagct tgaagagagc 165960
agatagtggg acttatcatc agcctccata attacatgag ccaatacctt aaaataaata 166020
ctgatgtata ttttattggt cctgtttctc tggagaatct tgcctaacac acctgaagct 166080
ctcattkgca tgtccatttt gtcgcctata ttgagttcat tccagattga gggcggtagc 166140
aaggtggcag ggatactgct ggaagatgcc attcggctga gcactggttg catctcctga 166200
tgttagttga atcttcaatc ttctcagcat tttgtcagtc tctcatgaat gaactcaaac 166260
taatgtaatt ttaaaagact gatataactg ctgcaggagc aaatgctatc tattgagaac 166320
taccttgtgt aggctrcttt atattaaatt atcacattta atcctaaata ttaaagacgt 166380
ggcaactaac attcagggga gtgaatttct cacccaagtc cacacaattc atatgtgcct 166440
gggtcagagc cacaaaggct gtctgaccct aaaccaatgt ccttgctgaa aaaggccatg 166500
ctgcctgcag agaaccagct ccttcattta taatgaaaag catatctagg tgtggattgg 166560
atgagatgct tatccatttt ttagatcagc atattttctc cctgtgggta ttcaaagaag 166620
aagccaaatt ataatcagac tatagcttag tgagccagga atcaggatgg agagggaggc 166680
gagaaaggtt gtgtgattta aatacataga tgatggtttg atagatgcag caaaccacca 166740
tggcacatgt aagcctgtgt aacaaacctg cacattctgc acatgtatcc cagtatttaa 166800
agtaaaatct aaaaataaat aaaaatattt ttaaaaatac ataatggcat aggctaagat 166860
aggctgagat caactgagtt atctctttta cagttgagat attagtgacc tagaaactaa 166920
atctactcat tctgtgaaac tggggtctgg acactcatct actatgctat agatattgtg 166980
ttggggctag ggacatgtga tggtcaggac actgtttcta ccctcaaaaa taactcctga 167040
gccagtggga gaaaaagaca agtaaacagg cagtttgggt tcagtggtga tgattataag 167100
gataatgttt cggaagcaca cagaaaacat ctaaagcaga ctgtgaaatc agggacgttt 167160
tctcacaagc aggtgcagac tgaaatctgg aggttgagta gtgctaatcc aggtgaagag 167220
ggttggagga agatggcatg aaggagggta gtgaagacca agggaactgc agagtctttt 167280
ttaggtggga aaaaaacaga gtggctttct cgacactaag agtttgctgt ggctaatgtg 167340
tagagcaaga gagaaaattg ttaactggaa aaataaggag ataccagcac aggaaatgct 167400
tgagcagcac taagcatttt gatattattc tgatggtatt gatgccacag ggtgtcataa 167460
tcatacctac attttggtgt cagtgtgaaa tgcactggag ggcacccaga ctggagatgg 167520
aagaatccgt tcttgaggca agtggtgatg gcagcctgaa ccaaaggaaa taggaatgag 167580
agaatatcga aagcggtgga gtacagagaa gaggatttag tgacaaattg gatgtaggaa 167640
gtgagaaaaa ccaggacaca gggatgtcac ccagatttct agatttcttt aagtgcgctg 167700
atgcagaaga aatacaagag aaagaagaaa tgagagtttt gtttatttgg gttttttttc 167760
gggggaagaa gtttggtcat attttccctg agatgcctgg gaaatatcta tgagacaatg 167820
tctatggaga gatacaaagt ttaaagctta ggtggaatat ctaggctgaa atagatactg 167880
aaaaagagca aaatcaacat gcagatggta atttaagcct ttagagagca ggaacttacc 167940
aagggaagga tggttcccta aggggtaata aataaatggt atgaaccagt gaggaggagc 168000
caaaatgtgt atgagaagtc acagcacaag aggtaagagg aaagcctaga atgtgtttgt 168060
caccaagatc aaaaggtgaa agagtttcaa gagagatcct tgttcaacga tctcaaagac 168120
ttcagagagg tcaaaaaaat agtcaccatg gaaagcaatc ccatttacag tagcaccaaa 168180
aagaataaaa tacttggaat aaacttagcc aaggaggcaa agacacatac cctgaaaact 168240
ataaaatact gaggaaagaa cttaagccac aaataaagat gaattctgac ttacgatgat 168300
tcgacttaac agtttttgtt tttgtttttt tttgacagag tctcaacctt ttccttaggc 168360
tggagtgcag tagcatgatc tttggctcac tgcaacctct gcctcccagg ttcaagtgat 168420
tctcctgcct cagtctacca agtagctggg attacaggca tgcaccacca aatccaacta 168480
atttttgtat tttcagtaga gacagggttt caccatgttg gccagggctg gtctcgaact 168540
cctgacctca agtgactcac ctgcctcagc ctcccaaagt gctgggatta caggcgtgaa 168600
ccacctaacc tggcaactta caattttctg attttatgat ggtgcaaaac agatacacgc 168660
tcagtatgct cctcaactta tgatggaatt atatccagaa acactcatag taacttgaaa 168720
atatcataag ttaaaaaatg cacttttaca gtattttcaa cttataatga atttataaac 168780
cctattgtaa gttgaggaac atctgcaagt gaaaagacat tctgtgttga agaactggaa 168840
ggcttaatat tgttaaaatg ttcataccat ccaaagcaat ctacagattc aatgcaatct 168900
ttcgtaaaat tccaatgacg ctttttgcag atatagaaaa gaaatcttaa aattcatacg 168960
aaatcttaag ggataccaaa tagccaaaac aattctgaaa aagaacaaac ttgaagatgt 169020
catacttcct gatttcaaaa catattacaa agataaaata atcaaaacag tgtgatactg 169080
gcataaaggc acacatatag accagtggaa cagaatagag aggccacaag taaaccctca 169140
catatatagt cacatgatct tcaacagtgg tgtcaagacc acactatggg gaaaggacag 169200
tctcttcaac aaatgatgtt gaaaaattgg ataccacaca caaaagaatg aagtttggcc 169260
cttaccttat atcatatata aaaattagct caaaatggat taaggacctt aacaaaagac 169320
ctaaaaccat aaagctccta gaagaaaaca aggcaaaagc ttcatgacat tggaattgtc 169380
aatgatttat tggatatggc acagacagca aaagcaaaaa taggagactg cattaaactt 169440
aaaaacactt gcacgtcaaa ggaaacaatc aatagagtga aaagccaacc tatgggattg 169500
tagaaaatat ttgcaaatcg tgtgtctgat gaggagttaa tattgagaat atgaaagagc 169560
tcctatagtc aacaagaaaa atacaaataa tctgttttaa aaataggcaa aatacttaag 169620
ctgacattta tctaaaaaag gtatacaaat ggccaagtag atgaaaagat gttcaacatc 169680
actaatcatt agagaaatgc aaatagaaac cacaatgaga taccacttta tacctattag 169740
aatggccact atcaaaaaaa aaancagttt ggcaagaatg tgaaaaaatt gcaacatttg 169800
tactttgttg atgagaatgt aaaatggtgc tgctgctgcg gaaaacagta tggcagttcc 169860
tcaaaaaatt aaaagtagca tgatcatatg ataaaatata cttctggata tgtatatcca 169920
aaagaaatga aaatagaatc tcaaagacat atttgcacac tcatgttcat tgcagtattt 169980
ttcacaataa cagaaggtgg aagcaaccct agtgtccacc agtggatgaa tagataaaca 170040
aaatgtggta tctacacgca aggaaatatc attcagcctt aaacatgaat aaaactctga 170100
cacatgctac acatggatga accttgagga catcatgcta agtgaaataa gccagtcaca 170160
aaaagacaaa ttctgtatgg tttctcttat gtgagtttat ctaaagtagt caaattcaga 170220
gaaacagaag acagaatgag agttgccagg ggctagggag gggagtaaac ccattgttgt 170280
tcaatgggta cagagtttcc actttgaaag atgaaaaagt tctggagatc tgttgtacaa 170340
caatgtgagt atgtttaaca ctgctgaact gtacacttaa aatggttaag atggggctag 170400
gcgtggtggc tcacgcctgt aatcccaaaa ctttaggagg ccgaggtaag cacattgttt 170460
gagcccagga atttgagatc agcctgcgca acgtggcaac accctgtctc tactaaaaat 170520
acaaaaaatt agcctagccg gacatggtgg cgcatgcctg tagtcacagc tacgtaggtg 170580
gccaaggtga aaggattgct tgagcccaag agatcaaggc ttcagtgagc tgtgatcatg 170640
ccattacatt tcggcctggg caagagtgag accctgtctc aaataacaac aacaacgaca 170700
aaaatgatca agatggcaaa atttatgttg tatgtttttt accacaatta atttctttta 170760
tttaaaactg atcatattaa caataaggag gtggttagtg aaggcaataa gagcaagctc 170820
agggccttcg atgatacaga gctgggttgc agaggatagg gaatcaatga cgggtaagga 170880
agtgaaggtg gatcaccaac cttttcctca aacgcctcat actctgtttc cagatagacc 170940
acctggttgc tggctgattc ttaattttgt tagatatgtt aacaccattt gctacagtgc 171000
tacccaacct tttgccattg tggtatgcat agagaatgat atttgtacaa cacgctgaag 171060
tcaataggta ggaagcaaaa gcagctggaa atatcagata tcaaggattc ctgatgctcc 171120
agggaacagc tgcccaggag cgagaggacc gtaccctgaa gaacctataa atcattagtg 171180
gctgagagtt gaaaaactct gcatttcact caaatctgtt gatgctacct aactccactt 171240
gaagccattc tttcaatctt ttggtcagag atgactcttt tgaggtcagt ttattattgc 171300
ccataacttt ccatgatgta aatctcaaaa gatcagctta tagagcattt gatctgctat 171360
ttctgaaata gctacttact tttataataa attcttactt ttataataaa tgttagactt 171420
tttataataa attctctgtc acactaagac ataaacagca ataaaattgg tttgaagaaa 171480
tgaaatggct aagacagaac agtttagatc aaggtttaag ccaagaagtc acaacagagg 171540
ctcagaattt gggaatatca attatcaaca taaaaacaac agcctaggaa tctagaagtc 171600
attcaaaaag tagaaatatg ggaggccaag gtgggaggat cgcttgagcc cagtagttgg 171660
agaccaacct gggcaatata gtgagaccct catctctaca aaaaataaaa attatcgcag 171720
tgtggtggtc catacctgtg gtcccagctg cttgtgaggc tgaggtagga gaatcacttg 171780
agcctgggag gtcaaggctg cagtgagctg tgattgtgcc actgcattct agcctgggca 171840
acagagaaag accctgtccc cccaaccccc caagaaagat aaagatagaa acagccaact 171900
ggatttttac agtcaaataa gtataggtgg gagattcaaa aagtcagttc aaaacagaag 171960
tacctgttag aattgatgtt ctcctgatat gagtggaatt ctgtccctca aataggtacg 172020
tggaagccct acgcctcagt ccctgtgaat gtaacttgat tggaaatagg gtctttgtag 172080
atgcaatcag gttaagatga ggtcattagg gtggactcaa tatgactgtt gtcctcataa 172140
aaagagaaga gacacagaca cagacacaca gagagagcac tgtgtgttga tgaagccaca 172200
gaccagagtg atgtggtcca caaggaacac ccaggattgc tggcatcaca agcagctgga 172260
aaagtcccat ggagtagacc cccctcagaa cctccagaag gagcttgcct tgctgacatc 172320
ttgatctcag acttccagcc cccagaaata tgagacaata catttctgtt ttcagccacc 172380
cagttttttg gaactttgtg gcagcggccc tagacaacta acacacctcc agagccttgt 172440
tctctggact caagaagaaa cgatcccttc taaagctggc aagtagcctg gctgagagca 172500
tggggcagca gggaacaatg gacgtaccct tggaatccta cgccagcctg cgccaccctg 172560
gagcagcttt ctcagcagtt ggagttattt tcttctgcct ttctttgatt ataggaatca 172620
aaccccatca tagtaaaatt ttatagactt gagactttct tagaggaaag gtttctgtaa 172680
gcccttccaa aatttcatgt catgtgtgat taactcaaac cagaaggaca ttgttttaga 172740
gaccttttct ttgcctcatc catgggtact cgggactgtt ttgttagcat gatctctctt 172800
accatggaac aaacatgaaa ctacacacct aagattgtcc actcgagtct acaatggtgg 172860
gttgtcggtt gtatcattct ttaattgtgc taattcagaa ttattttcat tctagtttcc 172920
acagcactct gcaaggtaac ccttcaatta aaatatatat atatataggc caggcatggt 172980
gactcacacc tgtaatccca gcactttggg aagccgaggc aggtggatca cctgtggtca 173040
ggagtttgag actagcctgg ccaatatggt gaaaccctat ctctactaaa aatacaaaaa 173100
attagccagg cgtagtggcg ggcgcctgta gtcctagcta cttgggagac tgagacagga 173160
gaatcacttg aacccaggag gcagaggttg cagtgagctg agatcgcgtc tgcgaatctc 173220
catctcaaca agagtgaaac tccatctcaa aaaaataaat aaaataaaat atagtgggat 173280
ttggagggaa gatgtgccca aacaggagag aagctcacac ttcaactcca actgaacacn 173340
cacccactgc ttaactgtaa ggatgctatt ttattttgtt tcctttaatn ncaagagnnn 173400
nacaaanatt gttnaagana gcatgnagct tactgcactg taccattgaa aacagcaagg 173460
atgataagga agagcaacct cgcagcactt tttctttcag atcctgtcac aggcagtggg 173520
aaactagatt gcaatggttc taagagaaaa gcatgacagt tttcagtttt atgcggtgcc 173580
tggcagttgt tgaattacaa aaaggcactc ttatagttgt gttaagattt gttgtgagga 173640
gttagaatag tgaggtttac cctgtgtgga cctacacatt aaataggaac atgctggagc 173700
tggagtcatt gccctgattc cttttggact caactttcac acagtccgtt tggatctttt 173760
ttcaagtaat tcatgtactt ttccgttctt ctggaagcat cctcacaatc tgctttatca 173820
tccattcttc aaatatttga gtacctacca tgtgtacaac gctaggccag gtacaataat 173880
aagtaagttc tttgctccca tggagccttc tggtctaata ggggagttgg atgtaaatca 173940
agtaattaaa ataattccta actgtgtaaa gattgagatg agctttcttc agaaaataac 174000
atcatttaag gagagacact cgtagaagac cccgacacaa atggtggtca ggggtgagga 174060
tgaagaaagt tacaggagag ctaagttttg caagatgagc cttgtggact tcacggaggt 174120
gtggtgggtc aggggagggg agcacaactc cagggagaag ggaaagcctc tgtgcaccca 174180
gaatgcagga agaccagggt ggagtggtat agagtaagtg tggaaaagtc agcagggcat 174240
gaaccatgca gtgccttgag aaacacggta aggtcattta ccatttgttt tttgtttgtt 174300
tgtttgtttt gagacagtct cactctgtca cccaggctgg agtgcagtgg tacagtcttg 174360
gctcactgca acctctacct ccaaggttca agcgattctc ctgcctcagc ctcccgagta 174420
gctgggatta caggcgtgcg ccaccactcc tggctaattt ttatattttt agaagagacg 174480
gggtttcacc atgttggcca ggctggtctt gaactcctga cctcaggtga tccgcctgcc 174540
ttggcctccc aaagtgctgg gattacaggc atgagccacc ataccagcca gaacatttac 174600
ctttaatgtt tacctttaac ctgagccact gaaagcttat aagatgggag gcagtggtga 174660
accagagagc tgtttggaaa ataaaatcaa gagggacttg gtgataggtt ggatttaaag 174720
acatgagtga gagagtctca aagatgattc ctggtttcag gtttctacag ttgcatgaat 174780
gaaatgtcat taactgagtn aagaaacact agcatacaac cgtatttggg ggaaacgttc 174840
atcaactcag ccttgggcat gttgagttgg tgaatctttc aagatgtctg aacngagatg 174900
cctaatagtt gtgtataggt ctggagttca ggggagaagg atggctgcct agagatataa 174960
atgtggacat tcaatgtaat tctcaattat ttattcaggt gctgttctag acatgtggcg 175020
taggtcaatg aacagaacag ncaaaaatga ctgcctcctt tgagcttcag tcctagtaaa 175080
gttctccatg ttttcataat actggaaggt gtaaatctgg atgagattgt atagggtggg 175140
aagaaaaaat atgctggagc cttgaggaag agcaacattt aataactgct ggtgtttgcc 175200
tttatggtaa ctcaacctgt ctctgttttc ctccttgtgt attttcactt tcagttccat 175260
tgcaaatagt caacattttc tgtatctcag gttcaaaact tgatcaataa gaacagattt 175320
ggtcgatcca gctaatcaat atgattcctt ttaggcagga atttcatctc tgattgcctc 175380
gcaatgctgg ccagtcttat agaaagtccc tgtctttggc ccggtttctg gctcaaccag 175440
ctttgacaag ggtgatgagt tactttgtac cataaggcaa tttatnagga agaaacacct 175500
tcataaaaaa aaacaaaaac aaaacaaaac aaaaaacaga acaggcagac atttggagaa 175560
ctcacctgca tattacagag agatttaata tgtttatcta ttgcatgcca ctgtaattta 175620
acagtctagg caaaggtaac agaaaagagg agctgagata atccagctcc tccccaacca 175680
ctcattcagg aggaagcaga tgtgagtgcc attgtagggt cctgagggag tattggttcc 175740
catttcctag cctgcccctc ctccccacgc ttggtcagtt acaccttcat atggctcctg 175800
ttctcacttt acctctctgc tttatgataa gcgcagataa aaggcaagag acacagacaa 175860
agcgaaaaag aaggaagagg gaaggaaatt tagaagggac cttgcaaaca ttttccttcc 175920
actgagtggt ccacaggagg aaacaatgaa aacttctctc tcctttggga ggccaaggcg 175980
ggcagatcac aaggtcagga gatcgagacc atcctggcta acatggtgaa accctgtctc 176040
tactaaaaat acaaaaaatt agtcaggcat ggtggtgtgt acctgtagtc ccagctactc 176100
aggaggctga ggcagtagaa tcgcttgaac ccaggaggca gaggttgcag tgagccgaga 176160
tcgcaccgct gcacttcagc ctgggcgaca gaatgagact ccgtctcaaa ataaaataaa 176220
ataaaaataa caaaaaataa caaaaaacaa aaaaanacct tctctctcac taacaaagag 176280
atgtgatttt ggagaaatgt cttccctctc tttcagtttt accaaatcta acttgggtat 176340
ctttagatcc ggtgtgccct cttttctttg atgacacgag tcctaactcc tatatattgt 176400
cttatatgat tgttttatgt catccaagct ggcacttata tcatctccct ggtctcatag 176460
gcatttaaat ctgggcccct gcactagacc ctgacaagat ctcttctaga tctaaaattc 176520
tcatccggga aagagtcgag agctgtcatt actgggacac ctgtagctgt atacttcatt 176580
atgacagatc tgttgtttat gtccagtgtc tcttctgatt ttggggtgtt catgctgcat 176640
ggttttctaa tatacgtagt tctaatatgt tctctgttca ttactgcgaa tttctgctcc 176700
gacccctggc cacctacaca aaccgcaatc cccagcatag gcaacatgtt agtaaccacc 176760
cggagggggc gactgcaagc catgatgaag agctgggtct accatgtacc tgacctgtgc 176820
tgcaagctct ggcactagag ctggggtcac agggccctag ataagtaatc tcctctgaga 176880
atagtcagat tttgtcaata catacaattt tctcttagca gaaatcttgg ttgtattaat 176940
aaatgctgtc attgacagca ttgctttgta tttgtacatg gatcaaatga aagaataaaa 177000
gtcaggaaag tgatgatatt cattccttgc catttactta atatgccatc aaactttccc 177060
actttcctat tattttttca ctctgggagt ttaggaaagg gaattatatg actacctgga 177120
ttctcatatg ccttcaacat atttttaact ggatcatttc atcttactct ggatttgtgc 177180
ctaaaatctc agtgctaagt gctctatctt ctaaattgag attccacctt ccaaagatgn 177240
actggtggtc ctcttattcc tgattatctt cccagctcac actcccccag atgaaataag 177300
gagagtgctg tgggaggaaa gttgtggtag aatcatcagt agcagtgttt acggagagag 177360
attattcctc ctttgccaaa gcgcaagaga ggacttccag agaatcactt gtaggagtga 177420
ggagtaccag tcaaacagaa agagactggc tcttctatct ggaagcttgg aaacccgtag 177480
ctctactcag ttcagccact agattacagc aagctgagtt ggttgtgaaa ggaagctggc 177540
atcttccttc tgaagaatgg tgcagatggg ggtagagtga acctgccctt gcgtgacata 177600
gacagttctg aaagtcagag gccagccaga gtacagctag cagtagcttg tcaagaaagg 177660
actgtcaaga agaatatttt ctaagattaa tgctgggctg ggggaacccc acccctttct 177720
ccttctctgc cacctcagac agtgcagagg ggagctcagc ggtgcccatg acagatgtta 177780
gaggaaggtt ggggaggcag agggctgcac aggcagaggc caagccaaga catgctcatt 177840
caggagagga ttaaaggaag gacctaagga agacaagatt ctctttctct taggacgtct 177900
ttggctgcgg aagaccagag taaaactctc cttatacaaa aaagaaatca cacaaattat 177960
atgttaaccc tatcaacaaa ggacataagt gctgaatggg tgtagatcca aaccaaacta 178020
gaagggaggt cagtggtttc ctaagataat accttctgct cctaactctc cactctgacc 178080
ccaactttgg aggagctaca cccaaaagaa gaagatgtgg agcaatgaaa gaaaagacag 178140
ttggttgctc accctgtaat ctcagcactt tgggaggctg aggtgggtgg atcacaaggt 178200
caagagtttg agaccagcct ggccaacgtg gtgaaaccct gtctctacta aaaatacaaa 178260
aattagctgg gtgtggtggc gcctgcctat aatcccagct actcaggaag ctgaggcagg 178320
agaattgctt gaacccagga ggcagaggtc gtagtgagct gagatcacgc cattgcactc 178380
cagctctggg caacagagca agactccatc tcaggaaaaa aaaaaaaaaa agaccatgtc 178440
ccctccctag ctcaaaacca tatgtcatac tgtcatgtaa tggggtgagg aagaagggag 178500
gtttgaatca gatatgagac tagactgcac tgaagtaaat ttttaataac caaagttgac 178560
caaaaagtta gggaattaac tagggataac aaccagtctt ttatcctcat ttataatcca 178620
actttcctat aattgaggat gactgatttc actgttggcc ttcccttaca ttccacttgg 178680
agcattactc agtgagaggt agggcatccc caggcacagt gagaggtgag acattcctgg 178740
cattctgtca ccgtgaaatt tccagtcctc atcttgtgtt ttctgtaatt cagctctaaa 178800
gccagccatt tcttcaaaga gtgctgattt gttttattgg agaatggtat ttagggacca 178860
aaancctagc actaggtttc tcattgtttc cagtatatca gtgtttctag gctctctcag 178920
caagaagagc agggaaatac atgtatgtgt actaactcaa gtacacacat acatgtattt 178980
agctagtttt gtatatattt acctatctat gcatgtgtct tacataacca tagaaccatc 179040
tgccttgata acttgtactc aggtattaac aatatactaa ttttgttaga ttgttactgg 179100
gacatgagtg cagtatatac atgttatttt ctttaatgtt atccctattt ccacttgttt 179160
ttaataaaat atgtggatta atgtgaattt tcatagtgta tctaataagc ccttttatca 179220
acataggaga catttaaaaa ctattcattt gaccacagac atacacaaaa atgataattg 179280
gaaatgcatg attgtggcca gaaaagaaat tacttaaggg aataggacac tgctggggtc 179340
caagacccca atgttaagac tgcattccaa agtacgtatt ttccatgcct ctaatttaaa 179400
gtgtcatatt tatttgatag taaataccat tactgataca acgttacatg cacactaagt 179460
gcaacaaata agggaatttt ctatagaaaa tgagagccag agttcatacc atcagagaaa 179520
gaagttataa atgagcagag gggagatgcc acaggagaac ctgtggggct agattaggag 179580
tatcagtaag aactcagctt attttaagag agaggatagg taggtagtta catgcatata 179640
tatatatata cctgcataca tatggttgga gggttatgta agatacatac gtaggtaaat 179700
atatacaaaa ctaggtaaat gtgagagagt gtgtgtacat gagttagtat acatacatgt 179760
atttccccgc tctttctgct gagggagcct agaagtaagg atatactaga aacaatgaga 179820
aacctagtgc tgggattttg gtccctaaat aacattctcc aataaaacaa gtcggcactc 179880tgaagaaatg gctggcttta gagctgaatt aaagagaaca caagatgagg ataggacatt 179940
ttgtggtgcc agaaaataaa gaagacctaa aaaggaaaaa acaaacaagc aaacaaacaa 180000
acaaacaaaa tagatagaag tatgtctgaa gactagagaa gccgactgaa agtgccccca 180060
gtggccaaag caggaagact ttgagcaatg aaatgaataa ggaaagtact gggttataac 180120
ccaaagaata caataaatag tcacaaatac atatttatac agatacatga ttgaataaat 180180
aaataaagga ggagggacaa ctgattctct cagaataatt ccaagtaaga aatgtagaga 180240
aatagaaata atagaataat aaatgaagta aacagaaaat tgccattagg aaactattgt 180300
tgtaattgcc acagacaaga gctgatgaat accaaaatta gtatgtgaaa ctttaaggag 180360
aaataaaaca tttgcatggc ctcaaagtgt cctctccaag tcttttttta attattgtag 180420
cagctttaac atccacccac aaattctttg atactcctcc ttcctaagag ataaagcttt 180480
aattcttcta agtgtcagtt ggagtcagtg acttgcttca agccaatgga gtaggaaaag 180540
agaaacactg aatgtaactt tataatgcag aaacctggca gacatcacct tacccaagta 180600
aggacagtta acctcaatgt catatacaca ctgatatgac gagaagggcg tatcatctcc 180660
atggtatttg tcccaaaaat gtataagctc agtctaatca tgagaaaaga tcagacaacc 180720
caaaattggg ggacactctg caaattacct gactgatact cctcgaaacc atcaaagtca 180780
ttaacaacaa gaagaattag aggaattgtc acagccaaga gaaacttcag atgtgacaat 180840
gaaatgcaat gtggtttcca ggatgagctc ctggatcaga cgaaagtcat tcgtgcaaaa 180900
acctgggaat tcccaataac ttctttagtt aaaagtattt gaccaaggtt aattttgtag 180960
ttttgataaa tgttctatgg tatataacat gctgggtcaa ggtatacagg aactctctgt 181020
actatctttg caactctcat gtgagtttta aattacttca aaatagtgtt tttgtaaaca 181080
ggatgagaat tttctatggt aagctgtaat aatgcaacat agaaattagc tcctgtgttg 181140
ccttgttcna aagnatatgt acatctgtgt agctttctgc catgaatacg ttgtatcaag 181200
tttatacttt attattcttt tttgatcttn aaaaagctgg gaacacacac tttatcaaga 181260
gccaaatgct ttttgtgatt ttgtttncta atagaaaatc tgatgtaact tgtcattact 181320
cctctttcat ctttgccagt aatataactc atctgaaatc ggcagacttg cttgtgctgg 181380
ataatataga tgattccata ttgtaaaggc tctaagaaaa caataataga atgaagagaa 181440
atattacaaa tgatcctctt ctgcctgttg atgggactcc gttagtgttg ccttcttgtt 181500
ctcatctcat caccattgga ttatcattgt attgtgtgca caatttgagg ccacagggcc 181560
acagagagtt gtgcccttaa ttaaaaatgc atcatgctag taggggaaaa gcacacgtaa 181620
ttagaaagtt atagtgcaaa cccctgagca aggtgcaaca gagggagatg tgactaaatg 181680
caaggtgcac agaggaagat gtgcctaatt tggtttagag gcaggtcctg gaagatgtgt 181740
ctaaaaatga tgcataaaat tttcttagga aaacgagaga aaatatccca tataagagga 181800
ataacaggca caagattcac aagtaaaagt gtaccaattg cttgaaagtg ttgttttggt 181860
gtggcagtat acaacagttt tagaagctca agctctggaa tcaggaaaat tgttgtcaaa 181920
ttccagttct gccacttcta gctatgtgac ttcaggcagc taattgaagc tccatggacc 181980
tgtttcctca tcgatgacat tgcataatat ggagctaatt atggtaccga catcagggag 182040
ctaattttta gggttaaata atattagcat aaagtgttca gcatcatatc cagcacgcgt 182100
gtttactgct tcacctacca gttgttattc tgagaaatat tcctggagaa gatggttttg 182160
gaaggattta taagagttaa ataagtgtat tgcaggcatg gggagcagta tcttcatgtg 182220
acatccctgt gtgagggggg cacagaccta caggttagag catagagggc aaagcactgg 182280
aagacccgct tatgccatgc taagaagatt agaatttctt ctgtacataa ttgatagtct 182340
ttgcattact ttaaggacca gagggacata aaggtatttc ttttctagat gttctaaaag 182400
attggtttaa agggaaaaaa ctaagacaga aagccagtta ggaaggtttc aggagtctca 182460
acgagatgaa atttggatga ccaattgacc attggattca gcaaaatggg aaatacgctg 182520
actttgccaa gagcagcccc actgaggcag ggggggacac ctgagacagg agaggctgga 182580
agaggggtgg gaagcgatat aatggtgctg taagcatctc tttgaagaag caaccttaaa 182640
tagcaaagga ggcatgatca ggagaaatgg tttaactgcc tattttcgtt ttcattttta 182700
caaccaagag tcttgagaaa acaatccaat caacatagca aacgagaaga aattggggaa 182760
agagggagag gttgagttgt ctcagattag ccagagggaa gggactcaag cacacatatg 182820
tgtcacccca ttcatatggg tgaagtcctc ctcctgtaga gcaagcagtc actgtggcat 182880
ggtgatagct ttggtttgta tagcacattt cccttgagta attcaaatta caggcatatt 182940
gctatctcac ttacacgtct ggcatttata tgaaagacta aagatcctca ttttttattt 183000
gagaacactg aaatccaaag gggtgaagag attataaaac tgaacaaaag tttaaatcca 183060
tgtcttctta ctttgttttt tactgttttt acttatgcta tctctgatgt tttataaatt 183120
aaaaaaaaga gaaaaattac atgggagtgt atgtgcgtgt ttgtgtgtgt gtaagtgtgt 183180
gtgtgtgtat cctgaattcc ctttggtgtg acatttttcc ctagcactta acgaagaatc 183240
atctcacaat aagaaccaag tatctagttg acatgaaact ctaatataat ttcctctgaa 183300
gtggagcaaa aaagatatat actttttttt atcacactga gcatatttct atgactcagt 183360
aaattctctg atggaaacaa ctgtgtctca gtggagtaac aaaggacaga tataatataa 183420
aatagagatg ttntgggacc tagaagaata aacctacaaa atcaatcttt attcatcacc 183480
actgtctcta agaaattatt aattacatta atgggatatt aaaggacaat aatatgagca 183540
aaatgtgctc attcaacata attaggtatt ctggatttga atagtttttt ttttctttta 183600
ctaattcatt agagttgttg gttagcttag ccttgctgca aatattatct atgttgttgc 183660
acaaagtaac cttctgaagg acatttaaag cttgtaagat cttaagggtt gtgataacag 183720
catgaaagta aacattttat gcacacttca gggatatcat aagtggcagg aatgcaacag 183780
tctgttataa gtgctctgct gagctcccaa accaacaaac acaaaacagc cacttaattg 183840
cccagtgcat ccgcccctcc gaaaacagag cttctcttca tacttactta agggacatgc 183900
tgcttggacg aatgagtaac cagccaggat acagcacatg cagttaatca gctaatgtta 183960
tgaacatttt ggatgtcagc tatcacataa aaatgtagct tttatggccc ataggctaac 184020
caagaaatga gccctccaat ttctatctgt ggcttcagtc gatgcgtcca aataattgaa 184080
aaccccactt tgaccttgga tatactgggt gtattaaata tttttgtaaa acggggaaaa 184140
attagtgact taaacatgtt ttttgatgaa acgtttgaaa actgtacagt atcgctgtct 184200
tctatgcact aatttgactt ggttgccttt tgtccacagc agaaaagaca gtgcccaccc 184260
acctgaagaa attctgtatt ggatttcaca ggccagtgag ggatattctt tgtatttgca 184320
tattaaggtt ttataattac acagaggtat tattaaaaac caacatgtgt gatcattatt 184380
ccagatgccc catctgtttt gactgtgcga tttgggttgt aaaatcacat atacaaatta 184440
gcaagagaaa ctcccttgaa aaataatagt ttacgcctta gcaagactct atgttctgaa 184500
ttgctatgtc atatatatag atacagaaaa aatagctaaa gccactgtgt aaagaagcaa 184560
agagacttca gccttaattt attcacataa caaagaggag ggactccttt cttctgattg 184620
aagataatgt ggttattttt cctatattga acaaccaaaa aatattctac agttacatca 184680
actcacaaat ctatgcacag ttttcaaact aacacggact agatttcaaa atgagaatct 184740
cccaagtctg aatgtttttt aaattgtttt cttttgggaa atcataccaa aaaattacaa 184800
aaatttttat ttaatgtaat tcttcaattc agttattcct cacagcaatc agaaaggaac 184860
tgaaactgaa taatgtttga atattttaac agaagaaagc acaggctgaa atagggaaga 184920
tttaagcgat gaggcagaac acagtatgtg tcgtgcagag caattacacc cgaagtctct 184980
tgagaagtca gggaaagcag aggatttcag ccgcccgatg tgtaatgata tctcagccag 185040
gcagatgctg agccgtagaa tagcactgag cttagacgac ttctagtttt aaagctcaag 185100
gtttgaagtt tgtttctttg attctaattt cattcttgca aatgtgcttt tctttaccat 185160
gtgaatgtgt gacaaagcta tcatttgatc tctcggttgc agccagactt catgctcagc 185220
tgaggccatt ataaacttcc tttgtactgt tctttacatt agatttttca atatgagaaa 185280
taaaatccta ggattctcta cactgtgttc ttttccttca agaatcatga tcttaaaaac 185340
actttttaaa tggacattta caattataat tactttatgt taaaagatct tcttttcttg 185400
gtatagtata atgatcttaa aaattcataa ccacttctta taatatatat tattcattca 185460
tttgcatcaa agtaaattta atcttgcaaa atctttgctt aaatgcaaaa aaggggaaag 185520
aatttggata aaaggtagaa taccatttca ttacatttta aagaaactta atagtggctt 185580
caaaataaca tgtaatactt tgtgtatcat ggtcacctca tcccccacca ccaacacaca 185640
ccctgtctac tcccatctta ctctttcttc ctttttctgt gtctgtagct tggtcaaaat 185700
catgggttgg gaaagacgtc aaagttttgg tggctgatag tgccgaagta agaatggaat 185760
aattttgctt aactgcatca tcttcccttt tgaaaaactt ttaactgaac tctaatatac 185820
atatagaaag aggtatagta tacatttttg taaactgaac acacccagca ccctgctcag 185880
gaaatattga ctgtgcctta gaagctcctt tccatactcc ctcccgctcc ccgccacccc 185940
cacccaggac gaccactctg cagacacccg gcagcacacg tcagtgccac ctgctggttt 186000
aacttcctcc acgtggaatg gagtacatac aacagtatgt actctgttgt tgcgtctggc 186060
tcccttcact caatgttatg ttgtgaaatc cacatttctt acactgagat gtagttcact 186120
cattcaaata tttaaataaa cccaaatgta ttttcccact caactgctag tgggcatttg 186180
gacagttcac attttgggac ttttaacaac tgacactgct gtggccaagg gagggcttgt 186240
gccttgtggg tgtgcacgca gttcttgcag gcacgcacct aggagaggat ccacagggct 186300
gctggattta cctgtgctca tttttagttg atgctgcttc tctcttaata acagcaaaga 186360
gtgcatggga actgctgtcc agaagaacaa gtccttgctt ttaggaggtt tgattcagtg 186420
cctcagccat gagattcaaa atactcaccc ttcaagcagc cgctcatcct tctctgtgtt 186480
aactggccct taatgcacaa ctgtagggca atgatgccag gtttgcacaa tcgtgaagaa 186540
ccttctgagt ctccaaaaag agcttcccgt ctgttctttg tagtttcaca gcgcaatgac 186600
caagtngtgc tgagttctaa ttcatttatt tacaaagagt tctatttnct actccctaga 186660
atgtactata gaagtaaatt taaaatggta tcttgttcct aaggagcgta caagctttgg 186720
ggagtgtaaa tatctctaat accaattaga atgcgggtga aacccatttt taaaatgtgt 186780
aaacaaggtg actgttggta tcctacatat gttaaacaat atattcaagg atattcgata 186840
aaatataact tgccatttct ccaacatgtc cctttataat tttttttttt tttttttgag 186900
acagtctcgc tgtgtccccc aggctggagt gcagtggcac aatcttggct cactgtaagc 186960
tccacctccc gggttcacgc cattctcctg cctcagcctc cctagtagct gggactacag 187020
gcgcctgcca ccacgcccag ctaatttttt gtatttttag cagagacggg gtttcaccgt 187080
gttagccagg atggtctcga tctccttacc tcgtgatccg cccacctcgg cctcccaaag 187140
tactgggatt acaggcgtga gccactgcgc ccagcctaca aaatttttat atctgtactt 187200
tgtctaaaca ttcattagtt tgtcaacgac agacatcagt tcaggttaaa cgacacagga 187260
gtctaatttt attctcttct gtgaatctaa ggacacgcat actccacact aacaaattta 187320
ttcaatcaat caatagatat tttatgctta tctctctacc cttcaggata tatctaaaat 187380
cttttctttt atttcccagt tgtctgctgg agagtttagc ttagagttga gttccgccac 187440
ctgatcaata ccattattcc ttcactgaat atttgctcag ctcaccttgt gtccagtgcc 187500
atgccagcca ctgcccgtgg aataatgagc agagccctgc atggttcctg tcctcaccaa 187560
gtttacagtc tcagggaaaa gagaactgtt gtgcaagggg tcacacaata tagtgtcaaa 187620
cgacagtacg agtagggggt ttaaggcatt cccccaaaat ttttgtccag ctggatcctc 187680
agaatgagac catctttgga aattgggtct ttgcagaggt aaccagttaa gttaattgtt 187740
ctggatggtc cagtgtttgg catctataag gaaaaggaga gggggattca gattcagaga 187800
cacagaaaca cgcaggccca gaaggccatg tggtgacaga agcagggatg gggtgttaca 187860
gctacaagcc agggaactcc gagcatggct gagaatcatg agaaacaaga gaaaggcaag 187920
gaaggactct cgcctggagc cttcagagag agcatggccc tgctggcgcc ttggtttttg 187980
acttctagcc tccagaatgc tgagagagta aatttctatt gtgttaagct aatgatctag 188040
tggtaatgtg tgacaggagt cctaggaaac taatgtattg tggattcaat tgacccgtaa 188100
gaaattgcag atgttcaact gctttgagcc acacaaacag caatattata ggattcatcc 188160
taccatgtta tgagcttgta agaggaaaac tttgtcagag aaagcttctg tgaggaattt 188220
ctagtggaac tgaaatctag aaaacaagta gaatttgatg gagttcaaga gaaaaagagg 188280
aagaaagggg aacccagcag agggccagca gagggccggc agaggtgggg gaggcacaga 188340
ggttctgagg cagagggtgc agatgtttcc aagcaactga aggatgtgac tggaacccgg 188400
tgtggggata gagctagctg aggctggaca ggcagggagg ggccaaaaaa aggcctctga 188460
gcctagattg aagattgaga ttttgaccag gcatggcagc tcgcacctgt agtcccggct 188520
actcaggagg ctgaggcaag aggatccctt gagcccagga gtttgaggcc agcctgggca 188580
acattgcaag atcccatatc tttaaaaaag aaaagtttat atttttgttt ttgtttgtta 188640
aaacaaaagt ttttttgttt gtttgttaaa agcagtgggt agccaggtgt ggtggtgcat 188700
gcttataatt ccagcgactc aggaaactga ggcttgaacc agaaggcaga ggttgcggtg 188760
agccaagatc gcaccactgc actccagcct gggagacaga gcaagactcc atctcaaaaa 188820
aaaaaaaaaa aaagagagag agaggaagaa aaaggcagtg gaatgccatt gaaaagtttt 188880
aagacagagc gtgagaaatg gcaataaccg cagaatgaag agcagattag aaagagctga 188940
agcagatgga gaaagcactg caggaaatgc aggaacccag tggtgcattg gccagggagg 189000
cactggtggg gatgcaggca gtgggcaggc ctagaggctt ttaggaaaga actctgtgtt 189060
ctcatttcaa tgatatgtcc caattaatat accatttgcc cttgtgtctg tttgaagaca 189120
ttgaattctc ataaaatatg cataccagtc ctgatacatc tagagccccc aagtcaactc 189180
ttctgaccac gtgtgtctat tctgctgccc gtgaagtctc gtggagtaga agtagtgcct 189240
tcattttttt tcttatttct ctctttgctc tataccttgt gtttccgagc actctgttcc 189300
tatatctgcc agagtggcca ttctatttta ttatcattgt ctctttatag aactatctac 189360
ccagttatac tgtgggctcc gtgagggcga gtgcagtgac ttatttcttt ttatatcccc 189420
tgagcttagc acagaacctg acctgtaaga tttgatttat aagtgacagt atcaatgtat 189480
aaataaatga gtcagcaaat gcatgaatta acaatacttt atttctgctc tgtcttatca 189540
cctttggcct gatatacctg ccttacactc tgatctgatc taatagatta actgcttttt 189600
ctacttctgc tctatttacc actgacaagt atttttctac tagttgtatc aacttttaga 189660
aaacaagact cttcctggta aatctcttta ctcgtgtgtg gaatcatttt tctaactgtg 189720
tacctctcac agagatgcta ctactttttg ttttgtgtct ttgggagcta attccttacc 189780
attgtcatca tcataaccat ggaactgttg agaacgtgcc attttgcaca cattactgcg 189840
ttgagcactc cagttaggaa gggaggaagg caacgaacag cagtgactcc ttctccaaat 189900
aagattacca tctaagacag aaaaaccaaa ggctacccac aaaatcaaat cagacttaca 189960
aatggctaag gtaaatgttt atgttacaca aaacaaaaac ataagagcga tttctgcagc 190020
ctaataagaa aaccagaaat caggatgtat aatctcatca tgagctcaca accaatagga 190080
tagttgagtc atccatcata ttgaaatggg aatgtttccc caaaaagaag ccctcctgtt 190140
ctccttagcc aatttgtatt tccacatata ggagggatgc attgccatct ctcttcctgt 190200
tttaaaagct ctcttggcct ctaattctta tctttccata attcctaaaa caaattatag 190260
agtaaaacca tacccaacaa ggaggtaaat gagtggatga tttttgaaac ccacccccca 190320
aatccctcca aaaaggcagc ctgaattaca tgtactcttt gaaaggcatc agtgttaaaa 190380
gatgcagttt gggaagccgg gacagaagac agggcagacg tggggaaggg tgttccactc 190440
tgcagaaggt cctggagaag gggagaggta aacagaagta aagagggact ccaagagacg 190500
tcggcactgg gagagaaaaa gagagcatag gaaagtatag catgaattct ggaagccaca 190560
gtccaccttt gtagtatctt agttcagcct tgttccagtt tatgatgtta aacctgagct 190620
tccctgaaac tcaatttgta gaaatataaa tatacactct taaataaatc catttgattg 190680
tcattcctca caaagatatc atatggcatt taagttcgtc gtgtccaagc atgtttgcag 190740
ccaaatggaa aactcgctgc atggaccaaa tgtggtattt gtgttttgag cttttctgtt 190800
ttaatctgct aggcgacata accaattttc ctgccattgt ctctctttac aaatgctact 190860
acttagtatg attctgtagt taattttttt taaatttttc atggttttta aaaattttta 190920
attctagcgt taggcatgtg taaacaaatt ttattgttta aatatgcaag taatagtaaa 190980
ccattaaaaa tgtctgagat gaaaagagac ttgtctttgg gaataaaatg acataaagtt 191040
ttccttgaat ttttttctgg tttanttttt ttgttgttaa gttttgtttt tgttttttct 191100
gttaactcaa aagttttagc tcatagagca atttatggcg ggcaagagag gtatacttgg 191160
taggcctttg ctgccatcta ctggcatttc atgtaattac ttattgcttc cattctaaaa 191220
ctaattttgt gtaacgtata taatagtatt ataggttccc ccttttnttc ttctttccaa 191280
tttttcttta gttaaagcaa agtgaagcaa atgcggacac caaagaaaag ctccctttac 191340
gcctgcgaat ctttgaaaaa tttccaaaca gacctcaaat ggtgaaaatc tcaaagcttc 191400
cttcagattt tacagttcct aaaatcaggt accaaaatac ttctttaatt gcatatttca 191460
catatattgt aaaagattca tcatcttaaa tctgatttaa cccttctttt aagtatatgt 191520
gggttgggtt tctttctatt ttattgtcat ctttctacta cctctacctc tatttaaaat 191580
aaataaataa ataaacaact ttgactcttt taagcaatgt attcacagaa gagtcacttt 191640
ataactgcag tagcctaagc aagaaggctg cttcccatcg cttctctctg ggatgactcc 191700
tcgggaatgg gacatcccag gaaactggag aagctgctca gtgttgcagg gatggcaggt 191760
agacatcaat ctcagacccc aaccgtatga gactaaaatt gcctctgtgg cccttttatt 191820
ttcaagcaaa cagggaaacc acagctggcc cagtttgtgt actactacag tgtttatgga 191880
gcctaccatg tcaggttacc atatataatt tgccttccac tttttaaaag aagaaccgtg 191940
gcgtttttcc actcatactg atttgatttt ctaccacgtt tgccctccag ttaagcaaat 192000
gcataaaaga tgctttaaac acctattttt aataataaaa ggaaattctt ctagttatag 192060
ctcaagaaat tacaaacaga attacagtaa tatgttacta gctttaaaaa taattctgtg 192120
gggggttata aaagtatgag actatatatg gtgccataat atttaaaatt cgggtagaaa 192180
tatatttgca tttctaattt taaaaaacaa aattaattga atttggtaat ttgaagagac 192240
gttacttgaa ttttcgttat gctttgaaga tcagatgaac gcacttgctt ttgagtctta 192300
aaatgtaaaa ttctctctta gtcattctta tgataaatgg acatttagag agagcaacta 192360
attcttccaa gtcttagagg gggaaaaaaa gtgttttatt accacaataa gattcaaaaa 192420
actgggctgg gtgcggtggc tcacacctgt aatcccagca ctttgggagg ccgaaccggg 192480
cagatcacct gaggtcggga gttcgagacc agcctgacca acatggagaa atcccatctc 192540
tagtaaaaat acaaaattag ctgggcgtgg tggcgcatgc ctgtaatccc agctactctg 192600
gaggctgagg caggagaatt gcttaaactc gggaggcgga ggttgtggtg agctgagatt 192660
gcaccattgc actccagcct gggcaacaag agtgaaactc cgtctcaaaa aaaaaaaaga 192720
ttcaaaaaac taccatcggt tactgagtaa tattgcttga aagttatttc aaggatattg 192780
ctttttaagc aggagtcact gagtttcagg aagctgttgc taatgaaata ttttagtcat 192840
gatctagttt tctatgatct tttatcactg ctttatcttt gctcaagcaa actcatcatt 192900
gcaaaatgct gtcacttgct cccttccact aataatgcct gatgcacata tacttcattt 192960
gcaaagggag agttttatga agcagtttat tgaccgccag caacaggaca catgttgcct 193020
cctgagaagc ctcccgacca cctcttcctc ctcctgcgac cactccaaac gctcagcaat 193080
tgaggacaac aaatacatcg accaaaaagt aagatcngct gtttcgaata accaggcttc 193140
taaaaagcat ctatgtttga gaaaagaacc gcagagttct ttagggtcct ggaatccaat 193200
ttnctcaaga gaataatgaa aanaaaatga tttcatttgt aaaagatatc atgaaaccta 193260
acatttttta ctctatgcat tgaaattttg catttgcccg tgtaagcttt tgagctgcgc 193320
cacgtggcag ccatgcgact ttgtaaacat caagagcctc ccaaatctgc attttctcan 193380
gtgcggaata aagggctggg atctccaagg ctcagtccag gtgtaatgac ctgccatctc 193440
ctgcaagtac aactgcttat gtctacttat tacatcagag aggatacgag agcatgtttc 193500
tctaaaatcg gtcgaaagaa ttgccattta ttcaatgctt agtatgtggc aggaacttag 193560
gtgcaagagc ttattcatgt tctagtttac ctatttcttt atcatttgaa aagtagaagg 193620
gaaaattttt ttcagattcc acagcaaagt atcagtaggg aaccacatat aaataaagca 193680
aatttaggta ataattttaa agaaatgtac tttttcattt attcactttt aaaaaaaata 193740
atataagggc tgtgtgccgt ggctcacccc tgtaatccca gcactttggg aggccgaggc 193800
gggtggatca cttgaggtca gaagttcgag accagcttgg ccaacatggt gtaaccccat 193860
ctctactaaa aatacaaaag tcagccgggc gtggtggtgg atgcctgtaa tcccagctac 193920
tcgggaggct gaggcaggag aatcactcga acctaggagg cagaggttgc agtgagctga 193980
gattgtgcca ctgtactcca gcctgggcaa cagagtgaga ctccatctca aaaaaaaaaa 194040
aaaaaaaaaa nangacntag aatgtattat ctaggtataa taagtaaaca tatttatata 194100
tacacacata gacatataaa tgtatatgtg tgtatatatg tatgcatagt atcaaactat 194160
atatatcagc ttggtcacat aatcaatgtc agttcagtta gaaaatgaaa gattaataat 194220
tgtcctttaa tattaaagag attaaacagt agagtttgca aaaacatcta gttcacttgc 194280
aagtattcca ctttggcatt cctagagtgt tttttattcc tttacattgt tactgccctt 194340
tttcttttgc ttatagtgaa atccatattt ctctatgatc atgtgacaat aaaatgccaa 194400
ctgtttcatc ctccaggatc ttctttctct ccgctttctt tcccttccca cagggatgaa 194460
ccctttggaa ttccctcacc tttctcttta tctcgcctcc cctttttctc ctctttcttg 194520
cctccccttt ttcctccttt ttcacctccc ccttttctcc tcctctttct cacctcccct 194580
cccctaatgt gatactactc ccgtttacct ctcccccagc tcccaggttc tctgctgtag 194640
ttcagtcatg ttgctcttgc tgaaaatgat gatgattttc tttgcaggat gtctcttctt 194700
tttcaaggat ttccatgtgt tgattttcct tcagccatct agagatgcta ttctactatc 194760
tttgcagaat ccaagattgt aaatgacaag tctgatgcca atgtcatttt ttttttaagt 194820
aattagcctt ttggttggta gacttggttt gcttgtttct tcaggaaaac ttgtaagatt 194880
ttctgtgtat ccttggagtt cagaagcttt cttagaatat accttatatg tcttttttca 194940
tcagaactgc tccaactaga gtcttttcag cttgccaact aagatatttg ctcagggaaa 195000
tttccattta ttttgcgttc aattgttact cttccatctg cttctctctc ccctgggatt 195060
gccatctctc tatttttgtt ctgtgcttgg tcttccagga cactaattag atttcaactg 195120
aggtcatcct ttgcttctaa atttctcgtg aaaaattatg atatggacat atgaccctta 195180
actatcctta aaggcttgca tattaccctt agctgtcctt agaggcttta cttttatctt 195240
ttatttttat ttttttagag atgagatctt gctgtgttgc ccaggctggg gtgcagtggc 195300
tattcacagg cacggccata gtgcactata gccttgaact cctgagctca agtgatcctc 195360
ctgcctcagc ctcccgagta gccgggacta taggcatggc caccatgcct ggcttttttg 195420
atttttttaa attaaactta tcacctctct tcttcacagt tataatccac tcaacactgt 195480
gcatggggca tggaagcaga aggtcatatg tcagtggata aacaagtggg aagatagtgc 195540
cttggcttca gccagtcagt ctgaaattgc agtttgcgtg gactagaaag caggttgttt 195600
tgttttgttt tgtttccaaa gcagattgta agccagaagt ctgggctgtc cttgtgacca 195660
cttatctcca ggaagaggat agagagctga tttccattat ggccaaagtc acaaaaccat 195720
gacatgcttt taaaaatcac tggtaacact accccactgg aaacacaaaa ttgaaatatg 195780
agtttatttt ctctctaaaa ggaaatgtga ttgtttctca catttcctga acacagtatt 195840
ttgatttggt gaggacaaag ataaaaagag tcttgagagg catgtgccgg gctgaggagg 195900
agtctaaaga gaatgtggcc cgcccctctg tgcgcccgcc cgaagcgaac cctccccagg 195960
tacagttgga ataacacgtt ttatcccata caacatgtct tattgctccc acttggaaag 196020
tggaatgtca aaaacatact ttttcttcat cagaggaccc tattatggga gtggcaagac 196080
aactgctcct gttactatcc acgctttctt aaagctttga ttcgatctag gttgtcagaa 196140
aagtagactt aattcttttc aggatccacc attttcagca atagttccca ccagttcttg 196200
gtgttcctca taagacctta ggatttgtca accttgttga gtgcccctgg gccagggaaa 196260
tctaaagcag aaaatccctc ttcaaaggat ttcagtgata aggatttaat ggaagcacaa 196320
attgcggaga cagcattctg gcatttgtat tatgaatacg gcaagccttt ttcattttta 196380
ttaagaaacc cgaaagccac ttaaaaacaa gagcgcataa acacagaaca aaaatccccg 196440
tcacagaccc taccaccatt agttcccctt ataaagtatt tttcagcgag cacttagaaa 196500
tttccattaa aatcccaatt gcctttggaa atcctagtca cagtaaagtg acaggcaggg 196560
ttcttcactc tacgtgnaaa aaaaaaacca cccagccctc tgcaaattgt gcaaattgag 196620
gctgtgtttc ctcagtgact ggtatgaaag aaaaaggaca ttagaggctg gtttatcggt 196680
gattctcata acatgaacaa aggaacaata aaataaaact gttctcttaa tggttatctt 196740
gtaccaggag aaacttctga cttcactatg ctagagggaa tcacctttct ctttccaggg 196800
aaaatagtga agccccaggt gcctgaagac tgcaagttca gggagaaaaa aacaacaact 196860
gacagcaacc ccagaagggg gctggggttt gatgaagcat tgcagaaaac acaaaagcac 196920
attaggcaag attttctccc agtaattacc caagctttga acagggatga gtaattccca 196980
tggcaacctc actttgcaga aaccatgttt ttaaaaatag ccctggtgga tcacctttat 197040
tatacagttt aaaatacctg tccttctccc agaaaacaac cagcaaacaa aaatctttaa 197100
aatcttgggg ctgacccaga tcctaaaagg aaaagacagg aaagagtgtt ttcctgcctg 197160
tcgtttgaga ctccatagaa acgaccttcc caagtggtca tttccccatc cctttatcct 197220
gctacctacc gttcctgtga gcaattgtga gaggttcctt ttcttcctga ttcaaggatt 197280
ttgacagggg cttttccagt ttccaagcag aaagaaatca agcaacaatt tctacttgta 197340
tttttcctcc atattattga aattaaactc tagtttcctt aagcagagtg gtgattaata 197400
aagtgagatc tgaacttgac tttccagtaa ccctgtaata aaagcagccc gctctgttct 197460
ccgaagtgag acatccagtc aaggtcaagg tctcacctgt ggttgagtct acagcgtctc 197520
actgccctgt ggcctgagga tggttctgtg ctgctgtctt ggctgatgca ccatttctta 197580
tgtcagaacc tgcaatagcc tgggaagcat gagtgaacct cctggagcca tgctaggatg 197640
agggctgtcc cagcacctcc acctcgtgcc cctgtacttc ccagcataga atcagagccc 197700
acataataat gaacagtgaa tattttctct gacagtaggg caatatctgc ccaccctctt 197760
gtcagcctcc tttctgctga agcatatgat agttctttaa taagccttca caatgaacag 197820
ctaacttatg tacagtaaag aggaaaatga tcattggaat gactatgttt tgtttaccca 197880
tttgatttta taactcatta acattcattc agtcattcaa caagcactta tagagcaccc 197940
gttattcatc tgctattctc tgggctgtgg gaattcaaca gtgagcaaga tgcgaactgt 198000
accctttaga agctcatagt ccaatgggag gaaatgcaca tacatgcatg aaagtaaaaa 198060
gtattactgg aaccatgaga cagaaccccc taagttcccc ttacagaaga agtgtgattg 198120
attgataaag gaagaaagca ccccaggcag agggggacat atatgcaaag gtatgcaaag 198180
catcaggtgc tcgatgtttg agagaaattg ggtagaagag tgattaagtg gtgcaggttc 198240
caaccctcat cagtaaagtg gagataattc tcattttcaa ggtttgttgt gagaatcaaa 198300
taatgtaata atgttaaata cctagcattg cacctgggct agcatatgtt ctgtgcctct 198360
caaaccagac aagaaaggtt actgttanta aactgtacca tgaagtcaga ctcagcaaac 198420
agatttctat tcatcagtta ggacaaaaga cttttacata aatttaacct tcagatgtaa 198480
cagtctagtt gagtgcaata tattaattac tgatcaattt ccttatggta cctaagtctg 198540
atttttttag agtttgattt ttgttgatat tttagttgct atccctattg tctacacggt 198600
gtcttcgaat ctgaagaagt aaattaggtc attctggtaa gatttactct tccgnttttt 198660
ttattgccat acagcatttt ataatgttct atatgattat agagtgcttg ataatttgtt 198720
cttgtaactc ctcacatagc aagttactca gcctgatcta taatttccag gatgaatgaa 198780
tgtttgttca ccttaaaaga gagagagaga gagagagaat gaacaaanga acgaacgaac 198840
acagcctgnt ttcattttta gngcttttgg tcttttgaaa gaattttttt tttaaataat 198900
ggcttagctt ctctgcagta ccattcaaga tgtatctcca ggaaaagagt gacagatgac 198960
atgatgctac catgtaacca tgggttgtat ctcaaaggga agaattggtg ttcctcatgt 199020
caaatatgaa aactctgtac acttctctct agcttaaaaa tgctttagta gataatggat 199080
tcccaattta gtcacaataa tggaaagaaa taaaaagatg cgtaagattt catcatcact 199140
ggccatcaga gaaatgcaaa tcaaagccac aatgagatac catctcacac cagttagaat 199200
ggcgatcatt aaaaagtcag gaaacaacag gtgctggaga ggatgtggag aaataggaac 199260
acttttacac tgttggtggg accgtaaact agttcaacca ttgtggaaga cagcgtgcta 199320
ttcctcaagg atctagaact agaaatacat ttgacccagc catcccatta ctgggtacat 199380
gcccaaagga ttataaatca tgctgctata aagacacatg cacatgtatg tttattgcag 199440
cactgttcac aatagcaaag acctggaacc aacccaaatg tccatcaatg atagactgga 199500
ttaagaaaat gtggcacata tacaccatgg aatactatgc agtcataaaa aaggatgagt 199560
tcatgtcctt tgtagggacg tggatgaagc tggaaaccat cattctcagc aaactatcac 199620
aaggacaaaa aaccaaatac tgcatgttct cactcatagg tgggaanctg aacaatgaga 199680
acacttggac acnaggaagg nggnacatca cacactggga cctgtcatgg ggcaggggga 199740
ggggggnnag ggatagtatt aggagatata cctaatgtaa atgatgagtt aatgggtgca 199800
gcacacaaac atggcacatg catacctatg taacaaacct gcacgttgtg cacatgcacc 199860
ctagaaccta aagtataata taaataaata aataaataaa taaataaata aataaataaa 199920
taaaacgatg cgtactataa aatcaaacca ttttttcttc ttactggtct ttgcagtaaa 199980
ttctcaagct aaaaccaaat atctgtgtgt gtgagcactc accctttcat ccaacaatca 200040
tttttgagga ccattatatg caaacagttt gctgggccct gagtaaacaa acacatcttt 200100
ctatattcaa ctaacattag agtaggaatt ccctctcaat gattattttt gcagaatatt 200160
taattgtgta accattttta ggttggaact atgtatcagc tgtttgtatt ccttagtaaa 200220
tgcgcattga gagtcaaaag taaatcagtc taggattaag aattttttat aggtaattta 200280
aaagattttt aatcgcattt tctgtatcat gcacaaaaga ggtatcaagg agttaaggcc 200340
gctgctaaat ctatcttgga aatttacatt ttgctcttct ttttaaactt tttcctcttc 200400
tgactacagt tttacttata aattgtctct tctatcaagt gtcatgctag tctcagtgtg 200460
ttgtatttgt tgctgatgat ggtgttgagt ccaagtcctg cttccttgtg ttgccacaga 200520
ccttaaattt cgaatttcta cacccataat cccagcactt tgggaggcca aggctggcgg 200580
atcacctgag ctcaggagtt cgagaccatc ctgggcaaca tggtgaaacc ccatctctac 200640
taaaaaaaag tagctgagca tggtggcaca caactatagt cccagctact cgggaggctg 200700
aggcatgaga attgcttgag cccagggggc ggaggttgca gtgagccaag atcatgccac 200760
tgcactccag cttgggcgat acagcgagac tccgtctcaa aacaaaaaaa aattttggaa 200820
tttctaaatt cacaaacagg ttaaaagcat ctgacattta ctctagaatc acaagcccac 200880
tcaccttctt ttgtctctgc agatttccaa tctttgcctt cctgtttata ttagatataa 200940
tcataaagtc attttgtatt ttacttttgt aattaaaatc tatctagcgt atatttatag 201000
ttttgtttgt ttgtttgttt gagacggagt ctcgctctgt cacccagcct ggggtgcagc 201060
ggcacgatct cggctcactg caagctccgc ctcccgggtt cacgccattc tcctgcntca 201120
gcctcctgag tagctgggac tacaggcgcc cgcaaccacg cccggctaat ttttttgtat 201180
ttttagtaga gacagggttt caccgtgtta gccaggatgg tctncnattt cctgacctcg 201240
tgatccaccc gcctcggcct cccaaagtgc tgggactaca ggcgtgagtc tccgcacccg 201300
ggcatttata gttncttatc attaagtact gtatattaaa cctatctaaa tttgtttcag 201360
tactcgaaga tattgctttt ccctcgattt ttgcacagtt tcattatttn atgtgtaaga 201420
tgttggagat ttgaccaagt gaccccaggc tactgtgtta gtggccgaaa cattgtcata 201480
acattcacgt gcaaaaaaaa atcagatcca ttaagtttta aattgtttag tttctaatat 201540
tacaagctgt tcctatatat caagttagtt gattcatttc aaaataagca gtccctcttt 201600
gtaattttta cgtcattcat atttcttatt ttcaaggact aactacatta aaatatataa 201660
gatagaaaaa gtaatacttt aatattatga aattaattca attttcaaat atatttcaag 201720
caccaacaat gcacagtgct agacaatgaa agaaaatgta ataaacaaag aatacattat 201780
acatatccta aggagtttac aatctattgg aatttacaga aagataaaaa gatgtttcac 201840
acagggcagg gatcaacttg tgctgggtgc ctaggagtcc aaaggaagag cgaagatttg 201900
gtgtatgcat ggcatgcaca cacgtgcaca tgcatgttta tatgaatatt ttaactccta 201960
cacatagtgt ttttacaggg ttcagaacac atgatattga aataagttac aataggaaat 202020
cttttttttt gtttgtttgt ttttttgaga cagagtctcg ctctgtggcc catgctggag 202080
tgcagtggca cgatctcagc tcactgcaag ctctgcctcc caggttcacg ccattctcct 202140
gcctcagcct cccgagcagc tgggactaca ggcgcccgcc accatgcccg gcttattttt 202200
tctatttttt agtagagacg gggtttcacc atgttagcca ggatggtctc gatctcctga 202260
cctcgtgatc cacccacctc ggcctcccaa agtgctggga ttacaggcgt gagccaccgc 202320
acctggccta caataagaaa tcttgaccca tcatctaaaa ttctcttcac aaaattcaca 202380
ttttaagata ctgttcaaag cttcataaca tgatattata atggtattca cctttatata 202440
catccataat caacatttta atcttgctga tgctcacatt aatcaccttt taaaattttt 202500
tttctaagca taatgtcaat tccnagagaa agtttatttt atagaaacat cttgccacac 202560
acatgatctg tcgtatgcac tttgggatta attatgaatt cacgggtgca tgaaaattca 202620
aatacagtca aatgagatac caccttcgac ccatgcaatt ttaagtaatt gcttattccc 202680
aattactata ttttatttgg gagacttatt caataaagtg gctcgttaca ataattacac 202740
tacaactttc tagcagaaat gacattcatc aagccatatt cattggaccg tggttttgtg 202800
tcttatggtc atatgttttt ataaccactt tcccatttat tattaacctg ttaatatttg 202860
taaagtgaga aaagaaaaat ggagccactc aaactttttc ccagttagaa acagaaatgt 202920
attgttaaca ttgtaaatca aaaaagctat tgaatattta taatacttgt ggtgtgcttt 202980
gtcaaataaa tattgatggc ttcattctga aggtggtttc tagggtcaag ctatggttct 203040
ttaggtctaa gcattgccgc atcctaaagg aatctatatt caagataggt ctgtggttac 203100
ttctgggtga ttgaattaat caaattaata ttctgattga ttgagagttt tgatggatcc 203160
cagattttaa ggaatcagta agtgtaaaat ataaaaacta tgatcatact agctttaatg 203220
agttaggaaa tgtattgatc tctttcagtg cttcagagtc attattctga aaatcaatta 203280
tgcatatgta gaacaaacaa aaagttggtt agtttcgatt ttgcattagg atgtgagaat 203340
agcaagagtt tataatatgt gtaaacaaaa tatttcaagt caagcagata atattttgtt 203400
atgatatagt ttagaaaatg cttttttata ctaagcctag tgacatttta catagacata 203460
atgcagtgaa aagatttgaa cactgaagct gcatgatcca gagttctagt aataattttg 203520
caatttatta tctgagtgaa cttagacaac ttaattttta tgagccttag atctttaatc 203580
tggaaaaaag agataataat accttaccta cctatgagga ttagtttgaa gattaagttt 203640
aaaatatgta tatatcacct cagcacagat caaggagcca agaaatacag atgtagaagt 203700
tataaaatgt acatttttaa atgtgcaatg ggcatctata aaattcttca ttcaatgact 203760
agagaataac attctaattc aagaacacat gtatgatttt aaatgtaacc atttaccaca 203820
gacttctaaa tatatacaca tcagtgtcct agaaaagata ttatttgacc aaaatgtaac 203880
aaaatcngaa acctaataag aagaaaataa ccacaaaaaa acctacacat tcagaaattt 203940
aaaactattt tcaaataagc acagaagaaa caccaatgaa aataagaaaa tatctacaat 204000
taaaaaataa tgaacaaaag atgcatcaaa cttgtgggaa gtagctaatg gcatttttag 204060
aggaaaaaat ttagccctga atgaatatct agtaaagaaa taaaggctta aattaatcct 204120
ccaagcattc atttcaagaa tttagaaaaa ttatcaacca aggaaacact aagatagcag 204180
aaagaaagaa ataataaaga gaaaagcagt tattaatcaa atggggggaa agaggtgata 204240
aataatatca acataattga aattttgttc tttggaagca gtaataaaat tgataaatct 204300
actttaaaat tcaacaagaa aaaattaagg agccttcttc tataaagatg acagaggcat 204360
tgacattgtt ttttaacctt gaattcccac atgaanaaca aaaagaatac caagatatca 204420
aaaccccaaa tccatagtta atatttacca taaaactcgg taatccacaa accctaaata 204480
aaagcaagtg ttgacaaaca gccacatgat ttgcatgata ttagtgtctg tgggaggaaa 204540
ccaagcttag ttacagagcg tccaatgttc atggaatggt agaacatctt ctttgctcca 204600
ttctgaaata aaaagtccag gagtggaatc aaaattgaac aggccaggaa caagagtgat 204660
aaggataaaa gcagatccag acaaaatttg tggggggagg aggattggga aacagagctt 204720
ggaaattcca gaaagaaagc taccatattt gatcgatata ttaaaacaac agaagaggaa 204780
actctgaagt tagaagagaa atactaaact gtttgggaaa actaattttg tataaaaatg 204840
agtaaggaaa attatcaaag ccaaattccc tgcaaacgtt attataagaa aaaaacagca 204900
gaatactgtc tctcactgta gacaaggaaa gcaacctana aaaacgtgct ctaaccagct 204960
caaactgtag catactattg aaaaattagt taaaagacat taaaaattac ataaggatga 205020
aatagcaaca taaataaaag ttagaaaaac tcagaaatga ggtgccagaa ctgagaaaag 205080
ttataaatta aagcaatgaa aactaaacga gaaggaacat aaagagacct cagatgattc 205140
aaaagtgaga aatagaaaat ggagaagagg gcatttttta aaatcaaaga gaaatgaaga 205200
aagagatgaa aatgatttgc aagaaaaatg acaaattgaa gaaagtcaaa aatccgacat 205260
ctgcattata ggtgtcccta aggaagaaaa accacagcaa gagaataaaa cgtatactaa 205320
acttttctga aacataaaaa gatatgaaac tatatattga cagcacacac ctaaaaatat 205380
tggagtaaat gattaaaaac aatacataca ccagacaaat gacaggtctt taaatttttt 205440
aaaaatatat tatctagccc aaataagaac aagtgattta taaaggaaag aacgttagat 205500
tatcatgaga tttttcagca gcaatgcttt atgtcagaag aaaatagagt aacatatata 205560
ggatgcccag gcaaagaata tctgagccag atttttttcc atcctgaaaa ctgactttca 205620
actttcaagg tcagagaaac tgctttcaag atctaagaat atgagtaatg taagatacaa 205680
gtaatcttgt ttcaatgaac ctgtaatcta ctaaaaaaca tgcctcagat aacctaaatg 205740
aactccaaaa gggactctta aaccatttgg cataaaaatt cacattcata tgtaacaact 205800
aactacataa ggacaacatg aagagtgaaa tatgtaataa ttatttgttc taatatggat 205860
agagtacaga tatacaaatg aggaggtgaa ngggaagaag atatgcaaac ccttaagata 205920
ttcagtagtn ttcttggttg tgtattttca ttctgagact attgtctatg aaatgtgaaa 205980
taaaactgag tcactgtnga gacaatctaa ttctggcatc cctggtgctc ttgataatca 206040
agagtgctct ttgtggagaa aaaaggagat atagatatca tatagaaaag cttaggtaaa 206100
aataaaaatc ctaaagaaaa cgtggcatgt atacaccatg gaatactatg cagccatata 206160
aaagaatgag ctcatgtcct ttgcagggac acggatgaag ctggaaacca tcattctcag 206220
caaactaaca caggaacaga aaaccaaaca cagcatgttc tcagtcataa gtaggaattg 206280
aacaatgaga acatatgggc acagggaggg gaacatcaca cactgggtgc tatcggggtg 206340
gggggcaagg ggagggatag cattaggaga aatacctaat gtagatgacg ggttgatggg 206400
tgcagccaac cactgtggga catgcatacc tacgtaacaa acctgcacgt tctgctcatg 206460
taccccagaa cttaaagtat aactaaaaaa aaaaaaaaaa aatcctgggt catgaattta 206520
aattgaaaac atcagaataa acccaggcaa aatatttgaa acagtgacca actccatagc 206580
agtgagcatc tatgggctct agatatgttc ttgaaacacc atttttccaa ttttccaata 206640
agtaaaccag ggcttcttga agaaaatggt tgattttgaa taggaagtgt acaagctgac 206700
cttggagcat cttgtcatac taggaacaag gaagctttgt caaagactac gagggtcata 206760
taaaaagaac ctacagactg accaacttga aaaactccca atgagcacag tagagataat 206820
ttgactaaca gtaagaaatg gtaattgaca tggactgaaa tccattaaac attaaataag 206880
tttaaatctt gagttcataa tgacattntt ttaaatagta attggttacc ttgagcgatg 206940
atagaaaatc aaccatgtaa aattaataag taaaagtcga taatcaagca tttatcttgg 207000
cttttccata ccagttttgc tactgggtaa ccaaataata caggagggaa agcacctcat 207060
tataaaacta tcccaactaa taaatgaaaa agaaatgaca gttttgcaaa cggaatgaag 207120
tcaagggatc taagaaatga acatcaagac ccgtaacatc acaaaaagaa acacacacac 207180
tctgttcctt tcgatggaag aatctgacac cacctatggc cttgccaaag ggatgaaacc 207240
agagtctgta tgatgaaacc tctggatcca gctgccgatt ttcagaaaat agaagacaga 207300
agaacgtgtt gaactgtacc aagagtgtgc tttcagcaaa atccagactc tctcttggct 207360
ggnngtgcgg tggcttactc ctacaatccc agcatattgg gaggccacgg caggaggatc 207420
acttgagccc aggcatttca agaccagcct gtgcaacatg aagaaacccc atctcttaaa 207480
aaaaaaaaaa tgttacttag ctatatgtga tggcacacgc ctgtagtccc agctactcag 207540
aaggctgaga caggaggatc gattcagccc aggaggtcaa gactgcagtg agtcatgata 207600
attccactgc atgcactcca gcctgggtga cagaacgaaa ccctgtcaaa aaaagaaaaa 207660
aaaaaatcca gactcaaaaa ctataggtca aatggcccag gtttctctat tttaagggga 207720
aaaaagggta acatgtagat taattagaag acatcgccaa aaaatcagca agattcatac 207780
attggaatgt ctttcaggtc caaattattc aatcacaaat aactctatgg gaattgagtt 207840
gaagcttttg aattatgtgt taaagtatgt aattctggaa acgtgtttta acttagaagt 207900
tcaagactta aaatatctct atattgttga taatttaaat ttaatttact tgttttgagt 207960
tattaattct gtcaaagaat tgttatctga ggcagttgga tgttttcagt ttccaaacaa 208020
aaccgaagaa aatcttcttc aacgaatctt tgactttttt caaagtaaac tccttgtaat 208080
tccatcattc atccccttcc tttttattcc cacatctctg atatgtttac atccagaatg 208140
agcaattact ggctcctttc atagctgtaa tttacaattt cagatctgaa attactcatc 208200
atgaaatgga tctctgtatt ctttgttttg ctaattattt caggtgattg tcagtatctt 208260
ctagagccag aagagggcac tgcagagcag tgtagctctg agctctttat gtttagcaca 208320
gtctaggaat gccctttgcc aaaaaaaatt cgcaaagctt tactatagaa gtaagaaaaa 208380
agaagggaat aactagataa tcactatagg ccttctttat ttagtagaaa aaagaaagta 208440
tataacgatc taaatacata tctaggacat caaatgtaat atcatatata tatgtataag 208500
tagatgaaag aagacatata tatgtgtgtg tgagtccttt ccttctttta agaacatccc 208560
aaaggccagg tgtggaggct cacacctgta atcccagcac tttgggaggc caaggtcggt 208620
ggatcacttg aggtcaggag tttgaggcca gcctggccaa catggtgaaa cctcgtctct 208680
actaaaaata caaaaattag ccggtgtggt agtgcatgcc tgtaatccca gctactaggg 208740
aggctgaggc aggagtattg cttgaaccca gggggcggag gttgcagtga gccgggatca 208800
caccactgcc ctccaacctg ggcaacagag tgagactctt tctcaaaaaa caaaacaaaa 208860
caaaagaaca tcccaaagct aaatctgatg tttttctatt ataatattga ttctcctgct 208920
acctctggca ttagttataa aaacagttct caagtactct cctgtatgaa ttaatactgt 208980
attttgtctt agttcaaatt caggacaaag gccattcagt agccttttag caatcttgtg 209040
cagggcagaa atcatttagg caatagtgta ccagatatta tcccaaaagt ttttcctaac 209100
gtgaaattgc aggggcagta gataagtgat tggattcaga ctctcatctt ccactgaagg 209160
aaagacaact aacacatgtc attgtccttt caagatgaaa taagagttgt ggaatctgga 209220
gtcctctctt aaaactcact gtcacaggac ctctgtgcct gggtctgtct caggactatg 209280
tgtgttctta ggtgtctaaa gagcagatgc tccacgatga tggggccacc agctgagtct 209340
tccatctcca aaagcggctc caagcagctt tccttaggag ctgagctgtc aactcaagag 209400
aggttaaatc catgtcaaaa gtcaactttt ggccgggtgt ggtggctcat gcctgtaatc 209460
tcagcacttt gggaggctga ggcaggtgga tcacaaggtc aggagttcaa gaccagcctg 209520
gccaatatgg tgaaacccca tctctactaa aaatacaaaa atcagtcggg catggtggcg 209580
ggcacctgta gtcccagcta ctcgggtggc tgaggcagga gaatcgcttg aacccaggag 209640
gtggaagttg cggtgagctg agattacgcc actgcactcc agcctggatg gcagagcaag 209700
actatcttaa aaaaaaaaaa aaaattatgc caaaagtcaa ctctttcagg aggggagaag 209760
taggaaagtt tcaagattta tcattggaaa tagcatgtat gtgctaccaa gaaaatggaa 209820
gttccaaata gttggtatcc actcttgtct ccttgtccat acattaattt ttctcctaag 209880
agttctagtg aataatgaaa ccaattccgg tttttcattt ttgagcagaa aaatgaacaa 209940
accacctttc ctcatgaggg ggaaatcacc agtatgttca gtgatgctga tctttactac 210000
atatctgctg taaaatatga aaagtggatt gctagttttg atgttatcta ggttatcatt 210060
tgtgactaaa aagacctgtt tgttactctg gttcttctcc actatggctt tatggacaca 210120
ctgactgaca ttatagcatt tgttcatagc tttgtttgta gaatggggtg ctgtgagttt 210180
gtacctcaac atacctaacc cttgttgaaa agaaactaac taggtgatct atttttactg 210240
aatacagagt tttctgtctt ctgagggttt tctttccccc ctcaactttg tttgacacac 210300
agtatgccct gtagggcttc ttgcctggtt tcaagatctg gctagcacag cacttataca 210360
ggtagtttgt accaaattaa cttgccctgt gcacacatgt ccacttcagt ccttcaccca 210420
gtaccgcctt tgcctctagg aatcttagcc ttccttcaag gcccagtata acctccactt 210480
tttcattgaa gcctttgccg actagtccag acttgctgtt ccaccgcaga gagctccagc 210540
ccctctgatc ttgtgttttc tcctttacgt atcatctagc actgtgccat ctactgcact 210600
gtacttgtca ctgatgatct catgtgtcct acccttgtct tcctatctag gctattcact 210660
tctagaaacc aagaactcca aattctattt accctaaatc tcctatggtc actaatatca 210720
tgctaagtgc tcagtaaatc taatctattg atcaaaatga acaggtctca attactatct 210780
tcagtctgac tactggagtt acactttcct gttatttatt atttattcta gttatttatt 210840
attgtgaatc tagttattta tttattatta tgagaacata gtggcccatt tgcctgtttt 210900
ctctttgccc ttcttctgcc tgctttaact ccttgtanac cttccaccaa tctaaaatct 210960
gcaactagca agccacacag aactgagctt ggggagtata tctttgaatt tacagtcagc 211020
atccaggatg gttttctcct tagttctctt ctctggagta attttatcat cgccaactag 211080
gaagagatct tgaatgccca tttcattcat tccccacacc tgcaagcaaa acaactccta 211140
aactcattgt tcagattagt gttaggttac aggccaagaa cctgcagcag acataatgtg 211200
gattagagaa cattgcgcta atcaaagaca aataaggagt ccagtatgag ggtcaacgtt 211260
aaagtctttg gaaactgaaa attttattca gacgaaggcc attatcagag tgaggcacag 211320
ccaatgcacc atccgtggct gggacgtggg gccccacaag tttgttcatg gtgctgccca 211380
aataaaagta aaaatagaca agaattgtca attgtacgat gatgctttag cgaaacatat 211440
tcatgtttca tgttttaaca atgtcatcta ttgaatgatt tgacagtata ttatttctta 211500
acattccaaa actaaaagtc atactcttat cattttcagc ttcgcaagtc tgttttcagc 211560
atcagggcaa ggaaccttct ggaaaaggag accgcagtca ctaaaatctt aaggtaacac 211620
caattaatgt tgacacatat ttaaacacaa gtgggattat attaatcgaa aaatagcttt 211680
ttgaaaaatg aattaatgtt ctgggcatca gcatatactt tctgccagaa agtagctttg 211740
agtatctatg tacttataaa caatgtaaaa gacatattga tgtcatttct aaaaaaaaat 211800
tttagtagct cagtaggcct ttctttcaag tatttaaaca taaatgataa gtataaacat 211860
tgaccaaaag gtgaaaataa cttactgtta tttttaacag ttttatatct tttgtgatat 211920
gtaaaggaga aattgcaatc taaaggataa atggtaaaag ggtaaacttt ttcattatag 211980
ttcattacac tattaagagc acatttatta aaaatccnga aataataaaa agtataccaa 212040
tcttagaatg cctatgaaaa catatgcttt taatgctact ttctagaaga tgcgctgaaa 212100
tgaagtatca aggaggaaaa ctaagcaacc gacttgagtg ttttataaga ctatatgtta 212160
tattatggag taacatgatg agtataaaaa cacataggca tttagaatat catttattgg 212220
tacatatatt acatagacat atgtagatga cacaactcaa gattgggagc tggaggtagg 212280
atcgctcgca aggcgagtgg acagattcat gccaggaagc cccctgcaaa cctgcggtga 212340
gtgataagga gttctagctc ccttctacta gatttattac taggaataga cattaatgca 212400
ttctctccag aatgcatatt actataactt ggaagactgt gtgagaaaat aaagcttagt 212460
atatatgatc tttaaaacta ttcttacttt ataatactac ctaaaatttg tgtgcaaaaa 212520
aaatttccta actcatcaag acagtatttc tctcaatatt ggctgacgtt catgcataga 212580
gttaagtatg tgttggagta gctgtcatag gatgaaaata agcatttcta gggcttgtat 212640
attatcacca caaaatgtga tgagataaac agacaaggtc tcattgaaat agacaacctg 212700
cgccccaact taggcttact cccgactggc tggtaactcc atcctggtat taccatcaga 212760
tcatgcagtg aggctggcct tgaaccacac atgttacatc aggatcatga ttccagctgc 212820
acctacatca gacaggttca tggtagggtc ctacagcaag gctgatccac tcactaaaaa 212880
gagaaattca ccctcaagcc agaaactacc tacaaggaca tcataattct cagtctgcat 212940
cgagtatctg cctgccaagt caggaactac agggacctta ctcacctgtc cagagccact 213000
gccttgcagt gtgaatgggc cctctgtgtg aatgggttcc cagagacttt ccaaggcaga 213060
tgcagaaaca gatactggca aggaagagat ttccagacct cacttctcta ggaactcttc 213120
cttaaaactg atctatcact ttaccttttt caccctcctg tccttattta cccctctctc 213180
agtttacaaa agaaaggtga aactctcact catccggaaa ctatggcgtg tattaatctg 213240
ggatgtaaaa tcctctgggt tgccaagcaa aaggaccgtt cccacctgga tttctccaaa 213300
aagagggtcc catggggccg tgccttatta tttatccagg tgacagtttt atggataact 213360
tccttcccaa agctatccac cttagattag gccttagaaa taacatgatt gtcacaaggg 213420
catgtggtta catgttattt gaattgaaaa ataaagccag actttttctg acagattcag 213480
ctgattggtt caacaatgaa aactgattta ataagtgccc aatgtcataa aattgaatag 213540
attggatggc gaagagtctc caatattttc ttaaaattat tttcaagcac aaacacaata 213600
atgctagaaa ttacattctt ctatttaacg tggtgcaaga gggatatagt tgctgatttt 213660
taaatataca gaagtgtttt tgttttttca attatataat gtacatgagc aatattttta 213720
agactatcag ggaatataga cacctctaac ttgcctaaca atggtgtagt ttaggggata 213780
cccacagcca ataaataata ttttactgca gcccagcata ctacagaatg agaggcagca 213840
ccttaaaact acctgagcta tatcaccttt tgaaactcag gaaataaaaa gccataattt 213900
gaaaaaataa aaaaccttag aattttttaa aatacaaatt tgatcttaga aagccatttt 213960
gttttttctt ctgtgcgaat ggtttcttca ttgcttctat gctagtttct gcatgaatta 214020
agggcaagtg caaaaaatca aactgatatt ttgggaatac ttatcttttc accactaatc 214080
gtagtaatag taatggcaat gataccatac ctgcattata atgtgatcca tcagttaaaa 214140
agtcaagaat agattgggtc catgtcaatg agtgtttgta ttgttttata ctgtttttca 214200
aggaacaata acagctaaaa ggaaaaaaag agggagaaaa agaatttttt ttnnaaaaaa 214260
aaaaaaggaa aacatttgca gtaacctcag gacaattgat tcgaataacc ttccacaaaa 214320
ttgggaagga gaaaaagctc tccaccactt tttcagtgtc tttttactgc ctctagggac 214380
tccgctctcc taggctccaa ccttgctgtc gattaaactc tgccaaggtt cctggataac 214440
ttagcagtgg ggtctcccag gaccatttgc attttgaaag aaggctttta aaaaatgaaa 214500
gggcttttaa gacaaagagg atgcagattc tgtcttttaa tagatgggtc tatcttgata 214560
taaataaaag aaatctggaa gagactgccg ttttagtgtt ctattcctct taactttcta 214620
ggtgttctta atttcataga attattgttt ttagtcttat ccaagaggtt cctcgccagg 214680
gaggtaagta acagcagtat agggaggctt gaaaaagaga cctgagctgg atcattccgg 214740
caaatatcac aggttggcat tcgtcctaat ttgtgtgcag atagagataa atcacaaaaa 214800
ccttaaatcc agagtgatat aagaatagga agtttttatg aaatattagc gtcttgagat 214860
aactttccaa aaaataacaa gtatttggga aaaaataaag caaccccttg acttaaggtt 214920
tctggaggcc tggctgtgta aacagacaat taatttcaat tctcagctct cttgtctatt 214980
ccatgggagc taggaggagg cgatcttcag ggcccctgaa gatctaatgt aggatactgg 215040
acttggtgtt aaatcccccc tggctgggat caggctctgc ttctctgtaa cattgaacac 215100
ctcactaatc tgaccctcag ttttcttatc taccttaaaa agattgtctg aataatctat 215160
tgaccaagca aaatttaata cttattccag taagggaaac tgccactttg ttttcataat 215220
gtctcagaag ggataagtga gaggtggata tatgtaaggt tttgggtttg ggtttcagtg 215280
tttgtaggat ggaggtctgt ttagactggg cagaattctt gatatgagtt gaggagtatt 215340
gaagatgcct ggtatggaca agtaatagtt actgttctga agacggcagt gctgtggttg 215400
aggaccagaa agagaaagcg acctgcctgg tgcctctcca ctgctttcca tgttctttcc 215460
cccggctttg gttcaacatt tgagtaatcc attctttaca gcgagtttgc ccttctattt 215520
tcattctcct tcttgacttg ggtgatctaa gagaagaaaa ataaatggtg accttatgtt 215580
gtcctcttca cacatgaaat ttattttttc ttttgtgcct ttcagatttt taaccagaca 215640
catgtattac ctttaacaaa caaatacaac tgacttttat agtggttttt tttttttttt 215700
aagtttggca ttgatcccca ttgggtagag tcttcacaaa aaatcctaat gaataccaac 215760
tatttgtagg tgactagctt gaccagttga gtgacctact gtctggagaa aggggttggc 215820
ccagcagtct atagttcaga taaatgaatt tgtgggaagt gcctgaaatc aacggtgaag 215880
ttgctgactg tttaacagct ttaccttcct ggacaagtca agtcatattg acgcagaggc 215940
tcagctctca gccctggaaa ttaagctgga gagctgccag gggtcttagt tctcaggggg 216000
gacccacatt tccaaatatc catcttccat ttgaaacagg atccacatta ttctagcaga 216060
aagtatgtta tatacattac tatgaacagg aaattccagc ccacagagga agaagtcttt 216120
cagagaggaa gggccctaga gcctgaggta tgtaactcac aggtagaatc acccatttct 216180
atgtataatc atctttaatt catgttcttg tacttttgaa aattaattga tgttttgaga 216240
aatataaatg aattttttga tatatttgag aactctttga tgagaaaaaa aaaagtgggc 216300
catttttaca gaacttgagg ctactggccc atgctaaaat gcagatgatt cacttggcac 216360
aaacaggcat ctgagttgtt gttttttaag agttatccga agaggatgtt ccactacctg 216420
aattataaaa tccaggattg ctattaaatt tattgttgtt ctgacttaga ctgtatcgtt 216480
cagctccact aaataaagct tcttttcaaa aggcagtgac cttttctctc atcaggcgaa 216540
ataaaaaaca aatagcaatg tactttcaaa agcatcacta cctttgttga gatttcctct 216600
aattcaaagc cctgaaatcg agcaaaaaat gcattatcgt tcctgcaagg ctgaatgaat 216660
agagaaatgt taaaataaaa caattaaaca ttttacatta gtttagaaag ttccatcctt 216720
gtgtggtttg ccatgagtac ctccttagtg aggacaatat atttataacc tttcgaatgc 216780
tcagtctcgt atgatgtttg cattctgaca tttggtttta taacgtaact ttctttgcca 216840
tgcacttata ttaataactg tttaagtctt aaggaatagt ctttagttta gtgctactta 216900
ctacagaaaa aaattaaacg gatttaataa aatacataga gatagttttt ctcttatcat 216960
tttaaaagaa tcatttaatg actataaata caacttatat actacttaca tatatatata 217020
ancactatgt atttattaat ctgcaattat gtaaatgaca ttagctggat tttttttcct 217080
gaaagaaagt gcccctaaga attcacgcat tcattcgaga aatatctctg tagtgtctca 217140
catgccaggc atttcacacc atttgctttt tcccatttgg aaagttctcc ttttataatt 217200
attgttccat aggttagcca gctattcagc aactttggat aaggtcatat tatttctctg 217260
cagctccgca ttctgggcag aactagcaag acaccctgta cactgctggg agggcctgag 217320
taccttacag cgntcccctg gacctttgag ctcagctcct cagtggaaag ggaaggtgct 217380
ggactgaccc tacagatgag agaaagaaac gacagagacc cttgcagcct agggtttgtg 217440
ccaacccctg agatagcagc aatttttttc ttagcatttg gtatgaataa ccccaagttt 217500
taagaaaata gagtatgaga atgaatgtca taaatattta tctttgcaat tctatgaagt 217560
ctgcctggtt attgttggct ttttcttaag attttcctga cacttaaaaa ctctgataag 217620
ttagttgaaa gactatttgg aaataagcta agtagataga tgaaaattaa ctgtattcag 217680
acaaccataa actaaggaga caagatgtgt agatatatgt ttttgcataa aacataaaat 217740
agtaaagatt taaaagtggc aaaatataac taaaacaaaa ataatatatt ctaatcacat 217800
ttttagatag tacctgattt gcggtaatca aaatatgtta tattttattg agatagcata 217860
tgatttatag attgttttta gttaagccca aaagtgatta taatagtgtt atggattaga 217920
agggctacta ttgagtttta ccaaacagat gtgggaagtt ttttttaata gactattttt 217980
tgagcagttt taggtttgcg gcaaaatgga gcaaaggtac agagatttcc catgtacctt 218040
ctgcccccac acaggcacag tctccccaac tatcaacatc cccatcagag tggtacattt 218100
gttacaattg atgaacctac actgacacat cactatcacg ccaagtctgt agctgacact 218160
agggttcact cctagagtac tatagtctat gggtttgaac aaatatgtga tgatgtgtat 218220
ctatcattat aacatcatac agagtaattt gagtgctcta aaaatcctct gtgctccacc 218280
tattcattcc tccctcccca caaaccctgg caaccaatga tctttttact gtttccacag 218340
acatagaaat gcacatagaa atacatagat atgtgtctcc atagacatgc attgatgttg 218400
atggcagctt tattcctaat tgccaaaact tggaagcaac caagatgtcc ttcagtagga 218460
gaatggataa gcaaactgtg gtacatccag acagtggaat aattattcag catggaaagg 218520
aaattagata tcatcatgga aagacatggt gtaaacataa atgcctgtta ctgagtaaaa 218580
gaagtcagtc tgaaaagtct acatactgta tgattctaac tatatggcat tctgggaaag 218640
atagaaccat ggagatggaa agatatctta acaaggtctt tcttttgtta ttttgtcact 218700
ggagagtaaa gtagtaaaga aaaatggaat acatatctgt tgaaaattgg ccaatgcagt 218760
tcctgcagca tttacaaaat ttcactttta ttgtagtaaa aagttcagcc tttgcattgt 218820
aatttgcatg tttcggagtc agtagttggg ttactaaatt tgaagcccag tgaatgatgc 218880
ggggttgcag acatttttta tgctgaaatt taatagatgc acgaaaggca tggatttctc 218940
atgagttaat ttttcttttt tgtttatagt atgggtataa gtgcgtaaga taaagacatt 219000
caaggtttat tttattttct gcctacnatg aagttctggt cgcccatgta tttacatgcc 219060
tttctatgaa aacattttta tgaataacac aagattggga agaactaact ggcagttgct 219120
atgaaagagc cagatccatt tactcaggat agggctgact cacaaaggag tggggtatcc 219180
actaggataa aaatgcagct ttttcctcat ctcagcaaga ggccattacc gacgagctca 219240
cccattagca tccgctgttg tctctacttg ggaagatcac attgtcactc tagtggagtc 219300
aggtaagagc catttccagg aaatactcat tatctattct cttagttata cagtcatagt 219360
tttacataat taccactgaa agactatttt cctgttgtct gctaatgtga ttacattaca 219420
ttaaccaacc ttggataata cttttaaatg tattacttgt ggagttcaag atttgagcaa 219480
aatccctcaa atgtaatgct ctgcaaagtt atactgcagt tcctttagat ggtaattacg 219540
tttaatacca gacggtattg tgtaatctaa cttttctata atgagtgaaa ataatttgaa 219600
gactcatagg cctctccctt tcattacaga atgtataggc tttttccaca cccttgttct 219660
gggacattaa gaaagaagac atggagacaa agaagaaaag aaccggggac cccctgctac 219720
tgtgtctata aacaactagt ggtgtttaaa ggctaataaa gctccaaaga tctctcttat 219780
aaccataatc tttgggccaa ttttaaaata ttttagatgg agaaatgtca agaaaaatag 219840
agacaatttc aagacatgat tctctttccc caacgtccat aaaagattat atatatatat 219900
atatatatnn nnggctgtca tataaggagc aattgaaatt ccacagcaca aaggcaatgc 219960
agggggaaaa aaaaggatca atctttcata ttattttttc tcaaaggctt ggcaagaaac 220020
caggggtaat atttttgcaa ctgggaatgt gtgtttgctg aagaatattc ccacatttga 220080
atcatcctca ggggtcctca tcttgtttta ctttcaaagg tagacagggc ataacattaa 220140
ccccaactgg gaaaaggaaa atgcctcact gtaattctcc tccagggaac aggaataaag 220200
ggattacata tgcctgcata atgaagaatt tcctcaccca gacaagacaa aagacttcat 220260
tatttttcac cagacacttg aagtcttgtg cctcccagtt gcagaagctg aggaggcagg 220320
ccagtttttt atatgaagcc actagatgga gttcctaaga aactggcctt ctagtacttg 220380
ccattgtgaa aagatctagg gaagatgtta aaaaccttgg tacctgacac tacccagtct 220440
ttcctctaag aaaagtgaga ctgtccctga agatcacagt attcttccag taaaattagc 220500
cttgccttta ctctgggaag caaataaatg agcattttct ttctgaaaat gcacctcctt 220560
tgtccttaca tgagaccaaa aggcatctca atactaatga aaaatgtaaa gtggcaaaat 220620
ataacaaaat ggaatattca agttcttctc cttctgggta ggtctgttac ttcgtaactt 220680
taaggatgta tgcatctcat ttcttatata aaatattgga agtctcaaat tttgtagtta 220740
ctcactattt cggcttgcaa gtattagatt cctgtaagag gaggtatatg gagactatgt 220800
tcccagcaac agatctgatc tccagttaaa gaaattgaac taagttcacc tgctacagcc 220860
tgctctgctc cctcttggct ttcaggcttc cctaatagct ttcacataca acatagagaa 220920
agangtatga agtttttagt cgtaagaagc aatgtctttt ttttttcatt actgtctctt 220980
ctagtgtagg tatgcagccc attattcttg agtggcatca tattctaact tgagataaaa 221040
ttaagattat ttaacttgcc cctttaaaag tatattttaa acacatgctg ttttgtccgt 221100
gattattttc atgcttcaaa agcagggagt gatcagaaaa gaaaatattt gatcttcacg 221160
gaatttcaag gttcattcat tccacaaata tttattgagc acctactgtg gataagagct 221220
gagaaataat catgaccaat tttaaagaaa accctactct cttagagctc tttggagcat 221280
ggcatatgtg acgaactaaa agaacaaaga aaatggcatg gagagaacga ggttcctcct 221340
ggtaaagatg agaccagaaa gggaggttag agggacacta aacggggctg tgcaagccat 221400
gctgctcgtt aggcttagtc tttttaaggc agtgataata accgcattcg tgatctattg 221460
ctgcaggaca aattactcca aaacttaagt gatttaaaca acacgttttt catctcacag 221520
ttttagtcag gaatctgggc atcccttagt catgtctctc tccaagctgc atgcatttgg 221580
acttgaatgg gaagagcccc actcaatcgc atggttgtta gtggattcag ttcctcgtga 221640
gctgtgatat gaaggcctca gttccatccg gtttgctgga ttcctcccca agtggaactc 221700
tccgtagagc acctcacaat atgcagcttg cttcaccagg gcaagcaagc aagatgggaa 221760
gagcaagtca gcgagagaga gagagagaga gagagagaga atgaatatgc tatgtagagt 221820
gttataacat ccaccatgac gcgggaaaag atacaacagg aaataatagc aactaaaatt 221880
caaagaaagc gttgatgttt ccaaagcact gtcacattca taatcatctt tacttcttcc 221940
agctccctgt gaagtcagaa ggaaaggcat tattgttctc tgcattttac atatgggaaa 222000
tggaggctta gagaaagcac atcacctgtc taaggtccca cagcttataa aagctgaagt 222060
cagaagtgtg tgcttttaaa gcttatgttt tctcaactca tcttctccat taggcttcca 222120
gacaaaggca gaactttcca tcagcagctg cactgcaggg tgcacttctt tgaaccatga 222180
gaggctagca agttagggat ggggtcacac agtccccacg cacctgccgc taccctccct 222240
actcacccct ccccaccttt tcacttactc attctgttca tcaggcagca tgagggccag 222300
aaactgaact tcctaggaat gggaggctga gtgataaagt ggtccctaat caactcacag 222360
cctagtaagg ggaataacta atgataacaa aatgccatga gcgttaaaca agcttggtta 222420
ataacatact gtaggaacat ggagtataaa acaagtcttt ttttgtgctt tcacataggt 222480
gaaatattca tttctcattt catgttactt ttcagagccc atttatatca gtctgtcatt 222540
atactgtgca tgttaaaaca ctatttggta tttatttcat ggtttgcctt actgtatatg 222600
cttatctata gtaacattgn tattcccttt aaaaaataat aaagcaaact tttaccatgc 222660
ttttgtatga acctgggcac attggattag agtatatgta acctcttagc aggtctgatt 222720
gtgtccaact gaagttcata gctttctgcc aacactgtta ttttccaaaa tagcaaaatt 222780
tcttacatga ccaacaaatg tgacaatggc ttaggctgta caaggctgtt tcattatgca 222840
gaaacgtcct atcatgggaa tctttctata cctgtctcaa tntccaggtg agctctaggc 222900
caaagggtca taaaacttcc ttcccattgc cttgctcctg catccaccgt ccaacctcag 222960
gtttataact tccatctgcg gtccttccct cattcaccag gaacctgtgt gtggccagtg 223020
gtctccttgt ataatggaat aagatttttc agaatgttct cgttagacat atttatatat 223080
ctgtagaaaa gttgcttcat gctgtttagt aaatgaaaaa tagtgattat ttagggtttg 223140
tttccaagaa tacatttaca ttcagtgaat ttgtatgatt tttcatagat attcaccata 223200
attatcttca tccacattaa aagcattttt aaggacttaa atatgacata tttagtaagt 223260
tcttatataa tgtattacta tataataagt tcttatatga tgtattatat aagttcttct 223320
gtaatatatg tgttatattt aaatacttaa aaatgcttct attatacatg tatcataaga 223380
gctgctattt taagtgcgct aagcacatac aaatcttttt ctcaaagatc ttaattctca 223440
gacagatggt aatcatattc aaagccattc aagaaatgca ttttaagaaa cataaatgtg 223500
aaaataatat gtaaaaaatg gcagaattgt gtgttcaggt gttgagcaaa tagagtatca 223560
ttagatttgc atatcataaa atcattgcat tttcaacctg tgagctatct ttcagagcaa 223620
ggctttctct tcattttacc aatgaggaag ttaggcccaa agatcactca actacttcat 223680
aacagtgtaa cttctggcac acaggtcttt taatcccttg tgttattttc ttgccactta 223740
tcaactatct caagggaatt cctgtcattc ccagttggag aaaattttct ggagaataat 223800
ttttttttct caccaaaatc attcacacca caggtgttag gccacccaat tgtcttcact 223860
cattagcaan atcagaaatt aacacaagtc cagttattgt ccaaaaagaa catgttttta 223920
aaagtcttcg tggtttaaac aagtggtaac tggttaccag taagctgcaa gcttcagatt 223980
gaggtttctg taggtaataa ttccaaaaac tgtgtgcttt tttttttttt ttgaactgtg 224040
gttttaaaaa caacacataa catttaccat ctaaaccatt tctaagtgta cagttcagtc 224100
gtgttaagta tgtttacatt gttgtgcata attccagctt tagttacttc tctttatgac 224160
tcatttttgc ttgtaagctt atgttttcct atcttcctaa agttctacaa aatctccttg 224220
gaacatatat ttaatcattc caggagcctg agtggacaaa tccttcccaa agggggttta 224280
ttagaaacct tgtttaaatt caaaaccgac atcatgattg cctgtgtgta ttaatctgtt 224340
ttcatgctgc tagtaaagac atacctgaga ctgggcaatt tacgaaagaa agaggtttag 224400
tgaacttaca gttccacgtg gctggagagg cctcacaatc atagcagacg gtgaaaggca 224460
cgtcttatat ggcagcagac aagagaagag agcttgtaca gggaaactcc cctttttaaa 224520
accatcagat cttatgagac taattcacaa tcacgagaaa agcacaagaa agacctgccc 224580
ccatgattca attacctccc accgggtccc tcccacgaca catgggaatt caagatgaga 224640
tttgggtggg gacaaagcca aaccatatca ctgtgggtag gctggccttc tgcttatggt 224700
gtcctgatag aagctctacc attatttttg gaaaggaggg aggaggcaga aggaggaggg 224760
gcaagagggg agctttctgt ttattttcca gcccttcttc atagctgtga tacttctgct 224820
ttgtaagtgt tcttgacgca gagcgtaaag ttcattttcc tttataatta tacgttattt 224880
gctgtatttt gtgttttcat tnnggtgttg nccntttaaa ataataaaag taatgagcac 224940
ttatgtgtta ttcatctcaa gtgtacaaac catgcattta tcttgggctc cttttttttt 225000
cctagagctt gcacccgaca gcgcatgctg agcggatcat ttgaggggca gcccgcaaag 225060
gagaggtcaa tcctcagcgt gcagcatcat atccgccaag agcgcaggta aatacttggg 225120
aagacagggc ttcagagact ctaaaaaagg ggggttttac aggaaatggt cgctgtacac 225180
agtcacggct gtcagccctg gctgccagac aggcatggct gaggaatcgc gttctatttg 225240
ctgtttgtta caataatgaa acacctaatc agatccaaag attcaaaaaa atctctactt 225300
cacaatcctt ttccttagag atggccaaat tctcaccttt aagatcagaa ggaaaaattc 225360
tgaattttgt tagatgggat caaagacatt tggagagagt ataagcttct gctatgaaaa 225420
gaaatcatag gcatttgtgg cgttgtagca gaaaaagtgt tttattttga ttttatcatg 225480
gtcactgctt gaaaggccag tttgatcttg agatgtatta accagtgcct gtggttgttt 225540
taggtcacta agacatggat caaacagcca gaggatcagc aggggaaaat ctcttgaaac 225600
tttgactcaa gatgtaagtt ttaagcaatg ctttggattt cagaaacgtg attatgaaaa 225660
tgtatttaaa tgactgctta gacaatgccc agtgtctttc tgctgcattc ccatgtctcc 225720
ttaagacttc ataccagagg gaatcaggaa actcaggata tgaattatgt agccaagtat 225780
cagaagtaac tgttaacagc agaaaactcc agtcatccca cacaaagcac atgtcttagt 225840
taaaatagta acacaaaagt gtcattatca gttggatttg acttgaaatt aaagacattt 225900
taagcattgt atataggatt gatttgcatc attgactttg aatattcact gagaatcgaa 225960
tattctagaa tctagatcaa gggtctataa tttcagggct ttatatatta ggaagtgaaa 226020
ttttatttct agaagaattt tcctgtcaag gactacctag tatttcccag gaaagctttt 226080
tgcttttaga ctctaagtca tggatttatt tactggctct ataaatagtt atcaagtgtt 226140
tgctctgtgc tgggttctgt tttaaggaac gaggagcagt ggggtaataa gatagactca 226200
gtgccctcct ggagcttaaa ttttagaata ggagacagat aataagttca taaaaatata 226260
atggaatttc tggagtgatt tctttttatt ttccatcatc tcttcattac tgtgacagat 226320
ttgctttata atgtaaagta aaatgaagtc atgtaaataa atcaaaggtg gggatttggg 226380
ggcagggaat tttagatacg atggttatcg tagacccatc tgcattatcc cggagaccca 226440
aatgaaatga aggagacatg aaaaaaatgc agagaagcca agcgttatat ggcccagcag 226500
ctataccatg caaagattac aatgaaaggt ttgggaaatg catattaaat aaccgtaatt 226560
atgaagccct ggtaaaaaga caggcgttag gttgaatctg gatgaactgg cttaaaaagt 226620
aatcttgaat gttcagagcc aaggatggca cttgagaaag gagggctagc aagagaaagt 226680
tagcaaagcc ttggggttat ttcgtttttc tctttttcac cacttatctc ttatttcttg 226740
agcttttgga gtgcttgcat actacatctg ctttcattct gtagaaactg ctgttttagt 226800
ccaagtacat ggtttttatt aagtgttccg ggcaaaatca agagcgagaa gttggcaatg 226860
agaacacctg atatcaccaa taccctatag acatggttnc tagttggcac agagnctctg 226920
tttaccacca tgatttttaa tatccatagc tctatctgat tggctaccat attgttgaca 226980
tagaattgcc atcaaatcca acatatggcc tgcgcaactt agaactgcag agtcagccat 227040
attgcacgga gaacattttc aggtgaaaag tcaaagaggc aaccctcatt caaagcgcct 227100
tcaatatgtt tcaaccgaaa tgtacaacct acttaagaat caaatcagaa catgtctttg 227160
aaaataatgt gtttaaacat agacagcaaa ggccctattt gaatagtctc agtgccggag 227220
cttacttctt cnnagagact tcctacccta tttttcatgt agaagtatag taaaatccat 227280
ctcccacctt ctccatagca aaatgccatg gggttctgat catttccaat aaattcttat 227340
aatgtctttt ctcccacaaa ggggagattt aaattagaga attttaactt tttcacttat 227400
tcggaatgat agcangacac agataattaa gtctaaggag tgctttctgt aaaatctact 227460
gagttactgg aactctggcc ttgcaccttc catggggtcc atctaaaggg ctgtgaaggg 227520
cctgcatggc ctgctcacct ctcttagctt tacccacact ggcatcctgg ctattccaca 227580
tgtagacacg ccaggcctgc tcctagctct ggaagaacac atttctgtag tcctaccaca 227640
gcctgcaccc tcacctcctt ctagtctttc ctcaaatagc accttcatat tgaggtctac 227700
cctgacctgt tcatttaaaa tcataatctt ctagcctgtc tgtgtctctc tatgcctttc 227760
acccattgtg attttttaaa aaatcggatc actaagcatc ctcttacata cttattttga 227820
attatttttt atctgtctcc cactgactag aacatcctat gagaataagg atgttttgtt 227880
tccacttgcc atatcctgca cactagaata gtgcctggca cataatagga tttcaatcaa 227940
tatgtgctga atgaattact ttttagagga acaaatactc ttgctatgaa gactgtggcc 228000
attaaatatg tgcatttaat cgtatacata ttttatatac tgtaaattta tatatttaat 228060
gtaagtatat acatttactt taaattacat atttaatgta aatatatacc tttagtataa 228120
atatacataa ttataaatat atacatttca tatagatata tatttattgt aaatatatac 228180
ttagtataaa tatacatatt taatgtaaat atatacattt agtgtaaata tacatatttg 228240
ttgtaaatat atacatttag tataaatata cattgtaaaa tatacattta atataaatat 228300
ataaatatat gtttaacagt aaatatatgt aattaatatt tatactttat attgagggag 228360
atattagttt taagtttttt aactgataat atattttgca ttcaaaaccc tcctgtttta 228420
acacaccccc tgttaattta ntttcntagc attccaatac agtgagatat agaaatgcac 228480
aaagagaaga cagtgaaata aagatgattc aggaaaaaaa ggagcaagca gagatgaaaa 228540
ggtacaggtt gctgcagtgt cccatggctc tcattcggga atggcaaaat ttcccttagc 228600
ctcattctcc catgaatttc tccttcaagg aaagtgcaag aagaggaact cagagagaac 228660
cacccatact tcgataagcc actgttcatt gtcgggcgag aacacaggtt cagaaacttt 228720
tgccgggtgg tggtccgagc acgcttcaac gcgtaagtac acttcatttc agccaggtgt 228780
ttggcctgag ccatgcaaac agcaggggtg ttgtcatatg aagaagaagg aacgtgtaat 228840
cctaatgggg tcacaaaata aactgcggac taattaatca tgctgctcct ctttgctgaa 228900
cacccgacca ggtggaaaac aaaggtcgca agtagttaac atttatagaa aactcgcatt 228960
gataaaacac aaaacagcca ttttcgtttg tgcattttaa cagtttcctg atacacttat 229020
atcggcatta ttaactccat attttatttt ggaagtactg agacaaaagg agactaaagg 229080
acatggtgaa aggaaggtca ttgtccatgt cttccatgag gcttgtagtt cctttgtggt 229140
aaaaatacct caatttgttt tttggagaat aacgtaaagt tgattagtgc tttcattacc 229200
aactgttata agaaggaaac ccactgttca ctgtctctac cctaccaaca tggaagaaat 229260
gtgtaagaag ccgtaagtag agtggacatt gaagacacta gttgtggaca cctaagccaa 229320
gtttgacagg caacaaatgg atgaaatgga tttttgtcaa gcatacctgt atnagtccat 229380
tttcatgcca ctgataaaga catacctgag actgggtaat ttataaagaa aaagagattt 229440
attggattca cagttccaag tggctgggga ngcctttcaa tcatggtgga aggcaaaagg 229500
cacatcttac atggcagcag acaagagagg gaagtgaaag cagaaacccc tcataaaatc 229560
atcagatctc atgagactta ttcaccacca caagaacagt atgggggaac cgcccccatg 229620
attcaattat ctctgactgg gtccctccta caacatgtgg gaattatggg agctaccatt 229680
caagatgaga tttgggtagg gacgcagagc caaaccctat cagtaccttt aagtaaatat 229740
tctgaagaca ttaagagtca tggaggaaat gagaaaactt tccatgttcc cattatgtag 229800
ttggagtgtc cctgatgcca tcgtttaagt aaattgattt ctttgttatt aattagtagc 229860
atatgataat cactatctgt tatggactga attgttcccc ctccacaaaa tccatacggt 229920
agagtccaaa ccctcagaac ctcagaatgt gactgtattt ggaaatagga attttaaaca 229980
ggttaattaa aatgagatca ttagggtggg ccctaatcta atatgattgg tttccttaag 230040
agaacatttg gacacagaca tatacagaga gaagaccttg cgaagacacg tagggagaag 230100
acggctctcc acaagtcaag gagacagccc tggaacaggg ttttccctca cagccctcag 230160
aaagaaccaa ctcagctggc atcttgatct tggatttcca gcctccaaaa ctatgagaaa 230220
ataaacttat gttgcttgag ccatccagtc ttaagcacca gtggtacttt gttacagcag 230280
ctcgaggaaa ctaatacaca ctattataac atttcaggga tggaagagac ctcagggacc 230340
actcggtgtc atttgtgtgc cccctccttc aacagaggag gacatttaag cgtgcagaag 230400
ttgagggctt tgctcaggga cccagctact acctggctct ctcttgattg ccagactatt 230460
gttctttctg ctgttctata aagactttca caatttaaag caactgagtc acaattatta 230520
aaatcttcca tgagttttca aagtaaagga agaaaatgcc attttggaga ttgatttgat 230580
cagttcttga agtacgtttt ttttatcttg aattatcctg ttggctgcct gtaccttaac 230640
atctcatggt taattctcca cttcacttag tgtgatgtaa tttccctttt atcagcaagg 230700
cagctgatgt tgaatacaat tgatgaagac tctgttgtaa ttggggacac atacacaaag 230760
actgtaagca atctcattga cagtgctcac aggcttcctg aaagtagaaa caacgactct 230820
cccttccaag aaattctaaa taaatcattc taccacatca cagttaaatg cagggggaag 230880
aagtctattt aaattatgga gtatttaatt aaataatctt gaataactaa cattcttgaa 230940
ctattaaggc aaagatttca aatgagtgtt tttaaatgaa agtcaaaact taattttgta 231000
ctacccatgt cagaaaattc tgaacaaagt cacaaagtct aaaatcaagt attttgagaa 231060
atataaaact ttattttcat aagcatcaac tgcaaattct ttggattttt tctttcatca 231120
atgttctctg acctccagag ttacctacag ttaacatatt ttataatgga cattgtagag 231180
aggctgtaaa agagatttta ggtagatgag atgtttgcaa atatgatttt tagcaagtta 231240
aaacatgctt gctttgttgc agaattttat atatgtgttc tcttacagat ctaaaacaga 231300
ccctgtcaca ggagctgtga aaaatacaaa gtaccatcaa ctttagtaag catcaccaac 231360
ttcattttcc atgcacattt aaagttttca tgtactattt tatgctgcat acaacgatta 231420
aaattctctt ttattttctt gctatatagt gctatgaaat agatgattgg ggaatgatgt 231480
ttttaaaata ccagtcatgt tgatagagcc acagaagcca tcatctctaa ctcttagaag 231540
cctttcctgg aacctttatg tttctcaatt ttgtttggtc tttggcagtg atttgctggg 231600
attggtcact tacctggact gggtcatgat catcgtaacc atctgctctt gcatttccat 231660
gatgtttgag tccccgtttc gaagagtcat gcatgcacct actttgcagg taccgcttac 231720cgctgcaaaa tctcagctta caactaggag gtaaaatact gacctgctgt ttttccgttc 231780
attgtaacca aactgccttt tgcccgtttc agattgctga gtatgtgttt gtgatattca 231840
tgagcattga gcttaatctg aagattatgg cagatggctt atttttcact ccaactgctg 231900
tcatcaggga cttcggtgga gtaatggaca tatttatata tcttgtaagt ctttgcttat 231960
tgcctaaatg aaaaatgtaa tggttttgta aaatctcctg catttcttgg tataagcgca 232020
agaggtatga gttacagagg cttagattcc ctaaccgaat tcttaaatgg actctagagt 232080
agttcattat atgcaaataa gggccatgca tgtaaaatct aaattaagag catcataaat 232140
atctatggat agttatattg ttcaaataca ctaatcacaa ttttatgtat gaatgagaca 232200
tacattaata aggtctaaca tggcaaatct agtttgcatc ccacaaacct tatggcttct 232260
atactaaaaa aaaaaagttt gcctcatata aaccatgtta ttgattatga gccccttatt 232320
gctgaaagca aactaaagtg attgtgattg tatctctctc ctgattccat tgcataaaat 232380
acctggctat agcagttgcc cattcaactg tctagtaaaa ctcgctggaa aaccatagaa 232440
atgggctcag agaatttttt atttttcctg tatgtccaag gaggcatgaa atcaatgtct 232500
ttgcagagac aacaaggaga attgtgatca ttaacaagta gcatgttgca ggtcattaat 232560
aaaatagcag taaccttgat aaaaggaatt ccagccagat cgacatcagt ggagcctcca 232620
gagtagtaag ttaaaagaag aggcagaacg cactggtgta cacacacaca cacacacggt 232680
gtggacaccc ccatttcttt cctgcataca catgatgact ttcctttgag gtacctagca 232740
agtctagatg aggtttgttg tttaaagtta acagatggca cgtacaacca gtgagtggaa 232800
tctctgctaa atgaaaagtt gtggccagtc ggctgtcaga aaatgtaaat agtaggggat 232860
gaattgtata aattccagag atcatttgtt cccctttagg tgagcttgat atttctttgt 232920
tggatgcctc aaaatgtacc tgctgaatcg ggagctcagc ttctaatggt ccttcggtgc 232980
ctgagacctc tgcgcatatt caaactggtg ccccagatga ggaaagttgt tcgagaactt 233040
ttcagcggct tcaaggaaat ttttttggta tgtgagaatt atcctttgat tccagttcac 233100
agtagtccac ctctaatgca gctaatgagg gaaaagtgag tcttgcttat tgaggtcaat 233160
tcaatagttt tggttattgc cagagggtaa tggaggcact aacaaaacac aatgcacctt 233220
caaacacttt actcatgggc acttctggcg tatgagttta tttaattcac ctaaagagaa 233280
gcactctgag atttgaaaga gttcntatct gctgactctt tcggtactaa cctcttgact 233340
ctaattccta ctctgggttt tagtttcctc ccatctgaaa atgaaggata agaagattca 233400
acacngtgta ctccacaaat gggattagga attcatgctt ttgggctcct aatctcattc 233460
tgtgtgttcc tgaaataata tagcacagaa tttgtcttta gatctcagga gntgttaaca 233520
taaaacaact ttaaaaatgc aacatatagg tataacccac ttcaattaac ttcagcatta 233580
cagtaatgag tgattacaaa ngatgattga gggggcaaaa cgtactttnt agctgggcaa 233640
acattgattt agggtcttct gaaaacaagg tcagagataa aacaacaaga aagaggctca 233700
ttgttcacaa tctgttacag aaagatcttt gccttacaaa acagtgatca aaagtttttt 233760
ttattattga tgaggtctgc ttgtgcatga gaagcatgaa ttaatttaca taggcttgtt 233820
ttgtatcttg ctttctagag acttacctgt gatgagaaaa cagctgtagt tgtagttgac 233880
acaaatgtat tttaaagata gattgtgatg ttactagagg tatatatatc attactgact 233940
ttttttttct ttttttttga gacagaatct tgctctgtcg cccaggctgg agtgcaatgg 234000
cgcaatctca gctcactgca acttccacct actgggttca agagattctc atgcctcagc 234060
ctcccaagta gctgagacta cacgcatgtg ccaccactcc cagttaattt tttgtatttt 234120
agtagacacg gggctgcacc atgttaccca tgctgccctt gaactcctga cctcaggaga 234180
tccacccacc tcagcctccc agttgctgaa tttctttttt aagatgggtt taaaaattct 234240
tgttttcttt atgcaaagcc ataaaacagt gactcttcac acagctggaa ttaaaagaaa 234300
atatcacctg actgctaatg tatatgaatc ttttgatcaa taataaattt tagaggagaa 234360
tttgtgcctt tccctaatgg tggtcagtgt gattttagta cacttaggta tatgtttagg 234420
ttattcaacc agtgcagttc acttgttcca tattttgccc tctgccactc gtctctgctg 234480
agaccaaaga agtcagccag cagagggagc atgagttaat taacagattt gctcttcagg 234540
actgaattct ctcctctcct ctatgcatag aacattctcc taacgcacac cttcacagtt 234600
acaagacagc taagccactg tcccgctcat ttgtgctctg ctaataaaaa tatgaatcca 234660
ggccgggcac agtggctcac gcctgtaatc ccagcacttt gagaggccca ggcgggtgga 234720
ttgcctgagg tcaggagttc aagaccagcc tgaccaatat gatgaaaccc tgtctctact 234780
aaaaatacaa aaattagctg ggcttggtgg cgtgtgcctg tagtcccagc tactcgggag 234840
gctgaggcag tagaattgct tgaacccagg aggtggaggt tgcagtgagc tgagattgca 234900
ccattgcact ccaccctggg ggacagagtg gcactccatc tcaaaaaaaa aaaaaaaaaa 234960
agaaaaaaaa ataaatatat atatgtccat ttgggaaaaa atagacaaaa tataattact 235020
taaacatttt tttcctttgt tccattaaat aaaaaagatc aaggtgttga ttttaaagtc 235080
agaaaagttc aagccatatc aaaaatacct tattccattt tcttacatga aattcatgtt 235140
tccatttaaa aaattcaaag cttgttaatt ttctcctttt gaccttccag taaggctaat 235200
tgtgtgacct atggtggaga agttaaaata tatcatcaaa aacccatgat ttttatacaa 235260
tgttatctta gaagtcctat ttatgtcact gtttaaacca aacctaatat ttagtcttta 235320
acaagagatt taacatttca tcaatttctt tcaggtctcc attcttttgc tgacattaat 235380
gctcgttttt gcaagctttg gagttcagct ttttgctgga aaactggcca agtgcaatga 235440
tcccaacatt attagaaggg taagatgtat ctttctgtct tttgaaataa aaattaaggg 235500
ccaagtgtgg tggcatgtgc ctacaatcct agcactttgg aatgccaagg agggaagatt 235560
acttgaactc aggaggtcaa ggttgcagtg agctatgatc tcaccactgt actccaacct 235620
gggcaacaga gcgagagccc tgtccctaaa aagaaaacaa aataataata aggtgtttac 235680
actcccttgg caagcatgtg gtaccagtgg ctgacaagcc tagtttaaga actccctata 235740
aaaccctaag aattctcttc ccacaaaccc ctttttgctt aagcatgtga tatgtctctt 235800
ctggctagaa aggttaataa gatgaaaagc acacctcaga gaatgtcact cttccctcct 235860
attccagtgt caacccactg ttgacaactt gagygtggtc acccaagatt ccagctgttt 235920
acagctgtaa gctttggata ctttcccttg aggtcttagc taacttgatc cttcctttgt 235980
tgtcacataa gactcatatc agcaaacagc cccatgcaaa aatgtccaag aagcagcgtt 236040
tggttctcac cactttttat tgcttcccca ctctcagctt tctccccatt agaaangcca 236100
gtgcctttac attagctcta gctgcccaga atctccctct ttatgacaac caacaaggac 236160
ctccacaaag acccaaactt gaatacttgc actacggcgt ttctttctct ttcttcagtc 236220
attggttata agggaaggct agctgctgta acaagcccaa tatttcggta gcttcacata 236280
atgaaatgta tatattgcat cttggatcag ttgcaatata tacatttgca atatatacac 236340
tatatacagc tctcctccaa atgaccactc agggactcac atgccttcta tcctatgccg 236400
ccaccctttg ccatgtcttc agagccttct tcaatgagct ggagataaca gtggagagcc 236460
atctccaact gagtgggctg tgggagaatc tgctccaccc acattcctct gtaaagagca 236520
gagatactgc aaggggggct ggaatttagt tgtgtgctcc agaaaaataa aagggggaca 236580
cagtttggtt aataattaga caatttttgt aatatcataa agtgtcccat tctcttagga 236640
ttcttatgtt acaagtaaat tcataaagta aaccaaccac tgctgatgta taaactagaa 236700
aagcattttc tctttgatcc caataaaatg atgcctcagt tcctaaatgt atatcttcaa 236760
aaggcctact agacctgaac tacattattt atttctagca aatatggcta tctagtatag 236820
attttaaatg atacaaattg ttctctaatt gtgacaaaat acaggtaaca tctttgttca 236880
gccaaaatac attataaatt atattaataa tgagaatttg aaacaaaggc cagactggga 236940
gagacattcc aagagctttg atacacctga gaagacagaa caaggaatgt ggcctgacgg 237000
tcatgccgta tcaaattagc tgataaagaa agtgacagag acctgacgca ttcatccaca 237060
agcttgtgtg tggaaagaag agtgattttt gatccacact gaacagaggc cagaaagata 237120
ataacacttc aggatgaagc ctgctaggaa tcttggatga ctcagtatat taacagtggc 237180
ctggccgggc gcggtggctc acgcctgtaa tcccagcact ttgggaggcc gaggcgggcg 237240
gatcacgagg tcaggagatc gagaccatcc tggctaacaa ggtgaaaccc cgtctctact 237300
aaaaatacaa aaaaaaatta gccgggcgta gtggcgggcg cctgtagtcc cagctacttg 237360
ggaggctgag gcaagagaat ggcgtgaacc cgggaggcgg agcttgcagt gagccgagat 237420
cccgccactg cactccagcc tgggcgacag agcgagactc cgtctcanaa nnaaaaannn 237480
nnaaanannn anaannanna aaannnnana aaaccggggg ccctaaaaac gggggggttt 237540
tactttttcc ccttatcccc ccccaaagtt aaaaattggg ggggaccgcc ccccccaaaa 237600
aaccctaacc cccattttta ggggcctttt ttcctttttc caaaaacagg ggggttttgc 237660
caaggtttaa atggaaaccc taagggaacc tccccttttt aaaagccccc ccccccaacc 237720
aaaaccttta aaaaaaattt ggcccgggaa aacggggttt aaattttttt gtttttcaaa 237780
aaccaaaaaa aaaaggccgg ggccggggcc aaaaacccct taaagaaagg ggacccccgt 237840
taaatttttt ttgaaaaact tccccccttt tttctaaaaa aaaaaataat tccaaaaaag 237900
gggggaaagg taatcccccc acttttaaaa cccccccctt tcctttaaaa aaaaaaaaaa 237960
t                                                                 237961
<210>3
<211>47841
<212>DNA
<213>智人(Homo sapiens)
<220>
<221>exon
<222>3895..4001
<223>外显子28
<220>
<221>exon
<222>9611..9731
<223>外显子29
<220>
<221>exon
<222>9816..9914
<223>外显子30
<220>
<221>exon
<222>15776..15869
<223>外显子31
<220>
<221>exon
<222>16382..16488
<223>外显子32
<220>
<221>exon
<222>16697..16771
<223>外显子33
<220>
<221>exon
<222>17934..18053
<223>外显子34
<220>
<221>exon
<222>23644..23712
<223>外显子35
<220>
<221>exon
<222>24928..25076
<223>外显子36
<220>
<221>exon
<222>25913..26006
<223>外显子37
<220>
<221>exon
<222>30767..30899
<223>外显子38
<220>
<221>exon
<222>31561..31676
<223>外显子39
<220>
<221>exon
<222>34044..34201
<223>外显子40
<220>
<221>exon
<222>37493..37643
<223>外显子41
<220>
<221>exon
<222>39652..39801
<223>外显子42
<220>
<221>exon
<222>41563..41680
<223>外显子43
<220>
<221>exon
<222>44131..45841
<223>外显子44
<220>
<221>misc_feature
<222>45842..47841
<223>3’调节区
<220>
<221>allele
<222>31646
<223>99-79310-29:多态性碱基A或C
<220>
<221>allele
<222>42373
<223>99-79311-50:多态性碱基G或C
<220>
<221>primer_bind
<222>31618..31635
<223>99-79310.pu
<220>
<221>primer_bind
<222>32080..32100
<223>99-79310.rp补体
<220>
<221>primer_bind
<222>42324..42344
<223>99-79311.pu
<220>
<221>primer_bind
<222>42704..42723
<223>99-79311.rp补体
<220>
<221>primer_bind
<222>31627..31645
<223>99-79310-29.mis
<220>
<22 1>primer_bind
<222>31647..31665
<223>99-79310-29.mis补体
<220>
<221>primer_bind
<222>42354..42372
<223>99-79311-50.mis
<220>
<221>primer_bind
<222>42374..42392
<223>99-79311-50.mis补体
<220>
<221>misc_binding
<222>31634..31658
<223>99-79310-29.探针
<220>
<221>misc_binding
<222>42361..42385
<223>99-79311-50.探针
<220>
<221>misc_feature
<222>26,350. 351,353,356..357,366..367,371,383,389,392,396,399..400
     404,411..412,416,421..422,435..438,440,442,446..447,450,455
     457..459,461,463..465,1805,2175,2328,2402,2561,4048,4661,6659
     6799,7509,7534,8289..8290,8294,10663,10789,11052,12083,12904
     13017,13916,14116..14117,14680,14971..14974,17093,18448,18669
     18767,18808..18811,18838,18971,18985,20714,20903,21355..21367
     22901,24093,24112..24115,24171..24173,24868..24869,25356,25797
     25879,26062,26234,26824,27130,27254,27437,28745,28781,29278,29475
     29526..29528,29617,31152,31790..31791,31796,32011,32262..32273
     32296,32415,33656,33719,39140,39142,39343,39944,40945..40947
     41948,42166..42169,43371..43372,46709..46720
<223>n=a,g,c或t
<400>3
gtttaaaaaa aaggtgaagg cctctnggct ttttttcccc aaattttttt gggaaaaaaa     60
agattttttt ttcccccctc cacaagggcc caaaaaataa aaacccttcg ggagaaaccc    120
gcttgggaat tttggggggc tccgggaatt taccaagggc ccggcccggg ggggggggtt    180
ccccccttta ttcccccccc ttttgggggc caaggggggg ggtttccagg gttgggggat    240
taaacccttt ttggttaaaa aggggaaacc cccttttttt ttaaaaaaca aaaaaaaaat    300
aacccggggg gtgggggggg gccccttttt cccccttcct tgggggggtn ngncannaaa    360
aagggnntaa ncccgggggg ggnggtttnc antaanccnn aatncccccc nngccnccca    420
nncggggggg aaaannnnan ancccnntcn cccanannna nannnaaaaa aaaaaaaaaa    480
aaaaaaaaaa aaaaaaaaac agtggcctaa gagcatggtg attttacatt atccactcat    540
acccagccaa agctgaagat tgatggtgac agcagccagc agatgagcat agacacagat    600
ttcatgatgc atttatcctg tttcctagag cagtgaggtc tgtgcgaggc tcagatggaa    660
agcctaagga gactcagcca tcatagagag caccagcacc aagcagaacg attgaaaaga    720
aattggcacg gtgagacggg gcttgagtct ttttgtcttc tcaaatccaa acataagagg    780
ccgaggccga ggccaaaaac gccatgagtg aaggtgacgt cggctgaagt tctgttggag    840
aacttcagcc catcttacta aaagaagaga taaatccaaa gaaaggggga aagtagatac    900
accaacattt agatcacaca cagttcctgt taaagacaac gaagcttcag ttgctgcgcc    960
catagtttcc agttgggaag atgtgttttc ttgtatgagg ctgagcactt cctccctctg   1020
ctcctttgtt tgttgtctta aaactcaaca gatgtcatga gatcaatata gatatagata   1080
tggagcctag gactttgtca ccaaaaccct gtaaacaaac gctgaggata ccttttgaca   1140
aatagtcatt aaatgtcagt tgtgtccaag gcactgtgat aggtgaaatg aaatgtggaa   1200
gggaaacatt aggaggtcct tgcttctgtt ttgtggcatt ttctgtccaa tcagaacgtg   1260
tttcatgttc aagcaacagt aatataaagt cagcagtttt caaaagccta tgagaagcag   1320
aaataacatg taatctatga tgtcagcatg ggaaattgtg cttccaactg ggagtactgt   1380
actgggaggg cttcagggag gaggtgggat ttgagatgag caggaaagga ccttccaagg   1440
agagcaagca gtgaagaagg acacggagca tacaaagaag ggtcacagtg tagaggcagg   1500
gaccgaacaa ggaggaagga gcatgggctt cgaaatcaca gcttctgaga ttggaatcct   1560
acttcaggag aggtgatggc ctggtctggt cacttaatcc ttctggaacc tatttctgcc   1620
ttgaatgctt ctcacacaat gatattatga agattagatt accttgttta tgcgaagtac   1680
ctaacctgat ctcaacagtg agtgttagtt tcattcccgc ccatgtagga aaaaactgaa   1740
gaacaaggcc agaaatgtaa gttagggaga gatcctcaag tgcctgaaat gcctggctaa   1800
ggggntttgg aatttcgttg atgagaagtg agaaaccaca aaaggttggt aagaagagga   1860
atcagacaca tcctagtgcc cacaaagtac aaagcaccat tcctagtgca gtttttgtta   1920
cccatatcct aatgaggata tccattccta atgaggaaaa caggtgtaga aagattaaat   1980
aatttgtcca aggtcaccca cctaataagt ggagaagcag ggaactagtg tccaggcacc   2040
ctggcttttc accaagatac cagactgctt catgcaatca aaggtgggct caggtgggtt   2100
caggaagaca aattggaaaa ggcagtgagg ccaaatatgt caagggacct ttatacaata   2160
cactacaaca cagcnctttc caaataatgt tctacataaa aaggtatggt tatggaaaga   2220
taatcgcaat gtagttttag ctgaaaaaag tgggcgatgg aagaatataa actttatgag   2280
ctcagataca tataggaaaa aagactggaa ggatatactc caaaacgntt cattgtgttt   2340
gtctgtggca attgtgggta agttttcttc cttttatttg tccaggcttt ataaattaaa   2400
gnatgtgtta tttgcattaa aatattctta ttttaaagaa tcatgctggt aatccagaaa   2460
gaagtaacgt tggcattact aaactcatcg tagtaagaat ggagacttgg gccaagaagg   2520
acagggaaag cccagggaac cctaagcttg atgctgggct nctgctggga tgctggtcca   2580
gggacagaaa ggaggaggcc aagaggagac atggcttagg gtcaaagagg acgtgaagca   2640
gattaaaatg gaatttttgt tgaaatattc aaacagtgat caagaatttt accatctaca   2700
ccttgaaccc agaaaagaga tttaggttca aaatatgacc atcatagcca aagaaacaaa   2760
aataaccaaa gggagaatag gaaatgagtc aaaaacttcc tatagatgtt taatttttaa   2820
aaccttttta acagctttat tgagatgtaa tccacatacc acacaataca cccacttcaa   2880
gtgttcaatt caatggtttt ttagcgtatt catagagttg tatacacgac agccactttt   2940
agaacatttg tatctccttg aaaagaaacc ctatgtctct taactattac ccccatccct   3000
ttagcctcca cctcaagacc taaacaacaa ctaatattct ttttgtctct atagagttca   3060
ctgttctgga cttctatatg aataaaatca taacatatgg tcttttgtga cttttttctc   3120
aattagcata atattttcaa ggatcctcca tgttgtagca cgtatcagga cttcatccct   3180
tcctatggct gaataatatt cacttgtatg gttggaccac attttgttta tctgtttgtt   3240
caaaaatgga catctggatt gtttccacct tttggctatt gtgaataatg cttatataaa   3300
cattttatac aagtttctat agggacatat attttcatct ctcttgggta gatacctagg   3360
agtggagttg ctggctcata tggtaactct gtgttagtgg tttgaggacc tgctagaatg   3420
ttttccaaag tggttgcacc attctacatc cccaccagta tgtaagggtt ccagtatgag   3480
gattgcgatt cctccacatc ctcgccaatg cttgttgtta tctgactttt tggttatggc   3540
tttctcagtg ggtgtgaggt gatatatcat tatggttttg atttgcattt tccggatggc   3600
agatggcaca tgatactgag catcttgtcg tgtgcttttt ggccatttgc atatcttcct   3660
tggagaagtg tctactcagg tcctttgctc atttaagtaa tattctcagc atcgattttt   3720
aactgcctgt ctccaaagtc tttgttacta tttgctgggt agctgtccac atcactgttg   3780
ttagataaag ggcttttggg attccgtgaa agaagaaaga gtttcctatc ctttatcttt   3840
tctgagttca ttttctgacc aggtttcccc tctcctcttg tttttctact ttaggaagat   3900
tgcaatggca tattcagaat taatgtcagt gtgtcaaaga acttaaattt aaaattgagg   3960
cctggagaga aaaaacctgg attttgggtg ccccgtgttt ggtaagtata tcataaaaaa   4020
atattctgaa gaatggtgtg tttgtcanta taaggcttta aataagtatc atatggcatg   4080
taactaaaag tagttttgct agagatgtta aaatgatctt aagtcataca gggcgaagcg   4140
ctagattata ttggaagata gaaataaggt aaaaaataag agagcaagta gtgcaatgag   4200
ttctgtatag cttcatgaaa ctagagaaat attatctcag tatttttcta atacttcaga   4260
aatatgtatc tggattcaaa tgccttaaaa aattaggctt aacaggattt tctgtcaaat   4320
taaaactaaa cttatcctga gtttatatct ttaaaggagg atctgatgtc ctcataatag   4380
aaccctaaat cataaagcta tttccatttt aaaacccatt tacactgaag gacttccatt   4440
attgaaacac tagagaggaa taatcagtga cacagttgat tgcttctaac tttcccttta   4500
atattccttt ttctttaaat tgagttttca aagcacttag atcaaagcta gaaataccta   4560
gtaccttctt tcttatttta ttaatgacca tgagtgaatc tctcagtctg tgtcattggt   4620
gaactgagtg ttctgtcacc ttcatttgtc ctttaaaatt nttatctgtt ttttaagttt   4680
tcttttagaa aatgtgtaag aataacaact gagtcacagc acctctgctt ttgtcacaat   4740
tgatgttctt ttctaaatgt caaaactctt taaaaggaac agcatttcac ccagctgtac   4800
cctagcactc actgttacct ctctttggca tttttctcat atgaaattcg cttttatacg   4860
taatccaata gaatgcatat tgggttttta ttttttaaaa tatccaagaa ctgagaaaaa   4920
ggattcattt ggggtatgtg gcttcagctt ggagagagag gaatgtgaga catgagaata   4980
tcctggcccc actgctgact agaaaagccg tccaatttcc attgaaataa aaattaaagg   5040
agcataaaaa ttttcttcca tgagataaaa attaattata gcataaagtt atttatgtta   5100
taatttatta atttttatta attcaaagat aatatcatgg aagtaaatgt agtcaggaat   5160
agagaacact ggggcatttc atttccttca ctatagagaa aggtagaggg tgcctcccac   5220
ctctgccaag tgaggtaccc cagggggatc acttaacgtc agagatgggc agggcaagaa   5280
gagagactct tgtggccagg ctgctcatca ccatctggag agcagggtta tctggtgttc   5340
ctggagagcc cagtagtcac tgcctagggc cacatcatct gagtcctctt gagccttgcg   5400
gcaaagggct ttgtgctggg aaagggtaac cccctccaaa gggtccgtag gtgtgtttcc   5460
aggagccaga cttgagaatc acccagagac tgcacactta caggagaaaa ggtgcaatga   5520
ggcactcctg ggctggagag ggggttcaaa ctcttgaaca cctatggcca gaatccaatt   5580
gtatcagatg cacaagactt aaactccatt cctccattcc tttcaacgac atcccacctc   5640
agtcatgtga gaatctcgtg gtggcctgaa gaggatgagt ggaagtgaag aaagtggcca   5700
acttttcttc ctttcctcaa accggggtcc ttgagctgct aaggatggga ttgttatatg   5760
agttatagga tcagttggat gtaaaactga attactgaaa ataaccaaaa agctctggga   5820
cctccccaag aattcagaca gggagctgga acacacttga aggtagtgtt tggagaaaag   5880
taaacctgcc agttgtgccc tatagcactc aacctagtcc ataaaaccag ctacatggga   5940
tttttaaaat caaagttaat ttaaatgcaa tattttatgg aaggtattat taggggtttc   6000
aaaggcaatg ccattctaga agcataagca aatagccagg cattccttga acatcatcac   6060
aagtgctctt gtccatttct ccaggataat gtgacttgga ttgtagtgaa atagacacct   6120
tcgatctaat aaatgtcatc tgtaaccatg ataacttttt acactttcct tcttaagtaa   6180
gctaatcaag agttggaagc tgaaattttg taattttata ttggctaaat tatgattaag   6240
aaaataacat atctaggaat acactagagg aatgctttgg taattataat taggacataa   6300
atatgcacta attcaggaga cagtctagtt tcaatattct ctcttcagat taataaatgt   6360
actttcttct gaatcactca gacttgatga gtcacctcag taaaaaggat taaacatatc   6420
atggattata aatacagtgt gatttatttt aagaggaggt ctggaatata ggaaaatggc   6480
atgcatggga gaaaaactaa caaagtattc aggcttataa taaatgtatt tattgagtgc   6540
ttgctcttca ccagctagta tgcttgtcac tgtggtaagg ccctgaataa gcgatggccc   6600
ctacccctta ggagcttaaa gtctagtggg aaacagaaaa taaaattaca aataatttna   6660
tataatatgc taagggcttt aatgctgcac agagaagccc ctaagcttac ctctggctca   6720
cccgaaactc atctccatgt aatgttaagc tacactgtga tatgttctag gaagaaggtg   6780
atcaggtttt atagggtcna aggcccaaac aatttggggt accaacatct cagaagggcc   6840
tgtacaaaag aggggtccta ccccttaggt ttctttggct tcatcatata cctgcctctg   6900
attcctacag aaaggctaag ggtacaatgg acacacagga gaagcaccta accccaacta   6960
tgcagggcca aagagaagga ccagatgaga agacacactg gttacctttt gaaggacaac   7020
caataggaac tagccaggtg aagggggcag ggtcagaggc aggtgaggag gaaagtctag   7080
gcataggttt ggtattacaa gttaaggcaa ctctatgccc aaagctcaag gcaaaaagcg   7140
ttggggtgct gtaggaagta cgacgtttct gatttctttt aggagagatg gttgtgtaag   7200
atacagcatg ccgtttttgg acaaagtctt tttctgcatt tccacatcca agggcagacg   7260
ctcagtcacg tcttcagggt gcccccatgt tccccaaggg aagagcagct ctccctacct   7320
tgatcttggg gggccttgga gcacctcctc tgggaggtaa aaaactgaca aaattatgtg   7380
gtcagatcta atgtcttagt tttctgaatt ggacaggcaa gattacaata tttcacaaat   7440
taaccagaaa aaatgacaac cttttcaatt caaggaaggg tagcaggtaa aaatgacaat   7500
aatagatgnc atttgggatt tattgaagga ctcngtagtt acaggtaaag tttcaaactt   7560
tgcaactttg ctagcatgaa gaaagcataa gaaaacactt tacatgatta aaactgaaaa   7620
agacttattt ttttaatgtg ataaattctt ccaactattg aagtctttga tgctacattt   7680
tgttttactt ggtttagtta gaatattttt cacatattct aacttctaga agatctagaa   7740
cataacagta gtttcagtgg ctgcaaattc agctaagaaa gcacttctac aaaagaaaat   7800
gagcaggtaa ggaagtccaa caccggctct gagaaccggt tcacttgctt gtaaaaaatc   7860
cttattcaag caaactgtgg catctgtaga atccttataa cttctgtcta ctgtaaaata   7920
tatgaaattt agtggaaaca tcccaaagga aagattgttg gaagcatcca aaagaatata   7980
tttgtacttt catacataaa aaaatataaa gcagaattcc aaaatatgca tttctgagtg   8040
gggcttttgc actatattaa agaccgtctc cactaatcag ccctaagccc ttaagaacaa   8100
atcagtttca gtttaatgtt ttcttcttat atcctcatct atttaatatt caaaaaactt   8160
atgaaggcac atcttgtgat tgtctctata gtttaaaaaa cataaaagat ggtagaaaag   8220
tacagaacca gattttccct agagcgttgc ctgtcctgag ggttaaattt tgagaaatga   8280
gctagcagnn gggnaaaaaa tgatcaaaat ataatttaaa taggctccaa ggggcctact   8340
ctagtcagtg gtccggagct cagttcttca ttaaattcaa gaaatatagt ccatgatttt   8400
ccagtgtttg gttatcaaaa tcttaattat ttaaaattag cctctaataa gaaggaaaga   8460
gggggaaaag ccactgaaag cttcttctat taacaacaaa aatgttagct aagaaccata   8520
acaattaaag aagatgcaat ctagtaaaaa ggatcacttt tataattggg aagagaaaag   8580
tataaccatg ttaaaagaac aagaaatgag acatccctgg cccccacaga agtgggagct   8640
aaacagtggg tacacctcga cataaagttg gaaactctgg acagcgggga cttcaaatgg   8700
gaggaggaag gaaggaggtc ataggttgga aaaattacct gttggattct gcgtgcacta   8760
tctgagtaat gggttcatta gaagctcaaa ccccagcatt atgcaataca cccatgtaac   8820
aagcctgcac gtgtaccccc caaatctata agaaaacaga aaatgaataa gccaatgagt   8880
ttcaggaatc aggaatcagc ggtggaggta gaaagcatac cacccataaa ggggaccaga   8940
ctaagagtcc actgagaaga ctcagagtta ataagaaaaa atccaactgg aagagagtaa   9000
tttggaaaaa tacatactac aagcaaacac ctcttgccgt ctcagtgacc tctaaatgca   9060
tcactacttt ccagccctgt gttcaccatg atgacacaaa gtgaaataaa gtgactaaat   9120
tctactctac actttctata ctaacacagg caattgtaat ttatgccttt cgaaagattt   9180
tcagttacaa aactatttca aaatccacat ccaaaatcca atgcttcttt gtgcaaatcg   9240
ataaaatcat ctgtccagtc ctcagggtaa tcaggacaag gtagaaatgt tgcagaacct   9300
ctcaagctag aactagagct gttttacatt gagatcaccc catcattacc taatgaacac   9360
aatcaattat aacacattga tgcattgtta tgatttagca aacgaatgcc atatagcgta   9420
aaaatgtgtg tgtatacata tacacacata tgtatgtgtg tgtgcacgca cacgtgtgtg   9480
tgtatatatg tgtgtgtata tacacacaca cacacatatc ccacactcat gactggaaag   9540
ggctacagat atttgccttc gggtgctgct tattggaatt tcacagaaca ttcctgtatt   9600
ggaatcgcag ggcgaatcct cggaacttta atttcgacaa tgtgggaaac gctatgctgg   9660
cgttgtttga agttctctcc ttgaaaggct gggtggaagt gagagatgtt attattcatc   9720
gtgtggggcc ggtaagcgag cacatcgaat cctttgaaca cttcaagagc agctttcatt   9780
tgttttgatg aataaccata ttttccttta tgcagatcca tggaatctat attcatgttt   9840
ttgtattcct gggttgcatg attggactga ccctttttgt tggagtagtt attgctaatt   9900
tcaatgaaaa caaggtaagg atttttggtt tggataccac agggtttagc cttttctagc   9960
cactcacttt gagctatttg tttcttttca cacgcggcgt gaagccgctt taaactgtaa  10020
tgtgactggt gtaaataatc tctataactg ttttacaagc tccctcattg ctgcttttca  10080
gacacattat ttaagagtac agttctcttg ctaaatttac ccttttggta acagtgtcat  10140
taattcaccg acaactgaga ggcgcgtctc ctattgttca aattgaaaag aaagatgggc  10200
agcaagttat taaaatacaa tagatgaaag tgattcgcta attacaggta atattacttt  10260
cactaaatgt aaattgtatg cttctgtgta actcagtagg tgaactcagg attttgatgg  10320
gggtgagggg agtctggtag aaatttcaaa atcctaattc acagaaaaaa agattttgtg  10380
gcagggcatg gtggctcacg cctgtaatcc cagcactttg ggaggccaag gcgggtggat  10440
cacttgaggt caggagttca agaccagcct ggccaacata gtgaaaccct gtctctacta  10500
aaaatacaaa aattagccgg gcgtggtggc gcatgcctgt aatcccagct actgggttgg  10560
ctgaggcatg agaatcgttt gaacctagaa ggcagaggtt gcagtgagcc gagatcacac  10620
cactgcatcc agcctgagca acagagcgag actcaaaaaa aanaaagaaa aaaaagaaaa  10680
aaagattttc taatttcata tgaacttgac atactttgtg aactcgggaa gcctgttgag  10740
tttgtaacag ctctaatgat tagaacaaag gctcacaaat gggaaaatna caatgtagtt  10800
tcctatcaaa gtgtgagttt ggggaagaac attctattag cactccttgg agaggggctt  10860
gctcatctag gcacttgagc tatgccctct attgtttgag acgcagtctt tggaatcata  10920
gtaagggaag tgcatgcagt ttttgagcac acactgtgta ctaagatttt acatattcaa  10980
tcaattctca caactctcaa atgcacggtt gcagaaaaag caatgactag tctggggctt  11040
ataaggtgtg anaaacaggg ccagaattca gaattggtgc ctattaccgc aggctctgtg  11100
attcttcgaa ggcatgagta gaataaagtc aaccttcact ctgcattaag ttgaagctag  11160
atctgcctgt aaagcaccgt gctgctcgat gttattcatg gctaggactg attcccatgc  11220
gttcacatca gagctcttca gtttgtgttg ctacacatgg gactgtatct gtcattcact  11280
gtcctcaggc tcaacgtgag tggtaccagt tagccagtca attgacacct ttgatgtgtg  11340
gctaatgagc atgtcatttc attcaggctt tcaaagggtg agatttaaaa attcctcttt  11400
tgggccccga ctctacttgg accctcagaa acatgggatg ttagagacag aaagaacagt  11460
agtgatcatg tcacccagcc ccttatttta ctcctatcac attcattaac gagatgcttt  11520
gagccctaca gtgttgagtt taataccaag cagaaagagg aagaaggatc tttttagatg  11580
cctttgagcc atgtaatgca gcagacactg agaattctag aatataagca gaagctaatc  11640
agtcaattaa caggagagtt taggcactgc ttgcccagaa caccgttaag aagccgtctg  11700
agcagacacc tgatttcagg aagattagaa tgtatcacag ctcacaattc agcaacatac  11760
atagaacaac ataaaatgtt cagtaactgg aaataaatgt ataattaatt gcaacacttg  11820
agcttagaga agtggctgag gttagcagaa taaccaggga ggtctccatc cagcactgta  11880
tttatgttct gcaggtagga aagagtaacg tggcctgttt gggggatctg gggcgtatgt  11940
tctatcagct caaatgggca cttaaagaaa ggagaaattg acaagaaatt atattaccaa  12000
gctttacaaa cttgatttgt taattggaga tatcaattgc taaattatgt gagcctttta  12060
gaaaagtttc tttctctgca agnttttttt ttttttttag aaagcagctc atgagctgcc  12120
atctaacagc atttatacat tattcaatca ttcaacagat gtatttgagc atctactagg  12180
tgccagaggc tgctcttgac actgaggacc tagtgaacta acctaaacac taaacacaga  12240
aaagttattt gccctcatgg agcacacatc ttaatagtca tacccaaagg cacataggta  12300
aatttccaaa tgtagagaca acagagatag aaaatgaggg aatctttagg gtacaattca  12360
gaatcatgca aaaatatgtc ttcttttgaa aatggaaacc tctttaaaga gttccaagtc  12420
tatattagta atatagattt ttttctgatt tctctactat gtaagacaat gtgtttgatt  12480
tattaaccta acttgataat aataaacttt cagaggtttt tatatattaa tgatcagatg  12540
atatctccat gcctattatt cttttagatc ctttcagagt tcaactttcc aaaatttttt  12600
ttatgtataa caaagtaatt acattagtgt ctatggtggc cagagaacaa gtgtttgctt  12660
ataattagtg agaaaagtgg tttagcaatg tgattatcag aaaagaacaa ttttaaacaa  12720
acactattat tgggaataaa tgatgtacta aagaatgaca aaataatcac cagaaagata  12780
tagaacttcc aaatcccaaa atgtacaaag caaaaattaa acaagttgta aaaagaagct  12840
agaaaatcca aaatcatagt gaaagatatt aacatatatc tcaaaaaatc tcataattca  12900
gagnagaata aaaggaaata tgagatttga tacaataaac acaatcaagt gaatgtataa  12960
ggaaaactct aattacaaca atttgagaat gtgcattatt ttcaagcaca aaatgtntct  13020
cccagaaggc cataattacc caagaattga taatgtaaga atgttttctg accataatga  13080
aaacaaaaac aaaaaaaact ctacaatttg gaaatattaa gacaatacta taaataattt  13140
atgagttgaa gaaattataa tagaaaatca caaaatattt acagacaaaa cattttatag  13200
cgtcatatac aaaaactaat gaggtatagg taaatcagta attacaaata aatgtatcat  13260
tttaagtgta tatattaaag aagaatcaca agttaaatat taatatgtca aatatccaaa  13320
tcaataaatt ataataaagt aaaatcaaat aaagtagggg ggaagaaagt aacaaagatt  13380
aggacacaaa ttaatgatac agaaagtaag gaaacttgta tagcttctat aatattcaag  13440
aataacaaaa gctgggtttt ggtttttttt aaatcaagtc aataaacctc taggaaggtt  13500
gaacaaaaat aaaaacatga aacaagaaag taagctacaa tcattaaaag agtgtcagta  13560
ttgttatagg tatagaaaat tagacttaca gaaaaaacta gaaagaccca gcagggaccc  13620
atgtatgtag aaaacagaag cagctcaaca aattagtgca gagggtggtg agaccaacaa  13680
ggagtggtgt tgggagtatt gattgtattg atgtaaagag ctatgctgag atctctacct  13740
cactgcatac tcaaaaatga attccagatg aattaaagac ttcaatatga aaagcaaaat  13800
ttaaaccatt tttaaagcat gtcagcattt attttttatt tgaatttcag ataagcagca  13860
aataatgttt ttgcctttat tatttttaat cagcgcataa ttgtacatat ttatcnggta  13920
cagtgtgata tttcaattca tgtattataa tgtgtaatga tcaaatcagg ataattagca  13980
tatctatcac ctcaaacatt tatcactgtt ttgtgttggg aacattcata atcctctctt  14040
ctaggtattt aaaaataaac aattaattgt tgtcaattag attcaccata tattaccatg  14100
gaacactaaa atttannttc ctccattcta gctgtatttt catatccatt aatcaacatt  14160
tgactatccc tattctagtt cccctcccca cccctagtaa gcatttgttt tttgccctgg  14220
agtagttatg gatttcatcc cattagccac caagtgaaat ctataaagga aaaaaattat  14280
aaactcgatt atatttaaat taaaattttc tgaatgacaa aagacactct aagcaaaata  14340
aaaatacaag ccaagactaa gagaaaatat gtacaactta cataattgat aaaagattag  14400
tatccagcat gtataaagaa tctctacaaa ccattaaaaa gtaaatatca aaatacaaaa  14460
atgagcaaag gatatgaatg ggcaattcac ataggaagat acaagcatca ccatttacac  14520
acatgcaaat gtttcatctc gttaatatta aaacaacatt agatacattt tcacacctat  14580
caaaatggtc agattacaat gtctggcaat atcaagtatt gcaagaatat taggatatgg  14640
taacacctgt gtattgctgg taggaaattt gttttggttn ttgctctttg gaaagcaagt  14700
tggcaacatc tggtaaatgt aaagatgctt aaattcctag accccatcaa ttcttctcct  14760
agagatcaac aatggagaaa ccctcataga tatttactgt gagacagtac atggatgctt  14820
attgcagcat tggttatagt ccataaatca aaaatgaata acttcggata ttcgtacagt  14880
ggatggtgtt tgtgagcagt taaacaaatt agatttagta atctagttgt atggaaagta  14940
tactgttcaa tgcagatata aagaaacagc nnnnataatc acatgttgga gtccatttct  15000
ataaatatta aaaaattcag aacaaattct tacgtattga ttcatgcgta agcacaaaag  15060
tctgaaaaca tagtaaggag gatgcacgcc tgaagggtag tggttagctc tgggtaagga  15120
aagggagagt ggggtttttg tctagttttt aaaattacac ttcagctttt atgataaaat  15180
ataatgcagt gcagtgcaat acaatataat ataattttaa tcatatgcat tttaatcaag  15240
tactctatta tacagaatat ggaattccat ttaggcagtt atcacagcac tactttctta  15300
aaatgcaaac tctatgactt tgtatctctc aaaaacagtt ttgcaattgc acatattaga  15360
cattttttaa agaaagacaa cataccctta actggaagcc acagcattga caagctataa  15420
ttttgctgct atgaaatgaa aggaaactaa ctactattag tgagtatcct tttttgaaaa  15480
tgtaattatg tagaaactcc tctttacatt ttcccaaacc tgaatattac acatctccaa  15540
agatacaagt cgaaggctgc tgaattctct ctgaaacacc tggtcatcat tttgggaact  15600
cctcccaaga ccaactttga gcattctgac catgtttctc tcaccaccac ggttggaaga  15660
acatggtcag tgcaagccct cacatcagtc ctgtttgtct cggcacccca tctgccatgt  15720
tcttggtgca agcacatgac aaaaggcctt ttcctgcttt cttttgtctg ttaaggggac  15780
ggctttgctg accgtcgatc agagaagatg ggaagacctg aagagccgac tgaagatcgc  15840
acagcctctt catcttccgc ctcgcccggg tacccaaaat gctctgattt tattcatgtt  15900
gggcactagt gtgcacgatt ccccaggagt ctcagattta aattaaaata ataatcgtga  15960
ggccgctggg aggttgtgca taaggtaata cagaaacagg ctccaaacca cagatctctc  16020
cataaggcta ttaaaatcaa ccacccaaag gctgtgcttc agtgctctca gactaagcct  16080
taatgaaaaa atgaattttt aaataaaata tatttgctct tgccttttaa aaatataagt  16140
gaaatgtatt aaactgacag aaattgaatg atgcacttct ccttccaata tagacggcat  16200
catgcactgt cgttttgaat attcagagcc agccattgct gcaaaaacac ctcacaatag  16260
acggaactgt ttggggagaa aaatgtaatg ggttttaaga taagcattta agaaaataaa  16320
cgacaagaaa gtaaatgtga cctgtgtcta aaatgccctt gcccaaacct ttcttttcta  16380
gataatgatg gttttagagc taaaatgtat gacataaccc agcatccatt ttttaagagg  16440
acaatcgcat tactcgtcct ggcccagtcg gtgttgctct ctgtcaaggt acttcgtttc  16500
accctaagac tccgggaatg aattttgtat tcactgctac atccgagagt atcacaagct  16560
gctatatgca ttcacggtta tgttcttggg tgtaaaaatt aagattcact gtcaatggca  16620
aagtgggcag aagaggggca agcctgtatg tgtccgatgg acgtgggcaa cgactcgtgt  16680
gctgtttctg ttgcagtggg acgtcgagga cccggtgacc gtacctttgg caacaatgtc  16740
agttgttttc accttcatct ttgttctgga ggtactgtaa tgagtcagct agctctgggg  16800
gaatctgtgc acagttttaa agtaaatcag cctccctctt tgatgccact tactctcctc  16860
tctgtgttcc attgcctttg aagtttgccc ttaggatatt tcctacttaa gcggttctgc  16920
ttaactcgaa caaagacatc actttatcca tcagattttt ctaactacag aaatgctgct  16980
gtcgattgtt gtgtctgaac attggcctgt ctagttatgc gagttctgat atttagaggg  17040
aatggtgcaa gccactataa ttcattgact caaattgcaa tagagacgca aancaagttg  17100
gcccagacaa ggttatttta acatgtgatt ctcataatat tgctttccag ggcagtcttc  17160
ctgaaataca agcagattct tattttgccc tacactggtt gatgtttccc aaaatctatg  17220
gccttttgct taaggaagaa aaatgtccca tgatcagaac tagtcataaa acgaagagga  17280
aagagtgtag agaacacaga tttgtaagct acttagcttc aaaaataaaa tcatatatct  17340
tggtaataaa ctcttatttt tagttactac atgtttacaa ttattcttta aatagatagt  17400
ataaccgagc atgctggctc actcctgtaa tcccagaact ttgggaagcc gacgtgggtg  17460
gatcacctga ggccaggagt ttgagaccag cctggccaac gtggtgaaac cccatctcta  17520
ctaaaaatac aaaaattagc caggagtggt tgcacgtgcc tataatctca gctactcggg  17580
aggctgaggc aggagaattg cttgaacccg ggaggcagag gctacagtga gccaagatca  17640
tgccactgca ctccagcctg ggtgacagag cgagactcag tctcaaaaaa taataataaa  17700
taaatagaca gacagacaga tagatagtgt aggcacgtgg cctaaaagga aacctcaaag  17760
ggcattaaag tgtttgtctc attttcaatg gaaaagatac tgtgtccaca tcaaataatt  17820
taaaattttc ttcatttgaa aaaaatacat acacataatg catctcaagt taatacattt  17880
aaatatgtac taaacactct ctctgtttat tttcttcttt gctttttctc caggttacca  17940
tgaagatcat agcaatgtcg cctgctggct tctggcaaag cagaagaaac cgatacgatc  18000
tcctggtgac gtcgcttggc gttgtatggg tggtgcttca ctttgccctc ctggtaagca  18060
tagaagtcaa gttgatttca gctgattatt tcagtttggt tcagttctgc tcagtcctgt  18120
ttccagtctc attttactcc acatcaacct gctctgaggt gttagatgga cctccctaaa  18180
gcccagcttt gactgtgatg ggctctcaga catgcttgtg tctacatgta cacaccccca  18240
cactcttcac acaggcaaaa cctggcccct caaagaccta gacgatgcaa gctagaaaga  18300
gaaggacctt caagatcttc tggtttagcc cctcatttta ccaaagggga aaacaagaaa  18360
gagagaggaa gactgcaaca gagactgaga actgtccaaa ttcacacaag ctagtatcag  18420
aagactatag tcctgttttc ctgttttnct cagctgaaat atagcatttg ttccactttg  18480
ttataatcag tatttcacaa tgtgattctc aagtgcttcc actgtttcat tttctataag  18540
acatttagcc tccacttctc taaagcatat gattctccat ctctatatct gtgttctcac  18600
tattttacct aaagtgcctt caccctccat tcagtctgag atcccactca aaatctgcag  18660
ctatgggtnt actgaactgt aatctagggc catattgtcc aatgaaaata aaatgtggcc  18720
acagatatca cttaacattt tctagaagcc acaataaaaa agtagtngtt tagaaaatat  18780
aactattaaa ttgttaataa ttattaannn nataaataat aattaattat ttaattangt  18840
aatatatttt attatttaaa atatgtatta attaaaagat gcattatgtg tatgtgtatg  18900
tatatatttt tattatttat atagttatat attatatatt aatatattta attaaataat  18960
taatttaatt nattatataa ttaanttaat aattatttaa ttatataatt atttggttat  19020
aattatttat gtataattat tatttatata cttataacta ttatgtatgt aattatactt  19080
atgtaattat aattatttat ataatttaat tattaacaat ttaataatta tattttctaa  19140
actatatcca aagtattatt attttcatgt gtaagcaata taaaattatt gagataagta  19200
gtatccttgt atctgtgtgt gaagtctttg gctgagtatg tatcttacat ttacagcata  19260
tcttcattta aattgccaca ttttaagtgc tcagtaacca catgtggttc catgtggctg  19320
ctggttacca tgttggatag cacagctctg gaagatatgg gtcctagtct aggttccacc  19380
attttccagc cttgactaat ttatttgcct tcaatgatcc tttgtttcct gctctgaatg  19440
gccaatataa cttcataatc cacctattcc ctctggcatt atgaagatca agtgagataa  19500
tatatttgag gctttcttga actagaaaga ttatacaagc ctgtaggcat tattataatt  19560
accttctttt tgttagtcat acttgatctc atcccaagga atattatcgg tttttccctg  19620
tttccttcta tccattctcc catcccctta gtgttagaga catgctggga aagactcatt  19680
tacacatcct aaagggcttg ccttaatacg agacgctgtg ctcatgaaca tagtgagcgt  19740
ccttcttaaa ccagtggtta ccttcagcat caggggctgt atgaagccta ggtgagctct  19800
cagtcatcct gaagtatttt ctcagcaata aatggttctc aattcctagt acaagacaca  19860
gtactagtaa ctgagaagaa tgtaataagc aaaacaaata tagttgctgc tcttgtgaac  19920
cttatatcct agaaaagtag atagatagtc atcaattgct cacaaatcta tgagtataat  19980
gactatgatg agggagatga aggagagcct gtgttcctgt gacaacatag ataatagtgg  20040
gagatggctt catcagagag gtcttggaag acatccccaa gggagtgatg gctccatctg  20100
taggataagg ggagggcatt tcaggtagtt gtccctgtga tggaaagatg acagagctgg  20160
aagaaggata gatacatagt actagcatag tacaagattt ggatgggtaa gaaggtatca  20220
gacctcttag gaccttgcag tccaggtgaa gaattcagat tctcatccta aaaactattg  20280
gttgtcatta cttccaaaac ataaagaggg aaggtatctg caatagatct ttagctaaca  20340
tgggaagaaa aggcagcaag gcccatgttt ttcctttctc cagataaaat ttgtattagt  20400
cccttctcac actgttatga agaaataccc aaaactgggt aatttataaa ggaaagatat  20460
ttaattgact caaagttcca catggctggg aaggccccag gcaacttaca atcatggtgg  20520
aaagggaagc aaacacatcc ttcttcacaa gggaacagga gagagaagaa tgagtgccca  20580
gcaaaggggg aagtccctta taaaaccatc agatcttgtg agaactaact caatatcatg  20640
agaacaggat gggggaaact gcctccctta attcaattat ctccacctgg tccctcccac  20700
aacatgtgga gatnatggga actacaattc aagatgagat ttgggtgggg acacagttaa  20760
accatatcat tctgcctgga cccctcccaa atctcatgtc ttcacaattc aaaatacaat  20820
cataccctcc caacagtccc cgaaagtctt aattcattcc agcattaact taaaagtcca  20880
agcccaaagt cttatctgag aanaggaaag tttctgctgc ctatgagcct gtaaaatcaa  20940
aagcaagtta gttacttcct agatacaatg ggggtacagg cattgggtaa atatacccat  21000
tccaaatggg agaaattggc caaaacaaag gggctatagg caccatgcaa gtccaaaatc  21060
caatagggca gtcattaaac attaaagttc caaaataatc tcctttgact ctgtcttata  21120
tatatccagg gcacactgat gcaagaggtg ggctcccatg gccttgggca gctccaccat  21180
tgtggctttg cagggtacag accccctcct ggactggtat tgagtgtctg tggcttttcc  21240
aggcacacag tgcaagctgt cagtggatct accattctgg agtctggagg atggtggccc  21300
tcttctcaca gctccactag gcagtgctcc agtggggact ctgtgtgtgg actcnnnnnn  21360
nnnnnnncaa ccacacattt tccttccgca ctgccccagc agaggttctc catgagggct  21420
ctacccccac agcaaacttc tgcctggaca tccagttgtt tctatacatc ctgtgaaatc  21480
taggcagagg ttcccaaacc tcagttcttg acttctgttc acccacaggc ccaaaaccat  21540
gtgtaagcca ccaagtcgtg gggcttgcac tctttgaagc atcagcctga gctgtatatt  21600
ggcacctttt agccatggct ggagcagaag ctgctggaag gcagggcacc atgtcccaaa  21660
gctgcataga gcagagggag cctggggccc acccacaaaa ccattgttcc cttctaggct  21720
tccaggcctg tgatggaagg ggctgctgtg aaggtctctg gcatgccctt ggggacattt  21780
tccccattgt cctggtgatt agcattcagt ccctcgttac ttatgtaaat ttctgcaact  21840
ggcttcaatt tctccctagt aaataaggtt ttcttttcta taaaaatcat cagactgcac  21900
attttccaaa tatttatact ctgcttcctc ttgaacactg tgtcacttag aaatttattc  21960
taccagatac cctaaatcat ctctcttaaa ttcaaagttc cacagatctc tagggcaggg  22020
gcaaaatgct gccagtctct ttgctaaagc ataacaagag tcacctttgc cctagttccc  22080
aataagttcc tcatctccac ctgagaccac ctcagcctgg acttcactgt ccatatcact  22140
atcagtattt tggtcaaagc tatccaacaa gtaggaagtt ccaaactttc ccatatcttc  22200
ctgtcttctt ctgagtcctc caaattgttc caacctctgc ctgttaccca gttccaaagt  22260
cgcttccaca ttttcaggta tccttatagt agccccccac tctaagtacg aatttactgt  22320
gttagtcctt tttcatgctg ctatgaagaa atacccaaaa ctgggtaatt tataaaggaa  22380
cgaggtttaa ttgactcaca gttctgcatg gctgggaagg cctcagaaaa cttatgatca  22440
tggtggaagg ggaagcaaac acatctttct ccacatggtg gcaggaagaa gtatgagtga  22500
ccagtgaaag gggaagcccc ttataaaact atcagacctg gtgagactta atcatcacaa  22560
gaacaggatg agggaaacca ccccagtgat tcaattatct ccacctggtc cctcccagga  22620
tacatgggga ttatgggaac tacaatccaa aataaggttt gggtgggaac atagccaaac  22680
catatcgaaa tgcaacctaa agctactgag tccaagcaaa agtcaagtag actctctaat  22740
cccagataac ctcagagagg aaatcttaaa cccaaagacc aacttccctt ttctgcctaa  22800
ttgcctttgt tcttctccaa gaacctcttt ggtcttggaa ggatgctcat tctccaccgt  22860
attttgcagt ggactattgg gaaggaaagt tccccatcca nggatgctat gtgcacacat  22920
tcatgtgctt ggacctcacc aaggatctca ctggaccccc ttcgcggggc ccatctgtga  22980
ctgtcatcat ttggctaggc aagcctcctt gagagtaatc acactctggc atcggctgaa  23040
tgtcaaggtt gttattgcag ttatagctgg tgggatcttt gtttctcaaa tgaagctttc  23100
ttattcataa agtgcagtca tctcttcctg ctaatcacac ccttgaaaaa agagctggat  23160
gtgttcctga gcagggagga cctctctgaa atcagcttag aggaatgagt gtatgtttgt  23220
tcttcagtgg tgtctagaat ctgacttctg gcaatctttt ccaccatcag ccctttctct  23280
ttgccaggat tcctttacct cctatgtcag ttgaccttcc tatgttgcac tgttaccctg  23340
tgtttttcac accctgtatg caaaagagct ggtcaccatt ttatgtaaaa taaatttcaa  23400
aatacagaat ttagctgagc aaaacagaac ccgaagtttc atttgagact gaattttaaa  23460
tctaatattt attcatgagt ttttgcagtg accttttcag cacctttttt agatcacttt  23520
cttataataa tttacacata ttaagctaat tattcagtat acttcacaga aggcttaaaa  23580
aatggaactg taacaagatc ttttgtgcaa attatgagaa gctgtcttct gtttaaattt  23640
cagaatgcat atacttacat gatgggcgct tgtgtgattg tatttaggtt tttctccatc  23700
tgtggaaaac atgtaagtac attgttaaga atcttatctt aaaggtcata tatgtgttaa  23760
tgaaagaatg gtgattaatt gattacagcc ttacctcggt tatttaggga tgtaatcaca  23820
aattactaga catcataagt caagattaac aaatattaaa cattgttaaa tgaatcagta  23880
gcttagttat cattcgatgt gtttcctgcc atttatgttg cttattcttt atattcaata  23940
attaagtaaa ttatttaaat ttattaattt aattaattaa agataaccag tcatgaaaac  24000
aaaaaccaat attctttctt aatgcatttt tatttttatt ttcaataaag ttaagtaact  24060
tcaaagaaaa ataatcttta atgaattttt atngtttcca tgattccaga tnnnnttttt  24120
tttttttttt tttgagatgg agtcttgctc tgtcaccagg ctggagtgca nnngtggcag  24180
gatctcggct cactgttttc tccacctccc aggttcaagt gattctcctg cctcagcctc  24240
ccgagtagct gagattacag gcatgtgcca ccacacccag ctaatttttg tatttttagt  24300
agagacaggg tttcaccacg ttagccagga tgagattcca gattttttaa tattatttgt  24360
taatgtccat gggtatattc cacatatatt tttcattttt tacaatgctg tttccttttt  24420
tattacaaac gttatttcat atatacattc catatataca cataaccaat atacttaata  24480
tttgatagtt atttagtatt ataccattgc ttaggtttgt ttttgtgaaa gtctgtttgt  24540
ggaagaaacc tgagtttact tgctgtcagt caaaaatgtg tagcccttat catagagaat  24600
tgaggagcag aagagaaaat ggaaggtgaa aatgcttagt gttactctta ttaatttgtg  24660
tgaagaggct gaaatgtttg aagtaaaaat aaaattcgcc caacgcctgg tgggttttga  24720
agaatatttt gatgtaatac cttatagaaa gcaactttca aatgatacac ctaagagtga  24780
ttttgagcca atctgcttaa agattagttg ctacccaggt cttccatagc ttaatagatt  24840
gaatattctc tctctctctc tctctctnng tctctgtctc tctctctctc tctctctgtc  24900
tccccgcttc ccacccctgg tccccaggta acgctaaaga tgctcctctt gacagtggtc  24960
gtcagcatgt acaagagctt ctttatcata gtaggcatgt ttctcttgct gctgtgttac  25020
gcttttgctg gagttgtttt atttggtact gtgaaatatg gggagaatat taacaggttg  25080
gtatatactt atctttctat tcatttatca agcaaaccct ttggtaataa aattttaaat  25140
aaacaaatgt tttttgtcta ttaaagtcta ggagagggga aagggaagta atcagttgga  25200
aattaaaata aaatagccaa gttttaaatg atatttttcc agttgaaaaa ggttattcaa  25260
ctgaaaaggt ctactttcaa aaccttagaa aaattagaaa taaaagaaaa caaaaagaat  25320
ctataattcc accaacattc agtaatcatc actccnaatt ccagcacttt ttctatctac  25380
atattgccaa aaaatgatat attattttta gatggaacaa ttttaagata actctgggtt  25440
tctttctcag caaaatatgg gaatttagag ccccccaaat ggttgtaata tatgaaaagc  25500
agttttcaac gatttgccta agttttatag atgcatcatt ttttttcaag tcctgataca  25560
acaaagtata taccgatatg tcaagttgta ggaattagat acatggctgc cccacctttt  25620
atagcatcgt ccaagtgaaa gaaggaatca cttagttgcc aaagcctgcc tacttagtca  25680
ttcaagatga atggtaataa attagtggcc atgctagagt tgggtgttca gacggctata  25740
cttggaggca agtataaatg acaaattaat aaaaaggtat aacctttgga aaaggtnact  25800
tagcaaccaa atttgctaca acctccactt gttttggtgt tggcaaacca tgctatttca  25860
tgacaaaccc ttctataant cacattctgt taattttttt ttcttaaatt aggcatgcaa  25920
atttttcttc ggctggaaaa gctattaccg tactgttccg aattgtcaca ggtgaagact  25980
ggaacaagat tatgcatgac tgtatggtaa atatctctca tcatgaacaa ggcttagact  26040
tagaatcagc atgaaactct tncaacacaa tgttggcagg atcatccttg ttagcgttaa  26100
gactttatgt atgaaatata aatcctgaca cttcagtcca taaaattgca ttattataca  26160
ttccaatgtg tgaatattta gggcaaaata ctcaattaac ccaacttgag ctattgtagt  26220
tccattcaac aaantatgca ttttgtgagt gttgttcttt ccctcccatc tttaatattt  26280
tggtaatgaa agtcaaacag gaagcccttt aatttaatgt gttcagtgga tagttcactg  26340
cccctcagct atatgctagg ccctaggtct tcaacaactc caaggcacac tcaaggagct  26400
tacctcaagg gctctgagtt actcttcctt tatactataa agtatacttt atacttcctt  26460
cttactatat cctgtcttcc ccaagcatca tccttctggt ctcagtttaa acaggtcttt  26520
tgccttaagc taagacagcc agctacatgt tcttatgctg ctctatagtt ctcctttgta  26580
ataaggagct gtagtgaatt actggcttac attcatttat tttatctctt tctcaccgta  26640
ggacagacca atgctgtgtt aaaaaatgtc tgcagtgatg gaaatctgca ctgtccaatt  26700
cgggagccac tagccatatg tggttatgga gcatttaaaa tgtggctaac acaactgagg  26760
aactgaattt tagttttaat tttatattat tacattttaa ttaacataaa tttaaattta  26820
catngctgca tggagctagt ggtcaccata ttggactgca cagcactcaa ctgtcagtag  26880
gaagaagaga tagggccgcc tatgtctttc ttaccagtct ctccccaaac ttggcacaaa  26940
cctagcacac agtaggagtg ctgggacttc atgcatgaat taacaaggag aatttgccaa  27000
atcaaataga atacaaggca aaatttaatg aatcttaaat aaaaatacaa gcagaatgct  27060
gggattatag aagagagagc tagtttatct ggctgagaaa aaccagaaag ttctctcaga  27120
ggtgtcggcn ttttatagag cctgtaaaca atgagagagt ttttgatgac ttaagtcttg  27180
tgctattcca tagcatccca taacagtgtt ccaagaatgg ggcttactcc tcacacaatt  27240
tgaatgtgaa tttnctatgt gcaggcacat cttgttttac tgtgcttccc ttattgcctt  27300
ttgcagacat tgcattttta caagttgaag gtttatggca atcttgtgtg gagcaggtct  27360
atcagggcca tttttccaat agcatgtttg ctcactttct ggttctgtat cacattttgg  27420
taattctcac tatttcngac tttttcatta ttatctgttt tggtgatctg tgatcagtga  27480
tcttttgatg tttcttttgt agtttttttt gaggggtgcc atgaaccatg ctcaataaga  27540
tggagaattt aattgataaa tgtcatatgt cttctgattg ctgcaccgaa catctgtttc  27600
tccaactctt ctctcttttc ttgggcctcc ctatgtcctg agacacaaca atattgacat  27660
taggccgatt cacaacccta caatggccta taagtgttca agtgaataga agattcacac  27720
atcagtcact tcaaatcaaa agctagaaat gattaagctt atggaggaag gcatgtcaaa  27780
agctgagtta gcccaaaagc taggtccctt gcaccaaata gttactcaag ttgtaaattc  27840
aaaggaaaag ttcttgaagg gaattaaaat gctactccag tgaacacatg actgataaga  27900
aatagcctta tggctgatat ggagaaaaaa ttttaccggt ctcagtagaa gatcagacta  27960
gccacaacat gcccttaagc taaagccaaa tgcagaagaa ggcccttact ctcttcaaat  28020
ttatgaaggg tgagagaggt gaggacgctg tagaaaaaaa tgtttgacgc tagcaaaggt  28080
tggttcatta tgtttaagga aagaaagaag ccatctccat aatatgaaag tgtaagtgct  28140
gctgatataa aagctgtggc aagttatcta gaagatctag ctcaaataat taaggtggct  28200
acactaaaca atggattttc aatgtagaca aaacagcctt ctattggaag aagatgccct  28260
ctagaacttt catagctaga aaggagaagt caatgcctgg attcaaagct tcaaataaca  28320
gacttactct gttgttaggg actaatgcag ctggtgactt tcagtggaag ccaatgctca  28380
tttaccattc caaaaatcct aggaccctgc aatggtttga ctgtgtcccc acccaaatct  28440
catcttgaat tgtagttccc ttaatctcca tgtgtcgtgg gagggaccag gcagagataa  28500
ttgaatcatg ggggtggttt cttccatcct gttcttgtga tactgagtga gttctcacta  28560
tagccgtcat gagatctgat ggttttataa gaggtttttc cccccatttt cttggcactt  28620
cttgctgcca ccatgtgaag aagaacatat ttgcttcccc ttccgccgtg attgtaaatc  28680
tcctgaggcc tcccaatccc tgctgaactg tgagtcaatt aaatctcttt cctttataaa  28740
ttacncagtc tcaggtatgt ctttattagc agtgtgagaa nggactaata cagtctctta  28800
agaattatgc taaatctacc ctgcctgtgc tctataaatg gaacaacaaa gcctggatga  28860
cagaatagct gtttgcagca tggtttgctg gatatttaag cccactcttg agacctactg  28920
ctcagaaaaa aaagattgct ttcaaagtag tactgctcat taacaatgca tctacctggt  28980
cacccaagag ctgtatcagg agatgtataa ggagattaac attgttttca tgcctgctaa  29040
cacaacatcc attctgtcca tggatcaaga agtcatttca actttcaagt cttattattt  29100
cagaaataga tttcataagg ctaatagctg ccatagatag tgattgctct gatggatctg  29160
ggcaaagtat attgaaaacc ttctggaaag gattcactat tctacatgcc attaagaaca  29220
ttcatggcca ggcgcagtgg ctcacgcctg taatcctagc actttgggag gtcaaggngg  29280
gtggatcacg aggtcaggag atcgagacca tcctggctaa catggtgaaa ccttgtctgt  29340
actaaagata caaaaaatta gccgggcatg gtggtgggcg cctgtagact cagctactcg  29400
ggaggctgag gcaggagaat ggcgtaagcc caggaggcgg agcttgcagt gagcggagat  29460
tgcaccactg cactncagcc tgggcgacag agtgagactc cgtctcaaaa aaaaaaaaaa  29520
aaaaannnaa cattcatgat tcatggaagg aggtcaaaat atcatcaaca ttaacaggaa  29580
tttggaagaa gttgattcca gccattatgg atgactntga ggggttcaag acttcagtga  29640
aggaggtcgc tgcacatgtg gttggtagaa atagcaagag aactagaatt agaaatggaa  29700
cctgaagacg cgactgaatt gctgcagtct cctgatcaaa cttgaaggaa tgaagattgc  29760
tccttatgga tgatcagagt ggtttcttga aatggaatct actcttgcag aagatgctat  29820
gaacatagtc ataatgacaa caaaggattt ataatgttac ataaaattac tcgataaacc  29880
agcagcaggg tttgagaggg ttgactccaa attcgaaaga agttctattg tgggtaaaat  29940
gctagcaaac agcatcacat gctgcagaaa aatctttcat gaaaggaaga gtcaattgat  30000
atgataaact tccatgttga cttgttttaa gaaatcgcca cagccacccc aaccttcagc  30060
agccaccacc ctgctcagtc agcagctgtc aacattgagg caagaccctc caccaccagc  30120
agaagattac aactcactga aggctcacat gattgttagc ttttcttagc aataaaagta  30180
ctttttatta aggtctgtac ctttttggac ataatgccat tgtgcactta ataagccaca  30240
gtatggtata aacatgagtt gcatgtgcac tgggaaacca aaacatgcat aggactttat  30300
tgcaatattc actttatcac agcagtctgg aactgaaact gcaatgtctc cgaggtatac  30360
ctgtagagtc tatattccca aatcttaacc cattacttca gtcagagaaa aacttgcaaa  30420
tgtcttttta tttgattttc tgcagtttga tcacagtggc tacttatcac ttggggctgg  30480
tggtggtggc agaaagaata tctagtggag atcagttcat tttcattgtg cttttaaaaa  30540
tggcaataac cttgggattc tacaagataa cagcatagca taagtgaaat attcttcttt  30600
atttctgcta cagatgatgt acccaatgta tgtggctttt gaaagcttac tttgaagtta  30660
attatatgct atatgtttag gaatctattc attaactata gtcagctaaa agaaatttgt  30720
attctctact cttatcctct ccttcttcca ccccaatgcc ccaaaggttc agcctccgtt  30780
ttgtactcca gatgaattta catactgggc aacagactgt ggaaattatg ctggggcact  30840
tatgtatttc tgttcatttt atgtcatcat tgcctacatc atgctaaatc tgcttgtagg  30900
taagtgatgt tagttgaata ctttttactc tttaaactca ggtacttaga taattatgta  30960
ttattttcaa gcaattaccc tggatttctt ggggtgggtg tttcatggca ttaattataa  31020
attgttgtct ctcaatccag aagctgaaaa gacctttgaa aggcacgtaa atgacagttg  31080
actgcaattt taagagttgt agcatttatt atgatcatta atttcaaaag ggctcttctc  31140
atggattgag tngaacaaat atcagagagg actatctttc tagccttgaa atatcacatt  31200
tatgtttttg aaaggtacac cttatttacc cagatgtggg cccacccaga actcaatttg  31260
acctttaaaa atggccctgg aactctcaac taagagttaa agccagctgg catgactatc  31320
tctatacaca gaatgtgtgt ttgtgcttac gaccctcatg ttttggaaag gcaggagctg  31380
gagaaatagc ttagtccaag tgtaaacatg ccaatttgga aaccatacta aaagcacttt  31440
aaaaatttgg cttatgatat aggtgataga atccattatt aataatagat gttttactct  31500
ttctaaaata tgacagatta gcataatggt ctaacttctg aatttttctt tttttaaaag  31560
ccataattgt ggagaatttc tccttgtttt attccactga ggaggaccag cttttaagtt  31620
acaatgatct tcgccacttt caaatmatat ggaacatggt ggatgataaa agagaggtat  31680
gggagtgggt tgttgtttca tgcctcacct caaagagact tatcaacatg tctcaaacac  31740
ttaaatggtt ttcaggttgg caaatgacac agattgaatt tttaaatggn ntgaanttgc  31800
agaaagccat catttacagt tcagcagaat cctctaggaa gggagacagc atcgttcctc  31860
cttacatgat cttcaaccat gaacatcctc ttcttcagac tttccgaagg ccagcaggga  31920
aaggaagcca aagggactct gtaggaatca gccttgggct caggccagaa aaagaggtga  31980
cactgaaact accaaaggga cagtatatta ncaaattcat gatcacctca aactcaagta  32040
gcaatcccaa ttaaaagtac aaaggagtta tttaagtggc atctgaaggt gtgtattgga  32100
ttatttttga gttactactt gaatgtttta accataaagt ttacccaacg tttcttaaaa  32160
ttagccaaag tagctgcagt ctgctcttcc tcttcttgtc attgtcgtca tcaacctcca  32220
cctccttccc ttcctcctac tcctcctcct ctaccccctc tnnnnnnnnn nnntcttccc  32280
cctcctcttc cccctnctct tccccctcct cttccccctc ctcctcgtcc acctcctctt  32340
ccacctcatc ttccccccta cctcctcctc ctctacccct tcctctacct tctcctcccc  32400
cacctcctcc ttctncactt cctcctgttc ttcctccctc tcctcttctc tcttcctcat  32460
cctagcaaac actcaggcac agttctaggc actgaggata tagcagtgaa caagatggaa  32520
cagctcctgt actcacagag cttacagtct aataggtgga gacaaataat aaaaagtgaa  32580
ataataataa atagtgcagt atttccagaa gttaaaacta tagacagtag ttggggttgg  32640
ggctgcgccg gcaggaatga ccatgaagga ggcctgaggg gtgctgtggg acctcatgtc  32700
tgaacaacaa ggaaagttct gccagggtat ttggggcgag atctggaaat agttcaagaa  32760
gagttgatga agggcacaaa gaccaagaag ccagcctggg catcataaat gaggggctcc  32820
ggcagtgcac tcaccccaat ttgctccctc ttcttggtac ccctgcccgc ccaggcttca  32880
gtcttgaggg ctttcctttc aaggtagtga gagccctgcg tgcagggcat ctgagctcac  32940
tctcagctcc tcaggatcca cctgtctctc tgtaactgtc acccacggga acctgctttc  33000
atgcaataca cacatgaaga cccactgccc tgcacaccga gatgtcagta actggcaggc  33060
agtcatggtc gccagtgttc cgcccagcac tttcattcaa agaaagatac agccaggggg  33120
catggtggtt tgtgttgcat ggaaggtagc aacacatctt agattctcag tgtctggatc  33180
agttctgacc ccagaagagg gcagagctga aggcctaatt ctcttgtata tagtttttct  33240
aatcctgaag aagacatgaa aaggagttag ttagctcttt tttttttttt ttttttgaga  33300
tggagtccca ctctgtcccc aggctggaat gcagtggtgc aacctctgct tcctgggttc  33360
aagtgattcc ccagcctcag cctcccaaat agctgggact acaggcatgt accactatgt  33420
ccgggtaatt tttttatttt tagtagagac tgggcttcat catgctggcc aggctggtct  33480
cgaactcctg acctcaggtg atccacccgc ctcggcctcc caaagtgctg agattacagg  33540
catgatccaa cacgagttat cttttaatgg tagaaaaaca tgtaataaac attgagacgt  33600
tcctagcatc ccgattgagt gaagaggagg attacacgtg tgtgtcttgt ccattncctt  33660
gtgtgagtac attatggccc actcagtgca tgtgttggag gtggcgtctg tgggacagnc  33720
tatgcaagca tcagcctggt gagagcaaga gtagggtcct ggggggctga aggggagctt  33780
cccatgcctc actccaaatg ctgcaatgtg gtgacatccc agaaagagaa gcaccagcag  33840
aaatttatca ctcagttttc tatcctctgc tcttcttagt gcacttaatt ctaccaggct  33900
ccaaggaggt gaccagcttt cttcacatct ggtgctaatt atgctagctt ttgagaaata  33960
gcaccttttt ttttttcttt tgagaaaccc aagtgaatca tcgaggcctg atgatttgct  34020
acttcttgtg ctctgccccg cagggggtga tccccacgtt ccgcgtcaag ttcctgctgc  34080
ggctactgcg tgggaggctg gaggtggacc tggacaagga caagctcctg tttaagcaca  34140
tgtgctacga aatggagagg ctccacaatg gcggcgacgt caccttccat gatgtcctga  34200
ggtacaaggc aggctttcgc agggctgaat gggggccaga aaccacagct gtcagccttc  34260
aaggcctctg cagtacaatt aacaagtgtg tttccaaccc aaaatgccac atctgctgtg  34320
gtcgtgaagt ggggtcacat gtcccaggcg ctaagtgccc tttcctgccg tcctccagtg  34380
aacatttcca agtaggtgcc tcgcagggga gggctgggcg gctgtgccct gatgtcccgt  34440
agggacccct gcccactgag gtgcaccccg aggggagagg tggaagggat ctgggagagc  34500
acagtcccac cccttccctg tgatgcggga actgcccaga agagctgagt gacttgcttg  34560
cggttacagg gctctggcaa agctgggact aacatgcaga gcacctcact tgcatgggtc  34620
tgatgagaat ttgcctggcc tgctctgtga tggttgcccc gttggctaaa acaccagatt  34680
ttccagacat ttcatgagcg cccagacagg acagagggtc aaatggagtc tctgcctttt  34740
cttcttcctg ggagacttct gtatttgttt ccttgggcta ctgtaactta gcaccttaag  34800
ctgagggatt taaacaacag aaaggtatgg tctcgaagtc ctggatgctg gaagcccgag  34860
atggaggtat tgcggggctg attccttctg aggcctgtga gggagaatct agcctagcct  34920
ctcccctggc tgctggaggt gcgctgccaa tgttggtcat tccttggctt gtagaagcat  34980
cagcttggtc tcccttcatc ttcacatggc attctgtttg tgtgtgtgtg tgtgtgtgtg  35040
tgtgtgtgtg tatctatgtt caaattcctc cttttataag aacatctgtc gtattacatt  35100
aggagtccat tctactccac tgtgatctca ttttaactta attactaatt acatctgcaa  35160
tgttctattt ccaaataacc ttacgttctg aggtactaga ggttaggact ccaacatatc  35220
tttttttggg aggaaacatt taacccataa cagcttctta agcaggagtc catggataaa  35280
acagaggccc atggacttgc aagggggaaa caattacatc tttattttca ctaatcactc  35340
tttgaaatgt gtcattctct tccatgatga acgtaggcaa caaaccacag tcgcattagc  35400
aatatccatg tctttgttac caggagaaat catagatatt ttcagatgac ataactgact  35460
gccttgactg acatcttaaa atatcattta tgctcaccag tgcttctgag ttatggtagt  35520
catttgagct ctgctagatg gtattattta atggaataat aaaggaagca cttacttatg  35580
ttactttatc actgccgttt taaagtaaat ttgagaattg tattttaata taattggttt  35640
cctttgtaat acggtgtatt tcattccgtg catttaaagc attatttcaa gaaatgtccc  35700
ataagctcca ctgccacagg ggtccatgcc acagaaaaaa ataagagcga ctgactagca  35760
gtagctattt taatcacata gcagtaccta caaggagtgt gtgggatatt gtgttgtgtc  35820
tcaaatttca ggagaactca ggtgtacaga aatatgcttg tggccagaag ctgaaaaaaa  35880
aaaaggatca gatcagcaca ggaagaatct gggaaaagtt ctctcaagtt atcaatttca  35940
cctcccacta tccagttctt ccaccaacaa gctaaaaagc agaaaaacat gggacggaga  36000
aatgcatgtg aatcacaaag gaggtcatct ctgtcagaat gtttctgagt ctttcctcct  36060
agtggcaaat ttttttggtt gacatgaggc agataggcat actgttgtca ttaataatta  36120
atattcagcc tctttggaac acaccgatgt atctaataaa aatagaccca ggcaaaatct  36180
gtgatggggc tgtctctccc cttcctattt attcccctag cccagtatat gataaaaaca  36240
aacagtgaag ataaaagcaa tgaagctttg atgggattct tgatgagtca gggaagagag  36300
gaagagaaaa ttcatttttt ttccctctgt ggtgggaaga gatttagcaa agagaagccc  36360
aatgtaccag tgctctcaag agcctccagg ctgtgatttg ggctctagga tggaactgag  36420
ctcacagaag tgggtagctc acaggtgcac cagggtgcat gggtctgagc cataacctgg  36480
aatcctgtgg ctacacctgg gtgcatcaca ctgccaagag gggctgtctt ctcctctggt  36540
ggtggactgc tcagtccagg catcctggga gctgccttat tgccccatga actgtaatgc  36600
tgtgttggct ttacctacaa ctgcatgggc ctgctgtgtg tcaagggtta aatgggagtg  36660
gatattcaac cctgggtttg tttggtagcc tctgaaatta ataaggaaga ccaggcatgg  36720
tggctcacac ctgtaatccc agctctttgg gaggctgagg caggtggatc atttgaggtt  36780
aggagtttaa gaccagtttg accaacatgg tgaaaactcg tctctactaa aaatacaaaa  36840
ctagctgggc atggtggcac acacctgtaa tcccagctac ttgggaggct gaggcagaag  36900
aaatgcttga acccaggagg cggaggttgc agtgagctga cagcgcgcca ttacactcca  36960
gcctggtcaa caagagtgaa gctccatctc aaaaaaagaa aaaattaatt aataaggaag  37020
atacagaagg atgaatgaga gaaacagaga gggaagtggg atgcagggag tagggatgtg  37080
tgacgcacag ccgagcatat taaccatcac ctcggggggc taagtgtgaa gaaagtatgg  37140
gaggtgcggt cttccttctg cagagaaagt cgcgagcctt ttcctagcct ggatcttttg  37200
ctttacaggc acttagatgg cacttactac tataagagcc tcacagatat taactcactt  37260
agtcattaaa taaaggagtt accaggacta tctatcatct ttgttttaca gacgagggaa  37320
gggagacaca gagaggtgac aggaccagcc caagacatgc gggtggcgag gggtggcgtc  37380
aaaacactag acttattaga ctgagtgatg tcctctctgg attttgacgt atctaagggt  37440
gtaaatctca ggtgaatcag agctgcgatt gcaggtgtgt ttctcccacc agcatgcttt  37500
cataccggtc cgtggacatc cggaagagct tgcagctgga ggaactcctg gcgagggagc  37560
agctggagta caccatagag gaggaggtgg ccaagcagac catccgcatg tggctcaaga  37620
agtgcctgaa gcgcatcaga gctgtgagtg aactgcacac atgcaggttg ggtccccgcc  37680
ccgccccgcc ctgccccgca ggaggatgaa agaaaagagc ttcgtgaaca tgggattagc  37740
tccttctgtg atcagccttc tatcccttta aactatgtcc actacctcca cctacagtgg  37800
tcagatcatg atgcagactt tcactctagt ccacagtcag ccctgccctc tttagcagag  37860
tccattagga gtttccatgg aatcccattt ttataatatg acatgaagac ttaaaaagca  37920
gtttattggc caggtgtggt ggctcatgcc tgtaatccca gcactatgag aggtcaaggg  37980
gggagctcaa ctcacttgag gccaggagtt ggagaccagc ctgccaacat ggcaaaaccc  38040
catctctact aaaaatacaa aaattaacca ggcgtggcac acatgcctgt agtcccagct  38100
actcaggagg ctgaggcatg agaatcactt gaacctggga ggtagaagtt gcagtgagct  38160
gagatcatgc cactgcactc cagcctgggt gacacagtga gaatctgtct caaaaaaaaa  38220
aaaaaagttt attgatatta aaatatgatg tccatttatt aaactcaact gttcaaaatt  38280
ctagaatttt ccacatattg aatttgcaaa actactttaa attgctgcta aaaatttcaa  38340
caaactgtga taatgtcatt tattctgaaa agaccacctc tcaagattaa tgatgtttcc  38400
tgcttcctga cttataagcc tataagattc tctaactcat aaattaatga atgtatactg  38460
cattgacata tactgtattt acagtgaatg tttctatgag ataattactt ttatgaatgc  38520
ttttggcatg tttcacagac agggaaaaaa cccaaagcaa tcactaaaca tttatatata  38580
acagagattg tttcaatcct cttcctcaga gcaacaacgt caattgcaga aacatgtatt  38640
tctattggag gagaaaaggt tcccagagaa aagatacaac tcaacctcct atagcaaggc  38700
cagctgccca gtgatgtccc atcactgctg gccactgtag ctatgttagc tccagggatc  38760
aatctgtcct cctctggctc tgagagggca caaggagtcc tggctttagt atatgccgag  38820
acagactggt ctcctggatt gacctgaaaa cttcagaacc aagacaagca caaaggtttt  38880
ctcatccacc caaggctctt tgcctcttac aacttgcagg aaagtgggaa aggggttggg  38940
attgtattgg cttaatgagc ctagaataaa ataagaggag aaaaaataga atagccacat  39000
tagtaatttt aaataagaca taagctgggc acagtgtctc atgcctgtaa tcccagcaca  39060
ttgggaaact gaggcgggag gatcgcttaa gaccagaagt ttgaaactag cttgggcaac  39120
agagtgagac ctcctctctn gnaaaaaaaa aaaaaaaaaa aaaattaatt agccagccac  39180
agtcatgcac acttttagtc tcagcttctc aggaggctga ggcaggagca tagcttgagc  39240
ctaggagttt aaggttacag tgagctataa taatcgcacc actgaactct agtctacggg  39300
acatagtgag atcctatcta aaaaaaaaaa aaaaaaaaaa aancagaaaa caccaacaac  39360
aaaaagaaaa acaaataaat aaaatacaag catcaatgac cgtcactatt ctgattgtta  39420
cacaaatgaa aatggactgg gaagtcaatg catacctctc taagcccacc tttgcatcag  39480
cctaccttaa ttgaacattg aaattagttc aggatcctta cttggaaatt cctaagaggt  39540
cacccgtcat gcaggtctta ggagagggga gaagaaaata agatttgtgt ggcggtgggg  39600
caggcaggat gctgggctta ttttactgaa caaacaatcg catttccata gaaacagcag  39660
cagtcgtgca gtatcatcca cagcctgaga gagagtcagc agcaagagct gagccggttt  39720
ctgaacccgc ccagcatcga gaccacccag cccagtgagg acacgaatgc caacagtcag  39780
gacaacagca tgcaacctga ggtatgggca cgaggcgtcc tctgtcccag gacactctgt  39840
gggcttcttt cttttaataa aaataaataa aatgggtgct ggtcagatca ttcaaacaag  39900
gtgacaatat ttctaatagg aatattttca ttaaaaaaaa aaanggcaac ggaaatccat  39960
tgatccagat tatgtctatg tctttgccat cttggatgca gttgaggtta tttaaaaaga  40020
gtctgactca tatgaatgcc aaaaaaagtg aatgccctga acttcataat tctgtagttt  40080
tatttttgtc taaagagtta acatcagctc taagggctgc atttgaatct gggtatatta  40140
catggagtat ggtttacagg aagctctgcc ctaaatattt tcctcccttc tctaaagtca  40200
tagaaatttg cagtaaaatc agtgaaaatg tttgtaatta gctttcaacc tccttaaata  40260
atcagactca ttgaagatat atcctttcct ggttgggtat cagaagaaca tatggaattc  40320
aggacaattg gcttgaggag tttctattta ttaagtcaca gcatattttc attttcaaac  40380
tctatgtatg tgtctatata aaaaagtaca aggagttatc agcgtcctgg agagtcctgt  40440
gctgtgagaa gcagctggct gggaggacct gcccctttat gaggcagcaa ttacgatttg  40500
aggttaacaa cgtggagctg atcccgtgct ctgtgcagag cccccagcag caccaggctc  40560
catggtgtgc agcaacgcag ccaggggcca gagtaccttt ggaagcctaa ggctccacgg  40620
cccagcaggg tgctccagga ggcccactgg tgccatagct cagttttcag tagatctcat  40680
gttttgggct ccccagcctt tagaaatcat ctgccaccga ctgcagggac ttctgcggag  40740
ttagtcaacc aaggggcaag gggaggcatc tgcagtggcc ttgccactgg tcaccctgaa  40800
gatggttggc aatgtctcgc atgggagagg gaggcaggct gaagtcagga cagacagtga  40860
gacagggcta atgaggttgg agaaagtgat gatttcagag ccctctgttt ttagatgaaa  40920
aagcctaaga aagaaagagg tgacnnnaaa aaaaaaaaaa ggatactaaa gagatgtgaa  40980
gaccaaggct tttgttagga aagggagagg tgacaggtga acctgagaac aggtgaaatg  41040
tgtgggaagt cttggcatct ctctttcttt cactgtagct tagattgtta tcagctccat  41100
cctccaccag ggcccatcat acagctttgc ctgcagagaa ctctttccct gaagctctaa  41160
gtgtggatct ccaggctggt gacagtagac tgcccccgcc cagccggtcc ccactgcccc  41220
accttccttc ctgcagttcc ccttccttac cccctggttt gccagcgaag atatgaaggg  41280
aaacaatgac attctcaggc atggagggga acgaagcagt gggggttacc caggacaaga  41340
tgtcccagga agagtggtgt ctccttcagc agggcgtgca gtggtggctc tttttcttct  41400
gtgacccttt atacccattt tcacttttcc ccattgtgga cactctgagt ccatgttgtt  41460
cttcccactt gtcctcctgc catgtgtttt cctttcttat agtaaaagga ggagagcgca  41520
gggttaaaaa gacggtaact gtgtgcttct cctcccatgc agacaagcag ccagcagcag  41580
ctcctgagcc ccacgctgtc ggatcgagga ggaagtcggc aagatgcagc cgacgcaggg  41640
aaaccccaga ggaaatttgg gcagtggcgt ctgccctcag gtaggtccat ccaggcattt  41700
ctccagcgat cgaggcattt taaaggtatt tactctgttt gtgtgttttg ggtcttgcct  41760
ttcaaaatgc aagtctgcat ctacagttgt ttacagacag caacataatg aaaaatgtag  41820
tcttgtcaaa aacattgtcc cccaaaataa cttctctaaa tatgacttac attagccccc  41880
attttccggg tacatttcag gctatcatgg ttgagaagcc agcacctatg aaaaagacaa  41940
gattcagnaa gagggagaaa tttccaaggg ctttctgtgt gcctcaaggc atgctcaaac  42000
atgggcaaaa gtattcaact gaagagggag tgggcagatg caatcattca gaaaatgcca  42060
cgaagttctc aaaaaaggga caggcccccg atttctctca gcacactttg cagctgagcc  42120
ggtcactggc tttaggcaag ctgctttacc tccatacaat aacaannnnc aacaacaaac  42180
acttacgtag tactcactgt atgccagtca ctcttctaag tgcattactt gtgttctctc  42240
attcaatcct ttaataaaca gtcccattat tttccatatt ttactgattc agtaagagaa  42300
ttttcttcta tgagcttctt ctctataggg ttttggaaag ccaggataat cccattaaga  42360
gcactcagga atsgagggag agcaatgctc cccacagccc agtgtccttg tacatgtttt  42420
tttctataga taactaagtt catgctaaag caggagcttt ataatgctct ttaactgtgc  42480
cccaacttca gcccaattga aaggagaaga tgtgtagcat atgtgttcca caaagcagat  42540
gacagcacag cttacatttt gaggctgacg atgttcagtg ggtcttcact gggactacca  42600
ccaaggaaag tatccccttt catatccagg aacttatttt tcagagatca gagaagatct  42660
aggttcctcc tgattcaaac acagcagaga atgacagcat caagacaacg tagatggtgg  42720
tgccaggtca taaattacaa gctgagtcgg ttcaatttta tcctgtaggc aattaggagc  42780
tagcaaagat ttctgagcag tatgtgactt ttggaatctg tgctttagga agttgacttg  42840
gcagcaaagg agggaattgt ctatgacaga gcctggaggc aggttacaag ctggaggaag  42900
ttaccgtggt gtgagcacaa ggcaacaaag gcatggacag agctgggggc cagatactgc  42960
agggacagat aggagaggtg acctggggag aatgcacagt ccttggtatt catttaaatg  43020
gacaaaagaa atgatgctgt caaaagtact tccattgggc caggcgcagt ggctcacccc  43080
tgtaatccca gcactttggg aggccgaggc aggtggatca tttgaggcct ggagttcaag  43140
accagcctgg tcaacatggt gaaaccctgt ctctactaaa aatacaaaaa ttagctgacc  43200
ggtagtggtg tgcacctgta atcccagctg cttgggaggc tgaggcagga gaatcacttg  43260
agcctgggaa gcagaggttg tggtgaacca agattgtgcc gctgcactcc tgtctgggtg  43320
agagagtgag aacctgtctc ccaaaaaaaa aaaaaaaaaa aaaaaaaaaa nngtacttcc  43380
actggtccat gcctaggtgg tccccaccaa aaacggtgat cgtgaaatag acatgctctt  43440
ggggtcaggc tgagtttgag gaggcagagg agaagaaaaa tagtattttg agggggcagc  43500
aacaatgtca caggtgtcat gctatgcact ttcctaagtc atctcatgta acctgtttta  43560
atcctgacaa tagtctaatt aggacatttt cattgtcttc atcttacaat ggaggaaact  43620
tgggttcaga gacgtgaagt tgcccatagc tacatatcca caggttgcag aggtgggtcc  43680
caacaccatg actgtgaggc cccagaacca cacctttcct cccataccct cactgcatcc  43740
cccctcgcct ttactgtggg tcacactctc cttccttttt gtttttttta ttgcatatgc  43800
taatgaatgc acaggtttct gtgacactta atagttcccg aattggaatt tttttagtga  43860
ttttctagtt tttttaatta tttcaaaatg aaaggggtga gcagcacgtt tttttcccaa  43920
atgacatcat tagttgtcca tgagcacaat taaaaaaaaa atctatcgtg aacataaaga  43980
atcaagtcct gaaaaggatg tttacttagc atctgtggct aggacacgtt agccaaaagt  44040
atcactgatg ggaatatcat gggtttttag gagtgattac aatagggtga agcaatacca  44100
agtggctcat aggactcatt aattccacag ccccaaaacc aataagccat tcagtgtcct  44160
cagtcaactt acggtttgga ggaaggacaa ccatgaaatc tgtcgtgtgc aaaatgaacc  44220
ccatgactga cgcggcttcc tgcggttctg aagttaagaa gtggtggacc cggcagctga  44280
ctgtggagag cgacgaaagt ggggatgacc ttctggatat ttaggtggat gtcaatgtag  44340
atgaatttct agtggtggaa accgttttct aataatgtcc ttgattgtcc agtgagcaat  44400
ctgtaattga tctataactg aattccagct tgtcacaaga tgtttataaa ttgattttca  44460
tcctgccaca gaaaggcata agctgcatgt atgatgggtt actatcaatc attgctcaaa  44520
aaaatttttg tataatgaca gtactgataa tattagaaat gataccgcaa gcaaatgtat  44580
atcacttaaa aatgtcatat attctgtctg cgtaaactaa ggtatatatt catatgtgct  44640
ctaatgcagt attatcaccg ccccgcaaaa gagtgctaag cccaaagtgg ctgatattta  44700
gggtacaggg gttatagctt tagttcacat ctttcccatt tccactagaa atatttctct  44760
tgagagaatt tattatttat gattgatctg aaaaggtcag cactgaactt atgctaaaat  44820
gatagtagtt ttacaaacta cagattctga attttaaaaa gtatcttctt tttctcgtgt  44880
tatattttta aatatacaca agacatttgg tgaccagaac aagttgattt ctgtcctcag  44940
ttatgttaat gaaactgttg cctccttcta agaaaattgt gtgtgcaagc accaggcaaa  45000
gaaatggact caggatgctt agcggtttaa aacaaacctg tagataaatc acttgagtga  45060
catagttgcg caaagatgtt aagtttctta agaaaccttt taataactga gtttagcaaa  45120
aagaataaaa ctatatagct caatttattt aaaaaaatct ttgcatgtgt gatgttatca  45180
ttggcttcat ttcttaccca aggtatgtct gttttgccat aaatcagcag agtcatttca  45240
ttctgggtga tcctaacaca ccattgctat gttagatttg aaatgacatc tctgttaaaa  45300
gaatcttcta tggaaataat ggtgccctgc aaaatcttcc tctgaactca caggttaggg  45360
atcacacaac ttacttaatc gttttttgtt tttgtttttt ttccttatat gtcaatggcc  45420
catgtcctcc gggaaaatta gaaaagcaaa atgattacaa agtgctgtta gatttcttgt  45480
gctgggccag ccaagtagaa gtggacttga cttggacctt taactatttt attacagatt  45540
ggacatttgc tgttcagatg ttttttaaca gagggattat ctcagaatcc tgtgacctcc  45600
aggttgtttt ataatctatt tttctctatt taacattcct cagatagata ggcaaatagg  45660
acattccttc tgtgtcacag aagtatcgtg gtagtggcag tctacagttt atatgattca  45720
ttgtaactat gagataaaga acaaccagtc atgtggccaa aaggattaga tttgatttga  45780
tgttcacttg gagtttactt tttgtacata caagataaaa taaatattgg atttgtaaaa  45840
taatttactc tgagttgacc atttttaaac ccttttcttg gtggggcagg cactcggtag  45900
cagcacattg caaacctgga ttgaatattc agtccataat tagttggcaa aagctgtgtc  45960
cctgatactc atttcaactc aattctctga gccagaatgt tcctttcaca cttgtgctga  46020
taaggctgag tgaataccct gtgccctcta agcctacaat gaacagaaaa ggcacttaca  46080
ggtccagggc atgggtctgt actagtgctg cataaaaaca agatgttttt ggctcattac  46140
acttgagtaa tacagcttca ttctcacgaa actgctgagc cctttctaaa acgtctggaa  46200
ttgatgttca gcagaacatc attgttgttc attctgcagt gaagccaggg gcagaatacc  46260
aatgtattta aagccatagc accctatatt ttcaatgaag cgaaacagtc acacacttcc  46320
tgtaggactc ctctctacga ttttcctgaa acaggtagag catatgcaag ccagagaaat  46380
taagcgccac ccccatttag attttacccc tagatatgta aacatatgaa aaatcccatt  46440
acacagatgg gaaaacttgg gtcacagtgt tccctggtcc gtagggaagc cagacactga  46500
tactaatcct gtcatcacgc cacccactgc ctttaattag agggtgctgt cagttccaaa  46560
ggcaccagaa agcatatggg gtggaatact tacttgactc agagcccctg agagagcagg  46620
ccacacatgt gtgacctgta tggcacttca aggagactca aagggaacaa ggatggacag  46680
aatggaaggg ccaatgctat tcactctann nnnnnnnnnn tttttttttt ttttttgaga  46740
cggagtcttg ctctgtcacc caggctggag tgcagtggca cgatctcggc tcactgcaag  46800
ctccacctcc cgggttcaca ccattctcct gcctcagcct cccaattagc tgggactaca  46860
ggtgcccgcc accatgccca gctaattttt ttgtattttt agtagagacg gggtttcacc  46920
atgttagcca ggatggtctc gatctcctga cctcgtgatc cacccgcctc ggcctcccaa  46980
agtgctggga ttacaggcgt gagccaccgt gcccggccca ctctattctt aatggtactt  47040
ccagaccaac atacatcagc agtgtctggc tggctgtgcc ttggccaagc tgaatgagat  47100
aagggtacat agaagaaaaa ccagtgttat aaagccttac aggaaagcag ctttaagcca  47160
gtggaatgat gtgtttgcct gtttccttgt aggaagtggc attctataca tgggtggttt  47220
tcagtatatc agtaagcagt ggaactgttt ctaaggcctt caacagatcc caaaatttta  47280
accagccaaa agccaggcag ccctcgttga agttgaggtg aagatgaaaa cggcactcat  47340
gtggtctctt ctcacccact attatgggtt gaagtgtgac ccccagaagg ataggttgaa  47400
gtcctaaccc ttagtacctg tgaatatgac cttattagga aatagggtct tcgcagatat  47460
aattacttat gaggaggtca tactagagga gggtaatccc ttactccaac atacctggta  47520
tcctctgaag acacaggcat gtggggagga tggccatgag acggtgaagg cagaggcatc  47580
ggagctatgc tgcccagagc caagggacac ctgggctacc agaagctgca agaggcaagg  47640
aaggcgcctc ccagaggctt ctaagggaga atggccccct gtcaacacct tgattctgga  47700
cttctagcca gaagaactgt gagaacatac atttctgttg ttttaagctg cccagtttgt  47760
ctgctttttt atcattttat cattttagtt ttttagttta gtctctgtct tctactaact  47820
ccctttccaa ttctacttta g                                            47841
<210>4
<211>6799
<212>DNA
<213>智人(Homo sapiens)
<220>
<221>5’UTR
<222>1..65
<220>
<221>CDS
<222>66..5282
<220>
<221>3’UTR
<222>5283..6799
<220>
<221>polyA_signal
<222>6081..6086
<220>
<221>polyA_signal
<222>6777..6782
<220>
<221>allele
<222>1658
<223>99-79316-158:多态性碱基C或T
<220>
<221>allele
<222>4481
<223>99-79310-29:多态性碱基A或C
<400>4
gacagctctg agcgctgggg ttacagactg tggttttgtg cttgctcacc aaagctaacc     60
tcagc atg ctc aaa agg aag cag agt tcc agg gtg gaa gcc cag cca gtc    110
      Met Leu Lys Arg Lys Gln Ser Ser Arg Val Glu Ala Gln Pro Val
      1               5                   10                  15
act gac ttt ggt cct gat gag tct ctg tcg gat aat gct gac atc ctc      158
Thr Asp Phe Gly Pro Asp Glu Ser Leu Ser Asp Asn Ala Asp Ile Leu
                20                  25                  30
tgg att aac aaa cca tgg gtt cac tct ttg ctg cgc atc tgt gcc atc      206
Trp Ile Asn Lys Pro Trp Val His Ser Leu Leu Arg Ile Cys Ala Ile
            35                  40                  45
atc agc gtc att tct gtt tgt atg aat acg cca atg acc ttc gag cac      254
Ile Ser Val Ile Set Val Cys Met Asn Thr Pro Met Thr Phe Glu His
        50                  55                  60
tat cct cca ctt cag tat gtg acc ttc act ttg gat aca tta ttg atg      302
Tyr Pro Pro Leu Gln Tyr Val Thr Phe Thr Leu Asp Thr Leu Leu Met
    65                  70                  75
ttt ctc tac acg gca gag atg ata gca aaa atg cac atc cgg ggc att      350
Phe Leu Tyr Thr Ala Glu Met Ile Ala Lys Met His Ile Arg Gly Ile
80                  85                  90                  95
gtc aag ggg gat agt tcc tat gtg aaa gat cgc tgg tgt gtt ttt gat      398
Val Lys Gly Asp Ser Ser Tyr Val Lys Asp Arg Trp Cys Val Phe Asp
                100                 105                 110
gga ttt atg gtc ttt tgc ctt tgg gtt tct ttg gtg cta cag gtg ttt      446
Gly Phe Met Val Phe Cys Leu Trp Val Ser Leu Val Leu Gln Val Phe
            115                 120                 125
gaa att gct gat ata gtt gat cag atg tca cct tgg ggc atg ttg cgg      494
Glu Ile Ala Asp Ile Val Asp Gln Met Set Pro Trp Gly Met Leu Arg
        130                 135                 140
att cca cgg cca ctg att atg atc cga gca ttc cgg att tat ttc cga      542
Ile Pro Arg Pro Leu Ile Met Ile Arg Ala Phe Arg Ile Tyr Phe Arg
    145                 150                 155
ttt gaa ctg cca agg acc aga att aca aat att tta aag cga tcg gga      590
Phe Glu Leu Pro Arg Thr Arg Ile Thr Asn Ile Leu Lys Arg Ser Gly
160                 165                 170                 175
gaa caa ata tgg agt gtt tcc att ttt cta ctt ttc ttt cta ctt ctt      638
Glu Gln Ile Trp Ser Val Ser Ile Phe Leu Leu Phe Phe Leu Leu Leu
                180                 185                 190
tat gga att tta gga gtt cag atg ttt gga aca ttt act tat cac tgt      686
Tyr Gly Ile Leu Gly Val Gln Met Phe Gly Thr Phe Thr Tyr His Cys
            195                 200                 205
gtt gta aat gac aca aag cca ggg aat gta acc tgg aat agt tta gct      734
Val Val Asn Asp Thr Lys Pro Gly Asn Val Thr Trp Asn Ser Leu Ala
        210                 215                 220
att cca gac aca cac tgc tca cca gag cta gaa gaa ggc tac cag tgc      782
Ile Pro Asp Thr His Cys Ser Pro Glu Leu Glu Glu Gly Tyr Gln Cys
    225                 230                 235
cca cct gga ttt aaa tgc atg gac ctt gaa gat ctg gga ctt agc agg      830
Pro Pro Gly Phe Lys Cys Met Asp Leu Glu Asp Leu Gly Leu Ser Arg
240                 245                 250                 255
caa gag ctg ggc tac agt ggc ttt aat gag ata gga act agt ata ttc      878
Gln Glu Leu Gly Tyr Ser Gly Phe Asn Glu Ile Gly Thr Ser Ile Phe
                260                 265                 270
acc gtc tat gag gcc gcc tca cag gaa ggc tgg gtg ttc ctc atg tac      926
Thr Val Tyr Glu Ala Ala Ser Gln Glu Gly Trp Val Phe Leu Met Tyr
            275                 280                 285
aga gca att gac agc ttt ccc cgt tgg cgt tcc tac ttc tat ttc atc      974
Arg Ala Ile Asp Set Phe Pro Arg Trp Arg Set Tyr Phe Tyr Phe Ile
        290                 295                 300
act ctc att ttc ttc ctc gcc tgg ctt gtg aag aac gtg ttt att gct     1022
Thr Leu Ile Phe Phe Leu Ala Trp Leu Val Lys Asn Val Phe Ile Ala
    305                 310                 315
gtt atc att gaa aca ttt gca gaa atc aga gta cag ttt caa caa atg     1070
Val Ile Ile Glu Thr Phe Ala Glu Ile Arg Val Gln Phe Gln Gln Met
320                 325                 330                 335
tgg gga tcg aga agc agc act acc tca aca gcc acc acc cag atg ttt     1118
Trp Gly Set Arg Set Set Thr Thr Set Thr Ala Thr Thr Gln Met Phe
                340                 345                 350
cat gaa gat gct gct gga ggt tgg cag ctg gta gct gtg gat gtc aac     1166
His Glu Asp Ala Ala Gly Gly Trp Gln Leu Val Ala Val Asp Val Asn
            355                 360                 365
aag ccc cag gga cgc gcc cca gcc tgc ctc cag aaa atg atg cgg tca     1214
Lys Pro Gln Gly Arg Ala Pro Ala Cys Leu Gln Lys Met Met Arg Ser
        370                 375                 380
tcc gtt ttc cac atg ttc atc ctg agc atg gtg acc gtg gac gtg atc     1262
Ser Val Phe His Met Phe Ile Leu Ser Met Val Thr Val Asp Val Ile
    385                 390                 395
gtg gcg gct agc aac tac tac aaa gga gaa aac ttc agg agg cag tac     1310
Val Ala Ala Ser Asn Tyr Tyr Lys Gly Glu Asn Phe Arg Arg Gln Tyr
400                 405                 410                 415
gac gag ttc tac ctg gcg gag gtg gct ttt aca gta ctt ttt gat ttg     1358
Asp Glu Phe Tyr Leu Ala Glu Val Ala Phe Thr Val Leu Phe Asp Leu
                420                 425                 430
gaa gca ctt ctg aag ata tgg tgt ttg gga ttt act gga tat att agc     1406
Glu Ala Leu Leu Lys Ile Trp Cys Leu Gly Phe Thr Gly Tyr Ile Ser
            435                 440                 445
tca tct ctc cac aaa ttc gaa cta cta ctc gta att gga act act ctt     1454
Set Set Leu His Lys Phe Glu Leu Leu Leu Val Ile Gly Thr Thr Leu
        450                 455                 460
cat gta tac cca gat ctt tat cat tca caa ttc acg tac ttt cag gtt     1502
His Val Tyr Pro Asp Leu Tyr His Set Gln Phe Thr Tyr Phe Gln Val
    465                 470                 475
ctc cga gta gtt cgg ctg att aag att tca cct gca tta gaa gac ttt     1550
Leu Arg Val Val Arg Leu Ile Lys Ile Ser Pro Ala Leu Glu Asp Phe
480                 485                 490                 495
gtg tac aag ata ttt ggt cct gga aaa aag ctt ggg agt ttg gtt gta     1598
Val Tyr Lys Ile Phe Gly Pro Gly Lys Lys Leu Gly Ser Leu Val Val
                500                 505                 510
ttt act gcc agc ctc ttg att gtt atg tca gca att agt ttg cag atg     1646
Phe Thr Ala Ser Leu Leu Ile Val Met Ser Ala Ile Ser Leu Gln Met
            515                 520                 525
ttc tgc ttt gty gaa gaa ctg gac aga ttt act acg ttt ccg agg gca     1694
Phe Cys Phe Val Glu Glu Leu Asp Arg Phe Thr Thr Phe Pro Arg Ala
        530                 535                 540
ttt atg tcc atg ttc cag atc ctc acc cag gaa gga tgg gtg gac gta     1742
Phe Met Ser Met Phe Gln Ile Leu Thr Gln Glu Gly Trp Val Asp Val
    545                 550                 555
atg gac caa act cta aat gct gtg gga cat atg tgg gca ccc gtg gtt     1790
Met Asp Gln Thr Leu Asn Ala Val Gly His Met Trp Ala Pro Val Val
560                 565                 570                 575
gcc atc tat ttc att ctc tat cat ctt ttt gcc act ctg atc ctc ctg     1838
Ala Ile Tyr Phe Ile Leu Tyr His Leu Phe Ala Thr Leu Ile Leu Leu
                580                 585                 590
agt ttg ttt gtt gct gtt att ttg gac aac tta gaa ctt gat gaa gac     1886
Ser Leu Phe Val Ala Val Ile Leu Asp Asn Leu Glu Leu Asp Glu Asp
            595                 600                 605
cta aag aag ctt aaa caa tta aag caa agt gaa gca aat gcg gac acc     1934
Leu Lys Lys Leu Lys Gln Leu Lys Gln Ser Glu Ala Asn Ala Asp Thr
        610                 615                 620
aaa gaa aag ctc cct tta cgc ctg cga atc ttt gaa aaa ttt cca aac     1982
Lys Glu Lys Leu Pro Leu Arg Leu Arg Ile Phe Glu Lys Phe Pro Asn
    625                 630                 635
aga cct caa atg gtg aaa atc tca aag ctt cct tca gat ttt aca gtt     2030
Arg Pro Gln Met Val Lys Ile Ser Lys Leu Pro Ser Asp Phe Thr Val
640                 645                 650                 655
cct aaa atc agg gag agt ttt atg aag cag ttt att gac cgc cag caa     2078
Pro Lys Ile Arg Glu Set Phe Met Lys Gln Phe Ile Asp Arg Gln Gln
                660                 665                 670
cag gac aca tgt tgc ctc ctg aga agc ctc ccg acc acc tct tcc tcc     2126
Gln Asp Thr Cys Cys Leu Leu Arg Ser Leu Pro Thr Thr Ser Ser Ser
            675                 680                 685
tcc tgc gac cac tcc aaa cgc tca gca att gag gac aac aaa tac atc     2174
Ser Cys Asp His Ser Lys Arg Ser Ala Ile Glu Asp Asn Lys Tyr Ile
        690                 695                 700
gac caa aaa ctt cgc aag tct gtt ttc agc atc agg gca agg aac ctt     2222
Asp Gln Lys Leu Arg Lys Ser Val Phe Ser Ile Arg Ala Arg Asn Leu
    705                 710                 715
ctg gaa aag gag acc gca gtc act aaa atc tta aga gct tgc acc cga     2270
Leu Glu Lys Glu Thr Ala Val Thr Lys Ile Leu Arg Ala Cys Thr Arg
720                 725                 730                 735
cag cgc atg ctg agc gga tca ttt gag ggg cag ccc gca aag gag agg     2318
Gln Arg Met Leu Ser Gly Ser Phe Glu Gly Gln Pro Ala Lys Glu Arg
                740                 745                 750
tca atc ctc agc gtg cag cat cat atc cgc caa gag cgc agg tca cta     2366
Ser Ile Leu Ser Val Gln His His Ile Arg Gln Glu Arg Arg Ser Leu
            755                 760                 765
aga cat gga tca aac agc cag agg atc agc agg gga aaa tct ctt gaa     2414
Arg His Gly Ser Asn Ser Gln Arg Ile Ser Arg Gly Lys Ser Leu Glu
        770                 775                 780
act ttg act caa gat cat tcc aat aca gtg aga tat aga aat gca caa     2462
Thr Leu Thr Gln Asp His Ser Asn Thr Val Arg Tyr Arg Asn Ala Gln
    785                 790                 795
aga gaa gac agt gaa ata aag atg att cag gaa aaa aag gag caa gca     2510
Arg Glu Asp Ser Glu Ile Lys Met Ile Gln Glu Lys Lys Glu Gln Ala
800                 805                 810                 815
gag atg aaa agg aaa gtg caa gaa gag gaa ctc aga gag aac cac cca     2558
Glu Met Lys Arg Lys Val Gln Glu Glu Glu Leu Arg Glu Asn His Pro
                820                 825                 830
tac ttc gat aag cca ctg ttc att gtc ggg cga gaa cac agg ttc aga     2606
Tyr Phe Asp Lys Pro Leu Phe Ile Val Gly Arg Glu His Arg Phe Arg
            835                 840                 845
aac ttt tgc cgg gtg gtg gtc cga gca cgc ttc aac gca tct aaa aca     2654
Asn Phe Cys Arg Val Val Val Arg Ala Arg Phe Asn Ala Ser Lys Thr
        850                 855                 860
gac cct gtc aca gga gct gtg aaa aat aca aag tac cat caa ctt tat     2702
Asp Pro Val Thr Gly Ala Val Lys Asn Thr Lys Tyr His Gln Leu Tyr
    865                 870                 875
gat ttg ctg gga ttg gtc act tac ctg gac tgg gtc atg atc atc gta     2750
Asp Leu Leu Gly Leu Val Thr Tyr Leu Asp Trp Val Met Ile Ile Val
880                 885                 890                 895
acc atc tgc tct tgc att tcc atg atg ttt gag tcc ccg ttt cga aga     2798
Thr Ile Cys Ser Cys Ile Ser Met Met Phe Glu Ser Pro Phe Arg Arg
                900                 905                 910
gtc atg cat gca cct act ttg cag att gct gag tat gtg ttt gtg ata     2846
Val Met His Ala Pro Thr Leu Gln Ile Ala Glu Tyr Val Phe Val Ile
            915                 920                 925
ttc atg agc att gag ctt aat ctg aag att atg gca gat ggc tta ttt     2894
Phe Met Ser Ile Glu Leu Asn Leu Lys Ile Met Ala Asp Gly Leu Phe
        930                 935                 940
ttc act cca act gct gtc atc agg gac ttc ggt gga gta atg gac ata     2942
Phe Thr Pro Thr Ala Val Ile Arg Asp Phe Gly Gly Val Met Asp Ile
    945                 950                 955
ttt ata tat ctt gtg agc ttg ata ttt ctt tgt tgg atg cct caa aat     2990
Phe Ile Tyr Leu Val Ser Leu Ile Phe Leu Cys Trp Met Pro Gln Asn
960                 965                 970                 975
gta cct gct gaa tcg gga gct cag ctt cta atg gtc ctt cgg tgc ctg     3038
Val Pro Ala Glu Ser Gly Ala Gln Leu Leu Met Val Leu Arg Cys Leu
                980                 985                 990
aga cct ctg cgc ata ttc aaa ctg gtg ccc cag atg agg aaa gtt gtt     3086
Arg Pro Leu Arg Ile Phe Lys Leu Val Pro Gln Met Arg Lys Val Val
            995                 1000                1005
cga gaa ctt ttc agc ggc ttc aag gaa att ttt ttg gtc tcc att ctt     3134
Arg Glu Leu Phe Ser Gly Phe Lys Glu Ile Phe Leu Val Ser Ile Leu
        1010                1015                1020
ttg ctg aca tta atg ctc gtt ttt gca agc ttt gga gtt cag ctt ttt     3182
Leu Leu Thr Leu Met Leu Val Phe Ala Ser Phe Gly Val Gln Leu Phe
    1025                1030                1035
gct gga aaa ctg gcc aag tgc aat gat ccc aac att att aga agg gaa     3230
Ala Gly Lys Leu Ala Lys Cys Asn Asp Pro Asn Ile Ile Arg Arg Glu
1040                1045                1050                1055
gat tgc aat ggc ata ttc aga att aat gtc agt gtg tca aag aac tta     3278
Asp Cys Asn Gly Ile Phe Arg Ile Asn Val Ser Val Ser Lys Asn Leu
                1060                1065                1070
aat tta aaa ttg agg cct gga gag aaa aaa cct gga ttt tgg gtg ccc     3326
Asn Leu Lys Leu Arg Pro Gly Glu Lys Lys Pro Gly Phe Trp Val Pro
            1075                1080                1085
cgt gtt tgg gcg aat cct cgg aac ttt aat ttc gac aat gtg gga aac     3374
Arg Val Trp Ala Asn Pro Arg Asn Phe Asn Phe Asp Asn Val Gly Asn
        1090                1095                1100
gct atg ctg gcg ttg ttt gaa gtt ctc tcc ttg aaa ggc tgg gtg gaa     3422
Ala Met Leu Ala Leu Phe Glu Val Leu Ser Leu Lys Gly Trp Val Glu
    1105                1110                1115
gtg aga gat gtt att att cat cgt gtg ggg ccg atc cat gga atc tat     3470
Val Arg Asp Val Ile Ile His Arg Val Gly Pro Ile His Gly Ile Tyr
1120                1125                1130                1135
att cat gtt ttt gta ttc ctg ggt tgc atg att gga ctg acc ctt ttt     3518
Ile His Val Phe Val Phe Leu Gly Cys Met Ile Gly Leu Thr Leu Phe
                1140                1145                1150
gtt gga gta gtt att gct aat ttc aat gaa aac aag ggg acg gct ttg     3566
Val Gly Val Val Ile Ala Asn Phe Asn Glu Asn Lys Gly Thr Ala Leu
            1155                1160                1165
ctg acc gtc gat cag aga aga tgg gaa gac ctg aag agc cga ctg aag     3614
Leu Thr Val Asp Gln Arg Arg Trp Glu Asp Leu Lys Ser Arg Leu Lys
        1170                1175                1180
atc gca cag cct ctt cat ctc ccg cct cgc ccg gat aat gat ggt ttt     3662
Ile Ala Gln Pro Leu His Leu Pro Pro Arg Pro Asp Asn Asp Gly Phe
    1185                1190                1195
aga gct aaa atg tat gac ata acc cag cat cca ttt ttt aag agg aca     3710
Arg Ala Lys Met Tyr Asp Ile Thr Gln His Pro Phe Phe Lys Arg Thr
1200                1205                1210                1215
atc gca tta ctc gtc ctg gcc cag tcg gtg ttg ctc tct gtc aag tgg     3758
Ile Ala Leu Leu Val Leu Ala Gln Ser Val Leu Leu Ser Val Lys Trp
                1220                1225                1230
gac gtc gag gac ccg gtg acc gta cct ttg gca aca atg tca gtt gtt     3806
Asp Val Glu Asp Pro Val Thr Val Pro Leu Ala Thr Met Ser Val Val
            1235                1240                1245
ttc acc ttc atc ttt gtt ctg gag gtt acc atg aag atc ata gca atg     3854
Phe Thr Phe Ile Phe Val Leu Glu Val Thr Met Lys Ile Ile Ala Met
        1250                1255                1260
tcg cct gct ggc ttc tgg caa agc aga aga aac cga tac gat ctc ctg     3902
Ser Pro Ala Gly Phe Trp Gln Ser Arg Arg Asn Arg Tyr Asp Leu Leu
    1265                1270                1275
gtg acg tcg ctt ggc gtt gta tgg gtg gtg ctt cac ttt gcc ctc ctg     3950
Val Thr Ser Leu Gly Val Val Trp Val Val Leu His Phe Ala Leu Leu
1280                1285                1290                1295
aat gca tat act tac atg atg ggc gct tgt gtg att gta ttt agg ttt     3998
Asn Ala Tyr Thr Tyr Met Met Gly Ala Cys Val Ile Val Phe Arg Phe
                1300                1305                1310
ttc tcc atc tgt gga aaa cat gta acg cta aag atg ctc ctc ttg aca     4046
Phe Ser Ile Cys Gly Lys His Val Thr Leu Lys Met Leu Leu Leu Thr
            1315                1320                1325
gtg gtc gtc agc atg tac aag agc ttc ttt atc ata gta ggc atg ttt     4094
Val Val Val Ser Met Tyr Lys Ser Phe Phe Ile Ile Val Gly Met Phe
        1330                1335                1340
ctc ttg ctg ctg tgt tac gct ttt gct gga gtt gtt tta ttt ggt act     4142
Leu Leu Leu Leu Cys Tyr Ala Phe Ala Gly Val Val Leu Phe Gly Thr
    1345                1350                1355
gtg aaa tat ggg gag aat att aac agg cat gca aat ttt tct tcg gct     4190
Val Lys Tyr Gly Glu Asn Ile Asn Arg His Ala Asn Phe Ser Ser Ala
1360                1365                1370                1375
gga aaa gct att acc gta ctg ttc cga att gtc aca ggt gaa gac tgg     4238
Gly Lys Ala Ile Thr Val Leu Phe Arg Ile Val Thr Gly Glu Asp Trp
                1380                1385                1390
aac aag att atg cat gac tgt atg gtt cag cct ccg ttt tgt act cca     4286
Asn Lys Ile Met His Asp Cys Met Val Gln Pro Pro Phe Cys Thr Pro
            1395                1400                1405
gat gaa ttt aca tac tgg gca aca gac tgt gga aat tat gct ggg gca     4334
Asp Glu Phe Thr Tyr Trp Ala Thr Asp Cys Gly Asn Tyr Ala Gly Ala
        1410                1415                1420
ctt atg tat ttc tgt tca ttt tat gtc atc att gcc tac atc atg cta     4382
Leu Met Tyr Phe Cys Ser Phe Tyr Val Ile Ile Ala Tyr Ile Met Leu
    1425                1430                1435
aat ctg ctt gta gcc ata att gtg gag aat ttc tcc ttg ttt tat tcc     4430
Asn Leu Leu Val Ala Ile Ile Val Glu Asn Phe Ser Leu Phe Tyr Ser
1440                1445                1450                1455
act gag gag gac cag ctt tta agt tac aat gat ctt cgc cac ttt caa     4478
Thr Glu Glu Asp Gln Leu Leu Ser Tyr Asn Asp Leu Arg His Phe Gln
                1460                1465                1470
atm ata tgg aac atg gtg gat gat aaa aga gag ggg gtg atc ccc acg     4526
Ile Ile Trp Asn Met Val Asp Asp Lys Arg Glu Gly Val Ile Pro Thr
            1475                1480                1485
ttc cgc gtc aag ttc ctg ctg cgg cta ctg cgt ggg agg ctg gag gtg     4574
Phe Arg Val Lys Phe Leu Leu Arg Leu Leu Arg Gly Arg Leu Glu Val
        1490                1495                1500
gac ctg gac aag gac aag ctc ctg ttt aag cac atg tgc tac gaa atg     4622
Asp Leu Asp Lys Asp Lys Leu Leu Phe Lys His Met Cys Tyr Glu Met
    1505                1510                1515
gag agg ctc cac aat ggc ggc gac gtc acc ttc cat gat gtc ctg agc     4670
Glu Arg Leu His Asn Gly Gly Asp Val Thr Phe His Asp Val Leu Ser
1520                1525                1530                1535
atg ctt tca tac cgg tcc gtg gac atc cgg aag agc ttg cag ctg gag     4718
Met Leu Ser Tyr Arg Ser Val Asp Ile Arg Lys Ser Leu Gln Leu Glu
                1540                1545                1550
gaa ctc ctg gag agg gag cag ctg gag tac acc ata gag gag gag gtg     4766
Glu Leu Leu Ala Arg Glu Gln Leu Glu Tyr Thr Ile Glu Glu Glu Val
            1555                1560                1565
gcc aag cag acc atc cgc atg tgg ctc aag aag tgc ctg aag cgc atc     4814
Ala Lys Gln Thr Ile Arg Met Trp Leu Lys Lys Cys Leu Lys Arg Ile
        1570                1575                1580
aga gct aaa cag cag cag tcg tgc agt atc atc cac agc ctg aga gag     4862
Arg Ala Lys Gln Gln Gln Ser Cys Ser Ile Ile His Ser Leu Arg Glu
    1585                1590                1595
agt cag cag caa gag ctg agc cgg ttt ctg aac ccg ccc agc atc gag     4910
Ser Gln Gln Gln Glu Leu Ser Arg Phe Leu Asn Pro Pro Ser Ile Glu
1600                1605                1610                1615
acc acc cag ccc agt gag gac acg aat gcc aac agt cag gac aac agc     4958
Thr Thr Gln Pro Ser Glu Asp Thr Asn Ala Asn Ser Gln Asp Asn Ser
                1620                1625                1630
atg caa cct gag aca agc agc cag cag cag ctc ctg agc ccc acg ctg     5006
Met Gln Pro Glu Thr Ser Ser Gln Gln Gln Leu Leu Ser Pro Thr Leu
            1635                1640                1645
tcg gat cga gga gga agt cgg caa gat gca gcc gac gca ggg aaa ccc     5054
Ser Asp Arg Gly Gly Ser Arg Gln Asp Ala Ala Asp Ala Gly Lys Pro
        1650                1655                1660
cag agg aaa ttt ggg cag tgg cgt ctg ccc tca gcc cca aaa cca ata     5102
Gln Arg Lys Phe Gly Gln Trp Arg Leu Pro Ser Ala Pro Lys Pro Ile
    1665                1670                1675
agc cat tca gtg tcc tca gtc aac tta cgg ttt gga gga agg aca acc     5150
Ser His Ser Val Ser Ser Val Asn Leu Arg Phe Gly Gly Arg Thr Thr
1680                1685                1690                1695
atg aaa tct gtc gtg tgc aaa atg aac ccc atg act gac gcg gct tcc     5198
Met Lys Ser Val Val Cys Lys Met Asn Pro Met Thr Asp Ala Ala Ser
                1700                1705                1710
tgc ggt tct gaa gtt aag aag tgg tgg acc cgg cag ctg act gtg gag     5246
Cys Gly Ser Glu Val Lys Lys Trp Trp Thr Arg Gln Leu Thr Val Glu
            1715                1720                1725
agc gac gaa agt ggg gat gac ctt ctg gat att tag gtggatgtca          5292
Ser Asp Glu Ser Gly Asp Asp Leu Leu Asp Ile  *
        1730                1735
atgtagatga atttctagtg gtggaaaccg ttttctaata atgtccttga ttgtccagtg   5352
agcaatctgt aattgatcta taactgaatt ccagcttgtc acaagatgtt tataaattga   5412
ttttcatcct gccacagaaa ggcataagct gcatgtatga tgggttacta tcaatcattg   5472
ctcaaaaaaa tttttgtata atgacagtac tgataatatt agaaatgata ccgcaagcaa   5532
atgtatatca cttaaaaatg tcatatattc tgtctgcgta aactaaggta tatattcata   5592
tgtgctctaa tgcagtatta tcaccgcccc gcaaaagagt gctaagccca aagtggctga   5652
tatttagggt acaggggtta tagctttagt tcacatcttt cccatttcca ctagaaatat   5712
ttctcttgag agaatttatt atttatgatt gatctgaaaa ggtcagcact gaacttatgc   5772
taaaatgata gtagttttac aaactacaga ttctgaattt taaaaagtat cttctttttc   5832
tcgtgttata tttttaaata tacacaagac atttggtgac cagaacaagt tgatttctgt   5892
cctcagttat gttaatgaaa ctgttgcctc cttctaagaa aattgtgtgt gcaagcacca   5952
ggcaaagaaa tggactcagg atgcttagcg gtttaaaaca aacctgtaga taaatcactt   6012
gagtgacata gttgcgcaaa gatgttaagt ttcttaagaa accttttaat aactgagttt   6072
agcaaaaaga ataaaactat atagctcaat ttatttaaaa aaatctttgc atgtgtgatg   6132
ttatcattgg cttcatttct tacccaaggt atgtctgttt tgccataaat cagcagagtc   6192
atttcattct gggtgatcct aacacaccat tgctatgtta gatttgaaat gacatctctg   6252
ttaaaagaat cttctatgga aataatggtg ccctgcaaaa tcttcctctg aactcacagg   6312
ttagggatca cacaacttac ttaatcgttt tttgtttttg ttttttttcc ttatatgtca   6372
atggcccatg tcctccggga aaattagaaa agcaaaatga ttacaaagtg ctgttagatt   6432
tcttgtgctg ggccagccaa gtagaagtgg acttgacttg gacctttaac tattttatta   6492
cagattggac atttgctgtt cagatgtttt ttaacagagg gattatctca gaatcctgtg   6552
acctccaggt tgttttataa tctatttttc tctatttaac attcctcaga tagataggca   6612
aataggacat tccttctgtg tcacagaagt atcgtggtag tggcagtcta cagtttatat   6672
gattcattgt aactatgaga taaagaacaa ccagtcatgt ggccaaaagg attagatttg   6732
atttgatgtt cacttggagt ttactttttg tacatacaag ataaaataaa tattggattt   6792
gtaaaat                                                             6799
<210>5
<211>1738
<212>PRT
<213>智人(Homo sapiens)
<400>5
Met Leu Lys Arg Lys Gln Ser Ser Arg Val Glu Ala Gln Pro Val Thr
1               5                   10                  15
Asp Phe Gly Pro Asp Glu Ser Leu Set Asp Asn Ala Asp Ile Leu Trp
            20                  25                  30
Ile Asn Lys Pro Trp Val His Ser Leu Leu Arg Ile Cys Ala Ile Ile
        35                  40                  45
Ser Val Ile Ser Val Cys Met Asn Thr Pro Met Thr Phe Glu His Tyr
    50                  55                  60
Pro Pro Leu Gln Tyr Val Thr Phe Thr Leu Asp Thr Leu Leu Met Phe
65                  70                  75                  80
Leu Tyr Thr Ala Glu Met Ile Ala Lys Met His Ile Arg Gly Ile Val
                85                  90                  95
Lys Gly Asp Ser Ser Tyr Val Lys Asp Arg Trp Cys Val Phe Asp Gly
            l00                 105                 110
Phe Met Val Phe Cys Leu Trp Val Ser Leu Val Leu Gln Val Phe Glu
        115                 120                 125
Ile Ala Asp Ile Val Asp Gln Met Set Pro Trp Gly Met Leu Arg Ile
    130                 135                 140
Pro Arg Pro Leu Ile Met Ile Arg Ala Phe Arg Ile Tyr Phe Arg Phe
145                 150                 155                 160
Glu Leu Pro Arg Thr Arg Ile Thr Asn Ile Leu Lys Arg Ser Gly Glu
                165                 170                 175
Gln Ile Trp Ser Val Set Ile Phe Leu Leu Phe Phe Leu Leu Leu Tyr
            180                 185                 190
Gly Ile Leu Gly Val Gln Met Phe Gly Thr Phe Thr Tyr His Cys Val
        195                 200                 205
Val Asn Asp Thr Lys Pro Gly Asn Val Thr Trp Asn Ser Leu Ala Ile
    210                 215                 220
Pro Asp Thr His Cys Ser Pro Glu Leu Glu Glu Gly Tyr Gln Cys Pro
225                 230                 235                 240
Pro Gly Phe Lys Cys Met Asp Leu Glu Asp Leu Gly Leu Ser Arg Gln
                245                 250                 255
Glu Leu Gly Tyr Ser Gly Phe Asn Glu Ile Gly Thr Ser Ile Phe Thr
            260                 265                 270
Val Tyr Glu Ala Ala Ser Gln Glu Gly Trp Val Phe Leu Met Tyr Arg
        275                 280                 285
Ala Ile Asp Ser Phe Pro Arg Trp Arg Ser Tyr Phe Tyr Phe Ile Thr
    290                 295                 300
Leu Ile Phe Phe Leu Ala Trp Leu Val Lys Asn Val Phe Ile Ala Val
305                 310                 315                 320
Ile Ile Glu Thr Phe Ala Glu Ile Arg Val Gln Phe Gln Gln Met Trp
                325                 330                 335
Gly Ser Arg Ser Ser Thr Thr Ser Thr Ala Thr Thr Gln Met Phe His
            340                 345                 350
Glu Asp Ala Ala Gly Gly Trp Gln Leu Val Ala Val Asp Val Asn Lys
        355                 360                 365
Pro Gln Gly Arg Ala Pro Ala Cys Leu Gln Lys Met Met Arg Ser Ser
    370                 375                 380
Val Phe His Met Phe Ile Leu Ser Met Val Thr Val Asp Val Ile Val
385                 390                 395                 400
Ala Ala Ser Asn Tyr Tyr Lys Gly Glu Asn Phe Arg Arg Gln Tyr Asp
                405                 410                 415
Glu Phe Tyr Leu Ala Glu Val Ala Phe Thr Val Leu Phe Asp Leu Glu
            420                 425                 430
Ala Leu Leu Lys Ile Trp Cys Leu Gly Phe Thr Gly Tyr Ile Ser Ser
        435                 440                 445
Ser Leu His Lys Phe Glu Leu Leu Leu Val Ile Gly Thr Thr Leu His
    450                 455                 460
Val Tyr Pro Asp Leu Tyr His Set Gln Phe Thr Tyr Phe Gln Val Leu
465                 470                 475                 480
Arg Val Val Arg Leu Ile Lys Ile Ser Pro Ala Leu Glu Asp Phe Val
                485                 490                 495
Tyr Lys Ile Phe Gly Pro Gly Lys Lys Leu Gly Ser Leu Val Val Phe
            500                 505                 510
Thr Ala Ser Leu Leu Ile Val Met Ser Ala Ile Ser Leu Gln Met Phe
        515                 520                 525
Cys Phe Val Glu Glu Leu Asp Arg Phe Thr Thr Phe Pro Arg Ala Phe
    530                 535                 540
Met Ser Met Phe Gln Ile Leu Thr Gln Glu Gly Trp Val Asp Val Met
545                 550                 555                 560
Asp Gln Thr Leu Asn Ala Val Gly His Met Trp Ala Pro Val Val Ala
                565                 570                 575
Ile Tyr Phe Ile Leu Tyr His Leu Phe Ala Thr Leu Ile Leu Leu Ser
            580                 585                 590
Leu Phe Val Ala Val Ile Leu Asp Asn Leu Glu Leu Asp Glu Asp Leu
        595                 600                 605
Lys Lys Leu Lys Gln Leu Lys Gln Ser Glu Ala Asn Ala Asp Thr Lys
    610                 615                 620
Glu Lys Leu Pro Leu Arg Leu Arg Ile Phe Glu Lys Phe Pro Asn Arg
625                 630                 635                 640
Pro Gln Met Val Lys Ile Ser Lys Leu Pro Ser Asp Phe Thr Val Pro
                645                 650                 655
Lys Ile Arg Glu Ser Phe Met Lys Gln Phe Ile Asp Arg Gln Gln Gln
            660                 665                 670
Asp Thr Cys Cys Leu Leu Arg Ser Leu Pro Thr Thr Ser Ser Ser Ser
        675                 680                 685
Cys Asp His Ser Lys Arg Ser Ala Ile Glu Asp Asn Lys Tyr Ile Asp
    690                 695                 700
Gln Lys Leu Arg Lys Ser Val Phe Ser Ile Arg Ala Arg Asn Leu Leu
705                 710                 715                 720
Glu Lys Glu Thr Ala Val Thr Lys Ile Leu Arg Ala Cys Thr Arg Gln
                725                 730                 735
Arg Met Leu Ser Gly Ser Phe Glu Gly Gln Pro Ala Lys Glu Arg Ser
            740                 745                 750
Ile Leu Ser Val Gln His His Ile Arg Gln Glu Arg Arg Ser Leu Arg
        755                 760                 765
His Gly Ser Asn Ser Gln Arg Ile Ser Arg Gly Lys Ser Leu Glu Thr
    770                 775                 780
Leu Thr Gln Asp His Ser Asn Thr Val Arg Tyr Arg Asn Ala Gln Arg
785                 790                 795                 800
Glu Asp Ser Glu Ile Lys Met Ile Gln Glu Lys Lys Glu Gln Ala Glu
                805                 810                 815
Met Lys Arg Lys Val Gln Glu Glu Glu Leu Arg Glu Asn His Pro Tyr
            820                 825                 830
Phe Asp Lys Pro Leu Phe Ile Val Gly Arg Glu His Arg Phe Arg Asn
        835                 840                 845
Phe Cys Arg Val Val Val Arg Ala Arg Phe Asn Ala Ser Lys Thr Asp
    850                 855                 860
Pro Val Thr Gly Ala Val Lys Asn Thr Lys Tyr His Gln Leu Tyr Asp
865                 870                 875                 880
Leu Leu Gly Leu Val Thr Tyr Leu Asp Trp Val Met Ile Ile Val Thr
                885                 890                 895
Ile Cys Ser Cys Ile Ser Met Met Phe Glu Ser Pro Phe Arg Arg Val
            900                 905                 910
Met His Ala Pro Thr Leu Gln Ile Ala Glu Tyr Val Phe Val Ile Phe
        915                 920                 925
Met Ser Ile Glu Leu Asn Leu Lys Ile Met Ala Asp Gly Leu Phe Phe
    930                 935                 940
Thr Pro Thr Ala Val Ile Arg Asp Phe Gly Gly Val Met Asp Ile Phe
945                 950                 955                 960
Ile Tyr Leu Val Ser Leu Ile Phe Leu Cys Trp Met Pro Gln Asn Val
                965                 970                 975
Pro Ala Glu Ser Gly Ala Gln Leu Leu Met Val Leu Arg Cys Leu Arg
            980                 985                 990
Pro Leu Arg Ile Phe Lys Leu Val Pro Gln Met Arg Lys Val Val Arg
        995                 1000                1005
Glu Leu Phe Ser Gly Phe Lys Glu Ile Phe Leu Val Ser Ile Leu Leu
    1010                1015                1020
Leu Thr Leu Met Leu Val Phe Ala Ser Phe Gly Val Gln Leu Phe Ala
1025                1030                1035                1040
Gly Lys Leu Ala Lys Cys Asn Asp Pro Asn Ile Ile Arg Arg Glu Asp
                1045                1050                1055
Cys Asn Gly Ile Phe Arg Ile Asn Val Ser Val Ser Lys Asn Leu Asn
            1060                1065                1070
Leu Lys Leu Arg Pro Gly Glu Lys Lys Pro Gly Phe Trp Val Pro Arg
        1075                1080                1085
Val Trp Ala Asn Pro Arg Asn Phe Asn Phe Asp Asn Val Gly Asn Ala
    1090                1095                1100
Met Leu Ala Leu Phe Glu Val Leu Ser Leu Lys Gly Trp Val Glu Val
1105                1110                1115                1120
Arg Asp Val Ile Ile His Arg Val Gly Pro Ile His Gly Ile Tyr Ile
                1125                1130                1135
His Val Phe Val Phe Leu Gly Cys Met Ile Gly Leu Thr Leu Phe Val
            1140                1145                1150
Gly Val Val Ile Ala Asn Phe Asn Glu Asn Lys Gly Thr Ala Leu Leu
        1155                1160                1165
Thr Val Asp Gln Arg Arg Trp Glu Asp Leu Lys Ser Arg Leu Lys Ile
    1170                1175                1180
Ala Gln Pro Leu His Leu Pro Pro Arg Pro Asp Asn Asp Gly Phe Arg
1185                1190                1195                1200
Ala Lys Met Tyr Asp Ile Thr Gln His Pro Phe Phe Lys Arg Thr Ile
                1205                1210                1215
Ala Leu Leu Val Leu Ala Gln Ser Val Leu Leu Ser Val Lys Trp Asp
            1220                1225                1230
Val Glu Asp Pro Val Thr Val Pro Leu Ala Thr Met Ser Val Val Phe
        1235                1240                1245
Thr Phe Ile Phe Val Leu Glu Val Thr Met Lys Ile Ile Ala Met Ser
    1250                1255                1260
Pro Ala Gly Phe Trp Gln Ser Arg Arg Asn Arg Tyr Asp Leu Leu Val
1265                1270                1275                1280
Thr Ser Leu Gly Val Val Trp Val Val Leu His Phe Ala Leu Leu Asn
                1285                1290                1295
Ala Tyr Thr Tyr Met Met Gly Ala Cys Val Ile Val Phe Arg Phe Phe
            1300                1305                1310
Ser Ile Cys Gly Lys His Val Thr Leu Lys Met Leu Leu Leu Thr Val
        1315                1320                1325
Val Val Ser Met Tyr Lys Ser Phe Phe Ile Ile Val Gly Met Phe Leu
    1330                1335                1340
Leu Leu Leu Cys Tyr Ala Phe Ala Gly Val Val Leu Phe Gly Thr Val
1345                1350                1355                1360
Lys Tyr Gly Glu Asn Ile Asn Arg His Ala Asn Phe Ser Ser Ala Gly
                1365                1370                1375
Lys Ala Ile Thr Val Leu Phe Arg Ile Val Thr Gly Glu Asp Trp Asn
            1380                1385                1390
Lys Ile Met His Asp Cys Met Val Gln Pro Pro Phe Cys Thr Pro Asp
        1395                1400                1405
Glu Phe Thr Tyr Trp Ala Thr Asp Cys Gly Asn Tyr Ala Gly Ala Leu
    1410                1415                1420
Met Tyr Phe Cys Ser Phe Tyr Val Ile Ile Ala Tyr Ile Met Leu Asn
1425                1430                1435                1440
Leu Leu Val Ala Ile Ile Val Glu Asn Phe Ser Leu Phe Tyr Ser Thr
                1445                1450                1455
Glu Glu Asp Gln Leu Leu Ser Tyr Asn Asp Leu Arg His Phe Gln Ile
            1460                1465                1470
Ile Trp Asn Met Val Asp Asp Lys Arg Glu Gly Val Ile Pro Thr Phe
        1475                1480                1485
Arg Val Lys Phe Leu Leu Arg Leu Leu Arg Gly Arg Leu Glu Val Asp
    1490                1495                1500
Leu Asp Lys Asp Lys Leu Leu Phe Lys His Met Cys Tyr Glu Met Glu
1505                1510                1515                1520
Arg Leu His Asn Gly Gly Asp Val Thr Phe His Asp Val Leu Ser Met
                1525                1530                1535
Leu Ser Tyr Arg Ser Val Asp Ile Arg Lys Ser Leu Gln Leu Glu Glu
            1540                1545                1550
Leu Leu Ala Arg Glu Gln Leu Glu Tyr Thr Ile Glu Glu Glu Val Ala
        1555                1560                1565
Lys Gln Thr Ile Arg Met Trp Leu Lys Lys Cys Leu Lys Arg Ile Arg
    1570                1575                1580
Ala Lys Gln Gln Gln Ser Cys Ser Ile Ile His Ser Leu Arg Glu Ser
1585                1590                1595                1600
Gln Gln Gln Glu Leu Ser Arg Phe Leu Asn Pro Pro Ser Ile Glu Thr
                1605                1610                1615
Thr Gln Pro Ser Glu Asp Thr Asn Ala Asn Ser Gln Asp Asn Ser Met
            1620                1625                1630
Gln Pro Glu Thr Ser Ser Gln Gln Gln Leu Leu Ser Pro Thr Leu Ser
        1635                1640                1645
Asp Arg Gly Gly Ser Arg Gln Asp Ala Ala Asp Ala Gly Lys Pro Gln
    1650                1655                1660
Arg Lys Phe Gly Gln Trp Arg Leu Pro Ser Ala Pro Lys Pro Ile Ser
1665                1670                1675                1680
His Ser Val Ser Ser Val Asn Leu Arg Phe Gly Gly Arg Thr Thr Met
                1685                1690                1695
Lys Ser Val Val Cys Lys Met Asn Pro Met Thr Asp Ala Ala Ser Cys
            1700                1705                1710
Gly Ser Glu Val Lys Lys Trp Trp Thr Arg Gln Leu Thr Val Glu Ser
        1715                1720                1725
Asp Glu Ser Gly Asp Asp Leu Leu Asp Ile
    1730                1735
<210>6
<211>453
<212>DNA
<213>智人(Homo sapiens)
<220>
<221>allele
<222>105
<223>99-62617-105:多态性碱基G或C
<220>
<221>misc_binding
<222>93..117
<223>99-62617-105.探针
<220>
<221>primer_bind
<222>86..104
<223>99-62617-105.mis
<220>
<221>primer_bind
<222>106..124
<223>99-62617-105.mis补体
<220>
<221>primer bind
<222>1..20
<223>99-62617.pu
<220>
<221>primer_bind
<222>435..453
<223>99-62617.rp补体
<400>6
tgaggatgag gggcaaacac agaggaagaa tctgggcccc atgaggtcaa cagtgagctg     60
ctaaaattaa cctgaaattt ccctgctggg agacattgtg ttgtsaaata gttttatacc    120
atcttttact aggttttcaa ttaccagcag ttggatgcac cctgtgatcc aatggataca    180
aatgagattt agaagtgcac tttaacttaa ataaaataaa tagccttgtc taatgtatta    240
acgagaaaga catttttgtc ttatttatat gtcttatgtt ctttgaaatg aaataaatga    300
ccatatatgc ttgtaaagag agggagtcta cagatatttg gagaaaggac attctgggtg    360
gagagaacac agagtgcaaa ggacttgaag ttaaagtgca tccagcagtc tcaaggaaga    420
gtaaaggggt ccatgtgagt ggaataaggt gag                                 453
<210>7
<211>18
<212>DNA
<213>人工序列
<220>
<223>序列测定寡核苷酸引物PU
<400>7
tgtaaaacga cggccagt                                                  18
<210>8
<211>18
<212>DNA
<213>人工序列
<220>
<223>序列测定寡核苷酸引物RP
<400>8
caggaaacag ctatgacc                                                  18

Claims (23)

1.一种经分离的纯化的或重组的多核苷酸,其特征在于,所述多核苷酸包含如SEQ ID No 1-4或6所示的核苷酸序列之一,或与这些序列之一互补的序列。
2.一种经分离的纯化的或重组的多核苷酸,其特征在于,所述多核苷酸包含SEQ ID No 4的至少50个核苷酸的连续跨距,其中所述多核苷酸编码生物学活性CanIon多肽。
3.一种经分离的纯化的或重组的多核苷酸,其特征在于,所述多核苷酸编码人CanIon多肽,该多肽含有SEQ ID NO 5的氨基酸序列或其生物学活性片段。
4.如权利要求1-3中任一项所述的多核苷酸,其特征在于,所述多核苷酸附着在一固体支持物上。
5.一种多核苷酸阵列,其特征在于,所述阵列含有至少一个权利要求4所述的多核苷酸。
6.如权利要求5所述的阵列,其特征在于,所述阵列是可寻址的。
7.如权利要求1-4中任一项所述的多核苷酸,其特征在于,它还包含标记。
8.一种重组载体,其特征在于,所述重组载体包含权利要求1-3中任一项所述的多核苷酸。
9.一种重组载体,其特征在于,所述重组载体包含权利要求2或3所述的多核苷酸,其可操作作地与一启动子连接。
10.一种宿主细胞,其特征在于,所述宿主细胞含有权利要求8或9所述的重组载体。
11.一种非人宿主动物或哺乳动物,其特征在于,所述动物含有权利要求8或9所述的重组载体。
12.一种哺乳类宿主细胞或非人宿主哺乳动物,其特征在于,所述宿主含有因与敲除载体同源重组而受破坏的CanIon基因。
13.一种经分离的纯化的或重组的多肽,其特征在于,所述多肽含有如SEQID No 5所示的氨基酸序列,或其生物学活性片段。
14.一种制备多肽的方法,其特征在于,所述方法包括:
a)提供含有编码权利要求13所述多肽的多核苷酸的细胞群,所述多核苷酸可操作地连接于一启动子;
b)在有助于所述多肽在所述细胞内生产的条件下培养所述细胞群;
c)从所述细胞群中纯化所述多肽。
15.使抗CanIon的抗体与权利要求13所述的多肽结合的方法,其特征在于,所述方法包括使所述抗体与所述多肽在所述抗体可特异性结合所述多肽的条件下接触。
16.一种检测细胞内CanIon基因表达的方法,其特征在于,所述方法包括以下步骤:
a)使所述细胞或所述细胞的提取物与以下两者之一接触:
i)在严格条件下能与权利要求1、2或3所述多核苷酸杂交的多核苷酸;或
ii)特异性结合如权利要求13所述多肽的多肽;以及
b)检测在所述细胞或提取物内所述多核苷酸和某一RNA种类之间是否发生杂交,或所述多肽与所述细胞或提取物内某一蛋白质是否结合;其中检测到存在所述杂交或所述结合则表明所述CanIon基因在所述细胞内被表达。
17.如权利要求16所述的方法,其特征在于,所述多核苷酸是寡核苷酸引物,其中所述杂交是通过检测存在含有所述引物序列的扩增产物而测定的。
18.如权利要求16所述的方法,其特征在于,所述多肽是抗CanIon的抗体。
19.一种鉴定CanIon多肽的候选调节剂的方法,其特征在于,所述方法包括:
a)使权利要求13所述的多肽与测试化合物接触;以及
b)测定所述化合物是否与所述多肽特异性结合;
其中测得所述化合物与所述多肽特异性结合表明所述化合物是所述CanIon多肽的候选调节剂。
20.如权利要求19所述的方法,其特征在于,所述方法还包括在所述候选调节剂存在时测试所述CanIon多肽的活性,其中所述候选调节剂存在时所述CanIon多肽的活性与所述候选调节剂不存在时的活性相比有差别,表明该候选调节剂是所述CanIon多肽的调节剂。
21.一种鉴定CanIon多肽调节剂的方法,其特征在于,所述方法包括:
a)使权利要求13所述的多肽与测试化合物接触;以及
b)检测所述化合物存在和不存在时所述多肽的活性;
其中测得所述化合物存在时的所述活性与所述化合物不存在时的活性相比有差别,表明所述化合物是所述CanIon多肽的调节剂。
22.如权利要求20或21所述的方法,其特征在于,所述多肽存在于细胞或细胞膜中,且所述活性包括电压门控离子通道活性。
23.一种制备药物组合物的方法,其特征在于,所述方法包括:
a)用权利要求19-22中任一项所述的方法鉴定CanIon多肽的调节剂;以及
b)联合所述调节剂与生理上可接受的动载体。
CNA018224997A 2000-12-05 2001-12-04 与精神分裂症相关的电压门控离子通道基因及蛋白质 Pending CN1777676A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US25131700P 2000-12-05 2000-12-05
US60/251,317 2000-12-05

Publications (1)

Publication Number Publication Date
CN1777676A true CN1777676A (zh) 2006-05-24

Family

ID=22951418

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA018224997A Pending CN1777676A (zh) 2000-12-05 2001-12-04 与精神分裂症相关的电压门控离子通道基因及蛋白质

Country Status (16)

Country Link
US (2) US20040091497A1 (zh)
EP (1) EP1339840B1 (zh)
JP (1) JP2004525614A (zh)
KR (1) KR20030074643A (zh)
CN (1) CN1777676A (zh)
AT (1) ATE339500T1 (zh)
AU (2) AU3357302A (zh)
BR (1) BR0115937A (zh)
CA (1) CA2430712A1 (zh)
DE (1) DE60123109T2 (zh)
EA (2) EA008252B1 (zh)
ES (1) ES2271092T3 (zh)
IL (1) IL156073A0 (zh)
MX (1) MXPA03005069A (zh)
UA (1) UA79927C2 (zh)
WO (1) WO2002046404A2 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020042100A1 (en) * 2000-07-03 2002-04-11 Chunhua Yan Isolated human ion channel proteins, nucleic acid molecules encoding human ion channel proteins, and uses thereof
CA2446708A1 (en) * 2001-05-10 2002-12-19 Mochida Pharmaceutical Co., Ltd. Novel voltage-dependent cation channel protein
US7634363B2 (en) 2005-12-07 2009-12-15 Affymetrix, Inc. Methods for high throughput genotyping
US20080075789A1 (en) * 2006-02-28 2008-03-27 The Regents Of The University Of California Genes differentially expressed in bipolar disorder and/or schizophrenia
FR2906532B1 (fr) * 2006-09-28 2008-12-12 Biomerieux Sa Nouvel oligonucleotide marque
KR20170066403A (ko) * 2014-10-13 2017-06-14 다우 아그로사이언시즈 엘엘씨 딱정벌레류 및 노린재류 해충에 대한 저항성을 부여하는 copi 코토머 알파 서브유닛 핵산 분자
KR20210087830A (ko) * 2020-01-03 2021-07-13 삼성전자주식회사 기판 적층 구조를 포함하는 전자 장치
CN114982679B (zh) * 2022-07-22 2023-08-01 中国水产科学研究院长江水产研究所 一种黄鳝家系建立及优良家系选育方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6008001A (en) * 1993-11-05 1999-12-28 Yeda Research And Development Co. Ltd. Diagnosis of the susceptibility of contracting schizophrenia
WO1999066041A1 (en) * 1998-06-16 1999-12-23 Human Genome Sciences, Inc. 94 human secreted proteins
WO1999004825A1 (en) * 1997-07-22 1999-02-04 Millennium Pharmaceuticals, Inc. Methods and compositions for the diagnosis and treatment of neuropsychiatric disorders
WO1999028342A2 (en) * 1997-12-03 1999-06-10 Merck & Co., Inc. Low-voltage activated calcium channel compositions and methods
WO1999057316A1 (en) * 1998-04-30 1999-11-11 Institut Pasteur A highly conserved polynucleotide sequence linked to a genetic predisposition to schizophrenia, a method of diagnosis, and applications thereof
EP1121428A2 (en) * 1998-10-13 2001-08-08 Genset Genes, proteins and biallelic markers related to central nervous system disease
AU778868B2 (en) * 1999-03-30 2004-12-23 Serono Genetics Institute S.A. Schizophrenia associated genes, proteins and biallelic markers
WO2001083752A2 (en) * 2000-04-29 2001-11-08 Millennium Pharmaceuticals, Inc. 23949 and 32391, human ion channels and uses thereof
JP2004513618A (ja) * 2000-07-07 2004-05-13 インサイト・ゲノミックス・インコーポレイテッド 輸送体及びイオンチャネル

Also Published As

Publication number Publication date
WO2002046404A9 (en) 2002-08-15
AU3357302A (en) 2002-06-18
ES2271092T3 (es) 2007-04-16
AU2002233573B2 (en) 2007-03-01
EA200500974A1 (ru) 2006-02-24
US20080184381A1 (en) 2008-07-31
DE60123109D1 (de) 2006-10-26
MXPA03005069A (es) 2003-09-05
US20040091497A1 (en) 2004-05-13
ATE339500T1 (de) 2006-10-15
BR0115937A (pt) 2003-09-30
EA008252B1 (ru) 2007-04-27
JP2004525614A (ja) 2004-08-26
EA200300642A1 (ru) 2003-12-25
KR20030074643A (ko) 2003-09-19
CA2430712A1 (en) 2002-06-13
IL156073A0 (en) 2003-12-23
WO2002046404A2 (en) 2002-06-13
EP1339840A2 (en) 2003-09-03
UA79927C2 (en) 2007-08-10
EP1339840B1 (en) 2006-09-13
WO2002046404A3 (en) 2002-12-12
DE60123109T2 (de) 2007-05-16
EA006367B1 (ru) 2005-12-29

Similar Documents

Publication Publication Date Title
RU2724527C2 (ru) Композиции и способы модулирования экспрессии рецептора гормона роста
CN113853437A (zh) 腺相关病毒载体用于在内耳中的毛细胞和支持细胞中校正基因缺陷/表达蛋白质的用途
EP0973898A2 (en) SECRETED EXPRESSED SEQUENCE TAGS (sESTs)
KR20210138587A (ko) 개선된 면역요법을 위한 조합 유전자 표적
CA2936612A1 (en) Atf6 polymorphisms associated with myocardial infarction, method of detection and uses thereof
AU2016351889A1 (en) Detection of foetal chromosomal aneuploidies using DNA regions that are differentially methylated between the foetus and the pregnant female
EP0973899A2 (en) SECRETED EXPRESSED SEQUENCE TAGS (sESTs)
KR20160037895A (ko) 성장 호르몬 수용체의 조절인자
KR20080096495A (ko) 소과 동물에서 배최장근 최대력, 근내 지방, 식용우소매유통 생산량 및 순 사료 섭취량으로부터 선택된 형질을평가하는 방법
KR101621273B1 (ko) 카텝신 c의 용도
KR20220160053A (ko) 다발성 골수종에서의 면역요법 표적 및 그의 식별 방법
CN1423696A (zh) 人类精神分裂症基因
CN101151371B (zh) 治疗中的逆转录转座子抑制
US6262334B1 (en) Human genes and expression products: II
JP2001245666A (ja) 新規ポリペプチド
US20040091497A1 (en) Schizophrenia-related voltage-gated ion channel gene and protein
AU778868B2 (en) Schizophrenia associated genes, proteins and biallelic markers
CN115151558A (zh) 哺乳动物序列中的靶向整合增强基因表达
KR20210144822A (ko) Ube3a-ats를 조절하기 위한 화합물 및 방법
CN111344408A (zh) 用于调控fndc3b表达的寡核苷酸
CA2474759A1 (en) Gene for peripheral arterial occlusive disease
KR102477906B1 (ko) 유도만능 줄기세포 분화 특이적 lncRNA, 및 이의 용도
KR20210116480A (ko) 기분 장애의 설치류 모델
KR100998272B1 (ko) 단백질 지령부위내 단반복 염기서열을 갖는 신규 유전자
KR100934286B1 (ko) 골다공증 예측용 다형성 마커 및 이를 이용한 골다공증예측 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1088358

Country of ref document: HK

AD01 Patent right deemed abandoned
C20 Patent right or utility model deemed to be abandoned or is abandoned
REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1088358

Country of ref document: HK