CN101874120B - 作为用于乳腺癌风险评估、诊断、预后和治疗的标记的chr2和chr16的遗传性变型 - Google Patents

作为用于乳腺癌风险评估、诊断、预后和治疗的标记的chr2和chr16的遗传性变型 Download PDF

Info

Publication number
CN101874120B
CN101874120B CN200880016394.2A CN200880016394A CN101874120B CN 101874120 B CN101874120 B CN 101874120B CN 200880016394 A CN200880016394 A CN 200880016394A CN 101874120 B CN101874120 B CN 101874120B
Authority
CN
China
Prior art keywords
allele
breast cancer
label
risk
haplotype
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN200880016394.2A
Other languages
English (en)
Other versions
CN101874120A (zh
Inventor
西蒙·斯泰西
帕特里克·舒莱姆
安德烈·马诺列斯库
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Decode Genetics ehf
Original Assignee
Decode Genetics ehf
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Decode Genetics ehf filed Critical Decode Genetics ehf
Publication of CN101874120A publication Critical patent/CN101874120A/zh
Application granted granted Critical
Publication of CN101874120B publication Critical patent/CN101874120B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/172Haplotypes
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Hospice & Palliative Care (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Oncology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

本发明涉及作为乳腺癌易感性变体的某些Chr2q14、Chr2q35和Chr16q12上的遗传性变型。描述了使用这些变型对乳腺癌的易感性增加和/或降低的风险评估和诊断的方法。本发明进一步涉及诊断对乳腺癌的易感性的试剂盒。

Description

作为用于乳腺癌风险评估、诊断、预后和治疗的标记的chr2和chr16的遗传性变型
背景技术
迄今为止,在世界范围内,乳腺癌是女性最常见的癌症。当前全球每年的发病率超过1,151,000个新增诊断病例(Parkin et al.,2005)。乳腺癌发病率在发达国家是最高的,特别是在北欧种族血统的群体中,并且这种发病率还在增加。在美国,每年年龄标化发病率为每100,000群体大约131个病例,这超过世界平均水平的三倍。在北欧国家,比率同样高。在2006年,估计在美国将新诊断214,650个侵袭性乳腺癌病例,并且41,430个人将死于该疾病[Jemal,et al.,(2006),CACancer J Clin,56,106-30]。对于该数字必需增加另外的61,980个在2006年预期的乳腺导管原位癌和小叶原位癌诊断。从个人角度看,在美国女性中,形成乳腺癌的终生可能性为13.2%(即每八个女性中的一个在其生命期间形成乳腺癌)。对于大多数癌症,早期检测和适当治疗是重要因素。总的来说,乳腺癌的5-年存活率为88%。然而,在存在有区域型侵袭性疾病或转移性疾病的个体中,存活率分别降低到81%和26%[Jemal,et al.,(2006),CA Cancer J Clin,56,106-30]。
逐渐地,重点落在鉴定处于原发性乳腺癌或复发性乳腺癌的高风险的个体。这样的个体可以通过更密集的筛选、预防性化学疗法、激素疗法以及预防性手术——在个体处于极高风险的情况下——进行处理。群体筛选检查计划对卫生事业形成巨大的经济负担,而预防性疗法具有相关联的风险与生活品质影响。乳腺癌的遗传诱因:
乳腺癌的两种主要类型的已知风险因素是内分泌因素和遗传。对于后者,大约12%的乳腺癌患者具有一个或多个患有乳腺癌的一级亲属[(2001),Lancet,358,1389-99]。公知的主要乳腺癌诱因基因BRCA1和BRCA2赋予携带者大大增加的乳腺癌风险,终生外显率估计值的范围为40-80%。BRCA1和BRCA2突变的存在可以解释大多数具有6个或以上乳腺癌病例的家族和大部分包含乳腺癌和卵巢癌或男性乳腺癌的家族。然而,这样的家族的确是非常罕见的。发现BRCA1和BRCA2突变在具有较少病例的家族中或者在特征仅在于乳腺癌病例的家族中的频率低得多。合起来,BRCA1和BRCA2的突变可以占15-20%的家族性乳腺癌风险。在非基础群体(non-founder population)中,如果可以检测所有常见的BRCA突变,那么预期2-3%之间的乳腺癌发生患者将包含突变[Gorski,et al.,(2005),Breast Cancer Res Treat,92,19-24;(2000),Br J Cancer,83,1301-8]。该低的“发现机会”统计将BRCA突变检测的可靠应用排除在具有明显的遗传诱因的家族之外(Anon[(2003),J Clin Oncol,21,2397-406])。已知稀少、高外显率突变在TP53和PTEN基因中发生,然而,这些一起占不超过5%的乳腺癌的总遗传风险[Easton,(1999),Breast Cancer Res,1,14-7]。连锁研究在鉴定任何更多的普遍的赋予高乳腺癌风险的突变中已经基本上失败[Smith,et al.,(2006),Genes Chromosomes Cancer,45,646-55]。
最近的流行病学研究已经表明多数乳腺癌病例在易生病、易感染的少数群体中出现[Antoniou,et al.,(2002),Br J Cancer,86,76-83;Pharoah,et al.,(2002),Nat Genet,31,33-6]。来自孪生研究的数据和存活的原发性乳腺癌患者的对侧乳房中癌症恒定的高发病率的观测表明乳腺癌的大部分的未表征风险与内源性因素相关,最可能与遗传因素相关[Lichtenstein,et al.,(2000),N Engl J Med,343,78-85;Petoand Mack,(2000),Nat Genet,26,411-4]。支持该普遍风险的遗传因素的知识是非常有限的。使用赋予低到中等风险并且可彼此相互作用和与激素风险因素相互作用的风险等位基因,种族隔离分析预测乳腺癌的非特征遗传风险很可能本质上是多基因的。然而,这些研究预测通过俘获这些低到中等风险等位基因的遗传序型分析可限定的分布的最高和最低五分之一之间的相对危险度的差异差不多有40倍[Antoniou,etal.,(2002),Br J Cancer,86,76-83;Pharoah,et al.,(2002),Nat Genet,31,33-6]。预期所有乳腺癌病例的88%在易感染的50%的群体中出现,并且12%的最高风险的群体占所有乳腺癌病例的50%[Pharoah,et al.,(2002),Nat Genet,31,33-6;Pharoah,(2003),Recent Results Cancer Res,163,7-18;discussion 264-6]。因此,许多关注集中于鉴定这样的遗传易感染个体并且对他们发展个性化的医疗管理策略。
我们和其他人已经示出冰岛具有显著的家族性乳腺癌风险,该风险延伸到至少第五级亲属[Amundadottir,et al.,(2004),PLoSMed,1,e65;Tulinius,et al.,(2002),J Med Genet,39,457-62]。在冰岛,BRCA1突变对家族性风险的作用被认为是最小的[Arason,et al.,(1998),J Med Genet,35,446-9;Bergthorsson,et al.,(1998),Hum Mutat,Suppl 1,S195-7]。在BRCA2基因(999del5)中单一基础突变(single foundermutation)存在的携带者频率在普通冰岛人群体中为0.6-0.8%,而在女性乳腺癌患者中为7.7-8.6%[Thorlacius,et al.,(1997),Am J Hum Genet,60,1079-84;Gudmundsson,et al.,(1996),Am J Hum Genet,58,749-56]。估计该单一突变占对第一到第三级亲属大约40%的遗传乳腺癌风险[Tulinius,et al.,(2002),J Med Genet,39,457-62]。尽管该估计高于在非基础群体中归因于组合的所有BRCA 1和2突变的15-25%的家族性风险,但是仍有大约60%的冰岛人家族性乳腺癌风险有待解释。检测对BRCA2999del5阴性的患者的一级亲属保持1.72倍的乳腺癌的群体风险(95%CI 1.49-1.96)[Tulinius,et al.,(2002),J Med Genet,39,457-62]。
对促进剩余的乳腺癌的遗传风险的遗传因素的理解是非常有限的。两种基因的变体被严格证实为低显现率乳腺癌风险基因:CHEK2和ATM[Renwick,et al.,(2006),Nat Genet,38,873-5;(2004),Am J Hum Genet,74,1175-82]。已经涉及许多其他的基因,然而它们对乳腺癌风险的作用在使用非常大样品组的分析中还没有被证实[BreastCancer Association,(2006),J Natl Cancer Inst,98,1382-96]。
在群体中,个体之中基因的细微差异赋予遗传风险。在个体之间的基因差异最经常是由于单核苷酸多态性(SNP),尽管其他的变异同样重要。在人类基因组中,平均每1000个碱基对上,存在SNP。因此,包含250,000个碱基对的典型的人基因可包含250个不同的SNP。仅少数的SNP位于外显子中,并且改变由该基因编码的蛋白质的氨基酸序列。大多数SNP可对基因功能具有很小或没有影响,而其他SNP可改变基因编码的mRNA的转录、剪接、翻译或稳定性。人类基因组中另外的遗传多态性由短的或长的DNA序列的插入、缺失、易位或倒位引起。因此,赋予疾病风险的遗传多态性可直接地改变蛋白质的氨基酸序列,可增加从基因产生的蛋白质的数量,或可减少通过该基因产生的蛋白质的数量。
因为揭示了赋予常见疾病风险的遗传多态性,对这样的风险因素的遗传检测对于临床医学变得重要。实例是载脂蛋白E检测以在痴呆患者中鉴定apoE4多态性的遗传携带者以差别诊断阿尔茨海默病,以及凝血因子V莱顿突变(Factor V Leiden)检测,以检测深静脉血栓倾向。更重要地,在癌治疗中,肿瘤细胞中遗传性变型的诊断用于对个体患者最适当的治疗方案的选择。在乳腺癌中,雌激素受体表达或heregulin 2型(Her2)受体酪氨酸激酶表达的遗传变异决定是否将抗雌激素药(他莫昔芬)或抗Her2抗体(赫赛汀)并入治疗计划。在融合编码Bcr和Abl受体酪氨酸激酶的基因的费城染色体遗传易位的慢性髓细胞样白血病(CML)诊断中,Bcr-Abl激酶的特异性抑制剂应该被用来治疗该癌症。对于具有这样的遗传改变的CML患者,Bcr-Abl激酶的抑制导致迅速消除肿瘤细胞和减轻白血病。
当前,没有可用的普遍成功的用于预防或治疗乳腺癌的方法。当前,乳腺癌的控制依赖于初级预防、早期诊断、适当的治疗和二级预防的结合。存在明确的临床需求:将遗传检验整合到这些控制领域的所有方面。鉴定癌症易感性基因也可揭示关键的分子通道,该通道可被操作(例如使用小分子量或大分子量药物)并且可导致更有效的治疗。
发明内容
本发明涉及对乳腺癌风险评估的方法。这包括在个体中确定对乳腺癌易感性增加的方法,以及确定对乳腺癌易感性降低的方法,或在个体中诊断对癌症的保护性,这通过评估已被发现与乳腺癌相关联的某些标记或单元型而进行,如本文进一步描述的。
在第一方面,本发明涉及在人类个体中确定对乳腺癌的易感性的方法,包括确定至少一个多态标记的至少一个等位基因在从该个体获得的核酸样品中存在或不存在,或在源自该个体的基因型数据集中存在或不存在,其中至少一个多态标记选自在表10、表15和表19的任一个中列出的多态标记,和与它们连锁不平衡的标记,并且其中至少一个等位基因的存在表示该个体对乳腺癌的易感性。在一个实施方式中,该方法可涉及确定至少一个多态标记的至少一个等位基因在从该个体获得的核酸样品中存在或不存在。在另一个实施方式中,该方法涉及确定至少一个多态标记的至少一个等位基因在源自该个体的基因型数据集中存在或不存在。在某些实施方式中,基因型数据集可源自特定个体,这是由于包含在基因型数据集中的信息与特定核酸样品模板有关,其中所述核酸样品包含来自单独个体的核酸。
确定多态标记的特定易感性等位基因存在给出了该等位基因赋予的特定易感性存在的直接指示。另一方面,确定这种易感性等位基因不存在给出了在获得基因型样品或基因型数据集的个体中不存在该特定易感性的指示。在具有两个可能的等位基因的多态标记的特定情况中,例如SNP或插入/缺失多态性,确定这种特定等位基因不存在暗示在个体中存在两个拷贝的替代等位基因(除非在该个体中特定基因组区域包含缺失或复制,其中在该个体的基因组中也可能存在仅单一拷贝或两个以上拷贝的特定基因组区域)。
在第二方面,本发明涉及在人类个体中诊断对乳腺癌的易感性的方法,该方法包括确定至少一个多态标记的至少一个等位基因在从该个体获得的核酸样品中存在或不存在,其中至少一个多态标记选自与rs4848543LD区段、rs3803662LD区段和rs13387042LD区段关联的标记,其中至少一个等位基因的存在表示对乳腺癌的易感性。在一个实施方式中,与rs4848543LD区段、rs3803662LD区段和/或rs13387042LD区段关联的标记是与这些LD区段的一个或多个内的至少一个标记连锁不平衡的标记。
在进一步的方面,本发明涉及在人类个体中诊断对乳腺癌的易感性的方法,该方法包括确定至少一个多态标记的至少一个等位基因在从该个体获得的核酸样品中存在或不存在,其中至少一个多态标记选自与在表10、表15和表19中列出的标记和与它们连锁不平衡的标记。在一个特定的实施方式中,与在表10、表15和表19中列出的标记连锁不平衡的标记是r2的值大于0.2的那些标记。在另一个实施方式中,与在表10、表15和表19中列出的标记连锁不平衡的标记是在白种人群体,例如HapMap CEPH群体中r2的值大于0.2的那些标记。
在另一方面,本发明涉及鉴定用于评估对乳腺癌的易感性的标记的方法,所述方法包括:a.鉴定与具有在SEQ ID NO:4、SEQ ID NO:5和SEQ ID NO:6中列出的序列的基因组区段内的至少一个标记连锁不平衡的至少一个多态标记;b.确定诊断患有乳腺癌或对乳腺癌具有易感性的个体的样品的基因型状态;和c.确定对照个体的样品的基因型状态;其中与对照样品中至少一个等位基因的频率相比,在诊断患有乳腺癌或对乳腺癌具有易感性的个体中至少一个多态性中至少一个等位基因的频率的显著性差异表示所述至少一个多态性可用于评估对乳腺癌的易感性。在一个实施方式中,与对照样品中至少一个等位基因的频率相比,在诊断患有乳腺癌或对乳腺癌具有易感性的个体中至少一个多态性中至少一个等位基因的频率增加表示所述至少一个多态性可用于评估对乳腺癌的易感性增加。在另一个实施方式中,与对照样品中至少一个等位基因的频率相比,在诊断患有乳腺癌或对乳腺癌具有易感性的个体中至少一个多态性中至少一个等位基因的频率降低表示所述至少一个多态性可用于评估对乳腺癌的易感性降低或保护免受乳腺癌。在一个实施方式中,与具有在SEQ ID NO:4、SEQ ID NO:5和SEQ ID NO:6中列出的序列的基因组区段内的至少一个标记连锁不平衡的至少一个多态标记选自rs4848543(SEQ ID NO:1)、rs3803662(SEQID NO:3)和rs13387042(SEQ ID NO:2)。
而且,本发明涉及基因型分型从处于乳腺癌风险或诊断患有乳腺癌的人类个体获得的核酸样品的方法,其包括确定在样品中存在或不存在至少一个多态标记的至少一个等位基因,其中至少一个标记选自表10、表15和表19中列出的标记,和与它们连锁不平衡的标记,并且其中存在或不存在至少一个多态标记的至少一个等位基因表示对乳腺癌的易感性。在一个实施方式中,至少一个标记选自rs4848543(SEQ ID NO:1)、rs3803662(SEQ ID NO:3)和rs13387042(SEQ ID NO:2)。在另一个实施方式中,基因型分型包括通过聚合酶链式反应(PCR),使用在所述至少一个多态标记侧翼的核苷酸引物对,扩增包含所述至少一个多态标记的核酸的片段。在进一步的实施方式中,使用选自等位基因-特异性探针杂交、等位基因-特异性引物延伸、等位基因-特异性扩增、核酸测序、5’-核酸外切酶消化、分子信标检测、寡核苷酸连接试验、粒度分析和单链构像分析的方法,进行基因型分型。在一个优选的实施方式中,该方法包括等位基因-特异性探针杂交。在另一个优选的实施方式中,该方法包括DNA测序。在特定优选的实施方式中,该方法包括下列步骤:1)将核酸拷贝与检测寡核苷酸探针和增强子寡核苷酸探针在寡核苷酸探针与核酸特异性杂交的条件下相接触;其中a)检测寡核苷酸探针的长度为5-100个核苷酸,并且与其核苷酸序列由SEQ ID NO:4、SEQ ID NO:5或SEQ ID NO:6给出的核酸的第一片段特异性杂交;b)检测寡核苷酸探针在其3’端包含可检测标记,并且在其5’端包含猝灭部分(quenching moiety);c)增强子寡核苷酸的长度为5-100个核苷酸,并且与所述核苷酸序列的第二片段互补,所述第二片段相对于寡核苷酸探针位于5’端,以便当两个寡核苷酸都与所述核酸杂交时,增强子寡核苷酸相对于检测寡核苷酸探针位于3’端;和d)在第一片段和第二片段之间存在单碱基缺口,以便当寡核苷酸探针和增强子寡核苷酸探针都与所述核酸杂交时,在寡核苷酸之间存在单碱基缺口;2)当检测探针与核酸杂交时,用内切核酸酶处理核酸,所述内切核酸酶将可检测标记从检测探针的3′端切割,以释放游离的可检测标记;和测量游离的可检测标记,其中存在该游离的可检测标记表明检测探针与核酸的第一片段特异性杂交,并且表明多态位点的序列为检测探针的互补体。
本发明的进一步方面涉及评估个体对乳腺癌治疗剂应答的可能性的方法,包括:确定在从该个体获得的核酸样品中存在或不存在至少一个多态标记的至少一个等位基因,其中至少一个多态标记选自表10、表15和表19中列出的多态标记和与它们连锁不平衡的标记,其中存在至少一个标记的至少一个等位基因表示对治疗剂的阳性应答的可能性。在一个实施方式中,治疗剂是化学治疗剂或激素治疗剂。在一个实施方式中,激素治疗剂是选择性雌激素受体调节剂或芳香酶抑制剂。在优选的实施方式中,选择性雌激素受体调节剂选自他莫昔芬和雷洛昔芬。在某些实施方式中,芳香酶抑制剂选自依西美坦、阿那曲唑和来曲唑。在其它的实施方式中,选择性雌激素受体调节剂与芳香酶抑制剂结合施用。
本发明的又一方面涉及预测诊断患有乳腺癌的个体的预后的方法,该方法包括确定在从该个体获得的核酸样品中存在或不存在至少一个多态标记的至少一个等位基因,其中至少一个多态标记选自表10、表15和表19中列出的多态标记,和与它们连锁不平衡的标记,其中至少一个等位基因的存在表示在个体中乳腺癌的更差预后。原则上,个体的预后可涉及对该疾病的任何特征进展模式,其包括但不限于继发肿瘤的形成、肿瘤的快扩散、肿瘤的等级(0级到IV级)和肿瘤的复发。
本发明也涉及监视经历乳腺癌治疗的个体的治疗进展的方法,该方法包括确定在从该个体获得的核酸样品中存在或不存在至少一个多态标记的至少一个等位基因,其中至少一个多态标记选自表10、表15和表19中列出的多态标记,以及与它们连锁不平衡的标记,其中确定至少一个等位基因的存在表示该个体的治疗结果。治疗可以是外科治疗、化学疗法治疗、放射治疗、基因疗法或免疫疗法的任一种。这些疗法的任一种可以单独使用或组合使用。例如,可进行外科治疗,然后进行化学疗法治疗和/或放射治疗。个体的治疗结果与在治疗结束时个体的肿瘤进行性有关。这样的结果的量度包括但不限于肿瘤的复发率或可能性、肿瘤扩散和继发肿瘤的形成。
本发明的另一方面涉及用于在人类个体中评估对乳腺癌的易感性的试剂盒,该试剂盒包括用于在个体的基因组中选择性检测至少一个多态标记的至少一个等位基因的试剂,其中多态标记选自表10、表15和表19中列出的标记和与它们连锁不平衡的标记,并且其中至少一个等位基因的存在表示对乳腺癌的易感性。在一个实施方式中,至少一个多态标记是rs4848543(SEQ ID NO:1)、rs3803662(SEQ IDNO:3)或rs13387042(SEQ ID NO:2)。在另一个实施方式中,试剂包括至少一种相邻寡核苷酸、缓冲液和可检测标记,所述至少一种相邻寡核苷酸与包含所述至少一个多态标记的个体基因组的区段杂交。在另一个实施方式中,所述试剂包括至少一对寡核苷酸,其与从对象获得的基因组核酸区段的相反链杂交,其中每个寡核苷酸引物对被设计以选择性扩增个体的包含一个多态标记的基因组片段,并且其中片段的大小为至少30个碱基对。在进一步的实施方式中,至少一种寡核苷酸与个体基因组完全互补。在另一个实施方式中,所述寡核苷酸的长度为大约18到大约50个核苷酸。在另一实施方式中,寡核苷酸的长度为20-30个核苷酸。在优选的实施方式中,该试剂盒包含:a.检测寡核苷酸探针,其长度为5-100个核苷酸;b.增强子寡核苷酸探针,其长度为5-100个核苷酸;和c.内切核酸酶;其中检测寡核苷酸探针与其核苷酸序列由SEQ ID NO:4、EQ IDNO:5或SEQ ID NO:6给出的核酸的第一片段特异性杂交,和其中检测寡核苷酸探针在其3’端包含可检测标记,并且在其5’端包含猝灭部分;其中增强子寡核苷酸的长度为5-100个核苷酸,并且与所述核苷酸序列的第二片段互补,所述第二片段相对于寡核苷酸探针位于5’端,以便当两个寡核苷酸都与所述核酸杂交时,增强子寡核苷酸相对于检测寡核苷酸探针位于3’端;其中在第一片段和第二片段之间存在单碱基缺口,以便当寡核苷酸探针和增强子寡核苷酸探针都与所述核酸杂交时,在寡核苷酸之间存在单碱基缺口;和其中当检测探针与所述核酸杂交时,用内切核酸酶处理所述核酸,将可检测标记从检测探针的3′端切割,以释放游离的可检测标记。
本发明进一步方面涉及用于确定人类个体中乳腺癌的遗传指示物的装置,包括:计算机可读存储器;和储存在所述计算机可读存储器上的程序;其中所述程序适合在处理器上执行以针对选自表10、表15和表19中列出的标记和与它们连锁不平衡的标记的至少一个多态标记,分析至少一个人类个体的标记和/或单元型信息,并基于所述标记或单元型信息产生输出,其中所述输出包括作为所述人类个体的乳腺癌的遗传指示物的至少一个标记或单元型的个体风险量度。在一个实施方式中,程序进一步包括与至少一个标记等位基因和/或单元型相关联的乳腺癌的风险量度,其中所述风险量度基于在诊断患有乳腺癌的多个个体中的至少一个多态标记的至少一个等位基因和/或单元型的频率和在多个参考个体中的至少一个多态标记的至少一个等位基因和/或单元型的频率的指示物的比较,并且其中人类个体的个体风险基于人类个体的至少一个标记等位基因和/或单元型的携带状态与至少一个标记等位基因和/或单元型的风险量度的比较。在一个实施方式中,至少一个多态标记选自rs4848543(SEQ ID NO:1)、rs3803662(SEQ ID NO:3)或rs13387042(SEQ ID NO:2)和与它们连锁不平衡的标记。
本发明也涉及寡核苷酸探针在制备用于在人类个体中诊断和/或评估对乳腺癌的易感性的药剂中的应用,其中所述探针与其核苷酸序列由在SEQ ID NO:4、SEQ ID NO:5或SEQ ID NO:6中列出的核酸的片段杂交,其中所述探针的长度为15-500个核苷酸。【0022a】本发明进一步涉及计算机可读介质,在其上储存:a.至少一个多态标记的标识符;b.在诊断患有乳腺癌的多个个体中所述至少一个多态标记的至少一个等位基因的频率的指示物;和c.在多个参考个体中所述至少一个多态标记的至少一个等位基因的频率的指示物;其中所述至少一个多态标记选自在表10、表15和表19中列出的多态标记和与它们连锁不平衡的多态标记。
在本发明的某些实施方式中,进一步评估在该个体中至少一种单元型的频率,其中所述单元型包含至少两种标记,并且其中至少一种单元型的存在表示对乳腺癌的易感性。在一个实施方式中,单元型是乳腺癌的风险单元型,即该单元型赋予增加的形成乳腺癌的风险。在一个实施方式中,该单元型选自在表7、表8、表9、表13、表14和表18中列出的单元型。
在本发明的另一实施方式中,在单元型背景上存在至少一个多态标记的至少一个等位基因,所述单元型背景选自在表9和表13中列出的单元型限定的单元型背景。在另一个实施方式中,本发明的方法涉及进一步进行分析乳腺癌的高外显遗传因素的步骤。在一个实施方式中,这样的高外显遗传因素是BRCA2999del5。近来的证据表明与BRCA1和BRCA2变体相关联的风险在一些情况中由在家族中簇集的其他遗传因素或环境因素所改变(Antoniou,A.C.,et al.Am J HumGenet 2008 Mar 18(Epub ahead of print))。因此,在某些实施方式中,乳腺癌的其他高外显突变——例如在BRCA1和BRCA2基因中发现的那些,其已经被充分记载并且是本领域技术人员已知的(参见,例如http://research.nhgri.nih.gov/bic/上的Breast Cancer Mutation Data Base;也参见Fackenthal,J.D.&Olopade,O.I.,Nature Reviews Cancer 7:937-48(2007),和其中引用的参考文献)——也可以被评估并且与本文描述的与乳腺癌相关联的变体组合。
在本发明的一个实施方式中,进行评估个体雌激素受体或孕酮受体状态的进一步步骤。在一个这样的实施方式中,雌激素阳性状态或孕酮阳性状态与风险增加相关联,所述风险增加与rs13387042等位基因A和rs3803662等位基因T以及与它们关联的标记——例如在表15和表19中列出的标记——相关联。
在另一方面,本发明涉及在先前诊断患有乳腺癌的个体中评估形成至少一个第二原发性肿瘤的风险的方法,该方法包括确定在从该个体获得的核酸样品中存在或不存在至少一个多态标记的至少一个等位基因,其中至少一个多态标记选自与rs4848543LD区段、rs13387042LD区段和rs3803662LD区段相关联的标记,其中至少一个等位基因的存在表示形成至少一个第二原发性肿瘤的风险。在一个实施方式中,至少一个多态标记选自在表10、表15和表19的任一个中列出的标记。在另一个实施方式中,至少一个标记与rs4848543LD区段相关联。在一个实施方式中,至少一个多态标记选自在表10、表15、表19、表20、表21和表22中列出的多态标记和与它们连锁不平衡的标记。在另一个实施方式中,至少一个多态标记选自与标记rs4848543强连锁不平衡的标记,如通过r2的值大于0.2所限定的。在又一实施方式中,至少一个多态标记选自表7、表8和表10中列出的标记。在另一个实施方式中,至少一个多态标记选自表10中列出的标记。在进一步的实施方式中,至少一个多态标记与STEAP3/TSAP6基因相关联。在优选的实施方式中,标记是rs4848543。在其它的实施方式中,进行评估至少一种单元型在个体中频率的额外步骤。在一个实施方式中,该至少一种单元型选自表7、表8和表9中列出的单元型。在其它的实施方式中,乳腺癌的高外显遗传因素例如BRCA2999del5也被评估。
在某些实施方式中,根据本文描述的发明的乳腺癌表型可选自所有乳腺癌、多原发性乳腺癌、早发型乳腺癌或其它医学可接受的诊断方法限定的乳腺癌。在另一个实施方式中,总家族史(FHS)是与乳腺癌相关联的表型。
在如本文描述的本发明的方法、应用、试剂盒或装置的具体实施方式中,被评估的人类个体是女性。
本文公开的可用于检测对乳腺癌易感性的标记都可以在本文描述的各种本发明的方法、试剂盒、装置和应用中使用。因此,在某些实施方式中,可用于实践本发明的至少一个多态标记可选自在表20、21和22中列出的多态标记和与它们连锁不平衡的标记。在另一个实施方式中,至少一个多态标记选自表10、表15和表19中列出的标记和与它们连锁不平衡的标记。在某些实施方式中,至少一个多态标记位于具有SEQ ID NO:4、SEQ ID NO:5和SEQ ID NO:6的任一个列出的序列的基因组片段内。在一个优选的实施方式中,在SEQ IDNO:4内的至少一个标记选自在表20中列出的标记。在另一个优选的实施方式中,在SEQ ID NO:5内的至少一个标记选自在表21中列出的标记。在又一优选的实施方式中,在SEQ ID NO:6内的至少一个标记选自在表22中列出的标记。在另一个实施方式中,至少一个多态标记选自在表7、8、10、14、15、18和19中列出的标记。在另一个实施方式中,至少一个多态标记选自与标记rs4848543(SEQ ID NO:1)、rs3803662(SEQ ID NO:3)或rs13387042(SEQ ID NO:2)强连锁不平衡的标记,如通过r2的值大于0.2所限定的。在优选的实施方式中,至少一个多态标记选自rs4848543(SEQ ID NO:1)、rs3803662(SEQ ID NO:3)和rs13387042(SEQ ID NO:2)。在另一个优选的实施方式中,至少一个多态标记是rs4848543(SEQ ID NO:1)。在另一个优选的实施方式中,至少一个多态标记是rs3803662(SEQ ID NO:3)。在又一实施方式中,至少一个多态标记是rs13387042(SEQ ID NO:2)。在进一步的实施方式中,至少一个多态标记与STEAP3/TSAP6基因、LOC643714基因和/或TNRC9基因相关联(即,连锁不平衡)。在一个这样的实施方式中,至少一个多态标记位于STEAP3/TSAP6基因、LOC643714基因和/或TNRC9基因内。在另一个优选的实施方式中,至少一个多态标记选自rs4848543、rs13387042、rs3803662、rs12922061、rs4784227和rs17271951。
在本发明的某些方法、应用、试剂盒或装置中,存在至少一个等位基因或单元型表示对乳腺癌的易感性增加。在本发明的其它方法中,存在至少一个等位基因或单元型表示对乳腺癌的易感性降低。在一个实施方式中,对乳腺癌的易感性增加存在于单元型背景上,所述单元型背景选自由下列组成的单元型背景:(i)rs8955398等位基因2、rs4848543等位基因1、rs6759589等位基因1、rs838066等位基因2、rs838100等位基因3、rs838086等位基因1、rs12711924等位基因1和rs3731603等位基因4;(ii)rs8955398等位基因4、rs4848543等位基因1、rs6759589等位基因1、rs838066等位基因2、rs838100等位基因3、rs838086等位基因1、rs12711924等位基因1和rs3731603等位基因4;(iii)rs8955398等位基因4、rs4848543等位基因1、rs6759589等位基因1、rs838066等位基因2、rs838100等位基因3、rs838086等位基因2、rs12711924等位基因1和rs3731603等位基因4;(iv)rs8955398等位基因2、rs4848543等位基因1、rs6759589等位基因1、rs838066等位基因2、rs838100等位基因3、rs838086等位基因2、rs12711924等位基因1和rs3731603等位基因3;(v)rs8955398等位基因4、rs4848543等位基因1、rs6759589等位基因1、rs838066等位基因2、rs838100等位基因3、rs838086等位基因1、rs12711924等位基因1和rs3731603等位基因3;(vi)rs8955398等位基因2、rs4848543等位基因1、rs6759589等位基因1、rs838066等位基因2、rs838100等位基因3、rs838086等位基因1、rs12711924等位基因1和rs3731603等位基因4。
在另一个实施方式中,对乳腺癌的易感性增加存在于单元型背景上,所述单元型背景选自由下列组成的单元型背景:(i)rs10191184等位基因3、rs6435957等位基因4、rs10171745等位基因3、rs6716542等位基因1、rs4491709等位基因4、rs12621130等位基因1、rs6735174等位基因1、rs6435959等位基因2、rs2372943等位基因3、rs13387042等位基因1、rs10490444等位基因1、rs13011060等位基因3;(ii)rs10191184等位基因3、rs6435957等位基因4、rs10171745等位基因3、rs6716542等位基因3、rs4491709等位基因4、rs12621130等位基因1、rs6735174等位基因2、rs6435959等位基因4、rs2372943等位基因3、rs13387042等位基因1、rs10490444等位基因3、rs13011060等位基因3;(iii)rs10191184等位基因3、rs6435957等位基因2、rs10171745等位基因3、rs6716542等位基因3、rs4491709等位基因4、rs12621130等位基因1、rs6735174等位基因2、rs6435959等位基因4、rs2372943等位基因3、rs13387042等位基因1、rs10490444等位基因3、rs13011060等位基因3;(iv)rs10191184等位基因3、rs6435957等位基因4、rs10171745等位基因3、rs6716542等位基因3、rs4491709等位基因4、rs12621130等位基因1、rs6735174等位基因1、rs6435959等位基因2、rs2372943等位基因3、rs13387042等位基因1、rs10490444等位基因3、rs13011060等位基因3;(v)rs10191184等位基因3、rs6435957等位基因4、rs10171745等位基因1、rs6716542等位基因3、rs4491709等位基因2、rs12621130等位基因1、rs6735174等位基因1、rs6435959等位基因2、rs2372943等位基因3、rs13387042等位基因1、rs10490444等位基因1、rs13011060等位基因3;(vi)rs10191184等位基因3、rs6435957等位基因4、rs10171745等位基因3、rs6716542等位基因3、rs4491709等位基因4、rs12621130等位基因1、rs6735174等位基因2、rs6435959等位基因4、rs2372943等位基因3、rs13387042等位基因1、rs10490444等位基因3、rs13011060等位基因1;(vii)rs10191184等位基因3、rs6435957等位基因4、rs10171745等位基因3、rs6716542等位基因1、rs4491709等位基因4、rs12621130等位基因1、rs6735174等位基因1、rs6435959等位基因2、rs2372943等位基因3、rs13387042等位基因1、rs10490444等位基因1、rs13011060等位基因1;(viii)rs10191184等位基因3、rs6435957等位基因2、rs10171745等位基因3、rs6716542等位基因1、rs4491709等位基因4、rs12621130等位基因1、rs6735174等位基因1、rs6435959等位基因2、rs2372943等位基因3、rs13387042等位基因1、rs10490444等位基因1、rs13011060等位基因3;(ix)rs10191184等位基因3、rs6435957等位基因4、rs10171745等位基因3、rs6716542等位基因1、rs4491709等位基因4、rs12621130等位基因1、rs6735174等位基因1、rs6435959等位基因2、rs2372943等位基因3、rs13387042等位基因1、rs10490444等位基因3、rs13011060等位基因1;(x)rs10191184等位基因3、rs6435957等位基因2、rs10171745等位基因3、rs6716542等位基因3、rs4491709等位基因4、rs12621130等位基因1、rs6735174等位基因1、rs6435959等位基因2、rs2372943等位基因3、rs13387042等位基因1、rs10490444等位基因1、rs13011060等位基因3。
在优选的实施方式中,赋予乳腺癌风险增加的至少一个等位基因或单元型是rs4848543等位基因1。在进一步的实施方式中,风险增加的特征是至少1.2的相对危险度或优势比,其包括至少1.25的风险、至少1.3的风险、至少1.4的风险、至少1.55的风险、至少1.6的风险、至少1.7的风险和至少2.0的风险。
在本发明的某些其它实施方式中,存在至少一个等位基因或单元型表示对乳腺癌易感性降低(风险降低)。例如,至少一个等位基因或单元型可选自在表8、9、13、14和18中列出的并且具有小于1的相对危险度(RR)或优势比(OR)值的标记等位基因和单元型。在一个实施方式中,表示乳腺癌易感性降低的至少一个等位基因存在于单元型背景上,所述单元型背景选自由下列组成的单元型背景:(i)rs895398等位基因2、rs4848543等位基因2、rs6759589等位基因3、rs838066等位基因4、rs838100等位基因1、rs838086等位基因1、rs12711924等位基因3和rs3731603等位基因3;(ii)rs895398等位基因2、rs4848543等位基因2、rs6759589等位基因3、rs838066等位基因2、rs838100等位基因1、rs838086等位基因1、rs12711924等位基因3和rs3731603等位基因3;(iii)rs895398等位基因2、rs4848543等位基因2、rs6759589等位基因1、rs838066等位基因2、rs838100等位基因3、rs838086等位基因2、rs12711924等位基因3和rs3731603等位基因3;(iv)rs895398等位基因2、rs4848543等位基因2、rs6759589等位基因3、rs838066等位基因4、rs838100等位基因3、rs838086等位基因2、rs12711924等位基因3和rs3731603等位基因3;(v)rs895398等位基因2、rs4848543等位基因2、rs6759589等位基因3、rs838066等位基因2、rs838100等位基因3、rs838086等位基因2、rs12711924等位基因3和rs3731603等位基因3;(vi)rs895398等位基因2、rs4848543等位基因2、rs6759589等位基因1、rs838066等位基因2、rs838100等位基因3、rs838086等位基因1、rs12711924等位基因1和rs3731603等位基因4;(vii)rs895398等位基因2、rs4848543等位基因2、rs6759589等位基因3、rs838066等位基因4、rs838100等位基因3、rs838086等位基因1、rs12711924等位基因1和rs3731603等位基因4;(viii)rs895398等位基因2、rs4848543等位基因2、rs6759589等位基因1、rs838066等位基因2、rs838100等位基因3、rs838086等位基因1、rs12711924等位基因3和rs3731603等位基因3;和(ix)rs895398等位基因2、rs4848543等位基因2、rs6759589等位基因3、rs838066等位基因2、rs838100等位基因1、rs838086等位基因1、rs12711924等位基因1和rs3731603等位基因4。
在另一个实施方式中,对乳腺癌的易感性降低存在于单元型背景上,所述单元型背景选自由下列组成的单元型背景:(i)rs10191184等位基因3、rs6435957等位基因2、rs10171745等位基因3、rs6716542等位基因3、rs4491709等位基因2、rs12621130等位基因3、rs6735174等位基因1、rs6435959等位基因2、rs2372943等位基因3、rs13387042等位基因3、rs10490444等位基因1、rs13011060等位基因3;(ii)rs10191184等位基因3、rs6435957等位基因4、rs10171745等位基因3、rs6716542等位基因3、rs4491709等位基因4、rs12621130等位基因1、rs6735174等位基因1、rs6435959等位基因4、rs2372943等位基因1、rs13387042等位基因3、rs10490444等位基因3、rs13011060等位基因1;(iii)rs10191184等位基因1、rs6435957等位基因4、rs10171745等位基因3、rs6716542等位基因3、rs4491709等位基因4、rs12621130等位基因1、rs6735174等位基因1、rs6435959等位基因4、rs2372943等位基因1、rs13387042等位基因3、rs10490444等位基因3、rs13011060等位基因1;(iv)rs10191184等位基因3、rs6435957等位基因2、rs10171745等位基因3、rs6716542等位基因3、rs4491709等位基因2、rs12621130等位基因3、rs6735174等位基因1、rs6435959等位基因2、rs2372943等位基因3、rs13387042等位基因3、rs10490444等位基因1、rs13011060等位基因1;(v)rs10191184等位基因1、rs6435957等位基因2、rs10171745等位基因1、rs6716542等位基因3、rs4491709等位基因2、rs12621130等位基因1、rs6735174等位基因1、rs6435959等位基因2、rs2372943等位基因3、rs13387042等位基因3、rs10490444等位基因3、rs13011060等位基因3;(vi)rs10191184等位基因3、rs6435957等位基因4、rs10171745等位基因3、rs6716542等位基因3、rs4491709等位基因4、rs12621130等位基因1、rs6735174等位基因1、rs6435959等位基因4、rs2372943等位基因1、rs13387042等位基因3、rs10490444等位基因3、rs13011060等位基因3;(vii)rs10191184等位基因1、rs6435957等位基因2、rs10171745等位基因3、rs6716542等位基因3、rs4491709等位基因4、rs12621130等位基因1、rs6735174等位基因1、rs6435959等位基因4、rs2372943等位基因1、rs13387042等位基因3、rs10490444等位基因3、rs13011060等位基因1;(viii)rs10191184等位基因3、rs6435957等位基因4、rs10171745等位基因3、rs6716542等位基因3、rs4491709等位基因4、rs12621130等位基因1、rs6735174等位基因1、rs6435959等位基因2、rs2372943等位基因3、rs13387042等位基因3、rs10490444等位基因1、rs13011060等位基因3;(ix)rs10191184等位基因3、rs6435957等位基因2、rs10171745等位基因3、rs6716542等位基因3、rs4491709等位基因2、rs12621130等位基因1、rs6735174等位基因1、rs6435959等位基因2、rs2372943等位基因3、rs13387042等位基因3、rs10490444等位基因1、rs13011060等位基因3;(x)rs10191184等位基因1、rs6435957等位基因2、rs10171745等位基因3、rs6716542等位基因3、rs4491709等位基因2、rs12621130等位基因3、rs6735174等位基因1、rs6435959等位基因2、rs2372943等位基因3、rs13387042等位基因3、rs10490444等位基因1、rs13011060等位基因3;(xi)rs10191184等位基因3、rs6435957等位基因4、rs10171745等位基因3、rs6716542等位基因3、rs4491709等位基因4、rs12621130等位基因1、rs6735174等位基因1、rs6435959等位基因4、rs2372943等位基因3、rs13387042等位基因3、rs10490444等位基因3、rs13011060等位基因1。
在某些实施方式中,对易感性降低的特征为小于0.9的风险(相对危险度或优势比),其包括小于0.8的风险、小于0.7的风险、小于0.6的风险和小于0.5的风险。
原则上,评估本文示出的与乳腺癌相关联的标记和单元型可以与分析包含来自人类个体的基因组DNA的样品或源自人类个体的基因型数据集中不与表10、表15和表19中列出的标记的任何一个连锁不平衡的至少一个乳腺癌风险变体的至少一个风险等位基因存在或不存在相结合。换句话说,不与本文描述的任意风险因素相连锁的遗传风险因素可以与本发明的风险因素相结合,以基于多个风险因素获得对个体综合风险的评估。此外,分析本文描述的一个以上的与乳腺癌相关联的风险因素可以被结合,以便获得总的组合风险。在一个这样的实施方式中,对个体或来自个体的样品进行rs4848543(SEQ IDNO:1)、rs3803662(SEQ ID NO:3)和rs13387042(SEQ ID NO:2)的分析,并且进行综合风险分析。在另一个实施方式中,进行对rs3803662(SEQID NO:3)和rs13387042(SEQ ID NO:2)的分析。
在一些实施方式中,本发明方法的方法、应用、试剂盒和装置进一步包括分析非遗传信息,以进行个体的风险评估、诊断或预后。在某些实施方式中,非遗传信息可包括年龄、性别、种族、社会经济状况、前疾病诊断、患者病史、乳腺癌家族史、生化测量和/或临床测量。遗传风险因素和非遗传风险因素的组合风险可通过本领域技术人员已知的方法进行。
在本发明的某些实施方式中,遗传区段(例如标记)之间的连锁不平衡(LD)的特征为连锁不平衡量度的某些值。如本文进一步描述的,连锁不平衡的特征可以是LD量度r2和|D’|的特定数值。在一个优选的实施方式中,连锁不平衡的特征为r2的值大于0.1。在另一个优选的实施方式中,连锁不平衡的特征为r2的值大于0.2。对于r2,也可能为其他截断值,其包括但不限于0.3、0.4、0.5、0.6、0.7、0.8、0.9、0.95、0.96、0.97、0.98、0.99。在另一个优选的实施方式中,连锁不平衡的特征为|D’|的值大于0.5。在另一个优选的实施方式中,连锁不平衡的特征为|D’|的值大于0.8。对于|D’|,也可能为其他截断值,其包括但不限于0.2、0.3、0.4、0.6、0.7、0.8、0.9、0.95、0.96、0.97、0.98和0.99。在某些实施方式中,连锁不平衡的特征为|D’|和r2的数字截断值。在一个这样的实施方式中,连锁不平衡的特征为|D’|的数字截断值大于0.8或r2的数字截断值大于0.2,或两者。在某些实施方式中,LD在特定群体中测定。在某些这样的实施方式中,群体选自白种人、中国人、日本人和非洲人群体。在一个实施方式中,群体是白种人CEPH群体。
在本发明的方法、应用、装置或试剂盒的某些其他实施方式中,个体是特定人类血统。在一个实施方式中,血统选自黑人非洲人血统、白种人血统和华人血统。在另一个实施方式中,血统是黑人非洲人血统。在另一个实施方式中,血统是非洲裔美国人血统。在另一个实施方式中,血统是欧洲人血统。在另一个实施方式中,血统是白种人血统。在某些实施方式中,血统是经历遗传分析或基因型分型的个体自我报告的。在其他实施方式中,血统通过遗传性测定进行确定,其包括在来自个体的核酸样品中检测至少一个多态标记的至少一个等位基因,其中该等位基因的存在或不存在表示该个体的血统。
附图描述
通过下列本发明的优选实施方式的更具体的描述,本发明的上述和其他目的、特征和优点将显而易见。
图1示出染色体2上的区域的基因组结构,其包括本文示出的与乳腺癌相关联的标记rs4848543。在该区域中,也发现与rs4848543连锁不平衡的标记,该区域在本文也被称为rs4848543LD区段。该区域的特征为大量的连锁不平衡(高LD),并且它的边界的特征为高重组区域。在白种人CEU HapMap群体中与rs4848543连锁不平衡的标记——如通过LD量度r2的值大于0.2所限定,跨越NCBI Build 34中染色体2上的位置120,023,583-120,117,062,和NCBI Build 36中的位置19,644,908-119,738,387bp。在这两个序列结构(build)中,这些标记跨越的区域为93,479bp。
图2示出染色体2上的区域的基因组结构,其包括标记rs13387042。在该区域中,也发现与rs13387042连锁不平衡的标记,该区域在本文也被称为rs13387042LD区段。该区域的特征为大量的连锁不平衡(高LD),并且它的边界的特征为高重组区域。在白种人CEUHapMap群体中与rs13387042连锁不平衡的标记——如通过LD量度r2的值大于0.2所限定,跨越NCBI Build 34中染色体2上的位置218,059,508-218,141,061,和NCBI Build 36中的位置217,565,211-217,646,764bp。在这两个序列结构中,这些标记跨越的区域为81,553bp。
图3示出染色体16上的区域的基因组结构,其包括标记rs3803662。在该区域中,也发现与rs3803662连锁不平衡的标记,该区域在本文也被称为rs3803662LD区段。该区域的特征为大量的连锁不平衡(高LD),并且它的边界的特征为高重组区域。在白种人CEUHapMap群体中与rs3803662连锁不平衡的标记——如通过LD量度r2的值大于0.2所限定,跨越NCBI Build 34中染色体16上的位置52,314,403-52,413,602,和NCBI Build 36中的位置51,093,311-51,192,501bp。在这两个序列结构中,这些标记跨越的区域为99,190bp。
发明详述
本发明的优选的实施方式的描述如下。
本发明公开了已被发现与乳腺癌相关联的多态变体和单元型。已经发现在某些多态标记(例如,标记rs4848543、标记rs13387042和标记rs3803662,以及与它们连锁不平衡的标记,与rs4848543LD区段、rs13387042LD区段和rs3803662LD区段相关联的标记,例如表10、表15、表19、表20、表21和表22的标记,例如表10、表15和表19中列出的标记)处的特定等位基因和包含这些等位基因的单元型与乳腺癌相关联。这些标记和单元型可用于乳腺癌的风险控制,如本文进一步详述的。本发明进一步的应用包括用于评估这些标记的特定等位基因存在或不存在的试剂盒。定义
除非另有说明,核酸序列以5’到3’的方向从左到右书写。说明书中引用的数字范围包括限定该范围的数字,并且包括在该限定范围内的每一个整数或任何非整数分数。除非另有限定,本文使用的所有技术和科学术语与本发明所涉及领域的普通技术人员的共同理解的具有相同的含义。
在本文的上下文中,下列术语具有所指出的意思:
“多态标记”,有时称为“标记”,如本文描述的,指基因组多态位点。每个多态标记具有至少两个序列变异,该变异的特征为在多态位点具有特定等位基因。因此,对多态标记的遗传关联暗示与该特定多态标记的至少一个特异性等位基因具有关联。标记可以包含在基因组中发现的任何变体类型的任何等位基因,包括单核苷酸多态性(SNP)、微卫星、插入、缺失、复制和易位。
“等位基因”指染色体上给定基因座(位置)的核苷酸序列。因此,多态标记等位基因指染色体上标记的组成(即序列)。对于任何给定的多态标记,来自个体的基因组DNA包含两个等位基因(例如,等位基因-特异性序列),其代表每个染色体上的标记的每个拷贝。本文使用的核苷酸的序列密码是:A=1、C=2、G=3、T=4。对于微卫星等位基因,CEPH样品(Centre d’Etudes du Polymorphisme Humain,genomicsrepository,CEPH样品1347-02)被用作参考,该样品中每个微卫星的较短的等位基因被设定为0,并且其他样品中所有其他等位基因根据该参考进行编号。因此,例如等位基因1是比CEPH样品中较短的等位基因长1bp,等位基因2是比CEPH样品中较短的等位基因长2bp,等位基因3是比CEPH样品中较短的等位基因长3bp,等等,并且等位基因-1是比CEPH样品中较短的等位基因短1bp,等位基因-2是比CEPH样品中较短的等位基因短2bp,等等。
如本文描述的,序列conucleotide错读(Sequenceconucleotide ambiguity)如IUPAC-IUB所提出。这些密码与EMBL、GenBank和PIR数据库使用的密码一致。
  IUB密码   含义
  A   腺苷
  C   胞苷
G 鸟嘌呤
  T   胸苷
  R   G或A
  Y   T或C
  K   G或T
  M   A或C
  S   G或C
  W   A或T
  B   CG或T
  D   AG或T
  H   AC或T
  V   AC或G
N ACG或T(任何碱基)
核苷酸位置——在该位置,在群体(自然群体或合成群体,例如合成分子文库)中一个以上序列是可能的——被称为“多态位点”。
“单核苷酸多态性”或“SNP”是当在基因组的特定位置的单核苷酸在物种的成员之间或个体中配对染色体之间不同时存在的DNA序列变异。多数SNP多态性具有两个等位基因。在这种情况中,每个个体对于该多态性的一个等位基因是纯合的(即个体的两个染色体拷贝在SNP位置具有相同的核苷酸),或者该个体是杂合的(即所述个体的两个姐妹染色体包含不同的核苷酸)。如本文报告的SNP术语引用正式的参考SNP(rs)ID鉴定标签,如由National Center for BiotechnologicalInformation(NCBI)分配给每个独特的SNP。
如本文所述的“变体”指与参考DNA不同的DNA片段。如本文定义的“标记”或“多态标记”是变体。与参考不同的等位基因称为“变体”等位基因。
“微卫星”是在特定位点具有多个小的重复碱基的多态标记,所述小的重复碱基的长度为2-8个核苷酸(例如CA重复),其中重复长度的数量在一般群体中具有差异。
“插入/缺失”是多态性的普通形式,其包括长度一般只有几个核苷酸的小的插入或缺失。
如本文描述的“单元型”指在DNA的一条链内的基因组DNA的片段,其特征为沿着该片段排列的等位基因的特定组合。对于二倍体生物例如人,单元型包含每一多态标记或基因座的等位基因对的一个成员。在某些实施方式中,单元型可以包含两个或更多个等位基因、三个或更多个等位基因、四个或更多个等位基因、或者五个或更多个等位基因。单元型在本文中在标记名称和在该单元型中的标记的等位基因的背景下进行描述,例如“1rs4848543”或“1-rs4848543”指在单元型中的标记rs4848543的1等位基因(A等位基因),并且其等价于“rs4848543等位基因1”或“rs4848543等位基因A”。而且,对于各个标记,单元型中的等位密码是1=A、2=C、3=G和4=T。
如本文描述的,术语“易感性”指个体(或个体组)易于形成乳腺癌或比平均个体更不能抵抗形成乳腺癌。该术语包括增加的易感性和降低的易感性。因此,本发明的特定多态标记和/或单元型可具有乳腺癌的易感性增加(即风险增加)的特征,如特征为相对危险度(RR)大于1或优势比(OR)大于1。可选地,本发明的标记和/或单元型具有乳腺癌的易感性降低(即风险降低)的特征,如特征为相对危险度或优势比小于1。
在本上下文中,术语“和/或”应该理解为表明,由其连接的项目的任一个或两个被包括在内。换言之,该术语在本文应该理解为指“一个或另一个或两个”。
在连锁遗传成分(基因和/或标记)的上下文中,术语“与……相关联”指该成分处于连锁不平衡。优选地,该术语被用来指成分处于连锁不平衡,如通过连锁不平衡量度r2的值大于0.2所确定。
如本文描述的术语“查阅表”是这样的表,其将一种形式的数据与另一形式相关联,或者将一种或多种形式的数据关联于与该数据相关的预测结果,例如表型或性状。例如,查阅表可以包含至少一个多态标记的等位数据和特定性状或表型例如特定的疾病诊断之间的相关性,包含该特定等位数据的个体可能显示所述相关性,或者比没有包含该特定等位数据的个体更可能显示所述相关性。查阅表可以是多维的,即它们可以同时包含关于单个标记的复等位基因的信息,或者它们可以包含关于多种标记的信息,并且它们也可包含其他的因素,例如关于疾病诊断、种族信息、生物标记、生化测量、治疗方法或药物等的详细资料。
“计算机可读介质”是信息存储介质,其可以通过计算机,使用商业上可获得的或定制的界面进行访问。示例性的计算机可读介质包括存储器(例如RAM、ROM、闪存等)、光存储介质(例如CD-ROM)、磁存储介质(例如计算机硬盘、软盘等)、穿孔卡、或其他的商业上可获得的介质。信息可以在目标系统和介质之间转移、在计算机之间转移、或在计算机和用于存储信息的存储或访问的计算机可读介质之间转移。这样的转移可以通过电,或者通过其他的可利用的方法例如IR连接、无线连接等。
“核酸样品”是从个体获得的包含核酸(DNA或RNA)的样品。在某些实施方式——即特异性多态标记和/或单元型的检测——中,核酸样品包含基因组DNA。这样的核酸样品可以从包含基因组DNA的任何来源获得,所述来源包括如血样;羊水样品;脑脊液样品;或来自皮肤、肌肉、口腔粘膜或结膜粘膜、胎盘、胃肠道或其他器官的组织样品。
术语“乳腺癌治疗剂”指可用于改善或预防与乳腺癌相关的症状的药剂。
如本文描述的,术语“乳腺癌关联核酸”指已被发现与乳腺癌关联的核酸。这包括但不限于本文描述的标记和单元型,以及与它们强连锁不平衡(LD)的标记和单元型。在一个实施方式中,乳腺癌关联核酸指特定基因组区域,例如LD-区段,发现其通过位于该区域内的至少一个多态标记或与该区域相关联(即连锁不平衡)的至少一个多态标记与乳腺癌相关联。
术语“所有乳腺癌”或“所有BC”指诊断患有乳腺癌的所有个体,而不管乳腺癌的特定亚表型。
术语“中等诱因(Medium Predisposition)”乳腺癌或“MedPre”乳腺癌指乳腺癌的亚表型。该表型的定义要求先证者满足下列标准的至少一个:1.先证者是包含3个或以上的在3次减数分裂事件的遗传距离(3M)内的受影响亲属的乳腺癌病例群体的一员。2.先证者是在3M内具有亲属关系的受影响对的一员,他们中的一个当年龄在50岁或更年轻时被诊断。3.先证者是在3M内具有亲属关系的受影响对的一员,他们中的一个被诊断患有任何类型的第二原发性肿瘤。4.先证者已被被诊断患有任何类型的第二原发性肿瘤。
在本文提供的研究中,在分析的1600个冰岛患者中,653个满足MedPre标准(40.8%)。
如本文描述的,术语“多原发性乳腺肿瘤”或“MPBC”指除了第一乳腺癌诊断之外至少一个原发性肿瘤被诊断,并且两个肿瘤都通过临床和组织学证实为独立的原发性肿瘤的病例,所述至少一个原发性肿瘤与第一乳腺癌同时出现,或在第一乳腺癌之后出现,并且在对侧或同侧乳房中发生。
如本文描述的,术语“家族史分数(family history score)”或“FHS”,基于患有乳腺癌的先证者的患有乳腺癌的亲属的数目进行定义。对于每一先证者,每一受影响的第一级亲属被分配分数1,每一受影响的第二级亲属被分配分数0.5和每一受影响的第三级亲属被分配分数0.25。如此获得的所有受影响亲属的总和代表总家族史分数或FHS。
如本文描述的,术语“rs4848543LD区段”或“rs4848543连锁不平衡区段”指NCBI(National Center for Biotechnology Information)Build 34的位置119,987,002和120,129,001之间和NCBI Build 36中的位置119,608,327和120,129,001之间的染色体2上的基因组区域。该rs4848543LD区段的大小为141,999bp。
如本文描述的,术语“STEAP3基因”或“TSAP6基因”指前列腺六跨膜上皮抗原(STEAP3)基因,其也被称为肿瘤抑制基因活化通道6(Tumor Suppressor Activated Pathway 6)(TSAP6)基因。该基因位于染色体2q14.2上,并且跨越位置120076561-120118373(NCBI Build34)。
如本文描述的,术语“rs13387042LD区段”或“rs13387042连锁不平衡区段”指NCBI(National Center for BiotechnologyInformation)Build 34的位置218,062,001和218,141,002之间的染色体2上的连锁不平衡(LD)区段。该LD区段跨越79,001个碱基对(Build 34)。
如本文描述的,术语“rs3803662LD区段”或“rs3803662连锁不平衡区段”指NCBI(National Center for Biotechnology Information)Build 34的位置52,291,041和52,436,127之间的染色体16上的连锁不平衡(LD)区段。该LD区段跨越145,086个碱基对(Build 34)。
如本文描述的,术语“Daly单元型”指在给定LD区段(高LD区域)内的二-标记单元型,其被鉴定为在HapMap项目中分型的另外一组SNP的有效替代物(r2>0.8)。在UTAH CEPH(CEU)HapMap样品中,这些另外的SNP具有>5%的次要等位基因频率,并且它们既不在Hap300SNP芯片上,它们也不能通过该芯片上的SNP进行有效标记[Pe′er,et al.,(2006),Nat Genet,38,663-7]。
如本文定义的,术语“雌激素受体阳性乳腺癌”或“ER阳性乳腺癌”指确定为对雌激素受体表达阳性的乳腺癌组织的样品。例如,雌激素受体的表达可以通过放射免疫测定法或免疫组织化学测定。≥10fmol/mg的放射性免疫测量或≥10%阳性核的免疫组织化学评价被考虑为阳性。
如本文定义的,术语“孕酮受体阳性乳腺癌”或“PR阳性乳腺癌”指确定为对孕酮受体表达阳性的乳腺癌组织的样品。例如,孕酮受体的表达可以通过放射免疫测定法或免疫组织化学测定。≥10fmol/mg的放射性免疫测量或≥10%阳性核的免疫组织化学评被考虑为阳性。
通过诊断患有乳腺癌的个体群体的关联分析,已经发现在某些多态标记处的某些等位基因与乳腺癌相关联。对于与癌症相关联的变体的全基因组分析显示,乳腺癌与在区段Chr2q14和Chr2q35内的染色体2的两个不同区域以及染色体16上的区域(Chr16q12)相关联。在这些区域中,发现特定标记和单元型与乳腺癌的风险增加相关联。
如在表1中所示,已经发现染色体2q14.2上的标记rs4848543的A等位基因(也称为rs4848543A等位基因或rs48485431等位基因或A-rs4848543)与乳腺癌的风险增加相关联。相对于4477个无癌症群体对照中,在1598个患者中MedPre乳腺癌表型分析产生1.42的估计相对危险度(RR)值,其p-值8.3x10-8。在对检验为在该实验所用的全基因组芯片的一部分的317,089个SNP标记修正后,p-值为0.026,即在全基因组水平下,该关联性是显著的。与更宽的所有BC表型的关联性稍微较弱,其中RR-值为1.16(参见表1)。这些结果已经在独立的冰岛乳腺癌人群中得以重复。
rs4848543标记位于本文称为rs4848543LD区段的区域内。该SNP标记和与该标记相关的标记(例如,在表10中列出的标记),被用于本发明的方法中。由于人基因组的局部连锁不平衡方式,存在多个与本文示出的、与癌症相关联的rs4848543强LD的多态标记。因此,这些相关标记(例如,在表10中列出的标记)——其包括已知的SNP或其他多态标记例如微卫星或插入/缺失,以及其他的相关SNP或其他的多态标记——可单独或组合使用,作为检测本文描述的与乳腺癌的关联性的替代标记。特别地,预期位于rs4848543LD区段内的其他多态标记可用作本发明方法中的替代标记。
通过全基因组关联性分析,染色体2上的第二区域(2q35)已被鉴定。标记rs13387042的等位基因A(也称为rs13387042A等位基因或rs133870421等位基因或A-rs13387042)已被发现与乳腺癌的风险增加相关联(参见表11)。该SNP位于染色体2q35处,其为与STEAP3/TSAP6基因座不同的位置。对2,181个患有乳腺癌(所有BC)的个体和12,441个群体对照的分析揭示rs13387042的A等位基因赋予1.19的风险,p-值为4.0x10-5。发现MedPre乳腺癌中的危险度(RR)与任何BC的危险度相当。也可用于检测与rs13387042关联性的替代标记在表15中列出。
该结果在来自冰岛人群体(583个病例和7966个对照)的第二独立样品中得以重复,其给出在该第二组中与所有BC相关联的rs13387042的A等位基因的RR估计为1.20(P-值修正=3.8x10-3)。因此,在独立的冰岛人样品中,最初发现明显被重复,并且具有非常相似的RR点估计和总P-值修正2.0x10-7,其接近对检验的317,089个SNP的Bonferroni修正后的显著性水平。观察到的rs13387042等位基因A变体的频率和相对危险度与在冰岛人群体中估计的15.6%的群体归因危险度相应。
在西班牙人和瑞典人样品中的重复研究证实这些发现。来自西班牙的446个乳腺癌病例和977个对照样品的分析给出1.21的RR(P-值为1.8x10-2;表11)。在西班牙对照样品中A-rs13387042变体的频率比较高,这暗示该变体在西班牙人血统的群体中可能更盛行,并因此促进更高的乳腺癌负担。两个瑞典人群——“Sweden Familial”和“Sweden Consecutive”被分析。“Sweden Consecutive”人群表现对乳腺癌的显著RR,其为1.31(P-值=2.0x10-4),而“Sweden Familial”人群给出1.11的相对危险度估计值,其不是统计学显著的。然而,总体上组合的瑞典人群返回1.22的显著相对危险度估计值(P-值=8.1x10-4)。
在联合分析中,使用Mantel-Haenszel模型,结合对冰岛、西班牙和瑞典人群的估计。结果是估计的相对危险度为1.20,P-值为3.8x10-11。这远在使用Bonferroni方法修正调查的317,089个SNP而得到的全基因组显著性阈值之下。因此,我们推断在数个欧洲人血统的群体样品中,rs13387042等位基因A对乳腺癌赋予显著性和可重复的风险。估计总群体归因危险度为16.4%。
使用来自1600个乳腺癌患者和11563个对照的数据进行进一步全基因组SNP分析,鉴定出SNP rs3803662的T等位基因(T-rs3803662;rs3803662等位基因T),其对任何BC赋予估计的1.23倍的风险增加(表16)。该结果在第二、独立的594个冰岛乳腺癌患者和1433个对照的人群中得以证实。当对个体之间的亲缘关系修正后,这两组冰岛样品的组合数据给出1.23的相对危险度估计值和2.8x10-7的P-值。这相应于估计的10.1%的群体归因危险度(表16)。可用于检测与rs3803662关联性的替代标记在表19中列出。
在上面描述的瑞典和西班牙人群中进行该发现的重复分析,以及对来自荷兰Nijmegen的558个乳腺癌病例和1384个对照进行分析。如在表16中所示,在所有这三个复制人群中,观察到对rs3803662等位基因T的显著增加的风险。这三个非冰岛复制人群的组合分析揭示总相对危险度估计值为1.35,P-值为5.1x10-12。冰岛和复制人群的联合分析表明组合的相对危险度估计值为1.28,P-值为2.7x10-17。当对检验的SNP数修正时,这远在全基因组显著性的阈值之下。相应的总群体归因危险度估计值为13.4%(表16)。
研究rs13387042等位基因A和rs3803662等位基因T与雌激素受体(ER)和孕酮受体(PR)状态之间的关联性。包括rs13387042等位基因A和rs3803662等位基因T的显著性乳腺癌风险被明确限定于诊断患有ER阳性肿瘤的那些患者,并且ER阳性和ER阴性肿瘤之间的OR差异也是显著的(表25)。相似地,优选地在诊断患有PR阳性肿瘤的患者中,存在乳腺癌风险的倾向性。STEAP3/TSAP6的生物学:
STEAP3/TSAP6的cDNA从鼠骨髓LTR6细胞系中p53激活诱导的一系列mRNA之一首次分离出来,所述细胞系含有温度敏感p53基因[Amson,et al.,(1996),Proc Natl Acad Sci U S A,93,3953-7]。该鼠形式被称为肿瘤抑制基因活化通道6(TSAP6)。随后,在LTR6细胞中,该基因被证实为激活的p53可诱导的[Passer,et al.,(2003),ProcNatl Acad Sci U S A,100,2284-9]。大鼠版本——其被命名为pHyde,在设计来检测在具有不同转移倾向性的两种细胞系中差异表达的基因的实验期间,从前列腺癌细胞系分离[Rinaldy and Steiner,(1999),DNACell Biol,18,829-36]。pHyde cDNA被示出在大鼠和人前列腺细胞系以及异种移植物中诱导细胞凋亡[Rinaldy,et al.,(2000),Gan To KagakuRyoho,27 Suppl 2,215-22;Steiner,et al.,(2000),Cancer Res,60,4419-25]。pHyde诱导细胞凋亡随后被显示通过胱天蛋白酶-3通道起作用[Zhang,et al.,(2001),Oncogene,20,5982-90]。STEAP3/TSAP6的下调也已经被与肝细胞癌的进展相关联[Coulouarn,et al.,(2005),J Hepatol,42,860-9]。
Passer等分离人版本的STEAP3/TSAP6的cDNA,并表明在乳腺癌细胞系MCF7中,通过p53活化,mRNA是可诱导的[Passer,et al.,(2003),Proc Natl Acad Sci U S A,100,2284-9]。p53的诱导在转录水平出现,并且被核苷酸-478和-357(登录号AY214461限定的序列)之间的STEAP3/TSAP6启动子内的保守p53应答元件所介导[Passer,et al.,(2003),Proc Natl Acad Sci U S A,100,2284-9]。该蛋白质被鉴定为488个氨基酸,50-55kDa,6-次跨膜蛋白[Passer,et al.,(2003),Proc Natl AcadSci U S A,100,2284-9]。靶向STEAP3/TSAP6的反义RNA抑制p53-依赖性细胞凋亡,其进一步支持了STEAP3/TSAP6作为细胞凋亡的效应物起作用的观点[Passer,et al.,(2003),Proc Natl Acad Sci U S A,100,2284-9]。STEAP3/TSAP6物理上与参与细胞周期调控和细胞凋亡的两种蛋白——Nix和Myt1——相互作用[Passer,et al.,(2003),Proc NatlAcad Sci U S A,100,2284-9]。Nix(也称为BNIP3L)是线粒体的、Bcl2-相关的凋亡前体蛋白。Nix和STEAP3/TSAP6加强彼此的凋亡前体效应[Passer,et al.,(2003),Proc Natl Acad Sci U S A,100,2284-9]。Myt1是双特异性(Ser/Thr和Tyr)激酶,其通过磷酸化并因而抑制细胞周期蛋白依赖性激酶p34cdc2而行使在G2/M检查点阻断细胞周期的功能。Myt1和TSAP6之间的相互作用通过将Myt1保持在其低磷酸化、活化状态促进p34cdc2的Myt1-依赖性磷酸化[Passer,et al.,(2003),Proc Natl AcadSci U S A,100,2284-9]。
有些矛盾地,STEAP3/TSAP6近来被鉴定为在nm1054小鼠突变株中对小红细胞、低色性贫血负责的基因[Ohgami,et al.,(2005),Nat Genet,37,1264-9]。通过来自肠、网状内皮系统和肝脏的转铁蛋白(Tf),将细胞外的铁运输到体内的所有增殖细胞。Tf-结合的铁通过转铁蛋白-受体(TfR1)介导的胞吞作用进入细胞。铁通过酸化在内体内从Tf释放,在那里之后,其通过二价金属转运蛋白Dmt1被输送到细胞质。然后,Tf和TfR1再循环到细胞外环境。环境的铁和Tf结合的铁主要以氧化Fe3+(三价铁)状态存在,并且在它可被跨越细胞质膜转运以前其必须被还原成Fe2+(亚铁)。通过其与贫血的相关性,STEAP3/TSAP6被鉴定为主要的铁还原酶,其在红细胞同系细胞中进行该反应,这表示其对铁摄取具有很大的重要性[Ohgami,et al.,(2005),Nat Genet,37,1264-9]。STEAP3/TSAP6也行使铜还原酶活性,并且这些金属还原酶活性被STEAP家族的其他成员STEAP2和STEAP4共享[Ohgami,et al.,(2006),Blood,108,1388-94]。
STEAP3/TSAP6也已经被示出参与刺激蛋白质经由非经典的通道分泌。经典的蛋白质分泌通过注定分泌的蛋白质上的氨基末端信号序列介导。该信号序列指引蛋白质通过内质网/高尔基体通道,然后在分泌小泡中转运到质膜。在分泌小泡与质膜融合后,分泌的蛋白质被释放到细胞间隙。蛋白质分泌也可通过非经典的通道进行,其中胞内小泡可以在内体的腔内萌发,形成所谓的多泡结构。多泡结构与质膜融合导致这些膜-被囊小泡释放入细胞间隙。这些小泡被称为外来体。STEAP3/TSAP6已被示出以p53依赖性方式刺激外来体产生[Amzallag,et al.,(2004),J Biol Chem,279,46104-12;Yu,et al.,(2006),Cancer Res,66,4795-801]。外来体可能涉及重要的抗致癌应答。响应p53-STEAP3/TSAP6通道刺激,在外来体中分泌的蛋白质之一是Maspin(乳腺丝氨酸蛋白醇抑制剂),其已证明在乳腺肿瘤细胞中对血管发生、肿瘤侵入和转移的抑制作用[Sheng,et al.,(1996),Proc Natl Acad Sci US A,93,11669-74;Shi,et al.,(2001),Cancer Res,61,6945-51;Zhang,etal.,(1997),Mol Med,3,49-59;Zou,et al.,(1994),Science,263,526-9]。外来体可以包含促炎因子(例如翻译调节肿瘤蛋白(TCTP)/组胺释放因子)和肿瘤特异性抗原(例如Her2/Neu和Mart1)[Amzallag,et al.,(2004),J Biol Chem,279,46104-12;Andre,et al.,(2002),Lancet,360,295-305]。已经表明STEAP3/TSAP6介导的内体形成可能对所谓的“旁观者”效应负责,其中被诱导表达p53的细胞在相邻细胞中可以产生细胞周期停滞、凋亡前体应答和死亡[Yu,et al.,(2006),Cancer Res,66,4795-801]。
对于STEAP3/TSAP6的可能的遗传性变型和癌症风险之间的关系几乎全部是未知的。在前列腺癌细胞系、异种移植物和肿瘤样品中筛选突变发现在总共4个细胞系、8个异种移植物和56个肿瘤样品(总共68个样品)中的异种移植物中存在2个错义突变(Ala184Thr和Ile305Thr)。作者推测STEAP3/TSAP6在前列腺癌中不是经典的肿瘤抑制基因。据我们所知,尚无任何其他类型的癌症中没有STEAP3/TSAP6遗传性变型的研究被报道。应用STEAP3/TSAP6通道在改善的乳腺癌疗法的开发中的潜力
我们观察,STEAP3/TSAP6LD区段中的遗传性变型暗示该基因作为乳腺癌发展过程中的共同因子。因此,靶向STEAP3/TSAP6、其同系物和STEAP3/TSAP6通道上其他组分的疗法可以被认为是治疗或预防乳腺癌的候选。这样的靶包括:STEAP3/TSAP6自身(OMIM#609671);同系物STEAP1(OMIM#604415)、STEAP2/TIARP/STAMP1(OMIM#605094)和STEAP4(NM_024636);相互作用蛋白Nix/BNIP3L(OMIM#605368)、Myt1(OMIM#602474)、TCTP/组胺释放因子(OMIM#600763);通道蛋白p34cdc2(OMIM#116940)、细胞周期蛋白B1(OMIM#123836)、HER2/Neu(OMIM#164870)、Maspin(OMIM#154790);和STEP3/TSAP6通道的、然而没有鉴定或涉及的其他成员。疗法可以包括STEAP3/TSAP6、其同系物或通道组分的小分子激动剂或拮抗剂;大分子试剂如STEAP3/TSAP6、其同系物或通道组分的激动剂或拮抗剂;或在基因疗法或免疫疗法方案中应用STEAP3/TSAP6、其同系物或通道组分作为转基因。STEAP3/TSAP6、其同系物或通道组分和/或影响它们活性的分子通过它们“旁观者效应”的增强,也可被开发为细胞抑制或细胞毒素疗法(化学疗法、放射治疗、基因或免疫疗法)的佐剂。评估标记和单元型
当比较个体时,人群中的基因组序列是不同的。更确切地说,基因组在个体之间、在基因组中的多个位置显示出序列可变性。序列中的这类变异通常被称为多态性,并且在每个基因组内具有多个这样的位点。例如,人基因组显示平均每500个碱基对发生序列变异。最普通的序列变体由在基因组中单个碱基位置发生的碱基变异组成,并且这样的序列变体或多态性通常被称为单核苷酸多态性(“SNP”)。这些SNP被认为在单一突变事件中已经发生,因此通常在每个SNP位点具有两种可能的等位基因;最初的等位基因和突变的等位基因。由于自然的遗传漂变并且可能也由于选择压力,最初的突变导致多态性,其特征在于在任何给定的人群中其等位基因的特定频率。在人基因组中,发现许多其他类型的序列变体,包括微卫星、插入、缺失、倒位和拷贝数变化。多态微卫星在特定位点具有多个小的重复碱基(例如CA重复,在互补链上的TG),其中重复长度的数量在一般群体中具有差异。一般地说,对于多态位点,所述序列的每个版本代表多态位点的特异性等位基因。所有序列变体可被称为多态性,其在所讨论的序列变体特有的特定多态位点发生。一般地说,多态性可以包含任何数量的特异性等位基因。因此,在本发明的一个实施方式中,多态性的特征为在任何给定的人群中存在两种或更多种等位基因。在另一实施方式中,多态性的特征为存在三种或更多种等位基因。在其他实施方式中,多态性的特征为四种或更多种等位基因、五种或更多种等位基因、六种或更多种等位基因、七种或更多种等位基因、九种或更多种等位基因、或者十种或更多种等位基因。所有这些多态性可以用于本发明的方法和试剂盒,并且因此在本发明的范围内。
在有些情况下,参考在多态位点的不同等位基因,而没有选择参考等位基因。可选地,对于特定的多态位点,参考序列可以被提及。有时,参考等位基因被称为“野生型”等位基因,并且其通常被选作第一测序的等位基因或选作来自“未受影响”的个体(例如没有显示性状或疾病表型的个体)的等位基因。
本文涉及的SNP标记的等位基因当它们在所使用的SNP分析中出现在多态位点时,涉及碱基A、C、G或T。本文使用的SNP的等位基因密码如下:1=A、2=C、3=G、4=T。然而,本领域普通技术人员将认识到通过分析或阅读相反DNA链,在所有情况下,可以测量互补的等位基因。因此,对于特征为A/G多态性的多态位点(多态标记),使用的分析可以被设计以特异性检测两种可能的碱基——即A和G——的一种或两种的存在。可选地,通过设计被设计来在DNA模板上检测相反链的试验,可以测量互补碱基T和C的存在。定量上(例如,在相对危险度方面),从任一DNA链(+链或-链)的测量将获得相同的结果。
一般地,对于特定序列,参考序列得以参照。与该参考不同的等位基因有时被称为“变体”等位基因。如本文使用的变体序列指与参考序列不同但是基本上相似的序列。在本文描述的多态遗传标记处的等位基因是变体。另外的变体可以包括影响多肽的改变。当与参考核苷酸序列比较时,序列差异可以包括导致移码的单核苷酸插入或缺失、或一个以上核苷酸插入或缺失;导致编码氨基酸改变的至少一个核苷酸的改变;导致过早终止密码子产生的至少一个核苷酸的改变;数个核苷酸的缺失,其导致由所述核苷酸编码的一个或多个氨基酸缺失;导致阅读框的编码序列中断的一个或数个核苷酸的插入,例如通过不等重组或基因转变;所有或部分序列的复制;易位;或核苷酸序列的重排。这样的序列变化可改变核酸编码的多肽。例如,如果核酸序列的改变引起移码,那么移码可以导致编码的氨基酸改变,和/或可以导致过早终止密码子的产生,这引起产生截短的多肽。可选地,与疾病或性状相关联的多态性可以是一个或多个核苷酸的同义改变(即不导致氨基酸序列改变的改变)。例如,这样的多态性可以改变剪接位点、影响mRNA的稳定性或转运、或者另外影响编码的多肽的转录或翻译。它也可改变DNA,以增加在体细胞水平下发生结构改变例如扩增或缺失的可能性。参考核苷酸序列编码的多肽是具有特定参考氨基酸序列的“参考”多肽,并且变体等位基因编码的多肽称为具有变体氨基酸序列的“变体”多肽。
单元型指DNA片段,其特征为沿着片段排列的等位基因的特定组合。对于二倍体生物例如人,单元型包含每个多态标记或基因座的等位基因对的一个成员。在某一实施方式中,单元型可以包含两种或多种等位基因、三种或多种等位基因、四种或多种等位基因或五种或多种等位基因,每个等位基因相应于沿着该片段的特定多态标记。单元型可以包含不同的多态标记的组合,例如SNP和微卫星,其在多态位点具有特定等位基因。因此,单元型包含在不同的遗传标记处的等位基因的组合。
检测特异性的多态标记和/或单元型可以通过本领域已知的检测多态位点处序列的方法完成。例如,可以使用对SNP和/或微卫星标记的存在进行基因型分型的标准技术,例如基于荧光的技术(Chen,X.等,Genome Res.9(5):492-98(1999)),其使用PCR、LCR、嵌套式PCR和其他用于核酸扩增的技术。可用于SNP基因型分型的具体方法包括但不限于TaqMan基因型分型分析和SNPlex平台(Applied Biosystems)、质谱法(例如,来自Sequenom的MassARRAY系统)、微测序方法、实时PCR、Bio-Plex系统(BioRad)、CEQ和SNPstream系统(Beckman)、分子倒置探针排列技术(Molecular Inversion Probe array technology)(例如Affymetrix GeneChip)和珠排列技术(BeadArray Technologies)(例如Illumina GoldenGate和Infinium分析)。通过本领域普通技术人员可用的这些或其他方法,可以鉴定在多态标记处的一种或多种等位基因,所述多态标记包括微卫星、SNP或其它类型的多态标记。
在本文描述的某些方法中,研究中的任何特定疾病或性状(例如乳腺癌)的易感性增加(即风险增加)的个体是这样的个体,其中在赋予该疾病或性状易感性增加的一个或多个多态标记处的至少一个特异性等位基因或单元型被鉴定(即风险标记等位基因或单元型)。在一个方面,风险标记或单元型是赋予乳腺癌风险(或易感性)显著增加的标记或单元型。在一个实施方式中,与标记或单元型关联的显著性通过相对危险度(RR)测量。在另一实施方式中,与标记或单元型关联的显著性通过优势比(OR)测量。在进一步的实施方式中,显著性通过百分比测量。在一个实施方式中,显著增加的风险被测量为至少1.2的风险(相对危险度和/或优势比),其包括但不限于:至少1.2、至少1.3、至少1.4、至少1.5、至少1.6、至少1.7、至少1.8、至少1.9、至少2.0、至少2.5、至少3.0、至少4.0和至少5.0。在具体的实施方式中,至少1.2的风险(相对危险度和/或优势比)是显著的。在另一具体的实施方式中,至少1.3的风险是显著的。在又一实施方式中,至少1.4的风险是显著的。在进一步的实施方式中,至少大约1.5的相对危险度是显著的。在另一进一步的实施方式中,风险显著增加至少大约1.7是显著的。然而,也考虑其他截断值,例如至少1.15、1.25、1.35等,并且这些截断值也在本发明的范围内。在其他实施方式中,显著的风险增加是至少大约20%,其包括但不限于大约25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、100%、150%、200%、300%和500%。在一个具体实施方式中,显著的风险增加是至少20%。在其他实施方式中,显著的风险显著是至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%和至少100%。然而,也考虑本领域普通技术人员认为适合表征本发明的其它截断值或范围,并且那些截断值或范围也在本发明的范围内。在某些实施方式中,显著的风险增加由p值表征,例如小于0.05的p值、小于0.01的p值、小于0.001的p值、小于0.0001的p值、小于0.00001的p值、小于0.000001的p值、小于0.0000001的p值、小于0.00000001的p值、或小于0.000000001的p值。
本发明的风险多态标记或单元型是,其中至少一个标记的至少一个等位基因或单元型与在比较组(对照)中其存在频率相比,在处于乳腺癌(受影响的)风险中的个体中以更高频率存在,并且其中所述标记或单元型的存在表示对该疾病或性状的易感性。在一个实施方式中,对照组可以是群体样品,即来自一般群体的随机样品。在另一实施方式中,对照组由一组没有疾病的个体(例如没有被诊断患有乳腺癌的个体)代表。在一个实施方式中,这类没有疾病的对照的特征是不存在一种或多种特异的疾病相关症状。在另一实施方式中,没有疾病的对照组的特征是不存在一种或多种疾病特异性风险因素。在一个实施方式中,这些风险因素是至少一个环境风险因素。代表性的环境因素是自然产物、矿物质或其他已知影响或考虑影响形成特异性疾病或性状的风险的化学品。其他环境风险因素是与生活方式相关的风险因素,其包括但不限于饮食习惯、主要居住地的地理位置和职业风险因素。在另一实施方式中,风险因素是至少一种遗传风险因素。
作为相关性简单检验的实例,将是在二乘二列表上进行的Fisher-精确检验。对于一组染色体,从包括两个标记或单元型、一个标记或单元型而不包括另一个、和不包括标记或单元型的染色体数目中构造出该二乘二列表。也考虑技术人员已知的其它相关性统计检验,并且其也在本发明的范围内。
在本发明的其他实施方式中,对疾病或性状易感性降低(即风险降低)的个体是这样的个体,其中在赋予疾病或性状易感性降低的一个或多个多态标记处的至少一个特异性等位基因或单元型被鉴定。赋予风险降低的标记等位基因和/或单元型也被认为是保护性的。在一个方面,保护性的标记或单元型是赋予疾病或性状风险(或易感性)显著降低的标记或单元型。在一个实施方式中,显著降低的风险被测量为小于0.9——包括但不限于小于0.9、小于0.8、小于0.7、小于0.6、小于0.5、小于0.4、小于0.3、小于0.2和小于0.1——的相对危险度。在一个具体实施方式中,显著降低的风险为小于0.7。在另一实施方式中,显著降低的风险为小于0.5。在又一实施方式中,显著降低的风险为小于0.3。在另一实施方式中,风险(或易感性)降低至少20%,包括但不限于至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%和至少98%。在一个具体实施方式中,风险显著降低为至少大约30%。在另一实施方式中,风险显著降低至少大约50%。在另一实施方式中,风险降低为至少大约70%。然而,也考虑本领域普通技术人员认为适合表征本发明的其它截断值或范围,并且那些截断或范围在本发明的范围内。
本领域技术人员将理解,对于两个等位基因存在于研究群体中并且其中发现一个等位基因与对照相比在群体中具有性状或疾病的个体组中频率增加的标记,发现所述标记的另一个等位基因与对照相比在具有性状或疾病的个体组中频率降低。在这样的情况下,该标记的一个等位基因(被发现在具有性状或疾病的个体中频率增加的等位基因)将为风险等位基因,而另一个等位基因将为保护性等位基因。
与疾病或性状(例如乳腺癌)相关的遗传性变型(遗传性变体)可被单独使用以预测给定基因型的疾病风险。对于双等位基因标记,例如SNP,有3种可能的基因型:风险变体的纯合子、杂合子和风险变体的非携带者。在多个基因座与变体相关的风险可用于评估综合风险。对于多个SNP变体,具有k种可能的基因型,k=3n×2p;其中n是常染色体基因座的数量,而p是性染色体(gonosomal)(sexchromosomal(性染色体))基因座的数量。综合风险评估计算通常假设不同的遗传性变型的相对危险度相乘,即与特定基因型组合相关的综合风险(例如RR或OR)是每一基因座的基因型的风险值的乘积。与具有相匹配的性别和种族的参考群体相比,如果存在的风险是人的相对危险度或人的特异性基因型,那么组合风险是基因座特异性风险值的乘积,并且其也相应于与该群体比较的综合风险评估。如果对人的风险是基于与风险等位基因的非携带者进行比较,那么组合风险相应于这样的评估,其将在所有基因座处具有给的的基因型组合的人与一组在任何那些基因座处不携带风险变体的个体相比较。任何风险变体的非携带者组具有最低的评估风险并且与其本身(即非携带者)相比具有1.0的组合风险,但是与所述群体相比具有小于1.0的综合风险。应该注意到,非携带者组潜在地可以是非常小的,特别是对大量基因座而言,并且在那种情况下,其相关性相应地小。
乘积模型是简约模型(parsimonious model),其通常拟合复杂特性的数据相当好。多重性偏差(Deviations from multiplicity)很少在常见疾病的常见变体的背景中描述,并且如果报道,通常仅仅是暗示性的,这是因为通常需要非常大的样品规模以能显示基因座之间的统计交互作用。
作为实例,让我们考虑已经描述成与前列腺癌相关的总共8个变体(Gudmundsson,J.等,Nat Genet 39:631-7(2007),Gudmundsson,J.等,Nat Genet 39:977-83(2007);Yeager,M.等,NatGenet 39:645-49(2007),Amundadottir,L等.,Nat Genet 38:652-8(2006);Haiman,C.A.等,Nat Genet 39:638-44(2007))。这些基因座的7个是在常染色体上,剩下的基因座在染色体X上。那么,理论上的基因型组合的总数是37×21=4374。这些基因型类别中的一些是非常少见的,但是仍然是可能的,并且对于综合风险评估而言应该加以考虑。可能的是,在多遗传性变型的情况中运用的乘积模型与非遗传风险变体结合也是有效的,假设所述遗传性变型不明显与“环境”因素相关。换言之,遗传风险变体和非遗传风险变体可以在乘积模型中评估,以估计组合风险,假设非遗传风险因素和遗传风险因素没有相互作用。
使用相同的定量方法,可以评估与乳腺癌相关联的多个变体相关联的组合风险或综合风险。在一个这样的实施方式中,评估标记rs4848543、rs13387042和rs3803662或与这些标记连锁不平衡的替代标记,并且计算基因型组合(33=27种可能的组合)的风险。在另一个实施方式中,所述标记的两个(例如标记rs13387042和rs3803662)基因型被组合以给出综合风险。在其它的实施方式中,已知为乳腺癌诱因(例如高外显风险因素,例如BRCA1、BRCA2、BARD1)的其他标记与本文描述的风险因素的一个或多个组合。连锁不平衡
天然的重组现象——其对于每一染色体对在每个减数分裂事件期间平均发生一次——代表其中自然提供序列(和因此生物学功能)变化的一种方式。已经发现重组在基因组中不随机发生;相反地,在重组率的频率方面具有大的变化,这产生高重组频率的小的区域(也称为重组热点)和低重组频率的大的区域,其通常被称为连锁不平衡(LD)区段(Myers,S.等,Biochem Soc Trans 34:526-530(2006);Jeffreys,A.J.,等,Nature Genet 29:217-222(2001);May,C.A.,等,Nature Genet31:272-275(2002))。
连锁不平衡(LD)指两种遗传成分的非随机分配。例如,如果特定的遗传成分(例如多态标记的“等位基因”)在群体中以0.50的频率(50%)发生,并且另一种以0.50的频率(50%)发生,那么人具有两种成分的预计发生率为0.25(25%),假设成分随机分布。然而,如果发现两种成分以高于0.25的频率共同发生,那么所述成分被认为处于连锁不平衡,这是因为它们倾向于以比它们的独立的等位基因发生频率(例如等位基因或单元型频率)预计的更高的比率共同遗传。粗略地说,LD通常与两种成分之间的重组事件的频率相关。在群体中,等位基因或单元型频率可以通过基因型分型群体中的个体并确定每种等位基因或单元型在该群体中的发生来确定。对于二倍体群体,例如人类群体,对于每一遗传成分(例如标记、单元型或基因),个体一般地具有两个等位基因。
已经提出许多不同的量度来评估连锁不平衡(LD)强度。大多数捕获双等位基因位点对之间的关联强度。LD的两个重要成对量度是r2(有时候指Δ2)和|D’|。两个量度的范围都是从0(没有不平衡)到1(‘完全’不平衡),但是它们的解释稍微不同。这样定义|D’|:如果仅仅存在可能单元型的两种或三种,那么其等于1,如果所有四种可能的单元型都存在,那么其<1。所以,|D’|的值<1表示在两个位点之间可能已经发生历史重组(频发突变也可能引起|D’|<1,但是对于单核苷酸多态性(SNP),通常认为这比重组可能性更小)。量度r2表示两个位点之间的统计相关性,并且如果仅存在两种单元型,那么取1的值。
r2量度可论证地是关联作图(association mapping)的最相关的量度,这是因为在r2与检测易感性基因座和SNP之间的相关性所需的样品大小之间存在简单的反比关系。对于位点对,定义这些量度,但是对于一些应用,确定强LD如何越过包含多个多态位点的完整区域可能是需要的(例如,检验LD的强度是否在基因座或整个种群中具有明显差异,或者,在一个区域中与在特定模型下预测的相比是否存在更多或更少的LD)。沿着一区域测量LD并不简单,但一个方法是应用量度r,其在群体遗传学中得以发展。大概说来,r测量在特定群体模型中,需要多少重组以产生在数据中见到的LD。这类方法也可潜在地为确定LD数据是否为重组热点的存在提供证据的问题提供统计上精确的方法。对于本文描述的方法,显著r2值可以是至少0.1,例如至少0.1、0.15、0.2、0.25、0.3、0.35、0.4、0.45、0.5、0.55、0.6、0.65、0.7、0.75、0.8、0.85、0.9、0.91、0.92、0.93、0.94、0.95、0.96、0.97、0.98、0.99或1.0。在一个优选的实施方式中,显著r2值可以是至少0.2。可选地,如本文描述的,连锁不平衡指这样的连锁不平衡,其特征为|D’|的值为至少0.2,例如0.3、0.4、0.5、0.6、0.7、0.8、0.85、0.9、0.95、0.96、0.97、0.98、0.99。因此,连锁不平衡表示不同标记的等位基因之间的相关性。通过相关系数或|D’|(r2可达1.0,而|D’|可达1.0)。在某些实施方式中,根据r2和|D’|两度的值定义连锁不平衡。在一个这样的实施方式中,显著连锁不平衡被定义为r2>0.1和/或|D’|>0.8。在另一实施方式中,显著连锁不平衡被定义为r2>0.2和|D’|>0.8。在另一实施方式中,显著连锁不平衡被定义为r2>0.2和|D’|>0.9。确定连锁不平衡的其它r2和|D’|值的组合和排列也被考虑,并且也在本发明的范围内。可以在单一人群中确定连锁不平衡,如本文定义的,或者可以在包括来自一个以上人群的个体的样品集合中确定连锁不平衡。在本发明的一个实施方式中,在来自一个或多个HapMap群体(白种人、非洲人、日本人、中国人)的样品中,确定LD,如所定义的(http://www.hapmap.org)。在一个这样的实施方式中,在HapMap样品的CEU群体中,确定LD。在另一实施方式中,在YRI群体中,确定LD。在又一实施方式中,在来自冰岛人群的样品中,确定LD。
在群体水平下,如果基因组中所有多态性是相同的,那么他们中的每一个将需要在关联性研究中进行研究。然而,由于多态性之间的连锁不平衡,紧密连锁的多态性是强相关的,这减少在关联性研究中为观察到显著关联性所需要研究的多态性的数量。LD的另一个结果是许多多态性可发出关联信号,这是由于这些多态性是强相关的这一事实。
基因组LD图谱已经在整个基因组范围内产生,并且这类LD图谱已被提出作为绘制疾病基因的构架(Risch,N.&Merkiangas,K,Science 273:1516-1517(1996);Maniatis,N.,等,Proc Natl Acad SciUSA 99:2228-2233(2002);Reich,DE等,Nature 411:199-204(2001))。
现在认为,人基因组的许多部分可以被打断为一系列不连续的单元型区段,其包含一些常见单元型;对于这些区段,连锁不平衡数据提供很少的表明重组的证据(参见例如,Wall.,J.D.andPritchard,J.K.,Nature Reviews Genetics 4:587-597(2003);Daly,M.等,Nature Genet.29:229-232(2001);Gabriel,S.B.等,Science 296:2225-2229(2002);Patil,N.等,Science 294:1719-1723(2001);Dawson,E.等,Nature418:544-548(2002);Phillips,M.S.等,Nature Genet.33:382-387(2003))。
有两个主要的定义这些单元型区段的方法:区段可被定义为具有有限单元型多样性的DNA的区域(参见例如,Daly,M.等,Nature Genet.29:229-232(2001);Patil,N.等,Science 294:1719-1723(2001);Dawson,E.等,Nature 418:544-548(2002);Zhang,K.等,Proc.Natl.Acad.Sci.USA 99:7335-7339(2002)),或定义为具有使用连锁不平衡鉴定的大量历史重组的过渡区之间的区域(参见例如,Gabriel,S.B.等,Science 296:2225-2229(2002);Phillips,M.S.等,Nature Genet.33:382-387(2003);Wang,N.等,Am.J.Hum.Genet.71:1227-1234(2002);Stumpf,M.P.,and Goldstein,D.B.,Curr.Biol.13:1-8(2003))。近来,在整个人基因组的范围中,已经产生重组率和相应热点的精密标度的图谱(Myers,S.,等,Science 310:321-32324(2005);Myers,S.等,BiochemSoc Trans 34:526530(2006))。该图谱显示,在整个基因组的范围内重组变化很大,其中重组率在热点高达10-60cM/Mb,而在间插区中,重组率接近0,因此,这代表具有有限的单元型多样性和高LD的区域。因此,该图谱可以被用于定义单元型区段/LD区段为重组热点侧翼的区域。如本文使用的,术语“单元型区段”或“LD区段”包括由上述特征的任一个定义的区段,或者由本领域普通技术人员使用来定义这样的区域的其它可选方法定义的区段。
鉴定单元型区段的一些代表性方法例如在U.S公开的专利申请号20030099964、20030170665、20040023237和20040146870中被列出。单元型区段可被用于使用包含多个标记在内的单一标记或单元型绘制表型和单元型状态之间的关联性。在每个单元型区段中,可鉴定主要的单元型,然后可鉴定一组“标签”SNP或标记(辨别单元型所需要的最小组的SNP或标记)。然后,这些标签SNP或标记可被用于评估来自个体组的样品,以鉴定表型和单元型之间的关联性。如果需要,可以同时评估相邻单元型区段,因为在单元型区段之间,也可能存在连锁不平衡。
公知地,连锁不平衡可以在群体之间变化,这是由于在各种群体中分类的历史速率不同。在本发明的某些实施方式中,LD是指如在白种人样品中测定的LD。在具体的实施方式中,LD在来自HapMap群体(如在http://www.hapmap.org上描述)的白种人CEPH样品中测定。在其它的实施方式中,LD在非洲人群体、非洲裔美国人群体、西班牙人群体、日本人群体、中国人群体中测定。在某些实施方式中,LD在来自中国、日本、非洲的HapMap样品中测定,如所述(http://www.hapmap.org)。
从而明显的是,对于任何给定的观察到的与基因组中多肽标记的关联性而言,基因组中另外的标记也可能显示关联性。这是LD在整个基因组内不均匀分布的自然结果,如通过重组率大量变化所观察到的。因此,用于检测关联性的标记在某种意义上代表与给定的疾病或性状关联的基因组区域(即区段或LD区段)的“标签”,并且如此可用于本发明该方法和试剂盒。一种或多种致病(功能的)变体或突变可存在于被发现与疾病或性状相关联的区域内。这样的变体可赋予比用来检测关联性的标签标记所观察到的更高的相对危险度(RR)或优势比(OR)。因此,本发明涉及用来检测与疾病的关联性的标记,如本文所述的,以及与所述标记连锁不平衡的标记。因此,在本发明的某些实施方式中,与本发明的标记和/或单元型LD的标记——如本文所述的,可被用作替代标记。在一个实施方式中,所述替代标记的相对危险度(RR)和/或优势比(OR)的值小于如本文所述的最初被发现与所述疾病相关联的标记或单元型的相对危险度(RR)和/或优势比(OR)。在其他实施方式中,替代标记的相对危险度(RR)和/或优势比(OR)的值大于如本文所述的最初被发现与疾病相关联的标记或单元型的相对危险度(RR)和/或优势比(OR)。这样的实施方式的实例是与最初发现与疾病相关的更常见变体(>10%群体频率)连锁不平衡(LD)的稀少的或相对稀少的(<10%的等位群体频率)变体,例如本文描述的变体。如本文所述,鉴定和使用这样的由本发明人发现的、用于检测关联性的标记可以通过本领域普通技术人员熟知的常规方法进行,并且因此在本发明的范围内。确定单元型频率
使用期望最大化算法可以估计患者组和对照组中单元型的频率(Dempster A.等,J.R.Stat.Soc.B,39:1-38(1977))。可以处理缺失基因型和阶段不确定性的该算法的执行工具可被使用。在零假设下,患者和对照被假设具有相同的频率。使用可能性方法,检验可选假设,其中可包含本文描述的标记的候选风险单元型被允许在患者中比在对照中具有更高频率,而其他单元型的频率的比率被假设为在两组中相同。在两个假设中分别最大化似然性,并且使用相应的1-df似然比率统计来评价统计显著性。
例如,为了在连锁区域内寻找风险性和保护性标记和单元型,研究基因型标记的所有可能组合的关联性,条件是那些标记跨越实质性区域。组合的患者和对照组可以被随机地分成两组,其大小与原始的患者组和对照组的大小相等。然后,重复标记和单元型分析,并且确定所记录的最显著的p值。可以重复该随机化方案,例如,超过100次,以构造p值的经验分布。在优选的实施方式中,小于0.05的p值表示显著的标记和/或单元型关联性。单元型分析
进行单元型分析的一个一般方法包括使用应用于NEstedModels的、基于似然性的推理(Gretarsdottir S.,等,Nat.Genet.35:131-38(2003))。在程序NEMO中,实行该方法,其考虑许多多态标记、SNP和微卫星。该方法和软件被明确地设计用于病例-对照研究,其中目的是鉴定赋予不同风险的单元型组。它也是研究LD结构的工具。在NEMO中,在EM算法的帮助下,对于观测数据,直接计算最大似然估计值、似然比和p值,处理其漏失数据的问题。
尽管可以依赖基于对于观测数据直接计算的似然性的似然比检验——其已经捕获由于阶段不确定性和缺失基因型造成的信息丢失——以给出有效的p值,但是仍然有兴趣知道多少信息由于信息不完全而丢失。单元型分析的信息量度在Nicolae和Kong(TechnicalReport 537,Department of Statistics,University of Statistics,Universityof Chicago;Biometrics,60(2):368-75(2004))中描述为连锁分析定义的信息量度的天然延伸,并且在NEMO中执行。
对于与疾病的单一标记关联性,Fisher精确检验可用于计算每个个体等位基因的双侧p值。通常,对于多重比较,除非明确地表明,所有的p值都在未调整的情况下给出。给出的频率(对于微卫星、SNP和单元型而言)是等位频率,其与携带者频率相反。为了最小化由于被招募为进行连锁分析的家族的患者的亲缘关系引起的任何偏差,一级和二级亲属可以从患者名单中除去。而且,对患者中的任何剩余的亲缘关系,可重复该检验以进行关联性修正,这通过延伸在Risch,N.&Teng,J.(Genome Res.,8:1273-1288(1998))中描述的用于血缘关系的差异调整程序——DNA池(DNA pooling(出处同上))——进行,以便它可以被用于一般的家族关系,并且给出调整和未调整的p值,用于比较。一般而言,如所期望的,差异非常小。为了评估对于多个检验修正的单一标记关联性的显著性,我们可以使用同一基因型数据进行随机性检验。患者和对照组群可以被随机化,并且重新进行关联性分析多次(例如,可达500,000次),并且p值是产生某一标记等位基因的p值的重复的分数,所述某一标记等位基因的p值小于或等于我们使用最初的患者和对照组群观察到的p值。
对于单一标记和单元型分析,可基于乘积模型(单元型相对危险度模型)(Terwilliger,J.D.&Ott,J.,Hum.Hered.42:337-46(1992)and Falk,C.T.&Rubinstein,P,Ann.Hum.Genet.51(Pt 3):227-33(1987)),即人携带的两个等位基因/单元型的风险相乘,计算相对危险度(RR)和群体归因危险度(PAR)。例如,如果RR是A相对于a的风险,那么人纯合子AA的风险将为杂合子Aa的风险的RR倍和纯合子aa的风险的RR2倍。在受影响群体内以及对照群体内,乘积模型具有简化分析和计算的良好性质——单元型是独立的,即在哈迪-温伯格平衡中。因此,受影响的和对照的单元型计数每个具有多项分布,但是在可选假设下,具有不同的单元型频率。具体而言,对于两个单元型,hi和hj,风险(hi)/风险(hj)=(fi/pi)/(fj/pj),其中f和p分别指受影响的群体和对照群体中的频率。尽管如果真实模型不是乘积的,那么具有一些幂损失(power loss),但是该损失除了极端情况,往往轻微。最重要地,因为p值相对于零假设计算,所以p值总是有效的。使用NEMO的连锁不平衡
可以使用D’和r2的标准定义,计算标记对之间的LD(Lewontin,R.,Genetics 49:49-67(1964);Hill,W.G.&Robertson,A.Theor.Appl.Genet.22:226-231(1968))。使用NEMO,两个标记等位基因组合的频率通过最大似然进行估计,并且与连锁平衡的偏差通过似然比检验进行评估。通过平均由边缘等位基因概率(marginal alleleprobabilities)加权的两个标记的所有可能等位基因的组合的值,将D’和r2的定义延伸至包括微卫星。当绘出所有标记组合以阐明在特定区域中的LD结构时,我们在左上角绘出D’并在右下角绘出p-值。在LD绘图中,如果希望,标记可被等距离绘出,而不是根据它们的物理位置。风险评估和诊断
在任何给定的群体内,具有形成疾病或性状的绝对危险度,其被定义为人在给定时间周期内形成特定疾病或性状的机会。例如,女性一生乳腺癌的绝对危险度是1/9。也就是说,每九个女性中的一个在她们的生命的一些时刻将形成乳腺癌。一般地,通过观察非常大量的人而不是特定个体,来测量风险。风险通常以绝对危险度(AR)和相对危险度(RR)给出。使用相对危险度来比较与两个变体相关联的风险或两个不同组的人的风险。例如,它可用于比较具有某一基因型的一组人与具有不同基因型的另一组。对于一种疾病,相对危险度2指一组形成疾病的机会是另一组的两倍。通常地,对于人或人的特异性基因型,给出的风险是与匹配的性别和种族的群体相比的相对危险度。相同性别和种族的两个个体的风险可以以简单的方式进行比较。例如,如果与群体比较,第一个个体具有相对危险度1.5,而第二个具有相对危险度0.5,则与第二个个体相比,第一个个体的风险是1.5/0.5=3。
如本文描述的,某些多态标记和包含这样的标记的单元型被发现可用于乳腺癌的风险评估。风险评估可以包括应用用于诊断对乳腺癌的易感性的标记。发现多态标记的特定等位基因在患有乳腺癌的个体中比在没有诊断出乳腺癌的个体中频率更高。因此,这些标记等位基因在个体中具有检测乳腺癌或对乳腺癌的易感性的预测价值。包含风险标记(例如本发明的标记)的单元型区段或LD区段内的标签标记,可被用作单元型区段或LD区段内其他标记和/或单元型的替代物。具有r2值等于1的标记是风险变体的完美替代物,即,一个标记的基因型完美地预测另一个标记的基因型。具有r2值小于1的标记也可以是风险变体的替代物,或者可选地,表示其相对危险度值与风险变体同样高或可能甚至更高的变体。鉴定的风险变体本身可以不是功能性变体,但是在这种情况中,其与其真正的功能性变体连锁不平衡。本发明包括评估如本文公开的标记的这类替代标记。这类标记在公共数据库中被注释、作图和列出,如本领域普通技术人员所熟知的,或者可以可选地在一组个体中通过对由本发明的标记鉴定的区域或一部分区域进行测序,容易地加以鉴定,并且在所形成的序列组中,鉴定多态性。因此,本领域普通技术人员可以容易地并且无需过多试验,对与本文描述的标记和/或单元型连锁不平衡的替代标记进行基因型分型。在单元型或LD区段内与所检测的风险变体LD的标签标记或替代标记也具有在个体中检测与乳腺癌的关联性或对乳腺癌的易感性的预测价值。与本发明的标记LD的这些标签标记或替代标记也可包含区别单元型的其他标记,因为这些类似地具有检测乳腺癌易感性的预测价值。
在某些实施方式中,可以通过对包含来自个体的基因组DNA的样品评估本文描述的与乳腺癌关联的变体的存在,来实践本发明。这样的评估包括检测至少一个多态标记的至少一个等位基因的存在或不存在,其使用本领域普通技术人员公知的和本文进一步描述的方法进行,并且基于这样的评估的结果,确定样品来源的个体是否处于增加或降低的乳腺癌风险(增加或降低的易感性)中。可选地,本发明可以利用这样的数据集进行实践,所述数据集包含关于本文描述的、与乳腺癌关联的至少一个多态标记(或与本文所示的、与乳腺癌关联的至少一个标记连锁不平衡的标记)的基因型状态的信息。换言之,包含关于这样的遗传状态的信息的数据集可以被用来查询某些风险等位基因在本发明人示出的、与乳腺癌关联的某些多态标记处存在或不存在,所述信息例如以某个多态标记或多个标记处的基因型计数(例如指示某些风险等位基因的存在或不存在)的形式、或一个或多个标记的真实基因型的形式。与乳腺癌关联的变体(例如标记等位基因)的阳性结果,如本文所示,表示数据集来源的个体处于乳腺癌的易感性增加(风险增加)。
在本发明的某些实施方式中,通过将多态标记的基因型数据与查阅表——其包括多态性的至少一个等位基因和乳腺癌之间的相关性——进行比较,将多态标记与乳腺癌相关联。在一些实施方式中,该表包括一个多态性的相关性。在其他实施方式中,该表包括多个多态性的相关性。在两种情况中,通过参看给出标记和乳腺癌之间相关性指示的查阅表,可以在样品来源的个体中,鉴定乳腺癌的风险,或对乳腺癌的易感性。在一些实施方式中,以统计学量度报道相关性。统计学量度可被报告为风险量度,例如相对危险度(RR)、绝对危险度(AR)或优势比(OR)。
本发明的标记和单元型,例如染色体2q14.2、染色体2q35和染色体16q12上的多态标记和单元型,例如表10、表15、表19、表20、表21和表22中给出的标记,和与它们连锁不平衡的标记,例如标记rs4848543、rs13387042和rs3803662,单独或联合,可用于风险评估和诊断目的。因此,甚至在由个体标记导致的风险增加相对有限(即10-30%数量级)的情况下,关联性也可具有显著的牵连(implication)。因此,相对常见的变体可对综合风险具有显著的贡献作用(群体归因危险度高),或者标记的组合可用于限定个体组,所述个体组基于标记的组合风险处于形成该疾病的显著联合风险中。
因此,在本发明的一个实施方式中,多个变体(标记和/或单元型)被用于综合风险评估。在一个实施方式中,这些变体选自本文公开的变体。其他的实施方式包括联合应用本发明的变体与已知可用于诊断对乳腺癌的易感性的其他变体。在这样的实施方式中,确定在个体中多个标记和/或单元型的基因型状态,并且将个体的状态与关联变体的群体频率、或临床上健康的对象例如年龄匹配和性别匹配的对象中变体的频率相比较。本领域已知的方法,例如多元分析或联合风险分析,可随后用于确定基于在多个基因座处的基因型状态赋予的综合风险。基于这类分析的风险评价可随后用于本发明的方法和试剂盒,如本文描述的。
如上所述,人基因组的单元型区段结构具有如此效果:在与疾病或性状最初相关联的变体连锁不平衡的大量变体(标记和/或单元型)可被用作评估与疾病或性状关联性的替代标记。这样的替代标记的数量将取决于因素例如区域中的历史重组率、区域中的突变频率(即区域中多态位点或标记的数量)和区域中LD的程度(LD区段的大小)。这些标记通常位于如使用本文描述的方法或本领域普通技术人员已知的其他的方法所定义的、正被讨论的LD区段或单元型区段的物理边界内。然而,有时标记和单元型关联性被发现延伸超过所定义的单元型区段的物理边界。在那些情况中,这样的标记和/或单元型也可用作物理上位于定义的单元型区段内的标记和/或单元型的替代标记和/或单元型。因此,与本发明的标记和单元型LD(通常特征在于r2大于0.1,例如r2大于0.2,包括r2大约0.3,也包括r2大于0.4)的标记和单元型也在本发明的范围内,即使它们物理上位于本文限定的单元型区段的边界外。这包括本文描述的标记(例如,表10、表15和表19),但是也可包括与在表10、表15和表19中列出的一种或多种标记的强LD(例如特征为r2大于0.1,或r2大于0.2和/或|D’|>0.8)的其他标记。
对于本文描述的SNP标记,与在患者中发现过量的等位基因(风险等位基因)相对的等位基因被发现在乳腺癌中频率降低。这些标记以及处于LD中和/或包含这些标记的单元型,因此保护免于遭受乳腺癌,即它们赋予携带这些标记和/或单元型的个体形成乳腺癌的风险或易感性降低。
在一些情况中,包括某些单元型的本发明的某些变体包含多种遗传标记的组合,例如SNP和微卫星。因此,通过本领域已知的方法和/或本文描述的用于检测多态位点处序列的方法,可进行检测单元型。而且,某些单元型或标记组和疾病表型之间的相关性可以使用标准技术进行检验。相关性的简单检验的代表性实例将是在二乘二列表上进行Fisher精确检验。
在特定实施方式中,发现与乳腺癌相关联的标记等位基因或单元型(例如在表10、表15、表19、表20、表21和表22中列出的标记等位基因和与它们连锁不平衡的标记)是其中标记等位基因或单元型与在健康个体(对照)中存在的频率相比,在处于乳腺癌(受影响)风险中的个体中以更高频率存在的标记等位基因或单元型,其中标记等位基因或单元型的存在表示乳腺癌或对乳腺癌的易感性。在其他实施方式中,发现与乳腺癌关联的一种或多种标记(例如在表10、表15、表19、表20、表21和表22中列出的标记等位基因和与它们连锁不平衡的标记)连锁不平衡的风险标记是标签标记,其与在健康个体(对照)中存在的频率相比,在处于乳腺癌(受影响)的风险中的个体中以更高频率存在,其中标签标记的存在表示对乳腺癌的易感性增加。在进一步的实施方式中,与发现与乳腺癌关联的一种或多种标记(例如,在表10、表15、表19、表20、表21和表22中列出的标记等位基因和与它们连锁不平衡的标记)连锁不平衡的风险标记等位基因(即赋予增加的易感性)是这样的标记,其包含一种或多种等位基因,所述等位基因与在健康个体(对照)中存在的频率相比,在处于乳腺癌风险中的个体中以更高频率存在,其中所述标记的存在表示对乳腺癌的易感性增加。研究群体
在一般意义上,本发明的方法和试剂盒可以用于包含来自任何来源即任何个体的基因组DNA的样品。在优选的实施方式中,个体是人类个体。个体可以是成人、儿童或胎儿。本发明也提供在个体中评估标记和/或单元型,所述个体是目标群体的成员。在一个实施方式中,这样的目标群体是基于以下方面而处于形成该疾病的风险中的一群或一组个体:其他遗传因素、生物标记、生物物理参数(例如体重、BMD、血压)或一般的健康和/或生活方式参数(例如疾病或相关疾病的历史、前疾病诊断、疾病家族史)。
本发明提供实施方式,其包括来自特定年龄亚组的个体,例如那些超过40岁的;超过45岁的;或超过50、55、60、65、70、75、80或85岁的。本发明的其他实施方式涉及其他年龄组,例如年龄在85以下的个体,例如在80岁以下;在75岁以下;或在70、65、60、55、50、45、40、35或30岁以下。其他实施方式涉及个体,其疾病开始时的年龄在上面描述的任何年龄范围内。也考虑的是,在某些实施方式中,年龄范围可以是适中的,例如开始时年龄超过45岁但是小于60岁。然而,也考虑其他的年龄范围,包括上面列出的年龄值包括的年龄范围。而且,本发明涉及任一性别——男性或女性——的个体。在一个实施方式中,其涉及评估男性对象。在另一个实施方式中,其涉及评估女性对象。
冰岛群体是北欧血统的白种人群体。报告在冰岛群体中遗传连锁和关联的许多研究已经在最近几年内出版。那些研究的许多显示在其他群体中变体的复制,所述变体最初在冰岛群体中鉴定为与特定的疾病相关(Stacey,S.N.,等,Nat Genet.May 27 2007(Epub aheadof print;Helgadottir,A.,等,Science 316:1491-93(2007);Steinthorsdottir,V.,等,Nat Genet.39:770-75(2007);Gudmundsson,J.,等,Nat Genet.39:631-37(2007);Amundadottir,L.T.,等,Nat Genet.38:652-58(2006);Grant,S.F.,等,Nat Genet.38:320-23(2006))。因此,一般而言,在冰岛群体中的遗传发现已经在包括来自非洲和亚洲的群体在内的其他群体中复制。
发现与乳腺癌相关的本发明的标记被认为在其他人类群体中显示相似的关联性。因此,也考虑包含各个人类群体的特定实施方式,并且其在本发明的范围内。这样的实施方式涉及来自一个或多个人类群体的人类对象,其包括但不限于白种人群体、欧洲人群体、美洲人群体、欧亚人群体、亚洲人群体、中亚人/南亚人群体、东亚人群体、中东人群体、非洲人群体、西班牙人群体和大洋洲人群体。欧洲人群体包括但不限于瑞典人、挪威人、芬兰人、俄国人、丹麦人、冰岛人、爱尔兰人、凯尔特人、英国人、苏格兰人、荷兰人、比利时人、法国人、德国人、西班牙人、葡萄牙人、意大利人、波兰人、保加利亚人、斯拉夫人、塞尔维亚人、波斯尼亚人、捷克人、希腊人和土尔其人群体。此外,在其他的实施方式中,本发明可以在特定的人类群体中实践,所述人类群体包括班图人、Mandenk、约鲁巴人、桑人、Mbuti Pygmy、奥克尼群岛人、Adygel、俄国人、撒丁岛人、托斯卡纳人、莫扎比特人(Mozabite)、贝多因人、德鲁兹人(Druze)、巴勒斯坦人、俾路支人(Balochi)、布拉灰人(Brahui)、莫克兰人(Makrani)、信德人、帕坦人、布鲁肖人(Burusho)、哈扎拉人、维吾尔人、卡拉什人、汉族人、傣族人、达斡尔人、赫哲族人(Hezhen)、拉枯族人、苗族人、鄂伦春人、畲族人、土家族人、土族人、锡伯族人、彝族人、蒙古族人、纳西族人、柬埔寨人、日本人、雅库特人、美拉尼西亚人、巴布亚人、Karitianan、Surui、Colmbian、玛雅人和比马人。
在一个实施方式中,本发明涉及群体,其包括黑人非洲人血统,例如包含非洲人血统(descent)或系谱(lineage)的人的群体。黑人非洲人血统可通过自己报告确定为非洲人-美国人、非洲裔美国人、黑人美国人,其为黑色种族成员或为黑人种族成员。例如,非洲人美国人或黑人美国人是生活在北美洲并且起源于任何非洲黑色种族的那些人。在另一实例中,自己报告的黑人非洲人血统的人可具有至少一个黑人非洲人血统的父母或至少一个黑人非洲人血统的祖父母。
个体对象中种族的作用也可通过遗传分析确定。血统的遗传分析可使用未连锁的微卫星标记例如在Smith等在Am J HumGenet 74,1001-13(2004)中提出的那些进行。
在某些实施方式中,本发明涉及在如上所述的特定群体中鉴定的标记和/或单元型。本领域普通技术人员将理解,当运用到不同的群体中时,连锁不平衡(LD)的量度可给出不同的结果。这归因于不同的人类群体的不同的群体历史以及可能已经导致在特定的基因组区域中的LD差异的差示选择压。本领域普通技术人员也熟知的是,某些标记例如SNP标记,在一个群体中是多态的,而在另一个群体中不是多态的。然而,本领域普通技术人员将运用可利用的和本文考虑的方法在任何给定的人类群体中实践本发明。这可包括评估本发明的LD区域中的多态标记,以鉴定在特定的群体内给出最强关联性的那些标记。因此,本发明的风险变体可存在于不同的单元型背景上,并且以不同频率存在于各种人类群体中。然而,应用本领域已知的方法和本发明的标记,本发明可以在任何给定的人类群体中进行实践。遗传检测的应用
本领域普通技术人员将明白和理解,一般而言,本文描述的变体本身没有提供形成乳腺癌的个体的绝对鉴定。然而,本文描述的变体确实表明携带本发明的风险性或保护性变体的个体形成乳腺癌的可能性增加和/或降低。然而,该信息本身是极有价值的,如在下面更详细概述的,因为其可用于疾病治疗和适当治疗选项的选择。
关于赋予形成疾病(例如乳腺癌)风险的遗传性变型的知识提供这样的机会:运用遗传学检测来区分具有增加的形成疾病风险的个体(即风险变体的携带者)和那些具有降低的形成疾病风险的个体(即保护性变体的携带者)。对于属于上述的两个组的个体而言,遗传学检测的核心价值是能够在早期诊断该疾病或该疾病诱因,以及给临床医师提供关于疾病的预后/攻击性的信息的可能性,以便能运用最适当的治疗。预测乳腺癌遗传风险的模型
乳腺癌风险评估的目标是对所有女性提供发展个人医疗管理策略的合理框架,其目的是增加高风险女性的存活率和生活品质,同时最小化低风险女性的成本、不必要的介入和忧虑。风险预测模型试图估计个体的乳腺癌风险,所述个体具有给定一组的先天风险特性(例如家族史、在先的良性乳腺病变、早先的乳腺肿瘤)。最通常用于临床实践的乳腺癌风险评估模型通过考虑家族史估计遗传风险因素。该风险估计基于具有一个或多个以前诊断患有乳腺癌的近亲属的个体风险增加的观察。他们没有考虑复杂的谱系结构。这些模型具有如此进一步的缺点——其不能将具有乳腺癌易感突变的基因的携带者和非携带者区分开。
更完善的风险模型具有更好处理具体家族史的机制并具有考虑BRCA1和BRCA2突变的携带者状态的能力。例如,疾病发生和携带者估计算法的乳腺和卵巢分析(Breast and Ovarian Analysis ofDisease Incidence and Carrier Estimation Algorithm)(BOADICEA)(Antoniou et al.,2004)通过血统分析程序MENDEL,基于个体谱系结构而考虑家族史。关于已知的BRCA1和BRCA2状态的信息也被考虑。BOADICEA和目前应用的所有其他的乳腺癌风险模型的主要的限制是它们没有并入来自其他诱因基因的基因型信息。当前的模型强烈地依赖于家族史来用作替代物,以补偿非BRCA风险遗传决定子知识缺乏。因此,可用的模型限于如此情况:其中具有已知的疾病家族史。低外显率乳腺癌诱因基因在群体中可能是相对共同的,并且可能不示出强的促进家族簇集的倾向,如BRCA1和BRCA2基因所示出的倾向。具有相对高的诱因等位基因的遗传负荷的患者可能示出很少或没有疾病家族史。因此需要构建模型,其并入通过基于基因的试验直接获得的遗传易感性数据。除使模型更精确之外,这也将减少对家族史参数的依赖性,并帮助将该风险预测(risk profiling)延伸到更广的风险群体,其中家族史不是如此关键的因素。将改善的遗传风险模型整合到乳腺癌初级预防的临床管理
目前临床初级预防选择可以分类为化学预防(或激素)治疗和预防手术。被鉴定为高风险的患者可以被规定长期化学预防疗法。该概念在心血管医学领域得到充分的接受,但是现在仅仅开始在临床肿瘤学中产生影响。最广泛使用的肿瘤学化学预防剂是他莫昔芬,一种选择性雌激素受体调节剂(SERM)。他莫昔芬最初用作针对乳腺癌复发的佐剂治疗,现在,他莫昔芬已经证明作为乳腺癌预防剂的效力(Cuzick et al.,2003;Martino et al.,2004)。FDA已经批准应用他莫昔芬在某些高风险女性中作为化学预防剂。
不幸地,长期使用他莫昔芬增加子宫内膜癌的风险大约2.5倍,静脉血栓形成的风险大约2.0倍。肺栓塞、中风和白内障的风险也被增加(Cuzick et al.,2003)。因此,他莫昔芬用于减少乳腺癌发生率的益处可能不容易被转换为综合死亡率的相应降低。称为雷洛昔芬的另一SERM在预防模式中可能更有效,并且没有带来相同的子宫内膜癌的风险。然而,血栓形成的风险在长期用雷洛昔芬治疗的患者中仍然升高(Cuzick et al.,2003;Martino et al.,2004)。而且,他莫昔芬和雷洛昔芬都具有与它们相关的生活质量问题。在化学预防模式中为了产生SERM治疗的合理的风险:收益分析,存在鉴定处于乳腺癌最大风险的个体的临床需要。假定乳腺癌的大比例风险是遗传的,在这方面清楚地存在定量个体风险的遗传试验的临床需要。可以预期相似的问题从任何可能变成可用的未来癌症化学预防治疗中出现,例如芳香酶抑制剂。此外,随着化学预防治疗越来越安全,鉴定这样的患者的的需要增加,所述患者是遗传易感的,但是没有与BRCA1&2携带者相关联的大规模升高的风险。
鉴定为处于乳腺癌高风险的患者被考虑进行预防手术;两侧乳腺切除术或卵巢摘除术或两者。明显地,这样的猛烈的治疗仅仅对察觉处于极端高风险的患者推荐。实际上,这样的风险目前仅仅可以在携带BRCA1、BRCA2或已知涉及罕见的乳腺癌诱因综合症的基因如Li-Fraumeni综合症中的p53、Cowden综合症中的PTEN的个体中被鉴定。
当BRCA1和BRCA2突变源自于多病例家族时它们的外显率的估计值倾向于比当它们源自于基于群体的估计时更高。这是因为携带不同突变的家族显示不同的乳腺癌外显率(参见例如Thorlaciuset al.,1997)。有助于该变化的一个主要因素是至今未知的诱因基因的作用,其作用为修饰BRCA1和BRCA2突变的外显率。因此,携带BRCA1或BRCA2基因突变的个体的绝对风险在缺少修饰基因存在和作用的知识的情况下不能被精确地量化。因为BRCA1和BRCA2携带者的治疗选择可能是严重的,所以就此而言,以更大的准确性量化个体BRCA携带者风险是重要的。因此,存在鉴定诱因基因并基于这些基因发展改善的风险评估模型的需要,该诱因基因的作用为修饰BRCA1和BRCA2携带者中乳腺癌的外显率。
此外,存在察觉到处于非常高的乳腺癌风险的个体,或许因为强的乳腺癌家族史,但是在他们中,没有已知诱因基因的突变可以被鉴定。在此情况下,考虑预防手术是困难的,因为不能检验个体以发现她是否已经遗传高外显率诱因基因。因此,个体风险不能被精确地评估。因此,对于鉴定任何保持未被发现的高外显率诱因基因和发展相关联的用于初级预防策略的遗传检验,存在明显的临床需要。早期诊断
在大多数西方国家,乳腺癌的临床筛选由周期性临床乳房检查(CBE)和X射线乳房X线照相术组成。有良好的证据表明CBE当用于好的乳房X线照相术筛选计划的情况中时,具有很少的附加的利益。在英国,介于50和70岁年龄之间的女性被邀请每三年进行筛选乳房X线照相术。在美国的情况根据医护人员而改变,然而,美国癌症学会推荐从40岁每年进行乳房X线照相术筛选。乳房X线照相术筛选在减少超过50岁的筛选女性中的死亡率方面已经证明有效。
遗传检验将不可能永远用作降低现有乳房X线照相术筛选计划门槛的工具。然而,乳房X线照相术筛选并非没有缺点,可以想到,遗传检验应该被用于选择用于增加的筛选计划的人。乳房X线照相术筛选的缺点之一是其迄今不能证明对50岁以下筛选的女性的改善生存方面的显著作用。
乳房X线照相术在50岁以下女性中较不有效的一个原因可能是在较年轻女性中乳房组织的密度更高,这使肿瘤的乳房X线照相术检测更困难。然而,在易感个体中乳腺癌倾向于在年轻年龄组中发生,并且在高乳房密度和乳腺癌风险之间具有明显的关联性。因此,在具有高诱因的个体的乳房X线照相术筛选中具有简单增加的问题,这是因为他们是在最高风险的组中由不最理想地进行的技术所处理的。最近的研究已经表明与乳房X线照相术筛选相比,对比增强磁共振成像(CE-MRI)更灵敏,并且在更早的阶段在该高风险组中检测到肿瘤(Warner et al.,2004;Leach et al.,2005)。CE-MRI策略当与常规X射线乳房X线照相术组合使用时,运行特别良好(Leach et al.2005)。因为CE-MRI要求专员中心,其招致高成本,所以在50岁以下的筛选必须限于处于最高风险的那些个体。目前的CE-MRI试验限于具有BRCA1、BRCA2或p53突变或非常强的疾病家族史的那些个体进入。该筛选模式扩展到较宽范围的高风险患者将通过提供基于基因的风险预测工具而得到极大的帮助。
有很好的证据支持这样的概念:在遗传易感女性中早期发作的乳腺癌和发生的癌症比在年长的、较不强易感的女性中生长得更快。这来自在年轻女性中更高比率的间期癌(interval cancer)这一观察结果,也就是说,在充分筛选的群体中,筛选访问之间的间期中出现癌症在年轻女性中更多。因此,建议筛选间期——无论什么方法——对于年轻女性应该缩小。这里存在矛盾,因为似乎需要对乳腺癌总比率相当低的年龄组使用更昂贵的方法进行更频繁的筛选。这里存在这样的明显临床需求:早期鉴定处于形成该疾病的最强易感性的那些年轻个体,并引导他们进入更昂贵的和广泛的筛选方案。治疗
目前,原发性乳腺癌通过手术、辅助化学疗法、放射治疗,然后进行长期的激素疗法来治疗。经常,使用三种或四种疗法的组合。
具有相同疾病阶段的乳腺癌患者对于辅助化学疗法可以具有非常不同的反应,这导致综合治疗结果方面较宽的变化。一致性方针(Consensus guidelines)(St Galen和NIH标准)已被开发用于确定乳腺癌患者对于辅助化学疗法治疗的合格性。然而,甚至最强的临床和组织学转移预测值也不能精确预测乳房肿瘤的临床反应(Goldhirsch etal.,1998;Eifel et al.,2001)。化学疗法或激素疗法减少转移的风险仅仅大约1/3,然而,接受该治疗的70-80%的患者没有它的情况下存活。因此,目前,大多数乳腺癌患者被提供无效的或不必要的治疗。在预后量度的发展中明显存在改善的临床需要,所述预后量度将使临床医师对将最受益的那些更适当地改变治疗。期望预测个体的遗传易感性可显示与他们的治疗结果相关的信息并从而帮助合理治疗设计是合理的。
几个先前研究例证了该概念:当用辅助化学疗法治疗时,乳腺癌患者——其是BRCA突变携带者——似乎示出更好的临床反应率和存活[Chappuis,et al.,(2002),J Med Genet,39,608-10;Goffin,et al.,(2003),Cancer,97,527-36]。对于卵巢癌,与非携带者相比,BRCA突变携带者显示出对铂化学疗法具有改善的反应[Cass,et al.,(2003),Cancer,97,2187-95]。相似的考虑可运用于其中涉及的基因未知的易感患者。例如,已知浸润小叶乳腺癌(ILBC)具有强的家族性成分,但是涉及的遗传性变型还没有被鉴定。ILBC患者显示对常见化学疗法方案更差的反应[Mathieu,et al.,(2004),Eur J Cancer,40,342-51]。
遗传易感性模型不但可帮助治疗策略的个人化,而且可在这些策略的设计中起完整的作用。例如,已发现,由于它们的缺陷DNA修复通路,BRCA1和BRCA2突变肿瘤细胞对聚(ADP-核糖)聚合酶(PARP)抑制剂极度敏感[Farmer,et al.,(2005),Nature,434,917-21]。考虑到它们特别用于BRCA携带者患者,这已经刺激靶向PARP的小分子药物的开发。从这个实例可知,显然遗传易感性的知识可鉴定药物靶,其导致与遗传风险预测结合使用的个人化化学疗法方案的发展。
癌症化学疗法对正常组织特别是高度增殖造血和肠上皮细胞隔膜具有公知的剂量限制的副作用。可以预期,在正常组织对细胞毒性药物的灵敏性方面存在基于遗传的个体差异。这些因素的理解可能帮助合理治疗设计和开发被设计来保护正常组织免于化学疗法副作用的药物。
遗传预测也可有助于改善的放射治疗方法:在进行标准放射治疗方案的乳腺癌患者组内,一部分患者将经历对正常耐受的辐射剂量的不良反应。急性反应包括红疹、湿性脱皮(moist desquamation)、浮肿和辐射性肺炎。包括毛细管扩张、浮肿、肺纤维化和乳房纤维化的长期反应可在放射治疗许多年后出现。急性反应和长期反应都是发病的重要来源,并且可能是致命的。在一个研究中,87%的患者被发现对放射治疗具有一些不良副作用,而11%具有严重的不良反应(LENT/SOMA Grade 3-4);[Hoeller,et al.,(2003),Int J Radiat OncolBiol Phys,55,1013-8]。对放射治疗经历不良反应的可能性主要是由于在正常的组织反应方面固有的个体差异,并且怀疑这些具有强的遗传成分。几个已知的乳腺癌诱因基因(例如BRCA1、BRCA2、ATM)影响DNA双链断裂修复的通路。DNA双链断裂是放射治疗诱发的主要的细胞毒性损害。这已经导致这样的顾虑:通过携带属于这些通路的基因变体而对乳腺癌遗传上易感的个体也可能处于遭受放射治疗引起的过量正常组织损伤的更高风险。
在群体中组成型放射敏感的个体的存在指大多数患者群体的放射治疗剂量率必须被限制,以便保持不良反应的频率为可接受水平。因此,对于可鉴定对放射治疗的不良反应风险升高的个体的可靠检验存在临床需要。这样的检验将对放射敏感的个体指出保守的或替代治疗,而对相对耐辐射的大多数患者允许放射治疗剂量的增加。已经估计通过简单地分类乳腺癌患者为放射敏感的、中等的和耐辐射的类型的试验使剂量不断增加成为可能,这将导致大约35%的局部肿瘤控制增加以及后继的存活率的改善(Burnet et al.,1996)。
暴露于电离辐射是促进乳房中肿瘤发生的一个被证实的因素(Dumitrescu和Cotarla 2005)。已知的乳腺癌诱因基因编码对辐射诱导的DNA损伤进行细胞应答的通路成分(Narod和Foulkes 2004)。因此,担忧第二原发性乳腺肿瘤的风险可能通过在放射治疗区域内照射正常的组织而增加。对于BRCA携带者,这似乎没有任何来自放射治疗的可测量的风险增加,然而它们的第二原发性肿瘤的风险已经特别高。有证据表明第二原发性肿瘤的风险在放射治疗的ATM和CHEK2基因的乳腺癌易感等位基因携带者中增加(Bernstein et al.,2004;Broekset al.,2004)。预期来自放射治疗(和也许来自密集的乳房X线照相术筛选)的第二原发性肿瘤的风险将通过在治疗计划阶段从患者获得精确的遗传风险概况来更好地限定。二级预防
大约30%的诊断患有1期或2期乳腺癌的患者将经历她们的原始肿瘤的局部-区域性复发或远侧转移性复发。当已经进行乳房保守外科手术时,或者在对侧乳房或者在同侧乳房,不具有原发性乳腺癌的患者也具有诊断患有第二原发性肿瘤的极大增加的风险。二级预防指用于防止复发或第二原发性肿瘤发生的方法。目前应用的方法包含:用他莫昔芬或另一SERM单独长期治疗或与芳香酶抑制剂交替长期治疗、对侧乳房的降低风险的乳房切除术和减少风险的卵巢切除术(在处于家族性乳腺癌-卵巢癌的风险中的患者)。关于利用他莫昔芬的考虑因素已在上面讨论。对于降低风险的手术选择,显然该风险需要尽可能被量化,以便得到告知的成本:收益分析。
存在一些迹象:对乳腺癌具有已知的遗传易感性的患者比大多数患者生活更差。携带CHEK2基因1100delC变体的患者与非携带者相比,具有估计的2.8倍的远侧转移风险增加和3.9倍的疾病复发风险增加[de Bock,et al.,(2004),J Med Genet,41,731-5]。BRCA1节阴性肿瘤患者比没有携带BRCA1突变的相似患者具有更大的转移风险[Goffin,et al.,(2003),Cancer,97,527-36;Moller,et al.,(2002),Int JCancer,101,555-9;Eerola,et al.,(2001),Int J Cancer,93,368-72]。因此,遗传预测可用于帮助评估局部复发和转移的风险,从而指导二级预防治疗的选择。
一般而言,具有原发性肿瘤诊断的患者以0.7%的年恒定发生率处于第二原发性肿瘤的风险中(Peto和Mack 2000)。具有BRCA突变的患者比大多数乳腺癌患者处于明显更大的第二原发性肿瘤风险中,其绝对风险在40-60%的范围内(Easton 1999)。BRCA突变的携带者对于第二原发性肿瘤具有极大的风险增加[Stacey,et al.,(2006),PLoS Med,3,e217;Metcalfe,et al.,(2004),J Clin Oncol,22,2328-35]。具有CHEK2基因突变的患者具有估计的5.7倍增加的对侧乳腺癌风险[de Bock,et al.,(2004),J Med Genet,41,731-5]。BARD1 Cys557Ser变体的携带者以2.7倍更可能诊断患有第二原发性肿瘤[Stacey,et al.,(2006),PLoS Med,3,e217]。遗传风险预测可用于在患者中评估第二原发性肿瘤的风险,并且将告知预防措施应该为多大攻击性的决定。方法
乳腺癌的风险评估和诊断的方法在本文描述,并且由本发明所包括。本发明也包括评估个体应答乳腺癌治疗剂的概率的方法,以及预测乳腺癌治疗剂有效性的方法。本发明也包括分析来自对象的样品以检测对乳腺癌的易感性的试剂盒。诊断和筛选分析
在某些实施方式中,本发明涉及通过检测遗传标记处特定等位基因来诊断或辅助诊断乳腺癌或对乳腺癌的易感性的方法,所述遗传标记处特定等位基因在乳腺癌对象或易感乳腺癌的对象中以更高频率出现。在具体的实施方式中,本发明是通过检测至少一个多态标记(例如,本文描述的标记)的至少一个等位基因来诊断对乳腺癌的易感性的方法。本发明描述这样的方法,经由该方法,特定标记的特定等位基因或单元型的检测表示对乳腺癌的易感性。这样的预示或预测分析也可用于在乳腺癌症状开始前,确定对象的预防治疗。在一些实施方式中,本发明涉及诊断的临床应用的方法,例如通过医学专业人员进行的诊断。在其他实施方式中,本发明涉及由非专业人员进行诊断或确定易感性的方法。基因型分型技术中近来的技术的进步,包括SNP标记的高通量基因型分型,例如分子倒置探针阵列技术(例如Affymetrix GeneChip)和BeadArray技术(例如Illumina GoldenGate和Infinium分析),已经使个体在相对低的成本下使他们自己的基因组同时得到高达一百万SNP的评估成为可能。个体可获得的所形成的基因型信息可以与关于不同SNP相关的疾病或性状风险相关的信息的公开文献进行比较。如本文描述的疾病相关等位基因的诊断运用,因此可由个体通过他的/她的基因型数据分析进行,或由健康专业人员基于临床检验的结果进行。换言之,基于遗传风险的易感性的诊断或评估可由健康专业人才、遗传顾问或非专业人员,基于他的/她的基因型和关于不同风险因素的公开信息而进行。在本文中,术语“诊断”、“易感性的诊断”和“确定易感性”旨在指任何可用的诊断方法,其包括上述的那些。
另外,在某些其他实施方式中,本发明涉及通过检测特定的遗传标记等位基因或单元型,诊断或辅助诊断对乳腺癌的易感性降低的方法,所述遗传标记等位基因或单元型在乳腺癌患者中比没有诊断出乳腺癌的个体中或一般群体中以更低频率出现。
如本文描述和示例的,特定标记等位基因或单元型(例如,位于rs4848543LD区段、rs13387042LD区段、rs3803662LD区段、STEAP3/TSAP6基因内的标记,在表10、表15、表19、表20、表21和表22中列出的标记和单元型,以及与它们连锁不平衡的标记)与乳腺癌(例如所有BC和/或MedPre乳腺癌)相关联。在一个实施方式中,标记等位基因或单元型是赋予显著的乳腺癌风险或对乳腺癌的易感性的标记等位基因或单元型。在另一实施方式中,本发明涉及在人类个体中诊断对乳腺癌的易感性的方法,该方法包括确定至少一个多态标记的至少一个等位基因在从该个体获得的核酸样品中存在或不存在,其中所述至少一个多态标记选自位于rs4848543LD区段、rs13387042LD区段、rs3803662LD区段、STEAP3/TSAP6基因内的多态标记,在表10、表15、表19、表20、表21和表22中列出的标记和单元型,以及与它们连锁不平衡的标记(例如定义为r2>0.2)。在另一实施方式中,本发明涉及在人类个体中诊断对乳腺癌的易感性的方法,其通过筛选至少一个标记等位基因或单元型,例如位于rs4848543LD区段、rs13387042LD区段、rs3803662LD区段、STEAP3/TSAP6基因内的标记,在表10、表15、表19、表20、表21和表22中列出的标记和单元型,以及与它们连锁不平衡的标记而进行。在另一实施方式中,所述标记等位基因或单元型与在健康对象(对照,例如群体对照)中存在的频率相比,在患有或易感乳腺癌(受影响的,所有BC或MedPre乳腺癌)的对象中以更高频率存在。在另一个实施方式中,本发明涉及在人类个体中诊断对乳腺癌的易感性的方法,该方法包括确定至少一个多态标记的至少一个等位基因在从该个体获得的核酸样品中存在或不存在,其中所述至少一个多态标记选自标记rs4848543、标记rs13387042、标记rs3803662和与它们连锁不平衡的标记。在某些实施方式中,至少一个标记等位基因或单元型的关联性的显著性的特征为p值<0.05。在其他实施方式中,关联性的显著性的特征为较小的p值,例如<0.01、<0.001、<0.0001、<0.00001、<0.000001、<0.0000001、<0.00000001或<0.000000001。
在这些实施方式中,至少一个标记等位基因或单元型的存在表示对乳腺癌的易感性。这些诊断方法包括检测存在或不存在与乳腺癌相关的至少一个标记等位基因或单元型。本文描述的单元型包括不同遗传标记(例如SNP、微卫星)处的等位基因的组合。组成特定单元型的特定遗传标记等位基因的检测可以通过本文描述的和/或本领域已知的多种方法进行。例如,遗传标记可以在核酸水平(例如,通过直接核苷酸测序或通过本领域普通技术人员已知的其他方法)或在氨基酸水平——如果遗传标记影响乳腺癌关联核酸编码的蛋白质的编码序列的话——(例如通过蛋白质测序或者通过使用识别这类蛋白质的免疫测定)进行检测。本发明的标记等位基因或单元型相应于与乳腺癌相关的基因组DNA序列的片段。这类片段包括正被讨论的多态标记或单元型的DNA序列,但是也可包括与所述标记或单元型强LD(连锁不平衡)的DNA片段(例如,通过r2的值大于0.2和/或|D’|>0.8确定的)。
在一个实施方式中,对乳腺癌的易感性的诊断可以使用杂交方法,例如DNA分析、RNA分析和/或原位杂交进行(参见CurrentProtocols in Molecular Biology,Ausubel,F.等,eds.,John Wiley&Sons,包括所有的附录)。来自检测对象或个体、具有基因组DNA、RNA或cDNA的生物样品(“检测样品”)从怀疑患有、易感或易患乳腺癌的对象(“检测对象”)获得。对象可以是成人、儿童或胎儿。检测样品可以来自包含基因组DNA的任何来源,例如血样;羊水样品;脑脊液样品;或者来自皮肤、肌肉、口腔、或结膜粘膜、胎盘、胃肠道或其他器官的组织样品。来自胎细胞或组织的DNA检测样品可以通过适当的方法获得,例如通过羊膜穿刺术或绒毛膜绒毛取样。然后检验DNA、RNA或cDNA样品。特异性标记等位基因的存在可以通过对特定等位基因特异性的核酸探针的序列特异性杂交来表示。一个以上特异性标记等位基因或特异性单元型的存在可以通过使用数种序列特异性核酸探针来表示,所述探针的每一个对特定的等位基因特异性。在一个实施方式中,单元型可以通过对特异性单元型特异性(即与包含所述单元型特有的特异性标记等位基因的DNA链特异性杂交)的单个核酸探针表示。序列特异性探针可以涉及与基因组DNA、RNA或cDNA杂交。如本文使用的“核酸探针”可以是DNA探针或RNA探针,其与互补序列杂交。本领域普通技术人员将明白如何设计这样的探针,以便序列特异性杂交将仅当特定等位基因存在于来自检测样品的基因组序列中时发生。
为了诊断对乳腺癌的易感性,通过将含有乳腺癌关联核酸的检测样品(例如基因组DNA样品)与至少一种核酸探针接触,形成杂交样品。检测mRNA或基因组DNA的非限定性实例是标记的、能与本文描述的mRNA或基因组DNA序列杂交的核酸探针。核酸探针可以是例如,全长核酸分子或其一部分,例如至少15、30、50、100、250或500个核苷酸长度的寡核苷酸,其在严格条件下足以特异性地与适当的mRNA或基因组DNA杂交。例如,核酸探针可以包含如本文描述的SEQ ID NO:4、SEQ IN NO:5或SEQ ID NO:6中列出的的核苷酸序列的全部或一部分,rs4848543LD区段、rs13387042LD区段、rs3803662LD区段和/或STEAP3/TSAP基因的核苷酸序列的全部或一部分,任选地其包含本文描述的标记的至少一个等位基因或本文描述的至少一个标记或单元型(例如表10、表15、表19、表20、表21和表22中列出的标记和单元型,以及与它们连锁不平衡的标记),或者探针可以是这类序列的互补序列。在具体的实施方式中,核酸探针是如本文描述的SEQ ID NO:4、SEQ IN NO:5或SEQ ID NO:6中列出的的核苷酸序列的一部分;或rs4848543LD区段、rs13387042LD区段、rs3803662LD区段和/或STEAP3/TSAP基因的核苷酸序列的一部分,任选地其包含本文描述的标记的至少一个等位基因(例如表10、表15、表19、表20、表21和表22中列出的标记和单元型,以及与它们连锁不平衡的标记)或包含在本文描述的单元型内的至少一个等位基因,或者探针可以是这类序列的互补序列。用于本发明的诊断分析的其他适合的探针在本文描述。可以通过本领域普通技术人员已知的方法进行杂交(参见例如,Current Protocols in Molecular Biology,Ausubel,F.等,eds.,John Wiley&Sons,包括所有的附录)。在一个实施方式中,杂交指特异性杂交,即没有错配的杂交(精确杂交(exact hybridization))。在一个实施方式中,特异性杂交的杂交条件是高度严格的。
特异性杂交——如果存在,那么使用标准方法检测。如果特异性杂交在核酸探针与检测样品中乳腺癌关联核酸之间发生,那么该样品含有与在核酸探针中存在的核苷酸互补的等位基因。可对本发明的其他标记或组成本发明单元型的标记重复该过程,或者同时使用多个探针,以同时检测一个以上标记等位基因。也可能设计含有特定单元型的一个以上标记等位基因的单一探针(例如含有与组成特定单元型的2个、3个、4个、5个或全部标记互补的等位基因)。检测在样品中单元型中的特定标记表示所述样品的来源具有特定单元型(例如单元型),因此是乳腺癌易感的。
在一个优选的实施方式中,利用在其3’端包含荧光部分或基团并且在其5’端包含猝灭剂的检测寡核苷酸探针、以及增强子寡核苷酸的方法被使用,如Kutyavin等描述的(Nucleic Acid Res.34:e128(2006))。荧光部分可以是Gig Harbor Green或Yakima Yellow或其它适当的荧光部分。设计检测探针以与包含待检测的SNP多态性的短核苷酸序列杂交。优选地,SNP是在从末端残基至自检测探针的3’端开始的-6残基之间的任何地方。增强子是短的寡核苷酸探针,其与相对于检测探针的DNA模板3’端杂交。设计探针以致当检测探针和增强子核苷酸探针都结合到模板时,在检测探针和增强子核苷酸探针之间存在单核苷酸缺口。该缺口产生合成的、内切核酸酶例如内切核酸酶IV识别的脱碱基位点。该酶将染料从完全互补的检测探针切割开,但是不切割包含错配的检测探针。因此,通过测量释放的荧光部分的荧光,可以进行由检测探针的核苷酸序列限定的特定等位基因存在性的评估。
检测探针可以是任何适当的大小,但是优选地探针是相对短的。在一个实施方式中,探针的长度为5-100个核苷酸。在另一实施方式中,探针的长度为10-50个核苷酸,并且在另一实施方式中,探针的长度为12-30个核苷酸。其他长度的探针是可能的,并且在本领域普通技术人员的技术范围内。
在优选的实施方式中,在检测之前,包含SNP多态性的DNA模板通过聚合酶链式反应(PCR)被扩增。在这样一个实施方式中,扩增的DNA作为检测探针和增强子探针的模板。
检测探针、增强子探针和/或用来通过PCR扩增模板的引物的某些实施方式包括应用修饰碱基,其包括修饰的A和修饰的G。修饰碱基的应用可以被用于根据模板DNA调节核苷酸分子(探针和/或引物)的解链温度,例如用于在包含低百分比G或C碱基的区域中增加解链温度,其中可以使用具有与其互补的T形成三个氢键的能力的修饰的A,或者用语在包含高百分比的G或C碱基的区域中降低解链温度,例如通过使用修饰的G碱基,其在双链DNA分子中与其互补的C碱基仅形成两个氢键。在优选的实施方式中,修饰碱基被用于设计检测核苷酸探针。本领域技术人员已知的任何修饰碱基可在这些方法中被选择,并且基于本文的教导和从技术人员已知的商业来源可获得的已知碱基,适当碱基的选择在本领域普通技术人员的范围内。
在另一个杂交方法中,RNA分析(参见Current Protocols inMolecular Biology,Ausubel,F.等,eds.,John Wiley&Sons,出处同上)被用于鉴定与乳腺癌相关的多态性的存在。对于RNA分析,RNA检测样品通过适当方式从对象获得。如本文所述,核酸探针与来自对象的RNA的特异性杂交表示与探针互补的特定等位基因。对于核酸探针应用的代表性实例参见例如美国专利号5,288,611和4,851,330。
另外或可选地,除了核酸探针之外或者代替核酸探针,在本文描述的杂交方法中可以使用肽核酸(PNA)探针。PNA是具有肽样、无机骨架例如N-(2-氨乙基)甘氨酸单元的DNA模拟型,其中有机碱基(A、G、C、T或U)经由亚甲基羰基连接子连接到甘氨酸氮(参见例如,Nielsen,P.等,Bioconjug.Chem.5:3-7(1994))。PNA探针可以被设计,以与样品中的分子特异性杂交,该样品被怀疑含有一个或多个与乳腺癌相关的标记等位基因或单元型。因此,PNA探针的杂交对于乳腺癌或乳腺癌易感性是诊断性的。
在本发明的一个实施方式中,收集含有从对象中获得的基因组DNA的检测样品,并且使用聚合酶链式反应(PCR)扩增包含本发明的一个或多个标记或单元型的片段。如本文描述的,鉴定与乳腺癌相关的特定标记等位基因或单元型可以使用多种方法来实现(例如序列分析、通过限制性消化的分析、特异性杂交、单链构象多态性分析(SSCP)、电泳分析等)。在另一实施方式中,通过使用定量PCR(动力学热循环)的表达分析完成诊断。该技术可以例如利用商业可获得的技术例如(Applied Biosystems,Foster City CA)。该技术可以评估在由与乳腺癌关联的核酸编码的多肽或剪接变体(一种或多种)的表达或组成方面变化的存在。此外,变体(一种或多种)的表达可以被量化为物理上或功能上不同。
在本发明的另一方法中,通过限制性消化的分析可用于检测特定的等位基因,如果该等位基因导致相对于参考序列限制性位点产生或消除的话。可以进行限制性片段长度多态性(RFLP)分析,例如,如在出处同上的Current Protocols in Molecular Biology中描述的。相关DNA片段的消化模式表示该特定的等位基因在样品中存在或不存在。
序列分析也可以用于在与乳腺癌相关联的多态位点(例如表10、表15、表19、表20、表21和/或表22的多态标记和单元型,以及与它们连锁不平衡的标记)处检测特异性等位基因。因此,在一个实施方式中,确定特定标记等位基因或单元型存在或不存在包括对从对象或个体获得的DNA或RNA检测样品进行序列分析。PCR或其他适当的方法可用于扩增乳腺癌关联核酸的一部分,并且然后可通过测序样品中基因组DNA的多态位点(或单元型中多个多态位点)而直接检测特异性等位基因的存在。
等位基因-特异性寡核苷酸也可用于在乳腺癌关联核酸处检测特定等位基因的存在性(例如表10、表15、表19、表20、表21和表22的多态标记和单元型,以及与它们连锁不平衡的标记),这通过应用扩增的寡核苷酸与等位基因-特异性寡核苷酸(ASO)探针的斑点印迹杂交(dot-blot hybridization)而进行(参见,例如,Saiki,R.et al.,Nature,324:163-166(1986))。“等位基因-特异性寡核苷酸”(本文也称为“等位基因-特异性寡核苷酸探针”)是大约10-50个碱基对或大约15-30个碱基对的寡核苷酸,其与乳腺癌关联核酸特异性杂交,并且其在多态位点包含特异性等位基因(例如本文描述的标记或单元型)。对一个或多个特定乳腺癌关联核酸特异性的等位基因-特异性寡核苷酸探针可使用标准方法进行制备(参见,例如Current Protocols in Molecular Biology,同上)。PCR可被用于扩增期望的区域。含有该扩增区域的DNA可使用标准方法进行斑点-印迹(参见,例如Current Protocols in Molecular Biology,同上),并且印迹可与寡核苷酸探针相接触。然后,可以检测探针与扩增的区域的特异性杂交的存在。等位基因-特异性寡核苷酸探针与来自对象的DNA特异性杂交表示在与乳腺癌相关联的多态位点的特异性等位基因(参见,例如Gibbs,R.et al.,Nucleic Acids Res.,17:2437-2448(1989)和WO 93/22456)。
在加入这些类似物作为锁核酸(locked nucleic acid,LNA)的情况下,引物和探针的大小可被减少至8个碱基。LNA是一类新的双环DNA类似物,其中呋喃糖环中的2′和4′位置经由O-亚甲基(氧-LNA)、S-亚甲基(硫-LNA)或氨基亚甲基(氨基-LNA)部分加以连接。所有这些LNA变体的共同之处是对互补核酸的亲和性,到目前为止,这是对于DNA类似物所报道的最高亲和性。例如,特定的全氧-LNA九聚体已示出当与互补DNA或RNA复合时具有64℃和74℃的解链温度(Tm),与之相反,对于相应的DNA九聚体,对于DNA和RNA为28℃。当LNA单体与标准DNA或RNA单体结合使用时,也获得Tm的实质性增加。对于引物和探针,依赖于包括LNA单体的位置(例如,3′端、5′端或中间),Tm可以大量增加。
在另一实施方式中,与来自对象的靶核酸序列片段互补的寡核苷酸探针阵列可被用于鉴定乳腺癌关联核酸中的多态性(例如表10、表15、表19、表20、表21和表22的多态标记和单元型,以及与它们连锁不平衡的标记)。例如,可以使用寡核苷酸阵列。寡核苷酸阵列一般包括在不同的已知位置与基底表面连接的多个不同寡核苷酸探针。这些寡核苷酸阵列也称为“GenechipsTM”,其已在本领域普遍地描述(参见,例如美国专利号5,143,854、PCT专利公布号WO 90/15070和92/10092)。通常,这些阵列可以使用机械合成方法生产,所述方法合并照相平版印刷法和固相寡核苷酸合成法的组合,或通过本领域普通技术人员已知的其他方法生产(参见例如Fodor,S.等,Science,251:767-773(1991);Pirrung等,美国专利号5,143,854(也参见出版的PCT申请WO 90/15070);和Fodor.S.等,出版的PCT申请WO 92/10092和美国专利号5,424,186,其每一篇的完整的教导被并入本文作为参考)。使用机械合成方法合成这些阵列的技术在例如美国专利号5,384,261中描述;其完整的教导被并入本文作为参考。在另一个实例中,可以使用线性阵列。
一旦寡核苷酸阵列被制备,目的核酸被允许与该阵列杂交。杂交检测是在目的核酸中检测特定的等位基因。杂交和扫描通常通过本文所述的方法或本领域普通技术人员已知的其他方法进行,例如在公布的PCT申请WO92/10092和WO95/11995以及美国专利号5,424,186中描述的方法,其每一篇的全部教导通过引用被并入本文。简而言之,靶核酸序列——其包括一个或多个先前鉴定的多态标记——通过公知的扩增技术(例如PCR)扩增。一般地,这涉及应用从多态位点的上游和下游与靶序列的两条链互补的引物序列。不对称PCR技术也可以被使用。然后,使扩增的靶——其通常并入标记——与该阵列在允许序列特异性杂交的适当条件下杂交。在阵列的杂交和洗涤完成后,该阵列被扫描以确定该阵列上的靶序列杂交的位置。从该扫描获得的杂交数据一般为荧光强度形式,其为该阵列上位置的函数。
尽管主要在单一检测单元方面进行描述,例如用于单一多态位点的检测,但是阵列可以包括多个检测单元,并且因此能分析多个特异性多态性(例如特定单元型的多个多态性)。在可选的排列中,通常理解,检测单元可以在单一阵列内或在多个单独的阵列中进行分组,以便在将靶与阵列杂交期间可以使用不同的最优条件。例如,经常期望提供对那些落入基因组序列的富含G-C片段的多态性的检测,其与落入富含A-T片段的那些分开。这允许对每一情况的杂交条件进行单独优化。
应用寡核苷酸阵列检测多态性的另外的描述可见于例如美国专利号5,858,659和5,837,832中,这两篇的完整的教导通过引用被并入本文。
本领域普通技术人员可用的核酸分析的其他方法可用于检测与乳腺癌关联的多态位点处的特定等位基因(例如,表10、表15、表19、表20、表21和表22的多态标记和单元型,以及与它们连锁不平衡的标记)。代表性的方法包括例如,直接手动测序(Church andGilbert,Proc.Natl.Acad.Sci.USA,81:1991-1995(1988);Sanger,F.,等,Proc.Natl.Acad.Sci.USA,74:5463-5467(1977);Beavis,等,美国专利号5,288,644);自动荧光测序;单链构象多态性分析(SSCP);夹固变性凝胶电泳(clamped denaturing gel electrophoresis)(CDGE);变性梯度凝胶电泳(DGGE)(Sheffield,V.,等,Proc.Natl.Acad.Sci.USA,86:232-236(1989))、迁移率变动分析(mobility shift analysis)(Orita,M.,等,Proc.Natl.Acad.Sci.USA,86:2766-2770(1989))、限制酶分析(Flavell,R.,等,Cell,15:25-41(1978);Geever,R.,等,Proc.Natl.Acad.Sci.USA,78:5081-5085(1981));异源双链分析;化学错配碱基裂解法(CMC)(Cotton,R.,等,Proc.Natl.Acad.Sci.USA,85:4397-4401(1985));RNase保护测定(Myers,R.,等,Science,230:1242-1246(1985);识别核苷酸错配的多肽的应用,例如大肠杆菌(E.coli)mutS蛋白;和等位基因-特异性PCR。
在本发明的另一实施方式中,在本发明的遗传标记(一种或多种)或单元型(一种或多种)导致多肽的组成或表达改变的那些情况下,诊断乳腺癌或对乳腺癌的易感性可以通过检验乳腺癌关联核酸编码的多肽的表达和/或组成来进行。因此,在本发明的遗传标记或单元型导致多肽的组成或表达改变的那些情况下,诊断对乳腺癌的易感性可通过检验这些多肽之一、或乳腺癌关联核酸编码的另一多肽的表达和/或组成来进行。显示出与乳腺癌关联性的本发明的单元型和标记可通过它们对一个或多个这些附近基因的影响而发挥作用。影响这些基因的可能的机制包括例如影响转录、影响RNA剪接、mRNA的选择性剪接形式的相对数量的改变、影响RNA稳定性、影响从原子核到细胞质的转运和影响翻译的效率和准确度。
因此,在另一个实施方式中,显示与乳腺癌关联性的本发明的变体(标记或单元型)影响附近基因的表达。公知地,影响基因表达的调控元件可位于基因的启动子区域的远处,甚至远至间隔数十个或甚至数百个千碱基。通过分析本发明的至少一个多态标记的至少一个等位基因的存在或不存在,因此可能评估这样的附近基因的表达水平。因此考虑的是,检测本发明的标记或单元型可被用于评估一种或多种STEAP3/TSAP6、LOC643714和TNRC9基因的表达。
多种方法可用于检测蛋白质表达水平,包括酶联免疫吸附测定(ELISA)、蛋白质印迹、免测沉淀法和免疫荧光法。评估来自对象的检测样品在由乳腺癌关联核酸编码的多肽的表达改变和/或组成改变的存在性。由乳腺癌关联核酸编码的多肽的表达的改变可以是例如定量的多肽表达(即产生多肽的量)方面的改变。由乳腺癌关联核酸编码的多肽的组成改变是定性的多肽表达(例如突变体多肽或不同剪接变体的表达)方面的改变。在一个实施方式中,诊断对乳腺癌的易感性通过检测由乳腺癌关联核酸编码的特定剪接变体或剪接变体的特定模式来进行。
这样的两种改变(定量的和定性的)也可都存在。如本文使用的,多肽表达或组成的“改变”指与对照样品中乳腺癌关联核酸编码的多肽的表达或组成相比,检测样品中表达或组成的改变。对照样品是相应于检测样品(例如来自同一类型的细胞)并且来自没有受乳腺癌影响和/或不对乳腺癌具有易感性的对象的样品。在一个实施方式中,对照样品来自不具有本文描述的标记等位基因或单元型的对象。类似地,与对照样品相比,在检测样品中存在一种或多种不同剪接变体,或者在检测样品中存在显著不同数量的不同剪接变体,可以表示对乳腺癌的易感性。在等位基因相对于对照样品中的参考改变剪接位点的那些情况中,与对照样品相比,检测样品中多肽的表达或组成的改变可以表示特异性等位基因。检查由乳腺癌关联核酸编码的多肽的表达或组成的不同方法可以被使用,其包括光谱法、比色法、电泳、等电聚焦和免疫测定(例如David等美国专利号4,376,110)例如免疫印迹(参见例如,Current Protocols in Molecular Biology,特别是第10章,出处同上)。
例如,在一个实施方式中,能够与乳腺癌关联核酸编码的多肽结合的抗体(例如,具有可检测标记的抗体)可被使用。抗体可以是多克隆的或单克隆的。完整的抗体或其片段(例如Fv、Fab、Fab’、F(ab’)2)可被使用。对于探针或抗体,术语“标记的”,意图包括通过将可检测的物质偶联(即物理连接)到探针或抗体而直接标记探针或抗体,以及通过与直接标记的另一试剂的反应而间接标记探针或抗体。间接标记的实例包括使用标记的二抗(例如荧光标记的二抗)检测一抗以及用生物素末端标记DNA探针,使得其可以用荧光标记的链霉抗生物素检测。
在该方法的一个实施方式中,将检测样品中由乳腺癌关联核酸(例如,编码STEAP3/TSAP6、LOC643714或TNRC9基因的核酸)编码的多肽的水平或数量与对照样品中所述多肽的水平或数量相比较。检测样品中多肽的水平或数量高于或低于对照样品中多肽的水平或数量——使得差异是统计学显著的——表示由所述核酸编码的多肽的表达的改变,并且对于对引起表达差异负责的特定等位基因或单元型而言是诊断性的。可选地,将检测样品中多肽的组成与对照样品中多肽的组成相比较。在另一实施方式中,在检测样品中和对照样品中,多肽的水平或数量和组成可以都被评估。
在另一实施方式中,诊断对乳腺癌的易感性通过检测本发明的至少一种标记或单元型(表10、表15、表19、表20、表21和表22的标记和单元型以及与它们连锁不平衡的标记的关联等位基因)与另外的基于蛋白质、基于RNA或基于DNA的分析联合进行。本发明的方法也可与对象的家族史和风险因素(例如环境风险因素、生活方式风险因素)的分析联合应用。试剂盒
可用于本发明方法的试剂盒包括可用于本文描述的任何方法的组分,包括例如,杂交探针、限制性内切酶(例如,用于RFLP分析)、等位基因-特异性寡核苷酸、与本文描述的发明的核酸(例如包含本发明的至少一个多态标记和/或单元型的基因组区段)编码的改变的多肽结合的抗体、或由本文描述的本发明的核酸编码的未改变的(天然的)多肽;扩增乳腺癌关联核酸的工具;分析乳腺癌关联核酸的核酸序列的工具;分析由乳腺癌关联核酸编码的多肽的氨基酸序列的工具;等。例如,试剂盒可以包括必要的缓冲液、用于扩增本发明核酸(例如,本文描述的多态标记的一个或多个)的核酸引物和用于使用这样的引物和必要的酶(例如DNA聚合酶)扩增的片段的等位基因-特异性检测的试剂。另外,试剂盒可以提供用于与本发明的方法联合使用的分析试剂,例如用于乳腺癌诊断分析的试剂。
在一个实施方式中,本发明是用于分析来自对象的样品以检测对象中乳腺癌存在性或对乳腺癌易感性的试剂盒,其中试剂盒包括在个体基因组中选择性检测本发明的至少一个多态性的至少一个等位基因所必需的试剂。在具体的实施方式中,试剂包括至少一种与包含本发明的至少一个多态性的个体基因组的片段杂交的相邻寡核苷酸。在另一实施方式中,试剂包含与从对象获得的基因组片段的相反链杂交的至少一对寡核苷酸,其中每个寡核苷酸引物对被设计以选择性扩增包括至少一个多态性的个体基因组的片段,其中所述多态性选自在表10、表15、表19、表20、表21和表22中列出的多态性和与它们连锁不平衡的多态标记。在又一个实施方式中,片段的大小为至少20个碱基对。这样的寡核苷酸或核酸(例如寡核苷酸引物)可以使用指示乳腺癌的多态性(例如SNP或微卫星)侧翼的核酸序列的一部分进行设计。在另一实施方式中,试剂盒包含能够等位基因特异性检测一个或多个与乳腺癌相关联的特异性多态标记或单元型的一种或多种标记的核酸,以及用于检测该标记的试剂。适合的标记包括例如放射性同位素、荧光标记、酶标记、酶辅因子标记、磁标记、自旋标记、表位标记。
在具体的实施方式中,待由所述试剂盒的试剂检测的多态标记或单元型包括选自表10、表15、表19、表20、表21和表22中的标记的一个或多个标记、两个或更多个标记、三个或更多个标记、四个或更多个标记或者五个或更多个标记。在一个实施方式中,待被检测的标记选自表10、表15或表19中的标记。在一个实施方式中,待被检测的标记选自表10中的标记。在另一个实施方式中,待被检测的标记选自表15中的标记。在另一个实施方式中,待被检测的标记选自表19中的标记。在优选的实施方式中,待被检测的标记是rs4848543、rs13387042和/或rs3803662。其他优选的实施方式包括包含用于检测标记rs4848543的试剂的那些实施方式,包含用于检测标记rs13387042的试剂的那些实施方式和包含用于检测标记rs3803662的试剂的那些实施方式。在另一个实施方式中,待被检测的标记或单元型包括至少一个标记,其来自与选自表10、表15、表19、表20、表21和表22中列出的标记的至少一个强连锁不平衡的标记组,所述强连锁不平衡如由r2的值大于0.2所限定。在又一实施方式中,待被检测的标记或单元型包括选自标记rs4848543、rs13387042和rs3803662以及与它们连锁不平衡的标记的至少一个标记。
在一个这样的实施方式中,标记或单元型的存在表示对乳腺癌的易感性(易感性增加或易感性降低)。在另一实施方式中,标记是rs4848543等位基因A、rs13387042等位基因A、和/或rs3803662等位基因T,其存在表示乳腺癌(例如所有BC和/或MedPre乳腺癌)的风险增加。在又一实施方式中,标记或单元型的存在表示对乳腺癌治疗剂的响应。在另一实施方式中,标记或单元型的存在指示乳腺癌的预后。在又一实施方式中,标记或单元型的存在指示治疗乳腺癌的进展。这样的治疗可包括通过手术、药物、放射治疗疗法或通过其它方式(例如生活方式改变)干预。与本发明的多态性相关联的乳腺癌的诊断
尽管诊断方法已在诊断对乳腺癌易感性的上下文中进行了一般性描述,但是该方法也可以被用于诊断与本发明的多态标记相关联的乳腺癌。例如,具有乳腺癌或与乳腺癌相关联的风险因素的个体可以被评估,以确定在该个体中存在本发明的多态性或单元型是否可能在该个体已经成为乳腺癌促进因素。在一个实施方式中,鉴定与本发明的标记和/或单元型相关联的乳腺癌有助于治疗计划。例如,最小化形成乳腺癌的个体发生的预防治疗可以被施用。这样的预防治疗也可以包括评估个体对于本发明的风险变体是杂合的或纯合的。在本发明的其他实施方式中,治疗可以被设计,并且治疗被选择以靶向与本发明的多态性和/或单元型相关联的适当的基因或蛋白质。
在其它的实施方式中,本发明涉及在对象中诊断和鉴定与本发明的多态性相关联的乳腺癌的方法,这通过鉴定本发明的多态标记或单元型的存在而进行,如本文详细描述的。例如,发现本文所述的多态标记和/或单元型在具有乳腺癌的对象中比在没有受乳腺癌影响的对象中更频繁。因此,这些标记和/或单元型对诊断乳腺癌具有预测价值。在一个实施方式中,对检测乳腺癌具有预测价值的标记或单元型包括选自表10、表15、表19、表20、表21和表22中的标记的一个或多个标记。在另一个实施方式中,对诊断乳腺癌的具有预测价值的标记选自标记rs4848543、rs13387042和rs3803662,以及与它们连锁不平衡的标记。
在另一个实施方式中,对诊断乳腺癌具有预测价值的标记等位基因包括rs4848543等位基因A、rs13387042等位基因A和rs3803662等位基因T,以及与它们连锁不平衡的标记。
因此,本文描述的方法可用于评估来自对象的样品存在或不存在标记的特异性等位基因、或单元型;存在或不存在标记的特异性等位基因、或单元型,表示对乳腺癌的敏感性。
在本发明的一个实施方式中,通过检测本发明的多态性,进行与本发明的多态性和/或单元型相关联的乳腺癌的诊断。特定的多态性在本文描述(参见例如表10、表15、表19、表20、表21和表22和与它们连锁不平衡的标记)。基因组DNA、RNA或cDNA的检测样品从患有乳腺癌的对象获得以确定该疾病是否与本发明的一个或多个多态性相关联。然后,检测DNA、RNA或cDNA样品以确定本发明的多态性的特异性等位基因或特异性单元型是否被发现存在于该样品中。如果发现核酸样品含有多态性的特异性等位基因或单元型,那么等位基因或单元型的存在表示与多态性和/或单元型相关联的乳腺癌。
本领域普通技术人员已知的方法——其包括但不限于杂交方法例如RNA分析、DNA分析、定量PCR、原位杂交、限制消化或序列分析——可用于检测多态性。使用多种方法——其包括酶联免疫吸附测定(ELISA)、蛋白质印迹、免测沉淀和免疫荧光或其他本领域普通技术人员已知的方法,通过检测与本发明的多态性相关联的核酸编码的多肽的表达和/或组成,也可进行与本发明的多态性相关联的乳腺癌的诊断。治疗剂
本发明的变体(例如,本发明的标记和/或单元型,例如在表10、表15和表19中的任何一个中列出的标记)可用于鉴定乳腺癌的新型治疗靶标。例如,包含与乳腺癌相关联的变体(标记和/或单元型)或与乳腺癌相关联的变体(标记和/或单元型)连锁不平衡的基因或者它们的产物(例如,STEAP3/TSAP6基因、LOC643714基因和/或TNRC9基因的一个或多个),以及受这些变体基因或它们的产物直接或间接调控或者与这些基因或它们的产物相互作用的基因或它们的产物,可被靶向,以开发治疗乳腺癌的治疗剂。治疗剂可包括例如非蛋白质和非核酸小分子、蛋白质、肽、蛋白质片段、核酸(DNA、RNA)、PNA(肽核酸)或它们的衍生物或模拟物的一种或多种,其可调节靶基因或它们的基因产物的功能和/或水平。
本发明的核酸和/或变体,或包含它们的互补序列的核酸可被用作调控细胞、组织或器官中的基因表达的反义构建物。与反义技术相关的方法是技术人员公知的,并且在Antisense Drug Technology:Principles,Strategies,and Applications,Crooke,ed.,Marcel Dekker Inc.,New York(2001)中描述和综述。一般而言,反义核酸分子被设计为与基因表达的mRNA的区域互补,以便反义分子与mRNA杂交,因此阻断mRNA翻译为蛋白质。数类反义寡核苷酸是本领域技术人员已知的,其包括切割剂(cleaver)和阻断剂(blockers)。前者与靶RNA位点结合,激活胞内核酸酶(例如RnaseH或Rnase L),其切割靶RNA。阻断剂与靶RNA结合,通过核糖体的位阻抑制蛋白质翻译。阻断剂的实例包括核酸、吗啉化合物、锁定核酸和甲基膦酸酯(Thompson,Drug DiscoveryToday,7:912-917(2002))。反义寡核苷酸可直接用作治疗剂,并且也可用于确定和验证基因功能,例如通过基因敲除或基因敲低实验。反义技术进一步在下述中描述:Lavery等,Curr.Opin.Drug Discov.Devel.6:561-569(2003),Stephens等,Curr.Opin.Mol.Ther.5:118-122(2003),Kurreck,Eur.J.Biochem.270:1628-44(2003),Dias等,Mol.Cancer Ter.1:347-55(2002),Chen,Methods Mol.Med.75:621-636(2003),Wang等,Curr.Cancer Drug Targets 1:177-96(2001),和Bennett,Antisense NuceicAcid Drug.Dev.12:215-24(2002)。
本文描述的变体可被用于对特定变体特异性的反义试剂的选择和设计。使用关于本文描述的变体的信息,特异性靶向含有本发明的一个或多个变体的mRNA分子的反义寡核苷酸或其他反义分子可以被设计。用这样的方式,含有本发明的一个或多个变体(标记和/或单元型)的mRNA分子的表达可被抑制或阻断。在一个实施方式中,设计反义分子为特异性结合靶核酸的特定等位形式(即一个或数个变体(等位基因和/或单元型)),从而抑制源于该特异性等位基因或单元型的产物的翻译,但是其没有结合于靶核酸分子的特异性多态位点处的其他或可选变体。
因为反义分子可用于失活mRNA以便抑制基因表达并因此抑制蛋白质表达,所以该分子可用于治疗乳腺癌。该方法可包括通过含有与mRNA中的一个或多个区域互补的核苷酸序列的核酶进行切割,这削弱了mRNA被翻译的能力。这样的mRNA区域包括例如,蛋白质编码区——特别是与催化活性相应的蛋白质编码区,底物和/或配体结合位点或蛋白质的其他功能结构域。
RNA干扰(RNAi)现象自从其在线虫(C.elegans)中最初发现(Fire等,Nature 391:806-11(1998))已被活跃地研究了几十年,并且在近些年里,其在治疗人类疾病中的潜在应用已被积极地探索(在Kim&Rossi,Nature Rev.Genet.8:173-204(2007)中综述)。RNA干扰(RNAi),也称为基因沉默,基于使用双链RNA分子(dsRNA)来关闭特异性基因。在细胞中,细胞质的双链RNA分子(dsRNA)通过细胞复合体加工为小的干扰RNA(siRNA)。siRNA指导蛋白质-RNA复合体靶向靶mRNA上的特异性位点,这导致mRNA的切割(Thompson,Drug DiscoveryToday,7:912-917(2002))。一般而言,siRNA分子的长度为大约20、21、22或23个核苷酸。因此,本发明的一方面涉及分离的核酸分子,并且应用这些用于RNA干扰的分子,即作为小的干扰RNA分子(siRNA)。在一个实施方式中,分离的核酸分子的长度为18-26个核苷酸,优选长度为19-25个核苷酸,更优选长度为20-24个核苷酸,并且更优选长度为21、22或23个核苷酸。
对于RNAi介导的基因沉默的另一途径起源于内源编码的初级微RNA(pri-miRNA)转录物,其在细胞内被加工以产生前体miRNA(pre-miRNA)。这些miRNA分子从核输出到细胞质,在那里它们经历加工以产生成熟miRNA分子(miRNA),其通过认别mRNA的3’非翻译区内的靶位点而指导翻译抑制,并且随后通过加工P-体(p-body)而降解mRNA(在Kim&Rossi,Nature Rev.Genet.8:173-204(2007)中综述)。
RNAi的临床应用包括采用合成的siRNA双链体,其大小优选为20-23个核苷酸,并且优选具有2个核苷酸的3’重叠序列。基因表达的敲低通过对靶mRNA的序列特异性设计而建立。这样的分子的最优设计和合成的数个商业站点是本领域技术人员已知的。
其他应用提供更长的siRNA分子(典型长度为25-30个核苷酸,优选大约27个核苷酸),以及小的发夹RNAs(shRNA;典型长度为大约29个核苷酸)。后者是自然表达的,如Amarzguioui等所述的(FEBS Lett.579:5974-81(2005))。对于体内加工,化学合成的siRNA和shRNA是底物,并且在一些情况中,提供相比于较短设计更有效的基因沉默(Kim等,Nature Biotechnol.23:222-226(2005);Siolas等,NatureBiotechnol.23:227-231(2005))。一般而言,siRNA提供基因表达的短暂沉默,这是因为它们的细胞内浓度通过后来的细胞分裂而稀释。与之相反,表达的shRNA介导长期、稳定的靶转录物敲低,因为只要shRNA的转录发生(Marques等,Nature Biotechnol.23:559-565(2006);Brummelkamp等,Science 296:550-553(2002))。
因为RNAi分子——包括siRNA、miRNA和shRNA——以序列依赖性方式发挥作用,所以本发明的变体(例如表10、表15和表19中列出的标记和单元型)可用于设计RNAi试剂,所述试剂识别包含特异性等位基因和/或单元型(例如本发明的等位基因和/或单元型)的特异性核酸分子,而不识别包含其他的等位基因或单元型的核酸分子。因此,这些RNAi试剂可以识别和破坏靶核酸分子。在采用反义试剂的情况下,RNAi试剂可以用作治疗剂(即用于关闭疾病相关基因或疾病相关基因变体),但是也可用于表征和验证基因功能(例如通过基因敲除或基因敲低实验)。
可以通过大量本领域技术人员已知的方法进行RNAi的递送。利用非病毒递送的方法包括胆固醇、稳定核酸脂质颗粒(SNALP)、重链抗体片段(Fab)、适配体和纳米颗粒。病毒递送方法包括使用慢病毒、腺病毒和腺病毒相关病毒。在一些实施方式中,siRNA分子被化学修饰以增加它们的稳定性。这可以包括在核糖的2’位置的修饰,包括2’-O-甲基嘌呤和2’-氟嘧啶,其提供对核糖核酸酶活性的抗性。其他的化学修饰是可能的,并且是本领域技术人员已知的。
下列参考文献提供RNAi的进一步综述,和使用RNAi靶向特异性基因的可能性:Kim&Rossi,Nat.Rev.Genet.8:173-184(2007),Chen&Rajewsky,Nat.Rev.Genet.8:93-103(2007),Reynolds,等,Nat.Biotechnol.22:326-330(2004),Chi等,Proc.Natl.Acad.Sci.USA 100:6343-6346(2003),Vickers等,J.Biol.Chem.278:7108-7118(2003),Agami,Curr.Opin.Chem.Biol.6:829-834(2002),Lavery,等,Curr.Opin.Drug Discov.Devel.6:561-569(2003),Shi,Trends Genet.19:9-12(2003),Shuey等,Drug Discov.Today 7:1040-46(2002),McManus等,Nat.Rev.Genet.3:737-747(2002),Xia等,Nat.Biotechnol.20:1006-10(2002),Plasterk等,curr.Opin.Genet.Dev.10:562-7(2000),Bosher等,Nat.Cell Biol.2:E31-6(2000),和Hunter,Curr.Biol.9:R440-442(1999)。
导致形成乳腺癌的诱因或风险增加的遗传缺陷或引起乳腺癌的遗传缺陷,可通过给携带该缺陷的对象施用核酸片段来永久地纠正,所述核酸片段掺入在遗传缺陷的位点提供正常的/野生型核苷酸(一个或多个)的修复序列。这样的位点特异性修复序列可包括对促进对象的基因组DNA内源性修复起作用的RNA/DNA寡核苷酸。施用修复序列可通过适当的载体(例如密封在阴离子脂质体中的具有聚乙烯亚胺(polyethelenimine)的复合体)、病毒载体例如腺病毒载体、或适合促进施用的核酸胞内吸收的其他药物组合物而进行。然后,可克服遗传缺陷,因为该嵌合寡核苷酸诱导正常序列并入对象的基因组,这导致正常/野生型基因产物的表达。置换被扩增,因此致使与所述疾病或病症相关的症状得到永久性修复和减轻。
本发明提供用于鉴定可用于治疗和/或预防乳腺癌的化合物或药剂的方法。因此本发明的变体可用作鉴定和/或开发治疗剂的标靶。在某些实施方式中,这样的方法包括分析药剂或化合物调节包含至少一种本发明变体(标记和/或单元型)的核酸的活性和/或表达,或核酸——例如STEAP3/TSAP6基因、LOC643714基因和/或TNRC9基因的一个或多个——的编码产物的能力。这又可用于鉴定抑制或改变所述核酸的编码产物的不期望活性或表达的药剂或化合物。进行这样实验的分析可以在基于细胞的系统或在无细胞体系中进行,如技术人员已知的。基于细胞的系统包括天然表达目的核酸分子的细胞或已被遗传修饰以表达某一期望核酸分子的重组细胞。
患者中变体基因表达可以通过含有变体的核酸序列(例如,含有本发明的至少一个变体的基因,其可被转录为含有至少一个变体的RNA,并且又被翻译为蛋白质)的表达来评估,或通过由于影响正常的转录物表达的水平或模式的变体(例如在基因的调节或控制区域中的变体)造成的正常/野生型核酸序列的表达改变来评估。基因表达的分析包括直接核酸分析(mRNA)、表达蛋白水平的分析或涉及通路例如信号通路的侧支化合物(collateral compounds)的分析。此外,也可分析应答所述信号通路而上调或下调的基因表达。一个实施方式包括将报道基因例如荧光素酶可操作连接到目的基因(一种或多种)的调节区。
在一个实施方式中,当将细胞与候选化合物或药剂接触并且mRNA的表达得以确定时,可以鉴定基因表达的调节剂。将在存在候选化合物或药剂的情况下mRNA的表达水平与不存在所述化合物或药剂的情况下的表达水平进行比较。基于该比较,治疗和/或预防乳腺癌的候选化合物或药剂可以被鉴定为调节变体基因的基因表达的那些化合物或药剂。当与不存在候选化合物或药剂的情况下相比,在存在候选化合物或药剂的情况下,mRNA或所编码的蛋白质的表达在统计学上显著更大时,那么该候选化合物或药剂被鉴定为核酸表达的刺激剂或上调剂。当与不存在候选化合物或药剂的情况下相比,在存在候选化合物或药剂的情况下,mRNA或所编码的蛋白质的表达在统计学上显著更小时,那么该候选化合物或药剂被鉴定为核酸表达的抑制剂或下调剂。
本发明进一步提供使用化合物进行治疗的方法,所述化合物通过药物(化合物和/或药剂)筛选被鉴定为基因调节剂(即基因表达的刺激剂和/或抑制剂)。应答治疗剂的似然性的评估方法、监视治疗进展的方法和治疗乳腺癌的方法
如本领域已知的,个体可以对具体治疗(例如治疗剂或治疗方法,如本文进一步描述的)具有差别应答。差别应答的基础可能部分是遗传决定的。药物基因组学致力于遗传变异(例如本发明的变体(标记和/或单元型))如何由于改变的药物分布和/或异常或改变的药物作用而影响药物应答的问题。因此,差别应答的的基础可部分在遗传学上加以确定。由于遗传变异影响药物应答造成的临床结果可在某些个体(例如本发明的遗传性变型携带者或非携带者)内导致药物毒性,或药物治疗失败。本发明的变体可确定治疗剂和/或方法作用于机体的方式,或者机体代谢治疗剂的方式。
因此,在一个实施方式中,存在多态位点处的特定等位基因或者单元型,表示对特定治疗方式的不同应答率。这意味着诊断患有乳腺癌并且携带本发明的多态处的特定等位基因或单元型(例如本发明的风险和保护性等位基因和/或单元型)处携带某一等位基因的患者将更好或更糟地应答用于治疗该疾病的特定治疗药物和/或其他治疗。因此,所述标记等位基因或单元型存在或不存在可以辅助确定哪种治疗应用于患者。例如,对于新诊断的患者,本发明的标记或单元型的存在性可被评估(例如通过检测源自血样的DNA,如本文所述的)。如果患者对于标记等位基因或单元型呈阳性,那么医师推荐一个特定的治疗,而如果患者对标记的至少一个等位基因、或单元型呈阴性,那么可以推荐不同的治疗过程(其可包括推荐除了连续监视疾病进展,不进行直接治疗)。因此,患者的携带者状态可用于帮助确定是否应该给予特定的治疗方式。其价值在于能在早期诊断疾病的可能性,以选择最适当的治疗,并给临床医师提供关于疾病预后/攻击性的信息,以便能运用最适当的治疗。
如本文进一步描述的,目前乳腺癌的临床预防选择主要是化学预防(化学疗法或激素疗法)和预防手术。最常见的化学预防是他莫昔芬和雷洛昔芬;其他选择包括芳香酶抑制剂。治疗选择也包括放射治疗,对于放射治疗,一部分患者经历不良症状。如本文描述的,本发明的标记可用来评估对这些治疗选择的响应,或预测使用这些治疗选择的任何一个所取得的治疗进展。因此,基于个体的遗传状态遗传,遗传预测可用于选择适当的治疗策略,或者它可用于预测特定的治疗选择的结果,并因此可用于治疗选择或可用治疗选择的组合的策略选择。
本发明也涉及监视乳腺癌治疗进展或有效性的方法。这可基于本发明的标记和单元型的基因型和/或单元型状态,即通过评估本文公开的至少一个多态标记的至少一个等位基因的存在或不存在来进行,或者通过监视与本发明的变体(标记和单元型)关联的基因表达来进行。风险基因mRNA或编码的多肽可以在组织样品(例如外周血液样品或活组织检查样品)中测量。因此,表达水平和/或mRNA水平可在监视其有效性的治疗之前或期间确定。可选地或伴随地,本文提供的乳腺癌的至少一个风险变体的基因型和/或单元型状态在治疗之前或期间确定以监视其有效性。
可选地,与本发明的标记和单元型相关的生物学网络或代谢途径可以通过确定mRNA和/或多肽水平来监视。这可以通过例如在治疗前或期间采集的样品中通过监视属于该网络和/或途径的数种基因的表达水平或多肽来进行。可选地,属于生物学网络或代谢途径的代谢物可以在治疗前或期间确定。治疗的有效性通过比较在治疗期间观察到的表达水平/代谢物水平的改变与从健康对象获得的相应数据来确定。
在进一步的方面,本发明的标记可用于增加临床试验的功效和有效性。因此,为本发明的风险变体的携带者的个体,即为赋予形成乳腺癌风险增加的的至少一个多态标记的至少一个等位基因的携带者的个体,可以更可能应答特定治疗方式。在一个实施方式中,携带在特定治疗(例如小分子药物)靶向的途径和/或代谢网络中的基因(一种或多种)的风险变体的个体更可能是治疗的应答者。在另一实施方式中,携带基因的风险变体——所述基因表达和/或功能由该风险变体改变——的个体更可能是靶向该基因、其表达或其基因产物的治疗方式的应答者。
在进一步的方面,本发明的标记和单元型可被用于为特定个体选择药剂。治疗方式、生活方式改变或两者组合的个人化选择可以通过应用本发明的风险变体来实现。因此,对本发明的特定标记的个体状态的知识,可用于选择靶向受本发明的风险变体影响的基因或基因产物的治疗选择。变体的某些组合可适用于选择治疗选择,而其他基因变体组合可靶向其他治疗选择。变体的这种组合可包括一种变体、两种变体、三种变体或四种或更多种变体,如以临床上可靠准确度确定治疗模式的选择所需要的。计算机执行的方面
本发明也涉及使用本文描述的、与乳腺癌关联的多态标记和单元型的计算机执行的程序。这样的程序可用于存储、操作或以其他方式分析可用于本发明方法的基因型数据,如本文描述的。一个实例涉及在可读介质上存储源自个体的基因型信息,以便能给第三方(例如所述个体)提供基因型信息,或用于从基因型数据衍生信息,例如通过比较该基因型数据与促进对乳腺癌的易感性增加的遗传风险因素相关的信息,并基于这样的比较报告结果。
一个这样的方面涉及计算机可读介质。一般地说,这样的介质具有储存下述的能力:(i)至少一个多态标记或单元型的标识符信息;(ii)在患有乳腺癌的个体中所述至少一个标记的至少一个等位基因的频率或单元型的频率的指示物;和参考群体中所述至少一个标记的至少一个等位基因的频率或单元型的频率的指示物。参考群体可以是无病的个体群体。可选地,参考群体是来自一般群体中的随机样本,并且因此代表普遍群体。频率指示物可以是计算的频率、等位基因和/或单元型拷贝的计数或适合于具体介质的真实频率的归一化或其他方式处理的值。
关于个体的附加信息可以被储存在介质上,例如家系信息,关于性别、体格属性或特征(包括身高和体重)、生化测量、治疗施用、治疗结果、药物、或在具体个体的基因型状态的背景中期望储存或处理的其他有用信息。
此外,本发明涉及适于确定或操作可用于确定人类个体中对乳腺癌的易感性的遗传数据的装置。这样的装置可以包括计算机可读存储器、操作在计算机可读存储器上储存的数据的程序、和产生包括遗传数据量度在内的输出的程序。这样的量度可以包括值,例如等位基因频率或单元型频率、基因型计数、性别、年龄、表型信息、优势比(OR)或相对危险度(RR)的值、群体归因危险度(PAR)、或者其他有用信息,所述其他有用信息或者是原始基因型数据的直接统计或者是基于遗传数据的计算。
在某些实施方式中,本文显示的、与乳腺癌的易感性增加(例如风险增加)相关的标记和单元型可用于解释和/或分析基因型数据。因此,在某些实施方式中,鉴定如本文所示的乳腺癌的风险等位基因或风险单元型,或者本文所示的与乳腺癌关联标记和/或单元型的任何一个LD的多态标记处的等位基因和/或单元型,表示基因型数据来源的个体处于增加的乳腺癌风险中。在一个这样的实施方式中,产生本文所示的与乳腺癌相关的至少一个多态标记或与它们连锁不平衡的标记的基因型数据。随后,第三方例如该基因型数据来源的个体可例如经由通过互联网可访问的用户界面获得基因型数据,对该基因型数据的解释,例如该基因型数据的形式为疾病(例如乳腺癌)的风险量度(例如绝对危险度(AR)、风险比(RR)或优势比(OR))。在另一实施方式中,评估源自个体的基因型数据集中鉴定的风险标记,并且个体可例如通过安全网络界面或通过其他的通信设备获得数据集中这类风险变体的存在所赋予的风险的评估结果。这样的风险评估的结果可以以数字形式(例如通过风险值,例如绝对危险度、相对危险度和/或优势比,或通过与参考相比的风险增加百分数)、通过图解法或通过适合给基因型数据来源的个体阐明风险的其它方式报告。在具体的实施方式中,第三方例如医师、其他的保健工作者或遗传顾问可获得风险评估的结果。可用于本发明不同方面的标记
上述方法和应用都可用本发明的标记和单元型实践,本发明的标记和单元型在本文在广义的方面被描述为可用于评估对乳腺癌的易感性。因此,通常情况下,这些应用通常可以简化为使用表10、15、19、20、21和22的任一个中列出的标记以及与它们连锁不平衡的标记进行实践。在某些实施方式中,标记或单元型存在于基因组区段内,所述基因组区段的序列在SEQ ID NO:4、SEQ ID NO:5或SEQ IDNO:6中列出。在某些实施方式中,标记存在于rs4848543LD区段、rs13387042LD区段或rs3803662LD区段内。在具体的实施方式中,标记选自在表10中列出的标记。在其它的实施方式中,标记选自在表15中列出的标记。在其它的实施方式中,标记选自在表19中列出的标记。在一些实施方式中,标记选自在表7和8中列出的标记。在一些其他的实施方式中,标记选自在表14中列出的标记。在一些其他的实施方式中,标记选自在表18中列出的标记。在其它的实施方式中,标记是rs4848543(SEQ ID NO:1)、rs13387042(SEQ ID NO:2)或rs3803662(SEQ ID NO:3)之一,其任选地包括与它们连锁不平衡的标记。在一个实施方式中,标记是rs4848543(SEQ ID NO:1)、rs13387042(SEQ IDNO:2)和rs3803662(SEQ ID NO:3)之一。在某些优选的实施方式中,标记是rs4848543(SEQ ID NO:1)。在其他优选的实施方式中,标记是rs13387042(SEQ ID NO:2)。在其他优选的实施方式中,标记是rs3803662(SEQ ID NO:3)。在具体的实施方式中,连锁不平衡被定义为r2的数值大于0.2。在另一个实施方式中,标记或单元型包括选自rs4848543等位基因A、rs13387042等位基因A和rs3803662等位基因T的至少一个标记。核酸和多肽
本文描述的核酸和多肽可被用于本发明的方法和试剂盒中,如上所述。如本文使用的,“分离的”核酸分子是与正常位于基因或核苷酸序列侧翼的核酸分开(如在基因组序列中)和/或已经被完全地或部分地从其他的转录序列纯化的(例如如在RNA文库中)核酸分子。例如,本发明的分离的核酸可以相对于其天然存在的复杂细胞环境被基本上分离,或当通过重组技术产生时相对于培养基被基本上分离,或当化学合成时相对于化学前体或其他化学品被基本上分离。在一些情况下,分离的物质将形成组合物(例如,含有其他物质的粗提取物)、缓冲体系或试剂混合物的一部分。在其他的情况中,物质可以被纯化至基本同质性,例如通过聚丙烯酰胺凝胶电泳(PAGE)或柱色谱法(例如HPLC)所确定的。本发明的分离的核酸分子可以占存在的所有大分子种类的至少大约50%、至少大约80%或至少大约90%(以摩尔计)。对于基因组DNA,术语“分离的”也可以指与基因组DNA天然关联的染色体分离的核酸分子。例如,分离的核酸分子可以含有大约250kb、200kb、150kb、100kb、75kb、50kb、25kb、10kb、5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb以下的核苷酸,所述核苷酸位于细胞的基因组DNA中的核酸分子的侧翼,所述核酸分子来源于所述细胞。
核酸分子可以与其他编码或调节序列融合,并且仍然被认为是分离的。因此,包含在载体中的重组DNA被包括在本文使用的“分离的”定义中。同样地,分离的核酸分子包括在异源寄主细胞或异源生物体中的重组DNA分子,以及在溶液中部分地或基本上纯化的DNA分子。“分离的”核酸分子也包括本发明的DNA分子的体内和体外RNA转录物。分离的核酸分子或核苷酸序列可以包括化学合成的或通过重组方法合成的核酸分子或核苷酸序列。例如,这类分离的核苷酸序列可用于制造所编码的多肽,用作用于分离同源序列(例如来自其他哺乳动物种类)、用于基因作图(例如通过与染色体原位杂交)或用于例如通过RNA印迹分析或其他的杂交技术检测组织(例如人组织)中基因表达的探针。
本发明也涉及在高严格杂交条件下——例如用于选择性杂交的条件——与本文描述的核苷酸序列杂交的核酸分子(例如与含有本文描述的标记或单元型相关联的多态位点的核苷酸序列特异性杂交的核酸分子)。这样的核酸分子可通过等位基因-或序列-特异性杂交(例如在高严格条件下)检测和/或分离。核酸杂交的严格条件和方法是本领域技术人员公知的(参见,例如Current Protocols in Molecular Biology,Ausubel,F.et al,John Wiley&Sons,(1998),和Kraus,M.and Aaronson,S.,Methods Enzymol.,200:546-556(1991),它们的完整教导通过引用被并入本文。
两种核苷酸或氨基酸序列的同一性百分比可以通过以最优比较为目的(例如,空位可以被引入第一序列的序列)进行比对序列来确定。然后,比较在相应位置的核苷酸或氨基酸,并且两个序列之间的同一性百分比是序列共享的相同位置的数目的函数(即同一性%=相同位置的数目/位置总数x100)。在某些实施方式中,用于比较目的而比对的序列的长度为参考序列长度的至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、或至少95%。两个序列的实际比较可以通过公知的方法例如使用数学算法来完成。这类数学算法的非限定性实例在Karlin,S.and Altschul,S.,Proc.Natl.Acad.Sci.USA,90:5873-5877(1993)描述。这样的算法被并入NBLAST和XBLAST程序(2.0版本),如在Altschul,S.等,Nucleic Acids Res.,25:3389-3402(1997)中描述的。当应用BLAST和Gapped BLAST程序时,可以使用各自的程序(例如NBLAST)的缺省参数。参见在www.ncbi.nlm.nih.gov的环球网站点。在一个实施方式中,序列比较的参数可以设定为得分=100、字长=12或可以进行改变(例如W=5或W=20)。
其他的实例包括Myers和Miller、CABIOS(1989)、ADVANCE和ADAM的算法,如在Torellis,A.and Robotti,C.,Comput.Appl.Biosci.10:3-5(1994)中描述;以及在Pearson,W.and Lipman,D.,Proc.Natl.Acad.Sci.USA,85:2444-48(1988)中描述的FASTA。在另一实施方式中,两个氨基酸序列之间的同一性百分比可以使用在GCG软件包(Accelrys,Cambridge,UK)中的GAP程序完成。
本发明也提供分离的核酸分子,其含有在高严格条件下与包括下列核苷酸序列或由下列核苷酸序列组成的核酸杂交的片段或部分:包括表10、表15、表19、表20、表21和表22中列出的多态标记以及与它们连锁不平衡的标记的核苷酸序列,和STEAP3/TSAP6、LOC643714和TNRC9基因的核苷酸序列,或者这样的核苷酸序列,其包括这样的核苷酸序列的互补体或由它们组成,这样的核苷酸序列包括表10、表15、表19、表20、表21和表22中列出的多态标记以及与它们连锁不平衡的标记,和STEAP3/TSAP6、LOC643714和TNRC9基因的核苷酸序列或它们的片段,其中核苷酸序列包括至少一个包含在本文描述的标记和单元型中的多态等位基因。本发明的核酸片段的长度为至少大约15、至少大约18、20、23或25个核苷酸,并且可以是30、40、50、100、200、500、1000、10,000或更多个核苷酸。
本发明的核酸片段在诸如本文描述的那些分析中被用作探针或引物。“探针”或“引物”是以碱基特异性方式与核酸分子的互补链杂交的寡核苷酸。除DNA和RNA之外,这样的探针和引物包括多肽核酸(PNA),如在Nielsen,P.等,Science 254:1497-1500(1991)中描述的。探针或引物包括与核酸分子的至少大约15、典型大约20-25并且在某些实施方式中大约40、50或75个连续核苷酸杂交的核苷酸序列的区域。在一个实施方式中,探针或引物包含本文描述的至少一个多态标记的至少一个等位基因或至少一个单元型、或其互补体。在具体的实施方式中,探针或引物可包含100个或更少核苷酸;例如,在某些实施方式中,从6个到50个核苷酸,或者例如从12到30个核苷酸。在其他实施方式中,探针或引物与邻近核苷酸序列或邻近核苷酸序列的互补体至少70%相同、至少80%相同、至少85%相同、至少90%相同、或至少95%相同。在另一实施方式中,探针或引物能够与邻近核苷酸序列或邻近核苷酸序列的互补体选择性杂交。通常,探针或引物进一步包含标记,例如放射性同位素、荧光标记、酶标记、酶辅因子标记、磁标记、自旋标记、表位标记。
本发明的核酸分子,例如上面描述的那些,可以使用技术人员公知的标准分子生物学技术进行鉴定和分离。扩增的DNA可以被标记(例如放射性标记),并且用作筛选源自人细胞的cDNA文库的探针。cDNA可以源自mRNA,并且包含在适当的载体中。相应的克隆可以被分离,DNA可以在体内切除后获得,并且克隆的插入物可以通过本领域公认方法在一个或两个方向测序,以鉴定编码具有适当分子量的多肽的正确阅读框。使用这些或相似的方法,多肽和编码多肽的DNA可以被分离、测序并进一步表征。
一般而言,本发明的分离的核酸序列可被用作DNA凝胶上的分子量标记,并用作染色体标记,其被标记以绘制相关的基因位置。核酸序列也可被用于与患者内的内源性DNA序列比较,以鉴定乳腺癌或对乳腺癌的易感性,并且可被用作探针,以便杂交和发现相关的DNA序列或从样品扣除已知序列(例如扣除杂交法)。核酸序列可以进一步被用于衍生引物,用于遗传指纹分析,以使用免疫技术产生抗多肽抗体,和/或用作抗原以产生抗DNA抗体或引发免疫应答。抗体
也提供与一种形式的基因产物特异性结合但是不与另一形式的基因产物特异性结合的多克隆抗体和/或单克隆抗体。也提供与含有多态位点或多个多态位点的变体或参考基因产物的一部分结合的抗体。如本文使用的术语“抗体”指免疫球蛋白分子和免疫球蛋白分子的免疫活性部分,即含有特异性结合抗原的抗原结合部位的分子。与本发明的多肽特异性结合的分子是与样品例如生物样品中该多肽或其片段结合、但是基本上不结合其他分子的分子,所述样品天然含有该多肽。免疫球蛋白分子的免疫学活性部分的实例包括F(ab)和F(ab’)2片段,其通过用酶例如胃蛋白酶处理抗体而产生。本发明提供与本发明的多肽结合的多克隆和单克隆抗体。如本文使用的,术语“单克隆抗体”或“单克隆抗体组分”指一群抗体分子,其仅含有能与本发明的多肽的特定表位发生免疫反应的抗原结合部位的一个种类。因此,单克隆抗体组分一般显示对与其发生免疫反应的本发明特定多肽的单一结合亲合性。
多克隆抗体可以如上所述通过使用需要的免疫原例如本发明的多肽或其片段来免疫适当的对象而加以制备。在免疫的对象中抗体效价可以通过标准技术,例如使用应用固定化多肽的酶联免疫吸附测定(ELISA)随时间进行监视。如果需要,针对所述多肽的抗体分子可以从哺乳动物(例如从血液)分离,并进一步通过公知的技术例如蛋白A色谱法纯化,以获得IgG部分。在免疫之后的适当时刻,例如当抗体效价最高时,产生抗体的细胞可以从对象获得,并用于通过标准技术例如Kohler和Milstein,Nature 256:495-497(1975)最初描述的杂交瘤技术、人B细胞杂交瘤技术(Kozbor等,Immunol.Today 4:72(1983)),EBV杂交瘤技术(Cole等,Monoclonal Antibodies and Cancer Therapy,Alan R.Liss,1985,Inc.,pp.77-96)或三源杂交瘤技术,制备单克隆抗体。产生杂交瘤的技术是公知的(一般参见Current Protocols in Immunology(1994)Coligan等,(eds.)John Wiley&Sons,Inc.,New York,NY)。简言之,将无限增殖细胞系(一般为骨髓瘤)与来自如上所述用免疫原免疫的哺乳动物的淋巴细胞(一般为脾细胞)融合,并且筛选所形成的杂交瘤细胞的培养物上清液以鉴定产生与本发明的多肽结合的单克隆抗体的杂交瘤。
用来将淋巴细胞和无限增殖化细胞系融合的许多已知方案的任一个可用于产生抗本发明多肽的单克隆抗体的目的(参见例如,Current Protocols in Immunology,supra;Galfre等,Nature 266:55052(1977);R.H.Kenneth,in Monoclonal Antibodies:A New Dimension InBiological Analyses,Plenum Publishing Corp.,New York,New York(1980);和Lerner,Yale J.Biol.Med.54:387-402(1981))。而且,普通技术人员将理解存在这类方法的许多变化,其也是可用的。
作为制备分泌单克隆抗体的杂交瘤的替代方案,抗本发明多肽的单克隆抗体可以通过用该多肽筛选重组组合免疫球蛋白文库(例如抗体噬菌体展示文库)从而分离与该多肽结合的免疫球蛋白文库成员来鉴定和分离。产生和筛选噬菌体展示文库的试剂盒是商业可获得的(例如,the Pharmacia Recombinant Phage Antibody System,CatalogNo.27-9400-01;和the Stratagene SurfZAPTM Phage Display Kit,CatalogNo.240612)。另外,特别容易用于产生和筛选抗体展示文库的方法和试剂的实例可见于例如,美国专利号5,223,409;PCT公布WO 92/18619;PCT公布WO 91/17271;PCT公布WO 92/20791;PCT公布WO92/15679;PCT公布WO 93/01288;PCT公布WO 92/01047;PCT公布WO 92/09690;PCT公布WO 90/02809;Fuchs等,Bio/Technology 9:1370-1372(1991);Hay等,Hum.Antibod.Hybridomas 3:81-85(1992);Huse等,Science 246:1275-1281(1989);和Griffiths等,EMBO J.12:725-734(1993)。
另外,可使用标准重组DNA技术产生的包含人和非人部分的重组抗体,例如嵌合和人源化单克隆抗体,在本发明的范围内。这样的嵌合和人源化单克隆抗体可以通过本领域已知的重组DNA技术产生。
一般而言,本发明的抗体(例如单克隆抗体)可用于通过标准技术例如亲和色谱法或免测沉淀法分离本发明的多肽。多肽特异性抗体可以帮助从细胞纯化天然的多肽和纯化在宿主细胞中表达的重组产生的多肽。而且,对本发明的多肽特异性的抗体可用于检测多肽(例如在细胞溶胞产物、细胞上清液或组织样品中),以便评估多肽表达的丰度和模式。作为临床试验过程的一部分,抗体可被诊断性地用于监视组织中蛋白水平,例如以确定给定的治疗方案的功效。抗体可以与可检测物质偶联在一起,以帮助其检测。可检测物质的实例包括多种酶、辅基、荧光物质、发光物质、生物发光物质、和放射性物质。适合的酶的实例包括辣根过氧化物酶、碱性磷酸酶、β-半乳糖苷酶或乙酰胆碱酯酶;适合的辅基复合体的实例链霉抗生物素/生物素以及抗生物素蛋白/生物素;适合的荧光物质的实例包括伞形酮、荧光素、异硫氰酸荧光素、若丹明、二氯三嗪胺荧光素(dichlorotriazinylaminefluorescein)、丹磺酰氯或藻红蛋白;发光物质的实例包括鲁米诺;生物发光物质的实例包括荧光素酶、莹光素(luciferin)和水母发光蛋白;适合的放射性物质的实例包括125I、131I、35S或3H。
抗体也可用于药物基因组学分析。在这样的实施方式中,抗由本发明的核酸编码的变体蛋白质——例如含有至少一种本发明的多态标记的核酸编码的变体蛋白质——的抗体,可用于鉴定需要改变的治疗方式的个体。
此外,抗体可用于评估疾病状态(例如在该疾病的进行期)中变体蛋白质的表达,或在具有对与蛋白质功能相关的疾病特别是乳腺癌的诱因的个体中变体蛋白质的表达。对于本发明的变体蛋白质——其由包含本文描述的至少一个多态标记或单元型的核酸编码——特异性的抗体可用于筛查变体蛋白质的存在,例如以筛查由变体蛋白质的存在指示的乳腺癌诱因。
抗体可被用于其他的方法。因此,连同通过电泳迁移率、等电点、胰蛋白酶或其他蛋白酶消化、或本领域技术人员已知的用于其他物理测定的分析,抗体可用作评估蛋白质例如本发明的变体蛋白质的诊断工具。抗体也可用于组织分型。在一个这样的实施方式中,特定变体蛋白质已被与在特定组织类型中的表达相关联,然后,对变体蛋白质特异性的抗体可用于鉴定特定组织类型。
包括变体蛋白质在内的蛋白质的亚细胞定位也可使用抗体确定,并且可被用于评估所述蛋白质在不同组织的细胞中的异常亚细胞定位。这样的应用可以运用于遗传学检测,也可以运用于监视特定治疗方式。在治疗目的在于纠正变体蛋白质的表达水平或存在性或者变体蛋白质的异常组织分布或发育表达的情况下,对变体蛋白质或其片段特异性的抗体可用于监视治疗功效。
抗体进一步可用于抑制变体蛋白质功能,例如通过阻断变体蛋白质与结合分子或配偶体的结合来进行。这样的应用也可运用于其中治疗包括抑制变体蛋白质功能的治疗情况。例如,抗体可被用于阻断或竞争性抑制结合,从而调节(即激动或拮抗)蛋白质的活性。可以制备针对含有特定功能所需的位点的特定蛋白质片段或针对与细胞或细胞膜相关的完整蛋白质的抗体。对于体内施用,抗体可以与其他的治疗负荷(therapeutic payload)例如放射性核素、酶、免疫原表位或细胞毒素剂——其包括细菌毒素(白喉或植物毒素例如篦麻毒素)——连接。抗体或其片段的体内半衰期可通过与聚乙二醇接合的聚乙二醇化(pegylation)来增加。
本发明进一步涉及用于在本文描述的方法中使用抗体的试剂盒。这包括但不限于,用于检测变体蛋白质在检测样品中存在性的试剂盒。一个优选的实施方式包含抗体例如标记的或可标记的抗体,和用于检测生物样品中变体蛋白质的化合物或试剂,确定在样品中变体蛋白质的数量或存在和/或不存在的工具,和将所述样品中变体蛋白质的数量与标准比较的工具,以及试剂盒应用的说明书。
现在,本发明将通过下列非限定性实施例举例说明。实施例【0269】患者和对照选择:National Bioethics Committee of Icelandand the Icelandic Data Protection Authority授权许可该研究。乳腺癌诊断记录从Icelandic Cancer Registry(ICR)获得。记录包括所有在1955年1月1日到2005年12月31日在冰岛诊断的侵入性乳腺肿瘤和乳腺导管原位癌和小叶原位癌的病例。在该时期,ICR包含4603个诊断个体的记录。包括所有活着的患者(大约2840个)的传播人群可适宜招募入本研究。我们从2210个患者获得知情同意书、血样和临床信息,回收率为大约78%。最初的对照组包括来自其他正在进行的deCODE遗传学全基因组关联性研究的所有个体,并且在乳腺癌患者组被基因型分型时,他们已经在Illumina SNP芯片上进行基因型分型。直到2005结束时在Icelandic Cancer Registry登记显示乳腺癌、前列腺癌或结肠直肠癌的个体从对照组排除,这导致4477个对照的组。独立复制对照组包括另外7406个来自非乳腺癌项目的对象,其在该4477组之后进行分型。在该7406组中,前列腺癌和结肠直肠癌患者没有被排除,因为我们已经获得表明正在讨论的SNP的频率与这些或者样品中的对照不同的中间数据(interim data)。在每个对照组中,在下面表8、9和14中列出的SNP的频率中,性别之间没有差异。因此,这些对照组提供所研究的SNP的群体频率的合理代表。
宗谱数据库:decode Genetics保持冰岛人宗谱的计算机化数据库。该记录包括几乎所有在前两个世纪生于冰岛的个体,并且对于该时期,大约95%的双亲关系是已知的[Sigurdardottir,et al.,(2000),Am J Hum Genet,66,1599-609]。另外,对于大多数个体,基于人口普查和教区记录,记录了居住县标识符。将该信息储存在亲属数据库中,其具有与在生物样品上和ICR记录使用的那些相匹配的加密个人标识符,这允许对研究参与者的基因型和表型与他们的宗谱进行交叉参考。
样品处理:在-20℃,在EDTA中保藏血样。使用Qiagen(http://www.quiagen.com)提取柱方法,从全血分离DNA。将DNA储存于4℃。
基因型分型:然后,随机选择一组1600个患者的样品,并且在Illumina Infinium Hap300 SNP珠微阵列(Illumina,San Diego,CA,USA)上进行基因型分型,所述珠微阵列含有317,511个源自I期国际HapMap项目的SNP。4480个无癌症对照样品在同一平台上基因型分型。在芯片上SNP的总数之中,170个没有产生基因型,而另外24个SNP具有低于80%的得率。在对照中,另外61个SNP显示与哈迪-温伯格平衡(Hardy-Weinberg equilibrium)具有非常显著的失真(p<1x10-10)。104个SNP是单态的,而58个SNP是近单态的(即,组合的患者和对照的人群中,次要等位基因频率小于0.001)。最后,在内部正在进行的数个不同的全基因组关联性研究中,在特定区域和可能信号的研究后,确定5个标记具有基因型分型问题。所有这些问题SNO从分析中除去。因此,在本文中最终的分析使用317,089个SNP。检出率(call rate)低于98%的任何芯片也从该分析中排除。
在该研究中检查的三个关键SNP的序列内容在下面给出:rs4848543(SEQ ID NO:1):caggataagattatttctgaggctgcttccatcagtggttctgtgagctggcccatgtattcagccagtcagtaggccatcaagcatgcatctacgcaaggcactagaagggttacatacaatgggaaactgaggcccagaaggaggaaagatgaagtgcccaaagttaaggagataaaagcagaagtgcaggtaagagaaggagtattcatattactgcaggaatccaaattctacaagaacatacgcttgttctttaaagggagccctcgctttaagcattatttgccgatcaatacc[A/C]attaataattacaggacatgggcaaatattctagcaaaggtcctgaggtcttcctagatgtgcccaaaataacaaggactccccccgcaggtggcaccaaaagtcggaggatgtgttggaagctgaccttccccacctgtccctgcctcacccacagtcacccacccctctaggatgtaatggtgaatcattcaacacatgggccaccttgggaagtcgcttaacctctctcccttttcacgttataaaatgggcatagtcattacacaaatgcataaatcaacctcaattttctcatctrs13387042(SEQ ID NO:2):ctgacatagccgcctgtgcaggtttttgggaccaggtctgccatctgtattcccaggctgggctggagcacctgaggctactatggttacagaaaggaacctggcatccgaaggtataggctcaaatcccagctctcatgattgctagctttgaggtttcaggttcatttcttaagtgctctgagctttggtgccctcctcttcaaaatgggaatgaggagcatgtctagctccctgttttgttgcagtgaatagctacatgaagaacagctaaaccagaacagaaagaaggcaaatgga[A/G]gctacagaaaccaaggatttccttgttgaatcgaatcttccttcaatcttccttcaccacactagtggatctccctgtgggagggatgttgagagtgctccgtgttttttttgttttttttttttttttttttgtgatggagtctcactctgtcacccagactggaatgcagtggtgcgatctcggctcactgcaacctctgcctcccaggttcaagtgattctcctgcctcagcttcccaagtagccaggactacaggcatatgccatcacacccagctaatttttgtatttttagtagrs3803662(SEQ ID NO:3):gctagtccttggctgttctgtgatcaaatgcaattgtttcccatttcttaagaaacagaatctttattagactcagttcttttcttggttatttttacaattttattgttctatggttattaaaaaataacatgtcatataaattaagcctagaaacatggatgtttatcaaagaaaggattgtcatccaaagcaccaactatgagagatatctatgtgcaatggtatatagatctgtcatagaagggtttaattatatctgcctaatgattttctctccttaatgcctctatagctgtc[C/T]cttagcgaagaataaaactgtggactgacccccacccatttgcgaagaaagtactgggtcttcagctttcattgttcagccggtggtctttgtggacaacaccaggggcccctcctgctgaagactgtctggacttcctgattttcactcctgtataaaccccctcccccattactacctttgtctccttggggaaaaaaaatgtttttcacttaagcaaaataataactacccagtatttgtttctggagtgaaattgtaaacttcattgtacattcttcctggctttgatgcttatcg
我们设计和测试分析以检测rs4848543LD区段中的许多SNP。这些分析基于[Kutyavin,et al.,(2006),Nucleic Acids Res,34,e128]中描述的Centaurus SNP分析技术。该分析和它们的引物为:SG02S733rs895398(Build 34)chr2:120,058,180正向引物:TTGGAACCTCCCACTGCCACA反向引物:ACAGCCCAGGTTTCAGGTTGGCATVIC-探针:AGCGACACTGFAM-探针:GCGACACCG增强子:CCTG*AGATCCAGGCASG02S738rs4848543(Build 34)chr2:120,061,096正向引物:AGGGAGCCCTCGCTTTAAGCATTA反向引物:TTTGGGCACATCTAGGAAGACCTCVIC-探针:GAT*CAATACCCFAM-探针:CGAT*CAATACCA增强子:TTAATAATTACAGGACATGSG02S739rs6759589(Build 34)chr2:120,064,976正向引物:TCAGCAGCCTCTTGTCTCACTAAT反向引物:CTTCTTGCCCAGGCAGGACAGAVIC-探针:TAGACTGAGCCFAM-探针:AAT*AGACTAAGCC增强子:CCATCCCCAACTAASG02S753rs895397(Build 34)chr2:120,072,400正向引物:CACTACTAGATCATGGGAGATGCCT反向引物:GTTTCCTCAGTTGTAATGTAGACCVIC-探针:TT*T*A*ACCCTTFAM-探针:GTTTTAACCCCT增强子:GCTGCTCGGAAGSG02S740rs838102(Build 34)chr2:120,079,878正向引物:GGTTTTGCATCCTTGCTCACTCACAT反向引物:GTGCCCTCTGCGTACTTGCGAATVIC-探针:TACTGCCACCFAM-探针:CTTACTGCCACT增强子:TGTCTCCTCACTCSG02S741rs838100(Build 34)chr2:120,083,710正向引物:ACTTACCAACAGCAGGCTGGTG反向引物:CCAGAAAGGGTGGCTCACCTCAVIC-探针:GTCTGAGGCTFAM-探针:GGTCTGAGGTT增强子:TCAGGTCACTCGSG02S734rs12711924(Build 34)chr2:120,107,316正向引物:AACGCTTATCACAGAGCCAGGTAG反向引物:GGAAAACCATGAACACTGTGGCAAVIC-探针:CCCGCCGTFAM-探针:GCCCGCCAT增强子:TTGTCTTTCTTGTGTCSG02S742rs3731603(Build 34)chr2:120,117,062正向引物:AACA*CTCTAGGGAGTAAAGCTC反向引物:GAGGA*CATTTGGAGTCCCCAATVIC-探针:GACTGTCTTCAAFAM-探针:ACTGT*CT*TCAC增强子:AAGTCAGTCCTGAGSG02S728rs13387042(Build 34)chr2:218,108,374正向引物:CCACTAGTGTGGTGA*AGGAAGATT反向引物:GCTACATGA*AGAA*CAGCTAAACCVIC-探针:TTTCTGTAGCCTFAM-探针:TT*T*CTGTAGCT*T增强子:CATTTGCCTTCTTTC*表示修饰的碱基,如[Kutyavin,et al.,(2006),Nucleic Acids Res,34,e128]所述。
BRCA2基因(999del5)的单一基础突变在普通冰岛人群体中以0.6-0.8%的携带者频率存在,而在女性乳腺癌患者中以7.7-8.6%存在[Thorlacius,et al.,(1997),Am J Hum Genet,60,1079-84;Gudmundsson,et al.,(1996),Am J Hum Genet,58,749-56]。使用微卫星型PCR分析(其被称为DG13S3727),在所述病例的1499个中测定BRCA2999del5突变的可能存在。使用的引物为正向  TGTGAAAAGCTATTTTTCCAATC反向:ATCACGGGTGACAGAGCAA
通过DG13S3727扩增的序列为:DG13S3727位置=chr13:30703058-30703261tgtgaaaagctatttttccaatcatgatgaaagtctgaagaaaaatgatagatttatcgcttctgtgacagacagtgaaaacacaaatcaaagagaagctgcaagtcatggtaagtcctctgtttagttgaactacaggtttttttgttgttgttgttttgattttttttttttgaggtggagtcttgctctgtcacccgtgat
统计方法:采用乘积模型,我们计算SNP等位基因的相对危险度(RR)为RR=[p/(1-p)]/[s/(1-s)],其中p和s分别是变体在患者和对照中的频率。基于标准似然比χ平方统计,计算与RR相关联的P-值。假设RR的估计值具有对数正态分布,计算置信区间。
单元型频率通过最大似然估计,并且病例和对照之间的差异检验使用广义似然比检验进行。单元型分析项目被称为NEMO,其代表NEsted模型,被用于计算所有的单元型结果。为了处理阶段不确定性和漏失基因型,强调NEMO不使用通常的两步方法进行关联性检验,其中单元型计数首先被估计,这可能使用EM算法,然后进行检验,处理估计的计数,就像它们是真的计数一样,该方法有时候是有问题的,并且可能需要随机化以恰当评估统计显著性。相反地,使用NEMO,直接对观测数据计算最大似然估计值、似然比和P值,因此由于阶段不确定性和漏失基因型造成的信息损失由似然比自动地获取。
在两个组内和两个组之间,一些冰岛人患者和对照都有亲缘关系。为了针对亲缘关系校正该关联性结果,我们通过在冰岛人宗谱中遗传的等位基因来模拟基因型。对于每次模拟,我们以与对真正基因型(real genotype)相同的方式进行病例-对照关联性检验,即χ平方似然比检验。我们计算N次模拟的χ平方统计的平均值(其与相应Z-得分的方差相同),对于独立个体在零假设下,其必须为1,而对于有亲缘关系的个体,预期其稍微更大。然后,通过将真正关联性的χ平方统计值除以从模拟获得的平均值,进行针对亲缘关系的校正。
使用Mantel-Haenszel模型,进行多个病例-对照复制组的联合分析,其中使多个组具有不同的等位基因、单元型和基因型群体频率,但是假定具有共同的相对危险度。
所有P-值均以双侧报告。
多原发性乳腺肿瘤的分析:从ICR获得多原发性乳腺癌(MPBC)的诊断记录。除了第一乳腺癌诊断之外,在临床上和通过组织学证实诊断的原发性肿瘤为独立的原发性肿瘤,其与第一乳腺癌同时出现或在第一乳腺癌之后出现,并且在对侧或同侧乳腺发生。在临床上和通过组织学分类为原始肿瘤的复发或多病灶单一原发性肿瘤的肿瘤被排除。直到2005年12月最后,出现在登记资料中的诊断具有2个或更多个独立原发性肿瘤的患者被考虑为MPBC。到2005年12月31日在ICR不具有第二原发性肿瘤诊断的患者被指定为单一原发性乳腺癌(SPBC)病例。MPBC相对于SPBC的风险通过逻辑回归加以确定,这考虑从第一乳腺癌诊断为协同变异的时刻之后的年数。使用NEMO软件,通过线性回归,评估发病年龄比较。
家族史分析:对于每个受影响的先证者,使用宗谱数据库和ICR记录,分配家族史分数。通过参考宗谱数据库,确定先证者周围的第一到第三级亲属的范围(circle)。然后,亲缘关系的影响状态从ICR记录加以确定。对于每一受影响的第一级亲属,先证者被分配家族史分数1,对于每一受影响的第二级亲属,先证者被分配家族史分数0.5,而对于每一受影响的第三级亲属,先证者被分配家族史分数0.25。然后,对于每一先证者,将总分数相加。通过在JMP v4软件(S.A.S.Institute Inc.)上运行Wilcoxon检验,检验SNP标记基因型和家族史分数之间的潜在关系。
关联性分析表型:对于关联性分析,我们使用两个相关的表型。第一个表型包括所有1600个诊断患有乳腺癌的个体。该表型被指定为“所有乳腺癌”(所有BC)。第二表型选择具有中度到高度诱因特征的个体,并且被指定为“中等诱因”(MedPre)。该表型的定义要求先证者满足下列标准的至少一个:1.先证者是包含3个或以上的在3次减数分裂事件的遗传距离(3M)内的受影响亲属的乳腺癌病例群体的一员。2.先证者是在3M内具有亲属关系的受影响对的一员,他们中的一个当年龄在50岁或更年轻时被诊断。3.先证者是在3M内具有亲属关系的受影响对的一员,他们中的一个被诊断患有任何类型的第二原发性肿瘤。4.先证者已被被诊断患有任何类型的第二原发性肿瘤。在Illumina Hap300芯片上分型的1600个患者中,653个满足MedPre标准(40.8%)。结果第一部分:染色体2q14.2上的rs4848543rs4848543等位基因A等位基因与乳腺癌风险增加相关联:
全基因组关联性分析表明rs4848543等位基因A与MedPre乳腺癌相关联。对1598个患者(他们中的653个满足MedPre表型标准)和4477个无癌症对照,获得该SNP的Illumina芯片数据。当对病例和对照组中的个体之间的亲缘关系校正时,与MedPre乳腺癌相关联的rs4848543等位基因A的RR估计值为1.42,其中P值为8.3x10-8(表1)。在对检验的317,089个SNP进行Bonferroni校正后,综合校正P-值为0.026。rs4848543的A等位基因也示出与所有BC表型具有标称显著关联性,其相对危险度估计值为1.16(表1)。为了证实在来自冰岛人群体的独立样品中的该结果,我们设计并验证Centaurus SNP分析——SG02S738,以检验rs4848543SNP。SG02S738分析对另外573个BC患者进行,其中198个符合MedPre表型定义。这些患者被再次检验,独立对照组包括7406个个体,使用Illumina芯片或SG02S738分析对其进行rs4848543分型。在第二组中,与MedPre乳腺癌相关联的rs4848543等位基因A的RR估计值为1.26(p-值=3.4x10-2)。因此,在独立的冰岛人样品中,最初发现以标称显著性得到复制。联合分析的结果——其中最初1598个患者和573个复制患者组被组合并与11883个对照相比较——在表1中示出。联合分析显示对所有BC表型具有标称显著风险,而对MedPre乳腺癌表型显示全基因组显著风险。对MedPre乳腺癌的综合Bonferroni校正P-值为0.0095(对317,089个SNP进行校正)。该值是全基因组显著的,即使所有BC和MedPre的两个表型的检验被考虑也是如此。
因为ICR记录回溯到1955年,我们招募的患者的一些是长期癌症存活者。如果与非携带者相比,携带rs4848543等位基因A变体的患者具有不同的长期存活的可能性,那么在流行病例中的变体的频率可能被影响。为了研究这一点,我们鉴定包括883个个体的患者亚组(subset),所述患者在2000年1月1日后诊断,并且从诊断到招募的时间小于5年。在该最近诊断的患者人群中,rs4848543等位基因A的等位基因频率为0.372945。我们也鉴定了一组1338个患者,所述患者在2000年1月1日之前已被诊断,并且已经存活至招募时。在该组中,rs4848543等位基因A的频率为0.372749,其与最近诊断的患者中的频率没有显著差异(P值=0.99)。因此,没有有说服力的证据表明:差异存活影响在表1中示出的风险估计值。
我们另外注意到,不具有MedPre表型的乳腺癌患者没有显示rs4848543等位基因A频率的任何增加(表1)。该观察的含意在下面进一步讨论。我们继续检查rs4848543等位基因A和具有MedPre表型定义的各个组成之间的关联。rs4848543等位基因A不与早发型乳腺癌显著相关联:
因为年轻的诊断年龄是在MedPre表型的定义中使用的标准之一,所以我们查找诊断年龄和rs4848543基因型之间的关联性。在于Illumina芯片上分析的1598个患者中,在rs4848543基因型和诊断年龄之间没有显著关联性(表2)。rs4848543等位基因A的风险与乳腺癌家族史相关联:
对于研究中的每个患者先证者计算家族史分数。使用宗谱数据库,我们鉴定每一先证者的第一到第三级亲属的范围。然后,通过参考ICR记录,我们鉴定他们自己已被诊断患有乳腺癌的所有亲属。然后,我们对每一先证者产生相加的家族史分数(FHS),对于每一受影响的第一级亲属,分配分数1,对于每一受影响的第二级亲属,分配分数0.5和,而对于每一受影响的第三级亲属,分配分数0.25。然后,1598个已经在Illumina芯片上分型的先证者被评估以寻找FHS和rs4848543基因型之间的关联性。如在表2中所示,增加FHS的倾向性与rs4848543的A等位基因的携带相关联。仅仅基于rs4848543等位基因A变体在所有BC患者中的相对危险度仅为1.16这个观察,该结果不被期望;该相对危险度单独不能产生乳腺癌病例的家族簇集[Stacey,et al.,(2006),PLoS Med,3,e217]。然而,使用MedPre表型,发现rs4848543等位基因A,在它的定义中,其具有大量家族史要素。这些观察表明rs4848543等位基因A可以与较不常见的、较高外显率的变体连锁不平衡。可选地,rs4848543等位基因A可示出与另一高外显率诱因决定子的相互作用,这增加了它们的外显率,并从而与乳腺癌的家族史相关联。rs4848543等位基因A的风险和乳腺癌家族史之间的关联性由携带BRCA2999del5突变的家族部分(但不完全)解释:
为了进一步研究rs4848543等位基因A和乳腺癌家族史之间的关联性,我们寻求携带良好表征的冰岛BRCA2999del5突变的家族是否是携带rs4848543等位基因A的家族展示的家族性簇集的原因。对于BRCA2999del5突变,我们从1600个患者的组分型出1499个患者。如上所述我们重新计算FHS,此时排除了所有已示出携带BRCA2999del5突变的先证者。如在表2中所示,rs4848543等位基因A和FHS的关联性在除去999del5突变携带者后仍然显著,这表示关联性不能完全由BRCA999del5突变家族所解释。然而,当与999del5携带者没有被排除时相比,P-值明显高,这导致我们怀疑BRCA2999del5可能涉及rs4848543等位基因A展示的家族簇集的一些。rs4848543等位基因A的风险延伸至BRCA2999del5突变携带者:
因为在冰岛BRCA2999del5突变家族性乳腺癌有实质性影响,所以我们考虑其与rs4848543等位基因A变体的关系。一种可能的方案是rs4848543等位基因A变体赋予BRCA2999del5携带者可忽略的额外风险,如CHEK2和BRCA突变之间相互作用所表示的[(2004),Am J Hum Genet,74,1175-82;Meijers-Heijboer,et al.,(2002),Nat Genet,31,55-9]。如果是这样,那么rs4848543等位基因A变体在受影响的BRCA2999del5携带者中的频率将接近对照频率。相反地,如果rs4848543等位基因A变体在受影响的BRCA2999del5携带者中的频率大于在群体对照中的频率,那么将表示rs4848543等位基因A赋予BRCA2携带者风险在999del5突变赋予的风险之上。为了最大化BRCA2999del5携带者的数量,在联合的冰岛Illumina和复制患者组中,进行下列分析。数据检查表明,rs4848543等位基因A变体的频率在患有乳腺癌的BRCA2999del5携带者中为0.463,这显著高于对照频率,并且对应于1.65的RR(表3)。因此,对于携带的每一rs4848543等位基因A等位基因,使BRCA2999del5携带者(其已经处于乳腺癌的高风险下)的风险乘以估计因子1.65。没有证据表明rs4848543基因型偏离该乘积模型。这些观察证明rs4848543等位基因A变体赋予的乳腺癌风险增加延伸到BRCA2999del5携带者。因为BRCA2999del5是产生无功能蛋白质的无效突变,所以这些结果表明rs4848543等位基因A赋予的风险延伸到所有BRCA2突变携带者,其中突变致使所述蛋白质无功能。rs4848543等位基因A可与BRCA2999del5协同相互作用:
rs4848543等位基因A风险延伸到BRCA2999del5携带者这一观察提出了这样的问题:与其对999del5非携带着相比,该变体是否对999del5携带者赋予了相同的相对危险度。我们注意到rs4848543等位基因A在BRCA2999del5携带者中的相对危险度估计值(1.65)有些高于rs4848543等位基因A在BRCA2突变的非携带着中的相对危险度估计值(1.13,表3)。因此,我们检验rs4848543等位基因A赋予的相对危险度在BRCA2999del5背景中是否与在非-999del5背景中不同。如在表3中所示,rs4848543等位基因A赋予的相对危险度估计在999del5携带者中比在非携带着中高1.46倍。这些观察与rs4848543等位基因A以协同方式与BRCA2999del5相互作用的解释相一致。因为BRCA2999del5是产生无功能蛋白质的无效突变,所以这些结果表明rs4848543等位基因A以协同方式与BRCA2突变相互作用,其中突变致使所述蛋白质无功能。
与BRCA2999del5的潜在相互作用也通过评估在患者中,患者携带的rs4848543的变体等位基因数目和999del5之间是否存在显著相关性,来进行研究。如在表4中所示,在患者中,在携带的rs4848543等位基因A的数目和BRCA2999del5等位基因的携带之间存在显著相关性。为了研究在患者中rs4848543等位基因A和BRCA2999del5等位基因之间的相关性是否可能已经由于潜在群体分层(underlyingpopulation stratification)而出现,我们检查在对照群体中是否存在相关性。在已经检验两种变体的5938个对照中,没有相关性。乳腺癌患者从该5938个对照的组中排除。因为BRCA2999del5是乳腺癌的如此强的风险因子,所以可能认为对照组排除了999del5携带者(因为相对少的女性携带者可能未被乳腺癌影响)。因此,我们使用包括已经检验过这两种变体的2925个男性的对照组重复该检验。在该组中,rs4848543等位基因A和999del5携带之间,没有相关性的证据。因此,我们推定没有可解释患者中rs4848543等位基因A和999del5的共遗传的潜在群体分层的证据。因此,最可能的解释是rs4848543等位基因A和999del5以协同方式相互作用。
然后,我们回到我们的观测:当已知的BRCA2999del5患者从分析中去除时,rs4848543等位基因A显示与家族史的关联性(表2)。我们寻求不是BRCA2999del5携带者但是符合MedPre表型标准的高风险患者是否显示rs4848543等位基因A的频率增加。在这些患者中,频率比对照中的高,这与1.35的相对危险度对应(表3)。因此,与rs4848543等位基因A的风险关联性延伸到不是999del5携带者但是其仍然具有MedPre特征的患者。
如表1中所示,在不符合MedPre表型定义的患者中,没有可检测到的与rs4848543等位基因A关联的风险。这暗示rs4848543等位基因A仅在MedPre表型背景中赋予风险。如果相对稀少的、高外显率突变在rs4848543等位基因A变体的背景上存在,那么这可发生。可选地,rs4848543等位基因A变体可以指示更常见的等位基因,其修饰BRCA2的外显率,以及其他至今未鉴定的具有家族关联性的高外显率风险决定子。这样的未鉴定的风险决定子可能是其他基因的高外显率变体、变体的多基因组合、或甚至在家族中簇集的环境风险因素。为方便起见,我们将这类假设的高外显率风险决定子称为BRCAx。为了进一步研究rs4848543等位基因A可能作为修饰基因这一观点,我们寻求在受影响的BRCA2999del5携带者中rs4848543等位基因A是否以与其在受影响MedPre非BRCA携带者中相同的频率发生。实际上,这询问与对具有BRCAx的个体相比,rs4848543等位基因A变体对999del5的携带者是否赋予相似的风险。如在表3中所示,在这些组之间的rs4848543等位基因A变体的频率没有显著性差异。然而,相对危险度的点估计值为1.22,这表示在999del5携带者中作用可能更大。rs4848543等位基因A和rs4848543LD区段内的多个其他标记(与rs4848543连锁不平衡)的携带者处于增加的多原发性乳腺癌风险:
多原发性乳腺肿瘤的发生是遗传诱因的指示,并且具有临床关联性。已经患有乳腺癌的患者对于形成第二原发性肿瘤的风险大大增加。遗传易感性可构成该增加的风险的实质组成。因此,我们研究多原发性乳腺癌(MPBC)是否在rs4848543等位基因A携带者中比非携带者中以更高预期频率发生。源自Illumina芯片的数据表明rs4848543LD区段中的其他标记能够至少与rs4848543一样好地预测MPBC。因此,我们对该区段内的标记设计并检测一组8个分析。在使用逻辑回归和针对患者追踪时间长度修正的MPBC风险评估中,当与仅经历单一原发性乳腺癌(SPBC)诊断的患者相比时,8个SNP中的7个显示携带者中MPBC风险增加(表5)。我们推定这7个SNP分析可以确定患者是否处于增加的MPBC风险。在一个连锁不平衡区段中的多个SNP显示与所有BC和MedPre乳腺癌表型的关联性:
SNP rs4848543等位基因A在连锁不平衡(LD)区段中发现,基于NCBI Build 34,该连锁不平衡区段的定界坐标在表6中示出。LD区段被限定在重组热点之间延伸,如使用如在[McVean,et al.,(2004),Science,304,581-4;Winckler,et al.,(2005),Science,308,107-11]描述的似然比检验,通过在牛津大学的Mathematical Genetics Group所限定的。来自Illumina Hap300芯片的数据显示许多SNP处于与rs4848543等位基因A的同一连锁不平衡区段中,并且示出与检验的两个乳腺癌诱因标称显著关联性。表7和8显示在Illumina Hap300芯片上存在的LD区段中所有SNP的列表,以及从他们中获得的两个表型的关联性值。我们也考虑该区段内的双标记单元型,其被鉴定为HapMap项目中分型的另外的SNP组的有效替代物(r2>0.8)(对HapMap数据的所有参考请参照release 20)。这些另外的SNP在UTAH CEPH(CEU)HapMap样品中具有>5%的次要等位基因频率,并且它们既不在Hap300SNP芯片上,它们也不被该芯片上的SNP有效标记[Pe′er,et al.,(2006),Nat Genet,38,663-7]。这些所谓的“Daly”单元型的结果在表7和8中示出。对于MedPre乳腺癌,29个单独SNP或两点“Daly”单元型表现出标称显著的p值。rs4848543等位基因A-关联性风险存在于多单元型背景上
为了设法区别rs4848543等位基因A标记相对稀少的、高外显率变体或表现为其他高外显率决定子的常见改性物,我们研究其中rs4848543等位基因A出现的单元型背景的多样性。rs4848543LD区段包含相对高重组的区域,其远端在核苷酸120034174附件。赋予标称显著的乳腺癌风险的SNP位于该重组区的远侧(在右边)。因此,我们限定我们的单元型多样性分析于该右侧的亚区段区域。使用在Illumina芯片上分型的SNP和样品,我们应用NEMO软件以鉴定限定区域(nt 120034174至nt 120129001)内的单元型。区分单元型所不必需的冗余SNP被除去,然后对每一得到的单元型评估相对危险度和频率。结果在表9中示出。显然所有鉴定的携带rs4848543A等位基因的单元型具有大于1的相对危险度估计值,并且在大多数情况下,RR估计值显著大于1。相反地,没有携带rs4848543C等位基因的单元型具有大于1的RR估计值,以及所有显著的估计值小于1(即,它们是保护性的)。因此,我们不能将风险与含有rs4848543等位基因A的单元型分开。这表明致病变体(即机械地赋予风险的变体)是rs4848543等位基因A或与rs4848543等位基因A强连锁不平衡的变体。在多单元型背景上致病变体的存在暗示其频率可能很接近rs4848543等位基因A的频率(即rs4848543等位基因A和致病变体之间的r2值高)。该观测支持如此观点:rs4848543等位基因A没有指出在rs4848543LD区段内稀少的、高外显率变体的存在,而是其标记高外显率决定子例如BRCA2和以前限定的BRCAx的更常见的改性物。许多标记通过它们的与rs4848543等位基因A的相关性可以示出BC风险关联性:
对HapMap项目数据(release 20)的参考揭示在CEU白种欧洲人群体样品中大量已知的SNP与rs4848543相关联,其r2值大于0.2。因为这些SNP与rs4848543显著相关,所以它们可被用于测量与通过rs4848543本身测量相同的BC风险。这些SNP在表10中列出。STEAP3/TSAP6基因是参与观察到的乳腺癌风险的最可能的基因:
在rs4848543LD区段区域中有三个目前已知的基因。这些是:1.补体成分1q亚成分样2基因C1Q12(NM_182528)2.六次跨膜前列腺上皮细胞抗原3(STEAP3)基因(另外称为肿瘤抑制基因活化通道6(TSAP6))、pHyde和Dudulin-2。该基因有三种主要的已知可选转录物,其通过RefSeq号NM_018234(同种型b)、NM_182915(同种型a)和NM_001008410(也称为AF262322)加以标识。该基因的第四种转录物已被描述,并称为标识符AK024163。3.转录物,AK127773,与STEAP3基因重叠,并且从相反(左向)链转录。该基因已被称为假拟蛋白(Hypothetical protein)FLJ45874。
rs4848543LD区段包含相对高重组的区域,其远端在核苷酸120034174附近。赋予标称显著乳腺癌风险的大多数SNP和Daly 2点单元型位于该重组区域的远侧(在右边)。这暗示在C1Q12中和C1Q12附近的变体不是关联性信号的来源。确实与风险强关联的变体位于STEAP3/TSAP6基因的5’以及为位于STEAP3/TSAP6基因之中。实际上,两个标称显著的SNP——rs838100和rs3731603,在该基因的转录序列内,而另两个——rs838102和rs12711924——位于STEAP3/TSAP6内含子内。这两个SNP的后一个位于IVS4基因的3’剪接位点附近。考虑这些观测和已知的STEAP3/TSAP6基因生物学(见下文),涉及观察到的乳腺癌风险增加的最可能基因是STEAP3/TSAP6。第二部分:染色体2q35上的rs13387042
rs13387042A等位基因与冰岛乳腺癌风险增加相关联:
全基因组关联性分析示出13387042等位基因A与任何BC表型相关联(表11)。该SNP位于染色体2q35处,在与STEAP3/TSAP6基因座不同的位置。对1598个患者和4475个无癌症对照,获得该SNP的Illumina芯片数据。当对病例和对照组中的个体之间的亲缘关系校正时,A-rs13387042的RR估计值为1.19,其中P值为4.0x10-5。在MedPre乳腺癌中,RR相似,P值为4.4x10-5
本质上,在对检测的317,089个SNP进行Bonferroni校正后,该结果没有达到被考虑为全基因组显著性的水平。因此,在来自冰岛人群体的独立样品中,我们寻求证实该结果,如同我们对rs4848543等位基因A所进行的。我们设计并检验Centaurus SNP分析——SG02S738,以检验rs13387042SNP。SG02S738分析对另外583个患者和包括7966个个体的独立对照组进行,所述个体通过Illumina芯片或Centaurus方法,针对rs13387042进行分型。该7966对照组包含已经被诊断患有前列腺癌或结肠直肠癌的个体,但是该个体没有患有乳腺癌。这得到我们的中间观测的证实:rs13387042等位基因A不赋予这些癌症可检测的风险(数据没有示出)。在第二组中,与任何BC相关联的rs13387042的A等位基因的RR估计值为1.20(p-值校正=3.8x10-3)。因此,在独立的冰岛人样品中,最初发现被显著性复制,具有非常相似的RR点估计值。联合分析的结果——其中最初1598个患者和583个复制样品被组合并与12441个对照相比较——在表11中示出。联合分析显示1.20的显著相对危险度估计值(p-值校正=2.0x10-7),其在对检测的317,089个SNP进行Bonferroni校正后接近于显著性水平。在冰岛人群体中,rs13387042等位基因A变体的观测的频率和相对危险度与15.6%的估计的群体归因危险度相应。
因为ICR记录回溯到1955年,我们招募的患者的一些是长期癌症存活者。如果与非携带者相比,携带rs13387042等位基因A变体的患者具有不同的长期存活的可能性,那么在流行病例中的变体的频率可能被影响。为了研究这一点,我们鉴定包括837个个体的患者的亚组,所述患者在2000年1月1日后诊断,并且从诊断到招募的时间小于5年。在该最近诊断的患者人群中,rs13387042等位基因A的等位基因频率为0.498。我们也鉴定了一组1344个患者,所述患者在2000年1月1日之前已被诊断,并且已经存活至招募时。在该组中,rs13387042等位基因A的频率为0.492,其与最近诊断的患者中的频率没有显著性差异(P值=0.71)。因此,没有有说服力的证据表明:差异存活影响在表11中示出的风险估计值。在西班牙人病例:对照样品中,rs13387042A等位基因与乳腺癌风险增加相关联
为了进一步研究rs13387042等位基因A在乳腺癌风险中的作用,我们检查了在西班牙收集的一个独立的BC病例:对照样品组。西班牙研究群体由从Oncology Department of Zaragoza Hospital inZaragoza,Spain招募的446个乳腺癌病例组成。一组977个对照个体在University Hospital in Zaragoza,Spain研究,并且确认在他们被包括在该研究之前没有患有乳腺癌。所有对象给出书面知情同意书。
使用SG02S728Centaurus分析,针对rs13387042对西班牙病例和对照样品进行基因型分型。该结果在表11中提供。在该群体中,rs13387042的等位基因A示出与乳腺癌风险显著相关联,其RR的点估计值为1.21(P-值为1.8x10-2)。rs13387042等位基因A变体的频率在西班牙对照样品中更高,这表示该变体可能更盛行,并因此在西班牙人采集的群体中促进更高的乳腺癌负担。在瑞典人人病例/对照样品中,rs13387042A等位基因与乳腺癌的风险增加相关联:
为了进一步证实rs13387042的A等位基因变体在乳腺癌风险中的作用,我们在两个瑞典人群中分型SNP:“Sweden Familial”人群包括已经访问Karolinska Institute,Stockholm的致病机制咨询诊所(oncogenetic counseling clinic)的346个BC患者,用于研究乳腺癌家族史。每一个患者来自不同的家庭。“Sweden Consecutive”人群包括参与Karolinska Institute乳腺癌诊所的482个连续招募的BC患者。在选择该第二个人群时,没有考虑家族史。对照是1300个来自Stockholm区域的献血者和434个结肠直肠癌病例的无癌症配偶。在该对照中,A-rs13387042频率在性别之间没有显著差异,在献血者和无癌症对照组之间也没有显著差异。
如在表11中所示,“Sweden Consecutive”人群显示1.31的显著的乳腺癌的相对危险度(P-值=2.0x10-4)。“瑞典家族”人群相对危险度估计值为1.11,其不是显著的,这或许因为该组可携带遮蔽A-rs13387042效应的高外显率基因。总之,组合的瑞典人群返回1.22的显著性相对危险度估计值(P-值=8.1x10-4)。
在联合分析中,使用Mantel-Haenszel模型,结合对冰岛、西班牙和瑞典人群的估计。结果是估计的相对危险度为1.20,P-值为3.8x10-11。这远在使用Bonferroni方法对研究的317,089个SNP进行校正得到的全基因组显著性阈值之下。因此,我们推断在数个欧洲人血统的群体样品中,A-rs13387042对乳腺癌赋予显著和可重复的风险。估计总群体归因危险度为16.4%。rs13387042等位基因A-关联风险存在于多单元型背景上:
rs13387042SNP在连锁不平衡(LD)区段中发现,基于NCBI Build 34,该连锁不平衡区段的定界坐标在表12中示出。LD区段被限定在重组热点之间延伸,如使用如在[McVean,et al.,(2004),Science,304,581-4;Winckler,et al.,(2005),Science,308,107-11]描述的似然比检验,通过在牛津大学的Mathematical Genetics Group所限定的。为了设法区别标记rs13387042的A等位基因标记相对稀少的、高外显率变体或更常见的低外显率变体,我们研究其中rs13387042等位基因A出现的单元型背景的多样性。使用在Illumina芯片上分型的SNP和样品,我们应用NEMO软件以鉴定LD区段内的单元型。区分单元型所不必需的冗余SNP被消除,然后对每一得到的单元型评估相对危险度和频率。结果在表13中示出。显然数个鉴定的携带rs13387042等位基因的A等位基因的单元型赋予大于1的相对危险度估计值,并且在若个情况下,RR估计值显著大于1。相反地,仅一个稀少的携带rs13387042等位基因的C等位基因的单元型示出大于1的RR估计值,以及含rs13387042等位基因C的单元型的两个标称显著RR的估计值小于1(即,它们是保护性的)。两个携带rs13387042的A等位基因的单元型没有产生大于1的RR估计值,并且这些估计值的一个是标称显著的。总之,这些观测结果表明致病变体(即,机械地赋予风险的变体)与rs13387042等位基因A强LD,但是可能不是rs13387042等位基因A本身。在rs13387042LD区段中多个SNP示出与BC风险相关联:
来自Illumina Hap300芯片的数据揭示多个SNP与rs13387042存在于同一LD区段中。表14示出在该LD区段中所有SNP的列表,其存在于Illumina Hap300芯片上,并且对于单点和两点“Daly”单元型分析,从它们获得关联值。可见,当针对对象中的家族亲缘关系进行校正后,21个SNP或Daly单元型显示标称显著的P值。许多标记通过它们与rs13387042等位基因A的相关性可以显示出BC风险关联性:
对HapMap项目数据(release 20)的参考揭示在CEU白种欧洲人群体样品中大量已知的SNP与rs13387042相关联,其r2值大于0.2。因为这些SNP与rs13387042显著相关联,所以它们可被用于测量与通过rs13387042本身测量相同的BC风险。这些SNP在表15中列出。第三部分:染色体16q12上的rs3803662
rs3803662的T等位基因与乳腺癌风险相关联:
使用来自1600个乳腺癌患者和11563个对照的数据的进一步全基因组SNP分析鉴定,SNP rs3803662的T等位基因赋予估计的1.23倍的任何BC风险增加(表16)。该结果在第二、独立的594个冰岛乳腺癌患者和1433个对照的人群中得以证实。当对个体之间的亲缘关系修正后,这两组冰岛样品的组合数据给出1.23的相对危险度估计值和2.8x10-7的P-值。这相应于估计的10.1%的群体归因危险度(表16)。rs3803662等位基因T与乳腺癌风险的关联性在来自瑞典、西班牙和荷兰的乳腺癌病例:对照人群中被复制。
为了证实rs3803662等位基因T与乳腺癌风险的关联性,我们在三个独立的外国人群中复制该发现。我们基因型分型上述的来自瑞典和西班牙人群的个体。我们也基因型分型来自荷兰Nijmegen的558个乳腺癌病例和1384个对照。该人群从在2005-2006年在荷兰东部诊断的乳腺癌患者的基于群体的登记调查获得。在该期间所有在70岁以前诊断患有乳腺癌的患者被邀请参加该研究。对照组在基于群体登记的随机样品从2002-2003进行的调查(the Nijmengen BiomedicalStudy)收集。如在表16中所示,在所有这三个复制人群中,对于rs3803662等位基因T观察到显著增加的风险。在这三个非冰岛复制人群的组合分析中,总相对危险度估计值为1.35,P-值为5.1x10-12。冰岛和复制人群的联合分析表明组合的相对危险度估计值为1.28,P-值为2.7x10-17。当对检验的SNP数修正时,这远在全基因组显著性的阈值之下。相应的总群体归因危险度估计值为13.4%(表16)。含有rs3803662的LD区段的限定和潜在候选基因的鉴定。
rs3803662SNP在连锁不平衡(LD)区段中发现,基于NCBIBuild 34,该连锁不平衡区段的定界坐标在表17中示出。LD区段被限定在重组热点之间延伸,如使用如在[McVean,et al.,(2004),Science,304,581-4;Winckler,et al.,(2005),Science,308,107-11]描述的似然比检验,通过在牛津大学的Mathematical Genetics Group所限定的。rs3803662存在于称为LOC643714的假拟蛋白的转录物内。因此,该假拟蛋白被暗示为潜在诱癌基因。已知基因TNRC9的5’端也在本区段中存在。TNRC9是与高泳动族(HMG)蛋白家族相关的染色质的成员,高泳动族(HMG)蛋白家族是一组已知包括转录因子和染色质重建剂的蛋白质。当与原发性乳腺癌相比时,减少的TNRC9蛋白表达已经在转移性乳腺癌中发现(Olendrowitz,C.2006,Bachelor of ScienceBioinformatics Thesis,Charité-Universitatsmedizin,Berlin)。靠近该基因5’端的SNP变体的鉴定表明该变体与改变TNRC9蛋白功能表达的遗传因素连锁不平衡,这导致乳腺癌风险增加。在rs3803662LD区段中多个SNP显示与BC风险相关:
来自Illumina Hap300芯片的数据揭示多个SNP与rs3803662存在于同一LD区段中。表18示出在该LD区段中所有SNP的列表,其存在于Illumina Hap300芯片上,并且对于单点和两点“Daly”单元型分析,从它们获得关联值。可见,80个SNP或Daly单元型显示标称显著的P-值。许多标记通过它们与rs3803662等位基因T的相关性可显示出BC风险关联性:
对HapMap项目数据(release 20)的参考揭示在CEU白种欧洲人群体样品中大量已知的SNP与rs3803662相关联,其r2值大于0.2。因为这些SNP与rs3803662显著相关联,所以它们可被用于测量与通过rs3803662本身测量相同的BC风险。这些SNP在表19中列出。在数个不同的种族中,rs3803662等位基因T和/或相关的SNP赋予乳腺癌风险:
为了研究来自不同种族背景的患者中rs3803662等位基因T的发现的一般性,我们在来自Multiethnic人群研究(MEC)的乳腺癌患者和对照的样品中,检验SNP关联性。MEC由超过215,000个夏威夷和洛杉矶(以及来自加利福尼亚州的其他地方的另外的非洲裔美国人)的男性和女性组成,并且在另外地方已经详细描写[Kolonel,et al.,(2000),Am J Epidemiol,151,346-57]。该人群主要包含非洲裔美国人、夏威夷土著人、日本裔美国人、拉丁美州人和欧洲裔美国人,他们通过完成26页的自我管理的调查表而在1993和1996年之间进入研究,所述调查表要求关于饮食习惯、人口因素、个人行为、在先医疗状况史、常见癌的家族史的详细信息,并且对于女性,要求生育历史和外源激素应用的详细信息。参与者的年龄在登记时介于45和75岁之间。在MEC中发生的癌症通过与覆盖夏威夷和洛杉矶地区的基于群体的癌症监视、流行病学和最终结果(SEER)登记的人群连锁(cohort linkage)鉴定,以及与覆盖整个加利福尼亚州的California State Cancer Registry的人群连锁鉴定。在1994开始,从MEC参与者的发生乳腺癌的病例和随机样品收集血样以用作在人群中进行遗传分析的对照库。在嵌套的乳腺癌病例对照研究中合格的病例由到2002年12月31前登记进入MEC后诊断患有发生的攻击性癌症的女性组成。对照是分别在进入该人群之前并且直到2002年12月31日没有诊断的没有乳腺癌的参与者。基于人种/种族和年龄(5年间隔),对照是与病例是频率匹配的。该研究由南加州大学和夏威夷大学的Institutional Review Boards批准。
在来自MEC的欧洲裔美国人、拉丁美洲人和非洲裔美国人中,我们设法研究与rs3803662相关联的风险。因为rs13387042SNP和其他SNP之间的相关性在不同种族中可能不同,我们选择一组SNP在这些样品中检验。对于非洲裔美国人和约鲁巴人(非洲裔),源自HapMap项目数据(release 20)的SNP、它们的r2和D′值在表23中示出。对这些SNP产生Centaurus分析,并且在MEC样品中进行基因型分型。为了更好地能比较SNP之间的结果,通过单元型分析,我们使用考虑漏失基因型的广义似然比检验。对于不同的SNP,这具有平衡病例和对照数目的作用,这使它们之间更容易比较。结果在表24中示出。首先,显然来自rs3803662等位基因T的风险在欧洲裔美国人得到显著地复制。在欧洲裔美国人中,与rs3803662等位基因T相比,相关SNP的两个——rs4784227等位基因T和rs17271951等位基因C,显示出标称更高的相对危险度和更低的P值。这例证了如此概念:与原来鉴定的SNP相关联可能具有更高的相对危险度,因此提供出众的疾病风险标记。
rs3803662等位基因T信号也在拉丁美洲人中显著地复制。在非洲裔美国人中,标记rs3803662的T等位基因没有显著地复制,实际上,T-等位基因在非洲裔美国人样品中是显著保护性的。这暗示在rs3803662等位基因T和推定的致病突变之间的LD相关性在非洲裔美国人中是相当不同的。我们注意到三种相关的SNP等位基因——rs12922061等位基因T、rs4784227等位基因T和rs17271951等位基因C——在欧洲人中与rs3803662等位基因T强相关,但是该相关性在Yoruban非洲人中没有得以维持(表24)。然而,不像rs3803662等位基因T,相关的SNP等位基因rs12922061等位基因T、rs4784227等位基因T和rs17271951等位基因C都对乳腺癌显示相对危险度的标称增加,它们中的两个达到1-侧水平的统计显著性(表24)。这显示使用相关SNP组可以提供适用于多种种族组的风险标记。rs13387042等位基因A和rs3803662等位基因T赋予雌激素受体阳性乳腺癌风险增加:
如果它们有用,那么检查在该研究中的患者医疗记录。使用组合样品组,我们寻找rs13387042等位基因A和rs3803662等位基因T、诊断年龄、雌激素受体(ER)和孕酮受体(PR)状态之间的关联性。没有任何一个变体显示与诊断年龄相关联。包括rs13387042等位基因A和rs3803662等位基因T的显著乳腺癌风险被清楚地限定于诊断患有ER阳性肿瘤的那些,并且ER阳性和ER阴性肿瘤的OR之间的差异显著(表24)。类似地,优选在诊断患有PR阳性肿瘤的患者中,具有对乳腺癌风险的倾向性,然而,PR阳性和PR阴性OR之间的差异不显著。这表明ER阳性和阴性肿瘤可能具有稍微不同的遗传病因学。表:表1:SNP SG02S738(rs4848543)等位基因A与乳腺癌风险的关联性: *针对个体之间的亲缘关系进行校正表2:SNP SG02S738(rs4848543)与乳腺癌诊断年龄和家族史的关联性:
  比较   P-值(Wilcoxon)
  rs4848543基因型对诊断年龄   0.5139
  rs4848543基因型对家族史分数   <0.001
  非-BRCA2rs4848543基因型对家族史分数   0.0044
表3:在BRCA2999del5携带者中,SNP SG02S738(rs4848543)与乳腺癌风险的关联性:
  p-校正*   p-值   r   95%CI   #受影响的   受影响的频率   #对照   对照频率
  BC BRCA2携带者对CTR   3.67E-03   8.02E-04   1.65   (1.18,2.30)   94   0.463   9452   0.344
  BC BRCA2非携带者对CTR   2.95E-03   2.19E-03   1.13   (1.04,1.22)   1621   0.371   9452   0.344
  BC BRCA2携带者对BCBRCA2非携带者   3.06E-02   1.29E-02   1.46   (1.04,2.05)   94   0.463   1621   0.371
  MedPre BRCA2非携带着对CTR   4.71E-06   5.92E-07   1.35   (1.19,1.55)   622   0.414   9452   0.344
  BC BRCA2携带者对MedPre BRCA2非携带者   n.a.   2.08E-01   1.22   n.a.   94   0.463   622   0.414
*针对个体之间的亲缘关系进行校正表4:rs4848543等位基因A和BRCA2999del5基因型之间的相关性表5:SNP与多原发性乳腺癌的关联性
#MPBC MPBC频率 #SPBC SPBC频率 P携带者 RR携带者 等位基因标记 rs SNP   在SeqID 4中位置
  128   0.258   1566   0.189   0.0111   1.615   4SG02S733   rs895398   34898
  160   0.409   2010   0.370   0.0433   1.419   1SG02S738   rs4848543   37814
  160   0.547   2019   0.488   0.0438   1.498   1SG02S739   rs6759589   41694
  163   0.414   2001   0.371   0.0389   1.427   4SG02S753   rs895397   49118
  162   0.645   2020   0.575   0.0072   1.928   3SG02S740   rs838102   56596
  160   0.650   2014   0.575   0.0050   2.012   3SG02S741   rs838100   60428
  127   0.445   1565   0.380   0.0176   1.602   1SG02S734   rs12711924   84034
  159   0.387   2004   0.343   0.1741   1.258   4SG02S742   rs3731603   93780
表6:染色体2上rs4848543LD区段的定义: 表12:染色体2上rs13387042LD-区段的定义 表16:SNP SG16S299(rs3803662)等位基因T与乳腺癌风险的关联性:16q12上SNP rs3803662的等位基因T的关联结果。冰岛1是最初发现人群,冰岛2是独立的复制组。所有P-值是双侧的,并且针对冰岛人病例和对照的亲缘关系和其他潜在群体分层进行调整。对于组合的非冰岛人和对于所有组合的人群,OR和P-值使用Mantel-Haenszel方法计算,并且所显示的频率如对个体组的频率的简单(数学)平均来获得。表17:染色体16上rs3803662LD-区段的定义: 表20:在rs4848543连锁不平衡区段(位置从NCBI Build 34开始)中所有dbSNP125标记的列表: 表21:在rs13387042连锁不平衡区段(位置从NCBI Build 34开始)中所有dbSNP125标记列表: 表22:在rs3803662连锁不平衡区段(位置从NCBI Build 34开始)中所有dbSNP125标记列表: 表23:在多种族人群中用于研究的HapMap SNP标记: *对于rs3803662的r2和D′值表24:来自多种族人群的乳腺癌关联性数据表25:在雌激素受体和孕酮受体阳性和阴性肿瘤中与rs13387042等位基因A和rs3803662等位基因T相关联的乳腺癌风险。表26.rs4848543的侧翼序列和相关的HapMap SNP标记,其中r2>0.2>rs4848543GCACTAGAAGGGTTACATACAATGGGAAACTGAGGCCCAGAAGGAGGAAAGATGAAGTGCCCAAAGTTAAGGAGATAAAAGCAGAAGTGCAGGTAAGAGAAGGAGTATTCATATTACTGCAGGAATCCAAATTCTACAAGAACATACGCTTGTTCTTTAAAGGGAGCCCTCGCTTTAAGCATTATTTGCCGATCAATACC[A/C]ATTAATAATTACAGGACATGGGCAAATATTCTAGCAAAGGTCCTGAGGTCTTCCTAGATGTGCCCAAAATAACAAGGACTCCCCCCGCAGGTGGCACCAAAAGTCGGAGGATGTGTTGGAAGCTGACCTTCCCCACCTGTCCCTGCCTCACCCACAGTCACCCACCCCTCTAGGATGTAATGGTGAATCATTCAACACAT>rs11680207GTGACACTAGGGACGTGGGGGGAATGCAAGTGGGTCCAGACCTGGGGGCCACCAGTGCAGGAGCAAGGGCAGGCCGGCCATCAGAGCTGGGCGGGGAGGGGGGCGCTGAGCTTGGCGTGGGAGTTTCCCCAACGGACTGTGTCTTCCAGGGACCCTCGCCCCTCATGCCCCTCTGCGTCCTGAAGGGAGGAGGCACCACC[C/T]CTCTGTGGCATCTGCTTTTTAGGGCTGACGATGGAACAAGCTCATGGACAGGAGTGAAGCCCCTGGCACATAGCAGGTGCCACAGAAGGGTGGTGAAGTCTGCCCTAGATCAGAGATCATTCAGGGGGTCTGTTAACTTGGATGAAGAAGAAATACACTCTTATCACTAACATCAGGAAGGTAAGCAAGGAACCACACAT>rs7583824AAAGGAAGGGATTTCTGGGCCTCAGAAAACCACATGCCAACGCATGGGGGTATTAAGGATAGGGGCTCTTGAACGCCCAGGCTGGTAAAATCTAGAACGGCAGAGGGAGGAGGGGTAATTTTTCTGGTTGGTAGAAATAAAGTGGGGATGAGGAAGAGCACGAAAGTCTGTCGGCAAACCTGAAAGTGGGAGCGAGCTTT[C/T]GTCAAATCCAGGGTCAACCTGAGCTCTCATTAATTGGGAAACTGGAGAGTCAGATCCTCTAAAGAAAGTGGAAATATTTGTTCTAAAGAACCCCTGCCAGGTCCCCGTTTACGTGACTCATAAAGAGGCCTTCAGGCAGAAAGGATCCCAGTGCACCAGTAACAGAAGGGCTCCAGGACCAGAGGGAATGGACAGGGAAC>rs4848541TGGCCTATAGTCGAGTAGATAGAGGGAGGGCTGATAACTAAGTGACTACAACAGGACCTCCCTGTGTAAGGGTTCTAGCTTATTTCCACACTCTTCTGGCACAGACAGGTTGGCAGGGCAGCTGGTAGCAGGCACAGCAGATGGAATGTCAGGAATGAAATCCACAAGACTCCAAGCCCCTCCCAGGGTGAGCTTGCCAC[A/G]GGCCACACCAGGAAGCTGAGCTCCTCACCCAAAGCCTGCCAGTGCCTACGTGGCAGTCATTCCCTTGTCAACAGACTTCCCACTGGCTTCTCTTGCTCCATTATTAAAAGCAAGAACCAAAAACTTCACTGAGGGGATAGAATCCCACTAATAAGCATGTCCACGCTTTGGGTCATCTTAGGGGCACAGAAAATCTGAGT>rs1446128GAGACACTTTTCTGCCTGCCCAAAGTCACATAGCTCATTAGAGGCCAGGTTGGGCCTGGAGTCTCTGGCAGGAATAATAGCTGAACTTTCATTCATTCCCTAACCCACCTGTGTTGTGAGGGCCCTGAGGCCAGCATGTTCATGGCTGCAGCCTCCAACCAACTGAGCTAATTGACAAGAAATCTGCTCTGCCTGATGCT[A/G]TGGGGGATACTCAGATTTTCTGTGCCCCTAAGATGACCCAAAGCGTGGACATGCTTATTAGTGGGATTCTATCCCCTCAGTGAAGTTTTTGGTTCTTGCTTTTAATAATGGAGCAAGAGAAGCCAGTGGGAAGTCTGTTGACAAGGGAATGACTGCCACGTAGGCACTGGCAGGCTTTGGGTGAGGAGCTCAGCTTCCTG>rs4849766CCAGGCTCAAGAGAGAAAGCCAGACCCTCTCTCCTTCCACCTACCTGAGAGAGGCCTGTCCTCAGGTGTCTGGCTCACAGATGGGGGACCCAACTGGGAGTCACTCCCTTCTGGAAGCCCCAGGCCCTATAAACAGGTCCCCGGCCTCACTGCTGGGCCTCGGCCTGGAGACAGCGGCTCAGTGCAACACAACCACGCCA[C/G]AGCTGATCAGGGGAAACCCACGCAGCAGTTGAGGGGGCTGGGGCTTTGCGGGTGCAGTGAGGGGACTGCTTCCCTTCAGTGGAGTTGCTGCCGCAGGTGAGGGGAGGAAGATGAATCTGAAGGTTCTAACGTCAGCCCACAGGCTGAAGCGAAGGCTGGCCTGAAGTGTTCCACCTGGGCCCCCACCTGAGCGGCTGAAG>rs6715243TGGGCCCCCACCTGAGCGGCTGAAGAGTTCTGTTTCCTCAAGGCCCACAGAGCTCCTCAGAGGGAAGCTTTAGTAGCTATTTCCTTAGGAAGGCAAGTATGTGTGCAACATTTCCTAATAAAATGCAAAGGCTGTTGGAGGCACTCCAGCCCCCTCATTTAGCTCTGAGGTGTAATTAATACATAAATTAAGCTCCTGCA[G/T]ACTCACAAATGTCCAAGAAAAAAAATGAAAAATATAATTAGTTTGCCCATCTGACTCCATCTGTCAGCTCTGAGCTCAATGCTCAACGTAGCAAATCCTGAGGGCTTTGGTCTCGCATTGGCTGGGCCCGGCGCTGCTCCTGCCCTGCTCCAGGGAAGTGGGCCCTCCGCAGCAGCTGCCCAGAGCCCGGGCTCTGGACT>rs895398TTACCAGCCCTCTCTCTCCCTTCTCCCCTTTGCCTTCCACACACAGCCTCTTGTCCAGCCACTCCCTCTTCCTGGAAGGGCCTTACTGACAGAGTGCTGGGGAGCCCTGTCAGCTGGCCACAGGTCTTAGCAAGGGCCACCCCCTCCTTCAGGCCTTCACCGTGTCTTGGAACCTCCCACTGCCACAGCCTCAGCGACAC[C/T]GTCCTTAGATCCAGGCAGGTGGGCTGTGACCCGGGACTGCACTTTGGAAGGCCTTGCTATCCTCCTCTGGCCATCTCCTTCTCCAGGGCCCGAGGGATCTGCAGAACCGGAGGAACATGCCAACCTGAAACCTGGGCTGTCTTTATCCGGCTGTACTCCACCTGGGATTTTCTGCCCGGATGGCATCAAGATCGCTTCCA>rs11684731GCCTAAGCCAGAGGAGGCAGGAGGGTTTAGGGCACCAGCCAAGAAGTGCTTTCCAGATGCTGAGTGGGATCCCGAATAAGGGAAAGGGCATCTAACATAGAATGAGGAGGAGATAACACAAGGGTAGAAATAACCAAGAAAGGGGATTTCTCTCAGATGGCTTTAGAGGTGCTCCCAGCCATTGCTGGGCTCACATGGCT[C/T]ACATGTCATAATTTTTGCCAAGGCGGTTTCACTGCCACCACCACCCCGCTCAGCCTCCAGTGGCTTGTCCACCCATGGCTGTGGCCTCTAACTGGGCAGGATTTTATAGGCTAGGAAGAAAAGTAGGGAATGTTAAGGGAGACGGAAGTCAAGTTCAACTTGGAACCATCCCAGAATGTCCAGCAGGAAAGGCCCATGGA>rs12464139GACACCTCACCTTGACACGCAGCCACCTGCCAGTGTTCACAAATGTTGGTTTTCAGCTTTATGCGAGGGTAGGATCCAACAAGCTCATTCTTTAATGAAAAAGAATGAAATTGTAAAATATCAGATCTTATTACATGTCCTAAGGGTAACTTTTATCTCATAACACTTTTGCTTCAATCATGAGTGTATAATTTCTATTT[G/T]ATTTTGTGTCTATGGGGTTAGGTGTGCAATGTAGAAAAGCTTGAAAACCATTGCCTTATACCCATTTGAAAAATGAACCACCAAACAAAGGCTTAAAAACATGAATATTTGTCAACCAAAAGGAGAACTCCTGGGCCTGGAAGAAACATCACGATTCAAGTGCTGCAGCACGAAAGAAGTTGAGGCTGGATTTGTATTCA>rs6754664TCCAACAAGCTCATTCTTTAATGAAAAAGAATGAAATTGTAAAATATCAGATCTTATTACATGTCCTAAGGGTAACTTTTATCTCATAACACTTTTGCTTCAATCATGAGTGTATAATTTCTATTTGATTTTGTGTCTATGGGGTTAGGTGTGCAATGTAGAAAAGCTTGAAAACCATTGCCTTATACCCATTTGAAAAA[G/T]GAACCACCAAACAAAGGCTTAAAAACATGAATATTTGTCAACCAAAAGGAGAACTCCTGGGCCTGGAAGAAACATCACGATTCAAGTGCTGCAGCACGAAAGAAGTTGAGGCTGGATTTGTATTCAGCTTGACTGTTTGTAAAGCACCATGCACCATGCAACTGCCTTCAGTTCCTTTTTTTTTTCTTTCTTTTTTTTTT>rs6754799TGAGTGTATAATTTCTATTTGATTTTGTGTCTATGGGGTTAGGTGTGCAATGTAGAAAAGCTTGAAAACCATTGCCTTATACCCATTTGAAAAATGAACCACCAAACAAAGGCTTAAAAACATGAATATTTGTCAACCAAAAGGAGAACTCCTGGGCCTGGAAGAAACATCACGATTCAAGTGCTGCAGCACGAAAGAAG[C/T]TGAGGCTGGATTTGTATTCAGCTTGACTGTTTGTAAAGCACCATGCACCATGCAACTGCCTTCAGTTCCTTTTTTTTTTCTTTCTTTTTTTTTTTTTTTTTTTTTGAGATGGAGTTTCGTTCTTGTCGCCCAGGCTGGAGTGCAATGGCACAATCTCGGCTCACTGCAATCTCCGCCTCCCAGGTTCAAGAGATTCTGCT>rs6759589GTGGGGGCAGCTCCTTGTTTTGTTCCTCACTGTCATTTTCCAAAAGGCAGACAAGCCCTGGCCGCCTTATGCCCAGGGCTGAGTCCACACCATGCTACACGAGCACCTGAGGGGAGGCTCCTCTCCAAAGTGCATTACCAGGGCCTGTGCTAAATTTTTCAGCAGCCTCTTGTCTCACTAATGGTCCCGGGAAATAGACT[A/G]AGCCTCCATCCCCAACTAAGTGCTCAGGCCTCCCCCACCTCTGTCCTGCCTGGGCAAGAAGCCCAGCGCCGCCCCACAGCCCAGCTCTCCATGCAGCCTCAGCTCCCAGTGGCCCTCTGCCAAGGACTTGCGCCTCTGCAGTGGGATGCAGTGCCTCATTTTATCCATAATTGTACGTGGTCCCTGTGTGATGTCCGGGG>rs1562256GGCCAGACCACACTCTGTGGGGTGTTGGGAGTTGGGTTTTCTTGCTGCAAGGAATATATGTTCTTTAAGGCAGTCATCTGCCTTAAAGATCCTAAGGTGAGGAATTAGGGGAGCCTTATACTTGAAAGGGAGGTCCCCTTTGGGCCTGGGGAGCATTGGTCTGAAGGCTCAGGTATGGAGGATGCAGGAATATCTGCTGG[C/T]GAGGATTGAGCTGGAACCTCCCTCCTTCCCACTCCCATCTTAGTCCCTCCGGCCTTTAAAAAAATTTATTTTATTTTATTTTTATTTTTTAAGATAGAGTTTCACTCTTGTCACCTAGGCTGGAGCGCAATGGCTCGATCTCGGCTCACTGCAATTTCCACCTCCTGGGTTCAAGTGATTCTCCTCCCTTAGCCTCCCAA>rs1446125GCTGGTCTCGAGCTGCAGACCTCAGGTGATCTGCCTGCCTCGGCCTCCCTAAGTGCTGGGATTACAGGTGAGAGCCACCGCGCCCAGCAGACCAGACCCTTTCTAATACCTTCTGACCCCAGCAGTGGGGCCCAGGCCCACCTAACATGGCAGCCTGGATGCACCTCTCTGTTCCTAGGCCTGGTGCCTGGCTCAGTAAA[C/T]GTTTTTTTTTTTAATGATTGAAAGCTCATCTTTATGGTACTTAAAGTCTGTTTCAATTACTAAGGGTCTTTGTCGCTTTTTTCTTAGGGCAGACTTGTCCAGGCCAGACCACACTCTGTGGGGTGTTGGGAGTTGGGTTTTCTTGCTGCAAGGAATATATGTTCTTTAAGGCAGTCATCTGCCTTAAAGATCCTAAGGTG>rs1446124GCTGGCTGGGATTACAGGTGCCCATCACTATGCCCAACTAATTTTTGTATTTTTAGTAGAGACGGGGTTTCACCATGTTGGCCAGGCTGGTCTCGAGCTGCAGACCTCAGGTGATCTGCCTGCCTCGGCCTCCCTAAGTGCTGGGATTACAGGTGAGAGCCACCGCGCCCAGCAGACCAGACCCTTTCTAATACCTTCTG[A/T]CCCCAGCAGTGGGGCCCAGGCCCACCTAACATGGCAGCCTGGATGCACCTCTCTGTTCCTAGGCCTGGTGCCTGGCTCAGTAAACGTTTTTTTTTTTAATGATTGAAAGCTCATCTTTATGGTACTTAAAGTCTGTTTCAATTACTAAGGGTCTTTGTCGCTTTTTTCTTAGGGCAGACTTGTCCAGGCCAGACCACACT>rs11677262TGATACATTATTTATGGATCAGGTGGCACAGCATTGCAGGCAGCAGCAGGGCAAAGACAGTGTGGAATCAGAGTCGGGCAGCGTTGGATGGGATTCCGGTTCTGCCACCACTGGCTATGTGATGGAAATCTACCACATCTCTCCAAGCCTTGCTGTCCTGTTTTATCAAATGAGGACATTGTACTGAATCACAAGGTCTG[C/T]ACAATGCCCGTGCATGTGCCTGGAATCTTCCCCTCTGGTGTCCCCTCAATGCCCATGGTGCTTCCTGCACAGGGTGTACCATAGTTGCTTGCTGTCTCCTGCTGAAGCCTGCTGTGAAGAGGGACTGTGTGGAGGTAAGGCAGTGGGCCTCTCCCTGTGAGGTCCTCAGGGGGCTGAAGGCAAAGTCAGAAGTAAAAAAA>rs7565771TCTTCTTCAGTATTTCCCTTCCTCTCTGAACACCGTTTCTTTTCCTTTCAGATTATCTGACAGCCTTTTAATGAACACCTACTAAGTGCCCAGCACTTTCCTGGGAACTTAATTCTTACAACCTGTTAAGAGGTCTATACACTCATTTTACAGTGGAGGAAATGGAGACTTAGCGGAGATGTGAAATTTGAACCAGGTCC[A/G]TGTGGTTTCAAAGCCTGCGCATGTTCCTTTACCCTATGGAAGCCTCCAGAAGCCAAGGTCTCATCTCCCCTCTTCCCTGGAGGCCCCAAACCTGGGTAGCTGTGCCCCTAGACCTTTGAGGGAGGGTCTCGAGCCATTATCTCCCTTACCTTTTCTTGCAGTGACTTGGCTTCTCCCAGGCTGCCGTAACCAGCAAACGC>rs838066TCACCTTTCGTGGTCGTGGCACGTCCTCTGCTGGATTTTTGAGCCAAGGACAGAGGGTTTGGGAGAAGGAGGCCTCCTTGGACTTCTGCCAGGAGTTACTGAGAAAAGAAAACCCAACCAGCTGGGGGGCCAGTTGGGGGGAAATCTGCACAGGATGTTCACACTGTGCCCCTCCCTGCTTCTTTCCTGACCCCCAGAGC[C/T]CACCTCAACACATCTGGAGTGTAGGGTGTTGTCTGCCCTGTCAGACCACTCTCCACACACAGCCTGGGGCAGGAACAATGGGACAGGTGGCTGGTGCTCACTCAGCACAGCAGGGGTGGTGGAAAGACACATGTCAGCTGAGGCTTGGCTTCAGGGCAGGCAAGTCACAGCCAAGTCACAGCCCAGCCCAGCATAGGCAA>rs895397TCAACGGTCTTGGCTTGTGACTAGACCAAGATCGCCAACCAGAATGGAGGGAGGCTGACCCAGCACATCCCGGAAGCATTTACAGAGCCAAGGAAGAGATTCTTCTTGCCCGTCTATGATAACATTGCATTGCCTTTCAGCTGGGGGCGATTAGAAAGGCACTCACTACTAGATCATGGGAGATGCCTGGGTTTTAACCC[C/T]TTGCTGCTCGGAAGGTGGTGATCATGATGGCCTGGGAGGGTTTTAGAATGGCAGAGTGTCAGGCCACCCCAAAGCTCCCAAATTAGAATGGCATTTTAACAAGACCCCCTAGGAGGTTGTATACGTGTTTAAGTTTGAGAAGCGCTGGTCTACATTACAACTGAGGAAACTCACTACTCCCTGAACACCTGCATCAAGGT>rs838059ATAAGGAGCTTCAGGTTATTTTTAGGAAGTCTAAGAATCCTGTTTTCTGGGGAGCCAGCCTCTGTTGGGGAGATAAGCCTCCGGAGGCCAGAGGCAGGAGCTGGGCCTCAAGGAAGGCCCCACAACTGGACCCCAAAGGGCACGGTGGGGAGGAAGAGGCAGAGCTCTGGTCTCCCTGTGGAGGGAGTGCTGCTGTAAAG[C/G]GCCTTTCCCTCCACCCCCAACTCCCGCCGAGAACCCCCCCACCCCCGCAGGCAGTTTGCTTTCCCCCTCCACAGCTTTCCTCCTACCCGAATACCCACCTCCCAGCTCTCTGCTCAGCCAGGGCCCAAGGCCAGAGCCTCTCTTCTCTTGCAAGAACTTTCCTGTCCCACCTTGCCCCAGGGCAACACCTCTTATGGCAA>rs838102CTAACTAACTGCCACATTCTCCTGTCCAAATTCTGCCTCATCGGTTATTCATTCAACAAACACTTACCGAGCACTAACTTTGAGCCAGGCACTCTAAGACCAGCTGAGTCCCACTTCTGGCAGGATGAGTGTTGTTGTCATCAACCACCCCACAAACACCCGTGCCCTCTGCGTACTTGCGAATCTGAGTGAGGAGACAC[A/G]GTGGCAGTAAGGCTCAGGACCTATAGCTCATGTGAGTGAGCAAGGATGCAAAACCAAAGACACCCGCTCCCCTCACCCACTGAGCTGGAGGGATCAACCACTGTGCCTGCCATCAGGGCTGATGGGCGACTGCTTGTGGATCACAAACTCTTGCGTTGTCACTTCAACCCAGGGGCAGAGTGTGTTCCTCTTCAGGTGTG>rs3769659GGGCCCAGCACTGTCTTGCTTCCTTCCCTTCCAGTTCCAGGCACCACCTTCTTTCTGGCCAGTCCAGAGACATCTCCAAGGGCCAGAGGGTCATCTCCAGAGGGCCTGGTGTCACTTCCCGCAGCTGCTCTGGCCTTTCACCCAGGTTGGGGCGATTTGATGGACAGTGGTGGGTCCCCTCAAACTCCACTGCATTCAGC[G/T]TGCTACTGACTCATGTGCAGGCCTGGGCAGTCACCCAGAAAGCCCCCCTGGATGCCAGCAAGCCCACTGTGGCAATGGGCAGGCCAGACCTCACCTGGAGGGCCCAGCTCACAGCCACTGTATCCTCTAGCTGTGCACCCAGAGTTCACCTTCAGAGAGACACTTGCCCTGACTGGGGGTATACTGTTACTCTCTCAAGC>rs865108AGCAGCCAGAAATCAGGGTGATGGGTGGGTGGAGGGGCAGGCATCTGGGAAAGCCCTGCCCTCCTGGTGTTCCCAGATCTGAAGGCTGGAGGCTGGAAACCTTGTGTCACCTGTGCTGGTGTGAGTTCCATTGGGGCTGCCGCTTACCCTCCCATGACCTTTAACATCTGGCATGGCTTGTGGGGGGTGCTGAGAGGAGG[A/G]GAAGTCTCAAGGCTGAGGGAGCTCAGGGTAGAGCCAAGGTCTCAGTGAGAACCCCAGGGGGCAGCTGTCACAGCTGACCTGGAGCCCTCCAGGAACGCGTACTCTCCAGCTCCTGTACTCTCAAAAGCAACAGAAAGGTTTGCTTTCCTCAGGTGCGGTTTCCTCACAGTGCAGCTTCTCCAAAGAGATCTGGAGACCCC>rs708670GCAGGGACTGACTTCCACTACCCCTCCTTCCAGTCCCTGCCCACTCCACCCCCCACCACAGCCAATGGCATTCTTTCCATCTCCAATCTTGACAACCTCCTGGCCCATCCCAATCCCCCTTCCTTAAAGATCCAGCCCAAGGCCTTGGGCACTTAAGGCACCTGCCATCTCCCCCAACGCCCACCCCTGACAATCTCTCC[C/T]GGCTTTGAATTCAGACAGGCAGCTGTGTTAGTTGGGGGACCTAGCTGGACAGAGATGTGTGTGAATTCCGGTCCAGCCATGTGCTAGCTGTGTGACGTTGGGTAGGTTGCTTTCCCTCTCTGTCCTGATGATTAAACAGTGAATATGAAACCCCTAAACACATGTCTTCCTTAGGACTGTTCTTGTGTGCACCTTTCCTT>rs708672CCTCATTGTTCTCTGACTGCTGTGGCCCCCTGGGTCTCCTCTCTTCTACTGGAGTGAAAGCCCCTGTGGGCAGGGCTAGATTCCTGAATCTCCGCGGAGTCTAACACAGGCCTGTAGGCAGGGACTGACTTCCACTACCCCTCCTTCCAGTCCCTGCCCACTCCACCCCCCACCACAGCCAATGGCATTCTTTCCATCTC[A/C]AATCTTGACAACCTCCTGGCCCATCCCAATCCCCCTTCCTTAAAGATCCAGCCCAAGGCCTTGGGCACTTAAGGCACCTGCCATCTCCCCCAACGCCCACCCCTGACAATCTCTCCCGGCTTTGAATTCAGACAGGCAGCTGTGTTAGTTGGGGGACCTAGCTGGACAGAGATGTGTGTGAATTCCGGTCCAGCCATGTG>rs708673AAACAGATGACAGCACTTGTCTCCAGGGCAAAGCATGGACGGGGGCTGAAGAAGACACAGGCATGTTTCTGCTGGCTGGGGATGGCTTTTCAGTGGACCTTGGAGGCCACACCGGCAGCCCAAAGGAGGCTGGAGGTTTGGAAGCTTTTGCATTGTTGAAGTGAATTATGTGCAAGCCCATTCTTAGGGATAAGTGTATT[C/G]TATTGTTTTCAACTTGTTTGGAACCTAGCGATCTTGGAATAGGGCACATCTAAGTATCCCGGGCATCTTTATCTCAAGCCCACATGCAGAACCTGTTTTTCAGATCCCTGAGCATCTGATAAACAGGTTCTGGGCAGGTTTCCCCTATCATCACCAAACACCAAGCCAAGGCCTCATTGTTCTCTGACTGCTGTGGCCCC>rs838100ATCAGTCACCACTCCCGGTCCAGCCCCTGTGGCCAAGAGCTGGCGTGCAGGCTGCGGGAGGCAGCTGGCTGTGCAAGACCCTGGCAGGGCCCTCGCCTCCTGAGAAACCGAGAGTCAGAACCAAAGCCAGGCTGTCCTGGTTGGAGACTGAGCCAGAAAGGGTGGCTCACCTCACGGTGAGGCTGTCGAGTGACCTGAGA[A/G]CCTCAGACCCTCACGTCAGCCGGATGTCGCACCAGCCTGCTGTTGGTAAGTCTGGCTAGGACGCAGATCCAAGGGGGCATGGGTCGTGTGCAAACCCCTCCCACCAGCTCCCTCACCACCTGACCCCTGCCCTGCTGGAGGGTGCCCCTTGAATCTCCAGGAGGTCCGAGGAACTCGACACCTCCCAGAGATCTGTACTG>rs838098AAATTTCAGGGGTTCAAGGATTTATCACACACAGTTGCGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTTTAAGGATGTTAATGTTTATGATGCATTTCTGTGGAATGCAGGCCCATTGGGAATTGTAAATTTTTCTTATTGGTAACCATTTCTGCATTGGTTTAGCACGGAACTGCTGCTGCAAGTAA[A/T]TGAACCAGATTTTTCTGGAATGATTCGAAAATCTAGCTGTTTGTAAAAAGCTCTCTAAATTATTCATTCACTTTTATTTTGCACAGTTGTGTGACGGTAAACTCTTTTCCATCAGACGAAACTTGCGCGCACGTGTATTTCTGCGGGGATTGGCTCGAGTGTGCTTGAGTTTTCTGTATTCTCTTTTGTAGGAACTTCTC>rs838096ATGCCCACAGAGAAAAATAGAAATCTACCAATTAGATGTGTGTGGCTATAAGTGAGCTTTTAAACCATGATTTGAGACTGGCATCCTCTGGCCTCTCTGCCCTCAGGTCAGCTGTGGGAGGCTAGGGGTGGGATAGCAAAAGGGACCTGGGATCAGGTGGGGCTTCCTGGACCCCAGGCCCAGTAAGAATGAAGCCTAGG[A/G]GTTCTAGGATAGGGGGCAGCCCTGGATTTGCAGAAACAGCCTGAGAATGAGGGGCTGGAAAGTATGAGTTGGAGCAGCTCAGTGAGGAGACAGAAAACTGAAGCAGAAGAAAGCAGAAGACACCAGAGTCTGGTGCTGACTGGGTGACTGGCTGTTACTCACATCCTGAGCAATGAGCCACAGACCCTCCCCACCCCAGA>rs838092CATTTCCCTGAGGGCTAATGATGCTGAACATCTTTTCATGTGCATTTGTATATCTTTTTTGGAGAAGTGTCTTTTCCAGTCTTTTGCCCACTTTATGTAGGTTGTTTGTCTTTTTAATACCGAGGTGTAAGAGTTCTTCAGATATTTAGAAACAGGTCCCCTTATCAGTTATATGATTTCCTGAACTTTTCTCCATTCTG[A/T]GTTGGCTTTGCACTTTCTCGATGCTGTGCTCTTTCGATTTCGTCAGCAGCGAATTAGCAGGACCTGGGGGGCTTTAAGAGGTGAGCAGGCAGACAGACAGCGCCCACAAAGTCCTGAGGATGAGAGAAGAGGCAGAGCTTACACAAAGGCTCTGTGAAAACTGAAGATGGACCCCAGGCAGGTTGGGGTGATCCCTGGGG>rs838090TCAGCCTCCGGAGTAGCTGGGATTACAGGCACGTGCCAACACACCCAGGTAATTTTTGTATTTTTAGTAGAGATGGGGTATCACCATGTTGGCCAGGCTGTGTGCAAGAATTTATGTTTTCACTTGTGGCTTGCTGAGCCCTGGTGCTGGCTGTGGGCACATACTCGTTCACCCAGGGACATGCACTGTTGATGGGTCCT[C/T]GCACTCTGGGCTATCTTGGGCCCCGTTTGCTCAATGCAGGCCCCTCTTTCTGAAGCGCTTTTCTTGGGCTCACTCTCAATTCGTCAAAGTTCGGCTCAGGCCCACCTCCTGCAGGAATCCTCCCAGTCCCCGCTGTCCGAAGTCAGTACCCTTGTCAGGAGACCTTAAACACTTTAGTCCACTGCCTGGCCCTCCCATGG>rs12467944AAGAGGCCGCCTAGGGAGCAGTACAAGGCAGCATTACAACCTGGCATTTTCCTGTTGCAGACTGCATTTTGGTGGCAAGAGAAGCTTTGGAGGTGCTTAACGTTTAGTTTGCATTTATCCTACCGCTGAAAAGCAGGGACCCTTAGGACCATAAGTCTAGGACTTTTCATAGCACCCTAGACTGCTGGGGATGAAAGGGG[C/T]TTGGAGCTGAGCTGGTGCAGCAGCTCCTGTTAGAGAAGCCACCCAGAGAGGCCCAGGGACCTCCTATGTCCCAGCGCCAGTTAGGGGCAGACGTGGGACCAGCTCCCCTCGGCTGCAGCGGCCTCCATATCAGCTCCCTGGAAGGGAGCAGATGCCAAGTCAGGTTCTGAGCAACACCCTCAAGGCCCAGCCCTGGCAAT>rs10196144GACTTGGCCCTCCCGACCACAGGAGAAGAGGGATTTGAATTCACCTCGGCCCAAATTGCAGATGCTGGCCTGCGAGCCCTGAGGCCATCTGCAAGGCTCCTGGGCTGACATAACTGTCACCCAGCTCTTCATCCTCCTTCCCCGGGGCTGAAGGGGTGCCTGCAGGGTCTTCTGCCCTCCCTCCACCTGGGCCCTACTGC[C/T]GGCACGGAGCTTCATTTCTGTTGGCAGCCAGTGTTTGCTTAGTGATTACTGAATGCCGTTTGCTGGGTGCTTATGATGTGCTCAGCACTGTTCTAAGTGCTTTACACAATTGACTTATTTACTCCTACAACCTGCCCATAAGGGAAGTGCTGCCATGGTCTCCCTTTTATAGCTGAGAAAACTGAGGCACAGATAGGTCC>rs6728660AGGCGGACTGGCTCCAGAGCCCGGCTCCTGGACCGAGCAGCCTTGAGTAGGGACCTGGTGCAGACCCGCCTGCCGTGGACTCACTATAGGATGGGTCAGGAGGCCCGTTGTCACCTACAAAATGTAGCCCACCACCCAGGAAACGCTCCCAGAACCAGGCAGAAAATACTGTCTCCTATTCACAGGGTGGCTGTGCCTGG[C/T]GTGAGTGTCTTGGCGGGTGCCTGCATGTCTGTGCAGGAGTGCCACCCCCATCTGTGGACTCGGAAAGCATGATCCCCACAAAAGCAACCCCTCAGAGTCTCAGCTCAGCCAATCCCTGTTATCCTGTGACAGGCAGGGCCATGTTTCAAAACCATGTTAAAGATGAGCAAGAGGCTAAGGAAGTTTCCCATGCTGGCAGA>rs10188946ATAATACCCATCGTAACAATAAATATAAATGGCTAATTTTCATCGAGTGCTGCCAGCATGCTCTTTTTGATATGTTATCATAACTAATCCTGCATCACTGCAAAATTCCATTTTACAGAACAGGAAATTGTGGCTCAAAGACATTAATGATCTTACTGAAAATTCCATAGCTGGTAAGTTGGGATTTGAACCCAGTTCCT[A/G]TGGATCTGAAACCCATGTTCTTTCTGCTATGGTAACAGGGTTTCCTAGAGGGCAAGGAGGAAAAGGTTGATGGCTTTTTGCTATTTGGAGCCAAGAAGGAGAGAGACTTGGCTTTTAGAATTGGACTCAGAAGGAGGAAAGTAACACACTTATGTACCCGGCCCTGAGGAAGGCAGGCATGTCTCAAATTTTATCGTATT>rs895406AGGAGGAATAGGAGTTTGCAAGCTGTCAAGGTGTCCTGGGGTGGGCGTTCCAAGCCGAGAGGAATGAGCTCTGCCCATTTAGAGGACAGTATGGGACCCAAGTGTTGACACGTCACAGGAGAAGGGGAGATGAGGCTGCGGAGGGAGTCTAGCTGCATAGTGAGGGTTCTACCATTATCCCAAGGACACTGGGGTCACTG[A/G]ATCTTTTCAGCAGTGACATGGTCAGATGAGAGTTTCAGACCATCCTGTGCCAGCCATGTGCAGATGTAGCTTGGGGTGAAGGTAATAGGAGAACGGGGTGAAGGTAACAGGAGAACAGTGTGCAGGTTAAACATTTCTTTGATCTTGATCTTTGAGTTTGATGTTGAAATGTGTATTTCCAGGGAAATACACAAGCAAAT>rs708675TGGACCTCTGAGTCGGGTATGAAGTAGTGTGTAAGAAAAATAATAAAAAAGTATTTACAAAATGCAACAGATTACAGAGGCAGGTATGGGGAAGTAAGGGGATAGTCTGGGGGAGCTTAACAGAGGTAGGGTTTTGAAGGAGGAATAGGAGTTTGCAAGCTGTCAAGGTGTCCTGGGGTGGGCGTTCCAAGCCGAGAGGA[A/G]TGAGCTCTGCCCATTTAGAGGACAGTATGGGACCCAAGTGTTGACACGTCACAGGAGAAGGGGAGATGAGGCTGCGGAGGGAGTCTAGCTGCATAGTGAGGGTTCTACCATTATCCCAAGGACACTGGGGTCACTGGATCTTTTCAGCAGTGACATGGTCAGATGAGAGTTTCAGACCATCCTGTGCCAGCCATGTGCAG>rs1867856CCATACTGTCCTCTAAATGGGCAGAGCTCATTCCTCTCGGCTTGGAACGCCCACCCCAGGACACCTTGACAGCTTGCAAACTCCTATTCCTCCTTCAAAACCCTACCTCTGTTAAGCTCCCCCAGACTATCCCCTTACTTCCCCATACCTGCCTCTGTAATCTGTTGCATTTTGTAAATACTTTTTTATTATTTTTCTTA[C/T]ACACTACTTCATACCCGACTCAGAGGTCCATGACTGGGTCTTCTACACCTTGGGGTCCATGGTTCCTAACACAGGTTCACAGTGCATGCTCACTGAGTGACTGATTTTTAAATTGGCCACCACAGAGCCAATATCAGGCATCTTAAGAGGAGTGCACGTAGAGCTTGGAGCAAGAACTAGTCTAACTGCCTTGCTGCCAC>rs12711924CCTGATCCCAGCTCTGCATCTGTTAGCTACATGTGACCTTGGGAAAGTGATTTGATCTTTGTGCCTCATTTCCTCCATCTCTAAAATGGGCTAATAGTGATCTCTACTTTGTGGGGTGGTTTTGAGGATTCGATGAGTTAATGCCTGAGAAACGCTTATCACAGAGCCAGGTAGCGTCAGGTGCAGTGTGAGCGCCCGCC[A/G]TCTTGTCTTTCTTGTGTCCTTCATCATTGCCCTCCCGGGGCACCAGCCTTTGCCACAGTGTTCATGGTTTTCCTTCCATCCATGTCAGGTCTTGGCCAACAAGAGCCACCTCTGGGTGGAGGAGGAGGTCTGGCGGATGGAGATCTACCTCTCCCTGGGAGTGCTGGCCCTCGGCACGTTGTCCCTGCTGGCCGTGACCT>rs1867749GGACTCAGGGACAGTGACAGCGTAATGCTCTTACGTAATCCAAATTAATTGCTCCTGACCAGGGATGCTTCACATCCATTGGAACAACACAGAGTTGTAGCCGTGTGTTTTTTAAAGTGTGTCTGCCTCTGAATCTCCCTGGCTCTGCTCATCTCAGAAGGTCCCTGGAGGAGGGCTCATGGCTGACACATGTTAGCATA[C/G]GAGAAGGGGAAGAATTTTATTTATCTGCCACTAATCCCCATGTGTCTCATACCCAAATCTAGGATTTTCCTCTTCCCACCTGGAGTATCCGGCGTGCATGGTTTATCCACAATTAAAGCAGACTGCAGGCTGCTCCCCTCACCAGAAAGCCGCTCCCTTAAGCAGCCATAGATTACATGCCCTGGCTCTGCCTGCCAGAG>rs838073TGCTCCAAGAGCCTCAGTTTACACCCCTGAAAAATGGAGTTAATGCCTTACAGGGATTTTATGAGCCACAGTAAGAGATTATGTGTGAAAGAAAAATAAAAAGCATTTTGCTATTATTCTTAGGGTATCTGGCCACATTTCCATTATCTCTGACTAAGGTACCAACCACCGATTTCTGAGTTCAGTAGGAGACAGTGAGA[C/T]AGAGGCCAAGGAACCCCAACCCTGGGCCTAAAAGTGGTCCAGTCAGTGTTTGCAAACTGGCGGACACTCACTAGTGGGTCATGCAATTGATTCCATGGATCACAAGCAGCATTTTAAAAATGAAATAAAATAGAATGACAAAGAAAACAGTGGAGTGTTTTGCATGGTGTCGGGATACTTTTTCAGTTATATGGAATTGC>rs838069CTGACCTCATGATCCGCCTGCCTCGGCCTTCCAAAGTGCTGGGATTATAGGCGTGAGCCACCGCACCCAGCCTTCCTTTGGTATTTTTTTGTTATTGTTTTGGTTTGGTTTGGGTTGTGCTAAGTGTTTCAATTCAGCCAGTTTTAACTGGCTGTTAGATATTAGACTGCAAAATACTCCAGTCAGAGCAGCTCACCTGC[A/G]CAGAAAAATGAGGGTTCAGCTTTTAGAACCTAAGTTCTTTCCCAGAGTTAGAGGAACTGCCTGTGACCTTGCCCACTCCAGCCACCTGCCTGAAATAATGACAAGACCAGCCTGACCCCAGCTTCATGAGCAATTGTCCAAAGCCCCTTTGTGCCGTAGTAATTGAGCACCAGCAGGAGCTACAACGACCTGGCTGTTTC>rs3731603TCCTGTGGCCCCGGCGGTGCTCTTCCCTCTTGTGCTTTGGGGCAGCAGCATTTTAGGTTTGTAGCTTTGGTGGAAAAGTTGCTCCCCACTGTTTTGAAGTGTAATGCCCCATGAGGAGGAAGTTGGAGCCAGTGTGGTTTTCTGGGTCCTCTGCCAGAGGACATTTGGAGTCCCCAATATTTTTCCTCAGGACTGACTTC[G/T]TGAAGACAGTCCTTCAGCCCAGGCAGGGCTCAACTCTGACGCCCGGGGAGCTTTACTCCCTAGAGTGTTTTCTCTTGCTCTCCCCCTTGGGCTGATTTCTAAAGGGTCTGCTCTAGGCCTTCCTGGGAGTCATTCAAACTGAAGATGGAAAGGGTGAGAAGGCACAGTGGTTTAAAGGACGCTCATCGCCAGGTTAAAGG表27.rs13387042的侧翼序列和相关的HapMap SNP标记,其中r2>0.2>rs13387042CTGGCATCCGAAGGTATAGGCTCAAATCCCAGCTCTCATGATTGCTAGCTTTGAGGTTTCAGGTTCATTTCTTAAGTGCTCTGAGCTTTGGTGCCCTCCTCTTCAAAATGGGAATGAGGAGCATGTCTAGCTCCCTGTTTTGTTGCAGTGAATAGCTACATGAAGAACAGCTAAACCAGAACAGAAAGAAGGCAAATGGA[A/G]GCTACAGAAACCAAGGATTTCCTTGTTGAATCGAATCTTCCTTCAATCTTCCTTCACCACACTAGTGGATCTCCCTGTGGGAGGGATGTTGAGAGTGCTCCGTGTTTTTTTTGTTTTTTTTTTTTTTTTTTTTGTGATGGAGTCTCACTCTGTCACCCAGACTGGAATGCAGTGGTGCGATCTCGGCTCACTGCAACCTC>rs1882419AGCCATGGGGGTGACACAAACTCCAACAAGCACCAGGGTCAAGTAGAAGCTAACTGACCCAGGAGAGAAAATAATTCTGTCAAGTTAAGTAATTTGCTGGTGTTCTCTGCTAACTCACATCTGCGTCCTGGGTCTCCTTAGCTCTTCCTTGAAAAAGCAATGAATGTTTTCTAACTGTAGCTACCCCTAGTTCTTCAGCA[C/T]GTCTGTGGCTGGCTGCTTGCCACCCAGGCATGAGAGGATGCTGTCCTCTGGGAGTCCCAGCCTTGTGGTAAAGAATGCAGGCTGAGAAAGACTGTAAGATTCATATTCAGGATCTTCCACTTGGTGGGCAACCCTAAGAAACTCATTTAATCTTTATTAGCCTCCGTTTCCCCTTCTGTAATAGTACCTGCCTCACAGGG>rs2252488AGACATGGTCAGGGCCTCAGACCCTGTGTGTGGCCATTCAGCTTTGCCCTGTTCTGTGGCCACAGTCCATGCTCTAAGTACTGACCAGATGTCTTACAATGCACACGGCACACAGTTATGGTCTCTGTGGGGATGGGGGAATAAGGTGTGGACAAATCTGTTCAGCTCTAAATCCTTGACCAGAGGAGCAGCTCAGAGCA[C/T]GAATCCACAGGGCAGTGGAGCCATGTGCAGGATCAAGCACAGCGGCATCACTGACTTGCAGGACACTGGAGTGCTGGGGCGTGGTTCTAGAGAAATGCCCTCAAGTCCTCGATAGATCCTAAATGTGGTTAGTTCTCTTCATTACAAAGACAGTGGAAGCTGAGGTCCATGCAGATTAAAAGGCTAAGCTGTACAGTAAT>rs2272525GGACCCTGGTCAGCCTTAACACAGGCTGTGATCATCTCAAACCTTTCGAGACCTTTATCCATAAGAAAATAAGAGGAAATTTTATTTCAAAGTAGCATGAAGTGATATGCCAACTCACTTGAACAGCATGACTATTTTCTGGTTCTGTTTTGTAGTTACTTTTCACGTGGAGGCCCCATCTGCAAAATAGGACAAAGGAA[A/G]ACTCACTGAGACCAAGTCTGGGATTCTGAACCCCAGACCACTTTCTTCCTCCTTCCCTCAAACACACTCACTCTCTCTCACTCTCTTCTCTTTCTCTCTCTCTTTTTTCTCTTTCTTTCTCTCTCTCTCTCTCAGGTCCTGGGGCACTCTGGACACAGTCTGAAAACCATTGAGGTACAGCAAGTACCACAGAATGGAAT>rs4396687TTTCCAAGGACTTAAGCAAACAGAGTCAACTCCTCTGTTTTCCTTGTTTGGGTATATTTTTGAAAATGTCTCTTCTTCTTTCCTTTCATTTACATTTTACCGTTGTTTATCCACCTTTTCCTCTTCCTTCAAAGCTCTAGACCTGCCTCCCTGCCTGTTCTTAGCCCACTTTTGAGAAAGGACTTTCCAACCCCATCCTC[C/G]AAAGGGCAGGGTCTCTCTCCAGGGCTCCAACAGAGTTCTGAAAGAACACGGCTTCCACCATTGTGTCTTCTCTGTTTTGTCAACTGCTGAAAGACTGACACAGTAGACAATGCTGCAGACCCCTTGGGAGATAGTCCAAGTTTAGGGTGGGGAGGGAATGGTGCATTCTGGGTGTCCACATATTTGTTGTTGCTTTAGGA>rs12614767ACAAGAAAAGGGAGTGAAGTGTGTGGGGTTTTTAAAGTGGTGGTGGGGGGGCATTAGGAGATACCCAGAAGCTCTCAAGATTCCAAACAGTCTGCTTTTCTTTTCAGACATTACACTCCAAGAAAAGAAACTCTAGTGTATAACAGAGGGGCTCTGTCAAAATTTAACAACATAAATATTGGGCAAATGAAGTTGTTTCT[C/T]TGGTGCTATCTCAACCTGCCAATGGAGAAATATCTCAAAAAGTCAAGAATTGAAGCCATTACTCAGAGACAGCATCCTATGGCATGGTGATCCAAAACAAGTACACCTCTACCTTTTCCCTTTCAGCCCCAAACCCCAAAACACTGGAGAATATTGGGGCAGGCAAGGCCCGTGAATAGGTGAGCAGAGCTGGAAGAAGA>rs4571035AAAGGCTTTGCCAGTAGTGCAGCCCTCTCCTCCCAAAGTCCTAGAGGCAATTACTCTGAAATATGGAAGAAAGAGGCACATCTGAAAGCCCAGTGCTGTCTTCTTGTCCTCACATCCCTCAGGATCTCAAGGTCAGCCTAGTAGAGGCATTGCTTTACCATAGTAGCAACTCAGGGAATATCTGTGGAACTGGATTCCTC[C/T]GAAGTTGGACAGTTGCTTTATCCCTGCTAGAGGCTCTCACTACTTAGACCCACACAGTCCTATAGATAGAAGAAACCTAGAGAGAACCACCTCTCACACTTTTATTTTATACATGGAGAACCAAAGGCCTCAAATGGTGGAGTGATTTGCTGGGGTGCTACAGTCATTGTCACAACTTACATTGTGACATGGGCTTCATA>rs10195963GCTGCAAGTCAAGTTCGACATTCAACTATTTCCTCGGGGTCCTTTTTTGGGAGAAGCAAGGCTTTGAGTTCACTCTTTGACTTCAAGTGAAGTCCATTTTCCTCTTAGACACTACCCCAGTGGTTCTCACACTCAAGGAAGCACCAAAGTCCCTGGAGGACCCGTCTAAATGAAGGATGCTAAGCCCCACCTCACAGAGA[G/T]TGATGCAGTACGTCCCAGGAATCTGCATGTTAAAGGAGCTCTGCAGGTGATTCTGATGGAGGTGGCCCTTGCAGGATGCTTTGAGAAACTATATGTTCTATCCCTCGAACTCTGCCTGCAGAACAGCCTGAGATGGCTCTTCCATGCTTTGACCATTTGGCCCTCCACAGTAGTCCCTGAGCTGCGTCTTCTTCGGACCA>rs10207736TGTCTAACCCCCCTTTCATCTGGTTATAATGAATGCCATTGCTTGTGTATAGTTGCCTACATTAATAGACAACAATGCAATATTCTCCTTATGGAAACCCTACCTAGATTGGGAGGCACCATGAAGCCACTTTTTCTTCTTTCTCCATCTCTACCCTGATTAGCAAACATCTCTAATTATTGTGACTCCCAACCCCAGTC[A/T]GATCATTTTATTCTTTTTCCAGTATCTATGCAGGGAAGCCTGGCAAAGGCTTAAGGGATGGGGTGGGGTGTAGCATGTCAGCAGGATTTGGAACTATGGGCCCCATACTTTTGGCACCTGCTGCATTTTCTCCCCACCTGCTGCACCATAATTCATCTGCTTGTATGAGTTTAGCAGAAAGAGCCCCCAGTTCCCTGTAA>rs12464018GGGAAATTTCAGTATACATAGAAGGCTTAATTCAAAATGATATAATGTCAACATTTGGTATAAGAAATTATTTATCTGGCAGAATATATACTCACAGATGTCAAAATGGGTCTAGAGAGTAGAGAATGGAGGCAATTATCCAGACACTGAGGCCCAAGGCACAATACTTTTAAGTAATCATGCCCTCAACTGGCATTTCC[A/G]TAGTCTTAAGCCCAAAAGCATTGGGTGGAACCATTCTATAAGCAAAGCCTCAGCTATGAAAACAACTTTTAAAATTGACATTCAAAAGATAAGATCAACAACAGGTGCCCTTTGCTTTCGGCAGTAGGTGTGTTCTTGAAAAGTTGGTTGTCAATATTTCCTTTTCCCATTAATCTAATCACATTCTAAATATAACAGGG>rs10932689GGCTCGAATTATGCTTGCACTGAACAAGGCTAGTCTAAGGTATGCAATTGCCCTGCTTCTTCACTACTTTCAAGTGTAAACAAATATGTCAGCATTATCCCTAGAAGGAGGGTTTAGGGGTTTTAAGTTGAATACTCTTCAGCTGAAGAAAATCCATTAATCTCCAGTTTTATTCTTGAGTTAGCTTTCAAATCTACATT[G/T]CGACAATAATTACTTTGGGATCTTTGAATTTTCTTTCATGCCTTTCTGTTCTATGAAGCCCACATGCGTAGTTTATGCATTTTCCAATTTAGGCTAGAAGTCCAATGTGCTGTCCATTGCACCACAGAGCCTGTTTGCTATGCATTTTTAAGAGTAAAATTTTCAGAAAATACTTAAATTAAAAAGATAGATTTGGAAAG>rs12613030TTAAATTAAAAAGATAGATTTGGAAAGCATATCCAAAATGTTGCTTTGAACTTCTTATTCTGGACAATTCCTGGACTGGGGAGAAGGCATGCCCAAGTACACATTGCTTGCAGTGGCACCTCCAAACCAATGCTGGTCGGGACTCTTCCTATTACCTCGCAACAGCAATGACTGGGCCCCATAATACAGCCACGGTCATT[A/G]TAAAAGATCATTACAAAGCATCAAATTAACTGCTATTAATGAAAGCCAGAAACACGTCATTCAGGAGGTCGAATGGCTGGGATGGAACATACAGGGTTGAATAATGGTAGGAGCCTGGGTTTGGAATTAGAAAACTGGGACAGGAATCCTACTTCTGCTATGAATCCATTGCAAGTGACTGGGCAAGTTGTTCCTCACTC>rs2888450CAGATCTCAATCCGTCTTATCCTACCCTCTTCCTGACCTCTAGCTACAAGAACAGCAAGGCACAGCCCCCTGGTTTTGAGAATGCTAATGCTTGCCAGCATTCTTGTCCTGCAGGGCATGAAGTATAGTCCTGCACAACCAGCAGGCTCTGTGACTGCCTAACCTCATCCTTGGTCACTGACCTCTGTCTTAGTAGCAGT[A/T]CGTGCCATCCTACCTAGCTTTGCTGGGTCAAGTGCGTTCACATCTTAAAACCGTTTGAAGCGTTTGTCTAATTAACATGCAGAAAGCATATACTGATTTTTATTTTCACCACCATGTATGTGAGGGCCTATTTTATGGCATGCAAAGCATCTCATTTTTATTTCAATTCTCTGTCTTGTAACTTTAAATGAGGCTGAAAT>rs4254482TTTTCCGGTTTGTGACTTACCTTTTAATTTTGCTCATAAATTACTTTTAACTTACAGATAGTAATATTTTTGAAAGGTTACATTCATCAGTCTTTGTATTGTTAAAAAGAGTCTTTATTGTTATACTTTTAAAGTAGCTTTTCCACTCCTAGTCAGATACTTTCACATATAATAGTTGTCTACTTTCCTCCTGAATTAAT[A/G]GGGATTTATTTTGGCATATGGTGTGAAGTAAGAAGCTAAATTCTTTTTCTTTTCTCTGCATCATCAATGATCTCTTACACTGTTAAATAAACTAGTCTTTTCCTTCTGCTTTCCACACCCATTTAACCTAGCCCACTGTTGACATCGTCAGAGAAAACTTTTCATCAGAAAGTCTGAACAGCACAATTATACTGTATCAA>rs2372932TTACCTTTTAATTTTGCTCATAAATTACTTTTAACTTACAGATAGTAATATTTTTGAAAGGTTACATTCATCAGTCTTTGTATTGTTAAAAAGAGTCTTTATTGTTATACTTTTAAAGTAGCTTTTCCACTCCTAGTCAGATACTTTCACATATAATAGTTGTCTACTTTCCTCCTGAATTAATGGGGATTTATTTTGGC[A/G]TATGGTGTGAAGTAAGAAGCTAAATTCTTTTTCTTTTCTCTGCATCATCAATGATCTCTTACACTGTTAAATAAACTAGTCTTTTCCTTCTGCTTTCCACACCCATTTAACCTAGCCCACTGTTGACATCGTCAGAGAAAACTTTTCATCAGAAAGTCTGAACAGCACAATTATACTGTATCAATCCAGCTTAAATTACA>rs4255939TGATCATCGATATACATGATGTCAAAAATTTGGGTATAACTGAAGAATTTTAGTAATTTAAAGATTTCAGAATTTAAATAATGAAATATCTGATACATTCAATTGGAAATTTGGTTGAGATCAGCTGACTTGTTAATTGGACTTCACTGATAAACATTTGCCTTAAAATCTGTAGAATCTAAAGCAGGGTATACCTAGTA[G/T]GCGAGTAAGACATCATTTCTGGAATCAAGGGGGCTTTTCAGTGTTGACCAGATGTTTATCACTGCATGGGCAAATGGCCCAAGGAGTATGGTTGTGGCTTGGCTTATTTCTTCTTAACGCAGATGCAGTTGCTTTCTTTCTGGGTGGCAGTGTGGAGGATAACTGGGGTCGGTGGGGACATAAAGTCTCACAAGGGGAGG>rs10192415TTCTTTATTGTATCCAGTATAACATACTCGAAGATGTATATATACACATATATAGATATACAAAGCATCTATACATCTAGACATGTATATATACATATATATATACACACACGTATATACTGTACTTCAATCATCTATATTAAATTGTGATAATATCACATTACCACATGTTGATGGCATTCTTGTAATCTGCCTGAAAT[C/T]CATGAAAACACATGCAGTGGTCTGGCTCATGTTGTCTCAGGGAGTGCATTCTGGCTCCCAGTGATCATCAATTACTTTTATAAAAGTTCACCAATCACTTGTTGGTTTCCGGAAAACAAATTTAAAGCAAACATTATTAATGTCAAACTTACACATTTTGCTTTCTGGAATCAACTTTTTTATTTTAAAAATTGAGAATA>rs7595393CAGGGTCCACGGTGTCCTTCGTGTCCCTCCCTGCCCAGCCTCAGCAGGAGCCCCCTGCTCCTAGACCACTCCCTTACTGAGTCCTGTAGATGTTCCAGCACACACAGTGCCTCCCTTCTCAAGGCCCCAGCCCCAGCCCCTTCTCAGGTCATTTGGGGGCTTACATCACCTGCTACCTGTGTGGAGATGGAGGTCTGTTT[C/G]CCAGCACTGCCTTGCTTTTCCTCCTGCCCCACTGCATTTAATCACTGTGATAAGAGGAAACAAAGAGGGAACGTCATTGGTCCCATTCCTCTGAATCTTGACCACGAAAATATCTTGAATTGCCTCCGTGTCCCCACCCAACATCGCCTCTTGCACTGCTACCTCTGCCTGAGTGCACATCAGCCAAGAGCCAGGAACCA>rs2372935CCCAGCCTAATGTGTACTTTTAAAAGCACTTTTCAAATACTTCATCTTGTTTAATCTTCTTGGCAGTTCTGTAAAGTGTGAAGCATTGTACAAAGTTAACTCTCATTATTATATTGGAACCCAGGGTTTTCAGAGGAGAATCCTCAAGGAGATAGGGCTTTCCTGCCTTGTGCCCATATAAGGTTGTGGATCCCAAGGGA[C/G]GAAAGCATTTTCATCAGACTGGGAGAGGCAAGAAAAGGTCACTGGCAGTATAGATTCTTCTGGAGTTCACTGGCAACTTGTCCCACTTCAGTTCTCCCTTAATCTTTCCAGATGTGCAGATGTATAGCCTGGGTGGATGAGCCAAAATGAATTCAAGGCTAAACAGGTCAGCTGGCTCAGCCCATGGGAAGCATGCTCAT>rs6733648TGGAGAAACCAAGAGGTTGATTTCCTCAGCCTTCAAGAGAGCTCATCCTCAGCTCTCTAAAGCTGACCAGAAAGAGGAGAGTGGGACCTATGAAAACAGCAGGAGATGGGAGGGCTTGAATTCCTAATGCTATACCCATAGGTCATTGTGCCATGGTCCTCTGCACCCCCAACACCCCCAACACTGATCCTGAAGGTCTC[A/C]ACAATCTTCATCTGCCTCTCTCCTTTCACCTTCTTTACACTCTCATTGATAGCCTTGGTTTTTTCTATACCTCCAGTATTCCCATTCCCATGATAGCCATTTAAGGACAGGGCACTTCCTGGTCACCATAAGGAATATTGTGGGAATGTTCTGCTCATGGATATTGCATCAGAATAGGTCTGGAAATGAAACACACCAAC>rs6435957GAGACAGATGGAGAGTGAGAGAAGGGAGGCAGGTAGGTAGGCAGAAGAATGAGGAAGAAAGCAAAGGAGTTGAGACTGGGAATGGACAGAAGGAAACCTGTACATGCTGTGATCTGGGCTTTCTATGTTCCCTGATCCAGGGTCCTGAGATCTTGGGGTACTCGCCACTGCATTGTAAGTTTCTGTGGATGAAGCTGGCA[C/T]ATAAATACATCTGTAAAGCTGTAACTCCTGGGCATTGTCCCTGAAATTTTACTGATGTCTAGATTCTAGGTATGGGATTAAATGGGTCCACATTTTGTGTTTTTCTGAGTCACCAATTACAACAAAACTTGCTCATATACTTATGCCTATCTTAAAAAATAATTTATTTTAATAAAATAATAATAAGGCAAGAAAAAAAG>rs6723019TCATTATCTCCAGAAAGCTTTTCCAGCTTCCAGTCACTGCTTCACTCCAGTTTTCTTTCTTCTTTTTTCATCTTGGCTTATTTTAGTTGGCTTCTATGCCCATGACTATCACCCTCAACCAAAGACAGAGAGGCTCCAATGCAGGAGGCAGACAGATTTGGGCTTGAACCCAATGCCGCTTCCTTGCTGTGTGAGCTTTG[G/T]CAAGTTATTCTATTGCCTAATTTTTGGGGATTGTATTATGTTATGTTACATGTTATGTTTTGTTACATGATATTGTGTTATATTACTATCTTCTTCATGGTGTTATTATATTATTAAGATTGATGAGATAATGTGTGTCAGATTTCTAGCAGGTTTCTTGGCATATTGCAACCACCAATACACTGAACATATACTGTCTA>rs12614773CCACATGTTTCTCATCCTCCTCCCAGGATTAGTGGGCAGCCCAAGCATGTCTTTCTTCAAAATGATGCTGGATACATAAGAGAGCAAGCAAAAACATACATGGCTTCTTGAAGCCCAGGCTTGGAATTGGTATGCCATTGCTTTTACTGGCCAAGCAAGTCACATGGGTGGCATCAGGGATGGGCTTATGCATCATCTAC[C/T]GTGGGAGGAGTTTTCTAAGTATGATGAGGGCACAGATACAGGGAGCGGTGACCATTACGAACATTAATGCGAATCCTCCACACTGTGTTTCTTGATCTGCCAGGACAGGGTTCTCTGAAGGCCAGTAGAGGTTCAGTGCTTCCAAAAAAGGATGCTGGGCTCAGGTAGGTAGACAGAGTTCATCACCTCTATCATGACTG>rs17833842TAACTTATAAATTGACTACAATCCTAATAATCACATTAAAATTTTTTATAGTGAAATTGATACTGAAGTTATATGGAAAAAATAAGAATAACTAGAGAAATATTAAGAAATTAAAAGAGAGCTACAATGAAAGATTAACTCTGCCTAAATTTAAAAGGCATTCTAAAGTTTCTGTGATTGAACTAGTAAGAACCTTGTGC[A/G]TAAGTGGAAAGACCAACTAATGAAATAAAATATGATCTGAAAGAGACCCATATGCATGTGAAAATTTAGTATATAATAAAAATGCAAGTTCTAATCACTTGATAGTCATTCCTTTAAAGAGATACAATGAAATCCATACCTTAAACCATATAAAAGAATAAACCTCAAATGTATGAAAGATAGTATATATAGAAAATAAA>rs10177578TGACTAGGTAAAGTTTAGAAACAACAAATTTGAATGTTCAAAAATATTATCAGCAGTAAAGTCAAAAGCCAAGTGACGAACTGGTAGAAAATGTTTCTATATATATCAGAGATAAAAAGTTAATGTCCCCAAAGTATAAAGAATTTTTGAAATTGAGAATAAGCGGAAAACCAAAAACCAATATAAATGGGCAAAAGATA[C/T]GTTCATATAATTTAAGTGGTCCCTAAATATATAAAAATATCTTCAACTTTCAAATATCCTTAAACATATAAACATACATTCAAATATGTTTCTTGTAATAAGAGGAATGAAAATTAAATATAATGAGATACCATTTTTCACCTATCAGAATGGTAAAACAATTTTTTTTAAACTCTTAACACACTGTTGACAAAGCTGTG>rs12623304AAAAAAAAACTATGAAAAAATGATGGCGATATATCAAAAAGACTCAGGATCCAGTGTGAGCAGCTCTTATTGGGCAAGTCTTGGAAATTTGAACAACAAAATCAACAACGGTTAGTTACACATTAACATGTTTGACAAAATAAGAATCCATGAGTCCAGACTGATATAAATTAATGAGTGAATAAATGAATAGGTGATTG[A/G]GAAGAAAGGAAAGCTTCTCTTCACAATAGAATGCCAATTAACAAATACAAAAGGAACAATGGAGTTAGAAAAGAGTTAGAACACTACCATTTTGCAGCAATTACAATAATAATTAGTTTAGGTAAGAATCATGAATGGGTGATACATTTACGGAGACTGTTTGATGAGGAACTGGATATTACATAG CCTCACAGTGTTTC>rs6716542AGAACACCTTCCGCACAAGCTCTTCAAATATCTCAAGTTCTCTTTTCCAGTATGGTGTTGCAGGGTGTAGTGAAAAATGCATGAGTTTGGAGTCAAACAGATTCCCGTTCCATTTCTGGTTGTATCCTATATTACCACTTGGAGTTGTTGGCAGTCTTAGGTGAACACAGGAGGCAATTCTTTTTTTACAGTGACTGACA[A/G]AGAGGTGAGCAAGAAATGTGAGTCTCTTATTTATTCCCAGCCCCTCTATCTTAACTTGTTGAAGGTAAAGACCAGTGGATCTGAATTTAGATTATTTACCCTCCCATGTGTGGGGAACACACACACGTGCACACACACACCAGGCTGGAATTTCTTCAGTTTGTTCCTCCGGGTCTACTCTATACTTCATGGAAGCTGAT>rs17777330AGTCAGCAACATGTCTCCAATTAACATGACAGATTTTTTGGACCACAGATCTCTTTGGGAATCTTATGTAAGCTGTGAAACTTCTCCCTTAAAAAACCTACATATTTAATTCTGTCTGTAATTTTAGGACTTCACATATCCCCAAAGACCATTCATGATCCACCAGGGTTAAAGACTTGTTTTAAGTAAAGAAAATATTC[A/G]CAGCCTCTGGAGTAGTAGACATCTCCAGAGAAAGTCTGGCATTCTTTGGTAACTCATGGCATTTATTACATTAGCTTTGGATGGAACAACCCCCAACCCCCAAGTCTGAGCATGTGGTTTGATGCTGCTTCCTTTCCATTTTCACTCTGCTCTCTTGGATTCTATGTAGCAAAAAGGTACCTTTTCTAGGGTCACATGTC>rs10211546ATATTTCTAGGGTAGTTTAGGTAACATAGAACTTTGTAGCTCAGCAGTCTTGGAATCACTAGACTCTAAGCCCCATGTAGTCAGAGACTGCCTGCTTTTATAATTCATCCCCAACAGCAGGCTATTGCATAACACATTGTTACCACCCACACCATTTTGTTGAGTAAATGAATGCATGCATGAACGAATCAGAGGATTCT[A/G]TTGTCTAAATAAACTTTGGAGGTGACTTAGTCTTCTCTTCCCTCTGATGCTTAGATCTTCTTTATCTCTCAGTTCAACATATATTGCTCAAATGGTTCCTAGGTGCAAGGGATCTGGAAGTTATTAAAATGAAATAGATTTTGGACCATGACCTTGACAAATTATGATCTACTAGGAGAGATAATATGGAAATCAGTATA>rs2372937GAAGTTATTAAAATGAAATAGATTTTGGACCATGACCTTGACAAATTATGATCTACTAGGAGAGATAATATGGAAATCAGTATAATACTACAGAGACAGTAAAAAGGAAAAAGAAATGTTTGCACTTAATAATTATTCCACCATTGTTCCAAAAGTTTCAATTATAGGGAACTAAGTTCCACTACTAATAAAAGTCAATA[C/T]GCATTGTATGCTTACTGCATGCTAAATATATTATGTCATTATAATATTTATGTTCAGGTGTATACTATGATTGTATGTATTTTACGACAAGGAAATTGAGGCTCAGAGAGGTTAAAGAACTTGCTCAAGGTGACAGAGCCAGTAGGTGGTAGAACAAAGACTCCTACATTCTGACCTAGTCCATATGTAAGCAGATTTAT>rs4315498TTCAATTATAGGGAACTAAGTTCCACTACTAATAAAAGTCAATACGCATTGTATGCTTACTGCATGCTAAATATATTATGTCATTATAATATTTATGTTCAGGTGTATACTATGATTGTATGTATTTTACGACAAGGAAATTGAGGCTCAGAGAGGTTAAAGAACTTGCTCAAGGTGACAGAGCCAGTAGGTGGTAGAAC[A/G]AAGACTCCTACATTCTGACCTAGTCCATATGTAAGCAGATTTATTGCTAGAAATATCTTGATGTTGCATTGAAATCTGCCTCTCCTTATTTTCCATTTGGAACTAATTCCACTCTCCCGAGCCAGAAAAACCAAGCCTCTCATTACTTGAAAAACCAATTAATGAGTTAAATTACATCAAGTTAGTTTAACAGTCAGCAA>rs12998806TAGGTAAGTCTTCACAGAGAAACTGGTATTAGGGCTAAGATCTAGCGGAGGACTAGGGGCTTTCTAGACAGACAATGGAGGCAGGACACTTCTGAGAGAGGAATGAAGCCTTGAGGTGTGAGACAGCATGTGGTAGAGCATGGAGGGTTCAGGCACTTGGAGGAGTTGGGTATGGGGAGAAATACAGAGCACCTGTGAGA[A/G]CCTGGGGCATGGCTGGAGAGGTAGGCAGGGGCCGGCTTGCAAAGGGCTTTACCTGTCATGCTGAAGGGCTAACTGCTGTTCTGGAGAATTTGCAGAGCCACTGAAGGTTTTGAAGCATCCTAATGTTAGGATTCACTTCAAGTTTTAGAAAGTTTAGTCTTTTGGCTCAAGGGTGGGGAGGGAATAAAAGAAGCGAGAGT>rs12465515CACCTACTCAGGAGGCTGAAGCGGGAGAATCGCTTGAACCTGGGAGGCGGAGGTTGCAGTGAGCTGAGTTGGCACCACTGCACCCCAGCCTGGGCAAAAAGAGTGAAACTCTGTCTCATAATAAATAAATAGAGTGGACAAGGAAATACTGATGGGGGTGAGAAAACAATTTGAGAGACATTTGAGAAGTAGTGAGATAA[C/G]ATTTGGTTACTGATTGAATATGGAGTGTTAGGATAACCCTGGGATCCTCATTTTGGGCAATCACAAAGCTACTGGCTACAGCAAAAGGAGGGGAAGAAAAGTGGTGGTGGGAGGGAGGCATGAGAAATTTGCTGCTGGCCATGTTAAGCTCCACCTCCTGTCACCAAGTGGTGATGCTCAGGAGATGTTTGTGTCCACAG>rs4491709ACCTCCTGTCACCAAGTGGTGATGCTCAGGAGATGTTTGTGTCCACAGGAGGAGAGTGATCTGGGTGGGAGGTTTACATGTCCCTCCTTCCATCTCCCGGTCCTTCTTTCCCTCCTCCCTCTTTCTTTGTTTGGTACTTCCTTTCTTCTCTCTTTTCTTTTTCTGCCTTCTTTTGAGAATGAAACCTAAGAGTGTTTATA[C/T]GTAGAGGGAAAAAGTGGAGCTAGAAGTTTAAGACACAGGAAAGGGAGGAAAAATGTCCTAGTGTGAGATTCCAAGGAGGAAGAAGGGCCAGGATAAGGTGGGGAGAGGGATGCCTCTTTTGCTCATTGCCTTTATCTGTCTTTGTCTGTCCTGGATTGATTGTCCTATCCTTTTCTTCCACTTCGTGTCTTCTCCCGTAT>rs2372938GGATTGATTGTCCTATCCTTTTCTTCCACTTCGTGTCTTCTCCCGTATTTCTACACAAGGCACAGTCAAATAAGGGCTGGCACGTGCGCATCTTTGTGCACACATGTGTGTGCACAAGCATTGAGGGATGCACAGGTGCACACACCTTGTAGAGCCTCTAGTAGCTCAAGTCACATTTTTTCGCATTTCCAGATTGTAAG[C/G]CTTACTGAGGGGCAGATGGGACGTTCTCACAGGAAAAAGGCTGACCTCAGGGAGAAAGATGTGGCCCCCACCTACAAACCAATGATGTCTACTCCCAACAGGGGACGTCTTTCCCCTGCGTGAAGCAACAGGACAGATTTGGTTAGGTGTGGCATCGATGTCCTAATCTCCTATGAGCACACAATGAATGAAGGTGGGGG>rs12621130GATGGGGCTCTGACCCAGTTTCCATTTGGCCAGCCGACTGGAAACAGCTACTCACTGGGCCACTGGGTTCTTTCCAAAGAACAGTGAAGAACAGTGGTTTGGGGTAGGTGGGGGCAGGGGCTGGTGGGGCAAGAATGTCAGAAGCAAATGCAGGCGTGGCTGGTCCAGTAGTTCCAGTACCAAAGAAGCCGCTATCTGGA[A/G]GAGTGGGACAACCCATCCTAAACATGGGAAGAAGAAACAGGAAATTTCAAAAGATACAACTACTAATTAAATGAAAGCACTCCTTAACCACCCCTTTGATAATTAGATCATCTTCTCCTAGAATGAGAAGGAATATTAGTCTGACTTTGCCCTCCATATGGAGAAACATGGCAGGCAGGCTCTCTGTGCCTGGAGGGTCT>rs13399995GAAGGACACTGCAGCCAAGCTGAGCCTGTGTCCAGCTGAACACGGACATTTACTTCTGCTTCTGAGGGGAAATATTGTCATGTCTTATGGGTGTACCCAGCAAAAGATGTTTCCACTAAAAGACTATAGAGAATTGCTTATTTCTAAGGACTGAATTCCGAATGTTTTTGGTCAGGTTCTCTCTGAACAGAGAACCATTG[C/T]CCCTGAGCAGAAGCGGTCTTCACACAACTAGCAACCATGTAGTGTTTTCTCATTCAAATGGCGTTTGGTATTCACCTGCCTGTCCTGGAACAAATGCAAAGTCAGGGTTGTTTCTAGCTCTCCCCCAATATTGGAAAAATGCTGATGAACTGAGCCTGGTTCCATTTTACACCTGACAAAAGGAACTCAGATGAGAGTGT>rs12052807TGCTCTCATGTGTCTCCAGGAGAGTGTGGCCTGGGTTAGCTTAAGACTAGGAATGTGCTGACAGCTGGGAAGAAAGTCAAAAGAAGGCATGGCATGTGGTTATGGGGCCGGAGGGACCGCTTGGGGGGAGAGGTGGAAGCGCTGACATGAGCTTGCTCTGCATCGCTGGTTCCCAGAGGTGGCCTGATAGGAGAGTGCCA[A/G]CTGGTGGTATGCCGTGGGCTCTGGGGAAGGGGCTAGAATGTTGTTGCAGCCCAGAGGGGCTGGGCTAGTGAGGAGCAAAAGAAAACATAAGCTGGGGGGAAACTGCCTAATAGACCAATTAGGAGACAGGGTTGTGCCCTAAGGGATGGGTGGGAGCAGGGGGTGCTAGAAGTAGACAGAGAGTAACTCTCAGCTCTGAA>rs10199394GCAAACTCATCTCATTTGCTACTTGTCCTATAGGTAAGGATGGACACCAAACCCAAAGAGACTTTTGGGATGTGGATAAAAATTGAAAACTTTGCCTCTCATTAATCCCTTGGAGAATATAGCATCTCCTTCAAACTGGACTGCTCTCCTTGATCCCTTGTCTTTACCTGAAAATATCTTTCAAGGCCTAGCTCATGCTA[C/T]CTTGGCCATAGGAACTTTCCTTATCACCTCCATCAATGCTGTTTGTCCCTCCACTAGAATCTTCTGTTTTGGTACTCCTCTTACTCAGCCTCAAGTTAAATTTATGTGTACTGGTTTTAACCCCAGTACCCAGTAAAGGTTCTGAATACACGTGATGAAATAAGTCTCTCCTATCCCATGGCACCTAGTATAGCATTTAG>rs2372940AAGTTAAATTTATGTGTACTGGTTTTAACCCCAGTACCCAGTAAAGGTTCTGAATACACGTGATGAAATAAGTCTCTCCTATCCCATGGCACCTAGTATAGCATTTAGTTGCTATACTAATTATTATAATTAGCATTTATTACGGGCTTACTATGTGCAAAGTGCCATTATTCCATTTATTATTCACAAAAATATTTAGT[C/T]TCTACTATTCTCTAATTTATTAGATAACCTAATATAAATCTTTTTTGTTTTGATTGTTGCTAGCTGATTGAAGGAAATAGAATTGTGGTGTGGTAGTAGGGGATGTTGAGTGAGTCTTCCTCATTCTTAATATTTCCTTCCACTAGGATAACGCCCCTGGGCTCTCTTCATCAGGGGAGGAGGAGTGACTTCATCTGATA>rs4583440CCTAATATAAATCTTTTTTGTTTTGATTGTTGCTAGCTGATTGAAGGAAATAGAATTGTGGTGTGGTAGTAGGGGATGTTGAGTGAGTCTTCCTCATTCTTAATATTTCCTTCCACTAGGATAACGCCCCTGGGCTCTCTTCATCAGGGGAGGAGGAGTGACTTCATCTGATAGATTCGGAAGGGAAAATGTTACCCAGT[C/G]GCTTCTCAGTCCTCTTTCTCTTGGAGCGAGCCCATCTCTGGAGCACATACACTCTCCCCTGCTCCTGTAGGTCTCGAGTTCTCAGGGGAAGGGTTTGCCCTGTAAGAGAGCTTGTCCTTCTCCAGTGAGGCCTGTCACTGGGAAGATAATTCTGTACAGTGCTGGGATTCAAATTTAGAAAGCCCACTTGCCCCATAATT>rs2372941TGTGGTGTGGTAGTAGGGGATGTTGAGTGAGTCTTCCTCATTCTTAATATTTCCTTCCACTAGGATAACGCCCCTGGGCTCTCTTCATCAGGGGAGGAGGAGTGACTTCATCTGATAGATTCGGAAGGGAAAATGTTACCCAGTCGCTTCTCAGTCCTCTTTCTCTTGGAGCGAGCCCATCTCTGGAGCACATACACTCT[C/G]CCCTGCTCCTGTAGGTCTCGAGTTCTCAGGGGAAGGGTTTGCCCTGTAAGAGAGCTTGTCCTTCTCCAGTGAGGCCTGTCACTGGGAAGATAATTCTGTACAGTGCTGGGATTCAAATTTAGAAAGCCCACTTGCCCCATAATTAAGCCACATTCACCAGCTTTAACAATGACAGAGGTGATATTGAGTTCTCCAGTGAT>rs6721811TACCAGGTCCTTCATTATCATATTCTACACATTGAAAATGAAGGTAAGAGAGCAAGCAACTTGCCCTAGGCTACCCAGGGAATAGGGAGGAAAGTCTGGATTTGAACCTACTGCTGCCTGACTCCGAAGCCCTGTTCTTTCTCTCACCCTGGAGGATGGATGAGGGTGGGATGGGGCAGTTAAAAGTTGAGGGGTATCTC[C/T]AGGAGAAAGATGAGACACATGACCATTGGGTCTAAGGAGCCAGAGAGAGGCCATTGTGTCTGAGCCTGGACAGCCAAGCTTCCTAGAGACAGAGGATGGGATGAGATGACTTCTGGCTGACTCTGCCTCCTTGAGCTCTTTAGGATCCCCTGCAGAATCTCCCAAAATGATGCTCATTGGAAACAGAGAGAGCACATTCA>rs12615418TAGAGATGGGGTTTCTCCATGTTGGTCAGCCTGTTCTCAAACTCCCGACCTCAGATGATCCACCTGCCTCAGCCTCCCAAAGTGCTGGGATTACAGGTGTGAGCCACCACACCCGGCCAATTTTTTTTTTTTTAAAATATGGCATTAAAATGGTATTTATCTTGACTACTGAGTTTTTGGTTAACCCCTTACATTTTGTG[C/T]CCAAGACATCTCACTCATGTTATCCTAGGCCCAGCATGGCTGGCCTTGTCTCTTAAATTCAAATTTTTAAATTTTTCATTCCTCAGGCTTCTCACTTGTAAAATAGAAATAATAATAGCATCTCCCCCACAGGCCTGTGCTGAGAGTGAAATGTGTTACTACACGTGCCTCACCTTCATTTTCAACAGGACCTATTGCCA>rs12621884CACACCCGGCCAATTTTTTTTTTTTTAAAATATGGCATTAAAATGGTATTTATCTTGACTACTGAGTTTTTGGTTAACCCCTTACATTTTGTGCCCAAGACATCTCACTCATGTTATCCTAGGCCCAGCATGGCTGGCCTTGTCTCTTAAATTCAAATTTTTAAATTTTTCATTCCTCAGGCTTCTCACTTGTAAAATAG[A/G]AATAATAATAGCATCTCCCCCACAGGCCTGTGCTGAGAGTGAAATGTGTTACTACACGTGCCTCACCTTCATTTTCAACAGGACCTATTGCCAGTAAGTGCTCGTTAATGTTAGCCATTATTCTTGGCATTGCTGTTGTTATTAGTGTCAGCCATCATTCTCTCAGCCAAGAGATCCTTCCAGAAGAGAAGTTCTCCATG>rs2372943CTTGAGTCTCAATTTCTTCAAGTTGGGAACATTACATGACAGGACAGGACTGTGAGGATTAAATGTAAACAACATTTTTTTTTTTTCTATAGAACATACTGTGGGGCCAGCACCATGCAAGGTGCTTTTATCTACAATTTATTTCTTTCCCTTCCCATGCCTTCTGCCTCTTTGAATAACTGCTGCAATGGCTGTAGAGA[A/G]ATAAATGCAGTAGACCAAGACTTTTAGTGATTTTTAAACAATGTTCTAGGGCAAATACATGGGTATGTTTACATACTCCACAAAGTGAAAAAATTATGCTAGTCAGTGTGCAAAGTGTGTTTTTCCAGACCTGCAAAAACTGAGATCAACTTCCATATTTCCAACTTCCATATTCCCTTCATCCCTTAAGCTACCAGGCA>rs4522583ATTTTTAAACAATGTTCTAGGGCAAATACATGGGTATGTTTACATACTCCACAAAGTGAAAAAATTATGCTAGTCAGTGTGCAAAGTGTGTTTTTCCAGACCTGCAAAAACTGAGATCAACTTCCATATTTCCAACTTCCATATTCCCTTCATCCCTTAAGCTACCAGGCAGAGGATGGGAGATAAAATTTGGCCATAAA[C/T]TTGTCATGGGTCCATCTTGGTCCTAATTAGAATTATCTACTTCCTAATCCATTAACTGCATGGATAGATAGTCTGAGGGCCTCAAGGGCAAGAGATGACTTCTACCCCTCCACCCATCCAGCCCTGACCCACCCTTCTCATATACATTGGAGAAAGCTCTGCTCTGTGTAAAACACATCAAGTGCAGGACATGGTTCTTT>rs2888451GTAGAGTTTGGGAAATGAGTAACATGTAGATCTGTGAATAGATATGTCTGAGGAAGCACCAGGCAGCGGAAATAGCTGGTTGCAGGAGCAGTTTGTCCTGCCCACCTGAATCTTCAGGTTCCTTCAGCTAAGCCTTAGGAGAGGAGGCTGGAGAGCTGCTTTGCTGGATCATCTCCTTTGGCCCCCCTCAGACTAGAACT[C/G]CACCTCCTCTCTACCTAGCTCTGTGCTCCACAGGCTGCCTCTGGGCTGCACTGATGGGCTCCCTTGACTGCTGGCTCCTGTTCAGGGTTGGAGGAGGAGGATGAAGTCATGGAATAGTGTCCCCATGCTGGGCTGCAGGTACAGTTGCTGCTTCTCTACTGAAGACCCCTGACAGCAACCCTGTCTTACAGCCAGGGTGT>rs2270398TCAGAGCAGGAGACATCATTTTCCCTTAATTCTATTCTGCCTTGTAACCCCTTTCTTAGACTCTCTGCTGAGTCTCTGCTTATGTGTTGGGATTGCATTGATGCAGATGCTTTAGGGCCACGTTGTGGAGGATACAAGATGATGAGACAGGAGGCAGCGTATGGTGAATCACTTCTCACAGCTCCTAACTAAGTTCTGGG[C/T]ACATGAATGGGTACTCAGCACATACCTACTGACCAAGCCTATGGAGAGCTGAAAACTCATAGGCTGACTTTGAAGCGAGGCCTTTGAAACCATCGTCCCAGGGGAAATAATCTAGGTCAAAGAGACGGCTGTGGCAAGGGTGCGAGCTGGCAAGCATGAGGGCTGACAAAGCAGGCAGCACTCCTCCTGAGCAGATGACC>rs13412666TATTCCCAGGCTGGGCTGGAGCACCTGAGGCTACTATGGTTACAGAAAGGAACCTGGCATCCGAAGGTATAGGCTCAAATCCCAGCTCTCATGATTGCTAGCTTTGAGGTTTCAGGTTCATTTCTTAAGTGCTCTGAGCTTTGGTGCCCTCCTCTTCAAAATGGGAATGAGGAGCATGTCTAGCTCCCTGTTTTGTTGCA[A/G]TGAATAGCTACATGAAGAACAGCTAAACCAGAACAGAAAGAAGGCAAATGGAAGCTACAGAAACCAAGGATTTCCTTGTTGAATCGAATCTTCCTTCAATCTTCCTTCACCACACTAGTGGATCTCCCTGTGGGAGGGATGTTGAGAGTGCTCCGTGTTTTTTTTGTTTTTTTTTTTTTTTTTTTTGTGATGGAGTCTCA>rs13426489CAAGTGATTCTCCTGCCTCAGCTTCCCAAGTAGCCAGGACTACAGGCATATGCCATCACACCCAGCTAATTTTTGTATTTTTAGTAGAGACGGGGTTTCACCATGTTGGCCAGGATGGTCTCGATTTCTTGACCTTGTGATCTGCGCACCTCTGCCTCCCAAAGTGCTGGGATTACAGGTGTTAGCCACCACACCAGCCT[G/T]CTCTGTGTGTTTTTAATCAATAGCAATATGTACCATATTTAGTAGGGACTATAAAGAAATTGTGCTAGAAACACCTGGTTATTTTACAGAACTTTGCCAGTGAGTACAAAAATATGCGTAGCCCACAACCTCTCTCCCCTAGAAAATACCTCCTGTGGGTAGAATGAAATGGGTAGGTGTTCTTACCATTCATTAGCATT>rs6713249ATTAAACCCCTTCCTTATACATTACCCAGTCTCAGCTAGTTCTTTATAGCAGTGTGAAAACAGACTAACACACTCTTAAAAGTAAATGTTATTACCCACCTTTTACAGATTAAGAAACTTAATATTACATCAAGGAATTAGTTTATAGCACTGGATGATCTGGCCTCAAATCTCCAGTGTGATCAGTATCAAGCTTTTCT[C/G]ACTGTATCAACAGAGTTTTCCTAACAAATCATAAGACACAAGTAGTTTCTCCAACTTAATCTATTATACCCATAATTCACTTGCCTCCAGGGAAAAAAATTAGATGAAACAGACTGTAGTGGCTTTGTGTAAAACAGCAGCTCCATTCCTTTAGCCCTATTCTAAAACAATAGACCATGTGCTGATAGCTAGCTAACCTC>rs12620095GCATTTGTTCCAAACACATTTTACATGGATTATCCCATTTAATCTTTACACTAAAGTATAATACTCTTATTACCCCATTTTAAAGAAGAGAAAACTGAGGCACAGTGAGATTAAGGAATTCATCCAGTTTCTGCTGCAAGTAGGGTGGCTAGCATTGTAATCTGGGCATTTGCCATGAAGCTGTGCCCTTAACCACTCCA[C/G]TATGTGCTATAAGGTGGAGCTGACTTCATGGGGGCTAATTCAACCAGGGGAGTGTGCTCATATTAACAGATCTGTGAACTCCCTGGTTTGTTTGTGAGACAATTATCTATTTGCTTACCTGAATCACAGCAATAATAGTTATACCTCCCACTTACTGCATGCCTACTTGGTAGCATGTACCTGGACAGAAGGTTTTCATT>rs4621152GGCGTGAGCCACCCCGGCTGGTCGCATTCCTCTATTTAGTGTTAATACCCTAAGACTCCCCAGCTGACCACCAAATGTAGGCAGGTGGAGGGACTGACCTCCAGGGGGCACATGTCTCAGGTTGACAAACACATTTTCTCTTGATCCTTTTTTTCAGTATGATGAAGTATTCTACAAGACTCTCATTGAACCTTCTGATA[C/T]CACATTCTAACCATTTATATAAAAGTCAAAAGCTCCTTGTCTTCAGGATTCCAAAGTTCTTAGCACAAAGGTCCAGGAAGTGTCTGAATTCTTTGGTGTCTGGTTCAGTATGGATGTTCGGGTCCCTCTTAGACTTGAGATAGAACAGGAAAGAGATGAATAGACAATGACAGAGGTAGAGAAAGTACCAACCCTTCCCA>rs12622764CCTCTCATCTCCTGAATGGCTGACCAGTGCTTGCTTCAAGTTAGATTAGAGTTTGAGCTTTGTAACATAAGTCCCCTTCTGTCTGATCAATGAAATGAGGGATAGGTACTTGCCCGAGAGTTATGGGACCTGGCATTTAACGTGAGAACATGCATCTTCAGAAGCACTGGTGAGACTTCAGAATTCCTGAAAGCACTATT[C/G]TTGCAAGGCTTGAATGTACCTTCTCCACTCCACCATGTCCTCTCCCAACCCTACTAGCATGATATCAAGCTTGGGTGGAGAGCTCGCTTGCAACTTTGTCAGATACCCATGAGCCACTCTTTGAATTTCTGACAATGAACAAGTATGTGGGAGGCCAACCCCATCCAACCTGACCCATCTGAACCCAATCACATGTTTTC>rs6723013AGAAGAGTCCTTTGTGACTCTGATTGGCTTTGTGACTTCCTTGGGGCTGGTGTTGGTCTCAGGCTTGTGTCTCGCAGTCATCCAAAATGTGGGTGGGCCATGTCCCACCTTAACTGTGGTTGTGAACGCAGAGGATTCACTCAACTTTCAGCATGCAACAATAATCAAATGCAGTTTTATGGTTCACAGAGGGCTCCACC[G/T]TCATGATTTCATTTGATCCTCCTAACAACCCTGGGAGCTCAGAGAGACTAAGGAACTTGTCTCATATCACATACCCAGGAGTTGACTGCACGGCATCTGATGCCAGCTTCTGTACCACGTGTCCTCCTGGTGATACTAGAGTAAATAAAACATAACTAGACAAGTAAATATTTTGTACAAAGTAATCTGCTAAAAATGT>rs2372945GAGCATTTTCTCTTGGTAAGTTCTCATTTTCCCTTAATCATTAGAAGACACGGCACAGTAAACGCGAGCTCATGAGCAGAAGGCTACATAGTTGTATACATGTGTGTGCTTTTTTTCACACCAGAGTTTGATGAAGCAAAATACCCAAAGGTCTTTTAAAAGTAAAGAGGTTTTAAGAGTAAAGAAATTTAAGAAAAAAA[A/C]CAAAAAGAAGTAAAGATGGTTAGGTCTCCTGTTTGCTCTCCTTTTGCAATCAGTCTGTCTCGCTCTGTGAGCTGACTATGCTGCAGACTTTTCTTTTACCTCCAGCCTTTCGCTTGTAGGGTTTGAGGCTAGGGGCGGGGAGAGAGAGTTCAGCCCAGCAGGCAGCAAACCCTATGTGCAAACACGATGTGTGAACATT>rs12694403TCACTCTCTACCCCTGCTGCCCTCCCAATGCTCAGGTGGGCCCTAGATTCATCCAGAAGCCAGGGTGTTGTGCTTCATGAAAGGGCCAATACCCCTAATGTGGGACCTATACAATAAAAGGCAAGGGCAGAAAGAGAGAAGAAATAAAAGGAAAAGGGGTGTCTTGAGGGGAGTACATGATAGACTCCTGTGCCTGGAAG[A/G]GACTAGGAAACTTATACTGACTGGTTCACTGCATTTGCTCAAAGAGTATTCATCTTCTTGAGTTTGTCAGGTGACTGTAAGAGCTGGGTTCAAGTTCTTTGGTTCACTATTATATGCCTAGCTGAGCACAATGCCTGGGACTTAGAGGGAAGGTCTGGGACTTCACCAGGATTCCCAAAATAGAACAAAGCATTTGTTA>rs12613955TGAAATATGCCAGCCAGCTTAAATTAGCAAAGCTGGAACTGTGGCAGAATGAATAGCCCGTGTCTGAGTGAGAGGGAAGGAAAGGGTCTACTGTGTGATAGGCAATGGTTCCAAAGTAGGAGTAGGGGCCTAGTGTGGTCATGCCTTCTGATATGTCAAGAAAAGGCAAAAAGTTGATATTTATTTGAAATATTCTGATT[G/T]TATAGGTTGGTGATCAATTAAAAAACTAACAAATACAGTTAACAAACATGTTTTAATGCTTGCAGACAGGATCCTTCCTGCCGATGTTTGGCCTTTGTCTTTAATGGAATTTGGGCTGCCCCATAACAGCCCACCCTAAGCAAAACTTCTTTTCTGCCTTTCTTTTATATTGTTTTTTATGGAATGTAGAGGGATTTTT>rs11894340CTGCTTCTATGCTGTATTCTAGTCATTAAAGGAGACCATCTCACACTCAAGGGGAGAGACTACACAAGCCATAGTGCTGCCATGGCAACACAACCATTAGGATGATGCCTTGAGCCTTCCTTCTTCATATTTCTTAGACTTCCTTTCTGACCTAGAGGAGCCAGAAGGACTTGGGACTTGTCATACCGTCCAATCCCAAG[A/G]AATGACAGGAATGAAGGAATTTTTAAAAATTCAACTCATTTCAACACACACACAAAAAATGAGAGAAGTGAGTCAATTTGAGAACTGAAATTCTGGTAGACTTTTGGGGAGACACTAGAAGGGCCATGTTCATGAGTAGGAACCATAGATTCTGAGTCAATTGGGCATGAAAGTTTTTCTCCTGGTGTCCCGATCTTGG>rs17778329ATTGTGTTGGGGGAAGGGAGGCTTCTGAGACAGAGCTGAGAGTCCCCAGCAATGCCATCCCTGGCTTCTGGCCCATCTGAATGCCTTACTCTTTCATGTAAGCAAGACATGAGGTCCTGCTGTTTGAGTTGGCTTTGCCCTGCTCCGTGATTTCAGTTCCTTGTCTCTCCAGCGTGTGGGCTCATTTCCGTCCTCTGAGC[A/G]CTATTGTTTTTCTGACTTGAACAGTCATCCAGAAAACCTCAGTAATAAGGCTTTTGTATCATTATTTACTTTGCTAATTATATATGTCTTTCCCATCCCCAGTGCTTGAAGACATCAAATTGCAGTTGAAGTAACGGCAGAGGGAAAAGCAAGGGCAACAACAACAAACCACTTCACTCCTCTGGGTGGAAACATGCAA>rs4442975AATTTTGGTGATGGGAGGTGTAGAGGGTAAACTCTTGATGATATCATTTGTGTACCTGGGTCCAGCCATGCCTGAACTTTTCAATTACTTGACCCAGTAAATTTCCTTATTCATTTAAATGTTAGAGTTGAGTTTTGTCTCTTATAACTGAAAGAGTGACATGTGTTTATATTAAGTGCAGGTCACTAATATAGTCTATT[G/T]GTTTCCCCAGGCTTGTTCTCCTTTTCTCAAATAGGACTGATCAGATAGTAAGTGCTCCATACCTGTAGGATACATAAAAGAGCAAATGAACAAGGAGCAGGAGATATGGTGGCTGACGGTTGGACTATAATTTTTTCTTGATTTTTCTGACTTTATTTTGGCTGTGATCTAGGAAGTGAAATCCAGGTCCTTCTAAACC>rs10932693TTTATTTTGGCTGTGATCTAGGAAGTGAAATCCAGGTCCTTCTAAACCCCAATTTAACTGTGGCTCCTGAGGGAGATTTTCAGATCTCAAATGATCTGTAAGTTTAAGGGAGGATGATTGGTCCCTGTACACTCTCTGTGAGAGTTCCTTTGGAATACTGGTTTCAGAATGTACAGCCACACAGGTAACTGGATTAGGGA[C/G]GGCCAGTGGTTTTTTATGAATGCTATTGAAGACACTGAATGGAAGCAATTCTCACCAGAACTCTTTTTGCTGTCATCTTTCAGGGGCTAAGTTGACACTAGAACCAATCAATGATCCCTGAACTGGGAGAAATGGGTGGCCTTGGCTGTGATTTTTGGTTGTGCTGCACATTTCAAGATGACAATATTGTTTTAAATTA>rs17778427TCATCCTGTTATCCATAATGAAGGAAGATTTTAGGATATTCCAGCTTAGATCCAGGTGTCCCCAGCTTCTATACTCACTCTGAAGAAGTGTACTTTATCTACTCTTTTTACACCATTTATCCCATTTTGGCCATTTCTGAAAGGAAGATCCTAGAAGCCAGGCCTCTTGGAAGAAGTTGGAGCTACAGCATTGATAGGAA[A/T]ACCTGACACCTAGAAAGGCAAGTCAGTTCTTCCCATGCAGTGGCTTTGGGGACTGTAATTTAACAAAGCTCTTTTTTACTTGTGTAAAGTGATCTCCATTCCACTTTTTTCTTGCACTGATTCTAATTAAGTGGAAGCAATTGTTATCATCATTTAGGATTATAGTTAAAATACCCCTCAAATTGTTTCCATTTGGAAT>rs17835044AAATATTTCTCTTGGTCACTTGAGTCTAGCATCTAAGTCATATAATGCTATTATAGCCTTGTTTTGCTTTTGATTTAGGTCATATCTTCTTTTTCTGATCTTTCTTAAAGTGAAGGGACCATTTGCTATGCTCACAAAAATTCTCAAGGCTGGAACTACAGCATGCTCTGGTTTCTAAGCCATACACATCCAGGTAGAAG[G/T]GTCAATTTAATTGCCAATGATCTCAGCCTTTTCTAACACTGTTCCTTAAGTTTCTTTGGCACTGCATGGCAAGCAACTGAGTCATGCATGAAAATTTCTCTTCTAGACAACCCATACCTACAGAGGGAGGATTTGGTTTACTGCAGATGCTGAGTGCTTCTGATGGCACACATTCCTTCTTATTAATATCCCCCTGGCC>rs7562029GAACAGTCAGCATTGTCTCCGCTTCCGCTCCACCCTGCAGTTCTGAGCTGAACAGATAATTTATCTGTGGCACAACAAAGTATATGACTTGGAAGAATGTTAAAGATCAAGTCCACCTTCTCCTTGTATTATATGGCTCTGAGAGCCAGAGAGGGGAGGTGACCTTCCCAGAATGTGAATGTGGTAGAGCCTAGCTTACA[A/G]TTCATGTCCAACTTAGGTGTGAAGTTCTATGAGACTATGCTGCCCTCTGCCTCACAATGCTTTCTCCCATGGGAGAGGAGGCTCAGAGGTACAAAGCAGCTGCAGAAAGACTCTCTCAAGCTATTGACTCTTGGATGACAACAATTAATGTTCAACTTGGCTTTACCCCCAACATGCACTGCACAGATGCCTGCAGGTC>rs13000023TGGCTCTGAGAGCCAGAGAGGGGAGGTGACCTTCCCAGAATGTGAATGTGGTAGAGCCTAGCTTACAATTCATGTCCAACTTAGGTGTGAAGTTCTATGAGACTATGCTGCCCTCTGCCTCACAATGCTTTCTCCCATGGGAGAGGAGGCTCAGAGGTACAAAGCAGCTGCAGAAAGACTCTCTCAAGCTATTGACTCTT[A/G]GATGACAACAATTAATGTTCAACTTGGCTTTACCCCCAACATGCACTGCACAGATGCCTGCAGGTCTACAATGCCGAGACCAAGTTTGGGGGGCATTTCCGCAGCTCTGTCTATTGTCCTCCTTTCCTCTTCTGTGGTCATTCTTCCCAAGGGATAGGCCTAGTCCAGGGTGGAGAAAAACAATTCTTGGTGGTAGGGG>rs735361GGTTTATAAGGCAACTCTTAGCTTGACCCACTCTACTCCTCCATCAAAATAAAGAAATAAATAAAGTTTTCAAACTAAAGAGCATTAAAGAATGATAACTTTTCTTTTTCTTGGTACTATCTATTGACCTATACCTGGTTTTCACTGTAACACATTTGTGGTATGAAAAATGACAATATGATGTCAGAGAAAATGAGAGA[C/G]ACATTTTAGAATTTATCAGAATGTGACTATGGTCACTTAAAGTCCAACTTTCTCATGTGGGTTTCAGCCTGTGCTGGAAACAAATAGCCTCTCTTACCTCTAAAGTACTTGGTTCTGTGCTCAAAGTGGCATATTAAGTTCTGCTGATTACATCAGAATTTGGATGGTGTCTCAGGATCTCAGTTTCCTATCAGTGGAA>rs13409592TTAGAATAAGACTTCCCTAAGCAAATCAATGTGATGATTGATACAAACAGCCATCACTGGGGCCTCCTCTATTTCCAATCTCTTCCTCAGTTTCCCAGTTCTTTCAGAACCTCACTGGGAAGTTCAGGGATATATGCCTGCAGGCTGGCCTGGCGCAGATGGATGATGAAGGGTCCTGCCTTGAGTGTAGGGTAGAGTGA[C/T]TCTGAGTGCTTTCCAACAGACTGTAAATTAAAGACACTCCAAAAAGCCCCTGGTGGGGATAGATGGGGAGAAGGGGTATCACTAAGTCTTCATCTTTTCTTCTAGGGCCAGGGTCAGTGGTTCAAATAAACATGGTGCCCCACAGAGATGGCCTGTGGCCAAGTAGCTCTCAGTGGGTTGACTCAAAGTCACCTGGACA>rs2287289GATCCGGGATCTGGTGATCCTCGGCAGGACAACTCACCATTCTGTTCGGTTGCCCGCTTGCCTCCTCCCGCTGGCTCCAGCTTCTGTGCCTACAATGAAGGCTGTGCCCATTCCCTCACGTGCCCGCCGTGGCCTGACACCTTCCTGGGCCCACCCTAACACATTCCTCCGTTGCTTTTAACGACTGTTTACAGCTCGCT[A/T]CCTCTAGGACGTGGCTTCTGATGAAAACTGTCCAGACGCTCTGCCTCCGGTGTAATTCAGAGCCCAGCTCTCCTCCTTAAAATTCTTTTACGCTATTTTCCACAAGCATGTGCTTCTGTTGGCAGTGCCATAAGTGTGATTGATCTTTACCATAAGTTCCTTGAACTTTGCTGTGACCTGGATGCTAAGGTGGCGGGAG>rs12329133AAAGTCCACGGGAGACACAGCTTCAGCCACCACCGGGGCTGCGACCTGTCCTCAGGATCCTCCTCAGCCCCCTCCAGGAGTCCTCAGCTTTCTGCTTTTAGCCCCAAACCCAGATTCACTTTCCCAGGCCATTCACCGTCTGAGGCAGCCCAGTCCGCTTTGTCCTTCCTCCTTCCCGAAGGCTCTCAGCCCCTGGGCAG[C/T]ATCAGAATTTCACTTTGATCTCCTTTTCCCTGGGAGCCAGAATAGCTTAGTCTCTTCAAAAGGAGAGTTAGAAAGTGTGCCGTTCATCTAATAAAAATTAACTCCTGAGAGTTATCCAATCCCAATACAGGTCATTTCGCTGGAGGCTACCCCGACTAGGAAACACATTTTAGGACATCAGCAGAGGTAAAGATGAGAG>rs13011060TAAATTTCAGCACATGCTATATAGTTTTCAGGATTAGTCCCTCTCTAGGTATTCATCTGGGGCTGGCGCCTCCTTGGCTGGCAGGGGCTGGTGATCGGGACTCCCCAGCGAGACAGATTGCACCCAGAGCAGTGAGGCCCCGAGCGCTTCCTGGAGCCTGGGGAAGATGGCATTCATTTTTAAAGTCCATTTATTGTGCA[A/G]TTGTTGAAAGTGGGACACAGAAATTTGGACTGATATGCCTAGGCCACATGACTACTGATTGGGCCAGGGTAAATGCAGTCTTTTTGTTGATGGAGAAGGTCTTTTCTGGGCCCAGCACAAAGCAATGGATCTTCAGTCTTAAGAAATGCATTGAAAACCATCCTTGTGCAGTTTGGGGTCCCTGGTAGGCCAAGAGCTG>rs13011326ATATGCCTAGGCCACATGACTACTGATTGGGCCAGGGTAAATGCAGTCTTTTTGTTGATGGAGAAGGTCTTTTCTGGGCCCAGCACAAAGCAATGGATCTTCAGTCTTAAGAAATGCATTGAAAACCATCCTTGTGCAGTTTGGGGTCCCTGGTAGGCCAAGAGCTGGAAAGGCCCTTAGACTCTGAGTGCTGTAGCCCC[C/T]CTTCTAGGTGATGGTCAAAACTTGAAAACGGCTCTAGACTCTGGACAGAAATGCATGAGAATTGAGTGTTCAAAGCTTGGTGCTTTGACTTCTTTTAACTTTCTGTAGACTGAAATATGAATAAGAGGAAGGCATGAGGCCCCTCTCAGTTTATGGAGCCATAGCTCCAAACCTCCCACTTTCCAACCCAGCAACCCTG>rs4674132AGAAATGCATTGAAAACCATCCTTGTGCAGTTTGGGGTCCCTGGTAGGCCAAGAGCTGGAAAGGCCCTTAGACTCTGAGTGCTGTAGCCCCCCTTCTAGGTGATGGTCAAAACTTGAAAACGGCTCTAGACTCTGGACAGAAATGCATGAGAATTGAGTGTTCAAAGCTTGGTGCTTTGACTTCTTTTAACTTTCTGTAG[A/G]CTGAAATATGAATAAGAGGAAGGCATGAGGCCCCTCTCAGTTTATGGAGCCATAGCTCCAAACCTCCCACTTTCCAACCCAGCAACCCTGTGTGTCCTAGGAATTGTAGCGGGTGTCCCAGAATGCAAAAATCACTCTGCTAGAACTGGAAAAGGAGACGCCTGCCTTTTCTAGCACGATCTTTAGTAAATAGATTCAG表28.rs3803662的侧翼序列和相关的HapMap SNP标记,其中r2>0.2>rs3803662TTTTATTGTTCTATGGTTATTAAAAAATAACATGTCATATAAATTAAGCCTAGAAACATGGATGTTTATCAAAGAAAGGATTGTCATCCAAAGCACCAACTATGAGAGATATCTATGTGCAATGGTATATAGATCTGTCATAGAAGGGTTTAATTATATCTGCCTAATGATTTTCTCTCCTTAATGCCTCTATAGCTGTC[C/T]CTTAGCGAAGAATAAAACTGTGGACTGACCCCCACCCATTTGCGAAGAAAGTACTGGGTCTTCAGCTTTCATTGTTCAGCCGGTGGTCTTTGTGGACAACACCAGGGGCCCCTCCTGCTGAAGACTGTCTGGACTTCCTGATTTTCACTCCTGTATAAACCCCCTCCCCCATTACTACCTTTGTCTCCTTGGGGAAAAA>rs4784220AGAGAATTACTAATATTTTCTTCTCCAACCTTAATGCTCACTCCCTGAGCTATGTGGATTATACTAGTGAAAGTACTGCCTTAACCCACTAATGTAAACAGATTCCTTTTAAGAAGCCTCCCTATCGAGAATGGTCTGTAAGAGACAACCATGTCAACAAGTAAAGTTCCTTCTGCCTTCCCTCCTGGGGTGGGCTAAGA[C/T]GGACCCTTCTCACCATTCCCAATTACCTGCAGGAAGGCAGCAACAGAATAGAGAAGGAGGGTAACACAGTTTCCTGTACTTTAAATACCTCCCTGCCTCCGCAAGTAAAACTTGAGCCATGCCAATGAGGGAAAAAGTGGCCGCGATTTCCCAGGTGGCTTAGTAATACACAGTTTTCTGACACACTGCAACTCCATTC>rs12598982CACTACCAAATAATATTGCTTCTTGCATTAAGTATAGCATTGGTTTGCTAGAATAATCCTAACAATGACAATGCAATGTACTTTAAATTGGGGTCAAAAAACTTTTTTCTTAAAGTACCAGATAGTCAAGCTTTTAAGCTCTATGGGTCATCCACAGACACACTGCAACTATACAAACTATATCACCCCTGTTGCAACTA[C/T]ACGAAAAGCAGGAAAGCAACCACAGAAGACAGACAATACATAAACAAATGAGTATGACTGTGTTCCAATAACATTTTATTAATAAAAACAGGCAACTGGCCCATGGGTGGTAATTTGCTGAAACTTGGTTTAAATTATTATTAGTATCTACCTTTTTTTAAAAGATGATGTTTTTTAGGGTCTTTCCATCATGAAAATT>rs4784222TAATGATACTATAAAAACACCCAGCATAACGCCAGCATAAGGATGTGAATGAATGAGCAAATGAAAGGAGGGAGGGCAATGGCAAAATTTTACCTTGGTTTCCAAGCTAAAGTATAACCTGAGTTTTTTAATGCTTTACAAAAAGGAAAGGCAATCAGAACCATAATTAATATTTAAGCTGTACTGACAGGTTTTCCAGG[C/G]AAAATTCTATAGAACTTGTTATTCTCCAACTTCCAAAAATAAGCAATAAATTTTTTTTAAAGAGCTGTTATTTTAAGACTTTATTTGAACCAAAGAATGTGTTTATGGTAACAACATACATGTTGTAAATTAATCAGTTTCAATGTTATAAAATAATACTTCCAAGAATAAATGTATCATATAATCTATGTACCTCATG>rs17271951TCATTGTTTGTAAAATCCAATTGTCATACTCTGGTATTTGTTCTCCAAAAGAATCATCACTTTCATATTCACTACAGCATGAGATGAGATATTTAATAAATAATAGGACATCATAATCCAGGGATTAAGTAGTTTCTTTTAGCAAAATTTAATATGAGGGTAGCATATGCCAGCCGTTCCTAGTTGAGCAACAATTTCTG[C/T]GTTGGGAGAGGATAACAAAGCCAAGTATTTTCCCATAAGAAGTTCACACTCTAAAAGGCCAGGCGCGGTGGCTCACACCTATAATCCCAGCACTTTGGGTGGCTGAGGCAGGCGGATCACTAGGTCAGGAGATCGAGACCATCCTGGCTAAGACGGTGAAACCCCGTCTCTACTAAAAATACAAAAAAATTAGCCAGGC>rs9933638GGAATAATTACAGATGATGCTAGGCAATATCACTAGATTGGGTTTTCATGAAGCTCGTGACTGGATTTTGCCACAAAAATCACTAACTGCTTTGGCTTCCAGAGAATGGCCTCATGGATAAGCCCCAAGTTCCAAAAACTACAAAATGTCAAAATCACATTCAACTAATTAATAATTTTATGTCACAATAAGAATTAGGA[A/G]TCTCTAGAAGGCTGGGTACAGTAGCTCATGTCTGTGATCCCAGCACTTTGGGAGATCGAGGCAGGCAGATCACTTAAGCCCAGCAGTTCAAGACCAGCCTGGGCAACATAGGGAGACCCCGTCCTACAAAAAATATAAAAATCAGCTGGGCATGGTGGCACATGCCTGTAGTCCCAGCTACCCAGGAGGCTGAGGTGGG>rs9302556AACACATAAGCCATTTTTTCCAAAGCTAGACAGCTTTTCTCTATCCACGTTCTTTCAAATATTTTACCTAAGACAGAGAATCTCATATTAAATTCAATTTCACACTTGCCAATCACACACGCCCACTCACAATTCCTCCAGATGATGCAATGTGGCCTAATGTGTATGCTTATGTATGTACATGTGCACACACAAACAGG[A/C]ATAATGTTTAAATACATATAAACACATTCATTGCTAGGTATTGGTTAAAACAAACAGGCTTACAGCATACCAACTTATTAAACATAATGATTGATATTAGTAGTTTCATTAATGTAATTAACCTTTAGATTTGAATTATCAAGTTCAAAGTCTAAGACCGAGAGCAGTGGTTCTCAGGCCGGTACAATAATGGCAAGTC>rs7190749CAGTCCTGCCCCTACCAGAAACCAGAGATATTTGCTGCTGGTAATAATGAGGAGGGGGTTTCTAAGTACAAGATCAGCTCTATTCTTTCATTCCCTGGAAATCTGCCCTCGCCTCTGATACCTCAAAAAATATCTGTTGCATTTCCAAGGGAAAGAACAATGATATAAGCCTTGCTGTTAAAAAAAAAAAAAAAAATGCC[A/G]CTACTTACAAGATAAAAGGCAAGGTGTTTTGTTTTTTTCCCCTTTCTCTTAGACTAGGCATGAATAATCTCAAAATATTTGTTTGTCAATAAAGTGATTAAAATAAAGTGATAGACAAGACATAATGATTAGAGAAATGAATCAAAGTAATATTTGGGACCAGGGTCTTACAAATCTAGAGTAAGTATGTTGAGCAGAA>rs12443621AGATCAAGATGTCTAGCATAATTTGAAAGTATGTTTCTATTTGACAGAAACCTTGGCTTGGAAAAGTTAAACTCTAAATATTTGTACAGAAAGAAGTATTCTGGGTTTCATTCATTAAAAGTCATTGACCACTGCAGAAAAGGGAGAGCAAGAGATTTACATATATTTTTCTTGACGTTTTATATGCATTAGGCCTGGCA[A/G]TGAACTTGAGGTAGGTATTACTATCTCCTTATTTCTAAGGGAATCAGAATACTGTAAACAAAGACATGGAGCTAAATAATGGAGTCAAATCCTGGCTTACTAGGCTCCACATCCATGTTGCTCCACTTATCAGACGGCCACCCAAACATACAAGTTTAACAAATTCCAAATTATTGGGGCCTAAATAGACACTTTTTTG>rs9933556CATGGAGCTAAATAATGGAGTCAAATCCTGGCTTACTAGGCTCCACATCCATGTTGCTCCACTTATCAGACGGCCACCCAAACATACAAGTTTAACAAATTCCAAATTATTGGGGCCTAAATAGACACTTTTTTGTTTCAATATTGCCCTTCTTCCCTTGTATTCTGAATATCATGTCAACCATGAATCATAAGCCAATG[C/T]TTACAAATTTAACTTCACATTATGAGTTTTGAGCCCAACTGATGCCTAACCACTAAACCATTCATATAACACACTGAAAAGAAGCCATTTAAGAAATGAGAAAAATAGGTATTGTTTTCTCTGTATGGCTGTAAAAGCTGAGATAAGAACATTTTGGCAAGTTCAATAGAGCCGAAAGGCTTGTGAAGGCTATGGGAGG>rs1362546TCCACTATTTGCACTAGCATTAATCAACATCCAAAAAGTGTACAAATTATTTTATCTTTATAATCAATCTTCTGAAATGCTAACTTGAAAATATAAACAGCACAATTACTTTTTTCTCTTTTCTTTCCCATTTGAAATGTGTGCTTGTGTGTGTGTGTGTGTGTGTATCTGAATCTGTACATATAAATCAAATACACACA[C/T]ATATACTTGTTTTAAAAAAATCCTCAAAGAATCAATCACATATTACAGAACTGAAGGAATATTGGAGTTCATCTGGTCCAAAGTGTTGGTATTGTAAAATCACTTTCAAATTTCACAGTTATCCAAATGGTAATGAATATTAATACCTAAGAAAATCAATCAAAGATTAACATTAAGACATTAGATTTTAAAAATCATT>rs1075367TTTTTAGCTACAAGGATATGTTTTTAAACCATATTGAATTACATAGAAAGCATTTCCATTTTCCTTTCAGGCTTTCTTATTACATCAGTGAGAAAATCTCAGTTTGGTGCGAATATGTCTTTAACACCTAATACTTGCTAATCTCTTTTTTAGCAGAGAGATTGAGACACATTATAGGGGAAGAGAGAGAGAGGGAGAGA[C/T]GGAGGAGATCATACAGGACCCAGTTACAACCCTTCTGTAGCTTTGGTTTGCTAGAATTAAATAGATTATTTTGTATTTATTGTATTTATTTTGATAGTTATGTGCTATTTATAGAAAGGAATACCAGTTTTCCATGTATGAAATAAAGTGTCCTTTTGTTAACAAAAAAGCATATTAATTTTTATGCAAATGCATGAAT>rs8046979CAGCTTCAGTGGATGCAAGTATGATCTCTCCGATGATCCTGGGTCCCTTCAGAGGCCTTTGGATGGTTCTGAGCAGTAGAACTCAAACTGTGATCCCAGGAAGGCAGCATCAGCATCACCTAGCAACTTGTTAGAAATGCAAATTCTTGGGCCCTACCCCAGACCTACTGAATCAGAAACTCTGGGTGTGGAGCGGCAAC[A/G]TGGATTCTAACAAGGCGTTCAGGTGACTCTCATGCTCAGTGAAGTTTGAAAAGCCTGTGGGTAACGAGCACAGTCTCTGGAACCTGCCTGTTGATTTGAAGGAATCCCAGATCAATCACCTCCTCACCTGAGACTTTGAACAAGTTATTTAATTTCAGCCATGCTTCCATTTCCGTTTCTGTTAACTGGGACATTAATA>rs1420529ATGAACTCTTCAGTGCCCTCCCCTTCCCACAGAGGGCTGAAAGGGACTCACTCTTGTTACAAGAACACGGCCACTCCTCCCTCTCTTCCTCTTCCCAGTCCATCCCTCACCCCAGTTTCAGCCACCATCCAAAAAGAAATCGCAGCATGGCCCTTGAAGCACATTGAGCTTAAAAGTGCCTAGAAGATAAAGCCTAAACT[G/T]CAGCACGACAGGCAAGACCTTTCAAAATCTGGCCTCGACCATCCTCTCTGGGTCTCCTTTCTGAGAACCCCTATTTTCTGCCTTTTCACAACTCCACACTTATGCATGATGCTGTTTTCCCTCCCTGGCTCACCCACCCCAGTGTTCTTCTTCTGTGATGGTAACCTCCCCAGAAAGTCTCTTGAGCTAGAGTGATCAT>rs11642645CTCGACCATCCTCTCTGGGTCTCCTTTCTGAGAACCCCTATTTTCTGCCTTTTCACAACTCCACACTTATGCATGATGCTGTTTTCCCTCCCTGGCTCACCCACCCCAGTGTTCTTCTTCTGTGATGGTAACCTCCCCAGAAAGTCTCTTGAGCTAGAGTGATCATTATTAAATTAAAAAAAAAAAAATCCTACTTTGTT[A/C]TATTCTGATTTCAAAAACCTGAAAGGCAAGATATTTGAGGGAAAAAAGAGAATATTGTTTTGTTGCTTTTTAAAAAATAAATTTGCAGGTCCTGACAATCCCGTGCTTTGTGTGTGCTGATCACACTGCAATCTAATCAGGTACAGTAAATAAAATGACTTGAGAACCTTTCTGACGAATGCAAAGGCTGATGATATTT>rs1420533TGTGATTTTTAAAAGGTAAGTAACAGGTGAATCAAAGCAAGGAAAAAGTAAATTTGAGAAAATAATAAAGCCTAGATGGCCAGCACACAGGAATGCATATCCTACTGCCCTAGACAGCTACTAAATGGGTTTCCTGTTTGACTCCAAGCTTCTTGGCCATCAATGCAAAGAAAGAACAAGAATGGTAAGATTAATGCCCA[A/G]TAAGATACAGCGAAGTGGATTTTTTTCAGTTCTTCTTGATATAGTAACCTAAGAAGATTCTCTGTAAATCATCATTTAAAAAGACACCATGAGGTGTAATGAGCTATACATTGTAAATAGAACTTTTTAAAAAAAATGATGTTCACGAAACTATTACTCATAATCCTCTCAATACAAAGTGAAGCCTTAATCAGTGTGC>rs1362548TTTTAAAAAAAATGATGTTCACGAAACTATTACTCATAATCCTCTCAATACAAAGTGAAGCCTTAATCAGTGTGCAATTCAATAAAGCAGAGAGGGCCTGTGAAGGCAACTGTGAAGTGGGGTGCCACATAATATGCCATCGTGAGCATTCAGCTCTCTCACAAGTCTGGCAGAAATCTCTTATCAAATTAGGTTATCTG[C/G]ATGAACGGAAGGAAGCAAGGCATCTTCTTCATGCCATTCTCCTTAGATATATTATTTCTTCCAACAGATTTTATTAACACAAACTGGGCAGCAGGGACTTCAAGAAGGACAAAAATCCTGTGTCAAAACCATTACATATGTTGGCAACATTTATCATCAGGAAAAGCGTCCCAGGAAGTTGAATTCTAATGTATGTGTG>rs2193094CTGGGCCTGGACTCAAGGGTTCTTGTGTACTTTCCTGCTGTCCGAAATACTGCCATCATGAACAAGCCCAGGCTGGCGTGCTGGAGGTGAAAGATACATGCCAGAGAACTGAGGGACCCCGGTGGACAGCCAGCCAACCTCCTGAAGCAAACCCTCCCTGCCAATCTGCAGTTGACTGCAAACACATAAGAGACCCAGAA[G/T]AGGATAAGCACTGCCCTTCTGAGCCCAACCTAAATTGCTGACATGCAGAATCAGAAACAAAATATGTGTTTTTGAAGTCACAAAGTTTAGAGGCGGTTTATCACTCGCGATAGATAACTGGTACAGACAACACGGGTCTGCCTAGAAAGTGAAAAACATACGAAGGCAAAACAGTAAGAGGTCAAGCTTTAGGAGGATA>rs4783780TCTCATATCCATAGAATATCCAGGTGACCTATAGGTTTCTTGAAGGCAGACCACATCCAATCTCAGCCTCAACAAGAAGGGCGTTCCTAATATAAACAATATTTATGATATTTACATTACATAAGCACAGGCTCATTTTGGTTTCCACAAAGAATAATAATAAACATAGACAATGGAAATCCTCAGAAATCTTCAAAATC[A/C]TCAAGCTTCACTCCAGTTAGCCGTTTCAATGGACTTTGCTTTCCTATCCTACACCCACATTCTCTCATTGTGACATCAGCACTTTGTTTTTCCTCCGAAGAACCACTGCTCCATACTCTTAGCTCCTGTGGCTTCCAAGAAGATGACAGTGTCCAGCTCCCCCACTGGCATGCCTACGTGGCTACGAGCCTGGGCATGG>rs3112581TTACATTCTCACAGCTCAGCCTCTTCAAGAGGGAGAGATTCTTTCTTGCATGTTTCAGCAGCTTTTCTGGATCAAGTCTCATTGGATAGACTTGGGTCCCATGCCCAGGCTCGTAGCCACGTAGGCATGCCAGTGGGGGAGCTGGACACTGTCATCTTCTTGGAAGCCACAGGAGCTAAGAGTATGGAGCAGTGGTTCTT[C/T]GGAGGAAAAACAAAGTGCTGATGTCACAATGAGAGAATGTGGGTGTAGGATAGGAAAGCAAAGTCCATTGAAACGGCTAACTGGAGTGAAGCTTGATGATTTTGAAGATTTCTGAGGATTTCCATTGTCTATGTTTATTATTATTCTTTGTGGAAACCAAAATGAGCCTGTGCTTATGTAATGTAAATATCATAAATAT>rs3112580TTTTTTTTTTTTTTTATCATATCAGCCAGGCTGTACTCAAGTAGTGGGAAGTTGTCCAGCAGCAGCTCCAAGTTACATTCTCACAGCTCAGCCTCTTCAAGAGGGAGAGATTCTTTCTTGCATGTTTCAGCAGCTTTTCTGGATCAAGTCTCATTGGATAGACTTGGGTCCCATGCCCAGGCTCGTAGCCACGTAGGCAT[A/G]CCAGTGGGGGAGCTGGACACTGTCATCTTCTTGGAAGCCACAGGAGCTAAGAGTATGGAGCAGTGGTTCTTCGGAGGAAAAACAAAGTGCTGATGTCACAATGAGAGAATGTGGGTGTAGGATAGGAAAGCAAAGTC CATTGAAACGGCTAACTGGAGTGAAGCTTGATGATTTTGAAGATTTCTGAGGATTTCCATTG>rs9931232TTGAATTAAGATTAAAGATAGAATGTTAATCATACAAGAAGGGCCATTTTCCAGGGCCTGGCATGTTTTACACAAGCATGAAACATATTTAAGAGAACATGGCCTCCCTGAGGAAGAGATTAAGGATACAAACCTAGGAAACAAAGAAAATAAAACGATCTACCTCAAAGGGATAAGATTAACCTGTGAGAAGCTCATGC[A/G]GACCTTAAATAAAAGCCTCTACTCCTTATATTTTTAAACAGGATTTTTCTTTTTTTTTTAGAGCACTAATTCCACCTTCAAAATATATTTGAGTTTGTAAGTATACTCAACAAAAATCCTGTCCTTTCTTATTAACCATACTCAAAACAGATTCTCTAAAATAGTTATGACACCATTAACATTTCATGAAATCCAAAAC>rs1123428CCTGGCTATATTTTATTTGAAGTTATTCTCCTACTTGCAACGACTTTTGAACCCACAAAACTCTTTCATCCATTCTCCACAGACACAGTACACTTTCATGAGCACTGACATTTGAAAAGGATCCATATACTCACAGAATGTAAAGATAATACACATGCATATAATTGATACAAAGGACTCTGGTCATTTGTTAAAGAGAG[A/T]AATGAATGAAACCCTATTATTCACGGTTTGTAAATAAATTTAAAGATAAGCGCTAACTTTCACTTGTTAAGCCTAGAGCCAAGAGTTCGGTGTTTCTTCTAAAGTTTCCCAGATGGTCATTAAAACAAGAGAGGGAAGAAACATACTTTCTTTGAAATCCATCATTTCCCATCCAGAAAGATAATACATGTCATCAAAA>rs3095604TCATTCACTGCTCTGGGAGAGAAAATGTCCCTATTTTCCTAAAAGGTCCTAGCTGATTAACTTCCCCACTCTACACTCACCCACCCCTCTTTATTTCTTTATCTTTCTTAAGCTCCATCTTTTTATTTAATTTTTTTTCTCATCGGCTTTATTGCTTTGAGTTAATCTGAGAGTTTGGCCTTCAGCCTTGGCGAAGGGAA[C/G]GGGCTTTATACTAAATGGGAACGTTGTGGAGAGGCCGTGAGATCTGCGCCCTCCCCAGTTTAGTTATCTGCCAGCTACTTTAACCAGAGTGGCGACATTCTGAAATATTTCCTATGACACTCGCTAACAGTTTCATCCCCTGGTCACACCTTGCTGGCCCAGGGCCTGAGCTTTTTCAGACAAGCATGACATGGGTTTT>rs4784227GAGTTGATCAGTAAATATTTGCTGAATGAAAGAATACATGAATGAAAAGTCAGAGCCCTATAGGTCAGCATGGACGGCGGTAAAGGAACCTGGCTGAGCCTGAAAGAGAATGTGATCTAAGATTAAATCCAGGATATGCTGGTAAATGTTTAACAGCCAACTCTTTGGGGAGGAAAAAAGTCCCAATTTGTAGTGTTTGC[C/T]GATTATTGTGATGTAAATACTCCCATCATGACCAATTTCAAGCTACCAACATGCTGACACTGAACTTGGAGTTGGAAGGAGATGAACAGGCATAATCAGGTCTCGTGAGATGGCCCAAGCCGGCCCCAGCACTCCACTGTTATATATGAGGCTAGAATTACTACATAACTGGAATAGCAACTTTCTGGACCATATGCCT>rs12922061ACTTCATTTTGAGGAAAAGAACAGTTACTACCATTCATTCATTCACTCATCACACCAATATTACTGAATCCTACCCTGGACCAGCATTGTTATGGTAGATCTTGATAATATAGTGACAGACAATACCATCCTTCCCACCATTTACATAGTAGACTGCCTGGGGCTCATAGTCTACTCACATCTCAGCACATGAGATAGTC[C/T]CATTATCACATTCTCTTCTATCTCTCTCACAGGCACTCACTCACCAGCCATGGAGAACTTAATGGGCATTAGGTTCTTAATCCTGCTGGGTATAATTGGAGATAACCACCCTGGCTGACTGAGCACTATACCAGGCTACTCATGGATGATTTGGTTATTAGACGTAATCAGAGTGGCCCTTGTATGCTAAAAAGGAGAC表29.多种族人群:>rs4784227GTAAATATTTGCTGAATGAAAGAATACATGAATGAAAAGTCAGAGCCCTATAGGTCAGCATGGACGGCGGTAAAGGAACCTGGCTGAGCCTGAAAGAGAATGTGATCTAAGATTAAATCCAGGATATGCTGGTAAATGTTTAACAGCCAACTCTTTGGGGAGGAAAAAAGTCCCAATTTGTAGTGTTTGC[C/T]GATTATTGTGATGTAAATACTCCCATCATGACCAATTTCAAGCTACCAACATGCTGACACTGAACTTGGAGTTGGAAGGAGATGAACAGGCATAATCAGGTCTCGTGAGATGGCCCAAGCCGGCCCCAGCACTCCACTGTTATATATGAGGCTAGAATTACTACATAACTGGAATAGCAACTTTCTGGAC>rs17271951TAAAATCCAATTGTCATACTCTGGTATTTGTTCTCCAAAAGAATCATCACTTTCATATTCACTACAGCATGAGATGAGATATTTAATAAATAATAGGACATCATAATCCAGGGATTAAGTAGTTTCTTTTAGCAAAATTTAATATGAGGGTAGCATATGCCAGCCGTTCCTAGTTGAGCAACAATTTCTG[C/T]GTTGGGAGAGGATAACAAAGCCAAGTATTTTCCCATAAGAAGTTCACACTCTAAAAGGCCAGGCGCGGTGGCTCACACCTATAATCCCAGCACTTTGGGTGGCTGAGGCAGGCGGATCACTAGGTCAGGAGATCGAGACCATCCTGGCTAAGACGGTGAAACCCCGTCTCTACTAAAAATACAAAAAAAT
序列表
 
<110>解码遗传学私营有限责任公司(deCODE Genetics ehf)
 
<120>作为用于乳腺癌风险评估、诊断、预后和治疗的标记的chr2和chr16的遗传性变型
(GENETIC VARIANTS ON CHR2 AND CHR16 AS MARKERS FOR USE IN BREASTCANCER RISK ASSESSMENT,DIAGNOSIS,PROGNOSIS AND TREATMENT)
 
<130>SCT093724-10
 
<160>6
 
<170>PatentIn version 3.5
 
<210>1
<211>600
<212>DNA
<213>Homo sapiens
 
<400>1
caggataaga ttatttctga ggctgcttcc atcagtggtt ctgtgagctg gcccatgtat     60
tcagccagtc agtaggccat caagcatgca tctacgcaag gcactagaag ggttacatac    120
aatgggaaac tgaggcccag aaggaggaaa gatgaagtgc ccaaagttaa ggagataaaa    180
gcagaagtgc aggtaagaga aggagtattc atattactgc aggaatccaa attctacaag    240
aacatacgct tgttctttaa agggagccct cgctttaagc attatttgcc gatcaatacc    300
mattaataat tacaggacat gggcaaatat tctagcaaag gtcctgaggt cttcctagat    360
gtgcccaaaa taacaaggac tccccccgca ggtggcacca aaagtcggag gatgtgttgg    420
aagctgacct tccccacctg tccctgcctc acccacagtc acccacccct ctaggatgta    480
atggtgaatc attcaacaca tgggccacct tgggaagtcg cttaacctct ctcccttttc    540
acgttataaa atgggcatag tcattacaca aatgcataaa tcaacctcaa ttttctcatc    600
 
<210>2
<211>600
<212>DNA
<213>Homo sapiens
 
<400>2
ctgacatagc cgcctgtgca ggtttttggg accaggtctg ccatctgtat tcccaggctg     60
ggctggagca cctgaggcta ctatggttac agaaaggaac ctggcatccg aaggtatagg    120
ctcaaatccc agctctcatg attgctagct ttgaggtttc aggttcattt cttaagtgct    180
ctgagctttg gtgccctcct cttcaaaatg ggaatgagga gcatgtctag ctccctgttt    240
tgttgcagtg aatagctaca tgaagaacag ctaaaccaga acagaaagaa ggcaaatgga    300
rgctacagaa accaaggatt tccttgttga atcgaatctt ccttcaatct tccttcacca    360
cactagtgga tctccctgtg ggagggatgt tgagagtgct ccgtgttttt tttgtttttt    420
tttttttttt ttttgtgatg gagtctcact ctgtcaccca gactggaatg cagtggtgcg    480
atctcggctc actgcaacct ctgcctccca ggttcaagtg attctcctgc ctcagcttcc    540
caagtagcca ggactacagg catatgccat cacacccagc taatttttgt atttttagta    600
 
<210>3
<211>600
<212>DNA
<213>Homo sapiens
 
<400>3
gctagtcctt ggctgttctg tgatcaaatg caattgtttc ccatttctta agaaacagaa     60
tctttattag actcagttct tttcttggtt atttttacaa ttttattgtt ctatggttat    120
taaaaaataa catgtcatat aaattaagcc tagaaacatg gatgtttatc aaagaaagga    180
ttgtcatcca aagcaccaac tatgagagat atctatgtgc aatggtatat agatctgtca    240
tagaagggtt taattatatc tgcctaatga ttttctctcc ttaatgcctc tatagctgtc    300
ycttagcgaa gaataaaact gtggactgac ccccacccat ttgcgaagaa agtactgggt    360
cttcagcttt cattgttcag ccggtggtct ttgtggacaa caccaggggc ccctcctgct    420
gaagactgtc tggacttcct gattttcact cctgtataaa ccccctcccc cattactacc    480
tttgtctcct tggggaaaaa aaatgttttt cacttaagca aaataataac tacccagtat    540
ttgtttctgg agtgaaattg taaacttcat tgtacattct tcctggcttt gatgcttatc    600
 
<210>4
<211>94080
<212>DNA
<213>Homo sapiens
 
<400>4
ggttgacaca aacacgggaa gattctgcag gaaacacaag gcagccacgg cctctgtccc     60
tgagaggagc agtgagggag ccgcagggct gggctgcggc gtgacactag ggacgtgggg    120
ggaatgcaag tgggtccaga cctgggggcc accagtgcag gagcaagggc aggccggcca    180
tcagagctgg gcggggaggg gggcgctgag cttggcgtgg gagtttcccc aacggactgt    240
gtcttccagg gaccctcgcc cctcatgccc ctctgcgtcc tgaagggagg aggcaccacc    300
cctctgtggc atctgctttt tagggctgac gatggaacaa gctcatggac aggagtgaag    360
cccctggcac atagcaggtg ccacagaagg gtggtgaagt ctgccctaga tcagagatca    420
ttcagggggt ctgttaactt ggatgaagaa gaaatacact cttatcacta acatcaggaa    480
ggtaagcaag gaaccacaca tagaattgac aataagtgtg actttgccac caagaagaat    540
cacaaagttt tattttattt tattttattt tattttactt taagttctgg gatacatgtg    600
cagaatgtgc aggtttgtta cataggtata cttgtgccat ggtggtttgc tgcacccatc    660
aacccgttat ctaggtttta agccccgcac gcattaggta tttgtcctaa tgctctcctt    720
cccctcgctc cccaccccca aacaggcccc ggtgtgtgat gttcccctcc ctgtgtccat    780
gtgttctcat tgttcaactc ccacttatga gtgagaacat gtggtgttta gttttctgtt    840
cctgagaatc atagagtttt catagcccag tacaataatc acagatacat gacatagagt    900
tgtgtgacat gtagacccca atagtccggt taatgggatg ctttagttaa aaagtacata    960
gattactgta ttataagttt atgttttagg atattttgat gattactttt tagaaatagt    1020
ttcctttgta acctttattt tacttaatgc atatgaaaga atcattcaga ggaggggtcc    1080
atggcttcac caagatgaaa caggtcattg gcatgaaaaa ggttaaaacg ctgtgccctg    1140
gaaccaggag tttatgatcc aggcctgcag catgctgtat gaccttggcc acataacttc    1200
attgtgcctc agttgcctca actataaaat ggggataata aacctgtgac atatgatgct    1260
tggggggtta aatgtgacaa aagtcttagc actctgtgtg ccatacagtg agggccccag    1320
catgggcatt gatgcaccgt cttgattcct cctgcctttc ccaggtacag ggagcttccc    1380
cagcctgcct gcatctgaga agattccacc agagaaacag aaccaatagg agacatatat    1440
taagagttgt gttgcggcca ggcctggtgg cccatgcctg taatcccttt gggattacac    1500
tttgggatta cagcactttg ggaggccaaa gcgggcctat cacctgagtt caggagttcg    1560
agaccagcct gaccaacgtg gagaaacccc gtccctacta aaaatacaaa attagccagg    1620
cgtggtggca ggcatctgta atcccagcta ctcgggaggc tgaggcagga gaatcacttg    1680
aacttgggag gcggaggttg cagtgagctg agatggtgcc attgcactcc agtctgggca    1740
acaagagcaa aactccatct caaaaaaaaa aaagagagag atgtgttgca agaaatcggc    1800
ttacgtgacc gtgggggctg gatccatagc gcaggctctc aggaggggca gtccagaact    1860
ctcaggctga tgctgcaggc cacaggtggg atttcttctc aagaaagcct cagctctgct    1920
cctaaggcct ttcaactgat tgactcatgc ccactcagat tattgagggc tatctccttt    1980
atttaaggtt aaccggccca gtgcagtggc tcacgcctat aatcccagta ttttggcagg    2040
aagattgctt gaggccagga gtttgagaca ggactggaca acagagcaag agcctcatct    2100
ctacaaaaca taaaaaaatt agcccggtgt ggtggcacac tcctatactc ctagctactc    2160
tggaggccaa gccgggagga tcacttgagc ccaaaagttc aaggctatac tcctagctac    2220
tctggaggcc aagcggggag gatcacttga gcccaaaagt tcaaggctgc agtcagctat    2280
gatcaagcca cttatactcc agcccagaaa acagagtgag accctgtctc taaaacaaca    2340
acaacaaaaa accccaacca attgtagata tcaactacat tgctgtggct tgaatgtctc    2400
ctccaaaact caatctgaaa cttaatccct aatttaatag tattggcagg tgacagggcc    2460
tttcagaggt agttgggtca tgtgggcatt catggattaa tgggttaata gattaatggg    2520
ttatcatggg agtagattag ctatcacaag agtgagtctg ttacaaaaat ccagcttggc    2580
tctctcttgt gagcccctcc ccatacgatg ccctgcactg accattagca agaaagcctt    2640
catcagatgg accccctcaa ccttggacat ctcaatcttc agaactctaa gaaataaatt    2700
tcttttcttt ataaattgcc cagtctctgg tattcagtta tagcaacaga aaatggacta    2760
agatacacat ctacgagata cctccacagc aactcctaga ttagtgttga tggaataact    2820
ggggattgta gcctagccaa gtcgacacct aagaccggcc ctcatgtcac ccaaggacaa    2880
gacagcgagg tcctgaagag tttcatgaag aggaggggaa ggagagagtg gggagctcaa    2940
tgtggacccc tcaattaatt tcccaagtgc tcaatgaggc ctgccccacc tctcatccag    3000
ctccttggcc aggccctgcc cccactcacc tctcttatgt gggacacgtg agcccctcca    3060
gtgtgccagg agcacatggg tacaggcaca catagagaat gccgtgtcca caggaaaccc    3120
agtgagcctg aagggccttg gcgtgccatt tacaggtcac tcacttgggc caggcctcac    3180
tagggatgcc agggtgaaca agacgtggcc agtgctcttg aagggctccc acctggtgga    3240
ggtagcagac aagtaagggg acaaaggccc ctcagaagta cacatctggt gggccgggcg    3300
cggtggctca catctgtaat cccagcactt tgggaggccg aagcaggcat cacttgaggt    3360
caggagttcg tgaccagcct ggccaacagg tgaaacccag tctctactaa aaatacaaaa    3420
attagccaga cgtggtggcg cgtggctgta atcccagcta ctcgggaagc tgaggcagga    3480
gaatcacttg aacccgggag gcggaatttg cagtgagccg agatcacgcc attgcactcc    3540
agcctggaca cagagcgaga ctccatctca aaaaactaaa aaaataaata ataaaaagta    3600
caaattaggt gtggttatcg cctggagagc caggagcatc cttgggaggg gacttgggga    3660
ggggtccgct gggctgctct agcccactct gggccagaat cgtgattcta attgcaggta    3720
ggctttaccc tatcaaagcc ccctgggctg gggactctgt gaagaagcaa gatgtgcttg    3780
aaacctccct ctctgctgaa aaatctagac aagctcctga ccggctgcat tgctgcttca    3840
gcccctcctc agggaagcgg gaggccctgg gtctctacgg gtgctctgtg aaagactgca    3900
gaggctggtg gggctgcatt cctgtctgtc tgcctaggac agtgcctact gacttctgac    3960
tgctgcccca tggtccaggg ctccaggtac accactgcaa tgtcactttg tgcttggggt    4020
tccaactaga caaaagcccc acgttgcaca gcccttgagc cgtcccgggt agcatgcccc    4080
ctggtggccg tgggcagtta ttaccgttaa tcctttcttg cccagatgcc tctagcgtag    4140
gccacagcag ccggccgggt tcgttgtgtc tggaaagacc agagaagggt tcccggagaa    4200
agaggccgtc tgatcggagt tttatgaacc agaggataaa gaaaggaagg gatttctggg    4260
cctcagaaaa ccacatgcca acgcatgggg gtattaagga taggggctct tgaacgccca    4320
ggctggtaaa atctagaacg gcagagggag gaggggtaat ttttctggtt ggtagaaata    4380
aagtggggat gaggaagagc acgaaagtct gtcggcaaac ctgaaagtgg gagcgagctt    4440
ttgtcaaatc cagggtcaac ctgagctctc attaattggg aaactggaga gtcagatcct    4500
ctaaagaaag tggaaatatt tgttctaaag aacccctgcc aggtccccgt ttacgtgact    4560
cataaagagg ccttcaggca gaaaggatcc cagtgcacca gtaacagaag ggctccagga    4620
ccagagggaa tggacaggga accaccaccc acaccaagca caggcccatt gtcggcatga    4680
ggagcctcgc ccctgcagat cacctcccag aggggagcgg atcagagatt aaattccaca    4740
cctttctaca aaatcatagc agtttgaaag tgccaagggg agtaggtgag gaggtttcga    4800
ggcatgtatg cagccgtttg gagacaccag ccatgtcgcc tgagttttct gatgtaatcc    4860
tcataacaac cattccagat ttaagtgatt agtcctgttt tacagatggg gaaactgaag    4920
ctcagagagg ttaagcaact tccccaaggt catacagtag ccaagtagca taagtggtat    4980
tcgaacccag ttctatttgg agccttcaca ggctttttgc tgcattccac aagagtctgt    5040
atattcagaa gcaagtcttc cacagccatc ataagtcatc ctcacagccg gctggcaggg    5100
agggaacatt gccactgtag ctgggatcat agatatcgtg gtctccattt gacggataag    5160
actgaggtct ggaagagagt cagtcagtct gtgtgataag cctgaaccac cctctccttc    5220
agttcctccc ctaacccaac atcctccggg tctggaagga cagtgtcttg agcaacttct    5280
tgcagctata cttctccagc taatagtcta gaaaaccgag cctggtcccg agtctcctcc    5340
tcggggtacg agccgagggc actgatgggg gtcaggaggt gctggctaaa agacggtggt    5400
gcaggtgccc ctggctttaa gcgcgcccag gttataaaaa gcttggttcc catgctggcc    5460
ctaattctcc atgcactgag taccttaggt cccttctctg ggtctgttgc tcccctgtaa    5520
aacaaggggg tgggagaaat gaccttcaag ctcaaacacc atatgtccac ctgggttggt    5580
atagcagatt gcattagttt gttaggactg ttttaacaaa tgccacagac tgagtggctt    5640
aaacaacaga catttattct ctcacagctc tggaggctgg aagtctgaga tcaaggcagt    5700
ggctggcagg gttgtttctc ctgaggcctc tctccttgta gccacccctc ttctccctgt    5760
gtcttcacat ggttgtccct gtgtgtgtgt gtctgtgtcc taatcacctc ttcttataag    5820
gacaccagtc acagaggatt accggccacc cataggactt cattttacct taattatctc    5880
tttaaagtct ccatctccaa attagtcaca ttctgaggta ctgggagtga ggacttaaac    5940
atacgaattt ggaggatagg acacaattca gcctataaca cagatagaag acactgctca    6000
ttttaaaaaa gaagtagcag gctgggcgca gtggcccata cctgtaatcg cagcactttg    6060
ggaggccgag gcgggaggat cacctgaggt caggagttcg agaccagcct ggccaacatg    6120
gtgaaacccc gcgtctacta aaaatacaaa aattagccga gcatggtggc atgctcctgt    6180
aatcccagct actcgggagg ctgaggcagg agaatcactt gaacctggga ggtggaggtt    6240
gcagtgagct gagatcgcac tgctgcactc cagcctgggt gacagagcaa gactccgtct    6300
caaaaaaaaa aaaaaaaaaa gaagtagcag tcccagccct ttaacagcga acttctgata    6360
catttaaaac agaatctgat tctcactttt tcttccaggc ccacttcaat gccactaatg    6420
aggcctatct gtctgcaatc tgatattaga ggccaaaaat aatctttcta tttgccactt    6480
actgggcacc aatgtcctac ctgacacatg ctggctcagg tgggggagga ggtacggtcc    6540
ctggccctag gaacgctcca tcttagaaag agacagaatg tgctggggtc agagtaaaaa    6600
gtgcatgggc ttcagcagca gatcccagca tggctaccac cagctggggg accttgggca    6660
agagccccct gtgagcctca gttttctcac ctggtcaatg ggactcacac tactgcggca    6720
cacattgtgc gcccacattg tctcggtgca caggggccac ccttcaaact gccagggtct    6780
gcacctctgt gcccaaggtg cagaaagggc tggctgccag aacccactct gcattttgcc    6840
tctttgcacc cgaggctgga agagccctgg aatcactgac tcgctggagc atccattcac    6900
cagtggccat gggagctgat gcataaatat tccagcgctc tggtccttcg agagggacac    6960
tctgtgacat gcgttgctca cctgtgacat gcccctccca gcgtctcctg acctcccctc    7020
ccaaatgcac tacttgcact tgctctcatt cccattctgc ttgctcacag gctggatcac    7080
acaagaccac acatgcgtgt acactcgtgc ctgcccatgg caagtattca aaaactgctt    7140
gctattttgt gggtggtggt gaagggaata gtatatttat aatacttcag gccaggaata    7200
tacatctcct ctgttttctg acccttccag gagtagggtg gattccaccc gcttttttgt    7260
aagccctcag aagtgctcca ggctctctgc acacccccag atctcccctg agcttcagcc    7320
ctcacccagc tccccagtca atttggcccc tgtgacgatg ttggtggggg gggcgggggc    7380
aggggaaaca gctggccctg gctcctgaca ggcactctgt tcccatctca gctgcctggc    7440
cctgcctgtg gcatcctcag agacccagtg gtgagtactt ccttggccct ttaggcccct    7500
ttccccaatc cagtagtgag acacggggag gggctggcag agacacaagt ctgccaccct    7560
ttcctggaca gccttctcct ctctggcagc aggaaaccac cccctactcc cactccagac    7620
ctacgctcac actccccgtc aaccccaagt gccactccag tctggggtcc ctccctgagc    7680
tttcataagc attgcaaatg cccaattcct tcattggctg gggagggcaa agcctaaatg    7740
ggcagtgggc tatagatggt ggccttccag gcactggcag caggacactt cagggcatca    7800
ttcaaatgca gaggggagag cattctgccc aagggcaggc ctatttgggg tgggcagggc    7860
agacttacaa tggagactac catacttacg tggctctctg caggccacgt gaccccttcc    7920
ctctgctcca tgtgcccagg attcaaactc aggctagtct gattcccaaa actgtgggcc    7980
tcagttttgg gaaaactgag aaaattgggc ctcagaatag ggatagggat ggagatggag    8040
atggaagaaa ataaaccagg ccctctgcct gatcccctcc ctactttggc tctggggttg    8100
ggagatgctg cagaggcttc atccactctc tgccccgacc ccctaactcc ctctcctgct    8160
ctgtccactg ggctggaccc tgtctgctgg gcctatcagg gctccccgtg tgtcctccac    8220
cagccagcaa tggccagaga gcccagctgg ccccagccta tcccctgccc accctgggcc    8280
ctgctcagag gacaaggctg aactgattct gtcaggaagg gttagtcttg tctcaggcct    8340
ggctgaatgc aaaaggacga gacaaatgca tgtggacagc ctcgatccgg agtgctctgt    8400
caaacatgct ggccacctct ccgggaagat cactcagact ccttgcatcc catcttggga    8460
aggctggcct gaggctccag agagatgttg ggagatgcca ggtgcctgca agccaagggc    8520
cctccgggga agggtgtcag gacccgctgc ttcttgcctc ttgcagagag ggcaacagct    8580
ggctccttct cctgccccag gtgaagactg atcagatact gattccagga tgaatccagc    8640
aacattaggc cctgcctggt cccatggtag catctggctg ggcttttggc ctatagtcga    8700
gtagatagag ggagggctga taactaagtg actacaacag gacctccctg tgtaagggtt    8760
ctagcttatt tccacactct tctggcacag acaggttggc agggcagctg gtagcaggca    8820
cagcagatgg aatgtcagga atgaaatcca caagactcca agcccctccc agggtgagct    8880
tgccacaggc cacaccagga agctgagctc ctcacccaaa gcctgccagt gcctacgtgg    8940
cagtcattcc cttgtcaaca gacttcccac tggcttctct tgctccatta ttaaaagcaa    9000
gaaccaaaaa cttcactgag gggatagaat cccactaata agcatgtcca cgctttgggt    9060
catcttaggg gcacagaaaa tctgagtatc ccccatagca tcaggcagag cagatttctt    9120
gtcaattagc tcagttggtt ggaggctgca gccatgaaca tgctggcctc agggccctca    9180
caacacaggt gggttaggga atgaatgaaa gttcagctat tattcctgcc agagactcca    9240
ggcccaacct ggcctctaat gagctatgtg actttgggca ggcagaaaag tgtctctgct    9300
atggtttgaa ggcatccccc aaaggcctcc aatgcaacag tgttgagaag ggggaccttt    9360
aagaggtacg tgggtcacga gggctctgcc ctcacgaatg gatttgtcct catcgcagga    9420
gcgggctcat tatcatgaga gtgggttggt tataaaattg aatgtggccc cattccttct    9480
ctccctttcc cccatgtaag gccccaccag acatggccct ccagtggtgg agttcccaac    9540
ctccagaacc acgagacaaa tgaactgtta ttttttcata aatgactcag cctgcagtac    9600
tctgttacag catcacaaaa tatgctaaga cacccctgag actcatcggc cacctgtctg    9660
tcagctttgc cgcaaaaatg atttgggagc agctatagtc aactttcctc agactacctc    9720
ctgctggcac attacggcca cctgctgtgt gcctggtgtt tttctaggtt cttggaataa    9780
agtgaacagg ccgggtacgg tggctcacgc ctgtaatccc agcactttaa gaggctgagg    9840
tgggcagatc acctgaggtc aggagttcga gaccagcctg gccaacatgg tgaaaccccg    9900
tctctgctaa aaatacaaaa atgtgctggg catggtggca ggtgcctgta atcccagcta    9960
ctcgggaggc taaggcagga gaatcgcttg aatccgggag gcagaggttg cagtgaaccg   10020
aggtctcgtc agtatactcc agcctgggca ataagagcaa aactccaagt caaaaagaaa   10080
aaagaaaaaa gaaaaaaaaa acagaaagaa agaataaagt gaacaaagca ggcaaaaata   10140
cctgccccca gaaagatcac attcagtgga tgtgcccatg ttccttcctc ttcctaaagc   10200
actcacaaat atcaacattc ccctgaactc accactgaga gtcacttctc agcgtgacaa    10260
tgttgaccag tcttcacctg ctgtgtaaag caggcctgcc ctatagtgac cccccaaaca    10320
ggtgcagaag gcaggtccac catcagccca tggccagcac accagttaga tacctgctgt    10380
tgccaggcag ctgtctgcca gcccgtaggc actagagagc cttggggcct ttcctgagcc    10440
cttttaaaga agtgcttcct ttagacatgg actctcaggc ctgctcagag cggggagggt    10500
gctgctccgc cccaaggcct tccctccatc ctttcctctg gcaatcaccg tgatagcagc    10560
aacgcccagc ctgaggcctt gggtgctgct tccctcagga aaactggcca aagagtagac    10620
agcagatact ttctccatat tcccaccccc acaacacagg ccagcagcac agcagctgta    10680
gacaagattt cataaagaac tggaggacaa gaaaggggag attaaggagc cctaggctct    10740
agggcctggc tcacacaaga atggtcttcc tcctgccaac ttcttggcct ttacaaaggc    10800
cccacctgac ccagcccagc ctcctgggca ctggccaagt tccacaccaa gactaccaga    10860
ccccgccaag tccaggctca agagagaaag ccagaccctc tctccttcca cctacctgag    10920
agaggcctgt cctcaggtgt ctggctcaca gatgggggac ccaactggga gtcactccct    10980
tctggaagcc ccaggcccta taaacaggtc cccggcctca ctgctgggcc tcggcctgga    11040
gacagcggct cagtgcaaca caaccacgcc agagctgatc aggggaaacc cacgcagcag    11100
ttgagggggc tggggctttg cgggtgcagt gaggggactg cttcccttca gtggagttgc    11160
tgccgcaggt gaggggagga agatgaatct gaaggttcta acgtcagccc acaggctgaa    11220
gcgaaggctg gcctgaagtg ttccacctgg gcccccacct gagcggctga agagttctgt    11280
ttcctcaagg cccacagagc tcctcagagg gaagctttag tagctatttc cttaggaagg    11340
caagtatgtg tgcaacattt cctaataaaa tgcaaaggct gttggaggca ctccagcccc    11400
ctcatttagc tctgaggtgt aattaataca taaattaagc tcctgcagac tcacaaatgt    11460
ccaagaaaaa aaatgaaaaa tataattagt ttgcccatct gactccatct gtcagctctg    11520
agctcaatgc tcaacgtagc aaatcctgag ggctttggtc tcgcattggc tgggcccggc    11580
gctgctcctg ccctgctcca gggaagtggg ccctccgcag cagctgccca gagcccgggc    11640
tctggactca gcctccaggg cagcaaggac tctggagtac acagactgca ggctgggagc    11700
cggggcactc ggcagagcag ccaggacctt ctctgtggcc ctgagcgctg gctaggggtg    11760
gcaagggcac cccggggaat ttgcatgtgc ctcttgctgc catgttccta tttgtgcaga    11820
cctggaagtg ggcggcagag ccctgaatgg gctaagactc gccctcctcc tccaacctgt    11880
cacctctgtc gcttactatc tgtaagaaga gaaaggctgc aaaggggaaa gggaactcga    11940
gaggaaggca ccgaggagaa gagaggagac aagagggcat tgggggagca aaggaggcca    12000
ctcacacagg aggattagaa ttaacaacta cccccacccc agctcccccc aacacacact    12060
tacacacgct tgtattacac cggggatctc acacacatcc ggtcactcag tattcagcac    12120
tctaggaaaa gaacaaacaa atggcttgtc tttcatcccc caaaattact tatgtcataa    12180
aattaatcca tatttgtttc agaaacattt aaataagaca taaggggtat ggcattaaac    12240
gtacccccaa atgcctcttc cccttacaag tggggatcat cattaaaaac ttttgtccca    12300
gaagtggtga ctcaggcctg taatcccagc acttagggag gctaaggtgg gaggatcact    12360
tgaggccagg aggtcaagac cagcctgggc aacactgtga ggtcctgtct ctaacagaaa    12420
aaagaacagg aaaatttaaa aggaggaatg aaaacaattg tttaaataat aatttggtgt    12480
gtattattta aagtacatta atatttggtg caatcgtttt tgaaagggag attgtactat    12540
acatgttgtt tggcaactta ggtgctcgct caggcaccag gccacacaca tcttgggcat    12600
tccacatctg ggttttgaaa gtaaaattat aataagaaaa taagcaaagg tcaaaatggg    12660
ttggaaaaaa attatttaca cagtgagttt tctactttat cataccaaga agatgacttc    12720
tctaattatt attatttttt tttaagatgg agtttcactc tgtcacccag gctggagtgc    12780
agtggcgcaa tctcagctca ctgcaacctc cacctcctgg gttcaagcga ttctcctgcc    12840
tcagccttcc aagtagctgg gatgacaggc tcccaccacc acatcaggct aatttttgta    12900
tttttagtag acatggggtt tcatcaggtt ggccagggtg gttgcgaact cctgacttca    12960
ggtgatccac ctgcctcggc ctcccagagt gctgggatta caggcgtgag ccaccgtgca    13020
cccggcccct aattattatt tacgtagaac aatatcaaag atatttttct tcctaactct    13080
atactccttg acaagaaaaa aaaagaaaag aaaggaagag cccgcgatat ataatggtac    13140
atttgaaaat gaagcatttg tatgtgcgct cacatgagta catatatatg tattacatcc    13200
atatgcatgt atgtgcatag actgtttcta gaagaattca caagaaactg gtaacatttg    13260
ttgcctctgg gaaacagatt ggcaactggt agaaggtgac tgacttcatt ataaacatat    13320
tttgtaatgt tttaattttc tgtcacatgc attattactt ttttccttag aaaggatttt    13380
ggttttgtct attttatcgg aagaggcaaa ttttaacaat aaaaacaaaa tgactgacat    13440
tcagccatag tcccacctct ctgaattact cagatctact gatttacatg tagattaaat    13500
gcaaatgagg gtggcactat ggttgattat ttagcagctc agcaatatga ccaatgccct    13560
gttcccttct acccttctgc tctgccccct cggcttgtag actttgtcct tgggcttcct    13620
aacctcattg ctacaagagt caggcacatg atcaaaacaa gacactgccc caaggtagga    13680
aagaagccac ctcttccttc ctatttttag gagaaaaatc tttcccccaa agccctcctg    13740
cagacttagc ccacatatcc cactggccat atttatttcc catgtctatg cctgagccca    13800
tctctggcaa gggaaaggga cccctttgga catcccaggg caagcaggcc tcctcagtgt    13860
tatcagacca actacccctc ttgaaaacaa tgactgtatt cttgtaacca cccaacctca    13920
atccagaaac aaaattcaca gatcacagaa tgtacctaca aaaacatatt tcaaaaaaga    13980
atcaaaacga agccctagct gtcacgtaaa ggagaaagta aaagtaattc aagacaaaag    14040
agtatgtttt ataataagca aaggctcagg cagcagactc tacagaacat aatgaagtgg    14100
tgagatgctt gcagctgcac acggaaatgc caaggttgcc ccatcataca tatagacaga    14160
tgcgggagat gactcaccca gcacgaggcc attgccactg gcggcatgat tttccaaaat    14220
ggcgaacaac tgttggtaaa gcttcaaaca aaacacagtg caacctcccc ttgatttata    14280
cagtaggata cttcctagga aatttagggc atatttaaaa acatgcaaaa agatacttgg    14340
agctcataca tcaaatggaa tgaagtttta ggcttaaaaa ggactttcag ctacataaaa    14400
gtctcatgag acatcagaaa gtcacgtggg acatggagcc atttcctctt agaaaggact    14460
gtctcacaca ttgtaaggta tttagccttc ctagaccccg tttattgaaa gatgatagca    14520
agggccctcc ccacaaaatg tcaaagcccc caccaatttc cagaacacac ttagggaatg    14580
gttctgtccc tttcgagaac tcctggctta ggccaacctg cctctcccag cccaggtgac    14640
ctcagagctg ggtggttgtc tgaacaacat tcaggttctt gcaggaagca tagaaggcga    14700
ttagaggttg gatagatagt caaccgtctg ttcatcacag aagcatttgc acatatttgt    14760
ctctagcttt gcctttgtat acatattttt aaatacaaat aaaatacgta tttaaaatat    14820
ggccaggtgt gttgactcat atctgcaatc ccagcacttt gagaggctga ggtgggagga    14880
tcaacttgag cacatgagtt tgacaccagc tgggcaacat agtgagatcc catctctata    14940
aaaaattagc caggtgtggt ggcatgtgcc tgtggtccca gctactcaag aggctgatgt    15000
gggaggatca cttgagccct ggaggttgag gctgcaggga gcactccagc ctgggcaaca    15060
gtgaaactgt ttcaaaaaaa aaaaaaaaaa aagacaaaca actgatttac cgaatgggca    15120
gaacttcatg gcacatactt ggctttcttt ttctttttcc cccatcactg tttttcagtg    15180
ctggctggtc agctctcctc tttcagccct tggatgacag ctggggctgt cccatagctt    15240
ttcagtcact ttgagctatg tcataactgt ggtcatattt tcaagcatga aaagtacaga    15300
tttgtctcaa tcaaaactca gtctcacaaa agccactttc ctccccagct cagtgcccac    15360
ccagtgggca ggaggagggg caggtctgtt ccttttctcc ctcgctgcca ccctcagtcc    15420
aagttcgggt ggggaagagt tgattagagg atggggcaaa gtcttagagg gccggacgtg    15480
ggtgatccat cacacatacc cattctatct tggcctctag ggtggatttt gaggagcccc    15540
ctccccatga tgatctctgc actccacaag gagttcctcg atgtgacggt gcactctcta    15600
gctggtcttc tgtggcatgc cccctctggt acccagtggt tcacccctcc caaccagcct    15660
ttccctgggg gacctctcct acccagcagg tgagtctcct gagtgggctt ctttcaagat    15720
acctgaaaac ccaactcctg ggaggttcac ttgctccaag gaaacttgta catctttgcc    15780
ttgcctaaga gtggaggagc agcttcccca caactgaccc tgtaatagaa aaaaacaagg    15840
tgttttgcct attctcacac acagaactcc caacaccaga tgtgtggagc atttcccaca    15900
taccaggcaa ttctcccttg gacaccagct gggtgtcctc taattcagtt cagttttgat    15960
cctatctacc tggagatagc atcagatccc acaggtcgat ggctcagtcc tgcgagactg    16020
cccctctaga gatgccaatc tcaagtgcag gttgtgacct gtgctttgaa ccattgacta    16080
tatattgggg ctccctcgac tccctcgttg ggtgagatta atctgctaga gcagctcata    16140
aaactcaggg aaatgctcta tttatgttta ctggtttatt aataaaagat gtaataaaga    16200
atacagataa gcaccagatg aggagataca tagggtaagg tctagagggc cagcagcttc    16260
tgtctctgtg gagttggagt gtaccaccct cccagcaagc agatgtgttc tccaacatgg    16320
aagttctctg aacctcatac ttagctgagg gatttttttt tttttttttt gagacagggt    16380
ctcactccgt cacccaggct ggagtgcagt ggtgccatct cggctcactg caacctccac    16440
ctcccgggta caagtgattc tcgtgcctca gcctcttgag tcgctgggat tacaggcgct    16500
tgccgccaca cccaactaat ttttgtattt ttggtagaga cagagtttca ccgtgttggc    16560
caggctggtc tcaaactcct gatgttaggt gatcccccca cctcggcctc ccaaagagct    16620
gggattacag atgtgtagct cagggatttt tatggagtct tcatcacata ggcatgattg    16680
attttcaagt ccatttccag cccctttctc ctctccagaa aatgggtcat ggggctgaaa    16740
gctccaagct tccaatcatg gcttggtctt tctgctgaca agcccccatc cagaagccca    16800
ccaagagttg cctcaataga acaaaagatc ctccttttac ccaggaagtt ccagggactt    16860
taggagctct gtgtcaggag ctagggtcaa aaaccagata ttagaacaaa agattctcct    16920
agcacctgta tctacaagga tattaggagt gctgtctcgg gaataaggac agagaccaaa    16980
cattggaaca aaagattatc ctgacacttc tatcacttag aaaatcacag ctgacccttc    17040
aacaatgcaa gggttaggag tgctgacaac tgcccaactc ctgcctcgca cacggttgaa    17100
aatttgtgta taacttttga ctcccccaaa gacttaacta caagcctact gttgactgga    17160
atccttatgg gtaacataaa cagtcaatta acagatatat cgtatatatt ttatatactg    17220
tattcttaca ataaagtaag ctagagaaaa gaaaacatta ttaagaaaat cataagagaa    17280
aatatattta tggtgctcta cggtatttat tgataccata ggtctgcacc atgtgtttac    17340
aacatgtatc atctgtctga aacgtcaggc aacctcagct gctgacctta gtctatggta    17400
catatcgagc aattcaactt gttcctgtga ggtcatgacc ttacttctta ggagctcttc    17460
cagcatcact agtggcactt cgtatgggtc ccatgatgct attcaaggtt tacagtattg    17520
cactaaccat gaaaataaat gagaactgag agagatcatg gttttcactg caatatgcaa    17580
tttactggag attgcaatag taaattgtaa attgctatat gcaatctact gctcacgtgg    17640
agatggtcag tatttcatag tgttttaagc agacactcgc aacacgagct caccgcaata    17700
gcaacaggag gtagctacaa aaatattaca gtagtacagt gcttactaca gtgaatttta    17760
tgtagttatg attgaatact tcatctttac atttgtttac atttccctca actacaaatg    17820
gtgccatgta tgatctgtgt tttttgcatg ttttcataaa ttttaacttt ttataataga    17880
tttgtgtaat tttatagtag taacttataa aatagactag tactcgcata tactttatgc    17940
attcatgaca tacctaactt tttgttgttc ttttttgata tttctgggct acacaagggc    18000
agtgacatga tcgtagcgca ctgtaacctg taactgtaag ttttttcaaa ctgtcacaaa    18060
tctcaaaaaa aaaatctaat atatttaatg aaaactatcc aagtataagt tgacccttgc    18120
agttcaaacc tgtgttgttc aagggtcaac cttacaagga ttttaggaac tctgctggga    18180
actggggaca gagagcaatg tgtatatttt gtgttatttc aggtgcgttt gctcatgcct    18240
ataatctcag cactttggga ggctgaaggg ggagaattgc ttgaggccag cagtttgaga    18300
ccagcttggg caacacagag agatcatgtc tctaccaaaa agatcccaaa aattcatatt    18360
ctccctcctc actttacctc acacgatgct ccaaatcagt ctcccacctt aagaattctc    18420
cataagcaaa agcccatctt gaatcccaca ctctcaggga cccttgccac actatccccc    18480
caattttctt ttctttcttt atttatttat ttatctttaa gacagagtct tgctctgtcg    18540
cccaagctgg agtgcagagg tgcgatctcg gctcagtgca acctccacct tctggattca    18600
agcaattctc ctgtctcagc ctcctgagta actgggacta caggtacatg ccaccacagc    18660
tggctaattt atatatatat atatttagta gagatggagt ctcaccatat tggtcagtct    18720
ggtcttgaac tcctgacctc agatgaccca cccgcctcag cctcccaaaa tgctgagatt    18780
acaggtgtga gcccccgtgc ccggcctccc aattttctca ttggccagtc actctggtgc    18840
cctggggact agcatccagc taagggatag atgccagctg ctctctcagt gctatggttt    18900
gaatgtttgt gcgccctcca caattcatgt tgaaaatccc cagcacaaca gtatcgaggg    18960
gtggggtcct taggaggtga tgaggacatg aggcctctgc agtcatgaat ggattagtgc    19020
cctatagaag ggctttagag gctgagtccc accttccatc cctccaccat gtgaggacac    19080
agcatttgtc ccctccagag gatacagcac aggtgccatc ttttaagcag tgagcagccc    19140
tcaccagaca ccaaacctgc cagtgccttg aacttggact tccgtcctct agaactgtga    19200
gaaataactt tccattattt ataaactacc caggctcaag tgttttgtta cagtggcaca    19260
gacgtactaa gacttgtggg tacccacaat tccataagcc attttctttg cttggcctgg    19320
gcatgacccc ctgtgctgtc cccgtgaaga aaaaggataa accaacaaac tctatgaatt    19380
aacttcagtg aatctcgtat gtttctaatc ttctgctttg gagctttggc gataaagaaa    19440
gattaggaaa ttagattaaa aaaaactaac attatcttaa atgacccata ttcccaatca    19500
atatctcttc ccttgaaact tggtgtgtat aaatccaata ctttttaatg tatttgtata    19560
tacatatgta aacatataca aatatataca tcatatatat gtatgtatct gcctaaataa    19620
ccacctggag ttagcaggtt ccatacctgc aggatgcaag cagggatggg cagaggcagg    19680
ctggtcagct tccaggtata tatatatata tatactcgga aaatacttgc tattagtttg    19740
gtggttttat tattaacgta aatgatgtct tgctgcacat attattctgc aagttggttt    19800
tcccacataa tgtgttggac atcttttagc cccatttcac actcttagcc tgccttttgc    19860
acaagagttg ctgtggcaac aagctgcccc caggtgtaac ctgacagctt cacttcagct    19920
gcaccaggta tgtctttctt tctgccccag gcatcacggt atacaggcaa atcttgaagt    19980
gccagggagt caaccctccc tggagcaatc cttgcccaat aggagaagga agccaatgaa    20040
taaatatgcc aggcctcgag gtcttaggcc ctcagtctaa ggcatagtct acatggtttc    20100
tctgggagtc ctcagttaaa ctgagccccg actgcccaca gcaatggcca gtgttaaaag    20160
aacaacctta accagattaa atttaacaca gtttaactga gcaaaggaca attcgtgact    20220
agggcagtct gctgagccag agtaggttta gacagactct ggtggaagat ttatggacag    20280
aaaaaggaaa gtgaagcaca gaaaacagaa gtgaggttca gaaacagctg aatgggtcgc    20340
agctcgtcgt ttgccttatt tgaacacagt ttgaaaagtt ggccaccttt gattggccaa    20400
aactcagtga ttgacacaag agtacgttac agcctgttta catttccctg taggctatag    20460
tttactatgc acagagaaac ctttaggctg aacttaaaat atgtaaggag gaagctttaa    20520
gctaaatttg atttttgttg ttgttgttgt tttgttttgt tttgtttttt gttttttgag    20580
atggagtttc actcttgttg cccaggctgg aatgcagtgg catgatctcg gctcactgca    20640
acctccgcct cccaggttca agtgattctc ctgcctcagc ctcccgagta gctgggatta    20700
caagtgtgca ccatcatgcc caattaattt ttgtatattt agtagagggg gtggtttcac    20760
catgttggcc aggctggtct ctaactcctg acctcaggtg atccatctgc ctcagcctcc    20820
caaagtgctg ggattacagg cgtgagccac cgcgccaggc cactaaacct cagcctccca    20880
aagtgctggg attacaggcg tgagccaccg caccaggcca ctaaacctca gcctcccaaa    20940
gtgctgggat tacaggcgtg agccactgcg ccaggccact aaatttaatt taacagtagc    21000
ttaacacatg gctggatggg cttttcctac ttccttgttt cattcttccc agtcctccaa    21060
ctcttgactc ctagatttat ggacccaaat aaatgactca aatgcagtcc ctttgtctca    21120
ggtttttggt ggaatccaag ctaaaacact aaataaaaaa tgttgttaaa aataagttta    21180
ttttggtcat tattgatcca cttggagtgg tcctcaaaat gggatctagg gaatcggtcc    21240
ctgaggctgg tttctgggaa tccacaaatg caaaactatt tccatagtca cactaaggag    21300
gtgtggcctt ttcaagaaat tacattaccc gtaaagtgca atagacggaa aacagaagcc    21360
catatgagaa tccagctatc ttctagcaag ccagaagtaa aagatgccag gtgcagtgga    21420
tcacatctat aatcccagca ctgaggattg cttgagcctg ggaatttgtg accagcctgg    21480
gcaccatagt gagaccccca tctctacaga taatttttaa aattagccag atgtggtggt    21540
gtgtgcccat gatcccaact actcgggagg ctaggaagga ggatcacctg agtcaggagg    21600
tcaaggctgc agtgagctgt gattgcacta ccacactcca gcctgaatga tagagtgaga    21660
ctctgtcaag aaagaaagaa agaaagaaag aaagaaagaa agaaagaaag aaagaaagaa    21720
agaaagaaag aaagaaagaa agaaggaagg aaggaaggaa ggaaggaagg aaggaaggaa    21780
ggaaggaagg aaggaaggaa agaaagaaaa agagatctgc aaaaaaatgt aaaacaatac    21840
cactcttctc actaaatttt tgtacttgga aaacatagtc atttttcaca aaaatgctat    21900
ttatattaac ataagtattt tgatgtgcaa tggacttatt tttgttattt tcacataaag    21960
attgtttaaa tttcttagtt ttaatttcta atactgtaaa tatcagtaga tataacccat    22020
gtaaacaaaa gctttttggg gtcctcaata attttcaaga gagaaaaaga ttgccaagac    22080
taaaaagttt gatagctatt aatagagttc attgctttta acttctgagt cccatgcata    22140
cttcattatt attattatta ttatttgtaa agacagggtc ttgctgtgtt gcccaggctg    22200
gtctcaaact cccaggctca agtgattctc ccatcttgga ttcccaaagt gctgggatta    22260
caggtatgag ccacagtgcc ctgcctcttc ttttaaaatc taattatgta tttgttatct    22320
cttacatttt tcctatcttt cttttttctg attatggccc aaaaggggaa gatttctgcc    22380
catgctcatg ttactatctt gaaattattt cttttcagac tctctagttc aggaaaaagg    22440
tcccctgcca catcaagtgg ccacggagga gcttgggcct gtgatgtccc ctcccttctg    22500
cctaaatgac cacctggagg cagcaggtta catacgtgga ggatgcaggc ggggatgggc    22560
agaggcagac tggtcagttt ccagggcaca cttcgggggc atacaaggga caaaaatgtg    22620
acggtggctc aggagggcac caaagatggc caaaagcttc tgcttttaag gtggcagtag    22680
gaggcagtta atggaaaaat agaaaccaat caagctacgt ctgccaccaa tgaaaatgaa    22740
ttattattta ttcaacaaaa tataagcttt ttaagaaaaa aaaaatagca aacgctcaac    22800
ccacttgcta agttccgttg gggtataatg gcatcagctc tgagtgccaa cttaccttgg    22860
caaggtggtt gcacgccctg aggatatgta caccttctcc gctgctggcc agctagatga    22920
ccttgagcaa gccacccacc cttctgaact tcgtctattt ggaaaataca gacattaata    22980
cctcatagtt tgtaatgagg ccttagagtc cacatattaa tcgttcagaa cacagctcaa    23040
aaaaatctaa aacttctggt ggggcacagt ggctcacacc tatgatccca gcactttggg    23100
agcctgaggt gggaggatag cttgagccta ggagtttgag accagcctgg acaagataga    23160
aaggccccat ctctatacaa aatataaaaa ttagccaggg gtggtggcac atgcctgtag    23220
tcccagctac tcaagagact aaggtaggag gatcgattga gcccaggagt ttgaggctgc    23280
agtgagctat gatcacacca ctgcactcca gcctgagtga cagagcaaga ccctgtcacc    23340
aagaaaaaaa agagagagag agagagagag aggtggcttc agtgggccga atagcagaga    23400
tccactggga gcattagcaa catcagggcc attgcttcag cagcctggaa ctaaagagga    23460
agaaagcaag aagcttcagg agattgaaca gtaggaagga aggaaggaag gaaggaagga    23520
aggaaggaag gaaggaagga aggaaggaag gaaggaaaga aggaaggaag ggagggaggg    23580
agggagggag ggagggaggg agggggagag ggaagcatat gagaaagcga ggctaggagt    23640
cttggagtca tccttgactc atctcttatt gtagtcattg ccagtactca cagctctcag    23700
acaacagtga ggaaacaagt tattttcaac atttcaggaa gctaaatgga aaccatgcac    23760
acaacaaggt ttcaaagtta attgaggatc aagattttct gctgttgtct ggtaagttat    23820
caattctgat ttttttaaac ctgattacag gcatccacaa aaaaatatgc aactaacatc    23880
atgtttaatg ttgaaagact aaatgctatc ctctgggatt gggagcaagg aaagggtatc    23940
cactctcatc actcctgtgt acttaaaaaa aaaaaagaaa taaaacatat gttcacacaa    24000
aagtctgtat gcaaatgttt atagtggctt tatttataat tcaccccaac tggaaacaac    24060
ctaacatgac cttcagctgg tgaatgaata agcaaaccat ggtacatcca tacaatgaat    24120
tactagacag caaaaaaaga aactggtgat ataggcaaca acctgatgaa tctcaaatgc    24180
actgtgctta gtgaaagaag ccaggcccaa aggactacat actgtatgat tcaatgttgt    24240
gacatactgg aaaaggtaaa attataggaa caaatcagta gttgtcaggg tctagtggct    24300
agggaaataa ttgactacaa aaggacagca agggggaatt ttggggggaa ttggaactgt    24360
tctgtatctc aaagatgggc atgattgatt acatgattat gccaaaattc attcatcaaa    24420
aatgtaaatt tttatgtatg tagatagatt ttattttaag tgaataaaag gaacaggcaa    24480
cttggaagca aaagagcagg agccgggcca ggcctgcggc tagattcaga aatagggtta    24540
gagggaatga tcgaggggaa tgacccaggc agccacagct ctggagagac ggctgcaggt    24600
ggacaaaaag caggtggaag cgcccagcag gaccttgacc agacaggcaa tgggaacata    24660
aaagacagca acagattgca acatcatgtc catgggctcc caaacctgat atctcagaat    24720
cacttccaga gctgattgga aagacagatt ccattgctaa gcatagtggc ctgcacctgt    24780
agttccagct actccagagg gcttgaaccc aggaggttga ggctgcagtg agctatgatc    24840
gcaccacagc gctccagact gggtgacaga atgagacaag tcagaatgaa agaaaggaag    24900
aaacaaagaa agagagaggg ggaaagaaag aaagaaagag agagagaaag aaagagagag    24960
agagaaagaa atagaggggg gaaagaaaga aagagagaaa gaaagagaga gaaagaaaga    25020
aaagaaagaa agaaagaaag agagagagag agaaagaaag aaagagagaa agaaagaaag    25080
agagagagaa agaaagaaag agagagagaa agaaaaggaa ggaaggaagg agaaagagca    25140
aaagagacag agggaaggaa ggaaggaagg aagggaggga gggagggagg gaagagggag    25200
agaaggtgag aaggagggag agagggaggg aagagggaga gaaggtgaga aggaaggagg    25260
gagggaggaa agaaggaagg aggggaggga ggaaggaagg aaggagggga gggaggaagg    25320
aaggaaggaa agaaggaaag aaggaaggaa ggagggaggg agggagggaa gaagggaaag    25380
aaagaaagga aggcagattt ctactgaggc tgcctcttta ttcccctctt tattcccctc    25440
agagaggtca tttaacctct ctgatctctg tggttgctgt agggactaaa ggacacaatc    25500
cttgggaaag tgcttggcac agaacttttc agcttgctat ggggagtgcc agccaccggc    25560
aacaggtgtg actgcagggg aaagccccgt gcaggtgaga gaaaggggcc agaatgagaa    25620
gggctttgta aggctgggac cactatgttg ggtctgctat ggagggggga gctcaggagt    25680
aggcagggca gatttgaaca tgggaagggg aaagctgctg ctggaagcag tggcccatgc    25740
ccaggtgcat ggagaagaga gcctggaagc ctctcttggt ccctctaggc tggcagaggc    25800
agggccccac attggcagtg gtgtgaacaa tttcccctca tcatggggct gctcatggct    25860
gtgaaacatg ggatggcact agatttggtc attaagtaaa taggataaag aaataattgg    25920
aaaatggatc cctgcctgga aggagtggaa ttgttcctgg ggctattgtt gtccggcatc    25980
ctgctttctg agtaatctcc cgagccaggc aaggaaggat gtcaggctta gggctgatga    26040
gaaacttaca cttgaaaaga gctcaaaatt acccatgaca atggaaaagc ctttgtatcc    26100
tgaacagaga gaggaaaaag actctgaatc ttctctgggg cgggaggaga gggaagatag    26160
gagggcagtc tcgagtcaca gaatgtcaaa cccaggaccc ctgtgtcttt ccaagttggg    26220
ggcactggcc agggaaggat cctggttctt ccggtgtctg ggatgatgag gctggtcctc    26280
aggcagtggg aggctggagg agggggaatg tgtgaagacc acatgctttc gcctgcaaga    26340
gcatccatcc atgtcttggt cactgcaatt tacatcctcc cattcaaccc tcagcacacc    26400
caccaaacca agctcctcct tgcaccttga tgggcagaaa gttggagtga tgattatcta    26460
agacagagcc ctgaggtgaa gaactggttt tctggtggag ggggtgaggg gaggatggag    26520
ggagctatcc cttccctgtc cccgcaaatc cttcagcaaa aaatccatag tgttgagtca    26580
aaatgccaat cagatgtgcc tctcagcagc tttaggcctg gactttgacc tcagccccaa    26640
cccccacccc cacaggcact cagcctaagc tcccattctg caccctcccc accctggttt    26700
gcaaaatgca tcaaagcaga agctgtgctt ttgcctttcc ttgtaacttc ttgtctgcaa    26760
gctgtattag atgcttgctg gtgtttaaaa cattttctat ttctctaaaa aaacaagttg    26820
gggcacccca aaatgaagcc tcccaagttc ggtcaaacat gcaagattgc cactcaattt    26880
ctccattcta gatgagaata gcgagtccca aaggctcgtg ggtgtctgcg gcgttgcact    26940
cacttaactc acttgttcaa aatacaggtg ccagggcctc ccccccgagc cacagaacct    27000
aaatccccag aatcaataac tttctttaaa taactagatg cttgatttaa agggaaaact    27060
ctatttaaag tgctgtatcc ctccttaaag acagattgtc ctacacgaag cagctacatg    27120
caaaatgaat tataggagtg tccttggttt tacaaaaaat gaaaagcatt gcaattctcc    27180
aaacatgata agaaaggaat ttttttgtta aactctgaga gcaaaacaat ttactagaag    27240
atacagatgc aagttgagta agcaagccaa taatggagaa aggaggaatt tttacagaag    27300
cagtttttcc tcaccccatc tgcatttcat gtctattaaa acacatgtca tgcaacgaaa    27360
aaatcaaagc agtatggttg ggtacacaca ttagtggctt tctgtatggt tagtgagatg    27420
aaaggacaga gaaagctatg ctggagtcat caggacatgg tagagccctc ttgtgagctg    27480
ctggaacaca tcagttgcac gtacgttctc ttgctggtgc agcccatccg gtcagaatct    27540
gtcgctcaca gtagctgtta ctgaatactg tctgcttctt agctgaaacc ttaccgtagg    27600
accatccggc cctgctcctt tcccgttaac atgtaagttg ttctcagacc ctaccttttc    27660
ccttggtttc tcatggaccg tggccaggac ttgggtgtcc acagccacac ccacaaaaga    27720
agtgcctgtt ccacccagga cctctgggtt aaatgacctc tctgaggcca cacaggatct    27780
acagcacaaa ctcagctcag attataaaac ttgcactctg aacgactgcc ctagccagcc    27840
ccaccaaggc catgaggggc ctcccagagc caagtgcgac ggcttctctt ggcctctgcc    27900
tccttgacct gcaagcaata tttgacccca cttcccttcc cgtctcacac cctcctgacc    27960
tcctcagctc tcctttctgg tctctcttcc cctctcctca cacctccaat tggatcttca    28020
gccttcctct cctctcactc cacatttttc agctggattc ctgtggtttt cactcttatc    28080
tctccctatg cctgccaaat ctgtgtgttc agctgtccga acttctcagc tctacatgtg    28140
tgtttgcaaa ggcttcacca tcctccccac acttcctcta ccagaggctg caccatgggt    28200
cactgggcct caatcttcct gcccactcag gtagaggctc tagggtcagc tttgcctcct    28260
gccggatgct gcactgctgg aatcagctgc ccacacttct ctccttttgt atggtgtcct    28320
cactgaaact tgggcggtgt cccttggagt gccttgagag ctgatgattg ccaccctctc    28380
taagagccta cagacccctg atggatatgt gtcctggagc ccctcacaca agcccagccc    28440
tctgtgttag ctagacagtc aagtgggtgc acacagggct agcaccaccg cggctcagaa    28500
gccaccttcc cctggaagcc actccttata tctgggcact ttctcctctg gactaccctt    28560
gcattgtgtt gttctatagg aggtgctgga gacagtgata agaacccatg gcccctgccc    28620
tcaagaagtt ctccagtttt attggtggga gcaaacaaat aaacagacag acatggagaa    28680
aatgcatcag gtcgggtttg catgcaggaa gttgtcactt gcgagggaat gacagaagca    28740
aaagtgggca gagggagaag ttaaaccaag gtgcagtccc accagaggcc tcagaagaac    28800
ccatgagaag ctctgaaact ggatgggctt tcagagttgt accaaatgga ggcaagaggg    28860
ctggcctcta cccctgtctc atccactaga atgtgggctg ctcccagaga gggtgtgagt    28920
gagttggggc aatacatctg ccttcagtgg aaagcaatta attcccagag agggttgcag    28980
ccattgctcc tccagcagcc agggatatga gtacctgtgt gcagatgggg acctgggcaa    29040
catgccacag catccatgac acggcacaga cagggatgcc caaagtgggg gctggccaag    29100
tcaaagatgg gggaagtaat gaggtgatca tcagatcttc ccatttcacc tgggcattga    29160
cctacatgta ggtgtttttc aagtggacaa tctttagttc cctctgctcc tcatcataca    29220
agtataccag caatggctaa tgttatcttt gcacttgcta catgcccagc tgtgtcttag    29280
ctcttcacat gcatagctta tttaatattc acaagaaccc tacgaattaa gtaatactgg    29340
ctaggcacag tgggtcctgc ctgtaatccc agcactttag aaggtcaagt ttggagaatt    29400
gctagagccc aggagttcaa gaccagcctg ggcaacatgg tgaaacctca tctctacaaa    29460
aaatacaaac aatttgctga gcatgatggc agacacctat agtacctgct actcaggacc    29520
ctgaggtggg aagatcactt aagcctggga ggcagaggct gcagtgagcc aggatcgcac    29580
cactgcactc cagcctggat aacagaatga gaccctgtct caaaataata aataaataag    29640
tgggccaggc acggtggctc ttgcctataa tcccagcact ttgggaggcc aaggcgggtg    29700
gatcacttga agtcgggagt tcaagaccag cctggccaac atagtgaaac cccatctcaa    29760
ctaaaaagac aaaaattagc cgggcatggt ggcacactcc tggaatccca actacttggg    29820
aggctgagac aggagaatca cttgaacctg ggaggcggag gttgcagtga gctgagatca    29880
tgccactgca ctccagcctg ggcaacagag caagactcca tctaaataaa taagtaaata    29940
aataaataaa tacataataa aactattgcc cctgtcttaa tgtaaatgga acatgaggct    30000
tagagaggta aaatgactca aggtcacaca gtaagtcaaa ggctgagcta tctctgccct    30060
ttcttcttcc tggtgtacac ctttcaccct gcaaagctca gtgcctacct tacttgctct    30120
atcaaacctt ccccatttcc ctcagaaaga ccaagtcccc ctcctggtct ctagagaaca    30180
agctgccctg gaccacacac cttggcttcc agccccttca ccatcctaga cgaggtcacc    30240
tagaaggttc catccagact gtgaatgtcc ctctttaact acagtctcca gtgaacccac    30300
aacctcaggg acatatgacc ttggagggtt aagtgggatt tcatttccct gactctggac    30360
ctgggctttg ctagcacacc tctcccacta tgatagcatt cgcttaaggc agctgagccc    30420
cgtcaggggc tccctgagct tgtggtcagc tcaagccatc acatctttct catctgtgct    30480
ctgggaagct gcctctgctt ggtctacaca gctgagacaa tggagcctgg gtgggctcag    30540
gggccccttc tgctgggaac ctgctttgaa acaacatatc cattgcattc actggaggag    30600
catcagaagt agacggtaat ttgtgttttt tcttcactgg atgccctagg gtgggttccc    30660
ccgaagcaga ccctgagatg agcatttatg caactgatcg aggatgtgcc caggagaacc    30720
ggataaggga ctcagagttg gagggaagat actaagaaaa tcatgctcca ggcaaagtcc    30780
cagcctcggc ttgatataaa ttacactgac ttgaggcaag ggagctgggc tctcacaccc    30840
cggctccagt cagccactgt ttcagggctg ccccaggagg acaccagctc ccagcactct    30900
tgccgtctgt gcatgcattc agcacactgg caccccctca aaggccagcc atttaagagg    30960
ggcacaggtg ctggggccac aaagcaccca gagcccagtg atgggtgcac aggcactgta    31020
aaagtgatat gagggccggg tgcagtggct catgcctgta atcctagcac tttgggaggc    31080
tgaggtgggc ggatcaccag gtcaggagat tgagaccatc ctggttaaca cggtgaaacc    31140
ctgtctctac taaaaataca ataaattagc tgggtgtggt ggcacacgcc tgtagtccca    31200
gctactcggg aggctgaggc aggagaatca cttgaaccca ggaggcagag gttgcaatga    31260
gctgagattg caccaccgca ctccagcctg ggcgacagag tgagactcac ctcaaaacaa    31320
aacaaaacaa aacaaaacaa aaaaagggat atgagaggat cagagcagcg tccccttgcc    31380
tcctgttacc aagaaggtac caagccgttg ttccctcagg ttgttcctca ttccatgttg    31440
ctcagccagc caaaatcaga agctgccaag ccacctgggg aaacaaggca cccaccgaag    31500
ctcttgtttt caaaagtttg agctaattaa agttgatgga gctggatttc ccctgaagga    31560
aaggatacca atgtttggga aggttaggat tcagagaaag aagcatttga agtcttcccc    31620
agggcctaga aattaaagtc tagagatttg ggagggtctc tagaagggca ggaacgcagg    31680
ccttcacctg aaccacttcc taagcagata gccaacctca tatgggagat tcctaaaggg    31740
gctgacatca aatcctgaga ctccatagtg aagaccccaa gctgcagcct cgcctggaag    31800
tataggaact taccagagta tccaatgaca ggagaagtcc agagggctct accctgaatg    31860
ttcaccatgg ataagtcctg ccccaaacct gacagataca gatttctcat ctatcttgac    31920
aaatgggaac ttgcagccag tttaatttgc ctcaaagaaa ataaaataat gtgacattcc    31980
ttcaccccca gcaagaacta atccctttct ccagtgctcc tacagcaggg aggacatttc    32040
cctgatattg atttttcatg actgtccttc ctccctagga gaccctgatc tccttaggga    32100
agaggtggtg ctttttaaac catttctgca gcccaggtgc ctatcaaggc cccagcatcc    32160
agtgggtctc aataaatgag acctatcata attaacattc ccctacctca gcacatgact    32220
catcaaagta ttacatgttg tttgcacttc tctaccccct cccccttccc atcacctcaa    32280
agctctccaa gcacacatga gccactgctc ataaatgttg catgaaagaa gggatggatg    32340
gatggatgga tggatggatg gatggatgga tggatggatg aatggatgga tggatagaca    32400
gacagatggc ctgatggatg aggctggtga gcaagtgaaa gagtgcttgt tttagaataa    32460
gctatttagg ccactgccat ttcctgttgg ctgagcaatg agcatgccac agggccaatc    32520
agctctaaat gcaaggcggt gcatggccag aggaaagttc ctgctgtctc tccttcaccc    32580
tgacagccat ggccccaagg gctaacagag gcccttgaga ccaattctgc catcaggaag    32640
gaaaagccct gccaaaatat ttgcattcag aaagttagca tttataacac agtcagagaa    32700
ctatgaaata tcttccaggc caagcactgg gcaatgccat gttggtgggt tctgatgagc    32760
cctgggaaac ttacttgcac cttttcagcc cctaacccta ttacacaggc ccctgcatgg    32820
aacaaatgcc ttcatcctca catgttgctg ttgggagtgt actttgatac agcctctact    32880
caagaacaat ttgggaatac ctatagacat tttactaaca aatgtgcacg ccatttgacc    32940
caggaattct actcctagga attaatcctg cacatatact cacgtatatg tacaaaatcc    33000
ccatatacaa tgtttgtaaa aagcacggtg tgaaagccat ctaactcttc atcagaggga    33060
ctgggtaaat aaaggatgtt ctgcagccat caaaaagaat gaaagttcta catgttctga    33120
tatggaacaa tccccaaaat atattgctaa gaaggaaaaa acaaggtgca gatcagtgtg    33180
catcatttac taccatttgt gatggtctta tatagcacag accagttctg gaaggatcca    33240
taagaatggg tcccaagggc taggtgcggt ggctcatgcc tgtaatccca gcactttggg    33300
aggccgtggc gggcagatca cctggggctg ggagattgag accagcctga tcaacatgga    33360
gatatctcat ctctactaaa aacacaaaat tagccaggcc tggtggcaca tgcttatagt    33420
cccagctact caggaggctg aggcaggaga attgcttgaa cctgggaggc ggaggttgca    33480
gtgagccagg atcgagccat tgcaccccag cctgggcaac aagagtgaaa ctcggtcaca    33540
aaaaaaaaaa aaagaagaat gggtcccagg agttgcctcc aaggaaggga ccatggggac    33600
tggggactga ggactgggag acaagagtag agaaatgctt ctcatattgc acaattttga    33660
atttttttgt atcatgtgta tgtattactt atgcttaatc aaatactcaa ttttaatatt    33720
aatttaaaaa aataataata tccccatcca cccagccagg tgccatagta tctgacattc    33780
tgccaatagg gagtcacaag gttgaagtct tagattgaac attgtttcaa catcatttct    33840
cactggaagc tctttataat gcaagcctta ctagaactgg tttaagtgtg atccaaccta    33900
tcagaccaac tttcctcttt cgggcataca aaaaacttca ctgggcattg actttgtcct    33960
acacacttgc ccaggcactg gagagacagg gagaacaggg ctgacctcac agtcagccag    34020
gtggacagct gcacgcacag agtggtggca gtgcacaggg agtggtggct ctgcacatgg    34080
actgtgggcc ctgcatggga ctagtggcac tgtgtacaga atgatggccc tgtacaagga    34140
gtggcagccc tgcataggga cctatggccc tgcacaggga gtcgtggcct tgcatgaggc    34200
cggtggcggc ctgcacggga ctgatggcac tgcacagaga gtgtggccct gcacaaggag    34260
tggtggccct gcatagggac ttatggccct gcacagggag ttgtggccct gcaaaaggag    34320
tggtggccct gcacagggac ggggcagata taccctgaca tttgaggaga ctgaggcaag    34380
gatataagtg ggagagagtt agaatttcga attctcagac tccttgggtt tcatgctgga    34440
acacgctggc atgagagaac caggccttgg cctgtggccc agctccctcc tcttcccacc    34500
tcctgccctg tcccacccca tcaggggctt gcacacacac acacacagac ccttcagccc    34560
tcagagccaa gctccttgca cacagactct ttccacagtc agcgccctta gctcctgtca    34620
agcctccagg tacacacaaa cctgcgtctc tgctcgcctg cacaaggaag gacccagcca    34680
agtgtcccaa tagggcctgg aagcgatctt gatgccatcc gggcagaaaa tcccaggtgg    34740
agtacagccg gataaagaca gcccaggttt caggttggca tgttcctccg gttctgcaga    34800
tccctcgggc cctggagaag gagatggcca gaggaggata gcaaggcctt ccaaagtgca    34860
gtcccgggtc acagcccacc tgcctggatc taaggacggt gtcgctgagg ctgtggcagt    34920
gggaggttcc aagacacggt gaaggcctga aggagggggt ggcccttgct aagacctgtg    34980
gccagctgac agggctcccc agcactctgt cagtaaggcc cttccaggaa gagggagtgg    35040
ctggacaaga ggctgtgtgt ggaaggcaaa ggggagaagg gagagagagg gctggtaacc    35100
caattcctct tcctgcctcc ctacacttca gcatcaccct gttcacgccc cttgcagatc    35160
tcccacagca ctccctgtgt acacctttgc tgctcaaagg gtctacacaa gccaagcaca    35220
gtggctcttg caaaggtggg aagatgtctt gaggccagga gtttgagacc accctaggca    35280
acatagtaag actctgtctc tattaaaaat aataataatt tttttttttt ttggagacag    35340
agtcttgctg tgttacccag gctggagtgc agtggcgtga tctcggctca ctgcaacctc    35400
cccttcccca gttcaagcta ttcccgtgcc tcagcctccc aagtagctgg gattaccggc    35460
acctcccatc acacccagct aatttttgta tttttagtgg agacagggtt tcaccatgtt    35520
gcccaggctg gtctccaact cctgacccca agcaattcgc ccacctcggc ctcccaaagt    35580
gctgggatta gaggcgtgag ccaccacaac cagccaataa taaaaatttt ttaaagggtg    35640
atctaagatc agcagcatgg cctcggaaat tggaaatgca gaccctctgg ccccacctca    35700
gaaccactga attagaattt gtatttggat aaaagtctca ggtgagttct gcaaactttg    35760
taatttgaga agcactggtc tacaccacac tccagcacct taacgcagct ccatttagca    35820
gtggtggaca ttgcatcatg cagtgcatgg ttccttcttg agtgcagctt atggaaggag    35880
ggggagtgac aggactgaac ttattgttca aatccccttg tggtcttggg gttcttggtt    35940
gctcactgca gagtttatag gtgaaatgag cagctgtcct cacctctcca gcacccttgg    36000
aatggaagag gctgccctga gctgggctgc catctcctgg gtcctcagtc tcaagccgct    36060
ttctgatgtc agtgagctct ttgaagtcag gtccgcatcc tacacagggt aggtacaggg    36120
ggccgggaag gcatagaata cacattaggt tggatctagc atctgatcca cctccccatg    36180
tttcacgaat gggccagtgg gtgagtctta gggagggcta ggccctgcct cttagaggaa    36240
ggcttaaaag gccccaacct actcttcttg gcctggtcag ctggaggcag gcagatgccc    36300
caagttcaga cagtcagata ctcccaccag ggatttgggt ctatggtgag tgacatctag    36360
aagcagggcc agccagaagt ccttcttggg gctgggcaca gtgactcgtg cctgtaatcc    36420
cagcactttg aggggctaag gcaggaggat tgcttgaagc taggagtttg agaccagcct    36480
ggacaacata gcaagaccct catctccaca aaagtaaaaa taataataat  aataaccagc    36540
catattagag cattcctata gttccagcaa ctcaagaggc tgaggtggga ggatcactgg    36600
agcccacgag gtcaaggctg cagtgagcta cgattgccct cctacagccc agcaattgca    36660
cacctaaccc cacatacaca taatcaaata gagattatac attcacgatt gaagccaaag    36720
tgttatgaca caaaacttac ccttaggaca tgtcataaga tctgatgttt tatattttta    36780
ttcttttttg ttaaagaaag agcttgttga tccaaccctc taataaagct gaaagccaac    36840
atttgcaaac actggcaggt ggctgcgtgt cagggtgagg tgtcactgaa cagggtgata    36900
aagcaagatc ttgtctctaa aataaataat ataatataat aaatataata taattaagta    36960
gaataatgaa atatcctgct ggccaaggtg gcatccccgc ccccagcagc aaagtcagca    37020
gggccagtgg tggcaagctg gtgtccacac cagtggccac agtgtcatgt ccaggcaatc    37080
tctgccctat gacctcagct gcctttccag ctgtctttgg tttctgcctg tttcccttca    37140
gcctccctag attctgggag gggccggtgt cctgctccag gtaggcagag tccaagtctg    37200
ttgtgggcag aactctgatg atcattgcag gggtgggagg agggatggag ggagcatgat    37260
gctggcagaa cctccatggc atctggggaa ttgaaggctg ttttttgctc agttctcacc    37320
atccaaagca gcatgaacag ttttcaccac gcctctcttg tggatgcctg tgttcctggt    37380
acacacctct gctatgacac ttatcacctg gtattagtta agcatctgcc tccttcattt    37440
gctgtgggta tttagaaagc aatccatatt tcctctctgt atgcctcaat ttctccacct    37500
ttattagagg acccaggata agattatttc tgaggctgct tccatcagtg gttctgtgag    37560
ctggcccatg tattcagcca gtcagtaggc catcaagcat gcatctacgc aaggcactag    37620
aagggttaca tacaatggga aactgaggcc cagaaggagg aaagatgaag tgcccaaagt    37680
taaggagata aaagcagaag tgcaggtaag agaaggagta ttcatattac tgcaggaatc    37740
caaattctac aagaacatac gcttgttctt taaagggagc cctcgcttta agcattattt    37800
gccgatcaat acccattaat aattacagga catgggcaaa tattctagca aaggtcctga    37860
ggtcttccta gatgtgccca aaataacaag gactcccccc gcaggtggca ccaaaagtcg    37920
gaggatgtgt tggaagctga ccttccccac ctgtccctgc ctcacccaca gtcacccacc    37980
cctctaggat gtaatggtga atcattcaac acatgggcca ccttgggaag tcgcttaacc    38040
tctctccctt ttcacgttat aaaatgggca tagtcattac acaaatgcat aaatcaacct    38100
caattttctc atctctaagt gagaaggttg gactggaatt aacaagagga tccttgaagt    38160
tctttcgagc tctgacatcc tcatccattg caaagcggct gtgaaactgg attatgtaag    38220
gtcctgtggc cccaccaatt gtttggcaca tcctgtcttt ttccctagct agataatgat    38280
gtggctgagg gcagggactg tgcccacact caccaggtgc atgtgagtca gcgtctggat    38340
tgtgtggccc cgctggggct gccctggctg tatcacatgc ctcttgtgcc catctcatac    38400
ccctcagcca ccctctgacc acagcattgc ccggcgtgcc ccctgcaggc ttttattctc    38460
ctgcagcccc agggcctcct caacactatg atgtgagtca cctgagaagc ccagtcccac    38520
aggcatgcac agctcaggag tgcaggactg tcaaggactc ttgcagcaac cctcagccat    38580
gtggtaggta tgtggggtgc agggtgggga ggcagtggca tacacactcc ccagaagctt    38640
cagtgggatg gagatcagct caacaacaca cctttgactt gacttcccct ccttctccac    38700
ttcactcccc cagcccctca ccctgctccc tgagctctcc tcccaaataa actgcatgca    38760
tgcaggcaca catgaccagg ctgaggctct gctcttagtg ggataccagg caaagacacc    38820
tgccctaggg attggagcct aagccagagg aggcaggagg gtttagggca ccagccaaga    38880
agtgctttcc agatgctgag tgggatcccg aataagggaa agggcatcta acatagaatg    38940
aggaggagat aacacaaggg tagaaataac caagaaaggg gatttctctc agatggcttt    39000
agaggtgctc ccagccattg ctgggctcac atggctcaca tgtcataatt tttgccaagg    39060
cggtttcact gccaccacca ccccgctcag cctccagtgg cttgtccacc catggctgtg    39120
gcctctaact gggcaggatt ttataggcta ggaagaaaag tagggaatgt taagggagac    39180
ggaagtcaag ttcaacttgg aaccatccca gaatgtccag caggaaaggc ccatggatgt    39240
tataggctac aaccctctca gtgctcagcg gaggaactag gagcagagag ggtgagtaag    39300
tcaaaggcac ccagaccttg tagggaatcc tgtgtccctg caggatgcag aatggatgct    39360
tctgaaccct gccacaccct cagggtacat gtcagagcac gtgtgtggct gggacaatcc    39420
tccatctatg ttcctcactt acaccggctc cagtttagga aacccaaaag gctacaacca    39480
acccaccacc acagtgacca caatgtactt ggtgacacct caccttgaca cgcagccacc    39540
tgccagtgtt cacaaatgtt ggttttcagc tttatgcgag ggtaggatcc aacaagctca    39600
ttctttaatg aaaaagaatg aaattgtaaa atatcagatc ttattacatg tcctaagggt    39660
aacttttatc tcataacact tttgcttcaa tcatgagtgt ataatttcta tttgattttg    39720
tgtctatggg gttaggtgtg caatgtagaa aagcttgaaa accattgcct tatacccatt    39780
tgaaaaatga accaccaaac aaaggcttaa aaacatgaat atttgtcaac caaaaggaga    39840
actcctgggc ctggaagaaa catcacgatt caagtgctgc agcacgaaag aagttgaggc    39900
tggatttgta ttcagcttga ctgtttgtaa agcaccatgc accatgcaac tgccttcagt    39960
tccttttttt tttctttctt tttttttttt tttttttttg agatggagtt tcgttcttgt    40020
cgcccaggct ggagtgcaat ggcacaatct cggctcactg caatctccgc ctcccaggtt    40080
caagagattc tgctgcctta gcttcctgag tagctgggat tgcaggtgcc tgccaccaag    40140
cctggctaat ttttgtattt ttagtagaga tggggttttg ccatgttggc caggctggtc    40200
tcaaactcct gacctcaggt acttggcctc caaagtgctg ggattacagg catgagccac    40260
catgcccagc ctgccttcag ttctaaccac taaaggattc gtgttctcaa ctgagaaaca    40320
gccatatgga ggggcttcct gcaagggcac tgaagatgtc agagatgatg cctgtggagc    40380
acctggcaca gaggagctgc cctgctgact gcagcacagc cagttcacag gggtgagccc    40440
cggcatcagc ttagggagca tcccttcttg cagctcctcc ccctagcaca ctctcccacc    40500
tctgctcgca caggacctct gtccaggagt gcttacggca aggtttctgc ctcaaaaaca    40560
gggcttttgg ggctaactgg gagtgtaagg gtaaaaggaa agcttccact aggccccccc    40620
gattgttcac tggaaatgaa gggacaatag gagattaata ggagaagaag gcatacaaat    40680
gtattaacat acataaacac aggagccatg aaaatatgag gctcaaagaa gagccagatg    40740
actgaagttt aaatagcacc ctcttcatag gagagaggga aatgggggta ggtaattttc    40800
aaggttagta aataattttg agggaaatca aatggaccca gaaggcagac attttcctgt    40860
aaatgtcctc ttaggaagct gaatgggact gcaatttaag ggaaagtgag gggcaaaact    40920
gcattgtgaa caaaggttgt cttattacat aggtaaagtc tccctagtca tccctcaaag    40980
ctgccctcag aagaatagat gaaaagcctg ggcttagtga cagcttttac tcttttctcc    41040
ttgcaggtgg gtggttaatc tttcctggtt atttgatgag atttctaggg agggggcctt    41100
aagacagttg catttctttt ggaaagaagt gtccatagtc agatatggaa attctagaca    41160
gcctcttttt cctgcacttg gggagggggc agaggagaaa caagagaaga ttggaaaatt    41220
cttggttctg aggcagcttc taaggacttg cattttcctt taattcaaag tgctcagcct    41280
gccaacactt cctactttgg ggtatcattc tctgtgaccc cacaggggaa tggggtctgt    41340
cctcagagaa tgggggagga cctcaaggca gcagggcaga actccagggt gagagtcaaa    41400
gatggtttcc tggacctgag actccagtgg ggttcatgct agagtcaccc cagtcttcag    41460
gctcactgcc caaacacgca cttgaggaag tctgtggggg cagctccttg ttttgttcct    41520
cactgtcatt ttccaaaagg cagacaagcc ctggccgcct tatgcccagg gctgagtcca    41580
caccatgcta cacgagcacc tgaggggagg ctcctctcca aagtgcatta ccagggcctg    41640
tgctaaattt ttcagcagcc tcttgtctca ctaatggtcc cgggaaatag actaagcctc    41700
catccccaac taagtgctca ggcctccccc acctctgtcc tgcctgggca agaagcccag    41760
cgccgcccca cagcccagct ctccatgcag cctcagctcc cagtggccct ctgccaagga    41820
cttgcgcctc tgcagtggga tgcagtgcct cattttatcc ataattgtac gtggtccctg    41880
tgtgatgtcc ggggacgtga aaagttgtgt ctcatttcat ttgggatcca gttaaattcc    41940
caaatgctgc aactgagcag gaatctcagt gctcagaggc cagcagtagg aggagtctgg    42000
ctgctgggcc cggacacctg gcctctccgg cctctgacca gctctggcca ttggtcacca    42060
ccctggcttt gttgggtatt aatccaccac actctgcctg gctgatccct gagtcagagc    42120
caggctggga tttgtgggtc tctgagccca ccagcctgtg actcccaaaa agagagcacc    42180
cttgctactt ggaaggcttg ccaccatgcc tagccagcac tcttgctttc taagctgaaa    42240
tcattataag atagtcccct actaccttct acccagaaat gtatcccctc acaaagtata    42300
tgttcccacc ctatcccaat cctaccatcg tgatttctga gtactttcca gaaaactgtc    42360
tccactggct cccaagggca gagcacttcc tccagcctct ggaatgtcca ccatgttgat    42420
ggtgcatgga tgataatgac cccacggatg agctctctcc agtgggatca cgaagggaga    42480
atgggatccc tgactcccca cagaacagct cggcccagct gtgaggttga gcaaatacac    42540
tcaaagctca gcgttaaccc aagtccagcg ctctcagctt acacaggtgg cagcccaatc    42600
ttagtgctcc actcaatcca tgtctatgta tacttaattc tctggaacta aaatggggaa    42660
tagggccagg caccatgact caagcctgta atcccagcac tttgggaggc cgaggtaagt    42720
ggatcaccta aggtcaggag ttcgagacca gcctggccaa catggtgaaa ccccatcttt    42780
actaaagata caaaattagc caggtgtggt ggcgggcgcc tgtaatccca gctacttggg    42840
aggctaaggg aggagaatca cttgaaccca ggaggtggaa attgcagtga gccgagatcg    42900
agccattgcg ctccagccta ggtgacaaga gtgaaactct atcttaaaaa ataaaaataa    42960
aataaaataa atttttttaa aggccggagg gactaagatg ggagtgggaa ggagggaggt    43020
tccagctcaa tcctcaccag cagatattcc tgcatcctcc atacctgagc cttcagacca    43080
atgctcccca ggcccaaagg ggacctccct ttcaagtata aggctcccct aattcctcac    43140
cttaggatct ttaaggcaga tgactgcctt aaagaacata tattccttgc agcaagaaaa    43200
cccaactccc aacaccccac agagtgtggt ctggcctgga caagtctgcc ctaagaaaaa    43260
agcgacaaag acccttagta attgaaacag actttaagta ccataaagat gagctttcaa    43320
tcattaaaaa aaaaaacgtt tactgagcca ggcaccaggc ctaggaacag agaggtgcat    43380
ccaggctgcc atgttaggtg ggcctgggcc ccactgctgg ggtcagaagg tattagaaag    43440
ggtctggtct gctgggcgcg gtggctctca cctgtaatcc cagcacttag ggaggccgag    43500
gcaggcagat cacctgaggt ctgcagctcg agaccagcct ggccaacatg gtgaaacccc    43560
gtctctacta aaaatacaaa aattagttgg gcatagtgat gggcacctgt aatcccagcc    43620
agctactcag gaggctgagg caagagaatt gcctgaaccc aggaggcgga ggttgcagtg    43680
agccaagaaa gcgccactgc actccagcct ggatgacaga gtaagagtcc atctcaaaaa    43740
aaaaataaaa taaagaaagg gtctggaagc tctaggtgac ctcatgctca catctatacg    43800
cacaccttga tacattattt atggatcagg tggcacagca ttgcaggcag cagcagggca    43860
aagacagtgt ggaatcagag tcgggcagcg ttggatggga ttccggttct gccaccactg    43920
gctatgtgat ggaaatctac cacatctctc caagccttgc tgtcctgttt tatcaaatga    43980
ggacattgta ctgaatcaca aggtctgtac aatgcccgtg catgtgcctg gaatcttccc    44040
ctctggtgtc ccctcaatgc ccatggtgct tcctgcacag ggtgtaccat agttgcttgc    44100
tgtctcctgc tgaagcctgc tgtgaagagg gactgtgtgg aggtaaggca gtgggcctct    44160
ccctgtgagg tcctcagggg gctgaaggca aagtcagaag taaaaaaaga gaggggggac    44220
ccatccccaa ccagctgcca tcccagggca ctcagcctaa ggccactgca tttgcatgct    44280
atttacataa atctgcatat acactgtatt cccactctat cttgtaggca attattgcat    44340
ttaggcagct ctgcattcca ggaaggggca caagcagaga tgtgatcccc tgaacttcat    44400
gacaagaagg tacccgaagc tcctctccca cctccagcag caaatgtctc ccctggggct    44460
gtcctgtgtt gtgtttgaac cctgctctgg ggctcctgcc cgccacctgt agtggctacc    44520
atcagaagtt cctgttaatt ggggatggca gggtcaccac atctctactc ttctcccact    44580
tctcagcagt tctaatttaa accaggttag aatcttccca cttggtagtc tggtagggaa    44640
attatagtta acaataattt attaataagt taaaatagcc agaagagaag aactgtaatg    44700
ttcccaacac acacaaaaaa gataaatgtt tgaagtgaag cattgaagtg atgctccaat    44760
tatcctgact tgatcattac atattgcatg caagtaccaa aagatcacat gtacccaaaa    44820
atatatacaa ctatgatata tcaattaatt ttttaattga ttttttttct tattttcctg    44880
tgtagtggca gaatcacagt tcactgcagc ctcaacctcc tggggttcaa acaatcctcc    44940
caactcaacc tcctgagtag ctgggactat aggccctcac aaccatgccc agctaatttt    45000
ttgtgtgttt ttgtagagat gggggtctca ttttgttacc cagctggcct gtaactcccg    45060
ggctcaaggg attctcttgc ctcagccttc caaaatgatg agattacaag tgtgagccac    45120
cgactctggc tgatatatca attttttaaa aaaaaggttc ttctccaggc ttcaatgcga    45180
cttcacctat accaggtgtg agcggccctc atgtccaggt gggtggggcc aggcatctgc    45240
agggacctca ggcttcttgg attgtttggg atggaggccc aaggaggcgg aaggtctggg    45300
gtctcaccca agctggctct ccccaaggaa taagagtaat cacatgggcc tggagcagaa    45360
aagggaagag aagggtcccc aggaatgatg atttctgggg cttcaggaaa gagtgtggaa    45420
ctgaatggca gagctaaggg aagactagga cttacaacca ccaaaatcag gccctccagc    45480
tgggttcggg gccaagggag agtgcagcct ggcttctgcc attctccttt catccccctg    45540
gagcttctga aatccacaga attgtggtga aggacaagga gccaagggct cacaggcgag    45600
gggaggcggg gaattcaatg tgttcaaggc ctacattgca catctgccct tggtttactc    45660
tatctaatgt tcccatttga ccggtaagaa aactgaggct caagattcaa acccaggtcc    45720
ttgtaacttc aaaaaccttg ttctttctag gtgtcaaagt caatagatgg gccacggggc    45780
tagcagtcac ttctcttcct ggacttggca gtcaagggat aggacctgaa ctaaattgcc    45840
tttctacaga cttttcagcc ccaaccagag gcctgctgca ggcagttgtt tgaactcctt    45900
gattaaatgt tcagcccctg gcctgggcgg cagactccca acacacaaga cttactgagt    45960
cccccaaata gacttcaaaa cacagtcctg agactctgcc tgccagttgc ccattaagct    46020
catcccagcc tggcatcttc ctttgttggt ccactctccc tatggctacc agggagaaag    46080
tcttttcaga gatgaataag ggcgtccaga caacagagat gtagtagtag gaggtggaac    46140
caaaacagaa ccaggggtct gaatcctggc tctgccactt tctgagatat gtcacatcag    46200
acaggtgact taacctcctg tgtctcagtt tccaaattca aaaacggaaa atgtattatg    46260
acgatcagat gagttaatac agtcaaaatg cttcttagaa cagcatctgg gatgtagcaa    46320
gcactcaaaa acatattagc tattatgatc acacagagat gcatacctcc taaaatcttt    46380
ctgggctccc accgccagca tgataaagcc tcacttctca ccaaaggcaa atcaggcctc    46440
tcatcatctg cctcctccct ccccagcccc atctcccgaa gcgcctctca gggcacctct    46500
gcccttgcac aaggcagggc ctgttcctag caactctcag agtagcagtg gaagtttcca    46560
acaccaagat ctcagatacc tcaagctggc aggagtgcga ggtccaacaa gaagagattt    46620
tatgaatcag ccagccatgg gggtggggca tggccaggtt tcctgattcc cagaccaggg    46680
tgccaacaac acctactgtt catgtgagaa aaggagaaag aggaggaggg gccactggcg    46740
tcttttgccc acctggggtt cctcgctgtg ggagaggggg aggccagagg acagcaagtt    46800
ccctgagagc ctctcagaga aaaggagggt ttagatcatc acacaggata aggaagaaga    46860
ccttttccaa gggggtggag cagagcctgc ctggaggtaa atttcctttg ggaactgtct    46920
tcttcagtat ttcccttcct ctctgaacac cgtttctttt cctttcagat tatctgacag    46980
ccttttaatg aacacctact aagtgcccag cactttcctg ggaacttaat tcttacaacc    47040
tgttaagagg tctatacact cattttacag tggaggaaat ggagacttag cggagatgtg    47100
aaatttgaac caggtccgtg tggtttcaaa gcctgcgcat gttcctttac cctatggaag    47160
cctccagaag ccaaggtctc atctcccctc ttccctggag gccccaaacc tgggtagctg    47220
tgcccctaga cctttgaggg agggtctcga gccattatct cccttacctt ttcttgcagt    47280
gacttggctt ctcccaggct gccgtaacca gcaaacgcct aaagatggct ctgagacgat    47340
ggccttctgt gtgtgtgtcc atgaaatcag gtagtacacc acacagaacc agactctcag    47400
tgacatgcct gatattccac agacctgcat ccgagctgtg cagatctcag gtagacacaa    47460
ccagtgattg gggatggctg gtaggatctt gcctaggcag gccagggagc tctgtgagga    47520
gtgtttggga gaaaatcccc caggttcatc tccctgcatg gactgcccct gctgggccct    47580
cacactaagc tggtcctggt cctcagtact gagggatcac cacaggtgtg taggccacag    47640
ctcacaggag ccctccacct agcgggtcaa aggtagtgga agatctgaga gtcaggcaga    47700
cctggtccaa atcccggatc tgccatttcc tcactgcatg atactaaaaa agtcacttct    47760
tcatctgaaa aatggggctg atcccaccca ttctgcaggg tctcagtggg gattgaaggg    47820
ggctgacctc aatgtagcac gatgcctgcc ccaggtggga cttcagcaaa ctctctttcc    47880
tttcccttcc ctccccttga aggccaagac caaggaaaca gaattgggca tgccagaaca    47940
tatcccagcc ctgtggggtg tatttacctc cacttctgat cacagtgtgt ttgcgtatga    48000
ccttgaggcc agtgactttt acaccttgcc tatgctgggc tgggctgtga cttggctgtg    48060
acttgcctgc cctgaagcca agcctcagct gacatgtgtc tttccaccac ccctgctgtg    48120
ctgagtgagc accagccacc tgtcccattg ttcctgcccc aggctgtgtg tggagagtgg    48180
tctgacaggg cagacaacac cctacactcc agatgtgttg aggtgagctc tgggggtcag    48240
gaaagaagca gggaggggca cagtgtgaac atcctgtgca gatttccccc caactggccc    48300
cccagctggt tgggttttct tttctcagta actcctggca gaagtccaag gaggcctcct    48360
tctcccaaac cctctgtcct tggctcaaaa atccagcaga ggacgtgcca cgaccacgaa    48420
aggtgacagc agtcaagggg aaagaggact cccttactgg agtgcacaga agtttcctat    48480
ttattttgct tacgcggttg actttttcca aaggctgctt gggacggctt acctcgaaaa    48540
gcttagcaat aaggctagta gtaaatcaga caaaaaaatc atggactggg ggaaagaaag    48600
tagcatttaa atatatttaa taaggacgat atagtcgtga acatgtgcct gagtatcctg    48660
gctaccacag taaaagggga aatatgatca gttatgggaa aagagtaaaa atattaatca    48720
tgattttttt tttcttggag ctttgtgtaa taggcactga tgttgaaaag ggtagagtta    48780
tttttccata tttgtagaaa ttcagaagat tatcagacta tttgcctcac aaggactttt    48840
tagcaagcaa aaagtatgat attgtcatgc accctggtga ggggaagtgt catccagttc    48900
taggtttctg tgaatctacc ttgatgcagg tgttcaggga gtagtgagtt tcctcagttg    48960
taatgtagac cagcgcttct caaacttaaa cacgtataca acctcctagg gggtcttgtt    49020
aaaatgccat tctaatttgg gagctttggg gtggcctgac actctgccat tctaaaaccc    49080
tcccaggcca tcatgatcac caccttccga gcagcaaggg gttaaaaccc aggcatctcc    49140
catgatctag tagtgagtgc ctttctaatc gcccccagct gaaaggcaat gcaatgttat    49200
catagacggg caagaagaat ctcttccttg gctctgtaaa tgcttccggg atgtgctggg    49260
tcagcctccc tccattctgg ttggcgatct tggtctagtc acaagccaag accgttgatc    49320
atacacaaaa gtttaagtac ctactacgcg ccaggaagct ccctcagaaa gatggttggt    49380
cctgctcccc cacccaccct ccaccctggc atcttttatc cactcttcct tcagcaactg    49440
cctttatcaa tgctcccttg agccaaaata aacaaataaa aagcaacttc ctttggaagc    49500
tactccatac tcttgcgctg gccacagtta catctccctg cagatacaca gattctcatg    49560
acacagagct cagacagtgc ttcctctctg gagggctcat gtttcgagag aagactggaa    49620
ggaggacaac cttatgctcc agtagaattc caaattctgg ggtgcaggga catttcgtgt    49680
gtgtatgtgg aggggggggt gtcctaatgc cctgtaagcc acactttata atgctgtaca    49740
atattgggtc accatcatgg gccatggaaa gcagaatctg tgaggttcag tcccaggctc    49800
cagcacccct ttgtcagctg gcctccccgc tcagtgccct ctcccactac ctgccctgcc    49860
tcagctctga ctgctgctga tgtgcctcca cccatcaggt cattgtgatg gcaaagacaa    49920
tgcctccatt tgccctgaat gcagccttac ataggaaaga gcttcctgtg ctccagaact    49980
tggaggagtc ctgcagcacc tggtctagtg gggagagcat cagtggggag cggcaccttt    50040
cctgcagcca cggcccactg ggcaggacca gatccaagtg gcctggcttc tggctagggt    50100
gtcagagtac attggggcat acagcttccc gtggccatct cgttttcatg gaggatttat    50160
tttgtgaagt ggacctgctc tgtcccatcc tataaatgct ggattaatcc aagaagctga    50220
gggtgagcaa catccctctc cttcctgatc aaataagaaa taaatctaga ttttctcctg    50280
gatgctattc tcttcttagc caaacagcta accttgtctt caaggaaaaa gggcaatccc    50340
aggggctctg taaattgaat attcagcaac tccaggggca gacatcccta agtgcataag    50400
tggagcaccc ctctgaatca gcatcacacc agctgggggc ataaaaagga gagcagagta    50460
ggcaggagct gtggggacat ttctgagatg ctaaaagagg caaggaagtg tgaggacggg    50520
tgtgcattca tgcaacaggt atttactgag cacctactat gagccaggca gtgctctatc    50580
cattagagat acggaattga ataaaacata aaaatccctg cccaggagga gctcacattt    50640
ctatgggaga agacagttac tgaaaaacag tccaaaaaac tctattttat agtgtgttca    50700
gaggtaatac aggctatggg gaaaaaaaga aagcaagcag gtacatggat gaggaatggg    50760
ggcgatcagc gtgggcctca cagaaatgat gacctttcag ccaagacttg gaggaggtag    50820
ggagggtacc tggggatgcc tagggtccag gcaaggggaa cggcaggggt caggatcctg    50880
tcagattcat ctgaggtggg actgaatgtg agcagagaga gggagacaga ggatgagggc    50940
agagagaagg ccaatcacac tgggccacgg ctattgcaag gactttactt ttgctggggg    51000
agggggtaga gttttgagca gaggagaaat gcgatctggc aaacatcttg caaggatggc    51060
tctgactgtt ctatccttgg cagaggacac cagagtctgg cccatagaag gtgctcaaca    51120
aagctcagca cattgcactc ctccctggag taggaaaggg ctcgtctgct ttgggaaatt    51180
tggctctcaa gcttctggaa acacctgacc ccatgccagg tgagacaagc tcacactcaa    51240
ggccccctta gtccaacggt cagtggacag aacaagcacc aaaggtcaac ggcgtgggcg    51300
gtggcctctc tgccaaagtg tgtgggccca agtagggtat tcacctccct ccctgtctgt    51360
gagaaatttc agacccctct actttttcca gcaggagttc atgttccttt taagataatc    51420
ctctatagac ctctggcagc ccagccttca aaatgtctcc ccctgtctct cttactcatg    51480
gagagccccg cttccccgcc tcaaaaaaaa gtcttcctct ctcttactca tgcatggaga    51540
gccccacaaa aagacactgg ttcccaggga ttcttccaaa gatgctggaa gacctctcag    51600
tgtttgcatt tcccaagctc ggtttccttg tgctgtcctt gggcattaaa ggaaggctat    51660
tcagccatcc ccatcagcag gagcaggcat caaaagaaca gctactgcag ggggagcata    51720
ttaggggcac cagagggggc taggaactgg gtcttgtctt ctcaaagttt acaacccact    51780
gcaggggcca ctcaccagcc ctggcaccct aagggcagga acctccattg ggcacgtgtg    51840
tctccagcac tgggagcact gtctggcacc tggggcactg tgagtgttga atggataaag    51900
gacctgtaag aattgccata agaggtgttg ccctggggca aggtgggaca ggaaagttct    51960
tgcaagagaa gagaggctct ggccttgggc cctggctgag cagagagctg ggaggtgggt    52020
attcgggtag gaggaaagct gtggaggggg aaagcaaact gcctgcgggg gtgggggggt    52080
tctcggcggg agttgggggt ggagggaaag gcgctttaca gcagcactcc ctccacaggg    52140
agaccagagc tctgcctctt cctccccacc gtgccctttg gggtccagtt gtggggcctt    52200
ccttgaggcc cagctcctgc ctctggcctc cggaggctta tctccccaac agaggctggc    52260
tccccagaaa acaggattct tagacttcct aaaaataacc tgaagctcct tatcagaggc    52320
taatagtgta tgtctcccag gaatactcta gaaagagtac caggggtcag gaacccccac    52380
tcagcctcca cgaatctgag cggaaaagcc cgggtctcct cacctgtaaa gaaaataact    52440
gcagccggca aatgtgacca caggtgagaa ggggcttcgg accagggcgc acacctctag    52500
agaggtgccc acagacagcc tccccttact tacgccctgc ttcgctgcag tgctgtgaag    52560
ccatcggcat tggaagtgcg gagggcagcg ggcagtgccc cagggggaag gggggacggg    52620
tagggtttca gagcccagaa ggcctagaca gggaggcagc tccgggagaa aggtacccgc    52680
catcccaccg gtcttggaac ctgaggactg ctgggaaggg tcaaaagtct gccctaaggg    52740
tggacaaggg acagagattg gggggggacc acaaaggcct gggcgcaacc ttgttgagag    52800
ggaagggatc cggacccaat ctggagccct ggtctcttcc cacctgcaac cgtggctgcc    52860
acttggcctc ggttataaaa tggacaagga ttcgaggtgc tcctcaggtt aagagagggg    52920
ggcctagagg tcaccctggc ctcggtgccc tccgtggccg ggttaagagg aggtcccgga    52980
gttctgctca cttcagccgt gtgccgggca ctgcaaatca ggaagtgttg gcgccggctg    53040
gcgacctccc gcctggggcc aggggaggag ggtggttgga cgctgccacc gctgccgggg    53100
ctgtgcaggg ctgggcgggg agcgaggacc cggcggctcc tgattgcggc cccgggggag    53160
gtggccgagc cggataagct gcggcgggct ggagggcggc cacctcccct gcaggtccgg    53220
ccctcccggg cgggtggggc gcgggggagg aggagcctcg ggccgagcca ccgccttcgc    53280
cgcggacctt cagctgccgc ggtcgctccg agcggcgggc cgcagaggtg agtgtaccct    53340
cccccggtct ccgcggggct gcgtgctgcg cccggtcccc gagacgcccg cccggttgca    53400
ccctgcgccg tcgctgcgcg gacctcgggt gccgccacac gtctggaggc gacttctgtc    53460
ccctgggacc gagccacgtg cgcccggcgg cagagaaacc gggttccggg gcccccaccc    53520
cgtgtgcctt ccttccctag gcgtggaagc cgcttgcgcc gcgcaggtta ggcagggccg    53580
gcggcgacag tggcggggag caggctccgg agccccgggt gcagatgtgg gcgcccctcc    53640
ggatgacccc ggctgagtcc acaggtcccg tgtgccccac ggctggggct ctggccagcg    53700
gtcccaaagg agggctggta gctgtgggcg gggatcttcc aggctcttcc tcgccagacc    53760
tcccagtccc ttcgcagccg aacagggcag ggacaggggc aggtgcaggg gctgggcagg    53820
ggcgcccgac cttggtcccc aggaggaggc tggcctcacc agtgcccgcc tctgcccgcg    53880
gagcccttgc ctggcaaagt tccccctcct gcccggcaaa gctccccctc ctgcccactt    53940
ccccgaaatt tggggacagg ctgcccggag aggtgtggtt ggaactttgg tcactctggg    54000
taaatgaagg ggagggtgtg cccagataat atgcggtttg gggaccagaa agccggatcc    54060
gtggggagaa gcaggaaggt cccgctggag ccctggcaga gggcacagag aggcctccca    54120
aatatccagg gccacctcag agatgggctc cagaagtggg gattctggaa atgcccccag    54180
ggaggtattt ctgtccatca gagtgcagcc ataatataat taacagcaga tattcccatt    54240
tatgtgtgcc aggcatcttg ctaagggctt tgagcacaat atcccagtta atcctcacaa    54300
caggaaggca ccattatctc ttgttaaaaa tggggaaaca gcctcagaga gtccacgtat    54360
tttgcaagga tacacagcta ggaagttgca gaagtagaat ttgaacccag agttatctga    54420
cttggagccc agaggaacct accactgggg cgaaacaggc tgtgtcctca cggggattct    54480
ggcagcccca agaatacagt gctgagagcc agaaggtcca caaaaccaaa gggtctcacc    54540
tgggtgtgtc ctctcagtca cctgcaaggc ttgttaaaaa tatagatccc caagtcccat    54600
ccgaagctga ctgaatcagc taggggcacc tggaggaccc agactatgtc ttactcatct    54660
ctgtccctgg tggcctgcag aggggctggc aaggagcagg tgcttagtga atgtctaatg    54720
ggtaagtggg cggggtgggg tagatggtgt cactagtgtc ctgaaggggg cttaaatgga    54780
gcaggtggcc tcagccaggc aatccggcag caggtatgga agtgacacag tctaatgctg    54840
gcctcagagc cagcagggag ctcaggctgg gccacttgtc cacctggggg ttgaacagcc    54900
tgccccaggt ttgctgaggt ccccaggacc aggccaggtc aagctgggat cacacatgtt    54960
ccctctccag cctagagatg tcaaacaggt agattcctct cccattcata tctcctatcc    55020
ttggcccaca gcccttccct tcttggactt atcagagacc aaggtgctgg gcagggcttc    55080
aggtggttaa aaagtgaaag ttcttgagtg aagtccaaag gcgcacacct gagagctgag    55140
tgggcaaaag gtcgctggct gagtgctggg gatagtctgg ctttggagtc agatggacga    55200
gtccaaatct cagctcctta ccccgtaaca tgaagccctc agctctctga acctctgttt    55260
atttgcaaaa ccttgccaag ggcttcaaac aggatatcct cataaaacaa gtatgcctat    55320
ttgggggact aagtgtgtga agtgctgagt tttaggagtg cagtaaatat cggatccctc    55380
cttcttcacc tcaggtttgc gagttaacca gtgaggggcc ttccaggcct agtgctcttg    55440
tagaccgaac cactagcttt cctagagaag gcaactgagg cctagagagt ggcctccagg    55500
ttccgtgctc tgtggcagag ctggccttgg ctccaagtcc cagggttccc agctcagtct    55560
cagctgatgc ctcccagcct ggcggtctac gctgcctgct acattccctg tccagctaca    55620
aatgaacaac tgagagggct ggggtgagat tcaggcaggc tggggcaagg gaaggaagca    55680
ggtcatttgg ggagtcgggc tctctggtct tccagctgag gctggatcca ctctttcctg    55740
tccacccacg gtgcgtagtg gccaggtctt cctgagctga gcaggttgag cactatgaaa    55800
ctgctttcta gcatctagac cagggagttg cctcttgatt taaaatgagg atgtttacca    55860
gtttaagtag ttattaaaac ctaaggccaa gttggtgcct ttcctccctc taggagttgg    55920
aagggtgtgt gcttttttct gctcctaccc cacccctgcc aaaccatccc aatttgagag    55980
gctgtggaga ttacagaact tggagaggag aggggcaggg atcggggttg gagactagat    56040
ggttttcaaa cattgggcta cagaagtccc tcttcctccc atctgtctcc tgcagctggg    56100
tccacccacc tgtccaacac agcctcccac aggtcccggg cctctttgtg ctccaaccgt    56160
cacatccttg gcatgccaca caccctcacc atcctgcctg aaatgccagt cctcatcact    56220
gacattcagc ctcccatgtg ccagcatccg ggccaaacac tttatctaca ggagctcatt    56280
tgtacctgga gactcttagg aggtcgataa tgttattctc ccaaccatgt gactttccaa    56340
ctccatatgg accccaacct ctttttttcc acccctaacc tgagactcct agccactaac    56400
taactgccac attctcctgt ccaaattctg cctcatcggt tattcattca acaaacactt    56460
accgagcact aactttgagc caggcactct aagaccagct gagtcccact tctggcagga    56520
tgagtgttgt tgtcatcaac caccccacaa acacccgtgc cctctgcgta cttgcgaatc    56580
tgagtgagga gacacggtgg cagtaaggct caggacctat agctcatgtg agtgagcaag    56640
gatgcaaaac caaagacacc cgctcccctc acccactgag ctggagggat caaccactgt    56700
gcctgccatc agggctgatg ggcgactgct tgtggatcac aaactcttgc gttgtcactt    56760
caacccaggg gcagagtgtg ttcctcttca ggtgtggcct ggtctcgtga gccctgcact    56820
gaatgggcca ggcgttcatt gcttcagcac cgtaagaaca ctgtcaccgg agaattgttc    56880
gatactcaac tcttcccagt cagtctgtct tctgcatgcc cacagttacc gggcagcgtg    56940
ggcaacaagt gagcactgat tgttccgcaa tcaggctgtg acttactcca tctctgcctt    57000
ctgcttaatg agagccaggt gggagttcag caaagatcac atgtttaagc cttgttatta    57060
aacacgttaa aaaaatactg ccccaagatt ataaagccga cttcggtaca tataaagaga    57120
tttggggtcg gtgaatgggc ccactaagct ttattttgtg gtgtcagctg tcttggttca    57180
tgtgtagaca gcagggctcc caaagccagc atgctggggt ctgtgaggga acaagcttcc    57240
catttcttgt atttatttat ttatttattt atttatttat tttttggaga cagaatctcg    57300
ctctgtcacc taggttggag tgcagtggtg ccatcttggc tcactgcaac ctctgcctcc    57360
cgatttcaag caattctcct gcttcagcct cctgagcagc tgggattaca ggtgtgctcc    57420
accacaccca gctaattttt gtattattag tagagatggg gttttgccat gttggccagg    57480
ctggttttga actcctgacc tcaggtgatc cacctgcctc ggcctcccaa agtgctggga    57540
ttacaggtgt gagtcaccac agccggctgc ttcccatttc tataagcatc cgactggtgg    57600
ggtggccagt aggctgtggg gagtggtgcg tgattttcct ggtgggcttg agagagtaac    57660
agtatacccc cagtcagggc aagtgtctct ctgaaggtga actctgggtg cacagctaga    57720
ggatacagtg gctgtgagct gggccctcca ggtgaggtct ggcctgccca ttgccacagt    57780
gggcttgctg gcatccaggg gggctttctg ggtgactgcc caggcctgca catgagtcag    57840
tagcacgctg aatgcagtgg agtttgaggg gacccaccac tgtccatcaa atcgccccaa    57900
cctgggtgaa aggccagagc agctgcggga agtgacacca ggccctctgg agatgaccct    57960
ctggcccttg gagatgtctc tggactggcc agaaagaagg tggtgcctgg aactggaagg    58020
gaaggaagca agacagtgct gggcccagca gccagaaatc agggtgatgg gtgggtggag    58080
gggcaggcat ctgggaaagc cctgccctcc tggtgttccc agatctgaag gctggaggct    58140
ggaaaccttg tgtcacctgt gctggtgtga gttccattgg ggctgccgct taccctccca    58200
tgacctttaa catctggcat ggcttgtggg gggtgctgag aggaggagaa gtctcaaggc    58260
tgagggagct cagggtagag ccaaggtctc agtgagaacc ccagggggca gctgtcacag    58320
ctgacctgga gccctccagg aacgcgtact ctccagctcc tgtactctca aaagcaacag    58380
aaaggtttgc tttcctcagg tgcggtttcc tcacagtgca gcttctccaa agagatctgg    58440
agacccccca gcagctttga caggaaaata gagtcctatc caccccacac caacacactg    58500
aagtagagac tctgggcctg gggctgccca gaaacccacc cacttaaact gcccgggcga    58560
ttctggtgtt cacaaatatt tgaaagcact gcctgacacc tgctggctca acaggtgtcc    58620
acctaggctg gagtacagtg gtgccatctc ggctcactgc aacctctgcc tcccaatttc    58680
aagcaattct cgtgcctcag cctcccgagc agctgggatt acaggtgtgc tccaccacac    58740
ccagctaatt tttgtattat tagttcacct aagcagagag cgatgtgagg ggctgtgagg    58800
atgtgcaggg gtggagggca cttaggtccc tccctcagct gaccatagag cacccagagt    58860
ggcagagggg ccacgtgcag tgagtggcca cagcagagca aggaaaggtg cacacaagaa    58920
cagtcctaag gaagacatgt gtttaggggt ttcatattca ctgtttaatc atcaggacag    58980
agagggaaag caacctaccc aacgtcacac agctagcaca tggctggacc ggaattcaca    59040
cacatctctg tccagctagg tcccccaact aacacagctg cctgtctgaa ttcaaagccg    59100
ggagagattg tcaggggtgg gcgttggggg agatggcagg tgccttaagt gcccaaggcc    59160
ttgggctgga tctttaagga agggggattg ggatgggcca ggaggttgtc aagattggag    59220
atggaaagaa tgccattggc tgtggtgggg ggtggagtgg gcagggactg gaaggagggg    59280
tagtggaagt cagtccctgc ctacaggcct gtgttagact ccgcggagat tcaggaatct    59340
agccctgccc acaggggctt tcactccagt agaagagagg agacccaggg ggccacagca    59400
gtcagagaac aatgaggcct tggcttggtg tttggtgatg ataggggaaa cctgcccaga    59460
acctgtttat cagatgctca gggatctgaa aaacaggttc tgcatgtggg cttgagataa    59520
agatgcccgg gatacttaga tgtgccctat tccaagatcg ctaggttcca aacaagttga    59580
aaacaataga atacacttat ccctaagaat gggcttgcac ataattcact tcaacaatgc    59640
aaaagcttcc aaacctccag cctcctttgg gctgccggtg tggcctccaa ggtccactga    59700
aaagccatcc ccagccagca gaaacatgcc tgtgtcttct tcagcccccg tccatgcttt    59760
gccctggaga caagtgctgt catctgtttg tgggtctgtc tgtctgtctg tctgtccgtc    59820
tttctcccca ctgtgagcac tgacaagcaa gtaaagatga caatgaagcc tttgtgggca    59880
ccaaatgctg acagcattat cactaagcca gtggcagcca tggtgactgc aataaatttc    59940
ccccacagaa attgataaat tgccactttc tgcagccatt atgtttgcct ttgtatcccg    60000
aagagtaaac gcctctctcc ctttctctct ctcgctcacg tgtgtgtgcg cgcgttagat    60060
gacatttatt cattttatgc atcctgggtt ctactggtcg tcccacctca gttcctgtag    60120
caaagagact tgagtctgag ccactaatta tcacccgtga ggtttcctcc ccgagcagga    60180
agcagcaggc cagagctgcg ctctctcagt gcactctcca accaagcatc agtcaccact    60240
cccggtccag cccctgtggc caagagctgg cgtgcaggct gcgggaggca gctggctgtg    60300
caagaccctg gcagggccct cgcctcctga gaaaccgaga gtcagaacca aagccaggct    60360
gtcctggttg gagactgagc cagaaagggt ggctcacctc acggtgaggc tgtcgagtga    60420
cctgagagcc tcagaccctc acgtcagccg gatgtcgcac cagcctgctg ttggtaagtc    60480
tggctaggac gcagatccaa gggggcatgg gtcgtgtgca aacccctccc accagctccc    60540
tcaccacctg acccctgccc tgctggaggg tgccccttga atctccagga ggtccgagga    60600
actcgacacc tcccagagat ctgtactgcc ttggaacagg ctgcaaaaag tgcagtatga    60660
aatgggaaat atgtatcagc tgcacgtttt catggccccc tttggaggaa agggagtcca    60720
ggttattaag tcaggaggct tttaaatttc aggggttcaa ggatttatca cacacagttg    60780
cgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtttaagga tgttaatgtt    60840
tatgatgcat ttctgtggaa tgcaggccca ttgggaattg taaatttttc ttattggtaa    60900
ccatttctgc attggtttag cacggaactg ctgctgcaag taaatgaacc agatttttct    60960
ggaatgattc gaaaatctag ctgtttgtaa aaagctctct aaattattca ttcactttta    61020
ttttgcacag ttgtgtgacg gtaaactctt ttccatcaga cgaaacttgc gcgcacgtgt    61080
atttctgcgg ggattggctc gagtgtgctt gagttttctg tattctcttt tgtaggaact    61140
tctcagcctt ccttttaaaa agataataat tttttaatga tgtctaaata atgattccag    61200
gcagtattac aagaaatata acagtaaaac gtttgtaaga gtccatcaga aagggaaaat    61260
gcccacagag aaaaatagaa atctaccaat tagatgtgtg tggctataag tgagctttta    61320
aaccatgatt tgagactggc atcctctggc ctctctgccc tcaggtcagc tgtgggaggc    61380
taggggtggg atagcaaaag ggacctggga tcaggtgggg cttcctggac cccaggccca    61440
gtaagaatga agcctagggg ttctaggata gggggcagcc ctggatttgc agaaacagcc    61500
tgagaatgag gggctggaaa gtatgagttg gagcagctca gtgaggagac agaaaactga    61560
agcagaagaa agcagaagac accagagtct ggtgctgact gggtgactgg ctgttactca    61620
catcctgagc aatgagccac agaccctccc caccccagag gcagcttgaa tgcagggact    61680
ggatgggccc agggcacagt ggatccgggg caggcaagag ccaactcggg gcccagagga    61740
ggacctttaa cctgactggg cctcagtttt ctcttctgca aagtagaagg aattatagcc    61800
ttctgcaggt caaaccctgt gcccacatcc acaggcacga tccccgactt cgcctcgctg    61860
gcacttctct gcatttgact cctggttatt gcagctgtgc ccatgccagg catttgttag    61920
gtgctgggat gtgcctgccc cgctcctctc tgttggggaa gacggaattc atgctgtagg    61980
ggaggcccgg agtttctaca tggggcagtc acagggtggg ggacttccct gaaaacttct    62040
tatttgcata aaatgtgcgc tgcttttgac ttatattgta aatttcagat ccataaaatg    62100
ggaaagactt tgcagaagct gttattcact ttacctgact gggagatgta gattgttcat    62160
atccaagggt gttagtttta atactaacat tagcatgtgg ggaagggtga tcgagatggt    62220
ggggagtagg gccccccacc acctacccct gggacctcta agggaaagta cacaccaccg    62280
tatgctagtt gcatcctgtt acctgtgctg cagagccaag gggccagagg cagggaaatt    62340
aattctgcct tgtaaaggca ctgggccttc ctgttgaatt ttgctacttg cggggaaggc    62400
acttcccagg caaaaagatt aagcctataa cctaagcaga aagcaagcaa gagctttggg    62460
tgggaagtgg ccagagacat agatcaggca gacccaggtt tggaagggcc aaggagacag    62520
cacatctgcc aatggcagca gctgggcctc acctgccctg acacccccac ctaatgggga    62580
ctgggcagaa ccctccaaat ggttgccatg ccctggccca ggagcctcca aaaaccctga    62640
agccattgac tcagcatccc tgaagcctcc ttccatgagt acccccatac caggctgcac    62700
ctcaatgcac cttagatctg gtgtttgatt ttcactttga ccagatctgc agcagtctct    62760
ttgttaatat ttatttccag tgtttacatt catctttgca taagtcctca gtgttactaa    62820
gtttatcaaa tagcgaaatg cttggccagg tctaacaatg tcaccaagct gcagaaggga    62880
ttagaaactc atagtattat tatttcatca ccactgagta caagagagcc ccagctaggt    62940
tctggggaga acagctatga ctcacaaata ctcccctccc aactcacaaa tactcccctt    63000
agaatctagt ccttaaatca ttcaaaccac aaaaatgtat tgagcactta ctgtgtgcta    63060
ggccccggta ggtgttagag gcacagaaat gagtttttta ttggccccca tccaatgagg    63120
tgacagacaa gagaaccagt gtgtgcagcc aatgttaatg tgacaaaaag tgcagagtta    63180
gtcccagagc gtgaagtcct ccctgtccta ggcccaggtg gaggccagga gctgctcccc    63240
gggctgcctg gaccagactt ttgagctctt gggaccctgg cgaacatcaa agctgttgca    63300
aaagtcagag ctcttgcaaa agttggagct ggcccatggc aggtggttga gaagtggcta    63360
catgactctt cccatgcaga gcggttagag ggtggaggcc gatttccagt atccctggga    63420
atccaaagaa agaggccact gaggggcagg ggagggcccc tccgaggctt ccagaaaaag    63480
gcagtgcagc agctgggcaa accaggataa ggcatgcatc cctaagccca aaaatcaggt    63540
gatgtgaggc aggccgagct ccatggcaga catgctgagc tgcctctgtg tgtcttggct    63600
aactctgccc tttcctaacc ccacggctca ccctgcccag gagcagggat gaggcccatc    63660
cctgattcag caaatcctgt gccataacaa ggggaggggt gggggcagcc acagcccaca    63720
agacccacca gtcccagggt ttgtgcagct ccaggtctcc ctggaaagca agaaaccacc    63780
cagctccaga cgctgaggct gcagattcag ctgccactgc ctgatggcct ccaacctggc    63840
tggattaact ggcccatagg gagctggctg cccccacaag ccagctccct ggcctccctg    63900
ggcaaactaa agccctcctc cctggctcca tagcgcccgg tcatcccctc attccagcac    63960
tttgcttctt cctgcattgt gtagctggcc tttctcctaa gagccttaaa agggcaggtc    64020
atctttggcc acctgcatgg ccccggcgcc ttgcttcatg ctgggtacac agcaggtact    64080
ctgggaataa caaataagag aatttgtcag aggaggtttg gcaggatgga ctattgcata    64140
gaactgcaca gactgtgcac tgcacgcctc cagagggcac tctccacagg gattactatg    64200
taaatggcac ctcctaaagt tgtgcagcat agggacccta gggcttgagc atgccccacc    64260
cgcctccgct gcttcaagcc cctggccttg gtgctgactg ttgggctttc ctcttcccct    64320
tcccaaccag cactgaccat catccttccc atacgctggc gatgggtagt aatgaactgt    64380
cccagtgagc agttctccca gactgggctg tcaaagcatg ctagtgagag attcctggat    64440
ggcaggcagg ccatctggat tcttgctcag ccaggaaact ctgtcctctg ggaatatcct    64500
cccagtcagg gtgttagggg gctcctggat ccccaagatc ttcatggtcc cctagaactg    64560
ctcctctccc cagcctgcag tgggcctaat gacccacatg tagccaggga gtggtcccca    64620
tggggtttgt tttattgact cagctaacaa tgccacaatg actctgattg ccttcttctc    64680
acctgagaga cccagctctg ggcagccaag gggtacgtag ggacagagca tatgcatgtg    64740
accctcaaga tctagaggag ctcagagaca gcatggatac tcgaagcccc cgtgagcagg    64800
gaggactttc tggaccaagt gggctgggag ctgggccaac tgtaaagacc cagggaaaaa    64860
aaaagtcaaa actgagttgc tcttgcatgc aagtgagtgg ttagttcatt gactccgtcc    64920
acagcccttt cctgagcagc tactgcagtg gttttcaaag tgtggtcccc acaccagcag    64980
caccagcaat tctggatgtg gagcccagca atatgttttc atcagtcctc caggtgaccc    65040
tgatgcagct caagtttgac ctgatgtgtc ctaagtgctg gggtttgcaa aagtgagttt    65100
tacttagttc tcaccttgag gagcttggag tgggggagaa gatagacagg aaagaaaaca    65160
gtactgtcca gtgagacgta ttgctctgga gggccatgga ggcagaggag cagttggtat    65220
aggcttgatc cttgcaaggg taagtggcct ggagacccca gtggcatgac tgtcctcggc    65280
agggaaccag atgttgggac cagcatcccc tagagggctc aaggagccca gtgccgaccc    65340
cagtgcccca gtgcccagcc accagggctg tggccctgag cagcaggtcc tcctactctt    65400
ccctccaccc cagatcttct gctctgctct tcccccttct tcttcccact cccaagtccc    65460
aaatagtagc aggtcttttc ctccgattgt cttggggaga aatgggcatg tacctccagg    65520
ccattatctt agagcacatt tttagaagat tttaaagtaa atttttccat taggcagaga    65580
acaccgtgta ttgatttggg tgcatctatt tctgctttac ccagacaaaa agatttacaa    65640
aatatcctag agaggaatag aattaaaaat  gagtaaattt aacaggctca gagcgtagca    65700
ctttatttgt ctcatataat ccttgccaca cctcattaag gtgaggaaca tcagcccata    65760
gtgcagatga ggaaatgggg ctcaggaagg tgaagtgact tggccgggcc gccagctagc    65820
aagtggtctg gtgggatatg aaattccatc cctctgctgg gcccttgctg gctgaccttg    65880
cagtttacta aggtgactga tcctgaataa atccagagtg ttctaacgtt ttgctgagcc    65940
cgtgtcctgt tggctgcatt gtggggagtg gcctggcctg gctagggaag ctctcagtga    66000
ccaattgtgg cttcagctgt gttatttaga gaatcccagg ggctgaaatg atcctctgcc    66060
tggttaggga agggatgact ttaggaggaa gagggaccta atgccccact tagcagatct    66120
gcagctgtgt gcatgtttcc acctgcacat ccttctataa accctcagcc atgtgggtga    66180
gcagcagacg gtgcctcccc cactccccct ggaacacatc tgccctgttc actgacctgg    66240
gagctggtgg ggtggacctc agaccccagc acttggcaca cacacatcat cccctgggcc    66300
ctggaatggc ttgcatggat ggcagagaaa tagctgtgtg agcaaaggcc aagagaacag    66360
tttagcccaa ggcaccattt ttacaacaac aacaggtaat ggtactgatt atataagcct    66420
cacttgtcca gaggtcacgg ggcttaggaa cctcaattat gtggaaaaca aataggacat    66480
aacttcagaa ggttgcagag ccactgtgct agtgtggtct ttgtgttgct ataaaggaat    66540
acctgaagct ggggaatttg taaagagaaa aggtgttttt caaaaggaag acaaacattt    66600
gaatgctctg gatttattca ggatcagtca ccttagtaac ctgcaaggtc agccagcaag    66660
ggcccagcag aggagtggat tcatatccca cctgaccact tgctagctgg tggcctgggc    66720
aagtcacttc accttcctga gccccatttc ttcatgtgca ccatgtgtgc agagatcacc    66780
tggggagaga ggaagtaaga gagagagaga gggtagggag gtggcaggct ctttttaaca    66840
agctgctctc gaggaaacta atacagtgag aactaacagg gaacttactt gctcctctgc    66900
cctcccccca gccagggagg gaatccaccc ccatgaccca aacacctctt attaggtgca    66960
cctccagtat tggagatcag aattcaacat gaggtttttg ggggacaaac ctccaaacca    67020
cagcagccac caacattggt gttacaaaat ccatccaatg acataggctc atggagcgcg    67080
cttaagctgt catccaaaac atgtttactc ttggtttaca cacactagta gcagtctgcc    67140
atacctcaat ttcctttttt attttaggta acaacttttt aaataacctt actgagctat    67200
gcctcacatc accacgcaat tcacccattc aaatggtgag ttgcatggtg tacccgtgag    67260
gatcactccc cattttctcc aaatccccca ttctggccac cactaatcta ctttctgtct    67320
ctattgattt gtttattcta gacatttata taagtgtaat tatgtaatgt ctggcctttt    67380
gtaattggct tctttccctt aatgctttca aggttcaccc ctgttggatg catacttagt    67440
tctctttatg gctgaatatt aatccaccgg atggataggc cacattttgt ttaaccattc    67500
ctcagttgat ggacgtttga attgtttcca ctttttgggt attatgaata atgggtgaaa    67560
atgtttttgt gtggatatac attcttcctt ctcttggata tatagctagg agtggagttg    67620
ctgggtcata tagaaactgt ttaacgtttt gaagaattcc caggctgttc tccacggtgc    67680
ctgcaccatt ttacaatccc agcagcagtg taggagggtt ctgatttctc cacatcctcc    67740
ctgtctttta aaaaaatata tcattgtagc catcctagtg ggtgtgaagt ggtatctcat    67800
tgtggttttc atttgcattt ccctgagggc taatgatgct gaacatcttt tcatgtgcat    67860
ttgtatatct tttttggaga agtgtctttt ccagtctttt gcccacttta tgtaggttgt    67920
ttgtcttttt aataccgagg tgtaagagtt cttcagatat ttagaaacag gtccccttat    67980
cagttatatg atttcctgaa cttttctcca ttctgagttg gctttgcact ttctcgatgc    68040
tgtgctcttt cgatttcgtc agcagcgaat tagcaggacc tggggggctt taagaggtga    68100
gcaggcagac agacagcgcc cacaaagtcc tgaggatgag agaagaggca gagcttacac    68160
aaaggctctg tgaaaactga agatggaccc caggcaggtt ggggtgatcc ctggggtgct    68220
ggatgaggat ctgattttgt actgcatttt ggaaggattt ctgcccccag aggctacata    68280
ggctccagtg gtgtgtgcag tcaggcagag agatgcacag aacctctaca gtgtgccagg    68340
catggtgtgg ggttctgggt gcatgtggaa caacacacag caatcttgcc ctcccaaagc    68400
tcagggaagt gggggcgggg ggtggacaac gagcacatga gaaaaagacc acaggggaag    68460
aactcccaga aacatcccag ccacagcgca atgccccagg tgtatatggc ccttggctac    68520
ttcatgccct tgagggaaaa tcggtatttt cattttacac ttgatgaaac aggttagaga    68580
aaggactggc gtgtccagta cctcccagtg agaagatact cagagtagac cccagatcca    68640
ggtccttcct ctttccctct ctacacgttt tcagtctaga aaagagttct gtgcgagaat    68700
ttttttgttt ttgtttgttt gtttgagacg gagtctcact ctgtcgccca ggctggagtg    68760
cagtggcgcg atctcggctc actgcaacct ccgcctccca ggttcaagcg attctcctgc    68820
ttcagcctcc ggagtagctg ggattacagg cacgtgccaa cacacccagg taatttttgt    68880
atttttagta gagatggggt atcaccatgt tggccaggct gtgtgcaaga atttatgttt    68940
tcacttgtgg cttgctgagc cctggtgctg gctgtgggca catactcgtt cacccaggga    69000
catgcactgt tgatgggtcc ttgcactctg ggctatcttg ggccccgttt gctcaatgca    69060
ggcccctctt tctgaagcgc ttttcttggg ctcactctca attcgtcaaa gttcggctca    69120
ggcccacctc ctgcaggaat cctcccagtc cccgctgtcc gaagtcagta cccttgtcag    69180
gagaccttaa acactttagt ccactgcctg gccctcccat ggggcaaagg tctccagggt    69240
gtgtgtgcac ttccttgggg cttcttaagg ctcattccct gggattaggg aggacataca    69300
gagcctcctt gcacctacat ttgtttacat attacttata ccacatacaa cgttataggg    69360
cactgctgca taagtgtaca ttttgaatgt attttactta taaagaaata gagcagtaat    69420
aggaacatgt gcccctaaat gtaattttac tgaccagaca aaaaaaattt tttttaattg    69480
aaaataagta gctggacgtg atagcatgcg cctgtagtcc cagctactca gactcagaag    69540
tctgagacaa gagaattgct tgaacctggg aggcagaggt tgcagtgagt cgagatcgcg    69600
ccactgcact ccaggctggc gacacagcga gactccgtct caataaataa ataactaata    69660
aataaacaaa aatttaaaaa aattgaagat aactgtgggc tgcttgagga caagaactgg    69720
gttattttct ctctctttgc tcagtcagtc cccacatggg aggcgtgcga ggcaccccgt    69780
tcttggcctg caggccgccc ccactccatc tggctgcagg gtgccacagc cagcctctga    69840
ttgccagtgg ccccagcacc tcaatccata ccgacctcac agcaaaccct ccgtggccac    69900
agcctgccct ggccactcat gtctgaaagg tgatcggtgt ccatgaagaa gaggccatgg    69960
ggctgtggat gtcatgtggc caactgttag tggcctgcgc aagagcagac aggagctggc    70020
aggcaggccc atgggccagg cgtggctccc agccataaac acaggctgta gccctgccgg    70080
gaagaaggag gggacagaca agcctgggca gagacccaga ggggaccagg acacccgatc    70140
ctccatggca gttctgtcca cagcttggga ggagaggcag gcaggtctgc aggcaggaga    70200
caggcctcgg cccacagagc tgcaatctga tcccatctgc tccctctcca gttctataaa    70260
tagaaccccc agggagccag ggcccagaca gggttagtca caccctcacc tcaggccgca    70320
gggacaggcc tctgggactt ccaagacatg taccacctgt cctgccccca acccctgcca    70380
gccttcagca ggagggttca tgctgagcat caggaggggg cagaagaatt gaacgtggcc    70440
actgtccatg aagaagttag agaagagtac acacaacaca catgcacaca agaataggac    70500
acgtgcacac acacacacac atgcatacaa gattaggaaa cacaagtgca cacacaacca    70560
gtcagaaatg agctctgagc ttttacacat attaactcat ttcatcctca aacagtcttt    70620
agagaggtat aattagtgtt cccgttttaa aggtgaggga actaaggcac agaggagcta    70680
tgtaactcac ccaaaggcac ccagctactg gcatgtgagg ccatgatttc tccccagcag    70740
ccccacccac agcccgtgcc tttaaccacc tgcctgaccc ctcccagcca agtggctccg    70800
tccctacatc agaaaggtca aggaagaggc cgcctaggga gcagtacaag gcagcattac    70860
aacctggcat tttcctgttg cagactgcat tttggtggca agagaagctt tggaggtgct    70920
taacgtttag tttgcattta tcctaccgct gaaaagcagg gacccttagg accataagtc    70980
taggactttt catagcaccc tagactgctg gggatgaaag gggcttggag ctgagctggt    71040
gcagcagctc ctgttagaga agccacccag agaggcccag ggacctccta tgtcccagcg    71100
ccagttaggg gcagacgtgg gaccagctcc cctcggctgc agcggcctcc atatcagctc    71160
cctggaaggg agcagatgcc aagtcaggtt ctgagcaaca ccctcaaggc ccagccctgg    71220
caatcccttc ccacctgtga ttaggtctgg ggttcaacaa aaataggact caaaatctgg    71280
atcttctcgc cttgcttcac tttgggctgg ttcagttttg tttcgaggta aatcattcga    71340
ggtttttcag ggatcctcag atgcatgtct gcgtgaagcc gtcctggctt ccccttcggc    71400
tgccccctgg gcaagagcct gggccatacc tgtgccattc ctgagctctg tctctagctg    71460
ccctatgtcc agtcattggc gatgggtctt attcaagccc cctttccccc aacccacact    71520
agattgtaag ccctcagggt ggggaccgct tctcactcat ccttatatgc ttaggagtgt    71580
tcagcacaaa gtcactcagg agatggcagg cagcggggag agggcagaga cagaggagag    71640
gcttctgtcc agagggttcc tacttaggat catccaaatc atcagcaaat gttggaaaga    71700
tggtctgggg gcctcaggct ggctactctt cctccccatc agggcaaaac tccccggggg    71760
cttgtgtctc cctgtggttg gggacaggcc tgggtgtatc tgtcccagcc ttgactgacc    71820
acaaggggag acttggccct cccgaccaca ggagaagagg gatttgaatt cacctcggcc    71880
caaattgcag atgctggcct gcgagccctg aggccatctg caaggctcct gggctgacat    71940
aactgtcacc cagctcttca tcctccttcc ccggggctga aggggtgcct gcagggtctt    72000
ctgccctccc tccacctggg ccctactgct ggcacggagc ttcatttctg ttggcagcca    72060
gtgtttgctt agtgattact gaatgccgtt tgctgggtgc ttatgatgtg ctcagcactg    72120
ttctaagtgc tttacacaat tgacttattt actcctacaa cctgcccata agggaagtgc    72180
tgccatggtc tcccttttat agctgagaaa actgaggcac agataggtcc atggtcacac    72240
agttaacata aggcagagtc aggaccagaa tccaggcgga ctggctccag agcccggctc    72300
ctggaccgag cagccttgag tagggacctg gtgcagaccc gcctgccgtg gactcactat    72360
aggatgggtc aggaggcccg ttgtcaccta caaaatgtag cccaccaccc aggaaacgct    72420
cccagaacca ggcagaaaat actgtctcct attcacaggg tggctgtgcc tggcgtgagt    72480
gtcttggcgg gtgcctgcat gtctgtgcag gagtgccacc cccatctgtg gactcggaaa    72540
gcatgatccc cacaaaagca acccctcaga gtctcagctc agccaatccc tgttatcctg    72600
tgacaggcag ggccatgttt caaaaccatg ttaaagatga gcaagaggct aaggaagttt    72660
cccatgctgg cagaggcagg acaggaacac atgtcccctg actcttgaca ttgagaatgc    72720
acccccttcc acccacctgg cctcttgtcc cagccagtgt ggtcccagct atgcagctct    72780
ctgggacatc tctggaaagc tcattgttct ctgtctgggc agtaagacgg agtgaggctc    72840
tgactgccga ggcagacaga cctgcctcct gctcttcctc ccctcaatta tttgtgctgc    72900
ctgaaacaag ttcctgagcc tccctgagcc tcagttccct cctctgtaaa gtgggaatga    72960
taactgaatc tacttcctgg ggttcttgtg aggaccagag gcccatcacc cgaggaaagg    73020
cctgacagca gcaatgggtg tatggtaggc atccattaat aggaactgct gctgctgctg    73080
ctgccttata aaaggaaaaa tcacagtttc aaaaacctct taagattgca tgatttgtca    73140
tctgagagca gagattgtga tctccattga caaagatgga agctggggcc cagggaggca    73200
cacagacttg tctgaagaca cacagctgct tcatagcaga gccgggccca gcctcctggt    73260
tcccctgccc catctttatg tcagtccctg gatccactcc ctcacctggt caggtgtcca    73320
gaggttccag gagagtgttg tggaaaagta ggaagaggca gacgcccatg gagggtgttg    73380
aaagccaccc cagctgctct gctgcttcag ggcaggggat cttaagccct gtggaactgt    73440
aggctggtga agcttgtgga cttctgctca gaataatgtt cttacatgca ccagacaaaa    73500
tagcttaggg ttacaaatga aatatattat atggaaacac agcgaaaata ttttttaaaa    73560
aagactacag tagcattagg catgcttctt tattagcaca ttaaatgaca agctctagtg    73620
gcagatctaa tgtctaccat aattttattt ttacttttat tattattatt attattatta    73680
ttattattat tattattatt ttgagatagt cttgctctgt cacccaaact ggagttcagt    73740
ggtgcgatca cttcagtctt caactcctgg gctcaagcga tcctcctgcc tcaatgtcct    73800
gagtagctgg gacgacaggc gtgtgccact gtgcctggct aatttttttt ttattttttt    73860
agagatggga cctccctgtg tggcccaggc tggtcttgaa ctcctgacct caagcgattc    73920
tcctgccttg acctcctgaa gtgctaagat tacaggtgtg agccactgca cctggctagc    73980
atggttttaa atttgtgctc aatttaaatg gtattaggat aaattattta caggtaaatt    74040
tatgatatga tcttggtcag tattaatgaa aaattatgtt gcctaccttc atacttaaag    74100
gaaatagcaa attttagtta gaagttggtg acaattaata tataataatt tttccatcca    74160
agtttactgt agaccgatgg cccgagttca gggtttcctc cacatccact catatcttgg    74220
gctcagcaaa gaagatcaca gggcacccac tctatcttag gggcccattc acttgtctct    74280
cagtcctgcc ctcagagatc aaggtttggt gttcattcat tcattcattc agcaaacact    74340
gagcactgcc tccgtgccag gctatgatac acagtgaggt ccaaggtcag atgagatgag    74400
gtcctgccct caagctgttc accatgcttc agggagagca taagaagaac tgctccaaga    74460
tgcaaaatgt agacaagcat agggacatgc tcacccttcc tggtcatcaa acacccagcg    74520
atggtgaggt tggggttaga tggtcactcc tggctagtga cactgtccat tgcctaatcc    74580
ttttgaaaag aagtatggca ctgcatcaca ttggtcatgg aaattccaga gttccctttc    74640
ccagcactct cactctgcca gtttttcccg aggaaatcat tcagcaggag ggacaaaggg    74700
tggagggcag aagtcatccc tgctcttcct gagtctgtgc tctccccagg gaaggggctg    74760
tgttgtgttc agcttgttcc cctggtgctg acacgtggta gcactcggtg aacacctgct    74820
gggtgaatgt ctgactgccg tgtagttacg atgtataaga ggagggaggt ggcagaaggg    74880
gcagtccagg agccctccac tgaccaggtt cctgacttct cttgcagcca ccaaaatgcc    74940
agaagagatg gacaagccac tgatcagcct ccacctggtg gacagcgata gtagccttgc    75000
caaggtcccc gatgaggccc ccaaagtggg catcctgggt agcggggact ttgcccgctc    75060
cctggccaca cgcctggtgg gctctggctt caaagtggtg gtggggagcc gcaaccccaa    75120
acgcacagcc aggctgtttc cctcagcggc ccaagtgact ttccaagagg aggcagtgag    75180
ctccccggag gtcatctttg tggctgtgtt ccgggagcac tactcttcac tgtgcagtct    75240
cagtgaccag ctggcgggca agatcctggt ggatgtgagc aaccctacag agcaagagca    75300
ccttcagcat cgtgagtcca atgctgagta cctggcctcc ctcttcccca cttgcacagt    75360
ggtcaaggcc ttcaatgtca tctctgcctg gaccctgcag gctggcccaa gggatggtaa    75420
caggcaggta ggttctgggg gaataatacc catcgtaaca ataaatataa atggctaatt    75480
ttcatcgagt gctgccagca tgctcttttt gatatgttat cataactaat cctgcatcac    75540
tgcaaaattc cattttacag aacaggaaat tgtggctcaa agacattaat gatcttactg    75600
aaaattccat agctggtaag ttgggatttg aacccagttc ctatggatct gaaacccatg    75660
ttctttctgc tatggtaaca gggtttccta gagggcaagg aggaaaaggt tgatggcttt    75720
ttgctatttg gagccaagaa ggagagagac ttggctttta gaattggact cagaaggagg    75780
aaagtaacac acttatgtac ccggccctga ggaaggcagg catgtctcaa attttatcgt    75840
atttattcta agggcttcca agaactgatt tctcagaaaa gtcaacagca ggtttttctg    75900
gggctagata atggctccac ggaacagcta gagctgcata cgtttcttgc cacgaggagc    75960
tcttaccaag acaaggtggt ttttaatgcc accttggttt ttaatgcatt ttcttggcga    76020
aagaatgcca gactccatgt gtgagaactt ccaccagtga gtcgagccca ggtgccaggc    76080
tctgtaggac agtttaaagg tgcccagcca tacctgacta cagcacctta aatgcaggct    76140
gcatcatggg actcccaggt atggaccagg aggaacagtg gagagtgttg gatgcagggc    76200
ctggagggaa cggagcaagc aagctggctg gaaaagactt ggaggagggc tttgacctgg    76260
gcccacctca tgctgtcagg ctcagggagc agggagtgca ttccagtctg agggaacaat    76320
ctgaaaaggc acagagataa gaaacaatgc tcctagacct cagttttctc acctgaaaaa    76380
tgaagactat agtacctacc tgcgggctca tggcaaggct gagagatcat atatgtaaag    76440
ctcagcatag agtaggtgtt cagtctgtgt ttggagacta aactgaccaa tgcagtgtca    76500
acaaggccca cggggtgctt ggggatctga ggactgcaat gtgcctgcag ggggacctcg    76560
tgggtcagag cagcgggctt caaggcggag agggcaggct ggagctggct tgtagaaggc    76620
cttatgtgct ggctgagggc tctactgagc cgagggacat catcaagggg ggtgattctg    76680
aactgaggga tggagctgca gccacagctg cccattctgc accatacgca aaactctttt    76740
gctgagcggc tcccagggca ggccacggcc ttggagacag ccatgtcggg ggcccatggg    76800
gactacctgg atgagcattt tgcttgtggt tgctgatgtc cacgagctgg gcaagatgct    76860
tactgtttgc agcttccctc cttgagtagt tggcctggct tggcaggtgg gccagaggct    76920
gggaggcctg ggcagcagag aaaagacccc tagcctggga gctagaaccc cattggctcc    76980
cacctgtacc attgactggc agctcacttg aacaagtccc tgcccctctg gccctcggtt    77040
tcctcagctg ctcagtgagg ccctgcccac tcctgtggcc tgtgacgccg tctgactgcc    77100
ccacttttct cccgcaggtg cccatctgcg gtgaccagcc agaagccaag cgtgctgtct    77160
cggagatggc gctcgccatg ggcttcatgc ccgtggacat gggatccctg gcgtcagcct    77220
gggaggtgga ggccatgccc ctgcgcctcc tcccggcctg gaaggtgccc accctgctgg    77280
ccctggggct cttcgtctgc ttctatgcct acaacttcgt ccgggacgtt ctgcagccct    77340
atgtgcagga aagccagaac aagttcttca agctgcccgt gtccgtggtc aacaccacac    77400
tgccgtgcgt ggcctacgtg ctgctgtcac tcgtgtactt gcccggcgtg ctggcggctg    77460
ccctgcagct gcggcgcggc accaagtacc agcgcttccc cgactggctg gaccactggc    77520
tacagcaccg caagcagatc gggctgctca gcttcttctg cgccgccctg cacgccctct    77580
acagcttctg cttgccgctg cgccgcgccc accgctacga cctggtcaac ctggcagtca    77640
agcaggtacc caccccatgc ccttcctccc tctggcaact cagcacatgc ttgtccagca    77700
cctccccccc ccaccaacca ggtgcagccg atacccacgg gtgcagcctt accaggtgcc    77760
aactgcagat tctgttccaa tggggcagca cccacatcct cctgcccaag attttgagta    77820
tcagtgaaca aagcagatga aaattcctgc ccccatgggt acagcccagt tggggcagac    77880
ttaaacaaaa tacagcagtg agtcatagtg ggcgttgaga ggatcaggag tgctaaggcg    77940
caaaggaaag caagcgtggg cggtgggggt gcaggtttga agatggtcca ggaggacttg    78000
cagagtgagt gctatgtgag cagagctgga aggaggggag aggggccggt ggcctgctgg    78060
ggtgatgttg caggccacgg ggcatagtcc ttgggcagaa gtgtgcctgg tacgttggag    78120
gagcagccag gaggcccatg tggctaaagc tgaacaagga gggggtggca ggcgaggcct    78180
gagaggaaga gcttcagcct taggctccga gtgaaatagg gagctggtga aggtttgaat    78240
ttaggtgttg atcggcctga cattttaagt ggttctctct ggtttttggc tgagaacaga    78300
ctgtaggagg tcaaaggcag ctagctgctg gggccagcga ggaagccgtg catatgccca    78360
gatttgaggc agtggaggct ggaggcagtg ggagcagtgg aggagcaagg agatcctgaa    78420
ggcacatgtg aagctggagt gcatggaatt gccgctggaa tggccccagg gttttgtggg    78480
tgatcaggga tgactctggg gtttgggtct gagcacctga aagagagagt tgccatcagc    78540
tgagatgggg aaggctgcag gagtgagcat tccaggttta ggtttgttgt tgttgttgtt    78600
gttctttgtt tgttttactg ggggtggcac taatcattca tttagaaaat tcatatgggg    78660
cttggttgcc agcagggttc ctgggaagtg gaggaccttc aggccacacc aggtggggac    78720
ccaggcatca gctggcacct gtgcccacag aaacaggccc ctgatgctcc ctcctggtcc    78780
acaagctcat ggggcttgat tcttagtccc aagctcacat cttcagcaac actgtcttta    78840
ttttctccaa attaattcca cctccagtgc ccagccccgg ggctggttga tgcataggtc    78900
ctgcccactc caggacgcta gtcacccaac agggttcagc ccaggtgctg gtgagacact    78960
tctcatccac ccctcattcc agcctggcag cccctgcagc tcctgctcct gctcagaatg    79020
cagggacctt ggtgaggctg ggccctcccc taaacaccta gcacagggcc atcccctccg    79080
agcatggggg attggcagga ctgggaagca gggctgggca cctcctgaga accacagacc    79140
tcagccccta ctcactgtca gggttgctgc ttctctgcca gcagctactc gactgccctc    79200
gtcctttgcc acccacagat accggcatca ttgcatctgt gggctcagaa tttcctaaga    79260
caaaggaaga accccagact tcaggcagaa aagcaagatg cttgatggaa atgagaggaa    79320
gggaagaaat cagtcatgaa cccttaacaa gagctcgctg tgttccagga accattctaa    79380
gagcttcgta caccactgtg aattcattta accccatctc atccctgtag gccaggtgct    79440
attatatcct tatttcatag atgagaaatc tgaggcacag aggggtcaag taacttggcc    79500
aaagtcacac agtcagtaag tagcacagct gggattcaga tccagctatt ttccagatcc    79560
atgcttatac ccacgctgct ttctacaggc aaaccaaatt cacaattgag taaatgattt    79620
cagaactagg tcattcattc actcattcac tgagcaccta ctctgccagg ccctggggcc    79680
acagaaagga gtaagaaaga cacagaccat ctggctcctc gcctcagctg gtgtggggcg    79740
gtgtggaggc ctgaaggcta gaggctggac tcctgctctc cagcatcgct gactggaaca    79800
aagatcttga ccttgagcaa gtcacagccc ctcttttgtc ctcgaggccc tgatgtgtag    79860
atcaagctct ctcctagtgc taatgttttc aatgctcttt gacgatattt tcttactgac    79920
ttctacaaag caccagcccc ttggcaggag gctctgcggg gctccctggg gactagtaca    79980
atgttgctgc ccaggacggg gcagatctgc atggaggagc ccactccctc tcccctgagc    80040
tggcaggtat ttccagcagc agtgggaaag acggggacgg tgcccactac cccccagggt    80100
aaaagacaca ccactgctcc ctccctcccc tgccaccctt caactgcctt tgtctaaatt    80160
ctctgccctg ccaaggctct ccctgatatt ctgttaaccc aattctgccc tgatgcaaat    80220
accagggcac agaggggcgc atgcaaggta attttccccg tgtcccaaaa atctttaggg    80280
ctgcaggccc tggtgaggtt gccaggcaac catccctccc gcaggacgag atcagtcaga    80340
gacaccgaag gcctctcatg caaaggggct taaacttgtt ctgcagagtt cttaagggca    80400
aaaccagggc tgatgtggtt atgtcggggt gggtggtcgg agggaggcag gggcttgaca    80460
cacagcagcc cagatacggg gaggtgccca agcctgggca catccaagca gattctggat    80520
ggtccatggt aagccatgcc cgcggttctg ggcctgggca cctgaggctg ttctgccttc    80580
agccccaaac agcagggact cctgggtggc tcaggcttga tgtgtggctt ctgctgccag    80640
cccatgggca cctcaccaca gggtccccac atggccactc accaccccaa ctgcccacta    80700
ggcccttggg tcaagggagc acattagtct aggcacaaga aactcctcca agatttcctt    80760
acagccctga gtctgcagat taggaggcaa aggtgtatgc cagctgtaga gaaaaccttt    80820
gagaccatgt ttacagacag tattattacc aacaataacc gatatttgta cagggcattt    80880
ggatttgctt gtgtatttcc ctggaaatac acatttcaac atcaaactca aagatcaaga    80940
tcaaagaaat gtttaacctg cacactgttc tcctgttacc ttcaccccgt tctcctatta    81000
ccttcacccc aagctacatc tgcacatggc tggcacagga tggtctgaaa ctctcatctg    81060
accatgtcac tgctgaaaag atccagtgac cccagtgtcc ttgggataat ggtagaaccc    81120
tcactatgca gctagactcc ctccgcagcc tcatctcccc ttctcctgtg acgtgtcaac    81180
acttgggtcc catactgtcc tctaaatggg cagagctcat tcctctcggc ttggaacgcc    81240
caccccagga caccttgaca gcttgcaaac tcctattcct ccttcaaaac cctacctctg    81300
ttaagctccc ccagactatc cccttacttc cccatacctg cctctgtaat ctgttgcatt    81360
ttgtaaatac ttttttatta tttttcttac acactacttc atacccgact cagaggtcca    81420
tgactgggtc ttctacacct tggggtccat ggttcctaac acaggttcac agtgcatgct    81480
cactgagtga ctgattttta aattggccac cacagagcca atatcaggca tcttaagagg    81540
agtgcacgta gagcttggag caagaactag tctaactgcc ttgctgccac taagaacaac    81600
agccatttat tacattaagt gcccactgtg tgcctgttcc atgctactca ttccacaaac    81660
gtaatgcttt tagtcctgca gtaacacagc aagatacaat gatgctatga gccaggaaag    81720
ggactgccca gggtctcatg actgcccacc agtggcagag tcagcgtcag aatccaggcc    81780
tatggtctct atgccccaag gttgcccttc cacaccctgc caccccctcc tcctctgagt    81840
ctggcaggca gtgagttggt accactctct tcccatccat cacccactat gaagacatgg    81900
agaggggcta atgctgcagc ctcactggtc cttcagcgtc tgacctgcaa cctagaggga    81960
aatcccacac ctgaatgctg tctttccatc tcttgttgat gaacactctc cttggccttc    82020
tcaaggagaa ggtggtgaac ttgatcatct ctaaacatag agacttactt actaggggag    82080
ctgttacatc tgcgttccag ttagccatgt gtgccactgg tcaccaggga gctctgagca    82140
caacactgtg gtttaatagg ctggctgaga atctcatgga ctcctaaggc tggcttaggt    82200
tctgtcctca tgcgggtctt tgccatccac tgctccctag cccacctcat ccctcccttc    82260
ccagcgtcac tgcagactgg aaatgttaga ggaaaaaaac aaggcatttt acaagccaat    82320
gtggtatacg tgtgtgtaat catccaaact ctgacttgtg acattaactg cctgatcttc    82380
ccgaggcgca gagaggaatg actaatgaag cagagttaaa gaacaaacaa cttccagcga    82440
ggagatgact tactcaattc atgctgtgag gtgtgagtaa gacttctctg ggcagaggta    82500
cggaggagac ctctctgccc tctgcacgcc tttccagcta atggtgactt caaccacagc    82560
aggcacataa gcaaaatcaa gagaatttca gacatgacct catccaaacc tcctaggtag    82620
agaaactgag gcccagagac agtcttgcca gagtcacatg ccactggtgg tcaggacaag    82680
aggctgggtc cctagactcc tggtccctta gtggcttaaa gtcaccaaag tgagccaggc    82740
ctgccctaaa atagaacaga gccaatcatt tttcacagat tgcaggaaaa gcactcaatg    82800
gatggcattt tctctgtttc tttaaacttt ctcttataag ctgtacaacc attttgctca    82860
gcccagtgga ttcactttta atattttatg tggtaactga gctcgtgttt ttttttttct    82920
gctgaaattg tttctcaaaa aacctgtatg agtcattctg ttttgagagg ctgcctatta    82980
aagtgtagtc acatcttcta atggaaatac tgttccttgt tctgctgaca ttatagaata    83040
aaagtaccag catttcacag tgtttcacag agaacacctt gacttccagg aactctgcta    83100
cccggtctag ttgcaccttg ataaaagttc ttcctcatga gggcactatg cgagtgagtg    83160
ttggctgggc taggaggggg ctcagtggca aggtggggag agaagggtca gaaatctcca    83220
ggttcatagg ggctccccaa tttatatgtc ctggaacttg gtgggggggc ccagatctct    83280
gtgagggcag ggtaagggca ggtatcttta ttttctgtag cccagggcct ggcacacagt    83340
aggtgcttcg taagtggtca ctgaactgct tggtgaatgg ccgtcagtct ctcttgcctg    83400
gcaaagttga gccaaggctg tgtgcctcag gcagaagtag agaactgggt aggaagaggg    83460
gaggctgaga gctttgggtc ggggagtgtt gggggctcag tgtctgtatg tgtctttgta    83520
tgtcctgagt gtgagccagt gatgggggca gtgtggggct ccaggaagac agagggctca    83580
gggtgagaca ggctgggaag ggaagcagcc agtaaggtgt gagctcattg gctgagggga    83640
ttcagagcta ggagagctcc tctctcctgt cctgggattc tggggccgga aaaccgtgag    83700
acggagccat gcttaagggc tgtatttctg gttgactcct tactctgctg atgtgactgt    83760
tctgattggc tgccccgggg cagatatgtg aaagccccag gagccccggt cattggcacc    83820
aggctgagtg ggtcctgatc ccagctctgc atctgttagc tacatgtgac cttgggaaag    83880
tgatttgatc tttgtgcctc atttcctcca tctctaaaat gggctaatag tgatctctac    83940
tttgtggggt ggttttgagg attcgatgag ttaatgcctg agaaacgctt atcacagagc    84000
caggtagcgt caggtgcagt gtgagcgccc gccgtcttgt ctttcttgtg tccttcatca    84060
ttgccctccc ggggcaccag cctttgccac agtgttcatg gttttccttc catccatgtc    84120
aggtcttggc caacaagagc cacctctggg tggaggagga ggtctggcgg atggagatct    84180
acctctccct gggagtgctg gccctcggca cgttgtccct gctggccgtg acctcactgc    84240
cgtccattgc aaactcgctc aactggaggg agttcagctt cgttcaggta aagtagtctc    84300
tagtctgcca gccagcttca gcgtggccct ggcccacctc tcatgagtaa gtgctctgcc    84360
tttgagaact gcctgggctc tgatcatctg cacagcagga ccactcggtg agatgccagg    84420
ccttcctgac ccagagggcc catccaagcc tcttgatagg ggctgcctgc tacaagctta    84480
acctcccaac acatgaggaa gccagacaca ggcatgtgaa aaaattacag accaggacac    84540
tgagccctgg gtccaccatt ctcaagcttc tagaattctt gagctttcca aacaaaattg    84600
aatgacatga agtcattgga cattttgctg gtctaggtag gagtcatcat ctacctagac    84660
atccatctag gtaggagtct agggagtgag cgagcctagc ccaccaccct ccacccctca    84720
tctcaacctg gctctgttgt tccccttaac cccttgattc atgcagcgtg gatgagacac    84780
aagcattagg accccagttt ataggggatg cgacacagct ttttcccaag gatgccattc    84840
ctatgaaaaa atccagaaaa aggaggtctg tcatcagatg aatttgagaa aagatttact    84900
tccccctaag agatcacaat gcactttggc acatcaaaga ttcgaataac atctacaaca    84960
aacaaacctt tgttaatcag acttattgga gtgttagcac cctccccctc cttttttcca    85020
aataacagct atcagcactc cacaagctgg gcgctgtggc atgtggctgg gatcccagct    85080
actaacagag gctgaggtgg gagaatcact tgagcttgag cgattcttcc aggagttaga    85140
agttcaagtg tccagcctgg acatcatagc aagaccttgc ctcttaaaaa aaaaaaaata    85200
ctccacagaa catactctgg gaaatgctgc tagtggcaaa agtttctttt tgcatttgtt    85260
cattcaacaa acatttattg agcacttact gcaggccagg catcctgcta ggcctgtgat    85320
gcaatagaga acaagacagg cagagccatc tttccatgat aaaggaaacg gaggcaggga    85380
cattgtttac atttctttgg catctcccac tgttctccac acagaatctg cggtcagtgt    85440
tggcggatta actcctcccc tcccatgagt gggagctgac taatgctgta tcctgccatt    85500
gtaacagggc agagaacagc catcctatcc acccccacta tcaacagaaa tctgtgcagg    85560
gaggacgtgg tacaggactc agggacagtg acagcgtaat gctcttacgt aatccaaatt    85620
aattgctcct gaccagggat gcttcacatc cattggaaca acacagagtt gtagccgtgt    85680
gttttttaaa gtgtgtctgc ctctgaatct ccctggctct gctcatctca gaaggtccct    85740
ggaggagggc tcatggctga cacatgttag catacgagaa ggggaagaat tttatttatc    85800
tgccactaat ccccatgtgt ctcataccca aatctaggat tttcctcttc ccacctggag    85860
tatccggcgt gcatggttta tccacaatta aagcagactg caggctgctc ccctcaccag    85920
aaagccgctc ccttaagcag ccatagatta catgccctgg ctctgcctgc cagagaaagc    85980
cggtggattt gattttgtta gcaagagctg actgagaccc tagcagctgc attctacttt    86040
acatattaaa gagtggaaat acaaatagga cagtcctttt gccactgcaa gagcaggggg    86100
ggttaggtgg gtagaaaggc aggattttac ttgtggaaat cagtgcctgc cttccatcca    86160
caaaaaccag atgtcaatat ggaggaggca catgtcagcg gcgcctggga agcctgagtt    86220
ccagctttcc ctccccacaa ccctgctctg taactgtggg cagagcatgt ctgctccaag    86280
agcctcagtt tacacccctg aaaaatggag ttaatgcctt acagggattt tatgagccac    86340
agtaagagat tatgtgtgaa agaaaaataa aaagcatttt gctattattc ttagggtatc    86400
tggccacatt tccattatct ctgactaagg taccaaccac cgatttctga gttcagtagg    86460
agacagtgag acagaggcca aggaacccca accctgggcc taaaagtggt ccagtcagtg    86520
tttgcaaact ggcggacact cactagtggg tcatgcaatt gattccatgg atcacaagca    86580
gcattttaaa aatgaaataa aatagaatga caaagaaaac agtggagtgt tttgcatggt    86640
gtcgggatac tttttcagtt atatggaatt gctagtttta tttgcaaatg tagcatacct    86700
cgttgtctac cggacagcag agtaaaacat ggttcttact gtgagtccct gtcaaatagg    86760
ctgaagccag agccctcttg gagaaacaga gataacccag gcctgcctcc catccgtgga    86820
ctcagatgct gagggatggc tctggcaatc tatttttgca gctccctaag tgactgatag    86880
gtgcgcatgc cgcagtgtgt ggcaacttcc agtgcaggaa acacaggcag tggaacccga    86940
agacctgaat ctcagtccca agacccccac ttacctgccc cgcatcatca gacaagtttc    87000
ctaggccctc ggagcttctg ctgctcactt gtgcctgtgt ccaccccata tggtcatcaa    87060
gaggatttga gctggacacg ttaaatgcag gatgcgtgca gccaacagtg gcatgctggc    87120
ttttgaggta agctgcaacc ttctccttta aagttagcgt ggctagtgag aagttacctg    87180
agccccatca ccctccccta cacacatgtc cacagcagac accaggctat ggggacagcc    87240
atggttcttg aggggccttg gctgacccct agatctgtaa tgcttttgtt accggaaaag    87300
ggtcccgatc cagaccccaa gagagggtta ttggacctca cgcgagaaag aattcaggac    87360
ctgtccatag agtaaagtga aagcaagttt attaagaaag caaaggaata aaagaatggc    87420
tactccatag tcagagcagc ggcatggctg ctcagctgct tatacttatt gttacttctt    87480
gattatatgc tgaacgaggg gtggattatt catgagtttt ccaggaaagg gatggcaatt    87540
cccagaacta agggttcctt acctttttag accatatagg gtaacttcct gacattgcca    87600
tggcatttgt aaactgacat ggcgctagtg ggagtgtttt ttaacatgcg aatgcattat    87660
aattagtgta taatgagcaa cgaggtcact ctcgttgcca tgttggtttt ggtgcttttg    87720
gctggcttct ttactgcaag ctgttttatc agcaaggtat ttatgacctg tatcctgagc    87780
cgacctccta tgtcatcccg tgactagcaa cgtttaacct cctgggaatg cagcccagta    87840
ggtctcagcc tcattttacc cagcccccca ttcaggtgaa gtctctctgg tttgaacacc    87900
tcagacactt cgtttagcta aaaaccattg aaacagtgta ttgattccac aaagaggtga    87960
cttgtgcttg catttatcct tttgttccca aatctgtttt caaagtttta catgttgttt    88020
tgtgttcctt tgggtatttt tttttttttt tttttttttt ttttgagacg gagtctcact    88080
ccgtcaccca ggctggagtg cagtggcaca atctcggctc actgcaacct ctgcctcccg    88140
ggttcatgcc attctcctgc ctcagcctcc caagtagctg ggactacagg cgcccggcac    88200
cacacctggc taattttttt tttttttttt ttttgtattt ttagtagaga tggggtttca    88260
ccgtgttagg caggatggtc tcaatctcct gacctcatga tccgcctgcc tcggccttcc    88320
aaagtgctgg gattataggc gtgagccacc gcacccagcc ttcctttggt atttttttgt    88380
tattgttttg gtttggtttg ggttgtgcta agtgtttcaa ttcagccagt tttaactggc    88440
tgttagatat tagactgcaa aatactccag tcagagcagc tcacctgcgc agaaaaatga    88500
gggttcagct tttagaacct aagttctttc ccagagttag aggaactgcc tgtgaccttg    88560
cccactccag ccacctgcct gaaataatga caagaccagc ctgaccccag cttcatgagc    88620
aattgtccaa agcccctttg tgccgtagta attgagcacc agcaggagct acaacgacct    88680
ggctgtttct tttttgctaa caagcttacg tataataaaa atggctctag cttggggatc    88740
ttattaatcg cctcatgaca atccctctcc ttttgggctt ctttgggttc tgggattttt    88800
aaattgttcc caaggagagt ttttgggaaa caaactccct ggaatcatgc aggcttccca    88860
ctgggacagg aaagtcaaag gccctttgtt attggctggc ctttggctgt cagcccttgc    88920
tatgaaccac tggcctgagg ctggaacttc ctgctgtctg caccatggga ttttgaatgg    88980
cacaagaatg aggctatatg aacaggagga gctgactgcc actggtgggc ctgggagcag    89040
cgtctccaca ctgtccctgt gcagagccca gagtgcccag caaaattcat cactctccag    89100
atcaggggct ggggacagtg gcccacacag accaaacact ggagctacag ggcatgtcac    89160
ccgagggaga tgcaaagacc tcactggggc tactaaggct ggctttccag gcctggatgg    89220
gctcccattg ctgcacctcc tgggaaagcc cacgacacag aggtgggcgc caaaaggctc    89280
tcagtggggc tttgtctaag gaacagatag gtccaggtct tcctcaggca agtgacctga    89340
gcagaggggc ccgtgtggac ttttcaccct gaagctagaa gggtgtggtg acgacagtct    89400
cctaaatgag tggctttagt cctagctgcc catcagcctc atccgccgaa ccttaaaaaa    89460
caacagatgc cccgccccaa accaacttaa tctgaatttc tggaagtggg gtttgggcac    89520
tagtatttta cccaagctcc ccgggtgatt ctaatgtgta gcaaggtttg aaaaccacag    89580
tctaaaagcc acagactgtt aaactcttgg ggataaaggg catcacccag ccatcttggc    89640
aacaccaata agtccacaat gaggaggggt gggagggccc acagttagtt agggctgggc    89700
acctggctgg ggaacatcag ggtgattgac ttcaagactt actctttttt ttttttttct    89760
ttttttttga gacggaattt cactcttgtt gcccaggctg gagtgcaatg gcgtgatttt    89820
ggctcactgc aacatccacc tcctgggttc aagcgagtag ctgggattac aggcatgcgc    89880
caccacacct ggctaatttt gtatttttag tagagacggg gacggggttt atccatgtcg    89940
gtcaggctgg tcttgaactc ccaacctcag gtgatctgcc cgcctcggcc tcccaaagtg    90000
ctgggattac aggcgtgagc caccgcaccc agccaagact tattcttgat ggtcagtgct    90060
ggggactttt ttaaccacag tcttccacac taagagatta gaatttagaa aagttggggt    90120
ggctcagaag ttgcagggga tttggaattc ttgacagaca cttctggaag tggcaaggat    90180
ttgcttatgt gcaactgaca gtcaaggagt cttctctttg ggaggtgacc acattaaaat    90240
gataggaatt cactgtgggt gacagcataa agccaatcgt ggcttcctca ctcttcgtgg    90300
tgagccagaa gttgttaaag actgggccaa gaagattcca aaaatggaca caaagccaag    90360
aagaaccaga gagggtgagg aaggatagag aaggttttat ttggttattt tacttgggcc    90420
caagaatgtt gaacgtgaga acctgtctgt gaaattgtag tgtgcagcca ttggaaaatg    90480
tttattatta tctttagcaa aagctttaca agcaattctc ccacaccatg ttctttcact    90540
cactgacgtt cactgtcctg gtgtctgtcc tggagcagga aatgaaggga cacacacaca    90600
cacacaccag ggaggagcaa gaacggggcc caatgtggaa tcagacccac ttagaaacac    90660
ttctgagggg agtgcaaatg agaagcgtct gtcagccgag gctctggatt gatgccaaca    90720
agctgggcta gaagggaatc caggaggctc agtccatgca gaccacccag aggtctcagt    90780
gtgccgccac acttaaatta caccctcgca atgtctcctt ggagaaaatg catatgtgtt    90840
cattgcttga tgggtcatcg ctatttccat ccctgtgtaa tagacgtggg aggtctctcc    90900
caaagctctc agtggctcac cagtgctagc agaattcagt cagagcaccc ctgtgccacg    90960
actccctcgc tctcggtgcc ctctgctgtg tcacttgcct gccctgtcta ggggactaga    91020
tggaggctac tgcaactact cagcgcttcc ccctctgact ttagctttgg aaattactta    91080
tctcccactg aagttgatta agtcgcctgc ccagggttca tatcagttga accagcacca    91140
acagtagaac ctgcatctct tccttcgtgg tccacgagaa ctcgtacatg ccaagaggct    91200
ggagtcatag agcagcactt cccagccatt ttcacattgc atctcttaca gaaagtcatg    91260
ctttgggtgg tggatcagcc actctcggct ggaagtgacc cacaaaagcc cacacattgt    91320
tcaaggggtg tgaagctcca ttgtaaaatg gccgggacca tttccattta gagttgggat    91380
ggtctcttct cccaacggtc actaatctcc tccagatgga agagtaggcc cagcggggtt    91440
tccacccggg ttgtttataa cccagtgtgg ggtgggaggt gaaggtctag catgcacaga    91500
gggcatctgt gtggtgttct ggggctttct atacggtgcc aggtcaccca gaccacaggc    91560
cccgtgagtc cccttcgcta ctggtgccaa atccacgtgc catctgtaaa ttatttactc    91620
tgcatttatc ttcaagctaa tttaaaatca atccactttt tgtctgatct taacttaggc    91680
caaatgttat ctgtgaaatt atgattttgg tatgcaagca gacacttgtt actctaatat    91740
acattaaaat acacacataa ctagtaaaat ttatacacac acacacacac acacatatac    91800
atgtatatgt atatatatat ttagagacag ggtcttgctc tgttacccag gctggagtgc    91860
agtagtgcag tggcacaatc ttggctcact gcaaccttga cctcttgggc tcaagtgatc    91920
ctcccatctc agcctcccaa gtagctggga caacaagcac atgctgccac agcctggcta    91980
atttttttgt attttttgta gaaacagggt ctcactatgt tgcccagggt ggtcttgaac    92040
ccctgggctc aagcagtcca cccacttagg cctcccaaag tgttgggatt acaggcgaga    92100
gccaccgcag caggccttaa atgtttttta aacttctttg aacttaattc catctgaaat    92160
catccagcag cctccagaga taacaaataa caaagttaag gaaaaagcat ggtcatatag    92220
ttattgtatg gaatccgtgt gaattggtgg gtccttagac accttcagca tagaagcatt    92280
attcccattt tcctgttgtg gaagctgagg cacagagagt tgagagttat cataagatca    92340
cactaagaga gtgacaggac tggggttcca acccatagcg gtgagtacta aagccaccct    92400
ccttcccctc cgccaggcca gcagatgagt cgttggcagg atcactgcat ctgtcatccc    92460
ctcgccctca ctccagcctt tttttccctc cacagtcctc actgggcttt gtggccctcg    92520
tgctgagcac actgcacacg ctcacctacg gctggacccg cgccttcgag gagagccgct    92580
acaagttcta cctgcctccc accttcacgc tcacgctgct ggtgccctgc gtcgtcatcc    92640
tggccaaagc cctgtttctc ctgccctgca tcagccgcag actcgccagg atccggagag    92700
gctgggagag ggagagcacc atcaagttca cgctgcccac agaccacgcc ctggccgaga    92760
agacgagcca cgtatgaggt gcctgccctg ggctctggac cccgggcaca cgagggacgg    92820
tgccctgagc ccgttaggtt ttcttttctt ggtggtgcaa agtggtataa ctgtgtgcaa    92880
ataggaggtt tgaggtccaa attcctggga ctcaaatgta tgcagtacta ttcagaatga    92940
tatacacaca tatgtgtata tgtatttaca tatattccac atatataaca ggatttgcaa    93000
ttatacatag ctagctaaaa agttgggtct ctgagatttc aacttgtaga tttaaaaaca    93060
agtgccgtac gttaagagaa gagcagatca tgctattgtg acatttgcag agatatacac    93120
acactttttg tacagaagag gcttgtgctg tggtgggttc gatttatccc tgcccacccc    93180
acccccacaa cttccctttt gctacttccc caaggctctt gcagagctag ggctctgaag    93240
gggagggaag gcaacggctc tgcccagagc catccctgga gcatgtgagc agcggctggt    93300
ctcttccctc cacctggggc agcagcagga ggcctgggga ggaggaaaat caggcagtcg    93360
gcctggagtc tgtgcctggt cctttgcccg gtggtgggag gatggaggga ttgggctgaa    93420
gctgctccac ctcatccttg ctgagtgggg gagacatttt ccctgaaagt cagaagtcac    93480
catagagcct gcaaatggat cctcctgtga gagtgacgtc acctcctttc cagagccatt    93540
agtgagcctg gcttgggaac aagtgtaatt tccttccctc ctttaacctg gcgatgagcg    93600
tcctttaaac cactgtgcct tctcaccctt tccatcttca gtttgaatga ctcccaggaa    93660
ggcctagagc agacccttta gaaatcagcc caagggggag agcaagagaa aacactctag    93720
ggagtaaagc tccccgggcg tcagagttga gccctgcctg ggctgaagga ctgtcttcac    93780
gaagtcagtc ctgaggaaaa atattgggga ctccaaatgt cctctggcag aggacccaga    93840
aaaccacact ggctccaact tcctcctcat ggggcattac acttcaaaac agtggggagc    93900
aacttttcca ccaaagctac aaacctaaaa tgctgctgcc ccaaagcaca agagggaaga    93960
gcaccgccgg ggccacagga cgtctgtcct ccagtcacag gccatccttg ctgctcccta    94020
ctgactctag cttacttccc ctgtgaagaa acaggtgttc tcggctgagc ccccaaccct    94080
 
<210>5
<211>82154
<212>DNA
<213>Homo sapiens
 
<400>5
cattaatagt gataactatt aataatatct gagtgttaac tatgtatcaa acactgtgct     60
atgggctttc tttaactatc tcacttatct ctcacaataa ccctgtgagg caggtactat    120
tacagaaggg gaaacggagg ctaataaaga ttaaatgagt ttcttagggt tgcccaccaa    180
gtggaagatc ctgaatatga atcttacagt ctttctcagc ctgcattctt taccacaagg    240
ctgggactcc cagaggacag catcctctca tgcctgggtg gcaagcagcc agccacagac    300
atgctgaaga actaggggta gctacagtta gaaaacattc attgcttttt caaggaagag    360
ctaaggagac ccaggacgca gatgtgagtt agcagagaac accagcaaat tacttaactt     420
gacagaatta ttttctctcc tgggtcagtt agcttctact tgaccctggt gcttgttgga     480
gtttgtgtca cccccatggc tctgccttct gctctgaagc acaaggttac cattagcata     540
catcaggctg tggttaattt ggctgccccc tctttaagct aaggagacat ggtcagggcc     600
tcagaccctg tgtgtggcca ttcagctttg ccctgttctg tggccacagt ccatgctcta     660
agtactgacc agatgtctta caatgcacac ggcacacagt tatggtctct gtggggatgg     720
gggaataagg tgtggacaaa tctgttcagc tctaaatcct tgaccagagg agcagctcag     780
agcatgaatc cacagggcag tggagccatg tgcaggatca agcacagcgg catcactgac     840
ttgcaggaca ctggagtgct ggggcgtggt tctagagaaa tgccctcaag tcctcgatag     900
atcctaaatg tggttagttc tcttcattac aaagacagtg gaagctgagg tccatgcaga     960
ttaaaaggct aagctgtaca gtaattatga ggtccttttg attagcagaa ctccatctat    1020
tccaaaacaa attcatagaa agacatcttt tctatgccta attgcctttc catctttgtt    1080
gaaaatcaac agaccataaa cgtggagtct gttttgggac ttgacattct gttctgctaa    1140
tctatgtgcc tctctttgcg ccaatacttt actctcttga ttactgtagc tttttagtaa    1200
atcttgacat cagatatttt aagtcctcca actttatttt tgcttctaag ttgttttgtg    1260
tttacataca aaatttagaa tcaatttgtt caatttctac caaaaaagtc tgcttgggtt    1320
ttggttggga ctgcattgaa tccatagatc aactattggg gattaatttt tttctctacg    1380
ttttgactgg tttgtatacc acagattaga ggattctggg atggagcttc agaatccata    1440
gcacaaacat gaagatattc agaacaatta acttttatgc tgatttaaag ctaataagaa    1500
taaatcttta catcaaatat aagccacctg gagccagtat tattgggact tcattgataa    1560
taagattatt tacccaaagg ggaatgattg tcaaagtacc tactgtgagc catatttata    1620
aaatgtaagc catatttgaa aaatacttaa ttttcacaag aagctgatga ggtaggcatt    1680
acctgctgta ctttacaaat ggggaaacta aagtacaaag agatgtagca gttaagctga    1740
ggtcacacag gtaattaaat ggtagcattg tcacttaaac ccaggcttgt ctaattccat    1800
tctgtggtac ttgctgtacc tcaatggttt tcagactgtg tccagagtgc cccaggacct    1860
gagagagaga gagagaaaga aagagaaaaa agagagagag aaagagaaga gagtgagaga    1920
gagtgagtgt gtttgaggga aggaggaaga aagtggtctg gggttcagaa tcccagactt    1980
ggtctcagtg agttttcctt tgtcctattt tgcagatggg gcctccacgt gaaaagtaac    2040
tacaaaacag aaccagaaaa tagtcatgct gttcaagtga gttggcatat cacttcatgc    2100
tactttgaaa taaaatttcc tcttattttc ttatggataa aggtctcgaa aggtttgaga    2160
tgatcacagc ctgtgttaag gctgaccagg gtccagggca gtacagtgga gctgcttttc    2220
ttctggattc tgaaccaccc tcagccttca gggcctgttg tctggtgggc tcatggagtc    2280
accagtgaac gtgaaagcca ctgctcctct ggtgtccatg tctattctga caggtggatc    2340
tcagccccag gttgactgat tgctcgcagg tgaggctact gcctccgcag tgctcaccaa    2400
atgctccggc cgctccagtc tgcacgttcc tgagcttggg ccacctcctg cttttcacag    2460
gcagcttctc ctcgatctcc tcctctcttt tttcttcatg agcctcaccc ttggcagcca    2520
ccccaagaaa ttcagccttc ttcatctcct ttctctctca gaaactggaa agatttttac    2580
tgaattcctg atatttttgt ctttgccaaa acccaaaggc cccaatctgc catgggccaa    2640
gaagtgccca gagaggttgt ttggacaaat ccagaaatga ccttgaatct ttactcagca    2700
cttagatgac aggttctctc cttctccacc acaccctagc acacgtgctt cttgtcggat    2760
caggaaatgt tttattgctt tttttccttt tcactttctc tacccaccct tctttgtgag    2820
cccttcccgg ttatgctgtc cgtattgcct ctcttctgga aaagtaatca gagagtgaaa    2880
atcccaggac aggaagggac cttgggaagg cattaaccag accttttcct ccaggcagca    2940
gccacagtcg ccggggtaaa gaaccctctt ttccatcttt aaactttcat cggtttctgc    3000
atcttctcat tgaagcatct ctgggttttg ctttttgttg tcttatttgt tactttcatt    3060
tttaaaagtt ttctttcatt cagaggtttc ttgagactgc ctggtgcaca tcatgcgtat    3120
ccgctgatag atgctgttgt gacttggtga aacatgttgc gtgctcttca ggcagatgta    3180
tgtcaacaaa cccttttcct ggctcagcca ggatttctgg gagtcagatt tgattatggg    3240
gtgtcatagg taaaaactgg aggctgtctg tggtggccca gctgtgcagt tagctgactt    3300
ggaggaatct ttggctataa ttggatgcca agagtggagg tggcacgaga gatggtacaa    3360
gcctatgatg atgtctaccc aggtgaaaaa tgatctaggt gcttgtaacc atcaccctga    3420
gcattcagtt ctacatccag ctattgtgga acaaaatgat ttatattgat taattgacta    3480
gttggttcat tttagcttga agagtactga tcagctgtgt gcattaggca gtttcttgac    3540
acactgctgt gctgaggaca gatttcccag agcctggatg tgtataattc tacatgctcc    3600
tttttccaag gacttaagca aacagagtca actcctctgt tttccttgtt tgggtatatt    3660
tttgaaaatg tctcttcttc tttcctttca tttacatttt accgttgttt atccaccttt    3720
tcctcttcct tcaaagctct agacctgcct ccctgcctgt tcttagccca cttttgagaa    3780
aggactttcc aaccccatcc tcgaaagggc agggtctctc tccagggctc caacagagtt    3840
ctgaaagaac acggcttcca ccattgtgtc ttctctgttt tgtcaactgc tgaaagactg    3900
acacagtaga caatgctgca gaccccttgg gagatagtcc aagtttaggg tggggaggga    3960
atggtgcatt ctgggtgtcc acatatttgt tgttgcttta ggaagaggag ctgggaggtt    4020
ggagtcgcca cacatgttga aagatgtggc aaaaaacaaa caaacaaaac acctcataga    4080
gagaaatcct gactttgtgc acaagaaaag ggagtgaagt gtgtggggtt tttaaagtgg    4140
tggtgggggg gcattaggag atacccagaa gctctcaaga ttccaaacag tctgcttttc    4200
ttttcagaca ttacactcca agaaaagaaa ctctagtgta taacagaggg gctctgtcaa    4260
aatttaacaa cataaatatt gggcaaatga agttgtttct ctggtgctat ctcaacctgc    4320
caatggagaa atatctcaaa aagtcaagaa ttgaagccat tactcagaga cagcatccta    4380
tggcatggtg atccaaaaca agtacacctc taccttttcc ctttcagccc caaaccccaa    4440
aacactggag aatattgggg caggcaaggc ccgtgaatag gtgagcagag ctggaagaag    4500
agactcctgc ccctggtggg cctcaggcta tttgtggaat gatgtttgtg agatgaacat    4560
gttcgctccc tcacccggat gttttggaca taggagcctg gagtaaagag tgtatatctt    4620
gggctgtcat tttcccgtgt gaaaggtgtt ttgttttctc cccgtttgca caacttgttt    4680
cccttaaact gtgctgtgca tggctaggaa gctcagcaat agactaaaca gtttgcgatc    4740
ccacagtttt gctttctgtt tctcaggcct gacccaacac tccatgggtt ccctagccct    4800
tcgtaggtgc ttcgaaacac tcatggggtc cttgacctga tcccagtggg ggtttgtgtg    4860
tggaagttag ggaacctctc tttgagagtt ctggtgcccc taactctgta gggtctgact    4920
tcacttctgc cccaataaga atgaaaggct ttgccagtag tgcagccctc tcctcccaaa    4980
gtcctagagg caattactct gaaatatgga agaaagaggc acatctgaaa gcccagtgct    5040
gtcttcttgt cctcacatcc ctcaggatct caaggtcagc ctagtagagg cattgcttta    5100
ccatagtagc aactcaggga atatctgtgg aactggattc ctctgaagtt ggacagttgc    5160
tttatccctg ctagaggctc tcactactta gacccacaca gtcctataga tagaagaaac    5220
ctagagagaa ccacctctca cacttttatt ttatacatgg agaaccaaag gcctcaaatg    5280
gtggagtgat ttgctggggt gctacagtca ttgtcacaac ttacattgtg acatgggctt    5340
catatccagt taaaacaaaa gcctctattc actgccccaa ggtgtgaagc cttgtctcca    5400
ggagatggag agtcaatgac tccaaggaga taagacttca gactcttcct gctgcaattt    5460
tttttttttt ttaagtaagt gccaaccaat aactcctggg gaaagtaaaa taatctgggg    5520
gaggaaaatt gttctctcct ggagatggga ctcctctgat ttggaactcc tctgtctgct    5580
ttcacttctt ggataggatt ttaaatccag cacccagcct gctgctgtga agttcacaat    5640
aactttatca cctgagttcc cttggtgctg cagcagatat gagttacaca cctggtcctc    5700
cgagagtggt ttaatccaca ccagagtcct gacttactag tttcttccta ttgcagagcc    5760
tatgcagact gcttctctga gcaccaacat cattatgcac tgtcctttct attcccaaga    5820
cttcctagtt gctgcaagtc aagttcgaca ttcaactatt tcctcggggt ccttttttgg    5880
gagaagcaag gctttgagtt cactctttga cttcaagtga agtccatttt cctcttagac    5940
actaccccag tggttctcac actcaaggaa gcaccaaagt ccctggagga cccgtctaaa    6000
tgaaggatgc taagccccac ctcacagaga ttgatgcagt acgtcccagg aatctgcatg    6060
ttaaaggagc tctgcaggtg attctgatgg aggtggccct tgcaggatgc tttgagaaac    6120
tatatgttct atccctcgaa ctctgcctgc agaacagcct gagatggctc ttccatgctt    6180
tgaccatttg gccctccaca gtagtccctg agctgcgtct tcttcggacc atgagcagaa    6240
tgtgtgtccc ctgactgact gtccttttcc ttgagaacca ggcatagtgg tgcactggta    6300
agagcatgga ctctggagcc acactgggtt tgaattatgt ctctgccact tactagctga    6360
gtgaccctag gcaactttct aaatctctgt gcttttgttt cttcatctgt aaaatgggga    6420
taataatact acttgcccca tagggttgtt atgaagatga accaagttaa tatctctaat    6480
aaatgtctct aaaatcccat gattgcaaaa agtagaaaat atgtcatgta gcctattata    6540
tcattatatt ataaggtgag gctattgaag gcaagagggg aaatgacttg ctgaaggcaa    6600
cagagctggt ctgcagcatg gccaagacca aaaacagctc ttttcgctcc cagataaatt    6660
gtctttttta tttttttccc aaactgcctg tctaaccccc ctttcatctg gttataatga    6720
atgccattgc ttgtgtatag ttgcctacat taatagacaa caatgcaata ttctccttat    6780
ggaaacccta cctagattgg gaggcaccat gaagccactt tttcttcttt ctccatctct    6840
accctgatta gcaaacatct ctaattattg tgactcccaa ccccagtcag atcattttat    6900
tctttttcca gtatctatgc agggaagcct ggcaaaggct taagggatgg ggtggggtgt    6960
agcatgtcag caggatttgg aactatgggc cccatacttt tggcacctgc tgcattttct    7020
ccccacctgc tgcaccataa ttcatctgct tgtatgagtt tagcagaaag agcccccagt    7080
tccctgtaag aaacacatac ggcttttcca ggttacactg tggggattga gaaaatgcac    7140
agtatccatg tctggaaatc aatggacaac tcactgcctg aatcgtttgt gtcttgtaac    7200
ttgcctcaag caacatctgt ctgaaaaatc tggtgctttg ggctaaatga ctggatattc    7260
tcctaaggaa tggcagtgag tgggttaatt tcacctctca tcttacttcc tgcctggccc    7320
ctctaccttg cccaccatgc ctggctttgc tgctgatctt cggctgacct gaaattgaac    7380
accttaactt aaggacaact aagggtgtag gtagattggg aagtatgtgt tcttcttgct    7440
ttgccaataa ttgtcttctg gattcattgg cctttcttct ggtttccttc ttcaacttct    7500
ttaacaaatg acttcagcca tgccaagcct tcttttaagc actttccctc tcactctcct    7560
gtcctataaa gatatctttc ttgaagcccc tccgtgccag gcgtccaaag tgaggcacat    7620
caactcggtc cttgaacgtc tcatgtttat cccaatagat ggtctagatg tggatgaatg    7680
taaaggaaat gtgcaaataa gatactttta aaattcagac agaattatac agggtgggaa    7740
atttcagtat acatagaagg cttaattcaa aatgatataa tgtcaacatt tggtataaga    7800
aattatttat ctggcagaat atatactcac agatgtcaaa atgggtctag agagtagaga    7860
atggaggcaa ttatccagac actgaggccc aaggcacaat acttttaagt aatcatgccc    7920
tcaactggca tttccatagt cttaagccca aaagcattgg gtggaaccat tctataagca    7980
aagcctcagc tatgaaaaca acttttaaaa ttgacattca aaagataaga tcaacaacag    8040
gtgccctttg ctttcggcag taggtgtgtt cttgaaaagt tggttgtcaa tatttccttt    8100
tcccattaat ctaatcacat tctaaatata acagggggct ggatgtttga agaaatcctg    8160
tagttgatct cattgcaaag tccttttaga gaggtaaaaa tagtttgttt tattttcaaa    8220
aattaggttt tcttagacta aaacttcttg gaagtggggg catatcatgt tcctgtatat    8280
tgcctacagg taaagaatgt aagaatgtat ggcttagtca cagagagcta gggcttcaga    8340
aatgctatat gtatcaaata ttttatatct atatttactc tgaagatatg acaatagctt    8400
ttaatgtggg tcgagagata tctaatcttt cgcttctctt tcaaccttcc aaaaccatgc    8460
aatcctcatt ccttcttttc aataacctcc acatgccccc ttcatctgtc ccacccaaag    8520
gaaactcttt taacttacca tttaattgat caactctgat gacctttccc taagctctct    8580
gtgctaaaat aatctggtac tttgggctga agaagtattc tcctaacgat ggaggtaggt    8640
ggcagtcaaa tgacgcagag attatgatag ggccctgtct aggctgtcac ataaggtaac    8700
attagccaca tgtggctact gtgtacttga aatgtgatga atgccattga gaactgaatt    8760
tttaatttaa tttaaaaatg gagtcgcatt tctgttttag gagaacttct aagtatgtct    8820
gaaacaactt gatcatgttt caagtgtaag ttttattaga tctaaatcta aatcaagtat    8880
ttcgaaaaag tattttagca tttgaataga gatgtgctct aagtataaaa cacacagtgg    8940
attttgaaga ttagtaagaa aaaaatgaat gtaaactatt tcattaataa atttttatat    9000
tggttacatg ctgaaatgat aatattttgc atatattggg tgaaattata tatattattt    9060
aaattaactt tccttttttt ttttaaactt tgtgtggcta caaggacact gaaattagaa    9120
acatggctcg aattatgctt gcactgaaca aggctagtct aaggtatgca attgccctgc    9180
ttcttcacta ctttcaagtg taaacaaata tgtcagcatt atccctagaa ggagggttta    9240
ggggttttaa gttgaatact cttcagctga agaaaatcca ttaatctcca gttttattct    9300
tgagttagct ttcaaatcta cattgcgaca ataattactt tgggatcttt gaattttctt    9360
tcatgccttt ctgttctatg aagcccacat gcgtagttta tgcattttcc aatttaggct    9420
agaagtccaa tgtgctgtcc attgcaccac agagcctgtt tgctatgcat ttttaagagt    9480
aaaattttca gaaaatactt aaattaaaaa gatagatttg gaaagcatat ccaaaatgtt    9540
gctttgaact tcttattctg gacaattcct ggactgggga gaaggcatgc ccaagtacac    9600
attgcttgca gtggcacctc caaaccaatg ctggtcggga ctcttcctat tacctcgcaa     9660
cagcaatgac tgggccccat aatacagcca cggtcattat aaaagatcat tacaaagcat     9720
caaattaact gctattaatg aaagccagaa acacgtcatt caggaggtcg aatggctggg     9780
atggaacata cagggttgaa taatggtagg agcctgggtt tggaattaga aaactgggac     9840
aggaatccta cttctgctat gaatccattg caagtgactg ggcaagttgt tcctcactcc     9900
ctactgcctt gctcatctat cagctgagaa tgtcaaggca gaaggtctcc agggctcctg     9960
caggctccta caagccagat ctcaatccgt cttatcctac cctcttcctg acctctagct    10020
acaagaacag caaggcacag ccccctggtt ttgagaatgc taatgcttgc cagcattctt    10080
gtcctgcagg gcatgaagta tagtcctgca caaccagcag gctctgtgac tgcctaacct    10140
catccttggt cactgacctc tgtcttagta gcagttcgtg ccatcctacc tagctttgct    10200
gggtcaagtg cgttcacatc ttaaaaccgt ttgaagcgtt tgtctaatta acatgcagaa    10260
agcatatact gatttttatt ttcaccacca tgtatgtgag ggcctatttt atggcatgca    10320
aagcatctca tttttatttc aattctctgt cttgtaactt taaatgaggc tgaaatttcc    10380
ctccatatgt ttattagcat cttctatttt atctcttata cactgactgt ttgcatcttt    10440
tgccccattt ccctgaatgg tttttttctc aatgatttgt aagcactctt tatatttaaa    10500
tatgttaact ctttcttgtc acatatttta aaccctttct tacaaacgtt gttttccggt    10560
ttgtgactta ccttttaatt ttgctcataa attactttta acttacagat agtaatattt    10620
ttgaaaggtt acattcatca gtctttgtat tgttaaaaag agtctttatt gttatacttt    10680
taaagtagct tttccactcc tagtcagata ctttcacata taatagttgt ctactttcct    10740
cctgaattaa tggggattta ttttggcata tggtgtgaag taagaagcta aattcttttt    10800
cttttctctg catcatcaat gatctcttac actgttaaat aaactagtct tttccttctg    10860
ctttccacac ccatttaacc tagcccactg ttgacatcgt cagagaaaac ttttcatcag    10920
aaagtctgaa cagcacaatt atactgtatc aatccagctt aaattacaca tgattgttag    10980
gatgggtaga aggtatgata aaatggggtg aaagtaaaat gaatgatcat cgatatacat    11040
gatgtcaaaa atttgggtat aactgaagaa ttttagtaat ttaaagattt cagaatttaa    11100
ataatgaaat atctgataca ttcaattgga aatttggttg agatcagctg acttgttaat    11160
tggacttcac tgataaacat ttgccttaaa atctgtagaa tctaaagcag ggtataccta    11220
gtatgcgagt aagacatcat ttctggaatc aagggggctt ttcagtgttg accagatgtt    11280
tatcactgca tgggcaaatg gcccaaggag tatggttgtg gcttggctta tttcttctta    11340
acgcagatgc agttgctttc tttctgggtg gcagtgtgga ggataactgg ggtcggtggg    11400
gacataaagt ctcacaaggg gaggaaagcc cctctgtggg ctctctgggc cagccaccct    11460
ccttacaaag tgggatgtca gcttctgctc tgaccagagt caaagtaggc atcagctatt    11520
gccattactg ttgttgtata atatggtgaa taaaggaaat gtgttatata tatatttttt    11580
tcttattatt atactttaag ttttagggta catgtgcaca atgtgcaggt tagttacata    11640
tgtatacatg tgccatgctg gtgtgctgca cccactaact ggtcatttag cattaggtat    11700
atctcctaaa gctatccctc cccccctccc cccaccccac aacagtcccc agagtgtgat    11760
gttccccttc ctgtgtccat gtgttctcat tgttcaattc ccacctatga gtgagaatat    11820
gtggtgtttg gttttttgtc cttgcgatag tttactgaga atgatgattt ccaatttcat    11880
ccatgtccct acaaaggaca tgaactcatc attttttatg gctgcatagc attccatggt    11940
gtatatgtgc cacattttct taatccagtc tatcattgtg ggacatttgg gttggttcca    12000
agtctttgct attgtgaata gtgccgcaat aaacatacat gtgcatgtgt ctttatagca    12060
gcatgattta tagtcctttg ggtatatacc cagtaatggg atggctgggt caaatggtat    12120
ttctagttct agatccctga ggaatggcca cactgacttc cacaatggtt gaactagttt    12180
acagtcccac caacagtgtc aaagtgttcc tatttctcca catcctctcc agcacctgtt    12240
gtttcctgac tttttaatga ttgccattct aactggtgtg agatggtatc tcattgtggt    12300
tttgatttgc attcctctga tggccagtga tagtgagcat ttttttcatg tgttttttgg    12360
ctgcataaat gtcttctttt gagaagtgtc tgttcatgtc cttcgcccac tttttgatgg    12420
ggttgtttgt ttttttcttg taaatttgtt tgagttcatg gtagattctg gatattagcc    12480
ctttgtcaga tgagtaggtt gcgaaaattt tctcccattt tgtaggtttc ctgttcactc    12540
tgatggtagt ttcttttgct gtgcagaagc tctttagtta atgtgttata ttttaagagc    12600
tcagttatct gttacctatt tgccagtgac aggaactcat gtcttctgag gcagttggtc    12660
tcatttatgg tagatataat taattattat ctaattatta ttgcccttga attatttgaa    12720
gatatcatca ggccctctct taaacacttc cgttcatgtg ctttagcttc tttatatggc    12780
cagccactct ctgtggatat gtccaggttt gttgatgtcc ccttgacatc agccaaccat    12840
aacttaacac tggatgagag ctaagcagtg ctaaacttat cacttccctc gaatgtgtca    12900
ttatactttt attagtgctg cttgggacta gatttccttt ctagcagcca agtcatgttt    12960
tgggctcata tgcagcttgt agctaagaaa gccttgagtt gttttcctat aaaccgtctg    13020
aaactatttt tagaattcaa gttacaactc tgaagtcctg ggtcttactt aatcaatgat    13080
accttctgag ataaatactg aaaatccttc aagtatagaa caaggacatc ctaactctgg    13140
gcatctgatg tctgttaaat gtatcacatt ttatttattt gtatttttta aaggaagtga    13200
gaaggagaag tgagatgctg agcatcaagc tgggcagagt tgtcatgttg tgatctgaga    13260
ttctgtcctg ttcttcagga tttaaggagt cgctaaccaa tgccaagcat gggctcatcg    13320
ggtgcagctg gggaggcaat tacttcaact caggagtttt caaaaacttt ccttatgcct    13380
gctcacagga tttcatggtg tttttcttct ttgttgttac ttttgtggaa aaggaaagtt    13440
accagtgaac aatctctgtg accttcctct caatcccaaa aatatgcttg tgataaatca    13500
gcagtttatt ttaatgcctc atttggaggc attgcttttc caagaatgaa tctttgcata    13560
ttatctgaga catcattttg gtgtaaggta gaattgtacc aggtatgtat ctttgtggcc    13620
aactatactg tcaaaactga gtttcagtca tccaataaaa aggaagctgt ctctgaattc    13680
agatattcct ccattctaag ggaactgaag tataacataa aatacttaac attctttctg    13740
tatatgtgaa aaaaccatac ctaaggaatt ttattattca gcccatgttt ctttattgta    13800
tccagtataa catactcgaa gatgtatata tacacatata tagatataca aagcatctat    13860
acatctagac atgtatatat acatatatat atacacacac gtatatactg tacttcaatc    13920
atctatatta aattgtgata atatcacatt accacatgtt gatggcattc ttgtaatctg    13980
cctgaaatcc atgaaaacac atgcagtggt ctggctcatg ttgtctcagg gagtgcattc    14040
tggctcccag tgatcatcaa ttacttttat aaaagttcac caatcacttg ttggtttccg    14100
gaaaacaaat ttaaagcaaa cattattaat gtcaaactta cacattttgc tttctggaat    14160
caactttttt attttaaaaa ttgagaatat aatttctgtc ttttgtttct ttgggcattt    14220
ttcttattct ccacaattat tcaaagatcc ttagccatag gtctgaaagt gtttgtttca    14280
gctctcatcc cccttccttg caggtaaggc tggcattcca cagccctgga taactcctct    14340
gtgctaggtc tatgcctgct cctgggacac tgaacactcc taggtttgca gggtccacgg    14400
tgtccttcgt gtccctccct gcccagcctc agcaggagcc ccctgctcct agaccactcc    14460
cttactgagt cctgtagatg ttccagcaca cacagtgcct cccttctcaa ggccccagcc    14520
ccagcccctt ctcaggtcat ttgggggctt acatcacctg ctacctgtgt ggagatggag    14580
gtctgtttgc cagcactgcc ttgcttttcc tcctgcccca ctgcatttaa tcactgtgat    14640
aagaggaaac aaagagggaa cgtcattggt cccattcctc tgaatcttga ccacgaaaat    14700
atcttgaatt gcctccgtgt ccccacccaa catcgcctct tgcactgcta cctctgcctg    14760
agtgcacatc agccaagagc caggaaccac tgcccaacca cgacccaggc acagaccctt    14820
atctctagcc tagagaagag gtgtgtttct ttctaatcat ctggtatgta tccaaggaaa    14880
ccataaattg atcattattt ttgtatgtgg aattagaaat attcatatag acatacattc    14940
tttggttttt atttttttat catccctaaa ataaatagca gatgttctca aaatggttta    15000
ttaatttcag tcctaagatt gtataattga ttgaaaccat aaatggcaga cagaagaaca    15060
gcaacagtga aaaccaagat taattctaat aaattcatta caatggcagg aatcaagtgt    15120
actttaagct cactgtaaag ttttcagtgt gttgtggatt cagaggcagt aggtgatgac    15180
ttttattata tattcttaag tacctggttt tggagggtga tggcttgttg gagggaatga    15240
tgctgaagga acataataaa acaatatgat aaatacaggg agagaagaaa gacaaaggaa    15300
aagaggaaac aaatgtcaag aataagatga ataggtaggg gagaagaaaa aataagttgt    15360
cataatttta tattccaagg actacgctag tccttggact acgctggtaa aaagaaatct    15420
aatcatgagg cagagaattt tatttatttc cccattcctt ttggctcgtg gcttgagttt    15480
gctctggctt tcattgaata catgggccaa ggcaggatga gcttctgcct gaaccgctgg    15540
gatgttattc ctgatctcat ggaaagacat gtcgcggctt ctgaccctgt gcctctgtat    15600
cactgtgttc cctgtattcc tgtgcccctc gtattagttt tcacattgct aatgaagaca    15660
taccagagac tgggtaattt ataaaggaaa gaggtttaat ggactcacag ttccacatgg    15720
ctggtgaggc cttacaatca tggcagaagg cgaaggaaga gcaaagggac ttcttacatg    15780
gtggcaggca agaaagagca tgtacagggg aattcccttt tataaaacca tcagatctca    15840
tgagacttat tcattaccag gagaacagta tgggggaaac cgctccccat gattcagtta    15900
tctccacttg gccctaccct tgacacatgg ggattattac aaaatcaagg tgagatttgg    15960
gtggggacac agtgagacta tatcacccct gtatccctgt gtctctatat tcctgtatcc    16020
ctggctgaat gggtcaaagt aatgatcagc ccacagatat gcatttgcct ctgctgagaa    16080
tagaaaggaa tataaatgaa gtctttttct tcatggagct tattaactag atgaagagag    16140
aaagcctgtg ggaaaagaca aatagaacct tcaggttcta tgcagtgagt gcccaagtgg    16200
tgattgtgaa aatgaaagtg cagccctgca gatgagcaga agctcatggt gggacctttc    16260
atgcaagcta tgcagaggag agagcatagg atttggggtt gggacacaca gattcaaatc    16320
atggtcctgc cactttcctg ctacatgaac ttgaccatgt tattttaccc ccatgaagtc    16380
tgagttttca gatgtgtaaa ataataccac taatgcatac ttttttaaaa tttaaattta    16440
aatttttttt tgacactgag tctcactctg tcaccaggct ggagtacagt ggcacgatct    16500
tggctcactg cagcctccac ctcctgggtt caagcaattc tcctgcctca gcctcctgag    16560
tagctggaac tacaggtgtg taccaccatg tccagccaat ttttgtattt ttagtagaga    16620
cggggtttca ccatgttggc caggatggtc tcgatctctt gacctcgtga tccgcctgcc    16680
tcggcctccc aaagtgctgg gattacagat gtgagccact gcgcccagcc taatgtgtac    16740
ttttaaaagc acttttcaaa tacttcatct tgtttaatct tcttggcagt tctgtaaagt    16800
gtgaagcatt gtacaaagtt aactctcatt attatattgg aacccagggt tttcagagga    16860
gaatcctcaa ggagataggg ctttcctgcc ttgtgcccat ataaggttgt ggatcccaag    16920
ggacgaaagc attttcatca gactgggaga ggcaagaaaa ggtcactggc agtatagatt    16980
cttctggagt tcactggcaa cttgtcccac ttcagttctc ccttaatctt tccagatgtg    17040
cagatgtata gcctgggtgg atgagccaaa atgaattcaa ggctaaacag gtcagctggc    17100
tcagcccatg ggaagcatgc tcatcccaaa gcaaaggtct ctggcagaaa tttctctgca    17160
cttatttacc ctgctgtctt cacattgggg tgcggagtct aattcaaaaa ctccaaggca    17220
tgagtccaag ccagggagct gttagaggtg cacatgggag atcttagcaa gagaaaaata    17280
tatgttttaa accctagaaa gaagaaagta aatgcctctc atttacttta aacaaataat    17340
atggccaagg tcacatagca ggaaagtggc aaggggtctg tcctcttttc actgttcaat    17400
catgaccata ttgtcctgga ggcctagggg caggatataa tgaagaaaca tccaattttg    17460
acagagtggg taaatgggat tgtgggactt gtagtgagct gatctgtctt cattcatgta    17520
attatcaata tcatttcaat gaccatgatg ttgatatgga aaatgatgag gatgatagta    17580
cagaaagaac atgaatatta gctgatgtct attgagtgtt tcctgggtgc cagacaccac    17640
cgttaagtgc tgaacaagga ttatagaatt taattctcta gtgacctttt gagataggtt    17700
atatgattgt cagctttcca caaatgagga agccaatatt cagaaggata cggtgctgaa    17760
gcttatgcag taagaaatag tagaagcaga attcaaactc aggcaattga acaccaaaat    17820
tcaagctctt aattactatt tctagaaccc tctgactgac tgattcctcc ctcaccacag    17880
ccaacttttg catcccccat ttctggagag catctcccca catggtatat actcaaaggt    17940
cccatagtga tcctcttccc aaagagcgtg aatgaggggt ttgaaactgc cagaactctg    18000
gtccagagct tggacttttg atgcgaatga tggagaaacc aagaggttga tttcctcagc    18060
cttcaagaga gctcatcctc agctctctaa agctgaccag aaagaggaga gtgggaccta    18120
tgaaaacagc aggagatggg agggcttgaa ttcctaatgc tatacccata ggtcattgtg    18180
ccatggtcct ctgcaccccc aacaccccca acactgatcc tgaaggtctc aacaatcttc    18240
atctgcctct ctcctttcac cttctttaca ctctcattga tagccttggt tttttctata    18300
cctccagtat tcccattccc atgatagcca tttaaggaca gggcacttcc tggtcaccat    18360
aaggaatatt gtgggaatgt tctgctcatg gatattgcat cagaataggt ctggaaatga    18420
aacacaccaa caaagtcaac agaggagagt ccaagcaaag cgtctgttta caaagttgtg    18480
gaaggtttag gggaactcat tatgagatag ttgaagcaac ccagagctag gaacagtggc    18540
gctcttacca caccaaggtt tgaaggagct cgggtttctg gaacccagac atagcagcag    18600
cagttgtgat agaggagttc ctggcagaag ccatagcttt cagttgagaa ggtggtcact    18660
gccaacccat ggctcagctg gaaggtaacc agagaataaa ttccccaaac tctttctctt    18720
cctttcctgt gctctcttat tggtgcctcc cattgagaga acccaaccaa agccagctgt    18780
aagggaaact aatgaggcat ttccatatag ctcagcctgc tgggaaacat gtactataga    18840
aaagggtgga gagcggatct agagaggcaa aaaaattaaa caacggcacc gatgtttaca    18900
tttctttctg atgtagagac ctcataccac ttttctgtac atcttacttt aatgtgtaaa    18960
aaggcctata ggctctttct ctaggttcag taaaagatga actaggaaac atatgccaca    19020
tttgagcttc ctcacagctt ggcccctgca aagctgtccc cttctaagaa ctaagtgccc    19080
tgggtattca gtgctgtgtt gtctggtgac ttcgcagccc tgtcaacatt gtttttctgt    19140
ttgtttgttt gtttaattat actttaagtt ctagggcaca tgtgcacaac gtgcaggttt    19200
gttacatatg tatacatgtg ccatgttggt gtgccgcacc cgttaactcg tcacttacat    19260
taggtatgtc tcctaatggt atccctcccc catccgccta ccccacgaca ggccccagtg    19320
tgtgatgttc cccaccctgt gtccaagtgt tctcattgtt caattcccac ctatgagtga    19380
gaacatgcgg tgtttggttt tctgtctttg cgatagtttg ctcagaatga tggtttccag    19440
cttcatccat gtcactacaa aggacatgaa ctcatccatt ggctcctcct cagaaaggtg    19500
gaaaagcaga acctcttaaa ctgctccagg tttcctggag agccttgcct taaaaaaggc    19560
cctttttttg gggtgggggg gacaccaatg ccgtgactcc ttcaagaatg tgattctagc    19620
aagagactga gctctattct ttttcttcct ccaccctctc ttaaggcaaa ttgagtcaaa    19680
ccatctcagt ctacccacac catccttctt taatttctgt agttaagagc ataaatccct    19740
tccctattct gagtgtggtt catcgaccta cagcatcagc atcacctggg agtctgtcag    19800
aaatgcaaaa tcttaggctc cagcccacat ccctgagcca aatctgcctt ttgcaagatc    19860
cccaggtgat atacatgtac attaatttta ggaggattga tgtagcctgt atgccatggt    19920
aagaggcatg caatgtaatg ttgagtttct ttctttagaa tttatagtag cagccgggac    19980
cggtggctca cgcctgtaat cccagcattc taggaggctg aggctggtgc atcacttgag    20040
gtcaggagtt ggagatcagc ctggcctggc caacatggca aaaccctgcc tttaccaaaa    20100
aatacaaaaa ttagccaggt gtggtggtat gcccccgtag tcccagctac tcaggaggct    20160
gagatgggag agtagcttga acctgggagg cggaggttgc agtgagccaa gatcacacca    20220
ctgcactcca gcctgggtga cagagtgaca tagtgagtcc ctgtctaaaa aaaaaaaaaa    20280
aaaaaaaaaa aaaaaagaat ttatagtagc cacaaaagcc tttttgagta attgaagaaa    20340
ttctgaagtt attgtgtgct ttgaaattta gtatttattg aatagtttat atctttcaaa    20400
aagcttttat aactcattgg agtctcgtca taactccatg aaatacgtaa ggtagataat    20460
aggagccaca ttttccacat gaggatctga ggcatgatta agtaaaatca gtcctctgct    20520
aggtggaatg gttttgagac cagatactag ggctcagaac tcattttaaa gctgttgtgg    20580
cagctatcaa ttctgaagaa agtcaacatg gcatagcatg cctcttacca tggcatacag    20640
gctgtatcaa tcctcctaaa actaatgtac atgcacacca cctgagggtc ttgcaaaagg    20700
cagatttggc tcagggatgt gggctggaac ctaagatttt gcatttctaa tagactccca    20760
ggtgatgctg gtgctgtagc tccctccgtc ccccagcttt cccccatcag tatttctgaa    20820
cacttgatcc acacccaatc tgcctcaaaa tcacttgtgg tggaaaatgc ttgttaaaca    20880
ggtagattgt tgtgccccat accaagacat aatggatttc ttatggtctc taaatgtgag    20940
aatcactttt ttgtattggt ttgaatgttc tgatttaaga gtatgggatg agggaatttt    21000
aggttcattg tgttcacatc agtaggactt aaacctatgg aagactttgc agcagaatag    21060
gaagattatt ctcccagcct acccaacagt tgaaaaacga tcagaaggac ttggaaggga    21120
gcaatggagg attgatgaca atggcaaaga ctgagcagtc cccaggcgtg acaacaaaaa    21180
ggaaagcaat cagctgtgga gagagaaatg gtgttgatga tattatgaaa gtcgggatat    21240
aaacaagaat gagaaaggga ggaatgggga aactgaatga gacagaagca cagaaaaaag    21300
aagaaaggaa aaaagaagga aaaaaggagg aaaagtggga gaagagacag atggagagtg    21360
agagaaggga ggcaggtagg taggcagaag aatgaggaag aaagcaaagg agttgagact    21420
gggaatggac agaaggaaac ctgtacatgc tgtgatctgg gctttctatg ttccctgatc    21480
cagggtcctg agatcttggg gtactcgcca ctgcattgta agtttctgtg gatgaagctg    21540
gcatataaat acatctgtaa agctgtaact cctgggcatt gtccctgaaa ttttactgat    21600
gtctagattc taggtatggg attaaatggg tccacatttt gtgtttttct gagtcaccaa    21660
ttacaacaaa acttgctcat atacttatgc ctatcttaaa aaataattta ttttaataaa    21720
ataataataa ggcaagaaaa aaagacaccc agatttgaaa aagcaaaaaa tgtctttatt    21780
tgcagacaaa atcatgtatg tagaaaatcc taaggaatct acaaattagc tactagaact    21840
aataagaaaa tttaatgatg tctcaggata cagggtcaat atttaaaaat tattgtattt    21900
caacttataa gtgatgaatg tttggataat ggggtttaaa taatccattt acaacaacat    21960
ccaaaatata aaataactag caacagactt tataaaaaca tacaatgaaa attgaagcac    22020
gttgctggga aaaagaaaaa agaaaacaaa attcataaaa agacattata ttcactgaac    22080
agaacactta gtatttttaa gacgtcagtt cttatcaaat ttatgtgtag actcaattca    22140
atcccaatca acattccaac atcaacattt ggctagagag caaagttggg gtcagattgt    22200
gtagggctgt gttaaagagt tgagcattac atgagataat ggatgtgaag aaagtgctta    22260
atagggggtc gtgcagagga agtgctcaag aaatagtatc attgtcatta ttaccattac    22320
tgtattgttg ttattattta acaaatgttt tcaagcccac tttggcttgt gtatgggttg    22380
aggaaaacgc tacccaggca gaaagataaa acttattctc catgcctctt gagaaaagaa    22440
gcagcaatcc ccagatgtag ggaggagggg agccctgctg gcttttagtc agcctcacac    22500
aggaaaggag aggtagagat tctgcagcga acaagaatca tgtccgggac ttcacagaca    22560
gggacactca aaggttggat gatgctcaat tgcagcatcc acctgcaggg gcctcacccc    22620
acttctcact taatgattgt ctctgctgtt agggagccct tgaaagccag gtgttttgtc    22680
tccttcccaa agcctcagaa gatagacggg ggccatgagg gaggtggggg cagggaaggg    22740
ggagttcctg tctgttcttt tctgcccttc cctgtgctct ccacctctat cccctcttcc    22800
ttcccaaaca ggtggcagga atgttaagac tatgaattcc atcaagagca agcagggttc    22860
cttagggcac cagttggtaa gtgtaagagg cctcatccgc ttgcaccagc agcagaaaga    22920
agctgcagga agagtctctt ttgggcatga gaagctaaag gaggctggtg gttttctggt    22980
taactgcaca aggcctgcaa gttctacaga tgtcctttga ggaccagagc agcctccttt    23040
cctcccacac tctccagaca tgggaggcag taggagttca aagcacttct cagaaattga    23100
gcctttggtt ctgctgtcag caaaaggctg tgaagctcag tccccgacac tgggtaggag    23160
aagggtgaat gaagactagg gggtctggtg aaggaagtgg ggaaacaaac tcttcatttt    23220
taaagagagt gacctggcaa aacacagaga agatactttg ggtttggagg aacgtgcaag    23280
aggtcgagag tcactgccga ggggttttga tgcggcactg tgctccggca atgggaaggg    23340
ctgtggtcag gaaacaaagc agcaggtgtg gcccatgtgg aattgtcagg caggatttac    23400
ctgtggtggc ccgtgccgca cagcctggcc caccttctgt ccacctctgc tttccttctt    23460
aggacctcct agaaagaaag ctggaccttc cgaaaagtag cttgggaggc aaataacatt    23520
tatcgaatgc atcaatgtct taggcctcaa gcaagggttt aacatgagaa tctctttgag    23580
ttcccctagc atcctatgag gtagacacta ttaatatccc ccaaggctca gagaagttaa    23640
gtcacttacc aggaaacaca actattaaat caggcctgcg tttgatccca gggatgttaa    23700
atttgaggcc tgagctcttt ccatcatact gcgaagtctc aattgtggca tcactgcaaa    23760
agaaaaacca actgaacgtt gctgtcacat gcagagagag agacaaagaa gagaaagggg    23820
gatgcagcta aatgctgggc tttttgctct tgcaggacca tgccacagag tccaccgtct    23880
ggggagcagg gcctgtgagc tacagattct cgaacaatac aatcatgggt caatgcctgg    23940
gcagagaata ggttctcttt gaagttcatt atctccagaa agcttttcca gcttccagtc    24000
actgcttcac tccagttttc tttcttcttt tttcatcttg gcttatttta gttggcttct    24060
atgcccatga ctatcaccct caaccaaaga cagagaggct ccaatgcagg aggcagacag    24120
atttgggctt gaacccaatg ccgcttcctt gctgtgtgag ctttgtcaag ttattctatt    24180
gcctaatttt tggggattgt attatgttat gttacatgtt atgttttgtt acatgatatt    24240
gtgttatatt actatcttct tcatggtgtt attatattat taagattgat gagataatgt    24300
gtgtcagatt tctagcaggt ttcttggcat attgcaacca ccaatacact gaacatatac    24360
tgtctatgta actttctcag actcagagat ttttgtctct tttatctccc acaattcttt    24420
tcttttcaaa atgtcacttc cagaattttt tcccagaaga atccagtcca ttaaataaga    24480
atgttttttc actaaaattt tctttctgca tactcttagg attgtatgat gttcgtctgt    24540
ctcccccacc tacaacctcc agcagagaga agagggctga gccagtagtg acaagggtgg    24600
gactttcaca tctcttttat tccccctgta gctttttgct aagggctaac tgatttcact    24660
taaaaaaaaa ttttttttta agaggccttc catcctggtc agacttcacc tttttgcacc    24720
ttagtattct cggctagaaa atggaaataa taagtcctcc cccactcact ttacagggtc    24780
atcataaaaa ctcgataaga tatattgttt aaaatattta aaaaccttgg aatgcttcat    24840
gaatataagg cattgttatt caaatacaga gcttcttaag agctttactt tttagctctg    24900
tgatcagtta acttttgatg tggagcaggc aaccacgaat tctcagaggc gtgcaacaat    24960
aaacatttat ttctcacaca tctgtggagc tgagctgatg taggctgggc ttgcttctcc    25020
atctgggggt ggtgtcgttt ggctgaccgt gttgggcctg gctgggttag tatggctcca    25080
catgtttctc atcctcctcc caggattagt gggcagccca agcatgtctt tcttcaaaat    25140
gatgctggat acataagaga gcaagcaaaa acatacatgg cttcttgaag cccaggcttg    25200
gaattggtat gccattgctt ttactggcca agcaagtcac atgggtggca tcagggatgg    25260
gcttatgcat catctactgt gggaggagtt ttctaagtat gatgagggca cagatacagg    25320
gagcggtgac cattacgaac attaatgcga atcctccaca ctgtgtttct tgatctgcca    25380
ggacagggtt ctctgaaggc cagtagaggt tcagtgcttc caaaaaagga tgctgggctc    25440
aggtaggtag acagagttca tcacctctat catgactgat tggctctaag gcccaatgac    25500
aaaactcttt acttctgtaa agtgttagac agtgaagaag atgaaaaggc catcatgaaa    25560
ttcagtctct gcttttagtt tttgtttgaa attcggtctc attgttgtgt ttgttttgtt    25620
ttgttttgtt tttccatatt ttctcccaag ggttattact ttcacaacag tggaaaaata    25680
ttccttatgt tctctcccct ctccttccca ggattccttt agattcctgt gtgtgcctga    25740
gggagctaga agagaaatac ataaaacata taactgtggg actcttgtct gagcccatct    25800
ccattcttaa gtcccattca cccccacaaa agctttcctt agagccaatt atgttcctta    25860
ggctaccata tccccataaa cagacgtgag ccactgtggg ttcctagtaa tgagattttg    25920
tttggcagtt ttatttgcaa atgactccaa agatctgagt aaaacatctt agagcaagaa    25980
attctgggtt agaaattttc aaaccagaac acttcttcaa aggaagatga ggttgagaga    26040
gggggtggcg gtgaggcagg gattgatttt aatgggccag tatccagggc tccagatgtt    26100
tcttcaaaag gaatctccca aattattgag cccaagttac agaataagcg agaaagaaaa    26160
tggtctacag aatctttgat tgggtccgca tgaattcatt aaaagtggtt gtcagggaga    26220
tgtgaggggt ggggaggctt gcacatatgt atattaacac acacacacac acacacacac    26280
gcacacgcac gcacacgtac acaaagagct tggtgtactg gtcttgtcaa atgctttcct    26340
ccctctgtcc ctccccacga aattaaatcc aaggtctgga gttttgccct ttaggttaaa    26400
aacaaaaaaa acaacaaaaa aaacaaactg ctgcttttcc aaaaagcatt aaagagagaa    26460
aaaatataac agcagctact gacttgaatt gaacttaaaa tttcccagga agaatctgct    26520
cagagccgaa ctcagaaact tgttgcaagc tccccagaca tgagaaaata aacttctatt    26580
aagctggcac tgaagtgcct ggaagggtgt tcaaccctta gaacaactct tagctttccg    26640
aggagtttca gggttggaag aacaactttg ccaattctac cctcaacttg gaacaaagca    26700
ttatacatct ggaggagtct ggtggtttaa tgctttcttt tccatccaag attattcatt    26760
cattcaataa atatttagtg agaacatact acctactggg cacggtgcta ggtgttgaga    26820
tgtggtgatc agggtgaaca aaacagacat agtcattgtc ctcctggaat ttgcacttta    26880
ttggaggtag gggagcacaa ttaactaatt acgtttactt gagataagtg tagttaaaga    26940
aacaaacaag atccagagac agaaagtagc aaggacttac aggatgatca gggaagtctt    27000
ttccatgaag gtaacattta aactacataa tgctgatatt ttgaatctga acctgaggat    27060
ctcagaattt tccacttctc cctctgaaac agaggaggtt ttggtccaca ggagaggcta    27120
agggttgatt cagtcaaagt ctttggagtt cagattagcc ctcgcagtta gctagaagtg    27180
gggatggaaa cttaatacac ttgaattcac acacctccgg aagtatttat ggctacttct    27240
ggttctgacg gcaaggtcag gtgaatcaac ttggtcttat gaatatagtt gttttccata    27300
tcccttgttg aaaatagaag caggtttgaa tcaacgtaaa gaggaagttg ttaaacacca    27360
tgagaaactt ccaaatcagg tgtgtcatgg actctttctc tacctgagat aaagatgagt    27420
ctgaataaaa taactgagaa gtggacttag gtgaaaatga gaagatagta aagatgattt    27480
gtcacaaatt gtagggaaca aaatccaaca ccacactaag aaaataatat actatgacaa    27540
ggtgggacct attacaagaa tgccaatttt gttcagtttt agaaaataca ttagaataat    27600
atacattagt ataactcagg aaaaatattg tgattatctc cagagatggt gaaaaagcct    27660
ttgagcaaac tgaacaccta ctcctaacaa aagcactcaa gaatatacaa attaatggct    27720
gtttctttga caagataaga aatatatagt ttggtcttaa caccagtatc tgtgctaatg    27780
agaaaatatt aggggcatat ttattaagat cagaaataaa taatatcctc tctccccttt    27840
atttgacatt gtactggaga tattagccaa tgcaattaaa caaggtaaat taaaggtata    27900
aaaattagaa acaaataagt taaactgtca gtatttgcag atgatatgat agtatacatg    27960
gaaaattcaa tcaattataa aatgaactca aacaataaaa tattttgcta aatttagaaa    28020
agataagaga atttaaaatt aatactcaga aatcaatagt tcttatatac aaaaccgaac    28080
accagttaga ggatatgata gggaaaacct catttaaaat ccaaagggga gaactttaaa    28140
gcttccttaa tgaaacaaaa gtagacctga acaaacagaa agacaacttt ttgctttttt    28200
tttttttttt gcttaggatg ttttaatatc ataaggttgc cattgttctc ttagctaact    28260
tataaattga ctacaatcct aataatcaca ttaaaatttt ttatagtgaa attgatactg    28320
aagttatatg gaaaaaataa gaataactag agaaatatta agaaattaaa agagagctac    28380
aatgaaagat taactctgcc taaatttaaa aggcattcta aagtttctgt gattgaacta    28440
gtaagaacct tgtgcgtaag tggaaagacc aactaatgaa ataaaatatg atctgaaaga    28500
gacccatatg catgtgaaaa tttagtatat aataaaaatg caagttctaa tcacttgata    28560
gtcattcctt taaagagata caatgaaatc cataccttaa accatataaa agaataaacc    28620
tcaaatgtat gaaagatagt atatatagaa aataaaacct tataagtcca caattctagt    28680
tagaagaaaa tatcattaat ttctgacttg atctgacctg ggtctaacta taatttggaa    28740
tcctgtaata ataaatgata atagtaatca aaatgatgat aaagaataaa atttgactag    28800
gtaaagttta gaaacaacaa atttgaatgt tcaaaaatat tatcagcagt aaagtcaaaa    28860
gccaagtgac gaactggtag aaaatgtttc tatatatatc agagataaaa agttaatgtc    28920
cccaaagtat aaagaatttt tgaaattgag aataagcgga aaaccaaaaa ccaatataaa    28980
tgggcaaaag atacgttcat ataatttaag tggtccctaa atatataaaa atatcttcaa    29040
ctttcaaata tccttaaaca tataaacata cattcaaata tgtttcttgt aataagagga    29100
atgaaaatta aatataatga gataccattt ttcacctatc agaatggtaa aacaattttt    29160
tttaaactct taacacactg ttgacaaagc tgtgagaaga aatactctca gtgttaggag    29220
gaatgaaaaa taatgcaact ctttggagag gaagttgcaa tctctaacac aaatacatat    29280
gtgtttctct cttgaggtgg caatccctat tctagaaatt tactctgaag ctatacctct    29340
aacaatatga atatgaaaat acatgtacac aaagttattc actgcagcaa tgtttataat    29400
tgcaaaatat tagaaacaac ctaaaatttc catatgtact agactgaatg tgcaatgata    29460
catccactca atggagtagt atggagttgt gaaacaaatg aggaagatct ttatgcttga    29520
cacagagtga ttttcaggat attttattga gtggaaaaag caaagagcaa aagagtattt    29580
ctgcaatgta tactatacta cattttgtgt aaaaaagaat atatacaatg tatgctatgc    29640
tacgttttgt agaagaggaa gacagatgaa aatagacata tttacaatat ctgtctaatt    29700
ttgctggcag aaacacagga agaataaacc agaaatggat acaatttgtg atctatagag    29760
gatgtgggga aatgggatgg aaaggacgag tggtgggcgt aggggacggc acttctctga    29820
atataccttt tgtatcattt ttagttttgg aaccatgctg acattttacc taccaagaaa    29880
aagcactaac tatatcataa atgaagaaca ttaccacact gaactaggga aaaaatttaa    29940
aaactaatac aagtaacatt tgaactcaat tctttgacta tagaccatca gactaaatac    30000
aaaaggaaac ataaacatta aaatgtagtt aacagttttt gtctaacaca tagtgttagc    30060
aattcagaaa ccactttatg tgaaacgtag aaatgagtga gtgagcaaat gcataactat    30120
attaaggata aaggagagta ggtttctgac tgttgaagac aattaaaaat atgtacagag    30180
ggccgggcac agtgactcat gcctgtaatc cctgcacttt gggaggctga ggcgggtgga    30240
tctcttgagg tcaggagttc gagaccagcc ttgccaccat ggtgaaactc catctctact    30300
aacagtataa aaatttagcc ggccgtgtgg cacgtgcctg taatcccagc tattcaggag    30360
gctgaggaag gagaatcact tgaacccagg aagcggaggt tacagtgagc tgaggattgt    30420
gccattgcac ttcagcctgg gcaacagagt gagacttagt ctcaaaaaaa taaataaata    30480
aaataataac gtacagagga aaatctcgaa tgtaccaata gtaataatct tgggttaaaa    30540
ttgttggcat cagcaaaaac tcatggtttt attaaatata ttaacattta ataaataata    30600
tgtattaata tataatttca tatatacgta catctatatg tatcttatat gtatttcttt    30660
tttatatata acatctgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtacacccct    30720
tcagtcctat gaatagctgt gttcactgaa ggaagcaatg gcacttcaat aaaaacgagc    30780
acatctagtc ccaagacctt gtttctaagt accattcctc aacaaaaaga atcctcaaca    30840
aaaagacatt tcctgaagaa atgtctgatg ccataggctg gttggagcaa agaaggccta    30900
acatgatcgt gaattacctt attgtaccag aaaaaaaaaa aaactatgaa aaaatgatgg    30960
cgatatatca aaaagactca ggatccagtg tgagcagctc ttattgggca agtcttggaa    31020
atttgaacaa caaaatcaac aacggttagt tacacattaa catgtttgac aaaataagaa    31080
tccatgagtc cagactgata taaattaatg agtgaataaa tgaataggtg attgagaaga    31140
aaggaaagct tctcttcaca atagaatgcc aattaacaaa tacaaaagga acaatggagt    31200
tagaaaagag ttagaacact accattttgc agcaattaca ataataatta gtttaggtaa    31260
gaatcatgaa tgggtgatac atttacggag actgtttgat gaggaactgg atattacata    31320
gcctcacagt gtttctcata ggctatttct aattctagag gaaaaatagt aacttcacag    31380
taagaagcat ggtggacacc accttaacca aatgattcaa gttatcaata acaacgggac    31440
aatctgacat gtgtttccca atatacagat gaaaaagagc atagcatcac aattttacaa    31500
cataaatcta agcaaaagga aagaaaagac aaacccaatt gaaggagagc cacattaagt    31560
aattggcttg aactcttcaa aatgcgaagg ttatagaagt caaaggaaag actgggttaa    31620
tattcttcta acactgtaag tctcagccta aatccaaagg cctgagaacc aggagtgcag    31680
acatccaaga gcaggagaag agagatggcc tggctcaagc agagagtcaa tttgcccttc    31740
cttcatcttt ttgttctatt caggccctgg agggattaaa tgatacccag ccttcactgg    31800
ggaaggtaat cttcattact cagtctgctg attcaaatgt taatctcttg cagaaacacc    31860
ctcacagtca cacccagaaa taatgtttta acagctacct ggtcatccct tacctcagtc    31920
aagtcgatac ataattaacc atcatagagc cagaacatgc aataacttgg aaataattca    31980
gtcattgtgc aaggagttac ctagactctg ttttaggctg gaaggtggga gtgagatata    32040
aaatgcatac agtgatcagg aggctacgag tactagaaag aactagaaag ctttaactct    32100
ttcatggcaa taataaaatt caagattgtt actaggaata aactgtacca gagttatgtg    32160
agacccaaac acagtcagaa ttagactttg gaggtatttg ttgaattgaa ctgaacccta    32220
tagctcccca ttgttcatag agtgcctaca acctgtggcc actgcactag gcattcagga    32280
ttcagaatgt tgagaggact atgagaagta acgtggctaa gcatggaacc agagagagtt    32340
ggcccaaccc tttcatttac aaatgaggaa actgatgccc acagtgagac tggcctggcc    32400
caacattaca caaccagttt atggcaaagc aaagagaaac acctgtttgg gtagtgaggg    32460
ttgcctttta ggtgccctga ccccattttt accaccaagg attgaggagg aattgcagta    32520
caaagagaca agagatagaa aaaatttgag cgttgctgct gctatagacc ctccatccag    32580
caaagccttg agagagatat tctaccaccg ggctgggact gtaaactagt tcaaccattg    32640
tggaagacag tgtggcgatt cctcaaggat ctagaactag aaataccgtt tgacccagcc    32700
atcccattac tgggtatata cccaagggat tataaatcat gctgctataa agacacatgc    32760
acacgtatgt ttattgtggc actattcata atagtagact tggaaccaat ccaaatgtcc    32820
atcagtgata gactggatta agaaaatgtg gcacatatac accatggaat accatgcagc    32880
cataaaaaag gatgagttca tgtcctttgt agggacatgg atgaagctgg aaaccatcat    32940
tctgagcaaa ctattgcaag gacagaaaac caaagaccac atgttcccac tcataggtgg    33000
gaattgaaca ttgagaacac ctggacacag ggtgggaaac atcacacact ggggtctgtc    33060
gtggggtggg ggaaggagtg agggatagca ttaggagata cacctaatgt aaatgacgag    33120
ttaatgggtg cagcacacca acatggcaca tgtgtacata tgtaacaaac ctgcacatgt    33180
accctagaac ttaaagtata ataataaaaa taatatatat tctaccaccg ggctgctaac    33240
ttggcaaggg ctgaaagaat ccaaccgaga agaaaatagg ccatcattgt gcccctctcc    33300
acatcaaaat gcaattactg agcttttctt aagagctcag cactgtgcta gatgttgtcc    33360
atgttgatct tcacaactgc agaggctgaa ttactatatg tttatgtgat aactaaatat    33420
tctattatgc ttgcatttgt ctttggtgaa tattattgaa gtcgtttact gctacggttt    33480
cctctgcagt ttttctacta gtccatcaca ctcttctttt tggccctatt tttacccata    33540
ctcagttagt ttcttgtggc aggctacgtg tgtgtgaggt tctgtgtgta tgtgtgtttg    33600
cgcaaacatg gttttgtgtc agtatacctc atagatatga aaacagtttc tgttcaaaca    33660
gtacccacac ttagactcca tattaatctt ggctcaattc tgtgaaaact ggccctgaag    33720
tctgtgaccc cccttactca cctctttacc tcatctcaac caaaagaatc cacttcaaga    33780
acaccttccg cacaagctct tcaaatatct caagttctct tttccagtat ggtgttgcag    33840
ggtgtagtga aaaatgcatg agtttggagt caaacagatt cccgttccat ttctggttgt    33900
atcctatatt accacttgga gttgttggca gtcttaggtg aacacaggag gcaattcttt    33960
ttttacagtg actgacaaag aggtgagcaa gaaatgtgag tctcttattt attcccagcc    34020
cctctatctt aacttgttga aggtaaagac cagtggatct gaatttagat tatttaccct    34080
cccatgtgtg gggaacacac acacgtgcac acacacacca ggctggaatt tcttcagttt    34140
gttcctccgg gtctactcta tacttcatgg aagctgatct tatgacttac atcaatggtc    34200
tcccttgtcc tctggcttct attagatttg gcaaatgggg agccctggca gatcactgaa    34260
gggaggacag aagttgtagt atttattcct gtgatattct ctcctggtgt gtcaccttgg    34320
gctgtctgcg tcccttgaca gaaggtcacc ctcttgtcag gcatcacttt tctcacagtt    34380
ctctctgtct ctgggttcca acaccactcc ctcttcttga cccttaacgc ctaggggtga    34440
ttatagctcc agctgttatt agcacggagg actgcacgat cccttatgat ttcactacac    34500
ccagtaaata gaacctttat taagcttttc ccaaataacc caatttcagt gcactgtctg    34560
ttttctgctt ggactttcac tcacgtatgt gcatgcacac acacacacac atacacacac    34620
gcatgcacac tcatacccac gtactctcta tatacgtgta cattgagtgc tatggaattt    34680
ttagggttct ttgaggacaa cttcctggaa gaagaataat gggagatgtg ctcagaggct    34740
ggtgagcgtt taattgacct ggttgtgagc acaatgggaa tgcttttctg aaccttccat    34800
ttgcctccaa tttagaataa ctgcttagtc agcaacatgt ctccaattaa catgacagat    34860
tttttggacc acagatctct ttgggaatct tatgtaagct gtgaaacttc tcccttaaaa    34920
aacctacata tttaattctg tctgtaattt taggacttca catatcccca aagaccattc    34980
atgatccacc agggttaaag acttgtttta agtaaagaaa atattcacag cctctggagt    35040
agtagacatc tccagagaaa gtctggcatt ctttggtaac tcatggcatt tattacatta    35100
gctttggatg gaacaacccc caacccccaa gtctgagcat gtggtttgat gctgcttcct    35160
ttccattttc actctgctct cttggattct atgtagcaaa aaggtacctt ttctagggtc    35220
acatgtccac ttctcaaact ctgtcttgca ctggggattt gagggtggac tatcagagca    35280
taatggaaga ggcaggaaag gatagcacta attagagaac ttgataggcc ttttgctact    35340
gataaagatt ctgtcctgta tcatccatga ggtttggatt tgcacttcta aaaaatagct    35400
gtgtgttttt gacaatagcc actccctttt tgctcctttc tggtctcttt cctaaatgac    35460
tttccaggat agtataaaat aagcaatcta tttagaggaa caaaacaaag aactacacca    35520
ttagcattaa aatatttcta gggtagttta ggtaacatag aactttgtag ctcagcagtc    35580
ttggaatcac tagactctaa gccccatgta gtcagagact gcctgctttt ataattcatc    35640
cccaacagca ggctattgca taacacattg ttaccaccca caccattttg ttgagtaaat    35700
gaatgcatgc atgaacgaat cagaggattc tgttgtctaa ataaactttg gaggtgactt    35760
agtcttctct tccctctgat gcttagatct tctttatctc tcagttcaac atatattgct    35820
caaatggttc ctaggtgcaa gggatctgga agttattaaa atgaaataga ttttggacca    35880
tgaccttgac aaattatgat ctactaggag agataatatg gaaatcagta taatactaca    35940
gagacagtaa aaaggaaaaa gaaatgtttg cacttaataa ttattccacc attgttccaa    36000
aagtttcaat tatagggaac taagttccac tactaataaa agtcaatacg cattgtatgc    36060
ttactgcatg ctaaatatat tatgtcatta taatatttat gttcaggtgt atactatgat    36120
tgtatgtatt ttacgacaag gaaattgagg ctcagagagg ttaaagaact tgctcaaggt    36180
gacagagcca gtaggtggta gaacaaagac tcctacattc tgacctagtc catatgtaag    36240
cagatttatt gctagaaata tcttgatgtt gcattgaaat ctgcctctcc ttattttcca    36300
tttggaacta attccactct cccgagccag aaaaaccaag cctctcatta cttgaaaaac    36360
caattaatga gttaaattac atcaagttag tttaacagtc agcaattccc tgttgtaatc    36420
atagttaggc tgctaccatt tttgtcccaa tcattggccc acactgaatt ttgtgtctaa    36480
ttcattgctt tctgtctcct taatttcatc ctctgccccc agagatacta tgctgagtat    36540
tgatgctgca gcaacatatt aatttttatg ttttctgact catttacccc aaagccatag    36600
tgcatcaaat gcttttgggt ttgtgaccat tttatctttg gtttcagtca ctgtttatct    36660
ggtcgcatct ttgttcattt aacaaatatt tgctatgaag tgcaagttta gtgggtagca    36720
aacactgctc tggcaagggg tatatgaaga aagacatcat tccttcctcc aagactagtc    36780
ttgtttggaa gctggacaaa caaacagtta caatacaatt aaaatagggt taattaagaa    36840
atgtgccaac tgtcaagggt aatcaaaggg gaccctttca gtctgtccca aggatgctag    36900
gtaagtcttc acagagaaac tggtattagg gctaagatct agcggaggac taggggcttt    36960
ctagacagac aatggaggca ggacacttct gagagaggaa tgaagccttg aggtgtgaga    37020
cagcatgtgg tagagcatgg agggttcagg cacttggagg agttgggtat ggggagaaat    37080
acagagcacc tgtgagagcc tggggcatgg ctggagaggt aggcaggggc cggcttgcaa    37140
agggctttac ctgtcatgct gaagggctaa ctgctgttct ggagaatttg cagagccact    37200
gaaggttttg aagcatccta atgttaggat tcacttcaag ttttagaaag tttagtcttt    37260
tggctcaagg gtggggaggg aataaaagaa gcgagagtga aggcatggga ccagtttaga    37320
gactagtgaa gtctgatgaa aaggagatga gagaagccta aagtggacaa gcagctggac    37380
acggcggctc acacctgtaa tcccagcaat ttgggaggac gaggtgggcg gatcacctgt    37440
agtcgggagt tcaaggccag cctggccaac atggtgaaac cccgtctcta ctaaaaatac    37500
aaaattagct gggtgtggtg gcagacacgt gtaatcccac ctactcagga ggctgaagcg    37560
ggagaatcgc ttgaacctgg gaggcggagg ttgcagtgag ctgagttggc accactgcac    37620
cccagcctgg gcaaaaagag tgaaactctg tctcataata aataaataga gtggacaagg    37680
aaatactgat gggggtgaga aaacaatttg agagacattt gagaagtagt gagataacat    37740
ttggttactg attgaatatg gagtgttagg ataaccctgg gatcctcatt ttgggcaatc    37800
acaaagctac tggctacagc aaaaggaggg gaagaaaagt ggtggtggga gggaggcatg    37860
agaaatttgc tgctggccat gttaagctcc acctcctgtc accaagtggt gatgctcagg    37920
agatgtttgt gtccacagga ggagagtgat ctgggtggga ggtttacatg tccctccttc    37980
catctcccgg tccttctttc cctcctccct ctttctttgt ttggtacttc ctttcttctc    38040
tcttttcttt ttctgccttc ttttgagaat gaaacctaag agtgtttata tgtagaggga    38100
aaaagtggag ctagaagttt aagacacagg aaagggagga aaaatgtcct agtgtgagat    38160
tccaaggagg aagaagggcc aggataaggt ggggagaggg atgcctcttt tgctcattgc    38220
ctttatctgt ctttgtctgt cctggattga ttgtcctatc cttttcttcc acttcgtgtc    38280
ttctcccgta tttctacaca aggcacagtc aaataagggc tggcacgtgc gcatctttgt    38340
gcacacatgt gtgtgcacaa gcattgaggg atgcacaggt gcacacacct tgtagagcct    38400
ctagtagctc aagtcacatt ttttcgcatt tccagattgt aagccttact gaggggcaga    38460
tgggacgttc tcacaggaaa aaggctgacc tcagggagaa agatgtggcc cccacctaca    38520
aaccaatgat gtctactccc aacaggggac gtctttcccc tgcgtgaagc aacaggacag    38580
atttggttag gtgtggcatc gatgtcctaa tctcctatga gcacacaatg aatgaaggtg    38640
gggggctctg ttaactggag ggaatcaggg gctgccctgc aaagcatgtg caaagaaaat    38700
aaatgcaatt ggagtgttgt ctacacatcg tcctcagtgg gcacaaaaga ggcacagtgg    38760
gatggggctc tgacccagtt tccatttggc cagccgactg gaaacagcta ctcactgggc    38820
cactgggttc tttccaaaga acagtgaaga acagtggttt ggggtaggtg ggggcagggg    38880
ctggtggggc aagaatgtca gaagcaaatg caggcgtggc tggtccagta gttccagtac    38940
caaagaagcc gctatctgga agagtgggac aacccatcct aaacatggga agaagaaaca    39000
ggaaatttca aaagatacaa ctactaatta aatgaaagca ctccttaacc acccctttga    39060
taattagatc atcttctcct agaatgagaa ggaatattag tctgactttg ccctccatat    39120
ggagaaacat ggcaggcagg ctctctgtgc ctggagggtc tggccagact ttgtctggca    39180
tgggtatttt gactccagcc tattttttag ggatcctcct gcagctggtc ctcaagaggt    39240
ctgaactttg ccgtctcatt tctaaagcct ctttcagcag gtactggggt tcccaggtcc    39300
agggaagcct ggtcattgct agaacacatg gcaacatcct tcaggaaact cagctcagac    39360
tgtctggaaa gatgctggaa aggctgaatc catgcaagta ttatctaacc agccccaagt    39420
catgttttca cacttagatt tctacaggat attcataaat tctggaaaca aagatattgc    39480
cactttattt tatttttaca cattgagaag tttccttggc aacataacat gtatttgcct    39540
atgtttccaa ggtttatgga tgaatgtggg tggtcaatgg gattcattca ttttgccaag    39600
caaacgatat gtttgaagcc atattaagtg ccaggtacca tagaggatac agatgttcat    39660
aatgtaaact gccctctagc agcttacaga tactacctag gaataatgct tacactgcag    39720
taaacaacat aaggcagaat atatatatat gtctttgtac tcataacaaa atgtaaaagt    39780
caaagtcagg gctcttttaa ctttcttagt agcagaaacc caaattgaac ttaagcagaa    39840
ggggaattat ttatttaaaa cacaaagaaa ttatttattg aaagcaaaca ggaaattgat    39900
tattgcttct tacaactcat gagctaaaag acagagctgg gttcagatac agatatatcc    39960
agagttgtga tgctatcagg acgctgtctg gtaatgaaac caaccacagc acagagcctg    40020
gagtggaggg acagaccaac tctcttcaga tgccacatcc tcacccagca gacctcctcc    40080
tctccagcac ccattcatca aaccttcgag aagaccctgg ttgctactgc aaggctttca    40140
gcaccaaatg ggaaccaact cctcctcctt ggacatggaa tacttgaact ggccattctg    40200
ggacaggggc ctgcccatgt gaatggaggg aggaagaagt gaaatcctta aagggttgct    40260
gggtcagcat atcacaaatt tcccttgccg tgagccagat ctgatgggat ggtattagtc    40320
aataggtaga taataggggg aagagggggt gaagaatgag atggttctac aaaaagaaag    40380
gcagggtgcc agaaggtaga atttgggcaa tagtgagtca cagaattgat tgtgtcttgg    40440
agcccatgga agggagctga ggcacctacg gttggagggg gaggtgggga cccttgggca    40500
cagctaaaga gtctgctttt gggtaggatg tacagagcaa ttagaattat ttagcagtga    40560
cttaaagcca agagaacaaa tctggcttca gagtgttgac atggaagaaa ggaagaggca    40620
aatggaagag gctattccaa agggagaagg tctgagcttg gtggtgcctg ggaaggaagg    40680
acactgcagc caagctgagc ctgtgtccag ctgaacacgg acatttactt ctgcttctga    40740
ggggaaatat tgtcatgtct tatgggtgta cccagcaaaa gatgtttcca ctaaaagact    40800
atagagaatt gcttatttct aaggactgaa ttccgaatgt ttttggtcag gttctctctg    40860
aacagagaac cattgcccct gagcagaagc ggtcttcaca caactagcaa ccatgtagtg    40920
ttttctcatt caaatggcgt ttggtattca cctgcctgtc ctggaacaaa tgcaaagtca    40980
gggttgtttc tagctctccc ccaatattgg aaaaatgctg atgaactgag cctggttcca    41040
ttttacacct gacaaaagga actcagatga gagtgttggt aactgggttt aaggaggagt    41100
cagaggtgac tgctgaaatt tctgccagac tacaactaaa ttaaaaaagg aattcggttt    41160
aagaagccaa tcttcaacta atttgaacat gaggatgctc aacttagaag cctcccatgg    41220
ggccctggag cccagaaggg actgcatact ctttgctcct gcaggtaact cagggctttg    41280
ttctggtgtc tctgacaggc ttctaacctt ctgcaattct gttgccacaa tttctgtggc    41340
accaggagaa aattcatgca tctaggctag ggtggtgctc tcatgtgtct ccaggagagt    41400
gtggcctggg ttagcttaag actaggaatg tgctgacagc tgggaagaaa gtcaaaagaa    41460
ggcatggcat gtggttatgg ggccggaggg accgcttggg gggagaggtg gaagcgctga    41520
catgagcttg ctctgcatcg ctggttccca gaggtggcct gataggagag tgccagctgg    41580
tggtatgccg tgggctctgg ggaaggggct agaatgttgt tgcagcccag aggggctggg    41640
ctagtgagga gcaaaagaaa acataagctg gggggaaact gcctaataga ccaattagga    41700
gacagggttg tgccctaagg gatgggtggg agcagggggt gctagaagta gacagagagt    41760
aactctcagc tctgaacagc gtcccacata ggaggaagaa cactgatgtg aggccaagtg    41820
gcttggaagg gcgttgacac cccattccct acaacaaagg gtttggcaaa ctcatctcat    41880
ttgctacttg tcctataggt aaggatggac accaaaccca aagagacttt tgggatgtgg    41940
ataaaaattg aaaactttgc ctctcattaa tcccttggag aatatagcat ctccttcaaa    42000
ctggactgct ctccttgatc ccttgtcttt acctgaaaat atctttcaag gcctagctca    42060
tgctatcttg gccataggaa ctttccttat cacctccatc aatgctgttt gtccctccac    42120
tagaatcttc tgttttggta ctcctcttac tcagcctcaa gttaaattta tgtgtactgg    42180
ttttaacccc agtacccagt aaaggttctg aatacacgtg atgaaataag tctctcctat    42240
cccatggcac ctagtatagc atttagttgc tatactaatt attataatta gcatttatta    42300
cgggcttact atgtgcaaag tgccattatt ccatttatta ttcacaaaaa tatttagtct    42360
ctactattct ctaatttatt agataaccta atataaatct tttttgtttt gattgttgct    42420
agctgattga aggaaataga attgtggtgt ggtagtaggg gatgttgagt gagtcttcct    42480
cattcttaat atttccttcc actaggataa cgcccctggg ctctcttcat caggggagga    42540
ggagtgactt catctgatag attcggaagg gaaaatgtta cccagtcgct tctcagtcct    42600
ctttctcttg gagcgagccc atctctggag cacatacact ctcccctgct cctgtaggtc    42660
tcgagttctc aggggaaggg tttgccctgt aagagagctt gtccttctcc agtgaggcct    42720
gtcactggga agataattct gtacagtgct gggattcaaa tttagaaagc ccacttgccc    42780
cataattaag ccacattcac cagctttaac aatgacagag gtgatattga gttctccagt    42840
gatattgagt tctccatctg ccttatgctt ttctgcttat ttccccattg gttcagaatt    42900
ctggtgggaa aaggggtgct gtttgtggga tgccttccca ccctcatgtg gccctccata    42960
agttcttcat ccctcattgc attcaataac ttgggtgtgg tgtgggtgga gtgcatgtgc    43020
catatgaccc tctcccttga gtctttgaaa cctatttctt actttatgac tttggacttc    43080
cttttctttg ggagtataaa agtggatacc accattccac cccttacccg tcatcaggag    43140
aagttagttg ggaagcaaag gcggagtgac gtggagggaa gagtctaaaa acagctctac    43200
acttagcttt gtccttgcat tgatgacaag cgatgttgga tcctgaaagg tggggatggg    43260
aggtaggaag acccaggaag ttgctgtgaa ggctaaatcc taaagacagt cactaaaagt    43320
ttccagaagg ggcatctatc actccacagg caagcaagat gagaccatgt tgaaaaggtc    43380
ttaaagaagc cagggaagag gtgaaacatc tctctgtgtg ctgaggacca taccaggtcc    43440
ttcattatca tattctacac attgaaaatg aaggtaagag agcaagcaac ttgccctagg    43500
ctacccaggg aatagggagg aaagtctgga tttgaaccta ctgctgcctg actccgaagc    43560
cctgttcttt ctctcaccct ggaggatgga tgagggtggg atggggcagt taaaagttga    43620
ggggtatctc taggagaaag atgagacaca tgaccattgg gtctaaggag ccagagagag    43680
gccattgtgt ctgagcctgg acagccaagc ttcctagaga cagaggatgg gatgagatga    43740
cttctggctg actctgcctc cttgagctct ttaggatccc ctgcagaatc tcccaaaatg    43800
atgctcattg gaaacagaga gagcacattc aagtaagtat ttgtgccaca ctatgattgt    43860
tccaatgacg tcaagtctgg gatggcaaca gcagcggttc catttctttt cttcaggacc    43920
tggattcttg ctccaaggtc ttccacctcc ctcctcattt tcttccactc ccactgcagg    43980
ctccttcctt ggaggagctg gggcagggag taggggtgga ggttgtgtgt gcacttgtgc    44040
acatgcatgc ctgtctctta tgtgttgctg agtcaggaat gggcaggaag gagaggcttg    44100
gacagcaagg cagccctggg caatctggtg atgaacttga aacgggagag ggtctattgt    44160
gcatttgcac tgactctgtg caggaagggt gggggcaggc caaggaggac tggcttggct    44220
gagacatgag atgtctcagg ggagggtttg gctgaggcag tggaagaatg cttgtcggga    44280
accggcctgc ctggaattgt aacctcccct gctgtctctg caccacactc agagtacagc    44340
tgtatgcctc ttagctggta gattcctttt ctagctgggg acaccgtgga cagggacagt    44400
ggggaagagc attggactca gagacaactt gacatcaagt cctgcttgga atcctatttg    44460
ggtttgtaat tcgttgaagg cagacacaga cataaactaa tccttagttt tcccatccct    44520
tcaataagga gtacaacacc tatcacacaa ggctacaaga ataaaagaga gaacttgtac    44580
aaaggcaggg cctccacttg gcacatctta gatcctagac aaatgctgaa caaggcagca    44640
tggtgtgatg gtgaagggtt acagccagac tgactgactg gtcctgtctt cgtttgaagt    44700
tttgatattt tgttcctcgt gggttttttg catttttact atttatttat ttatttattt    44760
atttatttat tgagagacag agttttactc ttgtttccca ggctggagtg caatggcgtg    44820
atctcggctc actgcaacct ccgcctccca ggttcaagcc attctcctgc ctcagcctcc    44880
tgagtagctg ggattacagg catgtgccac cacatccggc taattttgta tttttagtag    44940
agatggggtt tctccatgtt ggtcagcctg ttctcaaact cccgacctca gatgatccac    45000
ctgcctcagc ctcccaaagt gctgggatta caggtgtgag ccaccacacc cggccaattt    45060
tttttttttt aaaatatggc attaaaatgg tatttatctt gactactgag tttttggtta    45120
accccttaca ttttgtgccc aagacatctc actcatgtta tcctaggccc agcatggctg    45180
gccttgtctc ttaaattcaa atttttaaat ttttcattcc tcaggcttct cacttgtaaa    45240
atagaaataa taatagcatc tcccccacag gcctgtgctg agagtgaaat gtgttactac    45300
acgtgcctca ccttcatttt caacaggacc tattgccagt aagtgctcgt taatgttagc    45360
cattattctt ggcattgctg ttgttattag tgtcagccat cattctctca gccaagagat    45420
ccttccagaa gagaagttct ccatggaggg ggatgggaga tgagctgaac cctggaaaca    45480
gaaatggatc agatcaggga gcctcagtgc cctgaagcca gggcaggggt gcatggggct    45540
tctgcaaaac ccagggccaa gcatgcaggc aagaggcagc cttgccaagc ccttgcagaa    45600
aatgcttgca gtgcaactcc tctctggaga cgccacaagt tgccccgaca gcttttcctt    45660
ttggggcttg tttaacattt caaacaaaaa taaaataaat aactgcagtg tttatggaaa    45720
cctaagacag aaatgaagac gacttagaag aaagttaagt ggaagtgggc caggaggggg    45780
tttagaagat gcccctttcc ttggtgttag cagttttgtg cttcagtttg tcagctcttc    45840
ctactgctct cccctagcaa ctcctctgcc agtgtgcaca aatgcatgtg tgcacacatg    45900
tgcatgtgaa tgcatgtaca cacacatgac acacacacac tcatcccaac gagaggcaca    45960
catttcagac accatctcac acacacacat ttctctcttt ctggaaatgt gtccacccac    46020
tttctccttt atcttcttca ctgtgttttt ttgttttttt ttttttttct ttttagacaa    46080
agaatctaat taactcattc tggccagatg gtgtacatta ctttaactcc ttcactcctg    46140
tgaaaatttt tggcctcaac cttcactctg aatagaccaa gccaaactcg ttttatgtgg    46200
ataagccatt tccaagtcaa agttccgtgg caggaagtgg gagagtgggc agagggagca    46260
ggtccttaca agcaaagact tgtataatgc tttgcctaga tttgcttatc agtatgttaa    46320
atatatgtgg actattttat tcttccacct tttattttgg tatcttcttt gtctatccag    46380
tctcactttg ccagactcca ttatgcaaga gaggctttgc cagaagcaag gatgctgtag    46440
aggaaagtaa tgaaaatgtg aggatttctc agaaggccac atacaatctc taggtctttc    46500
cagtacacac agcttcaaaa gccaggtgct gtgttcccca agcaggtcag ggcatttcca    46560
ggagccctgg attccagaag ctcaggacac ctcagtggta aagagaccct aatgccggtg    46620
acagcacaga ccctggaaac cctagattgc ctccgtgtgt tcctcttggc ctcagcaggg    46680
ctggtttccc cctcctgtag gagcagagga ggctctcctc tcttgagccc agggcctagc    46740
atagtgacca taaggaagca tagaagatcc agctgcagat ttggaaaaca gagccctcat    46800
ctctggaaga gccaaaactg atcctcaaca tgtgccatgc acatcagata tcaaacgctt    46860
cattcatttt gccttcgctg ggtaaccagt gaccttgaga agtcacctct cttgagtctc    46920
aatttcttca agttgggaac attacatgac aggacaggac tgtgaggatt aaatgtaaac    46980
aacatttttt ttttttctat agaacatact gtggggccag caccatgcaa ggtgctttta    47040
tctacaattt atttctttcc cttcccatgc cttctgcctc tttgaataac tgctgcaatg    47100
gctgtagaga gataaatgca gtagaccaag acttttagtg atttttaaac aatgttctag    47160
ggcaaataca tgggtatgtt tacatactcc acaaagtgaa aaaattatgc tagtcagtgt    47220
gcaaagtgtg tttttccaga cctgcaaaaa ctgagatcaa cttccatatt tccaacttcc    47280
atattccctt catcccttaa gctaccaggc agaggatggg agataaaatt tggccataaa    47340
cttgtcatgg gtccatcttg gtcctaatta gaattatcta cttcctaatc cattaactgc    47400
atggatagat agtctgaggg cctcaagggc aagagatgac ttctacccct ccacccatcc    47460
agccctgacc cacccttctc atatacattg gagaaagctc tgctctgtgt aaaacacatc    47520
aagtgcagga catggttctt ttcttcaact atctacagaa atgaatagcg gccctagaga    47580
aatgcaaaag atgcctgcaa tccaaggcca aattggagaa catttcaagg agaactgggc    47640
ctttattgta gagtttggga aatgagtaac atgtagatct gtgaatagat atgtctgagg    47700
aagcaccagg cagcggaaat agctggttgc aggagcagtt tgtcctgccc acctgaatct    47760
tcaggttcct tcagctaagc cttaggagag gaggctggag agctgctttg ctggatcatc    47820
tcctttggcc cccctcagac tagaactgca cctcctctct acctagctct gtgctccaca    47880
ggctgcctct gggctgcact gatgggctcc cttgactgct ggctcctgtt cagggttgga    47940
ggaggaggat gaagtcatgg aatagtgtcc ccatgctggg ctgcaggtac agttgctgct    48000
tctctactga agacccctga cagcaaccct gtcttacagc cagggtgttt gtagttgctc    48060
cctcctccct gtccctttag agtggtgatg gcactatatg ttagatatgg tcagagcagg    48120
agacatcatt ttcccttaat tctattctgc cttgtaaccc ctttcttaga ctctctgctg    48180
agtctctgct tatgtgttgg gattgcattg atgcagatgc tttagggcca cgttgtggag    48240
gatacaagat gatgagacag gaggcagcgt atggtgaatc acttctcaca gctcctaact    48300
aagttctggg cacatgaatg ggtactcagc acatacctac tgaccaagcc tatggagagc    48360
tgaaaactca taggctgact ttgaagcgag gcctttgaaa ccatcgtccc aggggaaata    48420
atctaggtca aagagacggc tgtggcaagg gtgcgagctg gcaagcatga gggctgacaa    48480
agcaggcagc actcctcctg agcagatgac cagccccgca gtgctggatg ggtacgacta    48540
ttccaaaccc tggtgtaatt ctgtcctcta acgtggctgg tttgactcag cactgctggg    48600
gagccacaga gccttcttct ttagcattta tgagctcatt ataagcatcc aagaaaacat    48660
caacaaaggg tgctaagtcc ctctagaact gccttttaaa tttttctttt gtaaaaagaa    48720
tgatgcttta agtaaaacca caacttacag aattcagaca aaaccaggca gcccccaatg    48780
ttgttatccc agctcctctt ggaataaatt tgggaatgaa caaaaagtca cagaagagaa    48840
aactccagcc cacacccaca ccttttctga catagccgcc tgtgcaggtt tttgggacca    48900
ggtctgccat ctgtattccc aggctgggct ggagcacctg aggctactat ggttacagaa    48960
aggaacctgg catccgaagg tataggctca aatcccagct ctcatgattg ctagctttga    49020
ggtttcaggt tcatttctta agtgctctga gctttggtgc cctcctcttc aaaatgggaa    49080
tgaggagcat gtctagctcc ctgttttgtt gcagtgaata gctacatgaa gaacagctaa    49140
accagaacag aaagaaggca aatggaagct acagaaacca aggatttcct tgttgaatcg    49200
aatcttcctt caatcttcct tcaccacact agtggatctc cctgtgggag ggatgttgag    49260
agtgctccgt gttttttttg tttttttttt tttttttttt gtgatggagt ctcactctgt    49320
cacccagact ggaatgcagt ggtgcgatct cggctcactg caacctctgc ctcccaggtt    49380
caagtgattc tcctgcctca gcttcccaag tagccaggac tacaggcata tgccatcaca    49440
cccagctaat ttttgtattt ttagtagaga cggggtttca ccatgttggc caggatggtc    49500
tcgatttctt gaccttgtga tctgcgcacc tctgcctccc aaagtgctgg gattacaggt    49560
gttagccacc acaccagcct tctctgtgtg tttttaatca atagcaatat gtaccatatt    49620
tagtagggac tataaagaaa ttgtgctaga aacacctggt tattttacag aactttgcca    49680
gtgagtacaa aaatatgcgt agcccacaac ctctctcccc tagaaaatac ctcctgtggg    49740
tagaatgaaa tgggtaggtg ttcttaccat tcattagcat ttcaacctgg ctatcttctt    49800
cctagaattc cactactccc aattgcccat gtgtttccaa taaaaccaat tcaattgtgt    49860
accaacttgg tgacaaaacc tttatgtagt tcttctatca ttttgtgggg ttttcaaaga    49920
gggttgctct ttgatatggt ttgatgctgt gtccccaccc aaatctcatc tctaattgta    49980
atctccatgt gtcaggggag gggcctggta ggaggtgatt gaatcatggg ggggggactg    50040
ttcttgtgat agtgagtgag tactcacgag atctggttgt ttgaaagtct gtggcacttc    50100
cccctttgct ctgtctccct ctttctctcc tgccaccatg taagacgtgc cttgcttccc    50160
cttcaccttc tgccatgatt ataagtttcc tgaggcctcc ccagccatgc agaacagtgt    50220
caattaaacc ccttccttat acattaccca gtctcagcta gttctttata gcagtgtgaa    50280
aacagactaa cacactctta aaagtaaatg ttattaccca ccttttacag attaagaaac    50340
ttaatattac atcaaggaat tagtttatag cactggatga tctggcctca aatctccagt    50400
gtgatcagta tcaagctttt ctcactgtat caacagagtt ttcctaacaa atcataagac    50460
acaagtagtt tctccaactt aatctattat acccataatt cacttgcctc cagggaaaaa    50520
aattagatga aacagactgt agtggctttg tgtaaaacag cagctccatt cctttagccc    50580
tattctaaaa caatagacca tgtgctgata gctagctaac ctccattcag tgcttcacta    50640
tgtgtcaggc atttgttcca aacacatttt acatggatta tcccatttaa tctttacact    50700
aaagtataat actcttatta ccccatttta aagaagagaa aactgaggca cagtgagatt    50760
aaggaattca tccagtttct gctgcaagta gggtggctag cattgtaatc tgggcatttg    50820
ccatgaagct gtgcccttaa ccactccact atgtgctata aggtggagct gacttcatgg    50880
gggctaattc aaccagggga gtgtgctcat attaacagat ctgtgaactc cctggtttgt    50940
ttgtgagaca attatctatt tgcttacctg aatcacagca ataatagtta tacctcccac    51000
ttactgcatg cctacttggt agcatgtacc tggacagaag gttttcattt ttatgacaaa    51060
cctgtaaaaa atggcttctt agcctggttt ttcagatgag gagtttgatt ctccatccaa    51120
agtcatatga taaagaagtg gtgaaacagg aattccaacc caagtttgtt ttgttttgtt    51180
tctgaaatcc atagactgga gtagaatctc aaattatatg acatttgtct atgcttattt    51240
tttagtttcc aaggtgatgg attatttaaa aaccaaacga ttttgaatgt aaaacaagct    51300
taattcaatt tacttataaa caatgagcac tgactcttgt atacatttaa gttatgagac    51360
actccaatat taattcgacc cacacttttc tttctataat ctattgctcc caaatattct    51420
atactatctg catgtctgcc ttagatacat aaggatccag ccctttccca tgtgtctctc    51480
aggatggcac ctttgctctg ggccggatgc catggggttc tcagtgatgc gcactgaata    51540
atgcaaatat gaggacataa tcacagaagg aagcccttga aattctaaag ataaggccca    51600
cagaccaggg tactttgaat aagtcagtca tccttttcca aggttatact ttttccccct    51660
aaaataataa ctgcagacac agttctcaaa gcaaacaggt ctggtatagt agaggcattt    51720
ttagacaatt tttttctatc tacttgttaa gcacatttta aaatactgat tgccaataaa    51780
gggctttcca tagaactcaa aattccaagt ctctgtccca agcttctggg agcattcctc    51840
catttttctg tttttatttt ttgagatgga gcctcgctct tgctcaggct ggactgcagt    51900
ggagcgatct cggctcactg caacctctgc ctcctaggtt caagagattc tcccacctca    51960
gcctcctgag tagctgggat tacaggtgca tgccaccatg ctcggctaat ttttgtattt    52020
ttagtagaga tggggtttca ctacgtaggt caggctggtc tagaactcct gacctcaagt    52080
gatccactca ccttggcctc ccaaagtgct gggattacag gcgtgagcca ccccggctgg    52140
tcgcattcct ctatttagtg ttaataccct aagactcccc agctgaccac caaatgtagg    52200
caggtggagg gactgacctc cagggggcac atgtctcagg ttgacaaaca cattttctct    52260
tgatcctttt tttcagtatg atgaagtatt ctacaagact ctcattgaac cttctgatat    52320
cacattctaa ccatttatat aaaagtcaaa agctccttgt cttcaggatt ccaaagttct    52380
tagcacaaag gtccaggaag tgtctgaatt ctttggtgtc tggttcagta tggatgttcg    52440
ggtccctctt agacttgaga tagaacagga aagagatgaa tagacaatga cagaggtaga    52500
gaaagtacca acccttccca ggctgtcggc ttatttgact gtgggaatca ataaaaagta    52560
tttagtgact aaaatagaat ttgaacccag ttcagatctg taagctaaca ttttttaggc    52620
aacaccatac agcctcttca tcattccctg gcctctttca tcctatccct ttttctcccc    52680
cttcctcttt ctctccttta tttctcctta atcatcttgc ttctctttct tatatcttct    52740
cagtaagtaa ataatccaca acctcacagg taaattaaag ttgccattcg cacatctgtt    52800
ggctcccagg tatggttcca ggatactggg aatgttaggt agtgagaaag attcagatga    52860
tattaatttc ctgcaaatgg aatattcatg gcaggcacag tctggccaat tgctcatggc    52920
ctggcgagta cgactagcct cgattgtacc tggtctttgc gaatgtggtg gcatgttcac    52980
tggcatcaca tactccctct catctcctga atggctgacc agtgcttgct tcaagttaga    53040
ttagagtttg agctttgtaa cataagtccc cttctgtctg atcaatgaaa tgagggatag    53100
gtacttgccc gagagttatg ggacctggca tttaacgtga gaacatgcat cttcagaagc    53160
actggtgaga cttcagaatt cctgaaagca ctattcttgc aaggcttgaa tgtaccttct    53220
ccactccacc atgtcctctc ccaaccctac tagcatgata tcaagcttgg gtggagagct    53280
cgcttgcaac tttgtcagat acccatgagc cactctttga atttctgaca atgaacaagt    53340
atgtgggagg ccaaccccat ccaacctgac ccatctgaac ccaatcacat gttttctatt    53400
ttgaaataaa caggcagggt ctcaggaatt ttaagtgagt cctctatatc tttctctatc    53460
ttccttttct tccactaatt attacagaat tgatctgcca gtaattacta ctaaattgaa    53520
tttcaggggc agtgctgtat ctggccccaa taccctaagt ccagtaatag cctggaatgt    53580
tgctgagttg ttaccgtcct taaagggtga agccacaatg atactttcta taacttctat    53640
ttggtctttt taagcccagc acttagaagg attcacttgt ggagaccttt tcatttcttt    53700
caactctaca gcttagtgcc tgaaaggcac atattggtct ctgtgaatct ctacgttaag    53760
aatctgattt gcagcactgg aaaccttgct agtcttagct ctgggctgaa tcccatgaag    53820
ccacgccatg cctagggctt tcatgctgta gtccatacct ctgaagaaaa cggagagaaa    53880
catcttcctc ccttcttccc cccaagtgtg tgtctgttct cgtcagattc ttggcagggt    53940
taccaactct cttctaagca acttggattc acaacagaat gattcctttt caatgccaat    54000
ctaaacaaat gccatcaact cttatcccag ggagtatgaa aaacagaaga gtcctttgtg    54060
actctgattg gctttgtgac ttccttgggg ctggtgttgg tctcaggctt gtgtctcgca    54120
gtcatccaaa atgtgggtgg gccatgtccc accttaactg tggttgtgaa cgcagaggat    54180
tcactcaact ttcagcatgc aacaataatc aaatgcagtt ttatggttca cagagggctc    54240
caccttcatg atttcatttg atcctcctaa caaccctggg agctcagaga gactaaggaa    54300
cttgtctcat atcacatacc caggagttga ctgcacggca tctgatgcca gcttctgtac    54360
cacgtgtcct cctggtgata ctagagtaaa taaaacataa ctagacaagt aaatattttg    54420
tacaaagtaa tctgctaaaa atgtggatgg cattttaggt tatttgttgg tttgggttat    54480
gcctcttctt attttgtaga taactgaaag ctaagagcat tgtcttattt atttatttat    54540
ttatttaggc agagtctcac tctctcaccc aggctggagc gcagtggtgc gatctcagct    54600
cactgcaacc tccacctccc aggttcaagg attctcctgt ctcagcctcc caggtagctg    54660
ggattacagg cccctgccac cacacctggc taatttttct atttttagta gagacagggt    54720
ttcaccatgt tggccaggct ggtctcgaac tcccgacctc aggtgatcca cctgcttcgg    54780
cctcccaaag tgctgggatt acagcacttt gcaatcccat gcgtgagcca ccgcacccgg    54840
cccattgtct gtcttcataa gcagaaggct gtggcacagg gtaggagaag aacatgaaga    54900
caaagttgag gggagttgct tatctcatgc ttcttgctgc tctgcctgaa gcaaaaatgc    54960
tttatggata cttcacttat gatttaaaat aatagctcac attgtgtact tactgtgtgc    55020
caggaactgt gctaattctt tatattatgc ccataaaacc tgcttctgaa gcattggggg    55080
gtttgcactt gccgttccct ctgtctggaa tgcctcccta tgcctacctt catgaacctc    55140
ttccctttac tttccccatc tctgttcagg tgtcacattt ttagttattc tttcctgacc    55200
gctcagtata aagtagctca cacctctacg ttatcacact ccctcttacc tgctctattt    55260
gtctttatag ccctgctcac aattatagtg tacatggatt tcttaatgtg tgctttatct    55320
tccccctccc atcggaatat aaactccttg agagcaagga tgatattttc ccctgctgtt    55380
ttctcagtac caagaagagt gcctggcacg tagtagctgt tcaacaaata tttgctgtgt    55440
aaattatctc attttataga taaggaatct gaggttctaa gggagtaaat cattgacttc    55500
aggggacaca acaggcaaga ggtggaacac agtcatgagc taaggcagtc ccagatcctg    55560
cctgaccctt cactctcttc ctcattcagt gaatcgtaag gcacttgggc tgtttgagca    55620
gtgcccttat ccataccctg cccagtcagg gcctcccaga accaggtaaa aggatctggc    55680
cccctctgcc atcctcccac tggtgccctt cccctcccac ccaccgcaac ccccatctag    55740
ggagaggaaa ctctttttcc acctaaattc cccctctgtc tagttcatcc aagtcatctc    55800
ccttcccacc acactgttta cacttgtggg tctgtgttga tgcatatcac agccccctta    55860
gtcattgttt agccattata ctttgcaggg gtaattttcc atccctctgt ttatattttt    55920
gcttctcctt catgtgctcc ccctcccact tcttaagggc aaaggaagac atgttcagtc    55980
atacaagcaa taatagagtt ataattaaga tgggaacatt ttgccaaaag gaggatttag    56040
ttgtgatttg ttgaatgcca tcctgagtgc attatttaag agcaaattca agctctttca    56100
tgagacttcc tgaacagtgc agtcctctga gcctgctgtc tctatagtct ttgtgtcagc    56160
tttgtggggt caggattgcg cgtgaaggat acatgtttag caaggcctgg ttgctgaaaa    56220
agcttaaaag gaaacttcag ggactatcta ggaagatctt ctgtgatctg ttctctgatt    56280
ttgtgtgctc ttttgtggtt agccattgct cttggtaccg tgtgggactt agcaccctgt    56340
gcctcaaggt aagaacacac ttccagccca gcttcagttt aatgttcact atgagagtct    56400
ccagtaacaa cccacactct gcgtgggatt cactgccttt cccatgtcct ggtgttggac    56460
atacatactg gacagagtta ctgccttttc ccctagtaat taggggaaaa ggaccacatt    56520
ttcccctagt aataggggaa aaggtgtcca gtatcagagc taggtagagc tgaatttgga    56580
tatgaacttg agctgtaccc catggtgtct tttcttgcag tcctagcctc cagcgccttt    56640
agaatttgca ttctgtttgg tgggatgagg acggtggcag tggagacagg gtgagaggag    56700
catggatggg tcctaagcct tcctgtcttc agcagcatct cgtgctctgc ggctctgctg    56760
tgtgcctcag gggctgccca ttttcaggtt gcatttatta gcttcctgga tgctctggct    56820
tccagtaggg tttagcctgt gggaggcact ggatggagat gggagggagg gagagaggac    56880
aagagaagtc atgttatttc tcctttgcct tcccagcctg ggaggtttct ccagtagcag    56940
ctgcctctct tcttggattc cagaccccac tagacaggtg tgctgtggct ccagcttctg    57000
tctggtgttg ctggcccctg gttcacctga ctccagctcc tcctcctcca tgcagctggg    57060
tcctgctgct gcctccctct gctctgcctt gctgtcccct gtcaggcctc tcagctcctc    57120
catcccctgg gttaccaact cgctatactg aaatccttct gttttagaaa ctcatatgtg    57180
attttcattc ttcttggttg gacactgact gatattgagg gatttgtctt agaagtaaag    57240
ctgtgtgagc attttctctt ggtaagttct cattttccct taatcattag aagacacggc    57300
acagtaaacg cgagctcatg agcagaaggc tacatagttg tatacatgtg tgtgcttttt    57360
ttcacaccag agtttgatga agcaaaatac ccaaaggtct tttaaaagta aagaggtttt    57420
aagagtaaag aaatttaaga aaaaaaacaa aaagaagtaa agatggttag gtctcctgtt    57480
tgctctcctt ttgcaatcag tctgtctcgc tctgtgagct gactatgctg cagacttttc    57540
ttttacctcc agcctttcgc ttgtagggtt tgaggctagg ggcggggaga gagagttcag    57600
cccagcaggc agcaaaccct atgtgcaaac acgatgtgtg aacattgtgt gcttggggga    57660
actgggatta tttagctgag aagacacgaa atctcctccc cttatttggg ctttgggatc    57720
tgagttcatt ggaagctgaa atgtaagaga aagaagaaag ggggaaggag tgggacaaag    57780
gagaggggag tgggagatca gactgggcac attctccctc acagagggaa gcgatttctt    57840
tgttaggaaa gcagttctgt tttgagaccc ggatgccttg tttatgctca ggtgtgaagc    57900
tggcttagga attgagttta gcttgcctct gtgcttttat gaatgtgttg gctgctcagc    57960
aaatttagta cagaaacatt ttatgtaagc agaagagaaa attatatttt aaaagttgtt    58020
ttaacagaag gtcagagtat gggattgaga attaaaaaaa aaaaaaaagg aaattctgtg    58080
ttctaggctt taagacagag agtcacacac actaatttag accagctggg gtgatctcac    58140
agggactcca tgggccagag ctgccgttcc tccatggaga gcacatttcc cctagaaatg    58200
tgtactcagg tgcagctgaa gggtctgagg tcatggctgc atccctggcc agggtcctcc    58260
caggctgcag cctctgcttc ctctgttgtc cattggtcta gagccatcct tcgagaccag    58320
agccagacca tgagcgagcc aaatgtgcat gaggacagca tgaattatcc ttggagacca    58380
gggggccctg ttcatccaga cattgtcttt ctttttaaag aagctaaatg cctctttttc    58440
cctctttctt cttgcatgac ctctgggagc ttgggcagta aatttctctg ggacaggttg    58500
tgaggaacct cttcaaagaa gcagagatga gacaaactgt ttatcagttc actctctacc    58560
cctgctgccc tcccaatgct caggtgggcc ctagattcat ccagaagcca gggtgttgtg    58620
cttcatgaaa gggccaatac ccctaatgtg ggacctatac aataaaaggc aagggcagaa    58680
agagagaaga aataaaagga aaaggggtgt cttgagggga gtacatgata gactcctgtg    58740
cctggaaggg actaggaaac ttatactgac tggttcactg catttgctca aagagtattc    58800
atcttcttga gtttgtcagg tgactgtaag agctgggttc aagttctttg gttcactatt    58860
atatgcctag ctgagcacaa tgcctgggac ttagagggaa ggtctgggac ttcaccagga    58920
ttcccaaaat agaacaaagc atttgttatt tgcaaaaggt tcacaaagcc tgaaaaaata    58980
tgtgttgtct ctggtggaaa agtaagggaa tatagcttaa gtacctacta cgctctgact    59040
ctttggattt cacctgcagg gcttttagag gtggataatc agggccatct ttttcggggg    59100
tggggggcga aaacaaccac tgaagaggtg aagaatcttg tagttctaaa aggatcagag    59160
agaggcttaa aacaactttt gcaaactgaa atatgccagc cagcttaaat tagcaaagct    59220
ggaactgtgg cagaatgaat agcccgtgtc tgagtgagag ggaaggaaag ggtctactgt    59280
gtgataggca atggttccaa agtaggagta ggggcctagt gtggtcatgc cttctgatat    59340
gtcaagaaaa ggcaaaaagt tgatatttat ttgaaatatt ctgattttat aggttggtga    59400
tcaattaaaa aactaacaaa tacagttaac aaacatgttt taatgcttgc agacaggatc    59460
cttcctgccg atgtttggcc tttgtcttta atggaatttg ggctgcccca taacagccca    59520
ccctaagcaa aacttctttt ctgcctttct tttatattgt tttttatgga atgtagaggg    59580
atttttctgg aatttttgga acggggaaat tagtgacaat ggtggtgctg agattcctgt    59640
ttatttcttg gcttttcccc aattccctga gggaactcat ttcttttgga tcttccataa    59700
catcggtcac atagttgggc acagagaggg cccacacttg gtacatgttg atgaaataaa    59760
tgtgtcttcc tctaagtcta gctgaatgga gaactgaaat attagggtgg gtgaaagtta    59820
cctaaattgt ttgctgccaa attttgctgt gttctttgtc tccagttctg tgaggtgtgt    59880
gttagatacc tattgctgta taacaaatca cccccaaaac atatctgttt aaagtaacaa    59940
acatttatta tagcacacat ctgtaggtca ggaattcaag tgcctcttag ctggtactct    60000
catggggctg taaaggaaat atcagttggt gctgcagtct catctgaagg atccactcca    60060
aattcattca tgtggttatt ggcaggattc ggttcctcac cctatattgg actgagggcc    60120
tcagttcttc actgattgtt tgaccggagc tctccttcca ttctttgcca tagggcctct    60180
ccatagggca gccccgaaca tgggatctgg tttccattag agcaaacaag caaaggaaag    60240
cagtgcaaga cagaagctgc aatgttttgg taacctaatc tcaggagtga ccctcctgtc    60300
actgcttcta tgctgtattc tagtcattaa aggagaccat ctcacactca aggggagaga    60360
ctacacaagc catagtgctg ccatggcaac acaaccatta ggatgatgcc ttgagccttc    60420
cttcttcata tttcttagac ttcctttctg acctagagga gccagaagga cttgggactt    60480
gtcataccgt ccaatcccaa gaaatgacag gaatgaagga atttttaaaa attcaactca    60540
tttcaacaca cacacaaaaa atgagagaag tgagtcaatt tgagaactga aattctggta    60600
gacttttggg gagacactag aagggccatg ttcatgagta ggaaccatag attctgagtc    60660
aattgggcat gaaagttttt ctcctggtgt cccgatcttg gtcgtatagt gaccaagcat    60720
ccaagaaggg gataacacaa tgttcttaca gtgttttctc tgttgtatta ataactcagg    60780
catcagccag tggaatgggc aaagctaagt gaaggtttga atgccagaca gattctccat    60840
tggctaaacc caatagacat gaataaggaa taaggccagg aatcagcatc cagatatatt    60900
aatttatgaa tctgaggtta ttccaaaaag caagagaaca ggagcaccat tggctgagac    60960
ggacaccaat accaagctct agagagtaat ttcaggcaga aaggaaacct taattaccag    61020
aggttcaagg gataggcaca cagtaagtcc aaataggcag aaagaaggca tcagggataa    61080
tctggcagag actgcattca aggtcaaggg cagggcatcc cagctgctgt tgagactggg    61140
ctccaaggaa gtctccctgg agagactgaa aaacaatcct gggccttaat cactgaggac    61200
tgaaacacaa cataggagaa aactagggct taagagaggc ttggtcaaga aataggcaag    61260
aacctgatta ttggggaaca agagatccac agtcaggctg gaccagtagc aagacagcaa    61320
gagtagacaa aaagttgacc actgccagaa accaagattg gtctctgagt ctggcatggg    61380
gctgaaacta cttgttgaga tcaggctgtc tcacttgcca ggggtagagt catgctggaa    61440
gtggagccag gacagacatt gaaccctggc taccctgtga tcaattgcac tccataccct    61500
ttgatacctc atgggaaaat cagacaagtg ctgttctgaa aggcaattag gtttcatgat    61560
ttcctccccc atccggacat cagcatgaaa ttgggggctt ggcttccaag cccatgttct    61620
tcctttttgt gaagggcagg gtgagacaaa ggacaccaca ggccagagca accctctgct    61680
tccatacagg ccctagaaga gaagtgagga cgcgggtgac ccacacggcc ttctgtgcct    61740
cttcaacagc tactctccca gcctcccatt tctgccaagc cacattctcc acaggactca    61800
aacatttagc tttactttag acttttccag gaatcttccc aaatctcctt tcctcatccc    61860
ccctcacctc ttcctcacca cccacagccc cctcctccac ccccatgtac aacatccggc    61920
ttttactcat gcttgtttct aattatgcat actaatttat tttctttcct tttttcctga    61980
cctgcctata ttttcctact cattctttgg cctccactac cgaaaaatgg aatactcctc    62040
ctgtacaggg tcagggtttt tccttcccca gtgcctaaag ctggattcag tccacagtga    62100
cttctctaat aacagagtgt aagggactcc ttggttgaaa agaaggaaaa accccaactt    62160
gcctttcagg gtctcttcaa tgagcttgat ttgtgttaaa tttaggggct caggaatttc    62220
tgccgatttg cagcacttac tactcctacc cttcccaaca tttgtgcttt atcgaaacaa    62280
ctaaattagg agcagcttga gggtaggggt cagagcacag acattttctg tattgcctgt    62340
agaaactagc acagtacagg caccccctaa gtgcaaaaga agtccttgct gacccagatg    62400
gaattttcct gaagtgagtg ctttgtgtct atctttagaa ctagactttc ctgataaaat    62460
agtcaggaga tttggctgaa ttttccagta ttcaactggc tatgttgggg tcatgtagat    62520
acaaccttta agaacataat gacctttaaa atatctattc ctgaagtcag gtttggtccc    62580
tagtctgtgg gcagatgact gttttcatgg tatgctttgt tcgtgtcctt cctgggtggg    62640
ggaggatttg gggggacagt ttgactctag ttatctacaa agttgagtta tgagaccagc    62700
ccttttcaac tttacctctt gcaaattgat cctgtaataa attgacatga cgaaaacacc    62760
aaagcaacca gagaaatctc acaaaggcaa gaacaccatc acacaagtcc tcaaaatctt    62820
tcccaagatc cactaggggt taatgccact gatctgatac tggggcacag cctaggaggt    62880
tttgctgtct ctgaacgcac atgtctccag cttacagctc acaggccagc tttgtttttg    62940
aacagattgt gttgggggaa gggaggcttc tgagacagag ctgagagtcc ccagcaatgc    63000
catccctggc ttctggccca tctgaatgcc ttactctttc atgtaagcaa gacatgaggt    63060
cctgctgttt gagttggctt tgccctgctc cgtgatttca gttccttgtc tctccagcgt    63120
gtgggctcat ttccgtcctc tgagcactat tgtttttctg acttgaacag tcatccagaa    63180
aacctcagta ataaggcttt tgtatcatta tttactttgc taattatata tgtctttccc    63240
atccccagtg cttgaagaca tcaaattgca gttgaagtaa cggcagaggg aaaagcaagg    63300
gcaacaacaa caaaccactt cactcctctg ggtggaaaca tgcaattgta ccaagaggga    63360
taaggaaaaa actgctcatg tttgcagaaa gaagttggaa taagggcgtg aaagcaggcg    63420
ggctacttta gcatctgatg ccagggatat gagagagtag cccagtgtgt tcattcaaaa    63480
agtaaggctc tgaggccagg accaggaaag atcctggagt ccccagtcac aatggcatga    63540
agcaggatga tgcagagagg ctaagggggt gattcagtgg gttctttacc tataaaaatg    63600
atggaaaccc caacatcagc tgggcaagtg gccctgttca gagctcctgg actcgccatg    63660
actaaaacac tctgttttat ttcgtagttg atatctattg ttcttgcctc ccagcaagca    63720
atggaacagc acctttactt tcctttgaga aactattcct ttcccattct cagggcttgt    63780
gaggatcaag tgaggtcaca taatccagat ctggccaatc agcccatctc atgctactgg    63840
ctacactaat tggtttaggg atagtaaagt actcaaattt gtttactgaa catttagccc    63900
tggaattttg gtgatgggag gtgtagaggg taaactcttg atgatatcat ttgtgtacct    63960
gggtccagcc atgcctgaac ttttcaatta cttgacccag taaatttcct tattcattta    64020
aatgttagag ttgagttttg tctcttataa ctgaaagagt gacatgtgtt tatattaagt    64080
gcaggtcact aatatagtct attggtttcc ccaggcttgt tctccttttc tcaaatagga    64140
ctgatcagat agtaagtgct ccatacctgt aggatacata aaagagcaaa tgaacaagga    64200
gcaggagata tggtggctga cggttggact ataatttttt cttgattttt ctgactttat    64260
tttggctgtg atctaggaag tgaaatccag gtccttctaa accccaattt aactgtggct    64320
cctgagggag attttcagat ctcaaatgat ctgtaagttt aagggaggat gattggtccc    64380
tgtacactct ctgtgagagt tcctttggaa tactggtttc agaatgtaca gccacacagg    64440
taactggatt agggacggcc agtggttttt tatgaatgct attgaagaca ctgaatggaa    64500
gcaattctca ccagaactct ttttgctgtc atctttcagg ggctaagttg acactagaac    64560
caatcaatga tccctgaact gggagaaatg ggtggccttg gctgtgattt ttggttgtgc    64620
tgcacatttc aagatgacaa tattgtttta aattaacctg ttagagtgca cctttcctaa    64680
agaactttac cttgatgtct gagtaagggc agtgcaggag gtcccccaac ttaggggact    64740
gatcatgttc caaaggtcat ttctcagtct ggatgttttc atgagataat gaattccaag    64800
atattgtaag gttcaatatt ataaatggtt cttagtttac taagataatg cattgcctct    64860
ttgtgaagcc ttctctggtt accctaatca aaagtaactt ttctttcctc ttatatgtca    64920
cacagtatta aatgagttgt tttttaaaaa catcttaaaa tcttatactt aagcaattat    64980
gtagattatc ttggagtgtt gagcttattg ctctcattag atgttagtaa atggaaactg    65040
agtccacaat tttcacactg ttctagttct ttttcattct gcttcatttt ctgttgtctc    65100
ctgccaggtg tctgtgctaa ctcatcttgc ctgaggaccc ctaccccatg tctcactggt    65160
ctgcttggct tacttctgaa gcccagcacc accttccctc agtggctctt aacaataaac    65220
cctgacacag aagttctggc tggtccacct attcctttga gtcaggtcac aggtttccct    65280
ccagctaact gatggatgga ctgtccttgg ctcaggggtc cactcttgtt caattagata    65340
cattttgggg gcagggtcag aattcataaa atgcaggcat ttgaagaaca gggaatcaag    65400
gtagagagtt cctagaagac agagcaggga ggtaaaatga aatattctag taaagtatta    65460
atatttgtgg caggatatgg tcttttttct ttctttcttt tcttttgaga tggagtctta    65520
ctctgtcacc caggctggaa tgccctggca taatcttggc tcactgcagc ctccgcctcc    65580
cgggttcaag cgattctcat gcctcagcct ccctagtagc tggtattaca gatgtccgcc    65640
actacaccct gctaattttt gtatttttag tagagacggg gtttcaccat ataggccagg    65700
ctggtctcga actcctgacc tcaagtgatc ccccgccttg gatatggtct taactagaaa    65760
tgaagagatc tgagttcaaa ttcagcattt gtcacatgta ccctctctgg tcccaaggaa    65820
atcaagtaat atctccaatc ttcagatctt tcacatgaag aataaagagt attgatcacc    65880
atatctctac acctccttcc agctctaaga cctccaggac tcacctagaa ccaaattcat    65940
ccccacacag tggcggcagg gtcgtgttgt catgatgatg gcctctttcg gtgaagagag    66000
gttgtcagac acctggagca atgccagaga cattatcctt ccctaggaga gctactgata    66060
agaaaccact ggcagctcct cattcacttc tccatcattc actcttttct cctttctttt    66120
tccttagagg cataaacaag gtgtagatca tcctgttatc cataatgaag gaagatttta    66180
ggatattcca gcttagatcc aggtgtcccc agcttctata ctcactctga agaagtgtac    66240
tttatctact ctttttacac catttatccc attttggcca tttctgaaag gaagatccta    66300
gaagccaggc ctcttggaag aagttggagc tacagcattg ataggaaaac ctgacaccta    66360
gaaaggcaag tcagttcttc ccatgcagtg gctttgggga ctgtaattta acaaagctct    66420
tttttacttg tgtaaagtga tctccattcc acttttttct tgcactgatt ctaattaagt    66480
ggaagcaatt gttatcatca tttaggatta tagttaaaat acccctcaaa ttgtttccat    66540
ttggaatggg accttgtccc attctgctct tgctgaagga agtcttcatg gaatcacagg    66600
actcaacaaa catttctcat taaaaattct ctcctttagg caacagtggc atagaaatcc    66660
ttatgttcta ctgtctgacc cgtatgagaa cagcgcactt ctcaatttat aaaagaggca    66720
ttttccctcc tcctgggaaa aatatttctc ttggtcactt gagtctagca tctaagtcat    66780
ataatgctat tatagccttg ttttgctttt gatttaggtc atatcttctt tttctgatct    66840
ttcttaaagt gaagggacca tttgctatgc tcacaaaaat tctcaaggct ggaactacag    66900
catgctctgg tttctaagcc atacacatcc aggtagaagg gtcaatttaa ttgccaatga    66960
tctcagcctt ttctaacact gttccttaag tttctttggc actgcatggc aagcaactga    67020
gtcatgcatg aaaatttctc ttctagacaa cccataccta cagagggagg atttggttta    67080
ctgcagatgc tgagtgcttc tgatggcaca cattccttct tattaatatc cccctggccc    67140
ataatggttt gtgtggacaa cagctacttc cttcaagggt cctttgcttg gtaaatatat    67200
gcctccagga gctttctggg tagaagcagt cacaaatcac aggggtatct atgaatggca    67260
cggcccatgg aagggctcac actgtcctga tttttctacc ataagagcta aaataaggga    67320
ataggcttcc aggaaataag tcagatgggt tgtctgacta agcacagggg cagggattgg    67380
aggtgagatg acagagaaca gtcagcattg tctccgcttc cgctccaccc tgcagttctg    67440
agctgaacag ataatttatc tgtggcacaa caaagtatat gacttggaag aatgttaaag    67500
atcaagtcca ccttctcctt gtattatatg gctctgagag ccagagaggg gaggtgacct    67560
tcccagaatg tgaatgtggt agagcctagc ttacaattca tgtccaactt aggtgtgaag    67620
ttctatgaga ctatgctgcc ctctgcctca caatgctttc tcccatggga gaggaggctc    67680
agaggtacaa agcagctgca gaaagactct ctcaagctat tgactcttgg atgacaacaa    67740
ttaatgttca acttggcttt acccccaaca tgcactgcac agatgcctgc aggtctacaa    67800
tgccgagacc aagtttgggg ggcatttccg cagctctgtc tattgtcctc ctttcctctt    67860
ctgtggtcat tcttcccaag ggataggcct agtccagggt ggagaaaaac aattcttggt    67920
ggtaggggca ttggaattgt atgggcaggg ttctaggcca actttggcct ttcacaattc    67980
tgctaagcat tgaacagaat tttcacccta atttcacctt cccttccatc ccttccctaa    68040
ttttgctagt gtgtatggag ttgatttgat gagacctcgt cttttttttt ttctcccttg    68100
taacgtgggc cctatcttca agcctatctt catagccttt cttttccaga ccttgccaaa    68160
aagcagtaga agagaggtta caaaatataa gaggaaacct taaaacaaac agggtagaac    68220
tggagggaat cttaaataat gcctaaccca actccatatt ccactgatag gaaactgaga    68280
tcctgagaca ccatccaaat tctgatgtaa tcagcagaac ttaatatgcc actttgagca    68340
cagaaccaag tactttagag gtaagagagg ctatttgttt ccagcacagg ctgaaaccca    68400
catgagaaag ttggacttta agtgaccata gtcacattct gataaattct aaaatgtctc    68460
tctcattttc tctgacatca tattgtcatt tttcatacca caaatgtgtt acagtgaaaa    68520
ccaggtatag gtcaatagat agtaccaaga aaaagaaaag ttatcattct ttaatgctct    68580
ttagtttgaa aactttattt atttctttat tttgatggag gagtagagtg ggtcaagcta    68640
agagttgcct tataaacctg ttgttctcag caaatgagtc agctgagata aaaacattag    68700
tttccttggc gtgtcagcat ctctcccaaa ggagggtatt agttcatggg ttggcattgc    68760
tatcacaaag aaggctctgg cagcacctga ttggcttggc caagcttttc ccagttggcg    68820
tctgggcatc ttcctagcag tgggtcactc acccagcagt gatttggcct cctgttgaca    68880
taaatatgcc taattcaaag cagaaagtca atttgttatt ttgcctaaag aaatgtaact    68940
accaagcagg ctagatttct gtcttggcat aaccaggaaa tctttaccaa taatttatga    69000
tgtggtcacc cttgttgtag gcattatgga agatggaaag atatataagg aatggcgtct    69060
tgcaaaaaga actggacttt tttttttttt tttttttttg tagcaatgtg gagagtaaaa    69120
gcccaggggt caaatggtaa ttatagaagg agattcattt aaagaatgtc ataaggaaat    69180
agaaaataaa ggaaacattg caggaaacca tagggggcta gctgattcat ggaaaatgtg    69240
aggttatggc tgggtctaag aataagtaaa tcattggtga ctatggttgt agaggttagg    69300
acagagaaag ctggagcaac aagcaatcat ctgccagata agaccccggg ctgggtgaat    69360
gcaaggaggg agcggacaat tttgtcttcc aactctgtgg agctggagcc ttatcttagg    69420
agtccagtgg gcctggaggc ctgatcacca accagtgtaa tgttagaata agacttccct    69480
aagcaaatca atgtgatgat tgatacaaac agccatcact ggggcctcct ctatttccaa    69540
tctcttcctc agtttcccag ttctttcaga acctcactgg gaagttcagg gatatatgcc    69600
tgcaggctgg cctggcgcag atggatgatg aagggtcctg ccttgagtgt agggtagagt    69660
gattctgagt gctttccaac agactgtaaa ttaaagacac tccaaaaagc ccctggtggg    69720
gatagatggg gagaaggggt atcactaagt cttcatcttt tcttctaggg ccagggtcag    69780
tggttcaaat aaacatggtg ccccacagag atggcctgtg gccaagtagc tctcagtggg    69840
ttgactcaaa gtcacctgga caggcctggc ggaaacgcag gatggcccag ccctttccta    69900
ataggttttc cagagttgat ccatcattct gcccagaaaa ggggagaata aaaaatagat    69960
cacgagcccc tatgactgtg acttgtgctt ccttggaaat gcaaacaggt gaaggagaaa    70020
atgacacagc tagggtggta gggggcactg gaagtcaaca catttctggg ttcaaatgag    70080
aagggtgagg tgctggcatg gaggaaactg gcactggccg tctccaggca ggactttctg    70140
ggcactgggc aaggccatgg ctttgggagc tgccccaagc tgctggtcgt gccagtgctt    70200
cattcaccct gtgaaatgta ttaattagtg agtggttttg gctcagagag agttgctgtg    70260
gcttcagatg gatatagcag aaaaaaggca aatccatcta caggcgcctc tgagaaatct    70320
cagctcttgt gagcctgaga agagcttcca tagagagaag gcgagacccc agcaaagttg    70380
gacggagaaa attgagacac ccacaccaat tagtatgagt ctatcaatcc agtgccaccg    70440
aaacacaagt ctaagcctaa cagaatctgt gctgcgaata agtaagattg ttggaaacag    70500
aacaaaaaaa aactttgcaa atggtgcttc tttaagcttc tgcagttctc ttctctcact    70560
cccttttcaa aaatggctgt aaaaaaaatt tttggtctgg tttagccaga gcgcgtcaga    70620
gctggtagat gccttcaaaa ctgtgatctc cctttaattg tcagagggta ggctgaggtc    70680
cagggaggta aacagacttt tcctaagctc tgtagctggc tactggcagg attgagggaa    70740
ggtggaacaa gcctcttcat tcccaattca ggtttctttc ttccatccca catctcatgc    70800
aataaacatt tccaaatcta cctgcccagc ggggctaaga gcagagtggt ctccagaata    70860
agtggaatag catctcaggg actgctggtc tgaacacgta ctccgaacat cacagctgct    70920
gccaagcggg cagacgcctt agccccagcc cctctccctg ggctttcctg ggtcttgtcg    70980
acacttctca catcactctg ccttaaattt ttctccccct agaaagagat aacttgcctt    71040
tcattcatgc ctacctaact cagttcaatt caagtacata aatcctgctg acaaccctgg    71100
cagaagcttt atgagtaggg agtaaagatt gtgagaaagg cagggaatta atttataagg    71160
aaggaacaat gggagaggag agaaacaaag agaaggatgc aaagcaatta atgttaattg    71220
atgcttaata tatgccaggc ccagtcatcc tagttatttc atttaatctt taaaataatc    71280
cttgtgttgt catccatgcg ttttcagttg cagttccatg atttaagaaa agcacacagc    71340
cagaaagtgg cagagaaaaa atcatatcct gagtgacagc tttaccggcc cagtgctttc    71400
cattctaaca aatagtagaa agagggaaag agagaagaat cccttggtga taggaataag    71460
gtagagagag gctgtgaaag agagaaacag ggctttgggg gatcctgggt tctgatgctg    71520
acctctgtgt catttctgta tccattgtat gaatgtttat ggaaagtcag ctacgaagca    71580
aattgttcta ggcagggggg tttcagcaga gcttgggaga gcagatggtg ggaggagtgc    71640
atccatagga tagcctgggc tgtgggaata agagaacagc aagtcagggt gagtgctgca    71700
aagacaatat aagagagcga caggcctcag agaacctggg aaaaggaatg aatggggtca    71760
ccttaggaag ttcattagga ggggcctctc tgaagaggtg acctttgagt cgagacctga    71820
ggcactggag ttacaggaaa tgtgatgttg cacgtggaga atttcttgga aatggagcag    71880
caatgtagtc tgaccctatt gttgggccca ttaacttggg caatgtctca ccaaggtgga    71940
ggatggtgac aggtcctcct gggatatggg ccatggcagg acgaggggac aatgtctgta    72000
aaggatttaa aaagagtcat caattctaac gatgtcaatg ataaaatact tctccatatg    72060
cagggggcca tttccatgac ccagctcata aggagtggag agagtgctat cttcctctag    72120
aggcagctcc aggaagcagg agctggtaac ctgggggctg ctctgaaacc ttcaaaaggg    72180
caaatcatgt aggagtctct ggccactttc ttttctgtaa gagaagattc actcaaggtc    72240
aggggaccct aaggacccca gggaatcacc caaaaactcc agccagcccc tagaggaaga    72300
caatccacag agctggcccc atcccttcgg cctgtggcta aggcccatct gcccatggtt    72360
ccttcttgaa gtaattgctg taagaatttg tcattcacaa aaggaagtct ctattgtctc    72420
ttttcggatg tcatgtaacc aatgcgtgtt aaaggtcagt tgcatcagtt ctcttaaatg    72480
gcaattaagc tattgtctga gcaaaccaga ggcatccgga gtgcaagctt cgctcaaacc    72540
tagggacctg ggaaaggctg ggaacagagg agcaagtagg acaccacagg ggagggccgt    72600
ggcttcagga aacgtgggga acaccctgaa ctgtaaaagc agatgcgtca gcagacaaag    72660
ggggtcattt cactaaagcc tcagtgaagc agagaaattc cagactttgc ccatcaccta    72720
ctggcaggct ctccctccct ctgtcccctc cccaccctct cctcaccctt gtctttctct    72780
gcttcattat ctcacgctct ctctttctct cccgcagttt ctctgtctct cagtctcgat    72840
ttctcacatc ctgtttctct ttcttcttta ctctttctcc ctctccttca cctctcctgg    72900
cttcactcca ctccccccac ccactctgtt ccctctcaca ttctcatttg gggatggggg    72960
gcggctgaca aaccggattg ggggggtctg acaaactgga tttaaatttc agctccgcag    73020
cgttctcagc tcttggtctt ggaaatgttc cctgagcttc ggtttttctc atctgaaaat    73080
gaaaaaaata atacctagct ccaagtattg agcttgttgt gaggaatcaa acagataacg    73140
tttctaaaat tccaaacaca gtgcctggtc cacggcagat gcttgactgg tgacagcttc    73200
ctttcccagt gaggcccagg gaagtaggca cagtgcttgg caccctgcaa gcatgcgaca    73260
cagcttcaca aaatacccac agggagccag gagcaccgct tgaattttat ggatgacaaa    73320
attgtggttc aaggaaggta aaagtaccct ggtaggacac gtaattttta aaaagtctat    73380
agctattgat attactatat attaattccc attctgtccc tccggtttct cccctgaaca    73440
ctaatttcca aatccccaac actctatggt ttaaatgata aacgattcac ccaaatactg    73500
tataattttt tttttccttt tgggtcaggg ccatgctctg tcacccaggc tagagtgcag    73560
tggtacaatc gcagctaact gcagcctcaa cctcccaggc ttaagtgatc ctcccacttc    73620
acagcctccc aagtagttgg gactacaggc atgcacaacc acaactagct aatttttaaa    73680
atttttggca aagacagatc tcactacgtt gccctggctg gtctcgaact catggactca    73740
aatgatcctt tctcctcagc ctcccaaagt gcttggatta cagatgtgag ccaccgcaca    73800
tggccatgta caattcttga agaagctgaa actcatcttt ctttctcggt ataagaaaac    73860
tcaggatatg tttggacatc ccctcccatc tgccctccca gcctcctctt ctccaggctg    73920
aaccagatcc tgctgcatct ttctcaaaga ctctcttaca tcctcattat ggtttctgcc    73980
ccagtcctcc atgcttctct gaagtttaga gtcaaaatgc ccttttttgc tttaggggtg    74040
agaccttctc tagcaccgtg tgtctacaac acagagaggg caaacagaga tagtgcttgg    74100
tattttattt ttaaaatttt taatcttgat tatattttgc aatgtttata ccattgcaca    74160
acacacggaa gcattagtca caatttatat agctgatttc atggagctga attctatggt    74220
gtttatagcc gttgagtgtc ttctcccaga aattggaaag atgccccatt tgctgtaaca    74280
cacacgacct ccaccccatt cttttccttt gtaacccaaa ccacaatgtg taattgtgtg    74340
tttattttgt gtttaatgtt tatctcttcg cccaggctct aaggctctat gagggcaggg    74400
atcacatctg tttagttcac ccagatttca ttatatatcc agcattctac actctgtaac    74460
tgcttagtct caactctgac cacacattaa gtcatcaagg gagttaacag aaaaaaaaaa    74520
aaaacaataa acaagcaaaa tgtttactaa tgttccacaa gctcttttga atcaactggt    74580
ccctgtggca cctggggatc cgtagtcatg aaaatcctgc cagggattct tgatccggga    74640
tctggtgatc ctcggcagga caactcacca ttctgttcgg ttgcccgctt gcctcctccc    74700
gctggctcca gcttctgtgc ctacaatgaa ggctgtgccc attccctcac gtgcccgccg    74760
tggcctgaca ccttcctggg cccaccctaa cacattcctc cgttgctttt aacgactgtt    74820
tacagctcgc tacctctagg acgtggcttc tgatgaaaac tgtccagacg ctctgcctcc    74880
ggtgtaattc agagcccagc tctcctcctt aaaattcttt tacgctattt tccacaagca    74940
tgtgcttctg ttggcagtgc cataagtgtg attgatcttt accataagtt ccttgaactt    75000
tgctgtgacc tggatgctaa ggtggcggga gctgcctcca tccccacaat ttgactggta    75060
caacccgaaa gtaggatgat agtctgttct ggtcaaacat taacgtgggg cagggacaat    75120
ggagagaggg tttggtcatc tggcatgctg cagactgcca gaggagctgg aaaggctgag    75180
tatgggaaag gggagggatt tcatggcctc ttcgggcttt gagtatttga agaaactgcc    75240
tatggaagac cagacctgtg ccctgcctcc caagaaacac acagagctta gacggtggaa    75300
gctatctggg gcaaattcag ctccctgtga ggaaggtctt ctagttgtta ggggtgtctt    75360
ggtaggtcag ggagggtttt ccagcatcag tcattttcat accaatctct cggtttttgc    75420
catattcctg taccacccgt gcttttattt acctaatctt ttttatttac cgaattttta    75480
acctaatatt tcctttaaaa caactttaaa ttgacacact ttgtttcatt cctgttttta    75540
aaaagtacct atggcaaaag atatgaatag acacttctca aaagaagaca tgcaagccgc    75600
caacaaacat atggaaaaat gttcatcatc actaattatc agaaaaatgc aaaccaaaat    75660
cacagtgaga tatcatctca caccagttag aatggccatt attaaaaagt caaaaccaac    75720
agatgttggt gaggctgcag agaaaagaga acacttatat attcttgaga atttaaatta    75780
gttcagccac tgtggaaaga agtttggaga tttctcaaag aacttaaaca gaactaccat    75840
ttgacccagc aatcccgtga ctgggtatgt acctaaaaga aaacaaattg ttcaaccaaa    75900
aagacatatg cactcacatg ttcatcatag cactattcac aatagcacgg ttcatggaat    75960
caacgtaggt gcccaccaac aatagattgg ataaagaaaa tgtggtacat atataccatg    76020
gaatactatg cagccatgaa aaagaaggaa atcacgtcct gtacagcaac atggatgcag    76080
agggaggcca ttatccaaag caaattaaca caggaacaga aaaccacata ccacatgttc    76140
tcacttataa gtgggaacta aacatcaggt actcgtggac ataaagatgg caacaatagg    76200
ccaggcacgg tgctgatgcc tgtaatccca gcacttgggg aggctgaggc gggtggatca    76260
tatgaggtca ggagtttgac accagcctag ccaacatggt gaaagcccat ctctactaaa    76320
aatataaaaa ttagctgggt gtggtggcac acacctgaaa tcccagctac tcaggaggct    76380
gaggtgggag aatttcttga acctgggagg cagagattgc agtaagccaa gaaggtgcca    76440
ctgcattcca gcctgggcaa cagagtgaga ctctgtctcc aaaaaaaaaa aaaaaaaaaa    76500
aaaaagatag caacaataga cactggtaac atacccaggt aacaacatac ccaatatatg    76560
catgatatac ccacacaaca tacccaggta acaaacctgc atttgtactg cctggtgggt    76620
gtggtttgtg aaccggtatg tgtggtctgt ggtatgtatg gatgtgtgta gtttgtgaac    76680
tggtgtgtgt ggcatatggt gtgtatgtgg gtaactggca taactggggt atggtaggta    76740
tgggtatgtg tggtatgtga actggtaagt gatatgtatg agtgcgtatg gtgtgtgttg    76800
cgggtggtgt gtgaactggt gtgtggtgtg tggtatgcat cggtgcatgt gatgtgtgaa    76860
ctggtgtgtg tggtatggta tgcatgggtg tgtgtagtgt gtgaactgat atgtgtggtt    76920
tgtgaactgg tatgaactgg tgtggtgtgt gatgtgtggt atgtatgggt gtgtatggtt    76980
tgtaaactgg tgcatgtggt gtgaactggt gtgtggtatg catggagatg tgtggtttgt    77040
gaactggtgt gaattggtgt gtggtgtgtg gtatatatgg atgtgtggta tgtgaacttg    77100
tatgtgtggt gtggtttgga tgtggtgcat gtggtatgtg cagtatgtgg tgagagtgtg    77160
gcgtgtggtg tatgtggtgc atgtggtgtg tttggtatgt ggtatgcgta tggtgtgtgt    77220
ggtgtatggg gcatatgtgg tttgtgtgtg gtgtggtgtt tgtagagtgt ggtgcgcatg    77280
gtgtgtgtgg tatgtggtgt gtgtgtggca tgtggtgtat ggggtgtatg tggtttgtgt    77340
ggggtgtgtg ggatacgtgg ggtatatgtg gtggggtgtg tggtgtctgt gatgtgtggt    77400
atgtatgggg gtatgtggtg tgtgaattgg tgtgtgtggt ttgtaaactg gtgcatgtgg    77460
tgtgaattgg tatgtggtgt gcatggaagt gtgtggtttt tgaactggtg tgaactgctg    77520
tgtggtgtgt ggtatatatg gatgtgtggt atgtgaactt gtatgtgtgg tgtggtttgg    77580
atgtggtata tgtggtgtgt gcagtatatg gtgtgtttgt ggcgtgtggt gtatgtggtg    77640
catgtgtgcg gtatgtagtg tgtgtgtggc gtgtggtgtg tgtggtatag gggtatatgt    77700
ggtttgtgtg gggtgtatgg ggtgcgtgag gtgtgtgtgg tgtgatatgt ggtgtctgtg    77760
gtgtgtggta tgtatggggg tatgtggtgt gtgaattggt gtgtgcacca tggtatgtat    77820
gggtatgtgt ggtctgtgaa ctggtagggg tgctgtggtg gggagtggtg tgtgtggtgt    77880
gtggcatgta tggatgtgtg tggtgtgtgt cttgggagtg agggtgctta tcatgagcag    77940
gtgctgcaga agccctcagg gaagatgact tcactgggag ctgagatgac ctcactgggc    78000
gccctccttc agcagatgcg aggacaggcc cacaggccta aagtcaatta gaggcagatt    78060
tccaagcaga atctacttct cctgacctct gattcagtgc cttttcctga caattttatc    78120
cctgcgaccc cagccttgag aatgcaaaaa actaccccca acttcagcct gaggtcatga    78180
aaccaaccag gagtgcaggc cgtctagggg aggtgcgagt gcccacctac tgggcagcca    78240
ctctgagggc aaagtccacg ggagacacag cttcagccac caccggggct gcgacctgtc    78300
ctcaggatcc tcctcagccc cctccaggag tcctcagctt tctgctttta gccccaaacc    78360
cagattcact ttcccaggcc attcaccgtc tgaggcagcc cagtccgctt tgtccttcct    78420
ccttcccgaa ggctctcagc ccctgggcag tatcagaatt tcactttgat ctccttttcc    78480
ctgggagcca gaatagctta gtctcttcaa aaggagagtt agaaagtgtg ccgttcatct    78540
aataaaaatt aactcctgag agttatccaa tcccaataca ggtcatttcg ctggaggcta    78600
ccccgactag gaaacacatt ttaggacatc agcagaggta aagatgagag caatttgctc    78660
aggcttttac ttggggttaa ggatcactag gccaccagga ccagggatgc cagacaacct    78720
caggtttctt tccaagcttt ctccaaacta ggcctcactt ttatcatttt cctacccctg    78780
ggctctatga ttttgtggtg ttgcttttgt gttttcaaaa acactgcatt cattcattag    78840
ctctgcactt tccctcatgc aatgcacaca gaactgtaaa gacaaatgat aaagcccttt    78900
cccgcttgga tcttgtgttg ttggccaggt tcattcaaaa ggccattgtt tgatggtgat    78960
taagtgtgtt tgttttgaat attcacctaa acaaaaatga tcaatttaca caattcttgg    79020
aattcatggg tgtcttggga aaacttgaag ccacaaaaaa tgttcaatac ataaatgcca    79080
aggacctcct gctgtcaatt aagaccctca tgatagtctt ttgcttattt gctcgttaat    79140
tcatgtaaaa gtggtttgtg agcaaattaa gcatcagttg gcatgccgga catggacaca    79200
tagatacagt ttgtggtctg gaggggaggt ggaaatgaga gtctcacagg ctgccctcgg    79260
cccagaactt ctgtgtggag gttttgcata aaaatcagaa tttctggatt cttataaaaa    79320
ccctaaagtt ctagccccat tagggccact gttccactca cagccctgag taagcctccc    79380
ccatcagccc aggcatggac cctttgtcct gcctctgttg tcactctccc gactgtctca    79440
gacctaacca gctcctcttc tgtttgtgac ttgcccttat gggagcctga gggctcctac    79500
ctactagatg aagctgatgg ggacattctc ccaaatgaga aagcgatgga aagttgtgac    79560
catcagagga agatcagaga tcaagccttg ttgatgtaaa aggaattaaa gttgagaaac    79620
catttcctgc aaccagaatt gtgaaagcat acaacgtagt accaaaggaa aattaccgaa    79680
gcctccttcc ctgaagaacc ttcaggaagg ggaggccagc cgtctgacgt gatcacagtg    79740
atgtcttgcc ctgaaacaag aagcattctt cccaggtcct ttccgccgga ggattcttat    79800
tctgtgatca atgctgagct atgtggatga gtgtttgcgt ggatttcttt taaaactata    79860
ttgctaaata atcttgcccc ctggccccat gcacgttctt tttttttttt ttttttgcac    79920
ccagataaga aaaagacttg aatgtatttt tttctataaa atgcagtcaa tattgttctg    79980
tgagggggaa agaagtagtg gaggatgaag atggaacagg ggatgaggtg gtgaccagca    80040
tgccctcatg gatagacact gagcagggag aggcagggat atgcatggag taagccctct    80100
ctctctctag gacaaagcaa attatgtctt catgccagtg gactctgcat attcattgaa    80160
aaaaataaga tttaattaat ttagggaagc aatatgggct gaccagacag ccaagttctt    80220
caagatagga cagtaaaaca ttttatgtga gagctggcca atgtctggat ggaagaggga    80280
gggccaggga gactggagag atattgaggg ggtgaggagg tttgaggaat ccacagtggg    80340
gtgagcttca tgaccagtgg aatgaaataa gggctattct ggatggacga ccaatgtcag    80400
tgcaaggccc tcaatctctt gggataacac tggagttgga atacatatga aaaaaaaaat    80460
ccacaagtat aaaagaagta agcagaggcc gggcatggtg actcacacct gtaatcccag    80520
cactttggga ggccaaggcg ggcagattgc ctgaggtcag gagttcgtga ccagtctggc    80580
caacatggtg aaaccccgtc tctactaaaa ttagccaggt atggtggcgt gcacctgtaa    80640
tcccagctac tcaggaggct gaagcaggag aattgcttga cccagggagg tcgaggttgc    80700
agtgagccga gatcgcacca ctgcactcta gcctgggcga cagagtgaga ctccatctca    80760
aaaaaagact ggaatagagt acatttgtca taggccaact gcctccatgc tcttgtctca    80820
cagagatgtt tataacaagc ttgagtagct acaactggat actttggtct atatatgctt    80880
tcctcgtgat tctttttttc ctccttctta gcttaaacaa atgcacacag agggaagtgg    80940
ataaactatt agcagagtaa gcacttgcca agaataccgg gggcaccaaa aacacataaa    81000
aacaggcttg gttgggagcc cgatgtgggc agatcacaag gtcaagagat cgagaccatc    81060
ttggccaaca tgatgaaacc ctgtctctag gaaaaataca aaaattagct gggtatggtg    81120
acgcacgcct gtagtcccag ctactcggaa ggttgaggca ggagaatcac tgaaacccag    81180
gagctgcagg ttgcagtgag ccgagattgt gccactgcac tccagcctgg cgacagagtg    81240
agactctgtc tcaaaaaaaa aaaaaaaaaa aaaaagcgag gggatcttgg ggaacctagg    81300
aagaagttac ttaaatttca gcacatgcta tatagttttc aggattagtc cctctctagg    81360
tattcatctg gggctggcgc ctccttggct ggcaggggct ggtgatcggg actccccagc    81420
gagacagatt gcacccagag cagtgaggcc ccgagcgctt cctggagcct ggggaagatg    81480
gcattcattt ttaaagtcca tttattgtgc agttgttgaa agtgggacac agaaatttgg    81540
actgatatgc ctaggccaca tgactactga ttgggccagg gtaaatgcag tctttttgtt    81600
gatggagaag gtcttttctg ggcccagcac aaagcaatgg atcttcagtc ttaagaaatg    81660
cattgaaaac catccttgtg cagtttgggg tccctggtag gccaagagct ggaaaggccc    81720
ttagactctg agtgctgtag ccccccttct aggtgatggt caaaacttga aaacggctct    81780
agactctgga cagaaatgca tgagaattga gtgttcaaag cttggtgctt tgacttcttt    81840
taactttctg tagactgaaa tatgaataag aggaaggcat gaggcccctc tcagtttatg    81900
gagccatagc tccaaacctc ccactttcca acccagcaac cctgtgtgtc ctaggaattg    81960
tagcgggtgt cccagaatgc aaaaatcact ctgctagaac tggaaaagga gacgcctgcc    82020
ttttctagca cgatctttag taaatagatt caggaaatgt gggtcctggt cagagctggt    82080
gccacaagct gagtgccttc aggcagcaga cttagcctct tcaagtccaa tctcatcagt    82140
agtatcaggg ggct                                                      82154
 
<210>6
<211>99791
<212>DNA
<213>Homo sapiens
 
<400>6
ttcagtgagt cgacaccgcg ccactgcact ccagcctggg tgacaaagca agactctatc     60
tcaaaaacaa acaaacaaac aaacaaaaaa aaaaacagag agagaattac taatattttc    120
ttctccaacc ttaatgctca ctccctgagc tatgtggatt atactagtga aagtactgcc    180
ttaacccact aatgtaaaca gattcctttt aagaagcctc cctatcgaga atggtctgta    240
agagacaacc atgtcaacaa gtaaagttcc ttctgccttc cctcctgggg tgggctaaga    300
tggacccttc tcaccattcc caattacctg caggaaggca gcaacagaat agagaaggag    360
ggtaacacag tttcctgtac tttaaatacc tccctgcctc cgcaagtaaa acttgagcca    420
tgccaatgag ggaaaaagtg gccgcgattt cccaggtggc ttagtaatac acagttttct    480
gacacactgc aactccattc tttcctaaaa gttccttcca agcctgtagg cactgtaaga    540
caaacagcta agcacttcct gagtgcctac tatttgccag gctgtatgca gcaccaggaa    600
cacaaaaata aaagctatgg ccattcagga acaagatttc aaaatgaaaa ataggaggaa    660
aatctaacat ggatggaaaa aagccacact tttccatgct tcaagtttag tttccatttc    720
taaaatgtct gtcctcatat gttagccaga aagccagttt ccagcaagac aagcagaaat    780
aaatattatg caagtcaaac ctacaagaat gggtcttcaa gaaagggaaa taattttcgg    840
tcaaaatcta aaaatccata ttcaacaaaa aaagcacaga ttgagaaact aattcaatag    900
caaaaaagga aaattaccat tgatccaggt tgccattttt aataaaaagc agtaaggtct    960
taaagaaaat attagcattg aagttcaacc aaataaatta ctttgtcatc aaaatgaaga   1020
atgccagaaa gttctctgaa atacaatttt taacaaaact gagaaagcag aggaagtatt   1080
ttttaatatt acaaattttt gacaccaaca taagaattcc atgatatcct aaagagcaat   1140
gaacccaggt aatgcagttt ctagaaattt taaaacacta ccaaataata ttgcttcttg    1200
cattaagtat agcattggtt tgctagaata atcctaacaa tgacaatgca atgtacttta    1260
aattggggtc aaaaaacttt tttcttaaag taccagatag tcaagctttt aagctctatg    1320
ggtcatccac agacacactg caactataca aactatatca cccctgttgc aactacacga    1380
aaagcaggaa agcaaccaca gaagacagac aatacataaa caaatgagta tgactgtgtt    1440
ccaataacat tttattaata aaaacaggca actggcccat gggtggtaat ttgctgaaac    1500
ttggtttaaa ttattattag tatctacctt tttttaaaag atgatgtttt ttagggtctt    1560
tccatcatga aaattatgtt tttatgaaag tgatttggga agtattaaaa tacagaataa    1620
agagcaagcc ttgggctatg aagtcaaata ggactgggtt ccaggactgc tgtgtgactt    1680
tgggaaactg acctgccatc tctaggtgtt agtttcctca cttgtaaaat taagatgctg    1740
acagccctca cctcataggg tcactcactg caaggaccac acaagtgaac atgcatacag    1800
cacttagcat agttatggat aaccctgtac ctaccttatt atagcaattg ctatcaactt    1860
tcttctagct tatcattaat gatactataa aaacacccag cataacgcca gcataaggat    1920
gtgaatgaat gagcaaatga aaggagggag ggcaatggca aaattttacc ttggtttcca    1980
agctaaagta taacctgagt tttttaatgc tttacaaaaa ggaaaggcaa tcagaaccat    2040
aattaatatt taagctgtac tgacaggttt tccagggaaa attctataga acttgttatt    2100
ctccaacttc caaaaataag caataaattt tttttaaaga gctgttattt taagacttta    2160
tttgaaccaa agaatgtgtt tatggtaaca acatacatgt tgtaaattaa tcagtttcaa    2220
tgttataaaa taatacttcc aagaataaat gtatcatata atctatgtac ctcatgtcga    2280
taatttaaat aaatacatta aataaataca tcattccgaa gtccgcttta tcattgtttg    2340
taaaatccaa ttgtcatact ctggtatttg ttctccaaaa gaatcatcac tttcatattc    2400
actacagcat gagatgagat atttaataaa taataggaca tcataatcca gggattaagt    2460
agtttctttt agcaaaattt aatatgaggg tagcatatgc cagccgttcc tagttgagca    2520
acaatttctg tgttgggaga ggataacaaa gccaagtatt ttcccataag aagttcacac    2580
tctaaaaggc caggcgcggt ggctcacacc tataatccca gcactttggg tggctgaggc    2640
aggcggatca ctaggtcagg agatcgagac catcctggct aagacggtga aaccccgtct    2700
ctactaaaaa tacaaaaaaa ttagccaggc gtggtggtgg gcacctgtcg ttccagctac    2760
tcaggaggct gaggcaggag aatggcgtga acccaggagg cggagcttgc agtgagccga    2820
gatcgtgtca ctgcactcca gcctaggtga tagagcgaga ctccgtctca aaaaaaaaaa    2880
aaaaaaagaa gttcacactc taaaatgaag agaaatgaga aatgtctatg tgcacacaac    2940
ttcccacata cacacattag ttagagacca cagtcatgcc caccctccag ctcacgtgac    3000
atttcaaagc agagatgaga cttaaaggat ggaagaaatg gcgtttgttt catggatggg    3060
gtaacggagg cttttagggg cttatgggat ggacaagtaa aggatcaatg agacagaaag    3120
gcaaggcaag gcaaggcaag ggactcgatc tcaggaagtg gtgagtggag atgaaagaag    3180
tccaatggaa tggcagtcac tggagatata tttaaagaag agggtctttt tgtttgtttg    3240
tttgtttgtt tgtttgagat agagtcttgc tctgttgccc aggctggagt gcagtggcat    3300
gatcttggct cactgcaacc tctgcctccc gggttcaagc gattctcctg cctcagccac    3360
ccaagtagct gggatttcag gcccgcgcca ccacgcccgg ctaatttttg tatttttagt    3420
agagacgggt ttcaccatgt tggccaggct ggtcttgaac tcctgacctc aaatgctctg    3480
ctcatcttgg ccccacaaag tgctgggatt acaggcgtga accaccgcac ccggccaaga    3540
agagggtctt ttaaagaagc aagataggaa gatccgttaa agagagaact gcataggaag    3600
gaaaaggcct ggctaggatt ccctgaacct tctcatttca ctactctctt gttagtcatc    3660
aatgcagtta agaatcaacg caatcaaatc gaatcacata gtgattaatt tgtgccacca    3720
atagctctaa ttttgttaac ttctcattcc aataaaaata atcatctggt taatccattt    3780
cttcagcggg attacttgtt tgcttgtttc tttagctata ataaactctg aatgccagag    3840
tcaccaaact aagcattaaa caaactgatt gacaattcgg aagcatagga ataattacag    3900
atgatgctag gcaatatcac tagattgggt tttcatgaag ctcgtgactg gattttgcca    3960
caaaaatcac taactgcttt ggcttccaga gaatggcctc atggataagc cccaagttcc    4020
aaaaactaca aaatgtcaaa atcacattca actaattaat aattttatgt cacaataaga    4080
attaggaatc tctagaaggc tgggtacagt agctcatgtc tgtgatccca gcactttggg    4140
agatcgaggc aggcagatca cttaagccca gcagttcaag accagcctgg gcaacatagg    4200
gagaccccgt cctacaaaaa atataaaaat cagctgggca tggtggcaca tgcctgtagt    4260
cccagctacc caggaggctg aggtgggagg attgattgag cccaagagat ggcggctgta    4320
gtgagccatg atcacaccac tgcactccag cctgggtgac agagcaagac cctgtctcaa    4380
aaaaagaaaa gaatttctcg gaaagtctta atttttatct aaacctatct gaaaattcaa    4440
tgatgaattt tatgaactta gccctgaact gacattcctg gtgaaaactg caatcattgt    4500
aggacaagag ccgtcgtgtt aaatgctaag gctattttat acacatccaa tattttggga    4560
gcactgcaat taaaagtctt ctcacactaa aaccaatgca caaagcacct ctcaggttta    4620
agcctcacta ggctgatgcc tgaaacacag caaaatgctc atactcttta tacacatgtc    4680
caaaggtcta gctatcaaaa gacagataaa aaggagcatt ttcccccaac tgatggaagc    4740
aagtccaagg tgaagaaaga ggatagaacg agaaggtaaa ccatctctca aaggtgagaa    4800
atcaacacag agtcaaccaa tgtcttcatc tcaacccaac ccaccaagca atgtatcaga    4860
ttggattgga gacagattgg agactctatg aaagaactgg catgcacaac ccaagaacct    4920
cctggattct tggcccttct tttaaagaag gggggtttct agacaggaat agaacccaca    4980
gagtcatgga agccagcccc ctaccataaa ttgttcataa ccacaagctt attggtcagg    5040
tttataaagt gattcagact ctttagaggc tacaggaagg gtgcagataa gaggacactt    5100
atgctggggt ggggaattat tggagaggcc tccaacaatg agatatcacc tataattaca    5160
ttaaagattt aaaaacatga ttgaatcaca tgttaacaat ctcctaatta gagctctgac    5220
tctccttaga atgtccaaca tccactgcat ctaagaagca ctagtattta ttatgtagta    5280
ttgtttgtgt caaattccca aaaaaggtta tcttgaaggt taatggattt aagtagctgg    5340
aaaccctgat tagagttgcc catagaaatc tgaattctgc tcaaacagtt caaagctgac    5400
aacaaaacag tgatggactc tgaaagtgaa gagacccata gagttcacat gtaatgttaa    5460
aatgttcggc acttcacttc tcaactgggg tacatgtaca cctaagacct acatcttaga    5520
agtttccaga gttacagaat gaactggatc gtgtctcaga ttaacaattg attcaaagaa    5580
tggggataga aagggagcca tgacaaaata aaggaggggg ctgttttgta tcacagcaaa    5640
caaggagatc ctgtgtaaaa gaaattatca aaattgttaa tgccagaggg tagtggctca    5700
tgcctgtaat cccaccattt tggtaggcca aggcagaatt gcttgaggtc agaagtccaa    5760
gacaggactg agaaacacag tgagagtgag accccatctc cacacacaca aaaacatctt    5820
tgcattaaaa aatgaaacta gaggctttaa agaactgctg caggctacgt gacttaaaga    5880
atataagttc tctgccttct ttgtcatcag gagtgcttct gtgattacgt ataggaaggc    5940
aaaccttaaa ggaggtaact gaaatcttta cttcaacata ctcaattgta tgcacacagc    6000
ttggtaagca aaataagtca caaataagca atattgcttc aaaaaccttt tttaaaaaaa    6060
gatacataat caattatttt catattaata gagcaaagga ataccatgaa taatccaaga    6120
taccaggtaa tccagaagtc agatactgag aagtgaaata catcagataa tttttacagt    6180
gtgtctatga tcttaattac attttactaa gcctaatact agtttttctt tcttttttag    6240
aatttctaga ttacattatt tgaaagtaaa taatggcttc aaatcatgtt aggcaacaga    6300
attcccagga aggagtgaag gtaaatcaga tgactgaact atattacaat ttaagctgtg    6360
atgtttgcac aactataaca atattataaa tgagcttgag gtttcttact gaagatgttt    6420
aatatttgat ccaaaatatc gagcagtttt gactaagcac tgtaagcaaa gaaatacgct    6480
atcatagcag gacacctgta agtttccatt gtataagaaa atgtttcctt tgtttaattg    6540
gagagtcaat taaacataca aatatctgaa gacattatta tgaaggctga tttggaggaa    6600
atgtataatg cagatacatt ctgggtgtaa gtattaaatt catacaacca ttctggaaaa    6660
taattcaacg ttgccaagtc aagagcattc cctaaaaccc atgagttcct ctcccaagta    6720
aagacatgag aacaattctt gcacatgtgc aacagcgtgc atacacaagg gtgtttgcag    6780
gacccgccca tgatagcaaa gcactggtaa aaaatcaaat gtccagaggg agtatactca    6840
gaccatggaa tactgtacag tggcaaacca aaagaaagac acctgcatcc acttagaaga    6900
atattacaaa actaatattg aagcggggaa aagcaagtca gaaaataaaa tatataacat    6960
cattccactt ataaagaaac caggaatatg tacaactaag caatatatta ttaggggata    7020
aagagatgta tggtaaaatt ttatataaag aaaaaacaag ggaataataa atgtaaaatt    7080
caggaaagtg actatctctg ggggcaggaa gggagggagt tgcaactgag aagcgcacag    7140
agagaacttc aaaattattg ataactttca acaaagttgg atgttagaca aataggtgat    7200
cattttatta ctattattta aacatgctca taatttaaat tcacatgtat agctatatat    7260
tatgtattat agatataaaa caattcagag gtataaaatg caataaaaaa gtgtacaagc    7320
ccaaatctct agcatactgc caatcaaaag atgattgtta ttcataaagt atctcaaaaa    7380
ggaacattag actatttcca gaaatcctgg ttgctttatt attcatttat tatttattac    7440
cccaggaaga taaattttag gaagtttcta ctttgagtgt ctttcttcta agttgcaaat    7500
acaaataaat gcttatttgg aattataact atactggaag ctcatgtttc aaataaagct    7560
atttatatat agcttcatca ttgtttgaat gcttatcatt gcagcctcat tacaaagaac    7620
atctaaaaga tttttttcca acctaagaaa aaacagtgct ataataaggt atcttacatt    7680
catgggtaaa aatactcctt ttagagaaca taatataatt agtttctatt ccaagtctgt    7740
cagtgtgcac tgttaacctc tgacaattat gcatgaacct tttaattagc atgttatctt    7800
tggtgcaatt aataacttgt acttcatgtt ataggcaaat taaagttttc ccactaaaac    7860
caaattcttc agcatagttc taaaagtgtt ttgccattta aatgaaattt taacattcag    7920
acctcttgct cccaaaacac ataagccatt ttttccaaag ctagacagct tttctctatc    7980
cacgttcttt caaatatttt acctaagaca gagaatctca tattaaattc aatttcacac    8040
ttgccaatca cacacgccca ctcacaattc ctccagatga tgcaatgtgg cctaatgtgt    8100
atgcttatgt atgtacatgt gcacacacaa acaggcataa tgtttaaata catataaaca    8160
cattcattgc taggtattgg ttaaaacaaa caggcttaca gcataccaac ttattaaaca    8220
taatgattga tattagtagt ttcattaatg taattaacct ttagatttga attatcaagt    8280
tcaaagtcta agaccgagag cagtggttct caggccggta caataatggc aagtcatggt    8340
attcaagaga tgagtctaaa aggcccctca gtcctgcccc taccagaaac cagagatatt    8400
tgctgctggt aataatgagg agggggtttc taagtacaag atcagctcta ttctttcatt    8460
ccctggaaat ctgccctcgc ctctgatacc tcaaaaaata tctgttgcat ttccaaggga    8520
aagaacaatg atataagcct tgctgttaaa aaaaaaaaaa aaaatgccac tacttacaag    8580
ataaaaggca aggtgttttg tttttttccc ctttctctta gactaggcat gaataatctc    8640
aaaatatttg tttgtcaata aagtgattaa aataaagtga tagacaagac ataatgatta    8700
gagaaatgaa tcaaagtaat atttgggacc agggtcttac aaatctagag taagtatgtt    8760
gagcagaaat agatactaaa aatttacatt agaacaaaat aaaaatggat ttagtaatgc    8820
tggatttaaa ttggaaatag ctgtttaaac tcatgacctt aaagaaaatt tgtcttggcc    8880
aactgcggtg gctcacgcct gtaatcccag cactttggga ggccaaggca ggcagatcac    8940
ttgaggtcag aagtttgaga ccagcctggc caacatggtg aaatcccatc tctactaaaa    9000
atacaaaaat tagctgggca tggtggtaca tgcctgcagt cccagctgct tggggcgctg    9060
aggcaggaga accgcttgaa cctgggaggt ggaggttgca gtgagccgag atgggaccac    9120
tgcactccag cctgggaaac agacagagaa ggaccctgtc tcaaaaaaaa aaaaaaaaaa    9180
aaagaagaag aagaagaaga aaaagaaaat ttgtcttctg gctctctccc taaaatgaac    9240
taactgggga atcatttcta ccttccagaa gcatttgaat ggaacagctt gatatcatgc    9300
agagcaccta aattttggat gccactatgc tctatcaaag gaatcagagc tcctcagaga    9360
atagctgact ccatgtattg ggtcatgaga aaatcaagat ccactggaac ttgtggttcc    9420
cagaaaacaa cagtgctttc aagaatgcct gggggtaatg ctaaggggac caaagaggac    9480
atttaaaggg actcccgcag gtcatgctgt gaccatctga gcatcgacat gacaatatga    9540
attttaatta attagaacaa gtgcatccca taaaagctga gagtccagga tactcaaaga    9600
gaaacagtaa ggctggctgg gcacggtgac tcatgcctgt aatcccagca ctttgggagg    9660
ccgagaaggg tggatcacga ggtcaggagt tagagaccag cctggccaac atggtgaaac    9720
cctgtctcta ctaaaaatac aaaaattagc tggctgtggt ggcaagcgcc tgtaatccca    9780
gctactcggg aggctgaggc aggaaaattg cttaaacctg ggaggcggag gttgcagtgg    9840
gccaagattg tgccattgca ctccagctct ggacaacaga gcaagactcc atctcggggc    9900
aggagaagaa aaggtaaggc ctactgaaaa cacatttgta tcataatacc aaagaagagt    9960
gactataaga tgtcctaaaa atagatggtg aagtatttaa agattaggat actctctttc   10020
tcctgtgaag tatgtgcttc tttatgagga aagaatcagc atttttcttt ttgtgtgttt   10080
gtaggacaga atgaatgcag agaattctaa cccaaatagt tccagaaaag taggaatata   10140
ccatgaaaga tggcagcaat agtttgaaga gtgagtcaga aaacaagtag tttgagaacc   10200
gttagcctat attctaatga cttgaaagtt tagtgcatgg agaaaaaata tttaatgtaa   10260
agtcatgttt gcctttataa tttcaaagaa tacttaaagc agtatgggaa atgcctaaat   10320
ggacacattc agaactcctg agggaacgag cagaacacag agggcaagag aacttggaat   10380
cagaaattcc acgttcaagc accacgttgc ctattcctca actttaagaa tgatcaatcc    10440
tgccatatct gcctcccagg gtaagtctga ggaactctcc ctgtggttta tgtttgttca    10500
actgtatttg caggtccatc tttaagatag tttgcccatg aagatagcaa ggtacttttt    10560
atgaccctat ctcaaaatca ggacatattc tggtaaagac acataaatat tggctcaaat    10620
ggattttgtt ttacctgaat caaagggatt ttgttttacc tgaatcaaag ggatgaaaat    10680
ttgccccaga aatagttgac caagtaccag gaggtttcaa aggaaaaact aggaagctga    10740
cagattgaat gttcaaaatg attccaaccc aaaatgctct attacccaga acttgactcc    10800
agagataatc caaccaacat gaacctctgt tttctattta ctcagagcat agttgctgct    10860
caatacatcc attcatgcaa caagtgccat attcatgatc ccatgccagg cacgttctat    10920
gtgcttaaga tgcagttagt gacaaaagag gccaaagtcc atgcccttgg tgactgggga    10980
caggcaaagg tggatggcaa taaataagaa tattagatga aggaagtaaa ataagactat    11040
gtcacttaaa atgacttggt gggtagcata cttttgaaag gcttctcaga agaggtgaca    11100
tttttgagct gagacacaaa tgacaaggag ctggcattac aaagagctgg ggaaagaatt    11160
ccttgcagaa gaaagaatca atggaaaagc tctgagttag gaatgtggct ggcatgttat    11220
taaaaaaaaa gaagaagaag aaaagaaggc ttaaacaaag tgaatgccaa gaagtgttaa    11280
gatgtgagct tgcaggggaa ggaaagagct agagaacacg gtgtgagtaa cgtaagcgaa    11340
aacaataaat aatacctttc ttcacatcca aaagctgatc agatttcttt ttccaatgcc    11400
aaaatacatg taagtacata atgtcacgtt gcataccact gcggtggaac acaaggaaag    11460
aagagctata atgcaaacaa acagcaactg actctttggg gagcttaaga aaaaagaagt    11520
ccaggcacca acacaaaagg ctgaataaat cacaacctta ctcaaagaac aatattaagg    11580
gcataggctg tagaaaaggc aactggttca atgcttctca tgccctctga gagctatcac    11640
aattaatggc atcatcttcc aaacaacagg taatacaatg ttacttctgt gttatagaaa    11700
catttgggtt ataactggag atgtatggta tattcatcac aaagatgata atcatttcct    11760
ctttgtgtat tcaatggaca gaaatctcta agactaggcc tctgcttccc aaatattcat    11820
gcaactggaa ctgttacaag ggtaaaggca tgaattaaaa ttatagaaat ctagatgaga    11880
tggaaattga aaatacacta aaacctaaag tctcctatag ttaacatggg ataatatatg    11940
catagttcct aacagcgtac ctacaatcct ataagggctg agtaaatgtt agtttgcttt    12000
ccaaagtaaa agtgacctga tttttctgtg ttgctccccc ttgagatcta aagctaaacc    12060
tctactgaat aaaagcagag tgacttacaa ttgagatagg ccaatctaaa actgaaaagt    12120
ctaaaatgtc aaacttttaa aataagggga tgttcactgc ttatttgact cattaaaaat    12180
aaaaatacct agtgattgtg aatttaaaac tgtagactta tgatttgtgc attttatata    12240
tgttattctt caattagaag ttcaagaaat aataatggga ggcctgtatt aaaccattta    12300
tataaaagtt tctcaaccat aatggaaaga tcaagatgtc tagcataatt tgaaagtatg    12360
tttctatttg acagaaacct tggcttggaa aagttaaact ctaaatattt gtacagaaag    12420
aagtattctg ggtttcattc attaaaagtc attgaccact gcagaaaagg gagagcaaga    12480
gatttacata tatttttctt gacgttttat atgcattagg cctggcaatg aacttgaggt    12540
aggtattact atctccttat ttctaaggga atcagaatac tgtaaacaaa gacatggagc    12600
taaataatgg agtcaaatcc tggcttacta ggctccacat ccatgttgct ccacttatca    12660
gacggccacc caaacataca agtttaacaa attccaaatt attggggcct aaatagacac    12720
ttttttgttt caatattgcc cttcttccct tgtattctga atatcatgtc aaccatgaat    12780
cataagccaa tgcttacaaa tttaacttca cattatgagt tttgagccca actgatgcct    12840
aaccactaaa ccattcatat aacacactga aaagaagcca tttaagaaat gagaaaaata    12900
ggtattgttt tctctgtatg gctgtaaaag ctgagataag aacattttgg caagttcaat    12960
agagccgaaa ggcttgtgaa ggctatggga ggatgagtat attggaagaa gatcagtagg    13020
tcaagaatct aagaagagct atttatgtgg gagacaggaa ttaccttgaa ggaagagcag    13080
agccccagaa gaagaaaaac agaatataac agctaactat aaaaggaccc agggccaggt    13140
gcggtggctt aggcctgtaa tcccagcact ttgggaggcc aaggcgggtg gatcacgaga    13200
tcaggagatc aagaccatcc tggttaacat ggtgaaacct cgtctctacc accaatataa    13260
aaaatcagcc gggcatggtg gcaggcacct gtagtcccag ctacttggga ggttgaggca    13320
ggagaatggc atgaacccgg gaggtggagg ttgcagtgag ccaagatgac agccactgca    13380
ctccatcctg gaccacagag cgagactcca tctcaaaaaa aaaaaaaaaa aaaaaaaaaa    13440
aggacccaag agaatataag tcccatgaaa acagagctcg agtctgtctt gttttgtcac    13500
attacctatt tgatactcaa tatgtaattt aatttctgag tgaataaatt aagcaaatga    13560
ataacttaaa agtatagcta tgaatgttaa aaaaaaaaaa agaaaaagaa aaagaaagaa    13620
aaaagaaaaa attaagtggg gagaggcatg cctatggcct tgtccttggt cctgaataac    13680
tgtttggcca gatagtatgg tttcctaacc ctagctcatg gtgttcaaat tctactagtt    13740
tttctttgtt tgaactttcc atctccatga aactaaaaag tataattttt aagctgcaga    13800
acaaatcatt ccatgtctta ttttctgagg ttacatagct ggctgcatgt actttcaaca    13860
attctatcat gctttgacac ttagaaatat tttccctacc agctttggga agctgggcgg    13920
tttgtgttta ccatcctctc ctgatgttac gctttagttt aaaaataaca gtcattatca    13980
ctcaattatt cagtgatcaa gtgtaacacc aggtgcaaac aaaagttctg agaacactgg    14040
aacatgctct tgttactgca aacgatttaa gagctttgaa tttatgaagc cagtgatcat    14100
gttactctaa attagaagca ggtaaaacag aagaatggca taagctaaat tccttctttt    14160
cgtttcttta cttccttttt ccttttaagg atatctatag caaactatat tagctttcta    14220
ttttctccac tatttgcact agcattaatc aacatccaaa aagtgtacaa attattttat    14280
ctttataatc aatcttctga aatgctaact tgaaaatata aacagcacaa ttactttttt    14340
ctcttttctt tcccatttga aatgtgtgct tgtgtgtgtg tgtgtgtgtg tatctgaatc    14400
tgtacatata aatcaaatac acacacatat acttgtttta aaaaaatcct caaagaatca    14460
atcacatatt acagaactga aggaatattg gagttcatct ggtccaaagt gttggtattg    14520
taaaatcact ttcaaatttc acagttatcc aaatggtaat gaatattaat acctaagaaa    14580
atcaatcaaa gattaacatt aagacattag attttaaaaa tcattgcatt taatattttt    14640
tatccatttt caaatttcag aaactaggtc tatattgtcc tatagatcta acaagcacta    14700
taaaagaaaa attacaaaga tttcccaata tacagataga cacataaatg aaaactttta    14760
attgcaagag aaagggaact ggattcatca gttacatgca tttagaaaaa tctgtctcat    14820
tcatcagcag caatgaagga gaaaagttgg caacagagcc aagtatactt actttctaag    14880
tagccaataa ttggaggcat ttaaaaatct ttttcactaa aatatacatt ttttgctcaa    14940
actccagatt tctgacattt ccttattcta ctgataatga cttcatgtga gcaaaatgga    15000
atgaaagatt gaaaaaaatc agatatatgc tacccataaa ggtttatcaa tatgatatat    15060
ctaaacattt atgtacttat tggtttaact tagttgatat aaatgaatat gcatatcata    15120
cacatcatgt gaacagaaga gcagatcagt ggctgggggt aggggattaa ctgcaaaggg    15180
gtacaaggaa acttgtggtg atggaaatgt tctatattta ttatgtggtg gttgttcaca    15240
actgtacatg tttgtcaaaa cttaccaata gcacatttaa aattggcaga ttttattgta    15300
tgtaacatat ctgactcccc gaccaaaaaa accaaaactc tgttatacca tgacacctaa    15360
aaataattcc tacagagact tacctagaac atcatggaca ctcaaatatt aaccatgacc    15420
caagaaaaca ctataaagta tgcataaaca gtgattctcc tataaaatct acacacatac    15480
acaatatgtt aagaaatgag tacaaaaatt aggggagcta ccataataca tggcagaaac    15540
agatttcctg ccccctgcca taactatcat ttaccaacat tcaatcgaat ttaagaattg    15600
ggggaatttc agagagtatc ctaattcact tcctaattca cttcctctag ataccaccac    15660
tcaaagattc ccgtggttcc cagagccttc acttgacatt catacaactt tgaccaggaa    15720
agaagggtgc gccacctcca cctgtgcctc tgcctctata ctagaaagga ttaggcagag    15780
aaagagattc aaatactgga aggaaaagaa ggtattggga agccaggatg gtttgttggg    15840
gcaaagtatt ctcttgtcat acagatggct ctcttcttgg tggtgcccca gcccaccctc    15900
aagggtgtct ataagtagga gaagagaaaa gcactaatga tgattataac ataattaaat    15960
aatttatgaa ggataaaata tcagagtcat gagagctctg aaagaatagg tagactacat    16020
gcatcttacc tacacattga gtattaaaaa tcctagctgc cctctgcagt gatgccccac    16080
ccagaagacc aatccattgg aactattgca atctgatcag attaaacaca ccaaggtcac    16140
tctgaaagta tggaggaaaa caccaaatta agaacaaaat aatactttta aaatataaac    16200
cagtttaaaa gtatcaaaaa cgtttctatt tagtccatct ctgatctctc tcccaaacct    16260
ctgaccgaaa gagacacaga tttttgcttc taaaaacaaa gtatatttta ccaacaggat    16320
aatataagtg ctttcaattt tatctaataa aaagtagggc aaagtgaaaa acaggtgcct    16380
ctacagatgg agtatactaa atacatgtaa cacttctgat aatgttgaac caccccctcc    16440
ccttttggaa tttgaaacat cccgcataag atctgcattt ttcaaatatt gctaaatatt    16500
tagagtctaa aaagatgaga ttcattattt tgcacagtaa cacatctcct aataatattt    16560
caggccagtt ttgaagaact gaaattgata tcttttccgt atatacttaa cctcctacag    16620
atttatttga ttctcaataa ttactattct ctggtaaaag gcatatgtta ttacagtaca    16680
ctgcactccc acaagctgcc cattcagtgt attttaataa atctctgcca gagctgtata    16740
aatttgatcc tgtttaaatt taataaggat cagaatatat caaagcacaa atacccatgg    16800
gagaaataga tattttgcat agttattgaa tggcctattc agggatacaa tatgtaagac    16860
ccagaccatc aaccttgaat taaaaagaga gattaatgcg ttcaaagccg gctacttgtt    16920
aaataacata tgaaattagt atttaataaa acgtcttctc tatattgttg ctaatggtat    16980
ccatcctagt acagctttaa tatcaatatt ctcatacaga attctaatat ttacaagaat    17040
tgtcagcaat gtatttctta aatatctaca ttatcttgat aaaatgcaac actgtatgga    17100
acagagatga agaatacctc atagtaattt ggaattgttg agtttaatgt tcatttgagt    17160
aatataaata aaaagaacaa ccactttgct ggatatagtt ttcacagatt acaagcctga    17220
tgatcaatga actgctttcc cattctcttc tgtagctgga tatgtttctg atttgaatcg    17280
tatttcaata atcattaata tcctgtggtt gagcaaatca tttcaatttt ttccaaccaa    17340
aatctacact tgagtgtaaa caccaatggc aatgattaat gagcctggat ttagaggctg    17400
ttagaagata caggtagcaa aatgtcaggt atcaggaaat ccttcctcat agtaaggacg    17460
actcacaaga caactattgc caggaagatc aaagggaaat ggtatcatgc gaggcatgta    17520
gaaccaacct gttctagcgc taaatgcacc agacagatgg atgggctaat ccgtcttcag    17580
ttatctacaa atactgcggg ggccacaaat tgtttaaagc cactgaaact gacattcact    17640
catgcatgtt atatttgaat ctacacctca ttattcccaa ccactttcat cttattctta    17700
aactagaaat gtaagggtta gtgcattcat cagacaaact gataaaagac actatctggt    17760
tagcctgtcc agatccatta gaaacctcac cagaagatta ggtcttactt tcagataggt    17820
agttatcagg taatgaagtc tctcctcaat gcgcctggct cccgagcgag gttggcactt    17880
catcctccac tacatcttct atgagtatct aaatcctctc taccctcttc tgactcttct    17940
gtcctctgct ggatggggtt cagtgagaga aatgcatcct agctgagcag acgaaaaaaa    18000
aaacaacatg gttgggcaat cagctatttg tcacactgag aagacatcac ttcttaccaa    18060
gcaagaagta gtagaatggg ctgggcgcag tcgctcacac ctgtaatccc agcactttgg    18120
gaggccaaca cagcaggagc tcttgggcct gggagttcaa gaccaacttg ggcaatgtat    18180
tgagagctta tctctacaaa aaaaaaatta aaaaattaga tgagcagggt ggcacgcatc    18240
cacagtccca gctactcaag aggttgaggt gggaggattg cttgagcctg ggaggtcaag    18300
gctgcggtga gcacagtgag cactggtcac accactgcac tccagcctgc gtgacagagc    18360
aagactctgt ctcaaaaaca aaaaaaaaaa aaaaagaaga agaagaagga gaagaaatag    18420
tagtagatga gctacaaata caatgcccca atggctgaag gaaactgaag tatggatgca    18480
gatatgacat gtcccatata tctaatttta tgaaatatgg gtatataaaa tccaaacata    18540
aaaatcagat ccataagact aatgagtgta gttaaaattt cctgaaatag tatttctaaa    18600
tatatttaaa aactagcatt ggttgaacac cttcagtttt ccaataaaat tgtgtaattt    18660
attatgctat aatttttctt taaaactttt attttaaaag cccaggcttg gcagcctggc    18720
caagactagc accttatctt acacaaaata cagtgctctg cctcttaaca aatatagatg    18780
taaccactgc cagctgttta caacaagcaa aagctgggaa gccctattag gtgttatgtt    18840
tgttctgctc gtgttaatag actcatgttc aatgtcagct cttcttccta gatcagtgtc    18900
tgccaaattt cagttatttg tatatcactt tcatgcattt tgccatttaa agcaggtcca    18960
cactcttcct tatccaaaac cttagggcca gatgtatttt acagttgaaa gttttcaaga    19020
ttaggaaagt aatatggtgc atattccctt attacataat acctctagtg gtctgaggca    19080
gcaccccata gtcaaacatg tggacatttt tgtagcaaaa tgtctgaata ttcacataaa    19140
gataaataca ggaaaaaaaa gtttcatgtg aattcaggtc aagttttgat gcaaatgtgt    19200
aaccctaaac atttttttta atttgttttt cagagcattt agaatttgga attatggcta    19260
aggtatagta ttgtgagcct ttatttttct ttaattcatg catttgcata aaaattaata    19320
tgcttttttg ttaacaaaag gacactttat ttcatacatg gaaaactggt attcctttct    19380
ataaatagca cataactatc aaaataaata caataaatac aaaataatct atttaattct    19440
agcaaaccaa agctacagaa gggttgtaac tgggtcctgt atgatctcct ccgtctctcc    19500
ctctctctct cttcccctat aatgtgtctc aatctctctg ctaaaaaaga gattagcaag    19560
tattaggtgt taaagacata ttcgcaccaa actgagattt tctcactgat gtaataagaa    19620
agcctgaaag gaaaatggaa atgctttcta tgtaattcaa tatggtttaa aaacatatcc    19680
ttgtagctaa aaatcaagct acagcctacc aatggtagaa gcccagtacc acctgcctag    19740
cttccatcta tcctatgcca accagcacac catgtttgct catgtccctg gccagttcta    19800
ccttctctgc cagatatttg gaaacataca agggttgtag tattcagctg gaaaaaaaaa    19860
aagttcagtg gtataagacc acaggggtcc aggaagtgct tcattttaca taaagcccat    19920
tttactttat gccccttaaa tatgttttgc ctttgtgcat ggccatctgt gccgatgaca    19980
ctgttaccac tagagtacct aaatatgagt gcagtgatca actgtgcgta cacagcttca    20040
gtggatgcaa gtatgatctc tccgatgatc ctgggtccct tcagaggcct ttggatggtt    20100
ctgagcagta gaactcaaac tgtgatccca ggaaggcagc atcagcatca cctagcaact    20160
tgttagaaat gcaaattctt gggccctacc ccagacctac tgaatcagaa actctgggtg    20220
tggagcggca acatggattc taacaaggcg ttcaggtgac tctcatgctc agtgaagttt    20280
gaaaagcctg tgggtaacga gcacagtctc tggaacctgc ctgttgattt gaaggaatcc    20340
cagatcaatc acctcctcac ctgagacttt gaacaagtta tttaatttca gccatgcttc    20400
catttccgtt tctgttaact gggacattaa tagtacttac cttatagagt cgtggaggat    20460
taaatttatt aatacagata gagtacttag aatagttcct gaaaatactg cacaaatatc    20520
aatagtattc catgtaagct acataaaacc tttacttaca gctaaataat agtattttct    20580
ccaaataata aagacaatta ataactacaa gcttcatttg atgctcagaa tgaggttcat    20640
aggctttgtc tcctaataaa gtggaagtgt ggaacttcag cagagacagc caaatgtcag    20700
gccacaggcc agatgcagac tttagacagt ttccaaatag tgctaacatt taaaaatgtt    20760
aaaatatcac agaaatcaaa atttctggtt ccccttgaaa aatcaggacc tcagacaaca    20820
ctactctagg attccctaga gctactggca ggcagagtgg aggagcaacc acctcctttg    20880
aagaagtctc gtctcttgca gtctcacaca aatgggcagt tcagttgcag tcatgtacca    20940
tcttcctcac acctatgaca caggggtttg tgagccctgt ccttctgcaa actctaaggc    21000
ctctaagtgt gtcctctgtg tgcaggacag ggtgacagct gtcccactgg gaaagcaagg    21060
gagttcccaa gacactggtc tttcatgcaa caacagggag agtcccagga aacctgggaa    21120
aaaatggtca ccctatctgt gcagatggtt cccaagtcta caatccaagt gtctctccta    21180
tctggtccct gtttccaagt accatgagaa gcattttttt gtttgtttgt tttttgtttt    21240
ttgcgaatcc cacttttgcc tcaaaacaca ctttccttca cgtttatcat gtgctattca    21300
agcacttcat ggatgaaggc ctcctctata gcaggcacag tcctggacac tggagatgaa    21360
gcaacgaaca aaagagacag aaatctctgc cttcgccagg ttatgttcta gcatggagga    21420
gagagacaat gaataaataa ggcagaggga atgttgaatg gtagtaagtg cctggagaaa    21480
acggaagcaa ggcaggagga cggagagtat cagggaaagc aatgaggtgc ccatcaaagt    21540
cctccctgag aaaagggaca tctgaggaaa gacttgaaga gaatgaacaa ttgagccatg    21600
caaatatctg atgcaacggt atttggggca gaggaaaaca ggacctgggc cttgaggtgg    21660
gcgtgtgcca ggggtttcca agtgatcaag aagagcgggg tatgtggtgg gagggaagtc    21720
agacaggcct tgatgaggtc aaggaaataa tgtccaccac tgagttaaga ccaggctttc    21780
ctctgaatga atcagggagc cattggagag ctccaagcag aggagtcaca gggacctagc    21840
ttacttattt ttctcaaata gccatcgaca tctagttgtt ttgacttgtt attcaaggag    21900
gtcagtccaa ggaaactaga ttccccacct tctataattt cagcatcccc tctcattgaa    21960
gacaggaacc acgtttaaca tcaatgagtc ctgtgggaat aaagactgac agggaaccaa    22020
acagcaaaag ggaagactta cctcagttta tttatgggga tttatatact gcaaactaat    22080
actctatttc actggaatat ttgtgtttat gaagacatcc tgatgaacga gacttttttt    22140
ttcagttcat gaaattttca ccataaaaga accctgaatt cctattttga aatccattgt    22200
gccattttta ttctgcctgt atttgaatat agcatcaata tttaactact cattaaatga    22260
attgtgactt ttatagtgaa aatgtcagtc tttgcagttc attagattca tttaaagcat    22320
agctgcttga tatttttttt ccctggaaga ataaaagaac tgtgaattga agacataaac    22380
tttaaattta agcatgtgtt ttcttcaaaa ttaacattca ggatctgtaa cattattcat    22440
gagattgagg ggctgtttgc atctttctgc atttacttag tgactgtcgt cttttatgga    22500
gtatagagct gtttatcaca gttggatatg accagtggaa tgtcactgtg gacattaaga    22560
tgccataagc tattatgaat ctctacaatt ctgcatgtag tattaaaaac attatcttga    22620
actatggcat cagaaaaaat aaaccctgga agatgtcaaa tttaataact cactgaatcc    22680
aatagggcct aaaagtggtc tatttgagtt ttaaaaaata attctgataa gactttagac    22740
tgcctgaaag aaaatgatat attaaaaatg gaatttgaga aatgaattca aatgaatttt    22800
ttagatgttt gcaattcttt cttcctaaaa ttactatgat ttacatgtat ggagcagtaa    22860
atgcaaatga tttccaatca ccacgggtac gtgtactcaa ttacaaagtc tcttaatgag    22920
cattgaaaag atttcagcat tcactgaaca agacataaag caaatgaact cttcagtgcc    22980
ctccccttcc cacagagggc tgaaagggac tcactcttgt tacaagaaca cggccactcc    23040
tccctctctt cctcttccca gtccatccct caccccagtt tcagccacca tccaaaaaga    23100
aatcgcagca tggcccttga agcacattga gcttaaaagt gcctagaaga taaagcctaa    23160
acttcagcac gacaggcaag acctttcaaa atctggcctc gaccatcctc tctgggtctc    23220
ctttctgaga acccctattt tctgcctttt cacaactcca cacttatgca tgatgctgtt    23280
ttccctccct ggctcaccca ccccagtgtt cttcttctgt gatggtaacc tccccagaaa    23340
gtctcttgag ctagagtgat cattattaaa ttaaaaaaaa aaaaatccta ctttgttcta    23400
ttctgatttc aaaaacctga aaggcaagat atttgaggga aaaaagagaa tattgttttg    23460
ttgcttttta aaaaataaat ttgcaggtcc tgacaatccc gtgctttgtg tgtgctgatc    23520
acactgcaat ctaatcaggt acagtaaata aaatgacttg agaacctttc tgacgaatgc    23580
aaaggctgat gatattttgt gggtggaggg ctattcatgt atcttctttg agtatactaa    23640
agatccattt aattaagttt ggggaggggg gttctctatc ttttcctctg tccttttttc    23700
ctgaagctct cctactggaa agggaatgga agaaaacctt atgtggagtc cggagtgcct    23760
acctaaatta ctaagacaat aaaggacata caaaagaaga taatcaaatg ttactttggg    23820
tacttgaaca cttgctaaga gcatgcatcc tgcagtcagt aacattacca tctatactca    23880
gagggcaaac gctaatttca aatccagagc aatgtcaagg atttatcact gcaacccaaa    23940
gtatctttgc tatcaaagac agtgggggca tgaactacaa aggcaataac taaaaagagg    24000
ggctcatctc acacctctac tcctctccaa tattgggaag tccatttgag ttctagagag    24060
tgcacatgcc aaaatgcaag tgcgtgcatg cctgcgtaca cacacacaca cgcacaccat    24120
tccaacattt tcccatattt tgtccactcc ctctcttcct tgttatgggt agcagcagtg    24180
ataatgcact ttaatggaaa cctgcctaat gaacccaaaa ggaaaacgat taggaaaaaa    24240
atatgcaata catcgcattg aaaggtgccc ataattaaat tacttgttac cgtttttaaa    24300
tagtgcaaat attagtatgc ccacaaagaa ctaaaggttt gtttgtttta atctagatct    24360
tccagaattg gctgttcagg aactgcccat gttgcccaaa gtagctactt tttataagaa    24420
tttcccactg cctttgaaat attctctgac attcccattg gcttaagtat tctcatactt    24480
ttctgcctaa atttgtagtt tcccaagttt aattacccca gaacaatctg gtcatcaata    24540
accaaataaa agaggatggt atttttttcc ctcataaatc tattcatcaa gattcgacca    24600
agcctgcctg gaatgtccag cgaaagcttc aataatcagg gagaaatgag ttgcagaaac    24660
tcaaagagaa cagaatagcc aaggcaggag attacgaagc caggagatga gggcacactg    24720
aattaaacat tcttaagcag acttacatac ataatgaatt ggtcaattct gtccaatgtt    24780
tctgaaagag attacccttc caacaagcca aatgagtgtt caaggatggt agctcggatg    24840
gattcctgaa caaaataagt gttaatcact ttatctcccc caatcttttt tgtgaagaag    24900
agcaactttt catttccata aagccttgaa atcgttggtc ggcaggggat gggggtggtg    24960
ggggagggct ggttagagga tacagacaat gaagtccctg aaaaggggga tttcctgaca    25020
ataaacccct gatcagagcc agagagggga cattgttgtc ttcagcactc ccctctcctt    25080
tgggaattcc aggcgtagta gagagaagag ggtcacagtg acaactgctt gggaaggctc    25140
taaccaggta gtctttgcga ttttctgttt gggaaaagct ggcctacaac aatacatttt    25200
cttggaatgt gttcttttaa acaaattgct acagactttc ttaagacatc ctgtcaattg    25260
ttccaaaaat gtgtaatcag cttatgaaat ctttaagcaa agaacattaa atgttagcat    25320
aaaatctcat aactagttat gtattgagat tctcctacac accaggcaca gtgctgggca    25380
ctaaacacat agcagcgaac aaacgaaaca cagcggtcac tactgtctgg aaatcacagt    25440
taggaaagac aaaactgctt cttaaatctc tgtgcactcc atgccagaca cagtagccat    25500
tccataaata tttgaggaat gaatgaataa aaagacttca gagcttgagg ttcatgtgac    25560
tcaagattta aaaataaaaa aataaaaaag taaaagaaaa gaaaaagcta gcaggtatac    25620
tagaaccaaa cacacaaaat aatgagccag agtgtgctcc cacaatatta ggagaaatgg    25680
aacaagaaat caaaaccctc gacatattgc tcctatttat tattttaata tcatcgttgc    25740
acagaaccag tcattggtgg tgctttaaca attcctccta aatagctttg tgacttagtc    25800
caagcaccca gagacagatg agccccaatt caggcaagtc ccctgttgaa ggacaactat    25860
tttctcaaat gaacaaagat cttctcttct caatccgcca gatcacacag ctttataagt    25920
ttgaaaagtc tttttgctaa cctagaggta ttctctaaca gaaagaggga gatggaaaaa    25980
gaaaacatct gcaaggtgct gaaacacgcg tagattattt tacctgatcc aggagcctcc    26040
ttccctggtg actacctact cctcagaatg agtgctggcc ttcttagcta ttctggggaa    26100
cacaatgatg gaggctcctt ttagctccat caggccctag agaaataact gccctatatt    26160
tagatagatg ccctttgtaa caaaggaata attcatccca gttagcactt tctaaatgac    26220
agaaccagaa agttttcgaa aatattcttc tagctcagtg gctctgaacc aggggacgtt    26280
cggcaatatc taaagacata ttttgttgtc acaactgggg gtgctgctgg catctagtgg    26340
gtagaggcca gggatgctgc taaacctcct atgatacaca ggaaagttcc ccaaaacaaa    26400
gaactattta gcccaaaaca tcaacagtgc tgagatgaag aaatcctgct taagttatac    26460
attaaataaa gaacagcagg gcatctactg gtgaccccag atagttctgt taaaatattc    26520
tgaagtagga ttcttctccc agagtctatg ttcagcaact taaccagatg ttaaaaactg    26580
acccgatctt aggatgttaa caatatttta aaataatact gatggtaatg gtaacattaa    26640
tgaaatgctt ggtatacaga gagttatagt gcatatttac aatgacccta tgttgcaaat    26700
gttattagtg tcctctagaa ggtaactgta ttaatcacat acaataactc tatggagtag    26760
gtgggtttat aaccccctag gaagtgtgtg ctgtgggcaa gacttgatct gttttttttt    26820
tcaccaccat ctgtccagca cccagcagag tgaaatctcc atttcagaaa tgatgatgct    26880
gagaggctca ggaacatgcc agagatcaca gggccaataa atggtggaac cccagttcaa    26940
accgggcaga ctgcctggtt ccctagcctc tctctctcgc accgtgccag ccggccaact    27000
gcttcatatg tggagtcatt gaaacctatt agacctcttg agtctaacct tagataagca    27060
gaaccaacct aagggggaag gaattaggct gctttccaaa gttaccaaaa gtttcccaat    27120
attcaagaga ctgattaaac aaaccagtga ccccaagaca atggtgaagt acatttgtat    27180
tgccatgaga cacttgaaag caatctaaga gggtggctgg ttttataaga ggttaactgc    27240
ttctcagttt gagcaagact catgtggcac caggcactag gcaccgggca ggcttcctga    27300
agctaaaatg gccactttct caaaggacaa atgccctgca tgagtgcaga aactctttgc    27360
aaccactagg gagctaactc agggatcatg ggatttacat gtggaccaga caacaacttg    27420
gccaccagtc caatggatcc ccagtgccaa gttaacctta gcacagtctt cgggtaaaat    27480
ctagatcaat gctgattatg tcaggaggtc aactttcagg aattaatact ttttgaatga    27540
taagagagtg caaacattaa tttaaagtct cagagagtat actaattttc ctgttttcat    27600
catttcagta gattctataa ttctaggggg aaatatccca taagaaataa attctagcaa    27660
gtactgtaaa taaagaattg tatccacctt tataaaaaga ctaaaagaag aagagataag    27720
agcttgtttt ttagttttac aatattgaca tagtaggctt tatttttttt taaatgtgga    27780
aatttccctt ttagaacgat aagaatacta gcctggacac tatacaaaca tagtcattgt    27840
acttataagt gctttaagta tttattcata gcctgccttt ctctacaaag gaagtgaggt    27900
gacttttaaa agcatatgtg atttttaaaa ggtaagtaac aggtgaatca aagcaaggaa    27960
aaagtaaatt tgagaaaata ataaagccta gatggccagc acacaggaat gcatatccta    28020
ctgccctaga cagctactaa atgggtttcc tgtttgactc caagcttctt ggccatcaat    28080
gcaaagaaag aacaagaatg gtaagattaa tgcccagtaa gatacagcga agtggatttt    28140
tttcagttct tcttgatata gtaacctaag aagattctct gtaaatcatc atttaaaaag    28200
acaccatgag gtgtaatgag ctatacattg taaatagaac tttttaaaaa aaatgatgtt    28260
cacgaaacta ttactcataa tcctctcaat acaaagtgaa gccttaatca gtgtgcaatt    28320
caataaagca gagagggcct gtgaaggcaa ctgtgaagtg gggtgccaca taatatgcca    28380
tcgtgagcat tcagctctct cacaagtctg gcagaaatct cttatcaaat taggttatct    28440
ggatgaacgg aaggaagcaa ggcatcttct tcatgccatt ctccttagat atattatttc    28500
ttccaacaga ttttattaac acaaactggg cagcagggac ttcaagaagg acaaaaatcc    28560
tgtgtcaaaa ccattacata tgttggcaac atttatcatc aggaaaagcg tcccaggaag    28620
ttgaattcta atgtatgtgt ggtgttacaa tggaaatttt agtgtgcaac tggaatcagg    28680
ccatgagttt tgcctgtcat caaatgtatc tgttaactta gggttgaact gccccccacc    28740
ccactttttt tttttttgag acagtgtctc actctcttgc ccaggctaaa gtgcagtgcc    28800
atgatctcaa cccactgcaa cctccgcctc ccaggttcaa gcaattctcc ggcctcaatc    28860
tcccgagtag ctgggattac aggtgcctgc caccacgccc ggctactttt tatatttgta    28920
gtagagacgg ggtttcacca tgttggtcat ggttggccag gatggtctgg aactcctgac    28980
ctcaggtgat atgccctgcc tcggcctccc aaagtgttgg gaatgtaggc gtgagccacc    29040
atgcctggcc cctctttttt ttttttcttt tttttctaac tacacccttc tctttttcct    29100
ctctacaact gaatggtctt tctccctgat ataagaatct tctagatcac tcccatccat    29160
tgcattcttc ttggtcttct gttatcactc ttcttactca tcttactagc ttttaacttg    29220
actacgtttt cctttacttg gtttctgcct tggacttcca caagcttcac cctaataatc    29280
atgcagcctt gaaaaacatg gaggaaggaa aatgctgtca cctgccatct tgtacctgtt    29340
taaagctcca ctgttttcag tgtttaaact atgaagaaag gctccgatga tttaagctgt    29400
atagtcaaaa ctacagtgtc ttctaggaat ctaggattga gacaagatgt aaaaagagga    29460
acatgtaata tattatttta ccccactggc aattagaaat cgttagccaa agccaggatt    29520
ggggaggata ttcgaaaagt tattaatgca gacagagcaa ggcttttatg ccaccaagaa    29580
agttatttat tataaacaat gggttttgag tcacatggac aatagctatt ttaaaaacaa    29640
cgaatatatc caggaaaggt gcaaaaatat aaaggcaggc aatcctagtt tgtggtgctg    29700
atctattacc actgcaatga ctgtcaatag tgaccctgag cagaactcaa acagttaaga    29760
aaactcacca cctgttttcc aaggaatttt atttttgctt aaggtggtaa gtttgatact    29820
aaatacggag ggtgttcaat gtcaagttga ggacatagca atttaccctg caggccagtg    29880
ttcctagtgt ctactattca tattagatta acttaagtgg tgtataaaaa actttttaaa    29940
agtttaatag ctatgcattt attgtatggg taatctttac acattgcaag caatacaggg    30000
tcgccatatg caatggtgat acaaattaaa aagtgggtca atgtaaaaaa ttataaataa    30060
tagcagtgat aggtagatac agcagaaatg aatgtggcaa atctgcgaac acattgcaag    30120
acactggaag tgttcagaag gaaaatggta gctgtctaag ctatccttta gaagattaaa    30180
ccagaagtaa agcatagatt ccattgaagg tgagaaaaga tgacaagcag ggagagaggc    30240
ctgggctagg atactgatgg ctgaaagaaa agaaaaagat tatcagaagc ataataaaga    30300
agacatgaag actccctgga ctaagggaat gaaagaagcc aagtaatcta aattaatttt    30360
gaagttttgc acctggaaat acggcactga aaaaaacaga aattcaaagg ggagtttggg    30420
gggcagtggg gatacaggtt gccctctggc ttatgctgga tttgaactga cggcagacag    30480
ggaagcggtc atagcctgga gagagccact atgcaggaga tgagaaatgt agatcacagt    30540
agagatgagg atttgagacc ctggggtaaa ttgcaaaaat ggccacaatt ctccacacct    30600
ctgtctatcc atgcccttct gtaatgtaat tttgtggctc ctcccatcaa gaaatggatt    30660
ctgcgtcctc tcccctagaa cctgggctgg cccagtgact tgctttagcc agtagaatgt    30720
agtagaagga acagtgtgcc atttctgggc ctggactcaa gggttcttgt gtactttcct    30780
gctgtccgaa atactgccat catgaacaag cccaggctgg cgtgctggag gtgaaagata    30840
catgccagag aactgaggga ccccggtgga cagccagcca acctcctgaa gcaaaccctc    30900
cctgccaatc tgcagttgac tgcaaacaca taagagaccc agaataggat aagcactgcc    30960
cttctgagcc caacctaaat tgctgacatg cagaatcaga aacaaaatat gtgtttttga    31020
agtcacaaag tttagaggcg gtttatcact cgcgatagat aactggtaca gacaacacgg    31080
gtctgcctag aaagtgaaaa acatacgaag gcaaaacagt aagaggtcaa gctttaggag    31140
gatattccca attcctagga agaaggggga aagctgtaga caagacaaca gggcaatggc    31200
aatcagaaac attcaagtat ataatatcag ggaaccagga acatgggggc aggggacaca    31260
gaggataaaa gtgggggtag gagaagtcaa ggactcatca gggaagtata gcactgggct    31320
tagcagagaa tctgcctaga gaaggcactg gtatttttgc atgaatgatt gaagtttgat    31380
ctgtcaaggc agagctcgct ggagaagagt gagaagacag tgtcagtaac gtaacaagga    31440
atagaagtgg tctatggagt gttaaggagg gcctgggtgg gaaagatatg gaaccctagg    31500
taaagattac ttgtttgaag aatcattcag agagatgttg aagacgaggt caacagagtt    31560
ggacaaaagt gtaaatgtga atggtccttt ctctaggacc ctacaatcac aagtgtggct    31620
gggaccatcc atgccagcat cacttgggaa tttgttagca atgcccactc tcaggcccac    31680
cccagaccca ctacctgtct tttatccaca tccccatgtg ccattcaagt ttgagaagct    31740
ctgctctagg aagtacaaag acaaggaact gaagagcatt taatgacatc ttgagaaagt    31800
cattctgttt tgaattccct ttcaatcccc cagataaaat aacacaaagt cttgccttgg    31860
tactaagcca tcttcgacac ctccctaaca cttgcaaatc tcccttttca acagagttca    31920
acagagagca gagccttagg caagcaaggt ctccagtgag atttgaaaaa cactgtttac    31980
accccttttg tgtttatttt taggattttc ttttatgtgt ggaaagcaat caggttttcc    32040
atttgcagta gtcttaattt cacattaatt tatttaagag aaaaaaagag gtaaataaaa    32100
atatgtagca tataataatg tggatgcaaa tgagaagaca gcaaaagttg ttacaagtga    32160
ggtggcactc aaagcgaaga ctggaaaatc tatagtggaa gtcagaagac atctgggcac    32220
atttgaaggt agaaaggcaa gagacaggaa agatgggagc tgtttgcaga acaaagaata    32280
ttcaacaggc aggaaggact gttggaagga tttatcccag agtagaagct gccctctctg    32340
ggcctggaag aaagaaagat ctggtccctg aatgggtgag gatgacaaat cagagatcta    32400
aggcagataa tatcaaattc ttcataagta aaagattgga ggtcccctct aaaatgaggg    32460
taggttggtt tgactgggac tgcaaaagag tatgaaagac ttggaatatc cattgtggac    32520
aatgaccaag agaacaaaca gatgaaaagg attccgcagc aaaggcccag ggacagtcag    32580
gcagcattaa tttttagtaa ggaaaatgga cacagtttat cccaaagctg agaaatgaaa    32640
ctctaaggct gacacaaaaa atacaacagc aaagaaaggg ggcagaggag attaggtagt    32700
agtggcaagc atagctgaca agtcctcata gtcaaggtta catacaaagt caaaggttgg    32760
ctaggtgcag tggctcatgt ctgtaattcc aactctttgc agggccatgg cgagaggatc    32820
acttgaggcc aggagttcaa gaccagtctg gtcaacatag tgagacccca tctctacaaa    32880
aatattaaaa attagctggg tatggggtgt gcacttgcag tcctagctac tcaggaagct    32940
aaatcaggag gtttgcttga acccaggagt ttgaggctgc agtggctatg atcacaccac    33000
tgcactccag ccggggcaac acaacaagac cctgactctt aaaaaaaaca aaaaagagtt    33060
aatggaaaag gccagtagac tggactctgg gaacaagatt ctcagtggat atagggatat    33120
aagaagtgag aaataaacta ggtttgatca aaaaggaaaa acatcatgtt tttaaaaaac    33180
tggtttttaa aatgtcaact aaatattaac tagtgttcaa aattttgtta ccaagagttg    33240
ggacttgata aatggcacta caaaaactca ggaaaaattt tgaaaagaag agaaatttgg    33300
gcctaaaatg caggtaatca attaaaatta ggacataatg atgtgtggtt cttgcaaaga    33360
acataaatca ctgggtattt taagtgtgcc caaaataaaa tcccaaaact gaagaaaggc    33420
ctgaaaagat ataaatctta ttacagtgtg tctctctcac caaaagagga tcatccaaga    33480
agcacataaa aactaaaact ttgaagttta ggaaaaacaa gaacactaca gagtatacat    33540
aaaatttcaa acttggagat acccaagaag ggtttctcag acctcaccca tcgctcactc    33600
acacacagca cacttgctga actacctggt gtcccttcct ctccactcac tccttccaca    33660
gtaattgaga gtttcactgg gcacatggcc agccacaata taaagtacat ttcctgagta    33720
cccaagtgtg gccatgtgat gaaggctagc cagtgagata taagcaaagt ggcatgtggc    33780
agcttctgga aacctccgtt tgcccttgat ccccttcaat ccccttcgtc cttcttgctg    33840
gtcaaaccat ggaggttgac tagaggtcaa ccttgagcca taaggataag ggtcacagga    33900
tagctagagg cagcttggct cttcagtgtt taagaagcct ccatactagc cttggactac    33960
ttccctctag atttggttag ggaaacaaga aatgagtatc tacttcattt aagacgttgc    34020
tgttcaagat tttttctatt acatgtaagt tgaaccctaa tgtaccctct ttgctattat    34080
gggggcctcc tattccttga ccatttcttc aatggcctga atagttggat taaaagcagt    34140
cacttcaata ccacatttcc ctcaactcct gttctctcat ccctgcctag gcaaaatcca    34200
ccaccaagtc agcttcataa tcattgttct cttcctgcca ccaacacatc aaatactgat    34260
aaaaaaaatt aaaaataaaa tgtaaactta aacacttcta atagggatca tcacaactgt    34320
agtccaactc cttgaaaatg gacaagtgac ttcactgctg cattcctatt gcctagaagt    34380
gtctgaccca tactatgtca acacatattc actcaaatac taaactacaa ccagatcttc    34440
tgctcaacag tatttttatt catctctagt tcacttctta ccacatttta tgtgccaggc    34500
acttctctaa atgtgagatg taccatgtgc atcaaagtaa atacaccccc tatcctcatg    34560
aagtttacat ttcagtggaa agagatcaac aagagcagat gaataaatga ataatcaaga    34620
aattcaaata gggtacatgc tatgaacaaa attatgaagg tagagagata ttaattagag    34680
agatggggaa aaggatattt tagaaattga gattttttta atggtcagga catacttgaa    34740
ggtgatatct gggctcagac ataggtgctg agaagaggcc agccaagtga agacatttgg    34800
ggagagggct ctagacagag agaatatcaa gttcaaaaag atgggatgaa ggctggtacc    34860
gttaaaacac ataaagcgag ggtagagggg aggagtggta agaaaatgag gtaggaaaag    34920
tacacaggga tagatctcag gcttgtcaat caattcccat gcccatacat attgttctct    34980
ctctctctcc tctcttcccc aacatctttt ctactgaaat agatatacac tatatatata    35040
tatatatata tatatatata tatatatata tatatatata catgtgtata tatagaacaa    35100
gatatatttc tcactctata tccatacagc cactgagaat cttattccca tagtccaatc    35160
cactggccct tttccttaac tcttgacatt tttaagagtc aaggtcttgc tgtgtttccc    35220
aggctggaag tgcagtggtg tgtgtgtctg tgtgtgtgtg tgtgtacata tatatgtata    35280
tatacacatg tgtgcacata tttacatatt ttatatatat atgaatcttc agccatcttc    35340
cctttctttc ctattatcac aaagaaatag ttaccaaggc ttcatttaag ggctaactct    35400
cctttatcta cagtgttcgt tccaacagca actgaccacc caatccatca ttcaatagct    35460
ctctcactct ctctctaatc tcttcttcaa acatgttcag acattgtctt gaaaatatct    35520
tctcattagc cccacttcaa aatgtcaccc tctacctata cacacatata tgtatgtaaa    35580
cacatacata tgcaaatgta ccgagacaca cacatacaca gtttactagt acctactcaa    35640
tacaacctag gatctttcac cagacattct agtgtctcca cagtttgttc tcaaccaacc    35700
acatctccca ccatggaaag agaaaatctc atatccatag aatatccagg tgacctatag    35760
gtttcttgaa ggcagaccac atccaatctc agcctcaaca agaagggcgt tcctaatata    35820
aacaatattt atgatattta cattacataa gcacaggctc attttggttt ccacaaagaa    35880
taataataaa catagacaat ggaaatcctc agaaatcttc aaaatcatca agcttcactc    35940
cagttagccg tttcaatgga ctttgctttc ctatcctaca cccacattct ctcattgtga    36000
catcagcact ttgtttttcc tccaaagaac cactgctcca tactcttagc tcctgtggct    36060
tccaagaaga tgacagtgtc cagctccccc actggtatgc ctacgtggct acgagcctgg    36120
gcatgggacc caagtctatc caatgagact tgatccagaa aagctgctga aacatgcaag    36180
aaagaatctc tccctcttga agaggctgag ctgtgagaat gtaacttgga gctgctgctg    36240
gacaacttcc cactacttga gtacagcctg gctgatatga taaaaaaaaa aaaaaaaaaa    36300
aaagaaagaa aaagaaaaaa acagatgaaa gcagagctaa tataagaaag tcttgatagc    36360
atcccttgag actctagatc cagctatgcc tgaaacaaaa cttacaatcc cttttctatt    36420
taactcagtt tgactgaagt ctttttctca cttgcaacca aagcattttt actaaaacaa    36480
tcattttaac cacttttcca ttaaacattt ttattagaat ttttaaataa gtcaaataat    36540
aagggttgaa tctctcatta aagataagtt ggcatcaagg agcagcacga tggatctacc    36600
gagtatattt tattaactgt ttgatatttc tagatttaac tcatcccctt ttgaagaaga    36660
tcaacttcca accaatcata catatttaat aaaagttttc tagtcaggtc agcattttga    36720
acttctactt cctacaccta ggagattttt taaagaaact gtagaatttt tattattcta    36780
cagtaaatcc cttgcttatt acaaattagc tgtagaaatt gctggaaaaa atctcacaat    36840
ttggtacagt tatactacat ccatttaaaa taaattgaat tttaaaactc actcttatca    36900
ccatctttga cataattctt ctgcataaac aatttagtca atgtagataa ggctacatta    36960
aatttgcaac atttggaata gaaggaccca gcttaaaacc tcactccccc aaaagaatga    37020
gtatatatca ttcaaatatg aatttagagt aaaaactcaa atgtgtcttc atattagccc    37080
atttgtctat cttcaaattc ttcttttaca aacaaagcaa aattgaatta agattaaaga    37140
tagaatgtta atcatacaag aagggccatt ttccagggcc tggcatgttt tacacaagca    37200
tgaaacatat ttaagagaac atggcctccc tgaggaagag attaaggata caaacctagg    37260
aaacaaagaa aataaaacga tctacctcaa agggataaga ttaacctgtg agaagctcat    37320
gcggacctta aataaaagcc tctactcctt atatttttaa acaggatttt tctttttttt    37380
ttagagcact aattccacct tcaaaatata tttgagtttg taagtatact caacaaaaat    37440
cctgtccttt cttattaacc atactcaaaa cagattctct aaaatagtta tgacaccatt    37500
aacatttcat gaaatccaaa acaaatgtgt cttccaaaaa aataaatgtt ttcattcata    37560
aatggctaat atggttttaa attatgttat cacaaatttt gcatcattcc cccttaataa    37620
ccatttaaga atgtttcctt ccaaatagct attaagagag aaaggatgtt tcatcatgca    37680
tacacacaca taaacacaca ctccttgttt atgtcattgt ttttaatggt gcagtaggat    37740
ttccaaattc ttcaagtttc acacattcaa gaatgtttcc ttccaaataa ctattaagag    37800
agaaaggatg tttcatcatg caaacacaca cataagcaca cattccttgt ttatgtcatt    37860
gtttttaaca gtgcagtagg atttccaaat tctctgtttc acatgttact tcctaaatta    37920
ctgcctcact gactgggaag ttgaattggc aacaccagcc aatcctcagg tccaaggatg    37980
ttgtccttgc atttcctgtc tccttcctct tgaaggactc aaattcattt cattcatctg    38040
ctttactaca aacagaaaga ctccatcttt ggttgttcag ccccaaactc tctcttgagt    38100
tccagtgcat gactctgtga gaatatacca ctgaaatatc caaaatgagc ttgatctggt    38160
tatctttcct caaaaccagc ttctcctctc tccgctctgc ttccactcaa ggtcttacca    38220
ttcgtccagg ccccaaattc aaacaccctc aatcgtttct gcttcctctt tctgccttcc    38280
agtcgggagg ttctgtttag tgctttcttt tcttttgcat ccaaattcac atctccttga    38340
ttcaaatcct tcccatacct tacctcaact gggtgatggc atcctactcc cggtctctcc    38400
tactcttgcc ggggcctaca ccattctact caaaaggtca gatcaatctt tacaaaagta    38460
aaactctaac caatccaccg gtccacttaa aatttttcag gctgggcgca gtggttcaca    38520
cctgtaatct cagcactttg ggaggtcaaa ggcaggagga tcactggcgg ccaagagttc    38580
aagaccaacc ctggtgacac agcaagaccc tatctctgca aaaaataaaa tgaaaaagtt    38640
agccaagcat agcgaacaca cacctgtggt cccagctact caggaggcct gagtagctgg    38700
gaccacaggt atgtgtgcat ctcttgagcc tgggaaattg agactacaat aagccatggt    38760
cactgcactc aagcctgggt gacacagcaa gactccatct caaaaaatat ttatgtgtat    38820
atatatattc ctcgaatgca ctcagttgca gacaccgttg actttccaac agccttcttc    38880
cttgctaaca gagcataaca ctaattaatt atgctcacgt agcaatgccc agcctcaagg    38940
gatattggat tggtctaaac tgatcaaagt aatcttcctc tttgctagtg agtagcctag    39000
ggttggtacg caacccattt ctgaccaata agataaaaga gacggtctag tggaaaagct    39060
tttccttctt gccaagagat gtacaggaag agaaagtact catttgtgac cactcccacc    39120
accatcacct tgcttcttat tttgtgtgtt ttcatgtgac gatgtgacac ccagagctac    39180
agcagccaac ttgtagccat gggaagactg ataaaactcc aaggatagca gaataaaaag    39240
aaaatcaaag aagggctctt caagacatga ttgaaccatc caaaacaacc tggcactgcc    39300
aacccaaaga cttctttgaa ggtaaacaag tgtcttttat ggtttatgcc accatttgtt    39360
gagttttctg ttctctgcag cccaaagcac tctaactgat aaacttagaa agagcaaact    39420
cttgacctta gaaggccctc tgcttgatgt gctactcaaa gtgtagtcta cagacccaca    39480
accttagcat tgcctgggag cccagccctg ggcccatgaa tcagaatctc caagggtaaa    39540
gtccaaaagc ctgtgttata acaagctccc aggtggttct tgtgcatggt aaagtttgag    39600
aaacactgcc ctacaaaatg atcacaaatt attttttacc atctcagcta ctaccgtaca    39660
tagcatgaga tgcacttgat ctgcaatttg tctggtggca gtaacctttc cgggtttgag    39720
catcatttgt tgctccttta gtttcttctc ctcttaatca aaatcttcaa acttgaagcc    39780
ttcaggtcct gagaggatta caaaggtctg aatatgagac aggctgtgaa acaggccgtg    39840
atgaactatg gggtacaggc acatctgaag gacaccgagc agatgttgcc atacaaggat    39900
attggttcag tgttgccaga tgtctaaaga aaagctggaa tccagattta tatgcaaagt    39960
tttttagata tagacaacca agcctttttt aatactctgc agattaaaca aattttcaag    40020
tggattcaca tccagctgag tttgtgacat gaagtagatt ccttgaaata tcgacacata    40080
ctttgaaaac tgtgaccacc tacatgcatt gacttcattt gaaatgacta aaattaattt    40140
tctttggcta actatatgct agtctctact gagcacaggg tcttcatcag tagcccagca    40200
tctggagtgg tcaaatagtt tgtggacctc tagttaggag cagcaggact gttttatcca    40260
ttagtcacta tacaccacac acttagaact gcaagcttct catgggccca caacaatgtt    40320
taaaatgtga gaaaaaaata aactggccac acatcaccag aaaactacaa aattacaact    40380
aatagatgtg aagctaaata tttacaaaat gtaaactaag tcaacggatc catatcaact    40440
cagatatggt atcatatcac attagattaa atgcaggatg tggatgcatt ttaatgtttg    40500
atggggcatg gaagggagct cagatcaata gtgcttagag ctgccaaggt tctaaaaagg    40560
ccctgggtac caacctgaag ccaaccattc tgtggtaagt ctggtcttca caggtgtcac    40620
aaatttcttt acgcagctct actccattct attgaactgt ctacatagtt ggacatggga    40680
gcagaactgt ccacatagtt gcatgtaaac cataaatgac ttattaaaaa gttatgtttg    40740
gatcctcatc tacatatgaa tttaagacaa gaagtacaag aatcagcaca caagcaagtt    40800
ttgagggtcc cacataatga ttttaattat tttttgttaa tttattccaa catttaaaat    40860
tcatgataat tcacataaaa acccagatta tcatcctctt gaaaaaagaa ttgtaaagta    40920
tagagatatt ggacccaaat gttggcatgg caacactcta ctaatgctga cgaaggctat    40980
ccctttaaat ggggtatgtt ctctacttgg ccgcaaaccc tgtctccatg taggctaact    41040
tgctgtccca agagacaatt gagtttatgc cccctagttt aaggctctta ggaaaacctt    41100
atttcttttt cacaatgtgg cttcaatatc ttacgtgaag acctgtcgtg ataggataca    41160
ggaatctctc aatctaagaa gagtttcaat caaattcccc ccaatatgtt ctcaatttga    41220
accatgatcc ccaagaagat tgacaaatga caaattaccc tgcagtttct tttgcccttc    41280
aagctagcca aggcagaagc ccaatcaggt ggagtcaaag cactaatata agaatgtctt    41340
aattaatcaa agtgatcaat aaataataca cataataatt agaaagcaaa gtctgggact    41400
gatagaataa aaacaacata gcactaatct aagtaagggt gagaggtcaa tagccataat    41460
tcaaaaggaa aagccctaaa aatatgcaga aatagctagt aactggagtt tagtccaagt    41520
ttgttaacaa cccactgtat gatttcacct cacacccaca ttaaacacag tatcttattt    41580
tgggatggca gaattctgac aactacaggt tgagtatccc ttatctgaaa tgcttagatc    41640
tagaagtttc agatttaggg gttctttgga ttttggaata tttgcattat acttaccagt    41700
tcagcatccc taatccaaaa atctgaaatc cgaaatgttc caatgagcat ttcctttgac    41760
tgtcacatca gtgctctaaa aagttttgga ttttggagta tgttggattt cagattagtg    41820
ctaaattata tttgctaatt gatattctgt gtattgtttt cttactggtg aaaagacaaa    41880
ttgaactcag gaaagaaaaa ttacaaatat atagtcaaag agtcaccaga tcatttgagc    41940
aacataatga gtttttattt cttaatatac agggtttaat ttgttaacca caccagaaaa    42000
agaaatgttc aaacagtcga ctttctactt gaaattaaaa tggaaattag cccttaggaa    42060
acagtgatga ctttaagttt atacatcagt ggctggttca tgaattatta actgatttta    42120
atgatcctgg ctatatttta tttgaagtta ttctcctact tgcaacgact tttgaaccca    42180
caaaactctt tcatccattc tccacagaca cagtacactt tcatgagcac tgacatttga    42240
aaaggatcca tatactcaca gaatgtaaag ataatacaca tgcatataat tgatacaaag    42300
gactctggtc atttgttaaa gagagtaatg aatgaaaccc tattattcac ggtttgtaaa    42360
taaatttaaa gataagcgct aactttcact tgttaagcct agagccaaga gttcggtgtt    42420
tcttctaaag tttcccagat ggtcattaaa acaagagagg gaagaaacat actttctttg    42480
aaatccatca tttcccatcc agaaagataa tacatgtcat caaaagttaa gtctttagag    42540
attaattaat aatgtgagta ttttcaaata aaataaatgc atgtctttat atgctagttt    42600
ttacattttc agtataaacc tatattgaac agcaccactt cagacacaca aattagctgt    42660
gaaacaaaat gctataaacc tttaattagc acttgctgct ttatacccat aaagttaata    42720
cttcctcttc tactatattc tctgtaaagg aaaattatgg gaaataaaat tgtgtttttc    42780
acttccgaaa ataaaagtag caaaatatag tattgtggct cagtttaaag atagttatat    42840
ttttacttgc aaggaagtca atacaaagat cccttacaat aagtataatt tgattcctac    42900
caatattaag cgctatgtct aactttcata acttgggtac acagagcact gatgacgatc    42960
agattgctaa ataagtaaga aagcaagtta tttcaggcaa atagctgcat taagaaaata    43020
cgacagtaag ccaacttgta tccacactcc tgaagctgaa caagcatctc aataaataat    43080
gtctgttttc aagctttata taccctccct gaaataaatg ttctgagctt aaatagactc    43140
aaaatagcct ttctcagaaa ataaaaaaga gacacacaca aaacaccccc aatttcctct    43200
ggtcccttga agtacccttg ggatcccagt gaacagagat ttgccacgca ttgcagtgac    43260
tgcatttgta caataggttt ctattttggt gtcattcgag tgttgcagat cttaaatcag    43320
agaaagaagg agttacatta ggcaaggtaa tggcttccaa aaataagagc atgcccagtt    43380
tatacaaggc ttgcatccac atgctaagtt gtaaggagat aaataatacc ccactggaac    43440
aattaggtag attctcagaa acactacata cttaattagg ctgcctaagt cccttactga    43500
gcatacatgg gggacttttt aaagcattta ataacctgag taaatccaaa atcagaggac    43560
acaaactaat ccttaactct ggctccagcg atcggccttt tcttgcctct ctataaatgc    43620
ttagcgtagc ccttagaatt cggagagcag gaacgctcca accaccaaag ggttaaagca    43680
cacggaataa agtcccctcg atctatattt tttgggaggc ccctctgtgc cagacgctga    43740
gctgggcgat gatgacacgc gagggcgagc aagagagacc ctaatggtct tttacaaact    43800
tcagcactag agttgggaac gcagtataaa caaatagaaa ggaacacgag cctccatcag    43860
ccacggggca cagcaaactg ttcctcactc tagatgcaat tcctcctctt cctgttattt    43920
attcattagt tttgtttagc acctttcttt cagcaggctc cttatttcct cctgttatcc    43980
aagcaatcac aaacaaacta cgatttgaaa gaaaaagaga gggaggaggg aggagcagga    44040
ggaaggggaa agaaaaccac attcaaaagg cacaggccat tcagagcccg gctgtttctc    44100
tgaatctcgc cctcagggtg atgttttcga caaattcggc gctgggggct tcagggagga    44160
cagaggacac cggatggtgg gggggaattc cgcgcggccc gggtaccagg gctgcgactc    44220
tcgcccgcct cgctgctccg agcgacgccc gctgcccttc tgaggtccac ctcgccacct    44280
ggaacgctcg gtcctcgaag ttggcgcagg gggaggtgga gaaggtggag tgaccccagg    44340
gtgtggtgtg gaggtctcca atcccgatct ccccgaaatg caaaacttag cccccccaaa    44400
aaaatgagag gaaagaagcc acttactcta agcggggagg ggcgggcacc ccggttccga    44460
ggtccaaagt gccctaacga aagggcagca aaggccacct gcggggtccc accacttccc    44520
cccactcccc tgtccaggca tactcaaaag tttgttcctt tccgtccgta agcggccccg    44580
aggccggctc tggagtaggt gggggaggta agaaggactg ggggtggggg agggcaagat    44640
catcggacca ggagatcagg gacccctgcg tagcccccac tcagtccagg ggggctgcga    44700
tcgtgtttac taataacagc aacaaacaat cacacgccag cccttctttc agtcctcggg    44760
ctctcttcgc tttttggggg cagcaaagga gagtctggcg gggaggtggg agggagcgga    44820
ggggctgagg agagcgccgg ctgggggaca aaaagcggcg tgggatgggg cagaaagaga    44880
agcggggaga gctggacaga gacgaaggct caaaggtaga agagacatgg gaggaaagag    44940
gccaaagaaa agtgcagcag gcggtgagcc cgagcgcggg gcgcgcccag gatggggagg    45000
tggcccccgc cccccggccc accggcccag cccggtcacc ttgctgtagc cgtagtaccc    45060
caggcactgc gcgaagtcca ggctggcagg gtccccggcc gccgcggggt agaacctcac    45120
atccatgccg aagctgggcc cggggccggg ggccgggact ggggttcgcc ggggccggga    45180
cccgcctcct cgccgccgct agatccaccg tcgagggcgc ccgggggtgg cgcgtgggac    45240
tcgcggccgg aggggcgccg ggacccagag cccgaggagc tcgggagccg cggccgccgc    45300
acacaaaggc gcggccacgc gagccgcggg agagcgggag gcggccgggg ggacgcgccc    45360
cgccggggca ccgaggcagc gctgcgcgcg ggccgggcgc cgggggcgcg gggcgcggcg    45420
ctggggcccg ggtcggcgag gcgagttcag gtgcgctggg cgaggctggg acggcggcgg    45480
cggcggcggc tggccccgct cctcctcctc ctccccgggc ggactgagga gacgagccgc    45540
ggagacaagg ggcccggccc ctcccctcct tctccccctc ctgcctcagc cgccggtccc    45600
ctccccgcgc cgccgccgct ccgcccctcc caccgcgggc agctggcgcg ccgcccgccc    45660
cgccggtgcg ctcctcggcc cggaccgcct ccgggagcgc ccaccccgcc ccgccggccc    45720
catcaccccc gccgcggccg ccccctctcc ggggcccctc ttctccctac ctcgcccccc    45780
ttcccgctcc ggtcctcttt gtccccactg cctcggagcg ctcctctctc ccctcctttc    45840
ctcggccgaa gcggacgcca gccctgcgtc ccgtgtgtcc caccctcctc ctgcgcgacc    45900
acagcttccc cgggccccag catccccaag ccgtctgctc ccttcctgtc gctttcctcc    45960
ccatgacccc cttccttctt catgggtgcc tgtccccggg cccctctcct cgaccccgcc    46020
ttgcctttcg aatgtcccct gcgtggacac acctaaccca gacgccaacc tgcacgagtg    46080
tctcccggta gccgggagcc gggaccccaa gttcacctgt aggatttccc agaaggggtg    46140
ttggggcctg acctttcaca ggtaggcaga cttgaagctt cccaggtgaa gcctcgtgtc    46200
ggttctcttc gtattctctt tgctcttgtt tgtattcgaa aggcatttga gtaactggat    46260
ctaggcagat cattcactgc tctgggagag aaaatgtccc tattttccta aaaggtccta    46320
gctgattaac ttccccactc tacactcacc cacccctctt tatttcttta tctttcttaa    46380
gctccatctt tttatttaat tttttttctc atcggcttta ttgctttgag ttaatctgag    46440
agtttggcct tcagccttgg cgaagggaag gggctttata ctaaatggga acgttgtgga    46500
gaggccgtga gatctgcgcc ctccccagtt tagttatctg ccagctactt taaccagagt    46560
ggcgacattc tgaaatattt cctatgacac tcgctaacag tttcatcccc tggtcacacc    46620
ttgctggccc agggcctgag ctttttcaga caagcatgac atgggttttc ttttcatttc    46680
ttctgttctc cagagtagat cgggcttgtg acacctgtgt gtgtaccttc actcaatatt    46740
atctttctgg aacggagcag aaaaaaataa acttcaatta ggtgaaagtt tgtgtatttg    46800
ctcttctctt agcaaaaact tgggtcagga gactactgca tgagagagca gtgtgtgttg    46860
agaaaagaaa caactgccca cgttgtccct gggttgactc tgatccccac cctcccgaaa    46920
aagctttggt ttcccctccc tagtctccat ttaacgttga caacccagcg gtgctcccta    46980
atggcccagc aggttgcaca aattgacagt gagctgagat attatcagga caacacccca    47040
ttgagcaagt tcttgaaacg cagaagtgga ggccctttct ctgggccact gggcgcctgt    47100
ggcctttcca ccaatcagag ctggaggttg cagtggccac ctgttgtctc gcaagagaac    47160
atcttttaag tttcgctatt agtatttaac aatggcctac agagcaggat ctggccacag    47220
gagaggagca gtgtgatgat ctggggtacc aaaaaagaat tttttaaaaa aaaaatttta    47280
cagatagctc ttacaaggag ccaaaactct ggaaagctaa gtttttcttt gcacactcac    47340
aatcctcacc ttctgctcat tctgttttgc atctgaagca atctgagctt gattaaagga    47400
tgaagaaaag tataatcaaa gttacagaga ctaaacctga acttgtaatc agacttcgag    47460
gatcaggaat ataaatacgc ttcgcagtgg aaacccgcta gctgcaagaa tgggaattgc    47520
aagtgggctg atgtactgca ttcagctttg ggcggtagag cctagaaaat gaagcgagaa    47580
ctttacccct aaggctctca ggagttagga atgctcggtg acaatcccta actcctggcc    47640
attgttttgg aaaagtcttt ctcttaaatt tcccttccct gttaggatgc aaataccttt    47700
gtgaagggaa caatactcat ctgtctgcat tttattattt gatttaggat ataaggtaag    47760
caaaagatct gagtttagat tttgatttag agggagggga agaatccggg tgatgagctg    47820
aagatgtgta tgttgaggca tttagaatga gaaaatcact ggaacagaaa aagggcattg    47880
gtgaaggctg ctgacttgac gatttagccc aatctccacg catttggcag ctatctttat    47940
ttattgtttt tttttttttt ttttttttga gtacctacca tgtgccagac atgattttag    48000
gcacttgtga atgagaaaga ggattcaatt cccgacatga cacatataga agtcctcaaa    48060
gaggactatg attttggctc ttggaacaca aaatacacac gaactcacat gcacacgtgt    48120
atacatgccc tgaaccatcc cagtcacctg gagatactgt catggcacag ccactagctg    48180
ctgttgagag aagcgacatg aaaaacaaac tcacatacag tgtgaaggat gccagcttct    48240
acacccccat ggtatttgta taagaaggct caagggatga ggcagtgcat cccttgctac    48300
atcattgctg gatcccaaga acctcagacc atgcttgata catagtttgt ttgcaggaaa    48360
taaatattca ttaaagaaag aaagtttaga aagaacatgg gaaggaagaa ggaaaaaaac    48420
acagaatgtt ttaatagtgt aatttatttg cagggaacct taaggcagga tttgagaaga    48480
gtatatccag gacctctgat gtgaattaga acaatctact ttgggtgggg tgggggcctt    48540
ttgcaccctg ctgttgtaga cccttcgcag acataaaaac taagatccta tgtggtttcc    48600
tttagaactg atctgattac actctccatt gctttcgcac tatcatctaa ttttaagagt    48660
tccagtggtt ttgaagacta tccattaaaa actttagaat aatgctttaa aaaattaaat    48720
gcaattgtaa ctgtcatggt atttgttatc ttaagggtgt cactattttc agtctgtcag    48780
cagtcttgtt tctgaaagcc atagacaaag gtttccttta tactggatta gccttgaatt    48840
tgaagaacct tctccaagaa catatcttaa atatgctttg aatttatgct gaacaatgct    48900
aacagttatt gatttagaag ggcagcagaa gaatcaattc tgcagccaaa atacaacttc    48960
tgggcataag aaaattcctt tagggttttg agatgattcg gatcaaaact gtccatctta    49020
ttataatgct tgatgtttct aattaaatag ttgatgtcat ccaagaatcc cttaaaaatg    49080
gggagaaaat acacaaactt tacattgtgg gaaaactacc ttacatcttg acggaacctg    49140
aaaactttct ctactttatc tggtttcaaa ttatgcaaga aagtccccat gaggacttca    49200
ttaaacctgc cagagtttta taaccaaaaa cctcactgga acccccactt ttacgaatct    49260
atgaaagtaa tttaacccct ctgtgttctg cttgcccaag atcagatgca aatactatta    49320
aacagtatat acagtttaat tctcttgagt tttggtgatg aaaaatccta tccaaatatt    49380
atgatccttg caatacgtaa tgtaaccaaa ttaacgatag ctccaggtgg aaattaacaa    49440
ggccagggct actcacgttt cctctcatct attcccatag taacagctaa tgtattatat    49500
tgctaaaata tcttatattc agttttatgt ctgaacttgg tgttgtgtca taaagcgtag    49560
cattcctatc cagactggat tcttaatatg tgtatcctca tgaaatttag gagagtttcg    49620
tgtctgcaaa tcaacacttc atgtgcatag tctaaaccac atgcagataa aagcaagtca    49680
gaacctacca agactctcac catagtgaac ctacacatgg tatagaggaa gaattcttac    49740
ctgggagacc tgatgacaca ttaccagtgc aggacctaaa gcgaatcacc atagagagat    49800
ccacacagga attatagtgt gaaaaaaaat ccccaatcat agacattgtt agcttcagtt    49860
ttcagtgaat ctaaactctt ctagtatgaa aatgtgagct attttgatat ttttactttg    49920
gtcaaaaaaa cacagaaatc caaaaaatac agaaatctgg gaaatgggat aaaaataagc    49980
aaacttttcc ttcatgataa taaatatata ttcagttgtg tacatgaggt tgtttcccat    50040
actactacaa ttttagtcct attggtctct gtattaccag gcacaagaag ggctctagaa    50100
aactaatcat tttgtcagtt gactattact tttacaaaga atagataaca cccataggtt    50160
ctgacagata catagtaatt atggaacagt cacctccaac accctggtag caaaaaacta    50220
ttaagccaag aattcattac cacaaatatg gaatgcagca agtatttgct tgtgacctaa    50280
gtagctcttc aataaagata ttttagaaac caaaacactc cacacaatca ggaggtgtgc    50340
aattttcact gtatttacac tctgccttaa aaaaaaattt gtatgttgtc ctgcctgttt    50400
tctgaaatat attctatttc ttttaaagtg aaagaatgac ctcttttgca ggaacgattt    50460
tcagagacag cgtgtttatc aaatggtttc tctgctttca taaaaacaat ttattttcac    50520
tgaactcttc acgataagca tcaaagccag gaagaatgta caatgaagtt tacaatttca    50580
ctccagaaac aaatactggg tagttattat tttgcttaag tgaaaaacat tttttttccc    50640
caaggagaca aaggtagtaa tgggggaggg ggtttataca ggagtgaaaa tcaggaagtc    50700
cagacagtct tcagcaggag gggcccctgg tgttgtccac aaagaccacc ggctgaacaa    50760
tgaaagctga agacccagta ctttcttcgc aaatgggtgg gggtcagtcc acagttttat    50820
tcttcgctaa gagacagcta tagaggcatt aaggagagaa aatcattagg cagatataat    50880
taaacccttc tatgacagat ctatatacca ttgcacatag atatctctca tagttggtgc    50940
tttggatgac aatcctttct ttgataaaca tccatgtttc taggcttaat ttatatgaca    51000
tgttattttt taataaccat agaacaataa aattgtaaaa ataaccaaga aaagaactga    51060
gtctaataaa gattctgttt cttaagaaat gggaaacaat tgcatttgat cacagaacag    51120
ccaaggacta gcagcaaaat aatctctcct aatttacata gatctgtgcg tgccaaacag    51180
atgagtgttt gcttttcgag taatagtgca ggtgcgtatc ctgcagtgac taaatctcta    51240
actcatcaaa ctgtttcgcc agaatgggac atgccctctt tttctggaac agtttcaagt    51300
tttctcccca gcattccagc cacctgttta tggagttcat cctcgggaga agatgcatgc    51360
aattagaaac aagaaaatga aaataaatga ccttgtttgt tatttataac aaagaaactc    51420
tgcaaaatta atgctgtgaa gcttgacctc ctgacccagg aaaaagagcc acctcatggc    51480
tttgtggcca atggacaata gtctggcagc tcccattgtc cagccaccct gacttttgga    51540
tggtcattaa agccacatat ccaaaatatt aaatgtttta caagttagat tagaggattt    51600
gcacttttta aaatgcgtgt tttaaaaact gaggttagtt agcacaagag attttctttt    51660
taaggacagc aggtaaaaat catttagctt catctactcc atctatcctg tgtcaacaac    51720
atgttgaagg aaaggaaaag atttaaaaat tctgaactag tgctttggga attgaagaat    51780
ggttaaatat ataatagaaa tcaaatagaa aggtggtctt tgaaagtggt tcagggaaaa    51840
cattgtgttt cctccctgct gaggcctcag ggaggaaagg gggaattaca atgttctgtt    51900
acataaatgc agtgtggatg gtgcccccta gagttgtgcg atgaaatagc attgctgttt    51960
ttccttccac ctcttatccc aacccacaca tctagaagcc cagggcagga aggaaatgaa    52020
ggtggtaatg gagttttgaa gactcttcag aactggtgct tgggtggaac atcttgaggt    52080
aggatggcga ctgaaaatga cactctctgg tgtggctgat tctgaagctg gcctctccta    52140
ctgcatcttg cctctttccc catttggtct cctccttcat tcacccacaa caaattccat    52200
gagtgtcctc tattagtcta aaccttagag taaaatccgt gtttgatttt tttccatcca    52260
agttgcttat ttattggcca atctgcccag tgctactaca tctttaattg ttttattttt    52320
ccccaggagg aagtaactgt ttattcaaga aggttctcta ctgttcctca aaatgtcttc    52380
ttcactgtga aataaagtca gtttcataag gcatgcagat tgtcatgcaa acaccaccct    52440
gagcattcta gatcatacct cctcaccttc ccttttcttt ctgatcccct gagggtagct    52500
cattatatgc ccctccctac cccttcttgg gaatgctgca gccataaatc tggagaggtc    52560
attagaatta cgaactctgg ttggtgtctc acatacctac aacagcaaca acaacaacac    52620
aattatagcc actgtagagc caatgtcctg gttaatgttt gtgtaactgg ccaattctca    52680
ggcccagaga aaggagttta agaaagtttt tgcatctcac cagtctaaaa cttcttctgc    52740
agtccaaaac cacatttcaa ctattgttta actgaaagac tgagccctct taatctggaa    52800
ccaccaacta aattccccct gtgtgcttaa acaccaagtt agagagctgt gttcagtgcc    52860
agtgagaaaa agtagagtgt gattacccca tcttacccac agctgaaacc tgtgtcattt    52920
atttttcaac aaatgctgac tgtgcctttc taactatatg ctcctacgtt tccagaaatg    52980
ggaaaaagca tgatccctgt ttatactaaa catgacaaga catgaggaaa gtagtataat    53040
aatgaaatat tgtaatgagt gccataggaa aagcattctt aggctagtgt agtcaacaaa    53100
catttattta cagaaattgt tacaggtaat atgttagtgt gctgcttaga aaaggcgggg    53160
atcatttatg atcaggataa tcagaggaaa cttcatggag aaggcatttg aaagtagata    53220
gcattttggt gaggcaaaag ggatgaaaaa atacactagt ggagggagat tttgaacaca    53280
gttattagag agaaaatatt ccatgtgtgg tgggaatttt gggttgcatc agccatttgt    53340
tgggtagatt aagcttcagt aacaaataac ctttaatatc ttagtgggtt accagcacag    53400
aggactattt ctcagccccg ttccagtcca ccacccatca gctgctgttc atttgcacat    53460
cttcatctca ggaccaaagc tgaaaaagaa gcttctatct ggggcatgtg ggtcttgtag    53520
cagaggaaaa agagagagtg gaaacccgct acagttgtca aagctgctca cctcattccc    53580
gctcactttt cactgggcaa agcaaatcag atggccaagc cccatgtcaa tggggcagaa    53640
agtatgatcc tcccggaggg actggtctgg caaagagtaa ggaggagtcc cctattttgc    53700
aataatgtag tcggtgccat ggaaagagtg ttttagagac ctaccaaaag tttcaggcag    53760
caagcaaaat tgtttagtaa aaggagtgag tgagtgttga ggggaagagt ttggtgagat    53820
aagatgccgg gaagtgatag ggggaaggag acaggctggg aagtgaaaca ttataaagta    53880
ttgaaggctg ggcagctgag ttagattcga tgcaaaagga tgtatgatgg catgaaaaaa    53940
cgcagctgtg agttctgatc taaagtttgt tttgacccat atagagcaga ctcatttaac    54000
atttaattag tttatactgt gtgtcagttg tggtggcagg tagacatttg catagatcta    54060
tattttaaat tttgatcctc atgacacctc tctgggttag ataagtatta ttctctttgt    54120
taagctgaag gaggctcacc aaggttgaat gacttgctta aggacacaaa agcagcacac    54180
agaactgtga tgcaaagtga ggtctttcta ctgcatcact gcagggcaaa gaaattaaaa    54240
tgtcaccttt ctttagtatt gacttgttat tctttatctt ctccttaaat acacagtctg    54300
aaagcaaggt taatatgatg ctttttctca tattaattaa aatgatgttt atataactaa    54360
tccttgcata gtacaacttc ataagtgaat aaaaaagaga cagatcttta actgaggtat    54420
ttattataaa atttcgtggc agagacagtt acttctaacc aaatacagaa tgctctccac    54480
tatgtatttc ccagtttttc ctgctgttag gtgaggagca gctgaggcaa taaagaattg    54540
gtgtgcttcc tccatatctt tcttgacctg ctgtggtgtc cttggaagac acatgcacca    54600
gatggaagaa gacaattcat gcctcagaat tcacatgagc gaaaccatgt cttgatggta    54660
ttgcactaca agatatccag tgtctatttg ttacagcagc atagcccaac ctatcctgat    54720
taatacagat ccttctgact ttaattgata caaggaaagt gaccatatct gtcttgcaca    54780
tcctcttatc cctactgctg aatacaggac ctcccacata atatatgctc aataaagttt    54840
gattagtgga aaatgaatga atctcaaatt gagtctggcc tctgtctact atttggttaa    54900
accacttatt tactgctttt agaaaccagt ggttgatcaa tctttttgat atatcatttc    54960
atcagatcac tcctcagatt aagactttat tatatattta atcaatttta aactccttcc    55020
tttgacattc aaggtcccca taatctcacc tagattccta caactttacc aatttattgc    55080
tctaatccaa tctaacctat cactactggc ctgtgacccc tggtcactat attcactgtt    55140
ctagggacaa acatttagtg ttcttaagca aatcatttca agtctctgag cctcagtttc    55200
tcattctgta aagttgttat ttgtagcaaa agacataatg catacaaaag tttaagttat    55260
gcagcattat gaaaatccaa atttattttg tacttgttgt tggtatatat taaataaatt    55320
gatagatcag aggagtgaca ttaaaaaatg tgttgccatt tcagtagcac atttgtcaaa    55380
atctcccatg acaatcttgc atggaattgc tgtctaggga gaaatggtaa aggaaaccag    55440
ggagaccctg ttggttatct actccaaatt cattccctct tttttttctt aactctacct    55500
ctattttatt taagttctgc ccttctcctt gggaccatat ttatctaggg aggatccttt    55560
acaatggccc tattttcact gccaatgatt actgtagtca tgaactctga tgcgtttctg    55620
gttgataagt tgtggaaaag agtgtaagag ggcttctaag aagggtttct gtgcttttaa    55680
aaagaaacac tcagaaaata tataataatt tcttcttctg gacagtgtca tgtctcgaaa    55740
tgttgcagcc agctcatcag catgaaagga tctctagccc gaggtcagag ctgacacgct    55800
gagatgagaa tggaggggca gaaacacgga aagaacatag atccttgatg atgtcaggag    55860
tcactgatta actaaccctg gagctccttc tgtcctgatt tctagttatg tgaaataact    55920
cataatctta tcttttgatc taattgagtc ctagttttct gttacgtgca atggaaagca    55980
gtgaaaccct cttagactga gtccattagg gtacccgtaa caaaatacta taggctgggt    56040
ggctttcata acagaaattc atattctcat ggttatgaag gctggaagtc ccagatcaag    56100
gtgcagcagg tttagattct cttgaagcct ctctccttgg cttgcggatg gccaccttct    56160
tgctgtgtcc tcacatggcc ctccctctgt gagtgcacat ctctggtgtc tcttcctctc    56220
tcataaagtc acaaggcaga tttgattagg gcccacccta agggcctcat tttaacctaa    56280
ccacctcttt aaaggctctg tctccaaata cagtcacatt ctgaggtact gggggttaga    56340
gctttgaaat atgaattttt tttttctttt attttttttt tgagatggag tctcactctg    56400
tcgcctaggc tggagtccag cagtgtgatc ttggctcact gcaacctccg cctcctgtgt    56460
ttaagtgatt ctcctgcctc agcctcccga gtagctggga ttacaggcac atgccaccac    56520
acccggctaa tttttgtatt tttagtagag atgggtttca ccatgttggt caggctggtc    56580
tcgaactctt gacctcaagt gatccgccca cctcggcctc ccaaagtgct gggattacag    56640
gcgtgagcca ccgcacctgg cccaaatatg aattttgtgg gggacacagt tcagcctata    56700
acatttgctc aagccaaaaa aaggagttta aaatttcaga aaaaagcctc acagactcca    56760
agtgcacttt atcaaagtca gacatccaga gaactgggaa gccaataggc agctaatctc    56820
ttcatgtttt tccctcttca tggcttcaat tttacatttc tctcagcatg catgctttgg    56880
ttttttcttt ctcctcaccc ttctgcttat acaaagctca tcatgagtgc ccgatgatgg    56940
gcttcagccc ctaagtcaca tgacccttat gtttggctac ccctagctag caaactcagg    57000
ctccatgcct ctttgtgaaa ttcttgagat agagaatctg attggcccag tttgtatcaa    57060
gtgtttatcc ttgatccaat aggctgtggc caggggcatg ggtcaggcgg tacacaaggg    57120
ctgcctcttg tgatctgtgg ctaagttagc tcacccagag gacttgaatg ggaataaatt    57180
ccttagcagc tctagtggaa gagggtaatg tggataaaat tatagtgtag tcaagtggat    57240
ttgaagcaga tgaaacagtc atacacaaag gtgttgattc attactgaca ggctgtaaga    57300
agtctttagt aaagtcccac tttatcttgc cctcggttct gatttttttt ttaatgttcc    57360
caatatttta ataaacagat taggacatag aaaatatacc tacgaatttt tagttgacaa    57420
aatgatggaa acatttgtta agatagttag aaatgagatt cagactcaaa atcatcttaa    57480
agggctagaa atctgtgtag aatcaataag ataaaaatta gctcacataa atattaactt    57540
ccaaatttgg atttcagtgc tcacttgcaa agtgatggaa tggagttttc aaaatgaact    57600
cttaaataaa ttatagcact ctgtggatat gtgtctctct ttccaagaag gaagtccttt    57660
ttaattagtc gcatgctaaa gttagtttgg ctaagtaaat gttttcctag ggttgggaga    57720
tttctataat ttcagtttcc cttttgtttg cagatcaagt agtttaaatg acccagtaaa    57780
taatttggag tcaccacagt taactcacca accttgaaaa tccctgaacc aagaggcccc    57840
ttgatactgt aagggagggc taccataatt aatagcataa gtctaaccag ggtaccatac    57900
ctttccctat attgctggat attctgtaag tttggctttc ccaaattagg acacagagat    57960
aaggataaac tcactttcca gctatttcgt tatgcctttt ttatttcttt caacttttgg    58020
aaatgacctt atgaatttcc tcttattatg aaatatatct ttattgaaaa ctggagtcca    58080
aacattacaa aaaatacata gcataggaag tgaaatgaaa tactgcataa ccaatgtaaa    58140
tgattaggtg actcctcttt cagattacat tcctgagcat tttctaacaa attatcaata    58200
tttttatttt aatgaatata gaatcacacc ctacttattc ttttgtaatt tgcttttccc    58260
atgtaataat atggcctgca ggctgtaatg atagacttgt tttttgcaga acaatccatt    58320
agccaagggc aactagaaaa gccagacaaa atattcgatt gatttggttt gaaggcgtga    58380
gagagctacc atgtctgcaa ggacttgagg ggctaagatt tttgagaaaa gggaagtaca    58440
aggagtgtgc tcgacattca gtctgctttc ttctcaaggt ctttagctga ttcacaagta    58500
gtggctgaga gcagagaagc tgagctaagc ttctggtagt cttatcatac tgaagggaaa    58560
aattagaatt cagagcccta aaaggaaaag agtccgtgat aagcatccca aggtttttgt    58620
tgacgtccac caagggctat accctagaac ataggagtga accagaaata gaccaaccct    58680
cacaaagaac aaagtctagc tttgattaaa cattatccgt gattggatta ggtgatctgc    58740
ctctatgcta acagtttact aaaaataaaa atgaatcttc cttgaaagaa aataaaatta    58800
ccaagaggct caaattatct taatcttata tacacatctg gcatctaatt tcaaactacc    58860
agtcatttaa ggagacaaga ccacatgact gaagaaatag atgagagggg cggaccctaa    58920
gagtgtcggg atattggagt tgctagacat tgactttaaa ataactgtga ttacatggtc    58980
attctccact cacattactc aagagatact tagtacatgg acttagcaca tgagctgtgt    59040
atgtaatagt ccctcaacaa atatttaatg atatgaactg ataatccaaa ataatggtac    59100
taatatattt gcaattttaa cctaagtaat atatgggcaa ttggggtttc tgaacaccct    59160
attaagtctt actgtctgag ggctccatta aatcacctca ggttccttga gatgatttaa    59220
tggagcccac agacactaaa ttacatggag aaagtcactc ttttctattt tttttaagag    59280
aaggttctca ctctgttgtc caggctgtag tgcagtagtg caatcatagc tcactgcagc    59340
ctcaaactcc tgggctcaag tgatcctcct gcctcagcct cttgagtagc tgggactaca    59400
ggcatgcatc atcatatcta actaagtttc taacaaaaat tttgtaaaga cagggtctca    59460
ctatgttgcc caagctagtc ttaaactcct ggcctcaagt gatcctctta cctcccaaag    59520
tgctagaatt ataggtgtga gatacctggc cccttttctg tttcctttta gtccttctga    59580
ttatgccata gagggagtct cagcttggtg ctgacgtgtc ttttatacca tcctaatgct    59640
atttgatttt tttttttttt aacagagaaa gatctcaagc ttctcagtca atgtcttggt    59700
atctctactc tggtgttctt aaggaaaatg ctatgggctc ctttggacat ctggtaaagt    59760
ctatgaaccc tatatcaaaa taatgcttgt aaattcttac aataaaatac ctagtattac    59820
aaagtaaaga atatgttgaa atacagttcc atccaccatc cttttgccac tacagtttgt    59880
gattgttgta tttattttca tggttacttt ctacttatgg aaagtgcaat tggtttctgt    59940
ttatagtcat gacatacaat ttgcatttta aatacatttg tttaaattaa agagggaaga    60000
tgaattaagg aaataagtaa aagtaggaaa tatgacaaag ctaaaagtgg tgtgctgtga    60060
ttgagtgacg aatgcagact taacccaaga gatgacttta ttaatgggaa tttcaggcac    60120
cctttcacat tggggactgt actaaaccag gcttgacaca agcctcactt gtccatcagt    60180
caatgtccat tgattgagca gccccaccaa gtaccagaca ctgttccagg tgtgagggca    60240
gggcattgag caaggcaatt tattctcaag gtgtttacat tgtagggaaa ggatatagac    60300
aagaggcagg ccaaaacatt caattaaaag gtaacttcag atactgattt ttgtcctgaa    60360
gggcaaaagg gtgactagca gggtgactag agagggagtg acttggggta ggtgtaggac    60420
agtagcagtg gggtttgtgg cttggcccag ggctgcatta gaaaaagacc aggctcccac    60480
tgcagcagtg cccggaaaaa tgcagagacg agccaggatt tctggatcat taccatgagg    60540
aagggaataa atgtgtgttc tctttcagtt gctcctcttg acacctgggt aaatggctgt    60600
ttacacaggc agatcaccca gccgctccct caaaggtaaa cagctgcttt ctgcctcccc    60660
tgctagcaca gattggggcc ctgaaacagt gtgtacccag gcaaaagagg aggtattctc    60720
catttaggtt tccattcatt cattcaggca agatttcttg agtgcctcct aaaatgcagg    60780
caccaaggta ggtactggga acacagtaag gaacaataaa gaggtccctc ctcccccacc    60840
tctctctcct ctccacttag aatccaagct agaggtgtgc ctcagagtct caggccactc    60900
ctctcatgat acagatggaa atatcagaat cagaagaggc aaagtgactt gcccaagacc    60960
cggagctagc ccacttcaag caagtcaggt ctcaaaacgg tgccagctgc tttcattgcc    61020
tactacctga cttgctcaat cttggtcagt atttggattg gcacttttta gtgtattctc    61080
cattactaga ctattatggc ttagggaagg agaaaccaga ggtccatcct acaagcacac    61140
tgaaatgtaa tccaattcta agtccccgta ttacaacatg gactattgtg actgaccaca    61200
tttgccttat atttaccttc ttccgcaggg atatgcccga tttcagtttc ccatgttgaa    61260
atagcctaca gttgagacaa acatacatta catttaagca taccttccat tttttataag    61320
gtactatatt  tttaattgtttcaatcactg tgaaattaac aaatgttcat gagcacccac    61380
tgtgggagct cacagtgtgg gagttccgcc ctggtggagg tactgggatt taatgataaa    61440
ccaaagacaa atatatgctc aatctggtct ctgccctcat atctagtctg ggaggtaagc    61500
atttgtcaaa taatcgcaca tatatgattg tgtatgtatg tataaaacta aacgctgtca    61560
gttgtttaat ttaaaaaggt caaaaagaag tttgctttga agaatgagat caaggaataa    61620
aaattagtca gttaaaaaaa attacatata taaacataaa tttaccacca taatagatac    61680
ttgttttagt gcaggtcctc cgtgatgcac actaagacag gaataaacag gtaagggatt    61740
tattggggaa aatgcctgtg agtgaaaatt ggaggtcaag cacgatggct catgcatata    61800
atcccagcac tttgggaggc cgaggtaggt aggctgcttg agcccaggag ttcaaaatga    61860
gcctgggaaa cacagcaaaa ccccatctct acaaaaaaac atacaaaaat tagccagcta    61920
tggtgccgca tgcctgtcat cccacctact gggaggctga ggtgggagaa tcacttgagc    61980
cagggagttc caggctacag tgagtcttga tcacgccact gtgctccagc ctgggcaaca    62040
gaccgagacc gtgtctcaaa aaaataaata aataaaataa aataaatgaa aagaaaaagt    62100
aaaagaaaat ggtgggggag gctggagaag gccaggaaag ccatcagact gggaagtagt    62160
tctgtgaaga ggagagagga ggatggatgg tcttagattc agtgtcatcc taaggaagtt    62220
ctggcaaggc cacatttgcc catcagaaga gtcccccttt ctcaaggatg gaactggctt    62280
agttttcctg ctgggcttag ctacaagctg ggaacagcca ttgggaagtg tggtctctgc    62340
agacatgtgg tgatggattt ggagtacagc agctggggct gtccatcagt aagggatcta    62400
agaattacat gctcatggcc actgcaatgc taaaatagag caaaacacaa taaaaacaag    62460
ataaattaga gggacatgat ctggtctggg acaaggaaga ttgtttcaga aaatagtctc    62520
tgtcttacat tcacaaggga aaagagcaat gttccagaaa gagtggcgag tgcaaaggcc    62580
ctgtggcaga aggcagcatg ggatgttcaa gaaactgaaa gaaggccaga gcagcctaat    62640
ggaaataata taggagagag tggaatggga ggctgagagg tgagcattgc tggggacccc    62700
tacaaggcct ttaaggagag gacattgttt taaacacaca tctaaaactc actacttaca    62760
tgacagacat agggcagagg gtggagtact aggcgtgtgc ctgggtttcc aggtggctga    62820
actgtagcat gactggcggg actgaaggag tggagaggct aaggtcttga tgtcacctac    62880
ttttgttagg attagaacag gggtcacaaa ctgttggacc ccatggcaaa tgtaattttc    62940
tttttcaatt ttttattttt tgagacagtc tcactctgtc acacaggcta gagtgcagtg    63000
gcatgatctc agctcgcggc agcctcaaac tccctggctc aagccatgct cccccacctc    63060
agcctcctga gtagctggga ctacaggcac atgccactcc acccggctaa ttttttttct    63120
ttttcttttt tgtagagatg gggtctcacc ttgttgttca ggttgatctc gaattcttgg    63180
gctcaagcag tcctcccatc taggcttccc aaaatgctgg gattacagac atgagccact    63240
gcacccagcc acaaagataa cctaaagatg tgtttacttt gacccaggca gtagtttaaa    63300
aaagttttaa tttgttgttc acatttaaaa actggacaat ttctacataa aaatctgaat    63360
tactcatgtc tcttaaaaaa ataacatcta gcaatggtag gcccacattc cttcctgaaa    63420
ataattagct gggaaagagt agggactgac ccctttagac acggtataaa tagcatggga    63480
gttgatcagt aaatatttgc tgaatgaaag aatacatgaa tgaaaagtca gagccctata    63540
ggtcagcatg gacggcggta aaggaacctg gctgagcctg aaagagaatg tgatctaaga    63600
ttaaatccag gatatgctgg taaatgttta acagccaact ctttggggag gaaaaaagtc    63660
ccaatttgta gtgtttgccg attattgtga tgtaaatact cccatcatga ccaatttcaa    63720
gctaccaaca tgctgacact gaacttggag ttggaaggag atgaacaggc ataatcaggt    63780
ctcgtgagat ggcccaagcc ggccccagca ctccactgtt atatatgagg ctagaattac    63840
tacataactg gaatagcaac tttctggacc atatgcctgg aacacagcag gtgctgaata    63900
aatgtttgtt gatccaggaa ctgactgtgt tgaagcccac agatgggaaa tcagtagaag    63960
gcaggtaaga gtaaaaagaa gggcagagaa ttgggggtac agacccctga accataagtc    64020
agaggaatgt tgtacatgtt ttcagatccc tcactggtca aatgaaggca aagggttaga    64080
tctctccaaa tctttagagg gacatgatgt aactccatta agtaactcag tgattttcaa    64140
cattaaaaag tgtaattatc ttttcaaact aaatattaca aataaattct gataaaagga    64200
aatgtacgtc tgttgagacc cctgatccta taactggttt agtattccct gaagccactt    64260
gtagtagcct attcacatgg ggactcccca gtgaacattt cctcatatcc acactcttgt    64320
gaaggtcctt caccttgaat ctggactggg cctatggcct gatttgatgc atagaatgca    64380
cagatgagaa taggtgggtt tctggcataa gctcaaagaa ggcacagtgg cttccagagc    64440
cctgagctac tagtaagaaa gtccagctac cctgctggga aggccatgga gagaggccat    64500
ggggagctca tagagaaaga gagggaccct gagactacat ggagctagga agaacaacac    64560
ccagccatcc cagtgtccca gctgagcccc actccaaacc catctgccaa ctgagcacat    64620
ctacaagagt aaccactgac aggccagcac aagcccagcc aagtccagtt caaattgcag    64680
attgtaagca aataaagcag ttgatgtttt aaggttttta gatgatctta gagtttagat    64740
tatgttaagt atgtgagatc cctaaatagc catcaataaa aaaattgatc agtacaatgg    64800
agaactgcac aactattaaa agaagaaggc aaatccatgt ttaccgacat gaaagaaaat    64860
caccaagatt taccctaaca tgacaaagca agattcagaa gaatctgtag ggtatagtac    64920
gggatttgcc attgcatgaa aaagggaagg taagtatttg tgcatgcgtg catgtgcatt    64980
tgtgtgtgtg tgtgtgtgtg tgtgactata aatttgtaaa tgcatagaag atttctggaa    65040
agatacataa gacattagaa cagactggaa gacttgaaga agaggggaga ttgtgtatcc    65100
ttttgtacat attttcattg tgtatccttt tgtacatatt tttaccttat ttgcaggtat    65160
cacttattca aatcatagaa ataacatttt aacaaaaaag tgaggcctgc ttatataatg    65220
ttgaagacaa ctagctacca cactatggga acacactatt atattaaact tgatgattcg    65280
agttttgcct aaattttact cagaatcgaa tacaagaata gaggaaagaa tttaaaaccc    65340
atctggctaa tgcataccct tgccaactat tctattagaa aggaagatgg cagtggggag    65400
ggggttctta caatggaaaa ggtattggct tccctagtgc ctgaggtcgg gttctccaag    65460
aagcaaattc agagtgaagg attttaatga gagtaatcta tgtgggaagt ggtcccaaga    65520
agcaccaaaa cagaagtggg gaaaggacac agagaaggaa aggaagtcac tgaagggact    65580
gtgagttacc tttgtgggca actggggttt cgtcccactg gggacctctg ggagacactg    65640
taggacatgt ttcagggtgt cccatcctaa gtgggaggaa tctggagaat ttatactctg    65700
ctcccagggg catcaattct ccagtgtttc cagtcagctc tgcttgctgg ctgagatacc    65760
agagcaagtg ctggtctggg gaagttgtca gcgtgtagag gaggtgagta ctgagcagat    65820
acaggcaggg cactgtcagt gcatttgctt acctagacag caaagccaga gacaaaagct    65880
cgtgtgctta tgtggcagga gagagagagc gaaccatgca gggaagtgca ttactttatg    65940
attttttttt tttttgagat ggagttttgc tcttgttgac caggctggag tgcagtggtg    66000
ctatatcagt tcactgcaac gtctccctcc cagtttcaag caattctcct gccctcagcc    66060
tcccaggtag ctgggattac aggcgctcat caccaagcct ggctattttt tttttttttg    66120
tattttttag tggagatgga gttttgccat gttggccagg ctggtctcaa actcctgacc    66180
tcaggtgatc cacctgcctc agcctcccaa agtgctggga ttacaggcgt gagccaccgt    66240
gcccagccaa caagttgatt ttttagtttt atcagatgtt ttctaggaga ccataggaag    66300
ctactttgtc tacacattac gcctctgtaa aagaggaagg aagaaatttc caggggactt    66360
cggctcctct gcacttctgc attgtccatg taaaggtgct tattgagtat ggattgtggt    66420
gtcttgcacc ttggtggcag caggaaagtc ccggggcagg aagtgagtgg tacataatgc    66480
aggagagggg agaggaggtg cctgataacc ctgagagtct gggagctgct gccccagtga    66540
gctcctccat ctgtaacact ggcggaaact gtagtaagca ggctttacaa cagtgggaaa    66600
catgcatgcc gatgtcaggg cctcccatcc aaaagcaagg ccaggatgga tccagggtgg    66660
tgaataaatg aaacctaatc cagaacctaa caaaggagac tgcgccaagg ctaagaggag    66720
tgccctgaca gttcacagca tcttagagca cattgcacca cattatgcta tttcaccaag    66780
gagaaaattc ataaacattt ttaaaagtag attctcaaga ctagacatta ttttaatatt    66840
gcttattgat gattataagg taaagaatgt tggtgagcag gtagaaaaga aaggtaatta    66900
ctaggaccta attctggttc tccagaaata gatcatagtg taccaacaaa tttccatttt    66960
tgatagaatt actttgctga tatacattga tctaagcatt gcttctggcc atgtcactga    67020
taatattttt ctggacaaca tgccaaaaca caggtggaat gactgtacag tcaaaaatat    67080
tttttgacta tacagcagat ttcaatcaac tatactcagc tctctagaga tatgccacag    67140
gtgcttgttt ttactcttgt gtttattgta ttcgatattc tttcctcaat gatttggaag    67200
aagatgtagc aggcatactc accacattta tggaaggaat cattggcatg tttgatggca    67260
gaatcaggat tcaaattgta ctgacaggtc aggatgttag gtcaacacca accatatgca    67320
atttaagagt aatagaatct gtatttaaca ttaaaaagtc agttgtgttg gcacaggatt    67380
ggggagttgg attgacagca attgagttgg aaaagacctg tgggttttaa ttaacccaaa    67440
gttcaataag atccaacaat gaaacagctt attttttaaa gcaattttag gctgcagtaa    67500
taaaagcctt attctcagct gaagagcagt gatgatccta atagattctg tgaggctaca    67560
tctggagtat tgtgtactca gttctgggtg aaagagtgag caattacata caggagggat    67620
ttcaaatgca tgtcacacaa ggactggtta tcagcaccgg ggataaatgc gaacaaaatg    67680
ataatatttt acaggaataa tagtgacctc catctatttg atgagtattc aggtgtaaaa    67740
gggagtaaac ctattctttt tgctctatgc tttagtcagc tatggtcaca ttaataccat    67800
gttggcttgt aataacatct atttatctct tatgcattca cagataagct ggagtttgtc    67860
tgatctaatg taggcttggc tgggcttggc tccaggccat gattgtggtt caggtttgct    67920
gcatgtgttt ctttttcttt gggaatcagt aggtgcccct gggaatattt ttcttacagt    67980
gatagaagag gcacacgagg gtgcatgcat taaaagcctc tgctgatatc atgtctgcca    68040
atatccattg cccaagttaa gccatcccaa atttaagggg cttcagccac tgtgaggcca    68100
tgggaaggga actgcatgta ttcctattat ggagtagtgg aacaaataat ttaatttatt    68160
ccactccaga ctagcaggtc aaaatgaggg tcagtggtct gaagctatag gaagatagat    68220
tttggtaata aaaaactgga tgatcgttgg aactgtccaa agatggatgc aaacaactga    68280
agtctttgtc ccagaaggga ttagacagag ttcaatgggt catttcccaa gagcatccca    68340
gatggaattc cggtgtcatt tggaaagtta gagactgagc cagttagtat ctttcctact    68400
ccaacatcct caaattccat agtcctgttc tatcccatac tcttcctctt gactctgaca    68460
tcctgaggct tttactctct gtgccattcc ttggggaacc taattatata tggcttcttt    68520
gtgtctctaa gagattccat gagtatttct tgtcttccta attgctttgg aagcatttca    68580
gtgtgcaggc tgagtcttaa gtttctctta aattgcctat agctattagc tcagtgtcag    68640
gcaccaagcc cttagcatgg cattaaatca tcacccaaca cccagtgcag cctcaaacca    68700
tctttgcagc ctctctccta cctttcccat cttattatcc agccgaattg agatacctgt    68760
ccttcccgat acacagcccc tgcttttcaa gtctttgctc acttatagac cattatcctc    68820
ccttgtctag accccatcca tcccactcag tgcaaaccaa gtgctacctt ttccaagatg    68880
ttttcactga tgctccaacc aaaaagaagt ttctctacct cttctgggtg gtcttaacac    68940
ttctcatggt attcgagatg tttgtggtat agaaaagtga ttctccactc taactatcca    69000
tgatgacttg agaatactta aatcatacac gcccaggtcc catcccaaga tagtctcata    69060
ttattgatct ggaaacagaa actccaagta atagcagtgt cagcaataaa gcaggaactc    69120
acatagcaaa gtgtatggaa ataagttatt ccagggttgg tatggcagtt taatgatgcc    69180
accaagaacc taggctcttt cttcctgatc tgccattccc aatatatcag caatgtcttt    69240
cctcatggtt gcaaaacagc tgctatggct ccaagcatca catcctcaca ccagcatacc    69300
aggaaggaac aaagcaagca taggaaaagt gttcttctca catatctctc ttgctcgaga    69360
aagagaacca agaagtttcc tgcaaggaac aaagcaagca taggaaaagt gttcttctca    69420
catatctctc ttgctcgaga aagagaacca ggaagtttcc tgcagacatt tcctcacacc    69480
tcattggctg gaactgggtc acatgcacat ccttgaacta tcattggcaa agggaaatgg    69540
gtcatcaaaa ttgcttaagg ccaagcagga gccattgttg gggttaaact gtcctgaaca    69600
aaatctaggc tctgaatgat aggcaagaaa gaagagggga tggccacaac ttcctttaca    69660
cggtgaataa caagagcagc ttaagtaagt agatgcccct atggggcagt aatcttgctg    69720
tgggcagaaa catgtccatg cacacagaag ctttaggaat cttcagagag gttccatagt    69780
cacttgtgaa ccactgaagc ctctttctcc aagccattgt cttgaatgct gtttttaact    69840
gattacaatg catgcagctc ccgtgcccca cttattttag cttttgagga tgttcatttc    69900
cccggaatct ccaaatataa atcaggtttt cacagaaaac cacagagccc tcacaggtgt    69960
ggaaatcatc taaagatatg ctaatgattt gggtttctag aaaaatgtat atctatgaag    70020
gaggcaggga ttaagcacag ctagtatgta tgattttttc ttttcctttc atcacctgta    70080
ataaggcagg atggagactg aatgtatcag acaaaacagg gatcaaatac tagtttcaac    70140
atttgctgcc tgtttgacct tgggcaaatt ctttaacctc tctgagcctt ggtgccttgt    70200
tctcctcatg cataaaatga accctcctgc agggatgata tgtagaccaa cactgataat    70260
aatgacagta ataccagtta ccctgtcatg ggtgtccatt ccatgacagg cctgactcta    70320
ggcattttat acacattctc ttcttttttt tttttttgag acatggtctt gctttgttgc    70380
ttaggctgga gtggagtggt gcaattgcag ctcactgtag cctcaaactc ctgggctcaa    70440
gtgatcctac catctcagcc tcctgtctga atagctggga ctacaaattt cagctaattt    70500
tttttttcat ttttttgtag aggctgaggt tttgctatat tgcccaggct ggttctcaaa    70560
cttctagcct caagtgatcc tcctgctttg gcctcccaaa ttacaggcat gagccactgc    70620
acctggccac gtcatcgtca caaaaaatgc aatgagttag gggcttgtgt tgctcccaac    70680
gtttagagta ttgaagggac cagcccaaag tcacaaagct aatgggcaag ggttgaatcc    70740
atatgtctga ctccaaagcc agttctgcag catattaatt gcatatttct tggtttcttt    70800
ttttttcctc caattatttg gtgctatgcc aaaatcatca gaattgttcc tgtaggcatt    70860
ccttttctta attacatatt gcattgttct ctttctcact ttcccttgtt tgatccaagg    70920
taaattttta gtctttttaa aaatgctcat acattataaa tccttgctaa tatacagttc    70980
tttcagactg tcctgccttg cttgaggaag cagatgtggg tcagggagaa agaaggaccg    71040
atgaactcaa atagcctttt cacttttatt ctctcttttc acttcaaaat gctgtgtcat    71100
cagtgaatcc cctcctcata atctcttctt tcctggagaa taccagccta gtttcacttc    71160
ccttgtaaaa tatccacaga tctttgtgcc ccaatcactt tggctgtatt gcactgggcc    71220
ttgctaatgg cacaatatcc ttttcataat aaggtatccc acatgacaca gtagactttt    71280
gtacctggcc agaatcacta cattcatcgc agataccatg tgctgtctat tggataccct    71340
cattttctct tttcaggaag ggctggtgtc agctttcctc ctgcctctta tgaaccagga    71400
aatttttctc cctgtatctt ggggctgctg ttttccagcc tctgccaagt ttccattttt    71460
gtgggacatc agttgaccgg catacccgta ccctggacgg ggacttgggt taactgaggg    71520
ttggcattct ccccaaagcc tgttctgcat atatttttga aaacctattg gttttctgcc    71580
taccttcttt cctccatgag tagacttcaa tgaacacatc actctctttc ttcggtaatt    71640
acctggtctc acctgctcat cataaaagag ctattcttat tgttagggct gacagattca    71700
ctttgcaggt gatttaatct gcatctgtag tgtccacaga acatattcta gaagttaaaa    71760
gtacataata taatgaaaac cctgatgcaa cttttgcttg aaatatgagt atagcaaaga    71820
catttgagag aagagcctga aaataggtta atagtagttt aattgtatct aataagagct    71880
accattgatt aagcctataa taatactagt aactccccta aatatgctct acacattact    71940
tcatttaatc tacataataa cactcagagg aatgtattac catcccagat ttacagagta    72000
aatgtattac catcccagat tcacagagaa aattaaggct aagaatgtta ggtaattggc    72060
cgagtagcct gcagctagta agtatcagag aacggatttg aacccaggcc ttggctggtt    72120
tccaagtcca caagcttagc tgctgctacc cagcttcact gatttttgtt ccgtgcactg    72180
cctctaggat gtttccgtat ttgccttctg gttaatattt actccctcct ccctagcaca    72240
ccacattaag ggtgtggcat gggcttttca cttcctgaat gtttgttact cagtttcaac    72300
cagctttact ctctttcaaa gtgacataaa agtgacagcc ctttaagctc acagaaaaac    72360
aggagctgat tccagtacgc gattgactac catgcaagat tttgtctttc cttttatatt    72420
gttgaagatt ccttgatggc aacatggccc acacattatc taacctccag acaatcccag    72480
aggatctgca ggaaaccacc aagcacccca gaggggtcac tggcaacaaa tggattaagg    72540
aaatggcctg atttatggga ttattggggg tcggggtgga gaattataga caattttgtt    72600
tctactgcag aatcagcatg atagagtgaa tatggacttt ggagtcaggc ccaggcctgt    72660
aggatgacct gggaagcagt ctaggcagct ttggcccact tcagcttgta agatagagat    72720
aatacatcat cctagaaata tcgcatggat tatcagattt tgtatataaa gtccccagca    72780
gacacctggc acacagtaag tgctcccaaa accaaagcaa cagttcttag aagcttagct    72840
tggctcaggc tgaagtctca aatgatctag ggttcactct ccagccattt ctaagccatt    72900
gagtgaaact ggacatgtta gttctggtgt tgacttcagt atcctaagtt gggaaataga    72960
actcatcatt ccactcctcc ttttaagtat tttgataaga ataaccgaga agtccatgta    73020
gcattttgaa aatataaaat actattagat tggttttgtt ttgttttcat aggaaagaga    73080
aaggaagaag gaagggagag gagaaaaaga gaaaagaatt caggactgat attttcaaat    73140
ttccaaagtg agcaagattg gtgtttggta ctctttgatc tctccttttc ttaaaaaaaa    73200
gggggatgag tgtgttagag tcctacccca tctagaatta gagagagagg gaaacagaga    73260
ggtaaaaata tccttcctat tatccctcaa attttgccac agagaaaaca actcactctg    73320
cttttgtatc aatgacctta ctgcctcagt gtcctcatct gtcgaaatgt gtttaggaat    73380
agttgccctg cacacctgtc caaggtgtta gaagagccag atagataaga caatggggaa    73440
acttattttg aaaatcaagt agtattaaaa tcaaggtgga gagaaggaac accaggccaa    73500
gagtgagcaa atctgcattt gaacctgggc ttggatgatc agcagctttg tgactttggg    73560
caagtcattt cacctctcca cactgcaggt tcctcatctt gcaatgtgga aagcagaacc    73620
tctccgggtt ggaggatcct gtgggatccc acgtgagtca gcaccttgaa attgcacata    73680
cagggcacat catttctacc atcacctaag gtcaatccca ggttattgct ggccttttgg    73740
tttgctatgt tttccacctt tctcacaaat taaaaatgca gacatgtaaa ttctctatct    73800
atgtgcactt caggaacttt caagatccct ttagggttat atctttcctt agcctcttgc    73860
aaacctgaaa gcaaggtgac tgtaggacaa actgtgtggg cactggatgg ggaatgcatg    73920
cctctggtag aaggggaagc cagaattcag agccaaagaa caggcaccat gcaggactat    73980
gagtccagga tgtccaaatc tgacttctaa aggaatgcca gtgatactga ttgtttttaa    74040
tataaaatct accatttaca aaatacaggc tcaagaacaa ttgtaaacac tgcacagggc    74100
aagttttatt gtttttctta aaagagctga aaaccataat caagtgcatc tgccctttgt    74160
tgtagattgg ggcctgcaat ctagggagta gagaaaggct gcctgactgg ttagcaattg    74220
aaacacagag ctggggccat ctagtccgaa tgcagtgttc atcgttcttt gctaaacaca    74280
aggtgaccgt ggttgttgtg gttagcaagg tcacctagct tcctaggcag accttattcc    74340
accacaatgg gcttcctttg ctagaaagga catggaaaaa ggagtgacaa aagaggagaa    74400
agagctagtg aaggaaagag aggaagagag aggaaggtcc ccagttgtta ttacctaggg    74460
agtgcccagc atgcctttca gaggaacaca ggtgcctacc cctttctcct gcctgctaca    74520
gcccaccacc accaataaca actgtgcacc ctcactgttg cccccatgca tggagcagag    74580
atagagcaca gatagggaga aaagaatttt caagggtgag ttggaatagt gacttctgca    74640
agcctggtag gtttgtctct tttccggtat ccttgccact gcaccaggtg aaggggaagc    74700
agactgtaaa atactttgaa tattatcaag gttatttggg gaaaaaaaac agcaacgacc    74760
tcacctgatt gtgccaggtt tgtgatagga atctgggggg aagttgtcct caatgacctc    74820
catttcttga atgacccgtg gcccacctgc tacctctgag atgagtcagg ggacacaact    74880
ttcttgattt ccatcatcat ttgcctgcta ctgctgcaga gactcaagtg gaaaatgtca    74940
cttcttgaag tcatggcttt ggtgtctggt gacagggagt agatagagtt tggacagagc    75000
cacttgtgag ctgcgtggtt taatctctct gaacttcagt gtctctagct ctaaaatggg    75060
ggtagcagcc tcaatgagca aattaaagca aaataacaaa tgtaaagcac ttatcccaag    75120
acaaggcaca tgagaagtat tcaacaaagg acagctctag ttatggtggt gatggtctct    75180
aaagcttcca gactcagatt cctaaccaga cagccatgag acatggtccc cacagtggca    75240
aaagggtagg ctccaggctg cctaagttta aatatcctga ctctaccact tcagcaaggt    75300
actaaactct gtgcttcttg cctcatctgt aagatggaga tacctcattg ggctgttggg    75360
aagattgaca ggggtcaccc ttataatgtg ctcagcacaa tgcttggacc aggatggatg    75420
ctgcttgggt gatgttatca tccaggtggg cactgtggaa cacagactga tacttaagtt    75480
cagcacttgc ctcatggagc ttacagtcca gatagaatag gtgcacatga gatttttctc    75540
agcaaagttg tagtcagtgc tgcccgtgcc acccatctgg tctcagcatt gctgctcatg    75600
tgcactgtcg tgacccatct ttctgctgct gaccttaaga aaccttgcct taaggtatgc    75660
tttggggaaa ccaaattatg acagatataa actgaagtgc caagacgaat ctttcaaagt    75720
gctgtgatgt ccagatacgt ggcaagtgcc aggaatttgt gtttgggccc actgggagag    75780
aggtcctttt ccccggcttc ccgcagtgga aagctgctgt atgtctgata cctgtgctcc    75840
aaatctaccc tcgagttctt atttggcaac aggcttgctt agcaatgtcc ctggggtcag    75900
ggagccacgg gtgggctgat gcaagaaact gcagttgtgt ctctaggctg cgacagcatc    75960
acagctgtga gcttctcaat ttaaactcaa catctgggca caagaggaag caccctccat    76020
ccaggcaagt tgaagttttc tttcctgtat ctttaacaga ggttaaaatg taaacacaaa    76080
acaaagcaaa acccaactta actctctggg tcctgtttct gttaaaaaca ttttttaaaa    76140
aataataata attagaacaa tagacccagc tgagagaagt ctgtctcata ataacaagag    76200
agactaaaac acgctctccc acaaacagat aaggaaatag tgagctaaaa agtaaaactt    76260
aagagtgcta cttctcaact cagtaattga ttcatgaata agctctagcc caattttcta    76320
tgaaaaataa caacatagag aaaagaaaag ccactcagat gcagctatgt cacccaagtg    76380
ttcactggag aaatttaata tgtgtcagag aaaaatctgc cttctccaaa acattgcccc    76440
ctccaaaaaa aatgcttctc gttgtgggat tttttcctcc acactgacag agagtttgaa    76500
agtaaagcag ccgactagag tgtgggtgcc cacgccttag aacaaagaga ttaaagaata    76560
ggcttttctt caaataaatt cgattttttt gcaacaaatt cagggcctgg acagtttaat    76620
gaagaataaa aaatgctcag acccctctct ttcagctttt ccaaacaaac acagtcattt    76680
ccaaccactc acaggtgttt ttcttcccaa aacaaacaca gaaacaaata tttacagagt    76740
tatgaaaatt caatagaagt cacaggggca caaatttcct cacctgcatc caagatctct    76800
ggcctgggat tatcaaacag aacgtcacac ctactttcca ttacgggaca ggaaatcttt    76860
gagccaaaga gaatcagtct gcagaatgtg ttcgtaagga taaaggcctc atcttttcaa    76920
gaaagtgttt gcagctccaa ggaagaatgg actttggaca aaggaaacac cagtgacttt    76980
ttcctcatct gcccatacgt gcagaaatgc ccttgaagag ctcatgactg ccttgcgaat    77040
taatccctat gttgaccaac aacacaaaga gtggtgctga ctaccacact gaccaccagg    77100
aataatttcc tacttaggtg tttgcgggaa aggctgttgt ttgcttttct caaatgtccc    77160
ggatgtgaac aggtctcaaa attaggaaat gcagctggga atggctgcta tcaacaaccc    77220
ttatttcatc ttttttcttt cttcaataga gctagagaag caggcaagaa aagaaaataa    77280
tgcaattatg aaaggaggga ggaaagacag agggaaggca gcggggcaga agggaagcgg    77340
aaaaaagatg ggagagaaag gaagaaaggg agggcagaat ggggacaaaa gatggcaggg    77400
agggagcgag ggaggaagga gcagaaagga gagggaagaa gaaaggaagg aaggagagag    77460
gcagagagag agacaaaaag aaagaatgag agagaaacct gctgttgtca gaacctgact    77520
ggtttacgct gaggaaccag atagcctctc agtgaaaagc tgagattaag ctcacaacat    77580
aatttccatt atgttaatgt tgctttaaaa tatattgcac agagtgctgc aacaatcaaa    77640
ttatcaatta taatgtctac tcagagtaga aaagtgttgc aaacagaggg ctgattactg    77700
cttcagtaca tccaatctgc atactcattg ttcagtacag ggaaaacaaa ttatcttgtg    77760
ttggccccag ttcaaattta attaaatgag tgcaaagcaa ttataataaa gtacaatagt    77820
gtagtaatga aaggaaaata actcattaac ctattaatct ttatttatgt tcctctcaaa    77880
taactatgta atttctttat caccgcatcc cataagaaaa agtagggtct cgctgctcat    77940
ggcctggttt aacaggttct atttggttaa gatgcctttg tgggcaccat ttatactcac    78000
tttgcttagc tttggggcca cgcacccccc agctgtctgt catgctccct gcccacacgt    78060
atgcgtacct gatctagatt tagcgctcct ctcccacttt tccctgacac ttgtcagtta    78120
cagaaggtaa atctctctgg aagtgagaag tgcttaccac agcatatggg aaagaggcat    78180
cttccagcat ctggtatgta aggcaatgca aaaaagggga gaggacagaa tcacttctgg    78240
tttagagaga gcccagtgct tgacagctga agagattcca ctaaaagcta acactccact    78300
gtgctttcca gttaataaag ctttttacat gtatgatttc actgaggcct cctgataaca    78360
ctgtgagggt gcctgatgta cagatgagga aacagaatga tggagtagaa aagtatggtg    78420
tccaagcctt gctactcatg agtagcagat ccaggattct aatttaggtc tacagcccct    78480
aaatcttcat ttcattcccc tagaaccttg ctactcaaag tgtggtccag ggaccaggag    78540
cattggcgcc acctggaagc tcattggaat cttgggcctc accctagacc tgcagaataa    78600
gactccacat tttataagat cctctagtga ttctcacaca ctgaagttta agaagcactg    78660
gaactattgg atagtacact gccttttgag agaatggtga ctcaggcaaa tctcccagca    78720
actacttggt taagcatttc cttgcaattt gcaacacctt gagatgacct tgagatgatc    78780
ttgggtgatc aaggttgatt ctggcttcca ttttcatgtt atctgaagac agggctggaa    78840
gtagaggaca tagtaaaagc agaaatgatt tctctttctg gatccacagc agacccgaaa    78900
atcttcccct ttttcttcca aagagaattt gtgaaataga gagaaaggag aggggagaaa    78960
ctgatgaatt aaggaaggaa acagacactc gttaagtttc taccctgttc ttggaggttt    79020
tccatgtatt ccttcattta atcttcacaa caagcacctt tttaagataa ggtgactgac    79080
gacaggttta agtgatatgc ccaaggtcac ccacactgct gggtaacaga aatggtattt    79140
ggcttggatt caaagtttac actttcactg tactctattt tctcttaaaa aaaaaaaagg    79200
aaaagggaag gaaatcaaga tgaaataaaa gggtggtgtg gtagtcatta gtgctgttca    79260
ccaagaatct ccagttttta gtctctgagg tatgtgaagg attatacttc ctgccctgct    79320
tagaagtagg tgggagccat gtaaataggt ttggccaatg aattggcagc agcggtttca    79380
tgtttcattt tcagatcaaa tatttaattg cttgtggaca ccttacagag ctatctctct    79440
ttcctctgcc atgaaaattg ccaatattca agatggtggt tgcatcataa acctgtatcc    79500
atagtgagtg aatatgctca ccagagaccc ccaccaacct atgatagaca cataatgaga    79560
gtgataaaag caataaacct ttgtgttatt ttgagcccct gaagtgtgat ggttgcttgc    79620
tactgtagca tcactgagcc catccccact cttccagatg ctaggaagac gtgtgaaggg    79680
aaacagttaa catttctaca ctgcaacttt ttcacttgag actcacagca ttcctatgag    79740
aaaggtaagg aatggctatt atttattatg tatttataaa ttactattta cagataattt    79800
aacactgaca tagcagttta agtgtcctgc ccaagatcac aaagtttata agtggaaggg    79860
ctaggtttgg agcacaaggc ttgtaatgac tgatctttct tcaatgcaga acacttcctc    79920
caaaaaagga ctggagcacc attacctgcc cttgggtata ctcagattgg tatatctagc    79980
tttgtactca cactcctctt cccccaccac tcaggaggaa tccaagttat tgggcaaaaa    80040
tcaggccaag gaaaaacaag tacatgcagt tgccagcaga tgacgacatt gggtctttgc    80100
tagagaaacc accagagaaa gttcacagtg ataaccctca atgaagtcaa ctgtaaggag    80160
cttcattgtc cagtttgagt gttttttgtt ttttgtttga gaaagggtct tactgcatcg    80220
cccaggctgg agtgcagtgg cacaatcact gctcattgca gcctcaacat cctgggctca    80280
agcgatcctc ctacctcagc ctcccaagta gttagaacca caggtgcgtg ctaccccacc    80340
cagcaaattt aatttttttt tttttttttt tagagacagg gtctccctat gttgctcaat    80400
ctcgtctcta actcctggga tcaagcgatc ttcctacgtt ggcctcccaa agtgctggga    80460
ttataggtgt gagccaccat gcctggcctg tgttcatctt tcatgtgatt gtttttgcaa    80520
gatagaaagg caaaagttag tagtagcagg attgaccttt gtaatatgat cttaaaaata    80580
ttgtctccta atttgcatat ggaagaatct caactaaata acctcctttt aaccagttca    80640
ctaaacaaac caaagttctc cctttttcct ataaaacatg cttctaatgc aggttagagg    80700
ctcttggcaa gtaggctact gtccagcatg tccaaggtcc tgctctccca tctttgagtg    80760
ctatgtttac taagagtcta ttaggttcat tcccaggctt gtttatgctc actgtatttc    80820
ttattgtcat tatgtacctt aatgtaatgt gagtcagaaa aaaacatatt tctgtgaaga    80880
ctggatagaa cgctttggaa agatttgata aaagcaagtt actaaaaaga gtgttggcag    80940
acctgtaaca aaaaattgac aaaagttatg gtctatgtgg aacctgccct cagaatgttc    81000
ttttagtttc ccaaggcttc acattctgtg ttaaagaaac aaactgaaat tcatggacaa    81060
tgcattgcga gtgtgattta tacaagaaag gcaatctaga cgtcttagca atggaatgta    81120
accatgtttt ttaaaagcct aagtcatata tcaaatgatt gtcaaaacga taacccaaaa    81180
caatgtatag gttttgtgtt aaaataaaat gaaatattta aagtatggat cgtttttaat    81240
catttctgaa ttcaagccct acctatttgt cccaattgct tctgatataa ggactttcac    81300
ataattactt ttcctgtttg ccattttccc atttcccctt ccacagacat actgtgctac    81360
ctttaagtgc gaggtctttc acatatcttt ttttatccaa ttacctcatt caacaatatt    81420
tattttaaaa aattttttaa agagatggga tctgcctatg ttgcccaggt tggtctcaaa    81480
ctcctgggtt caagcagtcc tcccaccttg gcctcccaaa gtgctgggtt acaggcatga    81540
gccaacacat ctggccctct acaaatattt cctggacaat tactatgtgc caagcactgg    81600
cctgggtcct gggcatagac caacgaactg tagagccaac agtagagaaa acagacttta    81660
aataatgaga gaatcatcat ttaataataa ctgtggtgtg cgttatggag aaattcagag    81720
ttcactctgt ttttatataa ctcagacctg ggatggattt cctacttctg aatggtaaag    81780
taagtgtctg agtagatgag ccaccagcct tcttccttgt attctatttt taatgcagtt    81840
tctttgggcc aaatgatcac cgtcatcctt accagctcca gactgtgatt ccatagtggc    81900
tggattgcct tggagcttag agcaggttat ttcagtttac tccatggata ttctctccac    81960
tcttctccac ttcatgatgg ttaatattga gtgtcaactt gattggattg aaggatgcaa    82020
attattgttc ctgggagtgt ctatgaaggt gttgccaaag gagattaaca tttgagtcag    82080
tggactgggg aaggcagact caccctcaat ctgggtgggc acaatttaat cagctgccag    82140
cgtaaccaca ataaaagcag gcaaagaacg tgaaaagact agactcgttt agtcttctgg    82200
cctacatctt tctcctgtgc tggatgcttc ctgccctcaa acatcagact ccaagttctt    82260
caattctggc ttccctgatc ctcagcttgc agacggccta ttgtgggacc tcatcctgtg    82320
accgtgagtc aacgctcgtt aataaactcc cttttatata tacatctatc ctattaattc    82380
catccctcta gagaacccta agatatctct attctgttcc ccaagaggtg gacctttatg    82440
gacccaatca actgcctccc tcaccctgtg cctccaggtg gcttggaaag caggaggcga    82500
tgaaggctgt gggttttgtt ctctatctat ctatctgcag aattgtcaag tgttggcagc    82560
ctctctcttg gcaaagccac cacccttgtc aagcagcact ctctttatag ctactctcta    82620
ggtcagggat tgtcaaacaa ggcccagact aaggggtggc aagcaaagtg ccttggaagc    82680
caaggttacc ctcggagtta tgcaaatgca gggcctgaga gtccattctt tcttaaattt    82740
tgcaccctgg acacctcact tgccttaccc ttgtcccggc cttgatgaaa acttcctttg    82800
taaaggacta gagaataaat attttaggct ttgtaggaca cacagtttct gatgcaagta    82860
ttcaattctg cttttgaaat gtgagggcag tcatagacaa tatgtaaaca aatgggcaca    82920
gctgtgtttc aataaaactt tattttcaga aacaggtaca gggccaggtt tgatccatgg    82980
gccatggttt gccaacacct gctctaagtg atacagttcc ccatggttgc ttactctggg    83040
acagcacggt cccttgtggt ttcctttaat cctgctcaca tctttgcaaa aagccccttt    83100
actaagctcc cctcgaatta tccaaattga gtgtgccatc tgtttcttgc taggacccta    83160
attgatgcac ttggctttgc atttctccaa cacaggcttt aattgcaaag taacaacaac    83220
aaaaaaaaca agaaaatgga gactacaacc aattactctg tagcagggaa gtggtggtgt    83280
ttacatgtat tcatccattc ccaaatatga tagaatattt cacaaagttg cagtacactc    83340
ttaaagttga tgggagctga aataaataag cctttttttt tcccctgggg cctgcactct    83400
caaccctgct gccctacttg tcctcttcta atggaatgga ggtctattct aattaaacaa    83460
gaaaacacat cttttcacaa agggagaacg gaggacattg tactctgttc ctcaaagaaa    83520
gcatgcttta ataagaatcc ttttataatc cctgctttta tttgtagctt cccaaagctt    83580
ttgctggtaa taaaaggatt gtaaagttga caaatataag cagggacaaa gaagtttggg    83640
gagataatgc tctagtgaat gggctagtat ttgaaagttt attgatcctg caacacctag    83700
aagatgatca cgaagagcca atgctgccat caatcagggt gatatttcta ttacaaagta    83760
aaagcccttc caggcagggc tatccatttc tcatatcatg taagaattat gctttgtgct    83820
gagaaaaata attcaggcca aaatgcaggg cttggcatct gaagatctgg attcaaatct    83880
ggcttcatag aacttctaac ctacttcttt atcatatgga agcagcaaat agagctgtaa    83940
caaatgcaat gtgttctgtt gtggggttgc agacatctgc tgtcattcca ccactatgac    84000
tatcacaagt agcatccatt actcctggaa aaagccaccc attttcactg aggttccctc    84060
actctcacac ttaaagcctc acactttcca cttctggtgg agctccatct ctgtggcaag    84120
ggtggaacat gtgaccaagc ctagaccaat taatatactg tataccttgg gcagagagat    84180
ttgtttaatt ataggcaaat gatccagtta cagccaatga gactttctag gaaagtgatt    84240
agacaggctg tcctttctca ctaggcttga atgtgagggc tggaactgct gcagccattg    84300
tggatatatg gggagcctga ggctgaagtc aacagagtag aaggatgaca ttgttcaagc    84360
cccacataga gccatgccta aagctggtat tggttgggag aaaatataga caagttttca    84420
caatttcctt tatctaaacc ctttgtaatg tgactttgca gattctccca ttgagaacat    84480
taagagatgg aaactacttc ctactccttg aatatggact gctcttgtag cttgctttga    84540
cccatgcatt ccagtggaag tgatggtgtg cacttttgct gtcagaatcc tgcaccatgc    84600
agaaaagcct aggtgaacct gctggaggat gagagacaat gtggatgaga gccaaggcat    84660
cccagccaac agccagaagt agtgttgcct agctgaccca cagctaactg cagatcaata    84720
agggagccca gttcagacca gaagaaacat ccaactgagc ccagcttaaa ttgctgactt    84780
gcagattttc tgcgaaataa acagttgttt taagctactg tatgttgagg tgatttatta    84840
ttcatcaata actgatacac atcccatccc tgaatttttc atttatatga accgataatt    84900
ttatttttga tgtagtcagt taggaatggg ttttctgtga cttgaaataa aacaattctt    84960
aacacattaa agatgtgtct ttatttcccc cactagatag catcattagg gattctgtct    85020
tatccttatc caaagcactt gccctatctg gatccaaagc tgagtgactg atcaataact    85080
acttagtgat tgactatgtc atattgacag attcacaaat cacattttga agagcaaaga    85140
atatatttgc tcttgagtct ccaatgtcat ctgtagggca attgtacttt atttggctta    85200
gagcctcaac agaaatttgg aagatacaag gtgcttctcc aaccatcaca atagctgaaa    85260
acaaatacat ctgagacatt gtatctaagg aacccaactc tgccatctcc ctcaagggaa    85320
cccagaaaaa tctgggcttt aatcctaccc tccttgctat aaaaacctga aatgatgtca    85380
tctttttctt tctaaaataa aataaaggca tgtagtgctt ctaggcaaga ggtctagatg    85440
tatctgcctt tcctgtcctc caggacacca tccacttatt gctacaactt gctgcattat    85500
tcctgcaatt tattttcttc tttttgcaca aaaaaaaaag gaagaaaaaa ctaaagcagg    85560
gattccatag aattcatcct ctactttagt aaaaaggtag aatccacctg acctattctg    85620
tatgtcagag tggaatccag cagccatttc tctccaatta ttgaaaaatt gtgtgtgtgt    85680
gtgtgtgcgt gtgtgcgtgt gtgtgtgtgt gtagagagag agagaaaaaa aaggtagata    85740
tacaccagca tttttattct taaataagag gataatcagg cttactccca cccaagtgag    85800
tttacacttt aaattcttaa atggctggtt tttttttccc tcagatctgc agacgaaggt    85860
ccaaaggaag aagattttgt tgaagactga aaagagaaat atacttggtg gacagagata    85920
actcctttca gcacagaggt caggtaaggg aatcacagac tgacatttac ccttctctct    85980
gaactctccc aggcctcaac agctcctaat ctttcctttc ttcattctcc ctcctcctca    86040
ttcacatctc tttccccaag aagactcaag aaaaagtcca agataagaaa ttccatttat    86100
aagaaaagga aggcacaggt taatttggtt tatctcctcc aacctcaaca atggatgtga    86160
gttctgacaa ttgcttgtgg ccagaaccaa tcaaactttc cttcctcatt agatgacaag    86220
gctgcagcat gaagaagatg ccatattgtg gaattgggtg tcaaggagaa gacattcgaa    86280
ggtgcatgaa cagagtgaag gtggtgcaag caagtgcaga ggaggtgggg agactggagt    86340
gctgggaaaa gggtcagcag aagctagcaa acatgaaaga cacaacacaa aacaagcagt    86400
tgtgcaaatt aggatgataa ggggggagtg gtcaaaggtg tgtttctcat ggctcaacca    86460
gtgcaaactc agtcttatga ccctacatga ctgactgcac ctggcctctg catcccttca    86520
gcctcttccc caaaaggact cctccttatt gccagccaca caagccttcc ttcatttcct    86580
ctaacaggcc agacttgttc ctggctcccg gtcttggcat tcactgtttt ttctgccata    86640
gctggctcct tcccaaacat ggaatctcag cccaaacaat atctcctctg agacaccagc    86700
cttgatcacc tttatacaat acagatctgc tcctgcccat cactttctat ctcatgaccc    86760
tacaatgtgc cccttcgtga tagctcacac cagctaaaac catcttgttt gtggattgct    86820
cacttgcccc ctgcctgtct ctagctctag gaggtcggct ccctgtcact gtctggtcta    86880
ctgtgtcgta ccacccatgc ccagcaccta gccttgcaca ttataggact taatgcaaac    86940
ttcttgactg aaagaaaaat gaagaaactc agccttggga gagaaaacaa ccattaaatg    87000
attatttaat aaaatagagt attaatctat tttatattaa ttattaattt agttcataaa    87060
atattaattg tctttacaac gaatgtgtcc ttagtcattg gtgtttgtgc tttgtgaatc    87120
ttcacatccc atggggccag taatgggggt gggggtgtag tgtgggaagt ggggcaggga    87180
accaatctgg cctgcagggg ttacctgccc catgggtgcc tgcaggcttc atgtggtttc    87240
agtggcatgg caccctgatg ggaagagtgg ctcagaattg gtggagtatg gtgataataa    87300
aaagcaaaac aacttttagt tgattattgt tttttaattc tataccgact atggcccctt    87360
cactacctgc accctgtgag gagagttttc ccacatctgt cccactccca ccctcacact    87420
ccactggttt tttccccctt cttgagtgaa cacacgcact ggaagagcag gtgtccttga    87480
agggaggacc agctccatga caggacacat gtcctcccaa acacaaacat acgcaaacac    87540
agaacaaatt agaatctatc ctggctcctg agaacacttg ctctcaggcc actaaagcac    87600
cttgataata aattgtcctg tgcctgctac ctctgtctcc acctgctcct ggcagaaatc    87660
tcttccctca ttccagccac tctctggagg gcaggcaggg ttctgtttat ccatgtccac    87720
aggccatgcc aaccaatggc tcatggcttc cccacttcca ggaaagccac atggcccagg    87780
atacaataga gtagggaatg agtaggagga gaactggtct ctttatccca gcaatatgga    87840
ccttgtgatg gaaagagacc taaagacagt cacatttact tctcatctct acccgggccc    87900
tttcacacct aacagagtat ggcaattggt acatggatag cactgagctg agtgacccat    87960
cattacttcc tgccatcgga cacttatgtt ccatcccagt agggttccct agtcacaatg    88020
aagatccagt ctctatgcta cctccatctg atttcttcct tgatctctac tccttttatc    88080
ccactaacaa attttgtatt attacttttc atttattcaa aagtatacat ttgtttgtgc    88140
acaaaaaaat acaatttctt tttttgtatg gttcagattt aaatcccaca tacatgatat    88200
atgcaagcaa gttgctttgc tggggagatt tgtgaaattt cctcacactc atgttgtaag    88260
ctactttgtg gtcctcatct cttttcacat ggacagcact cttacagaaa ttaagaactt    88320
tatttttttg tagaaaacca gatgtaagcc cattgaaagg agaaaccttg gctatctttg    88380
tcattataat aaatctagta tgaaattgtt ggttagaaaa tattaaatga aaggaagaca    88440
gagaaggagg gaagaggaag gtaagaaggg aggagggagc tagagaaaag ggggcgggag    88500
ggagaaaaga aattaagttg tcctgaaact caactgctag gacagttact gtgagtaaag    88560
aggaaataac agtttataga aaaatatgtt tcttattttg aaaaaaaaaa gtttggaata    88620
aaacaaaaaa tacaaagacc cctatttttt agaattatga ggagttggag gagtcactta    88680
aatgtttgtt aaacatcact acttctacct ataaagggga aaatacttat aaagggaaaa    88740
ttttaactag agtgatattt gggacttaaa atgtctggta ccaattttat ccatttctca    88800
tcccagagca ggaagtttgc attgtttatg actgaatatt caagtatctt tcccccacta    88860
ggatttactg taggttcgtg gtagtgacag gggatttaaa tgaaaatttt taggtctcgg    88920
tcagtaaaac gacctgtgtc agcctagaga aagaggaaga gaggagacag ggttgaccca    88980
gcgctggacg agtctgaaga tgtgcatggg gagaaaataa ttgagctcat gtgacccaaa    89040
gtcaagtgta ctctgggttt aggtctcagc tgcagtattt atcggactgt gaggatcatt    89100
tcagctccct gagcctcagt ttactactca tctacagaat ggaattaata acattaaatg    89160
agatgatgca tcactagaca tttagctcag atcatggcat gtattacata tgccacaact    89220
gttagctagt gttatgataa tctttgttat tattatggtc aagatgccta ctgcaagact    89280
aaatatatat caaatgtttt ctgttgagca tacaacttga gcatattttc caacttacct    89340
tacagttcca tgtacccacg tggctggatt ctgaacaatg accacttcca gaccggactt    89400
acaaaatctc tctccacact ctctcatttc cctcatcttc cgagaagatc caatggagga    89460
cttcaaagtc ctagaagatg gcaaagcgac aagacagaaa gaatgtcatc catgaatgac    89520
cacgtggagc agagctccca ctccctgccc tgctgtccca cattgcacaa gaatgtgaca    89580
tagaaacaca atttcatttc tcttatgtca cggaaatttg aggactcttc cttatagttg    89640
ctagtattaa ttaccctagc taatgccaag gaagaccaaa aagtctttcc aatgctttgt    89700
aaggactaac cagaagacac acataaacac agctttgctc aaattcattt ttgtcacaaa    89760
tcacttcttc agggcctcag aatgtgaatt ccagctgctc tgtcaaccaa tgtctagaaa    89820
catttttgct gttgagtgca aagtcttcat tcatgagggt gctctccaaa cgcattcatt    89880
ccatggtgtt catttcttgg tatagaagca tatgaggaac agcacactcc ctggatctat    89940
atactacatt acctgtatta ataagaatgc taggctgtac ccattcatta tctaccagcc    90000
cgccagacaa aatgattcac cctagactta caggttgaag tcaattgagt atcctttgaa    90060
ctggagggag aggcgcttcc ataaagtggt gagagcttta tggcagaaag ttctattaat    90120
gaccccactt cagtgcttat caggagcagg ccatataatc ccttcccgga attacatgct    90180
ggtcggttca gataaataac ccagatctct gtcatttata atccaaaacg ttaacaatta    90240
atttccaaaa tcaatcctga agggggctag aagcctaaat cgctaggtcc aggcagaccc    90300
cactccatga atttctcatg agtcaaaatt taagcctcga aacttgtaac taactgttgt    90360
caagacacag ctgacttagg caatcaagac aacagtattc agcagtaacc tgggtgaaac    90420
atactctaag tgtgaattaa taagtcggct gacaccaggc cccagatgtt tcccactctg    90480
gcaatatgcc tgaagtgatg ataagcagat ttacatactt aactaatatg tttatttaaa    90540
agaaatttcc aaatccaaaa taacatccag atttcttatt tggctgcaga tcaaaagaca    90600
tcctatcaat aaagacagaa tccaggataa accttttcaa catctgctta aaaccaaaca    90660
acagatttga gagttttggt aaaacttaat tgcagacaaa tttcactgcc tcttacataa    90720
atatatattt tcatgtccct ggggtggttc tgacctcatc aattttcgtg ttcacaatac    90780
acaacattgt tcttttacca gcaccaacaa ttctgccttt atggagaatt cccatcccaa    90840
ggttttcttt cagactgaag gataaacaga ctttctctct ggccaggaaa agtcgaacaa    90900
aagtcagggg catgtgctaa cacttggaat gttgtagaaa agaaaaatcg acccctctac    90960
cagtaagatc tttgtttttc tataaatatt agaaagcatt tatttggtct ccatctccga    91020
taaatctgga aggagaatag aaaagtagag atgctccttg agtattacat tttttttttt    91080
tcttttcggt ggtgttgatt ccccaaggga gagcttagta actggatcaa agtcttaaca    91140
gatctgtgtg cttgtgaagg agatgataat aggaggggtg ttggccatag tagcacttat    91200
ccctttagtg tgaattagtt cactttcttc aggtcttagc tgtctgaaat tggaccatga    91260
tccttgggca ctgagacatt tttctcccat ctggccagtg ctgcaattga gctaaggatt    91320
tggttcagag actcttgttg cctggggatc tgtttaatgt caagaccgat attagctggt    91380
tgaccctggg gtcgggtgac ttagagagtc agaagtcatc catgtttgct gctgctccac    91440
cctttgaact tagtcatgat aaactcctgg gtccaatcct gttacagcca aaatagcaag    91500
aaaagagtgg tagaagcaat cagaaaaatg catagtaagg caccaatgag ataccatctt    91560
cctcttctca attggcatac actttaaaat agcggtgttc agtcttttgg cttccctggg    91620
ccacactgga agaagaattg tcttgggcca cacataaaat acactaacac caatgataac    91680
tgatgggcaa aaaaaaaaaa aaagaatcac aaaaaatttc tcataatgtt ttaagaaagt    91740
ttacaaattt gtgttgggcc gcattcaaag ccatcctggg ccacatgcag gacaagcttg    91800
ctttaaaata tcccatttga agacagttca gatctcccca gttatagatg atttatcaaa    91860
taactatgta tgtatgaaat taatatatca aaagccttaa aacatttcca acctttgacc    91920
aaaaaattgt tcttctagga tgtatcttaa gacataatta tgatttgtgc acaaatttag    91980
ctatgaaaat gtagttttac ttatgatatg acaaaaatat cacaaatgac ctaggtgtca    92040
aacaatagag accagttaat taaatgatgt tccacaactt atataattat taaaaacatt    92100
taggatattt acatttaata aaacccatag tgagggcatt tagattgttt ctaatttgga    92160
cttttatgaa taaagctact atgaaattat tgtatagttt ttctttttat aaatagatgc    92220
tttcatctgt tttgggtaac cctccatgag taaaatagct ggattatatg ggaaataaat    92280
gtttaacttt ataaagaact accaaacttg tttccaaagt gattatatca ttttacaaca    92340
ctgcaacaat gtatgaaaat tctagttgct ccacctcctt ctcaatactt ggtttcccaa    92400
tcattttaat tttagccatt ctggcaggtg tgtagtgata tgtcattatc gttttaattt    92460
acattcccct aataattaag aatgtgagca tcttttcatg tgcttattct ccacttgggt    92520
attttatttt gtgagttgac tattcaaatc ttcttttcat tttttattag gtcatttgtc    92580
ttattgagtt gtaggagttc ttcatatatt ctggatataa gccctttgtc agatgttttg    92640
caaatattat ctcccaacct gtggttttca ttttcatttt gtttatagtt tctttctttc    92700
tttctttctt tctttctttc tttctttctt tctttctttc tttctttctc tttctttctt    92760
ttctttcttc ctttatttct ttttcttttc tttttttttt ttttggtgag acagtctcac    92820
tccatcaccc agactgcagt gcagtggcac catctcacct cactgtaacc tccacctgct    92880
gggttcaagt gattctcatg tagcagcccg gattacaggc acttgccacc acactcagct    92940
aatttttgta tttttagtag agacagggtt ttgccatgct ggccagcctg gtctctaact    93000
cttgacctca agagatctgc ccacctcggc ctctcaaagt gctgggatta caggcgtgag    93060
ctaccgtgac tggcttcatc atagtatctt tctaagtaca gaaattttga acttaagttg    93120
cttttgagaa aaagaaatgt tgtggtgctt agtgaaaaga ttcaagagca cctgcctttc    93180
aacccctgct cagcctctgt ttttttactt ggctgccaac tctcttgctg tgtggacttt    93240
tcctcatcaa tccaaccatc tggtgcctac tggtggaagc tgtgagtggg taaaggccaa    93300
tgaggtgtca gggaacaaca gtagaaacag aagccaaacc taacctgccc tggagcttcc    93360
catgtgctct agaaagggaa gtgccttgtc tgctgaggca ccttctagta ctttccagct    93420
ttaaacgaag catggatctt ttccttcaca attaacaaaa gcccttgttc aggtatgttt    93480
ggcacgtgct gtcatgcttc tttgtcacaa gcaaaacaag aaactaggga tccttcaaaa    93540
ttctattaga aaatagacct ttcaggaaat gttgcagaat tggctttctg ggatatggga    93600
ccaaatattc cttcattccc tgagaattga cttctttctg ctgtatgctc caaatgaact    93660
ccatatatac atacctcatc atgcctctaa atttttaggg cacacatttc tttacatgtc    93720
tacctcctgc aattacactg gaagcccctt gaaagcatga ccatgttttg tacatctttg    93780
tatgtatagt gcctgtctta gtccatttct attgctgtaa gaaaatacct taaatctggt    93840
aaattataaa tcatagagat ttatttctca caatcctgac gactgggaag tccaacatca    93900
gggcaccaga agatttgatg tctgcagagg gctgtctctg ctttcaagat ggtgccttct    93960
tggtgcatcc tcacatagca aaatgacaga gagtaaaaag gactaaacag acttctttaa    94020
gatgttttac aagggcacta attccattca taagggcagg gcctcataac ctaatcacct    94080
cctaatggcc ccacctctta ataccattgc attggtgatt aagttttaca aattttagaa    94140
agacacaaac attcaaacca tagcagtgcc taccacagaa ctgatacaga atgagaactc    94200
aatggatact acttgaatgg ctgaatgaat gaagtgaatt aattgttcgt atccccaaat    94260
ctgagagata tctctctgtt taataatcta ttttgttaaa actttgctct ggagttggac    94320
agacctggga tcacatctca gctccagttc ttgctagctg tgtaactgag acaaagttct    94380
cagcttcctt tgagtcccat ggcttattaa aggggaacaa tggttataat tataataact    94440
acctcatgag tgtgtatgga ctcaatgagt taacacaaag tgtgtaagcc agtgcctggt    94500
tcttagtaag tgctctgtaa atgttagctt tggttattta catgctgtgt tttatgtgac    94560
ccatttctta tgaaataatg tttgctacaa gtagaagatg atggtgatgg ccaaatgtgc    94620
attatatatt ttagtgttca taacaaccag ttattattat ccttttttca gttgtaattg    94680
aagtgacatg cgtgaggtca caaagccagt gataaagctg ggattcagac tcaggctgac    94740
catactttaa tctctaaaca tagtcactct gtcccttcac acaggaaagc attctctgat    94800
ttggaggaga gaattcctgt agccaaggat ggtggcataa gccatagaca tggggctgtc    94860
aaattgctta gcctagaaga acaagagtca gccaactttg gggactccct gttctatccc    94920
cctccctctt atggcaatag gattaagttc tgtgtattag tccattttca tgaggctgat    94980
aaagacatac caaagactgg gtaatttact taaaaaaaaa aaaaaagagg tttaatggac    95040
tcagagttcc acatggctgg ggaggcctca caatcatggc agaagacaaa agtcacatct    95100
tacatggtgg cagacaagag agaatgagag ccaagtgaaa gggggatctc tctttataaa    95160
accatcagat ctcgtgagac ttactcacta ccatgagaac agtatgagga aactgtcccc    95220
catgattcat ttctctccca ccaggtccct cccacaacac ttaggaatta tgggatctac    95280
aattcaagat gagatttggg tggggacaca gccaaatcat atcaagtata ttgcagaaaa    95340
catgaataac agtggctaaa acaagataca attttttttc tcttacataa gaaaagagca    95400
gcctaaagct tatttagcct aaagctggta tggtgggttc cagtccacag gaccagggtt    95460
ctactttttt gctccttgaa aataagcatc caggagaaat gctgttcttc ctcacggggc    95520
ctgagattct cctctcctac caagtgtcac ctttctgctg gtctgcagaa actcctctgt    95580
ctcttcaggc agcagcacca gatacaccaa gcagaccaaa acaacatcac aaaggctctg    95640
aaaattaaac tgtctttgta accacagtcc acgaaactat gccaagacct ccgtgctaaa    95700
cctaaacagg ctgactgcct gctaaaataa aagattaaaa caggatccag agtctcctaa    95760
tataatagcc aaaatgttca gtatacagta aaaagccatg acactgagaa ccaagcaaaa    95820
cacaagtgaa ctaaaaaaga ccatcaactg acagccatgc tcagatgaat cagatgctgg    95880
aattgcctaa caaggatttt aaaggagaca gaaatgcttc aacaatcaat tacacattct    95940
cttgaaacaa ataaaaaaaa tataaaatct gggcaaaaaa tagttttttt atttttttaa    96000
aaaaaggaaa ccacagaact ctaaaatatg cagaaactct aaaataaaac agaaatagaa    96060
agggcatgtc tcctagccag atcagccatt caaagaagtg cagaagaact attcaatgat    96120
tttcacctaa tttccttggc tactttccag ctgcaaggaa tgctgggaaa tgtagtcttt    96180
aagcaggcac accaatgata gactggattt ttgtttacca ggtaaaagga aagaatatgt    96240
atcgggttac taagctaccc aggtctgccc ctgacacaaa gggctcatac attgggaaca    96300
aaatcaaggc tctgggagtt tacattggaa tatgatctta ctgtggataa gaccaaagaa    96360
atcctgtgca cacggatgag gattataaat cctggttcag gctggcatga tccacagttg    96420
ccacgattcc tgtatgcctg cagaaagaca acttaatgtg gcctaatgtt actaacatct    96480
cgacaggctc accttttgag ggaaggccat ttaattacct gattaatttg ctcatcttaa    96540
ttaacttgtt cctattgttg ataaccttgt attgattgct ctgctggtag taattagaaa    96600
actggtaaag aagtaaggag agaagcccaa agaggggggc agcacagcac acagattgtc    96660
ttcctgtctc ctaagaatct actgtgtagg ctgtgagctt agcatatttg cttctctttt    96720
taggtaaata tgttatagac acaaatgatg ttctctgttg attatttata accactccac    96780
gttccttctt agagtatctg cccttttcat tttttcaaag actcagctct catgagcccc    96840
acatgacctg ctacccccat caaccacagc tgattggata agcacctgac ctagactgtg    96900
ccagtcacat ttgattgttt cagatttctg aatcagagca tgaagaaaca gtaccagtta    96960
actttggatg ctgaaactat aggacgatgc agacttggaa ggtggacaag gtagctattt    97020
cgtgatagcc accatggacc ctgtattccc accaacaatc agagagcact tgtcagttaa    97080
gttcaccaga ctcctaatgg cattatagtt ctcccaccaa acttcttgcc ccagggtgta    97140
tggactatct ctgattattt gatagaagtt tccctgtaca ttagctgact caagttcatt    97200
gccatttttt gcaacccaaa gagtcccttc tataacaaag cactctcatc attgacttct    97260
ctctatctta gttttaagtg tctctggtga aaatgcaaat ttaaaggacc tattaaaaac    97320
aacagagtgg gagttgctat caaataaagt ataaactgct aaactgctaa ggcctctatc    97380
aagaccaatg ctgtgctaac tctttccaac ccagtaaaac gaggctttat tgtccaccac    97440
taacatgtca ccacctcccc tattgacttc agtcctttgg gaccccctaa ctctcatacc    97500
ccacccagct tccgagaact ctattgcctc ccagaagtaa tcatagtcaa cacttagtgg    97560
tagttatttt ggcttgaggc catggccttg caaagctggt attgaagtga tgctctcata    97620
tctaatttga ctgaattgag tgttccagta agactggtga tgttttcctt gcttcagggt    97680
ccatcctaat gagcaaatgc tgccttactt tcacagaagg ctgcaaatgt agacttgtaa    97740
agaaaatctt tacaaacact tcttggtgtc ttagagatca cccaacacaa ttacacatgg    97800
ggatatgctg ggaagtacta aaataaacct gatttatcct tcacatatgc ctttcatttg    97860
ctattgtggc ttcaaagctc aaaaaaaata gagagatgtt tctctaaact ttcactattt    97920
attaactgag aatgtaacgg aagtgaaaca gccaacaaaa attaaaagca gcttactcag    97980
ggatacagag tcatgactat gtggagcccc atatctttac ttctttgtct aaagtcctca    98040
taagcactgt ctgagtttgc atgagtccta caaactagaa caactcccaa cttcattgag    98100
aagaatgagg acatctttgc aaagaaggca gaggaaagcc acatgctact tgtaacactt    98160
tgatggctac ccagtgccaa ggtttttttt ttttttttta acaatcctga cagcagaaat    98220
ctggaagctt gatcctagaa gactgaagag cccccaacat gaccctgaac tctcacataa    98280
gagaggaact cttagttcgt ttgccattaa gagaaaacca cagactaggt catttataat    98340
gaacagaaat ttattttctc acagttctaa atgctgggac atccaagatc atgggacccg    98400
catccgacaa gagtgttcta gctgcatcat tccatggtgg aatggccaga gagggtgagg    98460
gagagaagca aaagggggcc aaactcatcc ctctgtaagg aactccctcc tgagataaca    98520
gcattaatca ttcatcaggg cagagccctc acggcctaat caccttttaa aggtcctatc    98580
tcttaatact gttataatta aacttcaacc tacatttggg agggaacaaa cattcaagcc    98640
acagtagaaa ccagcttctt tttctgttgt taaagcaaca ctttttttct tctctgttac    98700
ttgcagccta accagatcct aataaataca caagcttcta tgtcgacaaa tatgtctaca    98760
atgctgttta aatggcagca tggtattcta ggatagggaa gggccaccat ttactcaacc    98820
agcccattct tggaggatgt ttaagctatt tccaatattt tgctatgttc aacaaagtat    98880
taaggatctc cctagtagct aagcacccat gtaaatcctt agatatctta ggataaacct    98940
gtaaactagt ttatgtgtcc tagtttagct gggcccagct ggaccatcac acatatttaa    99000
atttttttga aacttattgc caacatgcat ctccagagag gtagtacacc aaattatgct    99060
cctacaaaag ttgcagaaac ttgcctgtct atccatactg tcacccacaa tggtgattat    99120
tactttttat ctgtgacaat ttgatttatg ctgggatttt gcagccagca ccaaggtagc    99180
atgttgtctc tcagtctaat aataatttcc ctctccctca tcatcatcac cagcactacc    99240
aatttctctg cactatgggt actaacatca aaaatgttcc catcacattt acttcatttt    99300
gaggaaaaga acagttacta ccattcattc attcactcat cacaccaata ttactgaatc    99360
ctaccctgga ccagcattgt tatggtagat cttgataata tagtgacaga caataccatc    99420
cttcccacca tttacatagt agactgcctg gggctcatag tctactcaca tctcagcaca    99480
tgagatagtc ccattatcac attctcttct atctctctca caggcactca ctcaccagcc    99540
atggagaact taatgggcat taggttctta atcctgctgg gtataattgg agataaccac    99600
cctggctgac tgagcactat accaggctac tcatggatga tttggttatt agacgtaatc    99660
agagtggccc ttgtatgcta aaaaggagac tcagtctcca tcccatggaa gattacattt    99720
ttctgactgc catccctcag atctagatgg tattgtctcc ctgacatcca aatatcttca    99780
atcatataac c                                                         99791

Claims (13)

1.试剂在制造用于确定对乳腺癌的易感性的试剂盒中的应用,所述试剂用于检测选自标记rs13387042及其r2=1.0的完美替代物的至少一个多态标记的至少一个等位基因,其中rs13387042的等位基因A或与其连锁不平衡的完美替代标记物的等位基因的存在表示对乳腺癌的易感性。
2.根据权利要求1所述的应用,其中所述至少一个多态标记位于具有如SEQ ID NO:5列出的序列的基因组区段内。
3.根据权利要求1所述的应用,其中所述至少一个多态标记为如SEQ ID NO:2列出的rs13387042。
4.根据权利要求1所述的应用,进一步包括在所述个体中评估至少一种单元型的频率。
5.根据权利要求1所述的应用,其中所述至少一个等位基因或单元型的存在赋予的易感性是增加的易感性。
6.根据权利要求5所述的应用,其中所述至少一个等位基因或单元型的存在表示对乳腺癌的易感性增加,其中相对危险度(RR)或优势比(OR)为至少1.20。
7.根据权利要求5所述的应用,其中所述至少一个等位基因或单元型的存在表示易感性增加,其中相对危险度(RR)或优势比(OR)为至少1.25。
8.选自标记rs13387042及其r2=1.0的完美替代物的至少一个多态标记的至少一个等位基因在制造用于确定在先前诊断患有乳腺癌的个体中形成至少第二原发性肿瘤的易感性的试剂盒中的应用,其中rs13387042的等位基因A或与其连锁不平衡的完美替代标记物的等位基因的存在表示所述易感性。
9.在人类个体中评估对乳腺癌的易感性的试剂盒,所述试剂盒包括用于在所述个体的基因组中选择性检测至少一个多态标记的至少一个等位基因的试剂,其中所述多态标记选自rs13387042及其r2=1.0的完美替代物,并且rs13387042的等位基因A或与其连锁不平衡的完美替代标记物的等位基因的存在表示对乳腺癌的易感性。
10.权利要求9所述的试剂盒,其中所述至少一个多态标记是如SEQ ID NO:2列出的rs13387042。
11.根据权利要求9或10所述的试剂盒,其中所述试剂包括至少一种相邻寡核苷酸、缓冲液和可检测标记,所述至少一种相邻寡核苷酸与包含所述至少一个多态标记的个体基因组的片段互补。
12.根据权利要求11所述的试剂盒,其中所述试剂包括至少一对寡核苷酸引物,其与从所述对象获得的基因组核酸片段的相反链杂交,其中每个寡核苷酸引物对被设计以选择性扩增所述个体的基因组的片段,所述片段包含一个多态标记,并且其中所述片段的大小为至少30个碱基对。
13.根据权利要求11所述的试剂盒,其中所述至少一种寡核苷酸与所述个体的基因组完全互补。
CN200880016394.2A 2007-03-26 2008-03-26 作为用于乳腺癌风险评估、诊断、预后和治疗的标记的chr2和chr16的遗传性变型 Expired - Fee Related CN101874120B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
IS8625 2007-03-26
IS8625 2007-03-26
IS8648 2007-05-25
IS8648 2007-05-25
PCT/IS2008/000009 WO2008117314A2 (en) 2007-03-26 2008-03-26 Genetic variants on chr2 and chr16 as markers for use in breast cancer risk assessment, diagnosis, prognosis and treatment

Publications (2)

Publication Number Publication Date
CN101874120A CN101874120A (zh) 2010-10-27
CN101874120B true CN101874120B (zh) 2015-01-14

Family

ID=39563444

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200880016394.2A Expired - Fee Related CN101874120B (zh) 2007-03-26 2008-03-26 作为用于乳腺癌风险评估、诊断、预后和治疗的标记的chr2和chr16的遗传性变型

Country Status (13)

Country Link
US (1) US20110117545A1 (zh)
EP (3) EP2527466A3 (zh)
JP (1) JP5676245B2 (zh)
KR (1) KR20090127939A (zh)
CN (1) CN101874120B (zh)
AU (1) AU2008231425B2 (zh)
CA (1) CA2681928A1 (zh)
EA (1) EA019953B1 (zh)
IL (1) IL201217A (zh)
MX (1) MX2009010439A (zh)
NZ (1) NZ580490A (zh)
WO (1) WO2008117314A2 (zh)
ZA (1) ZA200907471B (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK2468901T3 (en) 2005-11-29 2017-07-17 Cambridge Entpr Ltd Markers for breast cancer
JP2011527565A (ja) 2008-07-07 2011-11-04 ディコーデ ジェネテクス イーエイチエフ 乳癌のリスクアセスメントのための遺伝的変異
WO2010038032A1 (en) * 2008-10-03 2010-04-08 Mars, Incorporated Genetic test for liver copper accumulation in dogs and low copper pet diet
CN102712949B (zh) * 2009-06-01 2015-12-16 遗传技术有限公司 用于乳腺癌风险评估的方法
US8356023B2 (en) * 2009-07-28 2013-01-15 Ancestry.Com Operations Inc. Collaborative systems and methods for constructing representations of data
EP2721180A4 (en) * 2011-06-16 2015-09-02 Decode Genetics Ehf GENETIC VARIANTS FOR PREDICTING THE RISK OF BREAST CANCER
GB201120989D0 (en) 2011-12-06 2012-01-18 Mars Inc Genetic test
KR101390590B1 (ko) * 2012-06-28 2014-04-30 서울대학교산학협력단 췌장암 재발 예후 예측용 마커 및 이의 용도
US10188617B2 (en) 2013-03-12 2019-01-29 The Board Of Trustees Of The Leland Stanford Junior University Modulation of cellular DNA repair activity to intercept malignancy
CN107002138B (zh) * 2014-09-30 2022-06-14 基因技术有限公司 用于评估发展乳腺癌风险的方法
AU2017242028A1 (en) * 2016-03-29 2018-09-06 Regeneron Pharmaceuticals, Inc. Genetic variant-phenotype analysis system and methods of use
CN108588263B (zh) * 2018-06-07 2022-02-01 中国农业科学院烟草研究所 一种用于定位和克隆植物中控制同一性状的双隐性基因的方法
CN108676890B (zh) * 2018-07-12 2022-01-28 吉林大学 一种女性乳腺恶性肿瘤易感性预测试剂盒及系统
US10395772B1 (en) * 2018-10-17 2019-08-27 Tempus Labs Mobile supplementation, extraction, and analysis of health records
KR102091790B1 (ko) * 2019-09-02 2020-03-20 주식회사 클리노믹스 피검사자와 생물체 간의 유전자 정보를 이용한 유전적 띠 제공 시스템 및 그 방법
US11514627B2 (en) 2019-09-13 2022-11-29 23Andme, Inc. Methods and systems for determining and displaying pedigrees
KR20240063050A (ko) * 2022-11-02 2024-05-09 주식회사 디시젠 암 발생 위험도 예측 방법

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1835740A (zh) * 2003-08-11 2006-09-20 波美拉尼亚医学研究院 预防乳腺癌和卵巢癌的药物组合物

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4376110A (en) * 1980-08-04 1983-03-08 Hybritech, Incorporated Immunometric assays using monoclonal antibodies
US5223409A (en) * 1988-09-02 1993-06-29 Protein Engineering Corp. Directed evolution of novel binding proteins
US5424186A (en) * 1989-06-07 1995-06-13 Affymax Technologies N.V. Very large scale immobilized polymer synthesis
US5143854A (en) * 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US5288644A (en) * 1990-04-04 1994-02-22 The Rockefeller University Instrument and method for the sequencing of genome
US5837832A (en) * 1993-06-25 1998-11-17 Affymetrix, Inc. Arrays of nucleic acid probes on biological chips
US5858659A (en) * 1995-11-29 1999-01-12 Affymetrix, Inc. Polymorphism detection
AU785425B2 (en) * 2001-03-30 2007-05-17 Genetic Technologies Limited Methods of genomic analysis
WO2003014143A2 (en) * 2001-08-04 2003-02-20 Whitehead Institute For Biomedical Research Haplotype map of the human genome and uses therefor
US20040023237A1 (en) * 2001-11-26 2004-02-05 Perelegen Sciences Inc. Methods for genomic analysis
US20040146870A1 (en) * 2003-01-27 2004-07-29 Guochun Liao Systems and methods for predicting specific genetic loci that affect phenotypic traits
US9157122B2 (en) * 2004-11-11 2015-10-13 Garvan Institute Of Medical Research Method of diagnosing cancer and reagents therefor
KR101138862B1 (ko) * 2005-02-14 2012-05-14 삼성전자주식회사 단일염기 다형을 포함하는 유방암과 관련된 폴리뉴클레오티드, 그를 포함하는 마이크로어레이 및 진단 키트 및 그를이용한 유방암 진단 방법
KR101206028B1 (ko) * 2005-03-05 2012-11-28 삼성전자주식회사 유방암 특이적 다형성 서열을 이용한 유방암의 진단방법,유방암 특이적인 폴리뉴클레오티드 및 상기 폴리뉴클레오티드가 고정되어 있는 마이크로어레이
US7858303B2 (en) * 2005-03-14 2010-12-28 Wisconsin Alumni Research Foundation Method of analyzing breast cancer susceptibility and resistance
WO2006121991A2 (en) * 2005-05-06 2006-11-16 Diadexus, Inc. Compositions and methods for detection, prognosis and treatment of breast cancer

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1835740A (zh) * 2003-08-11 2006-09-20 波美拉尼亚医学研究院 预防乳腺癌和卵巢癌的药物组合物

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Abnormal frequencies of alleles in polymorphic markers of the 17q21 regeion is associated with breast cancer;S Jose et al;《Cancer letters》;19990426;第138卷(第1-2期);209-215 *
Loss of heterozygosity of BRCA1,BRCA2 and ATM genes in sporadic invasive ductal breast carcinoma;Rio P G et al;《International journal of oncology》;19981001;第13卷(第4期);849-853 *
The BARD1 Cys557Ser variant and breast cancer risk in Iceland;Stacey S N et al;《PLOS Medicine》;20060731;第3卷(第7期);e217 *

Also Published As

Publication number Publication date
WO2008117314A2 (en) 2008-10-02
JP2010522555A (ja) 2010-07-08
ZA200907471B (en) 2014-03-26
AU2008231425A1 (en) 2008-10-02
EP2137324A2 (en) 2009-12-30
EA019953B1 (ru) 2014-07-30
KR20090127939A (ko) 2009-12-14
MX2009010439A (es) 2009-10-20
WO2008117314A3 (en) 2008-12-18
EP2527466A2 (en) 2012-11-28
CA2681928A1 (en) 2008-10-02
US20110117545A1 (en) 2011-05-19
EP2540840A3 (en) 2013-05-15
CN101874120A (zh) 2010-10-27
IL201217A0 (en) 2010-05-31
AU2008231425B2 (en) 2014-03-20
EA200970891A1 (ru) 2010-04-30
EP2527466A3 (en) 2013-05-15
JP5676245B2 (ja) 2015-02-25
IL201217A (en) 2014-03-31
EP2540840A2 (en) 2013-01-02
NZ580490A (en) 2012-08-31

Similar Documents

Publication Publication Date Title
CN101874120B (zh) 作为用于乳腺癌风险评估、诊断、预后和治疗的标记的chr2和chr16的遗传性变型
AU2017267184B2 (en) Method for assessing a prognosis and predicting the response of patients with malignant diseases to immunotherapy
DK2471954T3 (en) Susceptibility genetic variants associated with cardiovascular diseases
CN101784675B (zh) 用于剥脱性综合征和青光眼的诊断、预后和治疗的标记物的chr 15q24上的遗传变异
CN101641451A (zh) chr8q24.21上的癌症易感性变体
US20090305284A1 (en) Methods for Identifying Risk of Breast Cancer and Treatments Thereof
CN107223159A (zh) 源自特定细胞类型的dna的检测及相关方法
KR20110036608A (ko) 유방암 위험도 평가를 위한 유전적 변이
CA2941594A1 (en) Genetic polymorphisms of the protein receptor c (procr) associated with myocardial infarction, methods of detection and uses thereof
KR20170086027A (ko) 신경발달 장애에서의 행동을 개선시키기 위한 박테리아를 포함하는 조성물 및 방법
ES2792126T3 (es) Método de tratamiento basado en polimorfismos del gen KCNQ1
KR102481305B1 (ko) 유전자에 기반한 염증성 장 질환의 진단
CN1704478A (zh) 评估急性髓性白血病患者的方法
AU2016325030A1 (en) Novel biomarkers and methods of treating cancer
WO2006022629A1 (en) Methods of identifying risk of type ii diabetes and treatments thereof
AU2023203393A1 (en) Compositions and methods for screening and identifying clinically aggressive prostate cancer
KR20090087486A (ko) 타입 2 당뇨병의 유전적 감수성 변이
CN101631876A (zh) 2型糖尿病的遗传易感性变体
IL179831A (en) In vitro method for detecting the presence or possibility of autism or autism disorder, and in vitro method for selecting compounds with biological activity on autism or autism disorders
DK2951317T3 (en) PROCEDURE FOR PREDICTING THE BENEFIT OF INCLUSING TAXAN IN A CHEMOTHERAPY PLAN FOR BREAST CANCER PATIENTS
WO2006022636A1 (en) Methods for identifying risk of type ii diabetes and treatments thereof
KR20190126812A (ko) 질환 진단용 바이오마커
TW202227102A (zh) 治療脂肪肝病之方法
WO2006022634A1 (en) Methods for identifying risk of type ii diabetes and treatments thereof
AU782728B2 (en) Prostate cancer-relased gene 3 (PG-3) and biallelic markers thereof

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150114

Termination date: 20150326

EXPY Termination of patent right or utility model