CN107077536A - 使用靶基因表达的数学建模评价TGF‑β细胞信号传导途径的活性 - Google Patents

使用靶基因表达的数学建模评价TGF‑β细胞信号传导途径的活性 Download PDF

Info

Publication number
CN107077536A
CN107077536A CN201580057321.8A CN201580057321A CN107077536A CN 107077536 A CN107077536 A CN 107077536A CN 201580057321 A CN201580057321 A CN 201580057321A CN 107077536 A CN107077536 A CN 107077536A
Authority
CN
China
Prior art keywords
tgf
cell signaling
signaling pathway
target gene
cdc42ep3
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201580057321.8A
Other languages
English (en)
Other versions
CN107077536B (zh
Inventor
H·J·范奥义任
A·范德斯托尔佩
D·A·M·W·范斯特里普
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Innomark Ltd
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN107077536A publication Critical patent/CN107077536A/zh
Application granted granted Critical
Publication of CN107077536B publication Critical patent/CN107077536B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/48Other medical applications
    • A61B5/4836Diagnosis combined with treatment in closed-loop systems or methods
    • A61B5/4839Diagnosis combined with treatment in closed-loop systems or methods combined with drug delivery
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • G16B5/20Probabilistic models
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Public Health (AREA)
  • Physiology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioethics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Medicinal Chemistry (AREA)

Abstract

本发明涉及一种基于受试者样品中测得的TGF‑β细胞信号传导途径的三个或更多个靶基因的表达水平,推断受试者中的TGF‑β细胞信号传导途径的活性的计算机执行方法。本发明还涉及一种推断受试者中的TGF‑β细胞信号传导途径的活性的装置、一种非临时性存储介质以及一种推断受试者中的TGF‑β细胞信号传导途径的活性的计算机程序。本发明还涉及一种测量受试者样品中的TGF‑β细胞信号传导途径的三个或更多个靶基因的表达水平的试剂盒,一种推断受试者中的TGF‑β细胞信号传导途径的活性的试剂盒,以及所述试剂盒执行此方法的用途。

Description

使用靶基因表达的数学建模评价TGF-β细胞信号传导途径的 活性
技术领域
本发明总体涉及生物信息学、基因组加工、蛋白质组加工和相关技术的领域。更具体地,本发明涉及一种通过数字处理设备执行的计算机执行方法,推断受试者中的TGF-β细胞信号传导途径的活性,其中所述推断基于受试者样品中测量的TGF-β细胞信号传导途径的三个或更多个靶基因的表达水平。本发明还涉及一种推断受试者中的TGF-β细胞信号传导途径的活性的装置,所述装置包含经配置以执行此方法的数字处理器,一种推断受试者中的TGF-β细胞信号传导途径的活性的非临时性存储介质,其存储可由数字处理设备执行以执行此方法的指令,以及一种推断受试者中的TGF-β细胞信号传导途径的活性的计算机程序,其包含当所述计算机程序在数字处理设备上运行时,用于引起数字处理设备执行此方法的程序代码装置。本发明还涉及一种测量受试者样品中的TGF-β细胞信号传导途径的三个或更多个靶基因的表达水平的试剂盒,一种推断受试者中TGF-β细胞信号传导途径的活性的试剂盒,以及所述试剂盒执行此方法的用途。
背景技术
基因组和蛋白质组分析已经基本上实现了医疗领域诸如肿瘤学中的临床应用,并且是其潜在希望,其中已知多种癌症与基因组突变/变异和/或特定基因的高或低表达水平的特定组合相关,其在癌症的生长和进化(例如,细胞增殖和转移)中起作用。
转化生长因子-β(TGF-β)是控制人中许多细胞类型中的不同功能,例如增殖、分化和愈伤的一种细胞因子。对于病理混乱,例如癌症(例如结肠癌、乳腺癌、前列腺癌),TGF-β细胞信号传导途径发挥两种相反的作用,肿瘤抑制因子或肿瘤促进因子。已知TGF-β在癌症发生早期作为肿瘤抑制因子,然而在更为发展的癌组织中,TGF-β可以通过作为侵染和转移的调节因子而作为肿瘤促进因子(参见Padua D.and MassaguéJ.,“Roles of TGFbeta inmetastasis”,Cell Research,Vol.19,No.1,2009,89-102页)。TGF-β以三种亚型存在(基因名:TGFB1,TGFB2,TGFB3),并且以失活的潜伏同源二聚体蛋白分泌,已知其在癌细胞中比在其正常相对物中增加(参见MassaguéJ.,“How cells read TGF-beta signals”,NatureReviews Molecular Cell Biology,Vol.1,No.3,2000,169-178页)。接着,潜伏的TGF-β可经蛋白水解活化,此时其可结合细胞膜上的TGF-β受体,由此引发典型的TGF-β细胞信号传导途径,有时称为SMAD细胞信号传导途径。最终,该典型的TGF-β细胞信号传导途径导致由受体调控的或R-SMAD(SMAD1,SMAD2,SMAD3,SMAD5和SMAD8)和SMAD4的转录因子复合体与DNA结合,由此引发TGF-β细胞信号传导途径的靶基因的转录(参见图1;L.TGF-β=潜伏TGF-β;PR=蛋白酶体;PH=磷酸酶;Co-R=共抑制因子;Co-A=共激活因子)。本文的术语“TGF-β细胞信号传导途径”优选指导致上述TGF-β转录因子的转录活性的任何信号传导过程。优选的,该术语指由TGF-β与胞外TGF受体结合造成胞内SMAD级联,最终导致作为转录因子的SMAD复合体的形成引发的信号传导过程。
对于癌症中的TGF-β信号传导,重要的是能够区分肿瘤抑制和促进活性,从而能够正确选择靶向药物治疗。目前正在研发抗TGF-β疗法(参见Yingling J.M.et al.,“Development of TGF-beta signalling inhibitors for cancer therapy”,NatureReviews Drug Discovery,Vol.3,No.12,2004,1011-1022页)。然而,目前并无可用于评价TGF-β细胞信号传导途径的功能状态/活性的临床测定,所述TGF-β细胞信号传导途径在其活化状态表明其更可能是促进肿瘤,在其失活状态表明其更可能是抑制肿瘤。因此期望能够改善对癌症患者,例如结肠癌、胰腺癌、肺癌、脑癌或乳腺癌进行表征的可能性,所述癌症至少部分是由TGF-β细胞信号传导途径的促肿瘤活性驱动的,因此所述患者可能响应TGF-β细胞信号传导途径的抑制剂。
发明概述
根据本发明的主要方面,以上问题由一种通过数字处理设备执行的、推断受试者中的TGF-β细胞信号传导途径的活性的计算机执行方法来解决,其中所述推断包括:
接收受试者样品中测得的TGF-β细胞信号传导途径的三个或更多个,例如三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个或更多个靶基因的表达水平;
确定受试者样品中TGF-β转录因子(TF)元件的活性水平,所述TGF-βTF元件控制所述三个或更多个TGF-β靶基因的转录,所述确定基于评估将三个或更多个TGF-β靶基因的表达水平与TGF-βTF元件的活性水平关联的校准数学模型;
基于所确定的所述受试者的样品中的TGF-βTF元件的活性水平推断所述受试者中的TGF-β细胞信号传导途径的活性,
其中所述三个或更多个TGF-β靶基因选自:ANGPTL4、CDC42EP3、CDKN1A、CDKN2B、CTGF、GADD45A、GADD45B、HMGA2、ID1、IL11、SERPINE1、INPP5D、JUNB、MMP2、MMP9、NKX2-5、OVOL1、PDGFB、PTHLH、SGK1、SKIL、SMAD4、SMAD5、SMAD6、SMAD7、SNAI1、SNAI2、TIMP1和VEGFA,优选选自:ANGPTL4、CDC42EP3、CDKN1A、CTGF、GADD45A、GADD45B、HMGA2、ID1、IL11、JUNB、PDGFB、PTHLH、SERPINE1、SGK1、SKIL、SMAD4、SMAD5、SMAD6、SMAD7、SNAI2、VEGFA,更优选选自:ANGPTL4、CDC42EP3、CDKN1A、CTGF、GADD45B、ID1、IL11、JUNB、SERPINE1、PDGFB、SKIL、SMAD7、SNAI2和VEGFA,更优选选自:ANGPTL4、CDC42EP3、ID1、IL11、JUNB、SERPINE1、SKIL和SMAD7。
本文中,TF元件的“活性水平”意指与其靶基因转录相关的TF元件的活性水平。
本发明基于发明人的创意,即鉴定TGF-β细胞信号传导途径中存在的效果的适合的方式可以基于对TGF-β细胞信号传导途径的信号传导输出的测量,其为所述靶基因的转录,受到由TGF-β细胞信号传导途径控制的TGF-β转录因子(TF)元件的控制。发明人的该创意假设样品中的TF活性水平处于准稳态,可通过TGF-β靶基因的表达值检测。本文所称的TGF-β细胞信号传导途径已知控制人中许多细胞类型中的功能,例如增殖、分化和愈伤。对于病理混乱,例如癌症(例如结肠癌、胰腺癌、肺癌、脑癌或乳腺癌),TGF-β细胞信号传导途径发挥两种相反的作用,肿瘤抑制因子或肿瘤促进因子,靶基因的表达谱可检测,因此通过校准数学途径模型开发。
本发明能够确定受试者中的TGF-β细胞信号传导途径的活性,通过(i)确定受试者样品中的TGF-βTF元件的活性水平,其中所述确定基于评估将TGF-β细胞信号传导途径的三个或更多个靶基因的表达水平与TGF-βTF元件的活性水平关联的校准数学模型,所述TGF-β细胞信号传导途径的转录通过TGF-βTF元件控制,以及(ii)基于所确定的受试者样品中的TGF-βTF元件的活性水平推断受试者中的TGF-β细胞信号传导途径的活性。这优选允许改善对癌症患者,例如结肠癌、胰腺癌、肺癌、脑癌或乳腺癌进行表征的可能性,所述癌症至少部分是由TGF-β细胞信号传导途径的促肿瘤活性驱动的,因此所述患者可能响应TGF-β细胞信号传导途径的抑制剂。在具体实施方案中,治疗确定可基于特定的TGF-β细胞信号传导途径的活性。在具体实施方案中,TGF-β细胞信号传导途径状态可设定为TGF-β细胞信号传导途径活化的几率的截断值,例如10:1、5:1、4:1、2:1、1:1、1:2、1:4、1:5或1:10。
本文中,术语“TGF-β转录因子元件”或“TGF-βTF元件”或“TF元件”定义为包含TGF-β成员(SMAD1、SMAD2、SMAD3、SMAD5和SMAD8与SMAD4)的至少一个,或优选二聚体或三聚体(来自SMAD1、SMAD2、SMAD3、SMAD5和SMAD8与SMAD4的两种蛋白)的蛋白复合体,其能够结合特异性DNA序列,由此控制靶基因转录。优选地,该术语是指由TGF-β与其受体结合引发的蛋白或蛋白复合体转录因子或TGF-β与其受体结合和最终转录因子蛋白或蛋白复合体之间的紧接的下游信号媒介。例如,已知TGF-β结合胞外TGF-β受体,引发胞内“SMAD”信号传导途径,并且一或多个SMAD蛋白(受体调控的或R-SMAD(SMAD1,SMAD2,SMAD3,SMAD5和SMAD8)以及SMAD4)参与,并且可以形成杂合物,其参与控制表达的TGF-β信号传导级联。
校准数学途径模型可以是概率模型,优选贝叶斯网络模型(Bayesian networkmodel),其基于将TGF-βTF元件的活性水平与受试者中的三个或更多个TGF-β靶基因的表达水平关联的条件概率,或者所述校准数学模型可以基于三个或更多个TGF-β靶基因的表达水平的一或多种线性组合。具体而言,TGF-β细胞信号传导途径的活性的推断可以如公开的国际专利申请WO2013/011479A2(“Assessment of cellular signaling pathwayactivity using probabilistic modeling of target gene expression”)中所公开或如公开的国际专利申请WO2014/102668A2(“Assessment of cellular signaling pathwayactivity using linear combination(s)of target gene expressions”)中所描述进行,所述申请的内容在此以其整体并入。关于使用靶基因表达的数学建模推断细胞信号传导途径的活性可见于Verhaegh W.et al.,“Selection of personalized patient therapythrough the use of knowledge-based computational models that identify tumor-driving signal transduction pathways”,Cancer Research,Vol.74,No.11,2014,2936-2945页。
如本文所用,术语“受试者”指任何生物。在一些实施方案中,受试者是动物,优选哺乳动物。在某些实施方案中,受试者是人,优选医学受试者。
如本文所用,术语“靶基因”指其转录直接或间接受TGF-β转录因子元件控制的基因。“靶基因”可以是“直接的靶基因”和/或“间接的靶基因”(如本文所述)。而且,“靶基因”可以是“直接的靶基因”和/或“间接的靶基因”(如本文所述)。
具体合适的TGF-β靶基因描述于以下文本段落以及下文实施例中(例如参见下表1至4、6、8和9)。
因此,根据优选的实施方案,所述TGF-β靶基因选自下表1、表2、表3、表4、表6、表8或表9中列举的TGF-β靶基因。
本发明人证实,接连的短列表中的TGF-β靶基因确定TGF-β细胞信号传导途径活性的证明力越来越强。
优选所述三个或更多个,例如三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个或更多个TGF-β靶基因选自ANGPTL4、CDC42EP3、CDKN1A、CTGF、GADD45A、GADD45B、HMGA2、ID1、IL11、JUNB、PDGFB、PTHLH、SGK1、SKIL、SMAD4、SMAD5、SMAD6、SMAD7、SNAI2、VEGFA,更优选选自:ANGPTL4、CDC42EP3、CDKN1A、CTGF、GADD45A、GADD45B、HMGA2、ID1、JUNB、PDGFB、PTHLH、SERPINE1、SGK1、SKIL、SMAD4、SMAD5、SMAD6、SMAD7、SNAI2、VEGFA。
进一步优选所述三个或更多个,例如三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个或更多个TGF-β靶基因选自:ANGPTL4、CDC42EP3、CDKN1A、CTGF、GADD45B、ID1、IL11、JUNB、PDGFB、SKIL、SMAD7和SNAI2,更优选选自ANGPTL4、CDC42EP3、CDKN1A、CTGF、GADD45B、ID1、JUNB、SERPINE1、SKIL、SMAD7、SNAI2和VEGFA。
进一步优选所述三个或更多个,例如三个、四个、五个、六个、七个或更多个TGF-β靶基因选自:ANGPTL4、CDC42EP3、ID1、IL11、JUNB、SKIL和SMAD7,更优选选自ANGPTL4、CDC42EP3、ID1、JUNB、SERPINE1、SKIL和SMAD7。
优选地,选取的三个或更多个TGF-β靶基因包括ANGPTL4和CDC42EP3,更优选地,ANGPTL4、CDC42EP3、ID1、JUNB、SERPINE1、SKIL和SMAD7。
特别优选地,所述三个或更多个TGF-β靶基因是ANGPTL4、CDC42EP3、CDKN1A、CTGF、GADD45B、ID1、JUNB、SERPINE1、SKIL、SMAD7、SNAI2和VEGFA。
本发明的另一个方面涉及一种方法(如本文所述),其还包括:
基于受试者中的TGF-β细胞信号传导途径的推断活性确定TGF-β细胞信号传导途径在受试者中是否以肿瘤促进因子起作用。
本发明还涉及一种方法(如本文所述),其还包括:
为受试者推荐开药,该药纠正TGF-β细胞信号传导途径的促肿瘤作用;
其中如果基于TGF-β细胞信号传导途径的推断活性确定TGF-β细胞信号传导途径在受试者中以肿瘤促进因子起作用,则进行所述推荐。
待根据本发明使用的样品可以是提取的样品,即从受试者中提取的样品。所述样品的实例包括但不限于受试者的组织、细胞、血液和/或体液。其可以是,例如,从癌症病灶、或从怀疑为癌症的病灶、或从转移性肿瘤、或从存在被癌细胞污染的体液的体腔(例如,胸腔或腹腔或膀胱腔)、或从含有癌细胞的其它体液等等、优选经由活检程序或其它样品提取程序获得的样品。提取样品的细胞还可以是来自血液系统恶性肿瘤(诸如白血病或淋巴瘤)的肿瘤细胞。在一些情况下,细胞样品还可以是循环肿瘤细胞,即已进入血流且可以使用合适的分离技术(例如血浆分离置换法或常规静脉采血)提取的肿瘤细胞。除了血液,提取样品的体液可以是尿、胃肠内容物或渗出物。如本文所使用,术语“样品”还涵盖这样的情况,其中受试者的组织和/或细胞和/或体液已取自受试者并且例如已经置于显微镜载片上,并且其中为了执行请求保护的方法,例如借助于激光捕获显微切割(LCM)或通过从载玻片上刮取目的细胞或通过荧光活化的细胞分选技术来提取该样品的一部分。另外,如本文所使用,术语“样品”还涵盖这样的情况,其中受试者的组织和/或细胞和/或体液已取自受试者并且已经置于显微镜载片上,并且在载片上执行请求保护的方法。
根据另一个公开的方面,推断受试者中的TGF-β细胞信号传导途径的活性的装置包含经配置以执行如本文所述的本发明的方法的数字处理器。
根据另一个公开的方面,推断受试者中的TGF-β细胞信号传导途径的活性的非临时性存储介质存储可由数字处理设备执行以执行如本文所述的本发明的方法的指令。所述非临时性存储介质可以是计算机可读取的存储介质,诸如硬盘驱动器或其它磁性存储介质、光盘或其它光存储介质、随机存取存储器(RAM)、只读存储器(ROM)、闪速存储器、或其它电子存储介质、网络服务器等等。数字处理设备可以是手提式设备(例如,个人数据助手或智能电话)、笔记本计算机、台式计算机、平板计算机或设备、遥控网络服务器等等。
根据另一个公开的方面,推断受试者中的TGF-β细胞信号传导途径的活性的计算机程序包含当所述计算机程序在数字处理设备上运行时,用于引起数字处理设备执行如本文所述的本发明的方法的程序代码装置。数字处理设备可以是手提式设备(例如,个人数据助手或智能电话)、笔记本计算机、台式计算机、平板计算机或设备、遥控网络服务器等等。
根据另一个公开的方面,测量受试者样品中TGF-β细胞信号传导途径的三个或更多个,例如三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个或更多个靶基因表达水平的试剂盒包括:
确定受试者样品中的三个或更多个TGF-β靶基因的表达水平的一或多种成分。
测量三个或更多个TGF-β靶基因的表达水平的一或多种成分或装置可选自:DNA阵列芯片,寡核苷酸阵列芯片,蛋白质阵列芯片,抗体,多种探针,例如标记探针,一组RNA逆转录酶测序成分,和/或RNA或DNA扩增引物,包括cDNA扩增引物。在一个实施方案中,所述试剂盒包括一组针对本文所述三个或更多个TGF-β靶基因的mRNA或cDNA序列的一部分的标记探针。在一个实施方案中,所述试剂盒包括一组针对本文如下进一步所述的三个或更多个TGF-β靶基因的mRNA或cDNA序列的一部分的引物和探针,例如选自表11的序列的一组特异性引物或探针。在一个实施方案中,所述标记探针包含在标准化的96孔板中。在一个实施方案中,所述试剂盒进一步包括针对例如表12中所示的一组参考基因的引物或探针。所述参考基因可以是例如可用于对本文所述靶基因表达水平进行规范化或标准化的组成型表达的基因。
在一个实施方案中,测量受试者样品中两种或更多种细胞信号传导途径的每一种的三个或更多个靶基因的表达水平的所述试剂盒包括:
针对三个或更多个TGF-β靶基因的聚合酶链反应引物,
针对三个或更多个TGF-β靶基因的探针,
其中所述三个或更多个TGF-β靶基因选自:ANGPTL4、CDC42EP3、CDKN1A、CDKN2B、CTGF、GADD45A、GADD45B、HMGA2、ID1、IL11、INPP5D、JUNB、MMP2、MMP9、NKX2-5、OVOL1、PDGFB、PTHLH、SERPINE1、SGK1、SKIL、SMAD4、SMAD5、SMAD6、SMAD7、SNAI1、SNAI2、TIMP和VEGFA,优选选自:ANGPTL4、CDC42EP3、CDKN1A、CTGF、GADD45A、GADD45B、HMGA2、ID1、IL11、JUNB、PDGFB、PTHLH、SERPINE1、SGK1、SKIL、SMAD4、SMAD5、SMAD6、SMAD7、SNAI2和VEGFA,更优选选自:ANGPTL4、CDC42EP3、CDKN1A、CTGF、GADD45B、ID1、IL11、JUNB、PDGFB、SERPINE1、SKIL、SMAD7、SNAI2和VEGFA,最优选选自:ANGPTL4、CDC42EP3、ID1、IL11、JUNB、SERPINE1、SKIL和SMAD7。
优选所述三个或更多个,例如三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个或更多个TGF-β靶基因选自:ANGPTL4、CDC42EP3、CDKN1A、CTGF、GADD45A、GADD45B、HMGA2、ID1、IL11、JUNB、PDGFB、PTHLH、SGK1、SKIL、SMAD4、SMAD5、SMAD6、SMAD7、SNAI2、VEGFA,更优选选自:ANGPTL4、CDC42EP3、CDKN1A、CTGF、GADD45A、GADD45B、HMGA2、ID1、JUNB、PDGFB、PTHLH、SERPINE1、SGK1、SKIL、SMAD4、SMAD5、SMAD6、SMAD7、SNAI2、VEGFA。
进一步优选所述三个或更多个,例如三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个或更多个TGF-β靶基因选自:ANGPTL4、CDC42EP3、CDKN1A、CTGF、GADD45B、ID1、IL11、JUNB、PDGFB、SKIL、SMAD7和SNAI2,更优选选自:ANGPTL4、CDC42EP3、CDKN1A、CTGF、GADD45B、ID1、JUNB、SERPINE1、SKIL、SMAD7、SNAI2和VEGFA。
进一步优选所述三个或更多个,例如三个、四个、五个、六个、七个或更多个TGF-β靶基因选自:ANGPTL4、CDC42EP3、ID1、IL11、JUNB、SKIL和SMAD7,更优选选自:ANGPTL4、CDC42EP3、ID1、JUNB、SERPINE1、SKIL和SMAD7。
优选所选三个或更多个TGF-β靶基因包括ANGPTL4和CDC42EP3,更优选包括ANGPTL4、CDC42EP3、ID1、JUNB、SERPINE1、SKIL和SMAD7。
特别优选所选三个或更多个TGF-β靶基因是ANGPTL4、CDC42EP3、CDKN1A、CTGF、GADD45B、ID1、JUNB、SERPINE1、SKIL、SMAD7、SNAI2和VEGFA。
根据另一个公开的方面,推断受试者中TGF-β细胞信号传导途径的活性的试剂盒包括:
本文所述的本发明的试剂盒,以及
本文所述的本发明的装置,本文所述的本发明的非临时性存储介质,或本文所述的本发明的计算机程序。
根据另一个公开的方面,推断受试者中TGF-β细胞信号传导途径的活性的试剂盒包括:
确定受试者样品中TGF-β细胞信号传导途径的三个或更多个靶基因的表达水平的一或多种成分,
其中所述一或多种成分优选选自:DNA阵列芯片,寡核苷酸阵列芯片,蛋白质阵列芯片,抗体,多种探针,例如标记探针,一组RNA逆转录酶测序成分,和/或RNA或DNA扩增引物,包括cDNA扩增引物,以及
本文所述的本发明的装置、本文所述的本发明的非临时性存储介质、或本文所述的本发明的计算机程序,
其中所述三个或更多个TGF-β靶基因选自:ANGPTL4、CDC42EP3、CDKN1A、CDKN2B、CTGF、GADD45A、GADD45B、HMGA2、ID1、IL11、INPP5D、JUNB、MMP2、MMP9、NKX2-5、OVOL1、PDGFB、PTHLH、SERPINE1、SGK1、SKIL、SMAD4、SMAD5、SMAD6、SMAD7、SNAI1、SNAI2、TIMP1和VEGF,优选选自:ANGPTL4、CDC42EP3、CDKN1A、CTGF、GADD45A、GADD45B、HMGA2、ID1、IL11、JUNB、PDGFB、PTHLH、SERPINE1、SGK1、SKIL、SMAD4、SMAD5、SMAD6、SMAD7、SNAI2和VEGFA,更优选选自:ANGPTL4、CDC42EP3、CDKN1A、CTGF、GADD45B、ID1、IL11、JUNB、PDGFB、SERPINE1、SKIL、SMAD7、SNAI2和VEGFA,最优选选自:ANGPTL4、CDC42EP3、ID1、IL11、JUNB、SERPINE1、SKIL和SMAD7。
优选所述三个或更多个,例如三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个或更多个TGF-β靶基因选自:ANGPTL4、CDC42EP3、CDKN1A、CTGF、GADD45A、GADD45B、HMGA2、ID1、IL11、JUNB、PDGFB、PTHLH、SGK1、SKIL、SMAD4、SMAD5、SMAD6、SMAD7、SNAI2、VEGFA,更优选选自:ANGPTL4、CDC42EP3、CDKN1A、CTGF、GADD45A、GADD45B、HMGA2、ID1、JUNB、PDGFB、PTHLH、SERPINE1、SGK1、SKIL、SMAD4、SMAD5、SMAD6、SMAD7、SNAI2、VEGFA。
进一步优选所述三个或更多个,例如三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个或更多个TGF-β靶基因选自:ANGPTL4、CDC42EP3、CDKN1A、CTGF、GADD45B、ID1、IL11、JUNB、PDGFB、SKIL、SMAD7和SNAI2,更优选选自:ANGPTL4、CDC42EP3、CDKN1A、CTGF、GADD45B、ID1、JUNB、SERPINE1、SKIL、SMAD7、SNAI2和VEGFA。
进一步优选所述三个或更多个,例如三个、四个、五个、六个、七个或更多个TGF-β靶基因选自:ANGPTL4、CDC42EP3、ID1、IL11、JUNB、SKIL和SMAD7,更优选选自:ANGPTL4、CDC42EP3、ID1、JUNB、SERPINE1、SKIL和SMAD7。
优选所选三个或更多个TGF-β靶基因包括ANGPTL4和CDC42EP3,更优选包括ANGPTL4、CDC42EP3、ID1、JUNB、SERPINE1、SKIL和SMAD7。
特别优选所选三个或更多个TGF-β靶基因是ANGPTL4、CDC42EP3、CDKN1A、CTGF、GADD45B、ID1、JUNB、SERPINE1、SKIL、SMAD7、SNAI2和VEGFA。
根据另一个公开的方面,本文所述的本发明的试剂盒用于执行本文所述的本发明的方法。
如本文所述的本发明还可以例如有利地与以下关联使用:
基于受试者中的TGF-β细胞信号传导途径的推断活性的诊断;
基于受试者中的TGF-β细胞信号传导途径的推断活性的预后;
基于受试者中的TGF-β细胞信号传导途径的推断活性的药物处方;
基于受试者中的TGF-β细胞信号传导途径的推断活性的药效预测;
基于受试者中的TGF-β细胞信号传导途径的推断活性的副作用预测;
药效的监测;
药物开发;
测定开发;
途径研究;
癌分期;
基于受试者中的TGF-β细胞信号传导途径的推断活性在临床试验中登记受试者;
待进行的后续测试的选择;和
伴随诊断测试的选择。
在阅读和理解所附的附图、以下描述和具体在阅读本文以下提供的更详尽的实施例之后,进一步的优点对于本领域技术人员而言将是显而易见的。
应当理解,权利要求1的方法、权利要求9的装置、权利要求10的非临时性存储介质、权利要求11的计算机程序、权利要求12至14的试剂盒,以及专利要求15的试剂盒的用途具有类似和/或相同的优选实施方案,具体而言,如从属权利要求中所定义。
应当理解,本发明的优选实施方案还可以是从属权利要求或上述实施方案与相应的独立权利要求的任何组合。
本发明的这些和其它方面从下文描述的实施方案将是显而易见的,且参考下文描述的实施方案进行阐明。
附图简要说明
图1示意性和示例性显示通过典型细胞信号传导途径(左边部分)的TGF-β信号传导在TGF-β蛋白与受体结合时引发。引发的细胞信号传导途径最终导致SMAD2/3和SMAD4转位至细胞核并结合DNA,由此启动靶基因转录(参见Sheen Y.Y.et al.,“Targeting thetransforming growth factor-βsignaling in cancer therapy”,Biomolecules andTherapeutics,Vol.21,No.5,2013,323-331页)
图2示意性和示例性显示用于对TGF-β细胞信号传导途径的转录程序建模的数学模型,本文中为贝叶斯网络模型。
图3示出示例性例示基于受试者样品中测量的TGF-β细胞信号传导途径的靶基因的表达水平推断受试者中的TGF-β细胞信号传导途径的活性的方法的流程图。
图4示出示例性例示获得本文所述校准数学途径模型的方法的流程图。
图5示出示例性例示测定本文所述受试者样品中TGF-β转录因子(TF)元件的活性水平的方法的流程图。
图6示出示例性例示使用离散可观察量推断受试者中的TGF-β细胞信号传导途径的活性的方法的流程图。
图7示出示例性例示使用连续可观察量推断受试者中的TGF-β细胞信号传导途径的活性的方法的流程图。
图8示出示例性例示由对TGF-β细胞信号传导途径的靶基因的RT-qPCR分析确定Cq值的方法的流程图。
图9-12分别显示基于TGF-β细胞信号传导途径的靶基因的证据组织的列表、20个靶基因的短列表、12个靶基因的短列表和7个靶基因的短列表(参见表4-7)的示例性贝叶斯网络模型的训练结果。(图示:1–对照;2–TGF-β以5ng/mL刺激0.5h;3–TGF-β以5ng/mL刺激1h;4–TGF-β以5ng/mL刺激2h;5–TGF-β以5ng/mL刺激4h;6–TGF-β以5ng/mL刺激8h;7–TGF-β以5ng/mL刺激16h;8–TGF-β以5ng/mL刺激24h;9–TGF-β以5ng/mL刺激72h)
图13-16分别显示使用靶基因的证据组织的列表、20个靶基因的短列表、12个靶基因的短列表和7个靶基因的短列表(参见表4-7)的经训练的示例性贝叶斯网络模型对来自GSE28448的人乳腺上皮细胞(HMEC-TR)进行TGF-β细胞信号传导途径的活性预测。(图示:1–对照,无TGF-β;2–对照,TGF-β;3–siRNA SMAD4,无TGF-β;4–siRNA SMAD4,TGF-β;5–siRNATIFγ,无TGF-β;6–siRNA TIFγ,TGF-β)
图17显示使用靶基因的证据组织的列表(参见表1)的经训练的示例性贝叶斯网络模型对来自GSE35830的外子宫颈上皮细胞(Ect1)进行TGF-β细胞信号传导途径的活性预测。(图示:1–对照,无TGF-β;2–用10%精浆刺激;3–用5ng/mL TGF-β3刺激)
图18显示使用靶基因的证据组织的列表(参见表1)的经训练的示例性贝叶斯网络模型对来自GSE16011的患者神经胶质瘤进行TGF-β细胞信号传导途径的活性预测。(图示:1–星形细胞瘤(II级);2–星形细胞瘤(III级);3–对照;4–多形性成胶质细胞瘤(IV级);5–少突-星形细胞肿瘤(II级);6–少突-星形细胞肿瘤(III级);7–少突神经胶质(II级);8–少突神经胶质(III级);9–纤维性星形细胞瘤(I级))
图19显示使用靶基因的证据组织的列表(参见表1)的经训练的示例性贝叶斯网络模型对来自GSE21653的乳腺癌样品进行TGF-β细胞信号传导途径的活性预测。(图示:1–管腔A;2–管腔B;3–HER2;4–基底的;5–大致正常)
图20-23分别显示使用靶基因的证据组织的列表、20个靶基因的短列表、12个靶基因的短列表和7个靶基因的短列表(参见表4-7)的经训练的示例性贝叶斯网络模型对来自GSE42373的A549肺腺癌细胞系的2D和3D培养物(用或不用10ng/mL TNF和2ng/mL TGF-β刺激)进行TGF-β细胞信号传导途径的活性预测。(图示:1–2D对照;2–2D TGF-β和TNFα;3–3D对照;4–3D TGF-β和TNFα)
图24例示使用经训练的示例性贝叶斯网络模型的Kaplan-Meier图中描述的神经胶质瘤患者(GSE16011)的预后,所述经训练的示例性贝叶斯网络模型使用靶基因的证据组织的列表(参见表1)。
图25说明使用经训练的示例性贝叶斯网络模型的Kaplan-Meier图中描述的乳腺癌患者(GSE6532、GSE9195、E-MTAB-365、GSE20685和GSE21653)的预后,所述经训练的示例性贝叶斯网络模型使用靶基因的证据组织的列表(参见表1)。
图26显示基于TGF-β细胞信号传导途径的推定靶基因的广泛文献列表的示例性贝叶斯网络模型的训练结果。(图示:1–对照;2–TGF-β以5ng/mL刺激0.5h;3–TGF-β以5ng/mL刺激1h;4–TGF-β以5ng/mL刺激2h;5–TGF-β以5ng/mL刺激4h;6–TGF-β以5ng/mL刺激8h;7–TGF-β以5ng/mL刺激16h;8–TGF-β以5ng/mL刺激24h;9–TGF-β以5ng/mL刺激72h)
图27显示使用靶基因的广泛文献列表(参见表5)的经训练的示例性贝叶斯网络模型对来自GSE16011的患者神经胶质瘤进行TGF-β细胞信号传导途径的活性预测。(图示:1–星形细胞瘤(II级);2–星形细胞瘤(III级);3–对照;4–多形性成胶质细胞瘤(IV级);5–少突-星形细胞肿瘤(II级);6–少突-星形细胞肿瘤(III级);7–少突神经胶质(II级);8–少突神经胶质(III级);9–纤维性星形细胞瘤(I级))
图28显示使用推定靶基因的广泛文献列表(参见表5)的经训练的示例性贝叶斯网络模型对来自GSE21653的乳腺癌样品进行TGF-β细胞信号传导途径的活性预测。(图示:1–管腔A;2–管腔B;3–HER2;4–基底的;5–大致正常)
图29显示使用“11个靶基因列表”的经训练的贝叶斯网络模型对用精浆或5ng/mLTGF-β3刺激的外子宫颈上皮细胞(Ect1)(GSE35830)进行TGF-β细胞信号传导途径的活性预测。(图示:1–对照,无TGF-β;2–用10%精浆刺激;3–用5ng/mL TGF-β3刺激)
图30显示使用“11个靶基因+SERPINE1列表”的经训练的贝叶斯网络模型对用精浆或5ng/mL TGF-β3刺激的外子宫颈上皮细胞(Ect1)(GSE35830)进行TGF-β细胞信号传导途径的活性预测。(图示:1–对照,无TGF-β;2–用10%精浆刺激;3–用5ng/mL TGF-β3刺激)
图31显示使用“11个靶基因列表”的经训练的贝叶斯网络模型在A549肺腺癌细胞系的2D和3D培养物(用或不用10ng/mL TNF和2ng/mL TGF-β刺激)(GSE42373)中进行TGF-β细胞信号传导途径的活性预测。(图示:1–2D对照;2–2D TGF-β和TNFα;3–3D对照;4–3D TGF-β和TNFα)
图32显示使用“11个靶基因+SERPINE1列表”的经训练的贝叶斯网络模型在A549肺腺癌细胞系的2D和3D培养物(用或不用10ng/mL TNF和2ng/mL TGF-β刺激)(GSE42373)中进行TGF-β细胞信号传导途径的活性预测。(图示:1–2D对照;2–2D TGF-β和TNFα;3–3D对照;4–3D TGF-β和TNFα)
图33显示使用“11个靶基因列表”的经训练的贝叶斯网络模型在神经胶质瘤患者和一些来自GSE16011的对照样品上进行TGF-β细胞信号传导途径的活性预测。(图示:1–星形细胞瘤(II级);2–星形细胞瘤(III级);3–对照;4–多形性成胶质细胞瘤(IV级);5–少突-星形细胞肿瘤(II级);6–少突-星形细胞肿瘤(III级);7–少突神经胶质(II级);8–少突神经胶质(III级);9–纤维性星形细胞瘤(I级))
图34显示使用“11个靶基因+SERPINE1列表”的经训练的贝叶斯网络模型在神经胶质瘤患者和一些来自GSE16011的对照样品上进行TGF-β细胞信号传导途径的活性预测。(图示:1–星形细胞瘤(II级);2–星形细胞瘤(III级);3–对照;4–多形性成胶质细胞瘤(IV级);5–少突-星形细胞肿瘤(II级);6–少突-星形细胞肿瘤(III级);7–少突神经胶质(II级);8–少突神经胶质(III级);9–纤维性星形细胞瘤(I级))
具体实施方案
以下实施例仅仅说明具体优选的方法和与其相关的所选方面。其中提供的教导可用于构建几种测试和/或试剂盒,例如用于检测、预测和/或诊断一或多种细胞信号传导途径的异常活性。此外,使用如本文所述的方法之后,可以有利地指导药物处方,可以进行药物反应预测和药效(和/或副作用)的监测,可以预测和监测药物抗性,例如选择后续待进行的测试(如伴随诊断测试)。以下实施例不应解释为限制本发明的范围。
实施例1:数学模型构建
如公开的国际专利申请WO2013/011479A2(“Assessment of cellular signalingpathway activity using probabilistic modeling of target gene expression”)中所详述,通过构建概率模型,例如,贝叶斯网络模型,并引入细胞信号传导途径(本文中,TGF-β细胞信号传导途径)的一或多个靶基因的表达水平和转录因子(TF)元件(本文中,TGF-βTF元件,控制细胞信号传导途径的一或多个靶基因的转录的TF元件)的水平之间的条件概率关系,此模型可以用于以高精确度测定细胞信号传导途径的活性。此外,通过调节条件概率和/或向模型中添加新的节点来代表额外的信息源,可以容易地升级概率模型来并入通过后期临床研究获得的额外知识。以这种方式,可以适当地升级概率模型来包括最近的医学知识。
在公开的国际专利申请WO2014/102668A2(“Assessment of cellular signalingpathway activity using probabilistic modeling of target gene expression”)中所详述的另一个容易理解和解释的方法中,细胞信号传导途径(本文中,TGF-β细胞信号传导途径)的活性可以通过构建和评估线性或(假-)线性模型来测定,所述模型引入细胞信号传导途径的一或多个靶基因的表达水平和转录因子(TF)元件(本文中,TGF-βTF元件,控制细胞信号传导途径的一或多个靶基因的转录的TF元件)的水平之间的关系,所述模型基于一或多个靶基因的表达水平的一或多种线性组合。
在两种方法中,一或多个靶基因的表达水平可以优选是mRNA水平的测量,其可以是例如使用与靶基因的mRNA序列相关的探针的(RT)-PCR和微阵列技术以及RNA测序的结果。在另一个实施方案中,一或多个靶基因的表达水平可以通过蛋白水平,例如由靶基因编码的蛋白的浓度和/或活性进行测量。
上述表达水平可以任选以可能适合或不适合更好应用的许多方式进行转换。例如,表达水平的四种不同转化,例如,基于微阵列的mRNA水平,可以是:
“连续数据”,即如使用众所周知的算法诸如MAS5.0和fRMA在微阵列预处理之后获得的表达水平,
“z得分”,即连续表达水平这样换算,使得跨越所有样品的平均值为0并且标准偏差为1,
“离散的”,即高于特定阈值的每一个表达设为1,并且低于特定阈值的每一个表达设为0(例如探针组的阈值可以选择为在许多阳性临床样品和相同数目的阴性临床样品的组中的其值的(加权)中值),
“模糊的”,即使用下述形式的S型函数,将连续表达水平转换为0和1之间的值:1/(1+exp((thr–expr)/se)),其中expr是连续表达水平,thr是如先前提及的阈值,并且se是影响0和1之间的差异的软化参数。
可以构建的最简单的线性模型之一是在第一层中具有代表转录因子(TF)元件(本文中,TGF-βTF元件)的节点和在第二层中具有代表靶基因表达水平的直接测量(例如,通过例如在微阵列或(q)PCR实验中,与特定靶基因特别高度关联的一个探针组)的加权节点的模型。权重可以基于来自训练数据集的计算或基于专业知识。在其中每个靶基因个靶基因可能测量多重表达水平的情况下(例如在微阵列实验的情况下,其中一个靶基因个靶基因可以用多重探针组进行测量),使用仅一种表达水平/靶基因的该方法是特别简单的。选择用于特定靶基因的一种表达水平的一种特定方法是使用来自探针组的表达水平,所述探针组能够最佳分开训练数据集的活性和非活性样品。测定该探针组的一种方法是执行统计检验,例如t检验,并且选择具有最低p值的探针组。具有最低p值的探针组的训练数据集的表达水平通过限定具有(已知)活性和非活性样品的表达水平重叠的可能性最小概率的探针组。另一种选择方法是基于优势比(odds-ratios)。在此类模型中,对于一或多个靶基因各自提供一或多种表达水平,并且一或多种线性组合包含对于一或多个靶基因各自包括加权项的线性组合,每个加权项基于对于相应的靶基因提供的一或多种表达水平的仅一种表达水平。如果如上所述每个靶基因选择仅一种表达水平,则该模型可以被称为“最具判别性的探针组”模型。
作为“最具判别性的探针组”模型的替代物,在其中每个靶基因可能测量多重表达水平的情况下,能够利用每个靶基因提供的所有表达水平。在此类模型中,对于一或多个靶基因各自提供一或多种表达水平,并且其中一或多种线性组合包含对于一或多个靶基因提供的一或多种表达水平的所有表达水平的线性组合。换言之,对于一或多个靶基因各自,对于相应的靶基因提供的一或多种表达水平各自可以在线性组合中通过其自身(个别)权重进行加权。该变体可以被称为“所有探针组”模型。它具有相对简单同时利用所有提供的表达水平的优点。
如上所述的两个模型的共同之处在于它们可以视为“单层”模型,其中TF元件的活性水平基于一或多个靶基因的一或多种探针组的表达水平的线性组合进行计算。
在TF元件(本文中,TGF-βTF元件)的活性水平已通过评估分别模型进行确定之后,确定的TF元件活性水平可以是有阈值的,以便推断细胞信号传导途径(本文中,TGF-β细胞信号传导途径)的活性。计算此类适当阈值的优选方法是通过比较已知具有非活性细胞信号传导途径的训练样品和具有活性细胞信号传导途径的训练样品的测定的TF元件活性水平wlc。这样做且还考虑到这些组中的方差的方法通过使用阈值获得
其中σ和μ是训练样品测定的TF元件活性水平wlc的标准偏差和平均值。在仅少数样品在活性和/或非活性训练样品中可获得的情况下,可以将假计数加入基于两组方差的平均值计算的方差中:
其中v是测定的TF元件活性水平wlc的组方差,x是阳性假计数,例如1或10,nact和npas分别是活性和非活性样品的数量。标准偏差σ接下来可以通过获得方差v的平方根来获得。
为了便于解释,阈值可以从测定的TF元件活性水平wlc中扣除,导致细胞信号传导途径的活性得分,其中负值对应于非活性细胞信号传导途径,并且正值对应于活性细胞信号传导途径。
作为上述“单层”模型的替代物,在一个实例中也可以使用“双层”。在此模型中,对于各靶基因,基于其相关探针组的测量强度,使用线性组合计算概括值(“第一(底)层”)。计算的概括值随后与使用进一步线性组合的细胞信号传导途径的其它靶基因的概括值组合(“第二(顶)层”)。再次,权重可以由训练数据集学习或基于专业知识或其组合。换种说法,在“双层”模型中,对于一或多个靶基因各自提供一或多种表达水平,并且一种或多种线性组合对于一或多个靶基因各自包含对于相应的靶基因提供的一或多种表达水平的所有表达水平的第一线性组合(“第一(底)层”)。该模型进一步基于对于一或多个靶基因各自包括加权项的进一步线性组合,各加权项基于对于相应的靶基因的第一线性组合(“第二(顶)层”)。
在优选形式的“双层”模型中,概括值的计算可以包括使用训练数据对于各靶基因限定阈值,并且从计算的线性组合中减除阈值,获得靶基因概括。此处,可以选择阈值,使得负靶基因概括值对应于下调的靶基因,并且正靶基因概括值对应于上调的靶基因。另外,靶基因概括值在它们合并到“第二(上层)”之前,使用例如上述转化(模糊、离散等)之一进行转化是可能的。
在TF元件的水平已通过评估“双层”模型进行测定之后,测定的TF元件水平可以是有阈值的,以便推断细胞信号传导途径的活性,如上所述。
在下文中,上述模型统称为“(假-)线性模型”。概率模型(例如,贝叶斯网络模型)训练和使用的更详细描述提供于以下实施例3中。
实施例2:靶基因的选择
转录因子(TF)是蛋白复合物(即,以特定结构结合在一起的蛋白的组合)或蛋白,其能够通过结合特定DNA序列来调节靶基因的转录,由此控制从DNA至mRNA遗传信息的转录。由于TF复合物的这种作用直接产生的mRNA在本文中称为(转录因子的)“直接的靶基因”。细胞信号传导途径活化还可以产生更多二级基因转录,称为“间接的靶基因”。在下文中,优选包含直接的靶基因或者由其组成的(假-)线性模型或贝叶斯网络模型(作为示例性数学模型)作为细胞信号传导途径活性和mRNA水平之间的直接联系,然而直接和间接靶基因之间的区别并不总是明显的。本文中,呈现使用基于可获得的科学文献数据的评分函数选择直接靶基因的方法。尽管如此,由于有限的信息以及生物学变异和不确定性,不能排除间接的靶基因的意外选择。为了选择靶基因,在www.ncbi.nlm.nih.gov/pubmed可得且本文中进一步被称为“Pubmed”的美国国立卫生研究所的MEDLINE数据库用于生成靶基因的两个列表。另外,基于靶基因表达的证明性质选出三个额外的靶基因列表。
在2013年第4季度和2014年第1季度期间,使用查询例如(“TGF-β”AND“targetgene”)检索包含推定TGF-β靶基因的出版物。进一步遵循下面更详细描述的方法手动分析所得出版物。
根据积累证据的科学实验的类型,通过使用其中对于特定靶基因的科学证据给予等级的排序系统,从科学文献中选择特定细胞信号传导途径mRNA靶基因。尽管一些实验证据仅仅暗示基因为直接靶基因,例如在其中已知TGF-β细胞信号传导途径是有活性的细胞系的微阵列上增加的mRNA(通过探针组强度增加测定),但其它证据可以是非常有力的,如鉴定的TGF-β细胞信号传导途径TF结合位点和细胞中特定细胞信号传导途径的刺激后染色质免疫沉淀(ChIP)测定中该位点的取回以及细胞系中细胞信号传导途径的特定刺激后mRNA的增加的组合。
可以在科学文献中鉴定用于发现特定细胞信号传导途径靶基因的几种类型的实验:
1.ChIP实验,其中显示了感兴趣的细胞信号传导途径的TF与它在基因组上的结合位点的直接结合。实例:通过使用染色质免疫沉淀(ChIP)技术,随后将具有和不具有活性的TGF-β细胞信号传导途径的诱导(例如通过用TGF-β刺激)的细胞系的DNA中的假定的功能TGF-βTF转录因子结合位点鉴定为仅基于核苷酸序列识别的结合位点的亚组。将假定的功能性鉴定为来源于ChIP的证据,其证明发现TF结合DNA结合位点。
2.电泳迁移率变化(EMSA)测定,其显示了TF与含有结合序列的DNA片段的体外结合。相比于基于ChIP的证据,基于EMSA的证据更弱,因为它无法被翻译为体内情形。
3.细胞信号传导途径的刺激和使用微阵列测量mRNA表达、RNA测序、定量PCR或其他技术,使用TGF-β细胞信号传导途径诱导的细胞系并测量在存在放线菌酮的情况下诱导后至少一个,优选几个时间点测量的mRNA概况,其抑制翻译为蛋白,因此假定诱导的mRNA是直接的靶基因。
4.与3类似,但使用蛋白质丰度测量,例如western印记来测量更下游的mRNA表达。
5.使用生物信息学方法鉴定基因组中的TF结合位点。对于TGF-βTF元件的实例:使用SMAD结合基序5'-AGAC-3',在人基因组序列上运行软件方法,并鉴定基因启动子区中和其它基因组区中潜在的结合位点。
6.与3类似,仅仅不存在放线菌酮。
7.与4类似,仅仅不存在放线菌酮。
以最简单的形式,技术人员可以对其中基因被鉴定为TGF-β转录因子家族的目标基因的这些实验方法的各自给予每一种潜在的基因1分。使用该相对排序策略,技术人员可以形成最可靠的靶基因的列表。
可选地,可以使用以另一种方式的排序来鉴定最可能是直接的靶基因的靶基因,通过给予提供体内直接靶基因最多证据的技术更高数目的分。在上文的列表中,这将表示对实验方法1)为8分,对2)为7分,并且降低至对实验方法8为1分。此类列表可以被称为“一般靶基因列表”。
尽管存在生物学变异和不确定性,但本发明人假定直接的靶基因最可能以组织不依赖的形式来诱导。这些靶基因的列表可被称为“证据组织(evidence curated)的靶基因的列表”。已经使用此类证据组织的靶基因的列表来构建TGF-β细胞信号传导途径的计算模型,其可以应用于来自不同组织来源的样品。
以下将示例说明如何针对TGF-β细胞信号传导途径具体构建证据组织的靶基因列表的选择。
引入评分函数,其对于出版物中报道的每种类型的实验证据(诸如ChIP、EMSA、差异表达、敲低/敲除、荧光素酶基因报道测定、序列分析)给出分。相同的实验证据有时在多个出版物中提到,其产生相应数量的分,例如,两个出版物提到ChIP发现导致针对单一ChIP发现的两倍的得分。进行进一步分析以仅允许具有不同类型的实验证据、而不仅仅一种类型的实验证据(例如,差异表达)的基因。选择那些具有多于一种类型可获知的实验证据的基因(如表1中所示)。
发明人做了进一步的证据组织的靶基因的列表(列于表2)的选择。选择那些经证实更有证明力从训练样品中确定TGF-β信号信号传导途径的活性的证据组织的靶基因的列表。本文中,来自GSE17708经5ng/mL TGF-β刺激4小时的样品选作活性或者促进肿瘤TGF-β活性样品,而未刺激的样品选作非活性或抑制肿瘤TGF-β样品进行训练,另外,可以使用经TGF-β刺激并去除TGF-β的原代细胞的患者样品或其他细胞系,例如GSE6653、GSE42373和GSE18670。在活性和非活性训练样品之间对负调控靶基因具有大于2或小于0.5的“软”优势比(见下文)的所有靶基因被选作“20个靶基因短列表”。经证实具有大于10或小于0.1的“软”优势比的靶基因被选作“12个靶基因短列表”(见表3)。“7个靶基因短列表”(见表4)由经证实具有大于15或小于1/15的“软”优势比的靶基因组成。所述20个靶基因短列表、12个靶基因短列表和7个靶基因短列表分别示于表5-7。
表1:TGF-β细胞信号传导途径模型中使用的TGF-β细胞信号传导途径的“证据组织的靶基因的列表”和用于测量靶基因的mRNA表达水平的相关探针组。
表2:基于TGF-β靶基因的证据组织的列表的TGF-β靶基因的“20个靶基因短列表”。
靶基因
ANGPTL4
CDC42EP3
CDKN1A
CTGF
GADD45A
GADD45B
HMGA2
ID1
IL11
JUNB
PDGFB
PTHLH
SGK1
SKIL
SMAD4
SMAD5
SMAD6
SMAD7
SNAI2
VEGFA
表3:基于TGF-β靶基因的证据组织的列表的TGF-β靶基因的“12个靶基因短列表”。
表4:基于TGF-β靶基因的证据组织的列表的TGF-β靶基因的“7个靶基因短列表”。
靶基因
ANGPTL4
CDC42EP3
ID1
IL11
JUNB
SKIL
SMAD7
实施例3:训练和使用数学模型
数学模型可用于推断细胞信号传导途径(本文中为受试者中的TGF-β细胞信号传导途径)的活性之前,必须适当训练该模型。
如果所述数学途径模型是概率模型,例如,贝叶斯网络模型,其基于将TGF-βTF元件的活性水平与受试者的样品中测量的TGF-β细胞信号传导途径的三个或更多个靶基因的表达水平关联的条件概率,所述训练可优选如公开的国际专利申请WO2013/011479A2(“Assessment of cellular signaling pathway activity using probabilisticmodeling of target gene expression”)中详细描述进行。
如果所述数学途径模型基于受试者的样品中测量的TGF-β细胞信号传导途径的三个或更多个靶基因的表达水平的一或多种线性组合,所述训练可优选如公开的国际专利申请WO2014/102668A2(“Assessment of cellular signaling pathway activity usinglinear combination(s)of target gene expressions”)中详细描述进行。
本文中,如图2中所示的示例性贝叶斯网络模型用于以简单的方式对TGF-β细胞信号传导途径的转录程序建模。所述模型由三种类型的节点组成:(a)第一层1中的转录因子(TF)元件(状态为“不存在”和“存在”);(b)第二层2中的靶基因TG1、TG2、TGn(状态为“下”和“上”);(c)第三层3中的与靶基因的表达水平连接的测量节点。这些可以是微阵列探针组PS1.1、PS1.2、PS1.3、PS2.1、PSn.1、PSn.m(状态为“低”和“高”),如本文优选使用,但也可以是其它基因表达测量,诸如RNAseq或RT-qPCR。
数学模型(本文中,示例性贝叶斯网络模型)的合适实施基于微阵列数据。该模型描述(i)靶基因的表达水平如何取决于TF元件的活化,和(ii)探针组强度进而如何取决于相应靶基因的表达水平。对于后者,探针组强度可以取自fRMA加工前的AffymetrixHG-U133Plus2.0微阵列,这广泛可得自GeneExpressionOmnibus(GEO,www.ncbi.nlm.nih.gov/geo)和ArrayExpress(www.ebi.ac.uk/arrayexpress)。
由于示例性贝叶斯网络模型是细胞信号传导途径(本文中,TGF-β细胞信号传导途径)的生物学的简化,且由于生物学测量通常有噪音,选择概率方法,即,以概率术语描述(i)TF件和靶基因,以及(ii)靶基因和它们各自的探针组之间的关系。此外,假设驱动肿瘤生长的致癌细胞信号传导途径的活性没有瞬时和动态改变,但长期或甚至不可逆改变。因此,开发示例性贝叶斯网络模型用于解释静态细胞状态。由于该原因,没有将复杂动态细胞信号传导途径特征并入模型。
一旦建立和校准示例性贝叶斯网络模型(参见下文),该模型可以通过输入探针组测量值作为第三层3中的观察值且在模型中回推对于TF元件必须“存在”何种概率而用于新样品的微阵列数据上。此处,“存在”被认为是TF元件结合至DNA且控制细胞信号传导途径的靶基因的转录的现象,且“不存在”被认为是TF元件不控制转录的情况。该可能性因此是可用于指示细胞信号传导途径(本文中,TGF-β细胞信号传导途径)的活性的初始读出值,其接下来可以通过取有活性相比于无活性的概率的比率而转化为细胞信号传导途径有活性的几率(即,如果p是细胞信号传导途径有活性的预测概率,几率以p/(1-p)给出)。
在示例性贝叶斯网络模型中,已经使概率关系为定量的,以允许定量概率推理。为了改善组织类型间的概况行为,已经小心精选描述(i)TF元件和靶基因之间的概率关系的参数。如果TF元件为“不存在”,最可能靶基因是“下”,因此对此选择0.95的概率,并且对为“上”的靶基因选择0.05的概率。后者(非零)概率解释靶基因受其它因子调节或意外地观察为“上”(例如由于测量噪音)的(罕见)概率。如果TF元件“存在”,则靶基因以0.70的概率被认为“上”,并且靶基因以0.30的概率被认为“下”。以这种方式选择后者值,因为可以存在即使TF元件存在靶基因也并未高度表达(例如因为基因启动子区被甲基化)的几种原因。在靶基因并未由TF元件上调但却下调的情况下,以相似的方式选择概率,但反映存在TF元件的情况下的下调。已经对实验数据校准描述(ii)靶基因和它们各自的探针组之间的关系的参数。对于后者,在本实施例中,使用来自已知具有TGF-β活性细胞信号传导途径的患者样品的微阵列数据,而来自相同数据集的健康样品用作非活性TGF-β活性细胞信号传导途径的样品,但这也可以使用细胞系实验或其他具有已知的细胞信号传导途径的活性状态的患者样品来进行。产生的条件概率表如下所示:
A:对于上调的靶基因
B:对于下调的靶基因
在这些表中,变量ALi,j、AHi,j、PLi,j和PHi,j代表具有“存在”(A)或“不存在”(B)转录复合体的校准样品数量,其分别具有“低”(L)或“高”(H)探针组强度。已加入虚拟计数避免0和1的极值。
为了使观察到的探针组强度离散化,针对每个探针组PSi,j使用阈值ti,j,低于该阈值的观察值称为“低”,高于该阈值的观察值称为“高”。该阈值被选作所用校准数据集中的探针组的(加权)中值强度。由于微阵列数据的噪音,在将观察到的探针组强度与其阈值进行比较时,使用模糊方法,假定在报道强度附近具有0.25(在log2尺度上)标准差的正态分布,并确定低于和高于阈值的概率质量。
如果使用上述实施例1中所述(假)线性模型代替上述示例性贝叶斯网络,在该模型能用于推断测试样品中的细胞信号传导途径的活性之前,需要确定指示结点和调用结点“不存在”或“存在”的阈值之间的关联的符号和量级的权重。可以使用专业知识先验地填充权重和阈值,但通常模型使用训练样品的代表性组进行训练,其中优选地基础事实是已知的。例如具有已知存在转录因子复合物(=活性途径)或不存在转录因子复合物(=非活性途径)的样品中的探针组的表达数据。
本领域已知考虑模型拓扑学且改变模型参数(此处权重和阈值)的训练算法(例如回归)的量级,使得模型输出(此处加权的线性得分)得到优化。另外,也可能直接由观察到的表达水平计算权重,而无需优化算法。
本文中名为“黑和白”方法的第一种方法归结为三元系统,其中每一个加权是集合{-1,0,1}的元件。如果将这放入生物学背景下,则-1和1对应于在细胞信号传导途径活性的情况下分别下调和上调的靶基因或探针组。在探针组或靶基因不能统计上证明为上调或下调的情况下,它收到0的权重。在一个实例中,可以使用活性细胞信号传导途径样品的表达水平相比于具有非活性细胞信号传导途径的样品的表达水平的左侧和右侧,两样品t检验,以测定探针或基因是上调还是下调,这考虑到使用的训练数据。在其中活性样品的平均值统计上大于非活性样品(即p值低于一定阈值,例如0.3)的情况下,靶基因或探针组被确定为上调的。相反,在其中活性样品的平均值统计上低于非活性样品的情况下,该靶基因或探针组被确定为在细胞信号传导途径活化后是下调的。在最低p值(左侧或右侧)超过上述阈值的情况下,该靶基因或探针组的权重可以被定义为0。
本文中名为“对数几率”-权重的第二种方法基于优势比的算法(例如基础e)。基于探针组/靶基因水平高于和低于相应阈值的阳性和阴性训练样品数目,所述阈值例如所有训练样品的加权中值,计算关于每个靶基因或探针组的优势比。可以加入假计数,以避免除以零。进一步的精化是通过下述以略微更随机的方式计数高于/低于阈值的样品:假定探针组/靶基因水平例如以某一指定的标准偏差(例如在2-log尺度上0.25)在其观察值周围正态分布,并且计数高于和低于阈值的概率质量。本文中,与假计数组合并使用概率质量而非确定性测量值计算的优势比称为“软”优势比。
关于使用靶基因表达的数学模型推断细胞信号传导途径的活性的进一步细节可见于Verhaegh W.et al.,“Selection of personalized patient therapy through theuse of knowledge-based computational models that identify tumor-drivingsignal transduction pathways”,Cancer Research,Vol.74,No.11,2014,2936-2945页。
本文中,经5ng/mL TGF-β处理、导致TGF-β细胞信号传导途径的肿瘤促进活性(此后称作TGF-β活性)的人A549肺腺癌细胞系样品、以及无TGF-β刺激、导致TGF-β细胞信号传导途径的肿瘤抑制活性(此后称作TGF-β非活性)的对照试验用作校准。这些微阵列以GSE17708的名义可从基因表达omnibus(GEO,www.ncbi.nlm.nih.gov/geo/,最后一次访问,2014年3月5日)公开获得。经5ng/mL TGF-β刺激4小时的样品选作活性或肿瘤促进的TGF-β细胞系的代表,基于所选基因(表1)与被选作非活性或肿瘤抑制的TGF-β样品相比观察到的倍数变化,进行训练。可选的,可以使用经TGF-β刺激并去除TGF-β的原代细胞的患者样品或其他细胞系,例如GSE6653、GSE42373和GSE18670。
图9-12分别显示基于TGF-β细胞信号传导途径的靶基因的证据组织的列表、20个靶基因的短列表、12个靶基因的短列表和7个靶基因的短列表(参见表1-4)的示例性贝叶斯网络模型的训练结果。在所述示意图中,纵轴代表TF元件是“存在”或“不存在”的几率,其对应于TGF-β细胞信号传导途径的活性或非活性,其中横轴以上的值对应于TF元件更有可能“存在”/活性,横轴以下的值对应于“不存在”/非活性的几率比“存在”/活性的几率更大。用TGF-β刺激4小时的A549细胞系样品(第5组)用于代表活性或肿瘤促进的训练样品,而未刺激的样品(第1组)用作非活性或肿瘤抑制TGF-β细胞信号传导途径的代表。使用不同靶基因列表的模型能够明确区分非活性和活性的训练样品。另外,可以从结果获知所有1小时或更长的刺激均导致对所有四个靶基因列表具有肿瘤促进活性的TGF-β细胞信号传导途径。用TGF-β刺激0.5h导致从TGF-β非活性到活性的不同的TGF-β活性,这可能是由相对较短的TGF-β刺激造成的。
随后,图13-23分别显示使用靶基因的证据组织的列表、20个靶基因的短列表、12个靶基因的短列表和7个靶基因的短列表的经训练的示例性贝叶斯网络模型的验证结果。
图13-16分别显示使用靶基因的证据组织的列表、20个靶基因的短列表、12个靶基因的短列表和7个靶基因的短列表(参见表1-4)的经训练的示例性贝叶斯网络模型对来自GSE28448的人乳腺上皮细胞(HMEC-TR)进行TGF-β细胞信号传导途径的活性预测。在所述示意图中,纵轴代表TF元件是“存在”或“不存在”的几率,其对应于TGF-β细胞信号传导途径的活性或非活性,其中横轴以上的值对应于TF元件更有可能“存在”/活性,横轴以下的值对应于“不存在”/非活性的几率比“存在”/活性的几率更大。每个条代表来自数据集的样品。一些样品用针对TIFγ(第5、第6组)或SMAD4(第3、第4组)的siRNA转染,另外一组样品由对照组成(未转染,第1、第2组)。第2、4、6组中的样品用5ng/mL TGF-β刺激,第1、3、5组中的样品未刺激。与对应的未刺激样品相比,使用不同靶基因列表的模型均正确预测了所有4个靶基因列表在第2组(对照)和第6组(TIFγ-沉默)的TGF-β刺激样品中增加的TGF-β活性,而在SMAD-沉默的样品(第4组)中无显著增加。(参见Hesling C.et al.,“Antagonisticregulation of EMT by TIF1γand SMAD4in mammary epithelial cells”,EMBOReports,Vol.12,No.7,2011,665-672页)
图17显示使用靶基因的证据组织的列表(参见表1)的经训练的示例性贝叶斯网络模型对来自GSE35830的外子宫颈上皮细胞(Ect1)进行TGF-β细胞信号传导途径的活性预测,所述细胞用精浆或5ng/mL TGF-β3刺激。在所述示意图中,纵轴代表TF元件是“存在”或“不存在”的几率,其对应于TGF-β细胞信号传导途径的活性或非活性,其中横轴以上的值对应于TF元件更有可能“存在”/活性,横轴以下的值对应于“不存在”/非活性的几率比“存在”/活性的几率更大。每个条代表来自数据集的样品。精浆也包含高水平的TGF-β1、TGF-β2和TGF-β3。但它们主要(95%-99%)以潜伏变体而非活性形式存在(参见Sharkey D.J.etal.,“TGF-beta mediates proinflammatory seminal fluid signaling in humancervical epithelial cells”,Journal of Immunology,Vol.189,No.2,2012,1024-1035页)。第三和第四(即四个中的两个)TGF-β3刺激样品(第3组)显示对于肿瘤促进TGF-β活性的强烈倾向,另外两种样品,即第一和第二样品经聚类分析证实与精液组(第2组)的第三和第四样品更相似。未刺激的样品(第1组)正确预测了非活性或肿瘤抑制TGF-β活性,而用精浆刺激的样品经预测具有TGF-β活性,介于大部分潜伏(即非活性)TGF-β亚型和对TGF-β途径较低的刺激造成的活性之间。
图18显示使用靶基因的证据组织的列表(参见表1)的经训练的示例性贝叶斯网络模型对来自GSE16011的患者神经胶质瘤进行TGF-β细胞信号传导途径的活性预测。在所述示意图中,纵轴代表TF元件是“存在”或“不存在”的几率,其对应于TGF-β细胞信号传导途径的活性或非活性,其中横轴以上的值对应于TF元件更有可能“存在”/活性,横轴以下的值对应于“不存在”/非活性的几率比“存在”/活性的几率更大。每个条代表来自数据集的样品。从文献得知,神经胶质瘤比正常细胞产生更多TGF-β(所有亚型)(参见Kaminska B.et al.,“TGF beta signaling and its role in glioma pathogenesis”,Advances inExperimental Medicine and Biology,Vol.986,2013,171-187页)。这在预测的TGF-β活性中也可见,其对于所有对照(第3组)是阴性的,而在约15%的神经胶质瘤中(第1、2、4-9组)预测到肿瘤促进TGF-β,预计因为TGF-β分泌在这些肿瘤中增加。
图19显示使用靶基因的证据组织的列表(参见表1)的经训练的示例性贝叶斯网络模型对来自GSE21653的乳腺癌样品进行TGF-β细胞信号传导途径的活性预测。在所述示意图中,纵轴代表TF元件是“存在”或“不存在”的几率,其对应于TGF-β细胞信号传导途径的活性或非活性,其中横轴以上的值对应于TF元件更有可能“存在”/活性,横轴以下的值对应于“不存在”/非活性的几率比“存在”/活性的几率更大。每个条代表来自数据集的样品。如预期,大多数乳腺癌预计具有非活性的TGF-β细胞信号传导途径。与预期一致的还有,最大部分的TGF-β活性或肿瘤促进TGF-β活性见于基底样品中。
图20-23分别显示使用靶基因的证据组织的列表、20个靶基因的短列表、12个靶基因的短列表和7个靶基因的短列表(参见表4-7)的经训练的示例性贝叶斯网络模型对来自GSE42373的A549肺腺癌细胞系的2D和3D培养物(用或不用10ng/mL TNF和2ng/mL TGF-β刺激)进行TGF-β细胞信号传导途径的活性预测。在所述示意图中,纵轴代表TF元件是“存在”或“不存在”的几率,其对应于TGF-β细胞信号传导途径的活性或非活性,其中横轴以上的值对应于TF元件更有可能“存在”/活性,横轴以下的值对应于“不存在”/非活性的几率比“存在”/活性的几率更大。每个条代表来自数据集的样品。et al.,“Epigeneticcoordination of signaling pathways during the epithelial-mesenchymaltransition”,Epigenetics&Chromatin,Vol.6,No.1,2013证实,在这些实验中,上皮间质转化(EMT)在3D培养模式中被有效诱导。这在TGF-β细胞信号传导途径的活性预测中也被证实,来自该组(第4组)的两个样品是仅有的被预测具有已知造成EMT的肿瘤促进TGF-β活性的样品。未经刺激的2D培养对照组(第1组)被正确预测无TGF-β活性,而经刺激的2D培养物(第2组)明显不能引发TGF-β肿瘤促进活性(无EMT),这也被et al证实。未经刺激的3D培养样品(第3组)经预测也具有非活性的TGF-β活性,虽然几率非常小。
图24说明Kaplan-Meier图中描述的284个神经胶质瘤患者(GSE16011,也可参见图18)的总生存数。在所述示意图中,纵轴代表一部分患者组的总生存数,横轴代表以年计时。图表代表肿瘤抑制TGF-β细胞信号传导途径(TGF-β非活性,虚线)对于总生存数具有保护性,而具有肿瘤促进TGF-β活性与显著更高的死亡风险相关(由曲线更陡的坡代表)。(具有预期活性TGF-βTF元件的患者组由37名患者组成(实线),而具有预期非活性TGF-βTF元件的患者组由235名患者组成(虚线))。TGF-βTF元件的活性水平的预后价值在TGF-β活性的预计可能性的危害比:2.17(95%CI:1.44–3.28,p=1.22e-4)中也得到证实,肿瘤促进TGF-β活性患者的中位生存期是0.7年,而肿瘤抑制TGF-β患者的中位生存期是1.34年。
图25说明Kaplan-Meier图中描述的乳腺癌患者(GSE6532、GSE9195、E-MTAB-365、GSE20685和GSE21653)的预后。在所述示意图中,纵轴代表一部分患者组的总生存数,横轴代表以月计时。图表代表肿瘤抑制TGF-β细胞信号传导途径(TGF-β非活性,虚线)对于无病生存具有保护性,而具有肿瘤促进TGF-β活性与显著更高的疾病复发风险相关(由曲线更陡的坡代表)。(具有预期活性TGF-βTF元件的患者组由103名患者组成(实线),而具有预期非活性TGF-βTF元件的患者组由1066名患者组成(虚线))。TGF-βTF元件的活性水平的预后价值在TGF-β活性的预计可能性的危害比:3.66(95%CI:2.37–5.33,p=4.0e-10)中也得到证实,75%生存,其中肿瘤促进TGF-β活性患者是2.3年,而肿瘤抑制TGF-β患者是6.4年。
开发进行样品测量的专用测定,例如在使用qPCR来测定靶基因的mRNA水平的整合平台上而非应用校准数学模型(例如,示例性贝叶斯网络模型)到来自微阵列或RNA测序的mRNA输入数据在临床应用中可能是有利的。然后可以将公开的靶基因的RNA/DNA序列用于确定在此类平台上选择何种引物和探针。
此类专用测定的确认可以通过使用基于微阵列的数学模型作为参考模型并且验证所开发的测定在一组确认样品上是否产生相似结果来完成。除专用测定外,还可以使用RNA测序数据作为输入测量建立并校准类似的数学模型来完成这一点。
基于以微阵列/RNA测序为基础、使用校准数学模型(例如,示例性贝叶斯网络模型)的调查所发现的最佳指示特定细胞信号传导途径的活性的靶基因的组能够转变为在受试者的样品上进行的多元定量PCR测定和/或解释表达测量和/或推断TGF-β细胞信号传导途径的活性的计算机。为了针对细胞信号传导途径的活性开发此类测试(例如,中央服务实验室中的FDA许可或CLIA遗弃的测试或仅用于研究的实验室研发的测试),需要开发标准化测试试剂盒,其需要在临床试验中临床验证以获得监管许可。
本发明涉及一种通过数字处理设备执行的、推断受试者中的TGF-β细胞信号传导途径的活性的计算机执行方法,其中所述推断基于受试者样品中测量的TGF-β细胞信号传导途径的三个或更多个靶基因的表达水平。本发明还涉及一种推断受试者中的TGF-β细胞信号传导途径的活性的装置,包含经配置以执行此方法的数字处理器,一种推断受试者中的TGF-β细胞信号传导途径的活性的非临时性存储介质,其存储可由数字处理设备执行以执行此方法的指令,以及一种推断受试者中的TGF-β细胞信号传导途径的活性的计算机程序,其包含当所述计算机程序在数字处理设备上运行时,用于引起数字处理设备执行此方法的程序代码装置。
所述方法可以用于,例如,诊断TGF-β细胞信号传导途径的(异常)活性,基于TGF-β细胞信号传导途径的推断活性的预后,基于TGF-β细胞信号传导途径的推断活性在临床试验中登记受试者,选择待进行的随后测试,选择伴随诊断测试,临床决策支持系统等。在这方面,参考公开的国际专利申请WO2013/011479A2(“Assessment of cellular signalingpathway activity using probabilistic modeling of target gene expression”),公开的国际专利申请WO2014/102668A2(“Assessment of cellular signaling pathwayactivity using linear combination(s)of target gene expressions”),和VerhaeghW.et al.,“Selection of personalized patient therapy through the use ofknowledge-based computational models that identify tumor-driving signaltransduction pathways”,Cancer Research,Vol.74,No.11,2014,2936-2945页,其更详细地描述这些应用。
实施例4:比较证据组织的列表与广泛文献列表
基于文献证据,按照本文所述程序构建的TGF-β靶基因列表(“靶基因的证据组织的列表”,参见表1)在此与未按照上述程序构建的推断的TGF-β靶基因的“广泛文献列表”进行比较。该可选列表是归因于对Thomson-Reuters’s Metacore(最后访问于May 14,2013)中提供的TGF-β细胞信号传导途径的活性响应的基因的汇编。在该数据库中查询在SMAD蛋白家族,即SMAD1、SMAD2、SMAD3、SMAD4、SMAD5和/或SMAD8下游直接被调控的基因。该查询得到217个独特的基因。基于支持SMAD家族造成的对各自基因转录调控的公开文献的数量进行进一步筛选。具有三篇或更多篇参考文献的基因被选入广泛文献列表。换言之,未对参考文献进行人工管理,也未基于实验证据进行证据得分计算。该程序产生61个基因,其中一个micro-RNA(MIR29B2)在Affymetrix HG-U133Plus2.0微阵列平台上没有提供,一个基因(BGLAP)经证实在根据R的生物传导器插件的Affymetrix HG-U133Plus2.0微阵列平台上没有探针组。最终产生59个推定的TGF-β靶基因,其示于表5中,连同Affymetrix HG-U133Plus2.0微阵列平台上的相关探针组。
表5:TGF-β细胞信号传导途径模型中所用的推定的TGF-β靶基因的“广泛文献列表”以及用于测量所述基因的mRNA表达水平的相关探针组
随后,使用本文所述程序构建示例性贝叶斯网络模型。与基于证据组织的列表的TGF-β细胞信号传导途径的描述类似,使用来自GSE17708的fRMA加工数据对探针组与其各自推定的包括广泛文献列表的该模型的TGF-β靶基因之间的边缘的条件概率列表进行训练。图26中所示训练结果示出非活性(第1组)和活性(第5组)训练样品之间的清晰间隔。与基于证据组织的列表的贝叶斯模型的训练结果(参见图9-12)相比,发现途径活性的更极端值,尤其是在第2和第3组中。在所述示意图中,纵轴代表TF元件是“存在”或“不存在”的几率,其对应于TGF-β细胞信号传导途径的活性或非活性,其中横轴以上的值对应于TF元件更有可能“存在”/活性,横轴以下的值对应于“不存在”/非活性的几率比“存在”/活性的几率更大。每个条代表来自数据集的样品。
接着在一定数量的数据集上测试基于广泛文献列表的训练的示例性网络贝叶斯模型。
图27显示基于广泛文献列表的经训练的示例性贝叶斯网络模型对来自GSE16011的患者神经胶质瘤进行TGF-β细胞信号传导途径的活性预测。在所述示意图中,纵轴代表TF元件是“存在”或“不存在”的几率,其对应于TGF-β细胞信号传导途径的活性或非活性,其中横轴以上的值对应于TF元件更有可能“存在”/活性,横轴以下的值对应于“不存在”/非活性的几率比“存在”/活性的几率更大。每个条代表来自数据集的样品。尽管由文献已知神经胶质瘤产生比正常细胞更多的TGF-β(所有亚型)(参见Kaminska B.et al.,“TGF betasignaling and its role in glioma pathogenesis”,Advances in ExperimentalMedicine and Biology,Vol.986,2013,171-187页),但大部分(>50%)的多形性成胶质细胞瘤(IV级)患者(第4组)明显过高估计了具有活性TGF-β细胞信号传导途径的肿瘤数量。另一方面,所有对照(第3组)的TGF-β肿瘤促进活性被正确的预测为阴性。
图28显示基于广泛文献列表的经训练的贝叶斯网络模型对来自GSE21653的乳腺癌样品进行TGF-β细胞信号传导途径的活性预测。在所述示意图中,纵轴代表TF元件是“存在”或“不存在”的几率,其对应于TGF-β细胞信号传导途径的活性或非活性,其中横轴以上的值对应于TF元件更有可能“存在”/活性,横轴以下的值对应于“不存在”/非活性的几率比“存在”/活性的几率更大。每个条代表来自数据集的样品。预料不到的是,大多数乳腺癌样品被预测具有肿瘤促进TGF-β细胞信号传导途径。另外,在管腔A亚型中发现了最大部分的具有肿瘤促进TGF-β活性的患者样品。管腔A已知在不同乳腺癌亚型中具有最好的预后,其并不对应于TGF-β肿瘤促进活性的攻击性。
实施例5:选择SERPINE1作为真实的TGF-β靶基因
2015年1月对TGF-β细胞信号传导途径进行可获得的文献证据的修正,还包括所有截至2015年1月19日的新科技文献。类似的,使用在“www.ncbi.nlm.nih.gov/pubmed”可得的美国国立卫生研究所的MEDLINE数据库,使用查询诸如(“TGF-β”AND“target gene”),发现出版物。在使用上述实施例2中所述方法学人工评价一些作为TGF-β细胞信号传导途径的推定靶基因的靶基因的实验证据的科技文献后,发现了一些推定的TGF-β靶基因,其在2013年第4季度和2014年第1季度期间的首次评价中未被发掘。对所有可获知的实验证据进行重新评估,使用上述实施例2中所述方法学,基于每个推定靶基因的可获知的实验证据的强度,准备推定靶基因的新排名。这产生了另一个推定的TGF-β靶基因,即SERPINE1,其获得了在设置阈值之上的实验证据得分。因此,SERPINE1被认为是TGF-β细胞信号传导途径的真实的直接靶基因,并经测试为TGF-β细胞信号传导途径的活性的改善的推论。
使用基于11个排名最高的靶基因ANGPTL4、CDC42EP3、CDKN1A、CTGF、GADD45B、ID1、JUNB、SKIL、SMAD7、SNAI2和VEGFA,加上或不加上新筛选的SERPINE1,使用如上述实施例3所述的相同的数据和方法训练的两个贝叶斯网络模型,分别产生了“11个靶基因+SERPINE1列表”(参见表6)和“11个靶基因列表”(参见表7)。
表6:TGF-β靶基因的“11个靶基因+SERPINE1列表”(或“修正的12个靶基因短列表”)。
靶基因
ANGPTL4
CDC42EP3
CDKN1A
CTGF
GADD45B
ID1
JUNB
SERPINE1
SKIL
SMAD7
SNAI2
VEGFA
表7:TGF-β靶基因的“11个靶基因列表”
基于另外囊括的SERPINE1基因,靶基因列表(参见表2和4)可被修正为另外的非限制性实施方案,如表8和表9所述。
表8:TGF-β靶基因的“修正的20个靶基因短列表”
靶基因
ANGPTL4
CDC42EP3
CDKN1A
CTGF
GADD45A
GADD45B
HMGA2
ID1
JUNB
PDGFB
PTHLH
SERPINE1
SGK1
SKIL
SMAD4
SMAD5
SMAD6
SMAD7
SNAI2
VEGFA
表9:TGF-β靶基因的“修正的7个靶基因短列表”
靶基因
ANGPTL4
CDC42EP3
ID1
JUNB
SERPINE1
SKIL
SMAD7
在途径活性水平的数学推理中多包括一个靶基因预期对于途径活性水平预测影响较小,其预期精确衡量途径活性水平。然而,经确定除了该预期影响,在几个实例中也有显著不同的途径活性,这只能由SERPINE1对途径活性推断具有预料不到的有利影响来解释。
图29和图30显示使用两种模型在用精浆或5ng/mL TGF-β3刺激或未加刺激的来自GSE35830的Ect1中进行TGF-β细胞信号传导途径的活性预测。清晰可见,将SERPINE1作为额外靶基因改善了所述模型以更高准确性检测非活性样品的能力。另外,用精浆刺激的第二组和用TGF-β3刺激的第三组的模型预测更准确,因为它们预测更高的TGF-β细胞信号传导途径的活性。
在2D和3D培养并用或不用TNF和TGF-β刺激的A549肺腺癌细胞系样品中发现了第二例改善的TGF-β细胞信号传导途径的活性预测。使用“11个靶基因列表”贝叶斯网络模型和“11个靶基因+SERPINE1”贝叶斯网络模型的模型预测示于图31和32中。EMT仅在经刺激的3D培养模型(第4组)中被有效诱导。与“11个靶基因列表”模型相比,该EMT的诱导在“11个靶基因+SERPINE1列表”中被更精确地诊断,并且考虑了第3组和第4组之间的相对差异。
第3个实例是使用两种模型在来自GSE16011的神经胶质瘤患者和一些对照样品中的TGF-β细胞信号传导途径的活性预测。从文献中已知TGF-β信号传导在神经胶质瘤中起到重要作用(see B.Kaminska et al.,“TGF beta signaling and its role in gliomapathogenesis”,Advances in Experimental Medicine and Biology,Vol.986,2013,171-187页)。与“11个靶基因列表”贝叶斯网络模型相比,基于TGF-β靶基因的“11个靶基因+SERPINE1列表”的贝叶斯网络模型改善了非活性与活性样品的分离。另外,更大部分的患者被预测具有活性TGF-β细胞信号传导途径,这与科学共识更一致(参见例如Kaminska etal.)。另外,正常的脑样品预计更可能具有非活性的TGF-β细胞信号传导途径,这与TGF-β细胞信号传导途径预期的肿瘤抑制作用或非活性作用的事实一致。
最后一个证明通过在数学途径模型中包括SERPINE1改善TGF-β细胞信号传导途径的活性预测的实例通过比较来自GSE16011的284个神经胶质瘤患者、使用基于TGF-β靶基因的“11个靶基因+SERPINE1列表”与靶基因的“11个靶基因列表”的贝叶斯网络模型的Cox的回归分析结果来示出。如图33和34中所示,在使用TGF-β靶基因的“11个靶基因+SERPINE1列表”时,TGF-β细胞信号传导途径的活性可能的危害比显著更高:2.57,p=7.87e-10vs2.33,p=3.06e-7。
实施例6:例证本发明的进一步信息
(1)测定基因表达水平
来自本文所述的独特的一组靶基因的数据被进一步用于使用本文描述的方法推断TGF-β细胞信号传导途径的活性。
用于分析提取样品中的基因表达水平的方法是普遍知晓的。例如Northern印记、PCR、巢式PCR、定量实时PCR(qPCR)、RNA-seq或微阵列的方法均可用于获得基因表达水平的数据。本领域已知用于分析靶基因的基因表达的所有方法均涵盖在本文中。
使用基于PCR的方法确定基因表达产物的方法具有特别用途。为了使用PCR对基因表达水平进行定量,通常使用常规定量实时PCR(qPCR)在每个循环的扩增后去实时测定PCR产物的累积,估测每种感兴趣的PCR产物的数量。这通常使用可检测的报告子,例如嵌入染料、小沟结合染料或荧光探针,由此使用光激发报告子发出荧光,产生的荧光通常使用例如在U.S专利6,713,297中公开的CCD相机或光电倍增管检测系统检测,其通过引用并入本文。
在一些实施方案中,用于在定量实时PCR(qPCR)测定中检测PCR产物的探针可包括荧光标记。有多种可商购的荧光标记。例如,Molecular Probes,Inc.(Eugene,Oreg.)销售多种荧光染料。非限制性实例包括Cy5、Cy3、TAMRA、R6G、R110、ROX、JOE、FAM、Texas RedTM和Oregon GreenTM。另外的荧光标记可包括IDT ZEN Double-Quenched Probes,其具有在qPCR测定中的传统5′水解探针。这些探针可包括例如具有3’TAMRA Quencher、3’Black HoleQuencher(BHQ,Biosearch Technologies)或内部ZEN Quencher和3’Iowa BlackFluorescent Quencher(IBFQ)的5′FAM染料。
可使用本领域熟知的方法将根据本发明有用的荧光染料附着于寡核苷酸引物。例如,将荧光标记添加至寡核苷酸的一种常用方式是将染料的N-羟基琥珀酰亚胺(NHS)酯与靶上的反应性氨基反应。核苷酸可经修饰以携带反应性氨基,例如在核碱基上纳入烯丙基氨基。通过烯丙基氨基的标记例如在U.S.专利5,476,928和5,958,691中描述,其通过引用并入本文。其他方式的荧光标记核苷酸、寡核苷酸和多核苷酸是本领域技术人员熟知的。
其他荧光方式包括使用基因检测系统例如SYBR-green染料,如U.S.专利5,436,134和5,658,751所公开,当嵌入从任何基因表达产物扩增的DNA时其发出荧光,所述专利通过引用并入本文。
确定靶基因表达水平的另外的有用方法包括RNA-seq,这是一个用于转录组分析的强大的分析工具,包括不同生理条件之间的基因表达水平差异,或发育期间或疾病发展期间发生的变化。
确定靶基因表达水平的另外的方法包括使用微阵列,例如本领域熟知的RNA和DNA微阵列。微阵列可用于同时定量大量基因的表达。
(2)确定TGF-β细胞信号传导活性的概括流程图
图3示出示例性例示推断分离自受试者的样品的TGF-β细胞信号传导活性的方法的流程图。首先,分离来自样品的mRNA(11)。其次,使用本领域已知的测定基因表达的方法测定独特的一组至少三个或更多个TGF-β靶基因的mRNA表达水平(12)。接着,使用将所述三个或更多个TGF-β靶基因的mRNA表达水平与TGF-βTF元件活性水平关联的校准数学途径模型(14)确定TGF-β转录因子(TF)元件(13)的活性水平。最后,基于所确定的受试者样品中的TGF-βTF元件的活性水平推断受试者中的TGF-β细胞信号传导途径的活性(15)。例如,如果活性在某一阈值之上,则TGF-β细胞信号传导途径确定为活性,如果活性在某一阈值之下,则归类为非活性。
(3)校准数学途径模型
如本文所述,本文所述的独特的一组三个或更多个TGF-β靶基因的表达水平用于使用本文进一步描述的校准数学途径模型确定TGF-βTF元件的活性水平。所述校准数学途径模型将所述三个或更多个TGF-β靶基因的表达水平与TGF-βTF元件活性水平关联。
如本文所述,校准数学途径模型基于数学途径模型的应用。例如,校准数学途径模型可基于概率模型,例如贝叶斯网络模型或线性或假线性模型。
在一个实施方案中,校准数学途径模型是整合了关联TGF-βTF元件和三个或更多个TGF-β靶基因的表达水平的条件概率关系的概率模型。在一个实施方案中,概率模型是贝叶斯网络模型。
在另一个实施方案中,校准数学途径模型可以是线性或假线性模型。在一个实施方案中,线性或假线性模型是本文进一步描述的线性或假线性组合模型。
图4示出示例性例示产生校准数学途径模型的方法的流程图。作为起始步骤,收集并标准化mRNA表达水平的训练数据。可使用例如微阵列探针组强度(101)、实时PCR Cq值(102)、原始RNAseq读段(103)或本领域已知的其他测量形式(104)收集数据。原始表达水平数据继而可通过使用标准化算法的标准化分别针对每种方法标准化,例如冷冻强壮多阵列分析(fRMA)或MAS5.0(111)、相对于参考基因平均Cq值的标准化(112)、读段标准化为每百万被安置读段的转录子的每千个碱基的读段/片段(RPKM/FPKM)(113)、或标准化w.r.t.参考基因/蛋白(114)。该标准化过程针对每种方法分别产生标准化的探针组强度(121)、标准化的Cq值(122)、标准化的RPKM/FPKM(123)或标准化的测量值(124),其代表训练样品中靶基因表达水平。
一旦训练数据被标准化,获得训练样品ID(131),从确定基因表达的方法之一获得这些特定样品的训练数据的训练数据(132)。来自训练样品的最终基因表达结果以训练数据(133)输出。整合来自不同训练样品的所有数据以校准模型(包括例如阈值,CPT,例如在概率或贝叶斯网络情况下,权重,例如在线性或假线性模型情况下等)(144)。另外,途径的靶基因和测量节点(141)用于产生例如图2所述模型结构(142)。产生的途径的模型结构(143)继而与训练数据(133)整合,以校准所述模型(144),其中靶基因的基因表达水平代表转录因子元件活性。作为训练样品中的TF元件确定的结果,产生校准的途径模型(145),其基于训练样品中靶基因表达水平,将TGF-β细胞信号传导途径的活性分配给后续检测的感兴趣的样品,例如来自患癌受试者。
(4)TF元件确定
图5示出示例性例示确定TF元件活性水平的方法的流程图。将来自从受试者提取的样品的表达水平数据(测试数据)(163)输入到校准的数学途径模型(145)。该数学途径模型可以是概率模型,例如贝叶斯网络模型,线性模型或假线性模型。
该数学途径模型可以是概率模型,例如贝叶斯网络模型,基于将TGF-βTF元件与在受试者样品中测得的TGF-β细胞信号传导途径的三个或更多个靶基因的表达水平关联的条件概率,或者所述数学模型可以基于在受试者样品中测得的TGF-β细胞信号传导途径的三个或更多个靶基因的表达水平的一或多种线性组合。具体的,确定TGF-β细胞信号传导途径的活性可以如公布的国际专利申请WO 2013/011479A2(“Assessment of cellularsignaling pathway activity using probabilistic modeling of target geneexpression”)中所公开的进行,其内容整体整合入本文。简言之,数据输入贝叶斯网络(BN)推理引擎调用(例如BNT工具箱)(154)。这产生BN中所有节点的计算的边缘BN概率(155)的一组值。从这些概率,确定转录因子(TF)节点的概率(156),并建立TF元件的活性水平(157)。
另外,数学模型可以是线性模型。例如,可以如公布的国际专利申请WO 2014/102668A2(“Assessment of cellular signaling pathway activity using linearcombination(s)of target gene expressions”)中所述使用线性模型,其内容整体整合入本文。关于使用靶基因表达的数学模型计算/确定细胞信号传导途径的进一步细节也可见于Verhaegh W.et al.,"Selection of personalized patient therapy through theuse of knowledge-based computational models that identify tumor-drivingsignal transduction pathways",Cancer Research,Vol.74,No.11,2014,2936-2945页。简言之,数据输入计算的加权线性组合得分(w/c)(151)。这产生计算的加权线性组合得分(152)的一组值。从这些加权线性组合得分,确定转录因子(TF)节点的加权线性组合得分(153),并建立TF元件的活性水平(157)。
(5)离散观测量的程序
图6示出推断受试者中作为离散观测量的TGF-β细胞信号传导途径的活性的方法的流程图。首先,提取测试样品并分配测试样品ID(161)。接着,收集并标准化mRNA表达水平的测试数据。可使用图5中讨论的针对训练样品的相同的方法收集测试数据,使用微阵列探针组强度(101)、实时PCR Cq值(102)、原始RNAseq读段(103)或其他测量形式(104)。原始表达水平数据继而可通过使用标准化算法的标准化分别针对每种方法标准化,例如冷冻强壮多阵列分析(fRMA)或MAS5.0(111)、相对于参考基因平均Cq值的标准化(112)、读段相对于RPKM/FPKM的标准化(113)、以及标准化w.r.t.参考基因/蛋白(114)。该标准化过程针对每种方法分别产生标准化的探针组强度(121)、标准化的Cq值(122)、标准化的RPKM/FPKM(123)或标准化的测量值(124)。
一旦测试数据被标准化,基于校准数学途径模型(145)在设定阈值步骤(164)中分析产生的测试数据(163),产生设定阈值的测试数据(165)。在使用离散观测量时,在一个非限制性实例中,每个高于某阈值的表达例如被给予值为1,低于该阈值的数值被给予值为0,或者在另外的实施方案中,本文所述阈值之上的概率质量用作阈值数值。基于校准数学途径模型,该数值代表TF元件的活性水平(157),其继而用于计算细胞信号传导途径的活性(171)。最终的输出给出受试者中细胞信号传导途径的活性(172)。
(6)持续观测量的程序
图7示出推断受试者中作为持续观测量的TGF-β细胞信号传导途径的活性的方法的流程图。首先,提取测试样品并分配测试样品ID(161)。接着,收集并标准化mRNA表达水平的测试数据(162)。可使用与图5中讨论的针对训练样品的相同的方法收集测试数据,使用微阵列探针组强度(101)、实时PCR Cq值(102)、原始RNAseq读段(103)或其他测量形式(104)。原始表达水平数据继而可通过使用标准化算法的标准化分别针对每种方法标准化,例如冷冻强壮多阵列分析(fRMA)或MAS5.0(111)、相对于参考基因平均Cq值的标准化(112)、读段相对于RPKM/FPKM的标准化(113)、或标准化w.r.t.参考基因/蛋白(114)。该标准化过程针对每种方法分别产生标准化的探针组强度(121)、标准化的Cq值(122)、标准化的RPKM/FPKM(123)或标准化的测量值(124)。
一旦测试数据被标准化,在校准数学途径模型(145)中分析产生的测试数据(163)。在使用持续观测量时,作为一个非限制性实例,使用本文进一步详细描述的Sigmoid函数将表达水平转变成介于0和1之间的数值。本文所述TF元件测定与校准数学模型用于说明测试数据,产生的数值代表TF元件活性水平(157),其继而用于计算细胞信号途径的活性(171)。最终的输出给出个体中的细胞信号途径的活性(172)。
(7)靶基因表达水平确定程序
图8示出示例性例示推断从受试者提取的样品的靶基因表达水平的方法的流程图。在一个示例性实施方案中,接收样品并在实验室注册。样品可包括例如福尔马林固定、石蜡包埋(FFPE)样品(181)或新鲜冷冻(FF)样品(180)。FF样品可直接裂解(183)。对于FFPE样品,可在添加蛋白酶K时用加热孵育步骤去除石蜡(182)。继而裂解细胞(183),其破坏细胞和核膜,使得核酸(NA)可供进一步加工。核酸与固相结合(184),其可以是例如珠子或滤器。然后用清洗缓冲液清洗核酸,去除裂解后存在的所有细胞碎片(185)。清洁的核酸继而用洗脱缓冲液从固相分离(186)。通过DNAse处理去除DNA,以确保只有RNA存在于样品中(187)。核酸样品继而可以直接用于RT-qPCR样品混合物(188)。RT-qPCR样品混合物包含RNA样品、从RNA样品制备cDNA的RT酶以及扩增cDNA的PCR酶、确保酶行使功能的缓冲液,并且可能包含分子级的水以设置固定的体积浓度。样品混合物继而可被加入包含干燥的RT-qPCR测定的多孔板(即96孔或384孔板)(189)。继而可以在PCR仪中根据规定的方案运行RT-qPCR(190)。示例性的PCR方案包括:i)50℃,30分钟;ii)95℃,5分钟;iii)95℃,15秒;iv)60℃,45秒;v)重复步骤iii和iv共50个循环。继而使用二阶导数方法,用原始数据确定Cq值(191)。导出Cq值进行分析(192)。
(8)TGF-β介导的疾病和病症以及治疗方法
如本文所述,本发明的方法和装置可用于评估受试者中的TGF-β细胞信号传导途径,例如疑似患有或患有疾病或病症的受试者,其中TGF-β细胞信号传导途径的状态全部或部分证明疾病的存在或进展。在一个实施方案中,本文提供一种治疗受试者的方法,其包含使用本文所述方法接收关于来自从受试者分离的样品的TGF-β细胞信号传导途径的活性状态的信息,并且如果关于TGF-β细胞信号传导途径的活性的信息代表活性TGF-β细胞信号传导途径,则施用给所述受试者TGF-β抑制剂。在一个具体实施方案中,TGF-β细胞信号传导途径活性指示设定为TGF-β细胞信号传导途径活化的几率的截断值为10:1、5:1、4:1、2:1、1:1、1:2、1:4、1:5、1:10。
可用于本发明的TGF-β抑制剂是熟知的。TGF-β抑制剂的实例包括,但不限于,Terameprocol、Fresolimumab、Sotatercept、Galunisertib、SB431542、LY2109761、LDN-193189、SB525334、SB505124、GW788388、LY364947、RepSox、LDN-193189HCl、K02288、LDN-214117、SD-208、EW-7197、ML347、LDN-212854、DMH1、Pirfenidone、Hesperetin、Trabedersen、Lerdelimumab、Metelimumab、trx-SARA、ID11、Ki26894或SB-431542。
在一个实施方案中,所述疾病或病症是自身免疫及其他免疫病症、癌症、支气管哮喘、心脏病、糖尿病、遗传性出血性毛细血管扩张症、马凡氏综合征、血管埃莱尔综合征、loeys-迪茨综合征、帕金森氏病、慢性肾脏病、多发性硬化症、肝、肺或肾纤维化等纤维化疾病、迪皮特朗病或阿尔茨海默病中的一种。
在一个具体实施方案中,受试者患有或疑似患有癌症,例如但不限于原发性肿瘤或转移性肿瘤、实体瘤、例如黑色素瘤、肺癌(包括肺腺癌、基底细胞癌、鳞状细胞癌、大细胞癌、细支气管肺泡癌、细支气管癌、非小细胞癌、小细胞癌、间皮瘤);乳腺癌(包括导管癌、小叶癌、炎性乳腺癌、透明细胞癌、黏液性癌、浆膜腔乳腺癌);结直肠癌(结肠癌、直肠癌、大肠腺癌);肛门癌;胰腺癌(包括胰腺腺癌、胰岛细胞癌、神经内分泌肿瘤);前列腺癌;前列腺腺癌;卵巢上皮癌(卵巢上皮性癌或表面上皮-间质肿瘤,包括浆液性肿瘤、子宫内膜样肿瘤和粘液性囊腺癌、性索-间质肿瘤);肝癌和胆管癌(包括肝癌、胆管癌、血管瘤);食管癌(包括食管腺癌和鳞状细胞癌);口腔和口咽鳞状细胞癌;涎腺腺样囊性癌;膀胱癌;膀胱癌;子宫癌(包括子宫内膜腺癌、眼、子宫乳头状浆液性癌、子宫透明细胞癌、子宫肉瘤和平滑肌肉瘤、混合苗勒氏肿瘤);神经胶质瘤、成胶质细胞瘤、成神经管细胞瘤以及其他脑瘤;肾癌(包括肾细胞癌、透明细胞癌、维尔姆肿瘤);头颈部癌(包括鳞状细胞癌);胃癌(胃癌、胃腺癌、胃肠道间质瘤);睾丸癌;生殖细胞肿瘤;神经内分泌肿瘤;宫颈癌;胃肠道、乳腺和其他器官的良性肿瘤;西涅细胞癌;间充质肿瘤,包括肉瘤、纤维肉瘤、血管瘤、血管瘤病、血管外皮细胞瘤、假血管瘤间质增生(pseudoangiomatous stromal hyperplasia)、肌纤维母细胞瘤、纤维瘤病、炎症性肌纤维母细胞瘤、脂肪瘤、血管脂肪瘤、颗粒细胞瘤、神经纤维瘤、神经鞘瘤、血管肉瘤、脂肪肉瘤、横纹肌肉瘤、骨肉瘤、脂肪肉瘤、平滑肌瘤、平滑肌肉瘤、皮肤癌、包括黑色素瘤、子宫颈癌、视网膜母细胞瘤、头颈部癌、胰腺、脑、甲状腺、睾丸、肾、膀胱、软组织、肾上腺、尿道、阴茎癌、粘液肉瘤、软骨肉瘤、骨肉瘤、脊索瘤、恶性纤维组织细胞瘤、淋巴管肉瘤、间皮瘤、鳞状细胞癌;表皮样癌、恶性皮肤附属器肿瘤、腺癌、肝癌、肝细胞癌、肾细胞癌、肾上腺样瘤、胆管癌、移行细胞癌、绒毛膜癌、精原细胞瘤、胚胎细胞癌、胶质瘤间变性(glioma anaplastic);多形性胶质母细胞瘤、神经母细胞瘤、髓母细胞瘤、恶性脑膜瘤、恶性神经鞘瘤、神经纤维肉瘤、甲状旁腺癌、甲状腺髓样癌、支气管类癌、嗜铬细胞瘤、胰岛细胞癌、恶性类癌、恶性副神经节瘤、黑色素瘤、默克尔细胞肿瘤(Merkel cell neoplasm)、叶状囊肉瘤、唾液癌、胸腺癌、阴道癌等。
在一个实施方案中,本文所述的方法可用于治疗患有淋巴瘤或淋巴细胞或骨髓细胞增殖病症或异常的宿主。例如,患有非霍奇金淋巴瘤的霍奇金淋巴瘤的受试者。例如,受试者可患有非霍奇金淋巴瘤,例如但不限于:与艾滋病有关的淋巴瘤;间变性大细胞淋巴瘤;血管免疫母细胞性淋巴瘤,爆发性NK细胞淋巴瘤;伯基特淋巴瘤,伯基特样淋巴瘤(小无裂细胞淋巴瘤);慢性淋巴细胞白血病/小淋巴细胞淋巴瘤;皮肤T细胞淋巴瘤;弥漫性大B细胞淋巴瘤;肠病型T细胞淋巴瘤;滤泡性淋巴瘤,肝脾γ-δT细胞淋巴瘤;淋巴母细胞淋巴瘤;套细胞淋巴瘤;边缘区淋巴瘤;鼻T细胞淋巴瘤;小儿淋巴瘤;外周T细胞淋巴瘤;原发性中枢神经系统淋巴瘤;T细胞白血病;转化淋巴瘤;治疗相关性T细胞淋巴瘤;或Waldenstrom氏巨大球蛋白血症。
或者,受试者可能患有霍奇金淋巴瘤,例如但不限于:结节性硬化症经典型霍奇金淋巴瘤(CHL);混合细胞CHL;淋巴细胞消耗CHL;富含淋巴细胞的CHL;淋巴细胞为主型霍奇金淋巴瘤;或结节性淋巴细胞为主型霍奇金淋巴瘤。
在一个实施方案中,受试者可能患有基于特异性T细胞、B细胞或NK细胞的淋巴瘤、增殖性病症或异常。例如,受试者可能患有特异性T细胞或NK细胞淋巴瘤,例如但不限于:外周T细胞淋巴瘤,例如外周T细胞淋巴瘤和没有另外指定的外周T细胞淋巴瘤(PTCL-NOS);间变性大细胞淋巴瘤,例如间变性淋巴瘤激酶(ALK)阳性,ALK阴性间变性大细胞淋巴瘤,或原发性皮肤间变性大细胞淋巴瘤;血管免疫母细胞淋巴瘤;皮肤T细胞淋巴瘤,例如蕈样真菌病,塞扎莱综合征,原发性皮肤间变性大细胞淋巴瘤,原发性皮肤CD30+T细胞淋巴增生性病症;原发性皮肤侵袭性表皮性CD8+细胞毒性T细胞淋巴瘤;原发性皮肤γ-δT细胞淋巴瘤;原发性皮肤小/中度CD4+T细胞淋巴瘤和淋巴瘤样丘疹病;成人T细胞白血病/淋巴瘤(ATLL);爆发性NK细胞淋巴瘤;肠病型T细胞淋巴瘤;血型γ-δT细胞淋巴瘤;淋巴细胞淋巴瘤;鼻NK/T细胞淋巴瘤;治疗相关性T细胞淋巴瘤;例如在实体器官或骨髓移植后出现的淋巴瘤;T细胞淋巴细胞白血病,T细胞大粒细胞淋巴细胞白血病;NK细胞慢性淋巴细胞增生性疾病;侵袭性NK细胞白血病;儿童系统性EBV+T细胞淋巴增殖性疾病(与慢性活性EBV感染相关);水痘样淋巴样淋巴瘤;成人T细胞白血病/淋巴瘤;肠病相关性T细胞淋巴瘤;肝脾T细胞淋巴瘤;或皮下脂膜炎样T细胞淋巴瘤。
或者,受试者可能患有特异性B细胞淋巴瘤或增殖性病症,例如但不限于:多发性骨髓瘤;弥漫性大B细胞淋巴瘤;滤泡性淋巴瘤;粘膜相关淋巴组织淋巴瘤(MALT);小细胞淋巴细胞淋巴瘤;套细胞淋巴瘤(MCL);伯基特淋巴瘤,纵隔大B细胞淋巴瘤;瓦尔登斯特伦巨球蛋白血症;淋巴结边缘区B细胞淋巴瘤(NMZL);脾边缘淋巴瘤(SMZL);血管内大B细胞淋巴瘤;原发性淋巴瘤;或淋巴瘤样肉芽肿病;慢性淋巴细胞白血病/小淋巴细胞淋巴瘤;B细胞幼淋巴细胞白血病;毛细胞白血病;脾淋巴瘤/白血病,无分类;脾弥漫性红髓小B细胞淋巴瘤;毛细胞白血病变体;淋巴浆细胞淋巴瘤;重链疾病,例如α重链疾病,γ重链病,μ重链疾病;血浆细胞骨髓瘤;骨孤立性浆细胞瘤;骨外浆细胞瘤;原发性皮肤滤泡中心淋巴瘤;T细胞/组织细胞丰富的大B细胞淋巴瘤;与慢性炎症相关的DLBCL;epstein-barr病毒(EBV)+老年人DLBCL;原发性纵隔(胸腺)大B细胞淋巴瘤;原发性皮肤DLBCL,腿型;ALK+大B细胞淋巴瘤;浆母细胞淋巴瘤;HHV8相关多中心引起的大B细胞淋巴瘤;Castlman病;B细胞淋巴瘤,无分类,具有弥漫性大B细胞淋巴瘤和伯基特淋巴瘤之间的特征;B细胞淋巴瘤,无分类,具有弥漫性大B细胞淋巴瘤和经典霍奇金淋巴瘤之间的特征;结节硬化型经典霍奇金淋巴瘤;淋巴细胞丰富的经典霍奇金淋巴瘤;混合细胞性经典霍奇金淋巴瘤;或淋巴细胞耗竭的经典霍奇金淋巴瘤。
在一个实施方案中,受试者患有白血病。例如,受试者可能患有淋巴细胞或骨髓源性的急性或慢性白血病,例如但不限于:急性淋巴细胞白血病(ALL);急性骨髓性白血病(AML);慢性淋巴细胞性白血病(CLL);慢性骨髓性白血病(CML);青少年骨髓单核细胞白血病(JMML);毛细胞白血病(HCL);急性早幼粒细胞白血病(AML亚型);T细胞淋巴细胞白血病(TPLL);大颗粒淋巴细胞白血病;或成人T细胞慢性白血病;大粒细胞淋巴细胞性白血病(LGL)。在一个实施方案中,受试者患有急性骨髓性白血病,例如未分化的AML(M0);成髓细胞白血病(M1;有或没有最小细胞成熟);成髓细胞白血病(M2;细胞成熟);早幼粒细胞白血病(M3或M3变体[M3V]);骨髓单核细胞白血病(M4或嗜酸粒细胞增多的M4变体[M4E]);单核细胞白血病(M5);红白血病(M6);或巨核细胞白血病(M7)。
在一个具体的实施方案中,受试者患有或疑似患有乳腺癌,肺癌,结肠癌,胰腺癌或脑癌。在一个具体实施方案中,受试者患有或疑似患有乳腺癌。
本申请描述了几个优选的实施例。本领域其它技术人员在阅读和理解了前述的详细描述后可以想到修改和替代。本发明旨在被构建为包括所有落入所附的权利要求或其等同形式的范围内的这种修改和替代。
本领域技术人员在实践声称的发明时,根据对图样、说明书、以及所附的权利要求的研究,能够理解并实施对公开的实施例的其它改变
在权利要求中,词语“包括”不排除其它元件或步骤,并且不定冠词“一”或“一个”不排除多个。
单独的单元或装置可以满足权利要求中所述几项的功能。某措施记载在相互不同的从属权利要求中的纯粹事实不指示不能有利地使用这些措施的组合。权利要求中的任何参考符号不应视为限制范围。
像一个或多个单元或设备执行的风险评估的确定的计算可以由任何其他数量的单元或设备执行。
计算机程序可以存储/分布在与其他硬件一起提供或作为其他硬件的一部分提供的合适的介质上,例如光学存储介质或固态介质,但也可以以其它形式分布,诸如通过因特网或其他有线或无线电信系统。
实施例6:本发明中所用序列表
序列表:
表10:TGF-β靶基因的寡核苷酸序列
表11:参考基因的寡核苷酸序列
序列表
<110> 皇家飞利浦有限公司
<120> 使用靶基因表达的数学建模评价TGF-β细胞信号传导途径的活性
<130> 2014PF00582
<160> 143
<170> PatentIn version 3.5
<210> 1
<211> 1905
<212> DNA
<213> Homo sapiens
<400> 1
ataaaaaccg tcctcgggcg cggcggggag aagccgagct gagcggatcc tcacacgact 60
gtgatccgat tctttccagc ggcttctgca accaagcggg tcttaccccc ggtcctccgc 120
gtctccagtc ctcgcacctg gaaccccaac gtccccgaga gtccccgaat ccccgctccc 180
aggctaccta agaggatgag cggtgctccg acggccgggg cagccctgat gctctgcgcc 240
gccaccgccg tgctactgag cgctcagggc ggacccgtgc agtccaagtc gccgcgcttt 300
gcgtcctggg acgagatgaa tgtcctggcg cacggactcc tgcagctcgg ccaggggctg 360
cgcgaacacg cggagcgcac ccgcagtcag ctgagcgcgc tggagcggcg cctgagcgcg 420
tgcgggtccg cctgtcaggg aaccgagggg tccaccgacc tcccgttagc ccctgagagc 480
cgggtggacc ctgaggtcct tcacagcctg cagacacaac tcaaggctca gaacagcagg 540
atccagcaac tcttccacaa ggtggcccag cagcagcggc acctggagaa gcagcacctg 600
cgaattcagc atctgcaaag ccagtttggc ctcctggacc acaagcacct agaccatgag 660
gtggccaagc ctgcccgaag aaagaggctg cccgagatgg cccagccagt tgacccggct 720
cacaatgtca gccgcctgca ccggctgccc agggattgcc aggagctgtt ccaggttggg 780
gagaggcaga gtggactatt tgaaatccag cctcaggggt ctccgccatt tttggtgaac 840
tgcaagatga cctcagatgg aggctggaca gtaattcaga ggcgccacga tggctcagtg 900
gacttcaacc ggccctggga agcctacaag gcggggtttg gggatcccca cggcgagttc 960
tggctgggtc tggagaaggt gcatagcatc acgggggacc gcaacagccg cctggccgtg 1020
cagctgcggg actgggatgg caacgccgag ttgctgcagt tctccgtgca cctgggtggc 1080
gaggacacgg cctatagcct gcagctcact gcacccgtgg ccggccagct gggcgccacc 1140
accgtcccac ccagcggcct ctccgtaccc ttctccactt gggaccagga tcacgacctc 1200
cgcagggaca agaactgcgc caagagcctc tctggaggct ggtggtttgg cacctgcagc 1260
cattccaacc tcaacggcca gtacttccgc tccatcccac agcagcggca gaagcttaag 1320
aagggaatct tctggaagac ctggcggggc cgctactacc cgctgcaggc caccaccatg 1380
ttgatccagc ccatggcagc agaggcagcc tcctagcgtc ctggctgggc ctggtcccag 1440
gcccacgaaa gacggtgact cttggctctg cccgaggatg tggccgttcc ctgcctgggc 1500
aggggctcca aggaggggcc atctggaaac ttgtggacag agaagaagac cacgactgga 1560
gaagccccct ttctgagtgc aggggggctg catgcgttgc ctcctgagat cgaggctgca 1620
ggatatgctc agactctaga ggcgtggacc aaggggcatg gagcttcact ccttgctggc 1680
cagggagttg gggactcaga gggaccactt ggggccagcc agactggcct caatggcgga 1740
ctcagtcaca ttgactgacg gggaccaggg cttgtgtggg tcgagagcgc cctcatggtg 1800
ctggtgctgt tgtgtgtagg tcccctgggg acacaagcag gcgccaatgg tatctgggcg 1860
gagctcacag agttcttgga ataaaagcaa cctcagaaca ctttg 1905
<210> 2
<211> 2088
<212> DNA
<213> Homo sapiens
<400> 2
tccgctccgt tcggccggtt ctcccgggaa gctattaata gcattacgtc agcctgggac 60
tggcaacacg gagtaaacga ccgcgccgcc agcctgaggg ctataaaagg ggtgatgcaa 120
cgctctccaa gccacagtcg cacgcagcca ggcgcgcact gcacagctct cttctctcgc 180
cgccgcccga gcgcaccctt cagcccgcgc gccggccgtg agtcctcggt gctcgcccgc 240
cggccagaca aacagcccgc ccgaccccgt cccgaccctg gccgccccga gcggagcctg 300
gagcaaaatg atgcttcaac acccaggcca ggtctctgcc tcggaagtga gtgcttctgc 360
catcgtcccc tgcctgtccc ctcctgggtc actggtgttt gaggattttg ctaacctgac 420
gccctttgtc aaggaagagc tgaggtttgc catccagaac aagcacctct gccaccggat 480
gtcctctgcg ctggaatcag tcactgtcag cgacagaccc ctcggggtgt ccatcacaaa 540
agccgaggta gcccctgaag aagatgaaag gaaaaagagg cgacgagaaa gaaataagat 600
tgcagctgca aagtgccgaa acaagaagaa ggagaagacg gagtgcctgc agaaagagtc 660
ggagaagctg gaaagtgtga atgctgaact gaaggctcag attgaggagc tcaagaacga 720
gaagcagcat ttgatataca tgctcaacct tcatcggccc acgtgtattg tccgggctca 780
gaatgggagg actccagaag atgagagaaa cctctttatc caacagataa aagaaggaac 840
attgcagagc taagcagtcg tggtatgggg gcgactgggg agtcctcatt gaatcctcat 900
tttataccca aaaccctgaa gccattggag agctgtcttc ctgtgtacct ctagaatccc 960
agcagcagag aaccatcaag gcgggagggc ctgcagtgat tcagcaggcc cttcccattc 1020
tgccccagag tgggtcttgg accagggcaa gtgcatcttt gcctcaactc caggatttag 1080
gccttaacac actggccatt cttatgttcc agatggcccc cagctggtgt cctgcccgcc 1140
tttcatctgg attctacaaa aaaccaggat gcccaccgtt aggattcagg cagcagtgtc 1200
tgtacctcgg gtgggaggga tggggccatc tccttcaccg tggctaccat tgtcactcgt 1260
aggggatgtg gagtgagaac agcatttagt gaagttgtgc aacggccagg gttgtgcttt 1320
ctagcaaata tgctgttatg tccagaaatt gtgtgtgcaa gaaaactagg caatgtactc 1380
ttccgatgtt tgtgtcacac aacactgatg tgacttttat atgctttttc tcagatctgg 1440
tttctaagag ttttgggggg cggggctgtc accacgtgca gtatctcaag atattcaggt 1500
ggccagaaga gcttgtcagc aagaggagga cagaattctc ccagcgttaa cacaaaatcc 1560
atgggcagta tgatggcagg tcctctgttg caaactcagt tccaaagtca caggaagaaa 1620
gcagaaagtt caacttccaa agggttagga ctctccactc aatgtcttag gtcaggagtt 1680
gtgtctaggc tggaagagcc aaagaatatt ccattttcct ttccttgtgg ttgaaaacca 1740
cagtcagtgg agagatgttt ggaaaccaca gtcagtggag cctgggtggt acccaggctt 1800
tagcattatt ggatgtcaat agcattgttt ttgtcatgta gctgttttaa gaaatctggc 1860
ccagggtgtt tgcagctgtg agaagtcact cacactggcc acaaggacgc tggctactgt 1920
ctattaaaat tctgatgttt ctgtgaaatt ctcagagtgt ttaattgtac tcaatggtat 1980
cattacaatt ttctgtaaga gaaaatatta cttatttatc ctagtattcc taacctgtca 2040
gaataataaa tattggaacc aagacatggt aaacaaaaaa aaaaaaaa 2088
<210> 3
<211> 760
<212> DNA
<213> Homo sapiens
<400> 3
gaggaaccga gaggctgaga ctaacccaga aacatccaat tctcaaactg aagctcgcac 60
tctcgcctcc agcatgaaag tctctgccgc ccttctgtgc ctgctgctca tagcagccac 120
cttcattccc caagggctcg ctcagccaga tgcaatcaat gccccagtca cctgctgtta 180
taacttcacc aataggaaga tctcagtgca gaggctcgcg agctatagaa gaatcaccag 240
cagcaagtgt cccaaagaag ctgtgatctt caagaccatt gtggccaagg agatctgtgc 300
tgaccccaag cagaagtggg ttcaggattc catggaccac ctggacaagc aaacccaaac 360
tccgaagact tgaacactca ctccacaacc caagaatctg cagctaactt attttcccct 420
agctttcccc agacaccctg ttttatttta ttataatgaa ttttgtttgt tgatgtgaaa 480
cattatgcct taagtaatgt taattcttat ttaagttatt gatgttttaa gtttatcttt 540
catggtacta gtgtttttta gatacagaga cttggggaaa ttgcttttcc tcttgaacca 600
cagttctacc cctgggatgt tttgagggtc tttgcaagaa tcattaatac aaagaatttt 660
ttttaacatt ccaatgcatt gctaaaatat tattgtggaa atgaatattt tgtaactatt 720
acaccaaata aatatatttt tgtacaaaaa aaaaaaaaaa 760
<210> 4
<211> 5715
<212> DNA
<213> Homo sapiens
<400> 4
cgcgcccacc ggagcccggg ctgagaggga cctggggagc tgcggcctgg ccggggcggc 60
gcactcaggt ggcctcgctt ccctgcgggt caccgcccgc cactcgcaca gctaggtcgg 120
cctgttggga tcgggagagg tgggcgcacg agttttagtg cgggagtccg gggtgcgggc 180
ggagtcctat tgtccccgtg cacccgggcg gcagcacctc cgggtccctc tttaaaccga 240
gcgtccggcg acctttcttt gtgcttaggg agtcgaaagc ggcatcttct ccgagagaag 300
tcgcctactg gggggtggcg ctggggaggt aacaatgggc gcccattgtc ctccgagggt 360
ccaacggtga cccccccccg cgcgcgcgcc cggccaccgg ttggccccgg gccagggcac 420
aggtaccgcg gctgggaggg tcggccccgc tgcccgcgcc ctccgccccg ccccagtgag 480
tccccgcgcc gccggccccg ccccgcgccg ccccgccctc cgcaggttca gtcctcgcgt 540
ccggccgccc cgcgctcagt cgcgcgcacc ttctctcgcg gccgggggac cgcagcgcgg 600
ggctagcccg gagacccggc caccggcctg gggcgccttc acgccgtctc ggagcggata 660
atgcggtgag caggcaccac gccggcagac tcggctggat ctgcgcacag cggcagggat 720
tgcgtgcgcc cgcgggaggc ccggggcagc ggctgggatc ctcagcggcg gccggtttgt 780
cctggttgtg gtcaagactg gatgatgtaa ctggctctct aggaagcctc acttggccgt 840
aacctcagga aggttctctt tgaccccatc tcatttcgaa gccacttctg aagccacttg 900
agaaaaatga tgtgacagtt cctatcaaaa aggattcaga aacatatacc atctgtgaag 960
aaagtggccc tttctcccgc ttgcaaaata gacattctca aattccaaaa tgccagccaa 1020
gaccccaatt tacctgaaag cagccaataa caagaaagga aagaaattta aactgaggga 1080
cattctgtct cctgatatga tcagtccccc gcttggagac tttcgccaca ccatccacat 1140
tggcaaagag ggccagcacg atgtctttgg agatatttcc tttcttcaag ggaactacga 1200
gcttttacct ggaaaccagg agaaagcaca cctgggccag ttccctgggc ataatgagtt 1260
cttccgggcc aacagcacct cggactctgt gttcacagaa acgccctccc cggtgctcaa 1320
aaatgccatc tccctcccga ccattggagg atcccaagct ctcatgttgc ccttattgtc 1380
accagtgaca tttaattcca aacaggagtc cttcgggcca gcaaagctgc ccaggcttag 1440
ctgcgagccc gtcatggagg aaaaagctca ggagaaaagc agtctgttgg agaatgggac 1500
agtccaccag ggagacacct cgtggggctc cagcggttct gcatctcagt ccagccaagg 1560
cagagacagc cactcctcca gcctgtccga acagtacccc gactggccag ccgaggacat 1620
gtttgaccat cccaccccat gcgagctcat caagggaaag actaagtcag aggagtccct 1680
ctctgacctt acaggttccc tcctctccct gcagcttgat cttgggccct cacttttgga 1740
tgaggtgctg aatgtaatgg ataaaaataa gtaacaagat gccaactttt ttcctttggg 1800
gtaaaaggta caaaaacaaa ctaaccacag ttgaagagaa gggcttccgg agctgtattt 1860
gcagttttgt gttgggtttt ctaaaataat attcttacaa agtatttttt tacctgttat 1920
gccctgtttg caaaaacaat ttagaaaaaa acaacaaagc aaaacctatc ttggcaaaaa 1980
aaggaagtga gtcagagccc attttcagga ggcattggtg atgttcggct cacatattgt 2040
ttgcagacac acaagaaatc tggcttggcc aggattggca ctagctatga agggctgagc 2100
gagtcacatt aaggaacttc acggaacttt atagcactcc gacattttct gagcaagagg 2160
aagtcaaaat ttatttaaca cctaagcctt tttgtagact cttttctata tattgcttag 2220
gctcaccata gcgaattctc cagtgttaaa acttttctgt tttcacattt gaactttatg 2280
ggttttgggg attttcttgt agttcttata tatccctata tattatatct atattgcaaa 2340
attttgactg tcagctacat gttggtaaga cacaggcaaa gtattactgt aactaagtta 2400
tttttaaagt taaaatatat ttttacgtgc ctttggcttt ttattgcaga gtctacattt 2460
tatagattct acatcagatg ttgtcactta tttccattgg gattccattg taagctgtgt 2520
atgtgcgtgt ttggaaaagt gtattcatac ttagtttttt tttcttcatc tgttatcata 2580
cttttaacag caaccaataa cggattgtaa agtgtaaagg cacaggttac tcatgatgct 2640
tctgcagaga ctgtgggcta caccacatat gttatttgga aatataggta ttttagtaca 2700
gtacatactt gcattacata ggtacttcaa gcaacacaat aaaaagtaaa tgataaagtg 2760
aacttgcttg tttatagtaa taaacaagac cataagagaa taagtatagc tagagaaatt 2820
gcttctctga aatgtacatg agcccttaag gtaagagatg atttccatct actctcattt 2880
tgattacttc cttatggttt gagaggctag aaactgagcc tctctacttt tggaaaaatg 2940
aacatgtgag gtcagatttt tttttttttt tttaagtcag cactgatgcc accctctcag 3000
tggtcatttc tgagcatctt cctgacttga acaccttcta cagcaaactc ttgcaagtcc 3060
agtttcatcc ctgtaaggca aatgtctttt cacgcagaaa gtgccatata gacgagataa 3120
aggcagctaa aacgagggca gtagagagca cttacccgac cccaaggtgc cagagatgcc 3180
ctgaggatgg tggttaagga aacaggagca ggaaatgtac acacagattc ctgtcccttt 3240
gccaactact ccttccccat caaagaaaaa cacttgcaca cagtaactac cagctccttc 3300
tctcaaactt gtatttctcc tggaaatgta tctcagaaat gacctcctct cccaaccact 3360
tcaacgattc tttctttggg tttggggttc ttgcagttct atcatctaaa ataacctttg 3420
gactgcaggt aaaatgcaat taggacaact aaccaagtag acgaaacaag ttcccctagg 3480
caggggtgtc caatatttta gcttccctgg accgcattgg aagaattttc ttgggccaca 3540
tgtaaaacac actaacacta accatagttg atgagcttaa aaaaataaaa atagaaaatt 3600
gcaaaaaaaa aaaaaaaaaa aaatctcaga ctgttttaag aaagtttaaa aatttgtgtt 3660
ggacttcatg cgggccacag gttggacaag cttgccctag ggcattgtgt gctttccgta 3720
acttctcagt tgtatttcgt tatccatgac tctccagtgt tttttctgtt ggaccacacc 3780
cgtcacagtt cacagttcca aagagaaatt tcccagccta ttctaaatct tgttaatgac 3840
gaagagtcca atgtatctca ttatttgtag ccaattttag actcttttca atacctcccc 3900
cccattttaa ttagtattga tcatattcag tctttcattt tactcttcat ctgtagcgtg 3960
acctcaaggt aaagatgaaa ctatttcatg aaaaggggag gagtatggct gtgcattagc 4020
tctactccct ctctggtaag tactggggag agaacagccc tgccagtact gggtttgata 4080
gattctaaat attaatcaca catcctgcct acagttagcc attttagttt ctgggagttc 4140
tttcatgtac attttcttcc attaattgaa ttaggtataa ttgagatggc aataaatatg 4200
cccgtattag aaagaggaaa caaagctaca tgcggcttat gattttgttg agtcacttct 4260
cccgaggcag cctttccaat gcctggtccc ttcccctgag agcaggtgga ctgctggtgg 4320
tggctttctt tcctgcagag aggcacttta gacccatacc tgctgtgagc tgaattgatg 4380
ttctcatcct gtgaaccttc tcccacttta acctaattta tctttacttg tttaaagata 4440
aggaaaccca agatgtactt tatttgcaaa ctcaaagcaa atggcgagcc acctgtgacc 4500
cagtaaccag aaaagaaacc atgccatttg tataagtaga gacacttctt gttgaggtag 4560
gcaaggctct tgtgagcgat ttttttcccc tagtgagacc taacaaaaga caagctatat 4620
catttctgcc tgaaattatc tgcttgaaaa gatcaaaata tcaggatact tagctcttca 4680
caaatatgaa gtcattatca catttcactg agccagaaat cactgttaac agcacacaca 4740
aaagactaca ctggttgaac agcaaagaga aacccgggtc tccagaatca cagtttagtc 4800
cttctatatt actgcaagtg acctgttttt tctgaaggct ccccgcaaat gaagtcctgg 4860
aatggaaaaa atccataagt ccataaatta acttgataaa tattttagaa cagacaaaag 4920
aaaatattga gtgatgtagt tctaatcctc ctaatatgga acctggcaag actgaatcat 4980
tttactgtga aatatataaa cacaatagaa tgagccaaca tgatggtttc tctccagtaa 5040
gagtttttct tttggaaatg aggttaacct agccccaaat ctagcaattc tcataaaatc 5100
cgattttaga attagcctcc cagattaatc tgaatgattg acttattttt tcttaggcaa 5160
gtcagtaagc cacccactag acagccatat ccagcaaaat aagagaagtt tccagatgcc 5220
aaatgataag ccaccatcaa cccagcgggg aagccttctg gttggtttgg ctgtatgaga 5280
ttcaggaagg ccagaatacc caaaattatt cacacgacgt taacttattg gtactggcta 5340
agcaatacat gtatttccta aaggaggaga tggtcttttg gttgatttat ggacacactt 5400
gtttcatctg actgtaaata tattgcatgc tttattctga tggtgcacta tttcatccag 5460
caagcttttc atctgagaat gtttaatgtt gaccttattc ttagagcaag tagatctaaa 5520
tatttttcag ctgagttatt agggagtcat tattctgtgg tacaatgctg caaaaagcat 5580
catgtggaag aatgggaact atgcttactt tatgaagtga tgtataacac aatgaaatct 5640
gttttacaac tactgtgctg catttaatta tcttccattt ttgctgttaa aaaaaaaaaa 5700
tccgttaatg atgtc 5715
<210> 5
<211> 4815
<212> DNA
<213> Homo sapiens
<400> 5
agtggcgtcg gaactgcaaa gcacctgtga gcttgcggaa gtcagttcag actccagccc 60
gctccagccc ggcccgaccc gaccgcaccc ggcgcctgcc ctcgctcggc gtccccggcc 120
agccatgggc ccttggagcc gcagcctctc ggcgctgctg ctgctgctgc aggtctcctc 180
ttggctctgc caggagccgg agccctgcca ccctggcttt gacgccgaga gctacacgtt 240
cacggtgccc cggcgccacc tggagagagg ccgcgtcctg ggcagagtga attttgaaga 300
ttgcaccggt cgacaaagga cagcctattt ttccctcgac acccgattca aagtgggcac 360
agatggtgtg attacagtca aaaggcctct acggtttcat aacccacaga tccatttctt 420
ggtctacgcc tgggactcca cctacagaaa gttttccacc aaagtcacgc tgaatacagt 480
ggggcaccac caccgccccc cgccccatca ggcctccgtt tctggaatcc aagcagaatt 540
gctcacattt cccaactcct ctcctggcct cagaagacag aagagagact gggttattcc 600
tcccatcagc tgcccagaaa atgaaaaagg cccatttcct aaaaacctgg ttcagatcaa 660
atccaacaaa gacaaagaag gcaaggtttt ctacagcatc actggccaag gagctgacac 720
accccctgtt ggtgtcttta ttattgaaag agaaacagga tggctgaagg tgacagagcc 780
tctggataga gaacgcattg ccacatacac tctcttctct cacgctgtgt catccaacgg 840
gaatgcagtt gaggatccaa tggagatttt gatcacggta accgatcaga atgacaacaa 900
gcccgaattc acccaggagg tctttaaggg gtctgtcatg gaaggtgctc ttccaggaac 960
ctctgtgatg gaggtcacag ccacagacgc ggacgatgat gtgaacacct acaatgccgc 1020
catcgcttac accatcctca gccaagatcc tgagctccct gacaaaaata tgttcaccat 1080
taacaggaac acaggagtca tcagtgtggt caccactggg ctggaccgag agagtttccc 1140
tacgtatacc ctggtggttc aagctgctga ccttcaaggt gaggggttaa gcacaacagc 1200
aacagctgtg atcacagtca ctgacaccaa cgataatcct ccgatcttca atcccaccac 1260
gtacaagggt caggtgcctg agaacgaggc taacgtcgta atcaccacac tgaaagtgac 1320
tgatgctgat gcccccaata ccccagcgtg ggaggctgta tacaccatat tgaatgatga 1380
tggtggacaa tttgtcgtca ccacaaatcc agtgaacaac gatggcattt tgaaaacagc 1440
aaagggcttg gattttgagg ccaagcagca gtacattcta cacgtagcag tgacgaatgt 1500
ggtacctttt gaggtctctc tcaccacctc cacagccacc gtcaccgtgg atgtgctgga 1560
tgtgaatgaa gcccccatct ttgtgcctcc tgaaaagaga gtggaagtgt ccgaggactt 1620
tggcgtgggc caggaaatca catcctacac tgcccaggag ccagacacat ttatggaaca 1680
gaaaataaca tatcggattt ggagagacac tgccaactgg ctggagatta atccggacac 1740
tggtgccatt tccactcggg ctgagctgga cagggaggat tttgagcacg tgaagaacag 1800
cacgtacaca gccctaatca tagctacaga caatggttct ccagttgcta ctggaacagg 1860
gacacttctg ctgatcctgt ctgatgtgaa tgacaacgcc cccataccag aacctcgaac 1920
tatattcttc tgtgagagga atccaaagcc tcaggtcata aacatcattg atgcagacct 1980
tcctcccaat acatctccct tcacagcaga actaacacac ggggcgagtg ccaactggac 2040
cattcagtac aacgacccaa cccaagaatc tatcattttg aagccaaaga tggccttaga 2100
ggtgggtgac tacaaaatca atctcaagct catggataac cagaataaag accaagtgac 2160
caccttagag gtcagcgtgt gtgactgtga aggggccgct ggcgtctgta ggaaggcaca 2220
gcctgtcgaa gcaggattgc aaattcctgc cattctgggg attcttggag gaattcttgc 2280
tttgctaatt ctgattctgc tgctcttgct gtttcttcgg aggagagcgg tggtcaaaga 2340
gcccttactg cccccagagg atgacacccg ggacaacgtt tattactatg atgaagaagg 2400
aggcggagaa gaggaccagg actttgactt gagccagctg cacaggggcc tggacgctcg 2460
gcctgaagtg actcgtaacg acgttgcacc aaccctcatg agtgtccccc ggtatcttcc 2520
ccgccctgcc aatcccgatg aaattggaaa ttttattgat gaaaatctga aagcggctga 2580
tactgacccc acagccccgc cttatgattc tctgctcgtg tttgactatg aaggaagcgg 2640
ttccgaagct gctagtctga gctccctgaa ctcctcagag tcagacaaag accaggacta 2700
tgactacttg aacgaatggg gcaatcgctt caagaagctg gctgacatgt acggaggcgg 2760
cgaggacgac taggggactc gagagaggcg ggccccagac ccatgtgctg ggaaatgcag 2820
aaatcacgtt gctggtggtt tttcagctcc cttcccttga gatgagtttc tggggaaaaa 2880
aaagagactg gttagtgatg cagttagtat agctttatac tctctccact ttatagctct 2940
aataagtttg tgttagaaaa gtttcgactt atttcttaaa gctttttttt ttttcccatc 3000
actctttaca tggtggtgat gtccaaaaga tacccaaatt ttaatattcc agaagaacaa 3060
ctttagcatc agaaggttca cccagcacct tgcagatttt cttaaggaat tttgtctcac 3120
ttttaaaaag aaggggagaa gtcagctact ctagttctgt tgttttgtgt atataatttt 3180
ttaaaaaaaa tttgtgtgct tctgctcatt actacactgg tgtgtccctc tgcctttttt 3240
ttttttttaa gacagggtct cattctatcg gccaggctgg agtgcagtgg tgcaatcaca 3300
gctcactgca gccttgtcct cccaggctca agctatcctt gcacctcagc ctcccaagta 3360
gctgggacca caggcatgca ccactacgca tgactaattt tttaaatatt tgagacgggg 3420
tctccctgtg ttacccaggc tggtctcaaa ctcctgggct caagtgatcc tcccatcttg 3480
gcctcccaga gtattgggat tacagacatg agccactgca cctgcccagc tccccaactc 3540
cctgccattt tttaagagac agtttcgctc catcgcccag gcctgggatg cagtgatgtg 3600
atcatagctc actgtaacct caaactctgg ggctcaagca gttctcccac cagcctcctt 3660
tttatttttt tgtacagatg gggtcttgct atgttgccca agctggtctt aaactcctgg 3720
cctcaagcaa tccttctgcc ttggcccccc aaagtgctgg gattgtgggc atgagctgct 3780
gtgcccagcc tccatgtttt aatatcaact ctcactcctg aattcagttg ctttgcccaa 3840
gataggagtt ctctgatgca gaaattattg ggctctttta gggtaagaag tttgtgtctt 3900
tgtctggcca catcttgact aggtattgtc tactctgaag acctttaatg gcttccctct 3960
ttcatctcct gagtatgtaa cttgcaatgg gcagctatcc agtgacttgt tctgagtaag 4020
tgtgttcatt aatgtttatt tagctctgaa gcaagagtga tatactccag gacttagaat 4080
agtgcctaaa gtgctgcagc caaagacaga gcggaactat gaaaagtggg cttggagatg 4140
gcaggagagc ttgtcattga gcctggcaat ttagcaaact gatgctgagg atgattgagg 4200
tgggtctacc tcatctctga aaattctgga aggaatggag gagtctcaac atgtgtttct 4260
gacacaagat ccgtggtttg tactcaaagc ccagaatccc caagtgcctg cttttgatga 4320
tgtctacaga aaatgctggc tgagctgaac acatttgccc aattccaggt gtgcacagaa 4380
aaccgagaat attcaaaatt ccaaattttt ttcttaggag caagaagaaa atgtggccct 4440
aaagggggtt agttgagggg tagggggtag tgaggatctt gatttggatc tctttttatt 4500
taaatgtgaa tttcaacttt tgacaatcaa agaaaagact tttgttgaaa tagctttact 4560
gtttctcaag tgttttggag aaaaaaatca accctgcaat cactttttgg aattgtcttg 4620
atttttcggc agttcaagct atatcgaata tagttctgtg tagagaatgt cactgtagtt 4680
ttgagtgtat acatgtgtgg gtgctgataa ttgtgtattt tctttggggg tggaaaagga 4740
aaacaattca agctgagaaa agtattctca aagatgcatt tttataaatt ttattaaaca 4800
attttgttaa accat 4815
<210> 6
<211> 2122
<212> DNA
<213> Homo sapiens
<400> 6
ggtggctatt ttgtccttgg gctgcctgtt ttcagctgct gcaaccacag ggatttcttc 60
tgttcaggcg ccatgtcaga accggctggg gatgtccgtc agaacccatg cggcagcaag 120
gcctgccgcc gcctcttcgg cccagtggac agcgagcagc tgagccgcga ctgtgatgcg 180
ctaatggcgg gctgcatcca ggaggcccgt gagcgatgga acttcgactt tgtcaccgag 240
acaccactgg agggtgactt cgcctgggag cgtgtgcggg gccttggcct gcccaagctc 300
taccttccca cggggccccg gcgaggccgg gatgagttgg gaggaggcag gcggcctggc 360
acctcacctg ctctgctgca ggggacagca gaggaagacc atgtggacct gtcactgtct 420
tgtacccttg tgcctcgctc aggggagcag gctgaagggt ccccaggtgg acctggagac 480
tctcagggtc gaaaacggcg gcagaccagc atgacagatt tctaccactc caaacgccgg 540
ctgatcttct ccaagaggaa gccctaatcc gcccacagga agcctgcagt cctggaagcg 600
cgagggcctc aaaggcccgc tctacatctt ctgccttagt ctcagtttgt gtgtcttaat 660
tattatttgt gttttaattt aaacacctcc tcatgtacat accctggccg ccccctgccc 720
cccagcctct ggcattagaa ttatttaaac aaaaactagg cggttgaatg agaggttcct 780
aagagtgctg ggcattttta ttttatgaaa tactatttaa agcctcctca tcccgtgttc 840
tccttttcct ctctcccgga ggttgggtgg gccggcttca tgccagctac ttcctcctcc 900
ccacttgtcc gctgggtggt accctctgga ggggtgtggc tccttcccat cgctgtcaca 960
ggcggttatg aaattcaccc cctttcctgg acactcagac ctgaattctt tttcatttga 1020
gaagtaaaca gatggcactt tgaaggggcc tcaccgagtg ggggcatcat caaaaacttt 1080
ggagtcccct cacctcctct aaggttgggc agggtgaccc tgaagtgagc acagcctagg 1140
gctgagctgg ggacctggta ccctcctggc tcttgatacc cccctctgtc ttgtgaaggc 1200
agggggaagg tggggtcctg gagcagacca ccccgcctgc cctcatggcc cctctgacct 1260
gcactgggga gcccgtctca gtgttgagcc ttttccctct ttggctcccc tgtacctttt 1320
gaggagcccc agctaccctt cttctccagc tgggctctgc aattcccctc tgctgctgtc 1380
cctccccctt gtcctttccc ttcagtaccc tctcagctcc aggtggctct gaggtgcctg 1440
tcccaccccc acccccagct caatggactg gaaggggaag ggacacacaa gaagaagggc 1500
accctagttc tacctcaggc agctcaagca gcgaccgccc cctcctctag ctgtgggggt 1560
gagggtccca tgtggtggca caggccccct tgagtggggt tatctctgtg ttaggggtat 1620
atgatggggg agtagatctt tctaggaggg agacactggc ccctcaaatc gtccagcgac 1680
cttcctcatc caccccatcc ctccccagtt cattgcactt tgattagcag cggaacaagg 1740
agtcagacat tttaagatgg tggcagtaga ggctatggac agggcatgcc acgtgggctc 1800
atatggggct gggagtagtt gtctttcctg gcactaacgt tgagcccctg gaggcactga 1860
agtgcttagt gtacttggag tattggggtc tgaccccaaa caccttccag ctcctgtaac 1920
atactggcct ggactgtttt ctctcggctc cccatgtgtc ctggttcccg tttctccacc 1980
tagactgtaa acctctcgag ggcagggacc acaccctgta ctgttctgtg tctttcacag 2040
ctcctcccac aatgctgaat atacagcagg tgctcaataa atgattctta gtgactttac 2100
ttgtaaaaaa aaaaaaaaaa aa 2122
<210> 7
<211> 3878
<212> DNA
<213> Homo sapiens
<400> 7
ggctccccac tctgccagag cgaggcgggg cagtgaggac tccgcgacgc gtccgcaccc 60
tgcggccaga gcggctttga gctcggctgc gtccgcgcta ggcgcttttt cccagaagca 120
atccaggcgc gcccgctggt tcttgagcgc caggaaaagc ccggagctaa cgaccggccg 180
ctcggccact gcacggggcc ccaagccgca gaaggacgac gggagggtaa tgaagctgag 240
cccaggtctc ctaggaagga gagagtgcgc cggagcagcg tgggaaagaa gggaagagtg 300
tcgttaagtt tacggccaac ggtggattat ccgggccgct gcgcgtctgg gggctgcgga 360
atgcgcgagg agaacaaggg catgcccagt gggggcggca gcgatgaggg tctggccagc 420
gccgcggcgc ggggactagt ggagaaggtg cgacagctcc tggaagccgg cgcggatccc 480
aacggagtca accgtttcgg gaggcgcgcg atccaggtca tgatgatggg cagcgcccgc 540
gtggcggagc tgctgctgct ccacggcgcg gagcccaact gcgcagaccc tgccactctc 600
acccgaccgg tgcatgatgc tgcccgggag ggcttcctgg acacgctggt ggtgctgcac 660
cgggccgggg cgcggctgga cgtgcgcgat gcctggggtc gtctgcccgt ggacttggcc 720
gaggagcggg gccaccgcga cgttgcaggg tacctgcgca cagccacggg ggactgacgc 780
caggttcccc agccgcccac aacgacttta ttttcttacc caatttccca cccccaccca 840
cctaattcga tgaaggctgc caacggggag cggcggaaag cctgtaagcc tgcaagcctg 900
tctgagactc acaggaagga ggagccgacc gggaataacc ttccatacat ttttttcttt 960
gtcttatctg gccctcgaca ctcaccatga agcgaaacac agagaagcgg atttccaggg 1020
atatttagga gtgtgtgaca ttccaggggt cgtttgcttt tcagggtttt ctgagggaaa 1080
gtgcatatga aatccttgac tggacctggt ggctacgaat cttccgatgg atgaatctcc 1140
cactccagcg ctgagtggga gaaggcagtg attagcactt gggtgacggc agtcgatgcg 1200
ttcactccaa tgtctgctga ggagttatgg tgaacccaca acttaggccc tagcggcaga 1260
aaggaaaacc tgaagactga ggacaaagtg gaggagggcc gaggtgggct tcagtaagtc 1320
cccggcggcg ctttagtttg agcgcatggc aagtcacatg cgtaaacgac actctctgga 1380
agccctggag accctcgccc aactccacca gatagcagag gggtaagaga ggatgtgcaa 1440
gcgacgacag atgctaaaat ccctggatca cgacgctgca gagcaccttt gcacaggatg 1500
ctggcctttg ctcttactac actgaggaga gattcccgcg ggttccgcag gcagactaca 1560
caggatgagg tggtggagtg gagtgagagc aattgtaacg gttaactgta acgttttctt 1620
tcacacacac acacacacac acacacacac atgctaggat gcggaaatcc ccttatgact 1680
tgctactttt tgattttgtg atattttgta ctttttagtt gttcagcaac tgtcttattt 1740
aatggggaga ttttaagtaa cataactagt ggctctcagt taaaatgtga ggaagaacta 1800
cagctcttaa atgtagcaat ggcactgttg caaactcagt gcaaacgcct agattgcttt 1860
cttcttaacc tatttatttc tttgttaaat ttttctgatt gtttccttta tagagtgtct 1920
cagggtgcag aggtcagact aagaaatatt ccaaatgtct tttagaagat agatgcactt 1980
atgcagtaaa ttatcttggg atagttccca aaagattgct gaaaaagtag attgagtata 2040
aaaacttgaa aatatatgat ggctcgtggg atgtcctact atcactgaac aaactaaagg 2100
tgcactgctt tgggatttaa tttccagggt tgcttgatca ttatatcatt ggaacaactg 2160
atacttcact actttaataa agaattaaca gagattgaac tccaagaggt gggtaatttg 2220
gtttaaaaat acatgttcat gggtttacca ctaactcctg agaaatgtta aaggttcaca 2280
ggggttccct tctctcaatg tttgtaataa ttgctcataa gcaataccag caattcataa 2340
aaactgctta cttatgccat agaaaattaa acacaaagtg tatacatgta ttatgcttct 2400
aaatgctcat tctaccagat acacatttaa aagagaaaaa aggaacagaa acaagtcatt 2460
tgagagtgga gacttataag aaggagtaca tttgagttga atacacaaat ctttacttct 2520
ctaccaattc ctattcccaa aatgaacata ttactgggga aagttagttg agaatcagag 2580
catatgttat tggggaaagg atatgtttat tgacacataa tctgtaccag gtatgcatta 2640
aaatatattt gttaatttaa tatttaaacc tgagagatag gtattgtttc ccagatgagg 2700
acaatgaggc aaagaaatat caagtaactt gccaaaggtt acaagatatt cattccatgg 2760
atgcacaaag aagtgcatct agttccacag ctgattatgg ttgtcttgct tttcttccca 2820
ttgcaccagc ttgtcctcca aaatcatgaa tgatacacat gaagataact ttttttaaaa 2880
aaaagcagaa atacacaatg atctcccttg taagctccta aggtggcttt tctttctcta 2940
acttctagta aatataaacg gtttgtttga aaactatttt aaaatgtcaa caatatggag 3000
aataaccccc cccaacacac ctataaaaac ccaaattttt ggaacaaaga taatggaacc 3060
tccattttca aactgaagca cagggacaga aaatatattt ctagttatca cttaagcact 3120
caatcattag aggctacaag aataatattt ttaaagttac agtattttac aattattaga 3180
aaacattcta tataaaagaa gtcagttgat actttaaaat ctcccatttg gtttataaaa 3240
tcccttaatt tgacctctat atcttaaatt ccaagatgtt taaatttgct agttgcatta 3300
tactgggtca tgaaaaatta tcccttgaaa tagatatgaa acatgttact tcatttctgg 3360
tttaaataac ttgtggaatc tttcctaatg acaacctgat attaagggaa actaaagaaa 3420
atgttattgt ggatcccaca gtactatatt acactgtttt ttttgtttgt tttgttagtt 3480
ttttttattt aaagcaaacc tcaaacatta ttgggtatca attaccacct ggttgtattg 3540
aaatagtaac ttatcaatgc catgtaaaaa ttaattccat tttcgaagcc acctggcaga 3600
caggtttagc tgtttcatca gcagcctaat atatactgtt aaatttgtta aggatttcac 3660
tttgaaggat acatgcaaaa catatagtta ctattttcat gagtcctgct tctagctcca 3720
ttgtggaata cagaaaatta aatatacctg ttaagttcgt atctaaacct aagacattac 3780
caaggtttgt acaaattcta ctacctgaca tttattccaa gaagatctgg aaagttaaat 3840
aaatttataa atttaataac aaaaaaaaaa aaaaaaaa 3878
<210> 8
<211> 5411
<212> DNA
<213> Homo sapiens
<400> 8
gtgtcccata gtgtttccaa acttggaaag ggcgggggag ggcgggagga tgcggagggc 60
ggaggtatgc agacaacgag tcagagtttc cccttgaaag cctcaaaagt gtccacgtcc 120
tcaaaaagaa tggaaccaat ttaagaagcc agccccgtgg ccacgtccct tcccccattc 180
gctccctcct ctgcgccccc gcaggctcct cccagctgtg gctgcccggg cccccagccc 240
cagccctccc attggtggag gcccttttgg aggcacccta gggccaggga aacttttgcc 300
gtataaatag ggcagatccg ggctttatta ttttagcacc acggcagcag gaggtttcgg 360
ctaagttgga ggtactggcc acgactgcat gcccgcgccc gccaggtgat acctccgccg 420
gtgacccagg ggctctgcga cacaaggagt ctgcatgtct aagtgctaga catgctcagc 480
tttgtggata cgcggacttt gttgctgctt gcagtaacct tatgcctagc aacatgccaa 540
tctttacaag aggaaactgt aagaaagggc ccagccggag atagaggacc acgtggagaa 600
aggggtccac caggcccccc aggcagagat ggtgaagatg gtcccacagg ccctcctggt 660
ccacctggtc ctcctggccc ccctggtctc ggtgggaact ttgctgctca gtatgatgga 720
aaaggagttg gacttggccc tggaccaatg ggcttaatgg gacctagagg cccacctggt 780
gcagctggag ccccaggccc tcaaggtttc caaggacctg ctggtgagcc tggtgaacct 840
ggtcaaactg gtcctgcagg tgctcgtggt ccagctggcc ctcctggcaa ggctggtgaa 900
gatggtcacc ctggaaaacc cggacgacct ggtgagagag gagttgttgg accacagggt 960
gctcgtggtt tccctggaac tcctggactt cctggcttca aaggcattag gggacacaat 1020
ggtctggatg gattgaaggg acagcccggt gctcctggtg tgaagggtga acctggtgcc 1080
cctggtgaaa atggaactcc aggtcaaaca ggagcccgtg ggcttcctgg tgagagagga 1140
cgtgttggtg cccctggccc agctggtgcc cgtggcagtg atggaagtgt gggtcccgtg 1200
ggtcctgctg gtcccattgg gtctgctggc cctccaggct tcccaggtgc ccctggcccc 1260
aagggtgaaa ttggagctgt tggtaacgct ggtcctgctg gtcccgccgg tccccgtggt 1320
gaagtgggtc ttccaggcct ctccggcccc gttggacctc ctggtaatcc tggagcaaac 1380
ggccttactg gtgccaaggg tgctgctggc cttcccggcg ttgctggggc tcccggcctc 1440
cctggacccc gcggtattcc tggccctgtt ggtgctgccg gtgctactgg tgccagagga 1500
cttgttggtg agcctggtcc agctggctcc aaaggagaga gcggtaacaa gggtgagccc 1560
ggctctgctg ggccccaagg tcctcctggt cccagtggtg aagaaggaaa gagaggccct 1620
aatggggaag ctggatctgc cggccctcca ggacctcctg ggctgagagg tagtcctggt 1680
tctcgtggtc ttcctggagc tgatggcaga gctggcgtca tgggccctcc tggtagtcgt 1740
ggtgcaagtg gccctgctgg agtccgagga cctaatggag atgctggtcg ccctggggag 1800
cctggtctca tgggacccag aggtcttcct ggttcccctg gaaatatcgg ccccgctgga 1860
aaagaaggtc ctgtcggcct ccctggcatc gacggcaggc ctggcccaat tggcccagct 1920
ggagcaagag gagagcctgg caacattgga ttccctggac ccaaaggccc cactggtgat 1980
cctggcaaaa acggtgataa aggtcatgct ggtcttgctg gtgctcgggg tgctccaggt 2040
cctgatggaa acaatggtgc tcagggacct cctggaccac agggtgttca aggtggaaaa 2100
ggtgaacagg gtccccctgg tcctccaggc ttccagggtc tgcctggccc ctcaggtccc 2160
gctggtgaag ttggcaaacc aggagaaagg ggtctccatg gtgagtttgg tctccctggt 2220
cctgctggtc caagagggga acgcggtccc ccaggtgaga gtggtgctgc cggtcctact 2280
ggtcctattg gaagccgagg tccttctgga cccccagggc ctgatggaaa caagggtgaa 2340
cctggtgtgg ttggtgctgt gggcactgct ggtccatctg gtcctagtgg actcccagga 2400
gagaggggtg ctgctggcat acctggaggc aagggagaaa agggtgaacc tggtctcaga 2460
ggtgaaattg gtaaccctgg cagagatggt gctcgtggtg ctcctggtgc tgtaggtgcc 2520
cctggtcctg ctggagccac aggtgaccgg ggcgaagctg gggctgctgg tcctgctggt 2580
cctgctggtc ctcggggaag ccctggtgaa cgtggtgagg tcggtcctgc tggccccaat 2640
ggatttgctg gtcctgctgg tgctgctggt caacctggtg ctaaaggaga aagaggagcc 2700
aaagggccta agggtgaaaa cggtgttgtt ggtcccacag gccccgttgg agctgctggc 2760
ccagctggtc caaatggtcc ccccggtcct gctggaagtc gtggtgatgg aggcccccct 2820
ggtatgactg gtttccctgg tgctgctgga cggactggtc ccccaggacc ctctggtatt 2880
tctggccctc ctggtccccc tggtcctgct gggaaagaag ggcttcgtgg tcctcgtggt 2940
gaccaaggtc cagttggccg aactggagaa gtaggtgcag ttggtccccc tggcttcgct 3000
ggtgagaagg gtccctctgg agaggctggt actgctggac ctcctggcac tccaggtcct 3060
cagggtcttc ttggtgctcc tggtattctg ggtctccctg gctcgagagg tgaacgtggt 3120
ctaccaggtg ttgctggtgc tgtgggtgaa cctggtcctc ttggcattgc cggccctcct 3180
ggggcccgtg gtcctcctgg tgctgtgggt agtcctggag tcaacggtgc tcctggtgaa 3240
gctggtcgtg atggcaaccc tgggaacgat ggtcccccag gtcgcgatgg tcaacccgga 3300
cacaagggag agcgcggtta ccctggcaat attggtcccg ttggtgctgc aggtgcacct 3360
ggtcctcatg gccccgtggg tcctgctggc aaacatggaa accgtggtga aactggtcct 3420
tctggtcctg ttggtcctgc tggtgctgtt ggcccaagag gtcctagtgg cccacaaggc 3480
attcgtggcg ataagggaga gcccggtgaa aaggggccca gaggtcttcc tggcttaaag 3540
ggacacaatg gattgcaagg tctgcctggt atcgctggtc accatggtga tcaaggtgct 3600
cctggctccg tgggtcctgc tggtcctagg ggccctgctg gtccttctgg ccctgctgga 3660
aaagatggtc gcactggaca tcctggtaca gttggacctg ctggcattcg aggccctcag 3720
ggtcaccaag gccctgctgg cccccctggt ccccctggcc ctcctggacc tccaggtgta 3780
agcggtggtg gttatgactt tggttacgat ggagacttct acagggctga ccagcctcgc 3840
tcagcacctt ctctcagacc caaggactat gaagttgatg ctactctgaa gtctctcaac 3900
aaccagattg agacccttct tactcctgaa ggctctagaa agaacccagc tcgcacatgc 3960
cgtgacttga gactcagcca cccagagtgg agcagtggtt actactggat tgaccctaac 4020
caaggatgca ctatggatgc tatcaaagta tactgtgatt tctctactgg cgaaacctgt 4080
atccgggccc aacctgaaaa catcccagcc aagaactggt ataggagctc caaggacaag 4140
aaacacgtct ggctaggaga aactatcaat gctggcagcc agtttgaata taatgtagaa 4200
ggagtgactt ccaaggaaat ggctacccaa cttgccttca tgcgcctgct ggccaactat 4260
gcctctcaga acatcaccta ccactgcaag aacagcattg catacatgga tgaggagact 4320
ggcaacctga aaaaggctgt cattctacag ggctctaatg atgttgaact tgttgctgag 4380
ggcaacagca ggttcactta cactgttctt gtagatggct gctctaaaaa gacaaatgaa 4440
tggggaaaga caatcattga atacaaaaca aataagccat cacgcctgcc cttccttgat 4500
attgcacctt tggacatcgg tggtgctgac caggaattct ttgtggacat tggcccagtc 4560
tgtttcaaat aaatgaactc aatctaaatt aaaaaagaaa gaaatttgaa aaaactttct 4620
ctttgccatt tcttcttctt cttttttaac tgaaagctga atccttccat ttcttctgca 4680
catctacttg cttaaattgt gggcaaaaga gaaaaagaag gattgatcag agcattgtgc 4740
aatacagttt cattaactcc ttcccccgct cccccaaaaa tttgaatttt tttttcaaca 4800
ctcttacacc tgttatggaa aatgtcaacc tttgtaagaa aaccaaaata aaaattgaaa 4860
aataaaaacc ataaacattt gcaccacttg tggcttttga atatcttcca cagagggaag 4920
tttaaaaccc aaacttccaa aggtttaaac tacctcaaaa cactttccca tgagtgtgat 4980
ccacattgtt aggtgctgac ctagacagag atgaactgag gtccttgttt tgttttgttc 5040
ataatacaaa ggtgctaatt aatagtattt cagatacttg aagaatgttg atggtgctag 5100
aagaatttga gaagaaatac tcctgtattg agttgtatcg tgtggtgtat tttttaaaaa 5160
atttgattta gcattcatat tttccatctt attcccaatt aaaagtatgc agattatttg 5220
cccaaatctt cttcagattc agcatttgtt ctttgccagt ctcattttca tcttcttcca 5280
tggttccaca gaagctttgt ttcttgggca agcagaaaaa ttaaattgta cctattttgt 5340
atatgtgaga tgtttaaata aattgtgaaa aaaatgaaat aaagcatgtt tggttttcca 5400
aaagaacata t 5411
<210> 9
<211> 5490
<212> DNA
<213> Homo sapiens
<400> 9
ggctgagttt tatgacgggc ccggtgctga agggcaggga acaacttgat ggtgctactt 60
tgaactgctt ttcttttctc ctttttgcac aaagagtctc atgtctgata tttagacatg 120
atgagctttg tgcaaaaggg gagctggcta cttctcgctc tgcttcatcc cactattatt 180
ttggcacaac aggaagctgt tgaaggagga tgttcccatc ttggtcagtc ctatgcggat 240
agagatgtct ggaagccaga accatgccaa atatgtgtct gtgactcagg atccgttctc 300
tgcgatgaca taatatgtga cgatcaagaa ttagactgcc ccaacccaga aattccattt 360
ggagaatgtt gtgcagtttg cccacagcct ccaactgctc ctactcgccc tcctaatggt 420
caaggacctc aaggccccaa gggagatcca ggccctcctg gtattcctgg gagaaatggt 480
gaccctggta ttccaggaca accagggtcc cctggttctc ctggcccccc tggaatctgt 540
gaatcatgcc ctactggtcc tcagaactat tctccccagt atgattcata tgatgtcaag 600
tctggagtag cagtaggagg actcgcaggc tatcctggac cagctggccc cccaggccct 660
cccggtcccc ctggtacatc tggtcatcct ggttcccctg gatctccagg ataccaagga 720
ccccctggtg aacctgggca agctggtcct tcaggccctc caggacctcc tggtgctata 780
ggtccatctg gtcctgctgg aaaagatgga gaatcaggta gacccggacg acctggagag 840
cgaggattgc ctggacctcc aggtatcaaa ggtccagctg ggatacctgg attccctggt 900
atgaaaggac acagaggctt cgatggacga aatggagaaa agggtgaaac aggtgctcct 960
ggattaaagg gtgaaaatgg tcttccaggc gaaaatggag ctcctggacc catgggtcca 1020
agaggggctc ctggtgagcg aggacggcca ggacttcctg gggctgcagg tgctcggggt 1080
aatgacggtg ctcgaggcag tgatggtcaa ccaggccctc ctggtcctcc tggaactgcc 1140
ggattccctg gatcccctgg tgctaagggt gaagttggac ctgcagggtc tcctggttca 1200
aatggtgccc ctggacaaag aggagaacct ggacctcagg gacacgctgg tgctcaaggt 1260
cctcctggcc ctcctgggat taatggtagt cctggtggta aaggcgaaat gggtcccgct 1320
ggcattcctg gagctcctgg actgatggga gcccggggtc ctccaggacc agccggtgct 1380
aatggtgctc ctggactgcg aggtggtgca ggtgagcctg gtaagaatgg tgccaaagga 1440
gagcccggac cacgtggtga acgcggtgag gctggtattc caggtgttcc aggagctaaa 1500
ggcgaagatg gcaaggatgg atcacctgga gaacctggtg caaatgggct tccaggagct 1560
gcaggagaaa ggggtgcccc tgggttccga ggacctgctg gaccaaatgg catcccagga 1620
gaaaagggtc ctgctggaga gcgtggtgct ccaggccctg cagggcccag aggagctgct 1680
ggagaacctg gcagagatgg cgtccctgga ggtccaggaa tgaggggcat gcccggaagt 1740
ccaggaggac caggaagtga tgggaaacca gggcctcccg gaagtcaagg agaaagtggt 1800
cgaccaggtc ctcctgggcc atctggtccc cgaggtcagc ctggtgtcat gggcttcccc 1860
ggtcctaaag gaaatgatgg tgctcctggt aagaatggag aacgaggtgg ccctggagga 1920
cctggccctc agggtcctcc tggaaagaat ggtgaaactg gacctcaggg acccccaggg 1980
cctactgggc ctggtggtga caaaggagac acaggacccc ctggtccaca aggattacaa 2040
ggcttgcctg gtacaggtgg tcctccagga gaaaatggaa aacctgggga accaggtcca 2100
aagggtgatg ccggtgcacc tggagctcca ggaggcaagg gtgatgctgg tgcccctggt 2160
gaacgtggac ctcctggatt ggcaggggcc ccaggactta gaggtggagc tggtccccct 2220
ggtcccgaag gaggaaaggg tgctgctggt cctcctgggc cacctggtgc tgctggtact 2280
cctggtctgc aaggaatgcc tggagaaaga ggaggtcttg gaagtcctgg tccaaagggt 2340
gacaagggtg aaccaggcgg tccaggtgct gatggtgtcc cagggaaaga tggcccaagg 2400
ggtcctactg gtcctattgg tcctcctggc ccagctggcc agcctggaga taagggtgaa 2460
ggtggtgccc ccggacttcc aggtatagct ggacctcgtg gtagccctgg tgagagaggt 2520
gaaactggcc ctccaggacc tgctggtttc cctggtgctc ctggacagaa tggtgaacct 2580
ggtggtaaag gagaaagagg ggctccgggt gagaaaggtg aaggaggccc tcctggagtt 2640
gcaggacccc ctggaggttc tggacctgct ggtcctcctg gtccccaagg tgtcaaaggt 2700
gaacgtggca gtcctggtgg acctggtgct gctggcttcc ctggtgctcg tggtcttcct 2760
ggtcctcctg gtagtaatgg taacccagga cccccaggtc ccagcggttc tccaggcaag 2820
gatgggcccc caggtcctgc gggtaacact ggtgctcctg gcagccctgg agtgtctgga 2880
ccaaaaggtg atgctggcca accaggagag aagggatcgc ctggtgccca gggcccacca 2940
ggagctccag gcccacttgg gattgctggg atcactggag cacggggtct tgcaggacca 3000
ccaggcatgc caggtcctag gggaagccct ggccctcagg gtgtcaaggg tgaaagtggg 3060
aaaccaggag ctaacggtct cagtggagaa cgtggtcccc ctggacccca gggtcttcct 3120
ggtctggctg gtacagctgg tgaacctgga agagatggaa accctggatc agatggtctt 3180
ccaggccgag atggatctcc tggtggcaag ggtgatcgtg gtgaaaatgg ctctcctggt 3240
gcccctggcg ctcctggtca tccaggccca cctggtcctg tcggtccagc tggaaagagt 3300
ggtgacagag gagaaagtgg ccctgctggc cctgctggtg ctcccggtcc tgctggttcc 3360
cgaggtgctc ctggtcctca aggcccacgt ggtgacaaag gtgaaacagg tgaacgtgga 3420
gctgctggca tcaaaggaca tcgaggattc cctggtaatc caggtgcccc aggttctcca 3480
ggccctgctg gtcagcaggg tgcaatcggc agtccaggac ctgcaggccc cagaggacct 3540
gttggaccca gtggacctcc tggcaaagat ggaaccagtg gacatccagg tcccattgga 3600
ccaccagggc ctcgaggtaa cagaggtgaa agaggatctg agggctcccc aggccaccca 3660
gggcaaccag gccctcctgg acctcctggt gcccctggtc cttgctgtgg tggtgttgga 3720
gccgctgcca ttgctgggat tggaggtgaa aaagctggcg gttttgcccc gtattatgga 3780
gatgaaccaa tggatttcaa aatcaacacc gatgagatta tgacttcact caagtctgtt 3840
aatggacaaa tagaaagcct cattagtcct gatggttctc gtaaaaaccc cgctagaaac 3900
tgcagagacc tgaaattctg ccatcctgaa ctcaagagtg gagaatactg ggttgaccct 3960
aaccaaggat gcaaattgga tgctatcaag gtattctgta atatggaaac tggggaaaca 4020
tgcataagtg ccaatccttt gaatgttcca cggaaacact ggtggacaga ttctagtgct 4080
gagaagaaac acgtttggtt tggagagtcc atggatggtg gttttcagtt tagctacggc 4140
aatcctgaac ttcctgaaga tgtccttgat gtgcagctgg cattccttcg acttctctcc 4200
agccgagctt cccagaacat cacatatcac tgcaaaaata gcattgcata catggatcag 4260
gccagtggaa atgtaaagaa ggccctgaag ctgatggggt caaatgaagg tgaattcaag 4320
gctgaaggaa atagcaaatt cacctacaca gttctggagg atggttgcac gaaacacact 4380
ggggaatgga gcaaaacagt ctttgaatat cgaacacgca aggctgtgag actacctatt 4440
gtagatattg caccctatga cattggtggt cctgatcaag aatttggtgt ggacgttggc 4500
cctgtttgct ttttataaac caaactctat ctgaaatccc aacaaaaaaa atttaactcc 4560
atatgtgttc ctcttgttct aatcttgtca accagtgcaa gtgaccgaca aaattccagt 4620
tatttatttc caaaatgttt ggaaacagta taatttgaca aagaaaaatg atacttctct 4680
ttttttgctg ttccaccaaa tacaattcaa atgctttttg ttttattttt ttaccaattc 4740
caatttcaaa atgtctcaat ggtgctataa taaataaact tcaacactct ttatgataac 4800
aacactgtgt tatattcttt gaatcctagc ccatctgcag agcaatgact gtgctcacca 4860
gtaaaagata acctttcttt ctgaaatagt caaatacgaa attagaaaag ccctccctat 4920
tttaactacc tcaactggtc agaaacacag attgtattct atgagtccca gaagatgaaa 4980
aaaattttat acgttgataa aacttataaa tttcattgat taatctcctg gaagattggt 5040
ttaaaaagaa aagtgtaatg caagaattta aagaaatatt tttaaagcca caattatttt 5100
aatattggat atcaactgct tgtaaaggtg ctcctctttt ttcttgtcat tgctggtcaa 5160
gattactaat atttgggaag gctttaaaga cgcatgttat ggtgctaatg tactttcact 5220
tttaaactct agatcagaat tgttgacttg cattcagaac ataaatgcac aaaatctgta 5280
catgtctccc atcagaaaga ttcattggca tgccacaggg gattctcctc cttcatcctg 5340
taaaggtcaa caataaaaac caaattatgg ggctgctttt gtcacactag catagagaat 5400
gtgttgaaat ttaactttgt aagcttgtat gtggttgttg atcttttttt tccttacaga 5460
cacccataat aaaatatcat attaaaattc 5490
<210> 10
<211> 9169
<212> DNA
<213> Homo sapiens
<400> 10
gatgacgctg cggcttctgg tggccgcgct ctgcgccggg atcctggcag aggcgccccg 60
agtgcgagcc cagcacaggg agagagtgac ctgcacgcgc ctttacgccg ctgacattgt 120
gttcttactg gatggctcct catccattgg ccgcagcaat ttccgcgagg tccgcagctt 180
tctcgaaggg ctggtgctgc ctttctctgg agcagccagt gcacagggtg tgcgctttgc 240
cacagtgcag tacagcgatg acccacggac agagttcggc ctggatgcac ttggctctgg 300
gggtgatgtg atccgcgcca tccgtgagct tagctacaag gggggcaaca ctcgcacagg 360
ggctgcaatt ctccatgtgg ctgaccatgt cttcctgccc cagctggccc gacctggtgt 420
ccccaaggtc tgcatcctga tcacagacgg gaagtcccag gacctggtgg acacagctgc 480
ccaaaggctg aaggggcagg gggtcaagct atttgctgtg gggatcaaga atgctgaccc 540
tgaggagctg aagcgagttg cctcacagcc caccagtgac ttcttcttct tcgtcaatga 600
cttcagcatc ttgaggacac tactgcccct cgtttcccgg agagtgtgca cgactgctgg 660
tggcgtgcct gtgacccgac ctccggatga ctcgacctct gctccacgag acctggtgct 720
gtctgagcca agcagccaat ccttgagagt acagtggaca gcggccagtg gccctgtgac 780
tggctacaag gtccagtaca ctcctctgac ggggctggga cagccactgc cgagtgagcg 840
gcaggaggtg aacgtcccag ctggtgagac cagtgtgcgg ctgcggggtc tccggccact 900
gaccgagtac caagtgactg tgattgccct ctacgccaac agcatcgggg aggctgtgag 960
cgggacagct cggaccactg ccctagaagg gccggaactg accatccaga ataccacagc 1020
ccacagcctc ctggtggcct ggcggagtgt gccaggtgcc actggctacc gtgtgacatg 1080
gcgggtcctc agtggtgggc ccacacagca gcaggagctg ggccctgggc agggttcagt 1140
gttgctgcgt gacttggagc ctggcacgga ctatgaggtg accgtgagca ccctatttgg 1200
ccgcagtgtg gggcccgcca cttccctgat ggctcgcact gacgcttctg ttgagcagac 1260
cctgcgcccg gtcatcctgg gccccacatc catcctcctt tcctggaact tggtgcctga 1320
ggcccgtggc taccggttgg aatggcggcg tgagactggc ttggagccac cgcagaaggt 1380
ggtactgccc tctgatgtga cccgctacca gttggatggg ctgcagccgg gcactgagta 1440
ccgcctcaca ctctacactc tgctggaggg ccacgaggtg gccacccctg caaccgtggt 1500
tcccactgga ccagagctgc ctgtgagccc tgtaacagac ctgcaagcca ccgagctgcc 1560
cgggcagcgg gtgcgagtgt cctggagccc agtccctggt gccacccagt accgcatcat 1620
tgtgcgcagc acccaggggg ttgagcggac cctggtgctt cctgggagtc agacagcatt 1680
cgacttggat gacgttcagg ctgggcttag ctacactgtg cgggtgtctg ctcgagtggg 1740
tccccgtgag ggcagtgcca gtgtcctcac tgtccgccgg gagccggaaa ctccacttgc 1800
tgttccaggg ctgcgggttg tggtgtcaga tgcaacgcga gtgagggtgg cctggggacc 1860
cgtccctgga gccagtggat ttcggattag ctggagcaca ggcagtggtc cggagtccag 1920
ccagacactg cccccagact ctactgccac agacatcaca gggctgcagc ctggaaccac 1980
ctaccaggtg gctgtgtcgg tactgcgagg cagagaggag ggccctgctg cagtcatcgt 2040
ggctcgaacg gacccactgg gcccagtgag gacggtccat gtgactcagg ccagcagctc 2100
atctgtcacc attacctgga ccagggttcc tggcgccaca ggatacaggg tttcctggca 2160
ctcagcccac ggcccagaga aatcccagtt ggtttctggg gaggccacgg tggctgagct 2220
ggatggactg gagccagata ctgagtatac ggtgcatgtg agggcccatg tggctggcgt 2280
ggatgggccc cctgcctctg tggttgtgag gactgcccct gagcctgtgg gtcgtgtgtc 2340
gaggctgcag atcctcaatg cttccagcga cgttctacgg atcacctggg taggggtcac 2400
tggagccaca gcttacagac tggcctgggg ccggagtgaa ggcggcccca tgaggcacca 2460
gatactccca ggaaacacag actctgcaga gatccggggt ctcgaaggtg gagtcagcta 2520
ctcagtgcga gtgactgcac ttgtcgggga ccgcgagggc acacctgtct ccattgttgt 2580
cactacgccg cctgaggctc cgccagccct ggggacgctt cacgtggtgc agcgcgggga 2640
gcactcgctg aggctgcgct gggagccggt gcccagagcg cagggcttcc ttctgcactg 2700
gcaacctgag ggtggccagg aacagtcccg ggtcctgggg cccgagctca gcagctatca 2760
cctggacggg ctggagccag cgacacagta ccgcgtgagg ctgagtgtcc tagggccagc 2820
tggagaaggg ccctctgcag aggtgactgc gcgcactgag tcacctcgtg ttccaagcat 2880
tgaactacgt gtggtggaca cctcgatcga ctcggtgact ttggcctgga ctccagtgtc 2940
cagggcatcc agctacatcc tatcctggcg gccactcaga ggccctggcc aggaagtgcc 3000
tgggtccccg cagacacttc cagggatctc aagctcccag cgggtgacag ggctagagcc 3060
tggcgtctct tacatcttct ccctgacgcc tgtcctggat ggtgtgcggg gtcctgaggc 3120
atctgtcaca cagacgccag tgtgcccccg tggcctggcg gatgtggtgt tcctaccaca 3180
tgccactcaa gacaatgctc accgtgcgga ggctacgagg agggtcctgg agcgtctggt 3240
gttggcactt gggcctcttg ggccacaggc agttcaggtt ggcctgctgt cttacagtca 3300
tcggccctcc ccactgttcc cactgaatgg ctcccatgac cttggcatta tcttgcaaag 3360
gatccgtgac atgccctaca tggacccaag tgggaacaac ctgggcacag ccgtggtcac 3420
agctcacaga tacatgttgg caccagatgc tcctgggcgc cgccagcacg taccaggggt 3480
gatggttctg ctagtggatg aacccttgag aggtgacata ttcagcccca tccgtgaggc 3540
ccaggcttct gggcttaatg tggtgatgtt gggaatggct ggagcggacc cagagcagct 3600
gcgtcgcttg gcgccgggta tggactctgt ccagaccttc ttcgccgtgg atgatgggcc 3660
aagcctggac caggcagtca gtggtctggc cacagccctg tgtcaggcat ccttcactac 3720
tcagccccgg ccagagccct gcccagtgta ttgtccaaag ggccagaagg gggaacctgg 3780
agagatgggc ctgagaggac aagttgggcc tcctggcgac cctggcctcc cgggcaggac 3840
cggtgctccc ggcccccagg ggccccctgg aagtgccact gccaagggcg agaggggctt 3900
ccctggagca gatgggcgtc caggcagccc tggccgcgcc gggaatcctg ggacccctgg 3960
agcccctggc ctaaagggct ctccagggtt gcctggccct cgtggggacc cgggagagcg 4020
aggacctcga ggcccaaagg gggagccggg ggctcccgga caagtcatcg gaggtgaagg 4080
acctgggctt cctgggcgga aaggggaccc tggaccatcg ggcccccctg gacctcgtgg 4140
accactgggg gacccaggac cccgtggccc cccagggctt cctggaacag ccatgaaggg 4200
tgacaaaggc gatcgtgggg agcggggtcc ccctggacca ggtgaaggtg gcattgctcc 4260
tggggagcct gggctgccgg gtcttcccgg aagccctgga ccccaaggcc ccgttggccc 4320
ccctggaaag aaaggagaaa aaggtgactc tgaggatgga gctccaggcc tcccaggaca 4380
acctgggtct ccgggtgagc agggcccacg gggacctcct ggagctattg gccccaaagg 4440
tgaccggggc tttccagggc ccctgggtga ggctggagag aagggcgaac gtggaccccc 4500
aggcccagcg ggatcccggg ggctgccagg ggttgctgga cgtcctggag ccaagggtcc 4560
tgaagggcca ccaggaccca ctggccgcca aggagagaag ggggagcctg gtcgccctgg 4620
ggaccctgca gtggtgggac ctgctgttgc tggacccaaa ggagaaaagg gagatgtggg 4680
gcccgctggg cccagaggag ctaccggagt ccaaggggaa cggggcccac ccggcttggt 4740
tcttcctgga gaccctggcc ccaagggaga ccctggagac cggggtccca ttggccttac 4800
tggcagagca ggacccccag gtgactcagg gcctcctgga gagaagggag accctgggcg 4860
gcctggcccc ccaggacctg ttggcccccg aggacgagat ggtgaagttg gagagaaagg 4920
tgacgagggt cctccgggtg acccgggttt gcctggaaaa gcaggcgagc gtggccttcg 4980
gggggcacct ggagttcggg ggcctgtggg tgaaaaggga gaccagggag atcctggaga 5040
ggatggacga aatggcagcc ctggatcatc tggacccaag ggtgaccgtg gggagccggg 5100
tcccccagga cccccgggac ggctggtaga cacaggacct ggagccagag agaagggaga 5160
gcctggggac cgcggacaag agggtcctcg agggcccaag ggtgatcctg gcctccctgg 5220
agcccctggg gaaaggggca ttgaagggtt tcggggaccc ccaggcccac agggggaccc 5280
aggtgtccga ggcccagcag gagaaaaggg tgaccggggt ccccctgggc tggatggccg 5340
gagcggactg gatgggaaac caggagccgc tgggccctct gggccgaatg gtgctgcagg 5400
caaagctggg gacccaggga gagacgggct tccaggcctc cgtggagaac agggcctccc 5460
tggcccctct ggtccccctg gattaccggg aaagccaggc gaggatggca aacctggcct 5520
gaatggaaaa aacggagaac ctggggaccc tggagaagac gggaggaagg gagagaaagg 5580
agattcaggc gcctctggga gagaaggtcg tgatggcccc aagggtgagc gtggagctcc 5640
tggtatcctt ggaccccagg ggcctccagg cctcccaggg ccagtgggcc ctcctggcca 5700
gggttttcct ggtgtcccag gaggcacggg ccccaagggt gaccgtgggg agactggatc 5760
caaaggggag cagggcctcc ctggagagcg tggcctgcga ggagagcctg gaagtgtgcc 5820
gaatgtggat cggttgctgg aaactgctgg catcaaggca tctgccctgc gggagatcgt 5880
ggagacctgg gatgagagct ctggtagctt cctgcctgtg cccgaacggc gtcgaggccc 5940
caagggggac tcaggcgaac agggcccccc aggcaaggag ggccccatcg gctttcctgg 6000
agaacgcggg ctgaagggcg accgtggaga ccctggccct caggggccac ctggtctggc 6060
ccttggggag aggggccccc ccgggccttc cggccttgcc ggggagcctg gaaagcctgg 6120
tattcccggg ctcccaggca gggctggggg tgtgggagag gcaggaaggc caggagagag 6180
gggagaacgg ggagagaaag gagaacgtgg agaacagggc agagatggcc ctcctggact 6240
ccctggaacc cctgggcccc ccggaccccc tggccccaag gtgtctgtgg atgagccagg 6300
tcctggactc tctggagaac agggaccccc tggactcaag ggtgctaagg gggagccggg 6360
cagcaatggt gaccaaggtc ccaaaggaga caggggtgtg ccaggcatca aaggagaccg 6420
gggagagcct ggaccgaggg gtcaggacgg caacccgggt ctaccaggag agcgtggtat 6480
ggctgggcct gaagggaagc cgggtctgca gggtccaaga ggcccccctg gcccagtggg 6540
tggtcatgga gaccctggac cacctggtgc cccgggtctt gctggccctg caggacccca 6600
aggaccttct ggcctgaagg gggagcctgg agagacagga cctccaggac ggggcctgac 6660
tggacctact ggagctgtgg gacttcctgg accccccggc ccttcaggcc ttgtgggtcc 6720
acaggggtct ccaggtttgc ctggacaagt gggggagaca gggaagccgg gagccccagg 6780
tcgagatggt gccagtggaa aagatggaga cagagggagc cctggtgtgc cagggtcacc 6840
aggtctgcct ggccctgtcg gacctaaagg agaacctggc cccacggggg cccctggaca 6900
ggctgtggtc gggctccctg gagcaaaggg agagaaggga gcccctggag gccttgctgg 6960
agacctggtg ggtgagccgg gagccaaagg tgaccgagga ctgccagggc cgcgaggcga 7020
gaagggtgaa gctggccgtg caggggagcc cggagaccct ggggaagatg gtcagaaagg 7080
ggctccagga cccaaaggtt tcaagggtga cccaggagtc ggggtcccgg gctcccctgg 7140
gcctcctggc cctccaggtg tgaagggaga tctgggcctc cctggcctgc ccggtgctcc 7200
tggtgttgtt gggttcccgg gtcagacagg ccctcgagga gagatgggtc agccaggccc 7260
tagtggagag cggggtctgg caggcccccc agggagagaa ggaatcccag gacccctggg 7320
gccacctgga ccaccggggt cagtgggacc acctggggcc tctggactca aaggagacaa 7380
gggagaccct ggagtagggc tgcctgggcc ccgaggcgag cgtggggagc caggcatccg 7440
gggtgaagat ggccgccccg gccaggaggg accccgagga ctcacggggc cccctggcag 7500
caggggagag cgtggggaga agggtgatgt tgggagtgca ggactaaagg gtgacaaggg 7560
agactcagct gtgatcctgg ggcctccagg cccacggggt gccaaggggg acatgggtga 7620
acgagggcct cggggcttgg atggtgacaa aggacctcgg ggagacaatg gggaccctgg 7680
tgacaagggc agcaagggag agcctggtga caagggctca gccgggttgc caggactgcg 7740
tggactcctg ggaccccagg gtcaacctgg tgcagcaggg atccctggtg acccgggatc 7800
cccaggaaag gatggagtgc ctggtatccg aggagaaaaa ggagatgttg gcttcatggg 7860
tccccggggc ctcaagggtg aacggggagt gaagggagcc tgtggccttg atggagagaa 7920
gggagacaag ggagaagctg gtcccccagg ccgccccggg ctggcaggac acaaaggaga 7980
gatgggggag cctggtgtgc cgggccagtc gggggcccct ggcaaggagg gcctgatcgg 8040
tcccaagggt gaccgaggct ttgacgggca gccaggcccc aagggtgacc agggcgagaa 8100
aggggagcgg ggaaccccag gaattggggg cttcccaggc cccagtggaa atgatggctc 8160
tgctggtccc ccagggccac ctggcagtgt tggtcccaga ggccccgaag gacttcaggg 8220
ccagaagggt gagcgaggtc cccccggaga gagagtggtg ggggctcctg gggtccctgg 8280
agctcctggc gagagagggg agcaggggcg gccagggcct gccggtcctc gaggcgagaa 8340
gggagaagct gcactgacgg aggatgacat ccggggcttt gtgcgccaag agatgagtca 8400
gcactgtgcc tgccagggcc agttcatcgc atctggatca cgacccctcc ctagttatgc 8460
tgcagacact gccggctccc agctccatgc tgtgcctgtg ctccgcgtct ctcatgcaga 8520
ggaggaagag cgggtacccc ctgaggatga tgagtactct gaatactccg agtattctgt 8580
ggaggagtac caggaccctg aagctccttg ggatagtgat gacccctgtt ccctgccact 8640
ggatgagggc tcctgcactg cctacaccct gcgctggtac catcgggctg tgacaggcag 8700
cacagaggcc tgtcaccctt ttgtctatgg tggctgtgga gggaatgcca accgttttgg 8760
gacccgtgag gcctgcgagc gccgctgccc accccgggtg gtccagagcc aggggacagg 8820
tactgcccag gactgaggcc cagataatga gctgagattc agcatcccct ggaggagtcg 8880
gggtctcagc agaaccccac tgtccctccc cttggtgcta gaggcttgtg tgcacgtgag 8940
cgtgcgtgtg cacgtccgtt atttcagtga cttggtcccg tgggtctagc cttcccccct 9000
gtggacaaac ccccattgtg gctcctgcca ccctggcaga tgactcactg tgggggggtg 9060
gctgtgggca gtgagcggat gtgactggcg tctgacccgc cccttgaccc aagcctgtga 9120
tgacatggtg ctgattctgg ggggcattaa agctgctgtt ttaaaaggc 9169
<210> 11
<211> 2358
<212> DNA
<213> Homo sapiens
<400> 11
aaactcacac aacaactctt ccccgctgag aggagacagc cagtgcgact ccaccctcca 60
gctcgacggc agccgccccg gccgacagcc ccgagacgac agcccggcgc gtcccggtcc 120
ccacctccga ccaccgccag cgctccaggc cccgccgctc cccgctcgcc gccaccgcgc 180
cctccgctcc gcccgcagtg ccaaccatga ccgccgccag tatgggcccc gtccgcgtcg 240
ccttcgtggt cctcctcgcc ctctgcagcc ggccggccgt cggccagaac tgcagcgggc 300
cgtgccggtg cccggacgag ccggcgccgc gctgcccggc gggcgtgagc ctcgtgctgg 360
acggctgcgg ctgctgccgc gtctgcgcca agcagctggg cgagctgtgc accgagcgcg 420
acccctgcga cccgcacaag ggcctcttct gtgacttcgg ctccccggcc aaccgcaaga 480
tcggcgtgtg caccgccaaa gatggtgctc cctgcatctt cggtggtacg gtgtaccgca 540
gcggagagtc cttccagagc agctgcaagt accagtgcac gtgcctggac ggggcggtgg 600
gctgcatgcc cctgtgcagc atggacgttc gtctgcccag ccctgactgc cccttcccga 660
ggagggtcaa gctgcccggg aaatgctgcg aggagtgggt gtgtgacgag cccaaggacc 720
aaaccgtggt tgggcctgcc ctcgcggctt accgactgga agacacgttt ggcccagacc 780
caactatgat tagagccaac tgcctggtcc agaccacaga gtggagcgcc tgttccaaga 840
cctgtgggat gggcatctcc acccgggtta ccaatgacaa cgcctcctgc aggctagaga 900
agcagagccg cctgtgcatg gtcaggcctt gcgaagctga cctggaagag aacattaaga 960
agggcaaaaa gtgcatccgt actcccaaaa tctccaagcc tatcaagttt gagctttctg 1020
gctgcaccag catgaagaca taccgagcta aattctgtgg agtatgtacc gacggccgat 1080
gctgcacccc ccacagaacc accaccctgc cggtggagtt caagtgccct gacggcgagg 1140
tcatgaagaa gaacatgatg ttcatcaaga cctgtgcctg ccattacaac tgtcccggag 1200
acaatgacat ctttgaatcg ctgtactaca ggaagatgta cggagacatg gcatgaagcc 1260
agagagtgag agacattaac tcattagact ggaacttgaa ctgattcaca tctcattttt 1320
ccgtaaaaat gatttcagta gcacaagtta tttaaatctg tttttctaac tgggggaaaa 1380
gattcccacc caattcaaaa cattgtgcca tgtcaaacaa atagtctatc aaccccagac 1440
actggtttga agaatgttaa gacttgacag tggaactaca ttagtacaca gcaccagaat 1500
gtatattaag gtgtggcttt aggagcagtg ggagggtacc agcagaaagg ttagtatcat 1560
cagatagcat cttatacgag taatatgcct gctatttgaa gtgtaattga gaaggaaaat 1620
tttagcgtgc tcactgacct gcctgtagcc ccagtgacag ctaggatgtg cattctccag 1680
ccatcaagag actgagtcaa gttgttcctt aagtcagaac agcagactca gctctgacat 1740
tctgattcga atgacactgt tcaggaatcg gaatcctgtc gattagactg gacagcttgt 1800
ggcaagtgaa tttgcctgta acaagccaga ttttttaaaa tttatattgt aaatattgtg 1860
tgtgtgtgtg tgtgtgtata tatatatata tgtacagtta tctaagttaa tttaaagttg 1920
tttgtgcctt tttatttttg tttttaatgc tttgatattt caatgttagc ctcaatttct 1980
gaacaccata ggtagaatgt aaagcttgtc tgatcgttca aagcatgaaa tggatactta 2040
tatggaaatt ctgctcagat agaatgacag tccgtcaaaa cagattgttt gcaaagggga 2100
ggcatcagtg tccttggcag gctgatttct aggtaggaaa tgtggtagcc tcacttttaa 2160
tgaacaaatg gcctttatta aaaactgagt gactctatat agctgatcag ttttttcacc 2220
tggaagcatt tgtttctact ttgatatgac tgtttttcgg acagtttatt tgttgagagt 2280
gtgaccaaaa gttacatgtt tgcacctttc tagttgaaaa taaagtgtat attttttcta 2340
taaaaaaaaa aaaaaaaa 2358
<210> 12
<211> 3256
<212> DNA
<213> Homo sapiens
<400> 12
aggatacagc ggcttctgcg cgacttataa gagctccttg tgcggcgcca ttttaagcct 60
ctcggtctgt ggcagcagcg ttggcccggc cccgggagcg gagagcgagg ggaggcggag 120
acggaggaag gtctgaggag cagcttcagt ccccgccgag ccgccaccgc aggtcgagga 180
cggtcggact cccgcggcgg gaggagcctg ttcccctgag ggtatttgaa gtataccata 240
caactgtttt gaaaatccag cgtggacaat ggctactcaa gctgatttga tggagttgga 300
catggccatg gaaccagaca gaaaagcggc tgttagtcac tggcagcaac agtcttacct 360
ggactctgga atccattctg gtgccactac cacagctcct tctctgagtg gtaaaggcaa 420
tcctgaggaa gaggatgtgg atacctccca agtcctgtat gagtgggaac agggattttc 480
tcagtccttc actcaagaac aagtagctga tattgatgga cagtatgcaa tgactcgagc 540
tcagagggta cgagctgcta tgttccctga gacattagat gagggcatgc agatcccatc 600
tacacagttt gatgctgctc atcccactaa tgtccagcgt ttggctgaac catcacagat 660
gctgaaacat gcagttgtaa acttgattaa ctatcaagat gatgcagaac ttgccacacg 720
tgcaatccct gaactgacaa aactgctaaa tgacgaggac caggtggtgg ttaataaggc 780
tgcagttatg gtccatcagc tttctaaaaa ggaagcttcc agacacgcta tcatgcgttc 840
tcctcagatg gtgtctgcta ttgtacgtac catgcagaat acaaatgatg tagaaacagc 900
tcgttgtacc gctgggacct tgcataacct ttcccatcat cgtgagggct tactggccat 960
ctttaagtct ggaggcattc ctgccctggt gaaaatgctt ggttcaccag tggattctgt 1020
gttgttttat gccattacaa ctctccacaa ccttttatta catcaagaag gagctaaaat 1080
ggcagtgcgt ttagctggtg ggctgcagaa aatggttgcc ttgctcaaca aaacaaatgt 1140
taaattcttg gctattacga cagactgcct tcaaatttta gcttatggca accaagaaag 1200
caagctcatc atactggcta gtggtggacc ccaagcttta gtaaatataa tgaggaccta 1260
tacttacgaa aaactactgt ggaccacaag cagagtgctg aaggtgctat ctgtctgctc 1320
tagtaataag ccggctattg tagaagctgg tggaatgcaa gctttaggac ttcacctgac 1380
agatccaagt caacgtcttg ttcagaactg tctttggact ctcaggaatc tttcagatgc 1440
tgcaactaaa caggaaggga tggaaggtct ccttgggact cttgttcagc ttctgggttc 1500
agatgatata aatgtggtca cctgtgcagc tggaattctt tctaacctca cttgcaataa 1560
ttataagaac aagatgatgg tctgccaagt gggtggtata gaggctcttg tgcgtactgt 1620
ccttcgggct ggtgacaggg aagacatcac tgagcctgcc atctgtgctc ttcgtcatct 1680
gaccagccga caccaagaag cagagatggc ccagaatgca gttcgccttc actatggact 1740
accagttgtg gttaagctct tacacccacc atcccactgg cctctgataa aggctactgt 1800
tggattgatt cgaaatcttg ccctttgtcc cgcaaatcat gcacctttgc gtgagcaggg 1860
tgccattcca cgactagttc agttgcttgt tcgtgcacat caggataccc agcgccgtac 1920
gtccatgggt gggacacagc agcaatttgt ggagggggtc cgcatggaag aaatagttga 1980
aggttgtacc ggagcccttc acatcctagc tcgggatgtt cacaaccgaa ttgttatcag 2040
aggactaaat accattccat tgtttgtgca gctgctttat tctcccattg aaaacatcca 2100
aagagtagct gcaggggtcc tctgtgaact tgctcaggac aaggaagctg cagaagctat 2160
tgaagctgag ggagccacag ctcctctgac agagttactt cactctagga atgaaggtgt 2220
ggcgacatat gcagctgctg ttttgttccg aatgtctgag gacaagccac aagattacaa 2280
gaaacggctt tcagttgagc tgaccagctc tctcttcaga acagagccaa tggcttggaa 2340
tgagactgct gatcttggac ttgatattgg tgcccaggga gaaccccttg gatatcgcca 2400
ggatgatcct agctatcgtt cttttcactc tggtggatat ggccaggatg ccttgggtat 2460
ggaccccatg atggaacatg agatgggtgg ccaccaccct ggtgctgact atccagttga 2520
tgggctgcca gatctggggc atgcccagga cctcatggat gggctgcctc caggtgacag 2580
caatcagctg gcctggtttg atactgacct gtaaatcatc ctttaggagt aacaatacaa 2640
atggattttg ggagtgactc aagaagtgaa gaatgcacaa gaatggatca caagatggaa 2700
tttatcaaac cctagccttg cttgttaaat tttttttttt ttttttttaa gaatatctgt 2760
aatggtactg actttgcttg ctttgaagta gctctttttt tttttttttt tttttttttg 2820
cagtaactgt tttttaagtc tctcgtagtg ttaagttata gtgaatactg ctacagcaat 2880
ttctaatttt taagaattga gtaatggtgt agaacactaa ttcataatca ctctaattaa 2940
ttgtaatctg aataaagtgt aacaattgtg tagccttttt gtataaaata gacaaataga 3000
aaatggtcca attagtttcc tttttaatat gcttaaaata agcaggtgga tctatttcat 3060
gtttttgatc aaaaactatt tgggatatgt atgggtaggg taaatcagta agaggtgtta 3120
tttggaacct tgttttggac agtttaccag ttgcctttta tcccaaagtt gttgtaacct 3180
gctgtgatac gatgcttcaa gagaaaatgc ggttataaaa aatggttcag aattaaactt 3240
ttaattcatt cgattg 3256
<210> 13
<211> 1424
<212> DNA
<213> Homo sapiens
<400> 13
agcagtcagc cggccggaga cagagacttc acgactccca gtctcctcct cgccgcggcc 60
gccgcctcct ccttctctcc tcctcctctt cctcctcctc cctcgctccc acagccatgt 120
ctgcttagac cagagcagcc ccacagccaa ctagggcagc tgccgccgcc acaacagcaa 180
ggacagccgc tgccgccgcc cgtgagcgat gacaggagtg tttgacagaa gggtccccag 240
catccgatcc ggcgacttcc aagctccgtt ccagacgtcc gcagctatgc accatccgtc 300
tcaggaatcg ccaactttgc ccgagtcttc agctaccgat tctgactact acagccctac 360
ggggggagcc ccgcacggct actgctctcc tacctcggct tcctatggca aagctctcaa 420
cccctaccag tatcagtatc acggcgtgaa cggctccgcc gggagctacc cagccaaagc 480
ttatgccgac tatagctacg ctagctccta ccaccagtac ggcggcgcct acaaccgcgt 540
cccaagcgcc accaaccagc cagagaaaga agtgaccgag cccgaggtga gaatggtgaa 600
tggcaaacca aagaaagttc gtaaacccag gactatttat tccagctttc agctggccgc 660
attacagaga aggtttcaga agactcagta cctcgccttg ccggaacgcg ccgagctggc 720
cgcctcgctg ggattgacac aaacacaggt gaaaatctgg tttcagaaca aaagatccaa 780
gatcaagaag atcatgaaaa acggggagat gcccccggag cacagtccca gctccagcga 840
cccaatggcg tgtaactcgc cgcagtctcc agcggtgtgg gagccccagg gctcgtcccg 900
ctcgctcagc caccaccctc atgcccaccc tccgacctcc aaccagtccc cagcgtccag 960
ctacctggag aactctgcat cctggtacac aagtgcagcc agctcaatca attcccacct 1020
gccgccgccg ggctccttac agcacccgct ggcgctggcc tccgggacac tctattagat 1080
gggctgctct ctcttactct cttttttggg actactgtgt tttgctgttc tagaaaatca 1140
taaagaaagg aattcatatg gggaagttcg gaaaactgaa aaagattcat gtgtaaagct 1200
tttttttgca tgtaagttat tgcatttcaa aagacccccc ctttttttac agaggacttt 1260
ttttgcgcaa ctgtggacac tttcaatggt gccttgaaat ctatgacctc aacttttcaa 1320
aagacttttt tcaatgttat tttagccatg taaataagtg tagatagagg aattaaactg 1380
tatattctgg ataaataaaa ttatttcgac catgaaaagc ggaa 1424
<210> 14
<211> 2109
<212> DNA
<213> Homo sapiens
<400> 14
ggagctgttt acccccactc taataggggt tcaatataaa aagccggcag agagctgtcc 60
aagtcagacg cgcctctgca tctgcgccag gcgaacgggt cctgcgcctc ctgcagtccc 120
agctctccac cgccgcgtgc gcctgcagac gctccgctcg ctgccttctc tcctggcagg 180
cgctgccttt tctccccgtt aaaagggcac ttgggctgaa ggatcgcttt gagatctgag 240
gaacccgcag cgctttgagg gacctgaagc tgtttttctt cgttttcctt tgggttcagt 300
ttgaacggga ggtttttgat cccttttttt cagaatggat tatttgctca tgattttctc 360
tctgctgttt gtggcttgcc aaggagctcc agaaacagtc ttaggcgctg agctcagcgc 420
ggtgggtgag aacggcgggg agaaacccac tcccagtcca ccctggcggc tccgccggtc 480
caagcgctgc tcctgctcgt ccctgatgga taaagagtgt gtctacttct gccacctgga 540
catcatttgg gtcaacactc ccgagcacgt tgttccgtat ggacttggaa gccctaggtc 600
caagagagcc ttggagaatt tacttcccac aaaggcaaca gaccgtgaaa atagatgcca 660
atgtgctagc caaaaagaca agaagtgctg gaatttttgc caagcaggaa aagaactcag 720
ggctgaagac attatggaga aagactggaa taatcataag aaaggaaaag actgttccaa 780
gcttgggaaa aagtgtattt atcagcagtt agtgagagga agaaaaatca gaagaagttc 840
agaggaacac ctaagacaaa ccaggtcgga gaccatgaga aacagcgtca aatcatcttt 900
tcatgatccc aagctgaaag gcaagccctc cagagagcgt tatgtgaccc acaaccgagc 960
acattggtga cagaccttcg gggcctgtct gaagccatag cctccacgga gagccctgtg 1020
gccgactctg cactctccac cctggctggg atcagagcag gagcatcctc tgctggttcc 1080
tgactggcaa aggaccagcg tcctcgttca aaacattcca agaaaggtta aggagttccc 1140
ccaaccatct tcactggctt ccatcagtgg taactgcttt ggtctcttct ttcatctggg 1200
gatgacaatg gacctctcag cagaaacaca cagtcacatt cgaattcggg tggcatcctc 1260
cggagagaga gagaggaagg agattccaca caggggtgga gtttctgacg aaggtcctaa 1320
gggagtgttt gtgtctgact caggcgcctg gcacatttca gggagaaact ccaaagtcca 1380
cacaaagatt ttctaaggaa tgcacaaatt gaaaacacac tcaaaagaca aacatgcaag 1440
taaagaaaaa aaaaagaaag acttttgttt aaatttgtaa aatgcaaaac tgaatgaaac 1500
tgttactacc ataaatcagg atatgtttca tgaatatgag tctacctcac ctatattgca 1560
ctctggcaga agtatttccc acatttaatt attgcctccc caaactcttc ccacccctgc 1620
tgccccttcc tccatccccc atactaaatc ctagcctcgt agaagtctgg tctaatgtgt 1680
cagcagtaga tataatattt tcatggtaat ctactagctc tgatccataa gaaaaaaaag 1740
atcattaaat caggagattc cctgtccttg atttttggag acacaatggt atagggttgt 1800
ttatgaaata tattgaaaag taagtgtttg ttacgcttta aagcagtaaa attattttcc 1860
tttatataac cggctaatga aagaggttgg attgaatttt gatgtactta tttttttata 1920
gatatttata ttcaaacaat ttattcctta tatttaccat gttaaatatc tgtttgggca 1980
ggccatattg gtctatgtat ttttaaaata tgtatttcta aatgaaattg agaacatgct 2040
ttgttttgcc tgtcaaggta atgactttag aaaataaata tttttttcct tactgtaaaa 2100
aaaaaaaaa 2109
<210> 15
<211> 8272
<212> DNA
<213> Homo sapiens
<400> 15
gcccgcgccg gctgtgctgc acagggggag gagagggaac cccaggcgcg agcgggaaga 60
ggggacctgc agccacaact tctctggtcc tctgcatccc ttctgtccct ccacccgtcc 120
ccttccccac cctctggccc ccaccttctt ggaggcgaca acccccggga ggcattagaa 180
gggatttttc ccgcaggttg cgaagggaag caaacttggt ggcaacttgc ctcccggtgc 240
gggcgtctct cccccaccgt ctcaacatgc ttaggggtcc ggggcccggg ctgctgctgc 300
tggccgtcca gtgcctgggg acagcggtgc cctccacggg agcctcgaag agcaagaggc 360
aggctcagca aatggttcag ccccagtccc cggtggctgt cagtcaaagc aagcccggtt 420
gttatgacaa tggaaaacac tatcagataa atcaacagtg ggagcggacc tacctaggca 480
atgcgttggt ttgtacttgt tatggaggaa gccgaggttt taactgcgag agtaaacctg 540
aagctgaaga gacttgcttt gacaagtaca ctgggaacac ttaccgagtg ggtgacactt 600
atgagcgtcc taaagactcc atgatctggg actgtacctg catcggggct gggcgaggga 660
gaataagctg taccatcgca aaccgctgcc atgaaggggg tcagtcctac aagattggtg 720
acacctggag gagaccacat gagactggtg gttacatgtt agagtgtgtg tgtcttggta 780
atggaaaagg agaatggacc tgcaagccca tagctgagaa gtgttttgat catgctgctg 840
ggacttccta tgtggtcgga gaaacgtggg agaagcccta ccaaggctgg atgatggtag 900
attgtacttg cctgggagaa ggcagcggac gcatcacttg cacttctaga aatagatgca 960
acgatcagga cacaaggaca tcctatagaa ttggagacac ctggagcaag aaggataatc 1020
gaggaaacct gctccagtgc atctgcacag gcaacggccg aggagagtgg aagtgtgaga 1080
ggcacacctc tgtgcagacc acatcgagcg gatctggccc cttcaccgat gttcgtgcag 1140
ctgtttacca accgcagcct cacccccagc ctcctcccta tggccactgt gtcacagaca 1200
gtggtgtggt ctactctgtg gggatgcagt ggctgaagac acaaggaaat aagcaaatgc 1260
tttgcacgtg cctgggcaac ggagtcagct gccaagagac agctgtaacc cagacttacg 1320
gtggcaactc aaatggagag ccatgtgtct taccattcac ctacaatggc aggacgttct 1380
actcctgcac cacagaaggg cgacaggacg gacatctttg gtgcagcaca acttcgaatt 1440
atgagcagga ccagaaatac tctttctgca cagaccacac tgttttggtt cagactcgag 1500
gaggaaattc caatggtgcc ttgtgccact tccccttcct atacaacaac cacaattaca 1560
ctgattgcac ttctgagggc agaagagaca acatgaagtg gtgtgggacc acacagaact 1620
atgatgccga ccagaagttt gggttctgcc ccatggctgc ccacgaggaa atctgcacaa 1680
ccaatgaagg ggtcatgtac cgcattggag atcagtggga taagcagcat gacatgggtc 1740
acatgatgag gtgcacgtgt gttgggaatg gtcgtgggga atggacatgc attgcctact 1800
cgcagcttcg agatcagtgc attgttgatg acatcactta caatgtgaac gacacattcc 1860
acaagcgtca tgaagagggg cacatgctga actgtacatg cttcggtcag ggtcggggca 1920
ggtggaagtg tgatcccgtc gaccaatgcc aggattcaga gactgggacg ttttatcaaa 1980
ttggagattc atgggagaag tatgtgcatg gtgtcagata ccagtgctac tgctatggcc 2040
gtggcattgg ggagtggcat tgccaacctt tacagaccta tccaagctca agtggtcctg 2100
tcgaagtatt tatcactgag actccgagtc agcccaactc ccaccccatc cagtggaatg 2160
caccacagcc atctcacatt tccaagtaca ttctcaggtg gagacctaaa aattctgtag 2220
gccgttggaa ggaagctacc ataccaggcc acttaaactc ctacaccatc aaaggcctga 2280
agcctggtgt ggtatacgag ggccagctca tcagcatcca gcagtacggc caccaagaag 2340
tgactcgctt tgacttcacc accaccagca ccagcacacc tgtgaccagc aacaccgtga 2400
caggagagac gactcccttt tctcctcttg tggccacttc tgaatctgtg accgaaatca 2460
cagccagtag ctttgtggtc tcctgggtct cagcttccga caccgtgtcg ggattccggg 2520
tggaatatga gctgagtgag gagggagatg agccacagta cctggatctt ccaagcacag 2580
ccacttctgt gaacatccct gacctgcttc ctggccgaaa atacattgta aatgtctatc 2640
agatatctga ggatggggag cagagtttga tcctgtctac ttcacaaaca acagcgcctg 2700
atgcccctcc tgacccgact gtggaccaag ttgatgacac ctcaattgtt gttcgctgga 2760
gcagacccca ggctcccatc acagggtaca gaatagtcta ttcgccatca gtagaaggta 2820
gcagcacaga actcaacctt cctgaaactg caaactccgt caccctcagt gacttgcaac 2880
ctggtgttca gtataacatc actatctatg ctgtggaaga aaatcaagaa agtacacctg 2940
ttgtcattca acaagaaacc actggcaccc cacgctcaga tacagtgccc tctcccaggg 3000
acctgcagtt tgtggaagtg acagacgtga aggtcaccat catgtggaca ccgcctgaga 3060
gtgcagtgac cggctaccgt gtggatgtga tccccgtcaa cctgcctggc gagcacgggc 3120
agaggctgcc catcagcagg aacacctttg cagaagtcac cgggctgtcc cctggggtca 3180
cctattactt caaagtcttt gcagtgagcc atgggaggga gagcaagcct ctgactgctc 3240
aacagacaac caaactggat gctcccacta acctccagtt tgtcaatgaa actgattcta 3300
ctgtcctggt gagatggact ccacctcggg cccagataac aggataccga ctgaccgtgg 3360
gccttacccg aagaggacag cccaggcagt acaatgtggg tccctctgtc tccaagtacc 3420
cactgaggaa tctgcagcct gcatctgagt acaccgtatc cctcgtggcc ataaagggca 3480
accaagagag ccccaaagcc actggagtct ttaccacact gcagcctggg agctctattc 3540
caccttacaa caccgaggtg actgagacca ccattgtgat cacatggacg cctgctccaa 3600
gaattggttt taagctgggt gtacgaccaa gccagggagg agaggcacca cgagaagtga 3660
cttcagactc aggaagcatc gttgtgtccg gcttgactcc aggagtagaa tacgtctaca 3720
ccatccaagt cctgagagat ggacaggaaa gagatgcgcc aattgtaaac aaagtggtga 3780
caccattgtc tccaccaaca aacttgcatc tggaggcaaa ccctgacact ggagtgctca 3840
cagtctcctg ggagaggagc accaccccag acattactgg ttatagaatt accacaaccc 3900
ctacaaacgg ccagcaggga aattctttgg aagaagtggt ccatgctgat cagagctcct 3960
gcacttttga taacctgagt cccggcctgg agtacaatgt cagtgtttac actgtcaagg 4020
atgacaagga aagtgtccct atctctgata ccatcatccc agctgttcct cctcccactg 4080
acctgcgatt caccaacatt ggtccagaca ccatgcgtgt cacctgggct ccacccccat 4140
ccattgattt aaccaacttc ctggtgcgtt actcacctgt gaaaaatgag gaagatgttg 4200
cagagttgtc aatttctcct tcagacaatg cagtggtctt aacaaatctc ctgcctggta 4260
cagaatatgt agtgagtgtc tccagtgtct acgaacaaca tgagagcaca cctcttagag 4320
gaagacagaa aacaggtctt gattccccaa ctggcattga cttttctgat attactgcca 4380
actcttttac tgtgcactgg attgctcctc gagccaccat cactggctac aggatccgcc 4440
atcatcccga gcacttcagt gggagacctc gagaagatcg ggtgccccac tctcggaatt 4500
ccatcaccct caccaacctc actccaggca cagagtatgt ggtcagcatc gttgctctta 4560
atggcagaga ggaaagtccc ttattgattg gccaacaatc aacagtttct gatgttccga 4620
gggacctgga agttgttgct gcgaccccca ccagcctact gatcagctgg gatgctcctg 4680
ctgtcacagt gagatattac aggatcactt acggagagac aggaggaaat agccctgtcc 4740
aggagttcac tgtgcctggg agcaagtcta cagctaccat cagcggcctt aaacctggag 4800
ttgattatac catcactgtg tatgctgtca ctggccgtgg agacagcccc gcaagcagca 4860
agccaatttc cattaattac cgaacagaaa ttgacaaacc atcccagatg caagtgaccg 4920
atgttcagga caacagcatt agtgtcaagt ggctgccttc aagttcccct gttactggtt 4980
acagagtaac caccactccc aaaaatggac caggaccaac aaaaactaaa actgcaggtc 5040
cagatcaaac agaaatgact attgaaggct tgcagcccac agtggagtat gtggttagtg 5100
tctatgctca gaatccaagc ggagagagtc agcctctggt tcagactgca gtaaccacta 5160
ttcctgcacc aactgacctg aagttcactc aggtcacacc cacaagcctg agcgcccagt 5220
ggacaccacc caatgttcag ctcactggat atcgagtgcg ggtgaccccc aaggagaaga 5280
ccggaccaat gaaagaaatc aaccttgctc ctgacagctc atccgtggtt gtatcaggac 5340
ttatggtggc caccaaatat gaagtgagtg tctatgctct taaggacact ttgacaagca 5400
gaccagctca gggagttgtc accactctgg agaatgtcag cccaccaaga agggctcgtg 5460
tgacagatgc tactgagacc accatcacca ttagctggag aaccaagact gagacgatca 5520
ctggcttcca agttgatgcc gttccagcca atggccagac tccaatccag agaaccatca 5580
agccagatgt cagaagctac accatcacag gtttacaacc aggcactgac tacaagatct 5640
acctgtacac cttgaatgac aatgctcgga gctcccctgt ggtcatcgac gcctccactg 5700
ccattgatgc accatccaac ctgcgtttcc tggccaccac acccaattcc ttgctggtat 5760
catggcagcc gccacgtgcc aggattaccg gctacatcat caagtatgag aagcctgggt 5820
ctcctcccag agaagtggtc cctcggcccc gccctggtgt cacagaggct actattactg 5880
gcctggaacc gggaaccgaa tatacaattt atgtcattgc cctgaagaat aatcagaaga 5940
gcgagcccct gattggaagg aaaaagacag acgagcttcc ccaactggta acccttccac 6000
accccaatct tcatggacca gagatcttgg atgttccttc cacagttcaa aagacccctt 6060
tcgtcaccca ccctgggtat gacactggaa atggtattca gcttcctggc acttctggtc 6120
agcaacccag tgttgggcaa caaatgatct ttgaggaaca tggttttagg cggaccacac 6180
cgcccacaac ggccaccccc ataaggcata ggccaagacc atacccgccg aatgtaggtg 6240
aggaaatcca aattggtcac atccccaggg aagatgtaga ctatcacctg tacccacacg 6300
gtccgggact caatccaaat gcctctacag gacaagaagc tctctctcag acaaccatct 6360
catgggcccc attccaggac acttctgagt acatcatttc atgtcatcct gttggcactg 6420
atgaagaacc cttacagttc agggttcctg gaacttctac cagtgccact ctgacaggcc 6480
tcaccagagg tgccacctac aacatcatag tggaggcact gaaagaccag cagaggcata 6540
aggttcggga agaggttgtt accgtgggca actctgtcaa cgaaggcttg aaccaaccta 6600
cggatgactc gtgctttgac ccctacacag tttcccatta tgccgttgga gatgagtggg 6660
aacgaatgtc tgaatcaggc tttaaactgt tgtgccagtg cttaggcttt ggaagtggtc 6720
atttcagatg tgattcatct agatggtgcc atgacaatgg tgtgaactac aagattggag 6780
agaagtggga ccgtcaggga gaaaatggcc agatgatgag ctgcacatgt cttgggaacg 6840
gaaaaggaga attcaagtgt gaccctcatg aggcaacgtg ttatgatgat gggaagacat 6900
accacgtagg agaacagtgg cagaaggaat atctcggtgc catttgctcc tgcacatgct 6960
ttggaggcca gcggggctgg cgctgtgaca actgccgcag acctgggggt gaacccagtc 7020
ccgaaggcac tactggccag tcctacaacc agtattctca gagataccat cagagaacaa 7080
acactaatgt taattgccca attgagtgct tcatgccttt agatgtacag gctgacagag 7140
aagattcccg agagtaaatc atctttccaa tccagaggaa caagcatgtc tctctgccaa 7200
gatccatcta aactggagtg atgttagcag acccagctta gagttcttct ttctttctta 7260
agccctttgc tctggaggaa gttctccagc ttcagctcaa ctcacagctt ctccaagcat 7320
caccctggga gtttcctgag ggttttctca taaatgaggg ctgcacattg cctgttctgc 7380
ttcgaagtat tcaataccgc tcagtatttt aaatgaagtg attctaagat ttggtttggg 7440
atcaatagga aagcatatgc agccaaccaa gatgcaaatg ttttgaaatg atatgaccaa 7500
aattttaagt aggaaagtca cccaaacact tctgctttca cttaagtgtc tggcccgcaa 7560
tactgtagga acaagcatga tcttgttact gtgatatttt aaatatccac agtactcact 7620
ttttccaaat gatcctagta attgcctaga aatatctttc tcttacctgt tatttatcaa 7680
tttttcccag tatttttata cggaaaaaat tgtattgaaa acacttagta tgcagttgat 7740
aagaggaatt tggtataatt atggtgggtg attatttttt atactgtatg tgccaaagct 7800
ttactactgt ggaaagacaa ctgttttaat aaaagattta cattccacaa cttgaagttc 7860
atctatttga tataagacac cttcggggga aataattcct gtgaatattc tttttcaatt 7920
cagcaaacat ttgaaaatct atgatgtgca agtctaattg ttgatttcag tacaagattt 7980
tctaaatcag ttgctacaaa aactgattgg tttttgtcac ttcatctctt cactaatgga 8040
gatagcttta cactttctgc tttaatagat ttaagtggac cccaatattt attaaaattg 8100
ctagtttacc gttcagaagt ataatagaaa taatctttag ttgctctttt ctaaccattg 8160
taattcttcc cttcttccct ccacctttcc ttcattgaat aaacctctgt tcaaagagat 8220
tgcctgcaag ggaaataaaa atgactaaga tattaaaaaa aaaaaaaaaa aa 8272
<210> 16
<211> 2397
<212> DNA
<213> Homo sapiens
<400> 16
gcacacactc atcgaaaaaa atttggatta ttagaagaga gaggtctgcg gcttccacac 60
cgtacagcgt ggtttttctt ctcggtataa aagcaaagtt gtttttgata cgtgacagtt 120
tcccacaagc caggctgatc cttttctgtc agtccacttc accaagcctg cccttggaca 180
aggacccgat gcccaacccc aggcctggca agccctcggc cccttccttg gcccttggcc 240
catccccagg agcctcgccc agctggaggg ctgcacccaa agcctcagac ctgctggggg 300
cccggggccc agggggaacc ttccagggcc gagatcttcg aggcggggcc catgcctcct 360
cttcttcctt gaaccccatg ccaccatcgc agctgcagct gcccacactg cccctagtca 420
tggtggcacc ctccggggca cggctgggcc ccttgcccca cttacaggca ctcctccagg 480
acaggccaca tttcatgcac cagctctcaa cggtggatgc ccacgcccgg acccctgtgc 540
tgcaggtgca ccccctggag agcccagcca tgatcagcct cacaccaccc accaccgcca 600
ctggggtctt ctccctcaag gcccggcctg gcctcccacc tgggatcaac gtggccagcc 660
tggaatgggt gtccagggag ccggcactgc tctgcacctt cccaaatccc agtgcaccca 720
ggaaggacag caccctttcg gctgtgcccc agagctccta cccactgctg gcaaatggtg 780
tctgcaagtg gcccggatgt gagaaggtct tcgaagagcc agaggacttc ctcaagcact 840
gccaggcgga ccatcttctg gatgagaagg gcagggcaca atgtctcctc cagagagaga 900
tggtacagtc tctggagcag cagctggtgc tggagaagga gaagctgagt gccatgcagg 960
cccacctggc tgggaaaatg gcactgacca aggcttcatc tgtggcatca tccgacaagg 1020
gctcctgctg catcgtagct gctggcagcc aaggccctgt cgtcccagcc tggtctggcc 1080
cccgggaggc ccctgacagc ctgtttgctg tccggaggca cctgtggggt agccatggaa 1140
acagcacatt cccagagttc ctccacaaca tggactactt caagttccac aacatgcgac 1200
cccctttcac ctacgccacg ctcatccgct gggccatcct ggaggctcca gagaagcagc 1260
ggacactcaa tgagatctac cactggttca cacgcatgtt tgccttcttc agaaaccatc 1320
ctgccacctg gaagaacgcc atccgccaca acctgagtct gcacaagtgc tttgtgcggg 1380
tggagagcga gaagggggct gtgtggaccg tggatgagct ggagttccgc aagaaacgga 1440
gccagaggcc cagcaggtgt tccaacccta cacctggccc ctgacctcaa gatcaaggaa 1500
aggaggatgg acgaacaggg gccaaactgg tgggaggcag aggtggtggg ggcagggatg 1560
ataggccctg gatgtgccca cagggaccaa gaagtgaggt ttccactgtc ttgcctgcca 1620
gggcccctgt tcccccgctg gcagccaccc cctcccccat catatccttt gccccaaggc 1680
tgctcagagg ggccccggtc ctggccccag cccccacctc cgccccagac acacccccca 1740
gtcgagccct gcagccaaac agagccttca caaccagcca cacagagcct gcctcagctg 1800
ctcgcacaga ttacttcagg gctggaaaag tcacacagac acacaaaatg tcacaatcct 1860
gtccctcact caacacaaac cccaaaacac agagagcctg cctcagtaca ctcaaacaac 1920
ctcaaagctg catcatcaca caatcacaca caagcacagc cctgacaacc cacacacccc 1980
aaggcacgca cccacagcca gcctcagggc ccacaggggc actgtcaaca caggggtgtg 2040
cccagaggcc tacacagaag cagcgtcagt accctcagga tctgaggtcc caacacgtgc 2100
tcgctcacac acacggcctg ttagaattca cctgtgtatc tcacgcatat gcacacgcac 2160
agccccccag tgggtctctt gagtcccgtg cagacacaca cagccacaca cactgccttg 2220
ccaaaaatac cccgtgtctc ccctgccact cacctcactc ccattccctg agccctgatc 2280
catgcctcag cttagactgc agaggaacta ctcatttatt tgggatccaa ggcccccaac 2340
ccacagtacc gtccccaata aactgcagcc gagctcccca caaaaaaaaa aaaaaaa 2397
<210> 17
<211> 1936
<212> DNA
<213> Homo sapiens
<400> 17
acagctcttg ccaggcaagg cagccgacca caggtgagtc ttggcatcta ccgttttcaa 60
gtgaccagga tgaagacact ccagtttttc ttccttttct gttgctggaa agcaatctgc 120
tgcaatagct gtgagctgac caacatcacc attgcaatag agaaagaaga atgtcgtttc 180
tgcataagca tcaacaccac ttggtgtgct ggctactgct acaccaggga tctggtgtat 240
aaggacccag ccaggcccaa aatccagaaa acatgtacct tcaaggaact ggtatacgaa 300
acagtgagag tgcccggctg tgctcaccat gcagattcct tgtatacata cccagtggcc 360
acccagtgtc actgtggcaa gtgtgacagc gacagcactg attgtactgt gcgaggcctg 420
gggcccagct actgctcctt tggtgaaatg aaagaataaa gatcagtgga catttcaggc 480
cacataccct tgtcctgaag gaccaagata ttcaaaaagt ctgtgtgtgt gcaatgtgcc 540
caggggacaa accactggat caggggattc agactctact gatccctggt ctactggcag 600
agggaactct gggaattgag agtgctgggg gccaggactc catcatgatt cagctctata 660
ttcctaggtc tgatttcata aggtttattc agtcttaact cacagacttg tgcctggttt 720
cttctttaaa aatcttagaa atcttctcag gcaatgcctc tctcttaggg ggaaacataa 780
gcctagaagg aggaagcagt aatgggagtg agtgaaagaa ctaactgcag cagtcttctg 840
gtagactctt gggccctcta gagcaaggtc agcatcttca gcattgtagc gtcaatgcct 900
agcactctgc ctggaactta gaaacacaac aatgacttct ttagatcaga aaggtcaagg 960
gtagaaaata ctggaagacg atgtttgagg taagctgatg aggctgcccg cagccacacc 1020
agtcccatga aagttagtgg catcagttcc acctcgcctt ttctccagca catggagtat 1080
tgagacatga tgtatctttc tgaattgttt ggtacagatg gggagtaaca gagctcaaga 1140
tttccaagct attactacca agcctgttag ttaagggcaa aggcaagaaa ttgtaatttg 1200
gggctgtgga aattagcctg cctctattca ttacttaaac aaattgatca catgctacta 1260
ggctcctgca aaactccttt ttgagataaa gggaaaaaac caaactatct caccctaccc 1320
tccctaggat ccacttcttt ggaatgacaa aggatttgaa agtaggtttg aaagcagttt 1380
cagcaattta ataaatataa ttaatttgtc tacaaatata tttgtataaa taaatagctc 1440
ctttagaaag aattagccat gggggacgag gggaaactgc tgttttctag gatcctgtct 1500
acatcaatct tctattttat ccatccatgt tctcccaaat ctgtgctttc tttcaacagg 1560
ttatatatta aaactatttc atgagttgat ttcttttaaa cgtgttaact gtcttagtta 1620
tgcactcagt ttcacactca tattgtttaa ctaatttatt taaatcttat ttttttaata 1680
aagatgctag ccaccagagt cacaggcttg gattgtttta tgtacaaaca gatgacttag 1740
atattctgta ttttataata ttagtggaat gaaatcttaa aatataattc ccagtgtttc 1800
tataaatatt acctttcctt atctttggag atattaaaaa taattttgtt ggatttctga 1860
agtgttttgt cacttaaatt tcctgtcatt ttttgaagac attttctgat gtaatttggg 1920
agaaaaaaag cataga 1936
<210> 18
<211> 1834
<212> DNA
<213> Homo sapiens
<400> 18
ttgggaaggg tttccagaag gtgggaaatg tcacctgatt cacactgaac ttttgaaagc 60
tccccacccc caaggagccg cgcacaccct cgctcgcggc cgccctccca cagccccaca 120
cactgggaga ccgcccaccg caaaccgcgg agacccccgt ctagatttaa agcgcggctg 180
cgcccggctt ctgacgtcca ttgaatcgcg cgggcggccg gcggcgagcg cggggctgcg 240
ccgggatcgc tgcgccctcc gccgctggcc tctgcgacgc gcgccgctcg cccgagccac 300
ccgccgccgc gccggctccc cgcgccgctg cgctcctcgc cccgcgcctg cccccaggat 360
ggtccgcgcg aggcaccagc cgggtgggct ttgcctcctg ctgctgctgc tctgccagtt 420
catggaggac cgcagtgccc aggctgggaa ctgctggctc cgtcaagcga agaacggccg 480
ctgccaggtc ctgtacaaga ccgaactgag caaggaggag tgctgcagca ccggccggct 540
gagcacctcg tggaccgagg aggacgtgaa tgacaacaca ctcttcaagt ggatgatttt 600
caacgggggc gcccccaact gcatcccctg taaagaaacg tgtgagaacg tggactgtgg 660
acctgggaaa aaatgccgaa tgaacaagaa gaacaaaccc cgctgcgtct gcgccccgga 720
ttgttccaac atcacctgga agggtccagt ctgcgggctg gatgggaaaa cctaccgcaa 780
tgaatgtgca ctcctaaagg caagatgtaa agagcagcca gaactggaag tccagtacca 840
aggcagatgt aaaaagactt gtcgggatgt tttctgtcca ggcagctcca catgtgtggt 900
ggaccagacc aataatgcct actgtgtgac ctgtaatcgg atttgcccag agcctgcttc 960
ctctgagcaa tatctctgtg ggaatgatgg agtcacctac tccagtgcct gccacctgag 1020
aaaggctacc tgcctgctgg gcagatctat tggattagcc tatgagggaa agtgtatcaa 1080
agcaaagtcc tgtgaagata tccagtgcac tggtgggaaa aaatgtttat gggatttcaa 1140
ggttgggaga ggccggtgtt ccctctgtga tgagctgtgc cctgacagta agtcggatga 1200
gcctgtctgt gccagtgaca atgccactta tgccagcgag tgtgccatga aggaagctgc 1260
ctgctcctca ggtgtgctac tggaagtaaa gcactccgga tcttgcaact ccatttcgga 1320
agacaccgag gaagaggagg aagatgaaga ccaggactac agctttccta tatcttctat 1380
tctagagtgg taaactctct ataagtgttc agtgttgaca tagcctttgt gcaaaaaaaa 1440
aaaaaaaaaa aaagaaaaag aaaaaaagaa aaatatattg tccatactgt aaataagtgt 1500
atgcttattt atttgggggg aaaactatac attaaaggac ctttgtccta aagctctctc 1560
ccaggccacc ttgttactca ttggacacgg agaggcattc attgtgaggt ctactggatg 1620
aggcccatag ttgagacttg tagacattta tttatactgt gtcatgtttt ataatttata 1680
cataaaatgt ctggttgact gtataccttg tttttgaaga aatttattcg tgaaaggaag 1740
agcagttgtt atttattgtg aggtctcttg cttgtaaagt aaaagctttt tttccttgta 1800
aaccatttaa gtccattcct tactattcac tcac 1834
<210> 19
<211> 2525
<212> DNA
<213> Homo sapiens
<400> 19
gggaagtcgg tgccgctgcc gtctctgcgt tcgccatgcg tcccggggcg ccagggccac 60
tctggcctct gccctggggg gccctggctt gggccgtggg cttcgtgagc tccatgggct 120
cggggaaccc cgcgcccggt ggtgtttgct ggctccagca gggccaggag gccacctgca 180
gcctggtgct ccagactgat gtcacccggg ccgagtgctg tgcctccggc aacattgaca 240
ccgcctggtc caacctcacc cacccgggga acaagatcaa cctcctcggc ttcttgggcc 300
ttgtccactg ccttccctgc aaagattcgt gcgacggcgt ggagtgcggc ccgggcaagg 360
cgtgccgcat gctggggggc cgcccgcgct gcgagtgcgc gcccgactgc tcggggctcc 420
cggcgcggct gcaggtctgc ggctcagacg gcgccaccta ccgcgacgag tgcgagctgc 480
gcgccgcgcg ctgccgcggc cacccggacc tgagcgtcat gtaccggggc cgctgccgca 540
agtcctgtga gcacgtggtg tgcccgcggc cacagtcgtg cgtcgtggac cagacgggca 600
gcgcccactg cgtggtgtgt cgagcggcgc cctgccctgt gccctccagc cccggccagg 660
agctttgcgg caacaacaac gtcacctaca tctcctcgtg ccacatgcgc caggccacct 720
gcttcctggg ccgctccatc ggcgtgcgcc acgcgggcag ctgcgcaggc acccctgagg 780
agccgccagg tggtgagtct gcagaagagg aagagaactt cgtgtgagcc tgcaggacag 840
gcctgggcct ggtgcccgag gccccccatc atcccctgtt atttattgcc acagcagagt 900
ctaatttata tgccacggac actccttaga gcccggattc ggaccacttg gggatcccag 960
aacctccctg acgatatcct ggaaggactg aggaagggag gcctgggggc cggctggtgg 1020
gtgggataga cctgcgttcc ggacactgag cgcctgattt agggcccttc tctaggatgc 1080
cccagcccct accctaagac ctattgccgg ggaggattcc acacttccgc tcctttgggg 1140
ataaacctat taattattgc tactatcaag agggctgggc attctctgct ggtaattcct 1200
gaagaggcat gactgctttt ctcagcccca agcctctagt ctgggtgtgt acggagggtc 1260
tagcctgggt gtgtacggag ggtctagcct gggtgagtac ggagggtcta gcctgggtga 1320
gtacggaggg tctagcctgg gtgagtacgg agggtctagc ctgggtgtgt atggaggatc 1380
tagcctgggt gagtatggag ggtctagcct gggtgagtat ggagggtcta gcctgggtgt 1440
gtatggaggg tctagcctgg gtgagtatgg agggtctagc ctgggtgtgt atggagggtc 1500
tagcctgggt gagtatggag ggtctagcct gggtgtgtac ggagggtcta gtctgagtgc 1560
gtgtggggac ctcagaacac tgtgacctta gcccagcaag ccaggccctt catgaaggcc 1620
aagaaggctg ccaccattcc ctgccagccc aagaactcca gcttccccac tgcctctgtg 1680
tgcccctttg cgtcctgtga aggccattga gaaatgccca gtgtgccccc tgggaaaggg 1740
cacggcctgt gctcctgaca cgggctgtgc ttggccacag aaccacccag cgtctcccct 1800
gctgctgtcc acgtcagttc atgaggcaac gtcgcgtggt ctcagacgtg gagcagccag 1860
cggcagctca gagcagggca ctgtgtccgg cggagccaag tccactctgg gggagctctg 1920
gcggggacca cgggccactg ctcacccact ggccccgagg ggggtgtaga cgccaagact 1980
cacgcatgtg tgacatccgg agtcctggag ccgggtgtcc cagtggcacc actaggtgcc 2040
tgctgcctcc acagtggggt tcacacccag ggctccttgg tcccccacaa cctgccccgg 2100
ccaggcctgc agacccagac tccagccaga cctgcctcac ccaccaatgc agccggggct 2160
ggcgacacca gccaggtgct ggtcttgggc cagttctccc acgacggctc accctcccct 2220
ccatctgcgt tgatgctcag aatcgcctac ctgtgcctgc gtgtaaacca cagcctcaga 2280
ccagctatgg ggagaggaca acacggagga tatccagctt ccccggtctg gggtgaggaa 2340
tgtggggagc ttgggcatcc tcctccagcc tcctccagcc cccaggcagt gccttacctg 2400
tggtgcccag aaaagtgccc ctaggttggt gggtctacag gagcctcagc caggcagccc 2460
accccaccct ggggccctgc ctcaccaagg aaataaagac tcaagccatt taaaaaaaaa 2520
aaaaa 2525
<210> 20
<211> 1398
<212> DNA
<213> Homo sapiens
<400> 20
ggagagcggg gccctttgtc ctccagtggc tggtaggcag tggctgggag gcagcggccc 60
aattagtgtc gtgcggcccg tggcgaggcg aggtccgggg agcgagcgag caagcaaggc 120
gggaggggtg gccggagctg cggcggctgg cacaggagga ggagcccggg cgggcgaggg 180
gcggccggag agcgccaggg cctgagctgc cggagcggcg cctgtgagtg agtgcagaaa 240
gcaggcgccc gcgcgctagc cgtggcagga gcagcccgca cgccgcgctc tctccctggg 300
cgacctgcag tttgcaatat gactttggag gaattctcgg ctggagagca gaagaccgaa 360
aggatggata aggtggggga tgccctggag gaagtgctca gcaaagccct gagtcagcgc 420
acgatcactg tcggggtgta cgaagcggcc aagctgctca acgtcgaccc cgataacgtg 480
gtgttgtgcc tgctggcggc ggacgaggac gacgacagag atgtggctct gcagatccac 540
ttcaccctga tccaggcgtt ttgctgcgag aacgacatca acatcctgcg cgtcagcaac 600
ccgggccggc tggcggagct cctgctcttg gagaccgacg ctggccccgc ggcgagcgag 660
ggcgccgagc agcccccgga cctgcactgc gtgctggtga cgaatccaca ttcatctcaa 720
tggaaggatc ctgccttaag tcaacttatt tgtttttgcc gggaaagtcg ctacatggat 780
caatgggttc cagtgattaa tctccctgaa cggtgatggc atctgaatga aaataactga 840
accaaattgc actgaagttt ttgaaatacc tttgtagtta ctcaagcagt tactccctac 900
actgatgcaa ggattacaga aactgatgcc aaggggctga gtgagttcaa ctacatgttc 960
tgggggcccg gagatagatg actttgcaga tggaaagagg tgaaaatgaa gaaggaagct 1020
gtgttgaaac agaaaaataa gtcaaaagga acaaaaatta caaagaacca tgcaggaagg 1080
aaaactatgt attaatttag aatggttgag ttacattaaa ataaaccaaa tatgttaaag 1140
tttaagtgtg cagccatagt ttgggtattt ttggtttata tgccctcaag taaaagaaaa 1200
gccgaaaggg ttaatcatat ttgaaaacca tattttattg tattttgatg agatattaaa 1260
ttctcaaagt tttattataa attctactaa gttattttat gacatgaaaa gttatttatg 1320
ctataaattt tttgaaacac aatacctaca ataaactggt atgaataatt gcatcatttc 1380
aaaaaaaaaa aaaaaaaa 1398
<210> 21
<211> 1393
<212> DNA
<213> Homo sapiens
<400> 21
tcagatcgcc gaagcgtcgg actaccgttg gtttccgcaa cttcctggat tatcctcgcc 60
aaggactttg caatatattt ttccgccttt tctggaagga tttcgctgct tcccgaaggt 120
cttggacgag cgctctagct ctgtgggaag gttttgggct ctctggctcg gattttgcaa 180
tttctccctg gggactgccg tggagccgca tccactgtgg attataattg caacatgacg 240
ctggaagagc tcgtggcgtg cgacaacgcg gcgcagaaga tgcagacggt gaccgccgcg 300
gtggaggagc ttttggtggc cgctcagcgc caggatcgcc tcacagtggg ggtgtacgag 360
tcggccaagt tgatgaatgt ggacccagac agcgtggtcc tctgcctctt ggccattgac 420
gaggaggagg aggatgacat cgccctgcaa atccacttca cgctcatcca gtccttctgc 480
tgtgacaacg acatcaacat cgtgcgggtg tcgggcatgc agcgcctggc gcagctcctg 540
ggagagccgg ccgagaccca gggcaccacc gaggcccgag acctgcattg tctcctggtc 600
acgaaccctc acacggacgc ctggaagagc cacggcttgg tggaggtggc cagctactgc 660
gaagaaagcc ggggcaacaa ccagtgggtc ccctacatct ctcttcagga acgctgaggc 720
ccttcccagc agcagaatct gttgagttgc tgccacaaac aaaaaataca ataaatattt 780
gaaccccctc ccccccagca caaccccccc aaaacaaccc aacccacgag gaccatcggg 840
ggcagagtcg ttggagactg aagaggaaga ggaggaggag aaggggagtg agcggccgcc 900
cccagggcgg agatccagga gctggcggcc gccgatccga tggagaaggg gggacccagg 960
ccagcaggag acaggacccc cgaagctgag gccttgggat ggagcagaag ccggagtggc 1020
ggggcacgct gccgccttcc ccatcacgga gggtccagac tgtccactcg ggggtggagt 1080
gagactgact gcaagcccca ccctccttga gactggagct ggcgtctgca tacgagagac 1140
ttggttgaac ttggttggtc cttgtctgca ccctcgacaa gaccacactt tgggacttgg 1200
gagctggggc tgaagttgct ctgtacccat gaactcccag tttgcgaatt atagagacaa 1260
tctattttgt tacttgcact tgttattcga accactgaga gcgagatggg aagcatagat 1320
atctatattt ttatttctac tatgagggcc ttgtaataaa tttctaaagc ctctgaaaaa 1380
aaaaaaaaaa aaa 1393
<210> 22
<211> 5843
<212> DNA
<213> Homo sapiens
<400> 22
ttggttgctg gtccacttac aaacactttt catatttgta tgtctttcca atggttatcc 60
tgttttgttc atttcaggca tatggccctg atcagattaa ctgacatgat gtatatgcaa 120
agccttttga gttcttcaga aaaataaatt atcttattca agactgattg cttataagga 180
acttattata gctaatatag taggcacaat tttttttttg taattctcct agatgagtca 240
gaacttagtt ttgacgtagg taaaaatttt atggtcacaa atctcaggtg tgagaaaatc 300
tctttccttg atactctata taaatagagg atataaatat ttcaagtctg gaagtagtga 360
gagaagctgg taattctgga catatagtga cagtcaaaaa ggagctcagg tacaggactg 420
gtctaagctg ctcaagattc aggagacagc cagtacacag agaagctgag gagatacata 480
agatatatct aaaacattta tctaaccttc tgtggtaaca agctccttaa aggggctgga 540
tgatgttgtg ttcacttttt atcaccagca aaggctaaga taatgtatat agtaaatatt 600
tagtaactat ttattaaata aataaatatt taagacagaa taaacaagta taataaatga 660
accaataaga atgcaccatc taagtcaaaa tagccacttt tatccttaac attgtacctg 720
ctttggctgc tgcagaagca aacttgttgg cattagacaa atcaagctgg tgatttaata 780
aattccaatg taagtcttac cagtattgat gaataactat ccagcactca ccatgaaagt 840
taaagaaaca acacagaaaa agttcctaag tggtcccaat ttgaaatgat cagataacct 900
ataaaagaac atattcatat tatactaaca taaacacata taaatgcact tacagcagtt 960
acacagtatt ctcttcaata actagtttcc ttatgcatta atgtgtaata acagcaacta 1020
caatatttag ataattataa aaaccaaggc aataatttaa aaactgatta accgttttac 1080
tctaacttaa gcatggattg gatcagtaag attgattaat aaatttgaat gcagtcagtt 1140
ggattgattc taatttaaag ttttaatttg ttgtagaata attttaagtg aatatatttg 1200
tccagtgttc gagtgctcaa cagtgtgttt gaaaaggaaa acaaagaaat gtttttgaga 1260
aatgtgttaa ttccttaaga caatggattt taattggatc tagttgtttt catttttctt 1320
cattatcatt atacatctgt atgttggaca gaacactaac actaaatagt ttttagaaaa 1380
attttttaaa gttatttaaa tcataatatc atgactgact tttaaattca aaattaggct 1440
gtgactatcc ttcttcactt aggaagagtg ttgtgaaagc cagaccatct gctgaggtgc 1500
tacagttaca tgtggccctc agaatgcatt tggcctgctc tgttttagca ctctgttgga 1560
ttaccaatac acaaaacaag ttaaccttga tctttcacat taagtatctc agggacaaaa 1620
tttgacatac gtctaaacct gtgacgtttc catctaaaga aggcagaaat aaaacaggac 1680
tttagattcg gttacaataa aatatcagat gcaccagaga cacaaggctt gaagctctgt 1740
cctgggaaaa tatggcaaac agtgcctctc ctgaacagaa tcaaaatcac tgttcagcca 1800
tcaacaacag catcccactg atgcagggca acctccccac tctgaccttg tctggaaaga 1860
tccgagtgac ggttactttc ttcctttttc tgctctctgc gacctttaat gcttctttct 1920
tgttgaaact tcagaagtgg acacagaaga aagagaaagg gaaaaagctc tcaagaatga 1980
agctgctctt aaaacatctg accttagcca acctgttgga gactctgatt gtcatgccac 2040
tggatgggat gtggaacatt acagtccaat ggtatgctgg agagttactc tgcaaagttc 2100
tcagttatct aaagcttttc tccatgtatg ccccagcctt catgatggtg gtgatcagcc 2160
tggaccgctc cctggctatc acgaggcccc tagctttgaa aagcaacagc aaagtcggac 2220
agtccatggt tggcctggcc tggatcctca gtagtgtctt tgcaggacca cagttataca 2280
tcttcaggat gattcatcta gcagacagct ctggacagac aaaagttttc tctcaatgtg 2340
taacacactg cagtttttca caatggtggc atcaagcatt ttataacttt ttcaccttca 2400
gctgcctctt catcatccct cttttcatca tgctgatctg caatgcaaaa atcatcttca 2460
ccctgacacg ggtccttcat caggaccccc acgaactaca actgaatcag tccaagaaca 2520
atataccaag agcacggctg aagactctaa aaatgacggt tgcatttgcc acttcattta 2580
ctgtctgctg gactccctac tatgtcctag gaatttggta ttggtttgat cctgaaatgt 2640
taaacaggtt gtcagaccca gtaaatcact tcttctttct ctttgccttt ttaaacccat 2700
gctttgatcc acttatctat ggatattttt ctctgtgatt gatagactac acaagaagtc 2760
atatgaagaa gggtaaggta atgaatctct ccatctggga atgattaaca caaatgttgg 2820
agcatgttta catacaaaca aagtaggatt tacacttaag ttatcattct tttagaaact 2880
cagtcttcag agcctcaatt attaaggaaa agtcttcagg aaaaatacta aaatattttc 2940
tcttcctcat aagcttctaa attaatctct gccttttctg acctcatata acacattatg 3000
taggtttctt atcactttct ctttgcataa taatgtacta atatttaaaa taccttcagc 3060
ctaaggcaca aggatgccaa aaaaacaaag gtgagaaacc acaacacagg tctaaactca 3120
gcatgctttg gtgagttttt ctccaaaagg ggcatattag caattagagt tgtatgctat 3180
ataatacata gagcacagag ccctttgccc ataatatcaa ctttccctcc tatagttaaa 3240
aagaaaaaaa atgaatctat ttttctcttt ggcttcaaaa gcattctgac atttggagga 3300
gtcagtaacc aatcccacca accactccag caacctgaca agactatgag tagttctcct 3360
tcatcctatt tatgtggtac aggttgtgaa gtatctctat ataaagggaa attttagagg 3420
ggttaggatt tggacagggg tttagaacat tcctctaagc tatctagtct gtggagtttg 3480
tggcaattaa ttgccataaa ataacaatgt ttccaaatgc aactaagaaa atactcatag 3540
tgagtacgct ctatgcatag tatgacttct attttaatgt gaagaatttt ttgtctctct 3600
cctgatctta ctaaatccat atttcataaa taactgagaa taattaaaac aaaattaagc 3660
aaatgcacaa gcaaaaagat gcttgataca caaaaggaac tctggagaga aaactacagc 3720
ttcagtctgt acagatcaaa gaagacagaa catgtcaggg gaaggaggga aagatcttga 3780
tgcagggttt cttaacctgc agtctatgca caacactata tttccatgta atgtttttat 3840
ttcagcccta tttgtattat tttgtgcatt taaaaaacac aatcttaagg ggatagacta 3900
gactgccaca gcagcccatg gcacaactaa cacctactga tattcacatt aaatagtatg 3960
gtttccaaaa tatgtctgca caacaagacc tctttatgta attcaggctt gtgtctacct 4020
cttccatgaa aaatggaaag ggatgaaaat aatgggagta taatacccat ttaatgtgaa 4080
aaacataaga gtcttaaaag aaattaagcc atttaacatt ttttaaatag gtaagatacc 4140
attatattta tatgagctat gtactgccac aaaaaaagat gaaatgtaat ttctaaatac 4200
tccaggtgtg tggtattatg gaaagcaaat tgccaactaa tggcacgtcc tttctttctt 4260
tgattttctc ctctcatact tcagttttat agtgttgtgt tgttgttttt ttcatatcct 4320
accttacttt ccaattctgt ctcaattgaa ctccctctgt ctactcactc tttcattcat 4380
agcttctttt ccattaaact cataccttta attaaccaat tcatggccca gttctacagt 4440
tgaattggac aaggctaaaa ttctgtagtg tgctaaaatg ctcaagttgg cacataaacc 4500
cattccaaga ttttatagtt cttgtagata acacagggat gtagataagt tgaaacaaaa 4560
ccagtgtcct ctaagtctct atcatatact tattcctaaa ctgataattc ttacttctgg 4620
atttaaaatc aaaaataaca cacttgtaca gatacaatct aagggcttta tcacacacgt 4680
gttaacgaat gtatctcagc ttggttcttc ttgtgtgctc attatggatc tctctgtctt 4740
aggaattgcc tcaggcattt ttttttttta cacattaact aaagggctat tcgaaatctt 4800
gactcagggg ttcttaacct acatttcatg caaaaaatat atatatttca atgtattttt 4860
tattttagtc ctatttgtat tattttatgc atttaaaaac acagtcctga gagggatgga 4920
ccagactgcc acagcagctc atagcacaaa aaaaggttaa gaagtcctag ttgactttgt 4980
atatatataa agaaatctat tacaataaaa atataacata atctattcat ctatttatat 5040
gcaaacataa aaatgtaaat attgaaacaa gattgcttca atatgcttat tgttttcaaa 5100
ccaacaaact ctcttaaggt tcaatatgta ataaaaaaca taacacaaat aattattcta 5160
tatgaatatt atggttcata aattataatg tataatctat acattataat gtaatatata 5220
aactaaaatt tatggcacaa aagataaata tggctttgaa attaaagata ttccactcaa 5280
cagacaatat ttcatatttg atattacaat catttatttt atgtcctatt ataataaaag 5340
gtgaggactc cttgtaaaaa aggaaatgtt ccacagagtc aatctaatat atcagatatt 5400
ggagattcta tcttggtttc tcttccttta cttagcctat aaaactagtt aaaaatggaa 5460
tttcttttag caattcagtt tagtacagga gtgacattaa ctaatgacaa taaattaaac 5520
aaagcctaca ttagttcaat ttaagcctat tcaacagaaa tatagaaata tagtagctaa 5580
aaaaatactc tggggaaggt accacaaaca ttatctacca gggaacatag cataaattag 5640
tctgaaattt cctgagagtg actttgtctt agaacttagg tggtagtcat gaagagataa 5700
tgtttttagg cagttaaaat acttctagaa ctccatctat tttacctgtg gtccactttc 5760
ctacattgaa ccaatgcctt gggcttctct aattactata cattgtgctc atatgaataa 5820
aagaaatttt aaaagaaaaa aaa 5843
<210> 23
<211> 1217
<212> DNA
<213> Homo sapiens
<400> 23
agggggcggg gaggggcgca gggctgcgcg ctcgccggcg ctctctttcg gtttggtcgg 60
cggctggagg agagtggacc cccccacttt aaggctctgt cctcggcgcg ttcccgccgc 120
cccccggtcc cgacgcgggg ctcggggatg cccgccagca tgttcagcat cgacaacatc 180
ctagccgccc ggccgcgctg caaggactcg gtgttgccgg tggcgcacag cgcggcggct 240
cccgtcgtct tcccggccct gcacggggac tcgctctacg gcgccagcgg cggcgcctcc 300
tcggactatg gcgccttcta cccgcgcccc gtggcccccg gcggcgcggg cctcccggcc 360
gcggtcagcg gctcccgcct cggctacaac aactacttct acgggcagct gcacgtgcag 420
gcggcgcccg tgggcccggc ctgctgcggg gccgtgccgc cgctgggcgc ccagcagtgc 480
tcctgcgtcc cgacgccccc aggctacgag ggccccggtt cggtgctggt gtccccggta 540
ccgcaccaga tgctgcccta catgaacgtg ggcacgctgt cgcgcaccga gctgcagctt 600
ctcaaccagc tgcactgtcg gcggaagcgg cggcaccgca ccatcttcac tgacgagcag 660
ctcgaagctc tcgagaacct cttccaggag accaagtacc cggacgtggg cacgcgcgag 720
cagctggccc ggaaagtgca cctccgcgag gagaaagtgg aggtctggtt taagaaccgc 780
cgcgccaaat ggaggcggca gaagcggtcc tcatcagagg agtcggagaa cgcggagaag 840
tggaacaaga cgtcgtcgtc gaaggcgtca ccggagaaga gggaagagga aggtaaaagc 900
gatttggact cggacagctg acggccgcgg gacacttgcc cgtattactt acctaactcg 960
aaggacttgc acagacagac gatgctactt tcttgcacac gcgctgcctt gcgggagggg 1020
gtcgagaaag aggaacgagg agctgtaaat agtgtacaga gccgggaggg tcggcgtctg 1080
gggtcagggc gcgcacagcc cagcagcccg aggccgcccg cgactagccc ccaccgtagt 1140
atttatagtt aaattaaggg tgacagtaca ataaagtgat ggcgatgtaa aaaaaaaaaa 1200
aaaaaaaaaa aaaaaaa 1217
<210> 24
<211> 430
<212> DNA
<213> Homo sapiens
<400> 24
gactgtcact cggtcccaga caccagagca agctcaagac ccagcagtgg gacagccaga 60
cagacggcac gatggcactg agctcccaga tctgggccgc ttgcctcctg ctcctcctcc 120
tcctcgccag cctgaccagt ggctctgttt tcccacaaca gacgggacaa cttgcagagc 180
tgcaacccca ggacagagct ggagccaggg ccagctggat gcccatgttc cagaggcgaa 240
ggaggcgaga cacccacttc cccatctgca ttttctgctg cggctgctgt catcgatcaa 300
agtgtgggat gtgctgcaag acgtagaacc tacctgccct gcccccgtcc cctcccttcc 360
ttatttattc ctgctgcccc agaacatagg tcttggaata aaatggctgg ttcttttgtt 420
ttccaaaaaa 430
<210> 25
<211> 2319
<212> DNA
<213> Homo sapiens
<400> 25
ttccccactc ccccgccctc cccagggccc tgggaagggg ctcagcgtgg gaaaggatgg 60
ttgagtttta accagaggca aagcgtgagc gggatcagtg tgtgcggaac gcaagcagcc 120
gagagcggag aggcgccgct gtagttaact cctccctgcc cgccgcgccg accctcccca 180
ggaaccccca gggagccagc atgaagcgag ctcaccccga gtacagctcc tcggacagcg 240
agctggacga gaccatcgag gtggagaagg agagtgcgga cgagaatgga aacttgagtt 300
cggctctagg ttccatgtcc ccaactacat cttcccagat tttggccaga aaaagacgga 360
gaggaataat tgagaagcgc cgacgagacc ggatcaataa cagtttgtct gagctgagaa 420
ggctggtacc cagtgctttt gagaagcagg gatctgctaa gctagaaaaa gccgagatcc 480
tgcagatgac cgtggatcac ctgaaaatgc tgcatacggc aggagggaaa ggttactttg 540
acgcgcacgc ccttgctatg gactatcgga gtttgggatt tcgggaatgc ctggcagaag 600
ttgcgcgtta tctgagcatc attgaaggac tagatgcctc tgacccgctt cgagttcgac 660
tggtttcgca tctcaacaac tacgcttccc agcgggaagc cgcgagcggc gcccacgcgg 720
gcctcggaca cattccctgg gggaccgtct tcggacatca cccgcacatc gcgcacccgc 780
tgttgctgcc ccagaacggc cacgggaacg cgggcaccac ggcctcaccc acggaaccgc 840
accaccaggg caggctgggc tcggcacatc cggaggcgcc tgctttgcga gcgcccccta 900
gcggcagcct cggaccggtg ctccctgtgg tcacctccgc ctccaaactg tcgccgcctc 960
tgctctcctc agtggcctcc ctgtcggcct tccccttctc tttcggctcc ttccacttac 1020
tgtctcccaa tgcactgagc ccttcagcac ccacgcaggc tgcaaacctt ggcaagccct 1080
atagaccttg ggggacggag atcggagctt tttaaagaac tgatgtagaa tgagggaggg 1140
gaaagtttaa aatcccagct gggctggact gttgccaaca tcaccttaaa gtcgtcagta 1200
aaagtaaaaa ggaaaaaggt acactttcag ataatttttt ttttaaagac taaaggtttg 1260
ttggtttact tttatctttt ttaatgtttt tttcatcatg tcatgtatta gcagttttta 1320
aaaactagtt gttaaatttt gttcaagaca ttaaattgaa atagtgagta taagccaaca 1380
ctttgtgata ggtttgtact gtgcctaatt tactttgtaa accagaatga ttccgttttt 1440
gcctcaaaat ttggggaatc ttaacattta gtatttttgg tctgtttttc tccttgtata 1500
gttatggtct gtttttagaa ttaattttcc aaaccactat gcttaatgtt aacatgattc 1560
tgtttgttaa tattttgaca gattaaggtg ttgtataaat aatattcttt tggggggagg 1620
ggaactatat tgaattttat atttctgagc aaagcgttga caaatcagat gatcagcttt 1680
atccaagaaa gaagactagt aaattgtctg cctcctatag cagaaaggtg aatgtacaaa 1740
ctgttggtgg ccctgaatcc atctgaccag ctgctggtat ctgccaggac tggcagttct 1800
gatttagtta ggagagagcc gctgataggt taggtctcat ttggagtgtt ggtggaaagg 1860
aaactgaagg taattgaata gaatacgcct gcatttacca gccccagcaa cacaaagaat 1920
ttttaatcac acggatctca aattcacaaa tgttaacatg gataagtgat catggtgtgc 1980
gagtggtcaa ttgagtagta cagtggaaac tgttaaatgc ataacctaat tttcctggga 2040
ctgccatatt ttcttttaac tggaaatttt tatgtgagtt ttccttttgg tgcatggaac 2100
tgtggttgcc aaggtattta aaagggcttt cctgcctcct tctctttgat ttatttaatt 2160
tgatttgggc tataaaatat catttttcag gtttattctt ttagcaggtg tagttaaacg 2220
acctccactg aactgggttt gacctctgtt gtactgatgt gttgtgacta aataaaaaag 2280
aaagaacaaa gtaaaaaaaa aaaaaaaaaa aaaaaaaaa 2319
<210> 26
<211> 4150
<212> DNA
<213> Homo sapiens
<400> 26
cttgaatctt ggggcaggaa ctcagaaaac ttccagcccg ggcagcgcgc gcttggtgca 60
agactcagga gctagcagcc cgtccccctc cgactctccg gtgccgccgc tgcctgctcc 120
cgccacccta ggaggcgcgg tgccacccac tactctgtcc tctgcctgtg ctccgtgccc 180
gaccctatcc cggcggagtc tccccatcct cctttgcttt ccgactgccc aaggcacttt 240
caatctcaat ctcttctctc tctctctctc tctctctctc tctctctctc tctctctctc 300
tctctctctc gcagggtggg gggaagagga ggaggaattc tttccccgcc taacatttca 360
agggacacaa ttcactccaa gtctcttccc tttccaagcc gcttccgaag tgctcccggt 420
gcccgcaact cctgatccca acccgcgaga ggagcctctg cgacctcaaa gcctctcttc 480
cttctccctc gcttccctcc tcctcttgct acctccacct ccaccgccac ctccacctcc 540
ggcacccacc caccgccgcc gccgccaccg gcagcgcctc ctcctctcct cctcctcctc 600
ccctcttctc tttttggcag ccgctggacg tccggtgttg atggtggcag cggcggcagc 660
ctaagcaaca gcagccctcg cagcccgcca gctcgcgctc gccccgccgg cgtccccagc 720
cctatcacct catctcccga aaggtgctgg gcagctccgg ggcggtcgag gcgaagcggc 780
tgcagcggcg gtagcggcgg cgggaggcag gatgagcgca cgcggtgagg gcgcggggca 840
gccgtccact tcagcccagg gacaacctgc cgccccagcg cctcagaaga gaggacgcgg 900
ccgccccagg aagcagcagc aagaaccaac cggtgagccc tctcctaaga gacccagggg 960
aagacccaaa ggcagcaaaa acaagagtcc ctctaaagca gctcaaaaga aagcagaagc 1020
cactggagaa aaacggccaa gaggcagacc taggaaatgg ccacaacaag ttgttcagaa 1080
gaagcctgct caggaggaaa ctgaagagac atcctcacaa gagtctgccg aagaggacta 1140
gggggcgcca acgttcgatt tctacctcag cagcagttgg atcttttgaa gggagaagac 1200
actgcagtga ccacttattc tgtattgcca tggtctttcc actttcatct ggggtggggt 1260
ggggtggggt gggggagggg ggggtggggt ggggagaaat cacataacct taaaaaggac 1320
tatattaatc accttctttg taatcccttc acagtcccag gtttagtgaa aaactgctgt 1380
aaacacaggg gacacagctt aacaatgcaa cttttaatta ctgttttctt ttttcttaac 1440
ctactaatag tttgttgatc tgataagcaa gagtgggcgg gtgagaaaaa ccgaattggg 1500
tttagtcaat cactgcactg catgcaaaca agaaacgtgt cacacttgtg acgtcgggca 1560
ttcatatagg aagaacgcgg tgtgtaacac tgtgtacacc tcaaatacca ccccaaccca 1620
ctccctgtag tgaatcctct gtttagaaca ccaaagataa ggactagata ctactttctc 1680
tttttcgtat aatcttgtag acacttactt gatgattttt aactttttat ttctaaatga 1740
gacgaaatgc tgatgtatcc tttcattcag ctaacaaact agaaaaggtt atgttcattt 1800
ttcaaaaagg gaagtaagca aacaaatatt gccaactctt ctatttatgg atatcacaca 1860
tatcagcagg agtaataaat ttactcacag cacttgtttt caggacaaca cttcattttc 1920
aggaaatcta cttcctacag agccaaaatg ccatttagca ataaataaca cttgtcagcc 1980
tcagagcatt taaggaaact agacaagtaa aattatcctc tttgtaattt aatgaaaagg 2040
tacaacagaa taatgcatga tgaactcacc taattatgag gtgggaggag cgaaatctaa 2100
atttcttttg ctatagttat acatcaattt aaaaagcaaa aaaaaaaaag gggggggcaa 2160
tctctctctg tgtctttctc tctctctctt cctctccctc tctcttttca ttgtgtatca 2220
gtttccatga aagacctgaa taccacttac ctcaaattaa gcatatgtgt tacttcaagt 2280
aatacgtttt gacataagat ggttgaccaa ggtgcttttc ttcggcttga gttcaccatc 2340
tcttcattca aactgcactt ttagccagag atgcaatata tccccactac tcaatactac 2400
ctctgaatgt tacaacgaat ttacagtcta gtacttatta catgctgcta tacacaagca 2460
atgcaagaaa aaaacttact gggtaggtga ttctaatcat ctgcagttct ttttgtacac 2520
ttaattacag ttaaagaagc aatctcctta ctgtgtttca gcatgactat gtatttttct 2580
atgttttttt aattaaaaat ttttaaaata cttgtttcag cttctctgct agatttctac 2640
attaacttga aaatttttta accaagtcgc tcctaggttc ttaaggataa ttttcctcaa 2700
tcacactaca catcacacaa gatttgactg taatatttaa atattaccct ccaagtctgt 2760
acctcaaatg aattctttaa ggagatggac taattgactt gcaaagacct acctccagac 2820
ttcaaaagga atgaacttgt tacttgcagc attcatttgt tttttcaatg tttgaaatag 2880
ttcaaactgc agctaaccct agtcaaaact atttttgtaa aagacatttg atagaaagga 2940
acacgttttt acatactttt gcaaaataag taaataataa ataaaataaa agccaacctt 3000
caaagaaact tgaagctttg taggtgagat gcaacaagcc ctgcttttgc ataatgcaat 3060
caaaaatatg tgtttttaag attagttgaa tataagaaaa tgcttgacaa atattttcat 3120
gtattttaca caaatgtgat ttttgtaata tgtctcaacc agatttattt taaacgcttc 3180
ttatgtagag tttttatgcc tttctctcct agtgagtgtg ctgacttttt aacatggtat 3240
tatcaactgg gccaggaggt agtttctcat gacggctttt gtcagtatgg cttttagtac 3300
tgaagccaaa tgaaactcaa aaccatctct cttccagctg cttcagggag gtagtttcaa 3360
aggccacata cctctctgag actggcagat cgctcactgt tgtgaatcac caaaggagct 3420
atggagagaa ttaaaactca acattactgt taactgtgcg ttaaataagc aaataaacag 3480
tggctcataa aaataaaagt cgcattccat atctttggat gggcctttta gaaacctcat 3540
tggccagctc ataaaatgga agcaattgct catgttggcc aaacatggtg caccgagtga 3600
tttccatctc tggtaaagtt acacttttat ttcctgtatg ttgtacaatc aaaacacact 3660
actacctctt aagtcccagt atacctcatt tttcatactg aaaaaaaaag cttgtggcca 3720
atggaacagt aagaacatca taaaattttt atatatatag tttatttttg tgggagataa 3780
attttatagg actgttcttt gctgttgttg gtcgcagcta cataagactg gacatttaac 3840
ttttctacca tttctgcaag ttaggtatgt ttgcaggaga aaagtatcaa gacgtttaac 3900
tgcagttgac tttctccctg ttcctttgag tgtcttctaa ctttattctt tgttctttat 3960
gtagaattgc tgtctatgat tgtactttga atcgcttgct tgttgaaaat atttctctag 4020
tgtattatca ctgtctgttc tgcacaataa acataacagc ctctgtgatc cccatgtgtt 4080
ttgattcctg ctctttgtta cagttccatt aaatgagtaa taaagtttgg tcaaaacaga 4140
aaaaaaaaaa 4150
<210> 27
<211> 1595
<212> DNA
<213> Homo sapiens
<400> 27
gagtgagtga gagggcagag gaaatactca atctgtgcca ctcactgcct tgagcctgct 60
tcctcactcc aggactgcca gaggaagcaa tcaccaaaat gaagactgct ttaattttgc 120
tcagcatttt gggaatggcc tgtgctttct caatgaaaaa tttgcatcga agagtcaaaa 180
tagaggattc tgaagaaaat ggggtcttta agtacaggcc acgatattat ctttacaagc 240
atgcctactt ttatcctcat ttaaaacgat ttccagttca gggcagtagt gactcatccg 300
aagaaaatgg agatgacagt tcagaagagg aggaggaaga agaggagact tcaaatgaag 360
gagaaaacaa tgaagaatcg aatgaagatg aagactctga ggctgagaat accacacttt 420
ctgctacaac actgggctat ggagaggacg ccacgcctgg cacagggtat acagggttag 480
ctgcaatcca gcttcccaag aaggctgggg atataacaaa taaagctaca aaagagaagg 540
aaagtgatga agaagaagag gaggaagagg aaggaaatga aaacgaagaa agcgaagcag 600
aagtggatga aaacgaacaa ggcataaacg gcaccagtac caacagcaca gaggcagaaa 660
acggcaacgg cagcagcgga ggagacaatg gagaagaagg ggaagaagaa agtgtcactg 720
gagccaatgc agaagacacc acagagaccg gaaggcaggg caagggcacc tcgaagacaa 780
caacctctcc aaatggtggg tttgaaccta caaccccacc acaagtctat agaaccactt 840
ccccaccttt tgggaaaacc accaccgttg aatacgaggg ggagtacgaa tacacgggcg 900
ccaatgaata cgacaatgga tatgaaatct atgaaagtga gaacggggaa cctcgtgggg 960
acaattaccg agcctatgaa gatgagtaca gctactttaa aggacaaggc tacgatggct 1020
atgatggtca gaattactac caccaccagt gaagctccag cctgggatga attcatccat 1080
tctggctttg catccggcta ccattttcga agttcaactc aggaaggtgc aatataacaa 1140
atgtgcatat tataatgagg aatggtacta ccgttccaga ttttctgtaa ttgcttctgc 1200
aaagtaatag gcttcttgtc cctttttttt ctggcatgtt atggaatgat cattgtaaat 1260
caggaccatt tatcaagcag tacaccaact cataagatca aatttcattg aatggtttga 1320
ggttgtagct ctataaatag tagtttttaa catgcctgta gtattgctaa ctgcaaaaac 1380
atactctttg tacaagaagt gcttctaaga atttcattga cattaatgac actgtataca 1440
ataaatgtgt agtttcttaa tcgcactacc tatgcaacac tgtgtattag gtttatcatc 1500
ctcatgtatt tttatgtgac ctgtatgtat attctaatct acgagtttta tcacaaataa 1560
aaatgcaatc cttcaaatgt gttataatta aaaaa 1595
<210> 28
<211> 1000
<212> DNA
<213> Homo sapiens
<400> 28
actctcattc cacgttctta actgttccat tttccgtatc tgcttcgggc ttccacctca 60
tttttttcgc tttgcccatt ctgtttcagc cagtcgccaa gaatcatgaa agtcgccagt 120
ggcagcaccg ccaccgccgc cgcgggcccc agctgcgcgc tgaaggccgg caagacagcg 180
agcggtgcgg gcgaggtggt gcgctgtctg tctgagcaga gcgtggccat ctcgcgctgc 240
gccgggggcg ccggggcgcg cctgcctgcc ctgctggacg agcagcaggt aaacgtgctg 300
ctctacgaca tgaacggctg ttactcacgc ctcaaggagc tggtgcccac cctgccccag 360
aaccgcaagg tgagcaaggt ggagattctc cagcacgtca tcgactacat cagggacctt 420
cagttggagc tgaactcgga atccgaagtt ggaacccccg ggggccgagg gctgccggtc 480
cgggctccgc tcagcaccct caacggcgag atcagcgccc tgacggccga ggcggcatgc 540
gttcctgcgg acgatcgcat cttgtgtcgc tgaagcgcct cccccaggga ccggcggacc 600
ccagccatcc agggggcaag aggaattacg tgctctgtgg gtctccccca acgcgcctcg 660
ccggatctga gggagaacaa gaccgatcgg cggccactgc gcccttaact gcatccagcc 720
tggggctgag gctgaggcac tggcgaggag agggcgctcc tctctgcaca cctactagtc 780
accagagact ttagggggtg ggattccact cgtgtgtttc tattttttga aaagcagaca 840
ttttaaaaaa tggtcacgtt tggtgcttct cagatttctg aggaaattgc tttgtattgt 900
atattacaat gatcaccgac tgaaaatatt gttttacaat agttctgtgg ggctgttttt 960
ttgttattaa acaaataatt tagatggtgg taaaaaaaaa 1000
<210> 29
<211> 1402
<212> DNA
<213> Homo sapiens
<400> 29
ggggacgaag ggaagctcca gcgtgtggcc ccggcgagtg cggataaaag ccgccccgcc 60
gggctcgggc ttcattctga gccgagcccg gtgccaagcg cagctagctc agcaggcggc 120
agcggcggcc tgagcttcag ggcagccagc tccctcccgg tctcgccttc cctcgcggtc 180
agcatgaaag ccttcagtcc cgtgaggtcc gttaggaaaa acagcctgtc ggaccacagc 240
ctgggcatct cccggagcaa aacccctgtg gacgacccga tgagcctgct atacaacatg 300
aacgactgct actccaagct caaggagctg gtgcccagca tcccccagaa caagaaggtg 360
agcaagatgg aaatcctgca gcacgtcatc gactacatct tggacctgca gatcgccctg 420
gactcgcatc ccactattgt cagcctgcat caccagagac ccgggcagaa ccaggcgtcc 480
aggacgccgc tgaccaccct caacacggat atcagcatcc tgtccttgca ggcttctgaa 540
ttcccttctg agttaatgtc aaatgacagc aaagcactgt gtggctgaat aagcggtgtt 600
catgatttct tttattcttt gcacaacaac aacaacaaca aattcacgga atcttttaag 660
tgctgaactt atttttcaac catttcacaa ggaggacaag ttgaatggac ctttttaaaa 720
agaaaaaaaa aatggaagga aaactaagaa tgatcatctt cccagggtgt tctcttactt 780
ggactgtgat attcgttatt tatgaaaaag acttttaaat gccctttctg cagttggaag 840
gttttcttta tatactattc ccaccatggg gagcgaaaac gttaaaatca caaggaattg 900
cccaatctaa gcagactttg ccttttttca aaggtggagc gtgaatacca gaaggatcca 960
gtattcagtc acttaaatga agtcttttgg tcagaaatta cctttttgac acaagcctac 1020
tgaatgctgt gtatatattt atatataaat atatctattt gagtgaaacc ttgtgaactc 1080
tttaattaga gttttcttgt atagtggcag agatgtctat ttctgcattc aaaagtgtaa 1140
tgatgtactt attcatgcta aactttttat aaaagtttag ttgtaaactt aaccctttta 1200
tacaaaataa atcaagtgtg tttattgaat ggtgattgcc tgctttattt cagaggacca 1260
gtgctttgat ttttattatg ctatgttata actgaaccca aataaataca agttcaaatt 1320
tatgtagact gtataagatt ataataaaac atgtctgaag tcaaaaaaaa aaaaaaaaaa 1380
aaaaaaaaaa aaaaaaaaaa aa 1402
<210> 30
<211> 1252
<212> DNA
<213> Homo sapiens
<400> 30
gatctggggt gctgccagga aaaagcaaat tctggaagtt aatggttttg agtgattttt 60
aaatccttgc tggcggagag gcccgcctct ccccggtatc agcgcttcct cattctttga 120
atccgcggct ccgcggtctt cggcgtcaga ccagccggag gaagcctgtt tgcaatttaa 180
gcgggctgtg aacgcccagg gccggcgggg gcagggccga ggcgggccat tttgaataaa 240
gaggcgtgcc ttccaggcag gctctataag tgaccgccgc ggcgagcgtg cgcgcgttgc 300
aggtcactgt agcgggactt cttttggttt tctttctctt tggggcacct ctggactcac 360
tccccagcat gaaggcgctg agcccggtgc gcggctgcta cgaggcggtg tgctgcctgt 420
cggaacgcag tctggccatc gcccggggcc gagggaaggg cccggcagct gaggagccgc 480
tgagcttgct ggacgacatg aaccactgct actcccgcct gcgggaactg gtacccggag 540
tcccgagagg cactcagctt agccaggtgg aaatcctaca gcgcgtcatc gactacattc 600
tcgacctgca ggtagtcctg gccgagccag cccctggacc ccctgatggc ccccaccttc 660
ccatccagac agccgagctc actccggaac ttgtcatctc caacgacaaa aggagctttt 720
gccactgact cggccgtgtc ctgacacctc cagaacgcag gtgctggcgc ccgttctgcc 780
tgggaccccg ggaacctctc ctgccggaag ccggacggca gggatgggcc ccaacttcgc 840
cctgcccact tgacttcacc aaatcccttc ctggagacta aacctggtgc tcaggagcga 900
aggactgtga acttgtggcc tgaagagcca gagctagctc tggccaccag ctgggcgacg 960
tcaccctgct cccaccccac ccccaagttc taaggtctct tcagagcgtg gaggtgtgga 1020
aggagtggct gctctccaaa ctatgccaag gcggcggcag agctggtctt ctggtctcct 1080
tggagaaagg ttctgttgcc ctgatttatg aactctataa tagagtatat aggttttgta 1140
ccttttttac aggaaggtga ctttctgtaa caatgcgatg tatattaaac tttttataaa 1200
agttaacatt ttgcataata aacgattttt aaacacttga aaaaaaaaaa aa 1252
<210> 31
<211> 2381
<212> DNA
<213> Homo sapiens
<400> 31
actgccgcgg ccctgctgct cagggcacat gcctcccctc cccaggccgc ggcccagctg 60
accctcgggg ctcccccggc agcggacagg gaagggttaa aggcccccgg ctccctgccc 120
cctgccctgg ggaacccctg gccctgtggg gacatgaact gtgtttgccg cctggtcctg 180
gtcgtgctga gcctgtggcc agatacagct gtcgcccctg ggccaccacc tggcccccct 240
cgagtttccc cagaccctcg ggccgagctg gacagcaccg tgctcctgac ccgctctctc 300
ctggcggaca cgcggcagct ggctgcacag ctgagggaca aattcccagc tgacggggac 360
cacaacctgg attccctgcc caccctggcc atgagtgcgg gggcactggg agctctacag 420
ctcccaggtg tgctgacaag gctgcgagcg gacctactgt cctacctgcg gcacgtgcag 480
tggctgcgcc gggcaggtgg ctcttccctg aagaccctgg agcccgagct gggcaccctg 540
caggcccgac tggaccggct gctgcgccgg ctgcagctcc tgatgtcccg cctggccctg 600
ccccagccac ccccggaccc gccggcgccc ccgctggcgc ccccctcctc agcctggggg 660
ggcatcaggg ccgcccacgc catcctgggg gggctgcacc tgacacttga ctgggccgtg 720
aggggactgc tgctgctgaa gactcggctg tgacccgggg cccaaagcca ccaccgtcct 780
tccaaagcca gatcttattt atttatttat ttcagtactg ggggcgaaac agccaggtga 840
tccccccgcc attatctccc cctagttaga gacagtcctt ccgtgaggcc tggggggcat 900
ctgtgcctta tttatactta tttatttcag gagcaggggt gggaggcagg tggactcctg 960
ggtccccgag gaggagggga ctggggtccc ggattcttgg gtctccaaga agtctgtcca 1020
cagacttctg ccctggctct tccccatcta ggcctgggca ggaacatata ttatttattt 1080
aagcaattac ttttcatgtt ggggtgggga cggaggggaa agggaagcct gggtttttgt 1140
acaaaaatgt gagaaacctt tgtgagacag agaacaggga attaaatgtg tcatacatat 1200
ccacttgagg gcgatttgtc tgagagctgg ggctggatgc ttgggtaact ggggcagggc 1260
aggtggaggg gagacctcca ttcaggtgga ggtcccgagt gggcggggca gcgactggga 1320
gatgggtcgg tcacccagac agctctgtgg aggcagggtc tgagccttgc ctggggcccc 1380
gcactgcata gggccttttg tttgtttttt gagatggagt ctcgctctgt tgcctaggct 1440
ggagtgcagt gaggcaatct gaggtcactg caacctccac ctcccgggtt caagcaattc 1500
tcctgcctca gcctcccgat tagctgggat cacaggtgtg caccaccatg cccagctaat 1560
tatttatttc ttttgtattt ttagtagaga cagggtttca ccatgttggc caggctggtt 1620
tcgaactcct gacctcaggt gatcctcctg cctcggcctc ccaaagtgct gggattacag 1680
gtgtgagcca ccacacctga cccataggtc ttcaataaat atttaatgga aggttccaca 1740
agtcaccctg tgatcaacag tacccgtatg ggacaaagct gcaaggtcaa gatggttcat 1800
tatggctgtg ttcaccatag caaactggaa acaatctaga tatccaacag tgagggttaa 1860
gcaacatggt gcatctgtgg atagaacgcc acccagccgc ccggagcagg gactgtcatt 1920
cagggaggct aaggagagag gcttgcttgg gatatagaaa gatatcctga cattggccag 1980
gcatggtggc tcacgcctgt aatcctggca ctttgggagg acgaagcgag tggatcactg 2040
aagtccaaga gttcgagacc ggcctgcgag acatggcaaa accctgtctc aaaaaagaaa 2100
gaatgatgtc ctgacatgaa acagcaggct acaaaaccac tgcatgctgt gatcccaatt 2160
ttgtgttttt ctttctatat atggattaaa acaaaaatcc taaagggaaa tacgccaaaa 2220
tgttgacaat gactgtctcc aggtcaaagg agagaggtgg gattgtgggt gacttttaat 2280
gtgtatgatt gtctgtattt tacagaattt ctgccatgac tgtgtatttt gcatgacaca 2340
ttttaaaaat aataaacact atttttagaa taacagaaaa a 2381
<210> 32
<211> 1201
<212> DNA
<213> Homo sapiens
<400> 32
aatattagag tctcaacccc caataaatat aggactggag atgtctgagg ctcattctgc 60
cctcgagccc accgggaacg aaagagaagc tctatctccc ctccaggagc ccagctatga 120
actccttctc cacaagcgcc ttcggtccag ttgccttctc cctggggctg ctcctggtgt 180
tgcctgctgc cttccctgcc ccagtacccc caggagaaga ttccaaagat gtagccgccc 240
cacacagaca gccactcacc tcttcagaac gaattgacaa acaaattcgg tacatcctcg 300
acggcatctc agccctgaga aaggagacat gtaacaagag taacatgtgt gaaagcagca 360
aagaggcact ggcagaaaac aacctgaacc ttccaaagat ggctgaaaaa gatggatgct 420
tccaatctgg attcaatgag gagacttgcc tggtgaaaat catcactggt cttttggagt 480
ttgaggtata cctagagtac ctccagaaca gatttgagag tagtgaggaa caagccagag 540
ctgtgcagat gagtacaaaa gtcctgatcc agttcctgca gaaaaaggca aagaatctag 600
atgcaataac cacccctgac ccaaccacaa atgccagcct gctgacgaag ctgcaggcac 660
agaaccagtg gctgcaggac atgacaactc atctcattct gcgcagcttt aaggagttcc 720
tgcagtccag cctgagggct cttcggcaaa tgtagcatgg gcacctcaga ttgttgttgt 780
taatgggcat tccttcttct ggtcagaaac ctgtccactg ggcacagaac ttatgttgtt 840
ctctatggag aactaaaagt atgagcgtta ggacactatt ttaattattt ttaatttatt 900
aatatttaaa tatgtgaagc tgagttaatt tatgtaagtc atatttatat ttttaagaag 960
taccacttga aacattttat gtattagttt tgaaataata atggaaagtg gctatgcagt 1020
ttgaatatcc tttgtttcag agccagatca tttcttggaa agtgtaggct tacctcaaat 1080
aaatggctaa cttatacata tttttaaaga aatatttata ttgtatttat ataatgtata 1140
aatggttttt ataccaataa atggcatttt aaaaaattca gcaaaaaaaa aaaaaaaaaa 1200
a 1201
<210> 33
<211> 5294
<212> DNA
<213> Homo sapiens
<400> 33
ctagggcatg gcatcccacg tgggtgtcag cacggccgca gaagaaccac ttctctggcc 60
cacccatgcc tgctaggcca tgcttcttca gaagtggcca caactctcct gacgtctcca 120
gagccggtca ttccacccag ggggacttca gctgccactg gacacttcaa ttgtacgctg 180
cgaccagttg ccaggaagga gagggctggc aagagagccg cggcagccgt ggcagggtgt 240
aggggacggt ggacggccag ggcccccccc tctctctctt tctctctctc tctcttgctt 300
ggtttctgta atgaggaagt tctccgcagc tcagtttcct ttccctcact gagcgcctga 360
aacaggaagt cagtcagtta agctggtggc agcagccgag gccaccaaga ggcaacgggc 420
ggcaggttgc agtggagggg cctccgctcc cctcggtggt gtgtgggtcc tgggggtgcc 480
tgccggcccg gccgaggagg cccacgccca ccatggtccc ctgctggaac catggcaaca 540
tcacccgctc caaggcggag gagctgcttt ccaggacagg caaggacggg agcttcctcg 600
tgcgtgccag cgagtccatc tcccgggcat acgcgctctg cgtgctgtat cggaattgcg 660
tttacactta cagaattctg cccaatgaag atgataaatt cactgttcag gcatccgaag 720
gcgtctccat gaggttcttc accaagctgg accagctcat cgagttttac aagaaggaaa 780
acatggggct ggtgacccat ctgcaatacc ctgtgccgct ggaggaagag gacacaggcg 840
acgaccctga ggaggacaca gtagaaagtg tcgtgtctcc acccgagctg cccccaagaa 900
acatcccgct gactgccagc tcctgtgagg ccaaggaggt tcctttttca aacgagaatc 960
cccgagcgac cgagaccagc cggccgagcc tctccgagac attgttccag cgactgcaaa 1020
gcatggacac cagtgggctt ccagaagagc atcttaaggc catccaagat tatttaagca 1080
ctcagctcgc ccaggactct gaatttgtga agacagggtc cagcagtctt cctcacctga 1140
agaaactgac cacactgctc tgcaaggagc tctatggaga agtcatccgg accctcccat 1200
ccctggagtc tctgcagagg ttatttgacc agcagctctc cccgggcctc cgtccacgtc 1260
ctcaggttcc tggtgaggcc aatcccatca acatggtgtc caagctcagc caactgacaa 1320
gcctgttgtc gtccattgaa gacaaggtca aggccttgct gcacgagggt cctgagtctc 1380
cgcaccggcc ctcccttatc cctccagtca cctttgaggt gaaggcagag tctctgggga 1440
ttcctcagaa aatgcagctc aaagtcgacg ttgagtctgg gaaactgatc attaagaagt 1500
ccaaggatgg ttctgaggac aagttctaca gccacaagaa aatcctgcag ctcattaagt 1560
cacagaaatt tctgaataag ttggtgatct tggtggaaac agagaaggag aagatcctgc 1620
ggaaggaata tgtttttgct gactccaaaa agagagaagg cttctgccag ctcctgcagc 1680
agatgaagaa caagcactca gagcagccgg agcccgacat gatcaccatc ttcatcggca 1740
cctggaacat gggtaacgcc ccccctccca agaagatcac gtcctggttt ctctccaagg 1800
ggcagggaaa gacgcgggac gactctgcgg actacatccc ccatgacatt tacgtgatcg 1860
gcacccaaga ggaccccctg agtgagaagg agtggctgga gatcctcaaa cactccctgc 1920
aagaaatcac cagtgtgact tttaaaacag tcgccatcca cacgctctgg aacatccgca 1980
tcgtggtgct ggccaagcct gagcacgaga accggatcag ccacatctgt actgacaacg 2040
tgaagacagg cattgcaaac acactgggga acaagggagc cgtgggggtg tcgttcatgt 2100
tcaatggaac ctccttaggg ttcgtcaaca gccacttgac ttcaggaagt gaaaagaaac 2160
tcaggcgaaa ccaaaactat atgaacattc tccggttcct ggccctgggc gacaagaagc 2220
tgagtccctt taacatcact caccgcttca cgcacctctt ctggtttggg gatcttaact 2280
accgtgtgga tctgcctacc tgggaggcag aaaccatcat ccagaaaatc aagcagcagc 2340
agtacgcaga cctcctgtcc cacgaccagc tgctcacaga gaggagggag cagaaggtct 2400
tcctacactt cgaggaggaa gaaatcacgt ttgccccaac ctaccgtttt gagagactga 2460
ctcgggacaa atacgcctac accaagcaga aagcgacagg gatgaagtac aacttgcctt 2520
cctggtgtga ccgagtcctc tggaagtctt atcccctggt gcacgtggtg tgtcagtctt 2580
atggcagtac cagcgacatc atgacgagtg accacagccc tgtctttgcc acatttgagg 2640
caggagtcac ttcccagttt gtctccaaga acggtcccgg gactgttgac agccaaggac 2700
agattgagtt tctcaggtgc tatgccacat tgaagaccaa gtcccagacc aaattctacc 2760
tggagttcca ctcgagctgc ttggagagtt ttgtcaagag tcaggaagga gaaaatgaag 2820
aaggaagtga gggggagctg gtggtgaagt ttggtgagac tcttccaaag ctgaagccca 2880
ttatctctga ccctgagtac ctgctagacc agcacatcct catcagcatc aagtcctctg 2940
acagcgacga atcctatggc gagggctgca ttgcccttcg gttagaggcc acagaaacgc 3000
agctgcccat ctacacgcct ctcacccacc atggggagtt gacaggccac ttccaggggg 3060
agatcaagct gcagacctct cagggcaaga cgagggagaa gctctatgac tttgtgaaga 3120
cggagcgtga tgaatccagt gggccaaaga ccctgaagag cctcaccagc cacgacccca 3180
tgaagcagtg ggaagtcact agcagggccc ctccgtgcag tggctccagc atcactgaaa 3240
tcatcaaccc caactacatg ggagtggggc cctttgggcc accaatgccc ctgcacgtga 3300
agcagacctt gtcccctgac cagcagccca cagcctggag ctacgaccag ccgcccaagg 3360
actccccgct ggggccctgc aggggagaaa gtcctccgac acctcccggc cagccgccca 3420
tatcacccaa gaagttttta ccctcaacag caaaccgggg tctccctccc aggacacagg 3480
agtcaaggcc cagtgacctg gggaagaacg caggggacac gctgcctcag gaggacctgc 3540
cgctgacgaa gcccgagatg tttgagaacc ccctgtatgg gtccctgagt tccttcccta 3600
agcctgctcc caggaaggac caggaatccc ccaaaatgcc gcggaaggaa cccccgccct 3660
gcccggaacc cggcatcttg tcgcccagca tcgtgctcac caaagcccag gaggctgatc 3720
gcggcgaggg gcccggcaag caggtgcccg cgccccggct gcgctccttc acgtgctcat 3780
cctctgccga gggcagggcg gccggcgggg acaagagcca agggaagccc aagaccccgg 3840
tcagctccca ggccccggtg ccggccaaga ggcccatcaa gccttccaga tcggaaatca 3900
accagcagac cccgcccacc ccgacgccgc ggccgccgct gccagtcaag agcccggcgg 3960
tgctgcacct ccagcactcc aagggccgcg actaccgcga caacaccgag ctcccgcatc 4020
acggcaagca ccggccggag gaggggccac cagggcctct aggcaggact gccatgcagt 4080
gaagccctca gtgagctgcc actgagtcgg gagcccagag gaacggcgtg aagccactgg 4140
accctctccc gggacctcct gctggctcct cctgcccagc ttcctatgca aggctttgtg 4200
ttttcaggaa agggcctagc ttctgtgtgg cccacagagt tcactgcctg tgagacttag 4260
caccaagtgc tgaggctgga agaaaaacgc acaccagacg ggcaacaaac agtctgggtc 4320
cccagctcgc tcttggtact tgggacccca gtgcctcgtt gagggcgcca ttctgaagaa 4380
aggaactgca gcgccgattt gagggtggag atatagataa taataatatt aataataata 4440
atggccacat ggatcgaaca ctcatgatgt gccaagtgct gtgctaagtg ctttacgaac 4500
attcgtcata tcaggatgac ctcgagagct gaggctctag ccacctaaaa ccacgtgccc 4560
aaacccacca gtttaaaacg gtgtgtgttc ggaggggtga aagcattaag aagcccagtg 4620
ccctcctgga gtgagacaag ggctcggcct taaggagctg aagagtctgg gtagcttgtt 4680
tagggtacaa gaagcctgtt ctgtccagct tcagtgacac aagctgcttt agctaaagtc 4740
ccgcgggttc cggcatggct aggctgagag cagggatcta cctggcttct cagttctttg 4800
gttggaagga gcaggaaatc agctcctatt ctccagtgga gagatctggc ctcagcttgg 4860
gctagagatg ccaaggcctg tgccaggttc cctgtgccct cctcgaggtg ggcagccatc 4920
accagccaca gttaagccaa gccccccaac atgtattcca tcgtgctggt agaagagtct 4980
ttgctgttgc tcccgaaagc cgtgctctcc agcctggctg ccagggaggg tgggcctctt 5040
ggttccaggc tcttgaaata gtgcagcctt ttcttcctat ctctgtggct ttcagctctg 5100
cttccttggt tattaggaga atagatgggt gatgtctttc cttatgttgc tttttcaaca 5160
tagcagaatt aatgtaggga gctaaatcca gtggtgtgtg tgaatgcaga agggaatgca 5220
ccccacattc ccatgatgga agtctgcgta accaataaat tgtgcctttc tcactcaaaa 5280
aaaaaaaaaa aaaa 5294
<210> 34
<211> 3879
<212> DNA
<213> Homo sapiens
<400> 34
atcagacgcg cagaggaggc ggggccgcgg ctggtttcct gccggggggc ggctctgggc 60
cgccgagtcc cctcctcccg cccctgagga ggaggagccg ccgccacccg ccgcgcccga 120
cacccgggag gccccgccag cccgcgggag aggcccagcg ggagtcgcgg aacagcaggc 180
ccgagcccac cgcgccgggc cccggacgcc gcgcggaaaa gatgaattta caaccaattt 240
tctggattgg actgatcagt tcagtttgct gtgtgtttgc tcaaacagat gaaaatagat 300
gtttaaaagc aaatgccaaa tcatgtggag aatgtataca agcagggcca aattgtgggt 360
ggtgcacaaa ttcaacattt ttacaggaag gaatgcctac ttctgcacga tgtgatgatt 420
tagaagcctt aaaaaagaag ggttgccctc cagatgacat agaaaatccc agaggctcca 480
aagatataaa gaaaaataaa aatgtaacca accgtagcaa aggaacagca gagaagctca 540
agccagagga tattactcag atccaaccac agcagttggt tttgcgatta agatcagggg 600
agccacagac atttacatta aaattcaaga gagctgaaga ctatcccatt gacctctact 660
accttatgga cctgtcttac tcaatgaaag acgatttgga gaatgtaaaa agtcttggaa 720
cagatctgat gaatgaaatg aggaggatta cttcggactt cagaattgga tttggctcat 780
ttgtggaaaa gactgtgatg ccttacatta gcacaacacc agctaagctc aggaaccctt 840
gcacaagtga acagaactgc accagcccat ttagctacaa aaatgtgctc agtcttacta 900
ataaaggaga agtatttaat gaacttgttg gaaaacagcg catatctgga aatttggatt 960
ctccagaagg tggtttcgat gccatcatgc aagttgcagt ttgtggatca ctgattggct 1020
ggaggaatgt tacacggctg ctggtgtttt ccacagatgc cgggtttcac tttgctggag 1080
atgggaaact tggtggcatt gttttaccaa atgatggaca atgtcacctg gaaaataata 1140
tgtacacaat gagccattat tatgattatc cttctattgc tcaccttgtc cagaaactga 1200
gtgaaaataa tattcagaca atttttgcag ttactgaaga atttcagcct gtttacaagg 1260
agctgaaaaa cttgatccct aagtcagcag taggaacatt atctgcaaat tctagcaatg 1320
taattcagtt gatcattgat gcatacaatt ccctttcctc agaagtcatt ttggaaaacg 1380
gcaaattgtc agaaggcgta acaataagtt acaaatctta ctgcaagaac ggggtgaatg 1440
gaacagggga aaatggaaga aaatgttcca atatttccat tggagatgag gttcaatttg 1500
aaattagcat aacttcaaat aagtgtccaa aaaaggattc tgacagcttt aaaattaggc 1560
ctctgggctt tacggaggaa gtagaggtta ttcttcagta catctgtgaa tgtgaatgcc 1620
aaagcgaagg catccctgaa agtcccaagt gtcatgaagg aaatgggaca tttgagtgtg 1680
gcgcgtgcag gtgcaatgaa gggcgtgttg gtagacattg tgaatgcagc acagatgaag 1740
ttaacagtga agacatggat gcttactgca ggaaagaaaa cagttcagaa atctgcagta 1800
acaatggaga gtgcgtctgc ggacagtgtg tttgtaggaa gagggataat acaaatgaaa 1860
tttattctgg caaattctgc gagtgtgata atttcaactg tgatagatcc aatggcttaa 1920
tttgtggagg aaatggtgtt tgcaagtgtc gtgtgtgtga gtgcaacccc aactacactg 1980
gcagtgcatg tgactgttct ttggatacta gtacttgtga agccagcaac ggacagatct 2040
gcaatggccg gggcatctgc gagtgtggtg tctgtaagtg tacagatccg aagtttcaag 2100
ggcaaacgtg tgagatgtgt cagacctgcc ttggtgtctg tgctgagcat aaagaatgtg 2160
ttcagtgcag agccttcaat aaaggagaaa agaaagacac atgcacacag gaatgttcct 2220
attttaacat taccaaggta gaaagtcggg acaaattacc ccagccggtc caacctgatc 2280
ctgtgtccca ttgtaaggag aaggatgttg acgactgttg gttctatttt acgtattcag 2340
tgaatgggaa caacgaggtc atggttcatg ttgtggagaa tccagagtgt cccactggtc 2400
cagacatcat tccaattgta gctggtgtgg ttgctggaat tgttcttatt ggccttgcat 2460
tactgctgat atggaagctt ttaatgataa ttcatgacag aagggagttt gctaaatttg 2520
aaaaggagaa aatgaatgcc aaatgggaca cgggtgaaaa tcctatttat aagagtgccg 2580
taacaactgt ggtcaatccg aagtatgagg gaaaatgagt actgcccgtg caaatcccac 2640
aacactgaat gcaaagtagc aatttccata gtcacagtta ggtagcttta gggcaatatt 2700
gccatggttt tactcatgtg caggttttga aaatgtacaa tatgtataat ttttaaaatg 2760
ttttattatt ttgaaaataa tgttgtaatt catgccaggg actgacaaaa gacttgagac 2820
aggatggtta ctcttgtcag ctaaggtcac attgtgcctt tttgaccttt tcttcctgga 2880
ctattgaaat caagcttatt ggattaagtg atatttctat agcgattgaa agggcaatag 2940
ttaaagtaat gagcatgatg agagtttctg ttaatcatgt attaaaactg atttttagct 3000
ttacaaatat gtcagtttgc agttatgcag aatccaaagt aaatgtcctg ctagctagtt 3060
aaggattgtt ttaaatctgt tattttgcta tttgcctgtt agacatgact gatgacatat 3120
ctgaaagaca agtatgttga gagttgctgg tgtaaaatac gtttgaaata gttgatctac 3180
aaaggccatg ggaaaaattc agagagttag gaaggaaaaa ccaatagctt taaaacctgt 3240
gtgccatttt aagagttact taatgtttgg taacttttat gccttcactt tacaaattca 3300
agccttagat aaaagaaccg agcaattttc tgctaaaaag tccttgattt agcactattt 3360
acatacaggc catactttac aaagtatttg ctgaatgggg accttttgag ttgaatttat 3420
tttattattt ttattttgtt taatgtctgg tgctttctgt cacctcttct aatcttttaa 3480
tgtatttgtt tgcaattttg gggtaagact ttttttatga gtactttttc tttgaagttt 3540
tagcggtcaa tttgcctttt taatgaacat gtgaagttat actgtggcta tgcaacagct 3600
ctcacctacg cgagtcttac tttgagttag tgccataaca gaccactgta tgtttacttc 3660
tcaccatttg agttgcccat cttgtttcac actagtcaca ttcttgtttt aagtgccttt 3720
agttttaaca gttcactttt tacagtgcta tttactgaag ttatttatta aatatgccta 3780
aaatacttaa atcggatgtc ttgactctga tgtattttat caggttgtgt gcatgaaatt 3840
tttatagatt aaagaagttg aggaaaagca aaaaaaaaa 3879
<210> 35
<211> 3392
<212> DNA
<213> Homo sapiens
<400> 35
gcggagccag cccctcccct acccggagca gcccgctggg gccgtcccga gcggcgacac 60
actaggagtc ccggccggcc agccagggca gccgcggtcc cgggactcgg ccgtgagtgc 120
tgcgggacgg atggtggcgg cggggcgcgg gccagcgcgg gcgccgtgag ccggagctgc 180
gcgcggggca tgcggctgcg gcccccggcc ctcggccccc gcgctccggc cccagccccg 240
gccgccggcc cccgcggagt gcagcgaccg cgccgccgct gagggaggcg ccccaccatg 300
ccgcgggccc cggcgccgct gtacgcctgc ctcctggggc tctgcgcgct cctgccccgg 360
ctcgcaggtc tcaacatatg cactagtgga agtgccacct catgtgaaga atgtctgcta 420
atccacccaa aatgtgcctg gtgctccaaa gaggacttcg gaagcccacg gtccatcacc 480
tctcggtgtg atctgagggc aaaccttgtc aaaaatggct gtggaggtga gatagagagc 540
ccagccagca gcttccatgt cctgaggagc ctgcccctca gcagcaaggg ttcgggctct 600
gcaggctggg acgtcattca gatgacacca caggagattg ccgtgaacct ccggcccggt 660
gacaagacca ccttccagct acaggttcgc caggtggagg actatcctgt ggacctgtac 720
tacctgatgg acctctccct gtccatgaag gatgacttgg acaatatccg gagcctgggc 780
accaaactcg cggaggagat gaggaagctc accagcaact tccggttggg atttgggtct 840
tttgttgata aggacatctc tcctttctcc tacacggcac cgaggtacca gaccaatccg 900
tgcattggtt acaagttgtt tccaaattgc gtcccctcct ttgggttccg ccatctgctg 960
cctctcacag acagagtgga cagcttcaat gaggaagttc ggaaacagag ggtgtcccgg 1020
aaccgagatg cccctgaggg gggctttgat gcagtactcc aggcagccgt ctgcaaggag 1080
aagattggct ggcgaaagga tgcactgcat ttgctggtgt tcacaacaga tgatgtgccc 1140
cacatcgcat tggatggaaa attgggaggc ctggtgcagc cacacgatgg ccagtgccac 1200
ctgaacgagg ccaacgagta cactgcatcc aaccagatgg actatccatc ccttgccttg 1260
cttggagaga aattggcaga gaacaacatc aacctcatct ttgcagtgac aaaaaaccat 1320
tatatgctgt acaagaattt tacagccctg atacctggaa caacggtgga gattttagat 1380
ggagactcca aaaatattat tcaactgatt attaatgcat acaatagtat ccggtctaaa 1440
gtggagttgt cagtctggga tcagcctgag gatcttaatc tcttctttac tgctacctgc 1500
caagatgggg tatcctatcc tggtcagagg aagtgtgagg gtctgaagat tggggacacg 1560
gcatcttttg aagtatcatt ggaggcccga agctgtccca gcagacacac ggagcatgtg 1620
tttgccctgc ggccggtggg attccgggac agcctggagg tgggggtcac ctacaactgc 1680
acgtgcggct gcagcgtggg gctggaaccc aacagtgcca ggtgcaacgg gagcgggacc 1740
tatgtctgcg gcctgtgtga gtgcagcccc ggctacctgg gcaccaggtg cgagtgccag 1800
gatggggaga accagagcgt gtaccagaac ctgtgccggg aggcagaggg caagccactg 1860
tgcagcgggc gtggggactg cagctgcaac cagtgctcct gcttcgagag cgagttcggc 1920
aagatctatg ggcctttctg tgagtgcgac aacttctcct gtgccaggaa caagggagtc 1980
ctctgctcag gccatggcga gtgtcactgc ggggaatgca agtgccatgc aggttacatc 2040
ggggacaact gtaactgctc gacagacatc agcacatgcc ggggcagaga tggccagatc 2100
tgcagcgagc gtgggcactg tctctgtggg cagtgccaat gcacggagcc gggggccttt 2160
ggggagatgt gtgagaagtg ccccacctgc ccggatgcat gcagcaccaa gagagattgc 2220
gtcgagtgcc tgctgctcca ctctgggaaa cctgacaacc agacctgcca cagcctatgc 2280
agggatgagg tgatcacatg ggtggacacc atcgtgaaag atgaccagga ggctgtgcta 2340
tgtttctaca aaaccgccaa ggactgcgtc atgatgttca cctatgtgga gctccccagt 2400
gggaagtcca acctgaccgt cctcagggag ccagagtgtg gaaacacccc caacgccatg 2460
accatcctcc tggctgtggt cggtagcatc ctccttgttg ggcttgcact cctggctatc 2520
tggaagctgc ttgtcaccat ccacgaccgg agggagtttg caaagtttca gagcgagcga 2580
tccagggccc gctatgaaat ggcttcaaat ccattataca gaaagcctat ctccacgcac 2640
actgtggact tcaccttcaa caagttcaac aaatcctaca atggcactgt ggactgatgt 2700
ttccttctcc gaggggctgg agcggggatc tgatgaaaag gtcagactga aacgccttgc 2760
acggctgctc ggcttgatca cagctcccta ggtaggcacc acagagaaga ccttctagtg 2820
agcctgggcc aggagcccac agtgcctgta caggaaggtg cctggccatg tcacctggct 2880
gctaggccag agccatgcca ggctgcgtcc ctccgagctt gggataaagc aaggggacct 2940
tggcactctc agctttccct gccacatcca gcttgttgtc ccaatgaaat actgagatgc 3000
tgggctgtct ctcccttcca ggaatgctgg gcccccagcc tggccagaca agacgactgt 3060
caggaagggt cggagtctgt aaaaccagca tacagtttgg cttttttcac attgatcatt 3120
tttatatgaa ataaaaagat cctgcattta tggtgtagtt ctgagtcctg agacttttcc 3180
gcgtgatggc tatgccttgc acacaggtgt tggtgatggg gctgttgaga tgcctgttga 3240
aggtacatcg tttgcaaatg tcagtttcct ctcctgtccg tgtttgttta gtacttttat 3300
aatgaaaaga aacaagattg tttgggattg gaagtaaaga ttaaaaccaa aagaatttgt 3360
gtttgtctga taaaaaaaaa aaaaaaaaaa aa 3392
<210> 36
<211> 3338
<212> DNA
<213> Homo sapiens
<400> 36
gacatcatgg gctattttta ggggttgact ggtagcagat aagtgttgag ctcgggctgg 60
ataagggctc agagttgcac tgagtgtggc tgaagcagcg aggcgggagt ggaggtgcgc 120
ggagtcaggc agacagacag acacagccag ccagccaggt cggcagtata gtccgaactg 180
caaatcttat tttcttttca ccttctctct aactgcccag agctagcgcc tgtggctccc 240
gggctggtgt ttcgggagtg tccagagagc ctggtctcca gccgcccccg ggaggagagc 300
cctgctgccc aggcgctgtt gacagcggcg gaaagcagcg gtacccacgc gcccgccggg 360
ggaagtcggc gagcggctgc agcagcaaag aactttcccg gctgggagga ccggagacaa 420
gtggcagagt cccggagcga acttttgcaa gcctttcctg cgtcttaggc ttctccacgg 480
cggtaaagac cagaaggcgg cggagagcca cgcaagagaa gaaggacgtg cgctcagctt 540
cgctcgcacc ggttgttgaa cttgggcgag cgcgagccgc ggctgccggg cgccccctcc 600
ccctagcagc ggaggagggg acaagtcgtc ggagtccggg cggccaagac ccgccgccgg 660
ccggccactg cagggtccgc actgatccgc tccgcgggga gagccgctgc tctgggaagt 720
gagttcgcct gcggactccg aggaaccgct gcgcccgaag agcgctcagt gagtgaccgc 780
gacttttcaa agccgggtag cgcgcgcgag tcgacaagta agagtgcggg aggcatctta 840
attaaccctg cgctccctgg agcgagctgg tgaggagggc gcagcgggga cgacagccag 900
cgggtgcgtg cgctcttaga gaaactttcc ctgtcaaagg ctccgggggg cgcgggtgtc 960
ccccgcttgc cagagccctg ttgcggcccc gaaacttgtg cgcgcagccc aaactaacct 1020
cacgtgaagt gacggactgt tctatgactg caaagatgga aacgaccttc tatgacgatg 1080
ccctcaacgc ctcgttcctc ccgtccgaga gcggacctta tggctacagt aaccccaaga 1140
tcctgaaaca gagcatgacc ctgaacctgg ccgacccagt ggggagcctg aagccgcacc 1200
tccgcgccaa gaactcggac ctcctcacct cgcccgacgt ggggctgctc aagctggcgt 1260
cgcccgagct ggagcgcctg ataatccagt ccagcaacgg gcacatcacc accacgccga 1320
cccccaccca gttcctgtgc cccaagaacg tgacagatga gcaggagggc ttcgccgagg 1380
gcttcgtgcg cgccctggcc gaactgcaca gccagaacac gctgcccagc gtcacgtcgg 1440
cggcgcagcc ggtcaacggg gcaggcatgg tggctcccgc ggtagcctcg gtggcagggg 1500
gcagcggcag cggcggcttc agcgccagcc tgcacagcga gccgccggtc tacgcaaacc 1560
tcagcaactt caacccaggc gcgctgagca gcggcggcgg ggcgccctcc tacggcgcgg 1620
ccggcctggc ctttcccgcg caaccccagc agcagcagca gccgccgcac cacctgcccc 1680
agcagatgcc cgtgcagcac ccgcggctgc aggccctgaa ggaggagcct cagacagtgc 1740
ccgagatgcc cggcgagaca ccgcccctgt cccccatcga catggagtcc caggagcgga 1800
tcaaggcgga gaggaagcgc atgaggaacc gcatcgctgc ctccaagtgc cgaaaaagga 1860
agctggagag aatcgcccgg ctggaggaaa aagtgaaaac cttgaaagct cagaactcgg 1920
agctggcgtc cacggccaac atgctcaggg aacaggtggc acagcttaaa cagaaagtca 1980
tgaaccacgt taacagtggg tgccaactca tgctaacgca gcagttgcaa acattttgaa 2040
gagagaccgt cgggggctga ggggcaacga agaaaaaaaa taacacagag agacagactt 2100
gagaacttga caagttgcga cggagagaaa aaagaagtgt ccgagaacta aagccaaggg 2160
tatccaagtt ggactgggtt gcgtcctgac ggcgccccca gtgtgcacga gtgggaagga 2220
cttggcgcgc cctcccttgg cgtggagcca gggagcggcc gcctgcgggc tgccccgctt 2280
tgcggacggg ctgtccccgc gcgaacggaa cgttggactt ttcgttaaca ttgaccaaga 2340
actgcatgga cctaacattc gatctcattc agtattaaag gggggagggg gagggggtta 2400
caaactgcaa tagagactgt agattgcttc tgtagtactc cttaagaaca caaagcgggg 2460
ggagggttgg ggaggggcgg caggagggag gtttgtgaga gcgaggctga gcctacagat 2520
gaactctttc tggcctgcct tcgttaactg tgtatgtaca tatatatatt ttttaatttg 2580
atgaaagctg attactgtca ataaacagct tcatgccttt gtaagttatt tcttgtttgt 2640
ttgtttgggt atcctgccca gtgttgtttg taaataagag atttggagca ctctgagttt 2700
accatttgta ataaagtata taattttttt atgttttgtt tctgaaaatt ccagaaagga 2760
tatttaagaa aatacaataa actattggaa agtactcccc taacctcttt tctgcatcat 2820
ctgtagatac tagctatcta ggtggagttg aaagagttaa gaatgtcgat taaaatcact 2880
ctcagtgctt cttactatta agcagtaaaa actgttctct attagacttt agaaataaat 2940
gtacctgatg tacctgatgc tatggtcagg ttatactcct cctcccccag ctatctatat 3000
ggaattgctt accaaaggat agtgcgatgt ttcaggaggc tggaggaagg ggggttgcag 3060
tggagaggga cagcccactg agaagtcaaa catttcaaag tttggattgt atcaagtggc 3120
atgtgctgtg accatttata atgttagtag aaattttaca ataggtgctt attctcaaag 3180
caggaattgg tggcagattt tacaaaagat gtatccttcc aatttggaat cttctctttg 3240
acaattccta gataaaaaga tggcctttgc ttatgaatat ttataacagc attcttgtca 3300
caataaatgt attcaaatac caaaaaaaaa aaaaaaaa 3338
<210> 37
<211> 1832
<212> DNA
<213> Homo sapiens
<400> 37
gagcggccag gccagcctcg gagccagcag ggagctggga gctgggggaa acgacgccag 60
gaaagctatc gcgccagaga gggcgacggg ggctcgggaa gcctgacagg gcttttgcgc 120
acagctgccg gctggctgct acccgcccgc gccagccccc gagaacgcgc gaccaggcac 180
ccagtccggt caccgcagcg gagagctcgc cgctcgctgc agcgaggccc ggagcggccc 240
cgcagggacc ctccccagac cgcctgggcc gcccggatgt gcactaaaat ggaacagccc 300
ttctaccacg acgactcata cacagctacg ggatacggcc gggcccctgg tggcctctct 360
ctacacgact acaaactcct gaaaccgagc ctggcggtca acctggccga cccctaccgg 420
agtctcaaag cgcctggggc tcgcggaccc ggcccagagg gcggcggtgg cggcagctac 480
ttttctggtc agggctcgga caccggcgcg tctctcaagc tcgcctcttc ggagctggaa 540
cgcctgattg tccccaacag caacggcgtg atcacgacga cgcctacacc cccgggacag 600
tacttttacc cccgcggggg tggcagcggt ggaggtgcag ggggcgcagg gggcggcgtc 660
accgaggagc aggagggctt cgccgacggc tttgtcaaag ccctggacga tctgcacaag 720
atgaaccacg tgacaccccc caacgtgtcc ctgggcgcta ccggggggcc cccggctggg 780
cccgggggcg tctacgccgg cccggagcca cctcccgttt acaccaacct cagcagctac 840
tccccagcct ctgcgtcctc gggaggcgcc ggggctgccg tcgggaccgg gagctcgtac 900
ccgacgacca ccatcagcta cctcccacac gcgccgccct tcgccggtgg ccacccggcg 960
cagctgggct tgggccgcgg cgcctccacc ttcaaggagg aaccgcagac cgtgccggag 1020
gcgcgcagcc gggacgccac gccgccggtg tcccccatca acatggaaga ccaagagcgc 1080
atcaaagtgg agcgcaagcg gctgcggaac cggctggcgg ccaccaagtg ccggaagcgg 1140
aagctggagc gcatcgcgcg cctggaggac aaggtgaaga cgctcaaggc cgagaacgcg 1200
gggctgtcga gtaccgccgg cctcctccgg gagcaggtgg cccagctcaa acagaaggtc 1260
atgacccacg tcagcaacgg ctgtcagctg ctgcttgggg tcaagggaca cgccttctga 1320
acgtcccctg cccctttacg gacaccccct cgcttggacg gctgggcaca cgcctcccac 1380
tggggtccag ggagcaggcg gtgggcaccc accctgggac ctaggggcgc cgcaaaccac 1440
actggactcc ggccctccta ccctgcgccc agtccttcca cctcgacgtt tacaagcccc 1500
cccttccact tttttttgta tgtttttttt ctgctggaaa cagactcgat tcatattgaa 1560
tataatatat ttgtgtattt aacagggagg ggaagagggg gcgatcgcgg cggagctggc 1620
cccgccgcct ggtactcaag cccgcgggga cattgggaag gggacccccg ccccctgccc 1680
tcccctctct gcaccgtact gtggaaaaga aacacgcact tagtctctaa agagtttatt 1740
ttaagacgtg tttgtgtttg tgtgtgtttg ttctttttat tgaatctatt taagtaaaaa 1800
aaaaattggt tctttaaaaa aaaaaaaaaa aa 1832
<210> 38
<211> 2187
<212> DNA
<213> Homo sapiens
<400> 38
gtcctttcta gacagccccc tcctccaggc tcagggacct gtctggctgt gagctcccag 60
gaggtcccag gggtgtgacc tccctccctc cctccctccc tcttcccttc accccaggcc 120
agcccagggc cagctataaa gctggcccag cctggctctc agcacaccca gctgcctgag 180
accctccttc aacctcccta gaggacagcc ccactctgcc tcctgctccc ccagggcagc 240
accatgtggc ccctgtggct ctgctgggca ctctgggtgc tgcccctggc tggccccggg 300
gcggccctga ccgaggagca gctcctgggc agcctgctgc ggcagctgca gctcagcgag 360
gtgcccgtac tggacagggc cgacatggag aagctggtca tccccgccca cgtgagggcc 420
cagtatgtag tcctgctgcg gcgcagccac ggggaccgct cccgcggaaa gaggttcagc 480
cagagcttcc gagaggtggc cggcaggttc ctggcgtcgg aggccagcac acacctgctg 540
gtgttcggca tggagcagcg gctgccgccc aacagcgagc tggtgcaggc cgtgctgcgg 600
ctcttccagg agccggtccc caaggccgcg ctgcacaggc acgggcggct gtccccgcgc 660
agcgcccagg cccgggtgac cgtcgagtgg ctgcgcgtcc gcgacgacgg ctccaaccgc 720
acctccctca tcgactccag gctggtgtcc gtccacgaga gcggctggaa ggccttcgac 780
gtgaccgagg ccgtgaactt ctggcagcag ctgagccggc cccggcagcc gctgctgcta 840
caggtgtcgg tgcagaggga gcatctgggc ccgctggcgt ccggcgccca caagctggtc 900
cgctttgcct cgcagggggc gccagccggg cttggggagc cccagctgga gctgcacacc 960
ctggacctca gggactatgg agctcagggc gactgtgacc ctgaagcacc aatgaccgag 1020
ggcacccgct gctgccgcca ggagatgtac attgacctgc aggggatgaa gtgggccaag 1080
aactgggtgc tggagccccc gggcttcctg gcttacgagt gtgtgggcac ctgccagcag 1140
cccccggagg ccctggcctt caattggcca tttctggggc cgcgacagtg tatcgcctcg 1200
gagactgcct cgctgcccat gatcgtcagc atcaaggagg gaggcaggac caggccccag 1260
gtggtcagcc tgcccaacat gagggtgcag aagtgcagct gtgcctcgga tggggcgctc 1320
gtgccaagga ggctccagcc ataggcgcct ggtgtatcca ttgagccctc taactgaacg 1380
tgtgcataga ggtggtctta atgtaggtct taactttata cttagcaagt tactccatcc 1440
caatttagtg ctcctgtgtg accttcgccc tgtgtccttc catttcctgt ctttcccgtc 1500
catcacccat cctaagcact tacgtgagta aataatgcag ctcagatgct gagctctagt 1560
aggaaatgct ggcatgctga ttacaagata cagctgagca atgcacacat tttcagctgg 1620
gagtttctgt tctctggcaa attcttcact gagtctggaa caataatacc ctatgattag 1680
aactggggaa acagaactga attgctgtgt tatatgagga attaaaacct tcaaatctct 1740
atttccccca aatactgacc cattctggac ttttgtaaac atacctaggc ccctgttccc 1800
ctgagagggt gctaagagga aggatgaagg gcttcaggct gggggcagtg gacagggaat 1860
tgggatacct ggattctggt tctgacaggg ccacaagcta ggatctctaa caaacgcaga 1920
aggctttggc tcgtcatttc ctcttaaaaa ggaggagctg ggcttcagct ctaagaactt 1980
cattgccctg gggatcagac agcccctacc tacccctgcc cactcctctg gagactgagc 2040
cttgcccgtg catatttagg tcatttccca cactgtctta gagaacttgt caccagaaac 2100
cacatgtatt tgcatgtttt ttgttaattt agctaaagca attgaatgta gatactcaga 2160
agaaataaaa aatgatgttt cactctg 2187
<210> 39
<211> 2048
<212> DNA
<213> Homo sapiens
<400> 39
cctggcccgg gagggtataa gtgcggcccg cgcccctccg agcggcgcgc tgggttccgg 60
agcgatggcc acagccgagt cccgtgcgct ccagtttgcc gagggcgccg cgtttccagc 120
gtaccgggcc ccccacgccg gcggggcgct cctgccgccc ccgagccctg cggcagccct 180
gctccctgcg ccgcccgcgg gccccggccc agcgaccttt gcgggcttcc tcggccggga 240
ccccgggccg gccccgccgc cccccgccag cctgggctcg cctgcgcccc ccaaaggcgc 300
ggccgccccg tcggcgtcgc agcgccgcaa gcgcacgtct ttcagcgccg aacagctgca 360
gctgctggag ctcgtcttcc gccggacccg gtaccccgac atccacttgc gcgagcgcct 420
ggccgcgctc accctgctcc ccgagtccag gatccagctt ttattttctc ccctcttcca 480
ggtatggttc cagaacaggc gtgccaagtc tcggcgtcag agtgggaaat ccttccaacc 540
tttggctagg ccggagatta tcctcaacca ctgtgctcct ggaactgaaa cgaaatgtct 600
gaagccccag ctgcctcttg aggtagatgt gaactgcctg cccgaaccaa acggggttgg 660
agggggcatc tctgactcta gctcccaagg tcagaatttt gaaacctgtt cccctctctc 720
tgaagacatt ggttcaaagc tggactcatg ggaggaacac atcttttctg cctttggtaa 780
cttttgagga ttctgggaga attcgggata agctctgagg agccatgact gacagcctgg 840
gagagacaca tcagcatact gtcctttctg acttccatgc taaggacatg tccttgttaa 900
ccttgatgat ggttttgaca gcacctctca catttgaagg taccccgcca ctttgtcaat 960
gacgttttaa gcccacactc ccaccccaga gttcccgcat tcgtttttac ctgtgttctc 1020
tccaagcctg cacattccat tggtctgcat ccctatgcct tcttgccagg cctgttttta 1080
gtttttggac tggttgttca gaactcatta ttttcttcac aagaatgcct cagcttgact 1140
cagtttcccc ttgtgtttga cagctgccat tttctcctgg tccctccaag gcttataatc 1200
ttaaagtcac tctaccccgt ctcttcaacc ctcatcctag gtttattact ttttaaaatt 1260
gggcctgtca tcttcacgtt caatcatagc tccaatgact ctgcatgcag attatttcga 1320
cagccccctt gcctctagct tctcaactac ttaaaaaaaa ttaccctctg tgggccaggt 1380
gcagtggctc actcctgcaa tctcagcact ttgggaggcc gagtgggtgg atcacctgaa 1440
gtcaggagtt caagaccagc ctggccaata tggcgaaacc ccatctctgc taaaaatata 1500
aaacttagct gggcacggtg acgggagcct gtagtcccag ctactcagga ggctgaggca 1560
ggagaatcac ttgagcctgg gaggtggagg ttgcagtgat ctaagatcgt gccactgcac 1620
ttcagcctgg gagacagagg gaggctctca aaaaaaaaaa aaaaaaaaaa aaaaattact 1680
ctatggttct gtggtagcct ccagttgcta ccaaattata aaaagctttc agttaccctc 1740
ccagataact gatatcatcc ttagcctgca ggacagctat gcaaatctga aggtcaacta 1800
tccacaatat atgctttggt cttaaagtca ctcctttcag ttttgaacca aattcatacc 1860
ttttgctttc aaaacactcg aggactcccc acctgccttc tgaagtctga aattttctct 1920
aagtaatcct gattttgcac ctgttacttc gatcactcca ttacccttag cacttgttat 1980
tgtacttcct gtgcaagttt tgtggattat taaatgtctt tcacaaatgt aaaaaaaaaa 2040
aaaaaaaa 2048
<210> 40
<211> 2735
<212> DNA
<213> Homo sapiens
<400> 40
acaacagtcc ccaggcatca ccattcaaga tgcatccagg ggtcctggct gccttcctct 60
tcttgagctg gactcattgt cgggccctgc cccttcccag tggtggtgat gaagatgatt 120
tgtctgagga agacctccag tttgcagagc gctacctgag atcatactac catcctacaa 180
atctcgcggg aatcctgaag gagaatgcag caagctccat gactgagagg ctccgagaaa 240
tgcagtcttt cttcggctta gaggtgactg gcaaacttga cgataacacc ttagatgtca 300
tgaaaaagcc aagatgcggg gttcctgatg tgggtgaata caatgttttc cctcgaactc 360
ttaaatggtc caaaatgaat ttaacctaca gaattgtgaa ttacacccct gatatgactc 420
attctgaagt cgaaaaggca ttcaaaaaag ccttcaaagt ttggtccgat gtaactcctc 480
tgaattttac cagacttcac gatggcattg ctgacatcat gatctctttt ggaattaagg 540
agcatggcga cttctaccca tttgatgggc cctctggcct gctggctcat gcttttcctc 600
ctgggccaaa ttatggagga gatgcccatt ttgatgatga tgaaacctgg acaagtagtt 660
ccaaaggcta caacttgttt cttgttgctg cgcatgagtt cggccactcc ttaggtcttg 720
accactccaa ggaccctgga gcactcatgt ttcctatcta cacctacacc ggcaaaagcc 780
actttatgct tcctgatgac gatgtacaag ggatccagtc tctctatggt ccaggagatg 840
aagaccccaa ccctaaacat ccaaaaacgc cagacaaatg tgacccttcc ttatcccttg 900
atgccattac cagtctccga ggagaaacaa tgatctttaa agacagattc ttctggcgcc 960
tgcatcctca gcaggttgat gcggagctgt ttttaacgaa atcattttgg ccagaacttc 1020
ccaaccgtat tgatgctgca tatgagcacc cttctcatga cctcatcttc atcttcagag 1080
gtagaaaatt ttgggctctt aatggttatg acattctgga aggttatccc aaaaaaatat 1140
ctgaactggg tcttccaaaa gaagttaaga agataagtgc agctgttcac tttgaggata 1200
caggcaagac tctcctgttc tcaggaaacc aggtctggag atatgatgat actaaccata 1260
ttatggataa agactatccg agactaatag aagaagactt cccaggaatt ggtgataaag 1320
tagatgctgt ctatgagaaa aatggttata tctatttttt caacggaccc atacagtttg 1380
aatacagcat ctggagtaac cgtattgttc gcgtcatgcc agcaaattcc attttgtggt 1440
gttaagtgtc tttttaaaaa ttgttattta aatcctgaag agcatttggg gtaatacttc 1500
cagaagtgcg gggtagggga agaagagcta tcaggagaaa gcttggttct gtgaacaagc 1560
ttcagtaagt tatctttgaa tatgtagtat ctatatgact atgcgtggct ggaaccacat 1620
tgaagaatgt tagagtaatg aaatggagga tctctaaaga gcatctgatt cttgttgctg 1680
tacaaaagca atggttgatg atacttccca caccacaaat gggacacatg gtctgtcaat 1740
gagagcataa tttaaaaata tatttataag gaaattttac aagggcataa agtaaataca 1800
tgcatataat gaataaatca ttcttactaa aaagtataaa atagtatgaa aatggaaatt 1860
tgggagagcc atacataaaa gaaataaacc aaaggaaaat gtctgtaata atagactgta 1920
acttccaaat aaataatttt cattttgcac tgaggatatt cagatgtatg tgcccttctt 1980
cacacagaca ctaacgaaat atcaaagtca ttaaagacag gagacaaaag agcagtggta 2040
agaatagtag atgtggcctt tgaattctgt ttaattttca cttttggcaa tgactcaaag 2100
tctgctctca tataagacaa atattccttt gcatattata aaggataaag aaggatgatg 2160
tctttttatt aaaatatttc aggttcttca gaagtcacac attacaaagt taaaattgtt 2220
atcaaaatag tctaaggcca tggcatccct ttttcataaa ttatttgatt atttaagact 2280
aaaagttgca ttttaaccct attttaccta gctaattatt taattgtcca gtttgtcttg 2340
gatatatagg ctattttcta aagacttgta tagcatgaaa taaaatatat cttataaagt 2400
ggaagtatgt atattaaaaa agagacatcc aaattttttt ttaaagcagt ctactagatt 2460
gtgatccctt gagatatgga aggatgcctt tttttctctg catttaaaaa aatcccccag 2520
cacttcccac agtgcctatt gatacttggg gagggtgctt ggcacttatt gaatatatga 2580
tcggccatca agggaagaac tattgtgctc agagacactg ttgataaaaa ctcaggcaaa 2640
gaaaatgaaa tgcatatttg caaagtgtat taggaagtgt ttatgttgtt tataataaaa 2700
atatattttc aacagacaaa aaaaaaaaaa aaaaa 2735
<210> 41
<211> 3549
<212> DNA
<213> Homo sapiens
<400> 41
acatctggcg gctgccctcc cttgtttccg ctgcatccag acttcctcag gcggtggctg 60
gaggctgcgc atctggggct ttaaacatac aaagggattg ccaggacctg cggcggcggc 120
ggcggcggcg ggggctgggg cgcgggggcc ggaccatgag ccgctgagcc gggcaaaccc 180
caggccaccg agccagcgga ccctcggagc gcagccctgc gccgcggagc aggctccaac 240
caggcggcga ggcggccaca cgcaccgagc cagcgacccc cgggcgacgc gcggggccag 300
ggagcgctac gatggaggcg ctaatggccc ggggcgcgct cacgggtccc ctgagggcgc 360
tctgtctcct gggctgcctg ctgagccacg ccgccgccgc gccgtcgccc atcatcaagt 420
tccccggcga tgtcgccccc aaaacggaca aagagttggc agtgcaatac ctgaacacct 480
tctatggctg ccccaaggag agctgcaacc tgtttgtgct gaaggacaca ctaaagaaga 540
tgcagaagtt ctttggactg ccccagacag gtgatcttga ccagaatacc atcgagacca 600
tgcggaagcc acgctgcggc aacccagatg tggccaacta caacttcttc cctcgcaagc 660
ccaagtggga caagaaccag atcacataca ggatcattgg ctacacacct gatctggacc 720
cagagacagt ggatgatgcc tttgctcgtg ccttccaagt ctggagcgat gtgaccccac 780
tgcggttttc tcgaatccat gatggagagg cagacatcat gatcaacttt ggccgctggg 840
agcatggcga tggatacccc tttgacggta aggacggact cctggctcat gccttcgccc 900
caggcactgg tgttggggga gactcccatt ttgatgacga tgagctatgg accttgggag 960
aaggccaagt ggtccgtgtg aagtatggga acgccgatgg ggagtactgc aagttcccct 1020
tcttgttcaa tggcaaggag tacaacagct gcactgatac cggccgcagc gatggcttcc 1080
tctggtgctc caccacctac aactttgaga aggatggcaa gtacggcttc tgtccccatg 1140
aagccctgtt caccatgggc ggcaacgctg aaggacagcc ctgcaagttt ccattccgct 1200
tccagggcac atcctatgac agctgcacca ctgagggccg cacggatggc taccgctggt 1260
gcggcaccac tgaggactac gaccgcgaca agaagtatgg cttctgccct gagaccgcca 1320
tgtccactgt tggtgggaac tcagaaggtg ccccctgtgt cttccccttc actttcctgg 1380
gcaacaaata tgagagctgc accagcgccg gccgcagtga cggaaagatg tggtgtgcga 1440
ccacagccaa ctacgatgat gaccgcaagt ggggcttctg ccctgaccaa gggtacagcc 1500
tgttcctcgt ggcagcccac gagtttggcc acgccatggg gctggagcac tcccaagacc 1560
ctggggccct gatggcaccc atttacacct acaccaagaa cttccgtctg tcccaggatg 1620
acatcaaggg cattcaggag ctctatgggg cctctcctga cattgacctt ggcaccggcc 1680
ccacccccac gctgggccct gtcactcctg agatctgcaa acaggacatt gtatttgatg 1740
gcatcgctca gatccgtggt gagatcttct tcttcaagga ccggttcatt tggcggactg 1800
tgacgccacg tgacaagccc atggggcccc tgctggtggc cacattctgg cctgagctcc 1860
cggaaaagat tgatgcggta tacgaggccc cacaggagga gaaggctgtg ttctttgcag 1920
ggaatgaata ctggatctac tcagccagca ccctggagcg agggtacccc aagccactga 1980
ccagcctggg actgccccct gatgtccagc gagtggatgc cgcctttaac tggagcaaaa 2040
acaagaagac atacatcttt gctggagaca aattctggag atacaatgag gtgaagaaga 2100
aaatggatcc tggcttcccc aagctcatcg cagatgcctg gaatgccatc cccgataacc 2160
tggatgccgt cgtggacctg cagggcggcg gtcacagcta cttcttcaag ggtgcctatt 2220
acctgaagct ggagaaccaa agtctgaaga gcgtgaagtt tggaagcatc aaatccgact 2280
ggctaggctg ctgagctggc cctggctccc acaggccctt cctctccact gccttcgata 2340
caccgggcct ggagaactag agaaggaccc ggaggggcct ggcagccgtg ccttcagctc 2400
tacagctaat cagcattctc actcctacct ggtaatttaa gattccagag agtggctcct 2460
cccggtgccc aagaatagat gctgactgta ctcctcccag gcgccccttc cccctccaat 2520
cccaccaacc ctcagagcca cccctaaaga gatactttga tattttcaac gcagccctgc 2580
tttgggctgc cctggtgctg ccacacttca ggctcttctc ctttcacaac cttctgtggc 2640
tcacagaacc cttggagcca atggagactg tctcaagagg gcactggtgg cccgacagcc 2700
tggcacaggg cagtgggaca gggcatggcc aggtggccac tccagacccc tggcttttca 2760
ctgctggctg ccttagaacc tttcttacat tagcagtttg ctttgtatgc actttgtttt 2820
tttctttggg tcttgttttt tttttccact tagaaattgc atttcctgac agaaggactc 2880
aggttgtctg aagtcactgc acagtgcatc tcagcccaca tagtgatggt tcccctgttc 2940
actctactta gcatgtccct accgagtctc ttctccactg gatggaggaa aaccaagccg 3000
tggcttcccg ctcagccctc cctgcccctc ccttcaacca ttccccatgg gaaatgtcaa 3060
caagtatgaa taaagacacc tactgagtgg ccgtgtttgc catctgtttt agcagagcct 3120
agacaagggc cacagaccca gccagaagcg gaaacttaaa aagtccgaat ctctgctccc 3180
tgcagggcac aggtgatggt gtctgctgga aaggtcagag cttccaaagt aaacagcaag 3240
agaacctcag ggagagtaag ctctagtccc tctgtcctgt agaaagagcc ctgaagaatc 3300
agcaattttg ttgctttatt gtggcatctg ttcgaggttt gcttcctctt taagtctgtt 3360
tcttcattag caatcatatc agttttaatg ctactactaa caatgaacag taacaataat 3420
atccccctca attaatagag tgctttctat gtgcaaggca cttttcacgt gtcacctatt 3480
ttaacctttc caaccacata aataaaaaag gccattatta gttgaaaaaa aaaaaaaaaa 3540
aaaaaaaaa 3549
<210> 42
<211> 2387
<212> DNA
<213> Homo sapiens
<400> 42
agacacctct gccctcacca tgagcctctg gcagcccctg gtcctggtgc tcctggtgct 60
gggctgctgc tttgctgccc ccagacagcg ccagtccacc cttgtgctct tccctggaga 120
cctgagaacc aatctcaccg acaggcagct ggcagaggaa tacctgtacc gctatggtta 180
cactcgggtg gcagagatgc gtggagagtc gaaatctctg gggcctgcgc tgctgcttct 240
ccagaagcaa ctgtccctgc ccgagaccgg tgagctggat agcgccacgc tgaaggccat 300
gcgaacccca cggtgcgggg tcccagacct gggcagattc caaacctttg agggcgacct 360
caagtggcac caccacaaca tcacctattg gatccaaaac tactcggaag acttgccgcg 420
ggcggtgatt gacgacgcct ttgcccgcgc cttcgcactg tggagcgcgg tgacgccgct 480
caccttcact cgcgtgtaca gccgggacgc agacatcgtc atccagtttg gtgtcgcgga 540
gcacggagac gggtatccct tcgacgggaa ggacgggctc ctggcacacg cctttcctcc 600
tggccccggc attcagggag acgcccattt cgacgatgac gagttgtggt ccctgggcaa 660
gggcgtcgtg gttccaactc ggtttggaaa cgcagatggc gcggcctgcc acttcccctt 720
catcttcgag ggccgctcct actctgcctg caccaccgac ggtcgctccg acggcttgcc 780
ctggtgcagt accacggcca actacgacac cgacgaccgg tttggcttct gccccagcga 840
gagactctac acccaggacg gcaatgctga tgggaaaccc tgccagtttc cattcatctt 900
ccaaggccaa tcctactccg cctgcaccac ggacggtcgc tccgacggct accgctggtg 960
cgccaccacc gccaactacg accgggacaa gctcttcggc ttctgcccga cccgagctga 1020
ctcgacggtg atggggggca actcggcggg ggagctgtgc gtcttcccct tcactttcct 1080
gggtaaggag tactcgacct gtaccagcga gggccgcgga gatgggcgcc tctggtgcgc 1140
taccacctcg aactttgaca gcgacaagaa gtggggcttc tgcccggacc aaggatacag 1200
tttgttcctc gtggcggcgc atgagttcgg ccacgcgctg ggcttagatc attcctcagt 1260
gccggaggcg ctcatgtacc ctatgtaccg cttcactgag gggcccccct tgcataagga 1320
cgacgtgaat ggcatccggc acctctatgg tcctcgccct gaacctgagc cacggcctcc 1380
aaccaccacc acaccgcagc ccacggctcc cccgacggtc tgccccaccg gaccccccac 1440
tgtccacccc tcagagcgcc ccacagctgg ccccacaggt cccccctcag ctggccccac 1500
aggtcccccc actgctggcc cttctacggc cactactgtg cctttgagtc cggtggacga 1560
tgcctgcaac gtgaacatct tcgacgccat cgcggagatt gggaaccagc tgtatttgtt 1620
caaggatggg aagtactggc gattctctga gggcaggggg agccggccgc agggcccctt 1680
ccttatcgcc gacaagtggc ccgcgctgcc ccgcaagctg gactcggtct ttgaggagcg 1740
gctctccaag aagcttttct tcttctctgg gcgccaggtg tgggtgtaca caggcgcgtc 1800
ggtgctgggc ccgaggcgtc tggacaagct gggcctggga gccgacgtgg cccaggtgac 1860
cggggccctc cggagtggca gggggaagat gctgctgttc agcgggcggc gcctctggag 1920
gttcgacgtg aaggcgcaga tggtggatcc ccggagcgcc agcgaggtgg accggatgtt 1980
ccccggggtg cctttggaca cgcacgacgt cttccagtac cgagagaaag cctatttctg 2040
ccaggaccgc ttctactggc gcgtgagttc ccggagtgag ttgaaccagg tggaccaagt 2100
gggctacgtg acctatgaca tcctgcagtg ccctgaggac tagggctccc gtcctgcttt 2160
ggcagtgcca tgtaaatccc cactgggacc aaccctgggg aaggagccag tttgccggat 2220
acaaactggt attctgttct ggaggaaagg gaggagtgga ggtgggctgg gccctctctt 2280
ctcacctttg ttttttgttg gagtgtttct aataaacttg gattctctaa cctttaaaaa 2340
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaa 2387
<210> 43
<211> 2224
<212> DNA
<213> Homo sapiens
<400> 43
tcccgtctcc gcagcaaaaa agtttgagtc gccgctgccg ggttgccagc ggagtcgcgc 60
gtcgggagct acgtagggca gagaagtcat ggcttctccg tccaaaggca atgacttgtt 120
ttcgcccgac gaggagggcc cagcagtggt ggccggacca ggcccggggc ctgggggcgc 180
cgagggggcc gcggaggagc gccgcgtcaa ggtctccagc ctgcccttca gcgtggaggc 240
gctcatgtcc gacaagaagc cgcccaagga ggcgtccccg ctgccggccg aaagcgcctc 300
ggccggggcc accctgcggc cactgctgct gtcggggcac ggcgctcggg aagcgcacag 360
ccccgggccg ctggtgaagc ccttcgagac cgcctcggtc aagtcggaaa attcagaaga 420
tggagcggcg tggatgcagg aacccggccg atattcgccg ccgccaagac atatgagccc 480
taccacctgc accctgagga aacacaagac caatcggaag ccgcgcacgc cctttaccac 540
atcccagctc ctcgccctgg agcgcaagtt ccgtcagaaa cagtacctct ccattgcaga 600
gcgtgcagag ttctccagct ctctgaacct cacagagacc caggtcaaaa tctggttcca 660
gaaccgaagg gccaaggcga aaagactgca ggaggcagaa ctggaaaagc tgaaaatggc 720
tgcaaaacct atgctgccct ccagcttcag tctccctttc cccatcagct cgcccctgca 780
ggcagcgtcc atatatggag catcctaccc gttccataga cctgtgcttc ccatcccgcc 840
tgtgggactc tatgccacgc cagtgggata tggcatgtac cacctgtcct aaggaagacc 900
agatcaatag actccatgat ggatgcttgt ttcaaagggt ttcctctccc tctccacgaa 960
ggcagtacca gccagtactc ctgctctgct aaccctgcgt gcaccaccct aagcggctag 1020
gctgacaggg ccacacgaca tagctgaaat ttgttctgta ggcggaggca ccaagccctg 1080
ttttcttggt gtaatcttcc agatgccccc ttttcctttc acaaagattg gctctgatgg 1140
tttttatgta taaatatata tatataataa aatataatac atttttatac agcagacgta 1200
aaaattcaaa ttattttaaa aggcaaaatt tatatacata tgtgcttttt ttctatatct 1260
caccttccca aaagacactg tgtaagtcca tttgttgtat tttcttaaag agggagacaa 1320
attatttgca aaatgtgcta aagtcaatga tttttacggg attattgact tctgcttatg 1380
gaaaacaaag aaacagacac aatgcacaca gaaaatatta gatatggaga gattattcaa 1440
agtgaagggg acacatcata tttctgcatt ttacttgcat taaaagaaac ctctttatat 1500
actacagttg ttcctatctc tcccccgccc cccaccgccc caccacacac atatttttaa 1560
agtttttcct tttttaagaa tatttttgta agaccaatac ctgggatgag aagaatcctg 1620
agactgcctg gaggtgaggt agaaaattag aaatacttcc taattcttct caaggctgtt 1680
ggtaacttta tttcagataa ttggagagta aaatgttaaa acctgttgag aggaattgat 1740
ggtttctgag aaatactagg tacattcatc ctcacagatt gcaaaggtga tttgggtggg 1800
ggtttagtaa ttttctgctt aaaaaatgag tatcttgtaa ccattaccta tatgctaaat 1860
attcttgaac aattagtaga tccagaaaga aaaaaaaata tgctttctct gtgtgtgtac 1920
ctgttgtatg tcctaaactt attagaaaat tttatatact tttttacatg ttggggggca 1980
gaaggtaaag ccatgttttg acttggtgaa aatgggattg tcaaacagcc cattaagttc 2040
cctggtattt caccttcctg tccatctgtc ccctccctcc ggtatacctt tatccctttg 2100
aaagggtgct tgtacaattt gatatatttt attgaagagt tatctcttat tctgaattaa 2160
attaagcatt tgttttattg cagtaaagtt tgtccaaact cacaattaaa aaaaaaaaaa 2220
aaaa 2224
<210> 44
<211> 2379
<212> DNA
<213> Homo sapiens
<400> 44
gacccccgag ctgtgctgct cgcggccgcc accgccgggc cccggccgtc cctggctccc 60
ctcctgcctc gagaagggca gggcttctca gaggcttggc gggaaaaaga acggagggag 120
ggatcgcgct gagtataaaa gccggttttc ggggctttat ctaactcgct gtagtaattc 180
cagcgagagg cagagggagc gagcgggcgg ccggctaggg tggaagagcc gggcgagcag 240
agctgcgctg cgggcgtcct gggaagggag atccggagcg aatagggggc ttcgcctctg 300
gcccagccct cccgctgatc ccccagccag cggtccgcaa cccttgccgc atccacgaaa 360
ctttgcccat agcagcgggc gggcactttg cactggaact tacaacaccc gagcaaggac 420
gcgactctcc cgacgcgggg aggctattct gcccatttgg ggacacttcc ccgccgctgc 480
caggacccgc ttctctgaaa ggctctcctt gcagctgctt agacgctgga tttttttcgg 540
gtagtggaaa accagcagcc tcccgcgacg atgcccctca acgttagctt caccaacagg 600
aactatgacc tcgactacga ctcggtgcag ccgtatttct actgcgacga ggaggagaac 660
ttctaccagc agcagcagca gagcgagctg cagcccccgg cgcccagcga ggatatctgg 720
aagaaattcg agctgctgcc caccccgccc ctgtccccta gccgccgctc cgggctctgc 780
tcgccctcct acgttgcggt cacacccttc tcccttcggg gagacaacga cggcggtggc 840
gggagcttct ccacggccga ccagctggag atggtgaccg agctgctggg aggagacatg 900
gtgaaccaga gtttcatctg cgacccggac gacgagacct tcatcaaaaa catcatcatc 960
caggactgta tgtggagcgg cttctcggcc gccgccaagc tcgtctcaga gaagctggcc 1020
tcctaccagg ctgcgcgcaa agacagcggc agcccgaacc ccgcccgcgg ccacagcgtc 1080
tgctccacct ccagcttgta cctgcaggat ctgagcgccg ccgcctcaga gtgcatcgac 1140
ccctcggtgg tcttccccta ccctctcaac gacagcagct cgcccaagtc ctgcgcctcg 1200
caagactcca gcgccttctc tccgtcctcg gattctctgc tctcctcgac ggagtcctcc 1260
ccgcagggca gccccgagcc cctggtgctc catgaggaga caccgcccac caccagcagc 1320
gactctgagg aggaacaaga agatgaggaa gaaatcgatg ttgtttctgt ggaaaagagg 1380
caggctcctg gcaaaaggtc agagtctgga tcaccttctg ctggaggcca cagcaaacct 1440
cctcacagcc cactggtcct caagaggtgc cacgtctcca cacatcagca caactacgca 1500
gcgcctccct ccactcggaa ggactatcct gctgccaaga gggtcaagtt ggacagtgtc 1560
agagtcctga gacagatcag caacaaccga aaatgcacca gccccaggtc ctcggacacc 1620
gaggagaatg tcaagaggcg aacacacaac gtcttggagc gccagaggag gaacgagcta 1680
aaacggagct tttttgccct gcgtgaccag atcccggagt tggaaaacaa tgaaaaggcc 1740
cccaaggtag ttatccttaa aaaagccaca gcatacatcc tgtccgtcca agcagaggag 1800
caaaagctca tttctgaaga ggacttgttg cggaaacgac gagaacagtt gaaacacaaa 1860
cttgaacagc tacggaactc ttgtgcgtaa ggaaaagtaa ggaaaacgat tccttctaac 1920
agaaatgtcc tgagcaatca cctatgaact tgtttcaaat gcatgatcaa atgcaacctc 1980
acaaccttgg ctgagtcttg agactgaaag atttagccat aatgtaaact gcctcaaatt 2040
ggactttggg cataaaagaa cttttttatg cttaccatct tttttttttc tttaacagat 2100
ttgtatttaa gaattgtttt taaaaaattt taagatttac acaatgtttc tctgtaaata 2160
ttgccattaa atgtaaataa ctttaataaa acgtttatag cagttacaca gaatttcaat 2220
cctagtatat agtacctagt attataggta ctataaaccc taattttttt tatttaagta 2280
cattttgctt tttaaagttg atttttttct attgttttta gaaaaaataa aataactggc 2340
aaatatatca ttgagccaaa tcttaaaaaa aaaaaaaaa 2379
<210> 45
<211> 1669
<212> DNA
<213> Homo sapiens
<400> 45
gctcctgtca tcgaggcccc tggcccaatg gcaggctgag tccccctcct ctggcctggt 60
cccgcctctc ctgccccttg tgctcagcgc tacctgctgc ccggacacat ccagagctgg 120
ccgacgggtg cgcgggcggg cggcggcacc atgcagggaa gctgccaggg gccgtgggca 180
gcgccgcttt ctgccgccca cctggcgctg tgagactggc gctgccacca tgttccccag 240
ccctgctctc acgcccacgc ccttctcagt caaagacatc ctaaacctgg aacagcagca 300
gcgcagcctg gctgccgccg gagagctctc tgcccgcctg gaggcgaccc tggcgccctc 360
ctcctgcatg ctggccgcct tcaagccaga ggcctacgct gggcccgagg cggctgcgcc 420
gggcctccca gagctgcgcg cagagctggg ccgcgcgcct tcaccggcca agtgtgcgtc 480
tgcctttccc gccgcccccg ccttctatcc acgtgcctac agcgaccccg acccagccaa 540
ggaccctaga gccgaaaaga aagagctgtg cgcgctgcag aaggcggtgg agctggagaa 600
gacagaggcg gacaacgcgg agcggccccg ggcgcgacgg cggaggaagc cgcgcgtgct 660
cttctcgcag gcgcaggtct atgagctgga gcggcgcttc aagcagcagc ggtacctgtc 720
ggcccccgaa cgcgaccagc tggccagcgt gctgaaactc acgtccacgc aggtcaagat 780
ctggttccag aaccggcgct acaagtgcaa gcggcagcgg caggaccaga ctctggagct 840
ggtggggctg cccccgccgc cgccgccgcc tgcccgcagg atcgcggtgc cagtgctggt 900
gcgcgatggc aagccatgcc taggggactc ggcgccctac gcgcctgcct acggcgtggg 960
cctcaatccc tacggttata acgcctaccc cgcctatccg ggttacggcg gcgcggcctg 1020
cagccctggc tacagctgca ctgccgctta ccccgccggg ccttccccag cgcagccggc 1080
cactgccgcc gccaacaaca acttcgtgaa cttcggcgtc ggggacttga atgcggttca 1140
gagccccggg attccgcaga gcaactcggg agtgtccacg ctgcatggta tccgagcctg 1200
gtagggaagg gacccgcgtg gcgcgaccct gaccgatccc acctcaacag ctccctgact 1260
ctcgggggga gaaggggctc ccaacatgac cctgagtccc ctggattttg cattcactcc 1320
tgcggagacc taggaacttt ttctgtccca cgcgcgtttg ttcttgcgca cgggagagtt 1380
tgtggcggcg attatgcagc gtgcaatgag tgatcctgca gcctggtgtc ttagctgtcc 1440
ccccaggagt gccctccgag agtccatggg cacccccggt tggaactggg actgagctcg 1500
ggcacgcagg gcctgagatc tggccgccca ttccgcgagc cagggccggg cgcccgggcc 1560
tttgctatct cgccgtcgcc cgcccacgca cccacccgta tttatgtttt tacctattgc 1620
tgtaagaaat gacgatcccc ttcccattaa agagagtgcg ttgaccccg 1669
<210> 46
<211> 2086
<212> DNA
<213> Homo sapiens
<400> 46
ataagggctg gaggtgctgc tttcaggcct ggccagccca ccatgcacgc ccactgcctg 60
cccttccttc tgcacgcctg gtgggcccta ctccaggcgg gtgctgcgac ggtggccact 120
gcgctcctgc gtacgcgggg gcagccctcg tcgccatccc ctctggcgta catgctgagc 180
ctctaccgcg acccgctgcc gagggcagac atcatccgca gcctacaggc agaagatgtg 240
gcagtggatg ggcagaactg gacgtttgct tttgacttct ccttcctgag ccaacaagag 300
gatctggcat gggctgagct ccggctgcag ctgtccagcc ctgtggacct ccccactgag 360
ggctcacttg ccattgagat tttccaccag ccaaagcccg acacagagca ggcttcagac 420
agctgcttag agcggtttca gatggaccta ttcactgtca ctttgtccca ggtcaccttt 480
tccttgggca gcatggtttt ggaggtgacc aggcctctct ccaagtggct gaagcaccct 540
ggggccctgg agaagcagat gtccagggta gctggagagt gctggccgcg gccccccaca 600
ccgcctgcca ccaatgtgct ccttatgctc tactccaacc tctcgcagga gcagaggcag 660
ctgggtgggt ccaccttgct gtgggaagcc gagagctcct ggcgggccca ggagggacag 720
ctgtcctggg agtggggcaa gaggcaccgt cgacatcact tgccagacag aagtcaactg 780
tgtcggaagg tcaagttcca ggtggacttc aacctgatcg gatggggctc ctggatcatc 840
taccccaagc agtacaacgc ctatcgctgt gagggcgagt gtcctaatcc tgttggggag 900
gagtttcatc cgaccaacca tgcatacatc cagagtctgc tgaaacgtta ccagccccac 960
cgagtccctt ccacttgttg tgccccagtg aagaccaagc cgctgagcat gctgtatgtg 1020
gataatggca gagtgctcct agatcaccat aaagacatga tcgtggaaga atgtgggtgc 1080
ctctgatgac atcctggagg gagactggat ttgcctgcac tctggaaggc tgggaaactc 1140
ctggaagaca tgataaccat ctaatccagt aaggagaaac agagaggggc aaagttgctc 1200
tgcccaccag aactgaagag gaggggctgc ccactctgta aatgaagggc tcagtggagt 1260
ctggccaagc acagaggctg ctgtcaggaa gagggaggaa gaagcctgtg cagggggctg 1320
gctggatgtt ctctttactg aaaagacagt ggcaaggaaa agcacaagtg catgagttct 1380
ttactggatt ttttaaaaac ctgtgaaccc cccgaaactg tatgtgaaag ttgagacata 1440
tgtgcatgta ttttggaggt gggatgaagt cacctatagc tttcatgtat tctccaaagt 1500
agtctgtgtg tgacctgtcc ccctccccaa agattaagga tcactgtata gattaaaaag 1560
agtccgtcaa tctcattgcc tcaggctggg ttgggggagc cccacagctt tctggctggc 1620
cagtggcaat ctactggcct tgtccagagg ctcactggag tggttctctg ctaatgagct 1680
gtacaacaat aaagccattg tctagttctc ctgggccagc tggtgcctgt gaaggcagag 1740
gcaggaactc atccaagagg accggccatg ttgggttaca gaagacatcc ctgcgtcagt 1800
ctgcttcggc agacacagcc tgagtttgtt aaagttggtg acaatccacc tcagtctctc 1860
aatgtgtgct attaatgagg cctctgagct tcctatccag cagtggtgaa ggccttgccc 1920
tgggtggcaa gatacttgct ctatggtcac agctcagcca ctggaagctg tgcgacctca 1980
ggtgagcaat tcactgtcca gtctccactt gtaaaaggaa cgctggtgaa tcctaatgca 2040
ttcatattaa atgtctgttg tcaggctcag aagagccatg agcttt 2086
<210> 47
<211> 3039
<212> DNA
<213> Homo sapiens
<400> 47
aataaagcgt gaacccgtcc gtccggctcg cactttaaga cttcccgagc ggcggcgggg 60
acgccagtcg agccgggaga cgcttacctg ccgcttcccc gcgccgcccg gtgcacctgg 120
ccgcaaggga cctcgttctc agggaagacg gcgacattcc gcggaggtgg aaccgccgcg 180
cgccgtccgg gctcggacct tccccggaac gtgggggcgc cttagcgact ccttccctgt 240
tgtgcccccg ttcccggcgt tcagcccggc cccgcaaagg tgggacggct cccggcttca 300
gttacggaag cggcccgtgt ccagcgacga gggttcgaaa atgccccgcg cgttcctggt 360
gaagaagccg tgcgtctcca cgtgcaagag gaactggagc gagctccccg acgaggagcg 420
cggcgagatc tacgtgccag tcagcctggg cttctgccca ccacagccct accgggagcc 480
ggaaccctct gtggccgaac ccccttcctg cccgctggct ttgaacatga gccttcgaga 540
ctctagctac agcatggccc ccgggccctg tgtggtggcc cagctgccct ctgaagacat 600
gggccacttg acagaccccc agagcagaga ccatggcttc ctgcgcacca agatgaaggt 660
gacccttggg gacagtccca gtggagacct gttcacctgc cgtgtctgcc agaaggcctt 720
cacctaccag cgcatgctga accgccacat gaagtgtcac aacgacgtca agaggcacct 780
ctgcacgtac tgcgggaagg gcttcaatga caccttcgac ctcaagagac acgtccgaac 840
tcacactggc gtgcggccct acaagtgcag cctgtgtgac aaggccttca cgcagcgctg 900
ctctctggag tctcacctca agaagatcca tggtgtgcag cagaagtacg cgtacaagga 960
gcggcgggcc aagctgtacg tgtgtgagga gtgcggctgc acatctgaga gccaggaggg 1020
ccacgtcctg cacctgaagg agcaccaccc tgacagcccg ctgctgcgca agacctccaa 1080
gaaggtggcc gtggcactac agaacactgt cacttccctg ctgcagggca gcccccacct 1140
gtgagtggct cgagccctgg gggtgctcct ggaagcccca agagcatcca ggattgcctc 1200
ccagctgcct ggccagccca ccctcctgca acctctcacc cgaacaccag tgatcaggac 1260
tggagccccc gtgccttggt ctcccccctg ggcacacgtg ctcactcagg cccagcaatg 1320
acctctgctc atttttgcat ttttgactta tgggccgagg ctgttctgag cctgggaaga 1380
tgtacctatg tcaagagaag ggatgaggcc aaggctgcct tcaattagaa gcagccgccc 1440
acagagacag gcactgtgtg cctggcagca ggacttccta cccagaggag gttcgagcta 1500
ggatcccact gcccccgcct ctcagcacag ggcaggggct gcaggtcccc agtggacatc 1560
agagtcaaaa gcactggcaa agggtacccc tgcaaacaac tgtggtgggg gctggcagca 1620
gaccccccac ctggcagggc ttctaatgct cagggttctg gagggctctg tccttccggc 1680
aaggagaggc acacatgtgt gcccagccgt gtgtgtgcgt gtgcttgtgt gtgtgcactg 1740
ctgtgtgtgt gtgcacgcac aggaagcctt tccacatatc acctcatttc taagaaataa 1800
actacaaggt gccaagaagg ttttatttcc ttttattttt taaagatgac aaatgtacag 1860
atgttaatat atttttggtg ccaatggcga tgtttttaag agtgggatgg agctggcttt 1920
tctccattcc cgtgcgcttc tatttatcct ggacatttca aacctcctct gtgccttggc 1980
tctgggcggg ggctgcccca acccaccccc gttctttgta cgtgctgaga cagccactag 2040
aagatcttcc tccagcggcg ccctggacgg ctgctcctgc gaacagccca tggcatcttc 2100
tgctcttccc tcccggctct gccctgcaca tcctgttgag ccaagcccca gtgacccgga 2160
gagctggcct gatgctgaga gtgtgtcctc ctggggcttt agggggcagg aaggtgggac 2220
gaatgacgat gcccatccac tacctgaagc actaggacac tcttgcaggg ccaggctgga 2280
agaccggccc ttttcttggt tgagtcaaaa gccttagcac agtggcaaaa aatgggacag 2340
aatgatgacc agcacctcag aaacttccag agggaggaga ggatttgatg gctaccaaat 2400
tgtatctgtt gccttttttc tgactttttc acctgaccag gctggggttt ggagtggctg 2460
tggggagacc cgtcctggct ggctggctgg ctcccttgct cccttgctgc agctgggaaa 2520
ggggttctgg gtgtaaagag gtgtgcgtct tgtgggccaa agggaaaaac aggcaggggt 2580
cagagccagc ctgccagagg caaatgcaaa agaggtcccc agaacacagc cagctgggca 2640
gccccttaaa gccaaacccc acctgaagca gaaccacttt ggcctcccct gcccaaaatg 2700
ggtagtgtct acacgtcccc gggctcaggc tcaggcccag ccctgggctg acctgagagg 2760
aaggctcctt cctggactgc cctctgaaat gtgtatagat tgattctaaa atctcttgtt 2820
tcacttgact ttagagtgtc tgggacgctg ctgtattctg aaagtcacat agcacacagt 2880
aatgttatct ggaagctctg tttttgttta catttctgta tccctgggtt gactgccaat 2940
ccgaggccgt catgaagctc tgtgttgtct gttttatttt ataaccttcc tctcaactat 3000
taaaattaga gatctaatgt ttaaaaaaaa aaaaaaaaa 3039
<210> 48
<211> 3393
<212> DNA
<213> Homo sapiens
<400> 48
cctgcctgcc tccctgcgca cccgcagcct cccccgctgc ctccctaggg ctcccctccg 60
gccgccagcg cccatttttc attccctaga tagagatact ttgcgcgcac acacatacat 120
acgcgcgcaa aaaggaaaaa aaaaaaaaaa agcccaccct ccagcctcgc tgcaaagaga 180
aaaccggagc agccgcagct cgcagctcgc agctcgcagc ccgcagcccg cagaggacgc 240
ccagagcggc gagcgggcgg gcagacggac cgacggactc gcgccgcgtc cacctgtcgg 300
ccgggcccag ccgagcgcgc agcgggcacg ccgcgcgcgc ggagcagccg tgcccgccgc 360
ccgggccccg cgccagggcg cacacgctcc cgccccccta cccggcccgg gcgggagttt 420
gcacctctcc ctgcccgggt gctcgagctg ccgttgcaaa gccaactttg gaaaaagttt 480
tttgggggag acttgggcct tgaggtgccc agctccgcgc tttccgattt tgggggcctt 540
tccagaaaat gttgcaaaaa agctaagccg gcgggcagag gaaaacgcct gtagccggcg 600
agtgaagacg aaccatcgac tgccgtgttc cttttcctct tggaggttgg agtcccctgg 660
gcgcccccac acggctagac gcctcggctg gttcgcgacg cagccccccg gccgtggatg 720
ctcactcggg ctcgggatcc gcccaggtag cggcctcgga cccaggtcct gcgcccaggt 780
cctcccctgc cccccagcga cggagccggg gccgggggcg gcggcgcccg ggggccatgc 840
gggtgagccg cggctgcaga ggcctgagcg cctgatcgcc gcggacccga gccgagccca 900
cccccctccc cagcccccca ccctggccgc gggggcggcg cgctcgatct acgcgtccgg 960
ggccccgcgg ggccgggccc ggagtcggca tgaatcgctg ctgggcgctc ttcctgtctc 1020
tctgctgcta cctgcgtctg gtcagcgccg agggggaccc cattcccgag gagctttatg 1080
agatgctgag tgaccactcg atccgctcct ttgatgatct ccaacgcctg ctgcacggag 1140
accccggaga ggaagatggg gccgagttgg acctgaacat gacccgctcc cactctggag 1200
gcgagctgga gagcttggct cgtggaagaa ggagcctggg ttccctgacc attgctgagc 1260
cggccatgat cgccgagtgc aagacgcgca ccgaggtgtt cgagatctcc cggcgcctca 1320
tagaccgcac caacgccaac ttcctggtgt ggccgccctg tgtggaggtg cagcgctgct 1380
ccggctgctg caacaaccgc aacgtgcagt gccgccccac ccaggtgcag ctgcgacctg 1440
tccaggtgag aaagatcgag attgtgcgga agaagccaat ctttaagaag gccacggtga 1500
cgctggaaga ccacctggca tgcaagtgtg agacagtggc agctgcacgg cctgtgaccc 1560
gaagcccggg gggttcccag gagcagcgag ccaaaacgcc ccaaactcgg gtgaccattc 1620
ggacggtgcg agtccgccgg ccccccaagg gcaagcaccg gaaattcaag cacacgcatg 1680
acaagacggc actgaaggag acccttggag cctaggggca tcggcaggag agtgtgtggg 1740
cagggttatt taatatggta tttgctgtat tgcccccatg gggtccttgg agtgataata 1800
ttgtttccct cgtccgtctg tctcgatgcc tgattcggac ggccaatggt gcttccccca 1860
cccctccacg tgtccgtcca cccttccatc agcgggtctc ctcccagcgg cctccggcgt 1920
cttgcccagc agctcaagaa gaaaaagaag gactgaactc catcgccatc ttcttccctt 1980
aactccaaga acttgggata agagtgtgag agagactgat ggggtcgctc tttgggggaa 2040
acgggctcct tcccctgcac ctggcctggg ccacacctga gcgctgtgga ctgtcctgag 2100
gagccctgag gacctctcag catagcctgc ctgatccctg aacccctggc cagctctgag 2160
gggaggcacc tccaggcagg ccaggctgcc tcggactcca tggctaagac cacagacggg 2220
cacacagact ggagaaaacc cctcccacgg tgcccaaaca ccagtcacct cgtctccctg 2280
gtgcctctgt gcacagtggc ttcttttcgt tttcgttttg aagacgtgga ctcctcttgg 2340
tgggtgtggc cagcacacca agtggctggg tgccctctca ggtgggttag agatggagtt 2400
tgctgttgag gtggctgtag atggtgacct gggtatcccc tgcctcctgc caccccttcc 2460
tccccacact ccactctgat tcacctcttc ctctggttcc tttcatctct ctacctccac 2520
cctgcatttt cctcttgtcc tggcccttca gtctgctcca ccaaggggct cttgaacccc 2580
ttattaaggc cccagatgat cccagtcact cctctctagg gcagaagact agaggccagg 2640
gcagcaaggg acctgctcat catattccaa cccagccacg actgccatgt aaggttgtgc 2700
agggtgtgta ctgcacaagg acattgtatg cagggagcac tgttcacatc atagataaag 2760
ctgatttgta tatttattat gacaatttct ggcagatgta ggtaaagagg aaaaggatcc 2820
ttttcctaat tcacacaaag actccttgtg gactggctgt gcccctgatg cagcctgtgg 2880
cttggagtgg ccaaatagga gggagactgt ggtaggggca gggaggcaac actgctgtcc 2940
acatgacctc catttcccaa agtcctctgc tccagcaact gcccttccag gtgggtgtgg 3000
gacacctggg agaaggtctc caagggaggg tgcagccctc ttgcccgcac ccctccctgc 3060
ttgcacactt ccccatcttt gatccttctg agctccacct ctggtggctc ctcctaggaa 3120
accagctcgt gggctgggaa tgggggagag aagggaaaag atccccaaga ccccctgggg 3180
tgggatctga gctcccacct cccttcccac ctactgcact ttcccccttc ccgccttcca 3240
aaacctgctt ccttcagttt gtaaagtcgg tgattatatt tttgggggct ttccttttat 3300
tttttaaatg taaaatttat ttatattccg tatttaaagt tgtaaaaaaa aataaccaca 3360
aaacaaaacc aaatgaaaaa aaaaaaaaaa aaa 3393
<210> 49
<211> 4934
<212> DNA
<213> Homo sapiens
<400> 49
aaacccgatc tccttggact tgaatgagga ggaggaggcg gcggcggcgg cggcggcgga 60
ggcgctcggc tggggaaagc tagcggcaga ggctcagccc cggcggcagc gcgcgccccg 120
ctgccagccc attttccgga cgccacccgc gggcactgcc gacgcccccg gggctgccga 180
ggggaggccg ggggggcgca gcggagcgcg gtcccgcgca ctgagccccg cggcgccccg 240
ggaacttggc ggcgacccga gcccggcgag ccggggcgcg cctcccccgc cgcgcgcctc 300
ctgcatgcgg ggccccagct ccgggcgccg gccggagccc cccccggccg cccccgagcc 360
ccccgcgccc cgcgccgcgc cgccgcgccg tccatgcacc gcttgatggg ggtcaacagc 420
accgccgccg ccgccgccgg gcagcccaat gtctcctgca cgtgcaactg caaacgctct 480
ttgttccaga gcatggagat cacggagctg gagtttgttc agatcatcat catcgtggtg 540
gtgatgatgg tgatggtggt ggtgatcacg tgcctgctga gccactacaa gctgtctgca 600
cggtccttca tcagccggca cagccagggg cggaggagag aagatgccct gtcctcagaa 660
ggatgcctgt ggccctcgga gagcacagtg tcaggcaacg gaatcccaga gccgcaggtc 720
tacgccccgc ctcggcccac cgaccgcctg gccgtgccgc ccttcgccca gcgggagcgc 780
ttccaccgct tccagcccac ctatccgtac ctgcagcacg agatcgacct gccacccacc 840
atctcgctgt cagacgggga ggagccccca ccctaccagg gcccctgcac cctccagctt 900
cgggaccccg agcagcagct ggaactgaac cgggagtcgg tgcgcgcacc cccaaacaga 960
accatcttcg acagtgacct gatggatagt gccaggctgg gcggcccctg cccccccagc 1020
agtaactcgg gcatcagcgc cacgtgctac ggcagcggcg ggcgcatgga ggggccgccg 1080
cccacctaca gcgaggtcat cggccactac ccggggtcct ccttccagca ccagcagagc 1140
agtgggccgc cctccttgct ggaggggacc cggctccacc acacacacat cgcgccccta 1200
gagagcgcag ccatctggag caaagagaag gataaacaga aaggacaccc tctctagggt 1260
ccccaggggg gccgggctgg ggctgcgtag gtgaaaaggc agaacactcc gcgcttctta 1320
gaagaggagt gagaggaagg cggggggcgc agcaacgcat cgtgtggccc tcccctccca 1380
cctccctgtg tataaatatt tacatgtgat gtctggtctg aatgcacaag ctaagagagc 1440
ttgcaaaaaa aaaaagaaaa aagaaaaaaa aaaaccacgt ttctttgttg agctgtgtct 1500
tgaaggcaaa agaaaaaaaa tttctacagt agtctttctt gtttctagtt gagctgcgtg 1560
cgtgaatgct tattttcttt tgtttatgat aatttcactt aactttaaag acatatttgc 1620
acaaaacctt tgtttaaaga tctgcaatat tatatatata aatatatata agataagaga 1680
aactgtatgt gcgagggcag gagtattttt gtattagaag aggcctatta aaaaaaaaag 1740
ttgttttctg aactagaaga ggaaaaaaat ggcaattttt gagtgccaag tcagaaagtg 1800
tgtattacct tgtaaagaaa aaaattacaa agcaggggtt tagagttatt tatataaatg 1860
ttgagatttt gcactatttt ttaatataaa tatgtcagtg cttgcttgat ggaaacttct 1920
cttgtgtctg ttgagacttt aagggagaaa tgtcggaatt tcagagtcgc ctgacggcag 1980
agggtgagcc cccgtggagt ctgcagagag gccttggcca ggagcggcgg gctttcccga 2040
ggggccactg tccctgcaga gtggatgctt ctgcctagtg acaggttatc accacgttat 2100
atattcccta ccgaaggaga caccttttcc cccctgaccc agaacagcct ttaaatcaca 2160
agcaaaatag gaaagttaac cacggaggca ccgagttcca ggtagtggtt ttgcctttcc 2220
caaaaatgaa aataaactgt taccgaagga attagttttt cctcttcttt tttccaactg 2280
tgaaggtccc cgtggggtgg agcatggtgc ccctcacaag ccgcagcggc tggtgcccgg 2340
gctaccaggg acatgccaga gggctcgatg acttgtctct gcagggcgct ttggtggttg 2400
ttcagctggc taaaggttca ccggtgaagg caggtgcggt aactgccgca ctggacccta 2460
ggaagcccca ggtattcgca atctgacctc ctcctgtctg tttcccttca cggatcaatt 2520
ctcacttaag aggccaataa acaacccaac atgaaaaggt gacaagcctg ggtttctccc 2580
aggataggtg aaagggttaa aatgagtaaa gcagttgagc aaacaccaac ccgagcttcg 2640
ggcgcagaat tcttcacctt ctcttcccct ttccatctcc tttccccgcg gaaacaacgc 2700
ttcccttctg gtgtgtctgt tgatctgtgt tttcatttac atctctctta gactccgctc 2760
ttgttctcca ggttttcacc agatagattt ggggttggcg ggacctgctg gtgacgtgca 2820
ggtgaaggac aggaaggggc atgtgagcgt aaatagaggt gaccagagga gagcatgagg 2880
ggtggggctt tgggacccac cggggccagt ggctggagct tgacgtcttt cctccccatg 2940
ggggtgggag ggcccccagc tggaagagca gactcccagc tgctaccccc tcccttccca 3000
tgggagtggc tttccatttt gggcagaatg ctgactagta gactaacata aaagatataa 3060
aaggcaataa ctattgtttg tgagcaactt ttttataact tccaaaacaa aaacctgagc 3120
acagttttga agttctagcc actcgagctc atgcatgtga aacgtgtgct ttacgaaggt 3180
ggcagctgac agacgtgggc tctgcatgcc gccagcctag tagaaagttc tcgttcattg 3240
gcaacagcag aacctgcctc tccgtgaagt cgtcagccta aaatttgttt ctctcttgaa 3300
gaggattctt tgaaaaggtc ctgcagagaa atcagtacag gttatcccga aaggtacaag 3360
gacgcacttg taaagatgat taaaacgtat ctttccttta tgtgacgcgt ctctagtgcc 3420
ttactgaaga agcagtgaca ctcccgtcgc tcggtgagga cgttcccgga cagtgcctca 3480
ctcacctggg actggtatcc cctcccaggg tccaccaagg gctcctgctt ttcagacacc 3540
ccatcatcct cgcgcgtcct caccctgtct ctaccaggga ggtgcctagc ttggtgaggt 3600
tactcctgct cctccaacct ttttttgcca aggtttgtac acgactccca tctaggctga 3660
aaacctagaa gtggaccttg tgtgtgtgca tggtgtcagc ccaaagccag gctgagacag 3720
tcctcatatc ctcttgagcc aaactgtttg ggtctcgttg cttcatggta tggtctggat 3780
ttgtgggaat ggctttgcgt gagaaagggg aggagagtgg ttgctgccct cagccggctt 3840
gaggacagag cctgtccctc tcatgacaac tcagtgttga agcccagtgt cctcagcttc 3900
atgtccagtg gatggcagaa gttcatgggg tagtggcctc tcaaaggctg ggcgcatccc 3960
aagacagcca gcaggttgtc tctggaaacg accagagtta agctctcggc ttctctgctg 4020
agggtgcacc ctttcctcta gatggtagtt gtcacgttat ctttgaaaac tcttggactg 4080
ctcctgagga ggccctcttt tccagtagga agttagatgg gggttctcag aagtggctga 4140
ttggaagggg acaagcttcg tttcaggggt ctgccgttcc atcctggttc agagaaggcc 4200
gagcgtggct ttctctagcc ttgtcactgt ctccctgcct gtcaatcacc acctttcctc 4260
cagaggagga aaattatctc ccctgcaaag cccggttcta cacagatttc acaaattgtg 4320
ctaagaaccg tccgtgttct cagaaagccc agtgtttttg caaagaatga aaagggaccc 4380
catatgtagc aaaaatcagg gctgggggag agccgggttc attccctgtc ctcattggtc 4440
gtccctatga attgtacgtt tcagagaaat tttttttcct atgtgcaaca cgaagcttcc 4500
agaaccataa aatatcccgt cgataaggaa agaaaatgtc gttgttgttg tttttctgga 4560
aactgcttga aatcttgctg tactatagag ctcagaagga cacagcccgt cctcccctgc 4620
ctgcctgatt ccatggctgt tgtgctgatt ccaatgcttt cacgttggtt cctggcgtgg 4680
gaactgctct cctttgcagc cccatttccc aagctctgtt caagttaaac ttatgtaagc 4740
tttccgtggc atgcggggcg cgcacccacg tccccgctgc gtaagactct gtatttggat 4800
gccaatccac aggcctgaag aaactgcttg ttgtgtatca gtaatcatta gtggcaatga 4860
tgacattctg aaaagctgca atacttatac aataaatttt acaattcttt ggaatgagaa 4920
aaaaaaaaaa aaaa 4934
<210> 50
<211> 1818
<212> DNA
<213> Homo sapiens
<400> 50
ggcgcccgcg cccgcccccg cgccgggccc ggctcggccc gacccggctc cgccgcgggc 60
aggcggggcc cagcgcactc ggagcccgag cccgagccgc agccgccgcc tggggcgctt 120
gggtcggcct cgaggacacc ggagaggggc gccacgccgc cgtggccgca gaaatgacca 180
tggttgacac agagatgcca ttctggccca ccaactttgg gatcagctcc gtggatctct 240
ccgtaatgga agaccactcc cactcctttg atatcaagcc cttcactact gttgacttct 300
ccagcatttc tactccacat tacgaagaca ttccattcac aagaacagat ccagtggttg 360
cagattacaa gtatgacctg aaacttcaag agtaccaaag tgcaatcaaa gtggagcctg 420
catctccacc ttattattct gagaagactc agctctacaa taagcctcat gaagagcctt 480
ccaactccct catggcaatt gaatgtcgtg tctgtggaga taaagcttct ggatttcact 540
atggagttca tgcttgtgaa ggatgcaagg gtttcttccg gagaacaatc agattgaagc 600
ttatctatga cagatgtgat cttaactgtc ggatccacaa aaaaagtaga aataaatgtc 660
agtactgtcg gtttcagaaa tgccttgcag tggggatgtc tcataatgcc atcaggtttg 720
ggcggatgcc acaggccgag aaggagaagc tgttggcgga gatctccagt gatatcgacc 780
agctgaatcc agagtccgct gacctccggg ccctggcaaa acatttgtat gactcataca 840
taaagtcctt cccgctgacc aaagcaaagg cgagggcgat cttgacagga aagacaacag 900
acaaatcacc attcgttatc tatgacatga attccttaat gatgggagaa gataaaatca 960
agttcaaaca catcaccccc ctgcaggagc agagcaaaga ggtggccatc cgcatctttc 1020
agggctgcca gtttcgctcc gtggaggctg tgcaggagat cacagagtat gccaaaagca 1080
ttcctggttt tgtaaatctt gacttgaacg accaagtaac tctcctcaaa tatggagtcc 1140
acgagatcat ttacacaatg ctggcctcct tgatgaataa agatggggtt ctcatatccg 1200
agggccaagg cttcatgaca agggagtttc taaagagcct gcgaaagcct tttggtgact 1260
ttatggagcc caagtttgag tttgctgtga agttcaatgc actggaatta gatgacagcg 1320
acttggcaat atttattgct gtcattattc tcagtggaga ccgcccaggt ttgctgaatg 1380
tgaagcccat tgaagacatt caagacaacc tgctacaagc cctggagctc cagctgaagc 1440
tgaaccaccc tgagtcctca cagctgtttg ccaagctgct ccagaaaatg acagacctca 1500
gacagattgt cacggaacac gtgcagctac tgcaggtgat caagaagacg gagacagaca 1560
tgagtcttca cccgctcctg caggagatct acaaggactt gtactagcag agagtcctga 1620
gccactgcca acatttccct tcttccagtt gcactattct gagggaaaat ctgacaccta 1680
agaaatttac tgtgaaaaag cattttaaaa agaaaaggtt ttagaatatg atctatttta 1740
tgcatattgt ttataaagac acatttacaa tttactttta atattaaaaa ttaccatatt 1800
atgaaattgc tgatagta 1818
<210> 51
<211> 4507
<212> DNA
<213> Homo sapiens
<400> 51
gaccaattgt catacgactt gcagtgagcg tcaggagcac gtccaggaac tcctcagcag 60
cgcctccttc agctccacag ccagacgccc tcagacagca aagcctaccc ccgcgccgcg 120
ccctgcccgc cgctgcgatg ctcgcccgcg ccctgctgct gtgcgcggtc ctggcgctca 180
gccatacagc aaatccttgc tgttcccacc catgtcaaaa ccgaggtgta tgtatgagtg 240
tgggatttga ccagtataag tgcgattgta cccggacagg attctatgga gaaaactgct 300
caacaccgga atttttgaca agaataaaat tatttctgaa acccactcca aacacagtgc 360
actacatact tacccacttc aagggatttt ggaacgttgt gaataacatt cccttccttc 420
gaaatgcaat tatgagttat gtgttgacat ccagatcaca tttgattgac agtccaccaa 480
cttacaatgc tgactatggc tacaaaagct gggaagcctt ctctaacctc tcctattata 540
ctagagccct tcctcctgtg cctgatgatt gcccgactcc cttgggtgtc aaaggtaaaa 600
agcagcttcc tgattcaaat gagattgtgg aaaaattgct tctaagaaga aagttcatcc 660
ctgatcccca gggctcaaac atgatgtttg cattctttgc ccagcacttc acgcatcagt 720
ttttcaagac agatcataag cgagggccag ctttcaccaa cgggctgggc catggggtgg 780
acttaaatca tatttacggt gaaactctgg ctagacagcg taaactgcgc cttttcaagg 840
atggaaaaat gaaatatcag ataattgatg gagagatgta tcctcccaca gtcaaagata 900
ctcaggcaga gatgatctac cctcctcaag tccctgagca tctacggttt gctgtggggc 960
aggaggtctt tggtctggtg cctggtctga tgatgtatgc cacaatctgg ctgcgggaac 1020
acaacagagt atgcgatgtg cttaaacagg agcatcctga atggggtgat gagcagttgt 1080
tccagacaag caggctaata ctgataggag agactattaa gattgtgatt gaagattatg 1140
tgcaacactt gagtggctat cacttcaaac tgaaatttga cccagaacta cttttcaaca 1200
aacaattcca gtaccaaaat cgtattgctg ctgaatttaa caccctctat cactggcatc 1260
cccttctgcc tgacaccttt caaattcatg accagaaata caactatcaa cagtttatct 1320
acaacaactc tatattgctg gaacatggaa ttacccagtt tgttgaatca ttcaccaggc 1380
aaattgctgg cagggttgct ggtggtagga atgttccacc cgcagtacag aaagtatcac 1440
aggcttccat tgaccagagc aggcagatga aataccagtc ttttaatgag taccgcaaac 1500
gctttatgct gaagccctat gaatcatttg aagaacttac aggagaaaag gaaatgtctg 1560
cagagttgga agcactctat ggtgacatcg atgctgtgga gctgtatcct gcccttctgg 1620
tagaaaagcc tcggccagat gccatctttg gtgaaaccat ggtagaagtt ggagcaccat 1680
tctccttgaa aggacttatg ggtaatgtta tatgttctcc tgcctactgg aagccaagca 1740
cttttggtgg agaagtgggt tttcaaatca tcaacactgc ctcaattcag tctctcatct 1800
gcaataacgt gaagggctgt ccctttactt cattcagtgt tccagatcca gagctcatta 1860
aaacagtcac catcaatgca agttcttccc gctccggact agatgatatc aatcccacag 1920
tactactaaa agaacgttcg actgaactgt agaagtctaa tgatcatatt tatttattta 1980
tatgaaccat gtctattaat ttaattattt aataatattt atattaaact ccttatgtta 2040
cttaacatct tctgtaacag aagtcagtac tcctgttgcg gagaaaggag tcatacttgt 2100
gaagactttt atgtcactac tctaaagatt ttgctgttgc tgttaagttt ggaaaacagt 2160
ttttattctg ttttataaac cagagagaaa tgagttttga cgtcttttta cttgaatttc 2220
aacttatatt ataagaacga aagtaaagat gtttgaatac ttaaacactg tcacaagatg 2280
gcaaaatgct gaaagttttt acactgtcga tgtttccaat gcatcttcca tgatgcatta 2340
gaagtaacta atgtttgaaa ttttaaagta cttttggtta tttttctgtc atcaaacaaa 2400
aacaggtatc agtgcattat taaatgaata tttaaattag acattaccag taatttcatg 2460
tctacttttt aaaatcagca atgaaacaat aatttgaaat ttctaaattc atagggtaga 2520
atcacctgta aaagcttgtt tgatttctta aagttattaa acttgtacat ataccaaaaa 2580
gaagctgtct tggatttaaa tctgtaaaat cagtagaaat tttactacaa ttgcttgtta 2640
aaatatttta taagtgatgt tcctttttca ccaagagtat aaaccttttt agtgtgactg 2700
ttaaaacttc cttttaaatc aaaatgccaa atttattaag gtggtggagc cactgcagtg 2760
ttatcttaaa ataagaatat tttgttgaga tattccagaa tttgtttata tggctggtaa 2820
catgtaaaat ctatatcagc aaaagggtct acctttaaaa taagcaataa caaagaagaa 2880
aaccaaatta ttgttcaaat ttaggtttaa acttttgaag caaacttttt tttatccttg 2940
tgcactgcag gcctggtact cagattttgc tatgaggtta atgaagtacc aagctgtgct 3000
tgaataatga tatgttttct cagattttct gttgtacagt ttaatttagc agtccatatc 3060
acattgcaaa agtagcaatg acctcataaa atacctcttc aaaatgctta aattcatttc 3120
acacattaat tttatctcag tcttgaagcc aattcagtag gtgcattgga atcaagcctg 3180
gctacctgca tgctgttcct tttcttttct tcttttagcc attttgctaa gagacacagt 3240
cttctcatca cttcgtttct cctattttgt tttactagtt ttaagatcag agttcacttt 3300
ctttggactc tgcctatatt ttcttacctg aacttttgca agttttcagg taaacctcag 3360
ctcaggactg ctatttagct cctcttaaga agattaaaag agaaaaaaaa aggccctttt 3420
aaaaatagta tacacttatt ttaagtgaaa agcagagaat tttatttata gctaatttta 3480
gctatctgta accaagatgg atgcaaagag gctagtgcct cagagagaac tgtacggggt 3540
ttgtgactgg aaaaagttac gttcccattc taattaatgc cctttcttat ttaaaaacaa 3600
aaccaaatga tatctaagta gttctcagca ataataataa tgacgataat acttcttttc 3660
cacatctcat tgtcactgac atttaatggt actgtatatt acttaattta ttgaagatta 3720
ttatttatgt cttattagga cactatggtt ataaactgtg tttaagccta caatcattga 3780
tttttttttg ttatgtcaca atcagtatat tttctttggg gttacctctc tgaatattat 3840
gtaaacaatc caaagaaatg attgtattaa gatttgtgaa taaattttta gaaatctgat 3900
tggcatattg agatatttaa ggttgaatgt ttgtccttag gataggccta tgtgctagcc 3960
cacaaagaat attgtctcat tagcctgaat gtgccataag actgaccttt taaaatgttt 4020
tgagggatct gtggatgctt cgttaatttg ttcagccaca atttattgag aaaatattct 4080
gtgtcaagca ctgtgggttt taatattttt aaatcaaacg ctgattacag ataatagtat 4140
ttatataaat aattgaaaaa aattttcttt tgggaagagg gagaaaatga aataaatatc 4200
attaaagata actcaggaga atcttcttta caattttacg tttagaatgt ttaaggttaa 4260
gaaagaaata gtcaatatgc ttgtataaaa cactgttcac tgtttttttt aaaaaaaaaa 4320
cttgatttgt tattaacatt gatctgctga caaaacctgg gaatttgggt tgtgtatgcg 4380
aatgtttcag tgcctcagac aaatgtgtat ttaacttatg taaaagataa gtctggaaat 4440
aaatgtctgt ttatttttgt actatttaaa aattgacaga tcttttctga agaaaaaaaa 4500
aaaaaaa 4507
<210> 52
<211> 1331
<212> DNA
<213> Homo sapiens
<400> 52
cctgcatctt tttggaagga ttctttttat aaatcagaaa gtgttcgagg ttcaaaggtt 60
tgcctcggag cgtgtgaaca ttcctccgct cggttttcaa ctcgcctcca acctgcgccg 120
cccggccagc atgtctcccc gcccgtgaag cggggctgcc gcctccctgc cgctccggct 180
gccactaacg acccgccctc gccgccacct ggccctcctg atcgacgaca cacgcacttg 240
aaacttgttc tcagggtgtg tggaatcaac tttccggaag caaccagccc accagaggag 300
gtcccgagcg cgagcggaga cgatgcagcg gagactggtt cagcagtgga gcgtcgcggt 360
gttcctgctg agctacgcgg tgccctcctg cgggcgctcg gtggagggtc tcagccgccg 420
cctcaaaaga gctgtgtctg aacatcagct cctccatgac aaggggaagt ccatccaaga 480
tttacggcga cgattcttcc ttcaccatct gatcgcagaa atccacacag ctgaaatcag 540
agctacctcg gaggtgtccc ctaactccaa gccctctccc aacacaaaga accaccccgt 600
ccgatttggg tctgatgatg agggcagata cctaactcag gaaactaaca aggtggagac 660
gtacaaagag cagccgctca agacacctgg gaagaaaaag aaaggcaagc ccgggaaacg 720
caaggagcag gaaaagaaaa aacggcgaac tcgctctgcc tggttagact ctggagtgac 780
tgggagtggg ctagaagggg accacctgtc tgacacctcc acaacgtcgc tggagctcga 840
ttcacggagg cattgaaatt ttcagcagag accttccaag gacatattgc aggattctgt 900
aatagtgaac atatggaaag tattagaaat atttattgtc tgtaaatact gtaaatgcat 960
tggaataaaa ctgtctcccc cattgctcta tgaaactgca cattggtcat tgtgaatatt 1020
ttttttttgc caaggctaat ccaattatta ttatcacatt taccataatt tattttgtcc 1080
attgatgtat ttattttgta aatgtatctt ggtgctgctg aatttctata ttttttgtaa 1140
cataatgcac tttagatata catatcaagt atgttgataa atgacacaat gaagtgtctc 1200
tattttgtgg ttgattttaa tgaatgccta aatataatta tccaaattga ttttcctttg 1260
tgcatgtaaa aataacagta ttttaaattt gtaaagaatg tctaataaaa tataatctaa 1320
ttacatcatg a 1331
<210> 53
<211> 3207
<212> DNA
<213> Homo sapiens
<400> 53
ggcccacaga ggagcacagc tgtgtttggc tgcagggcca agagcgctgt caagaagacc 60
cacacgcccc cctccagcag ctgaattcct gcagctcagc agccgccgcc agagcaggac 120
gaaccgccaa tcgcaaggca cctctgagaa cttcaggatg cagatgtctc cagccctcac 180
ctgcctagtc ctgggcctgg cccttgtctt tggtgaaggg tctgctgtgc accatccccc 240
atcctacgtg gcccacctgg cctcagactt cggggtgagg gtgtttcagc aggtggcgca 300
ggcctccaag gaccgcaacg tggttttctc accctatggg gtggcctcgg tgttggccat 360
gctccagctg acaacaggag gagaaaccca gcagcagatt caagcagcta tgggattcaa 420
gattgatgac aagggcatgg cccccgccct ccggcatctg tacaaggagc tcatggggcc 480
atggaacaag gatgagatca gcaccacaga cgcgatcttc gtccagcggg atctgaagct 540
ggtccagggc ttcatgcccc acttcttcag gctgttccgg agcacggtca agcaagtgga 600
cttttcagag gtggagagag ccagattcat catcaatgac tgggtgaaga cacacacaaa 660
aggtatgatc agcaacttgc ttgggaaagg agccgtggac cagctgacac ggctggtgct 720
ggtgaatgcc ctctacttca acggccagtg gaagactccc ttccccgact ccagcaccca 780
ccgccgcctc ttccacaaat cagacggcag cactgtctct gtgcccatga tggctcagac 840
caacaagttc aactatactg agttcaccac gcccgatggc cattactacg acatcctgga 900
actgccctac cacggggaca ccctcagcat gttcattgct gccccttatg aaaaagaggt 960
gcctctctct gccctcacca acattctgag tgcccagctc atcagccact ggaaaggcaa 1020
catgaccagg ctgccccgcc tcctggttct gcccaagttc tccctggaga ctgaagtcga 1080
cctcaggaag cccctagaga acctgggaat gaccgacatg ttcagacagt ttcaggctga 1140
cttcacgagt ctttcagacc aagagcctct ccacgtcgcg caggcgctgc agaaagtgaa 1200
gatcgaggtg aacgagagtg gcacggtggc ctcctcatcc acagctgtca tagtctcagc 1260
ccgcatggcc cccgaggaga tcatcatgga cagacccttc ctctttgtgg tccggcacaa 1320
ccccacagga acagtccttt tcatgggcca agtgatggaa ccctgaccct ggggaaagac 1380
gccttcatct gggacaaaac tggagatgca tcgggaaaga agaaactccg aagaaaagaa 1440
ttttagtgtt aatgactctt tctgaaggaa gagaagacat ttgccttttg ttaaaagatg 1500
gtaaaccaga tctgtctcca agaccttggc ctctccttgg aggaccttta ggtcaaactc 1560
cctagtctcc acctgagacc ctgggagaga agtttgaagc acaactccct taaggtctcc 1620
aaaccagacg gtgacgcctg cgggaccatc tggggcacct gcttccaccc gtctctctgc 1680
ccactcgggt ctgcagacct ggttcccact gaggcccttt gcaggatgga actacggggc 1740
ttacaggagc ttttgtgtgc ctggtagaaa ctatttctgt tccagtcaca ttgccatcac 1800
tcttgtactg cctgccaccg cggaggaggc tggtgacagg ccaaaggcca gtggaagaaa 1860
caccctttca tctcagagtc cactgtggca ctggccaccc ctccccagta caggggtgct 1920
gcaggtggca gagtgaatgt cccccatcat gtggcccaac tctcctggcc tggccatctc 1980
cctccccaga aacagtgtgc atgggttatt ttggagtgta ggtgacttgt ttactcattg 2040
aagcagattt ctgcttcctt ttatttttat aggaatagag gaagaaatgt cagatgcgtg 2100
cccagctctt caccccccaa tctcttggtg gggaggggtg tacctaaata tttatcatat 2160
ccttgccctt gagtgcttgt tagagagaaa gagaactact aaggaaaata atattattta 2220
aactcgctcc tagtgtttct ttgtggtctg tgtcaccgta tctcaggaag tccagccact 2280
tgactggcac acacccctcc ggacatccag cgtgacggag cccacactgc caccttgtgg 2340
ccgcctgaga ccctcgcgcc ccccgcgccc ctctttttcc ccttgatgga aattgaccat 2400
acaatttcat cctccttcag gggatcaaaa ggacggagtg gggggacaga gactcagatg 2460
aggacagagt ggtttccaat gtgttcaata gatttaggag cagaaatgca aggggctgca 2520
tgacctacca ggacagaact ttccccaatt acagggtgac tcacagccgc attggtgact 2580
cacttcaatg tgtcatttcc ggctgctgtg tgtgagcagt ggacacgtga ggggggggtg 2640
ggtgagagag acaggcagct cggattcaac taccttagat aatatttctg aaaacctacc 2700
agccagaggg tagggcacaa agatggatgt aatgcacttt gggaggccaa ggcgggagga 2760
ttgcttgagc ccaggagttc aagaccagcc tgggcaacat accaagaccc ccgtctcttt 2820
aaaaatatat atattttaaa tatacttaaa tatatatttc taatatcttt aaatatatat 2880
atatatttta aagaccaatt tatgggagaa ttgcacacag atgtgaaatg aatgtaatct 2940
aatagaagcc taatcagccc accatgttct ccactgaaaa atcctctttc tttggggttt 3000
ttctttcttt cttttttgat tttgcactgg acggtgacgt cagccatgta caggatccac 3060
aggggtggtg tcaaatgcta ttgaaattgt gttgaattgt atgctttttc acttttgata 3120
aataaacatg taaaaatgtt tcaaaaaaat aataaaataa ataaatacga agaatatgtc 3180
aggacagtca aaaaaaaaaa aaaaaaa 3207
<210> 54
<211> 2414
<212> DNA
<213> Homo sapiens
<400> 54
ttttttataa ggccgagcgc gcggcctggc gcagcatacg ccgagccggt ctttgagcgc 60
taacgtcttt ctgtctcccc gcggtggtga tgacggtgaa aactgaggct gctaagggca 120
ccctcactta ctccaggatg aggggcatgg tggcaattct catcgctttc atgaagcaga 180
ggaggatggg tctgaacgac tttattcaga agattgccaa taactcctat gcatgcaaac 240
accctgaagt tcagtccatc ttgaagatct cccaacctca ggagcctgag cttatgaatg 300
ccaacccttc tcctccacca agtccttctc agcaaatcaa ccttggcccg tcgtccaatc 360
ctcatgctaa accatctgac tttcacttct tgaaagtgat cggaaagggc agttttggaa 420
aggttcttct agcaagacac aaggcagaag aagtgttcta tgcagtcaaa gttttacaga 480
agaaagcaat cctgaaaaag aaagaggaga agcatattat gtcggagcgg aatgttctgt 540
tgaagaatgt gaagcaccct ttcctggtgg gccttcactt ctctttccag actgctgaca 600
aattgtactt tgtcctagac tacattaatg gtggagagtt gttctaccat ctccagaggg 660
aacgctgctt cctggaacca cgggctcgtt tctatgctgc tgaaatagcc agtgccttgg 720
gctacctgca ttcactgaac atcgtttata gagacttaaa accagagaat attttgctag 780
attcacaggg acacattgtc cttactgact tcggactctg caaggagaac attgaacaca 840
acagcacaac atccaccttc tgtggcacgc cggagtatct cgcacctgag gtgcttcata 900
agcagcctta tgacaggact gtggactggt ggtgcctggg agctgtcttg tatgagatgc 960
tgtatggcct gccgcctttt tatagccgaa acacagctga aatgtacgac aacattctga 1020
acaagcctct ccagctgaaa ccaaatatta caaattccgc aagacacctc ctggagggcc 1080
tcctgcagaa ggacaggaca aagcggctcg gggccaagga tgacttcatg gagattaaga 1140
gtcatgtctt cttctcctta attaactggg atgatctcat taataagaag attactcccc 1200
cttttaaccc aaatgtgagt gggcccaacg acctacggca ctttgacccc gagtttaccg 1260
aagagcctgt ccccaactcc attggcaagt cccctgacag cgtcctcgtc acagccagcg 1320
tcaaggaagc tgccgaggct ttcctaggct tttcctatgc gcctcccacg gactctttcc 1380
tctgaaccct gttagggctt ggttttaaag gattttatgt gtgtttccga atgttttagt 1440
tagccttttg gtggagccgc cagctgacag gacatcttac aagagaattt gcacatctct 1500
ggaagcttag caatcttatt gcacactgtt cgctggaagc tttttgaaga gcacattctc 1560
ctcagtgagc tcatgaggtt ttcattttta ttcttccttc caacgtggtg ctatctctga 1620
aacgagcgtt agagtgccgc cttagacgga ggcaggagtt tcgttagaaa gcggacgctg 1680
ttctaaaaaa ggtctcctgc agatctgtct gggctgtgat gacgaatatt atgaaatgtg 1740
ccttttctga agagattgtg ttagctccaa agcttttcct atcgcagtgt ttcagttctt 1800
tattttccct tgtggatatg ctgtgtgaac cgtcgtgtga gtgtggtatg cctgatcaca 1860
gatggatttt gttataagca tcaatgtgac acttgcagga cactacaacg tgggacattg 1920
tttgtttctt ccatatttgg aagataaatt tatgtgtaga cttttttgta agatacggtt 1980
aataactaaa atttattgaa atggtcttgc aatgactcgt attcagatgc ttaaagaaag 2040
cattgctgct acaaatattt ctatttttag aaagggtttt tatggaccaa tgccccagtt 2100
gtcagtcaga gccgttggtg tttttcattg tttaaaatgt cacctgtaaa atgggcatta 2160
tttatgtttt tttttttgca ttcctgataa ttgtatgtat tgtataaaga acgtctgtac 2220
attgggttat aacactagta tatttaaact tacaggctta tttgtaatgt aaaccaccat 2280
tttaatgtac tgtaattaac atggttataa tacgtacaat ccttccctca tcccatcaca 2340
caactttttt tgtgtgtgat aaactgattt tggtttgcaa taaaaccttg aaaaatattt 2400
acatataaaa aaaa 2414
<210> 55
<211> 7202
<212> DNA
<213> Homo sapiens
<400> 55
gatgtgtgtg gggttcggag ccgcgccggc acagccgaag ggagcgggcg agcggcgacg 60
gcggcggcgg cgggcacaga ttaattaaaa gaagaatgaa ctataatcct tgaagataac 120
tgggcaattt tttaagtcgg aggctgttct tactggtgtg aggatttaca cacgtcttca 180
gtttttcagc acagaccagc agaccatcat ttttagagga aatactccct ctgccctcct 240
ttttggtttc cttggtggta aagattaaat ttggttgcat cattttgact tgtgtttgag 300
tctagatttt atggcacaag gaatggcata aacttttcat gtgttttggt taaaacaaac 360
cagaccattg cattgaccct ggacatcttt aattgagaaa ttggtaactt tattttaata 420
tgtatatctg aagaattcaa gaaaacaaag gcatcctcag aggtgtgcct cttttcttta 480
ttattagagg caaaacgaac aattttatag gatttgtagt gaaattatac cagattataa 540
ggagaaccaa aactaagtcg caaaatttat taatttaagg ggctctcgct ttgaaagttt 600
gagagtaagt tacgataggc atttgtatcc attcattact ttcctctttt caaataagca 660
actaaataga aatgctaatc tcagacttaa ttatttaaca gaagagtgta ccatggaaaa 720
cctccagaca aatttctcct tggttcaggg ctcaactaaa aaactgaatg ggatgggaga 780
tgatggcagc cccccagcga aaaaaatgat aacggacatt catgcaaatg gaaaaacgat 840
aaacaaggtg ccaacagtta agaaggaaca cttggatgac tatggagaag caccagtgga 900
aactgatgga gagcatgtta agcgaacctg tacttctgtt cctgaaactt tgcatttaaa 960
tcccagtttg aaacacacat tggcacaatt ccatttaagt agtcagagct cgctgggtgg 1020
accagcagca ttttctgctc ggcattccca agaaagcatg tcgcctactg tatttctgcc 1080
tcttccatca cctcaggttc ttcctggccc attgctcatc ccttcagata gctccacaga 1140
actcactcag actgtgttgg aaggggaatc tatttcttgt tttcaagttg gaggagaaaa 1200
gagactctgt ttgccccaag tcttaaattc tgttctccga gaatttacac tccagcaaat 1260
aaatacagtg tgtgatgaac tgtacatata ttgttcaagg tgtacttcag accagcttca 1320
tatcttaaag gtactgggca tacttccatt caatgcccca tcctgtgggc tgattacatt 1380
aactgatgca caaagattat gtaatgcttt attgcggcca cgaacttttc ctcaaaatgg 1440
tagcgtactt cctgctaaaa gctcattggc ccagttaaag gaaactggca gtgcctttga 1500
agtggagcat gaatgcctag gcaaatgtca gggtttattt gcaccccagt tttatgttca 1560
gcctgatgct ccgtgtattc aatgtctgga gtgttgtgga atgtttgcac cccagacgtt 1620
tgtgatgcat tctcacagat cacctgacaa aagaacttgc cactggggct ttgaatcagc 1680
taaatggcat tgctatcttc atgtgaacca aaaatactta ggaacacctg aagaaaagaa 1740
actgaagata attttagaag aaatgaagga gaagtttagc atgagaagtg gaaagagaaa 1800
tcaatccaag acagatgcac catcaggaat ggaattacag tcatggtatc ctgttataaa 1860
gcaggaaggt gaccatgttt ctcagacaca ttcattttta caccccagct actacttata 1920
catgtgtgat aaagtggttg ccccaaatgt gtcacttact tctgctgtat cccagtctaa 1980
agagctcaca aagacagagg caagtaagtc catatcaaga cagtcagaga aggctcacag 2040
tagtggtaaa cttcaaaaaa cagtgtctta tccagatgtc tcacttgagg aacaggagaa 2100
aatggattta aaaacaagta gagaattatg tagccgttta gatgcatcaa tctcaaataa 2160
ttctacaagt aaaaggaaat ctgagtctgc cacttgcaac ttagtcagag acataaacaa 2220
agtgggaatt ggccttgttg ctgccgcttc atctccgctt cttgtgaaag atgtcatttg 2280
tgaggatgat aagggaaaaa tcatggaaga agtaatgaga acttatttaa aacaacagga 2340
aaaactaaac ttgattttgc aaaagaagca acaacttcag atggaagtaa aaatgttgag 2400
tagttcaaaa tctatgaagg aactcactga agaacagcag aatttacaga aagagcttga 2460
atctttgcag aatgaacatg ctcaaagaat ggaagaattt tatgttgaac agaaagactt 2520
agagaaaaaa ttggagcaga taatgaagca aaaatgtacc tgtgactcaa atttagaaaa 2580
agacaaagag gctgaatatg caggacagtt ggcagaactg aggcagagat tggaccatgc 2640
tgaggccgat aggcaagaac tccaagatga actcagacag gaacgggaag caagacagaa 2700
gttagagatg atgataaaag agctaaagct gcaaattctg aaatcatcaa agactgctaa 2760
agaatagaaa ctgttaaaga gattcatctg tgtattactg acaaggtttt ttttgtttgt 2820
tgcttgcttt ggtaattgaa ttctgaagaa tttatctgca tgacgataac taggcattct 2880
atccatttgt agatcagaga aagtgaagag attatatatt agtacttaaa tttttacatt 2940
ttccaaatga atgaaaatgt atgtttcttt gtactttttt aaaaaaatca gcttagtaac 3000
aatactatat ggtttcaact agtaggtaat ctgcttatat ttctaatgca aacttaacaa 3060
ttgtgtactt tttaaaagct gcaatatgtg ttggaaaata gctgtggtca attttgttat 3120
ccatatttca gactcaattt tagatacaat ggtggcttta tattttaagt atatagagct 3180
actcaaggag ttgaatctcc ccttttctca ttaacacaat ttttctaagt tgatatggtg 3240
tactcattaa catacaccaa atttactttt actttgttca gattgtggaa tgaatttcca 3300
ccagttctct tctttttaat gtgtacccta ggaggaattt tactgaggtt atagcatacc 3360
ccatgagcac agtggggaag aagaatgtgt tgttatgtgc tgctgctaaa cagaagcagc 3420
agttgtaatt tgtttttcag tttaaatgtg gttatagtta gatttttttt taagcagcaa 3480
cttttcaaaa ataaaatgtg ataatttctg aacttttgtt tgtgttgtta atagtggtgt 3540
gaaaatatta acgttcttga gaaaaactga taccactgtt gtgtatcagt ttctatacaa 3600
tccataatcc tcctgtacag tttttacatg tagttatgag tcttactaaa atttatataa 3660
tggacttgtt ttcctttaag ttgtaaaatg ttaaacacct tgaaggttat tttggacttc 3720
tgtatgttta aatgttgtct taccaaaatt tgcacgaatg gaccattttc atttactact 3780
taatatcaaa atcaggaatt tacagtcaac tgatagtaca tgataggtgc atataggaca 3840
gtttagttac ctgctactaa aagattttta gataagtttt agaagataaa ggaattccat 3900
agtttcagga gggacaacat cttctgcact ttttttttgc acagaaaagt ctgtcattct 3960
ctaatggcaa atttcatatt tgttaattct tggctcaaaa tatattaggt aaaattctta 4020
gatctgtttt taaagggagt ttcctgaaac tatcattaat tgacattatt accccatgga 4080
ttttatggga taataaatgt ttttcatgtt ctcttataag atactatgta tgaaattact 4140
tcagagagct atatttattt taaaataaat tagctagggt taaggttata ttctatttcc 4200
agcatagaag gtagataatc taatggtgta gaaagaatca ctaggttgtc atttaaccag 4260
ttattttcat attttgctta atagtacata tccaaaaaga attttgtact tccccaaatg 4320
taatttattt actaaattga gtataaccta aatgtgtgtt ttctattttc catttaaatt 4380
ttgctatatt aagactaatt taattcgttg agtcttggaa tcttctcaag gaggaacaaa 4440
tattaaaatg acatgtagaa acaaattttt tttttttttt tttttttttt ttttttgaga 4500
cagagtctcg ctgtctccca ggctggagtt cagtggtgca atctcggctc actgcaagct 4560
ctgcctcctg ggttcaagcc attctcctgc ctcagcctcc cgagtagctg ggactacagg 4620
cacccaccac cactcccggc taatttttag aaacaaatat ttaaaatgac atattctccc 4680
aatacaatct atttagatct ggagaaggaa aaatcagata tttatgatat agttttattt 4740
taattttgaa ttatttgtgt cacagctcag ctttttggaa gacaaactca aacacctata 4800
atttcattta tatttctaat tcacttggaa cctttctgct ttatgttacc tagaaaatga 4860
taatttgttt aacccaaaac ttctaaaata aattgcttaa tccttgaaat atgttattgg 4920
aaaattttaa gcagtgctta aacaccatta aattattatg aacttgtaat tcagaattga 4980
gtaaagaaat attttttcta gtccttcata tattgaaaac ttgccacatg acattgtatc 5040
gtcttcattt tccagaagat gcgttggtgt gccataggtt tctaacttcc ttgaaaatag 5100
ttttttaagt caattgtaaa tatacgtatt attgttaaaa gtaactttaa actgcaacac 5160
atagcttcaa aacaatatag agattttgta ataccttata agtggagttg gctaaaatac 5220
cttatccata taaaacttat tctattcttt gcatgcttat tttgtgtgtt ggttgctagc 5280
ttaaagtttg atttgttgtt actctttgtg tgccaaattc actaggcaag cggatttttc 5340
ctcagacttc aaaaaataat tcttttaaga aaaaatgtaa aaatgtttat tctaaaaagc 5400
tgcattaaag ggacaaccta taaaaagttt tgctagctca tctttagaag gaagaaagaa 5460
tattagcttg ggtgatgttt aatttgggtg gcgatagttt ctgtaggcta aactttatga 5520
gaaaagtgta cctactctat aaaggtaata aatgtaaaac ctcttgctgt tattgaggaa 5580
gctcttcaac taccctaaat ttcacaaatg taacttataa cactatgaaa agatttgacc 5640
aacaatttac gtttgctgtg tgctttagtt tttgtttaag catattcttt tgcttgaatt 5700
tctgtgttca tgagagttag ggtgttttat gcttcttgaa ctaattttat aacatattta 5760
atatattacc agttaagata taaaatcatt tgtacatagc gaattgtaaa gcagctatta 5820
aagtaggtga aataaagtat atatttgccg gttatccata tcttttagaa gtcctgacag 5880
aacaaccagt ttatttgcac ataggtagct tctgtttgaa ggaaggtaaa gttataagga 5940
aactcaaata ctataagatg tgtcaaggta tttctccaga attaattgca aagctagtgc 6000
tgaaggattt taatcagctt ctaaaatttt cttctcaata aggcatatgt tttgattact 6060
tagggaagat tcctcatttt tatttgccct ttatgcattt aatccacatg ataggacatt 6120
aaaaattaat ataaagaaaa atcgtgctca tactgtacat ctgtttctgt gcttggaact 6180
acttgttaat agtttttatc gaagctgtca gcaataaggg acataaaact gctgtattat 6240
acattgtgga attgaataaa cagcctaatt ttttttttct agtatagggt acttaagcat 6300
ttccactttt ggaagaaaag tgtattagta ttttatattg catttcattt aaaaggacag 6360
tttttttttt ttttttgtaa atccattcat tgaaatggtt tctaaactgt ataatgtaat 6420
ttggagccta tttagtaata gaattaaatg tcctatgtag tgctacaatt tttgaattag 6480
aaagtgatca aatgtaagaa aaaaatttaa aaattcagcc cagaaaacaa aatagtgtat 6540
taaattagtt taatgtaaaa ggaatttata agattttttt cctcaatata gatacctcac 6600
ttgaaaagaa agcacagcat acttaaagta gttctagtaa acatgtccta gaaaacagtt 6660
gctaaatgta ggacatcttt tgaggaatta gtttatgaga aataaaattt tacttgtttt 6720
tactatcctg ttagaagtat ttgtttatcc tgataatttt aagccaacat agtagtctta 6780
aattactttt gaatttctaa tctgtgaagg cagtaaatga aatatctgtt ctgcaactgt 6840
tgaaacaaat aattggctac attgaccata attaaagtta aaattttgcc aatgatgtac 6900
agttttatgg ttaaagttgc tgtggttggt tgcattacat gacacagaaa actgtcctct 6960
acctcacgtg aaataaatat tttatatggt tttactaaaa ataagactca tgtatctggt 7020
cacctagttt acaaattttg aattatattt attgaaacat gacatactgt gctctgagct 7080
tatacctcaa ttgtattttg tgctgttttc cattttcatg ccttgtaaat aacttgtata 7140
gattgtggat caaatactaa ataaaaactt ttaatgccaa ttaaatttga ttcaagttaa 7200
aa 7202
<210> 56
<211> 1351
<212> DNA
<213> Homo sapiens
<400> 56
agctccggct ccccctatat aaatcggcca tttgcttcgc tccgccccgc agcgccggag 60
tcaaagccgg ttcccggccc agtcccgtcc tgcagcagtc tgcctcctct ttcaacatga 120
cagatgccgc tgtgtccttc gccaaggact tcctggcagg tggagtggcc gcagccatct 180
ccaagacggc ggtagcgccc atcgagcggg tcaagctgct gctgcaggtg cagcatgcca 240
gcaagcagat cactgcagat aagcaataca aaggcattat agactgcgtg gtccgtattc 300
ccaaggagca gggagttctg tccttctggc gcggtaacct ggccaatgtc atcagatact 360
tccccaccca ggctcttaac ttcgccttca aagataaata caagcagatc ttcctgggtg 420
gtgtggacaa gagaacccag ttttggctct actttgcagg gaatctggca tcgggtggtg 480
ccgcaggggc cacatccctg tgttttgtgt accctcttga ttttgcccgt acccgtctag 540
cagctgatgt gggtaaagct ggagctgaaa gggaattccg aggcctcggt gactgcctgg 600
ttaagatcta caaatctgat gggattaagg gcctgtacca aggctttaac gtgtctgtgc 660
agggtattat catctaccga gccgcctact tcggtatcta tgacactgca aagggaatgc 720
ttccggatcc caagaacact cacatcgtca tcagctggat gatcgcacag actgtcactg 780
ctgttgccgg gttgacttcc tatccatttg acactgttcg ccgccgcatg atgatgcagt 840
cagggcgcaa aggaactgac atcatgtaca caggcacgct tgactgctgg cggaagattg 900
ctcgtgatga aggaggcaaa gcttttttca agggtgcatg gtccaatgtt ctcagaggca 960
tgggtggtgc ttttgtgctt gtcttgtatg atgaaatcaa gaagtacaca taagttattt 1020
cctaggattt ttccccctgt gaacaggcat gttgtattat ataacatatc ttgagcattc 1080
ttgacagact cctggctgtc agtttctcag tggcaactat ttactggttg aaaatgggaa 1140
gcaataatat tcatctgacc agttttctct taaagccatt tccatgatga tgatgatggg 1200
actcaattgt attttttatt tcagtcactc ctgataaata acaaatttgg agaaataaaa 1260
atatctaaaa taaattttgt ctgcagtata ttttcatata aaaatgcata tttgagtgct 1320
acattcgaat aaatactacc tttttagtga a 1351
<210> 57
<211> 8789
<212> DNA
<213> Homo sapiens
<400> 57
atgctcagtg gcttctcgac aagttggcag caacaacacg gccctggtcg tcgtcgccgc 60
tgcggtaacg gagcggtttg ggtggcggag cctgcgttcg cgccttcccg ctctcctcgg 120
gaggcccttc ctgctctccc ctaggctccg cggccgccca gggggtggga gcgggtgagg 180
ggagccaggc gcccagcgag agaggccccc cgccgcaggg cggcccggga gctcgaggcg 240
gtccggcccg cgcgggcagc ggcgcggcgc tgaggagggg cggcctggcc gggacgcctc 300
ggggcggggg ccgaggagct ctccgggccg ccggggaaag ctacgggccc ggtgcgtccg 360
cggaccagca gcgcgggaga gcggactccc ctcgccaccg cccgagccca ggttatcctg 420
aatacatgtc taacaatttt ccttgcaacg ttagctgttg tttttcactg tttccaaagg 480
atcaaaattg cttcagaaat tggagacata tttgatttaa aaggaaaaac ttgaacaaat 540
ggacaatatg tctattacga atacaccaac aagtaatgat gcctgtctga gcattgtgca 600
tagtttgatg tgccatagac aaggtggaga gagtgaaaca tttgcaaaaa gagcaattga 660
aagtttggta aagaagctga aggagaaaaa agatgaattg gattctttaa taacagctat 720
aactacaaat ggagctcatc ctagtaaatg tgttaccata cagagaacat tggatgggag 780
gcttcaggtg gctggtcgga aaggatttcc tcatgtgatc tatgcccgtc tctggaggtg 840
gcctgatctt cacaaaaatg aactaaaaca tgttaaatat tgtcagtatg cgtttgactt 900
aaaatgtgat agtgtctgtg tgaatccata tcactacgaa cgagttgtat cacctggaat 960
tgatctctca ggattaacac tgcagagtaa tgctccatca agtatgatgg tgaaggatga 1020
atatgtgcat gactttgagg gacagccatc gttgtccact gaaggacatt caattcaaac 1080
catccagcat ccaccaagta atcgtgcatc gacagagaca tacagcaccc cagctctgtt 1140
agccccatct gagtctaatg ctaccagcac tgccaacttt cccaacattc ctgtggcttc 1200
cacaagtcag cctgccagta tactgggggg cagccatagt gaaggactgt tgcagatagc 1260
atcagggcct cagccaggac agcagcagaa tggatttact ggtcagccag ctacttacca 1320
tcataacagc actaccacct ggactggaag taggactgca ccatacacac ctaatttgcc 1380
tcaccaccaa aacggccatc ttcagcacca cccgcctatg ccgccccatc ccggacatta 1440
ctggcctgtt cacaatgagc ttgcattcca gcctcccatt tccaatcatc ctgctcctga 1500
gtattggtgt tccattgctt actttgaaat ggatgttcag gtaggagaga catttaaggt 1560
tccttcaagc tgccctattg ttactgttga tggatacgtg gacccttctg gaggagatcg 1620
cttttgtttg ggtcaactct ccaatgtcca caggacagaa gccattgaga gagcaaggtt 1680
gcacataggc aaaggtgtgc agttggaatg taaaggtgaa ggtgatgttt gggtcaggtg 1740
ccttagtgac cacgcggtct ttgtacagag ttactactta gacagagaag ctgggcgtgc 1800
acctggagat gctgttcata agatctaccc aagtgcatat ataaaggtct ttgatttgcg 1860
tcagtgtcat cgacagatgc agcagcaggc ggctactgca caagctgcag cagctgccca 1920
ggcagcagcc gtggcaggaa acatccctgg cccaggatca gtaggtggaa tagctccagc 1980
tatcagtctg tcagctgctg ctggaattgg tgttgatgac cttcgtcgct tatgcatact 2040
caggatgagt tttgtgaaag gctggggacc ggattaccca agacagagca tcaaagaaac 2100
accttgctgg attgaaattc acttacaccg ggccctccag ctcctagacg aagtacttca 2160
taccatgccg attgcagacc cacaaccttt agactgaggt cttttaccgt tggggccctt 2220
aaccttatca ggatggtgga ctacaaaata caatcctgtt tataatctga agatatattt 2280
cacttttgtt ctgctttatc ttttcataaa gggttgaaaa tgtgtttgct gccttgctcc 2340
tagcagacag aaactggatt aaaacaattt tttttttcct cttcagaact tgtcaggcat 2400
ggctcagagc ttgaagatta ggagaaacac attcttatta attcttcacc tgttatgtat 2460
gaaggaatca ttccagtgct agaaaattta gccctttaaa acgtcttaga gccttttatc 2520
tgcagaacat cgatatgtat atcattctac agaataatcc agtattgctg attttaaagg 2580
cagagaagtt ctcaaagtta attcacctat gttattttgt gtacaagttg ttattgttga 2640
acatacttca aaaataatgt gccatgtggg tgagttaatt ttaccaagag taactttact 2700
ctgtgtttaa aaagtaagtt aataatgtat tgtaatcttt catccaaaat attttttgca 2760
agttatatta gtgaagatgg tttcaattca gattgtcttg caacttcagt tttatttttg 2820
ccaaggcaaa aaactcttaa tctgtgtgta tattgagaat cccttaaaat taccagacaa 2880
aaaaatttaa aattacgttt gttattccta gtggatgact gttgatgaag tatacttttc 2940
ccctgttaaa cagtagttgt attcttctgt atttctaggc acaaggttgg ttgctaagaa 3000
gcctataaga ggaatttctt ttccttcatt catagggaaa ggttttgtat tttttaaaac 3060
actaaaagca gcgtcactct acctaatgtc tcactgttct gcaaaggtgg caatgcttaa 3120
actaaataat gaataaactg aatattttgg aaactgctaa attctatgtt aaatactgtg 3180
cagaataatg gaaacattac agttcataat aggtagtttg gatatttttg tacttgattt 3240
gatgtgactt tttttggtat aatgtttaaa tcatgtatgt tatgatattg tttaaaattc 3300
agtttttgta tcttggggca agactgcaaa cttttttata tcttttggtt attctaagcc 3360
ctttgccatc aatgatcata tcaattggca gtgactttgt atagagaatt taagtagaaa 3420
agttgcagat gtattgactg taccacagac acaatatgta tgctttttac ctagctggta 3480
gcataaataa aactgaatct caacatacaa agttgaattc taggtttgat ttttaagatt 3540
ttttttttct tttgcacttt tgagtccaat ctcagtgatg aggtaccttc tactaaatga 3600
caggcaacag ccagttctat tgggcagctt tgtttttttc cctcacactc taccgggact 3660
tccccatgga cattgtgtat catgtgtaga gttggttttt ttttttttta atttttattt 3720
tactatagca gaaatagacc tgattatcta caagatgata aatagattgt ctacaggata 3780
aatagtatga aataaaatca aggattatct ttcagatgtg tttacttttg cctggagaac 3840
ttttagctat agaaacactt gtgtgatgat agtcctcctt atatcacctg gaatgaacac 3900
agcttctact gccttgctca gaaggtcttt taaatagacc atcctagaaa ccactgagtt 3960
tgcttatttc tgtgatttaa acatagatct tgatccaagc tacatgactt ttgtctttaa 4020
ataacttatc taccacctca tttgtactct tgattactta caaattcttt cagtaaacac 4080
ctaattttct tctgtaaaag tttggtgatt taagttttat tggcagtttt ataaaaagac 4140
atcttctcta gaaattgcta actttaggtc cattttactg tgaatgagga ataggagtga 4200
gttttagaat aacagatttt taaaaatcca gatgatttga ttaaaacctt aatcatacat 4260
tgacataatt cattgcttct tttttttgag atatggagtc ttgctgtgtt gcccaggcag 4320
gagtgcagtg gtatgatctc agctcactgc aacctctgcc tcccgggttc aactgattct 4380
cctgcctcag cctccctggt agctaggatt acaggtgccc gccaccatgc ctggctaact 4440
tttgtagttt tagtagagac ggggttttgc ctgttggcca ggctggtctt gaactcctga 4500
cctcaagtga tccatccacc ttggcctccc aaagtgctgg gattacgggc gtgagccact 4560
gtccctggcc tcattgttcc cttttctact ttaaggaaag ttttcatgtt taatcatctg 4620
gggaaagtat gtgaaaaata tttgttaaga agtatctctt tggagccaag ccacctgtct 4680
tggtttcttt ctactaagag ccataaagta tagaaatact tctagttgtt aagtgcttat 4740
atttgtacct agatttagtc acacgctttt gagaaaacat ctagtatgtt atgatcagct 4800
attcctgaga gcttggttgt taatctatat ttctatttct tagtggtagt catctttgat 4860
gaataagact aaagattctc acaggtttaa aattttatgt ctactttaag ggtaaaatta 4920
tgaggttatg gttctgggtg ggttttctct agctaattca tatctcaaag agtctcaaaa 4980
tgttgaattt cagtgcaagc tgaatgagag atgagccatg tacacccacc gtaagacctc 5040
attccatgtt tgtccagtgc ctttcagtgc attatcaaag ggaatccttc atggtgttgc 5100
ctttattttc cggggagtag atcgtgggat atagtctatc tcatttttaa tagtttaccg 5160
cccctggtat acaaagataa tgacaataaa tcactgccat ataaccttgc tttttccaga 5220
aacatggctg ttttgtattg ctgtaaccac taaataggtt gcctatacca ttcctcctgt 5280
gaacagtgca gatttacagg ttgcatggtc tggcttaagg agagccatac ttgagacatg 5340
tgagtaaact gaactcatat tagctgtgct gcatttcaga cttaaaatcc atttttgtgg 5400
ggcagggtgt ggtgtgtaaa ggggggtgtt tgtaatacaa gttgaaggca aaataaaatg 5460
tcctgtctcc cagatgatat acatcttatt atttttaaag tttattgcta attgtaggaa 5520
ggtgagttgc aggtatcttt gactatggtc atctggggaa ggaaaatttt acattttact 5580
attaatgctc cttaagtgtc tatggaggtt aaagaataaa atggtaaatg tttctgtgcc 5640
tggtttgatg gtaactggtt aatagttact caccatttta tgcagagtca cattagttca 5700
caccctttct gagagccttt tgggagaagc agttttattc tctgagtgga acagagttct 5760
ttttgttgat aatttctagt ttgctccctt cgttattgcc aactttactg gcattttatt 5820
taatgatagc agattgggaa aatggcaaat ttaggttacg gaggtaaatg agtatatgaa 5880
agcaattacc tctaaagcca gttaacaatt attttgtagg tggggtacac tcagcttaaa 5940
gtaatgcatt tttttttccc gtaaaggcag aatccatctt gttgcagata gctatctaaa 6000
taatctcata tcctcttttg caaagactac agagaatagg ctatgacaat cttgttcaag 6060
cctttccatt tttttccctg ataactaagt aatttctttg aacataccaa gaagtatgta 6120
aaaagtccat ggccttattc atccacaaag tggcatccta ggcccagcct tatccctagc 6180
agttgtccca gtgctgctag gttgcttatc ttgtttatct ggaatcactg tggagtgaaa 6240
ttttccacat catccagaat tgccttattt aagaagtaaa acgttttaat ttttagcctt 6300
tttttggtgg agttatttaa tatgtatatc agaggatata ctagatggta acatttcttt 6360
ctgtgcttgg ctatctttgt ggacttcagg ggcttctaaa acagacagga ctgtgttgcc 6420
tttactaaat ggtctgagac agctatggtt ttgaattttt agtttttttt ttttaaccca 6480
cttcccctcc tggtctcttc cctctctgat aattaccatt catatgtgag tgttagtgtg 6540
cctcctttta gcattttctt cttctctttc tgattcttca tttctgactg cctaggcaag 6600
gaaaccagat aaccaaactt actagaacgt tctttaaaac acaagtacaa actctgggac 6660
aggacccaag acactttcct gtgaagtgct gaaaaagacc tcattgtatt ggcatttgat 6720
atcagtttga tgtagcttag agtgcttcct gattcttgct gagtttcagg tagttgagat 6780
agagagaagt gagtcatatt catattttcc cccttagaat aatattttga aaggtttcat 6840
tgcttccact tgaatgctgc tcttacaaaa actggggtta caagggttac taaattagca 6900
tcagtagcca gaggcaatac cgttgtctgg aggacaccag caaacaacac acaacaaagc 6960
aaaacaaacc ttgggaaact aaggccattt gttttgtttt ggtgtcccct ttgaagccct 7020
gccttctggc cttactcctg tacagatatt tttgacctat aggtgccttt atgagaattg 7080
agggtctgac atcctgcccc aaggagtagc taaagtaatt gctagtgttt tcagggattt 7140
taacatcaga ctggaatgaa tgaatgaaac tttttgtcct ttttttttct gttttttttt 7200
ttctaatgta gtaaggacta aggaaaacct ttggtgaaga caatcatttc tctctgttga 7260
tgtggatact tttcacaccg tttatttaaa tgctttctca ataggtccag agccagtgtt 7320
cttgttcaac ctgaaagtaa tggctctggg ttgggccaga cagttgcact ctctagtttg 7380
ccctctgcca caaatttgat gtgtgacctt tgggcaagtc atttatcttc tctgggcctt 7440
agttgcctca tctgtaaaat gagggagttg gagtagatta attattccag ctctgaaatt 7500
ctaagtgacc ttggctacct tgcagcagtt ttggatttct tccttatctt tgttctgctg 7560
tttgaggggg ctttttactt atttccatgt tattcaaagg agactaggct tgatatttta 7620
ttactgttct tttatggaca aaaggttaca tagtatgccc ttaagactta attttaacca 7680
aaggcctagc accaccttag gggctgcaat aaacacttaa cgcgcgtgcg cacgcgcgcg 7740
cgcacacaca cacacacaca cacacacaca cacaggtcag agtttaaggc tttcgagtca 7800
tgacattcta gcttttgaat tgcgtgcaca cacacacgca cgcacacact ctggtcagag 7860
tttattaagg ctttcgagtc atgacattat agcttttgag ttggtgtgtg tgacaccacc 7920
ctcctaagtg gtgtgtgctt gtaatttttt ttttcagtga aaatggattg aaaacctgtt 7980
gttaatgctt agtgatatta tgctcaaaac aaggaaattc ccttgaaccg tgtcaattaa 8040
actggtttat atgactcaag aaaacaatac cagtagatga ttattaactt tattcttggc 8100
tctttttagg tccattttga ttaagtgact tttggctgga tcattcagag ctctcttcta 8160
gcctaccctt ggatgagtac aattaatgaa attcatattt tcaaggacct gggagccttc 8220
cttggggctg ggttgagggt ggggggttgg ggagtcctgg tagaggccag ctttgtggta 8280
gctggagagg aagggatgaa accagctgct gttgcaaagg ctgcttgtca ttgatagaag 8340
gactcacggg cttggattga ttaagactaa acatggagtt ggcaaacttt cttcaagtat 8400
tgagttctgt tcaatgcatt ggacatgtga tttaagggaa aagtgtgaat gcttatagat 8460
gatgaaaacc tggtgggctg cagagcccag tttagaagaa gtgagttggg ggttggggac 8520
agatttggtg gtggtatttc ccaactgttt cctcccctaa attcagagga atgcagctat 8580
gccagaagcc agagaagagc cactcgtagc ttctgctttg gggacaactg gtcagttgaa 8640
agtcccagga gttcctttgt ggctttctgt atacttttgc ctggttaaag tctgtggcta 8700
aaaaatagtc gaacctttct tgagaactct gtaacaaagt atgtttttga ttaaaagaga 8760
aagccaacta aaaaaaaaaa aaaaaaaaa 8789
<210> 58
<211> 7014
<212> DNA
<213> Homo sapiens
<400> 58
atccgggtcc tgggcgagcg ggcgccgtgc gcgtgtcccg cggccgagct gctaataaag 60
ttgcagcgag gagaagcgca gcgacggcgt cgggagagcg cgcctagccg gctcgcgaaa 120
aggaagctgt tgaagttatt gaagtacctg ttgctatatt ctaagaaatt aaaatgtcca 180
gaaatctgcc tctgacttga cccaatgaaa gaagcatatg gcacttgtga agataaatgt 240
tactcctccc tttttaattg gaacttctgc ttaggacctg tgtatgacgt ttcacctgtg 300
atctgttctt tcggtagcca ctgactttga gttacaggaa ggtctccgaa gatttgtgtc 360
aaatgacgtc aatggccagc ttgttttctt ttactagtcc agcagtaaag cgattgttgg 420
gctggaaaca aggtgatgag gaggagaaat gggcagaaaa ggcagttgat gctttggtga 480
agaaactaaa aaagaaaaag ggtgccatgg aggaactgga gaaagccttg agcagtccag 540
gacagccgag taaatgtgtc actattccca gatctttaga tggacgcctg caggtttctc 600
acagaaaagg cttaccccat gttatatatt gtcgtgtttg gcgctggccg gatttgcaga 660
gtcatcatga gctaaagccg ttggatattt gtgaatttcc ttttggatct aagcaaaaag 720
aagtttgtat caacccatac cactataaga gagtggagag tccagtctta cctccagtat 780
tagtgcctcg tcataatgaa ttcaatccac aacacagcct tctggttcag tttaggaacc 840
tgagccacaa tgaaccacac atgccacaaa atgccacgtt tccagattct ttccaccagc 900
ccaacaacac tccttttccc ttatctccaa acagccctta tcccccttct cctgctagca 960
gcacatatcc caactcccca gcaagttctg gaccaggaag tccatttcag ctcccagctg 1020
atacgcctcc tcctgcctat atgccacctg atgatcagat gggtcaagat aattcccagc 1080
ctatggatac aagcaataat atgattcctc agattatgcc cagtatatcc agcagggatg 1140
ttcagcctgt tgcctatgaa gagcctaaac attggtgttc aatagtctac tatgaattaa 1200
acaatcgtgt tggagaagct tttcatgcat cttctactag tgtgttagta gatggattca 1260
cagatccttc aaataacaaa agtagattct gcttgggttt gttgtcaaat gttaatcgta 1320
attcgacaat tgaaaacact aggcgacata ttggaaaagg tgttcatctg tactatgttg 1380
gtggagaggt gtatgcggaa tgcctcagtg acagcagcat atttgtacag agtaggaact 1440
gcaactttca tcatggcttt catcccacca ctgtctgtaa gattcccagc agctgcagcc 1500
tcaaaatttt taacaatcag gagtttgctc agcttctggc tcaatctgtc aaccatgggt 1560
ttgaggcagt atatgagctc accaaaatgt gtaccattcg gatgagtttt gtcaagggtt 1620
ggggagcaga atatcaccgg caggatgtaa ccagcacccc atgttggatt gagattcatc 1680
ttcatgggcc tcttcagtgg ctggataaag tccttactca gatgggctcc cctctgaacc 1740
ccatatcttc tgtttcataa tgcagaagta ttcttttcaa ttatattgtt agtggacttg 1800
ttttaatttt agagaaactt tgagtacaga tactgtgagc ttacattgaa aacagatatt 1860
acagcttatt tttttctaca taattgtgac caatacattt gtattttgtg atgaatctac 1920
atttgtttgt attcatgttc atgtgattaa ctcttagaag tgttgtaaaa gatgcagagt 1980
aagtattatg ccccagttca gaaatttggc attgatctta aactggaaca tgcttttact 2040
ttattgccct aacaattttt tattaaattt atttgaaaat gcatcacatg atgaaaaatt 2100
atagtagctt ataagagggc atatacagtg aagagtaagt tttccctcct actctcgatc 2160
ttccagaagc tgtactttta ccagtttctt tgtcccacca acttaaaaaa aaaaagtaca 2220
attcattgtt ttgcaaaagt gtatggtagg ggcttaaaag aaactataaa gttttatttg 2280
aatgaacact atgcactgct gtaactggta gtgttcagta aaagcaaaat gatagttttc 2340
tagatgacat aaaatttaca tttaatacag ataagtgttc ttcagtgtaa tgtgacttca 2400
tgctatatat cttttgtaag acatttcctt ttttaaaaaa atttttgcaa ataactgatc 2460
tcaagtatat gtcatttact caaaatctgt cataagcatt actttatagc tagtgacagt 2520
gcatgcacag ccttgttcaa ctatgtttgc tgcttttgga caatgttgca agaactctat 2580
ttttgacatg cattaatctt ttattttgca cttttatggg tgacagtttt tagcataacc 2640
tttgataaaa tacactcaag tgacttggac ttagatgctt atccttacgt ccttggtacc 2700
ttttttgtat taacaaacac tgcaatttat agattacatt tgtaggaagt tatgcttttt 2760
tctggttttt gttttacttt caacctaggt tataagactg ttattctata gctccaactt 2820
aaggtgcctt tttaattccc tacagtttta tgggtgttat cagtgctgga gaatcatgta 2880
gttaatccca ttgctcttac aagtgtcagc ttacttgtat cagcctccct acgcaaggac 2940
ctatgcactg gagccgtagg aggctcttca gttgggcccc aaggataagg ctactgattt 3000
gatactaaat gaatcagcag tggatgtagg gatagctgat tttaaaacac tcggctgggc 3060
acagtggctc acacctgtaa tcccagcact ttgggaggct gaggcaggca gatcatgatg 3120
tcaggagttt gagaccagcc tggccaatat ggtgaaaccc tgtctctaca aaaaatacaa 3180
aaattagctg ggcatggtgg tgcgtgcctg aagtcccagc tactcgggaa gctgaggcag 3240
aagaatcact tgaacctggg aggcggaggt tgtggtgagc cgagatcgca ccactgcact 3300
ccagcctggg cgacagagcg agactctgcc tcaaaaaaca aaacaaaaca aaacactcac 3360
ccatcaacga atatagactc ttctctcatt tatcgatgat cctctttttc cattttttaa 3420
gtacttatgt ggaagctagt ctcccaaaac acaatcttta gagagaaaag acatgaacga 3480
actccaaaat atccatttaa tcaatcatgt ttttggcttt ggataaagaa ctttgaacca 3540
gtttttttct caggagctgt caaatggaca cttaattatg acatgagaat gaagaaatta 3600
ttttggaaaa aaaaaatgac ctaatttacc tatcagtgaa agctttattt tctggtgcct 3660
tttgaaagta tatggagtca tatcattctt ctgtttaaaa tgttagtttg gtttgacttt 3720
ccactttgtc ctttctgctc ttgtgaagaa aaaaaaaagc attttcgagg aaagaattat 3780
gcaatttctt ttgttttctg tgtcattatt tattgctttt tcaatgtgca gccagtggat 3840
ggttttagtt ctttcagatg aactgccatt tgtgtttcag ctcacagttc tttgctgggt 3900
aaaagaaata ctttctgaca gtcacctgag ccttaaatgt aagtattaca tgacatgcat 3960
tctgtttctt ccagagttct gtctgccaca cgaaagagaa tatttgctta cttgatagaa 4020
ctttggcatt ttcatcattc ttttacttaa ccaggcttat ggcatgatct ctggaacaaa 4080
tttgtaggaa aaaattactc caattgaatg actgatgtat gtaatcaact tcattgggct 4140
gcagtaaact agtggaaatt agagagttgt tttattggtg ttttctactg tgagttaatt 4200
aaaaattgtt tttatttggg gtcattatgt cacagtcttg agttaacaag atcttacgtg 4260
attggccttt tctttgtttt ctcttaggag ttgtgtctca tgaatgacag tactaaagct 4320
attaacaact aagagtttga cagagaacta taagcctgtt gtatctccta aaagttgtca 4380
actccccacc cttggacttt aaatgaaaat tttattcagt ccagctattc ttacagtccc 4440
taaggatttt catatatcta tgtataggag ataaaatttg ctagtaagat ttttaaaaac 4500
tggctagtga aaggaaagta cctctgaaag aaaccatttt agcaaattat ggttatatgt 4560
tttaatttaa tctacagaat gttttatagt aaaattctag caccactaga ataatcacat 4620
agcatgtaca atatatttat gctggctgaa aagacagaat ctgggaataa taaaattgca 4680
accagtttgg taatgcaaac agcagaatag aatgaaatct cagtaatgaa ttaaagcaac 4740
aaaaagatat tgattggcaa aaagcaagat ataagagatt catttgctta acatttctac 4800
ataatattta tggtctggtc agtattggtc tggtcagtat tgcctggctg acgtgaaatg 4860
taaactagta ggcgtgttat tgatctgcta aaactaaccc tctttttaag aggagattta 4920
aggaagacgt caatcaaaat gtcaaatatg tgtgtcagaa tataaataat ttttcacatt 4980
gtattgttgc tatataaaaa aaataataga attggttggg tttctgaggt gaaatccaga 5040
gtaagagtac tagacagttc aacaagccac atctaatggc acagatagag gatgtagcta 5100
ttttatacct ttcataacat ttgagagtaa gatatccttc aggatgtgaa gtgattatta 5160
agtactcata cctgaaatct gttgtcaaga ttagaactgg ggttcatgtt aaaaaccttc 5220
catattacct gagggtacct gtggggaaca gttccttccc ctgtgtggta gtattttgtt 5280
ggaagagaat gtttatacaa aaaatgaaat tcttccaaca gcagagaaac tctaaaaagt 5340
ttgatagtac ctatcaaagt gctgtacttc tgtgatagag aacatctgat gtaccaattt 5400
agatctattt ctttatactt tttctaatca attgcttaat agtactttgg atgattatca 5460
cctttgccac ttaaaatata taaatatcct ttttacttca tgaggaagga agaatttttt 5520
gataattact gagttcagcc ttttgtgatg acttatattt tggacttaca ttttaacttt 5580
aaagaatgtc agatcccttc tttgtcttac tagttaaatc ctcacctaat ctcttgggta 5640
tgaatataaa tgtgtgtcat cgttatattg ttcagctaga tgagcaagta tcttagggta 5700
gtaggtagcc tggtggtttt agaagtgttt ggtgattttt atggagagag ttttcctaag 5760
tggtggttta taggtggtat cagatattat tagggcagct ttttggggag taatctcagg 5820
tctcccagag cagcagcatt tttctcattg atataagtaa gattcttagg agcttttctt 5880
atcacacaag atgcctgaat cgaatgtgag aattgaaggc atttcttctg cataaacaaa 5940
gaattctacc tgctggacag aaacctggaa agttctttgg aattcgctga attacagttt 6000
agtatgtcct gattacagag tgacaatatt tatcaagcct ttgttatatt ggattatctt 6060
ctctcttaaa atacaactgt attataattg aaatgacagc ccaaaattgg atggtttacc 6120
aaaaccaatg aaagggattt cacacatcaa tttttatttc tgttttgaag agcacatgct 6180
atataataat tgctagtagc aactgcagta aaacaggtga taagttattt tctctgaaaa 6240
gatccagtcc tagagcagga ttcttcgatc attcatggca gagtgaaaaa ggtttgtatg 6300
gttcttgtcc aaataactca gttcttaaaa ttcttaaaat gatcgtaaac cattatcctt 6360
taaaggttta tttgaagatg ctgttaaagt acagaatttt gtgtacaggt agatttttcc 6420
gtccctcatt aatagtgcct tcttaattaa tacagactgg tgttagctat aacaaaactc 6480
cagtaaggcc aaagaatccc aagttctttg tggaaaaaaa aaaaaaatct tttagggtca 6540
gattttccct tctaatatca ttgaagatga tgttgcattg atttattcat aaagtatttt 6600
aactatagga actctagaag ataatggtta ggcaagtgat ttttttttta aatatggttg 6660
gcgtaagttg tattttgaaa ttcacttatt ttaaaatcga agaggattgt aatcatggaa 6720
atagaatgtt tgtatctacc tgcccacatt ttcttaaaaa gatatttcat atacagataa 6780
tgaagaccaa gctagtggct gcactgtagg tctgctgctt atttgtattt gttgtgcttc 6840
tgtttatgtt gtagaagctg aaattctagc aacatgcttc aattctgtta ttttgatact 6900
tatgaaaatg tattaggttt tactatattg tgcttttgaa agccataact cttaagaact 6960
ttgtttttgc atattgtttg ctaattcttt actttaataa acctcaaaac ctgc 7014
<210> 59
<211> 2886
<212> DNA
<213> Homo sapiens
<400> 59
cgatcgaggg agctgagccg agagaaagag ccgccgggcg ctgcctcgcc agacctcgct 60
gggaccccgg ggccaccggg aggcactttt gtggaggggg gagggggggc gacctcggca 120
gcctcggcgc acgaagcgtc cgagggcagc gtggggcggg ctgcgacctc tgcatcggtg 180
gactgcattt ttaattaagg attcccagca gctctttggg atttttacag cttccactca 240
tgtgttgaca cccgcgtcca ggagaaactc gctccaagtg catctagcgc ctgggacctg 300
agacggcgtt ggcctttcgt gcatgcaaat ccagggattt aggttttgtt tgggatttcc 360
ttttctttct ttcctttttt ttttcttttt gcagggagta agaagggagc tgggggtatc 420
aacaagcctg cctttcggat cctgcgggaa aagcccatgt agttaagcgc tttggtttaa 480
aaaaaaggca aggtaaaggc agggctttcc agacacattt aggggttcgc gcgagcgctt 540
tgtgctcatg gaccagccgc acaacttttg aaggctcgcc ggcccatgtg gggtctttct 600
ggcggcgcgc cgcctgcagc ccccctaaag cgcgggggct ggagttgttg agcagccccg 660
ccgctgtggt ccatgtagcc gctggccgcg cgcggactgc ggctcggcgt gcgcgtgttc 720
ccggccgtcc cgcctcggcg agctccctca tgttgtcgcc ctgcggcgcc ccttcgacga 780
caggctgtgc gcggtctgca cggcgctccg cggcggagct tcatgtgggg ctgcgacccg 840
cgcagccggc gcctcgctga gggaacggac ccccggtaac cggagaccgc ctccccccca 900
cccctggcgc caaaggatat cgtatgttca ggtccaaacg ctcggggctg gtgcggcgac 960
tttggcgaag tcgtgtggtc cccgaccggg aggaaggcgg cagcggcggc ggcggtggcg 1020
gcgacgagga tgggagcttg ggcagccgag ctgagccggc cccgcgggca agagagggcg 1080
gaggctgcgg ccgctccgaa gtccgcccgg tagccccgcg gcggccccgg gacgcagtgg 1140
gacagcgagg cgcccagggc gcggggaggc gccggcgcgc agggggcccc ccgaggccca 1200
tgtcggagcc aggggccggc gctgggagct ccctgctgga cgtggcggag ccgggaggcc 1260
cgggctggct gcccgagagt gactgcgaga cggtgacctg ctgtctcttt tcggagcggg 1320
acgccgccgg cgcgccccgg gacgccagcg accccctggc cggggcggcc ctggagccgg 1380
cgggcggcgg gcggagtcgc gaagcgcgct cgcggctgct gctgctggag caggaactca 1440
aaaccgtcac gtactcgctg ctgaagcggc tcaaggagcg ctcgctggac acgctgctgg 1500
aggcggtgga gtcccgcggc ggcgtgccgg gcggctgcgt gctggtgccg cgcgccgacc 1560
tccgcctggg cggccagccc gcgccgccgc agctgctgct cggccgcctc tttcgctggc 1620
ccgacctgca gcacgccgtg gagctgaagc ccctgtgcgg ctgccacagc ttcgccgccg 1680
ccgccgacgg ccctaccgtg tgctgcaacc cctaccactt cagccggctc tgcgggcccg 1740
aatctccgcc acctccctac tctcggctgt ctcctcgcga cgagtacaag ccactggatc 1800
tgtccgattc cacattgtct tacactgaaa cggaggctac caactccctc atcactgctc 1860
cgggtgaatt ctcagacgcc agcatgtctc cggacgccac caagccgagc cactggtgca 1920
gcgtggcgta ctgggagcac cggacgcgcg tgggccgcct ctatgcggtg tacgaccagg 1980
ccgtcagcat cttctacgac ctacctcagg gcagcggctt ctgcctgggc cagctcaacc 2040
tggagcagcg cagcgagtcg gtgcggcgaa cgcgcagcaa gatcggcttc ggcatcctgc 2100
tcagcaagga gcccgacggc gtgtgggcct acaaccgcgg cgagcacccc atcttcgtca 2160
actccccgac gctggacgcg cccggcggcc gcgccctggt cgtgcgcaag gtgccccccg 2220
gctactccat caaggtgttc gacttcgagc gctcgggcct gcagcacgcg cccgagcccg 2280
acgccgccga cggcccctac gaccccaaca gcgtccgcat cagcttcgcc aagggctggg 2340
ggccctgcta ctcccggcag ttcatcacct cctgcccctg ctggctggag atcctcctca 2400
acaaccccag atagtggcgg ccccggcggg aggggcgggt gggaggccgc ggccaccgcc 2460
acctgccggc ctcgagaggg gccgatgccc agagacacag cccccacgga caaaaccccc 2520
cagatatcat ctacctagat ttaatataaa gttttatata ttatatggaa atatatatta 2580
tacttgtaat tatggagtca tttttacaat gtaattattt atgtatggtg caatgtgtgt 2640
atatggacaa aacaagaaag acgcactttg gcttataatt ctttcaatac agatatattt 2700
tctttctctt cctccttcct cttccttact ttttatatat atatataaag aaaatgatac 2760
agcagagcta ggtggaaaag cctgggtttg gtgtatggtt tttgagatat taatgcccag 2820
acaaaaagct aataccagtc actcgataat aaagtattcg cattatagtt ttttttaaaa 2880
aaaaaa 2886
<210> 60
<211> 3088
<212> DNA
<213> Homo sapiens
<400> 60
cggagagccg cgcagggcgc gggccgcgcg gggtggggca gccggagcgc aggcccccga 60
tccccggcgg gcgcccccgg gcccccgcgc gcgccccggc ctccgggaga ctggcgcatg 120
ccacggagcg cccctcgggc cgccgccgct cctgcccggg cccctgctgc tgctgctgtc 180
gcctgcgcct gctgccccaa ctcggcgccc gacttcttca tggtgtgcgg aggtcatgtt 240
cgctccttag caggcaaacg acttttctcc tcgcctcctc gccccgcatg ttcaggacca 300
aacgatctgc gctcgtccgg cgtctctgga ggagccgtgc gcccggcggc gaggacgagg 360
aggagggcgc agggggaggt ggaggaggag gcgagctgcg gggagaaggg gcgacggaca 420
gccgagcgca tggggccggt ggcggcggcc cgggcagggc tggatgctgc ctgggcaagg 480
cggtgcgagg tgccaaaggt caccaccatc cccacccgcc agccgcgggc gccggcgcgg 540
ccgggggcgc cgaggcggat ctgaaggcgc tcacgcactc ggtgctcaag aaactgaagg 600
agcggcagct ggagctgctg ctccaggccg tggagtcccg cggcgggacg cgcaccgcgt 660
gcctcctgct gcccggccgc ctggactgca ggctgggccc gggggcgccc gccggcgcgc 720
agcctgcgca gccgccctcg tcctactcgc tccccctcct gctgtgcaaa gtgttcaggt 780
ggccggatct caggcattcc tcggaagtca agaggctgtg ttgctgtgaa tcttacggga 840
agatcaaccc cgagctggtg tgctgcaacc cccatcacct tagccgactc tgcgaactag 900
agtctccccc ccctccttac tccagatacc cgatggattt tctcaaacca actgcagact 960
gtccagatgc tgtgccttcc tccgctgaaa cagggggaac gaattatctg gcccctgggg 1020
ggctttcaga ttcccaactt cttctggagc ctggggatcg gtcacactgg tgcgtggtgg 1080
catactggga ggagaagacg agagtgggga ggctctactg tgtccaggag ccctctctgg 1140
atatcttcta tgatctacct caggggaatg gcttttgcct cggacagctc aattcggaca 1200
acaagagtca gctggtgcag aaggtgcgga gcaaaatcgg ctgcggcatc cagctgacgc 1260
gggaggtgga tggtgtgtgg gtgtacaacc gcagcagtta ccccatcttc atcaagtccg 1320
ccacactgga caacccggac tccaggacgc tgttggtaca caaggtgttc cccggtttct 1380
ccatcaaggc tttcgactac gagaaggcgt acagcctgca gcggcccaat gaccacgagt 1440
ttatgcagca gccgtggacg ggctttaccg tgcagatcag ctttgtgaag ggctggggcc 1500
agtgctacac ccgccagttc atcagcagct gcccgtgctg gctagaggtc atcttcaaca 1560
gccggtagcc gcgtgcggag gggacagagc gtgagctgag caggccacac ttcaaactac 1620
tttgctgcta atattttcct cctgagtgct tgcttttcat gcaaactctt tggtcgtttt 1680
ttttttgttt gttggttggt tttcttcttc tcgtcctcgt ttgtgttctg ttttgtttcg 1740
ctctttgaga aatagcttat gaaaagaatt gttgggggtt tttttggaag aaggggcagg 1800
tatgatcggc aggacaccct gataggaaga ggggaagcag aaatccaagc accaccaaac 1860
acagtgtatg aaggggggcg gtcatcattt cacttgtcag gagtgtgtgt gagtgtgagt 1920
gtgcggctgt gtgtgcacgc gtgtgcagga gcggcagatg gggagacaac gtgctctttg 1980
ttttgtgtct cttatggatg tccccagcag agaggtttgc agtcccaagc ggtgtctctc 2040
ctgccccttg gacacgctca gtggggcaga ggcagtacct gggcaagctg gcggctgggg 2100
tcccagcagc tgccaggagc acggctctgt ccccagcctg ggaaagcccc tgcccctcct 2160
ctccctcatc aaggacacgg gcctgtccac aggcttctga gcagcgagcc tgctagtggc 2220
cgaaccagaa ccaattattt tcatccttgt cttattccct tcctgccagc ccctgccatt 2280
gtagcgtctt tcttttttgg ccatctgctc ctggatctcc ctgagatggg cttcccaagg 2340
gctgccgggg cagccccctc acagtattgc tcacccagtg ccctctcccc tcagcctctc 2400
ccctgcctgc cctggtgaca tcaggttttt cccggactta gaaaaccagc tcagcactgc 2460
ctgctcccat cctgtgtgtt aagctctgct attaggccag caagcgggga tgtccctggg 2520
agggacatgc ttagcagtcc ccttccctcc aagaaggatt tggtccgtca taacccaagg 2580
taccatccta ggctgacacc taactcttct ttcatttctt ctacaactca tacactcgta 2640
tgatacttcg acactgttct tagctcaatg agcatgttta gactttaaca taagctattt 2700
ttctaactac aaaggtttaa atgaacaaga gaagcattct cattggaaat ttagcattgt 2760
agtgctttga gagagaaagg actcctgaaa aaaaacctga gatttattaa agaaaaaaat 2820
gtattttatg ttatatataa atatattatt acttgtaaat ataaagacgt tttataagca 2880
tcattattta tgtattgtgc aatgtgtata aacaagaaaa ataaagaaaa gatgcacttt 2940
gctttaatat aaatgcaaat aacaaatgcc aaattaaaaa agataaacac aagattggtg 3000
tttttttcta tgggtgttat cacctagctg aatgtttttc taaaggagtt tatgttccat 3060
taaacgattt ttaaaatgta cacttgaa 3088
<210> 61
<211> 1722
<212> DNA
<213> Homo sapiens
<400> 61
attcattgcg ccgcggcacg gcctagcgag tggttcttct gcgctactgc tgcgcgaatc 60
ggcgacccca gtgcctcgac cactatgccg cgctctttcc tcgtcaggaa gccctccgac 120
cccaatcgga agcctaacta cagcgagctg caggactcta atccagagtt taccttccag 180
cagccctacg accaggccca cctgctggca gccatcccac ctccggagat cctcaacccc 240
accgcctcgc tgccaatgct catctgggac tctgtcctgg cgccccaagc ccagccaatt 300
gcctgggcct cccttcggct ccaggagagt cccagggtgg cagagctgac ctccctgtca 360
gatgaggaca gtgggaaagg ctcccagccc cccagcccac cctcaccggc tccttcgtcc 420
ttctcctcta cttcagtctc ttccttggag gccgaggcct atgctgcctt cccaggcttg 480
ggccaagtgc ccaagcagct ggcccagctc tctgaggcca aggatctcca ggctcgaaag 540
gccttcaact gcaaatactg caacaaggaa tacctcagcc tgggtgccct caagatgcac 600
atccgaagcc acacgctgcc ctgcgtctgc ggaacctgcg ggaaggcctt ctctaggccc 660
tggctgctac aaggccatgt ccggacccac actggcgaga agcccttctc ctgtccccac 720
tgcagccgtg ccttcgctga ccgctccaac ctgcgggccc acctccagac ccactcagat 780
gtcaagaagt accagtgcca ggcgtgtgct cggaccttct cccgaatgtc cctgctccac 840
aagcaccaag agtccggctg ctcaggatgt ccccgctgac cctcgaggct ccctcttcct 900
ctccatacct gcccctgcct gacagccttc cccagctcca gcaggaagga ccccacatcc 960
ttctcactgc catggaattc cctcctgagt gccccacttc tggccacatc agccccacag 1020
gactttgatg aagaccattt tctggttctg tgtcctctgc ctgggctctg gaagaggcct 1080
tcccatggcc atttctgtgg agggagggca gctggccccc agccctgggg gattcctgag 1140
ctggcctgtc tgcgtgggtt tttgtatcca gagctgtttg gatacagctg ctttgagcta 1200
caggacaaag gctgacagac tcactgggaa gctcccaccc cactcagggg accccactcc 1260
cctcacacac acccccccac aaggaaccct caggccaccc tccacgaggt gtgactaact 1320
atgcaataat ccacccccag gtgcagcccc agggcctgcg gaggcggtgg cagactagag 1380
tctgagatgc cccgagccca ggcagctatt tcagcctcct gtttggtggg gtggcacctg 1440
tttcccgggc aatttaacaa tgtctgaaaa gggactgtga gtaatggctg tcacttgtcg 1500
ggggcccaag tggggtgctc tggtctgacc gatgtgtctc ccagaactat tctgggggcc 1560
cgacaggtgg gcctgggagg aagatgttta catttttaaa ggtacactgg tatttatatt 1620
tcaaacattt tgtatcaagg aaacgttttg tatagttata tgtacagttt attgatattc 1680
aataaagcag ttaatttata tattaaaaaa aaaaaaaaaa aa 1722
<210> 62
<211> 2112
<212> DNA
<213> Homo sapiens
<400> 62
aaaacgggct cagttcgtaa aggagccggg tgacttcaga ggcgccggcc cgtccgtctg 60
ccgcacctga gcacggcccc tgcccgagcc tggcccgccg cgatgctgta gggaccgccg 120
tgtcctcccg ccggaccgtt atccgcgccg ggcgcccgcc agacccgctg gcaagatgcc 180
gcgctccttc ctggtcaaga agcatttcaa cgcctccaaa aagccaaact acagcgaact 240
ggacacacat acagtgatta tttccccgta tctctatgag agttactcca tgcctgtcat 300
accacaacca gagatcctca gctcaggagc atacagcccc atcactgtgt ggactaccgc 360
tgctccattc cacgcccagc tacccaatgg cctctctcct ctttccggat actcctcatc 420
tttggggcga gtgagtcccc ctcctccatc tgacacctcc tccaaggacc acagtggctc 480
agaaagcccc attagtgatg aagaggaaag actacagtcc aagctttcag acccccatgc 540
cattgaagct gaaaagtttc agtgcaattt atgcaataag acctattcaa ctttttctgg 600
gctggccaaa cataagcagc tgcactgcga tgcccagtct agaaaatctt tcagctgtaa 660
atactgtgac aaggaatatg tgagcctggg cgccctgaag atgcatattc ggacccacac 720
attaccttgt gtttgcaaga tctgcggcaa ggcgttttcc agaccctggt tgcttcaagg 780
acacattaga actcacacgg gggagaagcc tttttcttgc cctcactgca acagagcatt 840
tgcagacagg tcaaatctga gggctcatct gcagacccat tctgatgtaa agaaatacca 900
gtgcaaaaac tgctccaaaa ccttctccag aatgtctctc ctgcacaaac atgaggaatc 960
tggctgctgt gtagcacact gagtgacgca atcaatgttt actcgaacag aatgcatttc 1020
ttcactccga agccaaatga caaataaagt ccaaaggcat tttctcctgt gctgaccaac 1080
caaataatat gtatagacac acacacatat gcacacacac acacacacac ccacagagag 1140
agagctgcaa gagcatggaa ttcatgtgtt taaagataat cctttccatg tgaagtttaa 1200
aattactata tatttgctga tggctagatt gagagaataa aagacagtaa cctttctctt 1260
caaagataaa atgaaaagca cattgcatct tttcttccta aaaaaatgca aagatttaca 1320
ttgctgccaa atcatttcaa ctgaaaagaa cagtattgct ttgtaataga gtctgtaata 1380
ggatttccca taggaagaga tctgccagac gcgaactcag gtgccttaaa aagtattcca 1440
agtttactcc attacatgtc ggttgtctgg ttgccattgt tgaactaaag cctttttttg 1500
attacctgta gtgctttaaa gtatattttt aaaagggagg aaaaaaataa caagaacaaa 1560
acacaggaga atgtattaaa agtatttttg ttttgttttg tttttgccaa ttaacagtat 1620
gtgccttggg ggaggaggga aagattagct ttgaacattc ctggcgcatg ctccattgtc 1680
ttactatttt aaaacatttt aataattttt gaaaattaat taaagatggg aataagtgca 1740
aaagaggatt cttacaaatt cattaatgta cttaaactat ttcaaatgca taccacaaat 1800
gcaataatac aatacccctt ccaagtgcct ttttaaattg tatagttgat gagtcaatgt 1860
aaatttgtgt ttatttttat atgattgaat gagttctgta tgaaactgag atgttgtcta 1920
tagctatgtc tataaacaac ctgaagactt gtgaaatcaa tgtttctttt ttaaaaaaca 1980
attttcaagt tttttttaca ataaacagtt ttgatttaaa atctcgtttg tatactattt 2040
tcagagactt tacttgcttc atgattagta ccaaaccact gtacaaagaa ttgtttgtta 2100
acaagaaaaa aa 2112
<210> 63
<211> 3173
<212> DNA
<213> Homo sapiens
<400> 63
cggcgggcgg cagcagccta ggcagcagca gtagcagaag cagcagccgc cgagcagcag 60
caaggactct ggagtcagag taggactgta ggaccggagc ctgagtggaa caggagtgga 120
gctggcctgg gagagagcgg atccctccca gcaccctcag gccacccgtt gcctgcactc 180
tccctgccag acctccagag aggagagact cgggacagcc agccccaggt tcccccagct 240
ctctccatct gcctggctcc ttgggacccg ttccccagcc tcaggatggc gtcctccctg 300
cttgaggagg aagttcacta tggctccagt cccctggcca tgctgacggc agcgtgcagc 360
aaatttggtg gctctagccc tctgcgggac tcaacaactc tgggcaaagc aggcacaaag 420
aagccgtact ctgtgggcag tgacctttca gcctccaaaa ccatggggga tgcttatcca 480
gcccccttta caagcactaa tgggctcctt tcacctgcag gcagtcctcc agcacccacc 540
tcaggctatg ctaatgatta ccctcccttt tcccactcat tccctgggcc cacaggcacc 600
caggaccctg ggctactagt gcccaagggg cacagctctt ctgactgtct gcccagtgtc 660
tacacctctc tggacatgac acacccctat ggctcctggt acaaggcagg catccatgca 720
ggcatttcac caggcccagg caacactcct actccatggt gggatatgca ccctggaggc 780
aactggctag gtggtgggca gggccagggt gatgggctgc aagggacact gcccacaggt 840
ccagctcagc ctccactgaa cccccagctg cccacctacc catctgactt tgctcccctt 900
aatccagccc cctacccagc tccccacctc ttgcaaccag ggccccagca tgtcttgccc 960
caagatgtct ataaacccaa ggcagtggga aatagtgggc agctagaagg gagtggtgga 1020
gccaaacccc cacggggtgc aagcactggg ggtagtggtg gatatggggg cagtggggca 1080
gggcgctcct cctgcgactg ccctaattgc caggagctag agcggctggg agcagcagcg 1140
gctgggctgc ggaagaagcc catccacagc tgccacatcc ctggctgcgg caaggtgtat 1200
ggcaaggctt cgcacctgaa ggcccacttg cgctggcaca caggcgagag gcccttcgtc 1260
tgcaactggc tcttctgcgg caagaggttc actcgttcgg atgagctgga gcgtcatgtg 1320
cgcactcaca cccgggagaa gaagttcacc tgcctgctct gctccaagcg ctttacccga 1380
agcgaccacc tgagcaaaca ccagcgcacc catggagaac caggcccggg tccccctccc 1440
agtggcccca aggagctggg ggagggccgc agcacggggg aagaggaggc cagtcagacg 1500
ccccgacctt ctgcctcgcc agcaacccca gagaaagccc ctggaggcag ccctgagcag 1560
agcaacttgc tggagatctg agccgggtgg aaggtctccc accccagggc tgccctgaca 1620
gtctctcttg gctctctaga ccactgcttg ccaatcactc tctttacccc atgcatgcca 1680
tccttcgggg ctctctccct ctgtctccct cctggccatt ctgggcttgg gtatctcctt 1740
gcatgcctcc tcagctcacc ttctctcttc accatgagac tggctttcca caaactctca 1800
tctcaggccc tccccttgtg cctgatacct gcactccggc ttcctagact ctggccctgc 1860
cacaccaaca cactttctat ttgggctccc aacactattt ctccatctca ctccttgaca 1920
tgtacccctt tctgcttctc aagcttattt cctgctgtcc ctcagcctcc aggcttcagt 1980
cttcccaact tcttacacca ttgctttcca ttctccagaa ctcttttttc ctttttacaa 2040
acacaatgat aatgataatt tattgccccc tggtggcctc ttcatcaggg gtattggggt 2100
tagtgacctg gccagagggt gccaagaggg gggcagacca gtggggatct gatcccaaag 2160
atggggtgac cccagggtca gggaggctgc ccccaggcct gtatatttaa cccctatgta 2220
ccaggagtaa tgaatagtaa taattctatt tatgtaagtt atgatgacgg gtcaggtaga 2280
gtgagctggg gagggaagtg gatccatttc tgctaaggaa attctagtca aatgcatctc 2340
tgtatagaca aaatgttagt ggagaagatc ttgttaatag aatgtctatc atcagaatct 2400
cagttgatag ggtttctctt gtaatgaagt ctctacaaat tgggttagct acatctctgc 2460
taaacagttg atggggtatc tcttgattag ggggatccct aatatcccca gccccagcca 2520
gaagctgtga aacctcaagt cctatggagg ggagaaggac tggaatgtac cccatctccc 2580
ttgactgcag agcaggttcc tccactgccc caccccttag acaccatgac cccatcaggt 2640
taatcccctg ttgccatggt tatggagagc ttgcagctgc catcttagat gtgctctttg 2700
gggaagccca tctaacagga ggacattggt ttgggggtgc acctcctgaa gaatgggtgg 2760
ggaaggcttt ctctaggatc agattcaaat aagtatgtat tgagtgccta ctctgtgcaa 2820
ggcactatgc tagatctggt gcctagaagc cctgagaaag aacttaaaga gctaggagga 2880
cagaggcccc caagctgatc tggtggtgca tccacgcacc cccaccctgg gactttggat 2940
gctcccatct ccacctccag tgacttttaa agccgcttcg tgcctttcct gtaacgttgg 3000
atcctccttt tctgtcccct gctgtctcaa ggccccaagt taaagggtta aagccgctgg 3060
agcttgggga gagaacattg tggaatggaa gggatcatgc cctttgtgga gtcttttttt 3120
tttaatttaa taaataaaag ttggatttga aaaaaaaaaa aaaaaaaaaa aaa 3173
<210> 64
<211> 1616
<212> DNA
<213> Homo sapiens
<400> 64
ctccctgtgt tggtggagga tgtctgcagc agcatttaaa ttctgggagg gcttggttgt 60
cagcagcagc aggaggaggc agagcacagc atcgtcggga ccagactcgt ctcaggccag 120
ttgcagcctt ctcagccaaa cgccgaccaa ggaaaactca ctaccatgag aattgcagtg 180
atttgctttt gcctcctagg catcacctgt gccataccag ttaaacaggc tgattctgga 240
agttctgagg aaaagcagct ttacaacaaa tacccagatg ctgtggccac atggctaaac 300
cctgacccat ctcagaagca gaatctccta gccccacaga cccttccaag taagtccaac 360
gaaagccatg accacatgga tgatatggat gatgaagatg atgatgacca tgtggacagc 420
caggactcca ttgactcgaa cgactctgat gatgtagatg acactgatga ttctcaccag 480
tctgatgagt ctcaccattc tgatgaatct gatgaactgg tcactgattt tcccacggac 540
ctgccagcaa ccgaagtttt cactccagtt gtccccacag tagacacata tgatggccga 600
ggtgatagtg tggtttatgg actgaggtca aaatctaaga agtttcgcag acctgacatc 660
cagtaccctg atgctacaga cgaggacatc acctcacaca tggaaagcga ggagttgaat 720
ggtgcataca aggccatccc cgttgcccag gacctgaacg cgccttctga ttgggacagc 780
cgtgggaagg acagttatga aacgagtcag ctggatgacc agagtgctga aacccacagc 840
cacaagcagt ccagattata taagcggaaa gccaatgatg agagcaatga gcattccgat 900
gtgattgata gtcaggaact ttccaaagtc agccgtgaat tccacagcca tgaatttcac 960
agccatgaag atatgctggt tgtagacccc aaaagtaagg aagaagataa acacctgaaa 1020
tttcgtattt ctcatgaatt agatagtgca tcttctgagg tcaattaaaa ggagaaaaaa 1080
tacaatttct cactttgcat ttagtcaaaa gaaaaaatgc tttatagcaa aatgaaagag 1140
aacatgaaat gcttctttct cagtttattg gttgaatgtg tatctatttg agtctggaaa 1200
taactaatgt gtttgataat tagtttagtt tgtggcttca tggaaactcc ctgtaaacta 1260
aaagcttcag ggttatgtct atgttcattc tatagaagaa atgcaaacta tcactgtatt 1320
ttaatatttg ttattctctc atgaatagaa atttatgtag aagcaaacaa aatactttta 1380
cccacttaaa aagagaatat aacattttat gtcactataa tcttttgttt tttaagttag 1440
tgtatatttt gttgtgatta tctttttgtg gtgtgaataa atcttttatc ttgaatgtaa 1500
taagaatttg gtggtgtcaa ttgcttattt gttttcccac ggttgtccag caattaataa 1560
aacataacct tttttactgc ctaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaa 1616
<210> 65
<211> 1574
<212> DNA
<213> Homo sapiens
<400> 65
tcaccacggc ggcagccctt taaacccctc acccagccag cgccccatcc tgtctgtccg 60
aacccagaca caagtcttca ctccttcctg cgagccctga ggaagccttg tgagtgcatt 120
ggctggggct tggagggaag ttgggctgga gctggacagg agcagtgggt gcatttcagg 180
caggctctcc tgaggtccca ggcgccagct ccagctccct ggctagggaa acccaccctc 240
tcagtcagca tgggggccca agctccaggc agggtgggct ggatcactag cgtcctggat 300
ctctctcaga ctgggcagcc ccgggctcat tgaaatgccc cggatgactt ggctagtgca 360
gaggaattga tggaaaccac cggggtgaga gggaggctcc ccatctcagc cagccacatc 420
cacaaggtgt gtgtaagggt gcaggcgccg gccggttagg ccaaggctct actgtctgtt 480
gcccctccag gagaacttcc aaggagcttt ccccagacat ggccaacaag ggtccttcct 540
atggcatgag ccgcgaagtg cagtccaaaa tcgagaagaa gtatgacgag gagctggagg 600
agcggctggt ggagtggatc atagtgcagt gtggccctga tgtgggccgc ccagaccgtg 660
ggcgcttggg cttccaggtc tggctgaaga atggcgtgat tctgagcaag ctggtgaaca 720
gcctgtaccc tgatggctcc aagccggtga aggtgcccga gaacccaccc tccatggtct 780
tcaagcagat ggagcaggtg gctcagttcc tgaaggcggc tgaggactat ggggtcatca 840
agactgacat gttccagact gttgacctct ttgaaggcaa agacatggca gcagtgcaga 900
ggaccctgat ggctttgggc agcttggcag tgaccaagaa tgatgggcac taccgtggag 960
atcccaactg gtttatgaag aaagcgcagg agcataagag ggaattcaca gagagccagc 1020
tgcaggaggg aaagcatgtc attggccttc agatgggcag caacagaggg gcctcccagg 1080
ccggcatgac aggctacgga cgacctcggc agatcatcag ttagagcgga gagggctagc 1140
cctgagcccg gccctccccc agctccttgg ctgcagccat cccgcttagc ctgcctcacc 1200
cacacccgtg tggtaccttc agccctggcc aagctttgag gctctgtcac tgagcaatgg 1260
taactgcacc tgggcagctc ctccctgtgc ccccagcctc agcccaactt cttacccgaa 1320
agcatcactg ccttggcccc tccctcccgg ctgcccccat cacctctact gtctcctccc 1380
tgggctaagc aggggagaag cgggctgggg gtagcctgga tgtgggccaa gtccactgtc 1440
ctccttggcg gcaaaagccc attgaagaag aaccagccca gcctgccccc tatcttgtcc 1500
tggaatattt ttggggttgg aactcaaaaa aaaaaaaaaa aaatcaatct tttctcaaaa 1560
aaaaaaaaaa aaaa 1574
<210> 66
<211> 3829
<212> DNA
<213> Homo sapiens
<400> 66
caggcagcgc tgcgtcctgc tgcgcacgtg ggaagccctg gccccggcca cccccgcgat 60
gccgcgcgct ccccgctgcc gagccgtgcg ctccctgctg cgcagccact accgcgaggt 120
gctgccgctg gccacgttcg tgcggcgcct ggggccccag ggctggcggc tggtgcagcg 180
cggggacccg gcggctttcc gcgcgctggt ggcccagtgc ctggtgtgcg tgccctggga 240
cgcacggccg ccccccgccg ccccctcctt ccgccaggtg tcctgcctga aggagctggt 300
ggcccgagtg ctgcagaggc tgtgcgagcg cggcgcgaag aacgtgctgg ccttcggctt 360
cgcgctgctg gacggggccc gcgggggccc ccccgaggcc ttcaccacca gcgtgcgcag 420
ctacctgccc aacacggtga ccgacgcact gcgggggagc ggggcgtggg ggctgctgct 480
gcgccgcgtg ggcgacgacg tgctggttca cctgctggca cgctgcgcgc tctttgtgct 540
ggtggctccc agctgcgcct accaggtgtg cgggccgccg ctgtaccagc tcggcgctgc 600
cactcaggcc cggcccccgc cacacgctag tggaccccga aggcgtctgg gatgcgaacg 660
ggcctggaac catagcgtca gggaggccgg ggtccccctg ggcctgccag ccccgggtgc 720
gaggaggcgc gggggcagtg ccagccgaag tctgccgttg cccaagaggc ccaggcgtgg 780
cgctgcccct gagccggagc ggacgcccgt tgggcagggg tcctgggccc acccgggcag 840
gacgcgtgga ccgagtgacc gtggtttctg tgtggtgtca cctgccagac ccgccgaaga 900
agccacctct ttggagggtg cgctctctgg cacgcgccac tcccacccat ccgtgggccg 960
ccagcaccac gcgggccccc catccacatc gcggccacca cgtccctggg acacgccttg 1020
tcccccggtg tacgccgaga ccaagcactt cctctactcc tcaggcgaca aggagcagct 1080
gcggccctcc ttcctactca gctctctgag gcccagcctg actggcgctc ggaggctcgt 1140
ggagaccatc tttctgggtt ccaggccctg gatgccaggg actccccgca ggttgccccg 1200
cctgccccag cgctactggc aaatgcggcc cctgtttctg gagctgcttg ggaaccacgc 1260
gcagtgcccc tacggggtgc tcctcaagac gcactgcccg ctgcgagctg cggtcacccc 1320
agcagccggt gtctgtgccc gggagaagcc ccagggctct gtggcggccc ccgaggagga 1380
ggacacagac ccccgtcgcc tggtgcagct gctccgccag cacagcagcc cctggcaggt 1440
gtacggcttc gtgcgggcct gcctgcgccg gctggtgccc ccaggcctct ggggctccag 1500
gcacaacgaa cgccgcttcc tcaggaacac caagaagttc atctccctgg ggaagcatgc 1560
caagctctcg ctgcaggagc tgacgtggaa gatgagcgtg cgggactgcg cttggctgcg 1620
caggagccca ggggttggct gtgttccggc cgcagagcac cgtctgcgtg aggagatcct 1680
ggccaagttc ctgcactggc tgatgagtgt gtacgtcgtc gagctgctca ggtctttctt 1740
ttatgtcacg gagaccacgt ttcaaaagaa caggctcttt ttctaccgga agagtgtctg 1800
gagcaagttg caaagcattg gaatcagaca gcacttgaag agggtgcagc tgcgggagct 1860
gtcggaagca gaggtcaggc agcatcggga agccaggccc gccctgctga cgtccagact 1920
ccgcttcatc cccaagcctg acgggctgcg gccgattgtg aacatggact acgtcgtggg 1980
agccagaacg ttccgcagag aaaagagggc cgagcgtctc acctcgaggg tgaaggcact 2040
gttcagcgtg ctcaactacg agcgggcgcg gcgccccggc ctcctgggcg cctctgtgct 2100
gggcctggac gatatccaca gggcctggcg caccttcgtg ctgcgtgtgc gggcccagga 2160
cccgccgcct gagctgtact ttgtcaaggt ggatgtgacg ggcgcgtacg acaccatccc 2220
ccaggacagg ctcacggagg tcatcgccag catcatcaaa ccccagaaca cgtactgcgt 2280
gcgtcggtat gccgtggtcc agaaggccgc ccatgggcac gtccgcaagg ccttcaagag 2340
ccacgtctct accttgacag acctccagcc gtacatgcga cagttcgtgg ctcacctgca 2400
ggagaccagc ccgctgaggg atgccgtcgt catcgagcag agctcctccc tgaatgaggc 2460
cagcagtggc ctcttcgacg tcttcctacg cttcatgtgc caccacgccg tgcgcatcag 2520
gggcaagtcc tacgtccagt gccaggggat cccgcagggc tccatcctct ccacgctgct 2580
ctgcagcctg tgctacggcg acatggagaa caagctgttt gcggggattc ggcgggacgg 2640
gctgctcctg cgtttggtgg atgatttctt gttggtgaca cctcacctca cccacgcgaa 2700
aaccttcctc agctatgccc ggacctccat cagagccagt ctcaccttca accgcggctt 2760
caaggctggg aggaacatgc gtcgcaaact ctttggggtc ttgcggctga agtgtcacag 2820
cctgtttctg gatttgcagg tgaacagcct ccagacggtg tgcaccaaca tctacaagat 2880
cctcctgctg caggcgtaca ggtttcacgc atgtgtgctg cagctcccat ttcatcagca 2940
agtttggaag aaccccacat ttttcctgcg cgtcatctct gacacggcct ccctctgcta 3000
ctccatcctg aaagccaaga acgcagggat gtcgctgggg gccaagggcg ccgccggccc 3060
tctgccctcc gaggccgtgc agtggctgtg ccaccaagca ttcctgctca agctgactcg 3120
acaccgtgtc acctacgtgc cactcctggg gtcactcagg acagcccaga cgcagctgag 3180
tcggaagctc ccggggacga cgctgactgc cctggaggcc gcagccaacc cggcactgcc 3240
ctcagacttc aagaccatcc tggactgatg gccacccgcc cacagccagg ccgagagcag 3300
acaccagcag ccctgtcacg ccgggctcta cgtcccaggg agggaggggc ggcccacacc 3360
caggcccgca ccgctgggag tctgaggcct gagtgagtgt ttggccgagg cctgcatgtc 3420
cggctgaagg ctgagtgtcc ggctgaggcc tgagcgagtg tccagccaag ggctgagtgt 3480
ccagcacacc tgccgtcttc acttccccac aggctggcgc tcggctccac cccagggcca 3540
gcttttcctc accaggagcc cggcttccac tccccacata ggaatagtcc atccccagat 3600
tcgccattgt tcacccctcg ccctgccctc ctttgccttc cacccccacc atccaggtgg 3660
agaccctgag aaggaccctg ggagctctgg gaatttggag tgaccaaagg tgtgccctgt 3720
acacaggcga ggaccctgca cctggatggg ggtccctgtg ggtcaaattg gggggaggtg 3780
ctgtgggagt aaaatactga atatatgagt ttttcagttt tgaaaaaaa 3829
<210> 67
<211> 6244
<212> DNA
<213> Homo sapiens
<400> 67
ggcgaggcga ggtttgctgg ggtgaggcag cggcgcggcc gggccgggcc gggccacagg 60
cggtggcggc gggaccatgg aggcggcggt cgctgctccg cgtccccggc tgctcctcct 120
cgtgctggcg gcggcggcgg cggcggcggc ggcgctgctc ccgggggcga cggcgttaca 180
gtgtttctgc cacctctgta caaaagacaa ttttacttgt gtgacagatg ggctctgctt 240
tgtctctgtc acagagacca cagacaaagt tatacacaac agcatgtgta tagctgaaat 300
tgacttaatt cctcgagata ggccgtttgt atgtgcaccc tcttcaaaaa ctgggtctgt 360
gactacaaca tattgctgca atcaggacca ttgcaataaa atagaacttc caactactgg 420
tttaccattg cttgttcaga gaacaattgc gagaactatt gtgttacaag aaagcattgg 480
caaaggtcga tttggagaag tttggagagg aaagtggcgg ggagaagaag ttgctgttaa 540
gatattctcc tctagagaag aacgttcgtg gttccgtgag gcagagattt atcaaactgt 600
aatgttacgt catgaaaaca tcctgggatt tatagcagca gacaataaag acaatggtac 660
ttggactcag ctctggttgg tgtcagatta tcatgagcat ggatcccttt ttgattactt 720
aaacagatac acagttactg tggaaggaat gataaaactt gctctgtcca cggcgagcgg 780
tcttgcccat cttcacatgg agattgttgg tacccaagga aagccagcca ttgctcatag 840
agatttgaaa tcaaagaata tcttggtaaa gaagaatgga acttgctgta ttgcagactt 900
aggactggca gtaagacatg attcagccac agataccatt gatattgctc caaaccacag 960
agtgggaaca aaaaggtaca tggcccctga agttctcgat gattccataa atatgaaaca 1020
ttttgaatcc ttcaaacgtg ctgacatcta tgcaatgggc ttagtattct gggaaattgc 1080
tcgacgatgt tccattggtg gaattcatga agattaccaa ctgccttatt atgatcttgt 1140
accttctgac ccatcagttg aagaaatgag aaaagttgtt tgtgaacaga agttaaggcc 1200
aaatatccca aacagatggc agagctgtga agccttgaga gtaatggcta aaattatgag 1260
agaatgttgg tatgccaatg gagcagctag gcttacagca ttgcggatta agaaaacatt 1320
atcgcaactc agtcaacagg aaggcatcaa aatgtaattc tacagctttg cctgaactct 1380
ccttttttct tcagatctgc tcctgggttt taatttggga ggtcaattgt tctacctcac 1440
tgagagggaa cagaaggata ttgcttcctt ttgcagcagt gtaataaagt caattaaaaa 1500
cttcccagga tttctttgga cccaggaaac agccatgtgg gtcctttctg tgcactatga 1560
acgcttcttt cccaggacag aaaatgtgta gtctaccttt attttttatt aacaaaactt 1620
gttttttaaa aagatgattg ctggtcttaa ctttaggtaa ctctgctgtg ctggagatca 1680
tctttaaggg caaaggagtt ggattgctga attacaatga aacatgtctt attactaaag 1740
aaagtgattt actcctggtt agtacattct cagaggattc tgaaccacta gagtttcctt 1800
gattcagact ttgaatgtac tgttctatag tttttcagga tcttaaaact aacacttata 1860
aaactcttat cttgagtcta aaaatgacct catatagtag tgaggaacat aattcatgca 1920
attgtatttt gtatactatt attgttcttt cacttattca gaacattaca tgccttcaaa 1980
atgggattgt actataccag taagtgccac ttctgtgtct ttctaatgga aatgagtaga 2040
attgctgaaa gtctctatgt taaaacctat agtgtttgaa ttcaaaaagc ttatttatct 2100
gggtaaccca aactttttct gttttgtttt tggaagggtt tttgtggtat gtcatttggt 2160
attctattct gaaaatgcct ttctcctacc aaaatgtgct taagccacta aagaaatgaa 2220
gtggcattaa ttagtaaatt attagcatgg tcatgtttga atattctcac atcaagcttt 2280
tgcattttaa ttgtgttgtc taagtatact tttaaaaaat caagtggcac tctagatgct 2340
tatagtactt taatatttgt agcatacaga ctaatttttc taaaagggaa agtctgtcta 2400
gctgcttgtg aaaagttatg tggtattctg taagccattt ttttctttat ctgttcaaag 2460
acttattttt taagacatga attacattta aaattagaat atggttaata ttaaataata 2520
ggcctttttc taggaaggcg aaggtagtta ataatttgaa tagataacag atgtgcaaga 2580
aagtcacatt tgttatgtat gtaggagtaa acgttcggtg gatcctctgt ctttgtaact 2640
gaggttagag ctagtgtggt tttgaggtct cactacactt tgaggaaggc agcttttaat 2700
tcagtgtttc cttatgtgtg cgtacattgc aactgcttac atgtaattta tgtaatgcat 2760
tcagtgcacc cttgttactt gggagaggtg gtagctaaag aacattctga gtataggttt 2820
ttctccattt acagatgtct ttggtcaaat attgaaagca aacttgtcat ggtcttctta 2880
cattaagttg aaactagctt ataataactg gtttttactt ccaatgctat gaagtctctg 2940
cagggctttt acagttttcg aagtcctttt atcactgtga tcttattctg aggggagaaa 3000
aaactatcat agctctgagg caagacttcg actttatagt gctatcagtt ccccgataca 3060
gggtcagagt aacccataca gtattttggt caggaagaga aagtggccat ttacactgaa 3120
tgagttgcat tctgataatg tcttatctct tatacgtaga ataaatttga aagactattt 3180
gatcttaaaa ccaaagtaat tttagaatga gtgacatatt acataggaat ttagtgtcaa 3240
tttcatgtgt ttaaaaacat catgggaaaa atgcttagag gttactattt tgactacaaa 3300
gttgagtttt tttctgtagt taccataatt tcattgaagc aaatgaatga gtttgagagg 3360
tttgttttta tagttgtgtt gtattacttg tttaataata atctctaatt ctgtgatcag 3420
gtactttttt tgtgggggtt ttttttttgt tttttttttt ttgttgttgt ttttgggcca 3480
tttctaagcc taccagatct gctttatgaa atccagggga ccaatgcatt ttatcactaa 3540
aactattttt atataatttt aagaatatac caaaagttgt ctgatttaaa gttgtaatac 3600
atgatttctc actttcatgt aaggttatcc acttttgctg aagatatttt ttattgaatc 3660
aaagattgag ttacaattat acttttctta cctaagtgga taaaatgtac ttttgatgaa 3720
tcagggaatt tttttaaagt tggagtttag ttctaaattg actttacgta ttactgcagt 3780
taattccttt tttggctagg gatggtttga taaaccacaa ttggctgata ttgaaaatga 3840
aagaaactta aaaggtggga tggatcatga ttactgtcga taactgcaga taaatttgat 3900
tagagtaata attttgtcat ttaaaaacac agttgtttat actgcccatc ctaggatgct 3960
caccttccaa gattcaacgt ggctaaaaca tcttctggta aattgtgcgt ccatattcat 4020
tttgtcagta gccaggagaa atggggatgg gggaaatacg acttagtgag gcatagacat 4080
ccctggtcca tcctttctgt ctccagctgt ttcttggaac ctgctctcct gcttgctggt 4140
ccctgacgca gagaccgttg cctcccccac agccgtttga ctgaaggctg ctctggagac 4200
ctagagtaaa acggctgatg gaagttgtgg gacccacttc catttccttc agtcattaga 4260
ggtggaaggg aggggtctcc aagtttggag attgagcaga tgaggcttgg gatgcccctg 4320
ctttgacttc agccatggat gaggagtggg atggcagcaa ggtggctcct gtggcagtgg 4380
agttgtgcca gaaacagtgg ccagttgtat cgcctataag acagggtaag gtctgaagag 4440
ctgagcctgt aattctgctg taataatgat agtgctcaag aagtgccttg agttggtgta 4500
cagtgccatg gccatcaaga atcccagatt tcaggtttta ttacaaaatg taagtggtca 4560
cttggcgatt ttgtagtaca tgcatgagtt accttttttc tctatgtctg agaactgtca 4620
gattaaaaca agatggcaaa gagatcgtta gagtgcacaa caaaatcact atcccattag 4680
acacatcatc aaaagcttat ttttattctt gcactggaag aatcgtaagt caactgtttc 4740
ttgaccatgg cagtgttctg gctccaaatg gtagtgattc caaataatgg ttctgttaac 4800
actttggcag aaaatgccag ctcagatatt ttgagatact aaggattatc tttggacatg 4860
tactgcagct tcttgtctct gttttggatt actggaatac ccatgggccc tctcaagagt 4920
gctggacttc taggacatta agatgattgt cagtacatta aacttttcaa tcccattatg 4980
caatcttgtt tgtaaatgta aacttctaaa aatatggtta ataacattca acctgtttat 5040
tacaacttaa aaggaacttc agtgaatttg tttttatttt ttaacaagat ttgtgaactg 5100
aatatcatga accatgtttt gatacccctt tttcacgttg tgccaacgga atagggtgtt 5160
tgatatttct tcatatgtta aggagatgct tcaaaatgtc aattgcttta aacttaaatt 5220
acctctcaag agaccaaggt acatttacct cattgtgtat ataatgttta atatttgtca 5280
gagcattctc caggtttgca gttttatttc tataaagtat gggtattatg ttgctcagtt 5340
actcaaatgg tactgtattg tttatatttg taccccaaat aacatcgtct gtactttctg 5400
ttttctgtat tgtatttgtg caggattctt taggctttat cagtgtaatc tctgcctttt 5460
aagatatgta cagaaaatgt ccatataaat ttccattgaa gtcgaatgat actgagaagc 5520
ctgtaaagag gagaaaaaaa cataagctgt gtttccccat aagttttttt aaattgtata 5580
ttgtatttgt agtaatattc caaaagaatg taaataggaa atagaagagt gatgcttatg 5640
ttaagtccta acactacagt agaagaatgg aagcagtgca aataaattac atttttccca 5700
agtgccagtg gcatatttta aaataaagtg tatacgttgg aatgagtcat gccatatgta 5760
gttgctgtag atggcaacta gaacctttga gttacaagag tctttagaag ttttctaacc 5820
ctgcctagtg caagttacaa tattatagcg tgttcgggga gtgccctcct gtctgcaggt 5880
gtgtctctgt gcctgggggc ttttctccac atgcttaggg gtgtgggtct tccattgggg 5940
catgatggac ctgtctacag gtgatctctg ttgcctttgg gtcagcacat ttgttagtct 6000
cctgggggtg aaaacttggc ttacaagaga actggaaaaa tgatgagatg tggtccccaa 6060
acccttgatt gactctgggg aggggctttg tgaataggat tgctctcaca ttaaagatag 6120
ttacttcaat ttgaaggctg gatttaggga tttttttttt tccttataac aaagacatca 6180
ccaggatatg aagcttttgt tgaaagttgg aaaaaaagtg aaattaaaga cattcccaga 6240
caaa 6244
<210> 68
<211> 931
<212> DNA
<213> Homo sapiens
<400> 68
tttcgtcggc ccgccccttg gcttctgcac tgatggtggg tggatgagta atgcatccag 60
gaagcctgga ggcctgtggt ttccgcaccc gctgccaccc ccgcccctag cgtggacatt 120
tatcctctag cgctcaggcc ctgccgccat cgccgcagat ccagcgccca gagagacacc 180
agagaaccca ccatggcccc ctttgagccc ctggcttctg gcatcctgtt gttgctgtgg 240
ctgatagccc ccagcagggc ctgcacctgt gtcccacccc acccacagac ggccttctgc 300
aattccgacc tcgtcatcag ggccaagttc gtggggacac cagaagtcaa ccagaccacc 360
ttataccagc gttatgagat caagatgacc aagatgtata aagggttcca agccttaggg 420
gatgccgctg acatccggtt cgtctacacc cccgccatgg agagtgtctg cggatacttc 480
cacaggtccc acaaccgcag cgaggagttt ctcattgctg gaaaactgca ggatggactc 540
ttgcacatca ctacctgcag ttttgtggct ccctggaaca gcctgagctt agctcagcgc 600
cggggcttca ccaagaccta cactgttggc tgtgaggaat gcacagtgtt tccctgttta 660
tccatcccct gcaaactgca gagtggcact cattgcttgt ggacggacca gctcctccaa 720
ggctctgaaa agggcttcca gtcccgtcac cttgcctgcc tgcctcggga gccagggctg 780
tgcacctggc agtccctgcg gtcccagata gcctgaatcc tgcccggagt ggaagctgaa 840
gcctgcacag tgtccaccct gttcccactc ccatctttct tccggacaat gaaataaaga 900
gttaccaccc agcagaaaaa aaaaaaaaaa a 931
<210> 69
<211> 3677
<212> DNA
<213> Homo sapiens
<400> 69
tcgcggaggc ttggggcagc cgggtagctc ggaggtcgtg gcgctggggg ctagcaccag 60
cgctctgtcg ggaggcgcag cggttaggtg gaccggtcag cggactcacc ggccagggcg 120
ctcggtgctg gaatttgata ttcattgatc cgggttttat ccctcttctt ttttcttaaa 180
catttttttt taaaactgta ttgtttctcg ttttaattta tttttgcttg ccattcccca 240
cttgaatcgg gccgacggct tggggagatt gctctacttc cccaaatcac tgtggatttt 300
ggaaaccagc agaaagagga aagaggtagc aagagctcca gagagaagtc gaggaagaga 360
gagacggggt cagagagagc gcgcgggcgt gcgagcagcg aaagcgacag gggcaaagtg 420
agtgacctgc ttttgggggt gaccgccgga gcgcggcgtg agccctcccc cttgggatcc 480
cgcagctgac cagtcgcgct gacggacaga cagacagaca ccgcccccag ccccagctac 540
cacctcctcc ccggccggcg gcggacagtg gacgcggcgg cgagccgcgg gcaggggccg 600
gagcccgcgc ccggaggcgg ggtggagggg gtcggggctc gcggcgtcgc actgaaactt 660
ttcgtccaac ttctgggctg ttctcgcttc ggaggagccg tggtccgcgc gggggaagcc 720
gagccgagcg gagccgcgag aagtgctagc tcgggccggg aggagccgca gccggaggag 780
ggggaggagg aagaagagaa ggaagaggag agggggccgc agtggcgact cggcgctcgg 840
aagccgggct catggacggg tgaggcggcg gtgtgcgcag acagtgctcc agccgcgcgc 900
gctccccagg ccctggcccg ggcctcgggc cggggaggaa gagtagctcg ccgaggcgcc 960
gaggagagcg ggccgcccca cagcccgagc cggagaggga gcgcgagccg cgccggcccc 1020
ggtcgggcct ccgaaaccat gaactttctg ctgtcttggg tgcattggag ccttgccttg 1080
ctgctctacc tccaccatgc caagtggtcc caggctgcac ccatggcaga aggaggaggg 1140
cagaatcatc acgaagtggt gaagttcatg gatgtctatc agcgcagcta ctgccatcca 1200
atcgagaccc tggtggacat cttccaggag taccctgatg agatcgagta catcttcaag 1260
ccatcctgtg tgcccctgat gcgatgcggg ggctgctgca atgacgaggg cctggagtgt 1320
gtgcccactg aggagtccaa catcaccatg cagattatgc ggatcaaacc tcaccaaggc 1380
cagcacatag gagagatgag cttcctacag cacaacaaat gtgaatgcag accaaagaaa 1440
gatagagcaa gacaagaaaa aaaatcagtt cgaggaaagg gaaaggggca aaaacgaaag 1500
cgcaagaaat cccggtataa gtcctggagc gtgtacgttg gtgcccgctg ctgtctaatg 1560
ccctggagcc tccctggccc ccatccctgt gggccttgct cagagcggag aaagcatttg 1620
tttgtacaag atccgcagac gtgtaaatgt tcctgcaaaa acacagactc gcgttgcaag 1680
gcgaggcagc ttgagttaaa cgaacgtact tgcagatgtg acaagccgag gcggtgagcc 1740
gggcaggagg aaggagcctc cctcagggtt tcgggaacca gatctctcac caggaaagac 1800
tgatacagaa cgatcgatac agaaaccacg ctgccgccac cacaccatca ccatcgacag 1860
aacagtcctt aatccagaaa cctgaaatga aggaagagga gactctgcgc agagcacttt 1920
gggtccggag ggcgagactc cggcggaagc attcccgggc gggtgaccca gcacggtccc 1980
tcttggaatt ggattcgcca ttttattttt cttgctgcta aatcaccgag cccggaagat 2040
tagagagttt tatttctggg attcctgtag acacacccac ccacatacat acatttatat 2100
atatatatat tatatatata taaaaataaa tatctctatt ttatatatat aaaatatata 2160
tattcttttt ttaaattaac agtgctaatg ttattggtgt cttcactgga tgtatttgac 2220
tgctgtggac ttgagttggg aggggaatgt tcccactcag atcctgacag ggaagaggag 2280
gagatgagag actctggcat gatctttttt ttgtcccact tggtggggcc agggtcctct 2340
cccctgccca ggaatgtgca aggccagggc atgggggcaa atatgaccca gttttgggaa 2400
caccgacaaa cccagccctg gcgctgagcc tctctacccc aggtcagacg gacagaaaga 2460
cagatcacag gtacagggat gaggacaccg gctctgacca ggagtttggg gagcttcagg 2520
acattgctgt gctttgggga ttccctccac atgctgcacg cgcatctcgc ccccaggggc 2580
actgcctgga agattcagga gcctgggcgg ccttcgctta ctctcacctg cttctgagtt 2640
gcccaggaga ccactggcag atgtcccggc gaagagaaga gacacattgt tggaagaagc 2700
agcccatgac agctcccctt cctgggactc gccctcatcc tcttcctgct ccccttcctg 2760
gggtgcagcc taaaaggacc tatgtcctca caccattgaa accactagtt ctgtcccccc 2820
aggagacctg gttgtgtgtg tgtgagtggt tgaccttcct ccatcccctg gtccttccct 2880
tcccttcccg aggcacagag agacagggca ggatccacgt gcccattgtg gaggcagaga 2940
aaagagaaag tgttttatat acggtactta tttaatatcc ctttttaatt agaaattaaa 3000
acagttaatt taattaaaga gtagggtttt ttttcagtat tcttggttaa tatttaattt 3060
caactattta tgagatgtat cttttgctct ctcttgctct cttatttgta ccggtttttg 3120
tatataaaat tcatgtttcc aatctctctc tccctgatcg gtgacagtca ctagcttatc 3180
ttgaacagat atttaatttt gctaacactc agctctgccc tccccgatcc cctggctccc 3240
cagcacacat tcctttgaaa taaggtttca atatacatct acatactata tatatatttg 3300
gcaacttgta tttgtgtgta tatatatata tatatgttta tgtatatatg tgattctgat 3360
aaaatagaca ttgctattct gttttttata tgtaaaaaca aaacaagaaa aaatagagaa 3420
ttctacatac taaatctctc tcctttttta attttaatat ttgttatcat ttatttattg 3480
gtgctactgt ttatccgtaa taattgtggg gaaaagatat taacatcacg tctttgtctc 3540
tagtgcagtt tttcgagata ttccgtagta catatttatt tttaaacaac gacaaagaaa 3600
tacagatata tcttaaaaaa aaaaaagcat tttgtattaa agaatttaat tctgatctca 3660
aaaaaaaaaa aaaaaaa 3677
<210> 70
<211> 2151
<212> DNA
<213> Homo sapiens
<400> 70
gcctctccaa aggctgcaga agtttcttgc taacaaaaag tccgcacatt cgagcaaaga 60
caggctttag cgagttatta aaaacttagg ggcgctcttg tcccccacag ggcccgaccg 120
cacacagcaa ggcgatggcc cagctgtaag ttggtagcac tgagaactag cagcgcgcgc 180
ggagcccgct gagacttgaa tcaatctggt ctaacggttt cccctaaacc gctaggagcc 240
ctcaatcggc gggacagcag ggcgcgtcct ctgccactct cgctccgagg tccccgcgcc 300
agagacgcag ccgcgctccc accacccaca cccaccgcgc cctcgttcgc ctcttctccg 360
ggagccagtc cgcgccaccg ccgccgccca ggccatcgcc accctccgca gccatgtcca 420
ccaggtccgt gtcctcgtcc tcctaccgca ggatgttcgg cggcccgggc accgcgagcc 480
ggccgagctc cagccggagc tacgtgacta cgtccacccg cacctacagc ctgggcagcg 540
cgctgcgccc cagcaccagc cgcagcctct acgcctcgtc cccgggcggc gtgtatgcca 600
cgcgctcctc tgccgtgcgc ctgcggagca gcgtgcccgg ggtgcggctc ctgcaggact 660
cggtggactt ctcgctggcc gacgccatca acaccgagtt caagaacacc cgcaccaacg 720
agaaggtgga gctgcaggag ctgaatgacc gcttcgccaa ctacatcgac aaggtgcgct 780
tcctggagca gcagaataag atcctgctgg ccgagctcga gcagctcaag ggccaaggca 840
agtcgcgcct gggggacctc tacgaggagg agatgcggga gctgcgccgg caggtggacc 900
agctaaccaa cgacaaagcc cgcgtcgagg tggagcgcga caacctggcc gaggacatca 960
tgcgcctccg ggagaaattg caggaggaga tgcttcagag agaggaagcc gaaaacaccc 1020
tgcaatcttt cagacaggat gttgacaatg cgtctctggc acgtcttgac cttgaacgca 1080
aagtggaatc tttgcaagaa gagattgcct ttttgaagaa actccacgaa gaggaaatcc 1140
aggagctgca ggctcagatt caggaacagc atgtccaaat cgatgtggat gtttccaagc 1200
ctgacctcac ggctgccctg cgtgacgtac gtcagcaata tgaaagtgtg gctgccaaga 1260
acctgcagga ggcagaagaa tggtacaaat ccaagtttgc tgacctctct gaggctgcca 1320
accggaacaa tgacgccctg cgccaggcaa agcaggagtc cactgagtac cggagacagg 1380
tgcagtccct cacctgtgaa gtggatgccc ttaaaggaac caatgagtcc ctggaacgcc 1440
agatgcgtga aatggaagag aactttgccg ttgaagctgc taactaccaa gacactattg 1500
gccgcctgca ggatgagatt cagaatatga aggaggaaat ggctcgtcac cttcgtgaat 1560
accaagacct gctcaatgtt aagatggccc ttgacattga gattgccacc tacaggaagc 1620
tgctggaagg cgaggagagc aggatttctc tgcctcttcc aaacttttcc tccctgaacc 1680
tgagggaaac taatctggat tcactccctc tggttgatac ccactcaaaa aggacacttc 1740
tgattaagac ggttgaaact agagatggac aggttatcaa cgaaacttct cagcatcacg 1800
atgaccttga ataaaaattg cacacactca gtgcagcaat atattaccag caagaataaa 1860
aaagaaatcc atatcttaaa gaaacagctt tcaagtgcct ttctgcagtt tttcaggagc 1920
gcaagataga tttggaatag gaataagctc tagttcttaa caaccgacac tcctacaaga 1980
tttagaaaaa agtttacaac ataatctagt ttacagaaaa atcttgtgct agaatacttt 2040
ttaaaaggta ttttgaatac cattaaaact gctttttttt ttccagcaag tatccaacca 2100
acttggttct gcttcaataa atctttggaa aaactcaaaa aaaaaaaaaa a 2151
<210> 71
<211> 3207
<212> DNA
<213> Homo sapiens
<400> 71
ggcccacaga ggagcacagc tgtgtttggc tgcagggcca agagcgctgt caagaagacc 60
cacacgcccc cctccagcag ctgaattcct gcagctcagc agccgccgcc agagcaggac 120
gaaccgccaa tcgcaaggca cctctgagaa cttcaggatg cagatgtctc cagccctcac 180
ctgcctagtc ctgggcctgg cccttgtctt tggtgaaggg tctgctgtgc accatccccc 240
atcctacgtg gcccacctgg cctcagactt cggggtgagg gtgtttcagc aggtggcgca 300
ggcctccaag gaccgcaacg tggttttctc accctatggg gtggcctcgg tgttggccat 360
gctccagctg acaacaggag gagaaaccca gcagcagatt caagcagcta tgggattcaa 420
gattgatgac aagggcatgg cccccgccct ccggcatctg tacaaggagc tcatggggcc 480
atggaacaag gatgagatca gcaccacaga cgcgatcttc gtccagcggg atctgaagct 540
ggtccagggc ttcatgcccc acttcttcag gctgttccgg agcacggtca agcaagtgga 600
cttttcagag gtggagagag ccagattcat catcaatgac tgggtgaaga cacacacaaa 660
aggtatgatc agcaacttgc ttgggaaagg agccgtggac cagctgacac ggctggtgct 720
ggtgaatgcc ctctacttca acggccagtg gaagactccc ttccccgact ccagcaccca 780
ccgccgcctc ttccacaaat cagacggcag cactgtctct gtgcccatga tggctcagac 840
caacaagttc aactatactg agttcaccac gcccgatggc cattactacg acatcctgga 900
actgccctac cacggggaca ccctcagcat gttcattgct gccccttatg aaaaagaggt 960
gcctctctct gccctcacca acattctgag tgcccagctc atcagccact ggaaaggcaa 1020
catgaccagg ctgccccgcc tcctggttct gcccaagttc tccctggaga ctgaagtcga 1080
cctcaggaag cccctagaga acctgggaat gaccgacatg ttcagacagt ttcaggctga 1140
cttcacgagt ctttcagacc aagagcctct ccacgtcgcg caggcgctgc agaaagtgaa 1200
gatcgaggtg aacgagagtg gcacggtggc ctcctcatcc acagctgtca tagtctcagc 1260
ccgcatggcc cccgaggaga tcatcatgga cagacccttc ctctttgtgg tccggcacaa 1320
ccccacagga acagtccttt tcatgggcca agtgatggaa ccctgaccct ggggaaagac 1380
gccttcatct gggacaaaac tggagatgca tcgggaaaga agaaactccg aagaaaagaa 1440
ttttagtgtt aatgactctt tctgaaggaa gagaagacat ttgccttttg ttaaaagatg 1500
gtaaaccaga tctgtctcca agaccttggc ctctccttgg aggaccttta ggtcaaactc 1560
cctagtctcc acctgagacc ctgggagaga agtttgaagc acaactccct taaggtctcc 1620
aaaccagacg gtgacgcctg cgggaccatc tggggcacct gcttccaccc gtctctctgc 1680
ccactcgggt ctgcagacct ggttcccact gaggcccttt gcaggatgga actacggggc 1740
ttacaggagc ttttgtgtgc ctggtagaaa ctatttctgt tccagtcaca ttgccatcac 1800
tcttgtactg cctgccaccg cggaggaggc tggtgacagg ccaaaggcca gtggaagaaa 1860
caccctttca tctcagagtc cactgtggca ctggccaccc ctccccagta caggggtgct 1920
gcaggtggca gagtgaatgt cccccatcat gtggcccaac tctcctggcc tggccatctc 1980
cctccccaga aacagtgtgc atgggttatt ttggagtgta ggtgacttgt ttactcattg 2040
aagcagattt ctgcttcctt ttatttttat aggaatagag gaagaaatgt cagatgcgtg 2100
cccagctctt caccccccaa tctcttggtg gggaggggtg tacctaaata tttatcatat 2160
ccttgccctt gagtgcttgt tagagagaaa gagaactact aaggaaaata atattattta 2220
aactcgctcc tagtgtttct ttgtggtctg tgtcaccgta tctcaggaag tccagccact 2280
tgactggcac acacccctcc ggacatccag cgtgacggag cccacactgc caccttgtgg 2340
ccgcctgaga ccctcgcgcc ccccgcgccc ctctttttcc ccttgatgga aattgaccat 2400
acaatttcat cctccttcag gggatcaaaa ggacggagtg gggggacaga gactcagatg 2460
aggacagagt ggtttccaat gtgttcaata gatttaggag cagaaatgca aggggctgca 2520
tgacctacca ggacagaact ttccccaatt acagggtgac tcacagccgc attggtgact 2580
cacttcaatg tgtcatttcc ggctgctgtg tgtgagcagt ggacacgtga ggggggggtg 2640
ggtgagagag acaggcagct cggattcaac taccttagat aatatttctg aaaacctacc 2700
agccagaggg tagggcacaa agatggatgt aatgcacttt gggaggccaa ggcgggagga 2760
ttgcttgagc ccaggagttc aagaccagcc tgggcaacat accaagaccc ccgtctcttt 2820
aaaaatatat atattttaaa tatacttaaa tatatatttc taatatcttt aaatatatat 2880
atatatttta aagaccaatt tatgggagaa ttgcacacag atgtgaaatg aatgtaatct 2940
aatagaagcc taatcagccc accatgttct ccactgaaaa atcctctttc tttggggttt 3000
ttctttcttt cttttttgat tttgcactgg acggtgacgt cagccatgta caggatccac 3060
aggggtggtg tcaaatgcta ttgaaattgt gttgaattgt atgctttttc acttttgata 3120
aataaacatg taaaaatgtt tcaaaaaaat aataaaataa ataaatacga agaatatgtc 3180
aggacagtca aaaaaaaaaa aaaaaaa 3207
<210> 72
<211> 19
<212> DNA
<213> Homo sapiens
<400> 72
tgccttcctc cgctgaaac 19
<210> 73
<211> 18
<212> DNA
<213> Homo sapiens
<400> 73
accacgcacc agtgtgac 18
<210> 74
<211> 24
<212> DNA
<213> Homo sapiens
<400> 74
tcccaacttc ttctggagcc tggg 24
<210> 75
<211> 22
<212> DNA
<213> Homo sapiens
<400> 75
gaaatgaagg agaagtttag ca 22
<210> 76
<211> 23
<212> DNA
<213> Homo sapiens
<400> 76
gctttataac aggataccat gac 23
<210> 77
<211> 29
<212> DNA
<213> Homo sapiens
<400> 77
acagatgcac catcaggaat ggaattaca 29
<210> 78
<211> 20
<212> DNA
<213> Homo sapiens
<400> 78
gaagctgacc tggaagagaa 20
<210> 79
<211> 22
<212> DNA
<213> Homo sapiens
<400> 79
ccacagaatt tagctcggta tg 22
<210> 80
<211> 26
<212> DNA
<213> Homo sapiens
<400> 80
cctatcaagt ttgagctttc tggctg 26
<210> 81
<211> 19
<212> DNA
<213> Homo sapiens
<400> 81
gagactctca gggtcgaaa 19
<210> 82
<211> 19
<212> DNA
<213> Homo sapiens
<400> 82
ctgtgggcgg attagggct 19
<210> 83
<211> 24
<212> DNA
<213> Homo sapiens
<400> 83
atttctacca ctccaaacgc cggc 24
<210> 84
<211> 20
<212> DNA
<213> Homo sapiens
<400> 84
tgagggagaa caagaccgat 20
<210> 85
<211> 19
<212> DNA
<213> Homo sapiens
<400> 85
actagtaggt gtgcagaga 19
<210> 86
<211> 23
<212> DNA
<213> Homo sapiens
<400> 86
cactgcgccc ttaactgcat cca 23
<210> 87
<211> 21
<212> DNA
<213> Homo sapiens
<400> 87
gcgaattcag catctgcaaa g 21
<210> 88
<211> 18
<212> DNA
<213> Homo sapiens
<400> 88
ctttcttcgg gcaggctt 18
<210> 89
<211> 25
<212> DNA
<213> Homo sapiens
<400> 89
accacaagca cctagaccat gaggt 25
<210> 90
<211> 20
<212> DNA
<213> Homo sapiens
<400> 90
gtcggccaag ttgatgaatg 20
<210> 91
<211> 21
<212> DNA
<213> Homo sapiens
<400> 91
gatgagcgtg aagtggattt g 21
<210> 92
<211> 23
<212> DNA
<213> Homo sapiens
<400> 92
ccattgacga ggaggaggag gat 23
<210> 93
<211> 21
<212> DNA
<213> Homo sapiens
<400> 93
tgtggtcaag actggatgat g 21
<210> 94
<211> 20
<212> DNA
<213> Homo sapiens
<400> 94
cagaagtggc ttcgaaatga 20
<210> 95
<211> 24
<212> DNA
<213> Homo sapiens
<400> 95
tctctaggaa gcctcacttg gccg 24
<210> 96
<211> 21
<212> DNA
<213> Homo sapiens
<400> 96
aatggaacag cccttctacc a 21
<210> 97
<211> 21
<212> DNA
<213> Homo sapiens
<400> 97
gctcggtttc aggagtttgt a 21
<210> 98
<211> 23
<212> DNA
<213> Homo sapiens
<400> 98
tcatacacag ctacgggata cgg 23
<210> 99
<211> 21
<212> DNA
<213> Homo sapiens
<400> 99
gttgcttcaa ggacacatta g 21
<210> 100
<211> 20
<212> DNA
<213> Homo sapiens
<400> 100
gcagatgagc cctcagattt 20
<210> 101
<211> 24
<212> DNA
<213> Homo sapiens
<400> 101
tgccctcact gcaacagagc attt 24
<210> 102
<211> 19
<212> DNA
<213> Homo sapiens
<400> 102
gaaggaggag ggcagaatc 19
<210> 103
<211> 20
<212> DNA
<213> Homo sapiens
<400> 103
gtctcgattg gatggcagta 20
<210> 104
<211> 26
<212> DNA
<213> Homo sapiens
<400> 104
agttcatgga tgtctatcag cgcagc 26
<210> 105
<211> 20
<212> DNA
<213> Homo sapiens
<400> 105
ccacaaatca gacggcagca 20
<210> 106
<211> 20
<212> DNA
<213> Homo sapiens
<400> 106
gtcgtagtaa tggccatcgg 20
<210> 107
<211> 25
<212> DNA
<213> Homo sapiens
<400> 107
cccatgatgg ctcagaccaa caagt 25
<210> 108
<211> 18
<212> DNA
<213> Homo sapiens
<400> 108
ccaaccgcga gaagatga 18
<210> 109
<211> 20
<212> DNA
<213> Homo sapiens
<400> 109
ccagaggcgt acagggatag 20
<210> 110
<211> 23
<212> DNA
<213> Homo sapiens
<400> 110
ccatgtacgt tgctatccag gct 23
<210> 111
<211> 19
<212> DNA
<213> Homo sapiens
<400> 111
agtcctgagt ccggatgaa 19
<210> 112
<211> 18
<212> DNA
<213> Homo sapiens
<400> 112
cctccctcag tcgtctct 18
<210> 113
<211> 24
<212> DNA
<213> Homo sapiens
<400> 113
tgacggaggg tggcatcaaa tacc 24
<210> 114
<211> 22
<212> DNA
<213> Homo sapiens
<400> 114
gccagcttgt cttcaatgaa at 22
<210> 115
<211> 21
<212> DNA
<213> Homo sapiens
<400> 115
caaagccagc ttctgttcaa g 21
<210> 116
<211> 24
<212> DNA
<213> Homo sapiens
<400> 116
atccaccatg agttggtagg cagc 24
<210> 117
<211> 23
<212> DNA
<213> Homo sapiens
<400> 117
gccaagaaga aagtgaacat cat 23
<210> 118
<211> 20
<212> DNA
<213> Homo sapiens
<400> 118
atagggattc cgggagtcat 20
<210> 119
<211> 24
<212> DNA
<213> Homo sapiens
<400> 119
tcagaacaac agcctgccac ctta 24
<210> 120
<211> 22
<212> DNA
<213> Homo sapiens
<400> 120
tgactccttc aacaccttct tc 22
<210> 121
<211> 18
<212> DNA
<213> Homo sapiens
<400> 121
tgccagtgcg aacttcat 18
<210> 122
<211> 24
<212> DNA
<213> Homo sapiens
<400> 122
ccgggctgtg tttgtagact tgga 24
<210> 123
<211> 17
<212> DNA
<213> Homo sapiens
<400> 123
agccacatca tccctgt 17
<210> 124
<211> 22
<212> DNA
<213> Homo sapiens
<400> 124
cgtagatgtt atgtctgctc at 22
<210> 125
<211> 22
<212> DNA
<213> Homo sapiens
<400> 125
tttagcagca tctgcaaccc gc 22
<210> 126
<211> 24
<212> DNA
<213> Homo sapiens
<400> 126
gaggatttgg aaagggtgtt tatt 24
<210> 127
<211> 21
<212> DNA
<213> Homo sapiens
<400> 127
acagagggct acaatgtgat g 21
<210> 128
<211> 26
<212> DNA
<213> Homo sapiens
<400> 128
acgtcttgct cgagatgtga tgaagg 26
<210> 129
<211> 18
<212> DNA
<213> Homo sapiens
<400> 129
taaaccctgc gtggcaat 18
<210> 130
<211> 27
<212> DNA
<213> Homo sapiens
<400> 130
acatttcgga taatcatcca atagttg 27
<210> 131
<211> 24
<212> DNA
<213> Homo sapiens
<400> 131
aagtagttgg acttccaggt cgcc 24
<210> 132
<211> 17
<212> DNA
<213> Homo sapiens
<400> 132
ccgtggcctt agctgtg 17
<210> 133
<211> 21
<212> DNA
<213> Homo sapiens
<400> 133
ctgctggatg acgtgagtaa a 21
<210> 134
<211> 24
<212> DNA
<213> Homo sapiens
<400> 134
tctctctttc tggcctggag gcta 24
<210> 135
<211> 25
<212> DNA
<213> Homo sapiens
<400> 135
aaatgttaac aaatgtggca attat 25
<210> 136
<211> 20
<212> DNA
<213> Homo sapiens
<400> 136
aacaatgcct ccactccaaa 20
<210> 137
<211> 20
<212> DNA
<213> Homo sapiens
<400> 137
tccacacaac accaggactt 20
<210> 138
<211> 22
<212> DNA
<213> Homo sapiens
<400> 138
tgaaaactac ccctaaaagc ca 22
<210> 139
<211> 21
<212> DNA
<213> Homo sapiens
<400> 139
tatccaagac ccaggcatac t 21
<210> 140
<211> 21
<212> DNA
<213> Homo sapiens
<400> 140
tagattcggg caagtccacc a 21
<210> 141
<211> 20
<212> DNA
<213> Homo sapiens
<400> 141
aagatgaggc agaggtccaa 20
<210> 142
<211> 20
<212> DNA
<213> Homo sapiens
<400> 142
tccagaatgt cacaggtcca 20
<210> 143
<211> 20
<212> DNA
<213> Homo sapiens
<400> 143
tgctggtaca agttgtggga 20

Claims (15)

1.一种通过数字处理设备执行的、推断受试者中的TGF-β细胞信号传导途径的活性的计算机执行方法,其中所述推断包括:
接收受试者样品中测得的TGF-β细胞信号传导途径的三个或更多个靶基因的表达水平;
确定受试者样品中TGF-β转录因子(TF)元件的活性水平,所述TGF-βTF元件控制所述三个或更多个TGF-β靶基因的转录,所述确定基于评估将所述三个或更多个TGF-β靶基因的表达水平与TGF-βTF元件的活性水平关联的校准数学模型;
基于所确定的所述受试者的样品中的TGF-βTF元件的活性水平推断所述受试者中的TGF-β细胞信号传导途径的活性,
其中所述三个或更多个TGF-β靶基因选自:ANGPTL4、CDC42EP3、CDKN1A、CDKN2B、CTGF、GADD45A、GADD45B、HMGA2、ID1、IL11、SERPINE1、INPP5D、JUNB、MMP2、MMP9、NKX2-5、OVOL1、PDGFB、PTHLH、SGK1、SKIL、SMAD4、SMAD5、SMAD6、SMAD7、SNAI1、SNAI2、TIMP1和VEGFA,优选选自:ANGPTL4、CDC42EP3、CDKN1A、CTGF、GADD45A、GADD45B、HMGA2、ID1、IL11、JUNB、PDGFB、PTHLH、SERPINE1、SGK1、SKIL、SMAD4、SMAD5、SMAD6、SMAD7、SNAI2和VEGFA,更优选选自:ANGPTL4、CDC42EP3、CDKN1A、CTGF、GADD45B、ID1、IL11、JUNB、SERPINE1、PDGFB、SKIL、SMAD7、SNAI2和VEGFA,最优选选自:ANGPTL4、CDC42EP3、ID1、IL11、JUNB、SERPINE1、SKIL和SMAD7。
2.权利要求1的方法,其中所述三个或更多个TGF-β靶基因选自:ANGPTL4、CDC42EP3、CDKN1A、CTGF、GADD45A、GADD45B、HMGA2、ID1、IL11、JUNB、PDGFB、PTHLH、SGK1、SKIL、SMAD4、SMAD5、SMAD6、SMAD7、SNAI2、VEGFA,更优选选自:ANGPTL4、CDC42EP3、CDKN1A、CTGF、GADD45A、GADD45B、HMGA2、ID1、JUNB、PDGFB、PTHLH、SERPINE1、SGK1、SKIL、SMAD4、SMAD5、SMAD6、SMAD7、SNAI2、VEGF。
3.权利要求1的方法,其中所述三个或更多个TGF-β靶基因选自:ANGPTL4、CDC42EP3、CDKN1A、CTGF、GADD45B、ID1、IL11、JUNB、PDGFB、SKIL、SMAD7和SNAI2,更优选选自:ANGPTL4、CDC42EP3、CDKN1A、CTGF、GADD45B、ID1、JUNB、SERPINE1、SKIL、SMAD7、SNAI2和VEGFA。
4.权利要求1的方法,其中所述三个或更多个TGF-β靶基因选自:ANGPTL4、CDC42EP3、ID1、IL11、JUNB、SKIL和SMAD7,更优选选自:ANGPTL4、CDC42EP3、ID1、JUNB、SERPINE1、SKIL和SMAD7。
5.权利要求1-4任一项的方法,其中所选的三个或更多个TGF-β靶基因包括ANGPTL4和CDC42EP3,更优选ANGPTL4、CDC42EP3、ID1、JUNB、SERPINE1、SKIL和SMAD7。
6.权利要求1-5任一项的方法,其还包括:
基于受试者中的TGF-β细胞信号传导途径的推断活性确定TGF-β细胞信号传导途径在受试者中是否作为肿瘤促进因子起作用。
7.权利要求6的方法,其还包括:
为受试者推荐开药,该药纠正TGF-β细胞信号传导途径的促肿瘤作用;
其中如果基于TGF-β细胞信号传导途径的推断活性确定TGF-β细胞信号传导途径在受试者中作为肿瘤促进因子起作用,则进行所述推荐。
8.权利要求1-7任一项的方法,其中所述校准数学途径模型是概率模型,优选贝叶斯网络模型,其基于将TGF-βTF元件的活性水平与所述三个或更多个TGF-β靶基因的表达水平关联的条件概率,或者其中所述校准数学模型基于所述三个或更多个TGF-β靶基因的表达水平的一或多种线性组合。
9.一种推断受试者中的TGF-β细胞信号传导途径的活性的装置,包含经配置以执行权利要求1-8任一项的方法的数字处理器。
10.一种推断受试者中的TGF-β细胞信号传导途径的活性的非临时性存储介质,其存储可由数字处理设备执行以执行权利要求1-8任一项的方法的指令。
11.一种推断受试者中的TGF-β细胞信号传导途径的活性的计算机程序,其包含当所述计算机程序在数字处理设备上运行时,用于引起数字处理设备执行权利要求1-8任一项的方法的程序代码装置。
12.一种测量受试者样品中TGF-β细胞信号传导途径的三个或更多个靶基因的表达水平的试剂盒,其包括:
针对所述三个或更多个TGF-β靶基因的聚合酶链反应引物,
针对所述三个或更多个TGF-β靶基因的探针,
其中所述三个或更多个TGF-β靶基因选自:ANGPTL4、CDC42EP3、CDKN1A、CDKN2B、CTGF、GADD45A、GADD45B、HMGA2、ID1、IL11、INPP5D、JUNB、MMP2、MMP9、NKX2-5、OVOL1、PDGFB、PTHLH、SERPINE1、SGK1、SKIL、SMAD4、SMAD5、SMAD6、SMAD7、SNAI1、SNAI2、TIMP和VEGFA,优选选自:ANGPTL4、CDC42EP3、CDKN1A、CTGF、GADD45A、GADD45B、HMGA2、ID1、IL11、JUNB、PDGFB、PTHLH、SERPINE1、SGK1、SKIL、SMAD4、SMAD5、SMAD6、SMAD7、SNAI2和VEGFA,更优选选自:ANGPTL4、CDC42EP3、CDKN1A、CTGF、GADD45B、ID1、IL11、JUNB、PDGFB、SERPINE1、SKIL、SMAD7、SNAI2和VEGFA,最优选选自:ANGPTL4、CDC42EP3、ID1、IL11、JUNB、SERPINE1、SKIL和SMAD7。
13.一种推断受试者中TGF-β细胞信号传导途径的活性的试剂盒,包括:
权利要求12的试剂盒,以及
权利要求9的装置,权利要求10的非临时性存储介质,或权利要求11的计算机程序。
14.一种推断受试者中TGF-β细胞信号传导途径的活性的试剂盒,其包括:
确定受试者样品中TGF-β细胞信号传导途径的三个或更多个靶基因的表达水平的一或多种成分,
其中所述一或多种成分优选选自:DNA阵列芯片,寡核苷酸阵列芯片,蛋白质阵列芯片,抗体,多种探针,例如标记探针,一组RNA逆转录酶测序成分,和/或RNA或DNA扩增引物,包括cDNA扩增引物,以及
权利要求9的装置,权利要求10的非临时性存储介质,或权利要求12的计算机程序,
其中所述三个或更多个TGF-β靶基因选自:ANGPTL4、CDC42EP3、CDKN1A、CDKN2B、CTGF、GADD45A、GADD45B、HMGA2、ID1、IL11、INPP5D、JUNB、MMP2、MMP9、NKX2-5、OVOL1、PDGFB、PTHLH、SERPINE1、SGK1、SKIL、SMAD4、SMAD5、SMAD6、SMAD7、SNAI1、SNAI2、TIMP1和VEGF,优选选自:ANGPTL4、CDC42EP3、CDKN1A、CTGF、GADD45A、GADD45B、HMGA2、ID1、IL11、JUNB、PDGFB、PTHLH、SERPINE1、SGK1、SKIL、SMAD4、SMAD5、SMAD6、SMAD7、SNAI2和VEGFA,更优选选自:ANGPTL4、CDC42EP3、CDKN1A、CTGF、GADD45B、ID1、IL11、JUNB、PDGFB、SERPINE1、SKIL、SMAD7、SNAI2和VEGFA,最优选选自:ANGPTL4、CDC42EP3、ID1、IL11、JUNB、SERPINE1、SKIL和SMAD7。
15.权利要求12-14任一项的试剂盒在执行权利要求1-8任一项的方法中的用途。
CN201580057321.8A 2014-10-24 2015-10-26 使用靶基因表达的数学建模评价TGF-β细胞信号传导途径的活性 Active CN107077536B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP14190270 2014-10-24
EP14190270.0 2014-10-24
PCT/EP2015/074700 WO2016062891A1 (en) 2014-10-24 2015-10-26 ASSESSMENT OF TGF-β CELLULAR SIGNALING PATHWAY ACTIVITY USING MATHEMATICAL MODELLING OF TARGET GENE EXPRESSION

Publications (2)

Publication Number Publication Date
CN107077536A true CN107077536A (zh) 2017-08-18
CN107077536B CN107077536B (zh) 2021-09-28

Family

ID=51846474

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580057321.8A Active CN107077536B (zh) 2014-10-24 2015-10-26 使用靶基因表达的数学建模评价TGF-β细胞信号传导途径的活性

Country Status (10)

Country Link
US (2) US10016159B2 (zh)
EP (1) EP3210142B1 (zh)
JP (1) JP6415712B2 (zh)
CN (1) CN107077536B (zh)
AU (1) AU2015334840B2 (zh)
BR (1) BR112017007965A8 (zh)
CA (1) CA2965442A1 (zh)
DK (1) DK3210142T3 (zh)
ES (1) ES2833543T3 (zh)
WO (1) WO2016062891A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111479933A (zh) * 2017-10-02 2020-07-31 皇家飞利浦有限公司 使用靶基因表达的数学建模评估jak-stat1/2细胞信号传导途径活性
CN111587293A (zh) * 2017-10-02 2020-08-25 皇家飞利浦有限公司 确定免疫细胞类型和免疫应答的功能状态
CN111742369A (zh) * 2017-12-20 2020-10-02 皇家飞利浦有限公司 使用靶基因表达的数学建模评估mapk-ap-1细胞信号传导途径活性

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2019100441A (ru) * 2016-06-13 2020-07-14 Конинклейке Филипс Н.В. Способ логического вывода об активности транскрипционного фактора пути сигнальной трансдукции у субъекта
CN106701886B (zh) * 2016-12-16 2021-06-22 管晓翔 一种三阴性乳腺癌细胞上皮间质转换过程中对内皮细胞分泌功能影响的检测方法
EP3431582A1 (en) 2017-07-18 2019-01-23 Koninklijke Philips N.V. Cell culturing materials
EP3462348A1 (en) 2017-09-28 2019-04-03 Koninklijke Philips N.V. Bayesian inference
EP3461916A1 (en) * 2017-10-02 2019-04-03 Koninklijke Philips N.V. Assessment of jak-stat3 cellular signaling pathway activity using mathematical modelling of target gene expression
EP3462349A1 (en) * 2017-10-02 2019-04-03 Koninklijke Philips N.V. Assessment of notch cellular signaling pathway activity using mathematical modelling of target gene expression
JP7209334B2 (ja) * 2018-09-18 2023-01-20 国立大学法人東京工業大学 癌特異的遺伝子制御ネットワークの生成方法、生成用プログラム及び生成用装置
CN109616152B (zh) * 2018-12-06 2020-01-03 中国人民解放军军事科学院军事医学研究院 癌症特异的共调网络建立方法及装置
EP3739588A1 (en) 2019-05-13 2020-11-18 Koninklijke Philips N.V. Assessment of multiple signaling pathway activity score in airway epithelial cells to predict airway epithelial abnormality and airway cancer risk
RU2722276C1 (ru) * 2019-12-09 2020-05-28 федеральное государственное бюджетное учреждение "Национальный медицинский исследовательский центр онкологии" Министерства здравоохранения Российской Федерации Способ диагностики аденокарциномы поджелудочной железы с нейроэндокринным компонентом
EP3882363A1 (en) 2020-03-17 2021-09-22 Koninklijke Philips N.V. Prognostic pathways for high risk sepsis patients
EP3978628A1 (en) 2020-10-01 2022-04-06 Koninklijke Philips N.V. Prognostic pathways for viral infections
EP4136261A1 (en) 2020-04-16 2023-02-22 InnoSIGN B.V. Prognostic pathways for viral infections
WO2021251331A1 (ja) * 2020-06-08 2021-12-16 国立大学法人 東京医科歯科大学 標的分子予測方法
EP3940704A1 (en) 2020-07-14 2022-01-19 Koninklijke Philips N.V. Method for determining the differentiation state of a stem cell
EP3960875A1 (en) 2020-08-28 2022-03-02 Koninklijke Philips N.V. Pcr method and kit for determining pathway activity
EP3965119A1 (en) 2020-09-04 2022-03-09 Koninklijke Philips N.V. Methods for estimating heterogeneity of a tumour based on values for two or more genome mutation and/or gene expression related parameter, as well as corresponding devices
EP3974540A1 (en) 2020-09-25 2022-03-30 Koninklijke Philips N.V. Method for predicting immunotherapy resistance
EP4015651A1 (en) 2020-12-17 2022-06-22 Koninklijke Philips N.V. Treatment prediction and effectiveness of anti-tnf alpha treatment in ibd patients
EP4039825A1 (en) 2021-02-09 2022-08-10 Koninklijke Philips N.V. Comparison and standardization of cell and tissue culture
JP2024514404A (ja) 2021-03-11 2024-04-02 コーニンクレッカ フィリップス エヌ ヴェ 高リスク敗血症患者のための予後経路
WO2024033063A1 (en) 2022-08-12 2024-02-15 Innosign B.V. Prediction and monitoring of immunotherapy in cancer

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005018669A1 (en) * 2003-08-18 2005-03-03 Macrogenics, Inc. Fcϝriib-specific antibodies and methods of use thereof
EP1894012A2 (en) * 2005-05-18 2008-03-05 Novartis AG Methods for diagnosis and treatment of proliferative disorders mediated by cd40 signaling
CN101600449A (zh) * 2006-09-08 2009-12-09 健泰科生物技术公司 Wnt拮抗剂及其在wnt介导的病症的诊断和治疗中的用途
CN101967495A (zh) * 2009-01-23 2011-02-09 山东省寄生虫病防治研究院 乳腺癌细胞C35基因siRNA表达载体的构建以及抗肿瘤治疗应用
CN103589784A (zh) * 2006-07-13 2014-02-19 俄亥俄州立大学研究基金会 用于诊断和治疗结肠癌相关疾病的基于微小rna的方法和组合物
CN103649337A (zh) * 2011-07-19 2014-03-19 皇家飞利浦有限公司 使用目标基因表达的概率建模评估细胞信号传导途径活性

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6004761A (en) 1986-11-19 1999-12-21 Sanofi Method for detecting cancer using monoclonal antibodies to new mucin epitopes
US5436134A (en) 1993-04-13 1995-07-25 Molecular Probes, Inc. Cyclic-substituted unsymmetrical cyanine dyes
US5658751A (en) 1993-04-13 1997-08-19 Molecular Probes, Inc. Substituted unsymmetrical cyanine dyes with selected permeability
US6720149B1 (en) 1995-06-07 2004-04-13 Affymetrix, Inc. Methods for concurrently processing multiple biological chip assays
US5545531A (en) 1995-06-07 1996-08-13 Affymax Technologies N.V. Methods for making a device for concurrently processing multiple biological chip assays
US6146897A (en) 1995-11-13 2000-11-14 Bio-Rad Laboratories Method for the detection of cellular abnormalities using Fourier transform infrared spectroscopy
US6391550B1 (en) 1996-09-19 2002-05-21 Affymetrix, Inc. Identification of molecular sequence signatures and methods involving the same
NZ516848A (en) 1997-06-20 2004-03-26 Ciphergen Biosystems Inc Retentate chromatography apparatus with applications in biology and medicine
US6308170B1 (en) 1997-07-25 2001-10-23 Affymetrix Inc. Gene expression and evaluation system
US6953662B2 (en) 1997-08-29 2005-10-11 Human Genome Sciences, Inc. Follistatin-3
US6020135A (en) 1998-03-27 2000-02-01 Affymetrix, Inc. P53-regulated genes
US6884578B2 (en) 2000-03-31 2005-04-26 Affymetrix, Inc. Genes differentially expressed in secretory versus proliferative endometrium
JP2004536276A (ja) 2000-11-16 2004-12-02 シファーゲン バイオシステムズ, インコーポレイテッド 質量スペクトルを分析する方法
WO2002079491A2 (en) 2001-02-16 2002-10-10 Ciphergen Biosystems, Inc. Method for correlating gene expression profiles with protein expression profiles
DK2258872T3 (da) 2002-03-13 2013-11-18 Genomic Health Inc Genekspressionsprofilering i biopsier af tumorvæv
US7097976B2 (en) 2002-06-17 2006-08-29 Affymetrix, Inc. Methods of analysis of allelic imbalance
EP1570080A4 (en) 2002-11-15 2006-03-01 Genomic Health Inc GENE EXPRESSION PROFILING OF EGFR-POSITIVE CANCER DISEASE
US20040231909A1 (en) 2003-01-15 2004-11-25 Tai-Yang Luh Motorized vehicle having forward and backward differential structure
EP3170906B1 (en) 2003-06-24 2018-08-22 Genomic Health, Inc. Prediction of likelihood of cancer recurrence
WO2005008213A2 (en) 2003-07-10 2005-01-27 Genomic Health, Inc. Expression profile algorithm and test for cancer prognosis
PL1836629T3 (pl) 2004-11-05 2020-06-15 Genomic Health, Inc. Przewidywanie odpowiedzi na chemioterapię z zastosowaniem markerów ekspresji genu
US7754861B2 (en) 2005-03-23 2010-07-13 Bio-Rad Laboratories, Inc. Method for purifying proteins
US20060234911A1 (en) 2005-03-24 2006-10-19 Hoffmann F M Method of reversing epithelial mesenchymal transition
KR100806274B1 (ko) 2005-12-06 2008-02-22 한국전자통신연구원 멀티 쓰레디드 프로세서 기반의 병렬 시스템을 위한 적응형실행 방법
EP1974058B1 (en) 2006-01-11 2014-06-11 Genomic Health, Inc. Gene expression markers for colorectal cancer prognosis
WO2007123772A2 (en) 2006-03-31 2007-11-01 Genomic Health, Inc. Genes involved in estrogen metabolism
US8518639B2 (en) 2006-04-11 2013-08-27 Bio-Rad Innovations HPV detection and quantification by real-time multiplex amplification
CA2680591A1 (en) * 2007-03-15 2008-09-25 Genomic Health, Inc. Gene expression markers for prediction of patient response to chemotherapy
US7816084B2 (en) 2007-11-30 2010-10-19 Applied Genomics, Inc. TLE3 as a marker for chemotherapy
US8067178B2 (en) 2008-03-14 2011-11-29 Genomic Health, Inc. Gene expression markers for prediction of patient response to chemotherapy
US20110053804A1 (en) 2008-04-03 2011-03-03 Sloan-Kettering Institute For Cancer Research Gene Signatures for the Prognosis of Cancer
AU2009268659A1 (en) 2008-07-08 2010-01-14 Genomic Health, Inc. Gene expression profiling for predicting the survivability of prostate cancer subjects
CN102272325B (zh) 2008-11-17 2015-07-22 威拉赛特公司 用于疾病诊断的分子表达谱的方法和组合物
US8765383B2 (en) 2009-04-07 2014-07-01 Genomic Health, Inc. Methods of predicting cancer risk using gene expression in premalignant tissue
EP2460005A4 (en) 2009-07-31 2012-11-21 Translational Genomics Res Inst METHOD FOR ASSESSING A CANCER PROGRESSION RISK
US8451450B2 (en) 2009-09-14 2013-05-28 Bio-Rad Laboratories, Inc. Near real time optical phase conjugation
US8703736B2 (en) 2011-04-04 2014-04-22 The Translational Genomics Research Institute Therapeutic target for pancreatic cancer cells
US9970057B2 (en) * 2011-05-06 2018-05-15 Albert Einstein College Of Medicine, Inc. Human invasion signature for prognosis of metastatic risk
US9458510B2 (en) * 2011-06-27 2016-10-04 Mietamark Genetics, Inc. Signatures and determinants associated with prostate cancer progression and methods of use thereof
CA2856295A1 (en) * 2011-11-18 2013-05-23 Vanderbilt University Markers of triple-negative breast cancer and uses thereof
MX351626B (es) 2012-01-31 2017-10-23 Genomic Health Inc Algoritmo de perfil de expresion genica y prueba para determinar la prognosis de cancer de prostata.
BR112015011289A2 (pt) * 2012-11-20 2017-07-11 Koninklijke Philips Nv mídia de armazenamento não transitório, aparelho e método
JP6445451B2 (ja) * 2012-12-03 2018-12-26 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. ネオアジュバントベバシズマブを用いた化学療法に対する予測結果の評価
CN111961726A (zh) 2012-12-26 2020-11-20 皇家飞利浦有限公司 使用靶基因表达的线性组合评价细胞信号传导途径活性
WO2014174003A1 (en) 2013-04-26 2014-10-30 Koninklijke Philips N.V. Medical prognosis and prediction of treatment response using multiple cellular signalling pathway activities
CA2923092C (en) 2014-01-03 2019-12-17 Koninklijke Philips N.V. Assessment of the pi3k cellular signaling pathway activity using mathematical modelling of target gene expression

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005018669A1 (en) * 2003-08-18 2005-03-03 Macrogenics, Inc. Fcϝriib-specific antibodies and methods of use thereof
EP1894012A2 (en) * 2005-05-18 2008-03-05 Novartis AG Methods for diagnosis and treatment of proliferative disorders mediated by cd40 signaling
CN103589784A (zh) * 2006-07-13 2014-02-19 俄亥俄州立大学研究基金会 用于诊断和治疗结肠癌相关疾病的基于微小rna的方法和组合物
CN101600449A (zh) * 2006-09-08 2009-12-09 健泰科生物技术公司 Wnt拮抗剂及其在wnt介导的病症的诊断和治疗中的用途
CN101967495A (zh) * 2009-01-23 2011-02-09 山东省寄生虫病防治研究院 乳腺癌细胞C35基因siRNA表达载体的构建以及抗肿瘤治疗应用
CN103649337A (zh) * 2011-07-19 2014-03-19 皇家飞利浦有限公司 使用目标基因表达的概率建模评估细胞信号传导途径活性

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
S. M. REZAUL HASAN: "A Micro-sequenced CMOS Model for Cell Signaling Pathway using G-Protein and Phosphorylation Cascade", 《IEEE》 *
王瑞年: "Wnt信号传导与癌症", 《中国肿瘤》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111479933A (zh) * 2017-10-02 2020-07-31 皇家飞利浦有限公司 使用靶基因表达的数学建模评估jak-stat1/2细胞信号传导途径活性
CN111587293A (zh) * 2017-10-02 2020-08-25 皇家飞利浦有限公司 确定免疫细胞类型和免疫应答的功能状态
CN111742369A (zh) * 2017-12-20 2020-10-02 皇家飞利浦有限公司 使用靶基因表达的数学建模评估mapk-ap-1细胞信号传导途径活性

Also Published As

Publication number Publication date
CN107077536B (zh) 2021-09-28
DK3210142T3 (da) 2020-11-16
JP2018503354A (ja) 2018-02-08
CA2965442A1 (en) 2016-04-28
US20180271438A1 (en) 2018-09-27
ES2833543T3 (es) 2021-06-15
AU2015334840A1 (en) 2017-06-15
JP6415712B2 (ja) 2018-10-31
EP3210142B1 (en) 2020-09-16
US20160113572A1 (en) 2016-04-28
WO2016062891A1 (en) 2016-04-28
EP3210142A1 (en) 2017-08-30
AU2015334840B2 (en) 2021-10-21
BR112017007965A8 (pt) 2022-11-08
US10016159B2 (en) 2018-07-10
BR112017007965A2 (pt) 2018-01-23

Similar Documents

Publication Publication Date Title
CN107077536B (zh) 使用靶基因表达的数学建模评价TGF-β细胞信号传导途径的活性
RU2721130C2 (ru) Оценка активности путей клеточной сигнализации с помощью линейной комбинации(ий) экспрессий генов-мишеней
RU2719194C2 (ru) Оценка активности клеточных сигнальных путей с применением вероятностного моделирования экспрессии целевых генов
KR102114412B1 (ko) 위장관췌장 신경내분비 신생물 (GEP-NENs)의 예측 방법
AU2012381038B2 (en) Interrogatory cell-based assays for identifying drug-induced toxicity markers
RU2721916C2 (ru) Способы прогнозирования рака предстательной железы
KR101421326B1 (ko) 유방암 예후 예측을 위한 조성물 및 이를 포함하는 키트
AU2018210695A1 (en) Molecular subtyping, prognosis, and treatment of bladder cancer
CN107255721A (zh) 标志物用于识别心脏毒性剂的用途
CN108138237A (zh) 使用靶基因表达的数学建模评估NFkB细胞信号传导途径活性
CN112795650A (zh) 使用靶基因表达的数学建模评价pi3k细胞信号传导途径活性
CN101258249A (zh) 检测黑素瘤的方法和试剂
KR20080007659A (ko) 식도암 및 식도암 전이 진단을 위한 조성물 및 방법
KR20140140069A (ko) 전반적 발달장애의 진단 및 치료용 조성물 및 그 진단 및 치료 방법
CN101573453A (zh) 使用生物学途径基因表达分析来预测淋巴结阴性原发性乳腺癌的远处转移的方法
CN111448325A (zh) 使用靶基因表达的数学建模评估jak-stat3细胞信号传导途径活性
KR20060045950A (ko) 혈액학적 악성종양에 대한 예후
KR20040065524A (ko) 백혈병을 검사 및 치료하는 방법
CN114127314A (zh) 用于对乳腺癌的亚型(Subtype)进行鉴别或者分类的鉴别标志物遗传基因组、方法和套件
KR20200070890A (ko) 상처치료제 스크리닝용 조성물 및 이를 이용한 상처 치료제 스크리닝 방법
KR20100037637A (ko) Egfr 억제제 치료에 대한 예측 마커
KR102001153B1 (ko) 유방암 예후 예측용 조성물 및 방법
KR101653131B1 (ko) 간암 예후 예측용 조성물 또는 키트, 및 간암 예후 예측 방법
KR20190126812A (ko) 질환 진단용 바이오마커
WO2019018540A1 (en) METHODS FOR DETECTION OF PLASMOCYTE DYSGLOBULINEMIA

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220922

Address after: Holland Ian Deho Finn

Patentee after: Innomark Ltd.

Address before: Holland Ian Deho Finn

Patentee before: KONINKLIJKE PHILIPS N.V.