CN111448325A - 使用靶基因表达的数学建模评估jak-stat3细胞信号传导途径活性 - Google Patents

使用靶基因表达的数学建模评估jak-stat3细胞信号传导途径活性 Download PDF

Info

Publication number
CN111448325A
CN111448325A CN201880077951.5A CN201880077951A CN111448325A CN 111448325 A CN111448325 A CN 111448325A CN 201880077951 A CN201880077951 A CN 201880077951A CN 111448325 A CN111448325 A CN 111448325A
Authority
CN
China
Prior art keywords
jak
stat3
signaling pathway
activity
subject
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880077951.5A
Other languages
English (en)
Inventor
窦蒙
W·F·J·费尔哈格
A·范德斯托尔佩
R·韦尔特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV filed Critical Koninklijke Philips NV
Publication of CN111448325A publication Critical patent/CN111448325A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6851Quantitative amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B10/00Directed molecular evolution of macromolecules, e.g. RNA, DNA or proteins
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B20/00Methods specially adapted for identifying library members
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6872Intracellular protein regulatory factors and their receptors, e.g. including ion channels
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • G16B5/20Probabilistic models
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2501/00Active agents used in cell culture processes, e.g. differentation
    • C12N2501/40Regulators of development
    • C12N2501/42Notch; Delta; Jagged; Serrate
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/435Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
    • G01N2333/46Assays involving biological materials from specific organisms or of a specific nature from animals; from humans from vertebrates
    • G01N2333/47Assays involving proteins of known structure or function as defined in the subgroups
    • G01N2333/4701Details
    • G01N2333/4703Regulators; Modulating activity
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/52Predicting or monitoring the response to treatment, e.g. for selection of therapy based on assay results in personalised medicine; Prognosis

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Microbiology (AREA)
  • Pathology (AREA)
  • General Engineering & Computer Science (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medicinal Chemistry (AREA)
  • Physiology (AREA)
  • Cell Biology (AREA)
  • Biomedical Technology (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Chemical & Material Sciences (AREA)
  • Food Science & Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及用于推测对象中JAK‑STAT3细胞信号传导途径活性的计算机执行的方法,其中所述推测基于在对象样品中测量的JAK‑STAT3细胞信号传导途径的三个或更多个靶基因的表达水平。本发明进一步涉及用于推测对象中JAK‑STAT3细胞信号传导途径活性的装置、非暂时性存储介质和计算机程序。本发明进一步涉及用于测量对象样品中JAK‑STAT3细胞信号传导途径的三个或更多个靶基因的表达水平的试剂盒,用于推测对象中JAK‑STAT3细胞信号传导途径活性的试剂盒,以及这些试剂盒在进行所述方法中的用途。

Description

使用靶基因表达的数学建模评估JAK-STAT3细胞信号传导途 径活性
发明领域
本发明一般地涉及生物信息学、基因组处理、蛋白质组处理以及相关领域。更具体地,本发明涉及一种通过数字处理设备推测对象中JAK-STAT3细胞信号传导途径的活性的计算机执行方法,其中所述推测基于在对象样品中测量的JAK-STAT3细胞信号传导途径的三个或更多个靶基因的表达水平。本发明还涉及一种推测对象中JAK-STAT3细胞信号传导途径的活性的设备,其包含配置为执行该方法的数字处理器,及涉及一种推测对象中JAK-STAT3细胞信号传导途径的活性的非暂时存储介质,其存储可由数字处理装置执行以实施所述方法的指令,以及涉及推测对象中JAK-STAT3细胞信号传导途径的活性的计算机程序,其包含当所述计算机程序在数字处理装置上运行时使该数字处理装置执行所述方法的程序代码模块(program code means)。本发明进一步涉及测量对象样品中JAK-STAT3细胞信号传导途径的三个或更多个靶基因表达水平的试剂盒,涉及推测对象中JAK-STAT3细胞信号传导途径的活性的试剂盒,以及所述试剂盒在执行该方法中的应用。
发明背景
基因组和蛋白质组分析在医学领域例如肿瘤学领域已经被充分认知且具有潜在的临床应用希望,其中已知多种癌症与基因组突变/变异和/或特定基因的高或低表达水平的特定组合相关,在癌症的生长和进化例如细胞增殖和转移中起作用。
STAT3是一种可诱导转录因子,其调节免疫应答和癌症中涉及的许多基因的表达。对癌症进展至关重要的生物学过程是由JAK信号转导物和STAT3信号传导的激活物介导的。在细胞核中,STAT3与基因的启动子结合并诱导遗传程序,该程序促进癌症进展所需的各种细胞过程(也参见图1,其基于Yu H.et al.,“STATs in cancer inflammation andimmunity:a leading role for STAT3”,Nature Reviews Cancer,Vol.9,No.11,November2009,pages 798-809)。
关于在例如癌症中JAK-STAT3的信号传导,重要的是能检测异常JAK-STAT3信号传导活性以便能够正确选择靶向药物治疗。目前正在开发抗JAK-STAT3疗法(见Yue P.andTurkson J.,“Targeting STAT3 in cancer:how successful are we?”,Expert Opinionon Investigational Drugs,Vol.18,No.1,pages 45-56)。但是,目前尚无可用于评估关于JAK-STAT3细胞信号传导途径活性的功能状态的临床检测,例如其活跃(active)状态表示与其不活跃(passive)状态相比更有可能是肿瘤促进性的。因此期望能够改善鉴定患有疾病如癌症或免疫失调的患者的可能性,所述癌症如乳腺癌、宫颈癌、子宫内膜癌、卵巢癌、胰腺癌或前列腺癌,所述免疫失调至少部分是由JAK-STAT3细胞信号传导途径的异常活性引起的,因此这些患者可能应答JAK-STAT3细胞信号传导途径的抑制剂。
发明概述
根据本发明的一个主要方面,上述问题通过一种计算机执行方法得以解决,所述方法通过数字处理装置推测对象中JAK-STAT3细胞信号传导途径的活性,其中所述推测包括:
接收在对象样品中测量的JAK-STAT3细胞信号传导途径的三个或更多个例如三个、四个、五个、六个、七个、八个、九个、十个或更多个靶基因的表达水平,
确定所述对象样品中JAK-STAT3转录因子(TF)元件的活性水平,所述JAK-STAT3TF元件控制所述三个或更多个JAK-STAT3靶基因的转录,所述确定基于评估将所述三个或更多个JAK-STAT3靶基因的表达水平与JAK-STAT3 TF元件的活性水平相关联的经校准的数学模型途径,以及
基于确定的所述对象样品中所述JAK-STAT3 TF元件的活性水平,推测所述对象中JAK-STAT3细胞信号传导途径的活性,
其中所述三个或更多个JAK-STAT3靶基因选自:AKT1,BCL2,BCL2L1,BIRC5,CCND1,CD274,CDKN1A,CRP,FGF2,FOS,FSCN1,FSCN2,FSCN3,HIF1A,HSP90AA1,HSP90AB1,HSP90B1,HSPA1A,HSPA1B,ICAM1,IFNG,IL10,JunB,MCL1,MMP1,MMP3,MMP9,MUC1,MYC,NOS2,POU2F1,PTGS2,SAA1,STAT1,TIMP1,TNFRSF1B,TWIST1,VIM和ZEB1,优选选自:BCL2L1,BIRC5,CCND1,CD274,FOS,HIF1A,HSP90AA1,HSP90AB1,MMP1和MYC,或者:BCL2L1,CD274,FOS,HSP90B1,HSPA1B,ICAM1,IFNG,JunB,PTGS2,STAT1,TNFRSF1B和ZEB1。
在此,TF元件的“活性水平”表示所述TF元件关于其靶基因的转录的活性的水平。
本发明基于发明人的创新,即鉴别在JAK-STAT3细胞信号传导途径中发生的作用的合适方法可以基于测量JAK-STAT3细胞信号传导途径的信号传导输出,其例如是靶基因的转录,其受由JAK-STAT3细胞信号传导途径控制的JAK-STAT3转录因子(TF)元件控制。发明人的这项创新假设TF活性水平在样品中处于准稳定状态,可以例如通过JAK-STAT3靶基因的表达值检测。已知在本文中作为目标的JAK-STAT3细胞信号传导途径控制人体许多细胞类型的许多功能,例如增殖、分化和创伤愈合。关于病理性失调如癌症(例如乳腺癌,宫颈癌,子宫内膜癌,卵巢癌,胰腺癌或前列腺癌),异常JAK-STAT3细胞信号传导活性起重要作用,其可在靶基因的表达谱中检测及因此通过经校准的数学途径模型加以利用。
本发明使得可以通过以下方式确定对象中JAK-STAT3细胞信号传导途径的活性:(i)确定对象样品中JAK-STAT3 TF元件的活性水平,其中所述确定基于评估经校准的数学模型,该模型将JAK-STAT3细胞信号传导途径的三个或更多个靶基因(其转录由JAK-STAT3TF元件控制)的表达水平与JAK-STAT3 TF元件的活性水平相关联,及(ii)基于确定的对象样品中所述JAK-STAT3 TF元件的活性水平,推测所述对象中JAK-STAT3细胞信号传导途径的活性。这优选可以改良鉴定患有疾病的患者的可能性,所述疾病例如癌症如乳腺癌、宫颈癌、子宫内膜癌、卵巢癌、胰腺癌或前列腺癌,其至少部分由JAK-STAT3细胞信号传导途径的异常活性引起,及因此所述患者可能应答JAK-STAT3细胞信号传导途径的抑制剂。在特定实施方案中,治疗决定可以基于特定的JAK-STAT3细胞信号传导途径活性。在一个特定实施方案中,可以将JAK-STAT3细胞信号传导状态设置为JAK-STAT3细胞信号传导途径为活跃的几率的截止值,为例如10:1、5:1、4:1、2:1、1:1、1:2、1:4、1:5或1:10。
本文中,术语“JAK-STAT3转录因子元件”或“JAK-STAT3 TF元件”或“TF元件”被定义为含有至少STAT3同二聚体的蛋白质复合物,其能够结合特异性DNA序列,优选具有结合基序CTGGGAA的应答元件,由此控制靶基因的转录。优选地,该术语是指一种由STAT3诱导配体例如白介素6(IL-6)和IL-6家族细胞因子与其受体的结合而触发的蛋白质或蛋白质复合物转录因子或在配体与其受体结合和最终转录因子蛋白质或蛋白质复合物之间的中间体下游信号传导物质。
所述经校准的数学途径模型可以是基于将所述JAK-STAT3 TF元件的活性水平与所述三个或更多个JAK-STAT3靶基因的表达水平相关联的条件概率的概率模型,优选贝叶斯网络模型,或者经校准的数学途径模型可以基于所述三个或更多个JAK-STAT3靶基因表达水平的一个或多个线性组合。特别地,推测JAK-STAT3细胞信号传导途径的活性可以如公开的国际专利申请WO 2013/011479A2(Assessment of cellular signaling pathwayactivity using probabilistic modeling of target gene expression)所述或者如公开的国际专利申请WO 2014/102668A2(Assessment of cellular signaling pathwayactivity using linear combination(s)of target gene expressions)所述进行,所述专利其内容全文并入本文作参考。关于使用靶基因表达的数学建模推测细胞信号传导途径活性的更详细内容可见于Verhaegh W.et al.,“Selection of personalized patienttherapy through the use of knowledge-based computational models that identifytumor-driving signal transduction pathways”,Cancer Research,Vol.74,No.11,2014,pages 2936-2945。
如本文所用,术语“对象”是指任何生物。在一些实施方案中,所述对象是动物,优选是哺乳动物。在某些实施方案中,所述对象是人,优选医学对象。在其它实施方案中,所述对象是细胞系。
如本文所用,术语“靶基因”是指其转录受JAK-STAT3转录因子元件直接或间接控制的基因。“靶基因”可以是“直接靶基因”和/或“间接靶基因”(如本文所述)。此外,“多个靶基因”可以是“多个直接靶基因”和/或“多个间接靶基因”(如本文所述)。
特别合适的JAK-STAT3靶基因在下文段落及实施例中描述(参见例如下表1-3)。
因此,根据优选实施方案,JAK-STAT3靶基因选自下表1、表2或表3中列出的JAK-STAT3靶基因。
本发明人已经发现,较短列表中的JAK-STAT3靶基因更可能确定JAK-STAT3细胞信号传导途径的活性。
另一方面,本发明涉及一种方法(如本文所述),其进一步包含:
基于推测的对象中JAK-STAT3细胞信号传导途径的活性,确定所述对象中JAK-STAT3细胞信号传导途径是否异常运行。
本发明还涉及一种方法(如本文所述),其进一步包含:
建议为所述对象处方药物,以纠正JAK-STAT3细胞信号传导途径的异常运行,
其中,如果基于推测的JAK-STAT3细胞信号传导途径的活性确定JAK-STAT3细胞信号传导途径在对象中异常运行,则进行所述建议。
短语“细胞信号传导途径异常运行”是指其中该途径的“活性”与预期不符的情况,其中术语“活性”可以指所述转录因子复合物驱动靶基因表达的活性,即由此靶基因被转录的速度。“正常”可以是当其在预期非活跃(inactive)的组织中是非活跃的,而在预期活跃的组织中是活跃的。此外,一定活性水平被认为是“正常”,任何更高或更低的活性都可以被认为是“异常”。
本发明还涉及一种方法(如本文所述),其中JAK-STAT3细胞信号传导途径的异常运行是其中JAK-STAT3细胞信号传导途径作为对象中肿瘤促进物(promoter)起作用的运行。
根据本发明使用的样品可以是提取的样品,即已经从对象提取的样品。样品的实例包括但不限于对象的组织、细胞、血液和/或体液。如果对象是患有或可能患有癌症的医学对象,则其可以是例如得自癌症病变或疑似癌症的病变的样品,或得自转移性肿瘤的样品,或者得自其中存在癌细胞污染的液体的体腔(例如胸膜腔或腹腔或膀胱腔)的样品,或者得自含有癌细胞的其它体液等的样品,优选通过活检或其它样品提取程序获得。提取样品的细胞也可以是来自血液恶性肿瘤(例如白血病或淋巴瘤)的肿瘤细胞。在某些情况下,细胞样品也可以是循环肿瘤细胞,即已经进入血流且可以使用合适的分离技术例如单采血液分离术或常规静脉抽血提取的肿瘤细胞。除了血液之外,提取样品的体液可以是尿液、胃肠道内容物或渗出物。如本文所用,术语“样品”还涵盖其中例如对象的组织和/或细胞和/或体液已经取自该对象且例如已经置于显微镜载玻片上的情况,以及其中为进行所要求保护的方法而提取这个样品的一部分的情况,例如通过激光捕获显微切割(LCM)或通过从载玻片上刮下感兴趣的细胞或者通过荧光激活的细胞分选技术提取。另外,如本文所用,术语“样品”还涵盖这样的情况,例如其中对象的组织和/或细胞和/或体液已经取自该对象且已经将其置于显微镜载玻片上,以及在该载玻片上实施所要求保护的方法。
根据另一个公开的方面,本发明提供了推测对象中JAK-STAT3细胞信号传导途径的活性的设备,其包括配置为实施如本文所述本发明方法的数字处理器。
根据另一个公开的方面,本发明提供了推测对象中JAK-STAT3细胞信号传导途径的活性的非暂时存储介质,其存储可由数字处理装置执行以实施本文所述本发明方法的指令。所述非暂时存储介质可以是计算机可读存储介质,例如硬盘驱动器或其它磁性存储介质,光盘或其它光学存储介质,随机存取存储器(RAM),只读存储器(ROM),闪存或其它电子存储介质,网络服务器等。所述数字处理装置可以是手持装置(例如个人数据助理或智能电话),笔记本电脑,台式电脑,平板电脑或装置,远程网络服务器等。
根据另一个公开的方面,推测对象中JAK-STAT3细胞信号传导途径的活性的计算机程序包括程序代码模块,当所述计算机程序在数字处理装置上运行时使得所述数字处理装置执行本文所述本发明的方法。所述数字处理装置可以是手持装置(例如个人数据助理或智能电话),笔记本电脑,台式电脑,平板电脑或装置,远程网络服务器等。
根据另一个公开的方面,用于测量对象样品中JAK-STAT3细胞信号传导途径的三个或更多个例如三个、四个、五个、六个、七个、八个、九个、十个或更多个靶基因的表达水平的试剂盒包含:
确定所述对象样品中所述三个或更多个JAK-STAT3靶基因的表达水平的一或多种组分,
其中所述三个或更多个JAK-STAT3靶基因选自:AKT1,BCL2,BCL2L1,BIRC5,CCND1,CD274,CDKN1A,CRP,FGF2,FOS,FSCN1,FSCN2,FSCN3,HIF1A,HSP90AA1,HSP90AB1,HSP90B1,HSPA1A,HSPA1B,ICAM1,IFNG,IL10,JunB,MCL1,MMP1,MMP3,MMP9,MUC1,MYC,NOS2,POU2F1,PTGS2,SAA1,STAT1,TIMP1,TNFRSF1B,TWIST1,VIM和ZEB1,优选地选自:BCL2L1,BIRC5,CCND1,CD274,FOS,HIF1A,HSP90AA1,HSP90AB1,MMP1和MYC,或选自:BCL2L1,CD274,FOS,HSP90B1,HSPA1B,ICAM1,IFNG,JunB,PTGS2,STAT1,TNFRSF1B和ZEB1。
用于测量所述三个或更多个JAK-STAT3靶基因的表达水平的所述一或多种组分或手段可以选自:DNA阵列芯片,寡核苷酸阵列芯片,蛋白质阵列芯片,抗体,多个探针例如标记的探针,一组RNA逆转录酶测序成分和/或RNA或DNA包括cDNA,扩增引物。在一个实施方案中,所述试剂盒包括针对如本文所述的所述三个或更多个JAK-STAT3靶基因的mRNA或cDNA序列的一部分的一组标记的探针。在一个实施方案中,所述试剂盒包括针对所述三个或更多个JAK-STAT3靶基因的mRNA或cDNA序列的一部分的一组引物和探针。在一个实施方案中,所述标记的探针包含在标准化96孔板中。在一个实施方案中,所述试剂盒进一步包括针对一组参考基因的引物或探针。这种参考基因可以是例如组成型表达的基因,可用于使本文所述靶基因表达水平归一化或标准化。
在一个实施方案中,用于测量对象样品中JAK-STAT3细胞信号传导途径的三个或更多个例如三个、四个、五个、六个、七个、八个、九个、十个或更多个靶基因的表达水平的所述试剂盒包含:
针对所述三个或更多个JAK-STAT3靶基因的聚合酶链反应引物,
针对所述三个或更多个JAK-STAT3靶基因的探针,
其中所述三个或更多个JAK-STAT3靶基因选自:AKT1,BCL2,BCL2L1,BIRC5,CCND1,CD274,CDKN1A,CRP,FGF2,FOS,FSCN1,FSCN2,FSCN3,HIF1A,HSP90AA1,HSP90AB1,HSP90B1,HSPA1A,HSPA1B,ICAM1,IFNG,IL10,JunB,MCL1,MMP1,MMP3,MMP9,MUC1,MYC,NOS2,POU2F1,PTGS2,SAA1,STAT1,TIMP1,TNFRSF1B,TWIST1,VIM和ZEB1,优选选自:BCL2L1,BIRC5,CCND1,CD274,FOS,HIF1A,HSP90AA1,HSP90AB1,MMP1和MYC,或者选自:BCL2L1,CD274,FOS,HSP90B1,HSPA1B,ICAM1,IFNG,JunB,PTGS2,STAT1,TNFRSF1B和ZEB1。
根据另一个公开的方面,推测对象中JAK-STAT3细胞信号传导途径的活性的试剂盒包含:
如本文所述本发明的试剂盒,及
本文所述的本发明设备,本文所述的本发明非暂时存储介质或者本文所述的本发明计算机程序。
根据另一个公开的方面,本文所述的本发明试剂盒用于本文所述的本发明方法。
如本文所述的本发明可例如有利地用于如下至少一种活动中:
基于推测的对象中JAK-STAT3细胞信号传导途径的活性的诊断;
基于推测的对象中JAK-STAT3细胞信号传导途径的活性的预后;
基于推测的对象中JAK-STAT3细胞信号传导途径的活性的药物处方;
基于推测的对象中JAK-STAT3细胞信号传导途径的活性的药物功效预测;
基于推测的对象中JAK-STAT3细胞信号传导途径的活性的不良反应预测;
监测药物功效;
药物开发;
测定分析开发;
途径研究;
癌症分期;
基于推测的对象中JAK-STAT3细胞信号传导途径的活性的临床试验对象招募;
选择要进行的后续检测;和
选择伴随诊断检测。
通过阅读和理解附图、下文描述、尤其是阅读下面提供的详细实施例,进一步的优势对于本领域普通技术人员将是明显的。
应当理解,权利要求1的方法、权利要求7的设备、权利要求8的非暂时存储介质、权利要求9的计算机程序、权利要求10至12的试剂盒以及权利要求13的试剂盒应用具有相似和/或相同的优选实施方案,特别是如从属权利要求中所限定。
应当理解,本发明的优选实施方案也可以是从属权利要求或上述实施方案和各个独立权利要求的任意组合。
本发明的这些和其它方面通过参考下文描述的实施方案将变得明显并得以阐明。
附图简述
图1示意性且示例性地示出了JAK-STAT3细胞信号传导途径。在细胞核中,STAT3与基因的启动子结合并诱导遗传程序,该程序促进癌症进展所需的各种细胞过程(参见图1,其基于Yu H.et al.,“STATs in cancer inflammation and immunity:a leading rolefor STAT3”,Nature Reviews Cancer,Vol.9,No.11,November 2009,pages 798-809;“UVR;S”=UV辐照或日光;“C”=致癌物;“I”=感染;“ST”=应激;“SM”=吸烟;“OA”=癌基因激活;“GFR”=生长因子受体;“CR”=细胞因子受体;“TlR”=toll样受体;“AR”=肾上腺素能受体;“NR”=烟碱受体;“OF,IF”=致癌和炎症因子)。
图2示意性且示例性示出数学模型,在此是贝叶斯网络模型,用于对JAK-STAT3细胞信号传导途径的转录程序建模。
图3示出流程图,其示例性示出基于在对象样品中测量的JAK-STAT3细胞信号传导途径靶基因的表达水平推测对象中JAK-STAT3细胞信号传导途径的活性的过程。
图4示出流程图,其示例性示出获得如本文所述的经校准的数学路径模型的过程。
图5示出流程图,其示例性示出如本文所述确定对象样品中JAK-STAT3转录因子(TF)元件的活性水平的过程。
图6示出流程图,其示例性示出使用离散可观测量推测对象中JAK-STAT3细胞信号传导途径的活性的过程。
图7示出流程图,其示例性示出使用连续可观测量推测对象中JAK-STAT3细胞信号传导途径的活性的过程。
图8示出流程图,其示例性示出从JAK-STAT3细胞信号传导途径靶基因的RT-qPCR分析确定Cq值的过程。
图9示出了基于表1的靶基因证据汇总(curated)列表(39个靶基因列表)和本文所述的方法使用了来自数据集GSE57156的肺癌的EGFR突变细胞的贝叶斯网络模型的校准结果。
图10示出了基于表1的靶基因证据汇总列表(39个靶基因列表)和所述方法使用来自数据集GSE8687的皮肤T细胞淋巴瘤的Sez-4细胞系的贝叶斯网络模型的校准结果。
图11示出使用表1的靶基因证据汇总列表(39个靶基因列表),经训练的示例性肺贝叶斯网络模型的JAK-STAT3细胞信号传导途径活性预测(数据集GSE32975)。
图12示出使用表1的靶基因证据汇总列表(39个靶基因列表),经训练的示例性肺贝叶斯网络模型的JAK-STAT3细胞信号传导途径活性预测(数据集GSE20854)。
图13示出使用表1的靶基因证据汇总列表(39个靶基因列表),经训练的示例性肺贝叶斯网络模型的JAK-STAT3细胞信号传导途径活性预测(数据集GSE67051)。
图14示出使用表1的靶基因证据汇总列表(39个靶基因列表),经训练的示例性肺贝叶斯网络模型的JAK-STAT3细胞信号传导途径活性预测(数据集GSE52212)。
图15示出使用表1的靶基因证据汇总列表(39个靶基因列表),经训练的示例性肺贝叶斯网络模型的JAK-STAT3细胞信号传导途径活性预测(数据集GSE64536)。
图16示出使用表1的靶基因证据汇总列表(39个靶基因列表),经训练的示例性肺贝叶斯网络模型的JAK-STAT3细胞信号传导途径活性预测(数据集GS8685)。
图17示出使用表1的靶基因证据汇总列表(39个靶基因列表),经训练的示例性肺贝叶斯网络模型的JAK-STAT3细胞信号传导途径活性预测(数据集GS8507)。
图18示出分别使用表1的靶基因证据汇总列表(39个靶基因列表)和表2的针对JAK-STAT3肺模型的10个靶基因入选列表(shortlist),经训练的示例性肺贝叶斯网络模型之间的相关性。
图19示出分别使用表1的靶基因证据汇总列表(39个靶基因列表)和表3的针对JAK-STAT3血液模型的12个靶基因入选列表,经训练的示例性血液贝叶斯网络模型之间的相关性。
实施方案的详细描述
如下实施例仅举例说明特别优选的方法和与此相关的所选方面。本文提供的教导可用于构建几种检测和/或试剂盒,例如以检测、预测和/或诊断JAK-STAT3细胞信号传导途径的异常活性。此外,基于使用本文所述的方法,可以有利地指导药物处方,可以进行药物反应预测和药物功效(和/或不良反应)监测,可以预测和监测耐药性,例如以选择后续要进行的检测(例如伴随诊断检测)。如下实施例不应解释为限制本发明的范围。
实施例1:数学模型构建
如已公开的国际专利申请WO 2013/011479 A2(“Assessment of cellularsignaling pathway activity using probabilistic modeling of target geneexpression”)中所详述,通过构建概率模型例如贝叶斯网络模型,及合并细胞信号传导途径(在此为JAK-STAT3细胞信号传导途径)的三个或更多个靶基因的表达水平与转录因子(TF)元件(在此为JAK-STAT3 TF元件)的活性水平之间的条件概率关系,所述TF元件控制所述细胞信号传导途径的所述三个或更多个靶基因的转录,这种模型可以用于以高准确性程度确定所述细胞信号传导途径的活性。此外,通过调整条件概率和/或在模型加入新节点以表示其它信息源,可以轻松地更新所述概率模型以合并以后临床研究获得的其它知识。由此可以适当地更新所述概率模型以体现最新的医学知识。
在公开的国际专利申请WO 2014/102668 A2(“Assessment of cellularsignaling pathway activity using linear combination(s)of target geneexpressions”)中详细描述了另一种易于理解和解释的方法,细胞信号传导途径(在此是JAK-STAT3细胞信号传导途径)的活性可以通过构建和评估线性或(伪)线性模型而确定,所述模型合并了所述细胞信号传导途径的三个或更多个靶基因的表达水平与转录因子(TF)元件(在此是JAK-STAT3TF元件)的水平之间的关系,所述TF元件控制所述细胞信号传导途径的所述三个或更多个靶基因的转录,所述模型基于所述三个或更多个靶基因的表达水平的一个或多个线性组合。
在这两种方法中,所述三个或更多个靶基因的表达水平可以优选是测量的mRNA水平,这可以是例如使用与靶基因mRNA序列相关的探针的(RT)-PCR和微阵列技术以及RNA测序的结果。在另一个实施方案中,所述三个或更多个靶基因的表达水平可以通过蛋白质水平例如由靶基因编码的蛋白质的浓度和/或活性来测量。
前述表达水平可以任选地以可能更好或不适合所述应用的许多方式转换。例如,表达水平的四种不同转化,例如基于微阵列的mRNA水平,可以是:
-“连续数据”,即使用熟知算法如MAS5.0和fRMA预处理微阵列之后获得的表达水平,
-“z分数”,即按比例的连续表达水平,由此所有样品的平均值为0,标准偏差为1,
-“离散”,即高于某个阈值的每个表达水平设置为1,低于其设置为0(例如可以选择探针组的阈值作为在一组阳性和相同数目阴性临床样品中其值的(加权)中值),
-“模糊”,即使用以下格式的sigmoid函数将连续表达水平转换为0-1之间的值:1/(1+exp((thr–expr)/se)),expr是连续表达水平,thr是前面提到的阈值,se是影响0-1之间差异的软化参数。
可以构建的最简单线性模型之一是在第一层中具有代表转录因子(TF)元件(此处为JAK-STAT3 TF元件)的节点及在第二层中具有代表靶基因表达水平直接测量值的加权节点的模型,所述表达水平例如在微阵列或(q)PCR实验中通过与特定靶基因高度相关的一个探针组测量。权重可以基于从训练数据集的计算或者基于专业知识。在可能测量每个靶基因的多个表达水平的情况下(例如在微阵列实验中,可以用多个探针组测量一个靶基因),使用这种方法,每个靶基因只有一个表达水平特别简单。选择用于特定靶基因的一个表达水平的一种特定方法是使用探针组中的表达水平,其能最佳地分离训练数据集的活跃和不活跃样品。确定这种探针组的一种方法是进行统计学检验,例如t检验,并选择具有最低p值的探针组。根据定义,具有最低p值的探针组的训练数据集表达水平是(已知)活跃和不活跃样品的表达水平重叠的可能性最低的探针组。另一种选择方法是基于几率比。在这种模型中,为所述三个或更多个靶基因的每一个提供一个或多个表达水平,且所述一个或多个线性组合包含这样的线性组合,其包括所述三个或更多个靶基因每一个的加权项,每个加权项基于为相应靶基因提供的一或多个表达水平中的仅一个表达水平。如果如上所述每个靶基因仅选择一个表达水平,则该模型可以称为“最具辨别性探针组(most discriminantprobesets)”模型。
在所述“最具辨别性探针组”模型的替代中,在每个靶基因可能测量多个表达水平的情况下,可以利用每个靶基因提供的所有表达水平。在这种模型中,为所述三个或更多个靶基因的每一个提供一个或多个表达水平,并且所述一个或多个线性组合包含为所述三个或更多个靶基因提供的所述一个或多个表达水平的所有表达水平的线性组合。换句话说,对于所述三个或更多个靶基因的每一个,为各个靶基因提供的所述一个或多个表达水平的每一个可以在所述线性组合中通过其自身的(个体)权重来加权。这个变体可以称为“全探针组”模型。其具有在使用所有提供的表达水平时相对简单的优点。
如上所述的两个模型的共同点是其可以被视为“单层”模型,其中TF元件的活性水平基于所述三个或更多个靶基因的所述一或多个探针组的表达水平的线性组合计算。
通过评估各个模型确定所述TF元件(此处为JAK-STAT3 TF元件)的活性水平之后,可以对确定的TF元件活性水平设定阈值,以推测所述细胞信号传导途径(此处为JAK-STAT3细胞信号传导途径)的活性。计算这种合适阈值的优选方法是通过比较已知具有不活跃细胞信号传导途径的训练样品和具有活跃细胞信号传导途径的训练样品的确定的TF元件活性水平wlc(加权线性组合)。通过使用阈值给出一种这样做的方法,该方法还考虑了这些组中的方差。
Figure BDA0002519458730000091
其中σ和μ是训练样品的标准偏差和确定的TF元件活性水平wlc的平均值。在活跃和/或不活跃训练样品中只有少量样品可用的情况下,可以基于两组方差的平均值将伪计数加入计算的方差中:
Figure BDA0002519458730000092
其中v是确定的各组TF元件活性水平wlc的方差,x是正伪计数,例如1或10,并且nact和npas分别是活跃和不活跃样品数。接下来可以通过求出方差v的平方根获得标准偏差σ。
为了便于解释,可以从确定的TF元件活性水平wlc中减去阈值,从而得出细胞信号传导途径活性分数,其中负值对应于不活跃细胞信号传导途径,而正值对应于活跃细胞信号传导途径。
作为上述“单层”模型的替代,“两层”模型也可用于实施例中。在这种模型中,使用基于其相关探针组的测量强度的线性组合计算每个靶基因的总结值(summary value)(“第一(底)层”)。随后使用进一步的线性组合(“第二(上)层”)将计算的总结值与所述细胞信号传导途径的其它靶基因的总结值组合。同样,可以从训练数据集中学习加权,也可以根据专业知识或其组合加权。换句话说,在“两层”模型中,为所述三个或更多个靶基因的每一个提供一或多个表达水平,及所述一或多个线性组合包含所述三个或更多个靶基因每一个的第一线性组合,该第一线性组合是各个靶基因的所述一或多个表达水平的所有表达水平的组合(“第一(底)层”)。所述模型进一步基于进一步的线性组合,该线性组合包括针对所述三个或更多个靶基因每一个的加权项,每个加权项基于各个靶基因的所述第一线性组合(“第二(上)层”)。
在优选的“两层”模型版本中,总结值的计算可以包括使用训练数据为每个靶基因定义阈值以及从计算的线性组合中减去阈值,从而得出靶基因总结值。在此,可以选择阈值,使得靶基因负总结值对应于下调的靶基因,而靶基因正总结值对应于上调的靶基因。同样,在将靶基因总结值组合在“第二(上)层”中之前,可以使用例如上述转换方式(模糊,离散等)转化靶基因总结值。
如上所述,在通过评估所述“两层”模型确定了所述TF元件的活性水平之后,可以将确定的TF元件活性水平设定阈值,以推测所述细胞信号传导途径的活性。
在下文中,上述模型统称为“(伪)线性”模型。在下文实施例3中提供了训练和使用概率模型例如贝叶斯网络模型的更详细描述。
实施例2:靶基因的选择
转录因子(TF)是蛋白质复合物(即在特定结构中结合在一起的蛋白质组合)或者能通过与特定DNA序列结合以调节靶基因转录从而控制从DNA到mRNA的遗传信息转录的蛋白质。由于TF复合物的这种作用而直接产生的mRNA在本文中被称为(转录因子的)“直接靶基因”。细胞信号传导途径激活也可能导致更多的次级基因转录,称为“间接靶基因”。在下文中,优选这样的(伪)线性模型或贝叶斯网络模型(例如数学模型),其包含或由作为细胞信号传导途径活性和mRNA水平之间的直接链接的直接靶基因组成,但是直接靶基因和间接靶基因之间的区别并不总是明显。在本文中,提出了一种基于可获得的科学文献数据使用评分函数选择直接靶基因的方法。但是,由于信息有限以及生物学变异和不确定性,不能排除偶然选择间接靶基因。为了选择靶基因,使用了美国国立卫生研究院MEDLINE数据库产生靶基因列表,其网址为“www.ncbi.nlm.nih.gov/pubmed”,在本文中进一步称为“Pubmed”。此外,基于靶基因表达的经证明的性质,选择靶基因的两个额外列表。
在2017年第一季度和第二季度通过使用查询词如(“JAK-STAT3”AND“targetgene”)搜索包含推定的JAK-STAT3靶基因的出版物。根据下文更详细描述的方法学对所得出版物进行进一步人工分析。
通过使用分级系统从科学文献中选择特定细胞信号传导途径mRNA靶基因,在所述分级系统中,根据积累了证据的科学实验的类型,对特定靶基因的科学证据进行评级。虽然一些实验证据仅提示某基因是直接靶基因,例如通过增加细胞系(其中已知JAK-STAT3细胞信号传导途径是活跃的)微阵列上探针组的强度检测到mRNA增加,其它证据可以非常强,例如鉴别的JAK-STAT3细胞信号传导途径TF结合位点及这个位点在刺激细胞中特定细胞信号传导途径之后在染色质免疫沉淀测定(ChIP)中的恢复的组合,以及在细胞系中特异性刺激细胞信号传导途径之后mRNA的增加。
发现特定细胞信号传导途径靶基因的一些类型的实验可见于一些科学文献中:
1.ChIP实验,其中示出感兴趣的细胞信号传导途径的TF与基因组上其结合位点的直接结合。实例:通过使用染色质免疫沉淀(ChIP)技术,随后鉴别了细胞系DNA中推定的功能性JAK-STAT3 TF结合位点,使用和不用活跃诱导JAK-STAT3细胞信号传导途径,例如通过用JAK-STAT3刺激,作为仅基于核苷酸序列识别的结合位点的子集。推定的功能性被鉴定为ChIP衍生的证据,发现TF与DNA结合位点结合。
2.电泳迁移率(EMSA)测定,其示出TF与包含结合序列的DNA片段的体外结合。与基于ChIP的证据相比,基于EMSA的证据较弱,因为其不能转换为体内情况。
3.细胞信号传导途径的刺激及使用微阵列、RNA测序、定量PCR或其它技术测量mRNA表达,使用JAK-STAT3细胞信号传导途径可诱导的细胞系并在诱导后的至少一个、但优选几个时间点测量mRNA谱,在存在环己酰亚胺(其抑制翻译为蛋白质)的情况下进行,因此假定诱导的mRNA是直接靶基因。
4.与3相似,但是另外使用蛋白质丰度测量例如western印迹进一步下游测量mRNA表达。
5.使用生物信息学方法鉴定基因组中TF结合位点。关于JAK-STAT3 TF元件的示例:使用结合基序CTGGGAA,在基因启动子区域鉴定出潜在的结合位点。
6.与3相似,唯一不同是不存在环己酰亚胺。
7.与4相似,唯一不同是不存在环己酰亚胺。
对于这些实验方法中的每一种,以最简单的形式可以给每个潜在基因1分,其中该基因被鉴定为JAK-STAT3转录因子家族的靶基因。使用这种相对分级策略,可以给出最可靠靶基因列表。
或者,可以使用另一种分级方式以鉴定最可能是直接靶基因的靶基因,通过为体内直接靶基因提供最多证据的技术赋予更高分进行。在上面列表中,对于实验方法1)赋予7分,对于方法2)赋予6分,对于实验方法7)赋予1分。这种列表可以称为“靶基因一般列表”。
尽管存在生物学差异和不确定性,但本发明人假设直接靶基因最有可能以与组织非依赖性方式被诱导。这些靶基因的列表可以称为“靶基因证据汇总列表”。这种靶基因证据汇总列表已用于构建JAK-STAT3细胞信号传导途径的计算模型,其可应用于来自不同组织来源的样品。
下文示例了对于JAK-STAT3细胞信号传导途径,如何特别构建证据汇总靶基因列表的选择。
引进了在出版物中报道的一种评分函数,其为每种类型的实验证据例如ChIP、EMSA、差异表达、敲除/敲掉、萤光素酶基因报告蛋白测定、序列分析等赋分。相同的实验证据有时会在多个出版物中提及,而获得相应分值,例如两个出版物提及ChIP结果导致所得分数是单个ChIP结果的两倍。对具有不同类型的实验证据而不是仅一种类型实验证据的基因进行进一步分析,例如差异表达。选择那些可以获得一种以上类型实验证据的基因(如表1所示)。
本发明人进一步选择了靶基因证据汇总列表(列于表2)。选择了被证明在确定训练样品中JAK-STAT3信号传导途径的活性方面更可信的证据汇总列表的靶基因。在此,使用了来自数据集GSE57156的肺癌EGFR突变细胞的可用表达数据集。用厄洛替尼处理的细胞是JAK-STAT3非活跃(inactive)的,而用DMSO处理的细胞是JAK-STAT3活跃的。在来自GSE57156数据集的STAT3活跃和非活跃样品之间比较表1的“靶基因证据汇总列表”(39个靶基因列表)的基因表达值。如果靶基因的表达水平在途径活跃和非活跃组之间有明显差异,这表明靶基因可用于区分所述途径活跃和非活跃组,然后选择所述靶基因。这获得了表2示出的“JAK-STAT3肺模型的10个靶基因入选列表”。关于JAK-STAT3血液模型,采用数据集GSE8687中衍生自皮肤T细胞淋巴瘤的Sez-4细胞系来选择靶基因入选列表。缺乏IL-2的细胞是JAK-STAT3非活跃的,用IL-2培养的细胞是JAK-STAT3活跃的。在GSE8687数据集的STAT3活跃和非活跃样品之间比较表1的“靶基因证据汇总列表”(39个靶基因列表)的基因表达值。如果靶基因的表达水平在途径活跃和非活跃组之间有明显差异,这表明靶基因可用于区分所述途径活跃和非活跃组,然后选择靶基因。这获得在表3中示出的“JAK-STAT3血液模型的12个靶基因入选列表”。
表1:在JAK-STAT3细胞信号传导途径模型中使用的JAK-STAT3细胞信号传导途径的“靶基因证据汇总列表”(39个靶基因列表)和用于测量靶基因mRNA表达水平的相关探针组
Figure BDA0002519458730000121
Figure BDA0002519458730000131
表2:基于JAK-STAT3靶基因的证据汇总列表的JAK-STAT3靶基因的“JAK-STAT3肺模型的10个靶基因入选列表”(相关探针组与表1相同)
靶基因
BCL2L1
BIRC5
CCND1
CD274
FOS
HIF1A
HSP90AA1
HSP90AB1
MMP1
MYC
表3:基于JAK-STAT3靶基因的证据汇总列表的JAK-STAT3靶基因的“JAK-STAT3血液模型的12个靶基因入选列表”(相关探针组与表1相同)
靶基因
BCL2L1
CD274
FOS
HSP90B1
HSPA1B
ICAM1
IFNG
JunB
PTGS2
STAT1
TNFRSF1B
ZEB1
实施例3:训练和使用数学模型
在数学模型可用于推测对象的细胞信号传导途径(此处为JAK-STAT3细胞信号传导途径)的活性之前,必须对模型进行适当的训练。
如果所述数学途径模型是基于将JAK-STAT3 TF元件的活性水平与在对象样品中测量的JAK-STAT3细胞信号传导途径的三个或更多个靶基因的表达水平相关联的条件概率模型例如贝叶斯网络模型,所述训练可优选如公开的国际专利申请WO 2013/011479 A2(“Assessment of cellular signaling pathway activity using probabilisticmodeling of target gene expression”)所详细描述地进行。
如果所述数学途径模型基于在对象样品中测量的JAK-STAT3细胞信号传导途径的三个或更多个靶基因的表达水平的一或多个线性组合,所述训练可优选如在公开的国际专利申请WO 2014/102668 A2(“Assessment of cellular signaling pathway activityusing linear combination(s)of target gene expressions”)中所详细描述地进行。
在此,使用图2所示的示例性贝叶斯网络模型以简单方式对JAK-STAT3细胞信号传导途径的转录程序进行建模。所述模型由三种类型的节点组成:(a)第一层1中的转录因子(TF)元件(状态为“不存在”和“存在”);(b)第二层2中的靶基因TG1、TG2、TGn(状态为“下调”和“上调”);以及(c)第三层3中与靶基因表达水平关联的测量节点。这些可以是如本文优选使用的微阵列探针组PS1,1、PS1,2、PS1,3、PS2,1、PSn,1、PSn,m(状态为“低”和“高”),也可以是其它基因表达测量例如RNAseq或RT-qPCR。
所述数学模型的一种合适实施方式在本文中是示例的贝叶斯网络模型,其基于微阵列数据。所述模型描述了(i)靶基因的表达水平如何取决于TF元件的激活,以及(ii)探针组强度又如何取决于各自靶基因的表达水平。对于后者,探针组强度可以取自fRMA预处理的Affymetrix HG-U133Plus2.0微阵列,其可广泛得自Gene Expression Omnibus(GEO,www.ncbi.nlm.nih.gov/geo)和ArrayExpress(www.ebi.ac.uk/arrayexpress)。
由于示例的贝叶斯网络模型是细胞信号传导途径(此处是JAK-STAT3细胞信号传导途径)的生物学的简化,且由于生物学测量通常有噪声,因此选择了概率方法,即(i)TF元件和靶基因以及(ii)靶基因与其各自探针组之间的关系以概率术语描述。此外,假定驱动肿瘤生长的致癌细胞信号传导途径的活性不是瞬时和动态改变的,而是长期甚至不可逆地改变的。因此,开发示例的贝叶斯网络模型用于解释静态细胞状况。由于这个原因,复杂的动态细胞信号传导途径特征未纳入所述模型。
一旦建立并校准了示例的贝叶斯网络模型(参见下文),所述模型可用于新样品的微阵列数据,将探针组测量值作为观测值输入第三层3中并在模型中回推TF元件“存在”的概率必须是多少。在此,“存在”被认为是TF元件与DNA结合并控制细胞信号传导途径的靶基因转录的现象,而“不存在”是TF元件不控制转录的情况。因此,这种概率是主要读出数,可用于表示细胞信号传导途径(此处是JAK-STAT3细胞信号传导途径)的活性,接下来可将其翻译为细胞信号传导途径是活跃的几率,通过取其是活跃的概率与其是不活跃的概率之比(即几率以p/(1-p)给出,其中p是细胞信号传导途径是活跃的预测概率)。
在示例的贝叶斯网络模型中,概率关系已被量化以定量概率推理。为了改善跨组织类型的泛化行为,精心挑选了描述(i)TF元件与靶基因之间的概率关系的参数。如果TF元件“不存在”,则靶基因很可能“下调”,因此为此选择了0.95的概率,而对于靶基因“上调”则选择了0.05的概率。后者(非零)概率是为了解释靶基因受其它因子调控或偶然被观测为“上调”(例如由于测量噪声)的(极小)概率。如果TF元件是“存在”,则靶基因被认为是“上调”的概率是0.70,而靶基因被认为是“下调”的概率是0.30。之所以选择后一数值,是因为可能有一些原因导致即使存在TF元件也无法高表达靶基因,例如由于基因的启动子区域被甲基化。在靶基因不被TF元件上调而被下调的情况下,以相似方式选择概率,但是反映了TF元件存在时的下调。描述(ii)靶基因及其各自探针组之间关系的参数已根据实验数据校准。对于后者,在这个实施例中,使用来自已知具有活跃的JAK-STAT3细胞信号传导途径的患者样品的微阵列数据,而来自同一数据集的正常健康样品被用作不活跃JAK-STAT3细胞信号传导途径样品,但这也可以使用细胞系实验或其它已知细胞信号传导途径活性状态的患者样品进行。所得条件概率表由下式给出:
A:对于上调的靶基因
Figure BDA0002519458730000151
B:对于下调的靶基因
Figure BDA0002519458730000152
在这些表中,变量ALi,j、AHi,j、PLi,j和PHi,j表示“不存在”(A)或“存在”(P)转录复合物的分别具有“低”(L)或“高”(H)探针组强度的校准样品数。加入虚(dummy)计数以避免极端概率0和1。
为了离散所观测的探针组强度,对于每个探针组PSi,j使用阈值ti,j,低于此的观测值称为“低”,高于此的称为“高”。这个阈值已选择为所用校准数据集中探针组的(加权)中值强度。由于微阵列数据的噪声,当将观测的探针组强度与其阈值进行比较时,采用了一种模糊方法,其假设在报道的强度周围的正态分布,标准偏差为0.25(基于log2尺度),并确定低于和高于所述阈值的概率质量。
如果代替上述示例的贝叶斯网络,采用上述实施例1中所述的(伪)线性模型,表示节点与阈值之间的相关性的符号和大小以调用节点是“不存在”或“存在”的权重需要在可将所述模型用于推测检测样品中细胞信号传导途径活性之前确定。可以使用专业知识推测地(a priori)填充所述权重和阈值,但是通常将使用一组代表性的训练样品来训练所述模型,优选已知基本事实的训练样品,例如已知“存在”转录因子复合物(=活跃细胞信号传导途径)或“不存在”转录因子复合物(=不活跃细胞信号传导途径)的样品中探针组表达数据。
本领域中已知多种训练算法(例如回归),其考虑了模型拓扑并改变了模型参数(此处是权重和阈值),由此模型输出(此处是加权线性分数)得以优化。或者,也可以直接从观测的表达水平计算权重,而无需优化算法。
在本文中被称为“黑与白”方法的第一种方法归结为三元系统,其中每个权重是集合{-1,0,1}的元素。如果将其置于生物学环境中,则-1和1分别对应于细胞信号传导途径活性情况中被下调和上调的靶基因或探针组。在无法统计学证明探针组或靶基因被上调或下调的情况中,接受权重为0。在一个实例中,活跃细胞信号传导途径样品的表达水平相对于不活跃细胞信号传导途径样品的表达水平的左侧和右侧两样品t检验可用于鉴于使用的训练数据确定探针或基因是上调或下调的。在活跃样品的平均值在统计学上大于不活跃样品的平均值(即p值低于某个阈值,例如0.3)的情况下,确定靶基因或探针组是上调的。相反,在活跃样品的平均值在统计学上低于不活跃样品的情况下,确定靶基因或探针组在激活细胞信号传导途径后被下调。在最低p值(左侧或右侧)超过上述阈值,则可以将靶基因或探针组的权重定义为0。
在本文中被称为“对数几率”-权重的第二种方法基于几率比(odds ratio)的对数(例如以e为底)。基于探针组/靶基因水平高于和低于相应阈值(例如所有训练样品的(加权)中值)的阳性和阴性训练样品的数量,计算每个靶基因或探针组的几率比。可以加入伪计数以避免除以零。进一步的改进是以更概率性方式计数高于/低于所述阈值的样品,其假设探针组/靶基因水平是例如在其观测值周围正态分布的,具有一定的指定标准偏差(例如在2-log尺度为0.25),并计算高于和低于所述阈值的概率质量。在本文中,组合伪计数并使用概率质量代替确定性测量值计算的几率比称为“软”几率比。
关于使用靶基因表达的数学建模来推测细胞信号传导途径活性的更多细节可见于Verhaegh W.et al.,“Selection of personalized patient therapy through theuse of knowledge-based computational models that identify tumor-drivingsignal transduction pathways”,Cancer Research,Vol.74,No.11,2014,pages 2936-2945。
在本文中,我们已将来自Affymetrix U133Plus2.0的可公开获得的mRNA表达数据用于GEO数据库的两个数据集。由于实体癌细胞和血细胞的STAT3途径激活对靶基因表达水平具有略有不同的影响,因此使用了两个不同的校准数据集,代表实体癌细胞和血细胞中的STAT3激活。一个数据集具有来自非小细胞肺癌的EGFR突变细胞。用厄洛替尼处理的EGFR突变细胞形成JAK-STAT3非活跃组,用DMSO处理的EGFR突变细胞作为JAK-STAT3活跃校准样品。另一个数据集具有源自皮肤T细胞淋巴瘤的Sez-4细胞系。将缺乏IL-2的细胞作为JAK-STAT3非活跃组,将用IL-2培养的细胞作为JAK-STAT3活跃校准样品。因此,使用相同的靶基因列表(参见表1),分别在具有肺癌细胞和血细胞的校准样品上分别校准了两个不同的模型。
在下文中,图9和10示出分别在具有肺癌细胞和血细胞的数据集上贝叶斯网络模型的校准结果。
图9示出了基于表1的靶基因证据汇总列表(39个靶基因列表)和本文所述方法,使用来自数据集GSE57156的肺癌EGFR突变细胞的贝叶斯网络模型的校准结果。用厄洛替尼处理的细胞(第1组)是JAK-STAT3非活跃的,而用DMSO处理的细胞(第2组)被认为是JAK-STAT3活跃的。在该图中,垂直轴表示TF元件“存在”相对于“不存在”的几率,其相应于JAK-STAT3细胞信号传导途径为活跃相对于不活跃的几率,其中水平轴上方的值相应于TF元件更可能是“存在”/活跃的,而水平轴下方的值指示TF元件“不存在”/不活跃的几率大于其“存在”/活跃的几率。JAK-STAT3模型(肺模型)能够清楚地将非活跃与活跃校准样品分开。
图10示出基于表1的靶基因证据汇总列表(39个靶基因列表)和所述方法,使用源自数据集GSE8687的皮肤T细胞淋巴瘤的Sez-4细胞系的贝叶斯网络模型的校准结果。缺乏IL-2的细胞(第1组)是JAK-STAT3非活跃的并用作对照组。训练组包括3个样品,具有用IL-2培养的细胞,是STAT3活跃的。在用pan-Jak抑制剂(第3组)和Jak3抑制剂(第4组)处理的其它样品上测试了所述模型。在该图中,垂直轴表示TF元件“存在”相对于“不存在”的几率,其相应于JAK-STAT3细胞信号传导途径是活跃的相对于不活跃的几率,其中水平轴上方的值相应于TF元件更可能是“存在”/活跃的,而水平轴下方的值指示TF元件“不存在”/不活跃的几率大于其“存在”/活跃的几率。所述JAK-STAT3模型(血液模型)能够清楚地将非活跃与活跃校准样品分开。
在下文中,图11-15示出使用靶基因的证据汇总列表(39个靶基因列表)的经训练的示例性肺贝叶斯网络模型的验证结果。
图11示出使用表1的靶基因证据汇总列表(39个靶基因列表)的经训练的示例性肺贝叶斯网络模型的JAK-STAT3细胞信号传导途径活性预测。在数据集GSE32975中,用表皮生长因子(EGF)刺激来自HaCaT细胞系的上皮细胞。每个组代表来自细胞系的一个重复。在该图中,垂直轴表示TF元件“存在”相对于“不存在”的几率,其相应于JAK-STAT3细胞信号传导途径是活跃的相对于不活跃的几率,其中水平轴上方的值相应于TF元件更可能是“存在”/活跃的,而水平轴下方的值指示TF元件“不存在”/不活跃的几率大于其“存在”/活跃的几率。JAK-STAT3肺模型正确预测了用EGF刺激的样品中的较高STAT3活性(每组的第二条),以及在未刺激的对照组(每组的第一个)中的非活跃STAT3。在第6组和第7组中,样品用吉非替尼处理,JAK-STAT3肺模型可以预测降低的STAT3途径活性(第6组和第7组的第三条)。
图12示出使用表1的靶基因证据汇总列表(39个靶基因列表)的经训练的示例性肺贝叶斯网络模型的JAK-STAT3细胞信号传导途径活性预测。在数据集GSE20854中,IshikawaH细胞(衍生自子宫内膜癌)被给予EGF(表皮生长因子)或Iressa(吉非替尼)12或24小时。在该图中,垂直轴表示TF元件“存在”相对于“不存在”的几率,其相应于JAK-STAT3细胞信号传导途径是活跃的相对于不活跃的几率,其中水平轴上方的值相应于TF元件更可能是“存在”/活跃的,而水平轴下方的值指示TF元件“不存在”/不活跃的几率大于其“存在”/活跃的几率。所述JAK-STAT3肺模型正确预测了与未被给药的并在12小时(第1组)和第24小时(第4组)收获的样品相比,用EGF刺激12小时(第2组)和24小时(第5组)的样品中更高的STAT3活性。第3组和第6组分别给予iressa 12小时和24小时,JAK-STAT3肺模型预测降低的STAT3途径活性。
图13示出使用表1的靶基因证据汇总列表(39个靶基因列表)的经训练的示例性肺贝叶斯网络模型的JAK-STAT3细胞信号传导途径活性预测。PC9或HCC827细胞是GFR突变的NSCLC(非小细胞肺癌)细胞,它们用厄洛替尼或DMSO处理8天(数据集GSE67051)。在该图中,垂直轴表示TF元件“存在”相对于“不存在”的几率,其相应于JAK-STAT3细胞信号传导途径是活跃的相对于不活跃的几率,其中水平轴上方的值相应于TF元件更可能是“存在”/活跃的,而水平轴下方的值指示TF元件“不存在”/不活跃的几率大于其“存在”/活跃的几率。所述JAK-STAT3肺模型正确地预测了与用厄洛替尼处理的PC9(第2组)和HCC827(第4组)细胞相比,在用DMSO处理的PC9(第1组)和HCC827(第3组)细胞中更高的STAT3活性。
图14示出使用表1的靶基因证据汇总列表(39个靶基因列表)的经训练的示例性肺贝叶斯网络模型的JAK-STAT3细胞信号传导途径活性预测。在数据集GSE51212中,EGFR突变的肺癌细胞HCC827用1uM厄洛替尼(EGFR抑制剂)和DMSO处理。在该图中,垂直轴表示TF元件“存在”相对于“不存在”的几率,其相应于JAK-STAT3细胞信号传导途径是活跃的相对于不活跃的几率,其中水平轴上方的值相应于TF元件更可能是“存在”/活跃的,而水平轴下方的值指示TF元件“不存在”/不活跃的几率大于其“存在”/活跃的几率。所述JAK-STAT3肺模型正确地预测了与用厄洛替尼处理3小时(第3组)、6小时(第4组)、12小时(第5组)和24小时(第6组)的细胞相比,在用DMSO处理6小时(第1组)和24小时(第2组)的细胞中更高的STAT3活性。
图15示出使用表1的靶基因证据汇总列表(39个靶基因列表)的经训练的示例性肺贝叶斯网络模型的JAK-STAT3细胞信号传导途径活性预测。他莫昔芬的siSTAT3敲低(knockdown)启动转化诱导型乳腺癌模型系统(数据集GSE64536),具有乙醇(EtOH)和siNEG处理的相关对照。在该图中,垂直轴表示TF元件“存在”相对于“不存在”的几率,其相应于JAK-STAT3细胞信号传导途径是活跃的相对于不活跃的几率,其中水平轴上方的值相应于TF元件更可能是“存在”/活跃的,而水平轴下方的值指示TF元件“不存在”/不活跃的几率大于其“存在”/活跃的几率。所述JAK-STAT3肺模型正确地预测了与用他莫昔芬启动4小时(第3组)和24小时(第4组)的细胞相比,用乙醇处理4小时(第1组)和24小时(第2组)的细胞中更高的STAT3活性。
在下文中,图16和17示出使用靶基因的证据汇总列表(39个靶基因列表)的经训练的示例性血液贝叶斯网络模型的验证结果。
图16示出使用表1的靶基因证据汇总列表(39个靶基因列表)的经训练的示例性血液贝叶斯网络模型的JAK-STAT3细胞信号传导途径活性预测。Sez-4细胞系衍生自皮肤T细胞淋巴瘤(数据集GSE8685)。细胞缺乏IL-2共16小时(第1组),随后添加IL-2(200U)相对于IL-15(20ng/mL)。在该图中,垂直轴表示TF元件“存在”相对于“不存在”的几率,其相应于JAK-STAT3细胞信号传导途径是活跃的相对于不活跃的几率,其中水平轴上方的值相应于TF元件更可能是“存在”/活跃的,而水平轴下方的值指示TF元件“不存在”/不活跃的几率大于其“存在”/活跃的几率。所述JAK-STAT3血液模型正确地预测了与对照组(第1组)相比,用IL-2(第2组)和IL-15(第3组)处理的细胞中JAK-STAT3是活跃的。
图17示出使用表1的靶基因证据汇总列表(39个靶基因列表)的经训练的示例性血液贝叶斯网络模型的JAK-STAT3细胞信号传导途径活性预测。外周血单个核细胞(PBMC)分离自具有JAK-STAT3突变和所致免疫疾病(高IgE综合征)的患者和健康对照对象的全血(数据集GSE3507)。在该图中,垂直轴表示TF元件“存在”相对于“不存在”的几率,其相应于JAK-STAT3细胞信号传导途径是活跃的相对于不活跃的几率,其中水平轴上方的值相应于TF元件更可能是“存在”/活跃的,而水平轴下方的值指示TF元件“不存在”/不活跃的几率大于其“存在”/活跃的几率。所述JAK-STAT3血液模型正确地预测了健康对照组(第1组)中JAK-STAT3是非活跃的,对照组(无乳胶珠)在180分钟后(第2组)JAK-STAT3活性增加,在用IgG包被的乳胶珠处理180分钟的细胞中STAT3是高度活跃的。
图18示出使用表1的靶基因证据汇总列表(39个靶基因列表)和表2的JAK-STAT3肺模型的10个靶基因入选列表的经训练的示例性肺贝叶斯网络模型的进一步验证结果。在此,表1的靶基因证据汇总列表(39个靶基因列表)与JAK-STAT3肺模型的10个靶基因入选列表针对JAK-STAT3肺模型的相同数据集进行了比较。
图18示出分别用表1的靶基因证据汇总列表(39个靶基因列表)和表2的JAK-STAT3肺模型的10个靶基因入选列表的经训练的示例性肺贝叶斯网络模型之间的相关性。在该图中,水平轴表示经训练的示例性肺贝叶斯网络模型使用表1的靶基因证据汇总列表(39个靶基因列表)所预测的TF元件“存在”相对于“不存在”的几率(log2刻度),其相应于JAK-STAT3细胞信号传导途径是活跃的相对于不活跃的几率。垂直轴显示经训练的示例性肺贝叶斯网络模型使用JAK-STAT3肺模型的10个靶基因入选列表所预测的相同信息(数据集GSE57156,GSE32975,GSE20854,GSE67051,GSE51212,GSE64536)。这两个模型显著相关,p值为2.2e-16,相关系数为0.866。
图19示出使用表1的靶基因证据汇总列表(39个靶基因列表)和表3的JAK-STAT3血液模型的12个靶基因入选列表的经训练的示例性肺贝叶斯网络模型的进一步验证结果。在此,将表1的靶基因证据汇总列表(39个靶基因列表)与JAK-STAT3血液模型的12个靶基因入选列表针对JAK-STAT3肺模型的相同数据集进行了比较。
图19示出分别用表1的靶基因证据汇总列表(39个靶基因列表)和表3的JAK-STAT3血液模型的12个靶基因入选列表的经训练的示例性血液贝叶斯网络模型之间的相关性。在该图中,水平轴表示经训练的示例性血液贝叶斯网络模型使用表1的靶基因证据汇总列表(39个靶基因列表)所预测的TF元件“存在”相对于“不存在”的几率(log2刻度),其相应于JAK-STAT3细胞信号传导途径是活跃的相对于不活跃的几率。垂直轴显示经训练的示例性血液贝叶斯网络模型使用JAK-STAT3血液模型的10个靶基因入选列表所预测的相同信息(数据集GSE8687,GSE8685,GSE8507)。这两个模型显著相关,p值为2.2e-16,相关系数为0.963。
描述了基于JAK-STAT3活性关于疾病例如类风湿性关节炎的可预测性和/或例如对JAK-STAT抑制剂的治疗应答的进一步实验。在一个公共数据集GSE65010中,记忆和未致敏T效应细胞(即成熟且不同于活化或记忆T细胞,处于未在外周中面对其关联(cognate)抗原的状态)和T-Reg(CD4+-CD25+)细胞从健康个体和类风湿关节炎(RA)患者的外周血分离。分离RNA并进行Affymetrix HG-U133Plus2.0微阵列。使用基于血液的JAK-STAT3途径模型分析Affymetrix数据,并以log2几率刻度确定每个单独样品的JAK-STAT3途径活性。结果清楚表明,在类风湿性关节炎患者的样品中,与健康个体相比,JAK-STAT3途径在激活的记忆和T-Reg细胞方面更活跃(健康对照与RA患者的激活的记忆细胞之间的Wilcox检验p值为0.04;健康对照与RA患者的T-Reg细胞之间的Wilcox检验p值为0.065;健康对照与RA患者的激活的记忆加T-Reg细胞之间的组合Wilcox检验p值为0.0045)。因此,使用JAK-STAT3途径模型测量JAK-STAT3途径活性可以诊断类风湿关节炎并预测对抗STAT治疗的应答,监测治疗应答,正确用药和依从性检查。
代替对来自微阵列或RNA测序的mRNA输入数据应用经校准的数学模型例如示例性贝叶斯网络模型,在临床应用中开发专用测定以进行样品测量是有益的,例如在集成平台上使用qPCR确定靶基因的mRNA水平。然后可以使用揭示的靶基因的RNA/DNA序列确定在这种平台上选择哪些引物和探针。
通过将基于微阵列的数学模型用作参考模型,并验证开发的测定对一组验证样品是否给出相似结果,由此进行这种专用测定的验证。除了专用测定,还可以使用RNA测序数据作为输入测量值以建立和校准相似数学模型。
发现基于使用经校准的数学模型例如示例的贝叶斯网络模型的微阵列/RNA测序研究提示最佳指示特异性细胞信号传导途径活性的一组靶基因(例如表1-3)可以翻译成在对象的样品上和/或在计算机上进行的多重定量PCR测定,以解释表达测量结果和/或推测JAK-STAT3细胞信号传导途径的活性。为了开发针对细胞信号传导途径活性的这种检测(例如在中央服务实验室中FDA批准的或免于CLIA的检测,或者仅针对研究目的由实验室开发的检测),需要开发标准化检测试剂盒,这需要在临床试验中经过临床验证以获得监管部门批准。
本发明涉及通过数字处理装置推测对象中JAK-STAT3细胞信号传导途径的活性的计算机执行方法,其中所述推测基于在所述对象的样品中测量的JAK-STAT3细胞信号传导途径的三个或更多个靶基因的表达水平。本发明进一步涉及一种推测对象中JAK-STAT3细胞信号传导途径的活性的设备,其包括被配置为执行所述方法的数字处理器,涉及一种推测对象中JAK-STAT3细胞信号传导途径活性的非暂时存储介质,其存储可由数字处理装置执行以实施所述方法的指令,以及涉及一种推测对象中JAK-STAT3细胞信号传导途径的活性的计算机程序,其包含当所述计算机程序在数字处理装置上运行时使得所述数字处理装置执行所述方法的程序代码模块。
所述方法可用于例如诊断JAK-STAT3细胞信号传导途径的(异常)活性,基于推测的JAK-STAT3细胞信号传导途径的活性的预后,基于推测的JAK-STAT3细胞信号传导途径的活性的临床试验对象的招募,要进行的后续试验的选择,伴随诊断检测的选择,临床决策支持系统等。在这方面,参考公开的国际专利申请WO 2013/011479 A2(“Assessment ofcellular signaling pathway activity using probabilistic modeling of targetgene expression”)、公开的国际专利申请WO 2014/102668 A2(“Assessment of cellularsignaling pathway activity using linear combination(s)of target geneexpressions”)以及Verhaegh W.et al.,“Selection of personalized patient therapythrough the use of knowledge-based computational models that identify tumor-driving signal transduction pathways”,Cancer Research,Vol.74,No.11,2014,pages2936-2945,其更详细地描述了这些应用。
实施例4:例证本发明的进一步信息
(1)测量基因表达水平
使用本文所述的方法,进一步利用得自如本文所述一组独特靶基因的数据来推测JAK-STAT3细胞信号传导途径的活性。
分析提取的样品中基因表达水平的方法是众所周知的。例如,方法诸如Northern印迹、使用PCR、巢式PCR、定量实时PCR(qPCR)、RNA-seq或微阵列均可以用于获得基因表达水平数据。本领域已知用于分析靶基因基因表达的所有方法均涵盖在本文中。
使用基于PCR的方法确定基因的表达产物的方法可能特别有用。为了使用PCR定量基因表达的水平,通常使用常规定量实时PCR(qPCR)估算感兴趣的每个PCR产物的量,以测量在每个扩增循环后实时PCR产物的积累。这通常利用可检测的报告分子,例如嵌入染料、小槽结合染料或荧光探针,通过光应用激发报告分子发出荧光,所得荧光通常使用CCD相机或光电倍增管检测系统检测,如在美国专利号6,713,297中所揭示,所述专利并入本文作参考。
在一些实施方案中,在定量实时PCR(qPCR)测定中用于检测PCR产物的探针可以包括荧光标记。许多荧光标记是可商购的。例如,Molecular Probes,Inc.(Eugene,Oreg.)销售各种各样的荧光染料。非限制性实例包括Cy5,Cy3,TAMRA,R6G,R110,ROX,JOE,FAM,TexasRedTM和Oregon GreenTM。其它荧光标记可包括在qPCR测定中具有传统5’水解探针的IDTZEN双猝灭探针。这些探针可以包含例如5’FAM染料和3’TAMRA猝灭剂,3’Black HoleQuencher(BHQ,Biosearch Technologies)或内部ZEN猝灭剂和3’Iowa Black FluorescentQuencher(IBFQ)。
可以使用本领域熟知的方法将根据本发明有用的荧光染料附着于寡核苷酸引物。例如,为寡核苷酸添加荧光标记的一种常见方式是使染料的N-羟基琥珀酰亚胺(NHS)酯与靶上的反应性氨基反应。通过例如在核碱基上包含烯丙基胺基团可以对核苷酸加以修饰以携带反应性氨基。通过烯丙基胺标记在例如美国专利号5,476,928和5,958,691中描述,所述专利并入本文作参考。荧光标记核苷酸、寡核苷酸和多核苷酸的其它手段是本领域技术人员熟知的。
其它生荧光方法包括使用通用检测系统如SYBR-绿色染料,当插入来自任何基因表达产物的扩增的DNA时会发荧光,如美国专利号5,436,134和5,658,751所述,所述专利并入本文作参考。
确定靶基因表达水平的另一种有用方法包括RNA-seq,这是用于转录组分析的一种功能强大的分析工具,包括不同生理条件之间的基因表达水平差异,或者在疾病进展发生期间或过程中发生的变化。
确定基因表达水平的另一种方法包括使用微阵列,例如RNA和DNA微阵列,这是本领域熟知的。微阵列可用于同时定量大量基因的表达。
(2)确定JAK-STAT3细胞信号传导活性的通用工作流程
图3示例性地示出从分离自对象的样品推测JAK-STAT3细胞信号传导活性的过程的流程图。首先,分离来自样品的mRNA(11)。其次,使用本领域已知的测量基因表达的方法测量如本文所述的一组独特的至少三个或更多个JAK-STAT3靶基因的mRNA表达水平(12)。接下来,使用将所述三个或更多个JAK-STAT3靶基因的表达水平与JAK-STAT3 TF元件的活性水平相关联的经校准的数学途径模型(14)确定JAK-STAT3转录因子(TF)元件的活性水平(13)。最后,基于确定的对象样品中JAK-STAT3 TF元件的活性水平,推测对象中JAK-STAT3细胞信号传导途径的活性(15)。例如,如果所述活性高于某阈值,则JAK-STAT3细胞信号传导途径被确定是活跃的,如果所述活性低于某阈值,则可以归类为不活跃的。
(3)经校准的数学途径模型
如本文预期的,本文所述的一组独特的三个或更多个JAK-STAT3靶基因的表达水平用于确定JAK-STAT3 TF元件的活性水平,使用如本文进一步描述的经校准的数学途径模型进行。所述经校准的数学途径模型将所述三个或更多个JAK-STAT3靶基因的表达水平与JAK-STAT3 TF元件的活性水平相关联。
如本文预期的,所述经校准的数学途径模型基于数学途径模型的应用。例如,所述经校准的数学途径模型可以基于概率模型,例如贝叶斯网络模型,或者线性或伪线性模型。
在一个实施方案中,所述经校准的数学途径模型是掺入将JAK-STAT3 TF元件和所述三个或更多个JAK-STAT3靶基因的表达水平相关联的条件概率关系的概率模型。在一个实施方案中,所述概率模型是贝叶斯网络模型。
在另一个实施方案中,所述经校准的途径数学模型可以是线性或伪线性模型。在一个实施方案中,所述线性或伪线性模型是如本文进一步描述的线性或伪线性组合模型。
图4中示出示例性地说明生成经校准的数学途径模型的程序的流程图。作为初始步骤,收集并标准化mRNA表达水平的训练数据。可以使用例如微阵列探针组强度(101)、实时PCR Cq值(102)、原始RNAseq读数(103)或本领域已知的另外的测量方式(104)来收集所述数据。然后可以通过使用标准化算法分别对每种方法的原始表达水平数据进行标准化,所述标准化算法例如是冷冻稳健军事分析(frozen robust military analysis,fRMA)或MAS5.0(111),对参考基因的平均Cq进行标准化(112),将读取标准化为每千碱基转录物每百万经作图的(mapped)读取的读取/片段(RPKM/FPKM)(113),或者对参考基因/蛋白质标准化(114)。这种标准化程序对于每种方法分别产生标准化的探针组强度(121),标准化的Cq值(122),标准化的RPKM/FPKM(123),或者标准化的测量(124),其指示训练样品内的靶基因表达水平。
一旦训练数据已经标准化,获得训练样品ID(131)且从确定基因表达的方法之一中获得这些特定样品的训练数据(132)。得自训练样品的最终基因表达结果作为训练数据输出(133)。合并来自各种训练样品的所有数据以校准模型(包括例如阈值,CPT,例如在概率或贝叶斯网络模型的情况下,权重,例如在线性或伪线性模型的情况下等)(144)。此外,途径的靶基因和测量节点(141)用于生成例如如图2所述的模型结构(142)。然后将所得的途径模型结构(143)与训练数据(133)合并以校准模型(144),其中靶基因的基因表达水平指示转录因子元件活性。作为在训练样品中TF元件确定的结果,生成了经校准的途径模型(145),其基于训练样品中靶基因表达水平将JAK-STAT3细胞信号传导途径活性分配给随后检验的感兴趣样品,例如来自患有癌症的对象的样品。
(4)TF元件确定
图5中示出示例性地说明确定TF元件活性水平的程序的流程图。将来自从对象提取的样品的表达水平数据(检测数据)(163)输入经校准的数学途径模型(145)中。所述数学途径模型可以是概率模型,例如贝叶斯网络模型,线性模型或伪线性模型。
所述数学途径模型可以是概率模型,例如贝叶斯网络模型,其基于将JAK-STAT3TF元件和在对象样品中测量的JAK-STAT3细胞信号传导途径的所述三个或更多个靶基因的表达水平相关联的条件概率,或者所述数学模型可以基于在对象样品中测量的JAK-STAT3细胞信号传导途径的所述三个或更多个靶基因表达水平的一或多个线性组合。特别地,可以如公开的国际专利申请WO 2013/011479 A2(“Assessment of cellular signalingpathway activity using probabilistic modeling of target gene expression”)确定JAK-STAT3细胞信号传导途径的活性,所述专利的内容全文并入本文作参考。简言之,将数据输入贝叶斯网络(BN)推理机调用(例如BNT工具箱)(154)。这样产生关于BN中所有节点的计算的边缘BN概率的一组值(155)。根据这些概率,确定转录因子(TF)节点的概率(156)并确立TF元件的活性水平(157)。
或者,所述数学模型可以是线性模型。例如可以使用线性模型,如公开的国际专利申请WO 2014/102668 A2(“Assessment of cellular signaling pathway activityusing linear combination(s)of target gene expressions”)所述,其内容全部并入本文作参考。关于使用靶基因表达的数学建模来计算/确定细胞信号传导途径活性的更多详细信息也可见于Verhaegh W.et al.,"Selection of personalized patient therapythrough the use of knowledge-based computational models that identify tumor-driving signal transduction pathways",Cancer Research,Vol.74,No.11,2014,pages2936-2945。简言之,将数据输入计算的加权线性组合分数(w/c)(151)。这样产生关于计算的加权线性组合分数的一组值(152)。根据这些加权线性组合分数,确定转录因子(TF)节点的加权线性组合分数(153)并确立TF的元件活性水平(157)。
(5)离散化可观测量程序
图6示出示例性说明推测对象中JAK-STAT3细胞信号传导途径的活性作为离散化可观测量的程序的流程图。首先,提取检测样品并给予检测样品ID(161)。接下来,收集和标准化mRNA表达水平的检测数据(162)。可以使用与图5中针对训练样品所述相同的方法,使用微阵列探针组强度(101)、实时PCR Cq值(102)、原始RNAseq读数(103)或另外的测量方式(104)来收集检测数据。然后通过使用算法标准化分别对每种方法的原始表达水平数据进行标准化,例如fRMA或MAS5.0(111),对参考基因平均Cq进行标准化(112),将读取标准化为RPKM/FPKM(113),及对参考基因/蛋白质标准化(114)。这种标准化程序对于每种方法分别产生标准化的探针组强度(121),标准化的Cq值(122),标准化的RPKM/FPKM(123)或标准化的测量(124)。
一旦检测数据已被标准化,则基于所述经校准的数学途径模型(145)在设定阈值步骤(164)中分析所得的检测数据(163),产生阈值化的检测数据(165)。在一个非限制性实例中,在使用离散可观测量时,高于某阈值的每个表达例如赋值为1,低于该阈值的值赋值为0,或者在另一实施方案中,高于如本文所述的阈值的概率质量被用作设定阈值值。基于所述经校准的数学途径模型,这个值表示TF元件的活性水平(157),然后将其用于计算细胞信号传导途径的活性(171)。最终输出示出对象中所述细胞信号传导途径的活性(172)。
(6)连续可观测量程序
图7示出示例性说明推测对象中JAK-STAT3细胞信号传导途径的活性作为连续可观测量的程序的流程图。首先,提取检测样品并给予检测样品ID(161)。接下来,收集和标准化mRNA表达水平的检测数据(162)。可以使用与图5中针对训练样品所述相同的方法收集检测数据,使用微阵列探针组强度(101)、实时PCR Cq值(102)、原始RNAseq读数(103)或其它测量方式(104)。然后通过使用算法标准化分别对每种方法的原始表达水平数据进行标准化,例如fRMA(111),对参考基因平均Cq进行标准化(112),将读取标准化为RPKM/FPKM(113),及对w.r.t.参考基因/蛋白质标准化(114)。这种标准化程序对于每种方法分别产生标准化的探针组强度(121),标准化的Cq值(122),标准化的RPKM/FPKM(123)或标准化的测量(124)。
一旦检测数据已被标准化,将所得检测数据(163)在所述经校准的数学途径模型中分析(145)。作为一个非限制性实例,在使用连续可观测量时,如本文中进一步详细描述,使用sigmoid函数将表达水平转化为0至1之间的值。如本文所述的TF元件确定用于联合所述经校准的数学途径模型来解释检测数据,所得值代表TF元件的活性水平(157),然后用于计算所述细胞信号传导途径的活性(171)。最终输出给出了对象中所述细胞信号传导途径的活性(172)。
(7)靶基因表达水平确定程序
图8示出示例性地说明从提取自对象的样品中获得靶基因表达水平的程序的流程图。在示例的实施方案中,在实验室中接收和登记样品。样品可包括例如福尔马林固定的石蜡包埋(FFPE)的样品(181),或者新鲜冷冻(FF)的样品(180)。FF样品可以直接裂解(183)。对于FFPE样品,可以用加热温育步骤加入蛋白酶K除去石蜡(182)。然后裂解细胞(183),破坏细胞膜和核膜,使得可以进一步加工核酸(NA)。核酸与固相(184)结合,所述固相可以是例如珠或滤膜。然后用洗涤缓冲液洗涤核酸以去除裂解后存在的所有细胞碎片(185)。然后用洗脱缓冲液将清洁核酸与固相分离(186)。通过DNAse处理去除DNA以确保样品中仅存在RNA(187)。然后可以将核酸样品直接用于RT-qPCR样品混合物中(188)。RT-qPCR样品混合物包含RNA样品,用于从RNA样品制备cDNA的RT酶和用于扩增cDNA的PCR酶,确保酶功能且可以潜在含有分子级水以设定固定浓度体积的缓冲溶液。然后可以将样品混合物添加到多孔板(即96孔板或384孔板)中,其含有干燥的RT-qPCR测定分析物(189)。然后可以根据指定方案在PCR机器中运行RT-qPCR(190)。一个示例PCR方案包括:i)在50℃30分钟;ii)在95℃5分钟;iii)在95℃15秒;iv)在60℃45秒;v)重复步骤iii和iv 50个循环。然后通过使用二阶导数方法,利用原始数据确定Cq值(191)。导出Cq值进行分析(192)。
(8)JAK-STAT3介导的疾病和病症及治疗方法
如本文所预期的,本发明的方法和设备可用于评估对象中JAK-STAT3细胞信号传导途径活性,所述对象例如是怀疑患有或患有其中JAK-STAT3信号传导途径的状态完全或部分地证明疾病存在或进展的疾病或病症的对象。在一个实施方案中,本文提供一种治疗对象的方法,包括接收使用本文所述方法从对象提取的样品中衍生的关于JAK-STAT3细胞信号传导途径的活性状态的信息,以及如果关于JAK-STAT3细胞信号传导途径活性的所述信息表明存在活跃的JAK-STAT3信号传导途径,则给所述对象施用JAK-STAT3抑制剂。在一个特定的实施方案中,将JAK-STAT3细胞信号传导途径活性指征设定为JAK-STAT3细胞信号传导途径为活跃的几率的截止值10:1,5:1,4:1,2:1,1:1,1:2,1:4,1:5,1:10。
JAK-STAT3途径在多种疾病中起作用,例如在多种癌症类型中、在免疫系统介导的疾病中和在炎症性疾病中,所述癌症例如胰腺癌,结肠癌,乳腺癌,头颈癌,骨肉瘤,多发性骨髓瘤,滤泡性淋巴瘤,前列腺癌,宫颈发育不良,喉乳头状瘤,腹膜腔癌,卵巢癌,宫颈癌,非小细胞肺癌,膀胱癌,黑素瘤,食道癌,甲状腺癌,胃癌;淋巴瘤,前列腺癌,横纹肌肉瘤,胃癌,黑素瘤,低度神经胶质瘤,霍奇金淋巴瘤;肝细胞癌,头颈鳞状细胞癌,肾癌,肝癌,多形性胶质母细胞瘤,神经内分泌癌,多发性骨髓瘤,慢性淋巴细胞性白血病,鳞状细胞肺癌,和其它具有活跃STAT3信号传导途径作为癌症驱动途径的癌症类型及癌症亚型,所述免疫系统介导的疾病例如炎症性肠病,类风湿性关节炎,银屑病,SLE,多发性硬化等,所述炎症性疾病如哮喘,动脉粥样硬化,糖尿病,精神病如抑郁症和精神分裂症,痤疮,子宫内膜异位症等。对于此类疾病,测量组织和血液中免疫细胞类型中的JAK-STAT3途径活性谱预期有助于诊断、亚型分型和预测和/或监测对免疫调节尤其是免疫抑制和靶向免疫抑制治疗的应答和监测免疫应答状态。例如,特别是用于类风湿关节炎和银屑病。对药物应答的预测可用于将抗STAT3途径药物与患者匹配,例如STA-21用于治疗银屑病,姜黄素用于治疗胰腺癌(II/III期临床试验),结肠癌(I/II/III期),乳腺癌(II期),头颈癌(0期),骨肉瘤(I/II期),多发性骨髓瘤(II期),特应性哮喘(未提供几期),皮炎(II/III期),2型糖尿病(IV期),精神分裂症(I/II期),阿尔茨海默病(I/II期),多发性硬化症(II期),类风湿关节炎(0期),AZD用于治疗肝细胞癌,肺癌和胃癌(I期),原发性血小板增多症骨髓纤维化和后真性红细胞增多症(I期),寡脱氧核苷酸诱饵用于治疗头颈癌(O期),托法替尼用于治疗类风湿性关节炎(I/II/III期),幼年特发性关节炎(I/II/III期),银屑病(I/II/III期),强直性脊柱炎(II期),干燥性角结膜炎(II期),溃疡性结肠炎(III期),辣椒素用于治疗慢性阻塞性肺病(0/I/II期),银屑病(IV期),慢性颈痛(II期),鼻炎(I/II/IV期),肺动脉高压(II期),HIV感染(II/III期),周围神经系统疾病(II/III期),偏头痛(I期),口灼伤综合征(0期),姜黄素用于治疗胰腺癌(II/III期),结肠癌(I/II/III期),乳腺癌(II期),头颈癌(0期),骨肉瘤(I/II期),多发性骨髓瘤(II期),特应性哮喘(未提供几期),皮炎(II/III期),2型糖尿病(IV期),精神分裂症(I/II期),阿尔茨海默病(I/II期),多发性硬化症(II期),类风湿性关节炎(0期),白藜芦醇用于治疗结直肠癌(I期),滤泡性淋巴瘤(II期),心血管疾病(I/II期),2型糖尿病(I/II/III期),肥胖(II期),阿尔茨海默病(II/III期),记忆缺陷(未提供几期),醉茄素A(WithaferinA)用于治疗精神分裂症,3,3”-二吲哚基甲烷用于治疗乳腺癌(I/II/III期),前列腺癌(I/II期),宫颈发育不良(III期),喉乳头状瘤(II期),甲状腺疾病(0期),大黄素用于治疗多囊肾病,紫杉醇用于治疗腹膜腔癌(I/II/III期),乳腺癌(I/II/III/IV期),卵巢癌(I/II/III/IV期),宫颈癌(I/II/III),非小细胞肺癌(I/II/III/IV期),膀胱癌(I/II/III期),黑素瘤(I/II/III期),食道癌(I/II/III期),甲状腺癌(I/II/III期),胃癌(I/II/III期),齐墩果酸/CDDO-Me用于治疗实体瘤和淋巴瘤(I期),慢性肾病和2型糖尿病(I/II/III期),糖尿病肾病(II期),肝功能障碍(I/II期),长春瑞滨用于治疗非小细胞肺癌(I/II/III/IV期),乳腺癌(I/II/III/IV期),前列腺癌(I/II期),横纹肌肉瘤(I/II/III期),胃癌(II期),黑素瘤(II期),低度神经胶质瘤(II期),霍奇金淋巴瘤(I/II/III期),隐丹参酮用于治疗多囊卵巢综合征,桂皮用于治疗多囊卵巢综合征(I期),高胆固醇血症和2型糖尿病(II期),索拉非尼用于治疗肝细胞癌(I/II/III/IV期),头颈鳞状细胞癌(I/II期),胃癌(I/II期),乳腺癌(I/II/III期),前列腺癌(I/II期),甲状腺癌(II/III期),非小细胞肺癌(I/II/III期),胰腺癌(I/II/III期),膀胱癌(I/II期),结肠直肠癌(I/II期),肾癌(I/II/III/IV期),肝癌(I/II/III期),多形性胶质母细胞瘤(I/II期),白血病(I/II/III期),黑素瘤(I/II/III期),阿替莫德(Atiprimod)用于治疗神经内分泌癌(II期),多发性骨髓瘤(I/II期),金诺芬(Auranofin)用于治疗慢性淋巴细胞性白血病(II期),鳞状细胞肺癌(II期),卵巢癌(未提供几期),以及寡脱氧核苷酸诱饵用于治疗头颈癌(O期)(还参见Miklossy G.et al.,“Therapeutic modulators of STAT signaling for humandiseases”,Nature Reviews Drug Discovery,Vol.12,No.8,August 2013,pages 611-629)。
本申请描述了一些优选实施方案。在阅读和理解了前文详细描述之后可以对本发明进行修改和改变。本申请应解释为包括所有这种修改和改变,只要其符合所附权利要求书或其等价物的范围即可。
通过研究附图、公开内容和所附权利要求书,本领域技术人员在实践请求保护的本发明时可以理解和实现所公开的实施方案的其它变化。
在权利要求中,词语“包含”不排除其它元素或步骤,不定冠词“一个”或“一种”不排除多个/多种。
单个单元或装置可以实现权利要求中列举的若干项的功能。在相互不同从属的权利要求中列举的某些措施的事实不表示这些措施的组合不能有利地使用。
如通过一个或几个单元或装置执行的风险评分确定之类的计算可以由任何其它数量的单元或装置执行。
计算机程序可以与其它硬件一起或作为其它硬件的一部分存储/分布于适当的介质例如光学存储介质或固态介质上,但也可以以其它形式分布,例如通过Internet或其它有线或无线电信系统分布。
实施例5:申请中使用的序列表
Figure BDA0002519458730000261
Figure BDA0002519458730000271
序列表
<110> 皇家飞利浦有限公司
<120> 使用靶基因表达的数学建模评估JAK-STAT3细胞信号传导途径活性
<130> 2017PF02041
<160> 39
<170> PatentIn version 3.5
<210> 1
<211> 3008
<212> DNA
<213> Homo sapiens
<400> 1
taattatggg tctgtaacca ccctggactg ggtgctcctc actgacggac ttgtctgaac 60
ctctctttgt ctccagcgcc cagcactggg cctggcaaaa cctgagacgc ccggtacatg 120
ttggccaaat gaatgaacca gattcagacc ggcaggggcg ctgtggttta ggaggggcct 180
ggggtttctc ccaggaggtt tttgggcttg cgctggaggg ctctggactc ccgtttgcgc 240
cagtggcctg catcctggtc ctgtcttcct catgtttgaa tttctttgct ttcctagtct 300
ggggagcagg gaggagccct gtgccctgtc ccaggatcca tgggtaggaa caccatggac 360
agggagagca aacggggcca tctgtcacca ggggcttagg gaaggccgag ccagcctggg 420
tcaaagaagt caaaggggct gcctggagga ggcagcctgt cagctggtgc atcagaggct 480
gtggccaggc cagctgggct cggggagcgc cagcctgaga ggagcgcgtg agcgtcgcgg 540
gagcctcggg caccatgagc gacgtggcta ttgtgaagga gggttggctg cacaaacgag 600
gggagtacat caagacctgg cggccacgct acttcctcct caagaatgat ggcaccttca 660
ttggctacaa ggagcggccg caggatgtgg accaacgtga ggctcccctc aacaacttct 720
ctgtggcgca gtgccagctg atgaagacgg agcggccccg gcccaacacc ttcatcatcc 780
gctgcctgca gtggaccact gtcatcgaac gcaccttcca tgtggagact cctgaggagc 840
gggaggagtg gacaaccgcc atccagactg tggctgacgg cctcaagaag caggaggagg 900
aggagatgga cttccggtcg ggctcaccca gtgacaactc aggggctgaa gagatggagg 960
tgtccctggc caagcccaag caccgcgtga ccatgaacga gtttgagtac ctgaagctgc 1020
tgggcaaggg cactttcggc aaggtgatcc tggtgaagga gaaggccaca ggccgctact 1080
acgccatgaa gatcctcaag aaggaagtca tcgtggccaa ggacgaggtg gcccacacac 1140
tcaccgagaa ccgcgtcctg cagaactcca ggcacccctt cctcacagcc ctgaagtact 1200
ctttccagac ccacgaccgc ctctgctttg tcatggagta cgccaacggg ggcgagctgt 1260
tcttccacct gtcccgggag cgtgtgttct ccgaggaccg ggcccgcttc tatggcgctg 1320
agattgtgtc agccctggac tacctgcact cggagaagaa cgtggtgtac cgggacctca 1380
agctggagaa cctcatgctg gacaaggacg ggcacattaa gatcacagac ttcgggctgt 1440
gcaaggaggg gatcaaggac ggtgccacca tgaagacctt ttgcggcaca cctgagtacc 1500
tggcccccga ggtgctggag gacaatgact acggccgtgc agtggactgg tgggggctgg 1560
gcgtggtcat gtacgagatg atgtgcggtc gcctgccctt ctacaaccag gaccatgaga 1620
agctttttga gctcatcctc atggaggaga tccgcttccc gcgcacgctt ggtcccgagg 1680
ccaagtcctt gctttcaggg ctgctcaaga aggaccccaa gcagaggctt ggcgggggct 1740
ccgaggacgc caaggagatc atgcagcatc gcttctttgc cggtatcgtg tggcagcacg 1800
tgtacgagaa gaagctcagc ccacccttca agccccaggt cacgtcggag actgacacca 1860
ggtattttga tgaggagttc acggcccaga tgatcaccat cacaccacct gaccaagatg 1920
acagcatgga gtgtgtggac agcgagcgca ggccccactt cccccagttc tcctactcgg 1980
ccagcggcac ggcctgaggc ggcggtggac tgcgctggac gatagcttgg agggatggag 2040
aggcggcctc gtgccatgat ctgtatttaa tggtttttat ttctcgggtg catttgagag 2100
aagccacgct gtcctctcga gcccagatgg aaagacgttt ttgtgctgtg ggcagcaccc 2160
tcccccgcag cggggtaggg aagaaaacta tcctgcgggt tttaatttat ttcatccagt 2220
ttgttctccg ggtgtggcct cagccctcag aacaatccga ttcacgtagg gaaatgttaa 2280
ggacttctgc agctatgcgc aatgtggcat tggggggccg ggcaggtcct gcccatgtgt 2340
cccctcactc tgtcagccag ccgccctggg ctgtctgtca ccagctatct gtcatctctc 2400
tggggccctg ggcctcagtt caacctggtg gcaccagatg caacctcact atggtatgct 2460
ggccagcacc ctctcctggg ggtggcaggc acacagcagc cccccagcac taaggccgtg 2520
tctctgagga cgtcatcgga ggctgggccc ctgggatggg accagggatg ggggatgggc 2580
cagggtttac ccagtgggac agaggagcaa ggtttaaatt tgttattgtg tattatgttg 2640
ttcaaatgca ttttgggggt ttttaatctt tgtgacagga aagccctccc ccttcccctt 2700
ctgtgtcaca gttcttggtg actgtcccac cgggagcctc cccctcagat gatctctcca 2760
cggtagcact tgaccttttc gacgcttaac ctttccgctg tcgccccagg ccctccctga 2820
ctccctgtgg gggtggccat ccctgggccc ctccacgcct cctggccaga cgctgccgct 2880
gccgctgcac cacggcgttt ttttacaaca ttcaacttta gtatttttac tattataata 2940
taatatggaa ccttccctcc aaattcttca ataaaagttg cttttcaaaa aaaaaaaaaa 3000
aaaaaaaa 3008
<210> 2
<211> 6492
<212> DNA
<213> Homo sapiens
<400> 2
tttctgtgaa gcagaagtct gggaatcgat ctggaaatcc tcctaatttt tactccctct 60
ccccgcgact cctgattcat tgggaagttt caaatcagct ataactggag agtgctgaag 120
attgatggga tcgttgcctt atgcatttgt tttggtttta caaaaaggaa acttgacaga 180
ggatcatgct gtacttaaaa aatacaacat cacagaggaa gtagactgat attaacaata 240
cttactaata ataacgtgcc tcatgaaata aagatccgaa aggaattgga ataaaaattt 300
cctgcatctc atgccaaggg ggaaacacca gaatcaagtg ttccgcgtga ttgaagacac 360
cccctcgtcc aagaatgcaa agcacatcca ataaaatagc tggattataa ctcctcttct 420
ttctctgggg gccgtggggt gggagctggg gcgagaggtg ccgttggccc ccgttgcttt 480
tcctctggga aggatggcgc acgctgggag aacagggtac gataaccggg agatagtgat 540
gaagtacatc cattataagc tgtcgcagag gggctacgag tgggatgcgg gagatgtggg 600
cgccgcgccc ccgggggccg cccccgcacc gggcatcttc tcctcccagc ccgggcacac 660
gccccatcca gccgcatccc gggacccggt cgccaggacc tcgccgctgc agaccccggc 720
tgcccccggc gccgccgcgg ggcctgcgct cagcccggtg ccacctgtgg tccacctgac 780
cctccgccag gccggcgacg acttctcccg ccgctaccgc cgcgacttcg ccgagatgtc 840
cagccagctg cacctgacgc ccttcaccgc gcggggacgc tttgccacgg tggtggagga 900
gctcttcagg gacggggtga actgggggag gattgtggcc ttctttgagt tcggtggggt 960
catgtgtgtg gagagcgtca accgggagat gtcgcccctg gtggacaaca tcgccctgtg 1020
gatgactgag tacctgaacc ggcacctgca cacctggatc caggataacg gaggctggga 1080
tgcctttgtg gaactgtacg gccccagcat gcggcctctg tttgatttct cctggctgtc 1140
tctgaagact ctgctcagtt tggccctggt gggagcttgc atcaccctgg gtgcctatct 1200
gggccacaag tgaagtcaac atgcctgccc caaacaaata tgcaaaaggt tcactaaagc 1260
agtagaaata atatgcattg tcagtgatgt accatgaaac aaagctgcag gctgtttaag 1320
aaaaaataac acacatataa acatcacaca cacagacaga cacacacaca cacaacaatt 1380
aacagtcttc aggcaaaacg tcgaatcagc tatttactgc caaagggaaa tatcatttat 1440
tttttacatt attaagaaaa aaagatttat ttatttaaga cagtcccatc aaaactcctg 1500
tctttggaaa tccgaccact aattgccaag caccgcttcg tgtggctcca cctggatgtt 1560
ctgtgcctgt aaacatagat tcgctttcca tgttgttggc cggatcacca tctgaagagc 1620
agacggatgg aaaaaggacc tgatcattgg ggaagctggc tttctggctg ctggaggctg 1680
gggagaaggt gttcattcac ttgcatttct ttgccctggg ggctgtgata ttaacagagg 1740
gagggttcct gtggggggaa gtccatgcct ccctggcctg aagaagagac tctttgcata 1800
tgactcacat gatgcatacc tggtgggagg aaaagagttg ggaacttcag atggacctag 1860
tacccactga gatttccacg ccgaaggaca gcgatgggaa aaatgccctt aaatcatagg 1920
aaagtatttt tttaagctac caattgtgcc gagaaaagca ttttagcaat ttatacaata 1980
tcatccagta ccttaagccc tgattgtgta tattcatata ttttggatac gcacccccca 2040
actcccaata ctggctctgt ctgagtaaga aacagaatcc tctggaactt gaggaagtga 2100
acatttcggt gacttccgca tcaggaaggc tagagttacc cagagcatca ggccgccaca 2160
agtgcctgct tttaggagac cgaagtccgc agaacctgcc tgtgtcccag cttggaggcc 2220
tggtcctgga actgagccgg ggccctcact ggcctcctcc agggatgatc aacagggcag 2280
tgtggtctcc gaatgtctgg aagctgatgg agctcagaat tccactgtca agaaagagca 2340
gtagaggggt gtggctgggc ctgtcaccct ggggccctcc aggtaggccc gttttcacgt 2400
ggagcatggg agccacgacc cttcttaaga catgtatcac tgtagaggga aggaacagag 2460
gccctgggcc cttcctatca gaaggacatg gtgaaggctg ggaacgtgag gagaggcaat 2520
ggccacggcc cattttggct gtagcacatg gcacgttggc tgtgtggcct tggcccacct 2580
gtgagtttaa agcaaggctt taaatgactt tggagagggt cacaaatcct aaaagaagca 2640
ttgaagtgag gtgtcatgga ttaattgacc cctgtctatg gaattacatg taaaacatta 2700
tcttgtcact gtagtttggt tttatttgaa aacctgacaa aaaaaaagtt ccaggtgtgg 2760
aatatggggg ttatctgtac atcctggggc attaaaaaaa aaatcaatgg tggggaacta 2820
taaagaagta acaaaagaag tgacatcttc agcaaataaa ctaggaaatt tttttttctt 2880
ccagtttaga atcagccttg aaacattgat ggaataactc tgtggcatta ttgcattata 2940
taccatttat ctgtattaac tttggaatgt actctgttca atgtttaatg ctgtggttga 3000
tatttcgaaa gctgctttaa aaaaatacat gcatctcagc gtttttttgt ttttaattgt 3060
atttagttat ggcctataca ctatttgtga gcaaaggtga tcgttttctg tttgagattt 3120
ttatctcttg attcttcaaa agcattctga gaaggtgaga taagccctga gtctcagcta 3180
cctaagaaaa acctggatgt cactggccac tgaggagctt tgtttcaacc aagtcatgtg 3240
catttccacg tcaacagaat tgtttattgt gacagttata tctgttgtcc ctttgacctt 3300
gtttcttgaa ggtttcctcg tccctgggca attccgcatt taattcatgg tattcaggat 3360
tacatgcatg tttggttaaa cccatgagat tcattcagtt aaaaatccag atggcaaatg 3420
accagcagat tcaaatctat ggtggtttga cctttagaga gttgctttac gtggcctgtt 3480
tcaacacaga cccacccaga gccctcctgc cctccttccg cgggggcttt ctcatggctg 3540
tccttcaggg tcttcctgaa atgcagtggt gcttacgctc caccaagaaa gcaggaaacc 3600
tgtggtatga agccagacct ccccggcggg cctcagggaa cagaatgatc agacctttga 3660
atgattctaa tttttaagca aaatattatt ttatgaaagg tttacattgt caaagtgatg 3720
aatatggaat atccaatcct gtgctgctat cctgccaaaa tcattttaat ggagtcagtt 3780
tgcagtatgc tccacgtggt aagatcctcc aagctgcttt agaagtaaca atgaagaacg 3840
tggacgtttt taatataaag cctgttttgt cttttgttgt tgttcaaacg ggattcacag 3900
agtatttgaa aaatgtatat atattaagag gtcacggggg ctaattgctg gctggctgcc 3960
ttttgctgtg gggttttgtt acctggtttt aataacagta aatgtgccca gcctcttggc 4020
cccagaactg tacagtattg tggctgcact tgctctaaga gtagttgatg ttgcattttc 4080
cttattgtta aaaacatgtt agaagcaatg aatgtatata aaagcctcaa ctagtcattt 4140
ttttctcctc ttcttttttt tcattatatc taattatttt gcagttgggc aacagagaac 4200
catccctatt ttgtattgaa gagggattca catctgcatc ttaactgctc tttatgaatg 4260
aaaaaacagt cctctgtatg tactcctctt tacactggcc agggtcagag ttaaatagag 4320
tatatgcact ttccaaattg gggacaaggg ctctaaaaaa agccccaaaa ggagaagaac 4380
atctgagaac ctcctcggcc ctcccagtcc ctcgctgcac aaatactccg caagagaggc 4440
cagaatgaca gctgacaggg tctatggcca tcgggtcgtc tccgaagatt tggcaggggc 4500
agaaaactct ggcaggctta agatttggaa taaagtcaca gaattaagga agcacctcaa 4560
tttagttcaa acaagacgcc aacattctct ccacagctca cttacctctc tgtgttcaga 4620
tgtggccttc catttatatg tgatctttgt tttattagta aatgcttatc atctaaagat 4680
gtagctctgg cccagtggga aaaattagga agtgattata aatcgagagg agttataata 4740
atcaagatta aatgtaaata atcagggcaa tcccaacaca tgtctagctt tcacctccag 4800
gatctattga gtgaacagaa ttgcaaatag tctctatttg taattgaact tatcctaaaa 4860
caaatagttt ataaatgtga acttaaactc taattaattc caactgtact tttaaggcag 4920
tggctgtttt tagactttct tatcacttat agttagtaat gtacacctac tctatcagag 4980
aaaaacagga aaggctcgaa atacaagcca ttctaaggaa attagggagt cagttgaaat 5040
tctattctga tcttattctg tggtgtcttt tgcagcccag acaaatgtgg ttacacactt 5100
tttaagaaat acaattctac attgtcaagc ttatgaaggt tccaatcaga tctttattgt 5160
tattcaattt ggatctttca gggatttttt ttttaaatta ttatgggaca aaggacattt 5220
gttggagggg tgggagggag gaagaatttt taaatgtaaa acattcccaa gtttggatca 5280
gggagttgga agttttcaga ataaccagaa ctaagggtat gaaggacctg tattggggtc 5340
gatgtgatgc ctctgcgaag aaccttgtgt gacaaatgag aaacattttg aagtttgtgg 5400
tacgaccttt agattccaga gacatcagca tggctcaaag tgcagctccg tttggcagtg 5460
caatggtata aatttcaagc tggatatgtc taatgggtat ttaaacaata aatgtgcagt 5520
tttaactaac aggatattta atgacaacct tctggttggt agggacatct gtttctaaat 5580
gtttattatg tacaatacag aaaaaaattt tataaaatta agcaatgtga aactgaattg 5640
gagagtgata atacaagtcc tttagtctta cccagtgaat cattctgttc catgtctttg 5700
gacaaccatg accttggaca atcatgaaat atgcatctca ctggatgcaa agaaaatcag 5760
atggagcatg aatggtactg taccggttca tctggactgc cccagaaaaa taacttcaag 5820
caaacatcct atcaacaaca aggttgttct gcataccaag ctgagcacag aagatgggaa 5880
cactggtgga ggatggaaag gctcgctcaa tcaagaaaat tctgagacta ttaataaata 5940
agactgtagt gtagatactg agtaaatcca tgcacctaaa ccttttggaa aatctgccgt 6000
gggccctcca gatagctcat ttcattaagt ttttccctcc aaggtagaat ttgcaagagt 6060
gacagtggat tgcatttctt ttggggaagc tttcttttgg tggttttgtt tattatacct 6120
tcttaagttt tcaaccaagg tttgcttttg ttttgagtta ctggggttat ttttgtttta 6180
aataaaaata agtgtacaat aagtgttttt gtattgaaag cttttgttat caagattttc 6240
atacttttac cttccatggc tctttttaag attgatactt ttaagaggtg gctgatattc 6300
tgcaacactg tacacataaa aaatacggta aggatacttt acatggttaa ggtaaagtaa 6360
gtctccagtt ggccaccatt agctataatg gcactttgtt tgtgttgttg gaaaaagtca 6420
cattgccatt aaactttcct tgtctgtcta gttaatattg tgaagaaaaa taaagtacag 6480
tgtgagatac tg 6492
<210> 3
<211> 2820
<212> DNA
<213> Homo sapiens
<400> 3
gaaaccttga accccattga gaagtccctt tagggtttcg gacgcctcca cctcaccctg 60
ggctggtgct taaatagaaa aaagaaaaac aaaaaccaac taaatccata ccagccacct 120
ccgggagagt actcctggct cccagtagga ggcggagagc caaggggcgt gcaagagaga 180
gggggctggg ctcccgggtg gcaggaggcc gcggctgcgg agcggccgcc ctcgatccgg 240
gcgatggagg aggaagcaag cgagggggct ggttcctgag cttcgcaatt cctgtgtcgc 300
cttctgggct cccagcctgc cgggtcgcat gatccctccg gccggagctg gtttttttgc 360
cagccaccgc gaggccggct gagttaccgg catccccgca gccacctcct ctcccgacct 420
gtgatacaaa agatcttccg ggggctgcac ctgcctgcct ttgcctaagg cggatttgaa 480
tctctttctc tcccttcaga atcttatctt ggctttggat cttagaagag aatcactaac 540
cagagacgag actcagtgag tgagcaggtg ttttggacaa tggactggtt gagcccatcc 600
ctattataaa aatgtctcag agcaaccggg agctggtggt tgactttctc tcctacaagc 660
tttcccagaa aggatacagc tggagtcagt ttagtgatgt ggaagagaac aggactgagg 720
ccccagaagg gactgaatcg gagatggaga cccccagtgc catcaatggc aacccatcct 780
ggcacctggc agacagcccc gcggtgaatg gagccactgg ccacagcagc agtttggatg 840
cccgggaggt gatccccatg gcagcagtaa agcaagcgct gagggaggca ggcgacgagt 900
ttgaactgcg gtaccggcgg gcattcagtg acctgacatc ccagctccac atcaccccag 960
ggacagcata tcagagcttt gaacaggtag tgaatgaact cttccgggat ggggtaaact 1020
ggggtcgcat tgtggccttt ttctccttcg gcggggcact gtgcgtggaa agcgtagaca 1080
aggagatgca ggtattggtg agtcggatcg cagcttggat ggccacttac ctgaatgacc 1140
acctagagcc ttggatccag gagaacggcg gctgggatac ttttgtggaa ctctatggga 1200
acaatgcagc agccgagagc cgaaagggcc aggaacgctt caaccgctgg ttcctgacgg 1260
gcatgactgt ggccggcgtg gttctgctgg gctcactctt cagtcggaaa tgaccagaca 1320
ctgaccatcc actctaccct cccaccccct tctctgctcc accacatcct ccgtccagcc 1380
gccattgcca ccaggagaac cactacatgc agcccatgcc cacctgccca tcacagggtt 1440
gggcccagat ctggtccctt gcagctagtt ttctagaatt tatcacactt ctgtgagacc 1500
cccacacctc agttcccttg gcctcagaat tcacaaaatt tccacaaaat ctgtccaaag 1560
gaggctggca ggtatggaag ggtttgtggc tgggggcagg agggccctac ctgattggtg 1620
caacccttac cccttagcct ccctgaaaat gtttttctgc cagggagctt gaaagttttc 1680
agaacctctt ccccagaaag gagactagat tgcctttgtt ttgatgtttg tggcctcaga 1740
attgatcatt ttccccccac tctccccaca ctaacctggg ttccctttcc ttccatccct 1800
accccctaag agccatttag gggccacttt tgactaggga ttcaggctgc ttgggataaa 1860
gatgcaagga ccaggactcc ctcctcacct ctggactggc tagagtcctc actcccagtc 1920
caaatgtcct ccagaagcct ctggctagag gccagcccca cccaggaggg agggggctat 1980
agctacagga agcaccccat gccaaagcta gggtggccct tgcagttcag caccacccta 2040
gtcccttccc ctccctggct cccatgacca tactgaggga ccaactgggc ccaagacaga 2100
tgccccagag ctgtttatgg cctcagctgc ctcacttcct acaagagcag cctgtggcat 2160
ctttgccttg ggctgctcct catggtgggt tcaggggact cagccctgag gtgaaaggga 2220
gctatcagga acagctatgg gagccccagg gtcttcccta cctcaggcag gaagggcagg 2280
aaggagagcc tgctgcatgg ggtggggtag ggctgactag aagggccagt cctgcctggc 2340
caggcagatc tgtgccccat gcctgtccag cctgggcagc caggctgcca aggccagagt 2400
ggcctggcca ggagctcttc aggcctccct ctctcttctg ctccaccctt ggcctgtctc 2460
atccccaggg gtcccagcca ccccgggctc tctgctgtac atatttgaga ctagttttta 2520
ttccttgtga agatgatata ctatttttgt taagcgtgtc tgtatttatg tgtgaggagc 2580
tgctggcttg cagtgcgcgt gcacgtggag agctggtgcc cggagattgg acggcctgat 2640
gctccctccc ctgccctggt ccagggaagc tggccgaggg tcctggctcc tgaggggcat 2700
ctgcccctcc cccaaccccc accccacact tgttccagct ctttgaaata gtctgtgtga 2760
aggtgaaagt gcagttcagt aataaactgt gtttactcag tgaaaaaaaa aaaaaaaaaa 2820
<210> 4
<211> 2655
<212> DNA
<213> Homo sapiens
<400> 4
cccagaaggc cgcggggggt ggaccgccta agagggcgtg cgctcccgac atgccccgcg 60
gcgcgccatt aaccgccaga tttgaatcgc gggacccgtt ggcagaggtg gcggcggcgg 120
catgggtgcc ccgacgttgc cccctgcctg gcagcccttt ctcaaggacc accgcatctc 180
tacattcaag aactggccct tcttggaggg ctgcgcctgc accccggagc ggatggccga 240
ggctggcttc atccactgcc ccactgagaa cgagccagac ttggcccagt gtttcttctg 300
cttcaaggag ctggaaggct gggagccaga tgacgacccc atagaggaac ataaaaagca 360
ttcgtccggt tgcgctttcc tttctgtcaa gaagcagttt gaagaattaa cccttggtga 420
atttttgaaa ctggacagag aaagagccaa gaacaaaatt gcaaaggaaa ccaacaataa 480
gaagaaagaa tttgaggaaa ctgcggagaa agtgcgccgt gccatcgagc agctggctgc 540
catggattga ggcctctggc cggagctgcc tggtcccaga gtggctgcac cacttccagg 600
gtttattccc tggtgccacc agccttcctg tgggcccctt agcaatgtct taggaaagga 660
gatcaacatt ttcaaattag atgtttcaac tgtgctcttg ttttgtcttg aaagtggcac 720
cagaggtgct tctgcctgtg cagcgggtgc tgctggtaac agtggctgct tctctctctc 780
tctctctttt ttgggggctc atttttgctg ttttgattcc cgggcttacc aggtgagaag 840
tgagggagga agaaggcagt gtcccttttg ctagagctga cagctttgtt cgcgtgggca 900
gagccttcca cagtgaatgt gtctggacct catgttgttg aggctgtcac agtcctgagt 960
gtggacttgg caggtgcctg ttgaatctga gctgcaggtt ccttatctgt cacacctgtg 1020
cctcctcaga ggacagtttt tttgttgttg tgtttttttg tttttttttt tttggtagat 1080
gcatgacttg tgtgtgatga gagaatggag acagagtccc tggctcctct actgtttaac 1140
aacatggctt tcttattttg tttgaattgt taattcacag aatagcacaa actacaatta 1200
aaactaagca caaagccatt ctaagtcatt ggggaaacgg ggtgaacttc aggtggatga 1260
ggagacagaa tagagtgata ggaagcgtct ggcagatact ccttttgcca ctgctgtgtg 1320
attagacagg cccagtgagc cgcggggcac atgctggccg ctcctccctc agaaaaaggc 1380
agtggcctaa atccttttta aatgacttgg ctcgatgctg tgggggactg gctgggctgc 1440
tgcaggccgt gtgtctgtca gcccaacctt cacatctgtc acgttctcca cacgggggag 1500
agacgcagtc cgcccaggtc cccgctttct ttggaggcag cagctcccgc agggctgaag 1560
tctggcgtaa gatgatggat ttgattcgcc ctcctccctg tcatagagct gcagggtgga 1620
ttgttacagc ttcgctggaa acctctggag gtcatctcgg ctgttcctga gaaataaaaa 1680
gcctgtcatt tcaaacactg ctgtggaccc tactgggttt ttaaaatatt gtcagttttt 1740
catcgtcgtc cctagcctgc caacagccat ctgcccagac agccgcagtg aggatgagcg 1800
tcctggcaga gacgcagttg tctctgggcg cttgccagag ccacgaaccc cagacctgtt 1860
tgtatcatcc gggctccttc cgggcagaaa caactgaaaa tgcacttcag acccacttat 1920
ttctgccaca tctgagtcgg cctgagatag acttttccct ctaaactggg agaatatcac 1980
agtggttttt gttagcagaa aatgcactcc agcctctgta ctcatctaag ctgcttattt 2040
ttgatatttg tgtcagtctg taaatggata cttcacttta ataactgttg cttagtaatt 2100
ggctttgtag agaagctgga aaaaaatggt tttgtcttca actcctttgc atgccaggcg 2160
gtgatgtgga tctcggcttc tgtgagcctg tgctgtgggc agggctgagc tggagccgcc 2220
cctctcagcc cgcctgccac ggcctttcct taaaggccat ccttaaaacc agaccctcat 2280
ggctaccagc acctgaaagc ttcctcgaca tctgttaata aagccgtagg cccttgtcta 2340
agtgcaaccg cctagacttt ctttcagata catgtccaca tgtccatttt tcaggttctc 2400
taagttggag tggagtctgg gaagggttgt gaatgaggct tctgggctat gggtgaggtt 2460
ccaatggcag gttagagccc ctcgggccaa ctgccatcct ggaaagtaga gacagcagtg 2520
cccgctgccc agaagagacc agcaagccaa actggagccc ccattgcagg ctgtcgccat 2580
gtggaaagag taactcacaa ttgccaataa agtctcatgt ggttttatct aaaaaaaaaa 2640
aaaaaaaaaa aaaaa 2655
<210> 5
<211> 4304
<212> DNA
<213> Homo sapiens
<400> 5
cacacggact acaggggagt tttgttgaag ttgcaaagtc ctggagcctc cagagggctg 60
tcggcgcagt agcagcgagc agcagagtcc gcacgctccg gcgaggggca gaagagcgcg 120
agggagcgcg gggcagcaga agcgagagcc gagcgcggac ccagccagga cccacagccc 180
tccccagctg cccaggaaga gccccagcca tggaacacca gctcctgtgc tgcgaagtgg 240
aaaccatccg ccgcgcgtac cccgatgcca acctcctcaa cgaccgggtg ctgcgggcca 300
tgctgaaggc ggaggagacc tgcgcgccct cggtgtccta cttcaaatgt gtgcagaagg 360
aggtcctgcc gtccatgcgg aagatcgtcg ccacctggat gctggaggtc tgcgaggaac 420
agaagtgcga ggaggaggtc ttcccgctgg ccatgaacta cctggaccgc ttcctgtcgc 480
tggagcccgt gaaaaagagc cgcctgcagc tgctgggggc cacttgcatg ttcgtggcct 540
ctaagatgaa ggagaccatc cccctgacgg ccgagaagct gtgcatctac accgacaact 600
ccatccggcc cgaggagctg ctgcaaatgg agctgctcct ggtgaacaag ctcaagtgga 660
acctggccgc aatgaccccg cacgatttca ttgaacactt cctctccaaa atgccagagg 720
cggaggagaa caaacagatc atccgcaaac acgcgcagac cttcgttgcc ctctgtgcca 780
cagatgtgaa gttcatttcc aatccgccct ccatggtggc agcggggagc gtggtggccg 840
cagtgcaagg cctgaacctg aggagcccca acaacttcct gtcctactac cgcctcacac 900
gcttcctctc cagagtgatc aagtgtgacc cggactgcct ccgggcctgc caggagcaga 960
tcgaagccct gctggagtca agcctgcgcc aggcccagca gaacatggac cccaaggccg 1020
ccgaggagga ggaagaggag gaggaggagg tggacctggc ttgcacaccc accgacgtgc 1080
gggacgtgga catctgaggg cgccaggcag gcgggcgcca ccgccacccg cagcgagggc 1140
ggagccggcc ccaggtgctc ccctgacagt ccctcctctc cggagcattt tgataccaga 1200
agggaaagct tcattctcct tgttgttggt tgttttttcc tttgctcttt cccccttcca 1260
tctctgactt aagcaaaaga aaaagattac ccaaaaactg tctttaaaag agagagagag 1320
aaaaaaaaaa tagtatttgc ataaccctga gcggtggggg aggagggttg tgctacagat 1380
gatagaggat tttatacccc aataatcaac tcgtttttat attaatgtac ttgtttctct 1440
gttgtaagaa taggcattaa cacaaaggag gcgtctcggg agaggattag gttccatcct 1500
ttacgtgttt aaaaaaaagc ataaaaacat tttaaaaaca tagaaaaatt cagcaaacca 1560
tttttaaagt agaagagggt tttaggtaga aaaacatatt cttgtgcttt tcctgataaa 1620
gcacagctgt agtggggttc taggcatctc tgtactttgc ttgctcatat gcatgtagtc 1680
actttataag tcattgtatg ttattatatt ccgtaggtag atgtgtaacc tcttcacctt 1740
attcatggct gaagtcacct cttggttaca gtagcgtagc gtgcccgtgt gcatgtcctt 1800
tgcgcctgtg accaccaccc caacaaacca tccagtgaca aaccatccag tggaggtttg 1860
tcgggcacca gccagcgtag cagggtcggg aaaggccacc tgtcccactc ctacgatacg 1920
ctactataaa gagaagacga aatagtgaca taatatattc tatttttata ctcttcctat 1980
ttttgtagtg acctgtttat gagatgctgg ttttctaccc aacggccctg cagccagctc 2040
acgtccaggt tcaacccaca gctacttggt ttgtgttctt cttcatattc taaaaccatt 2100
ccatttccaa gcactttcag tccaataggt gtaggaaata gcgctgtttt tgttgtgtgt 2160
gcagggaggg cagttttcta atggaatggt ttgggaatat ccatgtactt gtttgcaagc 2220
aggactttga ggcaagtgtg ggccactgtg gtggcagtgg aggtggggtg tttgggaggc 2280
tgcgtgccag tcaagaagaa aaaggtttgc attctcacat tgccaggatg ataagttcct 2340
ttccttttct ttaaagaagt tgaagtttag gaatcctttg gtgccaactg gtgtttgaaa 2400
gtagggacct cagaggttta cctagagaac aggtggtttt taagggttat cttagatgtt 2460
tcacaccgga aggtttttaa acactaaaat atataattta tagttaaggc taaaaagtat 2520
atttattgca gaggatgttc ataaggccag tatgatttat aaatgcaatc tccccttgat 2580
ttaaacacac agatacacac acacacacac acacacacaa accttctgcc tttgatgtta 2640
cagatttaat acagtttatt tttaaagata gatcctttta taggtgagaa aaaaacaatc 2700
tggaagaaaa aaaccacaca aagacattga ttcagcctgt ttggcgtttc ccagagtcat 2760
ctgattggac aggcatgggt gcaaggaaaa ttagggtact caacctaagt tcggttccga 2820
tgaattctta tcccctgccc cttcctttaa aaaacttagt gacaaaatag acaatttgca 2880
catcttggct atgtaattct tgtaattttt atttaggaag tgttgaaggg aggtggcaag 2940
agtgtggagg ctgacgtgtg agggaggaca ggcgggagga ggtgtgagga ggaggctccc 3000
gaggggaagg ggcggtgccc acaccgggga caggccgcag ctccattttc ttattgcgct 3060
gctaccgttg acttccaggc acggtttgga aatattcaca tcgcttctgt gtatctcttt 3120
cacattgttt gctgctattg gaggatcagt tttttgtttt acaatgtcat atactgccat 3180
gtactagttt tagttttctc ttagaacatt gtattacaga tgcctttttt gtagtttttt 3240
ttttttttat gtgatcaatt ttgacttaat gtgattactg ctctattcca aaaaggttgc 3300
tgtttcacaa tacctcatgc ttcacttagc catggtggac ccagcgggca ggttctgcct 3360
gctttggcgg gcagacacgc gggcgcgatc ccacacaggc tggcgggggc cggccccgag 3420
gccgcgtgcg tgagaaccgc gccggtgtcc ccagagacca ggctgtgtcc ctcttctctt 3480
ccctgcgcct gtgatgctgg gcacttcatc tgatcggggg cgtagcatca tagtagtttt 3540
tacagctgtg ttattctttg cgtgtagcta tggaagttgc ataattatta ttattattat 3600
tataacaagt gtgtcttacg tgccaccacg gcgttgtacc tgtaggactc tcattcggga 3660
tgattggaat agcttctgga atttgttcaa gttttgggta tgtttaatct gttatgtact 3720
agtgttctgt ttgttattgt tttgttaatt acaccataat gctaatttaa agagactcca 3780
aatctcaatg aagccagctc acagtgctgt gtgccccggt cacctagcaa gctgccgaac 3840
caaaagaatt tgcaccccgc tgcgggccca cgtggttggg gccctgccct ggcagggtca 3900
tcctgtgctc ggaggccatc tcgggcacag gcccaccccg ccccacccct ccagaacacg 3960
gctcacgctt acctcaacca tcctggctgc ggcgtctgtc tgaaccacgc gggggccttg 4020
agggacgctt tgtctgtcgt gatggggcaa gggcacaagt cctggatgtt gtgtgtatcg 4080
agaggccaaa ggctggtggc aagtgcacgg ggcacagcgg agtctgtcct gtgacgcgca 4140
agtctgaggg tctgggcggc gggcggctgg gtctgtgcat ttctggttgc accgcggcgc 4200
ttcccagcac caacatgtaa ccggcatgtt tccagcagaa gacaaaaaga caaacatgaa 4260
agtctagaaa taaaactggt aaaaccccaa aaaaaaaaaa aaaa 4304
<210> 6
<211> 3691
<212> DNA
<213> Homo sapiens
<400> 6
ggcgcaacgc tgagcagctg gcgcgtcccg cgcggcccca gttctgcgca gcttcccgag 60
gctccgcacc agccgcgctt ctgtccgcct gcagggcatt ccagaaagat gaggatattt 120
gctgtcttta tattcatgac ctactggcat ttgctgaacg catttactgt cacggttccc 180
aaggacctat atgtggtaga gtatggtagc aatatgacaa ttgaatgcaa attcccagta 240
gaaaaacaat tagacctggc tgcactaatt gtctattggg aaatggagga taagaacatt 300
attcaatttg tgcatggaga ggaagacctg aaggttcagc atagtagcta cagacagagg 360
gcccggctgt tgaaggacca gctctccctg ggaaatgctg cacttcagat cacagatgtg 420
aaattgcagg atgcaggggt gtaccgctgc atgatcagct atggtggtgc cgactacaag 480
cgaattactg tgaaagtcaa tgccccatac aacaaaatca accaaagaat tttggttgtg 540
gatccagtca cctctgaaca tgaactgaca tgtcaggctg agggctaccc caaggccgaa 600
gtcatctgga caagcagtga ccatcaagtc ctgagtggta agaccaccac caccaattcc 660
aagagagagg agaagctttt caatgtgacc agcacactga gaatcaacac aacaactaat 720
gagattttct actgcacttt taggagatta gatcctgagg aaaaccatac agctgaattg 780
gtcatcccag aactacctct ggcacatcct ccaaatgaaa ggactcactt ggtaattctg 840
ggagccatct tattatgcct tggtgtagca ctgacattca tcttccgttt aagaaaaggg 900
agaatgatgg atgtgaaaaa atgtggcatc caagatacaa actcaaagaa gcaaagtgat 960
acacatttgg aggagacgta atccagcatt ggaacttctg atcttcaagc agggattctc 1020
aacctgtggt ttaggggttc atcggggctg agcgtgacaa gaggaaggaa tgggcccgtg 1080
ggatgcaggc aatgtgggac ttaaaaggcc caagcactga aaatggaacc tggcgaaagc 1140
agaggaggag aatgaagaaa gatggagtca aacagggagc ctggagggag accttgatac 1200
tttcaaatgc ctgaggggct catcgacgcc tgtgacaggg agaaaggata cttctgaaca 1260
aggagcctcc aagcaaatca tccattgctc atcctaggaa gacgggttga gaatccctaa 1320
tttgagggtc agttcctgca gaagtgccct ttgcctccac tcaatgcctc aatttgtttt 1380
ctgcatgact gagagtctca gtgttggaac gggacagtat ttatgtatga gtttttccta 1440
tttattttga gtctgtgagg tcttcttgtc atgtgagtgt ggttgtgaat gatttctttt 1500
gaagatatat tgtagtagat gttacaattt tgtcgccaaa ctaaacttgc tgcttaatga 1560
tttgctcaca tctagtaaaa catggagtat ttgtaaggtg cttggtctcc tctataacta 1620
caagtataca ttggaagcat aaagatcaaa ccgttggttg cataggatgt cacctttatt 1680
taacccatta atactctggt tgacctaatc ttattctcag acctcaagtg tctgtgcagt 1740
atctgttcca tttaaatatc agctttacaa ttatgtggta gcctacacac ataatctcat 1800
ttcatcgctg taaccaccct gttgtgataa ccactattat tttacccatc gtacagctga 1860
ggaagcaaac agattaagta acttgcccaa accagtaaat agcagacctc agactgccac 1920
ccactgtcct tttataatac aatttacagc tatattttac tttaagcaat tcttttattc 1980
aaaaaccatt tattaagtgc ccttgcaata tcaatcgctg tgccaggcat tgaatctaca 2040
gatgtgagca agacaaagta cctgtcctca aggagctcat agtataatga ggagattaac 2100
aagaaaatgt attattacaa tttagtccag tgtcatagca taaggatgat gcgaggggaa 2160
aacccgagca gtgttgccaa gaggaggaaa taggccaatg tggtctggga cggttggata 2220
tacttaaaca tcttaataat cagagtaatt ttcatttaca aagagaggtc ggtacttaaa 2280
ataaccctga aaaataacac tggaattcct tttctagcat tatatttatt cctgatttgc 2340
ctttgccata taatctaatg cttgtttata tagtgtctgg tattgtttaa cagttctgtc 2400
ttttctattt aaatgccact aaattttaaa ttcatacctt tccatgattc aaaattcaaa 2460
agatcccatg ggagatggtt ggaaaatctc cacttcatcc tccaagccat tcaagtttcc 2520
tttccagaag caactgctac tgcctttcat tcatatgttc ttctaaagat agtctacatt 2580
tggaaatgta tgttaaaagc acgtattttt aaaatttttt tcctaaatag taacacattg 2640
tatgtctgct gtgtactttg ctatttttat ttattttagt gtttcttata tagcagatgg 2700
aatgaatttg aagttcccag ggctgaggat ccatgccttc tttgtttcta agttatcttt 2760
cccatagctt ttcattatct ttcatatgat ccagtatatg ttaaatatgt cctacatata 2820
catttagaca accaccattt gttaagtatt tgctctagga cagagtttgg atttgtttat 2880
gtttgctcaa aaggagaccc atgggctctc cagggtgcac tgagtcaatc tagtcctaaa 2940
aagcaatctt attattaact ctgtatgaca gaatcatgtc tggaactttt gttttctgct 3000
ttctgtcaag tataaacttc actttgatgc tgtacttgca aaatcacatt ttctttctgg 3060
aaattccggc agtgtacctt gactgctagc taccctgtgc cagaaaagcc tcattcgttg 3120
tgcttgaacc cttgaatgcc accagctgtc atcactacac agccctccta agaggcttcc 3180
tggaggtttc gagattcaga tgccctggga gatcccagag tttcctttcc ctcttggcca 3240
tattctggtg tcaatgacaa ggagtacctt ggctttgcca catgtcaagg ctgaagaaac 3300
agtgtctcca acagagctcc ttgtgttatc tgtttgtaca tgtgcatttg tacagtaatt 3360
ggtgtgacag tgttctttgt gtgaattaca ggcaagaatt gtggctgagc aaggcacata 3420
gtctactcag tctattccta agtcctaact cctccttgtg gtgttggatt tgtaaggcac 3480
tttatccctt ttgtctcatg tttcatcgta aatggcatag gcagagatga tacctaattc 3540
tgcatttgat tgtcactttt tgtacctgca ttaatttaat aaaatattct tatttatttt 3600
gttacttggt acaccagcat gtccattttc ttgtttattt tgtgtttaat aaaatgttca 3660
gtttaacatc ccagtggaga aagttaaaaa a 3691
<210> 7
<211> 2122
<212> DNA
<213> Homo sapiens
<400> 7
ggtggctatt ttgtccttgg gctgcctgtt ttcagctgct gcaaccacag ggatttcttc 60
tgttcaggcg ccatgtcaga accggctggg gatgtccgtc agaacccatg cggcagcaag 120
gcctgccgcc gcctcttcgg cccagtggac agcgagcagc tgagccgcga ctgtgatgcg 180
ctaatggcgg gctgcatcca ggaggcccgt gagcgatgga acttcgactt tgtcaccgag 240
acaccactgg agggtgactt cgcctgggag cgtgtgcggg gccttggcct gcccaagctc 300
taccttccca cggggccccg gcgaggccgg gatgagttgg gaggaggcag gcggcctggc 360
acctcacctg ctctgctgca ggggacagca gaggaagacc atgtggacct gtcactgtct 420
tgtacccttg tgcctcgctc aggggagcag gctgaagggt ccccaggtgg acctggagac 480
tctcagggtc gaaaacggcg gcagaccagc atgacagatt tctaccactc caaacgccgg 540
ctgatcttct ccaagaggaa gccctaatcc gcccacagga agcctgcagt cctggaagcg 600
cgagggcctc aaaggcccgc tctacatctt ctgccttagt ctcagtttgt gtgtcttaat 660
tattatttgt gttttaattt aaacacctcc tcatgtacat accctggccg ccccctgccc 720
cccagcctct ggcattagaa ttatttaaac aaaaactagg cggttgaatg agaggttcct 780
aagagtgctg ggcattttta ttttatgaaa tactatttaa agcctcctca tcccgtgttc 840
tccttttcct ctctcccgga ggttgggtgg gccggcttca tgccagctac ttcctcctcc 900
ccacttgtcc gctgggtggt accctctgga ggggtgtggc tccttcccat cgctgtcaca 960
ggcggttatg aaattcaccc cctttcctgg acactcagac ctgaattctt tttcatttga 1020
gaagtaaaca gatggcactt tgaaggggcc tcaccgagtg ggggcatcat caaaaacttt 1080
ggagtcccct cacctcctct aaggttgggc agggtgaccc tgaagtgagc acagcctagg 1140
gctgagctgg ggacctggta ccctcctggc tcttgatacc cccctctgtc ttgtgaaggc 1200
agggggaagg tggggtcctg gagcagacca ccccgcctgc cctcatggcc cctctgacct 1260
gcactgggga gcccgtctca gtgttgagcc ttttccctct ttggctcccc tgtacctttt 1320
gaggagcccc agctaccctt cttctccagc tgggctctgc aattcccctc tgctgctgtc 1380
cctccccctt gtcctttccc ttcagtaccc tctcagctcc aggtggctct gaggtgcctg 1440
tcccaccccc acccccagct caatggactg gaaggggaag ggacacacaa gaagaagggc 1500
accctagttc tacctcaggc agctcaagca gcgaccgccc cctcctctag ctgtgggggt 1560
gagggtccca tgtggtggca caggccccct tgagtggggt tatctctgtg ttaggggtat 1620
atgatggggg agtagatctt tctaggaggg agacactggc ccctcaaatc gtccagcgac 1680
cttcctcatc caccccatcc ctccccagtt cattgcactt tgattagcag cggaacaagg 1740
agtcagacat tttaagatgg tggcagtaga ggctatggac agggcatgcc acgtgggctc 1800
atatggggct gggagtagtt gtctttcctg gcactaacgt tgagcccctg gaggcactga 1860
agtgcttagt gtacttggag tattggggtc tgaccccaaa caccttccag ctcctgtaac 1920
atactggcct ggactgtttt ctctcggctc cccatgtgtc ctggttcccg tttctccacc 1980
tagactgtaa acctctcgag ggcagggacc acaccctgta ctgttctgtg tctttcacag 2040
ctcctcccac aatgctgaat atacagcagg tgctcaataa atgattctta gtgactttac 2100
ttgtaaaaaa aaaaaaaaaa aa 2122
<210> 8
<211> 2024
<212> DNA
<213> Homo sapiens
<400> 8
aaggcaagag atctaggact tctagcccct gaactttcag ccgaatacat cttttccaaa 60
ggagtgaatt caggcccttg tatcactggc agcaggacgt gaccatggag aagctgttgt 120
gtttcttggt cttgaccagc ctctctcatg cttttggcca gacagacatg tcgaggaagg 180
cttttgtgtt tcccaaagag tcggatactt cctatgtatc cctcaaagca ccgttaacga 240
agcctctcaa agccttcact gtgtgcctcc acttctacac ggaactgtcc tcgacccgtg 300
ggtacagtat tttctcgtat gccaccaaga gacaagacaa tgagattctc atattttggt 360
ctaaggatat aggatacagt tttacagtgg gtgggtctga aatattattc gaggttcctg 420
aagtcacagt agctccagta cacatttgta caagctggga gtccgcctca gggatcgtgg 480
agttctgggt agatgggaag cccagggtga ggaagagtct gaagaaggga tacactgtgg 540
gggcagaagc aagcatcatc ttggggcagg agcaggattc cttcggtggg aactttgaag 600
gaagccagtc cctggtggga gacattggaa atgtgaacat gtgggacttt gtgctgtcac 660
cagatgagat taacaccatc tatcttggcg ggcccttcag tcctaatgtc ctgaactggc 720
gggcactgaa gtatgaagtg caaggcgaag tgttcaccaa accccagctg tggccctgag 780
gcccagctgt gggtcctgaa ggtacctccc ggttttttac accgcatggg ccccacgtct 840
ctgtctctgg tacctcccgc ttttttacac tgcatggttc ccacgtctct gtctctgggc 900
ctttgttccc ctatatgcat tgcaggcctg ctccaccctc ctcagcgcct gagaatggag 960
gtaaagtgtc tggtctggga gctcgttaac tatgctggga aacggtccaa aagaatcaga 1020
atttgaggtg ttttgttttc atttttattt caagttggac agatcttgga gataatttct 1080
tacctcacat agatgagaaa actaacaccc agaaaggaga aatgatgtta taaaaaactc 1140
ataaggcaag agctgagaag gaagcgctga tcttctattt aattccccac ccatgacccc 1200
cagaaagcag gagggcattg cccacattca cagggctctt cagtctcaga atcaggacac 1260
tggccaggtg tctggtttgg gtccagagtg ctcatcatca tgtcatagaa ctgctgggcc 1320
caggtctcct gaaatgggaa gcccagcaat accacgcagt ccctccactt tctcaaagca 1380
cactggaaag gccattagaa ttgccccagc agagcagatc tgcttttttt ccagagcaaa 1440
atgaagcact aggtataaat atgttgttac tgccaagaac ttaaatgact ggtttttgtt 1500
tgcttgcagt gctttcttaa ttttatggct cttctgggaa actcctcccc ttttccacac 1560
gaaccttgtg gggctgtgaa ttctttcttc atccccgcat tcccaatata cccaggccac 1620
aagagtggac gtgaaccaca gggtgtcctg tcagaggagc ccatctccca tctccccagc 1680
tccctatctg gaggatagtt ggatagttac gtgttcctag caggaccaac tacagtcttc 1740
ccaaggattg agttatggac tttgggagtg agacatcttc ttgctgctgg atttccaagc 1800
tgagaggacg tgaacctggg accaccagta gccatcttgt ttgccacatg gagagagact 1860
gtgaggacag aagccaaact ggaagtggag gagccaaggg attgacaaac aacagagcct 1920
tgaccacgtg gagtctctga atcagccttg tctggaacca gatctacacc tggactgccc 1980
aggtctataa gccaataaag cccctgttta cttgaaaaaa aaaa 2024
<210> 9
<211> 6774
<212> DNA
<213> Homo sapiens
<400> 9
cggccccaga aaacccgagc gagtaggggg cggcgcgcag gagggaggag aactgggggc 60
gcgggaggct ggtgggtgtg gggggtggag atgtagaaga tgtgacgccg cggcccggcg 120
ggtgccagat tagcggacgc ggtgcccgcg gttgcaacgg gatcccgggc gctgcagctt 180
gggaggcggc tctccccagg cggcgtccgc ggagacaccc atccgtgaac cccaggtccc 240
gggccgccgg ctcgccgcgc accaggggcc ggcggacaga agagcggccg agcggctcga 300
ggctggggga ccgcgggcgc ggccgcgcgc tgccgggcgg gaggctgggg ggccggggcc 360
ggggccgtgc cccggagcgg gtcggaggcc ggggccgggg ccgggggacg gcggctcccc 420
gcgcggctcc agcggctcgg ggatcccggc cgggccccgc agggaccatg gcagccggga 480
gcatcaccac gctgcccgcc ttgcccgagg atggcggcag cggcgccttc ccgcccggcc 540
acttcaagga ccccaagcgg ctgtactgca aaaacggggg cttcttcctg cgcatccacc 600
ccgacggccg agttgacggg gtccgggaga agagcgaccc tcacatcaag ctacaacttc 660
aagcagaaga gagaggagtt gtgtctatca aaggagtgtg tgctaaccgt tacctggcta 720
tgaaggaaga tggaagatta ctggcttcta aatgtgttac ggatgagtgt ttcttttttg 780
aacgattgga atctaataac tacaatactt accggtcaag gaaatacacc agttggtatg 840
tggcactgaa acgaactggg cagtataaac ttggatccaa aacaggacct gggcagaaag 900
ctatactttt tcttccaatg tctgctaaga gctgatttta atggccacat ctaatctcat 960
ttcacatgaa agaagaagta tattttagaa atttgttaat gagagtaaaa gaaaataaat 1020
gtgtatagct cagtttggat aattggtcaa acaatttttt atccagtagt aaaatatgta 1080
accattgtcc cagtaaagaa aaataacaaa agttgtaaaa tgtatattct cccttttata 1140
ttgcatctgc tgttacccag tgaagcttac ctagagcaat gatctttttc acgcatttgc 1200
tttattcgaa aagaggcttt taaaatgtgc atgtttagaa acaaaatttc ttcatggaaa 1260
tcatatacat tagaaaatca cagtcagatg tttaatcaat ccaaaatgtc cactatttct 1320
tatgtcattc gttagtctac atgtttctaa acatataaat gtgaatttaa tcaattcctt 1380
tcatagtttt ataattctct ggcagttcct tatgatagag tttataaaac agtcctgtgt 1440
aaactgctgg aagttcttcc acagtcaggt caattttgtc aaacccttct ctgtacccat 1500
acagcagcag cctagcaact ctgctggtga tgggagttgt attttcagtc ttcgccaggt 1560
cattgagatc catccactca catcttaagc attcttcctg gcaaaaattt atggtgaatg 1620
aatatggctt taggcggcag atgatataca tatctgactt cccaaaagct ccaggatttg 1680
tgtgctgttg ccgaatactc aggacggacc tgaattctga ttttatacca gtctcttcaa 1740
aaacttctcg aaccgctgtg tctcctacgt aaaaaaagag atgtacaaat caataataat 1800
tacactttta gaaactgtat catcaaagat tttcagttaa agtagcatta tgtaaaggct 1860
caaaacatta ccctaacaaa gtaaagtttt caatacaaat tctttgcctt gtggatatca 1920
agaaatccca aaatattttc ttaccactgt aaattcaaga agcttttgaa atgctgaata 1980
tttctttggc tgctacttgg aggcttatct acctgtacat ttttggggtc agctcttttt 2040
aacttcttgc tgctcttttt cccaaaaggt aaaaatatag attgaaaagt taaaacattt 2100
tgcatggctg cagttccttt gtttcttgag ataagattcc aaagaactta gattcatttc 2160
ttcaacaccg aaatgctgga ggtgtttgat cagttttcaa gaaacttgga atataaataa 2220
ttttataatt caacaaaggt tttcacattt tataaggttg atttttcaat taaatgcaaa 2280
tttgtgtggc aggattttta ttgccattaa catatttttg tggctgcttt ttctacacat 2340
ccagatggtc cctctaactg ggctttctct aattttgtga tgttctgtca ttgtctccca 2400
aagtatttag gagaagccct ttaaaaagct gccttcctct accactttgc tggaaagctt 2460
cacaattgtc acagacaaag atttttgttc caatactcgt tttgcctcta tttttcttgt 2520
ttgtcaaata gtaaatgata tttgcccttg cagtaattct actggtgaaa aacatgcaaa 2580
gaagaggaag tcacagaaac atgtctcaat tcccatgtgc tgtgactgta gactgtctta 2640
ccatagactg tcttacccat cccctggata tgctcttgtt ttttccctct aatagctatg 2700
gaaagatgca tagaaagagt ataatgtttt aaaacataag gcattcgtct gccatttttc 2760
aattacatgc tgacttccct tacaattgag atttgcccat aggttaaaca tggttagaaa 2820
caactgaaag cataaaagaa aaatctaggc cgggtgcagt ggctcatgcc tatattccct 2880
gcactttggg aggccaaagc aggaggatcg cttgagccca ggagttcaag accaacctgg 2940
tgaaaccccg tctctacaaa aaaacacaaa aaatagccag gcatggtggc gtgtacatgt 3000
ggtctcagat acttgggagg ctgaggtggg agggttgatc acttgaggct gagaggtcaa 3060
ggttgcagtg agccataatc gtgccactgc agtccagcct aggcaacaga gtgagacttt 3120
gtctcaaaaa aagagaaatt ttccttaata agaaaagtaa tttttactct gatgtgcaat 3180
acatttgtta ttaaatttat tatttaagat ggtagcacta gtcttaaatt gtataaaata 3240
tcccctaaca tgtttaaatg tccattttta ttcattatgc tttgaaaaat aattatgggg 3300
aaatacatgt ttgttattaa atttattatt aaagatagta gcactagtct taaatttgat 3360
ataacatctc ctaacttgtt taaatgtcca tttttattct ttatgtttga aaataaatta 3420
tggggatcct atttagctct tagtaccact aatcaaaagt tcggcatgta gctcatgatc 3480
tatgctgttt ctatgtcgtg gaagcaccgg atgggggtag tgagcaaatc tgccctgctc 3540
agcagtcacc atagcagctg actgaaaatc agcactgcct gagtagtttt gatcagttta 3600
acttgaatca ctaactgact gaaaattgaa tgggcaaata agtgcttttg tctccagagt 3660
atgcgggaga cccttccacc tcaagatgga tatttcttcc ccaaggattt caagatgaat 3720
tgaaattttt aatcaagata gtgtgcttta ttctgttgta ttttttatta ttttaatata 3780
ctgtaagcca aactgaaata acatttgctg ttttataggt ttgaagaaca taggaaaaac 3840
taagaggttt tgtttttatt tttgctgatg aagagatatg tttaaatatg ttgtattgtt 3900
ttgtttagtt acaggacaat aatgaaatgg agtttatatt tgttatttct attttgttat 3960
atttaataat agaattagat tgaaataaaa tataatggga aataatctgc agaatgtggg 4020
ttttcctggt gtttccctct gactctagtg cactgatgat ctctgataag gctcagctgc 4080
tttatagttc tctggctaat gcagcagata ctcttcctgc cagtggtaat acgatttttt 4140
aagaaggcag tttgtcaatt ttaatcttgt ggataccttt atactcttag ggtattattt 4200
tatacaaaag ccttgaggat tgcattctat tttctatatg accctcttga tatttaaaaa 4260
acactatgga taacaattct tcatttacct agtattatga aagaatgaag gagttcaaac 4320
aaatgtgttt cccagttaac tagggtttac tgtttgagcc aatataaatg tttaactgtt 4380
tgtgatggca gtattcctaa agtacattgc atgttttcct aaatacagag tttaaataat 4440
ttcagtaatt cttagatgat tcagcttcat cattaagaat atcttttgtt ttatgttgag 4500
ttagaaatgc cttcatatag acatagtctt tcagacctct actgtcagtt ttcatttcta 4560
gctgctttca gggttttatg aattttcagg caaagcttta atttatacta agcttaggaa 4620
gtatggctaa tgccaacggc agtttttttc ttcttaattc cacatgactg aggcatatat 4680
gatctctggg taggtgagtt gttgtgacaa ccacaagcac tttttttttt tttaaagaaa 4740
aaaaggtagt gaatttttaa tcatctggac tttaagaagg attctggagt atacttaggc 4800
ctgaaattat atatatttgg cttggaaatg tgtttttctt caattacatc tacaagtaag 4860
tacagctgaa attcagagga cccataagag ttcacatgaa aaaaatcaat ttatttgaaa 4920
aggcaagatg caggagagag gaagccttgc aaacctgcag actgcttttt gcccaatata 4980
gattgggtaa ggctgcaaaa cataagctta attagctcac atgctctgct ctcacgtggc 5040
accagtggat agtgtgagag aattaggctg tagaacaaat ggccttctct ttcagcattc 5100
acaccactac aaaatcatct tttatatcaa cagaagaata agcataaact aagcaaaagg 5160
tcaataagta cctgaaacca agattggcta gagatatatc ttaatgcaat ccattttctg 5220
atggattgtt acgagttggc tatataatgt atgtatggta ttttgatttg tgtaaaagtt 5280
ttaaaaatca agctttaagt acatggacat ttttaaataa aatatttaaa gacaatttag 5340
aaaattgcct taatatcatt gttggctaaa tagaataggg gacatgcata ttaaggaaaa 5400
ggtcatggag aaataatatt ggtatcaaac aaatacattg atttgtcatg atacacattg 5460
aatttgatcc aatagtttaa ggaataggta ggaaaatttg gtttctattt ttcgatttcc 5520
tgtaaatcag tgacataaat aattcttagc ttattttata tttccttgtc ttaaatactg 5580
agctcagtaa gttgtgttag gggattattt ctcagttgag actttcttat atgacatttt 5640
actatgtttt gacttcctga ctattaaaaa taaatagtag atacaatttt cataaagtga 5700
agaattatat aatcactgct ttataactga ctttattata tttatttcaa agttcattta 5760
aaggctacta ttcatcctct gtgatggaat ggtcaggaat ttgttttctc atagtttaat 5820
tccaacaaca atattagtcg tatccaaaat aacctttaat gctaaacttt actgatgtat 5880
atccaaagct tctcattttc agacagatta atccagaagc agtcataaac agaagaatag 5940
gtggtatgtt cctaatgata ttatttctac taatggaata aactgtaata ttagaaatta 6000
tgctgctaat tatatcagct ctgaggtaat ttctgaaatg ttcagactca gtcggaacaa 6060
attggaaaat ttaaattttt attcttagct ataaagcaag aaagtaaaca cattaatttc 6120
ctcaacattt ttaagccaat taaaaatata aaagatacac accaatatct tcttcaggct 6180
ctgacaggcc tcctggaaac ttccacatat ttttcaactg cagtataaag tcagaaaata 6240
aagttaacat aactttcact aacacacaca tatgtagatt tcacaaaatc cacctataat 6300
tggtcaaagt ggttgagaat atatttttta gtaattgcat gcaaaatttt tctagcttcc 6360
atcctttctc cctcgtttct tctttttttg ggggagctgg taactgatga aatcttttcc 6420
caccttttct cttcaggaaa tataagtggt tttgtttggt taacgtgata cattctgtat 6480
gaatgaaaca ttggagggaa acatctactg aatttctgta atttaaaata ttttgctgct 6540
agttaactat gaacagatag aagaatctta cagatgctgc tataaataag tagaaaatat 6600
aaatttcatc actaaaatat gctattttaa aatctatttc ctatattgta tttctaatca 6660
gatgtattac tcttattatt tctattgtat gtgttaatga ttttatgtaa aaatgtaatt 6720
gcttttcatg agtagtatga ataaaattga ttagtttgtg ttttcttgtc tccc 6774
<210> 10
<211> 2158
<212> DNA
<213> Homo sapiens
<400> 10
attcataaaa cgcttgttat aaaagcagtg gctgcggcgc ctcgtactcc aaccgcatct 60
gcagcgagca tctgagaagc caagactgag ccggcggccg cggcgcagcg aacgagcagt 120
gaccgtgctc ctacccagct ctgctccaca gcgcccacct gtctccgccc ctcggcccct 180
cgcccggctt tgcctaaccg ccacgatgat gttctcgggc ttcaacgcag actacgaggc 240
gtcatcctcc cgctgcagca gcgcgtcccc ggccggggat agcctctctt actaccactc 300
acccgcagac tccttctcca gcatgggctc gcctgtcaac gcgcaggact tctgcacgga 360
cctggccgtc tccagtgcca acttcattcc cacggtcact gccatctcga ccagtccgga 420
cctgcagtgg ctggtgcagc ccgccctcgt ctcctccgtg gccccatcgc agaccagagc 480
ccctcaccct ttcggagtcc ccgccccctc cgctggggct tactccaggg ctggcgttgt 540
gaagaccatg acaggaggcc gagcgcagag cattggcagg aggggcaagg tggaacagtt 600
atctccagaa gaagaagaga aaaggagaat ccgaagggaa aggaataaga tggctgcagc 660
caaatgccgc aaccggagga gggagctgac tgatacactc caagcggaga cagaccaact 720
agaagatgag aagtctgctt tgcagaccga gattgccaac ctgctgaagg agaaggaaaa 780
actagagttc atcctggcag ctcaccgacc tgcctgcaag atccctgatg acctgggctt 840
cccagaagag atgtctgtgg cttcccttga tctgactggg ggcctgccag aggttgccac 900
cccggagtct gaggaggcct tcaccctgcc tctcctcaat gaccctgagc ccaagccctc 960
agtggaacct gtcaagagca tcagcagcat ggagctgaag accgagccct ttgatgactt 1020
cctgttccca gcatcatcca ggcccagtgg ctctgagaca gcccgctccg tgccagacat 1080
ggacctatct gggtccttct atgcagcaga ctgggagcct ctgcacagtg gctccctggg 1140
gatggggccc atggccacag agctggagcc cctgtgcact ccggtggtca cctgtactcc 1200
cagctgcact gcttacacgt cttccttcgt cttcacctac cccgaggctg actccttccc 1260
cagctgtgca gctgcccacc gcaagggcag cagcagcaat gagccttcct ctgactcgct 1320
cagctcaccc acgctgctgg ccctgtgagg gggcagggaa ggggaggcag ccggcaccca 1380
caagtgccac tgcccgagct ggtgcattac agagaggaga aacacatctt ccctagaggg 1440
ttcctgtaga cctagggagg accttatctg tgcgtgaaac acaccaggct gtgggcctca 1500
aggacttgaa agcatccatg tgtggactca agtccttacc tcttccggag atgtagcaaa 1560
acgcatggag tgtgtattgt tcccagtgac acttcagaga gctggtagtt agtagcatgt 1620
tgagccaggc ctgggtctgt gtctcttttc tctttctcct tagtcttctc atagcattaa 1680
ctaatctatt gggttcatta ttggaattaa cctggtgctg gatattttca aattgtatct 1740
agtgcagctg attttaacaa taactactgt gttcctggca atagtgtgtt ctgattagaa 1800
atgaccaata ttatactaag aaaagatacg actttatttt ctggtagata gaaataaata 1860
gctatatcca tgtactgtag tttttcttca acatcaatgt tcattgtaat gttactgatc 1920
atgcattgtt gaggtggtct gaatgttctg acattaacag ttttccatga aaacgtttta 1980
ttgtgttttt aatttattta ttaagatgga ttctcagata tttatatttt tattttattt 2040
ttttctacct tgaggtcttt tgacatgtgg aaagtgaatt tgaatgaaaa atttaagcat 2100
tgtttgctta ttgttccaag acattgtcaa taaaagcatt taagttgaat gcgaccaa 2158
<210> 11
<211> 2812
<212> DNA
<213> Homo sapiens
<400> 11
agctgggctt tgtggagcgc tgcggagggt gcgtgcgggc cgcggcagcc gaacaaagga 60
gcaggggcgc cgccgcaggg acccgccacc cacctcccgg ggccgcgcag cggcctctcg 120
tctactgcca ccatgaccgc caacggcaca gccgaggcgg tgcagatcca gttcggcctc 180
atcaactgcg gcaacaagta cctgacggcc gaggcgttcg ggttcaaggt gaacgcgtcc 240
gccagcagcc tgaagaagaa gcagatctgg acgctggagc agccccctga cgaggcgggc 300
agcgcggccg tgtgcctgcg cagccacctg ggccgctacc tggcggcgga caaggacggc 360
aacgtgacct gcgagcgcga ggtgcccggt cccgactgcc gtttcctcat cgtggcgcac 420
gacgacggtc gctggtcgct gcagtccgag gcgcaccggc gctacttcgg cggcaccgag 480
gaccgcctgt cctgcttcgc gcagacggtg tcccccgccg agaagtggag cgtgcacatc 540
gccatgcacc ctcaggtcaa catctacagc gtcacccgta agcgctacgc gcacctgagc 600
gcgcggccgg ccgacgagat cgccgtggac cgcgacgtgc cctggggcgt cgactcgctc 660
atcaccctcg ccttccagga ccagcgctac agcgtgcaga ccgccgacca ccgcttcctg 720
cgccacgacg ggcgcctggt ggcgcgcccc gagccggcca ctggctacac gctggagttc 780
cgctccggca aggtggcctt ccgcgactgc gagggccgtt acctggcgcc gtcggggccc 840
agcggcacgc tcaaggcggg caaggccacc aaggtgggca aggacgagct ctttgctctg 900
gagcagagct gcgcccaggt cgtgctgcag gcggccaacg agaggaacgt gtccacgcgc 960
cagggtatgg acctgtctgc caatcaggac gaggagaccg accaggagac cttccagctg 1020
gagatcgacc gcgacaccaa aaagtgtgcc ttccgtaccc acacgggcaa gtactggacg 1080
ctgacggcca ccgggggcgt gcagtccacc gcctccagca agaatgccag ctgctacttt 1140
gacatcgagt ggcgtgaccg gcgcatcaca ctgagggcgt ccaatggcaa gtttgtgacc 1200
tccaagaaga atgggcagct ggccgcctcg gtggagacag caggggactc agagctcttc 1260
ctcatgaagc tcatcaaccg ccccatcatc gtgttccgcg gggagcatgg cttcatcggc 1320
tgccgcaagg tcacgggcac cctggacgcc aaccgctcca gctatgacgt cttccagctg 1380
gagttcaacg atggcgccta caacatcaaa gactccacag gcaaatactg gacggtgggc 1440
agtgactccg cggtcaccag cagcggcgac actcctgtgg acttcttctt cgagttctgc 1500
gactataaca aggtggccat caaggtgggc gggcgctacc tgaagggcga ccacgcaggc 1560
gtcctgaagg cctcggcgga aaccgtggac cccgcctcgc tctgggagta ctagggccgg 1620
cccgtccttc cccgcccctg cccacatggc ggctcctgcc aaccctccct gctaacccct 1680
tctccgccag gtgggctcca gggcgggagg caagccccct tgcctttcaa actggaaacc 1740
ccagagaaaa cggtgccccc acctgtcgcc cctatggact ccccactctc ccctccgccc 1800
gggttcccta ctcccctcgg gtcagcggct gcggcctggc cctgggaggg atttcagatg 1860
cccctgccct cttgtctgcc acggggcgag tctggcacct ctttcttctg acctcagacg 1920
gctctgagcc ttatttctct ggaagcggct aagggacggt tgggggctgg gagccctggg 1980
cgtgtagtgt aactggaatc ttttgcctct cccagccacc tcctcccagc cccccaggag 2040
agctgggcac atgtcccaag cctgtcagtg gccctccctg gtgcactgtc cccgaaaccc 2100
ctgcttggga agggaagctg tcgggtgggc taggactgac ccttgtggtg tttttttggg 2160
tggtggctgg aaacagcccc tctcccacgt ggcagaggct cagcctggct cccttccctg 2220
gagcggcagg gcgtgacggc cacagggtct gcccgctgca cgttctgcca aggtggtggt 2280
ggcgggcggg taggggtgtg ggggccgtct tcctcctgtc tctttccttt caccctagcc 2340
tgactggaag cagaaaatga ccaaatcagt atttttttta atgaaatatt attgctggag 2400
gcgtcccagg caagcctggc tgtagtagcg agtgatctgg cggggggcgt ctcagcaccc 2460
tccccagggg gtgcatctca gccccctctt tccgtccttc ccgtccagcc ccagccctgg 2520
gcctgggctg ccgacacctg ggccagagcc cctgctgtga ttggtgctcc ctgggcctcc 2580
cgggtggatg aagccaggcg tcgccccctc cgggagccct ggggtgagcc gccggggccc 2640
ccctgctgcc agcctccccc gtccccaaca tgcatctcac tctgggtgtc ttggtctttt 2700
attttttgta agtgtcattt gtataactct aaacgcccat gatagtagct tcaaactgga 2760
aatagcgaaa taaaataact cagtctgcag ccccagaaaa aaaaaaaaaa aa 2812
<210> 12
<211> 1690
<212> DNA
<213> Homo sapiens
<400> 12
gcaggcaggg ggttcgtgac gccggctggg tctgggggct gtgggccagc cgagccgacc 60
cgggcttctg ggggaccgcg ggggccgtga gcactcagag ggcgcatccc aggcccctcc 120
ggggacccgg ccagcctgaa gatgccgacg aacggcctgc accaggtgct gaagatccag 180
tttggcctcg tcaacgacac tgaccgctac ctgacagctg agagcttcgg cttcaaggtc 240
aatgcctcgg cacccagcct caagaggaag cagacctggg tgctggaacc cgacccagga 300
caaggcacgg ctgtgctgct ccgcagcagc cacctgggcc gctacctgtc ggcagaagag 360
gacgggcgcg tggcctgtga ggcagagcag ccgggccgtg actgccgctt cctggtcctg 420
ccgcagccag atgggcgctg ggtgctgcgg tccgagccgc acggccgctt cttcggaggc 480
accgaggacc agctgtcctg cttcgccaca gccgtttccc cggccgagct gtggaccgtg 540
cacctggcca tccacccgca ggcccacctg ctgagcgtga gccggcggcg ctacgtgcac 600
ctgtgcccgc gggaggacga gatggccgca gacggagaca agccctgggg cgtggacgcc 660
ctcctcaccc tcatcttccg gagccgacgg tactgcctca agtcctgtga cagccgctac 720
ctgcgcagcg acggccgtct ggtctgggag cctgagcccc gtgcctgcta cacgctggag 780
ttcaaggcgg gcaagctggc cttcaaggac tgcgacggcc actacctggc acccgtgggg 840
cccgcaggca ccctcaaggc cggccgaaac acgcgacctg gcaaggatga gctctttgat 900
ctggaggaga gtcacccaca ggtggtgctg gtggctgcca accaccgcta cgtctctgtg 960
cggcaagggg tcaacgtctc agccaatcag gatgatgaac tagaccacga gaccttcctg 1020
atgcaaattg accaggagac aaagaagtgc accttctatt ccagcactgg gggctactgg 1080
accctggtca cccatggggg cattcacgcc acagccacac aagtttctgc caacaccatg 1140
tttgagatgg agtggcgtgg ccggcgggta gcactcaaag ccagcaacgg gcgctacgtg 1200
tgcatgaaga agaatgggca gctggcggct atcagcgatt ttgtcggcaa ggacgaagag 1260
ttcaccctca agctcatcaa ccggcccatc ctggtgctgc gcggcctgga cggcttcgtc 1320
tgccaccacc gcggctccaa ccagctggac accaaccgct ccgtctacga cgtcttccac 1380
ctgagcttca gcgacggcgc ctaccggatc cgaggccgcg acggagggtt ctggtacacg 1440
ggcagccacg gcagcgtgtg cagcgacggc gaacgcgccg aggacttcgt cttcgagttc 1500
cgtgagcgcg gccgcctggc catccgcgcc cggagcggca agtacctgcg cggcggcgcc 1560
tcgggcctgc tgcgggccga tgccgacgcc ccggccggga ccgcgctttg ggagtactga 1620
ggccgcgccc agaccagcct gtcgcgcatt aaaaccgtgt ctctcccgca aaaaaaaaaa 1680
aaaaaaaaaa 1690
<210> 13
<211> 1911
<212> DNA
<213> Homo sapiens
<400> 13
ccctttcccc actgtggtgt gataagaggc tgccctcaca gtcacaatgc tcccgggtca 60
cagaggtgct gggccccagg ccagcctctg cctgggaagt tctctctggg aacatctggt 120
gggtactaca ggccctattc caggccctat ggcctgtgga acctcaccac gggggggagg 180
gctgggccag acggagacat cacctgtggt gtcagcccca tggatgagac agagtggata 240
cacagacatc ccaaggctga ggacctaagg gttgggctca tcagctgggc aggaacctac 300
ctcacctttg aggcatgcaa gaatacagtc actgcaactg cgaagagttt gggcaggaga 360
cagacctggg agatcttggt gagcaatgag catgagacac aggccgtggt gcgactaaag 420
agcgtgcagg gcctctacct gctgtgtgag tgtgatggca ccgtgtgtta tggccgccca 480
aggaccagcc accatgggtg ctttctactg cgtttccacc ggaacagcaa gtggaccctc 540
cagtgcctaa tctctggtcg ttatttggag tccaatggca aggacgtgtt ttgcacttcc 600
cacgtcctct cagcttacca catgtggacc ccccgaccag ccctccatgt ccacgtgatc 660
ctctacagcc ccatccaccg ctgctatgcc cgggctgacc ccactatggg ccgcatctgg 720
gtggacgcag cagttccctg cctggaggag tgtggcttcc tgttgcattt ccgagatgga 780
tgctaccacc tggagacctc tacacaccac ttcttgtccc atgtagaccg gctgttctcc 840
caaccctcat cacagacagc ttttcacatg caagtgcggc ctggagggct tgtggcactg 900
tgtgatggag aaggaggcat gttatatcca cagggcacgc atctgctctt gggcatgggc 960
tgcaacccca tgaggggtga ggagtggttc atcctacagc actgcccaac ctgggtcagc 1020
ctcaggtcaa agactgggcg gttcatctca gtcatctacg atggtgaggt gcgtgctgct 1080
tctgagcgct taaaccgaat gtccttgttc cagtttgaat gtgacagtga gagccccact 1140
gtgcagcttc gttcagccaa tggctactac ctatcccaga ggcgccacag ggcagtaatg 1200
gctgatgggc accccctgga gtctgacacg ttcttccgaa tgcactggaa ctgtggcagg 1260
atcatcctgc agtcctgcag ggggcgcttc ctgggcattg cacccaacag cctgctgatg 1320
gccaatgtca tccttccagg cccaaatgag gaatttggga ttttatttgc caatcgctcc 1380
ttccttgtat tgcgaggtcg ttatggctat gtgggctcct catcgggcca tgacctcata 1440
cagtgcaacc aggatcagcc cgaccgcatt catctactac cctgccgacc gggtatctac 1500
cacttccagg cacagggggg atccttctgg tcaataacat cctttggcac ctttcgccct 1560
tggggcaagt ttgccctcaa cttctgtatc gagcttcagg ggagcaactt actcactgta 1620
ctggccccca atggcttcta catgcgagcc gaccaaagtg gcaccctgtt ggcagacagt 1680
gaagacatta ccagagagtg tatctgggaa ttttaggtca atgggatgtc acctaccaaa 1740
atccaaatcc tccaggaaaa actactacac taaatggacc aggaacctca gagtcaagat 1800
ccaagagaag aacatctgtt acaacttttc ctacccagtt tagcaaaaca cctgttttat 1860
gcaacaatac atcacaacag gccaccccca aaaaaaaaaa aaaaaaaaaa a 1911
<210> 14
<211> 4082
<212> DNA
<213> Homo sapiens
<400> 14
gcgcgcgccg gcctgggcag gcgagcgggc gcgctcccgc cccctctccc ctccccgcgc 60
gcccgagcgc gcctccgccc ttgcccgccc cctgacgctg cctcagctcc tcagtgcaca 120
gtgctgcctc gtctgagggg acaggaggat caccctcttc gtcgcttcgg ccagtgtgtc 180
gggctgggcc ctgacaagcc acctgaggag aggctcggag ccgggcccgg accccggcga 240
ttgccgcccg cttctctcta gtctcacgag gggtttcccg cctcgcaccc ccacctctgg 300
acttgccttt ccttctcttc tccgcgtgtg gagggagcca gcgcttaggc cggagcgagc 360
ctgggggccg cccgccgtga agacatcgcg gggaccgatt caccatggag ggcgccggcg 420
gcgcgaacga caagaaaaag ataagttctg aacgtcgaaa agaaaagtct cgagatgcag 480
ccagatctcg gcgaagtaaa gaatctgaag ttttttatga gcttgctcat cagttgccac 540
ttccacataa tgtgagttcg catcttgata aggcctctgt gatgaggctt accatcagct 600
atttgcgtgt gaggaaactt ctggatgctg gtgatttgga tattgaagat gacatgaaag 660
cacagatgaa ttgcttttat ttgaaagcct tggatggttt tgttatggtt ctcacagatg 720
atggtgacat gatttacatt tctgataatg tgaacaaata catgggatta actcagtttg 780
aactaactgg acacagtgtg tttgatttta ctcatccatg tgaccatgag gaaatgagag 840
aaatgcttac acacagaaat ggccttgtga aaaagggtaa agaacaaaac acacagcgaa 900
gcttttttct cagaatgaag tgtaccctaa ctagccgagg aagaactatg aacataaagt 960
ctgcaacatg gaaggtattg cactgcacag gccacattca cgtatatgat accaacagta 1020
accaacctca gtgtgggtat aagaaaccac ctatgacctg cttggtgctg atttgtgaac 1080
ccattcctca cccatcaaat attgaaattc ctttagatag caagactttc ctcagtcgac 1140
acagcctgga tatgaaattt tcttattgtg atgaaagaat taccgaattg atgggatatg 1200
agccagaaga acttttaggc cgctcaattt atgaatatta tcatgctttg gactctgatc 1260
atctgaccaa aactcatcat gatatgttta ctaaaggaca agtcaccaca ggacagtaca 1320
ggatgcttgc caaaagaggt ggatatgtct gggttgaaac tcaagcaact gtcatatata 1380
acaccaagaa ttctcaacca cagtgcattg tatgtgtgaa ttacgttgtg agtggtatta 1440
ttcagcacga cttgattttc tcccttcaac aaacagaatg tgtccttaaa ccggttgaat 1500
cttcagatat gaaaatgact cagctattca ccaaagttga atcagaagat acaagtagcc 1560
tctttgacaa acttaagaag gaacctgatg ctttaacttt gctggcccca gccgctggag 1620
acacaatcat atctttagat tttggcagca acgacacaga aactgatgac cagcaacttg 1680
aggaagtacc attatataat gatgtaatgc tcccctcacc caacgaaaaa ttacagaata 1740
taaatttggc aatgtctcca ttacccaccg ctgaaacgcc aaagccactt cgaagtagtg 1800
ctgaccctgc actcaatcaa gaagttgcat taaaattaga accaaatcca gagtcactgg 1860
aactttcttt taccatgccc cagattcagg atcagacacc tagtccttcc gatggaagca 1920
ctagacaaag ttcacctgag cctaatagtc ccagtgaata ttgtttttat gtggatagtg 1980
atatggtcaa tgaattcaag ttggaattgg tagaaaaact ttttgctgaa gacacagaag 2040
caaagaaccc attttctact caggacacag atttagactt ggagatgtta gctccctata 2100
tcccaatgga tgatgacttc cagttacgtt ccttcgatca gttgtcacca ttagaaagca 2160
gttccgcaag ccctgaaagc gcaagtcctc aaagcacagt tacagtattc cagcagactc 2220
aaatacaaga acctactgct aatgccacca ctaccactgc caccactgat gaattaaaaa 2280
cagtgacaaa agaccgtatg gaagacatta aaatattgat tgcatctcca tctcctaccc 2340
acatacataa agaaactact agtgccacat catcaccata tagagatact caaagtcgga 2400
cagcctcacc aaacagagca ggaaaaggag tcatagaaca gacagaaaaa tctcatccaa 2460
gaagccctaa cgtgttatct gtcgctttga gtcaaagaac tacagttcct gaggaagaac 2520
taaatccaaa gatactagct ttgcagaatg ctcagagaaa gcgaaaaatg gaacatgatg 2580
gttcactttt tcaagcagta ggaattggaa cattattaca gcagccagac gatcatgcag 2640
ctactacatc actttcttgg aaacgtgtaa aaggatgcaa atctagtgaa cagaatggaa 2700
tggagcaaaa gacaattatt ttaataccct ctgatttagc atgtagactg ctggggcaat 2760
caatggatga aagtggatta ccacagctga ccagttatga ttgtgaagtt aatgctccta 2820
tacaaggcag cagaaaccta ctgcagggtg aagaattact cagagctttg gatcaagtta 2880
actgagcttt ttcttaattt cattcctttt tttggacact ggtggctcat tacctaaagc 2940
agtctattta tattttctac atctaatttt agaagcctgg ctacaatact gcacaaactt 3000
ggttagttca attttgatcc cctttctact taatttacat taatgctctt ttttagtatg 3060
ttctttaatg ctggatcaca gacagctcat tttctcagtt ttttggtatt taaaccattg 3120
cattgcagta gcatcatttt aaaaaatgca cctttttatt tatttatttt tggctaggga 3180
gtttatccct ttttcgaatt atttttaaga agatgccaat ataatttttg taagaaggca 3240
gtaacctttc atcatgatca taggcagttg aaaaattttt acaccttttt tttcacattt 3300
tacataaata ataatgcttt gccagcagta cgtggtagcc acaattgcac aatatatttt 3360
cttaaaaaat accagcagtt actcatggaa tatattctgc gtttataaaa ctagttttta 3420
agaagaaatt ttttttggcc tatgaaattg ttaaacctgg aacatgacat tgttaatcat 3480
ataataatga ttcttaaatg ctgtatggtt tattatttaa atgggtaaag ccatttacat 3540
aatatagaaa gatatgcata tatctagaag gtatgtggca tttatttgga taaaattctc 3600
aattcagaga aatcatctga tgtttctata gtcactttgc cagctcaaaa gaaaacaata 3660
ccctatgtag ttgtggaagt ttatgctaat attgtgtaac tgatattaaa cctaaatgtt 3720
ctgcctaccc tgttggtata aagatatttt gagcagactg taaacaagaa aaaaaaaatc 3780
atgcattctt agcaaaattg cctagtatgt taatttgctc aaaatacaat gtttgatttt 3840
atgcactttg tcgctattaa catccttttt ttcatgtaga tttcaataat tgagtaattt 3900
tagaagcatt attttaggaa tatatagttg tcacagtaaa tatcttgttt tttctatgta 3960
cattgtacaa atttttcatt ccttttgctc tttgtggttg gatctaacac taactgtatt 4020
gttttgttac atcaaataaa catcttctgt ggaccaggca aaaaaaaaaa aaaaaaaaaa 4080
aa 4082
<210> 15
<211> 3366
<212> DNA
<213> Homo sapiens
<400> 15
gcatgcgtag gcgcgcggcc gcggcggcgg ctggggaggg ttcttccgga aggttcggga 60
ggcttctgga aaaagcgccg cgcgctgggc gggcccgtcg ctatataagg caggcgcggg 120
ggtggcgcgt cagttgcttc agcgtcccgg tgtggctgtg ccgttggtcc tgtgcggtca 180
cttagccaag atgcctgagg aaacccagac ccaagaccaa ccgatggagg aggaggaggt 240
tgagacgttc gcctttcagg cagaaattgc ccagttgatg tcattgatca tcaatacttt 300
ctactcgaac aaagagatct ttctgagaga gctcatttca aattcatcag atgcattgga 360
caaaatccgg tatgaaagct tgacagatcc cagtaaatta gactctggga aagagctgca 420
tattaacctt ataccgaaca aacaagatcg aactctcact attgtggata ctggaattgg 480
aatgaccaag gctgacttga tcaataacct tggtactatc gccaagtctg ggaccaaagc 540
gttcatggaa gctttgcagg ctggtgcaga tatctctatg attggccagt tcggtgttgg 600
tttttattct gcttatttgg ttgctgagaa agtaactgtg atcaccaaac ataacgatga 660
tgagcagtac gcttgggagt cctcagcagg gggatcattc acagtgagga cagacacagg 720
tgaacctatg ggtcgtggaa caaaagttat cctacacctg aaagaagacc aaactgagta 780
cttggaggaa cgaagaataa aggagattgt gaagaaacat tctcagttta ttggatatcc 840
cattactctt tttgtggaga aggaacgtga taaagaagta agcgatgatg aggctgaaga 900
aaaggaagac aaagaagaag aaaaagaaaa agaagagaaa gagtcggaag acaaacctga 960
aattgaagat gttggttctg atgaggaaga agaaaagaag gatggtgaca agaagaagaa 1020
gaagaagatt aaggaaaagt acatcgatca agaagagctc aacaaaacaa agcccatctg 1080
gaccagaaat cccgacgata ttactaatga ggagtacgga gaattctata agagcttgac 1140
caatgactgg gaagatcact tggcagtgaa gcatttttca gttgaaggac agttggaatt 1200
cagagccctt ctatttgtcc cacgacgtgc tccttttgat ctgtttgaaa acagaaagaa 1260
aaagaacaac atcaaattgt atgtacgcag agttttcatc atggataact gtgaggagct 1320
aatccctgaa tatctgaact tcattagagg ggtggtagac tcggaggatc tccctctaaa 1380
catatcccgt gagatgttgc aacaaagcaa aattttgaaa gttatcagga agaatttggt 1440
caaaaaatgc ttagaactct ttactgaact ggcggaagat aaagagaact acaagaaatt 1500
ctatgagcag ttctctaaaa acataaagct tggaatacac gaagactctc aaaatcggaa 1560
gaagctttca gagctgttaa ggtactacac atctgcctct ggtgatgaga tggtttctct 1620
caaggactac tgcaccagaa tgaaggagaa ccagaaacat atctattata tcacaggtga 1680
gaccaaggac caggtagcta actcagcctt tgtggaacgt cttcggaaac atggcttaga 1740
agtgatctat atgattgagc ccattgatga gtactgtgtc caacagctga aggaatttga 1800
ggggaagact ttagtgtcag tcaccaaaga aggcctggaa cttccagagg atgaagaaga 1860
gaaaaagaag caggaagaga aaaaaacaaa gtttgagaac ctctgcaaaa tcatgaaaga 1920
catattggag aaaaaagttg aaaaggtggt tgtgtcaaac cgattggtga catctccatg 1980
ctgtattgtc acaagcacat atggctggac agcaaacatg gagagaatca tgaaagctca 2040
agccctaaga gacaactcaa caatgggtta catggcagca aagaaacacc tggagataaa 2100
ccctgaccat tccattattg agaccttaag gcaaaaggca gaggctgata agaacgacaa 2160
gtctgtgaag gatctggtca tcttgcttta tgaaactgcg ctcctgtctt ctggcttcag 2220
tctggaagat ccccagacac atgctaacag gatctacagg atgatcaaac ttggtctggg 2280
tattgatgaa gatgacccta ctgctgatga taccagtgct gctgtaactg aagaaatgcc 2340
accccttgaa ggagatgacg acacatcacg catggaagaa gtagactaat ctctggctga 2400
gggatgactt acctgttcag tactctacaa ttcctctgat aatatatttt caaggatgtt 2460
tttctttatt tttgttaata ttaaaaagtc tgtatggcat gacaactact ttaaggggaa 2520
gataagattt ctgtctacta agtgatgctg tgatacctta ggcactaaag cagagctagt 2580
aatgcttttt gagtttcatg ttggtttatt ttcacagatt ggggtaacgt gcactgtaag 2640
acgtatgtaa catgatgtta actttgtggt ctaaagtgtt tagctgtcaa gccggatgcc 2700
taagtagacc aaatcttgtt attgaagtgt tctgagctgt atcttgatgt ttagaaaagt 2760
attcgttaca tcttgtagga tctacttttt gaacttttca ttccctgtag ttgacaattc 2820
tgcatgtact agtcctctag aaataggtta aactgaagca acttgatgga aggatctctc 2880
cacagggctt gttttccaaa gaaaagtatt gtttggagga gcaaagttaa aagcctacct 2940
aagcatatcg taaagctgtt caaaaataac tcagacccag tcttgtggat ggaaatgtag 3000
tgctcgagtc acattctgct taaagttgta acaaatacag atgagttaaa agatattgtg 3060
tgacagtgtc ttatttaggg ggaaagggga gtatctggat gacagttagt gccaaaatgt 3120
aaaacatgag gcgctagcag gagatggtta aacactagct gctccaaggg ttgacatggt 3180
cttcccagca tgtactcagc aggtgtgggg tggagcacac gtaggcacag aaaacaggaa 3240
tgcagacaac atgcatcccc tgcgtccatg agttacatgt gttctcttag tgtccacgtt 3300
gttttgatgt tattcatgga ataccttctg tgttaaatac agtcacttaa ttccttggcc 3360
ttaaaa 3366
<210> 16
<211> 2703
<212> DNA
<213> Homo sapiens
<400> 16
tttttcggac catgacgtca aggtgggctg gtggcggcag gtgcggggtt gacaatcata 60
ctcctttaag gcggagggat ctacaggagg gcggctgtac tgtgcttcgc cttatatagg 120
gcgacttggg gcacgcagta gctctctcga gtcactccgg cgcagtgttg ggactgtctg 180
ggtatcggaa agcaagccta cgttgctcac tattacgtat aatccttttc ttttcaagat 240
gcctgaggaa gtgcaccatg gagaggagga ggtggagact tttgcctttc aggcagaaat 300
tgcccaactc atgtccctca tcatcaatac cttctattcc aacaaggaga ttttccttcg 360
ggagttgatc tctaatgctt ctgatgcctt ggacaagatt cgctatgaga gcctgacaga 420
cccttcgaag ttggacagtg gtaaagagct gaaaattgac atcatcccca accctcagga 480
acgtaccctg actttggtag acacaggcat tggcatgacc aaagctgatc tcataaataa 540
tttgggaacc attgccaagt ctggtactaa agcattcatg gaggctcttc aggctggtgc 600
agacatctcc atgattgggc agtttggtgt tggcttttat tctgcctact tggtggcaga 660
gaaagtggtt gtgatcacaa agcacaacga tgatgaacag tatgcttggg agtcttctgc 720
tggaggttcc ttcactgtgc gtgctgacca tggtgagccc attggcaggg gtaccaaagt 780
gatcctccat cttaaagaag atcagacaga gtacctagaa gagaggcggg tcaaagaagt 840
agtgaagaag cattctcagt tcataggcta tcccatcacc ctttatttgg agaaggaacg 900
agagaaggaa attagtgatg atgaggcaga ggaagagaaa ggtgagaaag aagaggaaga 960
taaagatgat gaagaaaaac ccaagatcga agatgtgggt tcagatgagg aggatgacag 1020
cggtaaggat aagaagaaga aaactaagaa gatcaaagag aaatacattg atcaggaaga 1080
actaaacaag accaagccta tttggaccag aaaccctgat gacatcaccc aagaggagta 1140
tggagaattc tacaagagcc tcactaatga ctgggaagac cacttggcag tcaagcactt 1200
ttctgtagaa ggtcagttgg aattcagggc attgctattt attcctcgtc gggctccctt 1260
tgaccttttt gagaacaaga agaaaaagaa caacatcaaa ctctatgtcc gccgtgtgtt 1320
catcatggac agctgtgatg agttgatacc agagtatctc aattttatcc gtggtgtggt 1380
tgactctgag gatctgcccc tgaacatctc ccgagaaatg ctccagcaga gcaaaatctt 1440
gaaagtcatt cgcaaaaaca ttgttaagaa gtgccttgag ctcttctctg agctggcaga 1500
agacaaggag aattacaaga aattctatga ggcattctct aaaaatctca agcttggaat 1560
ccacgaagac tccactaacc gccgccgcct gtctgagctg ctgcgctatc atacctccca 1620
gtctggagat gagatgacat ctctgtcaga gtatgtttct cgcatgaagg agacacagaa 1680
gtccatctat tacatcactg gtgagagcaa agagcaggtg gccaactcag cttttgtgga 1740
gcgagtgcgg aaacggggct tcgaggtggt atatatgacc gagcccattg acgagtactg 1800
tgtgcagcag ctcaaggaat ttgatgggaa gagcctggtc tcagttacca aggagggtct 1860
ggagctgcct gaggatgagg aggagaagaa gaagatggaa gagagcaagg caaagtttga 1920
gaacctctgc aagctcatga aagaaatctt agataagaag gttgagaagg tgacaatctc 1980
caatagactt gtgtcttcac cttgctgcat tgtgaccagc acctacggct ggacagccaa 2040
tatggagcgg atcatgaaag cccaggcact tcgggacaac tccaccatgg gctatatgat 2100
ggccaaaaag cacctggaga tcaaccctga ccaccccatt gtggagacgc tgcggcagaa 2160
ggctgaggcc gacaagaatg ataaggcagt taaggacctg gtggtgctgc tgtttgaaac 2220
cgccctgcta tcttctggct tttcccttga ggatccccag acccactcca accgcatcta 2280
tcgcatgatc aagctaggtc taggtattga tgaagatgaa gtggcagcag aggaacccaa 2340
tgctgcagtt cctgatgaga tcccccctct cgagggcgat gaggatgcgt ctcgcatgga 2400
agaagtcgat taggttagga gttcatagtt ggaaaacttg tgcccttgta tagtgtcccc 2460
atgggctccc actgcagcct cgagtgcccc tgtcccacct ggctccccct gctggtgtct 2520
agtgtttttt tccctctcct gtccttgtgt tgaaggcagt aaactaaggg tgtcaagccc 2580
cattccctct ctactcttga cagcaggatt ggatgttgtg tattgtggtt tattttattt 2640
tcttcatttt gttctgaaat taaagtatgc aaaataaaga atatgccgtt tttatacagt 2700
tct 2703
<210> 17
<211> 2879
<212> DNA
<213> Homo sapiens
<400> 17
gattggtggg ttcatgtttc ccgtcccccg cccgcgggaa gtgggggtga aaagcggccc 60
gacctgcttg cggtgtagtg ggcggaccgc gcggctggag gtgtgaggat ccgaacccag 120
gggtgggggg tggaggcggc tcctgcgatc gaaggggact tgagactcac cggccgcacg 180
ccatgagggc cctgtgggtg ctgggcctct gctgcgtcct gctgaccttc gggtcggtca 240
gagctgacga tgaagttgat gtggatggta cagtagaaga ggatctgggt aaaagtagag 300
aaggatcaag gacggatgat gaagtagtac agagagagga agaagctatt cagttggatg 360
gattaaatgc atcacaaata agagaactta gagagaagtc ggaaaagttt gccttccaag 420
ccgaagttaa cagaatgatg aaacttatca tcaattcatt gtataaaaat aaagagattt 480
tcctgagaga actgatttca aatgcttctg atgctttaga taagataagg ctaatatcac 540
tgactgatga aaatgctctt tctggaaatg aggaactaac agtcaaaatt aagtgtgata 600
aggagaagaa cctgctgcat gtcacagaca ccggtgtagg aatgaccaga gaagagttgg 660
ttaaaaacct tggtaccata gccaaatctg ggacaagcga gtttttaaac aaaatgactg 720
aagcacagga agatggccag tcaacttctg aattgattgg ccagtttggt gtcggtttct 780
attccgcctt ccttgtagca gataaggtta ttgtcacttc aaaacacaac aacgataccc 840
agcacatctg ggagtctgac tccaatgaat tttctgtaat tgctgaccca agaggaaaca 900
ctctaggacg gggaacgaca attacccttg tcttaaaaga agaagcatct gattaccttg 960
aattggatac aattaaaaat ctcgtcaaaa aatattcaca gttcataaac tttcctattt 1020
atgtatggag cagcaagact gaaactgttg aggagcccat ggaggaagaa gaagcagcca 1080
aagaagagaa agaagaatct gatgatgaag ctgcagtaga ggaagaagaa gaagaaaaga 1140
aaccaaagac taaaaaagtt gaaaaaactg tctgggactg ggaacttatg aatgatatca 1200
aaccaatatg gcagagacca tcaaaagaag tagaagaaga tgaatacaaa gctttctaca 1260
aatcattttc aaaggaaagt gatgacccca tggcttatat tcactttact gctgaagggg 1320
aagttacctt caaatcaatt ttatttgtac ccacatctgc tccacgtggt ctgtttgacg 1380
aatatggatc taaaaagagc gattacatta agctctatgt gcgccgtgta ttcatcacag 1440
acgacttcca tgatatgatg cctaaatacc tcaattttgt caagggtgtg gtggactcag 1500
atgatctccc cttgaatgtt tcccgcgaga ctcttcagca acataaactg cttaaggtga 1560
ttaggaagaa gcttgttcgt aaaacgctgg acatgatcaa gaagattgct gatgataaat 1620
acaatgatac tttttggaaa gaatttggta ccaacatcaa gcttggtgtg attgaagacc 1680
actcgaatcg aacacgtctt gctaaacttc ttaggttcca gtcttctcat catccaactg 1740
acattactag cctagaccag tatgtggaaa gaatgaagga aaaacaagac aaaatctact 1800
tcatggctgg gtccagcaga aaagaggctg aatcttctcc atttgttgag cgacttctga 1860
aaaagggcta tgaagttatt tacctcacag aacctgtgga tgaatactgt attcaggccc 1920
ttcccgaatt tgatgggaag aggttccaga atgttgccaa ggaaggagtg aagttcgatg 1980
aaagtgagaa aactaaggag agtcgtgaag cagttgagaa agaatttgag cctctgctga 2040
attggatgaa agataaagcc cttaaggaca agattgaaaa ggctgtggtg tctcagcgcc 2100
tgacagaatc tccgtgtgct ttggtggcca gccagtacgg atggtctggc aacatggaga 2160
gaatcatgaa agcacaagcg taccaaacgg gcaaggacat ctctacaaat tactatgcga 2220
gtcagaagaa aacatttgaa attaatccca gacacccgct gatcagagac atgcttcgac 2280
gaattaagga agatgaagat gataaaacag ttttggatct tgctgtggtt ttgtttgaaa 2340
cagcaacgct tcggtcaggg tatcttttac cagacactaa agcatatgga gatagaatag 2400
aaagaatgct tcgcctcagt ttgaacattg accctgatgc aaaggtggaa gaagagcccg 2460
aagaagaacc tgaagagaca gcagaagaca caacagaaga cacagagcaa gacgaagatg 2520
aagaaatgga tgtgggaaca gatgaagaag aagaaacagc aaaggaatct acagctgaaa 2580
aagatgaatt gtaaattata ctctcaccat ttggatcctg tgtggagagg gaatgtgaaa 2640
tttacatcat ttctttttgg gagagacttg ttttggatgc cccctaatcc ccttctcccc 2700
tgcactgtaa aatgtgggat tatgggtcac aggaaaaagt gggtttttta gttgaatttt 2760
ttttaacatt cctcatgaat gtaaatttgt actatttaac tgactattct tgatgtaaaa 2820
tcttgtcatg tgtataaaaa taaaaaagat cccaaatact caaaaaaaaa aaaaaaaaa 2879
<210> 18
<211> 2445
<212> DNA
<213> Homo sapiens
<400> 18
ataaaagccc aggggcaagc ggtccggata acggctagcc tgaggagctg ctgcgacagt 60
ccactacctt tttcgagagt gactcccgtt gtcccaaggc ttcccagagc gaacctgtgc 120
ggctgcaggc accggcgcgt cgagtttccg gcgtccggaa ggaccgagct cttctcgcgg 180
atccagtgtt ccgtttccag cccccaatct cagagcggag ccgacagaga gcagggaacc 240
ggcatggcca aagccgcggc gatcggcatc gacctgggca ccacctactc ctgcgtgggg 300
gtgttccaac acggcaaggt ggagatcatc gccaacgacc agggcaaccg caccaccccc 360
agctacgtgg ccttcacgga caccgagcgg ctcatcgggg atgcggccaa gaaccaggtg 420
gcgctgaacc cgcagaacac cgtgtttgac gcgaagcggc tgattggccg caagttcggc 480
gacccggtgg tgcagtcgga catgaagcac tggcctttcc aggtgatcaa cgacggagac 540
aagcccaagg tgcaggtgag ctacaagggg gagaccaagg cattctaccc cgaggagatc 600
tcgtccatgg tgctgaccaa gatgaaggag atcgccgagg cgtacctggg ctacccggtg 660
accaacgcgg tgatcaccgt gccggcctac ttcaacgact cgcagcgcca ggccaccaag 720
gatgcgggtg tgatcgcggg gctcaacgtg ctgcggatca tcaacgagcc cacggccgcc 780
gccatcgcct acggcctgga cagaacgggc aagggggagc gcaacgtgct catctttgac 840
ctgggcgggg gcaccttcga cgtgtccatc ctgacgatcg acgacggcat cttcgaggtg 900
aaggccacgg ccggggacac ccacctgggt ggggaggact ttgacaacag gctggtgaac 960
cacttcgtgg aggagttcaa gagaaaacac aagaaggaca tcagccagaa caagcgagcc 1020
gtgaggcggc tgcgcaccgc ctgcgagagg gccaagagga ccctgtcgtc cagcacccag 1080
gccagcctgg agatcgactc cctgtttgag ggcatcgact tctacacgtc catcaccagg 1140
gcgaggttcg aggagctgtg ctccgacctg ttccgaagca ccctggagcc cgtggagaag 1200
gctctgcgcg acgccaagct ggacaaggcc cagattcacg acctggtcct ggtcgggggc 1260
tccacccgca tccccaaggt gcagaagctg ctgcaggact tcttcaacgg gcgcgacctg 1320
aacaagagca tcaaccccga cgaggctgtg gcctacgggg cggcggtgca ggcggccatc 1380
ctgatggggg acaagtccga gaacgtgcag gacctgctgc tgctggacgt ggctcccctg 1440
tcgctggggc tggagacggc cggaggcgtg atgactgccc tgatcaagcg caactccacc 1500
atccccacca agcagacgca gatcttcacc acctactccg acaaccaacc cggggtgctg 1560
atccaggtgt acgagggcga gagggccatg acgaaagaca acaatctgtt ggggcgcttc 1620
gagctgagcg gcatccctcc ggcccccagg ggcgtgcccc agatcgaggt gaccttcgac 1680
atcgatgcca acggcatcct gaacgtcacg gccacggaca agagcaccgg caaggccaac 1740
aagatcacca tcaccaacga caagggccgc ctgagcaagg aggagatcga gcgcatggtg 1800
caggaggcgg agaagtacaa agcggaggac gaggtgcagc gcgagagggt gtcagccaag 1860
aacgccctgg agtcctacgc cttcaacatg aagagcgccg tggaggatga ggggctcaag 1920
ggcaagatca gcgaggcgga caagaagaag gtgctggaca agtgtcaaga ggtcatctcg 1980
tggctggacg ccaacacctt ggccgagaag gacgagtttg agcacaagag gaaggagctg 2040
gagcaggtgt gtaaccccat catcagcgga ctgtaccagg gtgccggtgg tcccgggcct 2100
gggggcttcg gggctcaggg tcccaaggga gggtctgggt caggccccac cattgaggag 2160
gtagattagg ggcctttcca agattgctgt ttttgttttg gagcttcaag actttgcatt 2220
tcctagtatt tctgtttgtc agttctcaat ttcctgtgtt tgcaatgttg aaattttttg 2280
gtgaagtact gaacttgctt tttttccggt ttctacatgc agagatgaat ttatactgcc 2340
atcttacgac tatttcttct ttttaataca cttaactcag gccatttttt aagttggtta 2400
cttcaaagta aataaacttt aaaattcaaa aaaaaaaaaa aaaaa 2445
<210> 19
<211> 2551
<212> DNA
<213> Homo sapiens
<400> 19
ggaaaacggc cagcctgagg agctgctgcg agggtccgct tcgtctttcg agagtgactc 60
ccgcggtccc aaggctttcc agagcgaacc tgtgcggctg caggcaccgg cgtgttgagt 120
ttccggcgtt ccgaaggact gagctcttgt cgcggatccc gtccgccgtt tccagccccc 180
agtctcagag cggagcccac agagcagggc accggcatgg ccaaagccgc ggcgatcggc 240
atcgacctgg gcaccaccta ctcctgcgtg ggggtgttcc aacacggcaa ggtggagatc 300
atcgccaacg accagggcaa ccgcaccacc cccagctacg tggccttcac ggacaccgag 360
cggctcatcg gggatgcggc caagaaccag gtggcgctga acccgcagaa caccgtgttt 420
gacgcgaagc ggctgatcgg ccgcaagttc ggcgacccgg tggtgcagtc ggacatgaag 480
cactggcctt tccaggtgat caacgacgga gacaagccca aggtgcaggt gagctacaag 540
ggggagacca aggcattcta ccccgaggag atctcgtcca tggtgctgac caagatgaag 600
gagatcgccg aggcgtacct gggctacccg gtgaccaacg cggtgatcac cgtgccggcc 660
tacttcaacg actcgcagcg ccaggccacc aaggatgcgg gtgtgatcgc ggggctcaac 720
gtgctgcgga tcatcaacga gcccacggcc gccgccatcg cctacggcct ggacagaacg 780
ggcaaggggg agcgcaacgt gctcatcttt gacctgggcg ggggcacctt cgacgtgtcc 840
atcctgacga tcgacgacgg catcttcgag gtgaaggcca cggccgggga cacccacctg 900
ggtggggagg actttgacaa caggctggtg aaccacttcg tggaggagtt caagagaaaa 960
cacaagaagg acatcagcca gaacaagcga gccgtgaggc ggctgcgcac cgcctgcgag 1020
agggccaaga ggaccctgtc gtccagcacc caggccagcc tggagatcga ctccctgttt 1080
gagggcatcg acttctacac gtccatcacc agggcgaggt tcgaggagct gtgctccgac 1140
ctgttccgaa gcaccctgga gcccgtggag aaggctctgc gcgacgccaa gctggacaag 1200
gcccagattc acgacctggt cctggtcggg ggctccaccc gcatccccaa ggtgcagaag 1260
ctgctgcagg acttcttcaa cgggcgcgac ctgaacaaga gcatcaaccc cgacgaggct 1320
gtggcctacg gggcggcggt gcaggcggcc atcctgatgg gggacaagtc cgagaacgtg 1380
caggacctgc tgctgctgga cgtggctccc ctgtcgctgg ggctggagac ggccggaggc 1440
gtgatgactg ccctgatcaa gcgcaactcc accatcccca ccaagcagac gcagatcttc 1500
accacctact ccgacaacca acccggggtg ctgatccagg tgtacgaggg cgagagggcc 1560
atgacgaaag acaacaatct gttggggcgc ttcgagctga gcggcatccc tccggccccc 1620
aggggcgtgc cccagatcga ggtgaccttc gacatcgatg ccaacggcat cctgaacgtc 1680
acggccacgg acaagagcac cggcaaggcc aacaagatca ccatcaccaa cgacaagggc 1740
cgcctgagca aggaggagat cgagcgcatg gtgcaggagg cggagaagta caaagcggag 1800
gacgaggtgc agcgcgagag ggtgtcagcc aagaacgccc tggagtccta cgccttcaac 1860
atgaagagcg ccgtggagga tgaggggctc aagggcaaga tcagcgaggc ggacaagaag 1920
aaggttctgg acaagtgtca agaggtcatc tcgtggctgg acgccaacac cttggccgag 1980
aaggacgagt ttgagcacaa gaggaaggag ctggagcagg tgtgtaaccc catcatcagc 2040
ggactgtacc agggtgccgg tggtcccggg cctggcggct tcggggctca gggtcccaag 2100
ggagggtctg ggtcaggccc taccattgag gaggtggatt aggggccttt gttctttagt 2160
atgtttgtct ttgaggtgga ctgttgggac tcaaggactt tgctgctgtt ttcctatgtc 2220
atttctgctt cagctctttg ctgcttcact tctttgtaaa gttgtaacct gatggtaatt 2280
agctggcttc attatttttg tagtacaacc gatatgttca ttagaattct ttgcatttaa 2340
tgttgatact gtaagggtgt ttcgttccct ttaaatgaat caacactgcc accttctgta 2400
cgagtttgtt tgtttttttt tttttttttt ttttttgctt ggcgaaaaca ctacaaaggc 2460
tgggaatgta tgtttttata atttgtttat ttaaatatga aaaataaaat gttaaacttt 2520
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa a 2551
<210> 20
<211> 3249
<212> DNA
<213> Homo sapiens
<400> 20
caagcttagc ctggccggga aacgggaggc gtggaggccg ggagcagccc ccggggtcat 60
cgccctgcca ccgccgcccg attgctttag cttggaaatt ccggagctga agcggccagc 120
gagggaggat gaccctctcg gcccgggcac cctgtcagtc cggaaataac tgcagcattt 180
gttccggagg ggaaggcgcg aggtttccgg gaaagcagca ccgccccttg gcccccaggt 240
ggctagcgct ataaaggatc acgcgcccca gtcgacgctg agctcctctg ctactcagag 300
ttgcaacctc agcctcgcta tggctcccag cagcccccgg cccgcgctgc ccgcactcct 360
ggtcctgctc ggggctctgt tcccaggacc tggcaatgcc cagacatctg tgtccccctc 420
aaaagtcatc ctgccccggg gaggctccgt gctggtgaca tgcagcacct cctgtgacca 480
gcccaagttg ttgggcatag agaccccgtt gcctaaaaag gagttgctcc tgcctgggaa 540
caaccggaag gtgtatgaac tgagcaatgt gcaagaagat agccaaccaa tgtgctattc 600
aaactgccct gatgggcagt caacagctaa aaccttcctc accgtgtact ggactccaga 660
acgggtggaa ctggcacccc tcccctcttg gcagccagtg ggcaagaacc ttaccctacg 720
ctgccaggtg gagggtgggg caccccgggc caacctcacc gtggtgctgc tccgtgggga 780
gaaggagctg aaacgggagc cagctgtggg ggagcccgct gaggtcacga ccacggtgct 840
ggtgaggaga gatcaccatg gagccaattt ctcgtgccgc actgaactgg acctgcggcc 900
ccaagggctg gagctgtttg agaacacctc ggccccctac cagctccaga cctttgtcct 960
gccagcgact cccccacaac ttgtcagccc ccgggtccta gaggtggaca cgcaggggac 1020
cgtggtctgt tccctggacg ggctgttccc agtctcggag gcccaggtcc acctggcact 1080
gggggaccag aggttgaacc ccacagtcac ctatggcaac gactccttct cggccaaggc 1140
ctcagtcagt gtgaccgcag aggacgaggg cacccagcgg ctgacgtgtg cagtaatact 1200
ggggaaccag agccaggaga cactgcagac agtgaccatc tacagctttc cggcgcccaa 1260
cgtgattctg acgaagccag aggtctcaga agggaccgag gtgacagtga agtgtgaggc 1320
ccaccctaga gccaaggtga cgctgaatgg ggttccagcc cagccactgg gcccgagggc 1380
ccagctcctg ctgaaggcca ccccagagga caacgggcgc agcttctcct gctctgcaac 1440
cctggaggtg gccggccagc ttatacacaa gaaccagacc cgggagcttc gtgtcctgta 1500
tggcccccga ctggacgaga gggattgtcc gggaaactgg acgtggccag aaaattccca 1560
gcagactcca atgtgccagg cttgggggaa cccattgccc gagctcaagt gtctaaagga 1620
tggcactttc ccactgccca tcggggaatc agtgactgtc actcgagatc ttgagggcac 1680
ctacctctgt cgggccagga gcactcaagg ggaggtcacc cgcaaggtga ccgtgaatgt 1740
gctctccccc cggtatgaga ttgtcatcat cactgtggta gcagccgcag tcataatggg 1800
cactgcaggc ctcagcacgt acctctataa ccgccagcgg aagatcaaga aatacagact 1860
acaacaggcc caaaaaggga cccccatgaa accgaacaca caagccacgc ctccctgaac 1920
ctatcccggg acagggcctc ttcctcggcc ttcccatatt ggtggcagtg gtgccacact 1980
gaacagagtg gaagacatat gccatgcagc tacacctacc ggccctggga cgccggagga 2040
cagggcattg tcctcagtca gatacaacag catttggggc catggtacct gcacacctaa 2100
aacactaggc cacgcatctg atctgtagtc acatgactaa gccaagagga aggagcaaga 2160
ctcaagacat gattgatgga tgttaaagtc tagcctgatg agaggggaag tggtggggga 2220
gacatagccc caccatgagg acatacaact gggaaatact gaaacttgct gcctattggg 2280
tatgctgagg ccccacagac ttacagaaga agtggccctc catagacatg tgtagcatca 2340
aaacacaaag gcccacactt cctgacggat gccagcttgg gcactgctgt ctactgaccc 2400
caacccttga tgatatgtat ttattcattt gttattttac cagctattta ttgagtgtct 2460
tttatgtagg ctaaatgaac ataggtctct ggcctcacgg agctcccagt cctaatcaca 2520
ttcaaggtca ccaggtacag ttgtacaggt tgtacactgc aggagagtgc ctggcaaaaa 2580
gatcaaatgg ggctgggact tctcattggc caacctgcct ttccccagaa ggagtgattt 2640
ttctatcggc acaaaagcac tatatggact ggtaatggtt acaggttcag agattaccca 2700
gtgaggcctt attcctccct tccccccaaa actgacacct ttgttagcca cctccccacc 2760
cacatacatt tctgccagtg ttcacaatga cactcagcgg tcatgtctgg acatgagtgc 2820
ccagggaata tgcccaagct atgccttgtc ctcttgtcct gtttgcattt cactgggagc 2880
ttgcactatg cagctccagt ttcctgcagt gatcagggtc ctgcaagcag tggggaaggg 2940
ggccaaggta ttggaggact ccctcccagc tttggaagcc tcatccgcgt gtgtgtgtgt 3000
gtgtatgtgt agacaagctc tcgctctgtc acccaggctg gagtgcagtg gtgcaatcat 3060
ggttcactgc agtcttgacc ttttgggctc aagtgatcct cccacctcag cctcctgagt 3120
agctgggacc ataggctcac aacaccacac ctggcaaatt tgattttttt tttttttcca 3180
gagacggggt ctcgcaacat tgcccagact tcctttgtgt tagttaataa agctttctca 3240
actgccaaa 3249
<210> 21
<211> 1240
<212> DNA
<213> Homo sapiens
<400> 21
cacattgttc tgatcatctg aagatcagct attagaagag aaagatcagt taagtccttt 60
ggacctgatc agcttgatac aagaactact gatttcaact tctttggctt aattctctcg 120
gaaacgatga aatatacaag ttatatcttg gcttttcagc tctgcatcgt tttgggttct 180
cttggctgtt actgccagga cccatatgta aaagaagcag aaaaccttaa gaaatatttt 240
aatgcaggtc attcagatgt agcggataat ggaactcttt tcttaggcat tttgaagaat 300
tggaaagagg agagtgacag aaaaataatg cagagccaaa ttgtctcctt ttacttcaaa 360
ctttttaaaa actttaaaga tgaccagagc atccaaaaga gtgtggagac catcaaggaa 420
gacatgaatg tcaagttttt caatagcaac aaaaagaaac gagatgactt cgaaaagctg 480
actaattatt cggtaactga cttgaatgtc caacgcaaag caatacatga actcatccaa 540
gtgatggctg aactgtcgcc agcagctaaa acagggaagc gaaaaaggag tcagatgctg 600
tttcgaggtc gaagagcatc ccagtaatgg ttgtcctgcc tgcaatattt gaattttaaa 660
tctaaatcta tttattaata tttaacatta tttatatggg gaatatattt ttagactcat 720
caatcaaata agtatttata atagcaactt ttgtgtaatg aaaatgaata tctattaata 780
tatgtattat ttataattcc tatatcctgt gactgtctca cttaatcctt tgttttctga 840
ctaattaggc aaggctatgt gattacaagg ctttatctca ggggccaact aggcagccaa 900
cctaagcaag atcccatggg ttgtgtgttt atttcacttg atgatacaat gaacacttat 960
aagtgaagtg atactatcca gttactgccg gtttgaaaat atgcctgcaa tctgagccag 1020
tgctttaatg gcatgtcaga cagaacttga atgtgtcagg tgaccctgat gaaaacatag 1080
catctcagga gatttcatgc ctggtgcttc caaatattgt tgacaactgt gactgtaccc 1140
aaatggaaag taactcattt gttaaaatta tcaatatcta atatatatga ataaagtgta 1200
agttcacaac aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1240
<210> 22
<211> 1629
<212> DNA
<213> Homo sapiens
<400> 22
acacatcagg ggcttgctct tgcaaaacca aaccacaaga cagacttgca aaagaaggca 60
tgcacagctc agcactgctc tgttgcctgg tcctcctgac tggggtgagg gccagcccag 120
gccagggcac ccagtctgag aacagctgca cccacttccc aggcaacctg cctaacatgc 180
ttcgagatct ccgagatgcc ttcagcagag tgaagacttt ctttcaaatg aaggatcagc 240
tggacaactt gttgttaaag gagtccttgc tggaggactt taagggttac ctgggttgcc 300
aagccttgtc tgagatgatc cagttttacc tggaggaggt gatgccccaa gctgagaacc 360
aagacccaga catcaaggcg catgtgaact ccctggggga gaacctgaag accctcaggc 420
tgaggctacg gcgctgtcat cgatttcttc cctgtgaaaa caagagcaag gccgtggagc 480
aggtgaagaa tgcctttaat aagctccaag agaaaggcat ctacaaagcc atgagtgagt 540
ttgacatctt catcaactac atagaagcct acatgacaat gaagatacga aactgagaca 600
tcagggtggc gactctatag actctaggac ataaattaga ggtctccaaa atcggatctg 660
gggctctggg atagctgacc cagccccttg agaaacctta ttgtacctct cttatagaat 720
atttattacc tctgatacct caacccccat ttctatttat ttactgagct tctctgtgaa 780
cgatttagaa agaagcccaa tattataatt tttttcaata tttattattt tcacctgttt 840
ttaagctgtt tccatagggt gacacactat ggtatttgag tgttttaaga taaattataa 900
gttacataag ggaggaaaaa aaatgttctt tggggagcca acagaagctt ccattccaag 960
cctgaccacg ctttctagct gttgagctgt tttccctgac ctccctctaa tttatcttgt 1020
ctctgggctt ggggcttcct aactgctaca aatactctta ggaagagaaa ccagggagcc 1080
cctttgatga ttaattcacc ttccagtgtc tcggagggat tcccctaacc tcattcccca 1140
accacttcat tcttgaaagc tgtggccagc ttgttattta taacaaccta aatttggttc 1200
taggccgggc gcggtggctc acgcctgtaa tcccagcact ttgggaggct gaggcgggtg 1260
gatcacttga ggtcaggagt tcctaaccag cctggtcaac atggtgaaac cccgtctcta 1320
ctaaaaatac aaaaattagc cgggcatggt ggcgcgcacc tgtaatccca gctacttggg 1380
aggctgaggc aagagaattg cttgaaccca ggagatggaa gttgcagtga gctgatatca 1440
tgcccctgta ctccagcctg ggtgacagag caagactctg tctcaaaaaa taaaaataaa 1500
aataaatttg gttctaatag aactcagttt taactagaat ttattcaatt cctctgggaa 1560
tgttacattg tttgtctgtc ttcatagcag attttaattt tgaataaata aatgtatctt 1620
attcacatc 1629
<210> 23
<211> 1832
<212> DNA
<213> Homo sapiens
<400> 23
gagcggccag gccagcctcg gagccagcag ggagctggga gctgggggaa acgacgccag 60
gaaagctatc gcgccagaga gggcgacggg ggctcgggaa gcctgacagg gcttttgcgc 120
acagctgccg gctggctgct acccgcccgc gccagccccc gagaacgcgc gaccaggcac 180
ccagtccggt caccgcagcg gagagctcgc cgctcgctgc agcgaggccc ggagcggccc 240
cgcagggacc ctccccagac cgcctgggcc gcccggatgt gcactaaaat ggaacagccc 300
ttctaccacg acgactcata cacagctacg ggatacggcc gggcccctgg tggcctctct 360
ctacacgact acaaactcct gaaaccgagc ctggcggtca acctggccga cccctaccgg 420
agtctcaaag cgcctggggc tcgcggaccc ggcccagagg gcggcggtgg cggcagctac 480
ttttctggtc agggctcgga caccggcgcg tctctcaagc tcgcctcttc ggagctggaa 540
cgcctgattg tccccaacag caacggcgtg atcacgacga cgcctacacc cccgggacag 600
tacttttacc cccgcggggg tggcagcggt ggaggtgcag ggggcgcagg gggcggcgtc 660
accgaggagc aggagggctt cgccgacggc tttgtcaaag ccctggacga tctgcacaag 720
atgaaccacg tgacaccccc caacgtgtcc ctgggcgcta ccggggggcc cccggctggg 780
cccgggggcg tctacgccgg cccggagcca cctcccgttt acaccaacct cagcagctac 840
tccccagcct ctgcgtcctc gggaggcgcc ggggctgccg tcgggaccgg gagctcgtac 900
ccgacgacca ccatcagcta cctcccacac gcgccgccct tcgccggtgg ccacccggcg 960
cagctgggct tgggccgcgg cgcctccacc ttcaaggagg aaccgcagac cgtgccggag 1020
gcgcgcagcc gggacgccac gccgccggtg tcccccatca acatggaaga ccaagagcgc 1080
atcaaagtgg agcgcaagcg gctgcggaac cggctggcgg ccaccaagtg ccggaagcgg 1140
aagctggagc gcatcgcgcg cctggaggac aaggtgaaga cgctcaaggc cgagaacgcg 1200
gggctgtcga gtaccgccgg cctcctccgg gagcaggtgg cccagctcaa acagaaggtc 1260
atgacccacg tcagcaacgg ctgtcagctg ctgcttgggg tcaagggaca cgccttctga 1320
acgtcccctg cccctttacg gacaccccct cgcttggacg gctgggcaca cgcctcccac 1380
tggggtccag ggagcaggcg gtgggcaccc accctgggac ctaggggcgc cgcaaaccac 1440
actggactcc ggccctccta ccctgcgccc agtccttcca cctcgacgtt tacaagcccc 1500
cccttccact tttttttgta tgtttttttt ctgctggaaa cagactcgat tcatattgaa 1560
tataatatat ttgtgtattt aacagggagg ggaagagggg gcgatcgcgg cggagctggc 1620
cccgccgcct ggtactcaag cccgcgggga cattgggaag gggacccccg ccccctgccc 1680
tcccctctct gcaccgtact gtggaaaaga aacacgcact tagtctctaa agagtttatt 1740
ttaagacgtg tttgtgtttg tgtgtgtttg ttctttttat tgaatctatt taagtaaaaa 1800
aaaaattggt tctttaaaaa aaaaaaaaaa aa 1832
<210> 24
<211> 4107
<212> DNA
<213> Homo sapiens
<400> 24
gcgcaaccct ccggaagctg ccgccccttt ccccttttat gggaatactt tttttaaaaa 60
aaaagagttc gctggcgcca ccccgtagga ctggccgccc taaaaccgtg ataaaggagc 120
tgctcgccac ttctcacttc cgcttccttc cagtaaggag tcggggtctt ccccagtttt 180
ctcagccagg cggcggcggc gactggcaat gtttggcctc aaaagaaacg cggtaatcgg 240
actcaacctc tactgtgggg gggccggctt gggggccggc agcggcggcg ccacccgccc 300
gggagggcga cttttggcta cggagaagga ggcctcggcc cggcgagaga tagggggagg 360
ggaggccggc gcggtgattg gcggaagcgc cggcgcaagc cccccgtcca ccctcacgcc 420
agactcccgg agggtcgcgc ggccgccgcc cattggcgcc gaggtccccg acgtcaccgc 480
gacccccgcg aggctgcttt tcttcgcgcc cacccgccgc gcggcgccgc ttgaggagat 540
ggaagccccg gccgctgacg ccatcatgtc gcccgaagag gagctggacg ggtacgagcc 600
ggagcctctc gggaagcggc cggctgtcct gccgctgctg gagttggtcg gggaatctgg 660
taataacacc agtacggacg ggtcactacc ctcgacgccg ccgccagcag aggaggagga 720
ggacgagttg taccggcagt cgctggagat tatctctcgg taccttcggg agcaggccac 780
cggcgccaag gacacaaagc caatgggcag gtctggggcc accagcagga aggcgctgga 840
gaccttacga cgggttgggg atggcgtgca gcgcaaccac gagacggcct tccaaggcat 900
gcttcggaaa ctggacatca aaaacgaaga cgatgtgaaa tcgttgtctc gagtgatgat 960
ccatgttttc agcgacggcg taacaaactg gggcaggatt gtgactctca tttcttttgg 1020
tgcctttgtg gctaaacact tgaagaccat aaaccaagaa agctgcatcg aaccattagc 1080
agaaagtatc acagacgttc tcgtaaggac aaaacgggac tggctagtta aacaaagagg 1140
ctgggatggg tttgtggagt tcttccatgt agaggaccta gaaggtggca tcaggaatgt 1200
gctgctggct tttgcaggtg ttgctggagt aggagctggt ttggcatatc taataagata 1260
gccttactgt aagtgcaata gttgactttt aaccaaccac caccaccacc aaaaccagtt 1320
tatgcagttg gactccaagc tgtaacttcc tagagttgca ccctagcaac ctagccagaa 1380
aagcaagtgg caagaggatt atggctaaca agaataaata catgggaaga gtgctcccca 1440
ttgattgaag agtcactgtc tgaaagaagc aaagttcagt ttcagcaaca aacaaacttt 1500
gtttgggaag ctatggagga ggacttttag atttagtgaa gatggtaggg tggaaagact 1560
taatttcctt gttgagaaca ggaaagtggc cagtagccag gcaagtcata gaattgatta 1620
cccgccgaat tcattaattt actgtagtgt taagagaagc actaagaatg ccagtgacct 1680
gtgtaaaagt tacaagtaat agaactatga ctgtaagcct cagtactgta caagggaagc 1740
ttttcctctc tctaattagc tttcccagta tacttcttag aaagtccaag tgttcaggac 1800
ttttatacct gttatacttt ggcttggttt ccatgattct tactttatta gcctagttta 1860
tcaccaataa tacttgacgg aaggctcagt aattagttat gaatatggat atcctcaatt 1920
cttaagacag cttgtaaatg tatttgtaaa aattgtatat atttttacag aaagtctatt 1980
tctttgaaac gaaggaagta tcgaatttac attagttttt ttcataccct tttgaacttt 2040
gcaacttccg taattaggaa cctgtttctt acagcttttc tatgctaaac tttgttctgt 2100
tcagttctag agtgtataca gaacgaattg atgtgtaact gtatgcagac tggttgtagt 2160
ggaacaaatc tgataactat gcaggtttaa attttcttat ctgattttgg taagtattcc 2220
ttagataggt ttttctttga aaacctggga ttgagaggtt gatgaatgga aattctttca 2280
cttcattata tgcaagtttt caataattag gtctaagtgg agttttaagg ttactgatga 2340
cttacaaata atgggctctg attgggcaat actcatttga gttccttcca tttgacctaa 2400
tttaactggt gaaatttaaa gtgaattcat gggctcatct ttaaagcttt tactaaaaga 2460
ttttcagctg aatggaactc attagctgtg tgcatataaa aagatcacat caggtggatg 2520
gagagacatt tgatcccttg tttgcttaat aaattataaa atgatggctt ggaaaagcag 2580
gctagtctaa ccatggtgct attattaggc ttgcttgtta cacacacagg tctaagccta 2640
gtatgtcaat aaagcaaata cttactgttt tgtttctatt aatgattccc aaaccttgtt 2700
gcaagttttt gcattggcat ctttggattt cagtcttgat gtttgttcta tcagacttaa 2760
ccttttattt cctgtccttc cttgaaattg ctgattgttc tgctccctct acagatattt 2820
atatcaattc ctacagcttt cccctgccat ccctgaactc tttctagccc ttttagattt 2880
tggcactgtg aaacccctgc tggaaacctg agtgaccctc cctccccacc aagagtccac 2940
agacctttca tctttcacga acttgatcct gttagcaggt ggtaatacca tgggtgctgt 3000
gacactaaca gtcattgaga ggtgggagga agtccctttt ccttggactg gtatcttttc 3060
aactattgtt ttatcctgtc tttgggggca atgtgtcaaa agtcccctca ggaattttca 3120
gaggaaagaa cattttatga ggctttctct aaagtttcct ttgtatagga gtatgctcac 3180
ttaaatttac agaaagaggt gagctgtgtt aaacctcaga gtttaaaagc tactgataaa 3240
ctgaagaaag tgtctatatt ggaactaggg tcatttgaaa gcttcagtct cggaacatga 3300
cctttagtct gtggactcca tttaaaaata ggtatgaata agatgactaa gaatgtaatg 3360
gggaagaact gccctgcctg cccatctcag agccataagg tcatctttgc tagagctatt 3420
tttacctatg tatttatcgt tcttgatcat aagccgctta tttatatcat gtatctctaa 3480
ggacctaaaa gcactttatg tagtttttaa ttaatcttaa gatctggtta cggtaactaa 3540
aaaagcctgt ctgccaaatc cagtggaaac aagtgcatag atgtgaattg gtttttaggg 3600
gccccacttc ccaattcatt aggtatgact gtggaaatac agacaaggat cttagttgat 3660
attttgggct tggggcagtg agggcttagg acaccccaag tggtttggga aaggaggagg 3720
ggagtggtgg gtttataggg ggaggaggag gcaggtggtc taagtgctga ctggctacgt 3780
agttcgggca aatcctccaa aagggaaagg gaggatttgc ttagaaggat ggcgctccca 3840
gtgactactt tttgacttct gtttgtctta cgcttctctc agggaaaaac atgcagtcct 3900
ctagtgtttc atgtacattc tgtggggggt gaacaccttg gttctggtta aacagctgta 3960
cttttgatag ctgtgccagg aagggttagg accaactaca aattaatgtt ggttgtcaaa 4020
tgtagtgtgt ttccctaact ttctgttttt cctgagaaaa aaaaataaat cttttattca 4080
aatacaggga aaaaaaaaaa aaaaaaa 4107
<210> 25
<211> 2081
<212> DNA
<213> Homo sapiens
<400> 25
agcatgagtc agacagcctc tggctttctg gaagggcaag gactctatat atacagaggg 60
agcttcctag ctgggatatt ggagcagcaa gaggctggga agccatcact taccttgcac 120
tgagaaagaa gacaaaggcc agtatgcaca gctttcctcc actgctgctg ctgctgttct 180
ggggtgtggt gtctcacagc ttcccagcga ctctagaaac acaagagcaa gatgtggact 240
tagtccagaa atacctggaa aaatactaca acctgaagaa tgatgggagg caagttgaaa 300
agcggagaaa tagtggccca gtggttgaaa aattgaagca aatgcaggaa ttctttgggc 360
tgaaagtgac tgggaaacca gatgctgaaa ccctgaaggt gatgaagcag cccagatgtg 420
gagtgcctga tgtggctcag tttgtcctca ctgaggggaa ccctcgctgg gagcaaacac 480
atctgaccta caggattgaa aattacacgc cagatttgcc aagagcagat gtggaccatg 540
ccattgagaa agccttccaa ctctggagta atgtcacacc tctgacattc accaaggtct 600
ctgagggtca agcagacatc atgatatctt ttgtcagggg agatcatcgg gacaactctc 660
cttttgatgg acctggagga aatcttgctc atgcttttca accaggccca ggtattggag 720
gggatgctca ttttgatgaa gatgaaaggt ggaccaacaa tttcagagag tacaacttac 780
atcgtgttgc agctcatgaa ctcggccatt ctcttggact ctcccattct actgatatcg 840
gggctttgat gtaccctagc tacaccttca gtggtgatgt tcagctagct caggatgaca 900
ttgatggcat ccaagccata tatggacgtt cccaaaatcc tgtccagccc atcggcccac 960
aaaccccaaa agcgtgtgac agtaagctaa cctttgatgc tataactacg attcggggag 1020
aagtgatgtt ctttaaagac agattctaca tgcgcacaaa tcccttctac ccggaagttg 1080
agctcaattt catttctgtt ttctggccac aactgccaaa tgggcttgaa gctgcttacg 1140
aatttgccga cagagatgaa gtccggtttt tcaaagggaa taagtactgg gctgttcagg 1200
gacagaatgt gctacacgga taccccaagg acatctacag ctcctttggc ttccctagaa 1260
ctgtgaagca tatcgatgct gctctttctg aggaaaacac tggaaaaacc tacttctttg 1320
ttgctaacaa atactggagg tatgatgaat ataaacgatc tatggatcca ggttatccca 1380
aaatgatagc acatgacttt cctggaattg gccacaaagt tgatgcagtt ttcatgaaag 1440
atggattttt ctatttcttt catggaacaa gacaatacaa atttgatcct aaaacgaaga 1500
gaattttgac tctccagaaa gctaatagct ggttcaactg caggaaaaat tgaacattac 1560
taatttgaat ggaaaacaca tggtgtgagt ccaaagaagg tgttttcctg aagaactgtc 1620
tattttctca gtcattttta acctctagag tcactgatac acagaatata atcttattta 1680
tacctcagtt tgcatatttt tttactattt agaatgtagc cctttttgta ctgatataat 1740
ttagttccac aaatggtggg tacaaaaagt caagtttgtg gcttatggat tcatataggc 1800
cagagttgca aagatctttt ccagagtatg caactctgac gttgatccca gagagcagct 1860
tcagtgacaa acatatcctt tcaagacaga aagagacagg agacatgagt ctttgccgga 1920
ggaaaagcag ctcaagaaca catgtgcagt cactggtgtc accctggata ggcaagggat 1980
aactcttcta acacaaaata agtgttttat gtttggaata aagtcaacct tgtttctact 2040
gttttataca ctttcaaaaa aaaaaaaaaa aaaaaaaaaa a 2081
<210> 26
<211> 1906
<212> DNA
<213> Homo sapiens
<400> 26
aaagcaagga tgagtcaagc tgcgggtgat ccaaacaaac actgtcactc tttaaaagct 60
gcgctcccga ggttggacct acaaggaggc aggcaagaca gcaaggcata gagacaacat 120
agagctaagt aaagccagtg gaaatgaaga gtcttccaat cctactgttg ctgtgcgtgg 180
cagtttgctc agcctatcca ttggatggag ctgcaagggg tgaggacacc agcatgaacc 240
ttgttcagaa atatctagaa aactactacg acctcaaaaa agatgtgaaa cagtttgtta 300
ggagaaagga cagtggtcct gttgttaaaa aaatccgaga aatgcagaag ttccttggat 360
tggaggtgac ggggaagctg gactccgaca ctctggaggt gatgcgcaag cccaggtgtg 420
gagttcctga tgttggtcac ttcagaacct ttcctggcat cccgaagtgg aggaaaaccc 480
accttacata caggattgtg aattatacac cagatttgcc aaaagatgct gttgattctg 540
ctgttgagaa agctctgaaa gtctgggaag aggtgactcc actcacattc tccaggctgt 600
atgaaggaga ggctgatata atgatctctt ttgcagttag agaacatgga gacttttacc 660
cttttgatgg acctggaaat gttttggccc atgcctatgc ccctgggcca gggattaatg 720
gagatgccca ctttgatgat gatgaacaat ggacaaagga tacaacaggg accaatttat 780
ttctcgttgc tgctcatgaa attggccact ccctgggtct ctttcactca gccaacactg 840
aagctttgat gtacccactc tatcactcac tcacagacct gactcggttc cgcctgtctc 900
aagatgatat aaatggcatt cagtccctct atggacctcc ccctgactcc cctgagaccc 960
ccctggtacc cacggaacct gtccctccag aacctgggac gccagccaac tgtgatcctg 1020
ctttgtcctt tgatgctgtc agcactctga ggggagaaat cctgatcttt aaagacaggc 1080
acttttggcg caaatccctc aggaagcttg aacctgaatt gcatttgatc tcttcatttt 1140
ggccatctct tccttcaggc gtggatgccg catatgaagt tactagcaag gacctcgttt 1200
tcatttttaa aggaaatcaa ttctgggcta tcagaggaaa tgaggtacga gctggatacc 1260
caagaggcat ccacacccta ggtttccctc caaccgtgag gaaaatcgat gcagccattt 1320
ctgataagga aaagaacaaa acatatttct ttgtagagga caaatactgg agatttgatg 1380
agaagagaaa ttccatggag ccaggctttc ccaagcaaat agctgaagac tttccaggga 1440
ttgactcaaa gattgatgct gtttttgaag aatttgggtt cttttatttc tttactggat 1500
cttcacagtt ggagtttgac ccaaatgcaa agaaagtgac acacactttg aagagtaaca 1560
gctggcttaa ttgttgaaag agatatgtag aaggcacaat atgggcactt taaatgaagc 1620
taataattct tcacctaagt ctctgtgaat tgaaatgttc gttttctcct gcctgtgctg 1680
tgactcgagt cacactcaag ggaacttgag cgtgaatctg tatcttgccg gtcattttta 1740
tgttattaca gggcattcaa atgggctgct gcttagcttg caccttgtca catagagtga 1800
tctttcccaa gagaagggga agcactcgtg tgcaacagac aagtgactgt atctgtgtag 1860
actatttgct tatttaataa agacgatttg tcagttattt tatctt 1906
<210> 27
<211> 2387
<212> DNA
<213> Homo sapiens
<400> 27
agacacctct gccctcacca tgagcctctg gcagcccctg gtcctggtgc tcctggtgct 60
gggctgctgc tttgctgccc ccagacagcg ccagtccacc cttgtgctct tccctggaga 120
cctgagaacc aatctcaccg acaggcagct ggcagaggaa tacctgtacc gctatggtta 180
cactcgggtg gcagagatgc gtggagagtc gaaatctctg gggcctgcgc tgctgcttct 240
ccagaagcaa ctgtccctgc ccgagaccgg tgagctggat agcgccacgc tgaaggccat 300
gcgaacccca cggtgcgggg tcccagacct gggcagattc caaacctttg agggcgacct 360
caagtggcac caccacaaca tcacctattg gatccaaaac tactcggaag acttgccgcg 420
ggcggtgatt gacgacgcct ttgcccgcgc cttcgcactg tggagcgcgg tgacgccgct 480
caccttcact cgcgtgtaca gccgggacgc agacatcgtc atccagtttg gtgtcgcgga 540
gcacggagac gggtatccct tcgacgggaa ggacgggctc ctggcacacg cctttcctcc 600
tggccccggc attcagggag acgcccattt cgacgatgac gagttgtggt ccctgggcaa 660
gggcgtcgtg gttccaactc ggtttggaaa cgcagatggc gcggcctgcc acttcccctt 720
catcttcgag ggccgctcct actctgcctg caccaccgac ggtcgctccg acggcttgcc 780
ctggtgcagt accacggcca actacgacac cgacgaccgg tttggcttct gccccagcga 840
gagactctac acccaggacg gcaatgctga tgggaaaccc tgccagtttc cattcatctt 900
ccaaggccaa tcctactccg cctgcaccac ggacggtcgc tccgacggct accgctggtg 960
cgccaccacc gccaactacg accgggacaa gctcttcggc ttctgcccga cccgagctga 1020
ctcgacggtg atggggggca actcggcggg ggagctgtgc gtcttcccct tcactttcct 1080
gggtaaggag tactcgacct gtaccagcga gggccgcgga gatgggcgcc tctggtgcgc 1140
taccacctcg aactttgaca gcgacaagaa gtggggcttc tgcccggacc aaggatacag 1200
tttgttcctc gtggcggcgc atgagttcgg ccacgcgctg ggcttagatc attcctcagt 1260
gccggaggcg ctcatgtacc ctatgtaccg cttcactgag gggcccccct tgcataagga 1320
cgacgtgaat ggcatccggc acctctatgg tcctcgccct gaacctgagc cacggcctcc 1380
aaccaccacc acaccgcagc ccacggctcc cccgacggtc tgccccaccg gaccccccac 1440
tgtccacccc tcagagcgcc ccacagctgg ccccacaggt cccccctcag ctggccccac 1500
aggtcccccc actgctggcc cttctacggc cactactgtg cctttgagtc cggtggacga 1560
tgcctgcaac gtgaacatct tcgacgccat cgcggagatt gggaaccagc tgtatttgtt 1620
caaggatggg aagtactggc gattctctga gggcaggggg agccggccgc agggcccctt 1680
ccttatcgcc gacaagtggc ccgcgctgcc ccgcaagctg gactcggtct ttgaggagcg 1740
gctctccaag aagcttttct tcttctctgg gcgccaggtg tgggtgtaca caggcgcgtc 1800
ggtgctgggc ccgaggcgtc tggacaagct gggcctggga gccgacgtgg cccaggtgac 1860
cggggccctc cggagtggca gggggaagat gctgctgttc agcgggcggc gcctctggag 1920
gttcgacgtg aaggcgcaga tggtggatcc ccggagcgcc agcgaggtgg accggatgtt 1980
ccccggggtg cctttggaca cgcacgacgt cttccagtac cgagagaaag cctatttctg 2040
ccaggaccgc ttctactggc gcgtgagttc ccggagtgag ttgaaccagg tggaccaagt 2100
gggctacgtg acctatgaca tcctgcagtg ccctgaggac tagggctccc gtcctgcttt 2160
ggcagtgcca tgtaaatccc cactgggacc aaccctgggg aaggagccag tttgccggat 2220
acaaactggt attctgttct ggaggaaagg gaggagtgga ggtgggctgg gccctctctt 2280
ctcacctttg ttttttgttg gagtgtttct aataaacttg gattctctaa cctttaaaaa 2340
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaa 2387
<210> 28
<211> 1220
<212> DNA
<213> Homo sapiens
<400> 28
cgctccacct ctcaagcagc cagcgcctgc ctgaatctgt tctgccccct ccccacccat 60
ttcaccacca ccatgacacc gggcacccag tctcctttct tcctgctgct gctcctcaca 120
gtgcttacag ttgttacggg ttctggtcat gcaagctcta ccccaggtgg agaaaaggag 180
acttcggcta cccagagaag ttcagtgccc agctctactg agaagaatgc tttgtctact 240
ggggtctctt tctttttcct gtcttttcac atttcaaacc tccagtttaa ttcctctctg 300
gaagatccca gcaccgacta ctaccaagag ctgcagagag acatttctga aatgtttttg 360
cagatttata aacaaggggg ttttctgggc ctctccaata ttaagttcag gccaggatct 420
gtggtggtac aattgactct ggccttccga gaaggtacca tcaatgtcca cgacgtggag 480
acacagttca atcagtataa aacggaagca gcctctcgat ataacctgac gatctcagac 540
gtcagcgtga gtgatgtgcc atttcctttc tctgcccagt ctggggctgg ggtgccaggc 600
tggggcatcg cgctgctggt gctggtctgt gttctggttg cgctggccat tgtctatctc 660
attgccttgg ctgtctgtca gtgccgccga aagaactacg ggcagctgga catctttcca 720
gcccgggata cctaccatcc tatgagcgag taccccacct accacaccca tgggcgctat 780
gtgcccccta gcagtaccga tcgtagcccc tatgagaagg tttctgcagg taatggtggc 840
agcagcctct cttacacaaa cccagcagtg gcagccactt ctgccaactt gtaggggcac 900
gtcgcccgct gagctgagtg gccagccagt gccattccac tccactcagg ttcttcaggg 960
ccagagcccc tgcaccctgt ttgggctggt gagctgggag ttcaggtggg ctgctcacag 1020
cctccttcag aggccccacc aatttctcgg acacttctca gtgtgtggaa gctcatgtgg 1080
gcccctgagg gctcatgcct gggaagtgtt gtggtggggg ctcccaggag gactggccca 1140
gagagccctg agatagcggg gatcctgaac tggactgaat aaaacgtggt ctcccactgc 1200
gccaaaaaaa aaaaaaaaaa 1220
<210> 29
<211> 4518
<212> DNA
<213> Homo sapiens
<400> 29
ggagtttatt cataacgcgc tctccaagta tacgtggcaa tgcgttgctg ggttatttta 60
atcattctag gcatcgtttt cctccttatg cctctatcat tcctccctat ctacactaac 120
atcccacgct ctgaacgcgc gcccattaat acccttcttt cctccactct ccctgggact 180
cttgatcaaa gcgcggccct ttccccagcc ttagcgaggc gccctgcagc ctggtacgcg 240
cgtggcgtgg cggtgggcgc gcagtgcgtt ctcggtgtgg agggcagctg ttccgcctgc 300
gatgatttat actcacagga caaggatgcg gtttgtcaaa cagtactgct acggaggagc 360
agcagagaaa gggagagggt ttgagaggga gcaaaagaaa atggtaggcg cgcgtagtta 420
attcatgcgg ctctcttact ctgtttacat cctagagcta gagtgctcgg ctgcccggct 480
gagtctcctc cccaccttcc ccaccctccc caccctcccc ataagcgccc ctcccgggtt 540
cccaaagcag agggcgtggg ggaaaagaaa aaagatcctc tctcgctaat ctccgcccac 600
cggcccttta taatgcgagg gtctggacgg ctgaggaccc ccgagctgtg ctgctcgcgg 660
ccgccaccgc cgggccccgg ccgtccctgg ctcccctcct gcctcgagaa gggcagggct 720
tctcagaggc ttggcgggaa aaagaacgga gggagggatc gcgctgagta taaaagccgg 780
ttttcggggc tttatctaac tcgctgtagt aattccagcg agaggcagag ggagcgagcg 840
ggcggccggc tagggtggaa gagccgggcg agcagagctg cgctgcgggc gtcctgggaa 900
gggagatccg gagcgaatag ggggcttcgc ctctggccca gccctcccgc tgatccccca 960
gccagcggtc cgcaaccctt gccgcatcca cgaaactttg cccatagcag cgggcgggca 1020
ctttgcactg gaacttacaa cacccgagca aggacgcgac tctcccgacg cggggaggct 1080
attctgccca tttggggaca cttccccgcc gctgccagga cccgcttctc tgaaaggctc 1140
tccttgcagc tgcttagacg ctggattttt ttcgggtagt ggaaaaccag cagcctcccg 1200
cgacgatgcc cctcaacgtt agcttcacca acaggaacta tgacctcgac tacgactcgg 1260
tgcagccgta tttctactgc gacgaggagg agaacttcta ccagcagcag cagcagagcg 1320
agctgcagcc cccggcgccc agcgaggata tctggaagaa attcgagctg ctgcccaccc 1380
cgcccctgtc ccctagccgc cgctccgggc tctgctcgcc ctcctacgtt gcggtcacac 1440
ccttctccct tcggggagac aacgacggcg gtggcgggag cttctccacg gccgaccagc 1500
tggagatggt gaccgagctg ctgggaggag acatggtgaa ccagagtttc atctgcgacc 1560
cggacgacga gaccttcatc aaaaacatca tcatccagga ctgtatgtgg agcggcttct 1620
cggccgccgc caagctcgtc tcagagaagc tggcctccta ccaggctgcg cgcaaagaca 1680
gcggcagccc gaaccccgcc cgcggccaca gcgtctgctc cacctccagc ttgtacctgc 1740
aggatctgag cgccgccgcc tcagagtgca tcgacccctc ggtggtcttc ccctaccctc 1800
tcaacgacag cagctcgccc aagtcctgcg cctcgcaaga ctccagcgcc ttctctccgt 1860
cctcggattc tctgctctcc tcgacggagt cctccccgca gggcagcccc gagcccctgg 1920
tgctccatga ggagacaccg cccaccacca gcagcgactc tgaggaggaa caagaagatg 1980
aggaagaaat cgatgttgtt tctgtggaaa agaggcaggc tcctggcaaa aggtcagagt 2040
ctggatcacc ttctgctgga ggccacagca aacctcctca cagcccactg gtcctcaaga 2100
ggtgccacgt ctccacacat cagcacaact acgcagcgcc tccctccact cggaaggact 2160
atcctgctgc caagagggtc aagttggaca gtgtcagagt cctgagacag atcagcaaca 2220
accgaaaatg caccagcccc aggtcctcgg acaccgagga gaatgtcaag aggcgaacac 2280
acaacgtctt ggagcgccag aggaggaacg agctaaaacg gagctttttt gccctgcgtg 2340
accagatccc ggagttggaa aacaatgaaa aggcccccaa ggtagttatc cttaaaaaag 2400
ccacagcata catcctgtcc gtccaagcag aggagcaaaa gctcatttct gaagaggact 2460
tgttgcggaa acgacgagaa cagttgaaac acaaacttga acagctacgg aactcttgtg 2520
cgtaaggaaa agtaaggaaa acgattcctt ctaacagaaa tgtcctgagc aatcacctat 2580
gaacttgttt caaatgcatg atcaaatgca acctcacaac cttggctgag tcttgagact 2640
gaaagattta gccataatgt aaactgcctc aaattggact ttgggcataa aagaactttt 2700
ttatgcttac catctttttt ttttctttaa cagatttgta tttaagaatt gtttttaaaa 2760
aattttaaga tttacacaat gtttctctgt aaatattgcc attaaatgta aataacttta 2820
ataaaacgtt tatagcagtt acacagaatt tcaatcctag tatatagtac ctagtattat 2880
aggtactata aaccctaatt ttttttattt aagtacattt tgctttttaa agttgatttt 2940
tttctattgt ttttagaaaa aataaaataa ctggcaaata tatcattgag ccaaatctta 3000
agttgtgaat gttttgtttc gtttcttccc cctcccaacc accaccatcc ctgtttgttt 3060
tcatcaattg ccccttcaga gggtggtctt aagaaaggca agagttttcc tctgttgaaa 3120
tgggtctggg ggccttaagg tctttaagtt cttggaggtt ctaagatgct tcctggagac 3180
tatgataaca gccagagttg acagttagaa ggaatggcag aaggcaggtg agaaggtgag 3240
aggtaggcaa aggagataca agaggtcaaa ggtagcagtt aagtacacaa agaggcataa 3300
ggactgggga gttgggagga aggtgaggaa gaaactcctg ttactttagt taaccagtgc 3360
cagtcccctg ctcactccaa acccaggaat tctgcccagt tgatggggac acggtgggaa 3420
ccagcttctg ctgccttcac aaccaggcgc cagtcctgtc catgggttat ctcgcaaacc 3480
ccagaggatc tctgggagga atgctactat taaccctatt tcacaaacaa ggaaatagaa 3540
gagctcaaag aggttatgta acttatctgt agccacgcag ataatacaaa gcagcaatct 3600
ggacccattc tgttcaaaac acttaaccct tcgctatcat gccttggttc atctgggtct 3660
aatgtgctga gatcaagaag gtttaggacc taatggacag actcaagtca taacaatgct 3720
aagctctatt tgtgtcccaa gcactcctaa gcattttatc cctaactcta catcaacccc 3780
atgaaggaga tactgttgat ttccccatat tagaagtaga gagggaagct gaggcacaca 3840
aagactcatc cacatgccca agattcactg atagggaaaa gtggaagcga gatttgaacc 3900
caggctgttt actcctaacc tgtccaagcc acctctcaga cgacggtagg aatcagctgg 3960
ctgcttgtga gtacaggagt tacagtccag tgggttatgt tttttaagtc tcaacatcta 4020
agcctggtca ggcatcagtt cccctttttt tgtgatttat tttgttttta ttttgttgtt 4080
cattgtttaa tttttccttt tacaatgaga aggtcaccat cttgactcct accttagcca 4140
tttgttgaat cagactcatg acggctcctg ggaagaagcc agttcagatc ataaaataaa 4200
acatatttat tctttgtcat gggagtcatt attttagaaa ctacaaactc tccttgcttc 4260
catccttttt tacatactca tgacacatgc tcatcctgag tccttgaaaa ggtatttttg 4320
aacatgtgta ttaattataa gcctctgaaa acctatggcc caaaccagaa atgatgttga 4380
ttatataggt aaatgaagga tgctattgct gttctaatta cctcattgtc tcagtctcaa 4440
agtaggtctt cagctccctg tactttggga ttttaatcta ccaccaccca taaatcaata 4500
aataattact ttctttga 4518
<210> 30
<211> 4206
<212> DNA
<213> Homo sapiens
<400> 30
ataactttgt agcgagtcga aaactgaggc tccggccgca gagaactcag cctcattcct 60
gctttaaaat ctctcggcca cctttgatga ggggactggg cagttctaga cagtcccgaa 120
gttctcaagg cacaggtctc ttcctggttt gactgtcctt accccgggga ggcagtgcag 180
ccagctgcaa gccccacagt gaagaacatc tgagctcaaa tccagataag tgacataagt 240
gacctgcttt gtaaagccat agagatggcc tgtccttgga aatttctgtt caagaccaaa 300
ttccaccagt atgcaatgaa tggggaaaaa gacatcaaca acaatgtgga gaaagccccc 360
tgtgccacct ccagtccagt gacacaggat gaccttcagt atcacaacct cagcaagcag 420
cagaatgagt ccccgcagcc cctcgtggag acgggaaaga agtctccaga atctctggtc 480
aagctggatg caaccccatt gtcctcccca cggcatgtga ggatcaaaaa ctggggcagc 540
gggatgactt tccaagacac acttcaccat aaggccaaag ggattttaac ttgcaggtcc 600
aaatcttgcc tggggtccat tatgactccc aaaagtttga ccagaggacc cagggacaag 660
cctacccctc cagatgagct tctacctcaa gctatcgaat ttgtcaacca atattacggc 720
tccttcaaag aggcaaaaat agaggaacat ctggccaggg tggaagcggt aacaaaggag 780
atagaaacaa caggaaccta ccaactgacg ggagatgagc tcatcttcgc caccaagcag 840
gcctggcgca atgccccacg ctgcattggg aggatccagt ggtccaacct gcaggtcttc 900
gatgcccgca gctgttccac tgcccgggaa atgtttgaac acatctgcag acacgtgcgt 960
tactccacca acaatggcaa catcaggtcg gccatcaccg tgttccccca gcggagtgat 1020
ggcaagcacg acttccgggt gtggaatgct cagctcatcc gctatgctgg ctaccagatg 1080
ccagatggca gcatcagagg ggaccctgcc aacgtggaat tcactcagct gtgcatcgac 1140
ctgggctgga agcccaagta cggccgcttc gatgtggtcc ccctggtcct gcaggccaat 1200
ggccgtgacc ctgagctctt cgaaatccca cctgaccttg tgcttgaggt ggccatggaa 1260
catcccaaat acgagtggtt tcgggaactg gagctaaagt ggtacgccct gcctgcagtg 1320
gccaacatgc tgcttgaggt gggcggcctg gagttcccag ggtgcccctt caatggctgg 1380
tacatgggca cagagatcgg agtccgggac ttctgtgacg tccagcgcta caacatcctg 1440
gaggaagtgg gcaggagaat gggcctggaa acgcacaagc tggcctcgct ctggaaagac 1500
caggctgtcg ttgagatcaa cattgctgtg ctccatagtt tccagaagca gaatgtgacc 1560
atcatggacc accactcggc tgcagaatcc ttcatgaagt acatgcagaa tgaataccgg 1620
tcccgtgggg gctgcccggc agactggatt tggctggtcc ctcccatgtc tgggagcatc 1680
acccccgtgt ttcaccagga gatgctgaac tacgtcctgt cccctttcta ctactatcag 1740
gtagaggcct ggaaaaccca tgtctggcag gacgagaagc ggagacccaa gagaagagag 1800
attccattga aagtcttggt caaagctgtg ctctttgcct gtatgctgat gcgcaagaca 1860
atggcgtccc gagtcagagt caccatcctc tttgcgacag agacaggaaa atcagaggcg 1920
ctggcctggg acctgggggc cttattcagc tgtgccttca accccaaggt tgtctgcatg 1980
gataagtaca ggctgagctg cctggaggag gaacggctgc tgttggtggt gaccagtacg 2040
tttggcaatg gagactgccc tggcaatgga gagaaactga agaaatcgct cttcatgctg 2100
aaagagctca acaacaaatt caggtacgct gtgtttggcc tcggctccag catgtaccct 2160
cggttctgcg cctttgctca tgacattgat cagaagctgt cccacctggg ggcctctcag 2220
ctcaccccga tgggagaagg ggatgagctc agtgggcagg aggacgcctt ccgcagctgg 2280
gccgtgcaaa ccttcaaggc agcctgtgag acgtttgatg tccgaggcaa acagcacatt 2340
cagatcccca agctctacac ctccaatgtg acctgggacc cgcaccacta caggctcgtg 2400
caggactcac agcctttgga cctcagcaaa gccctcagca gcatgcatgc caagaacgtg 2460
ttcaccatga ggctcaaatc tcggcagaat ctacaaagtc cgacatccag ccgtgccacc 2520
atcctggtgg aactctcctg tgaggatggc caaggcctga actacctgcc gggggagcac 2580
cttggggttt gcccaggcaa ccagccggcc ctggtccaag gtatcctgga gcgagtggtg 2640
gatggcccca caccccacca gacagtgcgc ctggaggccc tggatgagag tggcagctac 2700
tgggtcagtg acaagaggct gcccccctgc tcactcagcc aggccctcac ctacttcctg 2760
gacatcacca cacccccaac ccagctgctg ctccaaaagc tggcccaggt ggccacagaa 2820
gagcctgaga gacagaggct ggaggccctg tgccagccct cagagtacag caagtggaag 2880
ttcaccaaca gccccacatt cctggaggtg ctagaggagt tcccgtccct gcgggtgtct 2940
gctggcttcc tgctttccca gctccccatt ctgaagccca ggttctactc catcagctcc 3000
tcccgggatc acacgcccac agagatccac ctgactgtgg ccgtggtcac ctaccacacc 3060
cgagatggcc agggtcccct gcaccacggc gtctgcagca catggctcaa cagcctgaag 3120
ccccaagacc cagtgccctg ctttgtgcgg aatgccagcg gcttccacct ccccgaggat 3180
ccctcccatc cttgcatcct catcgggcct ggcacaggca tcgcgccctt ccgcagtttc 3240
tggcagcaac ggctccatga ctcccagcac aagggagtgc ggggaggccg catgaccttg 3300
gtgtttgggt gccgccgccc agatgaggac cacatctacc aggaggagat gctggagatg 3360
gcccagaagg gggtgctgca tgcggtgcac acagcctatt cccgcctgcc tggcaagccc 3420
aaggtctatg ttcaggacat cctgcggcag cagctggcca gcgaggtgct ccgtgtgctc 3480
cacaaggagc caggccacct ctatgtttgc ggggatgtgc gcatggcccg ggacgtggcc 3540
cacaccctga agcagctggt ggctgccaag ctgaaattga atgaggagca ggtcgaggac 3600
tatttctttc agctcaagag ccagaagcgc tatcacgaag atatctttgg tgctgtattt 3660
ccttacgagg cgaagaagga cagggtggcg gtgcagccca gcagcctgga gatgtcagcg 3720
ctctgagggc ctacaggagg ggttaaagct gccggcacag aacttaagga tggagccagc 3780
tctgcattat ctgaggtcac agggcctggg gagatggagg aaagtgatat cccccagcct 3840
caagtcttat ttcctcaacg ttgctcccca tcaagccctt tacttgacct cctaacaagt 3900
agcaccctgg attgatcgga gcctcctctc tcaaactggg gcctccctgg tcccttggag 3960
acaaaatctt aaatgccagg cctggcaagt gggtgaaaga tggaacttgc tgctgagtgc 4020
accacttcaa gtgaccacca ggaggtgcta tcgcaccact gtgtatttaa ctgccttgtg 4080
tacagttatt tatgcctctg tatttaaaaa actaacaccc agtctgttcc ccatggccac 4140
ttgggtcttc cctgtatgat tccttgatgg agatatttac atgaattgca ttttacttta 4200
atcaca 4206
<210> 31
<211> 13905
<212> DNA
<213> Homo sapiens
<400> 31
gggagggggg aggggagcca gagcgaggga gggtttatcg accgggcgat tttggttaaa 60
atattcaaaa tggcggacgg aggagcagcg agtcaagatg agagttcagc cgcggcggca 120
gcagcagcag actcaagaat gaacaatccg tcagaaacca gtaaaccatc tatggagagt 180
ggagatggca acacaggcac acaaaccaat ggtctggact ttcagaagca gcctgtgcct 240
gtaggaggag caatctcaac agcccaggcg caggctttcc ttggacatct ccatcaggtc 300
caactcgctg gaacaagttt acaggctgct gctcagtctt taaatgtaca gtctaaatct 360
aatgaagaat cgggggattc gcagcagcca agccagcctt cccagcagcc ttcagtgcag 420
gcagccattc cccagaccca gcttatgcta gctggaggac agataactgg gcttactttg 480
acgcctgccc agcaacagtt actactccag caggcacagg cacaggcaca gctgctggct 540
gctgcagtgc agcagcactc cgccagccag cagcacagtg ctgctggagc caccatctcc 600
gcctctgctg ccacgcccat gacgcagatc cccctgtctc agcccataca gatcgcacag 660
gatcttcaac aactgcaaca gcttcaacag cagaatctca acctgcaaca gtttgtgttg 720
gtgcatccaa ccaccaattt gcagccagcg cagtttatca tctcacagac gccccagggc 780
cagcagggtc tcctgcaagc gcaaaatctt ctaacgcaac tacctcagca aagccaagcc 840
aacctcctac agtcgcagcc aagcatcacc ctcacctccc agccagcaac cccaacacgc 900
acaatagcag caaccccaat tcagacactt ccacagagcc agtcaacacc aaagcgaatt 960
gatactccca gcttggagga gcccagtgac cttgaggagc ttgagcagtt tgccaagacc 1020
ttcaaacaaa gacgaatcaa acttggattc actcagggtg atgttgggct cgctatgggg 1080
aaactatatg gaaatgactt cagccaaact accatctctc gatttgaagc cttgaacctc 1140
agctttaaga acatgtgcaa gttgaagcca cttttagaga agtggctaaa tgatgcagag 1200
aacctctcat ctgattcgtc cctctccagc ccaagtgccc tgaattctcc aggaattgag 1260
ggcttgagcc gtaggaggaa gaaacgcacc agcatagaga ccaacatccg tgtggcctta 1320
gagaagagtt tcttggagaa tcaaaagcct acctcggaag agatcactat gattgctgat 1380
cagctcaata tggaaaaaga ggtgattcgt gtttggttct gtaaccgccg ccagaaagaa 1440
aaaagaatca acccaccaag cagtggtggg accagcagct cacctattaa agcaattttc 1500
cccagcccaa cttcactggt ggcgaccaca ccaagccttg tgactagcag tgcagcaact 1560
accctcacag tcagccctgt cctccctctg accagtgctg ctgtgacgaa tctttcagtt 1620
acaggcactt cagacaccac ctccaacaac acagcaaccg tgatttccac agcgcctcca 1680
gcttcctcag cagtcacgtc cccctctctg agtccctccc cttctgcctc agcctccacc 1740
tccgaggcat ccagtgccag tgagaccagc acaacacaga ccacctccac tcctttgtcc 1800
tcccctcttg ggaccagcca ggtgatggtg acagcatcag gtttgcaaac agcagcagct 1860
gctgcccttc aaggagctgc acagttgcca gcaaatgcca gtcttgctgc catggcagct 1920
gctgcaggac taaacccaag cctgatggca ccctcacagt ttgcggctgg aggtgcctta 1980
ctcagtctga atccagggac cctgagcggt gctctcagcc cagctctaat gagcaacagt 2040
acactggcaa ctattcaagc tcttgcttct ggtggctctc ttccaataac atcacttgat 2100
gcaactggga acctggtatt tgccaatgcg ggaggagccc ccaacatcgt gactgcccct 2160
ctgttcctga accctcagaa cctctctctg ctcaccagca accctgttag cttggtctct 2220
gccgccgcag catctgcagg gaactctgca cctgtagcca gccttcacgc cacctccacc 2280
tctgctgagt ccatccagaa ctctctcttc acagtggcct ctgccagcgg ggctgcgtcc 2340
accaccacca ccgcctccaa ggcacagtga gctgggcaga gctgggctgc cagaagcctt 2400
tttcactctg cagtgtgatt ggactgccag ccaggttaat aaactgaaaa atgtgattgg 2460
cttcctctcg ccgtgttgtg agggcaaagg agagaaggga gaaaaaaaaa aaaaaaccac 2520
acacacccat acacacatac cagaaaaaga aagaaaggat ggagacggaa catttgccta 2580
attttgtaat aaaacactgt cttttcagga ttgcttcatg gattggagaa ctttctaacc 2640
aaaaattaaa aaaaaaaaaa aaaaaagaaa caaaaaaatc aaaaacaaac aaaaataagt 2700
gaaaggacta cttatcattt ccagcagtca tgatgacaag ttaaggtggg ttaccaattc 2760
caatatagga aggggatttc ttgtttgtct aaatttcttt ttttcttaaa aaaaaaaaat 2820
catttttatg ggtctgttgt acaggccatt aagtcataac aaggtgttta taatcgtatc 2880
aattgtgttg ggggttcctt tcttaactgg tacaatttag gcaggcctgt attactgtat 2940
tattattgtt gttgttgtta ttgttttata tatatagttt ggacatgttt attatctctt 3000
gctcctggat cctatttcag tgagctccca cactgtgggg agggagggtt ttggggtaag 3060
gggagacttc tgttcttaac tgtggggaat gttcttgctg gtttccttat ccttgatgac 3120
tcttacagag gtgctagaaa attattttct tttgccactt atgcaagagg cttggtgcag 3180
aagctgaagg cagtgtgtgc aaacactccc attccacaca cgccccttcc cctccccaca 3240
tcaggtggtg cctttggagc acttttgtgt aggaaggaat tcctgctgaa ctgtagctct 3300
cactcacccc caaatcattg aatgaccctg aggcccagtt cctgtggtgc aacagtgctg 3360
ctttctgcta ctttcaatgg gaacagctgt acatgttgca gggcaggatt tggttcccaa 3420
gagcaaagac tactgcagac acctgacttg gtggttctcc tgatttctta tctcctgaaa 3480
aatgctcctg ctgttggtgt gtttgtttgt ttgttccatt ttgtggaagt ttttcatcca 3540
aactttaact aacttggcaa agaaaaaaaa ctgacttact gaaattggga aacttttccc 3600
ttcttttatt ttctaaagga attctactag actattttcc attgataata tatacaaaag 3660
aggtgtgatg agaagggtat aaggttacca ccttttcctc tagagagcca cagacttcct 3720
ttccactgga tggtttataa attcctctaa ccctgagatt cttcttggtt ctctgactaa 3780
aggaggcact tattagccgg gctgggatct gtagaacctt tgaagaagga ctttgagcag 3840
gaactttgca cacaccttaa gtgtctcctt ggtttgttca tgatgctcct gctaggtagg 3900
tctaaatggc aatacacatc tctttattca atgtagaaag taattagctc tgtaattatt 3960
ttcagggtgt ttgtagacta tataaatgag cccattgaaa aggaagagtt tgtgaaagtg 4020
gatgaagagg aataagggta acttggagat taaattcctt tttttgtcag tgtactgttg 4080
ttatgccatc tgtaccaaaa aattttccaa aagactggat cactgcagtg cagctcatct 4140
aagttcccct tcttattgga gttaaaggtt cccatttggt ggctgtgggt gcttgcttaa 4200
atctctggtg gtcccaagac tgcacttttt ctccctttcg agctggggat gtagagagaa 4260
cttacaggtg atttttattc tgattgcttt tgtttgtgtc cacaagggag cttggattct 4320
gtgtacttgt ctctttccca ttgtccagta aggcagtaaa tacagacaca atgtgtactt 4380
ttgtgtgtga ttcaagtggg agacagtctg ttaaaaggtc agaaacattt tagtcccctt 4440
taaaatattt cttttagttt atttctatcg tgttttattt cacagatatt taattaccac 4500
ccctaaattt cctcctctta cccttcacct tccctaaaat ccttccaaaa tcagtgaact 4560
gcaagcaggg aaactaacaa atgtccattc accctttttg tgtggtgtgt ttttttatgt 4620
tttgttttgt tttttaacta agcttgaacc aaagtcaatt tttagcaagc tgctgtacta 4680
atggactagt tgataacgtg cagttcagac acatcgagga gatagatgct actgacaatt 4740
tctttttcat ttgtctttat taattttata tgaaagttgc tgcttgtttt taatctttta 4800
tgttggtaaa ttgtgatatc ctctgggcag acattaactt gatgtttaac tagtttatta 4860
ggttggtgtg taaatagaat gacaatgtca attactaatt tctctcctct ccattcactt 4920
tttctctgtt gtagttaaat ttaatcttct atcctgactt gacatctcta cctttagtct 4980
gtggaaatga ttttagggct atcagtaatg ctgtagctgc ccataataat gagtccctcc 5040
cttgggagtg gtgaaactta gaaggaagga ttcagggagg gaaatgctgg tacccagtat 5100
actggattag aagttatagc attaatttct caaaattgct accaaaggaa gtgtggagtc 5160
ccaagggact caagctcagt gaggtaagac aaagggcaag gaaaggctgt ttgggtggtt 5220
tttttttccc cacatatggt ttagaaaatg atccctttcc caaacaaaac tcaccaacag 5280
actttaatat tagaaaagat actaagcttt aaatgtcaat acagtggtct tttattccct 5340
gccctgtcta tattttctac tcaatttggg ataaggggat tttatgtgaa gcacttgatg 5400
agggtagacc agcataaaaa atctgtttaa aagaagaaat aatctttagg aaaagataaa 5460
tctttagata aaaataaatt tttttctctt tttttactta tttaaaaata agttgtgaaa 5520
tgaaaggtac atttacacat gtacacacga aacactaata tagctttttg gtggttgttt 5580
agtttaaaat caactcccta tccatcatcc ctagatattc tacttatcgt attgcttcat 5640
gaacacctta gtcatttttt actttacgta tatatttttt tatcatctca agaaatgcat 5700
tttgaattga atgaactatc ttctaagcta agatactcaa atttaacttt tagccacctt 5760
atatgggaga gcctggaaac taaaggggac cagggaccat ttgaccaaaa gaggtgtttg 5820
gtggagtttc tgcatttcaa agaagaaagg ccagataggt catcacaatt cattgtatta 5880
ttcttttttt ttccccttaa tgtttatgca aattttattt tatatttctg aatttggtta 5940
gcacatacta agccaaagac tattctaaat gcatttatag tgaatactat gtatgcccat 6000
ggtaatgggt cctccctaag gagtggtgaa tgtaattgtg tgaatcctgc ttatcacaag 6060
tggtgcaatt tggtcataaa ctttatttat accctgtata catctgaata acagagcaga 6120
aagacctaaa aaagggcttc tcacaggaac aatattacta tgttgttcta agaaaaaata 6180
agttgagtgc tgtattagtt taagtgtttc taaagttcta taggcagcat tttagaatta 6240
agaattgtgt atatccatta actgatataa ttcacatgtc cttttatttg ttatcagaaa 6300
gatcaatact atcccaattt attcaacttg ttacccaaga aatggaacca aaggaatcca 6360
actttcattt tgtgtagaat catacctact tatacttaat gctagcactg taagaaataa 6420
gtcttttttg tttaaaaaag ggaagataag attaaagatt cttagtgaga tcatcttgcc 6480
aatttgttgt acatctctca ttcattgttg ggggaaaaaa aagcacaact atacctcttt 6540
aatgttattt tcttccatta tccctcattt atttggaaag ataagggaaa ccttgtctgt 6600
attatccaga agcacagata tttgcttgac acaatattta aattcagccc aatctttaac 6660
attaaaaaat tttcttttta acttgctgga aaagttggat acattggcaa atatagggaa 6720
ttcatgtctt tttttttttt ttttttctgg tcttgctctg ttgcctaggc tagagtgcaa 6780
cggcatgatc tcggctcact gcaacctctg cctcccgggt tcaagcaatt ctcctgcttc 6840
agcctcccaa gtagctggga ttacaggcgc ccaccaccgc acccggctaa tttttgtatt 6900
tttagtaggg acgggatttc tccgtgttgg ccaggctttt tgaactcctg accttaggtg 6960
atctgcctgc cttggcctcc caaagtgctg ggattacagg tatgagccac tgtgcccatc 7020
ctcatgtcaa tttttaaagt gataaatcct gatattatac attgcaatta gtgtagaata 7080
aacgcttggc ttatagaact ctctgttctt agtctaaagc tgttcccaaa ccaggtcatc 7140
ctcacgaaac attcttgacc aagaaaaaag ataaggtcat tgagatagga agacagagga 7200
aaagcctctt gctgttgttt cttcccaaga aaggagaagc cctgccaggg agaagtcagt 7260
agtattgctg actcactgta tcactgagtg tagggtgtgg tagcaaggag gaggcagggg 7320
attcacgctg acaggtggct ctggcctggc tcttgggggg ccttctgaag accagtctgc 7380
agtttgagga agggccccaa caattcattt ggagagcttg gccaaatact ttctcattaa 7440
atcagcacct aaacttgatg aacttaaagt ttgtttatta gagttgaaaa cattaaaaga 7500
tgactgatac taatgggaga aaaatactaa agacccaaaa tttaaaattt tccaaaatgg 7560
acaagaattg atgggttaat ttgctcataa ctgatatgag tttgctttta tgtgtgtgtg 7620
gaaagcattt aatgtgtgat gctgttcata gtcctggcta tttgatgtca ttttcagttt 7680
tacaacattt tgaggatgac actttataaa atggtaaatc tttctcagcg tttacaaact 7740
tggcttttga gaagggaaaa atcctctttg ctatttctgt aagaagaata actgagatca 7800
gctattatat aggtttgcat ggatggtgtc cacaatacaa atgtaaactt ggacaggaat 7860
aggataaata aattgctttc atcataaagg ccaatcatcc atttcttagt ccaaggagat 7920
taaatataaa taggacaccc ctgagatttc cagtaaggta tttgaaagga ttccactggg 7980
agggcaggga atatattttt tctcagagca tccagtttgt acccagtttt ctatatggtt 8040
tgtgaactgt agcttttaaa aaaaaatttt gtagttttct tctaacctta ttcattaagt 8100
agttccttgt tttggccctt ctactcttgg ccttagctaa aagcagtaaa tgtgagtgaa 8160
ttttatgttg attatgtcac ctggatctcc tttccttccc ttctttttct cattgaatgg 8220
tggtacctta atttgggtaa cagctagctt ctggcacctt cataaaatac ctcagaatag 8280
cttagcattg ttgcaaaact ggttttaaac taaaaaccaa ataaataagt gaaaaaattt 8340
tataaatagt ggaaataatt ctagctgtag catttagttg aactaatgtt tattatgatc 8400
gataaacaag attgatgctg tatgtatttg ggatcctgtt tataggttac aatttatagg 8460
gttagggagg gttgggtggg ggaagaggag atgttgatta tgttagaagg aaaacattgc 8520
tcgtgtgtgt gtttgttttt tcttatatct gtcttgccaa aggaaacttg attttccctg 8580
tgattggctt tggcctctgt ggtctggtct gcagcagtgt gtggtggcat gcaggtaaca 8640
tatggggtgt ccagtaggtt cagggaccct gagggtgcat ttacatccct tcctatggtt 8700
gcccatgccc cccagaccct gccaacctct cctaatgatt cattacctct gtacatagca 8760
aaagcatagg caaaggatga atgcgtgaat gcctggatgt gcagttgaga aacagaggca 8820
gacatagaca tgcaccaatt aatttggagc caagaggtga gtgattgatg tatcttaaat 8880
ctaggaaagt taaagtgaaa caggttcttt gtgttgccct ctgtcaagtt actgaatgtt 8940
gtgctaataa cacaacactt taaaacctta cttacttttc tcataccaag gctagttctt 9000
tctagaccaa aaacacaaac aggataaaaa gcaaaccaag aagttgaaag ctaacctgcc 9060
cacctcaccc ctgtgataca aagtgtgaac cttaaggatt agttggtggg attgaggaga 9120
gaattattct tggtgggaac atgaatgaga aatgatgctg gcttaggaaa aatcacaagc 9180
cctttctgcc catactctgg gacaaacttt cttggctccc tgagttcgga tatagactgt 9240
atctctagaa aggctatttt tttaaataaa tgatcccaca gaacttaagt gggatttggt 9300
ttagatacca aagacactgc taatgtcatt gcttatcctt aagttttcaa aacaggcaga 9360
gggaatagga gcaaaaagcc aaaatttgga aaagctttac tttatctctt tccttccctt 9420
ttcccctttt cccagtcccc tgctttttga aggaagtctt cttggttatc ctggctttgg 9480
aaaagagatt tattttgttt tgctctgctg gctctttaaa gatggatagt tgctcaatct 9540
agcagtgatg ttcttggaat tgctgagaaa tttggggagg gcaaaagata ggggtagaat 9600
tttttcatta tttcccttta tctaatactt ttaaatagaa ccaacacagc ctatatgagt 9660
tcagacaata tttagatgtg gtatctccat ctgtctcctg taaaagataa gaattttcaa 9720
gaacaggatt acgtggaaaa ccaaaagatc ttcccttact ctcctataaa tgttttgttc 9780
caaatgtttt tatatatggg ctctagggag tcaggtagtt cattgtttcg gtgtactatt 9840
gataggacac agaaagggag agagggtaaa gaaatgtatc actctctgaa tattgcatca 9900
aaaatgatta ggttgcagaa cttcatgaaa gctttactaa taatcttatt gttctgacat 9960
tatgtaaagg tggtattaat attgtatgac ttgtcaaagt gctagatagg tttataagta 10020
ggtaataggg atgttgaaga ttagagcact tgaaacagaa gttctgggaa aacaaggtgt 10080
gtgtaatgga acaccacttt gagcacagaa acaaaggtcc cttggacctg gtagggaaga 10140
tgtgatttat gattgtttct gtgtccctgt atctgcccac cctgcacagg gctccaccac 10200
ccagggccac cttctggttt aaacccagga cactgtcaaa aagttaagac cccaaaacta 10260
atttactgta aaaaacattg aggactgctg caaagttttc ccttgttttc tttgtgtact 10320
tgttcatcat tgtataagtt agccacagct tcacaagagc agcttaaggc ttctttcata 10380
aattggcagt ggcattgagt tctcaaacat tatatcccaa agtctgcagg cagacagctg 10440
gatacagcgc tgtgtataaa tgagacgtcc aaacacttga gtttcttaag attgggatct 10500
ctttcaaatg aaaaaggaca gagccaagta gagaaaagac tttgtgctcc cacccagcct 10560
taatgagtct catggtctaa aagtatagga agaaatgaaa tgcactttca gaagctaaaa 10620
tgacagtgtc tgctacaaaa ggctgtagtt gtaggcagtc ggggatgcca tgtccttggt 10680
tccattcctg cgtgagtctg cagaaggcac acactttgta agagtagagt ggactagtgc 10740
cagcctgaat aggtttaaaa ctgcaaacag ttggagaaca tggaacaggt tggtgcagga 10800
agcctaagat tttgcaatca tattataaca ttggcttttg acaacataaa tgttgtatct 10860
tccctaaggt caggtcgggg aaagaaagac ttccagcttc ttacctctgc gtgcatgggc 10920
acgtgtgcat tgctcagtcc gcaggaggtc tcactccgca ggaaacgctc tcctcccgca 10980
taagtctgta cttccatccc ctcatctgtg gtagtagtga aggctaggtg agtaagcgtg 11040
ggctgttcta cccaccagaa gtccaggagc tgttgtatac ctcatttcta actcgtgacc 11100
gagtgacttg ctttaacttt ctcgaaatcc tacagagttg ccaagtctgc cctccctcct 11160
cagtcatgtt aaactctggc ctatagcatc atgggacctg tagcctaggg tgggaccccc 11220
taaagcctct gaatgtcgct gcttaaaagc tactgcaaac tgagggcaaa ttgcaatctt 11280
ctattccttt ttgttgcaag gggtcttcac aggtctctta acatctgctt tccctgccac 11340
cctgccttta ggggctggcc agctatccac acccctaacc caccctgtgt ttctgacagc 11400
tggccacacg tcaacttctg tacttgcctt ttccttggtg gggtagaggc caaccccttc 11460
tcctctgagg cctcagggtt ctgtttcttt tcaggacttt gggtagaagg gaagacacca 11520
aaggctcctt taagctgact gctgcataca catttcactt tttttccttt gacatgacca 11580
aaaatatcca aatatttaag tttattatta ttattattat tatttgacaa tcttatatcc 11640
aatgggctct ctagaagctg catccccagc cctttcacct tttctttgaa tgtagttccc 11700
aaccttcaat tcccacccct aatgctgaca aaaagcttag ccaggtcatg atactgctgc 11760
tataagccag gggagggtgg tttctttgtt ttgttttgtt ttgttttgtt tttcaaattt 11820
ccagccaaaa ccaaagattt cttaatgatt gtataaactc aaaacaaaca aaagaaccaa 11880
agaaaaggga agtcttcagc atcagtccag tctgtggtgt cctggcactt agaagagtga 11940
ggccagggaa ggtggggcgg ggggaccctc tgactggatc agaaagggca ggcaagctgc 12000
ttaccacctt ccagggtcca gcacaggtgc atgcccctag ctttggccct cacaaacttg 12060
tgagcatgcc ctgaaacaaa ttggcatttc agattttcca aaacaaaagt caaaaaaccc 12120
catcaccacc atcatccacc ctacaccaac cagggtcact atggggactt agcacagggc 12180
ctagggaggg tgggagctgc tgctggactg gcccgaggac tccacagagt gggggacgtt 12240
gaagacactg gcgcacgatt ggctgctctg ctgggtgctt taacctctgg ggctgggcga 12300
atgcacgcca cggtgccctt ctgagccttt ttttcttttc ctgtactgga actgcttgga 12360
agtggctgtc ctgtttgtga gaaaacatgc agaaagatta tcaagctttt catttctctt 12420
tattgtagtt ttctttcctt tttgcagcac cactgtgcaa ctatgcattg tacttcacaa 12480
ccttttgtgc taggtagatg cctgtgactt tttaacttgg ggggtggggg gattgcaaat 12540
gaaggaactt tttacatgga tctttttaat ctcagttggt tgggggaggg gggtacttgg 12600
ttcttgggtc acacaagctc tatcccaaag caaaatccaa atgttaataa tattagcctg 12660
atgcagatac caaagataat ttctttcctg cagaacctta gactcgtgta ttaagtacga 12720
ttacccagca cttgcattag tctaacctca gtaattccaa agcttagatg tatattttgg 12780
tatatttctg ggatattaaa aaaaaaatgt cgtttaactt cttgtttgtt tcagtgtaat 12840
gctcttaaag tcatagcatg aaaataattg aactgtccta ttcttagtag tttgaaataa 12900
tagtattttt gtatgttttg ggtgtgtcta tgtatgtatt aacataacag ttttcactgc 12960
ctaggtgttc ataataaaaa agaaaatgaa aaaagttctg agtgtacata atattcaata 13020
ataatctccc accaggtgtc aatttagatt gcatattcct cattactgtt cccaactggg 13080
attttgtttt cttttaaaga gacagtgatc gtgtttttct aaagatgttt tctttctctc 13140
tttcaatatc ttaactcact ttttttttct tccttttttg tcttaattat taattcaggg 13200
gtgtttgtcc actgttgtca aaggaggggc acaaggggaa ttggcccccg gcctcctaga 13260
actttttgtt ttatgtactt taaaatgtga gtttgagttc ttctttgtgg aaacttaaga 13320
tgtggtgtaa atgattcttt ccaaaattgt ccagcagctt gaatgaggca gtgacaattc 13380
tgaggtggtt tattgggagt ccttctacat ttctcttaga taactctgca ctctgggtgg 13440
ctattgtgta gccttactgc cccagagtgc ctgttagcca aatatttccc ctctgatagg 13500
aatattttct aagaatcagc tgataacttg cgtgctggac cttgttatct gtgcccctgg 13560
gagacacacg ttttcttggt tttgaaaacc tgaaacacag gcaactttac attttgggga 13620
attagctgat gcctcctgaa gcctgaggag gtggcgggga atatgagcgg tgctgtctct 13680
ctcaaaagtg ccctttagat gattccccct cctagggctg cctgcagggg ctgtaggctt 13740
gggaaagatt gtgtaggtga cagtgaatca gaatgaagtg gtagattttg tgtagatgca 13800
tttgtctgct gtaatttttt atatatatat taaacttact gtaactgtac agttcatttc 13860
tgttgtaaaa catcattaaa ccatcttcca agtgttttca cattg 13905
<210> 32
<211> 4507
<212> DNA
<213> Homo sapiens
<400> 32
gaccaattgt catacgactt gcagtgagcg tcaggagcac gtccaggaac tcctcagcag 60
cgcctccttc agctccacag ccagacgccc tcagacagca aagcctaccc ccgcgccgcg 120
ccctgcccgc cgctgcgatg ctcgcccgcg ccctgctgct gtgcgcggtc ctggcgctca 180
gccatacagc aaatccttgc tgttcccacc catgtcaaaa ccgaggtgta tgtatgagtg 240
tgggatttga ccagtataag tgcgattgta cccggacagg attctatgga gaaaactgct 300
caacaccgga atttttgaca agaataaaat tatttctgaa acccactcca aacacagtgc 360
actacatact tacccacttc aagggatttt ggaacgttgt gaataacatt cccttccttc 420
gaaatgcaat tatgagttat gtgttgacat ccagatcaca tttgattgac agtccaccaa 480
cttacaatgc tgactatggc tacaaaagct gggaagcctt ctctaacctc tcctattata 540
ctagagccct tcctcctgtg cctgatgatt gcccgactcc cttgggtgtc aaaggtaaaa 600
agcagcttcc tgattcaaat gagattgtgg aaaaattgct tctaagaaga aagttcatcc 660
ctgatcccca gggctcaaac atgatgtttg cattctttgc ccagcacttc acgcatcagt 720
ttttcaagac agatcataag cgagggccag ctttcaccaa cgggctgggc catggggtgg 780
acttaaatca tatttacggt gaaactctgg ctagacagcg taaactgcgc cttttcaagg 840
atggaaaaat gaaatatcag ataattgatg gagagatgta tcctcccaca gtcaaagata 900
ctcaggcaga gatgatctac cctcctcaag tccctgagca tctacggttt gctgtggggc 960
aggaggtctt tggtctggtg cctggtctga tgatgtatgc cacaatctgg ctgcgggaac 1020
acaacagagt atgcgatgtg cttaaacagg agcatcctga atggggtgat gagcagttgt 1080
tccagacaag caggctaata ctgataggag agactattaa gattgtgatt gaagattatg 1140
tgcaacactt gagtggctat cacttcaaac tgaaatttga cccagaacta cttttcaaca 1200
aacaattcca gtaccaaaat cgtattgctg ctgaatttaa caccctctat cactggcatc 1260
cccttctgcc tgacaccttt caaattcatg accagaaata caactatcaa cagtttatct 1320
acaacaactc tatattgctg gaacatggaa ttacccagtt tgttgaatca ttcaccaggc 1380
aaattgctgg cagggttgct ggtggtagga atgttccacc cgcagtacag aaagtatcac 1440
aggcttccat tgaccagagc aggcagatga aataccagtc ttttaatgag taccgcaaac 1500
gctttatgct gaagccctat gaatcatttg aagaacttac aggagaaaag gaaatgtctg 1560
cagagttgga agcactctat ggtgacatcg atgctgtgga gctgtatcct gcccttctgg 1620
tagaaaagcc tcggccagat gccatctttg gtgaaaccat ggtagaagtt ggagcaccat 1680
tctccttgaa aggacttatg ggtaatgtta tatgttctcc tgcctactgg aagccaagca 1740
cttttggtgg agaagtgggt tttcaaatca tcaacactgc ctcaattcag tctctcatct 1800
gcaataacgt gaagggctgt ccctttactt cattcagtgt tccagatcca gagctcatta 1860
aaacagtcac catcaatgca agttcttccc gctccggact agatgatatc aatcccacag 1920
tactactaaa agaacgttcg actgaactgt agaagtctaa tgatcatatt tatttattta 1980
tatgaaccat gtctattaat ttaattattt aataatattt atattaaact ccttatgtta 2040
cttaacatct tctgtaacag aagtcagtac tcctgttgcg gagaaaggag tcatacttgt 2100
gaagactttt atgtcactac tctaaagatt ttgctgttgc tgttaagttt ggaaaacagt 2160
ttttattctg ttttataaac cagagagaaa tgagttttga cgtcttttta cttgaatttc 2220
aacttatatt ataagaacga aagtaaagat gtttgaatac ttaaacactg tcacaagatg 2280
gcaaaatgct gaaagttttt acactgtcga tgtttccaat gcatcttcca tgatgcatta 2340
gaagtaacta atgtttgaaa ttttaaagta cttttggtta tttttctgtc atcaaacaaa 2400
aacaggtatc agtgcattat taaatgaata tttaaattag acattaccag taatttcatg 2460
tctacttttt aaaatcagca atgaaacaat aatttgaaat ttctaaattc atagggtaga 2520
atcacctgta aaagcttgtt tgatttctta aagttattaa acttgtacat ataccaaaaa 2580
gaagctgtct tggatttaaa tctgtaaaat cagtagaaat tttactacaa ttgcttgtta 2640
aaatatttta taagtgatgt tcctttttca ccaagagtat aaaccttttt agtgtgactg 2700
ttaaaacttc cttttaaatc aaaatgccaa atttattaag gtggtggagc cactgcagtg 2760
ttatcttaaa ataagaatat tttgttgaga tattccagaa tttgtttata tggctggtaa 2820
catgtaaaat ctatatcagc aaaagggtct acctttaaaa taagcaataa caaagaagaa 2880
aaccaaatta ttgttcaaat ttaggtttaa acttttgaag caaacttttt tttatccttg 2940
tgcactgcag gcctggtact cagattttgc tatgaggtta atgaagtacc aagctgtgct 3000
tgaataatga tatgttttct cagattttct gttgtacagt ttaatttagc agtccatatc 3060
acattgcaaa agtagcaatg acctcataaa atacctcttc aaaatgctta aattcatttc 3120
acacattaat tttatctcag tcttgaagcc aattcagtag gtgcattgga atcaagcctg 3180
gctacctgca tgctgttcct tttcttttct tcttttagcc attttgctaa gagacacagt 3240
cttctcatca cttcgtttct cctattttgt tttactagtt ttaagatcag agttcacttt 3300
ctttggactc tgcctatatt ttcttacctg aacttttgca agttttcagg taaacctcag 3360
ctcaggactg ctatttagct cctcttaaga agattaaaag agaaaaaaaa aggccctttt 3420
aaaaatagta tacacttatt ttaagtgaaa agcagagaat tttatttata gctaatttta 3480
gctatctgta accaagatgg atgcaaagag gctagtgcct cagagagaac tgtacggggt 3540
ttgtgactgg aaaaagttac gttcccattc taattaatgc cctttcttat ttaaaaacaa 3600
aaccaaatga tatctaagta gttctcagca ataataataa tgacgataat acttcttttc 3660
cacatctcat tgtcactgac atttaatggt actgtatatt acttaattta ttgaagatta 3720
ttatttatgt cttattagga cactatggtt ataaactgtg tttaagccta caatcattga 3780
tttttttttg ttatgtcaca atcagtatat tttctttggg gttacctctc tgaatattat 3840
gtaaacaatc caaagaaatg attgtattaa gatttgtgaa taaattttta gaaatctgat 3900
tggcatattg agatatttaa ggttgaatgt ttgtccttag gataggccta tgtgctagcc 3960
cacaaagaat attgtctcat tagcctgaat gtgccataag actgaccttt taaaatgttt 4020
tgagggatct gtggatgctt cgttaatttg ttcagccaca atttattgag aaaatattct 4080
gtgtcaagca ctgtgggttt taatattttt aaatcaaacg ctgattacag ataatagtat 4140
ttatataaat aattgaaaaa aattttcttt tgggaagagg gagaaaatga aataaatatc 4200
attaaagata actcaggaga atcttcttta caattttacg tttagaatgt ttaaggttaa 4260
gaaagaaata gtcaatatgc ttgtataaaa cactgttcac tgtttttttt aaaaaaaaaa 4320
cttgatttgt tattaacatt gatctgctga caaaacctgg gaatttgggt tgtgtatgcg 4380
aatgtttcag tgcctcagac aaatgtgtat ttaacttatg taaaagataa gtctggaaat 4440
aaatgtctgt ttatttttgt actatttaaa aattgacaga tcttttctga agaaaaaaaa 4500
aaaaaaa 4507
<210> 33
<211> 579
<212> DNA
<213> Homo sapiens
<400> 33
aggctcagta taaatagcag ccaccgctcc ctggcaggca gggacccgca gctcagctac 60
agcacagatc agcaccatga agcttctcac gggcctggtt ttctgctcct tggtcctggg 120
tgtcagcagc cgaagcttct tttcgttcct tggcgaggct tttgatgggg ctcgggacat 180
gtggagagcc tactctgaca tgagagaagc caattacatc ggctcagaca aatacttcca 240
tgctcggggg aactatgatg ctgccaaaag gggacctggg ggtgcctggg ctgcagaagt 300
gatcagcgat gccagagaga atatccagag attctttggc catggtgcgg aggactcgct 360
ggctgatcag gctgccaatg aatggggcag gagtggcaaa gaccccaatc acttccgacc 420
tgctggcctg cctgagaaat actgagcttc ctcttcactc tgctctcagg agatctggct 480
gtgaggccct cagggcaggg atacaaagcg gggagagggt acacaatggg tatctaataa 540
atacttaaga ggtggaattt gtggaaaaaa aaaaaaaaa 579
<210> 34
<211> 4326
<212> DNA
<213> Homo sapiens
<400> 34
gctgagcgcg gagccgcccg gtgattggtg ggggcggaag ggggccgggc gccagcgctg 60
ccttttctcc tgccgggtag tttcgctttc ctgcgcagag tctgcggagg ggctcggctg 120
caccgggggg atcgcgcctg gcagacccca gaccgagcag aggcgaccca gcgcgctcgg 180
gagaggctgc accgccgcgc ccccgcctag cccttccgga tcctgcgcgc agaaaagttt 240
catttgctgt atgccatcct cgagagctgt ctaggttaac gttcgcactc tgtgtatata 300
acctcgacag tcttggcacc taacgtgctg tgcgtagctg ctcctttggt tgaatcccca 360
ggcccttgtt ggggcacaag gtggcaggat gtctcagtgg tacgaacttc agcagcttga 420
ctcaaaattc ctggagcagg ttcaccagct ttatgatgac agttttccca tggaaatcag 480
acagtacctg gcacagtggt tagaaaagca agactgggag cacgctgcca atgatgtttc 540
atttgccacc atccgttttc atgacctcct gtcacagctg gatgatcaat atagtcgctt 600
ttctttggag aataacttct tgctacagca taacataagg aaaagcaagc gtaatcttca 660
ggataatttt caggaagacc caatccagat gtctatgatc atttacagct gtctgaagga 720
agaaaggaaa attctggaaa acgcccagag atttaatcag gctcagtcgg ggaatattca 780
gagcacagtg atgttagaca aacagaaaga gcttgacagt aaagtcagaa atgtgaagga 840
caaggttatg tgtatagagc atgaaatcaa gagcctggaa gatttacaag atgaatatga 900
cttcaaatgc aaaaccttgc agaacagaga acacgagacc aatggtgtgg caaagagtga 960
tcagaaacaa gaacagctgt tactcaagaa gatgtattta atgcttgaca ataagagaaa 1020
ggaagtagtt cacaaaataa tagagttgct gaatgtcact gaacttaccc agaatgccct 1080
gattaatgat gaactagtgg agtggaagcg gagacagcag agcgcctgta ttggggggcc 1140
gcccaatgct tgcttggatc agctgcagaa ctggttcact atagttgcgg agagtctgca 1200
gcaagttcgg cagcagctta aaaagttgga ggaattggaa cagaaataca cctacgaaca 1260
tgaccctatc acaaaaaaca aacaagtgtt atgggaccgc accttcagtc ttttccagca 1320
gctcattcag agctcgtttg tggtggaaag acagccctgc atgccaacgc accctcagag 1380
gccgctggtc ttgaagacag gggtccagtt cactgtgaag ttgagactgt tggtgaaatt 1440
gcaagagctg aattataatt tgaaagtcaa agtcttattt gataaagatg tgaatgagag 1500
aaatacagta aaaggattta ggaagttcaa cattttgggc acgcacacaa aagtgatgaa 1560
catggaggag tccaccaatg gcagtctggc ggctgaattt cggcacctgc aattgaaaga 1620
acagaaaaat gctggcacca gaacgaatga gggtcctctc atcgttactg aagagcttca 1680
ctcccttagt tttgaaaccc aattgtgcca gcctggtttg gtaattgacc tcgagacgac 1740
ctctctgccc gttgtggtga tctccaacgt cagccagctc ccgagcggtt gggcctccat 1800
cctttggtac aacatgctgg tggcggaacc caggaatctg tccttcttcc tgactccacc 1860
atgtgcacga tgggctcagc tttcagaagt gctgagttgg cagttttctt ctgtcaccaa 1920
aagaggtctc aatgtggacc agctgaacat gttgggagag aagcttcttg gtcctaacgc 1980
cagccccgat ggtctcattc cgtggacgag gttttgtaag gaaaatataa atgataaaaa 2040
ttttcccttc tggctttgga ttgaaagcat cctagaactc attaaaaaac acctgctccc 2100
tctctggaat gatgggtgca tcatgggctt catcagcaag gagcgagagc gtgccctgtt 2160
gaaggaccag cagccgggga ccttcctgct gcggttcagt gagagctccc gggaaggggc 2220
catcacattc acatgggtgg agcggtccca gaacggaggc gaacctgact tccatgcggt 2280
tgaaccctac acgaagaaag aactttctgc tgttactttc cctgacatca ttcgcaatta 2340
caaagtcatg gctgctgaga atattcctga gaatcccctg aagtatctgt atccaaatat 2400
tgacaaagac catgcctttg gaaagtatta ctccaggcca aaggaagcac cagagccaat 2460
ggaacttgat ggccctaaag gaactggata tatcaagact gagttgattt ctgtgtctga 2520
agttcaccct tctagacttc agaccacaga caacctgctc cccatgtctc ctgaggagtt 2580
tgacgaggtg tctcggatag tgggctctgt agaattcgac agtatgatga acacagtata 2640
gagcatgaat ttttttcatc ttctctggcg acagttttcc ttctcatctg tgattccctc 2700
ctgctactct gttccttcac atcctgtgtt tctagggaaa tgaaagaaag gccagcaaat 2760
tcgctgcaac ctgttgatag caagtgaatt tttctctaac tcagaaacat cagttactct 2820
gaagggcatc atgcatctta ctgaaggtaa aattgaaagg cattctctga agagtgggtt 2880
tcacaagtga aaaacatcca gatacaccca aagtatcagg acgagaatga gggtcctttg 2940
ggaaaggaga agttaagcaa catctagcaa atgttatgca taaagtcagt gcccaactgt 3000
tataggttgt tggataaatc agtggttatt tagggaactg cttgacgtag gaacggtaaa 3060
tttctgtggg agaattctta catgttttct ttgctttaag tgtaactggc agttttccat 3120
tggtttacct gtgaaatagt tcaaagccaa gtttatatac aattatatca gtcctctttc 3180
aaaggtagcc atcatggatc tggtaggggg aaaatgtgta ttttattaca tctttcacat 3240
tggctattta aagacaaaga caaattctgt ttcttgagaa gagaatatta gctttactgt 3300
ttgttatggc ttaatgacac tagctaatat caatagaagg atgtacattt ccaaattcac 3360
aagttgtgtt tgatatccaa agctgaatac attctgcttt catcttggtc acatacaatt 3420
atttttacag ttctcccaag ggagttaggc tattcacaac cactcattca aaagttgaaa 3480
ttaaccatag atgtagataa actcagaaat ttaattcatg tttcttaaat gggctacttt 3540
gtcctttttg ttattagggt ggtatttagt ctattagcca caaaattggg aaaggagtag 3600
aaaaagcagt aactgacaac ttgaataata caccagagat aatatgagaa tcagatcatt 3660
tcaaaactca tttcctatgt aactgcattg agaactgcat atgtttcgct gatatatgtg 3720
tttttcacat ttgcgaatgg ttccattctc tctcctgtac tttttccaga cacttttttg 3780
agtggatgat gtttcgtgaa gtatactgta tttttacctt tttccttcct tatcactgac 3840
acaaaaagta gattaagaga tgggtttgac aaggttcttc ccttttacat actgctgtct 3900
atgtggctgt atcttgtttt tccactactg ctaccacaac tatattatca tgcaaatgct 3960
gtattcttct ttggtggaga taaagatttc ttgagttttg ttttaaaatt aaagctaaag 4020
tatctgtatt gcattaaata taatatgcac acagtgcttt ccgtggcact gcatacaatc 4080
tgaggcctcc tctctcagtt tttatataga tggcgagaac ctaagtttca gttgatttta 4140
caattgaaat gactaaaaaa caaagaagac aacattaaaa caatattgtt tctaattgct 4200
gaggtttagc tgtcagttct ttttgccctt tgggaattcg gcatggtttc attttactgc 4260
actagccaag agactttact tttaagaagt attaaaattc taaaattcaa aaaaaaaaaa 4320
aaaaaa 4326
<210> 35
<211> 931
<212> DNA
<213> Homo sapiens
<400> 35
tttcgtcggc ccgccccttg gcttctgcac tgatggtggg tggatgagta atgcatccag 60
gaagcctgga ggcctgtggt ttccgcaccc gctgccaccc ccgcccctag cgtggacatt 120
tatcctctag cgctcaggcc ctgccgccat cgccgcagat ccagcgccca gagagacacc 180
agagaaccca ccatggcccc ctttgagccc ctggcttctg gcatcctgtt gttgctgtgg 240
ctgatagccc ccagcagggc ctgcacctgt gtcccacccc acccacagac ggccttctgc 300
aattccgacc tcgtcatcag ggccaagttc gtggggacac cagaagtcaa ccagaccacc 360
ttataccagc gttatgagat caagatgacc aagatgtata aagggttcca agccttaggg 420
gatgccgctg acatccggtt cgtctacacc cccgccatgg agagtgtctg cggatacttc 480
cacaggtccc acaaccgcag cgaggagttt ctcattgctg gaaaactgca ggatggactc 540
ttgcacatca ctacctgcag ttttgtggct ccctggaaca gcctgagctt agctcagcgc 600
cggggcttca ccaagaccta cactgttggc tgtgaggaat gcacagtgtt tccctgttta 660
tccatcccct gcaaactgca gagtggcact cattgcttgt ggacggacca gctcctccaa 720
ggctctgaaa agggcttcca gtcccgtcac cttgcctgcc tgcctcggga gccagggctg 780
tgcacctggc agtccctgcg gtcccagata gcctgaatcc tgcccggagt ggaagctgaa 840
gcctgcacag tgtccaccct gttcccactc ccatctttct tccggacaat gaaataaaga 900
gttaccaccc agcagaaaaa aaaaaaaaaa a 931
<210> 36
<211> 3682
<212> DNA
<213> Homo sapiens
<400> 36
gcgagcgcag cggagcctgg agagaaggcg ctgggctgcg agggcgcgag ggcgcgaggg 60
cagggggcaa ccggaccccg cccgcaccca tggcgcccgt cgccgtctgg gccgcgctgg 120
ccgtcggact ggagctctgg gctgcggcgc acgccttgcc cgcccaggtg gcatttacac 180
cctacgcccc ggagcccggg agcacatgcc ggctcagaga atactatgac cagacagctc 240
agatgtgctg cagcaaatgc tcgccgggcc aacatgcaaa agtcttctgt accaagacct 300
cggacaccgt gtgtgactcc tgtgaggaca gcacatacac ccagctctgg aactgggttc 360
ccgagtgctt gagctgtggc tcccgctgta gctctgacca ggtggaaact caagcctgca 420
ctcgggaaca gaaccgcatc tgcacctgca ggcccggctg gtactgcgcg ctgagcaagc 480
aggaggggtg ccggctgtgc gcgccgctgc gcaagtgccg cccgggcttc ggcgtggcca 540
gaccaggaac tgaaacatca gacgtggtgt gcaagccctg tgccccgggg acgttctcca 600
acacgacttc atccacggat atttgcaggc cccaccagat ctgtaacgtg gtggccatcc 660
ctgggaatgc aagcatggat gcagtctgca cgtccacgtc ccccacccgg agtatggccc 720
caggggcagt acacttaccc cagccagtgt ccacacgatc ccaacacacg cagccaactc 780
cagaacccag cactgctcca agcacctcct tcctgctccc aatgggcccc agccccccag 840
ctgaagggag cactggcgac ttcgctcttc cagttggact gattgtgggt gtgacagcct 900
tgggtctact aataatagga gtggtgaact gtgtcatcat gacccaggtg aaaaagaagc 960
ccttgtgcct gcagagagaa gccaaggtgc ctcacttgcc tgccgataag gcccggggta 1020
cacagggccc cgagcagcag cacctgctga tcacagcgcc gagctccagc agcagctccc 1080
tggagagctc ggccagtgcg ttggacagaa gggcgcccac tcggaaccag ccacaggcac 1140
caggcgtgga ggccagtggg gccggggagg cccgggccag caccgggagc tcagattctt 1200
cccctggtgg ccatgggacc caggtcaatg tcacctgcat cgtgaacgtc tgtagcagct 1260
ctgaccacag ctcacagtgc tcctcccaag ccagctccac aatgggagac acagattcca 1320
gcccctcgga gtccccgaag gacgagcagg tccccttctc caaggaggaa tgtgcctttc 1380
ggtcacagct ggagacgcca gagaccctgc tggggagcac cgaagagaag cccctgcccc 1440
ttggagtgcc tgatgctggg atgaagccca gttaaccagg ccggtgtggg ctgtgtcgta 1500
gccaaggtgg gctgagccct ggcaggatga ccctgcgaag gggccctggt ccttccaggc 1560
ccccaccact aggactctga ggctctttct gggccaagtt cctctagtgc cctccacagc 1620
cgcagcctcc ctctgacctg caggccaaga gcagaggcag cgagttgtgg aaagcctctg 1680
ctgccatggc gtgtccctct cggaaggctg gctgggcatg gacgttcggg gcatgctggg 1740
gcaagtccct gactctctgt gacctgcccc gcccagctgc acctgccagc ctggcttctg 1800
gagcccttgg gttttttgtt tgtttgtttg tttgtttgtt tgtttctccc cctgggctct 1860
gccccagctc tggcttccag aaaaccccag catccttttc tgcagagggg ctttctggag 1920
aggagggatg ctgcctgagt cacccatgaa gacaggacag tgcttcagcc tgaggctgag 1980
actgcgggat ggtcctgggg ctctgtgcag ggaggaggtg gcagccctgt agggaacggg 2040
gtccttcaag ttagctcagg aggcttggaa agcatcacct caggccaggt gcagtggctc 2100
acgcctatga tcccagcact ttgggaggct gaggcgggtg gatcacctga ggttaggagt 2160
tcgagaccag cctggccaac atggtaaaac cccatctcta ctaaaaatac agaaattagc 2220
cgggcgtggt ggcgggcacc tatagtccca gctactcaga agcctgaggc tgggaaatcg 2280
tttgaacccg ggaagcggag gttgcaggga gccgagatca cgccactgca ctccagcctg 2340
ggcgacagag cgagagtctg tctcaaaaga aaaaaaaaag caccgcctcc aaatgccaac 2400
ttgtcctttt gtaccatggt gtgaaagtca gatgcccaga gggcccaggc aggccaccat 2460
attcagtgct gtggcctggg caagataacg cacttctaac tagaaatctg ccaatttttt 2520
aaaaaagtaa gtaccactca ggccaacaag ccaacgacaa agccaaactc tgccagccac 2580
atccaacccc ccacctgcca tttgcaccct ccgccttcac tccggtgtgc ctgcagcccc 2640
gcgcctcctt ccttgctgtc ctaggccaca ccatctcctt tcagggaatt tcaggaacta 2700
gagatgactg agtcctcgta gccatctctc tactcctacc tcagcctaga ccctcctcct 2760
cccccagagg ggtgggttcc tcttccccac tccccacctt caattcctgg gccccaaacg 2820
ggctgccctg ccactttggt acatggccag tgtgatccca agtgccagtc ttgtgtctgc 2880
gtctgtgttg cgtgtcgtgg gtgtgtgtag ccaaggtcgg taagttgaat ggcctgcctt 2940
gaagccactg aagctgggat tcctccccat tagagtcagc cttccccctc ccagggccag 3000
ggccctgcag aggggaaacc agtgtagcct tgcccggatt ctgggaggaa gcaggttgag 3060
gggctcctgg aaaggctcag tctcaggagc atggggataa aggagaaggc atgaaattgt 3120
ctagcagagc aggggcaggg tgataaattg ttgataaatt ccactggact tgagcttggc 3180
agctgaacta ttggagggtg ggagagccca gccattacca tggagacaag aagggttttc 3240
caccctggaa tcaagatgtc agactggctg gctgcagtga cgtgcacctg tactcaggag 3300
gctgagggga ggatcactgg agcccaggag tttgaggctg cagcgagcta tgatcgcgcc 3360
actacactcc agcctgagca acagagtgag accctgtctc ttaaagaaaa aaaaagtcag 3420
actgctggga ctggccaggt ttctgcccac attggaccca catgaggaca tgatggagcg 3480
cacctgcccc ctggtggaca gtcctgggag aacctcaggc ttccttggca tcacagggca 3540
gagccgggaa gcgatgaatt tggagactct gtggggcctt ggttcccttg tgtgtgtgtg 3600
ttgatcccaa gacaatgaaa gtttgcactg tatgctggac ggcattcctg cttatcaata 3660
aacctgtttg ttttaaaaaa aa 3682
<210> 37
<211> 1669
<212> DNA
<213> Homo sapiens
<400> 37
gaggtataag agcctccaag tctgcagctc tcgcccaact cccagacacc tcgcgggctc 60
tgcagcaccg gcaccgtttc caggaggcct ggcggggtgt gcgtccagcc gttgggcgct 120
ttctttttgg acctcggggc catccacacc gtcccctccc cctcccgcct ccctccccgc 180
ctcccccgcg cgccctcccc gcggaggtcc ctcccgtccg tcctcctgct ctctcctccg 240
cgggccgcat cgcccgggcc ggcgccgcgc gcgggggaag ctggcgggct gaggcgcccc 300
gctcttctcc tctgccccgg gcccgcgagg ccacgcgtcg ccgctcgaga gatgatgcag 360
gacgtgtcca gctcgccagt ctcgccggcc gacgacagcc tgagcaacag cgaggaagag 420
ccagaccggc agcagccgcc gagcggcaag cgcgggggac gcaagcggcg cagcagcagg 480
cgcagcgcgg gcggcggcgc ggggcccggc ggagccgcgg gtgggggcgt cggaggcggc 540
gacgagccgg gcagcccggc ccagggcaag cgcggcaaga agtctgcggg ctgtggcggc 600
ggcggcggcg cgggcggcgg cggcggcagc agcagcggcg gcgggagtcc gcagtcttac 660
gaggagctgc agacgcagcg ggtcatggcc aacgtgcggg agcgccagcg cacccagtcg 720
ctgaacgagg cgttcgccgc gctgcggaag atcatcccca cgctgccctc ggacaagctg 780
agcaagattc agaccctcaa gctggcggcc aggtacatcg acttcctcta ccaggtcctc 840
cagagcgacg agctggactc caagatggca agctgcagct atgtggctca cgagcggctc 900
agctacgcct tctcggtctg gaggatggag ggggcctggt ccatgtccgc gtcccactag 960
caggcggagc cccccacccc ctcagcaggg ccggagacct agatgtcatt gtttccagag 1020
aaggagaaaa tggacagtct agagactctg gagctggata actaaaaata aaaatatatg 1080
ccaaagattt tcttggaaat tagaagagca aaatccaaat tcaaagaaac agggcgtggg 1140
gcgcactttt aaaagagaaa gcgagacagg cccgtggaca gtgattccca gacgggcagc 1200
ggcaccatcc tcacacctct gcattctgat agaagtctga acagttgttt gtgttttttt 1260
tttttttttt tttgacgaag aatgttttta tttttatttt tttcatgcat gcattctcaa 1320
gaggtcgtgc caatcagcca ctgaaaggaa aggcatcact atggactttc tctattttaa 1380
aatggtaaca atcagaggaa ctataagaac acctttagaa ataaaaatac tgggatcaaa 1440
ctggcctgca aaaccatagt cagttaattc tttttttcat ccttcctctg aggggaaaaa 1500
caaaaaaaaa cttaaaatac aaaaaacaac attctattta tttattgagg acccatggta 1560
aaatgcaaat agatccggtg tctaaatgca ttcatatttt tatgattgtt ttgtaaatat 1620
ctttgtatat ttttctgcaa taaataaata taaaaaattt agagaaaaa 1669
<210> 38
<211> 2195
<212> DNA
<213> Homo sapiens
<400> 38
aagaaaaacc ttcccggtgc aatcgtgatc tgggaggccc acgtatggcg cctctccaaa 60
ggctgcagaa gtttcttgct aacaaaaagt ccgcacattc gagcaaagac aggctttagc 120
gagttattaa aaacttaggg gcgctcttgt cccccacagg gcccgaccgc acacagcaag 180
gcgatggccc agctgtaagt tggtagcact gagaactagc agcgcgcgcg gagcccgctg 240
agacttgaat caatctggtc taacggtttc ccctaaaccg ctaggagccc tcaatcggcg 300
ggacagcagg gcgcgtcctc tgccactctc gctccgaggt ccccgcgcca gagacgcagc 360
cgcgctccca ccacccacac ccaccgcgcc ctcgttcgcc tcttctccgg gagccagtcc 420
gcgccaccgc cgccgcccag gccatcgcca ccctccgcag ccatgtccac caggtccgtg 480
tcctcgtcct cctaccgcag gatgttcggc ggcccgggca ccgcgagccg gccgagctcc 540
agccggagct acgtgactac gtccacccgc acctacagcc tgggcagcgc gctgcgcccc 600
agcaccagcc gcagcctcta cgcctcgtcc ccgggcggcg tgtatgccac gcgctcctct 660
gccgtgcgcc tgcggagcag cgtgcccggg gtgcggctcc tgcaggactc ggtggacttc 720
tcgctggccg acgccatcaa caccgagttc aagaacaccc gcaccaacga gaaggtggag 780
ctgcaggagc tgaatgaccg cttcgccaac tacatcgaca aggtgcgctt cctggagcag 840
cagaataaga tcctgctggc cgagctcgag cagctcaagg gccaaggcaa gtcgcgcctg 900
ggggacctct acgaggagga gatgcgggag ctgcgccggc aggtggacca gctaaccaac 960
gacaaagccc gcgtcgaggt ggagcgcgac aacctggccg aggacatcat gcgcctccgg 1020
gagaaattgc aggaggagat gcttcagaga gaggaagccg aaaacaccct gcaatctttc 1080
agacaggatg ttgacaatgc gtctctggca cgtcttgacc ttgaacgcaa agtggaatct 1140
ttgcaagaag agattgcctt tttgaagaaa ctccacgaag aggaaatcca ggagctgcag 1200
gctcagattc aggaacagca tgtccaaatc gatgtggatg tttccaagcc tgacctcacg 1260
gctgccctgc gtgacgtacg tcagcaatat gaaagtgtgg ctgccaagaa cctgcaggag 1320
gcagaagaat ggtacaaatc caagtttgct gacctctctg aggctgccaa ccggaacaat 1380
gacgccctgc gccaggcaaa gcaggagtcc actgagtacc ggagacaggt gcagtccctc 1440
acctgtgaag tggatgccct taaaggaacc aatgagtccc tggaacgcca gatgcgtgaa 1500
atggaagaga actttgccgt tgaagctgct aactaccaag acactattgg ccgcctgcag 1560
gatgagattc agaatatgaa ggaggaaatg gctcgtcacc ttcgtgaata ccaagacctg 1620
ctcaatgtta agatggccct tgacattgag attgccacct acaggaagct gctggaaggc 1680
gaggagagca ggatttctct gcctcttcca aacttttcct ccctgaacct gagggaaact 1740
aatctggatt cactccctct ggttgatacc cactcaaaaa ggacacttct gattaagacg 1800
gttgaaacta gagatggaca ggttatcaac gaaacttctc agcatcacga tgaccttgaa 1860
taaaaattgc acacactcag tgcagcaata tattaccagc aagaataaaa aagaaatcca 1920
tatcttaaag aaacagcttt caagtgcctt tctgcagttt ttcaggagcg caagatagat 1980
ttggaatagg aataagctct agttcttaac aaccgacact cctacaagat ttagaaaaaa 2040
gtttacaaca taatctagtt tacagaaaaa tcttgtgcta gaatactttt taaaaggtat 2100
tttgaatacc attaaaactg cttttttttt tccagcaagt atccaaccaa cttggttctg 2160
cttcaataaa tctttggaaa aactctttta aaaaa 2195
<210> 39
<211> 5998
<212> DNA
<213> Homo sapiens
<400> 39
gggggggaag ggggagggag ggggaggagg tgactcgagc atttagacac aagcgagagg 60
atcatggcgg atggccccag gtgtaagcgc agaaagcagg cgaacccgcg gcgcaataac 120
gttacaaatt ataatactgt ggtagaaaca aattcagatt cagatgatga agacaaactg 180
catattgtgg aagaagaaag tgttacagat gcagctgact gtgaaggtgt accagaggat 240
gacctgccaa cagaccagac agtgttacca gggaggagca gtgaaagaga agggaatgct 300
aagaactgct gggaggatga cagaaaggaa gggcaagaaa tcctggggcc tgaagctcag 360
gcagatgaag caggatgtac agtaaaagat gatgaatgcg agtcagatgc agaaaatgag 420
caaaaccatg atcctaatgt tgaagagttt ctacaacaac aagacactgc tgtcattttt 480
cctgaggcac ctgaagagga ccagaggcag ggcacaccag aagccagtgg tcatgatgaa 540
aatggaacac cagatgcatt ttcacaatta ctcacctgtc catattgtga tagaggctat 600
aaacgcttta cctctctgaa agaacacatt aaatatcgtc atgaaaagaa tgaagataac 660
tttagttgct ccctgtgcag ttacaccttt gcatacagaa cccaacttga acgtcacatg 720
acatcacata aatcaggaag agatcaaaga catgtgacgc agtctgggtg taatcgtaaa 780
ttcaaatgca ctgagtgtgg aaaagctttc aaatacaaac atcacctaaa agagcactta 840
agaattcaca gtggagagaa gccatatgaa tgcccaaact gcaagaaacg cttttcccat 900
tctggctcct atagctcaca cataagcagt aagaaatgta tcagcttgat acctgtgaat 960
gggcgaccaa gaacaggact caagacatct cagtgttctt caccgtctct ttcagcatca 1020
ccaggcagtc ccacacgacc acagatacgg caaaagatag agaataaacc ccttcaagaa 1080
caactttctg ttaaccaaat taaaactgaa cctgtggatt atgaattcaa acccatagtg 1140
gttgcttcag gaatcaactg ttcaacccct ttacaaaatg gggttttcac tggtggtggc 1200
ccattacagg caaccagttc tcctcagggc atggtgcaag ctgttgttct gccaacagtt 1260
ggtttggtgt ctcccataag tatcaattta agtgatattc agaatgtact taaagtggcg 1320
gtagatggta atgtaataag gcaagtgttg gagaataatc aagccaatct tgcatccaaa 1380
gaacaagaaa caatcaatgc ttcacccata caacaaggtg gccattctgt tatttcagcc 1440
atcagtcttc ctttggttga tcaagatgga acaaccaaaa ttatcatcaa ctacagtctt 1500
gagcagccta gccaacttca agttgttcct caaaatttaa aaaaagaaaa tccagtcgct 1560
acaaacagtt gtaaaagtga aaagttacca gaagatctta ctgttaagtc tgagaaggac 1620
aaaagctttg aagggggggt gaatgatagc acttgtcttc tgtgtgatga ttgtccagga 1680
gatattaatg cacttccaga attaaagcac tatgacctaa agcagcctac tcagcctcct 1740
ccactccctg cagcagaagc tgagaagcct gagtcctctg tttcatcagc tactggagat 1800
ggcaatttgt ctcctagtca gccaccttta aagaacctct tgtctctcct aaaagcatat 1860
tatgctttga atgcacaacc aagtgcagaa gagctctcaa aaattgctga ttcagtaaac 1920
ctaccactgg atgtagtaaa aaagtggttt gaaaagatgc aagctggaca gatttcagtg 1980
cagtcttctg aaccatcttc tcctgaacca ggcaaagtaa atatccctgc caagaacaat 2040
gatcagcctc aatctgcaaa tgcaaatgaa ccccaggaca gcacagtaaa tctacaaagt 2100
cctttgaaga tgactaactc cccagtttta ccagtgggat caaccaccaa tggttccaga 2160
agtagtacac catccccatc acctctaaac ctttcctcat ccagaaatac acagggttac 2220
ttgtacacag ctgagggtgc acaagaagag ccacaagtag aacctcttga tctttcacta 2280
ccaaagcaac agggagaatt attagaaagg tcaactatca ctagtgttta ccagaacagt 2340
gtttattctg tccaggaaga acccttgaac ttgtcttgcg caaaaaagga gccacaaaag 2400
gacagttgtg ttacagactc agaaccagtt gtaaatgtaa tcccaccaag tgccaacccc 2460
ataaatatcg ctatacctac agtcactgcc cagttaccca caatcgtggc cattgctgac 2520
cagaacagtg ttccatgctt aagagcgcta gctgccaata agcaaacgat tctgattccc 2580
caggtggcat acacctactc aactacggtc agccctgcag tccaagaacc acccttgaaa 2640
gtgatccagc caaatggaaa tcaggatgaa agacaagata ctagctcaga aggagtatca 2700
aatgtagagg atcagaatga ctctgattct acaccgccca aaaagaaaat gcggaagaca 2760
gaaaatggaa tgtatgcttg tgatttgtgt gacaagatat tccaaaagag tagttcatta 2820
ttgagacata aatatgaaca cacaggtaaa agacctcatg agtgtggaat ctgtaaaaag 2880
gcatttaaac acaaacatca tttgattgaa cacatgcgat tacattctgg agaaaagccc 2940
tatcaatgtg acaaatgtgg aaagcgcttc tcacactctg ggtcttattc tcaacacatg 3000
aatcatcgct actcctactg taagagagaa gcggaagaac gtgacagcac agagcaggaa 3060
gaggcagggc ctgaaatcct ctcgaatgag cacgtgggtg ccagggcgtc tccctcacag 3120
ggcgactcgg acgagagaga gagtttgaca agggaagagg atgaagacag tgaaaaagag 3180
gaagaggagg aggataaaga gatggaagaa ttgcaggaag aaaaagaatg tgaaaaacca 3240
caaggggatg aggaagagga ggaggaggag gaagaagtgg aagaagaaga ggtagaagag 3300
gcagagaatg agggagaaga agcaaaaact gaaggtctga tgaaggatga cagggctgaa 3360
agtcaagcaa gcagcttagg acaaaaagta ggcgagagta gtgagcaagt gtctgaagaa 3420
aagacaaatg aagcctaatc gtttttctag aaggaaaata aattctaatt gataatgaat 3480
ttcgttcaat attatccttg cttttcatgg aaacacagta acctgtatgc tgtgattcct 3540
gttcactact gtgtaaagta aaaactaaaa aaatacaaaa tacaaaacac acacacacac 3600
acacacacac acacacacac acacacaaaa taaatccggg tgtgcctgaa cctcagacct 3660
agtaattttt catgcagttt tcaaagttag gaacaagttt gtaacatgca gcagattaga 3720
aaaccttaat gactcagaga gcaacaatac aagaggttaa aggaagctga ttaattagat 3780
atgcatctgg cattgtttta tcttatcagt attatcactc ttatgttggt ttattcttaa 3840
gctgtacaat tgggagaaat tttataattt tttattggta aacatatgct aaatccgctt 3900
cagtatttta ttatgttttt taaaatgtga gaacttctgc actacaaaat tcccttcaca 3960
gagaagtata atgtagttcc aacccgtgct aactaccttt tataaattca gtctagaagg 4020
tagtaatttc taatatttag atgtcttagt agagcgtatt atcatttaaa gtgtattgtt 4080
agccttaaga aagcagctga tagaagaact gaagtttctt actcacgtgg tttaaaatgg 4140
agttcaaaag attgccattg agttctgatt gcagggacta acaatgttaa tctgataagg 4200
acagcaaaat catcagaatc agtgtttgtg attgtgtttg aatatgtggt aacatatgaa 4260
ggatatgaca tgaagctttg tatctccttt ggccttaagc aagacctgtg tgctgtaagt 4320
gccatttctc agtattttca aggctctaac ccgccttcat ccaatgtgtg gcctacaata 4380
actagcattt gttgatttgt ctcttgtatc aaaattccca aataaaactt aaaaccactg 4440
actctgtcag agaaactgaa acactgggac atttcatcct tcaattcctc ggtattgatt 4500
ttatgttgat tgattttcag aatttctcta cagaaacgaa agggaaattt tctaatctgc 4560
tttatccatg tacttgcatt tcagacatgg acatgctatt gttatttggc tcataactgt 4620
ttccaaatgt tagttattat ggacccaatt tattaacaac attagctgat ttttacctat 4680
cagtattatt ttatttcttt tagtttatag atctgtgcaa catttttgta ctgtatgtct 4740
tcaaacctgg cagtattaat acccttctta ctgacatatg tacttttagt tttagaaaac 4800
ttttatattt atgtgtctta tttttatatt tctttattta ttacacagtg tagtgtataa 4860
tactgtagtt tgtattaata caataatata ttttagtatg aaaatttgga aagttgataa 4920
gatttaaagt agagatgcaa ttggttctcc tgcattgaga tttgatttaa cagtgttatg 4980
ttaacattta tacttgcctt ggactgtaga acagaactta aatgggaatg tattagtttt 5040
acaactacaa tcaagtcatt ttacctttac ccagttttta atataaaact taaattttga 5100
aattcactgt gtgactaata gcatgatgct ctgcagtttt attaagaaat cagcctaacc 5160
atacaactct catttcctta gtaagccaaa ttaggattaa cttctataaa cagtgttggg 5220
aacaatgttt aacattttgt gccaatttgt tcctgtattc atgtatgtaa gttacagatc 5280
tgactcttca tttttaagtt ccttgttaca tcatggtcat tttctagttt tttaccagac 5340
tcccatctca caataaaatg catcaacaag cctgaactgc tgtcattctt ttcatcatta 5400
tcagtatttt ctttggaaaa ctgtgaaatg gggtacattg tcatcctgca tttgattcat 5460
cttgagctga atttgggtaa cactaaatgt tttagacatt ctccactaaa ttatggattt 5520
tcttgtggct aaatgtttct ggagaggtca gagttgacaa aacctcttca caggttgctc 5580
cttcttcctg aaatccttaa tcctccgcat ttcatgcttc aggtcatttc agggaagcct 5640
gggtttagat gcctttctga ctctcagctc ctgcacttct gtcatcatac ctctgatact 5700
attatttata ttccttcccc actaggaaca ggaaccacat ttgtcatagt cactctcaca 5760
ttcctcactg cctaacaggg tgcctggcat aagttgggac aacagatatt tgttgaataa 5820
aaatataatt tgcatgttta tggagctcag ctatgttctc actttttttg cttctaattc 5880
cagaatatat gttaaatgat ctaataattt gattattttc ttataagtct tattaaacac 5940
tagtcataat agacacaata aattatgcct tctttttcta ttgccttaaa aaaaaaaa 5998

Claims (16)

1.一种由数字处理装置执行的用于推测对象中JAK-STAT3细胞信号传导途径的活性的计算机执行方法,其中所述推测包括:
接收在所述对象的样品中测量的JAK-STAT3细胞信号传导途径的三个或更多个靶基因的表达水平,
确定所述对象的样品中JAK-STAT3转录因子(TF)元件的活性水平,所述JAK-STAT3 TF元件控制所述三个或更多个JAK-STAT3靶基因的转录,所述确定基于评估将所述三个或更多个JAK-STAT3靶基因的表达水平与JAK-STAT3 TF元件的活性水平相关联的经校准的数学途径模型,以及
基于在所述对象的样品中确定的所述JAK-STAT3 TF元件的活性水平推测所述对象中JAK-STAT3细胞信号传导途径的活性,
其中所述三个或更多个JAK-STAT3靶基因选自:BCL2L1、BIRC5、CCND1、CD274、FOS、HIF1A、HSP90AA1、HSP90AB1、MMP1和MYC,或者选自:BCL2L1、CD274、FOS、HSP90B1、HSPA1B、ICAM1、IFNG、JunB、PTGS2、STAT1、TNFRSF1B和ZEB1。
2.权利要求1的方法,其中所述三个和更多个JAK-STAT3靶基因包括选自:BCL2L1、BIRC5、CCND1、CD274、FOS、HIF1A、HSP90AA1、HSP90AB1、MMP1和MYC的六个或更多个JAK-STAT3靶基因,或者选自:BCL2L1、CD274、FOS、HSP90B1、HSPA1B、ICAM1、IFNG、JunB、PTGS2、STAT1、TNFRSF1B和ZEB1的六个或更多个JAK-STAT3靶基因。
3.权利要求1或2的方法,其中选自BCL2L1、BIRC5、CCND1、CD274、FOS、HIF1A、HSP90AA1、HSP90AB1、MMP1和MYC的所述三个或更多个JAK-STAT3靶基因是基于它们在实体瘤、优选上皮样品中区分JAK-STAT3细胞信号传导途径活性是活跃的还是非活跃的能力而选择的,和/或被用于在实体瘤、优选肺样品上校准的经校准的数学途径模型中,或者其中选自BCL2L1、CD274、FOS、HSP90B1、HSPA1B、ICAM1、IFNG、JunB、PTGS2、STAT1、TNFRSF1B和ZEB1的所述三个或更多个JAK-STAT3靶基因是基于它们在血液样品中区分JAK-STAT3细胞信号传导途径活性是活跃的还是非活跃的能力而选择的,和/或被用于在血液样品上校准的经校准的数学途径模型中。
4.权利要求1的方法,进一步包括:
基于推测的所述对象中JAK-STAT3细胞信号传导途径的活性确定所述对象中JAK-STAT3细胞信号传导途径是否异常运行。
5.权利要求4的方法,进一步包括:
为所述对象推荐处方药物,以校正JAK-STAT3细胞信号传导途径的异常运行,
其中如果基于推测的JAK-STAT3细胞信号传导途径的活性确定JAK-STAT3细胞信号传导途径在所述对象中异常运行,则进行所述推荐。
6.权利要求4或5的方法,其中所述JAK-STAT3细胞信号传导途径的异常运行是其中JAK-STAT3细胞信号传导途径在所述对象中作为肿瘤促进物的运行。
7.权利要求1-6任一项的方法,其中所述方法被用于至少一项以下活动中:
基于推测的对象中JAK-STAT3细胞信号传导途径的活性的诊断;
基于推测的对象中JAK-STAT3细胞信号传导途径的活性的预后;
基于推测的对象中JAK-STAT3细胞信号传导途径的活性的药物处方;
基于推测的对象中JAK-STAT3细胞信号传导途径的活性的药物功效预测;
基于推测的对象中JAK-STAT3细胞信号传导途径的活性的不良反应的预测;
监测药物功效;
药物开发;
测定开发;
途径研究;
癌症分期;
基于推测的对象中JAK-STAT3细胞信号传导途径的活性的临床试验对象招募;
要进行的后续检测的选择;和
伴随诊断检测的选择。
8.权利要求1-7任一项的方法,其中所述经校准的数学途径模型是基于将所述JAK-STAT3 TF元件的活性水平与所述三个或更多个JAK-STAT3靶基因的表达水平相关联的条件概率的概率模型,优选贝叶斯网络模型,或者其中所述数学途径模型基于所述三个或更多个JAK-STAT3靶基因的表达水平的一或多个线性组合。
9.一种用于推测对象中JAK-STAT3细胞信号传导途径的活性的设备,其包括配置为执行权利要求1-8任一项的方法的数字处理器。
10.一种用于推测对象中JAK-STAT3细胞信号传导途径的活性的非暂时存储介质,其存储可由数字处理装置执行的执行权利要求1-8任一项的方法的指令。
11.一种用于推测对象中JAK-STAT3细胞信号传导途径的活性的计算机程序,其包含程序代码模块,当所述计算机程序在数字处理装置上运行时,所述程序代码模块使所述数字处理装置执行权利要求1-8任一项的方法。
12.一种用于在对象的样品中测量JAK-STAT3细胞信号传导途径的三个或更多个靶基因的表达水平的试剂盒,包括:
针对所述三个或更多个JAK-STAT3靶基因的聚合酶链反应引物,
针对所述三个或更多个JAK-STAT3靶基因的探针,和
权利要求9的设备、权利要求10的非暂时存储介质或权利要求11的计算机程序,
其中所述三个或更多个JAK-STAT3靶基因选自:BCL2L1、BIRC5、CCND1、CD274、FOS、HIF1A、HSP90AA1、HSP90AB1、MMP1和MYC,或者选自:BCL2L1、CD274、FOS、HSP90B1、HSPA1B、ICAM1、IFNG、JunB、PTGS2、STAT1、TNFRSF1B和ZEB1。
13.一种用于推测对象中JAK-STAT3细胞信号传导途径的活性的试剂盒,包括:
用于确定所述对象的样品中JAK-STAT3细胞信号传导途径的三个或更多个靶基因的表达水平的一或多个组分,和
权利要求9的设备、权利要求10的非暂时存储介质或权利要求11的计算机程序,
其中所述一或多个组分优选选自:DNA阵列芯片,寡核苷酸阵列芯片,蛋白质阵列芯片,抗体,多个探针例如标记的探针,一组RNA逆转录酶测序组分,和/或RNA或DNA包括cDNA,扩增引物,
其中所述三个或更多个JAK-STAT3靶基因选自:BCL2L1、BIRC5、CCND1、CD274、FOS、HIF1A、HSP90AA1、HSP90AB1、MMP1和MYC,或者选自:BCL2L1、CD274、FOS、HSP90B1、HSPA1B、ICAM1、IFNG、JunB、PTGS2、STAT1、TNFRSF1B和ZEB1。
14.权利要求12或13的试剂盒,其中所述三个或更多个JAK-STAT3靶基因包含选自:BCL2L1、BIRC5、CCND1、CD274、FOS、HIF1A、HSP90AA1、HSP90AB1、MMP1和MYC的六个或更多个JAK-STAT3靶基因,或者选自:BCL2L1、CD274、FOS、HSP90B1、HSPA1B、ICAM1、IFNG、JunB、PTGS2、STAT1、TNFRSF1B和ZEB1的六个或更多个JAK-STAT3靶基因。
15.权利要求12-14任一项的试剂盒,其中选自BCL2L1、BIRC5、CCND1、CD274、FOS、HIF1A、HSP90AA1、HSP90AB1、MMP1和MYC的所述三个或更多个JAK-STAT3靶基因是基于它们在实体瘤、优选上皮样品中区分JAK-STAT3细胞信号传导途径的活性是活跃的还是非活跃的能力而选择的,或者其中选自BCL2L1、CD274、FOS、HSP90B1、HSPA1B、ICAM1、IFNG、JunB、PTGS2、STAT1、TNFRSF1B和ZEB1的所述三个或更多个JAK-STAT3靶基因是基于它们在血液样品中区分JAK-STAT3细胞信号传导途径的活性是活跃的还是非活跃的能力而选择的。
16.权利要求12-15任一项的试剂盒在进行权利要求1-8任一项的方法中的用途。
CN201880077951.5A 2017-10-02 2018-09-27 使用靶基因表达的数学建模评估jak-stat3细胞信号传导途径活性 Pending CN111448325A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP17194293.1A EP3461916A1 (en) 2017-10-02 2017-10-02 Assessment of jak-stat3 cellular signaling pathway activity using mathematical modelling of target gene expression
EP17194293.1 2017-10-02
PCT/EP2018/076232 WO2019068543A1 (en) 2017-10-02 2018-09-27 EVALUATION OF THE ACTIVITY OF THE JAK-STAT3 CELL SIGNALING PATH USING THE MATHEMATICAL MODELING OF THE TARGET GENE EXPRESSION

Publications (1)

Publication Number Publication Date
CN111448325A true CN111448325A (zh) 2020-07-24

Family

ID=60119806

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880077951.5A Pending CN111448325A (zh) 2017-10-02 2018-09-27 使用靶基因表达的数学建模评估jak-stat3细胞信号传导途径活性

Country Status (5)

Country Link
US (1) US20190102510A1 (zh)
EP (2) EP3461916A1 (zh)
JP (1) JP2020535823A (zh)
CN (1) CN111448325A (zh)
WO (1) WO2019068543A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112795650A (zh) * 2014-01-03 2021-05-14 皇家飞利浦有限公司 使用靶基因表达的数学建模评价pi3k细胞信号传导途径活性

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3882363A1 (en) 2020-03-17 2021-09-22 Koninklijke Philips N.V. Prognostic pathways for high risk sepsis patients
EP3978628A1 (en) 2020-10-01 2022-04-06 Koninklijke Philips N.V. Prognostic pathways for viral infections
EP4136261A1 (en) 2020-04-16 2023-02-22 InnoSIGN B.V. Prognostic pathways for viral infections
EP3940704A1 (en) 2020-07-14 2022-01-19 Koninklijke Philips N.V. Method for determining the differentiation state of a stem cell
EP3960875A1 (en) 2020-08-28 2022-03-02 Koninklijke Philips N.V. Pcr method and kit for determining pathway activity
EP3974540A1 (en) 2020-09-25 2022-03-30 Koninklijke Philips N.V. Method for predicting immunotherapy resistance
EP4015651A1 (en) 2020-12-17 2022-06-22 Koninklijke Philips N.V. Treatment prediction and effectiveness of anti-tnf alpha treatment in ibd patients
EP4039825A1 (en) * 2021-02-09 2022-08-10 Koninklijke Philips N.V. Comparison and standardization of cell and tissue culture
JP2024514404A (ja) 2021-03-11 2024-04-02 コーニンクレッカ フィリップス エヌ ヴェ 高リスク敗血症患者のための予後経路

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016062899A1 (de) * 2014-10-25 2016-04-28 Cryptosource Gmbh Verfahren zur effizienten verwaltung des flüchtigen speichers auf ressourcenbeschränkten datenverarbeitungsmaschinen
US20160117439A1 (en) * 2014-10-24 2016-04-28 Koninklijke Philips N.V. Superior bioinformatics process for identifying at risk subject populations

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4711955A (en) 1981-04-17 1987-12-08 Yale University Modified nucleotides and methods of preparing and using same
US5660985A (en) 1990-06-11 1997-08-26 Nexstar Pharmaceuticals, Inc. High affinity nucleic acid ligands containing modified nucleotides
US5436134A (en) 1993-04-13 1995-07-25 Molecular Probes, Inc. Cyclic-substituted unsymmetrical cyanine dyes
US5658751A (en) 1993-04-13 1997-08-19 Molecular Probes, Inc. Substituted unsymmetrical cyanine dyes with selected permeability
US6783934B1 (en) 2000-05-01 2004-08-31 Cepheid, Inc. Methods for quantitative analysis of nucleic acid amplification reaction
AU2002307217A1 (en) * 2001-03-28 2002-10-15 University Of South Florida Materials and methods for treatment of cancer and identification of anti-cancer compounds
JP2005176804A (ja) * 2003-12-24 2005-07-07 Japan Health Science Foundation Stat3の活性化能を指標とする肝疾患治療剤のスクリーニング法
KR20110033922A (ko) * 2008-07-08 2011-04-01 더 보드 오브 리전츠 오브 더 유니버시티 오브 텍사스 시스템 전사의 신호 변환자 및 활성제(stats)의 증식 및 활성화의 신규한 억제제
WO2010056735A1 (en) * 2008-11-11 2010-05-20 The Trustees Of The University Of Pennsylvania Compositions and methods for inhibiting an oncogenic protein to enhance immunogenicity
EP2549399A1 (en) 2011-07-19 2013-01-23 Koninklijke Philips Electronics N.V. Assessment of Wnt pathway activity using probabilistic modeling of target gene expression
RU2721130C2 (ru) 2012-12-26 2020-05-18 Конинклейке Филипс Н.В. Оценка активности путей клеточной сигнализации с помощью линейной комбинации(ий) экспрессий генов-мишеней
WO2015050844A1 (en) * 2013-10-01 2015-04-09 Dana-Farber Cancer Institute, Inc. Methods of treating cancer with atovaquone-related compounds
AU2015334840B2 (en) * 2014-10-24 2021-10-21 Innosign B.V. Assessment of TGF-beta cellular signaling pathway activity using mathematical modelling of target gene expression

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160117439A1 (en) * 2014-10-24 2016-04-28 Koninklijke Philips N.V. Superior bioinformatics process for identifying at risk subject populations
WO2016062899A1 (de) * 2014-10-25 2016-04-28 Cryptosource Gmbh Verfahren zur effizienten verwaltung des flüchtigen speichers auf ressourcenbeschränkten datenverarbeitungsmaschinen

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112795650A (zh) * 2014-01-03 2021-05-14 皇家飞利浦有限公司 使用靶基因表达的数学建模评价pi3k细胞信号传导途径活性

Also Published As

Publication number Publication date
EP3692172B1 (en) 2022-12-21
US20190102510A1 (en) 2019-04-04
EP3461916A1 (en) 2019-04-03
WO2019068543A1 (en) 2019-04-11
EP3692172A1 (en) 2020-08-12
JP2020535823A (ja) 2020-12-10

Similar Documents

Publication Publication Date Title
CN111448325A (zh) 使用靶基因表达的数学建模评估jak-stat3细胞信号传导途径活性
CN107077536B (zh) 使用靶基因表达的数学建模评价TGF-β细胞信号传导途径的活性
CN108138237B (zh) 使用靶基因表达的数学建模评估NFkB细胞信号传导途径活性
KR102023584B1 (ko) 위장관췌장 신경내분비 신생물 (GEP-NENs)의 예측 방법
AU2012381038B2 (en) Interrogatory cell-based assays for identifying drug-induced toxicity markers
RU2721916C2 (ru) Способы прогнозирования рака предстательной железы
DK2644713T3 (en) A Method for Diagnosing Neoplasms II
CN110382521A (zh) 从氧化应激区分肿瘤抑制性foxo活性的方法
KR101421326B1 (ko) 유방암 예후 예측을 위한 조성물 및 이를 포함하는 키트
CN112795650A (zh) 使用靶基因表达的数学建模评价pi3k细胞信号传导途径活性
CN111183233A (zh) 使用靶基因表达的数学建模评估Notch细胞信号传导途径活性
KR20150043566A (ko) 심장독성 약제의 동정에 마커를 사용하는 용도
AU2018210695A1 (en) Molecular subtyping, prognosis, and treatment of bladder cancer
KR20140044341A (ko) 암에 대한 분자적 진단 검사
CA2430981A1 (en) Gene expression profiling of primary breast carcinomas using arrays of candidate genes
CN101687050A (zh) 用于鉴别原发起源不明的癌的起源的方法和材料
CN111742369A (zh) 使用靶基因表达的数学建模评估mapk-ap-1细胞信号传导途径活性
CN101573453A (zh) 使用生物学途径基因表达分析来预测淋巴结阴性原发性乳腺癌的远处转移的方法
KR20140140069A (ko) 전반적 발달장애의 진단 및 치료용 조성물 및 그 진단 및 치료 방법
CN111479933A (zh) 使用靶基因表达的数学建模评估jak-stat1/2细胞信号传导途径活性
CN101111768A (zh) 肺癌预后
AU2018304242B2 (en) Methods for detection of plasma cell dyscrasia
CN101778954A (zh) Egfr抑制剂治疗的预测性标记物
IL270787B2 (en) Melanoma detection methods
TW201827602A (zh) 辨識轉移性腫瘤的原發位置之方法及系統

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200724