CN106480205A - 用于同时检测多种突变类型的序列组合和探针 - Google Patents

用于同时检测多种突变类型的序列组合和探针 Download PDF

Info

Publication number
CN106480205A
CN106480205A CN201610994059.6A CN201610994059A CN106480205A CN 106480205 A CN106480205 A CN 106480205A CN 201610994059 A CN201610994059 A CN 201610994059A CN 106480205 A CN106480205 A CN 106480205A
Authority
CN
China
Prior art keywords
probe
sequence
seq
gene
exon
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610994059.6A
Other languages
English (en)
Inventor
易玉婷
管彦芳
陈海燕
刘久成
易鑫
杨玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Jiyinjia Biomedical Engineering Co Ltd
Beijing Gene+ Technology Co Ltd
Original Assignee
Suzhou Jiyinjia Biomedical Engineering Co Ltd
Beijing Gene+ Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Jiyinjia Biomedical Engineering Co Ltd, Beijing Gene+ Technology Co Ltd filed Critical Suzhou Jiyinjia Biomedical Engineering Co Ltd
Priority to CN201610994059.6A priority Critical patent/CN106480205A/zh
Publication of CN106480205A publication Critical patent/CN106480205A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Pathology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了用于同时检测多种突变类型的序列组合和探针。更具有而言,本发明提供了高灵敏度、高特异性的可以同时检测表1中列出的57个肿瘤驱动基因的点突变、短片段插入缺失、拷贝数变异和融合基因的序列组合、探针、基因芯片、方法和试剂盒。本发明还公开了所述序列组合和探针相关的基因芯片和试剂盒以及用于同时检测多种突变类型的方法。本发明通过检测血液、胸水、腹水等体液以及肿瘤冰冻组织或石蜡切片获得全面的肿瘤驱动基因突变信息,提高了肿瘤基因检测的灵敏度和准确率,从而实现辅助临床医生制定个体化用药方案,使精准治疗达到最好效果。

Description

用于同时检测多种突变类型的序列组合和探针
技术领域
本发明属于基因检测领域,更具体而言本发明涉及人基因突变的检测,特别是用于同时检测多种突变类型的技术。
背景技术
癌症是危害公众健康的一大难题。在中国,癌症是疾病死亡的第一杀手,并且其发病率和死亡率仍呈增长的趋势。仅在2015年,我国共有429.2万新发癌症病例和281.4万癌症死亡病例,其中以肺癌的发病率最高,并且肺癌的死亡率也排在各种癌症类型之首。另外,胃癌、食管癌和肝癌也是常见诊断的癌症类型,排在高发癌症类型的行列(Chen,W.,etal.,Cancer statistics in China,2015.CA Cancer J Clin,2016.66(2):p.115-32)。
癌症是基因病,肿瘤基因学研究揭示了近140个驱动基因,这些驱动基因分布于12条信号通路中,分别调节细胞命运、细胞生存和基因组稳定(Vogelstein,B.,et al.,Cancer genome landscapes.Science,2013.339(6127):p.1546-58)。驱动基因的发现推动了靶向药物的开发。截至2016年6月,美国食品药品监督管理局(FDA,U.S.Food and DrugAdministration)已经批准了72个靶向抗肿瘤药物。
多项研究证实,肺癌的驱动基因主要包括EGFR、KRAS、EML4-ALK、BRAF、PI3KCA、AKT1、MEK1、MET、HER2、RET、NRAS、NTRK1等。EGFR是目前肺癌研究中研究最充分的分子靶点。PIONEER研究显示,肺腺癌患者EGFR基因突变率在亚裔和中国人中分别为51.4%和50.2%(Shi,Y.,et al.,A prospective,molecular epidemiology study of EGFR mutationsin Asian patients with advanced non-small-cell lung cancer of adenocarcinomahistology(PIONEER).J Thorac Oncol,2014.9(2):p.154-62;Shi,Y.,et al.,MolecularEpidemiology of EGFR Mutations in Asian Patients with Advanced Non-Small-CellLung Cancer of Adenocarcinoma Histology-Mainland China Subset Analysis of thePIONEER study.PLoS One,2015.10(11):p.e0143515)。而KRAS和EML4-ALK的驱动突变率约占肺腺癌患者的15-25%和3-7%(Lovly,C.,L.Horn,W.Pao.2016.Molecular Profilingof Lung Cancer.My Cancer Genome(Updated March 28))。《美国国立癌症综合网络(NCCN,National Comprehensive Cancer Network)临床实践指南》已经明确对于晚期非小细胞肺癌患者,应该先实施EGFR和ALK基因检测。研究表明,对于存在驱动基因突变且接受对应的靶向治疗的患者,相对于未根据基因检测结果进行治疗的患者,可获得更好的治疗效果和更长的生存期(Kris MG,Johnson BE,Berry LD,et al.Using multiplexed assaysof oncogenic drivers in lung cancers to select targeted drugs.JAMA 2014;311:1998-2006)。对于非小细胞肺癌,除了FDA批准的EGFR抑制剂和ALK抑制剂,NCCN指南还推荐威罗菲尼和达拉非尼,达拉非尼联合曲美替尼适用于BRAF V600E突变患者;克唑替尼适用于MET高水平扩增或14号外显子跳跃突变以及ROS1重排患者;卡博替尼适用于RET重排患者;曲妥珠单抗和阿法替尼适用于HER2突变患者。NCCN指南强烈支持更广泛的基因检测,以最大限度的确定现有药物获准临床试验期药物相关的驱动突变。
靶向药物是精准治疗的先锋,其诠释了标准化治疗为基础的个体化治疗原则。而个体化治疗的前提条件是存在个体差异而进行分子靶点检测,但对于肿瘤分子靶点的检测却并非易事。一方面分子靶点涉及的类型复杂,包括点突变、短片断插入缺失、拷贝数变异、融合基因等。另一方面,晚期肿瘤患者的组织样本往往获取困难,而ctDNA(Cell-freeCirculating Tumor DNA)检测虽然无创,但是体液中除了ctDNA,也存在正常组织游离DNA,ctDNA通常占比非常少,属于超低频突变。目前对于靶点基因的检测,现有的ddPCR(微滴式数字PCR)等技术虽然可实现绝对定量,且灵敏度高,但是这类技术只能检测已知的突变位点,无法检测基因融合;RT-PCR(反转录PCR)技术虽然检测的突变类型较为全面,但是也只能检测已知的突变位点,并且存在灵敏度低、通量低等局限性。
因此,本领域中需要一种高灵敏度、高特异性的可以同时检测多个肿瘤基因的多种突变类型的新技术。
发明内容
本发明的目的在于提供肿瘤用药以及疗效预测的指导方案。经过反复试验,发明人实现了对与FDA批准靶向药物或NCCN指南推荐靶向药物或临床试验靶向药物正在开展的57个肿瘤驱动基因的敏感突变和耐药突变的同时检测。具体而言,本发明提供了用于高灵敏度、高特异性同时检测57个肿瘤驱动基因的点突变、短片段插入缺失、拷贝数变异和融合基因的序列组合;针对所述序列组合的探针;用于检测所述57个肿瘤驱动基因的点突变、短片段插入缺失、拷贝数变异和融合基因的方法、基因芯片和试剂盒。
因此,在第一方面,本发明提供了一种用于同时检测多种突变类型的序列组合,所述序列组合包括:
1)如下肿瘤驱动基因的所有CDS区域:FGFR1、NTRK1、ALK、FGFR2、APC、PIK3CA、AR、PMS2、ATM、PTCH1、PTEN、BRAF、BRCA1、BRCA2、KIT、RB1、CCND1、KRAS、RET、CDK4、MAP2K1、ROS1、CDK6、SMARCA4、CDKN2A、MET、SMO、MLH1、DDR2、MSH2、STK11、EGFR、MSH6、TP53、ERBB2、TSC1、NF1、TSC2、FBXW7、NRAS;
2)以下区域:AKT1外显子3;ESR1外显子4-8;CTNNB1外显子3;FGFR3外显子7,9,14-18;FLT3外显子14,15,20;HRAS外显子2,3;MAP2K2外显子2-4,6,7;MTOR外显子19,30,39,40,43-45,47,48,53,56;IDH1外显子4;IDH2外显子4;JAK2外显子14;PDGFRA外显子12-18;PTPN11外显子3,13;RAF1外显子3,4,6,7,10,14,15,17;SRC外显子14;VHL外显子1-3;序列SEQ ID NO.8。
在优选的实施方案中,本发明第一方面的序列组合还包括其中6个肿瘤驱动基因(ALK、FGFR3、NTRK1、PDGFRA、RET和ROS1)的融合基因断点以及肿瘤驱动基因MET外显子14跳跃突变相关的区域,即3)SEQ ID NO.9-SEQ ID NO.20。
在更优选的实施方案中,本发明第一方面的序列组合还包括EGFR基因19号外显子缺失突变的序列,即4)SEQ ID NO.1和SEQ ID NO.2。
在第二方面中,本发明提供了用于同时检测多种突变类型的探针,所述探针包括:针对本发明第一方面的序列组合1)-3)项中序列的探针;SEQ ID NO.1和SEQ ID NO.2。优选地,所述探针覆盖所述序列组合1)-3)项中全部序列。
在一个实施方案中,所述探针长度为100nt-140nt,优选110nt-130n,最优选120nt。
在一个实施方案中,所述探针包括针对本发明第一方面的序列组合第1)-3)项中除序列区间SEQ ID NO.21-SEQ ID NO.27之外的序列的探针;序列SEQ ID NO.28-SEQ IDNO.40。优选地,所述探针覆盖所述序列组合1)-3)项中除序列区间SEQ ID NO.21-SEQ IDNO.27之外的全部序列。
在优选的实施方案中,所述探针还包括:针对如下序列的探针:本发明的第一方面的序列组合中的1)-3)项中序列在染色体上前后小于150nt,优选小于120nt,更优选小于80nt的序列。
在第三方面中,本发明提供了用于同时检测多种突变类型的基因芯片,所述基因芯片上有根据本发明第二方面的探针。
在第四方面中,本发明提供了用于同时检测多种突变类型的试剂盒,所述试剂盒包括根据本发明第二方面的探针或者根据本发明第三方面的基因芯片。
在一个实施方案中,所述试剂盒还包括文库构建试剂、探针杂交洗脱试剂、引物和接头以及核酸纯化试剂。
在第五方面中,本发明提供一种用于同时检测多种突变类型的方法,所述方法包括以下步骤:
1)探针设计,根据本发明第一方面涉及的序列组合成探针,例如提交IDT(Integrated Device Technology)或罗氏(Roche)合成探针;
2)DNA提取,提取待检测样本中gDNA和/或cfDNA,例如石蜡包埋组织或石蜡切片、新鲜病理组织、血浆、胸水、腹水、脑脊液等体液样本的DNA;
3)文库构建,将提取的DNA构建样本文库;
4)杂交捕获,将所述样本文库采用步骤1)中合成的探针进行杂交捕获;
5)上机测序,将步骤4)得到的捕获序列测序产生测序数据,例如在Illumina测序平台或BGI-seq 500测序仪上机测序;
6)信息分析,进行变异检测和注释,例如采用发明人自主开发的血浆ctDNA低频突变富集测序技术——ER-seq(Enrichment&Rarallele Sequence)(中国专利公开号CN105063208A,公开日2015年11月18日)的信息分析流程(RealSeq Pipeline)统计质控参数如目标区域覆盖大小、平均测序深度、正反链互配率、低频突变率等,并进行变异检测和注释。
在优选的实施方案中,所述方法还包括以下步骤:
7)结果解读,根据检测出来的变异判断其与靶向药物疗效和预后的关系,例如通过与公共数据库(如COSMIC)或建立的数据库比对和文献检索,根据数据库记载和文献报道,判断其与靶向药物疗效和预后的关系。
本发明的序列组合、探针、基因芯片、试剂盒和方法可以用于同时检测57个肿瘤驱动基因的点突变、短片段插入缺失和拷贝数变异的序列组合。
本发明的有益效果是:
本发明可以特异性地一次性检测出多种肿瘤驱动基因的不同变异类型。
本发明的探针可以对EGFR、KRAS、BRAF、EML4-ALK等57种驱动突变实现多重全方位检测。
本发明可以实现一次性同时检测57种基因的多种变异类型,包括点突变、短片段插入缺失、拷贝数变异和基因融合。
本发明可以检测探针覆盖区域的已知突变,并同时可以发现新的未知变异。
本发明检测突变的灵敏度高,本发明可以实现0.5%以上变异的准确检出。
本发明可以精确识别融合基因的断点。
本发明适用于石蜡包埋组织或石蜡切片、新鲜病理组织、血浆、胸水、腹水、脑脊液等多种体液样本。
本发明检测突变的通量高:能够在短时间内同时进行多例样本检测,从而压缩成本,有利于临床的推广。
本发明对于融合基因的检测可以准确识别断点(精确到1bp),并且可以发现与ALK、FGFR3、NTRK1、PDGFRA、RET和ROS1相关的新的融合基因。
附图说明
通过以下附图对本发明进行说明:
图1为本发明的实施流程图;
图2为实施例2的ALK基因c.3806G>C读段图,序列见SEQ ID NO.3;
图3为实施例2的TP53基因c.455C>T(p.P152L)读段图,序列见SEQ ID NO.4;
图4为实施例3的EGFR基因的c.2235_2249del15(p.E746_A750del)读段图的部分截图,序列见SEQ ID NO:5;
图5为实施例3的TP53基因的c.578A>C(p.H193P)读段图的部分截图,序列见SEQID NO.6;
图6为实施例4的MET基因的14号外显子跳跃突变c.3028_3028+17del18读段图的部分截图,序列见SEQ ID NO.7。
具体实施方式
本发明利用发明人自主开发的血浆ctDNA低频突变富集测序技术——ER-seq(Enrichment&Rarallele Sequence)(中国专利申请公开号CN105063208A,公开日2015年11月18日),提供了一种高灵敏度、高特异性的可以同时检测多个基因的点突变、短片段插入缺失、拷贝数变异和融合基因的方法及试剂盒。
在本发明中,采用本领域通用表示法表示基因突变和蛋白质突变。例如,c.3140A>G(p.H1047R)表示错义突变,表示编码区第3140位的A碱基改变为G碱基,从而导致1047位的氨基酸由组氨酸H突变为精氨酸R;c.464+1G>T表示剪切突变,表示编码区第464位所在外显子3端紧连内含子的第一个碱基由G改变为T;c.2240_2254del15(p.L747_T751del)表示小片段缺失,表示编码区第2240位到2254位的15bp碱基缺失,从而导致第747位到751位的5个氨基酸缺失;c.548C>A(p.S183*)表示无义突变,编码区第548位的C碱基改变为A碱基,从而导致第183位的丝氨酸S变为终止密码子;c.3028_3028+17del18表示涉及到剪切区域的小片段缺失,表示表示编码区第3028位到其所在外显子3端紧连内含子的第17个碱基(共18个碱基)缺失。本领域技术人员根据上述示例可以解读本发明中的其他突变的含义。
不希望拘囿于理论,但发明人考虑,对基因序列进行捕获进行检测中使用的探针的效率受到多种因素的影响,例如探针之间的相似度、探针序列的复杂程度和GC含量差异、探针自身形成二级结构的倾向性、探针之间形成二级结构的可能性。因此,想要对多个基因的多个位点进行同时检测,存在很大挑战。需要检测的基因越多、位点越多越分散,需要设计的探针越多,有可能遇到的问题越多,检测的难度就越大。把多个基因的多个位点进行分开检测,人工费用、仪器费用、试剂费用基本上与试验份数成正比,如果不能做到高通量的批量检测,那么势必造成资源的巨大浪费,靶向药物是精准治疗的成本会居高不下,限制其在普通患者中的推广和应用。在本发明中,对57个肿瘤驱动基因(表1)、突变位点或相关区域的选择经过了发明人的反复论证,对这些区域进行探针设计可以很好地实现相关突变的高通量检测,有效地减少探针自身、探针之间的干扰。在本发明中,突变位点或相关区域的选择考虑了检测的全面性与检测的效率、灵敏度和特异性的平衡,既尽可能多地检测多种类型的突变,又保证了高灵敏度、高效率的精确检测。
本发明的目的在于提供一种同时检测点突变、短片段插入缺失、拷贝数变异和融合基因的探针,该探针包括57个肿瘤驱动基因(表1)。#号标记的基因探针设计区域除表1中指定的区域以外,另增加其中6个肿瘤驱动基因(ALK、FGFR3、NTRK1、PDGFRA、RET和ROS1)的融合基因断点和MET基因外显子14跳跃突变相关的区域如下:chr1:156843751-156844362,chr2:29446394-29448326,chr4:1808661-1808842,chr4:55140698-55141007,chr6:117650609-117658334,chr6:117647577-117650491,chr6:117645578-117647386,chr6:117642557-117645494,chr6:117641193-117642421,chr7:116411702-116411902,chr7:116412043-116412283,chr10:43610184-43612031。
另外,为了很好的捕获EGFR基因常见的19号外显子缺失突变,增加基于突变序列的探针:
E1:TGTCATAGGGACTCTGGATCCCAGAAGGTGAGAAAGTTAAAATTCCCGTCGCTATCAAGGCGAAAGCCAACAAGGAAATCCTCGATGTGAGTTTCTGCTTTGCTGTGTGGGGGTCCATGG(SEQ ID NO.1);
E2:ATCCCAGAAGGTGAGAAAGTTAAAATTCCCGTCGCTATCAAGGAATTAAGAGAAGCAACACTCGATGTGAGTTTCTGCTTTGCTGTGTGGGGGTCCATGGCTCTGAACCTCAGGCCCACC(SEQ ID NO.2)。
表1本发明的探针所覆盖的肿瘤驱动基因及其范围
注:all CDSs:所有编码区;Exon和Exons:外显子。
在本发明中,基因名称均采用NCBI-Gene(https://www.ncbi.nlm.nih.gov)里的官方命名(Official Symbol)。染色体序列的参考序列为GRCh37/hg19(http://hgdownload.soe.ucsc.edu/goldenPath/hg19/chromosomes/)。本领域技术人员应理解,本发明并不限于具体公开的参考染色体序列,本领域技术人员简单地通过对应,可以将本发明涉及的染色体序列在其他类型的基因组数据版本上确定。因此,本发明适用于其他类型的基因组数据版本,例如以后发布的版本。
在本发明中,提及基因序列(包括DNA序列、RNA序列)意味着包括提及的序列本身,以及如果在生物学的角度理解合理的情况下也包括提及序列的互补序列。这是因为基因序列在染色体上是双链形式存在的,提及一条链上的序列,另外一条链上的序列也必然存在,突变通常在两条序列上对应出现。
基于表1中列出的序列,通过对比待测样品与基因组数据库中的标准序列,本领域技术人员可以确定待测样品是否含有点突变、短片段插入缺失、拷贝数变异。
本发明检测的变异类型包括所有57个肿瘤驱动基因所覆盖区域的已知或未知的点突变、短片段插入缺失和拷贝数变异;6个肿瘤驱动基因(ALK、FGFR3、NTRK1、PDGFRA、RET和ROS1)所覆盖区域的融合变异。需要说明的是,本发明也可以检测MET基因的14号外显子跳跃突变。以下是本发明的染色体区域用于检测的突变情况:
chr1:156843751-156844362(SEQ ID NO.9,在NTRK1基因9号内含子发生的融合),chr2:29446394-29448326(SEQ ID NO.10,在ALK基因19号内含子发生的融合),chr4:1808661-1808842(SEQ ID NO.11,在FGFR3基因17号内含子发生的融合),chr4:55140698-55141007(SEQ ID NO.12,在PDGFRA基因11号内含子发生的融合),chr6:117650609-117658334(SEQ ID NO.13,在ROS1基因31号内含子发生的融合),chr6:117647577-117650491(SEQ ID NO.14,在ROS1基因32号内含子发生的融合),chr6:117645578-117647386(SEQ ID NO.15,在ROS1基因33号内含子发生的融合),chr6:117642557-117645494(SEQ ID NO.16,在ROS1基因34号内含子发生的融合),chr6:117641193-117642421(SEQ ID NO.17,在ROS1基因35号内含子发生的融合),chr7:116411702-116411902(SEQ ID NO.18,MET基因14号外显子跳跃突变),chr7:116412043-116412283(SEQ ID NO.19,MET基因14号外显子跳跃突变),chr10:43610184-43612031(SEQ IDNO.20,在RET基因11号内含子发生的融合)。
在本发明中,融合变异是指两个基因的编码区首尾相连置于同一套调控序列(包括启动子、增强子、核糖体结合序列、终止子等)控制之下,构成的嵌合基因。外显子跳跃,实际上就是涉及到剪切区域的突变,包括点突变、缺失等,突变后会引起剪切错误,导致外显子丢失。
在另一实施方案中,本发明的用于检测肿瘤驱动基因突变的试剂盒包括用于检测EGFR、KRAS、BRAF和EML4-ALK突变的试剂,特别是包括DNA提取试剂、文库构建试剂、探针杂交洗脱试剂、引物和接头试剂、核酸纯化试剂。
在一个示例性实施方案中,所述试剂盒包括的试剂的组成如下:
表2根据本发明一个实施方案的试剂盒的组成
注:上述序号1-22的试剂中,有些未对应具体的厂商来源,但本领域技术人员根据其中提供的试剂名称就可以自行获知很多厂商提供用于实现所述环节的试剂,本领域技术人员也可以根据有关手册配制实现所述环节的试剂。
对于本发明中特别选择的序列组合,可以选择常规的方法对其设计探针。例如对于长度120nt的探针,(1)设定窗口在所述序列组合中的序列上滑动,得到覆盖所有序列组合的探针;(2)为了避免探针的GC含量过低(低GC探针会导致覆盖深度不佳),在确保目标序列完全覆盖的情况下,部分探针在GC正常的区域允许重叠。本领域技术人员已知,在基因探针检测领域,随着基因探针数量增多,在同一个反应体系中进行检测会出现探针的相互影响或干扰。本发明中突变位点或相关区域的选择考虑了探针覆盖的全面性与检测的效率、灵敏度和特异性的平衡,既尽可能多地检测所需类型的突变,又保证了高灵敏度、高效率的精确检测。在本发明中,用于同时检测多种突变类型的探针符合探针设计规范。例如,探针自身不能形成二级结构、探针之间互补序列不宜过长。这样的探针设计规范是本领域技术人员可以确定的,探针设计软件或者探针设计提供商也可以提供本领域通常的探针设计规范。
在本发明的一个实施方案中,用于同时检测57个肿瘤驱动基因的点突变、短片段插入缺失、拷贝数变异和融合基因的方法包括以下步骤:
1)探针设计,根据NCCN指南、COSMIC、TCGA、ICGC数据库和相关文献确定基因集、突变位点或相关区域,确定探针的目标区域,设计并提交IDT或罗氏(Roche)合成探针;
2)DNA提取,提取检测样本中gDNA和cfDNA,包括石蜡包埋组织或石蜡切片、新鲜病理组织、血浆、胸水、腹水、脑脊液等体液样本的DNA;
3)文库构建,将步骤2)中提取的DNA按文库构建试剂盒说明书构建样本文库;
4)杂交捕获,将所述样本文库采用步骤1)中合成的探针,参照探针制造商(例如IDT或罗氏)提供的说明书进行杂交捕获;
5)上机测序,将步骤4)中捕获的样品进入Illumina测序平台或BGI-seq 500测序仪上机测序,产生原始测序数据;
6)信息分析,采用发明人自主开发的血浆ctDNA低频突变富集测序技术——ER-seq(Enrichment&Rarallele Sequence)(中国专利公开号CN105063208A,公开日2015年11月18日)的信息分析流程(RealSeq Pipeline)对所述原始测序数据统计质控参数如目标区域覆盖大小、平均测序深度、正反链互配率、低频突变率等,并进行变异检测和注释;
7)结果解读,对于检测出来的变异,进行公共数据库(COSMIC)和已建立的数据库比对和文献检索,根据数据库记载和文献报道,判断其与靶向药物疗效和预后的关系。
本发明的方法可通过检测血液、胸水、腹水等体液以及肿瘤冰冻组织或石蜡切片获得全面的肿瘤驱动基因突变信息,提高了肿瘤基因检测的灵敏度和准确率,从而实现辅助临床医生制定个体化用药方案,使精准治疗达到最好效果。
实施例
下面通过具体的实施例,对本发明进行说明,需要说明的是这些实施例仅仅是为了说明目的,而不能以任何方式解释成对本发明的限制。除非另有定义或说明,本专利所述的科学技术术语与本领域普通技术人员所理解具有相同的含义。
本发明实施例中肿瘤基因的探针设计策略如下:
探针设计的方法概括为根据NCCN指南、COSMIC、TCGA、ICGC数据库和相关文献确定基因集、突变位点或相关区域,确定探针的目标区域,设计并提交IDT(Integrated DeviceTechnology)合成探针。
(1)对于非复杂区域发生的变异,直接按照探针提供商的常规的设计方法即可。
(2)融合基因检测的探针设计:融合基因的断点通常发生于内含子(intron)区域,本发明对于融合基因的检测是基于DNA水平,并且可以精确到具体的断点,因此探针需要覆盖相关的内含子。根据NCCN指南确定本发明需要检测的融合基因为ALK、FGFR3、NTRK1、PDGFRA、RET和ROS1,然后根据COSMIC、TCGA数据库和文献记录的融合变异类型和断点位置确定本发明探针需要覆盖的区域。将预定的区域和全基因组参考序列进行比对,对于存在断点的重复区域,再增加覆盖配对基因的探针序列;
(3)短片段插入缺失的探针设计:大于15bp碱基的缺失可能会在探针捕获时存在缺口,因此针对热点该类型变异(EGFR 19号外显子缺失),再增加基于突变后的序列设计探针。
经过发明人反复测试,对于本发明的用于同时检测多种突变类型的序列组合1)-3)项中序列除序列区间SEQ ID NO.21-SEQ ID NO.27之外,以105-135nt的窗口长度平铺获得的探针均可有效用于本发明的检测中,序列区间SEQ ID NO.21-SEQ ID NO.27的探针可以是下表中的SEQ ID NO.28-SEQ ID NO.40。在本发明实施例中,在序列组合1)-3)项中序列除以下表中的序列区间SEQ ID NO.21-SEQ ID NO.27之外,使用的是以120nt的窗口长度平铺获得的探针;序列区间SEQ ID NO.21-SEQ ID NO.27的探针是下表中的SEQ ID NO.28-SEQ ID NO.40;短片段插入缺失的探针是SEQ ID NO.9-SEQ ID NO.20。
实施例1:
本实施例以涵盖点突变、短片断插入缺失、拷贝数变异和融合基因变异类型的3个Horizon标准品(HD-C755、HD200和HD664)、1个细胞系RT112和8个已知变异的临床样本为例来阐述本发明。本实施例的实施流程如图1。
1.DNA提取:本发明的样品适用范围包括手术切除的新鲜病理组织、甲醛固定石蜡包埋病例组织、石蜡切片、全血、血浆、胸腔积液标本等。本实施例采用血细胞的gDNA的测序结果作为对照用于排除胚系突变。对于全血需要首先进行血浆/血细胞分离:采集10mL外周血,及时进行血浆/血细胞分离(EDTA抗凝管,4h内;Streck管72h内)。分离步骤如下:
第1步:在4℃条件下1600g离心10min,离心后将上层血浆分装到多个1.5mL或者2.0mL的离心管中,在吸取血浆过程中注意不要吸到中间层的白细胞。注意:在分离血浆后,中间层+底层血细胞留取备用,作为正常对照。
第2步:在4℃条件下以16000g离心10min去除残余细胞,将上清转入新的1.5mL或者2.0mL离心管中(注意不要吸到管底的白细胞),即得到所需的血浆。
DNA提取:血浆、胸腔积液等体液按照QIAamp Circulating Nucleic Acid Kit(Qiagen)提取试剂说明书,进行血浆cfDNA的提取。血细胞和组织等样本按照QIAamp DNAMini Kit提取试剂说明书,进行gDNA的提取。然后采用Qubit定量,要求血浆cfDNA大于30ng;血细胞gDNA大于300ng;组织DNA大于100ng。
2.文库构建:体液中提取的cfDNA按照NEBNext Ultra II文库构建试剂盒说明书构建样本文库,引物和接头来自于Invitrogen。对于组织或者用于对照的血细胞提取的基因组DNA,应先打断成200-250bp的片段,然后按照文库构建试剂盒构建样本文库。
2.1末端修复及加“A”:按照下表配置末端修复以及加“A”反应:
组分 单反应体积(μl)
End Prep Reaction Buffer 7
End Prep Enzyme Mix 3
cfDNA或片段化的DNA 50μl
总体积 60μl
将以上混合物充分振荡混匀并离心,然后按照以下步骤在恒温混匀仪上孵育:首先20℃,孵育30min;然后65℃,孵育30min。孵育完成后,降至室温,高速离心机短暂离心。
2.2接头连接:按照下表配置接头连接反应Premix:
组分 单反应体积(μl)
Ligation Master Mix 30
Ligation Enhancer 1
总体积 31
接头加入量随DNA起始量变化而变化,对应关系见下表:
依次向反应管中加入31μl接头连接反应Premix及对应体积的接头,并用ddH2O补充体积至95μl,充分振荡混匀后离心。恒温混匀仪20℃孵育15min。孵育完成后,微量高速离心机短暂离心。连接反应结束后,使用磁珠对接头连接产物进行纯化,最后回溶至25μL TE(pH8.0)中。
2.3捕获前PCR(Non-C-PCR)引入标签(index)
按照下表顺序在PCR管中加入反应组分,振荡混匀并离心,并设置阴/阳性对照:
2.3.1 PCR上机样本循环数对应关系见下表:
2.3.2 PCR上机程序见下表:
对Non-C-PCR产物进行纯化,最终溶解在31μl TE(pH8.0)中。纯化产物进行Qubit-BR定量和2100质控。
3.靶序列富集与上机测序
3.1扩增后文库质控合格后并采用本发明实施例设计的探针,参照芯片制造商(IDT)提供的说明书进行杂交捕获。最后洗脱回溶21μL ddH2O带杂交洗脱磁珠。
3.2杂交捕获产物的扩增。
3.3先除去上一步磁珠,然后进行磁珠纯化,最后回溶25μL ddH2O,进行QC及上机。
3.4采用Illumina测序平台或BGI-seq 500测序仪进行上机测序,测序实验操作按照制造商提供的操作说明书进行上机测序操作。
4.信息分析
正反双链纠错低频信息分析(RealSeq Pipeline)具体方法为:
4.1基于插入片段两端的序列碱基作为标签,所述插入片段是文库中与接头引物相连接的DNA片段,经双末端测序,每个片段形成一对成对测序序列;将成对测序序列的测序序列1的前12bp碱基和测序序列2的前12bp碱基作为标签,字母序排列以较小的标签在前连接成24bp的一条索引,并且以这24bp作为成对测序序列的索引,测序序列1的标签在前就标记成正链;测序序列2的标签在前就标记为反链;
4.2对索引进行外部排序,以达到将同一个DNA模板的所有测序重复测序序列聚集到一起的目的;
4.3对聚集起来的拥有相同索引的测序序列进行中心聚类,根据其序列之间的汉明距离(Hamming distance),将每个有相同索引的大簇聚集成若干个小簇,每个小簇中任意两对成对测序序列的汉明距离不超过10,以达到区分开拥有相同索引却来自不同DNA模板的测序序列的目的;
4.4对步骤4.3中获得的同一个DNA模板的重复簇进行筛选,若正链和反链的测序序列数都达到2对以上,则进行后续分析;
4.5对满足4.4中条件的簇进行纠错,并产生一对无错的新测序序列。对于DNA模板的每一个测序碱基,若某种碱基型在正链的测序序列中的一致率达到80%,且在反链测序序列中的一致率也达到80%,则记新测序序列的这个碱基为此碱基型,否则记为N,这样便得到了代表原始DNA模板序列的新测序序列;
4.6将新测序序列用bwa mem算法重新比对到基因组上,筛除比对质量小于30的测序序列;
4.7根据4.6中得到的测序序列进行统计,得到捕获区域内每个位点的碱基型分布,统计目标区域覆盖大小、平均测序深度、正反链互配率、低频突变率;
4.8Call SNV/InDel/SV/CNV:根据患者样品与对照样品信息的比对,用mutect流程call somatic SNV变异;用gatk流程call somatic InDel变异;用contra.py流程callCNV;用somVar流程call SV;
所使用的筛选参数为:对照位点变异率≤2%;纠错后变异测序序列条数≥2;突变预测p值≤0.05;
4.9变异注释:注释变异的功能、变异测序序列支持数、变异频率、氨基酸变异及已有变异数据库中的该变异的情况。
5.检测结果:
5.1探针性能:
以下将结合覆盖度和目标区域序列占比说明本发明的探针的性能。
A.覆盖度:在样本的平均测序深度为~1000X(去除重复读段(reads))的情况下;目标区域覆盖深度大于500X的比例大于90%,表明覆盖情况很好。
B.目标区域序列占比:本发明目标区域序列占比均值是53%,说明本发明捕获效率较高(表3)。
表3本发明的探针的测试样本覆盖度和目标区域占比分布
5.2变异检测结果
本发明的方法检测结果与已知的变异类型和频率结果完全一致。对于点突变,本发明的方法可以准确识别0.5%以上的突变(表4)。
表4实施例1变异检测结果
5.3融合基因灵敏度分析:将含有融合基因变异FGFR3-TACC3的细胞系DNA按照2%、1%、0.5%进行稀释,并设置一个平行重复,然后进行检测。结果表明本发明的灵敏度高,0.5%的融合基因变异即可检出,检测频率与理论频率相比,具有高度的一致性和重复性(表5)。
表5融合基因灵敏度分析检测结果
实施例2:
取待检测的临床肺癌血液样本1例。受检者既往接受克唑替尼治疗,治疗10个月后,效果不明显,疾病继续发展。
按照实施例1所述检测之试剂盒和方法对血液样本进行血浆/血细胞分析,DNA提取,提取步骤按照试剂盒说明书操作步骤进行操作。
参考实施例1进行文库构建,杂交捕获,上机测序及信息分析。
结果表明所检测的基因中,存在以下基因变异,其他基因为野生型。
EML4-ALK融合基因的断点分别为chr2:42503274和chr2:29447354;前者位于EML4基因6号内含子(NM_019063),后者位于ALK基因19号内含子(NM_004304)。图2为ALK基因c.3806G>C读段图;图3为TP53基因c.455C>T(p.P152L)读段图。在图2中,参考序列的C碱基突变成了G碱基(由于ALK基因的编码链为负链,因此编码序列的改变为G突变为C)。在图3中,参考序列的G碱基突变成了A碱基(由于TP53基因的编码链为负链,因此编码序列的改变为C突变为T)。
检测结果解读:尽管受检者依然存在ALK基因融合,但是ALK基因激酶区的G1269A突变会导致克唑替尼发生耐药。目前FDA批准的ALK抑制色瑞替尼和艾乐替尼均能解决G1269A突变导致的耐药问题。TP53基因的c.455C>T(p.P152L)与肿瘤的发生发展和预后相关,目前尚无相关的靶向药物。基于上述基因突变的检测结果,该肺癌患者选择第二代ALK抑制剂色瑞替尼或艾乐替尼为宜。
实施例3:
取待检测的临床肺癌石蜡切片组织样本1例。
按照实施例1所述检测之试剂盒和方法进行DNA提取,提取步骤按照试剂盒说明书操作步骤进行操作。
参考实施例1进行文库构建,杂交捕获,上机测序及信息分析。
结果表明所检测的基因中,存在以下基因变异,其他基因为野生型。
图4为的EGFR基因的c.2235_2249del15(p.E746_A750del)读段图的部分截图;图5为TP53基因的c.578A>C(p.H193P)读段图的部分截图。在图4中,参考序列的15个碱基GGAATTAAGAGAAGC存在缺失。在图5中参考序列的T碱基突变成了G碱基(由于TP53基因的编码链为负链,因此编码序列的改变为A突变为C)。
检测结果解读:受检者存在EGFR基因的c.2235_2249del15(p.E746_A750del)突变,宜采用EGFR抑制剂,如易瑞沙或特罗凯进行治疗为宜。TP53基因的c.455C>T(p.P152L)与肿瘤的发生发展和预后相关,目前尚无相关的靶向药物。
实施例4:
取待检测的临床肺癌胸水1例,同步采集外周血,以血细胞提取的基因组DNA作为对照。受检者为肺腺癌IV期患者,发生骨转移。
按照实施例1所述检测之试剂盒和方法对胸水样本进行DNA提取,提取步骤按照试剂盒说明书操作步骤进行操作。
参考实施例1进行文库构建,杂交捕获,上机测序及信息分析。
结果表明所检测的基因中,存在以下基因变异,其他基因为野生型。
图6为MET基因的14号外显子跳跃突变c.3028_3028+17del18读段图的部分截图。在图6中,参考序列的18个碱基GGTATATTTCAGTTTATT存在缺失。
检测结果解读:受检者同时存在MET基因扩增和14号外显子跳跃突变。因此该肺癌患者宜选择MET抑制剂,如克唑替尼和卡博替尼,进行治疗为宜。
序列表
<110> 北京吉因加科技有限公司
苏州吉因加生物医学工程有限公司
<120> 用于同时检测多种突变类型的序列组合和探针
<130> CP20160435
<160> 40
<170> PatentIn version 3.3
<210> 1
<211> 120
<212> DNA
<213> 人工序列
<400> 1
tgtcataggg actctggatc ccagaaggtg agaaagttaa aattcccgtc gctatcaagg 60
cgaaagccaa caaggaaatc ctcgatgtga gtttctgctt tgctgtgtgg gggtccatgg 120
<210> 2
<211> 120
<212> DNA
<213> 人工序列
<400> 2
atcccagaag gtgagaaagt taaaattccc gtcgctatca aggaattaag agaagcaaca 60
ctcgatgtga gtttctgctt tgctgtgtgg gggtccatgg ctctgaacct caggcccacc 120
<210> 3
<211> 79
<212> DNA
<213> Homo sapiens
<400> 3
ctgtagatgt ctcgggccat cccgaagtct ccaatcttgg ccactcttcc agggcctgga 60
caggtcaaga ggcagtttc 79
<210> 4
<211> 79
<212> DNA
<213> homo sapiens
<400> 4
gatggccatg gcgcggacgc gggtgccggg cgggggtgtg gaatcaaccc acagctgcac 60
agggcaggtc ttggccagt 79
<210> 5
<211> 80
<212> DNA
<213> homo sapiens
<400> 5
gtgagaaagt taaaattccc gtcgctatca aggaattaag agaagcaaca tctccgaaag 60
ccaacaagga aatcctcgat 80
<210> 6
<211> 81
<212> DNA
<213> homo sapiens
<400> 6
cacacgcaaa tttccttcca ctcggataag atggctgagg aggggccaga cctaagagca 60
atcagtgagg aatcagaggc c 81
<210> 7
<211> 80
<212> DNA
<213> homo sapiens
<400> 7
atctgtagac taccgagcta cttttccaga aggtatattt cagtttattg ttctgagaaa 60
tacctataca tatacctcag 80
<210> 8
<211> 5177
<212> DNA
<213> homo sapiens
<400> 8
ggccttcaac cactatctca gtgcaatggg taagcaatgc ctgggtaaga ggcagttgac 60
gtgtggatgg ttgaatctgc ttgaaggctg tgtgtggcat ttaaaatccc cttttaaaac 120
cccgtaactg atttattcca tctttagatg ggaatggagg atgtgtcaaa ctatcaaacc 180
aacttttttt tttttttttg agatgagtct tgctctgtcg cccaggctgg agtgcagtgg 240
tgcaatctca gctcaccgca agctccacct cccgggttca agcaattctc ctacctcagc 300
ctccagagta gctgggacta caggcgcgtg ccaccacgcc cagctaattt tttctatttt 360
tggtagagat ggggtttcac cgtgttagcc aggatggtct caatctcctg accttgtaat 420
ctgcctgtct cagcctccca aagtgctggg attacaggcg tgagccaccg cgcatggccc 480
acatcaacat ttttacaaag ttactaactt ttgtggcagt gatgagttga ggtccaaaca 540
ttagctttca ggtctgtctt cattaagcta aagtgtgttt taaccaccag gctttacata 600
gtaatgacat tttgcttgaa agggaactga tcatttacag aaaatagctt aataatcaaa 660
agtgtaaaga aagatgacaa tcatttttga aaataacact tttaaaaaaa tgaactagtt 720
catgaaagca gtaccaacat agaaccatga aaatggtttg ttttctgcct aaattcctct 780
ttgtgcttat tgctcagagg gtttggacat agtactaatc agattaggtt gtaggttttt 840
atttcaggga ttaaaggcag tagtagggtt tgaaccaaga gtggctaaca taaataccac 900
agaggcccac agcaaaatca tggaaggaac tgacctggtg gagactggta aattggagag 960
tatttgcccc ttctatgttt gggccacacc taattgtggc tgtgagggca tgtggtctca 1020
gggtgggttt tcctatattg caagataacc taggaatgca aaattgatgc cagataccct 1080
gtttcaacat tgacagctga ttcagatttt gaaaacattg tacaagctga aaagaaacat 1140
ctgcagactt gatttggccc ttgaacctac agcatgtgac tttgggtaca tactttgggt 1200
aaccttggtg aggggctgag tctgtgttga tcgacttgct gttccccacc aatggaaaag 1260
gttcatgtct tgatcagtag tcaatcacat tgaccatttg tccagattag cttgccatac 1320
atgaacaaga tagaagtaag ttggtagagt tatcaattag gaaacccagt acagagtcta 1380
ttataattta gattgtacct catgatgaag gctaactcaa caaacccatc agaacagaca 1440
ctggaacaaa atgacatttc taaataccat ccagctctgt cttcataggc ttcagtgagg 1500
taaatcaggc aggcctttgc ccatgttata gaattggaaa gaacctcaga gtggtggtca 1560
cttgtcagag gttgggcaca cctgtgaggt ggtggggaga aatgacagac atcccagcag 1620
ctacacatgc tggctgcacg tctcttgcca aatgccagga ggtaattttt tagggtccct 1680
ccttagggaa aggggctgga agttttatta ttgctgttac tactgctcgt gaactcattt 1740
cagccttaga agttcttggc ttgtagtttt tgttgtactc atgaaaatgc tcccccatat 1800
atatgatcat tctcgcttac tataacatcc ttgcttacta aatgagttaa cagggcttta 1860
tggtgtgtat cgtgaaacac acgtgcatta aagaccctct ggaaggtatt agcttttcac 1920
actttcacaa caaaagcttc acacttgtgg ttattaagct attttctcta accagttccc 1980
tttcaagcaa aatgcataca ttggtctctg taggtgatgg gttaatgcat ggaaatagtt 2040
tctccttccc tggaactggg aatagtgggt gagatagtgt attttttaat gtaaagacag 2100
gcacaaatgc tttttttgtt gataaatact attttacaag ctaattataa gttaagcact 2160
gttacttgag atgaaatata cagggcttca aagatcataa tctaaataat tatgcacagc 2220
taatggttat acctgtgaag taaagtagtg gatcctgagg tgtaatttta tagtattagc 2280
tgcatttcag tagatggtgt gatgaagagt ttaatgcata ggattaaatg agaagttacg 2340
aggagtttgt ttaaagttaa tgtaccgagg taagttttca gtgttaagtt tttgggagat 2400
ttgttttggg agaggatgag ttggggttgg gggaggaaag gacttagcca gatgtgagtt 2460
tcttaaattg aagcataaaa tttacaattt atgtagtcca taattttctc tggacattct 2520
acagtcttag ttcatgcctg aagaccactg aaataatgct gagttgataa gtggttctct 2580
tgactttgtt tagtattctt tactcaaccc tatccatgaa gttcttcaat gaagcttttg 2640
ataatttatt gcaaaataca ttttccacaa agaagtcatt atgattggtt tgaactagtg 2700
gaacacaaat gtgaggttat aaagaggttc gccttagcca ggggctcctt tagctgcaaa 2760
gcagtttttt gctcagcaac ttggggtaga gatcagtgtg tcttgaagtt ttgttttgca 2820
aaactttgtt ctaatgagaa agtcaagtct taggaggaat gtatagtagt tgagtgtttg 2880
tattaacact gttttcatat tttcctttta tgtctctgat ttttctgaag acaagttcaa 2940
ggaatatatt tctctgtggg gcaacagata cagttttttc acttttcctc aattttagtc 3000
tccttacact ctgggaggat taacttgaca aatgatacct tagtgaataa ctgattattt 3060
ttatcaaaat cactcacatg tgttggttta ctgagtgcct ttttggatga gtgttttatg 3120
ccatatgtgt ttttaatgga aattaaagtg tagtcagtac actaaagtgt agtcagtaca 3180
attggaaata agagttgaga aaagtcagga tatggaggaa tgctccctag tgtcatgtta 3240
gtaaatgtct taaattttat acttgttccc tggcacattg gaattcacag atgggagtta 3300
atggctttct tttttttttt ttttttttcc tcagcgtctt gtgggtactt ctcttatagc 3360
tggtacttgt ctgacccctc ctttagtttg tgagctccct gggcggggaa taatggcctg 3420
cagatgctag cgagtgcctg acaaagagga gaagcccagg agatgttgag agtcagtcca 3480
gctctgcctg ttagcctttc agacaaataa agttgaagaa ggcaggtagc aagaaaaaga 3540
tcctgacctc tgctctgcca aagtgttttt aattacctgg atctagctgt aaggtttgcc 3600
acgtagtggt gacagctgag gtctagctca gcactactca gcagggaagc cacacatgca 3660
ttaagcactt gacataggac tagtctgaac tgagttgtgc tgtcattatt gatacacact 3720
ggattttgag gagacaaaaa agaatgcaaa atagtttaat tgttttcata tgggttacat 3780
gttgaaatgg tgttttaaat atataggtta aataaaatat aaacttgtat tgcagttaaa 3840
cacaaagcgt aaaatttacc atctgaacca tttatttcta agtgtactgt tcagtagtgt 3900
taagtgcact tattttgttg tgcggccaat ctccagaact tcttcacctt gcaaaacaga 3960
aattctgtac tcattaaaca actccccatt tccccctccc cccagcttct gacaaccacc 4020
attctatttt ctgtctatta atttgacaac ttcagatacc ttatataagt gaaatttata 4080
tagtatttgc tcttccatga caggcttatt tcacttagcg taatgtcgtc agggttcatt 4140
tatcttgcaa catgtcagaa tttccttcct ttttaaggct gaaggttgtt ccagtgtgtg 4200
tatatcacat acttcattta tccattcatc catcaggaga tacttgggtt gcttccactt 4260
tttggctatt gtgagtagtg ctgctatgaa catgggtatg caaatatctt ttgggggatt 4320
ctgctttgaa tttttttgga tatatacttg gaagtggaat tgctggatca tatggtaatt 4380
ctatttttaa ttttttgggg aaccatcatg ctgttctcca tagaggctgt gccattttac 4440
attcccacca acagggcaca agggttccag tttctccaca tacttaccaa cacttttttt 4500
tttttttttt taacagtagt catcctagag gatataggtg atctttcact gtgctttgga 4560
tttatattta ctggcttaga tttgtatggc caccaccata gtcaagatac agaacaactc 4620
aaccacaagg atttctcatg ataccttttt atagccacag ccacctctct ccctcttcct 4680
tgagcatttt gtcatatggt cattggtgat taaataaaat gtattttaat attgactttc 4740
tctgtttctt tctacctttt taaacatggc tactagaaaa atgcacaatt agatttgtgg 4800
ctggtgttct gtttcatcta aacaggctgg cctcacagag gagctggagt gtgcagtgct 4860
gctctagcaa gccaggcttg actcttccca ctcagggcac atcacttcca tgaagcttac 4920
tccttgggtt gtttggttga cttaggagaa tggaagtgat tagcagaatc ttgtaagcat 4980
tttaaacatt aaatgagcat tgtaaacagc ggcattcttc aggcaaatac agttttgttt 5040
tacctcttta aattccatgg tatattcgga cttcaaaaag tagatggtag agcacatgct 5100
ttctcagcac cttcaggctg cctggagcct cccaatagag gtgtcttcga gggagtccca 5160
gctctgtctc tgaaacc 5177
<210> 9
<211> 612
<212> DNA
<213> homo sapiens
<400> 9
ggtgcgaggg ccatcctgaa ccctgccccc actcctgggc tcctcctggg ttacagccaa 60
cttcctgcta tagccctgac cccagaaatt ggagtgcctg gttcgggaca gaaaggagtc 120
tggagtcctg gtgtcccgct gttctggcct ccttaccctc tccccaagcc aggactcctg 180
aactcctgag ctattccgtc cttgtcggct ggctgaggag acagccatgc agcagggcat 240
cctggcccag ctggaaaagg gtcacatgca tcttcttcct tgaggcccag cagcccacct 300
ccatcccccc tcgtcccatg aaggaatgag tcccagagta ggcaggggac tcactgcttt 360
cctcctccct ctgactgctt tctctcctcc ctctgactgc tttctctcct ccctcctgct 420
gcagtctcct tctcgccggt gggtgagtag cccaaggtgg agggcaggtt ctgcctggtc 480
tctggagctg aggctggggc agagggtaca gctgaactga tccctgagag accagctggg 540
gccagggttg gggggttact ggaggctaca gtgtgtgtca aggctcaccc ctcctgccct 600
gtgtccctac ag 612
<210> 10
<211> 1933
<212> DNA
<213> homo sapiens
<400> 10
actgcaggtg ggtggtcagc tgcaacatgg cctggcagcc tggcccttga agcactacac 60
aggccacttc ctacaggaag cctccctgga tctccatatc ctcccctgag ctctgaacct 120
ttccatcata cttagaaata ctaataaaat gattaaagaa ggtgtgtctt taattgaagc 180
atgatttaaa gtaaatgcaa agctaaaaat cagatatatg gaaaataatt atttgtatta 240
tatagggcag agtcatgtta gtctggttcc tccaagaagc agactggaga tgggattaga 300
cccaatatgg tctgcagatt ttattagaag aaatgcccat gagaggaaat ggggagggag 360
ccagggaagg ctgggtgaac cagcagactg tgttgcaagt ataaccccac gtgaacgagg 420
gagggaggga aggttgggtg gaagcaccct gggtgccatg gagcctaagg aagtttcagc 480
aaggccctaa ggggttctgg agccaaagtc agtcatcaga ggagtcccat gactcccagg 540
aattggcctg ccttagtatt tctgctgtgc tcagccattg ggtagggcag cttcagtgca 600
atcacagcag tggatttgag ggtgcagctg ggatcttggt cagttgtgtt tcctatagtt 660
ggagaactgc caagccacag agttggagaa gagccacatc atgaaaagat ctctgaattg 720
gtgtctgggg atctgtgctc taattccgcc tcttgttact tacaagctga gccatgagga 780
ccaggtcaca ggacctcttt ggactgcagt ttccctctct gtaggcaggg atggtaactc 840
ctgccctgtt tccctaacca ctgccactcc ccaccctcta gggttgtcaa tgaaatgaat 900
tcaccaacat aaaatggttt tgaaaaatcc taaagagctc taccaatgtg agtgaccatt 960
atcactccta catgtgagga tgttctggaa ggcaaactcc atggaagcca gaacaaaatt 1020
gtgattcagt gggtagattc tgtgtgtaaa gcccagcccc ccaacacatg ggccagggca 1080
aatgagtcac ccgctatgtg ctcagttccc tcctctatgc aatggaccga ccgtgatcag 1140
attagggtta cctgaggatc gaatgaattg aaatgtgtaa attgccgagc acgtagtaac 1200
catgcaacaa gtgttagctc ctattatcct gtccctttga gggatggcac catatgggga 1260
cacagtgtgt gctgccatct cccttctacc ggcagatccc tttgcctgca ggggcctggc 1320
ctgcgagggc tctcaagagc ctttccctct gcccttttca agcctctgcc catctgtcct 1380
gggcatgtct ctgccagcag taagagctgg ttgggaccac actgagttct ctgtgacctg 1440
caggtcagct caccttggct cacaggctga acagaaatat actcagaaac cgattttcct 1500
atctctctgc ctggagggtg gtggagggct ggtttgggga agagtgggct agtgcattac 1560
atagggtggg agccaaacag gagctgcgcc ggtggaagca tgtgggagct agaagtgacg 1620
tctaggggtg ggggcgagct ttcaccatcg tgatggacac tgaaggagct ccccaccccc 1680
tgatcagcca ggaggataca cacggggctg aggtgcagaa tcaggggctc ctcagggaac 1740
tgcagctgct ctggtggggg gaaggttggg agcttccgtt ttggcttggc ctgggctgcc 1800
ctaatcacca ccccacccaa ttccagggac tagcataacg aagtgacacc ttggcacctg 1860
tggcacagcc tgagacacta ttcagtcctg ccttcctgcc cccttgggag tccctggggc 1920
tctgtgcact cac 1933
<210> 11
<211> 182
<212> DNA
<213> homo sapiens
<400> 11
cgtgagtgct ggctctggcc tggtgccacc cgcctatgcc cctccccctg ccgtccccgg 60
ccatcctgcc ccccagagtg ctgaggtgtg gggcgggcct tctggggcac agcctgggca 120
cagaggtggc tgtgcgaaga ggggctcggt ggcacagcgc tcaccccgcc tcccgccagc 180
ag 182
<210> 12
<211> 310
<212> DNA
<213> homo sapiens
<400> 12
ccctgcgttc tgaactcacg gtggctgctg cagtcctggt gctgttggtg attgtgatca 60
tctcacttat tgtcctggtt gtcatttgga aacaggtaga tattttctca taaaactaaa 120
gatctttgaa gccaatgaga acaagcatag caacctagtt cagtgcttgg cacagagaag 180
gagctcagca attacatgtg gagtgaacgt tgttggactc tactgtgtcc agtcactgtg 240
ctgcttcagt gaagctctgg tgcactggga ctttggtaat tcaccagtta cctgtcctgg 300
tcatttatag 310
<210> 13
<211> 7726
<212> DNA
<213> homo sapiens
<400> 13
gctttaggga aaaaaagaaa atattggttg atatgtttga agtattaatc ttctgcactg 60
aaatctttct acagaatata ttaagaggaa agacaacatt aaagaaatat tcagaggcgg 120
ggccaagatg gccgactaga agcaactccg ttcagaggtt cctattgaaa aaaaccataa 180
taagtgtgtg agtccttcac cggcaaggta tctagattcg ctcatcaaaa ttgactagaa 240
ggctggcgtg acccacagag agaaggaaga gcagtgagcc cacctgagaa ccacacgggg 300
aaggggaacc ccctcccctc cagccaaggg gagcggcgag cgagcaggct acccagccgg 360
ggaaattgct tttccaaaga actgtgcaac tcatggattg gaagatccca ctctcgatcc 420
catgccaccg aggcctagca tcccaaccct agaatgtaca gattcttatg gcctctcagc 480
tggaatctgc ctaagcttac tgaactccct gggggagggg tgaccagcac aggcttctgc 540
tgcctgctgt ctaagccctt tgagctcctt gagggagggg cagcagccag cactgggact 600
cccaactgcc taacacgcta atctccctgg gcggcgggga gaaatgcagc atccatttct 660
atagctccag gctgtgcttt tcccctgcgg gagccagcga ggctggacag cttggtccca 720
agacttgtcg ccacaaccca acacaccagc tgtggtagtc agcggccaga gtgcctcttc 780
aggtctaacc ctcacccatc cttcctcagt gggtggggct tccctgcaga atcttcagta 840
actgcagcca gaggctcagg gacagaattc agatctccct gggcctgagc ccctaggggg 900
aggggtggct gcagtctctg cggaccaaca gacttagcct ctcctcctgg tagttctgag 960
gaatctggga agcccagaca agtgggcttt cccacagcaa aacacaccct ctccaccagg 1020
ggacaaagtg cttcgttaaa tgggtcctcc tcctggtgcc acccaactgg gtgagaccct 1080
ccaacaggga ttgtcaggac accctataca ggagcgatcc tactggcatc aggttggtgc 1140
cccttgaagt cagaggtccc agaagaagga gcagacaccc atttttgctg ctctccagcc 1200
tccttgagtt acatatccag gcgtgggagc aaatcagatg aataaggcct aaagtgaacc 1260
ccagcaaact gcagcagccc tacagaagag ggaagtgact attgaaagaa aaacaaataa 1320
gcagaaagtg acaacaacag catcatcatc aacaacaaca acaagggccc ccacaaaaaa 1380
cccatacaag ggtcagcagc ctcaaagacc acaactagac aaactcacga aggtgagaaa 1440
gaaccaatga aaaaaatgct gaaaacccaa aaggccagag tgcctcttct cctctaaatg 1500
atcacaatgt ctccattaag ggtgcagaac tgggcggagg atcagatgga tgaactgaca 1560
gaagtaggct tcacaagatg ggtagaaaaa actatgatga gctaaaggag tatgttctaa 1620
cccaatgcga agaagctaag aaccttgata aaaagttgga ggaattgcta actagaataa 1680
tcagtttaga gaggaacaca aatggcctga tggggctgaa aaacacagca caagaacttc 1740
gtgaagcata cacaagtgtc aacagctgaa tcgaccaagt ggaagagaag atatcagagt 1800
ttgaagacta ccttattgaa ataagacatg ctgacaagaa gagagaaaaa agaatgaaaa 1860
ggaatgaata aagcctccaa gaaatatgag acttcataaa aagactgaac ctatgatagc 1920
ttggagtacc aggaggagat ggggaaaatg gaaacacgtg ggaaaacacc cttcgggata 1980
ttatccagga gaacttcccc aacctagcaa gacaggccaa catgcaaatt cggcaaacac 2040
agagaacacc attaagatac tccacgagaa gatcaacccc aagacacata atcatcagat 2100
tctccaaggt tgaaatcaag taaaaactgt taagggcagc cagagagaaa ggccaggtta 2160
cctacaaagg gacgcccatc agactaacag tggacctctc aacataaacc ctacaaacca 2220
gaagagattg ggggccaaca tcaacattct taaagaaaag aattttcaac ccagaatttc 2280
atatccagcc aaactaagct tcataagtga aggagaaata aaatcctttc cagacaagca 2340
aatgctgagg gattttgtta ccaccaggcc tgccctgcaa cagctcctga aataagcact 2400
aaatatggaa aggaaaaact ggtaccagcc attgcaaaaa cacaccaaac tataaagatc 2460
aatgacacta tgaagaaact gcatcaacta gcatgcaaaa taaccaaata gcatcatggt 2520
gacaggatca aactcacata acaataccta ccttaaatgt aaaggggcta aatgccccaa 2580
ttaaaagata cagactggca aattggataa ggagtcaaga cccattggtg tgttgtattc 2640
aggagatcta tcttacatgc aaagacacac acaggctcaa aataaaggga ttgaggaaaa 2700
tttaccaagc atatggaaag caaaaaaaaa aaaaaagagg gttgcaatcc tagtctctga 2760
caaaacagac tttaaaccaa caaagatcaa aatagacaaa gaagggcatt atataatggt 2820
aaagggaaca attcaacaag aagagttaac tattctgaat atatatgcac ccaatacaag 2880
agcacccaga ctcacaaagt aagttcttag agacctacaa agagacttag actgccacgc 2940
aatagtagtg ggaaacttca acaccccact gccagtatta gacagatcaa caagacagaa 3000
aattaacaag gatattcagg acttgaactt agctctggat caagtggacc tagtagatgt 3060
ctacagaact ttctagccca aatcaacaga atatacattc ttctgagtgc cacatggtac 3120
ttattctaaa atctaccaca taattggaag taaaacactc ctcagcaaat gcaaaagagc 3180
tgaaatcata acaaacagtc tctcagacca cagagcaatc aaattagaac ccaggattaa 3240
gaaactcact caaaaccaca caatttcctg gaaattgaac aacttgctcc tgaatggctc 3300
ctgggtaaat aatgaaatta aggcagaaat aaataagttc tttgaaacaa atgagaacag 3360
agacaatgta ccagaatctc tgggacacaa ctaaagcagt gttaagagga aaattcatag 3420
cactaaatgc ccacattaga aagccagaaa gatctcaaat cgtcacccta acatcacaat 3480
taaaagagct agagaggcaa gagcaaacta atccaaaagc tggcagaaga caagaaataa 3540
ctaagatcag agaagaactg aaggagacaa agacacaaaa agccctccaa aaaaaatcaa 3600
cacatccagg agccgttttt tttaaaaaat aaaataaata acaaaatata ccactagcta 3660
gagaaataaa gaaggagaca gagaagaatc aaatagacac aaaaaaaatg ataaagggga 3720
tatcaccact gaccccacag aaatacaaaa taccaccaga taatactata aactcttcta 3780
tgcaaataaa ctagaaaatc tagaagaaat ggatacattc ctggatgcat acaccaagac 3840
taaaccagga agaagttgaa tccctgacta gaccagtagc aagctctgga atggaggcag 3900
taattaatag actaccaacc aaaaaaagcc caggaccaga tggattcaca gctgaattct 3960
accagaaata caaagaggag ctggtaccat tccttctgaa actgttccaa acaatggaaa 4020
aggaggaatt ccttcctaac tcattttatg aagccagcat catcctgata ccaaaactgg 4080
gaagagacac aacaacaaac tttgggccaa tatacctgat gaacattgat gtaaaaatcc 4140
tcaataaaat actggcaaac tgaatccagc agcacatcaa aaaacatatc caccacgaac 4200
aagtcggctt catccctggg atgcaaggct gattcaacat atgcaaatca ataaatgtaa 4260
tccatcacat aaacagaacc aaagacaaaa atcacacgat tatctgaata gatgcagaaa 4320
aggcctttga taaaattcaa catcaacatc cctttatgtt aaaaactctc aataaactag 4380
gtttttatgg aacatatctc taaataataa gaactattta tgacaaacct acagccaata 4440
tcatattgaa tgagcaaaac ctggaagaat tccctttgaa aaccagtaca agacaagggt 4500
gtccactctc accactccta ttcaacatag tattggaagt tctggtcagg gcaatcaggc 4560
aagaggaaga aataaagggt attcaaatag gaagagagga agtcaagttg tctctgtttg 4620
cagatgacat gattttgtat ttagaaaacc ccatcatctc agcccaaaaa cttcttgaac 4680
tgataagcaa cttcagcaaa gtctcaagat aaaaaatcaa tgtgcaaaaa tcacaagcat 4740
tcctttacac caacaatagg caagcagaga gccaaatcat gaatgaactc ccattcacaa 4800
tagctacaaa gagaataaaa tacctacgaa tacagctaac aagggatgtg aaggacctct 4860
tcaaggaaaa ctacaaacca ttgctcaagg aaataagaaa ggacacaaat aaatggaaaa 4920
acattccatc cccatggaca ggaataatga gtatcatgaa aatggccatt ctgcccagag 4980
taatttatag attcaatgct attctcatct aactaccgtt gacattcttc atagaattag 5040
aaaaagttat tttaaatttc acatagaatc aaagaagacc ccatgtagcc aagacaatcc 5100
taagcaaaaa gaacaaactt ggaggcatca tgctacctga cttcaaacta tattacaaag 5160
ctacagtaac acagcatggt actggtacca aaacaaatat atagaccaat ggagcagaac 5220
agagacctca gaaattacac cacacatcta caaccatttg atctttgaca aacctaacaa 5280
aaacaagcaa tgaggaaagg atctcctatt tagtaaatgg tgctgggaaa actggctagc 5340
catatgcaga aaactgaaac tgggcccatt ccttaacctt atacaaaatt taactcaaga 5400
tggattaaac acttaaatgt aaaaaccaaa accataaaaa ccctagaaga aaacctaggc 5460
aataccattc aggacatagg catgggcaaa gacttcatga ctaaaacacc aaaagcaatg 5520
gcaacaaaag ccaaaataga caaatgggat ctaactaaac taaagagctt ctgtacagca 5580
aaagaaacta tcatcagagt gaacagacaa cctacagaat gggagaaaaa ttttgcaatc 5640
tatccatctg acaaagggct aatatccaga atgtacaagg aacttaaaca tatttacaag 5700
aaaaagacag acaaccccat caaaaagtgg gcaaaagata tgaacagaca cttctcaaaa 5760
agggatttat gcagccaata aacgtatgaa aaaagctcaa catcactgat catcagagga 5820
gtacaaatca aaactacaat gagataccat ctcacgcgag tcagaatggc aactattaaa 5880
aagtcaggaa acaatagatg ctgatgaggg tgtggagaaa taggaatact tttacactgt 5940
tggtggtaaa gtaaattatt tcaaccattg tggaagacag tatggcaatt cctcaaggat 6000
ctagaaccag aaataacatt tgacccagta atctcattat tgagtacata cccaaaggag 6060
tataaatcac tctactataa agacacatgc acatgtatgt ttactgcagc actgtttaca 6120
ataacaaaga catggaacca agccaatcca tcaatgacaa accagataaa gaaaatgtgg 6180
tacatataca ccatggaata ctatgcagcc ataagaagga atgagatcat gtcctttgca 6240
gggacatgga tgaagctgga agtcatcatc ctcagcaacc taacacagga acagagaaca 6300
aaacagcacg tgttctcact cataagtggg agttgaacat tgagaacaca tggatacaga 6360
gaggggaaca gcacacacca gggcctgttg agggatagga gctgagggga gggaacttag 6420
aggacaggtc aataggtgca gcaaaccacc atggcacatg tatacctatg taacaaccct 6480
gcacgttctg cacatgtatc ttatttttta agaagaaatt ttaaaaaaag aaatattcag 6540
aaatattctt atatgattac atatttttaa atgagcattt gaagttttta ttagtgatgg 6600
atttgatgaa ttggtgataa gattaacaat atatctcaac ttgaaacaaa ataagtgata 6660
aatgaaaata aagaaaacta tcataagttt tggagcattt tccctccatt ctttttttca 6720
aattttttta tttttagttc tggggtacat gtgcaggacg tgaaggtttg ttacatgggt 6780
aaacatgtcc catggtggtt tactacacct agcaaaccat cacctaggta ttaagcccag 6840
catgcattag ctatttttcc taatactctc tatcccccca cccctccccc tgacaggccc 6900
cagtgtgtgt tgttcccctc cttgtgtcca tgcgttctca ttgttcagct cccacttgta 6960
agtgagaaca cgcagtgttt ggttttctgt tcctgaatta gtttgctgag gttaatagct 7020
tccagcttca tccatatccc tgcaaaaaaa cattatctca ttccttttta tggctgcata 7080
gtatgccatg gtgtatatgt accacatttg cttcaaccag tctaatgttg acgggcattt 7140
gggttgattc caaatgattc attattgtga atagtgctac agtgaacata cgtgtgcatg 7200
tatctttgta atagaatgat ttatattcct ttgggtatgt aactagtaat gtaatttcta 7260
ggtcaaatgg tatttttggt tctagatctt tgttccttcc attcttatag agctcatctc 7320
agagttaagg tatatctttc agaacactag ttaattttta atgaacttct tatatttttc 7380
atcctagtat ctcaaatata gtagccaata aatatttttt gaacattcag taacactatt 7440
ttcatatagt tatcaccata aaattgtcat agctagacat gaaataagga tactgaaaga 7500
agaagtaatt ttgcccagtt caggatccag ccagacccag ccagtattat ttcattactg 7560
cctgcaaggt ctcctatatt ttctgaattt cttcattcaa gttctagaaa taataatgta 7620
ctgcttttaa agaacaattt catatatctc taggattagt gaaataagtg ataagaaaaa 7680
aactgaaaca cagagttttc tgagtattga gtatgttagt actcac 7726
<210> 14
<211> 2915
<212> DNA
<213> homo sapiens
<400> 14
tctgcaaaaa ataataaata cagaaaatat acatgacaat atacctgtta tttctagttg 60
ttcatagatc ttcttagtga ctgaacgcca gagagtgtcc tttggcacaa tttacccttg 120
acctcattcc tctcccataa tctggcaaca cagatgctaa cagcatggtt ttatagtgat 180
cctagtgagg catggagcca attaactcag cccaccaaga aaactgtgag taatcagtgg 240
tgaagagaga gctgagtacc tttttcctat actaacagca tgggtaaact ttctccagaa 300
ttccaaacct ataagacaat tattccatga tttttaactg ggaagtttcc attttctcaa 360
ttttcagtct tttacattat ttgtagttta cttatgccat atttcaataa aatacagaat 420
acaaaattga taaggaaagt gtgacagttc agctaccaaa gttatcatta tatctgagat 480
tctgaggctc gttgcttcct tttgtattga cctacattcc acctcaaagt caatccaatt 540
gtttttcatt tgaaacatgg aaggagcaca agggctgggt tcaaaagaca taactggaat 600
gactttttac agaatcatca aaggcaagct caaggtcttc cattatgtct tctctaacaa 660
tgaagaatat ttcaggtctg aaacttttca gaccgcaata gttttaggac ttggtgccaa 720
tccacggtaa gcttagggat atgtgggaga atctggttct attcctgcta attgactcat 780
ccttctgaag accaacagag agtgaaggct ggccctcata agaggcaggg aaagggtaag 840
aacatcggga gcagcagggc agcagagttg gtcacagctg ttccccggag ctgagggtcc 900
ctttaaggac catcctgagc aaagcattag gacagagtgt ttttacacat tttgtgacgt 960
ctcaccttta gcattggcca tttcactgtt taaccaaaca actctgatcc aaaagaaaga 1020
ggcccttgag aatttgtgaa gtggctctac acaatggcca ttgagaaaag aaagaagaat 1080
tctgatgttg gttgagcacc ttctatttac aacatactgt actggggctt tacataacgt 1140
tgttttaatt cactgagtcc acaacagctt aaagagataa gatagatatt atcatctcca 1200
ttttacagat gaggaaactt aagttcaaaa aaggaaaaga acaagcattt aaacatggtt 1260
tgtgtactgg attgagtcat gtcctcccaa aattcatacc cactcagaat attttaatgt 1320
gaccttgttt agaaataaga tcttgacaaa tgtaatcaag ttaagatgag gtcatagtag 1380
tttagggtgg accctaatcc aatgactggc acttgcataa gaagagggaa atttggacac 1440
agagaacacc ttgtgatgca ggaggtgatg atgacagtga tgcacctacg agccaaggaa 1500
taccaaggac tgccagtaaa cgccagaagc taagaggcaa agatggattc tgccctagaa 1560
ccatcagaac aagcagtccc gctgatacgt tggtttcaga cttctaacct ctagagctgt 1620
aagaataaat gtctactgtt tcaagccacc cagttggtgg tcctttattg tggcaaccct 1680
tggaaactaa taaggcttgt tcaactccca agttcatgca ctttgcactt ccactacccc 1740
atcagtgagt acacagagtc taactagagt gtcctgactg aaggacttat tttgagacac 1800
tgaagttaca acaatcattc agtcatccta tagtctatgt cctgacagtg gagacctgga 1860
gcaaggagta tgcaaagtat ttagatggag tcattttagt agcacttaag gtgttactca 1920
gggtaacaca caaaagaggt cctagcaaaa acctgatgtg tgacctgatt gatgaacatc 1980
attacagtca caaaccacca agacagttct gcaggttaga atgtatttca ctctgcatga 2040
aaagcagcaa cagaaacttc aaggaggttt caattagaaa taagggccaa gggaattctc 2100
tagtatgaac aggaacattt tttaaggtta tgggaatgcc agagccagat gaagcaaaaa 2160
tagatctaaa gatcaagttg ccaggactat aattatggaa gtgacttttg tccttggaac 2220
ttcttaaaag atggtttcat agtcctgtga gaggagtgtc tttggaattt ggaattctcc 2280
cctcaagttg gcatgaaatc agtccttcta agccagttat ggttcacgtg ctccccgtac 2340
tggccaggtc tgaggctgtt catcagtggc tggttttcat cgacggtgtg ttttcagtcc 2400
ctgggaacac attgcaaact gtaatcttcc caatgaatac agaatcctgt gtgacctcta 2460
cacttcagac catttcagaa cctgacctaa ttttacagta tgagaaatat ctacttcatc 2520
accatttctc actagagagt attcaccttg ctaaagcaaa ttatcatcag gaatttacat 2580
gccatcatta tttaacatta aacatcagct aagcttttta aacaaaactg atattaagtt 2640
aatactggtt gcatgagcct atgatcaaac aatttccata aagtgtcaat gagcagttag 2700
agatttctga gaatgacgtg atctgtttat aattagcatg ccaagaccaa cgtctaggaa 2760
ttgagcaaag aacgtaatga tgcatgtgag tcctttaact aaagatcttt gtgtttgtat 2820
ataaatacat ttgcataaat agtgttactt ttgattactt tataattatc ttcttagttc 2880
tttgtcattt acaagtactt tgcaaacaca catac 2915
<210> 15
<211> 1809
<212> DNA
<213> homo sapiens
<400> 15
tctaataata taaatcagaa aaagaaatta attcatagat aaaagctaag ttgccccagc 60
tctacctaag cacacagagt aatatagcag agctagctac tactggattt ttgcaagcca 120
gttgttagac cgttggtagc ttgaaagcat ccatacagac agtgtttatg ccatgtgaaa 180
tcaaaagcaa ggtgtttttg cttttttttg cagagagcaa caaaccactg gaatatatcc 240
actcaatctt ctactttaaa atgacttagg aaacatatat atctttttaa taaatttagg 300
accaagaaat ctcagtcttt ggatactaaa tagttggcat tattattttg tataatatct 360
tcatacatat ttaatttcat ggatattaaa ctgaggaata aacatggtaa tttctcttag 420
gtagtttcag ttgtgtagag gaaacaaaca cgtaggccag agtctggcaa actatggcat 480
gaggaccaaa tctggctata gcctgatttt gtacccccta ttagctatga ataagtttta 540
cctttgtaaa gtgttatttt taaaaagaag gagaaggaaa aagagaacag aaaaagaaga 600
aaagaagaac atgctacaga gatcacatgt agcctgcaaa gtctaacata tttactattt 660
ggttcttttc agaaaaagtt tgctgagctg ggtagcaaac ttctgtacac aactaactag 720
ataactaact ataatataaa caagaatcat gtaagtttta tatagcatgt gagtgtataa 780
aatgcaataa ttcatttgac taaggagcat caggtaagca ttatgatgag ttcatttaag 840
tcttgaagga tgagaagaat ttcaattggc agaaaataaa taataggaaa tcacagctaa 900
ggggcacagg gtaggtagtg gggacctgta ttctaggctg aggcaaacac agggccaaag 960
actaagtgac ataaaaactt tttactggtc tgatatggct acagcacaga cataaatatt 1020
ggaaaagata aaccacaatt ggaggataaa ttacagaaga cctcacatgc cacaaagaag 1080
tttgtagctg attctgaaag cagtaaatgg agagccattg tgggtatttc agagagggat 1140
taagtaatcc agcctgtgct tcaactaaat ttaactgtca gcagtatgcg taagtcaagg 1200
gcacaggcaa gaaatgatac cttaaattag gaaagccaag gtggaaagag gaagatgaga 1260
actcatcaga gaaaaatcaa gatggtaaaa tcaacaggac ctgattactg agtagaggga 1320
aaaatcacat atggcactga gatttcctgc ctatgtgatt agaaagacaa tatatcataa 1380
actaaaataa aatacacagt ggaagaggta gatattgggg aagaaacaaa ggtcttaggc 1440
ctgttatgta taatgtagga gtggtcataa ggctggtata atgtgaatag aattatatgg 1500
ctggatagaa cagattgtga acagccttgg aagcctaatt aggagcatgg aattgatgtg 1560
gtaggaatta agggggtggc tgattattat tggggagaaa aatgacatga tgataatgat 1620
gttttagaaa gatcacatca catgaatgga atagtttaat agtttggata ataagattat 1680
atatatatat atatatatat atatatatat atagtcacca ttatctattg ctaatgttaa 1740
gaatgtactg atatttatta ctgaaccttt aggtaataag ctagtgtgta gacagacatg 1800
gtaacatac 1809
<210> 16
<211> 2938
<212> DNA
<213> homo sapiens
<400> 16
actataaagg aaaaaatgac ataatttaca aaataaaata ttgcttcttt tttcctttag 60
gaaatgttaa cagtgcattt gaagtgtttt tatgcaagaa cactatcagt agaatagtta 120
tagaagtttt cataatttga ttttaaaata tcttataaaa aactaattaa atccaggtaa 180
aaagccatat ataagtacac aaatcatact acaccatttt taatctcact tcttaaaatt 240
taatgtattt cttactgttg ttataaacaa attaaagtat cttaatatta aaacttattt 300
gtcaaaatca cccataaacg agtcaaaata aaccaaaaca aacataatta ttagtgaaac 360
aaattcattt ttgagttcag tcacatccag gttatattcc tcagtagaaa agaaaatgct 420
ttcagtataa tggcaatttt tttttttttt ttttttgcag agtacaagag tgtttatcat 480
tgttgttcat atacacatac tcgaatatgt agaaaaagta ttggaacgaa gcttaccaaa 540
tgttagcagt ggtctgccct agttgtagaa tcatgagtaa tttgtactgt cttccttata 600
taataagcag tattagtttt ataataataa aattttttta atattaaaat acaattatgt 660
caataggatt gtcatctgta ctggactatt ggctcagaag ttgaaagcag caagcatgct 720
ttgagagatg atcattaaaa tttgaactta atttcacagt agcttctatg ttcaagaagt 780
tagagtttta ttcacatgaa attcaatttg aagggctaca cagtgaaaga tcacaagtac 840
cttttgctaa attaattttt ccaacttgaa atgttctcac cacctcgctt cacttttaaa 900
ggcccaatgt aagcccacat cctcaatgat gccttctgaa acctcagcaa cctctactaa 960
tctttcatat ctgaacttga aagactaatt gcgcctctct gtgagtgctt atcctatgca 1020
ctgtcttact tatttcatct atttttgtct tttgttatta tttaacacat atcttgctat 1080
ttgtcttccc acacaggcat gtcttaactc cctcattaaa tggcaagctc ctgaggtcag 1140
cagttgtatt ttacaggttt acattttccc ctactcccag cagaaggcta atgttatgca 1200
ttagatatga ctgctcagaa gcaaaggctg tcaacactca ttttaaaaat tgtctaattt 1260
tatgtttata actgatgagt gccctcagca caatacaaat tttaaaataa ttgtgactgt 1320
tttgttattt taattactca atcttttctc atgcacacac acgctcttac tagtaaaacc 1380
acatgcactg ctgctaaaag caaagaaccg aattagctta gctagactca aaaattcgtg 1440
aatttcaaac agaataaaga cctttaagtc ctgagaaagt cagatatcca taggatgtct 1500
tggaagcaca ataggttgtc tgaaattatc tcatgttcat ccactagagt tatgggttta 1560
aacaatggtg atgtacaaga aagcaagcaa aggtcagctg aaggattctt catgtaattc 1620
tccttcccag taggaaagca gacaagcagt caagcctata tgccaactgc caaatatact 1680
gcagtcatat gcgtaagtct ggaggggctg gcttagtggc acaaacatca gctgtgcaat 1740
acttagactc tctggaacca caggttaaaa tcctggcagg gtcagctgaa atttttagct 1800
ttccaagttt gctgaaggag tttcacatat tgtctgggtg gaatctttga aaaaaatctc 1860
aaatcgagct tcaaagtgct ctcataaaga ttgtgactcc aatcactttg cagaaagaat 1920
aaagacttag aacacagtaa agtgttggct gtctttatcc tgagagttca actttatgtt 1980
tgtgactttt ccatcaactt tcccttgtaa cttaccccta cttgtgaaca aaacaagcca 2040
caactttctt aatatgtgtt tgagtgttct tttctggtaa gaatcatgcc cttcttttaa 2100
tgattcagtg tgttggggac tctcaatatt agcaatagat aggggtccat atatcttata 2160
agcaaactcg gacagtttgg ggaatgaaag aaagtgctat tattatttgt gctgaaacag 2220
aaataaacaa gaatgtatga tcactgtgat aactctaaaa gtccaatcag tacttgacca 2280
ttccctttga ggtttttact gcattttatt atcattaaag taaatcttct tagaaaaaaa 2340
atagctttct atctacctaa cctaattttt ctgccttcct ggtcatttat aaatgagcag 2400
ggatttgaaa taagcagatc agatgtctga aagcaagagt cgatcccaca agccagaaat 2460
ggatcttctg caaaagaggc cctactcatt ccaaaccagc ctgtctgctt agaaaccaaa 2520
actatcccaa tcaaagattg tcactggcct cccattaatt ctatactttt ttctgtaccc 2580
agggttattt ttcttttatt tattttaaac cataagccac aaaacatttg tatgcagcca 2640
atcagaaata aatactgttt taaagaaacc taaaagttgg tgcccttgca agtagtttta 2700
tctaaagtat aacatgaaat gtacatgtat attttccata aaatagttat gcctagatca 2760
gaaaacaatt cacagaagtt agtggttata aatgtatagc caaaggtaac aatgtaaatt 2820
ttattaactt aatcaggcaa tatttcatgt gggagattag atcaactaag agataaatca 2880
atcaggtatg attaagtaaa cagtttgttg cctattttaa aaattctatt atacttac 2938
<210> 17
<211> 1229
<212> DNA
<213> homo sapiens
<400> 17
actgtaaaat agcaacattt ttgtctcccc accctccaca tatatagggt gtacaagttt 60
gtgttggtat tggtatttgt gtttgagaga gaaagaaata tctcatggct ttgcagtatt 120
gtgtgtttta tgtgacacgg tgatgtggaa ctttgggttc ctaattactt tactttacta 180
ttctacaacc ttttacccag acagagcatg atggtccact tctaggcacc ttaattttga 240
taaaaatata tatgtgtatg cattgcctca acacttttat tgtagcttgt tgagtcaaag 300
ttagtaggta ttaacttctt cagattgcca atttgtataa aaagctactg caaattagta 360
ataaatgcat ctgggtttat aagcttttct cttagctatt tcacacatgt gacatcttac 420
gtaaaacaaa atttactatg accaaaaaaa tcaaccccat caccataagg ttaactttaa 480
aaagccaagt ttctcacttg gaatactaca aggggggaaa atgctgctat gttaaaaatg 540
ctttcaattt ttaatagaga atcttgagta gcagatatgc tgagtatttg ctcaaaggaa 600
agtcacctct aaacagctga tttagatcac ctttgtgtct acttcaaatc ctttgttttt 660
acaccttgca ttataaattt ctgaaagcaa ggcctatgat catttaattc ctttttgcat 720
agatcctaat ataatgaacc tttgcataag acacttgaat attttcctta attatgacgg 780
caacaaaagt tcaaaactca tctatcttaa gaaggttttg tgggcaatca tcacacaact 840
tctgaaatgg agtaagattg acttaaggct gaccacgtaa cacaaggctc tcaaaactcc 900
tctcctctca aacactgcct ccaggtcaac caaccatgtt accatctatt ctcttcaatg 960
taatattttt ctccttcttt catttgtttt tgagctacat gacaaaatac tggaaactaa 1020
tggatttttc tgtatttttc ttaaaaccac ataattttcc atccatccca ggtcacattt 1080
gagagtggaa gaggaagtta ttaataatta tgccagaaaa actggtataa accatgactg 1140
tcttgggcaa tgcggaattc ataggcactc tccttactgt tgcccaccct ttgcctaggt 1200
gctccataat gatggccaaa gctacatac 1229
<210> 18
<211> 201
<212> DNA
<213> homo sapiens
<400> 18
attaaaggtg catttttgtt actgttcatt tttagaagtt accttaagaa cacagtcatt 60
acagtttaag attgtcgtcg attcttgtgt gctgtcttat atgtagtcca taaaacccat 120
gagttctggg cactgggtca aagtctcctg gggcccatga tagccgtctt taacaagctc 180
tttctttctc tctgttttaa g 201
<210> 19
<211> 241
<212> DNA
<213> homo sapiens
<400> 19
ggtatatttc agtttattgt tctgagaaat acctatacat atacctcagt gggttgtgac 60
attgttgttt atttttggtt ttgcatttat atttttataa aaacctaaag gaagtattta 120
cctctgccaa gtaagtattt gacacaaaat tacatggctc ttaattttaa aagaacccat 180
gtatatatta cattatgatt ttagagtcca taagctctca tttcacaaaa aggttaattt 240
g 241
<210> 20
<211> 1848
<212> DNA
<213> homo sapiens
<400> 20
ggtgagggtc cctgcggggc agggaagatc ccctgccctc cccagctgcc ttccagggag 60
ggaggccagc tggggagaca gaggccatcc tgtgaggggc tgccaacgct gggcagacga 120
ggcctgtgtt ctgcccccat ttccataggg cgctgtgtgg ggacagtctg tggggtggga 180
ctgtgatgag gtgccgttcc catctaggtg agaggcagtg gtcagggtca cagcatcggg 240
caggggagca gcagtgtgga tggaggggca ctgaagtcag aagggggtgc ctttctgggg 300
agcctggcct gcaggtctgc atgtgctact cagagcctcc aggctgtgcc gagtatcctg 360
gagcctcctt gtcccggcca ggcaggcctc tgccctctcc tggtggtggc ctgccccttc 420
agtgttccta ctagcactgt ccagggcgct ggaagccaag cccagttctg gaagtaacag 480
aggctcagag ccaagggtgt gagtgaacgg tgagccacgc agcttatggt ggcgtgaata 540
gctcctcggc aggagcctcc agggaggaag ctgagcaccc agtggccaca gggccctggc 600
agttcccatc tcaggctggg aggtggcctg ggattcctgg gaggggccat atcccacagt 660
gcagctcagc ctgaggcctc ggccctggag cctccgttca ggcaacaccc agccctcggt 720
aagggtgtga gccaaggagg ccttcccaga tgtggccact gccgcttccc caccagcttt 780
cctaattggt ggtccccatc ctggcctggc tgcagcttag cctcatggca gggctctagg 840
atgagccacc agagtccttc ataaacccag tgggtttgtg tgaggctgcc caggaaggcc 900
gcactggtct gggctgctgc tggcagagac caccacccta accccagtca gctccagagt 960
cacactcatc agcaccaggt cttggaccca tgactcaacc tcagtatttg agaggatcag 1020
gttgatgtcg ccctcatgtg cttattgcag tctctagagt gtggtaaaca ggtttccagt 1080
gccagctgtg gaggtgacag cggcagggaa gccatggcag tgtcgacact gaccttgact 1140
gtgggttccc agggaatgtg gggccagacc aggacagccc aggagcagga gacctggggt 1200
gacggatgcc cagagctggc acatcaaggg agggttcctg gatcatggca ggctttggcc 1260
tccctggtca gagttcaagt actgggggcc agggtggggg tctgggaagg catccggagc 1320
agtcccaagt gggcccaatg tgtggataga actttggtgg gagggcaggg tggtagtgcc 1380
agcaggcagg gtgagcgggt gcgtgagggc cagtggcagc ccttgaggag cagtgcttcc 1440
acactctgag gcggaacatg gtggcgcctt tctttgcagg ggtggctatg tagagaagtt 1500
gtcctggaca cttccactgt agtcagaggt cctgggctgg gcctggtgct catttagtcc 1560
tggggcaggg gtcaggggag acagtagacc aggaaccaga gagggtcgaa gtactgagtc 1620
caagccatgc tgtgaccaca cctgtcatgt agcagctttc aggggcctgg ctgtggggtc 1680
ctgcccaggg cagagacagg cagcgttgcc gctggctcag atgacagccg gttctctgca 1740
cattggaact tgtccatggg gcctccttta agggtcttgc cttcttcctc ccctgtcatc 1800
ctcacacttt tcccccctct tctccccctt ccctcatttc caacatag 1848
<210> 21
<211> 156
<212> DNA
<213> homo sapiens
<400> 21
ggagcaaaga atctgcagag tgttgtgctt agtaaaatga attttgaatc ttttgtaaaa 60
gatcttcttc tggttcgtca gtatagagtt gaagtttata agaatagagc tggaaataag 120
gcatccaagg agaatgattg gtatttggca tataag 156
<210> 22
<211> 148
<212> DNA
<213> homo sapiens
<400> 22
gataattcaa agaggaggaa ttctgatcac agaaagaaaa aaagctgact tttccacaaa 60
agacatttat caggacctca accggttgtt gaaaggcaaa aagggagagc agatgaatag 120
tgctgtattg ccagaaatgg agaatcag 148
<210> 23
<211> 152
<212> DNA
<213> homo sapiens
<400> 23
ggcttggacc ctggcaaaca gattaaactg gattccagtg cacagtttgg atattacttt 60
cgtgtaacct gtaaggaaga aaaagtcctt cgtaacaata aaaactttag tactgtagat 120
atccagaaga atggtgttaa atttaccaac ag 152
<210> 24
<211> 151
<212> DNA
<213> homo sapiens
<400> 24
ggttgcagtt tcatcactgt ctgcggtaat caagttttta gaactcttat cagatgattc 60
caactttgga cagtttgaac tgactacttt tgacttcagc cagtatatga aattggatat 120
tgcagcagtc agagccctta acctttttca g 151
<210> 25
<211> 247
<212> DNA
<213> homo sapiens
<400> 25
ggctatgtag aaccaatgca gacactcaat gatgtgttag ctcagctaga tgctgttgtc 60
agctttgctc acgtgtcaaa tggagcacct gttccatatg tacgaccagc cattttggag 120
aaaggacaag gaagaattat attaaaagca tccaggcatg cttgtgttga agttcaagat 180
gaaattgcat ttattcctaa tgacgtatac tttgaaaaag ataaacagat gttccacatc 240
attactg 247
<210> 26
<211> 91
<212> DNA
<213> homo sapiens
<400> 26
ggtgaaagta cattttttgt tgaattaagt gaaactgcca gcatactcat gcatgcaaca 60
gcacattctc tggtgcttgt ggatgaatta g 91
<210> 27
<211> 89
<212> DNA
<213> homo sapiens
<400> 27
gtctttcttt gaagcagcaa gtatgatgag caagctttct cacaagcatt tggttttaaa 60
ttatggagta tgtgtctgtg gagacgaga 89
<210> 28
<211> 120
<212> DNA
<213> homo sapiens
<400> 28
gagcaaagaa tctgcagagt gttgtgctta gtaaaatgaa ttttgaatct tttgtaaaag 60
atcttcttct ggttcgtcag tatagagttg aagtttataa gaatagagct ggaaataagg 120
<210> 29
<211> 120
<212> DNA
<213> homo sapiens
<400> 29
atgaattttg aatcttttgt aaaagatctt cttctggttc gtcagtatag agttgaagtt 60
tataagaata gagctggaaa taaggcatcc aaggagaatg attggtattt ggcatataag 120
<210> 30
<211> 120
<212> DNA
<213> homo sapiens
<400> 30
acctcaaccg gttgttgaaa ggcaaaaagg gagagcagat gaatagtgct gtattgccag 60
aaatggagaa tcaggtacat ggattataaa tgtgaattac aatatatata atgtaaatat 120
<210> 31
<211> 120
<212> DNA
<213> homo sapiens
<400> 31
ataattcaaa gaggaggaat tctgatcaca gaaagaaaaa aagctgactt ttccacaaaa 60
gacatttatc aggacctcaa ccggttgttg aaaggcaaaa agggagagca gatgaatagt 120
<210> 32
<211> 120
<212> DNA
<213> homo sapiens
<400> 32
gtaggtattt atggaatact ttttcttttc ttcttgatta tcaaggcttg gaccctggca 60
aacagattaa actggattcc agtgcacagt ttggatatta ctttcgtgta acctgtaagg 120
<210> 33
<211> 120
<212> DNA
<213> homo sapiens
<400> 33
ttccagtgca cagtttggat attactttcg tgtaacctgt aaggaagaaa aagtccttcg 60
taacaataaa aactttagta ctgtagatat ccagaagaat ggtgttaaat ttaccaacag 120
<210> 34
<211> 120
<212> DNA
<213> homo sapiens
<400> 34
atccagtggt atagaaatct tcgattttta aattcttaat tttaggttgc agtttcatca 60
ctgtctgcgg taatcaagtt tttagaactc ttatcagatg attccaactt tggacagttt 120
<210> 35
<211> 120
<212> DNA
<213> homo sapiens
<400> 35
tttttagaac tcttatcaga tgattccaac tttggacagt ttgaactgac tacttttgac 60
ttcagccagt atatgaaatt ggatattgca gcagtcagag cccttaacct ttttcaggta 120
<210> 36
<211> 120
<212> DNA
<213> homo sapiens
<400> 36
atatctgttt attattcagt attcctgtgt acattttctg tttttatttt tatacaggct 60
atgtagaacc aatgcagaca ctcaatgatg tgttagctca gctagatgct gttgtcagct 120
<210> 37
<211> 120
<212> DNA
<213> homo sapiens
<400> 37
ttgctcacgt gtcaaatgga gcacctgttc catatgtacg accagccatt ttggagaaag 60
gacaaggaag aattatatta aaagcatcca ggcatgcttg tgttgaagtt caagatgaaa 120
<210> 38
<211> 120
<212> DNA
<213> homo sapiens
<400> 38
aaggaagaat tatattaaaa gcatccaggc atgcttgtgt tgaagttcaa gatgaaattg 60
catttattcc taatgacgta tactttgaaa aagataaaca gatgttccac atcattactg 120
<210> 39
<211> 120
<212> DNA
<213> homo sapiens
<400> 39
ttaaggtgaa agtacatttt ttgttgaatt aagtgaaact gccagcatac tcatgcatgc 60
aacagcacat tctctggtgc ttgtggatga attaggtaag acattaaact tctcatttga 120
<210> 40
<211> 120
<212> DNA
<213> homo sapiens
<400> 40
ttccttagtc tttctttgaa gcagcaagta tgatgagcaa gctttctcac aagcatttgg 60
ttttaaatta tggagtatgt gtctgtggag acgagagtaa gtaaaactac aggctttcta 120

Claims (11)

1.一种用于同时检测多种突变类型的序列组合,所述序列组合包括:
1)如下基因的所有CDS区域:FGFR1、NTRK1、ALK、FGFR2、APC、PIK3CA、AR、PMS2、ATM、PTCH1、PTEN、BRAF、BRCA1、BRCA2、KIT、RB1、CCND1、KRAS、RET、CDK4、MAP2K1、ROS1、CDK6、SMARCA4、CDKN2A、MET、SMO、MLH1、DDR2、MSH2、STK11、EGFR、MSH6、TP53、ERBB2、TSC1、NF1、TSC2、FBXW7、NRAS;
2)以下区域:AKT1外显子3;ESR1外显子4-8;CTNNB1外显子3;FGFR3外显子7,9,14-18;FLT3外显子14,15,20;HRAS外显子2,3;MAP2K2外显子2-4,6,7;MTOR外显子19,30,39,40,43-45,47,48,53,56;IDH1外显子4;IDH2外显子4;JAK2外显子14;PDGFRA外显子12-18;PTPN11外显子3,13;RAF1外显子3,4,6,7,10,14,15,17;SRC外显子14;VHL外显子1-3;序列SEQ ID NO.8;
所述序列组合优选还包括:3)序列:SEQ ID NO.9-SEQ ID NO.20;
所述序列组合优选还包括:4):SEQ ID NO.1和SEQ ID NO.2。
2.一种用于同时检测多种突变类型的探针,所述探针包括:
针对权利要求1的序列组合第1)-3)项中序列的探针;以及
SEQ ID NO.1和SEQ ID NO.2。
3.根据权利要求2所述的探针,所述探针长度为100nt-140nt,优选110nt-130nt,最优选120nt。
4.根据权利要求2或3所述的探针,所述探针包括:
针对权利要求1的序列组合第1)-3)项中除序列区间SEQ ID NO.21-SEQ ID NO.27之外的序列的探针;以及
序列SEQ ID NO.28-SEQ ID NO.40。
5.根据权利要求4所述的探针,所述探针覆盖所述序列组合1)-3)项中除序列区间SEQID NO.21-SEQ ID NO.27之外的全部序列。
6.根据权利要求2所述的探针,所述探针还包括:
针对如下序列的探针:权利要求1的序列组合第1)-3)项中序列及其在染色体上前后小于150nt,优选小于120nt,更优选小于80nt的序列。
7.一种用于同时检测多种突变类型的基因芯片,所述基因芯片上包括权利要求2-6任一项所述的探针。
8.一种用于同时检测多种突变类型的试剂盒,所述试剂盒包括权利要求2-6任一项所述的探针或权利要7所述的基因芯片。
9.根据权利要求7所述的试剂盒,所述试剂盒还包括文库构建试剂、探针杂交洗脱试剂、引物和接头以及核酸纯化试剂。
10.一种用于同时检测多种突变类型的方法,所述方法包括以下步骤:
1)探针设计,针对权利要求1的序列组合第1)-3)项中序列设计并合成探针;
2)DNA提取,提取待检测样本中gDNA和/或cfDNA;
3)文库构建,将提取的DNA构建样本文库;
4)杂交捕获,将所述样本文库采用步骤1)合成的探针进行杂交捕获;
5)上机测序,例如使用Illumina测序平台或BGI-seq 500测序仪,将步骤4)得到的捕获序列测序产生测序数据;
6)信息分析,进行变异检测和注释。
11.根据权利要求10所述的方法,所述方法还包括步骤:
7)结果解读,根据检测出来的变异判断其与靶向药物疗效和预后的关系。
CN201610994059.6A 2016-11-11 2016-11-11 用于同时检测多种突变类型的序列组合和探针 Pending CN106480205A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610994059.6A CN106480205A (zh) 2016-11-11 2016-11-11 用于同时检测多种突变类型的序列组合和探针

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610994059.6A CN106480205A (zh) 2016-11-11 2016-11-11 用于同时检测多种突变类型的序列组合和探针

Publications (1)

Publication Number Publication Date
CN106480205A true CN106480205A (zh) 2017-03-08

Family

ID=58272166

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610994059.6A Pending CN106480205A (zh) 2016-11-11 2016-11-11 用于同时检测多种突变类型的序列组合和探针

Country Status (1)

Country Link
CN (1) CN106480205A (zh)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104745697A (zh) * 2015-03-24 2015-07-01 济南艾迪康医学检验中心有限公司 检测nf1基因第31-34号全外显子的方法和引物
CN106906297A (zh) * 2017-04-13 2017-06-30 常州桐树生物科技有限公司 检测肿瘤耐药性变异的检测剂
CN107858426A (zh) * 2017-08-22 2018-03-30 上海派森诺生物科技股份有限公司 一种用于肿瘤个体化用药16个基因热点检测的杂交捕获试剂盒及其方法
CN108192971A (zh) * 2018-02-02 2018-06-22 厦门基源医疗科技有限公司 一种林奇综合征相关基因变异的检测方法
CN108277263A (zh) * 2018-04-13 2018-07-13 江西海普洛斯医学检验实验室有限公司 一种检测braf基因v600e的引物探针组合物及其检测方法
CN108410979A (zh) * 2018-05-25 2018-08-17 安徽华大医学检验所有限公司 一种同时检测单基因疾病和染色体疾病的芯片及其应用
CN108486235A (zh) * 2018-03-07 2018-09-04 北京圣谷智汇医学检验所有限公司 一种高效经济检测融合基因的方法和体系
CN108486251A (zh) * 2018-04-16 2018-09-04 南京大学(苏州)高新技术研究院 一种用于快速诊断与鉴别诊断bhd综合征的目标基因捕获测序方法及应用
CN108588201A (zh) * 2018-05-11 2018-09-28 浙江省人民医院 一种结直肠癌西妥昔单抗耐药性痕量dna突变检测的方法及装置
CN108707658A (zh) * 2018-06-12 2018-10-26 东莞博奥木华基因科技有限公司 一种个体化用药基因检测试剂盒及应用
CN109136371A (zh) * 2018-07-25 2019-01-04 南京世和基因生物技术有限公司 一种放疗疗效和毒性反应相关基因组合、检测探针库以及检测试剂盒
CN109385666A (zh) * 2017-08-02 2019-02-26 深圳华大基因股份有限公司 淋巴瘤基因捕获芯片及其应用
CN109427412A (zh) * 2018-11-02 2019-03-05 北京吉因加科技有限公司 用于检测肿瘤突变负荷的序列组合和其设计方法
CN109504776A (zh) * 2017-12-29 2019-03-22 上海桐树生物科技有限公司 用于肿瘤基因变异检测的试剂盒、引物、探针和检测剂
CN109554475A (zh) * 2018-12-29 2019-04-02 江苏为真生物医药技术股份有限公司 用于肺结节良恶性鉴别的基因突变/融合组合及试剂盒
CN109610010A (zh) * 2018-12-19 2019-04-12 益善生物技术股份有限公司 一种egfr基因的fish探针的制备方法
CN109722470A (zh) * 2017-10-27 2019-05-07 希森美康株式会社 品质评价方法、装置、程序、记录介质、及品质管理试样
CN110218797A (zh) * 2019-07-26 2019-09-10 上海思路迪医学检验所有限公司 Fgfr基因融合探针、检测方法和试剂盒
CN111009288A (zh) * 2019-11-28 2020-04-14 苏州元德基因生物科技有限公司 一种cebpa基因的探针设计方法及其应用
CN111118610A (zh) * 2018-10-31 2020-05-08 深圳华大基因股份有限公司 用于基因突变高深度测序的基因芯片及其制备方法和应用
CN112029865A (zh) * 2020-09-18 2020-12-04 武汉弘康健基因诊断技术有限公司 用于同时检测多种基因突变类型的探针组、基因芯片及其应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110008347A1 (en) * 2006-12-01 2011-01-13 Agency For Science ,Technology And Research Cancer-related protein kinases
CN105512142A (zh) * 2014-09-26 2016-04-20 深圳华大基因股份有限公司 基因变异与药物关系数据库和数据库系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110008347A1 (en) * 2006-12-01 2011-01-13 Agency For Science ,Technology And Research Cancer-related protein kinases
CN105512142A (zh) * 2014-09-26 2016-04-20 深圳华大基因股份有限公司 基因变异与药物关系数据库和数据库系统

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
FERGA C. GLEESON等: "Somatic STK11 and Concomitant STK11/KRAS Mutational Frequency in Stage IV Lung Adenocarcinoma Adrenal Metastases", 《J THORAC ONCOL.》 *
M. JAMAL-HANJANI等: "Detection of ubiquitous and heterogeneous mutations in cell-free DNA from patients with early-stage non-small-cell lung cancer", 《ANNALS OF ONCOLOGY》 *
PAIVI PELTOMAKI: "Lynch syndrome genes", 《FAMILIAL CANCER》 *
SHI-YI YANG等: "EGFR exon 19 in-frame deletion and polymorphisms of DNA repair genes in never-smoking female lung adenocarcinoma patients", 《INT. J. CANCER》 *
SOLANGE PETERS等: "Treatment and detection of ALK-rearranged NSCLC", 《LUNG CANCER》 *

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104745697A (zh) * 2015-03-24 2015-07-01 济南艾迪康医学检验中心有限公司 检测nf1基因第31-34号全外显子的方法和引物
CN106906297A (zh) * 2017-04-13 2017-06-30 常州桐树生物科技有限公司 检测肿瘤耐药性变异的检测剂
CN109385666A (zh) * 2017-08-02 2019-02-26 深圳华大基因股份有限公司 淋巴瘤基因捕获芯片及其应用
CN107858426A (zh) * 2017-08-22 2018-03-30 上海派森诺生物科技股份有限公司 一种用于肿瘤个体化用药16个基因热点检测的杂交捕获试剂盒及其方法
CN107858426B (zh) * 2017-08-22 2021-04-09 上海派森诺生物科技股份有限公司 一种用于肿瘤个体化用药16个基因热点检测的杂交捕获试剂盒及其方法
CN109722470A (zh) * 2017-10-27 2019-05-07 希森美康株式会社 品质评价方法、装置、程序、记录介质、及品质管理试样
CN109504776A (zh) * 2017-12-29 2019-03-22 上海桐树生物科技有限公司 用于肿瘤基因变异检测的试剂盒、引物、探针和检测剂
CN108192971A (zh) * 2018-02-02 2018-06-22 厦门基源医疗科技有限公司 一种林奇综合征相关基因变异的检测方法
CN108192971B (zh) * 2018-02-02 2020-10-16 厦门基源医疗科技有限公司 一种林奇综合征相关基因变异的检测方法
CN108486235A (zh) * 2018-03-07 2018-09-04 北京圣谷智汇医学检验所有限公司 一种高效经济检测融合基因的方法和体系
CN108277263A (zh) * 2018-04-13 2018-07-13 江西海普洛斯医学检验实验室有限公司 一种检测braf基因v600e的引物探针组合物及其检测方法
CN108486251A (zh) * 2018-04-16 2018-09-04 南京大学(苏州)高新技术研究院 一种用于快速诊断与鉴别诊断bhd综合征的目标基因捕获测序方法及应用
CN108588201A (zh) * 2018-05-11 2018-09-28 浙江省人民医院 一种结直肠癌西妥昔单抗耐药性痕量dna突变检测的方法及装置
CN108410979A (zh) * 2018-05-25 2018-08-17 安徽华大医学检验所有限公司 一种同时检测单基因疾病和染色体疾病的芯片及其应用
CN108707658A (zh) * 2018-06-12 2018-10-26 东莞博奥木华基因科技有限公司 一种个体化用药基因检测试剂盒及应用
CN108707658B (zh) * 2018-06-12 2019-09-17 东莞博奥木华基因科技有限公司 一种个体化用药基因检测试剂盒及应用
CN109136371A (zh) * 2018-07-25 2019-01-04 南京世和基因生物技术有限公司 一种放疗疗效和毒性反应相关基因组合、检测探针库以及检测试剂盒
CN109136371B (zh) * 2018-07-25 2019-11-01 南京世和基因生物技术有限公司 一种放疗疗效和毒性反应相关基因组合、检测探针库以及检测试剂盒
CN111118610A (zh) * 2018-10-31 2020-05-08 深圳华大基因股份有限公司 用于基因突变高深度测序的基因芯片及其制备方法和应用
CN109427412A (zh) * 2018-11-02 2019-03-05 北京吉因加科技有限公司 用于检测肿瘤突变负荷的序列组合和其设计方法
CN109427412B (zh) * 2018-11-02 2022-02-15 北京吉因加科技有限公司 用于检测肿瘤突变负荷的序列组合和其设计方法
CN109610010A (zh) * 2018-12-19 2019-04-12 益善生物技术股份有限公司 一种egfr基因的fish探针的制备方法
WO2020134950A1 (zh) * 2018-12-29 2020-07-02 江苏为真生物医药技术股份有限公司 用于肺结节良恶性鉴别的基因突变/融合组合及试剂盒
CN109554475A (zh) * 2018-12-29 2019-04-02 江苏为真生物医药技术股份有限公司 用于肺结节良恶性鉴别的基因突变/融合组合及试剂盒
CN110218797A (zh) * 2019-07-26 2019-09-10 上海思路迪医学检验所有限公司 Fgfr基因融合探针、检测方法和试剂盒
CN110218797B (zh) * 2019-07-26 2023-03-31 上海思路迪医学检验所有限公司 Fgfr基因融合探针、检测方法和试剂盒
CN111009288A (zh) * 2019-11-28 2020-04-14 苏州元德基因生物科技有限公司 一种cebpa基因的探针设计方法及其应用
CN111009288B (zh) * 2019-11-28 2023-08-29 苏州元德友勤医学检验所有限公司 一种cebpa基因的探针设计方法及其应用
CN112029865A (zh) * 2020-09-18 2020-12-04 武汉弘康健基因诊断技术有限公司 用于同时检测多种基因突变类型的探针组、基因芯片及其应用

Similar Documents

Publication Publication Date Title
CN106480205A (zh) 用于同时检测多种突变类型的序列组合和探针
CN107475375B (zh) 一种用于与微卫星不稳定性相关微卫星位点进行杂交的dna探针库、检测方法和试剂盒
AU2020264326B2 (en) Detection and treatment of disease exhibiting disease cell heterogeneity and systems and methods for communicating test results
CN108753967A (zh) 一种用于肝癌检测的基因集及其panel检测设计方法
US11142798B2 (en) Systems and methods for monitoring lifelong tumor evolution field of invention
Uzilov et al. Development and clinical application of an integrative genomic approach to personalized cancer therapy
CN104630375B (zh) 癌症基因突变及基因扩增检测
Endris et al. Molecular diagnostic profiling of lung cancer specimens with a semiconductor-based massive parallel sequencing approach: feasibility, costs, and performance compared with conventional sequencing
CN105518151B (zh) 循环核酸肿瘤标志物的鉴别和用途
CN103403181B (zh) ncRNA及其用途
CN106834515B (zh) 一种检测met基因14外显子突变的探针库、检测方法和试剂盒
CA3100345A1 (en) Cell-free dna for assessing and/or treating cancer
CN109427412A (zh) 用于检测肿瘤突变负荷的序列组合和其设计方法
CN107475370A (zh) 用于肺癌诊断的基因群和试剂盒及诊断方法
CN106650312A (zh) 一种用于循环肿瘤dna拷贝数变异检测的装置
CN104745679A (zh) 一种无创检测egfr基因突变的方法及试剂盒
US9944993B2 (en) Method for enrichment of circulating tumor DNA and reagent for enrichment of circulating tumor DNA
CN108517360A (zh) 一种循环肿瘤游离dna突变检测质控品及其制备方法
CN112626213A (zh) 基于二代测序技术的肝癌检测panel、试剂盒及其应用
WO2011073665A1 (en) Diagnostic methods based on somatically acquired rearrangement
CN110343748A (zh) 基于高通量靶向测序分析肿瘤突变负荷的方法
CN107475403A (zh) 从外周血游离dna中检测循环肿瘤dna的方法、试剂盒及其测序结果的分析方法
CN111424087A (zh) 基于二代测序的用于泛癌种检测或靶向用药的检测Panel、试剂盒及应用
CN106845154A (zh) 一种用于ffpe样本拷贝数变异检测的装置
CN106498079A (zh) 基于高通量测序检测人kras基因变异的质控方法及试剂盒

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170308