CN112592976B - 一种检测met基因扩增的方法及装置 - Google Patents

一种检测met基因扩增的方法及装置 Download PDF

Info

Publication number
CN112592976B
CN112592976B CN202011604267.3A CN202011604267A CN112592976B CN 112592976 B CN112592976 B CN 112592976B CN 202011604267 A CN202011604267 A CN 202011604267A CN 112592976 B CN112592976 B CN 112592976B
Authority
CN
China
Prior art keywords
sample
copy number
chromosome
met gene
quality control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011604267.3A
Other languages
English (en)
Other versions
CN112592976A (zh
Inventor
许明炎
周衍庆
陈亚如
陈实富
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Haplox Biotechnology Shenzhen Co ltd
Original Assignee
Haplox Biotechnology Shenzhen Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Haplox Biotechnology Shenzhen Co ltd filed Critical Haplox Biotechnology Shenzhen Co ltd
Priority to CN202011604267.3A priority Critical patent/CN112592976B/zh
Publication of CN112592976A publication Critical patent/CN112592976A/zh
Application granted granted Critical
Publication of CN112592976B publication Critical patent/CN112592976B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Abstract

一种检测MET基因扩增的方法及装置,该方法包括:拷贝数变异分析步骤,包括分析比对到参考基因组上的待测样本、相应的正常对照样本的测序数据中,7号染色体上MET基因的拷贝数,以及7号染色体的拷贝数,判断MET基因拷贝数扩增类型。通过对7号染色体上MET基因的拷贝数、7号染色体的拷贝数进行分析,可准确判断基因拷贝数扩增类型,区别整体染色体重复与和局部区域基因的重复导致的MET基因拷贝数扩增,对临床用药、新药筛选等具有重要的指导意义。

Description

一种检测MET基因扩增的方法及装置
技术领域
本发明涉及肿瘤基因检测技术领域,具体涉及一种检测MET基因扩增的方法及装置。
背景技术
MET基因位于人类7号染色体长臂,含有21个外显子,其编码的c-MET蛋白是肝细胞生长因子(HGF)的酪氨酸激酶受体,HGF与c-MET结合激活下游信号通路,促进细胞增殖、生长、迁移、血管生成。当MET基因出现异常时,主要表现为c-MET蛋白过表达、MET基因突变和MET基因扩增,会持续激活相关通路,导致癌细胞不断增殖和转移。MET基因扩增被认为是EGFR TKIs抑制剂获得性耐药的机制之一。因此MET基因的扩增在指导肿瘤临床治疗至关重要。
目前可以检测MET基因扩增的方法有荧光原位杂交(FISH)和荧光定量PCR技术。利用FISH技术从基因水平上进行检测MET基因扩增是目前行业公认的金标准,通过计算MET基因探针与7号染色体着丝粒(CEP7)探针杂交信号之比来判断MET基因是否有扩增,将检测结果小于1.8定义为阴性;1.8-2.2范围内无法准确界定,为疑似阳性;大于2.2定义为阳性。然而FISH检测MET基因扩增的错误率较高。而荧光定量PCR方法虽然重复性、特异性较好,但由于其技术本身原因导致定量的准确度不足,灵敏度较差。
发明内容
根据第一方面,在一些实施例中,为解决上述技术问题,提供一种检测MET基因扩增的方法,包括:
拷贝数变异分析步骤,包括分析比对到参考基因组上的待测样本、相应的正常对照样本的测序数据中,7号染色体上MET基因的拷贝数,及7号染色体的拷贝数,判断基因拷贝数扩增类型。
根据第二方面,在一些实施例中,提供一种检测MET基因扩增的系统,包括:
拷贝数变异分析装置,用于分析比对到参考基因组上的待测样本、相应的正常对照样本的测序数据中,7号染色体上MET基因的拷贝数,及7号染色体的拷贝数,判断基因拷贝数扩增类型。
根据第三方面,在一些实施例中,提供一种装置,包括:
存储器,用于存储程序;
处理器,用于通过执行所述存储器存储的程序以实现如第一方面所述的方法。
根据第四方面,在一些实施例中,提供一种计算机可读存储介质,其上存储有程序,所述程序能够被处理器执行以实现如第一方面所述的方法。
依据上述实施例的一种检测MET基因扩增的方法及装置,通过对7号染色体上MET基因的拷贝数、整个7号染色体的拷贝数进行分析,可准确判断基因拷贝数扩增类型,区别整体染色体重复与和局部区域基因的重复导致的MET基因拷贝数扩增,对临床用药、新药筛选等具有重要的指导意义。
附图说明
图1为显示为一实施例的流程图。
具体实施方式
下面通过具体实施方式结合附图对本发明作进一步详细说明。其中不同实施方式中类似元件采用了相关联的类似的元件标号。在以下的实施方式中,很多细节描述是为了使得本申请能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。在某些情况下,本申请相关的一些操作并没有在说明书中显示或者描述,这是为了避免本申请的核心部分被过多的描述所淹没,而对于本领域技术人员而言,详细描述这些相关操作并不是必要的,他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。
另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书和附图中的各种顺序只是为了清楚描述某一个实施例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。
本文中为部件所编序号本身,例如“第一”、“第二”等,仅用于区分所描述的对象,不具有任何顺序或技术含义。而本申请所说“连接”、“联接”,如无特别说明,均包括直接和间接连接(联接)。
MET基因位于人类7号染色体长臂(7q21-31),长度约125kb,同时含有21个外显子。c-MET是MET基因编码产生的具有自主磷酸化活性的跨膜受体,属于酪氨酸激酶受体(receptor tyrosine kinases,RTKs)超家族,由膜外Sema域、PSI域、IPT域和膜内JM域、催化TK域、C末端组成,主要表达于上皮细胞。
HGF与c-MET的Sema域结合使c-MET发生二聚、酪氨酸磷酸化,激活众多下游信号通路,如PI3K-Akt、Ras-MAPK、STAT和Wnt/β-catenin等,从而发挥其促细胞增殖、细胞生长、细胞迁移、侵袭血管及血管生成等效应,在组织正常发育和肿瘤进展中发挥关键作用。c-MET通路正常表达时促进组织的分化与修复,当调节异常时则促进肿瘤细胞的增殖与转移。c-MET通路异常激活主要包括MET 14外显子跳跃突变、MET扩增和MET过表达3种类型。
MET扩增即MET拷贝数扩增,包括整体染色体重复和局部区域基因的重复。整体染色体重复即多倍体,肿瘤细胞中出现多条7号染色体。尽管MET扩增的发生率不高,但常伴有较强的MET蛋白表达,同时也是预后不良的因素之一。MET抑制剂对于MET高扩增的患者有明显获益。约15%-20%的EGFR获得性耐药患者可检测到MET扩增,MET扩增可同时伴有T790M突变或小细胞肺癌(small cell lung cancer,SCLC)转化。MET扩增也是三代EGFR-TKIs的重要耐药机制之一。
高通量测序:又称为第二代测序,相比于第一代以Sanger为代表的测序技术,具有通量高、产量高、准确度高、分析自动化等特点。
Fastq文件:二代测序仪下机的bcl格式数据经转换得到的序列文件,包含序列名称、碱基序列信息、碱基质量值等。
BAM文件:使用BWA比对软件将下机序列比对到人类参考基因上生成的文件,该文件含有序列在参考基因上的位置、比对质量等详细信息。
SNV:单核苷酸位点变异。和参考基因组该位置的碱基不同,样本基因组上该位置的碱基可能被替换为其他类型的碱基。
CNV:基因拷贝数变异。基因组上大片段序列拷贝数的增加或者减少,可分为缺失(deletion)和重复(duplication)两种类型,是一种重要的分子机制。
胚系突变:亦称胚系变异,是指在人的胚胎发育期已经携带的变异(几乎全部遗传自父母),存在于生殖细胞内具有遗传性,构成人与人的遗传多样性。通常,人体的所有细胞均带有一致的胚系突变;但并非所有胚系突变具有致病性。
杂合突变:是指一对等位基因中只有其中一个基因出现突变。
随着高通量测序技术的高速发展,基于高通量测序(Next GenerationSequencing,NGS)的基因检测已经可以越来越多的指导临床肿瘤治疗,以分子检测的结果进行用药指导,给越来越多的患者带去获益。对于MET基因而言,目前基于高通量测序的分析方法仅仅只能分析MET基因拷贝数情况,而MET基因拷贝数增加并不代表一定是染色体上局部区域MET基因扩增造成的。因为MET基因拷贝数增加可能是染色体上局部区域MET基因扩增或染色体多体两种原因导致的。
染色体多体是指整条染色体重复,比如肿瘤细胞中出现多条7号染色体,每个c-MET基因所在的7号染色体上都有对应的着丝粒,而染色体多体通常以着丝粒(CEP)的数量来间接地反映。临床上,有的药物(如克唑替尼)只对局部区域MET基因的重复造成MET扩增有抑制作用,而对整体染色体重复造成的MET扩增无抑制作用,因此,目前迫切需要一种能够提供高灵敏度,高准确性的利用高通量测序检测MET基因扩增的方法。
根据第一方面,在一些实施例中,为解决上述技术问题,提供一种检测MET基因扩增的方法,包括:
拷贝数变异分析步骤,包括分析比对到参考基因组上的待测样本、相应的正常对照样本的测序数据中,7号染色体上MET基因的拷贝数,以及7号染色体的拷贝数,判断MET基因拷贝数扩增类型。
拷贝数变异分析步骤中对7号染色体上MET基因的拷贝数分析与对7号染色体的拷贝数分析无先后顺序之分,可同时进行,也可先进行其中一个子步骤。
在一些实施例中,如果待测样本的7号染色体上MET基因的拷贝数≥2.4,且待测样本的7号染色体的拷贝数<2.4,则判断为7号染色体上局部区域MET基因扩增造成的MET基因拷贝数增加。
在一些实施例中,如果待测样本的7号染色体上MET基因的拷贝数≥2.4,且待测样本的7号染色体的拷贝数≥2.4,则判断为7号染色体重复造成的MET基因拷贝数增加。
在一些实施例中,如果待测样本的MET基因拷贝数<2.4,则判断为MET基因拷贝数正常。
在一些实施例中,如果待测样本的7号染色体拷贝数<2.4,则判断为7号染色体拷贝数正常。
在一些实施例中,还包括单核苷酸杂合突变的突变频率的差值计算步骤,包括从比对到参考基因组上的待测样本、相应的正常对照样本的测序数据中提取待测样本、对应的正常对照样本中7号染色体上的全部胚系单核苷酸杂合突变,根据待测样本中的全部胚系单核苷酸杂合突变相对于相应的正常对照样本的变化以及待测样本的7号染色体上MET基因的拷贝数、7号染色体的拷贝数,判断MET基因拷贝数扩增类型。
拷贝数变异分析步骤与单核苷酸杂合突变的突变频率的差值计算步骤无先后顺序之分,可同时进行,也可先进行期中任意一个步骤。
在一些实施例中,提取待测样本、对应的正常对照样本中7号染色体上的全部胚系单核苷酸杂合突变后,计算待测样本与对应的正常对照样本中7号染色体上的全部胚系单核苷酸杂合突变的突变频率的差值的绝对值,根据所述绝对值以及待测样本中的7号染色体上MET基因的拷贝数、7号染色体的拷贝数,判断MET基因拷贝数扩增类型。
在一些实施例中,如果待测样本的7号染色体上MET基因的拷贝数≥2.4,且待测样本的7号染色体的拷贝数<2.4,待测样本、对应的正常对照样本中7号染色体上的全部胚系单核苷酸杂合突变的突变频率的差值的绝对值<8%,则判断为7号染色体上局部区域MET基因扩增造成的MET基因拷贝数增加。
在一些实施例中,如果待测样本的7号染色体上MET基因的拷贝数≥2.4,且待测样本的7号染色体的拷贝数≥2.4,待测样本、对应的正常对照样本中7号染色体上的全部胚系单核苷酸杂合突变的突变频率的差值的绝对值≥8%,则判断为7号染色体重复造成的MET基因拷贝数增加。
在一些实施例中,如果待测样本的MET基因拷贝数<2.4,则判断为MET基因拷贝数正常。
在一些实施例中,如果待测样本的7号染色体拷贝数<2.4,则判断为7号染色体拷贝数正常。
在一些实施例中,判别方法如表1所示:
表1
Figure BDA0002872541130000051
表1中,MET基因扩增是指7号染色体上局部区域MET基因扩增造成的MET基因拷贝数增加。“-”表示不作为判断条件,例如,表1中的第三种情况,就是只要MET拷贝数低于2.4就认为MET拷贝正常,没有附加条件;而表1中的第一种情况,是需要同时满足3个条件,才判断为7号染色体上局部区域MET基因扩增造成的MET基因拷贝数增加;同理,表1中的第二种情况,是需要同时满足3个条件,才判断为7号染色体重复造成的MET基因拷贝数增加。
在一些实施例中,拷贝数变异分析步骤和/或单核苷酸杂合突变的突变频率的差值计算步骤之前,还包括一次质控步骤,具体包括分别去除待测样本、对应的正常对照样本测序数据中的测序接头序列信息、低质量序列信息、N碱基占比高的序列信息,进行一次质控,如果测序数据满足所有一次质控参数条件,进行下一步分析,如果不满足所有一次质控参数条件,则报告质控不通过,不进入下一步分析。
在一些实施例中,所述低质量序列信息是指平均碱基质量值≤15的序列信息。
在一些实施例中,所述N碱基占比高的序列信息是指N碱基占比≥5%的序列信息。
N碱基是指未知碱基,也即是说,测序仪没有测出来的碱基被定义为N。
在一些实施例中,所述一次质控的信息为碱基质量值大于20的百分比Q20、碱基质量值大于30的百分比Q30、GC含量信息中的至少一种。
在一些实施例中,一次质控时,质控参数包括但不限于如下参数中的至少一种:Q20>90%,Q30>85%,GC含量在40-60%之间。
在一些实施例中,一次质控时,质控参数如下:Q20>90%,Q30>85%,GC含量在40-60%之间。也即是说,需同时满足前述三个条件,质控才通过。
在一些实施例中,将一次质控合格的测序数据比对到参考基因组上,得到原始比对文件,进行二次质控,如果测序数据满足所有二次质控参数条件,则进行下一步分析,如果不满足所有二次质控参数条件,则报告质控不通过,不进入下一步分析。
在一些实施例中,二次质控的信息包括比对率信息。
在一些实施例中,二次质控参数为比对率>85%。
比对率是指与生物体全基因组DNA标准序列相匹配的读序的碱基数总数占总读序碱基数的百分比。
在一些实施例中,二次质控合格后,去除冗余序列,然后进行三次质控,如果测序数据满足所有三次质控参数条件,则进行下一步分析,如果不满足所有三次质控参数条件,则报告质控不通过,不进入下一步分析。
在一些实施例中,三次质控的信息为重复率、有效测序深度中的至少一种。
在一些实施例中,三次质控的参数为如下参数中的至少一种:重复率<60%,有效测序深度>200×。
在一些实施例中,三次质控的参数包括:重复率<60%,有效测序深度>200×。
重复率是指实验过程中引入的PCR重复的序列占全部测序得到的序列的百分比。
有效测序深度是指经过去除PCR重复的序列之后的深度。
在一些实施例中,所述冗余序列包括但不限于PCR扩增序列等等。
冗余序列是指被多次检测的序列。
在一些实施例中,提取待测样本、对应的正常对照样本测序数据中7号染色体上的全部胚系单核苷酸杂合突变时,所提取的突变位点满足如下参数条件中的至少一种:突变位点最小覆盖深度为30,最低突变频率为2%,支持突变的碱基质量值≥25,序列比对质量值≥30,且没有链偏好性,即支持突变的reads均匀分布在正反两条链上,支持变异的分子总数≥3个。
在一些实施例中,所述相应的正常对照样本是指与待测样本来自于同一生物体的样本。
在一些实施例中,所述生物体包括但不限于人。
在一些实施例中,所述待测样本包括但不限于新鲜肿瘤组织样本。待测样本通常为肿瘤样本,一般是指来源于肿瘤患者的病患部位、组织或体液的样本,例如结直肠癌患者的患癌组织样本。正常对照样本,也可称为对照样本,一般是指来源于同一肿瘤患者的非病患部位、组织或体液的样本,例如,可以为外周血分离的白细胞样本、癌旁正常组织、唾液等等。
在一些实施例中,所述肿瘤为实体瘤。实体瘤即有形瘤,可通过临床检查如x线摄片、CT扫描,B超或触诊扪及到的有形肿块称实体瘤。
在一些实施例中,所述待测样本包括但不限于肠癌样本、肺癌样本、胃癌样本、膀胱癌样本、乳腺癌样本、头颈鳞癌样本等实体肿瘤样本。
在一些实施例中,所述待测样本、相对应的正常对照样本可以为石蜡切片样本。
在一些实施例中,本发明适用于所有癌症的检测。在一些实施例中,本发明所适用的癌症类型包括但不限于肠癌、肺癌、胃癌、膀胱癌、乳腺癌、头颈鳞癌等等存在实体肿瘤的癌症。
在一些实施例中,所述正常对照样本包括但不限于正常组织样本、体液样本中的至少一种。
在一些实施例中,所述体液样本包括但不限于唾液样本、血液样本中的至少一种。
在一些实施例中,正常对照样本可以是全血,更优选是外周血或外周血细胞部分。本领域技术人员可以理解,血液样本可以包含但不限于T细胞、单核细胞、嗜中性粒细胞、红细胞、血小板和微泡(例如外来体和外来体样囊泡)的血液的任何部分或组分。在本披露的上下文中,包含在血液样本中的血细胞涵盖任何有核细胞并且不限于全血的组分。因此,血细胞包含,例如白细胞(WBC)。在一些实施方案中,正常对照样本也可称为正常样本、对照样本。
参考基因组,例如可以是物种(例如,人)的参考的标准基因组序列,例如,在一个实施方案中,以UCSC数据库的hg19作为人类参考基因组的其中一个版本,在另一个实施方案中,以UCSC数据库的hg38作为人类参考基因组的其中一个版本。参考基因组也可以是NCBI的Genbank数据库等其他数据库的参考基因组。
本文所使用的术语“参考基因组”指的是可将获自检测基因组的结果与其比较的基因组。在某些情况下,所研究的区域可以是参考基因中的已知核苷酸序列,例如,序列可以被储存在例如NCBI的Genbank数据库或其它数据库中。在一些实施例中,检测基因组和参考基因组是来自相同(例如,哺乳动物)物种的基因组。
在一些实施例中,要求待测样本的测序深度>200×。
在一些实施例中,要求正常对照样本的测序深度>50×。
在一些实施例中,所述待测待测样本、相应的正常对照样本的测序数据包括高通量测序数据,具体是通过高通量测序方法获得的数据,高通量测序方法包括但不限于全基因组测序、全外显子组测序或捕获探针测序等高通量测序方法。高通量测序方法为本领域的常规方法,本领域技术人员可以根据需要选择。
高通量测序数据可以为全基因组数据、全外显子组测序数据、捕获探针测序数据中的至少一种,如果为捕获探针测序,则优选使用500基因以上的大panel(探针库)。
高通量测序仪器包括但不限于Illumina测序仪、华大测序仪等等。
高通量测序技术(High-throughput sequencing)又称“下一代”测序技术(“Next-generation”sequencing technology),以能一次并行对几十万到几百万条DNA分子进行序列测定和一般读长较短等为标志。通过高通量测序技术获得的数据通常称为高通量数据。
在一些实施例中,所述高通量测序数据为全基因组测序数据、全外显子组测序数据、捕获探针测序数据中的至少一种。
需要说明的是,本发明的检测方法所针对的样本测序数据为离体样品,不是以有生命的人或者动物体为直接实施对象,基因拷贝数扩增类型分析结果为中间结果,不是最终的疾病诊断结果,在实际应用中,在利用本发明的方法判别MET基因拷贝数增加的类型之后,还需要结合受试者当前的主观感受症状、既往病史、家族遗传史等信息,才能得出最后的诊断结果或健康状况。仅仅根据本发明的MET基因扩增检测结果是不能得到专利法意义上的诊断结果的。因此,本发明不属于疾病的诊断、治疗方法范畴。
在一些实施例中,本发明还可用于其他非诊断、非治疗目的,例如,用于科研实验中筛选治疗癌症的现有药物、新药候选物等等。
根据第二方面,在一些实施例中,提供一种检测MET基因扩增的系统,包括:
拷贝数变异分析装置,用于分析比对到参考基因组上的待测样本、相应的正常对照样本的测序数据中,7号染色体上MET基因的拷贝数,以及7号染色体的拷贝数,判断基因拷贝数扩增类型。
在一些实施例中,还包括单核苷酸杂合突变的突变频率的差值计算装置,用于从比对到参考基因组上的待测样本、相应的正常对照样本的测序数据中提取待测样本、对应的正常对照样本中7号染色体上的全部胚系单核苷酸杂合突变,根据待测样本中的全部胚系单核苷酸杂合突变相对于相应的正常对照样本的变化以及待测样本的7号染色体上MET基因的拷贝数、7号染色体的拷贝数,判断MET基因拷贝数扩增类型。
根据第三方面,在一些实施例中,提供一种装置,包括:
存储器,用于存储程序;
处理器,用于通过执行所述存储器存储的程序以实现如第一方面所述的方法。
根据第四方面,在一些实施例中,提供一种计算机可读存储介质,包括程序,所述程序能够被处理器执行以实现如第一方面所述的方法。
在一些实施例中,提供一种基于高通量测序的肿瘤组织样本检测MET基因扩增的生物信息分析方法,包括:
过滤肿瘤组织样本及其正常对照样本的高通量测序原始数据,去除低质量的序列,去掉N碱基占比多的序列等低质量序列,统计Q20、Q30比例以及GC含量信息;
将过滤后的肿瘤组织样本及其正常对照样本的数据映射到人参考基因组hg19上并完成去除PCR等冗余序列,统计比对率,去重率,捕获率等信息;
读取肿瘤组织样本的单核苷酸位点变异;
分析肿瘤组织样本的基因拷贝数变异;
结合肿瘤组织样本的胚系杂合单核酸位点变异频率偏移结果与基因拷贝数变异结果,分析基因拷贝数扩增来源。
实施例1
本实施例中,待测样本为肿瘤组织石蜡切片样本(即下文的肿瘤组织样本),正常对照样本为取自同一受试者的血液样本。
如图1所示,本实施例主要包括如下步骤:
a、使用fastp软件对肿瘤组织样本及对照样本的原始下机fastq数据过滤,去除低质量序列信息、N碱基占比高的序列(N碱基占比≥5%的序列)信息、接头序列信息。统计Q20信息、Q30信息、GC含量等信息。按照如下参数进行一次质控:Q20>90%,Q30>85%,GC含量在40%-60%之间。如果满足一次质控参数条件,则进入下一步分析;若不满足一次质控参数条件,则报告质控不通过,不进入下一步分析。
b、使用BWA软件(算法为BWA-MEM),将过滤得到的肿瘤组织样本及对照样本的干净fastq数据比对到人类参考基因组hg19上,得到原始比对bam文件。统计比对率信息并进行二次质控,二次质控参数条件为比对率>85%。如果满足质控参数条件,则进入下一步分析,若不满足质控参数条件,则报告质控不通过,不进入下一步分析。
c、使用gencore软件处理肿瘤组织样本及对照样本的原始比对bam文件,去掉PCR等重复序列,得到去重后的bam文件。统计重复率、有效测序深度等信息并进行三次质控,三次质控参数为:重复率<60%,有效测序深度>200×。如果满足质控参数条件,则进入下一步分析,若不满足质控参数条件,则报告质控不通过,不进入下一步分析。
d、使用samtools软件处理肿瘤组织样本及对照样本的去重后的bam文件,生成mpileup文件。
e、基于d步骤产生的mpileup文件,用varscan软件进行变异读取,得到SNV的vcf文件。
f、基于c步骤生成的bam文件,使用cnvkit软件分析拷贝数,用正常对照样本作为参考建立基线reference,得到基因拷贝数结果文件。
g、基于e步骤生成的SNV的vcf文件与f步骤生成的基因拷贝数结果文件,判断MET基因拷贝数增加是由7号染色体上局部区域MET基因扩增造成,还是由于7号染色体多体现象造成。
判别方法如表1所示:
表1
Figure BDA0002872541130000091
Figure BDA0002872541130000101
表1中,MET基因扩增是指7号染色体上局部区域MET基因扩增造成的MET基因拷贝数增加。
本实施例的测序数据为HapOnco680panel捕获测序数据,使用的测序仪为Illumina Novaseq6000测序仪,使用的试剂为测序仪配套试剂,测序方法参照测序仪说明书进行。
本实施例的具体操作步骤如下:
S1、过滤:过滤肿瘤组织样本及其正常对照样本的高通量测序原始数据时,使用fastp软件,参数:-3-W 4-M 25,其中,-M设置平均质量值为25,如低于25则舍弃;-W设置滑动窗口长度为4个碱基;-3设置去除3’末端低于平均质量值的碱基。
S2、比对到参考基因组:使用BWA(即Burrows-Wheeler-Alignment Tool)软件,算法为BWA-MEM,将过滤后的肿瘤组织样本及其正常对照样本的测序数据比对到人参考基因组hg19上,参数-k设置为32,是指使用32bp长度的序列作为种子序列进行查找比对,并使用gencore软件去除PCR扩增序列信息等冗余序列信息。
S3、提取单核苷酸位点变异:选用varscan软件,在读取突变位点步骤中要求:突变位点最小覆盖深度为30,最低突变频率为2%,支持突变的碱基质量值≥25,序列比对质量值≥30,且没有链偏好性,即支持突变的reads均匀分布在正反两条链上,支持变异的分子总数≥3个。
突变位点最小覆盖深度为30是指只有突变位点有30及以上的深度才对这个位点进行变异提取。
最低突变频率为2%是指只有突变频率有2%及以上的频率才对这个位点进行变异提取。
支持突变的碱基质量值是指支持这个突变的碱基对应的质量值,是测序仪在测序过程中对这个碱基的一个打分值。
序列比对质量值是指序列与参考基因组比对打分值。
S4、检测MET基因拷贝数变异:选用cnvkit软件,利用CBS算法计算肿瘤组织样本的基因拷贝数情况。
S5、分析基因拷贝数扩增来源:1)提取正常对照样本在7号染色体上的全部胚系单核苷酸位点杂合突变(即正常对照样本的杂合突变),计算肿瘤组织样本的突变频率与相应的正常对照样本突变频率的差值的绝对值;2)分析肿瘤组织样本的7号染色体上MET基因的拷贝数,及整个7号染色体的拷贝数;3)结合1和2的结果判断基因拷贝数扩增类型。
本实施例的判断结果如下表所示。
表2
Figure BDA0002872541130000102
Figure BDA0002872541130000111
实施例2
本实施例中,待测样本为肿瘤组织样本,正常对照样本为取自同一受试者的血液样本。
本实施例的检测方法参照实施例1进行。
本实施例的判断结果如下表所示。
表3
Figure BDA0002872541130000112
实施例3
本实施例中,待测样本为肿瘤组织样本,正常对照样本为取自同一受试者的血液样本。
本实施例的检测方法参照实施例1进行。
本实施例的判断结果如下表所示。
表4
MET基因拷贝数 7号染色体拷贝数 胚系杂合突变差值的绝对值 判断结果
5.37 3.47 11.25% 7号染色体扩增
实施例4
本实施例中,待测样本为肿瘤组织样本,正常对照样本为取自同一受试者的血液样本。
本实施例的检测方法参照实施例1进行。
本实施例的判断结果如下表所示。
表5
MET基因拷贝数 7号染色体拷贝数 胚系杂合突变差值的绝对值 判断结果
22.24 2.24 5.4% MET基因扩增
从实施例1-4的结果可知,通过分析待测样本、正常对照样本高通量测序数据中的MET基因拷贝数、7号染色体拷贝数,可以准确判断7号染色体上局部区域MET基因扩增与7号染色体扩增。进一步地,结合胚系杂合突变差值的绝对值,可以进一步验证判断结果的准确性。
在一些实施例中,相比现有的荧光原位杂交(FISH)和荧光定量PCR技术,本发明采用高通量测序方法分析MET基因扩增,解决了常规高通量测序方法无法准确判断是7号染色体上局部区域MET基因扩增还是7号染色体多体造成的拷贝数增加现象这一难题。
本领域技术人员可以理解,上述实施方式中各种方法的全部或部分功能可以通过硬件的方式实现,也可以通过计算机程序的方式实现。当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器、随机存储器、磁盘、光盘、硬盘等,通过计算机执行该程序以实现上述功能。例如,将程序存储在设备的存储器中,当通过处理器执行存储器中程序,即可实现上述全部或部分功能。另外,当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序也可以存储在服务器、另一计算机、磁盘、光盘、闪存盘或移动硬盘等存储介质中,通过下载或复制保存到本地设备的存储器中,或对本地设备的系统进行版本更新,当通过处理器执行存储器中的程序时,即可实现上述实施方式中全部或部分功能。
以上应用了具体个例对本发明进行阐述,只是用于帮助理解本发明,并不用以限制本发明。对于本发明所属技术领域的技术人员,依据本发明的思想,还可以做出若干简单推演、变形或替换。

Claims (4)

1.一种非疾病诊断治疗目的的检测MET基因扩增的方法,其特征在于,包括:
拷贝数变异分析步骤,包括分析比对到参考基因组上的待测样本、相应的正常对照样本的测序数据中,7号染色体上MET基因的拷贝数,以及7号染色体的拷贝数,判断MET基因拷贝数扩增类型;
所述MET基因拷贝数扩增类型包括:7号染色体上局部区域MET基因扩增造成的MET基因拷贝数增加、7号染色体重复造成的MET基因拷贝数增加、MET基因拷贝数正常、7号染色体拷贝数正常;
还包括单核苷酸杂合突变的突变频率的差值计算步骤,包括从比对到参考基因组上的待测样本、相应的正常对照样本的测序数据中提取待测样本、对应的正常对照样本中7号染色体上的全部胚系单核苷酸杂合突变,计算待测样本与对应的正常对照样本中7号染色体上的全部胚系单核苷酸杂合突变的突变频率的差值的绝对值,根据所述绝对值以及待测样本中的7号染色体上MET基因的拷贝数、7号染色体的拷贝数,判断MET基因拷贝数扩增类型;
如果待测样本的7号染色体上MET基因的拷贝数≥2.4,且待测样本的7号染色体的拷贝数<2.4,待测样本、对应的正常对照样本测序数据中7号染色体上的全部胚系单核苷酸杂合突变的突变频率的差值的绝对值<8%,则判断为7号染色体上局部区域MET基因扩增造成的MET基因拷贝数增加;
如果待测样本的7号染色体上MET基因的拷贝数≥2.4,且待测样本的7号染色体的拷贝数≥2.4,待测样本、对应的正常对照样本中7号染色体上的全部胚系单核苷酸杂合突变的突变频率的差值的绝对值≥8%,则判断为7号染色体重复造成的MET基因拷贝数增加;
如果待测样本的MET基因拷贝数<2.4,则判断为MET基因拷贝数正常;
如果待测样本的7号染色体拷贝数<2.4,则判断为7号染色体拷贝数正常。
2.如权利要求1所述的方法,其特征在于,拷贝数变异分析步骤和/或单核苷酸杂合突变的突变频率的差值计算步骤之前,还包括一次质控步骤,具体包括分别去除待测样本、对应的正常对照样本测序数据中的测序接头序列信息、低质量序列信息、N碱基占比高的序列信息,进行一次质控,如果测序数据满足所有一次质控参数条件,进行下一步分析,如果不满足所有一次质控参数条件,则报告质控不通过,不进入下一步分析;
所述一次质控的信息为碱基质量值大于20的百分比Q20、碱基质量值大于30的百分比Q30、GC含量信息中的至少一种;
一次质控参数为如下参数中的至少一种:Q20>90%,Q30>85%,GC含量在40%-60%之间;
一次质控参数包括:Q20>90%,Q30>85%,GC含量在40%-60%之间;
所述低质量的序列包括碱基质量值包括碱基质量值≤15的序列;
所述N碱基占比高的序列是指N碱基占比≥5%的序列;
将一次质控合格的测序数据比对到参考基因组上,得到原始比对文件,进行二次质控,如果测序数据满足所有二次质控参数条件,则进行下一步分析,如果不满足所有二次质控参数条件,则报告质控不通过,不进入下一步分析;
二次质控的信息包括比对率信息;
二次质控参数为比对率>85%;
二次质控合格后,去除冗余序列,然后进行三次质控,如果测序数据满足所有三次质控参数条件,则进行下一步分析,如果不满足所有三次质控参数条件,则报告质控不通过,不进入下一步分析;
三次质控的信息为重复率、有效测序深度中的至少一种;
三次质控的参数为如下参数中的至少一种:重复率<60%,有效测序深度>200×;
三次质控的参数包括:重复率<60%,有效测序深度>200×;
所述冗余序列包括PCR扩增序列。
3.如权利要求1所述的方法,其特征在于,提取待测样本、对应的正常对照样本测序数据中7号染色体上的全部胚系单核苷酸杂合突变时,所提取的突变位点满足如下参数条件中的至少一种:突变位点最小覆盖深度为30,最低突变频率为2%,支持突变的碱基质量值≥25,序列比对质量值≥30,且没有链偏好性,即支持突变的reads均匀分布在正反两条链上,支持变异的分子总数≥3个。
4.如权利要求1所述的方法,其特征在于,所述相应的正常对照样本是指与待测样本来自于同一生物体的样本;
所述生物体包括人;
所述待测样本包括肿瘤组织样本;
所述正常对照样本为正常组织样本、体液样本中的至少一种;
所述体液样本为唾液样本、血液样本中的至少一种;
所述待测样本、相应的正常对照样本的测序数据包括高通量测序数据;
所述高通量测序数据为全基因组测序数据、全外显子组测序数据、捕获探针测序数据中的至少一种。
CN202011604267.3A 2020-12-30 2020-12-30 一种检测met基因扩增的方法及装置 Active CN112592976B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011604267.3A CN112592976B (zh) 2020-12-30 2020-12-30 一种检测met基因扩增的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011604267.3A CN112592976B (zh) 2020-12-30 2020-12-30 一种检测met基因扩增的方法及装置

Publications (2)

Publication Number Publication Date
CN112592976A CN112592976A (zh) 2021-04-02
CN112592976B true CN112592976B (zh) 2021-09-21

Family

ID=75203947

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011604267.3A Active CN112592976B (zh) 2020-12-30 2020-12-30 一种检测met基因扩增的方法及装置

Country Status (1)

Country Link
CN (1) CN112592976B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114512183B (zh) * 2022-01-27 2022-09-20 北京吉因加医学检验实验室有限公司 一种预测met基因扩增或多倍体的方法及装置
CN115376609B (zh) * 2022-10-24 2023-03-10 广州燃石医学检验所有限公司 一种判别met基因拷贝数扩增类型的方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106062214A (zh) * 2013-12-28 2016-10-26 夸登特健康公司 用于检测遗传变异的方法和系统
CN107526941A (zh) * 2017-09-22 2017-12-29 至本医疗科技(上海)有限公司 拷贝数变异检测预处理装置、检测装置、判定装置和系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113774132A (zh) * 2014-04-21 2021-12-10 纳特拉公司 检测染色体片段中的突变和倍性
US11479812B2 (en) * 2015-05-11 2022-10-25 Natera, Inc. Methods and compositions for determining ploidy
CN107423534B (zh) * 2016-05-24 2021-08-06 郝柯 基因组拷贝数变异的检测方法和系统
JP2022535880A (ja) * 2019-06-06 2022-08-10 アポロミクス インコーポレイテッド(ハンジョウ) c-MET阻害剤を使用して癌患者を処置するための方法
CN111718982A (zh) * 2020-07-09 2020-09-29 深圳市海普洛斯生物科技有限公司 一种肿瘤组织单样本体细胞突变检测方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106062214A (zh) * 2013-12-28 2016-10-26 夸登特健康公司 用于检测遗传变异的方法和系统
CN107526941A (zh) * 2017-09-22 2017-12-29 至本医疗科技(上海)有限公司 拷贝数变异检测预处理装置、检测装置、判定装置和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
TumorNext: A comprehensive tumor profiling assay that incorporates high resolution copy number analysis and germline status to improve testing accuracy;Phillip N Gray等;《Oncotarget》;20161018;第7卷(第42期);第68206–68228页 *

Also Published As

Publication number Publication date
CN112592976A (zh) 2021-04-02

Similar Documents

Publication Publication Date Title
JP7458360B2 (ja) 疾患細胞不均一性を示す疾患の検出および処置、ならびに通信試験結果のためのシステムおよび方法
JP6829211B2 (ja) 癌スクリーニング及び胎児分析のための変異検出
Ding et al. Expanding the computational toolbox for mining cancer genomes
KR102521842B1 (ko) 암 검출을 위한 혈장 dna의 돌연변이 분석
CN107849612B (zh) 比对和变体测序分析管线
KR20190026837A (ko) 무세포 핵산의 프래그멘톰 프로파일링을 위한 방법
US20210065842A1 (en) Systems and methods for determining tumor fraction
CN112805563A (zh) 用于评估和/或治疗癌症的无细胞dna
CN111647648A (zh) 一种用于检测乳腺癌基因突变的基因panel及其检测方法与应用
CN115287348A (zh) Dna混合物中组织的单倍型的甲基化模式分析
CN112592976B (zh) 一种检测met基因扩增的方法及装置
AU2014346680A1 (en) Targeted screening for mutations
CN111785324A (zh) 一种微卫星不稳定分析方法及装置
Mancini-DiNardo et al. Detection of large rearrangements in a hereditary pan-cancer panel using next-generation sequencing
Quiroz-Zárate et al. Expression Quantitative Trait loci (QTL) in tumor adjacent normal breast tissue and breast tumor tissue
WO2022054086A1 (en) A system and a method for identifying genomic abnormalities associated with cancer and implications thereof
CN110564851A (zh) 一组用于非超突变型直肠癌分子分型的基因及其应用
CA3099612C (en) Method of cancer prognosis by assessing tumor variant diversity by means of establishing diversity indices
US20230197277A1 (en) Assessment and Quantification of Imperfect dsDNA Break Repair for Cancer Diagnosis and Treatment
US20240052419A1 (en) Methods and systems for detecting genetic variants
CN114155911A (zh) 一种矫正肿瘤突变负荷的方法及系统
Zaheed et al. Investigating the suitability of cell lines as models for the major subtypes of epithelial ovarian cancer.
WO2023274954A1 (en) Molecular tools for the diagnosis and prognosis of melanocytic spitzoid tumors
CN114350811A (zh) 一种成人脑胶质瘤分子分型NGS panel及其应用
McNulty et al. Tumor Mutational Profiling by Next-Generation Sequencing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A Method and Device for Detecting MET Gene Amplification

Effective date of registration: 20221118

Granted publication date: 20210921

Pledgee: Shenzhen hi tech investment small loan Co.,Ltd.

Pledgor: HAPLOX BIOTECHNOLOGY (SHENZHEN) Co.,Ltd.

Registration number: Y2022980022405

PC01 Cancellation of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Granted publication date: 20210921

Pledgee: Shenzhen hi tech investment small loan Co.,Ltd.

Pledgor: HAPLOX BIOTECHNOLOGY (SHENZHEN) Co.,Ltd.

Registration number: Y2022980022405