CN112768000A - 一种预测met基因拷贝数变化类型的方法及装置 - Google Patents

一种预测met基因拷贝数变化类型的方法及装置 Download PDF

Info

Publication number
CN112768000A
CN112768000A CN202110099257.7A CN202110099257A CN112768000A CN 112768000 A CN112768000 A CN 112768000A CN 202110099257 A CN202110099257 A CN 202110099257A CN 112768000 A CN112768000 A CN 112768000A
Authority
CN
China
Prior art keywords
copy number
sample
gene copy
ratio
met
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110099257.7A
Other languages
English (en)
Other versions
CN112768000B (zh
Inventor
管彦芳
方欢
李彩琴
刘涛
易鑫
杨玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Guiinga Medical Laboratory
Original Assignee
Shenzhen Guiinga Medical Laboratory
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Guiinga Medical Laboratory filed Critical Shenzhen Guiinga Medical Laboratory
Priority to CN202110099257.7A priority Critical patent/CN112768000B/zh
Publication of CN112768000A publication Critical patent/CN112768000A/zh
Application granted granted Critical
Publication of CN112768000B publication Critical patent/CN112768000B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection

Landscapes

  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Analytical Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

一种预测MET基因拷贝数变化类型的方法及装置,该方法包括:基因拷贝数比值分析步骤,根据基线,分析基因拷贝数的比值;捕获区域分析步骤,根据比值,对待测样本的捕获区域进行拷贝数变异注释,根据注释的结果,预测待测样本中MET基因拷贝数是否发生变化;MET基因拷贝数变化类型预测步骤,对于预测结果为MET基因拷贝数增加的待测样本,获取基因拷贝数比值,统计基因拷贝数比值是否存在显著性差异,预测得到MET基因拷贝数增加的类型。以相同时间点的正常对照样本建立基线,避免待测样本分析CNV的结果存在偏差,显著提高MET基因拷贝数变化类型预测的灵敏度和特异度。

Description

一种预测MET基因拷贝数变化类型的方法及装置
技术领域
本发明涉及生物信息学领域,具体涉及一种预测MET基因拷贝数变化类型的方法及装置。
背景技术
间质表皮转化因子(Mesenchymal to epithelial transition factor,简称MET)蛋白作为一种受体酪氨酸激酶,存在于上皮细胞中,能够参与很多生物学功能,位于人类第7条染色体(7q21-q31)区域,总长度超过120kb,其中包含21个外显子以及20个内含子。随着研究的深入,MET已被证实在多种恶性肿瘤中基因扩增,且已成为EGFR-TKIs的重要耐药机制之一,尤其在非小细胞肺癌(non-small cell lung cancer,NSCLC),已成为一个重要的肿瘤驱动基因和治疗靶点。目前有两种方式可引起MET基因拷贝数增加,一种为7号染色体多倍体(polysomy),是指整条染色体臂的拷贝数增加,另一种为MET基因扩增(amplification),是指MET基因独立于染色体臂发生拷贝数重复。研究表明,MET多倍体导致的MET基因拷贝数增加并不会影响EGFR-TKIs的活性,MET基因拷贝数增加不能直接说明EGFR-TKIs耐药,MET基因扩增才是肿瘤发生的驱动变异。实际应用中,鉴定方法主要包括荧光原位杂交(FISH)、微滴式数字PCR(ddPCR)、实时定量PCR(RT-PCR)等,每种鉴定方法都有各自的特点。
传统的方法,如FISH、ddPCR、RT-PCR等,存在操作繁琐、分辨率低等问题。具体地,荧光原位杂交技术(Fluorescence in situ hybridization,简称FISH)作为公认的检测CNV金标准方法,实验周期短,能够迅速得到结果、特异性好、定位准确,但是它只能定性检测,不能定量,此外,该方法判定的标准缺乏共识,导致不同实验室对结果判断存在较大的偏差。ddPCR是一种核酸分子绝对定量技术,但是其缺陷较多,包括通量不高、操作复杂、只能定性分析、容易污染等。实时荧光定量PCR:是指在PCR扩增过程中,通过荧光信号,对PCR进程进行实时检测。该方法在操作过程中存在很多陷阱,如:基线和阈值线设置不当,扩增效率低,使用了不正确的范围来制作标准曲线,使用了不恰当的均一化对照等等,导致结果的准确性降低。
发明内容
根据第一方面,在一些实施例中,提供一种预测MET基因拷贝数变化类型的方法,包括:
基因拷贝数比值分析步骤,根据同待测样本相同时间点且比对到参考基因组的正常样本测序数据建立的基线,分析比对到参考基因组的待测样本测序数据中基因拷贝数与正常样本中相应基因拷贝数的比值;
捕获区域分析步骤,根据所述比值,对待测样本的捕获区域进行拷贝数变异注释,根据注释的结果,预测待测样本中MET基因拷贝数是否发生变化,如果预测结果为MET基因拷贝数增加,则进入下一步骤;
MET基因拷贝数变化类型预测步骤,对于预测结果为MET基因拷贝数增加的待测样本,获取待测样本中发生拷贝数变异的捕获区域中,MET基因所包含的捕获区域的基因拷贝数比值以及7号染色体或7号染色体臂所包含的捕获区域的基因拷贝数比值,统计MET基因所包含的捕获区域的基因拷贝数比值与7号染色体或7号染色体臂所包含的捕获区域的基因拷贝数比值是否存在显著性差异,预测得到待测样本中MET基因拷贝数增加的类型。
根据第二方面,在一些实施例中,提供一种预测MET基因拷贝数变化类型的系统,包括:
基因拷贝数比值分析装置,用于根据同待测样本相同时间点且比对到参考基因组的正常样本测序数据建立的基线,分析比对到参考基因组的待测样本测序数据中基因拷贝数与相应的正常对照样本中该基因的拷贝数的比值;
目标捕获区域分析装置,用于根据所述比值,分析待测样本的目标捕获区域测序数据中目标捕获区域是否发生拷贝数变异,并获得待测样本的目标捕获区域基因拷贝数与相应的正常对照样本中的相应目标捕获区域基因拷贝数的比值;
MET基因拷贝数变化类型判断装置,用于根据待测样本的目标捕获区域基因拷贝数与对应的正常对照样本中的该目标捕获区域基因拷贝数的比值,获取待测样本的MET基因和7号染色体长臂上所包含的目标捕获区域的拷贝数变异基因的拷贝数与相应的正常对照样本中相应基因的拷贝数的比值,统计待测样本中的MET基因拷贝数比值与待测样本中的7号染色体拷贝数比值是否存在显著性差异,判断待测样本中MET基因拷贝数变化的类型。
根据第三方面,在一些实施例中,提供一种预测MET基因拷贝数变化类型的装置,包括:
存储器,用于存储程序;
处理器,用于通过执行所述存储器存储的程序以实现如第一方面所述的方法。
根据第四方面,在一些实施例中,提供一种计算机可读存储介质,其上存储有程序,所述程序能够被处理器执行以实现如第一方面所述的方法。
依据上述实施例的预测MET基因拷贝数变化类型的方法及装置,以相同时间点的正常对照样本建立基线,有效避免待测样本分析CNV的结果存在偏差,显著提高MET基因拷贝数变化类型预测的灵敏度和特异度。
具体实施方式
下面通过具体实施方式对本发明作进一步详细说明。其中不同实施方式中类似元件采用了相关联的类似的元件标号。在以下的实施方式中,很多细节描述是为了使得本申请能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。在某些情况下,本申请相关的一些操作并没有在说明书中显示或者描述,这是为了避免本申请的核心部分被过多的描述所淹没,而对于本领域技术人员而言,详细描述这些相关操作并不是必要的,他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。
另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书中的各种顺序只是为了清楚描述某一个实施例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。
本文中为部件所编序号本身,例如“第一”、“第二”等,仅用于区分所描述的对象,不具有任何顺序或技术含义。而本申请所说“连接”、“联接”,如无特别说明,均包括直接和间接连接(联接)。
术语表:
CNV:全称是Copy number variations,即基因拷贝数变异。
Ratio值:肿瘤样本在某个探针捕获区域读段数(read count)相对于正常样本(亦称参考样本)中相应探针捕获区域读段数的比例值。
Status:基因发生拷贝数变异类型,拷贝数变异类型包括Gain(增加)、Loss(减少)、Netural(正常),其中,Gain(增加)又分为染色体局部区域扩增造成的基因拷贝数增加、整个染色体加倍造成的基因拷贝数增加这两种类型。
ctDNA:循环肿瘤DNA,肿瘤细胞在进行分裂增值过程当中,主动向体液中分泌的已经经历过基因突变的DNA片段。
fastq:一种常见的高通量测序文件类型,通常原始测序数据都是以该文件类型储存。
7q:7号染色体长臂。
Pvalue:阈值,用于判断原假设是否成立的依据。
Bonferroni:校正P值的方法。
根据第一方面,在一些实施例中,提供一种预测MET基因拷贝数变化类型的方法,包括:
基因拷贝数比值分析步骤,根据同待测样本相同时间点且比对到参考基因组的正常样本测序数据建立的基线,分析比对到参考基因组的待测样本测序数据中基因拷贝数与正常样本中相应基因拷贝数的比值;
捕获区域分析步骤,根据所述比值,对待测样本的捕获区域进行拷贝数变异注释,根据注释的结果,预测待测样本中MET基因拷贝数是否发生变化,如果预测结果为MET基因拷贝数增加,则进入下一步骤;
MET基因拷贝数变化类型预测步骤,对于预测结果为MET基因拷贝数增加的待测样本,获取待测样本中发生拷贝数变异的捕获区域中,MET基因所包含的捕获区域的基因拷贝数比值以及7号染色体或7号染色体臂所包含的捕获区域的基因拷贝数比值,统计MET基因所包含的捕获区域的基因拷贝数比值与7号染色体或7号染色体臂所包含的捕获区域的基因拷贝数比值是否存在显著性差异,预测得到待测样本中MET基因拷贝数增加的类型。
在一些实施例中,统计MET基因所包含的捕获区域的基因拷贝数比值与7号染色体或7号染色体臂所包含的捕获区域的基因拷贝数比值是否存在显著性差异,预测得到待测样本中MET基因拷贝数变化的类型的具体方法如下:对MET基因所包含的捕获区域的基因拷贝数比值与7号染色体或7号染色体臂所包含的捕获区域的基因拷贝数比值进行T检验,根据T检验后P值与阈值的大小关系,预测得到待测样本中MET基因拷贝数增加的类型。
在一些实施例中,根据T检验后校正P值与阈值的大小关系,预测得到待测样本中MET基因拷贝数增加的类型。
在一些实施例中,如果校正P值<阈值,则预测待测样本中MET基因拷贝数增加是由7号染色体局部区域扩增造成;如果校正P值≥阈值,则预测待测样本中MET基因拷贝数增加是由7号染色体多倍体造成。
在一些实施例中,所述阈值为0.05。
在一些实施例中,所述MET基因所包含的捕获区域的基因拷贝数比值是指该捕获区域的基因拷贝数与正常样本中相应基因拷贝数的比值,所述7号染色体或7号染色体臂所包含的捕获区域的基因拷贝数比值是指7号染色体或7号染色体臂所包含的捕获区域的基因拷贝数与正常样本中相应基因拷贝数的比值。
在一些实施例中,所述7号染色体臂为7号染色体长臂、短臂中的至少一种,通常为7号染色体长臂。
在一些实施例中,捕获区域分析步骤中,根据待测样本的MET基因所包含的捕获区域中基因拷贝数与正常样本中相应基因拷贝数的比值与阈值的大小关系,预测待测样本中MET基因拷贝数是否发生变化。
在一些实施例中,用于预测MET基因拷贝数是否增加的阈值为1.4,用于预测MET基因拷贝数是否缺失的阈值为0.8。
在一些实施例中,如果待测样本的MET基因所包含的捕获区域中基因拷贝数与正常样本中相应基因拷贝数的比值>1.4,则预测待测样本中MET基因拷贝数增加。
在一些实施例中,如果待测样本的MET基因所包含的捕获区域中基因拷贝数与正常样本中相应基因拷贝数的比值<0.8,则预测待测样本中MET基因拷贝数缺失;如果待测样本的MET基因所包含的捕获区域中基因拷贝数与正常样本中相应基因拷贝数的比值≥0.8且≤1.4,则预测待测样本中MET基因拷贝数中性,即未发生MET基因拷贝数变异。
在一些实施例中,捕获区域分析步骤中,根据所述比值,对待测样本的捕获区域进行拷贝数变异注释后,得到每个捕获区域注释的基因,根据注释的结果,进行基因拷贝数变异过滤,保留发生基因拷贝数变异的捕获区域,然后合并相邻捕获区域基因拷贝数变异类型一致的区域。
在一些实施例中,捕获区域分析步骤中,如果预测结果为MET基因拷贝数缺失或中性,则不再进入下一步骤。
在一些实施例中,同待测样本相同时间点的正常样本是指与待测样本同一测序批次或一周内相近测序批次的正常样本。
在一些实施例中,同待测样本相同时间点的正常样本也是指同一建库批次的样本。
在一些实施例中,正常样本的数量≥1,正常样本的数量不受限制,包括但不限于1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、15个、20个、25个、30个、35个、40个等等,正常样本可以与部分待测样本同属于一个个体。
在一些实施例中,MET基因拷贝数变化类型预测步骤中,首先根据StatusRatio值判断MET基因是否发生扩增,StatusRatio值大于1.4为扩增,小于0.8为缺失,介于0.8和1.4间为中性,即未发生拷贝数变异,如果发生MET扩增,继续利用捕获区域的Ratio值,对MET区域和chR7q(即7号染色体长臂)区域包含的Ratio值进行T检验,采用T检验后校正p值是否大于0.05判断该样本是MET扩增还是polysomy样本(即7号染色体多倍体样本),如果p值<0.05,则待测样本为MET扩增样本,即7号染色体局部区域扩增造成MET基因拷贝数增加的样本;反之,如果p值≥0.05,则待测样本为polysomy样本,即7号染色体多倍体造成MET基因拷贝数增加的样本。
在一些实施例中,所述待测样本包括但不限于肿瘤组织样本、体液样本等等中的至少一种。
在一些实施例中,所述体液样本包括但不限于血液、腹水等等中的至少一种。
在一些实施例中,所述正常样本包括但不限于血细胞样本、癌旁组织样本等等中的至少一种。
在一些实施例中,所述待测样本、正常样本取自人体或动物体。
在一些实施例中,所述待测样本、正常样本的测序数据同为全基因自测序数据、全外显子组测序数据或区域捕获测序数据。也即是说,待测样本、正常样本的测序数据类型不受限制。
在一些实施例中,所述待测样本、正常样本的测序数据中含有MET基因测序数据,也即是说,用于区域捕获的探针库的靶标基因必须覆盖MET基因。
需要说明的是,比对到参考基因组的待测样本的测序数据是离体样本的测序数据,因此,不是以有生命的人体为对象;并且,预测得到的MET基因拷贝数变化类型只是中间结果,供后续的疾病诊断参考,属于中间参考信息,不是最终的诊断结果,在实际应用中,在利用本发明的方法预测待测样本的MET基因拷贝数变化类型之后,还需要结合受试者当前的主观感受症状、既往病史、家族遗传史等信息,才能得出最后的诊断结果或健康状况。单纯根据本发明的MET基因拷贝数变化类型结果是不能直接得到专利法意义上的诊断结果的。因此,本发明的技术方案不属于疾病的诊断方法,更不属于疾病的治疗方法。并且,本发明还可用于科研中相关疾病候选药物和/或候选新药的筛选等其他非诊断、非治疗目的。
根据第二方面,在一些实施例中,提供一种预测MET基因拷贝数变化类型的系统,包括:
基因拷贝数比值分析装置,用于根据同待测样本相同时间点且比对到参考基因组的正常样本测序数据建立的基线,分析比对到参考基因组的待测样本测序数据中基因拷贝数与正常样本中相应基因拷贝数的比值;
捕获区域分析装置,用于根据所述比值,对待测样本的捕获区域进行拷贝数变异注释,根据注释的结果,预测待测样本中MET基因拷贝数是否发生变化,如果预测结果为MET基因拷贝数增加,则进入下一步骤;
MET基因拷贝数变化类型预测装置,用于对于预测结果为MET基因拷贝数增加的待测样本,获取待测样本中发生拷贝数变异的捕获区域中,MET基因所包含的捕获区域的基因拷贝数比值以及7号染色体或7号染色体臂所包含的捕获区域的基因拷贝数比值,统计MET基因所包含的捕获区域的基因拷贝数比值与7号染色体或7号染色体臂所包含的捕获区域的基因拷贝数比值是否存在显著性差异,预测得到待测样本中MET基因拷贝数增加的类型。
根据第三方面,在一些实施例中,提供一种预测MET基因拷贝数变化类型的装置,包括:
存储器,用于存储程序;
处理器,用于通过执行所述存储器存储的程序以实现如第一方面所述的方法。
根据第四方面,在一些实施例中,提供一种计算机可读存储介质,其上存储有程序,所述程序能够被处理器执行以实现如第一方面所述的方法。
在一些实施例中,本发明的目的在于提供一种基于捕获测序技术鉴定待测样本中7号染色体上存在MET基因扩增或染色体多倍体(polysomy)的方法,克服目前常规方法存在的分辨率低、准确度低、操作复杂、容易污染等缺陷。
在一些实施例中,本发明的技术原理如下:本发明首先借助CNVkit软件得到待测样本区域层面的Ratio值,然后针对MET基因和7q所包含的捕获区域的Ratio值,采用统计学中的T检验方法检验是否存在显著性差异,最后利用校正后的Pvalue识别待测样本所属的类型(MET扩增、MET polysomy、Neutral)。具体是根据根据Ratio判断Neutral/gain/loss,如果是gain,再根据p值判断扩增/polysomy。
在一些实施例中,主要包括以下几个步骤:1、利用CNVkit软件分析待测样本的Ratio值,即利用同临床组织样本相同时间点的正常样本建立的基线分析组织样本的拷贝数值;2、对区域层面的结果,利用一套注释过滤体系,得到区域层面是否发生拷贝数变异的结果及对应的Ratio值;3、获取待测样本在MET基因和7q包含的探针捕获区域的Ratio值;4、采用统计学中的T检验方法检验在待测样本中的MET基因和7q的Ratio是否存在显著性差异;5、按照一定的条件判断待测样本所属的类型,具体的类型包括MET扩增(即7号染色体局部区域扩增造成的MET基因拷贝数增加)、MET polysomy(即7号染色体多倍体造成的MET基因拷贝数增加)、Neutral(中性,即MET基因拷贝数未增加)。
在一些实施例中,本发明所要求的输入文件包括:临床组织样本以及正常样本经过比对、排序、过滤、标记重复等步骤后生成的测序数据文件(通常为bam格式)、目标捕获区域文件(通常为bed格式,包含染色体、目标捕获区域起始点、终止点)、人类参考基因组序列(通常为fastq格式)。
在一些实施例中,本发明的输出文件包括:待测样本区域的Ratio值、样本所属类型(MET扩增、polysomy、Neutral)及Pvalue值等等。
在一些实施例中,本发明提供的拷贝数检测运行模式为单线程运行,一次可鉴定多个待测样本。
在一些实施例中,用7号染色体所包含的探针捕获区域的Ratio值鉴定MET扩增和polysomy,提高结果的灵敏度和特异度。
在一些实施例中,本发明的动态基线机制不同于现有技术,现有技术中,处理基线问题时,一般都是采用固定某一段时间的大量Normal样本建立的基线,或随机某一个Normal样本建立基线作为固定基线,但这种方式的处理丢失每天测序环境的不同带来的干扰,导致待测样本分析CNV的结果存在一定的偏差,本发明利用同待测样本相同时间点的30个正常样本建立的基线计算该待测样本在每个捕获区域的Ratio值,有效克服现有技术存在的缺陷,避免待测样本分析CNV的结果存在偏差。
在一些实施例中,关于MET相对于7q染色体臂拷贝数增加的显著性统计方法,现有方法在进行鉴定时,主要依靠设置拷贝数阈值的方式,根据待测样本拷贝数构建某一个指标是否超出阈值来区分MET基因扩增和polysomy,对于浓度较低的血浆ctDNA样本鉴定非常不利,灵敏度很低。本发明主要以7号染色体在人群中的分布情况为标准,通过统计学中的T检验区分MET基因扩增和polysomy。当样本MET基因和7q通过了统计检验时,证明待测样本在MET基因和7q上的拷贝数存在显著性差异,避免在未知肿瘤细胞含量的情况下,因为设置了不合适的拷贝数阈值而导致低灵敏度的问题,且能使得每一个样本检测结果都是可靠的。
在一些实施例中,关于Pvalue校正,通常在进行统计学检验时,直接采用Pvalue值与显著性阈值大小判断是否存在显著性差异,但是有时会获得假阳性结论,故本发明采用Bonferroni校正。
在一些实施例中,本发明的MET扩增检出性能如下:灵敏度90%,特异度100%。
实施例1
MET扩增是指7号染色体局部区域扩增造成的MET基因拷贝数增加。
MET多倍体是指7号染色体多倍体造成的MET基因拷贝数增加。
计算MET扩增和MET多倍体(亦称MET polysomy)在人群中的发生比例的方法如下:
挑选人工复核发生MET拷贝数增加(未区分是MET扩增还是MET多倍体)的250个肿瘤组织样本(包括石蜡包埋组织样本和新鲜组织样本),将250个样本的bam文件与捕获区间(吉因加大panel,芯片名称为cd3)的bed文件、人类参考基因组序列(本实施例使用的人类参考基因组为hs37d5)fastq文件作为输入文件,采用默认参数,利用CNVkit软件分别对每一个样本的拷贝数进行鉴定(即对每个探针捕获区域的拷贝数进行鉴定),获得每个样本相对于参考样本组(同批次的30个正常样本构建的集合,简称参考样本组,同批次是指同一建库批次)拷贝数的比值(Ratio)。使用CNVKit软件对每个样本的捕获区域进行CNV注释,根据注释的结果,利用CNV过滤规则(过滤规则为:Copy Ratio大于1.4为扩增,小于0.8为缺失,否则为中性)保留发生CNV的捕获区域,根据过滤后的结果,合并相邻捕获区域拷贝数变异类型(Status)一致的区域,根据CNVKit软件的分析结果,利用T检验识别MET扩增和METpolysomy,分布统计发生MET扩增和MET polysomy在人群中发生的比例值。如果T检验校正后p值<0.05,确定MET区域与chr7q区域(7号染色体长臂)有明显差异的样本,为MET扩增,反之,如果T检验校正后p值≥0.05,则为MET polysomy。
具体地,首先根据StatusRatio值判断MET基因是否发生扩增,StatusRatio值大于1.4为扩增,小于0.8为缺失,介于0.8和1.4间为中性,即未发生拷贝数变异,如果发生MET扩增,继续利用捕获区域的Ratio值,对MET区域和chR7q区域(7号染色体长臂)包含的Ratio值进行T检验,根据T检验后校正p值是否大于0.05,判断该样本是MET扩增还是polysomy样本,如果p值<0.05,则待测样本为MET扩增样本,即7号染色体局部区域扩增造成MET基因拷贝数增加的样本;反之,如果p值≥0.05,则待测样本为polysomy样本,即7号染色体多倍体造成MET基因拷贝数增加的样本。
鉴定结果如下表所示:
表1
突变类型 样本数 比例
MET扩增 206 82.4%
MET polysomy 44 17.6%
MET扩增表示7号染色体局部区域扩增造成的MET基因拷贝数增加。
MET polysomy表示7号染色体加倍造成的MET基因拷贝数增加。
实施例2
鉴定MET扩增和MET polysomy的方法如下:
随机筛选45例癌症患者组织样本,将45个样本的bam文件与捕获区间(吉因加大panel,芯片名称为cd3)的bed文件、人类参考基因组序列(本实施例使用的人类参考基因组为hs37d5)fastq文件作为输入文件,采用默认参数,利用CNVkit软件分别对每一个样本的拷贝数进行鉴定,获得每个样本相对于参考样本组拷贝数的Ratio。利用CNV注释过滤体系对每个样本进行处理,得到每个基因的Status值,基于CNVKit软件的分析结果,利用T检验识别MET扩增和MET polysomy,具体结果如下:
表2
Figure BDA0002915433070000091
Figure BDA0002915433070000101
对于FISH的结果,利用cMET/CEP7比值(即MET拷贝数与7号染色体着丝粒数的比值)与2的大小关系判断是发生MET扩增和polysomy,如果该比值≥2,为MET扩增(即7号染色体局部区域扩增造成的MET基因拷贝数增加),反之则为polysomy(即7号染色体多倍体造成的MET基因拷贝数增加)。
FISH方法参考文献:Florijn RJ,Bonden La Fau-Vrolijk H,Vrolijk H Fau-Wiegant J,Wiegant J Fau-Vaandrager JW,Vaandrager Jw Fau-Baas F,Baas F Fau-denDunnen JT,et al.High-resolution DNA Fiber-FISH for genomic DNA mapping andcolour bar-coding of large genes.Human Molecular Genetics.1995;4(5):831-6.
表2的IHC结果中,“空白”是指没有收集到该样本的IHC信息。
对于表2的鉴定结果,“AMP”表示MET基因局部扩增(非多倍体),“阴性”表示未发生MET基因拷贝数扩增。
本实施例检出MET局部扩增的灵敏度为12/14=85.7%,特异度为100%。漏检的两例MET局部扩增样本与全基因组扩增(whole genome doubling,WGD)有关。
可见,本实施例可以稳定地鉴定MET扩增,只是个别的样本与FISH结果存在偏差,存在偏差的样本可能是由于肿瘤细胞含量偏低所致。
本领域技术人员可以理解,上述实施方式中各种方法的全部或部分功能可以通过硬件的方式实现,也可以通过计算机程序的方式实现。当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器、随机存储器、磁盘、光盘、硬盘等,通过计算机执行该程序以实现上述功能。例如,将程序存储在设备的存储器中,当通过处理器执行存储器中程序,即可实现上述全部或部分功能。另外,当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序也可以存储在服务器、另一计算机、磁盘、光盘、闪存盘或移动硬盘等存储介质中,通过下载或复制保存到本地设备的存储器中,或对本地设备的系统进行版本更新,当通过处理器执行存储器中的程序时,即可实现上述实施方式中全部或部分功能。
以上应用了具体个例对本发明进行阐述,只是用于帮助理解本发明,并不用以限制本发明。对于本发明所属技术领域的技术人员,依据本发明的思想,还可以做出若干简单推演、变形或替换。

Claims (10)

1.一种预测MET基因拷贝数变化类型的方法,其特征在于,包括:
基因拷贝数比值分析步骤,根据同待测样本相同时间点且比对到参考基因组的正常样本测序数据建立的基线,分析比对到参考基因组的待测样本测序数据中基因拷贝数与正常样本中相应基因拷贝数的比值;
捕获区域分析步骤,根据所述比值,对待测样本的捕获区域进行拷贝数变异注释,根据注释的结果,预测待测样本中MET基因拷贝数是否发生变化,如果预测结果为MET基因拷贝数增加,则进入下一步骤;
MET基因拷贝数变化类型预测步骤,对于预测结果为MET基因拷贝数增加的待测样本,获取待测样本中发生拷贝数变异的捕获区域中,MET基因所包含的捕获区域的基因拷贝数比值以及7号染色体或7号染色体臂所包含的捕获区域的基因拷贝数比值,统计MET基因所包含的捕获区域的基因拷贝数比值与7号染色体或7号染色体臂所包含的捕获区域的基因拷贝数比值是否存在显著性差异,预测得到待测样本中MET基因拷贝数增加的类型。
2.如权利要求1所述的方法,其特征在于,统计MET基因所包含的捕获区域的基因拷贝数比值与7号染色体或7号染色体臂所包含的捕获区域的基因拷贝数比值是否存在显著性差异,预测得到待测样本中MET基因拷贝数变化的类型的具体方法如下:对MET基因所包含的捕获区域的基因拷贝数比值与7号染色体或7号染色体臂所包含的捕获区域的基因拷贝数比值进行T检验,根据T检验后P值与阈值的大小关系,预测得到待测样本中MET基因拷贝数增加的类型。
3.如权利要求2所述的方法,其特征在于,根据T检验后校正P值与阈值的大小关系,预测得到待测样本中MET基因拷贝数增加的类型;
和/或,如果校正P值<阈值,则预测待测样本中MET基因拷贝数增加是由7号染色体局部区域扩增造成;如果校正P值≥阈值,则预测待测样本中MET基因拷贝数增加是由7号染色体多倍体造成;
和/或,所述阈值为0.05;
和/或,校正P值的方法为Bonferroni校正法。
4.如权利要求2所述的方法,其特征在于,所述MET基因所包含的捕获区域的基因拷贝数比值是指该捕获区域的基因拷贝数与正常样本中相应基因拷贝数的比值,所述7号染色体或7号染色体臂所包含的捕获区域的基因拷贝数比值是指7号染色体或7号染色体臂所包含的捕获区域的基因拷贝数与正常样本中相应基因拷贝数的比值;
和/或,所述7号染色体臂为7号染色体长臂、短臂中的至少一种。
5.如权利要求1所述的方法,其特征在于,捕获区域分析步骤中,根据待测样本的MET基因所包含的捕获区域中基因拷贝数与正常样本中相应基因拷贝数的比值与阈值的大小关系,预测待测样本中MET基因拷贝数是否发生变化。
6.如权利要求5所述的方法,其特征在于,用于预测MET基因拷贝数是否增加的阈值为1.4,用于预测MET基因拷贝数是否缺失的阈值为0.8;
和/或,如果待测样本的MET基因所包含的捕获区域中基因拷贝数与正常样本中相应基因拷贝数的比值>1.4,则预测待测样本中MET基因拷贝数增加;如果待测样本的MET基因所包含的捕获区域中基因拷贝数与正常样本中相应基因拷贝数的比值<0.8,则预测待测样本中MET基因拷贝数缺失;如果待测样本的MET基因所包含的捕获区域中基因拷贝数与正常样本中相应基因拷贝数的比值≥0.8且≤1.4,则预测待测样本中MET基因拷贝数中性,即未发生MET基因拷贝数变异。
7.如权利要求1所述的方法,其特征在于,捕获区域分析步骤中,根据所述比值,对待测样本的捕获区域进行拷贝数变异注释后,得到每个捕获区域注释的基因,根据注释的结果,进行基因拷贝数变异过滤,保留发生基因拷贝数变异的捕获区域,然后合并相邻捕获区域基因拷贝数变异类型一致的区域;
和/或,捕获区域分析步骤中,如果预测结果为MET基因拷贝数缺失或中性,则不再进入下一步骤;
和/或,同待测样本相同时间点的正常样本是指与待测样本同一测序批次或一周内相近测序批次的正常样本;
和/或,同待测样本相同时间点的正常样本是指同一建库批次的样本;
和/或,所述待测样本为肿瘤组织样本、体液样本中的至少一种;
和/或,所述正常样本为血细胞样本、癌旁组织样本中的至少一种;
和/或,所述待测样本、正常样本取自人体或动物体;
和/或,所述待测样本、正常样本的测序数据同为全基因组测序数据、全外显子组测序数据或区域捕获测序数据;
和/或,所述待测样本、正常样本的测序数据中含有MET基因测序数据。
8.一种预测MET基因拷贝数变化类型的系统,其特征在于,包括:
基因拷贝数比值分析装置,用于根据同待测样本相同时间点且比对到参考基因组的正常样本测序数据建立的基线,分析比对到参考基因组的待测样本测序数据中基因拷贝数与相应的正常对照样本中该基因的拷贝数的比值;
目标捕获区域分析装置,用于根据所述比值,分析待测样本的目标捕获区域测序数据中目标捕获区域是否发生拷贝数变异,并获得待测样本的目标捕获区域基因拷贝数与相应的正常对照样本中的相应目标捕获区域基因拷贝数的比值;
MET基因拷贝数变化类型判断装置,用于根据待测样本的目标捕获区域基因拷贝数与对应的正常对照样本中的该目标捕获区域基因拷贝数的比值,获取待测样本的MET基因和7号染色体长臂上所包含的目标捕获区域的拷贝数变异基因的拷贝数与相应的正常对照样本中相应基因的拷贝数的比值,统计待测样本中的MET基因拷贝数比值与待测样本中的7号染色体拷贝数比值是否存在显著性差异,判断待测样本中MET基因拷贝数变化的类型。
9.一种预测MET基因拷贝数变化类型的装置,其特征在于,包括:
存储器,用于存储程序;
处理器,用于通过执行所述存储器存储的程序以实现如权利要求1-7任意一项所述的方法。
10.一种计算机可读存储介质,其特征在于,其上存储有程序,所述程序能够被处理器执行以实现如权利要求1-7任意一项所述的方法。
CN202110099257.7A 2021-01-25 2021-01-25 一种预测met基因拷贝数变化类型的方法及装置 Active CN112768000B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110099257.7A CN112768000B (zh) 2021-01-25 2021-01-25 一种预测met基因拷贝数变化类型的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110099257.7A CN112768000B (zh) 2021-01-25 2021-01-25 一种预测met基因拷贝数变化类型的方法及装置

Publications (2)

Publication Number Publication Date
CN112768000A true CN112768000A (zh) 2021-05-07
CN112768000B CN112768000B (zh) 2021-07-20

Family

ID=75707273

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110099257.7A Active CN112768000B (zh) 2021-01-25 2021-01-25 一种预测met基因拷贝数变化类型的方法及装置

Country Status (1)

Country Link
CN (1) CN112768000B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114093421A (zh) * 2021-11-23 2022-02-25 深圳基因家科技有限公司 一种判别淋巴瘤分子亚型的方法、装置和存储介质
CN114512183A (zh) * 2022-01-27 2022-05-17 北京吉因加医学检验实验室有限公司 一种预测met基因扩增或多倍体的方法及装置
CN114703263A (zh) * 2021-12-20 2022-07-05 北京科迅生物技术有限公司 一种群组染色体拷贝数变异检测方法及装置
CN115376609A (zh) * 2022-10-24 2022-11-22 广州燃石医学检验所有限公司 一种判别met基因拷贝数扩增类型的方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108427864A (zh) * 2018-02-14 2018-08-21 南京世和基因生物技术有限公司 一种拷贝数变异的检测方法、装置以及计算机可读介质
CN108664766A (zh) * 2018-05-18 2018-10-16 广州金域医学检验中心有限公司 拷贝数变异的分析方法、分析装置、设备及存储介质
CN109536582A (zh) * 2017-09-21 2019-03-29 江苏蒙特立生物技术有限公司 一种新型肺癌c-MET基因扩增检测方法及试剂盒
US20200219588A1 (en) * 2010-01-19 2020-07-09 Verinata Health, Inc. Detecting and classifying copy number variation
CN111508559A (zh) * 2020-04-21 2020-08-07 北京橡鑫生物科技有限公司 检测目标区域cnv的方法及装置
CN111968701A (zh) * 2020-08-27 2020-11-20 北京吉因加科技有限公司 检测指定基因组区域体细胞拷贝数变异的方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200219588A1 (en) * 2010-01-19 2020-07-09 Verinata Health, Inc. Detecting and classifying copy number variation
CN109536582A (zh) * 2017-09-21 2019-03-29 江苏蒙特立生物技术有限公司 一种新型肺癌c-MET基因扩增检测方法及试剂盒
CN108427864A (zh) * 2018-02-14 2018-08-21 南京世和基因生物技术有限公司 一种拷贝数变异的检测方法、装置以及计算机可读介质
CN108664766A (zh) * 2018-05-18 2018-10-16 广州金域医学检验中心有限公司 拷贝数变异的分析方法、分析装置、设备及存储介质
CN111508559A (zh) * 2020-04-21 2020-08-07 北京橡鑫生物科技有限公司 检测目标区域cnv的方法及装置
CN111968701A (zh) * 2020-08-27 2020-11-20 北京吉因加科技有限公司 检测指定基因组区域体细胞拷贝数变异的方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LUCHENG ZHU,ET AL.: "Identification of somatic copy number variations in plasma cell free DNA correlating with intrinsic resistances to EGFR targeted therapy in T790M negative non-small cell lung cancer", 《JOURNAL OF THORACIC DISEASE.》 *
王冰,等: "肿瘤驱动基因拷贝数变异检测的应用研究进展", 《医疗装备》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114093421A (zh) * 2021-11-23 2022-02-25 深圳基因家科技有限公司 一种判别淋巴瘤分子亚型的方法、装置和存储介质
CN114093421B (zh) * 2021-11-23 2022-08-23 深圳吉因加信息科技有限公司 一种判别淋巴瘤分子亚型的方法、装置和存储介质
CN114703263A (zh) * 2021-12-20 2022-07-05 北京科迅生物技术有限公司 一种群组染色体拷贝数变异检测方法及装置
CN114703263B (zh) * 2021-12-20 2023-09-22 北京科迅生物技术有限公司 一种群组染色体拷贝数变异检测方法及装置
CN114512183A (zh) * 2022-01-27 2022-05-17 北京吉因加医学检验实验室有限公司 一种预测met基因扩增或多倍体的方法及装置
CN115376609A (zh) * 2022-10-24 2022-11-22 广州燃石医学检验所有限公司 一种判别met基因拷贝数扩增类型的方法及装置

Also Published As

Publication number Publication date
CN112768000B (zh) 2021-07-20

Similar Documents

Publication Publication Date Title
CN112768000B (zh) 一种预测met基因拷贝数变化类型的方法及装置
US11142798B2 (en) Systems and methods for monitoring lifelong tumor evolution field of invention
CN110444255B (zh) 基于二代测序的生物信息质控方法、装置和存储介质
CN112805563A (zh) 用于评估和/或治疗癌症的无细胞dna
Heinzerling et al. Rare BRAF mutations in melanoma patients: implications for molecular testing in clinical practice
CN108319813B (zh) 循环肿瘤dna拷贝数变异的检测方法和装置
TWI670495B (zh) 一種鑑定樣本中腫瘤負荷的方法和系統
CN111304303B (zh) 微卫星不稳定的预测方法及其应用
JP2021516962A (ja) バリアント検出の改善
CN107447013B (zh) 检测Kras基因第12、13密码子突变位点的方法及其试剂盒
Dudley et al. Tumor cellularity as a quality assurance measure for accurate clinical detection of BRAF mutations in melanoma
Snow et al. A simple and cost-effective method of DNA extraction from small formalin-fixed paraffin-embedded tissue for molecular oncologic testing
CN116403644B (zh) 一种用于癌症风险预测的方法及装置
CN111899789B (zh) 二代测序鉴定brca1/2大片段重排的方法及系统
US20170101670A1 (en) Method for detecting rare mutation
CN116200490A (zh) 一种检测实体瘤微小残留病灶的方法
CN114277145A (zh) 用于肺癌诊断的试剂盒、装置及方法
CN110004229A (zh) 多基因作为egfr单克隆抗体类药物耐药标志物的应用
CN111968702B (zh) 一种基于循环肿瘤dna的恶性肿瘤早期筛查系统
US20210102199A1 (en) Fragment size characterization of cell-free dna mutations from clonal hematopoiesis
CN111370065B (zh) 一种检测rna跨样本交叉污染率的方法和装置
WO2016014941A1 (en) Method to diagnose malignant melanoma in the domestic dog
Wang et al. Gene mutation analysis in papillary thyroid carcinoma using a multi-gene panel in China
JP7185700B2 (ja) 腫瘍の遺伝的不均一性を評価することによって治療法に対する応答を予測する方法
CN110564851A (zh) 一组用于非超突变型直肠癌分子分型的基因及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant