CN110853705B - 肿瘤细胞含量评估方法、装置、系统以及计算机可读介质 - Google Patents

肿瘤细胞含量评估方法、装置、系统以及计算机可读介质 Download PDF

Info

Publication number
CN110853705B
CN110853705B CN201911088666.6A CN201911088666A CN110853705B CN 110853705 B CN110853705 B CN 110853705B CN 201911088666 A CN201911088666 A CN 201911088666A CN 110853705 B CN110853705 B CN 110853705B
Authority
CN
China
Prior art keywords
mutation
tumor cell
content
sample
cell content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911088666.6A
Other languages
English (en)
Other versions
CN110853705A (zh
Inventor
张水荣
施巍炜
王凯
柳文进
黄璐嘉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Origimed Technology Shanghai Co ltd
Original Assignee
Origimed Technology Shanghai Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Origimed Technology Shanghai Co ltd filed Critical Origimed Technology Shanghai Co ltd
Priority to CN201911088666.6A priority Critical patent/CN110853705B/zh
Publication of CN110853705A publication Critical patent/CN110853705A/zh
Application granted granted Critical
Publication of CN110853705B publication Critical patent/CN110853705B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection

Landscapes

  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Analytical Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明提供了一种能提高对肿瘤细胞含量评估的准确性的肿瘤细胞含量评估方法、装置、系统以及计算机可读介质,其中的肿瘤细胞含量评估方法包括以下步骤:逐一获取满足预定突变条件的突变位点的平均样本突变频率和对照突变频率,并计算得到与该突变位点对应的单个肿瘤细胞含量;一旦得到所有满足预定突变条件的突变位点对应的所有单个肿瘤细胞含量,就获取该所有单个肿瘤细胞含量并计算得到检测样本中的肿瘤细胞含量;根据预定评估规则对计算得到的检测样本中的肿瘤细胞含量评估得到评估后检测样本中的肿瘤细胞含量。

Description

肿瘤细胞含量评估方法、装置、系统以及计算机可读介质
技术领域
本发明属于生物领域,具体涉及一种肿瘤细胞含量评估方法、装置、系统以及计算机可读介质。
背景技术
1对肿瘤组织进行基因变异检测分析时,肿瘤组织内基因肿瘤细胞也有正常细胞,由于正常细胞的存在,使得对基因拷贝数变异、基因杂合性缺失、肿瘤细胞亚克隆等的分析时,为了能得到更精确的结果,需要考虑进肿瘤细胞。
目前对于肿瘤细胞含量的分析主要通过病理染色(Pathology),还有一些FACETS、PureCN等算法,其中,病理染色由于人工进行,误差较大,而其他两种算法之间差异也很大。
下述是采用这些方法,对38例肿瘤样本(检测样本,Sample)的肿瘤细胞含量进行分析,各种方法得到的肿瘤细胞含量结果如表1所示,发现,不管是病理给出的肿瘤细胞含量,还是目前已有的算法计算出的肿瘤细胞含量,结果之间差异较大,并没有一个很好的标准。
Figure BDA0002266204420000011
Figure BDA0002266204420000021
图1是背景技术中针对38例肿瘤样本对病例理给出的肿瘤细胞含量以及FACETS、PureCN两种算法计算的肿瘤细胞含量之间的比较。
由图1可见,各种方法的结果差异极显著,在这种情况下,无法确定哪个结果是准确的。
可见,目前对于这些检测样本中肿瘤细胞含量的分析方法中,病理染色人为误差较大,而不同方法得到的结果差异较大,并没有统一的标准,使得实际应用中带来很多困难。
发明内容
本发明提供一种肿瘤细胞含量评估方法、装置、系统以及计算机可读介质,目的在于提高对肿瘤细胞含量评估的准确性。
为了实现上述目的,本发明采用了如下技术方案:
本发明的一个目的是提供一种肿瘤细胞含量评估方法,用于根据包含分别对检测样本和对照样本测序分析得到的与各个突变位点分别对应的各个平均样本突变频率和与该各个突变位点分别对应的对照突变频率的测序分析数据,对检测样本中的肿瘤细胞含量进行评估,其特征在于,包括以下步骤:逐一获取满足预定突变条件的突变位点的平均样本突变频率和对照突变频率,并采用公式(1)计算得到与该突变位点对应的单个肿瘤细胞含量;一旦得到所有满足预定突变条件的突变位点对应的所有单个肿瘤细胞含量,就获取该所有单个肿瘤细胞含量并采用公式(2)计算得到检测样本中的肿瘤细胞含量;根据预定评估规则对公式(2)计算得到的检测样本中的肿瘤细胞含量评估得到评估后检测样本中的肿瘤细胞含量,
其中,公式(1)和公式(2)分别如下所示,
Figure BDA0002266204420000031
Figure BDA0002266204420000032
公式(1)中,针对一个满足预定突变条件的一个突变位点,P为计算得到的该突变位点对应的单个肿瘤细胞含量,VAFa为检测样本中该突变位点对应的样本平均突变频率,VAFt为检测样本中该突变位点对应的肿瘤细胞的突变频率,VAFn为对照样本中该突变位点对应的对照突变频率,当VAFa小于等于VAFn时,VAFt取值为VAFa/2,当VAFa大于VAFn时,VAFt取值为(VAFa+1)/2;
公式(2)中,p为计算得到的检测样本中的肿瘤细胞含量,n为满足预定突变条件的突变位点的总数,该n个突变位点各自对应的单个肿瘤细胞含量P分别为P1、P2、P3、P4…Pn。
本发明提供的肿瘤细胞含量评估方法,还具有这样的特征:其中,预定突变条件为,一个突变位点对应的对照突变频率大于等于0.4并小于等于0.6。
本发明提供的肿瘤细胞含量评估方法,还具有这样的认知:其中,对照样本为来自血液或癌旁组织的样本。
本发明提供的肿瘤细胞含量评估方法,还具有这样的特征:其中,预定评估规则为:直接将公式(2)计算得到的检测样本中的肿瘤细胞含量评估为评估后检测样本中的肿瘤细胞含量。
本发明提供的肿瘤细胞含量评估方法,还具有这样的特征:其中,预定评估规则为:采用下述肿瘤细胞含量矫正模型对计算得到的检测样本中的肿瘤细胞含量进行矫正,并将该矫正后得到的肿瘤细胞含量评估为评估后检测样本中的肿瘤细胞含量,
y=ax-b (3)
式(3)中,y为矫正后得到的检测样本中的肿瘤细胞含量;
x为计算得到的检测样本中的肿瘤细胞含量p,
a和b为模型参数,a的取值为1.4,b的取值范围为0.23-0.26。
本发明还提供一种肿瘤细胞含量评估装置,其特征在于,具有:单个肿瘤细胞含量计算部,逐一获取满足预定突变条件的突变位点的平均样本突变频率和对照突变频率,并采用公式(1)计算得到与该突变位点对应的单个肿瘤细胞含量;肿瘤细胞含量计算部,一旦得到所有满足预定突变条件的突变位点对应的所有单个肿瘤细胞含量,就获取该所有单个肿瘤细胞含量并采用公式(2)计算得到检测样本中的肿瘤细胞含量,含量评估部,根据预定评估规则对公式(2)计算得到的检测样本中的肿瘤细胞含量评估得到评估后检测样本中的肿瘤细胞含量,
其中,公式(1)和公式(2)分别如下所示,
Figure BDA0002266204420000051
Figure BDA0002266204420000052
公式(1)中,针对一个满足预定突变条件的一个突变位点,P为计算得到的该突变位点对应的单个肿瘤细胞含量,VAFa为检测样本中该突变位点对应的样本平均突变频率,VAFt为样本中该突变位点对应的肿瘤细胞的突变频率,VAFn为对照样本中该突变位点对应的对照突变频率,
公式(2)中,p为计算得到的检测样本中的肿瘤细胞含量,n为满足预定突变条件的突变位点的总数,n个突变位点各自对应的单个肿瘤细胞含量P分别用P1、P2、P3、P4…Pn表示。
本发明提供的肿瘤含量评估装置,还具有这样的特征:其中,预定评估规则为:直接将公式(2)计算得到的检测样本中的肿瘤细胞含量评估为评估后检测样本中的肿瘤细胞含量。
本发明提供的肿瘤含量评估装置,还具有这样的特征:其中,预定评估规则为:采用下述肿瘤细胞含量矫正模型对计算得到的检测样本中的肿瘤细胞含量进行矫正,并将该矫正后得到的肿瘤细胞含量评估为评估后检测样本中的肿瘤细胞含量,
y=ax-b (3)
式(3)中,y为矫正后的检测样本中的肿瘤细胞含量p′;
x为计算得到的检测样本中的肿瘤细胞含量p,
a和b为模型参数,
a的取值为1.4,b的取值范围为0.23-0.26。
本发明还提供一种肿瘤细胞含量评估系统,其特征在于,包括:突变频率检测装置,用于分别对检测样本和对照样本测序分析得到包含与各个突变位点分别对应的各个平均样本突变频率和与该各个突变位点分别对应的对照突变频率的测序分析数据;肿瘤细胞含量评估装置,根据样本突变频率和对照突变频率对检测样本中的肿瘤细胞含量进行评估,其中,肿瘤细胞含量评估装置为上述的肿瘤细胞含量评估装置。
本发明还提供一种肿瘤细胞含量评估设备,其特征在于,包括:用于存储计算机程序指令的存储器;以及用于执行计算机程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,使该设备执行如上的肿瘤细胞含量评估方法的步骤。
本发明还一种计算机可读介质,其特征在于:计算机可读介质存储有计算机程序,其中,计算机程序能被处理器执行以实现如上的肿瘤细胞含量评估方法的步骤。
本发明的另一个目的是提供一种基因拷贝数评估方法,其特征在于:基于检测样本中的肿瘤细胞的含量,对基因拷贝数进行评估,其中,检测样本中的肿瘤细胞的含量采用如上所述的肿瘤细胞含量评估方法评估得到。
发明作用与效果
本发明提供的肿瘤细胞含量评估方法、装置、系统以及计算机可读介质,由于根据检测样本和对照样本测序分析得到的与各个突变位点分别对应的各个平均样本突变频率和与该各个对照突变频率分别对应的对照突变频率通过公式(1)和公式(2)对检测样本中的肿瘤细胞含量进行评估,使得评估后的检测样本中的肿瘤细胞含量与实际的肿瘤细胞含量接近度高,相比现有的方法更可靠,从而也能作为一种检测样本中的肿瘤细胞含量分析的统一标准。
附图说明
图1是背景技术中针对38例肿瘤样本对病例理给出的肿瘤细胞含量以及FACETS、PureCN两种算法计算的肿瘤细胞含量之间的比较;
图2本发明的实施例1涉及的肿瘤细胞含量评估系统的结构框图;
图3是本发明实施例1涉及的肿瘤细胞含量评估装置的结构框图;
图4为本发明的实施例1所涉及的肿瘤细胞含量评估系统的动作流程图;
图5为本发明的实施例2涉及的肿瘤细胞含量评估装置的结构框图;
图6为对本发明的实施例1涉及的肿瘤细胞含量评估装置和方法的验证结果。
具体实施方式
以下结合附图来说明本发明的具体实施方式。对于实施例中所用到的具体方法或材料,本领域技术人员可以在本发明技术思路的基础上,根据已有的技术进行常规的替换选择,而不仅限于本发明实施例的具体记载。
实施例中所使用的方法如无特殊说明,均为常规方法;所使用的材料、试剂等,如无特殊说明,均可从商业途径得到。
以下各个实施例中,所涉及的检测样本来自待检测的对象,具体来自比如肿瘤组织;而对照样本指来自同一待检测对象作为对照的样本,具体来自比如血液或癌旁组织。
以下各个实施例中涉及的各种样本的取样和测序过程,均为现有通用的方法和过程。
实施例1
该实例是对肿瘤细胞含量评估系统以及相应的处理过程进行相应的说明。
图2本发明的实施例1涉及的肿瘤细胞含量评估系统的结构框图。
如图2所示,肿瘤细胞含量评估系统100包括:突变频率检测装置10,通过通信网络30与突变频率检测装置10相通信连接的肿瘤细胞含量评估装置20。
突变频率检测装置10是基于对检测样本和对照样本测序的结果,进行分析,得到包含与各个突变位点分别对应的各个平均样本突变频率和与该各个突变位点分别对应的对照突变频率的测序分析数据,也即得到每个突变位点在检测样本中的突变频率以及在对照样本中相应的突变频率。其中,由于检测样本中既有正常细胞也有肿瘤细胞,所以得到的样本突变频率事实上是这两种细胞的平均。
具体地,通过以下得到上述的平均样本突变频率和对照突变频率:
通过高通量二代测序平台对检测样本和对照样本进行测序,测得的序列和人类参考基因组进行比对,针对每一个突变位点,假设共有M条序列覆盖了该位点,其中有N条序列在该位点与人类参考基因组不一致,有M-N条序列在该位点与人类参考基因组一致,那么对于该位点,检测样本的平均突变频率或对照样本的突变频率为
Figure BDA0002266204420000091
图3是本发明实施例1涉及的肿瘤细胞含量评估装置的结构框图。
如图3所示,肿瘤细胞含量评估装置20具有单个肿瘤细胞含量计算部21、肿瘤含量计算部22、含量评估部23、信息存储部24、肿瘤细胞含量评估侧通信部25、肿瘤细胞含量评估侧暂存部26以及肿瘤细胞含量评估侧控制部27。
肿瘤细胞含量评估侧通信部25通过通信连接,从突变频率检测装置10接收上述的包含与各个突变位点分别对应的各个平均样本突变频率和与该各个突变位点分别对应的对照突变频率的测序分析数据,并将各个平均样本突变频率和对照突变频率与相对应的突变位点对应地存储在信息存储部24,具体对应方式如表1所示。
Figure BDA0002266204420000101
单个肿瘤细胞含量计算部21逐一获取满足预定突变条件的突变位点的平均样本突变频率和对照突变频率,并采用公式(1)计算得到与该突变位点对应的单个肿瘤细胞含量。
具体地,本实施例中:
单个肿瘤细胞含量计算部21从信息存储部24中对应存储的信息中,针对一个突变位点,当判断满足上述的预定突变条件时,就获取该突变位点对应的平均样本突变频率和对照突变频率,本实施例中,预定突变条件是:一个突变位点对应的对照突变频率大于等于0.4并小于等于0.6,也即0.4≤VAFn≤0.6。
例如表1中,对突变位点1,其对应的对照突变频率为0.5,满足预定突变条件,于是获取对应的平均样本突变频率(0.4)和对照突变频率(0.5);而对于突变位点2,由于VAFn为0.8,大于0.6,该突变位点不满足上述预定突变条件,所以舍弃。
之后,采用公式(1)计算得到与该每一个突变位点分别对应的各个肿瘤细胞含量,为便于表述,此时用“单个肿瘤细胞含量”表示,也即,针对一个满足预定突变条件的一个突变位点,将获取的对应的平均样本突变频率和对照突变频率,采用公式(1)进行计算得到该突变位点相应的单个肿瘤细胞含量,公式(1)如下:
Figure BDA0002266204420000111
公式(1)中,针对一个满足预定突变条件的一个突变位点,P为计算得到的该突变位点对应的单个肿瘤细胞含量,VAFa为检测样本中该突变位点对应的样本平均突变频率,VAFt为检测样本中该突变位点对应的肿瘤细胞的突变频率:当VAFa小于等于VAFn时,VAFt取值为VAFa/2,当VAFa大于VAFn时,VAFt取值为(VAFa+1)/2,VAFn为对照样本中该突变位点对应的对照突变频率。
通过逐一获取各个满足预定突变条件的突变位点,并采用公式(1)计算,就能得到各个满足预定突变条件的突变位点相应的单个肿瘤细胞含量。
例如上述表1中,若m=5,则满足预定突变条件的有突变位点1、突变位点3、突变位点4以及突变位点5,根据上述VAFt取值要求,:
对于突变位点1,VAFt取值为0.4/2=0.2;
对于突变位点3,VAFt取值为(0.55+1)/2=0.78;
对于突变位点4,VAFt取值为(0.5+1)/2=0.75;
对于突变位点5,VAFt取值为0.45/2=0.23。
相应地,该几个突变位点各自的单个肿瘤细胞含量计算得到分别为:0.33、0.18、0.22以及0.41。
一旦得到所有满足预定突变条件的突变位点对应的所有单个肿瘤细胞含量,肿瘤含量计算部22就获取计算得到的所有单个肿瘤细胞含量并采用公式(2)计算得到检测样本中的肿瘤细胞含量,其中,公式(2)如下所示:
Figure BDA0002266204420000121
公式(2)中,p为计算得到的检测样本中的肿瘤细胞含量,n为满足预定突变条件的突变位点的总数,该n个突变位点各自对应的单个肿瘤细胞含量P分别为P1、P2、P3、P4…Pn。
例如针对表1中,总共计算得到4(n=4)个单个肿瘤细胞含量,分别为0.33(P1)、0.18(P2)、0.22(P3)以及0.41(P4),从而计算得到检测样本中的肿瘤细胞含量p=(0.33+0.18+0.22+0.41)/4=0.285。
含量评估部根据预定评估规则对公式(2)计算得到的检测样本中的肿瘤细胞含量进行评估得到最后的检测样本中的肿瘤细胞含量,为了便于说明,本实施例中,评估得到的检测样本中的肿瘤细胞含量命名为评估后检测样本中的肿瘤细胞含量,本实施例中,预定评估规则为:直接将公式(2)计算得到的检测样本中的肿瘤细胞含量评估为评估后检测样本中的肿瘤细胞含量。据此,例如,上述计算得到的0.285,就直接为上述评估后检测样本中的肿瘤细胞含量。
肿瘤细胞含量评估侧暂存部26肿瘤细胞含量评估装置20运行产生的相关数据或参数进行暂时存储。
肿瘤细胞含量评估侧控制部27包括控制单个肿瘤细胞含量计算部21、肿瘤含量计算部22、含量评估部23、信息存储部24、肿瘤细胞含量评估侧通信部25以及肿瘤细胞含量评估侧暂存部26运行的计算机程序。
图4为本发明的实施例1所涉及的肿瘤细胞含量评估系统的动作流程图。
如图4所示,在本实施例中,肿瘤细胞含量评估系统100的动作流程包含以下步骤:
步骤S1,突变频率检测装置10得到包含与各个突变位点分别对应的各个平均样本突变频率和与该各个突变位点分别对应的对照突变频率的测序分析数据,并通过通信网络30将该测序分析数据发送给肿瘤细胞含量评估装置20,然后进入步骤S2;
步骤S2,肿瘤细胞含量评估侧通信部25通过通信网络30,从突变频率检测装置10接收上述测序数据,并将各个平均样本突变频率和对照突变频率与相对应的突变位点对应地存储到信息存储部24中,然后进入步骤S3;
步骤S3,单个肿瘤细胞含量计算部21逐一获取满足预定突变条件的突变位点的平均样本突变频率和对照突变频率,并采用公式(1)计算得到与该突变位点对应的单个肿瘤细胞含量,然后进入步骤S4;
步骤S4,肿瘤细胞含量评估侧控制部27判断是否得到所有满足预定突变条件的突变位点对应的所有单个肿瘤细胞含量,当判断为是时,进入步骤S5,当判断为不是时,返回步骤S3;
步骤S5,肿瘤含量计算部22获取计算得到的所有单个肿瘤细胞含量并采用公式(2)计算得到检测样本中的肿瘤细胞含量,然后进入步骤S6;
步骤S6,含量评估部根据预定评估规则对公式(2)计算得到的检测样本中的肿瘤细胞含量进行评估得到评估后检测样本中的肿瘤细胞含量。
实施例2
以下是对实施例2的说明。
在实施例2中,对于和实施例1中相同的结构,给予相同的符号,并省略相同的说明。
图5为本发明的实施例2涉及的肿瘤细胞含量评估装置的结构框图。
如图5所示,肿瘤细胞含量评估装置220具有单个肿瘤细胞含量计算部21、肿瘤含量计算部22、含量评估部223、信息存储部24、肿瘤细胞含量评估侧通信部25、肿瘤细胞含量评估侧暂存部26以及肿瘤细胞含量评估侧控制部27。
本实施例中,肿瘤细胞含量评估装置220与实施例的不同之处在于含量评估部223采用的预定评估规则,本实施例中的预定评估规则为:采用下述肿瘤细胞含量矫正模型对公式(2)计算得到的样本中的肿瘤细胞含量进行矫正,并将该矫正后得到的肿瘤细胞含量评估为评估后检测样本中的肿瘤细胞含量,
y=ax-b (3)
式(3)中,y为矫正后得到检测样本中的肿瘤细胞含量;
x为采用公式(2)计算得到的检测样本中的肿瘤细胞含量p;
a和b为模型参数,a的取值为1.4,b的取值范围为0.23-0.26。
实施例3
该实施例为了验证采用实施例1中的肿瘤细胞含量评估系统中的肿瘤细胞含量评估装置,以及相应的处理过程的评估样本中肿瘤细胞含量的可靠性。具体如下。
样本选择:选择配对的肿瘤细胞系样本和正常细胞系样本,采购的商业细胞系如表2,其中肿瘤细胞系都是纯的肿瘤细胞,也就是100%的肿瘤细胞,正常细胞系都是纯的正常细胞,也就是100%的正常细胞。
Figure BDA0002266204420000161
通过两种方法进行混样:
方法一:在测序前(实验阶段),将从肿瘤细胞系提取的DNA和从正常细胞系中提取的DNA按不同比例进行混样,具体比例如表3,然后对混合后的样本进行目标区域靶向测序。
Figure BDA0002266204420000162
方法二:在数据分析阶段,进行数据抽提混样,具体是:先对表1中5个纯的细胞系进行测序,得到测序数据,再从测序数据中按比例抽提数据进行混样,具体比例如表4
Figure BDA0002266204420000163
Figure BDA0002266204420000171
方法一和方法二的混合方法是为了模拟得到肿瘤组织样本中的肿瘤细胞的实际含量,也就是说以细胞系混样的实际结果作为参考标准,通过混样知道了真实的肿瘤细胞含量的话,就可以检验实施例1中的肿瘤细胞含量评估系统以及相应的处理过程的评估样本中肿瘤细胞含量的可靠性。
所以,本实施例采用现有的FACETS和PureCN算法,并采用实施例1的肿瘤细胞含量评估系统以及相应的处理过程(为便于说明,命名为OriPurity),分别对方法一和方法二混合后的样本计算或评估肿瘤细胞含量。其中,正常细胞系即视为对照样本,正常细胞系和配对的肿瘤细胞系的混合即视为检测样本。
图6为对本发明的实施例1涉及的肿瘤细胞含量评估装置和方法的验证结果。
采用上述三种方法,分别得到的检测样本中肿瘤细胞含量的结果(x)见表5所示。
Figure BDA0002266204420000172
Figure BDA0002266204420000181
该结果与混合后实际的肿瘤细胞含量(也即表3和表4中的混合后的肿瘤细胞含量)做回归分析,结果如图6所示。
图6中,左栏为各种方法对方法一混合计算或评估得到的肿瘤细胞含量(TestPurity),与方法一混合后实际的肿瘤细胞含量(TruePurity,表3中的混合后的肿瘤细胞含量)之间的回归分析;右栏为方法二混合计算或评估得到的肿瘤细胞含量(TestPurity),与方法二混合后实际的肿瘤细胞含量(TruePurity,表4中的混合后的肿瘤细胞含量)之间的回归分析;图6中,相关性系数R的取值范围是大于等于-1,小于等于1,R小于0时,x、y负相关,R等于0时,x、y不相关,R大于0时,x、y正相关,绝对值越大,说明x、y的相关性越强,模型越好回归越好;p值越小,x、y的相关性越有统计学意义,越可信。
从图6中可以看出,采用实施例1提供的装置和方法,方法一和方法二混合检测结果的R均最大,且p均最小,也即说明相比另外两种方法,实施例一提供的装置和方法得到的肿瘤细胞含量与混合后实际的肿瘤细胞含量接近度最高,也即最为准确,可靠性更高。
实施例4
本实施例对实施例3中提供的样本1-5,采用方法一混合后,分别采用实施例1和实施例2中的肿瘤细胞含量评估系统中的肿瘤细胞含量评估装置以及相应的处理过程分别得到评估的检测样本中的肿瘤细胞含量,结果见表6,其中:每个样本进行了5个重复,实施例2中b分别取值为0.23、0.25和0.26,实际肿瘤细胞含量即为前述的方法一混样的混合后的肿瘤细胞含量。
Figure BDA0002266204420000191
Figure BDA0002266204420000201
从表6中可以看出,实施例1得到的各个肿瘤细胞含量,与实际的肿瘤细胞含量的平均接近度为59%,实施例2中采用不同的b值得到的肿瘤细胞含量,与实际的肿瘤细胞含量的平均接近度为79%,可见,经实施例2矫正后得到的肿瘤细胞含量,更接近实际的肿瘤细胞含量,相比实施例1未经矫正得到的结果,可靠度提高了20%。
再将实施例1和实施例2分别得到的肿瘤细胞含量,分别对相应检测样本中存在拷贝数变异的基因进行拷贝数评估,同时还采用不考虑肿瘤细胞含量的方法进行拷贝数评估,结果见表7。
表7中,进行拷贝数评估的公式为:
Figure BDA0002266204420000202
其中,log2 ratio为以2为底ratio的对数;
purity为所述检测样本中的肿瘤细胞含量,当不考虑肿瘤细胞含量时,该值取值为1;
ratio为矫正后测序深度比,ratio=TD/CD,
TD为检测样本矫正后的样本矫正测序深度,
CD为对照样本矫正后的对照矫正测序深度。
具体地,通过以下得到上述检测矫正测序深度和对照矫正测序深度:
肿瘤样本和对照样本中基因测序深度均一化过程如下:
Figure BDA0002266204420000211
说明:
Dnor:均一化之后的测序深度;
Dgene:基因的测序深度;
Dmin:所有基因中最小测序深度;
Dmax:所有基因中最大测序深度;
肿瘤样本和对照样本中基因测序深度GC含量矫正,每个基因包括四种碱基A、G、C、T,G、C碱基与四种碱基的比值就是GC含量,利用局部多项式回归(LOESS和LOWESS)模型将均一化之后的深度Dnor与GC含量进行拟合,得到拟合模型,再将Dnor代入模型中进行预测,得到预测值Dpre,Dnor与Dpre比值就是GC矫正之后的测序深度,即TD(肿瘤样本均一化和GC矫正之后的深度,检测矫正测序深度)或者CD(对照样本均一化和GC矫正之后的深度,对照矫正测序深度)。
Figure BDA0002266204420000221
从表7中看出,实施例1得到的各个拷贝数结果,与实际的拷贝数结果的平均接近度为74%,实施例2中采用不同的b值得到的拷贝数结果,与实际的拷贝数结果的平均接近度为77%,不考虑肿瘤细胞含量的结果与实际的拷贝数结果的平均接近度为53%。
可见,采用本实施例1和实施例2得到的肿瘤细胞含量的进行拷贝数评估,相比不考虑肿瘤细胞含量的拷贝数评估结果,接近度至少提高了20%,结果相比不考虑肿瘤细胞含量的拷贝数评估更可靠;而经实施例2矫正后得到的拷贝数结果,更接近实际的拷贝数结果,相比实施例1未经矫正得到的结果,可靠度提高了3%。
实施例的作用与效果
实施例1涉及的肿瘤细胞含量评估方法、装置和系统,通过实施例3可知,相比现有的两种计算方法,对检测样本中的肿瘤细胞含量的评估结果和实际结果之间的回归性更好,也即对检测样本中的肿瘤细胞含量的分析更可靠,从而能作为一种可靠的统一标准供使用者采用,用于相应的需要肿瘤细胞含量的产品或方法中;
从实施例4可以看出,采用本发明提供的肿瘤细胞含量评估方法、装置和系统得到的肿瘤细胞含量,用于基因拷贝数评估,能提高基因拷贝数的评估结果的准确性,且相比不考虑肿瘤细胞含量的拷贝数评估,具有更高的可靠性。
实施例2所涉及的肿瘤细胞含量评估方法、装置和系统,实际上是对实施例1的评估结果的进一步矫正,通过实施例4也可以看出,该矫正相比实施例1,能得到更为准确的肿瘤细胞含量,相应地,采用该肿瘤细胞含量评估得到的基因拷贝数结果相比实施例1也更准确,也即实施例2的提供的肿瘤细胞含量评估方法、装置和系统对检测样本中的肿瘤细胞含量的分析可靠性高,从而使得在考虑肿瘤细胞含量的基因拷贝数的应用中的可靠性也更高。
另外,相应的,本发明还公开了一种肿瘤细胞含量评估设备,包括:用于存储计算机程序指令的存储器;以及用于执行计算机程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,使该设备执行实施例中的肿瘤细胞含量评估装置运行的方法的步骤。技术部分的具体内容可参见本文上述实施例,在此不再赘述。
相应的,本发明还公开了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述肿瘤细胞含量评估装置运行的方法的步骤。具体内容可参见实施例,在此不再赘述。

Claims (12)

1.一种肿瘤细胞含量评估方法,用于根据包含分别对检测样本和对照样本测序分析得到的与各个突变位点分别对应的各个平均样本突变频率和与该各个突变位点分别对应的各个对照突变频率的测序分析数据,对所述检测样本中的肿瘤细胞含量进行评估,其特征在于,包括以下步骤:
逐一获取满足预定突变条件的所述突变位点的所述平均样本突变频率和所述对照突变频率,并采用公式(1)计算得到与该所述突变位点对应的单个肿瘤细胞含量;
一旦得到所有满足所述预定突变条件的突变位点对应的所有单个肿瘤细胞含量,就获取所有所述单个肿瘤细胞含量并采用公式(2)计算得到所述检测样本中的肿瘤细胞含量;
根据预定评估规则对公式(2)计算得到的所述检测样本中的肿瘤细胞含量评估得到评估后检测样本中的肿瘤细胞含量,
其中,公式(1)和公式(2)分别如下所示,
Figure FDA0003492460640000011
Figure FDA0003492460640000012
公式(1)中,针对一个满足所述预定突变条件的一个突变位点,
P为计算得到的该突变位点对应的所述单个肿瘤细胞含量,
VAFa为所述检测样本中该突变位点对应的样本平均突变频率,
VAFt为所述检测样本中该突变位点对应的肿瘤细胞的突变频率,
VAFn为对照样本中该突变位点对应的对照突变频率,
当VAFa小于等于VAFn时,VAFt取值为VAFa/2,
当VAFa大于VAFn时,VAFt取值为(VAFa+1)/2;
公式(2)中,p为计算得到的所述检测样本中的肿瘤细胞含量,n为满足所述预定突变条件的突变位点的总数,n个所述突变位点各自对应的单个肿瘤细胞含量P分别为P1、P2、P3、P4…Pn。
2.根据权利要求1所述的肿瘤细胞含量评估方法,其特征在于:
其中,所述预定突变条件为,一个所述突变位点对应的所述对照突变频率大于等于0.4并小于等于0.6。
3.根据权利要求1或2所述的肿瘤细胞含量评估方法,其特征在于:
其中,所述对照样本为来自血液或癌旁组织的样本。
4.根据权利要求1或2所述的肿瘤细胞含量评估方法,其特征在于:
其中,所述预定评估规则为:直接将公式(2)计算得到的所述检测样本中的肿瘤细胞含量评估为所述评估后检测样本中的肿瘤细胞含量。
5.根据权利要求1或2所述的肿瘤细胞含量评估方法,其特征在于:
其中,所述预定评估规则为:采用下述肿瘤细胞含量矫正模型对所述计算得到的检测样本中的肿瘤细胞含量进行矫正,并将该矫正后得到的肿瘤细胞含量评估为所述评估后检测样本中的肿瘤细胞含量,
y=ax-b (3)
式(3)中,y为所述矫正后得到的检测样本中的肿瘤细胞含量;
x为所述计算得到的检测样本中的肿瘤细胞含量p,
a和b为模型参数,a的取值为1.4,b的取值范围为0.23-0.26。
6.一种肿瘤细胞含量评估装置,其特征在于,具有:
单个肿瘤细胞含量计算部,逐一获取满足预定突变条件的突变位点的平均样本突变频率和对照突变频率,并采用公式(1)计算得到与所述突变位点对应的单个肿瘤细胞含量;
肿瘤细胞含量计算部,一旦得到所有满足所述预定突变条件的突变位点对应的所有单个肿瘤细胞含量,就获取所有所述单个肿瘤细胞含量并采用公式(2)计算得到检测样本中的肿瘤细胞含量,
含量评估部,根据预定评估规则对公式(2)计算得到的所述检测样本中的肿瘤细胞含量评估得到评估后检测样本中的肿瘤细胞含量,
其中,公式(1)和公式(2)分别如下所示,
Figure FDA0003492460640000031
Figure FDA0003492460640000032
公式(1)中,针对一个满足所述预定突变条件的一个突变位点,
P为计算得到的该突变位点对应的所述单个肿瘤细胞含量,
VAFa为所述检测样本中该突变位点对应的样本平均突变频率,
VAFt为所述样本中该突变位点对应的肿瘤细胞的突变频率,
VAFn为对照样本中该突变位点对应的对照突变频率,
公式(2)中,p为计算得到的所述检测样本中的肿瘤细胞含量,n为满足所述预定突变条件的突变位点的总数,n个突变位点各自对应的单个肿瘤细胞含量P分别用P1、P2、P3、P4…Pn表示。
7.根据权利要求6所述的肿瘤细胞含量评估装置,其特征在于:
其中,所述预定评估规则为:直接将公式(2)计算得到的所述检测样本中的肿瘤细胞含量评估为所述评估后检测样本中的肿瘤细胞含量。
8.根据权利要求6所述的肿瘤细胞含量评估装置,其特征在于,
其中,所述预定评估规则为:采用下述肿瘤细胞含量矫正模型对所述计算得到的检测样本中的肿瘤细胞含量进行矫正,并将该矫正后得到的肿瘤细胞含量评估为所述评估后检测样本中的肿瘤细胞含量,
y=ax-b (3)
式(3)中,y为矫正后的检测样本中的肿瘤细胞含量p′;
x为所述计算得到的检测样本中的肿瘤细胞含量p,
a和b为模型参数,
a的取值为1.4,b的取值范围为0.23-0.26。
9.一种肿瘤细胞含量评估系统,其特征在于,包括:
突变频率检测装置,用于分别对检测样本和对照样本测序分析得到包含与各个突变位点分别对应的各个平均样本突变频率和与该各个突变位点分别对应的各个对照突变频率的测序分析数据;
肿瘤细胞含量评估装置,根据所述样本突变频率和所述对照突变频率对检测样本中的肿瘤细胞含量进行评估,
其中,所述肿瘤细胞含量评估装置为权利要求6-8中任意一项所述的肿瘤细胞含量评估装置。
10.一种肿瘤细胞含量评估设备,其特征在于,包括:
用于存储计算机程序指令的存储器;以及
用于执行计算机程序指令的处理器,
其中,当该计算机程序指令被该处理器执行时,使该设备执行权利要求1至5中任意一项所述的肿瘤细胞含量评估方法的步骤。
11.一种计算机可读介质,其特征在于:
所述计算机可读介质存储有计算机程序,
其中,所述计算机程序能被处理器执行以实现如权利要求1至5中任意一项所述的肿瘤细胞含量评估方法的步骤。
12.一种基因拷贝数评估方法,其特征在于:
基于检测样本中的肿瘤细胞的含量,对基因拷贝数进行评估,
其中,检测样本中的肿瘤细胞的含量采用权利要求1-5中任意一项所述的肿瘤细胞含量评估方法评估得到。
CN201911088666.6A 2019-11-08 2019-11-08 肿瘤细胞含量评估方法、装置、系统以及计算机可读介质 Active CN110853705B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911088666.6A CN110853705B (zh) 2019-11-08 2019-11-08 肿瘤细胞含量评估方法、装置、系统以及计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911088666.6A CN110853705B (zh) 2019-11-08 2019-11-08 肿瘤细胞含量评估方法、装置、系统以及计算机可读介质

Publications (2)

Publication Number Publication Date
CN110853705A CN110853705A (zh) 2020-02-28
CN110853705B true CN110853705B (zh) 2022-04-22

Family

ID=69600026

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911088666.6A Active CN110853705B (zh) 2019-11-08 2019-11-08 肿瘤细胞含量评估方法、装置、系统以及计算机可读介质

Country Status (1)

Country Link
CN (1) CN110853705B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114279911A (zh) * 2021-11-12 2022-04-05 万贝医疗健康科技(上海)有限公司 放化疗术后卵巢、宫颈癌细胞活动状态评估设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109427412A (zh) * 2018-11-02 2019-03-05 北京吉因加科技有限公司 用于检测肿瘤突变负荷的序列组合和其设计方法
RU2700421C1 (ru) * 2018-07-23 2019-09-17 Федеральное государственное автономное образовательное учреждение высшего образования "Национальный исследовательский Нижегородский государственный университет им. Н.И. Лобачевского" Способ оценки содержания пероксида водорода в опухолевых клетках при фотодинамическом воздействии

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2700421C1 (ru) * 2018-07-23 2019-09-17 Федеральное государственное автономное образовательное учреждение высшего образования "Национальный исследовательский Нижегородский государственный университет им. Н.И. Лобачевского" Способ оценки содержания пероксида водорода в опухолевых клетках при фотодинамическом воздействии
CN109427412A (zh) * 2018-11-02 2019-03-05 北京吉因加科技有限公司 用于检测肿瘤突变负荷的序列组合和其设计方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Measurement of the DNA Content in a Breast in a Tumor Cell Based on the Hadamard Transform Microscopic Fluorescence Image;Hongwu Tang、Erwen Mei;《ResearchGate》;20051215;第113-119页 *
非小细胞肺癌中 EGFR 突变位点和样本差异性对突变与蛋白表达的;叶美华、茹国庆;《临床与实验病理学杂志》;20190117;第77-80页 *

Also Published As

Publication number Publication date
CN110853705A (zh) 2020-02-28

Similar Documents

Publication Publication Date Title
CN110895959B (zh) 基因拷贝数评估方法、装置、系统以及计算机可读介质
Jónás et al. Estimating the effective population size from temporal allele frequency changes in experimental evolution
Campos et al. The effects on neutral variability of recurrent selective sweeps and background selection
Živković et al. Transition densities and sample frequency spectra of diffusion processes with selection and variable population size
Booker et al. Understanding the factors that shape patterns of nucleotide diversity in the house mouse genome
CN106676178B (zh) 一种评估肿瘤异质性的方法及系统
EP3293270B1 (en) Reagent kit, apparatus, and method for detecting chromosome aneuploidy
Vy et al. A composite-likelihood method for detecting incomplete selective sweep from population genomic data
US20210366570A1 (en) Methods for detecting biallelic loss of function in next-generation sequencing genomic data
CN111755068B (zh) 基于测序数据识别肿瘤纯度和绝对拷贝数的方法及装置
CN108804876B (zh) 用于计算癌症样本纯度和染色体倍性的方法和装置
CN112365927B (zh) Cnv检测装置
KR101936933B1 (ko) 염기서열의 변이 검출방법 및 이를 이용한 염기서열의 변이 검출 디바이스
CN110853705B (zh) 肿瘤细胞含量评估方法、装置、系统以及计算机可读介质
Demidov et al. ClinCNV: novel method for allele-specific somatic copy-number alterations detection
EP3283647B1 (en) A method for non-invasive prenatal detection of fetal chromosome aneuploidy from maternal blood
KR101770962B1 (ko) 유전자 서열 기반 개인 마커에 관한 정보를 제공하는 방법 및 이를 이용한 장치
Zhang et al. Scan statistics on Poisson random fields with applications in genomics
CN110191964A (zh) 确定生物样本中预定来源的游离核酸比例的方法及装置
CN111627498B (zh) 一种测序数据gc偏向性校正的方法及其装置
US20200354798A1 (en) Methods for determining tumor microsatellite instability
CN114067909B (zh) 一种矫正同源重组缺陷评分的方法、装置和存储介质
CN112626187B (zh) 一种判断胎儿基因型的方法及其装置
JP2019053395A (ja) コピー数計測装置、コピー数計測プログラム、コピー数計測方法および遺伝子パネル
EP4224478A1 (en) Method and system for determining differential expression

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant