CN113628682A - 一种t790m和c797s顺反式突变类型识别及计算方法 - Google Patents

一种t790m和c797s顺反式突变类型识别及计算方法 Download PDF

Info

Publication number
CN113628682A
CN113628682A CN202110918018.XA CN202110918018A CN113628682A CN 113628682 A CN113628682 A CN 113628682A CN 202110918018 A CN202110918018 A CN 202110918018A CN 113628682 A CN113628682 A CN 113628682A
Authority
CN
China
Prior art keywords
positive rate
signal channel
rate
positive
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110918018.XA
Other languages
English (en)
Other versions
CN113628682B (zh
Inventor
曹贵强
景奉香
义清文
张京红
谢中文
徐进
吴璋赟
侯琦芸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Turtle Technology Co ltd
Original Assignee
Shanghai Turtle Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Turtle Technology Co ltd filed Critical Shanghai Turtle Technology Co ltd
Priority to CN202110918018.XA priority Critical patent/CN113628682B/zh
Publication of CN113628682A publication Critical patent/CN113628682A/zh
Application granted granted Critical
Publication of CN113628682B publication Critical patent/CN113628682B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/50Mutagenesis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Artificial Intelligence (AREA)
  • Bioethics (AREA)
  • Analytical Chemistry (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本申请涉及一种T790M和C797S顺反式突变类型识别及计算方法。方法包括:确定反应单元内各信号通道的统计信息,统计信息中包括各信号通道的阳性信息和/或阴性信息;基于各信号通道的统计信息确定突变模板的阳性率,突变模板包括顺式突变和/或反式突变;基于突变模板的阳性率确定T790M和C797S顺反式突变的类型。采用本方法能够提高T790M和C797S顺反式突变类型识别及计算的准确性。

Description

一种T790M和C797S顺反式突变类型识别及计算方法
技术领域
本申请涉及生物学检测技术领域,特别是涉及一种T790M和C797S顺反式突变类型识别及计算方法。
背景技术
DPCR(Digital Polymerase Chain Reaction)技术是一种核酸分子绝对定量技术,可以直接数出DNA分子的个数,是对起始样品的绝对定量。在DPCR中,针对T790M和C797S中突变共存的情况下,识别出顺式突变和反式突变以及顺式突变和反式突变的数量(例如,个数,拷贝数或者突变率)是至关重要的。
传统技术中,一般是通过两个信号通道基于荧光信号值判断阴阳性,基于分布情况判断样本的顺式突变和反式突变类型,并计算样本中顺反式突变类型的发生概率。
然而,目前识别突变类型的过程中并没有考虑到T790M和C797S的反式突变中C797S突变模板的共腔室问题,使得识别得到的T790M和C797S顺反式突变类型的准确性较低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高T790M和C797S顺反式突变类型识别及计算准确性的T790M和C797S顺反式突变类型识别及计算方法、装置、设备和介质。
一种T790M和C797S顺反式突变类型识别及计算方法,方法包括:确定反应单元内各信号通道的统计信息,统计信息中包括各信号通道的阳性信息和/或阴性信息;基于各信号通道的统计信息确定突变模板的阳性率,突变模板包括顺式突变和/或反式突变;基于突变模板的阳性率确定T790M和C797S顺反式突变的类型。
在一些实施例中,方法还包括基于突变模板的阳性率及生物实验基本信息确定突变模板的拷贝数。
在一些实施例中,基于各信号通道的统计信息确定突变模板的阳性率,包括:基于各信号通道的统计信息确定各信号通道的阳性率,及不同信号通道组合的共有阳性率;基于各信号通道的阳性率及共有阳性率确定初始调整值;基于初始调整值、信号通道的阳性率及共有阳性率确定突变模板的阳性率。
在一些实施例中,基于各信号通道的统计信息确定各信号通道的阳性率,及不同信号通道组合的共有阳性率,包括以下至少一项:基于第一信号通道的阳性数量与有效反应单元的数量的关系确定第一信号通道的阳性率;基于第二信号通道的阳性数量与有效反应单元的数量的关系确定第二信号通道的阳性率;基于第一信号通道与第二信号通道同时为阳性的数量与有效反应单元的数量的关系确定第一信号通道与第二信号通道的共有阳性率。
在一些实施例中,基于各信号通道的阳性率及共有阳性率确定初始调整值,包括:基于第一信号通道的阳性率、第二信号通道的阳性率以及共有阳性率确定初始调整值。
在一些实施例中,基于初始调整值、信号通道的阳性率及共有阳性率确定突变模板的阳性率,包括:响应于第一信号通道的阳性率、突变模板的阳性率及初始调整值与预设阈值满足预设条件,且共有阳性率、突变模板的阳性率及初始调整值满足预设条件,确定突变模板的阳性率;响应于第一信号通道的阳性率、突变模板的阳性率及初始调整值与预设阈值不满足预设条件,或者,共有阳性率、突变模板的阳性率及初始调整值与预设阈值不满足预设条件,基于更新后的初始调整值确定突变模板的阳性率。
在一些实施例中,基于初始调整值、信号通道的阳性率及共有阳性率确定突变模板的阳性率,包括:基于第一信号通道的阳性率、顺式突变的阳性率及初始调整值确定T790M和C797S的反式突变中T790M突变模板的阳性率;基于第二信号通道的阳性率、顺式突变的阳性率及初始调整值确定T790M和C797S的反式突变中C797S突变模板的阳性率;基于第一信号通道与第二信号通道的共有阳性率及初始调整值确定T790M和C797S的顺式突变的阳性率,第一信号通道的阳性率、第二信号通道的阳性率及共有阳性率基于T790M和C797S的反式突变中T790M突变模板的阳性率、T790M和C797S的反式突变中C797S突变模板的阳性率及顺式突变的阳性率确定。
在一些实施例中,基于T790M和C797S的反式突变中T790M突变模板的阳性率、T790M和C797S的反式突变中C797S突变模板的阳性率及顺式突变的阳性率更新初始调整值。
在一些实施例中,基于各信号通道的统计信息确定突变模板的阳性率包括:基于各信号通道的统计信息确定各信号通道的阳性率和/或阴性率,及不同信号通道组合的阳性率和/或阴性率;基于各信号通道的阳性率和/或阴性率,及不同信号通道组合的阳性率和/或阴性率确定突变模板的阳性率。
在一些实施例中,基于各信号通道的统计信息确定各信号通道的阳性率和/或阴性率,及不同信号通道组合的阳性率和/或阴性率,包括以下至少一项:基于反应单元中两个信号通道为阳性且两个信号通道为阴性的数量与有效反应单元的数量的关系确定阳性率;基于反应单元中两个信号通道为阴性的数量与反应单元中有效反应单元的数量的关系确定阴性率;基于反应单元中三个信号通道为阳性且一个信号通道为阴性的数量与有效反应单元的数量的关系确定阳性率;基于反应单元中一个信号通道为阴性的数量与反应单元中有效反应单元的数量的关系确定阴性率;基于反应单元中一个信号通道为阳性且三个信号通道为阴性的数量与有效反应单元的数量的关系确定阳性率;基于反应单元中四个信号通道为阳性的数量与有效反应单元的数量的关系确定阳性率。
在一些实施例中,方法还包括:确定异常反应单元,并将异常反应单元去除;基于去除异常反应单元后的有效反应单元的各信号通道的阳性率和/或阴性率确定突变模板的阳性率。
在一些实施例中,确定异常反应单元包括以下至少一项:将反应单元中一个信号通道为阳性且三个信号通道为阴性的反应单元确定为异常反应单元,将异常反应单元确定为无效反应单元或者将异常反应单元的阳性信息转设为阴性信息;将反应单元中两个信号通道为阳性且两个信号通道为阴性的组合确定为异常组合,将异常组合对应的反应单元确定为异常反应单元,将异常反应单元确定为无效反应单元或者将异常反应单元的阳性信息转设为阴性信息。
在一些实施例中,基于各信号通道的阳性率和/或阴性率,及不同信号通道组合的阳性率和/或阴性率确定突变模板的阳性率,包括:基于反应单元中包括两个信号通道为阴性的统计概率及反应单元中包括两个信号通道为阴性且另外两个信号通道为阳性的统计概率确定突变模板的阳性率,其中,突变模板的阳性率包括T790M和C797S的反式突变中T790M突变模板的阳性率、T790M和C797S的反式突变中C797S突变模板的阳性率及顺式突变的阳性率。
在一些实施例中,方法还包括:对突变模板的阳性率进行校验,基于校验后的阳性率确定突变模板的拷贝数。
在一些实施例中,对突变模板的阳性率进行校验,包括:基于反应单元中一个信号通道为阴性的统计概率、反应单元中一个信号通道为阴性且另外三个信号通道为阳性的统计概率校验突变模板的阳性率。
在一些实施例中,对突变模板的阳性率进行校验,包括:基于反应单元中四个信号通道为阳性的统计概率校验突变模板的阳性率。
一种T790M和C797S顺反式突变类型识别及计算装置,装置包括:统计信息确定模块,用于确定反应单元内各信号通道的统计信息,统计信息中包括各信号通道的阳性信息和/或阴性信息;阳性率计算模块,用于基于各信号通道的统计信息确定突变模板的阳性率,突变模板包括顺式突变和/或反式突变;类型识别模块,用于基于突变模板的阳性率确定T790M和C797S顺反式突变的类型。
一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现以下步骤:确定反应单元内各信号通道的统计信息,统计信息中包括各信号通道的阳性信息和/或阴性信息;基于各信号通道的统计信息确定突变模板的阳性率,突变模板包括顺式突变和/或反式突变;基于突变模板的阳性率确定T790M和C797S顺反式突变的类型。
一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:确定反应单元内各信号通道的统计信息,统计信息中包括各信号通道的阳性信息和/或阴性信息;基于各信号通道的统计信息确定突变模板的阳性率,突变模板包括顺式突变和/或反式突变;基于突变模板的阳性率确定T790M和C797S顺反式突变的类型。
上述T790M和C797S顺反式突变类型识别及计算方法、装置、设备和介质,基于反应单元内各信号通道的阳性信息和/或阴性信息,计算顺式突变和/或反式突变的阳性率,以根据突变模板的阳性率确定T790M和C797S顺反式突变的类型,根据T790M和C797S顺反式突变的类型确定对应的医疗用药类型。在计算T790M和C797S顺反式突变类型的过程中考虑到了T790M和C797S的反式突变中T790M突变模板和T790M和C797S的反式突变中C797S突变模板共腔室的问题,提高了T790M和C797S顺反式突变类型识别及计算的准确性,进而提高医疗用药类型的选择准确性。
附图说明
图1为一个实施例中T790M和C797S顺反式突变类型识别及计算方法的应用环境图;
图2为一个实施例中T790M和C797S顺反式突变类型识别及计算方法的流程示意图;
图3为一些实施例中提供的用于确定突变模板阳性率的方法流程示意图;
图4为一个实施例中提供的基于两个信号通道计算突变模板拷贝数的流程示意图;
图5为一些实施例中提供的用于确定突变模板的阳性率的流程示意图;
图6为一个实施例中提供的基于四个信号通道计算突变模板拷贝数的流程示意图;
图7为一个实施例中提供的基于两个信号通道识别出顺式突变和反式突变的结果图;
图8为一个实施例中提供的基于四个信号通道识别出顺式突变和反式突变的结果图;
图9为一个实施例中提供的模拟低阳性率下的四个信号通道结果识别出顺式突变和反式突变的结果图;
图10为一个实施例中提供的模拟高阳性率下的四个信号通道结果识别出顺式突变和反式突变的结果图;
图11为一个实施例中T790M和C797S顺反式突变类型识别及计算装置的结构框图;
图12为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的T790M和C797S顺反式突变类型识别及计算方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。服务器104获取反应单元内各信号通道的统计信息,统计信息中包括信号通道的阳性信息和/或阴性信息;基于各信号通道的统计信息确定突变模板的阳性率,突变模板包括顺式突变和/或反式突变;基于突变模板的阳性率确定T790M和C797S顺反式突变的类型。进一步地,还可以将T790M和C797S顺反式突变的类型发送至终端102进行显示。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种T790M和C797S顺反式突变类型识别及计算方法的流程示意图,以该方法应用于图1中的服务器104为例进行说明,包括以下步骤:
步骤202,可以确定反应单元内各信号通道的统计信息,统计信息中包括信号通道的阳性信息和/或阴性信息。
在一些实施例中,反应单元中可以包括两个信号通道,例如可以是A信号通道和B信号信道。A信号通道可以是T790M突变位点对应通道,B信号通道可以是C797S突变位点对应通道。在一些实施例中,可以对A信号通道以及B信号通道用不同的荧光进行标记,该标记可以由不同的荧光通道检测出来,如FAM以及ROX。进而实现了信号通道可以基于荧光信号值判断信号通道的阴性或者阳性。在另一些实施例中,还可以增加一个通用信号通道E,例如可以是通用探针E通道,根据通用探针E通道识别异常反应单元。
在一些实施例中,可以获取DPCR的分析结果,分析结果中包括各信号通道的统计信息,基于统计信息中的阳性信息确定信号通道的阳性率,基于统计信息中的阴性信息确定各信号通道的阴性率。
在一些实施例中,在获取DPCR的分析结果之后,还包括基于分析结果判断反应单元中是否包含A信号通道和B信号通道。如果基于分析结果判定反应单元中包含A信号通道和B信号通道,则统计反应单元中各信号通道的阳性信息,基于阳性信息计算信号通道的阳性率。如果基于分析结果判定反应单元中不包含A信号通道和B信号通道,则退出并提示分析不成功,给出提示信息。提示信息包含反应单元是否为有效反应单元的标志,还包含反应单元对应的A信号通道和B信号通道是否为阳性的信息。
在一些实施例中,还可以基于分析结果判断是否存在E信号通道,如果存在E信号通道,需要对结果进行标定,利用E信号通道的结果对A信号通道结果和B信号通道结果进行校对,当有A信号通道为阳性或B信号通道为阳性时,对应反应单元中E信号通道也为阳性。
在一些实施例中,突变模板的类型包括顺式突变与反式突变。反式突变又包括T790M和C797S的反式突变中T790M突变模板、T790M和C797S的反式突变中C797S突变模板,T790M和C797S反式突变具体表现为:两种反式突变同时出现,且位于不同的等于基因上。例如,T790M和C797S顺式突变:T790M和C797S同时出现,且位于同一条等位基因上;具体表现为一条基因上A信号通道对应的T790M突变位点为阳性,且B信号通道对应的C797S突变位点为阳性,顺式突变的阳性率可以记为TAB。反式突变是指一条基因上不同信号通道对应的突变位点的状态不同,例如,T790M和C797S的反式突变中T790M突变模板是指一条基因上A信号通道对应的突变位点为阳性,且B信号通道对应的T790M和C797S的反式突变中C797S突变模板位点不为阳性,T790M和C797S的反式突变中T790M突变模板的阳性率可以记为TA。T790M和C797S的反式突变中C797S突变模板是指一条基因上B信号通道对应的突变位点为阳性,且A信号通道对应的T790M突变位点不为阳性,T790M和C797S的反式突变中C797S突变模板的阳性率可以记为TB
图3为一些实施例中提供的用于确定突变模板的阳性率的方法流程示意图。参见图3,在一些实施例中,基于各信号通道的统计信息确定突变模板的阳性率包括:
步骤302,可以基于各信号通道的统计信息确定各信号通道的阳性率,及不同信号通道组合的共有阳性率。
在一些实施例中,基于各信号通道的统计信息确定各信号通道的阳性率,包括:基于第一信号通道的阳性数量与反应单元中有效反应单元的数量的关系确定第一信号通道的阳性率。例如,通过DPCR分析结果,统计反应单元中有效反应单元的数量N,在有效反应单元的基础上统计第一信号通道(例如,A信号通道)的阳性数量NA,计算A信号通道的阳性率为PA=NA/N。
在一些实施例中,基于各信号通道的统计信息确定各信号通道的阳性率,包括:基于第二信号通道的阳性数量与反应单元中有效反应单元的数量的关系确定第二信号通道的阳性率。例如,通过DPCR分析结果,统计反应单元中有效反应单元的数量N,在有效反应单元的基础上统计第二信号通道(例如,B信号通道)的阳性数量NB,计算B信号通道的阳性率为PB=NB/N。
在一些实施例中,基于各信号通道的统计信息确定不同信号通道组合的共有阳性率,包括:基于第一信号通道与第二信号通道同时为阳性的数量与反应单元中有效反应单元的数量的关系确定第一信号通道与第二信号通道的共有阳性率。例如,通过DPCR分析结果,统计反应单元中有效反应单元的数量N,在有效反应单元的基础上统计A信号通道和B信号通道都为阳性的数量NAB,计算A信号通道和B信号通道在同一反应单元的共有阳性率为PAB=NAB/N。
步骤304,可以基于各信号通道的阳性率及共有阳性率确定初始调整值。在一些实施例中,可以基于第一信号通道的阳性率、第二信号通道的阳性率以及第一信号通道与第二信号通道的共有阳性率确定初始调整值。例如,初始调整值tmp,tmp=PA*PB(1-PAB)。
步骤204,可以基于各信号通道的统计信息确定突变模板的阳性率。例如在步骤306,可以基于初始调整值及各信号通道的阳性率确定突变模板的阳性率。
在一些实施例中,响应于第一信号通道的阳性率、突变模板的阳性率及初始调整值与预设阈值满足预设条件,且共有阳性率、突变模板的阳性率及初始调整值满足预设条件确定突变模板的阳性率。例如,响应于第一信号通道的阳性率、T790M和C797S的反式突变中T790M突变模板的模板阳性率、顺式突变的模板阳性率及初始调整值与预设阈值满足预设条件,且第一信号通道与第二信号通道的共有阳性率、顺式突变的模板阳性率及初始调整值与预设阈值满足预设条件,确定突变模板的阳性率。例如,minErr为预设阈值(例如,预期目标需求值)。当PA–(TA-TA*TAB-tmp)<minErr&&PAB-(TAB+tmp)<minErr时,判定满足预设条件,进而得到突变模板的阳性率。
在一些实施例中,响应于第一信号通道的阳性率、突变模板的阳性率及初始调整值与预设阈值不满足预设条件,或者,共有阳性率、突变模板的阳性率及初始调整值与预设阈值不满足预设条件,基于更新后的初始调整值确定突变模板的阳性率。例如,响应于第一信号通道的阳性率、T790M和C797S的反式突变中T790M突变模板的模板阳性率、顺式突变的模板阳性率及初始调整值与预设阈值不满足预设条件,或者,第一信号通道与第二信号通道的共有阳性率、顺式突变的模板阳性率及初始调整值与预设阈值不满足预设条件,更新初始调整值,基于更新后的初始调整值继续进行计算,直至基于更新后的初始调整值确定的阳性率满足预设条件,此时基于更新后的初始调整值确定突变模板的阳性率。
在一些实施例中,可以基于T790M和C797S的反式突变中T790M突变模板的阳性率、T790M和C797S的反式突变中C797S突变模板的阳性率及顺式突变的阳性率更新初始调整值,基于更新后的初始调整值确定突变模板的阳性率。例如,当不满足PA–(TA-TA*TAB-tmp)<minErr&&PAB-(TAB+tmp)<minErr时,更新初始调整值tmp=TATB-TATBTAB,基于更新后的初始调整值计算TA、TB、TAB、PA、PB、PAB,直至PA–(TA-TA*TAB-tmp)<minErr&&PAB-(TAB+tmp)<minErr时,得到突变模板的阳性率。
在一些实施例中,第一信号通道的阳性率、第二信号通道的阳性率及共有阳性率基于T790M和C797S的反式突变中T790M突变模板的阳性率、T790M和C797S的反式突变中C797S突变模板的阳性率及顺式突变的阳性率确定。基于初始调整值及各信号通道的阳性率确定突变模板的阳性率,包括确定顺式突变模板的阳性率以及反式突变模板的阳性率。
在一些实施例中,可以基于第一信号通道的阳性率、顺式突变的阳性率及初始调整值确定T790M和C797S的反式突变中T790M突变模板的阳性率。例如,T790M和C797S的反式突变中T790M突变模板的阳性率TA=(PA+tmp)/(1-TAB)。且,第一信号通道的阳性率PA可以表达为PA=TA(1-TB-TAB+TBTAB)。
在一些实施例中,可以基于第二信号通道的阳性率、顺式突变的阳性率及初始调整值确定T790M和C797S的反式突变中C797S突变模板的阳性率。例如,T790M和C797S的反式突变中C797S突变模板的阳性率TB=(PB+tmp)/(1-TAB)。且,第二信号通道的阳性率PB可以表达为PB=TB(1-TA-TAB+TATAB)。
在一些实施例中,可以基于第一信号通道与第二信号通道的共有阳性率及初始调整值确定顺式突变的阳性率。例如,顺式突变的阳性率TAB=PAB–tmp。且,第一信号通道与第二信号通道的共有阳性率PAB可以表达为PAB=TAB+(TATB-TATBTAB)。
在一个实施例中,突变模板的阳性率计算步骤如下:
步骤1:tmp=PA*PB(1-PAB)。
步骤2:PA=TA(1-TB-TAB+TBTAB),TA=(PA+tmp)/(1-TAB)。
步骤3:PB=TB(1-TA-TAB+TATAB),TB=(PB+tmp)/(1-TAB)。
步骤4:PAB=TAB+(TATB-TATBTAB),TAB=PAB–tmp,tmp=TATB-TATBTAB
步骤5:PA–(TA-TA*TAB-tmp)<minErr&&PAB-(TAB+tmp)<minErr。
其中:minErr为预设阈值,可以理解为预期目标需求值。步骤1为初始化初始调整值,然后循环执行步骤2到步骤4,直到符合步骤5的条件。计算得到突变模板的阳性率。
上述实施例中,在数字PCR仪器中,通过两个信号通道表示突变(或增加一个使用通用探针的通道),在各个信号通道阳性率情况的基础上,使用迭代算法估计得到更为准确的反式突变和顺式突变的阳性率以及拷贝数,提高了突变模板的识别准确性以及突变模板的阳性率和拷贝数的计算准确性。
步骤206,可以基于突变模板的阳性率确定T790M和C797S顺反式突变的类型。阳性率的大小表示概率的大小,故而可以通过阳性率的大小确定T790M和C797S顺反式突变的类型。例如,当对应的概率为0时说明不存在T790M和C797S顺反式突变。
在一些实施例中,基于突变模板的阳性率确定突变模板的拷贝数包括:基于信号通道的阳性率计算突变模板的拷贝数,通过反应单元内的突变模板的阳性率分布和生物实验基本信息,计算突变模板的拷贝数。根据计算得到的拷贝数对实际场景中的用药进行指导。其中,生物实验基本信息可以包括生物试剂稀释倍数、反应单元体积以及泊松分布等。
如图4所示,图4为一个实施例中提供的基于两个信号通道计算突变模板拷贝数的流程示意图。具体包括:
步骤402,获取DPCR分析结果。
步骤404,基于分析结果计算A信号通道和B信号通道的阳性率,以及A信号通道和B信号通道的共有阳性率。
步骤406,基于各信号通道的阳性率以及共有阳性率计算突变模板的阳性率。
步骤408,基于各突变模板的阳性率计算突变模板的拷贝数。
在计算突变模板的阳性率的过程中考虑到了不同信号通道组合时的共有阳性率,进而提高了突变模型阳性率计算的准确性。
在一些实施例中,反应单元中可以包括四个信号通道,例如可以包括两个突变信号通道以及两个野生信号通道。两个突变信号通道分别为A信号通道和B信号信道。例如,A信号通道可以是T790M突变位点对应通道,B信号通道可以是C797S突变位点对应通道。两个野生信号通道可以分别为C信号通道和D信号信道。例如,C野生信号通道可以是T790M野生信号对应的通道,D野生信号通道可以是C797S野生信号对应的通道。在另一些实施例中,还可以增加一个通用信号通道E,例如可以是通用探针E通道,根据通用探针E通道识别异常反应单元。
在一些实施例中,可以获取数字PCR的分析结果,基于分析结果判断是否存在四个信号通道数据(例如,A信号通道为T790M突变信号对应通道、B信号通道为C797S突变信号对应通道、C信号通道为T790M野生信号对应通道、D信号通道为C797S野生信号对应通道)。如果存在四个信号通道的结果数据,则提取四个信号通道的结果数据,结果数据对应每个反应单元,也可以说是每个反应单元对应四个信号通道的状态,每个状态有阴阳之分,阳性表示当前信号通道有信号,阴阳主要是通过反应单元内的亮度大小进行区分。
基于分析结果数据判断是否存在E信号通道,如果存在,需要对结果进行标定,基于通道的结果对A、B、C和D信号通道结果进行校对,当有A或B或C或者D信号通道为阳性时,对应反应单元中E信号通道也为阳性。
图5为一些实施例中提供的用于确定突变模板的阳性率的流程示意图。如图5所示,在一些实施例中,基于各信号通道的统计信息确定突变模板的阳性率,及不同信号通道组合的阳性率和/或阴性率,包括:
步骤502,可以基于各信号通道的统计信息确定各信号通道的阳性率和/或阴性率,及不同信号通道组合的阳性率和/或阴性率。包括:基于反应单元中两个信号通道为阳性且两个信号通道为阴性的数量与反应单元中有效反应单元的数量的关系确定阳性率。例如,基于每个反应单元的标记(例如,是否为有效反应单元的标记),统计有效反应单元索引和有效反应单元的数量。在有效反应单元索引的基础上,统计有效反应单元内仅有两个信号通道为阳性的信息,统计的详细信息包括:反应单元中A信号通道、D信号通道为阳性,B信号通道、C信号通道为阴性的阳性率
Figure BDA0003206347850000121
反应单元中B信号通道、C信号通道为阳性,A信号通道、D信号通道为阴性的阳性率
Figure BDA0003206347850000122
反应单元中A信号通道、B信号通道为阳性,C信号通道、D信号通道为阴性的阳性率
Figure BDA0003206347850000123
反应单元中C信号通道、D信号通道为阳性,A信号通道、B信号通道为阴性的阳性率
Figure BDA0003206347850000124
反应单元中A信号通道、C信号通道为阳性,B信号通道、D信号通道为阴性的阳性率,及索引;反应单元中B信号通道、D信号通道为阳性,A信号通道、C信号通道为阴性的阳性率及索引。
在一些实施例中,基于各信号通道的统计信息确定各信号通道的阳性率和/或阴性率,及不同信号通道组合的阳性率和/或阴性率,包括:基于反应单元中两个信号通道为阴性的数量与反应单元中有效反应单元的数量的关系确定阴性率。例如,在有效反应单元索引的基础上,统计两个信号通道为阴性的信息,统计详细信息包括:反应单元中B信号通道和C信号通道为阴性的个数比上有效个数N的个数比率
Figure BDA0003206347850000131
反应单元中A信号通道和D信号通道为阴性的个数比上有效个数N的个数比率
Figure BDA0003206347850000132
反应单元中C信号通道和D信号通道为阴性的个数比上有效个数N的个数比率
Figure BDA0003206347850000133
反应单元中A信号通道和B信号通道为阴性的个数比上有效个数N的个数比率
Figure BDA0003206347850000134
在一些实施例中,基于各信号通道的统计信息确定各信号通道的阳性率和/或阴性率,及不同信号通道组合的阳性率和/或阴性率,包括:基于反应单元中三个信号通道为阳性且一个信号通道为阴性的数量与反应单元中有效反应单元的数量的关系确定阳性率。例如,有效反应单元索引的基础上,统计三个信号通道为阳性且一个信号通道为阴性的阳性率,具体统计信息包括:反应单元中A信号通道、B信号通道、C信号通道为阳性,D信号通道为阴性的阳性率
Figure BDA0003206347850000135
反应单元中A信号通道、B信号通道、D信号通道为阳性,C信号通道为阴性的阳性率
Figure BDA0003206347850000136
反应单元中A信号通道、C信号通道、D信号通道为阳性,B信号通道为阴性的阳性率
Figure BDA0003206347850000137
反应单元中B信号通道、C信号通道、D信号通道为阳性,A信号通道为阴性的阳性率
Figure BDA0003206347850000138
在一些实施例中,基于各信号通道的统计信息确定各信号通道的阳性率和/或阴性率,及不同信号通道组合的阳性率和/或阴性率,包括:基于反应单元中一个信号通道为阴性的数量与反应单元中有效反应单元的数量的关系确定阴性率。例如,在有效反应单元索引的基础上,统计一个信号通道为阴性的阳性率,具体统计信息包括:反应单元中A信号通道为阴性的阳性率
Figure BDA0003206347850000139
反应单元中B为阴性的阳性率
Figure BDA00032063478500001310
反应单元中C信号通道为阴性的阳性率
Figure BDA00032063478500001311
反应单元中D信号为阴性的阳性率
Figure BDA00032063478500001312
在一些实施例中,基于各信号通道的统计信息确定各信号通道的阳性率和/或阴性率,及不同信号通道组合的阳性率和/或阴性率,包括:基于反应单元中一个信号通道为阳性且三个信号通道为阴性的数量与反应单元中有效反应单元的数量的关系确定阳性率。例如,在有效反应单元索引的基础上,每个有效反应单元中值出现一个通道为阳性的情况,具体统计包括:反应单元中仅有A信号通道为阳性的阳性率及位置索引;反应单元中仅有B信号通道为阳性的阳性率及位置索引;反应单元中仅有C信号通道为阳性的阳性率及位置索引;反应单元中仅有D信号通道为阳性的阳性率及位置索引。可以理解,通过位置索引可以确定对应的位置,进而可以实现对对应信息的准确定位。
在一些实施例中,基于各信号通道的统计信息确定各信号通道的阳性率和/或阴性率,及不同信号通道组合的阳性率和/或阴性率,包括:基于反应单元中四个信号通道为阳性的数量与反应单元中有效反应单元的数量的关系确定阳性率。例如,在有效反应单元索引的基础上,统计A信号通道、B信号通道、C信号通道、D信号通道,四个信号通道都为阳性的阳性率P(ABCD)。
在一些实施例中,方法还包括:确定异常反应单元,并将异常反应单元去除;基于去除异常反应单元后的有效反应单元的各信号通道的阳性率和/或阴性率确定突变模板的阳性率。例如,去除异常值具体包括:对有一个信号通道为阳性的反应单元进行去除异常值处理,对有两个信号通道为阳性的反应单元进行去除异常值的处理。
在一些实施例中,异常反应单元具体包括:将反应单元中一个信号通道为阳性且三个信号通道为阴性的反应单元确定为异常反应单元,将异常反应单元确定为无效反应单元或者将异常反应单元的阳性信息转设为阴性信息。例如,对有一个信号通道为阳性的反应单元进行去除异常值处理的方式包括:将该反应单元确定为无效反应单元,并更新有效反应单元个数N,及所有统计的阳性率。或者,将该反应单元作为有效反应单元,但将该反应单元内信号通道的信息转换为阴性信息。
在一些实施例中,异常反应单元具体包括:在反应单元中两个信号通道为阳性且两个信号通道为阴性的反应单元中确定异常组合,将异常组合对应的反应单元确定为异常反应单元,将异常反应单元确定为无效反应单元或者将异常反应单元的阳性信息转设为阴性信息。例如,对有两个信号通道为阳性的反应单元进行处理,具体包括对不会出现的组合进行处理,具体可以将出现异常组合的反应单元内阳性通道全部设置为阴性。或者,将出现异常组合的反应单元设置为无效反应单元,并更新有效反应单元个数N,及所有统计的阳性率。在一些实施例中,不会出现的组合的情况具体详细信息包括:反应单元中A信号通道和C信号通道为阳性,B信号通道和D信号通道为阴性。或者,反应单元中B信号通道和D信号通道为阳性,A信号通道和C信号通道为阴性。
步骤504,基于各信号通道的阳性率和/或阴性率,及不同信号通道组合的阳性率和/或阴性率确定突变模板的阳性率。在一些实施例中,基于各信号通道的阳性率和/或阴性率,及不同信号通道组合的阳性率和/或阴性率确定突变模板的阳性率,包括:基于反应单元中包括两个信号通道为阴性的统计概率及反应单元中包括两个信号通道为阴性且另外两个信号通道为阳性的统计概率确定突变模板的阳性率,其中,突变模板的阳性率包括T790M和C797S的反式突变中T790M突变模板的阳性率、T790M和C797S的反式突变中C797S突变模板的阳性率及顺式突变的阳性率。
例如,突变模板的阳性率可以通过反应单元中仅有两个信号通道为阳性的统计信息进行计算,具体计算包括:
Figure BDA0003206347850000151
Figure BDA0003206347850000152
其中,ai为突变模板的阳性率。a1为T790M和C797S的反式突变中T790M突变模板的阳性率,a2为T790M和C797S的反式突变中C797S突变模板的阳性率,a3为顺式突变模板的阳性率,a4为纯野生模板的阳性率。通过各信号通道的统计信息可以计算得到ai。P1i为突变模板中仅有单独模板在反应单元中的阳性率。
在一些实施例中,还包括对突变模板的阳性率进行验证,以确定突变模板的阳性率是否符合预期。在一些实施例中,方法还包括:对突变模板的阳性率进行校验,基于校验后的阳性率确定突变模板的拷贝数。
在一些实施例中,对突变模板的阳性率进行校验,包括:基于反应单元中一个信号通道为阴性的统计概率、反应单元中一个信号通道为阴性且另外三个信号通道为阳性的统计概率校验突变模板的阳性率。例如,基于三个信号通道为阳性一个信号通道为阴性的组合,以及一个信号通道为阴性判断是否符合概率分布情况。具体实施方案如下:
Figure BDA0003206347850000161
Figure BDA0003206347850000162
其中,di=U*sqrt(Pi/N),a∈[P-di,P+di],U为比例系数,N为有效反应单元个数,Pi为计算结果概率,
Figure BDA0003206347850000163
a为信号通道的阳性率。通过上述公式,可以验证在一个反应单元中三个信号通道为阳性,以及在一个反应单元中两个信号通道的概率是否符合概率公式。如果符合,基于初始计算得到的突变模板的阳性率结果进行精确计算。如果不符合,进行进一步计算,例如可以基于某一个突变模板的两个信号通道在同一反应单元的概率,三个信号通道在同一反应单元的概率和四个信号通道中包含该突变模板出现的概率(基于初始模板的阳性率)之和作为初始的阳性率。
在一些实施例中,对突变模板的阳性率进行校验,包括:基于反应单元中四个信号通道为阳性的统计概率,及突变模板的阳性率校验突变模板的阳性率。例如,基于四个信号通道判断是否符合概率分布情况对初步的阳性率结果进行校验,p=a3*a4+a1*a2-a1*a2*a3*a4,di=U2*sqrt(Pi/N),P(ABCD)∈[p-di,p+di]。其中U2为比例系数,如果公式P(ABCD)∈[p-di,p+di]不满足,则需要给出提示,后续进一步进行验证,如果公式P(ABCD)∈[p-di,p+di]满足则直接进行下一步的步骤。
在一些实施例中,基于反应单元内出现模板阳性率分布情况、生物实验基本信息及突变模板的阳性率确定各个突变模板的拷贝数。
在一些实施例中,当两个信号通道在一个反应单元时,仅有一种突变模板的阳性率P1i。
在一些实施例中,当三个信号通道在一个反应单元中时,含有两种突变模板的情况。例如包含P1i的情况有两种,阳性率分别为P21i和P22i。例如,突变模板1对应的情况有两种分别为
Figure BDA0003206347850000164
Figure BDA0003206347850000165
在一些实施例中,当四个信号通道在一个反应单元中时,可以分为两种情况。一种情况为两种突变模板在一个反应单元中,两种反式突变模板在一个反应单元中或者顺式突变模板和野生模板在一个反应单元中,可以计算P31i。另一种情况是某一个突变模板与第一种情况的不含此突变模板的类型在一个反应单元中,可以计算阳性率P32i,P31i=aj*ak,P32i=ai*aj*ak。其中,P31i的计算为两种突变模板在一个反应单元,主要使用两种情况,当P31i代表为某一反式突变模板在这种情况下的阳性率,则结果为两种反式突变模板的联合概率。如果为顺式突变或野生信号模板,则是顺式突变和野生信号模板的联合概率。P32i为三种突变模板在同一反应单元的情况,主要有如下情况:某一反式突变、顺式突变和野生信号在同一反应单元中,或者顺式突变或者野生信号与两种反式突变在同一反应单元中。
在一些实施例中,还包括:计算突变模板的阳性率Ri,Ri=P1i+P21i+P22i+P31i+P32i。当P31i大于P(ABCD)时,设置为P(ABCD)。后续需要综合判断P31i的取值。在获取到突变模板的阳性率Ri后,通过反应单元内出现突变模板的阳性率的分布情况和生物实验基本信息,计算各个突变模板的拷贝数。
在一些实施例中,方法还包括校验步骤。定义di=U3*sqrt(Ri/N),其中,U3为比例系数,如果ai∈[Ri-di,Ri+di],判定结果合理,否则需要重新评定结果(例如,当数据结果出现异常,或者局部数据不符合概率分布的情况下,会出现此现象)。具体的评定实施方案包括:
(1)判别四个信号通道中全是阳性的个数是否较少,如果较少,则使用Ri代替ai,并重新计算突变模板的阳性率,输出结果。
(2)判定信号通道中全为阳性的个数比较多时,则需要重新评估,具体实施方案如下:①A信号通道和B信号通道的方案,计算顺式突变和反式突变的阳性率PA,PB,PAB。②C信号通道和D信号通道两个信号通道方案,计算野生信号的阳性率PCD。③PA代替a1,PB代替a2,PAB代替a3,PCD代替a4,然后重复计算突变模板的阳性率,如果突变模板的阳性率出现异常,将给出异常信息并终止,或者使用其他替代方案,如使用三个信号通道为阳性,一个信号通道信号为阴性的关系式计算a1,a2,a3,a4。
图6为一个实施例中提供的基于四个信号通道计算突变模板拷贝数的流程示意图,如图6所示,包括:
步骤602,获取DPCR分析结果。
步骤604,基于获取到的DPCR分析结果确定反应单元内有两个信号通道的阳性信息统计、反应单元内有三个信号通道的阳性信息统计、反应单元内有一个信号通道的阳性信息统计、反应单元内有四个信号通道的阳性信息统计。
步骤606,基于反应单元内的信号通道的阳性信息确定突变模板的个数。
步骤608,基于突变模板的个数计算结果确定突变模板的拷贝数。
上述实施例中,基于两个信号通道计算出的结果可以很好的识别出T790M和C797S顺反式突变类型的结果。但是,当两种反式突变信号在同一个反应单元中时,存在无法准确识别出顺式突变的状况。低阳性率为1%以下的情况,高阳性率为[1%-15%]。具体识别正确率如图7到图10所示。图7和图8用于展示识别情况,图7针对在两个信号通道结果的各种阳性率情况下,识别出顺式突变和反式突变的正确率。图8针对四个信号通道结果的各种阳性率情况下,识别出顺势突变和反式突变的正确率。图9和图10用于对四个信号通道的顺式突变和反式突变的识别精度的分析。通过分析可知,个数误差主要来自两种反式突变在一个反应单元、顺式突变和纯野生在一个反应单元的个数。但是这个误差比两个信号通道结果的误差小。
图9主要是基准为T790M和C797S的反式突变中C797S突变模板的阳性率为2%,T790M和C797S的反式突变中T790M突变模板的阳性率为1.5%,顺势突变信号的阳性率为0.03%,纯野生信号的阳性率为14%。在此基础上仅仅变化其中一种信号通道的阳性率(如:T790M和C797S的反式突变中T790M突变模板信号阳性率为0.15%时,多次模拟实验,分析实验结果识别结果,同理可以改变浓度或其他模板),看误差情况的幅度。图10中的T790M和C797S的反式突变中C797S突变模板的阳性率为7.7%,T790M和C797S的反式突变中T790M突变模板的阳性率为6.9%,顺势突变信号的阳性率为0.1%,纯野生信号的阳性率为14%,使用同样方法统计误差情况。在这种基准浓度下,顺式突变浓度为0时,两个信号通道识别率不足100%,所以四个信号通道比两个信号通道识别结果更优。模拟实验结果与实际实验结果与实验结果通过t分布检验,属于同一样本。误差相对比例为识别出的顺式突变阳性个数与已知个数的平均差异比上已知个数;从结果上看四个信号通道的结果比两个信号通道的结果更精准,当反式突变阳性率较高、顺式突变阳性率较低时,两个信号通道会出现误识别;两个信号通道可以很好的识别出顺反式突变类型,但在极端情况下会存在误差,比如图10中,顺式突变阳性率为0时,两个信号通道误差比例大于0,说明存在误识别情况。
上述实施例中,为更加准确识别出顺式突变以及反式突变的数量,提出在四个信号通道(或增加一个使用通用探针的信号通道)表示突变情况的基础上,计算顺式突变和反式突变的数量,其计算得到的结果更优,并且通过对计算结果的检查以及验证以确保得到的结果符合各自的概率比例,进而提高了计算结果的准确性。
上述实施例中,增加通用信号通道(例如,通用探针)用于验证是否存在指定的突变模板(如顺式突变、反式突变、野生模板)。如果存在模板通用通道为阳性,排除假阳性信号的干扰,能更好的识别顺式突变和反式突变的结果。
上述实施例中,使用四个信号通道相比于两个信号通道更加合理准确的原因包括但不限于:1、四个信号通道可以准确识别出一个反式突变和一个顺势突变模板在同一反应单元的个数且为已知,而两个信号通道是未知。2、仅顺式突变在反应单元中的个数已知,两个信号通道未知。3、四个信号通道的结果计算更为简单,结果检验具有多样化。
应该理解的是,虽然图2-6的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-6中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图11所示,提供了一种T790M和C797S顺反式突变类型识别及计算装置,该装置可以采用软件模块或硬件模块,或者是二者的结合成为计算机设备的一部分,该装置具体包括:
统计信息确定模块1102,用于确定反应单元内各信号通道的统计信息,统计信息中包括各信号通道的阳性信息和/或阴性信息。
阳性率计算模块1104,用于基于各信号通道的统计信息确定突变模板的阳性率,突变模板包括顺式突变和/或反式突变。
类型识别模块1106,用于基于突变模板的阳性率确定T790M和C797S顺反式突变的类型。
在一些实施例中,装置还包括拷贝数确定模块,拷贝数确定模块用于基于突变模板的阳性率及生物实验基本信息确定突变模板的拷贝数。
在一些实施例中,阳性率计算模块1104还用于基于各信号通道的统计信息确定各信号通道的阳性率,及不同信号通道组合的共有阳性率;基于各信号通道的阳性率及共有阳性率确定初始调整值;基于初始调整值、信号通道的阳性率及共有阳性率确定突变模板的阳性率。
在一些实施例中,阳性率计算模块1104还用于基于第一信号通道的阳性数量与有效反应单元的数量的关系确定第一信号通道的阳性率;基于第二信号通道的阳性数量与有效反应单元的数量的关系确定第二信号通道的阳性率;基于第一信号通道与第二信号通道同时为阳性的数量与有效反应单元的数量的关系确定第一信号通道与第二信号通道的共有阳性率。
在一些实施例中,阳性率计算模块1104还用于基于第一信号通道的阳性率、第二信号通道的阳性率以及共有阳性率确定初始调整值。
在一些实施例中,阳性率计算模块1104还用于响应于第一信号通道的阳性率、突变模板的阳性率及初始调整值与预设阈值满足预设条件,且共有阳性率、突变模板的阳性率及初始调整值满足预设条件,确定突变模板的阳性率;响应于第一信号通道的阳性率、突变模板的阳性率及初始调整值与预设阈值不满足预设条件,或者,共有阳性率、突变模板的阳性率及初始调整值与预设阈值不满足预设条件,基于更新后的初始调整值确定突变模板的阳性率。
在一些实施例中,阳性率计算模块1104还用于基于第一信号通道的阳性率、顺式突变的阳性率及初始调整值确定T790M和C797S的反式突变中T790M突变模板的阳性率;基于第二信号通道的阳性率、顺式突变的阳性率及初始调整值确定T790M和C797S的反式突变中C797S突变模板的阳性率;基于第一信号通道与第二信号通道的共有阳性率及初始调整值确定顺式突变的阳性率,第一信号通道的阳性率、第二信号通道的阳性率及共有阳性率基于T790M和C797S的反式突变中T790M突变模板的阳性率、T790M和C797S的反式突变中C797S突变模板的阳性率及顺式突变的阳性率确定。
在一些实施例中,装置还包括更新模块,更新模块用于基于T790M和C797S的反式突变中T790M突变模板的阳性率、T790M和C797S的反式突变中C797S突变模板的阳性率及顺式突变的阳性率更新初始调整值。
在一些实施例中,阳性率计算模块1104还用于基于各信号通道的统计信息确定各信号通道的阳性率和/或阴性率,及不同信号通道组合的阳性率和/或阴性率;基于各信号通道的阳性率和/或阴性率,及不同信号通道组合的阳性率和/或阴性率确定突变模板的阳性率。
在一些实施例中,阳性率计算模块1104还用于基于反应单元中两个信号通道为阳性且两个信号通道为阴性的数量与有效反应单元的数量的关系确定阳性率;基于反应单元中两个信号通道为阴性的数量与反应单元中有效反应单元的数量的关系确定阴性率;基于反应单元中三个信号通道为阳性且一个信号通道为阴性的数量与有效反应单元的数量的关系确定阳性率;基于反应单元中一个信号通道为阴性的数量与反应单元中有效反应单元的数量的关系确定阴性率;基于反应单元中一个信号通道为阳性且三个信号通道为阴性的数量与有效反应单元的数量的关系确定阳性率;基于反应单元中四个信号通道为阳性的数量与有效反应单元的数量的关系确定阳性率。
在一些实施例中,装置还包括异常去除模块,异常去除模块用于确定异常反应单元,并将异常反应单元去除;基于去除异常反应单元后的有效反应单元的各信号通道的阳性率和/或阴性率确定突变模板的阳性率。
在一些实施例中,异常去除模块还用于将反应单元中一个信号通道为阳性且三个信号通道为阴性的反应单元确定为异常反应单元,将异常反应单元确定为无效反应单元或者将异常反应单元的阳性信息转设为阴性信息;将反应单元中两个信号通道为阳性且两个信号通道为阴性的组合确定为异常组合,将异常组合对应的反应单元确定为异常反应单元,将异常反应单元确定为无效反应单元或者将异常反应单元的阳性信息转设为阴性信息。
在一些实施例中,阳性率计算模块1104还用于基于反应单元中包括两个信号通道为阴性的统计概率及反应单元中包括两个信号通道为阴性且另外两个信号通道为阳性的统计概率确定突变模板的阳性率,其中,突变模板的阳性率包括T790M和C797S的反式突变中T790M突变模板的阳性率、T790M和C797S的反式突变中C797S突变模板的阳性率及顺式突变的阳性率。
在一些实施例中,装置还包括校验模块,校验模块用于对突变模板的阳性率进行校验,基于校验后的阳性率确定突变模板的拷贝数。
在一些实施例中,校验模块还用于基于反应单元中一个信号通道为阴性的统计概率、反应单元中一个信号通道为阴性且另外三个信号通道为阳性的统计概率校验突变模板的阳性率。
在一些实施例中,校验模块还用于基于反应单元中四个信号通道为阳性的统计概率校验突变模板的阳性率。
关于T790M和C797S顺反式突变类型识别及计算装置的具体限定可以参见上文中对于T790M和C797S顺反式突变类型识别及计算方法的限定,在此不再赘述。上述T790M和C797S顺反式突变类型识别及计算装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图12所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储统计信息数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种T790M和C797S顺反式突变类型识别及计算方法。
本领域技术人员可以理解,图12中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种T790M和C797S顺反式突变类型识别及计算方法,其特征在于,所述方法包括:
确定反应单元内各信号通道的统计信息,所述统计信息中包括各所述信号通道的阳性信息和/或阴性信息;
基于各所述信号通道的所述统计信息确定突变模板的阳性率,所述突变模板包括顺式突变和/或反式突变;
基于所述突变模板的阳性率确定T790M和C797S顺反式突变的类型。
2.根据权利要求1所述的方法,其特征在于,基于各所述信号通道的所述统计信息确定突变模板的阳性率,包括:
基于各所述信号通道的统计信息确定各所述信号通道的阳性率,及不同信号通道组合的共有阳性率;
基于各所述信号通道的所述阳性率及所述共有阳性率确定初始调整值;
基于所述初始调整值、所述信号通道的阳性率及所述共有阳性率确定所述突变模板的阳性率,其中,所述突变模板的阳性率及生物实验基本信息用于确定所述突变模板的拷贝数。
3.根据权利要求2所述的方法,其特征在于,所述基于各所述信号通道的所述统计信息确定各所述信号通道的阳性率,及不同信号通道组合的共有阳性率,包括以下至少一项:
基于第一信号通道的阳性数量与有效反应单元的数量的关系确定第一信号通道的阳性率;
基于第二信号通道的阳性数量与有效反应单元的数量的关系确定第二信号通道的阳性率;
基于第一信号通道与第二信号通道同时为阳性的数量与有效反应单元的数量的关系确定第一信号通道与第二信号通道的共有阳性率。
4.根据权利要求2所述的方法,其特征在于,所述基于各所述信号通道的所述阳性率及所述共有阳性率确定初始调整值,包括:
基于第一信号通道的阳性率、第二信号通道的阳性率以及共有阳性率确定初始调整值;
所述基于所述初始调整值、所述信号通道的阳性率及所述共有阳性率确定所述突变模板的阳性率,包括:
响应于所述第一信号通道的阳性率、所述突变模板的阳性率及所述初始调整值与预设阈值满足预设条件,且所述共有阳性率、所述突变模板的阳性率及所述初始调整值满足预设条件,确定所述突变模板的阳性率;
响应于所述第一信号通道的阳性率、所述突变模板的阳性率及所述初始调整值与预设阈值不满足预设条件,或者,所述共有阳性率、所述突变模板的阳性率及所述初始调整值与预设阈值不满足预设条件,基于更新后的初始调整值确定所述突变模板的阳性率,其中,更新初始调整值包括基于T790M和C797S的反式突变中T790M突变模板的阳性率、T790M和C797S的反式突变中C797S突变模板的阳性率及顺式突变的阳性率更新初始调整值。
5.根据权利要求4所述的方法,其特征在于,所述基于所述初始调整值、所述信号通道的阳性率及所述共有阳性率确定所述突变模板的阳性率,包括:
基于所述第一信号通道的阳性率、所述顺式突变的阳性率及所述初始调整值确定T790M和C797S的反式突变中T790M突变模板的阳性率;
基于所述第二信号通道的阳性率、所述顺式突变的阳性率及所述初始调整值确定T790M和C797S的反式突变中C797S突变模板的阳性率;
基于所述第一信号通道与所述第二信号通道的共有阳性率及所述初始调整值确定所述顺式突变的阳性率,所述第一信号通道的阳性率、所述第二信号通道的阳性率及所述共有阳性率基于所述T790M和C797S的反式突变中T790M突变模板的阳性率、所述T790M和C797S的反式突变中C797S突变模板的阳性率及所述顺式突变的阳性率确定。
6.根据权利要求1所述的方法,其特征在于,基于各所述信号通道的统计信息确定突变模板的阳性率包括:
基于各信号通道的统计信息确定各信号通道的阳性率和/或阴性率,及不同信号通道组合的阳性率和/或阴性率;
基于各信号通道的阳性率和/或阴性率,及不同信号通道组合的阳性率和/或阴性率确定突变模板的阳性率。
7.根据权利要求6所述的方法,其特征在于,基于各信号通道的统计信息确定各信号通道的阳性率和/或阴性率,及不同信号通道组合的阳性率和/或阴性率,包括以下至少一项:
基于反应单元中两个信号通道为阳性且两个信号通道为阴性的数量与有效反应单元的数量的关系确定阳性率;
基于反应单元中两个信号通道为阴性的数量与反应单元中有效反应单元的数量的关系确定阴性率;
基于反应单元中三个信号通道为阳性且一个信号通道为阴性的数量与有效反应单元的数量的关系确定阳性率;
基于反应单元中一个信号通道为阴性的数量与反应单元中有效反应单元的数量的关系确定阴性率;
基于反应单元中一个信号通道为阳性且三个信号通道为阴性的数量与有效反应单元的数量的关系确定阳性率;
基于反应单元中四个信号通道为阳性的数量与有效反应单元的数量的关系确定阳性率。
8.根据权利要求6所述的方法,其特征在于,所述方法还包括:
确定异常反应单元,并将所述异常反应单元去除;
基于去除异常反应单元后的有效反应单元的各信号通道的阳性率和/或阴性率确定突变模板的阳性率;
所述确定异常反应单元包括以下至少一项:
将所述反应单元中一个信号通道为阳性且三个信号通道为阴性的反应单元确定为异常反应单元,将所述异常反应单元确定为无效反应单元或者将所述异常反应单元的阳性信息转设为阴性信息;
将反应单元中两个信号通道为阳性且两个信号通道为阴性的组合确定为异常组合,将所述异常组合对应的反应单元确定为异常反应单元,将所述异常反应单元确定为无效反应单元或者将所述异常反应单元的阳性信息转设为阴性信息。
9.根据权利要求6所述的方法,其特征在于,所述基于各信号通道的阳性率和/或阴性率,及不同信号通道组合的阳性率和/或阴性率确定突变模板的阳性率,包括:
基于反应单元中包括两个信号通道为阴性的统计概率及所述反应单元中包括两个信号通道为阴性且另外两个信号通道为阳性的统计概率确定所述突变模板的阳性率,其中,所述突变模板的阳性率包括T790M和C797S的反式突变中T790M突变模板的阳性率、T790M和C797S的反式突变中C797S突变模板的阳性率及顺式突变的阳性率。
10.根据权利要求9所述的方法,其特征在于,所述方法还包括:对所述突变模板的阳性率进行校验,基于校验后的阳性率确定所述突变模板的拷贝数;所述对所述突变模板的阳性率进行校验,包括:
基于所述反应单元中一个信号通道为阴性的统计概率、所述反应单元中一个信号通道为阴性且另外三个信号通道为阳性的统计概率校验所述突变模板的阳性率;
基于所述反应单元中四个信号通道为阳性的统计概率校验所述突变模板的阳性率。
CN202110918018.XA 2021-08-11 2021-08-11 一种t790m和c797s顺反式突变类型识别及计算方法 Active CN113628682B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110918018.XA CN113628682B (zh) 2021-08-11 2021-08-11 一种t790m和c797s顺反式突变类型识别及计算方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110918018.XA CN113628682B (zh) 2021-08-11 2021-08-11 一种t790m和c797s顺反式突变类型识别及计算方法

Publications (2)

Publication Number Publication Date
CN113628682A true CN113628682A (zh) 2021-11-09
CN113628682B CN113628682B (zh) 2023-10-24

Family

ID=78384319

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110918018.XA Active CN113628682B (zh) 2021-08-11 2021-08-11 一种t790m和c797s顺反式突变类型识别及计算方法

Country Status (1)

Country Link
CN (1) CN113628682B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115798584A (zh) * 2022-12-14 2023-03-14 上海华测艾普医学检验所有限公司 一种同时检测egfr基因t790m和c797s顺反式突变的方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101381779A (zh) * 2008-10-21 2009-03-11 广州益善生物技术有限公司 kRas基因突变的检测探针、液相芯片及其检测方法
CN103571918A (zh) * 2012-07-18 2014-02-12 益善生物技术股份有限公司 Fyco1基因突变检测特异性引物和液相芯片
CN105969856A (zh) * 2016-05-13 2016-09-28 万康源(天津)基因科技有限公司 一种单细胞外显子测序肿瘤体细胞突变检测方法
CN109554444A (zh) * 2018-12-31 2019-04-02 新羿制造科技(北京)有限公司 一种检测核酸突变顺反式结构的方法及其试剂盒
CN110004219A (zh) * 2019-04-19 2019-07-12 格尚微(上海)生物科技有限公司 一种egfr t790m和c797s顺式突变的检测方法
WO2019208052A1 (ja) * 2018-04-25 2019-10-31 特定非営利活動法人North East Japan Study Group プログラム、情報処理方法および情報処理装置
CN110996962A (zh) * 2017-08-03 2020-04-10 诺华股份有限公司 第三代egfr酪氨酸激酶抑制剂和周期素d激酶抑制剂的治疗组合
CN112522406A (zh) * 2020-12-10 2021-03-19 珠海澳加动力生物科技有限公司 Egfr基因突变检测系统

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101381779A (zh) * 2008-10-21 2009-03-11 广州益善生物技术有限公司 kRas基因突变的检测探针、液相芯片及其检测方法
US20110269640A1 (en) * 2008-10-21 2011-11-03 Guangzhou Surexam Bio-Tech Co., Ltd. PROBES FOR DETECTING MUTATIONS OF kRas GENE, LIQUICHIP AND DETECTION METHODS THEREOF
CN103571918A (zh) * 2012-07-18 2014-02-12 益善生物技术股份有限公司 Fyco1基因突变检测特异性引物和液相芯片
CN105969856A (zh) * 2016-05-13 2016-09-28 万康源(天津)基因科技有限公司 一种单细胞外显子测序肿瘤体细胞突变检测方法
CN110996962A (zh) * 2017-08-03 2020-04-10 诺华股份有限公司 第三代egfr酪氨酸激酶抑制剂和周期素d激酶抑制剂的治疗组合
WO2019208052A1 (ja) * 2018-04-25 2019-10-31 特定非営利活動法人North East Japan Study Group プログラム、情報処理方法および情報処理装置
EP3786960A1 (en) * 2018-04-25 2021-03-03 Nonprofit Organization North East Japan Study Group Program, information processing method, and information processing device
CN109554444A (zh) * 2018-12-31 2019-04-02 新羿制造科技(北京)有限公司 一种检测核酸突变顺反式结构的方法及其试剂盒
CN110004219A (zh) * 2019-04-19 2019-07-12 格尚微(上海)生物科技有限公司 一种egfr t790m和c797s顺式突变的检测方法
CN112522406A (zh) * 2020-12-10 2021-03-19 珠海澳加动力生物科技有限公司 Egfr基因突变检测系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
M SATOUCHI, H TANAKA: "Detection of epidermal growth factor receptor gene T790M mutation in cytology samples using the cobas EGFR mutation test", 《ELSEVIER》 *
何婷婷 等: "EGFR C797S突变与奥西替尼耐药的相关性", 《重庆医学》 *
王耀;刘妍;许智慧;纪冬;李晓东;钟彦伟;徐东平;: "G1764A/C1766T/T1768A三联突变对HBV核心启动子活性的上调作用研究", 解放军医学杂志, no. 08 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115798584A (zh) * 2022-12-14 2023-03-14 上海华测艾普医学检验所有限公司 一种同时检测egfr基因t790m和c797s顺反式突变的方法
CN115798584B (zh) * 2022-12-14 2024-03-29 上海华测艾普医学检验所有限公司 一种同时检测egfr基因t790m和c797s顺反式突变的方法

Also Published As

Publication number Publication date
CN113628682B (zh) 2023-10-24

Similar Documents

Publication Publication Date Title
Nielsen et al. SNP calling, genotype calling, and sample allele frequency estimation from new-generation sequencing data
García-García et al. Assessment of the latest NGS enrichment capture methods in clinical context
Takayama et al. Construction and integration of three de novo Japanese human genome assemblies toward a population-specific reference
Peterson et al. The utility of empirically assigning ancestry groups in cross‐population genetic studies of addiction
US20120253960A1 (en) Methods, software arrangements, storage media, and systems for providing a shrinkage-based similarity metric
US11842794B2 (en) Variant calling in single molecule sequencing using a convolutional neural network
Kremer et al. Approaches for in silico finishing of microbial genome sequences
CN115083521B (zh) 一种单细胞转录组测序数据中肿瘤细胞类群的鉴定方法及系统
CN114420212A (zh) 一种大肠杆菌菌株鉴定方法和系统
De Marino et al. A comparative analysis of current phasing and imputation software
Glusman et al. Ultrafast comparison of personal genomes via precomputed genome fingerprints
Berg et al. XPRESSyourself: Enhancing, standardizing, and automating ribosome profiling computational analyses yields improved insight into data
CN113628682A (zh) 一种t790m和c797s顺反式突变类型识别及计算方法
WO2019242445A1 (zh) 病原体操作组的检测方法、装置、计算机设备和存储介质
Niehus et al. PopDel identifies medium-size deletions simultaneously in tens of thousands of genomes
Chung et al. FADU: a quantification tool for prokaryotic transcriptomic analyses
CN107967411B (zh) 一种脱靶位点的检测方法、装置及终端设备
CN107273715B (zh) 一种检测方法及装置
CN111210873B (zh) 基于外显子测序数据的拷贝数变异检测方法及系统、终端和存储介质
Jiang et al. DRAMS: A tool to detect and re-align mixed-up samples for integrative studies of multi-omics data
Huang et al. Reveel: large-scale population genotyping using low-coverage sequencing data
JP5946277B2 (ja) アセンブリ誤り検出のための方法およびシステム(アセンブリ誤り検出)
Lin et al. MapCaller–An integrated and efficient tool for short-read mapping and variant calling using high-throughput sequenced data
Gong et al. SAW: An efficient and accurate data analysis workflow for Stereo-seq spatial transcriptomics
WO2018006057A1 (en) Synthetic wgs bioinformatics validation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant