CN112669910A - 扩增曲线基线确定方法、装置以及电子设备 - Google Patents

扩增曲线基线确定方法、装置以及电子设备 Download PDF

Info

Publication number
CN112669910A
CN112669910A CN202011644504.9A CN202011644504A CN112669910A CN 112669910 A CN112669910 A CN 112669910A CN 202011644504 A CN202011644504 A CN 202011644504A CN 112669910 A CN112669910 A CN 112669910A
Authority
CN
China
Prior art keywords
amplification
baseline
determining
sample
curve
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011644504.9A
Other languages
English (en)
Inventor
李冬
杨智
贺贤汉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Bori Technology Co Ltd
Original Assignee
Hangzhou Bori Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Bori Technology Co Ltd filed Critical Hangzhou Bori Technology Co Ltd
Priority to CN202011644504.9A priority Critical patent/CN112669910A/zh
Publication of CN112669910A publication Critical patent/CN112669910A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本申请提供了一种扩增曲线基线确定方法、装置以及电子设备,涉及数据检测技术领域,包括:获取未知样本扩增数据,利用聚类分析法从未知样本扩增数据中确定明显扩增样本和非明显扩增样本,利用线性拟合方法确定明显扩增样本的扩增曲线基线以及最短基线期,基于最短基线期确定非明显扩增样本的扩增曲线基线,以缓解了目前的核酸定量方法无法获得真实的扩增曲线技术问题。

Description

扩增曲线基线确定方法、装置以及电子设备
技术领域
本申请涉及数据检测技术领域,尤其是涉及一种扩增曲线基线确定方法、装置以及电子设备。
背景技术
目前,诊断传染病标准的核酸定量方法多采用荧光实时定量PCR,能够量化样品模板的初始值,常被用在基因分析表达、转基因食物检测和癌症检测中。
但是,目前实际的PCR扩增曲线是较为多样的,即使是同一次扩增实验,各孔位的扩增曲线也相差很大,而且,现有的方法都无法消除基线即荧光本底强度的影响,难以确定各未知样本的基线。因此,目前的方法无法获得较高精度的扩增曲线。
发明内容
本发明的目的在于提供一种扩增曲线基线确定方法、装置以及电子设备,以缓解目前无法获得较高精度扩增曲线的技术问题。
第一方面,本申请实施例提供了一种扩增曲线基线确定方法,所述方法包括:
获取未知样本扩增数据,利用聚类分析法从所述未知样本扩增数据中确定明显扩增样本和非明显扩增样本;
利用线性拟合方法确定所述明显扩增样本的扩增曲线基线以及最短基线期;
基于所述最短基线期确定所述非明显扩增样本的扩增曲线基线。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,所述获取未知样本扩增数据的步骤,包括:
采集未知样本的PCR扩增数据。
结合第一方面,本发明实施例提供了第一方面的第二种可能的实施方式,其中,所述利用聚类分析法从所述未知样本扩增数据中确定明显扩增样本和非明显扩增样本的步骤,包括:
利用Savitzky-Golay求导法和聚类分析法,从所述PCR扩增数据中确定明显扩增样本和非明显扩增样本。
结合第一方面,本发明实施例提供了第一方面的第三种可能的实施方式,其中,所述利用Savitzky-Golay求导法和聚类分析法,从所述PCR扩增数据中确定明显扩增样本和非明显扩增样本的步骤,包括:
利用Savitzky-Golay求导法,确定所述PCR扩增数据的导数曲线,并查找所述导数曲线的极大值点;
基于所述极大值点利用聚类评价指标,从所述PCR扩增数据中确定明显扩增样本和非明显扩增样本,并确定所述明显扩增样本对应的最大一阶导数位置。
结合第一方面,本发明实施例提供了第一方面的第四种可能的实施方式,其中,所述利用线性拟合方法确定所述明显扩增样本的扩增曲线基线以及最短基线期的步骤,包括:
利用线性拟合方法,在所述最大一阶导数位置之前查找所述明显扩增样本的第一斜率最小区域;
按照从所述第一斜率最小区域向两端扩充的方式,查找拟合度达到第一预设值的第一扩增区域以及所述第一扩增区域对应的第一基线;
将原始扩增曲线与所述第一基线进行相减,得到去除基线后的第一扩增曲线;
综合所有所述明显扩增样本的所述第一扩增曲线,确定最短基线期。
结合第一方面,本发明实施例提供了第一方面的第五种可能的实施方式,其中,所述基于所述最短基线期确定所述非明显扩增样本的扩增曲线基线的步骤,包括:
基于所述最短基线期,利用线性拟合方法确定所述非明显扩增样本的扩增曲线基线。
结合第一方面,本发明实施例提供了第一方面的第六种可能的实施方式,其中,所述基于所述最短基线期,利用线性拟合方法确定所述非明显扩增样本的扩增曲线基线的步骤,包括:
基于所述最短基线期,利用线性拟合方法确定所述非明显扩增样本的第二斜率最小区域;
按照从所述第二斜率最小区域向两端扩充的方式,查找拟合度达到第二预设值的第二扩增区域以及所述第二扩增区域对应的第二基线;
将原始扩增曲线与所述第二基线进行相减,得到去除基线后的第二扩增曲线。
第二方面,本发明实施例提供了一种扩增曲线基线确定装置,所述装置包括:
获取模块,用于获取未知样本扩增数据,利用聚类分析法从所述未知样本扩增数据中确定明显扩增样本和非明显扩增样本;
第一确定模块,用于利用线性拟合方法确定所述明显扩增样本的扩增曲线基线以及最短基线期;
第二确定模块,用于基于所述最短基线期确定所述非明显扩增样本的扩增曲线基线。
第三方面,本发明实施例还提供一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的方法的步骤。
第四方面,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可运行指令,所述计算机可运行指令在被处理器调用和运行时,所述计算机可运行指令促使所述处理器运行上述第一方面所述的方法。
本申请实施例带来了以下有益效果:
本申请实施例提供的一种扩增曲线基线确定方法、装置以及电子设备,包括:首先获取未知样本扩增数据,利用聚类分析法从未知样本扩增数据中确定明显扩增样本和非明显扩增样本,然后再利用线性拟合方法确定明显扩增样本的扩增曲线基线以及最短基线期,之后基于最短基线期确定非明显扩增样本的扩增曲线基线,本方案中,通过利用聚类分析法将所有未知样本扩增曲线分为明显扩增样本及非明显扩增样本,能够确定明显扩增样本基线及最短基线期,再者,根据最短基线期确定其他非明显扩增样本的扩增曲线基线,实现了最后能够确定出未知样本扩增数据的更高精度的扩增曲线基线,缓解了目前无法获得较高精度扩增曲线的技术问题。
附图说明
为了更清楚地说明本申请具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种扩增曲线基线确定方法的流程示意图;
图2为本申请实施例提供的一种扩增曲线基线确定方法的另一流程示意图;
图3(a)和图3(b)为本申请实施例提供的一种扩增曲线基线确定方法中 PCR检测系统5个孔位的原始扩增数据示意图;
图4为本申请实施例提供的一种扩增曲线基线确定方法中PCR检测系统部分孔位扩增数据导数曲线示意图;
图5(a)和图5(b)为本申请实施例提供的一种扩增曲线基线确定方法中 PCR检测系统5个孔位的分析结果示意图;
图6为本申请实施例提供的一种增曲线基线确定装置的结构示意图;
图7为示出了本申请实施例所提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合附图对本申请的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
目前,诊断传染病标准的核酸定量方法仍然多采用荧光实时定量PCR,其能够量化样品模板的初始值,常被用在基因分析表达、转基因食物检测和癌症检测中。为确定样本的Ct值,现有方法一般将3-15个循环的荧光信号标准偏差10倍对应的阈值作为Ct值确定依据、或者利用sigmoid、Richards 等曲线模型,基于LM方法(Levenberg-Marquardt方法)、Akima插值法等方法进行拟合,得到拟合参数。然而,不管是哪种方法,都存在一个重要的难点问题,即如何消除基线也就是荧光本底强度的影响,即确定各未知样本的基线。只有在去除基线的情况下,才能获得真实的扩增曲线。
实际的PCR扩增曲线是千奇百怪的,即使是同一次扩增实验,各孔位的扩增曲线也相差很大。但总体而言,可分为两类:具有明显扩增的及不具有明显扩增的。如果采用同一种方法对所有未知样本进行基线期分析,很难不陷入以偏概全或者分析速度偏慢的窘境。从另一方面说,对于不具有明显扩增特性的扩增曲线,当以10倍的标准偏差作为阈值线确定的标准,如果基线期稍有偏差,很容易就使得具有扩增抬头的曲线被消除,或者将本是误差范围内的“抬头”看成真实扩增。
基于此,本申请实施例提供了一种扩增曲线基线确定方法、装置以及电子设备,通过该方法可以缓解目前的核酸定量方法无法获得真实的扩增曲线的技术问题。即首先利用聚类分析方法将所有未知样本扩增曲线分为明显扩增样本及非明显扩增样本,其次确定明显扩增样本基线及最短基线期,最后再根据最短基线期确定其他未知样本基线,总体而言,该方法易于理解,容易实现,精度较高。
实施例一:
图1为本申请实施例提供的一种扩增曲线基线确定方法的流程示意图。如图1所示,该方法包括:
步骤S110,获取未知样本扩增数据,利用聚类分析法从未知样本扩增数据中确定明显扩增样本和非明显扩增样本。
步骤S120,利用线性拟合方法确定明显扩增样本的扩增曲线基线以及最短基线期。
步骤S130,基于最短基线期确定非明显扩增样本的扩增曲线基线。
通过利用聚类分析法将所有未知样本扩增曲线分为明显扩增样本及非明显扩增样本,能够确定明显扩增样本基线及最短基线期,再者,根据最短基线期确定其他非明显扩增样本的扩增曲线基线,实现了最后能够确定出未知样本扩增数据的更高精度的扩增曲线基线,缓解了目前无法获得较高精度扩增曲线的技术问题。
在一些实施例中,上述步骤S110中获取未知样本扩增数据的步骤,具体包括:步骤a),采集未知样本的PCR扩增数据。
通过采集未知样本的PCR扩增数据,如图2所示,以便于后续对将所有未知样本扩增曲线分为明显扩增样本及非明显扩增样本。
在一些实施例中,上述步骤S110中利用聚类分析法从未知样本扩增数据中确定明显扩增样本和非明显扩增样本的步骤,包括:
步骤b),利用Savitzky-Golay求导法和聚类分析法,从PCR扩增数据中确定明显扩增样本和非明显扩增样本。
需要说明的是,Savitzky-Golay拟合是一种用多项式实现滑动窗内最小二乘拟合的平滑方法,在利用Savitzky-Golay拟合获得多项式系数矩阵之后,再求取相应的导数矩阵,即可获得具有平滑效果的扩增曲线导数数据。与直接差分法相比,Savitzky-Golay求导非常适合处理分辨滤较低、采样点数较少的扩增曲线数据。
在获得扩增曲线导数数据之后,当某循环位置导数值大于两边循环对应的导数值,即为极大值点,找出所有极大值点。
通过利用Savitzky-Golay求导法和聚类分析法,能够进行拟合,得到拟合参数,确定明显扩增样本及对应的最大一阶导数位置,从而为下一步确定其他扩增曲线指标奠定了基础,易于理解,容易实现,精度较高。
在一些实施例中,扩增曲线基线确定方法,上述步骤b)具体包括:
步骤c),利用Savitzky-Golay求导法,确定PCR扩增数据的导数曲线,并查找导数曲线的极大值点;
步骤d),基于极大值点利用聚类评价指标,从PCR扩增数据中确定明显扩增样本和非明显扩增样本,并确定明显扩增样本对应的最大一阶导数位置。
以导数最大值为一类,以其他极大值点作为另一类,利用聚类评价指标即轮廓系数进行考察,如果该二分类总体轮廓系数达到给定的阈值(一般设置成接近1的值,例如0.99),则该二分类成立,以最大值对应的扩增曲线循环位置为最大的一阶导数位置,如图2所示。
通过利用Savitzky-Golay求导法,确定PCR扩增数据的导数曲线,并查找导数曲线的极大值点,能够将具有明显扩增特性的扩增曲线,当以10 倍的标准偏差作为阈值线确定的标准,防止基线期稍有偏差,使得具有扩增抬头的曲线被消除,或者将本是误差范围内的“抬头”看成真实扩增,保证确定其他扩增曲线指标奠定了基础。
在一些实施例中,上述步骤S120具体包括如下步骤:
步骤e),利用线性拟合方法,在最大一阶导数位置之前查找明显扩增样本的第一斜率最小区域;
步骤f),按照从第一斜率最小区域向两端扩充的方式,查找拟合度达到第一预设值的第一扩增区域以及第一扩增区域对应的第一基线;
步骤g),将原始扩增曲线与第一基线进行相减,得到去除基线后的第一扩增曲线;
步骤h),综合所有明显扩增样本的第一扩增曲线,确定最短基线期。
对于上述步骤e),在最大的一阶导数位置之前,利用线性拟合方法以决定系数为指标进行迭代搜索,如图2所示,找出满足最小区域要求(即最短基线期,比如5个循环)的斜率最小区域。
对于上述步骤f),以斜率最小区域进行两端扩充,寻找拟合度最优的扩增区域及对应基线,即从斜率最小区域两端点开始,分别向两端延伸、拟合,找出决定系数最大的扩增区域,此即为拟合度最优区域。设区域起点为base_begin,终点为base_end,则基线期为[base_begin,base_end]。这里决定系数R2指:
Figure BDA0002876838450000081
其中,Xn表示实际的荧光强度值,
Figure BDA0002876838450000091
表示拟合值,
Figure BDA0002876838450000092
表示实际值的平均值,设最优线性拟合对应的斜率为k、截距为b,则基线为: yn=k*n+b,其中,yn表示第n个循环对应的荧光强度基线值。
对于上步骤h),对各扩增明显扩增曲线基线对应线性区间取交集,如图2所示,即可获得最短基线期,基线期终点设为min_base_interval。
通过利用线性拟合方法确定明显扩增样本的扩增曲线基线以及最短基线期,能够在原始扩增曲线的基础上减去基线,获得去除基线后的真实扩增曲线,综合各明显扩增样本扩增曲线基线,确定最短基线期。
在一些实施例中,上述步骤S130具体可以包括如下步骤:
步骤i),基于最短基线期,利用线性拟合方法确定非明显扩增样本的扩增曲线基线。
本步骤中,可以确定其他未知样本斜率最小区域。通过最短基线期确定非明显扩增样本的扩增曲线基线,能够短基线期及线性拟合方法,确定其他未知样本斜率最小区域。
在一些实施例中,上述步骤i)具体可以包括如下步骤:
步骤j),基于最短基线期,利用线性拟合方法确定非明显扩增样本的第二斜率最小区域;
步骤k),按照从第二斜率最小区域向两端扩充的方式,查找拟合度达到第二预设值的第二扩增区域以及第二扩增区域对应的第二基线;
步骤l),将原始扩增曲线与第二基线进行相减,得到去除基线后的第二扩增曲线。
对于上述步骤j),在最短基线期终点之前,对其他未知样本利用线性拟合方法以决定系数为指标进行迭代搜索,如图2所示,找出满足最小区域要求(注:即最短基线期,比如5个循环)的斜率最小区域。
对于上述步骤k)和步骤l),可以按照上述步骤f)和步骤g)的具体过程来实现。示例性的,以斜率最小区域进行两端扩充,寻找拟合度最优的扩增区域及对应基线,在原始扩增曲线的基础上减去基线,获得去除基线后的真实扩增曲线。
通过利用线性拟合方法确定非明显扩增样本的扩增曲线基线,能够以斜率最小区域进行两端扩充,寻找拟合度最优的扩增区域及对应基线,在原始扩增曲线的基础上减去基线,获得去除基线后的真实扩增曲线。
本申请实施例中,可以利用荧光定量PCR检测系统进行多次PCR扩增实验,并对采集到的扩增原始数据进行分析。下面以其中一次实验一个通道部分代表性孔位数据作为示例进行说明。
如图3(a)所示,选取了5个孔位的原始扩增数据,从上至下5条曲线以孔1-5区分。如图3(b)所示,为其中扩增高度较小的序号2-5孔位扩增放大数据。对于数据基本参数,循环数目是40,最短基线期是5个循环。
由图3(a)可见,1孔具有明显扩增,2孔稍有扩增,3-5孔扩增不明显,由图3(b)可见,3-5又可分为两个梯队,其中3孔稍有扩增,而4-5孔扩增不明显。
对于计算结果,按照前述步骤,首先进行了Savitzky-Golay求导,对孔 1、孔2,可得扩增数据导数曲线,如图4所示(其他孔位同理可得)。以导数曲线最大值点为1类,其他极大值点为另一类进行聚类分析,可得各孔对应的轮廓系数,如下表所示:
1 2 3 4 5
轮廓系数 0.9999 0.9846 0.9819 0.9897 0.9592
由此可见,当以0.99为评价阈值,则孔1可分,孔2-5不可分,孔1 最大一阶导数对应的循环位置为第30个循环,在此循环前,满足最短基线期要求且斜率最小的区域为:8-16个循环,以此区域向两端进行扩充,可得拟合最好的区间为:0-21个循环。对应的斜率k=9.414、截距b=9653.266,在原始扩增曲线的基础上,减去该拟合基线,即可获得去除基线后的真实扩增曲线,同理对该次实验该通道中其他具有明显扩增的孔位进行类似计算,可得最短基线期为:0-21。基于该最短基线期,同理对不具有明显扩增孔位进行线性拟合,可找到对应的基线及去除基线后的真实扩增曲线。最终获得的各孔扩增曲线如图5(a)和图5(b)所示,其中,图5(a)为5个孔位的总体扩增曲线,图5(b)为去除明显扩增的1孔之后的其他孔位扩增曲线放大图。由图5可见,孔1具有明显扩增,且在阈值线以上,即具有Ct值,孔2、孔3稍有扩增,但没有达到阈值线标准,孔4、孔5无抬头,与图3(a) 和图3(b)相对照,可见是符合的。
实施例二:
图6为本申请实施例提供的一种扩增曲线基线确定装置的结构示意图,如图6所示,扩增曲线基线确定装置600包括:
获取模块601,用于获取未知样本扩增数据,利用聚类分析法从未知样本扩增数据中确定明显扩增样本和非明显扩增样本;
第一确定模块602,用于利用线性拟合方法确定所述明显扩增样本的扩增曲线基线以及最短基线期;
第二确定模块603,用于基于最短基线期确定非明显扩增样本的扩增曲线基线。
本申请实施例提供的扩增曲线基线确定装置,与上述实施例提供的扩增曲线基线确定方法具有相同的技术特征,所以也能解决相同的技术问题,达到相同的技术效果。
实施例三:
本申请实施例提供的一种电子设备,如图7所示,电子设备700包括存储器701、处理器702,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述实施例提供的方法的步骤。
参见图7,电子设备还包括:总线703和通信接口704,处理器702、通信接口704和存储器701通过总线703连接;处理器702用于执行存储器701中存储的可执行模块,例如计算机程序。
其中,存储器701可能包含高速随机存取存储器(Random Access Memory,简称RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口704(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。
总线703可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器701用于存储程序,所述处理器702在接收到执行指令后,执行所述程序,前述本申请任一实施例揭示的过程定义的装置所执行的方法可以应用于处理器702中,或者由处理器702实现。
处理器702可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器702中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器702可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DigitalSignal Processing,简称DSP)、专用集成电路(Application Specific IntegratedCircuit,简称 ASIC)、现成可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器 701,处理器702读取存储器701中的信息,结合其硬件完成上述方法的步骤。
实施例四:
对应于上述扩增曲线基线确定方法,本申请实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储有机器可运行指令,计算机可运行指令在被处理器调用和运行时,计算机可运行指令促使处理器运行扩增曲线基线确定方法的步骤。
本申请实施例所提供的扩增曲线基线确定装置可以为设备上的特定硬件或者安装于设备上的软件或固件等。本申请实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,前述描述的系统、装置和单元的具体工作过程,均可以参考上述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
再例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述扩增曲线基线确定方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的范围。都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种扩增曲线基线确定方法,其特征在于,所述方法包括:
获取未知样本扩增数据,利用聚类分析法从所述未知样本扩增数据中确定明显扩增样本和非明显扩增样本;
利用线性拟合方法确定所述明显扩增样本的扩增曲线基线以及最短基线期;
基于所述最短基线期确定所述非明显扩增样本的扩增曲线基线。
2.根据权利要求1所述的扩增曲线基线确定方法,其特征在于,所述获取未知样本扩增数据的步骤,包括:
采集未知样本的PCR扩增数据。
3.根据权利要求2所述的扩增曲线基线确定方法,其特征在于,所述利用聚类分析法从所述未知样本扩增数据中确定明显扩增样本和非明显扩增样本的步骤,包括:
利用Savitzky-Golay求导法和聚类分析法,从所述PCR扩增数据中确定明显扩增样本和非明显扩增样本。
4.根据权利要求3所述的扩增曲线基线确定方法,其特征在于,所述利用Savitzky-Golay求导法和聚类分析法,从所述PCR扩增数据中确定明显扩增样本和非明显扩增样本的步骤,包括:
利用Savitzky-Golay求导法,确定所述PCR扩增数据的导数曲线,并查找所述导数曲线的极大值点;
基于所述极大值点利用聚类评价指标,从所述PCR扩增数据中确定明显扩增样本和非明显扩增样本,并确定所述明显扩增样本对应的最大一阶导数位置。
5.根据权利要求4所述的扩增曲线基线确定方法,其特征在于,所述利用线性拟合方法确定所述明显扩增样本的扩增曲线基线以及最短基线期的步骤,包括:
利用线性拟合方法,在所述最大一阶导数位置之前查找所述明显扩增样本的第一斜率最小区域;
按照从所述第一斜率最小区域向两端扩充的方式,查找拟合度达到第一预设值的第一扩增区域以及所述第一扩增区域对应的第一基线;
将原始扩增曲线与所述第一基线进行相减,得到去除基线后的第一扩增曲线;
综合所有所述明显扩增样本的所述第一扩增曲线,确定最短基线期。
6.根据权利要求1所述的扩增曲线基线确定方法,其特征在于,所述基于所述最短基线期确定所述非明显扩增样本的扩增曲线基线的步骤,包括:
基于所述最短基线期,利用线性拟合方法确定所述非明显扩增样本的扩增曲线基线。
7.根据权利要求6所述的扩增曲线基线确定方法,其特征在于,所述基于所述最短基线期,利用线性拟合方法确定所述非明显扩增样本的扩增曲线基线的步骤,包括:
基于所述最短基线期,利用线性拟合方法确定所述非明显扩增样本的第二斜率最小区域;
按照从所述第二斜率最小区域向两端扩充的方式,查找拟合度达到第二预设值的第二扩增区域以及所述第二扩增区域对应的第二基线;
将原始扩增曲线与所述第二基线进行相减,得到去除基线后的第二扩增曲线。
8.一种扩增曲线基线确定装置,其特征在于,所述装置包括:
获取模块,用于获取未知样本扩增数据,利用聚类分析法从所述未知样本扩增数据中确定明显扩增样本和非明显扩增样本;
第一确定模块,用于利用线性拟合方法确定所述明显扩增样本的扩增曲线基线以及最短基线期;
第二确定模块,用于基于所述最短基线期确定所述非明显扩增样本的扩增曲线基线。
9.一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至7任一项所述的方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可运行指令,所述计算机可运行指令在被处理器调用和运行时,所述计算机可运行指令促使所述处理器运行所述权利要求1至7任一项所述的方法。
CN202011644504.9A 2020-12-30 2020-12-30 扩增曲线基线确定方法、装置以及电子设备 Pending CN112669910A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011644504.9A CN112669910A (zh) 2020-12-30 2020-12-30 扩增曲线基线确定方法、装置以及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011644504.9A CN112669910A (zh) 2020-12-30 2020-12-30 扩增曲线基线确定方法、装置以及电子设备

Publications (1)

Publication Number Publication Date
CN112669910A true CN112669910A (zh) 2021-04-16

Family

ID=75412450

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011644504.9A Pending CN112669910A (zh) 2020-12-30 2020-12-30 扩增曲线基线确定方法、装置以及电子设备

Country Status (1)

Country Link
CN (1) CN112669910A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115641916A (zh) * 2022-09-29 2023-01-24 杭州准芯生物技术有限公司 一种分子生物学检测方法、计算机设备及可读存储介质
CN115985396A (zh) * 2022-12-16 2023-04-18 苏州思迈德生物科技有限公司 一种实时荧光定量pcr扩增数据的分析处理方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020042051A1 (en) * 1999-04-27 2002-04-11 Carl T. Wittwer Automated analysis of real-time nucleic acid amplification
JP2008545380A (ja) * 2005-05-13 2008-12-18 バイオ−ラッド ラボラトリーズ,インコーポレイティド 増幅データのベースライン化
CN109923613A (zh) * 2016-06-02 2019-06-21 Seegene株式会社 利用信号变化量数据集的样品内的目标分析物质检测方法
CN111944883A (zh) * 2020-08-25 2020-11-17 杭州博日科技股份有限公司 荧光定量的指标确定方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020042051A1 (en) * 1999-04-27 2002-04-11 Carl T. Wittwer Automated analysis of real-time nucleic acid amplification
JP2008545380A (ja) * 2005-05-13 2008-12-18 バイオ−ラッド ラボラトリーズ,インコーポレイティド 増幅データのベースライン化
CN109923613A (zh) * 2016-06-02 2019-06-21 Seegene株式会社 利用信号变化量数据集的样品内的目标分析物质检测方法
CN111944883A (zh) * 2020-08-25 2020-11-17 杭州博日科技股份有限公司 荧光定量的指标确定方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115641916A (zh) * 2022-09-29 2023-01-24 杭州准芯生物技术有限公司 一种分子生物学检测方法、计算机设备及可读存储介质
CN115641916B (zh) * 2022-09-29 2024-05-03 杭州准芯生物技术有限公司 一种分子生物学检测方法、计算机设备及可读存储介质
CN115985396A (zh) * 2022-12-16 2023-04-18 苏州思迈德生物科技有限公司 一种实时荧光定量pcr扩增数据的分析处理方法及装置
CN115985396B (zh) * 2022-12-16 2023-12-12 苏州思迈德生物科技有限公司 一种实时荧光定量pcr扩增数据的分析处理方法及装置

Similar Documents

Publication Publication Date Title
CN112669910A (zh) 扩增曲线基线确定方法、装置以及电子设备
CN108108426B (zh) 自然语言提问的理解方法、装置及电子设备
CN109685092B (zh) 基于大数据的聚类方法、设备、存储介质及装置
CN107204183A (zh) 一种音频文件检测方法及装置
CN109656928B (zh) 表间关系获得方法及装置
CN110895533B (zh) 一种表单映射方法、装置、计算机设备和存储介质
WO2019096176A1 (zh) 数据处理学习方法、系统以及电子设备
CN107122625B (zh) 人类短片段串联重复序列高通量测序信息的处理方法
CN110807286A (zh) 一种结构网格识别方法
CN105354224A (zh) 知识数据的处理方法和装置
CN113792084A (zh) 数据热度的分析方法、装置、设备及存储介质
CN112331266A (zh) 消除pcr荧光基线期波动的方法
CN109558602B (zh) 翻译工具的分布式选择与融合
CN108171425B (zh) 电能质量分区方法、装置及存储介质
CN113111972B (zh) 基于层次聚类的熔解曲线Tm值确定方法、装置以及电子设备
CN112669909A (zh) 假阳性样本的排除方法、装置以及电子设备
CN104103061A (zh) 医学x线图像的分割方法及系统
CN104462139A (zh) 用户行为的聚类方法和系统
CN114495144A (zh) 文本图像中表格key-value信息的提取方法及装置
CN112598185A (zh) 农业舆情分析方法、装置、设备及存储介质
CN106372340B (zh) 一种Nastran软件颤振计算数据的二次处理方法
CN112652363A (zh) 熔解曲线异常值处理方法、装置以及电子设备
CN110543622A (zh) 文本相似度检测方法、装置、电子设备及可读存储介质
CN109740249B (zh) 一种mux树逻辑结构优化方法、模块及存储介质
CN115170820B (zh) 一种应用于数据曲线过渡阶段的特征提取及界限识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination