CN102880812A - 基于小波分析法处理溶解曲线的方法、装置和电子终端 - Google Patents

基于小波分析法处理溶解曲线的方法、装置和电子终端 Download PDF

Info

Publication number
CN102880812A
CN102880812A CN2012102736203A CN201210273620A CN102880812A CN 102880812 A CN102880812 A CN 102880812A CN 2012102736203 A CN2012102736203 A CN 2012102736203A CN 201210273620 A CN201210273620 A CN 201210273620A CN 102880812 A CN102880812 A CN 102880812A
Authority
CN
China
Prior art keywords
peak
baseline
experimental data
curve map
wavelet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012102736203A
Other languages
English (en)
Other versions
CN102880812B (zh
Inventor
李欣
刘长胜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Todaysoft Technology Co ltd
Original Assignee
BEIJING HUASHENG HENGYE TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING HUASHENG HENGYE TECHNOLOGY Co Ltd filed Critical BEIJING HUASHENG HENGYE TECHNOLOGY Co Ltd
Priority to CN201210273620.3A priority Critical patent/CN102880812B/zh
Publication of CN102880812A publication Critical patent/CN102880812A/zh
Application granted granted Critical
Publication of CN102880812B publication Critical patent/CN102880812B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明实施例提供了一种基于小波分析法处理溶解曲线的方法、装置和电子终端,所述方法包括:对实验数据进行预处理;对预处理后的实验数据进行基线校正,获得基线统一的曲线图;通过小波变换对所述基线统一的曲线图进行转换,获得用于最终识别的曲线图;根据所述用于最终识别的曲线图进行峰识别,并根据识别出的峰进行基因检测。本发明能够根据原始数据曲线图,自动将峰进行有效分离。也就是说能够将原本看不出有几个峰而需要人为根据经验判断的曲线图,转变成识别度非常高的曲线图,从而大大提高了分析速度,并且减少了误判率,提高了基因检测的效率。

Description

基于小波分析法处理溶解曲线的方法、装置和电子终端
技术领域
本发明涉及筛查突变(mutation scanning)、基因分型(MutationGenotyping)、SSR分析、检测甲基化等领域,具体涉及一种基于小波分析法处理溶解曲线的方法、装置和电子终端。
背景技术
在溶解曲线的有效温度范围内,由于SNPs(Single-nucleotideploymorphisms,单核苷酸多态性)的基因型是“成对”检测的,因此纯合型时,就会发生其中的一个峰缺失(形成峰谷),而另一峰抬高的情形。
以下描述产生SNPS或实验数据的设备/仪器的相关工作过程:
1、在实验过程中首先提取样本。
2、将提取的样本放入到毛细管中。
3、在毛细管中加入内标、模版、荧光染料以及DNA扩增酶等。
4、放入仪器,首先进行PCR(Polymerase Chain Reaction,聚合酶链式反应),通过温度的调节和扩增酶的作用将需要分析的STR(short tandem repeat,短串联重复序列)片段进行扩增。同时,此过程也是一个荧光染料与其相对应的DNA片段充分结合的过程。
5、扩增反应完成后,通过逐渐增加温度,随着反应中双链DNA变性,荧光染料又回复到游离状态导致荧光信号降低,实验仪器将自动检测该过程中荧光强度随时间的变化细节,也就是在整个检测过程中,单位时间所对应的荧光强度数值。
6、最后使用的是荧光信号改变的负的一次导数与温度的关系进行原始DNA分型图的绘制。
这个设备与计算机通信,把实验数据传给计算机的过程如下:整个实验完成后,相关的实验数据可以通过用户的设置,存储到与该实验仪器联网的任意一台计算机上。相关的实验数据可以通过机器自带的软件进行相关的输出,其格式具有多样性,比如excel,xml或txt等。
图1为现有技术的溶解曲线图,关于图1中的术语解释如下:A:Adenine腺嘌呤;C:Cytosine胞嘧啶;G:Guanine鸟嘌呤;T:Thymine胸腺嘧啶。纯合型:指两条染色体在同一位点上拥有相同的核苷酸;杂合型:指两条染色体在同一位点上拥有不同的核苷酸。CC纯合型:两条染色体在该位点上具有相同的核苷酸,该核苷酸为胞嘧啶。就峰图而言,CC纯合型表示在标准参考序的某个C下面出现了一个峰,并且这个峰具备纯合型峰的特征(比如强度较高,以及在其参考序左右相邻的核苷酸下没有出峰等)。TT纯合型:两条染色体在该位点上具有相同的核苷酸,该核苷酸为胸腺嘧啶。就峰图而言,TT纯合型表示在标准参考序的某个T下面出现了一个峰,并且这个峰具备纯合型峰的特征(比如强度较高,以及在其参考序左右相邻的核苷酸下没有出峰等)。CG杂合型:两条染色体在该位点上具有不同的核苷酸,该核苷酸为胞嘧啶。就峰图而言,CG杂合型表示在标准参考序的相邻两个核苷酸C,G下面分别出现了一个峰。图1中X轴表示PCR产物的退火温度,单位为摄氏度,Y轴表示荧光浓度(RFU)对温度的一阶导数,单位为mmol/L/摄氏度。
如图1所示,对于杂合型,由于两峰同时出现,且峰高相近,因此融合后致使峰型不明显,峰高较纯合型低,因此,箭头10所指的两个峰就表示了杂合型,该SNP3就判为CG型。另外,箭头20所指即为峰谷,注意相应的配对峰抬高,其中箭头20的左箭头所指的SNP4判断为CC纯合型,箭头20的右箭头所指SNP2为CC纯合型,SNP1为TT纯合型。图1中箭头10表示“峰抬高”,箭头20表示“峰缺失”。
通常情况下,我们用肉眼判断的经验是先看“峰缺失”和“峰抬高”,对于纯合型,这两种情况是同时出现的。对于没有出现峰缺失的连续峰,就直接判断为杂合型。其中,峰缺失和峰抬高都是针对原始数据曲线而言的,具体解释如下:峰缺失就是指非常明显不是峰的地方,可以理解为非常明显的波谷;峰抬高就是指非常明显的是峰的地方,可以理解为非常明显的峰。
目前,市面上还没有专门的设备能够对如上所述的溶解峰进行有效分离。发明人在实现本发明的过程中发现,现在技术的不足至少在于:纯合型峰变换后旁边会出现杂峰,从而使分析人员受到干扰;当没有出现明显“峰缺失”和“峰抬高”,而只是总体峰型较低,现有的分析技术不能给出正确的结果;目前的实验人员都是直接通过人眼查看原始数据曲线(如图1中的黑色曲线),然后通过经验来判断哪里出了峰,以及峰的具体位置,从而找到SNP位点,这样非常的消耗时间,并且可能因为经验的不足容易造成误判。
发明内容
本发明的目的在于,提供一种基于小波分析法处理溶解曲线的方法、装置和电子终端,以提高曲线图中峰型识别的效率、提高分析速度、及减少人工误判率。
为达上述目的,一方面,本发明实施例提供了一种基于小波分析法处理溶解曲线的方法,所述方法包括:
对实验数据进行预处理;
对预处理后的实验数据进行基线校正,获得基线统一的曲线图;
通过小波变换对所述基线统一的曲线图进行转换,获得用于最终识别的曲线图;
根据所述用于最终识别的曲线图进行峰识别,以根据识别出的峰进行基因检测。
为达上述目的,另一方面,本发明实施例提供一种基于小波分析法处理溶解曲线的装置,所述装置包括:
预处理单元,用于对实验数据进行预处理;
基线校正单元,用于对预处理后的实验数据进行基线校正,获得基线统一的曲线图;
小波变换单元,用于通过小波变换对所述基线统一的曲线图进行转换,获得用于最终识别的曲线图;
峰识别及基因检测单元,用于根据所述用于最终识别的曲线图进行峰识别,以根据识别出的峰进行基因检测。
为达上述目的,又一方面,本发明实施例还提供一种电子终端,所述电子终端包括上述基于小波分析法处理溶解曲线的装置。
本发明上述技术方案的有益技术效果在于:本发明能够根据原始数据曲线图,自动将峰进行有效分离。也就是说能够将原本看不出有几个峰而需要人为根据经验判断的曲线图,转变成识别度非常高的曲线图。上述识别度是指:根据温度以及荧光强度与温度的一阶导所绘制出来的分型曲线的峰图的识别度。这样大大提高了分析速度,并且减少了误判率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做一简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为现有技术的溶解曲线图;
图2为本发明实施例与图1相对应的溶解曲线图;
图3为本发明实施例的一种基于小波分析法处理溶解曲线的方法的整体流程图;
图4为本发明实施例的一种基于小波分析法处理溶解曲线的方法的具体流程图;
图5为本发明实施例中分别为当n为1、2、3、4、5的小波基函数的示意图;
图6为本发明实施例的原始数据和变换后的数据表;
图7为本发明实施例的根据图6的数据绘制的软件处理截图;
图8为本发明实施例的根据图7的软件处理截图进行峰图识别的示意图;
图9为本发明实施例的一种基于小波分析法处理溶解曲线的装置的整体功能框图;
图10为本发明实施例的一种基于小波分析法处理溶解曲线的装置的具体功能框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例能够根据原始数据曲线图,自动将峰进行有效分离。也就是说能够将原本看不出有几个峰而需要人为根据经验判断的曲线图(如图1中的黑色曲线),转变成识别度非常高的曲线图(如图2中的虚线曲线)。这样大大提高了分析速度,并且减少了误判率。图2中箭头10表示“峰抬高”,箭头20表示“峰缺失”。
在实际应用中,数据来自于多种不同分析仪器(例如:1:ABI 7500;2:Bio-Rad CFX96;3:Roche LightCycler 480;4:Rotor-gene 6000;5:Stratagene3000),这些仪器所产生的数据具有不同量级的测量温度和荧光强度,并且监控温度间隔对于不同的仪器而言也是不同的。
因此基于以上问题的考虑,本发明实施例通过对原始数据进行小波变换达到进一步分型的效果。该方法能够很好的对原始曲线进行分解,还原真实峰型,直接提供给操作员清晰明了的峰图,在一定程度上提高了劳动效率,减少人工误判率,以及进一步提高基因检测的效率。
图3为本发明实施例的一种基于小波分析法处理溶解曲线的方法的整体流程图。如图3所示,该方法包括如下步骤:
110、对实验数据进行预处理;
120、对预处理后的实验数据进行基线校正,获得基线统一的曲线图;
130、通过小波变换对所述基线统一的曲线图进行转换,获得用于最终识别的曲线图;
140、根据所述用于最终识别的曲线图进行峰识别,并根据识别出的峰进行基因检测。
具体地,步骤110的具体处理过程可以包括:对实验数据进行采样间距归一化处理:以及对采样间距归一化处理后的实验数据执行数据周期扩展。
可选地,在所述对采样间距归一化处理后的实验数据执行数据周期扩展之后,所述方法还包括:保存原始实验数据和经过预处理后所得到的实验数据。
具体地,步骤120目的是将峰图中所有曲线的y值最低点统一变换到x轴。步骤120的具体处理过程可以包括:寻找一个完整周期内的起始点和终止点,以所述起始点和终止点作为参考点得到拟合直线;根据所述拟合直线对每个温度点进行强度值校正,将基线统一到X轴。所述根据所述拟合直线对每个温度点进行强度值校正是基于以下关系式:校正后的强度值=原强度值-拟合直线在该点的强度值。
具体地,步骤130的具体处理过程可以包括:选取符合预设条件的小波基;选取符合预设条件的窗口;根据所述选取的小波基和选取的窗口,通过小波变换对所述基线统一的曲线图进行转换,获得用于最终识别的曲线图。
具体地,步骤140中的基因检测包括:筛查突变,基因分型,SSR分析(Simple Sequence Repeat:简单重复序列),甲基化检测等。
步骤140中识别出来的峰,具有以下特征:
1.该峰的最高点的纵坐标需要分别大于其左右两个点(一共四个点)各自的纵坐标,并且其左一点的纵坐标需要大于其左二点的纵坐标,其右一点的纵坐标需要大于其右二点的纵坐标。
2."1"中所定义的峰位于经过对原始曲线使用基线校正以及小波变换方式处理之后的曲线之中,该曲线在进行峰识别的时候需要通过内置噪声过滤算法的过滤,其目的在于将曲线中的噪声点去掉:根据全局单个色带以及局部基因座内的峰出现的统计规律,进行噪声峰过滤;
3.1"中所定义的峰位于经过对原始曲线使用基线校正以及小波变换方式处理之后的曲线之中,该曲线需要通过内置FFT(快速傅里叶变换)算法的修正,目的在于去掉毛刺点,使曲线变得平滑:通过FFT,将高频噪声峰进行过滤。
4."1"中所定义的峰位于经过对原始曲线使用基线校正以及小波变换方式处理之后的曲线之中,该曲线需要通过Peak Area算法的过滤:将Area异常的峰进行过滤。
5."1"中所定义的峰位于经过对原始曲线使用基线校正以及小波变换方式处理之后的曲线之中,该曲线需要通过内置peak score算法的过滤:通过对每个peak score的计算,对score低的peak进行过滤。
6."1"中所定义的峰位于经过对原始曲线使用基线校正以及小波变换方式处理之后的曲线之中,该曲线需要通过内置相邻峰过滤算法的过滤:确保该样本对应内标色中值peak的半高宽范围内,最多只存在一个峰。
以下对本发明实施例的分析方法进行详细说明。图4为本发明实施例的方法流程图,如图4所示,该分析方法包括以下步骤:
一、预处理,实验数据转换。该过程包括以三个部分:
对实验数据进行采样间距归一化处理:例如将实验数据的温度间隔统一到例如0.1摄氏度,至此每一度将有10个数据点进行表示。这种转换方式平衡了不同仪器取样间隔不同的问题,使得对不同仪器的数据进行统一的算法处理提供了可能性。对于转换时出现的没有对应强度数据的温度间隔点,本实施例以与该点左右最近的实验值点为基础,采用线性插值的方式对这些点进行强度值的求解和填充。
对采样间距归一化处理后的实验数据执行数据周期拓展(按照镜面复制的方式,将数据进行填补和展开):因为原始数据的有效范围一般是35摄氏度到85摄氏度,对此本实施例采用周期映射的方法将温度区间左右扩延至0摄氏度到100摄氏度。这样可以在一定程度上消除接下来的小波变换过程中由边界数据导致的奇异值,提高算法的精确度。其中,周期映射是常用的处理手段,用于扩充分析数据集,其是以原始数据的起始点和终止点位基础进行数据的镜面复制。
保存原始实验数据成配置文件,并保存经过预处理后所得到的实验数据:在导出转换数据时,将原始数据的数据值起始点和终止点保存到单独的配置文件中,并将这个配置文件与转换后的数据保存在同一路径下。这两个值可以直接在后面的小波变换中使用,不用实时进行计算获取,减少了算法的时间复杂度。
可选地,该步骤之后还可以包括步骤:将原始数据和预处理之后的数据导入到GeneMarker中。
二、基线校正:将所有数据四个通道的曲线图(峰图)基线统一到X轴。作为举例而言,四个通道名称可以分别如下:通道1:FAM;通道2:TET;通道3:ROX;通道4:CAL。通道即色带,具体为荧光色带。关于荧光色带的具体说明如下:本实施例中PCR的过程实际上全称为荧光定量PCR,它是通过在PCR反应体系中加入荧光基团,利用荧光信号积累实时监测整个PCR进程,最后通过标准曲线对未知模板进行定量分析。在峰图中看到的蓝色曲线、绿色曲线等,实际上就是通过蓝色荧光、绿色荧光跟相应的DNA片段相结合,然后通过测定其浓度,所绘制出来的曲线。FAM、TET、ROX、CAL是荧光标量的简称,其为业内的行业规范。具体的相关介绍如下表:
CFX96六通道激发、检测光谱设计:
Figure BDA00001967286600091
针对某个色带,具体转换方法如下:
1、寻找一个完整周期内的起始点和终止点,以所述起始点和终止点作为参考点得到拟合直线。其中,关于完整周期的定义:一个完整的周期就是实验出来的原始数据的起始点跟终止点的温度区间。该拟合直线的直线方程有点斜式方程、斜截式方程和两点式方程。在本实施例中使用的直线方程的表达式如下:(y-f(x1))/(x-x1)=(y-f(x2))/(x-x2)。
2、根据所述拟合直线对每个温度点进行强度值校正,将基线统一到X轴。对校正后的每个温度参考点的强度值定义如下计算方式:
新强度值=原强度值-拟合直线在该点的强度值。
基线校正将样本中所有的峰变换到统一坐标基线上,抵消了因为扩增不平衡所产生的误差。
三、小波变换:该步骤包括以下三部分。
(1)选取合适的小波基。在本发明实施例中,合适的定义是指:一个合适的小波基意味着使用该小波基变换之后,变换所得到曲线峰形明显且质量较高。不同的分析类型采取不同情况的小波基。本实施例选取的小波基表达式包括但不限定于如下表达式:
1 - x 2 16 e x 2 32
在本发明实施例中可以采用Haar小波函数、墨西哥草帽(Mexican hat)小波函、或者Morlet小波函数(Jean Morlet,1984年)。较佳地,在本发明一实施例中,采用墨西哥草帽(Mexican hat)小波函数。
Haar小波(Alfred Haar,1910年):
Figure BDA00001967286600102
墨西哥草帽(Mexican hat)小波: ψ ( t ) = 2 3 π - 1 / 4 ( 1 - t 2 ) e - t 2 / 2 ;
Morlet小波(Jean Morlet,1984年):
Figure BDA00001967286600104
关于上述三种小波函数,其中Haar小波基是阶跃函数,墨西哥草帽(Mexican hat)小波基函数是类高斯峰,Morlet小波基函数是一个主峰加若干个副峰。本算法需要解决的问题是将那些单个峰叠加而成的数据分离还原成各个单峰。故采用墨西哥草帽(Mexican hat)基函数最为恰当。
可选地,本发明实施例在如下三个方面对墨西哥小波基:
ψ ( t ) = 2 3 π - 1 / 4 ( 1 - ( t / n ) 2 ) e - ( t / n ) 2 / 2 进行了处理。
1、确定小波基系数;
因为该变换不考虑峰的高低,只考虑峰的位置与形状,因此我们将其系数
Figure BDA00001967286600106
用1进行代替。
2、在
Figure BDA00001967286600107
中选取小波形状参数n=4;
对于形如:
Figure BDA00001967286600111
的小波基而言,其峰形(宽度)由参数n所决定。由小波基函数的形式,我们可知,该基函数与x轴的交点坐标为(-n,0),(n,0)。图5为本发明实施例中当n为1、2、3、4、5的小波基函数的示意图。其中,标号51、52、53、54、55分别表示n=1、2、3、4、5对应的小波基函数的示意图。小波形状参数n的作用:定义峰的标准宽度,即是原始数据中区分单个峰和叠加峰的判断依据。
(2)选取合适的窗口。在本发明实施例中,合适的窗口就是使得变换出来的曲线能够对原始曲线图进行准确还原。也就是说选择的区域要刚好能够将影响当前点的附近的点包含进来,但是又要避免将非影响当前点的周边点包含进来。对于一个点而言本实施例在其左右36个点的范围内进行取样,以上只为示例,不是对本发明实施例的限制。
选取-36到36积分的原因如下:积分参数的作用效果是原始数据中该积分区间内的点对变换后某点的影响效果的累计范围。该范围如果过小,则进行变换后的数据会由于累计的点不足而无法正确分离出参与叠加的峰。若该范围过大,则会造成冗余计算,影响计算速度。考虑到原始数据的温度区间(仪器决定)为:35-85,步长为0.25左右(仪器决定)。36个点的温度范围为10左右,通过系统考查原始数据中典型宽峰的温度范围,其上限一般不会超过20,所以,当进行小波变换时,只考虑该坐标点左右温度跨度为10范围内的原始数据点已经足够。
(3)通过小波变换对该基线统一的曲线图进行转换。原始的曲线图:是根据直接从实验分析仪器出来的基因分型原始数据绘制的基因分型图。原始曲线图是根据实验数据直接绘制的,原始曲线图与实验数据是两个可以等位互换的概念。即实验得到的原始数据就是原始曲线图,而原始曲线图就是实验所得到的原始数据。对原始曲线图执行基线校正后得到基线统一的曲线图。本实施例采取的小波变换表达式如下:
∫ i - 36 i + 36 f ( x ) 1 - x 2 16 e x 2 32 dx
其中本实施例定义f(x)等于在x温度点处的强度值。i的取值范围是从有效温度阈的左阈值到右阈值。其中,i代表在原始曲线中当前需要计算的点的x坐标,x的取值范围从i-36到i+36,也就是i的左右36个点,因此点的间隔取决于自己定义的精度。通过小波变换,得到的结果是新的拟合曲线中每个点的坐标信息。
本实施例通过考虑一个点左右36个点来确定该点变换后的值。就其物理意义而言,本实施例将通过平衡左右3.6度范围内的点对该点影响,从而得到该点的实际强度。这样的变换存在以下几点优势:
(1)变换后的峰变的更加锐利,从而使得原始曲线的峰完成了有效分离;
(2)基线倾斜的现象被很好的消除,峰的轮廓得到了很好的还原;
(3)最大可能的减小了噪声。
四、结果展示:
本步骤进行峰形识别,通过GeneMarker软件成熟的峰形识别机制,本实施例能够有效的过滤stutter峰(影子峰或者聚合酶脱落产物),spike峰(钉子峰),以及pull up峰(拔起峰),最后对变换后的曲线进行峰形查找和标识,并同时将有效数据范围之外的曲线清零便于分析人员进行查看。在同时本实施例将对以下形式的峰进行自动删除:变换后的峰的位置在原始数据(曲线)处于波谷处。
通过以上步骤,本发明实施例很好地对原始数据进行了有效分离,将原始数据曲线中所蕴藏的峰显性的表示了出来。从实际例子来看,例如是将图2中的黑色曲线,转变为了图2中的虚线曲线。因为其本质是将一个出峰情况不明显的曲线转换成了一个出峰情况一目了然的曲线,因此本发明实施例称转换之后的曲线为分离结果。
根据识别出的峰可进行基因检测,包括:筛查突变,基因分型,SSR分析(Simple Sequence Repeat:简单重复序列),甲基化检测等。
以下举一个实际的例子对本发明实施例的上述方法做进一步说明。
图6为本发明实施例的原始数据和变换后的数据表。图6示出了一个Sample某个染色带的相关数据,其中抬头为“Y”的列表示原始强度值(即仪器测得的强度值),抬头为“Wavelet Y”的列表示小波变换后的强度值。
图7为本发明实施例的根据图6的数据绘制的相关峰图。如图7所示,其中深灰色实线曲线表示的是根据小波变换数据所绘制的峰图,浅灰色虚线曲线表示的原始曲线所对应的峰图。
图8为本发明实施例进行峰图识别的示意图。图8是图7的局部放大示意图,图8中多出的小灰柱是对实线曲线中相应峰的标识。其中虚线部分是原始数据的温度强度示意图(横坐标代表分析样本的退火温度,纵坐标代表DNA片段的荧光浓度),实线部分是采用该算法进行数据分离之后的结果。
图9为本发明实施例的一种基于小波分析法处理溶解曲线的装置的整体功能框图。如图9所示,该装置200包括:
预处理单元210,用于对实验数据进行预处理;
基线校正单元220,用于对预处理后的实验数据进行基线校正,获得基线统一的曲线图;
小波变换单元230,用于通过小波变换对所述基线统一的曲线图进行转换,获得用于最终识别的曲线图;峰识别及基因检测单元240,用于根据所述用于最终识别的曲线图进行峰识别,并根据识别出的峰进行基因检测。
图10为本发明实施例的一种基于小波分析法处理溶解曲线的装置的具体功能框图。在一实施例中,如图10所示,所述预处理单元210可以包括:采样间距归一化处理模块212,用于对实验数据进行采样间距归一化处理:数据周期扩展模块214,用于对采样间距归一化处理后的实验数据执行数据周期扩展。
在一实施例中,如图10所示,该装置200还可以包括:存储单元(图中未绘示),用于保存原始实验数据和经过预处理后所得到的实验数据。
在一实施例中,如图10所示,所述基线校正单元220可以包括:直线拟合模块222,用于寻找一个完整周期内的起始点和终止点,以所述起始点和终止点作为参考点得到拟合直线;基线统一模块224,用于根据所述拟合直线对每个温度点进行强度值校正,将基线统一到X轴。
所述基线统一模块224在根据所述拟合直线对每个温度点进行强度值校正是基于以下关系式:校正后的强度值=原强度值–拟合直线在该点的强度值。
在一实施例中,如图10所示,所述小波变换单元230可以包括:第一选取模块232,用于选取小波基;第二选取模块234,用于选取窗口;小波变换模块236,用于根据所述选取的小波基和选取的窗口,通过小波变换对所述基线统一的曲线图进行转换,获得用于最终识别的曲线图。
本发明实施例的装置的工作方法请详见上面的方法实施例,故在此不再详述。
本发明实施例还提供一种电子终端,所述电子终端包括以上的基于小波分析法处理溶解曲线的装置。所述电子终端为计算机、移动通信终端、个人数字助理PDA或者现场手持测量设备。进一步地,该电子终端还可以包括:通信单元,用于通过有线和/或无线的方式将所述基于小波分析法处理溶解曲线的装置处理后的峰图、或者与所述处理后的峰图对应的数据传输到外部的其他设备。
本发明的装置或终端能够根据原始数据曲线图,自动将峰进行有效分离。也就是说能够将原本看不出有几个峰而需要人为根据经验判断的曲线图,转变成峰识别度非常高的曲线图。这样大大提高了分析速度,并且减少了误判率,有利于提高基因检测的效率。
另外,在一些屏幕较小的手持测量设备或移动通信终端上,受显示屏幕或分辨率限制,人眼根据原始峰图无法清晰识别峰的位置,通过本发明实施例的装置可将出峰不明显的原始峰图转换为出峰识别更加清晰明显的转换后峰图,从而有利于提高峰识别的准确率和效率,并且能够将人员无法判断出的峰识别出来,防止了遗漏。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,或者二者的结合来实施。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该软件模块或计算机软件产品可以存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。存储介质可以是随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质。
以上实施例仅用以说明本发明实施例的技术方案,而非对其限制;尽管参照前述实施例对本发明实施例进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例各实施例技术方案的精神和范围。

Claims (15)

1.一种基于小波分析法处理溶解曲线的方法,其特征在于,所述方法包括:
对实验数据进行预处理;
对预处理后的实验数据进行基线校正,获得基线统一的曲线图;
通过小波变换对所述基线统一的曲线图进行转换,获得用于最终识别的曲线图;
根据所述用于最终识别的曲线图进行峰识别,并根据识别出的峰进行基因检测。
2.根据权利要求1所述的方法,其特征在于,所述对实验数据进行预处理包括:
对实验数据进行采样间距归一化处理;
对采样间距归一化处理后的实验数据执行数据周期扩展。
3.根据权利要求2所述的方法,其特征在于,在所述对采样间距归一化处理后的实验数据执行数据周期扩展之后,所述方法还包括:保存原始实验数据和经过预处理后所得到的实验数据。
4.根据权利要求1所述的方法,其特征在于,所述对预处理后的实验数据进行基线校正包括:
寻找一个完整周期内的起始点和终止点,以所述起始点和终止点作为参考点得到拟合直线;
根据所述拟合直线对每个温度点进行强度值校正,将基线统一到X轴。
5.根据权利要求4所述的方法,其特征在于,所述根据所述拟合直线对每个温度点进行强度值校正是基于以下关系式:
校正后的强度值=原强度值-拟合直线在该点的强度值。
6.根据权利要求1所述的方法,其特征在于,所述通过小波变换对所述基线统一的曲线图进行转换,获得用于最终识别的曲线图包括:
选取小波基;
选取窗口;
根据所述选取的小波基和选取的窗口,通过小波变换对所述基线统一的曲线图进行转换,获得用于最终识别的曲线图。
7.一种基于小波分析法处理溶解曲线的装置,其特征在于,所述装置包括:
预处理单元,用于对实验数据进行预处理;
基线校正单元,用于对预处理后的实验数据进行基线校正,获得基线统一的曲线图;
小波变换单元,用于通过小波变换对所述基线统一的曲线图进行转换,获得用于最终识别的曲线图;
峰识别及基因检测单元,用于根据所述用于最终识别的曲线图进行峰识别,并根据识别出的峰进行基因检测。
8.根据权利要求7所述的装置,其特征在于,所述预处理单元包括:
采样间距归一化处理模块,用于对实验数据进行采样间距归一化处理:
数据周期扩展模块,用于对采样间距归一化处理后的实验数据执行数据周期扩展。
9.根据权利要求7所述的装置,其特征在于,所述装置还包括:
存储单元,用于保存原始实验数据和经过预处理后所得到的实验数据。
10.根据权利要求7所述的装置,其特征在于,所述基线校正单元包括:
直线拟合模块,用于寻找一个完整周期内的起始点和终止点,以所述起始点和终止点作为参考点得到拟合直线;
基线统一模块,用于根据所述拟合直线对每个温度点进行强度值校正,将基线统一到X轴。
11.根据权利要求10所述的装置,其特征在于,所述基线统一模块在根据所述拟合直线对每个温度点进行强度值校正是基于以下关系式:校正后的强度值=原强度值–拟合直线在该点的强度值。
12.根据权利要求7所述的装置,其特征在于,所述小波变换单元包括:
第一选取模块,用于选取小波基;
第二选取模块,用于选取窗口;
小波变换模块,用于根据所述选取的小波基和选取的窗口,通过小波变换对所述基线统一的曲线图进行转换,获得用于最终识别的曲线图。
13.一种电子终端,其特征在于,所述电子终端包括权利要求7-12中任一项所述的基于小波分析法处理溶解曲线的装置。
14.根据权利要求13所述的电子终端,其特征在于,所述电子终端为计算机、移动通信终端、个人数字助理PDA或现场手持测量设备。
15.根据权利要求13所述的电子终端,其特征在于,所述电子终端包括:
通信单元,用于通过有线和/或无线的方式将所述基于小波分析法处理溶解曲线的装置处理后的用于最终识别的曲线图、或者与所述用于最终识别的曲线图对应的数据传输到外部的其他设备。
CN201210273620.3A 2012-08-02 2012-08-02 基于小波分析法处理溶解曲线的方法、装置和电子终端 Expired - Fee Related CN102880812B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210273620.3A CN102880812B (zh) 2012-08-02 2012-08-02 基于小波分析法处理溶解曲线的方法、装置和电子终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210273620.3A CN102880812B (zh) 2012-08-02 2012-08-02 基于小波分析法处理溶解曲线的方法、装置和电子终端

Publications (2)

Publication Number Publication Date
CN102880812A true CN102880812A (zh) 2013-01-16
CN102880812B CN102880812B (zh) 2016-08-03

Family

ID=47482134

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210273620.3A Expired - Fee Related CN102880812B (zh) 2012-08-02 2012-08-02 基于小波分析法处理溶解曲线的方法、装置和电子终端

Country Status (1)

Country Link
CN (1) CN102880812B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106591443A (zh) * 2016-12-05 2017-04-26 北京华生恒业科技有限公司 一种分析处理农作物荧光毛细管电泳图谱的方法
CN109993336A (zh) * 2017-12-29 2019-07-09 广州潽蓝信息科技有限公司 基于小波分析的金融投资数据突变分析方法及其系统
WO2019145303A1 (en) 2018-01-23 2019-08-01 Biocartis Nv Methods for the analysis of dissociation melt curve data
CN112342282A (zh) * 2020-08-25 2021-02-09 杭州博日科技股份有限公司 荧光定量的指标确定方法
CN112836587A (zh) * 2021-01-08 2021-05-25 中国商用飞机有限责任公司北京民用飞机技术研究中心 跑道识别方法、装置、计算机设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1792319A (zh) * 2005-11-03 2006-06-28 浙江大学 中医脉象特征参数自动检测方法
US20080109174A1 (en) * 2006-11-07 2008-05-08 Chau Foo-Tim Data processing method based on wavelet transform and its application in classification of herbal medicines
CN101919695A (zh) * 2010-08-06 2010-12-22 李楚雅 一种基于小波变换的心电信号qrs波检测方法
CN102046807A (zh) * 2008-04-24 2011-05-04 3M创新有限公司 利用小波变换分析核酸扩增曲线

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1792319A (zh) * 2005-11-03 2006-06-28 浙江大学 中医脉象特征参数自动检测方法
US20080109174A1 (en) * 2006-11-07 2008-05-08 Chau Foo-Tim Data processing method based on wavelet transform and its application in classification of herbal medicines
CN102046807A (zh) * 2008-04-24 2011-05-04 3M创新有限公司 利用小波变换分析核酸扩增曲线
CN101919695A (zh) * 2010-08-06 2010-12-22 李楚雅 一种基于小波变换的心电信号qrs波检测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
熊智新: "基于小波变换胡化学谱图数据处理", 《中国博士论文全文数据库》 *
蔡涛等: "基于多尺度小波变换的红外光谱谱峰识别算法", 《分析化学》 *
陆英北等: "基于小波变换的心电信号基线矫正方法", 《北京生物医学工程》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106591443A (zh) * 2016-12-05 2017-04-26 北京华生恒业科技有限公司 一种分析处理农作物荧光毛细管电泳图谱的方法
CN106591443B (zh) * 2016-12-05 2017-11-28 北京华生恒业科技有限公司 一种分析处理农作物荧光毛细管电泳图谱的方法
CN109993336A (zh) * 2017-12-29 2019-07-09 广州潽蓝信息科技有限公司 基于小波分析的金融投资数据突变分析方法及其系统
WO2019145303A1 (en) 2018-01-23 2019-08-01 Biocartis Nv Methods for the analysis of dissociation melt curve data
CN111868256A (zh) * 2018-01-23 2020-10-30 比奥卡尔齐斯股份有限公司 用于分析解离解链曲线数据的方法
CN112342282A (zh) * 2020-08-25 2021-02-09 杭州博日科技股份有限公司 荧光定量的指标确定方法
CN112836587A (zh) * 2021-01-08 2021-05-25 中国商用飞机有限责任公司北京民用飞机技术研究中心 跑道识别方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN102880812B (zh) 2016-08-03

Similar Documents

Publication Publication Date Title
Butler Fundamentals of forensic DNA typing
CN101401101B (zh) 用于通过谱分析鉴定dna模式的方法和系统
EP2749655B2 (en) Single cell classification method, gene screening method and device thereof
CN102880812A (zh) 基于小波分析法处理溶解曲线的方法、装置和电子终端
EP1774323B1 (en) Automated analysis of multiplexed probe-traget interaction patterns: pattern matching and allele identification
US20180018422A1 (en) Systems and methods for nucleic acid-based identification
CN102682224B (zh) 检测拷贝数变异的方法和装置
Jordan et al. Past, present, and future of DNA typing for analyzing human and non-human forensic samples
CN102332064B (zh) 基于基因条形码的生物物种识别方法
KR102447812B1 (ko) 서열-특정 오류(sse)를 유발시키는 서열 패턴을 식별하기 위한 심층 학습-기반 프레임워크
CN111088382B (zh) 一种玉米全基因组snp芯片及其应用
CN110692101A (zh) 用于比对靶向的核酸测序数据的方法
Snedecor et al. Fast and accurate kinship estimation using sparse SNPs in relatively large database searches
JP2023535262A (ja) 拡張畳み込みニューラルネットワークを備えたベースコーラー
US20160103954A1 (en) Biological sequence variant characterization
CN110444253B (zh) 一种适用于混池基因定位的方法及系统
US11475980B2 (en) Methods of analyzing massively parallel sequencing data
CN105528532A (zh) 一种rna编辑位点的特征分析方法
CN104531844B (zh) 一种基于ssr基因型的果树品种区分及特征指纹展示方法
US20160103955A1 (en) Biological sequence tandem repeat characterization
CN112885407B (zh) 一种基于二代测序的微单倍型检测分型系统和方法
CN101984446B (zh) 基于亲缘相关系数的共显性分子标记遗传相似指数估计方法
CN111118168B (zh) 用于推断中国西北和毗邻中亚国家主体民族的snp标记组合
CN113035274A (zh) 一种基于nmf的肿瘤基因点突变的特征图谱提取算法
CN111584085A (zh) 基于基因及信号通路的蛛网膜下腔出血预测模型建立方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: JIANGSU TODAYSOFT TECHNOLOGY CO., LTD.

Effective date: 20130801

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20130801

Address after: 100083 Beijing City, Haidian District Zhongguancun Road No. 18 smartfortune International Building, block C room 1511

Applicant after: Beijing Huasheng Hengye Technology Co.,Ltd.

Applicant after: JIANGSU TODAYSOFT TECHNOLOGY Co.,Ltd.

Address before: 100083 Beijing City, Haidian District Zhongguancun Road No. 18 smartfortune International Building, block C room 1511

Applicant before: Beijing Huasheng Hengye Technology Co.,Ltd.

ASS Succession or assignment of patent right

Owner name: JIANGSU TODAYSOFT TECHNOLOGY CO., LTD.

Free format text: FORMER OWNER: BEIJING TODAYSOFT TECHNIQUE INCO.

Effective date: 20140721

Free format text: FORMER OWNER: JIANGSU TODAYSOFT TECHNOLOGY CO., LTD.

Effective date: 20140721

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 100083 HAIDIAN, BEIJING TO: 224007 YANCHENG, JIANGSU PROVINCE

TA01 Transfer of patent application right

Effective date of registration: 20140721

Address after: 701 room 4, building 5, 224007 South Avenue, hope road, Yancheng City economic and Technological Development Zone, Jiangsu, China

Applicant after: JIANGSU TODAYSOFT TECHNOLOGY Co.,Ltd.

Address before: 100083 Beijing City, Haidian District Zhongguancun Road No. 18 smartfortune International Building, block C room 1511

Applicant before: Beijing Huasheng Hengye Technology Co.,Ltd.

Applicant before: JIANGSU TODAYSOFT TECHNOLOGY Co.,Ltd.

C53 Correction of patent of invention or patent application
CB02 Change of applicant information

Address after: 701 room 4, building 5, 224007 South Avenue, hope road, Yancheng City economic and Technological Development Zone, Jiangsu, China

Applicant after: JIANGSU TODAYSOFT TECHNOLOGY Co.,Ltd.

Address before: 701 room 4, building 5, 224007 South Avenue, hope road, Yancheng City economic and Technological Development Zone, Jiangsu, China

Applicant before: JIANGSU TODAYSOFT TECHNOLOGY Co.,Ltd.

COR Change of bibliographic data

Free format text: CORRECT: APPLICANT; FROM: JIANGSU TODAYSOFT TECHNOLOGY CO., LTD. TO: JIANGSU HUASHENG HENGYE TECHNOLOGY CO., LTD.

CB02 Change of applicant information

Address after: 701 room 4, building 5, 224007 South Avenue, hope road, Yancheng City economic and Technological Development Zone, Jiangsu, China

Applicant after: JIANGSU HUASHENG GENE DATA TECHNOLOGY Co.,Ltd.

Address before: 701 room 4, building 5, 224007 South Avenue, hope road, Yancheng City economic and Technological Development Zone, Jiangsu, China

Applicant before: JIANGSU TODAYSOFT TECHNOLOGY Co.,Ltd.

COR Change of bibliographic data
C14 Grant of patent or utility model
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Method and device for processing solubility curve based on wavelet analysis method, and electronic terminal

Effective date of registration: 20190709

Granted publication date: 20160803

Pledgee: Chen Guitai

Pledgor: JIANGSU HUASHENG GENE DATA TECHNOLOGY Co.,Ltd.

Registration number: 2019320000317

PP01 Preservation of patent right
PP01 Preservation of patent right

Effective date of registration: 20191112

Granted publication date: 20160803

PD01 Discharge of preservation of patent
PD01 Discharge of preservation of patent

Date of cancellation: 20221112

Granted publication date: 20160803

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160803