CN103559428A - 一种基于dna测序峰形图定量分析碱基变异比例的方法 - Google Patents

一种基于dna测序峰形图定量分析碱基变异比例的方法 Download PDF

Info

Publication number
CN103559428A
CN103559428A CN201310473434.9A CN201310473434A CN103559428A CN 103559428 A CN103559428 A CN 103559428A CN 201310473434 A CN201310473434 A CN 201310473434A CN 103559428 A CN103559428 A CN 103559428A
Authority
CN
China
Prior art keywords
peak
image
color
dna sequencing
line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310473434.9A
Other languages
English (en)
Inventor
刘国庆
钱俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southern Medical University
Original Assignee
Southern Medical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southern Medical University filed Critical Southern Medical University
Priority to CN201310473434.9A priority Critical patent/CN103559428A/zh
Publication of CN103559428A publication Critical patent/CN103559428A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种基于DNA测序峰形图定量分析碱基变异比例的方法,该方法是根据DNA测序图,对有特定意义的碱基变异点,进行计算该点双峰图形里的每一峰形曲线下的像素点数总和,即为该峰形曲线的面积。再计算出该两个峰形图的面积比值,即为DNA碱基变异的具体比例。

Description

一种基于DNA测序峰形图定量分析碱基变异比例的方法
技术领域
本发明涉及一种定量分析DNA碱基变异比例的方法,具体涉及一种基于DNA测序峰形图定量分析碱基变异比例的方法。 
背景技术
目前,关于碱基变异,大多是进行变异的定性分析,尚未报道变异比例的定量分析。如CN101250581B一种检测乙型肝炎病毒P基因YMDD变异的置换扩增法公开了通过置换扩增法检测乙型肝炎病毒(HBV)P基因YMDD的变异,该方法适合单碱基变异的定性分析,虽然可结合SYBR Green染料或荧光分子探针联用,用于单个待测基因的定量分析,但操作流程复杂、实验条件苛刻、精确度不高、成本高等。由于商业化DNA测序技术的进步和普及,价廉物美的DNA测序已经成为基因分析的常用手段。通过DNA测序图,可以直接判读出碱基变异及其位置,而运用本发明,可简便地进行碱基变异比例的定量分析。
发明内容
本发明的目的在于提供一种基于DNA测序峰形图定量分析碱基变异比例的方法。
本发明所采取的技术方案是:
一种基于DNA测序峰形图定量分析碱基变异比例的方法,包含以下步骤:
1)截取图像:在打开的DNA测序峰形图中,找到碱基变异处的双峰形图,然后用GetDC(0)函数获取屏幕对像句柄,用BitBlt( )函数截取双峰图形,并将其传递给图像框控件进行显示,显示的图像保存为BMP图像文件;
2)图像数据读入:读入BMP图像文件,并保存到一个可变长的字节数组变量中;
3)清除噪音线条:用鼠标点击该噪音线条,在鼠标的点击事件里,使用GetDC(0)函数获得屏幕句柄后,用GetPixel( )函数获取鼠标点击处的颜色值,将噪音线条上的像素点的数据,设置为同背景色一样的白色;
4)补齐线条:被清除的线条与其他线有交叉,则它在被清除后,使剩下的线条在交叉处形成断裂,将该处颜色设置为与剩下线条相同的颜色;
5)计算峰形图像面积:计算峰形曲线与下边黑色横线所围成的封闭区域里的像素点数总和,含曲线本身,像素点的总和即可表示峰形图的面积,双峰形图处的两个峰形图面积的比例即为碱基变异的比例。
进一步的,所述的BMP图像文件为用SavePicture命令保存的24位BMP位图格式的图像文件。
进一步的,步聚2)中所述的可变长的字节数组变量所包含的数据分为两部分,前一部分称为BMP文件头,后一部分称为数据区。
进一步的,步聚3)中所述的噪音线条的颜色与峰形曲线颜色不一致时,使用循环语句,在存放图像的字节数组变量里,将所有与噪音线条颜色值相同的像素点三个颜色分量数据设置为255。
进一步的,步聚3)中所述的噪音线条的颜色与峰形曲线颜色一致时,可按下鼠标左键,并拖动鼠标画出一个小框,将噪音线条圈住,然后在鼠标左键的弹起事件里,使用循环语句,对画出的框内,所有与噪音线条颜色值相同的像素点三个颜色分量数据设置为255。
进一步的,所有的程序语言是基于Visual Basic6.0进行的。
本发明的有益效果是:
本发明基于DNA测序峰形图,可直接找出相关碱基的变异及位点,根据突变碱基位点处不同峰形的面积比,可简便、快速得出该碱基变异比例的定量结果。在普通PCR 测序的基础上进行碱基变异比例的定量分析,无需额外的设备与试剂,故成本低廉、应用前景好。
本发明可应用于HBV耐药治疗研究中,定量分析耐药株/野生株的比例,这对临床抗病毒治疗具有重要意义,可指导临床医师及时采取有效措施避免或减轻临床耐药带来的负面影响。本发明也可用于确定丙型肝炎病毒(HCV)的准种数和优势准种,这对临床研究和治疗HCV具有重要意义。
在本发明中,采用VB(Visual Basic)进行软件开发,其不但具有良好的界面设计能力,而且编程工作量较小,开发周期短,特别适合生物技术领域的相关软件研发工作。
附图说明
图1是DNA测序峰形图;
图2是截图区域示意图;
图3是峰形放大图;
图4是含噪音峰线的双峰图形;
图5是去掉噪音峰线后有断裂的双峰图形;
图6是图像坐标与数组变量下标对应关系示意图;
图7是修补好断裂后的峰形图;
图8是本发明方法的流程图。
具体实施方式
对本发明可的相关控件、变量等的描述是基于Visual Basic6.0进行的。
下面结合具本实施例对本发明作进一步说明,但并不局限于此。  
实施例1 
一、打开DNA测序峰形图
慢性乙肝患者长期使用口服核苷酸类似物(如拉米夫定)治疗,HBV会发生碱基突变使其产生耐药性。例如图1中用Chromas软件打开HBV DNA测序峰形图,图1中箭头有一双峰图,所指的碱基C的峰形图下产生了另一个碱基A的峰形图,它就是由碱基C变异产生的。开发碱基变异比例定量识别软件的目的是计算同一碱基位点下,DNA 峰形图中不同曲线下的面积比,从而得出该碱基变异比例大小。计算面积的方法是求峰形曲线下的像素点数,在Chromas 中不管图像XY方向的显示比例如何调整,每一峰形曲线下的面积虽然会变化,但它们的面积比值是恒定的。
二、截取图像
找到需要分析的双峰形图后,用GetDC(0)函数获取屏幕对像句柄后,用BitBlt( )函数截取屏幕上处适当区域的图像,如图2所示,所截取区域以恰好显示出双峰图形为准,上边显示出峰顶,下边包含基底黑线,左右恰好在双峰形图与基底黑线交界处,然后将其传递给图像框控件进行显示,显示的图像用SavePicture命令保存为24位BMP位图格式的图像文件。
三、图像数据读入
读入BMP图像文件,并保存到一个可变长的字节数组变量中,该数组变量里的数据分为两部分,前一部分称为BMP文件头,存放的此图像文件的相关属性信息,如图像宽度、高度、文件大小、数据区偏移量等等;后一部分称为数据区,存放的图像每个像素点三原色的数据,它是由相邻3个字节来表示,分别表示红、绿、篮三种颜色分量。对图像进行处理的时候,实际上是对每个像素三个字节的数据进行赋值,以改变它的颜色。
在数据区里,图像的每个像素点数据的存放顺序是:图像中,从左到右、从下往上的方向依次读入每个像素点的三个颜色数据到数组里。
四、图像显示
在处理图像时,需要通过鼠标点击线条,以获取该线条的颜色值。由于线条很细,宽度仅一个像素,很难用鼠标点中。解决方法是采用图像控件显示图像,该控件有“拉伸”属性,使所显示的图像以拉伸的方式放大,将一个像素点放大为足够大的小长方块,便于鼠标点击线条,获取该线条的颜色值,如图3所示。
五、清除噪音线条
在双峰图形上很可能会混杂入相邻峰形线条,或噪音线条,即峰形基底部的杂乱细小峰线,它是测序过程中出现的微弱背景或本底峰线,如图4所示。为了便于计算峰形曲线下的面积,需要把多余线条清除掉。
用鼠标点击该噪音线条,在鼠标的点击事件里,使用GetDC(0)函数获得屏幕句柄后,用GetPixel( )函数获取鼠标点击处的颜色值。将噪音线条上的像素点的数据,设置为同背景色一样的白色,即将该线条上每个像素点的三个颜色分量数据设置为255,即获得去掉噪音峰线后有断裂的双峰图形如图5。
当噪音线条的颜色与峰形曲线颜色不一致时,使用循环语句,在存放图像的字节数组变量里,将所有与噪音线条颜色值相同的像素点三个颜色分量数据设置为255。
当噪音线条的颜色与峰形曲线颜色一致时,可按下鼠标左键,并拖动鼠标画出一个小框,将噪音线条圈住,然后在鼠标左键的弹起事件里,使用循环语句,对刚才画出的框内,所有与噪音线条颜色值相同的像素点三个颜色分量数据设置为255。
六、补齐断裂峰线
如果被清除的线条与其他线有交叉,则它在被清除后,会使剩下的线条在交叉处形成断裂,如图5所示,左下部分就形成了线条断裂。为了准确地计算曲线下面积,需要将该断裂处补上,这在程序实现上需要一定的技巧。
修复断裂峰线时,首先获取要修补线条的颜色,与第4)步中的方法相同。
修补断裂峰线时,需先得到断裂处的像素点在字节数组变量中对应数据的位置,即数组的下标。由于图像数据是按图像中,从左到右、从下往上的方向依次读入到数组里,因此,图像中某点的坐标(x,y)与数组变量中的下标有着如图7所示的对应关系。
图像的读取顺序以及每个像素点的颜色值占3个字节,可得出该点在字节数组中的存放位置为:
该点颜色数据的第1字节下标:                                               
Figure 2013104734349100002DEST_PATH_IMAGE002
该点颜色数据的第2字节下标:
Figure 2013104734349100002DEST_PATH_IMAGE004
该点颜色数据的第3字节下标:
Figure 2013104734349100002DEST_PATH_IMAGE006
其中,offset是图像数据的偏移量,即字节数组变量中,数据区的起始位置下标值。
在得到该像素点在数组变量中对应的3个下标后,将这3个字节所表示的颜色值设置为要补齐的线条颜色值即可。图5中的断裂峰线,修补好后的图如图8所示。
七、计算峰形图像面积
首先找到图像中,水平方向的黑色基线的位置,即其Y坐标(像素单位),然后使用二重循环语句,从图像的左边到右边,依次计算每一列像素点上,曲线到黑色基线的像素点数(含曲线本身的像素点),将其进行累加,最终得出峰形曲线下的像素点数总和,用来表示峰形图的面积。求出双峰图形中两个峰形下的面积后,它们比值即是该处碱基变异的比例值。

Claims (6)

1.一种基于DNA测序峰形图定量分析碱基变异比例的方法,其特征在于:包含以下步骤:
1)截取图像:在打开的DNA测序峰形图中,找到碱基变异处的双峰形图,然后用GetDC(0)函数获取屏幕对像句柄,用BitBlt( )函数截取双峰图形,并将其传递给图像框控件进行显示,显示的图像保存为BMP图像文件;
2)图像数据读入:读入BMP图像文件,并保存到一个可变长的字节数组变量中;
3)清除噪音线条:用鼠标点击该噪音线条,在鼠标的点击事件里,使用GetDC(0)函数获得屏幕句柄后,用GetPixel( )函数获取鼠标点击处的颜色值,将噪音线条上的像素点的数据,设置为同背景色一样的白色;
4)补齐线条:被清除的线条与其他线有交叉,则它在被清除后,使剩下的线条在交叉处形成断裂,将该处颜色设置为与剩下线条相同的颜色;
5)计算峰形图像面积:计算峰形曲线与下边黑色横线所围成的封闭区域里的像素点数总和,含曲线本身,像素点的总和即可表示峰形图的面积,双峰形图处的两个峰形图面积的比例即为碱基变异的比例。
2.根据权利要求1所述的一种基于DNA测序峰形图定量分析碱基变异比例的方法,其特征在于:步聚1)和2)中所述的BMP图像文件为用SavePicture命令保存的24位BMP位图格式的图像文件。
3.根据权利要求1所述的一种基于DNA测序峰形图定量分析碱基变异比例的方法,其特征在于:步聚2)中所述的可变长的字节数组变量所包含的数据分为两部分,前一部分称为BMP文件头,后一部分称为数据区。
4.根据权利要求1所述的一种基于DNA测序峰形图定量分析碱基变异比例的方法,其特征在于:步聚3)中所述的噪音线条的颜色与峰形曲线颜色不一致时,使用循环语句,在存放图像的字节数组变量里,将所有与噪音线条颜色值相同的像素点三个颜色分量数据设置为255。
5.根据权利要求1所述的一种基于DNA测序峰形图定量分析碱基变异比例的方法,其特征在于:步聚3)中所述的噪音线条的颜色与峰形曲线颜色一致时,可按下鼠标左键,并拖动鼠标画出一个小框,将噪音线条圈住,然后在鼠标左键的弹起事件里,使用循环语句,对画出的框内,所有与噪音线条颜色值相同的像素点三个颜色分量数据设置为255。
6.根据权利要求1、2、3、4或5所述一种基于DNA测序峰形图定量分析碱基变异比例的方法,其特征在于:所有的程序语言是基于Visual Basic6.0进行的。
CN201310473434.9A 2013-10-11 2013-10-11 一种基于dna测序峰形图定量分析碱基变异比例的方法 Pending CN103559428A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310473434.9A CN103559428A (zh) 2013-10-11 2013-10-11 一种基于dna测序峰形图定量分析碱基变异比例的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310473434.9A CN103559428A (zh) 2013-10-11 2013-10-11 一种基于dna测序峰形图定量分析碱基变异比例的方法

Publications (1)

Publication Number Publication Date
CN103559428A true CN103559428A (zh) 2014-02-05

Family

ID=50013674

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310473434.9A Pending CN103559428A (zh) 2013-10-11 2013-10-11 一种基于dna测序峰形图定量分析碱基变异比例的方法

Country Status (1)

Country Link
CN (1) CN103559428A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040024532A1 (en) * 2002-07-30 2004-02-05 Robert Kincaid Method of identifying trends, correlations, and similarities among diverse biological data sets and systems for facilitating identification
WO2010083331A1 (en) * 2009-01-14 2010-07-22 Johanna Craig Integrated desktop software for management of virus data
CN103106353A (zh) * 2013-02-07 2013-05-15 艾云灿 一种基因组序列的指纹特征曲线的构造方法
CN103279652A (zh) * 2013-05-13 2013-09-04 浙江大学 一种基于蜂群行为的dna遗传算法的复杂化工过程建模方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040024532A1 (en) * 2002-07-30 2004-02-05 Robert Kincaid Method of identifying trends, correlations, and similarities among diverse biological data sets and systems for facilitating identification
WO2010083331A1 (en) * 2009-01-14 2010-07-22 Johanna Craig Integrated desktop software for management of virus data
CN103106353A (zh) * 2013-02-07 2013-05-15 艾云灿 一种基因组序列的指纹特征曲线的构造方法
CN103279652A (zh) * 2013-05-13 2013-09-04 浙江大学 一种基于蜂群行为的dna遗传算法的复杂化工过程建模方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
刘国庆等: "HBV和HCV变异比例分析软件设计", 《计算机工程与设计》, vol. 31, no. 21, 16 November 2010 (2010-11-16) *
刘国庆等: "基因序列拼接算法设计", 《计算机应用与软件》, vol. 27, no. 5, 15 May 2010 (2010-05-15), pages 24 - 26 *
廖绍雯等: "浅谈VB程序界面设计", 《河西学院学报》, vol. 22, no. 2, 25 April 2006 (2006-04-25), pages 78 - 80 *
王勇: "应用VB语言开发计算机读图软件", 《计算机与应用化学》, vol. 21, no. 3, 28 May 2004 (2004-05-28), pages 478 - 481 *

Similar Documents

Publication Publication Date Title
CN104484659A (zh) 一种对医学彩色和灰阶图像自动识别及校准的方法
CN104616275A (zh) 一种缺陷检测方法和装置
CN106855951A (zh) 一种基于计算机视觉的粮种品质检测方法
WO2020155043A1 (zh) 荧光图像配准方法、基因测序仪及系统、存储介质
CN106845545B (zh) 数字式电测仪表自动检定装置中的图像识别方法及装置
JP5339065B2 (ja) 対象物追跡装置
WO2019196019A1 (zh) 荧光图像配准方法、基因测序仪及系统、存储介质
JP2010119314A (ja) 細胞画像解析装置
CN113222913A (zh) 一种电路板缺陷检测定位方法、装置和存储介质
CN110569774A (zh) 基于图像处理与模式识别的折线图图像自动数字化方法
CN110910414B (zh) 图像轮廓生成方法、图像标注方法、电子装置及存储介质
CN103340600B (zh) 监护仪上波形失真处理方法及处理系统
JP5780791B2 (ja) 細胞の追跡処理方法
CN105719296B (zh) 基于地址-事件表示的高速图像二值连通域标记方法
CN101178810A (zh) 图像处理装置、图像的登录方法
Kang et al. Dental plaque quantification using mean-shift-based image segmentation
CN103559428A (zh) 一种基于dna测序峰形图定量分析碱基变异比例的方法
CN107833631A (zh) 一种医学影像计算机辅助分析方法
CN116884036A (zh) 基于YOLOv5DA的生猪姿态检测方法、装置、设备及介质
CN106339721A (zh) 一种仪表面板读数自动识别方法
JP4759957B2 (ja) 検査・計測用プログラムの作成方法並びにそのプログラムを作成するためのコンピュータプログラム及び検査・計測用プログラムの作成装置
CN114022415B (zh) 一种基于单像素特征聚类建立集群的液晶屏缺陷检测方法
US5904822A (en) Methods and apparatus for analyzing electrophoresis gels
CN103593667A (zh) 基于集合连通性原理的图像异物快速识别方法
CN118552952A (zh) 基于图像处理与生物信息修正的浮游生物检测方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20140205

RJ01 Rejection of invention patent application after publication