CN114187228A - 一种基于svm的数字pcr假阳性液滴检测方法 - Google Patents

一种基于svm的数字pcr假阳性液滴检测方法 Download PDF

Info

Publication number
CN114187228A
CN114187228A CN202111145778.8A CN202111145778A CN114187228A CN 114187228 A CN114187228 A CN 114187228A CN 202111145778 A CN202111145778 A CN 202111145778A CN 114187228 A CN114187228 A CN 114187228A
Authority
CN
China
Prior art keywords
droplets
gray
num
value
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111145778.8A
Other languages
English (en)
Inventor
夏江
高鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pilot Gene Technologies Hangzhou Co ltd
Original Assignee
Pilot Gene Technologies Hangzhou Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pilot Gene Technologies Hangzhou Co ltd filed Critical Pilot Gene Technologies Hangzhou Co ltd
Priority to CN202111145778.8A priority Critical patent/CN114187228A/zh
Publication of CN114187228A publication Critical patent/CN114187228A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/187Segmentation; Edge detection involving region growing; involving region merging; involving connected component labelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30108Industrial image inspection
    • G06T2207/30148Semiconductor; IC; Wafer

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种基于SVM的数字PCR假阳性液滴检测方法,属于图像处理技术领域。包括以下步骤:S1:构建样本库并基于SVM训练样本;S2:液滴图片二值化;S3:连通域处理;S4:判断液滴假阳性。本发明将数字PCR检测方法与图像处理和机器学习的方法相结合,能够准确识别假阳性和真阳性,极大地提升了数字PCR检测的灵敏度和准确度,具有广泛的应用前景。

Description

一种基于SVM的数字PCR假阳性液滴检测方法
技术领域
本发明属于图像处理技术领域,具体涉及一种基于SVM的数字PCR假阳性液滴检测方法。
背景技术
聚合酶链式反应(PCR)是一种生物体外实现特定DNA片段扩增的技术。它具有操作简便、检测灵敏、特异性强等特点,广泛用于临床诊断、法医学调查、生物技术等领域。
数字PCR基于聚合酶链式反应的原理精确的测定基因拷贝数,实现对基因突变定性和定量分析。微滴式数字PCR系统是用油水两相间隔得到的液滴当作微反应单元,将DNA或 RNA样本稀释并分散成数万甚至数百万个独立的反应单元,每个反应单元中包含(或不包含) 1个或1个以上目标分子(DNA或RNA模板)。微反应单元单层平铺于芯片内,将芯片放入升降温装置,针对所有的微反应单元的靶序列进行分子模板PCR扩增,扩增过程中微反应单元的荧光强度不断增强,完成扩增后。
CCD或者CMOS相机在光学成像系统中采集用于特定基因片段标记的荧光探针信号,依据荧光信号强弱判断微反应单元的阳性或阴性,最终基于统计学分析(泊松分布)检测样本中核苷酸的浓度。数字PCR不依赖扩增曲线的循环阈值,不受扩增效率的影响,能够直接读出DNA分子的个数,是一种核酸分子绝对定量技术。
发明内容
微滴式数字PCR低浓度(阳性点数量少)条件下具有极好的灵敏度和准确度。由于在实验室污染或者操作员操作有误,导致配置的试剂可能混入杂质。由于芯片生成过程中质控不严格,导致芯片表面出现划痕。由于清洗不干净或者静电,导致滤波器等成像系统出现粉尘。上述现象在液滴图片形成类似液滴轮廓的异常区域,这些区域可能误判为阳性液滴,影响数字PCR检测的灵敏度和准确度。本发明采用图像处理和机器学习的方法检测这些异常区域,能够准确识别假阳和真阳。
本发明的第一个方面公开了一种基于SVM的数字PCR假阳性液滴检测方法,包括以下步骤:
S1:构建样本库并基于SVM训练样本
S11:更换不同的滤光片和光源拍摄不同条件下的微液滴图片。拍摄芯片表面有缺陷的液滴图片。
S12:截取完整的液滴组成正样本库,归一化为同一尺寸24*24;负样本是芯片表面缺陷导致的“高亮点”、“划痕”、“凹凸点”等情况,负样本归一化为同一尺寸24*24;采用旋转等方法扩增样本量。
S13:计算样本的特征值,基于HOG特征算子计算样本的特征值,其中HOG检测窗口的大小为24*24,窗口滑动块的大小为8*8,滑动块的步长为2,细胞单元的大小为4*4,直方图的bins的数量为9个,特征值的维数为3888。设Si表示第i样本, 0≤i≤NUM_sample,NUM_sample,表示正负样本的总数;
Figure BDA0003285371220000021
表示第i样本第k维的特征值, 0≤k≤3888。对于液滴的正、负样本集(S0,CL0)…,(Si,CLi),...,(SNUM_sample,CLNUM_sample),其中Si表示第i样本,CLi=-1表示负样本,CLi=1表示正样本。
S14:生成训练分类器,样本的特征值导入支持向量机训练,生成分类器SVM_class.xml 文件,其中选择二分类的SVM,核函数为线性核函数,惩罚因子为1,循环迭代的次数为10000。
优选地,对S12中的正样本用高斯滤波处理,对S12中的负样本进行直方图均衡化。
S2:液滴图片二值化
S21:设图像Droplet_image,长度为image_height,图像的宽度为image_width,图片横坐标等分num_height份,纵坐标等分num_width份,则图像droplet_image总共分成num_size=num_width*num_height张子图片,子图片的表示为sub_imager,其中 0≤r≤num_size,子图片高度为
Figure BDA0003285371220000022
子图片宽度为
Figure BDA0003285371220000023
Figure BDA0003285371220000024
20≤num_width≤32,16≤num_height≤24,且num_height<num_width。
S22:任选一张子图片sub_imager,其中0≤r≤num_size。G(sub_x,sub_y)表示像素值在点(sub_x,sub_y)的灰度值,0≤sub_x≤sub_cols,0≤sub_y≤sub_rows。计算子图片阈值,生成此子图片的二值化图像:
1)统计图片sub_imager灰度直方图:
Figure BDA0003285371220000025
Figure BDA0003285371220000031
2)针对直方图进行归一化:
Forii 0:255
Figure BDA0003285371220000032
3)计算概率密度累加和:
Figure BDA0003285371220000033
4)从前往后遍历数组norm_histomw,找到第一个非零的数据位置设置为first_bin,从后往前遍历数组norm_histomr,找到第一个非零的数据位置设置为last_bin;
5)计算阈值的位置点:
Figure BDA0003285371220000034
Figure BDA0003285371220000041
6)生成sub_imager的二值化图像sub_binaryr
Figure BDA0003285371220000042
7)依据sub_binaryr连通域sub_img_domainr对二值化图像进行修改:
设sub_binaryr连通域的像素面积为sub_area_domainr,连通域的孔洞的数量为sub_img_holer,如果
Figure BDA0003285371220000043
或者sub_img_holer>10,则sub_binaryr的二值化图片sub_binaryr全部像素值为零。
S23:通过上面的操作,num_size张子图片对应num_size张二值化图像,所有的二值化图像按原图片Droplet_image的位置组合成的二值化Image_binary。
S3连通域处理
S31:设
Figure BDA0003285371220000044
表示二值化图像Image_binary的第m个连通域,其中0≤m≤NUMI_domain,NUMI_domain表示连通域的个数。
Figure BDA0003285371220000045
的像素面积为
Figure BDA0003285371220000046
Figure BDA0003285371220000047
Figure BDA0003285371220000048
表示第m个连通域像素单元的个数。
Figure BDA0003285371220000049
的像素周长为
Figure BDA00032853712200000410
计算第m个连通域的圆率
Figure BDA00032853712200000411
如果
Figure BDA00032853712200000412
则置第m个连通域所包含位置的像素值为0。
S32:连通均
Figure BDA00032853712200000413
中像素集合表示为
Figure BDA00032853712200000414
如果第m个像素单元属于
Figure BDA00032853712200000415
则表示为
Figure BDA00032853712200000416
其中
Figure BDA00032853712200000417
设集合
Figure BDA00032853712200000418
中像素单元横坐标的最大值表示为dmn_x_maxm,横坐标的最小值表示为dmn_x_minm,纵坐标的最大值表示为dmn_y_maxm,纵坐标的最小值表示为dmn_y_minm
S33:如果dmn_x_maxm-dmn_x_minm>30,则计算连通域
Figure BDA0003285371220000051
在x方向的投影值,其中最小投影值对应的x的坐标值为x_min_locm。基于坐标值x_min_locm沿y方向分割连通域连通域
Figure BDA0003285371220000052
如图2所示。
S34:如果dmn_y_maxm-dmn_y_minm>30,则计算连通域
Figure BDA0003285371220000053
在y方向的投影值,其中最小投影值对应的y的坐标值为y_min_locm。基于坐标值y_min_locm沿x方向分割连通域连通域
Figure BDA0003285371220000054
S35:计算连通域的质心坐标
Figure BDA0003285371220000055
Figure BDA0003285371220000056
Figure BDA0003285371220000057
计算连通域的像素单元到质心的最大距离:
Figure BDA0003285371220000058
Figure BDA0003285371220000059
计算外接圆的面积:
Figure BDA00032853712200000510
如果
Figure BDA00032853712200000511
且B_curveradiom<0.8,则在图像Learning_image_binary的对应位置标记连通域
Figure BDA00032853712200000512
S4判断假阳性,其中S42和S43是基于液滴像素值的标准差判断液滴假阳性;S44-S46 基于训练的分类器判断液滴假阳性;S47-S411基于液滴局部的像素对比度判断假阳性。
S41:任选液滴Dropletsi,其中0≤i≤Ndroplets,Ndroplets表示液滴的总数量。如果液滴Is_droplets[i]=1,液滴Dropletsi位置(pos_xi,pos_yi)在二值化图像Image_binary中对应的像素值为255,则更新Isdroplets[i]=-1。如果Is_droplets[i]=1则表示真阳性液滴,Isdroplets[i]=-1则表示假阳性液滴。
S42:设液滴Dropletsi位置(pos_xi,pos_yi)在二值化图像Learning_image_binary中对应的像素值为255,则在灰度图片Droplets_image中,以Dropletsi的位置(pos_xi,pos_yi)为中心,以4个像素单元为半径,计算此区域内像素的平均值:
Figure BDA0003285371220000061
其中Gray(x_lox,y_loc)表示在图像Droplets_image位置点(x_lox,y_loc)的像素值,(x_loc-pos_xi)2+(y_loc- pos_yi2≤16,NUMcirclei表示此圆形区域内的像素个数。
S43:计算此区域的最大值
Figure BDA0003285371220000062
计算此区域的最小值
Figure BDA0003285371220000063
计算此区域的像素的标准差:
Figure BDA0003285371220000064
如果
Figure BDA0003285371220000065
则Is_droplets[i]=-1,如果
Figure BDA0003285371220000066
则Is_droplets[i]=-1。
S44:设
Figure BDA0003285371220000067
表示二值化图像Learning_image_binary的第l个连通域,其中0≤l≤NUMC_domain,NUMC_domain表示连通域的个数。
计算
Figure BDA0003285371220000068
的像素面积
Figure BDA0003285371220000069
Figure BDA00032853712200000610
表示第1个连通域像素单元的个数。连通域
Figure BDA00032853712200000611
中像素集合表示为
Figure BDA00032853712200000612
第l个像素单元属于
Figure BDA00032853712200000613
表示为
Figure BDA00032853712200000614
其中
Figure BDA00032853712200000615
计算连通域的质心坐标
Figure BDA00032853712200000616
Figure BDA00032853712200000617
Figure BDA00032853712200000618
计算连通域的像素单元到质心的最大距离:
Figure BDA00032853712200000619
其中
Figure BDA00032853712200000620
计算此连通区域的圆度:
Figure BDA00032853712200000621
如果液滴Dropletsi位置点(pos_xi,pos_yi)属于连通域
Figure BDA00032853712200000622
的集合
Figure BDA0003285371220000071
Figure BDA0003285371220000072
则Is_droplets[i]=-1;
S45:任选一个液滴Dropletsi,其中0≤i≤Ndroplets,Ndroplets表示液滴的总数量。液滴Dropletsi与连通域
Figure BDA0003285371220000073
的距离为:
Figure BDA0003285371220000074
如果
Figure BDA0003285371220000075
则以(pos_xi,pos_yi)为中心,24个像素单元为矩形宽度,24个像素单元为矩形高度,截取灰度图片Droplets_image,形成新的样本图像sample_imgi,sample_imgi表示第i个液滴的样本,样本图像sample_imgi的高度和宽度都为24个像素。
S46:载入训练生成的SVM_class.xml文件,计算sample_imgi的HOG特征,
特征值导入到线性核函数SVM中,如果判断结果为1,则Is_droplets[i]=1,否则为Is_droplets[i]=-1。
S47:以连通域的质心坐标
Figure BDA0003285371220000076
为中心,以Domain_radius1为半径,其中
Figure BDA0003285371220000077
统计此圆形区域内对应的液滴像素值的灰度直方图Histoml_gray,直方图以灰度级为横坐标,像素个数为纵坐标。
Figure BDA0003285371220000078
NUM_I_GRAY(G)表示此区域内液滴像素值为G的液滴的个数。统计此圆形区域内所有液滴的灰度值,最大灰度值为graymax,最小灰度值为graymin, 0≤graymin≤graymax≤255。0≤l≤NUMC_domain,NUMC_domain表示连通域总数量,con_ratio=1.1。
S48:此圆形区域内液滴最大灰度值和液滴最小灰度值分别为graymax和graymin,灰度值 G的概率密度为
Figure BDA0003285371220000079
其中Num表示此圆形区域内液滴的总个数,nG表示灰度值为G的像素个数,graymin≤G≤graymax;计算灰度概率密度直方图Ck=pG,其中graymin≤k≤graymax&&k=G;
计算灰度直方图一阶矩为:
Figure BDA00032853712200000710
二阶矩为:
Figure BDA00032853712200000711
三阶矩为:
Figure BDA00032853712200000712
S49:计算参考值p_refer=(z1-M11)/(z1-z0),其中:
Figure BDA00032853712200000713
Figure BDA0003285371220000081
c1=(-M3l+M2l*M1l)/(M2l-M1l*M1l);
c0=(-M2l+M3l*M1l)/(M2l-M1l*M1l);
S410:灰度值从graymin到graymax依次遍历灰度概率密度直方图,如果存在Ck>p_refer,则Histoml_gray_Th=k,其中graymin≤k≤graymax
S411:以连通域的质心坐标
Figure BDA0003285371220000082
为中心,以Domain_radiusl为半径,统计此区域内小于或等于Histoml_gray_Th液滴的最大像素值为
Figure BDA0003285371220000083
其中Gj是以连通域的质心坐标
Figure BDA0003285371220000084
为中心,以Domain_radiusl为半径的圆形区域对应的液滴的像素值。如果存在液滴
Figure BDA0003285371220000085
Figure BDA0003285371220000086
Figure BDA0003285371220000087
Is_droplets[i]=-1。
本发明的另一个方面公开了一种检测装置,所述检测装置包括上述算法。
与现有技术相比,本发明取得了如下的显著优势:
1)采用一种新的阈值划分算法,对子区域的图片进行分割,组合为原始图片的二值化图片。依据连通域的条件和投影算法,生成新的二值化图Image_binary和Learning_image_binary,Image_binary用于检测异常区域芯片缺陷或者“杂质”等异常的区域。Learning_image_binary用于检测轮廓与真实液滴近似的假阳性液滴。
2)为了减少假阳性误判,文中建立了液滴的正负样本库,正样本是真实的液滴,负样本为假阳性液滴,包括芯片缺陷或者“杂质”等异常区域。文中选择Hog计算样本的特征,采用线性核函数SVM训练样本,提高了假阳性识别率。同时使用液滴像素标准差和局部的像素对比度判断假阳性。
附图说明
图1为本发明中所述的基于SVM的数字PCR假阳性液滴检测方法的流程图;
图2为本发明S33步骤的投影图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一种基于SVM的数字PCR假阳性液滴检测方法,具体包括以下步骤:
S1:构建样本库并基于SVM训练样本
S11:更换不同的滤光片和光源拍摄不同条件下的微液滴图片。拍摄芯片表面有缺陷的液滴图片。
S12:截取完整的液滴组成正样本库,归一化为同一尺寸24*24,对正样本用高斯滤波处理;负样本是芯片表面缺陷导致的“高亮点”、“划痕”、“凹凸点”等情况,负样本归一化为24*24,对负样本直方图均衡化;采用旋转、翻转、扭曲、仿射变换、缩放、压缩等方法扩增样本量。其中正样本库的样本数量为5734;负样本库的数量为11760个。
S13:计算样本的特征值,基于HOG特征算子计算样本的特征值,其中HOG检测窗口的大小为24*24,窗口滑动块的大小为8*8,滑动块的步长为2,细胞单元的大小为4*4,直方图的bins的数量为9个,特征值的维数为3888。设Si表示第i样本, 0≤i≤NUM_sample,NUM_sample,表示正负样本的总数;
Figure BDA0003285371220000091
表示第i样本第k维的特征值, 0≤k≤3888。对于液滴的正、负样本集(S0,CL0)…,(Si,CLi),...,(SNUM_sample,CLNUM_sample),其中Si表示第i样本,CLi=-1表示负样本,CLi=1表示正样本。
S14:生成训练分类器,样本的特征值导入支持向量机训练,生成分类器SVM_class.xml 文件,其中选择二分类的SVM,核函数为线性核函数,惩罚因子为1,循环迭代的次数为10000。
S2:液滴图片二值化
S21:设图像Droplet_image,长度为image_height,图像的宽度为image_width,图片横坐标等分num_height份,纵坐标等分num_width份,则图像droplet_image总共分成num_size=num_width*num_height张子图片,子图片的表示为sub_imager,其中 0≤r≤num_size,子图片高度为
Figure BDA0003285371220000092
子图片宽度为
Figure BDA0003285371220000093
Figure BDA0003285371220000094
20≤num_width≤32,16≤num_height≤24,且num_height<num_width。
S22:任选一张子图片sub_imager,其中0≤r≤num_size。G(sub_x,sub_y)表示像素值在点(sub_x,sub_y)的灰度值,0≤sub_x≤sub_cols,0≤sub_y≤sub_rows。计算子图片阈值,生成此子图片的二值化图像:
1)统计图片sub_imager灰度直方图:
Figure BDA0003285371220000095
Figure BDA0003285371220000101
2)针对直方图进行归一化:
Forii 0:255
Figure BDA0003285371220000102
3)计算概率密度累加和:
Figure BDA0003285371220000103
4)从前往后遍历数组norm_histomr,找到第一个非零的数据位置设置为first_bin,从后往前遍历数组norm_histomr,找到第一个非零的数据位置设置为last_bin;
5)计算阈值的位置点:
Figure BDA0003285371220000104
Figure BDA0003285371220000111
6)生成sub_imager的二值化图像sub_binaryr
Figure BDA0003285371220000112
7)依据sub_binaryr连通域sub_img_domainr对二值化图像进行修改:
设sub_binaryr连通域的像素面积为sub_area_domainr,连通域的孔洞的数量为sub_img_holer,如果
Figure BDA0003285371220000113
或者sub_img_holer>10,则sub_binaryr的二值化图片sub_binaryr全部像素值为零。
S23:通过上面的操作,num_size张子图片对应num_size张二值化图像,所有的二值化图像按原图片Droplet_image的位置组合成的二值化Image_binary。
S3连通域处理
S31:设
Figure BDA0003285371220000114
定示二值化图像Image_binary的第m个连通域,其中0≤m≤NUMI_domain,NUMI_domain表示连通域的个数。
Figure BDA0003285371220000115
的像素面积为
Figure BDA0003285371220000116
Figure BDA0003285371220000117
Figure BDA0003285371220000118
表示第m个连通域像素单元的个数。
Figure BDA0003285371220000119
的像素周长为
Figure BDA00032853712200001110
计算第m个连通域的圆率
Figure BDA00032853712200001111
如果
Figure BDA00032853712200001112
则置第m个连通域所包含位置的像素值为0。
S32:连通域
Figure BDA00032853712200001113
中像素集合表示为
Figure BDA00032853712200001114
如果第m个像素单元属于
Figure BDA00032853712200001115
则表示为
Figure BDA00032853712200001116
其中
Figure BDA00032853712200001117
设集合
Figure BDA00032853712200001118
中像素单元横坐标的最大值表示为dmn_x_maxm,横坐标的最小值表示为dmn_x_minm,纵坐标的最大值表示为dmn_y_maxm,纵坐标的最小值表示为dmn_y_minm
S33:如果dmn_x_maxm-dmn_x_minm>30,则计算连通域
Figure BDA0003285371220000121
在x方向的投影值,其中最小投影值对应的x的坐标值为x_min_locm。基于坐标值x_min_locm沿y方向分割连通域连通域
Figure BDA0003285371220000122
如图2所示。
S34:如果dmn_y_maxm—dmn_y_minm>30,则计算连通域
Figure BDA0003285371220000123
在y方向的投影值,其中最小投影值对应的y的坐标值为y_min_locm。基于坐标值y_min_locm沿x方向分割连通域连通域
Figure BDA0003285371220000124
S35:计算连通域的质心坐标
Figure BDA0003285371220000125
Figure BDA0003285371220000126
Figure BDA0003285371220000127
计算连通域的像素单元到质心的最大距离:
Figure BDA0003285371220000128
Figure BDA0003285371220000129
计算外接圆的面积:
Figure BDA00032853712200001210
如果
Figure BDA00032853712200001211
且B_curveradiom<0.8,则在图像Learning_image_binary的对应位置标记连通域
Figure BDA00032853712200001212
S4判断假阳性,其中S42和S43是基于液滴像素值的标准差判断液滴假阳性;S44-S46 基于训练的分类器判断液滴假阳性;S47-S411基于液滴局部的像素对比度判断假阳性。
S41:任选液滴Dropletsi,其中0≤i≤Ndroplets,Ndroplets表示液滴的总数量。如果液滴Is_droplets[i]=1,液滴Dropletsi位置(pos_xi,pos_yi)在二值化图像Image_binary中对应的像素值为255,则更新Isdroplets[i]=-1。如果Is_droplets[i]=1则表示真阳性液滴,Isdroplets[i]=-1则表示假阳性液滴。
S42:设液滴Dropletsi位置(pos_xi,pos_yi)在二值化图像Learning_image_binary中对应的像素值为255,则在灰度图片Droplets_image中,以Dropletsi的位置(pos_xi,pos_yi)为中心,以4个像素单元为半径,计算此区域内像素的平均值:
Figure BDA0003285371220000131
其中Gray(x_lox,y_loc)表示在图像Droplets_image位置点(x_lox,y_loc)的像素值,(x_loc-pos_xi)2+(y_loc- pos_yi2≤16,NUMcirclei表示此圆形区域内的像素个数。
S43:计算此区域的最大值
Figure BDA0003285371220000132
计算此区域的最小值
Figure BDA0003285371220000133
计算此区域的像素的标准差:
Figure BDA0003285371220000134
如果
Figure BDA0003285371220000135
则Is_droplets[i]=-1,如果
Figure BDA0003285371220000136
则Is_droplets[i]=-1。
S44:设
Figure BDA0003285371220000137
表示二值化图像Learning_image_binary的第1个连通域,其中0≤l≤NUMC_domain,NUMC_domain表示连通域的个数。
计算
Figure BDA0003285371220000138
的像素面积
Figure BDA0003285371220000139
Figure BDA00032853712200001310
表示第l个连通域像素单元的个数。连通域
Figure BDA00032853712200001311
中像素集合表示为
Figure BDA00032853712200001312
第1个像素单元属于
Figure BDA00032853712200001313
表示为
Figure BDA00032853712200001314
其中
Figure BDA00032853712200001315
计算连通域的质心坐标
Figure BDA00032853712200001316
Figure BDA00032853712200001317
Figure BDA00032853712200001318
计算连通域的像素单元到质心的最大距离:
Figure BDA00032853712200001319
其中
Figure BDA00032853712200001320
计算此连通区域的圆度:
Figure BDA0003285371220000141
如果液滴Dropletsi位置点(pos_xi,pos_yi)属于连通域
Figure BDA0003285371220000142
的集合
Figure BDA0003285371220000143
Figure BDA0003285371220000144
则Is_droplets[i]=-1;
S45:任选一个液滴Dropletsi,其中0≤i≤Ndroplets,Ndroplets表示液滴的总数量。液滴Dropletsi与连通域
Figure BDA0003285371220000145
的距离为:
Figure BDA0003285371220000146
如果
Figure BDA0003285371220000147
则以(pos_xi,pos_yi)为中心,24个像素单元为矩形宽度,24个像素单元为矩形高度,截取灰度图片Droplets_image,形成新的样本图像sample_imgi,sample_imgi表示第i个液滴的样本,样本图像sample_imgi的高度和宽度都为24个像素。
S46:载入训练生成的SVM_class.xml文件,计算sample_imgi的HOG特征,
特征值导入到线性核函数SVM中,如果判断结果为1,则Is_droplets[i]=1,否则为Is_droplets[i]=-1。
S47:以连通域的质心坐标
Figure BDA0003285371220000148
为中心,以Domain_radiusl为半径,其中
Figure BDA0003285371220000149
统计此圆形区域内对应的液滴像素值的灰度直方图Histoml-gray,直方图以灰度级为横坐标,像素个数为纵坐标。
Figure BDA00032853712200001410
NUM_I_GRAY(G)表示此区域内液滴像素值为G的液滴的个数。统计此圆形区域内所有液滴的灰度值,最大灰度值为graymax,最小灰度值为graymin, 0≤graymin≤graymax≤255。0≤l≤NUMC_domain,NUMC_domain表示连通域总数量,con_ratio=1.1。
S48:此圆形区域内液滴最大灰度值和液滴最小灰度值分别为graymax和graymin,灰度值 G的概率密度为
Figure BDA00032853712200001411
其中Num表示此圆形区域内液滴的总个数,nG表示灰度值为G的像素个数,graymin≤G≤graymax;计算灰度概率密度直方图Ck=pG,其中graymin≤k≤graymax&&k=G;
计算灰度直方图一阶矩为:
Figure BDA00032853712200001412
二阶矩为:
Figure BDA00032853712200001413
三阶矩为:
Figure BDA0003285371220000151
S49:计算参考值p_refer=(z1-M1l)/(z1-z0),其中:
Figure BDA0003285371220000152
Figure BDA0003285371220000153
c1=(-M3l+M2l*M1l)/(M2l-M1l*M1l);
c0=(-M2l+M3l*M1l)/(M2l-M1l*M1l);
S410:灰度值从graymin到graymax依次遍历灰度概率密度直方图,如果存在Ck>p_refer,则Histoml-gray_Th=k,其中graymin≤k≤graymax
S411:以连通域的质心坐标
Figure BDA0003285371220000154
为中心,以Domain_radiusl为半径,统计此区域内小于或等于Histoml-gray_Th液滴的最大像素值为
Figure BDA0003285371220000155
其中Gj是以连通域的质心坐标
Figure BDA0003285371220000156
为中心,以Domain_radiusl为半径的圆形区域对应的液滴的像素值。如果存在液滴
Figure BDA0003285371220000157
Figure BDA0003285371220000158
Figure BDA0003285371220000159
Is_droplets[i]=-1。
以上仅以较佳实施例公布了本发明,然其并非用以限制本发明,凡采取等同替换或等效变换的方案所获得的技术方案,均落在本发明的保护范围内。

Claims (8)

1.一种基于SVM的数字PCR假阳性液滴检测方法,其特征在于,包括以下步骤:
S1:构建样本库并基于SVM训练样本;
S2:液滴图片二值化;
S3:连通域处理;
S4:判断液滴假阳性。
2.根据权利要求1所述的检测方法,其特征在于,所述S1步骤包括:
S11:更换不同的滤光片和光源拍摄不同条件下的微液滴图片,拍摄芯片表面有缺陷的液滴图片;
S12:截取完整的液滴组成正样本库,归一化为同一尺寸24*24,且正样本用高斯滤波处理;负样本是芯片表面缺陷导致的“高亮点”、“划痕”、“凹凸点”的情况,负样本归一化为24*24,且对负样本进行直方图均衡化;并扩增样本量;
S13:计算样本的特征值,基于HOG特征算子计算样本的特征值,其中HOG检测窗口的大小为24*24,窗口滑动块的大小为8*8,滑动块的步长为2,细胞单元的大小为4*4,直方图的bins的数量为9个,特征值的维数为3888;设Si表示第i样本,0≤i≤NUM_sample,NUM_sample,表示正负样本的总数;
Figure RE-FDA0003484053970000011
表示第i样本第k维的特征值,0≤k≤3888;对于液滴的正、负样本集(S0,CL0)…,(Si,CLi),…,(SNUM_sample,CLNUM_sample),其中Si表示第i样本,CLi=-1表示负样本,CLi=1表示正样本;
S14:生成训练分类器,样本的特征值导入支持向量机训练,生成分类器SVM_class.xml文件,其中选择二分类的SVM,核函数为线性核函数,惩罚因子为1,循环迭代的次数为10000。
3.根据权利要求1所述的检测方法,其特征在于,所述S2步骤包括:
S21:设图像Droplet_image,长度为image_height,图像的宽度为image_width,图片横坐标等分num_height份,纵坐标等分num_width份,则图像droplet_image总共分成num_size=num_width*num_height张子图片,子图片的表示为sub_imager,其中0≤r≤num_size,子图片高度为
Figure RE-FDA0003484053970000012
子图片宽度为
Figure RE-FDA0003484053970000013
20≤num_width≤32,16≤num_height≤24,且num_height<num_width;
S22:任选一张子图片sub_imager,其中0≤r≤num_size;G(sub_x,sub_y)表示像素值在点(sub_x,sub_y)的灰度值,0≤sub_x≤sub_cols,0≤sub_y≤sub_rows;计算子图片阈值,生成此子图片的二值化图像;
S23:通过上述S21和S22的操作,num_size张子图片对应num_size张二值化图像,所有的二值化图像按原图片Droplet_image的位置组合成的二值化Image_binary。
4.根据权利要求1所述的检测方法,其特征在于,所述S3步骤包括:
S31:设
Figure RE-FDA0003484053970000021
表示二值化图像Image_binary的第m个连通域,其中0≤m≤NUMI_domain,NUMI_domain表示连通域的个数;
Figure RE-FDA0003484053970000022
的像素面积为
Figure RE-FDA0003484053970000023
Figure RE-FDA0003484053970000024
Figure RE-FDA0003484053970000025
表示第m个连通域像素单元的个数;
Figure RE-FDA0003484053970000026
的像素周长为
Figure RE-FDA0003484053970000027
计算第m个连通域的圆率
Figure RE-FDA0003484053970000028
如果
Figure RE-FDA0003484053970000029
则置第m个连通域所包含位置的像素值为0;
S32:连通域
Figure RE-FDA00034840539700000210
中像素集合表示为
Figure RE-FDA00034840539700000211
如果第m个像素单元属于
Figure RE-FDA00034840539700000212
则表示为
Figure RE-FDA00034840539700000213
其中
Figure RE-FDA00034840539700000214
设集合
Figure RE-FDA00034840539700000215
中像素单元横坐标的最大值表示为dmn_x_maxm,横坐标的最小值表示为dmn_x_minm,纵坐标的最大值表示为dmn_y_maxm,纵坐标的最小值表示为dmn_y_minm
S33:如果dmn_x_maxm-dmn_x_minm>30,则计算连通域
Figure RE-FDA00034840539700000216
在x方向的投影值,其中最小投影值对应的x的坐标值为x_min_locm;基于坐标值x_min_locm沿y方向分割连通域
Figure RE-FDA00034840539700000217
S34:如果dmn_y_maxm-dmn_y_minm>30,则计算连通域
Figure RE-FDA00034840539700000218
在y方向的投影值,其中最小投影值对应的y的坐标值为y_min_locm;基于坐标值y_min_locm沿x方向分割连通域
Figure RE-FDA00034840539700000219
S35:计算连通域的质心坐标
Figure RE-FDA00034840539700000220
Figure RE-FDA00034840539700000221
Figure RE-FDA00034840539700000222
计算连通域的像素单元到质心的最大距离:
Figure RE-FDA0003484053970000031
Figure RE-FDA0003484053970000032
计算外接圆的面积:
Figure RE-FDA0003484053970000033
如果
Figure RE-FDA0003484053970000034
且B_curveradiom<0.8,则在图像Learning_image_binary的对应位置标记连通域
Figure RE-FDA0003484053970000035
5.根据权利要求1所述的检测方法,其特征在于,所述S4步骤包括:
S41:任选液滴Dropletsi,其中0≤i≤Ndroplets,Ndroplets表示液滴的总数量;如果液滴Is_droplets[i]=1,液滴Dropletsi位置(pos_xi,pos_yi)在二值化图像Image_binary中对应的像素值为255,则更新Isdroplets[i]=-1;如果Is_droplets[i]=1则表示真阳性液滴,Isdroplets[i]=-1则表示假阳性液滴;
S42:设液滴Dropletsi位置(pos_xi,pos_yi)在二值化图像Learning_image_binary中对应的像素值为255,则在灰度图片Droplets_image中,以Dropletsi的位置(pos_xi,pos_yi)为中心,以4个像素单元为半径,计算此区域内像素的平均值:
Figure RE-FDA0003484053970000036
其中Gray(x_lox,y_loc)表示在图像Droplets_image位置点(x_lox,y_loc)的像素值,(x_loc-pos_xi)2+(y_loc-pos_yi)2≤16,
Figure RE-FDA0003484053970000037
表示此圆形区域内的像素个数;
S43:计算此区域的最大值
Figure RE-FDA0003484053970000038
计算此区域的最小值
Figure RE-FDA0003484053970000039
计算此区域的像素的标准差:
Figure RE-FDA00034840539700000310
如果
Figure RE-FDA00034840539700000311
则Is_droplets[i]=-1,如果
Figure RE-FDA00034840539700000312
则Is_droplets[i]=-1。
6.根据权利要求1所述的检测方法,其特征在于,所述S4步骤还包括:
S44:设
Figure RE-FDA0003484053970000041
表示二值化图像Learning_image_binary的第l个连通域,其中0≤l≤NUMC_domain,NUMC_domain表示连通域的个数;
计算
Figure RE-FDA0003484053970000042
的像素面积
Figure RE-FDA0003484053970000043
Figure RE-FDA0003484053970000044
表示第l个连通域像素单元的个数;连通域
Figure RE-FDA0003484053970000045
中像素集合表示为
Figure RE-FDA0003484053970000046
第l个像素单元属于
Figure RE-FDA0003484053970000047
表示为
Figure RE-FDA0003484053970000048
其中
Figure RE-FDA0003484053970000049
计算连通域的质心坐标
Figure RE-FDA00034840539700000410
Figure RE-FDA00034840539700000411
Figure RE-FDA00034840539700000412
计算连通域的像素单元到质心的最大距离:
Figure RE-FDA00034840539700000413
其中
Figure RE-FDA00034840539700000414
Figure RE-FDA00034840539700000415
计算此连通区域的圆度:
Figure RE-FDA00034840539700000416
如果液滴Dropletsi位置点(pos_xi,pos_yi)属于连通域
Figure RE-FDA00034840539700000417
的集合
Figure RE-FDA00034840539700000418
Figure RE-FDA00034840539700000419
则Is_droplets[i]=-1;
S45:任选一个液滴Dropletsi,其中0≤i≤Ndroplets,Ndroplets表示液滴的总数量;液滴Dropletsi与连通域
Figure RE-FDA00034840539700000420
的距离为:
Figure RE-FDA00034840539700000421
如果
Figure RE-FDA00034840539700000422
则以(pos_xi,pos_yi)为中心,24个像素单元为矩形宽度,24个像素单元为矩形高度,截取灰度图片Droplets_image,形成新的样本图像sample_imgi,sample_imgi表示第i个液滴的样本,样本图像sample_imgi的高度和宽度都为24个像素;
S46:载入训练生成的SVM_class.xml文件,计算sample_imgi的HOG特征,
特征值导入到线性核函数SVM中,如果判断结果为1,则Is_droplets[i]=1,否则为Is_droplets[i]=-1。
7.根据权利要求1所述的检测方法,其特征在于,所述S4步骤还包括:
S47:以连通域的质心坐标
Figure RE-FDA0003484053970000051
为中心,以Domain_radiusl为半径,其中
Figure RE-FDA0003484053970000052
统计此圆形区域内对应的液滴像素值的灰度直方图Histoml_gray,直方图以灰度级为横坐标,像素个数为纵坐标;
Figure RE-FDA0003484053970000053
Figure RE-FDA0003484053970000054
NUM_I_GRAY(G)表示此区域内液滴像素值为G的液滴的个数;统计此圆形区域内所有液滴的灰度值,最大灰度值为graymax,最小灰度值为graymin,0≤graymin≤graymax≤255;0≤l≤NUMC_domain,NUMC_domain表示连通域总数量,con_ratio=1.1;
S48:此圆形区域内液滴最大灰度值和液滴最小灰度值分别为graymax和graymin,灰度值G的概率密度为
Figure RE-FDA0003484053970000055
其中Num表示此圆形区域内液滴的总个数,nG表示灰度值为G的像素个数,graymin≤G≤graymax;计算灰度概率密度直方图Ck=pG,其中graymin≤k≤graymax&&k=G;
计算灰度直方图一阶矩为:
Figure RE-FDA0003484053970000056
二阶矩为:
Figure RE-FDA0003484053970000057
三阶矩为:
Figure RE-FDA0003484053970000058
S49:计算参考值p_refer=(z1-M1l)/(z1-z0),其中:
Figure RE-FDA0003484053970000059
Figure RE-FDA00034840539700000510
c1=(-M3l+M2l*M1l)/(M2l-M1l*M1l);
c0=(-M2l+M3l*M1l)/(M2l-M1l*M1l);
S410:灰度值从graymin到graymax依次遍历灰度概率密度直方图,如果存在Ck>p_refer,则Histoml_gray_Th=k,其中graymin≤k≤graymax
S411:以连通域的质心坐标
Figure RE-FDA00034840539700000511
为中心,以Domain_radiusl为半径,统计此区域内小于或等于Histoml_gray_Th液滴的最大像素值为
Figure RE-FDA00034840539700000512
其中Gj是以连通域的质心坐标
Figure RE-FDA00034840539700000513
为中心,以Domain_radiusl为半径的圆形区域对应的液滴的像素值;如果存在液滴
Figure RE-FDA0003484053970000061
Figure RE-FDA0003484053970000062
Is_droplets[i]=-1。
8.一种检测装置,其特征在于,所述检测装置采用权利要求1-7任一项所述的检测方法。
CN202111145778.8A 2021-09-28 2021-09-28 一种基于svm的数字pcr假阳性液滴检测方法 Pending CN114187228A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111145778.8A CN114187228A (zh) 2021-09-28 2021-09-28 一种基于svm的数字pcr假阳性液滴检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111145778.8A CN114187228A (zh) 2021-09-28 2021-09-28 一种基于svm的数字pcr假阳性液滴检测方法

Publications (1)

Publication Number Publication Date
CN114187228A true CN114187228A (zh) 2022-03-15

Family

ID=80601370

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111145778.8A Pending CN114187228A (zh) 2021-09-28 2021-09-28 一种基于svm的数字pcr假阳性液滴检测方法

Country Status (1)

Country Link
CN (1) CN114187228A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114648529A (zh) * 2022-05-19 2022-06-21 深圳市中科先见医疗科技有限公司 一种基于cnn网络的dpcr液滴荧光检测方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114648529A (zh) * 2022-05-19 2022-06-21 深圳市中科先见医疗科技有限公司 一种基于cnn网络的dpcr液滴荧光检测方法

Similar Documents

Publication Publication Date Title
CN107844683B (zh) 一种数字pcr液滴浓度的计算方法
JP6710135B2 (ja) 細胞画像の自動分析方法及びシステム
US5933519A (en) Cytological slide scoring apparatus
US7979212B2 (en) Method and system for morphology based mitosis identification and classification of digital images
CN109903296B (zh) 一种基于LBP-Adaboost算法的数字PCR液滴检测方法
JP2006048322A (ja) オブジェクト画像検出装置、顔画像検出プログラムおよび顔画像検出方法
WO2011146006A1 (en) Methods and systems for identifying well wall boundaries of microplates
CN108537787B (zh) 一种人脸图像的质量判定方法
WO2005076197A2 (en) Method and system for morphology based mitosis identification and classification of digital images
EP2283463A1 (en) System and method for detecting and eliminating one or more defocused or low contrast-to-noise ratio images
EP0791205A1 (en) Biological analysis system self-calibration apparatus
CN112813152B (zh) 一种基于图像识别的数字pcr液滴荧光检测方法
CN110648330B (zh) 摄像头玻璃的缺陷检测方法
CN113706490B (zh) 一种晶片缺陷检测方法
WO1996009604A1 (en) Apparatus for automated identification of cell groupings on a biological specimen
WO2020037573A1 (zh) 检测图像上的亮斑的方法、装置和计算机程序产品
Wang et al. A rule-based computer scheme for centromere identification and polarity assignment of metaphase chromosomes
CN114187228A (zh) 一种基于svm的数字pcr假阳性液滴检测方法
Marcuzzo et al. Automated Arabidopsis plant root cell segmentation based on SVM classification and region merging
GB2329014A (en) Automated identification of tubercle bacilli
CN112927182A (zh) 一种数字pcr微阵列图像分析方法
Tikkanen et al. Training based cell detection from bright-field microscope images
CN114038506A (zh) 一种微滴式数字pcr高浓度检测方法
CN114384073B (zh) 一种地铁隧道裂纹检测方法及系统
CN115082444A (zh) 一种基于图像处理的铜管焊缝缺陷检测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination