CN114549528A - 一种微液滴数字pcr液滴检测方法及系统 - Google Patents
一种微液滴数字pcr液滴检测方法及系统 Download PDFInfo
- Publication number
- CN114549528A CN114549528A CN202210442041.0A CN202210442041A CN114549528A CN 114549528 A CN114549528 A CN 114549528A CN 202210442041 A CN202210442041 A CN 202210442041A CN 114549528 A CN114549528 A CN 114549528A
- Authority
- CN
- China
- Prior art keywords
- droplet
- droplets
- digital pcr
- image
- detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 55
- 238000011304 droplet digital PCR Methods 0.000 title claims abstract description 24
- 238000003752 polymerase chain reaction Methods 0.000 title claims description 5
- 239000007788 liquid Substances 0.000 claims abstract description 79
- 238000000034 method Methods 0.000 claims abstract description 54
- 238000007847 digital PCR Methods 0.000 claims abstract description 40
- 238000012549 training Methods 0.000 claims abstract description 31
- 238000003708 edge detection Methods 0.000 claims abstract description 16
- 238000007781 pre-processing Methods 0.000 claims abstract description 13
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 11
- 238000004422 calculation algorithm Methods 0.000 claims description 28
- 230000000873 masking effect Effects 0.000 claims description 6
- 230000002159 abnormal effect Effects 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 4
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 230000004907 flux Effects 0.000 abstract 1
- 230000011218 segmentation Effects 0.000 description 25
- 238000001914 filtration Methods 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 10
- 150000007523 nucleic acids Chemical class 0.000 description 10
- 102000039446 nucleic acids Human genes 0.000 description 10
- 108020004707 nucleic acids Proteins 0.000 description 10
- 238000007635 classification algorithm Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 238000010801 machine learning Methods 0.000 description 8
- 238000011176 pooling Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 238000013461 design Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 210000002569 neuron Anatomy 0.000 description 4
- 238000003062 neural network model Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000007637 random forest analysis Methods 0.000 description 3
- 241000322338 Loeseliastrum Species 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 238000003709 image segmentation Methods 0.000 description 2
- 230000036039 immunity Effects 0.000 description 2
- 239000012535 impurity Substances 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000003064 k means clustering Methods 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 238000004445 quantitative analysis Methods 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000002146 bilateral effect Effects 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012938 design process Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000013100 final test Methods 0.000 description 1
- 238000001917 fluorescence detection Methods 0.000 description 1
- 238000002073 fluorescence micrograph Methods 0.000 description 1
- 238000000799 fluorescence microscopy Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000004313 glare Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 239000011259 mixed solution Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012567 pattern recognition method Methods 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/10—Image enhancement or restoration using non-spatial domain filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/12—Edge-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20048—Transform domain processing
- G06T2207/20061—Hough transform
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20172—Image enhancement details
- G06T2207/20192—Edge enhancement; Edge preservation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种微液滴数字PCR液滴检测方法及系统,包括:获取微液滴数字PCR图像并进行预处理,在预处理后的图像上依次使用Canny边缘检测和Hough圆检测获取独立液滴的定位信息,按定位信息对液滴进行截取并进行人工标注,以构建训练数据集;基于卷积神经网络构建液滴识别模型,使用训练数据集进行训练;将待测微液滴数字PCR图像进行预处理,使用Canny边缘检测和Hough圆检测获取独立液滴的定位信息,获得每个液滴的图像并按批次输入训练好的液滴识别模型,对液滴进行有效或无效分类识别;最后根据有效液滴的中心灰度进行阴性阳性判断。本发明的方法及系统可对样本中的阳性微液滴进行高精准度、高通量地识别。
Description
技术领域
本发明涉及核酸检测分析技术领域,尤其涉及一种微液滴数字PCR液滴检测方法及系统。
背景技术
微液滴数字PCR(droplet digital polymerase chain reaction, ddPCR)是一种单分子水平的核酸定量分析技术,在精准医学和临床诊断中有着广泛的应用。借助液滴微流控技术,ddPCR将传统的PCR反应混合溶液分成数万个纳升级别的微液滴(每个微液滴作为一个独立的反应单元,其中包含0或1个核酸分子),含有目标核酸分子的液滴在PCR扩增后会呈现出较强的荧光信号。通过荧光检测,根据荧光强度对微液滴进行阴性或阳性的分类和计数,即可判断出含有目标核酸分子的液滴数量和比例。最后,根据阳性微液滴个数和统计学分析(泊松分布原理),对检测样本中的目标核酸分子的进行绝对定量检测。
在上述过程中,微液滴数字PCR的液滴数据分类是关键步骤(通常包括图像预处理、液滴分割和液滴分类三个部分),它直接影响到统计学计算的输入,因而决定着ddPCR的定量结果准确性。
图像预处理中滤波是不可或缺的步骤,通过抑制或消除图像的噪声,提高图像的信噪比,来改善图像特征的识别和信号的提取。由于数字PCR反应结果是通过微弱荧光成像的方式得到的,所以杂光、杂点的引入是难以避免的。由于液滴数据的分类以单个反应单元为单位实现定位和分类,所以,一旦反应单元中出现杂点,检测结果的准确性会受到严重影响。常用的滤波方法包括中值滤波、高斯滤波、双边滤波等滤波算法。但上述滤波方法只能对微小的简单荧光斑点进行滤除,对于杂光、杂点、无效液滴以及支撑柱等干扰,只能通过规整的芯片设计避免光斑干扰,或通过手动方法进行人工剔除。
ddPCR数据的分割分类方法,目前主要有两种:手动阈值法和自动分类算法。其中最常用的是手动阈值法,即针对每种反应,根据阴性和阳性液滴荧光强度的平均信号,观察得到各类数据的分界线,然后通过手动设置阈值或封闭曲线的方式对 ddPCR 数据进行液滴分割和分类。但实验人员和实验批次等因素的不同,会直接影响手动阈值法的判定结果,导致检测系统不稳。
自动分割分类算法包含有监督和无监督两类分类算法。总的来说,有监督方法具有较高的准确性,但是针对不同的样本类型和检测指标,需要开发多种不同的分类算法。无监督方法,虽然不用训练数据就可以自动对样本进行分割分类,但是它们的准确性和可靠性通常都不尽如人意,时常会出现假阴性和假阳性的检测结果。
有监督分类算法,需要人工对ddPCR数据进行标注和训练集制作,然后进行模型训练。例如,先使用带有标签的阴性和阳性液滴确定聚类中心,之后计算经验阈值,以实现对微液滴的自动分类。机器学习类方法也属于有监督分类算法,例如随机森林、Mask-RCNN和编码解码模型(Encoder-Decoder)等。虽然该类算法有较好的液滴分割分类性能,但是局限性也很大。例如使用随机森林法对阳性液滴进行分类时,需要配合特殊的芯片结构设计来确定每一个液滴的位置,之后再进行分类。Mask-RCNN无需特殊的芯片结构来辅助液滴定位,可以在对阳性液滴分类的同时进行液滴分割,但是该方法仅适用于待检测的目标数不多的单色图像,例如单个待测样本仅含1024个微室(存放微液滴的位置)的1080×1120像素图像,该方法在高通量分析中使用是不切实际的。使用编码解码(encode- decode)结构的卷积神经网络进行阳性液滴分割分类,虽然可以处理4000x6000像素,包含43,561个微室的无规则液滴图像,但是在实际应用时,仍需要将原图裁剪至256x256像素的小尺寸图像再送入模型中处理。此外,该方法要使用两个并行的卷积网络,一个用于阳性液滴分割,一个用于噪声分割。虽然该方法有不错的分类分割效果,且有一定的异常点检测功能,但是并行模型结构复杂,训练难度大,同时,微孔荧光信号的强度差异,也会导致识别错误。
无监督方法不需要训练数据即可进行自动分类,例如k-means聚类法、迭代聚类方法、密度分水岭算法、最大类间方差法(大津法,Outs)等利用全局自动阈值分类的算法。无监督方法最常用的是k-means聚类法,但是当目标核酸分子浓度非常低的样本时,该方法效果不佳。网格化图像的粗粒度辅助迭代聚类方法(CALICO)可以有效解决上述问题,但是数据中存在的雨区液滴(rain,液滴亮度介于阴性和阳性液滴亮度之间的液滴区域),会造成类别之间的模糊连接,从而影响CALICO方法的准确率,同时网格化只能处理正交垂直分布的芯片图像。为了解决雨区液滴影响,可以使用密度分水岭算法。该算法首先对液滴数据荧光值的散点图进行自适应网格化得到网格内密度,然后根据密度用分水岭算法将不同网格内数据划分成不同区域,然后使用不同区域进行阳性、阴性液滴分类。密度分水岭算法虽然一定程度上解决了雨区数据影响,但是网格化操作依然不利于处理其他排布样式的液滴图像。此外,还可以使用感兴趣区域、最大类间方差法,配合连通区域计数来获取阳性液滴数目。但是此类方法仅适用于阴性、阳性液滴和背景灰度之间存在明显差异的荧光图像,对于存在不均匀光照、低对比度、模糊等问题的图像分割和分类准确率较低。
总的来说当前技术的问题在于:
第一,由于环境、仪器、样本等诸多因素影响,荧光图像上会有许多噪声干扰,例如光斑干扰、支撑柱边缘、粘连、模糊和破裂的液滴等情况。滤波方法可以对简单的光斑进行滤除,但是对于其他无效液滴,仅能通过手动方式剔除。
第二,使用人工阈值分割分类的方法,需要人工监督以纠正错误,而且实验人员和实验批次等因素的不同,会直接影响阈值方法的判定结果,导致检测系统不稳。
第三,无监督的聚类方法,通常在目标核酸分子浓度非常低时,效果不佳。带有网格化的自适应算法,虽然克服了人工阈值法的缺点,获得了较好的分割分类性能,但是对芯片的结构设计有要求,只能处理正交垂直分布的芯片图像,或者是有一定规律的图像,而不能很好地处理其他排布样式的微液滴图像。同时,该类算法对于存在杂光、杂点、不均匀光照、模糊等问题的图像分割和分类,准确率较低。
第四,机器学习类方法,虽然能提高图像处理的准确性,且具有一定的抗噪能力,但是这类方法仅适用于包含少量反应单元(几千个)的小尺寸图像,不适用于高通量分析。
第五,不同曝光时间、不同浓度的液滴图片灰度值差异很大,亮度过高、过低或者低对比度的图像,会对目前的分割和分类算法造成不良影响,甚至无法进行正常分割和分类。
发明内容
本发明提供了一种微液滴数字PCR液滴检测方法,通过将传统模式识别技术和神经网络相融合,可对样本中的阳性微液滴进行高精准度识别。
本发明的技术方案如下:
一种微液滴数字PCR液滴检测方法,包括以下步骤:
(1)获取不同批次、不同曝光度的微液滴数字PCR图像并进行预处理,在预处理后的图像上依次使用Canny算法结合Hough圆检测算法获得每个液滴的定位信息,根据液滴的定位信息在原始微液滴数字PCR图像中进行截取,获得液滴图像并对每个独立液滴进行人工标注,构建训练数据集;训练数据集中包含有效液滴图像和无效液滴图像;
(2)基于卷积神经网络构建液滴识别模型,使用训练数据集对液滴识别模型进行训练;
(3)将待测微液滴数字PCR图像进行预处理后,依次使用Canny边缘检测和Hough圆检测获得每个液滴的定位信息,根据液滴的定位信息在原始待测微液滴数字PCR图像中进行截取,获得每个液滴的图像,将截取的液滴图像按批次输入训练好的液滴识别模型,对液滴进行有效或无效分类识别;
(4)计算待测微液滴数字PCR图像中每个有效液滴中心区域的平均灰度值;选取中心区域平均灰度值最大和最小的两个液滴,计算两个液滴的中心区域平均灰度值的均值,将所述均值作为待测微液滴数字PCR图像中阳性液滴和阴性液滴的分类阈值;
将中心区域的平均灰度值大于或等于分类阈值的有效液滴分类为阳性液滴;将中心区域的平均灰度值小于分类阈值的有效液滴分类为阴性液滴。
步骤(1)和步骤(3)中,所述的预处理包括:采用非锐化掩蔽(Unsharp Masking,USM)对液滴边缘进行增强。
所述的定位信息包括液滴的圆心坐标和半径。
采用非锐化掩蔽对液滴边缘进行增强后,液滴边缘与背景的对比度更大,更有利于后续对液滴的分割和定位,避免阴性液滴被漏检。
进一步优选的,非锐化掩蔽的锐化参数为:锐化半径为3,锐化强度为500,阈值为0。
进一步优选的,Canny边缘检测算法的的最小阈值为20-50,最大阈值为最小阈值的三倍。最优选的,Canny边缘检测算法的的最小阈值为30。
进一步优选的,进行高斯滤波时,高斯核尺寸为3×3,高斯核x和y方向的标准偏差为0。
进一步优选的,Hough圆形检测算法的参数为:圆心累加器阈值为7.5, 检测最大圆半径为标准液滴半径像素尺寸的4/3倍,检测最小圆半径为标准液滴半径像素尺寸的2/3倍。
标准液滴直径约为103.82μm,在图像中标准液滴直径约为16个像素。
有效液滴是指无噪声干扰的液滴;无效液滴是指杂点或受噪声干扰的液滴。
所述的无效液滴包括以下类型:图像边缘液滴、异物边缘液滴、模糊液滴、粘连液滴、图像拼接处液滴、光斑干扰液滴、含细碎光斑的液滴、泡形物干扰液滴和形态异常的液滴。
步骤(1)中,为了提高液滴识别模型的准确率,被截取的液滴图像中不仅包含待测液滴本身,同时也包含该液滴周围的邻近液滴和环境的图像信息。最后通过人工标注,组建为训练液滴识别模型所需的训练数据集。
进一步优选的,步骤(1)和步骤(3)中,液滴图像以目标液滴圆心为中心,长宽分别为标准液滴直径的3倍。
为了使液滴识别模型的网络结构更轻量化、运算速度更快,优选的,所述的液滴识别模型包括依次连接的输入层、第一卷积层、第一最大池化层、第二卷积层、第二最大池化层、两个全连接层、输出层。
进一步优选的,液滴图像输入液滴识别模型后,按顺序经过如下模块:尺寸5×5深度为6的第一卷积层;尺寸2×2步长为2的第一最大池化层;尺寸5×5深度为16的第二卷积层;尺寸2×2步长为2的第二最大池化层;120个神经元的第一全连接层;84个神经元的第二全连接层;最后通过softmax输出有效液滴或无效液滴两个类别。
优选的,采用训练数据集对液滴识别模型进行训练的训练策略为:使用Adam优化器对模型进行优化,学习率设置为固定值0.001。
步骤(4)中,有效液滴的中心区域设定为以有效液滴圆心为中心的3/4圆的面积区域。
本发明还提供了一种微液滴数字PCR液滴检测系统,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上执行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的微液滴数字PCR液滴检测方法。
传统的模式识别方法,例如基于迭代聚类方法、密度分水岭算法、最大类间方差法(大津法,Outs)等利用全局自动阈值分类的算法,虽然能全局性地进行液滴分割与定位,且具有不错的分割效果,但是液滴识别准确率和可靠性通常都不尽如人意,时常会出现假阴性和假阳性的检测结果,而且抗干扰能力差,检测结果的准确性,会严重受到反应单元中的杂点、噪声、实验批次等因素的影响。同时,部分算法为了对不同类型的无效液滴进行识别和滤除,需要设计大量人工特征或者配合特殊的芯片设计(例如要求液滴为正交垂直分布,不能是任意的液滴排布),费时费力且效果不好。
而基于机器学习的方法,例如随机森林、Mask-RCNN和编码解码模型(Encoder-Decoder)等方法,特别是使用卷积神经网络的方法,因为其固有优势,虽然有较好的无效液滴识别准确率,且具有一定的抗噪能力,不用设计人工特征,但是无法处理高通量数据,不适用于全局性地对液滴做定位与分割,同时,分割模型训练难度较大。
与现有技术相比,本发明的有益效果为:
(1)本发明创新性地将传统模式识别技术与机器学习方法相融合,解决微液滴数字PCR核酸分子定量分析中的核酸液滴分割和分类问题。
(2)将传统模式识别技术与机器学习方法相融合,解决了机器学习方法仅适用于分析包含少量反应单元(几千个)的小尺寸数字PCR图像,不适用于高通量分析的问题。
(3)Canny边缘检测结合Hough圆检测的微液滴分割定位算法,可以在任意液滴排布的数字PCR图像上进行精准的液滴定位和分割,免去了用于辅助液滴定位的特殊芯片结构的设计过程。
(4)现有技术对于较大的光斑、杂点污染和支撑物边缘等无法通过滤波方式去除的液滴,只能通过设计规整的反应单元定位或手动方式滤除。本发明,将统模式识别技术与机器学习方法相融合,实现了多种无效液滴的自动滤除,提高了数字PCR液滴识别与分析系统对阳性液滴的识别精度,极具商业价值。
(5)用取自不同批次、不同曝光度以及受多种噪声影响的数字PCR图像进行卷积神经网络训练。训练出的液滴检测模型具有较高的泛化性和鲁棒性。使用该模型进行数字PCR液滴检测,可以免去复杂的图像预处理和规范化过程,同时可以提高系统在不同曝光度情况下液滴检测的精度。
(6)检测速度更快。检测一张2456×2404分辨率的包含3万左右液滴的数字PCR图像,常规人工特征方法需要3-5分钟,而本发明所提出的方法仅用时12秒左右,检测时间显著缩短。
附图说明
图1为微液滴数字PCR液滴检测方法的流程示意图;
图2为USM图像增强前后对比,其中虚线上方为原始数字PCR图像,虚线下方为USM增强图像;
图3为直接对原始数字PCR图像做Canny边缘检测和对USM增强图做Canny边缘检测的对比,其中虚线上方为原始数字PCR图像,虚线下方为USM增强图像;
图4为直接对原始数字PCR图像进行Hough圆检测得到的液滴情况(a)和对USM增强图像进行Hough圆检测得到的液滴情况(b);
图5为有效液滴(a)和无效液滴包含的9种不同类型(b)-(n);
图6为有效/无效液滴识别模型的结构示意图;
图7为采用本发明的微液滴数字PCR液滴检测方法对微液滴数字PCR的检查结果图。
具体实施方式
本发明将传统模式识别技术与机器学习方法相融合,提出一种高通量数字PCR图像液滴识别与分析方法,包括如下步骤:数据预处理、液滴定位与分割、组建数据集、液滴识别模型的搭建与训练、阴性阳性液滴检测。总的来说,算法分为两阶段,第一阶段液滴定位与分割,第二阶段液滴类型识别。算法整体流程图如图1所示。
第一阶段,液滴定位与分割。首先使用非锐化掩蔽(USM)对数字PCR图像进行预处理,增强边缘信息。之后,使用Canny算法对预处理后的图像中的边缘进行检测,并输出边缘图像。输出的边缘图像通过Hough圆形检测,得到圆心的位置与半径信息。
第二阶段,液滴识别。根据第一阶段输出的液滴定位信息,使用卷积神经网络对被定位的液滴进行识别,最终输出每个液滴的位置信息、半径信息、有效/无效、阴性/阳性信息。
具体如下:
1、数据预处理
获取像素大小为3456*2404的高分辨率数字PCR图像。数据预处理阶段,在对液滴边缘锐化增强的同时,要尽可能减小对噪声点的增强。使用非锐化掩蔽(Unsharp Masking,USM)对液滴边缘进行增强,并确定锐化参数(锐化半径:3,锐化强度:500,阈值:0)。图像增强前后对比如图2所示,虚线上方为原始数字PCR图像,下方为USM增强图像。可以看到增强后,液滴边缘与背景的对比度更大。
2、液滴定位与分割
基于Canny边缘检测和Hough圆形检测,设计液滴分割与定位方法。
第一阶段,边缘检测。选取数据集中单通道灰度图像,经数据预处理后作为输入,使用Canny算法对图像中所包含的边缘信息进行检测。Canny 阈值设置为30,检测弱轮廓边缘,最终输出边缘轮廓图如图3所示。虚线上方为使用原图直接进行边缘检测的结果,虚线下方为使用增强图像进行边缘检测的结果。可以看到直接使用原图进行边缘检测时,许多阴性液滴边缘被漏检。
第二阶段,滴液检测。首先,将第一阶段输出的边缘轮廓图进行高斯滤波,设置高斯核尺寸3×3,设置高斯核x和y方向的标准偏差为0。滤波后的平滑边缘轮廓图,使用Hough圆检测算法进行液滴检测。Hough算法参数设置,圆心累加器阈值7.5,检测最大圆半径8,检测最小圆半径4。最终输出符合条件的液滴定位信息(圆心坐标与半径),如图4所示。图4为直接在原图上进行Hough圆检测得到的液滴情况(a)与在USM增强图上进行检测得到的液滴情况(b)对比。
3、组建数据集
组建训练神经网络模型所需的数据集。数据集中包含两类液滴——有效液滴(无噪声干扰)和无效液滴(受噪声干扰或为杂点)。无效液滴包含9种不同类型:图像边缘液滴、异物边缘液滴、模糊液滴、粘连液滴、图像拼接处液滴、光斑干扰液滴、含细碎光斑的液滴、泡形物干扰液滴和形态异常的液滴。数据中各类液滴形态举例如图5所示。图5中(a)-(n)依次为:有效液滴、图像边缘液滴、图像拼接处液滴、异物边缘液滴、粘连液滴。第二行从左至右依次为:光斑干扰液滴、泡形物干扰液滴、含细碎光斑的液滴、形态异常的液滴和模糊液滴。
有效液滴和各类无效液滴样本取自不同批次、不同曝光度的数字PCR图像,用来增强所训练出的神经网络模型的泛化性和鲁棒性。每个液滴的图像,以液滴检测部分提供的圆心位置为中心,48像素点为宽和高,从原始单通道数字PCR图像中进行截取。为了提高液滴识别法准确率,被截取的液滴样本,不仅包含待测液滴本身,同时也包含该液滴周围的邻近液滴和环境的图像信息。最后通过人工标注,组建为训练神经网络模型所需的液滴数据集。
4、液滴识别模型的搭建与训练
使用卷积神经网络作为有效/无效液滴识别模型,进行有效、无效液滴识别。按照液滴定位与分割阶段,Hough圆检测算法输出的液滴中心点坐标,在原始的单通道数字PCR图像上进行液滴定位和截取,截取48×48像素的液滴图像,送入训练好的卷积神经网络中,对每一个液滴进行有效或无效的分类,最后将分类结果输出。卷积神经网络分类后,系统将无效液滴滤除,将有效液滴送入下一阶段进行阴性阳性液滴判断。
有效/无效液滴识别模型的结构如图6所示。该模型包含输入层、两个卷积层、两个池化层、两个全连接层和输出层,最终输出有效和无效液滴两个类别。
48×48像素的液滴图像输入模型后,按顺序经过如下模块:尺寸5×5深度为6的卷积层;尺寸2×2步长为2的最大池化层;尺寸5×5深度为16的卷积层;尺寸2×2步长为2的最大池化层;120个神经元的全连接层;84个神经元的全连接层;最后通过softmax输出两个类别。
本发明中,有效/无效液滴识别模型的训练策略,使用Adam优化器对模型进行优化,学习率设置为固定值0.001。
5、阴性/阳性液滴检测。
卷积神经网络对液滴进行有效无效分类后,对有效液滴进行阴性/阳性判断。首先,计算每个有效液滴中心6×6像素区域的平均灰度值。之后,选取灰度最大和最小的两个液滴中心平均灰度值,计算其均值,并将该均值作为该样本中阴性阳性液滴的分类阈值。最后,将中心6×6像素区域的平均灰度值大于分类阈值的有效液滴分为阳性液滴,小于该分类阈值的有效液滴分为阴性液滴。数字PCR液滴识别与分析系统的最终检测结果如图7所示。
以上所述的实施例对本发明的技术方案和有益效果进行了详细说明,应理解的是以上所述仅为本发明的具体实施例,并不用于限制本发明,凡在本发明的原则范围内所做的任何修改、补充和等同替换等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种微液滴数字PCR液滴检测方法,其特征在于,包括以下步骤:
(1)获取不同批次、不同曝光度的微液滴数字PCR图像并进行预处理,在预处理后的图像上依次使用Canny边缘检测和Hough圆检测获得每个液滴的定位信息,根据液滴的定位信息在原始微液滴数字PCR图像中进行截取,获得液滴图像并对每个独立液滴进行人工标注,构建训练数据集;训练数据集中包含有效液滴图像和无效液滴图像;
(2)基于卷积神经网络构建液滴识别模型,使用训练数据集对液滴识别模型进行训练;
(3)将待测微液滴数字PCR图像进行预处理后,依次使用Canny边缘检测和Hough圆检测获得每个液滴的定位信息,根据液滴的定位信息在原始待测微液滴数字PCR图像中进行截取,获得每个液滴的图像,将截取的液滴图像按批次输入训练好的液滴识别模型,对液滴进行有效或无效分类识别;
(4)计算待测微液滴数字PCR图像中每个有效液滴中心区域的平均灰度值;选取中心区域平均灰度值最大和最小的两个液滴,计算两个液滴的中心区域平均灰度值的均值,将所述均值作为待测微液滴数字PCR图像中阳性液滴和阴性液滴的分类阈值;
将中心区域的平均灰度值大于或等于分类阈值的有效液滴分类为阳性液滴;将中心区域的平均灰度值小于分类阈值的有效液滴分类为阴性液滴。
2.根据权利要求1所述的微液滴数字PCR液滴检测方法,其特征在于,步骤(1)和步骤(3)中,所述的预处理包括:采用非锐化掩蔽对液滴边缘进行增强。
3.根据权利要求2所述的微液滴数字PCR液滴检测方法,其特征在于,非锐化掩蔽的锐化参数为:锐化半径为3,锐化强度为500,阈值为0。
4.根据权利要求2所述的微液滴数字PCR液滴检测方法,其特征在于,Canny边缘检测算法的最小阈值为20-50,最大阈值为最小阈值的三倍。
5.根据权利要求2所述的微液滴数字PCR液滴检测方法,其特征在于,Hough圆形检测算法的参数为:圆心累加器阈值为7.5,检测最大圆半径为标准液滴半径像素尺寸的4/3倍,检测最小圆半径为标准液滴半径像素尺寸的2/3倍。
6.根据权利要求1所述的微液滴数字PCR液滴检测方法,其特征在于,所述的无效液滴包括以下类型:图像边缘液滴、异物边缘液滴、模糊液滴、粘连液滴、图像拼接处液滴、光斑干扰液滴、含细碎光斑的液滴、泡形物干扰液滴和形态异常的液滴。
7.根据权利要求1所述的微液滴数字PCR液滴检测方法,其特征在于,步骤(1)和步骤(3)中,液滴图像以目标液滴圆心为中心,长宽分别为标准液滴直径的3倍。
8.根据权利要求1所述的微液滴数字PCR液滴检测方法,其特征在于,采用训练数据集对液滴识别模型进行训练的训练策略为:使用Adam优化器对模型进行优化。
9.根据权利要求1所述的微液滴数字PCR液滴检测方法,其特征在于,步骤(4)中,有效液滴的中心区域设定为以有效液滴圆心为中心的3/4圆的面积区域。
10.一种微液滴数字PCR液滴检测系统,其特征在于,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上执行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-9任一项所述的微液滴数字PCR液滴检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210442041.0A CN114549528B (zh) | 2022-04-26 | 2022-04-26 | 一种微液滴数字pcr液滴检测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210442041.0A CN114549528B (zh) | 2022-04-26 | 2022-04-26 | 一种微液滴数字pcr液滴检测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114549528A true CN114549528A (zh) | 2022-05-27 |
CN114549528B CN114549528B (zh) | 2022-08-05 |
Family
ID=81667149
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210442041.0A Active CN114549528B (zh) | 2022-04-26 | 2022-04-26 | 一种微液滴数字pcr液滴检测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114549528B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115138527A (zh) * | 2022-06-22 | 2022-10-04 | 深圳市双翌光电科技有限公司 | 通过视觉引导的快速加工路径生成方法 |
CN115170555A (zh) * | 2022-08-04 | 2022-10-11 | 格物致和(北京)生物科技有限公司 | 一种基于图像的计数方法和系统 |
CN117496274A (zh) * | 2023-12-29 | 2024-02-02 | 墨卓生物科技(浙江)有限公司 | 一种基于液滴图像的分类计数方法、系统和存储介质 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040209316A1 (en) * | 2003-03-14 | 2004-10-21 | Ritchlin Christopher T. | Methods and compositions related to joint inflammation diseases |
US20100303378A1 (en) * | 2009-05-26 | 2010-12-02 | Chun-Wen Chang | Edge parameter computing method for image and image noise omitting method utilizing the edge parameter computing method |
US20150133312A1 (en) * | 2012-06-01 | 2015-05-14 | Fred Hutchinson Cancer Research Center | Compositions and methods for detecting rare nucleic acid molecule mutations |
WO2015157369A1 (en) * | 2014-04-08 | 2015-10-15 | University Of Washington Through Its Center For Commercialization | Methods and apparatus for performing digital assays using polydisperse droplets |
CN107254511A (zh) * | 2017-04-27 | 2017-10-17 | 臻准生物科技(上海)有限公司 | 一种数字pcr芯片信号读取方法 |
CN107502657A (zh) * | 2017-07-12 | 2017-12-22 | 浙江大学 | 一种极速pcr(聚合酶链式反应)扩增和终点检测方法 |
US20180373921A1 (en) * | 2017-06-27 | 2018-12-27 | The Regents Of The University Of California | Label-free digital brightfield analysis of nucleic acid amplification |
CN109903296A (zh) * | 2019-02-15 | 2019-06-18 | 领航基因科技(杭州)有限公司 | 一种基于LBP-Adaboost算法的数字PCR液滴检测方法 |
CN111222393A (zh) * | 2019-10-12 | 2020-06-02 | 浙江大学 | 一种基于自学习神经网络的病理切片中印戒细胞检测方法 |
CN112070711A (zh) * | 2020-06-04 | 2020-12-11 | 清华大学 | 一种微液滴图像检测法中微液滴的分析方法 |
CN112215865A (zh) * | 2019-07-11 | 2021-01-12 | 上海交通大学 | 一种荧光显微图像下的微液滴自动检测方法 |
CN112813152A (zh) * | 2021-04-02 | 2021-05-18 | 深圳市博瑞生物科技有限公司 | 一种基于图像识别的数字pcr液滴荧光检测方法 |
-
2022
- 2022-04-26 CN CN202210442041.0A patent/CN114549528B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040209316A1 (en) * | 2003-03-14 | 2004-10-21 | Ritchlin Christopher T. | Methods and compositions related to joint inflammation diseases |
US20100303378A1 (en) * | 2009-05-26 | 2010-12-02 | Chun-Wen Chang | Edge parameter computing method for image and image noise omitting method utilizing the edge parameter computing method |
US20150133312A1 (en) * | 2012-06-01 | 2015-05-14 | Fred Hutchinson Cancer Research Center | Compositions and methods for detecting rare nucleic acid molecule mutations |
WO2015157369A1 (en) * | 2014-04-08 | 2015-10-15 | University Of Washington Through Its Center For Commercialization | Methods and apparatus for performing digital assays using polydisperse droplets |
CN107254511A (zh) * | 2017-04-27 | 2017-10-17 | 臻准生物科技(上海)有限公司 | 一种数字pcr芯片信号读取方法 |
US20180373921A1 (en) * | 2017-06-27 | 2018-12-27 | The Regents Of The University Of California | Label-free digital brightfield analysis of nucleic acid amplification |
CN107502657A (zh) * | 2017-07-12 | 2017-12-22 | 浙江大学 | 一种极速pcr(聚合酶链式反应)扩增和终点检测方法 |
CN109903296A (zh) * | 2019-02-15 | 2019-06-18 | 领航基因科技(杭州)有限公司 | 一种基于LBP-Adaboost算法的数字PCR液滴检测方法 |
CN112215865A (zh) * | 2019-07-11 | 2021-01-12 | 上海交通大学 | 一种荧光显微图像下的微液滴自动检测方法 |
CN111222393A (zh) * | 2019-10-12 | 2020-06-02 | 浙江大学 | 一种基于自学习神经网络的病理切片中印戒细胞检测方法 |
CN112070711A (zh) * | 2020-06-04 | 2020-12-11 | 清华大学 | 一种微液滴图像检测法中微液滴的分析方法 |
CN112813152A (zh) * | 2021-04-02 | 2021-05-18 | 深圳市博瑞生物科技有限公司 | 一种基于图像识别的数字pcr液滴荧光检测方法 |
Non-Patent Citations (2)
Title |
---|
JIE ZHANG ETAL.: "Research on Droplet Digital PCR Amplification System", 《2021 IEEE 20TH INTERNATIONAL CONFERENCE ON TRUST, SECURITY AND PRIVACY IN COMPUTING AND COMMUNICATIONS (TRUSTCOM)》 * |
刘聪等: "微滴式数字PCR中低浓度荧光微滴分类", 《光学精密工程》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115138527A (zh) * | 2022-06-22 | 2022-10-04 | 深圳市双翌光电科技有限公司 | 通过视觉引导的快速加工路径生成方法 |
CN115138527B (zh) * | 2022-06-22 | 2023-12-26 | 深圳市双翌光电科技有限公司 | 通过视觉引导的快速加工路径生成方法 |
CN115170555A (zh) * | 2022-08-04 | 2022-10-11 | 格物致和(北京)生物科技有限公司 | 一种基于图像的计数方法和系统 |
CN117496274A (zh) * | 2023-12-29 | 2024-02-02 | 墨卓生物科技(浙江)有限公司 | 一种基于液滴图像的分类计数方法、系统和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN114549528B (zh) | 2022-08-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114549528B (zh) | 一种微液滴数字pcr液滴检测方法及系统 | |
CN110334706B (zh) | 一种图像目标识别方法及装置 | |
US11430131B2 (en) | Foreground segmentation and nucleus ranking for scoring dual ISH images | |
CN108921163A (zh) | 一种基于深度学习的包装喷码检测方法 | |
CN110728681B (zh) | 一种Mura缺陷检测方法及装置 | |
CN112215790A (zh) | 基于深度学习的ki67指数分析方法 | |
CN110490836B (zh) | dPCR微阵列图像信息处理方法 | |
CN110148126B (zh) | 基于颜色分量组合和轮廓拟合的血液白细胞分割方法 | |
CN112365497A (zh) | 基于TridentNet和Cascade-RCNN结构的高速目标检测方法和系统 | |
CN106340007A (zh) | 一种基于图像处理的车身漆膜缺陷检测识别方法 | |
CN114022657B (zh) | 一种屏幕缺陷分类方法、电子设备及存储介质 | |
Wang et al. | Quick leukocyte nucleus segmentation in leukocyte counting | |
CN115439456A (zh) | 一种病理图像中对象检测识别方法及装置 | |
CN115294377A (zh) | 一种道路裂缝的识别系统及方法 | |
CN114972339A (zh) | 用于推土机结构件生产异常检测的数据增强系统 | |
CN113409271B (zh) | 一种镜头油污的检测方法、装置及设备 | |
CN112927182A (zh) | 一种数字pcr微阵列图像分析方法 | |
Inbar et al. | Analyzing the secondary wastewater-treatment process using Faster R-CNN and YOLOv5 object detection algorithms | |
CN113673396A (zh) | 一种孢子发芽率计算方法、装置及存储介质 | |
Bouilhol et al. | DeepSpot: A deep neural network for RNA spot enhancement in single-molecule fluorescence in-situ hybridization microscopy images | |
CN116363136B (zh) | 一种机动车部件自动化生产在线筛选方法及系统 | |
CN111881748A (zh) | 一种基于vbai平台建模的车道线视觉识别方法和系统 | |
CN115995023A (zh) | 瑕疵检测方法、装置、电子设备、计算机可读存储介质及产品检测方法 | |
CN112750118B (zh) | 一种基于自动视觉检测的单细胞孔板测序中鉴定细胞个数的新方法及系统 | |
CN114152557A (zh) | 基于图像分析的血细胞计数方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |