CN116630867B - 一种基于Mask R-CNN的白带滴虫检测与跟踪方法 - Google Patents

一种基于Mask R-CNN的白带滴虫检测与跟踪方法 Download PDF

Info

Publication number
CN116630867B
CN116630867B CN202310917597.5A CN202310917597A CN116630867B CN 116630867 B CN116630867 B CN 116630867B CN 202310917597 A CN202310917597 A CN 202310917597A CN 116630867 B CN116630867 B CN 116630867B
Authority
CN
China
Prior art keywords
trichomonas
tracks
detection
detections
mask
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310917597.5A
Other languages
English (en)
Other versions
CN116630867A (zh
Inventor
张庆东
林崇应
赵少华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Mejer Medical Technology Co ltd
Original Assignee
Shenzhen Mejer Medical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Mejer Medical Technology Co ltd filed Critical Shenzhen Mejer Medical Technology Co ltd
Priority to CN202310917597.5A priority Critical patent/CN116630867B/zh
Publication of CN116630867A publication Critical patent/CN116630867A/zh
Application granted granted Critical
Publication of CN116630867B publication Critical patent/CN116630867B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/096Transfer learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Abstract

本申请涉及医学细胞识别的技术领域,尤其涉及一种基于Mask R‑CNN的白带滴虫检测与跟踪方法。本申请通过使用Mask R‑CNN实例分割模型准确地识别出视频序列中的Detections,Detections包括滴虫的质心坐标、外接矩形框及mask区域,然后通过使用Deepsort算法对滴虫进行实时跟踪并统计运动滴虫和非运动待确认滴虫的个数。当在Detections中不包含运动滴虫的情况下,对检出的Detections进行二次判断,从而识别出一些运动幅度不大或者主体不动只有鞭毛摆动的静态滴虫,最后综合检测结果输出白带标本的属性,相比较于相关技术中基于时间序列的帧差法对运动目标进行分析的方法,检出率更高、识别率更好,大大降低了白带临床检测中滴虫的假阴性率。

Description

一种基于Mask R-CNN的白带滴虫检测与跟踪方法
技术领域
本申请涉及医学细胞识别的技术领域,尤其是涉及一种基于Mask R-CNN的白带滴虫检测与跟踪方法。
背景技术
白带作为女性阴道分泌物,由阴道黏膜渗出物、子宫颈腺体及子宫内膜分泌物混合而成,其中存在的某些微生物对判断患者的病情具有重要的参考价值,因此白带常规检查在临床上有着非常广泛的应用。通过白带常规检查,可以了解阴道的清洁度,判断是否感染致病菌,从而辅助医生对病情做出更加准确的分析。
阴道滴虫是一种存在于阴道里面的极其微小有鞭毛的原虫生物,是引起滴虫性阴道炎的病原体。阴道滴虫呈梨形,虫体顶端有鞭毛4根,后端尖,大小约为多核白细胞的2~3倍。滴虫性阴道炎属性传播性传染病,对女性健康非常不利,所以对白带中的滴虫进行检测具有十分重要的意义。
目前在白带常规检查中,一般基于运动建模算法或者基于神经网络的检测方法对滴虫进行检测,原理都是利用基于时间序列的帧差法,获取图像的前景与背景,找出其中存在的运动目标,通过对运动目标进行分析识别出滴虫。此种方式对运动幅度较大的滴虫检测精度较理想,但是对运动幅度不大或者主体不动只有鞭毛摆动的静态滴虫检测精度较低,极易造成漏检,导致白带常规检验的假阴性,耽误病情的治疗。
发明内容
为了解决现有的滴虫检测方法对运动幅度不大或者主体不动的滴虫检测精度较低以及白带滴虫临床检验假阴性率较高的问题,本申请提供一种基于Mask R-CNN的白带滴虫检测与跟踪方法,采用如下的技术方案:
一种基于Mask R-CNN的白带滴虫检测与跟踪方法,包括如下步骤:
在预设轨迹点上对白带标本进行拍摄,得到视频序列并对所述视频逐帧进行预处理;
利用Mask R-CNN模型对预处理后的视频序列进行检测,得到目标检测对象,记为Detections,其中,所述Detections包括视频序列中滴虫的质心坐标、外接矩形框以及mask区域;
使用Deepsort算法对所述Detections中的滴虫进行实时跟踪并统计运动滴虫和非运动待确认滴虫的个数;
在所述Detections中不包含运动滴虫的情况下,对所述Detections中非运动待确认滴虫进行二次判断;若二次判断结果中滴虫个数大于0,则判定所述白带标本为滴虫阳性,否则为滴虫阴性。
通过采用上述技术方案,本申请通过在各个预设轨迹点上对白带标本进行拍摄,得到视频序列;在对视频进行预处理后,利用Mask R-CNN模型对预处理后的视频序列进行检测,得到Detections,其中,使用Mask R-CNN实例分割模型能够准确地识别出视频序列中滴虫的质心坐标、外接矩形框及mask区域,相比较于相关技术中基于时间序列的帧差法对运动目标进行分析识别出滴虫而言,检出率更高,不易造成漏检;然后,本申请通过使用Deepsort算法对Detections中的滴虫进行实时跟踪并统计运动滴虫和非运动待确认滴虫的个数。当Detections中包含运动滴虫时,则直接判定该白带样本为滴虫阳性,检测全部结束;当在Detections中不包含运动滴虫的情况下,对检出的Detections进行二次判断,从而识别出一些运动幅度不大或者主体不动只有鞭毛摆动的静态滴虫,最后综合检测结果输出白带标本的属性;相比于现有技术,滴虫的检出率更高、识别率更好,大大降低了白带临床检测中滴虫的假阴性率。
可选的,所述对视频逐帧进行预处理包括:
对所述视频逐帧进行色彩变换。
通过采用上述技术方案,本申请通过将拍摄到的原始视频逐帧进行色彩变换,降低不同白带样本图像间的背景色彩差异,从而最大化缩小滴虫RGB颜色的整体跨度,使原始视频帧中滴虫的特征分布更加聚集,从而便于后续利用Mask R-CNN模型对视频序列进行检测。
可选的,所述色彩变换包括如下步骤:
确定模板图像
单帧读取所述视频,得到目标图像,并分别计算通道内 的灰度均值和方差;
三个通道内分别对目标图像作线性变换得到,变换公式为:
其中中当前通道内某一像素点的灰度值,中当前通道内某一 像素点变换后的灰度值,分别为计算得到的在当前通道内的灰度均 值,分别为计算得到的在当前通道内的灰度方差;
对经线性变换得到的图像作约束处理,条件为:
,<0;, 255。
通过采用上述技术方案,具体公开了对原始视频帧进行色彩变换的步骤,使原始视频帧中的特征分布更加聚集,从而便于后续利用Mask R-CNN模型对视频序列进行检测。
可选的,所述Mask R-CNN模型的建立过程,包括如下步骤:
制作滴虫样本集,对滴虫进行标注,其中,所述样本集包括训练集和测试集;
统计所述样本集中滴虫的形态特征,其中,所述形态特征包括滴虫的面积、轮廓等效半径、最小外接矩形宽高比、RGB三通道色彩均值;
基于统计的形态特征值对Mask R-CNN网络中的对应参数进行修正;
基于迁移学习训练Mask R-CNN网络,依据测试集结果微调Mask R-CNN网络结构并保存权重参数。
通过采用上述技术方案,具体公开了Mask R-CNN模型的建立过程,通过统计滴虫样本集中滴虫的形态特征,包括滴虫的面积、轮廓等效半径、最小外接矩形宽高比、RGB三通道色彩均值等,然后对Mask R-CNN网络中的对应参数进行修正,再基于迁移学习训练MaskR-CNN网络,依据测试集结果微调Mask R-CNN网络结构并保存权重参数,从而使得训练后的Mask R-CNN模型能够准确识别视频序列中滴虫的质心坐标、外接矩形框以及mask区域。
可选的,所述使用Deepsort算法对所述Detections中的滴虫进行实时跟踪并统计运动滴虫的个数的过程中,包括如下步骤:
对第1次检测出的Detections初始化为对应的轨迹,记为Tracks,设定所述Tracks的状态为不确定态;初始化卡尔曼滤波的运动变量,使用卡尔曼滤波预测所述Tracks对应的矩形框,得到已预测Tracks;
将当前帧图像中检测到的Detections与所述已预测Tracks进行目标匹配,得到目标匹配结果,所述目标匹配结果包括Tracks失配、Detections失配和匹配成功;
在同一所述Tracks连续匹配成功次数≥3的情况下,确定所述Detections为滴虫,将所述Detections对应的Tracks的状态设定为确定态,标记所述Detections的ID并记录所述Detections的位置信息;
将状态为确定态的Tracks与当前帧检测到的Detections进行级联匹配,统计匹配结果;
在重复循环所述目标匹配直到统计完整个视频的匹配结果之后,依据ID遍历所有追踪到的滴虫,分别计算同一ID滴虫记录的第一次质心坐标和中间一次、最后一次质心坐标之间的欧式距离,取两者中的最大值作为距离值,若所述距离值大于预设欧式距离阈值,则判定该滴虫为运动滴虫,否则判定为非运动待确认滴虫,其中,所述预设欧式距离阈值为5;
统计运动滴虫和非运动待确认滴虫的个数,若运动滴虫个数大于0,则直接判定白带样本为滴虫阳性,检测结束。
通过采用上述技术方案,本申请通过使用Deepsort算法,对Mask R-CNN模型检测出来的Detections初始化为轨迹,然后使用卡尔曼滤波预测轨迹对应的矩形框,通过多次匹配将Detections中的滴虫确定出来,然后通过欧式距离阈值判定是否有运动滴虫,当没有运动滴虫时,对检出的Detections进行二次判断,以进一步判断剩余的Detections是否存在运动幅度不大的静态滴虫。
可选的,所述将当前帧图像中检测到的Detections与所述已预测Tracks进行目标匹配,得到目标匹配结果的过程中,包括如下步骤:
确认当前已存在的所有Tracks的状态,其中,Tracks的状态包括确定态Tracks和不确定态Tracks;
将所有不确定态Tracks与当前帧检测到的Detections逐一进行交并比匹配,依据匹配结果计算代价矩阵;
将所有所述代价矩阵输入匈牙利算法,得到目标匹配结果,所述目标匹配结果包括Tracks失配、Detections失配和匹配成功;
在Tracks失配的情况下,若当前该Detections对应的Tracks为不确定态,则直接删除;若为确定态,且满足已经和Detections连续失配次数达30次以上,则直接删除,否则继续进行匹配;
在Detections失配的情况下,创建一个新Tracks,状态设定为不确定态,继续进行匹配,若其连续匹配成功次数大于或等于3时,将其状态更改为确定态,否则直接删除;
在匹配成功的情况下,若当前该Tracks为不确定态,继续进行匹配;当连续匹配成功次数≥3时,将其状态更改为确定态,通过卡尔曼滤波更新其对应的Tracks变量进行级联匹配,若连续匹配成功次数小于3,则直接删除该轨迹。
可选的,所述将状态为确定态的Tracks与当前帧检测到的Detections进行级联匹配,统计匹配结果的过程中,包括如下步骤:
以当前检测帧为基准,依次遍历前30帧追踪过程中存在的确定态Tracks,计算每层中所有确定态Tracks的深度特征与当前帧检测到的所有Detections的对应特征之间的余弦距离,取所有所述余弦距离中的最小值作为该Tracks与检测结果之间的计算值,得到代价矩阵;
对所述代价矩阵进行运动信息约束,计算当前Tracks与所有Detections的马氏距离,并将代价矩阵中马氏距离大于预设马氏距离阈值的值设为无穷大;
将已进行运动信息约束的代价矩阵输入匈牙利算法,得到级联匹配结果,为匹配成功的滴虫标记相同ID,记录其位置信息,通过卡尔曼滤波更新其对应的Tracks变量,并利用Deepsort模型提取当前对应Detections的深度特征和运动信息特征并保存。
可选的,在所述Detections中不包含运动滴虫的情况下,对所述Detections进行二次判断的过程中,包括如下步骤:
基于记录的Detections的ID,遍历各Detections的质心坐标,去除位置重复区域;
将Detections包含的Mask区域以及外接矩形框区域映射到原始白带样本图像中;
计算Detections的面积、圆形度和最小外接矩形,依据面积阈值、最小外接矩形宽高比阈值和圆形度阈值,对与滴虫差异大于预设阈值的区域进行过滤;
计算剩余待判断Detections的最小外接矩形与水平方向的倾斜角度a,并将其最小外接矩形区域包含的彩色子图像沿逆时针方向旋转倾斜角度a后保存;
将保存的子图像分为滴虫与非滴虫两类,并统一所述子图像的尺寸;
修改resnet50网络输出层,冻结该网络的前26层,将基于ImageNet数据集的预训练权重迁移到该模型中作为初始权重进行训练,得到滴虫的2分类resnet50模型;
使用resnet50模型对统一尺寸后的所述子图像进行分类,判断所述子图像是否为滴虫,并进行计数。
第三方面,本申请提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于MaskR-CNN的白带滴虫检测与跟踪方法的步骤。
第四方面,本申请提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述基于Mask R-CNN的白带滴虫检测与跟踪方法的步骤。
综上所述,本申请包括以下至少一种有益技术效果:
1.本申请通过使用Deepsort算法,对Mask R-CNN模型检测出来的Detections初始化为轨迹,然后使用卡尔曼滤波预测轨迹对应的矩形框,通过多次匹配将Detections中的滴虫确定出来,然后通过欧式距离阈值判定是否有运动滴虫。当有运动滴虫时,直接判定该样本为滴虫阳性。当没有运动滴虫时,对非运动待确认滴虫进行二次判断,以进一步判断剩余的Detections是否存在运动幅度不大的静态滴虫,相比于现有技术,滴虫的检出率更高、识别率更好,大大降低了白带临床检测中滴虫的假阴性率;
2.本申请通过将拍摄到的原始视频逐帧进行色彩变换,降低不同病人白带样本图像间的背景色彩差异,从而最大化缩小滴虫所含RGB颜色的整体跨度,使原始视频帧中滴虫的特征分布更加聚集,从而便于后续利用Mask R-CNN模型对视频序列进行更精准的检测;
3.本申请通过使用预先训练的滴虫2分类resnet50模型,对检出的Detections中非运动待确认的滴虫进行二次判断,从而区分出Detections中运动幅度不大的静态滴虫,大大降低了白带临床检测中滴虫的假阴性率;同时,使用模型的判断效率更高,提高了滴虫检测速率。
附图说明
图1是本申请实施例一种基于Mask R-CNN的白带滴虫检测与跟踪方法的一个示例性流程示意图;
图2是本申请实施例中Deepsort算法的一个理解示意图;
图3是本申请实施例中对Detections中非运动待确认滴虫进行二次判断的一个示例性流程图;
图4是本申请实施例中resnet50网络结构的一个理解示意图;
图5是本申请实施例中计算机设备的内部结构图。
具体实施方式
本申请以下实施例中所使用的术语只是为了描述特定实施例的目的,而并非旨在作为对本申请的限制。如在本申请的说明书和所附权利要求书中所使用的那样,单数表达形式“一个”、“一种”、“所述”、“上述”、“该”和“这一”旨在也包括复数表达形式,除非其上下文中明确地有相反指示。还应当理解,本申请中使用的术语“和/或”是指包含一个或多个所列出项目的任何或所有可能组合。
以下,术语“第一”、“第二”仅用于描述目的,而不能理解为暗示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征,在本申请实施例的描述中,除非另有说明,“多个”的含义是两个或两个以上。
相关技术中,对滴虫的检测方式主要是基于运动建模算法或者基于神经网络的检测方法,原理都是利用基于时间序列的帧差法,获取图像的前景与背景,找出其中存在的运动目标,通过对运动目标进行分析识别出滴虫。然而这种方法只能识别出运动幅度较大的滴虫,对运动幅度不大或者主体不动只有鞭毛摆动的滴虫检测精度较低,极易造成漏检。
本申请实施例提出的基于Mask R-CNN的白带滴虫检测与跟踪方法,期望通过MaskR-CNN算法,检测出白带标本中的滴虫并进行精确地分割,然后通过Deepsort算法进行实时跟踪并统计运动滴虫和非运动待确认滴虫的个数。当存在运动滴虫时,直接判定当前白带样本为滴虫阳性,检测全部结束;当不存在运动滴虫时,对非运动待确认滴虫进行二次判断,以提高滴虫的检出率和识别率,降低白带临床检测中滴虫的假阴性率。
下面结合一些具体的实施例进行具体介绍。
参照图1,为本申请实施例一种基于Mask R-CNN的白带滴虫检测与跟踪方法的一个示例性流程示意图。
S1:依次在各个预设轨迹点上对白带标本进行拍摄,得到视频序列。
具体的,步骤S1可包括:
S1.1:吸取经过处理的白带标本液,滴加到定量玻片孔位中。
其中,白带标本液预先经过洗脱、稀释、混匀等处理,使用样本针吸取经过处理的白带标本液,然后滴加到定量玻片孔位。
S1.2:对玻片孔位进行自动聚焦,依次在各个预设轨迹点上连续拍摄T秒,得到原始视频序列,其中T>=5s。
将承载有白带标本液玻片移动到显微镜平台下,对玻片孔位进行自动聚焦,然后在各个预设轨迹点上拍摄T秒得到原始视频序列。具体的,本实施例中,放大倍数为10X40,每个预设轨迹点拍摄5秒的时间。
可选的,在步骤S1之后,可以执行步骤S2,对视频序列进行预处理。
S2:对视频序列逐帧进行色彩变换。
其中,由于白带显微环境的复杂性,不同病人的白带样本图像存在较大的色彩差异,对原始视频逐帧进行色彩变换能够降低这些色彩差异,最大化缩小滴虫所含RGB颜色的整体跨度,使原始视频帧中滴虫的特征分布更加聚集,便于后续利用Mask R-CNN模型对视频序列进行更加精确的检测。
具体的,步骤S2可包括:
S2.1:确定模板图像
其中,模板图像为一张从标本集图像中挑选出的聚焦清晰、色彩均匀且含有较多滴虫的RGB彩色图像。
S2.2:单帧读取S1.2中拍摄的原始视频,得到目标图像,并分别计算通道内的灰度均值和方差。
S2.3:在三个通道内分别对目标图像作线性变换得到,变换公式 为:
其中中当前通道内某一像素点的灰度值,中当前通道内某一 像素点变换后的灰度值,分别为计算得到的在当前通道内的灰度均 值,分别为计算得到的在当前通道内的灰度方差。
S2.4:对S2.3中经线性变换得到的图像作约束处理,条件为:
,<0;, 255。
S2.5:依次将预处理后的视频序列保存到指定路径。
S3:利用Mask R-CNN模型对预处理后的视频序列逐帧进行检测,得到目标检测对象,记为Detections。
其中,Detections包括视频序列中滴虫的质心坐标、外接矩形框以及mask区域,还包括外接矩形框坐标等。
具体的,本实施例中,Mask R-CNN模型的训练过程包括:
S3.1:制作滴虫样本集,对样本集中的滴虫进行标注,其中,样本集包括训练集和测试集。
具体的,本实施例中,收集8000张滴虫样本图像作为训练集和测试集,训练集和测试集的数量比为4:1,然后使用Labelme软件对滴虫进行标注。其中,Labelme软件是一种开源的图像标注工具,用于创建定制化标注任务或执行图像标注。
S3.2:统计样本集中滴虫的形态特征。
其中,形态特征包括滴虫的面积、轮廓等效半径、最小外接矩形宽高比、RGB三通道色彩均值。
S3.3:基于统计的滴虫形态特征值对Mask R-CNN模型中的对应参数进行修正。
其中,Mask R-CNN模型中包括多个参数,其中重要参数包括Mean_Pixels(RGB三通道色彩均值),Anchor_Scales(每个特征尺度上Anchor的base尺度),Anchor_Ratios(Anchor的宽高比)等。本实施例中,修正后的参数具体为Mean_Pixels=[166,153,112],Anchor_Scales=[16,32,64,128,256],Anchor_Ratios=[0.66,1.1,1.5]。
S3.4:基于迁移学习训练Mask R-CNN网络,依据测试集结果微调Mask R-CNN网络结构并保存权重参数。
在经过迁移学习算法训练Mask R-CNN网络后,根据测试集结果微调Mask R-CNN网络结构并保存权重参数,使得Mask R-CNN模型能够准确识别出视频序列中滴虫的质心坐标、外接矩形框以及mask区域。
S4:使用Deepsort算法对Detections中的滴虫进行实时跟踪。
参照图2,为Deepsort算法的一个理解示意图。
Deepsort算法具体应用在对Detections中的滴虫进行实时跟踪并统计时,可包括如下步骤:
S4.1:对第1次检测出的Detections初始化为对应的轨迹,记为Tracks,设定Tracks的状态为不确定态;初始化卡尔曼滤波的运动变量,使用卡尔曼滤波预测Tracks对应的矩形框,得到已预测Tracks。
其中,卡尔曼滤波是一种利用线性系统状态方程,通过系统输入输出观测数据,对系统状态进行最优估计的算法。由于观测数据中包括系统中的噪声和干扰的影响,所以最优估计也可看作是滤波过程。从卡尔曼滤波预测开始,由于每一时刻的检测目标组在一起就相当于构成一组轨迹,因此记为Tracks;经过卡尔曼滤波预测后,会对当前帧预测一个已预测轨迹。
S4.2:将当前帧图像中检测到的Detections与已预测Tracks进行目标匹配,得到目标匹配结果,目标匹配结果包括Tracks失配、Detections失配和匹配成功。
具体的,S4.2可包括:
S4.2.1:确认当前已存在的所有Tracks的状态,其中,Tracks的状态包括确定态Tracks和不确定态Tracks。
S4.2.2:将所有不确定态Tracks与当前帧检测到的Detections逐一进行IOU(交并比)匹配,依据匹配结果计算代价矩阵。
S4.2.3:将所有代价矩阵输入匈牙利算法,得到目标匹配结果,目标匹配结果包括Tracks失配、Detections失配和匹配成功。
S4.2.4:在Tracks失配的情况下,若当前该Detections对应的Tracks为不确定态,则直接删除;若为确定态,且满足已经和Detections连续失配次数达30次以上,则直接删除,否则继续进行匹配。
S4.2.5:在Detections失配的情况下,创建一个新Tracks,状态设定为不确定态,继续进行匹配,若其连续匹配成功次数大于或等于3时,将其状态更改为确定态,否则直接删除。
S4.2.6:在匹配成功的情况下,若当前该Tracks为不确定态,继续进行匹配;当连续匹配成功次数大于或等于3时,将其状态更改为确定态,通过卡尔曼滤波更新其对应的Tracks变量进行级联匹配。
S4.3:在同一Tracks连续匹配成功次数>=3的情况下,确定Detections为滴虫,将Detections对应的Tracks的状态设定为确定态,标记Detections的ID并记录Detections的位置信息。
S4.4:将状态为确定态的Tracks与当前帧检测到的Detections进行级联匹配,统计匹配结果。
具体的,S4.4可包括:
S4.4.1:以当前检测帧为基准,依次遍历前30帧追踪过程中存在的确定态Tracks,计算每层中所有确定态Tracks的深度特征与当前帧检测到的所有Detections的对应特征之间的余弦距离,取所有余弦距离中的最小值作为该Tracks与检测结果之间的计算值,得到代价矩阵。
S4.4.2:对代价矩阵进行运动信息约束,计算当前Tracks与所有Detections的马氏距离,并将代价矩阵中马氏距离大于预设马氏距离阈值的值设为无穷大,其中预设马氏距离阈值为9.4877。
S4.4.3:将已进行运动信息约束的代价矩阵输入匈牙利算法,得到级联匹配结果,为匹配成功的滴虫标记相同ID,记录其位置信息,通过卡尔曼滤波更新其对应的Tracks变量,并利用Deepsort模型提取当前对应Detections的深度特征和运动信息特征,保存在该Tracks的列表中.
S4.5:在重复循环目标匹配直到统计完整个视频的匹配结果之后,依据ID遍历所有追踪到的滴虫,分别计算同一ID滴虫记录的第一次质心坐标和中间一次、最后一次质心坐标之间的欧式距离,取两者中的最大值作为距离值,若该距离值大于预设欧式距离阈值,则判定该滴虫为运动滴虫,否则判定为非运动待确认滴虫,其中,预设欧式距离阈值为5。
S5:统计运动滴虫的个数。
S6:判断运动滴虫个数是否大于0。
若运动滴虫个数大于0,则直接判定白带样本为滴虫阳性,检测结束。
在Detections中不包含运动滴虫的情况下,执行步骤S7。
S7:对Detections进行二次判断。
其中,尽管拍摄的视频中未检测到运动滴虫,但实际白带标本中可能存在一些没有位移变化或者位移变化很小的静态滴虫,可能是因为温度、环境等因素已经死掉,或者是因为主体活性比较弱只有鞭毛在摆动,此类滴虫在形态上与某些类别的白细胞极为相似,所以,在不包含运动滴虫的情况下,需要对这类滴虫进行二次判断,以提高白带临床检测中滴虫的检出率。
参照图3,为本申请实施例对Detections中非运动待确认滴虫进行二次判断的一个示例性流程图。
具体的,步骤S7可包括:
S7.1:基于记录的Detections的ID,遍历各Detections的质心坐标,去除位置重复区域。
S7.2:将Detections包含的Mask区域以及外接矩形框区域映射到色彩变换后的原始白带样本图像中。
其中,在一些对视频序列进行了色彩变换的实施例中,将Detections包含的Mask区域以及外接矩形框区域映射到色彩变换后的原始白带样本图像中;在其他实施例中,也可以直接将Detections包含的Mask区域以及外接矩形框区域映射到原始白带样本图像中。
S7.3:计算Detections的面积、圆形度和最小外接矩形,依据面积阈值、最小外接矩形宽高比阈值和圆形度阈值,对与滴虫差异大于预设阈值的区域进行过滤。
其中,本实施例中,预设阈值包括面积阈值为5000px,即5000个像素点的大小,最小外接矩形宽高比阈值为1.8,圆形度阈值为0.55。
S7.4:计算剩余待判断Detections的最小外接矩形与水平方向的倾斜角度a。
S7.5:将最小外接矩形区域包含的彩色子图像沿逆时针方向旋转倾斜角度a后保存。
S7.6:将保存的子图像分为滴虫与非滴虫两类,并统一子图像的尺寸。
S7.7:使用resnet50模型对统一尺寸后的子图像进行分类,判断子图像是否为滴虫,并进行计数。
参照图4,为本申请实施例resnet50网络结构的一个理解示意图。
使用resnet50模型进行分类包括预先修改resnet50网络输出层,冻结该网络的前26层,将基于ImageNet数据集的预训练权重迁移到该模型中作为初始权重进行训练,得到滴虫的2分类resnet50网络模型。
S8:二次判断结果中滴虫的个数是否大于0。
若二次判断结果中滴虫的个数为0,则判定检测的白带标本为滴虫阴性,否则为滴虫阳性,检测结束。
本申请实施例一种基于Mask R-CNN的白带滴虫检测与跟踪方法的实施原理为:本申请通过Mask R-CNN算法,检测出白带标本中的滴虫并进行精确地分割,然后通过Deepsort算法进行实时跟踪并统计运动滴虫和非运动待确认滴虫的个数。当存在运动滴虫时,直接判定该白带样本为滴虫阳性,检测全部结束;当不存在运动滴虫时,对非运动待确认滴虫进行二次判断,以提高滴虫的检出率和识别率,降低白带临床检测中滴虫的假阴性率。
在一个实施例中,本申请提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种一种基于Mask R-CNN的白带滴虫检测与跟踪方法。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,上述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上均为本申请的较佳实施例,并非依此限制本申请的保护范围,故:凡依本申请的结构、形状、原理所做的等效变化,均应涵盖于本申请的保护范围之内。

Claims (5)

1.一种基于Mask R-CNN的白带滴虫检测与跟踪方法,其特征在于,包括如下步骤:
在预设轨迹点上对白带标本进行拍摄,得到视频序列并对所述视频逐帧进行预处理;其中,所述预处理包括对所述视频逐帧进行色彩变换;
利用Mask R-CNN模型对预处理后的视频序列进行检测,得到目标检测对象,记为Detections,其中,所述Detections包括视频序列中滴虫的质心坐标、外接矩形框以及mask区域;
使用Deepsort算法对所述Detections中的滴虫进行实时跟踪并统计运动滴虫和非运动待确认滴虫的个数;
在所述Detections中不包含运动滴虫的情况下,对所述Detections中非运动待确认滴虫进行二次判断;若二次判断结果中滴虫个数大于0,则判定所述白带标本为滴虫阳性,否则为滴虫阴性;
其中,所述使用Deepsort算法对所述Detections中的滴虫进行实时跟踪并统计运动滴虫和非运动待确认滴虫的个数的过程中,包括如下步骤:
将第1次检测出的Detections初始化为对应的轨迹,记为Tracks,设定所述Tracks的状态为不确定态;初始化卡尔曼滤波的运动变量,使用卡尔曼滤波预测所述Tracks对应的矩形框,得到已预测Tracks;
将当前帧图像中检测到的Detections与所述已预测Tracks进行目标匹配,得到目标匹配结果,所述目标匹配结果包括Tracks失配、Detections失配和匹配成功;
在同一所述已预测Tracks连续匹配成功次数≥3的情况下,确定所述Detections为滴虫,将所述Detections对应的Tracks的状态设定为确定态,标记所述Detections的ID并记录所述Detections的位置信息;
将状态为确定态的Tracks与当前帧检测到的Detections进行级联匹配,统计匹配结果;
在重复循环所述目标匹配直到统计完整个视频的匹配结果之后,依据ID遍历所有追踪到的滴虫,分别计算同一ID滴虫记录的第一次质心坐标和中间一次、最后一次质心坐标之间的欧式距离,取两者中的最大值作为距离值,若所述距离值大于预设欧式距离阈值,则判定该滴虫为运动滴虫,否则判定为非运动待确认滴虫;
统计运动滴虫和非运动待确认滴虫的个数,若运动滴虫个数大于0,则直接判定白带样本为滴虫阳性,检测结束;
其中,所述将当前帧图像中检测到的Detections与所述已预测Tracks进行目标匹配,得到目标匹配结果的过程中,包括如下步骤:
确认当前已存在的所有Tracks的状态,其中,Tracks的状态包括确定态Tracks和不确定态Tracks;
将所有不确定态Tracks与当前帧检测到的Detections逐一进行交并比匹配,依据匹配结果计算代价矩阵;
将所有所述代价矩阵输入匈牙利算法,得到目标匹配结果,所述目标匹配结果包括Tracks失配、Detections失配和匹配成功;
在Tracks失配的情况下,若当前该Detections对应的Tracks为不确定态,则直接删除;若为确定态,且满足已经和Detections连续失配次数达30次以上,则直接删除,否则继续进行匹配;
在Detections失配的情况下,创建一个新Tracks,状态设定为不确定态,继续进行匹配,若其连续匹配成功次数≥3时,将其状态更改为确定态,否则直接删除;
在匹配成功的情况下,若当前该Tracks为不确定态,继续进行匹配;当连续匹配成功次数≥3时,将其状态更改为确定态,通过卡尔曼滤波更新其对应的Tracks变量进行级联匹配,若连续匹配成功次数<3,则直接删除该轨迹;
其中,所述将状态为确定态的Tracks与当前帧检测到的Detections进行级联匹配,统计匹配结果的过程中,包括如下步骤:
以当前检测帧为基准,依次遍历前N帧追踪过程中存在的确定态Tracks,计算每层中所有确定态Tracks的深度特征与当前帧检测到的所有Detections的对应特征之间的余弦距离,取所有所述余弦距离中的最小值作为该Tracks与检测结果之间的计算值,得到代价矩阵;
对所述代价矩阵进行运动信息约束,计算当前Tracks与所有Detections的马氏距离,并将代价矩阵中马氏距离大于预设马氏距离阈值的值设为无穷大;
将已进行运动信息约束的代价矩阵输入匈牙利算法,得到级联匹配结果,为匹配成功的滴虫标记相同ID,记录其位置信息,通过卡尔曼滤波更新其对应的Tracks变量,并利用Deepsort模型提取当前对应Detections的深度特征和运动信息特征并保存;
其中,在所述Detections中不包含运动滴虫的情况下,对所述Detections中非运动待确认滴虫进行二次判断的过程中,包括如下步骤:
基于记录的Detections的ID,遍历各Detections的质心坐标,去除位置重复区域;
将Detections包含的Mask区域以及外接矩形框区域映射到原始白带样本图像中;
计算Detections的面积、圆形度和最小外接矩形,依据面积阈值、最小外接矩形宽高比阈值和圆形度阈值,对与滴虫差异大于预设阈值的区域进行过滤;
计算剩余待判断Detections的最小外接矩形与水平方向的倾斜角度a,并将其最小外接矩形区域包含的彩色子图像沿逆时针方向旋转倾斜角度a后保存;
将保存的子图像分为滴虫与非滴虫两类,并统一所述子图像的尺寸;
修改resnet50网络输出层,冻结该网络的前26层,将基于ImageNet数据集的预训练权重迁移到该模型中作为初始权重进行训练,得到滴虫的2分类resnet50模型;
使用resnet50模型对统一尺寸后的所述子图像进行分类,判断所述子图像是否为滴虫,并进行计数。
2.根据权利要求1所述的基于Mask R-CNN的白带滴虫检测与跟踪方法,其特征在于,所述色彩变换包括如下步骤:
确定模板图像
单帧读取所述视频,得到目标图像,并分别计算/>、/>在/>通道内的灰度均值和方差;
三个通道内分别对目标图像/>作线性变换得到/>,变换公式为:
其中为/>中当前通道内某一像素点的灰度值,/>为/>中当前通道内某一像素点变换后的灰度值,/>、/>分别为计算得到的/>和/>在当前通道内的灰度均值,/>分别为计算得到的/>和/>在当前通道内的灰度方差;
对经线性变换得到的图像作约束处理,条件为:
,/><0;/>,/> 255。
3.根据权利要求1所述的基于Mask R-CNN的白带滴虫检测与跟踪方法,其特征在于,所述Mask R-CNN模型的建立过程,包括如下步骤:
制作滴虫样本集,对滴虫进行标注,其中,所述样本集包括训练集和测试集;
统计所述样本集中滴虫的形态特征,其中,所述形态特征包括滴虫的面积、轮廓等效半径、最小外接矩形宽高比、RGB三通道色彩均值;
基于统计的形态特征对Mask R-CNN网络中的对应参数进行修正;
基于迁移学习训练Mask R-CNN网络,依据测试集结果微调Mask R-CNN网络结构并保存权重参数。
4.一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于:所述处理器执行所述计算机程序时实现权利要求1-3中任一项所述的基于Mask R-CNN的白带滴虫检测与跟踪方法的步骤。
5.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-3中任一项所述的基于Mask R-CNN的白带滴虫检测与跟踪方法的步骤。
CN202310917597.5A 2023-07-25 2023-07-25 一种基于Mask R-CNN的白带滴虫检测与跟踪方法 Active CN116630867B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310917597.5A CN116630867B (zh) 2023-07-25 2023-07-25 一种基于Mask R-CNN的白带滴虫检测与跟踪方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310917597.5A CN116630867B (zh) 2023-07-25 2023-07-25 一种基于Mask R-CNN的白带滴虫检测与跟踪方法

Publications (2)

Publication Number Publication Date
CN116630867A CN116630867A (zh) 2023-08-22
CN116630867B true CN116630867B (zh) 2023-11-17

Family

ID=87613855

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310917597.5A Active CN116630867B (zh) 2023-07-25 2023-07-25 一种基于Mask R-CNN的白带滴虫检测与跟踪方法

Country Status (1)

Country Link
CN (1) CN116630867B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106483129A (zh) * 2016-09-23 2017-03-08 电子科技大学 一种基于运动目标识别的白带滴虫自动检测的方法
CN112330731A (zh) * 2020-11-30 2021-02-05 深圳开立生物医疗科技股份有限公司 图像处理装置、方法、设备、超声系统及可读存储介质
CN112819076A (zh) * 2021-02-03 2021-05-18 中南大学 基于深度迁移学习的医学图像分类模型的训练方法及装置
CN113450354A (zh) * 2021-08-30 2021-09-28 山东仕达思生物产业有限公司 基于卷积神经网络和摇摆活动特征的滴虫检测方法
CN114092517A (zh) * 2021-11-15 2022-02-25 江苏航天大为科技股份有限公司 基于传统和深度学习算法的多目标跟踪方法
WO2023284341A1 (zh) * 2021-07-15 2023-01-19 北京小蝇科技有限责任公司 一种基于深度学习、上下文相关的尿液有形成分检测方法
CN115841649A (zh) * 2022-11-21 2023-03-24 哈尔滨工程大学 一种用于城市复杂场景的多尺度人数统计方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106483129A (zh) * 2016-09-23 2017-03-08 电子科技大学 一种基于运动目标识别的白带滴虫自动检测的方法
CN112330731A (zh) * 2020-11-30 2021-02-05 深圳开立生物医疗科技股份有限公司 图像处理装置、方法、设备、超声系统及可读存储介质
CN112819076A (zh) * 2021-02-03 2021-05-18 中南大学 基于深度迁移学习的医学图像分类模型的训练方法及装置
WO2023284341A1 (zh) * 2021-07-15 2023-01-19 北京小蝇科技有限责任公司 一种基于深度学习、上下文相关的尿液有形成分检测方法
CN113450354A (zh) * 2021-08-30 2021-09-28 山东仕达思生物产业有限公司 基于卷积神经网络和摇摆活动特征的滴虫检测方法
CN114092517A (zh) * 2021-11-15 2022-02-25 江苏航天大为科技股份有限公司 基于传统和深度学习算法的多目标跟踪方法
CN115841649A (zh) * 2022-11-21 2023-03-24 哈尔滨工程大学 一种用于城市复杂场景的多尺度人数统计方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
基于 CNN 的农作物病虫害图像识别模型;史冰莹 等;《计算机系统应用》;第29卷(第6期);第89-96页 *
基于 MaskR-CNN 的多目标跟踪算法;张彩丽 等;《吉林大学学报 (理学版 )》;第59卷(第3期);第609-618页 *
基于改进 Mask R-CNN 和 DeepSort的致密细胞识别与追踪;黄圳鸿 等;《激光与光电子学进展》;第59卷(第18期);第[1811004-1]-[1811004-10]页 *

Also Published As

Publication number Publication date
CN116630867A (zh) 2023-08-22

Similar Documents

Publication Publication Date Title
WO2020253629A1 (zh) 检测模型训练方法、装置、计算机设备和存储介质
CN109345527B (zh) 一种基于MaskRcnn的膀胱肿瘤检测方法
CN108665483B (zh) 一种基于多特征融合的癌细胞跟踪方法
CN110729045A (zh) 一种基于上下文感知残差网络的舌图像分割方法
CN111582349B (zh) 一种基于YOLOv3和核相关滤波改进的目标跟踪算法
CN112085113B (zh) 一种重症肿瘤影像识别系统及方法
CN108052886A (zh) 一种小麦条锈病菌夏孢子自动统计计数方法
CN110197113A (zh) 一种高精度锚点匹配策略的人脸检测方法
CN109271848A (zh) 一种人脸检测方法及人脸检测装置、存储介质
Hao et al. Anterior chamber angles classification in anterior segment OCT images via multi-scale regions convolutional neural networks
CN115641364B (zh) 基于胚胎动力学参数的胚胎分裂周期智能预测系统及方法
US20240005494A1 (en) Methods and systems for image quality assessment
US20220114724A1 (en) Image processing model generation method, image processing method and device, and electronic device
CN113706579A (zh) 一种基于工厂化养殖的对虾多目标跟踪系统及方法
CN106529441A (zh) 基于模糊边界分片的深度动作图人体行为识别方法
CN113780145A (zh) 精子形态检测方法、装置、计算机设备和存储介质
CN116863388A (zh) 一种基于神经网络的精子活力确定方法及系统
CN110378333B (zh) 一种sd-oct图像黄斑中央凹中心定位方法
CN116630867B (zh) 一种基于Mask R-CNN的白带滴虫检测与跟踪方法
Cheng et al. Improved faster RCNN for white blood cells detection in blood smear image
CN109934298A (zh) 一种基于聚类的形变图的渐进式图匹配方法及装置
CN110428405A (zh) 一种检测生物组织图像中肿块的方法、相应设备及介质
CN112597842B (zh) 基于人工智能的运动检测面瘫程度评估系统
CN109948706B (zh) 结合深度学习与特征多尺度融合的微钙化簇检测方法
CN113066108A (zh) 基于eco算法的抗遮挡视觉目标跟踪方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant