CN113344849B - 一种基于YOLOv5的微乳头检测系统 - Google Patents
一种基于YOLOv5的微乳头检测系统 Download PDFInfo
- Publication number
- CN113344849B CN113344849B CN202110450075.XA CN202110450075A CN113344849B CN 113344849 B CN113344849 B CN 113344849B CN 202110450075 A CN202110450075 A CN 202110450075A CN 113344849 B CN113344849 B CN 113344849B
- Authority
- CN
- China
- Prior art keywords
- module
- feature
- head detection
- microemulsion
- feature map
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20092—Interactive image processing based on input by user
- G06T2207/20104—Interactive definition of region of interest [ROI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30068—Mammography; Breast
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种基于YOLOv5的微乳头检测系统,包括肺腺癌病理图像获取模块、检测模型训练模块和微乳头检测模块;检测模型训练模块中的特征提取模块在BottleneckCSP网络结构的基础上增加一层特征提取来得到浅层特征图,使特征提取模块的下采样的倍数减少一半;特征融合模块对浅层特征图进行下采样并与深层特征图进行拼接,使浅层特征图与深层特征图的特征相融合,从而增强网络对小目标的检测能力;预测模块将GIoU损失替换为CIoU损失,对预测框进行优化,提高了预测框回归的速度和精度,更适合于对微乳头的检测。
Description
技术领域
本发明属于病理图像处理领域,具体涉及一种基于YOLOv5的微乳头检测系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
根据美国癌症协会的统计,每年有超过15万名患者死于肺癌,是世界上扩散最广泛的癌症之一,其总体发病率在世界范围内整体呈上升趋势。根据组织学特点和细胞类型以及对传统治疗的反应,可以将肺癌划分为非小细胞肺癌和小细胞肺癌两种主要类型,其中非小细胞肺癌约占肺癌的80%。
肺腺癌是非小细胞肺癌中常见的类型之一,起源于支气管粘膜腺上皮,约占全部肺癌的45%,较容易发生于女性及抽烟者。在相关临床病理及随访资料结果的肺腺癌病例中发现,微乳头型肺腺癌是一种类型独特的肺腺癌,微乳头型腺癌的预后很差,很容易出现术后的复发和转移。微乳头型肺腺癌中的微乳头结构成分侵袭性强,易转移,具有高度的恶性潜能,可以与肺泡壁相连,也可以呈环状结构漂浮在肺泡腔中,瘤细胞小、呈立方状,是影响预后的重要因素,该病理形态的出现提醒临床应采取积极治疗措施并密切随访。因此,一种自动、准确的微乳头检测系统就显得尤为重要,辅助医生快速准确识别出微乳头结构,避免人眼识别微乳头速度慢、效率低、以及准确性低的情况。
发明内容
本发明为了解决上述问题,提出了一种基于YOLOv5的微乳头检测系统,本发明基于传统的YOLOv5结构模型,提出适合于小目标的四个检测层结构,在三个检测层的基础上增加了一个专用于检测小目标的分支,能够适应于形状较小的微乳头结构,获得准确的位置信息再进行检测,提高检测精度,辅助医生的临床诊断。
根据一些实施例,本发明采用如下技术方案:
一种基于YOLOv5的微乳头检测系统,包括:
肺腺癌病理图像获取模块,其用于实时获取肺腺癌病理图像并传输至微乳头检测模块;
检测模型训练模块,其用于对基于YOLOv5的微乳头检测模型进行训练,得到微乳头检测模型并传输至微乳头检测模块;所述检测模型训练模块包括特征提取模块和特征融合模块;所述特征提取模块在BottleneckCSP网络结构的基础上增加一层特征提取来得到浅层特征图,使特征提取模块的下采样的倍数减少一半;所述特征融合模块对浅层特征图进行下采样并与深层特征图进行拼接;
微乳头检测模块,将肺腺癌病理图像输入微乳头检测模型,检测微乳头并进行标注。
进一步地,所述特征提取模块输出四个尺度不同的特征图至特征融合模块;所述特征融合模块将FPN和PAN结构相结合,对特征提取模块得到四个尺度不同的特征图进行多尺度融合处理。
进一步地,所述检测模型训练模块还包括:训练集构建模块、输入模块和预测模块。
进一步地,所述训练集构建模块用于获取肺腺癌病理图像并标注出微乳头结构,将标注完成的病理图像进行分块处理得到图像块,并对图像块进行颜色增强构建出训练集。
进一步地,所述颜色增强通过随机亮度对比度变化、随机亮度变化、随机对比度变化、随机伽马变化和对比度受限自适应直方图均衡变化实现。
进一步地,所述输入模块对训练集构建模块得到训练集中的图像块依次进行切片操作和卷积操作,得到二倍下采样特征图。
进一步地,所述预测模块对预测边框依次进行非极大值抑制、IoU值判定。
进一步地,所述预测模块采用CIoU损失作为预测边框回归的损失函数。
进一步地,所述预测模块在进行微乳头检测时采取窗口滑动的方式。
进一步地,所述微乳头检测模型采用SGD优化器进行优化。
与现有技术相比,本发明的有益效果为:
本发明针对所检测目标微乳头的尺寸较小,基于YOLOv5算法,在BottleneckCSP网络结构的基础上增加一层特征提取,将主干网络输出三个不同尺寸的特征图改为输出四个不同大小的特征图,使下采样的倍数减少一半,从而增强网络对小目标的检测能力。
本发明对152×152的浅层特征图进行下采样并与76×76的深层特征图进行拼接,让浅层特征与深层特征相融合,丰富卷积层的语义信息从而提高检测的精度,由于微乳头结构体积较小,此种拼接方式改善了低层特征的传播,获取到更多底层信息与高层信息相融合,提升对小目标的检测效果,具有较小的感受野,适用于检测较小的微乳头。
本发明的基于YOLOv5的微乳头检测模型用CIoU损失函数作为边界框回归的损失函数,CIoU loss中增加了衡量长宽比一致性的影响因子,将预测框和原本ground truth的长宽比都考虑了进去,提高了预测框回归的速度和精度,更适合于对微乳头的检测。
本发明的基于YOLOv5的微乳头检测模型的颈部模块利用FPN+PAN的方式,对主干部分提取到的特征图,进行多尺度融合处理,FPN自上而下的结构获取到微乳头结构的整体轮廓特征,自下而上的结构将不同尺度的特征信息进行融合,PANE从低层的特征层中存储微乳头精确的位置信息,FPN和PANET两者相结合,缩短了信息传播的路径,基础的信息由底层向高层传播以更好地进行分类和检测。
本发明的基于YOLOv5的微乳头检测模型的预测模块对预测边框依次进行非极大值抑制、IoU值判定,非极大值抑制筛选出得分最高的那个框,计算出预测框与当前候选框的重合程度(IoU),通过阈值来进行选择,可以抑制掉分数低的窗口。
本发明采用了颜色增强的方式对病理图像块进行预处理,通过改变病理图像的颜色特性来提高检测任务的泛化能力,降低颜色变化对CNN网络的影响,在保证不改变病理图像本身特性的条件下,选用了随机亮度对比度变化、随机亮度变化、随机对比度变化、随机伽马变化、对比度受限自适应直方图均衡变化这5种颜色变换方式对图像块进行了颜色增强。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为本发明的检测模型训练模块结构示意图;
图2为本发明的基于YOLOv5的微乳头检测模型的网络结构示意图;
图3为本发明的对微乳头的检测结果示意图。
具体实施方式:
下面结合附图与实施例对本发明作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
本实施例的基于YOLOv5的微乳头检测系统,包括:
(1)肺腺癌病理图像获取模块,其用于实时获取肺腺癌病理图像并传输至微乳头检测模块。
(2)检测模型训练模块,其用于对基于YOLOv5的微乳头检测模型进行训练,得到微乳头检测模型并传输至微乳头检测模块;
(3)微乳头检测模块,将肺腺癌病理图像输入微乳头检测模型,检测微乳头并进行标注。
如图1-图2所示,本发明选用YOLOv5来搭建微乳头检测模型的基础框架,YOLO是一个单阶段的目标检测器,采用回归的方式检测目标的位置和类别。对于输入的图像,把图像划分为S×S的网格,如果目标的中心落入网格单元,则由该网格单元负责检测该目标。YOLO是对整张图进行检测,检测速度可以达到实时帧检测,和二阶段检测器Faster R-CNN相比,有着更快的检测速度。YOLOv5是在YOLOv4的基础上发展而来,主要包括四种不同的型号,由小到大依次为YOLOv5s、YOLOv5m、YOLOv5l、YOLOv5x,选用了精度最高的YOLOv5x作为使用模型。
所述检测模型训练模块,包括:训练集构建模块、输入模块、特征提取模块、特征融合模块和预测模块。
(2.1)训练集构建模块:其用于获取肺腺癌病理图像并标注出微乳头结构,将标注完成的病理图像进行分块处理得到图像块,并对图像块进行颜色变换构建出训练集;所述对图像块进行颜色变换包括对图像块依次进行RandomBrightnessContrast、RandomBrightness、RandomContrast、RandomGamma、CLAHE;
训练集构建模块获取大量肺腺癌病理图像,由专业的病理医师来进行手工标注;肺腺癌病理图像是将H&E染色的玻片数字化后,由病理学家使用标注软件qupath对这五种生长型进行手工标注;在标注完成的图像中挑选出包含微乳头型的图像,再从这些全切片图像中挑选出183个含有微乳头类型的典型区域,作为数据集,每块区域的面积在1211×1354至5012×8409;
训练集构建模块对挑选出的数字病理切片进行分块处理,将其切割成512×512尺寸的图像块用于分析,切割完成后的每个图像块中,微乳头结构约为1-5个;
训练集构建模块将标注完成的图像块进行导出,所得到的标签数据的格式转化为模型训练所需的格式;具体的是,将标注软件qupath所导出的标签文件转换为.xml格式后,再转换为模型训练过程中学习用的标签文件.txt格式,得到微乳头专有数据集;
染色归一化、增强和染色转移是目前病理图像中比较流行的图像预处理技术,它通过改变给定图像的染色特性来提高任务的泛化能力;在组织病理学中,染色是指用苏木精和伊红对所需要的结构进行着色,以增强感兴趣区域和周围组织的对比度;但是这在一定程度上给测试和诊断带来了困难,当然对病理学家也是如此;H&E染色是影响WSI变异性的一个重要因素,而CNN对所训练的数据是高度敏感的,染色变化有可能会导致测试性能的下降。
因此,本实施例对训练所需的图像块进行了颜色增强,主要采用了RandomBrightnessContrast、RandomBrightness、RandomContrast、RandomGamma、CLAHE(随机亮度对比度变化、随机亮度变化、随机对比度变化、随机伽马变化、对比度受限自适应直方图均衡变化)这5种颜色变换方式对图像块进行增强。
(2.2)所述输入模块对训练集构建模块得到训练集中的图像块依次进行切片操作和卷积操作,得到二倍下采样特征图。
在网络输入端网络第一层为Focus模块,该模块的设计主要是减少计算量,加快计算速度。输入模块把特征图切分为四等份后叠加起来,其中,特征图是通过卷积提取到的特征;叠加之后图片的通道数变为原来的四倍,高度和宽度分别减半,最后将得到的新图片再经过卷积操作将通道数调整为预先设置的值。
Focus模块是对图片进行切片操作,具体操作是在一张图片中每隔一个像素拿到一个值,这样就拿到了四张图片,输入通道扩充了4倍,拼接后的图片相对于原来的RGB三通道模式变成了12个通道,最后将得到的新图片再经过卷积操作,得到没有信息丢失的二倍下采样特征图。
YOLOv5模型在主干特征提取网络之前加入了Focus结构,在YOLOv3和YOLOv4中并没有这个结构,用于对输入的图像进行切片操作。输入模块在一张图片中每隔一个像素取一个值,获取到四张图片(类似于邻近下采样),将w、h的信息集中到通道空间,输入通道扩充了4倍,即拼接后的图片相比原来的3通道变为12通道,最后将得到的新图片经过卷积操作,得到二倍下采样特征图。以YOLOv5s为例,原始的640×640×3的图像输入Focus结构,经过切片操作,先变成320×320×12的特征图,再经过一次32个卷积核的卷积操作,最终变成320×320×32的特征图。Focus模块主要是减少计算量加快运算速度,在位置信息尽可能保留的情况下增大感受野。
在输入模块,YOLOv5继续采用了YOLOv4中引入的马赛克数据增强技术,马赛克增强是参考的CutMix数据增强的方式,是对CutMix图片预处理方案的一种推广,马赛克数据增强技术对四张图片随机缩放、随机裁剪、随机排布后混合成一张图片,裁剪位置的长宽可以随机变化。但是,这种裁剪方式并不适用于图像块中微乳头成分的检测,马赛克增强在裁剪拼接图片的时候,将随机取得的4张图片依次以一个随机位置的十字线裁剪,取对应的部分进行拼接,每张原图对应的目标框也会受十字线裁剪的限制,微乳头本就形态不固定,这就使其丢失掉了过多的边缘信息,同时产生了过多的检测背景,所以本实施例的输入模块取消掉了原本YOLOv5模型中设置的马赛克增强方法,其他保持未变。
(2.3)特征提取模块,在BottleneckCSP网络结构的基础上增加一层特征提取,得到152×152的浅层特征图,使特征提取模块的下采样的倍数减少一半;并输出四个尺度不同的特征图至特征融合模块。
本发明的特征提取模块在BottleneckCSP网络结构原有的三个不同输出尺寸的基础上,增加了一个下采样分支,使得特征图的八倍下采样变为四倍下采样,从而增强网络对小目标微乳头的检测能力。
特征提取主干模块采用BottleneckCSP,将梯度的变化从头到尾地集成到特征图中,减少了模型的参数量既保证了推理速度和准确率,又减小了模型尺寸和计算量,提高了卷积神经网络学习能力。为了优化对小目标的检测效果,本发明的特征提取模块在BottleneckCSP网络结构的基础上增加了一层特征提取,得到152×152的浅层特征图,增加了一层特征提取的BottleneckCSP网络结构输出四个大小分别为152×152、76×76、38×38、19×19的特征图。
YOLOv5延续了YOLOv4的特征提取主干模块,继续借鉴了CSPNet的设计思路,同时与bottleneck相结合,形成了BottleneckCSP模块,BottleneckCSP模块在每个CSP单元中加入了1×1和3×3的过滤器(filter),减小了参数量。与YOLOv4不同的是,YOLOv4中只在主干网络使用了CSP结构,而YOLOv5中还额外设计了一种CSP结构,将其应用于neck部分。在neck模块还采用了PAN+FPN结构,更好的利用网络的高层和底层信息,实现了对于不同尺度微乳头的检测,加强网络特征融合的能力。YOLOv5是YOLOv4的pytorch改进版,延用了YOLOv4的许多创新之处。
YOLOv5模型使用BottleneckCSP作为特征提取主干模块,从输入图像中提取丰富的信息特征。BottleneckCSP借鉴了CSPNet(跨阶段局部网络)的设计思路跨阶段局部网络,CSPNet解决了大型卷积神经网络特征提取主干模块中网络优化的梯度信息重复问题,将梯度的变化从头到尾地集成到特征图中,减少了模型的参数量和FLOPS数值,既保证了推理速度和准确率,又减小了模型尺寸。传统的CSP结构是先把输入特征分离,通道数减半,BottleneckCSP则是直接用1×1卷积来实现的通道缩减,直接对原图通过1×1的卷积实现通道减半,再通过级联操作把通道合并,最后通过1×1卷积实现特征的融合。YOLOv5模型中设计了两种CSP结构,一种CSP结构应用于Backbone中,另一种CSP结构则应用于neck中。应用于Backbone中的是带有残差单元的(2*CBL卷积+残差),应用于neck中的是用普通的CBL来替换残差单元。因为Backbone部分的网络较深,增加残差结构可以增强层与层之间反向传播的梯度值,避免因为加深而带来的梯度消失,从而提取到更细粒度的特征而不必担心网络退化。通过卷积提取到的特征再经过一层SPP池化,SPP模块是由四个并行的分支构成,分别是卷积核大小为5×5、9×9、13×13的最大池化层和一个跳跃连接。经过SPP池化后的特征图重新级联起来传到下一层网络中,提高感受野。
(2.4)特征融合模块,将152×152的浅层特征图经过下采样与76×76的深层特征图进行拼接,使152×152的浅层特征图与76×76的深层特征图的特征相融合,并将FPN和PAN结构相结合,对特征提取模块得到的四个大小分别为152×152、76×76、38×38、19×19的特征图进行多尺度融合处理。
在特征融合颈部模块,利用FPN+PAN的方式,对特征提取模块提取到的特征,进行多尺度融合处理,再送入预测模块。
本发明加入了浅层的152×152的特征层,在特征融合模块经过下采样与76×76的特征层进行拼接,让浅层特征层与较深层的特征相融合,丰富卷积层的语义信息从而提高检测的精度,由于微乳头结构体积较小,此种拼接方式改善了低层特征的传播,获取到更多底层信息与高层信息相融合,提升对小目标的检测效果。
FPN是一种自顶向下传达强语义特征的网络,即一个正金字塔形结构,PAN与FPN网络正好相反,是一个倒金字塔结构,自底向上传达强定位特征,两者结合融合不同尺度的特征信息,在特征融合模块采用了特征金字塔网络FPN和PAN结构相结合的方式。
FPN是自顶向下的,将高层的特征信息通过上采样的方式进行传递融合,得到进行预测的特征图,特征金字塔会增强模型对于不同缩放尺度对象的检测,从而能够识别不同大小和尺度的同一个物体。FPN自上而下的结构可以获取微乳头图像的整体轮廓特征,自下而上的结构可以将不同尺度的特征信息进行融合,类似于医生在不同倍率的显微镜下对病理切片进行观测。
PANET加强了信息传播,采用了一种新的自下向上的FPN结构,改善了低层特征的传播,输出通过横向连接被添加到自上而下通路的同一阶段的特征图中,这些特征图为下一阶段提供信息,具有准确保留空间信息的能力,有助于对像素进行适当的定位以形成掩模。从低层的特征层中存储微乳头精确的位置信息,基础信息由底层向高层传播以更好地进行分类和检测。
(2.5)预测模块,对预测边框依次进行非极大值抑制、IoU值判定;并采用CIoU损失作为边界框回归的损失函数;
在预测模块,模型对检测图像进行识别分类,得到准确的检测目标,对检测得到的矩形框依次进行非极大值抑制、IoU值判定等,找到所有最可能存在目标的候选框。在预测模块增加了输出层,在第17层后,继续对特征图进行上采样等处理,使得特征图继续扩大,同时在第20层时,将获取到的大小为160×160的特征图与主干网络中的第2层特征图进行级联,以此获取更大的特征图,适用于小目标检测。在第31层的检测层,增加了小目标检测层,一共使用四个检测层来进行检测。
以网络的输入的图像大小为608×608为例,YOLOv5中使用了5次下采样,因此最后的特征图大小是19×19,38×38,76×76,在三个特征图中,最大的76×76负责检测小目标,而对应到608×608上,每格特征图的感受野是608/76=8×8大小。
本发明为适应于体积较小的微乳头结构,增加了一层输出分支。改进版YOLOv5模型的预测模块得到152×152、76×76、38×38、19×19四种不同尺度的预测结果,以输入图像大小为608×608为例,预测结果大小分别为19×19×255,38×38×255,76×76×255,152×152×255。不同大小的结果预测不同大小的目标,用四个不同尺寸预测,从而满足不同大小的目标物体,浅层特征图152×152经过下采样与深层特征图76×76特征图进行拼接,具有较小的感受野,适用于检测较小的微乳头;最深层特征图19×19,具有较大的感受野,适用于检测稍大的微乳头;较深层特征图38×38和深层特征图76×76,具有中等尺度的感受野,用于检测中等尺寸的微乳头。改进后的YOLOv5结构,适用范围大,对切片中的微乳头具有较优的检测结果,达到了提高对小目标检测的目的。
病理图像中的微乳头结构是由缺乏纤维血管中心的瘤细胞簇(或花瓣样)构成,可以与肺泡壁相连,也可以呈环状结构漂浮在肺泡腔中,核具有不同程度的异型性,瘤细胞小,为了解决瘤细胞体积小的问题,在网络中多加入了一个检测层,使改进后的整个网络模型对小物体的检测敏感度更高。
在YOLOv5中,选用了GIoU损失来作为边界框回归的损失函数,其公式为:
IoU计算的是产生的候选框与原标记框的交集和并集的比值,用于测量真实框和预测框之间的相关度,IoU越高,则相关度越高。GIoULoss中,增加了相交尺度的衡量方式,解决了当预测框和目标框不相交时,loss函数的求解问题。
在切割出的病理图像块中,微乳头体积较小,转移性强,多成簇出现,一个图像块中可能出现多个距离较近的微乳头结构,当多个微乳头结构位于同一个预测框中时,GIoU无法很好的区分出相对位置的关系。而且病理图像块中的微乳头形态多样,瘤细胞小,且无固定形状,所以本申请的预测模块将GIoUloss替换为CIoUloss,CIoUloss中增加了衡量长宽比一致性的影响因子,将预测框和原本groundtruth的长宽比都考虑了进去,提高了预测框回归的速度和精度,更适合于对微乳头的检测,CIoU损失函数的公式为:
其中,IoU为预选框和真值框的交并比,ρ代表的是计算两个中心点间的欧式距离,b和bgt分别代表了预测框和真实框的中心点,C代表的是能够同时包含预测框和真实框的最小闭包区域的对角线距离,α是权重函数,定义为:
v是用来衡量长宽比一致性的参数,定义为:
其中,wgt、hgt表示真值框的宽和高,w、h表示预测框的宽和高。
模型head部分主要用于最终预测模块,在特征图上应用锚定框,并生成带有类概率、对象得分和包围框的最终输出向量。YOLOv5模型的head部分没有任何改动,和YOLOv3和YOLOv4完全相同,也是三个输出头,步长分别是8,16和32,大输出特征图用来检测小物体,小输出特征图用来检测大物体。
模型采用自适应anchor的功能,在配置文件里提前预定义一组默认锚框,每次训练时,会去计算适应于训练集的最佳锚框值。根据超参数中的设定的数值来检查默认anchor与数据集标签的契合度,如果比值小于0.98,则根据数据集标签重新进行聚类,获得新的anchor;反之,则按照预先设定的默认值。在网络训练中,网络在初始锚框的基础上输出预测框,进而和真实框的groundtruth进行比对,计算两者之间的差距,再反向更新,迭代网络参数。
对于每一个输出层,直接采用形状规则匹配,就是该预测边框和当前层的anchor计算宽高比,如果宽高比例大于超参数中预先设定的阈值,则说明该预测框和anchor的匹配度不够,将此框过滤掉。计算其余的预测框的目标中心点落在哪个网格中,找出离中心点最近的两个网格,由这三个网格负责预测。比如说中心点落在当前网格的左上部分,则由当前网格、其左方、其上方的网格来负责该目标的检测;同理,若目标中心点落在当前网格的右下方,则由当前网格、其右方、其下方的网格来负责检测。极大的增加了预测到的正样本数。位置预测公式如下,即预测边框的中心位置和宽高的计算公式为::
bx=2σ(tx)-0.5+cx
by=2σ(ty)-0.5+cy
bw=pw(2σ(tw))2
bh=ph(2σ(th))2
其中,bx,by,bw,bh是所求得的预测边框的中心和宽高;cx,cy是特征图中网格单元的左上角的坐标;pw,ph是先验框的宽和高,σ是sigmoid函数;tx,ty,tw,th是要学习的参数,分别用于预测边框的中心和宽高。
用检测模型对图像块进行检测,得到微乳头检测目标。检测模型预测模块在进行微乳头目标检测时采取窗口滑动的方式,滑动窗口经提取特征,经分类器识别后,每个格点预测生成很多的候选框,这会导致很多窗口与其他窗口存在包含或者大部分交叉的情况,把这些候选框进行特征提取后送入分类器得出一个得分,在推理时,按照置信度对得分全部排序,进行非极大值抑制筛选,选取得分最高的那个框,计算其他的框与当前候选框的重合程度(IoU),如果重合程度大于一定阈值就删除,抑制分数低的窗口。下一次迭代的时候在剩下的框里面选取一个最大的,然后再删除它周围IoU区域大于一定阈值的,重复这个过程,直到无剩余候选框。根据上述方法迭代下去,找到所有最可能有目标物体微乳头的区域。
模型的优化算法采用SGD方法,学习率为0.001。对训练集数据进行训练,得到微乳头检测模型,辅助医生完成微乳头型肺腺癌的诊断。
本实施例中,在训练集上对基于YOLOv5的微乳头检测模型进行训练,并根据训练结果对预训练模型的动量、IoU阈值、anchor阈值等超参数微调,得到检测模型;对超参数的数值进行手动调整,寻找适合模型的最优的参数值。
本实施例中,使用测试集测试训练好的改进版YOLOv5模型的性能,利用检测模型对测试集进行微乳头结构检测,得到微乳头检测目标,并输出检测结果;如图3所示,图3为使用基于YOLOv5结构模型的微乳头检测方法对微乳头结构的检测结果,其中,检测框上方显示所检测出的物体的类别:微乳头;类别后的数字为判定为该类别的置信度,置信度可达0.9。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
Claims (6)
1.一种基于YOLOv5的微乳头检测系统,其特征是,包括:
肺腺癌病理图像获取模块,其用于实时获取肺腺癌病理图像并传输至微乳头检测模块;
检测模型训练模块,其用于对基于YOLOv5的微乳头检测模型进行训练,得到微乳头检测模型并传输至微乳头检测模块;
所述检测模型训练模块包括训练集构建模块、特征提取模块和特征融合模块;所述特征提取模块在BottleneckCSP网络结构的基础上增加一层特征提取来得到浅层特征图,使特征提取模块的下采样的倍数减少一半;所述特征融合模块对浅层特征图进行下采样并与深层特征图进行拼接;所述特征提取模块输出四个尺度不同的特征图至特征融合模块;所述特征融合模块将FPN和PAN结构相结合,对特征提取模块得到四个尺度不同的特征图进行多尺度融合处理;
所述训练集构建模块用于获取肺腺癌病理图像并标注出微乳头结构,将标注完成的病理图像进行分块处理得到图像块,并对图像块进行颜色增强构建出训练集;所述颜色增强依次通过随机亮度对比度变化、随机亮度变化、随机对比度变化、随机伽马变化和对比度受限自适应直方图均衡变化实现;
微乳头检测模块,将肺腺癌病理图像输入微乳头检测模型,检测微乳头并进行标注,所述微乳头检测模型采用SGD优化器进行优化。
2.如权利要求1所述的一种基于YOLOv5的微乳头检测系统,其特征是,所述检测模型训练模块还包括:输入模块和预测模块。
3.如权利要求2所述的一种基于YOLOv5的微乳头检测系统,其特征是,所述输入模块对训练集构建模块得到训练集中的图像块依次进行切片操作和卷积操作,得到二倍下采样特征图。
4.如权利要求2所述 的一种基于YOLOv5的微乳头检测系统,其特征是,所述预测模块对预测边框依次进行非极大值抑制、IoU值判定。
5.如权利要求2所述 的一种基于YOLOv5的微乳头检测系统,其特征是,所述预测模块采用CIoU损失作为预测边框回归的损失函数。
6.如权利要求2所述 的一种基于YOLOv5的微乳头检测系统,其特征是,所述预测模块在进行微乳头检测时采取窗口滑动的方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110450075.XA CN113344849B (zh) | 2021-04-25 | 2021-04-25 | 一种基于YOLOv5的微乳头检测系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110450075.XA CN113344849B (zh) | 2021-04-25 | 2021-04-25 | 一种基于YOLOv5的微乳头检测系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113344849A CN113344849A (zh) | 2021-09-03 |
CN113344849B true CN113344849B (zh) | 2023-01-24 |
Family
ID=77468568
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110450075.XA Active CN113344849B (zh) | 2021-04-25 | 2021-04-25 | 一种基于YOLOv5的微乳头检测系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113344849B (zh) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114373121A (zh) * | 2021-09-08 | 2022-04-19 | 武汉众智数字技术有限公司 | 一种改进yolov5网络的小目标检测的方法及系统 |
CN113855079A (zh) * | 2021-09-17 | 2021-12-31 | 上海仰和华健人工智能科技有限公司 | 基于乳腺超声影像的实时检测和乳腺疾病辅助分析方法 |
CN113688948A (zh) * | 2021-10-11 | 2021-11-23 | 中核检修有限公司 | 一种基于YOLO v5的附着海生物种类识别方法 |
CN114241548A (zh) * | 2021-11-22 | 2022-03-25 | 电子科技大学 | 一种基于改进YOLOv5的小目标检测算法 |
CN114300099B (zh) * | 2021-11-24 | 2022-07-05 | 大连工业大学 | 一种基于YOLOv5和显微高光谱图像的异型淋巴细胞分型方法 |
CN114550069B (zh) * | 2022-03-01 | 2022-10-21 | 华南农业大学 | 一种基于深度学习的仔猪乳头计数方法 |
CN114898171B (zh) * | 2022-04-07 | 2023-09-22 | 中国科学院光电技术研究所 | 一种适用于嵌入式平台的实时目标检测方法 |
CN114998891A (zh) * | 2022-05-17 | 2022-09-02 | 电子科技大学 | 一种基于迁移学习的智能冰箱食材精准检测方法 |
CN115151950A (zh) * | 2022-06-02 | 2022-10-04 | 深圳市正浩创新科技股份有限公司 | 图像识别方法、自移动设备及存储介质 |
CN115457297B (zh) * | 2022-08-23 | 2023-09-26 | 中国航空油料集团有限公司 | 航油油库漏油检测方法、装置及航油安全运维系统 |
CN115294126B (zh) * | 2022-10-08 | 2022-12-16 | 南京诺源医疗器械有限公司 | 一种病理图像的癌细胞智能识别方法 |
CN115345881B (zh) * | 2022-10-18 | 2023-01-13 | 上海交强国通智能科技有限公司 | 一种基于计算机视觉的路面病害检测方法 |
CN115601363B (zh) * | 2022-12-14 | 2023-05-23 | 中建科技集团有限公司 | 一种基于小目标检测算法的装配式建筑产品缺陷检测方法 |
CN116881830A (zh) * | 2023-07-26 | 2023-10-13 | 中国信息通信研究院 | 基于人工智能的自适应检测方法和系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112132206A (zh) * | 2020-09-18 | 2020-12-25 | 青岛商汤科技有限公司 | 图像识别方法及相关模型的训练方法及相关装置、设备 |
CN112263217A (zh) * | 2020-08-27 | 2021-01-26 | 上海大学 | 一种基于改进卷积神经网络的非黑素瘤皮肤癌病理图像病变区域检测方法 |
CN112435243A (zh) * | 2020-11-26 | 2021-03-02 | 山东第一医科大学附属省立医院(山东省立医院) | 一种全切片数字病理图像的自动分析系统及方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109903280B (zh) * | 2019-02-27 | 2020-09-29 | 上海联影智能医疗科技有限公司 | 肿瘤确定系统、方法及存储介质 |
CN111047582A (zh) * | 2019-12-17 | 2020-04-21 | 山东大学齐鲁医院 | 基于深度学习的小肠镜下克罗恩病辅助诊断系统 |
CN112529892A (zh) * | 2020-12-21 | 2021-03-19 | 苏州中科华影健康科技有限公司 | 消化道内镜病变图像检测方法、系统和计算机存储介质 |
CN112597981B (zh) * | 2021-03-04 | 2021-06-01 | 四川大学 | 基于深度神经网络的肠镜退镜质量智能监控系统及方法 |
-
2021
- 2021-04-25 CN CN202110450075.XA patent/CN113344849B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112263217A (zh) * | 2020-08-27 | 2021-01-26 | 上海大学 | 一种基于改进卷积神经网络的非黑素瘤皮肤癌病理图像病变区域检测方法 |
CN112132206A (zh) * | 2020-09-18 | 2020-12-25 | 青岛商汤科技有限公司 | 图像识别方法及相关模型的训练方法及相关装置、设备 |
CN112435243A (zh) * | 2020-11-26 | 2021-03-02 | 山东第一医科大学附属省立医院(山东省立医院) | 一种全切片数字病理图像的自动分析系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113344849A (zh) | 2021-09-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113344849B (zh) | 一种基于YOLOv5的微乳头检测系统 | |
CN107680678B (zh) | 基于多尺度卷积神经网络甲状腺超声图像结节诊断系统 | |
CN110287932B (zh) | 基于深度学习图像语义分割的道路阻断信息提取方法 | |
CN110428432B (zh) | 结肠腺体图像自动分割的深度神经网络算法 | |
CN111488921B (zh) | 一种全景数字病理图像智能分析系统及方法 | |
CN108648191B (zh) | 基于贝叶斯宽度残差神经网络的害虫图像识别方法 | |
CN109325960B (zh) | 一种红外云图气旋分析方法及分析系统 | |
Wan et al. | Accurate segmentation of overlapping cells in cervical cytology with deep convolutional neural networks | |
CN110472616B (zh) | 图像识别方法、装置、计算机设备及存储介质 | |
WO2021203795A1 (zh) | 一种基于显著性密集连接扩张卷积网络的胰腺ct自动分割方法 | |
CN110059586B (zh) | 一种基于空洞残差注意力结构的虹膜定位分割系统 | |
CN109784283A (zh) | 基于场景识别任务下的遥感图像目标提取方法 | |
CN110853011B (zh) | 用于肺结节检测的卷积神经网络模型的构建方法 | |
CN111680706A (zh) | 一种基于编码和解码结构的双通道输出轮廓检测方法 | |
CN108537751B (zh) | 一种基于径向基神经网络的甲状腺超声图像自动分割方法 | |
CN116363123B (zh) | 对循环肿瘤细胞检测的荧光显微成像系统及其方法 | |
CN112215217B (zh) | 模拟医师阅片的数字图像识别方法及装置 | |
US11790673B2 (en) | Method for detection of cells in a cytological sample having at least one anomaly | |
WO2021057395A1 (zh) | 一种鞋跟型号识别方法、装置及存储介质 | |
CN113129281B (zh) | 一种基于深度学习的小麦茎秆截面参数检测方法 | |
CN115953393B (zh) | 基于多任务学习的颅内动脉瘤检测系统、设备及存储介质 | |
CN112926652A (zh) | 一种基于深度学习的鱼类细粒度图像识别方法 | |
CN115210779A (zh) | 生物样品中对象的系统性表征 | |
CN114511710A (zh) | 一种基于卷积神经网络的图像目标检测方法 | |
Ge et al. | Coarse-to-fine foraminifera image segmentation through 3D and deep features |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |