CN116778482A - 胚胎图像卵裂球目标检测方法、计算机设备及存储介质 - Google Patents

胚胎图像卵裂球目标检测方法、计算机设备及存储介质 Download PDF

Info

Publication number
CN116778482A
CN116778482A CN202311035645.4A CN202311035645A CN116778482A CN 116778482 A CN116778482 A CN 116778482A CN 202311035645 A CN202311035645 A CN 202311035645A CN 116778482 A CN116778482 A CN 116778482A
Authority
CN
China
Prior art keywords
blastomere
model
embryo
network
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311035645.4A
Other languages
English (en)
Other versions
CN116778482B (zh
Inventor
谭威
陈长胜
闻庆伟
彭松林
熊祥
云新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Mutual United Technology Co ltd
Original Assignee
Wuhan Mutual United Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Mutual United Technology Co ltd filed Critical Wuhan Mutual United Technology Co ltd
Priority to CN202311035645.4A priority Critical patent/CN116778482B/zh
Publication of CN116778482A publication Critical patent/CN116778482A/zh
Application granted granted Critical
Publication of CN116778482B publication Critical patent/CN116778482B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • G06V20/695Preprocessing, e.g. image segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种胚胎图像卵裂球目标检测方法、计算机设备及存储介质,包括步骤:S1收集含有卵裂球的胚胎图像,构建胚胎图像数据集;S2构建胚胎图像卵裂球目标检测网络模型,模型包括用于提取图像中特征的backbone网络和用于对特征图进行多尺度检测和预测的head网络,head网络设置有模型不确定机制;S3利用胚胎图像数据集对模型进行训练,获取模型及其参数;S4对测试集胚胎数据进行测试;S5将待识别的胚胎图像输入至步骤S4的胚胎图像卵裂球目标检测网络模型得到检测结果。本发明构建的胚胎图像卵裂球目标检测网络模型加入了用于消除模型不确定性和数据不确定性的部分,这两个部分可提高卵裂细胞的检测准确性的精度,从而实现对卵裂球个数的预测和定位。

Description

胚胎图像卵裂球目标检测方法、计算机设备及存储介质
技术领域
本发明涉及人工智能技术领域,具体地指一种胚胎图像卵裂球目标检测方法、计算机设备及存储介质。
背景技术
随着不孕不育患者的指数增长,胚胎的体外培养技术作用与日俱增,利用时差培养箱进行体外胚胎培养已经成为一种重要手段。胚胎学家通过观察时差培养箱中拍摄的胚胎图像对胚胎的质量进行评估,选择优质胚胎进行移植。胚胎发育过程中卵裂球个数的变化是胚胎学家评判胚胎的优劣的重要特征之一,因此,如何运用计算机技术快速准确地识别胚胎中卵裂球的个数具有重要的意义。
胚胎在分裂过程中,卵裂球的个数在不断地增加,而在大多数胚胎图像中,卵裂球之间会出现互相重叠的现象,大大增加了卵裂球识别的难度。因此,如何有效地设计AI模型提升重叠卵裂球的个数识别概率需要进一步深入的研究。
发明内容
本发明针对现有技术的不足之处,提出一种胚胎图像卵裂球目标检测方法、计算机设备及存储介质,能够提高卵裂细胞的检测准确性的精度,从而实现对卵裂球个数的预测和定位。
为实现上述目的,本发明设计的一种胚胎图像卵裂球目标检测方法,其特殊之处在于,包括如下步骤:
S1收集含有卵裂球的胚胎图像,构建胚胎图像数据集;
S2构建胚胎图像卵裂球目标检测网络模型,所述胚胎图像卵裂球目标检测网络模型包括用于提取图像中特征的backbone网络和用于对backbone网络输出的特征图进行多尺度检测和预测的head网络,所述head网络设置有模型不确定机制;
S3利用步骤S1构建的胚胎图像数据集对所述胚胎图像卵裂球目标检测网络模型进行训练,获取模型及其参数;
S4利用训练后的模型对测试集胚胎数据进行预测,并完成测试集预测和结果评估;
S5将待识别的胚胎图像输入至步骤S4的胚胎图像卵裂球目标检测网络模型得到检测结果。
优选地,所述胚胎图像卵裂球目标检测网络模型采用yolov7网络框架作为基础网络。
优选地,步骤S2中所述模型不确定机制为在模型训练期间和测试期间对深度学习模型的卷积层之后应用MC-DropBlock算法,以捕捉模型的先验不确定性,算法的表达式为:
式中,W是卷积层的权重矩阵,X是输入,Y是输出,M是DropBlock遮挡矩阵,σ是DropBlock的概率参数,表示卷积操作,⊙表示对应元素相乘;
在训练时,随机地将特征图中的一些连续区域置零,从而增加模型的鲁棒性和泛化能力;在测试时,对同一个输入特征图进行多次采样,得到不同的输出特征图,从而估计模型的后验分布和不确定性。
优选地,步骤S2中所述head网络还设置有数据不确定机制,采用LaplaceDistribution处理数据不确定性算法,通过在训练期间合成特性统计量来改善网络的泛化能力,从而建模域偏移的不确定性,算法步骤包括:
假设输入的特征图为,其中R是实数集,N是批量大小,C是通道数,HW是高度和宽度,
a.计算特征图在空间维度上的均值μ和标准差σ
其中ε是一个很小的正数,用来避免除零错误;是张量的索引方式,表示从X张量中取出所有的批量维度、所有的通道维度、第/>个高度维度和第/>个宽度维度;
b.计算均值和标准差在通道维度上的标准差:
其中和/>是均值和标准差在通道维度上的均值;/>是张量的索引方式,分别表示从均值μ和标准差σ中取出第C个通道维度;
c.对均值和标准差进行重参数化处理:
其中是一个因子函数,用来控制随机变量的尺度,/>和/>是两个服从LaplaceDistribution的随机变量矩阵,形状为/>,⊙表示对应元素相乘;
d.对原始的特征图进行归一化、缩放和平移处理:
其中Y是输出的特征图,形状和X相同,βγ分别为重参数化的均值和标准差。
优选地,所述backbone网络由多个ELAN模块、CBS模块和MP模块组成,其中ELAN模块是一种特征提取模块,由多个CBS模块组成;所述MP模块是由最大池化层MaxPool和CBS组成,用于降低特征图的尺寸和增加通道数;所述CBS模块由卷积、批归一化、SiLU激活函数组成,用于对输入的特征图进行卷积操作,提取更高层次的特征,并通过批归一化层和SiLU激活函数进行归一化和非线性变换。
优选地,所述head网络由ELAN模块、CBS模块、MP模块、SPPCSPC模块和RepConv模块组成。
优选地,所述SPPCSPC模块由SPP空间金字塔池化模块和CSPC交叉阶段部分网络组成,用于特征提取和融合;其中SPP空间金字塔池化模块对输入的特征图进行不同尺度的池化操作,得到不同大小的特征图,并将它们拼接起来,形成一个固定长度的特征向量;CSPC交叉阶段部分网络将输入的特征图分成两个部分,一部分进行卷积操作,另一部分直接通过,拼接后形成一个更丰富的特征图。
优选地,所述RepConv模块在训练时使用多个分支的卷积层,每个分支有不同的分组数,然后将多个分支的输出相加。
本发明还提出一种设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的一种胚胎图像卵裂球目标检测方法。
本发明另外提出一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现上述的一种胚胎图像卵裂球目标检测方法。
本发明提出的一种胚胎图像卵裂球目标检测方法的有益效果为:
1、本发明采用yolov7网络框架作为基础网络,并在此基础上做了改进,加入了用于消除模型不确定性和数据不确定性的部分,这两个部分可提高卵裂细胞的检测准确性的精度,从而实现对卵裂球个数的预测和定位;
2、本发明在head网络中加入SPPCSPC模块,SPP用以适应不同大小的输入,避免了图像缩放和裁剪带来的信息损失,提高了特征的表达能力和检测效果;CSPC的优点是可以减少计算量和参数量,提高模型的效率和泛化能力,实现特征的残差连接和通道混合;
3、本发明采用MC-DropBlock的有效方法来处理细胞检测任务中的模型不确定性。该方法在模型训练期间和测试期间对深度学习模型的卷积层之后应用MC-DropBlock方法,以捕捉模型的先验不确定性;
4、本发明采用Laplace Distribution的用于处理数据不确定性问题的方法,借助于不确定的特性统计量,使得模型可以被训练以消除一定噪声的影响。
附图说明
图1为胚胎细胞中重叠的卵裂球示意图;
图2为3个卵裂球重叠示意图;
图3为胚胎图像卵裂球目标检测网络模型的结构示意图;
图4为图3中CBS模块的结构示意图;
图5为图3中ELAN模块的结构示意图;
图6为图3中MP模块的结构示意图;
图7为SPPCSPC模块的结构示意图;
图8为RepConv模块的结构示意图;
图9为胚胎图像卵裂球目标检测网络模型训练时候输入的标签图和原图;
图10为胚胎细胞图像经过加入模型不确定性检测机制的测试结果示意图;
图11为胚胎细胞图像经过加入数据不确定性检测机制的检测结果示意图;
图12为胚胎细胞图像经过加入模型不确定、数据不确定性检测机制的检测结果示意图。
具体实施方式
以下结合附图和具体实施例对本发明作进一步的详细描述。
卵裂球之间的重叠现象是胚胎细胞分裂过程中一种极为常见的现象。这种物理空间中重叠的现象出现的时长占据胚胎细胞分裂周期绝大部分时间。重叠现象会导致卵裂球之间相互挤压,产生形变,从而使得相关工作人员对胚胎细胞数目的统计变得十分困难。但是,卵裂期球的重叠不同于现实生活中普通物体的重叠,其具有自身的特点。
对于处在分裂期间的胚胎细胞而言,由于其在电镜照射下具有透明或者半透明的特点,即使卵裂球之间相互挤压、重叠和覆盖,单个细胞的图像信息和特征仍然可以被大部分保留下来,这就使得利用深度学习领域的目标检测算法检测细胞状态以及实现细胞计数的任务成为可能。图1是卵裂球重叠的胚胎细胞图像,从图中可以得知,虽然卵裂球之间相互重叠,并且某些卵裂球的边缘位于其他卵裂球的内部,但是单个卵裂球的图像信息和图像特征并没有过多的丢失。
图2显示的是胚胎细胞分裂中常见的卵裂球重叠现象,卵裂球c几乎已经完全被卵裂球d覆盖。如果这种现象出现在现实生活中,c、d、e大概率为光学上的不透明物体。显然,这种情况下,如果d处于c和e的前方,那么c可以被检测的可能性几乎为0。因为c所有的图像信息被d覆盖和遮挡,无法向收集图像信息的单元提供有效的信息。但是,对于胚胎细胞而言,正是由于其在电镜照射下具有透明或半透明的光学性质,使得细胞c的大部分图像特征可以被有效的保存下来,而这就可以为后续使用深度学习检测算法检测细胞提供了合适的基础。
基于上述研究,本发明提出的一种胚胎图像卵裂球目标检测方法,包括步骤:
S1收集含有卵裂球的胚胎图像,构建胚胎图像数据集;
S2构建胚胎图像卵裂球目标检测网络模型;
S3利用步骤S1构建的胚胎图像数据集对所述胚胎图像卵裂球目标检测网络模型进行训练,获取模型及其参数;
S4利用训练后的模型对测试集胚胎数据进行预测,并完成测试集预测和结果评估;
S5将待识别的胚胎图像输入至步骤S4的胚胎图像卵裂球目标检测网络模型得到检测结果。
下面详细介绍本实施例的实施过程:
1. 数据收集与预处理阶段
收集含有卵裂球的胚胎图像,构建原始胚胎图像数据集。本发明从不同生殖中心收集胚胎图像,对每一张胚胎图像,邀请多名胚胎专家进行卵裂球标注,采用投票数最多的作为该张图像的最终标签。考虑到时差培养箱中拍摄的图像长宽比相同,且胚胎在孔中摆放的位置各不相同,通过图像处理中旋转,翻转的技术对图像进行扩充,丰富胚胎姿态的多样性;同时考虑到时差培养箱在拍摄时会受到灯光环境的影响,调整图像的亮度、对比度以扩充数据集,增强对训练模型对不同光照环境下胚胎图像的识别能力。
2.模型构建和训练阶段
(1)模型构建
本发明提出的胚胎图像卵裂球目标检测网络模型主要采用yolov7网络框架作为基础网络,并在此基础上做了改进,加入了用于消除模型不确定性和数据不确定性的部分,用于提高卵裂细胞的检测准确性的精度,从而实现对卵裂球个数的预测和定位。胚胎图像卵裂球目标检测网络模型也可以通过yolov7、RetinaNet、DETR等网络框架实现,本实施例着重描述以yolov7网络实现的过程。
胚胎图像卵裂球目标检测网络模型主要包含backbone(骨干网络)、head(头网络)这两个部分。该网络对数据的处理流程如下:首先,具有标签的图片在经过预处理后,被送入backbone部分,backbone部分对图片的特征进行提取;随后,提取到的特征会被送入head部分,经过检测之后输出得到结果。图3是胚胎图像卵裂球目标检测网络模型的基本结构图。
在本实施例中,胚胎图像卵裂球目标检测网络模型的backbone网络是由多个ELAN模块、CBS模块和MP模块组成的,其中ELAN是一种特征提取模块,其自身由多个CBS模块(卷积、批归一化、SiLU激活函数)组成。backbone的作用是提取图像中的特征,为后续步骤提供基础。
具体而言,CBS模块是一种常见的卷积模块,它由卷积层、批归一化层和SiLU激活函数组成。CBS的作用是对输入的特征图进行卷积操作,提取更高层次的特征,并通过批归一化层和SiLU激活函数进行归一化和非线性变换,增强模型的泛化能力和表达能力。
如图4所示,CBS模块通过滑动窗口的方式对输入的特征图进行局部感受野的操作,生成新的特征图。批归一化层是一种常用的归一化层,将对每个批次的数据进行统计,并将其标准化为均值为0,方差为1的分布。批归一化层可以加速模型的收敛,防止梯度消失或爆炸,减少过拟合,提高模型的稳定性。
具体地,ELAN模块是一种特征提取模块,如图5所示,它由多个CBS模块(卷积、批归一化、SiLU激活函数)组成。ELAN的特点是它可以将输入的特征图分为两部分,一部分保留用于后续的特征图拼接,另一部分经过多个CBS后再和前一部分拼接起来输出,用于减少重复计算和内存占用,提高模型的学习能力和硬件利用率。
backbone网络的MP层是由最大池化层(MaxPool)和CBS(卷积、批归一化、SiLU激活函数)组成的,主要用于降低特征图的尺寸和增加通道数。如图6所示,数据进入MP层后,一方面经过最大池化层,对特征图进行下采样,经过CBS模块,对特征图进行卷积、归一化和激活。另一方面,经过两层的CBS模块后,将两次的特征数据进行融合拼接以降低特征图的尺寸,并增加通道数,提高特征质量。
head网络是用于对backbone网络输出的特征图进行多尺度检测和预测的部分。head网络的作用是对backbone网络提取的特征进行进一步的处理,使其能够适应不同尺度的目标检测任务。除了在backbone网络中出现的CBS,ELAN,MP模块部分,head网络还包含SPPCSPC和RepConv模块。
具体而言,SPPCSPC的工作是将SPP空间金字塔池化模块和CSPC交叉阶段部分网络模块这两种模块结合起来,从而形成一个强大的特征提取和融合的模块。如图7所示,其中,SPP的全称是空间金字塔池化(Spatial Pyramid Pooling),是一种特征提取的方法,对输入的特征图进行不同尺度的池化操作,得到不同大小的特征图,拼接形成一个固定长度的特征向量。SPP的优点是可以适应不同大小的输入,避免了图像缩放和裁剪带来的信息损失,提高了特征的表达能力和检测效果。
CSPC的全称是交叉阶段部分网络(Cross Stage Partial Connection),其本质也是一种特征提取的方法,可以将输入的特征图分成两个部分,一部分进行卷积操作,另一部分直接通过,拼接后形成一个更丰富的特征图。CSPC的优点是可以减少计算量和参数量,提高模型的效率和泛化能力,实现特征的残差连接和通道混合。
综上所述,SPPCSPC模块的主要工作流程如下:首先,对输入的特征图进行SPP操作,即利用不同大小的池化核进行池化,得到不同尺度的特征图,并将它们拼接起来,以此增加特征的多样性和鲁棒性。对拼接后的特征图进行CSPC操作,即将特征图分成两个部分,一部分进行卷积操作,另一部分保留,最后再将两部分拼接起来,实现特征的残差连接和通道混合。最后,再对拼接后的特征图进行卷积操作,得到最终的特征图。
RepConv是指重参数卷积,这是一种卷积层的变种,可以提高效率和精度。如图8所示,RepConv的原理是在训练时使用多个分支的卷积层,每个分支有不同的分组数,然后将多个分支的输出相加。由于RepConv可以利用多个分支的信息来增强特征表示,其可以提高模型的泛化能力。
对于胚胎图像卵裂球目标检测网络模型而言,由于标签的设定和充分的图像信息和图像特征被提供,使得重叠卵裂球的检测成为可能。在模型训练阶段,模型接受的可能标签图像和原图如图9所示。
从图9可以看出,对于卵裂球c,其在训练中几乎没有特征信息的损失。而对于卵裂球d和e,卵裂球d中虽然包含着整个卵裂球c的边缘以及卵裂球e的部分边缘,但是d的整体信息并没有过多的丢失。卵裂球e同理。
胚胎细胞中卵裂球之间的重叠,其意义更多是卵裂球之间在物理空间或者说三维空间上的重叠。但是对于二维的胚胎图像而言,由于卵裂球重叠现象的特殊性,即具有光学上的透明或者半透明性质,这种三维空间中的重叠,对于深度学习模型而言,其可以将这种情况视为对只具有边缘而内部为空的“普通物体”的检测。虽然这些“普通物体”的形状、大小不同,但是只要给它们设定统一的标签,模型会自动的提取和学习这些物体的特征,并设置相应的网络权重,从而实现最终的目标检测和计数任务。
由于胚胎细胞分裂这个领域的特殊性,原始yolov7模型并不能对某些特殊形态的重叠卵裂球做出有效的检测和计数。主要原因是使用模型对胚胎细胞卵裂球检测时存在两个问题:(1)相似性问题,(2)边缘噪声问题。
(1)相似性问题
相似性问题的产生,是由于卵裂球之间相互挤压、覆盖和重叠,虽然同属一个类别,但是仍存在一些细微的差异,尤其是在两个卵裂球形状、大小以及位置几乎一样的情况下,这样的卵裂球之间有很高的相似性。这种情况下,模型往往难以准确地区分同一个类别的不同对象,因为它们在外观和所处位置有很多的共性,而差异很小。这种相似性就会导致模型的分类准确率下降,甚至出现误检或漏检的情况。
MC-DropBlock是一种在卷积神经网络中引入随机性的方法,其可以有效地模拟模型不确定性,并提高模型的鲁棒性和泛化能力。具体来说,它在训练和测试阶段都会随机地丢弃一些特征图上的区域,从而使得模型不能依赖于某些局部特征,而是要学习更全局和抽象的特征,以此增加模型对不确定性的感知和适应能力,也就是说模型可以更好地区分相似目标,并且给出更合理的置信度。
在许多实际应用中,模型与物体预测不准确相关的风险非常高。对于复杂的细胞图像也同样面临这样的问题。标准的物体检测模型往往没有考虑到模型上的预测不确定性。为此,本发明引入了一种名为MC-DropBlock的有效方法来处理细胞检测任务中的模型不确定性。MC-DropBlock算法本质是一种基于DropBlock的贝叶斯卷积神经网络,它可以在训练和测试时对卷积层的特征图进行随机遮挡,从而模拟权重的不确定性。W是卷积层的权重矩阵,X是输入,Y是输出,M是DropBlock遮挡矩阵,σ是DropBlock的概率参数,M服从参数为1-σ的伯努利分布,整个算法的数学公式如下:
其中表示卷积操作,⊙表示对应元素相乘。在训练时,DropBlock会随机地将特征图中的一些连续区域置零,从而增加模型的鲁棒性和泛化能力。因此,本发明将MC-DropBlock算法引入到原始yolov7模型中,以处理检测过程中的相似性问题。
(2)边缘噪声问题
虽然由于卵裂球重叠现象的特殊性,即从光学上看,卵裂球多为透明或半透明的,单个卵裂球的图像特征和图像信息可以被有效的保留下来。但是,某些卵裂球的边缘仍然会对其周围的卵裂球的检测造成干扰。从图像处理的角度来看,对于这些边缘干扰,可以将其视为一种稀疏噪声。
稀疏噪声是一种只影响图像中一小部分像素的噪声,例如线条、条纹和脉冲噪声。稀疏噪声的特点是它的值与周围像素的值相差很大。稀疏噪声的存在会影响图像的质量和信息提取,因此需要采用一些特殊的方法来去除或减少。之所以可以把这些边缘干扰看成稀疏噪声,是因为这些边缘只占据整个卵裂球的很小一部分。
稀疏噪声可以看成是一种数据不确定性的问题,因为它表示了数据中存在的一些未知或不可预测的错误或偏差。数据不确定性,是由于数据本身的噪声或变异造成的,例如图像中的模糊、遮挡、光照等。这种不确定性是无法消除的,只能通过建模或降低噪声来减小。数据不确定性的问题通常需要用概率分布来描述和量化,而稀疏噪声可以用LaplaceDistribution来建模。Laplace Distribution(拉普拉斯分布)是一种具有重尾性质的分布,它可以用来描述稀疏噪声的概率密度函数。为此,本发明用以处理数据不确定性问题的方法。该方法假设特性统计量在考虑潜在不确定性后,遵循拉普拉斯分布。因此,每个特性统计量不再是确定性的值,而是一个具有不同分布可能性的概率点。借助于不确定的特性统计量,模型可以被训练以消除一定噪声的影响。
Laplace Distribution的算法步骤如下:假设输入的特征图为,其中R是实数集,N是批量大小,C是通道数,HW是高度和宽度,
a.计算特征图在空间维度上的均值μ和标准差σ
其中ε是一个很小的正数,用来避免除零错误;是一种张量的索引方式,表示从X张量中取出所有的批量维度、所有的通道维度、第/>个高度维度和第/>个宽度维度。这相当于对张量X进行切片操作,得到一个形状为/>的二维张量,其中N是批量大小,C是通道数,同时这个二维张量表示X张量在第h行第w列的所有像素值;
b.计算均值和标准差在通道维度上的标准差:
其中和/>是均值和标准差在通道维度上的均值;/>、/>均是一种张量的索引方式,表示从张量μσ中取出第c个通道维度。这相当于对μσ张量进行切片操作,得到一个形状为 (N)的一维张量,其中N是批量大小。这个一维张量表示μσ张量在第c个通道上的所有均值;
c.对均值和标准差进行重参数化处理:
其中是一个因子函数,用来控制随机变量的尺度,/>和/>是两个服从LaplaceDistribution的随机变量矩阵,形状为/>,⊙表示对应元素相乘;
d.对原始的特征图进行归一化、缩放和平移处理:
其中Y是输出的特征图,形状和X相同,βγ分别为重参数化的均值和标准差。
(2)模型训练和测试
使用胚胎图像数据集对胚胎图像卵裂球目标检测网络模型进行训练,获取训练后的网络和参数。其中,在模型训练期间和测试期间对深度学习模型的卷积层之后应用模型不确定性检测机制和数据不确定检测机制,以捕捉模型和数据的先验不确定性。
在训练时,MC-DropBlock算法会随机地将特征图中的一些连续区域置零,从而增加模型的鲁棒性和泛化能力。在测试时,MC-DropBlock算法会对同一个输入特征图进行多次采样,得到不同的输出特征图,从而估计模型的后验分布和不确定性。
根据本发明的设计,在测试阶段,对于一张测试图像,加入MC-DropBlock算法的模型会对其做预测,在预测过程中,相似性的问题,即大小、形状以及位置相近的卵裂球可能会出现漏检的情况,导致某些卵裂球的置信度比较低而无法被检测出。为了提高卵裂球的置信度,本发明把所有卵裂球的置信度的平均值作为最后的置信度。具体而言,假设一张图片中有n个卵裂球被检测到,每个卵裂球的置信度是 ,经过平均之后,所有卵裂球的置信度都为。这种策略会使边界框更加准确,而且对重叠物体或者相似性较高的目标检测更有效。
如图10所示,左图是2卵裂球重叠的图像,中间的图像是胚胎细胞在经过原始的yolov7模型检测后的图像,其只能检测出一个卵裂球,而另一个卵裂球由于和被检测出来的卵裂球在大小、形状以及图像特征上极为相似,而导致了yolov7模型的漏检。然而,对于右边的图像,在本发明将处理模型不确定性的MC- DropBlock方法引入的原始的yolov7网络并且通过平均被检测到卵裂球的置信度之后,2个重叠的卵裂球都可以被有效的检测出来,而且,整体目标检测的置信度也有所上升。
图11是胚胎细胞图像经过加入数据不确定性检测机制的检测结果示意图,左图是一个3卵裂球重叠的图像,中间的图像是胚胎细胞在经过原始的yolov7模型检测后的图像,由于中间卵裂球边缘的干扰,yolov7模型并没有将左边的卵裂球检测出来。然而,对于右边的图像,在加入了处理数据不确定性的方法之后,因为边缘被当做一种噪声处理,致使所有的卵裂球都被检测到。而且,目标检测的置信度也有所上升,这意味着改进之后的模型的检测精度被提高。
3.模型识别阶段
将测试集中的胚胎图像作为训练网络的输入,胚胎图像卵裂球目标检测网络模型会输出卵裂球识别结果。
为了有效处理原yolov7模型对胚胎细胞检测时存在的相似性问题和边缘噪声问题,本发明将MC-DropBlock方法和Laplace Distribution方法同时引进yolov7模型,其所达到的效果可以比单独使用这两种方法都有效。在本发明中,经过多次实验,将LaplaceDistribution模块放在SPPCSPC模块之后,将MC- DropBlock模块放在head部分第二个上采样模块之前,可以取得卵裂球检测和计数的最大精度。
如图12所示,上左是原图,上中是经过原始yolov7模型处理过的图像,其漏检了一个卵裂球。上右是经过单独加入了处理模型不确定性方法的结果,由于其未能有效处理卵裂球中的边缘噪声,因此也漏检了一个卵裂球。但是相对于原始的yolov7模型,由于其采取了平均卵裂球置信度的策略,其检测的置信度整体有所上升,这表明检测的精度被提高。下左是单独加入处理数据不确定性方法的结果。由于其可以把边缘噪声视为一种稀疏噪声,并使用Laplace Distribution来建模处理,使得卵裂球内的边缘噪声被有效的处理,所以每个卵裂球都可以都被检测到。最后,下右是把处理模型不确定性和数据不确定性的方法相结合加入yolov7模型之后的结果。可以看出,这种做法同时具有处理模型不确定性和数据不确定性的优点,既处理了卵裂球之间的相似性问题,提高了卵裂球的检测置信度,同时也有效解决了卵裂球检测中的边缘噪声问题,从而最终实现了卵裂球的精确计数。
本发明还提出一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述的一种胚胎图像卵裂球目标检测方法。
本说明书未作详细描述的内容属于本领域专业技术人员公知的现有技术。
最后需要说明的是,以上具体实施方式仅用以说明本专利技术方案而非限制,尽管参照较佳实施例对本专利进行了详细说明,本领域的普通技术人员应当理解,可以对本专利的技术方案进行修改或者等同替换,而不脱离本专利技术方案的精神和范围,其均应涵盖在本专利的权利要求范围当中。

Claims (10)

1.一种胚胎图像卵裂球目标检测方法,其特征在于:包括如下步骤:
S1收集含有卵裂球的胚胎图像,构建胚胎图像数据集;
S2构建胚胎图像卵裂球目标检测网络模型,所述胚胎图像卵裂球目标检测网络模型包括用于提取图像中特征的backbone网络和用于对backbone网络输出的特征图进行多尺度检测和预测的head网络,所述head网络设置有模型不确定机制;
S3利用步骤S1构建的胚胎图像数据集对所述胚胎图像卵裂球目标检测网络模型进行训练,获取模型及其参数;
S4利用训练后的模型对测试集胚胎数据进行预测,并完成测试集预测和结果评估;
S5将待识别的胚胎图像输入至步骤S4的胚胎图像卵裂球目标检测网络模型得到检测结果。
2.根据权利要求1所述的一种胚胎图像卵裂球目标检测方法,其特征在于:步骤S2中所述胚胎图像卵裂球目标检测网络模型采用yolov7网络框架作为基础网络。
3.根据权利要求1所述的一种胚胎图像卵裂球目标检测方法,其特征在于:步骤S2中所述模型不确定机制为在模型训练期间和测试期间对深度学习模型的卷积层之后应用MC-DropBlock算法,以捕捉模型的先验不确定性,算法的表达式为:
式中,W是卷积层的权重矩阵,X是输入,Y是输出,M是DropBlock遮挡矩阵,σ是DropBlock的概率参数,M服从参数为1-σ的伯努利分布,表示卷积操作,⊙表示对应元素相乘。
4.根据权利要求1所述的一种胚胎图像卵裂球目标检测方法,其特征在于:步骤S2中所述head网络还设置有数据不确定机制,采用Laplace Distribution处理数据不确定性算法,通过在训练期间合成特性统计量来改善网络的泛化能力,从而对模型的不确定性进行建模,算法步骤包括:
假设输入的特征图为,其中R是实数集,N是批量大小,C是通道数,HW是高度和宽度,
a.计算特征图在空间维度上的均值μ和标准差σ
其中ε是一个很小的正数,用来避免除零错误;是张量的索引方式,表示从X张量中取出所有的批量维度、所有的通道维度、第/>个高度维度和第/>个宽度维度;
b.计算均值和标准差在通道维度上的标准差:
其中和/>是均值和标准差在通道维度上的均值;/>和/>是张量的索引方式,分别表示从张量/>σ中取出第c个通道维度;
c.对均值和标准差进行重参数化:
其中是一个因子函数,用来控制随机变量的尺度,/>和/>是两个服从LaplaceDistribution的随机变量矩阵,形状为/>,⊙表示对应元素相乘;
d.对原始的特征图进行归一化、缩放和平移处理:
其中Y是输出的特征图,形状和X相同,βγ分别为重参数化的均值和标准差。
5.根据权利要求1所述的一种胚胎图像卵裂球目标检测方法,其特征在于:步骤S2中所述backbone网络由多个ELAN模块、CBS模块和MP模块组成,其中ELAN模块是一种特征提取模块,由多个CBS模块组成;所述MP模块是由最大池化层MaxPool和CBS组成,用于降低特征图的尺寸和增加通道数;所述CBS模块由卷积、批归一化、SiLU激活函数组成,用于对输入的特征图进行卷积操作,提取更高层次的特征,并通过批归一化层和SiLU激活函数进行归一化和非线性变换。
6.根据权利要求1所述的一种胚胎图像卵裂球目标检测方法,其特征在于:步骤S2中所述head网络由ELAN模块、CBS模块、MP模块、SPPCSPC模块和RepConv模块组成。
7.根据权利要求6所述的一种胚胎图像卵裂球目标检测方法,其特征在于:所述SPPCSPC模块由SPP空间金字塔池化模块和CSPC交叉阶段部分网络组成,用于特征提取和融合;其中SPP空间金字塔池化模块对输入的特征图进行不同尺度的池化操作,得到不同大小的特征图,拼接形成一个固定长度的特征向量;CSPC交叉阶段部分网络将输入的特征图分成两个部分,一部分进行卷积操作,另一部分直接通过,拼接后形成一个更丰富的特征图。
8.根据权利要求7所述的一种胚胎图像卵裂球目标检测方法,其特征在于:所述RepConv模块在训练时使用多个分支的卷积层,每个分支有不同的分组数,然后将多个分支的输出相加。
9.一种计算机设备,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至8中任一所述的方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的一种胚胎图像卵裂球目标检测方法。
CN202311035645.4A 2023-08-17 2023-08-17 胚胎图像卵裂球目标检测方法、计算机设备及存储介质 Active CN116778482B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311035645.4A CN116778482B (zh) 2023-08-17 2023-08-17 胚胎图像卵裂球目标检测方法、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311035645.4A CN116778482B (zh) 2023-08-17 2023-08-17 胚胎图像卵裂球目标检测方法、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN116778482A true CN116778482A (zh) 2023-09-19
CN116778482B CN116778482B (zh) 2023-10-31

Family

ID=88008343

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311035645.4A Active CN116778482B (zh) 2023-08-17 2023-08-17 胚胎图像卵裂球目标检测方法、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN116778482B (zh)

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111681209A (zh) * 2020-05-15 2020-09-18 武汉互创联合科技有限公司 卵裂球分裂状态智能检测方法及系统
CN111814741A (zh) * 2020-07-28 2020-10-23 四川通信科研规划设计有限责任公司 一种基于注意力机制的遮挡胚胎原核及卵裂球检测方法
CN112069874A (zh) * 2020-07-17 2020-12-11 中山大学 胚胎光镜图像中细胞的识别方法及系统、设备及存储介质
CN112990319A (zh) * 2021-03-18 2021-06-18 武汉互创联合科技有限公司 基于深度学习的染色体整倍性预测系统、方法、终端、介质
CN114897823A (zh) * 2022-05-10 2022-08-12 广州锟元方青医疗科技有限公司 一种细胞学样本图像质量控制方法、系统及存储介质
CN115049908A (zh) * 2022-08-16 2022-09-13 武汉互创联合科技有限公司 基于胚胎发育图像的多阶段智能分析方法及系统
CN115187558A (zh) * 2022-07-13 2022-10-14 爱辅科技(上海)有限公司 一种胚胎发育检测装置及其训练平台
CN115239715A (zh) * 2022-09-22 2022-10-25 中南大学 一种囊胚发育结果预测方法、系统、设备及存储介质
US20220343178A1 (en) * 2019-09-25 2022-10-27 Presagen Pty Ltd Method and system for performing non-invasive genetic testing using an artificial intelligence (ai) model
WO2022240851A1 (en) * 2021-05-10 2022-11-17 Kang Zhang System and method for outcome evaluations on human ivf-derived embryos
US20220392062A1 (en) * 2019-12-20 2022-12-08 Alejandro Chavez Badiola Method based on image conditioning and preprocessing for human embryo classification
US20230027723A1 (en) * 2021-07-07 2023-01-26 California Institute Of Technology Stain-free detection of embryo polarization using deep learning
CN115937082A (zh) * 2022-09-30 2023-04-07 湘潭大学 基于深度学习的胚胎质量智能评估系统及评估方法
WO2023121575A1 (en) * 2021-12-23 2023-06-29 Kodmed Saglik Ve Bilisim Teknolojileri A.S Determining the age and arrest status of embryos using a single deep learning model

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220343178A1 (en) * 2019-09-25 2022-10-27 Presagen Pty Ltd Method and system for performing non-invasive genetic testing using an artificial intelligence (ai) model
US20220392062A1 (en) * 2019-12-20 2022-12-08 Alejandro Chavez Badiola Method based on image conditioning and preprocessing for human embryo classification
CN111681209A (zh) * 2020-05-15 2020-09-18 武汉互创联合科技有限公司 卵裂球分裂状态智能检测方法及系统
CN112069874A (zh) * 2020-07-17 2020-12-11 中山大学 胚胎光镜图像中细胞的识别方法及系统、设备及存储介质
WO2022012110A1 (zh) * 2020-07-17 2022-01-20 中山大学 胚胎光镜图像中细胞的识别方法及系统、设备及存储介质
CN111814741A (zh) * 2020-07-28 2020-10-23 四川通信科研规划设计有限责任公司 一种基于注意力机制的遮挡胚胎原核及卵裂球检测方法
CN112990319A (zh) * 2021-03-18 2021-06-18 武汉互创联合科技有限公司 基于深度学习的染色体整倍性预测系统、方法、终端、介质
WO2022240851A1 (en) * 2021-05-10 2022-11-17 Kang Zhang System and method for outcome evaluations on human ivf-derived embryos
US20230027723A1 (en) * 2021-07-07 2023-01-26 California Institute Of Technology Stain-free detection of embryo polarization using deep learning
WO2023121575A1 (en) * 2021-12-23 2023-06-29 Kodmed Saglik Ve Bilisim Teknolojileri A.S Determining the age and arrest status of embryos using a single deep learning model
CN114897823A (zh) * 2022-05-10 2022-08-12 广州锟元方青医疗科技有限公司 一种细胞学样本图像质量控制方法、系统及存储介质
CN115187558A (zh) * 2022-07-13 2022-10-14 爱辅科技(上海)有限公司 一种胚胎发育检测装置及其训练平台
CN115049908A (zh) * 2022-08-16 2022-09-13 武汉互创联合科技有限公司 基于胚胎发育图像的多阶段智能分析方法及系统
CN115239715A (zh) * 2022-09-22 2022-10-25 中南大学 一种囊胚发育结果预测方法、系统、设备及存储介质
CN115937082A (zh) * 2022-09-30 2023-04-07 湘潭大学 基于深度学习的胚胎质量智能评估系统及评估方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
BO HUANG, WEI TAN, ZHOU LI: "An artificial intelligence model (euploid prediction algorithm) can predict embryo ploidy status based on time-lapse data", REPRODUCTIVE BIOLOGY AND ENDOCRINOLOGY *
YONGLE YANG, WEI TAN: "Correlation of the position and status of the polar body from the fertilized oocyte to the euploid status of blastocyste", FRONTIERS *
梅克进: "基于时序图像的胚胎卵裂期特征识别系统设计与实现", 中国优秀硕士论文电子期刊 *

Also Published As

Publication number Publication date
CN116778482B (zh) 2023-10-31

Similar Documents

Publication Publication Date Title
Wang et al. Chestnet: A deep neural network for classification of thoracic diseases on chest radiography
Ali et al. Structural crack detection using deep convolutional neural networks
Wang et al. Tire defect detection using fully convolutional network
CN111178197B (zh) 基于Mask R-CNN和Soft-NMS融合的群养粘连猪实例分割方法
Hu et al. Classification of metaphase chromosomes using deep convolutional neural network
CN112085714B (zh) 一种肺结节检测方法、模型训练方法、装置、设备及介质
CN109389129A (zh) 一种图像处理方法、电子设备及存储介质
CN110610210B (zh) 一种多目标检测方法
CN111429424B (zh) 一种基于深度学习的加热炉入口异常识别方法
Naik et al. Improved and Accurate Face Mask Detection Using Machine Learning in the Crowded Places
US11804029B2 (en) Hierarchical constraint (HC)-based method and system for classifying fine-grained graptolite images
CN110930378A (zh) 基于低数据需求的肺气肿影像处理方法及系统
CN112749675A (zh) 一种基于卷积神经网络的马铃薯病害识别方法
CN113191222A (zh) 水下鱼类目标检测方法及装置
CN108154513A (zh) 基于双光子成像数据的细胞自动探测和分割方法
CN113096080A (zh) 图像分析方法及系统
CN116778482B (zh) 胚胎图像卵裂球目标检测方法、计算机设备及存储介质
CN111353577B (zh) 基于多任务的级联组合模型的优化方法、装置及终端设备
CN111881803A (zh) 一种基于改进YOLOv3的畜脸识别方法
CN113963199B (zh) 一种基于多种传感器特征融合和机器学习的医废识别方法
Yang et al. Intelligent collection of rice disease images based on convolutional neural network and feature matching
Nikolskyy et al. Using LabView for real-time monitoring and tracking of multiple biological objects
Kapoor et al. Lung Cancer Detection Using VGG16 and CNN
Wang et al. Strawberry ripeness classification method in facility environment based on red color ratio of fruit rind
Princy et al. Detection & Classification of Tuberculosis HIV-Positive Patients using Deep Learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant