CN112465060A - 图像中目标物检测方法、装置、电子设备及可读存储介质 - Google Patents

图像中目标物检测方法、装置、电子设备及可读存储介质 Download PDF

Info

Publication number
CN112465060A
CN112465060A CN202011433976.XA CN202011433976A CN112465060A CN 112465060 A CN112465060 A CN 112465060A CN 202011433976 A CN202011433976 A CN 202011433976A CN 112465060 A CN112465060 A CN 112465060A
Authority
CN
China
Prior art keywords
target object
image
target
detection
loss function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011433976.XA
Other languages
English (en)
Inventor
柳杨
吕彬
吕传峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202011433976.XA priority Critical patent/CN112465060A/zh
Publication of CN112465060A publication Critical patent/CN112465060A/zh
Priority to PCT/CN2021/083182 priority patent/WO2022121156A1/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及图像检测技术,揭露了一种图像中目标物检测方法,包括:获取包含分类筛选子模型、共享编码子模型和检测子模型的目标物检测模型,利用共享编码子模型对训练图像集进行编码,利用分类筛选子模型对编码得到的编码特征进行筛选,利用检测子模型对筛选的结果进行目标物检测,并根据检测结果和训练图像的标准结果对目标物检测模型进行优化,利用优化后的标物检测模型对待检测目标物图像进行图像检测,得到检测结果。此外,本发明还涉及区块链技术,所述训练图像集可存储于区块链的节点。本发明还提出一种图像中目标物检测装置、电子设备以及计算机可读存储介质。本发明可以解决对图像进行目标物检测时精确率较低的问题。

Description

图像中目标物检测方法、装置、电子设备及可读存储介质
技术领域
本发明涉及图像检测技术领域,尤其涉及一种图像中目标物检测方法、装置、电子设备及计算机可读存储介质。
背景技术
信息时代随着电子产品的丰富和发展,近视已成为全球公共卫生的负担,近视患者中的高度近视人群容易引起黄斑区视网膜病变,进而发展为病理性近视。因此产生了基于眼底彩照的斑片状萎缩和视网膜脱离等病变产生的病灶等目标物进行检测的医疗手段。
现有的对图像中目标物进行检测的方法多为依靠深度学习模型对图像进行分析以检出图像中的目标物。该方法过于依赖图像的质量,但实际应用中图像质量往往无法得到保证,导致模型对于较难观测到的病灶会出现漏检的情况,或因图像模糊出现对不含有目标物的图像进行误判的情况,也无法获取病灶的大小、尺寸及位置的精确信息。
发明内容
本发明提供一种图像中目标物检测方法、装置及计算机可读存储介质,其主要目的在于解决对图像进行目标物检测时精确率较低的问题。
为实现上述目的,本发明提供的一种图像中目标物检测方法,包括:
获取目标物检测模型,其中,所述目标物检测模型中包含分类筛选子模型、共享编码子模型和检测子模型;
获取训练图像集,利用所述共享编码子模型对所述训练图像集进行编码,得到所述训练图像集的编码特征,其中,所述训练图像集包含训练图像及所述训练图像的标准检测结果;
利用所述分类筛选子模型对所述编码特征进行分类筛选,得到带有目标物的目标编码特征;
利用所述检测子模型对所述目标编码特征进行目标物检测,得到检测结果,其中,所述检测结果包括目标物的预测中心点信息、预测尺寸信息及预测边界信息;
根据所述检测结果与所述标准检测结果构建目标损失函数;
计算所述目标损失函数的损失值,根据所述损失值对所述目标物检测模型进行优化,得到标准目标物检测模型;
获取待检测目标物图像,利用所述标准目标物检测模型对所述待检测目标物图像进行图像检测,得到检测结果。
可选地,所述利用所述共享编码子模型对所述训练图像集进行编码,得到所述训练图像集的编码特征,包括:
利用前向并行卷积通道对所述训练图像集进行卷积得到的前向特征图;
利用后向并行卷积通道对所述前向特征图及所述前向特征图的下采样图像进行卷积,获得后向特征图;
对所述后向特征图进行池化处理,得到所述训练图像集的编码特征。。
可选地,所述利用所述分类筛选子模型对所述编码特征进行分类筛选,得到带有目标物的目标编码特征,包括:
利用所述分类筛选子模型对所述编码特征进行全连接处理,得到全连接特征;
利用第一激活函数计算所述全连接特征属于第一预设类别的第一类别概率;
根据所述第一类别概率对所述编码特征进行分类处理,得到带有目标物的目标编码特征。
可选地,所述利用所述检测子模型对所述目标编码特征进行目标物检测,得到检测结果,包括:
利用所述检测子模型对所述目标编码特征进行第一阈值倍数的上采样,得到中间特征图;
对所述中间特征图进行第二预设倍数的上采样,得到复原图像;
利用第二激活函数计算所述复原图像中各像素点属于第二预设类别的第二类别概率;
根据所述第二类别概率对所述复原图像进行目标物检测,得到检测结果。
可选地,所述标准检测结果包括标准中心点信息、标准尺寸信息及标准边界信息,所述根据所述检测结果与所述标准检测结果构建目标损失函数,包括:
根据所述预测中心点信息和所述标准中心点信息构建中心点损失函数;
根据所述预测尺寸信息和所述标准尺寸信息构建尺寸损失函数;
根据所述预测边界信息和所述标准边界信息构建边界损失函数;
将所述中心点损失函数、所述尺寸损失函数和所述边界损失函数聚合为目标损失函数。
可选地,所述将所述中心点损失函数、所述尺寸损失函数和所述边界损失函数聚合为目标损失函数,包括:
获取预设的函数系数;
利用所述函数系数、所述中心点损失函数、所述尺寸损失函数和所述边界损失函数进行算数运算,得到目标损失函数。
可选地,所述根据所述损失值对所述目标物检测模型进行优化,包括:
当所述目标损失函数的损失值大于预设的损失阈值,则利用优化算法对所述目标物检测模型的参数进行优化;
当所述目标损失函数的损失值小于或等于所述损失阈值,得到标准目标物检测模型。
为了解决上述问题,本发明还提供一种图像中目标物检测装置,所述装置包括:
模型获取模块,用于获取目标物检测模型,其中,所述目标物检测模型中包含分类筛选子模型、共享编码子模型和检测子模型;
图像编码模块,用于获取训练图像集,利用所述共享编码子模型对所述训练图像集进行编码,得到所述训练图像集的编码特征,其中,所述训练图像集包含训练图像及所述训练图像的标准检测结果;
分类筛选模块,用于利用所述分类筛选子模型对所述编码特征进行分类筛选,得到带有目标物的目标编码特征;
目标物检测模块,用于利用所述检测子模型对所述目标编码特征进行目标物检测,得到检测结果,其中,所述检测结果包括目标物的预测中心点信息、预测尺寸信息及预测边界信息;
损失函数构建模块,用于根据所述检测结果与所述标准检测结果构建目标损失函数;
模型优化模块,用于计算所述目标损失函数的损失值,根据所述损失值对所述目标物检测模型进行优化,得到标准目标物检测模型;
图像检测模块,用于获取待检测目标物图像,利用所述标准目标物检测模型对所述待检测目标物图像进行图像检测,得到检测结果。
为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
存储器,存储至少一个指令;及
处理器,执行所述存储器中存储的指令以实现上述所述的图像中目标物检测方法。
为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现上述所述的图像中目标物检测方法。
本发明实施例通过利用共享编码子模型对训练图像集进行编码,得到所述训练图像集的编码特征,可减少训练图像中的信息量,突出训练图像的图像特征,有利于提高后续进行目标物检测的精确度;利用分类筛选子模型对编码特征进行分类筛选,可剔除不包含目标物的编码特征,以避免后续对不包含目标物的编码特征进行图像检测,有利于提高图像检测的效率;利用检测子模型对目标编码特征进行目标物检测,得到预测中心点信息、预测尺寸信息及预测边界信息,并根据三种信息构建损失函数,利用损失函数对目标物检测模型进行优化,有利于提高目标物检测模型的精度。因此本发明提出的图像中目标物检测方法、装置、电子设备及计算机可读存储介质,可以解决对图像进行目标物检测时精确率较低的问题。
附图说明
图1为本发明一实施例提供的图像中目标物检测方法的流程示意图;
图2为本发明一实施例提供的图像中目标物检测装置的功能模块图;
图3为本发明一实施例提供的实现所述图像中目标物检测方法的电子设备的结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本申请实施例提供一种图像中目标物检测方法。所述图像中目标物检测方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之,所述图像中目标物检测方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。
参照图1所示,为本发明一实施例提供的图像中目标物检测方法的流程示意图。在本实施例中,所述图像中目标物检测方法包括:
S1、获取目标物检测模型,其中,所述目标物检测模型中包含分类筛选子模型、共享编码子模型和检测子模型。
本发明实施例中,所述目标物检测模型为具有图像分类与图像检测功能的U型卷积神经网络,所述U型卷积神经网络包括卷积层、池化层和全连接层。
具体的,所述目标物检测模型包括以下一层或多层的组合:
卷积层,用于对图像进行卷积处理,对于图片中的每一个特征首先局部感知,然后更高层次对局部进行综合操作,从而得到全局信息;
池化层,对卷积后的图像进行池化处理,用于特征降维,有利于减小数据和参数的数量,以及提高模型的容错性;
全连接层,用于线性分类,具体用于在提取的高层特征向量上进行线性组合并且输出最后的图像分类结果。
本发明实施例中,所述目标物检测模型中包含分类筛选子模型、共享编码子模型和检测子模型。其中,所述分类筛选子模型用于判定目标物检测模型中输入的图像中是否含有目标物,所述共享编码子模型用于对输入的图像进行编码,所述检测子模型用于对分类子模型判定为含有目标物的图像进行目标物检测。
S2、获取训练图像集,利用所述共享编码子模型对所述训练图像集进行编码,得到所述训练图像集的编码特征,其中,所述训练图像集包含训练图像及所述训练图像的标准检测结果。
本发明实施例中,所述训练图像集为包含训练图像及所述训练图像的标准检测结果,其中,所述检测结果包括但不限于目标物的标准中心点信息、标准尺寸信息及标准边界信息。
详细地,可利用具有数据抓取功能的python语句从用于存储所述训练图像集的区块链节点中获取所述训练图像集,利用区块链对数据的高吞吐性,可提高获取所述训练图像集的效率。
本发明实施例中,所述共享编码子模型采用多通道、多分辨率分支并行卷积的方式对同一特征进行卷积,从而得到目标物同一特征不同分辨率下的特征图。
所述共享编码子模型由传统的串行连接卷积,改成并行连接卷积,进而得到丰富的高分辨率表征,提高了进行目标物检测的精确度。
具体地,所述目标物检测模型包括多个不同分辨率的并行卷积通道。
详细地,所述利用所述共享编码子模型对所述训练图像集进行编码,得到所述训练图像集的编码特征,包括:
利用前向并行卷积通道对所述训练图像集进行卷积得到的前向特征图;
利用后向并行卷积通道对所述前向特征图及所述前向特征图的下采样图像进行卷积,获得后向特征图;
对所述后向特征图进行池化处理,得到所述训练图像集的编码特征。
所述前向并行卷积通道与所述后向并行卷积通道是相对而言的,例如,共享编码子模型包括4个并行卷积通道,第一个对训练图像进行卷积的并行卷积通道相对于第二个对训练图像进行卷积的并行卷积通道、第三个对训练图像进行卷积的并行卷积通道和第一个对训练图像进行卷积的并行卷积通道来说是前向并行卷积通道;第二个对训练图像进行卷积的并行卷积通道相对于第一个对训练图像进行卷积的并行卷积通道来说是后向并行卷积通道,依此类推。
当前向并行卷积通道为初始并行卷积通道时,后向卷积的对前向得到的结果及前向并行卷积通道的输入进行卷积,得到特征图。
当前向并行卷积通道不为初始卷积通道时,后向卷积的对前向得到的结果及所有前向卷积通道的输入进行卷积,得到特征图。
具体地,例如,在第一并行卷积通道中对所述训练图像进行卷积,得到第一特征图;
在第二并行卷积通道中对所述第一特征图及所述第一特征图的第一下采样图像进行卷积,得到第二特征图;
在第三并行卷积通道中对所述第二特征图及所述第二特征图的第二下采样图像进行卷积,得到第三特征图;
在第四并行卷积通道中对所述第三特征图及所述第三特征图的第三下采样图像进行卷积,得到第四特征图;
对所述第四特征图进行池化处理,得到所述训练图像集的编码特征。
其中,第一并行卷积通道、第一并行卷积通道、第一并行卷积通道、第一并行卷积通道以并行方式连接,以此得到同一特征的四种不同分辨率的特征图。
由于高分辨率图像含有更多的像素位置信息,更有利于位置信息的提取,低分辨率图像含有更多的特征信息,更有利于特征的识别。因此,本发明实施例中,所述目标物检测模型输出多层并行卷积通道得到的特征图的分辨率逐渐降低,特征信息也逐渐增强。所以,本发明实施例通过多层并行卷积通道得到的特征图即包含了高分辨率的位置信息,又包含了低分辨率的特征信息,更有利于后续利用特征图进行目标物检测,提高进行目标物检测的精确度。
S3、利用所述分类筛选子模型对所述编码特征进行分类筛选,得到带有目标物的目标编码特征。
本发明实施例中,所述利用所述分类筛选子模型对所述编码特征进行分类筛选,得到带有目标物的目标编码特征,包括:
利用所述分类筛选子模型对所述编码特征进行全连接处理,得到全连接特征;
利用第一激活函数计算所述全连接特征属于第一预设类别的第一类别概率;
根据所述第一类别概率对所述编码特征进行分类处理,得到带有目标物的目标编码特征。
详细地,所述第一预设类别包括多个预设类别,根据所述第一类别概率对所述全连接特征进行分类处理,得到训练图像集中各训练图像的编码特征的分类结果,即确定所述类别概率值最大的预设类别为训练图像的编码特征的分类结果。
例如,第一预设类别中包括类别A、类别B与类别C,训练图像1的全连接特征属于第一预设类别中类别A的概率为50%,全连接特征属于第一预设类别中类别B的概率为80%,则确定训练图像1的编码特征的分类结果为类别B。
详细地,所述第一激活函数包括但不限于softmax激活函数,利用第一激活函数可计算得到全连接特征为第一预设类别的第一类别概率。
本发明实施例通过分类筛选子模型对所述编码特征进行分类筛选,进而剔除不包含目标物的编码特征,保留包含目标物的编码特征,以避免后续对不包含目标物的编码特征进行图像检测,有利于提高图像检测的效率。
S4、利用所述检测子模型对所述目标编码特征进行目标物检测,得到检测结果,其中,所述检测结果包括目标物的预测中心点信息、预测尺寸信息及预测边界信息。
本发明实施例中,所述检测结果包括目标物的预测中心点信息、预测尺寸信息及预测边界信息,其中,所述预测中心点信息用于表示目标物中心点位置;所述预测尺寸信息用于表示目标物的尺寸大小;所述预测边界信息用于表示目标物的边界信息。
详细地,所述利用所述检测子模型对所述目标编码特征进行目标物检测,得到检测结果,包括:
利用所述检测子模型对所述目标编码特征进行第一阈值倍数的上采样,得到中间特征图;
对所述中间特征图进行第二预设倍数的上采样,得到复原图像;
利用第二激活函数计算所述复原图像中各像素点属于第二预设类别的第二类别概率;
根据所述第二类别概率对所述复原图像进行目标物检测,得到检测结果。
详细地,所述目标物检测包括对复原图像中像素点的分类进行检测,所述第二预设类别中包括多个预设类别,所述根据所述第二类别概率对所述复原图像进行目标物检测,得到检测结果,即确定所述第二类别概率值最大的预设类别为复原图像的检测结果。
例如,第二预设类别中包括类别D、类别E与类别F,复原图像中目标像素点为第二预设类别中类别D的概率为20%,复原图像中目标像素点为第二预设类别中类别E的概率为70%,复原图像中目标像素点为第二预设类别中类别F的概率为40%,则确定复原图像中目标像素点为类别E,当所述复原图像中所有像素点均完成上述操作,得到复原图像的检测结果。
本发明实施例中将目标编码特征进行第一阈值倍数的上采样,得到中间特征图,再将中间特征图进行第二阈值倍数的上采样,得到复原图像,避免直接将目标编码特征上采样至复原图像时上采样倍数过大导致复原图像中图像特征的丢失,提高了复原图像中特征信息的完整性。
S5、根据所述检测结果与所述标准检测结果构建目标损失函数。
本发明实施例中,所述根据所述检测结果与所述标准检测结果构建目标损失函数,包括:
根据所述预测中心点信息和所述标准中心点信息构建中心点损失函数;
根据所述预测尺寸信息和所述标准尺寸信息构建尺寸损失函数;
根据所述预测边界信息和所述标准边界信息构建边界损失函数;
将所述中心点损失函数、所述尺寸损失函数和所述边界损失函数聚合为目标损失函数。
详细地,所述将所述中心点损失函数、所述尺寸损失函数和所述边界损失函数聚合为目标损失函数,包括:
获取预设的函数系数;
利用所述函数系数、所述中心点损失函数、所述尺寸损失函数和所述边界损失函数进行算数运算,得到目标损失函数。
具体地,所述预设的函数系数可由用户自行定义。
本发明实施例中,所述目标损失函数为:
Figure 513545DEST_PATH_IMAGE001
Figure 875256DEST_PATH_IMAGE002
Figure 665488DEST_PATH_IMAGE003
Figure 796256DEST_PATH_IMAGE004
其中,
Figure 466271DEST_PATH_IMAGE005
为中心点损失函数,
Figure 629793DEST_PATH_IMAGE006
为尺寸损失函数,
Figure 410667DEST_PATH_IMAGE007
为边界损失函数,C为目标物的类别的数量,
Figure 661520DEST_PATH_IMAGE008
为所述训练图像的长度,
Figure 49907DEST_PATH_IMAGE009
为所述训练图像的宽度,
Figure 651789DEST_PATH_IMAGE010
为所述训练图像的数量,
Figure 236355DEST_PATH_IMAGE011
Figure 607293DEST_PATH_IMAGE012
为预设常数,
Figure 602800DEST_PATH_IMAGE013
为预测中心点信息,
Figure 426399DEST_PATH_IMAGE014
为标准中心点信息,
Figure 345814DEST_PATH_IMAGE015
为预测尺寸信息,
Figure 321991DEST_PATH_IMAGE016
为标准尺寸信息,
Figure 301448DEST_PATH_IMAGE017
为预测边界信息,
Figure 877923DEST_PATH_IMAGE018
为标准边界信息,
Figure 7553DEST_PATH_IMAGE019
Figure 865001DEST_PATH_IMAGE021
Figure 484201DEST_PATH_IMAGE022
为预设的函数系数。
详细地,在计算中心点损失函数的函数值时,若所述预测中心点信息与所述标准中心点信息一致(即,
Figure 829863DEST_PATH_IMAGE023
),则
Figure 294343DEST_PATH_IMAGE005
为:
Figure 228800DEST_PATH_IMAGE024
若所述预测中心点信息与所述标准中心点信息不一致(即
Figure 18902DEST_PATH_IMAGE025
,则
Figure 350395DEST_PATH_IMAGE005
为:
Figure 618565DEST_PATH_IMAGE026
本发明实施例利用中心点损失函数、尺寸损失函数及边界损失函数组合为目标损失函数,同时利用目标物的中心点位置,尺寸大小及边界位置的三种损失值,利用三种损失值对目标物检测模型的参数进行更新,有利于提高目标物检测模型的精度。
S6、计算所述目标损失函数的损失值,根据所述损失值对所述目标物检测模型进行优化,得到标准目标物检测模型。
本发明实施例中,所述根据所述损失值对所述目标物检测模型进行优化,包括:
当所述目标损失函数的损失值大于预设的损失阈值,则利用优化算法对所述目标物检测模型的参数进行优化;
当所述目标损失函数的损失值小于或等于所述损失阈值,得到标准目标物检测模型。
本发明实施例中,当所述目标损失函数的损失值大于预设的损失阈值,使用Adam优化算法对目标物检测模型的参数进行优化,Adam优化算法可自适应调节目标物检测模型训练过程中的学习率,使得目标物检测模型更加精确,提升目标物检测模型的性能。
S7、获取待检测目标物图像,利用所述标准目标物检测模型对所述待检测目标物图像进行图像检测,得到检测结果。
本发明实施例中,所述待检测目标物图像包括生物体组织的医学图像,例如,眼底彩照的彩色图像。
本发明实施例可利用具有数据抓取功能的python语句从用于存储所述待检测目标图像的区块链中抓取所述待检测目标物图像,当获取到待检测目标物图像后,将所述待检测目标物图像输入至标准目标物检测模型进行目标物检测,得到检测结果。
本发明实施例通过利用共享编码子模型对训练图像集进行编码,得到所述训练图像集的编码特征,可减少训练图像中的信息量,突出训练图像的图像特征,有利于提高后续进行目标物检测的精确度;利用分类筛选子模型对编码特征进行分类筛选,可剔除不包含目标物的编码特征,以避免后续对不包含目标物的编码特征进行图像检测,有利于提高图像检测的效率;利用检测子模型对目标编码特征进行目标物检测,得到预测中心点信息、预测尺寸信息及预测边界信息,并根据三种信息构建损失函数,利用损失函数对目标物检测模型进行优化,有利于提高目标物检测模型的精度。因此本发明提出的图像中目标物检测方法,可以解决对图像进行目标物检测时精确率较低的问题。
如图2所示,是本发明一实施例提供的图像中目标物检测装置的功能模块图。
本发明所述图像中目标物检测装置100可以安装于电子设备中。根据实现的功能,所述图像中目标物检测装置100可以包括模型获取模块101、图像编码模块102、分类筛选模块103、目标物检测模块104、损失函数构建模块105、模型优化模块106和图像检测模块107。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块/单元的功能如下:
所述模型获取模块101,用于获取目标物检测模型,其中,所述目标物检测模型中包含分类筛选子模型、共享编码子模型和检测子模型。
本发明实施例中,所述目标物检测模型为具有图像分类与图像检测功能的U型卷积神经网络,所述U型卷积神经网络包括卷积层、池化层和全连接层。
具体的,所述目标物检测模型包括以下一层或多层的组合:
卷积层,用于对图像进行卷积处理,对于图片中的每一个特征首先局部感知,然后更高层次对局部进行综合操作,从而得到全局信息;
池化层,对卷积后的图像进行池化处理,用于特征降维,有利于减小数据和参数的数量,以及提高模型的容错性;
全连接层,用于线性分类,具体用于在提取的高层特征向量上进行线性组合并且输出最后的图像分类结果。
本发明实施例中,所述目标物检测模型中包含预分类筛选子模型、共享编码子模型和检测子模型。其中,所述分类筛选子模型用于判定模型输入的图像中是否含有目标物,所述共享编码子模型用于对输入的图像进行编码,所述检测子模型用于对分类子模型判定为含有目标物的图像进行目标物检测。
所述图像编码模块102,用于获取训练图像集,利用所述共享编码子模型对所述训练图像集进行编码,得到所述训练图像集的编码特征,其中,所述训练图像集包含训练图像及所述训练图像的标准检测结果。
本发明实施例中,所述训练图像集为包含训练图像及所述训练图像的标准检测结果,其中,所述检测结果包括但不限于目标物的标准中心点信息、标准尺寸信息及标准边界信息。
详细地,可利用具有数据抓取功能的python语句从用于存储所述训练图像集的区块链节点中获取所述训练图像集,利用区块链对数据的高吞吐性,可提高获取所述训练图像集的效率。
本发明实施例中,所述共享编码子模型采用多通道、多分辨率分支并行卷积的方式对同一特征进行卷积,从而得到目标物同一特征不同分辨率下的特征图。
所述共享编码子模型由传统的串行连接卷积,改成并行连接卷积,进而得到丰富的高分辨率表征,提高了进行目标物检测的精确度。
具体地,所述目标物检测模型包括多个不同分辨率的并行卷积通道。
详细地,所述图像编码模块102具体用于:
利用前向并行卷积通道对所述训练图像集进行卷积得到的前向特征图;
利用后向并行卷积通道对所述前向特征图及所述前向特征图的下采样图像进行卷积,获得后向特征图;
对所述后向特征图进行池化处理,得到所述训练图像集的编码特征。
所述前向并行卷积通道与所述后向并行卷积通道是相对而言的,例如,共享编码子模型包括4个并行卷积通道,第一个对训练图像进行卷积的并行卷积通道相对于第二个对训练图像进行卷积的并行卷积通道、第三个对训练图像进行卷积的并行卷积通道和第一个对训练图像进行卷积的并行卷积通道来说是前向并行卷积通道;第二个对训练图像进行卷积的并行卷积通道相对于第一个对训练图像进行卷积的并行卷积通道来说是后向并行卷积通道,依此类推。
当前向并行卷积通道为初始并行卷积通道时,后向卷积的对前向得到的结果及前向并行卷积通道的输入进行卷积,得到特征图。
当前向并行卷积通道不为初始卷积通道时,后向卷积的对前向得到的结果及所有前向卷积通道的输入进行卷积,得到特征图。
具体地,例如,在第一并行卷积通道中对所述训练图像进行卷积,得到第一特征图;
在第二并行卷积通道中对所述第一特征图及所述第一特征图的第一下采样图像进行卷积,得到第二特征图;
在第三并行卷积通道中对所述第二特征图及所述第二特征图的第二下采样图像进行卷积,得到第三特征图;
在第四并行卷积通道中对所述第三特征图及所述第三特征图的第三下采样图像进行卷积,得到第四特征图;
对所述第四特征图进行池化处理,得到所述训练图像集的编码特征。
其中,第一并行卷积通道、第一并行卷积通道、第一并行卷积通道、第一并行卷积通道以并行方式连接,以此得到同一特征的四种不同分辨率的特征图。
由于高分辨率图像含有更多的像素位置信息,更有利于位置信息的提取,低分辨率图像含有更多的特征信息,更有利于特征的识别。因此,本发明实施例中,所述目标物检测模型输出多层并行卷积通道得到的特征图的分辨率逐渐降低,特征信息也逐渐增强。所以,本发明实施例通过多层并行卷积通道得到的特征图即包含了高分辨率的位置信息,又包含了低分辨率的特征信息,更有利于后续利用特征图进行目标物检测,提高进行目标物检测的精确度。
所述分类筛选模块103,用于利用所述分类筛选子模型对所述编码特征进行分类筛选,得到带有目标物的目标编码特征。
本发明实施例中,所述分类筛选模块103具体用于:
利用所述分类筛选子模型对所述编码特征进行全连接处理,得到全连接特征;
利用第一激活函数计算所述全连接特征属于第一预设类别的第一类别概率;
根据所述第一类别概率对所述编码特征进行分类处理,得到带有目标物的目标编码特征。
详细地,所述第一预设类别包括多个预设类别,根据所述第一类别概率对所述全连接特征进行分类处理,得到训练图像集中各训练图像的编码特征的分类结果,即确定所述类别概率值最大的预设类别为训练图像的编码特征的分类结果。
例如,第一预设类别中包括类别A、类别B与类别C,训练图像1的全连接特征属于第一预设类别中类别A的概率为50%,全连接特征属于第一预设类别中类别B的概率为80%,则确定训练图像1的编码特征的分类结果为类别B。
详细地,所述第一激活函数包括但不限于softmax激活函数,利用第一激活函数可计算得到全连接特征为第一预设类别的第一类别概率。
本发明实施例通过分类筛选子模型对所述编码特征进行分类筛选,进而剔除不包含目标物的编码特征,保留包含目标物的编码特征,以避免后续对不包含目标物的编码特征进行图像检测,有利于提高图像检测的效率。
所述目标物检测模块104,用于利用所述检测子模型对所述目标编码特征进行目标物检测,得到检测结果,其中,所述检测结果包括目标物的预测中心点信息、预测尺寸信息及预测边界信息。
本发明实施例中,所述检测结果包括目标物的预测中心点信息、预测尺寸信息及预测边界信息,其中,所述预测中心点信息用于表示目标物中心点位置;所述预测尺寸信息用于表示目标物的尺寸大小;所述预测边界信息用于表示目标物的边界信息。
详细地,所述目标物检测模块104具体用于:
利用所述检测子模型对所述目标编码特征进行第一阈值倍数的上采样,得到中间特征图;
对所述中间特征图进行第二预设倍数的上采样,得到复原图像;
利用第二激活函数计算所述复原图像中各像素点属于第二预设类别的第二类别概率;
根据所述第二类别概率对所述复原图像进行目标物检测,得到检测结果。
详细地,所述目标物检测包括对复原图像中像素点的分类进行检测,所述第二预设类别中包括多个预设类别,所述根据所述第二类别概率对所述复原图像进行目标物检测,得到检测结果,即确定所述第二类别概率值最大的预设类别为复原图像的检测结果。
例如,第二预设类别中包括类别D、类别E与类别F,复原图像中目标像素点为第二预设类别中类别D的概率为20%,复原图像中目标像素点为第二预设类别中类别E的概率为70%,复原图像中目标像素点为第二预设类别中类别F的概率为40%,则确定复原图像中目标像素点为类别E,当所述复原图像中所有像素点均完成上述操作,得到复原图像的检测结果。
本发明实施例中将目标编码特征进行第一阈值倍数的上采样,得到中间特征图,再将中间特征图进行第二阈值倍数的上采样,得到复原图像,避免直接将目标编码特征上采样至复原图像时上采样倍数过大导致复原图像中图像特征的丢失,提高了复原图像中特征信息的完整性。
所述损失函数构建模块105,用于根据所述检测结果与所述标准检测结果构建目标损失函数。
本发明实施例中,所述损失函数构建模块105具体用于:
根据所述预测中心点信息和所述标准中心点信息构建中心点损失函数;
根据所述预测尺寸信息和所述标准尺寸信息构建尺寸损失函数;
根据所述预测边界信息和所述标准边界信息构建边界损失函数;
将所述中心点损失函数、所述尺寸损失函数和所述边界损失函数聚合为目标损失函数。
详细地,所述将所述中心点损失函数、所述尺寸损失函数和所述边界损失函数聚合为目标损失函数,包括:
获取预设的函数系数;
利用所述函数系数、所述中心点损失函数、所述尺寸损失函数和所述边界损失函数进行算数运算,得到目标损失函数。
具体地,所述预设的函数系数可由用户自行定义。
本发明实施例中,所述目标损失函数为:
Figure 955000DEST_PATH_IMAGE001
Figure 916003DEST_PATH_IMAGE027
Figure 157628DEST_PATH_IMAGE003
Figure 229489DEST_PATH_IMAGE028
其中,
Figure 453054DEST_PATH_IMAGE005
为中心点损失函数,
Figure 53799DEST_PATH_IMAGE006
为尺寸损失函数,
Figure 313879DEST_PATH_IMAGE007
为边界损失函数,C为目标物的类别的数量,
Figure 205743DEST_PATH_IMAGE008
为所述训练图像的长度,
Figure 31617DEST_PATH_IMAGE009
为所述训练图像的宽度,
Figure 52531DEST_PATH_IMAGE010
为所述训练图像的数量,
Figure 799907DEST_PATH_IMAGE011
Figure 744730DEST_PATH_IMAGE012
为预设常数,
Figure 379104DEST_PATH_IMAGE029
为预测中心点信息,
Figure 649549DEST_PATH_IMAGE030
为标准中心点信息,
Figure 353062DEST_PATH_IMAGE015
为预测尺寸信息,
Figure 347914DEST_PATH_IMAGE016
为标准尺寸信息,
Figure 351642DEST_PATH_IMAGE031
为预测边界信息,
Figure 465091DEST_PATH_IMAGE018
为标准边界信息,
Figure 672213DEST_PATH_IMAGE019
Figure 224417DEST_PATH_IMAGE021
Figure 82651DEST_PATH_IMAGE022
为预设的函数系数。
详细地,在计算中心点损失函数的函数值时,若所述预测中心点信息与所述标准中心点信息一致(即,
Figure 881849DEST_PATH_IMAGE032
),则
Figure 825534DEST_PATH_IMAGE005
为:
Figure 119112DEST_PATH_IMAGE024
若所述预测中心点信息与所述标准中心点信息不一致(即
Figure 379323DEST_PATH_IMAGE025
,则
Figure 100155DEST_PATH_IMAGE005
为:
Figure 327874DEST_PATH_IMAGE033
本发明实施例利用中心点损失函数、尺寸损失函数及边界损失函数组合为目标损失函数,同时利用目标物的中心点位置,尺寸大小及边界位置的三种损失值,利用三种损失值对目标物检测模型的参数进行更新,有利于提高目标物检测模型的精度。
所述模型优化模块106,用于计算所述目标损失函数的损失值,根据所述损失值对所述目标物检测模型进行优化,得到标准目标物检测模型。
本发明实施例中,所述模型优化模块106具体用于:
当所述目标损失函数的损失值大于预设的损失阈值,则利用优化算法对所述目标物检测模型的参数进行优化;
当所述目标损失函数的损失值小于或等于所述损失阈值,得到标准目标物检测模型。
本发明实施例中,当所述目标损失函数的损失值大于预设的损失阈值,使用Adam优化算法对目标物检测模型的参数进行优化,Adam优化算法可自适应调节目标物检测模型训练过程中的学习率,使得目标物检测模型更加精确,提升目标物检测模型的性能。
所述图像检测模块107,用于获取待检测目标物图像,利用所述标准目标物检测模型对所述待检测目标物图像进行图像检测,得到检测结果。
本发明实施例中,所述待检测目标物图像包括生物体组织的医学图像,例如,眼底彩照的彩色图像。
本发明实施例可利用具有数据抓取功能的python语句从用于存储所述待检测目标图像的区块链中抓取所述待检测目标物图像,当获取到待检测目标物图像后,将所述待检测目标物图像输入至标准目标物检测模型进行目标物检测,得到检测结果。
本发明实施例通过利用共享编码子模型对训练图像集进行编码,得到所述训练图像集的编码特征,可减少训练图像中的信息量,突出训练图像的图像特征,有利于提高后续进行目标物检测的精确度;利用分类筛选子模型对编码特征进行分类筛选,可剔除不包含目标物的编码特征,以避免后续对不包含目标物的编码特征进行图像检测,有利于提高图像检测的效率;利用检测子模型对目标编码特征进行目标物检测,得到预测中心点信息、预测尺寸信息及预测边界信息,并根据三种信息构建损失函数,利用损失函数对目标物检测模型进行优化,有利于提高目标物检测模型的精度。因此本发明提出的图像中目标物检测装置,可以解决对图像进行目标物检测时精确率较低的问题。
如图3所示,是本发明一实施例提供的实现图像中目标物检测方法的电子设备的结构示意图。
所述电子设备1可以包括处理器10、存储器11和总线,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如图像中目标物检测程序12。
其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card, SMC)、安全数字(SecureDigital, SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器11还可以既包括电子设备1的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如图像中目标物检测程序12的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(Control Unit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如图像中目标物检测程序等),以及调用存储在所述存储器11内的数据,以执行电子设备1的各种功能和处理数据。
所述总线可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
图3仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图3示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
例如,尽管未示出,所述电子设备1还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
进一步地,所述电子设备1还可以包括网络接口,可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备1与其他电子设备之间建立通信连接。
可选地,该电子设备1还可以包括用户接口,用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
所述电子设备1中的所述存储器11存储的图像中目标物检测程序12是多个指令的组合,在所述处理器10中运行时,可以实现:
获取目标物检测模型,其中,所述目标物检测模型中包含分类筛选子模型、共享编码子模型和检测子模型;
获取训练图像集,利用所述共享编码子模型对所述训练图像集进行编码,得到所述训练图像集的编码特征,其中,所述训练图像集包含训练图像及所述训练图像的标准检测结果;
利用所述分类筛选子模型对所述编码特征进行分类筛选,得到带有目标物的目标编码特征;
利用所述检测子模型对所述目标编码特征进行目标物检测,得到检测结果,其中,所述检测结果包括目标物的预测中心点信息、预测尺寸信息及预测边界信息;
根据所述检测结果与所述标准检测结果构建目标损失函数;
计算所述目标损失函数的损失值,根据所述损失值对所述目标物检测模型进行优化,得到标准目标物检测模型;
获取待检测目标物图像,利用所述标准目标物检测模型对所述待检测目标物图像进行图像检测,得到检测结果。
具体地,所述处理器10对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。所述计算机可读存储介质可以是易失性的,也可以是非易失性的。例如,所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
本发明还提供一种计算机可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被电子设备的处理器所执行时,可以实现:
获取目标物检测模型,其中,所述目标物检测模型中包含分类筛选子模型、共享编码子模型和检测子模型;
获取训练图像集,利用所述共享编码子模型对所述训练图像集进行编码,得到所述训练图像集的编码特征,其中,所述训练图像集包含训练图像及所述训练图像的标准检测结果;
利用所述分类筛选子模型对所述编码特征进行分类筛选,得到带有目标物的目标编码特征;
利用所述检测子模型对所述目标编码特征进行目标物检测,得到检测结果,其中,所述检测结果包括目标物的预测中心点信息、预测尺寸信息及预测边界信息;
根据所述检测结果与所述标准检测结果构建目标损失函数;
计算所述目标损失函数的损失值,根据所述损失值对所述目标物检测模型进行优化,得到标准目标物检测模型;
获取待检测目标物图像,利用所述标准目标物检测模型对所述待检测目标物图像进行图像检测,得到检测结果。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (10)

1.一种图像中目标物检测方法,其特征在于,所述方法包括:
获取目标物检测模型,其中,所述目标物检测模型中包含分类筛选子模型、共享编码子模型和检测子模型;
获取训练图像集,利用所述共享编码子模型对所述训练图像集进行编码,得到所述训练图像集的编码特征,其中,所述训练图像集包含训练图像及所述训练图像的标准检测结果;
利用所述分类筛选子模型对所述编码特征进行分类筛选,得到带有目标物的目标编码特征;
利用所述检测子模型对所述目标编码特征进行目标物检测,得到检测结果,其中,所述检测结果包括目标物的预测中心点信息、预测尺寸信息及预测边界信息;
根据所述检测结果与所述标准检测结果构建目标损失函数;
计算所述目标损失函数的损失值,根据所述损失值对所述目标物检测模型进行优化,得到标准目标物检测模型;
获取待检测目标物图像,利用所述标准目标物检测模型对所述待检测目标物图像进行图像检测,得到检测结果。
2.如权利要求1所述的图像中目标物检测方法,其特征在于,所述利用所述共享编码子模型对所述训练图像集进行编码,得到所述训练图像集的编码特征,包括:
利用前向并行卷积通道对所述训练图像集进行卷积得到的前向特征图;
利用后向并行卷积通道对所述前向特征图及所述前向特征图的下采样图像进行卷积,获得后向特征图;
对所述后向特征图进行池化处理,得到所述训练图像集的编码特征。
3.如权利要求1所述的图像中目标物检测方法,其特征在于,所述利用所述分类筛选子模型对所述编码特征进行分类筛选,得到带有目标物的目标编码特征,包括:
利用所述分类筛选子模型对所述编码特征进行全连接处理,得到全连接特征;
利用第一激活函数计算所述全连接特征属于第一预设类别的第一类别概率;
根据所述第一类别概率对所述编码特征进行分类处理,得到带有目标物的目标编码特征。
4.如权利要求1所述的图像中目标物检测方法,其特征在于,所述利用所述检测子模型对所述目标编码特征进行目标物检测,得到检测结果,包括:
利用所述检测子模型对所述目标编码特征进行第一阈值倍数的上采样,得到中间特征图;
对所述中间特征图进行第二预设倍数的上采样,得到复原图像;
利用第二激活函数计算所述复原图像中各像素点属于第二预设类别的第二类别概率;
根据所述第二类别概率对所述复原图像进行目标物检测,得到检测结果。
5.如权利要求1至4中任一项所述的图像中目标物检测方法,其特征在于,所述标准检测结果包括标准中心点信息、标准尺寸信息及标准边界信息,所述根据所述检测结果与所述标准检测结果构建目标损失函数,包括:
根据所述预测中心点信息和所述标准中心点信息构建中心点损失函数;
根据所述预测尺寸信息和所述标准尺寸信息构建尺寸损失函数;
根据所述预测边界信息和所述标准边界信息构建边界损失函数;
将所述中心点损失函数、所述尺寸损失函数和所述边界损失函数聚合为目标损失函数。
6.如权利要求5所述的图像中目标物检测方法,其特征在于,所述将所述中心点损失函数、所述尺寸损失函数和所述边界损失函数聚合为目标损失函数,包括:
获取预设的函数系数;
利用所述函数系数、所述中心点损失函数、所述尺寸损失函数和所述边界损失函数进行算数运算,得到目标损失函数。
7.如权利要求1所述的图像中目标物检测方法,其特征在于,所述根据所述损失值对所述目标物检测模型进行优化,包括:
当所述目标损失函数的损失值大于预设的损失阈值,则利用优化算法对所述目标物检测模型的参数进行优化;
当所述目标损失函数的损失值小于或等于所述损失阈值,得到标准目标物检测模型。
8.一种图像中目标物检测装置,其特征在于,所述装置包括:
模型获取模块,用于获取目标物检测模型,其中,所述目标物检测模型中包含分类筛选子模型、共享编码子模型和检测子模型;
图像编码模块,用于获取训练图像集,利用所述共享编码子模型对所述训练图像集进行编码,得到所述训练图像集的编码特征,其中,所述训练图像集包含训练图像及所述训练图像的标准检测结果;
分类筛选模块,用于利用所述分类筛选子模型对所述编码特征进行分类筛选,得到带有目标物的目标编码特征;
目标物检测模块,用于利用所述检测子模型对所述目标编码特征进行目标物检测,得到检测结果,其中,所述检测结果包括目标物的预测中心点信息、预测尺寸信息及预测边界信息;
损失函数构建模块,用于根据所述检测结果与所述标准检测结果构建目标损失函数;
模型优化模块,用于计算所述目标损失函数的损失值,根据所述损失值对所述目标物检测模型进行优化,得到标准目标物检测模型;
图像检测模块,用于获取待检测目标物图像,利用所述标准目标物检测模型对所述待检测目标物图像进行图像检测,得到检测结果。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任意一项所述的图像中目标物检测方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述的图像中目标物检测方法。
CN202011433976.XA 2020-12-10 2020-12-10 图像中目标物检测方法、装置、电子设备及可读存储介质 Pending CN112465060A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202011433976.XA CN112465060A (zh) 2020-12-10 2020-12-10 图像中目标物检测方法、装置、电子设备及可读存储介质
PCT/CN2021/083182 WO2022121156A1 (zh) 2020-12-10 2021-03-26 图像中目标物检测方法、装置、电子设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011433976.XA CN112465060A (zh) 2020-12-10 2020-12-10 图像中目标物检测方法、装置、电子设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN112465060A true CN112465060A (zh) 2021-03-09

Family

ID=74801086

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011433976.XA Pending CN112465060A (zh) 2020-12-10 2020-12-10 图像中目标物检测方法、装置、电子设备及可读存储介质

Country Status (2)

Country Link
CN (1) CN112465060A (zh)
WO (1) WO2022121156A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113222890A (zh) * 2021-03-30 2021-08-06 平安科技(深圳)有限公司 小目标物检测方法、装置、电子设备及存储介质
CN113723480A (zh) * 2021-08-18 2021-11-30 北京达佳互联信息技术有限公司 一种图像处理方法、装置、电子设备和存储介质
CN114066835A (zh) * 2021-11-08 2022-02-18 鲁班嫡系机器人(深圳)有限公司 图像检测、自动光学检测方法、装置、存储介质及设备
WO2022121156A1 (zh) * 2020-12-10 2022-06-16 平安科技(深圳)有限公司 图像中目标物检测方法、装置、电子设备及可读存储介质
WO2022198786A1 (zh) * 2021-03-25 2022-09-29 平安科技(深圳)有限公司 目标物检测方法、装置、电子设备及存储介质

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115082405B (zh) * 2022-06-22 2024-05-14 强联智创(北京)科技有限公司 颅内病灶的检测模型的训练方法、检测方法、装置及设备
CN115063410B (zh) * 2022-08-04 2023-01-10 中建电子商务有限责任公司 一种基于无锚点目标检测的钢管计数方法
CN115170571B (zh) * 2022-09-07 2023-02-07 赛维森(广州)医疗科技服务有限公司 胸腹水细胞病理图像识别方法、图像识别装置、介质
CN115690853B (zh) * 2022-12-30 2023-04-28 广州蚁窝智能科技有限公司 手势识别方法及电动卫生罩启闭控制系统
CN117612139A (zh) * 2023-12-19 2024-02-27 昆明盛嗳谐好科技有限公司 基于深度学习的场景目标检测方法、系统和电子设备
CN117994594A (zh) * 2024-04-03 2024-05-07 武汉纺织大学 一种基于深度学习的电力作业风险识别方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111932482A (zh) * 2020-09-25 2020-11-13 平安科技(深圳)有限公司 图像中目标物的检测方法、装置、电子设备及存储介质
CN111932547A (zh) * 2020-09-24 2020-11-13 平安科技(深圳)有限公司 图像中目标物的分割方法、装置、电子设备及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10304193B1 (en) * 2018-08-17 2019-05-28 12 Sigma Technologies Image segmentation and object detection using fully convolutional neural network
CN110349147B (zh) * 2019-07-11 2024-02-02 腾讯医疗健康(深圳)有限公司 模型的训练方法、眼底黄斑区病变识别方法、装置及设备
CN112465060A (zh) * 2020-12-10 2021-03-09 平安科技(深圳)有限公司 图像中目标物检测方法、装置、电子设备及可读存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111932547A (zh) * 2020-09-24 2020-11-13 平安科技(深圳)有限公司 图像中目标物的分割方法、装置、电子设备及存储介质
CN111932482A (zh) * 2020-09-25 2020-11-13 平安科技(深圳)有限公司 图像中目标物的检测方法、装置、电子设备及存储介质

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022121156A1 (zh) * 2020-12-10 2022-06-16 平安科技(深圳)有限公司 图像中目标物检测方法、装置、电子设备及可读存储介质
WO2022198786A1 (zh) * 2021-03-25 2022-09-29 平安科技(深圳)有限公司 目标物检测方法、装置、电子设备及存储介质
CN113222890A (zh) * 2021-03-30 2021-08-06 平安科技(深圳)有限公司 小目标物检测方法、装置、电子设备及存储介质
CN113222890B (zh) * 2021-03-30 2023-09-15 平安科技(深圳)有限公司 小目标物检测方法、装置、电子设备及存储介质
CN113723480A (zh) * 2021-08-18 2021-11-30 北京达佳互联信息技术有限公司 一种图像处理方法、装置、电子设备和存储介质
CN113723480B (zh) * 2021-08-18 2024-03-05 北京达佳互联信息技术有限公司 一种图像处理方法、装置、电子设备和存储介质
CN114066835A (zh) * 2021-11-08 2022-02-18 鲁班嫡系机器人(深圳)有限公司 图像检测、自动光学检测方法、装置、存储介质及设备

Also Published As

Publication number Publication date
WO2022121156A1 (zh) 2022-06-16

Similar Documents

Publication Publication Date Title
CN112465060A (zh) 图像中目标物检测方法、装置、电子设备及可读存储介质
CN111932482B (zh) 图像中目标物的检测方法、装置、电子设备及存储介质
CN111932547B (zh) 图像中目标物的分割方法、装置、电子设备及存储介质
CN113283446B (zh) 图像中目标物识别方法、装置、电子设备及存储介质
CN111652845A (zh) 异常细胞自动标注方法、装置、电子设备及存储介质
CN111862096B (zh) 图像分割方法、装置、电子设备及存储介质
CN112184714B (zh) 图像分割方法、装置、电子设备及介质
CN112137591B (zh) 基于视频流的目标物位置检测方法、装置、设备及介质
CN111915609A (zh) 病灶检测分析方法、装置、电子设备及计算机存储介质
CN113065609B (zh) 图像分类方法、装置、电子设备及可读存储介质
CN111696084A (zh) 细胞图像分割方法、装置、电子设备及可读存储介质
CN112308853A (zh) 电子设备、医学图像指标生成方法、装置及存储介质
CN113554008B (zh) 静态物体区域内检测方法、装置、电子设备及存储介质
CN111914939A (zh) 识别模糊图像的方法、装置、设备及计算机可读存储介质
CN111476760B (zh) 医学图像的生成方法、装置、电子设备及介质
CN111815731B (zh) 图像处理方法、装置及计算机可读存储介质
CN111932595A (zh) 图像配准方法、装置、电子设备及存储介质
CN111985449A (zh) 救援现场图像的识别方法、装置、设备及计算机介质
CN112101481B (zh) 目标物的影响因子筛选方法、装置、设备及存储介质
CN113705686B (zh) 图像分类方法、装置、电子设备及可读存储介质
CN116664949A (zh) 目标物缺陷检测方法、装置、设备及存储介质
CN112580505B (zh) 网点开关门状态识别方法、装置、电子设备及存储介质
CN112233194B (zh) 医学图片优化方法、装置、设备及计算机可读存储介质
CN114049676A (zh) 疲劳状态检测方法、装置、设备及存储介质
CN111915615A (zh) 图像分割方法、装置、电子设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40040612

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination