CN113610798A - 图像检测方法、装置、电子设备及存储介质 - Google Patents

图像检测方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113610798A
CN113610798A CN202110884713.9A CN202110884713A CN113610798A CN 113610798 A CN113610798 A CN 113610798A CN 202110884713 A CN202110884713 A CN 202110884713A CN 113610798 A CN113610798 A CN 113610798A
Authority
CN
China
Prior art keywords
image
target
mask
detected
prediction frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110884713.9A
Other languages
English (en)
Inventor
李东海
暴天鹏
吴立威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Sensetime Technology Co Ltd
Original Assignee
Shenzhen Sensetime Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Sensetime Technology Co Ltd filed Critical Shenzhen Sensetime Technology Co Ltd
Priority to CN202110884713.9A priority Critical patent/CN113610798A/zh
Publication of CN113610798A publication Critical patent/CN113610798A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • G06T7/0008Industrial image inspection checking presence/absence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/40Filling a planar surface by adding surface attributes, e.g. colour or texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30108Industrial image inspection
    • G06T2207/30164Workpiece; Machine component

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)

Abstract

本申请实施例提供一种图像检测方法、装置、电子设备及存储介质,其中,该图像检测方法包括:获取高铁接触网的待检测图像;基于预设的填充方式对待检测图像进行像素填充,得到至少一张第一掩码图;对至少一张第一掩码图进行检测,确定高铁接触网是否存在目标部件缺失。本申请实施例有利于降低接触网螺母、螺栓和开口销缺失检测的难度。

Description

图像检测方法、装置、电子设备及存储介质
技术领域
本申请涉及图像检测技术领域,具体涉及一种图像检测方法、装置、电子设备及存储介质。
背景技术
接触网是铁路电气化工程中的重要组成部分,对接触网进行定期巡检是乘客安全出行的有力保障。在工业领域中,尤其是是高铁领域,接触网螺母、螺栓、开口销缺失检测技术已经有了较为广泛的应用,其总体思路是通过缺失检测模型,进行螺母、螺栓、开口销的粗定位,利用螺母、螺栓、开口销的纹理特征进行缺失检测。但是,相比正常的螺母、螺栓、开口销数据,螺母、螺栓、开口销缺失的数据数量十分少,这使得缺失检测的建模难度相对较大;另一方面,螺母、螺栓、开口销存在的场景不同,其呈现的特征也不相同,加大了缺失检测中的特征提取难度。可见,目前的接触网螺母、螺栓、开口销缺失检测较为复杂,存在检测难度大的问题。
发明内容
本申请实施例提供一种图像检测方法、装置、电子设备及存储介质,有利于降低接触网螺母、螺栓和开口销缺失检测的难度。
本申请实施例的第一方面提供一种图像检测方法,该方法包括:
获取高铁接触网的待检测图像;
基于预设的填充方式对待检测图像进行像素填充,得到至少一张第一掩码图;
对至少一张第一掩码图进行检测,确定高铁接触网是否存在目标部件缺失。
可以看出,本申请实施例通过获取高铁接触网的待检测图像;基于预设的填充方式对待检测图像进行像素填充,得到至少一张第一掩码图;对至少一张第一掩码图进行检测,以确定高铁接触网是否存在目标部件缺失。这样通过像素填充的方式,有利于降低缺失检测中对螺母、螺栓和开口销等目标部件的纹理特征的依赖,以通过上下文信息进行缺失检测,从而有利于降低接触网螺母、螺栓和开口销缺失检测的难度。
结合第一方面,在一个可能的实现方式中,对至少一张第一掩码图进行检测,确定高铁接触网是否存在目标部件缺失,包括:
对至少一张第一掩码图进行目标检测,得到至少一张第一掩码图中每张第一掩码图对应的参考预测框;
对参考预测框进行融合,得到第一目标预测框;
根据第一目标预测框,确定高铁接触网是否存在目标部件缺失。
本示例中,由于第一目标预测框是对参考预测框进行融合得到的预测框,说明第一目标预测框所框定的区域最有可能存在螺母、螺栓、开口销等目标部件,利用该区域进行缺失检测,有利于提高缺失检测的准确度。
结合第一方面,在一个可能的实现方式中,每张第一掩码图中包括进行像素填充得到的像素填充区域,对至少一张第一掩码图进行目标检测,得到至少一张第一掩码图中每张第一掩码图对应的参考预测框,包括:
对每张第一掩码图进行目标检测,得到每张第一掩码图对应的第一预测框;
将每张第一掩码图中落在像素填充区域的第一预测框,确定为参考预测框。
本示例中,将每张第一掩码图中整个落在像素填充区域的第一预测框作为参考预测框,有利于避免后续预测时用到非像素填充区域的物体纹理信息,从而降低对物体纹理信息的依赖。
结合第一方面,在一个可能的实现方式中,根据第一目标预测框,确定高铁接触网是否存在目标部件缺失,包括:
确定第一目标预测框在待检测图像中的位置信息;
根据位置信息从待检测图像中截取出待分类区域图像;
对待分类区域图像进行检测,确定高铁接触网是否存在目标部件缺失。
本示例中,采用目标检测先得到一个初始的检测结果,比如认为第一目标预测框所框定的区域应该存在目标部件,然后根据第一目标预测框从待检测图像中截取出待分类区域图像,利用待分类区域图像中的纹理信息对待分类区域图像中是否存在目标部件做分类,以进一步确定高铁接触网是否存在目标部件缺失,这样的双重检测方式,能够使最终输出的缺失检测结果更为准确。
结合第一方面,在一个可能的实现方式中,获取高铁接触网的待检测图像,包括:
对高铁接触网的原始图像进行目标检测,得到第一目标检测结果;
若第一目标检测结果中包括至少一个第二预测框,则从至少一个第二预测框中确定出第二目标预测框,根据第二目标预测框和预设的网格,得到待检测图像;
若第一目标检测结果中不包括第二预测框,则根据预设的矩形框和网格,得到待检测图像。
本示例中,第一目标检测结果是指对原始图像进行目标检测后未经过后续处理(比如非极大值抑制)的检测结果,第一目标检测结果中包括至少一个第二预测框,说明原始图像中检测出了螺母、螺栓、开口销等目标部件,则将宽度或高度最大的一个第二预测框确定为第二目标预测框,根据该第二目标预测框和网格对原始图像进行调整,得到待检测图像;第一目标检测结果中不包括第二预测框,说明原始图像中未检测出螺母、螺栓、开口销等目标部件,则根据预设的矩形框和网格对原始图像进行调整,得到待检测图像。这样无论原始图像中是否检测出螺母、螺栓、开口销等目标部件,均会对原始图像进行调整,以保证神经网络模型各层对待检测图像的感受范围尽可能保持一致。
结合第一方面,在一个可能的实现方式中,根据第二目标预测框和预设的网格,得到待检测图像,包括:
根据网格的尺寸和第二目标预测框的宽度或高度,计算得到第一缩放系数;
按照第一缩放系数对原始图像进行缩放,得到待检测图像。
本示例中,在原始图像中检测出螺母、螺栓、开口销等目标部件的情况下,基于网格的尺寸和第二目标预测框的宽度或高度得到第一缩放系数,再按照第一缩放系数对原始图像进行缩放,从而有利于保证神经网络模型各层对待检测图像的感受范围保持一致。
结合第一方面,在一个可能的实现方式中,根据预设的矩形框和网格,得到待检测图像,包括:
根据网格的尺寸和矩形框的宽度或高度,计算得到第二缩放系数;
按照第二缩放系数对原始图像进行缩放,得到待检测图像。
本示例中,在原始图像中未检测出螺母、螺栓、开口销等目标部件的情况下,根据网格的尺寸和矩形框的宽度或高度得到第二缩放系数,再按照第二缩放系数对原始图像进行缩放,从而有利于保证神经网络模型各层对待检测图像的感受范围保持一致。
结合第一方面,在一个可能的实现方式中,对每张第一掩码图进行目标检测,得到每张第一掩码图对应的第一预测框,包括:
执行至少一次卷积、门控卷积和权重系数相乘的操作,将得到的融合特征图作为目标特征图;
基于目标特征图对每张第一掩码图进行分类预测,得到第一预测框;
其中,至少一次卷积、门控卷积和权重系数相乘的操作,包括:
对每张第一掩码图或者上次操作得到的特征图进行卷积,得到第一特征图;
对每张第一掩码图或者上次操作得到的特征图进行门控卷积,得到第二特征图,第二特征图与第一特征图的尺寸相同,第二特征图中每个位置的值用于表示第一特征图中对应位置的权重系数;
将第一特征图中每个位置的值与第二特征图中对应的权重系数相乘,得到融合特征图。
本示例中,采用两阶段的神经网络模型对每张第一掩码图进行目标检测,并在第一阶段的检测中加入门控卷积,基于门控卷积提取出的权重系数,能够使神经网络模型针对第一掩码图的每个通道和每个空间位置,学习一种动态特征选择机制,即更加关注第一掩码图中未进行像素填充的区域,这些区域通常存在关键的上下文信息,即第一阶段得到的目标特征图是更具上下文信息的特征图,从而使得在第二阶段可利用更具上下文信息的目标特征图进行分类预测,进而降低对物体纹理特征的依赖。
结合第一方面,在一个可能的实现方式中,基于预设的填充方式对所述待检测图像进行像素填充,得到至少一张第一掩码图,包括:
根据预设的填充方式构建至少一个矩阵,至少一个矩阵中每个矩阵的大小与待检测图像的尺寸相同,每个矩阵中包括值为0的元素;
将每个矩阵与待检测图像的像素进行点乘,以将待检测图像中与值为0的元素对应的像素填充为黑色像素,得到至少一张第一掩码图,所述像素填充区域为所述每张第一掩码图中被填充为黑色像素的区域。
本示例中,基于预设的填充方式构建矩阵,将矩阵与待检测图像进行点乘,以对待检测图像进行像素填充,从而保证待检测图像中的螺母、螺栓、开口销等目标部件能够被黑色像素覆盖,以去除物体的纹理特征,进而便于在后续目标检测时基于上下文信息进行分类预测。
结合第一方面,在一个可能的实现方式中,对至少一张第一掩码图进行目标检测是通过神经网络模型执行的,神经网络模型通过以下步骤训练得到:
获取样本图像和样本图像中目标部件的标注数据;
将样本图像输入神经网络进行目标检测,得到至少一个第三预测框,并从至少一个第三预测框中确定出第三目标预测框;
根据第三目标预测框和网格对样本图像进行缩放,得到缩放后的样本图像;
对缩放后的样本图像进行像素填充,得到至少一张第二掩码图;
采用至少一张第二掩码图、标注数据及损失函数对神经网络进行训练,得到神经网络模型。
本示例中,对于包括螺母、螺栓、开口销等目标部件的样本图像,采用像素填充的方式将上述目标部件覆盖,以构造一批目标部件缺失的训练数据,即第二掩码图,从而解决高铁接触网中螺母、螺栓、开口销缺失的图像数据较少的问题。另外,采用目标部件被覆盖的第二掩码图训练神经网络,有利于使神经网络模型更关注于图像中的上下文信息,从而降低对螺母、螺栓、开口销等目标部件的纹理特征的依赖。
本申请实施例的第二方面提供一种图像检测装置,该装置包括获取单元和处理单元;
获取单元,用于获取高铁接触网的待检测图像;
处理单元,用于基于预设的填充方式对所述待检测图像进行像素填充,得到至少一张第一掩码图;
处理单元,还用于对所述至少一张第一掩码图进行检测,确定所述高铁接触网是否存在目标部件缺失。
本申请实施例的第三方面提供一种电子设备,包括处理器、输入设备、输出设备和存储器,处理器、输入设备、输出设备和存储器相互连接,其中,存储器用于存储计算机程序,计算机程序包括程序指令,处理器被配置用于调用程序指令,执行如本申请实施例第一方面中所描述的部分或全部步骤。
本申请实施例的第四方面提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储有用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。
本申请实施例的第五方面提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
本申请的这些方面或其他方面在以下实施例的描述中会更加简明易懂。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种应用环境的示意图;
图2为本申请实施例提供的一种图像检测方法的流程示意图;
图3为本申请实施例提供的一种像素填充方式与对应第一掩码图的示意图;
图4为本申请实施例提供的一种像素填充方式与对应矩阵的示意图;
图5为本申请实施例提供的一种原理说明的示意图;
图6为本申请实施例提供的一种特征提取的示意图;
图7为本申请实施例提供的另一种图像检测方法的流程示意图;
图8为本申请实施例提供的一种电子设备的结构示意图;
图9为本申请实施例提供的一种图像检测装置的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本申请所描述的实施例可以与其它实施例相结合。
为了更好的理解本申请实施例提供的图像检测方法,下面首先对该图像检测方法的应用环境进行简要介绍。
请参阅图1,图1为本申请实施例提供的一种应用环境的示意图,如图1所示,包括终端设备110、电子设备120、高铁接触网130和巡检车140,其中,终端设备110和电子设备120通过网络进行连接。终端设备110用于提供对高铁接触网进行拍摄得到的原始图像,比如终端设备110可以是支柱、巡检车140上的图像采集设备。电子设备120用于根据原始图像和预设的网格得到待检测图像,然后采用预设的N种填充方式对待检测图像进行像素填充以覆盖掉待检测图像中可能存在的螺母、螺栓、开口销等目标部件,得到N张掩码图,再对N张掩码图进行两阶段的目标检测,以利用掩码图中未进行像素填充区域的上下文信息预测像素填充区域是否存在螺母、螺栓、开口销等目标部件,若存在,则电子设备120基于像素填充区域的预测框在待检测图像中的位置信息,从待检测图像中截取出区域图像,最后对该区域图像进行分类预测,以确定高铁接触网是否存在目标部件缺失。其中,N为大于或等于1的整数。
相较于现有方案,本申请实施例通过像素填充的方式覆盖掉螺母、螺栓和开口销等目标部件的纹理特征,主要利用上下文信息进行预测,有利于降低缺失检测中对螺母、螺栓和开口销等目标部件的纹理特征的依赖,从而有利于降低接触网螺母、螺栓和开口销缺失检测的难度(比如,目标部件完全缺失的情况下,图像上并不存在目标部件的纹理特征,利用纹理特征进行准确预测的难度较大)。
应理解,在一些实施方式中,终端设备110还可以是电脑、智能手机等设备,比如,终端设备110可以从数据库中获取高铁接触网的原始图像,并向电子设备120提供该原始图像。其中,电子设备120可以是独立的物理服务器,也可以是服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、以及大数据和人工智能平台等基础云计算服务的云服务器,或者还可以是能够独立进行运作的设备,比如嵌入式设备。
请参阅图2,图2为本申请实施例提供的一种图像检测方法的流程示意图。该图像检测方法应用于电子设备,如图2所示,该方法包括:
201、获取高铁接触网的待检测图像。
本申请具体实施例中,该待检测图像可通过对高铁接触网的原始图像进行缩放得到,高铁接触网的原始图像是由终端设备向电子设备发送的,终端设备可以是巡检车上的图像采集设备,比如在输电线路巡检中,图像采集设备可向电子设备发送拍摄到的原始图像;终端设备还可以是输电线路中安装在固定位置的图像采集设备,比如支柱上的摄像机,通过设置拍摄时间间隔,该摄像机可每隔一定时间向电子设备发送拍摄到的原始图像;终端设备还可以是用户设备,比如算法开发或模型训练中,用户通常需要通过用户设备向电子设备发送高铁接触网的原始图像集。应理解,本申请对高铁接触网的原始图像的获取方式不作限定。
示例性的,获取高铁接触网的待检测图像,包括:
A1:对原始图像进行目标检测,得到第一目标检测结果;
A2:若第一目标检测结果中包括至少一个第二预测框,则从至少一个第二预测框中确定出第二目标预测框,根据第二目标预测框和网格,得到待检测图像;
A3:若第一目标检测结果中不包括第二预测框,则根据预设的矩形框和网格,得到待检测图像。
本申请具体实施例中,第一目标检测结果是指对原始图像进行目标检测后未经过后续处理(比如非极大值抑制)的检测结果,应理解,若原始图像中存在螺母、螺栓、开口销等目标部件,则第一目标检测结果中会包括至少一个候选框,即第二预测框,若原始图像中不存在螺母、螺栓、开口销等目标部件,则第一目标检测结果中可能不会包括第二预测框,即未产生候选框。
示例性的,本申请可采用训练好的神经网络模型进行目标检测,比如FasterR-CNN框架,由于神经网络模型骨干网络的感受野(感受范围)是固定的,因此,需要保证神经网络各层对输入图像的感受野尽可能保持一致,换言之即是看到的网格数量尽可能一致,这就需要对高铁接触网的原始图像进行缩放、调整。
针对第一目标检测结果中包括至少一个第二预测框的情况,获取至少一个第二预测框中每个第二预测框的宽度和高度,将宽度最大或高度最大的第二预测框确定为第二目标预测框,再根据第二目标预测框和该网格得到待检测图像。需要说明的是,宽度最大是指宽度值大于其它所有的宽度值和高度值,高度最大是指高度值大于其它所有的宽度值和高度值。
示例性的,根据第二目标预测框和网格,得到待检测图像,包括:
B1:根据网格的尺寸和第二目标预测框的宽度或高度,计算得到第一缩放系数;
B2:按照第一缩放系数对原始图像进行缩放,得到待检测图像。
其中,假设网格的尺寸为2*2,则将第二目标预测框宽度或高度中的最大值缩小为网格尺寸的一半,比如第二目标预测框宽度或高度中的最大值为1.5,则利用网格的尺寸和该最大值1.5计算得到第一缩放系数1/1.5,按照第一缩放系数对原始图像进行缩放,即得到待检测图像。
该实施方式中,在原始图像中检测出螺母、螺栓、开口销等目标部件的情况下,基于网格的尺寸和第二目标预测框的宽度或高度得到第一缩放系数,再按照第一缩放系数对原始图像进行缩放,从而有利于保证神经网络模型各层对待检测图像的感受范围保持一致。
针对第一目标检测结果中不包括第二预测框的情况,根据预设的矩形框和该网格得到待检测图像。其中,该矩形框的尺寸可基于经验值设定,比如:一般情况下,将采集的众多图像中尺寸最大的目标部件的外接矩形框设定为该矩形框。
示例性的,根据预设的矩形框和网格,得到待检测图像,包括:
C1:根据网格的尺寸和矩形框的宽度或高度,计算得到第二缩放系数;
C2:按照第二缩放系数对原始图像进行缩放,得到待检测图像。
其中,假设网格的尺寸为2*2,则将预设的矩形框宽度或高度中的最大值缩小为网格尺寸的一半,比如该矩形框宽度或高度中的最大值为2,则利用网格的尺寸和该最大值2计算得到第二缩放系数1/2,按照第二缩放系数对原始图像进行缩放,即得到待检测图像。
该实施方式中,在原始图像中未检测出螺母、螺栓、开口销等目标部件的情况下,根据网格的尺寸和矩形框的宽度或高度得到第二缩放系数,再按照第二缩放系数对原始图像进行缩放,从而有利于保证神经网络模型各层对待检测图像的感受范围保持一致。
202、基于预设的填充方式对待检测图像进行像素填充,得到至少一张第一掩码图。
示例性的,基于预设的填充方式对待检测图像进行像素填充,得到至少一张第一掩码图,包括:
根据预设的填充方式构建至少一个矩阵,至少一个矩阵中每个矩阵的大小与待检测图像的尺寸相同,每个矩阵中包括值为0的元素;
将每个矩阵与待检测图像的像素进行点乘,以将待检测图像中与值为0的元素对应的像素填充为黑色像素,得到至少一张第一掩码图。其中,像素填充区域为所述每张第一掩码图中被填充为黑色像素的区域。
本申请具体实施例中,预设了8种像素填充方式,如图3左侧网格所示,其中,按照这8种填充方式分别对待检测图像进行像素填充,得到对应的8张第一掩码图,如图3右侧所示。具体而言,对于每种填充方式,根据该填充方式和待检测图像的尺寸构建矩阵,以图3中左上角的第一种填充方式为例,假设待检测图像的尺寸为10*10(像素),则按照第一种填充方式(图4中左侧所示)中黑色像素和白色像素的分布可构建如图4中右侧所示的矩阵,其中,矩阵中值为0的元素即表示黑色像素,值为1的元素即表示白色像素。由于矩阵的大小与待检测图像的尺寸相同,则将构建的矩阵与待检测图像进行点乘,即可得到图3中右侧所示的第一掩码图,每张第一掩码图中均包括被黑色像素覆盖的像素填充区域。
应理解,按照以上8种填充方式对待检测图像进行像素填充,能够保证待检测图像中的目标部件至少在某一张第一掩码图中被黑色像素覆盖到,以此达到去除待检测图像中目标部件的纹理特征的目的。其原理可参阅图5,假设图5中线段AB=BC=CD,其长度为s,若有一长度同为s的线段,其起点在线段AB区间内,则该线段一定能被图5中上侧的大括号覆盖,若其起点在线段BC区间内,则该线段一定能被图5中下侧的大括号覆盖。此为一维空间的证明,以此类推至二维空间,按照以上8种填充方式则可以保证待检测图像中的目标部件被其中一种填充方式完全覆盖。
该实施方式中,基于预设的填充方式构建矩阵,将矩阵与待检测图像进行点乘,以对待检测图像进行像素填充,从而保证待检测图像中的螺母、螺栓、开口销等目标部件能够被黑色像素覆盖,以去除物体的纹理特征,进而便于在后续目标检测时基于上下文信息进行分类预测。
203、对至少一张第一掩码图进行检测,确定高铁接触网是否存在目标部件缺失。
示例性的,对至少一张第一掩码图进行检测,确定高铁接触网是否存在目标部件缺失,包括:
D1:对至少一张第一掩码图进行目标检测,得到至少一张第一掩码图中每张第一掩码图对应的参考预测框;
D2:对参考预测框进行融合,得到第一目标预测框;
D3:根据第一目标预测框,确定高铁接触网是否存在目标部件缺失。
本申请具体实施例中,将每张第一掩码图输入神经网络模型进行目标检测,将每张第一掩码图中产生的候选框确定为每张第一掩码图对应的第一预测框,然后对第一预测框进行筛选,保留完全落在像素填充区域的第一预测框,将其确定为参考预测框。该实施方式中,当第一预测框不是完全落在像素填充区域时,该第一预测框对应对象的纹理信息未能通过像素填充区域有效遮挡,后续预测时可能会利用到目标物体的纹理信息,而将每张第一掩码图中整个落在像素填充区域的第一预测框作为参考预测框,有利于避免后续预测时用到非像素填充区域的物体纹理信息,从而降低对物体纹理信息的依赖。
在确定出参考预测框后,对参考预测框进行融合,示例性的,可以是对参考预测框进行非极大值抑制,将得分大于阈值的参考预测框作为第一目标预测框,由于第一目标预测框是对参考预测框进行非极大值抑制得到的预测框,说明第一目标预测框所框定的区域应该存在螺母、螺栓、开口销等目标部件,利用该区域进行缺失检测,有利于提高缺失检测的准确度。
对于确定出的第一目标预测框,由于第一掩码图与待检测图像的尺寸相同,则第一目标预测框在第一掩码图中的位置信息即可作为第一目标预测框在待检测图像中的位置信息,根据该位置信息可从待检测图像中截取出待分类区域图像,将待分类区域图像输入分类模型进行检测,以利用待分类区域图像中的纹理信息确定第一目标预测框所框定的区域到底有没有目标部件,以此确定高铁接触网是否存在目标部件缺失。比如,该待分类区域图像中未预测出螺母、螺栓、开口销等目标部件,则说明高铁接触网存在目标部件的缺失。
该实施方式中,采用目标检测先得到一个初始的检测结果,比如认为第一目标预测框所框定的区域应该存在目标部件,然后根据第一目标预测框从待检测图像中截取出待分类区域图像,利用待分类区域图像中的纹理信息对待分类区域图像中是否存在目标部件做分类,以进一步确定高铁接触网是否存在目标部件缺失,这样的双重检测方式,能够使最终输出的缺失检测结果更为准确。
示例性的,对每张第一掩码图进行目标检测,得到每张第一掩码图对应的第一预测框,包括:
执行至少一次卷积、门控卷积和权重系数相乘的操作,将得到的融合特征图作为目标特征图;
基于目标特征图对每张第一掩码图进行分类预测,得到第一预测框;
其中,至少一次卷积、门控卷积和权重系数相乘的操作,包括:
E1:对每张第一掩码图或者上次操作得到的特征图进行卷积,得到第一特征图;
E2:对每张第一掩码图或者上次操作得到的特征图进行门控卷积,得到第二特征图,第二特征图与第一特征图的尺寸相同,第二特征图中每个位置的值用于表示第一特征图中对应位置的权重系数;
E3:将第一特征图中每个位置的值与第二特征图中对应的权重系数相乘,得到融合特征图。
本申请具体实施例中,采用两阶段的神经网络模型对每张第一掩码图进行目标检测,在第一阶段的检测中,除了普通卷积操作还加入了门控卷积,请参阅图6,图6为本申请实施例提供的一种特征提取的示意图,如图6所示,对于输入的第一掩码图,对其进行普通卷积得到第一特征图,对其进行门控卷积得到第二特征图,由于第二特征图中每个位置的值用于表示第一特征图中对应位置的权重系数,则可将二者相乘,得到第三特征图(即上次操作得到的特征图),以关注具有上下文信息的未填充区域,对第三特征图再进行普通卷积得到第四特征图,对第三特征图再进行门控卷积得到第五特征图,由于第五特征图中每个位置的值用于表示第四特征图中对应位置的权重系数,则可将二者相乘,得到第六特征图。应理解,图6中给出了执行两次卷积、门控卷积和权重系数相乘的操作,则第六特征图即为融合特征图,可将第六特征图作为目标特征图,本申请实施例可通过至少一次卷积、门控卷积和权重系数相乘的操作得到融合特征图,比如执行一次的情况下,第三特征图即为融合特征图。
其中,目标特征图可作为第一阶段检测的输出,神经网络模型第二阶段可基于目标特征图进行分类预测,产生的候选框即第一预测框。示例性的,还可对目标特征图进行普通卷积,得到第一阶段检测的输出第七特征图,神经网络模型第二阶段还可基于第七特征图进行分类预测,产生的候选框即第一预测框。
该实施方式中,采用两阶段的神经网络模型对每张第一掩码图进行目标检测,并在第一阶段的检测中加入门控卷积,基于门控卷积提取出的权重系数,能够使神经网络模型针对第一掩码图的每个通道和每个空间位置,学习一种动态特征选择机制,即更加关注第一掩码图中未进行像素填充的区域,这些区域通常存在关键的上下文信息,即第一阶段得到的目标特征图是更具上下文信息的特征图,从而使得在第二阶段可利用更具上下文信息的目标特征图进行分类预测,进而降低对物体纹理特征的依赖。
可以看出,本申请实施例通过获取高铁接触网的待检测图像;基于预设的填充方式对待检测图像进行像素填充,得到至少一张第一掩码图;对至少一张第一掩码图进行检测,以确定待检测图像对应的高铁接触网是否存在目标部件缺失。这样通过像素填充的方式,有利于降低缺失检测中对螺母、螺栓和开口销等目标部件的纹理特征的依赖,以通过上下文信息进行缺失检测,从而有利于降低接触网螺母、螺栓和开口销缺失检测的难度。
请参阅图7,图7为本申请实施例提供的另一种图像检测方法的流程示意图。如图7所示,该方法包括:
701、获取高铁接触网的待检测图像;
702、基于预设的填充方式对待检测图像进行像素填充,得到至少一张第一掩码图;
703、对至少一张第一掩码图进行目标检测,得到至少一张第一掩码图中每张第一掩码图对应的参考预测框;
704:对参考预测框进行融合,得到第一目标预测框;
705:根据第一目标预测框,确定高铁接触网是否存在目标部件缺失。
其中,上述步骤701-705的具体实施方式在图2所示的实施例中已有相关说明,且能达到相同或相似的有益效果,此处不再赘述。
其中,步骤703中,对至少一张第一掩码图进行目标检测是通过神经网络模型执行的,该神经网络模型通过以下步骤训练得到:
F1:获取样本图像和样本图像中目标部件的标注数据;
F2:将样本图像输入神经网络进行目标检测,得到至少一个第三预测框,并从至少一个第三预测框中确定出第三目标预测框;
F3:根据第三目标预测框和网格对样本图像进行缩放,得到缩放后的样本图像;
F4:对缩放后的样本图像进行像素填充,得到至少一张第二掩码图;
F5:采用至少一张第二掩码图、标注数据及损失函数对神经网络进行训练,得到神经网络模型。
本申请具体实施例中,由于高铁接触网中螺母、螺栓、开口销缺失的图像数据比较欠缺,而深度学习中需要大量的训练数据来训练神经网络模型,因此,采用包括螺母、螺栓、开口销等目标部件的样本图像构造一批目标部件缺失的训练数据。
具体而言,可通过对样本图像中的目标部件进行拉框标注得到标注数据,然后将样本图像输入神经网络进行目标检测,产生的候选框即第三预测框,获取至少一个第三预测框中每个第三预测框的宽度和高度,将宽度最大或高度最大的第三预测框确定为第三目标预测框,根据预设的网格的尺寸和第三目标预测框的宽度和高度计算得到缩放系数,按照该缩放系数对样本图像进行缩放,得到缩放后的样本图像。按照图3中所示的填充方式对缩放后的样本图像进行像素填充得到至少一张第二掩码图,将第二掩码图输入神经网络进行推理,并利用标注数据、损失函数和推理结果对神经网络的参数进行更新,经过多次迭代得到训练好的神经网络模型。
该实施方式中,对于包括螺母、螺栓、开口销等目标部件的样本图像,采用像素填充的方式将上述目标部件覆盖,以构造一批目标部件缺失的训练数据,即第二掩码图,从而解决高铁接触网中螺母、螺栓、开口销缺失的图像数据较少的问题。另外,采用目标部件被覆盖的第二掩码图训练神经网络,有利于使神经网络模型更关注于图像中的上下文信息,从而降低对螺母、螺栓、开口销等目标部件的纹理特征的依赖。
与上述实施例一致的,请参阅图8,图8为本申请实施例提供的一种电子设备的结构示意图,如图8所示,包括处理器、输入设备、输出设备和存储器,处理器、输入设备、输出设备和存储器相互连接,其中,存储器用于存储计算机程序,计算机程序包括程序指令,处理器被配置用于调用程序指令,上述程序包括用于执行以下步骤的指令;
获取高铁接触网的待检测图像;
基于预设的填充方式对待检测图像进行像素填充,得到至少一张第一掩码图;
对至少一张第一掩码图进行检测,确定高铁接触网是否存在目标部件缺失。
可以看出,在图8所示的电子设备中,通过获取高铁接触网的待检测图像;基于预设的填充方式对待检测图像进行像素填充,得到至少一张第一掩码图;对至少一张第一掩码图进行检测,以确定待检测图像对应的高铁接触网是否存在目标部件缺失。从而以像素填充的方式,降低缺失检测中对螺母、螺栓和开口销等目标部件的纹理特征的依赖,以通过上下文信息进行缺失检测,进而有利于降低接触网螺母、螺栓和开口销缺失检测的难度。
在一个可能的实现方式中,处理器执行对至少一张第一掩码图进行检测,确定高铁接触网是否存在目标部件缺失,包括:
对至少一张第一掩码图进行目标检测,得到至少一张第一掩码图中每张第一掩码图对应的参考预测框;
对参考预测框进行融合,得到第一目标预测框;
根据第一目标预测框,确定高铁接触网是否存在目标部件缺失。
在一个可能的实现方式中,每张第一掩码图中包括进行像素填充得到的像素填充区域,处理器执行对至少一张第一掩码图进行目标检测,得到至少一张第一掩码图中每张第一掩码图对应的参考预测框,包括:
对每张第一掩码图进行目标检测,得到每张第一掩码图对应的第一预测框;
将每张第一掩码图中落在像素填充区域的第一预测框,确定为参考预测框。
在一个可能的实现方式中,处理器执行根据第一目标预测框,确定高铁接触网是否存在目标部件缺失,包括:
确定第一目标预测框在待检测图像中的位置信息;
根据位置信息从待检测图像中截取出待分类区域图像;
对待分类区域图像进行检测,确定高铁接触网是否存在目标部件缺失。
在一个可能的实现方式中,处理器执行获取高铁接触网的待检测图像,包括:
对高铁接触网的原始图像进行目标检测,得到第一目标检测结果;
若第一目标检测结果中包括至少一个第二预测框,则从至少一个第二预测框中确定出第二目标预测框,根据第二目标预测框和预设的网格,得到待检测图像;
若第一目标检测结果中不包括第二预测框,则根据预设的矩形框和网格,得到待检测图像。
在一个可能的实现方式中,处理器执行根据第二目标预测框和预设的网格,得到待检测图像,包括:
根据网格的尺寸和第二目标预测框的宽度或高度,计算得到第一缩放系数;
按照第一缩放系数对原始图像进行缩放,得到待检测图像。
在一个可能的实现方式中,处理器执行根据预设的矩形框和网格,得到待检测图像,包括:
根据网格的尺寸和矩形框的宽度或高度,计算得到第二缩放系数;
按照第二缩放系数对原始图像进行缩放,得到待检测图像。
在一个可能的实现方式中,处理器执行对每张第一掩码图进行目标检测,得到每张第一掩码图对应的第一预测框,包括:
执行至少一次卷积、门控卷积和权重系数相乘的操作,将得到的融合特征图作为目标特征图;
基于目标特征图对每张第一掩码图进行分类预测,得到第一预测框;
其中,至少一次卷积、门控卷积和权重系数相乘的操作,包括:
对每张第一掩码图或者上次操作得到的特征图进行卷积,得到第一特征图;
对每张第一掩码图或者上次操作得到的特征图进行门控卷积,得到第二特征图,第二特征图与第一特征图的尺寸相同,第二特征图中每个位置的值用于表示第一特征图中对应位置的权重系数;
将第一特征图中每个位置的值与第二特征图中对应的权重系数相乘,得到融合特征图。
在一个可能的实现方式中,处理器执行基于预设的填充方式对所述待检测图像进行像素填充,得到至少一张第一掩码图,包括:
根据预设的填充方式构建至少一个矩阵,至少一个矩阵中每个矩阵的大小与待检测图像的尺寸相同,每个矩阵中包括值为0的元素;
将每个矩阵与待检测图像的像素进行点乘,以将待检测图像中与值为0的元素对应的像素填充为黑色像素,得到至少一张第一掩码图,所述像素填充区域为所述每张第一掩码图中被填充为黑色像素的区域。
在一个可能的实现方式中,对至少一张第一掩码图进行目标检测是通过神经网络模型执行的,处理器执行神经网络模型的训练步骤,包括:
获取样本图像和样本图像中目标部件的标注数据;
将样本图像输入神经网络进行目标检测,得到至少一个第三预测框,并从至少一个第三预测框中确定出第三目标预测框;
根据第三目标预测框和网格对样本图像进行缩放,得到缩放后的样本图像;
对缩放后的样本图像进行像素填充,得到至少一张第二掩码图;
采用至少一张第二掩码图、标注数据及损失函数对神经网络进行训练,得到神经网络模型。
上述主要从方法侧执行过程的角度对本申请实施例的方案进行了介绍。可以理解的是,电子设备为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所提供的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例可以根据上述方法示例对电子设备进行功能单元的划分,例如,可以对应各个功能划分各个功能单元,也可以将两个或两个以上的功能集成在一个处理单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。需要说明的是,本申请实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
与上述一致的,请参阅图9,图9为本申请实施例提供的一种图像检测装置的结构示意图。如图9所示,该装置包括获取单元901和处理单元902;
获取单元901,用于获取高铁接触网的待检测图像;
处理单元902,用于基于预设的填充方式对所述待检测图像进行像素填充,得到至少一张第一掩码图;
处理单元902,还用于对所述至少一张第一掩码图进行检测,确定所述高铁接触网是否存在目标部件缺失。
可以看出,在图9所示的图像检测装置中,通过获取高铁接触网的待检测图像;基于预设的填充方式对待检测图像进行像素填充,得到至少一张第一掩码图;对至少一张第一掩码图进行检测,以确定待检测图像对应的高铁接触网是否存在目标部件缺失。从而以像素填充的方式,降低缺失检测中对螺母、螺栓和开口销等目标部件的纹理特征的依赖,以通过上下文信息进行缺失检测,进而有利于降低接触网螺母、螺栓和开口销缺失检测的难度。
在一个可能的实现方式中,在对至少一张第一掩码图进行检测,确定高铁接触网是否存在目标部件缺失方面,处理单元902具体用于:
对至少一张第一掩码图进行目标检测,得到至少一张第一掩码图中每张第一掩码图对应的参考预测框;
对参考预测框进行融合,得到第一目标预测框;
根据第一目标预测框,确定高铁接触网是否存在目标部件缺失。
在一个可能的实现方式中,每张第一掩码图中包括进行像素填充得到的像素填充区域,在对至少一张第一掩码图进行目标检测,得到至少一张第一掩码图中每张第一掩码图对应的参考预测框方面,处理单元902具体用于:
对每张第一掩码图进行目标检测,得到每张第一掩码图对应的第一预测框;
将每张第一掩码图中落在像素填充区域的第一预测框,确定为参考预测框。
在一个可能的实现方式中,在根据第一目标预测框,确定高铁接触网是否存在目标部件缺失方面,处理单元902具体用于:
确定第一目标预测框在待检测图像中的位置信息;
根据位置信息从待检测图像中截取出待分类区域图像;
对待分类区域图像进行检测,确定高铁接触网是否存在目标部件缺失。
在一个可能的实现方式中,在获取高铁接触网的待检测图像方面,处理单元902具体用于:
对高铁接触网的原始图像进行目标检测,得到第一目标检测结果;
若第一目标检测结果中包括至少一个第二预测框,则从至少一个第二预测框中确定出第二目标预测框,根据第二目标预测框和预设的网格,得到待检测图像;
若第一目标检测结果中不包括第二预测框,则根据预设的矩形框和网格,得到待检测图像。
在一个可能的实现方式中,在根据第二目标预测框和预设的网格,得到待检测图像方面,处理单元902具体用于:
根据网格的尺寸和第二目标预测框的宽度或高度,计算得到第一缩放系数;
按照第一缩放系数对原始图像进行缩放,得到待检测图像。
在一个可能的实现方式中,在根据预设的矩形框和网格,得到待检测图像方面,处理单元902具体用于:
根据网格的尺寸和矩形框的宽度或高度,计算得到第二缩放系数;
按照第二缩放系数对原始图像进行缩放,得到待检测图像。
在一个可能的实现方式中,在对每张第一掩码图进行目标检测,得到每张第一掩码图对应的第一预测框方面,处理单元902具体用于:
执行至少一次卷积、门控卷积和权重系数相乘的操作,将得到的融合特征图作为目标特征图;
基于目标特征图对每张第一掩码图进行分类预测,得到第一预测框;
其中,至少一次卷积、门控卷积和权重系数相乘的操作,包括:
对每张第一掩码图或者上次操作得到的特征图进行卷积,得到第一特征图;
对每张第一掩码图或者上次操作得到的特征图进行门控卷积,得到第二特征图,第二特征图与第一特征图的尺寸相同,第二特征图中每个位置的值用于表示第一特征图中对应位置的权重系数;
将第一特征图中每个位置的值与第二特征图中对应的权重系数相乘,得到融合特征图。
在一个可能的实现方式中,在基于预设的填充方式对所述待检测图像进行像素填充,得到至少一张第一掩码图方面,处理单元902具体用于:
根据预设的填充方式构建至少一个矩阵,至少一个矩阵中每个矩阵的大小与待检测图像的尺寸相同,每个矩阵中包括值为0的元素;
将每个矩阵与待检测图像的像素进行点乘,以将待检测图像中与值为0的元素对应的像素填充为黑色像素,得到至少一张第一掩码图,所述像素填充区域为所述每张第一掩码图中被填充为黑色像素的区域。
在一个可能的实现方式中,处理单元902还用于:
获取样本图像和样本图像中目标部件的标注数据;
将样本图像输入神经网络进行目标检测,得到至少一个第三预测框,并从至少一个第三预测框中确定出第三目标预测框;
根据第三目标预测框和网格对样本图像进行缩放,得到缩放后的样本图像;
对缩放后的样本图像进行像素填充,得到至少一张第二掩码图;
采用至少一张第二掩码图、标注数据及损失函数对神经网络进行训练,得到神经网络模型。
本申请实施例还提供一种计算机可读存储介质,其中,该计算机可读存储介质存储有用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任何一种图像检测方法的部分或全部步骤。
本申请实施例还提供一种计算机程序产品,该计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,该计算机程序使得计算机执行如上述方法实施例中记载的任何一种图像检测方法的部分或全部步骤。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在申请明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件程序模块的形式实现。
所述集成的单元如果以软件程序模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器、随机存取器、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (13)

1.一种图像检测方法,其特征在于,所述方法包括:
获取高铁接触网的待检测图像;
基于预设的填充方式对所述待检测图像进行像素填充,得到至少一张第一掩码图;
对所述至少一张第一掩码图进行检测,确定所述高铁接触网是否存在目标部件缺失。
2.根据权利要求1所述的方法,其特征在于,所述对所述至少一张第一掩码图进行检测,确定所述高铁接触网是否存在目标部件缺失,包括:
对所述至少一张第一掩码图进行目标检测,得到所述至少一张第一掩码图中每张第一掩码图对应的参考预测框;
对所述参考预测框进行融合,得到第一目标预测框;
根据所述第一目标预测框,确定所述高铁接触网是否存在目标部件缺失。
3.根据权利要求2所述的方法,其特征在于,所述每张第一掩码图中包括进行像素填充得到的像素填充区域,所述对所述至少一张第一掩码图进行目标检测,得到所述至少一张第一掩码图中每张第一掩码图对应的参考预测框,包括:
对所述每张第一掩码图进行目标检测,得到所述每张第一掩码图对应的第一预测框;
将所述每张第一掩码图中落在所述像素填充区域的所述第一预测框,确定为所述参考预测框。
4.根据权利要求2所述的方法,其特征在于,所述根据所述第一目标预测框,确定所述高铁接触网是否存在目标部件缺失,包括:
确定所述第一目标预测框在所述待检测图像中的位置信息;
根据所述位置信息从所述待检测图像中截取出待分类区域图像;
对所述待分类区域图像进行检测,确定所述高铁接触网是否存在目标部件缺失。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述获取高铁接触网的待检测图像,包括:
对所述高铁接触网的原始图像进行目标检测,得到第一目标检测结果;
若所述第一目标检测结果中包括至少一个第二预测框,则从所述至少一个第二预测框中确定出第二目标预测框,根据所述第二目标预测框和预设的网格,得到所述待检测图像;
若所述第一目标检测结果中不包括第二预测框,则根据预设的矩形框和所述网格,得到所述待检测图像。
6.根据权利要求5所述的方法,其特征在于,所述根据所述第二目标预测框和预设的网格,得到所述待检测图像,包括:
根据所述网格的尺寸和所述第二目标预测框的宽度或高度,计算得到第一缩放系数;
按照所述第一缩放系数对所述原始图像进行缩放,得到所述待检测图像。
7.根据权利要求5所述的方法,其特征在于,所述根据预设的矩形框和所述网格,得到所述待检测图像,包括:
根据所述网格的尺寸和所述矩形框的宽度或高度,计算得到第二缩放系数;
按照所述第二缩放系数对所述原始图像进行缩放,得到所述待检测图像。
8.根据权利要求3-7任一项所述的方法,其特征在于,所述对所述每张第一掩码图进行目标检测,得到所述每张第一掩码图对应的第一预测框,包括:
执行至少一次卷积、门控卷积和权重系数相乘的操作,将得到的融合特征图作为目标特征图;
基于所述目标特征图对所述每张第一掩码图进行分类预测,得到所述第一预测框;
其中,至少一次卷积、门控卷积和权重系数相乘的操作,包括:
对所述每张第一掩码图或者上次操作得到的特征图进行卷积,得到第一特征图;
对所述每张第一掩码图或者上次操作得到的特征图进行门控卷积,得到第二特征图,所述第二特征图与所述第一特征图的尺寸相同,所述第二特征图中每个位置的值用于表示所述第一特征图中对应位置的权重系数;
将所述第一特征图中每个位置的值与所述第二特征图中对应的权重系数相乘,得到融合特征图。
9.根据权利要求3-8任一项所述的方法,其特征在于,所述对所述待检测图像进行像素填充,得到至少一张第一掩码图,包括:
根据预设的填充方式构建至少一个矩阵,所述至少一个矩阵中每个矩阵的大小与所述待检测图像的尺寸相同,所述每个矩阵中包括值为0的元素;
将所述每个矩阵与所述待检测图像的像素进行点乘,以将所述待检测图像中与所述值为0的元素对应的像素填充为黑色像素,得到所述至少一张第一掩码图,所述像素填充区域为所述每张第一掩码图中被填充为黑色像素的区域。
10.根据权利要求2-9任一项所述的方法,其特征在于,所述对所述至少一张第一掩码图进行目标检测是通过神经网络模型执行的,所述神经网络模型通过以下步骤训练得到:
获取样本图像和所述样本图像中目标部件的标注数据;
将所述样本图像输入神经网络进行目标检测,得到至少一个第三预测框,并从所述至少一个第三预测框中确定出第三目标预测框;
根据所述第三目标预测框和所述网格对所述样本图像进行缩放,得到缩放后的样本图像;
对所述缩放后的样本图像进行像素填充,得到至少一张第二掩码图;
采用所述至少一张第二掩码图、所述标注数据及损失函数对所述神经网络进行训练,得到所述神经网络模型。
11.一种图像检测装置,其特征在于,所述装置包括获取单元和处理单元;
所述获取单元,用于获取高铁接触网的待检测图像;
所述处理单元,用于基于预设的填充方式对所述待检测图像进行像素填充,得到至少一张第一掩码图;
所述处理单元,还用于对所述至少一张第一掩码图进行检测,确定所述高铁接触网是否存在目标部件缺失。
12.一种电子设备,其特征在于,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1-10任一项所述的方法。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1-10任一项所述的方法。
CN202110884713.9A 2021-07-31 2021-07-31 图像检测方法、装置、电子设备及存储介质 Pending CN113610798A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110884713.9A CN113610798A (zh) 2021-07-31 2021-07-31 图像检测方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110884713.9A CN113610798A (zh) 2021-07-31 2021-07-31 图像检测方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN113610798A true CN113610798A (zh) 2021-11-05

Family

ID=78306597

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110884713.9A Pending CN113610798A (zh) 2021-07-31 2021-07-31 图像检测方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113610798A (zh)

Similar Documents

Publication Publication Date Title
US10943145B2 (en) Image processing methods and apparatus, and electronic devices
Xu et al. Inter/intra-category discriminative features for aerial image classification: A quality-aware selection model
CN112329702B (zh) 一种快速人脸密度预测和人脸检测方法、装置、电子设备及存储介质
CN106971178A (zh) 行人检测和再识别的方法及装置
CN108875482B (zh) 物体检测方法和装置、神经网络训练方法和装置
CN110781980B (zh) 目标检测模型的训练方法、目标检测方法及装置
CN110807362A (zh) 一种图像检测方法、装置和计算机可读存储介质
CN112906794A (zh) 一种目标检测方法、装置、存储介质及终端
CN110533046B (zh) 一种图像实例分割方法、装置、计算机可读存储介质及电子设备
CN110942456B (zh) 篡改图像检测方法、装置、设备及存储介质
CN112132216B (zh) 车型识别方法、装置、电子设备及存储介质
CN112036381B (zh) 视觉跟踪方法、视频监控方法及终端设备
CN114331949A (zh) 一种图像数据处理方法、计算机设备以及可读存储介质
CN110991310A (zh) 人像检测方法、装置、电子设备及计算机可读介质
CN112802076A (zh) 反射图像生成模型及反射去除模型的训练方法
CN113065379B (zh) 融合图像质量的图像检测方法、装置、电子设备
CN111291704A (zh) 干扰去除方法、装置、计算机设备和存储介质
CN108520532B (zh) 识别视频中物体运动方向的方法及装置
CN112634174A (zh) 一种图像表示学习方法及系统
CN116543333A (zh) 电力系统的目标识别方法、训练方法、装置、设备和介质
CN113610798A (zh) 图像检测方法、装置、电子设备及存储介质
CN116486153A (zh) 图像分类方法、装置、设备及存储介质
CN116129345A (zh) 变压器的油枕油位检测方法、装置和计算机设备
CN115601684A (zh) 突发事件预警方法、装置、电子设备及存储介质
CN114708230A (zh) 基于图像分析的车架质量检测方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination