CN111160140A - 一种图像检测方法及装置 - Google Patents
一种图像检测方法及装置 Download PDFInfo
- Publication number
- CN111160140A CN111160140A CN201911284783.XA CN201911284783A CN111160140A CN 111160140 A CN111160140 A CN 111160140A CN 201911284783 A CN201911284783 A CN 201911284783A CN 111160140 A CN111160140 A CN 111160140A
- Authority
- CN
- China
- Prior art keywords
- feature map
- feature
- map
- attention
- layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/20—Scenes; Scene-specific elements in augmented reality scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/05—Recognition of patterns representing particular kinds of hidden objects, e.g. weapons, explosives, drugs
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本申请提供的一种图像检测方法及装置,该方法包括:获取包含一个或多个待检测物体的图像;根据神经网络对所述图像进行特征提取,得到N个特征图;N为大于或等于2的整数;对所述N个特征图进行融合处理得到第一特征图H;对所述第一特征图H进行语义信息提取,得到注意力图;根据所述注意力图和所述第一特征图H得到第二特征图;将所述N个特征图依次和所述第二特征图融合,得到检测结果。通过该方法可实现对行李物品中的危险物品的检测,提高了危险物品的检测准确率和效率。
Description
技术领域
本申请涉及通信技术领域,尤其涉及一种图像检测方法及装置。
背景技术
基于X光机的危险品检测任务,一般包括检测包裹中的刀、枪支、容器、打火机等物体;刀枪等危险品在真实场景中出现的概率非常低,导致可用于训练目标检测网络的训练数据少,而且刀枪等危险品出现时,大都隐藏性极高,角度刁钻,对目标检测算法要求特别高;而容器类危险品在真实生活场景中出现的概率极高,但种类、大小不一,且存在严重的遮挡、重叠等问题,目标检测算法进行标记的难度较大。由于检测任务的特殊性,一旦漏检会威胁公众安全,而误检会影响用户使用体验,因此要求目标检测算法同时具备较高的准确率和检出率。
发明内容
本申请实施例提供一种图像检测方法及装置,用以解决现有技术中,危险物品检测困难的问题。
第一方面,本申请实施例提供的一种图像检测方法,包括:
获取包含一个或多个待检测物体的图像;
根据神经网络对所述图像进行特征提取,得到N个特征图;所述N为大于或等于2的整数;
对所述N个特征图进行融合处理得到第一特征图H;
对所述第一特征图H进行语义信息提取,得到注意力图;
根据所述注意力图和所述第一特征图H得到第二特征图;
将所述N个特征图依次和所述第二特征图融合,得到检测结果。
可选的,所述对所述N个特征图进行融合处理得到第一特征图H,包括:
所述N个特征图包括多层;其中,第i+1层的M个特征图是由第i层的N个特征图卷积融合得到,M=N-1;所述i为大于或等于1的整数;
将最后一层的特征图作为所述第一特征图H。
可选的,所述第i+1层的M个特征图是由第i层的N个特征图卷积融合得到,包括:
所述M个特征图中的第j个特征图由第i层的第j个特征图和第j+1个特征图融合得到,所述j为大于或等于1的整数。
可选的,所述对所述第一特征图H进行语义信息提取,得到注意力图,包括:
对所述第一特征图H进行卷积降维,得到特征图Q和特征图K;
根据所述特征图Q和所述特征图K得到注意力权重;
对所述注意力权重进行归一化处理得到所述注意力图。
可选的,所述对所述第一特征图H进行语义信息提取,得到注意力图之后,还包括:
对所述第一特征图H进行卷积,得到特征图V;
根据所述特征图V和所述第一特征图H得到第三特征图S;其中,所述第三特征图S满足如下公式:
S=(V*A)+H;
其中,所述S是所述第三特征图,所述V是所述特征图V,所述A是所述注意力图,所述H是所述第一特征图H;
对所述第三特征图S进行卷积生成分割结果;
若所述分割结果与所述注意力图中的标记区域一致,根据所述注意力图和所述第一特征图H得到第二特征图。可选的,所述根据所述注意力图和所述第一特征图H得到第二特征图,包括:
所述第二特征图满足如下公式:
F=H*(A+1);
其中,所述F是所述第二特征图,所述A是所述注意力图,所述H是所述第一特征图。
可选的,所述将所述N个特征图依次和所述第二特征图融合,得到检测结果,包括:将所述第二特征图和所述N个特征图中除最后第一层以外的每层的最后一个特征图融合得到所述检测结果。
第二方面,本申请实施例提供的一种图像检测装置,包括:获取模块,用于获取包含一个或多个待检测物体的图像;
处理模块,用于根据神经网络对所述图像进行特征提取,得到N个特征图;所述N为大于或等于2的整数;
所述处理模块,还用于对所述N个特征图进行融合处理得到第一特征图H;
所述处理模块,还用于对所述第一特征图H进行语义信息提取,得到注意力图;
所述处理模块,还用于根据所述注意力图和所述第一特征图H得到第二特征图;
所述处理模块,还用于将所述N个特征图依次和所述第二特征图融合,得到检测结果。
第三方面,本申请实施例提供的一种电子设备,包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中:存储器存储有可被至少一个处理器执行的指令,该指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述方法的一个或多个步骤。
第四方面,本申请实施例提供的一种计算机可读介质,存储有计算机可执行指令,所述计算机可执行指令用于执行上述方法。
本申请提供的一种图像检测方法,该方法包括:获取包含一个或多个待检测物体的图像;根据神经网络对所述图像进行特征提取,得到N个特征图;N为大于或等于2的整数;对所述N个特征图进行融合处理得到第一特征图H;对所述第一特征图H进行语义信息提取,得到注意力图;根据所述注意力图和所述第一特征图H得到第二特征图;将所述N个特征图依次和所述第二特征图融合,得到检测结果。通过该方法可实现对行李物品中的危险物品的检测,提高了危险物品的检测准确率和效率。
本申请的这些方面或其它方面在以下实施例的描述中会更加简明易懂。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1A为本申请实施例提供的一种图像检测算法的网络结构示意图;
图1B为本申请实施例提供的一种图像检测方法的流程示意图;
图2为本申请实施例提供的语义信息提取模块流程示意图;
图3为本申请实施例提供的第二特征图F生成示意图;
图4为本申请实施例提供的一种图像检测装置的结构示意图;
图5为本申请实施例提供的电子设备的结构示意图。
具体实施方式
为了解决行李物品中危险物品识别困难,识别准确率和识别效率无法兼顾的问题,本申请实施例提供了一种危险物品检测方法及装置。
以下结合说明书附图对本申请的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本申请,并不用于限定本申请,并且在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
需要理解的是,在本申请实施例的描述中,“第一”、“第二”等词汇,仅用于区分描述的目的,而不能理解为指示或暗示相对重要性,也不能理解为指示或暗示顺序。在本申请实施例的描述中“多个”,是指两个或两个以上。
本申请实施例中的术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
图像检测的目的在于准确预测图像中存在的物体类别和位置,以类别号和检测框的方式输出检测目标。传统的目标检测方法实现步骤分为以下三个步骤:通过滑动窗口在不同尺度上生成不同纵横比的检测框、通过SIFT等方式进行特征提取、用支持向量机等方法进行检测框分类三个步骤,这种方法往往需要巨大的计算量,特征提取仅利用低阶视觉信息,很难捕捉到复杂场景中的语义信息,该方法中的三个步骤是独立执行和优化的,很难得到全局最优解,检测的准确率低下。
基于深度学习的目标检测算法可以有效避免传统图像检测方法的缺点,主要分为基于检测框的目标检测和像素级的实例分割。实例分割对物体进行像素级检测,精度高但是实时性差;而基于检测框的目标检测算法分为两步式检测算法和一步式检测算法两种。两步式检测算法,如(Region-Convolutional Neural Networks,R-CNN)算法及其变种,首先使用一个检测框生成器生成大量的检测框,再从检测框中提取特征层,然后使用一个分类器预测检测框的类别。一步式检测算法,如YOLO算法及其变种,直接在特征图的每个位置进行类别预测。其中,两步式检测算法精度较高,但实时性差;一步式检测算法实时性好,但精度低,目标准确率和检出率难以平衡。
为了解决上述检测危险物品要求较高的技术问题,现有技术方案中采取两步式检测算法对危险物品进行检测,虽然提高了检测准确率,但计算量大,执行复杂、计算效率低下,实时性差,且不能很好地拟合真实的物体边界。
因此,本申请提供的一种图像检测方法,该方法中基于一步式检测算法,构建了一个新的图像检测算法,本申请在原始的目标检测网络中融合了语义信息提取信息,使得检测结果更加准确,同时提高了检测物体的效率。请参见图1A,图1A为本申请实施例提供的一种图像检测算法的网络结构示意图,该网络结构包括以下四个模块:
1)特征提取模块
特征提取模块采用目标中心检测网络Center-Net中的多级跳跃连接的图像分类网络(Deep Layer Aggregation,DLA34)。所述特征提取模块用于对获取到的待检测图像进行特征提取得到一个或多个第一特征层。
2)融合模块
由于高阶特征层富含丰富的语义特征而缺少空间信息,低阶特征层刚好与之相反,因此融合模块用于将不同阶的特征层进行融合。
3)语义分割模块
为了提高目标检测的准确率,本申请实施例在DLA34网络中设计了语义分割模块,根据预设语义规则对特征图中像素进行分割,得到语义提取信息。
4)检测模块
为了进一步融合高级语义信息,检测模块用于将所述一个或多个第二特征层分别和所述第二特征图融合,得到检测结果。
下面结合图1A和图1B详细介绍整个图像检测算法的实现过程。请参见图1B,图1B为本申请实施例提供的一种图像检测方法流程示意图,该方法包括以下步骤:
步骤1:获取包含一个或多个待检测物体的图像。
电脑获取待检测物体的图像,其中,待检测物体的图像可以是基于X光机透射的图像,也可以是手机拍摄的图像,本申请实施例不做具体的限定。
步骤2:根据神经网络对所述图像进行特征提取,得到N个特征图;N为大于或等于2的整数。
需要说明的是,图1A中给出的特征图仅仅是所述N个特征图中的部分特征图,特征图编号也仅仅是示例,而不对本申请提供的图像检测算法中的网络结构的限定。。
示例性的,神经网络可以采用经典的多级跳跃连接的图像分类网络(Deep LayerAggregation,DLA)34对所述待检测图像进行特征提取,得到N个特征图。如图1A所示,给出了DLA34网络中的四层特征图,特征图layer12、特征图layer13、特征图layer14、特征图layer15为第一层中的特征图,第一层中的特征图是低阶特征层,其中每个特征图的分辨率和通道数都不一样,且第一层的特征图中的空间信息丰富、但语义特征信息较少;特征图layer23、特征图layer24、特征图layer25为第二层中的特征图;特征图layer34、特征图layer35为第三层中的特征图;第一特征图H为第四层中的特征图。
应理解,这里的“层”指的是前述“特征层”的简称,下文的叙述均以此为准。
步骤3:对所述N个特征图进行融合处理得到第一特征图H。可选的,对所述N个特征图进行融合处理得到第一特征图H包括:所述N个特征图包括多层;其中,第i+1层的M个特征图是由第i层的N个特征图卷积融合得到,M=N-1;i为大于或等于1的整数;将最后一层的特征图作为所述第一特征图H。
可选的,所述第i+1层的M个特征图是由第i层的N个特征图卷积融合得到,包括:所述M个特征图中的第j个特征图由第i层的第j个特征图和第j+1个特征图融合得到,j为大于或等于1的整数。
示例性的,假设所述N个特征图包括4层,以图1A为例,根据第一层的特征图融合得到第二层的特征图,第二层的特征图融合得到第三层的特征图,第三层的特征图融合得到第一特征图H。
下面通过具体的实例对融合的过程进行详细的解释说明。
以得到第二层的特征图中的layer25特征图的过程为例,要得到layer25层就需要将第一层的特征图中的layer14特征图和layer15特征图根据以下公式进行融合:
Layer25=Conv(Layer14+Deconv(Conv(Layer15)));
具体的,先对layer15特征图进行3*3的卷积,使得layer15特征图的输出通道数与layer14特征图的输出通道数相同;然后再对卷积之后的layer15特征图进行反卷积扩大分辨率至与layer14特征图的分辨率相同;
再将卷积及反卷积之后layer15特征图与layer14特征图进行求和,然后对layer15特征图和layer14特征图之和进行3*3的卷积,得到layer25特征图,layer25特征图的输出通道数与layer14特征图的输出通道数相同。同样地,对第一特征图H中的layer12特征图和layer13特征图进行融合,得到layer23;对第一特征图H中的layer13特征图和layer14特征图进行融合,得到layer24特征图。
以上述相同的方式对第二层的特征图中的layer23特征图和layer24特征图进行融合,得到layer34特征图;对第二层的特征图中的layer24特征图和layer25特征图进行融合,得到layer35;对第三层的特征图中的layer34特征图和layer35特征图进行融合,得到第一特征图H。
步骤4:对所述第一特征图H进行语义信息提取,得到注意力图。
如图1A所示的语义分割模块具体的实现包括多个步骤。下面将结合图2对本申请实施例提供的语义分割过程进行详细的描述。请参见图2,图2为本申请实施例提供的语义分割流程示意图。
201:对第一特征图H进行降维,得到特征图Q和特征图K。
示例性的,通过1*1的卷积核对第一特征图H进行降维,分别生成Q、K两个特征图特征图Q和特征图K的通道数降为第一特征图H的通道数的1/8。其中,特征图Q的排列方式为H*W*1/8C,特征图K的排列方式为1/8C*H*W。
202:根据特征图Q和特征图K得到注意力图。
示例性的,将特征图Q和特征图K相乘后得到注意力权重,再利用softmax函数对注意力权重进行归一化处理得到注意力图A。
203:对第一特征图H进行卷积得到特征图V。
示例性的,根据1*1的卷积核对第一特征图H进行卷积生成特征图V。
204:根据特征图V和注意力图A以及第一特征图H得到特征图F。
示例性的,如图2所示,将特征图V与注意力图A进行相乘后与第一特征图H相加得到特征图S。其中,所述特征图S满足如下公式:
S=(V*A)+H;
其中,所述S是所述特征图S,所述V是所述特征图V,所述A是所述注意力图,所述H是所述第一特征图。
205:对特征图S进行卷积得到分割结果。
示例性的,根据1*1的卷积核对特征图S进行卷积得到分割结果。
应理解,所述分割结果中的各个类别已被分类标记出。
206:根据损失函数对所述分割结果进行处理。
示例性的,根据1*1的卷积核对特征图S进行卷积生成分割结果,假设预设类别为五类,每个类有不同的标记,分割结果中的每个像素已按类别做了标记,为了确保语义信息提取的准确性,采用交叉熵的Loss函数分割结果进行监督处理。
应理解,得到分割结果之后,根据分割结果对注意力图进行验证,以确保注意力图的准确性,进一步根据注意力图和第一特征图H得到第二特征图。
步骤5:根据所述注意力图和所述第一特征图H得到第二特征图。
可选的,所述根据所述注意力图和所述第一特征图H得到第二特征图,包括:
所述第二特征图满足如下公式:
F=H*(A+1);
其中,所述F是所述第二特征图,所述A是所述注意力图,所述H是所述第一特征图H。
示例性的,请参见图3,图3为本申请实施例提供的第二特征图F生成示意图,如图3所示,对第一特征图进行语义分割之后进行语义信息提取的分割信息为注意力图A;为了让检测结果更准确,将该注意力图A与融合模块的输出的第一特征图H相乘再相加,可得检测模块的输入特征图即第二特征图F,第二特征图F中融合了分割的语义信息。
步骤6:将所述N个特征图依次和所述第二特征图融合,得到检测结果。
可选的,所述将所述N个特征图依次和所述第二特征图融合,得到检测结果,包括:将所述第二特征图和所述N个特征图中除最后第一层以外的每层的最后一个特征图融合得到所述检测结果。
一种可能的实施方式中,将特征图F和所述N个特征图中每层的最后的一个特征图作为所述检测模块的输入,一次实现特征图F和所述N个特征图中每层的最后的一个特征图的融合,得到所述检测结果。
另一种可能的实施方式中,将所述第二特征图和所述N个特征图中倒数第二层的最后一个特征图融合得到第一个中间特征图;将所述第一个中间特征图与所述N个特征图中倒数第h+2层的最后一个特征图融合得到第g个中间特征图;所述h为大于等于1的整数;所述g为大于等于2的整数;当所述N个特征图中倒数第h+2层为所述N个特征图中第2层时,将倒数第二个中间特征图与所述N个特征图中第一层的最后一个特征图融合得到最后一个中间特征图;
将所述最后一个中间特征图与所述N个特征图中第一层的最后一个特征图融合得到所述检测结果。示例性的,以图1A为例,首先将第二特征图F和layer35特征图作为检测模块的输入,两者相融合得到特征图F1;接着将特征图F1和layer25特征图相融合得到特征图F2;将特征图F2和layer15特征图相融合得到特征图F3,根据特征图F3输出检测结果。
以第二特征图F和layer35特征图融合为例,根据如下公式进行融合:
F1=Conv(F+Deconv(Conv(Layer35)));
其中,所述Conv表示卷积,所述Deconv表示反卷积。
下面将结合图1A、图2、图3和具体的实施例对本申请的技术方案进行详细的解释。
以基于X光机的透射图像为例,神经网络可以采用经典的多级跳跃连接的图像分类网络(Deep Layer Aggregation,DLA)对所述待检测图像进行特征提取,。如图1A所示,假设DLA34网络中的特征图共有4层,特征提取模块对所述待检测图像进行特征提取后得到第一层的特征图如下:特征图layer12、特征图layer13、特征图layer14、特征图layer15。对上述第一层的特征图进行融合得到第二层的特征图:特征图layer23、特征图layer24、特征图layer25;
根据第一层的特征图中的layer14特征图和layer15特征图进行融合得到layer25特征图;先对layer15特征图进行3*3的卷积,使得layer15特征图输出通道数与layer14特征图的输出通道数相同,然后再对卷积之后的layer15特征图进行反卷积扩大分辨率至与layer14特征图的分辨率相同。再将卷积及反卷积之后layer15特征图与layer14特征图进行求和,然后对求和后的layer15特征图和layer14特征图进行3*3的卷积,得到layer25特征图,layer25特征图的输出通道数与layer14特征图的输出通道数相同。
同样地,对第一层的特征图中的layer12特征图和layer13特征图进行融合,得到layer23特征图;对第一层的特征图中的layer13特征图和layer14特征图进行融合,得到layer24特征图。
得到上述第二层的特征图之后,为了使最终的特征图具备更多的空间信息,对上述第二层的特征图中的特征图layer23、特征图layer24、特征图layer25进一步融合,得到第三层的特征图。
对第二层的特征图中的特征图layer23和特征图layer24进行融合,得到特征图layer34;对第二层的特征图中的layer24特征图和layer25特征图进行融合,得到特征图layer35。
对第二层的特征图中的特征图layer34和特征图layer35进行融合,得到第一特征图H。
得到第一特征图H之后,通过1*1的卷积核对第一特征图H进行降维,分别生成Q、K两个特征图,特征图Q和特征图K的通道数降为第一特征图H的通道数的1/8。其中,特征图Q的排列方式为H*W*1/8C,特征图K的排列方式为1/8C*H*W。
如图2所示,将特征图Q和特征图K相乘后得到注意力权重,再利用softmax函数对注意力权重进行归一化处理得到注意力图A。
如图2所示,根据1*1的卷积核对第一特征图H进行卷积生成特征图V,将特征图V与注意力图进行相乘后与第一特征图H相加得到第三特征图S。
根据1*1的卷积核对第三特征图S进行卷积生成分割结果,采用交叉熵的Loss函数对分割结果进行监督处理,并根据分割结果判别注意力图的准确性。
为了让检测结果更准确,如图3所示,将注意力图A与特征提取模块的输出第一特征图H相乘再相加,可得检测模块的输入即第二特征图F,第二特征图F中融合了分割的语义信息。
如图1所示,检测模块的输入第二特征图F,对第二特征图F和特征图Layer35进行融合得到了特征图F1,利用特征图Layer25对特征图F1进行融合得到特征图F2;利用特征图Layer15对特征图F2进行融合得到了特征图F3,通过特征图F3进一步输出检测结果,检测结果中危险物品的图像已被标记处。
基于同一发明构思,本申请还提供一种图像检测装置,请参见图4,图4为本申请实施例提供的一种图像检测装置的结构示意图,该装置包括:获取模块401、处理模块402;
获取模块401,用于获取包含一个或多个待检测物体的图像;
处理模块402,用于根据神经网络对所述图像进行特征提取,得到N个特征图;所述N为大于或等于2的整数;
所述处理模块402,还用于对所述N个特征图进行融合处理得到第一特征图H;
所述处理模块402,还用于对所述第一特征图H进行语义信息提取,得到注意力图;
所述处理模块402,还用于根据所述注意力图和所述第一特征图H得到第二特征图;
所述处理模块402,还用于将所述N个特征图依次和所述第二特征图融合,得到检测结果。
可选的,所述处理模块402用于对所述N个特征图进行融合处理得到第一特征图H,具体用于:
所述N个特征图包括多层;其中,第i+1层的M个特征图是由第i层的N个特征图卷积融合得到,M=N-1;所述i为大于或等于1的整数;
将最后一层的特征图作为所述第一特征图H。
可选的,所述第i+1层的M个特征图是由第i层的N个特征图卷积融合得到,包括:
所述M个特征图中的第j个特征图由第i层的第j个特征图和第j+1个特征图融合得到,j为大于或等于1的整数。
可选的,所述处理模块402对所述第一特征图H进行语义信息提取,得到注意力图,具体用于:
对所述第一特征图H进行卷积降维,得到特征图Q和特征图K;
根据所述特征图Q和所述特征图K得到注意力权重;
对所述注意力权重进行归一化处理得到所述注意力图。
可选的,所述处理模块402用于对所述第一特征图H进行语义信息提取,得到注意力图之后,还用于:
对所述第一特征图H进行卷积,得到特征图V;
根据所述特征图V和所述第一特征图H得到第三特征图S;其中,所述第三特征图S满足如下公式:
S=(V*A)+H;
其中,所述S是所述第三特征图,所述V是所述特征图V,所述A是所述注意力图,所述H是所述第一特征图H;
对所述第三特征图S进行卷积生成分割结果;
若所述分割结果与所述注意力图中的标记区域一致,根据所述注意力图和所述第一特征图H得到第二特征图;
若所述分割结果与所述注意力图中的标记区域不一致,重新对所述第一特征图H进行语义信息提取。
可选的,所述处理模块402用于根据所述注意力图和所述第一特征图H得到第二特征图,具体用于:
所述第二特征图满足如下公式:
F=H*(A+1);
其中,所述F是所述第二特征图,所述A是所述注意力图,所述H是所述第一特征图。
可选的,所述处理模块402用于将所述N个特征图依次和所述第二特征图融合,得到检测结果,包括:将所述第二特征图和所述N个特征图中除最后第一层以外的每层的最后一个特征图融合得到所述检测结果。
基于同一发明构思,本申请实施例提供一种设置有图像检测功能的电子设备,请参见图5所述,图5为本申请实施例提供的电子设备的结构示意图。该设置有图像检测功能的电子设备包括至少一个处理器502,以及与至少一个处理器连接的存储器501,本申请实施例中不限定处理器502与存储器501之间的具体连接介质,图5是以处理器502和存储器501之间通过总线500连接为例,总线500在图5中以粗线表示,其它部件之间的连接方式,仅是进行示意性说明,并不以此为限。总线500可以分为地址总线、数据总线、控制总线等,为便于表示,图5中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
在本申请实施例中,存储器501存储有可被至少一个处理器502执行的指令,至少一个处理器502通过调用存储器501存储的指令,可以执行前述的使用相册的方法中所包括的步骤。
其中,处理器502是设置有图像检测功能的电子设备的控制中心,可以利用各种接口和线路连接整个设置有图像检测功能的电子设备的各个部分,通过执行存储在存储器501内的指令,从而实现设置有图像检测功能的电子设备的各种功能。可选的,处理器502可包括一个或多个处理单元,处理器502可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器502中。在一些实施例中,处理器502和存储器501可以在同一芯片上实现,在一些实施例中,它们也可以在独立的芯片上分别实现。
存储器501作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。存储器501可以包括至少一种类型的存储介质,例如可以包括闪存、硬盘、多媒体卡、卡型存储器、随机访问存储器(Random AccessMemory,RAM)、静态随机访问存储器(Static Random Access Memory,SRAM)、可编程只读存储器(Programmable Read Only Memory,PROM)、只读存储器(Read Only Memory,ROM)、带电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、磁性存储器、磁盘、光盘等等。存储器501是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。本申请实施例中的存储器501还可以是电路或者其它任意能够实现存储功能的装置,用于存储程序指令和/或数据。
处理器502可以是通用处理器,例如中央处理器(CPU)、数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本申请实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的图像检测的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
通过对处理器502进行设计编程,可以将前述实施例中介绍的检测路径的方法所对应的代码固化到芯片内,从而使芯片在运行时能够执行前述的检测路径的方法的步骤,如何对处理器502进行设计编程为本领域技术人员所公知的技术,这里不再赘述。
基于上述实施例,本申请实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意方法实施例中的图像检测方法。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (10)
1.一种图像检测方法,其特征在于,包括:
获取包含一个或多个待检测物体的图像;
根据神经网络对所述图像进行特征提取,得到N个特征图;所述N为大于或等于2的整数;
对所述N个特征图进行融合处理得到第一特征图H;
对所述第一特征图H进行语义信息提取,得到注意力图;
根据所述注意力图和所述第一特征图H得到第二特征图;
将所述N个特征图依次和所述第二特征图融合,得到检测结果。
2.如权利要求1所述的方法,其特征在于,所述对所述N个特征图进行融合处理得到第一特征图H,包括:
所述N个特征图包括多层;其中,第i+1层的M个特征图是由第i层的N个特征图卷积融合得到,M=N-1;所述i为大于或等于1的整数;
将最后一层的特征图作为所述第一特征图H。
3.如权利要求2所述的方法,其特征在于,所述第i+1层的M个特征图是由第i层的N个特征图卷积融合得到,包括:
所述M个特征图中的第j个特征图由第i层的第j个特征图和第j+1个特征图融合得到,所述j为大于或等于1的整数。
4.如权利要求1所述的方法,其特征在于,所述对所述第一特征图H进行语义信息提取,得到注意力图,包括:
对所述第一特征图H进行卷积降维,得到特征图Q和特征图K;
根据所述特征图Q和所述特征图K得到注意力权重;
对所述注意力权重进行归一化处理得到所述注意力图。
5.如权利要求1所述的方法,其特征在于,所述对所述第一特征图H进行语义信息提取,得到注意力图之后,还包括:
对所述第一特征图H进行卷积,得到特征图V;
根据所述特征图V和所述第一特征图H得到第三特征图S;其中,所述第三特征图S满足如下公式:
S=(V*A)+H;
其中,所述S是所述第三特征图,所述V是所述特征图V,所述A是所述注意力图,所述H是所述第一特征图H;
对所述第三特征图S进行卷积生成分割结果;
若所述分割结果与所述注意力图中的标记区域一致,根据所述注意力图和所述第一特征图H得到第二特征图。
6.如权利要求1所述的方法,其特征在于,所述根据所述注意力图和所述第一特征图H得到第二特征图,包括:
所述第二特征图满足如下公式:
F=H*(A+1);
其中,所述F是所述第二特征图,所述A是所述注意力图,所述H是所述第一特征图。
7.如权利要求1所述的方法,其特征在于,所述将所述N个特征图依次和所述第二特征图融合,得到检测结果,包括:
将所述第二特征图和所述N个特征图中除最后第一层以外的每层的最后一个特征图融合得到所述检测结果。
8.一种图像检测装置,其特征在于,所述装置包括:
获取模块,用于获取包含一个或多个待检测物体的图像;
处理模块,用于根据神经网络对所述图像进行特征提取,得到N个特征图;所述N为大于或等于2的整数;
所述处理模块,还用于对所述N个特征图进行融合处理得到第一特征图H;
所述处理模块,还用于对所述第一特征图H进行语义信息提取,得到注意力图;
所述处理模块,还用于根据所述注意力图和所述第一特征图H得到第二特征图;
所述处理模块,还用于将所述N个特征图依次和所述第二特征图融合,得到检测结果。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1-7任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现权利要求1-7任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911284783.XA CN111160140B (zh) | 2019-12-13 | 2019-12-13 | 一种图像检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911284783.XA CN111160140B (zh) | 2019-12-13 | 2019-12-13 | 一种图像检测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111160140A true CN111160140A (zh) | 2020-05-15 |
CN111160140B CN111160140B (zh) | 2023-04-18 |
Family
ID=70557099
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911284783.XA Active CN111160140B (zh) | 2019-12-13 | 2019-12-13 | 一种图像检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111160140B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111709951A (zh) * | 2020-08-20 | 2020-09-25 | 成都数之联科技有限公司 | 目标检测网络训练方法及系统及网络及装置及介质 |
CN112102244A (zh) * | 2020-08-17 | 2020-12-18 | 湖南大学 | 胎儿超声标准切面图像检测方法、计算机设备和存储介质 |
CN112508848A (zh) * | 2020-11-06 | 2021-03-16 | 上海亨临光电科技有限公司 | 一种基于深度学习多任务端到端的遥感图像船舶旋转目标检测方法 |
CN112633156A (zh) * | 2020-12-22 | 2021-04-09 | 浙江大华技术股份有限公司 | 车辆检测方法、图像处理装置以及计算机可读存储介质 |
CN112967264A (zh) * | 2021-03-19 | 2021-06-15 | 深圳市商汤科技有限公司 | 缺陷检测方法及装置、电子设备和存储介质 |
CN113673557A (zh) * | 2021-07-12 | 2021-11-19 | 浙江大华技术股份有限公司 | 特征处理方法、动作定位方法及相关设备 |
CN112633156B (zh) * | 2020-12-22 | 2024-05-31 | 浙江大华技术股份有限公司 | 车辆检测方法、图像处理装置以及计算机可读存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104636755A (zh) * | 2015-01-31 | 2015-05-20 | 华南理工大学 | 一种基于深度学习的人脸美丽评价方法 |
US20170124432A1 (en) * | 2015-11-03 | 2017-05-04 | Baidu Usa Llc | Systems and methods for attention-based configurable convolutional neural networks (abc-cnn) for visual question answering |
CN109242845A (zh) * | 2018-09-05 | 2019-01-18 | 北京市商汤科技开发有限公司 | 医疗影像处理方法及装置、电子设备及存储介质 |
CN109389129A (zh) * | 2018-09-15 | 2019-02-26 | 北京市商汤科技开发有限公司 | 一种图像处理方法、电子设备及存储介质 |
CN109829429A (zh) * | 2019-01-31 | 2019-05-31 | 福州大学 | 基于YOLOv3的监控场景下的安防敏感物品检测方法 |
CN110298361A (zh) * | 2019-05-22 | 2019-10-01 | 浙江省北大信息技术高等研究院 | 一种rgb-d图像的语义分割方法和系统 |
CN110533045A (zh) * | 2019-07-31 | 2019-12-03 | 中国民航大学 | 一种结合注意力机制的行李x光违禁品图像语义分割方法 |
GB2586858A (en) * | 2019-09-06 | 2021-03-10 | Smiths Heimann Sas | Image retrieval system |
-
2019
- 2019-12-13 CN CN201911284783.XA patent/CN111160140B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104636755A (zh) * | 2015-01-31 | 2015-05-20 | 华南理工大学 | 一种基于深度学习的人脸美丽评价方法 |
US20170124432A1 (en) * | 2015-11-03 | 2017-05-04 | Baidu Usa Llc | Systems and methods for attention-based configurable convolutional neural networks (abc-cnn) for visual question answering |
CN109242845A (zh) * | 2018-09-05 | 2019-01-18 | 北京市商汤科技开发有限公司 | 医疗影像处理方法及装置、电子设备及存储介质 |
CN109389129A (zh) * | 2018-09-15 | 2019-02-26 | 北京市商汤科技开发有限公司 | 一种图像处理方法、电子设备及存储介质 |
CN109829429A (zh) * | 2019-01-31 | 2019-05-31 | 福州大学 | 基于YOLOv3的监控场景下的安防敏感物品检测方法 |
CN110298361A (zh) * | 2019-05-22 | 2019-10-01 | 浙江省北大信息技术高等研究院 | 一种rgb-d图像的语义分割方法和系统 |
CN110533045A (zh) * | 2019-07-31 | 2019-12-03 | 中国民航大学 | 一种结合注意力机制的行李x光违禁品图像语义分割方法 |
GB2586858A (en) * | 2019-09-06 | 2021-03-10 | Smiths Heimann Sas | Image retrieval system |
Non-Patent Citations (2)
Title |
---|
FISHER YU: "Deep layer aggregation" * |
向杰;卜巍;邬向前;: "基于深度学习的手分割算法研究" * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112102244A (zh) * | 2020-08-17 | 2020-12-18 | 湖南大学 | 胎儿超声标准切面图像检测方法、计算机设备和存储介质 |
CN111709951A (zh) * | 2020-08-20 | 2020-09-25 | 成都数之联科技有限公司 | 目标检测网络训练方法及系统及网络及装置及介质 |
CN111709951B (zh) * | 2020-08-20 | 2020-11-13 | 成都数之联科技有限公司 | 目标检测网络训练方法及系统及网络及装置及介质 |
CN112508848A (zh) * | 2020-11-06 | 2021-03-16 | 上海亨临光电科技有限公司 | 一种基于深度学习多任务端到端的遥感图像船舶旋转目标检测方法 |
CN112508848B (zh) * | 2020-11-06 | 2024-03-26 | 上海亨临光电科技有限公司 | 一种基于深度学习多任务端到端的遥感图像船舶旋转目标检测方法 |
CN112633156A (zh) * | 2020-12-22 | 2021-04-09 | 浙江大华技术股份有限公司 | 车辆检测方法、图像处理装置以及计算机可读存储介质 |
CN112633156B (zh) * | 2020-12-22 | 2024-05-31 | 浙江大华技术股份有限公司 | 车辆检测方法、图像处理装置以及计算机可读存储介质 |
CN112967264A (zh) * | 2021-03-19 | 2021-06-15 | 深圳市商汤科技有限公司 | 缺陷检测方法及装置、电子设备和存储介质 |
CN113673557A (zh) * | 2021-07-12 | 2021-11-19 | 浙江大华技术股份有限公司 | 特征处理方法、动作定位方法及相关设备 |
Also Published As
Publication number | Publication date |
---|---|
CN111160140B (zh) | 2023-04-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111160140B (zh) | 一种图像检测方法及装置 | |
CN110738207B (zh) | 一种融合文字图像中文字区域边缘信息的文字检测方法 | |
CN110598788B (zh) | 目标检测方法、装置、电子设备及存储介质 | |
US20150279048A1 (en) | Method for generating a hierarchical structured pattern based descriptor and method and device for recognizing object using the same | |
CN111640089A (zh) | 一种基于特征图中心点的缺陷检测方法及装置 | |
CN111274981B (zh) | 目标检测网络构建方法及装置、目标检测方法 | |
CN110428414A (zh) | 一种识别图像中票据数量的方法及装置 | |
Zhang et al. | Fine localization and distortion resistant detection of multi-class barcode in complex environments | |
CN109344824A (zh) | 一种文本行区域检测方法、装置、介质和电子设备 | |
KR102576157B1 (ko) | 인공 신경망을 이용한 고속 객체 검출 방법 및 장치 | |
US9710703B1 (en) | Method and apparatus for detecting texts included in a specific image | |
CN114494823A (zh) | 零售场景下的商品识别检测计数方法及系统 | |
CN113723352A (zh) | 一种文本检测方法、系统、存储介质及电子设备 | |
CN111738069A (zh) | 人脸检测方法、装置、电子设备及存储介质 | |
CN111062385A (zh) | 一种用于图像文本信息检测的网络模型构建方法与系统 | |
Eilertsen et al. | BriefMatch: Dense binary feature matching for real-time optical flow estimation | |
CN116310688A (zh) | 基于级联融合的目标检测模型及其构建方法、装置及应用 | |
CN109815975A (zh) | 一种基于机器人的目标分类方法及相关装置 | |
CN113936288A (zh) | 倾斜文本方向分类方法、装置、终端设备和可读存储介质 | |
Pototzky et al. | Self-supervised learning for object detection in autonomous driving | |
Dong et al. | SiameseDenseU‐Net‐based Semantic Segmentation of Urban Remote Sensing Images | |
CN112733741A (zh) | 交通标识牌识别方法、装置和电子设备 | |
US9740947B2 (en) | Hardware architecture for linear-time extraction of maximally stable extremal regions (MSERs) | |
Gao et al. | Spatial Cross-Attention RGB-D Fusion Module for Object Detection | |
CN116958981B (zh) | 一种文字识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |