CN111582177A - 一种图像检测方法和相关装置 - Google Patents
一种图像检测方法和相关装置 Download PDFInfo
- Publication number
- CN111582177A CN111582177A CN202010387234.1A CN202010387234A CN111582177A CN 111582177 A CN111582177 A CN 111582177A CN 202010387234 A CN202010387234 A CN 202010387234A CN 111582177 A CN111582177 A CN 111582177A
- Authority
- CN
- China
- Prior art keywords
- image
- area
- complete
- image area
- visual
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 65
- 230000000007 visual effect Effects 0.000 claims abstract description 109
- 238000000034 method Methods 0.000 claims abstract description 43
- 230000001629 suppression Effects 0.000 claims abstract description 16
- 238000000605 extraction Methods 0.000 claims description 25
- 238000012549 training Methods 0.000 claims description 20
- 238000012545 processing Methods 0.000 claims description 7
- 238000002372 labelling Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 5
- 230000005764 inhibitory process Effects 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 13
- 238000004364 calculation method Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 210000000746 body region Anatomy 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000001373 regressive effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本申请实施例公开了一种图像检测方法和相关装置,该方法包括:获取待检测图像,该待检测图像中包括至少一个对象。根据待检测图像,检测对象的可视图像区域和对应的完整图像区域。其中,可视图像区域为部分可视区域或完整可视区域,完整图像区域包括对象的完整可视区域和完整不可视区域。对所述可视图像区域进行非极大值抑制,确定目标可视图像区域。根据所述目标可视图像区域,确定对应的完整图像区域为所述对象的目标完整图像区域。该方法中,通过对可视图像区域进行非极大值抑制,以过滤针对同一对象的重复的可视图像区域,从而根据未被排除的可视图像区域确定对象对应的完整图像区域,提高了确定对象的完整图像区域的准确率。
Description
技术领域
本申请涉及图像处理领域,特别是涉及一种图像检测方法和相关装置。
背景技术
在通过视频或图像进行对象跟踪如人体跟踪中,通常需要从图像中提取出人体的完整图像区域,该完整图像区域包括了人体的完整可视区域和完整不可视区域,该完整不可视区域如为被遮挡的图像区域等。其中,该完整图像区域即为全体框内的图像区域。如此,可以通过检测人体框的方式检测完整图像区域。
目前,在进行全体框的检测过程中,通常会出现检测出同一人的多个全体框的情形,导致全体框的检测不准确。可见,提高全体框的检测准确率是目前亟需解决的问题。
发明内容
为了解决上述技术问题,本申请提供了一种图像检测方法和相关装置,提高了确定对象的完整图像区域的准确率。
本申请实施例公开了如下技术方案:
一方面,本申请实施例提供了一种图像检测方法,所述方法包括:
获取待检测图像,所述待检测图像中包括至少一个对象;
根据所述待检测图像,检测所述对象的可视图像区域和对应的完整图像区域,所述可视图像区域为部分可视区域或完整可视区域,所述完整图像区域包括对象的完整可视区域和完整不可视区域;
对所述可视图像区域进行非极大值抑制,确定目标可视图像区域;
根据所述目标可视图像区域,确定对应的完整图像区域为所述对象的目标完整图像区域。
另一方面,本申请实施例提供了一种图像检测装置,所述装置包括:
获取单元,用于获取待检测图像,所述待检测图像中包括至少一个对象;
检测单元,用于根据所述待检测图像,检测所述对象的可视图像区域和对应的完整图像区域,所述可视图像区域为部分可视区域或完整可视区域,所述完整图像区域包括对象的完整可视区域和完整不可视区域;
确定单元,用于对所述可视图像区域进行非极大值抑制,确定目标可视图像区域;
所述确定单元,还用于根据所述目标可视图像区域,确定对应的完整图像区域为所述对象的目标完整图像区域。
另一方面,本申请实施例提供了一种设备,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行上述方法。
另一方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行上述方法。
由上述技术方案可以看出,获取待检测图像,该待检测图像中包括至少一个对象。根据待检测图像,检测对象的可视图像区域和对应的完整图像区域。其中,可视图像区域为部分可视区域或完整可视区域,完整图像区域包括对象的完整可视区域和完整不可视区域。对所述可视图像区域进行非极大值抑制,确定目标可视图像区域。根据所述目标可视图像区域,确定对应的完整图像区域为所述对象的目标完整图像区域。该方法中,通过对可视图像区域进行非极大值抑制,以过滤针对同一对象的重复的可视图像区域,从而根据未被排除的可视图像区域确定对象对应的完整图像区域,提高了确定对象的完整图像区域的准确率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种图像检测方法流程图;
图2为本申请实施例提供的一种图像示意图;
图3为本申请实施例提供的一种图像区域间重叠的示意图;
图4为本申请实施例提供的一种确定目标完整图像区域的场景示意图;
图5为本申请实施例提供的一种模型训练的场景示意图;
图6a为本申请实施例提供的一种检测模型示意图;
图6b为本申请实施例提供的另一种检测模型示意图;
图6c为本申请实施例提供的再一种检测模型示意图;
图7为本申请实施例提供的一种图像检测装置示意图。
具体实施方式
下面结合附图,对本申请的实施例进行描述。
目前,在进行全体框的检测过程中,通常会出现检测出同一人的多个全体框的情形,可视,提高全体框的检测准确率是目前亟需解决的问题。
为此,本申请实施例提供了一种图像检测方法,通过对检测出的可视图像区域进行非极大值抑制,以过滤针对同一对象的重复的可视图像区域,从而根据未被排除的可视图像区域确定对象对应的完整图像区域,提高了确定对象的完整图像区域的准确率。
首先,对本申请实施例所提供方法的执行主体进行介绍,该图像检测方法可以由图像处理设备来执行,该图像处理设备可以是终端设备或服务器。
接下来,对本申请实施例提供的图像检测方法进行介绍,参见图1,该图示出了本申请实施例提供的一种图像检测方法流程图,如图1所示,所述方法包括:
S101:获取待检测图像。
其中,待检测图像中包括至少一个对象。本申请实施例不限定该对象的类型,如可以是人体、动物、物品等。
接下来以对象为人体为例进行说明。
本申请实施例不限定该待检测图像的来源,该待检测图像可以是任意一张图像或者是视频中的一帧图像。
S102:根据所述待检测图像,检测所述对象的可视图像区域和对应的完整图像区域。
其中,上述中的可视图像区域可以是完整可视区域或部分可视区域。该完整可视区域为图像中针对该对象的全部可视区域,部分可视区域可以是完整可视区域中的一部分图像。在一种可能的实现方式中,所述可视图像区域对应于对象的任意一个或多个部位。如该可视图像区域为人头部的图像区域。
该完整图像区域可以包括对象的完整可视区域和完整不可视区域。也就是说,该完整图像区域对应于对象整体,无论该对象在图像中是否完全可视,所确定的完整图像区域包括了该对象整体。
例如,参见图2,该图示出了本申请实施例提供的一种图像示意图,如图2所示,在该图像中,对象即人体由一个帘子201遮挡,如此,该对象的完整可视区域为可视框202内的图像区域,该对象的完整图像区域为全体框203内的图像区域。该可视框可以是指图像中针对对象的可视区域的矩阵框,全体框可以是指图像中针对对象的包括完整的可视区域和不可视区域的矩形框。
接下来以可视图像区域为完整可视区域为例进行说明。
S103:对所述可视图像区域进行非极大值抑制,确定目标可视图像区域。
其中,非极大值抑制(Non-Maximum Suppression,NMS)可以是指抑制不是极大值的元素,可以理解为局部最大搜索。也就是说,针对图像中对象确定的可视图像区域,可以通过非极大值抑制的方式来删除针对同一对象的多余的可视图像区域。
本申请实施例不限定对可视图像区域进行非极大值抑制的方式,在一种可能的实现方式中,该S103对所述可视图像区域进行非极大值抑制,确定目标可视图像区域的方法,可以包括:
S201:当任意两个可视图像区域间的面积重叠率达到预设阈值时,将所述两个可视图像区域中对象分数低的可视图像区域删除,直至所述可视图像区域中不存在面积重叠率达到所述预设阈值的两个可视图像区域。
在本申请实施例中,在从图像中检测得到的每一个可视图像区域和对应的完整图像区域,均具有一个对象分数,该对象分数体现出该可视图像区域和对应的完整图像区域可能为对象(而不是背景)的分数。
在本申请实施例中,可以预先设置有预设阈值,该预设阈值可以用于区分两个可视图像区域间的面积重叠率的高低。
当从图像中检测到的两个可视图像区域间的面积重叠率达到预设阈值时,可以确定这两个可视图像区域很有可能是对应于同一个对象的可视图像区域。由此,可以根据这两个可视图像区域对应的对象分数,将对象分数低即为对象的可能性低的可视图像区域删除,直至图像中的这些可视图像区域中不存在面积重叠率达到预设阈值的两个可视图像区域。
其中,对于两个图像区域间的面积重叠流程的计算方式如下:
如图3所示,该图示出了本申请实施例提供的一种图像区域间重叠的示意图,如图3所示,图像区域1与图像区域2间的面积重叠率=(图像区域1的面积∩图像区域2的面积)/(图像区域1的面积∪图像区域2的面积)。其中,图像区域1的面积∩图像区域2的面积即图3中阴影面积。
S202:确定未被删除的可视图像区域为目标可视图像区域。
也就是说,未被删除的可视图像区域成为一个对象的可能性更高,且这些可视图像区域间属于同一个对象的可能性较低,由此,将这些未被删除的可视图像区域确定为目标可视图像区域,即更有可能对应于对象的可视图像区域。
接下来介绍一种对可视图像区域进行非极大值抑制的方式。
在本申请实施例中,可以按照每个可视图像区域的对象分数,对可视图像区域由高至低进行排序。对于其中的任意两个相邻的可视图像区域,若它们之间的面积重叠率达到预设阈值时,将它们之间对象分数低的可视图像区域删除,直至该可视图像区域的序列中不存在两个可视图像区域间的面积重叠率达到预设阈值,将该剩余的可视图像区域确定为目标可视图像区域。
S104:根据所述目标可视图像区域,确定对应的完整图像区域为所述对象的目标完整图像区域。
也就是说,对可视图像区域进行非极大值抑制后,确定的目标可视图像区域有较大可能为对应的对象,由此将这些目标可视图像区域对应的完整图像区域确定为目标完整图像区域,即为图像中对象确定的完整图像区域。
例如,参见图4,该图示出了本申请实施例提供的一种确定目标完整图像区域的场景示意图,如图4所示,假设从图像中检测出5个可视图像区域(对应于可视框)和对应的完整图像区域(对应于全体框),在通过S103对可视图像区域进行非极大值抑制后,删除其中的冗余的第2个可视图像区域和第4个可视图像区域,即确定第1、3、5个可视图像区域为目标可视图像区域,从而,将第1、3、5个可视图像区域对应的完整图像区域确定为目标完整图像区域。
由上述技术方案可以看出,获取待检测图像,该待检测图像中包括至少一个对象。根据待检测图像,检测对象的可视图像区域和对应的完整图像区域。其中,可视图像区域为部分可视区域或完整可视区域,完整图像区域包括对象的完整可视区域和完整不可视区域。对所述可视图像区域进行非极大值抑制,确定目标可视图像区域。根据所述目标可视图像区域,确定对应的完整图像区域为所述对象的目标完整图像区域。该方法中,通过对可视图像区域进行非极大值抑制,以过滤针对同一对象的重复的可视图像区域,从而根据未被排除的可视图像区域确定对象对应的完整图像区域,提高了确定对象的完整图像区域的准确率,进而提高了完整图像区域的召回率。
在本申请实施例中,上述S102中根据所述待检测图像,检测所述对象的可视图像区域和对应的完整图像区域的方法,可以包括:
根据所述待检测图像,通过检测模型检测对象的可视部位区域和对应的完整图像区域。
其中,该检测模型可以是通过检测样本训练得到的,该检测样本包括多张训练图像和训练图像中对象对应的标签,该标签包括可视部位区域和完整图像区域分别对应的标注坐标以及分类标注分数,检测模型对应的损失函数包括分类损失和回归坐标损失。
在本申请实施例中,参见图5,该图示出了本申请实施例提供的一种模型训练的场景示意图,如图5所示,对于训练图像中对象对应的标签,其中对于可视图像区域(对应可视框)的标注坐标为(xvl g,yvt g)和(xvr g,yvb g)(分别为可视框的左上角和右下角坐标),完整图像区域(对应全体框)的标注坐标为(xfl g,yft g)和(xfr g,yfb g)(分别为全体框的左上角和右下角坐标)。
在具体实现中,可以通过实例分割网络来生成检测样本。其中,可以通过实例分割网络来检测到训练图像中的可视图像区域(对应于可视框),进而得到可视图像区域对应的标注坐标。
其中,在图像中会根据预设规则划分出多个锚点框,对于可视框和全体框,它们会与一个锚点框间的重叠率最高,可以将这样的锚点框记为目标锚点框。假设该目标锚点框的坐标为(xvl p,yvt p)和(xvr p,yvb p)(分别为目标锚点框的左上角和右下角坐标),目标锚点框的宽和高分别为Pw和Ph。
假设检测模型在训练过程中输出的可视部位区域(对应可视框)的标注坐标为(xvl g’,yvt g’)和(xvr g’,yvb g’)(分别为可视框的左上角和右下角坐标),完整图像区域(对应全体框)的标注坐标为(xfl g’,yft g’)和(xfr g’,yfb g’)(分别为可视框的左上角和右下角坐标)。
则,检测模型对应的损失函数为L=Lcls(c,c*)+λlocLloc(t,t*)。
其中,λloc可以是指权重,Lcls(c,c*)可以是指分类损失,c可以是指检测模型训练过程中的分类分数,分类分数包括对象分数和背景分数,对象分数和背景分数的和可以为1。该c*可以是针对可视框和全体框的分类标注分数,分类标注分数也包括对象分数和背景分数,对象分数和背景分数的和可以为1。
该Lloc(t,t*)可以是指回归坐标损失。其中,t可以是根据Δxvl、Δyvt、Δxvr、Δyvb、Δxfl、Δyft、Δxfr和Δyfb得到的,该Δxvl、Δyvt、Δxvr、Δyvb、Δxfl、Δyft、Δxfr和Δyfb可以是检测模型在根据训练图像训练时基于对应的锚点框归回输出的数值。t*可以是根据Δ*xvl、Δ*yvt、Δ*xvr、Δ*yvb、Δ*xfl、Δ*yft、Δ*xfr和Δ*yfb得到的,Δ*xvl、Δ*yvt、Δ*xvr、Δ*yvb、Δ*xfl、Δ*yft、Δ*xfr和Δ*yfb的计算方式如下:
本申请实施例不限定该检测模型的架构,在一种可能的实现方式中,参见图6a,该图示出了本申请实施例提供的一种检测模型示意图,如图6a所示,该检测模型包括骨干网络、区域提取网络和区域回归网络,骨干网络用于检测待检测图像对应的图像特征,区域提取网络用于根据图像特征,检测对象的可视图像区域,区域回归网络用于根据可视图像区域对应的子图像特征进行回归,确定可视图像区域对应的完整图像区域。其中,该图像特征可以为待检测图像对应的特征表示,该可视图像区域的子图像特征可以用于体现该可视图像区域对应的特征表示。
下面对该图6a对应的检测模型的训练方式进行介绍。
其中,可以输入检测样本中的训练图像,骨干网络(如resnet网络或特征金字塔网络等)提取训练图像对应的图像特征。然后,区域提取网络(如两层卷积网络)可以提取人体区域即可视框,其中,可以提取出可视框的左上角和右下角的坐标。其中,可以根据该区域提取网络输出的可视框(即左上角和右下角坐标)与标注的可视部位区域即可视框的标注坐标进行损失计算,并反传网络。
然后,可以根据输出的可视框与目标锚点框间的面积重叠率是否大于人体阈值(可以通过图3对应的方式计算),确定输出的可视化框属于人体即对象还是属于背景,当属于背景时,不再输入至区域回归网络进行回归。当属于人体时,可以根据该输出的可视框的坐标根据骨干网络得到的图像特征中提取出该模型输出的可视框对应的子图像特征,即特征提取与对齐的过程。
最后,可以将该子图像特征传入区域回归网络(如三层卷积网络),从而同时输出可视框和全体框,并根据模型输出的可视框和全体框的坐标与标注坐标进行损失计算(通过图5对应的方法计算),并反传整个检测模型,让网络自动学习,直到收敛。
从而,可以通过该完成训练的检测模型进行图像检测。其中,可以将待检测图像输入至骨干网络中提取图像特征。然后,将图像特征输入至区域提取网络,以提取可视框对应的左上角坐标和右下角坐标,并选取对象分数最高的可视框。然后,确定该对象分数最高的可视框对应的子图像特征,将该子图像特征输入至区域回归网络,以输出每个可视框和对应的全体框。
相比于通过完整图像区域来回归得到目标完整图像区域,本申请中通过对可视图像区域来回归目标完整图像区域,由于相比完整图像区域,可视图像区域中仅包括针对对象的特征,而不包括其余背景的特征,由此不会对目标完整图像区域的回归造成影响,进而提高了目标完整图像区域的检测准确率。
在一种可能的实现方式中,参见图6b,该图示出了本申请实施例提供的另一种检测模型示意图,如图6b所示,该检测模型可以包括骨干网络和区域提取网络,其中,该骨干网络可以用于检测待检测图像对应的图像特征,区域提取网络用于根据所述图像特征,检测所述对象的可视图像区域和对应的完整图像区域。
其中,可以输入检测样本中的训练图像,骨干网络提取训练图像对应的图像特征。然后,区域提取网络(如两层卷积网络)可以提取人体区域即可视框以及全体框,其中,可以提取出可视框和全体框的左上角和右下角的坐标。然后,可以根据模型输出的可视框和全体框的坐标与标注坐标进行损失计算(通过图5对应的方法计算),并反传整个检测模型,让网络自动学习,直到收敛。
在实际场景中,在检测待检测图像中的完整图像区域时,还通常需要检测待检测图中对象的部位图像区域,该部位图像区域用于体现任意一种或多种对象部位,例如部位图像区域为人头部区域。如此,上述S104中根据所述待检测图像,检测所述对象的可视图像区域和对应的完整图像区域的方法,还可以包括:
根据所述待检测图像,检测所述对象的部位图像区域、可视图像区域和对应的完整图像区域,所述部位图像区域用于体现对象的任意一个或多个部位。
如此,对于上述图6a所示的检测模型,其中的区域提取网络可以用于根据图像特征,检测所述对象的部位图像区域和可视图像区域。
其中的区域回归网络可以用于根据可视图像区域对应的子图像特征进行回归,确定可视图像区域对应的完整图像区域,以及用于根据部位图像区域对应的子图像特征进行回归,得到部位图像区域对应的目标部位区域。该目标部位区域可以是对部位图像区域进行回归后得到的更为精确的图像区域。
例如,假设需要检测对象的头部图像区域,参见图6c,该图示出了本申请实施例提供的再一种检测模型示意图,如图6c所示,区域提取网络可以根据图像特征,检测对象的头部图像区域和可视图像区域。然后,区域回归网络可以根据可视图像区域对应的子图像特征进行回归,确定可视图像区域对应的完整图像区域。另外,还可以根据头部图像区域对应的子图像特征进行回归,得到头部图像区域对应的目标头部区域。
以及,对于图6b对应的检测模型,其中的区域提取网络还可以用于根据图像特征,检测对象的部位图像区域、可视图像区域和对应的完整图像区域。
可见,本申请实施例提供的区域提取网络具有良好的拓展功能,实现同步检测出待检测图像中对象的多种类型图像区域。
在具体实现中,在从待检测图像中检测出对象的部位图像区域、可视图像区域和完整图像区域后,可以通过贪心匹配算法来对这些图像区域进行匹配。
本申请实施例提供了一种图像检测装置,参见图7,该图示出了本申请实施例提供的一种图像检测装置示意图,如图7所示,所述装置包括:
获取单元701,用于获取待检测图像,所述待检测图像中包括至少一个对象;
检测单元702,用于根据所述待检测图像,检测所述对象的可视图像区域和对应的完整图像区域,所述可视图像区域为部分可视区域或完整可视区域,所述完整图像区域包括对象的完整可视区域和完整不可视区域;
确定单元703,用于对所述可视图像区域进行非极大值抑制,确定目标可视图像区域;
所述确定单元703,还用于根据所述目标可视图像区域,确定对应的完整图像区域为所述对象的目标完整图像区域。
在一种可能的实现方式中,所述确定单元703,具体用于:
当任意两个可视图像区域间的面积重叠率达到预设阈值时,将所述两个可视图像区域中对象分数低的可视图像区域删除,直至所述可视图像区域中不存在面积重叠率达到所述预设阈值的两个可视图像区域;
确定未被删除的所述可视图像区域为目标可视图像区域。
在一种可能的实现方式中,所述检测单元702,具体用于:
根据所述待检测图像,通过检测模型检测对象的可视部位区域和对应的完整图像区域;
其中,所述检测模型是通过检测样本训练得到的,所述检测样本包括多张训练图像和所述训练图像中对象对应的标签,所述标签包括可视部位区域和完整图像区域分别对应的标注坐标以及分类标注分数,所述检测模型对应的损失函数包括分类损失和回归坐标损失。
在一种可能的实现方式中,所述检测模型包括骨干网络和区域提取网络,所述骨干网络用于检测所述待检测图像对应的图像特征,所述区域提取网络用于根据所述图像特征,检测所述对象的可视图像区域和对应的完整图像区域。
在一种可能的实现方式中,所述检测模型包括骨干网络、区域提取网络和区域回归网络,所述骨干网络用于检测所述待检测图像对应的图像特征,所述区域提取网络用于根据所述图像特征,检测所述对象的可视图像区域,所述区域回归网络用于根据所述可视图像区域对应的子图像特征进行回归,确定所述可视图像区域对应的完整图像区域。
在一种可能的实现方式中,所述检测单元702,具体用于:
根据所述待检测图像,检测所述对象的部位图像区域、可视图像区域和对应的完整图像区域,所述部位图像区域用于体现对象的任意一个或多个部位;
所述区域提取网络用于根据所述图像特征,检测所述对象的部位图像区域、可视图像区域和对应的完整图像区域。
在一种可能的实现方式中,所述检测单元702,具体用于:
根据所述待检测图像,检测所述对象的部位图像区域、可视图像区域和对应的完整图像区域,所述部位图像区域用于体现对象的任意一个或多个部位;
所述区域提取网络用于根据所述图像特征,检测所述对象的部位图像区域和可视图像区域;
所述区域回归网络用于根据所述可视图像区域对应的子图像特征进行回归,确定所述可视图像区域对应的完整图像区域,以及用于根据所述部位图像区域对应的子图像特征进行回归,得到所述部位图像区域对应的目标部位区域。
在一种可能的实现方式中,所述可视图像区域对应于对象的任意一个或多个部位。
由上述技术方案可以看出,获取待检测图像,该待检测图像中包括至少一个对象。根据待检测图像,检测对象的可视图像区域和对应的完整图像区域。其中,可视图像区域为部分可视区域或完整可视区域,完整图像区域包括对象的完整可视区域和完整不可视区域。对所述可视图像区域进行非极大值抑制,确定目标可视图像区域。根据所述目标可视图像区域,确定对应的完整图像区域为所述对象的目标完整图像区域。该方法中,通过对可视图像区域进行非极大值抑制,以过滤针对同一对象的重复的可视图像区域,从而根据未被排除的可视图像区域确定对象对应的完整图像区域,提高了确定对象的完整图像区域的准确率。
本申请实施例提供了一种设备,可以是执行该身份识别方法的数据处理设备,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行上述方法。
本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行上述方法。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到上述实施例方法中的全部或部分步骤可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者诸如媒体网关等网络通信设备,等等)执行本申请各个实施例或者实施例的某些部分所述的方法。
需要说明的是,本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种图像检测方法,其特征在于,所述方法包括:
获取待检测图像,所述待检测图像中包括至少一个对象;
根据所述待检测图像,检测所述对象的可视图像区域和对应的完整图像区域,所述可视图像区域为部分可视区域或完整可视区域,所述完整图像区域包括对象的完整可视区域和完整不可视区域;
对所述可视图像区域进行非极大值抑制,确定目标可视图像区域;
根据所述目标可视图像区域,确定对应的完整图像区域为所述对象的目标完整图像区域。
2.根据权利要求1所述的方法,其特征在于,所述对所述可视图像区域进行非极大值抑制,确定目标可视图像区域,包括:
当任意两个可视图像区域间的面积重叠率达到预设阈值时,将所述两个可视图像区域中对象分数低的可视图像区域删除,直至所述可视图像区域中不存在面积重叠率达到所述预设阈值的两个可视图像区域;
确定未被删除的所述可视图像区域为目标可视图像区域。
3.根据权利要求1所述的方法,其特征在于,所述根据所述待检测图像,检测所述对象的可视图像区域和对应的完整图像区域,包括:
根据所述待检测图像,通过检测模型检测所述对象的可视部位区域和对应的完整图像区域;
其中,所述检测模型是通过检测样本训练得到的,所述检测样本包括多张训练图像和所述训练图像中对象对应的标签,所述标签包括可视部位区域和完整图像区域分别对应的标注坐标以及分类标注分数,所述检测模型对应的损失函数包括分类损失和回归坐标损失。
4.根据权利要求3所述的方法,其特征在于,所述检测模型包括骨干网络和区域提取网络,所述骨干网络用于检测所述待检测图像对应的图像特征,所述区域提取网络用于根据所述图像特征,检测所述对象的可视图像区域和对应的完整图像区域。
5.根据权利要求3所述的方法,其特征在于,所述检测模型包括骨干网络、区域提取网络和区域回归网络,所述骨干网络用于检测所述待检测图像对应的图像特征,所述区域提取网络用于根据所述图像特征,检测所述对象的可视图像区域,所述区域回归网络用于根据所述可视图像区域对应的子图像特征进行回归,确定所述可视图像区域对应的完整图像区域。
6.根据权利要求4所述的方法,其特征在于,所述根据所述待检测图像,检测所述对象的可视图像区域和对应的完整图像区域,包括:
根据所述待检测图像,检测所述对象的部位图像区域、可视图像区域和对应的完整图像区域,所述部位图像区域用于体现对象的任意一个或多个部位;
所述区域提取网络用于根据所述图像特征,检测所述对象的部位图像区域、可视图像区域和对应的完整图像区域。
7.根据权利要求5所述的方法,其特征在于,所述根据所述待检测图像,检测所述对象的可视图像区域和对应的完整图像区域,包括:
根据所述待检测图像,检测所述对象的部位图像区域、可视图像区域和对应的完整图像区域,所述部位图像区域用于体现对象的任意一个或多个部位;
所述区域提取网络用于根据所述图像特征,检测所述对象的部位图像区域和可视图像区域;
所述区域回归网络用于根据所述可视图像区域对应的子图像特征进行回归,确定所述可视图像区域对应的完整图像区域,以及用于根据所述部位图像区域对应的子图像特征进行回归,得到所述部位图像区域对应的目标部位区域。
8.根据权利要求1-7任意一项所述的方法,其特征在于,所述可视图像区域对应于对象的任意一个或多个部位。
9.一种图像检测装置,其特征在于,所述装置包括:
获取单元,用于获取待检测图像,所述待检测图像中包括至少一个对象;
检测单元,用于根据所述待检测图像,检测所述对象的可视图像区域和对应的完整图像区域,所述可视图像区域为部分可视区域或完整可视区域,所述完整图像区域包括对象的完整可视区域和完整不可视区域;
确定单元,用于对所述可视图像区域进行非极大值抑制,确定目标可视图像区域;
所述确定单元,还用于根据所述目标可视图像区域,确定对应的完整图像区域为所述对象的目标完整图像区域。
10.一种设备,其特征在于,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行权利要求1-8任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010387234.1A CN111582177A (zh) | 2020-05-09 | 2020-05-09 | 一种图像检测方法和相关装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010387234.1A CN111582177A (zh) | 2020-05-09 | 2020-05-09 | 一种图像检测方法和相关装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111582177A true CN111582177A (zh) | 2020-08-25 |
Family
ID=72117291
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010387234.1A Pending CN111582177A (zh) | 2020-05-09 | 2020-05-09 | 一种图像检测方法和相关装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111582177A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112270286A (zh) * | 2020-11-09 | 2021-01-26 | 北京机电工程研究所 | 一种抗阴影干扰的单色视频目标跟踪方法 |
CN113379683A (zh) * | 2021-05-24 | 2021-09-10 | 北京迈格威科技有限公司 | 物体检测方法、装置、设备及介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170011523A1 (en) * | 2015-07-06 | 2017-01-12 | Canon Kabushiki Kaisha | Image processing apparatus, image processing method, and storage medium |
EP3493104A1 (en) * | 2017-12-03 | 2019-06-05 | Facebook, Inc. | Optimizations for dynamic object instance detection, segmentation, and structure mapping |
CN109948497A (zh) * | 2019-03-12 | 2019-06-28 | 北京旷视科技有限公司 | 一种物体检测方法、装置及电子设备 |
CN110298302A (zh) * | 2019-06-25 | 2019-10-01 | 腾讯科技(深圳)有限公司 | 一种人体目标检测方法及相关设备 |
CN110532985A (zh) * | 2019-09-02 | 2019-12-03 | 北京迈格威科技有限公司 | 目标检测方法、装置及系统 |
-
2020
- 2020-05-09 CN CN202010387234.1A patent/CN111582177A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170011523A1 (en) * | 2015-07-06 | 2017-01-12 | Canon Kabushiki Kaisha | Image processing apparatus, image processing method, and storage medium |
EP3493104A1 (en) * | 2017-12-03 | 2019-06-05 | Facebook, Inc. | Optimizations for dynamic object instance detection, segmentation, and structure mapping |
CN109948497A (zh) * | 2019-03-12 | 2019-06-28 | 北京旷视科技有限公司 | 一种物体检测方法、装置及电子设备 |
CN110298302A (zh) * | 2019-06-25 | 2019-10-01 | 腾讯科技(深圳)有限公司 | 一种人体目标检测方法及相关设备 |
CN110532985A (zh) * | 2019-09-02 | 2019-12-03 | 北京迈格威科技有限公司 | 目标检测方法、装置及系统 |
Non-Patent Citations (5)
Title |
---|
CHENG CHI 等: "Relational Learning for Joint Head and Human Detection", 《ARXIV》 * |
KEVIN ZHANG 等: "Double Anchor R-CNN for Human Detection in a Crowd", 《ARXIV》 * |
XIN HUANG 等: "NMS by Representative Region:Towards Crowded Pedestrian Detection by Proposal Pairing", 《ARXIV》 * |
ZHIDA HUANG 等: "Visible Feature Guidance for Crowd Pedestrian Detection", 《ARXIV》 * |
韦皓瀚等: "改进星型级联可形变部件模型的行人检测", 《中国图象图形学报》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112270286A (zh) * | 2020-11-09 | 2021-01-26 | 北京机电工程研究所 | 一种抗阴影干扰的单色视频目标跟踪方法 |
CN112270286B (zh) * | 2020-11-09 | 2024-05-10 | 北京机电工程研究所 | 一种抗阴影干扰的单色视频目标跟踪方法 |
CN113379683A (zh) * | 2021-05-24 | 2021-09-10 | 北京迈格威科技有限公司 | 物体检测方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109918987B (zh) | 一种视频字幕关键词识别方法及装置 | |
US8737740B2 (en) | Information processing apparatus, information processing method, and non-transitory computer-readable storage medium | |
US9311533B2 (en) | Device and method for detecting the presence of a logo in a picture | |
CN111144215B (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN108960211A (zh) | 一种多目标人体姿态检测方法以及系统 | |
CN108009466B (zh) | 行人检测方法和装置 | |
RU2697649C1 (ru) | Способы и системы сегментации документа | |
CN110674680B (zh) | 活体识别的方法、装置、存储介质 | |
US20200005075A1 (en) | Computer Vision Systems and Methods for Automatically Detecting, Classifying, and Pricing Objects Captured in Images or Videos | |
CN105260428A (zh) | 图片处理方法和装置 | |
CN111582177A (zh) | 一种图像检测方法和相关装置 | |
CN111275040A (zh) | 定位方法及装置、电子设备、计算机可读存储介质 | |
CN111652140A (zh) | 基于深度学习的题目精准分割方法、装置、设备和介质 | |
JP2011165170A (ja) | 対象物検出装置及びプログラム | |
CN110210467A (zh) | 一种文本图像的公式定位方法、图像处理装置、存储介质 | |
CN114419428A (zh) | 一种目标检测方法、目标检测装置和计算机可读存储介质 | |
CN109685079B (zh) | 一种特征图像类别信息的生成方法和装置 | |
US20230131717A1 (en) | Search processing device, search processing method, and computer program product | |
CN115223173A (zh) | 对象识别方法、装置、电子设备及存储介质 | |
CN115019152A (zh) | 一种图像拍摄完整度判定方法及装置 | |
CN115171155A (zh) | 一种基于形状相似度的人体姿态估计方法及系统 | |
CN111291756B (zh) | 图像中文本区域的检测方法、装置、计算机设备及计算机存储介质 | |
CN116958981B (zh) | 一种文字识别方法及装置 | |
JP6717769B2 (ja) | 情報処理装置及びプログラム | |
US12125074B2 (en) | Computer vision systems and methods for automatically detecting, classifying, and pricing objects captured in images or videos |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200825 |
|
RJ01 | Rejection of invention patent application after publication |