CN108875574B - 行人检测误报结果的检测方法、装置、系统和存储介质 - Google Patents
行人检测误报结果的检测方法、装置、系统和存储介质 Download PDFInfo
- Publication number
- CN108875574B CN108875574B CN201810450115.9A CN201810450115A CN108875574B CN 108875574 B CN108875574 B CN 108875574B CN 201810450115 A CN201810450115 A CN 201810450115A CN 108875574 B CN108875574 B CN 108875574B
- Authority
- CN
- China
- Prior art keywords
- convolution
- layer
- pedestrian
- channel
- detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Traffic Control Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种行人检测误报结果的检测方法、装置、系统和存储介质,所述方法包括:获取针对待处理数据进行行人检测后得到的行人检测结果;以及利用训练好的行人误报判断网络检测所述行人检测结果是否是误报结果,所述行人误报判断网络包括依次连接的卷积层、最大池化层、至少一个卷积块单元、全局池化层以及输出层。根据本发明实施例的行人检测误报结果的检测方法、装置、系统和存储介质利用具有特定网络结构的行人误报判断网络来实施行人检测结果的误报检测,能够大大提升行人误报检测的精度且不会大幅度增加计算量,从而能够大大提升行人检测应用产品的可使用性。
Description
技术领域
本发明涉及行人检测技术领域,更具体地涉及一种行人检测误报结果的检测方法、装置、系统和存储介质。
背景技术
行人检测是当今非常流行的热门领域,但由于现有技术的缺陷,常常出现误报(即把非人的图像区域识别成了人)的情形。为了保障应用系统的视觉效果,人们往往需要设计一个误报剔除器,来精炼行人检测的结果。现有的误报剔除器相当简单,仅仅利用了几层神经网络来筛选检测结果,精度往往不尽如人意,这也使得行人检测系统难以大面积推广使用。
发明内容
本发明提出了一种关于行人检测误报结果的检测方案,其利用具有特定网络结构的行人误报判断网络来实施行人检测结果的误报检测,能够大大提升行人误报检测的精度。下面简要描述本发明提出的关于行人检测误报结果的检测方案,更多细节将在后续结合附图在具体实施方式中加以描述。
根据本发明一方面,提供了一种行人检测误报结果的检测方法,所述方法包括:获取针对待处理数据进行行人检测后得到的行人检测结果;以及利用训练好的行人误报判断网络检测所述行人检测结果是否是误报结果,所述行人误报判断网络包括依次连接的卷积层、最大池化层、至少一个卷积块单元、全局池化层以及输出层。
在一个实施例中,所述行人误报判断网络还包括提供注意力机制的注意力模块,所述注意力模块包括在所述卷积块单元的至少一个中。
在一个实施例中,所述行人误报判断网络包括三个依次连接的所述卷积块单元,分别为第一卷积块单元、第二卷积块单元和第三卷积块单元,所述第二卷积块单元和所述第三卷积块单元均包括所述注意力模块。
在一个实施例中,所述至少一个卷积块单元中的每个卷积块单元包括至少一个卷积块,每个卷积块包括逐通道卷积层、跨通道卷积层和批规范化层。
在一个实施例中,所述注意力模块包括在每个所述卷积块中,且所述注意力模块位于所述逐通道卷积层和所述跨通道卷积层之间。
在一个实施例中,所述注意力模块包括依次连接的至少一个卷积层、归一化层以及融合层,所述融合层将输入所述注意力模块的特征图与所述归一化层输出的特征图进行融合操作。
在一个实施例中,所述融合操作包括将输入所述注意力模块的特征图与所述归一化层输出的特征图进行点乘操作。
在一个实施例中,所述每个卷积块单元包括三个所述卷积块。
在一个实施例中,所述逐通道卷积层为卷积核是3×3的卷积层,所述跨通道卷积层为卷积核是1×1的卷积层。
在一个实施例中,所述注意力模块包括两个卷积层,每个卷积层均为卷积核是3×3的卷积层。
根据本发明另一方面,提供了一种行人检测误报结果的检测装置,所述装置包括:获取模块,用于获取针对待处理数据进行行人检测后得到的行人检测结果;以及误报检测模块,用于利用训练好的行人误报判断网络检测所述获取模块获取的所述行人检测结果是否是误报结果,所述行人误报判断网络包括依次连接的卷积层、最大池化层、至少一个卷积块单元、全局池化层以及输出层。
在一个实施例中,所述误报检测模块利用的所述行人误报判断网络还包括提供注意力机制的注意力模块,所述注意力模块包括在所述卷积块单元的至少一个中。
在一个实施例中,所述误报检测模块利用的所述行人误报判断网络包括三个依次连接的所述卷积块单元,分别为第一卷积块单元、第二卷积块单元和第三卷积块单元,所述第二卷积块单元和所述第三卷积块单元均包括所述注意力模块。
在一个实施例中,所述至少一个卷积块单元中的每个卷积块单元包括至少一个卷积块,每个卷积块包括逐通道卷积层、跨通道卷积层和批规范化层。
在一个实施例中,所述注意力模块包括在每个所述卷积块中,且所述注意力模块位于所述逐通道卷积层和所述跨通道卷积层之间。
在一个实施例中,所述注意力模块包括依次连接的至少一个卷积层、归一化层以及融合层,所述融合层将输入所述注意力模块的特征图与所述归一化层输出的特征图进行融合操作。
在一个实施例中,所述融合操作包括将输入所述注意力模块的特征图与所述归一化层输出的特征图进行点乘操作。
在一个实施例中,所述每个卷积块单元包括三个所述卷积块。
在一个实施例中,所述逐通道卷积层为卷积核是3×3的卷积层,所述跨通道卷积层为卷积核是1×1的卷积层。
在一个实施例中,所述注意力模块包括两个卷积层,每个卷积层均为卷积核是3×3的卷积层。
根据本发明又一方面,提供了一种行人检测误报结果的检测系统,所述系统包括存储装置和处理器,所述存储装置上存储有由所述处理器运行的计算机程序,所述计算机程序在被所述处理器运行时执行上述任一项所述的行人检测误报结果的检测方法。
根据本发明再一方面,提供了一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序在运行时执行上述任一项所述的行人检测误报结果的检测方法。
根据本发明实施例的行人检测误报结果的检测方法、装置、系统和存储介质利用具有特定网络结构的行人误报判断网络来实施行人检测结果的误报检测,能够大大提升行人误报检测的精度且不会大幅度增加计算量,从而能够大大提升行人检测应用产品的可使用性。
附图说明
通过结合附图对本发明实施例进行更详细的描述,本发明的上述以及其它目的、特征和优势将变得更加明显。附图用来提供对本发明实施例的进一步理解,并且构成说明书的一部分,与本发明实施例一起用于解释本发明,并不构成对本发明的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1示出用于实现根据本发明实施例的行人检测误报结果的检测方法、装置、系统和存储介质的示例电子设备的示意性框图;
图2示出根据本发明实施例的行人检测误报结果的检测方法的示意性流程图;
图3示出根据本发明实施例的行人检测误报结果的检测方法所采用的行人误报判断网络的示例性结构示意图;
图4示出根据本发明实施例的行人检测误报结果的检测方法所采用的行人误报判断网络所包括的注意力模块的示例性结构示意图;
图5示出根据本发明实施例的行人检测误报结果的检测装置的示意性框图;以及
图6示出根据本发明实施例的行人检测误报结果的检测系统的示意性框图。
具体实施方式
为了使得本发明的目的、技术方案和优点更为明显,下面将参照附图详细描述根据本发明的示例实施例。显然,所描述的实施例仅仅是本发明的一部分实施例,而不是本发明的全部实施例,应理解,本发明不受这里描述的示例实施例的限制。基于本发明中描述的本发明实施例,本领域技术人员在没有付出创造性劳动的情况下所得到的所有其它实施例都应落入本发明的保护范围之内。
首先,参照图1来描述用于实现本发明实施例的行人检测误报结果的检测方法、装置、系统和存储介质的示例电子设备100。
如图1所示,电子设备100包括一个或多个处理器102、一个或多个存储装置104、输入装置106以及输出装置108,这些组件通过总线系统110和/或其它形式的连接机构(未示出)互连。应当注意,图1所示的电子设备100的组件和结构只是示例性的,而非限制性的,根据需要,所述电子设备也可以具有其他组件和结构。
所述处理器102可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元,并且可以控制所述电子设备100中的其它组件以执行期望的功能。
所述存储装置104可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器102可以运行所述程序指令,以实现下文所述的本发明实施例中(由处理器实现)的客户端功能以及/或者其它期望的功能。在所述计算机可读存储介质中还可以存储各种应用程序和各种数据,例如所述应用程序使用和/或产生的各种数据等。
所述输入装置106可以是用户用来输入指令的装置,并且可以包括键盘、鼠标、麦克风和触摸屏等中的一个或多个。
所述输出装置108可以向外部(例如用户)输出各种信息(例如图像或声音),并且可以包括显示器、扬声器等中的一个或多个。
示例性地,用于实现根据本发明实施例的行人检测误报结果的检测方法和装置的示例电子设备可以被实现诸如智能手机、平板电脑等等移动终端。
下面,将参考图2描述根据本发明实施例的行人检测误报结果的检测方法200。如图2所示,行人检测误报结果的检测方法200可以包括如下步骤:
在步骤S210,获取针对待处理数据进行行人检测后得到的行人检测结果。
在一个实施例中,待处理数据可以为需要进行行人检测的图片数据和/或视频数据。在一个示例中,待处理数据可以为实时采集的数据。在另一个示例中,待处理数据可以为来自任何源的数据。在一个示例中,可以获取针对待处理数据实时进行行人检测得到的行人检测结果。在另一个示例中,可以获取来自任何源的行人检测结果。
在步骤S220,利用训练好的行人误报判断网络检测所述行人检测结果是否是误报结果,所述行人误报判断网络包括依次连接的卷积层、最大池化层、至少一个卷积块单元、全局池化层以及输出层。
在本发明的实施例中,采用具有特定网络结构的行人误报判断网络来实施行人检测结果的误报检测,即判断行人检测结果是否表示行人。具体地,该行人误报判断网络可以包括依次连接的卷积层、最大池化层、至少一个卷积块单元、全局池化层以及输出层。在一个示例中,所述卷积层和所述最大池化层也可以合并为一层。
在一个示例中,至少一个卷积块单元中的每个卷积块单元可以包括至少一个卷积块。其中,每个卷积块可以包括依次连接的逐通道卷积层、跨通道卷积层和批规范化层(BN-ReLU)。逐通道卷积层是指对于包含多个通道的特征图,对应于每个通道都有一个卷积核。跨通道卷积层是指多个通道共享同一个卷积核,基于跨通道卷积层可以得到跨通道相关性。批规范化层为深度学习中的激活函数。
基于该行人误报判断网络,使得几乎每层输出的特征图的边长均可以减半,从而可以极大地节约计算量,加快使用速度。
示例性地,该行人误报判断网络可以包括三个依次连接的所述卷积块单元。示例性地,每个卷积块单元可以包括三个卷积块。示例性地,每个卷积块所包括的逐通道卷积层可以为卷积核是3×3的卷积层,每个卷积块所包括的跨通道卷积层为卷积核是1×1的卷积层。
下面参照图3描述根据本发明实施例的行人检测误报结果的检测方法所采用的行人误报判断网络的示例性结构示意图。如图3所示,行人误报判断网络可以包括依次连接的卷积层Conv-1,最大池化层Max-Pool,卷积块单元X-2、X-3和X-4(在图3中,将卷积块单元示出为3个,其仅为示例性的),全局池化层Global-Pool,以及输出层Softmax。
其中,卷积块单元X-2、X-3和X-4的结构可以参照图3右上方的块block的结构。每个block可以包括至少一个卷积块conv-block(在图3中,将block示出为包括3个卷积块conv-block,其仅是示例性的)。其中,每个卷积块conv-block可以参照图3最右上方的卷积块conv-block的结构。每个卷积块conv-block可以包括逐通道卷积层(在图3中示出为3×3-CConv,表示卷积核是3×3的逐通道卷积层,其仅是示例性的)、跨通道卷积层(在图3中示出为1×1-Conv,表示卷积核是1×1的跨通道卷积层,其仅是示例性的)和批规范化层(BN-ReLU)。其中,3×3-CConv是指对于包含多个通道的特征图,对应于每个通道都有一个3×3的卷积核。正如前面所述,逐通道卷积层是指对于包含多个通道的特征图,对应于每个通道都有一个卷积核。
基于训练好的上述行人误报判断网络,可针对行人检测结果输出更高精度的行人误报判断结果且不会大幅度增加计算量。
在进一步的实施例中,步骤S220所采用的行人误报判断网络还可以包括提供注意力机制的注意力模块,所述注意力模块包括在所述卷积块单元的至少一个中。单独的卷积操作可能难以根据数据的多样性本身来动态地调节特征图的信号响应强度,引入注意力机制可以解决该问题。在本发明的实施例中,采用逐像素点注意力机制,即针对特征图的每个像素点搭建注意力模块,从而可以进一步极大地提高行人误报检测的精度。
在一个示例中,步骤S220所采用的行人误报判断网络可以包括三个依次连接的所述卷积块单元,分别为第一卷积块单元(例如如图3所示的卷积块单元X-2)、第二卷积块单元(例如如图3所示的卷积块单元X-3)和第三卷积块单元(例如如图3所示的卷积块单元X-4),其中,所述注意力模块可以包括在所述第二卷积块单元(例如如图3所示的卷积块单元X-3)和所述第三卷积块单元(例如如图3所示的卷积块单元X-4)中,即所述第二卷积块单元和所述第三卷积块单元均可包括所述注意力模块。在其他示例中,所述注意力模块也可以包括在第一卷积块单元、第二卷积块单元和第三卷积块单元这三者的至少一个中。
在一个示例中,步骤S220所采用的行人误报判断网络的每个卷积块单元可以包括至少一个卷积块(例如包括三个卷积块,如图3所示的卷积块conv-block),每个卷积块包括逐通道卷积层(例如如图3所示的逐通道卷积层3×3-CConv)、跨通道卷积层(例如如图3所示的跨通道卷积层1×1-Conv)和批规范化层,其中,所述注意力模块包括在每个所述卷积块中,且所述注意力模块位于所述逐通道卷积层(例如如图3所示的逐通道卷积层3×3-CConv)和所述跨通道卷积层(例如如图3所示的跨通道卷积层1×1-Conv)之间。
在一个示例中,步骤S220所采用的行人误报判断网络所包括的注意力模块可以包括依次连接的至少一个卷积层、归一化层以及融合层,所述融合层将输入所述注意力模块的特征图与所述归一化层输出的特征图进行融合操作。示例性地,所述融合操作包括将输入所述注意力模块的特征图与所述归一化层输出的特征图进行点乘操作。示例性地,所述注意力模块可以包括两个卷积层,每个卷积层均为卷积核是3×3的卷积层。
下面参照图4描述根据本发明实施例的行人检测误报结果的检测方法所采用的行人误报判断网络所包括的注意力模块的示例性结构示意图。如图4所示,注意力模块可以包括依次连接的卷积层3×3Conv-1、卷积层3×3Conv-2(在图4中,将卷积层示出为2个,且卷积核均为3×3,其仅为示例性的)、归一化层Sigmoid以及融合层Multiply。其中,融合层Multiply将输入注意力模块的特征图与归一化层Sigmoid输出的特征图进行点乘操作。
基于该注意力模块的引入,使得行人误报判断网络输出的结构更为精确,能够极大地增强行人检测结果的筛选功能。
基于上面的描述,根据本发明实施例的行人检测误报结果的检测方法利用具有特定网络结构的行人误报判断网络来实施行人检测结果的误报检测,能够大大提升行人误报检测的精度且不会大幅度增加计算量,从而能够大大提升行人检测应用产品的可使用性。
以上示例性地描述了根据本发明实施例的行人检测误报结果的检测方法。示例性地,根据本发明实施例的行人检测误报结果的检测方法可以在具有存储器和处理器的设备、装置或者系统中实现。
此外,根据本发明实施例的行人检测误报结果的检测方法可以方便地部署到智能手机、平板电脑、个人计算机等移动设备上。替代地,根据本发明实施例的行人检测误报结果的检测方法还可以部署在服务器端(或云端)。替代地,根据本发明实施例的行人检测误报结果的检测方法还可以分布地部署在服务器端(或云端)和个人终端处。
下面结合图5描述本发明另一方面提供的行人检测误报结果的检测装置。图5示出了根据本发明实施例的行人检测误报结果的检测装置500的示意性框图。
如图5所示,根据本发明实施例的行人检测误报结果的检测装置500包括获取模块510和误报检测模块520。所述各个模块可分别执行上文中结合图2描述的行人检测误报结果的检测方法的各个步骤/功能。以下仅对行人检测误报结果的检测装置500的各模块的主要功能进行描述,而省略以上已经描述过的细节内容。
获取模块510用于获取针对待处理数据进行行人检测后得到的行人检测结果。误报检测模块520用于利用训练好的行人误报判断网络检测所述获取模块510获取的所述行人检测结果是否是误报结果,所述行人误报判断网络包括依次连接的卷积层、最大池化层、至少一个卷积块单元、全局池化层以及输出层。获取模块510和误报检测模块520均可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现。
在一个实施例中,待处理数据可以为需要进行行人检测的图片数据和/或视频数据。在一个示例中,待处理数据可以为实时采集的数据。在另一个示例中,待处理数据可以为来自任何源的数据。在一个示例中,获取模块510可以获取针对待处理数据实时进行行人检测得到的行人检测结果。在另一个示例中,获取模块510可以获取来自任何源的行人检测结果。
在本发明的实施例中,误报检测模块520采用具有特定网络结构的行人误报判断网络来实施行人检测结果的误报检测,即判断行人检测结果是否表示行人。具体地,该行人误报判断网络可以包括依次连接的卷积层、最大池化层、至少一个卷积块单元、全局池化层以及输出层。在一个示例中,所述卷积层和所述最大池化层也可以合并为一层。
在一个示例中,至少一个卷积块单元中的每个卷积块单元可以包括至少一个卷积块。其中,每个卷积块可以包括依次连接的逐通道卷积层、跨通道卷积层和批规范化层(BN-ReLU)。逐通道卷积层是指对于包含多个通道的特征图,对应于每个通道都有一个卷积核。跨通道卷积层是指多个通道共享同一个卷积核,基于跨通道卷积层可以得到跨通道相关性。批规范化层为深度学习中的激活函数。
基于该行人误报判断网络,使得几乎每层输出的特征图的边长均可以减半,从而可以极大地节约计算量,加快使用速度。
示例性地,该行人误报判断网络可以包括三个依次连接的所述卷积块单元。示例性地,每个卷积块单元可以包括三个卷积块。示例性地,每个卷积块所包括的逐通道卷积层可以为卷积核是3×3的卷积层,每个卷积块所包括的跨通道卷积层为卷积核是1×1的卷积层。可以参照图3结合关于图3的描述理解根据本发明实施例的行人检测误报结果的检测装置500的误报检测模块520所采用的行人误报判断网络的示例性结构示意图,为了简洁,此处不再赘述。
基于训练好的上述行人误报判断网络,误报检测模块520可针对行人检测结果输出更高精度的行人误报判断结果且不会大幅度增加计算量。
在进一步的实施例中,误报检测模块520所采用的行人误报判断网络还可以包括提供注意力机制的注意力模块,所述注意力模块包括在所述卷积块单元的至少一个中。单独的卷积操作可能难以根据数据的多样性本身来动态地调节特征图的信号响应强度,引入注意力机制可以解决该问题。在本发明的实施例中,采用逐像素点注意力机制,即针对特征图的每个像素点搭建注意力模块,从而可以进一步极大地提高行人误报检测的精度。
在一个示例中,误报检测模块520所采用的行人误报判断网络可以包括三个依次连接的所述卷积块单元,分别为第一卷积块单元(例如如图3所示的卷积块单元X-2)、第二卷积块单元(例如如图3所示的卷积块单元X-3)和第三卷积块单元(例如如图3所示的卷积块单元X-4),其中,所述注意力模块可以包括在所述第二卷积块单元(例如如图3所示的卷积块单元X-3)和所述第三卷积块单元(例如如图3所示的卷积块单元X-4)中,即所述第二卷积块单元和所述第三卷积块单元均可包括所述注意力模块。在其他示例中,所述注意力模块也可以包括在第一卷积块单元、第二卷积块单元和第三卷积块单元这三者的至少一个中。
在一个示例中,误报检测模块520所采用的行人误报判断网络的每个卷积块单元可以包括至少一个卷积块(例如包括三个卷积块,如图3所示的卷积块conv-block),每个卷积块包括逐通道卷积层(例如如图3所示的逐通道卷积层3×3-CConv)、跨通道卷积层(例如如图3所示的跨通道卷积层1×1-Conv)和批规范化层,其中,所述注意力模块包括在每个所述卷积块中,且所述注意力模块位于所述逐通道卷积层(例如如图3所示的逐通道卷积层3×3-CConv)和所述跨通道卷积层(例如如图3所示的跨通道卷积层1×1-Conv)之间。
在一个示例中,误报检测模块520所采用的行人误报判断网络所包括的注意力模块可以包括依次连接的至少一个卷积层、归一化层以及融合层,所述融合层将输入所述注意力模块的特征图与所述归一化层输出的特征图进行融合操作。示例性地,所述融合操作包括将输入所述注意力模块的特征图与所述归一化层输出的特征图进行点乘操作。示例性地,所述注意力模块可以包括两个卷积层,每个卷积层均为卷积核是3×3的卷积层。可以参照图4结合关于图4的描述理解根据本发明实施例的行人检测误报结果的检测装置500的误报检测模块520所采用的行人误报判断网络所包括的注意力模块的示例性结构示意图,为了简洁,此处不再赘述。
基于该注意力模块的引入,使得行人误报判断网络输出的结构更为精确,能够极大地增强行人检测结果的筛选功能。
基于上面的描述,根据本发明实施例的行人检测误报结果的检测装置利用具有特定网络结构的行人误报判断网络来实施行人检测结果的误报检测,能够大大提升行人误报检测的精度且不会大幅度增加计算量,从而能够大大提升行人检测应用产品的可使用性。
图6示出了根据本发明实施例的行人检测误报结果的检测系统600的示意性框图。行人检测误报结果的检测系统600包括存储装置610以及处理器620。
其中,存储装置610存储用于实现根据本发明实施例的行人检测误报结果的检测方法中的相应步骤的程序代码。处理器620用于运行存储装置610中存储的程序代码,以执行根据本发明实施例的行人检测误报结果的检测方法的相应步骤,并且用于实现根据本发明实施例的行人检测误报结果的检测装置中的相应模块。
在一个实施例中,在所述程序代码被处理器620运行时使得行人检测误报结果的检测系统600执行以下步骤:获取针对待处理数据进行行人检测后得到的行人检测结果;以及利用训练好的行人误报判断网络检测所述行人检测结果是否是误报结果,所述行人误报判断网络包括依次连接的卷积层、最大池化层、至少一个卷积块单元、全局池化层以及输出层。
在一个实施例中,所述行人误报判断网络还包括提供注意力机制的注意力模块,所述注意力模块包括在所述卷积块单元的至少一个中。
在一个实施例中,所述行人误报判断网络包括三个依次连接的所述卷积块单元,分别为第一卷积块单元、第二卷积块单元和第三卷积块单元,所述第二卷积块单元和所述第三卷积块单元均包括所述注意力模块。
在一个实施例中,所述至少一个卷积块单元中的每个卷积块单元包括至少一个卷积块,每个卷积块包括逐通道卷积层、跨通道卷积层和批规范化层。
在一个实施例中,所述注意力模块包括在每个所述卷积块中,且所述注意力模块位于所述逐通道卷积层和所述跨通道卷积层之间。
在一个实施例中,所述注意力模块包括依次连接的至少一个卷积层、归一化层以及融合层,所述融合层将输入所述注意力模块的特征图与所述归一化层输出的特征图进行融合操作。
在一个实施例中,所述融合操作包括将输入所述注意力模块的特征图与所述归一化层输出的特征图进行点乘操作。
在一个实施例中,所述每个卷积块单元包括三个所述卷积块。
在一个实施例中,所述逐通道卷积层为卷积核是3×3的卷积层,所述跨通道卷积层为卷积核是1×1的卷积层。
在一个实施例中,所述注意力模块包括两个卷积层,每个卷积层均为卷积核是3×3的卷积层。
此外,根据本发明实施例,还提供了一种存储介质,在所述存储介质上存储了程序指令,在所述程序指令被计算机或处理器运行时用于执行本发明实施例的行人检测误报结果的检测方法的相应步骤,并且用于实现根据本发明实施例的行人检测误报结果的检测装置中的相应模块。所述存储介质例如可以包括智能电话的存储卡、平板电脑的存储部件、个人计算机的硬盘、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、便携式紧致盘只读存储器(CD-ROM)、USB存储器、或者上述存储介质的任意组合。所述计算机可读存储介质可以是一个或多个计算机可读存储介质的任意组合。
在一个实施例中,所述计算机程序指令在被计算机运行时可以实现根据本发明实施例的行人检测误报结果的检测装置的各个功能模块,并且/或者可以执行根据本发明实施例的行人检测误报结果的检测方法。
在一个实施例中,所述计算机程序指令在被计算机或处理器运行时使计算机或处理器执行以下步骤:获取针对待处理数据进行行人检测后得到的行人检测结果;以及利用训练好的行人误报判断网络检测所述行人检测结果是否是误报结果,所述行人误报判断网络包括依次连接的卷积层、最大池化层、至少一个卷积块单元、全局池化层以及输出层。
在一个实施例中,所述行人误报判断网络还包括提供注意力机制的注意力模块,所述注意力模块包括在所述卷积块单元的至少一个中。
在一个实施例中,所述行人误报判断网络包括三个依次连接的所述卷积块单元,分别为第一卷积块单元、第二卷积块单元和第三卷积块单元,所述第二卷积块单元和所述第三卷积块单元均包括所述注意力模块。
在一个实施例中,所述至少一个卷积块单元中的每个卷积块单元包括至少一个卷积块,每个卷积块包括逐通道卷积层、跨通道卷积层和批规范化层。
在一个实施例中,所述注意力模块包括在每个所述卷积块中,且所述注意力模块位于所述逐通道卷积层和所述跨通道卷积层之间。
在一个实施例中,所述注意力模块包括依次连接的至少一个卷积层、归一化层以及融合层,所述融合层将输入所述注意力模块的特征图与所述归一化层输出的特征图进行融合操作。
在一个实施例中,所述融合操作包括将输入所述注意力模块的特征图与所述归一化层输出的特征图进行点乘操作。
在一个实施例中,所述每个卷积块单元包括三个所述卷积块。
在一个实施例中,所述逐通道卷积层为卷积核是3×3的卷积层,所述跨通道卷积层为卷积核是1×1的卷积层。
在一个实施例中,所述注意力模块包括两个卷积层,每个卷积层均为卷积核是3×3的卷积层。
根据本发明实施例的行人检测误报结果的检测装置中的各模块可以通过根据本发明实施例的行人检测误报结果的检测的电子设备的处理器运行在存储器中存储的计算机程序指令来实现,或者可以在根据本发明实施例的计算机程序产品的计算机可读存储介质中存储的计算机指令被计算机运行时实现。
根据本发明实施例的行人检测误报结果的检测方法、装置、系统和存储介质利用具有特定网络结构的行人误报判断网络来实施行人检测结果的误报检测,能够大大提升行人误报检测的精度且不会大幅度增加计算量,从而能够大大提升行人检测应用产品的可使用性。
尽管这里已经参考附图描述了示例实施例,应理解上述示例实施例仅仅是示例性的,并且不意图将本发明的范围限制于此。本领域普通技术人员可以在其中进行各种改变和修改,而不偏离本发明的范围和精神。所有这些改变和修改意在被包括在所附权利要求所要求的本发明的范围之内。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。例如,以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个设备,或一些特征可以忽略,或不执行。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该本发明的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如相应的权利要求书所反映的那样,其发明点在于可以用少于某个公开的单个实施例的所有特征的特征来解决相应的技术问题。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域的技术人员可以理解,除了特征之间相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的一些模块的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
以上所述,仅为本发明的具体实施方式或对具体实施方式的说明,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种行人检测误报结果的检测方法,其特征在于,所述方法包括:
获取针对待处理数据进行行人检测后得到的行人检测结果;以及
利用训练好的行人误报判断网络检测所述行人检测结果是否是误报结果,所述行人误报判断网络包括依次连接的卷积层、最大池化层、至少一个卷积块单元、全局池化层以及输出层;
所述行人误报判断网络还包括提供注意力机制的注意力模块,所述注意力模块包括在所述卷积块单元的至少一个中;
所述至少一个卷积块单元中的每个卷积块单元包括至少一个卷积块,每个卷积块包括逐通道卷积层、跨通道卷积层和批规范化层;
所述注意力模块包括在每个所述卷积块中,且所述注意力模块位于所述逐通道卷积层和所述跨通道卷积层之间。
2.根据权利要求1所述的方法,其特征在于,所述行人误报判断网络包括三个依次连接的所述卷积块单元,分别为第一卷积块单元、第二卷积块单元和第三卷积块单元,所述第二卷积块单元和所述第三卷积块单元均包括所述注意力模块。
3.根据权利要求1所述的方法,其特征在于,所述注意力模块包括依次连接的至少一个卷积层、归一化层以及融合层,所述融合层将输入所述注意力模块的特征图与所述归一化层输出的特征图进行融合操作。
4.根据权利要求3所述的方法,其特征在于,所述融合操作包括将输入所述注意力模块的特征图与所述归一化层输出的特征图进行点乘操作。
5.根据权利要求1所述的方法,其特征在于,所述每个卷积块单元包括三个所述卷积块。
6.根据权利要求1所述的方法,其特征在于,所述逐通道卷积层为卷积核是3×3的卷积层,所述跨通道卷积层为卷积核是1×1的卷积层。
7.根据权利要求3所述的方法,其特征在于,所述注意力模块包括两个卷积层,每个卷积层均为卷积核是3×3的卷积层。
8.一种行人检测误报结果的检测装置,其特征在于,所述装置包括:
获取模块,用于获取针对待处理数据进行行人检测后得到的行人检测结果;以及
误报检测模块,用于利用训练好的行人误报判断网络检测所述获取模块获取的所述行人检测结果是否是误报结果,所述行人误报判断网络包括依次连接的卷积层、最大池化层、至少一个卷积块单元、全局池化层以及输出层;
所述行人误报判断网络还包括提供注意力机制的注意力模块,所述注意力模块包括在所述卷积块单元的至少一个中;
所述至少一个卷积块单元中的每个卷积块单元包括至少一个卷积块,每个卷积块包括逐通道卷积层、跨通道卷积层和批规范化层;
所述注意力模块包括在每个所述卷积块中,且所述注意力模块位于所述逐通道卷积层和所述跨通道卷积层之间。
9.一种行人检测误报结果的检测系统,其特征在于,所述系统包括存储装置和处理器,所述存储装置上存储有由所述处理器运行的计算机程序,所述计算机程序在被所述处理器运行时执行如权利要求1-7中的任一项所述的行人检测误报结果的检测方法。
10.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序在运行时执行如权利要求1-7中的任一项所述的行人检测误报结果的检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810450115.9A CN108875574B (zh) | 2018-05-11 | 2018-05-11 | 行人检测误报结果的检测方法、装置、系统和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810450115.9A CN108875574B (zh) | 2018-05-11 | 2018-05-11 | 行人检测误报结果的检测方法、装置、系统和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108875574A CN108875574A (zh) | 2018-11-23 |
CN108875574B true CN108875574B (zh) | 2021-06-25 |
Family
ID=64333805
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810450115.9A Active CN108875574B (zh) | 2018-05-11 | 2018-05-11 | 行人检测误报结果的检测方法、装置、系统和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108875574B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109871798B (zh) * | 2019-02-01 | 2021-06-29 | 浙江大学 | 一种基于卷积神经网络的遥感影像建筑物提取方法 |
CN114387171A (zh) * | 2020-10-21 | 2022-04-22 | Oppo广东移动通信有限公司 | 图像处理方法、装置、存储介质及电子设备 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105426841B (zh) * | 2015-11-19 | 2019-02-15 | 北京旷视科技有限公司 | 基于人脸检测的监控相机自定位方法及装置 |
WO2017101036A1 (en) * | 2015-12-16 | 2017-06-22 | Intel Corporation | Fully convolutional pyramid networks for pedestrian detection |
CN106203305B (zh) * | 2016-06-30 | 2020-02-04 | 北京旷视科技有限公司 | 人脸活体检测方法和装置 |
CN106845387B (zh) * | 2017-01-18 | 2020-04-24 | 合肥师范学院 | 基于自学习的行人检测方法 |
CN107247949B (zh) * | 2017-08-02 | 2020-06-19 | 智慧眼科技股份有限公司 | 基于深度学习的人脸识别方法、装置和电子设备 |
-
2018
- 2018-05-11 CN CN201810450115.9A patent/CN108875574B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN108875574A (zh) | 2018-11-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106203376B (zh) | 人脸关键点定位方法及装置 | |
CN108876791B (zh) | 图像处理方法、装置和系统及存储介质 | |
CN106651877B (zh) | 实例分割方法及装置 | |
CN108875523B (zh) | 人体关节点检测方法、装置、系统和存储介质 | |
CN108876792B (zh) | 语义分割方法、装置和系统及存储介质 | |
CN109671020B (zh) | 图像处理方法、装置、电子设备和计算机存储介质 | |
CN110288082B (zh) | 卷积神经网络模型训练方法、装置和计算机可读存储介质 | |
CN106447721B (zh) | 图像阴影检测方法和装置 | |
CN108875537B (zh) | 对象检测方法、装置和系统及存储介质 | |
CN106845352B (zh) | 行人检测方法和装置 | |
CN108875535B (zh) | 图像检测方法、装置和系统及存储介质 | |
CN108876804B (zh) | 抠像模型训练和图像抠像方法、装置和系统及存储介质 | |
CN109241888B (zh) | 神经网络训练与对象识别方法、装置和系统及存储介质 | |
CN108875519B (zh) | 对象检测方法、装置和系统及存储介质 | |
CN110070551B (zh) | 视频图像的渲染方法、装置和电子设备 | |
CN110084204B (zh) | 基于目标对象姿态的图像处理方法、装置和电子设备 | |
CN106650743B (zh) | 图像强反光检测方法和装置 | |
CN110490225B (zh) | 基于场景的图像分类方法、装置、系统和存储介质 | |
CN112085056B (zh) | 目标检测模型生成方法、装置、设备及存储介质 | |
CN110428394B (zh) | 用于目标移动侦测的方法、装置及计算机存储介质 | |
CN112084959B (zh) | 一种人群图像处理方法及装置 | |
CN110751021A (zh) | 图像处理方法、装置、电子设备和计算机可读介质 | |
CN108875574B (zh) | 行人检测误报结果的检测方法、装置、系统和存储介质 | |
CN108537208A (zh) | 一种多尺度的人脸检测方法及计算设备 | |
CN110490058B (zh) | 行人检测模型的训练方法、装置、系统和计算机可读介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |