CN110909564B - 行人检测方法与装置 - Google Patents
行人检测方法与装置 Download PDFInfo
- Publication number
- CN110909564B CN110909564B CN201811074285.8A CN201811074285A CN110909564B CN 110909564 B CN110909564 B CN 110909564B CN 201811074285 A CN201811074285 A CN 201811074285A CN 110909564 B CN110909564 B CN 110909564B
- Authority
- CN
- China
- Prior art keywords
- image
- convolution
- deconvolution
- processing
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种行人检测方法与装置,所述方法,包括:获取待检测图像;对所述待检测图像依次执行至少一次第一卷积处理,每次第一卷积处理均得到一个第一图像,其中,除第一次第一卷积处理以外,每次第一卷积处理均是对上一次第一卷积处理之后得到的第一图像执行的;对所得到的最后一个第一图像执行至少一次反卷积处理,并在每次反卷积处理后,均根据所述反卷积处理得到的第二图像,以及与所述第二图像尺寸相同的第一图像,确定一个第三图像,其中,除第一次反卷积处理以外,每次反卷积处理均是对上一次反卷积处理之后确定的第三图像执行的。本发明可降低在下采样的过程中造成的特征损失,提高像素分割的精度。
Description
技术领域
本发明涉及图像处理领域,尤其涉一种行人检测方法与装置。
背景技术
行人检测(Pedestrian Detection)可以理解为利用计算机视觉技术判断图像或者视频序列中是否存在行人并给予精确定位的过程。
现有的相关技术中,可以利用行人检测神经网络,对图像中的行人进行检测,行人检测神经网络可针对所输入的待检测图像输出标识信息,从而使得待检测图像中的行人被标识。
然而,在行人检测神经网络中,因需对待检测图像进行多样的处理,例如需要对图像进行上采样与下采样,其可能会导致像素特征的损失,从而导致识别效果不够准确。
发明内容
本发明提供一种行人检测方法与装置,以解决像素特征损失的问题。
根据本发明的第一方面,提供了一种行人检测方法,包括:
获取待检测图像;所述待检测图像为车载设备采集到的需检测其中行人的图像;
对所述待检测图像依次执行至少一次第一卷积处理,每次第一卷积处理均得到一个第一图像,其中,除第一次第一卷积处理以外,每次第一卷积处理均是对上一次第一卷积处理之后得到的第一图像执行的;
对所得到的最后一个第一图像执行至少一次反卷积处理,并在每次反卷积处理后,均根据所述反卷积处理得到的第二图像,以及与所述第二图像尺寸相同的第一图像,确定一个第三图像,其中,除第一次反卷积处理以外,每次反卷积处理均是对上一次反卷积处理之后确定的第三图像执行的;
根据所确定的最后一个第三图像,确定所述待检测图像中行人的标识信息;
根据所述行人的标识信息,对所述行人执行标识。
可选的,所述根据每次反卷积处理得到的第二图像,以及与所述第二图像尺寸相同的第一图像,确定一个第三图像;
将与所述第二图像尺寸相同的第一图像与所述第二图像连接,得到连接后图像;
对所述连接后图像依次执行至少一次第二卷积处理,得到所述第三图像。
可选的,所述第一卷积处理中对图像的采样方式是经第一素材集合与第二素材集合依次训练后确定的,所述反卷积处理中对图像的采样方式是经所述第二素材集合训练后确定的。
可选的,所述对所述待检测图像依次执行至少一次第一卷积处理,包括:利用第一卷积神经网络的卷积模块执行所述第一卷积处理;
所述对所得到的最后一个第一图像执行至少一次反卷积处理,并在每次反卷积处理后,均根据所述反卷积处理得到的第二图像,以及与所述第二图像尺寸相同的第一图像,确定一个第三图像,包括:
利用第一卷积神经网络的反卷积模块对所得到的最后一个第一图像执行至少一次反卷积处理,并在每次反卷积处理后,均根据所述反卷积处理得到的第二图像,以及与所述第二图像尺寸相同的第一图像,确定一个第三图像。
可选的,所述对所述待检测图像依次执行至少一次第一卷积处理之前,还包括:
确定所述卷积模块已在另一第二卷积神经网络中经第一素材集合训练过;
利用第二素材集合训练所述第一卷积神经网络;
所述第二卷积神经网络是采用ResNet网络架构的开源神经网络,所述卷积模块采用ResNet50的整体卷积结构。
可选的,所述利用第一卷积神经网络的卷积模块执行所述第一卷积处理,包括:利用所述卷积模块中的第一卷积层执行所述第一卷积处理;
所述利用第一卷积神经网络的反卷积模块对所得到的最后一个第一图像执行至少一次反卷积处理,包括:利用所述反卷积模块的反卷积层执行所述反卷积处理;
所述根据所述反卷积处理得到的第二图像,以及与所述第二图像尺寸相同的第一图像,确定一个第三图像,包括:利用所述第一卷积神经网络将与所述第二图像尺寸相同的第一图像与所述第二图像连接,得到连接后图像;利用所述反卷积模块对所述连接后图像依次执行至少一次第二卷积处理,得到所述第三图像,其中每次第二卷积处理均是利用所述反卷积模块中的一个第二卷积层执行的。
根据本发明的第二方面一种行人检测装置,其特征在于,包括:
获取单元,用于获取待检测图像;所述待检测图像为车载设备采集到的需检测其中行人的图像;
卷积处理单元,用于对所述待检测图像依次执行至少一次第一卷积处理,每次第一卷积处理均得到一个第一图像,其中,除第一次第一卷积处理以外,每次第一卷积处理均是对上一次第一卷积处理之后得到的第一图像执行的;
反卷积处理单元,用于对所得到的最后一个第一图像执行至少一次反卷积处理,并在每次反卷积处理后,均根据所述反卷积处理得到的第二图像,以及与所述第二图像尺寸相同的第一图像,确定一个第三图像,其中,除第一次反卷积处理以外,每次反卷积处理均是对上一次反卷积处理之后确定的第三图像执行的;
标识信息确定单元,用于根据所确定的最后一个第三图像,确定所述待检测图像中行人的标识信息;
标识单元,用于根据所述行人的标识信息,对所述行人执行标识。
可选的,所述反卷积处理单元,具体用于:
将与所述第二图像尺寸相同的第一图像与所述第二图像连接,得到连接后图像;
对所述连接后图像依次执行至少一次第二卷积处理,得到所述第三图像。
可选的,所述第一卷积处理中对图像的采样方式是经第一素材集合与第二素材集合依次训练后确定的,所述反卷积处理中对图像的采样方式是经所述第二素材集合训练后确定的。
可选的,所述卷积处理单元,具体用于:利用第一卷积神经网络的卷积模块执行所述第一卷积处理;
所述反卷积处理单元,具体用于:利用第一卷积神经网络的反卷积模块对所得到的最后一个第一图像执行至少一次反卷积处理,并在每次反卷积处理后,均根据所述反卷积处理得到的第二图像,以及与所述第二图像尺寸相同的第一图像,确定一个第三图像。
可选的,所述的行人检测装置,其特征在于,还包括:
第一素材确定单元,用于确定所述卷积模块已在另一第二卷积神经网络中经第一素材集合训练过;
第二素材训练单元,用于利用第二素材集合训练所述第一卷积神经网络;
所述第二卷积神经网络是采用ResNet网络架构的开源神经网络,所述卷积模块采用ResNet50的整体卷积结构。
可选的,所述卷积处理单元,具体用于:利用所述卷积模块中的第一卷积层执行所述第一卷积处理;
所述反卷积处理单元,具体用于:利用所述反卷积模块的反卷积层执行所述反卷积处理;以及:利用所述第一卷积神经网络将与所述第二图像尺寸相同的第一图像与所述第二图像连接,得到连接后图像;利用所述反卷积模块对所述连接后图像依次执行至少一次第二卷积处理,得到所述第三图像,其中每次第二卷积处理均是利用所述反卷积模块中的一个第二卷积层执行的。
根据本发明的第三方面,提供了一种电子设备,包括:
处理器;以及,
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行第一方面及其可选方案涉及的行人检测方法。
根据本发明的第四方面,提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面及其可选方案涉及的行人检测方法。
本发明提供的行人检测方法与装置,通过对所得到的最后一个第一图像执行至少一次反卷积处理,并在每次反卷积处理后,均根据所述反卷积处理得到的第二图像,以及与所述第二图像尺寸相同的第一图像,确定一个第三图像,以及根据所确定的最后一个第三图像,确定所述待检测图像中行人的标识信息,实现了标识信息的确定,由于第三图像的确定需结合同尺寸的第一图像,以及第二图像,本发明可以更好的保持像素特征,降低在下采样的过程中造成的特征损失,提高像素分割的精度,进而提升了识别准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中行人检测方法的流程示意图;
图2是本发明一实施例中第一卷积神经网络的结构示意图;
图3是本发明另一实施例中行人检测方法的流程示意图;
图4是本发明一实施例中步骤S13的流程示意图;
图5是本发明一实施例中第一卷积神经网络中卷积模块与反卷积模块的结构示意图;
图6是本发明一实施例中行人像素信息的示意图;
图7是本发明一实施例中标识行人的示意图;
图8是本发明一实施例中行人检测装置的结构示意图;
图9是本发明另一实施例中行人检测装置的结构示意图;
图10是本发明一电子终端的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
本发明及其可选方案提供的行人检测方法与装置,可应用于服务器、智能终端等任意可获得包含行人的图像的场景,其中的智能终端可以为车载终端、手机终端、平板电脑、计算机等等。
图1是本发明一行人检测方法的流程示意图一。
请参考图1,行人检测方法,包括:
S11:获取待检测图像。
待检测图像,可以理解为车载设备采集到的需检测其中行人的图像,其可以为任意需用于进行行人检测的图像,可以为动态视频中的图像,也可以为静态照片中的图像。
所述待检测图像可以是由车载摄像头采集到的图像。具体实施过程中,可不断针对当前采集到的图像实施检测,检测的刷新速度与检测过程的处理过程相匹配。
S12:对所述待检测图像依次执行至少一次第一卷积处理,每次第一卷积处理均得到一个第一图像。
其中,除第一次第一卷积处理以外,每次第一卷积处理均是对上一次第一卷积处理之后得到的第一图像执行的。卷积处理,也可理解为下采样,通过卷积处理,可通过对图像的采样,缩小图像的尺寸,或者保持同样的尺寸。
第一图像,可理解为适于实现卷积或反卷积的图像,其可以为矩阵图像,其同样也是卷积产生的图像。
其中一种实施方式中,所述第一卷积处理中对图像的采样方式是经第一素材集合与第二素材集合依次训练后确定的。相较于仅采用第二素材集合进行训练的方案,本实施方式可使得第一卷积处理中对图像的采样方式在第二素材训练之前,已具有一定的特征描述能力。
其中一种实施方式中,步骤S12具体可以包括:
利用第一卷积神经网络的卷积模块执行所述第一卷积处理。
图2是本发明一实施例中第一卷积神经网络的结构示意图。请参考图2,第一卷积神经网络,可以包括用于执行步骤S12的卷积模块22,以及用于执行后续步骤S13的反卷积模块23。第一卷积神经网络,可理解为用于实现行人识别、标识的神经网络。其还可包括输入层21与输出层24。
其中一种实施方式中,所述卷积模块是通过先在第二卷积神经网络中经第一素材集合训练,再在所述第一卷积神经网络中经第二素材集合训练后确定的。第二卷积神经网络,可理解为区别于第一卷积神经网络的其他卷积神经网络,其可以为开源的神经网络,例如采用残差网络ResNet网络架构的开源神经网络。所述卷积模块可采用ResNet50的整体卷积结构。采用ResNet50结构可以使得第一卷积神经网络训练有一个更佳的初始化,即在第一卷积神经网络未训练前即具备较佳的特征描述能力,进而可以使得第一卷积神经网络的收敛速度进一步提高。
所述反卷积模块是通过在所述第一卷积神经网络中经所述第二素材集合训练后确定的。其中,卷积模块与反卷积模块在所述第一神经网络中共同经第二素材集合进行共同训练。可见,本实施例与现有相关技术的区别之一在于本实施例中的卷积模块为共同训练之前已经被训练过的。
可见,所述第一卷积处理中对图像的采样方式是经第一素材集合与第二素材集合依次训练后确定的,所述反卷积处理中对图像的采样方式是经所述第二素材集合训练后确定的。
第一卷积神经网络经训练所实现的功能,可以理解为在训练后,可针对待检测图像得到对应的标识信息,从而为最终的标识提供依据。故而,在其训练时,可为其提供图像,以及图像中的标识信息。
图3是本发明另一实施例中行人检测方法的流程示意图。
基于以上训练过程,其中一种实施方式中,步骤S11之前,还可包括:
S16:确定所述卷积模块已在另一第二卷积神经网络中经第一素材集合训练过;
S17:利用第二素材集合训练所述第一卷积神经网络。
由于卷级模块与反卷积模块在第一卷积神经网络中进行训练之前,卷积模块已经被训练过,故而,第一卷积神经网络初始化下的特征映射的规则为具有一定特征描述能力的,本实施例的网络架构下,相较于现有技术,可提高卷积神经网络的特征描述能力与收敛速度,从而可以有利于提高检测精准度,以及泛化能力。其中,泛化能力可以理解为对新鲜样本的适应能力。
在步骤S12之后,可以包括:
S13:对所得到的最后一个第一图像执行至少一次反卷积处理,并在每次反卷积处理后,均根据所述反卷积处理得到的第二图像,以及与所述第二图像尺寸相同的第一图像,确定一个第三图像。
其中,除第一次反卷积处理以外,每次反卷积处理均是对上一次反卷积处理之后确定的第三图像执行的。
第二图像,可理解为适于实现卷积或反卷积的图像,其可以为矩阵图像,其同样也是反卷积产生的图像。
图4是本发明一实施例中步骤S13的流程示意图。
请参考图4,步骤S13可以包括:
S131:将与所述第二图像尺寸相同的第一图像与所述第二图像连接,得到连接后图像。
S132:对所述连接后图像依次执行至少一次第二卷积处理,得到所述第三图像。
可见,第三图像,可理解为适于实现卷积或反卷积的图像,其可以为矩阵图像,其同样也是卷积产生的图像。
通过第一图像与第二图像的连接,并对连接后图像进行卷积处理,可以更好的保持像素特征,降低在下采样的过程中造成的特征损失,提高像素分割的精度。
具体实施过程中,步骤S13中,可以包括:利用第一卷积神经网络的反卷积模块对所得到的最后一个第一图像执行至少一次反卷积处理,并在每次反卷积处理后,均根据所述反卷积处理得到的第二图像,以及与所述第二图像尺寸相同的第一图像,确定一个第三图像。
采用网络前后层中相同尺寸连接的方式,可以更好的保持像素特征,降低在下采样的过程中造成的特征损失,提高像素分割的精度。图5是本发明一实施例中第一卷积神经网络中卷积模块与反卷积模块的结构示意图。
对于卷积模块32,请参考图5,可以包括第一卷积层221;步骤S12中,可以利用所述卷积模块22中的第一卷积层221执行所述第一卷积处理。每个第一卷积层221输出的图像的尺寸可以与输入的图像的尺寸相同,也可以小于输入的图像的尺寸。图5中,以各长条表示各第一卷积层221,长条的长度表示第一卷积层221输出的图像的尺寸,同时,在图5中对应标识了各第一卷积层221对应的尺寸。
对于反卷积模块33,请参考图5,可以包括第二卷积层231与反卷积层232,步骤S13具体可以包括:利用所述反卷积模块23的反卷积层232执行所述反卷积处理,以及:利用所述第一卷积神经网络将与所述第二图像尺寸相同的第一图像与所述第二图像连接,得到连接后图像;利用所述反卷积模块23对所述连接后图像依次执行至少一次第二卷积处理,得到所述第三图像,其中每次第二卷积处理均是利用所述反卷积模块23中的一个第二卷积层231执行的。
每个反卷积层232输出的图像的尺寸可以大于输入的图像的尺寸。图5中,以各长条表示各第二卷积层231与反卷积层232,长条的长度表示第二卷积层231与反卷积层232输出的图像的尺寸,同时,在图5中对应标识了各第二卷积层231与反卷积层232对应的尺寸。
以上所涉及的第一卷积层221、第二卷积层231和反卷积层232,均可理解为中间层。
反卷积层232的上一层中间层,可以为第一卷积层221、第二卷积层231或另一反卷积层232。
第二卷积层231的上一层中间层,可以为第一卷积层221、第二卷积层231或反卷积层232。
此外,还需指出,第一卷积层221、第二卷积层231、以及反卷积层232的尺寸、数量均不限于图5所示。
S14:根据所确定的最后一个第三图像,确定所述待检测图像中行人的标识信息。
其中一种实施方式中,所述标识信息包括行人像素信息与对应的标识框单元信息。其组合可用于实现对行人的标识。
图6是本发明一实施例中行人像素信息的示意图。
行人像素信息,可以理解为用于表征所述待检测图像中每个行人的特定像素点,具体可以对行人在图像中的位置进行表征,以及对行人在图像中所占像素的多少进行初步表征的信息,任意可表征图像中行人的数据形式,均不脱离行人像素信息的描述。
特定像素点,可以是与行人对应的像素点,例如,每个行人的各特定像素点可以为该行人在图像中所有像素中的部分像素点。
请参考图6,行人像素信息可以为一张与待检测图像匹配的图,白色的像素点可以理解为根据待检测图像确定的特定像素点,其可对应于待检测图像中行人的部分像素。白色像素点的位置可表征行人的位置,所形成的各白色像素部分中白色像素点的数量可对应初步表征行人在待检测图像中的像素数量。
标识框单元信息,用于描述每个所述特定像素点对应的标识框单元。例如,若最终以矩形的行人标识框标识行人,则针对每一个特定像素点,可具有一个包括四个元素的数据,分别用于表示该特定像素距离其对应的标识框单元的四条边的距离,在该特定像素点确定后,依据四个距离,可对应确定其标识框单元,从而使得各标识框单元融合后可形成行人标识框。可见,对于标识框单元信息,未必需实际得到对应的标识框单元,只需得到其对应的距离数据即可。故而,标识框单元信息,可以为各组距离数据[d1,d2,d3,d4]。
为了使得第一卷积神经网络能够实现以上所涉及的功能,在训练时,第一卷积神经网络的输入层可接收训练图像,以及对应的标识信息。其中一种实施方式中,可以具体接收训练图片与标签,标签可以包括五个维度,第一维度中,以0或1的数据表示图片中的像素,其中,1可以表示以上所涉及的特定像素,即行人像素信息,0可以表示非特定像素,即图像中的其他像素;第二、第三、第四、第五维度中,可分别标注特定像素点到行人标识框的距离。
具体实施过程中,训练图像可以具体为1024×512×3大小的RGB(Red GreenBlue)彩色图片,标签可以具体为256×128×5的标签,其中,第一维的256×128标签用于以0或1的数据表示图片中的像素,由于其实现了特定像素与非特定像素的分类,其也可理解为一种非0即1的分割类别标签,其余四维256x 128的标签可以具体标识每个像素点到行人标识框的四条边的归一化后距离值,其可理解为对像素距离回归的结果,可见,其中可以包括特定像素点,也可以包括非特定像素点,因非特定像素点在行人标识框外,其距离值可理解为0。
由于本实施例基于像素进行边框回归,在较高的像素分割基础上,可以使得较小的行人目标上也有分割像素结果,继而其边框回归结果保持,使得小目标也能检测到。
在训练过程中,各中间层针对训练图像实施对特征的映射,从而得到标识信息,其可以以上所涉及的标签对标识进行表征,再将所得到的标识信息与所输入的标识信息进行比对,评估差距,从而调整各中间层的映射规则,例如可调整各中间层的参数,使得所能够输出的结果与所输入的标识信息接近。
具体实施过程中,可利用Softmax损失函数评估行人像素信息方面的差距,利用欧式距离损失(Euclidean Loss)函数评估行人标识框方面的差距,进而根据两个函数的评估,反向传播更新学习参数,从而得到更佳的映射规则。
S15:根据所述行人的标识信息,对所述行人执行标识。
其中一种实施方式中,步骤S15,具体为:将表征同一个行人的各特定像素点对应的标识框单元融合,得到行人标识框,以通过所述行人标识框在所述待检测图像中标识行人。其中,可以使用非极大值抑制算法进行标识框单元的融合。
图7是本发明一实施例中标识行人的示意图。
请参考图7,并比对图6,对于图6中左侧第二个白色像素点部分,在确定其中各白色像素点,以及对应的距离数据[d1,d2,d3,d4]后,可以得到对应的各标识框单元,标识框单元融合后,可得到图7所示的矩形的行人标识框。图7所示意的结果也可理解为边框回归后的结果。
综上可见,本实施例提供的行人检测方法,通过对所得到的最后一个第一图像执行至少一次反卷积处理,并在每次反卷积处理后,均根据所述反卷积处理得到的第二图像,以及与所述第二图像尺寸相同的第一图像,确定一个第三图像,以及根据所确定的最后一个第三图像,确定所述待检测图像中行人的标识信息,实现了标识信息的确定,由于第三图像的确定需结合同尺寸的第一图像,以及第二图像,本发明可以更好的保持像素特征,降低在下采样的过程中造成的特征损失,提高像素分割的精度,进而提升了识别准确性
图8是本发明一实施例中行人检测装置的结构示意图。
请参考图8,行人检测装置30,包括:
获取单元31,用于获取待检测图像;所述待检测图像为车载设备采集到的需检测其中行人的图像;
卷积处理单元32,用于对所述待检测图像依次执行至少一次第一卷积处理,每次第一卷积处理均得到一个第一图像,其中,除第一次第一卷积处理以外,每次第一卷积处理均是对上一次第一卷积处理之后得到的第一图像执行的;
反卷积处理单元33,用于对所得到的最后一个第一图像执行至少一次反卷积处理,并在每次反卷积处理后,均根据所述反卷积处理得到的第二图像,以及与所述第二图像尺寸相同的第一图像,确定一个第三图像,其中,除第一次反卷积处理以外,每次反卷积处理均是对上一次反卷积处理之后确定的第三图像执行的;
标识信息确定单元34,用于根据所确定的最后一个第三图像,确定所述待检测图像中行人的标识信息;
标识单元35,用于根据所述行人的标识信息,对所述行人执行标识。
本实施例提供的行人检测装置,通过对所得到的最后一个第一图像执行至少一次反卷积处理,并在每次反卷积处理后,均根据所述反卷积处理得到的第二图像,以及与所述第二图像尺寸相同的第一图像,确定一个第三图像,以及根据所确定的最后一个第三图像,确定所述待检测图像中行人的标识信息,实现了标识信息的确定,由于第三图像的确定需结合同尺寸的第一图像,以及第二图像,本发明可以更好的保持像素特征,降低在下采样的过程中造成的特征损失,提高像素分割的精度,进而提升了识别准确性。
图9是本发明另一实施例中行人检测装置的结构示意图。
请参考图9,行人检测装置30,包括:
获取单元31,用于获取待检测图像;所述待检测图像为车载设备采集到的需检测其中行人的图像;
卷积处理单元32,用于对所述待检测图像依次执行至少一次第一卷积处理,每次第一卷积处理均得到一个第一图像,其中,除第一次第一卷积处理以外,每次第一卷积处理均是对上一次第一卷积处理之后得到的第一图像执行的;
反卷积处理单元33,用于对所得到的最后一个第一图像执行至少一次反卷积处理,并在每次反卷积处理后,均根据所述反卷积处理得到的第二图像,以及与所述第二图像尺寸相同的第一图像,确定一个第三图像,其中,除第一次反卷积处理以外,每次反卷积处理均是对上一次反卷积处理之后确定的第三图像执行的;
标识信息确定单元34,用于根据所确定的最后一个第三图像,确定所述待检测图像中行人的标识信息;
标识单元35,用于根据所述行人的标识信息,对所述行人执行标识。
可选的,所述反卷积处理单元33,具体用于:
将与所述第二图像尺寸相同的第一图像与所述第二图像连接,得到连接后图像;
对所述连接后图像依次执行至少一次第二卷积处理,得到所述第三图像。
可选的,所述第一卷积处理中对图像的采样方式是经第一素材集合与第二素材集合依次训练后确定的,所述反卷积处理中对图像的采样方式是经所述第二素材集合训练后确定的。
可选的,所述卷积处理单元32,具体用于:利用第一卷积神经网络的卷积模块执行所述第一卷积处理;
所述反卷积处理单元33,具体用于:利用第一卷积神经网络的反卷积模块对所得到的最后一个第一图像执行至少一次反卷积处理,并在每次反卷积处理后,均根据所述反卷积处理得到的第二图像,以及与所述第二图像尺寸相同的第一图像,确定一个第三图像。
可选的,所述的行人检测装置30,还包括:
第一素材确定单元36,用于确定所述卷积模块已在另一第二卷积神经网络中经第一素材集合训练过;
第二素材训练单元37,用于利用第二素材集合训练所述第一卷积神经网络;
所述第二卷积神经网络是采用ResNet网络架构的开源神经网络,所述卷积模块采用ResNet50的整体卷积结构。
可选的,所述卷积处理单元32,具体用于:利用所述卷积模块中的第一卷积层执行所述第一卷积处理;
所述反卷积处理单元33,具体用于:利用所述反卷积模块的反卷积层执行所述反卷积处理;以及:利用所述第一卷积神经网络将与所述第二图像尺寸相同的第一图像与所述第二图像连接,得到连接后图像;利用所述反卷积模块对所述连接后图像依次执行至少一次第二卷积处理,得到所述第三图像,其中每次第二卷积处理均是利用所述反卷积模块中的一个第二卷积层执行的。
本实施例提供的行人检测装置,通过对所得到的最后一个第一图像执行至少一次反卷积处理,并在每次反卷积处理后,均根据所述反卷积处理得到的第二图像,以及与所述第二图像尺寸相同的第一图像,确定一个第三图像,以及根据所确定的最后一个第三图像,确定所述待检测图像中行人的标识信息,实现了标识信息的确定,由于第三图像的确定需结合同尺寸的第一图像,以及第二图像,本发明可以更好的保持像素特征,降低在下采样的过程中造成的特征损失,提高像素分割的精度,进而提升了识别准确性。
图10是本发明一实施例中电子终端的结构示意图。
请参考图10,该电子终端40包括:处理器41以及存储器42;其中
存储器42,用于存储计算机程序,该存储器还可以是flash(闪存)。
处理器41,用于执行存储器存储的执行指令,以实现上述方法中的各个步骤。具体可以参见前面方法实施例中的相关描述。
可选地,存储器42既可以是独立的,也可以跟处理器41集成在一起。
当所述存储器42是独立于处理器41之外的器件时,所述发送设备50还可以包括:
总线43,用于连接所述存储器42和处理器41。
本实施例还提供一种可读存储介质,可读存储介质中存储有执行指令,当电子终端的至少一个处理器执行该执行指令时,电子终端执行上述的各种实施方式提供的方法。
本实施例还提供一种程序产品,该程序产品包括执行指令,该执行指令存储在可读存储介质中。电子终端的至少一个处理器可以从可读存储介质读取该执行指令,至少一个处理器执行该执行指令使得电子终端实施上述的各种实施方式提供的方法。
在上述电子终端的实施例中,应理解,处理器可以是中央处理单元(英文:CentralProcessing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:DigitalSignal Processor,简称:DSP)、专用集成电路(英文:Application Specific IntegratedCircuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (11)
1.一种行人检测方法,其特征在于,包括:
获取待检测图像;所述待检测图像为车载设备采集到的需检测其中行人的图像;
对所述待检测图像依次执行至少一次第一卷积处理,每次第一卷积处理均得到一个第一图像,其中,除第一次第一卷积处理以外,每次第一卷积处理均是对上一次第一卷积处理之后得到的第一图像执行的;
对所得到的最后一个第一图像执行至少一次反卷积处理,并在每次反卷积处理后,均根据所述反卷积处理得到的第二图像,以及与所述第二图像尺寸相同的第一图像,确定一个第三图像,其中,除第一次反卷积处理以外,每次反卷积处理均是对上一次反卷积处理之后确定的第三图像执行的;
根据所确定的最后一个第三图像,利用第一卷积神经网络确定所述待检测图像中行人的标识信息;所述标识信息包括标识框单元信息,所述标识框单元信息,用于描述特定像素点对应的标识框单元,所述标识框单元信息包括与该标识框单元对应的特定像素点距离该标识框单元的每条边的距离;所述特定像素点为所述行人在所述待检测图像中的像素点;
根据所述行人的标识信息,对所述行人执行标识;
该方法还包括:训练所述第一卷积神经网络;
所述训练所述第一卷积神经网络,包括:
通过所述第一卷积神经网络的输入层接收训练图像以及对应的标识信息;
各中间层针对所述训练图像实施对特征的映射得到标识信息,将所得到的标识信息与输入层接收的标识信息进行比对,评估差距,调整各中间层的映射规则,使得所述第一卷积神经网络输出的结果与输入层接收的标识信息接近。
2.根据权利要求1所述的方法,其特征在于,所述根据每次反卷积处理得到的第二图像,以及与所述第二图像尺寸相同的第一图像,确定一个第三图像;
将与所述第二图像尺寸相同的第一图像与所述第二图像连接,得到连接后图像;
对所述连接后图像依次执行至少一次第二卷积处理,得到所述第三图像。
3.根据权利要求1所述的方法,其特征在于,所述第一卷积处理中对图像的采样方式是经第一素材集合与第二素材集合依次训练后确定的,所述反卷积处理中对图像的采样方式是经所述第二素材集合训练后确定的。
4.根据权利要求1所述的方法,其特征在于,所述对所述待检测图像依次执行至少一次第一卷积处理,包括:利用第一卷积神经网络的卷积模块执行所述第一卷积处理;
所述对所得到的最后一个第一图像执行至少一次反卷积处理,并在每次反卷积处理后,均根据所述反卷积处理得到的第二图像,以及与所述第二图像尺寸相同的第一图像,确定一个第三图像,包括:
利用第一卷积神经网络的反卷积模块对所得到的最后一个第一图像执行至少一次反卷积处理,并在每次反卷积处理后,均根据所述反卷积处理得到的第二图像,以及与所述第二图像尺寸相同的第一图像,确定一个第三图像。
5.根据权利要求4所述的方法,其特征在于,所述对所述待检测图像依次执行至少一次第一卷积处理之前,还包括:
确定所述卷积模块已在另一第二卷积神经网络中经第一素材集合训练过;
利用第二素材集合训练所述第一卷积神经网络;
所述第二卷积神经网络是采用ResNet网络架构的开源神经网络,所述卷积模块采用ResNet50的整体卷积结构。
6.根据权利要求4或5所述的行人检测方法,其特征在于,所述利用第一卷积神经网络的卷积模块执行所述第一卷积处理,包括:利用所述卷积模块中的第一卷积层执行所述第一卷积处理;
所述利用第一卷积神经网络的反卷积模块对所得到的最后一个第一图像执行至少一次反卷积处理,包括:利用所述反卷积模块的反卷积层执行所述反卷积处理;
所述根据所述反卷积处理得到的第二图像,以及与所述第二图像尺寸相同的第一图像,确定一个第三图像,包括:利用所述第一卷积神经网络将与所述第二图像尺寸相同的第一图像与所述第二图像连接,得到连接后图像;利用所述反卷积模块对所述连接后图像依次执行至少一次第二卷积处理,得到所述第三图像,其中每次第二卷积处理均是利用所述反卷积模块中的一个第二卷积层执行的。
7.一种行人检测装置,其特征在于,包括:
获取单元,用于获取待检测图像;所述待检测图像为车载设备采集到的需检测其中行人的图像;
卷积处理单元,用于对所述待检测图像依次执行至少一次第一卷积处理,每次第一卷积处理均得到一个第一图像,其中,除第一次第一卷积处理以外,每次第一卷积处理均是对上一次第一卷积处理之后得到的第一图像执行的;
反卷积处理单元,用于对所得到的最后一个第一图像执行至少一次反卷积处理,并在每次反卷积处理后,均根据所述反卷积处理得到的第二图像,以及与所述第二图像尺寸相同的第一图像,确定一个第三图像,其中,除第一次反卷积处理以外,每次反卷积处理均是对上一次反卷积处理之后确定的第三图像执行的;
标识信息确定单元,用于根据所确定的最后一个第三图像,利用第一卷积神经网络确定所述待检测图像中行人的标识信息;所述标识信息包括标识框单元信息,所述标识框单元信息,用于描述特定像素点对应的标识框单元,所述标识框单元信息包括与该标识框单元对应的特定像素点距离该标识框单元的每条边的距离;所述特定像素点为所述行人在所述待检测图像中的像素点;
标识单元,用于根据所述行人的标识信息,对所述行人执行标识;
训练单元,用于训练所述第一卷积神经网络;
所述训练单元,具体用于通过所述第一卷积神经网络的输入层接收训练图像以及对应的标识信息;各中间层针对训练图像实施对特征的映射得到标识信息,将所得到的标识信息与输入层接收的标识信息进行比对,评估差距,调整各中间层的映射规则,使得所述第一卷积神经网络输出的结果与输入层接收的标识信息接近。
8.根据权利要求7所述的行人检测装置,其特征在于,所述反卷积处理单元,具体用于:
将与所述第二图像尺寸相同的第一图像与所述第二图像连接,得到连接后图像;
对所述连接后图像依次执行至少一次第二卷积处理,得到所述第三图像。
9.根据权利要求7所述的行人检测装置,其特征在于,所述卷积处理单元,具体用于:利用第一卷积神经网络的卷积模块执行所述第一卷积处理;
所述反卷积处理单元,具体用于:利用第一卷积神经网络的反卷积模块对所得到的最后一个第一图像执行至少一次反卷积处理,并在每次反卷积处理后,均根据所述反卷积处理得到的第二图像,以及与所述第二图像尺寸相同的第一图像,确定一个第三图像。
10.根据权利要求9所述的行人检测装置,其特征在于,还包括:
第一素材确定单元,用于确定所述卷积模块已在另一第二卷积神经网络中经第一素材集合训练过;
第二素材训练单元,用于利用第二素材集合训练所述第一卷积神经网络;
所述第二卷积神经网络是采用ResNet网络架构的开源神经网络,所述卷积模块采用ResNet50的整体卷积结构。
11.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至6任一项所述的行人检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811074285.8A CN110909564B (zh) | 2018-09-14 | 2018-09-14 | 行人检测方法与装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811074285.8A CN110909564B (zh) | 2018-09-14 | 2018-09-14 | 行人检测方法与装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110909564A CN110909564A (zh) | 2020-03-24 |
CN110909564B true CN110909564B (zh) | 2023-02-28 |
Family
ID=69812316
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811074285.8A Active CN110909564B (zh) | 2018-09-14 | 2018-09-14 | 行人检测方法与装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110909564B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106650690A (zh) * | 2016-12-30 | 2017-05-10 | 东华大学 | 基于深度卷积‑反卷积神经网络的夜视图像场景识别方法 |
CN106845352A (zh) * | 2016-12-23 | 2017-06-13 | 北京旷视科技有限公司 | 行人检测方法和装置 |
CN108062569A (zh) * | 2017-12-21 | 2018-05-22 | 东华大学 | 一种基于红外和雷达的无人车驾驶决策方法 |
-
2018
- 2018-09-14 CN CN201811074285.8A patent/CN110909564B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106845352A (zh) * | 2016-12-23 | 2017-06-13 | 北京旷视科技有限公司 | 行人检测方法和装置 |
CN106650690A (zh) * | 2016-12-30 | 2017-05-10 | 东华大学 | 基于深度卷积‑反卷积神经网络的夜视图像场景识别方法 |
CN108062569A (zh) * | 2017-12-21 | 2018-05-22 | 东华大学 | 一种基于红外和雷达的无人车驾驶决策方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110909564A (zh) | 2020-03-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108765278B (zh) | 一种图像处理方法、移动终端及计算机可读存储介质 | |
CN109584248B (zh) | 基于特征融合和稠密连接网络的红外面目标实例分割方法 | |
CN108009543B (zh) | 一种车牌识别方法及装置 | |
CN111369545B (zh) | 边缘缺陷检测方法、装置、模型、设备及可读存储介质 | |
CN112381775B (zh) | 一种图像篡改检测方法、终端设备及存储介质 | |
CN111767878B (zh) | 嵌入式设备中基于深度学习的交通标志检测方法及系统 | |
WO2020258077A1 (zh) | 一种行人检测方法及装置 | |
CN111191611A (zh) | 基于深度学习的交通标志标号识别方法 | |
CN108805838B (zh) | 一种图像处理方法、移动终端及计算机可读存储介质 | |
CN111339887B (zh) | 商品识别方法及智能货柜系统 | |
CN112926531A (zh) | 特征信息提取方法、模型训练方法、装置及电子设备 | |
CN108377374A (zh) | 用于产生与图像相关的深度信息的方法和系统 | |
CN111738036A (zh) | 图像处理方法、装置、设备及存储介质 | |
CN111160395A (zh) | 图像识别方法、装置、电子设备和存储介质 | |
WO2020259416A1 (zh) | 图像采集控制方法、装置、电子设备及存储介质 | |
CN111191582A (zh) | 三维目标检测方法、检测装置、终端设备及计算机可读存储介质 | |
CN112784675B (zh) | 目标检测方法及装置、存储介质、终端 | |
CN111815528A (zh) | 基于卷积模型和特征融合的恶劣天气图像分类增强方法 | |
CN113744256A (zh) | 一种深度图空洞填充方法、装置、服务器及可读存储介质 | |
US20220028091A1 (en) | Systems and Methods for Machine Learning Enhanced Image Registration | |
CN111783654A (zh) | 车辆重识别方法、装置及电子设备 | |
CN111723805A (zh) | 一种信号灯的前景区域识别方法及相关装置 | |
CN113610884A (zh) | 图像处理方法、装置、电子设备及计算机可读存储介质 | |
CN112949423A (zh) | 物体识别方法、物体识别装置及机器人 | |
US20240177316A1 (en) | Method for segmenting roads in images, electronic device, and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |