CN116012873B - 一种行人重识别方法、装置、电子设备及存储介质 - Google Patents
一种行人重识别方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN116012873B CN116012873B CN202211550390.0A CN202211550390A CN116012873B CN 116012873 B CN116012873 B CN 116012873B CN 202211550390 A CN202211550390 A CN 202211550390A CN 116012873 B CN116012873 B CN 116012873B
- Authority
- CN
- China
- Prior art keywords
- convolution
- processing
- module
- feature map
- pedestrian
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 94
- 238000012545 processing Methods 0.000 claims abstract description 294
- 238000013528 artificial neural network Methods 0.000 claims abstract description 69
- 230000008569 process Effects 0.000 claims abstract description 52
- 238000000605 extraction Methods 0.000 claims abstract description 39
- 238000010586 diagram Methods 0.000 claims abstract description 37
- 238000007781 pre-processing Methods 0.000 claims abstract description 15
- 230000006870 function Effects 0.000 claims description 46
- 238000010606 normalization Methods 0.000 claims description 45
- 230000004913 activation Effects 0.000 claims description 44
- 238000011176 pooling Methods 0.000 claims description 8
- 238000013507 mapping Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 abstract description 12
- 230000000694 effects Effects 0.000 abstract description 10
- 238000004891 communication Methods 0.000 description 7
- 238000004590 computer program Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000003062 neural network model Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 1
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 1
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 1
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Image Analysis (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明提供一种行人重识别方法、装置、电子设备及存储介质,涉及图像识别技术领域,具体实现方案为:获取采集设备采集到的包含行人的目标图像;将目标图像输入到用于行人重识别的神经网络中的第一模块进行预处理,得到第一特征图,在第一模块中对目标图像进行多次第一卷积处理,且每次第一卷积处理采用的卷积尺寸相同;将第一特征图输入至神经网络中的第二模块进行特征提取处理,得到第二特征图,在第二模块中对目标图像进行N次第二卷积处理和N次第三卷积处理;基于第二特征图进行行人重识别。本发明可以减少在图像处理过程中的参数量,从而提高计算和处理的效率,进而提高对图像中特定行人的识别效果。
Description
技术领域
本发明涉及图像识别技术领域,尤其涉及一种行人重识别方法、装置、电子设备及存储介质。
背景技术
行人重识别(Person re-identification,Re-ID)是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术,给定一个监控行人图像,检索跨设备下的该行人图像,可以理解为弥补固定摄像头的视觉局限性,但是由于不同摄像设备之间的差异,同时行人兼具刚性和柔性的特性,外观易受穿着、尺度、遮挡、姿态和视角等影响,因此需要提取精度更高的特征来确定特定行人。
现有技术中,Re-ID方案中的模型一般存在两种类型,一是所占存储空间较大的模型,该类模型对特征提取的精度满足需求,但是识别速度较慢,二是所占存储空间较小的模型,该类模型的识别速度较快,但是特征提取的精准度较低。
可见,现有技术中对图像中特定行人的识别效果较差。
发明内容
本发明实施例提供了一种行人重识别方法、装置、电子设备及存储介质,以解决现有技术中对图像中特定行人的识别效果较差的问题。
第一方面,本发明实施例提供了一种行人重识别方法,包括:
获取采集设备采集到的包含行人的目标图像;
将所述目标图像输入到用于行人重识别的神经网络中的第一模块进行预处理,得到第一特征图,在所述第一模块中对所述目标图像进行多次第一卷积处理,且每次所述第一卷积处理采用的卷积尺寸相同;
将所述第一特征图输入至所述神经网络中的第二模块进行特征提取处理,得到第二特征图,在所述第二模块中对所述目标图像进行N次第二卷积处理和N次第三卷积处理,其中,所述第二卷积处理采用的卷积尺寸为1ⅹn,所述第三卷积处理采用的卷积尺寸为nⅹ1,N为大于1的整数,n为大于1的整数;
基于所述第二特征图进行行人重识别。
可选地,所述将所述目标图像输入到用于行人重识别的神经网络中的第一模块进行的预处理,包括:
对所述目标图像进行多次第一卷积处理,得到第一卷积处理结果;
对所述第一卷积处理结果进行自适配归一化SwitchableNorm,得到归一化层处理结果;
通过所述第一模块中的激活函数对所述归一化层处理结果进行处理,得到所述第一特征图。
可选地,所述通过所述第一模块中的激活函数对所述归一化层处理结果进行处理,得到所述第一特征图包括:
将所述归一化层处理结果输入至所述第一模块中的激活函数SiLU,以得到所述第一特征图,其中,所述第一特征图保留所述目标图像中的特征。
可选地,所述将所述第一特征图输入至所述神经网络中的第二模块进行的特征提取处理,包括:
对所述第一特征图进行N次第二卷积处理和N个第三卷积处理,得到第二卷积处理结果;
对所述第二卷积处理结果进行恒等映射处理,得到第二特征图。
可选地,所述对所述第一特征图进行N次第二卷积处理和N个第三卷积处理,得到第二卷积处理结果包括:
将所述第一特征图输入至K个卷积层,在每一个卷积层中对所述第一特征图进行N次第二卷积处理和N个第三卷积处理,以得到K个子特征图,K为大于1的正整数;
对K个子特征图进行相加处理,得到所述第二卷积处理结果。
可选地,在所述对所述第一特征图进行N次第二卷积处理和N个第三卷积处理,得到第二卷积处理结果之后,所述方法还包括:
对所述第二卷积处理结果进行全局平均池化,以得到对应所述第二卷积处理结果的权重图,所述权重图用于表示所述第二特征图中各个特征的权重值;
依据所述权重图调整所述神经网络对所述第二卷积处理结果中各个特征的关注度。
可选地,所述基于所述第二特征图进行行人重识别包括:
对所述第一特征图和所述第二特征图进行相加处理,得到第三特征图;
基于所述第三特征图提取对应所述目标图像的特征,以供所述神经网络进行行人重识别。
可选地,在将所述第一特征图输入至所述神经网络中的第二模块进行特征提取处理,得到第二特征图之后,所述方法还包括:
将所述第三特征图输入至所述神经网络中的第三模块进行特征提取处理,得到第四特征图,在所述第三模块中对所述目标图像进行N次第四卷积处理和N次第五卷积处理,其中,所述第四卷积处理采用的卷积尺寸为1ⅹn,所述第五卷积处理采用的卷积尺寸为nⅹ1。
第二方面,本发明实施例提供了一种行人重识别装置,包括:
第一获取模块,用于获取采集设备采集到的包含行人的目标图像;
第一处理模块,用于将所述目标图像输入到用于行人重识别的神经网络中的第一模块进行预处理,得到第一特征图,在所述第一模块中对所述目标图像进行多次第一卷积处理,且每次所述第一卷积处理采用的卷积尺寸相同;
第二处理模块,用于将所述第一特征图输入至所述神经网络中的第二模块进行特征提取处理,得到第二特征图,在所述第二模块中对所述目标图像进行N次第二卷积处理和N次第三卷积处理,其中,所述第二卷积处理采用的卷积尺寸为1ⅹn,所述第三卷积处理采用的卷积尺寸为nⅹ1,N为大于1的整数,n为大于1的整数;
执行模块,用于基于所述第二特征图进行行人重识别。
可选地,所述第一处理模块中的预处理包括:
对所述目标图像进行多次第一卷积处理,得到第一卷积处理结果;
对所述第一卷积处理结果进行自适配归一化SwitchableNorm,得到归一化层处理结果;
通过所述第一模块中的激活函数对所述归一化层处理结果进行处理,得到所述第一特征图。
可选地,所述第一处理模块中所述通过所述第一模块中的激活函数对所述归一化层处理结果进行处理,得到所述第一特征图包括:
将所述归一化层处理结果输入至所述第一模块中的激活函数SiLU,以得到所述第一特征图,其中,所述第一特征图保留所述目标图像中的特征。
可选地,所述第二处理模块中的特征提取处理包括:
对所述第一特征图进行N次第二卷积处理和N个第三卷积处理,得到第二卷积处理结果;
对所述第二卷积处理结果进行恒等映射处理,得到第二特征图。
可选地,所述第二处理模块中对所述第一特征图进行N次第二卷积处理和N个第三卷积处理,得到第二卷积处理结果包括:
将所述第一特征图输入至K个卷积层,在每一个卷积层中对所述第一特征图进行N次第二卷积处理和N个第三卷积处理,以得到K个子特征图,K为大于1的正整数;
对K个子特征图进行相加处理,得到所述第二卷积处理结果。
可选地,所述装置还包括:
第三处理模块,用于对所述第二卷积处理结果进行全局平均池化,以得到对应所述第二卷积处理结果的权重图,所述权重图用于表示所述第二特征图中各个特征的权重值;
第一调整模块,用于依据所述权重图调整所述神经网络对所述第二卷积处理结果中各个特征的关注度。
可选地,所述执行模块包括:
第一处理单元,用于对所述第一特征图和所述第二特征图进行相加处理,得到第三特征图;
提取单元,用于基于所述第三特征图提取对应所述目标图像的特征,以供所述神经网络进行行人重识别。
可选地,所述装置还包括:
第四处理模块,用于将所述第三特征图输入至所述神经网络中的第三模块进行特征提取处理,得到第四特征图,在所述第三模块中对所述目标图像进行N次第四卷积处理和N次第五卷积处理,其中,所述第四卷积处理采用的卷积尺寸为1ⅹn,所述第五卷积处理采用的卷积尺寸为nⅹ1。
第三方面,本发明实施例提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面所述的行人重识别方法。
第四方面,本发明实施例提供了一种存储介质,包括:
一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行第一方面所述的行人重识别方法。
本发明中实施例中,首先从采集设备中获取包含行人的目标图像,目标图像由采集设备采集得到,然后将目标图像输入至神经网络中的第一模块,由第一模块对目标图像进行多次卷积尺寸相同的卷积处理,以得到第一特征图,接着将第一特征图输入至神经网络中的第二模块,由第二模块对第一特征图再次进行多次卷积尺寸为1ⅹn和nⅹ1的卷积处理,以得到第二特征图,最后根据第二特征图对特定行人进行识别,通过第一卷积处理和第二卷积处理能够在保证计算精度的同时,减少计算过程中产生的参数量,从而加快对于目标图像的计算速度和处理效率,进而提高对图像中特定行人的识别效果。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种行人重识别方法的流程示意图;
图2是激活函数SiLU和激活函数ReLU的函数示意图;
图3是本发明实施例提供的第一模块的结构示意图;
图4是现有技术中第二模块的结构示意图;
图5是本发明实施例提供的第二模块的结构示意图;
图6是本发明实施例提供的一种行人重识别装置的结构示意图;
图7是用来实现本发明实施例的行人重识别方法的电子设备的框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
请参见图1,图1是本发明实施例提供的一种行人重识别方法的流程示意图,如图1所示,包括以下步骤:
步骤101、获取采集设备采集到的包含行人的目标图像;
步骤102、将所述目标图像输入到用于行人重识别的神经网络中的第一模块进行预处理,得到第一特征图,在所述第一模块中对所述目标图像进行多次第一卷积处理,且每次所述第一卷积处理采用的卷积尺寸相同;
步骤103、将所述第一特征图输入至所述神经网络中的第二模块进行特征提取处理,得到第二特征图,在所述第二模块中对所述目标图像进行N次第二卷积处理和N次第三卷积处理,其中,所述第二卷积处理采用的卷积尺寸为1ⅹn,所述第三卷积处理采用的卷积尺寸为nⅹ1,N为大于1的整数,n为大于1的整数;
步骤104、基于所述第二特征图进行行人重识别。
其中,上述行人重识别方法所包括的步骤101、步骤102、步骤103以及步骤104可以是由电子设备来执行,例如:计算机等设备,对此本发明实施例不作限定。
另外,上述行人重识别方法中的神经网络可以是卷积神经网络(ConvolutionalNeural Networks,CNN),并且上述行人重识别方法可以是基于全方位网络(Omni-ScaleNetwork,OSNet)模型来对目标图像进行特征提取处理,从而完成行人重识别。
在步骤101中,上述采集设备可以是包括摄像头、摄像机、相机、扫描仪、以及其他带有拍照功能的设备(例如:手机、平板电脑等),本发明实施例对此不作限定。
另外,上述目标图像可以是以像素形式存储于电子设备中,例如:上述目标图像以像素形式存储于计算机设备中,并且可以得到对应上述目标图像的权重图,计算机设备可以基于上述权重图完成上述行人重识别方法中每一个步骤。
在步骤102中,需要对上述目标图像进行预处理,即将上述目标图像通过上述第一模块进行多次第一卷积处理,从而得到上述第一特征图,上述第一模块可以理解为上述神经网络中的输入部分。
其中,在上述目标图像经历每一次第一卷积处理时,需要预设具有一定尺寸的卷积核,对上述目标图像的卷积运算可以理解为将上述目标图像对应的权重图与卷积核进行乘加运算。
另外,预设卷积核的尺寸可以是根据神经网络模型以及上述目标图像进行设定,对此本发明实施例不作限定。
在一些可选的实施方式中,将上述目标图像输入到用于行人重识别的神经网络中的上述第一模块进行预处理,得到上述第一特征图,在上述第一模块中对上述目标图像进行三次上述第一卷积处理,且每次上述第一卷积处理采用的卷积尺寸,即卷积核的尺寸为3×3,通过该方式,可以使得上述目标图像达到通过一次7×7卷积处理的效果,但是相较于这两种方式,通过三次卷积尺寸为3×3的处理,能够减少计算过程中产生的参数量,从而提高上述行人重识别方法的计算速度,进而做到神经网络模型的轻量化。
需要说明的是,通过卷积处理后的上述目标图像所对应的尺寸应小于上述目标图像对应的尺寸,并且在上述目标图像通过卷积处理后,还可以是进行归一化的处理,最后可以通过激活函数将上述第一特征图映射至上述第二模块中。
在步骤103中,需要对上述第一特征图进行特征提取处理,即将上述第一特征图通过上述第二模块进行N次第二卷积处理和N次第三卷积处理,从而得到上述第二特征图。
其中,在上述第一特征图经历N次第二卷积处理和N次第三卷积处理时,需要预设具有一定尺寸的卷积核,对上述第一特征图的卷积运算可以理解为将上述第一特征图与卷积核进行乘加运算。
另外,预设卷积核的尺寸可以是根据神经网络模型以及上述目标图像进行设定,对此本发明实施例不作限定。
在一些可选的实施方式中,将上述第一特征图映射到用于行人重识别的神经网络中的上述第二模块进行特征提取处理,得到上述第二特征图,在上述第二模块中将上述第一特征图分别通过四个分支进行卷积运算,且每次上述第二卷积处理采用的卷积尺寸,即卷积核的尺寸为1×3,每次上述第三卷积处理采用的卷积尺寸,即卷积核的尺寸为3×1,其中,第一个分支采用一次第二卷积处理和一次第三卷积处理,第二个分支采用两次第二卷积处理和两次第三卷积处理,第三个分支采用三次第二卷积处理和三次第三卷积处理,第四个分支采用四次第二卷积处理和四次第三卷积处理,通过该方式,可以进一步地能够减少计算过程中产生的参数量,从而提高上述行人重识别方法的计算速度,进而做到神经网络模型的轻量化。
需要说明的是,通过第二卷积处理和第三卷积处理后,还可以是进行全局平均池化的处理,以供神经网络通过一个权重矩阵,从通道域的角度赋予图像不同位置不同的权重,得到更重要的特征信息。
在步骤104中,将上述第一特征图和上述第二特征图相加处理得到可供神经网络进行行人重识别的特征图。
需要说明的是,若通过上述神经网络中上述第二模块处理后的特征图不满足特征提取的条件,则需要将上述第二特征图再次通过与上述第二模块结构相同的模块处理,例如:将上述第二特征图输入至第三模块,通过上述第三模块的处理,以得到第三特征图,最后将上述第一特征图和上述第三特征图相加,得到新的特征图,以供上述神经网络模型完成行人重识别。
其中,上述第二模块可以是通过激活函数将上述第二特征图映射至上述第三模块。
应理解,若上述第三特征图仍不满足特征提取的条件,则需要将上述第三特征图输入至下一个与上述第二模块结构相同的模块,进行处理,对于上述目标图像进行特征提取的次数,本发明实施例不作限定,可以是根据上述目标图像本身具有的属性来确定。
该实施方案中,首先从采集设备中获取包含行人的目标图像,目标图像由采集设备采集得到,然后将目标图像输入至神经网络中的第一模块,由第一模块对目标图像进行多次卷积尺寸相同的卷积处理,以得到第一特征图,接着将第一特征图输入至神经网络中的第二模块,由第二模块对第一特征图再次进行多次卷积尺寸为1ⅹn和nⅹ1的卷积处理,以得到第二特征图,最后根据第二特征图对特定行人进行识别,通过第一卷积处理和第二卷积处理能够在保证计算精度的同时,减少计算过程中产生的参数量,从而加快对于目标图像的计算速度和处理效率,进而提高对图像中特定行人的识别效果。
可选地,所述将所述目标图像输入到用于行人重识别的神经网络中的第一模块进行的预处理,包括:
对所述目标图像进行多次第一卷积处理,得到第一卷积处理结果;
对所述第一卷积处理结果进行自适配归一化SwitchableNorm,得到归一化层处理结果;
通过所述第一模块中的激活函数对所述归一化层处理结果进行处理,得到所述第一特征图。
在该实施方案中,上述预处理主要包括对上述目标图像进行预设次数的上述第一卷积处理,接着将上述第一卷积处理结果进行归一化处理,最后通过激活函数对上述归一化层处理结果进行处理,得到可以映射至上述第二模块的上述第一特征图,其中,上述神经网络采用自适配归一化SwitchableNorm,通过该方法,统一了多种归一化方法,并赋予权重至各个归一化方法,通过上述神经网络的不断学习来对上述第一卷积处理结果采用对应的归一化方法,自适配归一化SwitchableNorm是一种任务与数据驱动的归一化方法,它对各种归一化技术对训练所产生的影响进行激励或者抑制,从而提高了对于特定行人的识别效果。
其中,自适配归一化SwitchableNorm包括但不限于批归一化(BatchNormalization,BN)、实例归一化(Instance Normalization,IN)和层归一化(LayerNormalization,LN),上述神经网络根据不同任务来调整归一化方法的策略,即可以理解为上述神经网络根据上述第一卷积处理结果对应的属性及数据来确定归一化方法,大大提高了上述行人重识别方法中计算过程的质量。
可选地,所述通过所述第一模块中的激活函数对所述归一化层处理结果进行处理,得到所述第一特征图包括:
将所述归一化层处理结果输入至所述第一模块中的激活函数SiLU,以得到所述第一特征图,其中,所述第一特征图保留所述目标图像中的特征。
应理解,激活函数在上述神经网络中起到至关重要的作用,激活函数可以将非线性特性引入至上述神经网络中,若在相关实施方式中取消激活函数的使用,则上述第一模块输出结果仅表示线性函数,进而使得上述神经网络无法学习和模拟其他复杂类型的数据,例如本发明提供的行人重识别方法中的图像。
在该实施方案中,首先将上述归一化层处理结果输入至激活函数SiLU中,然后激活函数SiLU将得到的上述第一特征图映射至上述第二模块中,通过该方法,一方面可以使得上述神经网络更加强大,增加上述神经网络的能力,另一方面,激活函数SiLU还可以执行数据的归一化,将输入数据映射到某个范围内,再往下传递,即传递至上述第二模块,从而限制数据的扩张,防止数据过大导致的溢出风险。
需要说明的是,激活函数SiLU也可以称为S型(Sigmoid)加权线性组合,其中,激活函数SiLU可以通过下式表示:
其中,σ(x)表示激活函数SiLU,x表示自变量,e表示自然常数。
在一些可选的实施方式中,可以在上述神经网络中调用激活函数ReLU,请参见图2,图2是激活函数SiLU和激活函数ReLU的函数示意图,如图2所示,对于较大的横坐标值,激活函数SiLU的激活大约等于激活函数ReLU的激活,当横坐标值取-1.28左右时,激活函数SiLU的全局最小值约为-0.28,激活函数SiLU相较于激活函数ReLU存在递减的区域,使得激活函数SiLU具有自稳定特性,并且能够抑制上述神经网络中大数量权重的学习。
作为一种优选地的实施方式,请参见图3,图3是上述第一模块的示意图,如图3所示,首先将上述目标图像输入至上述第一模块,并且上述目标图像经历三次卷积尺寸为3×3的卷积运算,以得到第一卷积处理结果,然后将上述第一卷积处理结果输入至自适配归一化SwitchableNorm进行归一化处理,以得到上述归一化层处理结果,最后将上述归一化层处理结果通过激活函数SiLU映射至上述第二模块。
可选地,所述将所述第一特征图输入至所述神经网络中的第二模块进行的特征提取处理,包括:
对所述第一特征图进行N次第二卷积处理和N个第三卷积处理,得到第二卷积处理结果;
对所述第二卷积处理结果进行恒等映射处理,得到第二特征图。
在该实施方案中,首先需要对上述第一特征图进行N次第二卷积处理和N个第三卷积处理,然后将上述第二卷积处理结果进行恒等映射处理,最终才得到上述第二特征图,通过该方法,对上述第一特征图进行多层的卷积计算,进一步地减少了计算量,从而加快计算的速度和效率,另外对上述第二卷积处理结果进行恒等映射处理,可以解决梯度消失的问题,提高了上述神经网络的稳定性,进而提高上述行人重识别方法的识别效果。
可选地,所述对所述第一特征图进行N次第二卷积处理和N个第三卷积处理,得到第二卷积处理结果包括:
将所述第一特征图输入至K个卷积层,在每一个卷积层中对所述第一特征图进行N次第二卷积处理和N个第三卷积处理,以得到K个子特征图,K为大于1的正整数;
对K个子特征图进行相加处理,得到所述第二卷积处理结果。
在该实施方案中,首先将上述第一特征图分别输入至K个卷积层,也可以理解为将上述第一特征图分别输入至K个分支,在K个分支中都需要对上述第一特征图进行多次第二卷积处理和第三卷积处理,上述第一特征图在每个分支中经历的第二卷积处理和第三卷积处理的次数可以是不同的,最后得到由K个子特征图相加的上述第二卷积处理结果。
请参见图4和图5,图4是现有技术中对应第二模块的示意图,图5是本发明实施例中对应第二模块的示意图,如图5所示,上述第二模块将上述第一特征图分别输入至四个分支中,对于第二卷积处理而言,从左至右在每一个分支中依次经历一次卷积尺寸为1×3的卷积运算、两次卷积尺寸为1×3的卷积运算、三次卷积尺寸为1×3的卷积运算和四次卷积尺寸为1×3的卷积运算,对于第三卷积处理而言,从左至右在每一个分支中依次经历一次卷积尺寸为3×1的卷积运算、两次卷积尺寸为3×1的卷积运算、三次卷积尺寸为3×1的卷积运算和四次卷积尺寸为3×1的卷积运算,经历上述第二卷积处理和上述第三卷积处理后,将四个子特征图相加得到上述第二卷积处理结果。
通过图5的实施方式能够达到图4中实施方案所达到的效果,并且图5中的实施方式相较于图4中的实施方式,能够在计算过程中减小参数量,进而提高上述行人重识别方法的识别速度、效率及效果。
可选地,在所述对所述第一特征图进行N次第二卷积处理和N个第三卷积处理,得到第二卷积处理结果之后,所述方法还包括:
对所述第二卷积处理结果进行全局平均池化,以得到对应所述第二卷积处理结果的权重图,所述权重图用于表示所述第二特征图中各个特征的权重值;
依据所述权重图调整所述神经网络对所述第二卷积处理结果中各个特征的关注度。
在该实施方案中,通过在上述神经网络中添加SE注意力机制来得到重要的特性信息,首先对上述第二卷积处理结果进行全局平均池化,以得到对应上述第二卷积处理结果的权重图,依据上述权重图确定特征信息中更为重要的特征信息,即通过上述权重图中每一个特征对应的权重确定,从而使得上述神经网络对这些重要的特征信息设置为高关注度,进而提高了上述行人重识别方法的识别效果。
可选地,所述基于所述第二特征图进行行人重识别包括:
对所述第一特征图和所述第二特征图进行相加处理,得到第三特征图;
基于所述第三特征图提取对应所述目标图像的特征,以供所述神经网络进行行人重识别。
可以是将上述第一特征图和上述第二特征图进行相加处理,因为上述第一特征图和上述第二特征图的尺寸一致,所以可以得到上述第三特征图,在上述第三特征图满足特征提取要求的情况下,上述神经网络依据上述第三特征图完成对上述目标图像的特征提取处理,再而完成后续的行人重识别操作。
可选地,在将所述第一特征图输入至所述神经网络中的第二模块进行特征提取处理,得到第二特征图之后,所述方法还包括:
将所述第三特征图输入至所述神经网络中的第三模块进行特征提取处理,得到第四特征图,在所述第三模块中对所述目标图像进行N次第四卷积处理和N次第五卷积处理,其中,所述第四卷积处理采用的卷积尺寸为1ⅹn,所述第五卷积处理采用的卷积尺寸为nⅹ1。
在上述第三特征图不满足特征提取要求的情况下,需要将上述第三特征图再次经历如上述第二模块中的处理,即将上述第三特征图输入至所述神经网络中的第三模块进行特征提取处理,得到第四特征图,在上述第三模块中对所述目标图像进行N次第四卷积处理和N次第五卷积处理,最后将上述第四特征图与上述第一特征图进行相加处理,从而得到第五特征图,最后由上述神经网络依据上述第五特征图完成对上述目标图像的特征提取处理,再而完成后续的行人重识别操作。
需要说明的是,若上述第五特征图仍然不满足特征提取的要求,则需要将上述第五特征图再次经历如上述第二模块中的处理,具体经历的次数需要根据上述神经网络中的要求而定,本发明实施例不作限定。
请参见图6,图6是本发明实施例提供的一种行人重识别装置的结构示意图,如图6所示,行人重识别装置600包括:
第一获取模块601,用于获取采集设备采集到的包含行人的目标图像;
第一处理模块602,用于将所述目标图像输入到用于行人重识别的神经网络中的第一模块进行预处理,得到第一特征图,在所述第一模块中对所述目标图像进行多次第一卷积处理,且每次所述第一卷积处理采用的卷积尺寸相同;
第二处理模块603,用于将所述第一特征图输入至所述神经网络中的第二模块进行特征提取处理,得到第二特征图,在所述第二模块中对所述目标图像进行N次第二卷积处理和N次第三卷积处理,其中,所述第二卷积处理采用的卷积尺寸为1ⅹn,所述第三卷积处理采用的卷积尺寸为nⅹ1,N为大于1的整数,n为大于1的整数;
执行模块604,用于基于所述第二特征图进行行人重识别。
可选地,所述第一处理模块中的预处理包括:
对所述目标图像进行多次第一卷积处理,得到第一卷积处理结果;
对所述第一卷积处理结果进行自适配归一化SwitchableNorm,得到归一化层处理结果;
通过所述第一模块中的激活函数对所述归一化层处理结果进行处理,得到所述第一特征图。
可选地,所述第一处理模块中所述通过所述第一模块中的激活函数对所述归一化层处理结果进行处理,得到所述第一特征图包括:
将所述归一化层处理结果输入至所述第一模块中的激活函数SiLU,以得到所述第一特征图,其中,所述第一特征图保留所述目标图像中的特征。
可选地,所述第二处理模块中的特征提取处理包括:
对所述第一特征图进行N次第二卷积处理和N个第三卷积处理,得到第二卷积处理结果;
对所述第二卷积处理结果进行恒等映射处理,得到第二特征图。
可选地,所述第二处理模块中对所述第一特征图进行N次第二卷积处理和N个第三卷积处理,得到第二卷积处理结果包括:
将所述第一特征图输入至K个卷积层,在每一个卷积层中对所述第一特征图进行N次第二卷积处理和N个第三卷积处理,以得到K个子特征图,K为大于1的正整数;
对K个子特征图进行相加处理,得到所述第二卷积处理结果。
可选地,所述装置还包括:
第三处理模块,用于对所述第二卷积处理结果进行全局平均池化,以得到对应所述第二卷积处理结果的权重图,所述权重图用于表示所述第二特征图中各个特征的权重值;
第一调整模块,用于依据所述权重图调整所述神经网络对所述第二卷积处理结果中各个特征的关注度。
可选地,所述执行模块包括:
第一处理单元,用于对所述第一特征图和所述第二特征图进行相加处理,得到第三特征图;
提取单元,用于基于所述第三特征图提取对应所述目标图像的特征,以供所述神经网络进行行人重识别。
可选地,所述装置还包括:
第四处理模块,用于将所述第三特征图输入至所述神经网络中的第三模块进行特征提取处理,得到第四特征图,在所述第三模块中对所述目标图像进行N次第四卷积处理和N次第五卷积处理,其中,所述第四卷积处理采用的卷积尺寸为1ⅹn,所述第五卷积处理采用的卷积尺寸为nⅹ1。
根据本发明的实施例,本发明还提供了一种电子设备、一种可读存储介质。
图7示出了可以用来实施本发明实施例的示例电子设备700的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图7所示,设备700包括计算单元701,其可以根据存储在只读存储器(Read-OnlyMemory,ROM)702中的计算机程序或者从存储单元708加载到随机访问存储器(RandomAccess Memory,RAM)703中的计算机程序,来执行各种适当的动作和处理。在RAM 703中,还可存储设备700操作所需的各种程序和数据。计算单元701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(Input/Output,I/O)接口705也连接至总线704。
设备700中的多个部件连接至I/O接口705,包括:输入单元706,例如键盘、鼠标等;输出单元707,例如各种类型的显示器、扬声器等;存储单元708,例如磁盘、光盘等;以及通信单元709,例如网卡、调制解调器、无线通信收发机等。通信单元709允许设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元701可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元701的一些示例包括但不限于中央处理单元(Central processing unit,CPU)、图形处理单元(Graphics processing unit,GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元701执行上文所描述的各个方法和处理,例如行人重识别方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(Field Programmable Gate Array,FPGA)、专用集成电路(Application Specific Integrated Circuit,ASIC)、专用标准产品(ApplicationSpecific Standard Parts,ASSP)、芯片上系统(System on Chip,SOC)、复杂可编程逻辑设备(Complex Programmable logic device,CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(计算机存储器(Erasable Programmable Read-Only Memory,EPROM)或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置;以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网、广域网和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (12)
1.一种行人重识别方法,其特征在于,包括:
获取采集设备采集到的包含行人的目标图像;
将所述目标图像输入到用于行人重识别的神经网络中的第一模块进行预处理,得到第一特征图,在所述第一模块中对所述目标图像进行多次第一卷积处理,且每次所述第一卷积处理采用的卷积尺寸相同;
所述将所述目标图像输入到用于行人重识别的神经网络中的第一模块进行的预处理,包括:
对所述目标图像进行多次第一卷积处理,得到第一卷积处理结果;
对所述第一卷积处理结果进行自适配归一化SwitchableNorm,得到归一化层处理结果;
通过所述第一模块中的激活函数对所述归一化层处理结果进行处理,得到所述第一特征图;
将所述第一特征图输入至所述神经网络中的第二模块进行特征提取处理,得到第二特征图,在所述第二模块中对所述目标图像进行N次第二卷积处理和N次第三卷积处理,其中,所述第二卷积处理采用的卷积尺寸为1ⅹn,所述第三卷积处理采用的卷积尺寸为nⅹ1,N为大于1的整数,n为大于1的整数;
所述将所述第一特征图输入至所述神经网络中的第二模块进行的特征提取处理,包括:
对所述第一特征图进行N次第二卷积处理和N个第三卷积处理,得到第二卷积处理结果;
对所述第二卷积处理结果进行恒等映射处理,得到第二特征图;
基于所述第二特征图进行行人重识别;
所述基于所述第二特征图进行行人重识别包括:
对所述第一特征图和所述第二特征图进行相加处理,得到第三特征图;
基于所述第三特征图提取对应所述目标图像的特征,以供所述神经网络进行行人重识别。
2.根据权利要求1所述的行人重识别方法,其特征在于,所述通过所述第一模块中的激活函数对所述归一化层处理结果进行处理,得到所述第一特征图包括:
将所述归一化层处理结果输入至所述第一模块中的激活函数SiLU,以得到所述第一特征图,其中,所述第一特征图保留所述目标图像中的特征。
3.根据权利要求1所述的行人重识别方法,其特征在于,所述对所述第一特征图进行N次第二卷积处理和N个第三卷积处理,得到第二卷积处理结果包括:
将所述第一特征图输入至K个卷积层,在每一个卷积层中对所述第一特征图进行N次第二卷积处理和N个第三卷积处理,以得到K个子特征图,K为大于1的正整数;
对K个子特征图进行相加处理,得到所述第二卷积处理结果。
4.根据权利要求1所述的行人重识别方法,其特征在于,在所述对所述第一特征图进行N次第二卷积处理和N个第三卷积处理,得到第二卷积处理结果之后,所述方法还包括:
对所述第二卷积处理结果进行全局平均池化,以得到对应所述第二卷积处理结果的权重图,所述权重图用于表示所述第二特征图中各个特征的权重值;
依据所述权重图调整所述神经网络对所述第二卷积处理结果中各个特征的关注度。
5.根据权利要求1所述的行人重识别方法,其特征在于,在将所述第一特征图输入至所述神经网络中的第二模块进行特征提取处理,得到第二特征图之后,所述方法还包括:
将所述第三特征图输入至所述神经网络中的第三模块进行特征提取处理,得到第四特征图,在所述第三模块中对所述目标图像进行N次第四卷积处理和N次第五卷积处理,其中,所述第四卷积处理采用的卷积尺寸为1ⅹn,所述第五卷积处理采用的卷积尺寸为nⅹ1。
6.一种行人重识别装置,其特征在于,包括:
第一获取模块,用于获取采集设备采集到的包含行人的目标图像;
第一处理模块,用于将所述目标图像输入到用于行人重识别的神经网络中的第一模块进行预处理,得到第一特征图,在所述第一模块中对所述目标图像进行多次第一卷积处理,且每次所述第一卷积处理采用的卷积尺寸相同;
所述第一处理模块中的预处理包括:
对所述目标图像进行多次第一卷积处理,得到第一卷积处理结果;
对所述第一卷积处理结果进行自适配归一化SwitchableNorm,得到归一化层处理结果;
通过所述第一模块中的激活函数对所述归一化层处理结果进行处理,得到所述第一特征图;
第二处理模块,用于将所述第一特征图输入至所述神经网络中的第二模块进行特征提取处理,得到第二特征图,在所述第二模块中对所述目标图像进行N次第二卷积处理和N次第三卷积处理,其中,所述第二卷积处理采用的卷积尺寸为1ⅹn,所述第三卷积处理采用的卷积尺寸为nⅹ1,N为大于1的整数,n为大于1的整数;
所述第二处理模块中的特征提取处理包括:
对所述第一特征图进行N次第二卷积处理和N个第三卷积处理,得到第二卷积处理结果;
对所述第二卷积处理结果进行恒等映射处理,得到第二特征图;
执行模块,用于基于所述第二特征图进行行人重识别;
所述执行模块包括:
第一处理单元,用于对所述第一特征图和所述第二特征图进行相加处理,得到第三特征图;
提取单元,用于基于所述第三特征图提取对应所述目标图像的特征,以供所述神经网络进行行人重识别。
7.根据权利要求6所述的行人重识别装置,其特征在于,所述第一处理模块中所述通过所述第一模块中的激活函数对所述归一化层处理结果进行处理,得到所述第一特征图包括:
将所述归一化层处理结果输入至所述第一模块中的激活函数SiLU,以得到所述第一特征图,其中,所述第一特征图保留所述目标图像中的特征。
8.根据权利要求6所述的行人重识别装置,其特征在于,所述第二处理模块中对所述第一特征图进行N次第二卷积处理和N个第三卷积处理,得到第二卷积处理结果包括:
将所述第一特征图输入至K个卷积层,在每一个卷积层中对所述第一特征图进行N次第二卷积处理和N个第三卷积处理,以得到K个子特征图,K为大于1的正整数;
对K个子特征图进行相加处理,得到所述第二卷积处理结果。
9.根据权利要求6所述的行人重识别装置,其特征在于,所述装置还包括:
第三处理模块,用于对所述第二卷积处理结果进行全局平均池化,以得到对应所述第二卷积处理结果的权重图,所述权重图用于表示所述第二特征图中各个特征的权重值;
第一调整模块,用于依据所述权重图调整所述神经网络对所述第二卷积处理结果中各个特征的关注度。
10.根据权利要求6所述的行人重识别装置,其特征在于,所述装置还包括:
第四处理模块,用于将所述第三特征图输入至所述神经网络中的第三模块进行特征提取处理,得到第四特征图,在所述第三模块中对所述目标图像进行N次第四卷积处理和N次第五卷积处理,其中,所述第四卷积处理采用的卷积尺寸为1ⅹn,所述第五卷积处理采用的卷积尺寸为nⅹ1。
11.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至5中任一项所述的行人重识别方法。
12.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,其中,所述计算机指令用于使所述计算机执行根据权利要求1至5中任一项所述的行人重识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211550390.0A CN116012873B (zh) | 2022-12-05 | 2022-12-05 | 一种行人重识别方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211550390.0A CN116012873B (zh) | 2022-12-05 | 2022-12-05 | 一种行人重识别方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116012873A CN116012873A (zh) | 2023-04-25 |
CN116012873B true CN116012873B (zh) | 2024-01-26 |
Family
ID=86018428
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211550390.0A Active CN116012873B (zh) | 2022-12-05 | 2022-12-05 | 一种行人重识别方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116012873B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110399789A (zh) * | 2019-06-14 | 2019-11-01 | 佳都新太科技股份有限公司 | 行人重识别方法、模型构建方法、装置、设备和存储介质 |
CN111368969A (zh) * | 2020-02-05 | 2020-07-03 | 重庆特斯联智慧科技股份有限公司 | 基于残差神经网络的特征图处理方法、设备及存储介质 |
CN113033321A (zh) * | 2021-03-02 | 2021-06-25 | 深圳市安软科技股份有限公司 | 目标行人属性识别模型的训练方法及行人属性识别方法 |
CN114495010A (zh) * | 2022-02-14 | 2022-05-13 | 广东工业大学 | 一种基于多特征学习的跨模态行人重识别方法及系统 |
-
2022
- 2022-12-05 CN CN202211550390.0A patent/CN116012873B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110399789A (zh) * | 2019-06-14 | 2019-11-01 | 佳都新太科技股份有限公司 | 行人重识别方法、模型构建方法、装置、设备和存储介质 |
CN111368969A (zh) * | 2020-02-05 | 2020-07-03 | 重庆特斯联智慧科技股份有限公司 | 基于残差神经网络的特征图处理方法、设备及存储介质 |
CN113033321A (zh) * | 2021-03-02 | 2021-06-25 | 深圳市安软科技股份有限公司 | 目标行人属性识别模型的训练方法及行人属性识别方法 |
CN114495010A (zh) * | 2022-02-14 | 2022-05-13 | 广东工业大学 | 一种基于多特征学习的跨模态行人重识别方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN116012873A (zh) | 2023-04-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109829448B (zh) | 人脸识别方法、装置及存储介质 | |
CN112651438A (zh) | 多类别图像的分类方法、装置、终端设备和存储介质 | |
CN114186632B (zh) | 关键点检测模型的训练方法、装置、设备、存储介质 | |
CN111666905B (zh) | 模型训练方法、行人属性识别方法和相关装置 | |
CN108875487A (zh) | 行人重识别网络的训练及基于其的行人重识别 | |
CN111104911A (zh) | 一种基于大数据训练的行人重识别方法及装置 | |
CN111126254A (zh) | 图像识别方法、装置、设备及存储介质 | |
CN114913339B (zh) | 特征图提取模型的训练方法和装置 | |
CN116740355A (zh) | 自动驾驶图像的分割方法、装置、设备及存储介质 | |
CN113627421B (zh) | 一种图像处理方法、模型的训练方法以及相关设备 | |
CN111932530B (zh) | 三维对象检测方法、装置、设备和可读存储介质 | |
CN116071625B (zh) | 深度学习模型的训练方法、目标检测方法及装置 | |
CN108960246A (zh) | 一种用于图像识别的二值化处理装置及方法 | |
CN112668509A (zh) | 社交关系识别模型的训练方法、识别方法及相关设备 | |
CN116012873B (zh) | 一种行人重识别方法、装置、电子设备及存储介质 | |
CN115937537A (zh) | 一种目标图像的智能识别方法、装置、设备及存储介质 | |
CN112801045B (zh) | 一种文本区域检测方法、电子设备及计算机存储介质 | |
CN115346270A (zh) | 交警手势识别方法、装置、电子设备及存储介质 | |
CN112801083B (zh) | 图像识别的方法、装置、设备以及存储介质 | |
CN116188875B (zh) | 图像分类方法、装置、电子设备、介质和产品 | |
CN111815658A (zh) | 一种图像识别方法及装置 | |
CN114581746B (zh) | 物体检测方法、装置、设备及介质 | |
CN118429649B (zh) | 一种图像分割方法、装置、电子设备及存储介质 | |
CN117333487B (zh) | 一种痘痘分级方法、装置、设备及存储介质 | |
CN113609951B (zh) | 目标检测模型的训练和目标检测方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |