CN113221796A - 一种基于向量神经元的行人属性识别方法和系统 - Google Patents

一种基于向量神经元的行人属性识别方法和系统 Download PDF

Info

Publication number
CN113221796A
CN113221796A CN202110565472.1A CN202110565472A CN113221796A CN 113221796 A CN113221796 A CN 113221796A CN 202110565472 A CN202110565472 A CN 202110565472A CN 113221796 A CN113221796 A CN 113221796A
Authority
CN
China
Prior art keywords
capsule
network
vector
pedestrian
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110565472.1A
Other languages
English (en)
Other versions
CN113221796B (zh
Inventor
吴俊毅
姚灿荣
高志鹏
赵建强
杜新胜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Meiya Pico Information Co Ltd
Original Assignee
Xiamen Meiya Pico Information Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Meiya Pico Information Co Ltd filed Critical Xiamen Meiya Pico Information Co Ltd
Priority to CN202110565472.1A priority Critical patent/CN113221796B/zh
Publication of CN113221796A publication Critical patent/CN113221796A/zh
Application granted granted Critical
Publication of CN113221796B publication Critical patent/CN113221796B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Abstract

本发明给出了一种基于向量神经元的行人属性识别方法和系统,包括用全尺寸网络OSNet作为行人属性识别的主干网络,其中,全尺寸网络OSNet的卷积层包括点卷积层和深度可分离卷积层;将包括向量神经元的胶囊网络嵌入主干网络中学习不同属性之间的内在联系;将图像依次经过主干网络和胶囊网络识别获取行人属性。该方法和系统在不损失精度的情况下,可将模型参数量变为ResNet50的十分之一,加快识别的运行速度,利用胶囊网络的向量神经元来增加不同属性内在关联,通过不同属性间的内在关联,增加行人属性识别的精度。

Description

一种基于向量神经元的行人属性识别方法和系统
技术领域
本发明涉及计算机图像分析的技术领域,尤其是一种基于向量神经元的行人属性识别方法和系统。
背景技术
近年来,行人属性是智能监控视频系统的一个主要研究课题,受到了广泛的应用关注。目前行人属性识别主要是基于神经网络(例如:ResNet50或者Inception)的方法挖掘图像中的特征,将行人属性识别认为是一个多标签分类问题。然而,在实际的运用中,ResNet50和Inception的模型参数量过多,导致运行速度受到了一定程度的限制;并且目前方法没有考虑到不同行人属性间的内在联系。
行人属性识别是智能监控系统中一个重要的研究课题,其目的是在不同视角下识别出行人身上的属性,对于公共安全的防护有重要的应用意义,可以用于行人再识别或者人脸识别等领域。目前行人属性识别是一个具有挑战性的研究课题,图像的分辨率较低、不同角度下的属性有时候会产生轻微变化,这些都会影响行人属性识别的性能。目前行人属性识别任务利用卷积神经网络(例如:ResNet50)来提取特征,将这些特征用于多标签的分类问题。然而,ResNet50网络参数量较大,用于实际应用中需要较强的硬件设施。除此之外,行人属性识别的采集可能是来自不同的摄像机角度,可能导致严重视角错乱问题,并且现实场景中的图片大多数是低分辨的,这些等因素都会影响行人属性识别性能。
目前行人属性识别的方法主要分为多任务学习和多标签分类问题,多任务学习根据属性类别数在卷进神经网络接上若干个分类层,每个分类层单独去判断这个属性是否存在,例如有n个属性,卷积神经网络最后一层卷积层特征为d维,那么分类层参数就需要2×n×d;行人属性识别另一种方法是多标签分类,在卷积神经网络后面接一个分类,分类层参数是n×d。在同样主干网络的情况下,多标签分类方法的分类层参数会小于多任务学习,因此目前对于实际场景应用更多是采用多标签分类。
多标签分类是直接将多类问题转换成二进制分类问题,结合二分类的交叉熵损失函数进行优化,这类方法在行人属性识别上取得了一定显著的性能。然而。这类方法存在一定的问题,它在训练中完全忽略了不同行人属性间的关联,比如属性是“女”,应该和“背包、裙子”等属性联系更加密切。
发明内容
为了解决现有技术中模型参数量过多导致运行速度受到限制、没有考虑到不同行人属性间的内在联系影响行人属性识别性能的技术问题,本发明提出了一种基于向量神经元的行人属性识别方法和系统,以解决上述技术问题。
根据本发明的一个方面,一种基于向量神经元的行人属性识别方法,包括:
S1:利用全尺寸网络OSNet作为行人属性识别的主干网络,其中,全尺寸网络OSNet的卷积层包括点卷积层和深度可分离卷积层;
S2:将包括向量神经元的胶囊网络嵌入主干网络中学习不同属性之间的内在联系;以及
S3:将图像依次经过主干网络和胶囊网络识别获取行人属性。
在一些具体的实施例中,向量神经元包括长度CL和方向CO,其中,CL来表示属性是否存在,利用CO来学习不同属性间存在的内在联系。通过该设置可以获取不同属性间的内在关联。
在一些具体的实施例中,图像经过主干网络获得行人特征,并将行人特征送入胶囊网络中获取行人属性。
在一些具体的实施例中,胶囊网络包括主要胶囊层和分类胶囊层。
在一些具体的实施例中,主要胶囊层采用8个卷积操作,其中卷积核大小为2×2,将8个卷积获得的特征连接获得M个8D的向量胶囊神经元,并确定胶囊的长度
Figure BDA0003080808660000021
Figure BDA0003080808660000022
其中,
Figure BDA0003080808660000023
代表主要胶囊层中第k个向量胶囊神经元,k∈[1,M],Dim=8D。
在一些具体的实施例中,分类胶囊层紧跟于主要胶囊层之后,将行人特征映射到Dim=8D映射到24D,通过公式
Figure BDA0003080808660000024
映射,分类胶囊层的分类计算公式为
Figure BDA0003080808660000025
其中,Dim2=24D,Dim=8D,Wk∈R24×8是一个权重矩阵,n∈[1,N],
Figure BDA0003080808660000026
表示胶囊网络中主要胶囊层和分类胶囊层之间动态路由过程的耦合系数。
在一些具体的实施例中,基于类别数设置分类胶囊层的胶囊神经元个数。
在一些具体的实施例中,行人属性识别网络的损失函数L包括交叉熵损失函数Lcross_entropy和胶囊网络的约束损失函数Lcapsule,计算公式为L=αLcross_entropy+Lcapsule
Figure BDA0003080808660000027
其中,α表示交叉熵损失函数的权重,yn代表输入数据的标签,λ=0.5用来平衡前后两部分,m+和m-用来控制
Figure BDA0003080808660000031
的长度。
根据本发明的第二方面,提出了一种计算机可读存储介质,其上存储有一或多个计算机程序,该一或多个计算机程序被计算机处理器执行时实施上述任一项的方法。
根据本申请的第三方面,一种基于向量神经元的行人属性识别系统,该系统包括:
主干网络:利用全尺寸网络OSNet作为行人属性识别的主干网络,其中,全尺寸网络OSNet的卷积层包括点卷积层和深度可分离卷积层;
胶囊网络:将包括向量神经元的胶囊网络嵌入主干网络中学习不同属性之间的内在联系;
行人属性识别单元:配置用于将图像依次经过主干网络和胶囊网络识别获取行人属性。
在一些具体的实施例中,向量神经元包括长度CL和方向CO,其中,CL来表示属性是否存在,利用CO来学习不同属性间存在的内在联系。
在一些具体的实施例中,胶囊网络包括主要胶囊层和分类胶囊层,主要胶囊层采用8个卷积操作,其中卷积核大小为2×2,将8个卷积获得的特征连接获得M个8D的向量胶囊神经元,并确定胶囊的长度
Figure BDA0003080808660000032
其中,
Figure BDA0003080808660000033
代表主要胶囊层中第k个向量胶囊神经元,k∈[1,M],Dim=8D。
在一些具体的实施例中,分类胶囊层紧跟于主要胶囊层之后,将行人特征映射到Dim=8D映射到24D,通过公式
Figure BDA0003080808660000034
映射,分类胶囊层的分类计算公式为
Figure BDA0003080808660000035
其中,Dim2=24D,Dim=8D,Wk∈R24×8是一个权重矩阵,n∈[1,N],
Figure BDA0003080808660000036
表示胶囊网络中主要胶囊层和分类胶囊层之间动态路由过程的耦合系数。
在一些具体的实施例中,行人属性识别网络的损失函数L包括交叉熵损失函数Lcross_entropy和胶囊网络的约束损失函数Lcapsule,计算公式为L=αLcross_entropy+Lcapsule
Figure BDA0003080808660000037
其中,α表示交叉熵损失函数的权重,yn代表输入数据的标签,λ=0.5用来平衡前后两部分,m+和m-用来控制
Figure BDA0003080808660000038
的长度。
本发明提出了一种基于向量神经元的行人属性识别方法和系统,该方法采用轻量级网络,在模型中更多使用1*1卷积层,来降低模型的参数,在不损失精度的情况下,将模型参数量变为ResNet50的十分之一,加快识别的运行速度;为了增加不同属性间的关联,在模型中引入向量神经元(即胶囊网络),利用胶囊网络的第一维度来表示这个属性是否存在,用胶囊网络的第二维度来感应不同属性间的关联。本发明提出的行人属性识别方法,在公开数据集上均获得具有竞争力的性能,并且具有较好的现实应用意义。
附图说明
包括附图以提供对实施例的进一步理解并且附图被并入本说明书中并且构成本说明书的一部分。附图图示了实施例并且与描述一起用于解释本发明的原理。将容易认识到其它实施例和实施例的很多预期优点,因为通过引用以下详细描述,它们变得被更好地理解。通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请的一个实施例的基于向量神经元的行人属性识别方法的流程图;
图2a、b是本申请的一个具体的实施例的标准卷积和深度可分离卷积的网络结构示意图;
图3a、b是本申请的一个具体的实施例的残差结构的卷积块及其扩展的网络结构图;
图4是本申请的一个实施例的基于向量神经元的行人属性识别系统的框架图;
图5是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
根据本申请的一个实施例的基于向量神经元的行人属性识别方法,图1示出了根据本申请的实施例的基于向量神经元的行人属性识别方法的流程图。如图1所示,该方法包括:
S101:利用全尺寸网络OSNet作为行人属性识别的主干网络,其中,全尺寸网络OSNet的卷积层包括点卷积层和深度可分离卷积层。
在具体的实施例中,本申请采用轻量级模型Omi-Scale Network(OSNet)来作为行人属性识别的轻量级主干网络,其中,标准3*3卷积块如图2a所示,而本申请中将标准3*3卷积块变更为点卷积层和深度可分离卷积层,以减少参数的数量。OSNet的模块如图3所示,OSNet的主要卷积块是利用图2b结合残差网络ResNet50的思想构造而成,形成类似残差结构轻量残差卷积块,具体如图3a所示;在OSNet的整体网络中,利用缩放因子来对图3a进行构建获得如图4中的结构,该结构允许在当前层中学习到的较小尺度的特性在下一层中有效地保存,从而使最终的特性能够捕获整个空间尺度范围。
S102:将包括向量神经元的胶囊网络嵌入主干网络中学习不同属性之间的内在联系。
在具体的实施例中,在OSNet为主干网络的基础上,添加向量神经元(胶囊网络)作为分支,以获取不同属性间的内在关联。胶囊网络的神经元是向量的,存在长度CL和方向CO,在本申请中利用CL来表示这个属性是否存在,利用CO来学习不同属性间可能存在的内在联系。
在具体的实施例中,将上述主干网络获得的特征送入胶囊网络,胶囊网络分支包含主要胶囊层和分类胶囊层,主要胶囊层采用8个卷积进行操作,其中卷积核大小为(2 2,步长为2),然后将这8个卷积获得的特征连接起来,可以得到M个8D的向量胶囊神经元,然后通过下式来确定胶囊的长度:
Figure BDA0003080808660000051
其中,
Figure BDA0003080808660000052
代表主要胶囊层中第k个向量胶囊神经元,k∈[1,M],Dim=8D。
在具体的实施例中,主要胶囊层后面紧接着分类胶囊层,根据类别数N来设置分类胶囊层的胶囊神经元个数。特征通过主要胶囊层获得
Figure BDA0003080808660000053
将特征映射到Dim=8D映射到24D,通过公式进行映射:
Figure BDA0003080808660000054
其中Dim2=24D,Dim=8D,Wk∈R24×8是一个权重矩阵。接下来,分类胶囊层分类计算公式如下
Figure BDA0003080808660000055
其中,n∈[1,N],
Figure BDA0003080808660000056
表示胶囊网络中主要胶囊层和分类胶囊层之间动态路由过程的耦合系数。在具体的实施例中,计算网络的损失函数,损失函数包含交叉熵损失函数和胶囊网络的约束损失,胶囊网络的约束损失函数如下所示:
Figure BDA0003080808660000057
Figure BDA0003080808660000058
其中,yn代表输入数据的标签,λ=0.5用来平衡前后两部分,m+和m-用来控制
Figure BDA0003080808660000059
的长度,本申请中
Figure BDA00030808086600000510
整体的损失函数如下所示:L=αLcross_entropy+Lcapsule,其中,Lcross_entropy表示交叉熵损失函数,Lcapsule表示上述的胶囊网络的约束损失函数,α表示交叉熵损失函数的权重。
S103:将包括向量神经元的胶囊网络嵌入主干网络中学习不同属性之间的内在联系。
该行人属性识别方法采用多标签分类的方法,结合二分类交叉熵损失函数进行优化,并利用向量神经元(即胶囊网络)来增加模型训练过程不同属性间的关联,通过不同属性间的关联来提升行人属性识别的准确率。与此同时,为了将行人属性识别适用于现实场景中,本申请采用轻量级网络,在减少模型参数的同时,行人属性识别的精度也能达到ResNet50的精度。采用一个更轻量级的网络,可以减缓神经网络大量参数对硬件设施的依赖;并使用向量神经元来感知不同属性间的内在联系,从而使得网络能挖掘出更多特征信息,来帮助行人属性识别。与此同时,本申请中的向量神经元只在训练过程中参与,模型的推理过程中并不需要,不会增加模型的参数量。
申请人利用上述方法在公开数据集上进行了多次测试,本申请的方法模型参数量只有ResNet50只有十分之一左右,却可以达到和ResNet50一样具有竞争力的性能。本申请性能验证主要是采用召回率(Recall)和平均准确率(mA)两个指标。在数据集RAP上,单独采用主干网络OSNet时,mA只有80.29%,Recall只有80.80%,当采用向量神经元(即胶囊网络)来增加模型训练过程不同属性间的关联时,mA可以提升到81.23%,召回率可以提升到82.02%。在数据集PA100k上也有很显著的性能提升,mA性能从79.61提升到81.50%,Recall从86.82%提升到88.11%。
继续参考图4,图4示出了根据本申请的实施例的基于向量神经元的行人属性识别系统的框架图。该系统具体包括主干网络401、胶囊网络402和行人属性识别单元403。
在具体的实施例中,主干网络401利用全尺寸网络OSNet作为行人属性识别的主干网络,其中,全尺寸网络OSNet的卷积层包括点卷积层和深度可分离卷积层;胶囊网络402将包括向量神经元的胶囊网络嵌入主干网络中学习不同属性之间的内在联系,其中,向量神经元包括长度CL和方向CO,其中,CL来表示属性是否存在,利用CO来学习不同属性间存在的内在联系;行人属性识别单元403配置用于将图像依次经过主干网络和胶囊网络识别获取行人属性。
在具体的实施例中,胶囊网络402包括主要胶囊层和分类胶囊层,主要胶囊层采用8个卷积操作,其中卷积核大小为2×2,将8个卷积获得的特征连接获得M个8D的向量胶囊神经元,并确定胶囊的长度
Figure BDA0003080808660000061
其中,
Figure BDA0003080808660000062
代表主要胶囊层中第k个向量胶囊神经元,k∈[1,M],Dim=8D。分类胶囊层紧跟于主要胶囊层之后,将行人特征映射到Dim=8D映射到24D,通过公式
Figure BDA0003080808660000063
映射,分类胶囊层的分类计算公式为
Figure BDA0003080808660000064
其中,Dim2=24D,Dim=8D,Wk∈R24×8是一个权重矩阵,n∈[1,N],
Figure BDA0003080808660000065
表示胶囊网络中主要胶囊层和分类胶囊层之间动态路由过程的耦合系数
在具体的实施例中,行人属性识别网络的损失函数L包括交叉熵损失函数Lcross_entropy和胶囊网络的约束损失函数Lcapsule,计算公式为L=αLcross_entropy+Lcapsule,Lcapsule
Figure BDA0003080808660000066
其中,α表示交叉熵损失函数的权重,yn代表输入数据的标签,λ=0.5用来平衡前后两部分,m+和m-用来控制
Figure BDA0003080808660000071
的长度。
本申请针对行人属性识别目前存在着两个明显问题,首先,现有的方法均采用ResNet50作为主干网络来提取行人特征,但是模型参数量太多,会导致现实应用中需要依赖硬件设施;其次目前,现有的方法倾向于考虑每个属性是否存在,忽略了不同属性间的关联,例如属性项链或者手提包常出现在女性身上。为了解决上述问题,本申请采用轻量级网络,在模型中更多使用1*1卷积层,来降低模型的参数,在不损失精度的情况下,将模型参数量变为ResNet50的十分之一,加快识别的运行速度;为了增加不同属性间的关联,在模型中引入向量神经元(即胶囊网络),利用胶囊网络的第一维度来表示这个属性是否存在,用胶囊网络的第二维度来感应不同属性间的关联。本申请提出的行人属性识别方法,在公开数据集上均获得具有竞争力的性能,并且具有较好的现实应用意义。
下面参考图5,其示出了适于用来实现本申请实施例的电子设备的计算机系统500的结构示意图。图5示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图5所示,计算机系统500包括中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有系统500操作所需的各种程序和数据。CPU 501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。在该计算机程序被中央处理单元(CPU)501执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请的计算机可读存储介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读存储介质,该计算机可读存储介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。
作为另一方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:用全尺寸网络OSNet作为行人属性识别的主干网络,其中,全尺寸网络OSNet的卷积层包括点卷积层和深度可分离卷积层;将包括向量神经元的胶囊网络嵌入主干网络中学习不同属性之间的内在联系;将图像依次经过主干网络和胶囊网络识别获取行人属性。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (14)

1.一种基于向量神经元的行人属性识别方法,其特征在于,包括:
S1:利用全尺寸网络OSNet作为行人属性识别的主干网络,其中,所述全尺寸网络OSNet的卷积层包括点卷积层和深度可分离卷积层;
S2:将包括向量神经元的胶囊网络嵌入所述主干网络中学习不同属性之间的内在联系;以及
S3:将图像依次经过所述主干网络和所述胶囊网络识别获取行人属性。
2.根据权利要求1所述的基于向量神经元的行人属性识别方法,其特征在于,所述向量神经元包括长度CL和方向CO,其中,CL来表示属性是否存在,利用CO来学习不同属性间存在的内在联系。
3.根据权利要求1所述的基于向量神经元的行人属性识别方法,其特征在于,所述图像经过所述主干网络获得行人特征,并将所述行人特征送入所述胶囊网络中获取所述行人属性。
4.根据权利要求3所述的基于向量神经元的行人属性识别方法,其特征在于,所述胶囊网络包括主要胶囊层和分类胶囊层。
5.根据权利要求4所述的基于向量神经元的行人属性识别方法,其特征在于,所述主要胶囊层采用8个卷积操作,其中卷积核大小为2×2,将所述8个卷积获得的特征连接获得M个8D的向量胶囊神经元,并确定胶囊的长度
Figure FDA0003080808650000011
其中,
Figure FDA0003080808650000012
代表主要胶囊层中第k个向量胶囊神经元,k∈[1,M],Dim=8D。
6.根据权利要求5所述的基于向量神经元的行人属性识别方法,其特征在于,所述分类胶囊层紧跟于所述主要胶囊层之后,将所述行人特征映射到Dim=8D映射到24D,通过公式
Figure FDA0003080808650000013
映射,所述分类胶囊层的分类计算公式为
Figure FDA0003080808650000014
其中,Dim2=24D,Dim=8D,Wk∈R24×8是一个权重矩阵,n∈[1,N],
Figure FDA0003080808650000015
表示所述胶囊网络中所述主要胶囊层和所述分类胶囊层之间动态路由过程的耦合系数。
7.根据权利要求6所述的基于向量神经元的行人属性识别方法,其特征在于,基于类别数设置所述分类胶囊层的胶囊神经元个数。
8.根据权利要求1所述的基于向量神经元的行人属性识别方法,其特征在于,行人属性识别网络的损失函数L包括交叉熵损失函数Lcross_entropy和胶囊网络的约束损失函数Lcapsule,计算公式为L=αLcross_entropy+Lcapsule
Figure FDA0003080808650000016
Figure FDA0003080808650000021
其中,α表示交叉熵损失函数的权重,yn代表输入数据的标签,λ=0.5用来平衡前后两部分,m+和m-用来控制
Figure FDA0003080808650000022
的长度。
9.一种计算机可读存储介质,其上存储有一或多个计算机程序,其特征在于,该一或多个计算机程序被计算机处理器执行时实施权利要求1至9中任一项所述的方法。
10.一种基于向量神经元的行人属性识别系统,其特征在于,所述系统包括:
主干网络:利用全尺寸网络OSNet作为行人属性识别的主干网络,其中,所述全尺寸网络OSNet的卷积层包括点卷积层和深度可分离卷积层;
胶囊网络:将包括向量神经元的胶囊网络嵌入所述主干网络中学习不同属性之间的内在联系;
行人属性识别单元:配置用于将图像依次经过所述主干网络和所述胶囊网络识别获取行人属性。
11.根据权利要求10所述的基于向量神经元的行人属性识别系统,其特征在于,所述向量神经元包括长度CL和方向CO,其中,CL来表示属性是否存在,利用CO来学习不同属性间存在的内在联系。
12.根据权利要求10所述的基于向量神经元的行人属性识别系统,其特征在于,所述胶囊网络包括主要胶囊层和分类胶囊层,所述主要胶囊层采用8个卷积操作,其中卷积核大小为2×2,将所述8个卷积获得的特征连接获得M个8D的向量胶囊神经元,并确定胶囊的长度
Figure FDA0003080808650000023
其中,
Figure FDA0003080808650000024
代表主要胶囊层中第k个向量胶囊神经元,k∈[1,M],Dim=8D。
13.根据权利要求12所述的基于向量神经元的行人属性识别系统,其特征在于,所述分类胶囊层紧跟于所述主要胶囊层之后,将所述行人特征映射到Dim=8D映射到24D,通过公式
Figure FDA0003080808650000025
映射,所述分类胶囊层的分类计算公式为
Figure FDA0003080808650000026
其中,Dim2=24D,Dim=8D,Wk∈R24×8是一个权重矩阵,n∈[1,N],
Figure FDA0003080808650000027
表示所述胶囊网络中所述主要胶囊层和所述分类胶囊层之间动态路由过程的耦合系数。
14.根据权利要求10所述的基于向量神经元的行人属性识别系统,其特征在于,行人属性识别网络的损失函数L包括交叉熵损失函数Lcross_entropy和胶囊网络的约束损失函数Lcapsule,计算公式为L=αLcross_entropy+Lcapsule
Figure FDA0003080808650000028
Figure FDA0003080808650000029
其中,α表示交叉熵损失函数的权重,yn代表输入数据的标签,λ=0.5用来平衡前后两部分,m+和m-用来控制
Figure FDA00030808086500000210
的长度。
CN202110565472.1A 2021-05-24 2021-05-24 一种基于向量神经元的行人属性识别方法和系统 Active CN113221796B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110565472.1A CN113221796B (zh) 2021-05-24 2021-05-24 一种基于向量神经元的行人属性识别方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110565472.1A CN113221796B (zh) 2021-05-24 2021-05-24 一种基于向量神经元的行人属性识别方法和系统

Publications (2)

Publication Number Publication Date
CN113221796A true CN113221796A (zh) 2021-08-06
CN113221796B CN113221796B (zh) 2022-07-01

Family

ID=77098122

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110565472.1A Active CN113221796B (zh) 2021-05-24 2021-05-24 一种基于向量神经元的行人属性识别方法和系统

Country Status (1)

Country Link
CN (1) CN113221796B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113505761A (zh) * 2021-09-08 2021-10-15 阿里巴巴达摩院(杭州)科技有限公司 车辆属性提取方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107944399A (zh) * 2017-11-28 2018-04-20 广州大学 一种基于卷积神经网络目标中心模型的行人重识别方法
CN108460407A (zh) * 2018-02-02 2018-08-28 东华大学 一种基于深度学习的行人属性精细化识别方法
CN109102025A (zh) * 2018-08-15 2018-12-28 电子科技大学 基于深度学习联合优化的行人重识别方法
US20200302176A1 (en) * 2019-03-18 2020-09-24 Nvidia Corporation Image identification using neural networks

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107944399A (zh) * 2017-11-28 2018-04-20 广州大学 一种基于卷积神经网络目标中心模型的行人重识别方法
CN108460407A (zh) * 2018-02-02 2018-08-28 东华大学 一种基于深度学习的行人属性精细化识别方法
CN109102025A (zh) * 2018-08-15 2018-12-28 电子科技大学 基于深度学习联合优化的行人重识别方法
US20200302176A1 (en) * 2019-03-18 2020-09-24 Nvidia Corporation Image identification using neural networks

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113505761A (zh) * 2021-09-08 2021-10-15 阿里巴巴达摩院(杭州)科技有限公司 车辆属性提取方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN113221796B (zh) 2022-07-01

Similar Documents

Publication Publication Date Title
CN110458107B (zh) 用于图像识别的方法和装置
CN109754015B (zh) 用于画作多标签识别的神经网络及相关方法、介质和设备
Gao et al. MLNet: Multichannel feature fusion lozenge network for land segmentation
US20210406592A1 (en) Method and apparatus for visual question answering, computer device and medium
CN111476309A (zh) 图像处理方法、模型训练方法、装置、设备及可读介质
CN111597961B (zh) 面向智能驾驶的移动目标轨迹预测方法、系统、装置
Wang et al. FE-YOLOv5: Feature enhancement network based on YOLOv5 for small object detection
CN113822951B (zh) 图像处理方法、装置、电子设备及存储介质
CN115131627B (zh) 一种轻量化植物病虫害目标检测模型的构建和训练方法
KR20210137213A (ko) 이미지 처리 방법 및 장치, 프로세서, 전자 기기, 저장 매체
CN112954399B (zh) 一种图像处理方法、装置以及计算机设备
CN113515669A (zh) 基于人工智能的数据处理方法和相关设备
CN115809327B (zh) 一种多模融合和话题的实时社交网络谣言检测方法
CN112434683A (zh) 基于注意力机制的行人属性识别方法、系统、装置
CN113033321A (zh) 目标行人属性识别模型的训练方法及行人属性识别方法
CN113221796B (zh) 一种基于向量神经元的行人属性识别方法和系统
CN113128588A (zh) 模型训练方法、装置、计算机设备及计算机存储介质
CN115861756A (zh) 基于级联组合网络的大地背景小目标识别方法
CN114708494A (zh) 一种农村宅基地建筑识别方法及系统
CN112668675B (zh) 一种图像处理方法、装置、计算机设备及存储介质
CN114596548A (zh) 目标检测方法、装置、计算机设备及计算机可读存储介质
CN112132867A (zh) 一种遥感影像变换检测方法及装置
CN111598140A (zh) 一种基于胶囊网络的遥感图像分类方法
CN116740078A (zh) 图像分割处理方法、装置、设备以及介质
CN115577768A (zh) 半监督模型训练方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant