CN111783754B - 基于部位上下文的人体属性图像分类方法、系统和装置 - Google Patents
基于部位上下文的人体属性图像分类方法、系统和装置 Download PDFInfo
- Publication number
- CN111783754B CN111783754B CN202010918876.XA CN202010918876A CN111783754B CN 111783754 B CN111783754 B CN 111783754B CN 202010918876 A CN202010918876 A CN 202010918876A CN 111783754 B CN111783754 B CN 111783754B
- Authority
- CN
- China
- Prior art keywords
- human body
- network
- convolution
- body attribute
- graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 67
- 238000013145 classification model Methods 0.000 claims abstract description 34
- 230000002776 aggregation Effects 0.000 claims abstract description 33
- 238000004220 aggregation Methods 0.000 claims abstract description 33
- 238000010224 classification analysis Methods 0.000 claims abstract description 22
- 238000000605 extraction Methods 0.000 claims abstract description 13
- 238000012549 training Methods 0.000 claims description 37
- 230000006870 function Effects 0.000 claims description 24
- 238000010586 diagram Methods 0.000 claims description 23
- 230000003044 adaptive effect Effects 0.000 claims description 20
- 239000011159 matrix material Substances 0.000 claims description 20
- 238000013528 artificial neural network Methods 0.000 claims description 13
- 230000009466 transformation Effects 0.000 claims description 10
- 230000009467 reduction Effects 0.000 claims description 9
- 238000004422 calculation algorithm Methods 0.000 claims description 7
- 238000013527 convolutional neural network Methods 0.000 claims description 6
- 239000006185 dispersion Substances 0.000 claims description 5
- 238000011478 gradient descent method Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 4
- 238000012935 Averaging Methods 0.000 claims description 3
- 230000006855 networking Effects 0.000 claims description 3
- 239000000284 extract Substances 0.000 abstract description 4
- 230000008569 process Effects 0.000 description 9
- 238000006467 substitution reaction Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明属于计算机视觉领域,具体涉及了一种基于部位上下文的人体属性图像分类方法、系统和装置,旨在解决现有的人体分类方法忽略了人体属性之间的关系而未考虑人体内在层次结构信息导致分类精确度不足的问题。本发明包括:通过人体属性图像分类模型获取人体属性分类预测图;人体属性图像分类模型先通过特征提取网络提取待测试图像的原始特征图,再基于原始特征图通过属性分类解析网络获取高阶特征图,通过关系聚合网络和关系离散网络分别提取合适的上下文信息,将原始特征图和合适的上下文信息融合后生成人体属性分类预测图。本发明解决了如何从复杂北京中,对不同的属性产生合适的上下文特征的问题,提高了人体图像识别的精确度。
Description
技术领域
本发明属于计算机视觉领域,具体涉及了一种基于部位上下文的人体属性图像分类方法、系统和装置。
背景技术
人体属性分类是计算机视觉中的热门研究课题之一,也是基于视觉的模式识别应用的一个重要研究方向。它需要将图像中人的各个属性(性别、年龄、衣服类型等)分类出来,从而为针对人的应用提供更加详细的先验信息,比如:行人重识别,行人检索以及视频监控等。由于自然场景中人体不同部位大小和形状的多样化,图片模糊以及光照差异大等问题,人体属性分类方法需要具有良好的区分人体前景和场景中的背景以及准确分类各个属性的能力。而传统的手工设计,基于全局或者局部的特征在人体属性分类这个问题上很难做到较好的效果。而当前基于深度学习的人体属性分类方法大多采用多尺度特征融合或者使用注意力机制来解决自然场景中人体部位大小和形状多样化问题。这些方法忽略了人体属性之间的关系进而失去获得人体内在层次结构信息,影响方法的识别性能。
发明内容
为了解决现有技术中的上述问题,即现有的人体分类方法忽略了人体属性之间的关系而未考虑人体内在层次结构信息导致分类精确度不足的问题,本发明提供了一种基于部位上下文的人体属性图像分类方法,所述方法包括:
步骤S10,获取待测试图像作为当前帧;
步骤S20,基于所述当前帧,通过训练好的人体属性图像分类模型获取人体属性分类预测图;
其中,所述人体属性图像分类模型,包括特征提取网络、属性分类解析网络、关系聚合网络和关系离散网络,并基于训练图像以及端到端的有监督训练,通过随机梯度下降算法更新网络参数,反复迭代至损失函数收敛,获得训练好的人体属性图像分类模型;
所述属性分类解析网络,为串联的卷积层,包括设定数量的降维卷积层和设定数量的用于降低特征大小的卷积层;
所述关系聚合网络,基于图卷积网络和聚合动态卷积神经网络构建,所述图卷积网络以人体属性作为图卷积的节点,属性之间的连接关系作为图卷积的边,图卷积之间的连接矩阵根据部位之间语义关系进行更新;所述聚合动态卷积神经网络以将图卷积网络的输出重排成一组卷积核大小的第一卷积核作为卷积核;
所述关系离散网络,基于属性相似离散网络和离散动态卷积神经网络,所述离散动态卷积网络以将所述相似离散网络的输出重排成一组卷积核大小的第二卷积核作为卷积核。
进一步地,所述人体属性图像分类网络,其训练方法包括:
步骤A100,从带有分类标签的人体属性图像数据集中提取第s帧作为训练帧;
步骤A200,基于所述训练帧,通过所述特征提取网络获取原始特征图;
步骤A400,通过所述关系聚合网络获取自适应全局上下文信息;基于所述原始特征图和高阶特征图,通过所述关系离散网络获取显著局部上下文信息;
步骤A500,融合所述原始特征图、自适应全局上下文信息和显著局部上下文信息生成人体属性训练分类预测图;
步骤A600,基于所述人体属性训练分类预测图与对应的分类标签计算所述人体属
性图像分类网络的全局损失函数,若所述全局损失函数值不低于预设的阈值,则通过随机
梯度下降法调节更新所述人体属性图像分类网络的参数,令并跳转至步骤
A100,直至全局损失函数小于预设的阈值,获得训练好的人体属性图像分类模型。
进一步地,所述图卷积之间的连接矩阵为:
进一步地,“基于所述原始特征图和高阶特征图,通过所述关系聚合网络获取自适应全局上下文信息”,其方法为:
步骤A413,将所述图卷积网络的输出参数H进行特征变换,重排成一组卷积核的大小,生成第一卷积核;
“基于所述原始特征图和高阶特征图,通过所述关系离散网络获取显著局部上下文信息”,其方法为:
其中,N是人体属性的类别;
步骤A423,将所述相似离散结构的输出参数B进行特征变换,重排成一组卷积核的大小,生成第二卷积核;
进一步地,“融合所述原始特征图、自适应全局上下文信息和显著局部上下文信息”,其方法包括合并、累加、取均值、卷积网络和多层感知机。
本发明的另一方面,提出了一种基于部位上下文的人体属性图像分类系统,所述系统包括:图像获取模块、分类预测模块和存储模块;
所述图像获取模块,用于获取待测试图像作为当前帧;
所述分类预测模块,用于基于所述当前帧,通过训练好的人体属性图像分类模型获取人体属性分类预测图;
所述存储模块,用于存储人体属性分类数据集;
其中,所述人体属性图像分类模型,包括特征提取网络、属性分类解析网络、关系聚合网络和关系离散网络,并基于训练图像以及端到端的有监督训练,通过随机梯度下降算法更新网络参数,反复迭代至损失函数收敛,获得训练好的人体属性图像分类模型;
所述属性分类解析网络,为串联的卷积层,包括设定数量的降维卷积层和设定数量的用于降低特征大小的卷积层;
所述关系聚合网络,基于图卷积网络和聚合动态卷积神经网络构建,所述图卷积网络以人体属性作为图卷积的节点,属性之间的连接关系作为图卷积的边,图卷积之间的连接矩阵根据部位之间语义关系进行更新;所述聚合动态卷积神经网络以图卷积网络的输出作为卷积核;
所述关系离散网络,基于属性相似离散网络和离散动态卷积神经网络,所述离散动态卷积网络以所述相似离散网络的输出作为卷积核。
本发明的第三方面,提出了一种存储装置,其中存储有多条程序,所述程序适于由处理器加载并执行以实现上述的基于部位上下文的人体属性图像分类方法。
本发明的第四方面,提出了一种处理装置,包括处理器、存储装置;所述处理器,适于执行各条程序;所述存储装置,适于存储多条程序;所述程序适于由处理器加载并执行以实现上述的基于部位上下文的人体属性图像分类方法。
本发明的有益效果:
(1)本发明基于部位上下文的人体属性图像分类方法,针对不同大小的人体各个部位,可以产生合适的上下文信息,获取合适的特征,提高了人体属性分类对各个属性分类的精确度,并且扩大了人体属性图像分类方法的适用范围。解决了如何从复杂背景中,对不同的属性产生合适的上下文特征。
(2)本发明基于部位上下文的人体属性图像分类方法,通过从原始特征图中获取高阶特征图,可以获得部位更好的语义表达,用来提取全局上下文和局部上下文可以提高分类预测结果的精确度。
(3)本发明基于部位上下文的人体属性图像分类方法,通过关系聚合网络的图卷积网络对高阶特征图进行全局上下文信息的提取,可以探索到人体部位之间的语义关系,利用这种关系可以获得属性的全局上下文,图像分类的过程中考虑人体的全局上下文提高了分类预测结果的精确度。
(4)本发明基于部位上下文的人体属性图像分类方法,通过关系离散网络对高阶特征图进行局部显著上下文的提取,可以减少部位之间的相互干扰,能够获得有区分性和代表性的局部上下文,提高了分类预测结果的精确度。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本发明基于部位上下文的人体属性图像分类方法第一实施例的流程示意图;
图2是本发明基于部位上下文的人体属性图像分类方法第一实施例中基于部位上下文的人体图像分类模型总体结构示意图;
图3是本发明基于部位上下文的人体属性图像分类方法的关系聚合网络中图卷积网络的结构示意图;
图4是本发明基于部位上下文的人体属性图像分类方法的关系离散网络中的属性离散网络的原理示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
本发明提供一种基于部位上下文的人体属性图像分类方法,本方法包括:
步骤S10,获取待测试图像作为当前帧;
步骤S20,基于所述当前帧,通过训练好的人体属性图像分类模型获取人体属性分类预测图;
其中,所述人体属性图像分类模型,包括特征提取网络、属性分类解析网络、关系聚合网络和关系离散网络,并基于训练图像以及端到端的有监督训练,通过随机梯度下降算法更新网络参数,反复迭代至损失函数收敛,获得训练好的人体属性图像分类模型;
所述属性分类解析网络,为串联的卷积层,包括设定数量的降维卷积层和设定数量的用于降低特征大小的卷积层;
所述关系聚合网络,基于图卷积网络和聚合动态卷积神经网络构建,所述图卷积网络以人体属性作为图卷积的节点,属性之间的连接关系作为图卷积的边,图卷积之间的连接矩阵根据部位之间语义关系进行更新;所述聚合动态卷积神经网络以将图卷积网络的输出重排成一组卷积核大小的第一卷积核作为卷积核;
所述关系离散网络,基于属性相似离散网络和离散动态卷积神经网络,所述离散动态卷积网络以将所述相似离散网络的输出重排成一组卷积核大小的第二卷积核作为卷积核。
为了更清晰地对本发明基于部位上下文的人体属性图像分类方法进行说明,下面结合图1对本发明方法实施例中各步骤展开详述。
本发明一种实施例的基于部位上下文的人体属性图像分类方法,包括步骤S10-步骤S20,各步骤详细描述如下:
步骤S10,获取待测试图像作为当前帧;
步骤S20,基于所述当前帧,通过训练好的人体属性图像分类模型获取人体属性分类预测图;
如图2所示,所述人体属性图像分类模型,包括特征提取网络、属性分类解析网络、关系聚合网络和关系离散网络,并基于训练图像以及端到端的有监督训练,通过随机梯度下降算法更新网络参数,反复迭代至损失函数收敛,获得训练好的人体属性图像分类模型;
所述属性分类解析网络,为串联的卷积层,包括设定数量的降维卷积层和设定数量的用于降低特征大小的卷积层;
所述属性分类解析网络应用几个连续的卷积从原始特征图中提取高阶特征图。
首先通过降维卷积层来降低特征的通道数,使其降维到与要识别的属性类别数一致,使其可以通过训练过程学习到与属性类别对应的特征。然后通过用于降低特征大小的卷积层来降低特征的大小以降低计算量,通过这种方法得到属性的高阶语义特征。
如图3所示,属性分类解析网络的输出作为关系聚合网络的输入,根据人体特有的连接方式,我们建立图卷积来建模人体的空间关系和部位之间的语义关系。使用这种方法可以获得属性的全局信息。
所述关系聚合网络,基于图卷积网络和聚合动态卷积神经网络构建,所述图卷积网络以人体属性作为图卷积的节点,属性之间的连接关系作为图卷积的边,图卷积之间的连接矩阵根据部位之间语义关系进行更新;所述聚合动态卷积神经网络以将图卷积网络的输出重排成一组卷积核大小的第一卷积核作为卷积核;
在一些优选的实施方式中,所述图卷积之间的连接矩阵如公式(1)所示:
所述关系离散网络,基于属性相似离散网络和离散动态卷积神经网络,所述离散动态卷积网络以将所述相似离散网络的输出重排成一组卷积核大小的第二卷积核作为卷积核。
所述关系离散网络,无特定的网络结构,凡是用本发明的提取显著局部上下文信息并与自适应全局上下文信息结合的方法均应视作本发明要求保护的范围。
在一些优选的实施方式中,所述人体属性图像分类网络,其训练方法包括:
步骤A100,从带有分类标签的人体属性图像数据集中提取第s帧作为训练帧;
步骤A200,基于所述训练帧,通过所述特征提取网络获取原始特征图;
步骤A400,通过所述关系聚合网络获取自适应全局上下文信息;基于所述原始特征图和高阶特征图,通过所述关系离散网络获取显著局部上下文信息;
在一些优选的实施方式中,“基于所述原始特征图和高阶特征图,通过所述关系聚合网络获取自适应全局上下文信息”,其方法为:
步骤A413,将所述图卷积网络的输出参数H进行特征变换,重排成一组卷积核的大小,生成第一卷积核;
作用方式可以选取但不局限于卷积操作,然后得到自适应全局上下文信息。
在本实施例中,全局上下文特征对于属性分类非常重要,但是它可以带来一些冗余信息或者干扰信息。因为使用全局特征来识别比较相似的属性是比较困难的。因此,我们采用了关系离散网络来获取具有代表性的局部上下文特征。
在一些优选的实施方式中,“基于所述原始特征图和高阶特征图,通过所述关系离散网络获取显著局部上下文信息”,其方法为:
如图4所示,将关系离散操作应用于高级特征图,即高级特征图中每个部位特征图和其余的全部部位特征图进行相减得到部位之间的语义相似度,关系离散网络的目标是使具有同种标签的特征尽可能的近,不同标签的特征尽可能的远。首先计算一个类别和其他所有类别的相似度离散,。然后这个类别特征乘上这个相似度,我们就可以把相似的特征拉大,同时,我们把这个特征也加入到这个里面,进而凸显这个类别的特征,得到相似度离散。然后我们把所有的部位的这个结合到一起,形成一组参数;将语义相似度作为动态卷积的卷积核,作用在原始特征图上,削弱部位特征图之间的相似程度,生成显著局部上下文信息。
具体步骤详述如下:
其中,N是人体属性的类别;
步骤A423,将所述相似离散结构的输出参数B进行特征变换,重排成一组卷积核的大小,生成第二卷积核;
我们将关系离散网络得到的输出作为动态卷积的卷积核,可以使卷积更加专注具有局部特点表达的一些特征,因此可以生成具有代表性的局部特征。
作用方式可以选取但不局限于卷积操作,然后得到自适应全局上下文信息。
在本实施例中,关系离散网络仅使用人体属性分类的标签作为监督,在训练的过程中不适用任何额外的监督信息;
同时,由于图卷积的各个节点对应于不同的属性,因此对于属性分类解析网络我们在训练阶段采用了标签进行监督,指导网络生成对应的高级属性图。
步骤A500,融合所述原始特征图、自适应全局上下文信息和显著局部上下文信息生成人体属性训练分类预测图;
在一些优选的实施方式中,“融合所述原始特征图、自适应全局上下文信息和显著局部上下文信息”,其方法包括合并、累加、取均值、卷积网络和多层感知机。
融合方法包括但不限于上述方法,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
步骤A600,基于所述人体属性训练分类预测图与对应的分类标签计算所述人体属性图像分类网络的全局损失函数,若所述全局损失函数值不低于预设的阈值,则通过随机梯度下降法调节更新所述人体属性图像分类网络的参数,令s=s+1并跳转至步骤A100,直至全局损失函数小于预设的阈值,获得训练好的人体属性图像分类模型。
本发明第二实施例的基于部位上下文的人体属性图像分类系统,所述系统包括:图像获取模块、分类预测模块和存储模块;
所述图像获取模块,用于获取待测试图像作为当前帧;
所述分类预测模块,用于基于所述当前帧,通过训练好的人体属性图像分类模型获取人体属性分类预测图;
所述存储模块,用于存储人体属性分类数据集;
其中,所述人体属性图像分类模型,包括特征提取网络、属性分类解析网络、关系聚合网络和关系离散网络,并基于训练图像以及端到端的有监督训练,通过随机梯度下降算法更新网络参数,反复迭代至损失函数收敛,获得训练好的人体属性图像分类模型;
所述属性分类解析网络,为串联的卷积层,包括设定数量的降维卷积层和设定数量的用于降低特征大小的卷积层;
所述关系聚合网络,基于图卷积网络和聚合动态卷积神经网络构建,所述图卷积网络以人体属性作为图卷积的节点,属性之间的连接关系作为图卷积的边,图卷积之间的连接矩阵根据部位之间语义关系进行更新;所述聚合动态卷积神经网络以将图卷积网络的输出重排成一组卷积核大小的第一卷积核作为卷积核;
所述关系离散网络,基于属性相似离散网络和离散动态卷积神经网络,所述离散动态卷积网络以将所述相似离散网络的输出重排成一组卷积核大小的第二卷积核作为卷积核。
所属技术领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统的具体工作过程及有关说明,可以参考前述方法实施例中的对应过程,在此不再赘述。
需要说明的是,上述实施例提供的基于部位上下文的人体属性图像分类系统,仅以上述各功能模块的划分进行举例说明,在实际应用中,可以根据需要而将上述功能分配由不同的功能模块来完成,即将本发明实施例中的模块或者步骤再分解或者组合,例如,上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块,以完成以上描述的全部或者部分功能。对于本发明实施例中涉及的模块、步骤的名称,仅仅是为了区分各个模块或者步骤,不视为对本发明的不当限定。
本发明第三实施例的一种存储装置,其中存储有多条程序,所述程序适于由处理器加载并执行以实现上述的基于部位上下文的人体属性图像分类方法。
本发明第四实施例的一种处理装置,包括处理器、存储装置;处理器,适于执行各条程序;存储装置,适于存储多条程序;所述程序适于由处理器加载并执行以实现上述的基于部位上下文的人体属性图像分类方法。
所属技术领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的存储装置、处理装置的具体工作过程及有关说明,可以参考前述方法实施例中的对应过程,在此不再赘述。
本领域技术人员应该能够意识到,结合本文中所公开的实施例描述的各示例的模块、方法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,软件模块、方法步骤对应的程序可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。为了清楚地说明电子硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以电子硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
术语“第一”、 “第二”等是用于区别类似的对象,而不是用于描述或表示特定的顺序或先后次序。
术语“包括”或者任何其它类似用语旨在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备/装置不仅包括那些要素,而且还包括没有明确列出的其它要素,或者还包括这些过程、方法、物品或者设备/装置所固有的要素。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
Claims (8)
1.一种基于部位上下文的人体属性图像分类方法,其特征在于,所述方法包括:
步骤S10,获取待测试图像作为当前帧;
步骤S20,基于所述当前帧,通过训练好的人体属性图像分类模型获取人体属性分类预测图;
其中,所述人体属性图像分类模型,包括特征提取网络、属性分类解析网络、关系聚合网络和关系离散网络,并基于训练图像以及端到端的有监督训练,通过随机梯度下降算法更新网络参数,反复迭代至损失函数收敛,获得训练好的人体属性图像分类模型;
所述人体属性图像分类模型,其训练方法包括:
步骤A100,从带有分类标签的人体属性图像数据集中提取第s帧作为训练帧;
步骤A200,基于所述训练帧,通过所述特征提取网络获取原始特征图;
步骤A400,通过所述关系聚合网络获取自适应全局上下文信息;基于所述原始特征图和高阶特征图,通过所述关系离散网络获取显著局部上下文信息;
步骤A500,融合所述原始特征图、自适应全局上下文信息和显著局部上下文信息生成人体属性训练分类预测图;
步骤A600,基于所述人体属性训练分类预测图与对应的分类标签计算所述人体属性图像分类模型的全局损失函数,若所述全局损失函数值不低于预设的阈值,则通过随机梯度下降法调节更新所述人体属性图像分类模型的参数,令s=s+1并跳转至步骤A100,直至全局损失函数小于预设的阈值,获得训练好的人体属性图像分类模型;
所述属性分类解析网络,为串联的卷积层,包括设定数量的降维卷积层和设定数量的用于降低特征大小的卷积层;
所述关系聚合网络,基于图卷积网络和聚合动态卷积神经网络构建,所述图卷积网络以人体属性作为图卷积的节点,属性之间的连接关系作为图卷积的边,图卷积之间的连接矩阵根据部位之间语义关系进行更新;所述聚合动态卷积神经网络以将图卷积网络的输出重排成一组卷积核大小的第一卷积核作为卷积核;
所述关系离散网络,基于属性相似离散网络和离散动态卷积神经网络,所述离散动态卷积网络以将所述属性相似离散网络的输出重排成一组卷积核大小的第二卷积核作为卷积核。
3.根据权利要求2所述的基于部位上下文的人体属性图像分类方法,其特征在于,基于所述原始特征图和高阶特征图,通过所述关系聚合网络获取自适应全局上下文信息,其方法为:
步骤A413,将所述图卷积网络的输出参数进行特征变换,重排成一组卷积核的大小,生成第一卷积核;
4.根据权利要求2所述的基于部位上下文的人体属性图像分类方法,其特征在于,基于所述原始特征图和高阶特征图,通过所述关系离散网络获取显著局部上下文信息,其方法为:
其中,N是人体属性的类别;
步骤A423,将所述相似离散结构的输出参数B进行特征变换,重排成一组卷积核的大小,生成第二卷积核;
5.根据权利要求1所述的基于部位上下文的人体属性图像分类方法,其特征在于,融合所述原始特征图、自适应全局上下文信息和显著局部上下文信息,其方法包括合并、累加、取均值、卷积网络和多层感知机。
6.一种基于部位上下文的人体属性图像分类系统,其特征在于,所述系统包括:图像获取模块、分类预测模块和存储模块;
所述图像获取模块,用于获取待测试图像作为当前帧;
所述分类预测模块,用于基于所述当前帧,通过训练好的人体属性图像分类模型获取人体属性分类预测图;
所述存储模块,用于存储人体属性分类数据集;
其中,所述人体属性图像分类模型,包括特征提取网络、属性分类解析网络、关系聚合网络和关系离散网络,并基于训练图像以及端到端的有监督训练,通过随机梯度下降算法更新网络参数,反复迭代至损失函数收敛,获得训练好的人体属性图像分类模型;
所述人体属性图像分类模型,其训练方法包括:
步骤A100,从带有分类标签的人体属性图像数据集中提取第s帧作为训练帧;
步骤A200,基于所述训练帧,通过所述特征提取网络获取原始特征图;
步骤A400,通过所述关系聚合网络获取自适应全局上下文信息;基于所述原始特征图和高阶特征图,通过所述关系离散网络获取显著局部上下文信息;
步骤A500,融合所述原始特征图、自适应全局上下文信息和显著局部上下文信息生成人体属性训练分类预测图;
步骤A600,基于所述人体属性训练分类预测图与对应的分类标签计算所述人体属性图像分类模型的全局损失函数,若所述全局损失函数值不低于预设的阈值,则通过随机梯度下降法调节更新所述人体属性图像分类模型的参数,令s=s+1并跳转至步骤A100,直至全局损失函数小于预设的阈值,获得训练好的人体属性图像分类模型;
所述属性分类解析网络,为串联的卷积层,包括设定数量的降维卷积层和设定数量的用于降低特征大小的卷积层;
所述关系聚合网络,基于图卷积网络和聚合动态卷积神经网络构建,所述图卷积网络以人体属性作为图卷积的节点,属性之间的连接关系作为图卷积的边,图卷积之间的连接矩阵根据部位之间语义关系进行更新;所述聚合动态卷积神经网络以将图卷积网络的输出重排成一组卷积核大小的第一卷积核作为卷积核;
所述关系离散网络,基于属性相似离散网络和离散动态卷积神经网络,所述离散动态卷积网络以将所述属性相似离散网络的输出重排成一组卷积核大小的第二卷积核作为卷积核。
7.一种存储装置,其中存储有多条程序,其特征在于,所述程序适于由处理器加载并执行以实现权利要求1-5任一项所述的基于部位上下文的人体属性图像分类方法。
8.一种处理装置,包括处理器,适于执行各条程序,所述程序适于由处理器加载并执行以实现权利要求1-5任一项所述的基于部位上下文的人体属性图像分类方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010918876.XA CN111783754B (zh) | 2020-09-04 | 2020-09-04 | 基于部位上下文的人体属性图像分类方法、系统和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010918876.XA CN111783754B (zh) | 2020-09-04 | 2020-09-04 | 基于部位上下文的人体属性图像分类方法、系统和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111783754A CN111783754A (zh) | 2020-10-16 |
CN111783754B true CN111783754B (zh) | 2020-12-08 |
Family
ID=72762348
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010918876.XA Active CN111783754B (zh) | 2020-09-04 | 2020-09-04 | 基于部位上下文的人体属性图像分类方法、系统和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111783754B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112507872B (zh) * | 2020-12-09 | 2021-12-28 | 中科视语(北京)科技有限公司 | 人体头肩区域的定位方法、定位装置和电子设备 |
CN112860928A (zh) * | 2021-02-08 | 2021-05-28 | 天津大学 | 一种基于类别感知图神经网络的服饰检索方法 |
CN112801238B (zh) * | 2021-04-15 | 2021-07-27 | 中国科学院自动化研究所 | 一种图像分类方法、装置、电子设备及存储介质 |
CN114333074B (zh) * | 2022-03-14 | 2022-05-24 | 南京邮电大学 | 基于动态轻量高分辨率网络的人体姿态估计方法 |
CN117197843B (zh) * | 2023-11-06 | 2024-02-02 | 中国科学院自动化研究所 | 无监督的人体部件区域确定方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105740892A (zh) * | 2016-01-27 | 2016-07-06 | 北京工业大学 | 一种高准确率的基于卷积神经网络的人体多部位识别方法 |
CN108537162A (zh) * | 2018-03-29 | 2018-09-14 | 北京微播视界科技有限公司 | 人体姿态的确定方法和装置 |
CN108664948A (zh) * | 2018-05-21 | 2018-10-16 | 北京京东尚科信息技术有限公司 | 用于生成信息的方法和装置 |
CN109766918A (zh) * | 2018-12-18 | 2019-05-17 | 南开大学 | 基于多层次上下文信息融合的显著性物体检测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150138078A1 (en) * | 2013-11-18 | 2015-05-21 | Eyal Krupka | Hand pose recognition using boosted look up tables |
-
2020
- 2020-09-04 CN CN202010918876.XA patent/CN111783754B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105740892A (zh) * | 2016-01-27 | 2016-07-06 | 北京工业大学 | 一种高准确率的基于卷积神经网络的人体多部位识别方法 |
CN108537162A (zh) * | 2018-03-29 | 2018-09-14 | 北京微播视界科技有限公司 | 人体姿态的确定方法和装置 |
CN108664948A (zh) * | 2018-05-21 | 2018-10-16 | 北京京东尚科信息技术有限公司 | 用于生成信息的方法和装置 |
CN109766918A (zh) * | 2018-12-18 | 2019-05-17 | 南开大学 | 基于多层次上下文信息融合的显著性物体检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111783754A (zh) | 2020-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111783754B (zh) | 基于部位上下文的人体属性图像分类方法、系统和装置 | |
Hong et al. | Graph convolutional networks for hyperspectral image classification | |
CN109685115B (zh) | 一种双线性特征融合的细粒度概念模型及学习方法 | |
CN110866140B (zh) | 图像特征提取模型训练方法、图像搜索方法及计算机设备 | |
CN110633745B (zh) | 一种基于人工智能的图像分类训练方法、装置及存储介质 | |
CN111079639B (zh) | 垃圾图像分类模型构建的方法、装置、设备及存储介质 | |
CN109558942B (zh) | 一种基于浅度学习的神经网络迁移方法 | |
CN107408209B (zh) | 用于在半导体工艺中进行缺陷分类的系统和方法 | |
CN111079658B (zh) | 基于视频的多目标连续行为分析方法、系统、装置 | |
CN110309856A (zh) | 图像分类方法、神经网络的训练方法及装置 | |
CN109359725B (zh) | 卷积神经网络模型的训练方法、装置、设备及计算机可读存储介质 | |
Kang et al. | SAR image classification based on the multi-layer network and transfer learning of mid-level representations | |
EP3029606A2 (en) | Method and apparatus for image classification with joint feature adaptation and classifier learning | |
CN113570029A (zh) | 获取神经网络模型的方法、图像处理方法及装置 | |
CN110993037A (zh) | 一种基于多视图分类模型的蛋白质活性预测装置 | |
CN114861842B (zh) | 少样本目标检测方法、装置和电子设备 | |
CN112749737A (zh) | 图像分类方法及装置、电子设备、存储介质 | |
CN115170565B (zh) | 基于自动神经网络架构搜索的图像欺诈检测方法及装置 | |
CN109101984B (zh) | 一种基于卷积神经网络的图像识别方法及装置 | |
CN113987236A (zh) | 基于图卷积网络的视觉检索模型的无监督训练方法和装置 | |
CN112699858B (zh) | 无人平台烟尘雾感知方法、系统、计算机设备及存储介质 | |
Everett et al. | Protocaps: A fast and non-iterative capsule network routing method | |
Dong et al. | Scene-oriented hierarchical classification of blurry and noisy images | |
Bouteldja et al. | A comparative analysis of SVM, K-NN, and decision trees for high resolution satellite image scene classification | |
CN114936327B (zh) | 元素识别模型的获取方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |