发明内容
基于此,为了解决或改善现有技术的问题,本申请提供一种行人属性分类方法、装置、电子设备及存储介质,可以降低行人属性分类时,混淆及误判的几率。
本申请第一方面提供一种行人属性分类方法,包括:获取待分类图像;将所述待分类图像输入预先训练的属性分类模型进行属性分类,得到对所述待分类图像的属性分类结果;所述预先训练的属性分类模型的训练步骤包括:建立原始属性分类模型,并获取样本数据;对所述样本数据进行人体层次结构划分,得到不同层次的人体图像划分结果;获取不同层次的人体图像划分结果中,人体相邻各部位特征流的联系;利用所述人体图像划分结果,以及所述人体各部位特征流的联系,将所述样本数据进行分割,得到不同层次的样本分割图像;利用不同层次的样本分割图像训练所述原始属性分类模型,得到用于将待分类图像进行不同层次的属性识分类的属性分类模型;将所述待分类图像输入预先训练的属性分类模型对所述待分类图像进行分类的步骤包括:将所述待分类图像进行人体层次结构划分,得到不同层次的人体图像划分结果;获取不同层次的人体图像划分结果中,人体相邻各部位特征流的联系;利用所述人体图像划分结果,以及所述人体各部位特征流的联系,将所述待分类图像进行分割,得到人体图像不同层次的分割图像;对不同层次的分割图像进行属性分类,得到属性分类结果。
其中,在利用不同层次的样本分割图像训练所述原始属性分类模型时,所述预先训练的属性分类模型的训练步骤还包括:获取所述样本数据内人体的全身图像;将所述全身图像及所述分割图像进行相互监督学习,直至所述相互监督学习的次数达到第一预定次数。
其中,所述将所述全身图像及所述分割图像进行相互监督学习,包括:利用相邻所述分割图像之间的特征流的联系,将相邻所述分割图像进行融合,得到人体的融合验证图像;利用所述融合验证图像验证及修正所述全身图像;将所述全身图像按照相邻所述分割图像之间的特征流的联系进行分割,得到分割验证图像;利用所述分割验证图像验证及修正所述分割图像。
其中,在利用不同层次的样本分割图像训练所述原始属性分类模型时,所述预先训练的属性分类模型的训练步骤还包括:将所述全身图像、所述分割图像各自进行自监督学习,直至所述自监督学习的次数达到第二预定次数。
其中,所述利用所述人体图像划分结果,以及所述人体各部位特征流的联系,将所述样本数据进行分割,得到人体图像不同层次的样本分割图像,包括:利用预先建立的语义分割网络,并将所述人体图像划分结果,以及人体各部位特征流的联系作为所述语义分割网络的条件,对所述样本数据进行分割,得到至少两个不同层次人体的样本分割图像,一个层次人体的样本分割图像包括:上半身图像及下半身图像,另一个层次人体的样本分割图像包括:头部图像、身体图像、腿部图像及脚部图像。
其中,所述头部图像的属性包括:头部穿戴物体属性、头部动作属性及人体生理属性;所述身体图像的属性包括:身体穿戴物体属性、身体穿戴颜色属性、身体方位属性、手部是否提取物品的属性;所述腿部图像的属性包括:腿部穿戴物体属性、腿部穿戴颜色属性;所述脚部图像的属性包括:鞋子颜色属性、鞋子款式属性。
其中,所述人体各部位特征流的联系包括:上半身特征与下半身特征的联系、头部特征与身体特征的联系、身体特征与腿部特征的联系、腿部特征与脚部特征的联系。
本申请第二方面提供一种行人属性分类装置,包括:图像获取模块,用于获取待分类图像;模型训练模块,用于预先训练用于行人属性分类的属性分类模型;模型运行模块,用于运行所述模型训练模块训练的属性分类模型;结果获取模块,用于将所述待分类图像输入所述属性分类模型进行属性分类,得到对所述待分类图像的属性分类结果;所述模型训练模块包括:模型建立单元,用于建立原始属性分类模型;样本数据获取单元,用于获取样本数据;第一划分单元,用于对所述样本数据进行人体层次结构划分,得到不同层次的人体图像划分结果;第一联系获取单元,用于获取不同层次的人体图像划分结果中,人体相邻各部位特征流的联系;第一图像分割单元,用于利用所述人体图像划分结果,以及所述人体各部位特征流的联系,将所述样本数据进行分割,得到不同层次的样本分割图像;训练单元,用于利用不同层次的样本分割图像训练所述原始属性分类模型,得到用于将待分类图像进行不同层次的属性识分类的属性分类模型;所述模型运行模块包括:第二划分单元,用于将所述待分类图像进行人体层次结构划分,得到不同层次的人体图像划分结果;第二联系获取单元,用于获取不同层次的人体图像划分结果中,人体相邻各部位特征流的联系;第二图像分割单元,用于利用所述人体图像划分结果,以及所述人体各部位特征流的联系,将所述待分类图像进行分割,得到人体图像不同层次的分割图像;属性分类单元,用于对不同层次的分割图像进行属性分类,得到属性分类结果。
本申请第三方面提供一种电子设备,包括存储器及处理器,所述存储器中储存有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行上述中任一项所述的行人属性分类方法的步骤。
本申请第四方面提供一个或多个存储有计算机可读指令的非易失性可读存储介质,所述计算机可读指令被一个或多个处理器执行时,使得所述一个或多个处理器执行上述中任一项所述的行人属性分类方法的步骤。
本申请上述的行人属性分类方法、装置、电子设备及存储介质,通过在预先训练时,利用不同层次的人体图像划分结果,以及各部位特征流的联系,能够将人体图像按照不同层次进行分割,从而使得利用样本分割图像训练出的属性分类模型,能够对人体图像进行不同层次的属性分类,因此在进行行人属性分类时,不会受到背景杂物、物体遮挡等影响,从而降低行人属性分类时,混淆及误判的几率。
具体实施方式
下面结合附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而非全部实施例。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如背景技术所述,发明人研究发现,现有技术的行人属性分类的方法,是基于整张图片对人体进行属性分类,过分注重对进行特征提取的深度神经卷积网络进行优化,这会导致整图分类结果易受背景杂物、物体遮挡等影响,从而增加行人属性分类时,混淆及误判的几率。
本申请实施例提出一种行人属性分类方法、装置、电子设备及存储介质,可以降低行人属性分类时,混淆及误判的几率。
图1是本申请一实施例行人属性分类方法的流程示意图,行人属性分类方法包括:
S101、获取待分类图像;
S102、将待分类图像输入预先训练的属性分类模型进行属性分类,得到对待分类图像的属性分类结果。
请参阅图2,在步骤S102中,预先训练的属性分类模型的训练步骤包括:
S1021、建立原始属性分类模型,并获取样本数据;
S1022、对样本数据进行人体层次结构划分,得到不同层次的人体图像划分结果;
S1023、获取不同层次的人体图像划分结果中,人体相邻各部位特征流的联系;
S1024、利用人体图像划分结果,以及人体各部位特征流的联系,将样本数据进行分割,得到人体图像不同层次的样本分割图像;
S1025、利用不同层次的样本分割图像训练原始属性分类模型,得到用于将待分类图像进行不同层次的属性识分类的属性分类模型。
在本实施中,通过在预先训练时,利用不同层次的人体图像划分结果,以及各部位特征流的联系,能够将人体图像按照不同层次进行分割,从而使得利用样本分割图像训练出的属性分类模型,能够对人体图像进行不同层次的属性分类,因此在进行行人属性分类时,不会受到背景杂物、物体遮挡等影响,从而降低行人属性分类时,混淆及误判的几率。
同理,将待分类图像输入预先训练的属性分类模型对待分类图像进行分类的步骤包括:将待分类图像进行人体层次结构划分,得到不同层次的人体图像划分结果;获取不同层次的人体图像划分结果中,人体相邻各部位特征流的联系;利用人体图像划分结果,以及人体各部位特征流的联系,将待分类图像进行分割,得到人体图像不同层次的分割图像;对不同层次的分割图像进行属性分类,得到属性分类结果。
在步骤S102及步骤S1021中,属性分类模型可以为注意力机制模型,也可以为ACN(Agent Cooperate Network,经纪人合作网络)模型。
在步骤S1022中,人体层次结构可以为第一层次的全身结构;还可以为第二层次的上半身结构及下半身结构;还可以为第三层次的头部结构、身体结构、腿部结构及脚部结构。在本实施例中,利用三个层次的结构对样本图像进行三次划分,得到了不同层次的人体图像划分结果。
根据不同层次的人体图像划分结果,在步骤S1023中,第二层次的上半身结构及下半身结构特征流的联系,是上半身特征及下半身特征之间的联系;第三层次相邻各部位特征流的联系,是头部特征与身体特征的联系、身体特征与腿部特征的联系、腿部特征与脚部特征的联系。
因此在步骤S104中,根据人体图像划分结果,以及人体各部位特征流的联系,将第二层次的结构,划分为上半身图像及下半身图像;将第三层次的结构,划分为头部图像、身体图像、腿部图像及脚部图像;而由于第一层次为全身结构,因此不用进行分割,即能够得到人体的全身图像。
其中,头部图像的属性可包括:头部穿戴物体属性、头部动作属性及人体生理属性;头部穿戴物体属性可以为:无帽、普通帽、安全帽,戴眼镜、戴墨镜、无眼镜、无口罩、戴口罩;其中,头部动作属性可以为:吸烟、未吸烟;人体生理属性可以为:性别、年龄。
身体图像的属性可以包括:身体穿戴物体属性、身体穿戴颜色属性、身体方位属性、手部是否提取物品的属性;其中,身体穿戴物体属性可以为:T恤、无袖、衬衫、西装、毛衣、夹克、羽绒服、风衣、外套,无背包、单肩包、双肩包;身体穿戴颜色属性可以为:身体穿戴物体颜色,例如T恤的颜色;身体方位属性可以为:正面、背面、左侧面、右侧面;手部是否提取物品的属性可以为:无手提物、有手提物。
腿部图像的属性可包括:腿部穿戴物体属性、腿部穿戴颜色属性;腿部穿戴物体属性可以为:长裤、短裤、长裙、短裙,腿部穿戴颜色属性可以为:腿部穿戴物体颜色,例如长裤颜色。
脚部图像的属性可包括:鞋子颜色属性、鞋子款式属性;鞋子款式属性可以为:凉鞋、皮鞋、布鞋等。
其中,分割样本图像时,可以使用预先建立的语义分割网络进行分割,将人体图像划分结果、以及人体各部位特征流的联系作为语义分割网络的条件对样本数据进行分割,分别得到不同层次人体的样本分割图像,分割后,第二层次人体的样本分割图像包括:上半身图像及下半身图像,第三层次人体的样本分割图像包括:头部图像、身体图像、腿部图像及脚部图像,第一层次的为全身图像。
在一个实施例中,步骤S1024,利用人体图像划分结果,以及人体各部位特征流的联系,将样本数据进行分割,得到人体图像不同层次的样本分割图像,具体步骤包括:利用预先建立的语义分割网络,并将人体图像划分结果,以及人体各部位特征流的联系作为语义分割网络的条件,对样本数据进行分割,得到至少两个不同层次人体的样本分割图像,一个层次人体的样本分割图像包括:上半身图像及下半身图像,另一个层次人体的样本分割图像包括:头部图像、身体图像、腿部图像及脚部图像。
在一个实施例中,步骤S1024,至少两个不同层次人体的样本分割图像还可以是三个,分别为第一层次的全身图像,第二层次的上半身图像及下半身图像,第三层次的头部图像、身体图像、腿部图像及脚部图像。
因此,在步骤S105中,分别利用第一层次、第二层次及第三层次得到的图像,对原始属性分类模型进行训练,能够使得训练出的属性分类模型,从不同层次对待分类图像上的行人属性进行分类,从而使得分类时,降低受到背景杂物、物体遮挡等影响,从而降低行人属性分类时,混淆及误判的几率。
在一个实施例中,在步骤S1025,利用不同层次的样本分割图像训练原始属性分类模型时,预先训练的属性分类模型的训练步骤还包括:
S1026、获取样本数据内人体的全身图像;
S1027、将全身图像及分割图像进行相互监督学习,直至相互监督学习的次数达到第一预定次数。
上述实施例中已经提到,在步骤S104中,能够得到第一层次、第二层次及第三层次的人体图像,其中,第一层次的人体图像为全身图像,第二层次及第三层次的人体图像为身体部位图像。
在对人体图像的各个身体部位图像及全身图像进行分类时,有时会出现一些特征分类错误的情况,因此就可能出现全身图像分类正确,身体部位图像分类错误的情况,在这种情况下,通过本实施例就能够将全身图像对身体部位图像进行监督,对身体部位图像分类错误的特征进行修正,从而提升身体部位图像的准确度。同理,出现身体部位图像分类正确,全身图像分类错误的情况时,本实施例的方法也能够通过身体部位图像对全身图像的监督及修正,提升全身图像的准确度。
第一预定次数可以根据实际情况进行设定,例如可以为3次,也可以为4次,5次等,通过多次的相互监督学习,能够进一步提升全身图像及身体部位图像的准确度。
在一个实施例中,步骤S1027中,将全身图像及分割图像进行相互监督学习,具体步骤包括:利用相邻分割图像之间的特征流的联系,将相邻分割图像进行融合,得到人体的融合验证图像;利用融合验证图像验证及修正全身图像;将全身图像按照相邻分割图像之间的特征流的联系进行分割,得到分割验证图像;利用分割验证图像验证及修正分割图像。
在本实施中,通过将全身图像进行分割,能够得到人体的各部位分割验证图像,且各部位的分割验证图像与各分割图像一一对应,能够对比出二者的不同点,因此可以通过对不同点的判断,来验证该不同点是否应存在于分割图像内,是则将该不同点从分割图像内消除,否则将该不同点加入分割图像内,从而进行修正。同理各分割图像融合能够得到人整体的融合验证图,能够通过融合验证图像对全身图像进行验证及修正。
在一个实施例中,在步骤S1025,利用不同层次的样本分割图像训练原始属性分类模型时,预先训练的属性分类模型的训练步骤还包括:S1028、将全身图像、分割图像各自进行自监督学习,直至自监督学习的次数达到第二预定次数。
在本实施中,在对人体图像的各个身体部位图像及全身图像进行分类时,对于同一特征,有时会出现分类错误、有时会出现分类正确的情况发生,这就使得多次分类中,每次出现的正确分类和错误分类不相同,因此将全身图像及分割图像各自进行自监督学习,能够使用分类正确时的图像对分类错误时的图像进行修正,提升分类的准确度。
在步骤S1025中,自监督学习的方法包括:至少获取两次全身图像以及分割图像;将不同次获取的全身图像进行相互监督学习,将不同次获取的相同部位的人体部位图像进行相互监督学习。
在本实施例中,第二预定次数可以根据实际情况进行设定,例如可以为3次,也可以为4次,5次等,通过多次的自监督学习,能够进一步提升分类的准确度。
例如,请参阅图3,在对待分类图像进行分类时,首先会将待分类图像内的人体进行层次结构划分,划分有三个层次,从上至下分别为上述实施例中描述的第一层次、第二层次及第三层次的图像,随后需要将三个层次的图像进行互相监督学习及自监督学习,随后根据不同层次结构对图像进行不同层次的分割,最后将待分类图像内的人体图像进行不同层次的分类,从而提升行人属性分类的准确性。
在本实施例中,对于三个层次的图像,先进行自监督学习,再进行互相监督学习,自监督学习的第二预定次数大于互相监督学习的第一预定次数,例如,第二预定次数为5次,第一预定次数就可以为3次,由于先进行了自监督学习,使得每个层次的图像的准确度均有所提升,因此就可以降低互相监督学习的次数,而由于互相监督学习比自监督学习会占用更多的运算资源,因此降低互相监督学习的次数后,会减少运算资源的浪费。在一个实施例中,上述实施例中的步骤S102中,将待分类图像输入预先训练的属性分类模型时,行人属性分类方法还包括:S1021、获取预先构建的对比度增强算法;S1022、利用对比度增强算法增强待分类图像的对比度,以提升待分类图像的特征明显度。
其中,在步骤1012中,利用对比度增强算法增强待分类图像的对比度的步骤包括:获取待分类图像的每个像素点的原始亮度;计算待分类图像的所有像素点的平均亮度;获取预设的增强值;计算每个像素点的每个原始亮度及平均亮度的差值、增强值与一的和值;对差值及和值求解乘积值;对乘积值及平均亮度进行求和,得到每个像素点的亮度值;根据亮度值调整每个像素点的亮度,利用亮度的调整完成对比度的增强。
在其他实施例中,对比度增强算法可以使用直方图调整算法,在其他实施例中,还能使用灰度变换算法或其他公知的能够增强图像对比度的算法。
通过对待分类图像的对比度进行增强,能够使得待分类图像越清晰醒目,色彩也越鲜明艳丽,高对比度对于图像的清晰度、细节表现、灰度层次表现都有很大帮助,而这些表现在机器视觉里,高对比度的图像就表现出更加明显特征,因此通过增强待分类图像的对比度,能够提升待分类图像的特征明显度,使得对象检测模型能够容易地检测出待分类图像上的特征点,从而有利于对象检测模型利用特征点判断待分类图像上人体的特征,因此降低了属性分类模型对待分类图像进行分类的难度。
图4为一个实施例的行人属性分类装置的结构框图。如图4所示,行人属性分类装置包括:图像获取模块1、模型训练模块2、模型运行模块3及结果获取模块4;图像获取模块1用于获取待分类图像;模型训练模块2用于预先训练用于行人属性分类的属性分类模型;模型运行模块3用于运行模型训练模块训练的属性分类模型;结果获取模块4用于将待分类图像输入属性分类模型进行属性分类,得到对待分类图像的属性分类结果。
模型训练模块包括:模型建立单元,用于建立原始属性分类模型;样本数据获取单元,用于获取样本数据;第一划分单元,用于对样本数据进行人体层次结构划分,得到不同层次的人体图像划分结果;第一联系获取单元,用于获取不同层次的人体图像划分结果中,人体相邻各部位特征流的联系;第一图像分割单元,用于利用人体图像划分结果,以及人体各部位特征流的联系,将样本数据进行分割,得到不同层次的样本分割图像;训练单元,用于利用不同层次的样本分割图像训练原始属性分类模型,得到用于将待分类图像进行不同层次的属性识分类的属性分类模型;
模型运行模块包括:第二划分单元,用于将待分类图像进行人体层次结构划分,得到不同层次的人体图像划分结果;第二联系获取单元,用于获取不同层次的人体图像划分结果中,人体相邻各部位特征流的联系;第二图像分割单元,用于利用人体图像划分结果,以及人体各部位特征流的联系,将待分类图像进行分割,得到人体图像不同层次的分割图像;属性分类单元,用于对不同层次的分割图像进行属性分类,得到属性分类结果。
本实施例提供的行人属性分类装置,通过在预先训练时,利用不同层次的人体图像划分结果,以及各部位特征流的联系,能够将人体图像按照不同层次进行分割,从而使得利用样本分割图像训练出的属性分类模型,能够对人体图像进行不同层次的属性分类,因此在进行行人属性分类时,不会受到背景杂物、物体遮挡等影响,从而降低行人属性分类时,混淆及误判的几率。
上述行人属性分类装置中各个模块的划分仅用于举例说明,在其他实施例中,可将行人属性分类装置按照需要划分为不同的模块,以完成上述行人属性分类装置的全部或部分功能。
关于行人属性分类装置的具体限定可以参见上文中对于行人属性分类方法的限定,在此不再赘述。上述行人属性分类装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
本申请实施例中提供的行人属性分类装置中的各个模块的实现可为计算机程序的形式。该计算机程序可在终端或服务器上运行。该计算机程序构成的程序模块可存储在终端或服务器的存储器上。该计算机程序被处理器执行时,实现本申请实施例中所描述方法的步骤。
本申请还提出了一种电子设备,包括存储器及处理器,所述存储器中储存有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行上述任意实施例中所述的行人属性分类方法的步骤。
电子设备可以以各种形式来实施。例如,本申请中描述的电子设备可以包括诸如手机、平板电脑、笔记本电脑、掌上电脑、个人数字助理(Personal Digital Assistant,PDA)、便捷式媒体播放器(Portable Media Player,PMP)、导航装置、可穿戴设备、智能手环、计步器等移动终端,以及诸如数字TV、台式计算机等固定终端。
本申请实施例还提供了一种计算机可读存储介质。一个或多个包含计算机可执行指令的非易失性计算机可读存储介质,当所述计算机可执行指令被一个或多个处理器执行时,使得所述处理器执行行人属性分类方法的步骤。
一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行行人属性分类方法。
本申请所使用的对存储器、存储、数据库或其它介质的任何引用可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM),它用作外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDR SDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。