CN115294394A - 一种属性识别方法、装置、设备及介质 - Google Patents
一种属性识别方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN115294394A CN115294394A CN202210956032.3A CN202210956032A CN115294394A CN 115294394 A CN115294394 A CN 115294394A CN 202210956032 A CN202210956032 A CN 202210956032A CN 115294394 A CN115294394 A CN 115294394A
- Authority
- CN
- China
- Prior art keywords
- image
- channel
- pixel point
- color space
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 65
- 239000013598 vector Substances 0.000 claims description 116
- 238000000605 extraction Methods 0.000 claims description 32
- 238000012545 processing Methods 0.000 claims description 27
- 238000011176 pooling Methods 0.000 claims description 25
- 230000008569 process Effects 0.000 claims description 22
- 238000004590 computer program Methods 0.000 claims description 14
- 238000006243 chemical reaction Methods 0.000 claims description 10
- 239000000284 extract Substances 0.000 claims description 8
- 238000012549 training Methods 0.000 claims description 7
- 238000007499 fusion processing Methods 0.000 claims description 6
- 238000012937 correction Methods 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 17
- 238000004891 communication Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 101150039208 KCNK3 gene Proteins 0.000 description 3
- 239000011521 glass Substances 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000037308 hair color Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 101150083764 KCNK9 gene Proteins 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/34—Smoothing or thinning of the pattern; Morphological operations; Skeletonisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本申请实施提供一种属性识别方法、装置、设备及介质,由于在本申请实施例中,在基于预先训练完成的属性识别模型进行属性识别之前,首先针对获取到的第一待识别图像中的每个像素点,根据该第一待识别图像在LAB颜色空间下每个通道的第一方差与预先保存的标准对照方差的比值,以及预先保存的该像素点对应的标准对照像素点在每个通道的对照数值,和该第一待识别图像在LAB颜色空间下每个通道的第一均值,确定该第一待识别图像的每个像素点在LAB颜色空间下每个通道对应的第一矫正后数值,并基于每个第一矫正后数值,确定矫正后的RGB颜色空间下的第一目标待识别图像,基于该第一目标待识别图像进行属性识别,有效提高了属性识别的准确率。
Description
技术领域
本申请涉及图像处理技术领域,尤其涉及一种属性识别方法、装置、设备及介质。
背景技术
日常监控视频中的行人具有丰富的属性信息,这些属性信息在图像检索,智慧安防和人机交互等领域具有广泛的应用价值,因此人的属性识别已经成为计算机视觉的热点研究方向。目前如何提升人的属性识别的准确率,增加属性识别能够识别的属性信息的种类数以及在视频中提升属性识别的稳定性已经成为研究重点。
现有技术中,对人的属性识别方法主要是基于一般的卷积神经网络分类识别,基于背景抑制,或者基于损失函数改进的分类网络实现的,这些方法虽然取得了一些效果,但是对于颜色类数据未做统一的矫正,导致对颜色的识别准确率过多依赖图像采集设备采集的图像数据的质量,降低了属性识别的准确率。
因此,如何提高属性识别的准确率成为亟待解决的问题。
发明内容
本申请实施提供一种属性识别方法、装置、设备及介质,用以解决现有技术中属性识别的准确率较低的问题。
第一方面,本申请提供了一种属性识别方法,所述方法包括:
确定获取到的第一待识别图像在LAB颜色空间下每个通道的第一均值和第一方差;
针对所述第一待识别图像中的每个像素点,根据LAB颜色空间下每个通道的第一方差与预先保存的标准对照方差的比值,以及预先保存的标准对照像素点集中,该像素点对应的标准对照像素点在每个通道的对照数值和所述第一均值,确定该像素点在LAB颜色空间下每个通道对应的第一矫正后数值;
基于所述第一待识别图像每个像素点在LAB颜色空间下每个通道对应的第一矫正后数值,确定所述第一待识别图像矫正后的RGB颜色空间下的第一目标待识别图像;
将所述第一目标待识别图像输入到预先训练完成的属性识别模型中,根据所述属性识别模型的输出确定识别到的所述第一待识别图像的属性值。
第二方面,本申请提供了一种属性识别装置,所述装置包括:
确定模块,用于确定获取到的第一待识别图像在LAB颜色空间下每个通道的第一均值和第一方差;用于针对所述第一待识别图像中的每个像素点,根据LAB颜色空间下每个通道的第一方差与预先保存的标准对照方差的比值,以及预先保存的标准对照像素点集中,该像素点对应的标准对照像素点在每个通道的对照数值和所述第一均值,确定该像素点在LAB颜色空间下每个通道对应的第一矫正后数值;
矫正模块,基于所述第一待识别图像每个像素点在LAB颜色空间下每个通道对应的第一矫正后数值,确定所述第一待识别图像矫正后的RGB颜色空间下的第一目标待识别图像;
识别模块,用于将所述第一目标待识别图像输入到预先训练完成的属性识别模型中,根据所述属性识别模型的输出确定识别到的所述第一待识别图像的属性值。
第三方面,本申请还提供了一种电子设备,所述电子设备至少包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序时实现上述任一所述的属性识别方法的步骤。
第四方面,本申请还提供了一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现上述任一所述的属性识别方法的步骤。
本申请实施例提供了一种属性识别方法、装置、设备及介质,该方法中确定获取到的第一待识别图像在LAB颜色空间下每个通道的第一均值和第一方差,针对第一待识别图像中的每个像素点,根据LAB颜色空间下每个通道的第一方差与预先保存的标准对照方差的比值,以及预先保存的标准对照像素点集中,该像素点对应的标准对照像素点在每个通道的对照数值和该第一均值,确定该像素点在LAB颜色空间下每个通道对应的第一矫正后数值,并基于第一待识别图像每个像素点在LAB颜色空间下每个通道对应的第一矫正后数值,确定第一待识别图像矫正后的RGB颜色空间下的第一目标待识别图像,将该第一目标待识别图像输入到预先训练完成的属性识别模型中,根据属性识别模型的输出确定识别到的第一待识别图像的属性值。由于在本申请实施例中,在基于预先训练完成的属性识别模型进行属性识别之前,首先针对获取到的第一待识别图像中的每个像素点,根据该第一待识别图像在LAB颜色空间下每个通道的第一方差与预先保存的标准对照方差的比值,以及预先保存的该像素点对应的标准对照像素点在每个通道的对照数值,和该第一待识别图像在LAB颜色空间下每个通道的第一均值,确定该第一待识别图像的每个像素点在LAB颜色空间下每个通道对应的第一矫正后数值,从而实现对该第一待识别图像的每个像素点进行矫正,并根据第一待识别图像的每个像素点在LAB颜色空间下每个通道对应的第一矫正后数值,得到矫正后的RGB颜色空间下的第一目标待识别图像,基于该矫正后的第一目标待识别图像进行属性识别,有效提高了属性识别的准确率。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的属性识别过程示意图;
图2为本申请实施例提供的属性识别模型进行属性识别的过程示意图;
图3为本申请实施例提供的另一属性识别过程示意图;
图4为本申请实施例提供的属性识别装置的结构示意图;
图5为本申请实施例提供的一种电子设备结构示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图,对本申请的实施例的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供了一种属性识别方法、装置、设备及介质,该方法中确定获取到的第一待识别图像在LAB颜色空间下每个通道的第一均值和第一方差,针对第一待识别图像中的每个像素点,根据LAB颜色空间下每个通道的第一方差与预先保存的标准对照方差的比值,以及预先保存的标准对照像素点集中,该像素点对应的标准对照像素点在每个通道的对照数值和该第一均值,确定该像素点在LAB颜色空间下每个通道对应的第一矫正后数值,并基于第一待识别图像每个像素点在LAB颜色空间下每个通道对应的第一矫正后数值,确定第一待识别图像矫正后的RGB颜色空间下的第一目标待识别图像,将该第一目标待识别图像输入到预先训练完成的属性识别模型中,根据属性识别模型的输出确定识别到的第一待识别图像的属性值。
实施例1:
图1为本申请实施例提供的属性识别过程示意图,该过程具体包括以下步骤:
S101:确定获取到的第一待识别图像在LAB颜色空间下每个通道的第一均值和第一方差。
本申请实施例提供的属性识别过程适用于电子设备,该电子设备可以是服务器、PC、图像采集设备等设备。
图像采集设备在采集图像时,容易受到外界环境的干扰,例如,外界环境光照强度较高时,图像采集设备采集到的图像的亮度相对较高,如果直接对图像采集设备采集到的该图像进行属性识别,会因为图像采集设备采集到的图像的质量不高,而导致属性识别的准确率较低。因此,为了提高了属性识别的准确率,在本申请实施例中,电子设备获取到图像采集设备采集的第一待识别图像,对该第一待识别图像进行统一矫正,避免由于第一待识别图像的图像质量而影响属性识别准确率的问题。
在本申请实施例中,电子设备可以获取第一待识别图像,并确定该第一待识别图像在LAB颜色空间下每个通道的第一均值和第一方差。其中,第一待识别图像可以是与电子设备连接的图像采集设备采集到的某一张图像,也可以是与电子设备连接的图像采集设备采集到的视频中的某一视频帧对应的帧图像,还可以是电子设备的使用者输入的图像。若电子设备为图像采集设备,则该第一待识别图像为该电子设备自身采集到的图像。
在确定该第一待识别图像在LAB颜色空间下每个通道的第一均值和第一方差时,获取该第一待识别图像的每个像素点在LAB颜色空间下L通道对应的数值,并根据每个像素点的L通道对应的数值,确定该第一待识别图像在L通道的第一均值和第一方差获取该第一待识别图像的每个像素点在LAB颜色空间下A通道对应的数值,并根据每个像素点的A通道对应的数值,确定该第一待识别图像在A通道的第一均值和第一方差获取该第一待识别图像的每个像素点在LAB颜色空间下B通道对应的数值,并根据每个像素点的B通道对应的数值,确定该第一待识别图像在B通道的第一均值和第一方差
S102:针对所述第一待识别图像中的每个像素点,根据LAB颜色空间下每个通道的第一方差与预先保存的标准对照方差的比值,以及预先保存的标准对照像素点集中,该像素点对应的标准对照像素点在每个通道的对照数值和所述第一均值,确定该像素点在LAB颜色空间下每个通道对应的第一矫正后数值。
在本申请实施例中,对第一待识别图像进行矫正时,可以针对该第一待识别图像中的每个像素点,确定该像素点在LAB颜色空间下每个通道对应的第一矫正后数值。
具体的,针对第一待识别图像中的每个像素点,并针对LAB颜色空间下的每个通道,首先确定该像素点在该通道对应的第一方差与预先保存的标准对照方差的比值,并根据预先保存的标准对照像素点集中,该像素点对应的标准对照像素点在该通道的对照数值和第一待识别图像在该通道对应的第一均值,确定该像素点在该通道对应的第一矫正后数值。
在本申请实施例中,可以对于LAB颜色空间下的每个通道都对应预先保存一个标准对照方差,该标准对照方差可以是工作人员预先根据某一张拍摄效果较好的对照图像确定的。在本申请实施例中,标准对照像素点集中保存有多个标准对照像素点在LAB颜色空间下每个通道对应的对照数值,也就是说,针对标准对照像素点集中的每个标准对照像素点都对应保存有三个标准对照数值,即LAB颜色空间下的L通道、A通道和B通道分别对应的对照数值。标准对照像素点集中保存的标准对照像素点的数量可以与第一待识别图像中的像素点数量一致。为了使属性识别方法可以适用于不同像素尺寸第一待识别图像,在本申请实施例中,可以根据第一待识别图像可能出现的像素尺寸大小,预先保存有多个标准对照像素点集,在对第一待识别图像进行矫正之前,可以根据第一待识别图像的像素尺寸,确定在矫正时使用预先保存的哪一个标准对照像素点集对第一待识别图像进行矫正。
具体的,在本申请实施例中,在确定第一待识别图像中任一像素点在L通道对应的第一矫正后数值时,可以确定第一待识别图像在LAB颜色空间下L通道对应的第一方差与预先保存的标准对照方差的比值,为了方便描述,该比值可以表示为在本申请实施例中,可以确定第一预设参数c1与该比值的第一乘积确定了第一乘积之后,还可以确定第一乘积与第二预设参数c2的第一和值并根据确定的第一和值,确定该第一和值与预先保存的标准对照像素点集中,该像素点对应的标准对照像素点在L通道的对照数值的第二乘积将第二乘积与第一待识别图像在LAB颜色空间下的L通道的第一均值的第二和值确定为该像素点在LAB颜色空间下L通道对应的第一矫正后数值。在确定该像素点在A通道和B通道分别对应的第一矫正后数值时,确定方法与确定该像素点在L通道对应的第一矫正后数值的方法相似,该像素点在A通道对应的第一矫正后数值可以表示为:
其中,c1表示第一预设参数,表示该第一待识别图像在A通道的第一方差,表示LAB颜色空间下A通道对应预先保存的标准对照方差,c2表示第二预设参数,表示在预先保存的标准对照像素点集中,该像素点对应的标准对照像素点在A通道的对照数值,表示该第一待识别图像在A通道的第一均值。
其中,c1表示第一预设参数,表示该第一待识别图像在B通道的第一方差,表示LAB颜色空间下B通道对应预先保存的标准对照方差,c2表示第二预设参数,表示在预先保存的标准对照像素点集中,该像素点对应的标准对照像素点在B通道的对照数值,表示该第一待识别图像在B通道的第一均值。
在本申请实施例中,第一预设参数c1与第二预设参数c2的和值为1,即c1+c2=1,在本申请实施例中,可以通过c1和c2控制矫正后的图像的颜色深浅以及亮度的高低,本领域的技术人员可以根据需要进行设置,在本申请实施例中,默认c1=0.5,c2=0.5。
S103:基于所述第一待识别图像每个像素点在LAB颜色空间下每个通道对应的第一矫正后数值,确定所述第一待识别图像矫正后的RGB颜色空间下的第一目标待识别图像。
在确定了第一待识别图像的每个像素点在LAB颜色空间下每个通道对应的第一矫正后数值之后,在本申请实施例中,可将每个像素点在LAB颜色空间下每个通道对应的第一矫正后数值,转换为RGB颜色空间下对应的数值,从而得到第一待识别图像矫正后的RGB颜色空间下的第一目标待识别图像。
S104:将所述第一目标待识别图像输入到预先训练完成的属性识别模型中,根据所述属性识别模型的输出确定识别到的所述第一待识别图像的属性值。
确定了第一待识别图像矫正后的RGB颜色空间下的第一目标待识别图像之后,可以将该第一目标待识别图像输入到预先训练完成的属性识别模型中,进行属性识别,从而根据属性识别模型的输出确定识别到的第一待识别图像的属性值。其中,第一待识别图像的属性值可以是识别出某一预设属性的可能性,例如,属性识别模型可以输出识别到的第一目标待识别图像中包含的人的上身衣着颜色对应的每个预设颜色的可能性,第一目标待识别图像的属性值也可以是属性识别模型识别到的第一目标待识别图像中包含的人的上身衣着的具体颜色。
由于在本申请实施例中,在基于预先训练完成的属性识别模型进行属性识别之前,首先针对获取到的第一待识别图像中的每个像素点,根据该第一待识别图像在LAB颜色空间下每个通道的第一方差与预先保存的标准对照方差的比值,以及预先保存的该像素点对应的标准对照像素点在每个通道的对照数值,和该第一待识别图像在LAB颜色空间下每个通道的第一均值,确定该第一待识别图像的每个像素点在LAB颜色空间下每个通道对应的第一矫正后数值,从而实现对该第一待识别图像的每个像素点进行矫正,并根据第一待识别图像的每个像素点在LAB颜色空间下每个通道对应的第一矫正后数值,得到矫正后的RGB颜色空间下的第一目标待识别图像,基于该矫正后的第一目标待识别图像进行属性识别,有效提高了属性识别的准确率。
实施例2:
为了进一步提高属性识别的准确率,在上述实施例的基础上,在本申请实施例中,所述标准对照像素点集中标准对照像素点在每个通道的对照数值的确定过程包括:
对第一样本集中的每个第一标准对照图像进行LAB颜色空间转换,得到每个第二标准对照图像;
根据所述第一样本集中的每个所述第二标准对照图像,确定所述第一样本集在LAB颜色空间下每个通道的第一对照平均值;
针对每个像素点,根据该像素点在每个所述第二标准对照图像中对应的每个通道的数值,确定该像素点在LAB颜色空间下每个通道对应的第二对照平均值;并针对LAB颜色空间下的每个通道,计算该通道对应的所述第二对照平均值与该通道对应的所述第一对照平均值的差值,并将所述差值作为所述标准对照像素点集中该像素点对应的标准对照像素点在该通道的对照数值。
为了进一步提高属性识别的准确率,在确定标准对照像素点集中标准对照像素点在每个通道的对照数值时,还可以根据多张图像综合确定,在本申请实施例中,可以基于第一样本集进行确定,第一样本集中保存有多张预先拍摄完成的第一标准对照图像,第一样本集中的每个第一标准对照图像可以是工作人员预先选择的颜色比较分明的图像,其中,颜色比较分明的图像可以理解为,该图像不存在过度曝光、虚影等问题,并且第一样本集中的每个第一标准对照图像的尺寸大小均相等。
在本申请实施例中,可以对第一样本集中的每个第一标准对照图像进行LAB颜色空间转换,从而得到每个第二标准对照图像。并根据该第一样本集中的每个第二标准对照图像,确定第一样本集在LAB颜色空间每个通道的第一对照平均值。
具体的,第一样本集G={g1,g2,…,gn},其中第一样本集中包含了n个第一标准对照图像g,可以对第一样本集G中n个第一标准对照图像进行LAB颜色空间转换,得到n个第二标准对照图像。假设n=10,每个第二标准对照图像中包括50个像素点,那么确定第一样本集G在LAB颜色空间下L通道的第一对照平均值时,可以获取10个第二标准对照图像的50个像素点在L通道的数值,也就是可以获取到50*10个L通道的数值,可以确定获取到的500个L通道的数值的平均值,该平均值即为该第一样本集G在L通道的第一对照平均值
确定了第一样本集在LAB颜色空间下每个通道的第一对照平均值之后,在本申请实施例中,可以针对每个像素点,根据该像素点在每个第二标准对照图像中对应的每个通道的数值,确定该像素点在LAB颜色空间下每个通道对应的第二对照平均值。
具体的,假设第一样本集G中包括n个第二标准对照图像,可以获取像素点1在n个第二标准对照图像中对应的每个通道的数值,并根据每个通道的数值,确定像素点1在LAB颜色空间下每个通道对应的第二对照平均值。
为了方便描述,每个像素点在LAB颜色空间下L通道对应的第二对照平均值可以表示为LG,A通道对应的第二对照平均值可以表示为AG,B通道对应的第二对照平均值可以表示为BG。
在本申请实施例中,每个像素点在LAB颜色空间下的L通道的第二对照平均值LG的确定过程可以表示为:
第一样本集G在LAB颜色空间下的A通道的第二对照平均值AG的确定过程可以表示为:
第一样本集G在LAB颜色空间下的B通道的第二对照平均值BG的确定过程可以表示为:
确定了该像素点在LAB颜色空间下每个通道对应的第二对照平均值之后,可以针对每个LAB颜色空间下的每个通道,计算该通道对应的第二对照平均值与该通道对应的所述第一对照平均值的差值,可以将该差值作为标准对照像素点集中该像素点对应的标准对照像素点在该通道的对照数值。
具体的,可以针对LAB颜色空间下的L通道,计算该像素点在L通道对应的第二对照平均值LG与第一样本集在L通道的第一对照平均值的差值,将该差值作为标准对照像素点集中该像素点对应的标准对照像素点在L通道的对照数值为了方便描述,的确定过程可以表示为:
为了进一步提高属性识别的准确率,在上述各实施例的基础上,在本申请实施例中,所述方法还包括:
根据所述第一样本集中的每个所述第二标准对照图像,确定所述第一样本集在LAB颜色空间下每个通道的第一对照方差,并使用所述第一对照方差对所述标准对照方差进行更新。
为了进一步提高属性识别的准确率,可以根据第一样本集中的每个第二标准对照图像,确定第一对照方差。
具体的,第一样本集G={g1,g2,…,gn}中包含有n个第二标准对照图像,假设n=10,每个第二标准对照图像中包括50个像素点。在确定第一样本集G在LAB颜色空间下L通道的第一对照方差时,可以获取10个第二标准对照图像的50个像素点在L通道的数值,也就是可以获取到50*10个L通道的数值,可以确定获取到的500个L通道的数值的方差,该方差即为该第一样本集G在L通道的第一对照方差
具体的,在本申请实施例中,确定了第一样本集在LAB颜色空间下每个通道的第一对照方差之后,可以使用确定的第一样本集在LAB颜色空间下每个通道的第一对照方差,对对应通道预先保存的标准对照方差进行更新,例如使用确定的L通道的对照方差A1,对针对L通道预先保存的标准对照方差进行更新,即使
实施例3:
为了进一步提高属性识别的准确率,在上述各实施例的基础上,在本申请实施例中,所述属性识别模型的训练过程包括:
针对第二样本集中的每个样本图像,其中,每个样本图像对应有标签,所述标签用于标识样本图像中包含的人像的每个预设属性对应的目标属性值;
将该样本图像输入到预先训练完成的特征提取网络中,所述特征提取网络的特征提取层提取该样本图像的特征图像,并将所述特征图像输入到特征金字塔网络中;所述特征金字塔网络提取所述特征图像的每个第一图像特征向量,选取任一第一图像特征向量输入到投影层中;所述投影层对输入的所述第一图像特征向量进行卷积处理,得到映射后的第二图像特征向量,并将所述第二图像特征向量输入到卷积层中;所述卷积层对所述第二图像特征向量进行膨胀卷积处理,得到第三图像特征向量,并对所述第二图像特征向量和所述第三图像特征向量进行融合处理,得到融合后的第四图像特征向量,并将所述第四图像特征向量输入到池化层中;所述池化层对所述第四图像特征向量进行平均池化处理,得到每个池化后的第五图像特征向量,并将每个所述第五图像特征向量输入到全连接层中;所述全连接层根据所述每个第五图像特征向量,确定该样本图像的每个预设属性对应的属性值;
根据每个所述预设属性对应的属性值,以及每个所述预设属性对应的目标属性值,确定该样本图像对应的损失值,根据该样本图像对应的损失值对所述属性识别模型进行调整。
为了获得识别准确率高的属性识别模型,在本申请实施例中,预先配置有第二样本集,该第二样本集中包含多个样本图像,可以根据该第二样本集中包含的每个样本图像对属性识别模型进行训练。在本申请实施例中,第二样本集中除了包含各个样本图像以外,还包含各个样本图像对应的标签,其中,该标签用于标识样本图像中包含的人的每个预设属性对应的目标属性值。其中预设属性可以是样本图像中包含的人的性别,年龄,是否戴帽子,发型,是否佩戴眼镜,上身穿着颜色,下身穿着颜色等属性。每个属性对应的目标属性值可以是每个属性对应的具体属性值,比如,性别对应的目标属性值为女,年龄对应的属性值可以为童年,少年,青年,中年,老年等,年龄对应的属性值也可以为年龄范围,如0-12岁、12-20岁、20-40岁等,上身穿着颜色对应的目标属性值为红色等。
在本申请实施例中,还可以针对每个属性,预先将每个属性可能出现的属性值进行保存,在对样本图像进行标注时,可以从预先保存的每个属性可能出现的属性值中选择样本图像对应的目标属性值,并采用该目标属性值进行标注,例如,对于上身穿着颜色这一属性,该属性可能出现的属性值可能为红色、橙色、黄色、绿色、蓝色、白色,假设样本图像中包含的人的上身穿着颜色为白色,那么在对该样本图像进行标注时,只需将上身穿着颜色这一属性对应的白色属性值标识为1,其他属性值标识为0。
为了进一步提高属性识别模型识别的准确率,在本申请实施例中,还可以对样本图像的标签进行划分,例如,根据人体属性的本身特性,可以将标签划分为基于全局的属性,基于局部的属性,基于身体结构的属性,基于颜色的属性。其中,基于全局的属性可以包括年龄,行为,服装样式等属性;基于局部的属性可以是人的头部所对应的属性,例如,是否戴帽子,是否带眼镜,发型等属性;基于身体结构的属性可以包括上身穿着、下身穿着、脚部穿鞋类型、是否穿袜等属性;基于颜色的属性可以包括上身颜色、下身颜色和发色等属性。
为了对属性识别模型进行训练,在本申请实施例中,在获得第二样本集后,可以将第二样本集中的每个样本图像依次输入到原始的属性识别模型中的特征提取网络中,该特征提取网络的特征提取层提取输入的样本图像的特征图像。
具体的,该特征提取网络可以是骨架网络TResNet-M,TResNet-M网络的特征提取层可以对该样本图像进行不同尺度的编码,并输出不同尺寸大小的特征图像。在本申请实施例中,假设样本图像的分辨率为256x192,特征提取网络TResNet-M的特征提取层提取到的该样本图像的不同大小的特征图像分别为feature1,feature2和feature3,其中,feature1的尺寸维度为8x6x256,feature2的尺寸维度为16x12x256,feature3的尺寸维度为32x24x256。
在本申请实施例中,特征提取网络的特征提取层可以将提取到的每个特征图像输入到特征金字塔网络(Feature Pyramid Networks,FPN)中,特征金字塔网络提取特征图像的每个第一图像特征向量。
在本申请实施例中,为了兼顾属性识别的时效性,提高属性识别的效率,在本申请实施例中,可以基于单进单出机制(Single-Input Single-Output,SiSo)进行属性识别,即选取任一第一图像特征向量,并输入到特征金字塔网络中的投影层中。投影层可以对输入的第一图像特征向量进行卷积处理,得到映射后的第二图像特征向量。具体的,在本申请实施例中,投影层可以基于1×1,3×3的卷积核对输入的第一图像特征向量进行卷积处理。
为了增大属性识别模型的感受野范围,在本申请实施例中,投影层可以将映射后的第二图像特征向量输入到卷积层中,卷积层对获取到的第二图像特征向量进行膨胀卷积处理,从而得到第三图像特征向量。具体的,在本申请实施例中,可以基于4个1×1,3×3,1×1的卷积核对获取到的第二图像特征向量进行膨胀卷积处理。确定了进行膨胀卷积后的第三图像特征向量之后,可以将第二图像特征向量和第三图像特征向量融合,得到融合增强后的第四图像特征向量。
在本申请实施例中,卷积层可以将第四图像特征向量输入到池化层中,池化层可以对接收到的第四图像特征向量进行平均池化处理,从而确定每个池化后的第五图像特征向量,其中第五图像特征向量可以是每个预设属性对应的池化后的特征向量。
在本申请实施例中,池化层可以将每个第五图像特征向量输入到全连接层中,全连接层将接收到的每个第五图像特征向量进行分类,得到该样本图像的每个预设属性对应的属性值,并输出。具体的,在本申请实施例中,可以基于加权交叉熵损失函数对接收到的每个第五图像特征向量进行分类,从而得到该样本图像的每个预设属性对应的属性值。
在对属性识别模型进行训练时,将样本图像输入到属性识别模型中,属性识别模型输出该样本图像的每个预设属性对应的属性值。因为样本图像的每个预设属性对应的目标属性值已知,因此可以根据样本图像的每个预设属性对应的目标属性值和识别到的属性值,确定该样本图像对应的损失值,并根据确定的该样本图像对应的损失值对属性识别模型的参数进行调整。
在本申请实施例中预先设置有收敛条件,该收敛条件可以是,第二样本集中的样本图像通过属性识别模型训练后得到的每个预设属性对应的属性值与每个预设属性对应的目标属性值一致的次数大于预设数量;也可以是属性识别模型进行训练的迭代次数达到设置的最大迭代次数等,具体的本申请实施例对此不作限制。
下面结合一个具体的实施例,对属性识别模型进行属性识别的过程进行说明,图2为本申请实施例提供的属性识别模型进行属性识别的过程示意图,如图2所示,将包含人的第一目标待识别图像输入到特征提取网络TResNet-M中,TResNet-M网络的特征提取层提取该第一目标待识别图像不同尺寸维度的特征图像,分别为32x24x256尺寸维度、16x12x256尺寸维度和8x6x256尺寸维度。TResNet-M网络的特征提取层将提取到的每个特征图像输入到特征金字塔网络中,特征金字塔网络可以提取到特征图像的每个第一图像特征向量,基于单进单出机制,从特征金字塔网络提取的每个第一图像特征向量中,选取任一图像特征向量输入到投影层Projector中,具体的,可以选择尺寸维度为8*6*256的第一图像特征向量输入到投影层Projector中,投影层Projector基于1×1,3×3的卷积核对接收到的第一图像特征向量进行卷积处理,得到映射后的第二图像特征向量,卷积层基于4个1×1,3×3,1×1的卷积核对映射后的第二图像特征向量进行膨胀卷积处理,得到第三图像特征向量,并将第二图像特征向量和第三图像特征向量进行融合处理,得到具有感受野范围更大的第四图像特征向量,池化层对第四图像特征向量进行平均池化处理,得到多个池化后的第五图像特征向量Task1,Task2,……,Task5,其中,Task1,Task2,……,Task5是预先划分的不同类型的属性集合对应的第五图像特征向量,Task1对应的类型为基于全局的属性集合,可以包括年龄,行为,服装样式等属性;Task2对应的类型为基于局部的属性集合,可以包括是否戴帽子,是否戴眼镜,发型等属性;Task3对应的类型为基于身体结构的属性集合,可以包括上身穿着、下身穿着等属性;Task4对应的类型为基于脚部特点的属性集合,可以包括脚部穿鞋类型、是否穿袜;Task5对应的类型为基于颜色的属性集合,可以包括上身颜色、下身颜色和发色等属性。全连接层将接收到的每个第五图像特征向量进行分类,从而确定该第一目标待识别图像的每个预设属性对应的属性值并输出。
在本申请实施例中,训练完成的属性识别模型可以识别出第一目标待识别图像的多个不同类型的属性集合中的每个属性,并基于识别到的多个不同类型的属性确定该第一目标待识别图像的每个预设属性对应的属性值,有效的提高了属性识别的准确率。
为了进一步提高属性识别模型识别的准确率,在上述各实施例的基础上,在本申请实施例中,所述针对第二样本集中的每个样本图像,将该样本图像输入到预先训练完成的特征提取网络中之前,所述方法还包括:
针对所述第二样本集中的每个样本图像,确定该样本图像在LAB颜色空间下每个通道的第二均值和第二方差;针对该样本图像中的每个像素点,根据LAB颜色空间下每个通道的第二方差以及所述标准对照方差的比值,以及所述标准对照像素点集中,该像素点对应的标准对照像素点在每个通道的对照数值和所述第二均值,确定该像素点在LAB颜色空间下每个通道对应的第二矫正后数值;基于该样本图像每个像素点在LAB颜色空间下每个通道对应的第二矫正后数值,确定该样本图像矫正后的RGB颜色空间下的目标样本图像;并使用所述目标样本图像对该样本图像进行更新。
为了进一步提高属性识别模型识别的准确率,在对属性识别模型进行训练时,可以对第二样本集中的每个样本图像进行矫正。
在本申请实施例中,可以针对第二样本集中的每个样本图像,将该样本图像进行LAB颜色空间转换,即将RGB颜色空间下的该样本图像转换为LAB颜色空间下的样本图像,并确定该样本图像在LAB颜色空间下每个通道的第二均值和第二方差,针对该样本图像中的每个像素点,根据LAB颜色空间下每个通道的第二方差与标准对照方差的比值,以及标准对照像素点集中,该像素点对应的标准对照像素点在每个通道的对照数值和所述第二均值,确定该像素点在每个通道对应的第二矫正后数值,并进行RGB颜色空间转换,即将LAB颜色空间下的矫正后的样本图像,转换为RGB颜色空间下的目标样本图像。在本申请实施例中,可以使用目标样本图像对该样本图像进行更新,即使用矫正后的样本图像对属性识别模型进行训练。
由于确定第二样本集中的每个样本图像对应的目标样本图像的过程,与上述各实施例的确定第一待识别图像对应的目标待识别图像的过程相似,并且在上述各实施例中已经做了详细的说明,因此,在本申请实施例中不再赘述。
实施例4:
为了提高属性识别的稳定性,在上述各实施例的基础上,在本申请实施例中,若所述第一待识别图像为视频中的帧图像,所述方法还包括:
获取所述视频中与所述第一待识别图像相邻的预设数量的第二待识别图像;
针对每个第二待识别图像,确定该第二待识别图像在LAB颜色空间下每个通道的第三均值和第三方差;针对该第二待识别图像中的每个像素点,根据该第二待识别图像在LAB颜色空间下每个通道的第三方差以及所述标准对照方差的比值,以及预先保存的标准对照像素点集中,该像素点对应的标准对照像素点在每个通道的对照数值和所述第三方差,确定该像素点在LAB颜色空间下每个通道对应的第三矫正后数值;基于该第二待识别图像每个像素点在LAB颜色空间下每个通道对应的第三矫正后数值,确定该第二待识别图像矫正后的RGB颜色空间下的第二目标待识别图像;将所述第二目标待识别图像输入到预先训练完成的所述属性识别模型中,根据所述属性识别模型的输出确定识别到的该第二待识别图像的属性值;
根据所述第一待识别图像的属性值,每个所述第二待识别图像的属性值以及预设权重,确定所述第一待识别图像的目标属性值。
由于视频中的每一帧对应的图像是连续的,且图像中包含的内容一般是相关联的,因此,为了提升属性识别的稳定性,从而提高属性识别的准确性,在本申请实施例中,在识别第一待识别图像中包含的人的属性时,若第一待识别图像为视频中的帧图像,可以结合与第一待识别图像相邻的其他第二待识别图像中包含的人的属性,综合确定第一待识别图像的目标属性值。
在本申请实施例中,可以获取视频中与第一待识别图像相邻的预设数量的第二待识别图像。
具体的,在本申请实施例中,可以确定第一待识别图像在视频中的帧位置,并获取该帧位置后预设数量的其他第二待识别图像,也可以获取该帧位置前预设数量的其他第二待识别图像,还可以获取包含该帧位置在内的其他第二待识别图像。在本申请实施例中,获取视频中与第一待识别图像相邻的预设数量的第二待识别图像时,还可以在该视频的视频序列中进行滑窗取样,每次滑窗间隔为1,窗体的大小为[width,height,t],其中,width为第二待识别图像的宽,height为第二待识别图像的高,t为预设数量。可以从视频序列中该第一待识别图像对应的位置开始,移动t次滑窗窗体,每次移动滑窗窗体时,滑窗窗体对应的图像内容即为获取到的第二待识别图像。
在本申请实施例中,可以针对获取到的每个第二待识别图像,对该第二待识别图像的每个像素点进行矫正,并得到每个像素点在每个通道对应的第三矫正后数值,从而确定第二待识别图像矫正后的RGB颜色空间下的第二目标待识别图像。并基于属性识别模型的输出确定识别到的该第二待识别图像的属性值。
确定了预设数量的第二待识别图像的属性值之后,在本申请实施例中,可以根据第一待识别图像的属性值,每个第二待识别图像的属性值以及预设权重,综合确定第一待识别图像的目标属性值。
具体的,可以综合第一待识别图像的属性值,以及每个第二待识别图像的属性值,确定第一待识别图像的任一预设属性对应的第一属性值为Awci,那么第一属性值Awci的确定过程可以表示为:
Awci=W(c-t/2+1)iA(c-t/2+1)i+W(c-t/2+2)iA(c-t/2+2)i+...+WciAci+W(c+1)iA(c+1)i+...+W(c+t/2) iA(c+t/2)i
其中,c表示待识别图像的标识,该标识可以是当前待识别图像在视频中的排序序号,也可以是按照任意规则规定的标识,i表示预设属性对应的标识,例如,预设属性A对应的标识为1,预设属性B对应的标识为2,Aci表示第c张待识别图像的i属性对应的属性值,该属性值可以是识别到该属性对应的可能性,Wci标识第c张待识别图像的i属性所占据的比重,即预设权重,其中,W(c-t/2+1)i+W(c-t/2+2)i+...+Wci+W(c+1)i+...+W(c+t/2)i=1。
在本申请实施例中,确定了第一待识别图像的每个预设属性对应的第一属性值之后,可以针对每个预设属性对应的第一属性值,判断该第一属性值是否大于预设阈值thresh,若是,则可以将该预设属性对应的目标属性值确定为第一待识别图像的目标属性值。
下面结合一个具体的实施例,对属性识别过程进行说明,图3为本申请实施例提供的另一属性识别过程示意图,如图3所示,该过程包括以下步骤:
S301:获取第一待识别图像,对第一待识别图像进行矫正,得到第一目标待识别图像。
S302:基于预先训练完成的属性识别模型对第一待识别图像进行特征提取,确定第一待识别图像的属性值。
S303:获取视频中与第一待识别图像相邻的预设数量的第二待识别图像,并识别每个第二待识别图像的属性值,根据第一待识别图像的属性值,每个第二待识别图像的属性值,确定第一待识别图像的目标属性值。
实施例5:
图4为本申请实施例提供的属性识别装置的结构示意图,如图4所示,该装置包括:
确定模块401,用于确定获取到的第一待识别图像在LAB颜色空间下每个通道的第一均值和第一方差;针对所述第一待识别图像中的每个像素点,根据LAB颜色空间下每个通道的第一方差与预先保存的标准对照方差的比值,以及预先保存的标准对照像素点集中,该像素点对应的标准对照像素点在每个通道的对照数值和所述第一均值,确定该像素点在LAB颜色空间下每个通道对应的第一矫正后数值;
矫正模块402,用于基于所述第一待识别图像每个像素点在LAB颜色空间下每个通道对应的第一矫正后数值,确定所述第一待识别图像矫正后的RGB颜色空间下的第一目标待识别图像;
识别模块403,用于将所述第一目标待识别图像输入到预先训练完成的属性识别模型中,根据所述属性识别模型的输出确定识别到的所述第一待识别图像的属性值。
在一种可能的实施方式中,所述确定模块401,还用于对第一样本集中的每个第一标准对照图像进行LAB颜色空间转换,得到每个第二标准对照图像;根据所述第一样本集中的每个所述第二标准对照图像,确定所述第一样本集在LAB颜色空间下每个通道的第一对照平均值;针对每个像素点,根据该像素点在每个所述第二标准对照图像中对应的每个通道的数值,确定该像素点在LAB颜色空间下每个通道对应的第二对照平均值;并针对LAB颜色空间下的每个通道,计算该通道对应的所述第二对照平均值与该通道对应的所述第一对照平均值的差值,并将所述差值作为所述标准对照像素点集中该像素点对应的标准对照像素点在该通道的对照数值。
在一种可能的实施方式中,所述确定模块401,还用于根据所述第一样本集中的每个所述第二标准对照图像,确定所述第一样本集在LAB颜色空间下每个通道的对照方差,并使用所述对照方差对所述标准对照方差进行更新。
在一种可能的实施方式中,所述装置还包括:
训练模块404,用于针对第二样本集中的每个样本图像,其中,每个样本图像对应有标签,所述标签用于标识样本图像中包含的人像的每个预设属性对应的目标属性值;将该样本图像输入到预先训练完成的特征提取网络中,所述特征提取网络的特征提取层提取该样本图像的特征图像,并将所述特征图像输入到特征金字塔网络中;所述特征金字塔网络提取所述特征图像的每个第一图像特征向量,选取任一第一图像特征向量输入到投影层中;所述投影层对输入的所述第一图像特征向量进行卷积处理,得到映射后的第二图像特征向量,并将所述第二图像特征向量输入到卷积层中;所述卷积层对所述第二图像特征向量进行膨胀卷积处理,得到第三图像特征向量,并对所述第二图像特征向量和所述第三图像特征向量进行融合处理,得到融合后的第四图像特征向量,并将所述第四图像特征向量输入到池化层中;所述池化层对所述第四图像特征向量进行平均池化处理,得到每个池化后的第五图像特征向量,并将每个所述第五图像特征向量输入到全连接层中;所述全连接层根据所述每个第五图像特征向量,确定该样本图像的每个预设属性对应的属性值;根据每个所述预设属性对应的属性值,以及每个所述预设属性对应的目标属性值,确定该样本图像对应的损失值,根据该样本图像对应的损失值对所述属性识别模型进行调整。
在一种可能的实施方式中,所述训练模块404,还用于针对所述第二样本集中的每个样本图像,确定该样本图像在LAB颜色空间下每个通道的第二均值和第二方差;针对该样本图像中的每个像素点,根据LAB颜色空间下每个通道的第二方差与所述标准对照方差的比值,以及所述标准对照像素点集中,该像素点对应的标准对照像素点在每个通道的对照数值和所述第二均值,确定该像素点在LAB颜色空间下每个通道对应的第二矫正后数值;基于该样本图像每个像素点在LAB颜色空间下每个通道对应的第二矫正后数值,确定该样本图像矫正后的RGB颜色空间下的目标样本图像;并使用所述目标样本图像对该样本图像进行更新。
在一种可能的实施方式中,所述装置还包括:
获取模块405,用于获取所述视频中与所述第一待识别图像相邻的预设数量的第二待识别图像;
所述确定模块401,还用于针对每个第二待识别图像,确定该第二待识别图像在LAB颜色空间下每个通道的第三均值和第三方差;针对该第二待识别图像中的每个像素点,根据该第二待识别图像在LAB颜色空间下每个通道的第三方差以及所述标准对照方差的比值,以及预先保存的标准对照像素点集中,该像素点对应的标准对照像素点在每个通道的对照数值和所述第三方差,确定该像素点在LAB颜色空间下每个通道对应的第三矫正后数值;
所述矫正模块402,还用于基于该第二待识别图像每个像素点在LAB颜色空间下每个通道对应的第三矫正后数值,确定该第二待识别图像矫正后的RGB颜色空间下的第二目标待识别图像;
所述识别模块403,还用于将所述第二目标待识别图像输入到预先训练完成的所述属性识别模型中,根据所述属性识别模型的输出确定识别到的该第二待识别图像的属性值;
所述确定模块401,还用于根据所述第一待识别图像的属性值,每个所述第二待识别图像的属性值以及预设权重,确定所述第一待识别图像的目标属性值。
实施例6:
图5为本申请实施例提供的一种电子设备结构示意图,在上述各实施例的基础上,本申请还提供了一种电子设备,如图5所示,包括:处理器501、通信接口502、存储器503和通信总线504,其中,处理器501,通信接口502,存储器503通过通信总线504完成相互间的通信;
所述存储器503中存储有计算机程序,当所述程序被所述处理器501执行时,使得所述处理器501执行如下步骤:
确定获取到的第一待识别图像在LAB颜色空间下每个通道的第一均值和第一方差;
针对所述第一待识别图像中的每个像素点,根据LAB颜色空间下每个通道的第一方差与预先保存的标准对照方差的比值,以及预先保存的标准对照像素点集中,该像素点对应的标准对照像素点在每个通道的对照数值和所述第一均值,确定该像素点在LAB颜色空间下每个通道对应的第一矫正后数值;
基于所述第一待识别图像每个像素点在LAB颜色空间下每个通道对应的第一矫正后数值,确定所述第一待识别图像矫正后的RGB颜色空间下的第一目标待识别图像;
将所述第一目标待识别图像输入到预先训练完成的属性识别模型中,根据所述属性识别模型的输出确定识别到的所述第一待识别图像的属性值。
在一种可能的实施方式中,所述标准对照像素点集中标准对照像素点在每个通道的对照数值的确定过程包括:
对第一样本集中的每个第一标准对照图像进行LAB颜色空间转换,得到每个第二标准对照图像;
根据所述第一样本集中的每个所述第二标准对照图像,确定所述第一样本集在LAB颜色空间下每个通道的第一对照平均值;
针对每个像素点,根据该像素点在每个所述第二标准对照图像中对应的每个通道的数值,确定该像素点在LAB颜色空间下每个通道对应的第二对照平均值;并针对LAB颜色空间下的每个通道,计算该通道对应的所述第二对照平均值与该通道对应的所述第一对照平均值的差值,并将所述差值作为所述标准对照像素点集中该像素点对应的标准对照像素点在该通道的对照数值。
在一种可能的实施方式中,所述方法还包括:
根据所述第一样本集中的每个所述第二标准对照图像,确定所述第一样本集在LAB颜色空间下每个通道的对照方差,并使用所述对照方差对所述标准对照方差进行更新。
在一种可能的实施方式中,所述属性识别模型的训练过程包括:
针对第二样本集中的每个样本图像,其中,每个样本图像对应有标签,所述标签用于标识样本图像中包含的人像的每个预设属性对应的目标属性值;
将该样本图像输入到预先训练完成的特征提取网络中,所述特征提取网络的特征提取层提取该样本图像的特征图像,并将所述特征图像输入到特征金字塔网络中;所述特征金字塔网络提取所述特征图像的每个第一图像特征向量,选取任一第一图像特征向量输入到投影层中;所述投影层对输入的所述第一图像特征向量进行卷积处理,得到映射后的第二图像特征向量,并将所述第二图像特征向量输入到卷积层中;所述卷积层对所述第二图像特征向量进行膨胀卷积处理,得到第三图像特征向量,并对所述第二图像特征向量和所述第三图像特征向量进行融合处理,得到融合后的第四图像特征向量,并将所述第四图像特征向量输入到池化层中;所述池化层对所述第四图像特征向量进行平均池化处理,得到每个池化后的第五图像特征向量,并将每个所述第五图像特征向量输入到全连接层中;所述全连接层根据所述每个第五图像特征向量,确定该样本图像的每个预设属性对应的属性值;
根据每个所述预设属性对应的属性值,以及每个所述预设属性对应的目标属性值,确定该样本图像对应的损失值,根据该样本图像对应的损失值对所述属性识别模型进行调整。
在一种可能的实施方式中,所述针对第二样本集中的每个样本图像,将该样本图像输入到预先训练完成的特征提取网络中之前,所述方法还包括:
针对所述第二样本集中的每个样本图像,确定该样本图像在LAB颜色空间下每个通道的第二均值和第二方差;针对该样本图像中的每个像素点,根据LAB颜色空间下每个通道的第二方差与所述标准对照方差的比值,以及所述标准对照像素点集中,该像素点对应的标准对照像素点在每个通道的对照数值和所述第二均值,确定该像素点在LAB颜色空间下每个通道对应的第二矫正后数值;基于该样本图像每个像素点在LAB颜色空间下每个通道对应的第二矫正后数值,确定该样本图像矫正后的RGB颜色空间下的目标样本图像;并使用所述目标样本图像对该样本图像进行更新。
在一种可能的实施方式中,若所述第一待识别图像为视频中的帧图像,所述方法还包括:
获取所述视频中与所述第一待识别图像相邻的预设数量的第二待识别图像;
针对每个第二待识别图像,确定该第二待识别图像在LAB颜色空间下每个通道的第三均值和第三方差;针对该第二待识别图像中的每个像素点,根据该第二待识别图像在LAB颜色空间下每个通道的第三方差以及所述标准对照方差的比值,以及预先保存的标准对照像素点集中,该像素点对应的标准对照像素点在每个通道的对照数值和所述第三方差,确定该像素点在LAB颜色空间下每个通道对应的第三矫正后数值;基于该第二待识别图像每个像素点在LAB颜色空间下每个通道对应的第三矫正后数值,确定该第二待识别图像矫正后的RGB颜色空间下的第二目标待识别图像;将所述第二目标待识别图像输入到预先训练完成的所述属性识别模型中,根据所述属性识别模型的输出确定识别到的该第二待识别图像的属性值;
根据所述第一待识别图像的属性值,每个所述第二待识别图像的属性值以及预设权重,确定所述第一待识别图像的目标属性值。
由于上述电子设备解决问题的原理与属性识别方法相似,因此上述电子设备的实施可以参见上述实施例,重复之处不再赘述。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。通信接口502用于上述电子设备与其他设备之间的通信。存储器可以包括随机存取存储器(RandomAccess Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离前述处理器的存储装置。上述处理器可以是通用处理器,包括中央处理器、网络处理器(Network Processor,NP)等;还可以是数字指令处理器(Digital Signal Processing,DSP)、专用集成电路、现场可编程门陈列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
实施例7:
在上述各实施例的基础上,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有可由处理器执行的计算机程序,当所述程序在所述处理器上运行时,使得所述处理器执行时实现如下步骤:
确定获取到的第一待识别图像在LAB颜色空间下每个通道的第一均值和第一方差;
针对所述第一待识别图像中的每个像素点,根据LAB颜色空间下每个通道的第一方差与预先保存的标准对照方差的比值,以及预先保存的标准对照像素点集中,该像素点对应的标准对照像素点在每个通道的对照数值和所述第一均值,确定该像素点在LAB颜色空间下每个通道对应的第一矫正后数值;
基于所述第一待识别图像每个像素点在LAB颜色空间下每个通道对应的第一矫正后数值,确定所述第一待识别图像矫正后的RGB颜色空间下的第一目标待识别图像;
将所述第一目标待识别图像输入到预先训练完成的属性识别模型中,根据所述属性识别模型的输出确定识别到的所述第一待识别图像的属性值。
在一种可能的实施方式中,所述标准对照像素点集中标准对照像素点在每个通道的对照数值的确定过程包括:
对第一样本集中的每个第一标准对照图像进行LAB颜色空间转换,得到每个第二标准对照图像;
根据所述第一样本集中的每个所述第二标准对照图像,确定所述第一样本集在LAB颜色空间下每个通道的第一对照平均值;
针对每个像素点,根据该像素点在每个所述第二标准对照图像中对应的每个通道的数值,确定该像素点在LAB颜色空间下每个通道对应的第二对照平均值;并针对LAB颜色空间下的每个通道,计算该通道对应的所述第二对照平均值与该通道对应的所述第一对照平均值的差值,并将所述差值作为所述标准对照像素点集中该像素点对应的标准对照像素点在该通道的对照数值。
在一种可能的实施方式中,所述方法还包括:
根据所述第一样本集中的每个所述第二标准对照图像,确定所述第一样本集在LAB颜色空间下每个通道的对照方差,并使用所述对照方差对所述标准对照方差进行更新。
在一种可能的实施方式中,所述属性识别模型的训练过程包括:
针对第二样本集中的每个样本图像,其中,每个样本图像对应有标签,所述标签用于标识样本图像中包含的人像的每个预设属性对应的目标属性值;
将该样本图像输入到预先训练完成的特征提取网络中,所述特征提取网络的特征提取层提取该样本图像的特征图像,并将所述特征图像输入到特征金字塔网络中;所述特征金字塔网络提取所述特征图像的每个第一图像特征向量,选取任一第一图像特征向量输入到投影层中;所述投影层对输入的所述第一图像特征向量进行卷积处理,得到映射后的第二图像特征向量,并将所述第二图像特征向量输入到卷积层中;所述卷积层对所述第二图像特征向量进行膨胀卷积处理,得到第三图像特征向量,并对所述第二图像特征向量和所述第三图像特征向量进行融合处理,得到融合后的第四图像特征向量,并将所述第四图像特征向量输入到池化层中;所述池化层对所述第四图像特征向量进行平均池化处理,得到每个池化后的第五图像特征向量,并将每个所述第五图像特征向量输入到全连接层中;所述全连接层根据所述每个第五图像特征向量,确定该样本图像的每个预设属性对应的属性值;
根据每个所述预设属性对应的属性值,以及每个所述预设属性对应的目标属性值,确定该样本图像对应的损失值,根据该样本图像对应的损失值对所述属性识别模型进行调整。
在一种可能的实施方式中,所述针对第二样本集中的每个样本图像,将该样本图像输入到预先训练完成的特征提取网络中之前,所述方法还包括:
针对所述第二样本集中的每个样本图像,确定该样本图像在LAB颜色空间下每个通道的第二均值和第二方差;针对该样本图像中的每个像素点,根据LAB颜色空间下每个通道的第二方差与所述标准对照方差的比值,以及所述标准对照像素点集中,该像素点对应的标准对照像素点在每个通道的对照数值和所述第二均值,确定该像素点在LAB颜色空间下每个通道对应的第二矫正后数值;基于该样本图像每个像素点在LAB颜色空间下每个通道对应的第二矫正后数值,确定该样本图像矫正后的RGB颜色空间下的目标样本图像;并使用所述目标样本图像对该样本图像进行更新。
在一种可能的实施方式中,若所述第一待识别图像为视频中的帧图像,所述方法还包括:
获取所述视频中与所述第一待识别图像相邻的预设数量的第二待识别图像;
针对每个第二待识别图像,确定该第二待识别图像在LAB颜色空间下每个通道的第三均值和第三方差;针对该第二待识别图像中的每个像素点,根据该第二待识别图像在LAB颜色空间下每个通道的第三方差以及所述标准对照方差的比值,以及预先保存的标准对照像素点集中,该像素点对应的标准对照像素点在每个通道的对照数值和所述第三方差,确定该像素点在LAB颜色空间下每个通道对应的第三矫正后数值;基于该第二待识别图像每个像素点在LAB颜色空间下每个通道对应的第三矫正后数值,确定该第二待识别图像矫正后的RGB颜色空间下的第二目标待识别图像;将所述第二目标待识别图像输入到预先训练完成的所述属性识别模型中,根据所述属性识别模型的输出确定识别到的该第二待识别图像的属性值;
根据所述第一待识别图像的属性值,每个所述第二待识别图像的属性值以及预设权重,确定所述第一待识别图像的目标属性值。
由于上述提供的计算机可读取介质解决问题的原理与属性识别方法相似,因此处理器执行上述计算机可读取介质中的计算机程序后,实现的步骤可以参见上述实施例,重复之处不再赘述。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
对于系统/装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (10)
1.一种属性识别方法,其特征在于,所述方法包括:
确定获取到的第一待识别图像在LAB颜色空间下每个通道的第一均值和第一方差;
针对所述第一待识别图像中的每个像素点,根据LAB颜色空间下每个通道的第一方差与预先保存的标准对照方差的比值,以及预先保存的标准对照像素点集中,该像素点对应的标准对照像素点在每个通道的对照数值和所述第一均值,确定该像素点在LAB颜色空间下每个通道对应的第一矫正后数值;
基于所述第一待识别图像每个像素点在LAB颜色空间下每个通道对应的第一矫正后数值,确定所述第一待识别图像矫正后的RGB颜色空间下的第一目标待识别图像;
将所述第一目标待识别图像输入到预先训练完成的属性识别模型中,根据所述属性识别模型的输出确定识别到的所述第一待识别图像的属性值。
2.如权利要求1所述的方法,其特征在于,所述标准对照像素点集中标准对照像素点在每个通道的对照数值的确定过程包括:
对第一样本集中的每个第一标准对照图像进行LAB颜色空间转换,得到每个第二标准对照图像;
根据所述第一样本集中的每个所述第二标准对照图像,确定所述第一样本集在LAB颜色空间下每个通道的第一对照平均值;
针对每个像素点,根据该像素点在每个所述第二标准对照图像中对应的每个通道的数值,确定该像素点在LAB颜色空间下每个通道对应的第二对照平均值;并针对LAB颜色空间下的每个通道,计算该通道对应的所述第二对照平均值与该通道对应的所述第一对照平均值的差值,并将所述差值作为所述标准对照像素点集中该像素点对应的标准对照像素点在该通道的对照数值。
3.如权利要求1或2所述的方法,其特征在于,所述方法还包括:
根据所述第一样本集中的每个所述第二标准对照图像,确定所述第一样本集在LAB颜色空间下每个通道的对照方差,并使用所述对照方差对所述标准对照方差进行更新。
4.如权利要求1所述的方法,其特征在于,所述属性识别模型的训练过程包括:
针对第二样本集中的每个样本图像,其中,每个样本图像对应有标签,所述标签用于标识样本图像中包含的人像的每个预设属性对应的目标属性值;
将该样本图像输入到预先训练完成的特征提取网络中,所述特征提取网络的特征提取层提取该样本图像的特征图像,并将所述特征图像输入到特征金字塔网络中;所述特征金字塔网络提取所述特征图像的每个第一图像特征向量,选取任一第一图像特征向量输入到投影层中;所述投影层对输入的所述第一图像特征向量进行卷积处理,得到映射后的第二图像特征向量,并将所述第二图像特征向量输入到卷积层中;所述卷积层对所述第二图像特征向量进行膨胀卷积处理,得到第三图像特征向量,并对所述第二图像特征向量和所述第三图像特征向量进行融合处理,得到融合后的第四图像特征向量,并将所述第四图像特征向量输入到池化层中;所述池化层对所述第四图像特征向量进行平均池化处理,得到每个池化后的第五图像特征向量,并将每个所述第五图像特征向量输入到全连接层中;所述全连接层根据所述每个第五图像特征向量,确定该样本图像的每个预设属性对应的属性值;
根据每个所述预设属性对应的属性值,以及每个所述预设属性对应的目标属性值,确定该样本图像对应的损失值,根据该样本图像对应的损失值对所述属性识别模型进行调整。
5.如权利要求4所述的方法,其特征在于,所述针对第二样本集中的每个样本图像,将该样本图像输入到预先训练完成的特征提取网络中之前,所述方法还包括:
针对所述第二样本集中的每个样本图像,确定该样本图像在LAB颜色空间下每个通道的第二均值和第二方差;针对该样本图像中的每个像素点,根据LAB颜色空间下每个通道的第二方差与所述标准对照方差的比值,以及所述标准对照像素点集中,该像素点对应的标准对照像素点在每个通道的对照数值和所述第二均值,确定该像素点在LAB颜色空间下每个通道对应的第二矫正后数值;基于该样本图像每个像素点在LAB颜色空间下每个通道对应的第二矫正后数值,确定该样本图像矫正后的RGB颜色空间下的目标样本图像;并使用所述目标样本图像对该样本图像进行更新。
6.如权利要求1所述的方法,其特征在于,若所述第一待识别图像为视频中的帧图像,所述方法还包括:
获取所述视频中与所述第一待识别图像相邻的预设数量的第二待识别图像;
针对每个第二待识别图像,确定该第二待识别图像在LAB颜色空间下每个通道的第三均值和第三方差;针对该第二待识别图像中的每个像素点,根据该第二待识别图像在LAB颜色空间下每个通道的第三方差以及所述标准对照方差的比值,以及预先保存的标准对照像素点集中,该像素点对应的标准对照像素点在每个通道的对照数值和所述第三方差,确定该像素点在LAB颜色空间下每个通道对应的第三矫正后数值;基于该第二待识别图像每个像素点在LAB颜色空间下每个通道对应的第三矫正后数值,确定该第二待识别图像矫正后的RGB颜色空间下的第二目标待识别图像;将所述第二目标待识别图像输入到预先训练完成的所述属性识别模型中,根据所述属性识别模型的输出确定识别到的该第二待识别图像的属性值;
根据所述第一待识别图像的属性值,每个所述第二待识别图像的属性值以及预设权重,确定所述第一待识别图像的目标属性值。
7.一种属性识别装置,其特征在于,所述装置包括:
确定模块,用于确定获取到的第一待识别图像在LAB颜色空间下每个通道的第一均值和第一方差;用于针对所述第一待识别图像中的每个像素点,根据LAB颜色空间下每个通道的第一方差与预先保存的标准对照方差的比值,以及预先保存的标准对照像素点集中,该像素点对应的标准对照像素点在每个通道的对照数值和所述第一均值,确定该像素点在LAB颜色空间下每个通道对应的第一矫正后数值;
矫正模块,基于所述第一待识别图像每个像素点在LAB颜色空间下每个通道对应的第一矫正后数值,确定所述第一待识别图像矫正后的RGB颜色空间下的第一目标待识别图像;
识别模块,用于将所述第一目标待识别图像输入到预先训练完成的属性识别模型中,根据所述属性识别模型的输出确定识别到的所述第一待识别图像的属性值。
8.如权利要求7所述的装置,其特征在于,所述确定模块,还用于对第一样本集中的每个第一标准对照图像进行LAB颜色空间转换,得到每个第二标准对照图像;根据所述第一样本集中的每个所述第二标准对照图像,确定所述第一样本集在LAB颜色空间下每个通道的第一对照平均值;针对每个像素点,根据该像素点在每个所述第二标准对照图像中对应的每个通道的数值,确定该像素点在LAB颜色空间下每个通道对应的第二对照平均值;并针对LAB颜色空间下的每个通道,计算该通道对应的所述第二对照平均值与该通道对应的所述第一对照平均值的差值,并将所述差值作为所述标准对照像素点集中该像素点对应的标准对照像素点在该通道的对照数值。
9.一种电子设备,其特征在于,所述电子设备至少包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序时实现权利要求1-6中任一所述的属性识别方法的步骤。
10.一种计算机可读存储介质,其特征在于,其存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-6中任一所述的属性识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210956032.3A CN115294394A (zh) | 2022-08-10 | 2022-08-10 | 一种属性识别方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210956032.3A CN115294394A (zh) | 2022-08-10 | 2022-08-10 | 一种属性识别方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115294394A true CN115294394A (zh) | 2022-11-04 |
Family
ID=83827699
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210956032.3A Pending CN115294394A (zh) | 2022-08-10 | 2022-08-10 | 一种属性识别方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115294394A (zh) |
-
2022
- 2022-08-10 CN CN202210956032.3A patent/CN115294394A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11087447B2 (en) | Systems and methods for quality assurance of image recognition model | |
US11301711B2 (en) | Systems and methods for enhancing real-time image recognition | |
JP6994588B2 (ja) | 顔特徴抽出モデル訓練方法、顔特徴抽出方法、装置、機器および記憶媒体 | |
CN110991380B (zh) | 人体属性识别方法、装置、电子设备以及存储介质 | |
WO2019100282A1 (zh) | 一种人脸肤色识别方法、装置和智能终端 | |
CN111739027B (zh) | 一种图像处理方法、装置、设备及可读存储介质 | |
US20140177955A1 (en) | System and method for adaptive skin tone detection | |
CN109740589B (zh) | 视频模式中的异步对象roi检测方法及系统 | |
CN108197546A (zh) | 人脸识别中光照处理方法、装置、计算机设备及存储介质 | |
CN112257526B (zh) | 一种基于特征交互学习的动作识别方法及终端设备 | |
CN104200431A (zh) | 图像灰度化的处理方法及处理装置 | |
CN111666800A (zh) | 一种行人重识别模型训练方法及行人重识别方法 | |
WO2023279799A1 (zh) | 对象识别方法、装置和电子系统 | |
CN112232205A (zh) | 移动端cpu实时多功能人脸检测方法 | |
CN113408380A (zh) | 视频图像调整方法、设备及存储介质 | |
WO2019212501A1 (en) | Trained recognition models | |
CN112489144A (zh) | 图像处理方法、图像处理装置、终端设备及存储介质 | |
CN112417989A (zh) | 一种监考人员违规行为识别方法及系统 | |
CN116843561A (zh) | 一种图像增强方法及设备 | |
JP4988872B2 (ja) | 映像における移動物体の一般的な色への分類方法、装置およびプログラム(映像における移動物体の一般的な色への分類) | |
CN113557522A (zh) | 基于相机统计的图像帧预处理 | |
CN115294394A (zh) | 一种属性识别方法、装置、设备及介质 | |
CN112989924B (zh) | 目标检测方法、目标检测装置及终端设备 | |
CN115984133A (zh) | 图像增强方法、车辆抓拍方法、设备及介质 | |
CN115035393A (zh) | 频闪场景分类方法、模型训练方法、相关装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |