CN114092746A

CN114092746A - 一种多属性识别方法、装置、存储介质及电子设备

Info

Publication number: CN114092746A
Application number: CN202111438968.9A
Authority: CN
Inventors: 张天麒; 李彩凤; 史晓蒙; 张星; 吕晓鹏; 韩晴
Original assignee: Beijing E Hualu Information Technology Co Ltd
Current assignee: Beijing E Hualu Information Technology Co Ltd
Priority date: 2021-11-29
Filing date: 2021-11-29
Publication date: 2022-02-25

Abstract

本发明公开了一种多属性识别方法、装置、存储介质及电子设备，该方法包括：根据如多属性识别模型构建方法构建得到的多属性识别模型对获取的待识别图像进行预处理；根据预处理结果确定多属性对应的概率值矩阵；根据概率矩阵对待处理图像的多个属性进行识别。该方法利用训练得到的多属性识别模型对图像进行处理并完成识别，实现了单个模型对不同属性进行推断与识别，大幅度减少了计算量和计算时长，提高了多属性识别效率。

Description

一种多属性识别方法、装置、存储介质及电子设备

技术领域

本发明涉及及图像处理、深度学习技术领域，具体涉及一种多属性识别方法、装置、存储介质及电子设备。

背景技术

随着互联网技术的发展，人体表情与动作识别技术应用到了越来越多的领域，比如监控视频的事件检测、体育视频的内容分析、体感设备的人机交互等。目前目标物多属性识别方法主要包括：采用单属性多模型的形式，一个模型针对性地识别一个属性，最后将多个模型的输出结果整合在一起完成多属性的识别。该方法中单个模型无法对不同属性进行推断，多属性的识别效率不高且模型管理与部署也极不方便且识别过程计算量大且计算耗时长。

发明内容

有鉴于此，本发明实施例提供了涉及一种多属性识别方法、装置、存储介质及电子设备，以解决现有技术中多属性的识别效率不高且模型管理与部署也极不方便且识别过程计算量大且计算耗时长的技术问题。

本发明提出的技术方案如下：

本发明实施例第一方面提供一种多属性识别模型构建方法，该多属性识别模型构建方法包括：获取待训练的图像样本集；对所述图像样本集中的图像按照目标属性进行分类并将分类后带标签的图像样本集输入至预设的神经网络中训练直至得到满足条件的多属性识别模型。

可选地，对所述图像样本集中的图像的多属性进行分类并将分类后带标签的图像样本集输入至预设的神经网络中训练直至得到满足条件的多属性识别模型，包括：对所述图像样本集中的图像的多属性进行分类和标签二值化处理确定对应的一维向量；将带标签的图像样本集输入至预设的神经网络中生成一维标签概率向量；根据所述一维向量与所述一维标签概率向量计算标签损失值并根据所述损失值对所述神经网络进行更新直至满足预设条件时得到满足条件的多属性识别模型。

本发明实施例第二方面提供一种多属性识别方法，该多属性识别方法包括：根据如本发明实施例第一方面或第一方面任一项所述的多属性识别模型构建方法构建得到的多属性识别模型对获取的待识别图像进行预处理；根据预处理结果确定多属性对应的概率值矩阵；根据所述概率矩阵对所述待处理图像的多个属性进行识别。

可选地，根据如本发明实施例第一方面或第一方面任一项所述的多属性识别模型构建方法构建得到的多属性识别模型对获取的待识别图像进行预处理，包括：计算所述待识别图像分类后的任一属性对应的多个子属性的概率值；根据所述概率值对所述待识别图像分类后的任一属性对应的多个子属性进行识别。

本发明实施例第三方面提供一种多属性识别模型构建装置，该多属性识别模型构建装置包括：获取模块，用于获取待训练的图像样本集；训练模块，用于对所述图像样本集中的图像按照目标属性进行分类并将分类后带标签的图像样本集输入至预设的神经网络中训练直至得到满足条件的多属性识别模型。

可选地，所述训练模块包括：分类处理模块，用于对所述图像样本集中的图像的多属性进行分类和标签二值化处理确定对应的一维向量；输入模块，用于将带标签的图像样本集输入至预设的神经网络中生成一维标签概率向量；计算模块，用于根据所述一维向量与所述一维标签概率向量计算标签损失值并根据所述损失值对所述神经网络进行更新直至满足预设条件时得到满足条件的多属性识别模型。

本发明实施例第四方面提供一种多属性识别装置，该多属性识别装置包括：预处理模块，用于根据如发明实施例第一方面或第一方面任一项所述的多属性识别模型构建方法构建得到的多属性识别模型对获取的预处理的待识别图像进行预处理；第一确定模块，用于根据预处理结果确定多属性对应的概率值矩阵；第一识别模块，用于根据所述概率矩阵对所述待处理图像的多个属性进行识别。

可选地，所述装置还包括：计算模块，用于计算所述待识别图像分类后的任一属性对应的多个子属性的概率值；第二识别模块，用于根据所述概率值对所述待识别图像分类后的任一属性对应的多个子属性进行识别。

本发明实施例第五方面提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于使所述计算机执行如本发明实施例第一方面及第一方面任一项所述的多属性识别模型构建方法，或者执行如本发明实施例第二方面及第二方面任一项所述多属性识别方法。

本发明实施例第六方面提供一种电子设备，包括：存储器和处理器，所述存储器和所述处理器之间互相通信连接，所述存储器存储有计算机指令，所述处理器通过执行所述计算机指令，从而执行如本发明实施例第一方面及第一方面任一项所述的多属性识别模型构建方法，或者执行如本发明实施例第二方面及第二方面任一项所述多属性识别方法。

本发明提供的技术方案，具有如下效果：

本发明实施例提供的多属性识别模型构建方法，所述方法包括：获取待训练的图像样本集；对所述图像样本集中的图像按照目标属性进行分类并将分类后带标签的图像样本集输入至预设的神经网络中训练直至得到满足条件的多属性识别模型。该方法对图像样本集中的图像按照目标属性进行分类，有助于模型对于不同标签的属性的推断，同时方便了模型的管理和部署。

本发明实施例提供的多属性识别方法，所述方法包括：根据如多属性识别模型构建方法构建得到的多属性识别模型对获取的待识别图像进行预处理；根据预处理结果确定多属性对应的概率值矩阵；根据所述概率矩阵对所述待处理图像的多个属性进行识别。该方法利用训练得到的多属性识别模型对图像进行处理并完成识别，实现了单个模型对不同属性进行推断与识别，大幅度减少了计算量和计算时长，提高了多属性识别效率。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是根据本发明实施例的多属性识别模型构建方法的流程图；

图2是根据本发明实施例的多属性识别方法的流程图；

图3是根据本发明实施例的多属性识别模型构建装置的结构框图；

图4是根据本发明实施例的多属性识别装置的结构框图；

图5是根据本发明实施例提供的计算机可读存储介质的结构示意图；

图6是根据本发明实施例提供的电子设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例提供一种多属性识别模型构建方法，如图1所示，该方法包括如下步骤：

步骤S101：获取待训练的图像样本集。具体地，在采集的视频中进行抽帧标注获取得到待训练的图像样本集。

在一实施例中，采集幼儿园视频并获取待训练的幼儿园视频抽帧图像样本集。

步骤S102：对图像样本集中的图像按照目标属性进行分类并将分类后带标签的图像样本集输入至预设的神经网络中训练直至得到满足条件的多属性识别模型。具体地，在获取待训练的图像样本集之后，为了平衡数据量小的属性样本，采用旋转、平移、放缩、翻转、随机裁剪的数据增强方式处理获取的待训练的图像样本集。

然后将图像样本集中的图像按照目标属性进行分类。其中各个属性对应不同标签。

在一实施例中，对获取的幼儿园儿童图像样本集中儿童图像进行分类。具体地，儿童属性包括人头属性和人体属性。其中人头属性包括表情、朝向、和俯仰状态三个属性。具体的，表情输出类型为[＂highlight＂、＂calm＂、＂sad＂、＇emoji＿null＇]，朝向的输出类型为[＂back＂、＂front＂、＂left＂、＂right＂、＂towards＿null＂]，俯仰状态的输出类型为[＇down＇、＇up＇、＇straight＇、＇pose＿null＇]。

人体属性包括站立大小动作、站立手持物，坐立大小动作以及坐立手持物六个属性。输出类型分别为[＇sit＿catch＇、＇sit＿large＇、＇sit＿small＇、＇stand＿catch＇、＇stand＿large＇、＇stand＿small＇]。

将分类后带标签的图像样本集输入至预设的神经网络中训练直至得到满足条件的多属性识别模型。具体地，构建由ResNext网络、CSPNet结构和SENet单元组成的神经网络。

本发明实施例提供的多属性识别模型构建方法，该方法包括：获取待训练的图像样本集；对图像样本集中的图像按照目标属性进行分类并将分类后带标签的图像样本集输入至预设的神经网络中训练直至得到满足条件的多属性识别模型。该方法对图像样本集中的图像按照目标属性进行分类，有助于模型对于不同标签的属性的推断，同时方便了模型的管理和部署。

作为本发明实施例一种可选的实施方式，步骤S102，包括：对图像样本集中的图像的多属性进行分类和标签二值化处理确定对应的一维向量。具体地，对图像样本集中的图像的多属性进行分类之后使用sklearn函数库中的多标签二值化MultiLabelBinarizer函数进行处理可以得到对应的一维向量。

在一实施例中，在标签二值化过程中将多个属性(人头、人体)的标签融合为一组由0/1组成的一维向量，并产生一个记录该向量每个位置对应的标签含义的文件Label。

具体地，以人头朝向属性为例，标签数据为1时表示当前人头朝向为朝左，标签数据为0时表示当前人头朝向为朝右，则经过标签二值化处理之后，得到对应的一维向量[0，1，0，0]，即当前输入的幼儿园儿童监控图片中，该儿童的人头朝向为朝左。

然后，将带标签的图像样本集输入至预设的神经网络中生成一维标签概率向量。具体地，在训练过程中，每一个把标签会生成一个概率值，根据多个标签的概率值可以得到一组标签概率值组成的向量。

在一实施例中，将带标签的图像样本集输入至预设的神经网络中生成一维标签概率向量由人头和人脸的属性标签概率值组成，不能直接根据概率最大值求预测标签。因此，根据标签二值化过程中产生的Label文件并将属于同一属性对应标签的标签概率分离出来，然后再根据每一个属性对应标签的标签概率最值，得到对应属性的预测概率。

根据一维向量与一维标签概率向量计算标签损失值并根据损失值对神经网络进行更新直至满足预设条件时得到满足条件的多属性识别模型。具体地，获取到一维向量与一维标签概率向量之后，根据以下公式计算标签损失值：

式中，∈表示常量；l表示多标签融合后所有类别的数量；i表示正确分类；j表示错误分类；ce表示原始的交叉熵计算公式；k表示种类数量；y_k表示k类别的真实标签，即表示任意一组真实标签的一维向量；p_k表示神经网络的预测概率，即表示任意一组一维预测概率向量。

然后根据计算得到的标签损失值对神经网络参数的偏导来更新神经网络的参数权重，当更新次数大于第一预设次数时，得到训练好的多属性识别模型。

本发明实施例还提供一种多属性识别方法，如图2所示，该方法包括如下步骤：

步骤S201：根据如多属性识别模型构建方法构建得到的多属性识别模型对获取的待识别图像进行预处理。具体地，在获取到训练好的多属性识别模型之后，将待识别图像输入多属性识别模型中进行分析处理。

步骤S202：根据预处理结果确定多属性对应的概率值矩阵。具体地，在对待识别图像输入多属性识别模型中进行分析处理之后，根据标签映射对处理结果进行处理可以生成多属性对应多标签的概率值矩阵：

其中，x，y分别代表不同的属性；p_x1，....，p_xi以及p_y1，....，p_yi分别表示为多标签的概率值。

在一实施例中，输入一张幼儿园监控图片，经过目标检测将目标分为人头和人体两部分，人头进行表情、朝向和俯仰状态的识别；人体进行站立大小动作、站立手持物、坐立大小动作以及坐立手持物的属性识别，经过多属性识别模型之后，每个目标的概率由两部分组成即人头和人体，这两部分构成概率矩阵。

其中，x，y分别表示人头和人体属性；p_xi分别表示人头表情、朝向、俯仰状态不同标签的概率值，p_yi分别表示人体姿态(站立大小动作、站立手持物、坐立大小动作以及坐立手持物)的概率值。

步骤S203：根据概率矩阵对待处理图像的多个属性进行识别。具体地，获取的多属性对应多标签的概率值矩阵中的各个概率分别是根据属性识别模型中不用的属性分类得到的，根据该概率矩阵可以完成多属性识别。

在一实施例中，得到概率矩阵之后，根据各个属性的概率将目标识别为如表情为高光、朝向为朝左、俯仰状态为低头，人体属性为站立大动作的状态。

本发明实施例提供的多属性识别方法，该方法包括：根据如多属性识别模型构建方法构建得到的多属性识别模型对获取的待识别图像进行预处理；根据预处理结果确定多属性对应的概率值矩阵；根据概率矩阵对待处理图像的多个属性进行识别。该方法利用训练得到的多属性识别模型对图像进行处理并完成识别，实现了单个模型对不同属性进行推断与识别，大幅度减少了计算量和计算时长，提高了多属性识别效率。

作为本发明实施例一种可选的实施方式，步骤S201，包括：计算待识别图像分类后的任一属性对应的多个子属性的概率值；根据概率值对待识别图像分类后的任一属性对应的多个子属性进行识别。具体地，对待识别图像进行分析并生成多标签的概率值，根据该概率值可以识别待识别图像分类后的任一属性对应的多个子属性的状态。

在一实施例中，将一张待识别幼儿园抽帧图片进行分类，包括人头和人体两个属性，计算人头任一属性对应的表情、朝向、俯仰三个属性的概率值分别为p₁、p₂、p₃，根据三个概率值可以识别三个属性状态分别为：表情为高光、朝向为朝右、俯仰状态为抬头。人体对应多属性识别与人头对应多属性识别方法一致，此处不再赘述。

本发明实施例还提供一种多属性识别模型构建装置，如图3所示，该装置包括：

获取模块101，用于获取待训练的图像样本集；详细内容参见上述方法实施例中步骤S101的相关描述。

训练模块102，用于对图像样本集中的图像按照目标属性进行分类并将分类后带标签的图像样本集输入至预设的神经网络中训练直至得到满足条件的多属性识别模型；详细内容参见上述方法实施例中步骤S102的相关描述。

本发明实施例提供的多属性识别模型构建装置，获取待训练的图像样本集；对图像样本集中的图像按照目标属性进行分类并将分类后带标签的图像样本集输入至预设的神经网络中训练直至得到满足条件的多属性识别模型。对图像样本集中的图像按照目标属性进行分类，有助于模型对于不同标签的属性的推断，同时方便了模型的管理和部署。

作为本发明实施例一种可选的实施方式，该训练模块包括：分类处理模块，用于对图像样本集中的图像的多属性进行分类和标签二值化处理确定对应的一维向量；输入模块，用于将带标签的图像样本集输入至预设的神经网络中生成一维标签概率向量；计算模块，用于根据一维向量与一维标签概率向量计算标签损失值并根据损失值对神经网络进行更新直至满足预设条件时得到满足条件的多属性识别模型。

本发明实施例提供的多属性识别模型构建装置的功能描述详细参见上述实施例中多属性识别模型构建方法描述。

本发明实施例还提供一种多属性识别装置，如图4所示，该装置包括：

预处理模块201，用于根据如多属性识别模型构建方法构建得到的多属性识别模型对获取的待识别图像进行预处理；详细内容参见上述方法实施例中步骤S201的相关描述。

第一确定模块202，用于根据预处理结果确定多属性对应的概率值矩阵；详细内容参见上述方法实施例中步骤S202的相关描述。

第一识别模块203，用于根据概率矩阵对待处理图像的多个属性进行识别；详细内容参见上述方法实施例中步骤S203的相关描述。

本发明实施例提供的多属性识别装置，根据如多属性识别模型构建方法构建得到的多属性识别模型对获取的待识别图像进行预处理；根据预处理结果确定多属性对应的概率值矩阵；根据概率矩阵对待处理图像的多个属性进行识别。利用训练得到的多属性识别模型对图像进行处理并完成识别，实现了单个模型对不同属性进行推断与识别，大幅度减少了计算量和计算时长，提高了多属性识别效率。

作为本发明实施例一种可选的实施方式，该装置包括：计算模块，用于计算待识别图像分类后的任一属性对应的多个子属性的概率值；第二识别模块，用于根据概率值对待识别图像分类后的任一属性对应的多个子属性进行识别。

本发明实施例提供的多属性识别装置的功能描述详细参见上述实施例中多属性识别方法描述。

本发明实施例还提供一种存储介质，如图5所示，其上存储有计算机程序601，该指令被处理器执行时实现上述实施例中多属性识别模型构建方法或多属性识别方法的步骤。该存储介质上还存储有音视频流数据，特征帧数据、交互请求信令、加密数据以及预设数据大小等。其中，存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)、随机存储记忆体(Random Access Memory，RAM)、快闪存储器(Flash Memory)、硬盘(Hard DiskDrive，缩写：HDD)或固态硬盘(Solid-State Drive，SSD)等；所述存储介质还可以包括上述种类的存储器的组合。

本领域技术人员可以理解，实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)、随机存储记忆体(RandomAccessMemory，RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive，缩写：HDD)或固态硬盘(Solid-State Drive，SSD)等；所述存储介质还可以包括上述种类的存储器的组合。

本发明实施例还提供了一种电子设备，如图6所示，该电子设备可以包括处理器51和存储器52，其中处理器51和存储器52可以通过总线或者其他方式连接，图6中以通过总线连接为例。

处理器51可以为中央处理器(Central Processing Unit，CPU)。处理器51还可以为其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片，或者上述各类芯片的组合。

存储器52作为一种非暂态计算机可读存储介质，可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块，如本发明实施例中的对应的程序指令/模块。处理器51通过运行存储在存储器52中的非暂态软件程序、指令以及模块，从而执行处理器的各种功能应用以及数据处理，即实现上述方法实施例中的多属性识别模型构建方法或多属性识别方法。

存储器52可以包括存储程序区和存储数据区，其中，存储程序区可存储操作装置、至少一个功能所需要的应用程序；存储数据区可存储处理器51所创建的数据等。此外，存储器52可以包括高速随机存取存储器，还可以包括非暂态存储器，例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中，存储器52可选包括相对于处理器51远程设置的存储器，这些远程存储器可以通过网络连接至处理器51。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

所述一个或者多个模块存储在所述存储器52中，当被所述处理器51执行时，执行如图1所示实施例中的多属性识别模型构建方法以及如图2所示实施例中的多属性识别方法。

上述电子设备具体细节可以对应参阅图1至图2所示的实施例中对应的相关描述和效果进行理解，此处不再赘述。

虽然结合附图描述了本发明的实施例，但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型，这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims

1.一种多属性识别模型构建方法，其特征在于，包括如下步骤：

获取待训练的图像样本集；

对所述图像样本集中的图像按照目标属性进行分类并将分类后带标签的图像样本集输入至预设的神经网络中训练直至得到满足条件的多属性识别模型。

2.根据权利要求1所述的方法，其特征在于，对所述图像样本集中的图像的多属性进行分类并将分类后带标签的图像样本集输入至预设的神经网络中训练直至得到满足条件的多属性识别模型，包括：

对所述图像样本集中的图像的多属性进行分类和标签二值化处理确定对应的一维向量；

将带标签的图像样本集输入至预设的神经网络中生成一维标签概率向量；

根据所述一维向量与所述一维标签概率向量计算标签损失值并根据所述损失值对所述神经网络进行更新直至满足预设条件时得到满足条件的多属性识别模型。

3.一种多属性识别方法，其特征在于，包括如下步骤：

根据如权利要求1或2中所述的多属性识别模型构建方法构建得到的多属性识别模型对获取的待识别图像进行预处理；

根据预处理结果确定多属性对应的概率值矩阵；

根据所述概率矩阵对所述待处理图像的多个属性进行识别。

4.根据权利要求3所述的方法，其特征在于，根据如权利要求1或2中所述的多属性识别模型构建方法构建得到的多属性识别模型对获取的待识别图像进行预处理，包括：

计算所述待识别图像分类后的任一属性对应的多个子属性的概率值；

根据所述概率值对所述待识别图像分类后的任一属性对应的多个子属性进行识别。

5.一种多属性识别模型构建装置，其特征在于，包括：

获取模块，用于获取待训练的图像样本集；

训练模块，用于对所述图像样本集中的图像按照目标属性进行分类并将分类后带标签的图像样本集输入至预设的神经网络中训练直至得到满足条件的多属性识别模型。

6.根据权利要求5所述的装置，其特征在于，所述训练模块包括：

分类处理模块，用于对所述图像样本集中的图像的多属性进行分类和标签二值化处理确定对应的一维向量；

输入模块，用于将带标签的图像样本集输入至预设的神经网络中生成一维标签概率向量；

计算模块，用于根据所述一维向量与所述一维标签概率向量计算标签损失值并根据所述损失值对所述神经网络进行更新直至满足预设条件时得到满足条件的多属性识别模型。

7.一种多属性识别装置，其特征在于，包括：

预处理模块，用于根据如权利要求1或2中所述的多属性识别模型构建方法构建得到的多属性识别模型对获取的待识别图像进行预处理；

第一确定模块，用于根据预处理结果确定多属性对应的概率值矩阵；

第一识别模块，用于根据所述概率矩阵对所述待处理图像的多个属性进行识别。

8.根据权利要求7所述的装置，其特征在于，所述装置还包括：

计算模块，用于计算所述待识别图像分类后的任一属性对应的多个子属性的概率值；

第二识别模块，用于根据所述概率值对所述待识别图像分类后的任一属性对应的多个子属性进行识别。

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于使所述计算机执行如权利要求1－2任一项所述的多属性识别模型构方法或如权利要求3－4任一项所述的多属性识别方法。

10.一种电子设备，其特征在于，包括：存储器和处理器，所述存储器和所述处理器之间互相通信连接，所述存储器存储有计算机指令，所述处理器通过执行所述计算机指令，从而执行如权利要求1－2任一项所述的多属性识别模型构方法或如权利要求3－4任一项所述的多属性识别方法。