一种性别分类网络训练方法、性别分类方法及相关装置
技术领域
本发明涉及图像处理技术领域,尤其涉及一种性别分类网络训练方法、性别分类方法及相关装置。
背景技术
人脸是重要的生物特征之一,人脸图像上蕴含了大量的信息,例如性别、年龄、人种、身份等。人机交互技术(Human-Computer Interaction,HCI)的发展使得计算机视觉、人工智能在监控、GUI(Graphical User Interface,图形用户界面)人机界面设计等方面发挥了越来越重要的作用。随着技术的进步,基于人脸图像模式识别问题也成为近年来研究的热点。
随着人脸检测功能的不断完善,针对人脸的多种分类功能开始成熟,其中最常用的就是性别分类功能。
发明内容
本发明提供一种性别分类网络训练方法、性别分类方法及相关装置,以提高性别分类网络训练的速率和准确性。
根据本发明实施例的第一方面,提供一种性别分类网络训练方法,包括:
分别以训练样本集合中各训练样本为主训练样本生成训练样本组,其中,各训练样本组中包括主训练样本以及至少两个辅助训练样本;所述至少两个辅助训练样本中包括至少一个与主训练样本对应的性别相同的训练样本,以及至少一个与主训练样本对应的性别不同的训练样本;
将训练样本组输入到预设的卷积神经网络进行网络训练,以使所述预设的卷积神经网络对主训练样本的识别结果达到预设要求。
根据本发明实施例的第二方面,提供一种性别分类方法,包括:
将待检测图像输入到基于上述性别分类网络训练方法训练后的卷积神经网络;
根据所述训练后的卷积神经网络的识别结果确定所述待检测图像对应的性别。
根据本发明实施例的第三方面,提供一种性别分类网络训练装置,包括:
生成单元,用于分别以训练样本集合中各训练样本为主训练样本生成训练样本组,其中,各训练样本组中包括主训练样本以及至少两个辅助训练样本;所述至少两个辅助训练样本中包括至少一个与主训练样本对应的性别相同的训练样本,以及至少一个与主训练样本对应的性别不同的训练样本;
训练单元,用于将训练样本组输入到预设的卷积神经网络进行网络训练,以使所述预设的卷积神经网络对主训练样本的识别结果达到预设要求。
根据本发明实施例的第四方面,提供一种性别分类装置,包括:
输入单元,用于将待检测图像输入到基于上述性别分类网络训练装置得到的训练后的卷积神经网络;
确定单元,用于根据所述训练后的卷积神经网络的识别结果确定所述待检测图像对应的性别。
应用本发明实施例,通过分别以训练样本集合中各训练样本为主训练样本生成训练样本组,其中,各训练样本组中包括主训练样本以及至少一个与主训练样本对应的性别相同的辅助训练样本,以及至少一个与主训练样本对应的性别不同的辅助训练样本,并将训练样本组作为卷积神经网络的输入,输入到预设的卷积神经网络中进行网络训练,直至该预设的卷积神经网络对主训练样本的识别结果,与现有技术中以单一训练样本作为输入的网络训练方式相比,由于本发明实施例中输入到预设的卷积神经网络中的训练样本组中同时包括与主训练样本对应的相别相同和不同的辅助训练样本,可以让卷积神经网络更好地根据训练样本组中不同训练样本之间的相关性与差异性进行参数优化调整,可以提升卷积神经网络的训练速度和准确性。
附图说明
图1是本发明实施例提供的一种性别分类网络训练方法的流程示意图;
图2是本发明实施例提供的一种性别分类方法的流程示意图;
图3是本发明实施例提供的一种性别分类网络训练装置的结构示意图;
图4是本发明实施例提供的一种性别分类装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明实施例中的技术方案,并使本发明实施例的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明实施例中技术方案作进一步详细的说明。
请参见图1,图1为本发明实施例提供的一种性别分类网络训练方法的流程示意图,如图1所示,该性别分类网络训练方法可以包括以下步骤:
步骤101、分别以训练样本集合中各训练样本为主训练样本生成训练样本组,其中,各训练样本组中包括主训练样本以及至少两个辅助训练样本;该至少两个辅助训练样本中包括至少一个与主训练样本对应的性别相同的训练样本,以及至少一个与主训练样本对应的性别不同的训练样本。
本发明实施例中,上述方法可以应用于图像处理系统中,例如应用于图像处理系统后台服务器。为便于描述,以下以上述方法的执行主体为服务器为例进行描述。
本发明实施例中,训练样本集合可以包括多个对应的性别不同的训练样本,例如,该训练样本集合可以包括1000个男性训练样本,1000个女性训练样本;其中,训练样本为人脸图像。
本发明实施例中,对于训练样本集合中的任一训练样本,服务器可以从训练样本集合中选择至少一个与该训练样本对应的性别不同的辅助训练样本,以及至少一个与该训练样本对应的性别相同的辅助训练样本,并将该训练样本(作为主训练样本)以及至少两个辅助训练样本生成以该训练样本为主训练样本的训练样本组。
举例来说,对于任一训练样本,假设其对应的性别为男性,则服务器可以从训练样本集合中的其余训练样本中选择至少一个男性样本以及至少一个女性样本作为辅助样本,以生成以该训练样本为主训练样本的训练样本组。
作为一种可选的实施方式,当训练样本组中辅助训练样本的数量为2个时,上述步骤101中,分别以训练样本集合中各训练样本为主训练样本生成训练样本组,可以包括:
分别以训练样本集合中各训练样本为主训练样本生成对应的第一训练样本组、第二训练样本组、第三训练样本组以及第四训练样本组;
其中,训练样本对应的第一训练样本组中两个辅助训练样本对应的年龄与该训练样本对应的年龄差均不超过预设年龄阈值;第二训练样本组中对应的性别相同的辅助训练样本对应的年龄与该训练样本对应的年龄差不超过所述预设年龄阈值,另一辅助训练样本对应的年龄与该训练样本对应的年龄超过所述预设年龄阈值;第三训练样本组中对应的性别相同的辅助训练样本对应的年龄与该训练样本对应的年龄差超过所述预设年龄阈值,另一辅助训练样本对应的年龄与该训练样本对应的年龄不超过所述预设年龄阈值;第四训练样本组中两个辅助训练样本对应的年龄与该训练样本对应的年龄差均超过预设年龄阈值(可以根据具体应用场景设定,如3岁、2岁等)。
在该实施方式中,为了进一步地体现训练样本组中各样本之间的相关性和差异性,提升基于训练样本组进行训练的性别分类网络的准确率,在生成训练集合中各训练样本对应的训练样本组时,对于任一训练样本,可以分别根据辅助训练样本对应的性别与该训练样本对应的性别是否相同,以及对应的年龄与该训练样本对应的年龄的差值是否超过预设年龄阈值等条件,生成该训练样本对应的四个训练样本组,以下称为第一训练样本组、第二训练样本组、第三训练样本组以及第四训练样本组。其中,训练样本组对应的样本标签与训练样本组中的主训练样本对应的性别一致。
举例来说,假设训练样本组中辅助训练样本的数量为2个,则训练样本对应的训练样本组的生成策略如下:
第一训练样本组:假设训练样本i,属性为男性(即对应的性别为男性),则从训练样本集合中的其余训练样本中随机挑选一个对应的年龄与训练样本i对应的年龄的差值不超过预设年龄阈值的属性为男性的训练样本j1作为辅助训练样本,例如,假设预设年龄阈值为3岁,训练样本i对应的年龄为18岁,则训练样本j1对应的年龄可以为15~21岁;并随机挑选一个对应的年龄与训练样本i对应的年龄的差值不超过预设年龄阈值的属性为女性的训练样本j2作为辅助训练样本,则将作为[i,j1,j2]一个训练样本组,样本标签为男性;
第二训练样本组:假设训练样本i,属性为男性,则从训练样本集合中的其余训练样本中随机挑选一个对应的年龄与训练样本i对应的年龄的差值超过预设年龄阈值的属性为男性的训练样本j1作为辅助训练样本,例如,假设预设年龄阈值为3岁,训练样本i对应的年龄为18岁,则训练样本j1对应的年龄可以为小于15岁或大于21岁;并随机挑选一个对应的年龄与训练样本i对应的年龄的差值不超过预设年龄阈值的属性为女性的训练样本j2作为辅助训练样本,则将作为[i,j1,j2]一个训练样本组,样本标签为男性;
第三训练样本组:假设训练样本i,属性为男性,则从训练样本集合中的其余训练样本中随机挑选一个对应的年龄与训练样本i对应的年龄的差值不超过预设年龄阈值的属性为男性的训练样本j1作为辅助训练样本,并随机挑选一个对应的年龄与训练样本i对应的年龄的差值超过预设年龄阈值的属性为女性的训练样本j2作为辅助训练样本,则将作为[i,j1,j2]一个训练样本组,样本标签为男性;
第四训练样本组:假设训练样本i,属性为男性,则从训练样本集合中的其余训练样本中随机挑选一个对应的年龄与训练样本i对应的年龄的差值超过预设年龄阈值的属性为男性的训练样本j1作为辅助训练样本,并随机挑选一个对应的年龄与训练样本i对应的年龄的差值超过预设年龄阈值的属性为女性的训练样本j2作为辅助训练样本,则将作为[i,j1,j2]一个训练样本组,样本标签为男性。
需要注意的是,上述第一训练样本组、第二训练样本组、第三训练样本组以及第三训练样本组与训练样本组中包括的辅助训练样本的选择策略的对应关系并不是固定,即按上述训练样本组生成策略中描述的第一训练样本组的生成策略生成的训练样本组也可以称为第二(或第三或第四)训练样本组,本发明实施例后续不再复述。
步骤102、将训练样本组输入到预设的卷积神经网络进行网络训练,以使预设的卷积神经网络对主训练样本的识别结果达到预设要求。
本发明实施例中,区别于现有技术中将单个训练样本作为网络模型的输入的训练方式,服务器生成训练集合中各训练样本对应的训练样本组后,可以将各训练样本对应的训练样本组作为预设的卷积神经网络的输入,对该预设的卷积神经网络进行网络训练。由于同一训练样本组中主训练样本以及辅助训练样本的性别和年龄之间均具有一定的相似性或差异性,因而,以训练样本组为单位作为训练输入的训练方式,可以让性别分类网络更好地根据训练样本组中不同训练样本之间的相关性与差异性进行参数优化调整,可以提升卷积神经网络的训练速度和准确性。其中,在该预设的卷积神经网络的训练过程中,输入训练样本组后,识别结果对应的为主训练样本对应的性别。
作为一种可选的实施方式,在本发明实施例中,上述预设的卷积神经网络中的目标函数的识别信号可以如下:
其中,Ident(*)为标准的逻辑回归Logistic Regression公式,fi表示主训练样本i经过卷积后的图像特征信息,t为训练次数,θid为标准逻辑回归公式中的线性系数;
目标函数中增加的验证信号如下:
其中,Verif1(fi,fj1,θve)为辅助训练样本j1对应的验证信号,Verif2(fi,fj2,θve)为辅助训练样本j2对应的验证信号,fj1为训练样本j1经过卷积后的图像特征信息,fj2为训练样本j2经过卷积后的图像特征信息,m为一个可变系数;‖‖为范数;
该预设的卷积神经网络的反向传播阈值调整策略如下:
其中,α、β分别表示与主训练样本对应的性别相同的和不同的辅助训练样本对应的验证信号的不同权重,为对*求fi的偏导数。
在该实施方式中,在设计用于性别分类的卷积神经网络模型时,可以在目标函数中增加验证信号,用于优化深度学习的速率和准确性。
具体的,在该实施方式中,预设的卷积神经网络各层依次可以为输入层、多个(如3个、4个等)卷积层和池化层、全连接层和输出层。
以整个卷积神经网络为8层为例,第1层为输入层,第2、3、4层为卷积层,每个卷积层的步长、卷积子大小、卷积子的个数均可以自由设置,每层卷积层后都接一个池化层来降低卷积输出的特征向量,然后接一个ReLU(Rectified Linear Units,整流线性单元)激活函数用于加速收敛。第5层为全连接层将卷积后的特征转化为1维向量。第6层为dropout(脱落)层使模型在训练时对第5层的一维向量随机放弃部分的权重值,用于提升网络的自适应性。第7层为输出层将第6层的一维数据转化为标签结果(男、女),第8层为反馈层使用softmax函数(一种函数)作为最终的目标函数,并在目标函数中增加验证信号,用于优化深度学习的速率和准确性。
其中,该目标函数的识别信号,以及增加的验证信号,以及最终的反向传播阈值调整策略可以参见上述流程中的相关描述,本发明实施例在此不再赘述。
本发明实施例中,服务器生成训练样本集合中各训练样本对应的训练样本组后,可以将该训练样本组输入到设计好的卷积神经网络中,使用梯度下降法和反向传播算法来自适应优化卷积神经网络中的各个参数,直至测试结果满足预设要求,例如,性别识别的准确率超过预设阈值(如80%、90%等)。
作为一种可选的实施方式,在本发明实施例中,当训练样本集合中各训练样本对应的训练样本组包括第一训练样本组、第二训练样本组、第三训练样本组以及第四训练样本组时,服务器可以分别将训练样本集合中各训练样本对应的第一训练样本组、第二训练样本组、第三训练样本组以及第四训练样本组输入到预设的卷积神经网络进行四轮网络训练,即第一轮网络训练中,分别将各训练样本对应的以训练样本组作为输入进行网络训练…第四轮网络训练中,分别将各训练样本对应的以训练样本组作为输入进行网络训练;其中,具体的训练实现方式可以参见上述方法流程中的相关描述,本发明实施例在此不再赘述。
可见,在图1所描述的方法流程中,通过分别以训练样本集合中各训练样本为主训练样本生成训练样本组,其中,各训练样本组中包括主训练样本以及至少一个与主训练样本对应的性别相同的辅助训练样本,以及至少一个与主训练样本对应的性别不同的辅助训练样本,并将训练样本组作为卷积神经网络的输入,输入到预设的卷积神经网络中进行网络训练,直至该预设的卷积神经网络对主训练样本的识别结果,与现有技术中以单一训练样本作为输入的网络训练方式相比,由于本发明实施例中输入到预设的卷积神经网络中的训练样本组中同时包括与主训练样本对应的相别相同和不同的辅助训练样本,可以让卷积神经网络更好地根据训练样本组中不同训练样本之间的相关性与差异性进行参数优化调整,可以提升卷积神经网络的训练速度和准确性。
请参见图2,为本发明实施例提供的一种性别分类方法的流程示意图,如图2所示,该性别分类方法可以包括以下步骤:
步骤201、将待检测图像输入到基于上述性别分类网络训练方法训练后的卷积神经网络。
本发明实施例中,待检测图像可以为任一需要进行性别分类的人脸图像。当服务器接收到针对待检测图像的性别分类指令时,服务器可以将该待检测图像输入到图1所描述的方法流程中所描述的训练后的卷积神经网络。
步骤202、根据该训练后的卷积神经网络的识别结果确定待检测图像对应的性别。
本发明实施例中,服务器将待检测图像输入到训练后的卷积神经网络后,可以根据训练后的卷积神经网络的识别结果确定待检测图像对应的性别,进而根据检测结果进行后续处理,如将待检测图像对应的性别反馈给用户,或根据待检测图像对应的性别对待检测图像进行其它处理等。
通过以上描述可以看出,在本发明实施例提供的技术方案中,通过分别以训练样本集合中各训练样本为主训练样本生成训练样本组,其中,各训练样本组中包括主训练样本以及至少一个与主训练样本对应的性别相同的辅助训练样本,以及至少一个与主训练样本对应的性别不同的辅助训练样本,并将训练样本组作为卷积神经网络的输入,输入到预设的卷积神经网络中进行网络训练,直至该预设的卷积神经网络对主训练样本的识别结果,与现有技术中以单一训练样本作为输入的网络训练方式相比,由于本发明实施例中输入到预设的卷积神经网络中的训练样本组中同时包括与主训练样本对应的相别相同和不同的辅助训练样本,可以让卷积神经网络更好地根据训练样本组中不同训练样本之间的相关性与差异性进行参数优化调整,可以提升卷积神经网络的训练速度和准确性,进而也可以提高基于训练后的卷积神经网络实现的性别分类的准确性。
请参见图3,为本发明实施例提供的一种性别分类网络训练装置的结构示意图,其中,该性别分类网络训练装置可以应用于上述方法实施例中的图像处理系统,例如,应用于图像处理系统的后台服务器中,如图3所示,该性别分类网络训练装置可以包括:
生成单元310,用于分别以训练样本集合中各训练样本为主训练样本生成训练样本组,其中,各训练样本组中包括主训练样本以及至少两个辅助训练样本;所述至少两个辅助训练样本中包括至少一个与主训练样本对应的性别相同的训练样本,以及至少一个与主训练样本对应的性别不同的训练样本;
训练单元320,用于将训练样本组输入到预设的卷积神经网络进行网络训练,以使所述预设的卷积神经网络对主训练样本的识别结果达到预设要求。
在可选实施例中,当训练样本组中辅助训练样本的数量为2个时,
所述生成单元310,可以具体用于分别以训练样本集合中各训练样本为主训练样本生成对应的第一训练样本组、第二训练样本组、第三训练样本组以及第四训练样本组;
其中,训练样本对应的第一训练样本组中两个辅助训练样本对应的年龄与主训练样本对应的年龄差均不超过预设年龄阈值;第二训练样本组中对应的性别相同的辅助训练样本对应的年龄与主训练样本对应的年龄差不超过所述预设年龄阈值,另一辅助训练样本对应的年龄与主训练样本对应的年龄超过所述预设年龄阈值;第三训练样本组中对应的性别相同的辅助训练样本对应的年龄与主训练样本对应的年龄差超过所述预设年龄阈值,另一辅助训练样本对应的年龄与主训练样本对应的年龄不超过所述预设年龄阈值;第四训练样本组中两个辅助训练样本对应的年龄与主训练样本对应的年龄差均超过预设年龄阈值;
所述训练单元320,可以具体用于分别将训练样本集合中各训练样本对应的第一训练样本组、第二训练样本组、第三训练样本组以及第四训练样本组输入到预设的卷积神经网络进行四轮网络训练。
在可选实施例中,所述预设的卷积神经网络中的目标函数的识别信号如下:
其中,Ident(*)为标准的逻辑回归Logistic Regression公式,fi表示主训练样本i经过卷积后的图像特征信息,t为训练次数,θid为标准逻辑回归公式中的线性系数;
所述目标函数中增加的验证信号如下:
其中,Verif1(fi,fj1,θve)为辅助训练样本j1对应的验证信号,Verif2(fi,fj2,θve)为辅助训练样本j2对应的验证信号,fj1为辅助训练样本j1经过卷积后的图像特征信息,fj2为辅助训练样本j2经过卷积后的图像特征信息,m为一个可变系数;‖‖为范数;
所述预设的卷积神经网络的反向传播阈值调整策略如下:
其中,α、β分别表示与主训练样本对应的性别相同的和不同的辅助训练样本对应的验证信号的不同权重,为对*求fi的偏导数。
在可选实施例中,所述训练单元320,可以具体用于将训练样本组输入到所述预设的卷积神经网络中,使用梯度下降法和反向传播算法自适应学习优化卷积神经网络中的各个参数。
请参见图4,为本发明实施例提供的一种实现性别分类的装置的结构示意图,其中,该实现性别分类的装置可以应用于上述方法实施例中的图像处理系统,例如,应用于图像处理系统的后台服务器中,如图4所示,该实现性别分类的装置可以包括:
输入单元410,用于将待检测图像输入到基于图3所示性别分类网络训练装置得到的训练后的卷积神经网络;
确定单元420,用于根据所述训练后的卷积神经网络的识别结果确定所述待检测图像对应的性别。
上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
由上述实施例可见,通过分别以训练样本集合中各训练样本为主训练样本生成训练样本组,其中,各训练样本组中包括主训练样本以及至少一个与主训练样本对应的性别相同的辅助训练样本,以及至少一个与主训练样本对应的性别不同的辅助训练样本,并将训练样本组作为卷积神经网络的输入,输入到预设的卷积神经网络中进行网络训练,直至该预设的卷积神经网络对主训练样本的识别结果,与现有技术中以单一训练样本作为输入的网络训练方式相比,由于本发明实施例中输入到预设的卷积神经网络中的训练样本组中同时包括与主训练样本对应的相别相同和不同的辅助训练样本,可以让卷积神经网络更好地根据训练样本组中不同训练样本之间的相关性与差异性进行参数优化调整,可以提升卷积神经网络的训练速度和准确性。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。