CN109740536A

CN109740536A - 一种基于特征融合神经网络的亲属识别方法

Info

Publication number: CN109740536A
Application number: CN201910003726.3A
Authority: CN
Inventors: 马波; 丁小莹
Original assignee: Beijing Institute of Technology BIT
Current assignee: Beijing Institute of Technology BIT
Priority date: 2018-06-12
Filing date: 2019-01-03
Publication date: 2019-05-10
Anticipated expiration: 2039-01-03
Also published as: CN109740536B

Abstract

本发明涉及一种基于特征融合神经网络的亲属识别方法，属于图像处理领域。包括如下步骤：步骤一、对数据集中的人脸图像进行预处理，得到预处理后的人脸图像；步骤二、构建正样本对和负样本对；步骤三、生成对应的正样本对标签和负样本对标签；步骤四、分别对正样本对、负样本对以及正样本对标签和负样本对标签进行分割，生成训练集和测试集；步骤五、生成网络输入的训练数据和测试数据；步骤六、将步骤五生成的训练数据分批输入神经网络进行T轮迭代训练，并保存训练好的网络参数，输出训练好的神经网络；步骤七、经训练好的神经网络进行测试。所述方法学习不同特征之间的互补性和差异性，提高了特征的鲁棒性。

Description

一种基于特征融合神经网络的亲属识别方法

技术领域

本发明涉及一种基于特征融合神经网络的亲属识别方法，属于图像处理领域。

背景技术

亲属关系识别作为图像处理领域的一个重要分支，主要研究基于人脸图片的两个个体之间是否具有明确的基因遗传上的亲属关系，具有非常广泛的社会理论研究意义和潜在的商业应用场景。亲属识别中最常研究的四种亲属关系包括：父子，父女，母子以及母女，由于基因的大量继承，这几类亲属关系类型也是人类关系中最亲近的具有生物特征的连接桥梁。近年来，随着移动互联网技术的发展和普及，人们越来越乐意于通过网络在各种社交媒体和各个网站上分享自己的生活状态，而电子图片、视频作为一种直观的表达方式受到越来越多用户的青睐，每天网络上就有成千上万张的海量图片流通，如何有效的组织利用、挖掘分析图片中的潜在信息和关系就成了图像处理研究领域中的重中之重。

现存的模型方法可以大致分为两大类：基于特征的亲属识别模型以及基于学习的亲属识别模型。基于特征的亲属识别算法旨在设计出一个通用的低层手工特征表示以便具有亲属关系的特征可以有效的被使用，常用的特征包括局部特征和全局特征。基于学习的亲属识别方法主要通过寻找一个合适的语义转换空间以便在这个映射的子空间中，有效的增加具有亲属关系人脸图像对之间的可分性。典型的代表模型有度量学习、迁移学习、多核学习、基于图的学习、基于神经网络的学习等。

在亲属识别领域中，提取出每个人脸图像的多个特征表示是很容易的，然而，从相同的人脸图片中提取出的这些多个特征虽然能够从不同的方面对输入图片进行描述，但它们之间通常是高度相关的。对于多特征融合而言，这些高度相关的信息应该被保留下来，因为它们反映了样本的固有属性信息。此外，不同的特征表示方法学习到对目标样本不同的特征映射，对不同的复杂情况处理效果不同，有的特征对姿势变换处理效果好，有的特征对光照强弱比较鲁棒，有的特征对局部信息的细节捕捉能力强。为了综合利用各个特征对不同挑战因素之间的优势，处理实际情况中复杂的各种情况，采用多个特征融合的方式成为一种高效的特征学习方式。因此，我们联合多种特征学习了一个多特征融合的神经网络来解决亲属识别中特征不够鲁棒的问题。

发明内容

本发明的目的是对多个特征的非线性高维映射进行联合学习，产生一个更具判别性的特征表示，以有效的解决亲属识别中特征不够鲁棒的问题，提出了一种基于特征融合神经网络的亲属识别方法。

本发明的目的是通过以下技术方案实现的：

步骤一、对数据集中的人脸图像进行预处理，得到预处理后的人脸图像；

其中，数据集包含X个人脸图像，X为偶数；预处理后的人脸图像数量也为X个；数据集中按顺序的两个人脸图像具有亲属关系，具体为：数据集中偶数序号对应的图像为待识别图像，奇数序号对应的图像为男性亲属图像或女性亲属图像中的一种；

其中，偶数序号的待识别图像为需要进行判断是否与对应的奇数序号图像具有亲属关系；

人脸图像为RGB图像，即三通道的人脸图像，所述的三通道分别对应R通道、G通道和B通道；

其中，预处理包括对齐、裁剪操作；

步骤一又包括如下子步骤：

步骤1.1利用基于结构化SVM的人脸对齐方法对数据集中的人脸图像进行对齐，得到对齐后的人脸图像；

步骤1.2将步骤1.1对齐后的人脸图像进行裁剪，得到裁剪后的人脸图像；

其中，对齐后的人脸图像的数量为X个；裁剪后的人脸图像的数量为X个，每个图像的维度为64*64；

其中，预处理后的人脸图像的个数为X个；

步骤二、基于步骤一得到的预处理后的人脸图像构建正样本对和负样本对；

其中，正样本对的数量为X/2；负样本对的数量为X/2个；

步骤二又包括如下子步骤：

步骤2.1构建X/2个正样本对，具体为：按顺序将数据集中的两个人脸图像组成一对；

步骤2.2构建X/2个负样本对，具体为：第1个男性亲属图像或女性亲属图像与第X/2个待识别图像组成一对，第S个男性亲属图像或女性亲属图像与第S-1个待识别图像组成一对；S的取值范围为2到X/2；

步骤三、基于步骤二构建的正样本对和负样本对，生成对应的正样本对标签和负样本对标签；具体为，将正样本对对应的标签设置为1，负样本对对应的标签设置为0；

其中，正样本对标签为X/2个，负样本对标签为X/2个；

步骤四、分别将步骤二构建的正样本对、负样本对和步骤三生成的正样本对标签、负样本对标签进行分割，生成训练集和测试集；

分别将X/2个正样本对和负样本对进行分割，将其中的A％用于训练，将剩下的B％＝1-A％正样本对和负样本对用于测试；分别将X/2个正样本对标签和负样本对标签进行分割，将其中的A％用于训练，将剩下的B％＝1-A％正样本对和负样本对标签用于测试；

其中，X/2个正样本对和负样本对的A％以及X/2个正样本对标签和负样本对标签的A％构成训练集，即训练集样本总数为(A％*X)个；X/2个正样本对和负样本对的B％以及X/2个正样本对标签和负样本对标签的B％构成测试集，即测试集样本总数为(B％*X)个；

步骤五、对步骤四生成的训练集和测试集中的正样本对和负样本对中的两张图像分别提取m种特征，每种特征对应两个特征向量，然后将对应同一种特征的两个特征向量做差取绝对值，得出m个特征向量差模，再将得出的m个特征向量差模作为网络输入的训练数据和测试数据；

其中，m>＝2，训练集中的样本总数即训练数据总数为(A％*X)个，测试集中的样本总数即测试数据总数为(B％*X)个；

步骤六、将步骤五生成的训练数据分批输入神经网络进行T轮迭代训练，输出训练好的神经网络，并保存训练好的神经网络参数；

其中，神经网络包括m个基本特征转换模块和1个融合特征转换模块，这两种类型模块的操作均为先经全连接层，再经非线性激活函数激活；

基本特征转换模块包含的全连接层数为C层，记为全连接层1，全连接层2…全连接层C，C>＝2；全连接层1、全连接层2…全连接层C对应的神经元个数分别为H1、H2…H3；每个全连接层后面使用的非线性激活函数为F1，F1为sigmoid，relu以及tanh中的一种；

融合特征转换模块包含的全连接层数为Q层，记为第1全连接层，第2全连接层…第Q全连接层，Q>＝2；每个全连接层后面使用的非线性激活函数为F2，F2为sigmoid，relu以及tanh中的一种；

步骤六又包括如下子步骤：

步骤6.1初始化迭代次数t为1，初始化迭代总次数T，初始化迭代份数i为1，初始化基本特征转换模块中全连接层1到全连接层C的权重参数，初始化融合特征转换模块中第1全连接层到第Q全连接层的权重参数，初始化batch的值为N；

步骤6.2将步骤五得到的(A％*X)个训练数据随机分为(A％*X)/N＝I份，每份N个训练样本；

步骤6.3取步骤6.2生成第i份数据，将第i份数据的N个训练样本提取的m种特征x_j，分别输入m个基本特征转换模块中进行前向传播，分别得到的全连接层C输出的特征φ(x_j)，j∈[1,m]；

步骤6.4拼接步骤6.3中的特征x_j和φ(x_j)，形成第j个基本特征转换模块的输出即遍历j∈[1,m]，生成m个基本特征转换模块的输出；

步骤6.5将步骤6.4生成的所有基本特征转换模块的输出进行融合，得到一个融合m种特征的特征向量，具体为：拼接特征和m个基本特征转换模块的全连接层C输出的特征φ(x_j)，产生一个h维度的融合特征向量，即z^T＝[x₁ ^T,…,x_i ^T,…,x_m ^T,φ(x₁ ^T),…,φ(x_i ^T),…,φ(x_m ^T)]∈R^h；

步骤6.6将步骤6.5产生的h维度的融合特征输入融合特征转换模块，即依次输入第1全连接层直至第Q全连接层进行非线性学习，第Q全连接层输出N个P维特征向量；

步骤6.7计算损失，具体为：将步骤6.6输出的N个P维特征向量和第i份数据的N个标签一起经softmax-loss损失函数计算交叉熵；

步骤6.8反向传播，具体为，求解步骤6.7得到的损失对权重参数的偏导数，使用Adam优化器对参数进行更新，完成反向传播；

步骤6.9判断迭代份数i是否等于I，如果不等于，则将i加1，跳至步骤6.3；

步骤6.10判断迭代次数t是否等于T，如果不等于，则将t加1，跳至步骤6.2，否则跳至步骤6.11；

步骤6.11输出训练好的神经网络，并保存神经网络参数；

其中，保存的神经网络参数包括m个基本特征转换模块中的全连接层权重和1个融合特征转换模块的全连接层的权重；

步骤七、将步骤五生成的(B％*X)个测试数据输入步骤六训练好的神经网络进行测试，具体为：加载步骤五生成的测试数据的每个样本对提取的m种特征输入步骤六训练好的神经网络进行前向传播，得到第Q全连接层输出的K维向量，然后输入Softmax函数计算，得到一个K维向量，此K维向量中的每个值代表该样本属于每一类别的概率，将K维向量中概率最大的位置作为人脸图像样本对的标签；

其中，K＝2，且最大的位置为0或1中的一个；0表示人脸图像对不具有亲属关系，1表示人脸图像对具有亲属关系。

有益效果

本发明一种基于特征融合神经网络的亲属识别方法，与现有技术相比，具有如下有益效果：

1.所述方法基于多特征融合的网络结构，不需要进行核的选择和设计；

2.所述方法不是简单的进行线性特征结合，而是通过神经网络的协同学习进行非线性的高维映射，学习不同特征之间的互补性和差异性，提高了特征的鲁棒性。

附图说明

图1为一种基于特征融合神经网络的亲属识别方法中基本特征转换模块的示意图；

图2为一种基于特征融合神经网络的亲属识别方法的流程图。

具体实施方式

下面结合附图1和附图2，具体说明本发明的实施方式。

实施例1

本实施例阐述本发明所述的亲属识别方法用于识别父子关系、父女关系、母子关系以及母女关系中的一种，示意图如图2所示。包括如下步骤：

步骤I、对数据集中的人脸图像进行预处理，得到预处理后的人脸图像；

其中，数据集包含X个人脸图像，X为偶数；预处理后的人脸图像数量也为X个；数据集中按顺序的两个人脸图像具有直系亲属关系，且数据集中偶数序号对应的图像为孩子图像，奇数序号对应的图像为父亲图像或母亲图像中的一种；

其中，预处理包括对齐、裁剪操作；

步骤I又包括如下子步骤：

步骤(I.1)利用基于结构化SVM的人脸对齐方法对数据集中的人脸图像进行对齐，得到对齐后的人脸图像；

步骤(I.2)将步骤(I.1)对齐后的人脸图像进行裁剪，得到裁剪后的人脸图像；

其中，预处理后的人脸图像的个数为X个，其中X的取值依赖于数据集，具体到本实施例，采取了如下表1所示的3个不同的数据集：

表1不同的数据集

步骤II、基于步骤一得到的预处理后的人脸图像构建人脸图像正样本对和人脸图像负样本对；

其中，人脸图像正样本对的数量为X/2；人脸图像负样本对的数量为X/2个；

步骤II又包括如下子步骤：

步骤(II.1)构建X/2个正样本对，具体为：按顺序将数据集中的两个人脸图像组成一对；

步骤(II.2)构建X/2个负样本对，具体为：第1个男性亲属图像或女性亲属图像与第X/2个待识别图像组成一对，第S个男性亲属图像或女性亲属图像与第S-1个待识别图像组成一对；S的取值范围为2到X/2；

步骤III、基于步骤二构建的正样本对和负样本对，生成对应的正样本对标签和负样本对标签；具体为，将正样本对对应的标签设置为1，负样本对对应的标签设置为0；

其中，正样本对标签为X/2个，负样本对标签为X/2个；

具体到本实施例，使用ones()函数生成正样本对标签1，使用zeros()函数生成负样本对标签0；

步骤IV、分别将步骤II构建的正样本对、负样本对和步骤III生成的正样本对标签、负样本对标签进行分割，生成训练集和测试集；

分别将X/2个正样本对和负样本对进行分割，将其中的80％用于训练，将剩下的20％＝1-80％正样本对和负样本对用于测试；分别将X/2个正样本对标签和负样本对标签进行分割，将其中的80％用于训练，将剩下的20％＝1-80％正样本对和负样本对标签用于测试；

其中，X/2个正样本对和负样本对的80％以及X/2个正样本对标签和负样本对标签的80％构成训练集；X/2个正样本对和负样本对的20％以及X/2个正样本对标签和负样本对标签的20％构成测试集；

步骤V、对步骤IV生成的训练集和测试集中的正样本对和负样本对中的两张图像分别提取m种特征，每种特征对应两个特征向量，然后将对应同一种特征的两个特征向量做差取绝对值，得出m个特征向量差模，再将得出的m个特征向量差模作为网络输入的训练数据和测试数据；

具体到本实例中，m的取值为4，分别表示人工设计的低层特征描述子HOG、LBP、SIFT，以及利用预训练好的VGGNet网络提取的高层特征VGG。具体为，(1)HOG：首先将每个图像划分为16*16个不重叠的block，每个block的尺寸大小为4*4，接下来再次将每个图像划分为8*8个非重叠的block，每个block的大小为8*8，对每个划分出的block提取出一个9维的HOG特征向量，将所有的block的特征表示拼接起来即形成一个维度为2880的特征向量，代表整副图像的HOG特征描述符；(2)LBP：将每个图像划分为8*8的非重叠的block，对于每个8*8大小的block提取一个59维局部二值模式的LBP特征，将所有block的特征拼接起来即可形成一个3776维的图像LBP特征向量；(3)SIFT：使用16*16大小的滑动窗口在人脸图像上进行滑动，滑动窗口每次移动的步长为8个像素，这样采样将整副图像划分为49个有重叠的patch，对每个patch而言提取出一个128维的SIFT特征描述子，将所有patch的特征向量拼接起来即为整个图像的6272维SIFT特征表示向量；(4)VGG特征：使用3*3大小的卷积核后跟池化层的重复模块元素堆积起来的VGGNet网络结构预训练，提取倒数第二个全连接层的输出向量，即一个4096维的特征向量输出；

步骤VI、将步骤V生成的训练数据分批输入神经网络进行T轮迭代训练，输出训练好的神经网络，并保存训练好的神经网络参数；

其中，神经网络包括4个基本特征转换模块和1个融合特征转换模块，这两种类型模块的操作均为先经全连接层，再经非线性激活函数激活；

具体到本实例中，第1个基本特征转换模块包含3个全连接层，3个全连接层对应的神经元个数分别为2880、1024、512；第2个基本特征转换模块包含4个全连接层，4个全连接层对应的神经元个数分别为3776、2048、1024，512；第3个基本特征转换模块包含5个全连接层，5个全连接层对应的神经元个数分别为6272、4096、2048、1024、512；第4个基本特征转换模块包含4个全连接层，4个全连接层对应的神经元个数分别为4096、2048、1024、512，激活函数均为tanh，融合特征转换模块包含5个全连接层，激活函数均为relu；

步骤VI又包括如下子步骤：

步骤(VI.1)初始化迭代次数t为1，初始化迭代总次数T为300，初始化迭代份数i为1，采用均值为0，方差为0.02的高斯分布分别初始化4个基本特征转换模块中全连接层的权重参数和1个融合特征转换模块中全连接层的权重参数，初始化batch的值N为16；

步骤(VI.2)将步骤V得到的(A％*X)个训练数据随机分为(A％*X)/N＝I份，每份N个训练样本；

步骤(VI.3)取步骤(VI.2)生成第i份数据，将第i份数据的N个训练样本提取的4种特征x_j，分别输入4个基本特征转换模块中进行前向传播，分别得到的全连接层C输出的特征φ(x_j)，j∈[1,4]；

步骤(VI.4)拼接步骤(VI.3)中的特征x_j和φ(x_j)，形成第j个基本特征转换模块的输出即遍历j∈[1,4]，生成4个基本特征转换模块的输出；

具体到本实例中，HOG特征维度为2880，经过上述第1个基础特征转化模块后得到一个512维向量，最后拼接形成一个3392维的向量表示；LBP特征维度为3776，经过上述第2个基础特征转化模块后得到一个512维向量，最后拼接形成一个4288维的向量表示；SIFT特征维度为6272，经过上述第3个基础特征转化模块后得到一个512维向量，最后拼接形成一个6784维的向量；VGG特征维度为4096维，经过上述第4个基础特征转化模块后得到一个512维向量，最后拼接形成一个4608维的特征输出；

步骤(VI.5)将步骤(VI.4)生成的所有基本特征转换模块的输出进行融合，得到一个融合4种特征的特征向量，具体为：拼接特征和4个基本特征转换模块的全连接层C输出的特征φ(x_j)，产生一个h维度的融合特征向量，即z^T＝[x₁ ^T,…,x_i ^T,…,x_m ^T,φ(x₁ ^T),…,φ(x_i ^T),…,φ(x_m ^T)]∈R^h；

具体到本实例中，h＝3392+4288+6784+4608＝19072，即最后整个拼接为一个19072维的向量。

步骤(VI.6)将步骤(VI.5)产生的19072维度的融合特征输入融合特征转换模块，即依次输入5个全连接层进行非线性学习，第5个全连接层输出N个2维特征向量；

步骤(VI.7)计算损失，具体为：将步骤(VI.6)输出的N个2维特征向量和第i份数据的2个标签一起经softmax-loss损失函数计算交叉熵；

步骤(VI.8)反向传播，具体为，求解步骤(VI.7)得到的损失对权重参数的偏导数，使用Adam优化器对参数进行更新，完成反向传播；

整个网络训练过程中，使用Adam优化器进行权值参数的反向传播优化，其中学习率为0.0001，β1和β2分别为0.9和0.999，dropout中的保留率参数为0.5。

步骤(VI.9)判断迭代次数t是否等于T，如果不等于，则将t加1，跳至步骤(VI.3)，否则跳至步骤(VI.10)；

步骤(VI.10)判断迭代次数t是否等于T，如果不等于，则将t加1，跳至步骤(VII.2)，否则跳至步骤(VII.11)；

步骤(VI.11)输出训练好的神经网络，并保存训练好的神经网络参数；

其中，保存的神经网络参数包括4个基本特征转换模块中的全连接层权重和1个融合特征转换模块的全连接层的权重；

步骤VII、将步骤V生成的(B％*X)个测试数据输入步骤VI训练好的神经网络进行测试，具体为：加载步骤V生成的测试数据的每个样本对提取的4种特征输入步骤VI训练好的神经网络进行前向传播，得到第5全连接层输出的2维向量，然后输入Softmax函数计算，得到一个2维向量，此2维向量中的每个值代表该样本属于每一类别的概率，将2维向量中概率最大的位置作为人脸图像样本对的标签；

其中，最大的位置为0或1中的一个；0表示人脸图像对不具有亲属关系，1表示人脸图像对具有亲属关系。

本发明提出的基本特征转换模块如图1所示；

该模块全连接层组成，每个全连接层后面都使用非线性激活函数进行激活；如实施例中的步骤VI所述，每个模块使用的层数以及每层使用的神经元个数不同，因此产生不同的特征映射，这样不仅最大化的保留每种特征的信息，同时通过非线性的高维映射和神经网络联合学习到了新的更具判别性的特征表示。

本发明不仅限于以上实施例，凡是利用本发明的设计思路，做一些简单变化的设计，都应计入本发明的保护范围之内。

Claims

1.一种基于特征融合神经网络的亲属识别方法，其特征在于：包括如下步骤：

其中，预处理包括对齐、裁剪操作；

其中，正样本对的数量为X/2；负样本对的数量为X/2个；

其中，正样本对标签为X/2个，负样本对标签为X/2个；

步骤六又包括如下子步骤：

步骤6.5将步骤6.4生成的所有基本特征转换模块的输出进行融合，得到一个融合m种特征的特征向量，具体为：拼接特征和m个基本特征转换模块的全连接层C输出的特征φ(x_j)，产生一个h维度的融合特征向量，即z^T＝[z₁ ^T，…，x_i ^T，…，x_m ^T，φ(x₁ ^T)，…，φ(x_i ^T)，…，φ(x_m ^T)]∈R^h；

步骤6.11输出训练好的神经网络，并保存神经网络参数；

步骤七、将步骤五生成的(B％*X)个测试数据输入步骤六训练好的神经网络进行测试，具体为：加载步骤五生成的测试数据的每个样本对提取的m种特征输入步骤六训练好的神经网络进行前向传播，得到全连接层Q输出的K维向量，然后输入Softmax函数计算，得到一个K维向量，此K维向量中的每个值代表该样本属于每一类别的概率，将K维向量中概率最大的位置作为人脸图像样本对的标签；

2.根据权利要求1所述的一种基于特征融合神经网络的亲属识别方法，其特征在于：步骤一又包括如下子步骤：

其中，预处理后的人脸图像的个数为X个。

3.根据权利要求1所述的一种基于特征融合神经网络的亲属识别方法，其特征在于：步骤二又包括如下子步骤：

步骤2.2构建X/2个负样本对，具体为：第1个男性亲属图像或女性亲属图像与第X/2个待识别图像组成一对，第S个男性亲属图像或女性亲属图像与第S-1个待识别图像组成一对；S的取值范围为2到X/2。

4.根据权利要求1所述的一种基于特征融合神经网络的亲属识别方法，其特征在于：步骤五中，m>＝2，训练集中的样本总数即训练数据总数为(A％*X)个，测试集中的样本总数即测试数据总数为(B％*X)个。