CN107679465B

CN107679465B - 一种基于生成网络的行人重识别数据生成和扩充方法

Info

Publication number: CN107679465B
Application number: CN201710857752.3A
Authority: CN
Inventors: 杨华; 陈琳; 高志勇
Original assignee: Shanghai Jiaotong University
Current assignee: Shanghai Jiaotong University
Priority date: 2017-09-20
Filing date: 2017-09-20
Publication date: 2019-11-15
Anticipated expiration: 2037-09-20
Also published as: CN107679465A

Abstract

本发明提供了一种基于生成网络的行人重识别数据生成和扩充方法，步骤为：利用视频预测网络生成新的行人视频帧样本。利用深度生成对抗网络进行端到端的行人背景变换数据生成。利用不同的数据生成方法进行行人数据集的广度和丰富性的扩充。将扩充的数据集送入特征提取网络中提取特征并用欧氏距离评估性能。本方法同时考虑了行人的类内和类间数据扩充，联合利用了不同的生成网络生成更多更丰富的样本，扩充的数据集具有很好的多样性和鲁棒性，能更好的解决与适应由于样本数量不足和背景干扰带来的性能损失，具有普遍的适用性，扩充的数据集在下一步的行人识别中能发挥更好的性能及效率。

Description

一种基于生成网络的行人重识别数据生成和扩充方法

技术领域

本发明属于计算机视觉技术领域，具体为一种基于生成网络的行人重识别数据生成和扩充方法，尤其是涉及一种适合于行人重识别中提升识别性能的数据生成和扩充方法。

背景技术

行人重识别是智能视频监控中的一项关键任务，是近年来计算机视觉领域中一直备受关注的研究热点，适用于安防以及公共场所寻人等技术领域。行人重识别可定义为：在无重叠的视频监控网络中，对于摄像头中给定的某个行人，判断其是否出现在其他摄像头中的过程。它是一种自动的目标识别技术，能在监控网络中快速定位到感兴趣的人体目标，是智能视频监控和人体行为分析等应用中的重要步骤。

现有的深度行人重识别网络，基于训练数据与待测试数据是独立同分布的思想，用当前的训练数据来对将来的数据进行估计与模拟。因此不充分的训练数据集会给网络性能带来很大的影响，使得训练时准确率较高，测试时表现很差。这种现象被称为过拟合。由于现有行人重识别数据集普遍过小，不足以满足深度网络训练要求，往往更容易导致过拟合从而带来性能损失。现有的方法分为三种，一是提出收集更多的标注数据从而对数据集进行扩充(参见J.Ponce，T.L.Berg，M.Everingham，D.A.Forsyth，M.Hebert，S.Lazebnik，M.Marszalek，C.Schmid，B.C.Russell，and A.Torralba.2006.Dataset Issues in ObjectRecognition.Springer Berlin Heidelberg.29-48pages)，但这种方法代价过大，并且标注工作的可靠性也不够高；二是加入非标注数据，进行无监督学习从而提升性能(参见Peixi Peng，Tao Xiang，Yaowei Wang，Massimiliano Pontil，Shaogang Gong，TiejunHuang，and Yonghong Tian.2016.Unsupervised Cross-Dataset Transfer Learning forPerson Reidentification.In IEEE Conference on Computer Vision and PatternRecognition.1306-1315；H.Wang，S.Gong，and T.Xiang.2014.Unsupervised learning ofgenerative topic saliency for person re-identification.British Machine VisionAssociation Bmva(2014))，这种方法引入的数据由于不满足独立同分布的先决条件，往往会引入很多的误差，性能提升很有限；第三种是通过对已有的数据集进行线性变换，从而得到更多的数据对数据集进行扩充(参见Niall Mclaughlin，Jesus Martinez Del Rincon，and Pau1 Miller.2015.Data-augmentation for reducing dataset bias in personreidentification.In IEEE International Conference on Advanced Video andSignal Based Surveillance.1-6)，这种方法无法提供多样性的扩充样本，并且扩充的数据集鲁棒性不够好，实施复杂度过高。

发明内容

针对上述现有技术存在的问题，本发明提供一种基于生成网络的行人重识别数据生成和扩充方法，该方法利用现有的深度生成网络的优势，提出了类内和类间两种数据生成方法，分别对原有数据集的长度和丰富性进行扩充，从而在不需要额外的标定或数据收集工作的情况下提升最终识别的准确率。

本发明是通过以下技术方案实现的：

本发明联合并改进了两种深度生成对抗网络，其中利用传统对抗生成网络在不需要前景提取的情况下进行端到端的行人图像背景替换，实现类间行人数据集扩充，增加数据集的多样性，使下一步的特征提取更多的关注在行人本身，减少背景的干扰从而提升识别准确率；同时利用视频预测的数据生成网络，基于原有的行人视频预测新得视频帧，进行类内数据集扩充，从而增加数据集的长度，为下一步的行人空时特征提取提供更多的连续训练样本。

这样，本方法同时考虑了行人的类内和类间数据扩充，联合利用了不同的生成网络生成更多更丰富的样本，扩充的数据集具有很好的多样性和鲁棒性，能更好的解决与适应由于样本数量不足和背景干扰带来的性能损失，具有普遍的适用性，扩充的数据集在下一步的行人识别中能发挥更好的性能及效率。

具体地，本发明所述的基于生成网络的行人重识别数据生成和扩充方法，包括以下步骤：

第一步：基于无监督的视频预测生成网络，形成行人视频预测生成网络P；

第二步：对行人视频中的每一个图像序列s＝(s⁰，...，s^T-1)，均经过第一步中的行人视频预测生成网络P生成新的视频帧序列p＝(p⁰，...，p^T-1)，并同原始视频帧计算生成目标损失函数L并反传进行优化迭代，得到最优模型；其中，s^T-1表示第T帧原始图像，p^T-1表示第T帧预测图像，上标T表示序列长度；

第三步：在整个待扩充行人数据集上对第二步得到的最优模型进行应用，对待扩充行人数据集中的每一个行人视频帧，优化得到新的预测帧，并加入到待扩充行人数据集中进行类内视频长度的扩充，得到类内生成数据，用于减少由于数据量不足带来的过拟合现象；

第四步：基于传统生成对抗网络，形成行人图片生成对抗网络N，其中行人图片生成对抗网络N包含主要由卷积网络构成的生成单元G和描述单元D；

第五步：对待扩充行人数据集中的每一张输入图片s(t)，均经过第四步中的行人图片生成对抗网络N的生成单元G，通过生成单元G生成新的图片o(t)；

第六步：对待扩充行人数据集中的每一张输入图片s(t)所对应的原始背景替换图y(t)和对应的生成图片o(t)，均经过第四步中的行人图片生成对抗网络N的描述单元D，通过描述单元D中的损失函数L_C(G，D)判别二者的差异损失，并将损失函数L_C(G，D)分别反向传播于生成单元G和描述单元D进行对抗迭代优化；

第七步：加入一范数损失函数，用于减少生成图片的模糊程度；

第八步：最大化描述单元D的损失，用于使网络能够区分生成图片和原始图片；最小化生成单元G的损失，用于使生成图片能够接近原始图片；进行第六步的对抗迭代优化，得到最优的端到端的背景替换数据生成模型G^*；

第九步：应用第八步的背景替换数据生成模型G^*得到新的端到端的背景替换生成图片；将背景替换生成图片加入待扩充行人数据集中进行类间数据扩充，得到类间生成数据，用于增加数据集的多样性，减少背景干扰；

第十步：利用第三步得到的类内生成数据和第九步得到的类间生成数据对待扩充行人数据集进行扩充，得到最终的扩充数据集，并将最终的扩充数据集送入特征提取网络中提取特征并用欧氏距离评估性能。

优选地，第一步中，所述行人视频预测生成网络P包含四个主要由卷积网络构成的单元，分别为：输入卷积单元A、循环卷积单元R、输出预测单元以及损失计算单元E，其中：

所述输入卷积单元A用于接收并对输入图片进行卷积操作；

所述循环卷积单元R用于对输入图片进行循环卷积操作，并保留序列信息；

所述输出预测单元用于预测对应图像的输出；

所述损失计算单元E用于计算输入图像和预测图像之间的性能损失；

所述输入卷积单元A、循环卷积单元R、输出预测单元以及损失计算单元E的输出分别为：

其中，为输入卷积单元A的输出；为输出预测单元的输出；为损失计算单元E的输出；为循环卷积单元R的输出；l代表单元层的个数；t代表当帧图像在序列中的位置；s^t代表第t帧图像；ConV代表经过卷积操作；ReLU代表经过激活层操作操作；Maxpool代表经过最大值池化操作；convLSTM代表经过全卷积网络构成的长短时记忆单元层操作；Usample代表经过上采样层操作。

优选地，第二步中，所述目标损失函数L为：

其中，λ_t表示赋予序列的每一帧输入图像的权重系数，λ_l表示赋予每一重单元层的权重系数，n_l表示固定参数，表示在第l个单元层对第t帧输入图像通过网络后计算出的损失，t表示图像帧数，l表示单元层数。

优选地，所述目标损失函数L还包括如下任意一组特征：

-n_l＝4、λ_t＝1、λ_l＝0、l＝0；

-n_l＝4、λ_t＝1、λ_l＝1、l＞0。

优选地，第五步中，通过生成单元G生成新的图片o(t)的过程为：

o(t)＝G(s(t)，n(t))

其中，G()为经过生成单元G的操作，n(t)为生成单元G中网络自带的随机噪声。

优选地，第六步中，描述单元D中的损失函数L_C(G，D)计算公式为：

其中，G()表示经过生成单元G的操作，D()表示表示经过卷积网络构成的描述单元D的操作，E表示求期望操作，y表示对应的原始背景替换图片，o表示对应的输出预测背景替换图片，p_data()表示对应数据的概率分布，n表示随机噪声，p_n(n)表示数据n的概率分布，s表示原始输入图片。

优选地，第八步中，经过对抗优化迭代，最优的端到端的背景替换数据生成模型G^*表达式为：

其中，λ为1。

优选地，第十步中，数据扩充至待扩充行人数据集中原始行人图片的两倍到三倍；具体为，待扩充行人数据集为S，第三步中得到的类内生成数据为P，第九步中得到的类间生成数据为O，则最终的扩充数据集Y为：

与现有技术相比，本发明的有益效果在于：

1)联合并改进了两种深度生成对抗网络，同时考虑了类内和类间的数据生成，用以对行人数据进行扩充，因此能得到更为鲁棒性和适用性更广的数据扩充方法；

2)利用视频预测的数据生成网络生成的类内扩充样本，能很好地保留原有的数据的特征同时增加视频的长度，减少由于数据量不足带来的性能损失，不需要额外的收集样本和进行标注工作，降低了复杂度，同时保证了数据的一致性；

3)利用传统对抗生成网络在进行端到端的行人图像背景替换，减少了背景的干扰，实现了类间行人数据集扩充，增加了数据集的多样性，使下一步的特征提取更多的关注在行人本身从而提升识别的准确率。同时不需要额外的前景提取，降低了算法的复杂度，增加了方法的普适性。

附图说明

图1为本发明一实施例中网络结构的具体参数和组成方式示意图；

图2为本发明一实施例中类内数据生成结果示意图；

图3为本发明一实施例中类间数据生成结果示意图；

图4为本发明一实施例中将扩充的数据集送入特征提取网络做行人重识别的最终结果示意图；其中，(a)为PRID-2011数据集上的结果，(b)为i-LIDS-VID数据集上的结果。

具体实施方式

下面结合附图对本发明的实施例作详细说明：本实施例以本发明技术方案为前提进行实施，给出了详细的实施方式和具体的操作过程，但本发明的保护范围不限于下述的实施例。

实施例

本实施采用的图像帧来自数据库PRID-2011(参见：Martin Hirzer，CsabaBeleznai，Peter M.Roth，and Horst Bischof.2011.Person Re-identification byDescriptive and Discriminative Classification.Springer Berlin Heidelberg.91-102pages)和i-LIDS-VID(参见：Wei Shi Zheng，Shaogang Gong，and TaoXiang.2009.Associating Groups of People.Active Range Imaging Dataset forIndoor Surveillance(2009))中的群体监控视频(video for traffic surveillance)，以进行行人重识别性能评估。

本实施例涉及的基于生成网络的行人重识别数据生成和扩充方法，包括如下具体步骤：

步骤S1：类内数据生成，利用视频预测生成网络P生成新的行人视频帧样本。

具体步骤为：

S11、基于无监督的视频预测生成网络，形成行人视频预测生成网络P，其中行人视频预测生成网络P包含四个由卷积网络构成的单元，分别为：输入卷积单元A，卷积单元R，输出预测单元以及损失计算单元E；

S12、对行人视频中的每一个图像序列s＝(s⁰，...，s^T-1)，均经过1中的行人视频预测生成网络P，S11中各单元的输出为：

其中，为输入卷积单元A的输出；为输出预测单元的输出；为损失计算单元E的输出；为循环卷积单元R的输出；l代表单元层的个数；t代表当帧图像在序列中的位置；s^t代表第t帧图像；Conv代表经过卷积操作；ReLU代表经过激活层操作；Maxpool代表经过最大值池化操作操作；convLSTM代表经过全卷积网络构成的长短时记忆单元层操作；Usample代表经过上采样层操作。本实施例中，视频长度T为16；l为4代表四层网络；卷积层的卷积核大小为3*3，其4层网络的通道数分别为(3，48，96，192)。

S13、对整个数据集(即待扩充行人数据集)送入网络中进行S12中的各层优化迭代，目标损失函数L为：

其中，λ_t表示赋予序列的每一帧输入图像的权重系数，λ_l表示赋予每一重单元层的权重系数，n_l表示固定参数，表示在第l个单元层对第t帧输入图像通过网络后计算出的损失，t表示图像帧数，l表示单元层数。实施例中，n_l＝4，λ_t＝1，λ_l＝0，l＝0；λ_l＝1，l＞0。

S14、在整个待扩充行人数据集上进行训练和测试，对待扩充行人数据集中的每一个行人视频帧得到新的预测帧，加入待扩充行人数据集中进行类内视频长度的扩充，减少由于数据量不足带来的过拟合现象。本实施例中，数据集扩充一倍。

图1的类内数据生成部分是步骤中所述行人视频预测生成网络P网络结构的具体参数和组成方式示意图。行人视频是以序列的方式输入，经过网络的优化迭代生成预测的新的视频帧从而进行视频长度的扩充。

从图2类内数据生成结果示意图中可以看出，本实施例的方法能够很好地生成保留原始视频帧特性的新的图片用于对原始视频帧进行扩充。

步骤S2：类间数据生成，利用行人图片生成对抗网络N进行端到端的行人背景变换数据生成。

具体步骤为：

S21、采用并改进传统生成对抗网络，形成行人图片生成对抗网络N，其中包含主要由卷积网络构成的生成单元G和描述单元D.

S22、对待扩充行人数据集的每一张图片s(t)，均经过生成对抗网络N的生成单元G，通过生成单元G生成新的图片o(t)：

o(t)＝G(s(t)，n(t))，

其中，G()代表经过卷积网络构成的生成单元的操作，n(t)为G中网络自带的随机噪声。

S23、对待扩充行人数据集中的每一张输入图片s(t)所对应的原始背景替换图y(t)，和对应的生成图片o(t)，均经过行人图片生成对抗网络N的描述单元D，通过描述单元D中的损失函数L_C(G，D)判别二者的差异损失，并将损失函数L_C(G，D)分别反向传播于生成单元G和描述单元D进行对抗迭代优化，其中损失函数L_C(G，D)计算公式为：

本实施例中，训练数据集中的原始图片和背景替换目标图片由现有的数据集提供。

S24、加入一范数损失函数，从而减少生成图片的模糊程度：

其中，各参数含义请参考损失函数L_C(G，D)中的参数含义。

S25、最大化D的损失，从而使网络能好的区分生成图片和原始图片；最小化G的损失，从而使生成的图片能尽量的接近原始图片。进行上述的对抗迭代优化，最终的优化目标(即最优的端到端的背景替换数据生成模型)为G^*：

其中λ为参数权重，并为1。

S26、将所有待扩充行人数据集行人图片送入网络中进行训练并优化迭代得到最佳模型，从而应用S25得到的模型G^*得到新的端到端的背景替换生成图片。本实施例中，得到训练好的模型后，输入待扩充行人数据集行人图片应用S25得到的模型G^*则可得到背景替换的输出图片，不需要而外的前景提取。

S27、将背景替换生成图片加入待扩充行人数据集中进行类间数据扩充，增加数据集的多样性，减少背景干扰。

图1的类间数据生成部分是步骤中所述行人图片生成对抗网络N的网络结构具体参数和组成方式示意图。行人原始图片和背景替换目标图片是以成对的方式输入，经过网络的优化迭代从而训练模型进行端对端的背景替换，新的待扩充数据集则可应用模型G^*生成更多的多样背景样本进行行人数据丰富性的扩充。

从图3类间数据生成结果示意图中可以看出，本实施例的方法在测试集上能够在较为精确地保留原始行人的基础下进行多样的端到端背景替换，用于对原始行人数据集进行扩充，具有很好的适用性。

步骤S3：利用不同的数据生成方法进行行人数据集的广度和丰富性地扩充。

具体步骤为：

分别应用步骤S1和步骤S2的数据生成方法，加入待扩充行人数据集中，分别得到两倍到三倍的数据集扩充。待扩充行人数据集为S，步骤S1得到的类内生成数据为P，步骤S2得到的类间生成数据为O，则最终的扩充数据集Y为：

步骤S4：将最终的扩充数据集Y送入特征提取网络中提取特征并用欧氏距离评估性能。

图1的数据扩充部分是步骤中所述方式示意图。行人原始视频帧，和生成的类内以及类间样本，能够有选择的多样的根据需求进行数据扩充，形成新的两到三倍的扩充样本，同时提升数据集的广度和多样性。

综上所述，本实施例方法步骤联合并改进了两种深度生成对抗网络，同时考虑了类内和类间的数据生成，提取出的行人数据扩充方法更具有鲁棒性，适用性更广。生成的类内样本不需要额外的收集样本和进行标注工作，降低了复杂度，同时保证了数据的一致性；类间行端到端的行人图像背景替换样本生成，减少了背景的干扰，增加了数据集的多样性，同时不需要额外的前景提取，降低了算法的复杂度，使其在下一步的行人识别中发挥更好的性能及效率。

如图4(a)和(b)所示，是基于本实施例扩充的数据集送入特征提取网络做行人重识别的最终结果示意图，以行人重识别中普遍应用的累积匹配特性(CMC)曲线作为表征。五条曲线从上至下依次代表的是本实施例方法和其他方法在不同条件下的性能，作为参照系用以进行方法的比较；第一条带圆圈的曲线代表本实施例的类内数据生成进行两倍数据扩充后得到的准确率结果；第二条带十字的曲线代表本实施例的类间数据生成进行两倍数据扩充后得到的准确率结果；第三条带方块的曲线代表本实施例的综合利用类内和类间数据生成进行三倍数据扩充后得到的准确率结果；第四条曲线代表本实施例的参考的方法(参见：N.McLaughlin，J.Martinez del Rincon，and P.Miller.Recurrent convolutionalnetwork for video-based person re-identification.In Proceedings of the IEEEConference on Computer Vision and Pattern Recognition，2016.2，3，5，7)，这也是本实施例的参考特征提取网络，不用本实施例做数据扩充的结果；其他的曲线代表了运用不同网络不用本实施例进行数据扩充提取出相对应的特征所得到的性能(参见：S.Karanam，Y.Li，and R.J.Radke.Sparse re-id：Block sparsity for person re-identification.In Proceedings of the IEEE Conference on Computer Vision andPattern Recognition Workshops，pages 33-40，2015.5，7；参见：T.Wang，S.Gong，X.Zhu，and S.Wang.Person re-identification by video ranking.In European Conferenceon ComputerVision，pages 688-703.Springer，2014.2，5，7)。

从图4(a)和(b)中可以看出，本实施例的所提出的数据生成和扩充的方法方法较之前的方法能够更好地帮助于提取出更具有区分度的特征，并且在不同的数据集上都能得到很好地效果，识别的精度有了明显的提高。

以下表1，是基于本实施例得到的性能的最终识别准确率的数值比较结果。从上至下依次陈列了用以对照的其他结果同本实施例实施结果的数值比较。可以看到本实施例精度在不同数据集上都有很好的效果提升。

表1

综上所述，本实施例提供的基于生成网络的行人重识别数据生成和扩充方法，联合并改进了两种深度生成对抗网络，同时考虑了类内和类间的数据生成，用以对行人数据进行扩充，因此能得到更为鲁棒性和适用性更广的数据扩充方法；利用视频预测的数据生成网络生成的类内扩充样本，很好地保留原有的数据的特征同时增加视频的长度，减少由于数据量不足带来的性能损失，不需要额外的收集样本和进行标注工作，降低了复杂度，同时保证了数据的一致性；利用传统对抗生成网络在进行端到端的行人图像背景替换，减少了背景的干扰，实现了类间行人数据集扩充，增加了数据集的多样性，使下一步的特征提取更多的关注在行人本身从而提升识别的准确率。同时不需要额外的前景提取，降低了算法的复杂度，增加了方法的普适性。

尽管本发明的内容已经通过上述优选实施例作了详细介绍，但应当认识到上述的描述不应被认为是对本发明的限制。在本领域技术人员阅读了上述内容后，对于本发明的多种修改和替代都将是显而易见的。因此，本发明的保护范围应由所附的权利要求来限定。

Claims

1.一种基于生成网络的行人重识别数据生成和扩充方法，其特征在于：包括以下步骤：

第二步：对行人视频中的每一个图像序列s＝(s⁰,...,s^T-1)，均经过第一步中的行人视频预测生成网络P生成新的视频帧序列p＝(p⁰,...,p^T-1)，并同原始视频帧计算生成目标损失函数L并反传进行优化迭代，得到最优模型；其中，s^T-1表示第T帧原始图像，p^T-1表示第T帧预测图像，上标T表示序列长度；

第六步：对待扩充行人数据集中的每一张输入图片s(t)所对应的原始背景替换图y(t)和对应的生成图片o(t)，均经过第四步中的行人图片生成对抗网络N的描述单元D，通过描述单元D中的损失函数L_C(G,D)判别二者的差异损失，并将损失函数L_C(G,D)分别反向传播于生成单元G和描述单元D进行对抗迭代优化；

2.根据权利要求1所述的基于生成网络的行人重识别数据生成和扩充方法，其特征是：第一步中，所述行人视频预测生成网络P包含四个主要由卷积网络构成的单元，分别为：输入卷积单元A、循环卷积单元R、输出预测单元以及损失计算单元E，其中：

所述输入卷积单元A用于接收并对输入图片进行卷积操作；

所述输出预测单元用于预测对应图像的输出；

其中，为输入卷积单元A的输出；为输出预测单元的输出；为损失计算单元E的输出；为循环卷积单元R的输出；l代表单元层的个数；t代表当帧图像在序列中的位置；s^t代表第t+1帧图像；Conv代表经过卷积操作；

ReLU代表经过激活层操作操作；Maxpool代表经过最大值池化操作；

convLSTM代表经过全卷积网络构成的长短时记忆单元层操作；Usample代表经过上采样层操作。

3.根据权利要求1所述的基于生成网络的行人重识别数据生成和扩充方法，其特征是：第二步中，所述目标损失函数L为：

4.根据权利要求3所述的基于生成网络的行人重识别数据生成和扩充方法，其特征是：所述目标损失函数L还包括如下任意一组特征：

-n_l＝4、λ_t＝1、λ_l＝0、l＝0；

-n_l＝4、λ_t＝1、λ_l＝1、l＞0。

5.根据权利要求1所述的基于生成网络的行人重识别数据生成和扩充方法，其特征是：第五步中，通过生成单元G生成新的图片o(t)的过程为：

o(t)＝G(s(t),n(t))，

6.根据权利要求1所述的基于生成网络的行人重识别数据生成和扩充方法，其特征是：第六步中，描述单元D中的损失函数L_C(G,D)计算公式为：

其中，G()表示经过生成单元G的操作，D()表示经过卷积网络构成的描述单元D的操作，E表示求期望操作，y表示对应的原始背景替换图片，o表示对应的输出预测背景替换图片，p_data()表示对应数据的概率分布，n表示随机噪声，p_n(n)表示数据n的概率分布，s表示原始输入图片。

7.根据权利要求1所述的基于生成网络的行人重识别数据生成和扩充方法，其特征是：第八步中，经过对抗优化迭代，最优的端到端的背景替换数据生成模型G^*表达式为：

其中，λ为1，L_L1是指一范数损失函数。

8.根据权利要求1所述的基于生成网络的行人重识别数据生成和扩充方法，其特征是：第十步中，数据扩充至待扩充行人数据集中原始行人图片的两倍到三倍；具体为，待扩充行人数据集为S，第三步中得到的类内生成数据为Q，第九步中得到的类间生成数据为O，则最终的扩充数据集Y为：