CN108510071B

CN108510071B - 数据的特征提取方法、装置及计算机可读存储介质

Info

Publication number: CN108510071B
Application number: CN201710324243.4A
Authority: CN
Inventors: 吴振国
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2017-05-10
Filing date: 2017-05-10
Publication date: 2020-01-10
Anticipated expiration: 2037-05-10
Also published as: CN108510071A

Abstract

本发明实施例公开了一种数据的特征提取方法、装置及计算机可读存储介质，应用于计算机领域，该方法包括：通过预置的第一神经网络提取各样本中的行为数据的特征，并将提取的特征输入至预置的第二神经网络中，将该预置的第一神经网络和该预置的第二神经网络进行对抗性训练，当训练后的第二神经网络输出属于预置数值范围的结果值时，停止训练，通过训练后的第一神经网络提取目标行为数据的特征，该目标行为数据与该行为数据属于同一数据类别，这样不但可以确保特征不受数据分布的变化的干扰，并且相较于现有排序的方法，简化了提取具有样本分布不变性的特征的过程，缩短了运算时间，减少对运算资源的长时间的占用。

Description

数据的特征提取方法、装置及计算机可读存储介质

技术领域

本发明实施例属于计算机技术领域，尤其涉及一种数据的特征提取方法、装置及计算机可读存储介质。

背景技术

线上支付是电子支付的一种形式，它是通过第三方提供的与银行之间的支付接口进行的即时支付方式。由于线上支付的便捷性和资金到账的快速性，越来越多的银行、商家、用户选择线上支付。随着线上支付的发展，线上的支付平台还可以具有申请贷款、信用卡或者购买保险、理财产品等功能。开通这些功能之前，银行或者支付平台都需要对用户进行信用评分，信用低的用户会容易出现还款不及时或者不还款的现象，因此信用审核显得尤为重要。

现有技术中，首先从用户支付行为数据中提取特征，如，过去的12个月用户的活跃好友数、转账金额、发红包的金额等表示支付相关的特征并得到特征值，然后对所有的用户按照特征值由大到小进行排列，选取特征值大于预置数值的特征就是具有样本分布不变性的特征。

但是，由于产生支付行为数据的用户的数量巨大，多则几亿用户，少则几千万用户，所以导致通过排序方法提取特征和排名的过程计算量庞大，并且非常耗时，进而造成长时间的占用大量的运算资源。

发明内容

本发明实施例提供一种数据的特征提取方法、装置及计算机可读存储介质，旨在解决通过排序方法提取特征的过程所导致的计算量庞大、耗时，进而造成长时间的占用大量的运算资源的问题。

本发明实施例第一方面提供了一种数据的特征提取方法，包括：

通过预置的第一神经网络提取各样本中的行为数据的特征，并将提取的特征输入至预置的第二神经网络中；

将所述预置的第一神经网络和所述预置的第二神经网络进行对抗性训练；

当训练后的第二神经网络输出属于预置数值范围的结果值时，停止训练，所述结果值为正确判别所述提取的特征的样本来源的概率值；

通过训练后的第一神经网络提取目标行为数据的特征，所述目标行为数据与所述行为数据属于同一数据类别。

本发明实施例第二方面提供了一种数据的特征提取装置，包括：

提取单元，用于通过预置的第一神经网络提取各样本中的行为数据的特征，并将提取的特征输入至预置的第二神经网络中；

训练单元，用于将所述预置的第一神经网络和所述预置的第二神经网络进行对抗性训练，以及，当训练后的第二神经网络输出属于预置数值范围的结果值时，停止训练，所述结果值为正确判别所述提取的特征的样本来源的概率值；

所述提取单元，还用于通过训练后的第一神经网络提取目标行为数据的特征，所述目标行为数据与所述行为数据属于同一数据类别。

本发明实施例第三方面提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可执行指令，所述计算机可执行指令用于执行本发明实施例第一方面提供的数据的特征提取方法。

本发明实施例提供的数据的特征提取方法、装置及计算机可读存储介质，是通过两个神经网络进行对抗性训练，得到具有样本分布不变性的特征，这样不但可以确保特征不受数据分布的变化的干扰，并且相较于现有排序的方法，无需每次对新提取的特征重新排序，通过训练后的第一神经网络提取的特征均为具有样本分布不变性的特征，进而简化了提取特征的过程，缩短了运算时间，减少对运算资源的长时间的占用。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例。

图1为本发明实施例提供的应用场景的示意图；

图2为本发明实施例提供的数据的特征提取装置的结构示意图；

图3为本发明第一实施例提供的数据的特征提取方法的实现流程示意图；

图4为本发明第二实施例提供的数据的特征提取方法的实现流程示意图；

图5为本发明第三实施例提供的数据的特征提取装置的结构示意图；

图6为本发明第四实施例提供数据的特征提取装置的结构示意图。

具体实施方式

为使得本发明的发明目的、特征、优点能够更加的明显和易懂，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而非全部实施例。基于本发明中的实施例，本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1示出了上述数据的特征提取方法的一种示例性应用场景图，在该场景下，包括：数据的特征提取装置10、数据源平台11以及终端A、B和C。

该终端A、B和C可以是各种具有通信功能的手持设备、车载设备、可穿戴设备、计算机设备、定位设备或连接到无线调制解调器的其他处理设备，例如、手机、平板电脑、个人数字助理(PDA，personal digital assistant)。需要说明的是，在实际应用场景中，终端的数目不做限定看，可以多于2个，也可以少于2个。该终端A、B和C中可安装与该数据源平台11关联的客户端，该终端A、B和C通过该客户端，将用户的行为数据上传至数据源平台11中。

该数据源平台11可以为一台服务器，也可以为多台服务器集群，还可以为云平台。该数据源平台11可以为支付平台、社交平台等平台。该数据源平台存储有多种数据类别，该数据类别是按照用户在客户端上的行为操作划分的，例如，若用户通过客户端进行与支付相关的操作，则产生的数据类别为支付行为数据；若用户通过客户端进行与社交相关的操作，则产生的数据类别为社交行为数据。

如果该数据源平台11为支付平台，则该支付平台可以为线下银行的服务器，也可以为线上第三方支付机构的服务器。用户在支付平台上产生的行为数据是支付行为数据，如，资金转账、偿还贷款或信用卡、支付保险金额等行为数据。如果数据源平台11为社交平台，则用户在该社交平台上产生的行为数据是社交行为数据，如点赞、评论、添加好友数量等行为数据，另外在该社交平台上还可以产生支付行为数据，如，给好友红包、打赏等支付行为数据。

数据的特征提取装置10可以为计算机、超级计算机，也可以是服务器、服务器集群或云平台等具有运算功能的设备，数据的特征提取装置10从数据源平台11中获取终端A、B和C上传的行为数据。需要说明的是，图1中是以该数据的特征提取装置10为服务器为例的应用场景图，当然也可以将数据的特征提取装置10更换为计算机等具有运算功能的设备。

图2是上述数据的特征提取装置的硬体结构示意图，如图2所示，该装置包括：总线1、处理器2、通信接口3和存储器4。处理器2、通信接口3、存储器4通过总线1相互连接。

其中，总线1包括一通路，在计算机系统各个器件间传送信息。处理器2可以是通用处理器，例如，中央处理器(CPU)、网络处理器(NP，network processor)或微处理器等，也可以是特定应用集成电路(ASIC，application-specific integrated circuit)，或一个或多个用于控制本发明方案程序执行的集成电路。还可以是数字信号处理器(DSP，DigitalSignal Processing)、现场可编程门阵列(FPGA，Field－Programmable Gate Array)或其他可编程逻辑器件。

通信接口3可包括使用任何收发器的装置，以便与其他设备或通信网络进行通信，如以太网、无线接入网和无线局域网等。

存储器4中保存有执行本发明技术方案的程序，还可以保存有操作系统和其他关键业务。具体地，程序可以包括程序代码，该程序代码包括计算机操作指令。更具体地，存储器4可以包括只读存储器(ROM，read-only memory)、可存储信息和指令的其他类型的动态存储设备、磁盘存储器、闪存等。

数据的特征提取装置10的处理器2执行存储器4中所存放的程序，以及调用其他设备，可用于实现本发明实施例提供的数据的特征提取方法。

请参阅图3，图3为本发明第一实施例提供的数据的特征提取方法的实现流程示意图，可应用于上述数据的特征提取装置10中，主要包括以下步骤：

S301：通过预置的第一神经网络提取各样本中的行为数据的特征，并将提取的特征输入至预置的第二神经网络中。

人工神经网络(ANN，artificial neural network)，简称神经网络(NN，neuralnetwork)或类神经网络，是一种模仿生物神经网络的结构和功能的数学模型或计算模型，用于对函数进行估计或近似。

该预置的第一神经网络随机提取各样本中的行为数据的特征。每一个样本中包括多个行为数据。需要说明的是，该各样本的数量可以为两个。

以该行为数据为支付行为数据为例，该支付行为数据为用户在支付过程中产生的行为数据，例如，用户A在xxxx年xx月xx日，偿还贷款1万元整，用户B在xxxx年xx月xx日，偿还信用卡2000元整，该信号卡号为2xxxx，除了上述举例中的信用卡还款和贷款偿还之外，还可以为每一个月支付的保险额，或者线上个人借款的还款等支付行为数据。

同样地，当行为数据为社交行为数据时，该社交行为数据为用户在社交过程中产生的行为数据，例如，用户C在xxxx年xx月xx日为用户D共享的文章点赞。

上述对该行为数据的名词解释同样适用于本步骤中的行为数据，此处不再赘述。

S302：将该预置的第一神经网络和该预置的第二神经网络进行对抗性训练。

对抗性训练的目的是使得训练后的第二神经网络无法判别出训练后的第一神经网络提取的特征的样本来源，即无法判别出该提取的特征属于哪一个样本。

S303：当训练后的第二神经网络输出属于预置数值范围的结果值时，停止训练。

该结果值为正确判别该提取的特征的样本来源的概率值。当该训练后的第二神经网络输出的结果值属于该预置数值范围内时，表示该训练后的第二神经网络无法判别出该提取的特征属于哪一个样本，此时就可以停止对抗性训练。

S304：通过训练后的第一神经网络提取目标行为数据的特征。

该目标行为数据与步骤S301中各样本中的行为数据属于同一数据类别，例如，若各样本中的行为数据为支付行为数据，则该目标行为数据必须也是支付行为数据；若各样本中的行为数据为社交行为数据，则该目标行为数据必须也是社交行为数据。该数据类别的名词解释和举例请参见上述相关描述，此处不再赘述。

需要说明的是，产生该目标行为数据和各样本中的行为数据的用户可以是相同的，也可以是不同的。该目标行为数据可以包括上述S301中样本中的该行为数据，也可以不包含该行为数据。

该提取的该目标行为数据的特征均为具有样本分布不变性的特征。该具有样本分布不变性的特征是指在不同的样本分布下具有不变性的特征，即不会随着数据分布变化而改变的特征。

由于随着时间的推移，用户的活跃量可能会发生大幅变化，若将输出具有样本分布不变性的特征的神经网络作为后续对待评价的用户进行评价的模型，这样可以有效地避免受到数据分布变化的干扰，提高了该模型输出的稳定性。

在本发明实施例中，通过两个神经网络进行对抗性训练，得到具有样本分布不变性的特征，这样不但可以确保特征不受数据分布的变化的干扰，并且相较于现有使用排序方法来提取特征，无需每次对新提取的特征重新排序，通过训练后的第一神经网络提取的特征均为具有样本分布不变性的特征，进而简化了提取特征的过程，缩短了运算时间，减少对运算资源的长时间的占用。

请参阅图4，图4为本发明第二实施例提供的数据的特征提取方法的实现流程示意图，可应用于上述数据的特征提取装置10中，主要包括以下步骤：

步骤S401-步骤S403是对上述步骤S301的细化。

S401：获取目标用户在各数据源上产生的同一数据类别的行为数据。

该行为数据以及数据类别的名词解释和举例参见上述描述，此处不做赘述。该数据源相当于图1示例中的数据源平台11。由于该目标用户在不同的数据源可能会产生不同数据类别的行为数据，例如，用户B在社交平台既可以产生社交行为数据，又可以产生支付行为数据，因此，获取的行为数据为同一数据类别的数据。

在实际应用中，可以设置获取该行为数据的预置时间段，该预置时间段可以是以年为单位的时间段，也可以是以月为单位的时间段。例如，2014年-2016年期间，用户D在各支付平台上产生的支付行为数据。

S402：选取具有评价标签的目标用户对应的行为数据组成训练样本，并将选取后剩余的目标用户对应的行为数据组成测试样本。

该选取后剩余的目标用户是没有评价标签的用户，即将没有评价标签的用户对应的行为数据组成该测试样本。

该评价标签用于标识该目标用户所属的预置评价类别。该预置评价类别与步骤S401中获取的行为数据相关。

若获取的行为数据为支付行为数据，则该预置评价类别为信用评价类别。其中该信用评价类别包括：信用好类别和信用坏类别。若该目标用户属于信用好类别的用户，则表示该目标用户未有无信用卡逾期，或信用卡逾期次数未超过预置次数；若该目标用户属于信用坏类别的用户，则表示该目标用户有信用卡逾期，或信用卡逾期次数超过该预置次数。

上述对信用好类别和信用坏类别的定义只是一个举例，当然还可以使用其他方法定义信用好类别和信用坏类别，例如，贷款还款情况，储蓄卡或信用卡按时缴纳年费情况；此外也可以直接从银行的服务器中获取征信记录，并依据该征信记录生成该评价标签。上述与支付行为数据对应的评价标签一般从银行的服务器中获取。

若获取的行为数据为社交行为数据，则该预置评价类别可以为用户活跃度评价类别，也可以是用户上网行为评价类别，例如，上传不良文字、视频、或图片等多媒体文件的用户属于评价差类别的用户，无不良上网行为的用户属于评价好类别的用户。

需要说明的是，使用其他行为数据对应的设置评价标签和预置评价类别的过程与上述设置支付行为数据的评价标签和预置评价类别的过程相似，此处不再赘述。

S403：通过预置的第一神经网络从该训练样本或该测试样本中随机提取该行为数据的特征，并将提取的特征输入至预置的第二神经网络中。

在实际应用中，该预置的第一神经网络可以从该训练样本中提取行为数据的特征，也可以从该测试样本中提取行为数据的特征。

步骤S404-步骤S406为上述步骤S302的细化。

S404：通过预置的第一代价函数，对该预置的第二神经网络进行训练，得到训练后的第二神经网络，以使该训练后的第二神经网络正确判别该提取的特征所属样本的来源。

该样本的来源中包括该训练样本或该测试样本，即，该提取的特征是属于该训练样本还是该测试样本。

该第一代价函数L_{data_distribution}的公式为：L_{data_distribution}＝-t_dlny_d-(1-t_d)ln(1-y_d)，其中，t_d为该提取的特征的标签，该标签用于标识该提取的特征所属该样本的来源，y_d为该训练后的第二神经网络输出的结果值，该结果值为提取的特征来源于该训练样本或该测试样本的概率值。

优选地，t_d为0或1的值，若t_d＝0标识提取的特征属于训练样本，则t_d＝1标识提取的特征属于测试样本，反之，若t_d＝0标识提取的特征属于测试样本，则t_d＝1标识提取的特征属于训练样本。需要说明的是，t_d不限于取0或1的值，还可以取其他的不相同的两个数值，此处不做限定。

y_d为(0,1)之间的值。若t_d＝0标识提取的特征属于训练样本，t_d＝1标识提取的特征属于测试样本，且该训练后的第二神经网络输出的结果值为该提取的特征来源于该训练样本的概率值，则该训练后的第二神经网络输出的结果值越接近0，表示该提取的特征来源于该训练样本。由此说明，t_d的取值y_d的取值要相对应。

S405：将该训练样本中的行为数据对应的特征输入至该预置的第一神经网络中。

需要说明的是，在训练该预置的第一神经网络时，需要选取该训练样本中的行为数据，这是因为该训练样本中的行为数据对应的目标用户标识有评价标签。

S406：通过预置的第二代价函数和预置的总代价函数，对该预置的第一神经网络进行训练，得到训练后的第一神经网络，以使通过该训练后的第一神经网络提取的特征输入至该训练后的第二神经网络时，该训练后的第二神经网络输出的结果值属于该预置数值范围。

进一步地，该步骤S406具体为：

设置该总代价函数中的该第一代价函数为预置值，且该第一代价函数中的y_d的数值属于该预置数值范围内，该总代价函数L_overall的公式为：

L_overall＝αL_{credit_scoring}-(1-α)L_{data_distribution}，其中，α为平衡因子；

将该第二代价函数代入至该总代价函数中，并通过代入后的总代价函数，对该预置的第一神经网络进行训练，得到该训练后的第一神经网络，其中该训练后的第一神经网络用于用户评价，该第二代价函数L_{credit_scoring}的公式为：

L_{credit_scoring}＝-t_clny_c-(1-t_c)ln(1-y_c)，

其中，t_c为该目标用户的该评价标签，y_c为该训练后的第一神经网络输出的结果值，该训练后的第一神经网络输出的结果值为该目标用户属于预置评价类别中的一个评价类别的概率值。

一般地，该预置评价类别的数量为两个。优选地，t_c为0或1的值，预置评价类别为第一评价类别和第二评价类别。若t_c＝0标识属于该第一评价类别的该目标用户，则t_c＝1标识该第二评价类别的该目标用户，反之，若t_c＝0标识该第二评价类别的该目标用户，则t_c＝1标识属于该第一评价类别的该目标用户。需要说明的是，t_c不限于取0或1的值，还可以取其他的不相同的两个数值，此处不做限定。

以预置评价类别包括：信用好类别和信用坏类别为例，t_c＝0标识信用好的目标用户，则t_c＝1标识信用坏的目标用户，反之，也可以t_c＝0标识信用坏的目标用户，则t_c＝1标识信用好的目标用户。

y_c为(0,1)之间的值。若t_c＝0标识属于该第一评价类别的该目标用户，t_c＝1标识该第二评价类别的该目标用户，且该训练后的第一神经网络输出的结果值为该目标用户属于该第一评价类别的概率值，则y_c越接近0表示该目标用户属于该第一评价类别的概率越大。由此说明，t_c的取值y_c的取值要相对应。由此说明，t_c的取值y_c的取值要相对应。

以预置评价类别包括：信用好类别和信用坏类别为例，若t_c＝0表示信用好的用户，y_c＝1表示信用坏的用户，且该第一神经网络输出的结果值为该目标用户属于信用坏的用户的概率值，则y_c越接近0表示该目标用户属于信用好类别的概率越大。

需要说明的是，该总代价函数中的平衡因子是预置的常数。设置该总代价函数中的该第一代价函数为预置值，需使得该第一代价函数中的y_d的数值属于该预置数值范围内。

S407：当该训练后的第二神经网络输出属于该预置数值范围的结果值时，停止训练。

该结果值为正确判别提取的特征的样本来源的概率值。该预置数值范围可以是0.5加或减n，其中，n的取值为趋近于0的数值，如0.01、0.001，也可以等于0。

因此，在步骤S406中，将y_d的数值设置属于该预置数值范围内，再对该第一神经网络进行训练，可以使得该训练后的第二神经网络输出的结果值属于该预置数值范围内(趋近于0.5)，即该训练后的第二神经网络无法区分由该第一神经网络提取的特征属于该训练样本还是该测试样本。

S408：选取待评价的用户在各该数据源上产生的目标行为数据。

该待评价的用户产生的该目标行为数据与该目标用户产生的行为数据属于同一数据类别。此处数据类别的名词解释和举例与步骤S401相同，参见上述描述，此处不再赘述。

如果步骤S401中该目标用户产生的行为数据为支付行为数据，则该目标行为数据也是支付行为数据；如果步骤S401中该目标用户产生的行为数据为社交行为数据，则该目标行为数据也是社交行为数据。

该待评价的用户可以与该目标用户相同，也可以是包含该目标用户。

S409：通过该训练后的第一神经网络提取该目标行为数据的特征。

提取的该目标行为数据的特征均为具有样本分布不变性的特征。上述步骤S303对该具有样本分布不变性的特征的名词解释和举例同样适用于本步骤，此处不再赘述。

S410：通过该训练后的第一神经网络，根据该目标行为数据的特征对该待评价的用户进行评价，得到预置评价类别中的一个评价类别的概率值。

例如，该预置评价类别为：信用好类别和信用坏类别，则通过该训练后的第一神经网络对该待评价的用户进行信用评价，得到该待评价的用户属于信用好类别或信用坏类别的概率值。

S411：根据该概率值确定该待评价的用户所属的该预置评价类别。

举例说明：以该目标行为数据为支付行为数据为例，该预置评价类别包括：信用好类别和信用坏类别，且t_c＝0表示信用好的用户，t_c＝1表示信用坏的用户；若该训练后的第一神经网络输出y_c＝0，则该待评价的用户属于信用好的用户，即该待评价用户属于信用好类别。

由于随着时间的推移，用户的活跃量可能会发生大幅变化，若将输出具有样本分布不变性的特征的第一神经网络作为后续对待评价的用户进行评价的模型，这样可以有效地避免受到数据分布变化的干扰，提高了该模型输出的稳定性。

需要说明的是，本发明实施例中与第一实施例相同的描述，请参阅第一实施例相应的描述，此处不再赘述。

在本发明实施例中，通过两个神经网络进行对抗性训练，得到具有样本分布不变性的特征，并将输出具有样本分布不变性的特征的第一神经网络作为后续对待评价的用户进行评价的模型，这样不但可以确保特征不受数据分布的变化的干扰，并且相较于现有使用排序方法来提取特征，无需每次对新提取的特征重新排序，通过训练后的第一神经网络提取的特征均为具有样本分布不变性的特征，进而简化了提取特征的过程，缩短了运算时间，减少对运算资源的长时间的占用，同时能够提高该模型输出的稳定性。

请参阅图5，图5为本发明第三实施例提供的数据的特征提取装置的结构示意图，为了便于说明，仅示出了与本发明实施例相关的部分。图5示例的数据的特征提取装置可以是前述图3所示实施例提供的数据的特征提取方法的执行主体。图5示例的数据的特征提取装置，主要包括：提取单元501和训练单元502。以上各功能模块详细说明如下：

提取单元501，用于通过预置的第一神经网络提取各样本中的行为数据的特征，并将提取的特征输入至预置的第二神经网络中。

训练单元502，用于将该预置的第一神经网络和该预置的第二神经网络进行对抗性训练，以及，当训练后的第二神经网络输出属于预置数值范围的结果值时，停止训练，该结果值为该正确判别提取的特征的样本来源的概率值。

提取单元501，还用于通过训练后的第一神经网络提取目标行为数据的特征，该目标行为数据与该行为数据属于同一数据类别。

需要说明的是，该各样本的数量可以为两个。产生该目标行为数据和各样本中的行为数据的用户可以是相同的，也可以是不同的。该目标行为数据可以包括各样本中的该行为数据，也可以不包含该行为数据。

本实施例未尽之细节，请参阅前述图3所示实施例的描述，此处不再赘述。

本发明实施例中，数据的特征提取装置通过两个神经网络进行对抗性训练，得到具有样本分布不变性的特征，这样不但可以确保特征不受数据分布的变化的干扰，并且相较于现有排序的方法，无需每次对新提取的特征重新排序，通过训练后的第一神经网络提取的特征均为具有样本分布不变性的特征，进而简化了提取特征的过程，缩短了运算时间，减少对运算资源的长时间的占用。

请参阅图6，图6为本发明第四实施例提供的数据的特征提取装置的结构示意图，为了便于说明，仅示出了与本发明实施例相关的部分。图6示例的数据的特征提取装置可以是前述图3和图4所示实施例提供的数据的特征提取方法的执行主体。图6示例的数据的特征提取装置，主要包括：提取单元601、训练单元602和评价单元603，其中该提取单元601包括：获取子单元6011、选取子单元6012、提取子单元6013和输入子单元6014。以上各功能模块详细说明如下：

获取子单元6011，用于获取目标用户在各数据源上产生的同一数据类别的行为数据。

选取子单元6012，用于选取具有评价标签的目标用户对应的行为数据组成训练样本，并将选取后剩余的目标用户对应的行为数据组成测试样本。

提取子单元6013，用于通过该预置的第一神经网络从该训练样本或该测试样本中随机提取该行为数据的特征。

输入子单元6014，用于将提取的特征输入至预置的第二神经网络中。

该评价标签用于标识该目标用户所属的预置评价类别。

若获取的行为数据为社交行为数据，则该预置评价类别可以为用户活跃度评价类别，也可以是用户上网行为评价类别，如，上传不良文字、视频、或图片等多媒体文件的用户。同样地，也可以通过数量的统计来定义评价好与坏。

训练单元602，用于：

通过预置的第一代价函数，对该预置的第二神经网络进行训练，得到该训练后的第二神经网络，以使该训练后的第二神经网络正确判别该提取的特征属于所属样本的来源，该样本的来源中包括该训练样本或该测试样本，该第一代价函数L_{data_distribution}的公式为：

L_{data_distribution}＝-t_dlny_d-(1-t_d)ln(1-y_d)，

其中，t_d为提取的特征的标签，该标签用于标识提取的特征所属该样本的来源，y_d为该训练后的第二神经网络输出的结果值；

将该训练样本中的行为数据对应的特征输入至该预置的第一神经网络中；

通过预置的第二代价函数和预置的总代价函数，对该预置的第一神经网络进行训练，得到该训练后的第一神经网络，以使通过该训练后的第一神经网络提取的特征输入至该训练后的第二神经网络时，该训练后的第二神经网络输出的结果值属于该预置数值范围。

y_d为(0,1)之间的值，若t_d＝0标识提取的特征属于训练样本，t_d＝1标识提取的特征属于测试样本，且该训练后的第二神经网络输出的结果值为该提取的特征来源于该训练样本的概率值，则该训练后的第二神经网络输出的结果值越接近0，表示该提取的特征来源于该训练样本。由此说明，t_d的取值y_d的取值要相对应。

进一步地，训练单元602，还用于：

L_overall＝αL_{credit_scoring}-(1-α)L_{data_distribution}，

其中，α为平衡因子；

L_{credit_scoring}＝-t_clny_c-(1-t_c)ln(1-y_c)，

一般地，该预置评价种类的数量为两个。优选地，t_c为0或1的值，该预置评价类别为：第一评价类别和第二评价类别。若t_c＝0标识属于该第一评价类别的该目标用户，则t_c＝1标识该第二评价类别的该目标用户，反之，若t_c＝0标识该第二评价类别的该目标用户，则t_c＝1标识属于该第一评价类别的该目标用户。需要说明的是，t_c不限于取0或1的值，还可以取其他的不相同的两个数值，此处不做限定。

训练单元602，还用于当训练后的第二神经网络输出属于该预置数值范围的结果值时，停止训练。

选取子单元6012，还用于选取待评价的用户在各该数据源上产生的目标行为数据。

该待评价的用户产生的该目标行为数据与该目标用户产生的行为数据属于同一数据类别。若该目标用户产生的行为数据为支付行为数据，则该目标行为数据也是支付行为数据；若该目标用户产生的行为数据为社交行为数据，则该目标行为数据也是社交行为数据。

提取子单元6013，还用于通过该训练后的第一神经网络提取该目标行为数据的特征。

该目标行为数据与该行为数据属于同一数据类别。提取的该目标行为数据的特征均为具有样本分布不变性的特征。

评价单元603，用于通过该训练后的第一神经网络，根据该目标行为数据的特征对该待评价的用户进行评价，得到该预置评价类别中的一个评价类别的概率值。

评价单元603，还用于根据该概率值确定该待评价的用户所属的该预置评价类别。

本实施例未尽之细节，请参阅前述图3和图4所示实施例的描述，此处不再赘述。

本发明实施例中，数据的特征提取装置通过两个神经网络进行对抗性训练，得到具有样本分布不变性的特征，并将输出具有样本分布不变性的特征的第一神经网络作为后续对待评价的用户进行评价的模型，这样不但可以确保特征不受数据分布的变化的干扰，并且相较于现有使用排序方法来提取特征，无需每次对新提取的特征重新排序，通过训练后的第一神经网络提取的特征均为具有样本分布不变性的特征，进而简化了提取特征的过程，缩短了运算时间，减少对运算资源的长时间的占用，同时能够提高该模型输出的稳定性。

本发明第五实施例提供了一种计算机可读存储介质，该计算机可读存储介质存储有计算机可执行指令，该计算机可执行指令用于执行上述第一实施例或第二实施例提供的数据的特征提取方法。具体说明请详见上述本发明第一实施例和本发明第二实施例，此处不再赘述。

在本申请所提供的多个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个模块或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信链接可以是通过一些接口，装置或模块的间接耦合或通信链接，可以是电性，机械或其它的形式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理模块，即可以位于一个地方，或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能模块可以集成在一个处理模块中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。

需要说明的是，对于前述的各方法实施例，为了简便描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以采用其它顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定都是本发明所必须的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其它实施例的相关描述。

以上为对本发明实施例所提供的数据的特征提取方法、装置及计算机可读存储介质的描述，对于本领域的技术人员，依据本发明实施例的思想，在具体实施方式及应用范围上均会有改变之处，综上，本说明书内容不应理解为对本发明的限制。

Claims

1.一种数据的特征提取方法，其特征在于，包括：

通过预置的第一代价函数，对所述预置的第二神经网络进行训练，得到所述训练后的第二神经网络，以使所述训练后的第二神经网络正确判别所述提取的特征所属样本的来源，所述样本的来源中包括训练样本或测试样本；

将所述训练样本中的行为数据对应的特征输入至所述预置的第一神经网络中；

通过预置的第二代价函数和预置的总代价函数，对所述预置的第一神经网络进行训练，得到所述训练后的第一神经网络，以使通过所述训练后的第一神经网络提取的特征输入至所述训练后的第二神经网络时，所述训练后的第二神经网络输出的结果值属于预置数值范围；

当训练后的第二神经网络输出属于所述预置数值范围的结果值时，停止训练，所述结果值为正确判别所述提取的特征的样本来源的概率值；

2.根据权利要求1所述的方法，其特征在于，所述通过预置的第一神经网络提取各样本中的行为数据的特征，并将提取的特征输入至预置的第二神经网络中，包括：

获取目标用户在各数据源上产生的同一数据类别的行为数据；

选取具有评价标签的目标用户对应的行为数据组成训练样本，并将选取后剩余的目标用户对应的行为数据组成测试样本，所述评价标签用于标识所述目标用户所属的预置评价类别；

通过所述预置的第一神经网络从所述训练样本或所述测试样本中随机提取所述行为数据的特征，并将提取的特征输入至所述预置的第二神经网络中。

3.根据权利要求1所述的方法，其特征在于，所述通过预置的第一代价函数，对所述预置的第二神经网络进行训练，得到所述训练后的第二神经网络，包括：

通过预置的公式为L_{data_distribution}＝-t_dlny_d-(1-t_d)ln(1-y_d)的第一代价函数，对所述预置的第二神经网络进行训练，得到所述训练后的第二神经网络，

其中，t_d为提取的特征的标签，所述标签用于标识提取的特征所属所述样本的来源，y_d为所述训练后的第二神经网络输出的结果值。

4.根据权利要求1所述的方法，其特征在于，所述通过预置的第二代价函数和预置的总代价函数，对所述预置的第一神经网络进行训练，得到所述训练后的第一神经网络，以使通过所述训练后的第一神经网络提取的特征输入至所述训练后的第二神经网络时，所述训练后的第二神经网络输出的结果值属于预置数值范围，包括：

设置所述总代价函数中的所述第一代价函数为预置值，且所述第一代价函数中的y_d的数值属于所述预置数值范围内，所述总代价函数L_overall的公式为：

L_overall＝αL_{credit_scoring}-(1-α)L_{data_distribution}，

其中，α为平衡因子；

将所述第二代价函数代入至所述总代价函数中，并通过代入后的总代价函数，对所述预置的第一神经网络进行训练，得到所述训练后的第一神经网络，其中所述训练后的第一神经网络用于用户评价，所述第二代价函数L_{credit_scoring}的公式为：

L_{credit_scoring}＝-t_clny_c-(1-t_c)ln(1-y_c)，

其中，t_c为所述目标用户的所述评价标签，y_c为所述训练后的第一神经网络输出的结果值，所述训练后的第一神经网络输出的结果值为所述目标用户属于预置评价类别中的一个评价类别的概率值。

5.根据权利要求4所述的方法，其特征在于，所述通过训练后的第一神经网络提取目标行为数据的特征，包括：

选取待评价的用户在各所述数据源上产生的目标行为数据；

通过所述训练后的第一神经网络提取所述目标行为数据的特征；

则所述通过训练后的第一神经网络提取目标行为数据的特征之后，还包括：

通过所述训练后的第一神经网络，根据所述目标行为数据的特征对所述待评价的用户进行评价，得到所述预置评价类别中的一个评价类别的概率值；

根据所述概率值确定所述待评价的用户所属的所述预置评价类别。

6.一种数据的特征提取装置，其特征在于，所述装置包括：

训练单元，用于通过预置的第一代价函数，对所述预置的第二神经网络进行训练，得到所述训练后的第二神经网络，以使所述训练后的第二神经网络正确判别所述提取的特征所属样本的来源，所述样本的来源中包括训练样本或测试样本；

7.根据权利要求6所述的装置，其特征在于，所述提取单元包括：

获取子单元，用于获取目标用户在各数据源上产生的同一数据类别的行为数据；

选取子单元，用于选取具有评价标签的目标用户对应的行为数据组成训练样本，并将选取后剩余的目标用户对应的行为数据组成测试样本，所述评价标签用于标识所述目标用户所属的预置评价类别；

提取子单元，用于通过所述预置的第一神经网络从所述训练样本或所述测试样本中随机提取所述行为数据的特征；

输入子单元，用于将提取的特征输入至所述预置的第二神经网络中。

8.根据权利要求6所述的装置，其特征在于，所述训练单元，还用于：

9.根据权利要求6所述的装置，其特征在于，所述训练单元，还用于：

L_overall＝αL_{credit_scoring}-(1-α)L_{data_distribution}，

其中，α为平衡因子；

L_{credit_scoring}＝-t_clny_c-(1-t_c)ln(1-y_c)，

10.根据权利要求9所述的装置，其特征在于，所述提取单元包括：

选取子单元，用于选取待评价的用户在各所述数据源上产生的目标行为数据；

提取子单元，用于通过所述训练后的第一神经网络提取所述目标行为数据的特征；

所述装置还包括：评价单元；

所述评价单元，用于通过所述训练后的第一神经网络，根据所述目标行为数据的特征对所述待评价的用户进行评价，得到所述预置评价类别中的一个评价类别的概率值；

所述评价单元，还用于根据所述概率值确定所述待评价的用户所属的所述预置评价类别。

11.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机可执行指令，所述计算机可执行指令用于执行权利要求1至5任一项所述的数据的特征提取方法。