CN111275491B - 一种数据处理方法及装置 - Google Patents
一种数据处理方法及装置 Download PDFInfo
- Publication number
- CN111275491B CN111275491B CN202010071525.XA CN202010071525A CN111275491B CN 111275491 B CN111275491 B CN 111275491B CN 202010071525 A CN202010071525 A CN 202010071525A CN 111275491 B CN111275491 B CN 111275491B
- Authority
- CN
- China
- Prior art keywords
- behavior
- user
- data
- feature
- trained
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 16
- 230000006399 behavior Effects 0.000 claims abstract description 358
- 238000012549 training Methods 0.000 claims abstract description 109
- 238000009826 distribution Methods 0.000 claims abstract description 64
- 238000000034 method Methods 0.000 claims abstract description 54
- 238000012545 processing Methods 0.000 claims description 51
- 230000003993 interaction Effects 0.000 claims description 36
- 239000013598 vector Substances 0.000 claims description 33
- 238000003860 storage Methods 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 13
- 230000002452 interceptive effect Effects 0.000 claims description 12
- 230000008569 process Effects 0.000 abstract description 9
- 238000005516 engineering process Methods 0.000 abstract description 7
- 230000006870 function Effects 0.000 description 29
- 238000010586 diagram Methods 0.000 description 15
- 230000000694 effects Effects 0.000 description 13
- 238000005070 sampling Methods 0.000 description 8
- 230000009471 action Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000003068 static effect Effects 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000004075 alteration Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 239000002131 composite material Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及金融科技(Fintech)领域,公开一种数据处理方法及装置,用以解决现有技术无法训练得到通用的行为预测模型的问题,方法包括:参与方设备接收联邦服务器发送的模型训练请求,根据模型训练请求获取本地存储的用户行为数据,并按照预设特征分布规则处理用户行为数据得到与其他参与方设备特征分布一致的待训练数据集,通过各个参与方设备使用特征分布一致的待训练数据集训练得到模型结构一致的各个参与方模型,使得联邦服务器能够基于模型结构一致的各个参与方模型训练得到行为预测模型。由于行为预测模型结合了各个参与方设备的行为数据特征,因此能够用于预测各个参与方设备中的用户的行为,通用性较好,且准确率较高。
Description
技术领域
本发明涉及金融科技(Fintech)技术领域,尤其涉及一种数据处理方法及装置。
背景技术
随着计算机技术的发展,越来越多的技术应用在金融领域,传统金融业正在逐步向金融科技(Fintech)转变,然而,由于金融行业的安全性和实时性要求较高,因此也对金融科技领域的技术提出了更高的要求。在金融领域中,在推广用户之前通常需要对用户的行为进行预测,比如通过预测用户对某商品感兴趣的概率,能够预先将对该商品不感兴趣的用户排除,从而降低无用的推广操作,提高推广效率。
现阶段,各个参与方仅能使用本地存储的用户行为数据训练得到行为预测模型,然而,由于不同参与方中的用户不同,对象也不同,因此某一参与方训练的行为预测模型仅能适用于对本参与方中的用户的行为进行预测,而无法对其它参与方中的用户的行为进行预测,从而导致行为预测模型的通用性较差,预测的准确率较低。
发明内容
本发明提供一种数据处理方法及装置,用以训练得到通用的行为预测模型,以实现对各个参与方中的用户的行为进行预测,进而能够提升用户行为预测的准确率。
第一方面,本发明提供的一种数据处理方法,所述方法应用于参与方设备,所述方法包括:
接收联邦服务器发送的模型训练请求,根据所述模型训练请求获取本地存储的用户行为数据,按照预设特征分布规则对所述用户行为数据进行处理,得到与其他参与方设备特征分布一致的待训练数据集,利用所述待训练数据集训练得到参与方模型,并将所述参与方模型发送给所述联邦服务器,所述联邦服务器用于基于各个参与方模型联合训练得到行为预测模型。
在一种可能的实现方式中,所述预设特征分布规则为按照共用的用户行为特征维度和对象行为特征维度生成特征分布一致的待训练数据的规则;具体实施中,所述按照预设特征分布规则对所述用户行为数据进行处理,得到与其他参与方设备特征分布一致的训练数据集,包括:按照所述共用的用户行为特征维度,从所述用户行为数据中提取出任一用户的用户行为特征,按照所述共用的对象行为特征维度,从所述用户行为数据中提取出任一对象的对象行为特征,构建任一用户的用户行为特征和任一对象的对象行为特征之间的特征对,基于所述特征对,生成与其他参与方设备特征分布一致的待训练数据,基于各个用户与各个对象构成的各个特征对对应的待训练数据,构建所述待训练数据集。
在一种可能的实现方式中,所述按照所述共用的用户行为特征维度,从所述用户行为数据中提取出任一用户的用户行为特征包括:从所述用户行为数据中提取出所述用户在任一共用的用户行为特征维度下的特征值,根据所述用户在各个共用的用户行为特征维度下的特征值,构建得到所述用户的用户行为特征;相应地,所述按照所述共用的对象行为特征维度,从所述用户行为数据中提取出任一对象的对象行为特征,包括:从所述用户行为数据中提取出所述对象在任一共用的对象行为特征维度下的特征值,根据所述对象在各个共用的对象行为特征维度下的特征值,构建得到所述对象的对象行为特征。
在一种可能的实现方式中,所述基于所述特征对,生成与其他参与方设备特征分布一致的待训练数据,包括:按照共用的交互行为特征维度,从所述用户行为数据中提取出所述用户与所述对象的交互特征,根据所述用户与所述对象的交互特征,确定所述特征对对应的标签,将拼接所述用户的用户行为特征、所述对象的对象行为特征、所述交互特征及所述标签得到的特征向量作为所述特征对对应的待训练数据。
在一种可能的实现方式中,所述根据所述各个特征对对应的待训练数据,构建所述待训练数据集,包括:根据所述各个特征对对应的标签,确定属于正负样本的待训练数据的比例是否符合预设范围,若不符合预设范围,则对标签为负样本的待训练数据进行下采样,或者对标签为正样本的待训练数据进行上采样处理,若符合预设范围,则基于所述各个待训练数据构建所述待训练数据集。
在一种可能的实现方式中,所述将所述参与方模型发送给所述联邦服务器之后,还接收所述联邦服务器发送的所述行为预测模型,将待测特征对对应的特征信息输入所述行为预测模型中进行预测,得到所述待测特征对对应的预测标签;所述待测特征对对应的特征信息包括待测用户的用户行为特征、待测对象的对象行为特征和所述待测用户与所述待测对象的交互特征中的任意一项或任意多项;所述预测标签用于确定所述待测用户是否会对所述待测对象执行预设行为。
在一种可能的实现方式中,所述共用的用户行为特征维度包括用户执行预设行为的时间和/或用户在各时段内执行所述预设行为的次数;相应地,所述共用的对象行为特征维度包括对象被执行所述预设行为的时间和/或对象在各时段内被执行所述预设行为的次数。
在一种可能的实现方式中,所述交互行为特征维度包括用户对对象执行预设行为的时间和/或用户在各时段内对对象执行所述预设行为的次数。
第二方面,本发明提供的一种数据处理装置,所述装置包括:
收发模块,用于接收联邦服务器发送的模型训练请求;
获取模块,用于根据所述模型训练请求获取本地存储的用户行为数据;
处理模块,用于按照预设特征分布规则对所述用户行为数据进行处理,得到与其他参与方设备特征分布一致的待训练数据集;
训练模块,用于利用所述待训练数据集训练得到参与方模型,并将所述参与方模型发送给所述联邦服务器,所述联邦服务器用于基于各个参与方模型联合训练得到行为预测模型。
在一种可能的实现方式中,所述预设特征分布规则为按照共用的用户行为特征维度和对象行为特征维度生成特征分布一致的待训练数据的规则;具体实施中,所述处理模块具体用于:按照所述共用的用户行为特征维度,从所述用户行为数据中提取出任一用户的用户行为特征,按照所述共用的对象行为特征维度,从所述用户行为数据中提取出任一对象的对象行为特征,构建任一用户的用户行为特征和任一对象的对象行为特征之间的特征对,基于所述特征对,生成与其他参与方设备特征分布一致的待训练数据,基于各个用户与各个对象构成的各个特征对对应的待训练数据,构建所述待训练数据集。
在一种可能的实现方式中,所述处理模块具体用于:从所述用户行为数据中提取出所述用户在任一共用的用户行为特征维度下的特征值,根据所述用户在各个共用的用户行为特征维度下的特征值,构建得到所述用户的用户行为特征;以及,从所述用户行为数据中提取出所述对象在任一共用的对象行为特征维度下的特征值,根据所述对象在各个共用的对象行为特征维度下的特征值,构建得到所述对象的对象行为特征。
在一种可能的实现方式中,所述处理模块具体用于:按照共用的交互行为特征维度,从所述用户行为数据中提取出所述用户与所述对象的交互特征,根据所述用户与所述对象的交互特征,确定所述特征对对应的标签,将拼接所述用户的用户行为特征、所述对象的对象行为特征、所述交互特征及所述标签得到的特征向量作为所述特征对对应的待训练数据。
在一种可能的实现方式中,所述处理模块具体用于:根据所述各个特征对对应的标签,确定属于正负样本的待训练数据的比例是否符合预设范围,若不符合预设范围,则对标签为负样本的待训练数据进行下采样处理,或者对标签为正样本的待训练数据进行上采样处理,若符合预设范围,则基于所述各个待训练数据构建所述待训练数据集。
在一种可能的实现方式中,所述装置还包括预测模块;所述收发模块将所述参与方模型发送给所述联邦服务器之后,还用于:接收所述联邦服务器发送的所述行为预测模型;相应地,所述预测模块用于:将待测特征对对应的特征信息输入所述行为预测模型中进行预测,得到所述待测特征对对应的预测标签;所述待测特征对对应的特征信息包括待测用户的用户行为特征、待测对象的对象行为特征和所述待测用户与所述待测对象的交互特征中的任意一项或任意多项;所述预测标签用于确定所述待测用户是否会对所述待测对象执行预设行为。
在一种可能的实现方式中,所述共用的用户行为特征维度包括用户执行预设行为的时间和/或用户在各时段内执行所述预设行为的次数;相应地,所述共用的对象行为特征维度包括对象被执行所述预设行为的时间和/或对象在各时段内被执行所述预设行为的次数。
在一种可能的实现方式中,所述交互行为特征维度包括用户对对象执行预设行为的时间和/或用户在各时段内对对象执行所述预设行为的次数。
第三方面,本发明提供的一种计算设备,包括至少一个处理单元以及至少一个存储单元,其中,所述存储单元存储有计算机程序,当所述程序被所述处理单元执行时,使得所述处理单元执行上述第一方面任意所述的数据处理方法。
第四方面,本发明提供的一种计算机可读存储介质,其存储有可由计算设备执行的计算机程序,当所述程序在所述计算设备上运行时,使得所述计算设备执行上述第一方面任意所述的数据处理方法。
本发明提供的数据处理方法及装置,通过各个参与方设备按照预设特征分布规则对所述用户行为数据进行处理,得到与其他参与方设备特征分布一致的待训练数据集,使得各个参与方设备能够使用特征分布一致的待训练数据集训练得到模型结构一致的参与方模型,如此,联邦服务器能够基于各个参与方设备训练得到的模型结构一致的参与方模型训练得到行为预测模型,由于该行为预测模型结合了各个参与方设备的行为数据特征,因此能够用于对各个参与方设备中的用户的行为进行预测,行为预测模型的通用性较好,且还能够提升用户行为预测的准确率。
本发明的这些方面或其他方面在以下实施例的描述中会更加简明易懂。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种适用的系统架构示意图;
图2为本发明实施例中提供的一种数据处理方法的流程示意图;
图3为本发明实施例中提供的一种数据处理方式的执行流程示意图;
图4为本发明实施例提供的一种模型训练方法的交互流程示意图;
图5为本发明实施例提供的一种数据处理装置的结构示意图;
图6为本发明实施例提供的一种前端设备的结构示意图;
图7为本发明实施例提供的一种后端设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
图1为本发明实施例提供的一种适用的系统架构示意图,如图1所示,该系统架构中可以包括联邦服务器110和至少两个参与方设备,比如参与方设备121、参与方设备122和参与方设备123。其中,联邦服务器110可以与每个参与方设备连接,比如可以通过有线方式连接,也可以通过无线方式连接,具体不作限定。
基于图1所示意的系统架构,图2为本发明实施例提供的一种数据处理方法对应的流程示意图,该方法可以应用于任一参与方设备,比如参与方设备121、参与方设备122或参与方设备123,具体不作限定。
如图2所示,该方法包括:
步骤201,接收联邦服务器发送的模型训练请求。
步骤202,根据所述模型训练请求获取本地存储的用户行为数据。
步骤203,按照预设特征分布规则对所述用户行为数据进行处理,得到与其他参与方设备特征分布一致的待训练数据集。
步骤204,利用所述待训练数据集训练得到参与方模型,并将所述参与方模型发送给所述联邦服务器,所述联邦服务器用于基于各个参与方模型联合训练得到行为预测模型。
本发明的上述实施例中,通过各个参与方设备按照预设特征分布规则对所述用户行为数据进行处理,得到与其他参与方设备特征分布一致的待训练数据集,使得各个参与方设备能够使用特征分布一致的待训练数据集训练得到模型结构一致的参与方模型,如此,联邦服务器能够基于各个参与方设备训练得到的模型结构一致的参与方模型训练得到行为预测模型,由于该行为预测模型结合了各个参与方设备的行为数据特征,因此能够用于对各个参与方设备中的用户的行为进行预测,行为预测模型的通用性较好。
在步骤203中,预设特征分布规则可以存在多种可能,比如:
可能一
在可能一中,预设特征分布规则可以设置为:联邦服务器110先统计各个参与方设备中的全部用户和全部对象,再使用one-hot算法对全部用户进行编码,将全部用户映射到第一向量空间,使用one-hot算法对全部对象进行编码,将全部对象映射到第二向量空间,进一步地,联邦服务器110将第一向量空间和第二向量空间同步给各个参与方设备,以使各个参与方设备利用本地用户在第一向量空间中的映射值和本地对象在第二向量空间中的映射值构建参与方设备的待训练数据集。
举例来说,当用户行为数据为门禁数据时,若参与方设备A的用户包括用户1和用户2,参与方设备A的对象包括门1和门2,参与方设备B的用户包括用户3和用户4,参与方设备B的对象包括门3和门4,联邦服务器110通过one-hot算法将全部用户映射到第一向量空间[0 0 0 0](第一向量空间中的各个向量位依次对应用户1、用户2、用户3和用户4)中,将全部对象映射到第二向量空间[0 0 0 0](第二向量空间中的各个向量位依次对应门1、门2、门3和门4)中,则当用户1在门1处刷卡、用户2未刷卡、用户3在门4处刷卡、用户4未刷卡时,参与方设备A构建得到的待训练数据集包括待训练数据[1 0 00 1 0 0 0]和待训练数据[0 1 0 0 0 0 0 0],参与方设备B构建得到的待训练数据集包括待训练数据[0 0 1 0 00 0 1]和待训练数据[0 0 0 1 0 0 1 0]。
由此可知,通过设置可能一中的预设特征分布规则,使得各个参与方设备中的待训练数据集能够具有相同的特征分布。然而,可能一将各个参与方设备的全部用户和全部对象映射到对应的向量空间,而不同参与方设备的待训练数据通常集中分布在各自对应的映射值范围内,比如参与方设备A的待训练数据集中在第1位、第2位和第5位,而第3位、第4位、第6位和第7位均为零,参与方设备B的待训练数据集中在第3位、第4位、第6位和第7位,而第1位、第2位和第5位均为零。因此,采用可能一会使得参与方设备的待训练数据集中包含较多的无意义数据,当使用该种形式的待训练数据集进行模型训练时,这些无意义的数据可能会对模型训练产生噪声影响,导致模型训练的效果较差;且,这些无意义的数据还会增加模型训练时间,导致系统的性能损耗较大,模型训练的效率较差。
可能二
在可能二中,为了解决可能一存在的上述问题,预设特征分布规则可以设置为:联邦服务器110使用embedding算法对每个参与方设备中的用户进行编码,以将每个参与方设备中的用户映射到各个参与方设备对应的第一公共向量空间,并使用embedding算法对每个参与方设备中的对象进行编码,以将每个参与方设备中的对象映射到各个参与方设备对应的第二公共向量空间;进一步地,联邦服务器110将第一向量空间和第二向量空间同步给各个参与方设备,以使各个参与方设备基于相同的第一公共向量空间和第二公共向量空间构建待训练数据集。
举例来说,当用户行为特征为门禁数据时,若参与方设备A的用户包括用户1和用户2,参与方设备A的对象包括门1和门2,参与方设备B的用户包括用户3和用户4,参与方设备B的对象包括门3和门4,联邦服务器110通过one-hot算法将参与方设备A的用户1和用户2(或者参与方设备B的用户3和用户4)映射到第一公共向量空间[0 0]中,将参与方设备A的对象门1和门2(或者参与方设备B的门3和门4)映射到第二公共向量空间[0 0]中。其中,第一公共向量空间的第1位在参与方设备A中用于标识用户1,在参与方设备B中用于标识用户3,第一公共向量空间的第2位在参与方设备A中用于标识用户2,在参与方设备B中用于标识用户4;相应地,第二公共向量空间的第1位在参与方设备A中用于标识门1,在参与方设备B中用于标识门3,第二公共向量空间的第2位在参与方设备A中用于标识门2,在参与方设备B中用于标识门4。如此,若用户1在门1处刷卡,用户2未刷卡,用户3在门4处刷卡,用户4未刷卡,则参与方设备A构建得到的待训练数据集中包括待训练数据[1 0 1 0]和待训练数据[01 0 0],参与方设备B构建得到的待训练数据集中包括待训练数据[1 0 0 1]和待训练数据[0 1 1 0]。
由此可知,通过设置可能二中的预设特征分布规则,使得各个参与方设备中的待训练数据集能够具有相同的特征分布,且各个参与方设备的待训练数据中基本不包含无意义的数据,因此可以降低样本数据的数据量,提高模型训练的效率。然而,由于可能二将各个参与方设备的用户和对象分别映射到同一公共向量空间中,因此不同参与方设备的待训练数据中的相同位在不同参与方设备中表示不同的含义,如此,若使用具有相同形式但含义不同的待训练数据进行模型训练,会使得联邦服务器110无法提取出不同参与方设备的用户特征以及对象特征,导致模型的效果较差,可能会增大预测的误判概率。
基于此,本发明实施例提供了一种可能的数据处理方式,在该数据处理方式中,预设特征分布规则设置为各个参与方设备按照共用的用户行为特征维度和对象行为特征维度生成特征分布一致的待训练数据的规则。
图3为利用该预设特征分布规则处理得到待训练数据集的执行流程示意图,该方法包括:
步骤301,按照共用的用户行为特征维度,从用户行为数据中提取出任一用户的用户行为特征。
本发明实施例中,用户行为数据可以包括设定时段内参与方设备中的每个用户对一个或多个对象执行预设行为的行为数据。举例来说,若用户行为数据为社区门禁数据,设定时段为10月上旬,参与方设备为社区A,则参与方设备的用户行为数据中可以包括社区A中的每个用户在10月上旬时在小区A的每个门处的刷卡数据,比如,若小区A中设置有门1和门2,则参与方设备的用户行为数据可以包括用户在门1处刷卡的日期和时间、用户在门2处刷卡的日期和时间;在该示例中,预设行为是指刷卡行为,一个或多个对象是指小区A中的门1和门2。再举一个例子,若用户行为数据为电商平台数据,参与方设备为书商C,设定时段为10月上旬,则参与方设备的用户行为数据中可以包括书商C的每个用户10月上旬时在书商C的平台上购买书的消费数据,比如,若书商C的平台上发布有书1和书2,则参与方设备的用户行为数据可以包括用户购买书1的日期和时间、用户购买书2的日期和时间;在该示例中,预设行为是指购买行为,一个或多个对象是指书商C的平台上发布的书1和书2。
具体实施中,参与方设备可以按照共用的用户行为特征维度,从用户行为数据中提取出任一用户在任一共用的用户行为特征维度下的特征值,然后再根据该用户在各个共用的用户行为特征维度下的特征值,构建得到该用户的用户行为特征。其中,共用的用户行为特征维度用于指示用户对各个对象的执行情况,共用的用户行为特征维度可以包括用户执行预设行为的时间和/或用户在各时段内执行所述预设行为的次数,比如可以包括设定时段内用户每次执行预设行为的时间、设定时段内用户执行预设行为的总次数、设定时段的每个时间间隔内用户执行预设行为的次数,等等。
举例来说,若用户行为数据包括社区A中的每个用户在10月上旬时在小区A的门1、门2处的刷卡数据,则任一用户的用户行为特征可以包括10月上旬时该用户每次在门1或门2处刷卡的时间、10月上旬时该用户在门1和门2处刷卡的总次数、10月上旬的每周内该用户在门1和门2处刷卡的次数、10月上旬的每天内该用户在门1和门2处刷卡的次数等。
在一个示例中,为了简化待训练数据集的数据量,并提高用户行为特征的时效性,共用的用户行为特征维度可以设置为包括用户最近一次执行预设行为的时间、用户最近一天执行预设行为的次数、用户最近一周执行预设行为的次数中的任意一项或任意多项。可以理解的,该示例中的时间信息(即最近一次、最近一天和最近一周)可以由本领域技术人员根据经验进行设置,比如若时间信息为最近五次、最近两天、最近两周,则共用的用户行为特征维度为用户最近五次执行预设行为的时间、用户最近两天执行预设行为的次数、用户最近两周执行预设行为的次数。
步骤302,按照共用的对象行为特征维度,从用户行为数据中提取出任一对象的对象行为特征。
具体实施中,参与方设备可以按照共用的对象行为特征维度,从用户行为数据中提取出任一对象在任一共用的对象行为特征维度下的特征值,然后再根据该对象在各个共用的对象行为特征维度下的特征值,构建得到该对象的对象行为特征。其中,共用的对象行为特征维度用于指示对象的被执行情况,共用的对象行为特征维度可以包括对象被执行预设行为的时间和/或对象在各时段内被执行预设行为的次数,比如可以包括设定时段内对象被执行预设行为的时间、设定时段内对象被执行预设行为的总次数、设定时段的每个时间间隔内对象被执行预设行为的次数,等等。
举例来说,若用户行为数据包括社区A中的每个用户在10月上旬时在小区A的门1、门2处的刷卡数据,对象为门1,则该对象的对象行为特征可以包括10月上旬时门1被刷卡的时间、10月上旬时门1被刷卡的总次数、10月上旬的每周内门1被刷卡的次数、10月上旬的每天内门1被刷卡的次数等。
在一个示例中,为了简化待训练数据集的数据量,提高对象行为特征的时效性,共用的对象行为特征特为可以设置为包括对象最近一次被执行预设行为的时间、对象最近一天被执行预设行为的次数、对象最近一周被执行预设行为的次数中的任意一项或任意多项。可以理解的,该示例中的时间信息(即最近一次、最近一天和最近一周)可以由本领域技术人员根据经验进行设置,比如若时间信息为最近三次、最近三天、最近两周,则共用的对象行为特征可以为对象最近三次被执行预设行为的时间、对象最近三天被执行预设行为的次数、对象最近两周被执行预设行为的次数。
步骤303,构建任一用户的用户行为特征和任一对象的对象行为特征之间的特征对,基于所述特征对,生成与其他参与方设备特征分布一致的待训练数据。
具体实施中,参与方设备可以先统计得到参与方设备中的全部用户和全部对象,然后针对任一用户和任一对象建立一个特征对,如此,参与方设备中的每个用户可以对应多个特征对,且参与方设备中的每个对象也可以对应多个特征对。举例来说,当小区A中的用户包括用户1和用户2,对象包括门1和门2时,参与方设备可以根据小区A中的全部用户和全部对象构建四个特征对,分别为:user1-item1特征对、user1-item2特征对、user2-item1特征对、user2-item2特征对;其中,user1是指用户1,user2是指用户2,item1是指对象1,item2是指对象2。
本发明实施例中,通过为每个用户和每个对象设置一个特征对,能够使得每个用户和每个对象对应一个待训练数据,相比于现有技术直接使用每个用户的行为数据和每个对象的行为数据训练模型来说,可以降低待训练数据集的数据量,提高模型训练的效率。
在一个示例中,针对于任一特征对,参与方设备还可以按照共用的交互行为特征维度,从用户行为数据中提取出该特征对中的用户与该特征对中的对象的交互特征。其中,共用的交互行为特征维度用于指示用户对对象的执行情况,交互行为特征维度可以包括用户对对象执行预设行为的时间和/或用户在各时段内对对象执行所述预设行为的次数,比如可以包括设定时段内用户对对象执行预设行为的时间、设定时段内用户对对象执行预设行为的总次数、设定时段的每个时间间隔内用户对对象执行预设行为的次数,等等。
举例来说,若用户行为数据包括社区A中的每个用户在10月上旬时在小区A的门1、门2处的刷卡数据,特征对中的用户和对象分别为用户1和门1,则交互特征可以包括10月上旬时用户在门1处刷卡的时间、10月上旬时用户在门1处刷卡的总次数、10月上旬的每周内用户在门1处刷卡的次数、10月上旬的每天内用户在门1处刷卡的次数等。
在一个示例中,为了简化待训练数据集的数据量,提高交互特征的时效性,共用的交互特征维度可以设置为如下任意一项或任意多项:用户最近一次对对象执行预设行为的时间、用户最近一周对对象执行预设行为的次数、用户对对象执行预设行为的次数在所有用户中的排名。可以理解的,该示例中的时间信息(即最近一次、最近一周)可以由本领域技术人员根据经验进行设置,比如若时间信息为最近三次、最近两周,则共用的交互特征维度也可以为用户最近三次对对象执行预设行为的时间、用户最近两周对对象执行预设行为的次数、用户对对象执行预设行为的次数在所有用户中的排名。
本发明实施例中,参与方设备可以采用监督式的机器学习算法执行模型训练,在监督式的机器学习算法中,每条待训练数据还需要设置对应的标签,标签可以根据行为预测模型的预测功能来设置,待训练数据对应的标签用于指示特征对中的用户和对象是否在设定时段内实现了行为预测模型的功能。
在一个示例中,参与方设备还可以根据交互特征确定特征对对应的标签,比如若行为预测模型的功能为预测用户对对象刷卡的次数,则特征对对应的标签可以设置为设定时段内特征对中的用户对特征对中的对象刷卡的次数,若行为预测模型的功能为预测用户在某一时刻是否会在对象处刷卡,则特征对对应的标签可以基于设定时段的该时刻时特征对中的用户是否在特征对中的对象处刷卡来设置,比如若该时刻时特征对中的用户在特征对中的对象处刷卡,则可以设置特征对对应的标签为第一标签,若该时刻时特征对中的用户未在特征对中的对象处刷卡,则可以设置特征对对应的标签为第二标签。
其中,第一标签和第二标签可以由本领域技术人员根据经验进行设置,比如第一标签可以设置为1,第二标签可以设置为0,或者第一标签可以设置为0,第二标签可以设置为1,具体不作限定。举例来说,若行为预测模型用于预测用户在未来时段的某一天是否会对某一对象执行预设行为,则当该特征对中的用户在设定时段(与未来时段时长相同)的某一天(与未来时段的某一天对应)对对象执行了预设行为时,该特征对对应的标签可以为第一标签,当该特征对中的用户在设定时段的某一天没有对对象执行预设行为时,该特征对对应的标签可以为第二标签;或者,若行为预测模型用于预测用户在某一时刻对对象执行预设行为,则当该特征对中的用户在设定时段的该时刻对对象执行了预设行为时,特征对对应的标签可以为第一标签,当该特征对中的用户在设定时段的该时刻没有对对象执行预设行为时,该特征对对应的标签可以为第二标签。
或者,特征对对应的标签也可以由特征向量来表示,比如,特征对对应的标签可以为基于设定时段的某一子时段内的用户行为数据提取得到的用户行为特征、对象行为特征和交互特征拼接得到的特征向量。举例来说,设定时段为第1天至第7天,若根据第1天至第7天的用户行为数据提取得到用户1刷卡的用户行为特征、门1被刷卡的对象行为特征和用户1在门1处刷卡的交互特征,则还可以根据第8天的用户行为数据提取得到第8天中用户1在门1处刷卡的交互特征,然后将拼接第8天的交互特征作为特征对对应的标签。
本发明实施例中,通过提取特征对对应的标签,使得参与方设备能够基于监督式的机器学习算法实现模型训练,且行为预测模型更有针对性,预测效果较好。
进一步地,针对于任一特征对,参与方设备还可以对该特征对中的用户的用户行为特征、对象的对象行为特征、交互特征以及标签进行拼接,并将拼接得到的特征向量作为特征对对应的待训练数据。其中,拼接的顺序不作限定,比如可以按照用户的用户行为特征、对象的对象行为特征、交互特征、标签的顺序依次拼接,也可以按照对象的对象行为特征、用户的用户行为特征、交互特征、标签的顺序依次拼接,还可以按照交互特征、对象的对象行为特征、用户的用户行为特征、标签的顺序依次拼接,等等。
本发明实施例中,通过将用户执行预设行为的执行情况作为用户行为特征,将对象被执行预设行为的执行情况作为对象行为特征,将用户对对象执行行为的执行情况作为交互特征,可以使得不同参与方设备中用户的用户行为特征具有同一表达形式,不同参与方设备中对象的对象行为特征具有同一表达形式,不同参与方设备中用户与对象的交互特征也具有同一表达形式。如此,不同参与方设备可以根据与其他参与方设备具有同一表达形式的用户行为特征、与其他参与方设备具有同一表达形式的对象行为特征、与其他参与方设备具有同一表达形式的交互和标签构建特征分布一致的待训练数据。由于各个参与方设备的待训练数据具有相同的数据分布,且特征维度相同,因此不同参与方设备能够基于特征分布一致的待训练数据训练得到模型结构相同的参与方模型。
步骤304,基于各个用户与各个对象构成的各个特征对对应的待训练数据,构建所述待训练数据集。
本发明实施例中,每个待训练数据对应的标签可以指示该待训练数据为正样本数据还是负样本数据,比如当待训练数据对应的标签为第一标签时,待训练数据为正样本数据,当待训练数据对应的标签为第二标签时,待训练数据为负样本数据;或者,当待训练数据的标签指示在设定时段内实现了行为预测模型的功能时,待训练数据为正样本数据,当待训练数据中的标签指示在设定时段内未能实现行为预测模型的功能时,待训练数据为负样本数据。
在一种可能的场景中,由于用户具有惯性思维,因此用户可能会经常对某一对象执行预设行为,而很少对其它的对象执行预设行为,如此,参与方设备构建得到的各个待训练数据中会包含较少的正样本数据和较多的负样本数据。比如若小区中的门较多,而用户习惯性地在小区的某一个门处刷卡,而很少在其它门处刷卡,因此在基于用户与小区中的各个门构建得到各个待训练数据后,各个待训练数据中的正样本数据的数量很少,而负样本数据的数量很多。如此,若参与方设备直接使用各个待训练数据进行模型训练,则数量较多的负样本数据可能会带偏模型参数,导致训练出的行为预测模型无法准确预测用户对对象执行预设行为的可能性,行为预测模型的效果较差。
为了解决上述问题,在一种可能的实现方式中,参与方设备在基于参与方设备中的全部用户与全部对象构建得到各个待训练数据后,可以先根据各个特征对对应的标签,确定出待训练数据集中的正样本数据和负样本数据,然后判断属于正负样本的待训练数据的比例是否符合预设范围,若不符合预设范围,则可以对负样本数据进行下采样处理,或者可以对正样本数据进行上采样处理,比如采用下采样方法来减少负样本数据的数量和权重,或者使用上采样方法来增多待训练数据中正样本数据的数量或权重;相应地,若符合预设范围,则可以基于各个待训练数据构建待训练数据集。
下面分别介绍几种可能的上采样方法和下采样方法。
上采样方法一:参与方设备可以先从全部用户与全部对象对应的待训练数据中获取全部或部分正样本数据,然后对这全部或部分正样本数据进行复制,以通过复制的方式增多待训练数据中正样本数据的数量。
上采样方法二:参与方设备可以先从全部用户与全部对象对应的待训练数据中获取全部的正样本数据,然后每次从全部的正样本数据(或上次选取遗留的正样本数据)中选取至少两个正样本数据,拼接至少两个正样本数据中的不同部分得到一个新的正样本数据。比如,若选取了两个正样本数据,则可以将第一个正样本数据的前半部分和第二个正样本数据的后半部分拼接为一个新的正样本数据,或者可以将第一个正样本数据的后1/3部分和第二个正样本数据的前2/3部分拼接为一个新的正样本数据,具体不作限定。
上采样方法三:参与方设备可以先从全部用户与全部对象对应的待训练数据中获取全部或部分正样本数据,然后增大其中每个正样本数据在损失函数中的权重,不同正样本数据被增大的权重可以相同,也可以不同,不作限定。如此,参与方设备在使用正样本数据和负样本数据训练模型时,由于这些正样本数据的权重较大,因此可以降低负样本数据带偏模型参数的能力,降低模型训练的偏差,提高模型的效果。
下采样方法一:参与方设备可以先从全部用户与全部对象对应的待训练数据中获取全部的负样本数据,然后随机从全部的负样本数据中选取部分负样本数据进行删除,以通过随机删除的方式减少待训练数据中负样本数据的数量。
下采样方法二:参与方设备可以先从全部用户与全部对象对应的待训练数据中获取全部的负样本数据,然后计算得到每个负样本数据与其它负样本数据的相似度,若相似度小于预设相似度阈值,则删除该负样本数据,若相似度大于或等于预设相似度阈值,则保留该负样本数据。通过将与其它负样本数据的相似度较小的负样本删除,可以基于较为相似的负样本数据执行模型训练,从而提高行为预测模型识别不同待预测数据的能力,提高预测效果。
具体实施中,针对于任一负样本数据,参与方设备可以先计算该负样本数据与任一其它负样本数据的相似度,然后将该负样本数据与所有其它负待训练数据的相似度的平均值或加权平均值作为该负样本数据与其它负样本数据的相似度。
下采样方法三:参与方设备可以先从全部用户与全部对象对应的待训练数据中获取全部或部分负样本数据,然后减小其中每个负样本数据在损失函数中的权重,不同负样本数据被减小的权重可以相同,也可以不同,不作限定。如此,参与方设备在使用正样本数据和负样本数据训练模型时,由于这些负样本数据的权重较小,因此可以降低负样本数据带偏模型参数的能力,降低模型训练的偏差,提高模型的效果。
本发明实施例中,通过实验发现,若采用上采样方法一中的复制方式和/或上采样方法二中的拼接方式增加正样本数据的数量,或者,若采用下采样方法一中的删除方式和/或下采样方法二中的相似度删除方式降低负样本数据的数量,则在将待训练数据中正样本数据和负样本数据的数量比例调整至1:3时,模型训练的效果较好。相应地,若采用上采样方法三中的加权方式增加正样本数据的权重,或者,若采用下采样方法三中的降权方式降低负样本数据的权重,则在将待训练数据中正样本数据的权重和负样本数据的权重比例调整至20:1时,模型训练的效果较好。
在步骤204中,参与方设备可以先将全部的待训练数据划分为训练数据、验证数据和测试数据,训练数据用于参与方设备训练得到参与方模型,验证数据用于参与方设备验证参与方模型的效果,测试数据用于在模型训练结束后,联邦服务器110验证行为预测模型的效果。
具体实施中,参与方设备可以将训练得到的参与方模型的模型参数上报给联邦服务器110,参与方模型的模型参数用于联邦服务器110根据各个参与方模型的模型参数得到综合模型参数,若确定满足模型训练的结束条件,则根据综合模型参数得到行为预测模型,若确定不满足模型训练的结束条件,则将综合模型参数下发给各个参与方设备,以联合各个参与方设备循环执行步骤201~步骤204。
作为一种示例,参与方设备可以仅将参与方模型的模型参数上报给联邦服务器110,如此,在接收到各个参与方模型的模型参数后,联邦服务器110可以基于各个模型参数计算得到平均模型参数,并可以将平均模型参数确定为本次训练的综合模型参数。
作为另一种示例,参与方设备可以同时将参与方模型的模型参数和损失函数发送给联邦服务器110,如此,联邦服务器110在接收到各个模型参数和损失函数后,可以先根据各个损失函数确定各个模型参数的权重,再使用加权平均的方式对各个模型参数进行计算,得到综合模型参数。其中,若模型参数对应的损失函数越小,说明参与方模型的效果越好,因此可以为该模型参数分配较大的权重,相应地,若模型参数对应的损失函数越大,说明参与方模型的效果越差,因此可以为该模型参数分配较小的权重。
具体实施中,可以先按照由小到大的顺序对各个损失函数进行排序,若损失函数的排序越靠后,则可以设置该损失函数对应的模型参数的权重越小,若损失函数的排序越靠前,则可以设置该损失函数对应的模型参数的权重越大。举例来说,若参与方设备121~参与方设备123的损失函数分别为0.05、0.30、0.15,说明参与方设备121~参与方设备123对应的参与方模型的效果排名为:参与方设备122对应的参与方模型>参与方设备123对应的参与方模型>参与方设备121对应的参与方模型,因此,联邦服务器110可以设置参与方设备121~参与方设备123对应的模型参数的权重分别为10%、60%、30%。
本发明实施例中,模型训练的结束条件可以包括以下任意一项或任意多项:本次训练的综合模型参数收敛、已执行训练的次数大于或等于预设次数、已执行训练的时长大于或等于预设训练时长,具体可以由本领域技术人员根据经验进行设置,具体不作限定。
具体实施中,若模型训练的结束条件为已执行训练的次数大于或等于5次,则当参与方设备依次训练了5次参与方模型(即第5次训练结束)后,联邦服务器110可以确定第5次训练满足模型训练的结束条件;或者,若模型训练的结束条件为已执行训练的时长大于或等于5分钟,则从联邦服务器110下发模型训练请求开始至执行到第5分钟时(若此时正在执行第3次训练),联邦服务器110可以确定第3次训练满足模型训练的结束条件。
相应的,若模型训练的结束条件为本次训练的综合模型参数收敛,则针对于本次训练,联邦服务器110还可以根据本次训练中各参与方设备发送的损失函数计算得到本次训练的综合损失函数,若确定本次训练的综合损失函数处于收敛状态(比如本次训练的综合损失函数小于或等于某一阈值),则可以确定本次训练满足模型训练的结束条件,否则确定本次训练不满足模型训练的结束条件。
进一步地,若本次训练满足模型训练的结束条件,则联邦服务器110可以使用本次训练的综合模型参数构建得到行为预测模型,若本次训练不满足模型训练的结束条件,则联邦服务器110可以将本次训练的综合模型参数下发给各个参与方设备,以使各个参与方设备基于本次训练的综合模型参数,使用各个参与方设备的待训练数据集重新执行下一次训练,直至满足模型训练的结束条件为止。
在一个示例中,联邦服务器110构建得到行为预测模型后,还可以将行为预测模型下发给各个参与方设备,如此,任一参与方设备接收到行为预测模型后,可以将待测特征对对应的特征信息输入行为预测模型中进行预测,得到待测特征对对应的预测标签。其中,待测特征对对应的特征信息可以包括待测用户的用户行为特征、待测对象的对象行为特征和待测用户与待测对象的交互特征中的任意一项或任意多项,预测标签用于确定待测用户是否会对待测对象执行预设行为。
本发明实施例中,通过联合各个参与方设备中的用户行为数据构建得到行为预测模型,使得行为预测模型能够用于对任一参与方设备中的用户的行为进行预测,行为预测模型具有较好的通用性。
下面从联邦服务器与各个参与方设备的交互角度描述本发明实施例中的数据处理方法。
图4为本发明实施例提供的一种模型训练的整体流程示意图,该方法包括:
步骤401,联邦服务器110向各个参与方设备下发模型训练请求,模型训练请求中携带有初始模型参数。
步骤402,任一参与方设备接收到联邦服务器下发的模型训练请求后,获取本地存储的用户行为数据,按照预设特征分布规则对用户行为数据进行处理,得到与其他参与方设备特征分布一致的待训练数据集。
步骤403,任一参与方设备基于初始模型参数,利用待训练数据集训练得到与其他参与方设备模型结构一致的参与方模型。
步骤404,任一参与方设备将参与方模型的模型参数上报给联邦服务器。
步骤405,联邦服务器接收到各个参与方设备上报的参与方模型的模型参数后,根据各个参与方模型的模型参数得到综合模型参数。
步骤406,联邦服务器确定是否满足模型训练的结束条件,若是,则执行步骤407,若否,则执行步骤408。
步骤407,联邦服务器根据综合模型参数构建得到行为预测模型。
步骤408,联邦服务器将综合模型参数下发给各个参与方设备。
步骤409,任一参与方设备接收到联邦服务器下发的综合模型参数后,使用综合模型参数更新本地存储的初始模型参数,并执行步骤403。
本发明的上述实施例中,参与方设备接收联邦服务器发送的模型训练请求,根据所述模型训练请求获取本地存储的用户行为数据,按照预设特征分布规则对所述用户行为数据进行处理,得到与其他参与方设备特征分布一致的待训练数据集,利用所述待训练数据集训练得到参与方设备模型,并将所述参与方设备模型发送给所述联邦服务器,以便于所述联邦服务器基于各个参与方设备模型联合训练得到行为预测模型。本发明实施例中,通过各个参与方设备按照预设特征分布规则对所述用户行为数据进行处理,得到与其他参与方设备特征分布一致的待训练数据集,使得各个参与方设备能够使用特征分布一致的待训练数据集训练得到模型结构一致的参与方设备模型,如此,联邦服务器能够基于各个参与方设备训练得到的模型结构一致的参与方设备模型训练得到行为预测模型,由于该行为预测模型结合了各个参与方设备的行为数据特征,因此能够用于对各个参与方设备中的用户的行为进行预测,行为预测模型的通用性较好。
针对上述方法流程,本发明实施例还提供一种数据处理装置,该装置的具体内容可以参照上述方法实施。
图5为本发明实施例提供的一种数据处理装置的结构示意图,包括:
收发模块501,用于接收联邦服务器发送的模型训练请求;
获取模块502,用于根据所述模型训练请求获取本地存储的用户行为数据;
处理模块503,用于按照预设特征分布规则对所述用户行为数据进行处理,得到与其他参与方设备特征分布一致的待训练数据集;
训练模块504,用于利用所述待训练数据集训练得到参与方模型,并将所述参与方模型发送给所述联邦服务器,所述联邦服务器用于基于各个参与方模型联合训练得到行为预测模型。
可选地,所述预设特征分布规则为按照共用的用户行为特征维度和对象行为特征维度生成特征分布一致的待训练数据的规则;
所述处理模块503具体用于:
按照所述共用的用户行为特征维度,从所述用户行为数据中提取出任一用户的用户行为特征;
按照所述共用的对象行为特征维度,从所述用户行为数据中提取出任一对象的对象行为特征;
构建任一用户的用户行为特征和任一对象的对象行为特征之间的特征对,基于所述特征对,生成与其他参与方设备特征分布一致的待训练数据;
基于各个用户与各个对象构成的各个特征对对应的待训练数据,构建所述待训练数据集。
可选地,所述处理模块503具体用于:
从所述用户行为数据中提取出所述用户在任一共用的用户行为特征维度下的特征值,根据所述用户在各个共用的用户行为特征维度下的特征值,构建得到所述用户的用户行为特征;以及,
从所述用户行为数据中提取出所述对象在任一共用的对象行为特征维度下的特征值,根据所述对象在各个共用的对象行为特征维度下的特征值,构建得到所述对象的对象行为特征。
可选地,所述处理模块503具体用于:
按照共用的交互行为特征维度,从所述用户行为数据中提取出所述用户与所述对象的交互特征;
根据所述用户与所述对象的交互特征,确定所述特征对对应的标签;
将拼接所述用户的用户行为特征、所述对象的对象行为特征、所述交互特征及所述标签得到的特征向量作为所述特征对对应的待训练数据。
可选地,所述处理模块503具体用于:
根据所述各个特征对对应的标签,确定属于正负样本的待训练数据的比例是否符合预设范围;
若不符合预设范围,则对标签为负样本的待训练数据进行下采样处理,或者对标签为正样本的待训练数据进行上采样处理;若符合预设范围,则基于所述各个待训练数据构建所述待训练数据集。
可选地,所述装置还包括预测模块505;
所述收发模块501将所述参与方模型发送给所述联邦服务器之后,还用于:接收所述联邦服务器发送的所述行为预测模型;
所述预测模块505用于:将待测特征对对应的特征信息输入所述行为预测模型中进行预测,得到所述待测特征对对应的预测标签;所述待测特征对对应的特征信息包括待测用户的用户行为特征、待测对象的对象行为特征和所述待测用户与所述待测对象的交互特征中的任意一项或任意多项;所述预测标签用于确定所述待测用户是否会对所述待测对象执行预设行为。
可选地,所述共用的用户行为特征维度包括用户执行预设行为的时间和/或用户在各时段内执行所述预设行为的次数;所述共用的对象行为特征维度包括对象被执行所述预设行为的时间和/或对象在各时段内被执行所述预设行为的次数。
可选地,所述交互行为特征维度包括用户对对象执行预设行为的时间和/或用户在各时段内对对象执行所述预设行为的次数。
从上述内容可以看出:本发明的上述实施例中,参与方设备接收联邦服务器发送的模型训练请求,根据所述模型训练请求获取本地存储的用户行为数据,按照预设特征分布规则对所述用户行为数据进行处理,得到与其他参与方设备特征分布一致的待训练数据集,利用所述待训练数据集训练得到参与方模型,并将所述参与方模型发送给所述联邦服务器,以便于所述联邦服务器基于各个参与方模型联合训练得到行为预测模型。本发明实施例中,通过各个参与方设备按照预设特征分布规则对所述用户行为数据进行处理,得到与其他参与方设备特征分布一致的待训练数据集,使得各个参与方设备能够使用特征分布一致的待训练数据集训练得到模型结构一致的参与方模型,如此,联邦服务器能够基于各个参与方设备训练得到的模型结构一致的参与方模型训练得到行为预测模型,由于该行为预测模型结合了各个参与方设备的行为数据特征,因此能够用于对各个参与方设备中的用户的行为进行预测,行为预测模型的通用性较好。
基于同一发明构思,本发明实施例还提供了一种计算设备,包括至少一个处理单元以及至少一个存储单元,其中,所述存储单元存储有计算机程序,当所述程序被所述处理单元执行时,使得所述处理单元执行图2至图4任意所述的方法。
基于同一发明构思,本发明实施例还提供了一种计算机可读存储介质,其存储有可由计算设备执行的计算机程序,当所述程序在所述计算设备上运行时,使得所述计算设备执行图2至图4任意所述的方法。
基于同一发明构思,本发明实施例提供了一种终端设备,如图6所示,包括至少一个处理器601,以及与至少一个处理器连接的存储器602,本发明实施例中不限定处理器601与存储器602之间的具体连接介质,图6中处理器601和存储器602之间通过总线连接为例。总线可以分为地址总线、数据总线、控制总线等。
在本发明实施例中,存储器602存储有可被至少一个处理器601执行的指令,至少一个处理器601通过执行存储器602存储的指令,可以执行前述的数据处理方法中所包括的步骤。
其中,处理器601是终端设备的控制中心,可以利用各种接口和线路连接终端设备的各个部分,通过运行或执行存储在存储器602内的指令以及调用存储在存储器602内的数据,从而实现数据处理。可选的,处理器601可包括一个或多个处理单元,处理器601可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理下发指令。可以理解的是,上述调制解调处理器也可以不集成到处理器601中。在一些实施例中,处理器601和存储器602可以在同一芯片上实现,在一些实施例中,它们也可以在独立的芯片上分别实现。
处理器601可以是通用处理器,例如中央处理器(CPU)、数字信号处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本发明实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合数据处理实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器602作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。存储器602可以包括至少一种类型的存储介质,例如可以包括闪存、硬盘、多媒体卡、卡型存储器、随机访问存储器(Random AccessMemory,RAM)、静态随机访问存储器(Static Random Access Memory,SRAM)、可编程只读存储器(Programmable Read Only Memory,PROM)、只读存储器(Read Only Memory,ROM)、带电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、磁性存储器、磁盘、光盘等等。存储器602是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。本发明实施例中的存储器602还可以是电路或者其它任意能够实现存储功能的装置,用于存储程序指令和/或数据。
基于同一发明构思,本发明实施例提供了一种后端设备,如图7所示,包括至少一个处理器701,以及与至少一个处理器连接的存储器702,本发明实施例中不限定处理器701与存储器702之间的具体连接介质,图7中处理器701和存储器702之间通过总线连接为例。总线可以分为地址总线、数据总线、控制总线等。
在本发明实施例中,存储器702存储有可被至少一个处理器701执行的指令,至少一个处理器701通过执行存储器702存储的指令,可以执行前述的数据处理方法中所包括的步骤。
其中,处理器701是后端设备的控制中心,可以利用各种接口和线路连接后端设备的各个部分,通过运行或执行存储在存储器702内的指令以及调用存储在存储器702内的数据,从而实现数据处理。可选的,处理器701可包括一个或多个处理单元,处理器701可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、应用程序等,调制解调处理器主要对接收到的指令进行解析以及对接收到的结果进行解析。可以理解的是,上述调制解调处理器也可以不集成到处理器701中。在一些实施例中,处理器701和存储器702可以在同一芯片上实现,在一些实施例中,它们也可以在独立的芯片上分别实现。
处理器701可以是通用处理器,例如中央处理器(CPU)、数字信号处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本发明实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合数据处理实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器702作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。存储器702可以包括至少一种类型的存储介质,例如可以包括闪存、硬盘、多媒体卡、卡型存储器、随机访问存储器(Random AccessMemory,RAM)、静态随机访问存储器(Static Random Access Memory,SRAM)、可编程只读存储器(Programmable Read Only Memory,PROM)、只读存储器(Read Only Memory,ROM)、带电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、磁性存储器、磁盘、光盘等等。存储器702是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。本发明实施例中的存储器702还可以是电路或者其它任意能够实现存储功能的装置,用于存储程序指令和/或数据。
本领域内的技术人员应明白,本发明的实施例可提供为方法、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种数据处理方法,其特征在于,应用于参与方设备,所述方法包括:
接收联邦服务器发送的模型训练请求;
根据所述模型训练请求获取本地存储的用户行为数据;
按照预设特征分布规则对所述用户行为数据进行处理,得到与其他参与方设备特征分布一致的待训练数据集;
利用所述待训练数据集训练得到参与方模型,并将所述参与方模型发送给所述联邦服务器,所述联邦服务器用于基于各个参与方模型联合训练得到行为预测模型;
接收所述联邦服务器发送的所述行为预测模型;
将待测特征对对应的特征信息输入所述行为预测模型中进行预测,得到所述待测特征对对应的预测标签;所述待测特征对对应的特征信息包括待测用户的用户行为特征、待测对象的对象行为特征和所述待测用户与所述待测对象的交互特征中的任意一项或任意多项;所述预测标签用于确定所述待测用户是否会对所述待测对象执行预设行为。
2.根据权利要求1所述的方法,其特征在于,所述预设特征分布规则为按照共用的用户行为特征维度和对象行为特征维度生成特征分布一致的待训练数据的规则;
所述按照预设特征分布规则对所述用户行为数据进行处理,得到与其他参与方设备特征分布一致的训练数据集,包括:
按照所述共用的用户行为特征维度,从所述用户行为数据中提取出任一用户的用户行为特征;
按照所述共用的对象行为特征维度,从所述用户行为数据中提取出任一对象的对象行为特征;
构建任一用户的用户行为特征和任一对象的对象行为特征之间的特征对,基于所述特征对,生成与其他参与方设备特征分布一致的待训练数据;
基于各个用户与各个对象构成的各个特征对对应的待训练数据,构建所述待训练数据集。
3.根据权利要求2所述的方法,其特征在于,所述按照所述共用的用户行为特征维度,从所述用户行为数据中提取出任一用户的用户行为特征,包括:
从所述用户行为数据中提取出所述用户在任一共用的用户行为特征维度下的特征值,根据所述用户在各个共用的用户行为特征维度下的特征值,构建得到所述用户的用户行为特征;
所述按照所述共用的对象行为特征维度,从所述用户行为数据中提取出任一对象的对象行为特征,包括:
从所述用户行为数据中提取出所述对象在任一共用的对象行为特征维度下的特征值,根据所述对象在各个共用的对象行为特征维度下的特征值,构建得到所述对象的对象行为特征。
4.根据权利要求2所述的方法,其特征在于,所述基于所述特征对,生成与其他参与方设备特征分布一致的待训练数据,包括:
按照共用的交互行为特征维度,从所述用户行为数据中提取出所述用户与所述对象的交互特征;
根据所述用户与所述对象的交互特征,确定所述特征对对应的标签;
将拼接所述用户的用户行为特征、所述对象的对象行为特征、所述交互特征及所述标签得到的特征向量作为所述特征对对应的待训练数据。
5.根据权利要求4所述的方法,其特征在于,所述根据所述各个特征对对应的待训练数据,构建所述待训练数据集,包括:
根据所述各个特征对对应的标签,确定属于正负样本的待训练数据的比例是否符合预设范围;
若不符合预设范围,则对标签为负样本的待训练数据进行下采样处理,或者对标签为正样本的待训练数据进行上采样处理;若符合预设范围,则基于所述各个待训练数据构建所述待训练数据集。
6.根据权利要求2至5中任一项所述的方法,其特征在于,所述共用的用户行为特征维度包括用户执行预设行为的时间和/或用户在各时段内执行所述预设行为的次数;所述共用的对象行为特征维度包括对象被执行所述预设行为的时间和/或对象在各时段内被执行所述预设行为的次数。
7.根据权利要求4或5中任一项所述的方法,其特征在于,所述交互行为特征维度包括用户对对象执行预设行为的时间和/或用户在各时段内对对象执行所述预设行为的次数。
8.一种数据处理装置,其特征在于,所述装置包括:
收发模块,用于接收联邦服务器发送的模型训练请求;
获取模块,用于根据所述模型训练请求获取本地存储的用户行为数据;
处理模块,用于按照预设特征分布规则对所述用户行为数据进行处理,得到与其他参与方设备特征分布一致的待训练数据集;
训练模块,用于利用所述待训练数据集训练得到参与方模型,并将所述参与方模型发送给所述联邦服务器,所述联邦服务器用于基于各个参与方模型联合训练得到行为预测模型;
所述收发模块,还用于接收所述联邦服务器发送的所述行为预测模型;
预测模块,用于将待测特征对对应的特征信息输入所述行为预测模型中进行预测,得到所述待测特征对对应的预测标签;所述待测特征对对应的特征信息包括待测用户的用户行为特征、待测对象的对象行为特征和所述待测用户与所述待测对象的交互特征中的任意一项或任意多项;所述预测标签用于确定所述待测用户是否会对所述待测对象执行预设行为。
9.一种计算设备,其特征在于,包括至少一个处理单元以及至少一个存储单元,其中,所述存储单元存储有计算机程序,当所述程序被所述处理单元执行时,使得所述处理单元执行权利要求1~7任一权利要求所述的方法。
10.一种计算机可读存储介质,其特征在于,其存储有可由计算设备执行的计算机程序,当所述程序在所述计算设备上运行时,使得所述计算设备执行权利要求1~7任一权利要求所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010071525.XA CN111275491B (zh) | 2020-01-21 | 2020-01-21 | 一种数据处理方法及装置 |
PCT/CN2020/129123 WO2021147486A1 (zh) | 2020-01-21 | 2020-11-16 | 一种数据处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010071525.XA CN111275491B (zh) | 2020-01-21 | 2020-01-21 | 一种数据处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111275491A CN111275491A (zh) | 2020-06-12 |
CN111275491B true CN111275491B (zh) | 2023-12-26 |
Family
ID=71003365
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010071525.XA Active CN111275491B (zh) | 2020-01-21 | 2020-01-21 | 一种数据处理方法及装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN111275491B (zh) |
WO (1) | WO2021147486A1 (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111275491B (zh) * | 2020-01-21 | 2023-12-26 | 深圳前海微众银行股份有限公司 | 一种数据处理方法及装置 |
CN111612168B (zh) * | 2020-06-30 | 2021-06-15 | 腾讯科技(深圳)有限公司 | 一种机器学习任务的管理方法以及相关装置 |
CN111833179A (zh) * | 2020-07-17 | 2020-10-27 | 浙江网商银行股份有限公司 | 资源分配平台、资源分配方法及装置 |
CN111833180A (zh) * | 2020-07-17 | 2020-10-27 | 浙江网商银行股份有限公司 | 一种资源分配方法以及装置 |
CN111898769A (zh) * | 2020-08-17 | 2020-11-06 | 中国银行股份有限公司 | 基于横向联邦学习的建立用户行为周期模型的方法及系统 |
CN112052915B (zh) * | 2020-09-29 | 2024-02-13 | 中国银行股份有限公司 | 一种数据训练方法、装置、设备及存储介质 |
CN112396189B (zh) * | 2020-11-27 | 2023-09-01 | 中国银联股份有限公司 | 一种多方构建联邦学习模型的方法及装置 |
CN112686388A (zh) * | 2020-12-10 | 2021-04-20 | 广州广电运通金融电子股份有限公司 | 一种在联邦学习场景下的数据集划分方法及系统 |
CN113158223A (zh) * | 2021-01-27 | 2021-07-23 | 深圳前海微众银行股份有限公司 | 基于状态转移核优化的数据处理方法、装置、设备及介质 |
CN113570126A (zh) * | 2021-07-15 | 2021-10-29 | 远景智能国际私人投资有限公司 | 光伏发电站的发电功率预测方法、装置及系统 |
CN113283185B (zh) * | 2021-07-23 | 2021-11-12 | 平安科技(深圳)有限公司 | 联邦模型训练、客户画像方法、装置、设备及介质 |
CN113902473B (zh) * | 2021-09-29 | 2024-06-14 | 支付宝(杭州)信息技术有限公司 | 业务预测系统的训练方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018052987A1 (en) * | 2016-09-13 | 2018-03-22 | Ohio State Innovation Foundation | Systems and methods for modeling neural architecture |
CN110309923A (zh) * | 2019-07-03 | 2019-10-08 | 深圳前海微众银行股份有限公司 | 横向联邦学习方法、装置、设备及计算机存储介质 |
CN110598870A (zh) * | 2019-09-02 | 2019-12-20 | 深圳前海微众银行股份有限公司 | 一种联邦学习方法及装置 |
CN110633806A (zh) * | 2019-10-21 | 2019-12-31 | 深圳前海微众银行股份有限公司 | 纵向联邦学习系统优化方法、装置、设备及可读存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111275491B (zh) * | 2020-01-21 | 2023-12-26 | 深圳前海微众银行股份有限公司 | 一种数据处理方法及装置 |
-
2020
- 2020-01-21 CN CN202010071525.XA patent/CN111275491B/zh active Active
- 2020-11-16 WO PCT/CN2020/129123 patent/WO2021147486A1/zh active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018052987A1 (en) * | 2016-09-13 | 2018-03-22 | Ohio State Innovation Foundation | Systems and methods for modeling neural architecture |
CN110309923A (zh) * | 2019-07-03 | 2019-10-08 | 深圳前海微众银行股份有限公司 | 横向联邦学习方法、装置、设备及计算机存储介质 |
CN110598870A (zh) * | 2019-09-02 | 2019-12-20 | 深圳前海微众银行股份有限公司 | 一种联邦学习方法及装置 |
CN110633806A (zh) * | 2019-10-21 | 2019-12-31 | 深圳前海微众银行股份有限公司 | 纵向联邦学习系统优化方法、装置、设备及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111275491A (zh) | 2020-06-12 |
WO2021147486A1 (zh) | 2021-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111275491B (zh) | 一种数据处理方法及装置 | |
CN112100387B (zh) | 用于文本分类的神经网络系统的训练方法及装置 | |
CN110727868B (zh) | 对象推荐方法、装置和计算机可读存储介质 | |
CN110910180B (zh) | 信息推送方法、装置、电子设备和存储介质 | |
CN111523678A (zh) | 业务的处理方法、装置、设备及存储介质 | |
CN111951050B (zh) | 理财产品推荐方法及装置 | |
CN113554228B (zh) | 还款率预测模型的训练方法及还款率的预测方法 | |
CN113254840B (zh) | 人工智能应用服务推送方法、推送平台及终端设备 | |
CN111815432A (zh) | 金融服务风险预测方法及装置 | |
WO2020155831A1 (zh) | 数据标签生成、模型训练、事件识别方法和装置 | |
CN111325572B (zh) | 一种数据处理方法及装置 | |
CN111967970B (zh) | 基于spark平台的银行产品推荐方法及装置 | |
CN111754261B (zh) | 一种车辆出租意愿的评估方法、装置及终端设备 | |
CN113450158A (zh) | 银行活动信息推送方法及装置 | |
CN110766465A (zh) | 金融产品评估方法及其验证方法、装置 | |
CN115860802A (zh) | 产品价值预测方法、装置、计算机设备和存储介质 | |
CN116245630A (zh) | 一种反欺诈检测方法、装置、电子设备及介质 | |
CN115860889A (zh) | 一种基于人工智能的金融贷款大数据管理方法及系统 | |
CN112785419B (zh) | 一种催收行动推荐方法及装置 | |
CN116977049A (zh) | 资源申请服务的处理方法、装置、计算机设备和存储介质 | |
CN116860756A (zh) | 业务办理文件的生成方法、装置、存储介质以及电子设备 | |
CN117522556A (zh) | 个人消费贷款业务营销目标客户确定方法及装置 | |
CN116071165A (zh) | 理财产品的预测方法和理财产品的预测装置 | |
CN115631023A (zh) | 一种信贷审核方法和相关装置 | |
CN117149429A (zh) | 一种基于交易识别的贷款分类错峰处理方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |