CN111325572A - 一种数据处理方法及装置 - Google Patents
一种数据处理方法及装置 Download PDFInfo
- Publication number
- CN111325572A CN111325572A CN202010071497.1A CN202010071497A CN111325572A CN 111325572 A CN111325572 A CN 111325572A CN 202010071497 A CN202010071497 A CN 202010071497A CN 111325572 A CN111325572 A CN 111325572A
- Authority
- CN
- China
- Prior art keywords
- time sequence
- behavior
- user
- feature
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 17
- 238000012549 training Methods 0.000 claims abstract description 107
- 238000009826 distribution Methods 0.000 claims abstract description 59
- 238000012545 processing Methods 0.000 claims abstract description 52
- 238000000034 method Methods 0.000 claims abstract description 45
- 230000006399 behavior Effects 0.000 claims description 403
- 238000003860 storage Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 15
- 230000002123 temporal effect Effects 0.000 claims 2
- 230000008569 process Effects 0.000 abstract description 14
- 239000000284 extract Substances 0.000 abstract description 8
- 238000005516 engineering process Methods 0.000 abstract description 7
- 230000006870 function Effects 0.000 description 22
- 238000010586 diagram Methods 0.000 description 17
- 230000000694 effects Effects 0.000 description 9
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 230000000284 resting effect Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Data Mining & Analysis (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及金融科技(Fintech)领域,公开一种数据处理方法及装置,用以解决现有技术无法训练得到通用的行为预测模型的问题,方法包括:参与方设备根据联邦服务器发送的模型训练请求获取本地存储的用户行为数据,并从中提取出按时序统计的时序行为数据,按照预设特征分布规则处理时序行为数据得到与其他参与方设备特征分布一致的待训练数据集,通过各参与方设备使用特征分布一致的待训练数据集训练得到模型结构一致的参与方模型,使得联邦服务器能基于模型结构一致的各参与方模型训练得到通用的行为预测模型。由于行为预测模型结合了各参与方设备的时序行为数据,因此能准确预测各参与方设备中的用户的时序行为,通用性较好。
Description
技术领域
本发明涉及金融科技(Fintech)技术领域,尤其涉及一种数据处理方法及装置。
背景技术
随着计算机技术的发展,越来越多的技术应用在金融领域,传统金融业正在逐步向金融科技(Fintech)转变,然而,由于金融行业的安全性和实时性要求较高,因此也对金融科技领域的技术提出了更高的要求。金融领域通常需要对用户的时序行为进行预测,比如通过预测各用户在某时段内是否会购买某商品,能够预先对该商品在该时段内的销量进行评估,以提前为该商品准备足够的库存,保证金融活动的顺利进行。
现阶段,各个参与方仅能使用本地存储的用户行为数据训练得到行为预测模型,然而,不同参与方中的用户行为可能分别集中在不同的时段,因此某一参与方训练的行为预测模型仅能适用于对本参与方中的用户的时序行为进行预测,而无法对其它参与方中的用户的时序行为进行预测,从而导致行为预测模型的通用性较差,且用户时序行为预测的准确率较低。
发明内容
本发明提供一种数据处理方法及装置,用以训练得到通用的行为预测模型,以实现对各个参与方中的用户的时序行为进行预测,进而提升用户时序行为预测的准确率。
第一方面,本发明提供的一种数据处理方法,所述方法应用于参与方设备,所述方法包括:
接收联邦服务器发送的模型训练请求,根据所述模型训练请求获取本地存储的用户行为数据,从所述用户行为数据中提取得到按时序统计的时序行为数据,按照预设特征分布规则对所述时序行为数据进行处理,得到与其他参与方设备特征分布一致的待训练数据集,利用所述待训练数据集训练得到参与方模型,并将所述参与方模型发送给所述联邦服务器;所述联邦服务器用于基于各个参与方模型联合训练得到行为预测模型。
在一种可能的实现方式中,所述预设特征分布规则为按照共用的时序行为特征维度生成特征分布一致的待训练数据的规则;具体实施中,所述按照预设特征分布规则对所述时序行为数据进行处理,得到与其他参与方设备特征分布一致的待训练数据集,包括:按照所述共用的时序行为特征维度,从所述时序行为数据中提取出任一用户在任一时序对象内的时序行为特征,构建任一用户和任一时序对象之间的特征对,基于所述用户在包含所述时序对象在内的多个时序对象内的时序行为特征,生成与其他参与方设备特征分布一致的待训练数据,基于各个用户与各个时序对象构成的各个特征对对应的待训练数据,构建所述待训练数据集。
在一种可能的实现方式中,所述共用的时序行为特征维度包括用户在按时序统计的时序对象的各个子时序对象内的行为特征;具体实施中,所述按照所述共用的时序行为特征维度,从所述时序行为数据中提取出用户在任一时序对象内的时序行为特征,包括:从所述时序行为数据中提取得到所述用户在所述时序对象内的时序行为数据,根据用户在所述时序对象内的时序行为数据确定用户在所述时序对象的各个子时序对象内是否执行了预设行为;根据所述用户在所述各个子时序对象内是否执行了所述预设行为,确定所述用户在所述各个子时序对象内的行为特征,按时序统计所述用户在所述各个子时序对象内的行为特征,构建得到所述用户在所述时序对象内的时序行为特征。
在一种可能的实现方式中,所述按时序统计所述用户在所述各个子时序对象内的行为特征,构建得到所述用户在所述时序对象内的时序行为特征,包括:按时序顺序拼接所述用户在所述各个子时序对象内的行为特征,至少将拼接得到的一维特征向量作为所述用户在所述时序对象内的时序行为特征。
在一种可能的实现方式中,所述至少将拼接得到的一维特征向量作为所述用户在所述时序对象内的时序行为特征,包括:根据所述时序对象的类别确定所述时序对象的类别特征,或者,根据所述时序对象的时间标签确定所述时序对象的标签特征,拼接所述一维特征向量以及所述类别特征和/或所述标签特征,将拼接得到的一维特征向量作为所述用户在所述时序对象内的时序行为特征。
在一种可能的实现方式中,所述基于所述用户在包含所述时序对象在内的多个时序对象内的时序行为特征,生成与其他参与方设备特征分布一致的待训练数据,包括:按照所述多个时序对象的时序顺序拼接所述多个时序对象的时序行为特征,将拼接得到的多维特征向量作为所述特征对对应的所述待训练数据。
在一种可能的实现方式中,所述将所述参与方模型发送给所述联邦服务器之后,还接收所述联邦服务器发送的所述行为预测模型,将待测特征对对应的特征信息输入所述行为预测模型中进行预测,得到所述待测特征对对应的预测时序行为特征;所述待测特征对对应的特征信息包括待测用户在待测时序对象之前的多个时序对象内的时序行为特征;所述预测时序行为特征用于确定所述待测用户在所述待测时序对象内执行预设行为的情况。
第二方面,本发明提供的一种数据处理装置,所述装置包括:
收发模块,用于接收联邦服务器发送的模型训练请求;
获取模块,用于根据所述模型训练请求获取本地存储的用户行为数据;
处理模块,用于从所述用户行为数据中提取得到按时序统计的时序行为数据,按照预设特征分布规则对所述时序行为数据进行处理,得到与其他参与方设备特征分布一致的待训练数据集;
训练模块,用于利用所述待训练数据集训练得到参与方模型,并将所述参与方模型发送给所述联邦服务器;所述联邦服务器用于基于各个参与方模型联合训练得到行为预测模型。
在一种可能的实现方式中,所述预设特征分布规则为按照共用的时序行为特征维度生成特征分布一致的待训练数据的规则;
所述处理模块具体用于:
按照所述共用的时序行为特征维度,从所述时序行为数据中提取出任一用户在任一时序对象内的时序行为特征;
构建任一用户和任一时序对象之间的特征对,基于所述用户在包含所述时序对象在内的多个时序对象内的时序行为特征,生成与其他参与方设备特征分布一致的待训练数据;
基于各个用户与各个时序对象构成的各个特征对对应的待训练数据,构建所述待训练数据集。
在一种可能的实现方式中,所述共用的时序行为特征维度包括用户在按时序统计的时序对象的各个子时序对象内的行为特征;
所述处理模块具体用于:
从所述时序行为数据中提取得到所述用户在所述时序对象内的时序行为数据,根据用户在所述时序对象内的时序行为数据确定用户在所述时序对象的各个子时序对象内是否执行了预设行为;
根据所述用户在所述各个子时序对象内是否执行了所述预设行为,确定所述用户在所述各个子时序对象内的行为特征;
按时序统计所述用户在所述各个子时序对象内的行为特征,构建得到所述用户在所述时序对象内的时序行为特征。
在一种可能的实现方式中,所述处理模块具体用于:
按时序顺序拼接所述用户在所述各个子时序对象内的行为特征,至少将拼接得到的一维特征向量作为所述用户在所述时序对象内的时序行为特征。
在一种可能的实现方式中,所述处理模块具体用于:
根据所述时序对象的类别确定所述时序对象的类别特征,或者,根据所述时序对象的时间标签确定所述时序对象的标签特征;
拼接所述一维特征向量以及所述类别特征和/或所述标签特征,将拼接得到的一维特征向量作为所述用户在所述时序对象内的时序行为特征。
在一种可能的实现方式中,所述处理模块具体用于:
按照所述多个时序对象的时序顺序拼接所述多个时序对象的时序行为特征,将拼接得到的多维特征向量作为所述特征对对应的所述待训练数据。
在一种可能的实现方式中,所述装置还包括预测模块;
所述收发模块将所述参与方模型发送给所述联邦服务器之后,还用于:接收所述联邦服务器发送的所述行为预测模型;
所述预测模块用于:将待测特征对对应的特征信息输入所述行为预测模型中进行预测,得到所述待测特征对对应的预测时序行为特征;所述待测特征对对应的特征信息包括待测用户在待测时序对象之前的多个时序对象内的时序行为特征;所述预测时序行为特征用于确定所述待测用户在所述待测时序对象内执行预设行为的情况。
第三方面,本发明提供的一种计算设备,包括至少一个处理单元以及至少一个存储单元,其中,所述存储单元存储有计算机程序,当所述程序被所述处理单元执行时,使得所述处理单元执行上述第一方面任意所述的数据处理方法。
第四方面,本发明提供的一种计算机可读存储介质,其存储有可由计算设备执行的计算机程序,当所述程序在所述计算设备上运行时,使得所述计算设备执行上述第一方面任意所述的数据处理方法。
本发明提供的数据处理方法及装置,通过各个参与方设备从用户行为数据中提取得到按时序统计的时序行为数据,再按照预设特征分布规则对所述时序行为数据进行处理,得到与其他参与方设备特征分布一致的待训练数据集,使得各个参与方设备能够使用特征分布一致的待训练数据集训练得到模型结构一致的参与方模型,如此,联邦服务器能够基于各个参与方设备训练得到的模型结构一致的参与方模型训练得到行为预测模型,由于该行为预测模型结合了各个参与方设备的时序行为特征,因此能够用于对各个参与方设备中的用户的时序行为进行预测,行为预测模型的通用性较好,且还可以提高用户时序行为预测的准确率。
本发明的这些方面或其他方面在以下实施例的描述中会更加简明易懂。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种适用的系统架构示意图;
图2为本发明实施例提供的一种数据处理方法对应的流程示意图;
图3为本发明实施例中提供的一种数据处理方式的执行流程示意图;
图4为本发明实施例提供的一种模型训练方法的交互流程示意图;
图5为本发明实施例提供的一种数据处理装置的结构示意图;
图6为本发明实施例提供的一种终端设备的结构示意图;
图7为本发明实施例提供的一种后端设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
图1为本发明实施例提供的一种适用的系统架构示意图,如图1所示,该系统架构可以包括联邦服务器110和至少两个参与方设备,比如参与方设备121、参与方设备122和参与方设备123。其中,联邦服务器110可以与每个参与方设备连接,比如可以通过有线方式连接,也可以通过无线方式连接,具体不作限定。
基于图1所示意的系统架构,图2为本发明实施例提供的一种数据处理方法对应的流程示意图,该方法可以应用于任一参与方设备,比如参与方设备121、参与方设备122或参与方设备123,具体不作限定。
如图2所示,该方法包括:
步骤201,接收联邦服务器发送的模型训练请求。
步骤202,根据所述模型训练请求获取本地存储的用户行为数据。
步骤203,从所述用户行为数据中提取得到按时序统计的时序行为数据,按照预设特征分布规则对所述时序行为数据进行处理,得到与其他参与方设备特征分布一致的待训练数据集。
本发明实施例中,用户行为数据可以包括设定时段内参与方设备中的每个用户对一个或多个行为对象执行预设行为的行为数据。举例来说,若用户行为数据为10月份的社区门禁数据,参与方设备为社区A,则用户行为数据可以包括社区A中的每个用户在10月份时在小区A的任意门处刷卡的日期和时刻,比如,若小区A中设置有门1和门2,则用户行为数据可以包括小区A中的每个用户在门1处刷卡的日期和时刻,以及每个用户在门2处刷卡的日期和时刻;在该示例中,预设行为是指刷卡行为。再举一个例子,若用户行为数据为10月份的电商平台数据,参与方设备为书商C,则用户行为数据可以包括每个用户10月份时在书商C的平台上购买书的日期和时刻,比如,若书商C的平台上发布有书1和书2,则用户行为数据可以包括每个用户在书商C的平台上购买书1的日期和时刻,以及每个用户在电商C的平台上购买书2的日期和时刻;在该示例中,预设行为是指购买行为。
具体实施中,从用户行为数据中提取得到按时序统计的时序行为数据,具体可以是指将任一用户在设定时段内的行为数据按照时序进行排列,比如用户在10.1日至10.10日均执行了刷卡行为,则可以分别提取得到用户在10.1日的刷卡行为数据至用户在10.10日的刷卡行为数据(且每日的刷卡行为数据也按照时序排列,比如按照每次刷卡的时间顺序进行排列),然后再按照10.1日至10.10日的时间顺序对10.1日的刷卡行为数据至10.10日的刷卡行为数据进行依次排序,得到该用户的时序行为数据。
步骤204,利用所述待训练数据集训练得到参与方模型,并将所述参与方模型发送给所述联邦服务器,所述联邦服务器用于基于各个参与方模型联合训练得到行为预测模型。
本发明的上述实施例中,通过各个参与方设备从用户行为数据中提取得到按时序统计的时序行为数据,再按照预设特征分布规则对所述时序行为数据进行处理,得到与其他参与方设备特征分布一致的待训练数据集,使得各个参与方设备能够使用特征分布一致的待训练数据集训练得到模型结构一致的参与方模型,如此,联邦服务器能够基于各个参与方设备训练得到的模型结构一致的参与方模型训练得到行为预测模型,由于该行为预测模型结合了各个参与方设备的时序行为特征,因此能够用于对各个参与方设备中的用户的时序行为进行预测,行为预测模型的通用性较好。
需要说明的是,上述步骤编号仅为执行流程的一种示例,并不构成对各个步骤的执行先后顺序的限定。举例来说,参与方设备可以在接收到模型训练请求之前获取用户行为数据,并处理用户行为数据得到待训练数据集(即步骤202和步骤203在步骤201之前执行),也可以在接收到模型训练请求之后再获取用户行为数据,并处理用户行为数据得到待训练数据集(即步骤202和步骤203在步骤201之后执行),具体不作限定。
在步骤203中,预设特征分布规则可以存在多种可能,比如,在一种可能的方式中,预设特征分布规则可以设置为:先基于特征工程分析每个参与方设备中的时序行为数据,以找到各个参与方设备中时序行为数据的公共时序特征,再基于公共时序特征对每个参与方设备中时序行为数据的时序特征进行处理,构建得到每个参与方设备中的待训练数据集。
由此可知,通过设置该种方式中的预设特征分布规则,可以使得各个参与方设备中的待训练数据集具有相同的特征分布。然而,一方面,特征工程需要依赖人为操作,因此该种方式需要人为从每个参与方设备中的用户行为数据中提取时序特征,导致数据处理的效率较低,运维的人工成本较高;另一方面,通过特征工程得到的不同参与方设备的时序特征可能并不相同,比如通过特征工程确定用户最近一周执行预设行为的次数属于参与方设备121的一个特征,而该特征并不适用于参与方设备122,如此,若提取公共时序特征,可能会使得参与方设备的待训练数据集中包含遗漏掉本身的时序特征,导致模型训练的精确度较差。
基于此,本发明实施例提供了一种可能的数据处理方式,在该数据处理方式中,预设特征分布规则设置为各个参与方设备按照共用的时序行为特征维度生成特征分布一致的待训练数据的规则。
图3为利用该预设特征分布规则处理得到待训练数据集的执行流程示意图,该方法包括:
步骤301,按照共用的时序行为特征维度,从时序行为数据中提取出任一用户在任一时序对象内的时序行为特征。
此处,时序对象的时长可以由本领域技术人员根据经验进行设置,比如可以设置为1天,也可以设置为1周,还可以设置为1个月,具体不作限定。
在一种可能的实现方式中,共用的时序行为特征维度可以包括用户在按时序统计的时序对象的各个子时序对象内的行为特征。其中,子时序对象的时长小于时序对象的时长,比如若时序对象的时长为1天,则子时序对象的时长可以为1小时,也可以为1分钟。
具体实施中,参与方设备可以先从时序行为数据中提取得到任一用户在任一时序对象内的时序行为数据,然后根据该用户在该时序对象内的时序行为数据确定该用户在该时序对象的各个子时序对象内是否执行了预设行为,进而根据该用户在各个子时序对象内是否执行预设行为确定该用户在各个子时序对象内的行为特征;且,参与方设备还可以按时序统计该用户在该时序对象内的各个子时序对象内的行为特征,从而构建得到该用户在该时序对象内的时序行为特征。其中,构建的方式可以有多种,比如可以将按照时序统计得到的数据表作为用户在时序对象内的时序行为特征,也可以将按照时序统计得到的映射视图作为用户在时序对象内的时序行为特征,还可以将按照时序统计的栈表作为用户在时序对象内的时序行为特征,不作限定。
作为一种示例,可以按照时序顺序拼接用户在时序对象的各个子时序对象内的行为特征,并至少将拼接得到的第一特征子向量作为用户在时序对象内的时序行为特征,第一特征子向量为一维特征向量。其中,第一特征子向量中可以设置有与各个子时序对象一一对应的向量位,任一向量位处的值用于标识用户在对应的子时序对象内是否执行了预设行为;比如,当时序对象为2019年10月24日时,若设置子时序对象的时长为1小时,则第一特征子向量中可以设置有第1至第24向量位,第1向量位的值用于指示用户在2019年10月24日的0:00~1:00的时间范围内是否执行了刷卡行为,第2向量位的值用于指示用户在2019年10月24日的1:00~2:00的时间范围内是否执行了刷卡行为,……,第24向量位的值用于指示用户在2019年10月24日的23:00~0:00的时间范围内是否执行了刷卡行为;或者,若设置子时序对象的时长为0.5小时,则第一特征子向量中可以设置有第1至第48向量位,第1向量位的值用于指示用户在2019年10月24日的0:00~0:30的时间范围内是否执行了刷卡行为,第2向量位的值用于指示用户在2019年10月24日的0:30~1:00的时间范围内是否执行了刷卡行为,……,第48向量位的值用于指示用户在2019年10月24日的23:30~0:00的时间范围内是否执行了刷卡行为。
本发明实施例中,第一特征子向量中向量位的值可以为第一标识值或第二标识值,第一标识值用于指示用户执行了预设行为,第二标识值为用于指示用户未执行预设行为。其中,第一标识值和第二标识值可以由数字形式表示,也可以由字符形式标识,还可以由字段形式表示,不作限定。
具体实施中,参与方设备可以先根据时序对象内子时序对象的数量生成初始第一特征子向量,并设置初始第一特征子向量中每个向量位的值为第二标识值(比如0)。进一步地,针对于用户在该时序对象中执行了预设行为的任一时刻,将该时刻所属的子时序对象对应的向量位的值由第二标识值修改为第一标识值(比如由0修改为1)。如此,在修改了所有执行预设行为的时刻所属的子时序对象对应的向量位的值后,参与方设备可以将初始第一特征子向量转化为第一特征子向量。
举例来说,若第一标识值为1,第二标识值为0,时序对象的时长为1天,子时序对象的时长为1小时,则初始第一特征子向量可以为[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 00 0 0 0 0 0];其中,初始第一特征子向量中设置有第1至第24向量位,每个向量位对应一个1小时的子时序对象。进一步地,若用户在9:05和18:06执行了刷卡行为,由于9:05属于9:00~10:00的子时序对象,9:00~10:00的子时序对象对应的向量位为第10向量位,因此可以将初始第一特征子向量中的第10向量位的值更新为1;相应地,18:06属于18:00~19:00的子时序对象,18:00~19:00的子时序对象对应的向量位为第19向量位,因此可以将初始第一特征子向量中的第19向量位的值更新为1。如此,用户在该时序对象内的第一特征子向量可以为[0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0]。
在上述示例中,通过设置将第一特征子向量作为用户在时序对象内的时序行为特征,且第一特征子向量的向量位用于指示时序对象的各个子时序对象内用户是否执行预设行为,使得用户在时序对象内的时序行为特征能够涵盖用户在时序对象内执行预设行为的时间信息和时序信息,时序行为特征具有准确的时序特性。
本发明实施例中,用户在时序对象内的时序行为特征还可以包括除第一特征子向量以外的其它信息,下面列举几种可能的时序行为特征。
示例一
具体实施中,参与方设备还可以根据时序对象的类别确定时序对象的类别特征,然后拼接用户在时序对象的各个子时序对象内的行为特征和类别特征,并将拼接得到的一维特征向量作为用户在时序对象内的时序行为特征。其中,类别特征可以由第二特征子向量来表示,第二特征子向量中设置有与各个类别一一对应的各个向量位,每个向量位的值用于指示时序对象是否为该类别。如此,拼接得到的一维特征向量中同时包括第一特征子向量和第二特征子向量,第一特征子向量由用户在时序对象的各个子时序对象内的行为特征构成,第二特征子向量由时序对象的类别特征构成。
需要说明的是,各个类别可以基于类别周期进行设置,类别周期可以由本领域技术人员根据经验进行设置,或者也可以根据实际需要进行设置,比如可以设置为一周,也可以设置为一个月,还可以设置为一年,具体不作限定。比如,当类别周期设置为一周时,第二特征子向量中可以设置有第1至第7向量位,第1向量位的值用于指示时序对象的类别为周一,第2向量位的值用于指示时序对象的类别是否为周二,……,第7向量位的值用于指示时序对象的类别是否为周日。
本发明实施例中,第二特征子向量中向量位的值可以为第三标识值或第四标识值,第三标识值用于标识时序对象属于该向量位对应的类别,第四标识值用于标识时序对象不属于该向量位对应的类别。其中,第三标识值和第四标识值可以由数字形式表示,也可以由字符形式表示,还可以由字段形式表示,不作限定。
具体实施中,参与方设备可以先根据用户在时序对象的各个子时序对象内的行为特征生成第一特征子向量,再根据时序对象的类别特征生成第二特征子向量,最后拼接第一特征子向量和第二特征子向量,得到用户在行为对象内的时序行为特征。其中,第二特征子向量的生成方式可以参照第一特征子向量,比如可以先根据类别周期中的各个类别生成初始第二特征子向量,初始第二特征子向量中每个向量位的值可以为第四标识值(比如0),再将初始第二特征子向量中行为对象所属的类别对应的向量位的值由第四标识值更新为第三标识值(比如由0修改为1),如此,即可实现将初始第二特征子向量更新为第二特征子向量。
需要说明的是,上述仅是一种示例性的简单说明,并不构成对方案的限定,在具体实施中,可以先生成第一特征子向量和第二特征子向量,再拼接第一特征子向量和第二特征子向量得到时序行为特征,也可以先拼接初始第一特征子向量和初始第二特征子向量得到初始时序行为特征,再对初始时序行为特征中每个向量位的值进行更新得到时序行为特征,具体不作限定。
举例来说,若第一标识值和第三标识值均为1,第二标识值和第四标识值加农为0,时序对象为2019年9月30日,子时序对象的时长为1小时,类别周期为一周,则时序行为特征可以为具有第1至第31向量位的一维特征向量,第1至第24向量位与24个子时序对象(24个小时)一一对应,第25至第31向量位与7个类别(周一至周日)一一对应。相应地,若用户在9:05和18:06执行了刷卡行为,则由于9:05属于9:00~10:00的子时序对象(对应第10向量位),因此一维特征向量中第10向量位的值可以为1,18:06属于18:00~19:00的时序对象(对应第19向量位),因此一维特征向量中第19向量位的值为1,由于2019年9月30日为周一,因此一维特征向量中第25向量位的值为1。如此,用户在2019年9月30日内的时序行为特征可以为[0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0]。
在上述示例中,通过在时序行为特征中同时设置行为对象的类别,使得时序行为特征能够同时涵盖用户执行预设行为的时序特征和时序对象的类别特征,从而时序信息能够更为综合和全面,且更能标识用户的行为习惯,基于此训练得到的参与方模型能够具有更好的模型效果。
示例二
具体实施中,参与方设备还可以根据时序对象的时间标签确定时序对象的标签特征,然后拼接用户在时序对象的各个子时序对象内的行为特征和标签特征,将拼接得到的一维特征向量作为用户在时序对象内的时序行为特征。其中,标签特征可以由第三特征子向量表示,第三特征子向量中设置有与各个时间标签一一对应的各个向量位,每个向量位的值用于指示时序对象是否属于该时间标签。如此,拼接得到的一维特征向量中同时包括第一特征子向量和第三特征子向量,第一特征子向量由用户在时序对象的各个子时序对象内的行为特征构成,第三特征子向量由时序对象的标签特征构成。
需要说明的是,各个时间标签可以由本领域技术人员根据经验进行设置,也可以根据实际需要进行设置,比如可以设置为工作日和休息日。若设置时间标签为工作日和休息日,则第三特征子向量可以包括第1至第2向量位,第1向量位的值用于指示时序对象是否属于工作日,第2向量位的值用于指示时序对象是否属于休息日。
本发明实施例中,第三特征子向量中向量位的值可以设置为第五标识值或第六标识值,第五标识值用于标识时序对象属于该向量位对应的时间标签,第六标识值用于标识时序对象不属于该向量位对应的时间标签。其中,第五标识值和第六标识值可以由数字形式表示,也可以由字符形式标识,还可以由字段形式表示,不作限定。
具体实施中,参与方设备可以先根据用户在时序对象的各个子时序对象内的行为特征生成第一特征子向量,再根据时序对象的标签特征生成第三特征子向量,最后拼接第一特征子向量和第三特征子向量,得到用户在行为对象内的时序行为特征。其中,第三特征子向量的生成方式可以参照第一特征子向量,比如可以先根据各个时间标签生成初始第三特征子向量,初始第三特征子向量中每个向量位的值可以为第六标识值(比如0),再将初始第三特征子向量中行为对象所属的时间标签对应的向量位的值由第六标识值更新为第五标识值(比如由0修改为1),如此,即可实现将初始第三特征子向量更新为第三特征子向量。
需要说明的是,上述仅是一种示例性的简单说明,并不构成对方案的限定,在具体实施中,可以先生成第一特征子向量和第三特征子向量,再拼接第一特征子向量和第三特征子向量得到时序行为特征,也可以先拼接初始第一特征子向量和初始第三特征子向量得到初始时序行为特征,再对初始时序行为特征中每个向量位的值进行更新得到时序行为特征,具体不作限定。
举例来说,若第一标识值和第五标识值均为1,第二标识值和第六标识值均为0,时序对象为2019年9月30日,子时序对象的时长为1小时,时间标签为工作日或休息日,则时序行为特征可以为具有第1至第26向量位的一维特征向量,第1至第24向量位与24个子时序对象(第1向量位对应0:00~1:00的子时序对象,第2向量位对应1:00~2:00的子时序对象,……,第24向量位对应23:00~24:00的子时序对象)一一对应,第25向量位对应工作日,第26向量位对应休息日。相应地,若用户在9:05和18:06执行了刷卡行为,则由于9:05属于9:00~10:00的子时序对象(对应第10向量位),因此时序行为特征中第10向量位的值为1,18:06属于18:00~19:00的子时序对象(对应第19向量位),因此时序行为特征中第19向量位的值为1,由于2019年9月30日为周一,周一属于工作日,因此时序行为特征中第25向量位的值为1。如此,用户在2019年9月30日内的时序行为特征可以为[0 0 0 0 0 0 0 0 0 1 00 0 0 0 0 0 0 1 0 0 0 0 0 1 0]。
示例三
具体实施中,参与方设备还可以根据时序对象的类别确定时序对象的类别特征,以及根据时序对象的时间标签确定时序对象的标签特征,然后拼接用户在时序对象的各个子时序对象内的行为特征、类别特征和标签特征,将拼接得到的一维特征向量作为用户在时序对象内的时序行为特征。其中,类别特征可以由第二特征子向量表示,标签特征可以由第三特征子向量表示,如此,拼接得到的一维特征向量中同时包括第一特征子向量、第二特征子向量和第三特征子向量,第一特征子向量由用户在时序对象的各个子时序对象内的行为特征构成,第二特征子向量由时序对象的类别特征构成,第三特征子向量由时序对象的标签特征构成。
具体实施中,参与方设备可以先根据时序行为数据设置初始第一特征子向量中每个向量位的值得到第一特征子向量,根据时序对象与类别周期的关系设置初始第二特征子向量中每个向量位的值得到第二特征子向量,根据时序对象所属的时间标签设置初始第三特征子向量中每个向量位的值得到第三特征子向量,再拼接第一特征子向量、第二特征子向量和第三特征子向量得到时序行为特征,或者也可以先拼接初始第一特征子向量、初始第二特征子向量和初始第三特征子向量得到初始时序行为特征,再根据时序行为数据、时序对象的类别和时序对象所属的时间标签设置初始时序行为特征中每个向量位的值,得到时序行为特征,具体不作限定。
举例来说,若第一标识值、第三标识值和第五标识值均为1,第二标识值、第四标识值和第六标识值均为0,时序对象为2019年9月30日,子时序对象的时长为1小时,类别周期为一周,时间标签为工作日或休息日,则时序行为特征可以为具有第1至第33向量位的一维特征向量,第1至第24向量位与24个子时序对象(对应24个小时)一一对应,第25向量位与工作日对应,第26向量位与休息日对应,第27至第33向量位与7个类别(对应周一至周日)一一对应。若用户在9:05和18:06执行了刷卡行为,由于9:05属于9:00~10:00的子时序对象(对应第10向量位),因此时序行为特征中第10向量位的值为1,18:06属于18:00~19:00的子时序对象(对应第19向量位),因此时序行为特征中第19向量位的值为1,由于2019年9月30日为周一,因此时序行为特征中第27向量位的值为1,由于周一属于工作日,因此时序行为特征中第25向量位的值为1。如此,用户在2019年9月30日内的时序行为特征可以为[0 0 0 00 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 1 0 0 0 0 0 0]。
在上述示例中,通过设置时序行为特征同时包括用户在各个子时序对象内的行为特征、时序对象的类别特征和标签特征,使得时序行为特征能够同时涵盖用户执行预设行为的时序特征、时间特征和属性特征,从而时序行为特征更为综合和全面,且更能标识用户在每天的行为习惯,如此,基于该时序行为特征训练得到的参与方模型可以具有较好的模型效果,应用场景更为广泛。
需要说明的是,本发明实施例不限定拼接各个特征子向量的顺序,比如可以按照第一特征子向量、第二特征子向量和第三特征子向量的顺序进行拼接,也可以按照第二特征子向量、第一特征子向量和第三特征子向量的顺序进行拼接,还可以按照第二特征子向量、第三特征子向量和第一特征子向量的顺序进行拼接,不做限定。
步骤302,构建任一用户和任一时序对象之间的特征对,基于所述用户在包含所述时序对象在内的多个时序对象内的时序行为特征,生成与其他参与方设备特征分布一致的待训练数据。
具体实施中,针对于任一用户,参与方设备可以针对于全部时序对象中的每个时序对象构建一个特征对,也可以先从全部时序对象中选择部分时序对象构建特征对,具体不作限定。举例来说,若用户行为数据包括用户1在2019年9月30日至2019年11月3日执行刷卡行为的行为数据,则参与方设备可以针对于35个日期中的每个日期构建一个特征对,从而针对于用户1和35个日期构建得到35个特征对:特征对user1-date20190930、特征对user1-date20191001、……、特征对user1-date20191103;或者也可以针对于35个日期中处于周日的日期(即2019年10页6日、2019年10月13日、2019年10月20日、2019年10月27日和2019年11月3日)构建特征对,从而针对于用户1和处于周日的日期构建得到5个特征对:特征对user1-date20191006特征对、user1-date20191013、特征对user1-date20191020、特征对user1-date20191027、特征对user1-date20191103;等等。
其中,user1是指用户1,date(20190930~20191103)是指2019年9月30日~2019年11月3日。
在一种可能的实现方式中,可以采用监督式的机器学习算法执行模型训练,在监督式的机器学习算法中,每条待训练数据均可以包括训练信息和标签信息,训练信息用于输入模型训练得到对应的预测信息,标签信息用于根据预测信息与标签信息的差值调整模型参数。具体实施中,在确定用户在每个时序对象内的时序行为特征后,针对于任一特征对,参与方设备可以选取位于该特征对对应的时序对象之前的N个时序对象,将用户在N个时序对象内的时序行为特征作为该特征对对应的训练信息,将用户在该特征对对应的时序对象内的时序行为特征作为该特征对对应的标签信息,如此,参与方设备可以根据该特征对对应的训练信息和标签信息生成该特征对对应的待训练数据。其中,N的数量可以由本领域技术人员根据经验进行设置,具体不作限定。
举例来说,当用户行为数据包括用户1在2019年9月30日至2019年11月3日执行刷卡行为的行为数据,N设置为6时,若针对于2019年10月6日至2019年11月3日构建得到特征对user1-date(20191006~20191103),则特征对user1-date20191006的训练信息可以由用户1在2019年9月30日内的时序行为特征至用户1在2019年10月5日内的时序行为特征拼接得到,且标签信息可以为用户1在2019年10月6日内的时序行为特征;特征对user1-date20191007的训练信息可以由用户1在2019年10月1日内的时序行为特征至用户1在2019年10月6日内的时序行为特征拼接得到,且标签信息可以为用户1在2019年10月7日内的时序行为特征;……;特征对user1-date20191103的训练信息可以由用户1在2019年10月28日内的时序行为特征至用户1在2019年11月2日内的时序行为特征拼接得到,且标签信息可以为用户1在2019年11月3日内的时序行为特征。
或者,若针对于2019年10月6日至2019年11月3日中的周末构建得到特征对user1-date20191006、特征对user1-date20191013、特征对user1-date20191020、特征对user1-date20191027和user1-date20191103,则特征对user1-date20191006的训练信息可以由用户1在2019年9月30日内的时序行为特征至用户1在2019年10月5日内的时序行为特征拼接得到,且标签信息可以为用户1在2019年10月6日内的时序行为特征;特征对user1-date20191013的训练信息可以由用户1在2019年10月6日内的时序行为特征至用户1在2019年10月12日内的时序行为特征拼接得到,且标签信息可以为用户1在2019年10月13日内的时序行为特征;……;特征对user1-date20191103的训练信息可以由用户1在2019年10月28日内的时序行为特征至用户1在2019年11月2日内的时序行为特征拼接得到,且标签信息可以为用户1在2019年11月3日内的时序行为特征。
在一个示例中,针对于任一特征对,参与方设备可以按照时序对象的时序顺序拼接用户在N个时序对象内的时序行为特征和用户在特征对对应的时序对象内的时序行为特征,并可以将拼接得到的多维特征向量作为特征对对应的待训练数据。其中,多维特征向量的第I行数据为用户在第I个时序对象内的时序行为特征,第I个时序对象是指包含特征对对应的时序对象和之前的N个时序对象在内的N+1个时序对象中的第I个时序对象,多维特征向量的第I行数据在第J列处的值是指用户在第I个时序对象下的时序行为特征的第J个向量位处的值。
具体实施中,针对于任一特征对,参与方设备可以先按照时间顺序对用户在N个时序特征内的时序行为特征进行排序,得到相邻的第一至第N行时序行为特征,然后在列上依次将排序靠后的时序行为特征拼接在排序靠前的时序行为特征的下方。进一步地,参与方设备还可以将用户在特征对对应的时序对象内的时序行为特征拼接在第N行时序行为特征的下方,从而得到该特征对对应的待训练数据。
举例来说,当N设置为6,时序行为特征包括33个向量位时,特征对对应的待训练数据可以为7行33列的多维特征向量,比如,若特征对对应的时序对象为2019年10月16日,则该特征对对应的待训练数据可以如下所示:
其中,待训练数据的第一行为用户在2019年10月9日内的时序行为特征,第二行为用户在2019年10月10日内的时序行为特征,第三行为用户在2019年10月11日内的时序行为特征,第四行为用户在2019年10月12日内的时序行为特征,第五行为用户在2019年10月13日内的时序行为特征,第六行为用户在2019年10月14日内的时序行为特征,第七行为用户在2019年10月15日内的时序行为特征。且,待训练数据的第一行至第六行为待训练数据的训练信息,第七行为待训练数据的标签信息,训练信息用于训练模型预测得到2019年10月15对应的预测时序行为特征,标签信息用于根据2019年10月15对应的预测时序行为特征与2019年10月15对应的时序行为特征的差值调整模型的参数。
本发明实施例中,通过按照时间顺序拼接时序对象之前的多个时序对象的时序行为特征和时序对象的时序行为特征,并将拼接得到的多维特征向量作为用户与时序行为特征对应的待训练数据,可以使得待训练数据以多维特征向量的形式包含较为全面的时序信息,且待训练数据可以方便地作为模型的输入信息,从而使得待训练数据的构建过程可以基于神经网络,而无需基于人为分析,数据处理的效果较好,效率较高。
步骤303,基于各个用户与各个时序对象构成的各个特征对对应的待训练数据,构建所述待训练数据集。
本发明实施例中,参与方设备可以将各个特征对对应的待训练数据作为待训练数据集,也可以先对各个特征对对应的待训练数据进行筛选,将不满足要求的待训练数据筛除后,再将满足要求的待训练数据作为待训练数据集,不作限定。
在步骤204中,参与方设备可以先将全部的待训练数据划分为训练数据、验证数据和测试数据,训练数据用于参与方设备训练得到参与方模型,验证数据用于参与方设备验证参与方模型的效果,得到参与方模型的损失函数,相应地,测试数据用于在模型训练结束后,联邦服务器110验证行为预测模型的效果。
具体实施中,参与方设备可以将参与方模型的模型参数上报给联邦服务器110,参与方模型的模型参数用于联邦服务器110根据各个参与方模型的模型参数得到综合模型参数,若确定满足模型训练的结束条件,则根据模型训练得到行为预测模型,若不满足所述模型训练的结束条件,则将综合模型参数下发给所述各个参与方设备,并联合各个参与方设备循环执行步骤201~步骤204。
作为一种示例,参与方设备可以仅将参与方模型的模型参数上报给联邦服务器110,如此,在接收到各个参与方模型的模型参数后,联邦服务器110可以基于各个模型参数计算得到平均模型参数,并可以将平均模型参数确定为本次模型训练的综合模型参数。
作为另一种示例,参与方设备可以同时将参与方模型的模型参数和损失函数发送给联邦服务器110,如此,联邦服务器110在接收到各个模型参数和损失函数后,可以先根据各个损失函数确定各个模型参数的权重,再使用加权平均的方式对各个模型参数进行计算,得到综合模型参数。其中,若模型参数对应的损失函数越小,说明参与方模型的效果越好,因此可以为该模型参数分配较大的权重,相应地,若模型参数对应的损失函数越大,说明参与方模型的效果越差,因此可以为该模型参数分配较小的权重。
具体实施中,可以先按照由小到大的顺序对各个损失函数进行排序,若损失函数的排序越靠后,则可以设置该损失函数对应的模型参数的权重越小,若损失函数的排序越靠前,则可以设置该损失函数对应的模型参数的权重越大;举例来说,若参与方设备121~参与方设备123的损失函数分别为0.05、0.30、0.15,说明参与方设备121~参与方设备123对应的参与方模型的效果排名为:参与方设备122对应的参与方模型>参与方设备123对应的参与方模型>参与方设备121对应的参与方模型,因此,联邦服务器110可以设置参与方设备121~参与方设备123对应的模型参数的权重分别为10%、60%、30%。
本发明实施例中,模型训练的结束条件可以包括以下任意一项或任意多项:本次模型训练的综合模型参数收敛、已执行的模型训练的次数大于或等于预设次数、已执行模型训练的时间大于或等于预设训练时长,具体可以由本领域技术人员根据经验进行设置,具体不作限定。
具体实施中,若模型训练的结束条件为已执行的模型训练的次数大于或等于5次,则当各个参与方设备分别训练得到5次模型(即第5次模型训练结束)后,联邦服务器110可以确第5次模型训练满足模型训练的结束条件;或者,若模型训练的结束条件为已执行模型训练的时间大于或等于5分钟,则从联邦服务器110下发初始模型参数开始执行至第5分钟时(若此时正在执行第3次模型训练),联邦服务器110可以确定第3次模型训练满足模型训练的结束条件。
相应的,若模型训练的结束条件为本次模型训练的综合模型参数收敛,则针对于本次模型训练,联邦服务器110还可以根据本次模型训练中各参与方设备发送的损失函数计算得到本次模型训练的综合损失函数,若确定本次模型训练的综合损失函数处于收敛状态(比如本次模型训练的综合损失函数小于或等于某一阈值),则可以确定本次模型训练满足模型训练的结束条件,否则确定本次模型训练不满足模型训练的结束条件。
进一步地,若本次模型训练满足模型训练的结束条件,则联邦服务器110可以使用本次模型训练的综合模型参数构建得到横向联邦模型,若本次模型训练不满足模型训练的结束条件,则联邦服务器110可以将本次模型训练的综合模型参数下发给各个参与方设备,以使各个参与方设备基于本次模型训练的综合模型参数,使用各个参与方设备的待训练数据执行下一次模型训练,直至满足模型训练的结束条件。
在一个示例中,联邦服务器构建得到行为预测模型后,还可以将行为预测模型下发给各个参与方设备,如此,任一参与方设备可以将待测特征对对应的特征信息输入行为预测模型中进行预测,得到待测特征对对应的预测时序行为特征。其中,待测特征对对应的特征信息包括待测用户在待测时序对象之前的多个时序对象内的时序行为特征,预测时序行为特征用于确定待测用户在所述待测时序对象内执行预设行为的情况。通过联合各个参与方设备中的时序行为数据构建得到行为预测模型,使得行为预测模型能够用于对任一参与方设备中的用户的时序行为数据进行预测,行为预测模型具有较好的通用性。
下面从联邦服务器与各个参与方设备的交互角度描述本发明实施例中的数据处理方法。
图4为本发明实施例提供的一种模型训练的整体流程示意图,该方法包括:
步骤401,联邦服务器110向各个参与方设备下发模型训练请求,模型训练请求中携带有初始模型参数。
步骤402,任一参与方设备接收到联邦服务器下发的模型训练请求后,获取本地存储的用户行为数据,并从用户行为数据中提取得到按时序统计的时序行为数据,按照预设特征分布规则对时序行为数据进行处理,得到与其他参与方设备特征分布一致的待训练数据集。
步骤403,任一参与方设备基于初始模型参数,利用待训练数据集训练得到与其他参与方设备模型结构一致的参与方模型。
步骤404,任一参与方设备将参与方模型的模型参数上报给联邦服务器。
步骤405,联邦服务器接收到各个参与方设备上报的参与方模型的模型参数后,根据各个参与方模型的模型参数得到综合模型参数。
步骤406,联邦服务器确定是否满足模型训练的结束条件,若是,则执行步骤407,若否,则执行步骤408。
步骤407,联邦服务器根据综合模型参数构建得到行为预测模型。
步骤408,联邦服务器将综合模型参数下发给各个参与方设备。
步骤409,任一参与方设备接收到联邦服务器下发的综合模型参数后,使用综合模型参数更新本地存储的初始模型参数,并执行步骤403。
本发明的上述实施例中,参与方设备接收联邦服务器发送的模型训练请求,根据所述模型训练请求获取本地存储的用户行为数据,从所述用户行为数据中提取得到按时序统计的时序行为数据,按照预设特征分布规则对所述时序行为数据进行处理,得到与其他参与方设备特征分布一致的待训练数据集,利用所述待训练数据集训练得到参与方模型,并将所述参与方模型发送给所述联邦服务器;所述联邦服务器用于基于各个参与方模型联合训练得到行为预测模型。本发明实施例中,通过各个参与方设备从用户行为数据中提取得到按时序统计的时序行为数据,再按照预设特征分布规则对所述时序行为数据进行处理,得到与其他参与方设备特征分布一致的待训练数据集,使得各个参与方设备能够使用特征分布一致的待训练数据集训练得到模型结构一致的参与方模型,如此,联邦服务器能够基于各个参与方设备训练得到的模型结构一致的参与方模型训练得到行为预测模型,由于该行为预测模型结合了各个参与方设备的时序行为特征,因此能够用于对各个参与方设备中的用户的时序行为进行预测,行为预测模型的通用性较好,且还可以提高用户时序行为预测的准确率。
针对上述方法流程,本发明实施例还提供一种数据处理装置,该装置的具体内容可以参照上述方法实施。
图5为本发明实施例提供的一种数据处理装置的结构示意图,所述装置包括:
收发模块501,用于接收联邦服务器发送的模型训练请求;
获取模块502,用于根据所述模型训练请求获取本地存储的用户行为数据;
处理模块503,用于从所述用户行为数据中提取得到按时序统计的时序行为数据,按照预设特征分布规则对所述时序行为数据进行处理,得到与其他参与方设备特征分布一致的待训练数据集;
训练模块504,用于利用所述待训练数据集训练得到参与方模型,并将所述参与方模型发送给所述联邦服务器;所述联邦服务器用于基于各个参与方模型联合训练得到行为预测模型。
可选地,所述预设特征分布规则为按照共用的时序行为特征维度生成特征分布一致的待训练数据的规则;
所述处理模块503具体用于:
按照所述共用的时序行为特征维度,从所述时序行为数据中提取出任一用户在任一时序对象内的时序行为特征;
构建任一用户和任一时序对象之间的特征对,基于所述用户在包含所述时序对象在内的多个时序对象内的时序行为特征,生成与其他参与方设备特征分布一致的待训练数据;
基于各个用户与各个时序对象构成的各个特征对对应的待训练数据,构建所述待训练数据集。
可选地,所述共用的时序行为特征维度包括用户在按时序统计的时序对象的各个子时序对象内的行为特征;
所述处理模块503具体用于:
从所述时序行为数据中提取得到所述用户在所述时序对象内的时序行为数据,根据用户在所述时序对象内的时序行为数据确定用户在所述时序对象的各个子时序对象内是否执行了预设行为;
根据所述用户在所述各个子时序对象内是否执行了所述预设行为,确定所述用户在所述各个子时序对象内的行为特征;
按时序统计所述用户在所述各个子时序对象内的行为特征,构建得到所述用户在所述时序对象内的时序行为特征。
可选地,所述处理模块503具体用于:
按时序顺序拼接所述用户在所述各个子时序对象内的行为特征,至少将拼接得到的一维特征向量作为所述用户在所述时序对象内的时序行为特征。
可选地,所述处理模块503具体用于:
根据所述时序对象的类别确定所述时序对象的类别特征,或者,根据所述时序对象的时间标签确定所述时序对象的标签特征;
拼接所述一维特征向量以及所述类别特征和/或所述标签特征,将拼接得到的一维特征向量作为所述用户在所述时序对象内的时序行为特征。
可选地,所述处理模块503具体用于:
按照所述多个时序对象的时序顺序拼接所述多个时序对象的时序行为特征,将拼接得到的多维特征向量作为所述特征对对应的所述待训练数据。
可选地,所述装置还包括预测模块505;
所述收发模块501将所述参与方模型发送给所述联邦服务器之后,还用于:接收所述联邦服务器发送的所述行为预测模型;
所述预测模块505用于:将待测特征对对应的特征信息输入所述行为预测模型中进行预测,得到所述待测特征对对应的预测时序行为特征;所述待测特征对对应的特征信息包括待测用户在待测时序对象之前的多个时序对象内的时序行为特征;所述预测时序行为特征用于确定所述待测用户在所述待测时序对象内执行预设行为的情况。
从上述内容可以看出:本发明的上述实施例中,参与方设备接收联邦服务器发送的模型训练请求,根据所述模型训练请求获取本地存储的用户行为数据,从所述用户行为数据中提取得到按时序统计的时序行为数据,按照预设特征分布规则对所述时序行为数据进行处理,得到与其他参与方设备特征分布一致的待训练数据集,利用所述待训练数据集训练得到参与方模型,并将所述参与方模型发送给所述联邦服务器;所述联邦服务器用于基于各个参与方模型联合训练得到行为预测模型。本发明实施例中,通过各个参与方设备从用户行为数据中提取得到按时序统计的时序行为数据,再按照预设特征分布规则对所述时序行为数据进行处理,得到与其他参与方设备特征分布一致的待训练数据集,使得各个参与方设备能够使用特征分布一致的待训练数据集训练得到模型结构一致的参与方模型,如此,联邦服务器能够基于各个参与方设备训练得到的模型结构一致的参与方模型训练得到行为预测模型,由于该行为预测模型结合了各个参与方设备的时序行为特征,因此能够用于对各个参与方设备中的用户的时序行为进行预测,行为预测模型的通用性较好,且还可以提高用户时序行为预测的准确率。
基于同一发明构思,本发明实施例还提供了一种计算设备,包括至少一个处理单元以及至少一个存储单元,其中,所述存储单元存储有计算机程序,当所述程序被所述处理单元执行时,使得所述处理单元执行图2至图4任意所述的方法。
基于同一发明构思,本发明实施例还提供了一种计算机可读存储介质,其存储有可由计算设备执行的计算机程序,当所述程序在所述计算设备上运行时,使得所述计算设备执行图2至图4任意所述的方法。
基于同一发明构思,本发明实施例提供了一种终端设备,如图6所示,包括至少一个处理器601,以及与至少一个处理器连接的存储器602,本发明实施例中不限定处理器601与存储器602之间的具体连接介质,图6中处理器601和存储器602之间通过总线连接为例。总线可以分为地址总线、数据总线、控制总线等。
在本发明实施例中,存储器602存储有可被至少一个处理器601执行的指令,至少一个处理器601通过执行存储器602存储的指令,可以执行前述的数据处理方法中所包括的步骤。
其中,处理器601是终端设备的控制中心,可以利用各种接口和线路连接终端设备的各个部分,通过运行或执行存储在存储器602内的指令以及调用存储在存储器602内的数据,从而实现数据处理。可选的,处理器601可包括一个或多个处理单元,处理器601可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理下发指令。可以理解的是,上述调制解调处理器也可以不集成到处理器601中。在一些实施例中,处理器601和存储器602可以在同一芯片上实现,在一些实施例中,它们也可以在独立的芯片上分别实现。
处理器601可以是通用处理器,例如中央处理器(CPU)、数字信号处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本发明实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合数据处理实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器602作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。存储器602可以包括至少一种类型的存储介质,例如可以包括闪存、硬盘、多媒体卡、卡型存储器、随机访问存储器(Random AccessMemory,RAM)、静态随机访问存储器(Static Random Access Memory,SRAM)、可编程只读存储器(Programmable Read Only Memory,PROM)、只读存储器(Read Only Memory,ROM)、带电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、磁性存储器、磁盘、光盘等等。存储器602是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。本发明实施例中的存储器602还可以是电路或者其它任意能够实现存储功能的装置,用于存储程序指令和/或数据。
基于相同的技术构思,本发明实施例提供了一种后端设备,如图7所示,包括至少一个处理器701,以及与至少一个处理器连接的存储器702,本发明实施例中不限定处理器701与存储器702之间的具体连接介质,图7中处理器701和存储器702之间通过总线连接为例。总线可以分为地址总线、数据总线、控制总线等。
在本发明实施例中,存储器702存储有可被至少一个处理器701执行的指令,至少一个处理器701通过执行存储器702存储的指令,可以执行前述的数据处理方法中所包括的步骤。
其中,处理器701是后端设备的控制中心,可以利用各种接口和线路连接后端设备的各个部分,通过运行或执行存储在存储器702内的指令以及调用存储在存储器702内的数据,从而实现数据处理。可选的,处理器701可包括一个或多个处理单元,处理器701可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、应用程序等,调制解调处理器主要对接收到的指令进行解析以及对接收到的结果进行解析。可以理解的是,上述调制解调处理器也可以不集成到处理器701中。在一些实施例中,处理器701和存储器702可以在同一芯片上实现,在一些实施例中,它们也可以在独立的芯片上分别实现。
处理器701可以是通用处理器,例如中央处理器(CPU)、数字信号处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本发明实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合数据处理实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器702作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。存储器702可以包括至少一种类型的存储介质,例如可以包括闪存、硬盘、多媒体卡、卡型存储器、随机访问存储器(Random AccessMemory,RAM)、静态随机访问存储器(Static Random Access Memory,SRAM)、可编程只读存储器(Programmable Read Only Memory,PROM)、只读存储器(Read Only Memory,ROM)、带电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、磁性存储器、磁盘、光盘等等。存储器702是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。本发明实施例中的存储器702还可以是电路或者其它任意能够实现存储功能的装置,用于存储程序指令和/或数据。
本领域内的技术人员应明白,本发明的实施例可提供为方法、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种数据处理方法,其特征在于,应用于参与方设备,所述方法包括:
接收联邦服务器发送的模型训练请求;
根据所述模型训练请求获取本地存储的用户行为数据;
从所述用户行为数据中提取得到按时序统计的时序行为数据,按照预设特征分布规则对所述时序行为数据进行处理,得到与其他参与方设备特征分布一致的待训练数据集;
利用所述待训练数据集训练得到参与方模型,并将所述参与方模型发送给所述联邦服务器;所述联邦服务器用于基于各个参与方模型联合训练得到行为预测模型。
2.根据权利要求1所述的方法,其特征在于,所述预设特征分布规则为按照共用的时序行为特征维度生成特征分布一致的待训练数据的规则;
所述按照预设特征分布规则对所述时序行为数据进行处理,得到与其他参与方设备特征分布一致的待训练数据集,包括:
按照所述共用的时序行为特征维度,从所述时序行为数据中提取出任一用户在任一时序对象内的时序行为特征;
构建任一用户和任一时序对象之间的特征对,基于所述用户在包含所述时序对象在内的多个时序对象内的时序行为特征,生成与其他参与方设备特征分布一致的待训练数据;
基于各个用户与各个时序对象构成的各个特征对对应的待训练数据,构建所述待训练数据集。
3.根据权利要求2所述的方法,其特征在于,所述共用的时序行为特征维度包括用户在按时序统计的时序对象的各个子时序对象内的行为特征;
所述按照所述共用的时序行为特征维度,从所述时序行为数据中提取出用户在任一时序对象内的时序行为特征,包括:
从所述时序行为数据中提取得到所述用户在所述时序对象内的时序行为数据,根据用户在所述时序对象内的时序行为数据确定用户在所述时序对象的各个子时序对象内是否执行了预设行为;
根据所述用户在所述各个子时序对象内是否执行了所述预设行为,确定所述用户在所述各个子时序对象内的行为特征;
按时序统计所述用户在所述各个子时序对象内的行为特征,构建得到所述用户在所述时序对象内的时序行为特征。
4.根据权利要求3所述的方法,其特征在于,所述按时序统计所述用户在所述各个子时序对象内的行为特征,构建得到所述用户在所述时序对象内的时序行为特征,包括:
按时序顺序拼接所述用户在所述各个子时序对象内的行为特征,至少将拼接得到的一维特征向量作为所述用户在所述时序对象内的时序行为特征。
5.根据权利要求4所述的方法,其特征在于,所述至少将拼接得到的一维特征向量作为所述用户在所述时序对象内的时序行为特征,包括:
根据所述时序对象的类别确定所述时序对象的类别特征,或者,根据所述时序对象的时间标签确定所述时序对象的标签特征;
拼接所述一维特征向量以及所述类别特征和/或所述标签特征,将拼接得到的一维特征向量作为所述用户在所述时序对象内的时序行为特征。
6.根据权利要求4或5任一所述的方法,其特征在于,所述基于所述用户在包含所述时序对象在内的多个时序对象内的时序行为特征,生成与其他参与方设备特征分布一致的待训练数据,包括:
按照所述多个时序对象的时序顺序拼接所述多个时序对象的时序行为特征,将拼接得到的多维特征向量作为所述特征对对应的所述待训练数据。
7.根据权利要求1至5中任一项所述的方法,其特征在于,所述将所述参与方模型发送给所述联邦服务器之后,还包括:
接收所述联邦服务器发送的所述行为预测模型;
将待测特征对对应的特征信息输入所述行为预测模型中进行预测,得到所述待测特征对对应的预测时序行为特征;所述待测特征对对应的特征信息包括待测用户在待测时序对象之前的多个时序对象内的时序行为特征;所述预测时序行为特征用于确定所述待测用户在所述待测时序对象内执行预设行为的情况。
8.一种数据处理装置,其特征在于,所述装置包括:
收发模块,用于接收联邦服务器发送的模型训练请求;
获取模块,用于根据所述模型训练请求获取本地存储的用户行为数据;
处理模块,用于从所述用户行为数据中提取得到按时序统计的时序行为数据,按照预设特征分布规则对所述时序行为数据进行处理,得到与其他参与方设备特征分布一致的待训练数据集;
训练模块,用于利用所述待训练数据集训练得到参与方模型,并将所述参与方模型发送给所述联邦服务器;所述联邦服务器用于基于各个参与方模型联合训练得到行为预测模型。
9.一种计算设备,其特征在于,包括至少一个处理单元以及至少一个存储单元,其中,所述存储单元存储有计算机程序,当所述程序被所述处理单元执行时,使得所述处理单元执行权利要求1~7任一权利要求所述的方法。
10.一种计算机可读存储介质,其特征在于,其存储有可由计算设备执行的计算机程序,当所述程序在所述计算设备上运行时,使得所述计算设备执行权利要求1~7任一权利要求所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010071497.1A CN111325572B (zh) | 2020-01-21 | 2020-01-21 | 一种数据处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010071497.1A CN111325572B (zh) | 2020-01-21 | 2020-01-21 | 一种数据处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111325572A true CN111325572A (zh) | 2020-06-23 |
CN111325572B CN111325572B (zh) | 2024-05-03 |
Family
ID=71172515
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010071497.1A Active CN111325572B (zh) | 2020-01-21 | 2020-01-21 | 一种数据处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111325572B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113094407A (zh) * | 2021-03-11 | 2021-07-09 | 广发证券股份有限公司 | 一种基于横向联邦学习的反洗钱识别方法、装置及系统 |
CN113537297A (zh) * | 2021-06-22 | 2021-10-22 | 同盾科技有限公司 | 一种行为数据预测方法及装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108304440A (zh) * | 2017-11-01 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 游戏推送的方法、装置、计算机设备及存储介质 |
CN108629665A (zh) * | 2018-05-08 | 2018-10-09 | 北京邮电大学 | 一种个性化商品推荐方法和系统 |
US20190188572A1 (en) * | 2016-05-20 | 2019-06-20 | Deepmind Technologies Limited | Memory-efficient backpropagation through time |
US20190206057A1 (en) * | 2016-09-13 | 2019-07-04 | Ohio State Innovation Foundation | Systems and methods for modeling neural architecture |
CN110309923A (zh) * | 2019-07-03 | 2019-10-08 | 深圳前海微众银行股份有限公司 | 横向联邦学习方法、装置、设备及计算机存储介质 |
CN110598870A (zh) * | 2019-09-02 | 2019-12-20 | 深圳前海微众银行股份有限公司 | 一种联邦学习方法及装置 |
CN110633806A (zh) * | 2019-10-21 | 2019-12-31 | 深圳前海微众银行股份有限公司 | 纵向联邦学习系统优化方法、装置、设备及可读存储介质 |
-
2020
- 2020-01-21 CN CN202010071497.1A patent/CN111325572B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190188572A1 (en) * | 2016-05-20 | 2019-06-20 | Deepmind Technologies Limited | Memory-efficient backpropagation through time |
US20190206057A1 (en) * | 2016-09-13 | 2019-07-04 | Ohio State Innovation Foundation | Systems and methods for modeling neural architecture |
CN108304440A (zh) * | 2017-11-01 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 游戏推送的方法、装置、计算机设备及存储介质 |
CN108629665A (zh) * | 2018-05-08 | 2018-10-09 | 北京邮电大学 | 一种个性化商品推荐方法和系统 |
CN110309923A (zh) * | 2019-07-03 | 2019-10-08 | 深圳前海微众银行股份有限公司 | 横向联邦学习方法、装置、设备及计算机存储介质 |
CN110598870A (zh) * | 2019-09-02 | 2019-12-20 | 深圳前海微众银行股份有限公司 | 一种联邦学习方法及装置 |
CN110633806A (zh) * | 2019-10-21 | 2019-12-31 | 深圳前海微众银行股份有限公司 | 纵向联邦学习系统优化方法、装置、设备及可读存储介质 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113094407A (zh) * | 2021-03-11 | 2021-07-09 | 广发证券股份有限公司 | 一种基于横向联邦学习的反洗钱识别方法、装置及系统 |
CN113094407B (zh) * | 2021-03-11 | 2022-07-19 | 广发证券股份有限公司 | 一种基于横向联邦学习的反洗钱识别方法、装置及系统 |
CN113537297A (zh) * | 2021-06-22 | 2021-10-22 | 同盾科技有限公司 | 一种行为数据预测方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111325572B (zh) | 2024-05-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111275491A (zh) | 一种数据处理方法及装置 | |
CN109272408A (zh) | 车贷款金融产品智能推荐方法、装置、设备及介质 | |
CN110163683B (zh) | 价值用户关键指标确定方法、广告投放方法及装置 | |
CN107545038A (zh) | 一种文本分类方法与设备 | |
CN110910201B (zh) | 信息推荐的控制方法、装置、计算机设备及存储介质 | |
CN111325572B (zh) | 一种数据处理方法及装置 | |
KR100944117B1 (ko) | 예정가격의 발생 확률을 이용한 입찰 분석 방법 | |
CN109508807A (zh) | 彩票用户活跃度预测方法、系统及终端设备、存储介质 | |
CN109934700A (zh) | 一种套现侦测的方法及装置 | |
CN112765463A (zh) | 一种大数据和用户需求的数据管理方法及云计算服务器 | |
CN111695979A (zh) | 一种原材料与成品的关系分析方法、装置及设备 | |
CN111091460A (zh) | 一种数据处理方法及装置 | |
CN115545103A (zh) | 异常数据识别、标签识别方法和异常数据识别装置 | |
CN107330709B (zh) | 确定目标对象的方法及装置 | |
WO2021129368A1 (zh) | 一种客户类型的确定方法及装置 | |
CN111325255B (zh) | 特定人群圈定方法、装置、电子设备及存储介质 | |
CN113420789A (zh) | 一种预测风险账号的方法、装置、存储介质和计算机设备 | |
JP2000250888A (ja) | 予測目的別モデル選定型需要予測方式 | |
CN116501979A (zh) | 信息推荐方法、装置、计算机设备及计算机可读存储介质 | |
CN115689245A (zh) | 一种用于确定不同场景下骑手的背单量的方法及装置 | |
CN113254787B (zh) | 事件分析方法、装置、计算机设备及存储介质 | |
CN112215511B (zh) | 一种考勤数据的计算方法、装置及设备 | |
CN115278757A (zh) | 一种检测异常数据的方法、装置及电子设备 | |
CN110570301B (zh) | 风险识别方法、装置、设备及介质 | |
CN114418776A (zh) | 一种数据处理方法、装置、终端设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |