CN111814977A - 训练事件预测模型的方法及装置 - Google Patents
训练事件预测模型的方法及装置 Download PDFInfo
- Publication number
- CN111814977A CN111814977A CN202010888440.0A CN202010888440A CN111814977A CN 111814977 A CN111814977 A CN 111814977A CN 202010888440 A CN202010888440 A CN 202010888440A CN 111814977 A CN111814977 A CN 111814977A
- Authority
- CN
- China
- Prior art keywords
- sample
- feature
- event
- target domain
- source domain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012549 training Methods 0.000 title claims abstract description 123
- 238000000034 method Methods 0.000 title claims abstract description 98
- 238000013528 artificial neural network Methods 0.000 claims abstract description 90
- 230000008569 process Effects 0.000 claims abstract description 23
- 239000013598 vector Substances 0.000 claims description 295
- 238000000605 extraction Methods 0.000 claims description 77
- 238000012545 processing Methods 0.000 claims description 56
- 238000012512 characterization method Methods 0.000 claims description 33
- 238000004590 computer program Methods 0.000 claims description 3
- 238000013508 migration Methods 0.000 abstract description 3
- 230000005012 migration Effects 0.000 abstract description 3
- 230000007935 neutral effect Effects 0.000 abstract description 3
- 238000002955 isolation Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 26
- 230000006399 behavior Effects 0.000 description 20
- 238000011156 evaluation Methods 0.000 description 6
- 230000003993 interaction Effects 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000013526 transfer learning Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000006735 deficit Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Mathematical Physics (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本说明书实施例提供一种训练事件预测模型的方法,该方法可以应用于迁移学习的场景,通过设置中立的服务器,实现源域参与方和目标域参与方的数据隔离和隐私安全保护。其中源域参与方部署源域特征提取器,目标域参与方部署目标域特征器,中立的服务器中部署事件预测模型中的模型共用部分,具体包括共享特征提取器、图神经网络和分类网络。对于任一的参与方,其利用本域的特征提取器对本域中的样本进行特征提取,得到本域特征表示,再利用从服务器获取的模型共用部分的当前参数,对该本域特征表示进行处理,得到对应的事件分类结果,进而基于事件分类结果和本域样本进行模型更新,并将模型共用部分的更新结果上传至服务器,以使服务器进行集中更新。
Description
技术领域
本说明书一个或多个实施例涉及机器学习领域,尤其涉及利用机器学习训练事件预测模型的方法和装置。
背景技术
在许多场景下,需要对用户操作行为或操作事件进行分析和处理。例如,为了识别出有可能威胁网络安全或用户信息安全的高风险操作行为,例如盗取账户、流量攻击、欺诈交易等等,可以评估用户操作行为的风险程度,以便进行风险防控。
为了评估某项操作行为的风险度,可以基于该项操作行为本身的特征进行分析。进一步地,还可以更全面地考虑用户的行为序列。行为序列是用户在日常操作使用中产生的一系列点击、访问、购买等事件的发生过程,可表示为事件集合的时间序列,它蕴含了用户的细粒度习惯偏好等特点,便于更全面地分析用户的操作历史和操作模式。
随着机器学习的兴起,利用机器学习对操作行为或操作事件进行评估,已成为当下研究的热点。然而,目前的评估方式较为单一,导致评估准确度十分有限。因此,希望能有改进的方案,更为准确有效地对操作事件进行分析处理,以便于进行风险防控。
发明内容
本说明书一个或多个实施例描述了训练事件预测模型的方法及装置,其中通过构建基于用户事件序列的关系网络图,并利用高阶的、具有丰富表征含义的特征表示对关系网络图中的节点进行节点向量初始化,进而对关系网络进行更加有效的图嵌入处理,从而实现对事件的准确表征和分类预测。
根据第一方面,提供一种训练事件预测模型的方法,所述方法包括:
获取多个训练样本,其中各个样本中包括用户的多个操作事件构成的事件序列,以及对应的分类标签;获取针对该多个训练样本对应的多个用户而构建的关系网络图,其中包括对应该多个用户的多个节点,以及节点之间存在关联关系而形成的连接边;将所述各个样本作为当前样本,输入事件预测模型,该事件预测模型包括特征提取器、图神经网络和分类网络,其中,利用所述特征提取器对所述当前样本进行特征提取,所述特征提取器包括编码层、第一嵌入层和第二嵌入层;其中编码层用于,针对当前样本所对应当前事件序列中的每个事件,将该事件的多项属性信息编码为对应的多个编码向量;第一嵌入层用于,对所述每个事件的多个编码向量进行第一组合,得到各个事件对应的各个事件向量;第二嵌入层用于,对所述各个事件向量进行第二组合,得到所述当前事件序列对应的特征表示;利用所述图神经网络,基于所述特征表示,对所述关系网络图进行图嵌入处理,得到所述当前事件序列的图嵌入向量;利用所述分类网络,基于所述图嵌入向量,预测所述当前样本的事件类别,得到预测结果;基于各个样本的预测结果和对应的分类标签,训练所述事件预测模型。
根据第二方面,提供一种训练事件预测模型的方法,所述方法包括:
获取训练样本集,其中包括多个源域样本和多个目标域样本,其中各个样本具有对应的分类标签;每个源域样本包括源域用户的多个源域事件构成的源域事件序列,每个目标域样本包括目标域用户的多个目标域事件构成的目标域事件序列;获取针对所述多个源域样本对应的多个源域用户而构建的源域关系网络图,其中包括对应该多个源域用户的多个源域节点,以及源域节点之间存在关联关系而形成的连接边;获取针对所述多个目标域样本对应的多个目标域用户而构建的目标域关系网络图,其中包括对应该多个目标域用户的多个目标域节点,以及目标域节点之间存在关联关系而形成的连接边;将所述各个样本作为当前样本,输入事件预测模型,该事件预测模型包括源域特征提取器、目标域特征提取器、共享特征提取器、图神经网络和分类网络,其中,当所述当前样本为源域样本时,采用所述源域特征提取器对该源域样本进行特征提取,得到源域特征表示;利用所述图神经网络,基于所述源域特征表示,对所述源域关系网络图进行图嵌入处理,得到该源域样本的源域图嵌入向量;采用所述共享特征提取器,对该源域样本进行特征提取,得到第一特征表示;根据所述源域图嵌入向量和第一特征表示,得到源域样本的样本特征向量;当所述当前样本为目标域样本时,采用所述目标域特征提取器对该目标域样本进行特征提取,得到目标域特征表示;利用所述图神经网络,基于所述目标域特征表示,对所述目标域关系网络图进行图嵌入处理,得到该目标域样本的目标域图嵌入向量;采用所述共享特征提取器,对该目标域样本进行特征提取,得到第二特征表示;根据所述目标域图嵌入向量和第二特征表示,得到目标域样本的样本特征向量;利用所述分类网络,基于所述当前样本的样本特征向量,预测当前样本的事件类别,得到预测结果;基于各个样本的预测结果和对应的分类标签,训练所述事件预测模型。
根据第三方面,提供一种实现隐私保护的多方联合训练事件预测模型的方法,所述多方包括第一参与方、第二参与方和服务器;所述第一参与方中部署源域特征提取器,所述第二参与方中部署目标域特征器;所述服务器中部署模型共用部分,具体包括共享特征提取器、图神经网络和分类网络;所述方法应用于所述第一参与方,所述方法包括:
获取多个源域样本,其中每个源域样本包括源域用户的多个源域事件构成的源域事件序列,以及对应的分类标签;获取针对所述多个源域样本对应的多个源域用户而构建的源域关系网络图,其中包括对应该多个源域用户的多个源域节点,以及源域节点之间存在关联关系而形成的连接边;将所述各个样本作为当前样本,输入事件预测模型,其中,从所述服务器获取所述模型共用部分的当前参数;采用所述源域特征提取器对该源域样本进行特征提取,得到源域特征表示;利用所述图神经网络的当前参数,基于所述源域特征表示,对所述源域关系网络图进行图嵌入处理,得到该源域样本的源域图嵌入向量;采用所述共享特征提取器的当前参数,对该源域样本进行特征提取,得到第一特征表示;根据该源域图嵌入向量和第一特征表示,得到源域样本的样本特征向量;利用所述分类网络的当前参数,基于所述当前样本的样本特征向量,预测当前样本的事件类别,得到预测结果;基于各个样本的预测结果和对应的分类标签,对所述源域特征提取器和所述模型共用部分的当前参数进行更新;将所述模型共用部分的当前参数的第一更新结果,发送至所述服务器,以使所述服务器根据该第一更新结果,以及从所述第二参与方接收的针对所述模型共用部分的当前参数的第二更新结果,更新所述模型共用部分。
根据第四方面,提供一种实现隐私保护的多方联合训练事件预测模型的方法,所述多方包括第一参与方、第二参与方和服务器;所述第一参与方中部署源域特征提取器,所述第二参与方中部署目标域特征器;所述服务器中部署模型共用部分,具体包括共享特征提取器、图神经网络和分类网络;所述方法应用于所述第二参与方,所述方法包括:
获取多个目标域样本,其中每个目标域样本包括目标域用户的多个目标域事件构成的目标域事件序列,以及对应的分类标签;获取针对所述多个目标域样本对应的多个目标域用户而构建的目标域关系网络图,其中包括对应该多个目标域用户的多个目标域节点,以及目标域节点之间存在关联关系而形成的连接边;将所述各个样本作为当前样本,输入事件预测模型,其中,从所述服务器获取所述模型共用部分的当前参数;采用所述目标域特征提取器对该目标域样本进行特征提取,得到目标域特征表示;利用所述图神经网络的当前参数,基于所述目标域特征表示,对所述目标域关系网络图进行图嵌入处理,得到该目标域样本的目标域图嵌入向量;采用所述共享特征提取器的当前参数,对该目标域样本进行特征提取,得到第二特征表示;根据该目标域图嵌入向量和第二特征表示,得到目标域样本的样本特征向量;利用所述分类网络的当前参数,基于所述当前样本的样本特征向量,预测当前样本的事件类别,得到预测结果;基于各个样本的预测结果和对应的分类标签,对所述目标域特征提取器和所述模型共用部分的当前参数进行更新;将所述模型共用部分的当前参数的第二更新结果,发送至所述服务器,以使所述服务器根据该第二更新结果,以及从所述第二参与方接收的针对所述模型共用部分的当前参数的第一更新结果,更新所述模型共用部分。
根据第五方面,提供一种实现隐私保护的多方联合训练事件预测模型的方法,所述多方包括第一参与方、第二参与方和服务器;所述第一参与方中部署源域特征提取器,所述第二参与方中部署目标域特征器;所述服务器中部署模型共用部分,具体包括共享特征提取器、图神经网络和分类网络;所述方法应用于所述服务器,所述方法包括:
分别向所述第一参与方和第二参与方发送所述模型共用部分的当前参数;从所述第一参与方接收其根据上述第三方面提供的方法得到的针对所述当前参数的第一更新结果;从所述第二参与方接收其根据上述第四方面提供的方法得到的针对所述当前参数的第二更新结果;基于所述第一更新结果和第二更新结果,更新所述服务器中部署的模型共用部分。
根据第六方面,提供一种训练事件预测模型的装置,所述装置包括:
样本获取单元,配置为获取多个训练样本,其中各个样本中包括用户的多个操作事件构成的事件序列,以及对应的分类标签;关系图获取单元,配置为获取针对该多个训练样本对应的多个用户而构建的关系网络图,其中包括对应该多个用户的多个节点,以及节点之间存在关联关系而形成的连接边;事件预测单元,配置为将所述各个样本作为当前样本,输入事件预测模型,该事件预测模型包括特征提取器、图神经网络和分类网络,其中事件预测单元包括:样本表征模块,配置为利用所述特征提取器对所述当前样本进行特征提取,所述特征提取器包括编码层、第一嵌入层和第二嵌入层;其中编码层用于,针对当前样本所对应当前事件序列中的每个事件,将该事件的多项属性信息编码为对应的多个编码向量;第一嵌入层用于,对所述每个事件的多个编码向量进行第一组合,得到各个事件对应的各个事件向量;第二嵌入层用于,对所述各个事件向量进行第二组合,得到所述当前事件序列对应的特征表示;图嵌入模块,配置为利用所述图神经网络,基于所述特征表示,对所述关系网络图进行图嵌入处理,得到所述当前事件序列的图嵌入向量;分类预测模块,配置为利用所述分类网络,基于所述图嵌入向量,预测所述当前样本的事件类别,得到预测结果;训练单元,配置为基于各个样本的预测结果和对应的分类标签,训练所述事件预测模型。
根据第七方面,提供一种训练事件预测模型的装置,所述装置包括:
样本获取单元,配置为获取训练样本集,其中包括多个源域样本和多个目标域样本,其中各个样本具有对应的分类标签;每个源域样本包括源域用户的多个源域事件构成的源域事件序列,每个目标域样本包括目标域用户的多个目标域事件构成的目标域事件序列;关系图获取单元,配置为获取针对所述多个源域样本对应的多个源域用户而构建的源域关系网络图,其中包括对应该多个源域用户的多个源域节点,以及源域节点之间存在关联关系而形成的连接边;获取针对所述多个目标域样本对应的多个目标域用户而构建的目标域关系网络图,其中包括对应该多个目标域用户的多个目标域节点,以及目标域节点之间存在关联关系而形成的连接边;事件预测单元,配置为将所述各个样本作为当前样本,输入事件预测模型,该事件预测模型包括源域特征提取器、目标域特征提取器、共享特征提取器、图神经网络和分类网络;所述事件预测单元包括:源域样本表征模块,配置为当所述当前样本为源域样本时,采用所述源域特征提取器对该源域样本进行特征提取,得到源域特征表示;利用所述图神经网络,基于所述源域特征表示,对所述源域关系网络图进行图嵌入处理,得到该源域样本的源域图嵌入向量;采用所述共享特征提取器,对该源域样本进行特征提取,得到第一特征表示;根据所述源域图嵌入向量和第一特征表示,得到源域样本的样本特征向量;目标域样本表征模块,配置为当所述当前样本为目标域样本时,采用所述目标域特征提取器对该目标域样本进行特征提取,得到目标域特征表示;利用所述图神经网络,基于所述目标域特征表示,对所述目标域关系网络图进行图嵌入处理,得到该目标域样本的目标域图嵌入向量;采用所述共享特征提取器,对该目标域样本进行特征提取,得到第二特征表示;根据所述目标域图嵌入向量和第二特征表示,得到目标域样本的样本特征向量;分类预测模块,配置为利用所述分类网络,基于所述当前样本的样本特征向量,预测当前样本的事件类别,得到预测结果;训练单元,配置为基于各个样本的预测结果和对应的分类标签,训练所述事件预测模型。
根据第八方面,提供一种实现隐私保护的多方联合训练事件预测模型的装置,所述多方包括第一参与方、第二参与方和服务器;所述第一参与方中部署源域特征提取器,所述第二参与方中部署目标域特征器;所述服务器中部署模型共用部分,具体包括共享特征提取器、图神经网络和分类网络;所述装置集成于所述第一参与方,所述装置包括:
样本获取单元,配置为获取多个源域样本,其中每个源域样本包括源域用户的多个源域事件构成的源域事件序列,以及对应的分类标签;关系图获取单元,配置为获取针对所述多个源域样本对应的多个源域用户而构建的源域关系网络图,其中包括对应该多个源域用户的多个源域节点,以及源域节点之间存在关联关系而形成的连接边;事件预测单元,配置为将所述各个样本作为当前样本,输入事件预测模型,其中所述事件预测单元包括:参数获取模块,配置为从所述服务器获取所述模型共用部分的当前参数;样本表征模块,配置为采用所述源域特征提取器对该源域样本进行特征提取,得到源域特征表示;利用所述图神经网络的当前参数,基于所述源域特征表示,对所述源域关系网络图进行图嵌入处理,得到该源域样本的源域图嵌入向量;采用所述共享特征提取器的当前参数,对该源域样本进行特征提取,得到第一特征表示;根据该源域图嵌入向量和第一特征表示,得到源域样本的样本特征向量;分类预测模块,配置为利用所述分类网络的当前参数,基于所述当前样本的样本特征向量,预测当前样本的事件类别,得到预测结果;参数更新单元,配置为基于各个样本的预测结果和对应的分类标签,对所述源域特征提取器和所述模型共用部分的当前参数进行更新;结果发送单元,配置为将所述模型共用部分的当前参数的第一更新结果,发送至所述服务器,以使所述服务器根据该第一更新结果,以及从所述第二参与方接收的针对所述模型共用部分的当前参数的第二更新结果,更新所述模型共用部分。
根据第九方面,提供一种实现隐私保护的多方联合训练事件预测模型的装置,所述多方包括第一参与方、第二参与方和服务器;所述第一参与方中部署源域特征提取器,所述第二参与方中部署目标域特征器;所述服务器中部署模型共用部分,具体包括共享特征提取器、图神经网络和分类网络;所述装置集成于所述第二参与方,所述装置包括:
样本获取单元,配置为获取多个目标域样本,其中每个目标域样本包括目标域用户的多个目标域事件构成的目标域事件序列,以及对应的分类标签;关系图获取单元,配置为获取针对所述多个目标域样本对应的多个目标域用户而构建的目标域关系网络图,其中包括对应该多个目标域用户的多个目标域节点,以及目标域节点之间存在关联关系而形成的连接边;事件预测单元,配置为将所述各个样本作为当前样本,输入事件预测模型,其中所述事件预测单元包括:参数获取模块,配置为从所述服务器获取所述模型共用部分的当前参数;样本表征模块,配置为采用所述目标域特征提取器对该目标域样本进行特征提取,得到目标域特征表示;利用所述图神经网络的当前参数,基于所述目标域特征表示,对所述目标域关系网络图进行图嵌入处理,得到该目标域样本的目标域图嵌入向量;采用所述共享特征提取器的当前参数,对该目标域样本进行特征提取,得到第二特征表示;根据该目标域图嵌入向量和第二特征表示,得到目标域样本的样本特征向量;分类预测模块,配置为利用所述分类网络的当前参数,基于所述当前样本的样本特征向量,预测当前样本的事件类别,得到预测结果;参数更新单元,配置为基于各个样本的预测结果和对应的分类标签,对所述目标域特征提取器和所述模型共用部分的当前参数进行更新;结果发送单元,配置为将所述模型共用部分的当前参数的第二更新结果,发送至所述服务器,以使所述服务器根据该第二更新结果,以及从所述第二参与方接收的针对所述模型共用部分的当前参数的第一更新结果,更新所述模型共用部分。
根据第十方面,提供一种实现隐私保护的多方联合训练事件预测模型的装置,所述多方包括第一参与方、第二参与方和服务器;所述第一参与方中部署源域特征提取器,所述第二参与方中部署目标域特征器;所述服务器中部署模型共用部分,具体包括共享特征提取器、图神经网络和分类网络;所述装置集成于所述服务器,所述装置包括:
参数发送单元,配置为分别向所述第一参与方和第二参与方发送模型共用部分的当前参数;第一结果接收单元,配置为从所述第一参与方接收其根据上述第八方面提供的装置得到的针对所述当前参数的第一更新结果;第二结果接收单元,配置为从所述第二参与方接收其根据上述第九方面提供的装置得到的针对所述当前参数的第二更新结果;参数更新单元,配置为基于所述第一更新结果和第二更新结果,更新所述服务器中部署的模型共用部分。
根据第十一方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面至第五方面中任一方面提供的方法。
根据第十二方面,提供了一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面至第五方面中任一方面提供的方法。
根据本说明书实施例提供的方法和装置,通过构建基于用户事件序列的关系网络图,并利用高阶的、具有丰富表征含义的特征表示对关系网络图中的节点进行节点向量初始化,进而对关系网络进行更加有效的图嵌入处理,从而实现对事件的准确表征和分类预测。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本说明书披露的一个实施例的实施场景示意图;
图2示出根据一个实施例的训练事件预测模型的方法流程图;
图3为本说明书披露的另一个实施例的实施场景示意图;
图4示出根据另一个实施例的训练事件预测模型的方法流程图;
图5示出根据一个实施例的事件预测模型的结构示意图;
图6示出根据一个实施例的实现隐私保护的多方联合训练事件预测模型的方法流程图;
图7示出根据另一个实施例的实现隐私保护的多方联合训练事件预测模型的方法流程图;
图8示出根据又一个实施例的实现隐私保护的多方联合训练事件预测模型的方法流程图;
图9示出根据一个实施例的训练事件预测模型的装置的示意性框图;
图10示出根据另一个实施例的训练事件预测模型的装置的示意性框图;
图11示出根据一个实施例的实现隐私保护的多方联合训练事件预测模型的装置的示意性框图;
图12示出根据另一个实施例的实现隐私保护的多方联合训练事件预测模型的装置的示意性框图;
图13示出根据又一个实施例的实现隐私保护的多方联合训练事件预测模型的装置的示意性框图。
具体实施方式
下面结合附图,对本说明书提供的方案进行描述。
本说明书实施例披露一种训练事件预测模型的方法,为便于理解,下面先对该方法的发明构思进行介绍。
首先,发明人想到,不同用户的操作事件序列之间可能具有一定的关联关系,例如,其发生基于相同的终端设备(如智能手机),相应地,可以利用多个用户构建关系网络图,进而利用图神经网络对该关系网络图进行表征,如此得到的节点表征向量中不仅包含对应事件序列自身的特征,还融入了其他关联事件序列的特征,因此可以有效丰富事件序列表征向量的含义,提高表征的全面性和准确性。
此外,发明人还想到,对于关系网络图中的用户节点(或称事件序列节点),在一种实施方式中,可以利用其对应事件序列中各个事件的原始特征初始化其节点向量;在另一种实施方式中,为了进一步提高后续节点表征向量的准确性,还可以借鉴FM(Factorization Machine,因子分解机)的框架,对事件序列自身的原始特征进行高阶组合运算,从而得到具有丰富、有效含义的特征表示,用于初始化关系网络图中节点的向量。
基于上述发明构思,接下来结合图1示出的实施场景示意图,描述上述方法的一个实施示例。具体地,图1中示出的事件预测模型中包括特征提取器、图神经网络和分类网络,其中特征提取器的实现借鉴了上述FM的框架,并且,该特征提取器具体包括编码层、第一嵌入层和第二嵌入层,其中编码层用于对当前训练样本中各个事件的多项属性信息进行编码,得到多个编码向量,第一嵌入层和第二嵌入层用于依次对输入其中的向量进行高阶组合,进而得到当前事件序列的特征表示;其中图神经网络用于基于该特征表示对上述关系网络图进行图嵌入处理,得到该事件的图嵌入向量;其中分类网络用于基于该图嵌入向量,得到当前事件序列的分类结果;进一步地,可以基于该分类结果及训练样本中当前事件序列的分类标签,确定预测损失,进而利用该预测损失对事件预测模型进行训练。
以下结合具体的实施例,对上述方法进行进一步详细介绍。
具体地,图2示出根据一个实施例的训练事件预测模型的方法流程图。可以理解,该方法可以通过任何具有计算、处理能力的装置、设备、平台、设备集群来执行。如图2所示,训练过程至少包括以下步骤。
步骤S210,获取多个训练样本。
为训练事件预测模型,每个训练样本包括,预定数量(例如10件或20件)的历史事件构成的事件序列<E1,E2,…,En>,以及针对该事件序列标注的分类标签。分类标签可以是针对整个事件序列,或针对事件序列中最后一个事件En的事件类别进行的标注,事件类别例如可以是,欺诈事件或非欺诈事件的分类类别,事件风险度级别的分类类别,等等。需要理解,历史事件序列中的各个事件对应相同的触发用户。
每个事件可以具有多项与事件有关的属性信息。为了事件评估的全面性,可以获取各个事件的细粒度的全面的属性信息以供后续处理。这些属性信息可以包括,用户操作行为的行为类型(例如,登录操作,充值操作,支付操作,交易操作等),行为时间,用户操作所使用的设备信息(例如设备型号、MAC地址,IP地址等等),所使用的软件方面的信息,例如浏览器类型,app版本,等等。如果操作行为是交易行为,属性信息还可以包括交易行为的涉及金额,付款渠道,交易对象,等等。在一个实施例中,事件属性信息还可以包括,历史操作事件的操作结果,例如操作成功,失败,超时,等等。
如此,采集历史事件序列中各个历史事件的属性信息,形成样本特征,并结合该事件序列的分类标签,形成训练样本。
由上可以获取多个训练样本,且该多个训练样本对应多个用户。另一方面,可以在步骤S220,获取针对该多个用户构建的关系网络图,其中包括对应该多个用户的多个节点,以及节点之间存在关联关系而形成的连接边。需要理解,关系网络图中除包括对应该多个用户的多个节点以外,还可以包括对应其他用户的其他节点。在一个实施例中,节点之间存在的关联关系可以包括以下中的至少一种:对应事件序列的操作设备相同,对应事件序列中的最后一个事件的操作设备相同,对应用户之间的交互达到预定交互标准。在一个具体的实施例中,其中预定交互标准可以包括:互相转账的次数超过次数阈值(如10次)、社交平台上互相关注的时长超过时长阈值(如1年)、利用通讯软件进行通讯的天数超过天数阈值(如30天)、在预定时间内(如最近10min或1h内)发生交互(如转账、通讯、社交平台互动等)。如此,可以获取事件关系网络图。
基于以上获取的多个训练样本,在步骤S230,将其中各个样本作为当前样本,输入事件预测模型,该事件预测模型包括特征提取器、图神经网络和分类网络。需要说明,事件预测模型的结构可以参见图1。对于步骤S230的实施具体包括:
在步骤S231,利用特征提取器对当前样本进行特征提取,该特征提取器包括编码层、第一嵌入层和第二嵌入层。其中编码层针对当前样本所对应当前事件序列中的每个事件,将该事件的多项属性信息编码为对应的多个编码向量。
编码层可以采用多种编码方式进行编码。
在一个实施例中,在编码层中预先构造一个映射表或查找表,其中记录各个属性下不同属性值与编码向量的映射关系。对于输入事件的各项属性,根据具体的属性值查找该映射表,得到对应的编码向量。
在一个实施例中,编码层可以采用独热one-hot编码方式将一项属性信息编码为一个编码向量。One-hot编码方式适合于属性值为有限多个的属性信息。
对于属性取值不限的属性信息,例如包含有文字描述的属性字段,在一个实施例中,编码层还可以采用更为复杂的神经网络进行词嵌入,以得到属性信息对应的编码向量。
通过采用各种编码方式,编码层将各个事件Ei的多项属性信息编码为对应的多个编码向量。
然后,第一嵌入层对各个事件的所述多个编码向量进行第一组合,得到各个事件对应的各个事件向量。
在一个实施例中,上述第一组合包括多个编码向量的加权线性组合。
根据一种实施方式,上述第一组合还包括,涉及N个编码向量相乘的N阶向量间组合运算,其中N>=2。
可以理解,常规神经网络中对特征向量的组合一般是采用线性组合的方式。然而,在事件包含多项属性信息的情况下,属性信息之间有时候并非完全独立,而是存在一定的依赖关系或关联关系,而简单的线性组合却不足以发现和处理这样的关联关系。因此,在一个实施例中,借鉴FM因子分解机的框架,在第一嵌入层中引入高阶向量间组合运算。
N阶向量间组合运算涉及N个编码向量的相乘运算,从而可以表征N个编码向量之间的关联关系。其中,阶数N为预设的超参数,例如,可以设置为2,或3,或4。
在以上公式(1)中,为n个编码向量的线性组合,为2阶向量间组合运算,其中涉及2个编码向量的相乘, 为3阶向量组合运算,其中涉及3个编码向量的相乘。高阶运算中编码向量的相乘可以采取按位相乘的方式进行,其结果仍然是一个向量。并且,需要理解,以上公式(1)中的各项权重系数,包括线性权重系数,2阶权重系数,3阶权重系数,均通过神经网络的训练而确定。
在一个实施例中,还可以对以上例如公式(1)示出的第一向量组合方式进行修改,例如省略其中的线性组合项,或者省略其中的部分高阶向量间组合项,得到第一向量组合方式的更多变换实施方案。
在第一嵌入层针对事件序列<E1,E2,…,En>中各个事件Ei得到对应的事件向量Ai的基础上,第二嵌入层将各个事件向量Ai进行第二组合,得到当前事件序列对应的特征表示。
在一个实施例中,第二嵌入层采用线性组合的方式,对各个事件向量A1,A2,…,An进行线性加权叠加,得到当前事件序列对应的特征表示Y。
在另一个实施例中,第二嵌入层采用基于时序的神经网络,对各个事件向量进行时序处理。具体的,上述基于时序的神经网络可以是,循环神经网络RNN,或者长短期记忆神经网络LSTM。于是,可以将上述各个事件向量A1,A2,…,An按照事件发生时间的先后顺序,依次输入RNN或LSTM。RNN或LSTM神经网络于是依次迭代处理该多个事件向量构成的向量序列,得到事件序列的特征表示Y。更具体的,RNN或LSTM可以将处理完最后一个事件向量An时得到的隐含向量,作为序列的特征表示。
在又一实施例中,第二嵌入层也可以对输入的多个事件向量A1,A2,…,An进行组合运算,其中包括线性组合和高阶向量间组合,由此得到当前事件序列的特征表示Y。具体地,可以预设第二嵌入层中高阶组合运算的阶数M,其中M>=2, 该阶数M与第一嵌入层中的阶数N是互相独立的超参数,可以相同,也可以不同。于是,在第二嵌入层中,可以对第一嵌入层输出的多个事件向量A1,A2,…,An进行线性组合运算,以及进行M阶之内的向量间组合运算,基于各组合运算的求和,得到序列特征表示Y。具体运算过程与前述对第一嵌入层的描述相似,不再赘述。
如此,第二嵌入层对输入事件序列中各个事件对应的事件向量直接进行组合,得到序列特征表示Y。
根据另一方面的实施例,第二嵌入层对事件序列中最后一个事件En进行特殊处理。这是因为,在使用事件预测模型进行事件评估时,是将待评估的事件与之前的历史事件构成一个序列输入到模型中进行评估,因此待评估的事件是输入序列中最后一个事件。相应的,在模型训练所使用的训练样本中,分类标签往往是针对事件序列中最后一个事件进行标注的。因此,事件序列中最后一个事件,或者作为待评估的对象,或者作为标注的对象,具有与其他事件不同的性质。
考虑到以上特点,第二嵌入层首先对事件序列中除最后一个事件的其他事件对应的事件向量A1,A2,…,An-1进行第三组合,得到一个组合向量。第三组合的组合方式可以与上述第二组合方式相同。然后,将最后一个事件对应的事件向量An与前述组合向量进行第四组合,得到最终的事件序列的特征表示Y。其中,第四组合可以是线性加权组合,或者是直接拼接。
以上,利用特征提取器对当前样本进行特征提取,可以得到当前事件序列的特征表示。接着,在步骤S232,利用上述图神经网络,基于该特征表示,对上述关系网络图进行图嵌入处理,得到该当前事件序列的图嵌入向量。具体地,利用当前事件序列的特征表示,对关系网络图中与该当前事件序列对应的当前节点进行节点向量初始化,同理,对于关系网络图中其他事件序列对应的节点,也可以采用步骤S231中描述的实施例确定对应的特征表示,进而对节点进行初始化。在一个实施例中,其中图神经网络可以是图卷积网络(GraphConvolution Networks,GCN)、或图注意力网络(Graph Attention Networks)、或图自编码器(Graph Autoencoders)等。在一个实施例中,其中图嵌入处理可以包括对当前事件序列所对应当前节点进行多级邻居节点聚合,进而确定当前事件序列的图嵌入向量。
以上,可以得到该当前事件序列的图嵌入向量。然后在步骤S233,利用上述分类网络,基于该图嵌入向量,预测当前样本的事件类别,得到预测结果。在一个实施例中,其中分类网络可以利用逻辑回归(Logistic Regression)模型实现。在另一个实施例中,其中分类网络可以利用若干全连接层实现。
在以上通过事件预测模型得到当前样本的类别预测结果后,在步骤S240,结合该类别预测结果和当前样本的分类标签,训练事件预测模型。在一种实施方式中,可以基于该类别预测结果和分类标签,确定预测损失,再基于该预测损失,利用反向传播法,调整事件预测模型的参数。进一步,在一个实施例中,可以在某次训练中同时调节特征提取器、图神经网络和分类网络的模型参数。在另一个实施例中,可以在某次训练中固定特征提取器和分类网络的模型参数,调节图神经网络的模型参数,再在下次训练中固定图神经网络的模型参数,而调节特征提取器和分类网络的模型参数。
由上,通过构建针对多个事件的关系网络图,借鉴FM框架对节点向量进行初始表征,再利用图神经网络算法对关系网络图进行嵌入处理,得到图嵌入向量,实现对事件进行全面、准确的向量表征,进而得到准确的分类结果。
根据另一方面的实施例,发明人提出,还可以借鉴wide and deep(深度和广度)模型的框架,在事件预测中引入一些经验特征,以更加全面地表征事件。具体地,对应上述多个训练样本,其中各个样本还可以包括对应用户的画像特征,事件预测模型还可以包括用于处理该画像特征的特征编码器,该特征编码器用于对所述用户画像特征进行编码,得到画像编码向量。在一个实施例中,用户画像特征可以包括单项特征,例如性别、年龄、兴趣爱好、职业、所属群体(如高消费群体、低消费群体等)。在另一个实施例中,用户画像特征可以包括基于单项特征得到的经验组合特征,例如,某个经验组合特征的取值规则为,如果用户的性别为男且喜欢打篮球,则该经验组合特征的取值为1,否则为0。在一个实施例中,其中特征编码器的编码方式可以参见前述对编码层的描述。
对于画像编码向量的利用,在一个实施例中,上述步骤S232可以包括:利用图神经网络,基于当前样本对应的特征表示和当前画像编码向量,对关系网络图进行图嵌入处理,得到图嵌入向量。在一个具体的实施例中,可以对该特征表示和当前画像编码向量进行融合处理,再利用得到的融合向量对当前事件序列对应的当前节点进行节点向量初始化。在一个示例中,其中融合处理可以包括拼接、相加或求平均等。在另一个实施例中,上述步骤S233可以包括:将图嵌入向量和当前画像编码向量,输入分类网络中,得到所述预测结果。在一个具体的实施例中,可以对该图嵌入向量和当前画像编码向量进行融合处理,再将得到的融合向量输入分类网络中,得到所述预测结果。
以上,通过引入基于用户画像特征,可以实现对事件序列进行的更加全面、丰富、准确的表征。
如前所述,为了对操作事件进行评估,其特征刻画和表征非常重要。然而,如本领域技术人员所知,模型训练依赖于大量的标注数据。在一些标注数据稀少的领域,很难进行这样的模型训练和学习。
考虑到以上问题,在本说明书披露的另一方面的实施例中,利用迁移学习的方式,借助数据量更为丰富的相似领域的标注数据,来进行模型训练,使得训练得到的模型可以用于数据量较少的领域。一般地,可以将数据量更为丰富的领域称为源域,将有待进行分析和学习,但是数据量较少的领域称为目标域。
例如,在一个场景中,需要分析用户在客服平台中的交互事件。假定热线客服平台已经启用较长时间,积累了大量的数据,而有待分析的在线客服平台由于上线不久,数据较为稀少,而两者的数据具有一定相似性,那么可以将热线客服平台作为源域,将在线客服平台作为目标域。又例如,在另一场景中,需要分析某一服务平台中不同区域用户的操作事件。假定华东地区启用该服务时间较长,积累数据较多,而有待分析的华北地区则开通该服务不久,数据稀少,那么可以将华东地区作为源域,将华北地区作为目标域。
由于源域数据比较丰富,常规迁移学习中,往往基于源域数据训练一个模型,然后通过生成对抗等方式,使得目标域数据拟合源域数据,通过多步骤多阶段训练,得到适于目标域的模型。与上述常规迁移学习不同的,在本说明书公开的实施例中,将源域数据和目标域数据进行有区分地统一训练,从而快速高效地得到适用于源域和目标域两者的事件预测模型。
图3示出根据另一个实施例的实施场景示意图。如图3所示,采集来自源域和目标域的历史数据作为训练样本集,训练事件预测模型。更具体的,训练样本集中包括大量的源域样本和相对少量的目标域样本,每个样本包括对应域的历史事件构成的事件序列。
事件预测模型可以划分为源域部分,共享部分,目标域部分。
在训练过程中,对于源域样本,将其输入到源域部分和共享部分进行综合处理,对于目标域样本,将其输入共享部分和目标域部分进行综合处理,根据两个域样本的综合处理的结果,得到预测损失,并据此训练整个事件预测模型。
在这个过程中,由于源域样本比较丰富,因此源域部分可以快速建立起适用的模型参数。共享部分既处理源域样本,又处理目标域样本,因此可以起到将针对源域数据训练得到的模型参数传递到目标域部分的作用,使得基于少量的目标域数据,训练得到适用于目标域的模型。
在通过以上训练方式训练得到事件预测模型后,该模型即可用于对目标域中待评估的事件序列进行分析和评估。具体地,可以将待评估的目标域事件序列输入到事件预测模型的共享部分和目标域部分,根据这两个部分的综合处理结果,输出得到针对该事件序列的事件评估结果,例如事件分类结果,更具体的,可以是风险度分类结果。
下面具体描述以上事件预测模型的训练过程和模型结构。
图4示出根据另一个实施例的训练事件预测模型的方法流程图。可以理解,该方法可以通过任何具有计算、处理能力的装置、设备、平台、设备集群来执行。如图4所示,训练过程至少包括以下步骤。
首先,在步骤401,获取训练样本集,其中包括多个源域样本和多个目标域样本。
可以理解,源域和目标域可以基于要分析的业务场景而定。一般地,源域是数据较为丰富的领域,目标域则是有待分析、但是数据较为稀少的领域。例如,在一个例子中,源域是热线服务平台,目标域是在线服务平台;或者,在另一例子中,源域是华东地区数据,目标域是华北地区数据。
由于源域的数据来源更为丰富,因此,通过样本采集而形成的训练样本集中,源域样本的数目,即第一数目,一般来说远远大于目标域样本的第二数目。典型的,第一数目的大小会是第二数目的N倍,例如N在5-15之间。更具体的,在一个例子中,源域样本的数目为目标域样本的10倍。
为训练事件预测模型,每个训练样本包括,预定数量(例如10件或20件)的历史事件构成的事件序列<E1,E2,…,En>,以及针对该事件序列标注的分类标签。分类标签可以是针对整个事件序列,或针对事件序列中最后一个事件En的事件类别进行的标注,事件类别例如可以是,欺诈事件或非欺诈事件的分类类别,事件风险度级别的分类类别,等等。
更具体的,每个源域样本包括由多个源域事件构成的源域事件序列S,即,,序列S中每个历史事件均为源域事件;而每个目标域样本包括由多个目标域事件构成的目标域事件序列T,即,,序列T中每个历史事件均为目标域事件。
每个事件可以具有多项与事件有关的属性信息。为了事件评估的全面性,可以获取各个事件的细粒度的全面的属性信息以供后续处理。这些属性信息可以包括,用户操作行为的行为类型(例如,登录操作,充值操作,支付操作,交易操作等),行为时间,用户操作所使用的设备信息(例如设备型号、MAC地址,IP地址等等),所使用的软件方面的信息,例如浏览器类型,app版本,等等。如果操作行为是交易行为,属性信息还可以包括交易行为的涉及金额,付款渠道,交易对象,等等。在一个实施例中,事件属性信息还可以包括,历史操作事件的操作结果,例如操作成功,失败,超时,等等。
一般地,源域事件和目标域事件的属性信息数据具有一定的相似性。在一个实施例中,源域事件和目标域事件具有完全相同的属性字段,只是某些属性字段的属性值分布有差异。例如,源域事件和目标域事件均包含属性ABCDE,其中属性A为用户年龄,属性B为使用设备型号,等等。如果源域事件和目标域事件来自不同的用户群体,那么两类事件在属性A和属性B的属性值分布上存在差异。
在一个实施例中,源域事件和目标域事件具有部分相同的属性字段,还具有部分独有的属性字段。具体的,源域事件可以具有第一多项属性,例如属性ABCDE,目标域事件具有第二多项属性,例如属性CDEFG,其中第一多项属性和第二多项属性存在交集,例如CDE。更具体的,在源域事件为华东地区服务事件,目标域事件为华北地区服务事件的例子中,源域事件和目标域事件的属性交集(例如CDE)可以是两个地区服务事件共有的属性,例如用户设备信息,事件发生时间,等等;源域事件独有的属性(例如属性AB)可以与仅在华东地区提供的服务内容有关,而目标域事件独有的属性(例如属性FG)可以与仅在华北地区提供的服务内容有关。
如此,采集源域事件序列中各个源域事件的属性信息,形成样本特征,并结合该源域事件序列的分类标签,形成源域样本。类似的,采集目标域事件序列中各个目标域事件的属性信息,形成样本特征,并结合该目标域事件序列的分类标签,形成目标域样本。第一数目的源域样本和第二数目的目标域样本共同构成训练样本集。
另一方面,在步骤S402,获取针对上述多个源域样本对应的多个源域用户而构建的源域关系网络图,其中包括对应该多个源域用户的多个源域节点,以及源域节点之间存在关联关系而形成的连接边;并且,获取针对上述多个目标域样本对应的多个目标域用户而构建的目标域关系网络图,其中包括对应该多个目标域用户的多个目标域节点,以及目标域节点之间存在关联关系而形成的连接边。需要说明,对步骤S402的描述,可以参见对步骤S220的描述。
在以上获取到训练样本集后,在步骤S403,将其中的各个样本依次作为当前样本,输入到事件预测模型。
图5示出根据一个实施例的事件预测模型的结构示意图。如图5所示,事件预测模型至少包括源域特征提取器,共享特征提取器,目标域特征提取器,图神经网络,源域注意力层,目标域注意力层,以及分类网络。下面结合图5的结构图,描述训练过程中的后续步骤。
对于输入到事件预测模型的当前样本,如图4步骤S404所示,需要区分该样本为源域样本或是目标域样本。
如果当前样本为源域样本,则在步骤S405,将其输入到源域特征提取器和共享特征提取器。具体地,一方面,采用源域特征提取器对该源域样本进行特征提取,得到源域特征表示;利用图神经网络,基于该源域特征表示,对上述源域关系网络图进行图嵌入处理,得到该源域样本的源域图嵌入向量;另一方面,采用共享特征提取器,对该源域样本进行特征提取,得到第一特征表示;进一步地,通过源域注意力层,根据上述源域特征表示和第一特征表示,得到源域样本的样本特征向量。
如果当前样本为目标域样本,则在步骤S406,将其输入到目标域特征提取器和共享特征提取器。具体地,一方面,采用目标域特征提取器对该目标域样本进行特征提取,得到目标域特征表示;利用图神经网络,基于该目标域特征表示,对上述目标域关系网络图进行图嵌入处理,得到该目标域样本的目标域图嵌入向量;另一方面,采用共享特征提取器,对该目标域样本进行特征提取,得到第二特征表示;进一步地,通过目标域注意力层,根据上述目标域特征表示和第二特征表示,得到目标域样本的样本特征向量。
在一个实施例中,上述源域特征提取器,共享特征提取器和目标域特征提取器,各自在其对应的特征空间中进行特征提取。
进一步的,在一个例子中,源域事件和目标域事件具有完全相同的属性字段,例如属性ABCDE。在这样的情况下,源域源域特征提取器,共享特征提取器和目标域特征提取器,均在与属性ABCDE对应的特征空间中进行特征提取,只是进行提取运算时采取的模型参数可能有所不同。
在另一例子中,如前所述,源域事件与目标域事件具有部分共有属性,在此之外还具有部分独有的属性。具体的,源域事件具有第一多项属性,例如属性ABCDE,目标域事件具有第二多项属性,例如属性CDEFG,第一多项属性和第二多项属性存在交集,例如CDE。在这样的情况下,源域特征提取器可以在第一多项属性对应的第一特征空间中进行特征提取;目标域特征提取器可以在第二多项属性对应的第二特征空间中进行特征提取。而共享特征提取器,则可以在共享特征空间中进行特征提取,其中,共享特征空间对应于第一多项属性和第二多项属性的并集,例如该并集为ABCDEFG。
更具体的,在步骤S405中,采用共享特征提取器对源域样本进行特征提取时,可以采用以下处理方式。首先,将源域样本中各个源域事件的第一多项属性(例如ABCDE)的属性值(例如abcde)填入共享特征空间(对应于ABCDEFG)中与第一多项属性对应的字段(例如前5个字段),用缺省值(例如0)填充其余字段,得到源域事件在共享特征空间中的第一属性表示(例如abcde00)。然后,通过共享特征提取器,对该第一属性表示进行特征提取操作。
类似的,在步骤S406中,采用共享特征提取器对目标域样本进行特征提取时,可以采用以下处理方式。将目标域样本中各个目标域事件的第二多项属性(例如CDEFG)的属性值(例如cdefg)填入共享特征空间(对应于ABCDEFG)中与第二多项属性对应的字段(例如后5个字段),用缺省值(例如0)填充其余字段,得到目标域事件在共享特征空间中的第二属性表示(例如00cdefg)。然后,通过共享特征提取器,对该第二属性表示进行特征提取操作。
从特征提取操作所采用的处理过程而言,在一个实施例中,源域特征提取器,共享特征提取器和目标域特征提取器可以为参数不同,结构相同的特征提取器,采用同样的提取算法进行特征提取。例如,上述三个特征提取器可以采用层数相同、算法相同的深度神经网络DNN来实现。
更具体的,在一个实施例中,源域特征提取器,共享特征提取器和目标域特征提取器采用结构相同的双层特征提取器进行特征提取。具体地,该双层特征提取器包括,编码层,第一嵌入层和第二嵌入层。
当将当前样本(源域样本或目标域样本)输入到双层特征提取器,编码层就针对当前样本所对应的当前事件序列<E1,E2,…,En>中的每个事件Ei(源域事件或目标域事件),将该事件的多项属性信息编码为对应的多个编码向量。
属性信息的编码处理可以与特征提取器的特征空间相对应,即,将输入事件的属性信息编码为与特征空间的维度对应的多个编码向量。
例如,当应用于源域特征提取器时,针对每个源域事件,编码层将源域事件的第一多项属性的属性信息编码为第一多个编码向量;当应用于目标域特征提取器时,针对每个目标域事件,编码层将目标域事件的第二多项属性的属性信息编码为第二多个编码向量。当应用于共享特征提取器时,针对每个事件,不管是目标域还是源域,编码层将该事件的属性信息编码为与共享特征空间的维度对应的多个编码向量。
编码层可以采用多种编码方式进行编码。对此可以参见对前述编码层中编码方式的描述,在此不赘述。
以上以双层特征提取器为例,描述了图5中源域特征提取器,共享特征提取器和目标域特征提取器的特征提取过程。可以理解,这三个特征提取器还可以采用其他方式进行特征提取,在一种实施方式中,这三个提取器为结构和算法相同的特征提取器。
由此,如图4中步骤S405所示,当把源域样本输入到源域特征提取器和共享特征提取器,源域特征提取器即对该源域样本对应的源域事件序列进行特征提取,得到源域特征表示Ys;共享特征提取器也对该源域事件序列进行特征提取,得到第一特征表示Y1;并且,利用图神经网络,基于源域特征表示Ys,对源域关系网络图进行图嵌入处理,得到该源域样本的源域图嵌入向量Qs。然后,源域注意力层根据源域图嵌入向量Qs和第一特征表示Y1,得到源域样本的样本特征向量V。具体地,源域注意力层可以利用第一权重分配因子,对源域图嵌入向量Qs和第一特征表示Y1进行加权组合,得到样本特征向量V,其中第一权重分配因子可以预先设置,也可以通过训练而确定。在其他实施例中,源域注意力层还可以通过其他方式对源域图嵌入向量Qs和第一特征表示Y1进行组合,例如进行拼接,线性变换等等,得到源域样本的样本特征向量V。
另一方面,如图4中步骤S406所示,当把目标域样本输入到目标域特征提取器和共享特征提取器,目标域特征提取器即对该目标域样本对应的目标域事件序列进行特征提取,得到目标域特征表示Yt;共享特征提取器也对该目标域事件序列进行特征提取,得到第二特征表示Y2;并且,利用图神经网络,基于目标域特征表示Yt,对目标域关系网络图进行图嵌入处理,得到该目标域样本的目标域图嵌入向量Qt。然后,目标域注意力层根据目标域图嵌入向量Qt和第二特征表示Y2,得到目标域样本的样本特征向量V。类似的,目标域注意力层可以利用第二权重分配因子,对目标域图嵌入向量Qt和第二特征表示Y2进行加权组合,得到样本特征向量V,其中第二权重分配因子可以预先设置,也可以通过训练而确定。或者,目标域注意力层还可以通过其他方式对目标域图嵌入向量Qt和第二特征表示Y2进行组合,得到目标域样本的样本特征向量V。
需要说明,上述利用图神经网络对源域关系网络图进行图嵌入处理,以及利用图神经网络对目标域关系网络图进行图嵌入处理,均可以参见前述对立又图神经网络对关系网络进行图嵌入处理的相关描述,不作赘述。
由此,对于输入到事件预测模型的当前样本,通过源域特征提取器,共享特征提取器,目标域特征提取器,图神经网络,以及对应的注意力层,得到当前样本的样本特征向量V。
接着,在步骤S407,将上述样本特征向量V输入到事件预测模型中的分类网络。分类网络根据该样本特征向量V,预测当前样本的事件类别,得到预测结果。
具体地,分类网络可以采用多层感知机(MLP),对样本特征向量进行进一步处理,最后施加诸如softmax的函数运算,得到针对当前样本的预测结果。该预测结果可以体现为,预测的分类类别,或者当前样本属于各个分类的概率。
对于训练样本集中的各个样本,均可以采用上述步骤S404到步骤S407的处理。于是,可以得到各个样本的预测结果。
于是,在步骤S408,根据各个样本的预测结果和对应的分类标签,确定分类损失。具体地,可以采用多种形式的损伤函数,例如交叉熵,L2误差,等等,根据预测结果和分类标签的比对,确定分类损失。并在分类损失减小的方向,更新事件预测模型。具体的,可以采用反向传播、梯度下降等方式,调整事件预测模型中各个模块的模型参数,从而训练和更新事件预测模型。
综上,在目标域样本较少的情况下,可以利用迁移学习的方式,利用样本数据丰富的源域样本,进行有区分的统一训练。具体的,在事件预测模型中包含有源域模型部分,共享模型部分和目标域模型部分。在训练过程中,由于源域样本比较丰富,因此源域模型部分可以快速建立起适用的模型参数。共享模型部分既处理源域样本,又处理目标域样本,可以将针对源域数据训练得到的模型参数传递到目标域部分。结合针对源域和目标域表征设置的域适应损失,可以使得目标域模型部分得到与源域类似的特征表征,如此使得基于少量的目标域数据,训练得到适用于源域和目标域两者的模型。
在训练得到事件预测模型的基础上,就可以使用该事件预测模型,针对目标域的事件进行评估和预测。
根据再一方面的实施例,发明人还考虑到存在源域数据和目标域数据归属不同数据方(或称参与方)的情况,在这种情况下,需要对各方数据的隐私进行保护。相应地,本说明书实施例还披露一种实现隐私保护的多方联合训练事件预测模型的方法,其中多方包括第一参与方、第二参与方和服务器,事件预测模型包括源域特征提取器、目标域特征提取器、共享特征提取器、图神经网络和分类网络。具体地,第一参与方中部署源域特征提取器,第二参与方中部署目标域特征提取器;服务器中部署模型共用部分,即共享特征提取器、图神经网络和分类网络。
下面从上述方法的执行主体分别为第一参与方、第二参与方和服务器的角度,对上述方法进行描述。
具体地,图6示出根据一个实施例的实现隐私保护的多方联合训练事件预测模型的方法流程图,所述方法应用于上述第一参与方,所述方法包括:
步骤S610,获取多个源域样本,其中每个源域样本包括源域用户的多个源域事件构成的源域事件序列,以及对应的分类标签。步骤S620,获取针对该多个源域样本对应的多个源域用户而构建的源域关系网络图,其中包括对应该多个源域用户的多个源域节点,以及源域节点之间存在关联关系而形成的连接边。步骤S630,将该各个样本作为当前样本,输入事件预测模型,其中步骤S630具体包括:步骤S631,从该服务器获取该模型共用部分的当前参数;步骤S632,采用该源域特征提取器对该源域样本进行特征提取,得到源域特征表示;利用该图神经网络的当前参数,基于该源域特征表示,对该源域关系网络图进行图嵌入处理,得到该源域样本的源域图嵌入向量;采用该共享特征提取器的当前参数,对该源域样本进行特征提取,得到第一特征表示;根据该源域图嵌入向量和第一特征表示,得到源域样本的样本特征向量;步骤S633,利用该分类网络的当前参数,基于该当前样本的样本特征向量,预测当前样本的事件类别,得到预测结果。步骤S640,基于各个样本的预测结果和对应的分类标签,对该源域特征提取器和该模型共用部分的当前参数进行更新;步骤S650,将该模型共用部分的当前参数的第一更新结果,发送至该服务器,以使该服务器根据该第一更新结果,以及从该第二参与方接收的针对该模型共用部分的当前参数的第二更新结果,更新该模型共用部分。
针对以上步骤,需要说明的是,对上述步骤的描述可以参见前述实施例。此外,对于模型共用部分的当前参数的更新结果,可以是更新后的参数,也可以是计算出的更新梯度。
图7示出根据另一个实施例的实现隐私保护的多方联合训练事件预测模型的方法流程图,所述方法应用于上述第二参与方,所述方法包括:
步骤S710,获取多个目标域样本,其中每个目标域样本包括目标域用户的多个目标域事件构成的目标域事件序列,以及对应的分类标签。步骤S720,获取针对该多个目标域样本对应的多个目标域用户而构建的目标域关系网络图,其中包括对应该多个目标域用户的多个目标域节点,以及目标域节点之间存在关联关系而形成的连接边。步骤S730,将该各个样本作为当前样本,输入事件预测模型,其中步骤S730具体包括:步骤S731,从该服务器获取该模型共用部分的当前参数;步骤S732,采用该目标域特征提取器对该目标域样本进行特征提取,得到目标域特征表示;利用该图神经网络的当前参数,基于该目标域特征表示,对该目标域关系网络图进行图嵌入处理,得到该目标域样本的目标域图嵌入向量;采用该共享特征提取器的当前参数,对该目标域样本进行特征提取,得到第二特征表示;根据该目标域图嵌入向量和第二特征表示,得到目标域样本的样本特征向量;步骤S733,利用该分类网络的当前参数,基于该当前样本的样本特征向量,预测当前样本的事件类别,得到预测结果。步骤S740,基于各个样本的预测结果和对应的分类标签,对该目标域特征提取器和该模型共用部分的当前参数进行更新;步骤S750,将该模型共用部分的当前参数的第二更新结果,发送至该服务器,以使该服务器根据该第二更新结果,以及从该第二参与方接收的针对该模型共用部分的当前参数的第二更新结果,更新该模型共用部分。
针对以上步骤,需要说明的是,对上述步骤的描述可以参见前述实施例。
图8示出根据又一个实施例的实现隐私保护的多方联合训练事件预测模型的方法流程图,所述方法应用于上述服务器,所述方法包括:
步骤S810,分别向所述第一参与方和第二参与方发送上述模型共用部分的当前参数;步骤S820,从所述第一参与方接收其根据图6示出的方法得到的针对所述当前参数的第一更新结果;步骤S830,从所述第二参与方接收其根据图7示出的方法得到的针对所述当前参数的第二更新结果;步骤S840,基于所述第一更新结果和第二更新结果,更新所述服务器中部署的模型共用部分。
针对以上步骤,需要说明的是,在步骤S840,在一个实施例中,在第一更新结果和第二更新结果为更新后的参数的情况下,可以对二者取平均,并利用平均后的参数更新服务器中部署的模型共用部分。具体地,可以对两个更新结果中分别包括的针对共享特征提取器、图神经网络和分类网络的更新参数,对应取平均,再利用三部分的平均后参数,分别更新这三个模型部件。在另一个实施例中,在第一更新结果和第二更新结果为参数梯度的情况下,可以对参数梯度取平均,并结合梯度的平均值利用梯度下降的计算式,更新服务器中模型共用部分的参数。
此外需要说明,服务器还可以对第一更新结果和第二更新结果预处理,再利用预处理的处理结果,更新其中部署的模型共用部分。在一个示例中,针对某个参数,可以查看第一更新结果和第二更新结果中与其对应的结果数值,如果相差超出预定范围,则本次不对其进行更新。
由上,通过中立的服务器作为模型共用部分的使用桥梁,可以有效实现事件预测模型训练过程中的隐私保护。
与上述实施例中披露的训练方法相对应的,本说明书实施例中还披露以下训练装置:
具体地,图9示出根据一个实施例的训练事件预测模型的装置的示意性框图。如图9所示,所述装置900包括:
样本获取单元910,配置为获取多个训练样本,其中各个样本中包括用户的多个操作事件构成的事件序列,以及对应的分类标签;关系图获取单元920,配置为获取针对该多个训练样本对应的多个用户而构建的关系网络图,其中包括对应该多个用户的多个节点,以及节点之间存在关联关系而形成的连接边;事件预测单元930,配置为将所述各个样本作为当前样本,输入事件预测模型,该事件预测模型包括特征提取器、图神经网络和分类网络,其中事件预测单元包括:样本表征模块931,配置为利用所述特征提取器对所述当前样本进行特征提取,所述特征提取器包括编码层、第一嵌入层和第二嵌入层;其中编码层用于,针对当前样本所对应当前事件序列中的每个事件,将该事件的多项属性信息编码为对应的多个编码向量;第一嵌入层用于,对所述每个事件的多个编码向量进行第一组合,得到各个事件对应的各个事件向量;第二嵌入层用于,对所述各个事件向量进行第二组合,得到所述当前事件序列对应的特征表示;图嵌入模块932,配置为利用所述图神经网络,基于所述特征表示,对所述关系网络图进行图嵌入处理,得到所述当前事件序列的图嵌入向量;分类预测模块933,配置为利用所述分类网络,基于所述图嵌入向量,预测所述当前样本的事件类别,得到预测结果;训练单元940,配置为基于各个样本的预测结果和对应的分类标签,训练所述事件预测模型。
在一个实施例中,所述第一组合包括,涉及N个编码向量相乘的N阶向量间组合运算,其中N≥2。
在一个实施例中,所述第二嵌入层包括基于时序的神经网络,用于依次迭代处理所述各个事件向量,得到所述当前事件序列对应的特征表示。
在一个实施例中,所述第二组合包括,涉及M个事件向量的M阶向量间组合运算,其中M≥2。在一个实施例中,所述各个样本中还包括所述用户的用户画像特征;所述事件预测模型中还包括特征编码器,该特征编码器用于对所述用户画像特征进行编码,得到画像编码向量;其中,所述图嵌入模块932具体配置为:利用所述图神经网络,基于所述特征表示和所述当前事件序列所对应的当前画像编码向量,对所述关系网络图进行图嵌入处理,得到所述图嵌入向量。
在一个实施例中,所述各个样本中还包括所述用户的用户画像特征;所述事件预测模型中还包括特征编码器,该特征编码器用于对所述用户画像特征进行编码,得到画像编码向量;其中,所述分类预测模块933具体配置为:将所述图嵌入向量和所述当前事件所对应的当前画像编码向量,输入所述分类网络中,得到所述预测结果。
图10示出根据另一个实施例的训练事件预测模型的装置的示意性框图。如图10所示,所述装置1000包括:
样本获取单元1010,配置为获取训练样本集,其中包括多个源域样本和多个目标域样本,其中各个样本具有对应的分类标签;每个源域样本包括源域用户的多个源域事件构成的源域事件序列,每个目标域样本包括目标域用户的多个目标域事件构成的目标域事件序列。关系图获取单元1020,配置为获取针对所述多个源域样本对应的多个源域用户而构建的源域关系网络图,其中包括对应该多个源域用户的多个源域节点,以及源域节点之间存在关联关系而形成的连接边;获取针对所述多个目标域样本对应的多个目标域用户而构建的目标域关系网络图,其中包括对应该多个目标域用户的多个目标域节点,以及目标域节点之间存在关联关系而形成的连接边。事件预测单元1030,配置为将所述各个样本作为当前样本,输入事件预测模型,该事件预测模型包括源域特征提取器、目标域特征提取器、共享特征提取器、图神经网络和分类网络;所述事件预测单元1030包括:源域样本表征模块1031,配置为当所述当前样本为源域样本时,采用所述源域特征提取器对该源域样本进行特征提取,得到源域特征表示;利用所述图神经网络,基于所述源域特征表示,对所述源域关系网络图进行图嵌入处理,得到该源域样本的源域图嵌入向量;采用所述共享特征提取器,对该源域样本进行特征提取,得到第一特征表示;根据所述源域图嵌入向量和第一特征表示,得到源域样本的样本特征向量;目标域样本表征模块1032,配置为当所述当前样本为目标域样本时,采用所述目标域特征提取器对该目标域样本进行特征提取,得到目标域特征表示;利用所述图神经网络,基于所述目标域特征表示,对所述目标域关系网络图进行图嵌入处理,得到该目标域样本的目标域图嵌入向量;采用所述共享特征提取器,对该目标域样本进行特征提取,得到第二特征表示;根据所述目标域图嵌入向量和第二特征表示,得到目标域样本的样本特征向量;分类预测模块1033,配置为利用所述分类网络,基于所述当前样本的样本特征向量,预测当前样本的事件类别,得到预测结果。训练单元1040,配置为基于各个样本的预测结果和对应的分类标签,训练所述事件预测模型。
在一个实施例中,源域事件具有第一多项属性,目标域事件具有第二多属性,且第一多项属性和第二多项属性存在交集;所述源域特征提取器用于在所述第一多项属性对应的第一特征空间进行特征提取;所述目标域特征提取器用于在所述第二多项属性对应的第二特征空间进行特征提取;所述共享特征提取器用于在共享特征空间中进行特征提取,其中,所述共享特征空间对应于所述第一多项属性和第二多项属性的并集。
在一个实施例中,所述源域样本表征模块1031配置为采用所述共享特征提取器,对该源域样本进行特征提取,得到第一特征表示,包括:将所述源域样本中各个源域事件的第一多项属性的属性值填入所述共享特征空间中与所述第一多项属性对应的字段,用缺省值填充其余字段,得到源域事件在共享特征空间中的第一属性表示,根据所述第一属性表示进行特征提取;所述目标域样本表征模块1032配置为采用所述共享特征提取器,对该目标域样本进行特征提取,得到第二特征表示,包括:将所述目标域样本中各个目标域事件的第二多项属性的属性值填入所述共享特征空间中与所述第二多项属性对应的字段,用缺省值填充其余字段,得到目标域事件在共享特征空间中的第二属性表示,根据所述第二属性表示进行特征提取。
在一个实施例中,所述源域特征提取器和目标域特征提取器为参数不同,结构相同的双层特征提取器,所述双层特征提取器包括编码层,第一嵌入层和第二嵌入层;其中,所述编码层用于,针对输入的当前样本所对应的多个事件中的每个事件,将该事件的多项属性信息编码为对应的多个编码向量;第一嵌入层用于,对各个事件的所述多个编码向量进行第一组合,得到各个事件对应的各个事件向量;第二嵌入层用于,将所述各个事件向量进行第二组合,得到所述当前事件序列对应的特征表示。
在一个实施例中,所述源域样本表征模块1031配置为根据所述源域图嵌入向量和第一特征表示,得到源域样本的样本特征向量,包括:利用第一权重分配因子,对所述源域图嵌入向量和第一特征表示进行加权组合,得到所述源域样本的样本特征向量;所述目标域样本表征模块1032配置为根据所述目标域图嵌入向量和第二特征表示,得到目标域样本的样本特征向量,包括:利用第二权重分配因子,对所述目标域图嵌入向量和第二特征表示进行加权组合,得到所述目标域样本的样本特征向量。
图11示出根据一个实施例的实现隐私保护的多方联合训练事件预测模型的装置的示意性框图,其中多方包括第一参与方、第二参与方和服务器;所述第一参与方中部署源域特征提取器,所述第二参与方中部署目标域特征器;所述服务器中部署模型共用部分,具体包括共享特征提取器、图神经网络和分类网络;所述装置集成于所述第一参与方。如图11所示,所述装置1100包括:
样本获取单元1110,配置为获取多个源域样本,其中每个源域样本包括源域用户的多个源域事件构成的源域事件序列,以及对应的分类标签。关系图获取单元1120,配置为获取针对所述多个源域样本对应的多个源域用户而构建的源域关系网络图,其中包括对应该多个源域用户的多个源域节点,以及源域节点之间存在关联关系而形成的连接边。事件预测单元1130,配置为将所述各个样本作为当前样本,输入事件预测模型,其中所述事件预测单元包括:参数获取模块1131,配置为从所述服务器获取所述模型共用部分的当前参数;样本表征模块1132,配置为采用所述源域特征提取器对该源域样本进行特征提取,得到源域特征表示;利用所述图神经网络的当前参数,基于所述源域特征表示,对所述源域关系网络图进行图嵌入处理,得到该源域样本的源域图嵌入向量;采用所述共享特征提取器的当前参数,对该源域样本进行特征提取,得到第一特征表示;根据该源域图嵌入向量和第一特征表示,得到源域样本的样本特征向量;分类预测模块1133,配置为利用所述分类网络的当前参数,基于所述当前样本的样本特征向量,预测当前样本的事件类别,得到预测结果。参数更新单元1140,配置为基于各个样本的预测结果和对应的分类标签,对所述源域特征提取器和所述模型共用部分的当前参数进行更新。结果发送单元1150,配置为将所述模型共用部分的当前参数的第一更新结果,发送至所述服务器,以使所述服务器根据该第一更新结果,以及从所述第二参与方接收的针对所述模型共用部分的当前参数的第二更新结果,更新所述模型共用部分。
图12示出根据另一个实施例的实现隐私保护的多方联合训练事件预测模型的装置的示意性框图,其中多方包括第一参与方、第二参与方和服务器;所述第一参与方中部署源域特征提取器,所述第二参与方中部署目标域特征器;所述服务器中部署模型共用部分,具体包括共享特征提取器、图神经网络和分类网络;所述装置集成于所述第二参与方。如图12所示,所述装置1200包括:
样本获取单元1210,配置为获取多个目标域样本,其中每个目标域样本包括目标域用户的多个目标域事件构成的目标域事件序列,以及对应的分类标签。关系图获取单元1220,配置为获取针对所述多个目标域样本对应的多个目标域用户而构建的目标域关系网络图,其中包括对应该多个目标域用户的多个目标域节点,以及目标域节点之间存在关联关系而形成的连接边。事件预测单元1230,配置为将所述各个样本作为当前样本,输入事件预测模型,其中所述事件预测单元1230包括:参数获取模块1231,配置为从所述服务器获取所述模型共用部分的当前参数;样本表征模块1232,配置为采用所述目标域特征提取器对该目标域样本进行特征提取,得到目标域特征表示;利用所述图神经网络的当前参数,基于所述目标域特征表示,对所述目标域关系网络图进行图嵌入处理,得到该目标域样本的目标域图嵌入向量;采用所述共享特征提取器的当前参数,对该目标域样本进行特征提取,得到第二特征表示;根据该目标域图嵌入向量和第二特征表示,得到目标域样本的样本特征向量;分类预测模块1233,配置为利用所述分类网络的当前参数,基于所述当前样本的样本特征向量,预测当前样本的事件类别,得到预测结果。参数更新单元1240,配置为基于各个样本的预测结果和对应的分类标签,对所述目标域特征提取器和所述模型共用部分的当前参数进行更新。结果发送单元1250,配置为将所述模型共用部分的当前参数的第二更新结果,发送至所述服务器,以使所述服务器根据该第二更新结果,以及从所述第二参与方接收的针对所述模型共用部分的当前参数的第一更新结果,更新所述模型共用部分。
图13示出根据又一个实施例的实现隐私保护的多方联合训练事件预测模型的装置的示意性框图,其中多方包括第一参与方、第二参与方和服务器;所述第一参与方中部署源域特征提取器,所述第二参与方中部署目标域特征器;所述服务器中部署模型共用部分,具体包括共享特征提取器、图神经网络和分类网络;所述装置集成于所述服务器。如图13所示,所述装置1300包括:
参数发送单元1310,配置为分别向所述第一参与方和第二参与方发送所述模型共用部分的当前参数;第一结果接收单元1320,配置为从所述第一参与方接收其根据权利要求26所述的装置得到的针对所述当前参数的第一更新结果;第二结果接收单元1330,配置为从所述第二参与方接收其根据权利要求27所述的装置得到的针对所述当前参数的第二更新结果;参数更新单元1340,配置为基于所述第一更新结果和第二更新结果,更新所述服务器中部署的模型共用部分。
根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行结合图2、图4、图6、图7或图8所描述的方法。
根据再一方面的实施例,还提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现结合图2、图4、图6、图7或图8所描述的方法。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。
Claims (30)
1.一种训练事件预测模型的方法,所述方法包括:
获取多个训练样本,其中各个样本中包括用户的多个操作事件构成的事件序列,以及对应的分类标签;
获取针对该多个训练样本对应的多个用户而构建的关系网络图,其中包括对应该多个用户的多个节点,以及节点之间存在关联关系而形成的连接边;
将所述各个样本作为当前样本,输入事件预测模型,该事件预测模型包括特征提取器、图神经网络和分类网络,其中,
利用所述特征提取器对所述当前样本进行特征提取,所述特征提取器包括编码层、第一嵌入层和第二嵌入层;其中编码层用于,针对当前样本所对应当前事件序列中的每个事件,将该事件的多项属性信息编码为对应的多个编码向量;第一嵌入层用于,对所述每个事件的多个编码向量进行第一组合,得到各个事件对应的各个事件向量;第二嵌入层用于,对所述各个事件向量进行第二组合,得到所述当前事件序列对应的特征表示;
利用所述图神经网络,基于所述特征表示,对所述关系网络图进行图嵌入处理,得到所述当前事件序列的图嵌入向量;
利用所述分类网络,基于所述图嵌入向量,预测所述当前样本的事件类别,得到预测结果;
基于各个样本的预测结果和对应的分类标签,训练所述事件预测模型。
2.根据权利要求1所述的方法,其中,所述第一组合包括,涉及N个编码向量相乘的N阶向量间组合运算,其中N≥2。
3.根据权利要求1所述的方法,其中,所述第二嵌入层包括基于时序的神经网络,用于依次迭代处理所述各个事件向量,得到所述当前事件序列对应的特征表示。
4.根据权利要求1所述的方法,其中,所述第二组合包括,涉及M个事件向量的M阶向量间组合运算,其中M≥2。
5.根据权利要求1所述的方法,其中,所述各个样本中还包括所述用户的用户画像特征;所述事件预测模型中还包括特征编码器,该特征编码器用于对所述用户画像特征进行编码,得到画像编码向量;
其中,利用所述图神经网络,基于所述特征表示,对所述关系网络图进行图嵌入处理,得到所述当前事件序列的图嵌入向量,包括:
利用所述图神经网络,基于所述特征表示和所述当前事件序列所对应的当前画像编码向量,对所述关系网络图进行图嵌入处理,得到所述图嵌入向量。
6.根据权利要求1所述的方法,其中,所述各个样本中还包括所述用户的用户画像特征;所述事件预测模型中还包括特征编码器,该特征编码器用于对所述用户画像特征进行编码,得到画像编码向量;
其中,利用所述分类网络,基于所述图嵌入向量,预测所述当前样本的事件类别,得到预测结果,包括:
将所述图嵌入向量和所述当前事件所对应的当前画像编码向量,输入所述分类网络中,得到所述预测结果。
7.一种训练事件预测模型的方法,所述方法包括:
获取训练样本集,其中包括多个源域样本和多个目标域样本,其中各个样本具有对应的分类标签;每个源域样本包括源域用户的多个源域事件构成的源域事件序列,每个目标域样本包括目标域用户的多个目标域事件构成的目标域事件序列;
获取针对所述多个源域样本对应的多个源域用户而构建的源域关系网络图,其中包括对应该多个源域用户的多个源域节点,以及源域节点之间存在关联关系而形成的连接边;获取针对所述多个目标域样本对应的多个目标域用户而构建的目标域关系网络图,其中包括对应该多个目标域用户的多个目标域节点,以及目标域节点之间存在关联关系而形成的连接边;
将所述各个样本作为当前样本,输入事件预测模型,该事件预测模型包括源域特征提取器、目标域特征提取器、共享特征提取器、图神经网络和分类网络,其中,
当所述当前样本为源域样本时,采用所述源域特征提取器对该源域样本进行特征提取,得到源域特征表示;利用所述图神经网络,基于所述源域特征表示,对所述源域关系网络图进行图嵌入处理,得到该源域样本的源域图嵌入向量;采用所述共享特征提取器,对该源域样本进行特征提取,得到第一特征表示;根据所述源域图嵌入向量和第一特征表示,得到源域样本的样本特征向量;
当所述当前样本为目标域样本时,采用所述目标域特征提取器对该目标域样本进行特征提取,得到目标域特征表示;利用所述图神经网络,基于所述目标域特征表示,对所述目标域关系网络图进行图嵌入处理,得到该目标域样本的目标域图嵌入向量;采用所述共享特征提取器,对该目标域样本进行特征提取,得到第二特征表示;根据所述目标域图嵌入向量和第二特征表示,得到目标域样本的样本特征向量;
利用所述分类网络,基于所述当前样本的样本特征向量,预测当前样本的事件类别,得到预测结果;
基于各个样本的预测结果和对应的分类标签,训练所述事件预测模型。
8.根据权利要求7所述的方法,其中,源域事件具有第一多项属性,目标域事件具有第二多属性,且第一多项属性和第二多项属性存在交集;
所述源域特征提取器用于在所述第一多项属性对应的第一特征空间进行特征提取;
所述目标域特征提取器用于在所述第二多项属性对应的第二特征空间进行特征提取;
所述共享特征提取器用于在共享特征空间中进行特征提取,其中,所述共享特征空间对应于所述第一多项属性和第二多项属性的并集。
9.根据权利要求8所述的方法,其中,
采用所述共享特征提取器,对该源域样本进行特征提取,得到第一特征表示,包括:
将所述源域样本中各个源域事件的第一多项属性的属性值填入所述共享特征空间中与所述第一多项属性对应的字段,用缺省值填充其余字段,得到源域事件在共享特征空间中的第一属性表示,根据所述第一属性表示进行特征提取;
采用所述共享特征提取器,对该目标域样本进行特征提取,得到第二特征表示,包括:
将所述目标域样本中各个目标域事件的第二多项属性的属性值填入所述共享特征空间中与所述第二多项属性对应的字段,用缺省值填充其余字段,得到目标域事件在共享特征空间中的第二属性表示,根据所述第二属性表示进行特征提取。
10.根据权利要求7所述的方法,其中,所述源域特征提取器和目标域特征提取器为参数不同,结构相同的双层特征提取器,所述双层特征提取器包括编码层,第一嵌入层和第二嵌入层;其中,
所述编码层用于,针对输入的当前样本所对应的多个事件中的每个事件,将该事件的多项属性信息编码为对应的多个编码向量;
第一嵌入层用于,对各个事件的所述多个编码向量进行第一组合,得到各个事件对应的各个事件向量;
第二嵌入层用于,将所述各个事件向量进行第二组合,得到所述当前事件序列对应的特征表示。
11.根据权利要求7所述的方法,其中,
根据所述源域图嵌入向量和第一特征表示,得到源域样本的样本特征向量,包括:利用第一权重分配因子,对所述源域图嵌入向量和第一特征表示进行加权组合,得到所述源域样本的样本特征向量;
根据所述目标域图嵌入向量和第二特征表示,得到目标域样本的样本特征向量,包括:利用第二权重分配因子,对所述目标域图嵌入向量和第二特征表示进行加权组合,得到所述目标域样本的样本特征向量。
12.一种实现隐私保护的多方联合训练事件预测模型的方法,所述多方包括第一参与方、第二参与方和服务器;所述第一参与方中部署源域特征提取器,所述第二参与方中部署目标域特征器;所述服务器中部署模型共用部分,具体包括共享特征提取器、图神经网络和分类网络;所述方法应用于所述第一参与方,所述方法包括:
获取多个源域样本,其中每个源域样本包括源域用户的多个源域事件构成的源域事件序列,以及对应的分类标签;
获取针对所述多个源域样本对应的多个源域用户而构建的源域关系网络图,其中包括对应该多个源域用户的多个源域节点,以及源域节点之间存在关联关系而形成的连接边;
将所述各个样本作为当前样本,输入事件预测模型,其中,
从所述服务器获取所述模型共用部分的当前参数;
采用所述源域特征提取器对该源域样本进行特征提取,得到源域特征表示;利用所述图神经网络的当前参数,基于所述源域特征表示,对所述源域关系网络图进行图嵌入处理,得到该源域样本的源域图嵌入向量;采用所述共享特征提取器的当前参数,对该源域样本进行特征提取,得到第一特征表示;根据该源域图嵌入向量和第一特征表示,得到源域样本的样本特征向量;
利用所述分类网络的当前参数,基于所述当前样本的样本特征向量,预测当前样本的事件类别,得到预测结果;
基于各个样本的预测结果和对应的分类标签,对所述源域特征提取器和所述模型共用部分的当前参数进行更新;
将所述模型共用部分的当前参数的第一更新结果,发送至所述服务器,以使所述服务器根据该第一更新结果,以及从所述第二参与方接收的针对所述模型共用部分的当前参数的第二更新结果,更新所述模型共用部分。
13.一种实现隐私保护的多方联合训练事件预测模型的方法,所述多方包括第一参与方、第二参与方和服务器;所述第一参与方中部署源域特征提取器,所述第二参与方中部署目标域特征器;所述服务器中部署模型共用部分,具体包括共享特征提取器、图神经网络和分类网络;所述方法应用于所述第二参与方,所述方法包括:
获取多个目标域样本,其中每个目标域样本包括目标域用户的多个目标域事件构成的目标域事件序列,以及对应的分类标签;
获取针对所述多个目标域样本对应的多个目标域用户而构建的目标域关系网络图,其中包括对应该多个目标域用户的多个目标域节点,以及目标域节点之间存在关联关系而形成的连接边;
将所述各个样本作为当前样本,输入事件预测模型,其中,
从所述服务器获取所述模型共用部分的当前参数;
采用所述目标域特征提取器对该目标域样本进行特征提取,得到目标域特征表示;利用所述图神经网络的当前参数,基于所述目标域特征表示,对所述目标域关系网络图进行图嵌入处理,得到该目标域样本的目标域图嵌入向量;采用所述共享特征提取器的当前参数,对该目标域样本进行特征提取,得到第二特征表示;根据该目标域图嵌入向量和第二特征表示,得到目标域样本的样本特征向量;
利用所述分类网络的当前参数,基于所述当前样本的样本特征向量,预测当前样本的事件类别,得到预测结果;
基于各个样本的预测结果和对应的分类标签,对所述目标域特征提取器和所述模型共用部分的当前参数进行更新;
将所述模型共用部分的当前参数的第二更新结果,发送至所述服务器,以使所述服务器根据该第二更新结果,以及从所述第二参与方接收的针对所述模型共用部分的当前参数的第一更新结果,更新所述模型共用部分。
14.一种实现隐私保护的多方联合训练事件预测模型的方法,所述多方包括第一参与方、第二参与方和服务器;所述第一参与方中部署源域特征提取器,所述第二参与方中部署目标域特征器;所述服务器中部署模型共用部分,具体包括共享特征提取器、图神经网络和分类网络;所述方法应用于所述服务器,所述方法包括:
分别向所述第一参与方和第二参与方发送所述模型共用部分的当前参数;
从所述第一参与方接收其根据权利要求12所述的方法得到的针对所述当前参数的第一更新结果;
从所述第二参与方接收其根据权利要求13所述的方法得到的针对所述当前参数的第二更新结果;
基于所述第一更新结果和第二更新结果,更新所述服务器中部署的模型共用部分。
15.一种训练事件预测模型的装置,所述装置包括:
样本获取单元,配置为获取多个训练样本,其中各个样本中包括用户的多个操作事件构成的事件序列,以及对应的分类标签;
关系图获取单元,配置为获取针对该多个训练样本对应的多个用户而构建的关系网络图,其中包括对应该多个用户的多个节点,以及节点之间存在关联关系而形成的连接边;
事件预测单元,配置为将所述各个样本作为当前样本,输入事件预测模型,该事件预测模型包括特征提取器、图神经网络和分类网络,其中事件预测单元包括:
样本表征模块,配置为利用所述特征提取器对所述当前样本进行特征提取,所述特征提取器包括编码层、第一嵌入层和第二嵌入层;其中编码层用于,针对当前样本所对应当前事件序列中的每个事件,将该事件的多项属性信息编码为对应的多个编码向量;第一嵌入层用于,对所述每个事件的多个编码向量进行第一组合,得到各个事件对应的各个事件向量;第二嵌入层用于,对所述各个事件向量进行第二组合,得到所述当前事件序列对应的特征表示;
图嵌入模块,配置为利用所述图神经网络,基于所述特征表示,对所述关系网络图进行图嵌入处理,得到所述当前事件序列的图嵌入向量;
分类预测模块,配置为利用所述分类网络,基于所述图嵌入向量,预测所述当前样本的事件类别,得到预测结果;
训练单元,配置为基于各个样本的预测结果和对应的分类标签,训练所述事件预测模型。
16.根据权利要求15所述的装置,其中,所述第一组合包括,涉及N个编码向量相乘的N阶向量间组合运算,其中N≥2。
17.根据权利要求15所述的装置,其中,所述第二嵌入层包括基于时序的神经网络,用于依次迭代处理所述各个事件向量,得到所述当前事件序列对应的特征表示。
18.根据权利要求15所述的装置,其中,所述第二组合包括,涉及M个事件向量的M阶向量间组合运算,其中M≥2。
19.根据权利要求15所述的装置,其中,所述各个样本中还包括所述用户的用户画像特征;所述事件预测模型中还包括特征编码器,该特征编码器用于对所述用户画像特征进行编码,得到画像编码向量;
其中,所述图嵌入模块具体配置为:
利用所述图神经网络,基于所述特征表示和所述当前事件序列所对应的当前画像编码向量,对所述关系网络图进行图嵌入处理,得到所述图嵌入向量。
20.根据权利要求15所述的装置,其中,所述各个样本中还包括所述用户的用户画像特征;所述事件预测模型中还包括特征编码器,该特征编码器用于对所述用户画像特征进行编码,得到画像编码向量;
其中,所述分类预测模块具体配置为:
将所述图嵌入向量和所述当前事件所对应的当前画像编码向量,输入所述分类网络中,得到所述预测结果。
21.一种训练事件预测模型的装置,所述装置包括:
样本获取单元,配置为获取训练样本集,其中包括多个源域样本和多个目标域样本,其中各个样本具有对应的分类标签;每个源域样本包括源域用户的多个源域事件构成的源域事件序列,每个目标域样本包括目标域用户的多个目标域事件构成的目标域事件序列;
关系图获取单元,配置为获取针对所述多个源域样本对应的多个源域用户而构建的源域关系网络图,其中包括对应该多个源域用户的多个源域节点,以及源域节点之间存在关联关系而形成的连接边;获取针对所述多个目标域样本对应的多个目标域用户而构建的目标域关系网络图,其中包括对应该多个目标域用户的多个目标域节点,以及目标域节点之间存在关联关系而形成的连接边;
事件预测单元,配置为将所述各个样本作为当前样本,输入事件预测模型,该事件预测模型包括源域特征提取器、目标域特征提取器、共享特征提取器、图神经网络和分类网络;所述事件预测单元包括:
源域样本表征模块,配置为当所述当前样本为源域样本时,采用所述源域特征提取器对该源域样本进行特征提取,得到源域特征表示;利用所述图神经网络,基于所述源域特征表示,对所述源域关系网络图进行图嵌入处理,得到该源域样本的源域图嵌入向量;采用所述共享特征提取器,对该源域样本进行特征提取,得到第一特征表示;根据所述源域图嵌入向量和第一特征表示,得到源域样本的样本特征向量;
目标域样本表征模块,配置为当所述当前样本为目标域样本时,采用所述目标域特征提取器对该目标域样本进行特征提取,得到目标域特征表示;利用所述图神经网络,基于所述目标域特征表示,对所述目标域关系网络图进行图嵌入处理,得到该目标域样本的目标域图嵌入向量;采用所述共享特征提取器,对该目标域样本进行特征提取,得到第二特征表示;根据所述目标域图嵌入向量和第二特征表示,得到目标域样本的样本特征向量;
分类预测模块,配置为利用所述分类网络,基于所述当前样本的样本特征向量,预测当前样本的事件类别,得到预测结果;
训练单元,配置为基于各个样本的预测结果和对应的分类标签,训练所述事件预测模型。
22.根据权利要求21所述的装置,其中,源域事件具有第一多项属性,目标域事件具有第二多属性,且第一多项属性和第二多项属性存在交集;
所述源域特征提取器用于在所述第一多项属性对应的第一特征空间进行特征提取;
所述目标域特征提取器用于在所述第二多项属性对应的第二特征空间进行特征提取;
所述共享特征提取器用于在共享特征空间中进行特征提取,其中,所述共享特征空间对应于所述第一多项属性和第二多项属性的并集。
23.根据权利要求22所述的装置,其中,
所述源域样本表征模块配置为采用所述共享特征提取器,对该源域样本进行特征提取,得到第一特征表示,包括:
将所述源域样本中各个源域事件的第一多项属性的属性值填入所述共享特征空间中与所述第一多项属性对应的字段,用缺省值填充其余字段,得到源域事件在共享特征空间中的第一属性表示,根据所述第一属性表示进行特征提取;
所述目标域样本表征模块配置为采用所述共享特征提取器,对该目标域样本进行特征提取,得到第二特征表示,包括:
将所述目标域样本中各个目标域事件的第二多项属性的属性值填入所述共享特征空间中与所述第二多项属性对应的字段,用缺省值填充其余字段,得到目标域事件在共享特征空间中的第二属性表示,根据所述第二属性表示进行特征提取。
24.根据权利要求21所述的装置,其中,所述源域特征提取器和目标域特征提取器为参数不同,结构相同的双层特征提取器,所述双层特征提取器包括编码层,第一嵌入层和第二嵌入层;其中,
所述编码层用于,针对输入的当前样本所对应的多个事件中的每个事件,将该事件的多项属性信息编码为对应的多个编码向量;
第一嵌入层用于,对各个事件的所述多个编码向量进行第一组合,得到各个事件对应的各个事件向量;
第二嵌入层用于,将所述各个事件向量进行第二组合,得到所述当前事件序列对应的特征表示。
25.根据权利要求21所述的装置,其中,
所述源域样本表征模块配置为根据所述源域图嵌入向量和第一特征表示,得到源域样本的样本特征向量,包括:利用第一权重分配因子,对所述源域图嵌入向量和第一特征表示进行加权组合,得到所述源域样本的样本特征向量;
所述目标域样本表征模块配置为根据所述目标域图嵌入向量和第二特征表示,得到目标域样本的样本特征向量,包括:利用第二权重分配因子,对所述目标域图嵌入向量和第二特征表示进行加权组合,得到所述目标域样本的样本特征向量。
26.一种实现隐私保护的多方联合训练事件预测模型的装置,所述多方包括第一参与方、第二参与方和服务器;所述第一参与方中部署源域特征提取器,所述第二参与方中部署目标域特征器;所述服务器中部署模型共用部分,具体包括共享特征提取器、图神经网络和分类网络;所述装置集成于所述第一参与方,所述装置包括:
样本获取单元,配置为获取多个源域样本,其中每个源域样本包括源域用户的多个源域事件构成的源域事件序列,以及对应的分类标签;
关系图获取单元,配置为获取针对所述多个源域样本对应的多个源域用户而构建的源域关系网络图,其中包括对应该多个源域用户的多个源域节点,以及源域节点之间存在关联关系而形成的连接边;
事件预测单元,配置为将所述各个样本作为当前样本,输入事件预测模型,其中所述事件预测单元包括:
参数获取模块,配置为从所述服务器获取所述模型共用部分的当前参数;
样本表征模块,配置为采用所述源域特征提取器对该源域样本进行特征提取,得到源域特征表示;利用所述图神经网络的当前参数,基于所述源域特征表示,对所述源域关系网络图进行图嵌入处理,得到该源域样本的源域图嵌入向量;采用所述共享特征提取器的当前参数,对该源域样本进行特征提取,得到第一特征表示;根据该源域图嵌入向量和第一特征表示,得到源域样本的样本特征向量;
分类预测模块,配置为利用所述分类网络的当前参数,基于所述当前样本的样本特征向量,预测当前样本的事件类别,得到预测结果;
参数更新单元,配置为基于各个样本的预测结果和对应的分类标签,对所述源域特征提取器和所述模型共用部分的当前参数进行更新;
结果发送单元,配置为将所述模型共用部分的当前参数的第一更新结果,发送至所述服务器,以使所述服务器根据该第一更新结果,以及从所述第二参与方接收的针对所述模型共用部分的当前参数的第二更新结果,更新所述模型共用部分。
27.一种实现隐私保护的多方联合训练事件预测模型的装置,所述多方包括第一参与方、第二参与方和服务器;所述第一参与方中部署源域特征提取器,所述第二参与方中部署目标域特征器;所述服务器中部署模型共用部分,具体包括共享特征提取器、图神经网络和分类网络;所述装置集成于所述第二参与方,所述装置包括:
样本获取单元,配置为获取多个目标域样本,其中每个目标域样本包括目标域用户的多个目标域事件构成的目标域事件序列,以及对应的分类标签;
关系图获取单元,配置为获取针对所述多个目标域样本对应的多个目标域用户而构建的目标域关系网络图,其中包括对应该多个目标域用户的多个目标域节点,以及目标域节点之间存在关联关系而形成的连接边;
事件预测单元,配置为将所述各个样本作为当前样本,输入事件预测模型,其中所述事件预测单元包括:
参数获取模块,配置为从所述服务器获取所述模型共用部分的当前参数;
样本表征模块,配置为采用所述目标域特征提取器对该目标域样本进行特征提取,得到目标域特征表示;利用所述图神经网络的当前参数,基于所述目标域特征表示,对所述目标域关系网络图进行图嵌入处理,得到该目标域样本的目标域图嵌入向量;采用所述共享特征提取器的当前参数,对该目标域样本进行特征提取,得到第二特征表示;根据该目标域图嵌入向量和第二特征表示,得到目标域样本的样本特征向量;
分类预测模块,配置为利用所述分类网络的当前参数,基于所述当前样本的样本特征向量,预测当前样本的事件类别,得到预测结果;
参数更新单元,配置为基于各个样本的预测结果和对应的分类标签,对所述目标域特征提取器和所述模型共用部分的当前参数进行更新;
结果发送单元,配置为将所述模型共用部分的当前参数的第二更新结果,发送至所述服务器,以使所述服务器根据该第二更新结果,以及从所述第二参与方接收的针对所述模型共用部分的当前参数的第一更新结果,更新所述模型共用部分。
28.一种实现隐私保护的多方联合训练事件预测模型的装置,所述多方包括第一参与方、第二参与方和服务器;所述第一参与方中部署源域特征提取器,所述第二参与方中部署目标域特征器;所述服务器中部署模型共用部分,具体包括共享特征提取器、图神经网络和分类网络;所述装置集成于所述服务器,所述装置包括:
参数发送单元,配置为分别向所述第一参与方和第二参与方发送所述模型共用部分的当前参数;
第一结果接收单元,配置为从所述第一参与方接收其根据权利要求26所述的装置得到的针对所述当前参数的第一更新结果;
第二结果接收单元,配置为从所述第二参与方接收其根据权利要求27所述的装置得到的针对所述当前参数的第二更新结果;
参数更新单元,配置为基于所述第一更新结果和第二更新结果,更新所述服务器中部署的模型共用部分。
29.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-14中任一项的所述的方法。
30.一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-14中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010888440.0A CN111814977B (zh) | 2020-08-28 | 2020-08-28 | 训练事件预测模型的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010888440.0A CN111814977B (zh) | 2020-08-28 | 2020-08-28 | 训练事件预测模型的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111814977A true CN111814977A (zh) | 2020-10-23 |
CN111814977B CN111814977B (zh) | 2020-12-18 |
Family
ID=72860328
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010888440.0A Active CN111814977B (zh) | 2020-08-28 | 2020-08-28 | 训练事件预测模型的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111814977B (zh) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112288042A (zh) * | 2020-12-18 | 2021-01-29 | 蚂蚁智信(杭州)信息技术有限公司 | 行为预测系统的更新方法及装置、存储介质和计算设备 |
CN112434754A (zh) * | 2020-12-14 | 2021-03-02 | 前线智能科技(南京)有限公司 | 一种基于图神经网络的跨模态医学影像域适应分类方法 |
CN112507372A (zh) * | 2021-02-05 | 2021-03-16 | 支付宝(杭州)信息技术有限公司 | 实现隐私保护的多方协同更新模型的方法及装置 |
CN112559099A (zh) * | 2020-12-04 | 2021-03-26 | 北京新能源汽车技术创新中心有限公司 | 基于用户行为的远程图像显示方法、装置、系统及存储介质 |
CN112634048A (zh) * | 2020-12-30 | 2021-04-09 | 第四范式(北京)技术有限公司 | 一种反洗钱模型的训练方法及装置 |
CN112668633A (zh) * | 2020-12-25 | 2021-04-16 | 浙江大学 | 一种基于细粒度领域自适应的图迁移学习方法 |
CN112949752A (zh) * | 2021-03-25 | 2021-06-11 | 支付宝(杭州)信息技术有限公司 | 业务预测系统的训练方法及装置 |
CN112988186A (zh) * | 2021-02-19 | 2021-06-18 | 支付宝(杭州)信息技术有限公司 | 异常检测系统的更新方法及装置 |
CN113132931A (zh) * | 2021-04-16 | 2021-07-16 | 电子科技大学 | 一种基于参数预测的深度迁移室内定位方法 |
CN114818973A (zh) * | 2021-07-15 | 2022-07-29 | 支付宝(杭州)信息技术有限公司 | 一种基于隐私保护的图模型训练方法、装置及设备 |
CN114814776A (zh) * | 2022-06-24 | 2022-07-29 | 中国空气动力研究与发展中心计算空气动力研究所 | 基于图注意力网络和迁移学习的pd雷达目标检测方法 |
CN115208755A (zh) * | 2022-07-13 | 2022-10-18 | 北京交通大学 | 面向物联网设备资源友好的特征提取器部署方法及系统 |
CN116432039A (zh) * | 2023-06-13 | 2023-07-14 | 支付宝(杭州)信息技术有限公司 | 协同训练方法及装置、业务预测方法及装置 |
CN117792801A (zh) * | 2024-02-28 | 2024-03-29 | 贵州华谊联盛科技有限公司 | 一种基于多元事件分析的网络安全威胁识别方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111275350A (zh) * | 2020-02-08 | 2020-06-12 | 支付宝(杭州)信息技术有限公司 | 更新事件评估模型的方法及装置 |
DE202020101664U1 (de) * | 2020-02-07 | 2020-07-07 | Google Llc | Rechnergestützte Graphenoptimierung |
CN111523047A (zh) * | 2020-04-13 | 2020-08-11 | 中南大学 | 基于图神经网络的多关系协同过滤算法 |
-
2020
- 2020-08-28 CN CN202010888440.0A patent/CN111814977B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE202020101664U1 (de) * | 2020-02-07 | 2020-07-07 | Google Llc | Rechnergestützte Graphenoptimierung |
CN111275350A (zh) * | 2020-02-08 | 2020-06-12 | 支付宝(杭州)信息技术有限公司 | 更新事件评估模型的方法及装置 |
CN111523047A (zh) * | 2020-04-13 | 2020-08-11 | 中南大学 | 基于图神经网络的多关系协同过滤算法 |
Non-Patent Citations (1)
Title |
---|
THIEN HUU NGUYEN等: "《Graph Convolutional Networks with Argument-Aware Pooling for Event Detection》", 《ASSOCIATION FOR THE ADVANCEMENT OF ARTIFICIAL》 * |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112559099B (zh) * | 2020-12-04 | 2024-02-27 | 北京国家新能源汽车技术创新中心有限公司 | 基于用户行为的远程图像显示方法、装置、系统及存储介质 |
CN112559099A (zh) * | 2020-12-04 | 2021-03-26 | 北京新能源汽车技术创新中心有限公司 | 基于用户行为的远程图像显示方法、装置、系统及存储介质 |
CN112434754A (zh) * | 2020-12-14 | 2021-03-02 | 前线智能科技(南京)有限公司 | 一种基于图神经网络的跨模态医学影像域适应分类方法 |
CN112288042A (zh) * | 2020-12-18 | 2021-01-29 | 蚂蚁智信(杭州)信息技术有限公司 | 行为预测系统的更新方法及装置、存储介质和计算设备 |
CN112668633B (zh) * | 2020-12-25 | 2022-10-14 | 浙江大学 | 一种基于细粒度领域自适应的图迁移学习方法 |
CN112668633A (zh) * | 2020-12-25 | 2021-04-16 | 浙江大学 | 一种基于细粒度领域自适应的图迁移学习方法 |
CN112634048A (zh) * | 2020-12-30 | 2021-04-09 | 第四范式(北京)技术有限公司 | 一种反洗钱模型的训练方法及装置 |
CN112507372B (zh) * | 2021-02-05 | 2021-05-14 | 支付宝(杭州)信息技术有限公司 | 实现隐私保护的多方协同更新模型的方法及装置 |
CN112507372A (zh) * | 2021-02-05 | 2021-03-16 | 支付宝(杭州)信息技术有限公司 | 实现隐私保护的多方协同更新模型的方法及装置 |
CN112988186A (zh) * | 2021-02-19 | 2021-06-18 | 支付宝(杭州)信息技术有限公司 | 异常检测系统的更新方法及装置 |
CN112988186B (zh) * | 2021-02-19 | 2022-07-19 | 支付宝(杭州)信息技术有限公司 | 异常检测系统的更新方法及装置 |
CN112949752A (zh) * | 2021-03-25 | 2021-06-11 | 支付宝(杭州)信息技术有限公司 | 业务预测系统的训练方法及装置 |
CN113132931A (zh) * | 2021-04-16 | 2021-07-16 | 电子科技大学 | 一种基于参数预测的深度迁移室内定位方法 |
CN113132931B (zh) * | 2021-04-16 | 2022-01-28 | 电子科技大学 | 一种基于参数预测的深度迁移室内定位方法 |
CN114818973A (zh) * | 2021-07-15 | 2022-07-29 | 支付宝(杭州)信息技术有限公司 | 一种基于隐私保护的图模型训练方法、装置及设备 |
CN114814776A (zh) * | 2022-06-24 | 2022-07-29 | 中国空气动力研究与发展中心计算空气动力研究所 | 基于图注意力网络和迁移学习的pd雷达目标检测方法 |
CN114814776B (zh) * | 2022-06-24 | 2022-10-14 | 中国空气动力研究与发展中心计算空气动力研究所 | 基于图注意力网络和迁移学习的pd雷达目标检测方法 |
CN115208755A (zh) * | 2022-07-13 | 2022-10-18 | 北京交通大学 | 面向物联网设备资源友好的特征提取器部署方法及系统 |
CN116432039A (zh) * | 2023-06-13 | 2023-07-14 | 支付宝(杭州)信息技术有限公司 | 协同训练方法及装置、业务预测方法及装置 |
CN116432039B (zh) * | 2023-06-13 | 2023-09-05 | 支付宝(杭州)信息技术有限公司 | 协同训练方法及装置、业务预测方法及装置 |
CN117792801A (zh) * | 2024-02-28 | 2024-03-29 | 贵州华谊联盛科技有限公司 | 一种基于多元事件分析的网络安全威胁识别方法及系统 |
CN117792801B (zh) * | 2024-02-28 | 2024-05-14 | 贵州华谊联盛科技有限公司 | 一种基于多元事件分析的网络安全威胁识别方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN111814977B (zh) | 2020-12-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111814977B (zh) | 训练事件预测模型的方法及装置 | |
CN110659744B (zh) | 训练事件预测模型、评估操作事件的方法及装置 | |
WO2019114344A1 (zh) | 一种基于图结构模型的异常账号防控方法、装置以及设备 | |
CN110555469B (zh) | 处理交互序列数据的方法及装置 | |
CN111818093B (zh) | 用于进行风险评估的神经网络系统、方法及装置 | |
WO2021139524A1 (zh) | 利用lstm神经网络模型处理交互数据的方法及装置 | |
CN110543935B (zh) | 处理交互序列数据的方法及装置 | |
CN110689110B (zh) | 处理交互事件的方法及装置 | |
CN112541575B (zh) | 图神经网络的训练方法及装置 | |
CN110705688B (zh) | 对操作事件进行风险评估的神经网络系统、方法及装置 | |
CN112085293B (zh) | 训练交互预测模型、预测交互对象的方法及装置 | |
CN109658120B (zh) | 一种业务数据处理方法以及装置 | |
CN113592593B (zh) | 序列推荐模型的训练及应用方法、装置、设备及存储介质 | |
CN116862012A (zh) | 机器学习模型训练方法、业务数据处理方法、装置及系统 | |
CN112580789B (zh) | 训练图编码网络、预测交互事件的方法及装置 | |
WO2022237175A1 (zh) | 图数据的处理方法、装置、设备、存储介质及程序产品 | |
CN111967565A (zh) | 用于进行风险评估的神经网络系统、方法及装置 | |
CN111242283A (zh) | 评估交互事件的自编码器的训练方法及装置 | |
CN116090504A (zh) | 图神经网络模型训练方法及装置、分类方法、计算设备 | |
CN114445121A (zh) | 一种广告点击率预测模型构建及广告点击率预测方法 | |
CN111402028A (zh) | 一种信息处理方法、装置及设备 | |
CN114511024B (zh) | 节点分类方法、装置、设备、介质和计算机程序产品 | |
CN114048804B (zh) | 一种分类模型训练方法及装置 | |
CN115757962A (zh) | 内容推荐方法、装置、电子设备及存储介质 | |
CN116150429A (zh) | 异常对象识别方法、装置、计算设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40039733 Country of ref document: HK |