CN114610994A - 基于联合预测的推送方法和系统 - Google Patents
基于联合预测的推送方法和系统 Download PDFInfo
- Publication number
- CN114610994A CN114610994A CN202210222683.XA CN202210222683A CN114610994A CN 114610994 A CN114610994 A CN 114610994A CN 202210222683 A CN202210222683 A CN 202210222683A CN 114610994 A CN114610994 A CN 114610994A
- Authority
- CN
- China
- Prior art keywords
- participant
- data
- model
- joint prediction
- joint
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000013480 data collection Methods 0.000 claims description 11
- 238000005304 joining Methods 0.000 claims description 8
- 230000003993 interaction Effects 0.000 claims description 6
- 238000012417 linear regression Methods 0.000 claims description 6
- 238000003860 storage Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 230000006399 behavior Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 235000019800 disodium phosphate Nutrition 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 2
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Computer Security & Cryptography (AREA)
- Development Economics (AREA)
- Computer Hardware Design (AREA)
- Game Theory and Decision Science (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开提供了一种基于联合预测的推送方法和系统,方法包括:获取请求方在第一参与者处的第一数据以及在第二参与者处的第二数据,其中第一参与者处的第一数据不同于第二参与者处的第二数据,并且第一数据和第二数据是不互通的;基于共享学习联合所获取的第一数据和第二数据来进行联合预测以进行向该请求方的联合预测相关推送;以及向第一参与者和第二参与者反馈联合预测的结果。
Description
技术领域
本公开涉及人工智能领域,更具体地,涉及基于联合预测的推送方法和系统。
背景技术
在生活中的许多场景中,企业和公益团体等需要基于用户的特征进行一些活动推送,然而,在传统上,各个企业或团体各自根据自己端内的数据进行运营。一方面,由于是分别进行运营,用户可能会从各企业收到各自的推送,这可能会造成权益的浪费。另一方面,各个参与者都只有用户在自己场景的数据,而没有在其他场景的数据,这对于用户行为的刻画是局部的而非完整的,从而导致推送的准确性较差。因此,随着运营成本的增加以及运营预算的减少,如何向最有价值的用户进行推送是一个很难解的问题。
另外,有些企业或团体还通过互通特征进行联合运营。然而,由于是以明文的方式进行数据互通,因此导致用户的个人隐私信息存在泄露风险。另外,由于各家企业都有保密协议,一些特别敏感的数据不会互通,这导致对用户特征的刻画也是残缺的,从而导致推荐准确性较差。
因此,希望能够提供一种基于联合预测的推送方法,能够打破数据孤岛,在保护各自隐私的情况下,实现联合运营,减少不必要的推送,并且对用户的刻画更加完善。
发明内容
提供本公开内容以便以简化形式介绍将在以下具体实施方式中进一步的描述一些概念。本公开内容并非旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于帮助确定所要求保护的主题的范围。
针对以上问题,根据本公开的一个方面,提供了一种基于联合预测的推送方法,所述方法包括:获取请求方在第一参与者处的第一数据以及在第二参与者处的第二数据,其中所述第一参与者处的第一数据不同于所述第二参与者处的第二数据,并且所述第一数据和所述第二数据是不互通的;基于共享学习联合所获取的第一数据和第二数据来进行联合预测以进行向所述请求方的联合预测相关推送;以及向所述第一参与者和所述第二参与者反馈所述联合预测的结果。
本公开实施例的技术方案中,不同参与者共同进行联合预测相关推送,不再出现一个用户可能同时收到两份推送的情况,减少了不必要的推送。另外,本公开同时利用了不同参与者处的用户特征数据,解决了数据孤岛问题,对用户的刻画更加完善,预测结果更加准确。另外,本公开通过共享学习的加密技术保证了参与者不会存在隐私泄漏的风险。
根据本公开的一个实施例,基于共享学习联合所获取的第一数据和第二数据来进行联合预测以进行向所述请求方的联合预测相关推送进一步包括:将所获取的第一数据和第二数据输入联合预测模型以进行向所述请求方的联合预测相关推送,其中所述联合预测模型是由所述第一参与者处的第一参与者模型和所述第二参与者处的第二参与者模型联合得到的,所述第一参与者模型和所述第二参与者模型是基于共享学习联合所述第一数据和所述第二数据经由第三方协作者进行加密训练得到的。
根据本公开的进一步实施例,所述第一参与者模型和所述第二参与者模型是通过以下操作来训练得到的,其中训练数据集包括共有群体在同一时间段在所述第一参与者处的第一数据、在所述第二参与者处的第二数据以及关于联合预测结果的训练标签:初始化所述第一参与者模型的第一模型参数和所述第二参与者模型的第二模型参数;所述第一参与者和所述第二参与者各自计算相应的第一中间结果和第二中间结果并且利用所述第三方协作者发送的公钥来进行加密交互;所述第一参与者和所述第二参与者各自计算加密梯度并且添加掩码后发送给所述第三方协作者;所述第二参与者计算加密损失并且发送给所述第三方协作者;以及所述第三方协作者将解密后的梯度分别回传给所述第一参与者和所述第二参与者以更新所述第一模型参数和所述第二模型参数,直至损失收敛。
根据本公开的进一步实施例,所述第一参与者模型和所述第二参与者模型是基于同态加密和线性回归来训练得到的。
根据本公开的进一步实施例,所述共有群体是利用基于加密的样本对齐算法来得到的。
根据本公开的进一步实施例,所述样本对齐算法包括RSA算法,其中,所述第一参与者和所述第二参与者利用所述第三方协作者发送的公钥来对样本数据进行加密,并且将经加密的样本数据发送给所述第三方协作者;以及所述第三方协作者利用私钥对所述经加密的样本数据进行解密,并且取出共有群体返回给所述第一参与者和所述第二参与者。
根据本公开的进一步实施例,所述联合预测的结果是多分类的。
根据本公开的另一方面,提供了一种基于联合预测的推送系统,所述系统包括:数据采集模块,获取请求方在第一参与者处的第一数据以及在第二参与者处的第二数据,其中所述第一参与者处的第一数据不同于所述第二参与者处的第二数据,并且所述第一数据和所述第二数据是不互通的;联合预测模块,基于共享学习联合所获取的第一数据和第二数据来进行联合预测以进行向所述请求方的联合预测相关推送;以及结果反馈模块,向所述第一参与者和所述第二参与者反馈所述联合预测的结果。
本公开实施例的技术方案中,本公开联合不同参与者处基于不同特征的用户数据利用共享学习来进行联合预测,以向请求方进行联合预测相关的推送,从而避免了不必要的推送,使不同参与者在保证数据安全的情况下进行用户特征的互通,解决了数据孤岛问题,并且对用户进行了更完善的刻画。
根据本公开的一个实施例,所述联合预测模块进一步:将所获取的第一数据和第二数据输入联合预测模型以进行向所述请求方的联合预测相关推送,其中所述联合预测模型是由所述第一参与者处的第一参与者模型和所述第二参与者处的第二参与者模型联合得到的,所述第一参与者模型和所述第二参与者模型是基于共享学习联合所述第一数据和所述第二数据经由第三方协作者进行加密训练得到的。
根据本公开的进一步实施例,所述第一参与者模型和所述第二参与者模型是通过以下操作来训练得到的,其中训练数据集包括共有群体在同一时间段在所述第一参与者处的第一数据、在所述第二参与者处的第二数据以及关于联合预测结果的训练标签:初始化所述第一参与者模型的第一模型参数和所述第二参与者模型的第二模型参数;所述第一参与者和所述第二参与者各自计算相应的第一中间结果和第二中间结果并且利用所述第三方协作者发送的公钥来进行加密交互;所述第一参与者和所述第二参与者各自计算加密梯度并且添加掩码后发送给所述第三方协作者;所述第二参与者计算加密损失并且发送给所述第三方协作者;以及所述第三方协作者将解密后的梯度分别回传给所述第一参与者和所述第二参与者以更新所述第一模型参数和所述第二模型参数,直至损失收敛。
根据本公开的进一步实施例,所述第一参与者模型和所述第二参与者模型是基于同态加密和线性回归来训练得到的。
根据本公开的进一步实施例,所述共有群体是利用基于加密的样本对齐算法来得到的。
根据本公开的进一步实施例,所述样本对齐算法包括RSA算法,其中,所述第一参与者和所述第二参与者利用所述第三方协作者发送的公钥来对样本数据进行加密,并且将经加密的样本数据发送给所述第三方协作者;以及所述第三方协作者利用私钥对所述经加密的样本数据进行解密,并且取出共有群体返回给所述第一参与者和所述第二参与者。
根据本公开的进一步实施例,所述联合预测的结果是多分类的。
根据本公开的又一方面,提供了一种存储有指令的计算机可读存储介质,当这些指令被执行时使得机器执行前述方面中的任一者所述的方法。
通过阅读下面的详细描述并参考相关联的附图,这些及其他特点和优点将变得显而易见。应该理解,前面的概括说明和下面的详细描述只是说明性的,不会对所要求保护的各方面形成限制。
附图说明
为了能详细地理解本公开的上述特征所用的方式,可以参照各实施例来对以上简要概述的内容进行更具体的描述,其中一些方面在附图中示出。然而应该注意,附图仅示出了本公开的某些典型方面,故不应被认为限定其范围,因为该描述可以允许有其它等同有效的方面。
图1是根据本公开的一个实施例的基于联合预测的推送系统的示意架构图。
图2是根据本公开的一个实施例的联合第一参与者模型和第二参与者模型的联合预测模型的训练过程的示意架构图。
图3是根据本公开的一个实施例的加密样本对齐的示意图。
图4是根据本公开的一个实施例的加密模型训练的示意图。
图5是根据本公开的一个实施例的基于联合预测的推送方法的示意流程图。
图6是根据本公开的一个实施例的基于联合预测的推送系统的示意架构图。
具体实施方式
下面结合附图详细描述本公开,本公开的特点将在以下的具体描述中得到进一步的显现。为了解说方便,以下将以支付平台和线下商户为例来描述本发明的实施方式,但本领域技术人员可以理解,本发明同样适用于其他的参与者。
图1示出了根据本公开的一个实施例的基于联合预测的推送系统100的示意架构图。如图1中所示,系统100可至少包括数据采集模块101、联合预测模块102和结果反馈模块103。
数据采集模块101可获取请求方在第一参与者处的第一数据以及在第二参与者处的第二数据,其中第一参与者处的第一数据和第二参与者处的第二数据是不互通的,并且第一数据不同于第二数据,即,第一数据和第二数据基于不同的请求方特征。在一实施方式中,在智慧风控的场景中,数据采集模块101可获取请求方在不同数据拥有者处的不同资产数据(例如,信用数据等)。在另一实施方式中,在智慧支付场景中,数据采集模块101可获取用户在不同数据拥有者处的不同支付数据(例如,支付平台处的第一支付数据、线下商户处的第二支付数据等)。在另一实施方式中,在智慧教育的场景中,数据采集模块101可获取请求方在不同数据拥有者处的不同教育数据。
联合预测模块102可基于共享学习联合所获取的第一数据和第二数据来进行联合预测以进行向请求方的联合预测相关推送。进一步地,联合预测模块102可将所获取的第一数据和第二数据输入联合预测模型以进行向请求方的联合预测相关推送,其中该联合预测模型是由第一参与者处的第一参与者模型和第二参与者处的第二参与者模型联合得到的,第一参与者模型和第二参与者模型是基于共享学习联合第一数据和第二数据经由第三方协作者进行加密训练得到的,具体训练过程将在下文图2-4中进一步详细描述。在一实施方式中,联合预测模块102可基于请求方在各个数据拥有者处的支付数据来进行联合预测,以进行向请求方的联合预测相关推送(例如,由各个数据拥有者基于联合预测结果来进行权益推送以避免权益的浪费)。
结果反馈模块103可向第一参与者和第二参与者反馈联合预测的结果。在上述智慧支付的实施方式中,结果反馈模块103可向不同的数据拥有者反馈联合预测的结果,其中不同数据拥有者可基于所反馈的结果来进行联合预测相关推送(例如,在联合预测的结果指示用户支付意愿较高,则进行最低档的权益推送)。
由此,通过联合不同的数据拥有者所拥有的数据来共同进行联合预测相关推送,避免出现使一个用户同时收到多份推送的情况,减少了不必要的推送。另外,通过同时利用不同数据拥有者的数据,打破数据孤岛,对用户的刻画更加完善,使模型的预测结果更加准确。另外,通过共享学习的加密技术,可以保证不同的数据拥有者不会存在用户隐私数据泄露的风险。
下面以红包码为例来解说支付平台与线下商户利用系统100联合进行权益推送的场景。如图1中所示,在用户扫码领取红包码时,数据采集模块101可读取用户在支付平台和线下商户处的相关支付特征信息。例如,数据采集模块101可获取用户在支付平台处的基础信息、线上线下支付信息、在线下门店的支付行为信息。联合预测模块102可随后将所获取的用户信息输入基于共享学习的联合预测模型以得到预测的用户支付意愿为线下商户低意愿,从而基于预测结果来由线下商户推送额外补贴的权益(例如,线下消费立减权益等)。随后,结果反馈模块103可向支付平台和线下商户反馈联合预测的结果。
本领域技术人员能够理解,本公开的系统及其各模块既可以以硬件形式实现,也可以以软件形式实现,并且各模块可以任意合适的方式合并或组合。
图2示出了根据本公开的一个实施例的联合第一参与者模型和第二参与者模型的联合预测模型的训练过程200的示意架构图。训练过程200主要包括三个阶段:数据准备、加密样本对齐和加密模型训练。
在第一阶段(即,数据准备)的过程中,第一参与者和第二参与者各自清洗出训练所需要的用户特征。在一实施方式中,第一参与者为支付平台,其可清洗用户基础信息和线上线下支付信息,其中用户基础信息可包括用户性别、年龄、所在城市等,线上线下支付信息可包括用户消费频次、支付成功率等,第二参与者为线下商户,其可清洗用户在自己线下门店的支付行为信息以及训练标签,其中用户在线下门店的支付行为信息包括用户消费频次、消费偏好等,训练标签可包括联合预测结果。注意到,应选取同一时间段的数据,从而保证样本可对齐。由此,在不同参与者处清洗出的用户特征勾勒出更完整的用户画像,从而解决了数据孤岛问题。另外,模型的标签不再是简单的二分类,而是多分类,从而提升了模型预测的适用性。
在做好数据准备之后得到来自第一参与者和第二参与者的各自的原始数据。由于第一参与者和第二参与者处的用户群体并非完全重合,因此在第二阶段(即,加密样本对齐)的过程中,系统可利用基于加密的用户样本对齐算法在第一参与者和第二参与者不公开各自数据的前提下确认双方的共有用户群体,并且不暴露不互相重叠的用户,联合这些用户的特征进行建模。样本对齐算法可选用RSA算法。用户样本对齐的过程可包括:由协作者产生公钥分发给第一参与者和第二参与者,对用户样本进行加密,经加密的用户样本被发送给协作者,随后由协作者利用私钥对经加密的用户样本进行解密,取出第一参与者和第二参与者的共有用户群体,如参考以下图3进一步详细描述的。如图3所示,为了保证数据的隐私性,可选择协作者(例如,飞地平台)来管控公钥和私钥的分发。第三方协作者可利用RSA算法来生成一对密钥(包括公钥和私钥),其中RSA算法的具体描述如下:(1)随机找两个大质数P和Q,计算n=P*Q;(2)计算n的欧拉函数m=$(n);(3)随机选择一个正整数e,使得1<e<m,且e与m互质d;(4)根据扩展欧几里得算法,求得d,使得e*d/m的余数为1;(5)公钥为(n,e),私钥为(n,d);以及(6)公钥用来加密,其中密文为明文的e次方除以n的余数;私钥用来解密,其中解密出的明文为密文的d次方除以n的余数。在图3中,第一参与者和第二参与者各自包括认证模块、用户数据和加密模块,其中认证模块可用于接收协作者下发的公钥,并且发送给加密模块对用户数据进行加密,随后经加密的数据被发送给协作者。协作者可包括解密模块,其中该解密模块可用于对第一参与者和第二参与者上传的经加密数据基于私钥进行解密。在解密之后,共有用户群体可被取出以作为训练数据集返回给第一参与者和第二参与者。
在确定训练数据集之后,可以在第三阶段进行加密模型训练。在图4中进一步详细示出了加密模型训练过程。在图4中具体包括以下步骤:
S1:可靠的第三方协作者创建公钥-私钥对(例如,利用RSA算法),并且将公钥分发给第一参与者和第二参与者,用以对训练过程中需要交换的数据进行加密。
S2:第一参与者和第二参与者分别初始化各自的模型参数(即,第一参与者模型的第一模型参数和第二参与者模型的第二模型参数),并且分别对梯度和损失计算所需的中间结果进行加密和交换。
S3:第一参与者和第二参与者各自计算加密梯度并且添加掩码后发送给第三方协作者,另外,第二参与者计算加密损失并且发送给第三方协作者。
S4:第三方协作者将解密后的梯度分别回传给第一参与者和第二参与者以更新第一参与者处的第一模型参数和第二参与者处的第二模型参数,迭代上述步骤直至损失收敛。
以下以线性回归和同态加密技术为例具体描述上述训练过程,但本领域技术人员可以理解,本发明同样适用于其他机器学习方法和加密技术。
具体而言,首先给定学习率η、正则化参数λ、支付平台处的训练数据集线下商户处的训练数据集分别与第一参与者和第二参与者处的模型相关的模型参数ΘA、ΘB、第二参与者处的训练标签yi、以及第一参与者和第二参与者处的随机掩码RA、RB。
目标函数可表示为:
则经同态加密后的目标函数可表示为:
其中加法同态加密可被标示为[[·]]。
由此可见,第一参与者可计算并且将其发送给第二参与者。第二参与者可计算和[[L]],并且将发送给第一参与者,将[[L]]发送给第三方协作者。随后,第一参与者和第二参与者各自计算加密梯度并且添加掩码以得到和并且将和发送到第三方协作者。第三方协作者随后解密L、和并且将发送给第一参与者,将发送给第二参与者,第一参与者和第二参与者根据解密后的梯度更新各自模型的参数ΘA、ΘB。随后,迭代上述步骤,直至损失函数收敛,模型训练完成。
在推理阶段,协作者可将具有用户标识符的用户请求发送给第一参与者和第二参与者,第一参与者和第二参与者可基于所接收到的用户标识符读取相关的用户特征来分别计算和并且随后将计算出的和发送给协作者,协作者随后计算 并且对其进行解密以得到预测值y(例如,0-2)。
由此,在第一参与者处的第一参与者模型和第二参与者处的第二参与者模型训练完成之后,可以将联合第一参与者模型和第二参与者模型的联合预测模型部署在模型平台。在一个示例中,在用户领取例如红包码时,模型平台会读取不同参与者处的用户特征,通过部署好的模型进行联合预测,从而基于联合预测结果来进行相应的联合推送。
如以上所提及的,在加密样本对齐和加密模型训练的过程中,第一参与者和第二参与者的数据在本地保存,训练中的数据交互不会导致数据隐私泄漏。为了进一步阻止协作者从第一参与者和第二参与者学到信息,第一参与者和第二参与者可通过添加加密的随机掩码进一步向协作者隐藏其梯度。由此,通过共享学习的加密技术,保证了第一参与者和第二参与者不会存在隐私泄露的风险。另外,在不泄漏用户隐私的情况下,还可联合第一参与者和第二参与者处的用户特征来更完善地勾勒出用户画像,从而使预测结果更准确,并且避免了权益浪费。
图5是根据本公开的一个实施例的基于联合预测的推送方法500的示意流程图。方法500开始于步骤501,数据采集模块101可获取请求方在第一参与者处的第一数据以及在第二参与者处的第二数据,其中第一参与者处的第一数据不同于第二参与者处的第二数据,并且第一数据和第二数据是不互通的。在一实施方式中,数据采集模块101可获取请求方在不同数据拥有者处的信用数据、发票开票数据等以用于后续的风险预测。在另一实施方式中,数据采集模块101可获取请求方在不同数据拥有者处的支付数据以用于后续的支付预测。
在步骤502,联合预测模块102可基于共享学习联合所获取的第一数据和第二数据来进行联合预测以进行向所述请求方的联合预测相关推送。进一步地,联合预测模块102可将所获取的第一数据和第二数据输入联合预测模型以进行向请求方的联合预测相关推送,其中该联合预测模型是由第一参与者处的第一参与者模型和第二参与者处的第二参与者模型联合得到的,第一参与者模型和第二参与者模型是基于共享学习联合第一数据和第二数据经由第三方协作者进行加密训练得到的。例如,第一参与者模型和第二参与者模型的训练过程可包括加密样本对齐和加密模型训练。在加密样本对齐时可利用RSA算法来在协作者处进行用户样本对齐以取出共有用户群体,包括:第一参与者和第二参与者利用协作者发送的公钥来对用户样本进行加密,并且将经加密的用户样本发送给第三方协作者,随后第三方协作者利用私钥对经加密的用户样本进行解密,并且取出共有用户群体返回给第一参与者和第二参与者。在加密模型训练时可包括以下步骤:由协作者向第一参与者和第二参与者发送公钥,第一参与者和第二参与者计算和交换经加密的中间结果,第一参与者和第二参与者计算基于中间结果来计算加密梯度和损失并且发送给协作者,协作者随后解密梯度并且回传给第一参与者模型和第二参与者模型以更新梯度。在一实施方式中,第一参与者模型和第二参与者模型是基于同态加密和线性回归来训练得到的。
在步骤503,结果反馈模块103可向第一参与者和第二参与者反馈联合预测的结果。在一实施方式中,联合预测的结果可以是多分类的。在一实施方式中,结果反馈模块103可向不同的数据拥有者反馈经联合预测的风险预测结果以用于智慧风控。
由此,在一方面,不同的数据拥有者共同进行联合推送,不再出现一个用户可能同时收到多份不必要推送的情况,减少了不必要的推送。在另一方面,该方法同时利用了不同参与者的数据,由于不同参与者拥有基于不同用户特征的数据,因此解决了数据孤岛问题,对用户的刻画更加完善,使得预测结果更加准确,从而更好地制定推送策略以用于不同的联合预测场景。在又一方面,该方法通过共享学习的加密技术保证了多个不同参与者不会存在隐私泄露的风险。
图6示出了根据本公开的一个实施例的基于联合预测的推送系统600的示意架构图。如图6中所示,系统600可包括存储器601和至少一个处理器602。存储器601可存储经训练的联合预测模型。存储器601可包括RAM、ROM、或其组合。存储器601可存储计算机可执行指令,这些指令在由至少一个处理器602执行时使该至少一个处理器执行本文中所描述的各种功能,包括:获取请求方在第一参与者处的第一数据以及在第二参与者处的第二数据,其中第一参与者处的第一数据不同于第二参与者处的第二数据,并且第一数据和第二数据是不互通的;基于共享学习联合所获取的第一数据和第二数据来进行联合预测以进行向该请求方的联合预测相关推送;以及向第一参与者和第二参与者反馈该联合预测的结果。在一些情形中,存储器601可尤其包含BIOS,该BIOS可控制基本硬件或软件操作,诸如与外围组件或设备的交互。处理器602可包括智能硬件设备(例如,通用处理器、DSP、CPU、微控制器、ASIC、FPGA、可编程逻辑器件、分立的门或晶体管逻辑组件、分立的硬件组件,或其任何组合)。
结合本文中的公开描述的各种解说性框以及模块可以用设计成执行本文中描述的功能的通用处理器、DSP、ASIC、FPGA或其他可编程逻辑器件、分立的门或晶体管逻辑、分立的硬件组件、或其任何组合来实现或执行。通用处理器可以是微处理器,但在替换方案中,处理器可以是任何常规的处理器、控制器、微控制器、或状态机。处理器还可被实现为计算设备的组合(例如,DSP与微处理器的组合、多个微处理器、与DSP核心协同的一个或多个微处理器,或者任何其他此类配置)。
本文中所描述的功能可以在硬件、由处理器执行的软件、固件、或其任何组合中实现。如果在由处理器执行的软件中实现,则各功能可以作为一条或多条指令或代码存储在计算机可读介质上或藉其进行传送。其他示例和实现落在本公开及所附权利要求的范围内。例如,由于软件的本质,本文描述的功能可使用由处理器执行的软件、硬件、固件、硬连线或其任何组合来实现。实现功能的特征也可物理地位于各种位置,包括被分布以使得功能的各部分在不同的物理位置处实现。
以上所已经描述的内容包括所要求保护主题的各方面的示例。当然,出于描绘所要求保护主题的目的而描述每一个可以想到的组件或方法的组合是不可能的,但本领域内的普通技术人员应该认识到,所要求保护主题的许多进一步的组合和排列都是可能的。从而,所公开的主题旨在涵盖落入所附权利要求书的精神和范围内的所有这样的变更、修改和变化。
Claims (15)
1.一种基于联合预测的推送方法,所述方法包括:
获取请求方在第一参与者处的第一数据以及在第二参与者处的第二数据,其中所述第一参与者处的第一数据不同于所述第二参与者处的第二数据,并且所述第一数据和所述第二数据是不互通的;
基于共享学习联合所获取的第一数据和第二数据来进行联合预测以进行向所述请求方的联合预测相关推送;以及
向所述第一参与者和所述第二参与者反馈所述联合预测的结果。
2.如权利要求1所述的方法,基于共享学习联合所获取的第一数据和第二数据来进行联合预测以进行向所述请求方的联合预测相关推送进一步包括:
将所获取的第一数据和第二数据输入联合预测模型以进行向所述请求方的联合预测相关推送,其中所述联合预测模型是由所述第一参与者处的第一参与者模型和所述第二参与者处的第二参与者模型联合得到的,所述第一参与者模型和所述第二参与者模型是基于共享学习联合所述第一数据和所述第二数据经由第三方协作者进行加密训练得到的。
3.如权利要求2所述的方法,所述第一参与者模型和所述第二参与者模型是通过以下操作来训练得到的,其中训练数据集包括共有群体在同一时间段在所述第一参与者处的第一数据、在所述第二参与者处的第二数据以及关于联合预测结果的训练标签:
初始化所述第一参与者模型的第一模型参数和所述第二参与者模型的第二模型参数;
所述第一参与者和所述第二参与者各自计算相应的第一中间结果和第二中间结果并且利用所述第三方协作者发送的公钥来进行加密交互;
所述第一参与者和所述第二参与者各自计算加密梯度并且添加掩码后发送给所述第三方协作者;
所述第二参与者计算加密损失并且发送给所述第三方协作者;以及
所述第三方协作者将解密后的梯度分别回传给所述第一参与者和所述第二参与者以更新所述第一模型参数和所述第二模型参数,直至损失收敛。
4.如权利要求3所述的方法,所述第一参与者模型和所述第二参与者模型是基于同态加密和线性回归来训练得到的。
5.如权利要求3所述的方法,所述共有群体是利用基于加密的样本对齐算法来得到的。
6.如权利要求5所述的方法,所述样本对齐算法包括RSA算法,其中,
所述第一参与者和所述第二参与者利用所述第三方协作者发送的公钥来对样本数据进行加密,并且将经加密的样本数据发送给所述第三方协作者;以及
所述第三方协作者利用私钥对所述经加密的样本数据进行解密,并且取出共有群体返回给所述第一参与者和所述第二参与者。
7.如权利要求1所述的方法,所述联合预测的结果是多分类的。
8.一种基于联合预测的推送系统,所述系统包括:
数据采集模块,获取请求方在第一参与者处的第一数据以及在第二参与者处的第二数据,其中所述第一参与者处的第一数据不同于所述第二参与者处的第二数据,并且所述第一数据和所述第二数据是不互通的;
联合预测模块,基于共享学习联合所获取的第一数据和第二数据来进行联合预测以进行向所述请求方的联合预测相关推送;以及
结果反馈模块,向所述第一参与者和所述第二参与者反馈所述联合预测的结果。
9.如权利要求8所述的系统,所述联合预测模块进一步:
将所获取的第一数据和第二数据输入联合预测模型以进行向所述请求方的联合预测相关推送,其中所述联合预测模型是由所述第一参与者处的第一参与者模型和所述第二参与者处的第二参与者模型联合得到的,所述第一参与者模型和所述第二参与者模型是基于共享学习联合所述第一数据和所述第二数据经由第三方协作者进行加密训练得到的。
10.如权利要求9所述的系统,所述第一参与者模型和所述第二参与者模型是通过以下操作来训练得到的,其中训练数据集包括共有群体在同一时间段在所述第一参与者处的第一数据、在所述第二参与者处的第二数据以及关于联合预测结果的训练标签:
初始化所述第一参与者模型的第一模型参数和所述第二参与者模型的第二模型参数;
所述第一参与者和所述第二参与者各自计算相应的第一中间结果和第二中间结果并且利用所述第三方协作者发送的公钥来进行加密交互;
所述第一参与者和所述第二参与者各自计算加密梯度并且添加掩码后发送给所述第三方协作者;
所述第二参与者计算加密损失并且发送给所述第三方协作者;以及
所述第三方协作者将解密后的梯度分别回传给所述第一参与者和所述第二参与者以更新所述第一模型参数和所述第二模型参数,直至损失收敛。
11.如权利要求10所述的系统,所述第一参与者模型和所述第二参与者模型是基于同态加密和线性回归来训练得到的。
12.如权利要求10所述的系统,所述共有群体是利用基于加密的样本对齐算法来得到的。
13.如权利要求12所述的系统,所述样本对齐算法包括RSA算法,其中,
所述第一参与者和所述第二参与者利用所述第三方协作者发送的公钥来对样本数据进行加密,并且将经加密的样本数据发送给所述第三方协作者;以及
所述第三方协作者利用私钥对所述经加密的样本数据进行解密,并且取出共有群体返回给所述第一参与者和所述第二参与者。
14.如权利要求8所述的系统,所述联合预测的结果是多分类的。
15.一种存储有指令的计算机可读存储介质,当所述指令被执行时使得机器执行如权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210222683.XA CN114610994A (zh) | 2022-03-09 | 2022-03-09 | 基于联合预测的推送方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210222683.XA CN114610994A (zh) | 2022-03-09 | 2022-03-09 | 基于联合预测的推送方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114610994A true CN114610994A (zh) | 2022-06-10 |
Family
ID=81861847
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210222683.XA Pending CN114610994A (zh) | 2022-03-09 | 2022-03-09 | 基于联合预测的推送方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114610994A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115879650A (zh) * | 2023-02-21 | 2023-03-31 | 北京航空航天大学 | 基于区块链多态分离可信的多任务联合预测方法及系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111241567A (zh) * | 2020-01-16 | 2020-06-05 | 深圳前海微众银行股份有限公司 | 基于秘密共享的纵向联邦学习方法、系统及存储介质 |
CN111737749A (zh) * | 2020-06-28 | 2020-10-02 | 南方电网科学研究院有限责任公司 | 基于联邦学习的计量装置告警预测方法及设备 |
CN111935156A (zh) * | 2020-08-12 | 2020-11-13 | 科技谷(厦门)信息技术有限公司 | 一种联邦学习的数据隐私保护方法 |
CN112163979A (zh) * | 2020-10-19 | 2021-01-01 | 科技谷(厦门)信息技术有限公司 | 一种基于联邦学习的城市交通出行数据分析方法 |
US20210174243A1 (en) * | 2019-12-06 | 2021-06-10 | International Business Machines Corporation | Efficient private vertical federated learning |
WO2021120888A1 (zh) * | 2019-12-20 | 2021-06-24 | 支付宝(杭州)信息技术有限公司 | 一种基于隐私数据进行模型训练的方法及系统 |
US20210248244A1 (en) * | 2018-12-28 | 2021-08-12 | Webank Co., Ltd | Model parameter training method, terminal, and system based on federation learning, and medium |
CN113722738A (zh) * | 2021-09-02 | 2021-11-30 | 脸萌有限公司 | 数据保护方法、装置、介质及电子设备 |
-
2022
- 2022-03-09 CN CN202210222683.XA patent/CN114610994A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210248244A1 (en) * | 2018-12-28 | 2021-08-12 | Webank Co., Ltd | Model parameter training method, terminal, and system based on federation learning, and medium |
US20210174243A1 (en) * | 2019-12-06 | 2021-06-10 | International Business Machines Corporation | Efficient private vertical federated learning |
WO2021120888A1 (zh) * | 2019-12-20 | 2021-06-24 | 支付宝(杭州)信息技术有限公司 | 一种基于隐私数据进行模型训练的方法及系统 |
CN111241567A (zh) * | 2020-01-16 | 2020-06-05 | 深圳前海微众银行股份有限公司 | 基于秘密共享的纵向联邦学习方法、系统及存储介质 |
CN111737749A (zh) * | 2020-06-28 | 2020-10-02 | 南方电网科学研究院有限责任公司 | 基于联邦学习的计量装置告警预测方法及设备 |
CN111935156A (zh) * | 2020-08-12 | 2020-11-13 | 科技谷(厦门)信息技术有限公司 | 一种联邦学习的数据隐私保护方法 |
CN112163979A (zh) * | 2020-10-19 | 2021-01-01 | 科技谷(厦门)信息技术有限公司 | 一种基于联邦学习的城市交通出行数据分析方法 |
CN113722738A (zh) * | 2021-09-02 | 2021-11-30 | 脸萌有限公司 | 数据保护方法、装置、介质及电子设备 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115879650A (zh) * | 2023-02-21 | 2023-03-31 | 北京航空航天大学 | 基于区块链多态分离可信的多任务联合预测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112199702B (zh) | 一种基于联邦学习的隐私保护方法、存储介质及系统 | |
CN108616539B (zh) | 一种区块链交易记录访问的方法及系统 | |
CN109033865B (zh) | 一种空间众包中隐私保护的任务分配方法 | |
CN112989368A (zh) | 多方联合进行隐私数据处理的方法及装置 | |
US7873169B2 (en) | Methods, devices and systems for generating anonymous public keys in a secure communication system | |
US10797867B2 (en) | System and method for electronic bidding | |
EP3469761A1 (en) | Secure data exchange | |
CN107040369A (zh) | 数据传输方法、装置及系统 | |
CN105103487A (zh) | 用于基于矩阵分解的到评级贡献用户的隐私保护推荐的方法和系统 | |
CN110912713A (zh) | 多方联合进行模型数据处理的方法及装置 | |
Lyu et al. | Towards fair and decentralized privacy-preserving deep learning with blockchain | |
CN109565440B (zh) | 密钥交换方法,密钥交换系统 | |
WO2022213965A1 (zh) | 用于控制带宽的多方联合数据处理方法及装置 | |
Yang et al. | Efficient verifiably encrypted ECDSA-like signatures and their applications | |
CN113722753A (zh) | 基于区块链的隐私数据处理方法、装置及系统 | |
CN114610994A (zh) | 基于联合预测的推送方法和系统 | |
Guo et al. | Subset membership encryption and its applications to oblivious transfer | |
CN111160961A (zh) | 一种信息推荐方法及装置 | |
CN109274659B (zh) | 一种无证书的在线/离线可搜索密文方法 | |
CN118133985A (zh) | 任务处理方法、装置、系统及介质 | |
Alqahtani et al. | Zone-based privacy-preserving billing for local energy market based on multiparty computation | |
US10972271B2 (en) | Secret authentication code adding device, secret authentication code adding method, and program | |
CN117521102A (zh) | 一种基于联邦学习的模型训练方法及装置 | |
CN115549998B (zh) | 一种基于区块链和多密钥同态加密的数据协同方法 | |
CN113095505B (zh) | 多方协同更新模型的方法、装置及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |