CN116757286B - 基于联邦学习的多方联合因果树模型构建系统以及方法 - Google Patents
基于联邦学习的多方联合因果树模型构建系统以及方法 Download PDFInfo
- Publication number
- CN116757286B CN116757286B CN202311032785.6A CN202311032785A CN116757286B CN 116757286 B CN116757286 B CN 116757286B CN 202311032785 A CN202311032785 A CN 202311032785A CN 116757286 B CN116757286 B CN 116757286B
- Authority
- CN
- China
- Prior art keywords
- party
- joint
- model
- passive
- segmentation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010276 construction Methods 0.000 title claims abstract description 145
- 230000001364 causal effect Effects 0.000 title claims abstract description 128
- 238000000034 method Methods 0.000 title claims abstract description 91
- 230000011218 segmentation Effects 0.000 claims abstract description 227
- 238000011156 evaluation Methods 0.000 claims abstract description 114
- 230000004044 response Effects 0.000 claims abstract description 27
- 238000004364 calculation method Methods 0.000 claims description 70
- 238000007477 logistic regression Methods 0.000 claims description 70
- 238000012549 training Methods 0.000 claims description 53
- 238000012545 processing Methods 0.000 claims description 22
- 238000004458 analytical method Methods 0.000 claims description 18
- 230000006399 behavior Effects 0.000 claims description 8
- 230000000694 effects Effects 0.000 abstract description 13
- 239000012634 fragment Substances 0.000 description 27
- 230000008569 process Effects 0.000 description 18
- 238000010586 diagram Methods 0.000 description 10
- 238000004590 computer program Methods 0.000 description 8
- 238000005192 partition Methods 0.000 description 8
- 235000013399 edible fruits Nutrition 0.000 description 7
- 230000009850 completed effect Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 3
- 238000007476 Maximum Likelihood Methods 0.000 description 2
- 230000003631 expected effect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 241000192128 Gammaproteobacteria Species 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/043—Distributed expert systems; Blackboards
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/041—Abduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/04—Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks
- H04L63/0428—Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the data content is protected, e.g. by encrypting or encapsulating the payload
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L9/00—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
- H04L9/008—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols involving homomorphic encryption
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L9/00—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
- H04L9/40—Network security protocols
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L2209/00—Additional information or applications relating to cryptographic mechanisms or cryptographic arrangements for secret or secure communication H04L9/00
- H04L2209/46—Secure multiparty computation, e.g. millionaire problem
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Bioethics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computer Hardware Design (AREA)
- Computational Linguistics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
说明书实施例提供基于联邦学习的多方联合因果树模型构建系统及方法,其中基于联邦学习的多方联合因果树模型构建系统包括:主动方,用于响应于多方联合模型构建任务生成模型联合构建请求,并发送至被动方;被动方,用于接收模型联合构建请求,并根据模型联合构建请求读取被动方样本数据的第一类别信息,并发送至主动方;主动方,用于基于本地样本数据对应的第二类别信息或第一类别信息确定至少一个分割方式;针对每个分割方式分别构建评估任务并执行,并确定每个分割方式对应的分割评分,基于分割评分在至少一个分割方式中选择目标分割方式,根据目标分割方式构建多方联合因果树模型,从而实现预测不同对象对干预措施的响应信息的技术效果。
Description
技术领域
本说明书实施例涉及机器学习技术领域,特别涉及一种基于联邦学习的多方联合因果树模型构建系统以及方法。
背景技术
因果树模型,也称异质性因果效应分析模型,用于研究不同个体或群体之间,特定干预措施的因果效应是否存在差异,因而其可以帮助企业评估特定干预措施对不同的个体或群体的不同的效果,例如可以应用于教育政策评估、医疗干预研究、市场营销和消费者行为、产品优化及用户体验、社会福利干预效果研究等。
现有技术在进行因果树模型的构建时,通过将多方数据集合到同一方去进行模型训练,但是将数据集合到同一方很容易泄露各方数据,而且由于对隐私数据的保护,各数据合作方无法提供相关隐私数据,导致构建的因果树模型不够精准,无法精准分析不同个体或群体对于干预措施的异质性表现,因而亟需一种有效的方案以解决上述问题。
发明内容
有鉴于此,本说明书实施例提供了一种基于联邦学习的多方联合因果树模型构建系统。本说明书一个或者多个实施例同时涉及一种基于联邦学习的多方联合因果树模型构建方法,一种数据处理系统,一种计算设备,一种计算机可读存储介质以及一种计算机程序,以解决现有技术中存在的技术缺陷。
根据本说明书实施例的第一方面,提供了一种基于联邦学习的多方联合因果树模型构建系统,所述系统包括主动方和被动方,包括:
所述主动方,用于响应于多方联合模型构建任务生成模型联合构建请求,并将所述模型联合构建请求发送至所述被动方;
所述被动方,用于接收所述模型联合构建请求,并根据所述模型联合构建请求读取被动方样本数据的第一类别信息,并发送至所述主动方;
所述主动方,用于基于本地样本数据对应的第二类别信息或所述第一类别信息确定关联所述多方联合模型构建任务的至少一个分割方式;针对每个分割方式分别构建评估任务并执行,根据评估任务执行结果确定每个分割方式对应的分割评分,其中,评估任务为与所述主动方单方关联的评估任务或与所述主动方和所述被动方多方关联的评估任务;基于每个分割方式对应的分割评分在至少一个分割方式中选择目标分割方式,根据所述目标分割方式构建所述多方联合模型构建任务对应的多方联合因果树模型,其中,所述多方联合因果树模型用于预测不同对象对干预措施的响应信息。
根据本说明书实施例的第二方面,提供了一种基于联邦学习的多方联合因果树模型构建方法,包括:
主动方响应于多方联合模型构建任务生成模型联合构建请求;
被动方根据所述模型联合构建请求读取被动方样本数据的第一类别信息;
主动方基于本地样本数据对应的第二类别信息或所述第一类别信息确定关联所述多方联合模型构建任务的至少一个分割方式;
针对每个分割方式分别构建评估任务并执行,根据评估任务执行结果确定每个分割方式对应的分割评分,其中,评估任务为与所述主动方单方关联的评估任务或与所述主动方和所述被动方多方关联的评估任务;
基于每个分割方式对应的分割评分在至少一个分割方式中选择目标分割方式,根据所述目标分割方式构建所述多方联合模型构建任务对应的多方联合因果树模型,其中,所述多方联合因果树模型用于预测不同对象对干预措施的响应信息。
根据本说明书实施例的第三方面,提供了一种数据处理系统,包括:
主动方,用于接收异质性因果效应分析请求;并将所述异质性因果效应分析请求中携带的待分析数据输入至上述系统中的多方联合因果树模型进行处理;
根据处理结果获得所述待分析数据中的不同对象对干预措施的响应信息。
根据本说明书实施例的第四方面,提供了一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现上述基于联邦学习的多方联合因果树模型构建方法的步骤。
根据本说明书实施例的第五方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现上述基于联邦学习的多方联合因果树模型构建方法的步骤。
本说明书一个实施例提供了一种基于联邦学习的多方联合因果树模型构建系统,包括主动方和被动方,通过主动方响应于多方联合模型构建任务生成模型联合构建请求,并将模型联合构建请求发送至被动方;被动方接收模型联合构建请求,并根据模型联合构建请求读取被动方样本数据的第一类别信息,并发送至主动方;主动方基于本地样本数据对应的第二类别信息或第一类别信息确定关联多方联合模型构建任务的至少一个分割方式;针对每个分割方式分别构建评估任务并执行,根据评估任务执行结果确定每个分割方式对应的分割评分;基于每个分割方式对应的分割评分在至少一个分割方式中选择目标分割方式,从而实现被动方的数据不出域,不泄露各方隐私的情况下,确定结合了多方数据的影响的目标分割方式。根据目标分割方式构建多方联合模型构建任务对应的多方联合因果树模型以实现预测不同对象对干预措施的响应信息,即得到能够预测不同对象对干预措施的响应情况的多方联合因果树模型,可以保证在不泄露各方数据隐私的情况下,完成多方联合的因果树模型的构建,以结合多方数据对干预措施的影响信息,实现多方联合下的预测不同对象对于干预措施的响应情况。
附图说明
图1是本说明书一个实施例提供的一种基于联邦学习的多方联合因果树模型构建系统的示意图;
图2是本说明书一个实施例提供的一种基于联邦学习的多方联合因果树模型构建系统的结构示意图;
图3是本说明书一个实施例提供的一种基于联邦学习的多方联合因果树模型构建方法的处理过程流程图;
图4是本说明书一个实施例提供的一种数据处理系统的系统示意图;
图5是本说明书一个实施例提供的一种计算设备的结构框图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
此外,需要说明的是,本说明书一个或多个实施例所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。
首先,对本说明书一个或多个实施例涉及的名词术语进行解释。
隐私计算:一种旨在保护个体隐私的计算方法,允许在保护数据隐私的前提下进行数据分析和计算。利用隐私计算技术可以使得多个数据持有方在不泄露己方隐私数据的情况下进行联合数据分析和建模,实现数据可用不可见,解决数据孤岛问题。
逻辑回归模型:一种假设样本服从伯努利分布,利用极大似然估计和梯度下降求解的二分类模型,通常用来解决分类问题。
联邦学习:一种带有隐私保护、安全加密技术的分布式机器学习框架,旨在让分散的各参与方在满足不向其他参与者披露隐私数据的前提下,协作进行机器学习的模型训练。
因果树模型:一种结合决策树和因果推断的方法,用于研究因果关系和预测因果效应。它旨在识别因果关系并预测某个变量对目标变量的因果效应。
多方安全计算:安全多方计算是指在无可信第三方的情况下,多个参与方协同计算一个约定的函数,并且保证每一方仅获取自己的计算结果,无法通过计算过程中的交互数据推测出其他任意一方的输入和输出数据(除非函数本身可以由自己的输入推测出其他参与方的输入和输出)。
在本说明书中,提供了一种基于联邦学习的多方联合因果树模型构建系统,本说明书同时涉及一种基于联邦学习的多方联合因果树模型构建方法,一种数据处理系统,一种计算设备,以及一种计算机可读存储介质,在下面的实施例中逐一进行详细说明。
参见图1所示的示意图,本说明书提供的基于联邦学习的多方联合因果树模型构建系统,为了实现在各数据提供方之间不泄露隐私数据的情况下,构建多方联合因果树模型,从而实现多方联合一致性因果效应分析,可以由主动方响应于多方联合模型构建任务生成模型联合构建请求,并将模型联合构建请求发送至被动方,被动方接收模型联合构建请求,并根据模型联合构建请求读取被动方样本数据的第一类别信息,并发送至主动方,主动方基于本地样本数据对应的第二类别信息或第一类别信息确定关联多方联合模型构建任务的至少一个分割方式,针对每个分割方式分别构建评估任务并执行,根据评估任务执行结果确定每个分割方式对应的分割评分,基于每个分割方式对应的分割评分在至少一个分割方式中选择目标分割方式,从而实现被动方的数据不出域,不泄露各方隐私的情况下,确定结合了多方数据的影响的目标分割方式。根据目标分割方式构建多方联合模型构建任务对应的多方联合因果树模型以实现预测不同对象对干预措施的响应信息,即得到能够预测不同对象对干预措施的响应情况的多方联合因果树模型,可以保证在不泄露各方数据隐私的情况下,完成多方联合的因果树模型的构建,以结合多方数据对干预措施的影响信息,实现多方联合下的预测不同对象对于干预措施的响应情况。
图2示出了根据本说明书一个实施例提供的一种基于联邦学习的多方联合因果树模型构建系统的结构示意图,基于联邦学习的多方联合因果树模型构建系统200包括主动方210和被动方220。
所述主动方210,用于响应于多方联合模型构建任务生成模型联合构建请求,并将模型联合构建请求发送至所述被动方220;所述被动方220,用于接收模型联合构建请求,并根据模型联合构建请求读取所述被动方样本数据的第一类别信息,并发送至所述主动方210。
所述主动方210,用于基于本地样本数据对应的第二类别信息或第一类别信息确定关联多方联合模型构建任务的至少一个分割方式;针对每个分割方式分别构建评估任务并执行,根据评估任务执行结果确定每个分割方式对应的分割评分,其中,评估任务为与所述主动方210单方关联的评估任务或与所述主动方210和所述被动方220多方关联的评估任务;基于每个分割方式对应的分割评分在至少一个分割方式中选择目标分割方式,根据目标分割方式构建多方联合模型构建任务对应的多方联合因果树模型,其中,多方联合因果树模型用于预测不同对象对干预措施的响应信息。
本实施例以主动方持有用户饰品消费数据,被动方持有用户服装消费数据为例,对基于联邦学习的多方联合因果树模型构建系统进行描述,其他场景的描述均可参见本实施例相同或相似的描述。具体的,多方联合模型构建任务可以理解为,根据主动方持有的数据和被动方持有的数据进行的、联合构建因果树模型的任务,以用于构建多方联合因果树模型;模型联合构建请求可以理解为主动方响应于多方联合模型构建任务之后,主动方生成的、请求被动方协同进行构建多方联合模型的、模型联合构建请求,模型联合构建请求通常由主动方发送至被动方。
主动方210可以理解为,进行多方联合因果树模型构建的模型构建执行方和参与方,并至少提供本地样本数据,本地样本数据即为主动方样本数据。主动方样本数据可以理解为主动方存储于主动方本地的样本数据,且为主动方的隐私数据,不可被其他参与方所明文获取,参与方指参与构建多方联合因果树模型的主动方或被动方,以下描述主动方和被动方统称参与方;例如,市场营销和消费者行为分析场景下,主动方样本数据可以是饰品营销平台持有的用户饰品消费数据。
主动方样本数据的第二类别信息可以理解为,主动方对主动方样本数据进行分类后、主动方样本数据中各数据所属的类别信息,例如,市场营销和消费者行为分析场景下,主动方样本数据的第二类别信息可以是饰品营销平台持有的用户上月耳饰消费额、上月手链消费额、用户上月项链消费额等。
被动方220可以理解为,参与多方联合因果树模型构建过程的模型构建参与方,并至少存储有被动方样本数据以用于多方联合因果树模型构建,被动方样本数据可以理解为被动方存储在被动方本地的样本数据,且为被动方的隐私数据,不可被其他参与方所明文获取,例如,市场营销和消费者行为分析场景下,被动方样本数据可以是服装营销平台持有的用户服装消费数据。
被动方样本数据的第一类别信息可以理解为,被动方对被动方样本数据进行分类后、被动方样本数据中各数据所属的类别信息,例如,市场营销和消费者行为分析场景下,被动方样本数据的第一类别信息可以是服装营销平台持有的用户上月衬衫消费额、上月短裤消费额等。
分割方式可以理解为,将样本数据中的用户群体分割为至少两个用户子群体的样本分割方式,分割后得到该分割方式对应的样本分割,分割方式可以关联于主动方样本数据的第二类别信息,也可以关联于被动方样本数据的第一类别信息,例如,市场营销和消费者行为分析场景下,一个分割方式可以为根据“上月耳饰消费额40元”进行分割的分割方式,“上月耳饰消费额”属于主动方样本数据的第二类别信息,则该分割方式关联于主动方样本数据的第二类别信息。
评估任务可以理解为,对分割方式进行打分的、用于评估该分割方式的效果是否达到了期望分割效果的任务,评估任务与分割方式具有一一对应的关系,每一个分割方式对应有每一个分割方式对应的评估任务,评估任务可以用于判断是否已完成多方因果树模型的构建。评估任务执行结果即为评估任务执行后得到的评估任务对应的执行结果,用以表征分割方式的分割效果的优良程度。
分割评分可以理解为,根据评估任务执行结果表征的分割方式的分割效果的优良程度,对分割方式进行打分后获得的分割方式的分割效果评分。
目标分割方式可以理解为,最优的分割方式,即最适合构建多方联合因果树模型的分割方式,基于目标分割方式构建的多方联合因果树模型预测不同对象对干预措施的响应信息相较于其他分割方式构建的模型更准确。
多方联合因果树模型可以理解为,主动方和被动方通过联邦学习、联合构建的因果树模型,在构建过程中,主动方或者被动方均仅持有自己本地存储的数据,而不持有除自身之外其他参与方的明文数据。
对象是指在多方联合因果树模型应用的过程中,输入至多方联合因果树模型的数据的各数据归属用户。
对干预措施的响应信息是指在多方联合因果树模型应用的过程中,将数据和某一个或多个干预措施输入至多方联合因果树模型中,不同对象在该干预措施的条件下,对应的模型输出结果,从而可以确定不同对象是否响应了输入的干预措施。
需要说明的是,考虑到主动方和被动方需要相互配合实现因果树模型的构建,在此过程中要避免数据泄露,确保各方数据的隐私安全。不同参与方持有的数据相对于其他参与方都是隐私数据,直接进行数据分享可能会造成隐私数据泄露,因而需要一种更安全且精准的多方联合因果树模型构建方案。
有鉴于此,本实施例提供的基于联邦学习的多方联合因果树模型构建系统,在主动方和被动方需要配合实现构建多方因果树模型时,可以由主动方基于多方联合模型构建任务生成模型联合构建请求,并将模型联合构建请求发送至被动方,被动方基于联合构建请求把被动方样本数据的第一类别信息发送至主动方,以便主动方能够基于各数据持有方的样本数据类别信息,确定分割方式,并通过主动方和被动方进行联邦学习,对分割方式评估,并根据评估后得到的目标分割方式完成多方联合因果书模型的构建,以实现在不泄露各数据持有方数据隐私,保证了各数据持有方数据的安全性的情况下,完成多方联合因果树模型的构建,并提高了模型的精准度。
需要说明的是,主动方和被动方进行联邦学习并对分割方式评估可以通过如下具体方式实现,即主动方得到被动方的第一类别信息后,结合本地样本数据中的第二类别信息,确定根据第一类别信息或第二类别信息得到的至少一个分割方式,并针对每一个分割方式构建评估任务,执行评估任务以得到每一个分割方式的分割评分,从而可以主动方和被动方联合计算的分割方式并得到目标分割方式,根据目标分割方式构建多方联合模型构建任务对应的多方联合因果树模型,可以有效的提高构建的多方联合因果树模型的精准度。
例如,主动方为饰品购物平台,其持有用户的饰品消费数据组成的表R1,被动方为服装购物平台,其持有用户的服装消费数据组成的表R2,现饰品购物平台想综合用户的饰品购买情况和服装购买情况,去预测给不同用户发红包后,不同用户当月饰品的消费额能否超过100的情况,以便后续可以分析不同用户对发红包这个营销措施的响应情况。
表R1
表R2
基于此,首先饰品购物平台会向服装购物平台发起多方联合因果树模型联合训练的请求,服装购物平台基于饰品购物平台发送的多方联合因果树模型联合训练的请求将“用户上月衬衫消费额”、“用户上月短裤消费额”发送给饰品购物平台,饰品购物平台根据“用户上月耳饰消费额”、“用户上月手链消费额”、“用户上月项链消费额”、“用户上月衬衫消费额”“用户上月短裤消费额”生成至少一个分割方式并计算分割评分。
进一步的,例如一个分割方式可以为 “用户上月手链消费额60元”,并针对“用户上月手链消费额60元”构建评估任务,由于“用户上月手链消费额”是饰品购物平台的类别数据,因此针对“用户上月手链消费额60元”构建的评估任务关联饰品购物平台,则饰品购物平台可以自己计算这种分割方式的分割评分,例如计算的分割评分为60分;再例如,或者用户上月短裤消费额35,一个分割方式可以为 “用户上月手链消费额60元”,并针对“用户上月手链消费额60元”构建评估任务,由于“用户上月手链消费额”是饰品购物平台的类别数据,因此针对“用户上月衬衫消费额45元”构建的评估任务关联服装购物平台,则饰品购物平台执行与服装购物平台多方关联的评估任务,并计算针对“用户上月衬衫消费额45元”的分割评分,例如分割评分为90分。
再进一步的,例如至少一个分割方式中所得到的分割评分最高为98分,其所对应的分割方式为“用户上月衬衫消费额45元”,则根据“用户上月衬衫消费额45元”构建多方联合因果树模型。
具体实施时,任意执行多方联合因果树模型构建任务的数据提供方都可以为主动方,任意参与多方联合因果树模型构建任务的数据提供方都可以为被动方,其基于联邦学习的多方联合因果树模型构建可参见本实施例相同或相应的描述,在此不作过多赘述。
此外,考虑到主动方和被动方虽然都具有与自身业务相关的数据,但是由于主动方和被动方的业务维度不同,如果基于本地数据训练模型,很难保证训练出的本地因果树模型的精准度,如果直接进行数据分享可能会造成隐私数据泄露,因此为了能够提高训练出的因果树模型的精准度,同时保证主动方和被动方数据的安全性,此时可以在主动方和被动方不公开各自数据的前提下确定双方公有的用户,而在此过程中不需要暴露两者之间互不重叠的用户,以便联合双方的数据完成模型的训练。
基于此,为了保证主动方和被动方数据的安全性,主动方和被动方还可以在加密场景下通过隐私求交算法进行样本对齐。也就是说,在加密场景下主动方提供的用户数据与参与方B提供的用户数据虽然属于不同业务维度,但是这些数据均来自于相同的用户,如主动方提供用户1、2和3的耳饰消费数据和项链消费数据,而被动方也将提供用户1、2和3的衬衫消费数据和短裤消费数据,以此为基础进行后续的模型构建。
本说明书提供的提供了一种基于联邦学习的多方联合因果树模型构建系统,为了实现在各数据提供方之间不泄露隐私数据的情况下,构建多方联合因果树模型,从而实现多方联合一致性因果效应分析,可以由主动方响应于多方联合模型构建任务生成模型联合构建请求,并将模型联合构建请求发送至被动方,被动方接收模型联合构建请求,并根据模型联合构建请求读取被动方样本数据的第一类别信息,并发送至主动方,主动方基于本地样本数据对应的第二类别信息或第一类别信息确定关联多方联合模型构建任务的至少一个分割方式,针对每个分割方式分别构建评估任务并执行,根据评估任务执行结果确定每个分割方式对应的分割评分,基于每个分割方式对应的分割评分在至少一个分割方式中选择目标分割方式,从而实现被动方的数据不出域,不泄露各方隐私的情况下,确定结合了多方数据的影响的目标分割方式,根据目标分割方式构建多方联合模型构建任务对应的多方联合因果树模型以实现预测不同对象对干预措施的响应信息,基于目标分割方式构建多方联合因果树模型,从而得到目标分割方式对应的多方联合因果树模型,即得到能够预测不同对象对干预措施的响应情况的多方联合因果树模型,从而实现多方联合预测不同对象对于干预措施的响应情况。
进一步的,在主动方响应于多方联合模型构建任务生成模型联合构建请求之前,主动方可以构建多方联合因果树模型构建任务,如果主动方单方构建因果树模型构建任务,而不考虑被动方样本数据对该任务的影响,则无法构建出精准的因果树模型,为了能够获得更准确的多方联合构建任务,因而本实施例中,主动方,还用于获取本地数据对应的结果标签数据,并构建初始多方联合模型构建任务,以及通过隐私计算下的联合计算模型对主动方和被动方进行联合计算,根据联合计算结果对结果标签数据进行更新,获得本地样本数据对应的无偏结果标签数据,利用无偏结果标签数据对初始多方联合模型构建任务进行更新,获得多方联合模型构建任务。
具体的,结果标签数据可以理解为,样本在受到干预措施干预后是否达到了预期效果,在本实施例中,主动方样本数据对应的结果标签是指,具有主动方样本数据的特性的用户在受到干预措施干预后是否达到了预期效果;例如,沿用上例,结果标签可以表征给耳饰购物平台中的用户发红包后,用户的月消费额是否达到了一百元。
初始多方联合模型构建任务可以理解为,根据主动方本地样本数据创建的初始的多方联合模型构建任务,即初始多方联合模型构建任务没有结合被动方样本数据的特性,因而需要联合被动方对初始多方联合模型构建任务进行更新。
隐私计算下的联合计算模型可以理解为,一种允许在保护数据隐私的前提下进行多方联合分析和计算的模型,即允许多个参与方在不泄露己方隐私数据的情况下进行联合建模和数据分析。
联合计算结果可以理解为,主动方和被动方通过隐私计算下的联合计算模型进行计算后得到的模型输出结果,主动方和被动方通过隐私计算下的联合计算模型进行联合计算以实现将结果标签更新为无偏结果标签,从而用于后续根据该无偏结果标签更新初始多方联合模型构建任务,隐私计算下的联合计算模型可以为联邦逻辑回归模型,也可以为随机森林模型,本实施例对此不做限定。
无偏结果标签可以理解为,根据主动方样本数据对结果标签的影响因子和被动方样本数据对结果标签的影响因子对结果标签更新得到的预测数据;例如,无偏结果标签可以表征给用户发红包后,根据用户的耳饰消费数据和服装消费数据,预测用户在发红包的条件下用户月消费额是否达到了一百元。
基于此,在需要获得更准确的多方联合构建任务时,主动方将获取本地数据对应的结果标签数据,并构建初始多方联合模型构建任务,通过隐私计算下的联合计算模型对主动方和被动方进行联合计算,根据联合计算结果对结果标签数据进行更新,获得本地样本数据对应的无偏结果标签数据,利用无偏结果标签数据对初始多方联合模型构建任务进行更新,即可得到更准确的多方联合模型构建任务。
沿用上例,在耳饰购物平台响应多方联合模型构建任务之前,耳饰购物平台首先获取本地数据对应的结果标签数据,如下表R3所示,并根据该结果标签数据构建初始多方联合模型构建任务,通过隐私计算下的联合计算模型对主动方和被动方进行联合计算,并对结果标签数据进行更新,得到无偏结果标签数据,如下表R4所示。
表R3
表R4
本说明书提供的基于联邦学习的多方联合因果树模型构建系统,为了能够保证多方联合训练模型的准确,可以由主动方和被动方通过隐私计算下的联合计算模型对主动方和被动方进行联合计算,根据联合计算结果对主动方本地样本数据对应的结果标签数据进行更新得到无偏结果标签数据,并基于无偏结果标签数据将主动方样本数据对应的初始多方联合因果树模型构建任务更新为主动方样本数据和被动方样本数据对应的多方联合因果树模型构建任务,保证了多方联合因果树模型构建任务与主动方和被动方多方相关联,从而保证了多方联合因果树模型构建任务的准确性,从而保证了后续构建的多方联合因果树模型的准确性。
可选的,主动方还可以通过联邦逻辑回归模型对主动方和被动方进行联邦计算,根据联邦计算结果对结果标签数据进行更新,获得本地样本数据对应的无偏结果标签数据。
具体的,联邦逻辑回归模型是指联邦学习下的逻辑回归模型,是隐私计算下的联合计算模型的其中一种模型,其中,联邦学习可以理解为让分散的各参与方在满足不向其他参与者披露隐私数据的前提下,协作进行机器学习的模型训练方法,逻辑回归模型是一种假设样本服从伯努利分布,利用极大似然估计和梯度下降求解的二分类模型。
在一些实施例中,主动方可以使用联邦逻辑回归模型对主动方和被动方进行联邦计算,并根据联邦计算结果对结果标签数据进行更新,获得本地样本数据对应的无偏结果标签数据,从而实现后续对初始多方联合模型构建任务的更新。
沿用上例,耳饰购物平台和服装购物平台通过联邦逻辑回归模型进行联邦计算,并对结果标签上表R3进行更新,获得耳饰购物平台样本数据对应的无偏结果标签数据如下表R5所示。
表R5
在一些实施例中,在模型建立过程中,主动方还用于提供干预变量,干预变量用于代表样本数据所对应的用户是否接受相应的干预措施,通常用布尔值变量t表示。通过计算样本数据的倾向得分,以获取样本数据i在类别信息Xi的条件下接收干预措施的倾向性,主动方基于该倾向性,对结果标签数据进行修正,得到无偏结果标签数据。
在一些具体实施例中,样本数据i在类别信息Xi的条件下接收干预措施的倾向性可以通过倾向得分wi表示,倾向得分wi的计算可以通过样本t做因变量,样本类别信息Xi做自变量的逻辑回归模型()计算倾向得分wi,主动方通过逻辑回归模型对主动方的样本数据和被动方样本数据进行联邦计算,从而对结果标签进行修正,获得样本的无偏结果标签数据。无偏结果标签数据的计算公式为,由于主动方持有y和w,通常选择在主动方完成无偏结果标签数据的计算。
进一步的,样本类别信息分别来自主动方和被动方,且被动方的数量可能为多个,为了提高模型建立过程中数据的安全性,可以使用基于联邦运算的逻辑回归模型和多方安全逻辑回归模型计算倾向得分。
本说明书提供的基于联邦学习的多方联合因果树模型构建系统,可以由主动方和被动方通过联邦逻辑回归模型对主动方和被动方进行联邦计算,根据联邦计算结果对主动方本地样本数据对应的结果标签数据进行更新得到无偏结果标签数据,并基于无偏结果标签数据将主动方样本数据对应的初始多方联合因果树模型构建任务更新为主动方样本数据和被动方样本数据对应的多方联合因果树模型构建任务,保证了多方联合因果树模型构建任务与主动方和被动方多方相关联,从而保证了多方联合因果树模型构建任务的准确性,从而保证了后续构建的多方联合因果树模型的准确性。
进一步的,如果采用现有的训练好的逻辑回归模型进行数据处理,由于其训练时采用的样本数据不是主动方和被动方的样本数据,因而其准确度无法得到保证,为了能够保证逻辑回归模型的准确,可以由主动方和被动方联合训练逻辑回归模型,由于样本数据来自于主动方和被动方,为了保护各方数据的安全性,可以由主动方与被动方通过联邦学习的方式训练逻辑回归模型,主动方还和被动方还可以训练逻辑回归模型,具体采用如下方案实现:
主动方将初始逻辑回归模型拆分为第一子模型和第二子模型,将第二子模型发送至被动方;基于本地样本数据对第一子模型训练,得到第一子模型对应的第一参数;被动方接收第二子模型,基于被动方样本数据对第二子模型训练,得到第二子模型对应的第二参数,并将第二参数发送至主动方;主动方接收第二参数,并基于第一参数和第二参数更新初始逻辑回归模型,直至获得满足训练停止条件的逻辑回归模型。
具体的,第一子模型是指逻辑回归模型中主动方需要训练的部分,第一参数是指主动方训练第一子模型所得到的模型自身参数,第二子模型是指逻辑回归模型中被动方需要训练的部分,第二参数是指被动方训练第二子模型所得到的模型自身参数。
基于此,主动方将初始逻辑回归模型拆分为第一子模型和第二子模型,将第二子模型发送至被动方;基于本地样本数据对第一子模型训练,得到第一子模型对应的第一参数;被动方,用于接收第二子模型,基于被动方样本数据对第二子模型训练,得到第二子模型对应的第二参数,并将第二参数发送至主动方;主动方,用于接收第二参数,并基于第一参数和第二参数更新初始逻辑回归模型,直至获得满足训练停止条件的逻辑回归模型,从而保证了逻辑回归模型的准确性,并且保证了主动方与被动方各方数据的安全性。
沿用上例,例如初始逻辑回归模型为,包含参数为WA1和WB1,WA1为第一参数,WB1为第二参数,耳饰购物平台根据上表R1进行初始逻辑回归模型训练,得到WA2参数的值,服装购物平台根据上表R2进行初始逻辑回归模型训练,得到WB2参数,并将WB2参数发送至主动方,主动方基于WA2和WB2更新初始逻辑回归模型,并计算模型偏差值,并基于偏差值迭代训练逻辑回归模型,具体迭代步骤不再赘述,直至得到逻辑回归模型。
综上,通过主动方和被动方联合训练逻辑回归模型,可以确保逻辑回归模型的准确性,且能够保证主动方和被动方的本地数据的安全性和隐私性。
进一步的,主动方将逻辑回归模型发送至被动方;被动方接收逻辑回归模型,利用逻辑回归模型计算被动方样本数据的被动方参量样本数据,并发送被动方参量样本数据至主动方;主动方接收被动方参量样本数据,将本地样本数据和被动方参量样本数据输入至逻辑回归模型进行处理,获得本地样本数据对应的无偏结果标签数据。
具体的,被动方参量样本数据是指被动方基于逻辑回归模型中的第二参数,对被动方样本数据进行作乘加密处理后的,所得到的参数化被动方样本数据,以此实现被动方样本数据不明文出域的同时协同主动方进行联合计算的目的。
在一些实施例中,主动方获取逻辑回归模型之后,如果没有被动方协同参与利用逻辑回归模型的预测计算过程,就会导致逻辑回归模型无法得到准确的预测值,因而主动方还用于与被动方联合利用逻辑回归模型计算得到无偏结果标签数据。
基于此,主动方将逻辑回归模型发送至被动方;被动方接收逻辑回归模型,利用逻辑回归模型计算被动方样本数据的被动方参量样本数据,并发送被动方参量样本数据至主动方;主动方接收被动方参量样本数据,将本地样本数据和被动方参量样本数据输入至逻辑回归模型进行处理,获得本地样本数据对应的无偏结果标签数据,从而可以由主动方基于训练好的逻辑回归模型计算无偏结果标签数据,以保证无偏结果标签数据对初始多方联合因果树模型构建任务更新的准确性,从而提高了多方联合因果树模型构建任务的精准度。
沿用上例,例如,最终得到的逻辑回归模型参数为WA和WB,耳饰购物平台将训练好的逻辑回归模型发送至服装购物平台,服装购物平台将服装上月消费数据与WB做乘,得到参数化的服装上月消费数据,如下表R6所示,并将参数化的服装上月消费数据发送至耳饰购物平台。
进一步的,耳饰购物平台接收参数化的服装上月消费数据,并结合本地的耳饰上月消费数据,一并输入至训练好的逻辑回归模型进行处理,得到无偏结果标签数据,如下表R7所示。
表R6
表R7
综上,主动方通过与被动方联合利用逻辑回归模型得到无偏结果标签数据,可以得到准确的多方联合因果树模型构建任务,从而保证了根据该任务构建的多方联合因果树模型的准确度。
进一步的,主动方,还用于获取预设随机数,基于预设随机数将本地样本数据拆分为第一训练集和第一评估集,根据第一训练集中的第二类别信息确定关联主动方的第一分割方式,并根据第一分割方式和第一评估集构建与主动方单方关联的评估任务并执行,根据任务执行结果获得第一分割方式对应的分割评分。
具体的,预设随机数是指主动方和被动方提前协商,进行预先设定的随机数,该随机数仅主动方和被动方可获得。
第一训练集和第一评估集是指主动方根据预设随机数将本地样本数据进行拆分为两部分,任选其中一部分为第一训练集,则剩余的另一部分为第一评估集。
在一些实施例中,为了确定当前分割方式是否是目标分割方式,可以考虑确定当前分割方式得到的样本子群体中的样本之间的差异是否是最小的,有鉴于此,主动方可以基于预设随机数将本地样本数据拆分为第一训练集和第一评估集,根据第一训练集中的第二类别信息确定关联主动方的第一分割方式,并根据第一分割方式和第一评估集构建与主动方单方关联的评估任务并执行,根据任务执行结果获得第一分割方式对应的分割评分。
具体的,主动方在训练模型时基于预设随机数对样本数据拆分,保证主动方样本数据的安全性,避免了可能存在的本地样本数据泄露的问题,根据第一训练集中的第二类别信息确定关联主动方的第一分割方式,并根据第一分割方式和第一评估集构建与主动方单方关联的评估任务并执行,根据任务执行结果获得第一分割方式对应的分割评分,从而实现了主动方单方执行分割方式由主动方样本数据类别确定的情况,提高了单方关联评估任务执行效率,从而提高了多方联合因果树模型构建任务的执行效率。
沿用表R1,例如,预设随机数为3,根据用户i分为第一训练集(用户1、2、3及对应主动方样本数据)和第一评估集(用户4及对应主动方样本数据)。根据用户1、2、3的用户上月耳饰消费额、用户上月手链消费额、用户上月项链消费额确定关联耳饰购物平台的第一分割方式,例如用户上月耳饰消费额30为第一分割方式,根据该分割方式构建评估任务,并得到该分割方式对应的分割评分。
在一些实施例中,为了便于描述,本说明书中用X表示样本数据的类别,用i表示用户,用t表示干预数据,用y表示结果标签数据。样本数据的类别X是指,用户的数据的分类,比如沿用上例,主动方样本数据的类别可以为耳饰、手链、项链,发箍等,被动方样本数据的类别X可以标识衬衫,短裤,外套等,例如用户10,主动方样本数据的类别耳饰用XA表示,用户10对应的该类别下的样本数据,表示用户10上月耳饰消费额为32元,被动方样本数据的类别衬衫用XM表示,则表示用户上月的衬衫消费额为46元;干预措施表示给予样本某种特定的标识,从而可以实现观察在该干预措施下,用户对干预措施的响应情况。相应的,分割方式用π表示,用户群体用γ表示,分割后的用户子群体用γn表示。
具体的,主动方提供本地样本数据的第二类别信息,基于第二类别信息确定分割方式并分割样本,例如一个样本分割可以表示为,代表根据将样本分割为,n个子集,在确定了一个分割方式后,可以计算当前计算的样本子群体的无偏因果效应评估量τ:,样本个体的可以用样本i所属的γ子群的τ来估算,并计算分裂准则,基于分裂准则获得当前分割方式的分割评分。
具体的,表示无偏因果标签数据,表示计算的样本子群体中接收干预的平均值,表示计算的样本子群体中没有接收干预的平均值,即τ的计算为计算的样本子群体中接收干预的平均值减去计算的样本子群体中没有接收干预的平均值,用以表示计算的样本子群体中样本之间的差异程度。
进一步的,主动方还可以计算当前分割方式的分裂准则EMSE,以用于评估当前分割方式下计算的样本子群体中样本之间的差异值是否目标差异值,即对应的分割方式是否是目标分割方式,分裂准则EMSE计算如下:
其中::训练样本数据集;:训练样本个数;:评估样本个数;:子集中属于处理组的的方差值;:子集中属于对照组的的方差值;:处理组在子集中所占的比例。
进一步的,在分裂过程中,每一种分裂方式对应着一个样本分割π,计算使分割评分-EMSE 最大的分割方式π,即为目标分割方式。
在上述实施例的基础上,以根据进行分割为例,主动方持有数据可以如表R8所示:
表R8
基于此,根据进行分割得到的分割方式为,该分割方式下,t=1的样本子群体的无偏因果效应评估量,对应的分裂准则为,因而该分割方式对应的分割评分为6.64。
本说明书提供的基于联邦学习的多方联合因果树模型构建系统,由主动方获取预设随机数,基于预设随机数将本地样本数据拆分为第一训练集和第一评估集,根据第一训练集中的第二类别信息确定关联主动方的第一分割方式,并根据第一分割方式和第一评估集构建与主动方单方关联的评估任务并执行,根据任务执行结果获得第一分割方式对应的分割评分,从而保证了主动方样本数据的安全性,并且主动方样本数据类别确定分割方式的情况下,由主动方单方执行计算分割评分过程,提高了单方关联评估任务执行效率,从而提高了多方联合因果树模型构建任务的执行效率。
进一步的,主动方,还用于根据预设随机数构建拆分请求并发送至被动方;被动方,用于接收拆分请求并解析,获得预设随机数;基于预设随机数将被动方样本数据拆分为第二训练集和第二评估集;确定第二训练集对应的第一类别信息,并发送至主动方;主动方,用于根据第一类别信息确定关联主动方和被动方的第二分割方式,并针对第二分割方式创建联合评估任务并执行,以及将联合评估任务发送至被动方;被动方,用于根据第二评估集更新联合评估任务,并执行更新后的联合执行任务,将更新后的联合执行任务的被动方任务执行结果反馈至主动方;主动方,用于根据主动方任务执行结果和被动方任务执行结果确定第二分割方式对应的分割评分。
具体的,第二训练集和第二评估集是指被动方根据主动方发送的预设随机数将被动方本地样本数据进行拆分为两部分,任选其中一部分为第二训练集,则剩余的另一部分为第二评估集。
在一些实施例中,主动方根据预设随机数构建拆分请求并发送至被动方;被动方,用于接收拆分请求并解析,获得预设随机数;基于预设随机数将被动方样本数据拆分为第二训练集和第二评估集;确定第二训练集对应的第一类别信息,并发送至主动方;主动方,用于根据第一类别信息确定关联主动方和被动方的第二分割方式,并针对第二分割方式创建联合评估任务并执行,以及将联合评估任务发送至被动方;被动方,用于根据第二评估集更新联合评估任务,并执行更新后的联合执行任务,将更新后的联合执行任务的被动方任务执行结果反馈至主动方;主动方,用于根据主动方任务执行结果和被动方任务执行结果确定第二分割方式对应的分割评分。
沿用上例,主动方根据预设随机数3构建拆分请求,并发送至被动方,被动方解析拆分请求后获得随机数3,并将被动方样本数据拆分为第二训练集(用户1、2、3及对应被动方样本数据)和第二评估集(用户4及对应被动方样本数据),并将用户上月衬衫消费额和用户上月短裤消费额发送至主动方,主动方根据用户上月衬衫消费额确定第二分割方式为用户上月衬衫消费额50元,并将“用户上月衬衫消费额50元”发送至被动方,被动方更新联合评估任务,并执行更新后的联合执行任务,将更新后的联合执行任务的被动方任务执行结果反馈至主动方;主动方根据主动方任务执行结果和被动方任务执行结果确定第二分割方式对应的分割评分。
在一些实施例中,主动方提取无偏结果标签数据,将无偏结果标签数据通过加法秘密分享算法生成第一分片和第二分片,并将第二分片和多方关联的评估任务对应的分割方式发送至被动方;被动方接收多方关联的评估任务对应的分割方式和第二分片,基于多方关联的评估任务对应的分割方式生成被动方样本数据对应的标签标识数据,将标签标识数据通过加法秘密分享算法生成第三分片和第四分片,基于第二分片和第四分片计算得到第六分片,并将第三分片和第六分片发送至主动方;主动方,接收第三分片和第六分片,基于第一分片和第三分片计算得到第五分片,基于第五分片和第六分片计算得到无偏结果标签均值数据;主动方根据第一分片和第五分片计算第七分片,并发送第七分片至安全三方;被动方根据第二分片和第六分片计算第八分片,并发送第八分片至安全三方;安全三方接收第七分片和第八分片计算生成第九分片和第十分片,并将第九分片发送至主动方,将第十分片发送至被动方;被动方根据第十分片与第八分片计算第十一分片,并将第十一分片发送至主动方;主动方接收第九分片和第十一分片,并结合第七分片,计算得到无偏结果标签方差数据,基于无偏结果标签均值数据、无偏结果标签方差数据、无偏结果标签数据,计算得到该分割方式对应的分割评分。
在一些实施例中,沿用上例,计算分割方式具体可以为,主动方将无偏结果标签数据,秘密分享成、,将发送给被动方;被动方根据类别信息分割点生成标识g,将g秘密分享成、,将发送给主动方;主动方将根据变量t将数据分为处理组和对照组,分别通过基于秘密分享的安全乘法计算对照组和处理组的,进而计算,双方各持有的秘密分享,。被动方将发送给主动方,主动方就可以计算出;双方各计算己方持有的,;通过秘密分享计算,最终,被动方将秘密分享分片求和后发送给主动方,主动就可以计算,从而计算对照组和处理组方差和,并计算τ:,并计算分裂准则,基于分裂准则获得当前分割方式的分割评分。
其中,,是通过秘密分享技术计算得到的两个相关联的无偏结果标签数据的两个分片数据,g是一个标识向量标识在当前分割方式下每个样本是否属于计算的样本子集,、是g通过秘密分享技术计算得到的两个相关联的无标识数据的两个分片数据。
本说明书中用X表示样本数据的类别,被动方样本数据的类别X可以标识衬衫,短裤,外套等,例如用户10,被动方样本数据的类别衬衫用XM表示,则表示用户上月的衬衫消费额为46元,在上述实施例的基础上,以根据进行分割为例,服装购物平台持有数据可以如表R9所示。
表R9
基于此,饰品购物平台联合服装购物平台计算分割方式的计算步骤如下所示。
a.饰品购物平台持有用户1、2、3、4的无偏结果标签数据为[0.9,0.3,0.6,0.2],加密生成,,设随机生成的随机数为0.4,加密后得到,,得到,并将发送至服装购物平台,并将发送至服装购物平台。
b.服装购物平台根据分割样本得到分割方式为,并生成标识数据[1,0,0,1],服装购物平台根据服装购物平台生成的随机数0.2,对g秘密分享后得到,,;并将发送至饰品购物平台。
c.饰品购物平台根据t将样本分为对照组t=0和处理组t=1。
d.饰品购物平台计算,并得到对照组,处理组,得到,同理,服装购物平台计算得到,并将发送至饰品购物平台,饰品购物平台计算得到。
e.饰品购物平台计算,服装购物平台计算,通过秘密分享计算, 计算完成后主动方获得S1分片,被动方获得S2分片,被动方将秘密分享分片求和后,得到,并发送给主动方,最终主动方。
f.主动就可以计算,从而计算对照组和处理组方差和,并计算τ:,并计算分裂准则EMSE,分裂准则EMSE计算过程同上述分裂准则计算过程,此处不在赘述。
g.基于分裂准则获得当前分割方式的分割评分8.26。
本说明书提供的基于联邦学习的多方联合因果树模型构建系统,由主动方和被动方基于相同随机数由被动方对被动方样本数据进行拆分,可以保证拆分后主动方样本数据与被动方样本数据的样本是对齐的样本,从而提高多方联合因果树模型的准确度,并且通过随机数拆分的方式保护了各方本地数据的隐私,在此基础上,通过由被动方接收拆分请求并解析,获得预设随机数;基于预设随机数将被动方样本数据拆分为第二训练集和第二评估集;确定第二训练集对应的第一类别信息,并发送至主动方;主动方根据第一类别信息确定关联主动方和被动方的第二分割方式,并针对第二分割方式创建联合评估任务并执行,以及将联合评估任务发送至被动方;被动方根据第二评估集更新联合评估任务,并执行更新后的联合执行任务,将更新后的联合执行任务的被动方任务执行结果反馈至主动方;主动方根据主动方任务执行结果和被动方任务执行结果确定第二分割方式对应的分割评分,从而实现多方安全下的分割评分计算,以保证各方数据的隐私安全,且基于多方联邦方式计算分割评分,实现了在保证分割方式评分计算的准确的情况下,防止了各方数据的泄露的可能性。
可选的,主动方基于本地样本数据还可以与被动方通过同态加密的方式联合计算分割评分,并基于分割评分确定目标分割方式,基于目标分割方式完成多方联合因果树模型的构建。
具体实施时,主动方和被动方分别对自己的数据使用全同态加密,加密之后联合计算密文状态下的分割方式对应的分割评分,计算完成后将计算得到的目标分割方式密文结果解密成目标分割方式,基于目标分割方式完成多方联合因果树模型的构建。
本说明书提供的基于联邦学习的多方联合因果树模型构建系统,还可以采用同态加密的方式联合计算分割评分,以实现确定分割评分的过程中各方数据的安全性。
进一步的,主动方,还用于基于至少一个分割方式中的每个分割方式对对象群体进行递归分割,根据分割结果构建满足分割停止条件的多方联合因果树模型,其中,多方联合因果树模型关联多方联合模型构建任务。
具体的,分割停止条件是指用于指示停止递归分割的条件,例如可以是预设的因果树的树深,预设的递归的次数,完成了多方联合因果树模型构建等,本实施例对此不做限定。
在一些实施例中,在构建多方联合因果树模型的过程中,主动方通过递归分割对多方联合因果树模型进行分割,并根据分割结果判断是否满足分割停止条件以决定是否继续分割,直至获得多方联合因果树模型,从而保证了多方联合因果树模型的精度满足预期。
例如,分割停止条件设置为递归次数达到五次,则主动方基于至少一个分割方式中的每个分割方式对对象群体进行递归分割直至达到了五次的递归次数,停止分割,并得到多方联合因果树模型。
再例如,分割停止条件设置为出现了目标分割方式,则主动方基于至少一个分割方式中的每个分割方式对对象群体进行递归分割直至出现了目标分割方式时停止分割,并得到多方联合因果树模型。
在一些实施例中,分割停止条件可以为达到设定的树深便停止分裂或者节点的对照组和实验组样本量小于设置的最小样本数(例如5个)便停止分裂或者分割后分裂准则相比分割前不再减小便停止分裂(即达到目标分割评分)。
与上述方法实施例相对应,本说明书还提供了一种基于联邦学习的多方联合因果树模型构建方法实施例,图3示出了本说明书一个实施例提供的一种基于联邦学习的多方联合因果树模型构建方法的处理流程图。如图3所示,该方法包括:
步骤S302,主动方响应于多方联合模型构建任务生成模型联合构建请求;
步骤S304,被动方根据所述模型联合构建请求读取被动方样本数据的第一类别信息;
步骤S306,主动方基于本地样本数据对应的第二类别信息或所述第一类别信息确定关联所述多方联合模型构建任务的至少一个分割方式;
步骤S308,针对每个分割方式分别构建评估任务并执行,根据评估任务执行结果确定每个分割方式对应的分割评分,其中,评估任务为与所述主动方单方关联的评估任务或与所述主动方和所述被动方多方关联的评估任务;
步骤S310,基于每个分割方式对应的分割评分在至少一个分割方式中选择目标分割方式,根据所述目标分割方式构建所述多方联合模型构建任务对应的多方联合因果树模型,其中,所述多方联合因果树模型用于预测不同对象对干预措施的响应信息。
一个可选的实施例中,所述主动方,还用于获取所述本地数据对应的结果标签数据,并构建初始多方联合模型构建任务,以及通过隐私计算下的联合计算模型对所述主动方和所述被动方进行联合计算,根据所述联合计算结果对所述结果标签数据进行更新,获得所述本地样本数据对应的无偏结果标签数据,利用所述无偏结果标签数据对所述初始多方联合模型构建任务进行更新,获得多方联合模型构建任务。
一个可选的实施例中,所述主动方,还用于通过联邦逻辑回归模型对所述主动方和所述被动方进行联邦计算,根据所述联邦计算结果对所述结果标签数据进行更新,获得所述本地样本数据对应的无偏结果标签数据。
一个可选的实施例中,所述主动方,还用于将初始逻辑回归模型拆分为第一子模型和第二子模型,将所述第二子模型发送至所述被动方;基于本地样本数据对所述第一子模型训练,得到所述第一子模型对应的第一参数;
所述被动方,用于接收所述第二子模型,基于所述被动方样本数据对所述第二子模型训练,得到所述第二子模型对应的第二参数,并将所述第二参数发送至所述主动方;
所述主动方,用于接收所述第二参数,并基于所述第一参数和所述第二参数更新所述初始逻辑回归模型,直至获得满足训练停止条件的逻辑回归模型。
一个可选的实施例中,所述主动方,还用于将所述逻辑回归模型发送至所述被动方;
所述被动方,还用于接收所述逻辑回归模型,利用所述逻辑回归模型计算所述被动方样本数据的被动方参量样本数据,并发送所述被动方参量样本数据至所述主动方;
所述主动方,接收所述被动方参量样本数据,将所述本地样本数据和所述被动方参量样本数据输入至所述逻辑回归模型进行处理,获得所述本地样本数据对应的无偏结果标签数据。
一个可选的实施例中,所述主动方,还用于获取预设随机数,基于所述预设随机数将本地样本数据拆分为第一训练集和第一评估集,根据所述第一训练集中的所述第二类别信息确定关联所述主动方的第一分割方式,并根据所述第一分割方式和所述第一评估集构建与所述主动方单方关联的评估任务并执行,根据任务执行结果获得所述第一分割方式对应的分割评分。
一个可选的实施例中,所述主动方,还用于根据所述预设随机数构建拆分请求并发送至所述被动方;
所述被动方,用于接收所述拆分请求并解析,获得所述预设随机数;基于所述预设随机数将所述被动方样本数据拆分为第二训练集和第二评估集;确定所述第二训练集对应的第一类别信息,并发送至主动方
所述主动方,用于根据所述第一类别信息确定关联所述主动方和所述被动方的第二分割方式,并针对所述第二分割方式创建联合评估任务并执行,以及将联合评估任务发送至所述被动方;
所述被动方,用于根据所述第二评估集更新所述联合评估任务,并执行更新后的联合执行任务,将更新后的联合执行任务的被动方任务执行结果反馈至所述主动方;
所述主动方,用于根据主动方任务执行结果和所述被动方任务执行结果确定所述第二分割方式对应的分割评分。
一个可选的实施例中,所述主动方,还用于基于至少一个分割方式中的每个分割方式对对象群体进行递归分割,根据分割结果构建满足分割停止条件的多方联合因果树模型,其中,所述多方联合因果树模型关联所述多方联合模型构建任务。
上述为本实施例的一种基于联邦学习的多方联合因果树模型构建方法的示意性方案。需要说明的是,该基于联邦学习的多方联合因果树模型构建方法的技术方案与上述的基于联邦学习的多方联合因果树模型构建方法系统的技术方案属于同一构思,基于联邦学习的多方联合因果树模型构建方法的技术方案未详细描述的细节内容,均可以参见上述基于联邦学习的多方联合因果树模型构建系统的技术方案的描述。
与上述方法实施例相对应,本说明书还提供了一种数据处理系统实施例,图4示出了本说明书一个实施例提供的一种数据处理系统的结构示意图。如图4所示,该数据处理系统400包括:
主动方410,用于接收异质性因果效应分析请求;并将所述异质性因果效应分析请求中携带的待分析数据输入至上述系统中的多方联合因果树模型进行处理;根据处理结果获得所述待分析数据中的不同对象对干预措施的响应信息。
图5示出了根据本说明书一个实施例提供的一种计算设备500的结构框图。该计算设备500的部件包括但不限于存储器510和处理器520。处理器520与存储器510通过总线530相连接,数据库550用于保存数据。
计算设备500还包括接入设备540,接入设备540使得计算设备500能够经由一个或多个网络560通信。这些网络的示例包括公用交换电话网(PSTN,Public SwitchedTelephone Network)、局域网(LAN,Local Area Network)、广域网(WAN,Wide AreaNetwork)、个域网(PAN,Personal Area Network)或诸如因特网的通信网络的组合。接入设备540可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC,networkinterface controller))中的一个或多个,诸如IEEE802.11无线局域网(WLAN,WirelessLocal Area Network)无线接口、全球微波互联接入(Wi-MAX,WorldwideInteroperability for Microwave Access)接口、以太网接口、通用串行总线(USB,Universal Serial Bus)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC,Near FieldCommunication)。
在本说明书的一个实施例中,计算设备500的上述部件以及图5中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图5所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
计算设备500可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或个人计算机(PC,Personal Computer)的静止计算设备。计算设备500还可以是移动式或静止式的服务器。
其中,处理器520用于执行如下计算机可执行指令,该计算机可执行指令被处理器执行时实现上述基于联邦学习的多方联合因果树模型构建方法的步骤。
上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的基于联邦学习的多方联合因果树模型构建方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述基于联邦学习的多方联合因果树模型构建方法的技术方案的描述。
本说明书一实施例还提供一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现上述基于联邦学习的多方联合因果树模型构建方法的步骤。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的基于联邦学习的多方联合因果树模型构建方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述基于联邦学习的多方联合因果树模型构建方法的技术方案的描述。
本说明书一实施例还提供一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述基于联邦学习的多方联合因果树模型构建方法的步骤。
上述为本实施例的一种计算机程序的示意性方案。需要说明的是,该计算机程序的技术方案与上述的基于联邦学习的多方联合因果树模型构建方法的技术方案属于同一构思,计算机程序的技术方案未详细描述的细节内容,均可以参见上述基于联邦学习的多方联合因果树模型构建方法的技术方案的描述。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据专利实践的要求进行适当的增减,例如在某些地区,根据专利实践,计算机可读介质不包括电载波信号和电信信号。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本说明书实施例并不受所描述的动作顺序的限制,因为依据本说明书实施例,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本说明书实施例所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书实施例的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本说明书实施例的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。
Claims (11)
1.一种基于联邦学习的多方联合因果树模型构建系统,其特征在于,应用于消费者行为分析场景,所述系统包括主动方和被动方,所述主动方为第一营销平台,所述被动方为第二营销平台,包括:
所述主动方,用于获取所述消费者第一消费数据对应的结果标签数据,并构建初始多方联合模型构建任务,以及通过隐私计算下的联合计算模型对所述主动方和所述被动方进行联合计算,根据所述联合计算结果对所述结果标签数据进行更新,获得所述消费者第一消费数据对应的无偏结果标签数据,利用所述无偏结果标签数据对所述初始多方联合模型构建任务进行更新,获得多方联合模型构建任务;
所述主动方,用于响应于多方联合模型构建任务生成模型联合构建请求,并将所述模型联合构建请求发送至所述被动方;
所述被动方,用于接收所述模型联合构建请求,并根据所述模型联合构建请求读取用户第二消费数据的第一消费类别信息,并发送至所述主动方;
所述主动方,用于基于用户第一消费数据对应的第二消费类别信息或所述第一消费类别信息确定关联所述多方联合模型构建任务的至少一个分割方式;针对每个分割方式分别构建评估任务并执行,根据评估任务执行结果确定每个分割方式对应的分割评分,其中,评估任务为与所述主动方单方关联的评估任务或与所述主动方和所述被动方多方关联的评估任务;基于每个分割方式对应的分割评分在至少一个分割方式中选择目标分割方式,基于每个分割方式依次对对象群体进行递归分割,直至获得对应所述目标分割方式的分割结果,作为所述多方联合模型构建任务对应的多方联合因果树模型,其中,所述多方联合因果树模型为主动方和被动方通过联邦学习、联合构建的因果树模型,且用于预测不同消费者对干预措施的响应信息。
2.根据权利要求1所述的基于联邦学习的多方联合因果树模型构建系统,其特征在于,所述主动方,还用于通过联邦逻辑回归模型对所述主动方和所述被动方进行联邦计算,根据所述联邦计算结果对所述结果标签数据进行更新,获得所述用户第一消费数据对应的无偏结果标签数据。
3.根据权利要求2所述的基于联邦学习的多方联合因果树模型构建系统,其特征在于,所述主动方,还用于将初始逻辑回归模型拆分为第一子模型和第二子模型,将所述第二子模型发送至所述被动方;基于用户第一消费数据对所述第一子模型训练,得到所述第一子模型对应的第一参数;
所述被动方,用于接收所述第二子模型,基于所述用户第二消费数据对所述第二子模型训练,得到所述第二子模型对应的第二参数,并将所述第二参数发送至所述主动方;
所述主动方,用于接收所述第二参数,并基于所述第一参数和所述第二参数更新所述初始逻辑回归模型,直至获得满足训练停止条件的逻辑回归模型。
4.根据权利要求2所述的基于联邦学习的多方联合因果树模型构建系统,其特征在于,所述主动方,还用于将所述逻辑回归模型发送至所述被动方;
所述被动方,还用于接收所述逻辑回归模型,利用所述逻辑回归模型计算所述用户第二消费数据的被动方参量样本数据,并发送所述被动方参量样本数据至所述主动方;
所述主动方,接收所述被动方参量样本数据,将所述用户第一消费数据和所述被动方参量样本数据输入至所述逻辑回归模型进行处理,获得所述用户第一消费数据对应的无偏结果标签数据。
5.根据权利要求1所述的基于联邦学习的多方联合因果树模型构建系统,其特征在于,所述主动方,还用于获取预设随机数,基于所述预设随机数将用户第一消费数据拆分为第一训练集和第一评估集,根据所述第一训练集中的所述第二消费类别信息确定关联所述主动方的第一分割方式,并根据所述第一分割方式和所述第一评估集构建与所述主动方单方关联的评估任务并执行,根据任务执行结果获得所述第一分割方式对应的分割评分。
6.根据权利要求5所述的基于联邦学习的多方联合因果树模型构建系统,其特征在于,所述主动方,还用于根据所述预设随机数构建拆分请求并发送至所述被动方;
所述被动方,用于接收所述拆分请求并解析,获得所述预设随机数;基于所述预设随机数将所述用户第二消费数据拆分为第二训练集和第二评估集;确定所述第二训练集对应的第一消费类别信息,并发送至主动方;
所述主动方,用于根据所述第一消费类别信息确定关联所述主动方和所述被动方的第二分割方式,并针对所述第二分割方式创建联合评估任务并执行,以及将联合评估任务发送至所述被动方;
所述被动方,用于根据所述第二评估集更新所述联合评估任务,并执行更新后的联合执行任务,将更新后的联合执行任务的被动方任务执行结果反馈至所述主动方;
所述主动方,用于根据主动方任务执行结果和所述被动方任务执行结果确定所述第二分割方式对应的分割评分。
7.根据权利要求1所述的基于联邦学习的多方联合因果树模型构建系统,其特征在于,所述主动方,还用于基于至少一个分割方式中的每个分割方式对对象群体进行递归分割,根据分割结果构建满足分割停止条件的多方联合因果树模型,其中,所述多方联合因果树模型关联所述多方联合模型构建任务。
8.一种基于联邦学习的多方联合因果树模型构建方法,其特征在于,应用于消费者行为分析场景,包括:
主动方获取消费者第一消费数据对应的结果标签数据,并构建初始多方联合模型构建任务,以及通过隐私计算下的联合计算模型对所述主动方和被动方进行联合计算,根据所述联合计算结果对所述结果标签数据进行更新,获得所述消费者第一消费数据对应的无偏结果标签数据,利用所述无偏结果标签数据对所述初始多方联合模型构建任务进行更新,获得多方联合模型构建任务;
所述主动方响应于多方联合模型构建任务生成模型联合构建请求,其中,所述主动方为第一营销平台;
所述被动方根据所述模型联合构建请求读取用户第二消费数据的第一消费类别信息,其中,所述被动方为第二营销平台;
所述主动方基于用户第一消费数据对应的第二消费类别信息或所述第一消费类别信息确定关联所述多方联合模型构建任务的至少一个分割方式;
针对每个分割方式分别构建评估任务并执行,根据评估任务执行结果确定每个分割方式对应的分割评分,其中,评估任务为与所述主动方单方关联的评估任务或与所述主动方和所述被动方多方关联的评估任务;
基于每个分割方式对应的分割评分在至少一个分割方式中选择目标分割方式,基于每个分割方式依次对对象群体进行递归分割,直至获得对应所述目标分割方式的分割结果,作为所述多方联合模型构建任务对应的多方联合因果树模型,其中,所述多方联合因果树模型为主动方和被动方通过联邦学习、联合构建的因果树模型,且用于预测不同消费者对干预措施的响应信息。
9.一种数据处理系统,其特征在于,包括:
主动方,用于接收异质性因果效应分析请求;并将所述异质性因果效应分析请求中携带的待分析数据输入至权利要求1-7任一项所述系统中的多方联合因果树模型进行处理;
根据处理结果获得所述待分析数据中的不同对象对干预措施的响应信息。
10.一种计算设备,其特征在于,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求8所述方法的步骤。
11.一种计算机可读存储介质,其特征在于,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求8所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311032785.6A CN116757286B (zh) | 2023-08-16 | 2023-08-16 | 基于联邦学习的多方联合因果树模型构建系统以及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311032785.6A CN116757286B (zh) | 2023-08-16 | 2023-08-16 | 基于联邦学习的多方联合因果树模型构建系统以及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116757286A CN116757286A (zh) | 2023-09-15 |
CN116757286B true CN116757286B (zh) | 2024-01-19 |
Family
ID=87950008
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311032785.6A Active CN116757286B (zh) | 2023-08-16 | 2023-08-16 | 基于联邦学习的多方联合因果树模型构建系统以及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116757286B (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109299728A (zh) * | 2018-08-10 | 2019-02-01 | 深圳前海微众银行股份有限公司 | 联邦学习方法、系统及可读存储介质 |
CN111695697A (zh) * | 2020-06-12 | 2020-09-22 | 深圳前海微众银行股份有限公司 | 多方联合决策树构建方法、设备及可读存储介质 |
CN112199709A (zh) * | 2020-10-28 | 2021-01-08 | 支付宝(杭州)信息技术有限公司 | 基于多方的隐私数据联合训练模型的方法和装置 |
CN113112032A (zh) * | 2021-04-16 | 2021-07-13 | 中国民航大学 | 基于联邦学习的航班延误预测系统及方法 |
WO2022110248A1 (zh) * | 2020-11-30 | 2022-06-02 | 华为技术有限公司 | 一种联邦学习方法、装置及系统 |
CN114648119A (zh) * | 2022-03-17 | 2022-06-21 | 北京达佳互联信息技术有限公司 | 异质性因果效应的确定方法、装置、电子设备及存储介质 |
CN114677200A (zh) * | 2022-04-01 | 2022-06-28 | 重庆邮电大学 | 基于多方高维数据纵向联邦学习的商业信息推荐方法及装置 |
CN115169587A (zh) * | 2022-09-02 | 2022-10-11 | 第四范式(北京)技术有限公司 | 联邦学习系统及实现多方联合处理任务的方法与设备 |
CN115470958A (zh) * | 2021-06-10 | 2022-12-13 | 腾讯科技(深圳)有限公司 | 联邦学习方法、装置、计算机可读介质及电子设备 |
WO2023071626A1 (zh) * | 2021-10-27 | 2023-05-04 | 腾讯科技(深圳)有限公司 | 一种联邦学习方法、装置、设备、存储介质及产品 |
CN116227628A (zh) * | 2023-03-10 | 2023-06-06 | 特斯联科技集团有限公司 | 基于不变风险最小化博弈机制的联邦学习方法及系统 |
CN116226532A (zh) * | 2023-03-03 | 2023-06-06 | 深圳市洞见智慧科技有限公司 | 基于联邦学习的信息推荐方法及相关装置 |
CN116523069A (zh) * | 2023-04-12 | 2023-08-01 | 中国工商银行股份有限公司 | 基于联邦建模的优惠券推送方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11924064B2 (en) * | 2021-12-22 | 2024-03-05 | Atlassian Pty Ltd. | Apparatuses, methods, and computer program products for predictive determinations of causal change identification for service incidents |
-
2023
- 2023-08-16 CN CN202311032785.6A patent/CN116757286B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109299728A (zh) * | 2018-08-10 | 2019-02-01 | 深圳前海微众银行股份有限公司 | 联邦学习方法、系统及可读存储介质 |
CN111695697A (zh) * | 2020-06-12 | 2020-09-22 | 深圳前海微众银行股份有限公司 | 多方联合决策树构建方法、设备及可读存储介质 |
WO2021249086A1 (zh) * | 2020-06-12 | 2021-12-16 | 深圳前海微众银行股份有限公司 | 多方联合决策树构建方法、设备及可读存储介质 |
CN112199709A (zh) * | 2020-10-28 | 2021-01-08 | 支付宝(杭州)信息技术有限公司 | 基于多方的隐私数据联合训练模型的方法和装置 |
WO2022110248A1 (zh) * | 2020-11-30 | 2022-06-02 | 华为技术有限公司 | 一种联邦学习方法、装置及系统 |
CN113112032A (zh) * | 2021-04-16 | 2021-07-13 | 中国民航大学 | 基于联邦学习的航班延误预测系统及方法 |
CN115470958A (zh) * | 2021-06-10 | 2022-12-13 | 腾讯科技(深圳)有限公司 | 联邦学习方法、装置、计算机可读介质及电子设备 |
WO2023071626A1 (zh) * | 2021-10-27 | 2023-05-04 | 腾讯科技(深圳)有限公司 | 一种联邦学习方法、装置、设备、存储介质及产品 |
CN114648119A (zh) * | 2022-03-17 | 2022-06-21 | 北京达佳互联信息技术有限公司 | 异质性因果效应的确定方法、装置、电子设备及存储介质 |
CN114677200A (zh) * | 2022-04-01 | 2022-06-28 | 重庆邮电大学 | 基于多方高维数据纵向联邦学习的商业信息推荐方法及装置 |
CN115169587A (zh) * | 2022-09-02 | 2022-10-11 | 第四范式(北京)技术有限公司 | 联邦学习系统及实现多方联合处理任务的方法与设备 |
CN116226532A (zh) * | 2023-03-03 | 2023-06-06 | 深圳市洞见智慧科技有限公司 | 基于联邦学习的信息推荐方法及相关装置 |
CN116227628A (zh) * | 2023-03-10 | 2023-06-06 | 特斯联科技集团有限公司 | 基于不变风险最小化博弈机制的联邦学习方法及系统 |
CN116523069A (zh) * | 2023-04-12 | 2023-08-01 | 中国工商银行股份有限公司 | 基于联邦建模的优惠券推送方法及装置 |
Non-Patent Citations (4)
Title |
---|
A Tree-based Federated Learning Approach for Personalized Treatment Effect Estimation from Heterogeneous Data Source;Xiaoqing Tan et al.;《arXiv》;1-12 * |
DCMT:A Direct Entire-Space Causal Multi-Task Framework for Post-Click Conversion Estimation;Feng Zhu et al.;《2023 IEEE 39th International Conference on Data Engineering (ICDE)》;3113-3125 * |
TOWARDS CAUSAL FEDERATED LEARNING FOR ENHANCED ROBUSTNESS AND PRIVACY;Sreya Francis et al.;《arXiv》;1-9 * |
计及用户充电行为与隐私保护的联邦学习电动汽车短期充电负荷预测;杨挺 等;《10.13336/j.1003-6520.hve.20230765 》;1-8 * |
Also Published As
Publication number | Publication date |
---|---|
CN116757286A (zh) | 2023-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110633806B (zh) | 纵向联邦学习系统优化方法、装置、设备及可读存储介质 | |
CN109299728B (zh) | 基于构建梯度树模型的样本联合预测方法、系统及介质 | |
US20230078061A1 (en) | Model training method and apparatus for federated learning, device, and storage medium | |
TWI732226B (zh) | 分類模型生成方法及裝置、資料識別方法及裝置 | |
CN113689003B (zh) | 一种安全的去除第三方的混合联邦学习框架及方法 | |
TW202006615A (zh) | 基於模型的預測方法和裝置 | |
Ersoy et al. | Blockchain‐based asset storage and service mechanism to metaverse universe: Metarepo | |
CN112288094B (zh) | 联邦网络表示学习方法及系统 | |
CN113127916A (zh) | 数据集合处理方法、数据处理方法、装置及存储介质 | |
CN112347500B (zh) | 分布式系统的机器学习方法、装置、系统、设备及存储介质 | |
CN104601596B (zh) | 一种分类数据挖掘系统中数据隐私保护方法 | |
CN110969264B (zh) | 模型训练方法、分布式预测方法及其系统 | |
CN113505882A (zh) | 基于联邦神经网络模型的数据处理方法、相关设备及介质 | |
CN112989399B (zh) | 数据处理系统及方法 | |
CN114401079A (zh) | 多方联合信息价值计算方法、相关设备及存储介质 | |
CN111767411B (zh) | 知识图谱表示学习优化方法、设备及可读存储介质 | |
CN113221153B (zh) | 图神经网络训练方法、装置、计算设备及存储介质 | |
CN113312644B (zh) | 基于隐私保护的跨域推荐模型训练方法及训练系统 | |
CN112200382A (zh) | 一种风险预测模型的训练方法和装置 | |
CN114362948B (zh) | 一种联邦衍生特征逻辑回归建模方法 | |
CN113962286A (zh) | 一种基于分段函数的去中心化逻辑回归分类预测方法 | |
CN114168295A (zh) | 混合架构系统及基于历史任务效果的任务调度方法 | |
CN116757286B (zh) | 基于联邦学习的多方联合因果树模型构建系统以及方法 | |
CN111914281B (zh) | 基于区块链和同态加密的贝叶斯模型训练方法及装置 | |
CN113807157A (zh) | 基于联邦学习训练神经网络模型的方法、装置和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |