CN113011521B - 基于链式的多标签预测方法、控制器和介质 - Google Patents

基于链式的多标签预测方法、控制器和介质 Download PDF

Info

Publication number
CN113011521B
CN113011521B CN202110392483.4A CN202110392483A CN113011521B CN 113011521 B CN113011521 B CN 113011521B CN 202110392483 A CN202110392483 A CN 202110392483A CN 113011521 B CN113011521 B CN 113011521B
Authority
CN
China
Prior art keywords
data
user
holder
training
generating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110392483.4A
Other languages
English (en)
Other versions
CN113011521A (zh
Inventor
蔡文渊
张坤坤
高明
钱卫宁
徐林昊
顾海林
杜蓓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Hipu Intelligent Information Technology Co ltd
East China Normal University
Original Assignee
Shanghai Hipu Intelligent Information Technology Co ltd
East China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Hipu Intelligent Information Technology Co ltd, East China Normal University filed Critical Shanghai Hipu Intelligent Information Technology Co ltd
Priority to CN202110392483.4A priority Critical patent/CN113011521B/zh
Publication of CN113011521A publication Critical patent/CN113011521A/zh
Application granted granted Critical
Publication of CN113011521B publication Critical patent/CN113011521B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于链式的多标签联邦学习方法、控制器和介质,所述方法包括步骤S1、获取n个数据持有方中每一数据持有方对应的训练数据集;步骤S2、基于所述n个数据持有方的用户标签生成标签排序;步骤S3、以{X1,X2,...,Xn}U{Yt(m)|m<j,m=1,2,...n}作为预测子模型Mt(j)的输入数据,以预测标签Yt(j)作为预测子模型Mt(j)的输出数据,进行纵向联邦学习训练,并行训练生成预测子模型Mt(j);步骤S4、待测用户的特征为{x1,x2,...,xn},将{x1,x2,...,xn}U{yt(m)|m<j,m=1,2,...n}作为Mt(j)输入,按照标签排序依次执行各个预测子模型Mt(j)的预测任务,生成所述待测用户所有标签{yt(1),yt(2),...,yt(n)},yt(j)表示待测用户对应于第t(j)个标签的预测值。本发明基于多标签之间的相互关系进行联邦学习,提高了模型精度。

Description

基于链式的多标签预测方法、控制器和介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于链式的多标签联邦学习方法、控制器和介质。
背景技术
纵向联邦学习指的是多个数据持有方的数据集中的用户重叠较多而用户特征重叠较少的情况下的联邦学习。纵向联邦学习的任务就是在保持数据本地化的情况下,共同训练出一个机器学习模型。多标签学习解决的是一个样本对应多个标签的机器学习的技术问题,例如:一张图片中可能即包含狗,也包含猫。相对的,传统的单标签学习解决的则是一个样本仅对应一个标签的机器学习的技术问题,例如:判断一张图片是猫的照片还是狗的照片。
传统的基于单标签的纵向联邦学习,已多有研究和应用。在多标签场景下,例如:在银行数据持有方与电商数据持有方的联邦学习场景中,电商数据持有方要预测用户是否会购买某件商品的标签,同时银行数据持有方要预测用户是否会如期还款的标签。按照现有技术的方案,可以将这个问题转化为两个独立的传统的单标签联邦学习问题:一个联邦学习模型用来预测用户是否会购买某件商品的标签;另一个联邦学习模型用来预测用户是否会如期还款的标签,两个模型互不相干。但是这样处理实际上忽略了两个标签的相互关系(如:“是否会如期还款”这个标签可能能够帮助判断“用户是否会购买某件商品”这个标签),导致模型精度较低。由此可知,如何在模型训练过程中挖掘出多标签之间的相关关系,基于多标签之间的相互关系进行联邦学习,提高模型精度成为亟待解决的技术问题。
发明内容
本发明目的在于,提供一种基于链式的多标签联邦学习方法、控制器和介质,基于多标签之间的相互关系进行联邦学习,提高了模型精度。
根据本发明一方面,提供了一种基于链式的多标签联邦学习方法,包括:
步骤S1、获取n个数据持有方中每一数据持有方对应的训练数据集,n个数据持有方的用户是重叠的,每一数据持有方对应一个用户标签,第i数据持有方对应的第i训练数据集为(Xi,Yi),其中,
Figure GDA0003802145490000021
Figure GDA0003802145490000022
Xi表示i训练数据集的样本用户特征数据集,包括ni个样本用户,每个样本用户有mi个属性;Yi表示i训练数据集的样本用户标签数据集,i表示数据持有方序号,i=1,2,…,n,
Figure GDA0003802145490000023
yik∈R,k=1,2,…,ni
步骤S2、基于所述n个数据持有方的用户标签生成标签排序:t(1)<t(2)<t(3)…<t(n),其中,t(j)表示排在第j位的标签对应的数据持有方序号,j=1,2,…n;
步骤S3、以{X1,X2,…,Xn}∪{Yt(m)|m<j,m=1,2,…n}作为预测子模型Mt(j)的输入数据,以预测标签Yt(j)作为预测子模型Mt(j)的输出数据,进行纵向联邦学习训练,并行训练生成预测子模型Mt(j)
步骤S4、待测用户的特征为{x1,x2,…,xn},xi表示待测用户在第i个数据持有方对应的待测用户特征数据,令j从1开始取值,将{x1,x2,…,xn}∪{yt(m)|m<j,m=1,2,…n}作为Mt(j)输入,按照t(1)<t(2)<t(3)…<t(n)的顺序依次执行各个预测子模型Mt(j)的预测任务,生成所述待测用户所有标签{yt(1),yt(2),…,yt(n)},yt(j)表示待测用户对应于第t(j)个标签的预测值。
根据本发明第二方面,提供一种电子设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被设置为用于执行本发明第一方面所述的方法。
根据本发明第三方面,提供一种计算机可读存储介质,所述计算机指令用于执行本发明第一方面所述的方法。
本发明与现有技术相比具有明显的优点和有益效果。借由上述技术方案,本发明提供的一种基于链式的多标签联邦学习方法、控制器和介质可达到相当的技术进步性及实用性,并具有产业上的广泛利用价值,其至少具有下列优点:
本发明通过构建链式联邦学习模型,将当前标签的前序标签也作为特征数据加入到输入数据中,使得在模型训练过程中能够学习到多标签之间的相关关系,基于多标签之间的相互关系进行联邦学习,提高模型精度。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。
附图说明
图1为本发明实施例提供的基于链式的多标签联邦学习方法中,各个预测标签结果产生的顺序示意图。
具体实施方式
为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种基于链式的多标签联邦学习方法、控制器和介质的具体实施方式及其功效,详细说明如后。
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时处理可以被终止,但是还可以具有未包括在附图中的附加步骤。处理可以对应于方法、函数、规程、子例程、子程序等等。
本发明实施例提供了一种基于链式的多标签联邦学习方法,包括:
步骤S1、获取n个数据持有方中每一数据持有方对应的训练数据集,可以理解的是,每一数据持有方各自的训练数据集是存储在各自本地,模型训练过程中,每一数据持有方各自的训练数据集也始终存储在各自本地,n个数据持有方的用户是重叠的,每一数据持有方对应一个用户标签,第i数据持有方对应的第i训练数据集为(Xi,Yi),其中,
Figure GDA0003802145490000041
Figure GDA0003802145490000042
Xi表示i训练数据集的样本用户特征数据集,包括ni个样本用户,每个样本用户有mi个属性;Yi表示i训练数据集的样本用户标签数据集,i表示数据持有方序号,i=1,2,…,n,
Figure GDA0003802145490000043
yik∈R,k=1,2,…,ni
其中,可以理解的是,n个数据持有方的样本用户是重叠的,指的是n个数据持有方的样本用户是相同的,且样本用户是横向对齐的。n个数据持有方的数据属性数量可能相同也可能不同,同一数据持有方的每一样本用户的数据属性数量是相同的。
步骤S2、基于所述n个数据持有方的用户标签生成标签排序:t(1)<t(2)<t(3)…<t(n),其中,t(j)表示排在第j位的标签对应的数据持有方序号,j=1,2,…n;
其中,可以随机初始化n个数据持有方的用户标签生成标签排序,也可根据每一用户标签的目标精确度来排序,目标精确度越高,标签排序越靠后。作为一种实施例,若t(1)=5,则表示第5个数据持有方的标签排在标签排序的第一位。
步骤S3、以{X1,X2,…,Xn}∪{Yt(m)|m<j,m=1,2,…n}作为预测子模型Mt(j)的输入数据,以预测标签Yt(j)作为预测子模型Mt(j)的输出数据,进行纵向联邦学习训练,并行训练生成预测子模型Mt(j)
需要说明的是,联邦学习过程中,各个子模型Mt(j)是分散存储在各个数据持有方的,即,每个数据持有方只保有各个子模型Mt(j)的一部分,作为对应的本地预测子模型。{X1,X2,…,Xn}∪{Yt(m)|m<j,m=1,2,…n}作为预测子模型Mt(j)的输入数据,具体指的是,将满足m<j的Yt(m)加入对应的Xt(m),作为Mt(m)在第t(m)数据持有方的本地预测子模型的输入数据,这样可将当前标签的前序标签也作为特征数据加入到输入数据中,这样即可学习到标签之间的相互关系,且各个数据持有方的用户数据始终都存在自己的数据库中,子模型训练和使用过程中,各个数据持有方之间只传递模型更新参数。但可以理解的是,这种相关关系是依赖于标签排序的,排在后面的标签由于训练时用到的特征更多,因此其子模型的模型精度相对更高,所以重要的、对精度要求高的标签需要排到后面。
步骤S4、待测用户的特征为{x1,x2,…,xn},xi表示待测用户在第i个数据持有方对应的待测用户特征数据,令j从1开始取值,将{x1,x2,…,xn}∪{yt(m)|m<j,m=1,2,…n}作为Mt(j)输入,按照t(1)<t(2)<t(3)…<t(n)的顺序依次执行各个预测子模型Mt(j)的预测任务,生成所述待测用户所有标签{yt(1),yt(2),…,yt(n)},yt(j)表示待测用户对应于第t(j)个标签的预测值,各个预测标签结果产生的顺序如图1所示。
可以理解的是,待测用户的特征也是分散存储在多个数据持有方中的,即每一数据持有方持有一部分待测用户的特征数据。
本发明实施例通过构建链式联邦学习模型,将当前标签的前序标签也作为特征数据加入到输入数据中,使得在模型训练过程中能够学习到多标签之间的相关关系,基于多标签之间的相互关系进行联邦学习,提高模型精度。
联邦学习涉及多个客户端,每一客户端可能有一个或多个标签,也可能没有标签,只有用户数据,因此,可将客户端的用户数据进行预处理,再从预处理后的数据中获取n个数据持有方中每一数据持有方对应的训练数据集,作为一种实施例,所述步骤S1可包括:
步骤S11、获取Z个客户端中每一客户端的数据,采用预设的对齐算法和隐私求交算法获取每一客户端中Z个客户端重叠的数据,作为每一客户端对应的用户数据,所述用户数据包括用户特征数据和用户标签数据;
需要说明的是,步骤S11中可以直接采用现有的对齐算法和隐私求交算法获取每一客户端中Z个客户端重叠的数据,现有的对齐算法和隐私求交算法在此不再赘述。
步骤S12、获取第z客户端数据中用户标签的类别数量Wz,并判断Wz是否大于等于2,若是,则构建Wz个第z客户端对应的数据持有方,并以所述第z客户端对应的用户数据中的每一类用户标签数据作为一个数据持有方对应的用户标签数据集,以所述第z客户端对应的用户特征数据作为每一数据持有方对应的用户特征数据集,构建Wz个训练数据集,为每一数据持有方划分一个对应的训练数据集,否则,执行步骤S13,z=1,2,…Z;
步骤S13、构建一个第x客户端对应的数据持有方,并以第z客户端对应的用户标签数据作为用户标签数据集,以第z客户端对应的用户特征数据作为用户特征数据集,构建该数据持有方对应的训练数据集训;
步骤S14、将基于所述Z个客户端数据生成的所有数据持有方的训练数据集,确定为所述n个数据持有方的训练数据集。
通过步骤S11-步骤S14即可使得n个数据持有方的训练数据集的每一数据持有方的训练数据集中的用户重叠对齐,且每一数据持有方对应一个用户标签。但可以理解的是,如果某一客户端只有用户特征数据集,没有对应的标签,也可将该客户端对应的用户特征数据集加入每轮训练的输入数据,参与训练。
作为一种实施例,步骤S2可包括:
步骤S21、获取所述n个用户标签中每一用户标签的目标精确度;
其中,每一用户的目标精确度可根据具体应用场景来确定。
步骤S22、根据目标精确度从小到大的顺序对应生成所述n个用户标签对应的标签排序:t(1)<t(2)<t(3)…<t(n)。
作为一种实施例,每一预测子模型Mt(j)包括分散存在所述n个数据持有方上的本地预测子模型
Figure GDA0003802145490000071
表示预测子模型Mt(j)在第i数据持有方上的本地预测子模型,所述步骤S3包括并行执行的步骤S31和步骤S32:
步骤S31、若j=1,将Xi作为
Figure GDA0003802145490000072
的输入数据,预测Yt(j)作为Mt(j)的输出数据,进行纵向联邦学习训练,生成Mt(j)
步骤S32、若j>1,则将Xt(r)和Yt(r)作为
Figure GDA0003802145490000081
的输入数据,r=1,2,...j-1,将Xt(p)作为
Figure GDA0003802145490000082
的输入数据,p=j,j+1,...n,预测Yt(j)作为Mt(j)的输出数据,进行纵向联邦学习训练,生成Mt(j)
这样可将当前标签的前序标签也作为特征数据加入到输入数据中,即可学习到标签之间的相互关系。
当每一子模型输入数据和输出数据确认好后,可以选择预设的机器学习模型框架进行联邦学习,训练子模型,作为一种实施例,所述步骤S3中采用纵向神经网络的架构进行纵向联邦学习,生成Mt(j),第i数据持有方上的本地预测子模型为
Figure GDA0003802145490000083
其中,u为第一神经网络模型深度,第t(j)数据持有方上的本地预测子模型还包括综合神经网络
Figure GDA0003802145490000084
其中,h为第一神经网络模型深度,所述步骤S3具体包括:
步骤S311、第i数据持有方将
Figure GDA0003802145490000085
对应的输入数据输入
Figure GDA0003802145490000086
生成对应的输出outputi,t(j),发送给第t(j)数据持有方;
步骤S312、第t(j)数据持有方将接收到的outputi,t(j)按顺序拼接起来,生成
Figure GDA0003802145490000087
输入到第t(j)数据持有方的
Figure GDA0003802145490000088
生成
Figure GDA0003802145490000089
基于
Figure GDA00038021454900000810
Yt(j)神经网络的损失函数获取损失值loss;
步骤S313、第t(j)数据基于loss反向计算第一梯度值并更新
Figure GDA00038021454900000811
并生成第i数据持有方对应的第二梯度值发送给第i数据持有方;
步骤S314、第i数据持有方基于对应的第二梯度值,继续反向传播计算
Figure GDA00038021454900000812
的梯度更新各个layer;
步骤S315、循环执行步骤S311-步骤S314,直至预测子模型Mt(j)收敛。
需要说明的是,步骤S315可以直接采用现有的判断模型收敛的方法判断预测子模型Mt(j)是否收敛,在此不再展开描述。
作为一种实施例,所述步骤S4具体可包括:
步骤S41、将xi输入
Figure GDA0003802145490000091
基于Mt(1)生成yt(1)
步骤S42、将xt(1)和yt(1)输入
Figure GDA0003802145490000092
将xt(k1)输入
Figure GDA0003802145490000093
基于Mt(2)生成yt(2),k1=2,...n;
步骤S43、将xt(1)和yt(1)输入
Figure GDA0003802145490000094
将xt(2)和yt(2)输入
Figure GDA0003802145490000095
将xt(k2)输入
Figure GDA0003802145490000096
基于Mt(3)生成yt(3),k2=3,4,...n;
步骤S4(n-1)、将xt(1)和yt(1)输入
Figure GDA0003802145490000097
将xt(2)和yt(2)输入
Figure GDA0003802145490000098
…将xt(n-2)和yt(n -2)输入
Figure GDA0003802145490000099
将xt(k(n-2))输入
Figure GDA00038021454900000910
基于Mt(n-1)生成yt(n-1),k(n-2)=n-1,n;
步骤S4n、将xt(1)和yt(1)输入
Figure GDA00038021454900000911
将xt(2)和yt(2)输入
Figure GDA00038021454900000912
xt(n-1)和yt(n-1)输入
Figure GDA00038021454900000913
将xt(n)输入
Figure GDA00038021454900000914
基于Mt(n)生成yt(n)
可以理解的是,步骤S43和步骤S4(n-1)之间的“…”表示以此规律执行。通过步骤S41-步骤S4n,最终生成所述待测用户所有标签{yt(1),yt(2),…,yt(n)},可以根据具体应用需要获取{yt(1),yt(2),…,yt(n)}中的任意一个或多个值,作为目标数据。
本发明实施例还提供一种电子设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被设置为用于执行本发明实施例所述的方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机指令用于执行本发明实施例所述的方法。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容作出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。

Claims (7)

1.一种基于链式的多标签预测方法,其特征在于,包括:
步骤S1、获取n个数据持有方中每一数据持有方对应的训练数据集,n个数据持有方的用户是重叠的,每一数据持有方对应一个用户标签,第i数据持有方对应的第i训练数据集为(Xi,Yi),其中,
Figure FDA0003802145480000011
Figure FDA0003802145480000012
Xi表示i训练数据集的样本用户特征数据集,包括ni个样本用户,每个样本用户有mi个属性;Yi表示i训练数据集的样本用户标签数据集,i表示数据持有方序号,i=1,2,...,n,
Figure FDA0003802145480000013
yik∈R,k=1,2,...,ni
步骤S2、基于所述n个数据持有方的用户标签生成标签排序:t(1),t(2),t(3),...,t(n),其中,t(j)表示排在第j位的标签对应的数据持有方序号,j=1,2,...,n;
步骤S2包括:
步骤S21、获取所述n个用户标签中每一用户标签的目标精确度;
步骤S22、根据目标精确度从小到大的顺序对应生成所述n个用户标签对应的标签排序:t(1),t(2),t(3),...,t(n);
步骤S3、以{X1,X2,...,Xn}∪{Yt(m)|m<j,m=1,2,...,n}作为预测子模型Mt(j)的输入数据,以预测标签Yt(j)作为预测子模型Mt(j)的输出数据,进行纵向联邦学习训练,并行训练生成预测子模型Mt(j)
步骤S4、待测用户的特征为{x1,x2,...,xn},xi表示待测用户在第i个数据持有方对应的待测用户特征数据,令j从1开始取值,将{x1,x2,...,xn}∪{yt(m)|m<j,m=1,2,...,n}作为Mt(j)输入,按照t(1),t(2),t(3),...,t(n)的顺序依次执行各个预测子模型Mt(j)的预测任务,生成所述待测用户所有标签{yt(1),yt(2),...,yt(n)},yt(j)表示待测用户对应于第t(j)个数据持有方的标签的预测值。
2.根据权利要求1所述的方法,其特征在于,
所述步骤S1包括:
步骤S11、获取Z个客户端中每一客户端的数据,采用预设的对齐算法和隐私求交算法获取每一客户端中Z个客户端重叠的数据,作为每一客户端对应的用户数据,所述用户数据包括用户特征数据和用户标签数据;
步骤S12、获取第z客户端数据中用户标签的类别数量Wz,并判断Wz是否大于等于2,若是,则构建Wz个第z客户端对应的数据持有方,并以所述第z客户端对应的用户数据中的每一类用户标签数据作为一个数据持有方对应的用户标签数据集,以所述第z客户端对应的用户特征数据作为每一数据持有方对应的用户特征数据集,构建Wz个训练数据集,为每一数据持有方划分一个对应的训练数据集,否则,执行步骤S13,z=1,2,…,Z;
步骤S13、构建一个第x客户端对应的数据持有方,并以第z客户端对应的用户标签数据作为用户标签数据集,以第z客户端对应的用户特征数据作为用户特征数据集,构建该数据持有方对应的训练数据集训;
步骤S14、将基于所述Z个客户端数据生成的所有数据持有方的训练数据集,确定为所述n个数据持有方的训练数据集。
3.根据权利要求1所述的方法,其特征在于,
每一预测子模型Mt(j)包括分散存在所述n个数据持有方上的本地预测子模型
Figure FDA0003802145480000021
表示预测子模型Mt(j)在第i数据持有方上的本地预测子模型,所述步骤S3包括并行执行的步骤S31和步骤S32:
步骤S31、若j=1,将Xi作为
Figure FDA0003802145480000022
的输入数据,预测Yt(j)作为Mt(j)的输出数据,进行纵向联邦学习训练,生成Mt(j)
步骤S32、若j>1,则将Xt(r)和Yt(r)作为
Figure FDA0003802145480000031
的输入数据,r=1,2,...,j-1,将Xt(p)作为
Figure FDA0003802145480000032
的输入数据,p=j,j+1,...,n,预测Yt(j)作为Mt(j)的输出数据,进行纵向联邦学习训练,生成Mt(j)
4.根据权利要求1所述的方法,其特征在于,
所述步骤S3中采用纵向神经网络的架构进行纵向联邦学习,生成Mt(j),第i数据持有方上的本地预测子模型为
Figure FDA0003802145480000033
其中,u为第一神经网络模型深度,第t(j)数据持有方上的本地预测子模型还包括综合神经网络
Figure FDA0003802145480000034
其中,h为综合神经网络模型深度,所述步骤S3具体包括:
步骤S311、第i数据持有方将
Figure FDA0003802145480000035
对应的输入数据输入
Figure FDA0003802145480000036
生成对应的输出outputi,t(j),发送给第t(j)数据持有方;
步骤S312、第t(j)数据持有方将接收到的outputi,t(j)按顺序拼接起来,生成
Figure FDA0003802145480000037
输入到第t(j)数据持有方的
Figure FDA0003802145480000038
生成
Figure FDA0003802145480000039
基于
Figure FDA00038021454800000310
Yt(j)神经网络的损失函数获取损失值loss;
步骤S313、第t(j)数据持有方基于loss反向计算第一梯度值并更新
Figure FDA00038021454800000311
并生成第i数据持有方对应的第二梯度值发送给第i数据持有方;
步骤S314、第i数据持有方基于对应的第二梯度值,继续反向传播计算
Figure FDA00038021454800000312
的梯度更新各个layer;
步骤S315、循环执行步骤S311-步骤S314,直至预测子模型Mt(j)收敛。
5.根据权利要求3所述的方法,其特征在于,
所述步骤S4包括:
步骤S41、将xi输入
Figure FDA0003802145480000041
基于Mt(1)生成yt(1)
步骤S42、将xt(1)和yt(1)输入
Figure FDA0003802145480000042
将xt(k1)输入
Figure FDA0003802145480000043
基于Mt(2)生成yt(2),k1=2,...,n;
步骤S43、将xt(1)和yt(1)输入
Figure FDA0003802145480000044
将xt(2)和yt(2)输入
Figure FDA0003802145480000045
将xt(k2)输入
Figure FDA0003802145480000046
基于Mt(3)生成yt(3),k2=3,4,...,n;
步骤S4(n-1)、将xt(1)和yt(1)输入
Figure FDA0003802145480000047
将xt(2)和yt(2)输入
Figure FDA0003802145480000048
将xt(n-2)和yt(n -2)输入
Figure FDA0003802145480000049
将xt(k(n-2))输入
Figure FDA00038021454800000410
基于Mt(n-1)生成yt(n-1),k(n-2)=n-1,n;
步骤S4n、将xt(1)和yt(1)输入
Figure FDA00038021454800000411
将xt(2)和yt(2)输入
Figure FDA00038021454800000412
…,xt(n-1)和yt(n-1)输入
Figure FDA00038021454800000413
将xt(n)输入
Figure FDA00038021454800000414
基于Mt(n)生成yt(n)
6.一种电子设备,其特征在于,包括:
至少一个处理器;
以及,与所述至少一个处理器通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被设置为用于执行前述权利要求1-5任一项所述的方法。
7.一种计算机可读存储介质,其特征在于,存储有计算机可执行指令,所述计算机可执行指令用于执行前述权利要求1-5中任一项所述的方法。
CN202110392483.4A 2021-04-13 2021-04-13 基于链式的多标签预测方法、控制器和介质 Active CN113011521B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110392483.4A CN113011521B (zh) 2021-04-13 2021-04-13 基于链式的多标签预测方法、控制器和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110392483.4A CN113011521B (zh) 2021-04-13 2021-04-13 基于链式的多标签预测方法、控制器和介质

Publications (2)

Publication Number Publication Date
CN113011521A CN113011521A (zh) 2021-06-22
CN113011521B true CN113011521B (zh) 2022-09-30

Family

ID=76388498

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110392483.4A Active CN113011521B (zh) 2021-04-13 2021-04-13 基于链式的多标签预测方法、控制器和介质

Country Status (1)

Country Link
CN (1) CN113011521B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110633806A (zh) * 2019-10-21 2019-12-31 深圳前海微众银行股份有限公司 纵向联邦学习系统优化方法、装置、设备及可读存储介质
CN111160572A (zh) * 2020-04-01 2020-05-15 支付宝(杭州)信息技术有限公司 一种基于多标签的联邦学习方法、装置和系统
CN111241567A (zh) * 2020-01-16 2020-06-05 深圳前海微众银行股份有限公司 基于秘密共享的纵向联邦学习方法、系统及存储介质
CN111753996A (zh) * 2020-06-24 2020-10-09 中国建设银行股份有限公司 一种方案确定模型的优化方法、装置、设备及存储介质
CN112085159A (zh) * 2020-07-24 2020-12-15 西安电子科技大学 一种用户标签数据预测系统、方法、装置及电子设备
CN112199709A (zh) * 2020-10-28 2021-01-08 支付宝(杭州)信息技术有限公司 基于多方的隐私数据联合训练模型的方法和装置
CN112288128A (zh) * 2020-09-14 2021-01-29 北京沃东天骏信息技术有限公司 信息预测方法和装置
CN112396189A (zh) * 2020-11-27 2021-02-23 中国银联股份有限公司 一种多方构建联邦学习模型的方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110633806A (zh) * 2019-10-21 2019-12-31 深圳前海微众银行股份有限公司 纵向联邦学习系统优化方法、装置、设备及可读存储介质
CN111241567A (zh) * 2020-01-16 2020-06-05 深圳前海微众银行股份有限公司 基于秘密共享的纵向联邦学习方法、系统及存储介质
CN111160572A (zh) * 2020-04-01 2020-05-15 支付宝(杭州)信息技术有限公司 一种基于多标签的联邦学习方法、装置和系统
CN111753996A (zh) * 2020-06-24 2020-10-09 中国建设银行股份有限公司 一种方案确定模型的优化方法、装置、设备及存储介质
CN112085159A (zh) * 2020-07-24 2020-12-15 西安电子科技大学 一种用户标签数据预测系统、方法、装置及电子设备
CN112288128A (zh) * 2020-09-14 2021-01-29 北京沃东天骏信息技术有限公司 信息预测方法和装置
CN112199709A (zh) * 2020-10-28 2021-01-08 支付宝(杭州)信息技术有限公司 基于多方的隐私数据联合训练模型的方法和装置
CN112396189A (zh) * 2020-11-27 2021-02-23 中国银联股份有限公司 一种多方构建联邦学习模型的方法及装置

Also Published As

Publication number Publication date
CN113011521A (zh) 2021-06-22

Similar Documents

Publication Publication Date Title
Darko et al. Artificial intelligence in the AEC industry: Scientometric analysis and visualization of research activities
US20200027528A1 (en) Systems and methods for predicting chemical reactions
Motawa et al. Case-based reasoning and BIM systems for asset management
CN103593353A (zh) 信息搜索方法、展示信息排序权重值确定方法及其装置
CN109784654A (zh) 任务生成方法、装置、计算机设备和存储介质
CN113011522B (zh) 基于有向无环图的多标签联邦学习方法、控制器和介质
CN114003949A (zh) 基于隐私数据集的模型训练方法和装置
CN116629983B (zh) 基于用户偏好的跨领域商品推荐方法及系统
Krishankumar et al. Cloud vendor selection for the healthcare industry using a big data-driven decision model with probabilistic linguistic information
CN114219159A (zh) 一种基于联邦学习与注意力机制的生产线调度方法
WO2021185427A1 (en) Generation of personalized recommendations
Berki et al. Requirements engineering and process modelling in software quality management—towards a generic process metamodel
Batkovskiy et al. Developing intelligent decision support systems in multi-criteria problems of administrative-territorial formations infrastructure projects assessment
CN116705197B (zh) 一种合成及逆合成分子图预测模型的处理方法和装置
Huang et al. An Ad CTR prediction method based on feature learning of deep and shallow layers
Qu et al. Adaptive planning of human–robot collaborative disassembly for end-of-life lithium-ion batteries based on digital twin
CN113011521B (zh) 基于链式的多标签预测方法、控制器和介质
CN113159152B (zh) 基于树形结构的多标签预测方法、控制器和介质
CN109857661A (zh) 一种基于大数据分析的智能生成测试用例的方法及系统
US11868686B2 (en) System and method for manufacture and customization of construction assemblies in a computing environment
Santos et al. An information theory framework for two-stage binary image operator design
CN115760201B (zh) 智能销售线索推荐理由生成方法及系统
CN115982391B (zh) 信息处理方法及装置
Zhang et al. Intrinsic Performance Influence-based Participant Contribution Estimation for Horizontal Federated Learning
KR102330804B1 (ko) 소프트웨어 개발 원가검증 시스템

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant