CN115600250A - 数据处理方法、存储介质和电子设备 - Google Patents

数据处理方法、存储介质和电子设备 Download PDF

Info

Publication number
CN115600250A
CN115600250A CN202211587360.7A CN202211587360A CN115600250A CN 115600250 A CN115600250 A CN 115600250A CN 202211587360 A CN202211587360 A CN 202211587360A CN 115600250 A CN115600250 A CN 115600250A
Authority
CN
China
Prior art keywords
client
data
virtual data
private
attacker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211587360.7A
Other languages
English (en)
Other versions
CN115600250B (zh
Inventor
姚柳佚
王桢
谢悦湘
李雅亮
陈道源
邝炜瑞
丁博麟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Alibaba China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba China Co Ltd filed Critical Alibaba China Co Ltd
Priority to CN202211587360.7A priority Critical patent/CN115600250B/zh
Publication of CN115600250A publication Critical patent/CN115600250A/zh
Application granted granted Critical
Publication of CN115600250B publication Critical patent/CN115600250B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Storage Device Security (AREA)

Abstract

本申请公开了一种数据处理方法、存储介质和电子设备。其中,该方法包括:获取虚拟数据,其中,第一客户端的角色为联邦学习训练过程中的攻击者,第二客户端的角色为联邦学习训练过程中的被攻击者,第一客户端与第二客户端共享邻居生成器;利用虚拟数据进行图联邦攻击,重构第二客户端的私有节点属性以及第一客户端与第二客户端之间的连接关系;基于私有节点属性和连接关系,确定第二客户端发生隐私数据泄露。本申请解决了相关技术中缺乏对联邦学习中图相关信息及邻居生成器共享所引发的隐私泄露的检测手段的技术问题。

Description

数据处理方法、存储介质和电子设备
技术领域
本申请涉及计算机技术领域,具体而言,涉及一种数据处理方法、存储介质和电子设备。
背景技术
目前,考虑联邦学习(Federated Learning,FL)中隐私泄露的问题,相关技术领域的技术人员将经典的联邦学习推广到基于图数据的联邦图学习(Federated GraphLearning,FGL)。尽管FGL在隐私保护上取得一定的成功,但是,现有FGL大多关注联邦图学习算法的设计,在联邦学习中图相关信息(如节点嵌入信息(Node Embedding)和邻居生成器(Neighbor Generator)等)的共享可能会导致隐私泄露问题。然而,相关技术中却缺乏对隐私泄露问题的检测手段。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种数据处理方法、存储介质和电子设备,以至少解决相关技术中缺乏对联邦学习中图相关信息及邻居生成器共享所引发的隐私泄露的检测手段的技术问题。
根据本发明实施例的一个方面,提供了一种数据处理方法,包括:获取虚拟数据,其中,虚拟数据由第一客户端通过对第二客户端的反馈信息进行匹配后得到,虚拟数据用于重构第二客户端的私有节点属性,反馈信息为第二客户端在联邦学习训练过程中返回的邻居生成器的更新信息,第一客户端的角色为联邦学习训练过程中的攻击者,第二客户端的角色为联邦学习训练过程中的被攻击者,第一客户端与第二客户端共享邻居生成器;利用虚拟数据进行图联邦攻击,重构第二客户端的私有节点属性以及第一客户端与第二客户端之间的连接关系;基于私有节点属性和连接关系,确定第二客户端发生隐私数据泄露。
根据本发明实施例的另一方面,还提供了一种数据处理方法,包括:获取金融风控虚拟数据,其中,金融风控虚拟数据由第一客户端通过对第二客户端的反馈信息进行匹配后得到,反馈信息为第二客户端在联邦学习训练过程中返回的邻居生成器的更新信息,第一客户端的角色为联邦学习训练过程中的攻击者,第二客户端的角色为联邦学习训练过程中的被攻击者,第一客户端与第二客户端共享邻居生成器;利用金融风控虚拟数据进行图联邦攻击,重构第二客户端的私有节点属性以及第一客户端与第二客户端之间的连接关系;基于私有节点属性和连接关系确定第二客户端在多个银行客户端之间进行联合风控的过程中发生隐私数据泄露。
根据本发明实施例的另一方面,还提供了一种数据处理方法,包括:获取商品推荐虚拟数据,其中,商品推荐虚拟数据由第一客户端通过对第二客户端的反馈信息进行匹配后得到,反馈信息为第二客户端在联邦学习训练过程中返回的邻居生成器的更新信息,第一客户端的角色为联邦学习训练过程中的攻击者,第二客户端的角色为联邦学习训练过程中的被攻击者,第一客户端与第二客户端共享邻居生成器;利用商品推荐虚拟数据进行图联邦攻击,重构第二客户端的私有节点属性以及第一客户端与第二客户端之间的连接关系;基于私有节点属性和连接关系确定第二客户端在多个商家客户端之间进行联合推荐的过程中发生隐私数据泄露。
根据本发明实施例的另一方面,还提供了一种计算机可读存储介质,上述计算机可读存储介质包括存储的程序,其中,在上述程序运行时控制上述计算机可读存储介质所在设备执行任意一项上述的数据处理方法。
根据本发明实施例的另一方面,还提供了一种电子设备,包括:处理器;以及存储器,与上述处理器连接,用于为上述处理器提供处理以下处理步骤的指令:获取虚拟数据,其中,虚拟数据由第一客户端通过对第二客户端的反馈信息进行匹配后得到,反馈信息为第二客户端在联邦学习训练过程中返回的邻居生成器的更新信息,第一客户端的角色为联邦学习训练过程中的攻击者,第二客户端的角色为联邦学习训练过程中的被攻击者,第一客户端与第二客户端共享邻居生成器;利用虚拟数据进行图联邦攻击,重构第二客户端的私有节点属性以及第一客户端与第二客户端之间的连接关系;基于私有节点属性和连接关系,确定第二客户端发生隐私数据泄露。
在本发明实施例中,通过获取虚拟数据,其中,虚拟数据由第一客户端通过对第二客户端的反馈信息进行匹配后得到,虚拟数据用于重构第二客户端的私有节点属性,反馈信息为第二客户端在联邦学习训练过程中返回的邻居生成器的更新信息,第一客户端的角色为联邦学习训练过程中的攻击者,第二客户端的角色为联邦学习训练过程中的被攻击者,第一客户端与第二客户端共享邻居生成器,利用虚拟数据进行图联邦攻击,重构第二客户端的私有节点属性以及第一客户端与第二客户端之间的连接关系,进一步基于私有节点属性和连接关系,确定第二客户端发生隐私数据泄露。由于上述过程中所重构的联邦参与者中的被攻击者的私有节点属性和攻击者与被攻击者之间的连接关系能够揭示被攻击者是否发生了隐私数据泄露,本发明实施例达到了利用基于信息匹配的联邦图学习隐私攻击方法对存在邻居生成器共享关系的联邦参与者进行隐私数据泄露检测的目的,从而实现了对联邦图学习的联邦参与者进行更全面的数据隐私泄露检测、提高联邦学习安全性的技术效果,进而解决了相关技术中缺乏对联邦学习中图相关信息及邻居生成器共享所引发的隐私泄露的检测手段的技术问题。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1示出了一种用于实现数据处理方法的计算机终端(或移动设备)的硬件结构框图;
图2是根据本申请实施例的一种数据处理方法的流程图;
图3是根据本申请实施例的一种可选的联邦图学习隐私攻击过程的示意图;
图4是根据本申请实施例的另一种数据处理方法的流程图;
图5是根据本申请实施例的又一种数据处理方法的流程图;
图6是根据本申请实施例的一种数据处理装置的结构示意图;
图7是根据本申请实施例的一种可选的数据处理装置的结构示意图;
图8是根据本申请实施例的另一种数据处理装置的结构示意图
图9是根据本申请实施例的另一种可选的数据处理装置的结构示意图;
图10是根据本申请实施例的又一种数据处理装置的结构示意图;
图11是根据本申请实施例的另一种计算机终端的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
首先,在对本申请实施例进行描述的过程中出现的部分名词或术语适用于如下解释:
图(Graph)数据:由节点和连节点之间所连接的边构成。本申请实施例中,基于Graph数据的联邦图学习算法采用Fedsage+算法(开源的代码),基于Graph数据的边预测模型采用attri2vec模型(开源的代码)。
实施例1
根据本申请实施例,还提供了一种数据处理方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例1所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图1示出了一种用于实现数据处理方法的计算机终端(或移动设备)的硬件结构框图。如图1所示,计算机终端10(或移动设备10)可以包括一个或多个(图中采用102a,102b,……,102n来示出)处理器102(处理器102可以包括但不限于微处理器(Microcontroller Unit,MCU)或可编程逻辑器件(Field Programmable Gate Array,FPGA)等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输装置106。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(Universal SerialBus,USB)端口(可以作为计算机总线的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
应当注意到的是上述一个或多个处理器102和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算机终端10(或移动设备)中的其他元件中的任意一个内。如本申请实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
存储器104可用于存储应用软件的软件程序以及模块,如本申请实施例中的数据处理方法对应的程序指令/数据存储装置,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的数据处理方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
显示器可以例如触摸屏式的液晶显示器(Liquid Crystal Display,LCD),该液晶显示器可使得用户能够与计算机终端10(或移动设备)的用户界面进行交互。
此处需要说明的是,在一些可选实施例中,上述图1所示的计算机设备(或移动设备)可以包括硬件元件(包括电路)、软件元件(包括存储在计算机可读介质上的计算机代码)、或硬件元件和软件元件两者的结合。应当指出的是,图1仅为特定具体实例的一个实例,并且旨在示出可存在于上述计算机设备(或移动设备)中的部件的类型。
在FGL中,直接对算法实施隐私攻击是一种有效检测算法中是否存在隐私泄露风险的方法。相关技术提供的在FGL中重建训练数据的方法主要基于图像和文本数据。例如,梯度深漏方法(Deep Leakage from Gradient,DLG)主要通过对FGL的输入进行优化来生成相同的梯度,从而获得对应的重构训练样本和标签。DLG比以前的攻击要强大得多,它可以恢复准确的像素级原始图像和标记级原始文本。继DLG之后,倒置梯度深漏(invert DeepLeakage from Gradient,iDLG)方法通过探索标签与最后一层梯度的符号之间的关系,对输入的标签进行解析计算,从而提高了DLG的效率。在iDLG方法中,通过最小化原始梯度和重建数据生成的虚拟梯度之间的幅度不变损失(也即余弦相似度损失),能够成功地从平均参数梯度中恢复多个训练图像。
基于上述情况,本申请提出一种基于梯度匹配的FGL隐私攻击(Privacy Attackon federated Graph learning,PAG)方法。PAG方法用于重建联邦参与者的私有节点属性和链接关系。执行PAG的联邦参与者能够通过在FGL中对生成器接收到的梯度进行匹配以重构节点属性,进而匹配被攻击者。根据FGL局部子图训练连接预测模型,以归纳得到上述重构节点对应的链接。
在上述运行环境下,本申请提供了如图2所示的一种数据处理方法。图2是根据本申请实施例的一种数据处理方法的流程图,如图2所示,该数据处理方法包括:
步骤S21,获取虚拟数据,其中,虚拟数据由第一客户端通过对第二客户端的反馈信息进行匹配后得到,虚拟数据用于重构第二客户端的私有节点属性,反馈信息为第二客户端在联邦学习训练过程中返回的邻居生成器的更新信息,第一客户端的角色为联邦学习训练过程中的攻击者,第二客户端的角色为联邦学习训练过程中的被攻击者,第一客户端与第二客户端共享邻居生成器;
步骤S22,利用虚拟数据进行图联邦攻击,重构第二客户端的私有节点属性以及第一客户端与第二客户端之间的连接关系;
步骤S23,基于私有节点属性和连接关系,确定第二客户端发生隐私数据泄露。
在本申请实施例中,上述反馈信息为梯度匹配(Gradient Match)计算过程中所需的梯度更新信息。上述虚拟数据的数据类型主要取决于第二客户端的私有节点属性的数据类型。以金融风控场景为例,上述第二客户端的私有节点属性可以为账户属性数据,例如:账户名称、账户金额等。
上述第一客户端为FGL中多个联邦参与者(也即多个客户端)中发起隐私攻击的客户端,也即联邦学习训练过程中的攻击者。上述第二客户端为多个联邦参与者中被攻击的客户端,也即联邦学习训练过程中的被攻击者。
在FGL训练过程中,第二客户端(被攻击者)返回邻居生成器的更新信息,并将该更新信息作为反馈信息发送至第一客户端(攻击者)。第一客户端对该反馈信息进行匹配,得到上述虚拟数据。
根据FedSage+算法中为防止隐私泄露设计的机制,需要联邦参与者共享邻居生成器来确保对缺失邻居的情况进行修复。也就是说,上述第一客户端(攻击者)与第二客户端(被攻击者)共享邻居生成器。但是,在FGL中多个联邦参与者共享邻居生成器会引发额外的隐私泄露问题。
根据本申请实施例提供的上述方法,利用上述虚拟数据进行图联邦攻击(PAG),进而能够重构第二客户端(被攻击者)的私有节点属性,还能够重构第一客户端(攻击者)与第二客户端之间的连接关系。
进一步地,基于第二客户端(被攻击者)的私有节点属性和第一客户端(攻击者)与第二客户端之间的连接关系进行分析,判断第二客户端是否发生了隐私数据泄露,也即上述确定第二客户端发生隐私数据泄露。
综上,本申请提出的PAG算法能够针对FGL进行新型数据重构攻击,在新型数据重构攻击中,攻击者能够重构其他联邦参与者的私有节点属性,从而揭示其他联邦参与者的私有数据的子图。
需要说明的是,本申请实施例可以但不限于应用于健康、科学、社会、语言和艺术等领域中任何涉及检验FGL算法隐私泄露情况以保护安全性的场景下。
在本申请实施例中,通过获取虚拟数据,其中,虚拟数据由第一客户端通过对第二客户端的反馈信息进行匹配后得到,反馈信息为第二客户端在联邦学习训练过程中返回的邻居生成器的更新信息,第一客户端的角色为联邦学习训练过程中的攻击者,第二客户端的角色为联邦学习训练过程中的被攻击者,第一客户端与第二客户端共享邻居生成器,利用虚拟数据进行图联邦攻击,重构第二客户端的私有节点属性以及第一客户端与第二客户端之间的连接关系,进一步基于私有节点属性和连接关系,确定第二客户端发生隐私数据泄露。由于上述过程中所重构的联邦参与者中的被攻击者的私有节点属性和攻击者与被攻击者之间的连接关系能够揭示被攻击者是否发生了隐私数据泄露,本申请实施例达到了利用基于信息匹配的联邦图学习隐私攻击方法对存在邻居生成器共享关系的联邦参与者进行隐私数据泄露检测的目的,从而实现了对联邦图学习的联邦参与者进行更全面的数据隐私泄露检测、提高联邦学习安全性的技术效果,进而解决了相关技术中缺乏对联邦学习中图相关信息及邻居生成器共享所引发的隐私泄露的检测手段的技术问题。
在一种可选的实施例中,在步骤S21中,获取虚拟数据,包括如下方法步骤:
步骤S211,获取反馈信息;
步骤S212,对反馈信息进行梯度匹配,得到虚拟数据。
本申请实施例提供的PAG算法针对需要共享邻居生成器和节点嵌入的FGL训练过程,在联邦训练过程中补充缺失的邻居信息。PAG方法的目的是重建其他联邦参与者的私有节点属性和恢复节点之间的链接关系,为此,执行PAG攻击的参与者(即攻击者,AttackClient A)进行搜索并从目标参与者(即被攻击者,Victim Client V)处获取反馈信息,进一步对该反馈信息进行梯度匹配(Gradient Match),基于匹配度更高的反馈信息得到上述虚拟数据,该虚拟数据用于实现上述PAG方法的目的。
在一种可选的实施例中,在步骤S212中,对反馈信息进行梯度匹配,得到虚拟数据,包括如下方法步骤:
步骤S2121,基于反馈信息确定第一参数、第二参数和第三参数,其中,第一参数用于表示邻居生成器的合成节点特征向量,第二参数用于表示邻居生成器的关联参数,第三参数用于表示参与联邦学习训练过程的不同客户端之间传输的关联参数对应的梯度;
步骤S2122,利用第一参数、第二参数和第三参数确定目标函数;
步骤S2123,通过对目标函数进行优化,获取虚拟数据。
本申请实施例中,PAG算法对应的FGL隐私攻击过程包括两个阶段,第一阶段为节点属性重构,第二阶段为边推理。
图3是根据本申请实施例的一种可选的联邦图学习隐私攻击过程的示意图,如图3所示,在执行PAG的过程中,节点属性重构阶段,FGL的攻击客户端(即上述第一客户端,也即攻击者)接收目标客户端(即上述第二客户端)返回的反馈信息(也即邻居生成器的更新信息)。基于该反馈信息可以确定上述第一参数、上述第二参数和上述第三参数。
上述第一参数用于表示邻居生成器的合成节点特征向量,记为X(A);第二参数用于表示邻居生成器的关联参数,记为WHg(A);第三参数用于表示参与联邦学习训练过程的不同客户端之间传输的关联参数对应的梯度,记为TWHg(A)。
利用上述第一参数X(A)、上述第二参数WHg(A)和上述第三参数TWHg(A),确定待优化的目标函数L,如下述公式(1)所示:
Figure 830609DEST_PATH_IMAGE001
公式(1)
进一步地,对上述目标函数L进行优化,得到上述虚拟数据。对目标函数L进行优化的优化方法可以但不限于是常用的函数优化方法,如随机梯度下降法、动量算法、RMSProp算法和Adam算法等。
在一种可选的实施例中,在步骤S22中,利用虚拟数据进行图联邦攻击,重构第二客户端的私有节点属性以及第一客户端与第二客户端之间的连接关系,包括如下方法步骤:
步骤S221,基于虚拟数据进行图联邦攻击,重构第二客户端的私有节点属性;
步骤S222,获取待应用的映射函数,其中,映射函数用于确定私有节点属性与第二客户端的节点特征表示之间的对应关系;
步骤S223,利用私有节点属性和映射函数,重构第一客户端与第二客户端之间的连接关系。
在上述可选的实施例中,基于所获取的虚拟数据,执行PAG攻击,以重构被攻击者(即上述第二客户端)的私有节点属性。
进一步地,攻击者在自己的图数据上训练边预测模型(本例中采用attri2vec模型),并根据训练得到的attri2vec模型获取从上述被攻击者的私有节点属性到对应的节点特征表示的映射函数(即上述待应用的映射函数)。进一步地,基于边推理方法,利用上述被攻击者的私有节点属性和上述映射函数,重构得到攻击者(即第一客户端)和被攻击者(即第二客户端)之间的连接关系。
在一种可选的实施例中,在步骤S223中,利用私有节点属性和映射函数,重构第一客户端与第二客户端之间的连接关系,包括如下方法步骤:
步骤S2231,基于映射函数获取私有节点属性对应的节点特征表示;
步骤S2232,利用私有节点属性对应的节点特征表示,重构第一客户端与第二客户端之间的连接关系。
在上述可选的实施例中,在获取待应用的映射函数后,基于该映射函数,获取被攻击者(即第二客户端)的私有节点属性对应的节点特征表示。具体地,攻击者将上述待应用的映射函数应用于被攻击者的私有节点属性(数据集)上,得到该被攻击者的私有节点属性对应的节点特征表示。
进一步地,基于指定的重构方法,利用上述被攻击者的私有节点属性对应的节点特征表示,重构攻击者(即第一客户端)和被攻击者(即第二客户端)之间的连接关系。
在一种可选的实施例中,在步骤S2232中,利用私有节点属性对应的节点特征表示,重构第一客户端与第二客户端之间的连接关系,包括如下方法步骤:
步骤S22321,对私有节点属性对应的节点特征表示进行采样,得到第一样本和第二样本,其中,第一样本是用于训练图训练链接预测模型的正样本,第二样本是用于训练图训练链接预测模型的负样本;
步骤S22322,利用第一样本和第二样本构建边特征;
步骤S22323,基于边特征训练目标分类器,其中,目标分类器用于预测第一客户端与第二客户端之间存在边链接的概率;
步骤S22324,按照目标分类器的预测结果,重构第一客户端与第二客户端之间的连接关系。
在上述可选的实施例中,获得被攻击者的私有节点属性的节点特征表示后,通过负采样方法对被攻击者的私有节点属性对应的节点特征表示进行采样,得到训练边预测模型(即上述图训练连接预设模型,本例中采用attri2vec模型)所需要的训练集,该训练集包括正样本(即上述第一样本)和负样本(即上述第二样本)。
上述边链接用于描述不同私有节点属性之间的关联关系。仍然以金融风控场景为例,上述边链接可以是不同账户之间的转账关系。上述正样本可以是不同私有节点属性之间已知的关联关系,例如:账户A与账户B之间存在已知的转账关系。上述负样本可以是随机设定不同私有节点属性之间的关联关系(该关联关系原本并不存在),例如:账户A与账户C之间原本并不存在转账关系,此处可以设定账户A与账户C之间原本存在转账关系,并以此作为负样本。进一步地,基于上述用于训练attri2vec模型的训练集(包括上述正样本和上述负样本),通过以下公式(2)来构建训练集的边特征:
Figure 482170DEST_PATH_IMAGE002
公式(2)
在上述公式(2)中,rij表示训练集中第i个重构节点和第j个重构节点之间的边特征,avi表示训练集中第i个重构节点的特征表示,avj表示训练集中第j个重构节点的特征表示。
进一步地,在构建上述用于训练attri2vec模型的训练集的边特征后,在边特征上训练一个分类器f(即上述目标分类器),该分类器f用于预测FGL中攻击者和被攻击者之间的存在边链接的概率。通过已训练的分类器f对FGL中多个节点进行预测,并根据预测结果重构攻击者和被攻击者之间的连接关系,进而推断得到多个重构节点中的每一对重构节点之间是否存在边链接。
在一种可选的实施例中,在步骤S222中,获取映射函数,包括如下方法步骤:
步骤S2221,在第一客户端对应的子图上,对图训练链接预测模型进行训练,获取映射函数。
在上述可选的实施例中,在利用虚拟数据进行图联邦攻击,重构第二客户端的私有节点属性以及第一客户端与第二客户端之间的连接关系的过程中,攻击者基于自己的图数据,利用上述第一样本和上述第二样本训练图训练连接预测模型(也即边预测模型,本例中采用attri2vec模型),并根据训练得到的attri2vec模型获取从上述被攻击者的私有节点属性到对应的节点特征表示的映射函数(即上述待应用的映射函数)。上述attri2vec模型能够支持具有节点属性的节点特征表示的学习、支持节点分类以及支持节点之间的边预测。
在一种可选的实施例中,数据处理方法还包括如下方法步骤:
步骤S241,对初始预测模型进行随机初始化,得到初始化结果;
步骤S242,基于初始化结果,采用第一样本和第二样本对初始预测模型进行迭代训练,得到图训练链接预测模型。
在上述可选的实施例中,初始预测模型为预设的初始图训练链接预测模型(例如本例中采用初始的attri2vec模型)。对上述初始的attri2vec模型进行随机初始化,将初始化结果用于训练目标图训练链接预测模型(也即上述步骤S242中所得到的图训练链接预测模型)。
进一步地,基于初始化结果,采用第一样本(对私有节点属性对应的节点特征表示进行采样得到的上述正样本)和第二样本(对私有节点属性对应的节点特征表示进行采样得到的上述负样本)对初始预测模型进行迭代训练,得到上述目标图训练链接预测模型。
需要说明的是,由于对初始预设模型的迭代训练是基于随机初始化的结果进行的,进一步提升了迭代训练所得到的目标图训练连接预设模型的泛化能力,使得该目标图训练连接预设模型能够得到更准确的边预测结果。综上,在PAG攻击的边推理阶段中,攻击者恢复第一阶段中所获得的节点之间的链接关系。也就是说,在边推理过程中,通过推理重构节点之间的链接关系,进而重建被攻击者的私有数据子图。利用attri2vec模型,通过学习重构节点的节点表示来归纳恢复节点之间的链接关系。容易理解的是,与相关技术中基于图像和文本数据的常规FL重建隐私攻击相比,本申请实施例提供的PAG隐私攻击方法能够探索联邦图学习(FGL)中的隐私泄露攻击。
综上所述,本申请实施例提供的数据处理方法的有益效果在于:所提出的PAG隐私攻击算法能够重建联邦参与者的私有节点属性和重建节点之间的连接关系。
在一种可选的实施例中,通过终端设备提供一图形用户界面,图形用户界面所显示的内容至少部分地包含一图联邦攻击重构场景,数据处理方法还包括如下方法步骤:
步骤S251,响应作用于图形用户界面的第一触控操作,从多个候选客户端中选取第一客户端与第二客户端;
步骤S252,响应作用于图形用户界面的第二触控操作,控制第一客户端向第二客户端发起隐私攻击以获取虚拟数据;
步骤S253,利用虚拟数据进行图联邦攻击,重构私有节点属性和连接关系以确定第二客户端发生隐私数据泄露。
在上述可选的实施例中,上述图形用户界面所显示的图联邦攻击重构场景可以是联邦图学习(FGL)设定下执行图联邦攻击(PAG)以检测被攻击者是否发生数据隐私泄露的场景。
上述图形用户界面还包括第一控件(或第一触控区域),当检测到作用于第一控件(或第一触控区域)的第一触控操作时,从多个候选客户端中选取第一客户端与第二客户端。多个候选客户端为FGL训练过程中的多个联邦参与者客户端。上述第一客户端为多个联邦参与者中的隐私数据攻击者(也即执行PAG攻击的客户端)。上述第二客户端为多个联邦参与者中的隐私数据被攻击者(也即受到PAG攻击的客户端)。
上述图形用户界面还包括第二控件(或第二触控区域),当检测到作用于第二控件(或第二触控区域)的第二触控操作时,控制第一客户端向第二客户端发起隐私攻击以获取虚拟数据。具体地,在FGL训练过程中,第二客户端(被攻击者)返回邻居生成器的更新信息,并将该更新信息作为反馈信息发送至第一客户端(攻击者)。第一客户端对该反馈信息进行匹配,得到上述虚拟数据。
进一步地,利用上述虚拟数据进行图联邦攻击,重构被攻击者的私有节点属性和攻击者与被攻击者之间的连接关系。基于第二客户端(被攻击者)的私有节点属性和第一客户端(攻击者)与第二客户端之间的连接关系进行分析,判断第二客户端是否发生了隐私数据泄露,也即上述确定第二客户端发生隐私数据泄露。
需要说明的是,上述第一触控操作和上述第二触控操作均可以是用户用手指接触上述终端设备的显示屏并触控该终端设备的操作。该触控操作可以包括单点触控、多点触控,其中,每个触控点的触控操作可以包括点击、长按、重按、划动等。上述第一触控操作和上述第二触控操作还可以是通过鼠标、键盘等输入设备实现的触控操作。
在上述运行环境下,本申请提供了如图4所示的一种数据处理方法。图4是根据本申请实施例的另一种数据处理方法的流程图,如图4所示,该数据处理方法,包括:
步骤S41,获取金融风控虚拟数据,其中,金融风控虚拟数据由第一客户端通过对第二客户端的反馈信息进行匹配后得到,反馈信息为第二客户端在联邦学习训练过程中返回的邻居生成器的更新信息,第一客户端的角色为联邦学习训练过程中的攻击者,第二客户端的角色为联邦学习训练过程中的被攻击者,第一客户端与第二客户端共享邻居生成器;
步骤S42,利用金融风控虚拟数据进行图联邦攻击,重构第二客户端的私有节点属性以及第一客户端与第二客户端之间的连接关系;
步骤S43,基于私有节点属性和连接关系确定第二客户端在多个银行客户端之间进行联合风控的过程中发生隐私数据泄露。
在本申请实施例中,在金融领域的联合风控场景下,上述第一客户端为FGL中多个联邦参与者(也即多个客户端)中发起隐私攻击的客户端,也即联邦学习训练过程中的攻击者。上述第二客户端为多个联邦参与者中被攻击的客户端,也即联邦学习训练过程中的被攻击者。上述多个联邦参与者为多个银行客户端。
在FGL训练过程中,第二客户端(被攻击者)返回邻居生成器的更新信息,并将该更新信息作为反馈信息发送至第一客户端(攻击者)。第一客户端对该反馈信息进行匹配,得到上述金融风控虚拟数据。
根据FedSage+算法中为防止隐私泄露设计的机制,需要联邦参与者共享邻居生成器来确保对缺失邻居的情况进行修复。也就是说,上述第一客户端(攻击者)与第二客户端(被攻击者)共享邻居生成器。但是,在FGL中多个联邦参与者共享邻居生成器会引发额外的隐私泄露问题。
根据本申请实施例提供的上述方法,利用上述金融风控虚拟数据进行图联邦攻击(PAG),进而能够重构第二客户端(被攻击者)的私有节点属性,还能够重构第一客户端(攻击者)与第二客户端之间的连接关系。
进一步地,基于第二客户端(被攻击者)的私有节点属性和第一客户端(攻击者)与第二客户端之间的连接关系进行分析,判断第二客户端在多个银行客户端之间进行联合风控的过程中是否发生了隐私数据泄露,也即上述确定第二客户端在多个银行客户端之间进行联合风控的过程中发生隐私数据泄露。
综上,本申请提出的PAG算法能够针对FGL进行新型数据重构攻击,在新型数据重构攻击中,攻击者能够重构其他联邦参与者的私有节点属性,从而揭示其他联邦参与者的私有数据的子图。
在本申请实施例中,通过获取金融风控虚拟数据,其中,金融风控虚拟数据由第一客户端通过对第二客户端的反馈信息进行匹配后得到,反馈信息为第二客户端在联邦学习训练过程中返回的邻居生成器的更新信息,第一客户端的角色为联邦学习训练过程中的攻击者,第二客户端的角色为联邦学习训练过程中的被攻击者,第一客户端与第二客户端共享邻居生成器,利用金融风控虚拟数据进行图联邦攻击,重构第二客户端的私有节点属性以及第一客户端与第二客户端之间的连接关系,进一步基于私有节点属性和连接关系,确定第二客户端在多个银行客户端之间进行联合风控的过程中发生隐私数据泄露。由于上述过程中所重构的联邦参与者中的被攻击者的私有节点属性和攻击者与被攻击者之间的连接关系能够揭示被攻击者是否发生了隐私数据泄露,本申请实施例达到了在金融领域的联合风控场景下利用基于信息匹配的联邦图学习隐私攻击方法对存在邻居生成器共享关系的联邦参与者进行隐私数据泄露检测的目的,从而实现了在金融领域的联合风控场景下对联邦图学习的联邦参与者进行更全面的数据隐私泄露检测、提高联邦学习安全性的技术效果,进而解决了相关技术中缺乏对联邦学习中图相关信息及邻居生成器共享所引发的隐私泄露的检测手段的技术问题。
在一种可选的实施例中,通过终端设备提供一图形用户界面,图形用户界面所显示的内容至少部分地包含一金融领域联合风控场景,数据处理方法还包括如下方法步骤:
步骤S441,响应作用于图形用户界面的第一触控操作,从多个候选银行客户端中选取第一客户端与第二客户端;
步骤S442,响应作用于图形用户界面的第二触控操作,控制第一客户端向第二客户端发起金融风控隐私攻击以获取金融风控虚拟数据;
步骤S443,利用金融风控虚拟数据进行图联邦攻击,重构私有节点属性和连接关系以确定第二客户端在多个银行客户端之间进行联合风控的过程中发生隐私数据泄露。
在上述可选的实施例中,上述图形用户界面所显示的金融领域联合风控场景可以是金融领域的联邦图学习(FGL)设定下执行图联邦攻击(PAG)以检测被攻击者是否发生数据隐私泄露,进而进行联合风控的场景。
上述图形用户界面还包括第一控件(或第一触控区域),当检测到作用于第一控件(或第一触控区域)的第一触控操作时,从多个候选客户端中选取第一客户端与第二客户端。多个候选客户端为FGL训练过程中的多个联邦参与者客户端。上述第一客户端为多个联邦参与者中的隐私数据攻击者(也即执行PAG攻击的客户端)。上述第二客户端为多个联邦参与者中的隐私数据被攻击者(也即受到PAG攻击的客户端)。
上述图形用户界面还包括第二控件(或第二触控区域),当检测到作用于第二控件(或第二触控区域)的第二触控操作时,控制第一客户端向第二客户端发起金融风控隐私攻击以获取金融风控虚拟数据。具体地,在FGL训练过程中,第二客户端(被攻击者)返回邻居生成器的更新信息,并将该更新信息作为反馈信息发送至第一客户端(攻击者)。第一客户端对该反馈信息进行匹配,得到上述金融风控虚拟数据。
进一步地,利用上述金融风控虚拟数据进行图联邦攻击,重构被攻击者的私有节点属性和攻击者与被攻击者之间的连接关系。基于第二客户端(被攻击者)的私有节点属性和第一客户端(攻击者)与第二客户端之间的连接关系进行分析,判断第二客户端是否发生了隐私数据泄露,也即上述确定第二客户端在多个银行客户端之间进行联合风控的过程中发生隐私数据泄露。
需要说明的是,上述第一触控操作和上述第二触控操作均可以是用户用手指接触上述终端设备的显示屏并触控该终端设备的操作。该触控操作可以包括单点触控、多点触控,其中,每个触控点的触控操作可以包括点击、长按、重按、划动等。上述第一触控操作和上述第二触控操作还可以是通过鼠标、键盘等输入设备实现的触控操作。
在上述运行环境下,本申请提供了如图5所示的一种数据处理方法。图5是根据本申请实施例的又一种数据处理方法的流程图,如图5所示,该数据处理方法,包括:
步骤S51,获取商品推荐虚拟数据,其中,商品推荐虚拟数据由第一客户端通过对第二客户端的反馈信息进行匹配后得到,反馈信息为第二客户端在联邦学习训练过程中返回的邻居生成器的更新信息,第一客户端的角色为联邦学习训练过程中的攻击者,第二客户端的角色为联邦学习训练过程中的被攻击者,第一客户端与第二客户端共享邻居生成器;
步骤S52,利用商品推荐虚拟数据进行图联邦攻击,重构第二客户端的私有节点属性以及第一客户端与第二客户端之间的连接关系;
步骤S53,基于私有节点属性和连接关系确定第二客户端在多个商家客户端之间进行联合推荐的过程中发生隐私数据泄露。
在本申请实施例中,在电商领域的商品推荐场景下,上述第一客户端为FGL中多个联邦参与者(也即多个客户端)中发起隐私攻击的客户端,也即联邦学习训练过程中的攻击者。上述第二客户端为多个联邦参与者中被攻击的客户端,也即联邦学习训练过程中的被攻击者。上述多个联邦参与者为多个商家客户端。
在FGL训练过程中,第二客户端(被攻击者)返回邻居生成器的更新信息,并将该更新信息作为反馈信息发送至第一客户端(攻击者)。第一客户端对该反馈信息进行匹配,得到上述商品推荐虚拟数据。
根据FedSage+算法中为防止隐私泄露设计的机制,需要联邦参与者共享邻居生成器来确保对缺失邻居的情况进行修复。也就是说,上述第一客户端(攻击者)与第二客户端(被攻击者)共享邻居生成器。但是,在FGL中多个联邦参与者共享邻居生成器会引发额外的隐私泄露问题。
根据本申请实施例提供的上述方法,利用上述商品推荐虚拟数据进行图联邦攻击(PAG),进而能够重构第二客户端(被攻击者)的私有节点属性,还能够重构第一客户端(攻击者)与第二客户端之间的连接关系。
进一步地,基于第二客户端(被攻击者)的私有节点属性和第一客户端(攻击者)与第二客户端之间的连接关系进行分析,判断第二客户端在多个商家客户端之间进行联合推荐的过程中是否发生了隐私数据泄露,也即上述确定第二客户端在多个商家客户端之间进行联合推荐的过程中发生隐私数据泄露。
综上,本申请提出的PAG算法能够针对FGL进行新型数据重构攻击,在新型数据重构攻击中,攻击者能够重构其他联邦参与者的私有节点属性,从而揭示其他联邦参与者的私有数据的子图。
在本申请实施例中,通过获取商品推荐虚拟数据,其中,商品推荐虚拟数据由第一客户端通过对第二客户端的反馈信息进行匹配后得到,反馈信息为第二客户端在联邦学习训练过程中返回的邻居生成器的更新信息,第一客户端的角色为联邦学习训练过程中的攻击者,第二客户端的角色为联邦学习训练过程中的被攻击者,第一客户端与第二客户端共享邻居生成器,利用商品推荐虚拟数据进行图联邦攻击,重构第二客户端的私有节点属性以及第一客户端与第二客户端之间的连接关系,进一步基于私有节点属性和连接关系,确定第二客户端在多个商家客户端之间进行联合推荐的过程中发生隐私数据泄露。由于上述过程中所重构的联邦参与者中的被攻击者的私有节点属性和攻击者与被攻击者之间的连接关系能够揭示被攻击者是否发生了隐私数据泄露,本申请实施例达到了在电商领域的商品推荐场景下下利用基于信息匹配的联邦图学习隐私攻击方法对存在邻居生成器共享关系的联邦参与者进行隐私数据泄露检测的目的,从而实现了在电商领域的商品推荐场景下对联邦图学习的联邦参与者进行更全面的数据隐私泄露检测、提高联邦学习安全性的技术效果,进而解决了相关技术中缺乏对联邦学习中图相关信息及邻居生成器共享所引发的隐私泄露的检测手段的技术问题。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
实施例2
根据本申请实施例,还提供了一种用于实施上述数据处理方法的装置实施例,图6是根据本申请实施例的一种数据处理装置的结构示意图,如图6所示,该装置包括:获取模块601、重构模块602和确定模块603,其中,获取模块601,用于获取虚拟数据,其中,虚拟数据由第一客户端通过对第二客户端的反馈信息进行匹配后得到,虚拟数据用于重构第二客户端的私有节点属性,反馈信息为第二客户端在联邦学习训练过程中返回的邻居生成器的更新信息,第一客户端的角色为联邦学习训练过程中的攻击者,第二客户端的角色为联邦学习训练过程中的被攻击者,第一客户端与第二客户端共享邻居生成器;重构模块602,用于利用虚拟数据进行图联邦攻击,重构第二客户端的私有节点属性以及第一客户端与第二客户端之间的连接关系;确定模块603,用于基于私有节点属性和连接关系,确定第二客户端发生隐私数据泄露。
可选地,上述获取模块601还用于:获取反馈信息;对反馈信息进行梯度匹配,得到虚拟数据。
可选地,上述获取模块601还用于:基于反馈信息确定第一参数、第二参数和第三参数,其中,第一参数用于表示邻居生成器的合成节点特征向量,第二参数用于表示邻居生成器的关联参数,第三参数用于表示参与联邦学习训练过程的不同客户端之间传输的关联参数对应的梯度;利用第一参数、第二参数和第三参数确定目标函数;通过对目标函数进行优化,获取虚拟数据。
可选地,上述重构模块602还用于:基于虚拟数据进行图联邦攻击,重构第二客户端的私有节点属性;获取待应用的映射函数,其中,映射函数用于确定私有节点属性与第二客户端的节点特征表示之间的对应关系;利用私有节点属性和映射函数,重构第一客户端与第二客户端之间的连接关系。
可选地,上述重构模块602还用于:基于映射函数获取私有节点属性对应的节点特征表示;利用私有节点属性对应的节点特征表示,重构第一客户端与第二客户端之间的连接关系。
可选地,上述重构模块602还用于:对私有节点属性对应的节点特征表示进行采样,得到第一样本和第二样本,其中,第一样本是用于训练图训练链接预测模型的正样本,第二样本是用于训练图训练链接预测模型的负样本;利用第一样本和第二样本构建边特征;基于边特征训练目标分类器,其中,目标分类器用于预测第一客户端与第二客户端之间存在边链接的概率;按照目标分类器的预测结果,重构第一客户端与第二客户端之间的连接关系。
可选地,上述重构模块602还用于:在第一客户端对应的子图上,对图训练链接预测模型进行训练,获取映射函数。
可选地,上述重构模块602还包括:初始化单元(图中未示出),用于对初始预测模型进行随机初始化,得到初始化结果;基于所述初始化结果,采用所述第一样本和所述第二样本对所述初始预测模型进行迭代训练,得到所述图训练链接预测模型。
可选地,图7是根据本申请实施例的一种可选的数据处理装置的结构示意图,如图7所示,该装置除包括图6所示的所有模块外,还包括:显示模块604,用于响应作用于图形用户界面的第一触控操作,从多个候选客户端中选取第一客户端与第二客户端;响应作用于图形用户界面的第二触控操作,控制第一客户端向第二客户端发起隐私攻击以获取虚拟数据;利用虚拟数据进行图联邦攻击,重构私有节点属性和连接关系以确定第二客户端发生隐私数据泄露。
此处需要说明的是,上述获取模块601、重构模块602和确定模块603对应于实施例1中的步骤S21至步骤S23,三个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。
在本申请实施例中,通过获取虚拟数据,其中,虚拟数据由第一客户端通过对第二客户端的反馈信息进行匹配后得到,虚拟数据用于重构第二客户端的私有节点属性,反馈信息为第二客户端在联邦学习训练过程中返回的邻居生成器的更新信息,第一客户端的角色为联邦学习训练过程中的攻击者,第二客户端的角色为联邦学习训练过程中的被攻击者,第一客户端与第二客户端共享邻居生成器,利用虚拟数据进行图联邦攻击,重构第二客户端的私有节点属性以及第一客户端与第二客户端之间的连接关系,进一步基于私有节点属性和连接关系,确定第二客户端发生隐私数据泄露。由于上述过程中所重构的联邦参与者中的被攻击者的私有节点属性和攻击者与被攻击者之间的连接关系能够揭示被攻击者是否发生了隐私数据泄露,本申请实施例达到了利用基于信息匹配的联邦图学习隐私攻击方法对存在邻居生成器共享关系的联邦参与者进行隐私数据泄露检测的目的,从而实现了对联邦图学习的联邦参与者进行更全面的数据隐私泄露检测、提高联邦学习安全性的技术效果,进而解决了相关技术中缺乏对联邦学习中图相关信息及邻居生成器共享所引发的隐私泄露的检测手段的技术问题。
根据本申请实施例,还提供了一种用于实施上述另一种数据处理方法的装置实施例,图8是根据本申请实施例的另一种数据处理装置的结构示意图,如图8所示,该装置包括:获取模块801、重构模块802和确定模块803,其中,获取模块801,用于获取金融风控虚拟数据,其中,金融风控虚拟数据由第一客户端通过对第二客户端的反馈信息进行匹配后得到,反馈信息为第二客户端在联邦学习训练过程中返回的邻居生成器的更新信息,第一客户端的角色为联邦学习训练过程中的攻击者,第二客户端的角色为联邦学习训练过程中的被攻击者,第一客户端与第二客户端共享邻居生成器;重构模块802,用于利用金融风控虚拟数据进行图联邦攻击,重构第二客户端的私有节点属性以及第一客户端与第二客户端之间的连接关系;确定模块803,用于基于私有节点属性和连接关系确定第二客户端在多个银行客户端之间进行联合风控的过程中发生隐私数据泄露。
可选地,图9是根据本申请实施例的另一种可选的数据处理装置的结构示意图,如图9所示,该装置除包括图8所示的所有模块外,还包括:显示模块804,用于响应作用于图形用户界面的第一触控操作,从多个候选银行客户端中选取第一客户端与第二客户端;响应作用于图形用户界面的第二触控操作,控制第一客户端向第二客户端发起金融风控隐私攻击以获取金融风控虚拟数据;利用金融风控虚拟数据进行图联邦攻击,重构私有节点属性和连接关系以确定第二客户端在多个银行客户端之间进行联合风控的过程中发生隐私数据泄露。
此处需要说明的是,上述获取模块801、重构模块801和确定模块803对应于实施例1中的步骤S41至步骤S43,三个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。
在本申请实施例中,通过获取金融风控虚拟数据,其中,金融风控虚拟数据由第一客户端通过对第二客户端的反馈信息进行匹配后得到,反馈信息为第二客户端在联邦学习训练过程中返回的邻居生成器的更新信息,第一客户端的角色为联邦学习训练过程中的攻击者,第二客户端的角色为联邦学习训练过程中的被攻击者,第一客户端与第二客户端共享邻居生成器,利用金融风控虚拟数据进行图联邦攻击,重构第二客户端的私有节点属性以及第一客户端与第二客户端之间的连接关系,进一步基于私有节点属性和连接关系,确定第二客户端在多个银行客户端之间进行联合风控的过程中发生隐私数据泄露。由于上述过程中所重构的联邦参与者中的被攻击者的私有节点属性和攻击者与被攻击者之间的连接关系能够揭示被攻击者是否发生了隐私数据泄露,本申请实施例达到了在金融领域的联合风控场景下利用基于信息匹配的联邦图学习隐私攻击方法对存在邻居生成器共享关系的联邦参与者进行隐私数据泄露检测的目的,从而实现了在金融领域的联合风控场景下对联邦图学习的联邦参与者进行更全面的数据隐私泄露检测、提高联邦学习安全性的技术效果,进而解决了相关技术中缺乏对联邦学习中图相关信息及邻居生成器共享所引发的隐私泄露的检测手段的技术问题。
根据本申请实施例,还提供了一种用于实施上述又一种数据处理方法的装置实施例,图10是根据本申请实施例的又一种数据处理装置的结构示意图,如图10所示,该装置包括:获取模块1001、重构模块1002和确定模块1003,其中,获取模块1001,用于获取商品推荐虚拟数据,其中,商品推荐虚拟数据由第一客户端通过对第二客户端的反馈信息进行匹配后得到,反馈信息为第二客户端在联邦学习训练过程中返回的邻居生成器的更新信息,第一客户端的角色为联邦学习训练过程中的攻击者,第二客户端的角色为联邦学习训练过程中的被攻击者,第一客户端与第二客户端共享邻居生成器;重构模块1002,用于利用商品推荐虚拟数据进行图联邦攻击,重构第二客户端的私有节点属性以及第一客户端与第二客户端之间的连接关系;确定模块1003,用于基于私有节点属性和连接关系确定第二客户端在多个商家客户端之间进行联合推荐的过程中发生隐私数据泄露。
此处需要说明的是,上述获取模块1001、重构模块1002和确定模块1003对应于实施例1中的步骤S51至步骤S53,三个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。
在本申请实施例中,通过获取商品推荐虚拟数据,其中,商品推荐虚拟数据由第一客户端通过对第二客户端的反馈信息进行匹配后得到,反馈信息为第二客户端在联邦学习训练过程中返回的邻居生成器的更新信息,第一客户端的角色为联邦学习训练过程中的攻击者,第二客户端的角色为联邦学习训练过程中的被攻击者,第一客户端与第二客户端共享邻居生成器,利用商品推荐虚拟数据进行图联邦攻击,重构第二客户端的私有节点属性以及第一客户端与第二客户端之间的连接关系,进一步基于私有节点属性和连接关系,确定第二客户端在多个商家客户端之间进行联合推荐的过程中发生隐私数据泄露。由于上述过程中所重构的联邦参与者中的被攻击者的私有节点属性和攻击者与被攻击者之间的连接关系能够揭示被攻击者是否发生了隐私数据泄露,本申请实施例达到了在电商领域的商品推荐场景下下利用基于信息匹配的联邦图学习隐私攻击方法对存在邻居生成器共享关系的联邦参与者进行隐私数据泄露检测的目的,从而实现了在电商领域的商品推荐场景下对联邦图学习的联邦参与者进行更全面的数据隐私泄露检测、提高联邦学习安全性的技术效果,进而解决了相关技术中缺乏对联邦学习中图相关信息及邻居生成器共享所引发的隐私泄露的检测手段的技术问题。
需要说明的是,本实施例的优选实施方式可以参见实施例1中的相关描述,此处不再赘述。
实施例3
根据本申请实施例,还提供了一种电子设备的实施例,该电子设备可以是计算设备群中的任意一个计算设备。该电子设备包括:处理器和存储器,其中:
存储器,与上述处理器连接,用于为上述处理器提供处理以下处理步骤的指令:获取虚拟数据,其中,虚拟数据由第一客户端通过对第二客户端的反馈信息进行匹配后得到,虚拟数据用于重构第二客户端的私有节点属性,反馈信息为第二客户端在联邦学习训练过程中返回的邻居生成器的更新信息,第一客户端的角色为联邦学习训练过程中的攻击者,第二客户端的角色为联邦学习训练过程中的被攻击者,第一客户端与第二客户端共享邻居生成器;利用虚拟数据进行图联邦攻击,重构第二客户端的私有节点属性以及第一客户端与第二客户端之间的连接关系;基于私有节点属性和连接关系,确定第二客户端发生隐私数据泄露。
在本申请实施例中,通过获取虚拟数据,其中,虚拟数据由第一客户端通过对第二客户端的反馈信息进行匹配后得到,虚拟数据用于重构第二客户端的私有节点属性,反馈信息为第二客户端在联邦学习训练过程中返回的邻居生成器的更新信息,第一客户端的角色为联邦学习训练过程中的攻击者,第二客户端的角色为联邦学习训练过程中的被攻击者,第一客户端与第二客户端共享邻居生成器,利用虚拟数据进行图联邦攻击,重构第二客户端的私有节点属性以及第一客户端与第二客户端之间的连接关系,进一步基于私有节点属性和连接关系,确定第二客户端发生隐私数据泄露。由于上述过程中所重构的联邦参与者中的被攻击者的私有节点属性和攻击者与被攻击者之间的连接关系能够揭示被攻击者是否发生了隐私数据泄露,本申请实施例达到了利用基于信息匹配的联邦图学习隐私攻击方法对存在邻居生成器共享关系的联邦参与者进行隐私数据泄露检测的目的,从而实现了对联邦图学习的联邦参与者进行更全面的数据隐私泄露检测、提高联邦学习安全性的技术效果,进而解决了相关技术中缺乏对联邦学习中图相关信息及邻居生成器共享所引发的隐私泄露的检测手段的技术问题。
需要说明的是,本实施例的优选实施方式可以参见实施例1中的相关描述,此处不再赘述。
实施例4
本申请的实施例可以提供一种计算机终端,该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地,在本实施例中,上述计算机终端也可以替换为移动终端等终端设备。
可选地,在本实施例中,上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。
在本实施例中,上述计算机终端可以执行数据处理方法中以下步骤的程序代码:获取虚拟数据,其中,虚拟数据由第一客户端通过对第二客户端的反馈信息进行匹配后得到,虚拟数据用于重构第二客户端的私有节点属性,反馈信息为第二客户端在联邦学习训练过程中返回的邻居生成器的更新信息,第一客户端的角色为联邦学习训练过程中的攻击者,第二客户端的角色为联邦学习训练过程中的被攻击者,第一客户端与第二客户端共享邻居生成器;利用虚拟数据进行图联邦攻击,重构第二客户端的私有节点属性以及第一客户端与第二客户端之间的连接关系;基于私有节点属性和连接关系,确定第二客户端发生隐私数据泄露。
可选地,图11是根据本申请实施例的另一种计算机终端的结构框图,如图11所示,该计算机终端可以包括:一个或多个(图中仅示出一个)处理器122、存储器124、以及外设接口126。
其中,存储器可用于存储软件程序以及模块,如本申请实施例中的数据处理方法和装置对应的程序指令/模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的数据处理方法。存储器可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:获取虚拟数据,其中,虚拟数据由第一客户端通过对第二客户端的反馈信息进行匹配后得到,虚拟数据用于重构第二客户端的私有节点属性,反馈信息为第二客户端在联邦学习训练过程中返回的邻居生成器的更新信息,第一客户端的角色为联邦学习训练过程中的攻击者,第二客户端的角色为联邦学习训练过程中的被攻击者,第一客户端与第二客户端共享邻居生成器;利用虚拟数据进行图联邦攻击,重构第二客户端的私有节点属性以及第一客户端与第二客户端之间的连接关系;基于私有节点属性和连接关系,确定第二客户端发生隐私数据泄露。
可选地,上述处理器还可以执行如下步骤的程序代码:获取反馈信息;对反馈信息进行梯度匹配,得到虚拟数据。
可选地,上述处理器还可以执行如下步骤的程序代码:基于反馈信息确定第一参数、第二参数和第三参数,其中,第一参数用于表示邻居生成器的合成节点特征向量,第二参数用于表示邻居生成器的关联参数,第三参数用于表示参与联邦学习训练过程的不同客户端之间传输的关联参数对应的梯度;利用第一参数、第二参数和第三参数确定目标函数;通过对目标函数进行优化,获取虚拟数据。
可选地,上述处理器还可以执行如下步骤的程序代码:基于虚拟数据进行图联邦攻击,重构第二客户端的私有节点属性;获取待应用的映射函数,其中,映射函数用于确定私有节点属性与第二客户端的节点特征表示之间的对应关系;利用私有节点属性和映射函数,重构第一客户端与第二客户端之间的连接关系。
可选地,上述处理器还可以执行如下步骤的程序代码:基于映射函数获取私有节点属性对应的节点特征表示;利用私有节点属性对应的节点特征表示,重构第一客户端与第二客户端之间的连接关系。
可选地,上述处理器还可以执行如下步骤的程序代码:对私有节点属性对应的节点特征表示进行采样,得到第一样本和第二样本,其中,第一样本是用于训练图训练链接预测模型的正样本,第二样本是用于训练图训练链接预测模型的负样本;利用第一样本和第二样本构建边特征;基于边特征训练目标分类器,其中,目标分类器用于预测第一客户端与第二客户端之间存在边链接的概率;按照目标分类器的预测结果,重构第一客户端与第二客户端之间的连接关系。
可选地,上述处理器还可以执行如下步骤的程序代码:在第一客户端对应的子图上,对图训练链接预测模型进行训练,获取映射函数。
可选地,上述处理器还可以执行如下步骤的程序代码:对初始预测模型进行随机初始化,得到初始化结果;基于所述初始化结果,采用所述第一样本和所述第二样本对所述初始预测模型进行迭代训练,得到所述图训练链接预测模型。
可选地,上述处理器还可以执行如下步骤的程序代码:响应作用于图形用户界面的第一触控操作,从多个候选客户端中选取第一客户端与第二客户端;响应作用于图形用户界面的第二触控操作,控制第一客户端向第二客户端发起隐私攻击以获取虚拟数据;利用虚拟数据进行图联邦攻击,重构私有节点属性和连接关系以确定第二客户端发生隐私数据泄露。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:获取金融风控虚拟数据,其中,金融风控虚拟数据由第一客户端通过对第二客户端的反馈信息进行匹配后得到,反馈信息为第二客户端在联邦学习训练过程中返回的邻居生成器的更新信息,第一客户端的角色为联邦学习训练过程中的攻击者,第二客户端的角色为联邦学习训练过程中的被攻击者,第一客户端与第二客户端共享邻居生成器;利用金融风控虚拟数据进行图联邦攻击,重构第二客户端的私有节点属性以及第一客户端与第二客户端之间的连接关系;基于私有节点属性和连接关系确定第二客户端在多个银行客户端之间进行联合风控的过程中发生隐私数据泄露。
可选地,上述处理器还可以执行如下步骤的程序代码:响应作用于图形用户界面的第一触控操作,从多个候选银行客户端中选取第一客户端与第二客户端;响应作用于图形用户界面的第二触控操作,控制第一客户端向第二客户端发起金融风控隐私攻击以获取金融风控虚拟数据;利用金融风控虚拟数据进行图联邦攻击,重构私有节点属性和连接关系以确定第二客户端在多个银行客户端之间进行联合风控的过程中发生隐私数据泄露。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:获取商品推荐虚拟数据,其中,商品推荐虚拟数据由第一客户端通过对第二客户端的反馈信息进行匹配后得到,反馈信息为第二客户端在联邦学习训练过程中返回的邻居生成器的更新信息,第一客户端的角色为联邦学习训练过程中的攻击者,第二客户端的角色为联邦学习训练过程中的被攻击者,第一客户端与第二客户端共享邻居生成器;利用商品推荐虚拟数据进行图联邦攻击,重构第二客户端的私有节点属性以及第一客户端与第二客户端之间的连接关系;基于私有节点属性和连接关系确定第二客户端在多个商家客户端之间进行联合推荐的过程中发生隐私数据泄露。
在本申请实施例中,通过获取虚拟数据,其中,虚拟数据由第一客户端通过对第二客户端的反馈信息进行匹配后得到,虚拟数据用于重构第二客户端的私有节点属性,反馈信息为第二客户端在联邦学习训练过程中返回的邻居生成器的更新信息,第一客户端的角色为联邦学习训练过程中的攻击者,第二客户端的角色为联邦学习训练过程中的被攻击者,第一客户端与第二客户端共享邻居生成器,利用虚拟数据进行图联邦攻击,重构第二客户端的私有节点属性以及第一客户端与第二客户端之间的连接关系,进一步基于私有节点属性和连接关系,确定第二客户端发生隐私数据泄露。由于上述过程中所重构的联邦参与者中的被攻击者的私有节点属性和攻击者与被攻击者之间的连接关系能够揭示被攻击者是否发生了隐私数据泄露,本申请实施例达到了利用基于信息匹配的联邦图学习隐私攻击方法对存在邻居生成器共享关系的联邦参与者进行隐私数据泄露检测的目的,从而实现了对联邦图学习的联邦参与者进行更全面的数据隐私泄露检测、提高联邦学习安全性的技术效果,进而解决了相关技术中缺乏对联邦学习中图相关信息及邻居生成器共享所引发的隐私泄露的检测手段的技术问题。
本领域普通技术人员可以理解,图11所示的结构仅为示意,计算机终端也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(MobileInternet Devices,MID)、PAD等终端设备。图11其并不对上述电子装置的结构造成限定。例如,计算机终端还可包括比图11中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图11所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、ROM、RAM、磁盘或光盘等。
根据本申请实施例,还提供了一种计算机可读存储介质的实施例。可选地,在本实施例中,上述计算机可读存储介质可以用于保存上述实施例1所提供的数据处理方法所执行的程序代码。
可选地,在本实施例中,上述计算机可读存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:获取虚拟数据,其中,虚拟数据由第一客户端通过对第二客户端的反馈信息进行匹配后得到,虚拟数据用于重构第二客户端的私有节点属性,反馈信息为第二客户端在联邦学习训练过程中返回的邻居生成器的更新信息,第一客户端的角色为联邦学习训练过程中的攻击者,第二客户端的角色为联邦学习训练过程中的被攻击者,第一客户端与第二客户端共享邻居生成器;利用虚拟数据进行图联邦攻击,重构第二客户端的私有节点属性以及第一客户端与第二客户端之间的连接关系;基于私有节点属性和连接关系,确定第二客户端发生隐私数据泄露。
可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:获取反馈信息;对反馈信息进行梯度匹配,得到虚拟数据。
可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:基于反馈信息确定第一参数、第二参数和第三参数,其中,第一参数用于表示邻居生成器的合成节点特征向量,第二参数用于表示邻居生成器的关联参数,第三参数用于表示参与联邦学习训练过程的不同客户端之间传输的关联参数对应的梯度;利用第一参数、第二参数和第三参数确定目标函数;通过对目标函数进行优化,获取虚拟数据。
可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:基于虚拟数据进行图联邦攻击,重构第二客户端的私有节点属性;获取待应用的映射函数,其中,映射函数用于确定私有节点属性与第二客户端的节点特征表示之间的对应关系;利用私有节点属性和映射函数,重构第一客户端与第二客户端之间的连接关系。
可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:基于映射函数获取私有节点属性对应的节点特征表示;利用私有节点属性对应的节点特征表示,重构第一客户端与第二客户端之间的连接关系。
可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:对私有节点属性对应的节点特征表示进行采样,得到第一样本和第二样本,其中,第一样本是用于训练图训练链接预测模型的正样本,第二样本是用于训练图训练链接预测模型的负样本;利用第一样本和第二样本构建边特征;基于边特征训练目标分类器,其中,目标分类器用于预测第一客户端与第二客户端之间存在边链接的概率;按照目标分类器的预测结果,重构第一客户端与第二客户端之间的连接关系。
可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:在第一客户端对应的子图上,对图训练链接预测模型进行训练,获取映射函数。
可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:对初始预测模型进行随机初始化,得到初始化结果;基于所述初始化结果,采用所述第一样本和所述第二样本对所述初始预测模型进行迭代训练,得到所述图训练链接预测模型。
可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:响应作用于图形用户界面的第一触控操作,从多个候选客户端中选取第一客户端与第二客户端;响应作用于图形用户界面的第二触控操作,控制第一客户端向第二客户端发起隐私攻击以获取虚拟数据;利用虚拟数据进行图联邦攻击,重构私有节点属性和连接关系以确定第二客户端发生隐私数据泄露。
可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:获取金融风控虚拟数据,其中,金融风控虚拟数据由第一客户端通过对第二客户端的反馈信息进行匹配后得到,反馈信息为第二客户端在联邦学习训练过程中返回的邻居生成器的更新信息,第一客户端的角色为联邦学习训练过程中的攻击者,第二客户端的角色为联邦学习训练过程中的被攻击者,第一客户端与第二客户端共享邻居生成器;利用金融风控虚拟数据进行图联邦攻击,重构第二客户端的私有节点属性以及第一客户端与第二客户端之间的连接关系;基于私有节点属性和连接关系确定第二客户端在多个银行客户端之间进行联合风控的过程中发生隐私数据泄露。
可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:响应作用于图形用户界面的第一触控操作,从多个候选银行客户端中选取第一客户端与第二客户端;响应作用于图形用户界面的第二触控操作,控制第一客户端向第二客户端发起金融风控隐私攻击以获取金融风控虚拟数据;利用金融风控虚拟数据进行图联邦攻击,重构私有节点属性和连接关系以确定第二客户端在多个银行客户端之间进行联合风控的过程中发生隐私数据泄露。
可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:获取商品推荐虚拟数据,其中,商品推荐虚拟数据由第一客户端通过对第二客户端的反馈信息进行匹配后得到,反馈信息为第二客户端在联邦学习训练过程中返回的邻居生成器的更新信息,第一客户端的角色为联邦学习训练过程中的攻击者,第二客户端的角色为联邦学习训练过程中的被攻击者,第一客户端与第二客户端共享邻居生成器;利用商品推荐虚拟数据进行图联邦攻击,重构第二客户端的私有节点属性以及第一客户端与第二客户端之间的连接关系;基于私有节点属性和连接关系确定第二客户端在多个商家客户端之间进行联合推荐的过程中发生隐私数据泄露。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、ROM、RAM、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (14)

1.一种数据处理方法,其特征在于,包括:
获取虚拟数据,其中,所述虚拟数据由第一客户端通过对第二客户端的反馈信息进行匹配后得到,所述虚拟数据用于重构所述第二客户端的私有节点属性,所述反馈信息为所述第二客户端在联邦学习训练过程中返回的邻居生成器的更新信息,所述第一客户端的角色为联邦学习训练过程中的攻击者,所述第二客户端的角色为联邦学习训练过程中的被攻击者,所述第一客户端与所述第二客户端共享所述邻居生成器;
利用所述虚拟数据进行图联邦攻击,重构所述第二客户端的私有节点属性以及所述第一客户端与所述第二客户端之间的连接关系;
基于所述私有节点属性和所述连接关系,确定所述第二客户端发生隐私数据泄露。
2.根据权利要求1所述的数据处理方法,其特征在于,获取所述虚拟数据包括:
获取所述反馈信息;
对所述反馈信息进行梯度匹配,得到所述虚拟数据。
3.根据权利要求2所述的数据处理方法,其特征在于,对所述反馈信息进行梯度匹配,得到所述虚拟数据包括:
基于所述反馈信息确定第一参数、第二参数和第三参数,其中,所述第一参数用于表示所述邻居生成器的合成节点特征向量,所述第二参数用于表示所述邻居生成器的关联参数,所述第三参数用于表示参与联邦学习训练过程的不同客户端之间传输的所述关联参数对应的梯度;
利用所述第一参数、所述第二参数和所述第三参数确定目标函数;
通过对所述目标函数进行优化,获取所述虚拟数据。
4.根据权利要求1所述的数据处理方法,其特征在于,利用所述虚拟数据进行图联邦攻击,重构所述第二客户端的所述私有节点属性以及所述第一客户端与所述第二客户端之间的所述连接关系包括:
基于所述虚拟数据进行图联邦攻击,重构所述第二客户端的私有节点属性;
获取待应用的映射函数,其中,所述映射函数用于确定所述私有节点属性与所述第二客户端的节点特征表示之间的对应关系;
利用所述私有节点属性和所述映射函数,重构所述第一客户端与所述第二客户端之间的连接关系。
5.根据权利要求4所述的数据处理方法,其特征在于,利用所述私有节点属性和所述映射函数,重构所述第一客户端与所述第二客户端之间的所述连接关系包括:
基于所述映射函数获取所述私有节点属性对应的节点特征表示;
利用所述私有节点属性对应的节点特征表示,重构所述第一客户端与所述第二客户端之间的所述连接关系。
6.根据权利要求5所述的数据处理方法,其特征在于,利用所述私有节点属性对应的节点特征表示,重构所述第一客户端与所述第二客户端之间的所述连接关系包括:
对所述私有节点属性对应的节点特征表示进行采样,得到第一样本和第二样本,其中,所述第一样本是用于训练图训练链接预测模型的正样本,所述第二样本是用于训练所述图训练链接预测模型的负样本;
利用所述第一样本和所述第二样本构建边特征;
基于所述边特征训练目标分类器,其中,所述目标分类器用于预测所述第一客户端与所述第二客户端之间存在边链接的概率;
按照所述目标分类器的预测结果,重构所述第一客户端与所述第二客户端之间的所述连接关系。
7.根据权利要求6所述的数据处理方法,其特征在于,获取所述映射函数包括:
在所述第一客户端对应的子图上,对所述图训练链接预测模型进行训练,获取所述映射函数。
8.根据权利要求7所述的数据处理方法,其特征在于,所述数据处理方法还包括:
对初始预测模型进行随机初始化,得到初始化结果;
基于所述初始化结果,采用所述第一样本和所述第二样本对所述初始预测模型进行迭代训练,得到所述图训练链接预测模型。
9.根据权利要求1所述的数据处理方法,其特征在于,通过终端设备提供一图形用户界面,所述图形用户界面所显示的内容至少部分地包含一图联邦攻击重构场景,所述方法还包括:
响应作用于所述图形用户界面的第一触控操作,从多个候选客户端中选取所述第一客户端与所述第二客户端;
响应作用于所述图形用户界面的第二触控操作,控制所述第一客户端向所述第二客户端发起隐私攻击以获取所述虚拟数据;
利用所述虚拟数据进行图联邦攻击,重构所述私有节点属性和所述连接关系以确定所述第二客户端发生隐私数据泄露。
10.一种数据处理方法,其特征在于,包括:
获取金融风控虚拟数据,其中,所述金融风控虚拟数据由第一客户端通过对第二客户端的反馈信息进行匹配后得到,所述反馈信息为所述第二客户端在联邦学习训练过程中返回的邻居生成器的更新信息,所述第一客户端的角色为联邦学习训练过程中的攻击者,所述第二客户端的角色为联邦学习训练过程中的被攻击者,所述第一客户端与所述第二客户端共享所述邻居生成器;
利用所述金融风控虚拟数据进行图联邦攻击,重构所述第二客户端的私有节点属性以及所述第一客户端与所述第二客户端之间的连接关系;
基于所述私有节点属性和所述连接关系确定所述第二客户端在多个银行客户端之间进行联合风控的过程中发生隐私数据泄露。
11.根据权利要求10所述的数据处理方法,其特征在于,通过终端设备提供一图形用户界面,所述图形用户界面所显示的内容至少部分地包含一金融领域联合风控场景,所述方法还包括:
响应作用于所述图形用户界面的第一触控操作,从多个候选银行客户端中选取所述第一客户端与所述第二客户端;
响应作用于所述图形用户界面的第二触控操作,控制所述第一客户端向所述第二客户端发起金融风控隐私攻击以获取所述金融风控虚拟数据;
利用所述金融风控虚拟数据进行图联邦攻击,重构所述私有节点属性和所述连接关系以确定所述第二客户端在多个银行客户端之间进行联合风控的过程中发生隐私数据泄露。
12.一种数据处理方法,其特征在于,包括:
获取商品推荐虚拟数据,其中,所述商品推荐虚拟数据由第一客户端通过对第二客户端的反馈信息进行匹配后得到,所述反馈信息为所述第二客户端在联邦学习训练过程中返回的邻居生成器的更新信息,所述第一客户端的角色为联邦学习训练过程中的攻击者,所述第二客户端的角色为联邦学习训练过程中的被攻击者,所述第一客户端与所述第二客户端共享所述邻居生成器;
利用所述商品推荐虚拟数据进行图联邦攻击,重构所述第二客户端的私有节点属性以及所述第一客户端与所述第二客户端之间的连接关系;
基于所述私有节点属性和所述连接关系确定所述第二客户端在多个商家客户端之间进行联合推荐的过程中发生隐私数据泄露。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至12中任意一项所述的数据处理方法。
14.一种电子设备,其特征在于,包括:
处理器;以及
存储器,与所述处理器连接,用于为所述处理器提供处理以下处理步骤的指令:
获取虚拟数据,其中,所述虚拟数据由第一客户端通过对第二客户端的反馈信息进行匹配后得到,所述反馈信息为所述第二客户端在联邦学习训练过程中返回的邻居生成器的更新信息,所述第一客户端的角色为联邦学习训练过程中的攻击者,所述第二客户端的角色为联邦学习训练过程中的被攻击者,所述第一客户端与所述第二客户端共享所述邻居生成器;
利用所述虚拟数据进行图联邦攻击,重构所述第二客户端的私有节点属性以及所述第一客户端与所述第二客户端之间的连接关系;
基于所述私有节点属性和所述连接关系,确定所述第二客户端发生隐私数据泄露。
CN202211587360.7A 2022-12-12 2022-12-12 数据处理方法、存储介质和电子设备 Active CN115600250B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211587360.7A CN115600250B (zh) 2022-12-12 2022-12-12 数据处理方法、存储介质和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211587360.7A CN115600250B (zh) 2022-12-12 2022-12-12 数据处理方法、存储介质和电子设备

Publications (2)

Publication Number Publication Date
CN115600250A true CN115600250A (zh) 2023-01-13
CN115600250B CN115600250B (zh) 2023-03-21

Family

ID=84853285

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211587360.7A Active CN115600250B (zh) 2022-12-12 2022-12-12 数据处理方法、存储介质和电子设备

Country Status (1)

Country Link
CN (1) CN115600250B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110008696A (zh) * 2019-03-29 2019-07-12 武汉大学 一种面向深度联邦学习的用户数据重建攻击方法
CN111460511A (zh) * 2020-04-17 2020-07-28 支付宝(杭州)信息技术有限公司 基于隐私保护的联邦学习、虚拟对象分配方法和装置
CN112714106A (zh) * 2020-12-17 2021-04-27 杭州趣链科技有限公司 一种基于区块链的联邦学习搭便车攻击防御方法
CN114021188A (zh) * 2021-11-04 2022-02-08 全球能源互联网研究院有限公司南京分公司 一种联邦学习协议交互安全验证方法、装置及电子设备
CN114357504A (zh) * 2021-11-26 2022-04-15 北京邮电大学 基于隐私保护的联邦学习方法以及相关设备
CN114580009A (zh) * 2022-01-13 2022-06-03 吉林省元依科技有限公司 基于联邦学习的区块链数据管理方法、系统及存储介质
WO2022116933A1 (zh) * 2020-12-04 2022-06-09 华为技术有限公司 一种训练模型的方法、数据处理的方法以及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110008696A (zh) * 2019-03-29 2019-07-12 武汉大学 一种面向深度联邦学习的用户数据重建攻击方法
CN111460511A (zh) * 2020-04-17 2020-07-28 支付宝(杭州)信息技术有限公司 基于隐私保护的联邦学习、虚拟对象分配方法和装置
WO2022116933A1 (zh) * 2020-12-04 2022-06-09 华为技术有限公司 一种训练模型的方法、数据处理的方法以及装置
CN112714106A (zh) * 2020-12-17 2021-04-27 杭州趣链科技有限公司 一种基于区块链的联邦学习搭便车攻击防御方法
CN114021188A (zh) * 2021-11-04 2022-02-08 全球能源互联网研究院有限公司南京分公司 一种联邦学习协议交互安全验证方法、装置及电子设备
CN114357504A (zh) * 2021-11-26 2022-04-15 北京邮电大学 基于隐私保护的联邦学习方法以及相关设备
CN114580009A (zh) * 2022-01-13 2022-06-03 吉林省元依科技有限公司 基于联邦学习的区块链数据管理方法、系统及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘俊旭;孟小峰;: "机器学习的隐私保护研究综述" *
周俊;方国英;吴楠;: "联邦学习安全与隐私保护研究综述" *

Also Published As

Publication number Publication date
CN115600250B (zh) 2023-03-21

Similar Documents

Publication Publication Date Title
Rey et al. Federated learning for malware detection in IoT devices
Naeem et al. Malware detection in industrial internet of things based on hybrid image visualization and deep learning model
Gai et al. A survey on FinTech
CN114331829A (zh) 一种对抗样本生成方法、装置、设备以及可读存储介质
Huang et al. Robustness of on-device models: Adversarial attack to deep learning models on android apps
CN114547415A (zh) 工业物联网中基于网络威胁情报的攻击模拟方法
EP4189917A1 (en) Techniques for identity data characterization for data protection
CN116010684A (zh) 物品推荐方法、装置及存储介质
CN110543756B (zh) 设备识别方法、装置、存储介质及电子设备
Krishnan et al. Detection and defending the XSS attack using novel hybrid stacking ensemble learning-based DNN approach
CN115796229A (zh) 图节点的嵌入方法、系统、设备及存储介质
Banković et al. Distributed intrusion detection system for wireless sensor networks based on a reputation system coupled with kernel self-organizing maps
CN113191478A (zh) 神经网络模型的训练方法、装置和系统
Turukmane et al. M-MultiSVM: An efficient feature selection assisted network intrusion detection system using machine learning
Zhen et al. Intelligent-based ensemble deep learning model for security improvement in real-time wireless communication
Singh et al. How Safe You Are on Social Networks?
CN115600250B (zh) 数据处理方法、存储介质和电子设备
Nevrataki et al. A survey on federated learning applications in healthcare, finance, and data privacy/data security
Jose et al. DOMAIN-based intelligent network intrusion detection system
Nguyen et al. Feature representation of autoencoders for unsupervised iot malware detection
Anandhi et al. Performance evaluation of deep neural network on malware detection: visual feature approach
Kumar et al. An ANFIS-based compatibility scorecard for IoT integration in websites
CN112860986A (zh) 向服务的用户生成单独内容的系统和方法
CN115587257B (zh) 模型超参数优化方法、存储介质和电子设备
Parameswari et al. Hybrid rat swarm hunter prey optimization trained deep learning for network intrusion detection using CNN features

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant