CN110874646B - 一种联邦学习的异常处理方法、装置及电子设备 - Google Patents

一种联邦学习的异常处理方法、装置及电子设备 Download PDF

Info

Publication number
CN110874646B
CN110874646B CN202010047742.5A CN202010047742A CN110874646B CN 110874646 B CN110874646 B CN 110874646B CN 202010047742 A CN202010047742 A CN 202010047742A CN 110874646 B CN110874646 B CN 110874646B
Authority
CN
China
Prior art keywords
member object
target
target member
communication
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010047742.5A
Other languages
English (en)
Other versions
CN110874646A (zh
Inventor
刘磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202110009946.4A priority Critical patent/CN112734045B/zh
Priority to CN202010047742.5A priority patent/CN110874646B/zh
Publication of CN110874646A publication Critical patent/CN110874646A/zh
Application granted granted Critical
Publication of CN110874646B publication Critical patent/CN110874646B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Bioethics (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本说明书实施例提供一种联邦学习的异常处理方法、装置及电子设备。方法包括:基于目标联邦学习的第一目标成员对象与目标联邦学习的第二目标成员对象在参与目标联邦学习时的通信记录,确定第一目标成员对象与第二目标成员对象之间的通信特征序列。将第一目标成员对象与第二目标成员对象之间的通信特征序列输入至异常识别模型,得到第一目标成员对象与第二目标成员对象的异常识别结果,异常识别模型是基于样本数据和预先为样本数据标注的异常分类标签训练得到的,样本数据包括第一样本成员对象在远程控制第二样本成员时,与第二样本成员对象之间的通信特征序列。对第一目标成员对象和/或第二目标成员对象执行与异常识别结果相匹配的风控决策。

Description

一种联邦学习的异常处理方法、装置及电子设备
技术领域
本文件涉及人工智能技术领域,尤其涉及一种联邦学习的异常处理方法、装置及电子设备。
背景技术
联邦学习能够在保护机构私有数据隐私的基础上,实现机构之间联合建模,从而解决样本数据割裂的问题。目前,联邦学习系统在引入大量机构进行联合训练时,没有办法识别出训练作恶的成员对象,导致联邦学习模型的正确性无法得到保障。
发明内容
本说明书实施例目的是提供一种联邦学习的异常处理方法、装置及电子设备,能够识别出联邦学习训练过程中异常的成员对象(例如作恶成员对象),并采取相应的风控措施进行处理。
为了实现上述目的,本说明书实施例是这样实现的:
第一方面,提供一种联邦学习的异常处理方法,包括:
基于目标联邦学习的第一目标成员对象与所述目标联邦学习的第二目标成员对象在参与所述目标联邦学习时的通信记录,确定所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列;
将所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列输入至异常识别模型,得到所述第一目标成员对象与所述第二目标成员对象的异常识别结果,其中,所述异常识别模型是基于样本数据和预先为所述样本数据标注的异常分类标签训练得到的,所述样本数据包括第一样本成员对象在远程控制第二样本成员时,与所述第二样本成员对象之间的通信特征序列;
对所述第一目标成员对象和/或所述第二目标成员对象执行与所述异常识别结果相匹配的风控决策。
第二方面,提供一种联邦学习的异常处理装置,包括:
特征确定模块,基于目标联邦学习的第一目标成员对象与所述目标联邦学习的第二目标成员对象在参与所述目标联邦学习时的通信记录,确定所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列;
异常识别模块,将所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列输入至异常识别模型,得到所述第一目标成员对象与所述第二目标成员对象的异常识别结果,其中,所述异常识别模型是基于样本数据和预先为所述样本数据标注的异常分类标签训练得到的,第一样本成员对象在远程控制第二样本成员时,与所述第二样本成员对象之间的通信特征序列;
风控决策模块,对所述第一目标成员对象和/或所述第二目标成员对象执行与所述异常识别结果相匹配的风控决策。
第三方面,提供一种电子设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行:
基于目标联邦学习的第一目标成员对象与所述目标联邦学习的第二目标成员对象在参与所述目标联邦学习时的通信记录,确定所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列;
将所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列输入至异常识别模型,得到所述第一目标成员对象与所述第二目标成员对象的异常识别结果,其中,所述异常识别模型是基于样本数据和预先为所述样本数据标注的异常分类标签训练得到的,所述样本数据包括第一样本成员对象在远程控制第二样本成员时,与所述第二样本成员对象之间的通信特征序列;
对所述第一目标成员对象和/或所述第二目标成员对象执行与所述异常识别结果相匹配的风控决策。
第四方面,提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如下步骤:
基于目标联邦学习的第一目标成员对象与所述目标联邦学习的第二目标成员对象在参与所述目标联邦学习时的通信记录,确定所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列;
将所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列输入至异常识别模型,得到所述第一目标成员对象与所述第二目标成员对象的异常识别结果,其中,所述异常识别模型是基于样本数据和预先为所述样本数据标注的异常分类标签训练得到的,所述样本数据包括第一样本成员对象在远程控制第二样本成员时,与所述第二样本成员对象之间的通信特征序列;
对所述第一目标成员对象和/或所述第二目标成员对象执行与所述异常识别结果相匹配的风控决策。
本说明书实施例的方案利用深度学习模型,通过联邦学习训练过程中成员对象之间的通信特征序列,识别出发起远程控制的异常成员对象,从而对异常成员对象采取相应的风控措施,以保护联邦学习的训练不受破坏。在这种保护机制下,能够放心地引入更多的机构参与到联邦学习中来,可提高联邦学习的实用性和通用性。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书实施例中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为联邦学习的示意图。
图2为本说明书实施例提供的联邦学习的异常处理方法的流程示意图。
图3为本说明书实施例提供的联邦学习的异常处理装置的结构示意图。
图4为本说明书实施例提供的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
联邦学习系统在引入不同机构进行训练的同时,也给一些恶意机构提供了攻击机会。这些恶意机构在参与到联邦学习的训练过程中,会故意提供错误的中间参数,以破坏模型的正确性。为此,本文件旨在提供一种能够识别出联邦学习的异常成员对象(包含作恶成员对象),并采取相应的风控措施进行处理的技术方案。
为更方便理解本文件的方案,下面对联邦学习进行简单介绍。
参考图1,假设机构A和机构B联合训练一个机器学习模型,它们的业务系统分别拥有各自用户的相关数据。此外,机构B 还拥有模型需要预测的标签数据。出于数据隐私保护和安全考虑,A 和 B 无法直接进行数据交换,可使用联邦学习模型。
其中,联邦学习包括:
第一部分:(加密)样本对齐。由于两家企业的用户群体并非完全重合,系统利用基于加密的用户样本对齐技术,在 A 和 B 不公开各自数据的前提下确认双方的共有用户,并且不暴露不互相重叠的用户,以便联合这些用户的特征进行建模。
第二部分:加密模型训练。在确定共有用户群体后,就可以利用这些数据训练机器学习模型。为了保证训练过程中数据的保密性,需要借助第三方的服务端 C 进行加密训练。以线性回归模型为例,训练过程可分为以下4 步:
第①步:服务端C 把公钥分发给 A 和 B,用以对训练过程中需要交换的数据进行加密。
第②步:A 和 B 之间以加密形式交互用于计算梯度的中间结果。
第③步:A 和 B 分别基于加密的梯度值进行计算,同时 B 根据其标签数据计算损失,并把结果汇总给 C。C 通过汇总结果计算总梯度值并将其解密。
第④步:C 将解密后的总梯度值分别回传给 A 和 B,A 和 B 根据总梯度值更新各自模型的参数。这里,A 和 B各自的模型具有相同的风险特征维度,但更新各自模型的参数方法并不一定相同,也就是说,模型A和模型B中风险特征的权重值可能存在差异。
通过迭代上述步骤直至损失函数收敛,这样就完成了整个联邦学习过程。在样本对齐及模型训练过程中,A 和 B 各自的私有数据始终保留在本地,不存在暴露的风险。
以上是联邦学习的原理,在实际应用中,联邦学习系统会引入大量机构进行训练。因此想要破坏模型的正确性,异常成员对象需要在训练过程中入侵操控其他成员对象提供错误的中间参数。为此,本申请旨在基于联邦学习中各成员对象之间的通信数据,找到异常成员对象。
图2是本说明书实施例联邦学习的异常处理方法的流程图。图2所示的方法可以由下文相对应的装置执行,包括:
步骤S202,基于目标联邦学习的第一目标成员对象与目标联邦学习的第二目标成员对象在参与目标联邦学习时的通信记录,确定第一目标成员对象与第二目标成员对象之间的通信特征序列。
具体地,本步骤可以从第一目标成员对象和/或第二目标成员对象的网络流量日志中提取得到第一目标成员对象与第二目标成员对象之间通信记录。或者,通过监测第一目标成员对象与第二目标成员对象之间的流量数据,确定第一目标成员对象与第二目标成员对象之间通信记录。
应理解,通信特征序列的具体形式并不唯一,本说明书实施例不作具体限定。作为优选方案,通信特征序列应体现出第一目标成员对象与第二目标成员对象之间的通信节奏。在联邦学习的训练过程中,异常成员对象会向其他成员对象发起远程控制操作,因此在通信节奏上具有一定规律可循。通过能够反映第一目标成员对象与第二目标成员对象之间通信节奏的通信特征序列,可以有效识别第一目标成员对象与第二目标成员对象是否存在恶意行为。
此外,在实际应用,本步骤可以设置单位时段(24小时、12小时、1小时中的任一者),具体基于目标联邦学习的第一目标成员对象与所述目标联邦学习的第二目标成员对象在参与目标联邦学习时的单位时段的通信记录,确定第一目标成员对象与第二目标成员对象之间的通信特征序列。应理解,引入单位时段可以实现不同时间粒度的异常识别。
步骤S204,将第一目标成员对象与第二目标成员对象之间的通信特征序列输入至异常识别模型,得到第一目标成员对象与第二目标成员对象的异常识别结果,其中,异常识别模型是基于样本数据和预先为样本数据标注的异常分类标签训练得到的,样本数据包括第一样本成员对象在远程控制第二样本成员时,与第二样本成员对象之间的通信特征序列。
应理解,在本说明书实施例的方法中,可以预先通过以往确定得到的异常成员对象远程控制其他成员对象时的通信特征序列,来作为异常识别模型的黑样本数据,使异常识别模型具有基于通信特征序列,识别出异常行为的能力。或者,也可以模拟异常成员对象在联邦学习的训练过程中远程控制其他成员对象,以获得黑样本数据。
当然除了黑样本数据外,也可以引入白样本数据来训练异常识别模型,这里黑样本数据与白样本数据的比例以小于或等于1:9且大于或等于1:20为宜。
此外,如果引用上述单位时段,则样本数据对应包括第一样本成员对象在远程控制第二样本成员时,与所述第二样本成员对象之间的单位时段的通信特征序
在具体的训练过程中,本步骤以样本数据作为输入,以样本数据的异常分类标签(异常分类标签用于指示样本数据为黑样本数据还白样本数据)作为输出,对异常识别模型进行训练。在训练过程中,异常识别模型会输出训练结果,这个训练结果即异常识别模型预测样本数据是白样本数据还是黑样本数据的结果,与实际的异常分类标签可能存在误差。本步骤通过最大似然估计推导得到损失函数,计算出训练结果与异常分类标签之间的损失,并以降低损失为目的,对异常识别模型的参数进行优化,从而实现训练的意义。
这里需要说明的是,本说明书实施例不对异常识别模型作具体限定,任何具有分类能力的模型都可以适用于本说明书实施例的方案。
步骤S206,对第一目标成员对象和/或第二目标成员对象执行与异常识别结果相匹配的风控决策。
同样地,本说明书实施例不对风控决策作具体限定。作为示例介绍,本步骤中,如果异常识别结果指示第一目标成员对象和目标成员对象具有异常行为,则执行的风控决策可以包括:
降低第一目标成员对象和/或第二目标成员对象在目标联邦学习的信任值,其中,目标联邦学习的成员对象的信任值与成员对象在所述目标联邦学习中的赋能策略相关联。
取消第一目标成员对象和/或第二目标成员对象参与目标联邦学习的资格,也就是说,如果在目标联学习训练过程中识别出异常行为,则将第一目标成员对象和/或第二目标成员从目标联学习中剔除出去。
基于图2所示的方法,本说明书实施例的方案利用深度学习模型,通过联邦学习训练过程中成员对象之间的通信特征序列,识别出发起远程控制的异常成员对象,从而对异常成员对象采取相应的风控措施,以保护联邦学习的训练不受破坏。在这种保护机制下,能够放心地引入更多的机构参与到联邦学习中来,可提高联邦学习的实用性和通用性。
下面结合实际的应用场景,对本说明书实施例的方法进行详细介绍。
应用场景一
本应用场景一利用图像识别功能的第一异常识别模型(例如ResNet残差网络模型),来识别目标联邦学习中的异常成员对象。
具体地,首先选取一定数量的已确定的异常成员对象和非异常成员对象作为样本成员对象。
之后,以时间和通信量为维度,对以往联邦学习的第一样本成员对象与目标联邦学习的第二样本成员对象在参与目标联邦学习时的通信记录进行图像编码,得到第一样本成员对象与第二样本成员对象之间的通信二维图(即通信特征序列),该通信二维图可以在时间上反映出第一样本成员对象与第二样本成员对象之间的通信节奏,可以作为训练第一异常识别模型的样本数据。
通过上述方式,可以确定出以往联邦学习中各样本成员对象之间的通信二维图,并以样本数据为输入,样本数据对应的异常分类标签为输出,对第一异常识别模型进行有监督训练。
在第一异常识别模型训练完成后,即可投入到目标联邦学习中进行使用。
具体地,如果目标联邦学习已经结束,则可以使用第一异常识别模型复查目标联邦学习中是否存在异常成员对象。比如,从目标联邦学习的训练过程的流量数据中提取出各成员对象之间的通信记录,并将通信记录转换为通信二维图。之后,将目标联邦学习的各成员对象之间的通信二维图输入至第一异常识别模型,以进行异常识别。这里,以目标联邦学习中的第一目标成员对象与第二目标成员对象为例,如果第一异常识别模型通过第一目标成员对象与第二目标成员对象之间的通信二维图识别出异常行为,则可以将第一目标成员对象和/或第二目标成员对象确定为异常成员对象并进行记录,从而在后续进行的其他联邦学习中拒绝异常成员对象参与。
如果目标联邦学习尚未结束,则可以使用第一异常识别模型在目标联邦学习的训练过程中实时检测异常成员对象。比如,在进行目标联邦学习的训练流程时,提取出各成员对象之间的通信记录,并将通信记录转换为通信二维图。之后,将目标联邦学习的各成员对象之间通信二维图输入至第一异常识别模型,以进行异常识别。这里,以目标联邦学习中的第一目标成员对象与第二目标成员对象为例,如果第一异常识别模型通过第一目标成员对象与第二目标成员对象之间的通信二维图识别出异常行为,则可以将第一目标成员对象和/或第二目标成员对象确定为异常成员对象,并立即将异常成员对象从目标联邦学习中剔除出去,以阻止其参与后续轮次的训练过程。
可见,本应用场景一中,利用样本数据的通信二维图像对第一异常识别模型进行训练,可以使第一异常识别模型能够学习获得异常成员对象发起远程控制的节奏序列。这种训练方式下,不需要特征提取即可得到样本数据,特别适用于不方便对联邦学习异常行为进行刻画的场景。
应用场景二
本应用场景二通过技术人员的先验知识,人为刻画出异常成员对象在联邦学习的训练过程中,向其他成员对象发起远程控制所特有的至少一种通信特征维度。之后,将刻画出的至少一种通信特征维度作为底层输入向量,构建得到数据识别功能的第二异常识别模型。
在第二异常识别模型构建完成后,同样地选取一定数量的已确定的异常成员对象和非异常成员对象作为样本成员对象。
之后,按照异常识别模型所具有的通信特征维度,对以往联邦学习的第一样本成员对象与第二样本成员对象在参与目标联邦学习时的通信记录进行特征提取,得到第一样本成员对象与第二样本成员对象之间的通信特征序列,该通信特征序列可以作为训练第二异常识别模型的样本数据。
通过上述方式,可以确定出以往联邦学习中各样本成员对象之间的通信特征序列,并以样本数据为输入,样本数据对应的异常分类标签为输出,对第二异常识别模型进行有监督训练。
在第二异常识别模型训练完成后,即可投入到目标联邦学习中进行使用。
具体地,如果目标联邦学习已经结束,则可以使用第二异常识别模型复查目标联邦学习中是否存在异常成员对象。比如,从目标联邦学习的训练过程的流量数据中提取出各成员对象之间的通信记录,并将通信记录转换为通信特征序列。之后,将目标联邦学习的各成员对象之间的通信特征序列输入至第二异常识别模型,以进行异常识别。这里,以目标联邦学习中的第一目标成员对象与第二目标成员对象为例,如果第一异常识别模型通过第一目标成员对象与第二目标成员对象之间的通信二维图识别出异常行为,则可以将第一目标成员对象和/或第二目标成员对象确定为异常成员对象并进行记录,从而在后续进行的其他联邦学习中拒绝异常成员对象参与。
如果目标联邦学习尚未结束,则可以使用第二异常识别模型在目标联邦学习的训练过程中实时检测异常成员对象。比如,在进行目标联邦学习的训练流程时,提取出各成员对象之间的通信记录,并将通信记录转换为通信特征序列。之后,将目标联邦学习的各成员对象之间通信特征序列输入至第二异常识别模型,以进行异常识别。这里,以目标联邦学习中的第一目标成员对象与第二目标成员对象为例,如果第二异常识别模型通过第一目标成员对象与第二目标成员对象之间的通信特征序列识别出异常行为,则可以将第一目标成员对象和/或第二目标成员对象确定为异常成员对象,并立即将异常成员对象从目标联邦学习中剔除出去,以阻止其参与后续轮次的训练过程。
可见,应用场景二中,如果具有刻画联邦学习训练过程中异常成员对象发起远程控制的特征的能力,则可以通过特征刻画的方式,确定异常成员对象发起远程控制时所特有的通信特征维度,并基于刻画的通信特征维度构建训练第二异常识别模型。这种训练方式下,异常识别模型具有较为明确的训练方向,因此具有较高的识别正确率。
以上应用场景一和应用场景二仅用于示例性介绍本说明书实施例的方法,并不能限制本文件的保护范围。在实际应用中,异常识别模型并不限于一个,可以利用多种类型的深度学习模型(如上述的第一异常识别模型和第二异常识别模型)协同识别联邦学习中的异常成员对象。
此外,与上述联邦学习的异常处理方法相对应地,本说明书实施例还提供一种联邦学习的异常处理装置。图3是本说明书实施例异常处理装置300的结构示意图,包括:
特征确定模块310,基于目标联邦学习的第一目标成员对象与所述目标联邦学习的第二目标成员对象在参与所述目标联邦学习时的通信记录,确定所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列;
异常识别模块320,将所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列输入至异常识别模型,得到所述第一目标成员对象与所述第二目标成员对象的异常识别结果,其中,所述异常识别模型是基于样本数据和预先为所述样本数据标注的异常分类标签训练得到的,第一样本成员对象在远程控制第二样本成员时,与所述第二样本成员对象之间的通信特征序列;
风控决策模块330,对所述第一目标成员对象和/或所述第二目标成员对象执行与所述异常识别结果相匹配的风控决策。
基于图3所示的装置,本说明书实施例的方案利用深度学习模型,通过联邦学习训练过程中成员对象之间的通信特征序列,识别出发起远程控制的异常成员对象,从而对异常成员对象采取相应的风控措施,以保护联邦学习的训练不受破坏。在这种保护机制下,能够放心地引入更多的机构参与到联邦学习中来,可提高联邦学习的实用性和通用性。
可选地,特征确定模块310在执行时,具体基于目标联邦学习的第一目标成员对象与所述目标联邦学习的第二目标成员对象在参与所述目标联邦学习时的单位时段(如24小时、12小时、1小时中的任一者)的通信记录,确定所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列。对应地,上述样本数据包括第一样本成员对象在远程控制第二样本成员时,与所述第二样本成员对象之间的单位时段的通信特征序列。
可选地,所述异常识别模型包括属于卷积神经网络的第一异常识别模型,特征确定模块310在执行时,具体以时间和通信量为维度,对目标联邦学习的第一目标成员对象与所述目标联邦学习的第二目标成员对象在参与所述目标联邦学习时的通信记录进行图像编码,得到所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列。
可选地,所述异常识别模型包括具有至少一种通信特征维度的第二异常识别模型,特征确定模块310在执行时,具体基于所述第二异常识别模型具有的至少一种通信特征维度,对目标联邦学习的第一目标成员对象与所述目标联邦学习的第二目标成员对象在参与所述目标联邦学习时的通信记录进行特征提取,得到所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列。
可选地,风控决策模块330在执行时,若异常识别结果指示所述第一目标成员对象和所述目标成员对象具有异常行为,则对所述第一目标成员对象和/或所述第二目标成员对象执行以下至少一者:
降低在目标联邦学习的信任值,其中,所述目标联邦学习的成员对象的信任值与成员对象在所述目标联邦学习中的赋能策略相关联;
取消参与目标联邦学习的资格。
可选地,所述第一目标成员对象与所述第二目标成员对象在参与所述目标联邦学习时的通信记录是从第一目标成员对象和/或第二目标成员对象的网络流量日志中提取得到的。
显然,本说明书实施例的异常处理装置可以作为上述图2所示的异常处理方法的执行主体,因此够实现该异常处理方法在图2所实现的功能。由于原理相同,本文不再赘述。
图4是本说明书的一个实施例电子设备的结构示意图。请参考图4,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
其中,处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成桑树异常处理装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:
基于目标联邦学习的第一目标成员对象与所述目标联邦学习的第二目标成员对象在参与所述目标联邦学习时的通信记录,确定所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列。
将所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列输入至异常识别模型,得到所述第一目标成员对象与所述第二目标成员对象的异常识别结果,其中,所述异常识别模型是基于样本数据和预先为所述样本数据标注的异常分类标签训练得到的,所述样本数据包括第一样本成员对象在远程控制第二样本成员时,与所述第二样本成员对象之间的通信特征序列。
对所述第一目标成员对象和/或所述第二目标成员对象执行与所述异常识别结果相匹配的风控决策。
基于图4所示的电子设备,本说明书实施例的方案利用深度学习模型,通过联邦学习训练过程中成员对象之间的通信特征序列,识别出发起远程控制的异常成员对象,从而对异常成员对象采取相应的风控措施,以保护联邦学习的训练不受破坏。在这种保护机制下,能够放心地引入更多的机构参与到联邦学习中来,可提高联邦学习的实用性和通用性。
上述如本说明书图1所示实施例揭示的异常处理方法可以应用于处理器中,由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本说明书实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本说明书实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
应理解,本说明书实施例的电子设备可以实现上述异常处理装置在图2所示的实施例的功能。由于原理相同,本文不再赘述。
当然,除了软件实现方式之外,本说明书的电子设备并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
此外,本说明书实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令。其中,上述指令当被包括多个应用程序的便携式电子设备执行时,能够使该便携式电子设备执行图1所示实施例的方法,并具体用于执行以下方法:
基于目标联邦学习的第一目标成员对象与所述目标联邦学习的第二目标成员对象在参与所述目标联邦学习时的通信记录,确定所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列。
将所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列输入至异常识别模型,得到所述第一目标成员对象与所述第二目标成员对象的异常识别结果,其中,所述异常识别模型是基于样本数据和预先为所述样本数据标注的异常分类标签训练得到的,所述样本数据包括第一样本成员对象在远程控制第二样本成员时,与所述第二样本成员对象之间的通信特征序列。
对所述第一目标成员对象和/或所述第二目标成员对象执行与所述异常识别结果相匹配的风控决策。
应理解,上述指令当被包括多个应用程序的便携式电子设备执行时,能够使上文所述的异常处理装置实现图2所示实施例的功能。由于原理相同,本文不再赘述。
本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
以上仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。此外,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本文件的保护范围。

Claims (9)

1.一种联邦学习的异常处理方法,包括:
基于目标联邦学习的第一目标成员对象与所述目标联邦学习的第二目标成员对象在参与所述目标联邦学习时的通信记录,确定所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列,包括:以时间和通信量为维度,对目标联邦学习的第一目标成员对象与所述目标联邦学习的第二目标成员对象在参与所述目标联邦学习时的通信记录进行图像编码,得到时间维度上反映第一样本成员对象与第二样本成员对象之间的通信节奏的通信特征序列;
将所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列输入至异常识别模型,得到所述第一目标成员对象与所述第二目标成员对象的异常识别结果,其中,所述异常识别模型是基于样本数据和预先为所述样本数据标注的异常分类标签训练得到的,所述样本数据包括联邦学习过程中,第一样本成员对象在远程控制第二样本成员时,与所述第二样本成员对象之间的通信特征序列;
对所述第一目标成员对象和/或所述第二目标成员对象执行与所述异常识别结果相匹配的风控决策。
2.根据权利要求1所述的方法,
基于目标联邦学习的第一目标成员对象与所述目标联邦学习的第二目标成员对象在参与所述目标联邦学习时的通信记录,确定所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列,包括:
基于目标联邦学习的第一目标成员对象与所述目标联邦学习的第二目标成员对象在参与所述目标联邦学习时的单位时段的通信记录,确定所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列;
其中,所述样本数据包括第一样本成员对象在远程控制第二样本成员时,与所述第二样本成员对象之间的单位时段的通信特征序列。
3.根据权利要求2所述的方法,
所述单位时段包括24小时、12小时、1小时中的任一者。
4.根据权利要求1或2中任一项所述的方法,
所述异常识别模型包括具有至少一种通信特征维度的第二异常识别模型,基于目标联邦学习的第一目标成员对象与所述目标联邦学习的第二目标成员对象在参与所述目标联邦学习时的通信记录,确定所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列,包括:
基于所述第二异常识别模型具有的至少一种通信特征维度,对目标联邦学习的第一目标成员对象与所述目标联邦学习的第二目标成员对象在参与所述目标联邦学习时的通信记录进行特征提取,得到所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列。
5.根据权利要求1或2中任一项所述的方法,
对所述第一目标成员对象和/或所述第二目标成员对象执行与所述异常识别结果相匹配的风控决策,包括:
若异常识别结果指示所述第一目标成员对象和所述第二目标成员对象具有异常行为,则对所述第一目标成员对象和/或所述第二目标成员对象执行以下至少一者:
降低在目标联邦学习的信任值,其中,所述目标联邦学习的成员对象的信任值与成员对象在所述目标联邦学习中的赋能策略相关联;
取消参与目标联邦学习的资格。
6.根据权利要求1或2中任一项所述的方法,
所述第一目标成员对象与所述第二目标成员对象在参与所述目标联邦学习时的通信记录是从第一目标成员对象和/或第二目标成员对象的网络流量日志中提取得到的。
7.一种联邦学习的异常处理装置,包括:
特征确定模块,基于目标联邦学习的第一目标成员对象与所述目标联邦学习的第二目标成员对象在参与所述目标联邦学习时的通信记录,确定所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列包括:以时间和通信量为维度,对目标联邦学习的第一目标成员对象与所述目标联邦学习的第二目标成员对象在参与所述目标联邦学习时的通信记录进行图像编码,得到时间维度上反映第一样本成员对象与第二样本成员对象之间的通信节奏的通信特征序列;
异常识别模块,将所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列输入至异常识别模型,得到所述第一目标成员对象与所述第二目标成员对象的异常识别结果,其中,所述异常识别模型是基于样本数据和预先为所述样本数据标注的异常分类标签训练得到的,所述样本数据包括联邦学习过程中,第一样本成员对象在远程控制第二样本成员时,与所述第二样本成员对象之间的通信特征序列;
风控决策模块,对所述第一目标成员对象和/或所述第二目标成员对象执行与所述异常识别结果相匹配的风控决策。
8.一种电子设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行:
基于目标联邦学习的第一目标成员对象与所述目标联邦学习的第二目标成员对象在参与所述目标联邦学习时的通信记录,确定所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列包括:以时间和通信量为维度,对目标联邦学习的第一目标成员对象与所述目标联邦学习的第二目标成员对象在参与所述目标联邦学习时的通信记录进行图像编码,得到时间维度上反映第一样本成员对象与第二样本成员对象之间的通信节奏的通信特征序列;
将所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列输入至异常识别模型,得到所述第一目标成员对象与所述第二目标成员对象的异常识别结果,其中,所述异常识别模型是基于样本数据和预先为所述样本数据标注的异常分类标签训练得到的,所述样本数据包括联邦学习过程中,第一样本成员对象在远程控制第二样本成员时,与所述第二样本成员对象之间的通信特征序列;
对所述第一目标成员对象和/或所述第二目标成员对象执行与所述异常识别结果相匹配的风控决策。
9.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如下步骤:
基于目标联邦学习的第一目标成员对象与所述目标联邦学习的第二目标成员对象在参与所述目标联邦学习时的通信记录,确定所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列包括:以时间和通信量为维度,对目标联邦学习的第一目标成员对象与所述目标联邦学习的第二目标成员对象在参与所述目标联邦学习时的通信记录进行图像编码,得到时间维度上反映第一样本成员对象与第二样本成员对象之间的通信节奏的通信特征序列;
将所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列输入至异常识别模型,得到所述第一目标成员对象与所述第二目标成员对象的异常识别结果,其中,所述异常识别模型是基于样本数据和预先为所述样本数据标注的异常分类标签训练得到的,所述样本数据包括联邦学习过程中,第一样本成员对象在远程控制第二样本成员时,与所述第二样本成员对象之间的通信特征序列;
对所述第一目标成员对象和/或所述第二目标成员对象执行与所述异常识别结果相匹配的风控决策。
CN202010047742.5A 2020-01-16 2020-01-16 一种联邦学习的异常处理方法、装置及电子设备 Active CN110874646B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202110009946.4A CN112734045B (zh) 2020-01-16 2020-01-16 一种联邦学习的异常处理方法、装置及电子设备
CN202010047742.5A CN110874646B (zh) 2020-01-16 2020-01-16 一种联邦学习的异常处理方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010047742.5A CN110874646B (zh) 2020-01-16 2020-01-16 一种联邦学习的异常处理方法、装置及电子设备

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202110009946.4A Division CN112734045B (zh) 2020-01-16 2020-01-16 一种联邦学习的异常处理方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN110874646A CN110874646A (zh) 2020-03-10
CN110874646B true CN110874646B (zh) 2020-12-04

Family

ID=69718439

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202010047742.5A Active CN110874646B (zh) 2020-01-16 2020-01-16 一种联邦学习的异常处理方法、装置及电子设备
CN202110009946.4A Active CN112734045B (zh) 2020-01-16 2020-01-16 一种联邦学习的异常处理方法、装置及电子设备

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202110009946.4A Active CN112734045B (zh) 2020-01-16 2020-01-16 一种联邦学习的异常处理方法、装置及电子设备

Country Status (1)

Country Link
CN (2) CN110874646B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111445031B (zh) * 2020-03-31 2021-07-27 深圳前海微众银行股份有限公司 一种应对攻击的方法及联邦学习装置
CN111797999A (zh) * 2020-07-10 2020-10-20 深圳前海微众银行股份有限公司 纵向联邦建模优化方法、装置、设备及可读存储介质
CN112132198B (zh) * 2020-09-16 2021-06-04 建信金融科技有限责任公司 数据处理方法、装置、系统和服务器
CN112416887B (zh) * 2020-11-18 2024-01-30 脸萌有限公司 信息交互方法、装置和电子设备
CN113724117A (zh) * 2020-12-28 2021-11-30 京东城市(北京)数字科技有限公司 用于房屋异常使用识别的模型训练方法和装置
CN112613569B (zh) * 2020-12-29 2024-04-09 北京百度网讯科技有限公司 图像识别方法、图像分类模型的训练方法及装置
CN113468060B (zh) * 2021-07-12 2022-09-16 建信金融科技有限责任公司 一种基于复现思想的程序异常检测方法和装置
CN113704768A (zh) * 2021-08-10 2021-11-26 深圳致星科技有限公司 联邦学习执行流程的安全审计方法、装置及系统
CN114021464A (zh) * 2021-11-09 2022-02-08 京东科技信息技术有限公司 数据处理方法、装置和存储介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109391599A (zh) * 2017-08-10 2019-02-26 蓝盾信息安全技术股份有限公司 一种基于https流量特征分析的僵尸网络通讯信号的检测系统
US10685159B2 (en) * 2018-06-27 2020-06-16 Intel Corporation Analog functional safety with anomaly detection
CN109255444B (zh) * 2018-08-10 2022-03-29 深圳前海微众银行股份有限公司 基于迁移学习的联邦建模方法、设备及可读存储介质
CN109165515A (zh) * 2018-08-10 2019-01-08 深圳前海微众银行股份有限公司 基于联邦学习的模型参数获取方法、系统及可读存储介质
CN109818793A (zh) * 2019-01-30 2019-05-28 基本立子(北京)科技发展有限公司 针对物联网的设备类型识别及网络入侵检测方法
CN110177122A (zh) * 2019-06-18 2019-08-27 国网电子商务有限公司 一种识别网络安全风险的模型建立方法及装置
CN110225067B (zh) * 2019-07-24 2021-08-24 上海戎磐网络科技有限公司 一种物联网安全预警系统
CN110414688A (zh) * 2019-07-29 2019-11-05 卓尔智联(武汉)研究院有限公司 信息分析方法、装置、服务器及存储介质
KR20190103088A (ko) * 2019-08-15 2019-09-04 엘지전자 주식회사 연합학습을 통한 단말의 명함을 인식하는 방법 및 이를 위한 장치

Also Published As

Publication number Publication date
CN110874646A (zh) 2020-03-10
CN112734045A (zh) 2021-04-30
CN112734045B (zh) 2022-07-12

Similar Documents

Publication Publication Date Title
CN110874646B (zh) 一种联邦学习的异常处理方法、装置及电子设备
CN110874649B (zh) 联邦学习的执行方法、系统、客户端及电子设备
CN111723943B (zh) 一种基于多标签的联邦学习方法、装置和系统
CN110458662B (zh) 反欺诈风控方法及装置
CN109948320B (zh) 基于区块链的身份识别管理方法、装置、介质及电子设备
CN113055153B (zh) 一种基于全同态加密算法的数据加密方法、系统和介质
CN110933104A (zh) 恶意命令检测方法、装置、设备及介质
US11829486B1 (en) Apparatus and method for enhancing cybersecurity of an entity
CN113723623A (zh) 联邦学习审计装置、系统及方法
CN114693192A (zh) 风控决策方法、装置、计算机设备和存储介质
CN111539382A (zh) 一种图像识别模型隐私风险的评估方法、装置及电子设备
CN116011640A (zh) 基于用户行为数据的风险预测方法及装置
CN113177203B (zh) 一种识别加密恶意报文流的方法及装置
CN107294981B (zh) 一种认证的方法和设备
CN116506230B (zh) 基于rsa非对称加密的数据采集方法、系统
CN111767579A (zh) 存证方法、装置、计算机设备和存储介质
CN115659346A (zh) 一种多方安全计算平台的功能测试方法及装置
CN116010951A (zh) 电力区块链智能合约安全检测方法、装置、设备及介质
CN115982779A (zh) 一种数据匿名化方法、装置、电子设备及存储介质
Thanthrige Hidden markov model based intrusion alert prediction
Dissanayake et al. “Trust Pass”-Blockchain-Based Trusted Digital Identity Platform Towards Digital Transformation
CN115622793A (zh) 一种攻击类型识别方法、装置、电子设备及存储介质
Iqbal et al. Forensic investigation of small-scale digital devices: a futuristic view
CN114117428A (zh) 一种检测模型的生成方法及装置
CN113901502A (zh) 一种数据处理方法、装置、电子设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant