CN114092769A - 基于联邦学习的变电站多场景巡检分析方法 - Google Patents

基于联邦学习的变电站多场景巡检分析方法 Download PDF

Info

Publication number
CN114092769A
CN114092769A CN202210063012.3A CN202210063012A CN114092769A CN 114092769 A CN114092769 A CN 114092769A CN 202210063012 A CN202210063012 A CN 202210063012A CN 114092769 A CN114092769 A CN 114092769A
Authority
CN
China
Prior art keywords
data
model
inspection station
inspection
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210063012.3A
Other languages
English (en)
Other versions
CN114092769B (zh
Inventor
辛建波
徐波
李帆
华栋
刘穗生
刘奕清
林谋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Junhua Energy Technology Co ltd
Super High Voltage Branch Of State Grid Jiangxi Electric Power Co ltd
State Grid Corp of China SGCC
Electric Power Research Institute of State Grid Jiangxi Electric Power Co Ltd
Original Assignee
Guangdong Junhua Energy Technology Co ltd
Super High Voltage Branch Of State Grid Jiangxi Electric Power Co ltd
State Grid Corp of China SGCC
Electric Power Research Institute of State Grid Jiangxi Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Junhua Energy Technology Co ltd, Super High Voltage Branch Of State Grid Jiangxi Electric Power Co ltd, State Grid Corp of China SGCC, Electric Power Research Institute of State Grid Jiangxi Electric Power Co Ltd filed Critical Guangdong Junhua Energy Technology Co ltd
Priority to CN202210063012.3A priority Critical patent/CN114092769B/zh
Publication of CN114092769A publication Critical patent/CN114092769A/zh
Application granted granted Critical
Publication of CN114092769B publication Critical patent/CN114092769B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2155Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E40/00Technologies for an efficient electrical power generation, transmission or distribution
    • Y02E40/70Smart grids as climate change mitigation technology in the energy generation sector

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Public Health (AREA)
  • Strategic Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Water Supply & Treatment (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Evolutionary Biology (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于联邦学习的变电站多场景巡检分析方法,包括下述步骤:数据获取,半监督数据标注,数据对齐,主服务器分发公钥给各巡检站,各巡检站构建本地模型,各巡检站上传加密模型梯度信息,主服务器计算巡检站模型梯度信息,主服务器使用数据分布动态加权法返回巡检站模型更新参数,各巡检站使用主服务器返回参数更新模型参数,各巡检站共享中间结果,协助彼此计算模型参数,得到联邦学习后的模型,将实时拍摄图像数据输入联邦学习后的模型进行预测,得到实际应用场景预测结果,对增量数据进行训练更新模型。本发明在各个部署网点数据不交换的前提下进行模型之间的协作训练,使得模型在不同电网部署场景具有泛化性。

Description

基于联邦学习的变电站多场景巡检分析方法
技术领域
本发明涉及一种基于联邦学习的变电站多场景巡检分析方法,属于变电站巡检数据处理技术领域。
背景技术
输电、变电、配电设备运维业务是保证电网稳定的核心环节,需确保电网长期、高效地运行,及时发现并检测电网中设备的缺陷以及可能影响正常输电的异物尤为重要。
近年来,随着深度学习的成果不断涌现,国内外研究人员提出一些基于卷积神经网络进行缺陷检测或异物识别的方法,并在一些该领域内现有数据集上取得了较为优异的表现。虽然卷积神经网络在图像识别领域效果显著,甚至在数据充足的情况下已超过人类识别的准确率,然而当数据集规模较小时,卷积神经网络通常会出现严重的过拟合现象,从而无法应对现实生活中复杂的场景。
而由于电力设备本身故障少,收集到的数据中发生缺陷的样本和正常的样本数量严重不均衡,从而使得简单的卷积神经网络难以应对;此外,由于不同部署场景收集的数据有所不同,因此如何在多方场景多方数据的情况下进行协同学习也显得尤为重要。
联邦学习本质上是一种分布式机器学习技术,或者说是一种机器学习框架,其目标是在保证数据隐私安全及合法合规的基础上,实现共同建模,提升人工智能模型的效果。
联邦学习在现实场景中具有广泛的应用前景,因为目前深度学习为主流的人工智能模型的效果依赖于大量的优质数据,但在现实场景中,除了少数巨头公司能够满足要求,绝大多数企业都存在数据量少,数据质量差的问题,不足以支撑人工智能技术的实现;同时国内外监管环境也在逐步加强数据保护,陆续出台相关政策,因此数据在安全合规的前提下自由流动,成了大势所趋;在用户和企业角度下,商业公司所拥有的数据往往都有巨大的潜在价值。
变电站的巡检地点分布在不同的位置,因而采集到的图像以及对应的巡检系统也会分别部署在不同的地理场景中。此外,不同的巡检场景也同样意味着模型面对的数据类型会有所不同。例如,场景Ⅰ部件缺陷出现的频率较高,而表面异物出现的频率则相对较低,而场景Ⅱ则正好相反,异物的样本多,而缺陷的样本少。因此,如何在不交换原始数据的情况下对不同场景的数据进行协同学习,提升模型的场景适应能力和鲁棒性是一个亟需解决的现实问题。
此外,受到自然天气、光照条件等因素的影响,不同场景采集的图像之间数据分布会存在明显的不同,即存在领域差异。因此,在联邦学习的过程中消除这种领域差异带来的负面影响,对提升巡检系统的性能具有重要的作用。
发明内容
为了解决多场景适应性的问题,本发明提供了一种基于联邦学习的变电站多场景巡检分析方法,引入联邦学习技术以在多场景拥有多方数据的前提下开展高效率的模型学习;实现在各个部署网点数据不交换的前提下进行模型之间的协作训练,使得模型在不同电网部署场景都具有更好的泛化性。
本发明通过下述技术方案来实现,一种基于联邦学习的变电站多场景巡检分析方法,步骤如下:
步骤S1:数据获取:使用巡检系统采集数据,巡检系统分别部署在不同的地理场景中去获取图像;
步骤S2:半监督数据标注:人工标注部分数据的标签,剩余数据采用小样本深度学习模型进行数据标注,小样本深度学习模型包括FasterRCNN主分支、多尺度正样本细化分支和fixmatch(半监督学习)多尺度细化分支,当FasterRCNN主分支、多尺度正样本细化分支训练无法达到用户满意的效果时,开启fixmatch多尺度细化分支进行半监督循环训练;
步骤S3:数据对齐:采用基于加密传输的数据样本对齐技术,确认不同场景中的共有数据,一遍遍联合数据特征进行建模;
步骤 S4:主服务器分发公钥给各巡检站:在巡检系统中会设置一个主服务器用来协调各巡检站的数据以及模型信息,主服务器生成公钥,并通过加密算法 加密后分发给各巡检站;
步骤S5:各巡检站构建本地模型:根据任务需要,各巡检站在本地构建相同的本地模型,使用相同初始化;使用数据对齐后的数据在本地模型进行训练;
步骤S6:各巡检站上传加密模型梯度信息:各巡检站的本地模型在本地训练时需要将模型梯度信息上传到主服务器,通过加密算法对模型梯度信息进行加密,然后使用公钥将加密后的模型梯度信息上传到主服务器上,然后主服务器使用解密算法将各巡检站上传的加密模型梯度信息进行解密;
步骤S7:主服务器计算巡检站模型梯度信息:主服务器根据各巡检站提交的模型梯度信息计算各巡检站更新模型所必须的计算结果,并对各个巡检站的更新权重进行分配;分配原则使用数据分布动态加权法;
步骤S8:主服务器使用数据分布动态加权法返回巡检站模型更新参数;
步骤S9:各巡检站使用主服务器返回参数更新模型参数:根据主服务器分配的权重结果,通过加密传输到各巡检站,各巡检站根据分配的权重及加权后的模型梯度信息更新本地模型参数;
步骤S10:各巡检站共享中间结果,协助彼此计算模型参数:各巡检站根据本地数据训练的中间模型参数进行加密传输,加密方式使用加密算法处理,彼此通过共享中间参数,来互相更新模型;
步骤S11:得到联邦学习后的模型:在更新完参数后,主服务器以及各巡检站对模型参数进行共享,从而得到一个包含对所有类型数据都有充分训练的模型;
步骤S12:将实时拍摄图像数据输入联邦学习后的模型进行预测,得到实际应用场景预测结果;
步骤S13:对增量数据按照步骤S2-S11进行训练更新模型。
进一步优选,FasterRCNN主分支包括FPN(特征图金字塔网络)网络Ⅰ、RPN网络(Region Proposal Network, 区域候选网络)和ROI(感兴趣区域)分类回归网络,多尺度正样本细化分支包括FPN网络Ⅱ,FasterRCNN主分支和多尺度正样本细化分支的训练流程为:
S2-11.输入标注的原始图像,从原始图像中剪裁出正样本目标,对剪裁的正样本目标进行多尺度缩放,得到多尺度正样本图像,形成多尺度图像金字塔,作为多尺度正样本细化分支的输入;
S2-12.原始图像通过FPN网络Ⅰ后获得原始图像特征,多尺度正样本图像通过FPN网络Ⅱ后获得图像特征;
S2-13. FasterRCNN主分支中的原始图像特征通过RPN网络得到ROI后进入ROI分类回归网络获得最终的预测结果,同时计算出RPN背景分类损失,RPN 边框回归损失、ROI类别分类损失、ROI 边框回归损失,对FasterRCNN主分支进行更新优化;
S2-14. 多尺度正样本细化分支的图像特征为正样本图像特征,仅需计算ROI的类别分类损失和背景分类损失,背景分类损失合并到主分支的RPN背景分类损失中,类别分类损失合并到FasterRCNN主分支的ROI类别分类损失中,对小样本深度学习模型进行迭代更新。
进一步优选,fixmatch多尺度细化分支包括FPN网络Ⅲ,半监督循环训练的具体流程为:
S2-21.使用FasterRCNN主分支和多尺度正样本细化分支组成的模型对所有未标注的图像进行预测,挑选出置信度在阈值以上的预测框作为图像的标注,并使用挑选的标注进行FasterRCNN主分支和多尺度正样本细化分支的优化与更新;
S2-22.在fixmatch多尺度细化分支的训练时,将输入的多尺度正样本图像分别进行强增强和弱增强,以得到的强增强图像和弱增强图像作为一组输入样本;
S2-23.使用FPN网络Ⅲ对强增强图像和弱增强图像处理,得到弱增强图像输出、强增强图像输出和背景分类损失,背景分类损失合并到主分支的RPN背景分类损失;
S2-24.将弱增强图像输出的标签作为伪标签,强增强图像输出的标签作为真实标签,计算类别分类损失,并合并到FasterRCNN主分支的ROI类别分类损失中,更新优化小样本深度学习模型;
S2-25.重复步骤S2-21至 S2-24进行循环训练,直到小样本深度学习模型满足精度要求或设定的最大循环次数。
进一步优选,步骤S2-22中,在主服务器中构建自适应领域处理模块对不同巡检站的强增强图像和弱增强图像进行处理,然后再进入步骤S2-23,自适应领域处理模块包括特征提取器、领域分类器、类别分类器、拆解模块、重构模块,特征提取器从各强增强图像和弱增强图像中抽取视觉特征,领域分类器判断输入的视觉特征属于哪个巡检站,类别分类器分类输入图像具体的障碍类别,利用类别分类器对视觉特征进行类别分类,并利用交叉墒损失计算得到各类别内视觉特征的梯度;并利用领域分类结果产生的损失更新特征提取器和领域分类器的关联关系;拆解模块将视觉特征拆解为领域相关的特征或领域不相关的特征,重构模块将拆解完的特征重新构成整体特征;并利用拆解与重构过程中产生的对抗损失以及类别损失更新特征提取器、拆解模块、重构模块、类别分类器。
进一步优选,步骤S7所述数据分布动态加权法,具体为:
使用海林格距离对本地数据集的平衡程度进行量化;设两个离散概率分布数据集 分别为
Figure 951683DEST_PATH_IMAGE001
Figure 834188DEST_PATH_IMAGE002
,其中u n 代表数据集U中的第n个数据,v n 代表 数据集V中的第n个数据,则它们之间的海林格距离定义为:
Figure 124355DEST_PATH_IMAGE003
(1)
其中,u i 代表数据集U中的第i个数据,v i 代表数据集V 中的第i个数据;
于是,本地数据集D k 的平衡程度通过计算其与平衡数据集的海林格距离来刻画;平衡数据集是指各类别样本数量分布均衡的数据集,定义一个基准数据集D b 作为平衡数据集的替代;在基准数据集D b 中,各个类别的样本数量人为设置一个合理的比例;海林格距离满足柯西-施瓦兹不等式,具有如下性质:
Figure 66903DEST_PATH_IMAGE004
(2)
使用式(3)所示的B k 表征本地数据集D k 的平衡情况,称为平衡度;平衡度是通过将式(2)计算出的本地数据集D k 与基准数据集D b 之间的海林格距离进行翻转后得到的:
Figure 504838DEST_PATH_IMAGE005
(3)
其中,
Figure 112406DEST_PATH_IMAGE006
Figure 584975DEST_PATH_IMAGE007
分别为本地数据集D k 与基准数据集D b 上的概率分布,H k 为第k个巡检 站本地数据集的海林格距离;
数据量权重计算方式为:
Figure 698425DEST_PATH_IMAGE008
(4)
其中q k 为第k个巡检站分配的数据量权重,D vk 为第k个巡检站的数据量,D v 为各巡检站数据集的总量;
将公式(3)中得到的平衡度通过归一化的方法转化为权重的形式,具体计算方式为:
Figure 561338DEST_PATH_IMAGE009
(5)
式中,B i 表征第i个巡检站本地数据集D i 的平衡情况,S k 为第k个巡检站的平衡度权重, K为巡检站总数量;
通过结合数据量权重和平衡度权重得到最终的综合权重;由式(4)和式(5)得到, 数据量权重的集合
Figure 785646DEST_PATH_IMAGE010
和平衡度权重的集合
Figure 847143DEST_PATH_IMAGE011
满足概率分 布的特点;令概率分布
Figure 584024DEST_PATH_IMAGE012
为基准分布,表示各巡检站不存在差异时的 权重集合;则
Figure 996551DEST_PATH_IMAGE013
Figure 24550DEST_PATH_IMAGE014
的定义为:
Figure 878236DEST_PATH_IMAGE015
式中,
Figure 67909DEST_PATH_IMAGE016
Figure 967732DEST_PATH_IMAGE017
分别表示数据量权重影响因子和平衡度权重影响因子;
得到:
Figure 720793DEST_PATH_IMAGE018
其中,
Figure 22462DEST_PATH_IMAGE019
是第k个巡检站在第t次与主服务器通信时的模型参数,
Figure 383036DEST_PATH_IMAGE020
表示第t次通 信时的联邦学习后的模型参数;
得到权重后,为每个巡检站提供相应的权重及加权后的梯度信息,从而指导巡检站更新本地模型。
本发明的有益效果:
采用少量标注数据的半监督循环训练技术,重点解决数据的自动标注以及利用对抗学习的快速数据生成技术,并融合至传统深度学习训练框架,实现对增量数据的分布式使用,提升模型的场景适应能力和鲁棒性,确保深度学习模型的精确度有较大提升。
由于不同应用部署场景对智能巡检系统既有共性的需求也有不同的需求,其累积的数据类型也会存在不同。因此,本发明将引入联邦学习技术以在多场景拥有多方数据的前提下开展高效率的模型学习。本发明能够实现在各个部署网点数据不交换的前提下进行模型之间的协作训练,并解决了不同电网部署点采集的数据之间由于室内/室外,照明条件,天气状态等因素的不同会有较大的数据偏差,这种数据偏差会降低模型的性能的问题,使得模型在不同电网部署场景都具有更好的泛化性。
附图说明
图1为本发明中联邦学习的原理图。
图2为本发明的流程图。
图3为小样本深度学习模型示意图。
具体实施方式
下面结合实施例对本发明作进一步详细阐明。
参照图1和图2,一种基于联邦学习的变电站多场景巡检分析方法,步骤如下:
步骤S1:数据获取。使用巡检系统采集数据,各个独立的巡检系统分别部署在不同的地理场景中构成巡检站,巡检站获取图像;增量式获取数据,不断扩充数据量,并且可以不断更新优化模型。
步骤S2:半监督数据标注。人工标注少部分数据的标签,剩余数据采用小样本深度学习模型进行数据标注,当小样本深度学习模型无法达到用户满意的效果时,开启半监督循环训练进一步提升模型精度。首先选取1/5的数据进行人为标注,然后使用半监督方法Ladder Networks将剩余的4/5数据的标签进行自动生成,从而完成对整个数据集标注的任务。
步骤S3:数据对齐。采用基于加密传输的数据样本对齐技术,确认不同场景中的共有数据,一遍遍联合数据特征进行建模。具体方法如下,如在巡检站Ⅰ和巡检站Ⅱ之间进行数据对齐,则需要执行以下步骤:
(1)巡检站Ⅱ首先通过 RSA加密算法,生成公钥n、加密算法e 以及解密算法d,然后把公钥n和加密算法 e发送给巡检站Ⅰ。
(2)巡检站Ⅰ接收到公钥n和加密算法e后,将己方数据A进行哈希加密形成H(A),同时添加噪声r,并对噪声r使用加密算法e加密,得到密文:H(A)+e(r),并传给巡检站Ⅱ。
(3)巡检站Ⅱ拿到密文后,使用解密算法d进行解密得到 d(H(A)+e(r))=d(H(A))+d(e(r))=d(H(A))+r。同时,巡检站Ⅱ对己方数据进行哈希加密,再通过解密算法d进行解密,得到d(H(B))。然后进行二次哈希加密,得到密文B:H(d(H(B)))。最后将d(H(A))+r和密文B传送给巡检站Ⅰ。
(4)巡检站Ⅰ接收到巡检站Ⅱ的信息后,首先对d(H(A))+r去除噪声r,得到d(H(A)),再进行二次哈希得到H(d(H(A))),然后将其传送给巡检站Ⅱ。
(5)可以看出,经过步骤(4)处理后,巡检站Ⅰ的加密数据为:H(d(H(A)))。同时,经过步骤(3)处理后,巡检站Ⅱ的加密数据为:H(d(H(B))),两者处于一个数据纬度,因此巡检站Ⅱ可以基于H(d(H(A)))以及H(d(H(B)))进行交集运算,最终得到双方的共同样本ID。最后,将共同样本共享给其他方,完成数据对其的工作。
步骤 S4:主服务器分发公钥给各巡检站。在巡检系统中会设置一个主服务器用来协调各巡检站的数据以及模型信息,从而破除各巡检站的数据孤岛效应,充分利用所有巡检站的数据信息。主服务器按照步骤S3中的方式生成公钥n,并通过加密算法 e加密后分发给各个巡检站。
步骤S5:各巡检站构建本地模型。根据任务需要,各巡检站在本地构建相同的本地模型,使用相同初始化;使用数据对齐后的数据在本地模型进行训练。
步骤S6:各巡检站上传加密模型梯度信息。各巡检站的本地模型在本地训练时需要将模型梯度信息上传到主服务器,通过加密算法对模型梯度信息进行加密,然后使用公钥n将加密后的模型梯度信息上传到主服务器上,然后主服务器使用解密算法d将各巡检站上传的加密模型梯度信息进行解密。
步骤S7:主服务器计算巡检站模型梯度信息。主服务器根据各巡检站提交的模型梯度信息计算各巡检站更新模型所必须的计算结果,并对各个巡检站的更新权重进行分配;分配原则使用基于数据分布动态加权的联邦学习方法。
步骤S8:主服务器使用数据分布动态加权法返回巡检站模型更新参数。
步骤S9:各巡检站使用主服务器返回参数更新模型参数。根据主服务器分配的权重结果,通过加密传输到各巡检站,各巡检站根据分配的权重及加权后的模型梯度信息更新本地模型参数。
步骤S10:各巡检站共享中间结果,协助彼此计算模型参数。各巡检站根据本地数据训练的中间模型参数进行加密传输,加密方式使用加密算法e处理,彼此通过共享中间参数,来互相更新模型。
步骤S11:得到联邦学习后的模型。在更新完参数后,主服务器以及各巡检站对模型参数进行共享,从而得到一个包含对所有类型数据都有充分训练的模型。
步骤S12:将实时拍摄图像数据输入联邦学习后的模型进行预测,得到实际应用场景预测结果。
步骤S13:对增量数据按照步骤S2-S11进行训练更新模型。
本发明步骤S2中, 小样本深度学习模型可以用少量标注数据训练出较高精度的模型,对数据进行标注。但小样本深度学习模型由于数据的局限性,对于尺度变化较大的缺陷检测和异物检测效果较差,而在真实的数据中,目标的尺度分布一般是连续的,因此提出了一种多尺度正样本细化分支来丰富目标尺度,增强模型对于新领域目标的特征提取能力。
多尺度正样本细化分支为特征提取网络增强分支,与小样本深度学习模型的特征提取网络共享权值,通过生成目标的多尺度正样本构成输入图像金字塔,与主干网络同时对特征提取器进行更新,提升小样本深度学习模型在不同尺度上的表现。多尺度分支的用法灵活,可应用在不同的模型架构上,以小样本深度学习模型微调方法为例,使用带FPN的双阶段检测模型FasterRCNN为基础模型,在双阶段检测模型FasterRCNN基础上增加了多尺度正样本细化分支,用少量样本对网络进行微调,如图3所示,小样本深度学习模型包括FasterRCNN主分支和多尺度正样本细化分支;FasterRCNN主分支包括FPN(特征图金字塔网络)网络Ⅰ、RPN网络和ROI(感兴趣区域)分类回归网络,多尺度正样本细化分支包括FPN网络Ⅱ,训练流程为:
S2-11.输入标注的原始图像,从原始图像中剪裁出正样本目标,对剪裁的正样本目标进行多尺度缩放,得到多尺度正样本图像,形成多尺度图像金字塔,作为多尺度正样本细化分支的输入;
S2-12.原始图像通过FPN网络Ⅰ后获得原始图像特征,多尺度正样本图像通过FPN网络Ⅱ后获得图像特征;
S2-13. FasterRCNN主分支中的原始图像特征通过RPN网络得到ROI后进入ROI分类回归网络获得最终的预测结果,同时计算出RPN背景分类损失,RPN 边框回归损失、ROI类别分类损失、ROI 边框回归损失,对FasterRCNN主分支进行更新优化;
S2-14. 多尺度正样本细化分支的图像特征为正样本图像特征,即仅需计算ROI的类别分类损失和背景分类损失,背景分类损失合并到主分支的RPN背景分类损失中,类别分类损失合并到FasterRCNN主分支的ROI类别分类损失中,对小样本深度学习模型进行迭代更新。
通过分支的强化作用,有效增强了小样本深度学习模型对样本特征的识别能力,进一步提升模型的检测精度。
FasterRCNN主分支和多尺度正样本细化分支组成能达到的精度有限,当无法达到用户满意的效果时,将开启半监督循环训练进一步提升模型精度。半监督循环训练的核心是充分利用未标注数据,将上一轮预测结果中置信度较高的数据与原始标注数据作为新一轮的训练数据,使小样本深度学习模型学到更多的数据模式特征。这种数据集构建模式不可避免的在数据中混入了大量的噪声数据,如果直接使用,随着迭代次数的增加,小样本深度学习模型的学习将会朝着不可控的方向进行。针对该问题,小样本深度学习模型在FasterRCNN主分支和多尺度正样本细化分支的基础上加入fixmatch(半监督学习)多尺度细化分支,以实现半监督循环训练,其核心思想为一致性正则化原理,即对于一个输入,即使受到微小干扰,其预测都应该是一致的。fixmatch多尺度细化分支包括FPN网络Ⅲ,参照图3,半监督循环训练的具体流程为:
S2-21.使用FasterRCNN主分支和多尺度正样本细化分支组成的模型对所有未标注的图像进行预测,挑选出置信度在阈值以上的预测框作为图像的标注,并使用挑选的标注进行FasterRCNN主分支和多尺度正样本细化分支的优化与更新;
S2-22.在fixmatch多尺度细化分支的训练时,将输入的多尺度正样本图像分别进行强增强和弱增强,以得到的强增强图像和弱增强图像作为一组输入样本;
S2-23.使用FPN网络Ⅲ对强增强图像和弱增强图像处理,得到弱增强图像输出、强增强图像输出和背景分类损失,背景分类损失合并到主分支的RPN背景分类损失(强增强为各种数据增强方式结合,同时包含改变和不改变数据结构、特性的方法,弱增强则为翻转平移等不改变数据结构、特性的数据增强方法);
S2-24.将弱增强图像输出的标签作为伪标签,强增强图像输出的标签作为真实标签,计算类别分类损失,并合并到FasterRCNN主分支的ROI类别分类损失中,更新优化小样本深度学习模型;
S2-25.重复步骤S2-21至 S2-24进行循环训练,直到小样本深度学习模型满足精度要求或设定的最大循环次数。
通过这种训练方式,噪声标签对网络精度的影响被削弱,且通过不同的数据增强,网络学到了更多的目标模式,对复杂环境的鲁棒性更高,能更好的学习到目标的代表性特征,提升模型精度。
更特别地是,本发明步骤S2-22中,在主服务器中构建自适应领域处理模块对不同巡检站的强增强图像和弱增强图像进行处理,以拉近不同领域距离,然后再进入步骤S2-23,自适应领域处理模块包括特征提取器、领域分类器、类别分类器、拆解模块、重构模块,特征提取器从各强增强图像和弱增强图像中抽取视觉特征,领域分类器判断输入的视觉特征属于哪个巡检站,类别分类器分类输入图像具体的障碍类别,即有没有故障,以及具体的故障类别,例如部位漏油、存在鸟巢等,利用类别分类器对视觉特征进行类别分类,并利用交叉墒损失计算得到各类别内视觉特征的梯度;并利用领域分类结果产生的损失更新特征提取器和领域分类器的关联关系;拆解模块将视觉特征拆解为领域相关的特征或领域不相关的特征,重构模块将拆解完的特征重新构成整体特征;并利用拆解与重构过程中产生的对抗损失以及类别损失更新特征提取器、拆解模块、重构模块、类别分类器。
通过拆解重构以及相应的任务(分类损失、交叉墒损失)达到缩小领域差异的目的。具体而言,通过从整体的视觉特征中抽取出领域相关的部分用于后续的识别,例如异物检测,缺陷检测等具体巡检任务,以消除由于领域相关的特征带来的影响,进而达到拉近不同领域距离的效果。
常用的权重分配算法仅根据各巡检站上的数据量确定相应的局部模型的权重,但是由于不同的巡检场景面对的数据类型会有所不同。例如,场景Ⅰ部件缺陷出现的频率较高,而表面异物出现的频率则相对较低,而场景Ⅱ则正好相反,异物的样本多,而缺陷的样本少。单纯采用数据量来分配局部模型权重并不合理,因为数据分布更为平衡的各巡检站通常会训练出质量更高的局部模型,应该在分配更高的权重。因此本发明采用基于数据分布动态加权的联邦学习方法,详情如下所述。
使用海林格距离对本地数据集的平衡程度进行量化。设两个离散概率分布数据集 分别为
Figure 973417DEST_PATH_IMAGE021
Figure 343219DEST_PATH_IMAGE022
,其中u n 代表数据集U中的第n个数据,v n 代表 数据集V 中的第n个数据,则它们之间的海林格距离定义为:
Figure 155186DEST_PATH_IMAGE023
(1)
其中,u i 代表数据集U中的第i个数据,v i 代表数据集V 中的第i个数据;
于是,本地数据集D k 的平衡程度可以通过计算其与平衡数据集的海林格距离来刻画。平衡数据集是指各类别样本数量分布均衡的数据集。由此,定义了一个基准数据集D b 作为平衡数据集的替代。在基准数据集D b 中,各个类别的样本数量人为设置一个合理的比例。
本地数据集D k 与基准数据集D b 的海林格距离越小,表示两者的相似度越高,也即该本地数据集D k 的平衡程度越高。值得注意的是,海林格距离与相似度是负相关的,为了便于后续的计算以及更为直观地表示平衡程度,需要对其进行转换。考虑到海林格距离满足柯西-施瓦兹不等式,所以其具有如下性质:
Figure 952240DEST_PATH_IMAGE024
(2)
最终,使用式(3)所示的B k 表征本地数据集D k 的平衡情况,称为平衡度。它是通过将式(2)计算出的本地数据集D k 与基准数据集D b 之间的海林格距离进行翻转后得到的:
Figure 561076DEST_PATH_IMAGE025
(3)
其中,
Figure 672252DEST_PATH_IMAGE026
Figure 682933DEST_PATH_IMAGE027
分别为本地数据集D k 与基准数据集D b 上的概率分布,H k 为第k个巡 检站本地数据集的海林格距离。
在常用算法中,仅根据各巡检站的数据量进行加权,其权重为:
Figure 650889DEST_PATH_IMAGE008
(4)
其中q k 为第k个巡检站分配的数据量权重,D vk 为第k个巡检站的数据量,D v 为各巡检站数据集的总量。
由于各巡检站数据分布极不平衡,因此在此基础上加入了对各巡检站上本地数据分布的考虑。为此,将平衡度B k 通过归一化的方法转化为权重的形式。具体计算方式为:
Figure 933972DEST_PATH_IMAGE028
(5)
式中,B i 表征第i个巡检站本地数据集D i 的平衡情况,S k 为第k个巡检站的平衡度权重,K为巡检站总数量。
通过结合数据量权重和平衡度权重得到最终的综合权重。考虑到随着实际情况的 变化,两种权重会对综合权重产生不同的影响,所以定义了数据量权重影响因子
Figure 645576DEST_PATH_IMAGE029
和平衡 度权重影响因子
Figure 510764DEST_PATH_IMAGE030
表示它们对综合权重的影响程度。虽然数据量和平衡度都会对局部模型 的质量产生作用,但是权重计算的是各巡检站在某个因素上的相对差距。例如数据量相同 的多个客户端,通过式(4)计算出的数据量权重也是相同的,此时可以仅使用由式(5)所确 定的平衡度权重进行加权,因为数据量对局部模型质量的影响不存在差异。使用与衡量本 地数据集平衡程度相类似的方法量化不同客户端在数据量和平衡度两个方面的差异,并据 此确定影响因子。由式(4)和式(5) 可知,数据量权重的集合
Figure 587304DEST_PATH_IMAGE031
和平衡度 权重的集合
Figure 170732DEST_PATH_IMAGE032
满足概率分布的特点。令概率分布
Figure 420448DEST_PATH_IMAGE033
为基准分布,表示各巡检站不存在差异时的权重集合。则
Figure 858251DEST_PATH_IMAGE034
Figure 168010DEST_PATH_IMAGE035
的定义为:
Figure 238734DEST_PATH_IMAGE036
式中,
Figure 964245DEST_PATH_IMAGE034
Figure 804025DEST_PATH_IMAGE035
分别表示数据量权重影响因子和平衡度权重影响因子。
因此得到:
Figure 284685DEST_PATH_IMAGE037
其中,
Figure 764076DEST_PATH_IMAGE038
是第k个巡检站在第t次与主服务器通信时的模型参数,
Figure 824436DEST_PATH_IMAGE039
表示第t次通 信时的联邦学习后的模型参数。
此外, 由于
Figure 518723DEST_PATH_IMAGE040
, 因此基于数据分布动态加权的联邦学习方法 具有收敛性。
得到权重后,为每个巡检站提供相应的权重及加权后的梯度信息,从而指导巡检站更新本地模型。
在巡检分析中,各巡检站的巡检场景面对的数据类型会有所不同,因此各巡检站的数据类别比例会有不同。例如,场景Ⅰ部件缺陷出现的频率较高,而表面异物出现的频率则相对较低,而场景Ⅱ则正好相反,异物的样本多,而缺陷的样本少。之前常规的各个巡检站单独自己训练会导致模型不够鲁棒,而采用基于数据分布动态加权的联邦学习方法能够很好的解决这个问题。
基于数据分布动态加权联邦学习能够让场景Ⅰ中出现频率较低的表面异物也能够通过场景Ⅱ提供的数据参数也能较好的学习,从而当场景Ⅰ中出现表面异物时,巡检站Ⅰ也能够较好的识别出表面异物。而这是在传统各巡检站单独自己训练中是很难做到的。
在巡检场景中,各巡检站训练本地数据时根据本地数据集数量以及类别比例从主服务器获得相应的更新参数权重,从而去更新模型。这样在最后的联邦学习后的模型中就不仅包含了对本地的数据进行了充分训练,也能对本地没有的数据有了充分的训练。

Claims (5)

1.一种基于联邦学习的变电站多场景巡检分析方法,其特征在于,步骤如下:
步骤S1:数据获取:使用巡检系统采集数据,巡检系统分别部署在不同的地理场景中去获取图像;
步骤S2:半监督数据标注:人工标注部分数据的标签,剩余数据采用小样本深度学习模型进行数据标注,小样本深度学习模型包括FasterRCNN主分支、多尺度正样本细化分支和fixmatch多尺度细化分支,当FasterRCNN主分支、多尺度正样本细化分支训练无法达到用户满意的效果时,开启fixmatch多尺度细化分支进行半监督循环训练;
步骤S3:数据对齐:采用基于加密传输的数据样本对齐技术,确认不同场景中的共有数据,一遍遍联合数据特征进行建模;
步骤 S4:主服务器分发公钥给各巡检站:在巡检系统中会设置一个主服务器用来协调各巡检站的数据以及模型信息,主服务器生成公钥,并通过加密算法 加密后分发给各巡检站;
步骤S5:各巡检站构建本地模型:根据任务需要,各巡检站在本地构建相同的本地模型,使用相同初始化;使用数据对齐后的数据在本地模型进行训练;
步骤S6:各巡检站上传加密模型梯度信息:各巡检站的本地模型在本地训练时需要将模型梯度信息上传到主服务器,通过加密算法对模型梯度信息进行加密,然后使用公钥将加密后的模型梯度信息上传到主服务器上,然后主服务器使用解密算法将各巡检站上传的加密模型梯度信息进行解密;
步骤S7:主服务器计算巡检站模型梯度信息:主服务器根据各巡检站提交的模型梯度信息计算各巡检站更新模型所必须的计算结果,并对各个巡检站的更新权重进行分配;分配原则使用数据分布动态加权法;
步骤S8:主服务器使用数据分布动态加权法返回巡检站模型更新参数;
步骤S9:各巡检站使用主服务器返回参数更新模型参数:根据主服务器分配的权重结果,通过加密传输到各巡检站,各巡检站根据分配的权重及加权后的模型梯度信息更新本地模型参数;
步骤S10:各巡检站共享中间结果,协助彼此计算模型参数:各巡检站根据本地数据训练的中间模型参数进行加密传输,加密方式使用加密算法处理,彼此通过共享中间参数,来互相更新模型;
步骤S11:得到联邦学习后的模型:在更新完参数后,主服务器以及各巡检站对模型参数进行共享,从而得到一个包含对所有类型数据都有充分训练的模型;
步骤S12:将实时拍摄图像数据输入联邦学习后的模型进行预测,得到实际应用场景预测结果;
步骤S13:对增量数据按照步骤S2-S11进行训练更新模型。
2.根据权利要求1所述的一种基于联邦学习的变电站多场景巡检分析方法,其特征在于,FasterRCNN主分支包括FPN网络Ⅰ、RPN网络和ROI分类回归网络,多尺度正样本细化分支包括FPN网络Ⅱ,FasterRCNN主分支和多尺度正样本细化分支的训练流程为:
S2-11.输入标注的原始图像,从原始图像中剪裁出正样本目标,对剪裁的正样本目标进行多尺度缩放,得到多尺度正样本图像,形成多尺度图像金字塔,作为多尺度正样本细化分支的输入;
S2-12.原始图像通过FPN网络Ⅰ后获得原始图像特征,多尺度正样本图像通过FPN网络Ⅱ后获得图像特征;
S2-13. FasterRCNN主分支中的原始图像特征通过RPN网络得到ROI后进入ROI分类回归网络获得最终的预测结果,同时计算出RPN背景分类损失,RPN 边框回归损失、ROI类别分类损失、ROI 边框回归损失,对FasterRCNN主分支进行更新优化;
S2-14. 多尺度正样本细化分支的图像特征为正样本图像特征,仅需计算ROI的类别分类损失和背景分类损失,背景分类损失合并到主分支的RPN背景分类损失中,类别分类损失合并到FasterRCNN主分支的ROI类别分类损失中,对小样本深度学习模型进行迭代更新。
3.根据权利要求2所述的一种基于联邦学习的变电站多场景巡检分析方法,其特征在于,fixmatch多尺度细化分支包括FPN网络Ⅲ,半监督循环训练的具体流程为:
S2-21.使用FasterRCNN主分支和多尺度正样本细化分支组成的模型对所有未标注的图像进行预测,挑选出置信度在阈值以上的预测框作为图像的标注,并使用挑选的标注进行FasterRCNN主分支和多尺度正样本细化分支的优化与更新;
S2-22.在fixmatch多尺度细化分支的训练时,将输入的多尺度正样本图像分别进行强增强和弱增强,以得到的强增强图像和弱增强图像作为一组输入样本;
S2-23.使用FPN网络Ⅲ对强增强图像和弱增强图像处理,得到弱增强图像输出、强增强图像输出和背景分类损失,背景分类损失合并到主分支的RPN背景分类损失;
S2-24.将弱增强图像输出的标签作为伪标签,强增强图像输出的标签作为真实标签,计算类别分类损失,并合并到FasterRCNN主分支的ROI类别分类损失中,更新优化小样本深度学习模型;
S2-25.重复步骤S2-21至 S2-24进行循环训练,直到小样本深度学习模型满足精度要求或设定的最大循环次数。
4.根据权利要求3所述的一种基于联邦学习的变电站多场景巡检分析方法,其特征在于,步骤S2-22中,在主服务器中构建自适应领域处理模块对不同巡检站的强增强图像和弱增强图像进行处理,然后再进入步骤S2-23,自适应领域处理模块包括特征提取器、领域分类器、类别分类器、拆解模块、重构模块,特征提取器从各强增强图像和弱增强图像中抽取视觉特征,领域分类器判断输入的视觉特征属于哪个巡检站,类别分类器分类输入图像具体的障碍类别,利用类别分类器对视觉特征进行类别分类,并利用交叉墒损失计算得到各类别内视觉特征的梯度;并利用领域分类结果产生的损失更新特征提取器和领域分类器的关联关系;拆解模块将视觉特征拆解为领域相关的特征或领域不相关的特征,重构模块将拆解完的特征重新构成整体特征;并利用拆解与重构过程中产生的对抗损失以及类别损失更新特征提取器、拆解模块、重构模块、类别分类器。
5.根据权利要求1所述的一种基于联邦学习的变电站多场景巡检分析方法,其特征在于,所述数据分布动态加权法具体为:
使用海林格距离对本地数据集的平衡程度进行量化;设两个离散概率分布数据集分别 为
Figure 448018DEST_PATH_IMAGE001
Figure 843228DEST_PATH_IMAGE002
,其中u n 代表数据集U中的第n个数据,v n 代表数据集V 中的第n个数据,则它们之间的海林格距离定义为:
Figure 657600DEST_PATH_IMAGE003
(1)
其中,u i 代表数据集U中的第i个数据,v i 代表数据集V中的第i个数据;
于是,本地数据集D k 的平衡程度通过计算其与平衡数据集的海林格距离来刻画;平衡数据集是指各类别样本数量分布均衡的数据集,定义一个基准数据集D b 作为平衡数据集的替代;在基准数据集D b 中,各个类别的样本数量人为设置一个合理的比例;海林格距离满足柯西-施瓦兹不等式,具有如下性质:
Figure 417745DEST_PATH_IMAGE004
(2)
使用式(3)所示的B k 表征本地数据集D k 的平衡情况,称为平衡度;平衡度是通过将式(2)计算出的本地数据集D k 与基准数据集D b 之间的海林格距离进行翻转后得到的:
Figure 684779DEST_PATH_IMAGE005
(3)
其中,
Figure 883679DEST_PATH_IMAGE006
Figure 739508DEST_PATH_IMAGE007
分别为本地数据集D k 与基准数据集D b 上的概率分布,H k 为第k个巡检站本 地数据集的海林格距离;
数据量权重计算方式为:
Figure 732872DEST_PATH_IMAGE008
(4)
其中q k 为第k个巡检站分配的数据量权重,D vk 为第k个巡检站的数据量,D v 为各巡检站数据集的总量;
将公式(3)中得到的平衡度通过归一化的方法转化为权重的形式,具体计算方式为:
Figure 487202DEST_PATH_IMAGE009
(5)
式中,B i 表征第i个巡检站本地数据集D i 的平衡情况,S k 为第k个巡检站的平衡度权重,K为巡检站总数量;
通过结合数据量权重和平衡度权重得到最终的综合权重;由式(4)和式(5)得到,数据 量权重的集合
Figure 161896DEST_PATH_IMAGE010
和平衡度权重的集合
Figure 685282DEST_PATH_IMAGE011
满足概率分布 的特点;令概率分布
Figure 115126DEST_PATH_IMAGE012
为基准分布,表示各巡检站不存在差异时的权重集 合;则
Figure 356752DEST_PATH_IMAGE013
Figure 818826DEST_PATH_IMAGE014
的定义为:
Figure 462297DEST_PATH_IMAGE015
式中,
Figure 797463DEST_PATH_IMAGE013
Figure 464068DEST_PATH_IMAGE014
分别表示数据量权重影响因子和平衡度权重影响因子;
得到:
Figure 542882DEST_PATH_IMAGE016
其中,
Figure 40860DEST_PATH_IMAGE017
是第k个巡检站在第t次与主服务器通信时的模型参数,
Figure 812507DEST_PATH_IMAGE018
表示第t次通信时 的联邦学习后的模型参数;
得到权重后,为每个巡检站提供相应的权重及加权后的梯度信息,从而指导巡检站更新本地模型。
CN202210063012.3A 2022-01-20 2022-01-20 基于联邦学习的变电站多场景巡检分析方法 Active CN114092769B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210063012.3A CN114092769B (zh) 2022-01-20 2022-01-20 基于联邦学习的变电站多场景巡检分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210063012.3A CN114092769B (zh) 2022-01-20 2022-01-20 基于联邦学习的变电站多场景巡检分析方法

Publications (2)

Publication Number Publication Date
CN114092769A true CN114092769A (zh) 2022-02-25
CN114092769B CN114092769B (zh) 2022-06-14

Family

ID=80308876

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210063012.3A Active CN114092769B (zh) 2022-01-20 2022-01-20 基于联邦学习的变电站多场景巡检分析方法

Country Status (1)

Country Link
CN (1) CN114092769B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114694015A (zh) * 2022-06-02 2022-07-01 深圳市万物云科技有限公司 基于通用框架的多任务联邦学习场景识别方法及相关组件
CN114897849A (zh) * 2022-05-21 2022-08-12 四川大学 一种基于卷积神经网络的新生儿耳廓形态畸形诊断方法
CN114898136A (zh) * 2022-03-14 2022-08-12 武汉理工大学 一种基于特征自适应的小样本图像分类方法
CN116361635A (zh) * 2023-06-02 2023-06-30 中国科学院成都文献情报中心 一种多维时序数据异常检测方法
CN116402275A (zh) * 2023-03-03 2023-07-07 河海大学 面向大坝智能协同巡检的无人载具动态选择方法
CN116756576A (zh) * 2023-08-17 2023-09-15 阿里巴巴(中国)有限公司 数据处理方法、模型训练方法、电子设备及存储介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200125739A1 (en) * 2018-10-19 2020-04-23 International Business Machines Corporation Distributed learning preserving model security
CN111143308A (zh) * 2019-12-26 2020-05-12 许昌中科森尼瑞技术有限公司 基于联邦学习的高低压电动机数据处理方法、系统及装置
CN111178538A (zh) * 2019-12-17 2020-05-19 杭州睿信数据科技有限公司 垂直数据的联邦学习方法及装置
CN111275207A (zh) * 2020-02-10 2020-06-12 深圳前海微众银行股份有限公司 基于半监督的横向联邦学习优化方法、设备及存储介质
CN112686385A (zh) * 2021-01-07 2021-04-20 中国人民解放军国防科技大学 面向多站点三维影像的联邦深度学习方法及系统
US20210225463A1 (en) * 2020-01-22 2021-07-22 doc.ai, Inc. System and Method with Federated Learning Model for Medical Research Applications
CN113609521A (zh) * 2021-07-27 2021-11-05 广州大学 一种基于对抗训练的联邦学习隐私保护方法及系统
CN113627085A (zh) * 2021-08-20 2021-11-09 深圳前海微众银行股份有限公司 横向联邦学习建模优化方法、设备、介质及程序产品
US20210357800A1 (en) * 2020-05-13 2021-11-18 Seagate Technology Llc Distributed decentralized machine learning model training
CN113705712A (zh) * 2021-09-02 2021-11-26 广州大学 一种基于联邦半监督学习的网络流量分类方法和系统
CN113850272A (zh) * 2021-09-10 2021-12-28 西安电子科技大学 基于本地差分隐私的联邦学习图像分类方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200125739A1 (en) * 2018-10-19 2020-04-23 International Business Machines Corporation Distributed learning preserving model security
CN111178538A (zh) * 2019-12-17 2020-05-19 杭州睿信数据科技有限公司 垂直数据的联邦学习方法及装置
CN111143308A (zh) * 2019-12-26 2020-05-12 许昌中科森尼瑞技术有限公司 基于联邦学习的高低压电动机数据处理方法、系统及装置
US20210225463A1 (en) * 2020-01-22 2021-07-22 doc.ai, Inc. System and Method with Federated Learning Model for Medical Research Applications
CN111275207A (zh) * 2020-02-10 2020-06-12 深圳前海微众银行股份有限公司 基于半监督的横向联邦学习优化方法、设备及存储介质
US20210357800A1 (en) * 2020-05-13 2021-11-18 Seagate Technology Llc Distributed decentralized machine learning model training
CN112686385A (zh) * 2021-01-07 2021-04-20 中国人民解放军国防科技大学 面向多站点三维影像的联邦深度学习方法及系统
CN113609521A (zh) * 2021-07-27 2021-11-05 广州大学 一种基于对抗训练的联邦学习隐私保护方法及系统
CN113627085A (zh) * 2021-08-20 2021-11-09 深圳前海微众银行股份有限公司 横向联邦学习建模优化方法、设备、介质及程序产品
CN113705712A (zh) * 2021-09-02 2021-11-26 广州大学 一种基于联邦半监督学习的网络流量分类方法和系统
CN113850272A (zh) * 2021-09-10 2021-12-28 西安电子科技大学 基于本地差分隐私的联邦学习图像分类方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
H. WANG等: ""Optimizing Federated Learning on Non-IID Data with Reinforcement Learning"", 《IEEE INFOCOM 2020 - IEEE CONFERENCE ON COMPUTER COMMUNICATIONS》 *
王亚珅: ""面向数据共享交换的联邦学习技术发展综述"", 《无人系统技术》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114898136A (zh) * 2022-03-14 2022-08-12 武汉理工大学 一种基于特征自适应的小样本图像分类方法
CN114898136B (zh) * 2022-03-14 2024-04-19 武汉理工大学 一种基于特征自适应的小样本图像分类方法
CN114897849A (zh) * 2022-05-21 2022-08-12 四川大学 一种基于卷积神经网络的新生儿耳廓形态畸形诊断方法
CN114694015A (zh) * 2022-06-02 2022-07-01 深圳市万物云科技有限公司 基于通用框架的多任务联邦学习场景识别方法及相关组件
CN116402275A (zh) * 2023-03-03 2023-07-07 河海大学 面向大坝智能协同巡检的无人载具动态选择方法
CN116402275B (zh) * 2023-03-03 2023-12-15 河海大学 面向大坝智能协同巡检的无人载具动态选择方法
CN116361635A (zh) * 2023-06-02 2023-06-30 中国科学院成都文献情报中心 一种多维时序数据异常检测方法
CN116361635B (zh) * 2023-06-02 2023-10-10 中国科学院成都文献情报中心 一种多维时序数据异常检测方法
CN116756576A (zh) * 2023-08-17 2023-09-15 阿里巴巴(中国)有限公司 数据处理方法、模型训练方法、电子设备及存储介质
CN116756576B (zh) * 2023-08-17 2023-12-12 阿里巴巴(中国)有限公司 数据处理方法、模型训练方法、电子设备及存储介质

Also Published As

Publication number Publication date
CN114092769B (zh) 2022-06-14

Similar Documents

Publication Publication Date Title
CN114092769B (zh) 基于联邦学习的变电站多场景巡检分析方法
CN111353413B (zh) 一种输电设备低漏报率缺陷识别方法
CN108921051B (zh) 基于循环神经网络注意力模型的行人属性识别网络及技术
CN110880019B (zh) 通过无监督域适应训练目标域分类模型的方法
CN114092832B (zh) 一种基于并联混合卷积网络的高分辨率遥感影像分类方法
CN112347970B (zh) 一种基于图卷积神经网络的遥感影像地物识别方法
CN109635748B (zh) 高分辨率影像中道路特征的提取方法
CN103824309B (zh) 一种城市建成区边界自动提取方法
CN109859171A (zh) 一种基于计算机视觉和深度学习的楼面缺陷自动检测方法
CN109120919B (zh) 一种针对图像质量主观评测的自动分析系统与方法
CN106991666B (zh) 一种适用于多尺寸图片信息的病害图像识别方法
CN108549907B (zh) 一种基于多源迁移学习的数据校验方法
CN112054943A (zh) 一种移动网络基站流量预测方法
CN108960404A (zh) 一种基于图像的人群计数方法及设备
CN114627467B (zh) 基于改进神经网络的水稻生育期识别方法及系统
CN114022878A (zh) 一种基于改进YOLOv5的串型番茄实时检测方法
CN111160128A (zh) 一种基于对抗神经网络模型的遥感图像处理方法及系统
CN112004233B (zh) 一种基于大数据挖掘的网络规划方法
CN112668754B (zh) 一种基于多源特征信息融合的电力设备缺陷诊断方法
CN111192206A (zh) 一种提高图像清晰度的方法
CN113343796B (zh) 一种基于知识蒸馏的雷达信号调制方式识别方法
CN118096922A (zh) 一种基于风格迁移和遥感影像生成地图的方法
Qin et al. A wireless sensor network location algorithm based on insufficient fingerprint information
CN113671599A (zh) 一种基于全球气候模式的登陆气旋识别方法
CN109800809A (zh) 一种基于维度分解的候选区域提取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant