CN114398685A - 一种政务数据处理方法、装置、计算机设备及存储介质 - Google Patents

一种政务数据处理方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN114398685A
CN114398685A CN202111229267.4A CN202111229267A CN114398685A CN 114398685 A CN114398685 A CN 114398685A CN 202111229267 A CN202111229267 A CN 202111229267A CN 114398685 A CN114398685 A CN 114398685A
Authority
CN
China
Prior art keywords
government affair
data
government
parameter
nodes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111229267.4A
Other languages
English (en)
Inventor
范进
闫晨旭
胡友龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hengyang Huolian Technology Co.,Ltd.
Original Assignee
Hainan Fire Chain Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hainan Fire Chain Technology Co ltd filed Critical Hainan Fire Chain Technology Co ltd
Priority to CN202111229267.4A priority Critical patent/CN114398685A/zh
Publication of CN114398685A publication Critical patent/CN114398685A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/64Protecting data integrity, e.g. using checksums, certificates or signatures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • G06F21/55Detecting local intrusion or implementing counter-measures
    • G06F21/56Computer malware detection or handling, e.g. anti-virus arrangements
    • G06F21/562Static detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Virology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种政务数据处理方法、装置、计算机设备及存储介质,该方法包括:基于区块链技术和联邦学习方式,构建政务数据共享架构,形成多地联合办公的政务数据模型;利用所述政务数据模型,探测多地联合办公的政务数据中是否存在设定的异常数据,以在探测到多地联合办公的政务数据中存在设定的异常数据的情况下,剔除所述异常数据。该方案,通过对政务数据中的异常数据进行探测和剔除,提升政务数据的安全性。

Description

一种政务数据处理方法、装置、计算机设备及存储介质
技术领域
本发明属于计算机技术领域,具体涉及一种政务数据处理方法、装置、计算机设备及存储介质,尤其涉及一种基于区块链和联邦学习的异常数据探测算法、装置、计算机设备及存储介质。
背景技术
随着计算机网络技术的飞速发展和互联网的广泛普及,病毒与黑客攻击日益增多,攻击手段也千变万化,使大量企业、机构和个人的电脑随时面临着被攻击和入侵的危险。尤其对于政务系统,更是需要病毒与黑客的主要攻击对象。但现有的政务系统网络安全防范不足,政务数据存在被恶意攻击、被恶意篡改的情况。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的目的在于,提供一种政务数据处理方法、装置、计算机设备及存储介质,以解决政务数据存在被恶意攻击、被恶意篡改的情况,使得政务数据的安全性较差的问题,达到通过对政务数据中的异常数据进行探测和剔除,提升政务数据的安全性的效果。
本发明提供一种政务数据处理方法,包括:基于区块链技术和联邦学习方式,构建政务数据共享架构,形成多地联合办公的政务数据模型;利用所述政务数据模型,探测多地联合办公的政务数据中是否存在设定的异常数据,以在探测到多地联合办公的政务数据中存在设定的异常数据的情况下,剔除所述异常数据。
在一些实施方式中,基于区块链技术和联邦学习方式,构建政务数据共享架构,包括:收集政务数据的政务节点,作为样本节点;通过区块链技术中的共识算法,自政务数据的政务节点中随机选出一个节点,成为当前轮次的聚合节点;利用所述当前轮次的聚合节点,根据参数集合降维后,构建孤立森林,得到孤立参数向量,并剔除孤立参数向量后完成聚合;将该剔除孤立参数向量后的向量的哈希上传到区块链防篡改,并将向量源数据下放给下轮参与节点,完成多地联合政务模型的聚合。
在一些实施方式中,根据参数集合降维,包括:聚合所述政务节点对于参数向量的各个维度,收集所述各个维度的对应值,依据箱体图参数降维算法进行数据降维。
在一些实施方式中,构建孤立森林,包括:聚合所述政务节点根据降维后的参数集合,利用参数孤立森林探测算法,构建拥有k棵孤立树的孤立森林,得到孤立参数向量;k为正整数。
在一些实施方式中,剔除孤立参数向量,包括:对于所述政务节点对于参数向量的各个维度,计算箱体图关键函数;根据箱体图关键函数,若一个维度向量内的所有值都在设定范围内,则该维度向量被剔除;若一个维度向量内的一半值都在设定范围外,则该维度向量被剔除。
与上述方法相匹配,本发明另一方面提供一种政务数据处理装置,包括:建模单元,被配置为基于区块链技术和联邦学习方式,构建政务数据共享架构,形成多地联合办公的政务数据模型;处理单元,被配置为利用所述政务数据模型,探测多地联合办公的政务数据中是否存在设定的异常数据,以在探测到多地联合办公的政务数据中存在设定的异常数据的情况下,剔除所述异常数据。
在一些实施方式中,所述建模单元,基于区块链技术和联邦学习方式,构建政务数据共享架构,包括:收集政务数据的政务节点,作为样本节点;通过区块链技术中的共识算法,自政务数据的政务节点中随机选出一个节点,成为当前轮次的聚合节点;利用所述当前轮次的聚合节点,根据参数集合降维后,构建孤立森林,得到孤立参数向量,并剔除孤立参数向量后完成聚合;将该剔除孤立参数向量后的向量的哈希上传到区块链防篡改,并将向量源数据下放给下轮参与节点,完成多地联合政务模型的聚合。
在一些实施方式中,所述建模单元,根据参数集合降维,包括:聚合所述政务节点对于参数向量的各个维度,收集所述各个维度的对应值,依据箱体图参数降维算法进行数据降维。
在一些实施方式中,所述建模单元,构建孤立森林,包括:聚合所述政务节点根据降维后的参数集合,利用参数孤立森林探测算法,构建拥有k棵孤立树的孤立森林,得到孤立参数向量;k为正整数。
在一些实施方式中,所述建模单元,剔除孤立参数向量,包括:对于所述政务节点对于参数向量的各个维度,计算箱体图关键函数;根据箱体图关键函数,若一个维度向量内的所有值都在设定范围内,则该维度向量被剔除;若一个维度向量内的一半值都在设定范围外,则该维度向量被剔除。
与上述装置相匹配,本发明再一方面提供一种计算机设备,包括:以上所述的政务数据处理装置。
与上述方法相匹配,本发明再一方面提供一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行以上所述的政务数据处理方法。
由此,本发明的方案,通过基于区块链构建政务数据共享架构,并采用联邦学习,在政务数据遭受攻击时,能够及时识别异常数据,合理剔除异常数据;从而,通过对政务数据中的异常数据进行探测和剔除,提升政务数据的安全性。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
图1为本发明的政务数据处理方法的一实施例的流程示意图;
图2为本发明的方法中构建政务数据共享架构的一实施例的流程示意图;
图3为本发明的政务数据处理装置的一实施例的结构示意图;
图4为本发明的基于区块链和联邦学习的异常数据探测算法的一实施例的流程示意图。
结合附图,本发明实施例中附图标记如下:
102-建模单元;104-处理单元。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明具体实施例及相应的附图对本发明技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
根据本发明的实施例,提供了一种政务数据处理方法,如图1所示本发明的方法的一实施例的流程示意图。该政务数据处理方法可以包括:步骤S110 和步骤S120。
在步骤S110处,基于区块链技术和联邦学习方式,构建政务数据共享架构,形成多地联合办公的政务数据模型。
在一些实施方式中,步骤S110中基于区块链技术和联邦学习方式,构建政务数据共享架构的具体过程,参见以下示例性说明。
下面结合图2所示本发明的方法中构建政务数据共享架构的一实施例流程示意图,进一步说明步骤S110中构建政务数据共享架构的具体过程,包括:步骤S210至步骤S240。
步骤S210,收集政务数据的政务节点,作为样本节点。
步骤S220,通过区块链技术中的共识算法,自政务数据的政务节点中随机选出一个节点,成为当前轮次的聚合节点。
步骤S230,利用所述当前轮次的聚合节点,根据参数集合降维后,构建孤立森林,得到孤立参数向量,并剔除孤立参数向量后完成聚合。
在一些实施方式中,步骤S230中根据参数集合降维,包括:聚合所述政务节点对于参数向量的各个维度,收集所述各个维度的对应值,依据箱体图参数降维算法进行数据降维。
图4为本发明的基于区块链和联邦学习的异常数据探测算法的一实施例的流程示意图。下面结合图4,对本发明的方案的具体实现过程进行示例性说明。如图4所示,本发明的方案提供的一种基于区块链和联邦学习的异常数据探测算法,包括:
步骤1、本地更新,核心政务部门通过共识算法随机选出一个政务节点成为当前轮次的聚合节点。
当前轮次的聚合节点随机选择参与本次聚合的政务节点,参与政务节点下载最新全局模型后进行本地训练,将训练结果上传到聚合政务节点。
步骤2、参数降维,聚合政务节点对于参数向量的各个维度,收集其对应值,依据箱型图思路进行数据降维。其中,依据箱型图思路进行数据降维,即依据箱体图参数降维算法(Dimensionality Reduction)进行降维。
箱体图参数降维算法,具体包括:
步骤21、对于n个部门,n为正整数。n个部门中的某个部门i,通过本地政务数据,训练获得本地模型参数wi,若模型向量存在d个维度,则本地模型参数表示为:
Figure RE-GDA0003559532520000051
步骤22、对于各个维度,维度矩阵表示为:
Figure RE-GDA0003559532520000052
在一些实施方式中,步骤S230中构建孤立森林,包括:聚合所述政务节点根据降维后的参数集合,利用参数孤立森林探测算法,构建拥有k棵孤立树的孤立森林,得到孤立参数向量。k为正整数。
如图4所示,本发明的方案提供的一种基于区块链和联邦学习的异常数据探测算法,还包括:
步骤3、构建孤立森林:聚合政务节点根据降维后的参数集合,构建拥有 k棵孤立树的孤立森林,得到孤立参数向量。
其中,可以利用参数孤立森林探测算法(Tree Reduction),构建孤立森林。
参数孤立森林探测算法,具体包括:
步骤31、对于每个参数维度
Figure RE-GDA0003559532520000061
将维度从小到大排序,将数据分成两部分,一部分是数值较小的一部分,另一部分为数值较大的一部分,两部分内部数据个数相同或者相差一个。要创建k个孤立树,将数据分成 k份,每一份包含一半数值小的数,一半数值大的数。对于每一份数据,构造孤立树。
步骤32、在训练集中随机选择变量S作为根节点,并随机在S的取值范围内选择分割点p。
步骤33、将≥p的样本放在左节点,将<p的样本放在右节点。
步骤34、对左右节点的数据重复步骤32、步骤33直到结束,结束的条件是以下三种情况之一:
①达到最大限度树的高度。②节点上的样本对应特征的值全相等。③节点只有一个样本。
在一些实施方式中,步骤S230中剔除孤立参数向量,包括:对于所述政务节点对于参数向量的各个维度,计算箱体图关键函数;根据箱体图关键函数,若一个维度向量内的所有值都在设定范围内,则该维度向量被剔除。若一个维度向量内的一半值都在设定范围外,则该维度向量被剔除。
如图4所示,本发明的方案提供的一种基于区块链和联邦学习的异常数据探测算法,还包括:
步骤4、异常数据剔除:聚合政务节点剔除参数向量集中的孤立参数向量。
具体地,对于每个维度
Figure RE-GDA0003559532520000062
计算箱体图关键函数Q:
Q=[Q1,Q3,M,IQR,L,H],Q1为下四分位数,Q3是上四分位数,M为中位数,IQR=Q3-Q1,L=Q1-1.5IQR,H=Q3-1.5IQR。
如果一个维度向量内的所有值都在L~H的范围中,该维度向量被剔除。
如果一个维度向量内的一半值都在L~H的范围外,该维度向量被剔除。
步骤5、服务器端聚合:聚合政务节点基于最新参数向量集完成模型聚合。
步骤6、区块链上传:将该向量的哈希上传到区块链防篡改。
本发明的方案,能够使当地政务数据不离开当地政务部门的前提下,共建政务模型,保证了关键政务数据不被泄露。还能够预防政务数据被恶意攻击,若数据被恶意篡改,能够将恶意数据剔除。将参数向量上传到区块链能够做到可信溯源,保证政务数据的可信应用。
步骤S240,将该剔除孤立参数向量后的向量的哈希上传到区块链防篡改,并将向量源数据下放给下轮参与节点,完成多地联合政务模型的聚合。
在本发明的方案中,核心政务部门,通过共识算法,即区块链的任何共识算法均可,例如pow、pos等,随机选出一个节点成为当前轮次的聚合节点。该节点(即当前轮次的聚合节点),根据参数集合,降维后构建孤立森林,得到孤立参数向量,并剔除孤立参数向量后完成聚合。进而,将该向量(即剔除孤立参数向量后的向量)的哈希上传到区块链防篡改,并将向量源数据下放给下轮参与节点,完成多地联合政务模型的聚合。
在步骤S120处,利用所述政务数据模型,探测多地联合办公的政务数据中是否存在设定的异常数据,以在探测到多地联合办公的政务数据中存在设定的异常数据的情况下,剔除所述异常数据。
本发明的方案,提出一种基于区块链和联邦学习的异常数据探测算法,基于区块链构建政务数据共享架构,并采用联邦学习,解决多地联合政务数据建模的问题,例如各地部门之间需要开发一种应用于部门会议的语音识别软件,仅应用于部门内部的政务文件重点提取模型等,旨在多地联合办公的政务数据遭受攻击时,能够及时识别异常数据,合理剔除异常数据,降低异常数据对政务系统准确度的影响。
其中,区块链是一个信息技术领域的术语。从本质上讲,它是一个共享数据库,存储于其中的数据或信息,具有“不可伪造”“全程留痕”“可以追溯”“公开透明”“集体维护”等特征。
联邦学习,即联邦机器学习,又名联合学习,联盟学习。联邦机器学习是一个机器学习框架,能有效帮助多个机构在满足用户隐私保护、数据安全和部门法规的要求下,进行数据使用和机器学习建模。
采用本实施例的技术方案,通过基于区块链构建政务数据共享架构,并采用联邦学习,在政务数据遭受攻击时,能够及时识别异常数据,合理剔除异常数据。从而,通过对政务数据中的异常数据进行探测和剔除,提升政务数据的安全性。
根据本发明的实施例,还提供了对应于政务数据处理方法的一种政务数据处理装置。参见图3所示本发明的装置的一实施例的结构示意图。该政务数据处理装置可以包括:建模单元102和处理单元104。
其中,建模单元102,被配置为基于区块链技术和联邦学习方式,构建政务数据共享架构,形成多地联合办公的政务数据模型。该建模单元102的具体功能及处理参见步骤S110。
在一些实施方式中,所述建模单元102,基于区块链技术和联邦学习方式,构建政务数据共享架构,包括:
所述建模单元102,具体被配置为收集政务数据的政务节点,作为样本节点。该建模单元102的具体功能及处理还参见步骤S210。
所述建模单元102,具体被配置为通过区块链技术中的共识算法,自政务数据的政务节点中随机选出一个节点,成为当前轮次的聚合节点。该建模单元 102的具体功能及处理还参见步骤S220。
所述建模单元102,具体被配置为利用所述当前轮次的聚合节点,根据参数集合降维后,构建孤立森林,得到孤立参数向量,并剔除孤立参数向量后完成聚合。该建模单元102的具体功能及处理还参见步骤S230。
在一些实施方式中,所述建模单元102,根据参数集合降维,包括:所述建模单元102,具体被配置为聚合所述政务节点对于参数向量的各个维度,收集所述各个维度的对应值,依据箱体图参数降维算法进行数据降维。
图4为本发明的基于区块链和联邦学习的异常数据探测算法的一实施例的流程示意图。下面结合图4,对本发明的方案的具体实现过程进行示例性说明。如图4所示,本发明的方案提供的一种基于区块链和联邦学习的异常数据探测算法,包括:
步骤1、本地更新,核心政务部门通过共识算法随机选出一个政务节点成为当前轮次的聚合节点。
当前轮次的聚合节点随机选择参与本次聚合的政务节点,参与政务节点下载最新全局模型后进行本地训练,将训练结果上传到聚合政务节点。
步骤2、参数降维,聚合政务节点对于参数向量的各个维度,收集其对应值,依据箱型图思路进行数据降维。其中,依据箱型图思路进行数据降维,即依据箱体图参数降维算法(Dimensionality Reduction)进行降维。
箱体图参数降维算法,具体包括:
步骤21、对于n个部门,n为正整数。n个部门中的某个部门i,通过本地政务数据,训练获得本地模型参数wi,若模型向量存在d个维度,则本地模型参数表示为:
Figure RE-GDA0003559532520000091
步骤22、对于各个维度,维度矩阵表示为:
Figure RE-GDA0003559532520000092
在一些实施方式中,所述建模单元102,构建孤立森林,包括:所述建模单元102,具体被配置为聚合所述政务节点根据降维后的参数集合,利用参数孤立森林探测算法,构建拥有k棵孤立树的孤立森林,得到孤立参数向量。k 为正整数。
如图4所示,本发明的方案提供的一种基于区块链和联邦学习的异常数据探测算法,还包括:
步骤3、构建孤立森林:聚合政务节点根据降维后的参数集合,构建拥有 k棵孤立树的孤立森林,得到孤立参数向量。
其中,可以利用参数孤立森林探测算法(Tree Reduction),构建孤立森林。
参数孤立森林探测算法,具体包括:
步骤31、对于每个参数维度
Figure RE-GDA0003559532520000093
将维度从小到大排序,将数据分成两部分,一部分是数值较小的一部分,另一部分为数值较大的一部分,两部分内部数据个数相同或者相差一个。要创建k个孤立树,将数据分成 k份,每一份包含一半数值小的数,一半数值大的数。对于每一份数据,构造孤立树。
步骤32、在训练集中随机选择变量S作为根节点,并随机在S的取值范围内选择分割点p。
步骤33、将≥p的样本放在左节点,将<p的样本放在右节点。
步骤34、对左右节点的数据重复步骤32、步骤33直到结束,结束的条件是以下三种情况之一:
①达到最大限度树的高度。②节点上的样本对应特征的值全相等。③节点只有一个样本。
在一些实施方式中,所述建模单元102,剔除孤立参数向量,包括:
所述建模单元102,具体被配置为对于所述政务节点对于参数向量的各个维度,计算箱体图关键函数。
所述建模单元102,具体被配置为根据箱体图关键函数,若一个维度向量内的所有值都在设定范围内,则该维度向量被剔除。若一个维度向量内的一半值都在设定范围外,则该维度向量被剔除。
如图4所示,本发明的方案提供的一种基于区块链和联邦学习的异常数据探测算法,还包括:
步骤4、异常数据剔除:聚合政务节点剔除参数向量集中的孤立参数向量。
具体地,对于每个维度
Figure RE-GDA0003559532520000101
计算箱体图关键函数Q:
Q=[Q1,Q3,M,IQR,L,H],Q1为下四分位数,Q3是上四分位数,M为中位数,IQR=Q3-Q1,L=Q1-1.5IQR,H=Q3-1.5IQR。
如果一个维度向量内的所有值都在L~H的范围中,该维度向量被剔除。
如果一个维度向量内的一半值都在L~H的范围外,该维度向量被剔除。
步骤5、服务器端聚合:聚合政务节点基于最新参数向量集完成模型聚合。
步骤6、区块链上传:将该向量的哈希上传到区块链防篡改。
本发明的方案,能够使当地政务数据不离开当地政务部门的前提下,共建政务模型,保证了关键政务数据不被泄露。还能够预防政务数据被恶意攻击,若数据被恶意篡改,能够将恶意数据剔除。将参数向量上传到区块链能够做到可信溯源,保证政务数据的可信应用。
所述建模单元102,具体被配置为将该剔除孤立参数向量后的向量的哈希上传到区块链防篡改,并将向量源数据下放给下轮参与节点,完成多地联合政务模型的聚合。该建模单元102的具体功能及处理还参见步骤S240。
在本发明的方案中,核心政务部门,通过共识算法,随机选出一个节点成为当前轮次的聚合节点。该节点(即当前轮次的聚合节点),根据参数集合,降维后构建孤立森林,得到孤立参数向量,并剔除孤立参数向量后完成聚合。进而,将该向量(即剔除孤立参数向量后的向量)的哈希上传到区块链防篡改,并将向量源数据下放给下轮参与节点,完成多地联合政务模型的聚合。
处理单元104,被配置为利用所述政务数据模型,探测多地联合办公的政务数据中是否存在设定的异常数据,以在探测到多地联合办公的政务数据中存在设定的异常数据的情况下,剔除所述异常数据。该处理单元104的具体功能及处理参见步骤S120。
本发明的方案,提出一种基于区块链和联邦学习的异常数据探测算法,基于区块链构建政务数据共享架构,并采用联邦学习,解决多地联合政务数据建模的问题,旨在多地联合办公的政务数据遭受攻击时,能够及时识别异常数据,合理剔除异常数据,降低异常数据对政务系统准确度的影响。
其中,区块链是一个信息技术领域的术语。从本质上讲,它是一个共享数据库,存储于其中的数据或信息,具有“不可伪造”“全程留痕”“可以追溯”“公开透明”“集体维护”等特征。
联邦学习,即联邦机器学习,又名联合学习,联盟学习。联邦机器学习是一个机器学习框架,能有效帮助多个机构在满足用户隐私保护、数据安全和部门法规的要求下,进行数据使用和机器学习建模。
由于本实施例的装置所实现的处理及功能基本相应于前述方法的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。
采用本发明的技术方案,通过基于区块链构建政务数据共享架构,并采用联邦学习,在政务数据遭受攻击时,能够及时识别异常数据,合理剔除异常数据,保证了关键政务数据不被泄露。
根据本发明的实施例,还提供了对应于政务数据处理装置的一种计算机设备。该计算机设备可以包括:以上所述的政务数据处理装置。
由于本实施例的计算机设备所实现的处理及功能基本相应于前述装置的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。
采用本发明的技术方案,通过基于区块链构建政务数据共享架构,并采用联邦学习,在政务数据遭受攻击时,能够及时识别异常数据,合理剔除异常数据,保证政务数据的可信应用。
根据本发明的实施例,还提供了对应于政务数据处理方法的一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行以上所述的政务数据处理方法。
由于本实施例的存储介质所实现的处理及功能基本相应于前述方法的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。
采用本发明的技术方案,通过基于区块链构建政务数据共享架构,并采用联邦学习,在政务数据遭受攻击时,能够及时识别异常数据,合理剔除异常数据,降低异常数据对政务系统准确度的影响。
综上,本领域技术人员容易理解的是,在不冲突的前提下,上述各有利方式可以自由地组合、叠加。
以上所述仅为本发明的实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。

Claims (10)

1.一种政务数据处理方法,其特征在于,包括:
基于区块链技术和联邦学习方式,构建政务数据共享架构,形成多地联合办公的政务数据模型;
利用所述政务数据模型,探测多地联合办公的政务数据中是否存在设定的异常数据,以在探测到多地联合办公的政务数据中存在设定的异常数据的情况下,剔除所述异常数据。
2.根据权利要求1所述的政务数据处理方法,其特征在于,基于区块链技术和联邦学习方式,构建政务数据共享架构,包括:
收集政务数据的政务节点,作为样本节点;
通过区块链技术中的共识算法,自政务数据的政务节点中随机选出一个节点,成为当前轮次的聚合节点;
利用所述当前轮次的聚合节点,根据参数集合降维后,构建孤立森林,得到孤立参数向量,并剔除孤立参数向量后完成聚合;
将该剔除孤立参数向量后的向量的哈希上传到区块链防篡改,并将向量源数据下放给下轮参与节点,完成多地联合政务模型的聚合。
3.根据权利要求2所述的政务数据处理方法,其特征在于,根据参数集合降维,包括:
聚合所述政务节点对于参数向量的各个维度,收集所述各个维度的对应值,依据箱体图参数降维算法进行数据降维。
4.根据权利要求2所述的政务数据处理方法,其特征在于,构建孤立森林,包括:
聚合所述政务节点根据降维后的参数集合,利用参数孤立森林探测算法,构建拥有k棵孤立树的孤立森林,得到孤立参数向量;k为正整数。
5.根据权利要求2所述的政务数据处理方法,其特征在于,剔除孤立参数向量,包括:
对于所述政务节点对于参数向量的各个维度,计算箱体图关键函数;
根据箱体图关键函数,若一个维度向量内的所有值都在设定范围内,则该维度向量被剔除;若一个维度向量内的一半值都在设定范围外,则该维度向量被剔除。
6.一种政务数据处理装置,其特征在于,包括:
建模单元,被配置为基于区块链技术和联邦学习方式,构建政务数据共享架构,形成多地联合办公的政务数据模型;
处理单元,被配置为利用所述政务数据模型,探测多地联合办公的政务数据中是否存在设定的异常数据,以在探测到多地联合办公的政务数据中存在设定的异常数据的情况下,剔除所述异常数据。
7.根据权利要求6所述的政务数据处理装置,其特征在于,所述建模单元,基于区块链技术和联邦学习方式,构建政务数据共享架构,包括:
收集政务数据的政务节点,作为样本节点;
通过区块链技术中的共识算法,自政务数据的政务节点中随机选出一个节点,成为当前轮次的聚合节点;
利用所述当前轮次的聚合节点,根据参数集合降维后,构建孤立森林,得到孤立参数向量,并剔除孤立参数向量后完成聚合;
将该剔除孤立参数向量后的向量的哈希上传到区块链防篡改,并将向量源数据下放给下轮参与节点,完成多地联合政务模型的聚合。
8.根据权利要求7所述的政务数据处理装置,其特征在于,所述建模单元,根据参数集合降维,包括:
聚合所述政务节点对于参数向量的各个维度,收集所述各个维度的对应值,依据箱体图参数降维算法进行数据降维。
9.一种计算机设备,其特征在于,包括:如权利要求6至8中任一项所述的政务数据处理装置。
10.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至5中任一项所述的政务数据处理方法。
CN202111229267.4A 2021-10-21 2021-10-21 一种政务数据处理方法、装置、计算机设备及存储介质 Pending CN114398685A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111229267.4A CN114398685A (zh) 2021-10-21 2021-10-21 一种政务数据处理方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111229267.4A CN114398685A (zh) 2021-10-21 2021-10-21 一种政务数据处理方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN114398685A true CN114398685A (zh) 2022-04-26

Family

ID=81225807

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111229267.4A Pending CN114398685A (zh) 2021-10-21 2021-10-21 一种政务数据处理方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN114398685A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115982097A (zh) * 2022-12-20 2023-04-18 河北东软软件有限公司 一种基于政务数据的数据归档方法、装置及相关组件
CN117077067A (zh) * 2023-10-18 2023-11-17 北京亚康万玮信息技术股份有限公司 一种基于智能匹配的信息系统自动部署规划方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115982097A (zh) * 2022-12-20 2023-04-18 河北东软软件有限公司 一种基于政务数据的数据归档方法、装置及相关组件
CN115982097B (zh) * 2022-12-20 2023-10-27 河北东软软件有限公司 一种基于政务数据的数据归档方法、装置及相关组件
CN117077067A (zh) * 2023-10-18 2023-11-17 北京亚康万玮信息技术股份有限公司 一种基于智能匹配的信息系统自动部署规划方法
CN117077067B (zh) * 2023-10-18 2023-12-22 北京亚康万玮信息技术股份有限公司 一种基于智能匹配的信息系统自动部署规划方法

Similar Documents

Publication Publication Date Title
CN109922069B (zh) 高级持续性威胁的多维关联分析方法及系统
CN107679997A (zh) 医疗理赔拒付方法、装置、终端设备及存储介质
CN112468347B (zh) 一种云平台的安全管理方法、装置、电子设备及存储介质
CN114398685A (zh) 一种政务数据处理方法、装置、计算机设备及存储介质
CN110287316A (zh) 一种告警分类方法、装置、电子设备及存储介质
CN113434859A (zh) 入侵检测方法、装置、设备及存储介质
CN112600794A (zh) 一种联合深度学习中检测gan攻击的方法
Shi et al. A framework of intrusion detection system based on Bayesian network in IoT
WO2023035362A1 (zh) 用于模型训练的污染样本数据的检测方法及装置
CN113011893B (zh) 数据处理方法、装置、计算机设备及存储介质
CN114282258A (zh) 截屏数据脱敏方法、装置、计算机设备及存储介质
CN117541033A (zh) 面向作战任务的能力需求分析方法、服务器及存储介质
CN117729027A (zh) 异常行为检测方法、装置、电子设备及存储介质
CN115713424A (zh) 风险评估方法、风险评估装置、设备及存储介质
CN117375855A (zh) 一种异常检测方法、模型训练方法及相关设备
CN114866338A (zh) 网络安全检测方法、装置及电子设备
CN111652102B (zh) 一种输电通道目标物辨识方法及系统
CN108377275A (zh) 基于神经网络算法的网络安全防护方法
CN112950222A (zh) 资源处理异常检测方法、装置、电子设备及存储介质
CN114615056B (zh) 一种基于对抗鲁棒性学习的Tor恶意流量检测方法
CN114338147B (zh) 一种口令爆破攻击的检测方法及装置
CN113987309B (zh) 个人隐私数据识别方法、装置、计算机设备及存储介质
CN116629388B (zh) 差分隐私联邦学习训练方法、装置和计算机可读存储介质
CN113657429B (zh) 面向数字孪生城市物联网的数据融合方法及装置
CN115455258B (zh) 一种网络空间语言描述与分析方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20230703

Address after: Office 0184, Xiangnan Xiangxi Blockchain Industrial Park, No. 2, Zhengshui Avenue, High tech Zone, Hengyang City, Hunan Province, 421099

Applicant after: Hengyang Huolian Technology Co.,Ltd.

Address before: 571924 Walker Park, Hainan Ecological Software Park, Old Town High tech Industrial Demonstration Zone, Chengmai County, Administrative division, County level, Hainan Province 8830

Applicant before: Hainan fire Chain Technology Co.,Ltd.