CN114398685A

CN114398685A - 一种政务数据处理方法、装置、计算机设备及存储介质

Info

Publication number: CN114398685A
Application number: CN202111229267.4A
Authority: CN
Inventors: 范进; 闫晨旭; 胡友龙
Original assignee: Hainan Fire Chain Technology Co ltd
Current assignee: Hengyang Huolian Technology Co.,Ltd.
Priority date: 2021-10-21
Filing date: 2021-10-21
Publication date: 2022-04-26

Abstract

本发明公开了一种政务数据处理方法、装置、计算机设备及存储介质，该方法包括：基于区块链技术和联邦学习方式，构建政务数据共享架构，形成多地联合办公的政务数据模型；利用所述政务数据模型，探测多地联合办公的政务数据中是否存在设定的异常数据，以在探测到多地联合办公的政务数据中存在设定的异常数据的情况下，剔除所述异常数据。该方案，通过对政务数据中的异常数据进行探测和剔除，提升政务数据的安全性。

Description

一种政务数据处理方法、装置、计算机设备及存储介质

技术领域

本发明属于计算机技术领域，具体涉及一种政务数据处理方法、装置、计算机设备及存储介质，尤其涉及一种基于区块链和联邦学习的异常数据探测算法、装置、计算机设备及存储介质。

背景技术

随着计算机网络技术的飞速发展和互联网的广泛普及，病毒与黑客攻击日益增多，攻击手段也千变万化，使大量企业、机构和个人的电脑随时面临着被攻击和入侵的危险。尤其对于政务系统，更是需要病毒与黑客的主要攻击对象。但现有的政务系统网络安全防范不足，政务数据存在被恶意攻击、被恶意篡改的情况。

上述内容仅用于辅助理解本发明的技术方案，并不代表承认上述内容是现有技术。

发明内容

本发明的目的在于，提供一种政务数据处理方法、装置、计算机设备及存储介质，以解决政务数据存在被恶意攻击、被恶意篡改的情况，使得政务数据的安全性较差的问题，达到通过对政务数据中的异常数据进行探测和剔除，提升政务数据的安全性的效果。

本发明提供一种政务数据处理方法，包括：基于区块链技术和联邦学习方式，构建政务数据共享架构，形成多地联合办公的政务数据模型；利用所述政务数据模型，探测多地联合办公的政务数据中是否存在设定的异常数据，以在探测到多地联合办公的政务数据中存在设定的异常数据的情况下，剔除所述异常数据。

在一些实施方式中，基于区块链技术和联邦学习方式，构建政务数据共享架构，包括：收集政务数据的政务节点，作为样本节点；通过区块链技术中的共识算法，自政务数据的政务节点中随机选出一个节点，成为当前轮次的聚合节点；利用所述当前轮次的聚合节点，根据参数集合降维后，构建孤立森林，得到孤立参数向量，并剔除孤立参数向量后完成聚合；将该剔除孤立参数向量后的向量的哈希上传到区块链防篡改，并将向量源数据下放给下轮参与节点，完成多地联合政务模型的聚合。

在一些实施方式中，根据参数集合降维，包括：聚合所述政务节点对于参数向量的各个维度，收集所述各个维度的对应值，依据箱体图参数降维算法进行数据降维。

在一些实施方式中，构建孤立森林，包括：聚合所述政务节点根据降维后的参数集合，利用参数孤立森林探测算法，构建拥有k棵孤立树的孤立森林，得到孤立参数向量；k为正整数。

在一些实施方式中，剔除孤立参数向量，包括：对于所述政务节点对于参数向量的各个维度，计算箱体图关键函数；根据箱体图关键函数，若一个维度向量内的所有值都在设定范围内，则该维度向量被剔除；若一个维度向量内的一半值都在设定范围外，则该维度向量被剔除。

与上述方法相匹配，本发明另一方面提供一种政务数据处理装置，包括：建模单元，被配置为基于区块链技术和联邦学习方式，构建政务数据共享架构，形成多地联合办公的政务数据模型；处理单元，被配置为利用所述政务数据模型，探测多地联合办公的政务数据中是否存在设定的异常数据，以在探测到多地联合办公的政务数据中存在设定的异常数据的情况下，剔除所述异常数据。

在一些实施方式中，所述建模单元，基于区块链技术和联邦学习方式，构建政务数据共享架构，包括：收集政务数据的政务节点，作为样本节点；通过区块链技术中的共识算法，自政务数据的政务节点中随机选出一个节点，成为当前轮次的聚合节点；利用所述当前轮次的聚合节点，根据参数集合降维后，构建孤立森林，得到孤立参数向量，并剔除孤立参数向量后完成聚合；将该剔除孤立参数向量后的向量的哈希上传到区块链防篡改，并将向量源数据下放给下轮参与节点，完成多地联合政务模型的聚合。

在一些实施方式中，所述建模单元，根据参数集合降维，包括：聚合所述政务节点对于参数向量的各个维度，收集所述各个维度的对应值，依据箱体图参数降维算法进行数据降维。

在一些实施方式中，所述建模单元，构建孤立森林，包括：聚合所述政务节点根据降维后的参数集合，利用参数孤立森林探测算法，构建拥有k棵孤立树的孤立森林，得到孤立参数向量；k为正整数。

在一些实施方式中，所述建模单元，剔除孤立参数向量，包括：对于所述政务节点对于参数向量的各个维度，计算箱体图关键函数；根据箱体图关键函数，若一个维度向量内的所有值都在设定范围内，则该维度向量被剔除；若一个维度向量内的一半值都在设定范围外，则该维度向量被剔除。

与上述装置相匹配，本发明再一方面提供一种计算机设备，包括：以上所述的政务数据处理装置。

与上述方法相匹配，本发明再一方面提供一种存储介质，所述存储介质包括存储的程序，其中，在所述程序运行时控制所述存储介质所在设备执行以上所述的政务数据处理方法。

由此，本发明的方案，通过基于区块链构建政务数据共享架构，并采用联邦学习，在政务数据遭受攻击时，能够及时识别异常数据，合理剔除异常数据；从而，通过对政务数据中的异常数据进行探测和剔除，提升政务数据的安全性。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

图1为本发明的政务数据处理方法的一实施例的流程示意图；

图2为本发明的方法中构建政务数据共享架构的一实施例的流程示意图；

图3为本发明的政务数据处理装置的一实施例的结构示意图；

图4为本发明的基于区块链和联邦学习的异常数据探测算法的一实施例的流程示意图。

结合附图，本发明实施例中附图标记如下：

102-建模单元；104-处理单元。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明具体实施例及相应的附图对本发明技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

根据本发明的实施例，提供了一种政务数据处理方法，如图1所示本发明的方法的一实施例的流程示意图。该政务数据处理方法可以包括：步骤S110 和步骤S120。

在步骤S110处，基于区块链技术和联邦学习方式，构建政务数据共享架构，形成多地联合办公的政务数据模型。

在一些实施方式中，步骤S110中基于区块链技术和联邦学习方式，构建政务数据共享架构的具体过程，参见以下示例性说明。

下面结合图2所示本发明的方法中构建政务数据共享架构的一实施例流程示意图，进一步说明步骤S110中构建政务数据共享架构的具体过程，包括：步骤S210至步骤S240。

步骤S210，收集政务数据的政务节点，作为样本节点。

步骤S220，通过区块链技术中的共识算法，自政务数据的政务节点中随机选出一个节点，成为当前轮次的聚合节点。

步骤S230，利用所述当前轮次的聚合节点，根据参数集合降维后，构建孤立森林，得到孤立参数向量，并剔除孤立参数向量后完成聚合。

在一些实施方式中，步骤S230中根据参数集合降维，包括：聚合所述政务节点对于参数向量的各个维度，收集所述各个维度的对应值，依据箱体图参数降维算法进行数据降维。

图4为本发明的基于区块链和联邦学习的异常数据探测算法的一实施例的流程示意图。下面结合图4，对本发明的方案的具体实现过程进行示例性说明。如图4所示，本发明的方案提供的一种基于区块链和联邦学习的异常数据探测算法，包括：

步骤1、本地更新，核心政务部门通过共识算法随机选出一个政务节点成为当前轮次的聚合节点。

当前轮次的聚合节点随机选择参与本次聚合的政务节点，参与政务节点下载最新全局模型后进行本地训练，将训练结果上传到聚合政务节点。

步骤2、参数降维，聚合政务节点对于参数向量的各个维度，收集其对应值，依据箱型图思路进行数据降维。其中，依据箱型图思路进行数据降维，即依据箱体图参数降维算法(Dimensionality Reduction)进行降维。

箱体图参数降维算法，具体包括：

步骤21、对于n个部门，n为正整数。n个部门中的某个部门i，通过本地政务数据，训练获得本地模型参数w_i，若模型向量存在d个维度，则本地模型参数表示为：

步骤22、对于各个维度，维度矩阵表示为：

在一些实施方式中，步骤S230中构建孤立森林，包括：聚合所述政务节点根据降维后的参数集合，利用参数孤立森林探测算法，构建拥有k棵孤立树的孤立森林，得到孤立参数向量。k为正整数。

如图4所示，本发明的方案提供的一种基于区块链和联邦学习的异常数据探测算法，还包括：

步骤3、构建孤立森林：聚合政务节点根据降维后的参数集合，构建拥有 k棵孤立树的孤立森林，得到孤立参数向量。

其中，可以利用参数孤立森林探测算法(Tree Reduction)，构建孤立森林。

参数孤立森林探测算法，具体包括：

步骤31、对于每个参数维度

将维度从小到大排序，将数据分成两部分，一部分是数值较小的一部分，另一部分为数值较大的一部分，两部分内部数据个数相同或者相差一个。要创建k个孤立树，将数据分成 k份，每一份包含一半数值小的数，一半数值大的数。对于每一份数据，构造孤立树。

步骤32、在训练集中随机选择变量S作为根节点，并随机在S的取值范围内选择分割点p。

步骤33、将≥p的样本放在左节点，将＜p的样本放在右节点。

步骤34、对左右节点的数据重复步骤32、步骤33直到结束，结束的条件是以下三种情况之一：

①达到最大限度树的高度。②节点上的样本对应特征的值全相等。③节点只有一个样本。

在一些实施方式中，步骤S230中剔除孤立参数向量，包括：对于所述政务节点对于参数向量的各个维度，计算箱体图关键函数；根据箱体图关键函数，若一个维度向量内的所有值都在设定范围内，则该维度向量被剔除。若一个维度向量内的一半值都在设定范围外，则该维度向量被剔除。

步骤4、异常数据剔除：聚合政务节点剔除参数向量集中的孤立参数向量。

具体地，对于每个维度

计算箱体图关键函数Q：

Q＝[Q₁，Q₃，M，IQR，L，H]，Q₁为下四分位数，Q₃是上四分位数，M为中位数，IQR＝Q₃-Q₁，L＝Q₁-1.5IQR，H＝Q₃-1.5IQR。

如果一个维度向量内的所有值都在L～H的范围中，该维度向量被剔除。

如果一个维度向量内的一半值都在L～H的范围外，该维度向量被剔除。

步骤5、服务器端聚合：聚合政务节点基于最新参数向量集完成模型聚合。

步骤6、区块链上传：将该向量的哈希上传到区块链防篡改。

本发明的方案，能够使当地政务数据不离开当地政务部门的前提下，共建政务模型，保证了关键政务数据不被泄露。还能够预防政务数据被恶意攻击，若数据被恶意篡改，能够将恶意数据剔除。将参数向量上传到区块链能够做到可信溯源，保证政务数据的可信应用。

步骤S240，将该剔除孤立参数向量后的向量的哈希上传到区块链防篡改，并将向量源数据下放给下轮参与节点，完成多地联合政务模型的聚合。

在本发明的方案中，核心政务部门，通过共识算法，即区块链的任何共识算法均可，例如pow、pos等，随机选出一个节点成为当前轮次的聚合节点。该节点(即当前轮次的聚合节点)，根据参数集合，降维后构建孤立森林，得到孤立参数向量，并剔除孤立参数向量后完成聚合。进而，将该向量(即剔除孤立参数向量后的向量)的哈希上传到区块链防篡改，并将向量源数据下放给下轮参与节点，完成多地联合政务模型的聚合。

在步骤S120处，利用所述政务数据模型，探测多地联合办公的政务数据中是否存在设定的异常数据，以在探测到多地联合办公的政务数据中存在设定的异常数据的情况下，剔除所述异常数据。

本发明的方案，提出一种基于区块链和联邦学习的异常数据探测算法，基于区块链构建政务数据共享架构，并采用联邦学习，解决多地联合政务数据建模的问题，例如各地部门之间需要开发一种应用于部门会议的语音识别软件，仅应用于部门内部的政务文件重点提取模型等，旨在多地联合办公的政务数据遭受攻击时，能够及时识别异常数据，合理剔除异常数据，降低异常数据对政务系统准确度的影响。

其中，区块链是一个信息技术领域的术语。从本质上讲，它是一个共享数据库，存储于其中的数据或信息，具有“不可伪造”“全程留痕”“可以追溯”“公开透明”“集体维护”等特征。

联邦学习，即联邦机器学习，又名联合学习，联盟学习。联邦机器学习是一个机器学习框架，能有效帮助多个机构在满足用户隐私保护、数据安全和部门法规的要求下，进行数据使用和机器学习建模。

采用本实施例的技术方案，通过基于区块链构建政务数据共享架构，并采用联邦学习，在政务数据遭受攻击时，能够及时识别异常数据，合理剔除异常数据。从而，通过对政务数据中的异常数据进行探测和剔除，提升政务数据的安全性。

根据本发明的实施例，还提供了对应于政务数据处理方法的一种政务数据处理装置。参见图3所示本发明的装置的一实施例的结构示意图。该政务数据处理装置可以包括：建模单元102和处理单元104。

其中，建模单元102，被配置为基于区块链技术和联邦学习方式，构建政务数据共享架构，形成多地联合办公的政务数据模型。该建模单元102的具体功能及处理参见步骤S110。

在一些实施方式中，所述建模单元102，基于区块链技术和联邦学习方式，构建政务数据共享架构，包括：

所述建模单元102，具体被配置为收集政务数据的政务节点，作为样本节点。该建模单元102的具体功能及处理还参见步骤S210。

所述建模单元102，具体被配置为通过区块链技术中的共识算法，自政务数据的政务节点中随机选出一个节点，成为当前轮次的聚合节点。该建模单元 102的具体功能及处理还参见步骤S220。

所述建模单元102，具体被配置为利用所述当前轮次的聚合节点，根据参数集合降维后，构建孤立森林，得到孤立参数向量，并剔除孤立参数向量后完成聚合。该建模单元102的具体功能及处理还参见步骤S230。

在一些实施方式中，所述建模单元102，根据参数集合降维，包括：所述建模单元102，具体被配置为聚合所述政务节点对于参数向量的各个维度，收集所述各个维度的对应值，依据箱体图参数降维算法进行数据降维。

箱体图参数降维算法，具体包括：

步骤22、对于各个维度，维度矩阵表示为：

在一些实施方式中，所述建模单元102，构建孤立森林，包括：所述建模单元102，具体被配置为聚合所述政务节点根据降维后的参数集合，利用参数孤立森林探测算法，构建拥有k棵孤立树的孤立森林，得到孤立参数向量。k 为正整数。

参数孤立森林探测算法，具体包括：

步骤31、对于每个参数维度

步骤33、将≥p的样本放在左节点，将＜p的样本放在右节点。

在一些实施方式中，所述建模单元102，剔除孤立参数向量，包括：

所述建模单元102，具体被配置为对于所述政务节点对于参数向量的各个维度，计算箱体图关键函数。

所述建模单元102，具体被配置为根据箱体图关键函数，若一个维度向量内的所有值都在设定范围内，则该维度向量被剔除。若一个维度向量内的一半值都在设定范围外，则该维度向量被剔除。

具体地，对于每个维度

计算箱体图关键函数Q：

步骤6、区块链上传：将该向量的哈希上传到区块链防篡改。

所述建模单元102，具体被配置为将该剔除孤立参数向量后的向量的哈希上传到区块链防篡改，并将向量源数据下放给下轮参与节点，完成多地联合政务模型的聚合。该建模单元102的具体功能及处理还参见步骤S240。

在本发明的方案中，核心政务部门，通过共识算法，随机选出一个节点成为当前轮次的聚合节点。该节点(即当前轮次的聚合节点)，根据参数集合，降维后构建孤立森林，得到孤立参数向量，并剔除孤立参数向量后完成聚合。进而，将该向量(即剔除孤立参数向量后的向量)的哈希上传到区块链防篡改，并将向量源数据下放给下轮参与节点，完成多地联合政务模型的聚合。

处理单元104，被配置为利用所述政务数据模型，探测多地联合办公的政务数据中是否存在设定的异常数据，以在探测到多地联合办公的政务数据中存在设定的异常数据的情况下，剔除所述异常数据。该处理单元104的具体功能及处理参见步骤S120。

本发明的方案，提出一种基于区块链和联邦学习的异常数据探测算法，基于区块链构建政务数据共享架构，并采用联邦学习，解决多地联合政务数据建模的问题，旨在多地联合办公的政务数据遭受攻击时，能够及时识别异常数据，合理剔除异常数据，降低异常数据对政务系统准确度的影响。

由于本实施例的装置所实现的处理及功能基本相应于前述方法的实施例、原理和实例，故本实施例的描述中未详尽之处，可以参见前述实施例中的相关说明，在此不做赘述。

采用本发明的技术方案，通过基于区块链构建政务数据共享架构，并采用联邦学习，在政务数据遭受攻击时，能够及时识别异常数据，合理剔除异常数据，保证了关键政务数据不被泄露。

根据本发明的实施例，还提供了对应于政务数据处理装置的一种计算机设备。该计算机设备可以包括：以上所述的政务数据处理装置。

由于本实施例的计算机设备所实现的处理及功能基本相应于前述装置的实施例、原理和实例，故本实施例的描述中未详尽之处，可以参见前述实施例中的相关说明，在此不做赘述。

采用本发明的技术方案，通过基于区块链构建政务数据共享架构，并采用联邦学习，在政务数据遭受攻击时，能够及时识别异常数据，合理剔除异常数据，保证政务数据的可信应用。

根据本发明的实施例，还提供了对应于政务数据处理方法的一种存储介质，所述存储介质包括存储的程序，其中，在所述程序运行时控制所述存储介质所在设备执行以上所述的政务数据处理方法。

由于本实施例的存储介质所实现的处理及功能基本相应于前述方法的实施例、原理和实例，故本实施例的描述中未详尽之处，可以参见前述实施例中的相关说明，在此不做赘述。

采用本发明的技术方案，通过基于区块链构建政务数据共享架构，并采用联邦学习，在政务数据遭受攻击时，能够及时识别异常数据，合理剔除异常数据，降低异常数据对政务系统准确度的影响。

综上，本领域技术人员容易理解的是，在不冲突的前提下，上述各有利方式可以自由地组合、叠加。

以上所述仅为本发明的实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的权利要求范围之内。

Claims

1.一种政务数据处理方法，其特征在于，包括：

基于区块链技术和联邦学习方式，构建政务数据共享架构，形成多地联合办公的政务数据模型；

利用所述政务数据模型，探测多地联合办公的政务数据中是否存在设定的异常数据，以在探测到多地联合办公的政务数据中存在设定的异常数据的情况下，剔除所述异常数据。

2.根据权利要求1所述的政务数据处理方法，其特征在于，基于区块链技术和联邦学习方式，构建政务数据共享架构，包括：

收集政务数据的政务节点，作为样本节点；

通过区块链技术中的共识算法，自政务数据的政务节点中随机选出一个节点，成为当前轮次的聚合节点；

利用所述当前轮次的聚合节点，根据参数集合降维后，构建孤立森林，得到孤立参数向量，并剔除孤立参数向量后完成聚合；

将该剔除孤立参数向量后的向量的哈希上传到区块链防篡改，并将向量源数据下放给下轮参与节点，完成多地联合政务模型的聚合。

3.根据权利要求2所述的政务数据处理方法，其特征在于，根据参数集合降维，包括：

聚合所述政务节点对于参数向量的各个维度，收集所述各个维度的对应值，依据箱体图参数降维算法进行数据降维。

4.根据权利要求2所述的政务数据处理方法，其特征在于，构建孤立森林，包括：

聚合所述政务节点根据降维后的参数集合，利用参数孤立森林探测算法，构建拥有k棵孤立树的孤立森林，得到孤立参数向量；k为正整数。

5.根据权利要求2所述的政务数据处理方法，其特征在于，剔除孤立参数向量，包括：

对于所述政务节点对于参数向量的各个维度，计算箱体图关键函数；

根据箱体图关键函数，若一个维度向量内的所有值都在设定范围内，则该维度向量被剔除；若一个维度向量内的一半值都在设定范围外，则该维度向量被剔除。

6.一种政务数据处理装置，其特征在于，包括：

建模单元，被配置为基于区块链技术和联邦学习方式，构建政务数据共享架构，形成多地联合办公的政务数据模型；

处理单元，被配置为利用所述政务数据模型，探测多地联合办公的政务数据中是否存在设定的异常数据，以在探测到多地联合办公的政务数据中存在设定的异常数据的情况下，剔除所述异常数据。

7.根据权利要求6所述的政务数据处理装置，其特征在于，所述建模单元，基于区块链技术和联邦学习方式，构建政务数据共享架构，包括：

收集政务数据的政务节点，作为样本节点；

8.根据权利要求7所述的政务数据处理装置，其特征在于，所述建模单元，根据参数集合降维，包括：

9.一种计算机设备，其特征在于，包括：如权利要求6至8中任一项所述的政务数据处理装置。

10.一种存储介质，其特征在于，所述存储介质包括存储的程序，其中，在所述程序运行时控制所述存储介质所在设备执行权利要求1至5中任一项所述的政务数据处理方法。