CN117725619A - 数据共享方法、装置、计算机设备、芯片及可读存储介质 - Google Patents
数据共享方法、装置、计算机设备、芯片及可读存储介质 Download PDFInfo
- Publication number
- CN117725619A CN117725619A CN202410171739.2A CN202410171739A CN117725619A CN 117725619 A CN117725619 A CN 117725619A CN 202410171739 A CN202410171739 A CN 202410171739A CN 117725619 A CN117725619 A CN 117725619A
- Authority
- CN
- China
- Prior art keywords
- data
- important
- encryption
- category
- encrypted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 75
- 238000003860 storage Methods 0.000 title claims abstract description 17
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 78
- 238000004364 calculation method Methods 0.000 claims description 51
- 238000009826 distribution Methods 0.000 claims description 43
- 238000012545 processing Methods 0.000 claims description 39
- 230000006870 function Effects 0.000 claims description 36
- 239000011159 matrix material Substances 0.000 claims description 25
- 230000004927 fusion Effects 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 16
- 238000007726 management method Methods 0.000 claims description 16
- 230000009466 transformation Effects 0.000 claims description 13
- 238000004458 analytical method Methods 0.000 claims description 12
- 238000012886 linear function Methods 0.000 claims description 9
- 238000010276 construction Methods 0.000 claims description 6
- 230000005540 biological transmission Effects 0.000 description 26
- 230000035945 sensitivity Effects 0.000 description 14
- 230000006399 behavior Effects 0.000 description 13
- 230000008569 process Effects 0.000 description 12
- 239000006185 dispersion Substances 0.000 description 10
- 238000004891 communication Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 238000003066 decision tree Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 238000005336 cracking Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000013468 resource allocation Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 230000009022 nonlinear effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Landscapes
- Storage Device Security (AREA)
Abstract
本发明公开了一种数据共享方法、装置、计算机设备、芯片及可读存储介质,该方法包括:根据多个类别数据集合各自的信息熵数据,在多个类别数据集合中确定重要数据集合和常规数据集合;根据重要数据集合中多个重要数据各自的数据特征对多个重要数据进行分级加密,得到多个加密重要数据;利用预设加密算法对常规数据集合中的多个常规数据进行加密,得到多个加密常规数据;根据多个加密重要数据和多个加密常规数据构建数据发送端与数据需求端之间的数据共享链路,以将多个加密重要数据和多个加密常规数据传输至数据需求端。由此对不同安全级别的数据采用不同的加密强度进行加密和安全传输,有效提高数据共享的安全性。
Description
技术领域
本发明涉及数据共享技术领域,尤其涉及一种数据共享方法、装置、计算机设备、芯片及可读存储介质。
背景技术
随着大数据、云计算、人工智能等前沿技术的发展和普及,数据共享成为驱动创新、优化服务的重要途径。数据共享对于实现数据高效利用和设备的智能化、高效化、安全化管理具有重要作用。
相关技术中,主要依赖于数据库管理系统或数据仓库实现数据共享过程中数据的存储和访问控制。然而,一旦数据库被非法入侵或遭受攻击,可能会导致敏感信息泄露,相关技术中数据共享的安全性有待提高。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明提出一种数据共享方法、装置、计算机设备、芯片及可读存储介质,通过对不同安全级别的数据采用不同的加密强度进行加密和安全传输,实现对数据的细粒度保护,提高数据共享的安全性。
为达到上述目的,本发明第一方面实施方式提出了一种数据共享方法,应用于数据发送端,所述数据发送端中存储有满足预设数据要求的初始数据,所述初始数据包括多个类别数据集合;所述方法包括:根据多个类别数据集合各自的信息熵数据,在所述多个类别数据集合中确定重要数据集合和常规数据集合;其中,所述重要数据集合中数据的重要程度大于所述常规数据集合中数据的重要程度;根据所述重要数据集合中多个重要数据各自的数据特征对所述多个重要数据进行分级加密,得到多个加密重要数据;利用预设加密算法对所述常规数据集合中的多个常规数据进行加密,得到多个加密常规数据;根据所述多个加密重要数据和所述多个加密常规数据构建所述数据发送端与数据需求端之间的数据共享链路,以将所述多个加密重要数据和所述多个加密常规数据传输至所述数据需求端。
根据本发明的一个实施方式,所述初始数据是从所述数据发送端中存储的终端数据中调度得到的;通过以下方式获取所述初始数据:获取所述数据需求端发送的数据需求指令;对所述数据需求指令进行解析,得到所述预设数据要求;根据所述预设数据要求对应的要求向量值以及所述终端数据对应的数据向量值进行关联性计算,得到所述预设数据要求与所述终端数据之间的关联数据;若所述关联数据大于等于预设关联数据阈值,对所述终端数据进行调度,以得到所述初始数据。
根据本发明的一个实施方式,所述初始数据包括多个初始终端数据;通过以下方式得到所述多个类别数据集合:对任一初始终端数据进行属性分析,得到所述任一初始终端数据的数据属性;对所述任一初始终端数据的数据属性进行非线性变换,得到所述任一初始终端数据的非线性属性;基于所述非线性属性的属性向量值、多个预设数据类别中任一数据类别对应的向量方差数据,以及所述任一数据类别对应的类别参数进行分布概率计算,得到所述非线性属性在所述任一数据类别中的分布概率;其中,所述向量方差数据和所述类别参数是根据所述任一数据类别中预设类别数据的非线性属性数据得到的;根据所述非线性属性在所述多个预设数据类别中的分布概率确定所述任一初始终端数据对应的目标数据类别;根据所述多个初始终端数据分别对应的目标数据类别对所述多个初始终端数据进行分类,得到所述多个类别数据集合。
根据本发明的一个实施方式,所述多个类别数据集合是利用数据分类决策模型基于所述多个初始终端数据的数据属性对所述多个初始终端数据进行分类得到的。
根据本发明的一个实施方式,所述根据多个类别数据集合各自的信息熵数据,在所述多个类别数据集合中确定重要数据集合和常规数据集合,包括:针对任一类别数据集合,根据所述任一类别数据集合的信息熵数据与预设信息熵阈值的比较结果确定将所述任一类别数据集合中的数据加入所述重要数据集合,或者,确定将所述任一类别数据集合中的数据加入所述常规数据集合。
根据本发明的一个实施方式,所述任一类别数据集合对应有属性特征;通过以下方式获取所述任一类别数据集合的信息熵数据:确定所述任一类别数据集合中的数据在所述初始数据中的类别数据出现概率;确定所述属性特征的特性数据在所述初始数据中的特性数据出现概率;其中,所述特性数据用于描述所述属性特征的特征值的分布情况;根据所述类别数据出现概率和所述特性数据出现概率进行信息熵计算,得到所述任一类别数据集合的信息熵数据。
根据本发明的一个实施方式,所述根据所述重要数据集合中多个重要数据各自的数据特征对所述多个重要数据进行分级加密,得到多个加密重要数据,包括:根据所述多个重要数据各自的数据特征确定所述多个重要数据各自的数据级别;基于所述多个重要数据各自的数据级别对所述多个重要数据进行分级加密,得到所述多个加密重要数据。
根据本发明的一个实施方式,所述基于所述多个重要数据各自的数据级别对所述多个重要数据进行分级加密,得到所述多个加密重要数据,包括:根据所述多个重要数据各自对应的数据级别确定所述多个重要数据各自的目标加密算法;利用所述多个重要数据各自的目标加密算法对所述多个重要数据进行分级加密,得到所述多个加密重要数据。
根据本发明的一个实施方式,任一重要数据对应有数据类别;所述基于所述多个重要数据各自对应的数据级别确定所述多个重要数据各自的目标加密算法,包括:将数据级别大于等于预设级别阈值的重要数据确定为敏感数据;根据同一数据类别中敏感数据的哈希数据制定所述同一数据类别中敏感数据的加密策略;其中,所述加密策略包括加密算法类型、密钥管理方式、加密层次和安全协议中的至少一种;根据任一敏感数据的加密策略和数据级别确定所述任一敏感数据的目标加密函数;其中,所述目标加密算法包括所述目标加密函数。
根据本发明的一个实施方式,所述基于所述多个重要数据各自对应的数据级别确定所述多个重要数据各自的目标加密算法,还包括:将数据级别小于预设级别阈值的重要数据确定为非敏感数据;确定所述非敏感数据的目标加密算法采用预设加密函数;其中,所述预设加密函数的加密安全程度大于所述预设加密算法的加密安全程度。
根据本发明的一个实施方式,所述根据所述重要数据集合中多个重要数据各自的数据特征对所述多个重要数据进行分级加密,得到多个加密重要数据,包括:根据所述多个重要数据各自的数据特征进行信息增益计算,得到特征信息增益数据;根据所述特征信息增益数据确定所述多个重要数据各自的数据级别;根据所述多个重要数据各自的数据级别对所述多个重要数据进行分级加密,得到所述多个加密重要数据。
根据本发明的一个实施方式,任一重要数据对应有数据类别;根据所述多个重要数据各自的数据特征进行信息增益计算,得到特征信息增益数据,包括:确定所述任一重要数据的数据特征在所述重要数据集合中的特征信息熵;确定所述任一重要数据的数据特征在所述数据类别中的特征条件熵;根据所述特征信息熵和所述特征条件熵得到所述任一重要数据的数据特征的信息增益数据;其中,所述特征信息增益数据包括所述任一重要数据的数据特征的信息增益数据。
根据本发明的一个实施方式,所述根据所述多个重要数据各自对应的特征信息增益数据,确定所述多个重要数据各自的数据级别,包括:基于所述特征信息增益数据对所述多个重要数据进行划分,得到重要数据划分结果;根据所述重要数据划分结果设置所述多个重要数据各自对应的数据级别。
根据本发明的一个实施方式,所述根据所述多个加密重要数据和所述多个加密常规数据构建所述数据发送端与数据需求端之间的数据共享链路,包括:基于所述多个加密重要数据对应的重要摘要数据,以及所述多个加密常规数据对应的常规摘要数据,配置共享链路环境;根据所述共享链路环境、所述数据发送端的发送端协议,以及所述数据需求端的需求端协议,构建所述数据共享链路。
根据本发明的一个实施方式,所述基于所述多个加密重要数据对应的重要摘要数据,以及所述多个加密常规数据对应的常规摘要数据,配置共享链路环境,包括:利用预设线性函数对任一加密重要数据对应的摘要进行线性计算,得到所述任一加密重要数据对应的重要摘要线性数据;其中,所述重要摘要数据包括所述重要摘要线性数据;利用所述预设线性函数对任一加密常规数据对应的摘要进行线性计算,得到所述任一加密常规数据对应的常规摘要线性数据;其中,所述常规摘要数据包括所述常规摘要线性数据;根据所述多个加密重要数据各自对应的重要摘要线性数据和所述多个加密常规数据各自对应的常规摘要线性数据构建摘要融合矩阵;基于所述摘要融合矩阵配置所述共享链路环境。
为达到上述目的,本发明第二方面实施方式提出了一种数据共享装置,应用于数据发送端,所述数据发送端中存储有满足预设数据要求的初始数据,所述初始数据包括多个类别数据集合;所述装置包括:数据集合确定模块,用于根据多个类别数据集合各自的信息熵数据,在所述多个类别数据集合中确定重要数据集合和常规数据集合;其中,所述重要数据集合中数据的重要程度大于所述常规数据集合中数据的重要程度;重要数据加密模块,用于根据所述重要数据集合中多个重要数据各自的数据特征对所述多个重要数据进行分级加密,得到多个加密重要数据;常规数据加密模块,用于利用预设加密算法对所述常规数据集合中的多个常规数据进行加密,得到多个加密常规数据;共享链路构建模块,用于根据所述多个加密重要数据和所述多个加密常规数据构建所述数据发送端与数据需求端之间的数据共享链路,以将所述多个加密重要数据和所述多个加密常规数据传输至所述数据需求端。
为达到上述目的,本发明第三方面实施方式提出了一种计算机设备,包括存储器和处理器,所述存储器存储有第一计算机程序,所述处理器执行所述第一计算机程序时实现前述任一项实施方式所述的数据共享方法的步骤。
为达到上述目的,本发明第四方面实施方式提出了一种芯片,包括存储单元和处理单元,所述存储单元存储有第二计算机程序,所述处理单元执行所述第二计算机程序时实现前述任一项实施方式所述的数据共享方法的步骤。
为达到上述目的,本发明第五方面实施方式提出了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现前述任一项实施方式所述的数据共享方法的步骤。
根据本发明提供的多个实施方式,通过在数据发送端分析不同类别数据集合的信息熵数据来区分不同类别数据集合中数据的重要程度,以确定重要数据集合和常规数据集合,并进一步通过对重要数据集合中的重要数据的数据特征进行分析,以对重要数据集合中的重要数据进行分级加密处理。由此,可以对不同安全级别的数据采用不同的加密强度进行加密和安全传输,通过智能分层加密策略实现对数据的细粒度保护,确保数据共享的安全性和有效性。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
图1为根据本说明书实施方式提供的数据共享方法的流程示意图。
图2为根据本说明书实施方式提供的获取初始数据的流程示意图。
图3为根据本说明书实施方式提供的得到多个类别数据集合的流程示意图。
图4为根据本说明书实施方式提供的获取信息熵数据的流程示意图。
图5为根据本说明书实施方式提供的得到多个加密重要数据的流程示意图。
图6为根据本说明书实施方式提供的得到多个加密重要数据的流程示意图。
图7为根据本说明书实施方式提供的确定目标加密算法的流程示意图。
图8为根据本说明书实施方式提供的确定目标加密算法的流程示意图。
图9为根据本说明书实施方式提供的得到多个加密重要数据的流程示意图。
图10为根据本说明书实施方式提供的得到特征信息增益数据的流程示意图。
图11为根据本说明书实施方式提供的确定数据级别的流程示意图。
图12为根据本说明书实施方式提供的构建数据共享链路的流程示意图。
图13a为根据本说明书实施方式提供的配置共享链路环境的流程示意图。
图13b为根据本说明书实施方式提供的智慧实验室终端数据共享系统的结构框图。
图14为根据本说明书实施方式提供的数据共享装置的结构框图。
图15为根据本说明书实施方式提供的计算机设备的结构框图。
图16为根据本说明书实施方式提供的芯片的结构框图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
随着大数据、云计算、人工智能等前沿技术的发展和普及,数据的价值日益凸显,数据共享成为驱动创新、优化服务的重要途径。以智慧实验室为例,智慧实验室(SmartLaboratory)也称为智能实验室或数字化实验室,是运用先进的科技和智能化技术实现实验室环境、运营、管理、实验过程全面优化的科研实验场所。智慧实验室利用物联网(Internet of Things,IoT)、传感器、数据分析、人工智能等技术手段,将传统实验室转变为高效、可持续、智能化的创新型实验室。智慧实验室中包含有大量的终端设备,这些设备在运行过程中会产生大量的数据,部分设备需要借助数据共享来完成设备之间的有效协同工作。例如,实验仪器设备、环境监测设备等将自身的状态数据实时上传至共享平台,其他设备或系统可以实时获取这些数据进行分析和处理,从而判断设备的运行状态、预测可能出现的故障等,并提前采取相应的措施。数据共享对于实现数据高效利用和设备的智能化、高效化和安全化管理具有重要作用。
相关技术中,智慧实验室的终端数据共享方法主要依赖于数据库管理系统或数据仓库实现数据的存储和访问控制。通过将数据存储在数据库中,并给相应的终端设备授权,以使终端设备对具有访问权限的数据进行访问。然而,由于终端设备产生的数据量较大,构建和维护数据库需要消耗大量的计算资源进行数据清洗、整合及索引建立等数据处理工作,这会导致数据入库和查询的时间成本增加。同时,如果数据库中的数据没有经过加密处理,或者,数据保护的粒度较粗,会导致数据共享的安全性较低,一旦数据库被非法入侵或遭受攻击,可能会导致敏感信息泄露,从而严重影响实验室的安全性和合规性。另外,在对数据进行共享传输时,通常采用“批量”或者“全量”数据传输,即,将所有的数据放在一起传输,而不论终端设备实际需要哪些数据,在数据被发送到相应的接收端设备后,由接收端再进行筛选和分类等处理。这样不仅浪费带宽资源,也降低了终端数据的共享效率。
为了在数据共享过程中实现对数据的细粒度保护,提高数据共享的安全性,同时有效提高数据共享的效率,有必要提出一种数据共享方法、装置、计算机设备、芯片及可读存储介质。该方法通过在数据发送端分析不同类别数据集合的信息熵数据来区分不同类别数据集合中数据的重要程度,以确定重要数据集合和常规数据集合,并进一步通过对重要数据集合中的重要数据的数据特征进行分析,以对重要数据集合中的重要数据进行分级加密处理。由此,可以对不同安全级别的数据采用不同的加密强度进行加密和安全传输,通过智能分层加密策略实现对数据的细粒度保护,确保数据共享的安全性和有效性。
本说明书提供的数据共享方法根据初始数据包括的多个类别数据集合各自的信息熵数据初步确定多个类别数据集合中的数据的重要程度,以将多个类别数据集合中重要程度更高的重要数据划分至重要数据集合中,将常规数据划分至常规数据集合中。其中,初始数据是存储在数据发送端的满足预设数据要求的数据。针对重要数据集合中的重要数据,进一步基于各重要数据各自的数据特征进行细粒度的分级加密处理,以得到多个加密重要数据。针对常规数据集合中的常规数据,则使用预设加密算法进行加密,得到多个加密常规数据,以满足基本的安全需求,确保这些数据在传输过程中不被轻易窃取或篡改。这种差异化加密方式可以确保高价值或高敏感数据得到更高级别的安全保障,增加破解难度,降低重要信息泄露的风险。最后,根据加密后的重要数据和常规数据,构建从数据发送端到数据需求端的数据共享链路。通过数据共享链路,所有加密数据得以高效、安全地传输至数据需求端。
由此,通过将需要共享的数据划分为重要数据和常规数据,可以合理分配加密资源,避免过度加密造成的性能浪费,同时提高数据处理的效率,保证关键数据的安全。对于重要数据集合中的每一个重要数据,根据其数据特征进行分级加密,以实现采用更强或更复杂的加密方式对高价值或高敏感数据的数据进行加密,这种个性化加密方法可以更好地保护数据的隐私和完整性,有效抵御不同的攻击行为。通过采用灵活的分级加密策略,可以根据实际业务需求调整具体的加密策略,可以适应多种应用场景下的数据保护需求。
进一步地,本说明书提供的数据共享方法通过获取数据需求端发送的数据需求指令,来对数据需求指令进行解析得到预设数据要求。通过对预设数据要求对应的要求向量值与数据发送端中存储的终端数据对应的数据向量值进行关联性计算,以衡量预设数据要求与终端数据之间的匹配程度或相关性。若计算得到的关联数据大于或等于预设关联数据阈值,则对对应的终端数据进行调度,以得到满足预设数据要求的初始数据。由此,能够实现准确地按照数据需求端的要求筛选需要共享的数据,避免无效或无关数据的传输,提高数据共享的效率。根据终端数据与预设数据要求的关联性进行数据筛选,仅对符合条件的数据进行共享,可以节省网络传输带宽和终端设备的存储空间,提高资源利用率。
本说明书提供的数据共享方法还基于初始数据的数据属性对初始数据进行分类,以得到多个类别数据集合。具体地,针对初始数据中包括的每个初始终端数据,通过对初始终端数据进行分析,识别并提取其数据属性,然后对数据属性进行非线性变换处理,得到对应的非线性属性。基于非线性属性的属性向量值,以及多个预设数据类别中各数据类别对应的向量方差数据和类别参数,采用分布概率计算方法来估计非线性属性在各数据类别中的分布概率。根据上述计算得到的非线性属性在各数据类别中的分布概率,可以选择最高的分布概率对应的数据类别作为该初始终端数据的目标数据类别。将所有初始终端数据按照各自的目标数据类别进行分类,从而形成多个类别数据集合。由此,通过属性分析、非线性变换和分布概率计算,能够更准确地识别和划分数据的类别,提高数据分类的精度和可靠性,将相同性质的数据划分到同一个类别中,从而提高数据共享的效率。
再进一步地,本说明书提供的数据共享方法根据重要数据集合中多个重要数据各自的数据特征确定多个重要数据各自的数据级别,以基于多个重要数据各自的数据级别,对不同级别的数据采用不同的加密策略或算法进行加密,实现分级加密处理,得到多个加密重要数据。
在一些可实现的方式中,根据多个重要数据各自的数据特征可以进行信息增益计算,得到数据特征的特征信息增益数据。根据特征信息增益数据可以对多个重要数据进行划分,以各重要数据各自对应的数据类别为目标,划分得到重要数据划分结果,并根据重要数据划分结果设置多个重要数据各自的数据级别。通过利用信息增益理论能够更加科学合理地量化分级数据的重要性程度,并据此对重要数据实施差异化加密保护,在保障数据安全的同时可以优化资源分配和数据处理效率。
又进一步地,本说明书提供的数据共享方法通过将多个重要数据各自的数据级别与预先设置的预设级别阈值进行比较,将数据级别大于等于该预设级别阈值的重要数据识别为敏感数据。针对同一数据类别中的敏感数据,通过分析这些数据的哈希数据来制定相应的加密策略,以使加密策略与数据的性质相匹配。对于任一敏感数据,通过结合其对应的加密策略以及数据级别,来确定该敏感数据的目标加密函数。同时,将数据级别小于预设级别阈值的重要数据识别为非敏感数据,以使用预设加密函数作为目标加密算法,对非敏感数据进行加密。由此,基于数据级别的差异性,实现对重要数据中的敏感数据的精准识别和针对性加密,使得资源分配更加合理,敏感程度更高的数据能得到更高级别的安全保障。通过根据敏感数据的特性为敏感数据制定特定的加密策略,可以提供更加精细和定制化的加密保护,满足不同数据的需求和限制,提高数据的安全性和机密性。
本说明书实施方式提供一种数据共享方法,应用于数据发送端,数据发送端中存储有满足预设数据要求的初始数据,初始数据包括多个类别数据集合。参考图1所示,数据共享方法可以包括以下步骤。
S110、根据多个类别数据集合各自的信息熵数据,在多个类别数据集合中确定重要数据集合和常规数据集合;其中,重要数据集合中数据的重要程度大于常规数据集合中数据的重要程度。
S120、根据重要数据集合中多个重要数据各自的数据特征对多个重要数据进行分级加密,得到多个加密重要数据。
S130、利用预设加密算法对常规数据集合中的多个常规数据进行加密,得到多个加密常规数据。
S140、根据多个加密重要数据和多个加密常规数据构建数据发送端与数据需求端之间的数据共享链路,以将多个加密重要数据和多个加密常规数据传输至数据需求端。
其中,初始数据是需要共享的终端数据。数据发送端是存储有可供共享的终端数据的终端,数据需求端是向数据发送端请求获取共享数据的终端,数据发送端和数据需求端可以是用户端设备、服务端设备、云端设备等终端设备中的任一种。
预设数据要求可以用于描述数据需求端希望获取的数据类型、格式、范围或其他特定条件等。多个类别数据集合是通过对初始数据进行分类得到的。
信息熵数据即信息熵,用于衡量类别数据集合中的数据不确定性,类别数据集合的信息熵越高,意味着类别数据集合中的数据包含越多的随机性和信息内容。
数据特征可以用于描述数据的机密性、完整性、趋势性、相关性、离散程度等特性中的至少一个特性。
预设加密算法是安全等级较低的加密算法,利用预设加密算法加密后的数据能够满足基本的安全需求。
具体地,数据发送端存储有满足预设数据要求的初始数据,且初始数据被分类为多个类别数据集合。根据各个类别数据集合的信息熵数据,可以在多个类别数据集合中识别出重要数据和常规数据,以根据重要数据得到重要数据集合,根据常规数据得到常规数据集合。重要数据集合中数据的重要程度大于常规数据集合中数据的重要程度,意味着重要数据集合中的数据价值更高或者敏感度更高。
针对重要数据集合中包括的多个重要数据,进一步基于各个重要数据的数据特征对各个重要数据进行细粒度的分级加密处理,以得到多个加密重要数据。针对常规数据集合中包括的多个常规数据,则使用预设加密算法对各个常规数据进行加密,得到多个加密常规数据,以使加密常规数据满足基本的安全需求。
根据加密后的多个加密重要数据和多个加密常规数据,构建从数据发送端到数据需求端的数据共享链路。其中,数据共享链路对应配置有数据传输规则。通过数据共享链路,数据发送端可以按照数据传输规则将多个加密重要数据和多个加密常规数据传输给数据需求端,以完成数据发送端和数据需求端之间的数据共享,使数据需求端得到数据共享结果。
可以理解的是,对多个重要数据进行分级加密处理的加密算法的安全等级高于预设加密算法的安全等级。
在一些实施例中,多个类别数据集合可以是根据数据类型、数据来源、数据功能等中的任一个对初始数据进行分类得到的。数据特征可以是用于表示数据行为的特征,例如,可以用于描述数据的趋势性、相关性、离散程度等,也可以称为数据行为特征。
示例性地,假设数据类型包括文本数据、图像数据、音视频数据、时间序列数据等,则可以将每个数据类型作为一个类别,以根据这些数据类型对数据发送端中存储的满足预设数据要求的初始数据进行分类,得到多个类别数据集合。针对每个类别数据集合中的数据计算对应集合的信息熵数据,以根据各个类别数据集合的信息熵数据确定哪些类别数据集合中的数据属于重要程度更高的重要数据,哪些类别数据集合中的数据属于重要程度较低的常规数据,从而得到重要数据集合和常规数据集合。
针对重要数据集合中的多个重要数据,可以分别提取各重要数据对应的数据行为特征,以根据各重要数据对应的数据行为特征对各重要数据进行分级加密,得到多个加密重要数据。例如,假设重要数据对应的数据行为特征表明数据的离散程度或变异程度较大,则某些应用场景下可以使用安全等级较高的加密算法对重要数据进行加密(例如,若共享数据为实验室安全监测数据,数据的离散程度或变异程度较大表明数据包含的可能性和信息量较多),另一些应用场景下也可以使用安全等级较低的加密算法对重要数据进行加密(例如,若共享数据为用户行为数据,数据的离散程度或变异程度较大会使得对用户行为进行预测的难度增加)。
针对常规数据集合中的多个常规数据,则直接使用预设加密算法进行加密,得到多个加密常规数据。根据多个加密重要数据和多个加密常规数据,可以配置数据的传输格式、传输顺序以及传输速度等数据传输规则,并构建数据发送端和数据需求端之间的数据共享链路,以使数据发送端通过数据共享链路将多个加密重要数据和多个加密常规数据传输给数据需求端。
示例性地,假设数据来源包括传感器、监控设备、移动终端、实验操作终端等,则可以将每个数据来源作为一个类别,以根据这些数据来源对数据发送端中存储的满足预设数据要求的初始数据进行分类,得到多个类别数据集合。关于数据特征提取、分级加密和数据共享传输的描述与上述描述类似,具体不再赘述。
示例性地,假设数据功能包括用于建立通信、用于配置实验室设备、用于异常告警等,则可以将每个数据功能作为一个类别,以根据这些数据功能对数据发送端中存储的满足预设数据要求的初始数据进行分类,得到多个类别数据集合。关于数据特征提取、分级加密和数据共享传输的描述与上述描述类似,具体不再赘述。
需要说明的是,上述数据类型、数据来源、数据功能等分类依据可以根据实际应用场景等确定,本说明书中不作具体限定。
在另一些实施例中,数据特征也可以是根据数据的机密性、完整性、可用性等进行评估得到的。
示例性地,针对重要数据集合中的多个重要数据,可以根据预设标准对各重要数据的机密性、完整性等进行评估,以得到各重要数据的数据特征。假设任一重要数据属于隐私数据(某些领域的隐私数据需要遵循严格的隐私保护法规),且包含的隐私信息较为完整,则可以根据预设评估标准对该重要数据进行评分,作为该重要数据的数据特征,以使后续可以使用安全等级较高的加密算法对该重要数据进行加密。
假设任一重要数据属于机密实验数据,则可以根据预设评估标准对该重要数据进行评分,作为该重要数据的数据特征,以使后续可以使用安全等级较高的加密算法对该重要数据进行加密。
假设任一重要数据属于常规实验数据,则可以根据预设评估标准对该重要数据进行评分,作为该重要数据的数据特征,以使后续可以使用安全等级较低的加密算法对该重要数据进行加密。
需要说明的是,数据发送端和数据需求端可以是智慧实验室中的终端设备,也可以是跨平台服务、智能家居、移动支付等任一场景中的终端设备,本说明书中不作具体限定。数据需求端也可以称为数据接收端。
在一些场景中,若任一类别数据集合的信息熵数据较高,则该类别数据集合中的数据的重要程度较高。例如,若任一类别数据集合为交易数据集合,则集合的信息熵数据可能较高,集合中数据的重要程度也较高。
在另一些场景中,若任一类别数据集合的信息熵数据较低,则该类别数据集合中的数据的重要程度较高。例如,若任一类别数据集合为用户行为数据集合或用户隐私数据集合,则集合的信息熵数据可能较低,但是集合中数据的重要程度较高。关于根据信息熵数据确定重要数据集合和常规数据集合的方式,可以根据实际应用场景等确定,本说明书中不作具体限定。
上述实施方式中,通过对需要共享的数据进行划分,得到重要数据集合和常规数据集合,并分别加密,可以合理分配加密资源,避免过度加密造成的性能浪费,同时提高数据处理的效率,保证关键数据的安全。对于重要数据集合中的每一个重要数据,根据其数据特征进行分级加密,以实现采用更强或更复杂的加密方式对高价值或高敏感数据的数据进行加密,实现对数据的更细粒度的保护,提高不同重要程度的数据的共享安全性。这种个性化加密方法可以更好地保护数据的隐私和完整性,有效抵御不同的攻击行为。同时,通过采用灵活的分级加密策略,可以根据实际业务需求调整具体的加密策略,可以适应多种应用场景下的数据保护需求。
在一些实施方式中,初始数据是从数据发送端中存储的终端数据中调度得到的。参考图2所示,可以通过以下方式获取初始数据:
S210、获取数据需求端发送的数据需求指令。
S220、对数据需求指令进行解析,得到预设数据要求。
S230、根据预设数据要求对应的要求向量值以及终端数据对应的数据向量值进行关联性计算,得到预设数据要求与终端数据之间的关联数据。
S240、若关联数据大于等于预设关联数据阈值,对终端数据进行调度,以得到初始数据。
其中,数据需求指令是数据需求端根据一定的协议、规则和格式生成的。
要求向量值是将预设数据要求转换为向量后得到的,数据向量值是将终端数据转换为向量后得到的。
关联数据用于表明预设数据要求与终端数据之间的相关性或匹配程度。
具体地,数据需求端根据预设数据要求生成数据需求指令,并将数据需求指令发送给数据发送端。数据发送端在接收到数据需求端发送的数据需求指令后,可以对数据需求指令进行解析,以得到预设数据要求。
数据发送端根据预设数据要求和内部存储的终端数据计算预设数据要求和终端数据之间的关联数据。数据发送端将预设数据要求转换为向量,得到要求向量值,并利用要求向量值与终端数据对应的数据向量值进行关联性计算,以根据计算得到的关联数据评估终端数据与预设数据要求之间的匹配程度。
若根据终端数据与预设数据要求计算得到的关联数据大于等于预设关联数据阈值,表明终端数据与数据需求端的需求之间的一致性和关联性满足条件,则数据发送端对终端数据进行调度,以最终得到初始数据。
在一些实施例中,数据发送端中存储有多个终端数据集合,终端数据是终端数据集合中的数据。关联数据是根据预设数据要求对应的要求向量值以及各终端数据集合中的终端数据对应的数据向量值进行关联性计算得到的,则关联数据也可以认为是预设数据要求与终端数据集合之间的关联数据。其中,终端数据集合中的数据可以是未经过分类处理的数据。
示例性地,数据发送端和数据需求端为智慧实验室中的终端设备。数据需求端可以获取智慧实验室中的终端设备,并在终端设备中确定相应的请求设备,从而确定数据发送端,以向数据发送端发送数据需求指令。
数据发送端在接收到数据需求指令后,通过对数据需求指令进行解析,可以识别数据需求指令中的指令字符,并根据指令字符得到预设数据要求,从而确定数据需求指令对应的指令要求。数据发送端提取内部存储的终端数据集合,针对任一终端数据集合,可以按照如下公式计算预设数据要求与该终端数据集合之间的关联数据:
其中,A表示预设数据要求与终端数据集合之间的关联数据;a表示终端数据集合中终端数据的序列号;q表示终端数据集合中终端数据的总数量;B'表示预设数据要求对应的向量值,即要求向量值;lnB'表示要求向量值的对数值;Ba表示终端数据集合中第a个终端数据对应的向量值,即数据向量值;lnBa表示该第a个终端数据的数据向量值对应的对数值;γ表示向量维度系数,可以根据预设数据要求的要求向量值与终端数据的数据向量值的向量维度进行调整。
假设终端数据集合包括集合1、集合2和集合3,数据发送端计算得到预设数据要求与集合1的关联数据记为A1,预设数据要求与集合2的关联数据记为A2,预设数据要求与集合3的关联数据记为A3。将预设关联数据阈值记为R_th,假设A1大于等于R_th,且A2小于R_th,且A3小于R_th,则数据发送端可以将集合1中的终端数据进行调度,以根据调度的终端数据得到初始数据。
假设A1大于等于R_th,且A2大于等于R_th,且A3小于R_th,则数据发送端可以将集合1和集合2中的终端数据进行调度,以根据调度的终端数据得到初始数据。
在另一些实施例中,也可以采用余弦相似度计算等方法计算得到预设数据要求的要求向量值与各终端数据的数据向量值之间的关联数据,具体不再赘述。
需要说明的是,本说明书中,预设数据要求也可以称为指令要求,关联数据也可以称为关联系数。
上述实施方式中,根据预设数据要求与数据发送端中存储的终端数据之间的关联数据来从终端数据中调度数据需求指令对应的数据,可以实现准确地按照数据需求端的要求筛选需要共享的数据,避免无效或无关数据的传输,提高数据共享的效率。根据终端数据与预设数据要求的关联性进行数据筛选,可以有效地过滤掉与实际需求不匹配的数据,仅对符合条件的数据进行共享,可以减少数据处理和传输的负载,提高数据处理和传输的效率,并可以节省网络传输带宽和终端设备的存储空间,提高资源利用率。
在一些实施方式中,初始数据包括多个初始终端数据,参考图3所示,可以通过以下方式得到多个类别数据集合:
S310、对任一初始终端数据进行属性分析,得到任一初始终端数据的数据属性。
S320、对任一初始终端数据的数据属性进行非线性变换,得到任一初始终端数据的非线性属性。
S330、基于非线性属性的属性向量值、多个预设数据类别中任一数据类别对应的向量方差数据,以及任一数据类别对应的类别参数进行分布概率计算,得到非线性属性在任一数据类别中的分布概率;其中,向量方差数据和类别参数是根据任一数据类别中预设类别数据的非线性属性数据得到的。
S340、根据非线性属性在多个预设数据类别中的分布概率确定任一初始终端数据对应的目标数据类别。
S350、根据多个初始终端数据分别对应的目标数据类别对多个初始终端数据进行分类,得到多个类别数据集合。
其中,数据属性是关键的、具有区分度的、能够用于唯一识别初始终端数据的属性,也称为特有属性。
类别参数可以用于描述对应的数据类别中预设类别数据的非线性属性的属性值分布特征,例如中位数、离散度、相关性等中的任一种分布特征。
预设数据类别是根据预设的分类规则设定的或者分类好的类别。预设类别数据是预先设置在对应的数据类别下的数据,可以是样本数据或者历史数据。
具体地,初始数据中包括调度得到的多个初始终端数据。针对任一初始终端数据,可以对该初始终端数据进行属性分析,以提取出其特有属性,作为该初始终端数据的数据属性。对该初始终端数据的数据属性进行非线性变换处理,以通过非线性变换更好地捕捉该初始终端数据的潜在结构和数据属性中各特征的复杂关系,得到该初始终端数据对应的非线性属性。将该初始终端数据的非线性属性转换为向量,得到非线性属性的属性向量值。
通过根据预设的分类规则可以对样本数据或历史数据进行分类,得到多个数据类别,作为多个预设数据类别,且针对其中任一数据类别,分类至该数据类别下数据记为预设类别数据。根据任一数据类别中预设类别数据的非线性属性进行向量方差计算,可以得到该数据类别对应的向量方差数据。即,可以将预设类别数据的非线性属性的属性值转换为向量并进行方差运算,得到向量方差数据。根据该数据类别中预设类别数据的非线性属性的属性值分布特征进行分析,可以得到该数据类别对应的类别参数。
基于初始终端数据对应的非线性属性的属性向量值、任一数据类别对应的向量方差数据,以及该任一数据类别对应的类别参数进行分布概率计算,可以得到初始终端数据的非线性属性在该任一数据类别中的分布概率。按照这种方法,可以得到初始终端数据的非线性属性分别在多个预设数据类别中的分布概率。根据初始终端数据分别在多个预设数据类别中的分布概率中的最大分布概率,可以确定初始终端数据对应的目标数据类别。根据各初始终端数据各自对应的目标数据类别对多个初始终端数据进行分类,以得到多个类别数据集合。
可以理解的是,数据属性(即特有属性)具有唯一性,数据属性中可以包括多个特征。例如,若初始终端数据是图像数据,其数据属性可以包括颜色、纹理、形状、尺度等特征;若初始终端数据是用于建立通信连接的数据,其数据属性可以包括通信协议、端口信息、安全属性、连接配置参数等特征。
针对同一个初始终端数据,通过对该初始终端数据的数据属性进行非线性变换,可以得到非线性变换后的多个特征。通过计算非线性变换后的多个特征之间的相关性,将线性关系最高的两个或多个特征合并为一个特征,并根据该合并后特征与其他特征可以构成该初始终端数据的非线性属性。本说明书中对非线性变换的方式不作具体限定。
示例性地,可以采用如下公式计算初始终端数据的非线性属性在任一数据类别中的分布概率:
其中,D表示第b个初始终端数据的非线性属性在多个预设数据类别中第m个数据类别中的分布概率;α表示第b个初始终端数据的非线性属性对应的参数,是非线性属性的多项式的阶数,该阶数可以通过对非线性属性进行多项式展开得到。exp表示指数函数;fb表示第b个初始终端数据的非线性属性的属性向量值;dm表示多个预设数据类别中第m个数据类别对应的向量方差数据;表示第m个数据类别的类别参数。
在一些实施例中,类别参数可以通过聚类方法得到。
示例性地,针对第m个数据类别,可以通过对该数据类别中预设类别数据非线性属性的属性值进行聚类处理,得到多个簇。针对每个簇,可以分析每个簇内部的数据分布特性,如频数、频率、中心趋势、离散度、偏斜度、峰度、相关性、协方差等特性中的任一个,以得到该数据类别的类别参数。其中,类别参数可以通过标准差或方差计算、相关性计算、协方差计算、离散度或变异度测量等方式中的任一种得到,具体不再赘述。
需要说明的是,多个预设数据类别可以通过预设的数据类别表获取。关于数据属性中的具体特征以及数据属性的分析、提取方式,可以根据实际应用场景等确定,本说明书中不作具体限定。
本说明书中,重要数据也可以称为重要终端数据,常规数据也可以称为常规终端数据。
上述实施方式中,通过计算各个数据类别中预设类别数据的非线性属性的向量方差和类别参数,可以更准确地评估各类别的内部差异性和一致性。通过属性分析、非线性变换和分布概率计算,能够更准确地识别初始终端数据的类别,提高初始终端数据分类的精度和可靠性,从而提高数据共享的效率。
在一些实施方式中,多个类别数据集合是利用数据分类决策模型基于多个初始终端数据的数据属性对多个初始终端数据进行分类得到的。
具体地,可以将多个初始终端数据输入到预先训练好的数据分类决策模型中,通过数据分类决策模型中的输入层对各初始终端数据进行属性分析,得到数据属性,然后利用数据分类决策模型中的隐藏层对各初始终端数据的数据属性进行非线性变换,得到非线性属性。根据多个预设数据类别,利用数据分类决策模型中输出层的输出函数可以计算各初始终端数据的非线性属性在多个预设数据类别中的分布概率,得到各初始终端数据的多个分布概率值。根据分布概率值,通过数据分类决策模型中的分类器可以确定各初始终端数据的目标数据类别,以实现通过分类器对多个初始终端数据进行数据分类处理,得到多个类别数据集合。
需要说明的是,数据分类决策模型的训练过程与上述过程类似,具体不再赘述。
本说明书对数据分类决策模型的具体结构、输出函数、分类器不作具体限定。在本说明书中,类别数据集合也可以称为分类终端数据集合,类别数据集合中的数据也可以称为分类终端数据。
在一些实施方式中,根据多个类别数据集合各自的信息熵数据,在多个类别数据集合中确定重要数据集合和常规数据集合,可以包括:针对任一类别数据集合,根据任一类别数据集合的信息熵数据与预设信息熵阈值的比较结果确定将任一类别数据集合中的数据加入重要数据集合,或者,确定将任一类别数据集合中的数据加入常规数据集合。
其中,重要数据集合和常规数据集合被初始化为空集合。
具体地,针对任一类别数据集合,根据该类别数据集合中的数据进行信息熵计算,得到该类别数据集合的信息熵数据。将该类别数据集合的信息熵数据与预设信息熵阈值进行比较,若该类别数据集合的信息熵数据大于等于预设信息熵阈值,则可以将该类别数据集合中的数据加入重要数据集合;若该类别数据集合的信息熵数据小于预设信息熵阈值,则可以将该类别数据集合中的数据加入常规数据集合。
或者,若该类别数据集合的信息熵数据大于等于预设信息熵阈值,则可以将该类别数据集合中的数据加入常规数据集合;若该类别数据集合的信息熵数据小于预设信息熵阈值,则可以将该类别数据集合中的数据加入重要数据集合。
示例性地,数据发送端和数据接收端是智慧家居中的终端设备。假设任一类别数据集合是用户行为数据集合,根据该集合中的数据进行信息熵计算得到信息熵数据。将该信息熵数据与预设信息熵阈值进行比较,若该类别数据集合的信息熵数据大于等于预设信息熵阈值,表明用户行为比较多元化,可能含有更多有价值的信息,需要更细致的分析或更高级别的保护,则可以将该集合中的数据加入重要数据集合。若该集合的信息熵数据小于预设信息熵阈值,表明用户行为偏好比较单一,可能不具有很高的价值,则可以将该集合中的数据加入常规数据集合。
示例性地,数据发送端和数据需求端是智慧实验室中的终端设备。假设任一类别数据集合是重要实验设备的配置数据集合,根据该集合中的数据进行信息熵计算得到信息熵数据。将该信息熵数据与预设信息熵阈值进行比较,若该类别数据集合的信息熵数据大于等于预设信息熵阈值,表明重要实验设备的配置较为随机和复杂,则可以将该集合中的数据加入常规数据集合。若该集合的信息熵数据小于预设信息熵阈值,表明重要实验设备的配置较为确定和规律,则可以将该集合中的数据加入重要数据集合。
需要说明的是,关于预设信息熵阈值的设置方式,以及根据信息熵数据与预设信息熵阈值的比较结果确定将数据加入重要数据集合或者常规数据集合的方式,可以根据实际应用场景或需求等确定,本说明书中不作具体限定。预设信息熵阈值可以根据多个类别数据集合进行设置,也可以根据各类别数据集合分别进行设置。
在一些实施方式中,任一类别数据集合对应有属性特征。参考图4所示,可以通过以下方式获取任一类别数据集合的信息熵数据。
S410、确定任一类别数据集合中的数据在初始数据中的类别数据出现概率。
S420、确定属性特征的特性数据在初始数据中的特性数据出现概率;其中,特性数据用于描述属性特征的特征值的分布情况。
S430、根据类别数据出现概率和特性数据出现概率进行信息熵计算,得到任一类别数据集合的信息熵数据。
其中,属性特征是类别数据集合中的数据的特征。类别数据出现概率是任一类别数据集合中的数据在初始数据中的占比或出现频率。
属性特征的特征值的分布情况可以包括特征值的集中程度、离散程度、频数、中心趋势等分布情况中的任一种。特性数据也可以称为特性值。
特性数据出现概率是任一类别数据集合中的数据的任一属性特征的特性数据在初始数据中的占比或出现频率。
具体地,针对任一类别数据集合,通过统计分析该类别数据集合中的数据在初始数据中的出现概率或占比,可以确定该类别数据集合中的数据的类别数据出现概率。根据该类别数据集合中数据的特征,可以得到该类别数据集合对应的多个属性特征。针对任一属性特征,通过分析该属性特征的特征值的分布情况,得到该属性特征的特性数据。通过统计分析该属性特征的特性数据在初始数据中的出现概率或占比,可以确定该属性特征的特性数据的特性数据出现概率。根据上述类别数据出现概率和特性数据出现概率进行信息熵计算,可以得到该类别数据集合的信息熵数据。
示例性地,可以通过如下公式计算任一类别数据集合对应的信息熵数据:
其中,F表示多个类别数据集合中第h个类别数据集合对应的信息熵数据;E(h)表示第h个类别数据集合中的数据出现的概率,即第h个类别数据集合的类别数据出现概率;E(hg)表示第h个类别数据集合的第g个属性特征的特性值在初始数据(或者,多个类别数据集合)中出现的概率,即第h个类别数据集合的第g个属性特征的特性值的特性数据出现概率。
在一些实施例中,特性数据可以是属性特征的特征值的中位数、平均数、方差等数据中的任一种。
需要说明的是,属性特征可以包括任一类别数据集合中数据的全部特征,也可以是根据具体场景从数据的全部特征中选取的部分特征。属性特征可以包括前述数据属性中的特征,或者可以包括前述非线性属性中的特征。
上述实施方式中,针对任一类别数据集合,通过确定类别数据出现概率和特性数据出现概率,能够提供更加详细和深入的数据特征分析,有助于发现数据的潜在价值和规律。通过信息熵计算来评估数据的复杂性和不确定性,可以为后续数据的分类、存储和管理等提供依据,提高后续数据处理的效率。
在一些实施方式中,参考图5所示,根据重要数据集合中多个重要数据各自的数据特征对多个重要数据进行分级加密,得到多个加密重要数据,可以包括以下步骤。
S510、根据多个重要数据各自的数据特征确定多个重要数据各自的数据级别。
S520、基于多个重要数据各自的数据级别对多个重要数据进行分级加密,得到多个加密重要数据。
其中,数据级别可以用于表示重要数据的敏感程度。
具体地,针对重要数据集合中的每一个重要数据进行分析,以提取各重要数据的数据特征。基于各重要数据的数据特征,可以确定各重要数据各自对应的数据级别。在确定各重要数据各自的数据级别后,可以针对不同级别的重要数据分别采用不同的加密策略或算法,以实现对多个重要数据进行分级加密,得到多个加密重要数据。
示例性地,数据特征可以用于表示数据的机密性、完整性、可用性(或者,可用价值)等特性中的至少一个特性。针对重要数据集合中的每一个重要数据,提取各重要数据的数据特征。针对任一重要数据,若该重要数据的数据特征表明该数据的机密性、完整性、可用性较高,可以为该数据分配较高的数据级别,表明该数据的敏感程度较高,并可以利用较高级别的加密算法或者较强的密钥长度来提高对该数据加密的安全性。
若该重要数据的数据特征表明该数据的机密性、完整性、可用性较低,可以为该数据分配较低的数据级别,表明该数据的敏感程度较低,并可以利用较低级别或者性能消耗较小的加密算法来保证对该数据的加密满足基本的安全性。
若该重要数据的数据特征表明该数据的完整性较高,但是机密性和可用性较低,可以为该数据分配较低的数据级别,表明该数据的敏感程度较低。
若该重要数据的数据特征表明该数据的机密性较高,但是完整性和可用性较低,也可以为该数据分配较为中等的数据级别,表明该数据的敏感程度一般。
示例性地,数据特征也可以用于表示数据的趋势性、离散程度、与其他数据的相关性等特性中的至少一个特性。针对重要数据集合中的每一个重要数据,提取各重要数据的数据特征。针对任一重要数据,若该重要数据的数据特征表明该数据的趋势性较明显,和/或,离散程度较低,和/或,与其他数据的相关性较高,可以为该数据分配较高的数据级别,表明该数据的敏感程度较高。
若该重要数据的数据特征表明该数据的趋势性较弱,和/或,离散程度较高,和/或,与其他数据的相关性较低,可以为该数据分配较低的数据级别,表明该数据的敏感程度较低。
需要说明的是,关于如何根据数据特征确定数据级别,以及如何基于数据级别确定加密方式,可以根据实际应用场景等确定,本说明书中不作具体限定。
在一些实施方式中,参考图6所示,基于多个重要数据各自的数据级别对多个重要数据进行分级加密,得到多个加密重要数据,可以包括以下步骤。
S610、根据多个重要数据各自对应的数据级别确定多个重要数据各自的目标加密算法。
S620、利用多个重要数据各自的目标加密算法对多个重要数据进行分级加密,得到多个加密重要数据。
具体地,针对重要数据集合中的任一重要数据,可以基于该重要数据的数据级别确定该重要数据的目标加密算法,从而确定多个重要数据各自的目标加密算法。数据级别通常可以反映数据的敏感性、重要性或业务价值等。对于数据级别较高的重要数据,可能需要选择安全性更高、破解难度更大的加密算法,例如AES-256(256-Advanced EncryptionStandard,256位进阶加密标准)、RSA(Rivest-Shamir-Adleman,公钥加密算法)等算法,并配合足够长度的密钥,或者是采用国家及行业推荐的安全标准。对于数据级别相对较低的重要数据,由于其仍然具有一定的敏感性,因此可以选取一些性能与安全兼顾的加密算法作为目标加密算法,例如AES-128等算法。通过这种方式,可以确保不同数据级别的重要数据得到与其敏感程度相匹配的加密保护。在确定多个重要数据各自的目标加密算法之后,利用多个重要数据各自的目标加密算法对多个重要数据分别进行加密处理,以得到多个加密重要数据。由此,既确保了数据的安全性,也兼顾了系统性能和资源使用的合理性。通过这种方式,可以在数据共享、传输或存储过程中,有效地防止未经授权的访问和恶意攻击,确保数据安全可控。
需要说明的是,本说明书对不同的数据级别各自对应的目标加密算法不作具体限定。
在一些实施方式中,任一重要数据对应有数据类别。参考图7所示,基于多个重要数据各自对应的数据级别确定多个重要数据各自的目标加密算法,可以包括以下步骤。
S710、将数据级别大于等于预设级别阈值的重要数据确定为敏感数据。
S720、根据同一数据类别中敏感数据的哈希数据制定同一数据类别中敏感数据的加密策略;其中,加密策略包括加密算法类型、密钥管理方式、加密层次和安全协议中的至少一种。
S730、根据任一敏感数据的加密策略和数据级别确定任一敏感数据的目标加密函数;其中,目标加密算法包括目标加密函数。
其中,敏感数据为重要数据集合中敏感程度达到一定条件的数据,具有更高的安全保护需求。哈希数据即哈希值。
可以理解的是,重要数据集合中的数据是根据多个类别数据集合中的数据得到的,因此,重要数据集合中的任一重要数据对应有数据类别,该数据类别即该重要数据所属的类别数据集合所对应的数据类别。
具体地,可以事先设置预设级别阈值,以将重要数据集合中的多个重要数据各自的数据级别与预设级别阈值进行比较。针对任一重要数据,若该重要数据的数据级别大于等于预设级别阈值,可以将该重要数据识别为敏感数据。由此,可以在重要数据集合中确定多个敏感数据。可以理解的是,任一敏感数据对应有数据类别。
针对同一数据类别中的敏感数据,可以通过计算各敏感数据的哈希数据,并分析各敏感数据的哈希数据的特性,来制定适用于该数据类别中的敏感数据的性质的加密策略。这个策略可以涵盖加密算法类型、密钥管理方式、加密层次、采用的安全协议等要素中的至少一种要素。由此,可以针对不同数据类别中的敏感数据的性质(例如,数据类型、离散程度、规律性等)分别制定对应的加密策略。针对任一敏感数据,可以根据该敏感数据对应的加密策略以及其数据级别来确定一个最适合的加密函数,作为该敏感数据的目标加密函数。
示例性地,可以采用MD5(Message-Digest Algorithm 5,信息摘要算法)、SHA1(Secure Hash Algorithm 1,安全散列算法)、SHA256(Secure Hash Algorithm 256-bit,安全哈希算法256位)等中的任一种哈希函数计算敏感数据的哈希值。针对同一数据类别中的敏感数据,可以根据各敏感数据的哈希值分析哈希值的分布、碰撞情况等特性,以制定相应的加密策略。
若该数据类别中敏感数据的哈希值分布较均匀,一定程度上可以表明该数据类别中数据多样性较高,可以选择性能优越且抗碰撞性强的加密算法类型,比如AES系列对称加密算法等,以应对大量异构数据的安全需求。若该数据类别中敏感数据的哈希值分布呈现出明显的规律性或聚集性,可能需要加强加密策略以对抗潜在的模式攻击,这时可以考虑采用更复杂的加密算法类型(如公钥加密算法RSA或ECC(Ellipse Curve Ctyptography,椭圆曲线密码算法)等),或者增加加密层次。哈希值碰撞是指不同的输入数据产生相同的哈希值。如果同一类别中存在大量哈希值碰撞,这可能影响加密的安全性。在这种情况下,可以考虑使用加盐技术来减少哈希值碰撞,并可以考虑采用多重加密或多层加密架构来增强安全性。
根据哈希值的分布和碰撞情况,还可以选择合适的密钥管理方式。如果哈希值较为均匀且碰撞率低,可以使用简单的密钥管理方式。如果哈希值分布不均匀或存在大量碰撞,需要更复杂的密钥管理机制,例如,可以使用HSM(Hardware Security Module,硬件安全模块)或密钥管理服务来安全地生成、存储、分发和更新密钥。
根据选择的加密算法类型和密钥管理方式,还可以进一步选择合适的加密层次和安全协议。对于敏感程度更高的数据,可以考虑使用多层加密架构,每一层使用不同的加密算法和密钥。同时,可以采用如SSL(Secure Sockets Layer,安全套接字层)/TLS(Transport Layer Security,传输层安全)或IPsec(Internet Protocol Security,网际协议安全)等安全协议来保护数据传输的安全性和完整性。由此,根据敏感数据的加密策略和数据级别,可以确定敏感数据对应的具体的目标加密函数。
需要说明的是,具体的加密策略可以根据实际应用场景或需求等确定,本说明书中不作具体限定。
上述实施方式中,通过将敏感数据的哈希数据作为评估数据复杂性、安全风险的一个方面,可以用于在辅助制定加密策略时全面考量数据保护需求,以使制定的加密策略能够同时满足安全和高效的需求。
在一些实施方式中,参考图8所示,基于多个重要数据各自对应的数据级别确定多个重要数据各自的目标加密算法,还可以包括以下步骤。
S810、将数据级别小于预设级别阈值的重要数据确定为非敏感数据。
S820、确定非敏感数据的目标加密算法采用预设加密函数;其中,预设加密函数的加密安全程度大于预设加密算法的加密安全程度。
其中,非敏感数据为重要数据集合中敏感程度未达到一定条件的数据,非敏感数据的安全保护需求比敏感数据的安全保护需求低,但是比常规数据的安全保护需求高。
具体地,针对任一重要数据,若该重要数据的数据级别小于预设级别阈值,可以将该重要数据识别为非敏感数据。由此,可以在重要数据集合中确定多个非敏感数据。这意味着这些数据虽然仍然被认为是重要的,但其内在的敏感程度和潜在风险低于敏感数据的敏感程度和潜在风险。
针对非敏感数据,可以采取预先设定好的预设加密函数作为目标加密算法来进行加密。其中,预设加密函数的加密安全程度大于用于对常规数据加密的预设加密算法的加密安全程度。这种方式可以简化非敏感数据的加密处理流程,同时又能在加密层面使得对非敏感数据的加密达到一定的安全保障标准,有效防止因数据泄露带来的潜在威胁。由此,在满足不同等级数据的安全保护需求的同时,能够一定程度上节省复杂的加密流程以及节省计算资源。
需要说明的是,预设加密函数和预设加密算法可以根据实际应用场景或应用需求等确定,本说明书中不作具体限定。
在一些实施方式中,参考图9所示,根据重要数据集合中多个重要数据各自的数据特征对多个重要数据进行分级加密,得到多个加密重要数据,可以包括以下步骤。
S910、根据多个重要数据各自的数据特征进行信息增益计算,得到特征信息增益数据。
S920、根据特征信息增益数据确定多个重要数据各自的数据级别。
S930、根据多个重要数据各自的数据级别对多个重要数据进行分级加密,得到多个加密重要数据。
其中,本实施方式中,数据特征是用于表示数据行为的特征。针对任一重要数据,可以根据该任一重要数据与其所属类别数据集合中其他数据的相关性、离散程度、距离中位数的差异性等至少一个特性,得到该任一重要数据的数据特征。
特征信息增益数据即根据数据特征计算得到的信息增益值,是衡量数据特征对数据分类贡献的一种度量,可以用于评估数据特征的重要性。
具体地,针对多个重要数据中的各个重要数据,可以根据各重要数据的数据特征分别进行信息增益计算,得到各重要数据的数据特征的信息增益值,以得到特征信息增益数据。根据特征信息增益数据可以对各重要数据的数据特征的重要性进行分析,以确定与各重要数据各自的数据特征的重要性相匹配的数据级别,并根据多个重要数据各自的数据级别对多个重要数据分别进行分级加密,以得到多个加密重要数据。
可以理解的是,由于任一重要数据可以具有多个数据特征,因此,根据任一重要数据的数据特征进行信息增益计算,可以得到任一重要数据的多个数据特征的信息增益值。
在一些实施例中,针对任一重要数据,可以将其多个数据特征的信息增益值进行组合或加权处理,以确定该重要数据的数据级别。
示例性地,针对任一重要数据,假设该重要数据具有3个数据特征,分别记为数据特征1、数据特征2、数据特征3。根据数据特征1进行信息增益计算,得到数据特征1的信息增益值,记为IG1;根据数据特征2进行信息增益计算,得到数据特征2的信息增益值,记为IG2;根据数据特征3进行信息增益计算,得到数据特征3的信息增益值,记为IG3。根据该重要数据的3个数据特征的信息增益值进行组合或加权处理,例如,可以取3个数据特征的信息增益值的最大值,或者取3个数据特征的信息增益值的平均值,或者对3个数据特征的信息增益值进行加权求和等,以得到该重要数据的数据特征的处理后信息增益值。
进一步地,可以设置多个信息增益阈值。假设多个信息增益阈值包括阈值1、阈值2、阈值3、阈值4,且阈值1>阈值2>阈值3>阈值4。将处理后信息增益值与多个信息增益阈值分别进行比较,若处理后信息增益值大于阈值1,可以将该重要数据的数据级别设置为数据级别1;若处理后信息增益值位于阈值1和阈值2之间,可以将该重要数据的数据级别设置为数据级别2;若处理后信息增益值位于阈值2和阈值3之间,可以将该重要数据的数据级别设置为数据级别3;若处理后信息增益值位于阈值3和阈值4之间,可以将该重要数据的数据级别设置为数据级别4;若处理后信息增益值小于阈值4,可以将该重要数据的数据级别设置为数据级别5。其中,数据级别1、数据级别2、数据级别3、数据级别4和数据级别5之间的级别高低关系可以根据实际应用场景等确定,本说明书中不作具体限定。
需要说明的是,关于根据多个重要数据各自的数据级别对多个重要数据进行分级加密的描述,请参考本说明书中根据重要数据集合中多个重要数据各自的数据特征对多个重要数据进行分级加密的描述,具体这里不再赘述。
在一些实施方式中,任一重要数据对应有数据类别。参考图10所示,根据多个重要数据各自的数据特征进行信息增益计算,得到特征信息增益数据,可以包括以下步骤。
S1010、确定任一重要数据的数据特征在重要数据集合中的特征信息熵。
S1020、确定任一重要数据的数据特征在数据类别中的特征条件熵。
S1030、根据特征信息熵和特征条件熵得到任一重要数据的数据特征的信息增益数据;其中,特征信息增益数据包括任一重要数据的数据特征的信息增益数据。
其中,特征信息熵是根据数据特征在重要数据集合中的取值分布情况计算得到的数据特征的信息熵。特征条件熵是以重要数据所属的数据类别为给定条件,根据数据特征在已知的重要数据所属数据类别中的取值分布情况计算得到的数据特征的条件熵。
具体地,针对任一重要数据的任一数据特征,可以通过统计在重要数据集合中该数据特征的所有可能取值的分布情况(所有可能取值的出现概率),来计算得到该数据特征在重要数据集合中的信息熵,作为该数据特征的特征信息熵。由于重要数据已经过分类处理被划分到对应的数据类别中,即,重要数据对应有所属的类别数据集合,因此,可以将上述重要数据所属的数据类别作为给定条件,通过统计在该数据类别中上述数据特征的取值的分布情况,来计算得到该数据特征在对应数据类别中的条件熵,作为该数据特征在给定条件下的特征条件熵。根据该数据特征的特征信息熵和特征条件熵进行差异计算,可以得到该数据特征的信息增益数据(信息增益值)。由此,可以计算得到上述重要数据的多个数据特征的信息增益数据,从而可以得到特征信息增益数据。
示例性地,针对任一重要数据的任一数据特征,可以通过以下公式计算该数据特征的信息增益值:
/>
其中,G表示任一重要数据的数据特征中第n个数据特征的信息增益值;H(n)表示该第n个数据特征对应的熵值,即该第n个数据特征的特征信息熵;K(n|y)表示在给定条件y下该第n个特征对应的条件熵值。其中,给定条件y为该任一重要数据所属的数据类别。关于上述第n个数据特征对应的信息熵和条件熵的计算方式,具体这里不再赘述。
上述实施方式中,通过基于重要数据的数据特征进行信息增益计算,可以有助于识别出对重要数据的不确定性具有重要影响的数据特征,从而为重要数据的分级加密处理提供可靠的依据,满足具有不同安全需求的数据的处理要求。
在一些实施方式中,参考图11所示,根据多个重要数据各自对应的特征信息增益数据,确定多个重要数据各自的数据级别,可以包括以下步骤。
S1110、以多个重要数据分别对应的数据类别为目标,基于特征信息增益数据对多个重要数据进行划分,得到重要数据划分结果。
S1120、根据重要数据划分结果设置多个重要数据各自对应的数据级别。
具体地,根据特征信息增益数据,可以按照从高到低的顺序对各数据特征的信息增益值进行排序,并依次使用对应的数据特征作为分类依据,以将多个重要数据逐步划分为不同的组别或子集,得到重要数据划分结果。
其中,重要数据划分结果中各个子集对应有不同的分类深度,即,不同的子集是根据不同数量的数据特征进行划分得到的。根据重要数据划分结果可以为不同的子集分别设置对应的数据级别,即,为各个子集中的重要数据分别设置对应的数据级别,以得到重要数据集合中多个重要数据各自对应的数据级别。
可以理解的是,本实施方式中,基于特征信息增益数据对多个重要数据进行划分的过程,可以理解为是类似于构建决策树的过程。
示例性地,假设多个重要数据的所有数据特征包括数据特征1、数据特征2、数据特征3、数据特征4。通过前述计算得到特征信息增益数据的方法,可以得到数据特征1、数据特征2、数据特征3、数据特征4各自的信息增益值。通过比较4个数据特征的信息增益值,假设数据特征3的信息增益值>数据特征1的信息增益值>数据特征2的信息增益值>数据特征4的信息增益值,则可以选择其中信息增益值最大的数据特征3作为第一次分裂的节点。根据各重要数据在数据特征3下的特征值,可以将多个重要数据划分为不同的子集。其中,可以根据数据特征3的不同取值进行子集划分,也可以根据数据特征3的不同取值与针对数据特征3预设的多个特征值范围之间的比较结果进行子集划分。
假设划分得到的子集包括子集1和子集2,下来可以选择信息增益值第二的数据特征1作为第二次分裂的节点,分别对子集1和子集2中的重要数据进行进一步划分。假设划分得到的子集包括子集3、子集4、子集5和子集6,则可以继续选择信息增益值第三的数据特征2作为第三次分裂的节点。以此类推,直至根据所有的数据特征完成了数据划分,得到构建的决策树,作为重要数据划分结果。
根据重要数据划分结果,可以将数据级别理解为决策树中的节点深度(即,子集所在的叶子节点的深度)。对于落在不同子集(即不同分支)下的重要数据,可以分别设置对应的数据级别,例如,可以为更靠近根节点的子集中的重要数据设置更高的数据级别,以及为更远离根节点的子集中的重要数据设置更低的数据级别。以此,可以确定多个重要数据各自对应的数据级别,以用于进一步识别多个重要数据中的敏感数据,并根据敏感数据对应的加密策略和数据级别确定敏感数据的目标加密算法。
需要说明的是,关于基于特征信息增益数据对多个重要数据进行划分的方式,可以根据实际应用场景或需求等确定,本说明书中不作具体限定。
上述实施方式中,通过对重要数据的数据特征进行分析,以基于数据特征的信息增益值进行重要数据的划分和数据级别的设置,能够提供一种更加准确和合理的数据级别确定方式。
在一些实施方式中,参考图12所示,根据多个加密重要数据和多个加密常规数据构建数据发送端与数据需求端之间的数据共享链路,可以包括以下步骤。
S1210、基于多个加密重要数据对应的重要摘要数据,以及多个加密常规数据对应的常规摘要数据,配置共享链路环境。
S1220、根据共享链路环境、数据发送端的发送端协议,以及数据需求端的需求端协议,构建数据共享链路。
其中,重要摘要数据是根据多个加密重要数据的摘要信息得到的,常规摘要数据是根据多个加密常规数据的摘要信息得到的。
共享链路环境可以理解为是安全通信框架。
发送端协议是数据发送端的端口协议,可以包括数据发送端所采用的数据封装格式、传输协议、加密解密方式等标准或约定。需求端协议是数据需求端的端口协议,可以包括数据需求端对数据格式、接入方式、解密策略等方面的特定要求等。
具体地,可以提取多个加密重要数据的数据摘要信息,以得到重要摘要数据,以及提取多个加密常规数据的数据摘要信息,以得到常规摘要数据。基于多个加密重要数据对应的重要摘要数据和多个加密常规数据对应的常规摘要数据配置共享链路环境。共享链路环境可以包括网络架构、安全协议、密钥管理等内容,以确保数据能够在安全可靠的环境中进行交换。共享链路环境可以用于指示数据发送端使用重要摘要数据和常规摘要数据对需要传输的共享数据进行签名,以及指示数据接收端使用重要摘要数据和常规摘要数据对接收到的共享数据进行验证。
分别识别数据发送端和数据需求端的端口协议,以得到发送端协议和需求端协议。根据共享链路环境、发送端协议、需求端协议构建数据共享链路,以确保数据发送端和数据需求端之间的数据共享传输能够按照规范正确传输,且能够满足数据需求端对接收数据的要求。
在一些实施例中,重要摘要数据可以是由多个加密重要数据的摘要构成的,常规摘要数据可以是由多个加密常规数据的摘要构成的。
示例性地,可以分别计算多个加密重要数据的摘要,以得到重要摘要数据,以及分别计算多个加密常规数据的摘要,以得到常规摘要数据。将重要摘要数据和常规摘要数据进行融合,可以得到融合摘要。根据融合摘要,可以配置融合摘要对应的共享链路环境。
在另一些实施例中,重要摘要数据可以是通过对多个加密重要数据的摘要进行线性处理后得到的,常规摘要数据可以是通过对多个加密常规数据的摘要进行线性处理后得到的。
示例性地,可以分别计算多个加密重要数据的摘要,并对多个加密重要数据的摘要进行线性处理,以得到重要摘要数据。分别计算多个加密常规数据的摘要,并对多个加密常规数据的摘要进行线性处理,以得到常规摘要数据。将重要摘要数据和常规摘要数据进行融合,得到融合摘要,以根据融合摘要配置对应的共享链路环境。其中,可以采用简单叠加、组合散列等任一种方式对重要摘要数据和常规摘要数据进行融合。
可以理解的是,多个加密重要数据中包括对敏感数据加密后的数据以及对非敏感数据加密后的数据。
需要说明的是,关于多个加密重要数据的摘要计算方式,以及多个加密常规数据的摘要计算方式,本说明书中不作具体限定。
在本说明书中,数据共享链路也可以称为混合共享链路。
在一些实施方式中,参考图13a所示,基于多个加密重要数据对应的重要摘要数据,以及多个加密常规数据对应的常规摘要数据,配置共享链路环境,可以包括以下步骤。
S1310、利用预设线性函数对任一加密重要数据对应的摘要进行线性计算,得到任一加密重要数据对应的重要摘要线性数据;其中,重要摘要数据包括重要摘要线性数据。
S1320、利用预设线性函数对任一加密常规数据对应的摘要进行线性计算,得到任一加密常规数据对应的常规摘要线性数据;其中,常规摘要数据包括常规摘要线性数据。
S1330、根据多个加密重要数据各自对应的重要摘要线性数据和多个加密常规数据各自对应的常规摘要线性数据构建摘要融合矩阵。
S1340、基于摘要融合矩阵配置共享链路环境。
具体地,针对任一加密重要数据的摘要,通过利用预设线性函数对摘要进行线性计算,以得到该任一加密重要数据的摘要线性值,作为该任一加密重要数据对应的重要摘要线性数据。针对任一加密常规数据的摘要,同样通过利用预设线性函数对摘要进行线性计算,以得到该任一加密常规数据的摘要线性值,作为该任一加密常规数据对应的常规摘要线性数据。
根据多个加密重要数据分别对应的重要摘要线性数据可以构建加密重要数据的摘要对应的重要摘要矩阵,以及根据多个加密常规数据分别对应的常规摘要线性数据可以构建加密常规数据的摘要对应的常规摘要矩阵。对重要摘要矩阵和常规摘要矩阵进行矩阵融合,可以构建得到摘要融合矩阵,以基于摘要融合矩阵配置共享链路环境。
示例性地,预设线性函数的公式可以表示如下:
L_digest=βD_digest+θ
其中,L_digest表示摘要线性值;β表示摘要系数;D_digest表示数据的摘要,若数据为加密重要数据,则D_digest为加密重要数据的摘要,若数据为加密常规数据,则D_digest为加密常规数据的摘要;θ表示偏移量。
上述公式中,β和θ的值可以根据具体应用场景和需求确定,例如,可以根据数据的范围、摘要的范围、期望的线性关系等因素中至少一个进行调整。
对重要摘要矩阵和常规摘要矩阵进行矩阵融合,可以通过将重要摘要矩阵中的元素和常规摘要矩阵中的元素加入至同一个矩阵中,以构建得到摘要融合矩阵。其中,融合的方式可以是将重要摘要矩阵中的元素和常规摘要矩阵中的元素加入至同一个矩阵中,也可以是组合散列等任一种方式。根据摘要融合矩阵可以得到加密重要数据的摘要和加密常规数据的摘要对应的融合摘要,基于摘要融合矩阵配置共享链路环境,即基于融合摘要配置对应的共享链路环境。
示例性地,本说明书提供的数据共享方法可以应用于智慧实验室中,实现基于边缘网关的智慧实验室终端数据共享方法。该方法的基本流程可以包括:
步骤1.获取智慧实验室的终端设备,确定终端设备中的接收端和发送端,并响应于接收端向发送端发送的数据需求指令,以根据数据需求指令从发送端中调度数据需求指令对应的多个初始终端数据。通过获取智慧实验室的终端设备,确定终端设备中的接收端和发送端,可以了解终端设备中相应的请求设备,便于后续从发送端中调度数据需求指令对应的初始终端数据。
步骤2.将多个初始终端数据输入到预先训练好的数据分类决策模型中,通过数据分类决策模型对多个初始终端数据进行分类处理,得到多个分类终端数据集合(即,多个类别数据集合)。通过使用数据分类决策模型对初始终端数据进行分类处理,可以将相同性质的数据分类到一起,便于后续提高数据的处理效率。
步骤3.计算多个分类终端数据集合中每个分类终端数据集合对应的数据信息熵,根据数据信息熵,在多个分类终端数据集合中的重要数据集合和常规数据集合。提取重要数据集合中重要终端数据对应的数据特征,以根据数据特征对重要终端数据进行分级加密处理,得到加密重要数据。通过计算每个分类终端数据集合对应的数据信息熵,可以通过数据信息熵了解每个分类终端数据集合中的数据包含的信息量,进而判断每个分类终端数据集合中的数据的重要性。
步骤4.利用预设加密算法对常规数据集合中的常规终端数据进行数据加密处理,得到加密常规数据。根据加密重要数据和加密常规数据,在接收端和发送端之间构建混合共享链路。通过利用预设的加密算法对常规终端数据进行数据加密处理,可以将常规终端数据转换成相应的密文,提高常规终端数据的安全性。
步骤5.在混合共享链路中配置网关处理器,并通过网关处理器配置加密重要数据和加密常规数据的数据传输规则,基于混合共享链路和数据传输规则将加密重要数据和加密常规数据传输至接收端中,以执行发送端和接收端之间的数据共享,得到数据共享结果。通过网关处理器配置加密重要数据和加密常规数据的数据传输规则,可以使数据传输按照相应的规则进行传输,进而提高加密重要数据和加密常规数据的共享传输效率,从而提高智慧实验室的终端数据的共享效率。
进一步地,上述数据共享方法可以应用于基于边缘网关的智慧实验室终端数据共享系统中,参考图13b所示,基于边缘网关的智慧实验室终端数据共享系统可以包括:数据调度模块、数据分类模块、数据加密模块、链路构建模块和数据共享模块。
其中,数据调度模块,可以用于获取智慧实验室的终端设备,确定终端设备中的接收端和发送端,并响应于接收端向发送端发送的数据需求指令,以根据数据需求指令从发送端中调度数据需求指令对应的多个初始终端数据。
数据分类模块,可以用于将多个初始终端数据输入到预先训练好的数据分类决策模型中,通过数据分类决策模型对多个初始终端数据进行分类处理,得到多个分类终端数据集合。
数据加密模块,可以用于计算多个分类终端数据集合中每个分类终端数据集合对应的数据信息熵,根据数据信息熵,在多个分类终端数据集合中的重要数据集合和常规数据集合。提取重要数据集合中重要终端数据对应的数据特征,以根据数据特征对重要终端数据进行分级加密处理,得到加密重要数据。
链路构建模块,可以用于利用预设加密算法对常规数据集合中的常规终端数据进行数据加密处理,得到加密常规数据。根据加密重要数据和加密常规数据,在接收端和发送端之间构建混合共享链路。
数据共享模块,可以用于在混合共享链路中配置网关处理器,并通过网关处理器配置加密重要数据和加密常规数据的数据传输规则,基于混合共享链路和数据传输规则将加密重要数据和加密常规数据传输至接收端中,以执行发送端和接收端之间的数据共享,得到数据共享结果。
本说明书实施方式提供一种数据共享装置,应用于数据发送端,数据发送端中存储有满足预设数据要求的初始数据,初始数据包括多个类别数据集合。参考图14所示,数据共享装置1400可以包括:数据集合确定模块1410、重要数据加密模块1420、常规数据加密模块1430、共享链路构建模块1440。
数据集合确定模块1410,用于根据多个类别数据集合各自的信息熵数据,在多个类别数据集合中确定重要数据集合和常规数据集合;其中,重要数据集合中数据的重要程度大于常规数据集合中数据的重要程度。
重要数据加密模块1420,用于根据重要数据集合中多个重要数据各自的数据特征对多个重要数据进行分级加密,得到多个加密重要数据。
常规数据加密模块1430,用于利用预设加密算法对常规数据集合中的多个常规数据进行加密,得到多个加密常规数据。
共享链路构建模块1440,用于根据多个加密重要数据和多个加密常规数据构建数据发送端与数据需求端之间的数据共享链路,以将多个加密重要数据和多个加密常规数据传输至数据需求端。
关于数据共享装置的具体限定可以参见上文中对于数据共享方法的限定,在此不再赘述。上述数据共享装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
本说明书实施方式还提供一种计算机设备,参考图15所示,计算机设备1500可以包括存储器1510、处理器1520及存储在存储器1510上并可在处理器1520上运行的第一计算机程序1530,处理器1520执行第一计算机程序1530时,实现前述任一项实施方式中的数据共享方法。
本说明书实施方式还提供一种芯片,参考图16所示,芯片1600可以包括存储单元1610、处理单元1620及存储在存储单元1610上并可在处理单元1620上运行的第二计算机程序1630,处理单元1620执行第二计算机程序1630时,实现前述任一项实施方式中的数据共享方法。
本说明书实施方式还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现前述任一项实施方式中的数据共享方法。
需要说明的是,在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (19)
1.一种数据共享方法,其特征在于,应用于数据发送端,所述数据发送端中存储有满足预设数据要求的初始数据,所述初始数据包括多个类别数据集合;所述方法包括:
根据多个类别数据集合各自的信息熵数据,在所述多个类别数据集合中确定重要数据集合和常规数据集合;其中,所述重要数据集合中数据的重要程度大于所述常规数据集合中数据的重要程度;
根据所述重要数据集合中多个重要数据各自的数据特征对所述多个重要数据进行分级加密,得到多个加密重要数据;
利用预设加密算法对所述常规数据集合中的多个常规数据进行加密,得到多个加密常规数据;
根据所述多个加密重要数据和所述多个加密常规数据构建所述数据发送端与数据需求端之间的数据共享链路,以将所述多个加密重要数据和所述多个加密常规数据传输至所述数据需求端。
2.根据权利要求1所述的方法,其特征在于,所述初始数据是从所述数据发送端中存储的终端数据中调度得到的;通过以下方式获取所述初始数据:
获取所述数据需求端发送的数据需求指令;
对所述数据需求指令进行解析,得到所述预设数据要求;
根据所述预设数据要求对应的要求向量值以及所述终端数据对应的数据向量值进行关联性计算,得到所述预设数据要求与所述终端数据之间的关联数据;
若所述关联数据大于等于预设关联数据阈值,对所述终端数据进行调度,以得到所述初始数据。
3.根据权利要求1所述的方法,其特征在于,所述初始数据包括多个初始终端数据;通过以下方式得到所述多个类别数据集合:
对任一初始终端数据进行属性分析,得到所述任一初始终端数据的数据属性;
对所述任一初始终端数据的数据属性进行非线性变换,得到所述任一初始终端数据的非线性属性;
基于所述非线性属性的属性向量值、多个预设数据类别中任一数据类别对应的向量方差数据,以及所述任一数据类别对应的类别参数进行分布概率计算,得到所述非线性属性在所述任一数据类别中的分布概率;其中,所述向量方差数据和所述类别参数是根据所述任一数据类别中预设类别数据的非线性属性数据得到的;
根据所述非线性属性在所述多个预设数据类别中的分布概率确定所述任一初始终端数据对应的目标数据类别;
根据所述多个初始终端数据分别对应的目标数据类别对所述多个初始终端数据进行分类,得到所述多个类别数据集合。
4.根据权利要求3所述的方法,其特征在于,所述多个类别数据集合是利用数据分类决策模型基于所述多个初始终端数据的数据属性对所述多个初始终端数据进行分类得到的。
5.根据权利要求1所述的方法,其特征在于,所述根据多个类别数据集合各自的信息熵数据,在所述多个类别数据集合中确定重要数据集合和常规数据集合,包括:
针对任一类别数据集合,根据所述任一类别数据集合的信息熵数据与预设信息熵阈值的比较结果确定将所述任一类别数据集合中的数据加入所述重要数据集合,或者,确定将所述任一类别数据集合中的数据加入所述常规数据集合。
6.根据权利要求5所述的方法,其特征在于,所述任一类别数据集合对应有属性特征;通过以下方式获取所述任一类别数据集合的信息熵数据:
确定所述任一类别数据集合中的数据在所述初始数据中的类别数据出现概率;
确定所述属性特征的特性数据在所述初始数据中的特性数据出现概率;其中,所述特性数据用于描述所述属性特征的特征值的分布情况;
根据所述类别数据出现概率和所述特性数据出现概率进行信息熵计算,得到所述任一类别数据集合的信息熵数据。
7.根据权利要求1至6任一项所述的方法,其特征在于,所述根据所述重要数据集合中多个重要数据各自的数据特征对所述多个重要数据进行分级加密,得到多个加密重要数据,包括:
根据所述多个重要数据各自的数据特征确定所述多个重要数据各自的数据级别;
基于所述多个重要数据各自的数据级别对所述多个重要数据进行分级加密,得到所述多个加密重要数据。
8.根据权利要求7所述的方法,其特征在于,所述基于所述多个重要数据各自的数据级别对所述多个重要数据进行分级加密,得到所述多个加密重要数据,包括:
根据所述多个重要数据各自对应的数据级别确定所述多个重要数据各自的目标加密算法;
利用所述多个重要数据各自的目标加密算法对所述多个重要数据进行分级加密,得到所述多个加密重要数据。
9.根据权利要求8所述的方法,其特征在于,任一重要数据对应有数据类别;所述基于所述多个重要数据各自对应的数据级别确定所述多个重要数据各自的目标加密算法,包括:
将数据级别大于等于预设级别阈值的重要数据确定为敏感数据;
根据同一数据类别中敏感数据的哈希数据制定所述同一数据类别中敏感数据的加密策略;其中,所述加密策略包括加密算法类型、密钥管理方式、加密层次和安全协议中的至少一种;
根据任一敏感数据的加密策略和数据级别确定所述任一敏感数据的目标加密函数;其中,所述目标加密算法包括所述目标加密函数。
10.根据权利要求8所述的方法,其特征在于,所述基于所述多个重要数据各自对应的数据级别确定所述多个重要数据各自的目标加密算法,还包括:
将数据级别小于预设级别阈值的重要数据确定为非敏感数据;
确定所述非敏感数据的目标加密算法采用预设加密函数;其中,所述预设加密函数的加密安全程度大于所述预设加密算法的加密安全程度。
11.根据权利要求1至6任一项所述的方法,其特征在于,所述根据所述重要数据集合中多个重要数据各自的数据特征对所述多个重要数据进行分级加密,得到多个加密重要数据,包括:
根据所述多个重要数据各自的数据特征进行信息增益计算,得到特征信息增益数据;
根据所述特征信息增益数据确定所述多个重要数据各自的数据级别;
根据所述多个重要数据各自的数据级别对所述多个重要数据进行分级加密,得到所述多个加密重要数据。
12.根据权利要求11所述的方法,其特征在于,任一重要数据对应有数据类别;根据所述多个重要数据各自的数据特征进行信息增益计算,得到特征信息增益数据,包括:
确定所述任一重要数据的数据特征在所述重要数据集合中的特征信息熵;
确定所述任一重要数据的数据特征在所述数据类别中的特征条件熵;
根据所述特征信息熵和所述特征条件熵得到所述任一重要数据的数据特征的信息增益数据;其中,所述特征信息增益数据包括所述任一重要数据的数据特征的信息增益数据。
13.根据权利要求11所述的方法,其特征在于,所述根据所述多个重要数据各自对应的特征信息增益数据,确定所述多个重要数据各自的数据级别,包括:
基于所述特征信息增益数据对所述多个重要数据进行划分,得到重要数据划分结果;
根据所述重要数据划分结果设置所述多个重要数据各自对应的数据级别。
14.根据权利要求1至6任一项所述的方法,其特征在于,所述根据所述多个加密重要数据和所述多个加密常规数据构建所述数据发送端与数据需求端之间的数据共享链路,包括:
基于所述多个加密重要数据对应的重要摘要数据,以及所述多个加密常规数据对应的常规摘要数据,配置共享链路环境;
根据所述共享链路环境、所述数据发送端的发送端协议,以及所述数据需求端的需求端协议,构建所述数据共享链路。
15.根据权利要求14所述的方法,其特征在于,所述基于所述多个加密重要数据对应的重要摘要数据,以及所述多个加密常规数据对应的常规摘要数据,配置共享链路环境,包括:
利用预设线性函数对任一加密重要数据对应的摘要进行线性计算,得到所述任一加密重要数据对应的重要摘要线性数据;其中,所述重要摘要数据包括所述重要摘要线性数据;
利用所述预设线性函数对任一加密常规数据对应的摘要进行线性计算,得到所述任一加密常规数据对应的常规摘要线性数据;其中,所述常规摘要数据包括所述常规摘要线性数据;
根据所述多个加密重要数据各自对应的重要摘要线性数据和所述多个加密常规数据各自对应的常规摘要线性数据构建摘要融合矩阵;
基于所述摘要融合矩阵配置所述共享链路环境。
16.一种数据共享装置,其特征在于,应用于数据发送端,所述数据发送端中存储有满足预设数据要求的初始数据,所述初始数据包括多个类别数据集合;所述装置包括:
数据集合确定模块,用于根据多个类别数据集合各自的信息熵数据,在所述多个类别数据集合中确定重要数据集合和常规数据集合;其中,所述重要数据集合中数据的重要程度大于所述常规数据集合中数据的重要程度;
重要数据加密模块,用于根据所述重要数据集合中多个重要数据各自的数据特征对所述多个重要数据进行分级加密,得到多个加密重要数据;
常规数据加密模块,用于利用预设加密算法对所述常规数据集合中的多个常规数据进行加密,得到多个加密常规数据;
共享链路构建模块,用于根据所述多个加密重要数据和所述多个加密常规数据构建所述数据发送端与数据需求端之间的数据共享链路,以将所述多个加密重要数据和所述多个加密常规数据传输至所述数据需求端。
17.一种计算机设备,包括存储器和处理器,所述存储器存储有第一计算机程序,其特征在于,所述处理器执行所述第一计算机程序时实现权利要求1至15中任一项所述的方法的步骤。
18.一种芯片,包括存储单元和处理单元,所述存储单元存储有第二计算机程序,其特征在于,所述处理单元执行所述第二计算机程序时实现权利要求1至15中任一项所述的方法的步骤。
19.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至15中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410171739.2A CN117725619B (zh) | 2024-02-06 | 2024-02-06 | 数据共享方法、装置、计算机设备、芯片及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410171739.2A CN117725619B (zh) | 2024-02-06 | 2024-02-06 | 数据共享方法、装置、计算机设备、芯片及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117725619A true CN117725619A (zh) | 2024-03-19 |
CN117725619B CN117725619B (zh) | 2024-05-07 |
Family
ID=90209197
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410171739.2A Active CN117725619B (zh) | 2024-02-06 | 2024-02-06 | 数据共享方法、装置、计算机设备、芯片及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117725619B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130111220A1 (en) * | 2011-10-31 | 2013-05-02 | International Business Machines Corporation | Protecting sensitive data in a transmission |
CN115529132A (zh) * | 2022-09-16 | 2022-12-27 | 北京天融信网络安全技术有限公司 | 一种数据传输的方法、装置、电子设备及介质 |
CN116112151A (zh) * | 2023-04-10 | 2023-05-12 | 山东工程职业技术大学 | 一种数据信息安全共享管理方法、系统及存储介质 |
WO2023109056A1 (zh) * | 2021-12-14 | 2023-06-22 | 苏州浪潮智能科技有限公司 | 一种基于属性的加密方法及系统 |
CN117390657A (zh) * | 2023-12-12 | 2024-01-12 | 深圳竹云科技股份有限公司 | 数据加密方法、装置、计算机设备和存储介质 |
-
2024
- 2024-02-06 CN CN202410171739.2A patent/CN117725619B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130111220A1 (en) * | 2011-10-31 | 2013-05-02 | International Business Machines Corporation | Protecting sensitive data in a transmission |
WO2023109056A1 (zh) * | 2021-12-14 | 2023-06-22 | 苏州浪潮智能科技有限公司 | 一种基于属性的加密方法及系统 |
CN115529132A (zh) * | 2022-09-16 | 2022-12-27 | 北京天融信网络安全技术有限公司 | 一种数据传输的方法、装置、电子设备及介质 |
CN116112151A (zh) * | 2023-04-10 | 2023-05-12 | 山东工程职业技术大学 | 一种数据信息安全共享管理方法、系统及存储介质 |
CN117390657A (zh) * | 2023-12-12 | 2024-01-12 | 深圳竹云科技股份有限公司 | 数据加密方法、装置、计算机设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN117725619B (zh) | 2024-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Samy et al. | Fog-based attack detection framework for internet of things using deep learning | |
Zhang et al. | Serious challenges and potential solutions for the industrial internet of things with edge intelligence | |
Voas et al. | A closer look at IoT's things | |
Sharma et al. | An enhanced approach to fuzzy C-means clustering for anomaly detection | |
Mounica et al. | RETRACTED: Detecting Sybil Attack In Wireless Sensor Networks Using Machine Learning Algorithms | |
US10805305B2 (en) | Detection of operational threats using artificial intelligence | |
Du et al. | Digital forensics as advanced ransomware pre-attack detection algorithm for endpoint data protection | |
CN116895375B (zh) | 一种基于数据共享的医疗器械管理追溯方法及系统 | |
US20240121262A1 (en) | Endpoint agents and scalable cloud architecture for low latency classification | |
Panahnejad et al. | APT-Dt-KC: advanced persistent threat detection based on kill-chain model | |
Subathra et al. | Decentralized consensus blockchain and IPFS-based data aggregation for efficient data storage scheme | |
Zhao et al. | Edge intelligence based identification and classification of encrypted traffic of Internet of Things | |
Kim et al. | P2P computing for trusted networking of personalized IoT services | |
CN117201501B (zh) | 一种智慧工程共享管理系统及运行方法 | |
CN116896445B (zh) | 一种卫星网络信息加密系统及方法 | |
CN117725619B (zh) | 数据共享方法、装置、计算机设备、芯片及可读存储介质 | |
Zhang et al. | Cross-domain network attack detection enabled by heterogeneous transfer learning | |
Alajlan et al. | Malicious behavior detection in cloud using self‐optimized dynamic kernel convolutional neural network | |
CN115189966A (zh) | 区块链隐私数据加解密服务系统 | |
Koumidis et al. | Optimizing blockchain for data integrity in cyber physical systems | |
Jiang et al. | Anomaly Detection and Access Control for Cloud-Edge Collaboration Networks. | |
CN112087448A (zh) | 安全日志提取方法、装置和计算机设备 | |
Maiga et al. | Intrusion Detection with Deep Learning Classifiers: A Synergistic Approach of Probabilistic Clustering and Human Expertise to Reduce False Alarms | |
Altalbe | Enhanced Intrusion Detection in In-Vehicle Networks using Advanced Feature Fusion and Stacking-Enriched Learning | |
CN111708602B (zh) | 基于虚拟边界识别的租户敏感信息流动态控制方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |