CN117349713A - 基于数据分类模板的数据安全处理方法及系统 - Google Patents
基于数据分类模板的数据安全处理方法及系统 Download PDFInfo
- Publication number
- CN117349713A CN117349713A CN202311642856.4A CN202311642856A CN117349713A CN 117349713 A CN117349713 A CN 117349713A CN 202311642856 A CN202311642856 A CN 202311642856A CN 117349713 A CN117349713 A CN 117349713A
- Authority
- CN
- China
- Prior art keywords
- data
- matrix
- attention
- data classification
- sampling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 18
- 239000011159 matrix material Substances 0.000 claims abstract description 189
- 238000005070 sampling Methods 0.000 claims abstract description 101
- 238000012545 processing Methods 0.000 claims abstract description 45
- 238000013528 artificial neural network Methods 0.000 claims abstract description 25
- 238000000605 extraction Methods 0.000 claims abstract description 22
- 238000000034 method Methods 0.000 claims description 32
- 230000004913 activation Effects 0.000 claims description 27
- 238000010606 normalization Methods 0.000 claims description 17
- 230000008569 process Effects 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 6
- 238000013461 design Methods 0.000 description 19
- 238000003062 neural network model Methods 0.000 description 7
- 230000004069 differentiation Effects 0.000 description 5
- 238000013500 data storage Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 230000008520 organization Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000003709 image segmentation Methods 0.000 description 3
- 238000013480 data collection Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 241000282414 Homo sapiens Species 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000011022 operating instruction Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供了一种基于数据分类模板的数据安全处理方法及系统,通过获取初始数据集,并利用数据分类模板将初始数据集转换为待分类数据矩阵;利用特征提取器,通过多个卷积层对待分类数据矩阵进行多次特征提取,得到多个采样特征矩阵;利用数据分类模板中的注意力调整器调整每个采样特征矩阵中一个或多个特征元素值,并将多个调整后的采样特征矩阵转换为至少一个注意力矩阵;利用数据分类模板中的分类器,通过预设神经网络中的多个转置卷积层对至少一个注意力矩阵进行多次上采样,得到数据分类矩阵;根据数据分类矩阵中各个数据分类值以及至少一个分类阈值,得到初始数据集中各项数据的安全类别,并根据安全类别对各项数据进行安全处理。
Description
技术领域
本申请涉及数据安全处理技术领域,尤其涉及一种基于数据分类模板的数据安全处理方法及系统。
背景技术
随着智能化和数字化技术的不断发展,现代社会已经进入到了大数据时代。但是在大数据为人类提供各种便利的同时,也对个人隐私、企业甚至国家的信息数据的安全带来了极大的挑战。
现有的数据安全处理,需要人工根据相关法律或企业内部数据管理制度所规定的分类或者分级标准来对业务数据进行分类或分级。但是由于每个人对文字表达的分类标准的理解存在差异,不同人对同一数据的分类结果可能不同,甚至同一个人在不同时期对同一数据的分类结果也可能不同。进而导致数据安全处理的结果不统一,产生数据安全风险。
即现有的数据安全处理存在数据分类时分类标准执行的差异化导致分类不准确、前后分类不统一的技术问题。
发明内容
本申请提供一种基于数据分类模板的数据安全处理方法及系统,以解决数据分类时分类标准执行的差异化导致分类不准确、前后分类不统一的技术问题。
第一个方面,本申请提供一种基于数据分类模板的数据安全处理方法,包括:
获取初始数据集,并利用数据分类模板中的预处理器,将初始数据集转换为待分类数据矩阵;
利用预设神经网络中的特征提取器,通过多个卷积层对待分类数据矩阵进行多次特征提取,得到多个采样特征矩阵,预设神经网络包含在数据分类模板中;
利用数据分类模板中的注意力调整器,调整每个采样特征矩阵中一个或多个特征元素值,并将多个调整后的采样特征矩阵转换为至少一个注意力矩阵;
利用数据分类模板中的分类器,通过预设神经网络中的多个转置卷积层对至少一个注意力矩阵进行多次上采样,得到数据分类矩阵;
根据数据分类矩阵中各个数据分类值以及至少一个分类阈值,得到初始数据集中各项数据的安全类别,并根据安全类别对各项数据进行安全处理。
在一种可能的设计中,利用数据分类模板中的预处理器,将初始数据集转换为待分类数据矩阵,包括:
利用预处理器,根据预设数据结构将初始数据集构造成多个数据块;
根据预设填充方式将多个数据块填充到待分类数据矩阵的各个元素位置中。
在一种可能的设计中,利用数据分类模板中的注意力调整器,调整每个采样特征矩阵中一个或多个特征元素值,并将多个调整后的采样特征矩阵转换为至少一个注意力矩阵,包括:
将每个采样特征矩阵输入注意力调整器的线性调制模块中,对每个采样特征矩阵进行线性调制,线性调制模块包括:至少一个的卷积层、至少一个批归一化层和至少一个线性整流单元(Rectified Linear Unit,ReLU),其中m大于等于1;
从线性调制后的各个采样特征矩阵中,筛选出多个满足预设要求的目标特征矩阵集,每个目标特征矩阵集中包含至少两个采样特征矩阵;
将每个目标特征矩阵集输入注意力调整器中的注意力激活模块,生成注意力矩阵,注意力激活模块包括:至少一个 的卷积层、至少一个批归一化层和至少一个预设激活函数,其中k大于等于1。
在一种可能的设计中,将每个采样特征矩阵输入注意力调整器的线性调制模块中,对每个采样特征矩阵进行线性调制,包括:
,
其中,表示对第i个采样特征矩阵/>进行线性调制,表示/>的卷积层,BN表示批归一化层,ReLU线性整流单元,/>表示将/>输入多层网络结构进行处理。
在一种可能的设计中,从线性调制后的各个采样特征矩阵中,筛选出多个满足预设要求的目标特征矩阵集,包括:
将相邻两次对待分类数据矩阵进行特征提取所得到的采样特征矩阵加入同一个目标特征矩阵集中。
在一种可能的设计中,将每个目标特征矩阵集输入注意力调整器中的注意力激活模块,生成注意力矩阵,包括:
,
,
其中,表示第m个注意力矩阵,/>表示激活模块处理,表示对第i个采样特征矩阵/>进行线性调制,/>表示对第i+1个采样特征矩阵/>进行线性调制,/>表示/>的卷积层,BN表示批归一化层,/>表示sigmoid激活函数,/>表示输入多层网络结构进行处理。
在一种可能的设计中,生成注意力矩阵,还包括:
对注意力激活模块的输出数据与目标特征矩阵集中的第一采样特征矩阵进行残差连接,得到注意力矩阵:
/>,
其中,表示第一采样特征矩阵,第一采样特征矩阵对应的特征提取的顺序在先。
在一种可能的设计中,根据安全类别对各项数据进行安全处理,包括:
根据各项数据对应的安全类别,确定各项数据的存储位置、加密方式、访问和操作权限、保密期限、防火墙设置、审批流程中的至少一个。
第二方面,本申请提供一种基于数据分类模板的数据安全处理系统,包括:
数据采集模块,用于获取初始数据集;
数据分类模块,用于:
利用数据分类模板中的预处理器,将初始数据集转换为待分类数据矩阵;
利用预设神经网络中的特征提取器,通过多个卷积层对待分类数据矩阵进行多次特征提取,预设神经网络包含在数据分类模板中;
利用数据分类模板中的注意力调整器,调整每个采样特征矩阵中一个或多个特征元素值,并将多个调整后的采样特征矩阵转换为至少一个注意力矩阵;
利用数据分类模板中的分类器,通过预设神经网络中的多个转置卷积层对至少一个注意力矩阵进行多次上采样,得到数据分类矩阵;
根据数据分类矩阵中各个数据分类值以及至少一个分类阈值,得到初始数据集中各项数据的安全类别;
安全处理模块,用于根据安全类别对各项数据进行安全处理。
第三方面,本申请提供一种电子设备,包括:处理器,以及与处理器通信连接的存储器;
存储器存储计算机执行指令;
处理器执行存储器存储的计算机执行指令,以实现第一方面所提供的任意一种可能的基于数据分类模板的数据安全处理方法。
第四方面,本申请提供一种存储介质,计算机可读存储介质中存储有计算机执行指令,计算机执行指令被处理器执行时用于实现第一方面所提供的任意一种可能的基于数据分类模板的数据安全处理方法。
第五方面,本申请还提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现第一方面所提供的任意一种可能的基于数据分类模板的数据安全处理方法。
本申请提供了一种基于数据分类模板的数据安全处理方法及系统,通过获取初始数据集,并利用数据分类模板中的预处理器,将初始数据集转换为待分类数据矩阵;利用预设神经网络中的特征提取器,得到多个采样特征矩阵,通过多个卷积层对待分类数据矩阵进行多次特征提取;利用数据分类模板中的注意力调整器,调整每个采样特征矩阵中一个或多个特征元素值,并将多个调整后的采样特征矩阵转换为至少一个注意力矩阵;利用数据分类模板中的分类器,通过预设神经网络中的多个转置卷积层对至少一个注意力矩阵进行多次上采样,得到数据分类矩阵;根据数据分类矩阵中各个数据分类值以及至少一个分类阈值,得到初始数据集中各项数据的安全类别,并根据安全类别对各项数据进行安全处理。解决了现有的数据安全处理存在数据分类时分类标准执行的差异化导致分类不准确、前后分类不统一的技术问题。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1为本申请实施例提供的一种基于数据分类模板的数据安全处理方法的流程示意图;
图2为本申请实施例提供的步骤S103的一种可能的实施方式的流程示意图;
图3为本申请实施例提供的一种基于数据分类模板的数据安全处理系统的结构示意图;
图4为本申请实施例提供的一种电子设备的结构示意图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,包括但不限于对多个实施例的组合,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
图1为本申请实施例提供的一种基于数据分类模板的数据安全处理方法的流程示意图。如图1所示,该方法的具体步骤包括:
S101、获取初始数据集,并利用数据分类模板中的预处理器,将初始数据集转换为待分类数据矩阵。
在本步骤中,获取初始数据集的方式包括:在预设数据采集周期内,从服务器的临时数据存储库中提取至少一个企业或机构或组织所上传的原始业务数据,并将其打包形成初始数据集。可选的,预设数据采集周期,包括:一个小时、一日、一周、一月、一季度、一年中的至少一个。
需要说明的是,企业或机构或组织的原始业务数据可以通过设置后台自动上传,在原始业务数据产生时就将其进行上传,并且上传时将数据来源、数据生成时间、操作员、数据用途等信息自动采集,与原始业务数据一起上传到服务器的临时数据存储库中。还需要说明的是,预设数据采集周期的大小与临时数据存储库的大小相关,临时数据存储库越大,则可以设置的设数据采集周期就越长。
在一种可能的设计中,利用数据分类模板中的预处理器,将初始数据集转换为待分类数据矩阵,具体包括:
首先,利用数据分类模板中的预处理器,根据预设数据结构将初始数据集构造成多个数据块;然后,根据预设填充方式将多个数据块填充到待分类数据矩阵的各个元素位置中。
在本申请中,为了便于后续进行数据分类,创造性地利用图像分割原理,将待分类数据矩阵当作待分割图像,对应的,数据块就可以理解为待分割图像的像素块。这种数据组织方式可以为本申请后续进行数据分类时,创造性地引入图像分割技术来进行数据分类,拓展了数据分类的方法选择范围和灵活性。
S102、利用预设神经网络中的特征提取器,通过多个卷积层对待分类数据矩阵进行多次特征提取,得到多个采样特征矩阵。
在本步骤中,预设神经网络包含在数据分类模板中。
需要说明的是,预设神经网络包括:解码器、编译器以及全连接层,全连接层可以将编码器和解码器连接起来。预设神经网络包括:用于图像分割的卷积神经网络模型、深度学习模型、Unet神经网络模型、Unet++神经网络模型等等。
值得注意的是,特征提取的过程也可以称为下采样,对于不同的卷积层可以对应相同或者不同的卷积核,包括:1X1、3X3、5X5、12X12、24X24、64X64、128X128等等的卷积核。不同的卷积核进行特征提取后所得到的采样特征矩阵的尺寸也是不一样的,即不同的采样特征矩阵的总行数和/或总列数可能不同。
还需要说明的是,不同卷积层可以按照一定顺序进行排列,一般尺寸较大的卷积核对于的卷积层排列在前,前一个卷积层输出的采样特征矩阵可以作为后一个卷积层的输入数据。卷积层的数量与神经网络模型的深度相关,例如,神经网络模型的深度为5,每个深度上有两个卷积层,则总共需要10个卷积层来进行特征提取。
S103、利用数据分类模板中的注意力调整器,调整每个采样特征矩阵中一个或多个特征元素值,并将多个调整后的采样特征矩阵转换为至少一个注意力矩阵。
在本步骤中,注意力调整器以各个采样特征矩阵作为输入,然后经过卷积处理、批归一化处理、对每个采样特征矩阵中的部分或全部特征元素值进行线性调整处理或非线性调整处理、激活处理等多重网络结构处理后,得到与每个采样特征矩阵对应的注意力矩阵。
值得说明的是,在本步骤中引入注意力机制,从数据块的层面进行数据特征的重建,注意力矩阵所起到的作用是调整每个数据块和/或每个数据块中的待分类数据的关注权重,便于后续更为准确的对待分类数据进行数据划分。
还需要说明的是,注意力调整器也可以看成一个提前根据数据分类标准或者数据分类规则训练好的神经网络模型。引入注意力机制可以提高数据分类的效率和准确性。
在本实施例中,通过图2来具体介绍本步骤的一种可能的实时方式。
图2为本申请实施例提供的步骤S103的一种可能的实施方式的流程示意图。如图2所示,在本步骤中,具体实现方式包括:
S1031、将每个采样特征矩阵输入注意力调整器的线性调制模块中,对每个采样特征矩阵进行线性调制。
在本实施例中,线性调制模块包括:至少一个的卷积层、至少一个批归一化层和至少一个线性整流单元(Rectified Linear Unit,ReLU),其中m大于等于1。
在一种可能的设计中,可以用公式(1)所示的方式进行线性调制:
,
其中,表示对第i个采样特征矩阵/>进行线性调制,表示/>的卷积层,BN表示批归一化层,ReLU线性整流单元,/>表示将/>输入多层网络结构进行处理。
本步骤的主要作用是对每个采样特征矩阵进行调整,以突出或放大其中对于某些需要特别关注的数据,比如安全分类级别更高的数据,压制或缩小安全级别低的数据。
S1032、从线性调制后的各个采样特征矩阵中,筛选出多个满足预设要求的目标特征矩阵集。
在本步骤中,每个目标特征矩阵集中包含至少两个采样特征矩阵。
可选的,预设要求包括:目标特征矩阵集中的采样特征矩阵是相邻的特征提取所得到的,即在某次通过卷积层进行特征提取时,该次特征提取的输入数据和输出数据所对应的采样特征矩阵加入到同一个模板特征矩阵集当中。
或者说,目标特征矩阵集中某一个采样特征矩阵是另一个采样特征矩阵对应的通过卷积层进行的输入或输出。
在一种可能的设计中,本步骤具体可以通过以下方式实现:
将相邻两次对待分类数据矩阵进行特征提取所得到的采样特征矩阵加入同一个目标特征矩阵集中。这样目标特征矩阵集的数量是特征提取总次数减一。
S1033、将每个目标特征矩阵集输入注意力调整器中的注意力激活模块,生成注意力矩阵。
在本实施例中,注意力激活模块包括:至少一个的卷积层、至少一个批归一化层和至少一个预设激活函数,其中k大于等于1。
在一种可能的设计中,可以用公式(2)所示的方式生成注意力矩阵:
(2),
其中,表示第m个注意力矩阵,/>表示激活模块处理,表示对第i个采样特征矩阵/>进行线性调制,/>表示对第i+1个采样特征矩阵/>进行线性调制,/>表示/>的卷积层,BN表示批归一化层,/>表示sigmoid激活函数,/>表示输入多层网络结构进行处理。
在另一种可能的设计中,由于预设神经网络模型以及注意力调整器中可能存在较多的嵌套结构,这就可能出现过多的注意力加权,从而将导致各个注意力矩阵之间的梯度过低或消失,对后续数据分类的精准度造成不良影像。为了改善这一现象,可以采用残差连接的方式,在对注意力矩阵加权后再补充回原来的采样特征矩阵,具体可以用公式(3)来表示:
注意力矩阵:
,
,
其中,表示第一采样特征矩阵,第一采样特征矩阵对应的特征提取的顺序在先。即将采样特征矩阵/>输入卷积层进行特征提取后,得到采样特征矩阵,或者说先进行采样特征矩阵/>对应的特征提取,并将本次特征提取的最终结果和/或中间结果,作为采样特征矩阵/>对应的特征提取的输入数据,得到采样特征矩阵/>。
S104、利用数据分类模板中的分类器,通过预设神经网络中的多个转置卷积层对至少一个注意力矩阵进行多次上采样,得到数据分类矩阵。
在本步骤中,转置卷积层对应的上采样和上述特征提取时的卷积层对应的下采样可以看成两个互逆的过程。但是值得注意的是,两者虽然过程互逆,但是输入数据不同,因此数据分类矩阵是将注意力矩阵重新组合的结果,而重新组合时的方式与待分类数据矩阵进行特征提取时的方式互逆,就能保证数据分类矩阵中的元素与待分类数据矩阵中的元素保持严格的一一对应,这样就能够实现,通过对数据分类矩阵来对初始数据集中的数据进行准确且统一的分类的技术效果。
S105、根据数据分类矩阵中各个数据分类值以及至少一个分类阈值,得到初始数据集中各项数据的安全类别,并根据安全类别对各项数据进行安全处理。
在本步骤中,根据各项数据对应的安全类别,确定各项数据的存储位置、加密方式、访问和操作权限、保密期限、防火墙设置、审批流程中的至少一个。
例如,可以将企业的业务数据划分为:公开、内部和机密三个安全等级或安全类别。公开是指该数据可以面向企业之外的任何人使用和读取,其不包含敏感信息或商业秘密。内部是指该数据仅可以在企业内部不受限制的读取和使用,但是其包含了部分敏感信息,不能给企业之外的人员阅读和使用。机密是指该数据包含了对于企业的核心信息或重要数据,只有企业内部中被授权的管理层人员才可以查阅和使用。
公开类别的数据不进行加密处理,内部类别的数据进行一次加密,机密类别的数据在一次加密的基础上需要进行二次加密,两次加密的方式不同。
此外,对于机密类别的数据,还需要进行切割分布式存储备份,避免受到外部黑客攻击时拿到完整的机密信息,提高数据的安全性。
本实施例提供了一种基于数据分类模板的数据安全处理方法,通过获取初始数据集,并利用数据分类模板中的预处理器,将初始数据集转换为待分类数据矩阵;利用预设神经网络中的特征提取器,得到多个采样特征矩阵,通过多个卷积层对待分类数据矩阵进行多次特征提取;利用数据分类模板中的注意力调整器,调整每个采样特征矩阵中一个或多个特征元素值,并将多个调整后的采样特征矩阵转换为至少一个注意力矩阵;利用数据分类模板中的分类器,通过预设神经网络中的多个转置卷积层对至少一个注意力矩阵进行多次上采样,得到数据分类矩阵;根据数据分类矩阵中各个数据分类值以及至少一个分类阈值,得到初始数据集中各项数据的安全类别,并根据安全类别对各项数据进行安全处理。解决了现有的数据安全处理存在数据分类时分类标准执行的差异化导致分类不准确、前后分类不统一的技术问题。
本申请通过利用神经网络模型以及注意力机制,实现了根据分类标准严格统一对数据分类的技术效果,消除了人工分类的差异化,并且注意力机制还提高了数据分类的效率。
图3为本申请实施例提供的一种基于数据分类模板的数据安全处理系统的结构示意图。该数据安全处理系统300可以通过软件、硬件或者两者的结合实现。
如图3所示,该数据安全处理系统300包括:
数据采集模块301,用于获取初始数据集;
数据分类模块302,用于:
利用数据分类模板中的预处理器,将初始数据集转换为待分类数据矩阵;
利用预设神经网络中的特征提取器,通过多个卷积层对待分类数据矩阵进行多次特征提取,得到多个采样特征矩阵,预设神经网络包含在数据分类模板中;
利用数据分类模板中的注意力调整器,调整每个采样特征矩阵中一个或多个特征元素值,并将多个调整后的采样特征矩阵转换为至少一个注意力矩阵;
利用数据分类模板中的分类器,通过预设神经网络中的多个转置卷积层对至少一个注意力矩阵进行多次上采样,得到数据分类矩阵;
根据数据分类矩阵中各个数据分类值以及至少一个分类阈值,得到初始数据集中各项数据的安全类别;
安全处理模块303,用于根据安全类别对各项数据进行安全处理。
在一种可能的设计中,数据分类模块302,用于:
利用预处理器,根据预设数据结构将初始数据集构造成多个数据块;
根据预设填充方式将多个数据块填充到待分类数据矩阵的各个元素位置中。
在一种可能的设计中,数据分类模块302,用于:
将每个采样特征矩阵输入注意力调整器的线性调制模块中,对每个采样特征矩阵进行线性调制,线性调制模块包括:至少一个的卷积层、至少一个批归一化层和至少一个线性整流单元(Rectified Linear Unit,ReLU),其中m大于等于1;
从线性调制后的各个采样特征矩阵中,筛选出多个满足预设要求的目标特征矩阵集,每个目标特征矩阵集中包含至少两个采样特征矩阵;
将每个目标特征矩阵集输入注意力调整器中的注意力激活模块,生成注意力矩阵,注意力激活模块包括:至少一个的卷积层、至少一个批归一化层和至少一个预设激活函数,其中k大于等于1。
在一种可能的设计中,数据分类模块302,用于将每个采样特征矩阵输入注意力调整器的线性调制模块中,对每个采样特征矩阵进行线性调制,包括:
,
其中,表示对第i个采样特征矩阵/>进行线性调制,表示/>的卷积层,BN表示批归一化层,ReLU线性整流单元,/>表示将/>输入多层网络结构进行处理。
在一种可能的设计中,数据分类模块302,用于:
将相邻两次对待分类数据矩阵进行特征提取所得到的采样特征矩阵加入同一个目标特征矩阵集中。
在一种可能的设计中,数据分类模块302,用于将每个目标特征矩阵集输入注意力调整器中的注意力激活模块,生成注意力矩阵,包括:
,
其中,表示第m个注意力矩阵,/>表示激活模块处理,表示对第i个采样特征矩阵/>进行线性调制,/>表示对第i+1个采样特征矩阵/>进行线性调制,/>表示/>的卷积层,BN表示批归一化层,/>表示sigmoid激活函数,/>表示输入多层网络结构进行处理。
在一种可能的设计中,数据分类模块302,用于生成注意力矩阵,还包括:
对注意力激活模块的输出数据与目标特征矩阵集中的第一采样特征矩阵进行残差连接,得到注意力矩阵:
,
,
其中,表示第一采样特征矩阵,第一采样特征矩阵对应的特征提取的顺序在先。
在一种可能的设计中,安全处理模块303,用于:
根据各项数据对应的安全类别,确定各项数据的存储位置、加密方式、访问和操作权限、保密期限、防火墙设置、审批流程中的至少一个。
值得说明的是,图3所示实施例提供的系统,可以执行上述任一方法实施例中所提供的方法,其具体实现原理、技术特征、专业名词解释以及技术效果类似,在此不再赘述。
图4为本申请实施例提供的一种电子设备的结构示意图。如图4所示,该电子设备400,可以包括:至少一个处理器401和存储器402。图4示出的是以一个处理器为例的装置。
存储器402,用于存放程序。具体地,程序可以包括程序代码,程序代码包括计算机操作指令。
存储器402可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
处理器401用于执行存储器402存储的计算机执行指令,以实现以上各方法实施例所述的方法。
其中,处理器401可能是一个中央处理器(central processing unit,简称为CPU),或者是特定集成电路(application specific integrated circuit,简称为ASIC),或者是被配置成实施本申请实施例的一个或多个集成电路。
可选地,存储器402既可以是独立的,也可以跟处理器401集成在一起。当所述存储器402是独立于处理器401之外的器件时,所述电子设备400,还可以包括:
总线403,用于连接所述处理器401以及所述存储器402。总线可以是工业标准体系结构(industry standard architecture,简称为ISA)总线、外部设备互连(peripheralcomponent, PCI)总线或扩展工业标准体系结构(extended industry standardarchitecture, EISA)总线等。总线可以分为地址总线、数据总线、控制总线等,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器402和处理器401集成在一块芯片上实现,则存储器402和处理器401可以通过内部接口完成通信。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(read-only memory ,ROM)、随机存取存储器(randomaccess memory,RAM)、磁盘或者光盘等各种可以存储程序代码的介质,具体的,该计算机可读存储介质中存储有程序指令,程序指令用于上述各方法实施例中的方法。
本申请实施例还提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由本申请的权利要求书指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求书来限制。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。
Claims (10)
1.一种基于数据分类模板的数据安全处理方法,其特征在于,包括:
获取初始数据集,并利用数据分类模板中的预处理器,将所述初始数据集转换为待分类数据矩阵;
利用预设神经网络中的特征提取器,通过多个卷积层对所述待分类数据矩阵进行多次特征提取,得到多个采样特征矩阵,所述预设神经网络包含在所述数据分类模板中;
利用所述数据分类模板中的注意力调整器,调整每个所述采样特征矩阵中一个或多个特征元素值,并将多个调整后的所述采样特征矩阵转换为至少一个注意力矩阵;
利用所述数据分类模板中的分类器,通过所述预设神经网络中的多个转置卷积层对所述至少一个注意力矩阵进行多次上采样,得到数据分类矩阵;
根据所述数据分类矩阵中各个数据分类值以及至少一个分类阈值,得到所述初始数据集中各项数据的安全类别,并根据所述安全类别对所述各项数据进行安全处理。
2.根据权利要求1所述的基于数据分类模板的数据安全处理方法,其特征在于,所述利用数据分类模板中的预处理器,将所述初始数据集转换为待分类数据矩阵,包括:
利用所述预处理器,根据预设数据结构将所述初始数据集构造成多个数据块;
根据预设填充方式将所述多个数据块填充到所述待分类数据矩阵的各个元素位置中。
3.根据权利要求1所述的基于数据分类模板的数据安全处理方法,其特征在于,所述利用所述数据分类模板中的注意力调整器,调整每个所述采样特征矩阵中一个或多个特征元素值,并将多个调整后的所述采样特征矩阵转换为至少一个注意力矩阵,包括:
将每个所述采样特征矩阵输入所述注意力调整器的线性调制模块中,对每个所述采样特征矩阵进行线性调制,所述线性调制模块包括:至少一个 的卷积层、至少一个批归一化层和至少一个线性整流单元(Rectified Linear Unit,ReLU),其中m大于等于1;
从线性调制后的各个所述采样特征矩阵中,筛选出多个满足预设要求的目标特征矩阵集,每个所述目标特征矩阵集中包含至少两个所述采样特征矩阵;
将每个所述目标特征矩阵集输入所述注意力调整器中的注意力激活模块,生成所述注意力矩阵,所述注意力激活模块包括:至少一个的卷积层、至少一个批归一化层和至少一个预设激活函数,其中k大于等于1。
4.根据权利要求3所述的基于数据分类模板的数据安全处理方法,其特征在于,所述将每个所述采样特征矩阵输入所述注意力调整器的线性调制模块中,对每个所述采样特征矩阵进行线性调制,包括:
,
其中,表示对第i个采样特征矩阵/>进行线性调制,/>表示/>的卷积层,BN表示批归一化层,ReLU所述线性整流单元,/>表示将/>输入多层网络结构进行处理。
5.根据权利要求3所述的基于数据分类模板的数据安全处理方法,其特征在于,所述从线性调制后的各个所述采样特征矩阵中,筛选出多个满足预设要求的目标特征矩阵集,包括:
将相邻两次对所述待分类数据矩阵进行特征提取所得到的所述采样特征矩阵加入同一个所述目标特征矩阵集中。
6.根据权利要求5所述的基于数据分类模板的数据安全处理方法,其特征在于,所述将每个所述目标特征矩阵集输入所述注意力调整器中的注意力激活模块,生成所述注意力矩阵,包括:
,
,
其中,表示第m个所述注意力矩阵,/>表示激活模块处理,表示对第i个采样特征矩阵/>进行线性调制,/>表示对第i+1个采样特征矩阵/>进行线性调制,/>表示/>的卷积层,BN表示批归一化层,/>表示sigmoid激活函数,/>表示输入多层网络结构进行处理。
7.根据权利要求6所述的基于数据分类模板的数据安全处理方法,其特征在于,所述生成所述注意力矩阵,还包括:
对所述注意力激活模块的输出数据与所述目标特征矩阵集中的第一采样特征矩阵进行残差连接,得到所述注意力矩阵:
,
,
其中,表示所述第一采样特征矩阵,所述第一采样特征矩阵对应的特征提取的顺序在先。
8.根据权利要求1所述的基于数据分类模板的数据安全处理方法,其特征在于,所述根据所述安全类别对所述各项数据进行安全处理,包括:
根据所述各项数据对应的所述安全类别,确定所述各项数据的存储位置、加密方式、访问和操作权限、保密期限、防火墙设置、审批流程中的至少一个。
9.一种基于数据分类模板的数据安全处理系统,其特征在于,包括:
数据采集模块,用于获取初始数据集;
数据分类模块,用于:
利用数据分类模板中的预处理器,将所述初始数据集转换为待分类数据矩阵;
利用预设神经网络中的特征提取器,通过多个卷积层对所述待分类数据矩阵进行多次特征提取,得到多个采样特征矩阵,所述预设神经网络包含在所述数据分类模板中;
利用所述数据分类模板中的注意力调整器,调整每个所述采样特征矩阵中一个或多个特征元素值,并将多个调整后的所述采样特征矩阵转换为至少一个注意力矩阵;
利用所述数据分类模板中的分类器,通过所述预设神经网络中的多个转置卷积层对所述至少一个注意力矩阵进行多次上采样,得到数据分类矩阵;
根据所述数据分类矩阵中各个数据分类值以及至少一个分类阈值,得到所述初始数据集中各项数据的安全类别;
安全处理模块,用于根据所述安全类别对所述各项数据进行安全处理。
10.一种电子设备,其特征在于,包括:处理器以及存储器;
所述存储器,用于存储所述处理器的计算机程序;
所述处理器配置为经由执行所述计算机程序来执行权利要求1至7任一项所述的数据安全处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311642856.4A CN117349713B (zh) | 2023-12-04 | 2023-12-04 | 基于数据分类模板的数据安全处理方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311642856.4A CN117349713B (zh) | 2023-12-04 | 2023-12-04 | 基于数据分类模板的数据安全处理方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117349713A true CN117349713A (zh) | 2024-01-05 |
CN117349713B CN117349713B (zh) | 2024-02-23 |
Family
ID=89357784
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311642856.4A Active CN117349713B (zh) | 2023-12-04 | 2023-12-04 | 基于数据分类模板的数据安全处理方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117349713B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107092596A (zh) * | 2017-04-24 | 2017-08-25 | 重庆邮电大学 | 基于attention CNNs和CCR的文本情感分析方法 |
CN113190681A (zh) * | 2021-03-02 | 2021-07-30 | 东北大学 | 一种基于胶囊网络遮罩记忆注意力的细粒度文本分类方法 |
CN114549832A (zh) * | 2022-01-20 | 2022-05-27 | 华东师范大学 | 一种基于数据集分布和上下文信息的语义分割方法 |
-
2023
- 2023-12-04 CN CN202311642856.4A patent/CN117349713B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107092596A (zh) * | 2017-04-24 | 2017-08-25 | 重庆邮电大学 | 基于attention CNNs和CCR的文本情感分析方法 |
CN113190681A (zh) * | 2021-03-02 | 2021-07-30 | 东北大学 | 一种基于胶囊网络遮罩记忆注意力的细粒度文本分类方法 |
CN114549832A (zh) * | 2022-01-20 | 2022-05-27 | 华东师范大学 | 一种基于数据集分布和上下文信息的语义分割方法 |
Also Published As
Publication number | Publication date |
---|---|
CN117349713B (zh) | 2024-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11893777B2 (en) | Systems and methods for image based content capture and extraction utilizing deep learning neural network and bounding box detection training techniques | |
AU2019430859B2 (en) | Generative adversarial mechanism and attention mechanism-based standard face generation method | |
CN110706302B (zh) | 一种文本合成图像的系统及方法 | |
CN115063573B (zh) | 一种基于注意力机制的多尺度目标检测方法 | |
CN107977665A (zh) | 一种发票中关键信息的识别方法及计算设备 | |
US10185895B1 (en) | Systems and methods for classifying activities captured within images | |
WO2020248841A1 (zh) | 图像的au检测方法、装置、电子设备及存储介质 | |
CN114549913B (zh) | 一种语义分割方法、装置、计算机设备和存储介质 | |
CN112257578A (zh) | 人脸关键点检测方法、装置、电子设备及存储介质 | |
CN113781164B (zh) | 虚拟试衣模型训练方法、虚拟试衣方法和相关装置 | |
CN113392791A (zh) | 一种皮肤预测处理方法、装置、设备及存储介质 | |
CN111310995A (zh) | 基于卷积神经网络的业务预测方法以及装置 | |
CN113554047A (zh) | 图像处理模型的训练方法、图像处理方法及对应的装置 | |
CN115049919A (zh) | 一种基于注意力调控的遥感图像语义分割方法及系统 | |
CN117349713B (zh) | 基于数据分类模板的数据安全处理方法及系统 | |
CN111861963B (zh) | 图像合成方法及相关设备 | |
CN111401335B (zh) | 一种关键点检测方法及装置、存储介质 | |
CN112861950A (zh) | 翻拍图像的识别方法、装置、电子设备及存储介质 | |
Miao et al. | ITrans: generative image inpainting with transformers | |
Thakur et al. | Geometrical attack classification using DCNN and forgery localization using machine learning | |
Chowdhury et al. | A Demonstration of GeoTorchAI: A Spatiotemporal Deep Learning Framework | |
CN117314756B (zh) | 基于遥感图像的验保方法、装置、计算机设备及存储介质 | |
CN117853678B (zh) | 基于多源遥感进行地理空间数据三维实体化改造的方法 | |
CN114091662B (zh) | 一种文本图像生成方法、装置及电子设备 | |
US20240184860A1 (en) | Methods and arrangements for providing impact imagery |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |