CN108363717A - 一种数据安全级别的识别检测方法及装置 - Google Patents

一种数据安全级别的识别检测方法及装置 Download PDF

Info

Publication number
CN108363717A
CN108363717A CN201711473686.6A CN201711473686A CN108363717A CN 108363717 A CN108363717 A CN 108363717A CN 201711473686 A CN201711473686 A CN 201711473686A CN 108363717 A CN108363717 A CN 108363717A
Authority
CN
China
Prior art keywords
data
vector
cell
theme
data cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711473686.6A
Other languages
English (en)
Other versions
CN108363717B (zh
Inventor
赵伟
武新
崔维力
刘奥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TIANJIN NANKAI UNIVERSITY GENERAL DATA TECHNOLOGIES Co Ltd
Original Assignee
TIANJIN NANKAI UNIVERSITY GENERAL DATA TECHNOLOGIES Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TIANJIN NANKAI UNIVERSITY GENERAL DATA TECHNOLOGIES Co Ltd filed Critical TIANJIN NANKAI UNIVERSITY GENERAL DATA TECHNOLOGIES Co Ltd
Priority to CN201711473686.6A priority Critical patent/CN108363717B/zh
Publication of CN108363717A publication Critical patent/CN108363717A/zh
Application granted granted Critical
Publication of CN108363717B publication Critical patent/CN108363717B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种数据安全级别的识别检测方法及装置,本发明旨在提供一种识别检测数据安全分级的方法。该方法作用的对象为关系型数据库或大数据服务提供者的存储数据,可为单个关系表,单个存储文件或单个数据库判定其安全级别,级别越高则数据泄漏或损坏后造成的损失越大。该方法以数据单元所含敏感数据多少作为最重要特征,结合数据单元的主题,数据量,对大数据服务平台上尽可能多的数据单元做聚类并根据其结果设定安全分级并可对新的数据单元进行安全级别认定。该种分级方法能全面,准确,有效的评估数据安全级别,为普通数据服务和大数据服务平台应该设定哪种级别的数据安全保护提供参考,为评估大数据服务能力提供支持。

Description

一种数据安全级别的识别检测方法及装置
技术领域
本发明属于数据挖掘领域,涉及到通过大数据应用大数据分析算法对数据安全级别进行检测评估,具体涉及到了数据的表示,特征提取和聚类算法创新及应用。
背景技术
数据往往以一定形式存储在数据库中,方便用户存取和操作。现如今,大数据依托于更广泛更开放的云平台出现,一方面改变着人们的生活方式和对数据的认知,另一方面也对敏感的私有数据的安全保护提出了更高的要求。人们希望数据服务提供者能够安全存储敏感数据并提供可靠地数据服务,尤其是在大数据环境下,因为敏感数据的恶意篡改、泄露、遗失、损坏等会造成非常严重的后果。对于数据服务的提供者,根据数据重要程度提供相应级别的安全保护至关重要,数据安全级别越高,说明数据一旦泄露造成的后果越严重,其所需要的安全保护级别就越高。而现在并没有评估数据安全级别的体系或方法,本发明提供了一种识别检测数据安全分级的方法。
数据大都以数据表的形式存储自数据库中,待评估的数据单元可能是数据表,也可能是一个数据库。评估一个数据单元的安全级别,需要将安全相关的因素提取出来。而这些因素太多,哪些最重要,哪些可以起到一定作用但不那么重要,这些因素对安全级别的影响程度是怎样的,如何将这些因素融合起来综合评估一个数据单元的安全级别,这些问题都是较难解决的。直观认为,数据单元含有的敏感数据越多,其安全级别就会越高。但另外如数据单元主题,数据量多少这些因素,也起到了比较重要的作用。比如某一数据单元敏感数据并不多,但它的主题与国家安全相关,那么它的安全级别依然很高。
数据单元的主题是影响其安全级别的重要因素,而对数据单元主题的划分现在没有可靠地标准,无法将其简单的划分为几类,而且使用人工标准的划分只能依靠人工来识别新数据单元的主题,无法自动化。因此确定一个数据单元的主题依然困难。现如今有很多的自然语言处理方法,能够使用聚类、深度学习等方法确定文本主题等,但对数据库中存储的格式化的数据进行主题分类识别的研究较少,其难度在于如何表示数据单元主题相关特征。比如一张数据表,除了要关注数据表中的各属性的值,还要关注该表有哪些属性。
普通的将影响数据单元安全级别的各因素简单融合叠加,人为设定安全分级的方法太主观,不科学,无法对数据单元进行有效分级,分级结果也不具备说服性。因此要找到科学有效的分级方法。聚类能够在没有标记的情况下将数据自行聚集成多个簇,其恰好能够对应于安全分级,因此聚类对于解决数据安全级别的问题是一个有效手段。采用大量样本,最好是云平台上的全部数据,才能获得更准确科学的安全级别。而大数据量会使聚类过程消耗大量时间和计算间,因此要求聚类方法尽可能简单高效。另一个难题是分类数量的确定。由于数据安全级别需要自动形成最合适的类别,所以常用的k-means聚类算法不能奏效。采用层次聚类方法,通过计算各层聚类后增益熵的方法,能够选取最佳分类,从而确定安全级别个数。
发明内容
本发明的目标是在现有聚类算法基础上,针对大数据服务提供者所存储的大量数据,提出一种能够识别检测数据安全级别的方法,为普通数据服务和大数据服务平台应该设定哪种级别的数据安全保护提供参考,为评估大数据服务能力提供支持。
为了达到上述目的,本发明采取的技术方案为:一种数据安全级别的识别检测方法,包括:
步骤1、构建敏感数据字典;
步骤2、为每个数据单元构建主题相关特征向量,并对大数据平台的数据单元进行聚类,得到主题分类;
步骤3、计算每个数据单元敏感得分并为每个数据单元构建安全相关特征向量;
步骤4、依据安全相关特征向量对大数据平台数据单元进行聚类并设定安全级别;
步骤5、识别检测新数据单元的安全级别。
进一步的,步骤1所述构建敏感数据字典的方法为:
步骤101、将与安全相关的敏感词及其安全权重记录汇集起来;
步骤102、根据敏感词的长度区分存储。
进一步的,步骤2所述得到主题分类的具体方法为:
步骤201、构建主题属性相关特征,包括两部分,前一部分为所有数据表中属性,值为 1或0,1表示某数据单元包含该属性,0表示不包含;后一部分为数据表中数据出现的词,值为1或0,1表示某数据单元数据中出现了该词,0表示未出现;
步骤202、依据特征向量聚类并确定最佳分类数;主要采用Jaccard距离来衡量样本间的距离,各类的距离采用类间样本平均距离;
步骤203、学习主题分类器,利用卷积神经网络CNN训练分类器。
进一步的,步骤3所述构建安全相关特征向量的方法为:
步骤301、计算各数据单元的敏感得分;
步骤302、计算各数据单元的主题特征值;
步骤303、计算各数据单元的数据量倒数;
步骤304、上述3个数值作为各数据单元的特征数据,构成特征矩阵,用于后续聚类设定安全级别。
进一步的,步骤5所述识别检测新数据单元的安全级别的具体步骤为:
步骤501、为新数据单元构建主题相关特征向量,将该向量输入到主题分类器中,得到其主题;
步骤502、构造出安全相关特征向量,并将该向量各维乘以其对应的安全权重得到向量 v;
步骤503、将向量v输入步骤4形成的安全级别分类器中,得到其安全级别。
本发明的另一方面,提供了一种数据安全级别的识别检测装置,包括:
字典模块,用于构建敏感数据字典;
主题向量模块,用于为每个数据单元构建主题相关特征向量,并对大数据平台的数据单元进行聚类,得到主题分类;
安全向量模块,用于计算每个数据单元敏感得分并为每个数据单元构建安全相关特征向量;
安全级别模块,用于依据安全相关特征向量对大数据平台数据单元进行聚类并设定安全级别;
识别模块,用于识别检测新数据单元的安全级别。
进一步的,所述字典模块包括:
汇集单元,用于将与安全相关的敏感词及其安全权重记录汇集起来;
存储单元,用于根据敏感词的长度区分存储。
进一步的,主题向量模块包括:
主题特征单元,用于构建主题属性相关特征,包括两部分,前一部分为所有数据表中属性,值为1或0,1表示某数据单元包含该属性,0表示不包含;后一部分为数据表中数据出现的词,值为1或0,1表示某数据单元数据中出现了该词,0表示未出现;
聚类单元,用于依据特征向量聚类并确定最佳分类数;主要采用Jaccard距离来衡量样本间的距离,各类的距离采用类间样本平均距离;
学习单元,用于学习主题分类器,利用卷积神经网络CNN训练分类器。
进一步的,所述安全向量模块包括:
敏感得分单元,用于计算各数据单元的敏感得分;
主题特征值单元,用于计算各数据单元的主题特征值;
数据量单元,用于计算各数据单元的数据量倒数;
矩阵单元,用于将上述3个数值作为各数据单元的特征数据,构成特征矩阵,用于后续聚类设定安全级别。
进一步的,所述识别模块包括:
主题单元,用于为新数据单元构建主题相关特征向量,将该向量输入到主题分类器中,得到其主题;
安全单元,用于构造出安全相关特征向量,并将该向量各维乘以其对应的安全权重得到向量v;
分类单元,用于将向量v输入步骤4形成的安全级别分类器中,得到其安全级别。
本发明提出的一种数据安全级别的识别检测方法及装置,与现有技术相比,有益效果为:
本发明创新性的构筑了能够表示普通数据库中存储的数据单元主题属性和安全属性的特征向量,并且先后运用了两次高效的层次聚类算法来解决主题划分和安全等级划分的问题,最终能够通过之前的划分来识别检测新数据单元的主题及安全级别。
附图说明
图1是识别检测数据安全分级方法整体过程说明图;
图2是检测新数据单元的安全级别过程说明图。
具体实施方式
下面结合附图及具体实施例对本发明做进一步说明。
本发明提供的识别检测数据安全分级方法包含以下步骤,总体处理流程如图1所示:
步骤1、构建敏感数据字典;
步骤2、为每个数据单元构建主题相关特征向量,并对大数据平台的数据单元进行聚类,得到主题分类;
步骤3、计算个数据单元敏感得分并为每个数据单元构建安全相关属性特征向量;
步骤4、依据安全相关特征向量对大数据平台数据单元进行聚类并设定安全级别;
步骤5、识别检测新数据单元的安全级别;
本发明的具体设计实现如下:
1.构建敏感数据字典
敏感数据字典将与安全相关的敏感词及其安全权重记录汇集起来。数据库中,很多属性记录了敏感信息,比如姓名,性别,账号,密码等。而这些属性的安全权重不同,安全权重越高,表示该数据越应该被保护起来,比如性别的权重会低于账号和密码。而权重的赋值可根据需求变化,所有敏感词的权重大于0。一条记录的格式为:“敏感词-权重”,比如“密码-3”。敏感数据字典尽可能全面的将数据表中出现的安全相关属性记录下来。
敏感数据字典的组织形式是根据敏感词的长度区分存储。即词长为1的词记录在一个单独的位置,词长为2的词记录在另一个位置,以此类推。这样存储的好处是识别一个数据表中属性是否为敏感词时,先确定词的长度L,然后直接根据长度定位到第一个长度为L 的词的存储位置,然后遍历,提高了了查词的效率。
2.获取主题分类
主要依靠聚类算法来实现主题分类,包含以下过程。
1)构建主题属性相关特征。
一个主题属性相关特征由两部分组成,前一部分为所有数据表中属性,值为1或0,1 表示某数据单元包含该属性,0表示不包含。后一部分为数据表中数据出现的词,值为1或0,1表示某数据单元数据中出现了该词,0表示未出现。那么l个数据单元,m个属性和n 个词所构成的数据结构举例如下,每个数据单元共m+n个特征:
2)依据特征向量聚类并确定最佳分类数。
每个数据单元的特征不是数值属性,而是分类属性。因此采用Jaccard距离来衡量样本间的距离,各类的距离采用类间样本平均距离。层次聚类的步骤是:首先每个样本作为一个类,然后重复的将两个距离最近的类合并成一个类。每次合并后重新计算类间距离和组内平方误差和(WSS)。最终完成层次聚类。
根据每次合并后计算的组内平方误差和,绘制出拐点图。该图横坐标为类别数目,纵坐标为组内平方误差和。随着聚类数目增多,每个类别中数量越来越少,距离越来越近,因此WSS会随聚类增多增多而减少。关注拐点图斜率变化,当WWS减少的很缓慢时,认为进一步增大聚类数效果不能增强。出现从WWS下降剧烈到下降缓慢的“肘点”时,为最佳分类数k。此时便可以根据各类别的特征来设定主题,比如“经济相关”,“人员信息相关”,“电影信息相关”等主题。
3)学习主题分类器
利用聚类结果,每个样本都有一个主题标记。那么现在数据单元特征为m+n+1个。那么l个数据单元构成了l×(m+n+1)的特征矩阵。利用卷积神经网络(CNN)训练分类器,以该矩阵作为输入。识别新数据单元的主题时,先构造其主题相关特征向量,然后输入训练好的分类器,输出为其主题标志。
3.构建安全相关特征向量
一个数据单元包括三个安全相关属性,为敏感得分a1,主题a2和数据量倒数a3,下面分别说明。
敏感得分能够衡量一个数据单元所含敏感数据的总安全程度。设a1l为第l个数据单元的敏感得分,计算a1l首先要将该数据表中的各属性与敏感字典中的敏感词相匹配,匹配过程是:对于数据表l,首先初始化安全权重w1l=0,取其第一个属性词,根据该词词长选择要查询的特性词长的敏感字典,然后遍历该字典,若找到改词,则说明该词为敏感词,那么w1l=w1l+w,其中w为该敏感词的安全权重;若该词不在敏感字典中,则其不是一个敏感词,保持w1l不变,之后依次匹配该数据单元的剩余属性,每次匹配成功,w1l就加上该词对应的安全权重,最终得到该敏感字典总的安全权重w1l。敏感得分a1l的计算如下:
a1l=w1l/w1max,0<l≤L
其中w1max为所有数据单元中安全权重的最大值。显然a1l满足0<a1l≤1。
根据第三步的聚类结果,共k个主题,为每个主题设定安全权重,权重大于0,比如电影相关主题权重为1,那么人员信息相关主题权重为3,国家安全信息相关权重为5。设w2l为第l个数据单元的主题权重,那么其主题特征值a2l为:
a2l=w2l/w2max,0<l≤L
其中w2max为所有k个主题安全权重的最大值。显然a2l满足0<a2l≤1。
设第l个数据单元所存储的字数为nl,那么该数据单元所含的数据量dl为:
dl=nl/nmin,0<l≤L
其中nmin为所有数据单元中所含字数的最小值。显然a1l满足a1l≥1。dl越大,则该数据单元所含数据量越多。当一个数据单元在总数据量不高却有很高的敏感的分时,我们认为它的安全级别会更高,因此需要数据量倒数a3这一特征。第l个数据单元的数据量倒数a3l为:
a31=1/dl=nminnl,0<l≤L
显然a3l满足0<a3l≤1。
那么l个数据单元构成了l×3的特征矩阵,用于后续聚类设定安全级别。
4.设定安全级别
采用层次聚类法对l个数据单元进行聚类分析。由于数据单元的3个安全相关特征对于安全级别的影响不同,因此需要为这3个特征设定安全权重,设a1安全权重为s1,a2安全权重为s2,a3安全权重为s3。由于a1,a2,a3均为数值属性,因此直接将特征值和权重相乘是有意义的,最后输入聚类算法的特征矩阵为:
最初把每个数据单元看做一个点,采用欧氏距离。类间距离采用类的重心之间的距离,类的重心为该类各变量平均。每次合并后重新计算类间距离和组内平方误差和。最终完成层次聚类。同样利用绘制拐点图的方法选取最佳分类数。根据各类别特征设定安全分级,安全级别越高,说明数据单元的所需的安全保护级别越高。
5.识别检测新数据单元的安全级别
如图2,识别检测新数据单元的安全级别流程如下:首先为新数据单元构建主题相关特征向量,将该向量输入到主题分类器中,得到其主题。之后构造出安全相关特征向量,并将该项量各维乘以其对应的安全权重得到向量v=(a1×s1,a2×s2,a3×s3),将v输入安全级别分类器中,得到其安全级别。
安全级别分类器运作过程如下:根据步骤4的结果,类间距离采用类的重心之间的距离,那么每个类都维护着一个重心属性。设p个类的重心分别为c1=(x1,y1,z1),c2=(x2,y2, z2),…,cp=(xp,yp,zp)。那么即可计算出新向量v和各重心的距离,判断新数据单元属于哪个安全级别即看该数据单元到那个类的重心距离最小。判断完成后,将该新数据单元加入到该类中并重新计算该类的重心。新重心的计算公式为:
cnew=cn+v/n+1
其中n为跟新前该类的样本数量。
以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种数据安全级别的识别检测方法,其特征在于,包括:
步骤1、构建敏感数据字典;
步骤2、为每个数据单元构建主题相关特征向量,并对大数据平台的数据单元进行聚类,得到主题分类;
步骤3、计算每个数据单元敏感得分并为每个数据单元构建安全相关特征向量;
步骤4、依据安全相关特征向量对大数据平台数据单元进行聚类并设定安全级别;
步骤5、识别检测新数据单元的安全级别。
2.根据权利要求1所述的一种数据安全级别的识别检测方法,其特征在于,步骤1所述构建敏感数据字典的方法为:
步骤101、将与安全相关的敏感词及其安全权重记录汇集起来;
步骤102、根据敏感词的长度区分存储。
3.根据权利要求1所述的一种数据安全级别的识别检测方法,其特征在于,步骤2所述得到主题分类的具体方法为:
步骤201、构建主题属性相关特征,包括两部分,前一部分为所有数据表中属性,值为1或0,1表示某数据单元包含该属性,0表示不包含;后一部分为数据表中数据出现的词,值为1或0,1表示某数据单元数据中出现了该词,0表示未出现;
步骤202、依据特征向量聚类并确定最佳分类数;主要采用Jaccard距离来衡量样本间的距离,各类的距离采用类间样本平均距离;
步骤203、学习主题分类器,利用卷积神经网络CNN训练分类器。
4.根据权利要求1所述的一种数据安全级别的识别检测方法,其特征在于,步骤3所述构建安全相关特征向量的方法为:
步骤301、计算各数据单元的敏感得分;
步骤302、计算各数据单元的主题特征值;
步骤303、计算各数据单元的数据量倒数;
步骤304、上述3个数值作为各数据单元的特征数据,构成特征矩阵,用于后续聚类设定安全级别。
5.根据权利要求1所述的一种数据安全级别的识别检测方法,其特征在于,步骤5所述识别检测新数据单元的安全级别的具体步骤为:
步骤501、为新数据单元构建主题相关特征向量,将该向量输入到主题分类器中,得到其主题;
步骤502、构造出安全相关特征向量,并将该向量各维乘以其对应的安全权重得到向量v;
步骤503、将向量v输入步骤4形成的安全级别分类器中,得到其安全级别。
6.一种数据安全级别的识别检测装置,其特征在于,包括:
字典模块,用于构建敏感数据字典;
主题向量模块,用于为每个数据单元构建主题相关特征向量,并对大数据平台的数据单元进行聚类,得到主题分类;
安全向量模块,用于计算每个数据单元敏感得分并为每个数据单元构建安全相关特征向量;
安全级别模块,用于依据安全相关特征向量对大数据平台数据单元进行聚类并设定安全级别;
识别模块,用于识别检测新数据单元的安全级别。
7.根据权利要求6所述的一种数据安全级别的识别检测装置,其特征在于,所述字典模块包括:
汇集单元,用于将与安全相关的敏感词及其安全权重记录汇集起来;
存储单元,用于根据敏感词的长度区分存储。
8.根据权利要求6所述的一种数据安全级别的识别检测装置,其特征在于,主题向量模块包括:
主题特征单元,用于构建主题属性相关特征,包括两部分,前一部分为所有数据表中属性,值为1或0,1表示某数据单元包含该属性,0表示不包含;后一部分为数据表中数据出现的词,值为1或0,1表示某数据单元数据中出现了该词,0表示未出现;
聚类单元,用于依据特征向量聚类并确定最佳分类数;主要采用Jaccard距离来衡量样本间的距离,各类的距离采用类间样本平均距离;
学习单元,用于学习主题分类器,利用卷积神经网络CNN训练分类器。
9.根据权利要求6所述的一种数据安全级别的识别检测装置,其特征在于,所述安全向量模块包括:
敏感得分单元,用于计算各数据单元的敏感得分;
主题特征值单元,用于计算各数据单元的主题特征值;
数据量单元,用于计算各数据单元的数据量倒数;
矩阵单元,用于将上述3个数值作为各数据单元的特征数据,构成特征矩阵,用于后续聚类设定安全级别。
10.根据权利要求6所述的一种数据安全级别的识别检测装置,其特征在于,所述识别模块包括:
主题单元,用于为新数据单元构建主题相关特征向量,将该向量输入到主题分类器中,得到其主题;
安全单元,用于构造出安全相关特征向量,并将该向量各维乘以其对应的安全权重得到向量v;
分类单元,用于将向量v输入步骤4形成的安全级别分类器中,得到其安全级别。
CN201711473686.6A 2017-12-29 2017-12-29 一种数据安全级别的识别检测方法及装置 Active CN108363717B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711473686.6A CN108363717B (zh) 2017-12-29 2017-12-29 一种数据安全级别的识别检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711473686.6A CN108363717B (zh) 2017-12-29 2017-12-29 一种数据安全级别的识别检测方法及装置

Publications (2)

Publication Number Publication Date
CN108363717A true CN108363717A (zh) 2018-08-03
CN108363717B CN108363717B (zh) 2021-03-12

Family

ID=63010320

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711473686.6A Active CN108363717B (zh) 2017-12-29 2017-12-29 一种数据安全级别的识别检测方法及装置

Country Status (1)

Country Link
CN (1) CN108363717B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111797429A (zh) * 2020-06-29 2020-10-20 平安普惠企业管理有限公司 安全和隐私级别的维护方法、装置、电子设备及存储介质
CN111814903A (zh) * 2020-07-21 2020-10-23 上海数鸣人工智能科技有限公司 一种基于dpi聚类分析用户对营销活动敏感度的方法
CN112925914A (zh) * 2021-03-31 2021-06-08 携程旅游网络技术(上海)有限公司 数据安全分级方法、系统、设备及存储介质
CN115396238A (zh) * 2022-10-28 2022-11-25 中孚信息股份有限公司 一种基于大数据安全评估分析系统及方法
US11797576B2 (en) * 2021-08-24 2023-10-24 International Business Machines Corporation Sensitivity-based database processing and distributed storage
CN117094033A (zh) * 2023-10-19 2023-11-21 南京怡晟安全技术研究院有限公司 基于关键数据敏感度的安全销毁评估系统和方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102426599A (zh) * 2011-11-09 2012-04-25 中国人民解放军信息工程大学 基于d-s证据理论的敏感信息检测方法
US20140283089A1 (en) * 2013-03-14 2014-09-18 Cellco Partnership (D/B/A Verizon Wireless) Sensitive personal information data protection
CN105471823A (zh) * 2014-09-03 2016-04-06 阿里巴巴集团控股有限公司 一种敏感信息处理方法、装置、服务器及安全判定系统
CN106485286A (zh) * 2016-10-29 2017-03-08 华东理工大学 一种基于局部敏感判别的矩阵分类模型
CN106897459A (zh) * 2016-12-14 2017-06-27 中国电子科技集团公司第三十研究所 一种基于半监督学习的文本敏感信息识别方法
CN106909534A (zh) * 2015-12-23 2017-06-30 中国移动通信集团公司 一种判别文本安全性的方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102426599A (zh) * 2011-11-09 2012-04-25 中国人民解放军信息工程大学 基于d-s证据理论的敏感信息检测方法
US20140283089A1 (en) * 2013-03-14 2014-09-18 Cellco Partnership (D/B/A Verizon Wireless) Sensitive personal information data protection
CN105471823A (zh) * 2014-09-03 2016-04-06 阿里巴巴集团控股有限公司 一种敏感信息处理方法、装置、服务器及安全判定系统
CN106909534A (zh) * 2015-12-23 2017-06-30 中国移动通信集团公司 一种判别文本安全性的方法及装置
CN106485286A (zh) * 2016-10-29 2017-03-08 华东理工大学 一种基于局部敏感判别的矩阵分类模型
CN106897459A (zh) * 2016-12-14 2017-06-27 中国电子科技集团公司第三十研究所 一种基于半监督学习的文本敏感信息识别方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111797429A (zh) * 2020-06-29 2020-10-20 平安普惠企业管理有限公司 安全和隐私级别的维护方法、装置、电子设备及存储介质
CN111797429B (zh) * 2020-06-29 2023-08-18 北京新时科技发展有限公司 安全和隐私级别的维护方法、装置、电子设备及存储介质
CN111814903A (zh) * 2020-07-21 2020-10-23 上海数鸣人工智能科技有限公司 一种基于dpi聚类分析用户对营销活动敏感度的方法
CN111814903B (zh) * 2020-07-21 2022-04-01 上海数鸣人工智能科技有限公司 一种基于dpi聚类分析用户对营销活动敏感度的方法
CN112925914A (zh) * 2021-03-31 2021-06-08 携程旅游网络技术(上海)有限公司 数据安全分级方法、系统、设备及存储介质
CN112925914B (zh) * 2021-03-31 2024-03-15 携程旅游网络技术(上海)有限公司 数据安全分级方法、系统、设备及存储介质
US11797576B2 (en) * 2021-08-24 2023-10-24 International Business Machines Corporation Sensitivity-based database processing and distributed storage
CN115396238A (zh) * 2022-10-28 2022-11-25 中孚信息股份有限公司 一种基于大数据安全评估分析系统及方法
CN117094033A (zh) * 2023-10-19 2023-11-21 南京怡晟安全技术研究院有限公司 基于关键数据敏感度的安全销毁评估系统和方法
CN117094033B (zh) * 2023-10-19 2024-01-09 南京怡晟安全技术研究院有限公司 基于关键数据敏感度的安全销毁评估系统和方法

Also Published As

Publication number Publication date
CN108363717B (zh) 2021-03-12

Similar Documents

Publication Publication Date Title
CN108363717A (zh) 一种数据安全级别的识别检测方法及装置
CN102567464B (zh) 基于扩展主题图的知识资源组织方法
CN108848068A (zh) 基于深度信念网络-支持向量数据描述的apt攻击检测方法
CN103500175B (zh) 一种基于情感分析在线检测微博热点事件的方法
CN104408095B (zh) 一种基于改进的knn文本分类方法
CN106530078A (zh) 基于跨行业数据的贷款风险预警方法及系统
CN104216876B (zh) 信息文本过滤方法及系统
CN109471944A (zh) 文本分类模型的训练方法、装置及可读存储介质
CN108717408A (zh) 一种敏感词实时监控方法、电子设备、存储介质及系统
CN104408153A (zh) 一种基于多粒度主题模型的短文本哈希学习方法
CN107766585A (zh) 一种面向社交网络的特定事件抽取方法
Lee Unsupervised and supervised learning to evaluate event relatedness based on content mining from social-media streams
CN106447490A (zh) 一种基于用户画像的征信应用方法
CN110675269B (zh) 文本审核方法以及装置
CN109102157A (zh) 一种基于深度学习的银行工单派单方法及系统
CN109918674B (zh) 一种基于案件要素相似性建模的案件串并方法
CN107944485A (zh) 基于聚类群组发现的推荐系统及方法、个性化推荐系统
CN108228622A (zh) 业务问题的分类方法及装置
CN109740642A (zh) 发票类别识别方法、装置、电子设备及可读存储介质
CN112800225B (zh) 一种微博评论情绪分类方法和系统
CN109168051A (zh) 一种基于蓝光存储的网络直播平台监管取证系统
CN110232158A (zh) 基于多模态数据的突发公共安全事件检测方法
CN110019820A (zh) 一种病历中主诉与现病史症状时间一致性检测方法
CN109086794A (zh) 一种基于t-lda主题模型的驾驶行为模式识方法
CN108280357A (zh) 基于语义特征提取的数据防泄漏方法、系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20180803

Assignee: Zhongguancun Technology Leasing Co.,Ltd.

Assignor: TIANJIN NANKAI UNIVERSITY GENERAL DATA TECHNOLOGIES Co.,Ltd.

Contract record no.: X2023980031710

Denomination of invention: A method and device for identifying and detecting data security level

Granted publication date: 20210312

License type: Exclusive License

Record date: 20230202

EE01 Entry into force of recordation of patent licensing contract
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A method and device for identifying and detecting data security level

Effective date of registration: 20230207

Granted publication date: 20210312

Pledgee: Zhongguancun Technology Leasing Co.,Ltd.

Pledgor: TIANJIN NANKAI UNIVERSITY GENERAL DATA TECHNOLOGIES Co.,Ltd.

Registration number: Y2023110000054

PE01 Entry into force of the registration of the contract for pledge of patent right
EC01 Cancellation of recordation of patent licensing contract

Assignee: Zhongguancun Technology Leasing Co.,Ltd.

Assignor: TIANJIN NANKAI UNIVERSITY GENERAL DATA TECHNOLOGIES Co.,Ltd.

Contract record no.: X2023980031710

Date of cancellation: 20240511

EC01 Cancellation of recordation of patent licensing contract
PC01 Cancellation of the registration of the contract for pledge of patent right

Granted publication date: 20210312

Pledgee: Zhongguancun Technology Leasing Co.,Ltd.

Pledgor: TIANJIN NANKAI UNIVERSITY GENERAL DATA TECHNOLOGIES Co.,Ltd.

Registration number: Y2023110000054

PC01 Cancellation of the registration of the contract for pledge of patent right