CN113591150B - 一种针对敏感数据的脱敏处理方法 - Google Patents

一种针对敏感数据的脱敏处理方法 Download PDF

Info

Publication number
CN113591150B
CN113591150B CN202110886512.2A CN202110886512A CN113591150B CN 113591150 B CN113591150 B CN 113591150B CN 202110886512 A CN202110886512 A CN 202110886512A CN 113591150 B CN113591150 B CN 113591150B
Authority
CN
China
Prior art keywords
words
value
file
word
sensitive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110886512.2A
Other languages
English (en)
Other versions
CN113591150A (zh
Inventor
温积群
王绍荃
钟尚染
杨迁
项胜乙
虞冠鹤
何涨云
孙浩迈
叶青旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wenzhou Science And Technology Branch Of Zhejiang Tusheng Transmission And Transfer Engineering Co ltd
Original Assignee
Wenzhou Science And Technology Branch Of Zhejiang Tusheng Transmission And Transfer Engineering Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wenzhou Science And Technology Branch Of Zhejiang Tusheng Transmission And Transfer Engineering Co ltd filed Critical Wenzhou Science And Technology Branch Of Zhejiang Tusheng Transmission And Transfer Engineering Co ltd
Priority to CN202110886512.2A priority Critical patent/CN113591150B/zh
Publication of CN113591150A publication Critical patent/CN113591150A/zh
Application granted granted Critical
Publication of CN113591150B publication Critical patent/CN113591150B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • G06F21/6254Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Bioethics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明公开了一种针对敏感数据的脱敏处理方法,首先借助设置敏感字库,敏感字库组成包括数据积累词、设定词和关联词组;此处的数据积累词通过对用户的敏感文件进行分析得到;之后针对用户上传文件时,进行的敏感判定,得到其是否属于敏感文件;此处借助敏感字库内的数据积累词、设定词和关联词组进行联动判定,更加准确,也具备自主判定的智能性;之后对得到的敏感文件进行权限设定,具体权限为仅限本人及其直属领导查看;对敏感文件进行脱敏处理,具体通过数据相关属性来对数据进行脱敏处理,对数据合理隐藏;在用户访问时,自动对用户身份进行验证,并根据用户身份查阅敏感文件;本发明简单有效,且易于实用。

Description

一种针对敏感数据的脱敏处理方法
技术领域
本发明属于数据脱敏领域,涉及数据权限设定技术,具体是一种针对敏感数据的脱敏处理方法。
背景技术
公开号为CN108512807A的专利公开了一种数据传输中的数据脱敏方法及数据脱敏服务器,其中的方法提通过判断用户终端发送的包含敏感数据的数据传输请求的类型,若确认数据传输请求的类型为数据下载请求,且数据下载请求对应的待下载数据总量大于或等于第一阈值,则对数据下载请求中的数据库查询指令进行数据脱敏处理;以及根据经数据脱敏处理后的数据库查询指令在目标数据库中获取对应的待下载数据,并将待下载数据发送至对应的用户终端。本发明针对用户访问敏感数据的数量采用不同的脱敏方法,提高了数据处理的速度,不仅解决了敏感数据的可逆性问题,而且解决了大量敏感数据处理时系统性能耗损问题,有效的保障了大数据中敏感数据的安全性、完整性和可用性。
但是,针对数据脱敏来说,其对数据敏感程度的判定方式,用户的权限是否允许,对数据进行具体脱敏处理的方式都有所欠缺,或者未有涉及,基于此,现提供一种解决方案。
发明内容
本发明的目的在于提供一种针对敏感数据的脱敏处理方法。
本发明的目的可以通过以下技术方案实现:
一种针对敏感数据的脱敏处理方法,该方法借助下述步骤实现:
步骤一:设置敏感字库,敏感字库组成包括数据积累词、设定词和关联词组;设定词为管理人员预先设定的词语;
步骤二:针对用户上传文件时,进行的敏感判定,得到其是否属于敏感文件;
步骤三:对得到的敏感文件进行权限设定,具体权限为仅限本人及其直属领导查看;
步骤四:对敏感文件进行脱敏处理,具体处理步骤为:
S01:获取到敏感文件中的所有的数据积累词、设定词,将其标记为更换词语;
S02:将所有的更换词语按照在敏感文件中的出现顺序进行排列;
S03:获取到敏感文件上传的时间戳,以月日时分的形式获取,得到八位数字构成的上传时值组,将其标记为Tj,j=1...8;
S04:之后对Tj进行特征值Zt计算,具体计算公式为:
式中,QG{*}指代为对括号内数值,取其个位上的数值;
S05:之后根据得到的特征值Zt,当其为奇数时,将更换词语从第Zt个开始,依次往后移一个位置,取代原来的更换词语,代入原本位置;
否则,将更换词语从第Zt个开始,依次往前移一个位置,取代原来的更换词语,代入原本位置;
S06:得到新的敏感文件标记为脱敏文件;并将时间戳传输至对应有文件阅读权限的用户的个人设备;
步骤五:用户访问时,自动对用户身份进行验证,并根据用户身份查阅敏感文件;
步骤六:完成脱敏处理。
进一步地,步骤一中的数据积累词借助下述方式进行获取:
S1:获取到所有的机密文件,任选一机密文件;
S2:获取得到机密文件,对其进行分词处理,得到若干个组成分词;从组成分词里面删除常用词汇,常用词汇为用户预设词语,具体举例为:你好、比如、大概等常用无实际意义的词汇;将剩余的组成分词标记为目标分词;
S3:获取到所有的目标分词,并自动获取到所有的目标分词出现次数,将其标记为纵向次数;将目标分词标记为M i,i=1...n;对应的纵向次数标记为Z i,i=1...n;
S4:之后选择下一机密文件,重复步骤S2-S3,得到对应本次机密文件的目标分词和对应的纵向次数;进行目标分词合并操作,得到目标分词M i及其对应的纵向次数Z i和横向次数H i,i=1...m;
S5:重复步骤S4,直到对所有的机密文件处理完毕,得到所有的目标分词及其对应的纵向次数和横向次数,三者依次标记为M i、Z i和H i,i=1...k,k≥m;
S6:之后对目标分词进行核次值计算,具体计算公式为:
Q i=0.347*Z i+0.653*H i;
式中,0.347和0.653均为预设的权值,用于体现不同因素对最终结果的不同影响;
S7:得到所有目标分词M i对应的核次值Qi;
S8:将Q i大于X1的目标分词,去除设定词之后,剩余的全部标记为数据积累词;
S9:当任意三项以上的数据积累词同时出现在同一篇机密文件中的次数超过X2次时,将对应的数据积累词标记为关联词组;X1和X2均为预设数值。
进一步地,步骤S4中的对目标分词合并操作具体为:
S401:将其与前面得到的所有目标分词Mi进行合并,将一致的目标分词的纵向次数相加,更新目标分词,将其标记为M i,i=1...m,对应的纵向次数为Z i,i=1...m;m≥n;
S402:之后将本项机密文件内出现的与上一项机密文件内相同的目标分词,定义一个横向次数,并将横向次数的值自动加一,横向次数的值初始为零,将横向次数标记为Hi,i=1...m;且Hi、Z i和M i一一对应。
进一步地,步骤二中的敏感判定具体步骤为:
SS1:将用户的上传文件标记为待测文件;
SS2:对待测文件进行分词处理,对得到的分词删除常用词汇,之后将得到的分词标记为单构分词;
SS3:获取得到所有单构分词的次数,将该次数除以单构分词的总个数,得到的值标记为占用配比;
SS4:将占用配比超过X3的单构分词标记为占用分词,X3为预设数值,具体根据多次实验数据设置;
SS5:将占用分词与数据积累词、设定词、关联词组进行比较,
当占用分词中存在数据积累词或设定词,将其个数除以占用分词的总个数,当得到的值超过X4时,将占用分词所在的待测文件标记为敏感文件;X4为预设数值;
当占用分词中出现任意一组关联词组时,自动将其标记为敏感文件。
进一步地,步骤五中的对用户身份进行验证的具体验证方式为:
SS01:当用户登陆时,对其身份密钥录入过程进行监控;具体监控方式为获取到用户录入密钥时候的录入时间,录入时间指代为用户录入第一个字符到最后一个字符的时间;
SS02:根据用户的习惯获取到惯性时段;
SS03:将录入时间与惯性时段进行比较,得到偏离值;
当录入时间位于惯性时段时,偏离值为零;
否则,自动将录入时间减去惯性时段的两个端值之后去绝对值,将绝对值小的数值标记为偏离值;
SS04:同时监控用户录入密钥的错误次数,错误次数指代当用户出现删除字符重新录入的时候,每删除一次字符并重新录入一次,自动将错误次数的值加一;
SS05:获取到用户上一次登陆的时间距今的时间差,将该差值标记为疏远值;
SS06:根据公式计算危险值W,具体计算公式为:
危险值=0.2疏远值+0.443*错误次数+0.357*偏离值;
当危险值超过X7时,产生拒绝信号,否则允许用户登陆;X7为预设数值;
SS07:验证通过后若对应身份权限允许读取敏感文件,则会按照步骤四中的脱敏处理的反向原理对脱敏文件进行敏感解除,将其恢复为敏感文件;否则不允许读取敏感文件。
进一步地,步骤SS02中惯性时段获取方式为:
SS022:获取到用户近三十次的录入时间,将其标记为Lj,j=1...30;
SS023:之后求取录入时间的均值标记为P;
SS024:借助公式计算离差值Lc,具体计算公式为:
SS025:之后令j=1,去除对应的录入时间L1之后,重复步骤SS023-SS024的处理过程,得到新的离差值,当新得到的离差值与Lc的差值的绝对值大于X6时,将数据L1剔除,否则不做处理;X6为预设数值;
SS026:之后令j值自动加一,重复步骤SS025-SS026,直到对所有的Lj值处理完毕;将剩余的录入时间的最小值到最大值标记为惯性时段。
本发明的有益效果:
本发明首先借助设置敏感字库,敏感字库组成包括数据积累词、设定词和关联词组;此处的数据积累词通过对用户的敏感文件进行分析得到;之后针对用户上传文件时,进行的敏感判定,得到其是否属于敏感文件;此处借助敏感字库内的数据积累词、设定词和关联词组进行联动判定,更加准确,也具备自主判定的智能性;
之后对得到的敏感文件进行权限设定,具体权限为仅限本人及其直属领导查看;对敏感文件进行脱敏处理,具体通过数据相关属性来对数据进行脱敏处理,对数据合理隐藏;在用户访问时,自动对用户身份进行验证,并根据用户身份查阅敏感文件;本发明简单有效,且易于实用。
具体实施方式
一种针对敏感数据的脱敏处理方法,该方法具体包括下述步骤:
步骤一:设置敏感字库,敏感字库组成包括数据积累词、设定词和关联词组;设定词为管理人员预先设定的词语;
数据积累词借助下述方式进行获取:
S1:获取到所有的机密文件,任选一机密文件;
S2:获取得到机密文件,对其进行分词处理,得到若干个组成分词;从组成分词里面删除常用词汇,常用词汇为用户预设词语,具体举例为:你好、比如、大概等常用无实际意义的词汇;将剩余的组成分词标记为目标分词;
S3:获取到所有的目标分词,并自动获取到所有的目标分词出现次数,将其标记为纵向次数;将目标分词标记为M i,i=1...n;对应的纵向次数标记为Z i,i=1...n;
S4:之后选择下一机密文件,重复步骤S2-S3,得到对应本次机密文件的目标分词和对应的纵向次数;进行目标分词合并操作,具体为:
S401:将其与前面得到的所有目标分词M i进行合并,将一致的目标分词的纵向次数相加,更新目标分词,将其标记为M i,i=1...m,对应的纵向次数为Z i,i=1...m;m≥n;
S402:之后将本项机密文件内出现的与上一项机密文件内相同的目标分词,定义一个横向次数,并将横向次数的值自动加一,横向次数的值初始为零,将横向次数标记为Hi,i=1...m;且H i、Z i和M i一一对应;
S5:重复步骤S4,直到对所有的机密文件处理完毕,得到所有的目标分词及其对应的纵向次数和横向次数,三者依次标记为M i、Z i和H i,i=1...k,k≥m;
S6:之后对目标分词进行核次值计算,具体计算公式为:
Q i=0.347*Z i+0.653*H i;
式中,0.347和0.653均为预设的权值,用于体现不同因素对最终结果的不同影响;
S7:得到所有目标分词M i对应的核次值Qi;
S8:将Q i大于X1的目标分词,去除设定词之后,剩余的全部标记为数据积累词;
S9:当任意三项以上的数据积累词同时出现在同一篇机密文件中的次数超过X2次时,将对应的数据积累词标记为关联词组;X1和X2均为预设数值;
步骤二:针对用户上传文件时,进行的敏感判定,得到其是否属于敏感文件,敏感判定具体步骤为:
SS1:将用户的上传文件标记为待测文件;
SS2:对待测文件进行分词处理,对得到的分词删除常用词汇,之后将得到的分词标记为单构分词;
SS3:获取得到所有单构分词的次数,将该次数除以单构分词的总个数,得到的值标记为占用配比;
SS4:将占用配比超过X3的单构分词标记为占用分词,X3为预设数值,具体根据多次实验数据设置;
SS5:将占用分词与数据积累词、设定词、关联词组进行比较,
当占用分词中存在数据积累词或设定词,将其个数除以占用分词的总个数,当得到的值超过X4时,将占用分词所在的待测文件标记为敏感文件;X4为预设数值;
当占用分词中出现任意一组关联词组时,自动将其标记为敏感文件;
步骤三:对得到的敏感文件进行权限设定,具体权限为仅限本人及其直属领导查看,同时管理人员、上传人员均可自定义修改敏感文件的权限;
步骤四:对敏感文件进行脱敏处理,具体处理步骤为:
S01:获取到敏感文件中的所有的数据积累词、设定词,将其标记为更换词语;
S02:将所有的更换词语按照在敏感文件中的出现顺序进行排列;
S03:获取到敏感文件上传的时间戳,以月日时分的形式获取,得到八位数字构成的上传时值组,将其标记为Tj,j=1...8;
S04:之后对Tj进行特征值Zt计算,具体计算公式为:
式中,QG{*}指代为对括号内数值,取其个位上的数值;
S05:之后根据得到的特征值Zt,当其为奇数时,将更换词语从第Zt个开始,依次往后移一个位置,取代原来的更换词语,代入原本位置;
否则,将更换词语从第Zt个开始,依次往前移一个位置,取代原来的更换词语,代入原本位置;
S06:得到新的敏感文件标记为脱敏文件;并将时间戳传输至对应有文件阅读权限的用户的个人设备;
步骤五:用户访问时,自动对用户身份进行验证,具体验证方式为:
SS01:当用户登陆时,对其身份密钥录入过程进行监控;具体监控方式为获取到用户录入密钥时候的录入时间,录入时间指代为用户录入第一个字符到最后一个字符的时间;
SS02:根据用户的习惯获取到惯性时段;
SS021:惯性时段获取方式为:
SS022:获取到用户近三十次的录入时间,将其标记为Lj,j=1...30;
SS023:之后求取录入时间的均值标记为P;
SS024:借助公式计算离差值Lc,具体计算公式为:
SS025:之后令j=1,去除对应的录入时间L1之后,重复步骤SS023-SS024的处理过程,得到新的离差值,当新得到的离差值与Lc的差值的绝对值大于X6时,将数据L1剔除,否则不做处理;X6为预设数值;
SS026:之后令j值自动加一,重复步骤SS025-SS026,直到对所有的Lj值处理完毕;将剩余的录入时间的最小值到最大值标记为惯性时段;
SS03:将录入时间与惯性时段进行比较,得到偏离值;
当录入时间位于惯性时段时,偏离值为零;
否则,自动将录入时间减去惯性时段的两个端值之后去绝对值,将绝对值小的数值标记为偏离值;
SS04:同时监控用户录入密钥的错误次数,错误次数指代当用户出现删除字符重新录入的时候,每删除一次字符并重新录入一次,自动将错误次数的值加一;
SS05:获取到用户上一次登陆的时间距今的时间差,将该差值标记为疏远值;
SS06:根据公式计算危险值W,具体计算公式为:
危险值=0.2疏远值+0.443*错误次数+0.357*偏离值;
当危险值超过X7时,产生拒绝信号,否则允许用户登陆;X7为预设数值;
SS07:验证通过后若对应身份权限允许读取敏感文件,则会按照步骤四中的脱敏处理的反向原理对脱敏文件进行敏感解除,将其恢复为敏感文件;否则不允许读取敏感文件;
步骤六:完成脱敏处理。
一种针对敏感数据的脱敏处理方法,该方法首先借助设置敏感字库,敏感字库组成包括数据积累词、设定词和关联词组;此处的数据积累词通过对用户的敏感文件进行分析得到;之后针对用户上传文件时,进行的敏感判定,得到其是否属于敏感文件;此处借助敏感字库内的数据积累词、设定词和关联词组进行联动判定,更加准确,也具备自主判定的智能性;
之后对得到的敏感文件进行权限设定,具体权限为仅限本人及其直属领导查看;对敏感文件进行脱敏处理,具体通过数据相关属性来对数据进行脱敏处理,对数据合理隐藏;在用户访问时,自动对用户身份进行验证,并根据用户身份查阅敏感文件;本发明简单有效,且易于实用。
以上内容仅仅是对本发明结构所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。

Claims (1)

1.一种针对敏感数据的脱敏处理方法,其特征在于,该方法借助下述步骤实现:
步骤一:设置敏感字库,敏感字库组成包括数据积累词、设定词和关联词组;设定词为管理人员预先设定的词语;
数据积累词借助下述方式进行获取:
步骤S1:获取到所有的机密文件,任选一机密文件;
步骤S2:获取得到机密文件,对其进行分词处理,得到若干个组成分词;从组成分词里面删除常用词汇,常用词汇为用户预设词语;将剩余的组成分词标记为目标分词;
步骤S3:获取到所有的目标分词,并自动获取到所有的目标分词出现次数,将其标记为纵向次数;将目标分词标记为Mi,i=1...n;对应的纵向次数标记为Zi,i=1...n;
步骤S4:之后选择下一机密文件,重复步骤S2-S3,得到对应本次机密文件的目标分词和对应的纵向次数;进行目标分词合并操作,得到目标分词Mi及其对应的纵向次数Zi和横向次数Hi,i=1...m;对目标分词合并操作具体为:
S401:将其与前面得到的所有目标分词Mi进行合并,将一致的目标分词的纵向次数相加,更新目标分词,将其标记为Mi,i=1...m,对应的纵向次数为Zi,i=1...m;m≥n;
S402:之后将本项机密文件内出现的与上一项机密文件内相同的目标分词,定义一个横向次数,并将横向次数的值自动加一,横向次数的值初始为零,将横向次数标记为Hi,i=1...m;且Hi、Zi和Mi一一对应;
步骤S5:重复步骤S4,直到对所有的机密文件处理完毕,得到所有的目标分词及其对应的纵向次数和横向次数,三者依次标记为Mi、Zi和Hi,i=1...k,k≥m;
步骤S6:之后对目标分词进行核次值计算,具体计算公式为:
Qi=0.347*Zi+0.653*Hi;
式中,0.347和0.653均为预设的权值,用于体现不同因素对最终结果的不同影响;
步骤S7:得到所有目标分词Mi对应的核次值Qi;
步骤S8:将Qi大于X1的目标分词,去除设定词之后,剩余的全部标记为数据积累词;
步骤S9:当任意三项以上的数据积累词同时出现在同一篇机密文件中的次数超过X2次时,将对应的数据积累词标记为关联词组;X1和X2均为预设数值;
步骤二:针对用户上传文件时,进行的敏感判定,得到其是否属于敏感文件;敏感判定具体步骤为:
SS1:将用户的上传文件标记为待测文件;
SS2:对待测文件进行分词处理,对得到的分词删除常用词汇,之后将得到的分词标记为单构分词;
SS3:获取得到所有单构分词的次数,将该次数除以单构分词的总个数,得到的值标记为占用配比;
SS4:将占用配比超过X3的单构分词标记为占用分词,X3为预设数值,具体根据多次实验数据设置;
SS5:将占用分词与数据积累词、设定词、关联词组进行比较:
当占用分词中存在数据积累词或设定词,将其个数除以占用分词的总个数,当得到的值超过X4时,将占用分词所在的待测文件标记为敏感文件;X4为预设数值;
当占用分词中出现任意一组关联词组时,自动将其标记为敏感文件;
步骤三:对得到的敏感文件进行权限设定,具体权限为仅限本人及其直属领导查看;
步骤四:对敏感文件进行脱敏处理;对敏感文件进行脱敏处理的具体处理步骤为:
S01:获取到敏感文件中的所有的数据积累词、设定词,将其标记为更换词语;
S02:将所有的更换词语按照在敏感文件中的出现顺序进行排列;
S03:获取到敏感文件上传的时间戳,以月日时分的形式获取,得到八位数字构成的上传时值组,将其标记为Tj,j=1...8;
S04:之后对Tj进行特征值Zt计算,具体计算公式为:
式中,QG{*}指代为对括号内数值,取其个位上的数值;
S05:之后根据得到的特征值Zt,当其为奇数时,将更换词语从第Zt个开始,依次往后移一个位置,取代原来的更换词语,代入原本位置;
否则,将更换词语从第Zt个开始,依次往前移一个位置,取代原来的更换词语,代入原本位置;
S06:得到新的敏感文件标记为脱敏文件;并将时间戳传输至对应有文件阅读权限的用户的个人设备;
步骤五:用户访问时,自动对用户身份进行验证,并根据用户身份查阅敏感文件;对用户身份进行验证的具体验证方式为:
步骤SS01:当用户登陆时,对其身份密钥录入过程进行监控;具体监控方式为获取到用户录入密钥时候的录入时间,录入时间指代为用户录入第一个字符到最后一个字符的时间;
步骤SS02:根据用户的习惯获取到惯性时段,惯性时段获取方式为:
步骤SS022:获取到用户近三十次的录入时间,将其标记为Lj,j=1...30;
步骤SS023:之后求取录入时间的均值标记为P;
步骤SS024:借助公式计算离差值Lc,具体计算公式为:
步骤SS025:之后令j=1,去除对应的录入时间L1之后,重复步骤SS023-SS024的处理过程,得到新的离差值,当新得到的离差值与Lc的差值的绝对值大于X6时,将数据L1剔除,否则不做处理;X6为预设数值;
步骤SS026:之后令j值自动加一,重复步骤SS025-SS026,直到对所有的Lj值处理完毕;将剩余的录入时间的最小值到最大值标记为惯性时段;
步骤SS03:将录入时间与惯性时段进行比较,得到偏离值;
当录入时间位于惯性时段时,偏离值为零;
否则,自动将录入时间减去惯性时段的两个端值之后去绝对值,将绝对值小的数值标记为偏离值;
步骤SS04:同时监控用户录入密钥的错误次数,错误次数指代当用户出现删除字符重新录入的时候,每删除一次字符并重新录入一次,自动将错误次数的值加一;
步骤SS05:获取到用户上一次登陆的时间距今的时间差,将该差值标记为疏远值;
步骤SS06:根据公式计算危险值W,具体计算公式为:
危险值=0.2疏远值+0.443*错误次数+0.357*偏离值;
当危险值超过X7时,产生拒绝信号,否则允许用户登陆;X7为预设数值;
步骤SS07:验证通过后若对应身份权限允许读取敏感文件,则会按照步骤四中的脱敏处理的反向原理对脱敏文件进行敏感解除,将其恢复为敏感文件;否则不允许读取敏感文件;
步骤六:完成脱敏处理。
CN202110886512.2A 2021-08-03 2021-08-03 一种针对敏感数据的脱敏处理方法 Active CN113591150B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110886512.2A CN113591150B (zh) 2021-08-03 2021-08-03 一种针对敏感数据的脱敏处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110886512.2A CN113591150B (zh) 2021-08-03 2021-08-03 一种针对敏感数据的脱敏处理方法

Publications (2)

Publication Number Publication Date
CN113591150A CN113591150A (zh) 2021-11-02
CN113591150B true CN113591150B (zh) 2024-04-26

Family

ID=78254439

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110886512.2A Active CN113591150B (zh) 2021-08-03 2021-08-03 一种针对敏感数据的脱敏处理方法

Country Status (1)

Country Link
CN (1) CN113591150B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107180200A (zh) * 2017-04-20 2017-09-19 北京同余科技有限公司 数据文件可定制化脱敏方法和系统
CN108512807A (zh) * 2017-02-24 2018-09-07 中国移动通信集团公司 一种数据传输中的数据脱敏方法及数据脱敏服务器
CN109410073A (zh) * 2018-09-26 2019-03-01 平安健康保险股份有限公司 影像文件脱敏方法、装置、计算机设备和存储介质
CN109614816A (zh) * 2018-11-19 2019-04-12 平安科技(深圳)有限公司 数据脱敏方法、装置及存储介质
WO2019114766A1 (zh) * 2017-12-14 2019-06-20 中兴通讯股份有限公司 一种数据脱敏方法、服务器、终端及计算机可读存储介质
CN110532797A (zh) * 2019-07-24 2019-12-03 方盈金泰科技(北京)有限公司 大数据的脱敏方法和系统
CN110610070A (zh) * 2019-08-08 2019-12-24 全球能源互联网研究院有限公司 一种用户身份识别方法及装置
CN111159770A (zh) * 2019-12-31 2020-05-15 医渡云(北京)技术有限公司 文本数据脱敏方法、装置、介质及电子设备
CN112001521A (zh) * 2020-06-05 2020-11-27 浙江图盛输变电工程有限公司温州科技分公司 一种基于多峰高斯分布拟合的电动汽车充电需求预测方法
CN112016803A (zh) * 2020-07-23 2020-12-01 浙江图盛输变电工程有限公司温州科技分公司 一种融合作业大数据的跨专业电网风险安全管控系统
CN112580080A (zh) * 2020-12-25 2021-03-30 国家电投集团科学技术研究院有限公司 基于管理策略的数据脱敏系统
CN112749376A (zh) * 2021-03-05 2021-05-04 闪捷信息科技有限公司 一种关系型数据库的动态脱敏方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3021274A1 (en) * 2014-11-11 2016-05-18 Tata Consultancy Services Limited Data privacy management

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108512807A (zh) * 2017-02-24 2018-09-07 中国移动通信集团公司 一种数据传输中的数据脱敏方法及数据脱敏服务器
CN107180200A (zh) * 2017-04-20 2017-09-19 北京同余科技有限公司 数据文件可定制化脱敏方法和系统
WO2019114766A1 (zh) * 2017-12-14 2019-06-20 中兴通讯股份有限公司 一种数据脱敏方法、服务器、终端及计算机可读存储介质
CN109410073A (zh) * 2018-09-26 2019-03-01 平安健康保险股份有限公司 影像文件脱敏方法、装置、计算机设备和存储介质
CN109614816A (zh) * 2018-11-19 2019-04-12 平安科技(深圳)有限公司 数据脱敏方法、装置及存储介质
CN110532797A (zh) * 2019-07-24 2019-12-03 方盈金泰科技(北京)有限公司 大数据的脱敏方法和系统
CN110610070A (zh) * 2019-08-08 2019-12-24 全球能源互联网研究院有限公司 一种用户身份识别方法及装置
CN111159770A (zh) * 2019-12-31 2020-05-15 医渡云(北京)技术有限公司 文本数据脱敏方法、装置、介质及电子设备
CN112001521A (zh) * 2020-06-05 2020-11-27 浙江图盛输变电工程有限公司温州科技分公司 一种基于多峰高斯分布拟合的电动汽车充电需求预测方法
CN112016803A (zh) * 2020-07-23 2020-12-01 浙江图盛输变电工程有限公司温州科技分公司 一种融合作业大数据的跨专业电网风险安全管控系统
CN112580080A (zh) * 2020-12-25 2021-03-30 国家电投集团科学技术研究院有限公司 基于管理策略的数据脱敏系统
CN112749376A (zh) * 2021-03-05 2021-05-04 闪捷信息科技有限公司 一种关系型数据库的动态脱敏方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
"Making IoT Data Ready for Smart City Applications";R. Lee;2020 IEEE International Conference on Big Data and Smart Computing (BigComp);20200420;605-608 *
大数据智能下数据脱敏的思考;王红凯;龚小刚;叶卫;陈超;马新强;姚进强;刘勇;;科技导报;20200213(第03期);115-122 *
电力用户信息脱敏研究;朱克;彭昌余;;电脑知识与技术;20180915(第26期);10-12 *

Also Published As

Publication number Publication date
CN113591150A (zh) 2021-11-02

Similar Documents

Publication Publication Date Title
CN102656553B (zh) 企业级数据管理
CN113129395B (zh) 一种数据压缩加密系统
CN110019640B (zh) 涉密文件检查方法及装置
CN113591150B (zh) 一种针对敏感数据的脱敏处理方法
CN113763217B (zh) 一种基于智慧校园的网络监管方法及系统
CN112073709A (zh) 测试数据的生成方法、装置及电子设备
CN116561813B (zh) 一种应用于档案信息的安全管理系统
CN116611092A (zh) 一种基于多因子的数据脱敏方法及装置、溯源方法及装置
CN115270162B (zh) 基于多方计算的审计审价异构数据在线整合方法及系统
CN109753505B (zh) 在大数据存储系统中创建临时存储单元的方法及系统
CN113010865B (zh) 智慧教育平台的大数据基础组件安全管理方法及系统
CN114265560A (zh) 一种亿级合规指标业务数据的自规范存储系统
CN114237517A (zh) 一种文件分散存储方法及装置
TW201719474A (zh) 對於電腦裝置之動作記錄之解析、翻譯、監查的資訊之輸出以及系統之傾向分析裝置
CN108959486B (zh) 审计字段信息获取方法、装置、计算机设备和存储介质
CN111984966A (zh) 基于Linux云平台的口令检测方法、装置、设备及存储介质
CN113535885B (zh) 基于用户昵称的年龄预测方法、装置及电子设备
CN115001833B (zh) 登录方法及装置
CN112286874B (zh) 一种基于时间的文件管理方法
CN113918526B (zh) 日志处理方法、装置、计算机设备和存储介质
CN115374462B (zh) 一种基于金融服务数据的存储管理系统
CN111159787A (zh) 一种保证信息安全的计算机存储系统
CN109299349B (zh) 应用推荐方法和装置、设备、计算机可读存储介质
CN110022242B (zh) 一种关键字确定方法及装置
CN114329581A (zh) 一种数据保护方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant