CN109388965A - 一种混合数据的脱敏方法及系统 - Google Patents
一种混合数据的脱敏方法及系统 Download PDFInfo
- Publication number
- CN109388965A CN109388965A CN201811050576.3A CN201811050576A CN109388965A CN 109388965 A CN109388965 A CN 109388965A CN 201811050576 A CN201811050576 A CN 201811050576A CN 109388965 A CN109388965 A CN 109388965A
- Authority
- CN
- China
- Prior art keywords
- sensitive information
- data
- information type
- desensitization
- fractionation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Databases & Information Systems (AREA)
- Computer Security & Cryptography (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种混合数据的脱敏方法及系统,在获取待脱敏的混合数据后,将待脱敏的混合数据进行拆分和归类,得到拆分字典集合,标记拆分字典集合中对应的敏感信息类型,得到识别敏感信息类型的拆分字典集合;根据预设脱敏算法,使用异步线程将识别敏感信息类型的拆分字典集合进行动态脱敏。本发明提供的混合数据的脱敏方法及系统,可实现通过建立异步线程对包含有不同类型敏感信息的混合数据进行快速脱敏,为构建安全可信的数据使用环境奠定了坚实的基础。
Description
技术领域
本发明涉及信息安全领域,具体涉及一种混合数据的脱敏方法及系统。
背景技术
数据脱敏是指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。在涉及客户安全数据或者一些商业性敏感数据的情况下,在不违反系统规则条件下,对真实数据进行改造并提供测试使用,如身份证号、手机号、卡号、客户号等个人信息都需要进行数据脱敏。
大数据环境已经逐步应用于了各大企业,企业敏感数据的所有权和使用权缺乏明确界定和管理,可能造成用户隐私信息的泄露和企业内部数据的泄露,直接造成企业声誉和经济的双重损失。数据的大量汇集,使得黑客成功攻击一次就能获得更多数据,极大降低了黑客的进攻成本。因此,大数据将有可能成为网络攻击的显著目标。
在大数据环境下的数据是NoSql的存储形式,各种类型的数据并非像传统数据中一样整齐的存储,而是杂乱的存储在一起,传统的脱敏算法,只能针对单一敏感数据类型进行处理,对于大数据的NoSql存储形式中杂乱的存储的多种敏感数据类型,处理起来效果较差,同时,由于数据量巨大,效率也较为低下。
发明内容
因此,本发明提供一种混合数据的脱敏方法及系统,克服了现有技术中对混合数据进行脱敏效率低下的不足。
本发明实施例提供一种混合数据的脱敏方法,包括如下步骤:
获取待脱敏的混合数据;将待脱敏的混合数据进行拆分和归类,得到拆分字典集合;标记所述拆分字典集合中对应的敏感信息类型,得到识别敏感信息类型的拆分字典集合;根据预设脱敏算法,使用异步线程将所述识别敏感信息类型的拆分字典集合进行动态脱敏。
优选地,所述将待脱敏的混合数据进行拆分和归类,得到拆分字典集合的步骤,具体包括:
根据数据类型将所述待脱敏的混合数据拆分为不同的字段数据;根据各类型敏感信息的数据特征,获取拆分字典的关键字;将进行拆分后的字段数据根据所述关键字进行归类,得到所述拆分字典集合。
优选地,所述标记所述拆分字典集合中对应的敏感信息类型,得到识别敏感信息类型的拆分字典集合的步骤,具体为:根据预设识别算法将所述拆分字典集合中各关键字和各关键字下的对应字段数据与对应的敏感信息类型进行标记,得到识别敏感信息类型的拆分字典集合。
优选地,所述数据类型包括汉字、数字、英文字母及符号中的至少一种。
优选地,所述关键字包括:数据类型和数据长度。
优选地,所述根据预设脱敏算法,使用异步线程将所述识别敏感信息类型的拆分字典集合进行动态脱敏的步骤,具体包括:
获取所述识别敏感信息类型的拆分字典集合中敏感信息类型的数量及各敏感信息类型对应的字段数据累计的总数量;
根据敏感信息类型及对应的字段数据构建待处理库;
初始化预设数量的异步线程,其中,所述预设数量小于所述敏感信息类型的数量;
使用初始化后的异步线程按照预设脱敏算法对所述敏感信息类型对应的字段数据进行脱敏处理;
判断各所述异步线程处理当前敏感信息类型对应的字段数据的数量是否小于所述字段数据的总数量与所述敏感信息类型数量的比值;
当所述异步线程处理当前敏感信息类型对应的字段数据的数量小于所述字段数据的总数量与所述敏感信息类型数量的比值时,在处理完毕当前敏感信息类型对应的字段数据后,将所述异步线程置为空闲状态;
从所述待处理库中取另一敏感信息类型对应的字段数据,使用处于空闲状态的异步线程按照预设脱敏算法进行脱敏处理;
将处理完毕的敏感信息类型对应所有字段数据移出待处理库。
优选地,所述预设数量的条数为所述敏感信息类型的数量的一半。
本发明实施例还提供一种混合数据脱敏系统,包括:待脱敏数据获取模块,用于获取待脱敏的混合数据;拆分字典集合获取模块,用于将待脱敏的混合数据进行拆分和归类,得到拆分字典集合;敏感信息类型标记模块,用于标记所述拆分字典集合中对应的敏感信息类型,得到识别敏感信息类型的拆分字典集合;脱敏模块,用于根据预设脱敏算法,使用异步线程将所述识别敏感信息类型的拆分字典集合进行动态脱敏。
本发明实施例还提供一种计算机设备,包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行上述的混合数据的脱敏方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行上述的混合数据的脱敏方法。
本发明技术方案,具有如下优点:
本发明提供的混合数据脱敏方法及系统,在获取待脱敏的混合数据后,将待脱敏的混合数据进行拆分和归类,得到拆分字典集合,标记拆分字典集合中对应的敏感信息类型,得到识别敏感信息类型的拆分字典集合;根据预设脱敏算法,使用异步线程将识别敏感信息类型的拆分字典集合进行动态脱敏。本发明提供的混合数据脱敏方法及系统,可实现通过建立异步线程对包含有不同类型敏感信息的混合数据进行快速脱敏,为构建安全可信的数据使用环境奠定了坚实的基础。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的混合数据的脱敏方法一个具体示例的流程图;
图2为本发明实施例提供的得到拆分字典集合一个具体示例的流程图;
图3为本发明实施例提供的使用异步线程进行动态脱敏一个具体示例的流程图;
图4为本发明实施例提供的混合数据的脱敏系统的一个具体示例的组成图;
图5为本发明实施例提供的计算机设备的一个具体示例的组成图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,还可以是两个元件内部的连通,可以是无线连接,也可以是有线连接。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
实施例1
本发明实施例提供一种混合数据的脱敏方法,如图1所示,该混合数据的脱敏方法包括如下步骤:
步骤S1:获取待脱敏的混合数据。本发明实施例中的待脱敏的混合数据来源可以为hive,hbase,mongo等数据库,上述数据库中存储包含多种敏感信息类型的混合数据。
步骤S2:将待脱敏的混合数据进行拆分和归类,得到拆分字典集合。
在一较佳实施例中,执行步骤S2中将待脱敏的混合数据进行拆分和归类,得到拆分字典集合的步骤,如图2所示,具体包括:
步骤S21:根据数据类型将待脱敏的混合数据拆分为不同的字段数据。在一较佳实施例中,数据类型包括汉字、数字、英文字母及符号中的至少一种。
步骤S22:根据各类型敏感信息的数据特征,获取拆分字典的关键字。
在本发明实施例中,关键字可包括:数据类型和数据长度。在一较佳实施例中,可以是根据身份证号、手机号、银行卡号、姓名、社保号码、邮箱等这些敏感信息的数据特征,来获取拆分字典的关键字,例如将18位数字、11位数字、3位汉字以及10以下英文字母等作为拆分字典的key(关键字)。
步骤S23:将进行拆分后的字段数据根据关键字进行归类,得到拆分字典集合。
在本发明实施例中,将拆分后的字段数据存入其格式类型所对应的key下,进行归类,得到拆分字典集合。
步骤S3:标记拆分字典集合中对应的敏感信息类型,得到识别敏感信息类型的拆分字典集合。
在一较佳实施例中,执行步骤S3中标记拆分字典集合中对应的敏感信息类型,得到识别敏感信息类型的拆分字典集合的步骤,具体为:根据预设识别算法将拆分字典集合中各关键字和各关键字下的对应字段数据与对应的敏感信息类型进行标记,得到识别敏感信息类型的拆分字典集合。
在实际应用中,根据现有技术中的识别算法,将各关键字和各关键字下的对应字段数据与对应的敏感信息类型进行标记,例如:将18位数字下的字段数据标记为身份证信息,将11位数字下的字段数据标记为手机号码,将3位汉字或2位汉字下的字段数据标记为姓名等。
步骤S4:根据预设脱敏算法,使用异步线程将识别敏感信息类型的拆分字典集合进行动态脱敏。
本发明实施例中预设脱敏算法,可根据敏感信息类型设定不同的脱敏规则,用户可以根据预设的加密策略,对不同敏感信息类型对应的字段数据的部分或全部进行加密处理。
在一较佳实施例中,执行步骤S4中根据预设脱敏算法,使用异步线程将识别敏感信息类型的拆分字典集合进行动态脱敏的步骤,如图3所示,具体包括:
步骤S41:获取识别敏感信息类型的拆分字典集合中敏感信息类型的数量及各敏感信息类型对应的字段数据累计的总数量。
本发明实施例中,统计敏感信息类型记为M,统计每种敏感信息类型下对应的字段数据的数量,将每种敏感信息类型下对应的字段数据的数量进行累计的总数量记为N。
步骤S42:根据敏感信息类型及对应的字段数据构建待处理库。
本发明实施例中,根据敏感信息类型及对应的字段数据构建待处理库,将每种敏感信息类型与之对应的字段数据放置该待处理库中。
步骤S43:初始化预设数量的异步线程,其中,预设数量小于敏感信息类型的数量。
在本发明实施例中,初始化数量为小于敏感信息类型的数量的异步线程,对敏感数据进行脱敏处理。优选初始化数量为M/2条异步线程,为其设置如下状态:每条线程每次处理数据至多为N/M条数据。
步骤S44:使用初始化后的异步线程按照预设脱敏算法对敏感信息类型对应的字段数据进行脱敏处理。
本发明实施例中,根据当前线程处理的敏感信息类型设置相应的脱敏算法进行脱敏处理,每种敏感信息类型对应的脱敏算法可以相同可以不同,根据实际需要进行相应设置。
步骤S45:判断各异步线程处理当前敏感信息类型对应的字段数据的数量是否小于字段数据的总数量与敏感信息类型数量的比值。
本发明实施例中,判断各异步线程处理当前的敏感信息类型对应的字段数据是否小于N/M条。
步骤S46:当异步线程处理当前敏感信息类型对应的字段数据的数量小于字段数据的总数量与敏感信息类型数量的比值时,在处理完毕当前敏感信息类型对应的字段数据后,将异步线程置为空闲状态。
本发明实施例中,每条线程每次只处理一种敏感信息类型对应的字段数据,当有线程处理的当前的敏感信息类型对应的字段数据小于N/M条时,不再取其他类别敏感信息类型的字段数据,在处理完毕当前敏感信息类型对应的字段数据后,将该异步线程置为空闲状态。如果当前处理数据的数量为N/M条,则当该线程处理完当前数据后,将该异步线程置为空闲状态。
步骤S47:从待处理库中取另一敏感信息类型对应的字段数据,使用处于空闲状态的异步线程按照预设脱敏算法进行脱敏处理。
本发明实施例中,在线程处理完毕当前的敏感信息类型对应的字段数据后置为空闲状态,然后在接着处理待处理库中其他敏感信息类型对应的字段数据,该线程直至将该敏感信息类型对应的全部字段数据全部处理完毕后,再处理其他类型的敏感数据。
步骤S48:将处理完毕的敏感信息类型对应所有字段数据移出待处理库。
本发明实施例提供的混合数据脱敏方法,在获取待脱敏的混合数据后,将待脱敏的混合数据进行拆分和归类,得到拆分字典集合,标记拆分字典集合中对应的敏感信息类型,得到识别敏感信息类型的拆分字典集合;根据预设脱敏算法,使用异步线程将识别敏感信息类型的拆分字典集合进行动态脱敏。该方法可实现通过建立异步线程对包含有不同类型敏感信息的混合数据进行快速脱敏,为构建安全可信的数据使用环境奠定了坚实的基础。
实施例2
本发明实施例提供一种混合数据脱敏系统,如图4所示,该混合数据脱敏系统包括:
待脱敏数据获取模块1,用于获取待脱敏的混合数据。此模块执行实施例1中的步骤S1所描述的方法,在此不在赘述。
拆分字典集合获取模块2,用于将待脱敏的混合数据进行拆分和归类,得到拆分字典集合。此模块执行实施例1中的步骤S2、步骤S21~步骤S23所描述的方法,在此不在赘述。
敏感信息类型标记模块3,用于标记拆分字典集合中对应的敏感信息类型,得到识别敏感信息类型的拆分字典集合。此模块执行实施例1中的步骤S3所描述的方法,在此不在赘述。
脱敏模块4,用于根据预设脱敏算法,使用异步线程将识别敏感信息类型的拆分字典集合进行动态脱敏。此模块执行实施例1中的步骤S4、步骤S41~步骤S48所描述的方法,在此不在赘述。
本发明实施例提供的混合数据脱敏系统,在获取待脱敏的混合数据后,将待脱敏的混合数据进行拆分和归类,得到拆分字典集合,标记拆分字典集合中对应的敏感信息类型,得到识别敏感信息类型的拆分字典集合;根据预设脱敏算法,使用异步线程将识别敏感信息类型的拆分字典集合进行动态脱敏。该系统可实现通过建立异步线程对包含有不同类型敏感信息的混合数据进行快速脱敏,为构建安全可信的数据使用环境奠定了坚实的基础。
实施例3
本发明实施例提供一种计算机设备,如图5所示,包括:至少一个处理器401,例如CPU(Central Processing Unit,中央处理器),至少一个通信接口403,存储器404,至少一个通信总线402。其中,通信总线402用于实现这些组件之间的连接通信。其中,通信接口403可以包括显示屏(Display)、键盘(Keyboard),可选通信接口403还可以包括标准的有线接口、无线接口。存储器404可以是高速RAM存储器(Ramdom Access Memory,易挥发性随机存取存储器),也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器404可选的还可以是至少一个位于远离前述处理器401的存储装置。其中处理器401可以执行图1描述的基于虚拟节点的多站协同干扰定位方法,存储器404中存储一组程序代码,且处理器401调用存储器404中存储的程序代码,以用于执行实施例1中的混合数据的脱敏方法。
其中,通信总线402可以是外设部件互连标准(peripheral componentinterconnect,简称PCI)总线或扩展工业标准结构(extended industry standardarchitecture,简称EISA)总线等。通信总线402可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器404可以包括易失性存储器(英文:volatile memory),例如随机存取存储器(英文:random-access memory,缩写:RAM);存储器也可以包括非易失性存储器(英文:non-volatile memory),例如快闪存储器(英文:flash memory),硬盘(英文:hard diskdrive,缩写:HDD)或固态硬盘(英文:solid-state drive,缩写:SSD);存储器404还可以包括上述种类的存储器的组合。
其中,处理器401可以是中央处理器(英文:central processing unit,缩写:CPU),网络处理器(英文:network processor,缩写:NP)或者CPU和NP的组合。
其中,处理器401还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(英文:application-specific integrated circuit,缩写:ASIC),可编程逻辑器件(英文:programmable logic device,缩写:PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(英文:complex programmable logic device,缩写:CPLD),现场可编程逻辑门阵列(英文:field-programmable gate array,缩写:FPGA),通用阵列逻辑(英文:generic arraylogic,缩写:GAL)或其任意组合。
可选地,存储器404还用于存储程序指令。处理器401可以调用程序指令,实现如本申请实施例1中提供的混合数据脱敏方法。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的基于虚拟节点的多站协同干扰定位方法。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory,ROM)、随机存储记忆体(Random Access Memory,RAM)、快闪存储器(FlashMemory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引申出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
Claims (10)
1.一种混合数据的脱敏方法,其特征在于,包括如下步骤:
获取待脱敏的混合数据;
将待脱敏的混合数据进行拆分和归类,得到拆分字典集合;
标记所述拆分字典集合中对应的敏感信息类型,得到识别敏感信息类型的拆分字典集合;
根据预设脱敏算法,使用异步线程将所述识别敏感信息类型的拆分字典集合进行动态脱敏。
2.根据权利要求1所述的混合数据的脱敏方法,其特征在于,所述将待脱敏的混合数据进行拆分和归类,得到拆分字典集合的步骤,具体包括:
根据数据类型将所述待脱敏的混合数据拆分为不同的字段数据;
根据各类型敏感信息的数据特征,获取拆分字典的关键字;
将进行拆分后的字段数据根据所述关键字进行归类,得到所述拆分字典集合。
3.根据权利要求2所述的混合数据的脱敏方法,其特征在于,所述标记所述拆分字典集合中对应的敏感信息类型,得到识别敏感信息类型的拆分字典集合的步骤,具体为:
根据预设识别算法将所述拆分字典集合中各关键字和各关键字下的对应字段数据与对应的敏感信息类型进行标记,得到识别敏感信息类型的拆分字典集合。
4.根据权利要求2所述的混合数据的脱敏方法,其特征在于,所述数据类型包括汉字、数字、英文字母及符号中的至少一种。
5.根据权利要求2所述的混合数据的脱敏方法,其特征在于,所述关键字包括:数据类型和数据长度。
6.根据权利要求1所述的混合数据的脱敏方法,其特征在于,所述根据预设脱敏算法,使用异步线程将所述识别敏感信息类型的拆分字典集合进行动态脱敏的步骤,具体包括:
获取所述识别敏感信息类型的拆分字典集合中敏感信息类型的数量及各敏感信息类型对应的字段数据累计的总数量;
根据敏感信息类型及对应的字段数据构建待处理库;
初始化预设数量的异步线程,其中,所述预设数量小于所述敏感信息类型的数量;
使用初始化后的异步线程按照预设脱敏算法对所述敏感信息类型对应的字段数据进行脱敏处理;
判断各所述异步线程处理当前敏感信息类型对应的字段数据的数量是否小于所述字段数据的总数量与所述敏感信息类型数量的比值;
当所述异步线程处理当前敏感信息类型对应的字段数据的数量小于所述字段数据的总数量与所述敏感信息类型数量的比值时,在处理完毕当前敏感信息类型对应的字段数据后,将所述异步线程置为空闲状态;
从所述待处理库中取另一敏感信息类型对应的字段数据,使用处于空闲状态的异步线程按照预设脱敏算法进行脱敏处理;
将处理完毕的敏感信息类型对应所有字段数据移出待处理库。
7.根据权利要求6所述的混合数据的脱敏方法,其特征在于,所述预设数量的条数为所述敏感信息类型的数量的一半。
8.一种混合数据脱敏系统,其特征在于,包括:
待脱敏数据获取模块,用于获取待脱敏的混合数据;
拆分字典集合获取模块,用于将待脱敏的混合数据进行拆分和归类,得到拆分字典集合;
敏感信息类型标记模块,用于标记所述拆分字典集合中对应的敏感信息类型,得到识别敏感信息类型的拆分字典集合;
脱敏模块,用于根据预设脱敏算法,使用异步线程将所述识别敏感信息类型的拆分字典集合进行动态脱敏。
9.一种计算机设备,其特征在于,包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行如权利要求1-7中任一所述的混合数据的脱敏方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行如权利要求1-7中任一所述的混合数据的脱敏方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811050576.3A CN109388965B (zh) | 2018-09-10 | 2018-09-10 | 一种混合数据的脱敏方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811050576.3A CN109388965B (zh) | 2018-09-10 | 2018-09-10 | 一种混合数据的脱敏方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109388965A true CN109388965A (zh) | 2019-02-26 |
CN109388965B CN109388965B (zh) | 2022-02-08 |
Family
ID=65418646
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811050576.3A Active CN109388965B (zh) | 2018-09-10 | 2018-09-10 | 一种混合数据的脱敏方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109388965B (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110472036A (zh) * | 2019-08-21 | 2019-11-19 | 恩亿科(北京)数据科技有限公司 | 一种基于大数据的敏感数据确定方法及装置 |
CN110851864A (zh) * | 2019-11-08 | 2020-02-28 | 国网浙江省电力有限公司信息通信分公司 | 一种敏感数据自动识别和处理方法及系统 |
CN111125160A (zh) * | 2019-12-26 | 2020-05-08 | 广东知得失网络科技有限公司 | 一种基于商标近似分析的数据预处理方法、系统及终端 |
CN111310224A (zh) * | 2020-01-16 | 2020-06-19 | 平安医疗健康管理股份有限公司 | 日志脱敏方法、装置、计算机设备及计算机可读存储介质 |
CN111639081A (zh) * | 2020-06-02 | 2020-09-08 | 南京星邺汇捷网络科技有限公司 | 敏感数据采集方法、装置及数据处理设备 |
CN111767565A (zh) * | 2019-03-15 | 2020-10-13 | 北京京东尚科信息技术有限公司 | 一种数据脱敏的处理方法、处理装置和存储介质 |
CN112347510A (zh) * | 2020-11-06 | 2021-02-09 | 中国工商银行股份有限公司 | 脱敏方法和脱敏装置 |
CN112395645A (zh) * | 2020-11-30 | 2021-02-23 | 中国民航信息网络股份有限公司 | 一种数据脱敏处理方法及装置 |
CN113177223A (zh) * | 2021-01-29 | 2021-07-27 | 张斌 | 一种基于数据属性动态因子实现的高安全性的数据可逆脱敏算法 |
CN113360946A (zh) * | 2021-06-29 | 2021-09-07 | 招商局金融科技有限公司 | 新闻脱敏处理方法、装置、电子设备及可读存储介质 |
CN114662138A (zh) * | 2020-12-23 | 2022-06-24 | 中国科学院沈阳自动化研究所 | 一种工业过程数据脱敏方法 |
CN117235781A (zh) * | 2023-08-21 | 2023-12-15 | 广州市玄武无线科技股份有限公司 | 一种数据脱敏方法、系统、装置及存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080133934A1 (en) * | 2006-10-10 | 2008-06-05 | Infosys Technologies Ltd. | Configurable data masking for software testing |
US20110270837A1 (en) * | 2010-04-30 | 2011-11-03 | Infosys Technologies Limited | Method and system for logical data masking |
US20150082449A1 (en) * | 2013-08-02 | 2015-03-19 | Yevgeniya (Virginia) Mushkatblat | Data masking systems and methods |
CN106203145A (zh) * | 2016-08-04 | 2016-12-07 | 北京网智天元科技股份有限公司 | 数据脱敏方法及相关设备 |
CN106295400A (zh) * | 2016-08-04 | 2017-01-04 | 北京网智天元科技股份有限公司 | 蒙版式数据脱敏方法及相关设备 |
CN107145799A (zh) * | 2017-05-04 | 2017-09-08 | 山东浪潮云服务信息科技有限公司 | 一种数据脱敏方法及装置 |
CN107944283A (zh) * | 2017-11-15 | 2018-04-20 | 中国农业银行股份有限公司 | 一种数据敏感性识别方法及装置 |
CN108418676A (zh) * | 2018-01-26 | 2018-08-17 | 山东超越数控电子股份有限公司 | 一种基于权限的数据脱敏方法 |
CN108470128A (zh) * | 2017-02-23 | 2018-08-31 | 全球能源互联网研究院有限公司 | 一种用电负荷数据的在线脱敏方法和装置 |
-
2018
- 2018-09-10 CN CN201811050576.3A patent/CN109388965B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080133934A1 (en) * | 2006-10-10 | 2008-06-05 | Infosys Technologies Ltd. | Configurable data masking for software testing |
US20110270837A1 (en) * | 2010-04-30 | 2011-11-03 | Infosys Technologies Limited | Method and system for logical data masking |
US20150082449A1 (en) * | 2013-08-02 | 2015-03-19 | Yevgeniya (Virginia) Mushkatblat | Data masking systems and methods |
CN106203145A (zh) * | 2016-08-04 | 2016-12-07 | 北京网智天元科技股份有限公司 | 数据脱敏方法及相关设备 |
CN106295400A (zh) * | 2016-08-04 | 2017-01-04 | 北京网智天元科技股份有限公司 | 蒙版式数据脱敏方法及相关设备 |
CN108470128A (zh) * | 2017-02-23 | 2018-08-31 | 全球能源互联网研究院有限公司 | 一种用电负荷数据的在线脱敏方法和装置 |
CN107145799A (zh) * | 2017-05-04 | 2017-09-08 | 山东浪潮云服务信息科技有限公司 | 一种数据脱敏方法及装置 |
CN107944283A (zh) * | 2017-11-15 | 2018-04-20 | 中国农业银行股份有限公司 | 一种数据敏感性识别方法及装置 |
CN108418676A (zh) * | 2018-01-26 | 2018-08-17 | 山东超越数控电子股份有限公司 | 一种基于权限的数据脱敏方法 |
Non-Patent Citations (2)
Title |
---|
ALEKSEY ET.AL.: ""The technique of dynamic data masking in information systems"", 《2016 5TH MEDITERRANEAN CONFERENCE ON EMBEDDED COMPUTING》 * |
邢宇恒等: ""数据脱敏在海量数据系统中的应用"", 《电信科学》 * |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111767565A (zh) * | 2019-03-15 | 2020-10-13 | 北京京东尚科信息技术有限公司 | 一种数据脱敏的处理方法、处理装置和存储介质 |
CN111767565B (zh) * | 2019-03-15 | 2024-04-12 | 北京京东尚科信息技术有限公司 | 一种数据脱敏的处理方法、处理装置和存储介质 |
CN110472036A (zh) * | 2019-08-21 | 2019-11-19 | 恩亿科(北京)数据科技有限公司 | 一种基于大数据的敏感数据确定方法及装置 |
CN110851864A (zh) * | 2019-11-08 | 2020-02-28 | 国网浙江省电力有限公司信息通信分公司 | 一种敏感数据自动识别和处理方法及系统 |
CN111125160A (zh) * | 2019-12-26 | 2020-05-08 | 广东知得失网络科技有限公司 | 一种基于商标近似分析的数据预处理方法、系统及终端 |
CN111310224A (zh) * | 2020-01-16 | 2020-06-19 | 平安医疗健康管理股份有限公司 | 日志脱敏方法、装置、计算机设备及计算机可读存储介质 |
CN111639081A (zh) * | 2020-06-02 | 2020-09-08 | 南京星邺汇捷网络科技有限公司 | 敏感数据采集方法、装置及数据处理设备 |
CN112347510A (zh) * | 2020-11-06 | 2021-02-09 | 中国工商银行股份有限公司 | 脱敏方法和脱敏装置 |
CN112347510B (zh) * | 2020-11-06 | 2024-03-29 | 中国工商银行股份有限公司 | 脱敏方法和脱敏装置 |
CN112395645A (zh) * | 2020-11-30 | 2021-02-23 | 中国民航信息网络股份有限公司 | 一种数据脱敏处理方法及装置 |
CN112395645B (zh) * | 2020-11-30 | 2024-06-11 | 中国民航信息网络股份有限公司 | 一种数据脱敏处理方法及装置 |
CN114662138B (zh) * | 2020-12-23 | 2024-06-11 | 中国科学院沈阳自动化研究所 | 一种工业过程数据脱敏方法 |
CN114662138A (zh) * | 2020-12-23 | 2022-06-24 | 中国科学院沈阳自动化研究所 | 一种工业过程数据脱敏方法 |
CN113177223A (zh) * | 2021-01-29 | 2021-07-27 | 张斌 | 一种基于数据属性动态因子实现的高安全性的数据可逆脱敏算法 |
CN113360946B (zh) * | 2021-06-29 | 2024-01-30 | 招商局金融科技有限公司 | 新闻脱敏处理方法、装置、电子设备及可读存储介质 |
CN113360946A (zh) * | 2021-06-29 | 2021-09-07 | 招商局金融科技有限公司 | 新闻脱敏处理方法、装置、电子设备及可读存储介质 |
CN117235781A (zh) * | 2023-08-21 | 2023-12-15 | 广州市玄武无线科技股份有限公司 | 一种数据脱敏方法、系统、装置及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109388965B (zh) | 2022-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109388965A (zh) | 一种混合数据的脱敏方法及系统 | |
CN109598509B (zh) | 风险团伙的识别方法和装置 | |
CN109815742B (zh) | 数据脱敏方法及装置 | |
US20150106931A1 (en) | Classifying malware by order of network behavior artifacts | |
EP3956791B1 (en) | Providing context associated with a potential security issue for an analyst | |
CN109460676A (zh) | 一种混合数据的脱敏方法、脱敏装置及脱敏设备 | |
JP5382599B2 (ja) | 秘匿化アドレスマッチング処理システム | |
WO2019062081A1 (zh) | 业务员画像形成方法、电子装置及计算机可读存储介质 | |
CN111767565A (zh) | 一种数据脱敏的处理方法、处理装置和存储介质 | |
US9992209B1 (en) | System and method for characterizing security entities in a computing environment | |
EP3301603A1 (en) | Improved search for data loss prevention | |
CN108932434B (zh) | 一种基于机器学习技术的数据加密方法及装置 | |
CN109145588A (zh) | 数据处理方法及装置 | |
CN108683583A (zh) | 一种垃圾邮件处理方法、装置及存储介质 | |
CN116055067B (zh) | 一种弱口令检测的方法、装置、电子设备及介质 | |
CN113032821A (zh) | 数据脱敏方法、装置、电子设备及可读存储介质 | |
CN110427496B (zh) | 用于文本处理的知识图谱扩充方法及装置 | |
CN110097258B (zh) | 一种用户关系网络建立方法、装置及计算机可读存储介质 | |
CN107862016A (zh) | 一种专题页面的配置方法 | |
CN110175318B (zh) | 一种保险理赔附件生成方法及装置 | |
CN110956170A (zh) | 生成护照机读码样本的方法、装置、设备及存储介质 | |
CN110489992A (zh) | 基于大数据平台的脱敏方法及系统 | |
CN115225328A (zh) | 页面访问数据的处理方法、装置、电子设备以及存储介质 | |
WO2021104279A1 (zh) | 用户画像构建方法和装置、设备和存储介质 | |
CN104965976B (zh) | 一种抽样方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |