CN108536739A - 元数据敏感信息字段识别方法、装置、设备及存储介质 - Google Patents

元数据敏感信息字段识别方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN108536739A
CN108536739A CN201810185823.4A CN201810185823A CN108536739A CN 108536739 A CN108536739 A CN 108536739A CN 201810185823 A CN201810185823 A CN 201810185823A CN 108536739 A CN108536739 A CN 108536739A
Authority
CN
China
Prior art keywords
sensitive information
data
information field
row data
default row
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810185823.4A
Other languages
English (en)
Other versions
CN108536739B (zh
Inventor
戴秀凤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Life Insurance Company of China Ltd
Original Assignee
Ping An Life Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Life Insurance Company of China Ltd filed Critical Ping An Life Insurance Company of China Ltd
Priority to CN201810185823.4A priority Critical patent/CN108536739B/zh
Publication of CN108536739A publication Critical patent/CN108536739A/zh
Application granted granted Critical
Publication of CN108536739B publication Critical patent/CN108536739B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明属于信息安全技术领域,特别涉及一种元数据敏感信息字段识别方法、装置、设备及存储介质。元数据敏感信息字段识别方法包括获取元数据库的系统视图,在系统视图中查找所有用户列表;获取每个用户列表的预设行数据,并将预设行数据与预设的敏感信息字段进行匹配;当预设行数据与预设的敏感信息字段匹配成功时,将预设行数据对应的用户表名、敏感信息字段及数据输出至敏感信息汇总表中;接收待评估表并检测到待评估表的表名在敏感信息汇总表时,显示待评估表的敏感信息字段及数据。本发明技术方案能够快速将元数据中敏感信息区分出并输出至敏感信息汇总表,通过敏感信息汇总表快速识别待评估表中的敏感信息。

Description

元数据敏感信息字段识别方法、装置、设备及存储介质
技术领域
本发明属于信息安全技术领域,特别涉及一种元数据敏感信息字段识别方法、装置、设备及存储介质。
背景技术
目前,敏感信息的安全问题一直受到人们的重视,对敏感信息的鉴别通常依赖人工鉴别,例如对于数据库中很多需要外发的待评估表进行审核时,需要人工逐个判断待评估表是否具有敏感信息,工作效率较低,目前也有采用程序进行识别,但是,现有技术中通常采用较单一的文本相似算法策略,例如采用全文md5识别算法进行识别,即对每一个待评估表进行现场全文识别,识别速度较慢,因此,现有技术所采用的程序也未能做到快速识别,鉴别效率低,无法快速将待评估表中的敏感信息区分出来。
发明内容
本发明的目的在于提供一种元数据敏感信息字段识别方法、装置、设备及存储介质,能够实现能够实现快速识别元数据中用户列表的敏感信息字段,并通过敏感信息汇总表对待评估表进行评估。
本发明是这样实现的,本发明第一方面提供一种元数据敏感信息字段识别方法,包括:
获取元数据库的系统视图,在所述系统视图中查找所有用户列表;
获取每个用户列表的预设行数据,并将所述预设行数据与预设的敏感信息字段进行匹配;
当所述预设行数据与预设的敏感信息字段匹配成功时,将所述预设行数据对应的用户表名、所述敏感信息字段及数据输出至敏感信息汇总表中;
接收待评估表并检测到所述待评估表的表名在所述敏感信息汇总表时,显示所述待评估表的敏感信息字段及数据。
本发明第二方面提供一种元数据敏感信息字段识别装置,所述元数据敏感信息字段识别装置包括:
用户列表查找模块,用于获取元数据库的系统视图,在所述系统视图中查找所有用户列表;
匹配模块,用于获取每个用户列表的预设行数据,并将所述预设行数据与预设的敏感信息字段进行匹配;
汇总模块,用于当所述预设行数据与预设的敏感信息字段匹配成功时,将所述预设行数据对应的用户表名、所述敏感信息字段及数据输出至敏感信息汇总表中;
评估模块,用于接收待评估表并检测到所述待评估表的表名在所述敏感信息汇总表时,显示所述待评估表的敏感信息字段及数据。
本发明第三方面提供一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如本发明第一方面所述方法的步骤。
本发明第四方面提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如本发明第一方面所述方法的步骤。
本发明提供一种元数据敏感信息字段识别方法、装置、设备及存储介质,在系统视图中查找所有用户列表,将预设行数据与预设的敏感信息字段进行匹配;当预设行数据与预设的敏感信息字段匹配成功时,将预设行数据对应的用户表名、敏感信息字段及数据输出至敏感信息汇总表中,实现快速识别元数据中用户列表的敏感信息字段,接收待评估表并检测到待评估表的表名在敏感信息汇总表时,显示待评估表的敏感信息字段及数据,能够快速将元数据中敏感信息区分出并输出至敏感信息汇总表,通过敏感信息汇总表快速识别待评估表中的敏感信息,提高工作效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一种实施例提供的一种元数据敏感信息字段识别方法的流程图;
图2是本发明一种实施例提供的一种元数据敏感信息字段识别方法步骤S30的具体流程图;
图3是本发明第二实施例提供的一种元数据敏感信息字段识别装置的结构示意图;
图4是本发明第二实施例提供的一种元数据敏感信息字段识别装置匹配模块的具体结构示意图;
图5是本发明第三实施例提供的终端设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
为了说明本发明的技术方案,下面通过具体实施例来进行说明。
实施例1
本发明第一实施例提供一种元数据敏感信息字段识别方法,如图1所示,元数据敏感信息字段识别方法包括:
步骤S10,获取元数据库的系统视图,在系统视图中查找所有用户列表。
在步骤S10中,大数据库中元数据包括系统列表和用户列表,在大数据库中获取元数据系统视图,系统视图是大数据库中数据的一种变换,是查看表中数据的另外一种方式,可以将视图看成是一个移动的窗口,视图是从一个或多个实际表中获得的,表中的数据寄存在大数据库中,将产生视图的表叫做该视图的系统表,可以采用SELECT语句获取大数据库的系统视图中所有的表名,排除系统表,获取用户列表,将获取的系统视图中的用户列表返回。
步骤S20,获取每个用户列表的预设行数据,并将预设行数据与预设的敏感信息字段进行匹配。
在步骤S20中,根据返回的用户列表获取每个用户列表中的预设行数据,每个用户列表中包括多行,每行中包括字段以及数据,将每个用户列表预设行数据与预设的敏感信息进行匹配。例如,预设的敏感信息字段由用户根据自身的业务进行确定,敏感信息字段可以是:姓名、身份证号、联系电话、账号资金等,将每个用户列表预设行数据与敏感信息字段姓名、身份证号、联系电话进行匹配。作为一种实施方式,敏感信息字段可以为中文,例如,姓名、身份证号、联系电话,也可以为英文,例如,name、phone、ID number。作为另一种实施方式,敏感信息字段可以为具体的信息,例如,姓名为小A,电话号码为12335,将小A、12335设为敏感信息字段。
作为本实施例的一种实施方式,对于步骤S20中获取每个用户列表的预设行数据,并将预设行数据与预设的敏感信息字段进行匹配,包括:
获取每个用户列表中从第一行数据至预设行的数据,并将第一行数据至预设行的数据与预设的敏感信息字段进行匹配。
在本步骤中,每个用户列表中含有多行,每行中包括字段以及数据,对于很多用户列表,通常位于用户列表前面几十行的信息为敏感信息,因此,可以只获取每个用户列表前面的数据即可,获取每个用户列表中第一行起至预设行的数据,预设行根据需求确定,例如,每个用户列表中包括一百行数据,设置预设行为三十行,获取每个用户列表中从第一行起至第三十行数据,将从用户列表中获取的预设航数据与敏感信息字段进行匹配,当用户列表中行数不足三十行时,获取三十行内的数据。
本步骤中通过将获取每个用户列表的预设行数据,将每个用户列表的部分数据与敏感信息进行对比,不需要将用户列表的全部数据均进行对比,提高了识别用户列表中包括敏感信息的效率。
作为本实施例的一种实施方式,对于步骤S20中获取每个用户列表的预设行数据,并将预设行数据与预设的敏感信息字段进行匹配,包括:
将每个用户列表的数据分成多组预设行数据,将每组预设行数据与预设的敏感信息字段进行匹配。
在本步骤中,用户列表中的所有数据均与敏感信息字段进行匹配,进行匹配的方式不是逐行数据进行匹配,而是将每个用户列表分为多组预设行数据,获取每个用户列表中预设行数据,同时将每组的数据与敏感信息进行匹配。例如,用户列表中包含九十行数据,将九十行数据分为第一组、第二组以及第三组,获取每个用户列表的每组三十行数据,获取规则可以为从第一行起,将获取的用户列表的三组预设行数据与敏感信息字段进行匹配,获取匹配成功的敏感信息。
本步骤中通过将每个用户列表的数据分成多组预设行数据,同时将多组预设行数据与敏感信息进行匹配,提供了每个用户列表与敏感信息的匹配效率。
步骤S30,当预设行数据与预设的敏感信息字段匹配成功时,将预设行数据对应的用户表名、敏感信息字段及数据输出至敏感信息汇总表中。
在步骤S30中,在用户列表中获取每个用户表名,并将用户列表中的用户表名对应的预设行数据返回,返回的预设行数据为用户列表中预设行的字段与数据,对返回的预设行数据与预设的敏感信息字段进行匹配,例如,预设行数据是指取一个表开头的N条记录,比如一个表有100行记录,如果全部取出来就会对数据库造成影响,所以用分页查询的方法取从第一行起的20行或30行进行判断,用户列表中包含A、B、C、D四个用户表名,将用户表名A、B、C、D中预设行对应的数据进行返回,依次获取用户列表A、B、C、D表的预设行的所有的字段及数据,并对获取的字段及数据与敏感信息字段进行分析匹配,当A、B、C、D表中某一行的数据与敏感信息字段匹配成功时,则将对应为敏感信息字段的数据判断为敏感信息字段,将为敏感信息字段对应的表名,敏感信息字段及数据输出到敏感信息汇总表,更具体的,A表中第二行包括了多个字段与字段的数据,其中包括了姓名及姓名对应的数据小A,敏感信息字段为姓名,当将A表中第二行与敏感信息字段进行匹配时,A表中第二行姓名与敏感信息字段姓名匹配成功,将姓名对应的表名A、敏感信息字段姓名以及数据小A输出至敏感信息汇总表中。
为了方便用户对查找出的敏感信息字段详情进行查看,将表名、敏感信息字段及数据在敏感信息汇总表中进行汇总显示,将表名、敏感信息字段及数据和在敏感信息汇总表中进行汇总时,按照敏感信息字段对应的用户列表的表名进行排列,敏感信息汇总表中包含敏感信息字段的表名、敏感信息字段及数据、敏感信息字段的个数等,将匹配成功的敏感信息字段输出至敏感信息汇总表中,需要与敏感信息汇总表中敏感信息字段的表名、敏感信息字段及数据、敏感信息字段的个数一一对应,例如,设置的敏感信息字段为姓名、身份证号、联系电话,获取用户列表A、B、C、D表的行字段数据,当B表中包含了姓名和联系电话,C表中包含了身份证号,则将B表、敏感信息字段姓名及对应的数据、联系电话及对应数据在敏感信息汇总表中一一对应显示,将C表、敏感信息字段身份证号及对应的数据在敏感信息汇总表一一对应显示,汇总显示时,更具体的,敏感信息汇总表中敏感信息字段的表名一列填入B表,将B表中的敏感信息字段数据一列填入敏感信息字段姓名及对应的数据,敏感信息字段联系电话及敏感信息字段对应的数据、在敏感信息字段的个数一列填入在B表中查找到的所有为敏感信息字段的个数,通过敏感信息汇总表格能够清楚的观察用户列表中的哪些列表包含敏感信息字段,并通过敏感信息汇总表对多个待评估表进行评估,提高了工作效率。
步骤S40,接收待评估表并检测到待评估表的表名在敏感信息汇总表时,显示待评估表的敏感信息字段及数据。
在步骤S40中,待评估表是指需要人员进行评估是否包括敏感信息的表,可以是数据库中的用户列表,也可以是在数据库中的用户列表增加了部分数据的表,当接收到待评估表时,将需要进行评估的待评估表与敏感信息汇总表进行匹配,获取待评估表的表名,将表名与敏感信息汇总表进行匹配,当敏感信息汇总表中包括了待评估表的表名,将待评估表中敏感信息字段及数据进行显示,当敏感信息汇总表中未匹配到待评估表的表名,则待评估表中不包含敏感信息字段。作为一种实施方式,对敏感信息字段根据安全级别在敏感信息汇总表中进行高亮显示,例如,当敏感信息字段设置的为金额、身份证号、姓名,根据安全级别将金额划分为最高安全级别,身份证号次之,姓名安全级别为最低,将从用户列表预设行数据匹配的敏感信息字段输出至敏感信息汇总表时高亮显示,高亮显示时按红橙黄绿等顺序进行显示。当有敏感信息字段输出至敏感信息汇总表中,当输出的敏感信息字段为最高安全级别金额时,金额为红色高亮显示,当输出的敏感信息字段为身份证号时,身份证号为橙色高亮显示,当输出的敏感信息字段为姓名时,姓名为黄色高亮显示,通过敏感信息汇总表能够快速获取待评估表中的敏感信息字段,并通过敏感信息汇总表对待评估表进行风险评估。
本发明提供一种元数据敏感信息字段识别方法,在系统视图中查找所有用户列表,将预设行数据与预设的敏感信息字段进行匹配;当预设行数据与预设的敏感信息字段匹配成功时,将预设行数据对应的用户表名、敏感信息字段及数据输出至敏感信息汇总表中,实现快速识别元数据中用户列表的敏感信息字段,接收待评估表并检测到待评估表的表名在敏感信息汇总表时,显示待评估表的敏感信息字段及数据,通过敏感信息汇总表实现快速对待评估表进行评估,提高工作效率。
作为本发明第一实施例的一种实施方式,在步骤S20中,对于将预设行数据与预设的敏感信息字段进行匹配,包括:
当检测到预设行数据包括敏感信息字段时,判定预设行数据与预设的敏感信息字段匹配成功。
在本步骤中,预设行数据中包括字段以及字段对应的数据,预设的敏感信息字段为字段或字段对应的数据,将预设的敏感信息字段与预设行数据中的字段或字段对应的数据进行匹配,具体的,将每个用户列表中获取的预设行数据与敏感信息字段进行匹配,每个用户列表中预设行数据包括了多个字段以及字段对应的数据,敏感信息字段为具体字段或者具体数据。作为本步骤一种实施方式,敏感信息字段为具体字段,当预设行数据中字段以及字段对应的数据包括预设的敏感信息字段时,则判定预设行数据与预设的敏感信息字段匹配成功,例如,敏感信息字段的具体字段设置的为姓名,将获取的用户列表预设行数据中的字段及字段对应的数据与敏感信息字段进行匹配,当预设行数据中的字段及字段对应的数据包括姓名时,则判定预设行数据与敏感信息字段匹配成功。作为本步骤另一种实施方式,敏感信息字段作为具体数据时,当预设行数据中字段以及字段对应的数据包括预设的敏感信息字段时,则判定预设行数据与预设的敏感信息字段匹配成功,例如,敏感信息字段的具体数据设置的为身份证号时,将预设行数据中字段及字段对应的数据与敏感信息字段进行匹配,当预设行数据中的字段及字段对应的数据包括具体的数据身份证号时,则判定预设行数据与敏感信息字段匹配成功,通过本实施方式,快速查找敏感信息字段,操作简单。
作为本发明第一实施例的一种实施方式,如图2所示,对于上述实施例中步骤S30中当预设行数据与预设的敏感信息字段匹配成功时,将预设行数据对应的用户表名、敏感信息字段及数据输出至敏感信息汇总表中,包括:
步骤S301,当预设行数据与预设的敏感信息字段匹配成功时,获取预设行数据对应的用户表名、敏感信息字段及数据。
步骤S302,计算用户表名的敏感信息字段的个数。
步骤S303,将用户表名、个数、敏感信息字段字段及数据输出至敏感信息汇总表中,按逐行排列显示。
在上述步骤中,当用户列表预设行中的数据与敏感信息字段匹配成功,将预设行数据对应的用户表名、敏感信息字段及数据输出至敏感信息汇总表中,统计敏感信息字段在该表中的个数,并一起输出至敏感信息汇总表中。例如,当用户列表中包括了A、B、C、D表,设置的敏感信息字段为姓名、身份证号、联系电话,获取用户列表A、B、C、D表预设行数据,当B表中预设行数据包括姓名和联系电话,C表中预设行数据包括身份证号,则将B表、预设行数据中的敏感信息字段姓名及数据、联系电话及数据在敏感信息汇总表格中逐行排列显示,将C表、预设行数据中敏感信息字段身份证号以及数据在敏感信息汇总表中显示,将在B表中查找的所有敏感信息逐列排列完成之后将在C表中查找的所有敏感信息逐列排列完成,当B表中统计的敏感信息字段个数为2时,将敏感信息字段的个数一并在敏感信息汇总表中显示。作为一种实施方式,在敏感信息汇总表中按表名不同将敏感信息字段进行排列时,为一个表名的敏感信息字段的表名一列只需填入一个表名,例如,在预设的表格中,前五行是B表中敏感信息字段的数据,那么在敏感信息字段的表名一列,前五行只需填入一个B表。
实施例2
本发明第二实施例提供一种元数据敏感信息字段识别装置,如图3所示,元数据敏感信息字段识别装置3包括:
用户列表查找模块31,用于获取元数据库的系统视图,在系统视图中查找所有用户列表;
匹配模块32,用于获取每个用户列表的预设行数据,并将预设行数据与预设的敏感信息字段进行匹配;
汇总模块33,用于当预设行数据与预设的敏感信息字段匹配成功时,将预设行数据对应的用户表名、敏感信息字段及数据输出至敏感信息汇总表中;
评估模块34,用于接收待评估表并检测到待评估表的表名在敏感信息汇总表时,显示待评估表的敏感信息字段及数据。
本发明提供一种元数据敏感信息字段识别装置,在系统视图中查找所有用户列表,将预设行数据与预设的敏感信息字段进行匹配;当预设行数据与预设的敏感信息字段匹配成功时,将预设行数据对应的用户表名、敏感信息字段及数据输出至敏感信息汇总表中,实现快速识别元数据中用户列表的敏感信息字段,接收待评估表并检测到待评估表的表名在敏感信息汇总表时,显示待评估表的敏感信息字段及数据,通过敏感信息汇总表实现快速对待评估表进行评估,提高工作效率。
作为本发明第二实施例的一种实施方式,如图4所示,对于上述实施例中,匹配模块32包括:
第一匹配模块321,用于获取每个用户列表中从第一行数据至预设行的数据,并将第一行数据至预设行的数据与预设的敏感信息字段进行匹配。
第二匹配模块322,用于将每个用户列表的数据分成多组预设行数据,依次将每组预设行数据与预设的敏感信息字段进行匹配。
作为本发明第二实施例的一种实施方式,对于上述将预设行数据与预设的敏感信息字段进行匹配,包括:
当检测到预设行数据包括敏感信息字段时,判定预设行数据与预设的敏感信息字段匹配成功。
进一步地,汇总模块33中当所述预设行数据与预设的敏感信息字段匹配成功时,将所述预设行数据对应的用户表名、所述敏感信息字段及数据输出至敏感信息汇总表中,包括:
当所述预设行数据与预设的敏感信息字段匹配成功时,获取所述预设行数据对应的用户表名、所述敏感信息字段及数据;
计算所述用户表名的所述敏感信息字段的个数;
将所述用户表名、所述个数、所述敏感信息字段字段及数据输出至敏感信息汇总表中,按逐行排列显示。
上述元数据敏感信息字段识别装置3中模块的具体工作过程,可以参考前述实施例1中元数据敏感信息字段识别方法对应的过程,在此不再赘述。
实施例3
本发明第三实施例提供一计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例1中的一种元数据敏感信息字段识别方法,为避免重复,这里不再赘述。或者,该计算机程序被处理器执行时实现上述实施例2中一种元数据敏感信息字段识别装置中各模块/单元的功能,为避免重复,这里不再赘述。
实施例4
图5是本实施例中终端设备5的示意图。如图5所示,终端设备5包括处理器53、存储器51以及存储在存储器51中并可在处理器53上运行的计算机程序52。处理器53执行计算机程序52时实现上述实施例1中一种元数据敏感信息字段识别方法的各个步骤,例如图1所示的步骤S10、S20、S30和S40。或者,处理器53执行计算机程序52时实现上述实施例2中一种元数据敏感信息字段识别装置各模块/单元的功能,如图3所示的用户列表查找模块31、匹配模块32、汇总模块33以及评估模块34。
计算机程序52可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器51中,并由处理器53执行,以完成本发明。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序52指令段,该指令段用于描述计算机程序52在终端设备5中的执行过程。例如,计算机程序52可以被分割成用户列表查找模块31、匹配模块32、汇总模块33以及评估模块34,各模块具体功能与实施例1中的一种元数据敏感信息字段识别方法步骤一一对应,为避免重复,在此不一一赘述。
该终端设备5可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。终端设备5可包括,但不仅限于,处理器53、存储器51。本领域技术人员可以理解,图5仅仅是终端设备5的示例,并不构成对终端设备5的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如终端设备5还可以包括输入汇总设备、网络接入设备、总线等。
所称处理器53可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器53、数字信号处理器53(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器53可以是微处理器53或者该处理器53也可以是任何常规的处理器53等。
存储器51可以是终端设备5的内部存储单元,例如终端设备5的硬盘或内存。存储器51也可以是终端设备5的外部存储设备,例如终端设备5上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器51还可以既包括终端设备5的内部存储单元也包括外部存储设备。存储器51用于存储计算机程序52以及终端设备5所需的其他程序和数据。存储器51还可以用于暂时地存储已经汇总或者将要汇总的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序52来指令相关的硬件来完成,计算机程序52可存储于一计算机可读存储介质中,该计算机程序52在被处理器53执行时,可实现上述各个方法实施例的步骤。其中,计算机程序52包括计算机程序52代码,计算机程序52代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序52代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器51、只读存储器51(ROM,Read-Only Memory)、随机存取存储器51(RAM,RandomAccess Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种元数据敏感信息字段识别方法,其特征在于,所述元数据敏感信息字段识别方法包括:
获取元数据库的系统视图,在所述系统视图中查找所有用户列表;
获取每个用户列表的预设行数据,并将所述预设行数据与预设的敏感信息字段进行匹配;
当所述预设行数据与预设的敏感信息字段匹配成功时,将所述预设行数据对应的用户表名、所述敏感信息字段及数据输出至敏感信息汇总表中;
接收待评估表并检测到所述待评估表的表名在所述敏感信息汇总表时,显示所述待评估表的敏感信息字段及数据。
2.如权利要求1所述的元数据敏感信息字段识别方法,其特征在于,获取每个用户列表的预设行数据,并将所述预设行数据与预设的敏感信息字段进行匹配,包括:
获取每个用户列表中从第一行数据至预设行的数据,并将所述第一行数据至预设行的数据与预设的敏感信息字段进行匹配。
3.如权利要求1所述的元数据敏感信息字段识别方法,其特征在于,获取每个用户列表的预设行数据,并将所述预设行数据与预设的敏感信息字段进行匹配,包括:
将每个用户列表的数据分成多组预设行数据,将所述每组预设行数据与预设的敏感信息字段进行匹配。
4.如权利要求2或者3所述的元数据敏感信息字段识别方法,其特征在于,将所述预设行数据与预设的敏感信息字段进行匹配,包括:
当检测到所述预设行数据包括敏感信息字段时,判定所述预设行数据与预设的敏感信息字段匹配成功。
5.如权利要求1所述的元数据敏感信息字段识别方法,其特征在于,当所述预设行数据与预设的敏感信息字段匹配成功时,将所述预设行数据对应的用户表名、所述敏感信息字段及数据输出至敏感信息汇总表中,包括:
当所述预设行数据与预设的敏感信息字段匹配成功时,获取所述预设行数据对应的用户表名、所述敏感信息字段及数据;
计算所述用户表名的所述敏感信息字段的个数;
将所述用户表名、所述个数、所述敏感信息字段字段及数据输出至敏感信息汇总表中,按逐行排列显示。
6.一种元数据敏感信息字段识别装置,其特征在于,所述元数据敏感信息字段识别装置包括:
用户列表查找模块,用于获取元数据库的系统视图,在所述系统视图中查找所有用户列表;
匹配模块,用于获取每个用户列表的预设行数据,并将所述预设行数据与预设的敏感信息字段进行匹配;
汇总模块,用于当所述预设行数据与预设的敏感信息字段匹配成功时,将所述预设行数据对应的用户表名、所述敏感信息字段及数据输出至敏感信息汇总表中;
评估模块,用于接收待评估表并检测到所述待评估表的表名在所述敏感信息汇总表时,显示所述待评估表的敏感信息字段及数据。
7.如权利要求6所述的元数据敏感信息字段识别装置,其特征在于,所述匹配模块包括:
第一匹配模块,用于获取每个用户列表中从第一行数据至预设行的数据,并将所述第一行数据至预设行的数据与预设的敏感信息字段进行匹配。
第二匹配模块,用于将每个用户列表的数据分成多组预设行数据,依次将所述每组预设行数据与预设的敏感信息字段进行匹配。
8.如权利要求7所述的元数据敏感信息字段识别装置,其特征在于,将所述预设行数据与预设的敏感信息字段进行匹配,包括:
当检测到所述预设行数据包括敏感信息字段时,判定所述预设行数据与预设的敏感信息字段匹配成功。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述方法的步骤。
CN201810185823.4A 2018-03-07 2018-03-07 元数据敏感信息字段识别方法、装置、设备及存储介质 Active CN108536739B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810185823.4A CN108536739B (zh) 2018-03-07 2018-03-07 元数据敏感信息字段识别方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810185823.4A CN108536739B (zh) 2018-03-07 2018-03-07 元数据敏感信息字段识别方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN108536739A true CN108536739A (zh) 2018-09-14
CN108536739B CN108536739B (zh) 2021-10-12

Family

ID=63486518

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810185823.4A Active CN108536739B (zh) 2018-03-07 2018-03-07 元数据敏感信息字段识别方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN108536739B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109829327A (zh) * 2018-12-15 2019-05-31 中国平安人寿保险股份有限公司 敏感信息处理方法、装置、电子设备及存储介质
CN110704873A (zh) * 2019-09-25 2020-01-17 全球能源互联网研究院有限公司 一种防止敏感数据泄漏的方法及系统
CN111079185A (zh) * 2019-12-20 2020-04-28 南京医康科技有限公司 数据库信息处理的方法、装置、存储介质及电子设备
CN111241133A (zh) * 2018-11-29 2020-06-05 中国移动通信集团重庆有限公司 敏感数据识别方法、装置、设备及计算机存储介质
CN113032834A (zh) * 2021-04-20 2021-06-25 江苏保旺达软件技术有限公司 一种数据库表格处理方法、装置、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104123370A (zh) * 2014-07-24 2014-10-29 杭州安恒信息技术有限公司 数据库敏感信息探测方法及系统
CN105099688A (zh) * 2014-05-15 2015-11-25 阿里巴巴集团控股有限公司 一种电子账户的操作方法、支付页面的展示方法及装置
US20160034171A1 (en) * 2014-08-04 2016-02-04 Flextronics Ap, Llc Multi-touch gesture recognition using multiple single-touch touch pads
CN105824825A (zh) * 2015-01-06 2016-08-03 中国移动通信集团湖南有限公司 一种敏感数据识别方法和装置
CN106529329A (zh) * 2016-10-11 2017-03-22 中国电子科技网络信息安全有限公司 一种用于大数据的脱敏系统及脱敏方法
CN107729456A (zh) * 2017-09-30 2018-02-23 武汉汉思信息技术有限责任公司 敏感信息检索方法、服务器及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105099688A (zh) * 2014-05-15 2015-11-25 阿里巴巴集团控股有限公司 一种电子账户的操作方法、支付页面的展示方法及装置
CN104123370A (zh) * 2014-07-24 2014-10-29 杭州安恒信息技术有限公司 数据库敏感信息探测方法及系统
US20160034171A1 (en) * 2014-08-04 2016-02-04 Flextronics Ap, Llc Multi-touch gesture recognition using multiple single-touch touch pads
CN105824825A (zh) * 2015-01-06 2016-08-03 中国移动通信集团湖南有限公司 一种敏感数据识别方法和装置
CN106529329A (zh) * 2016-10-11 2017-03-22 中国电子科技网络信息安全有限公司 一种用于大数据的脱敏系统及脱敏方法
CN107729456A (zh) * 2017-09-30 2018-02-23 武汉汉思信息技术有限责任公司 敏感信息检索方法、服务器及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李珍珍: "《淘宝开店做金冠》", 30 September 2017, 南京:东南大学出版社 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111241133A (zh) * 2018-11-29 2020-06-05 中国移动通信集团重庆有限公司 敏感数据识别方法、装置、设备及计算机存储介质
CN109829327A (zh) * 2018-12-15 2019-05-31 中国平安人寿保险股份有限公司 敏感信息处理方法、装置、电子设备及存储介质
CN110704873A (zh) * 2019-09-25 2020-01-17 全球能源互联网研究院有限公司 一种防止敏感数据泄漏的方法及系统
CN111079185A (zh) * 2019-12-20 2020-04-28 南京医康科技有限公司 数据库信息处理的方法、装置、存储介质及电子设备
CN111079185B (zh) * 2019-12-20 2022-12-30 医渡云(北京)技术有限公司 数据库信息处理的方法、装置、存储介质及电子设备
CN113032834A (zh) * 2021-04-20 2021-06-25 江苏保旺达软件技术有限公司 一种数据库表格处理方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN108536739B (zh) 2021-10-12

Similar Documents

Publication Publication Date Title
CN108536739A (zh) 元数据敏感信息字段识别方法、装置、设备及存储介质
CN109634698B (zh) 菜单显示方法、装置、计算机设备及存储介质
CA2845743C (en) Resolving similar entities from a transaction database
CN108615119B (zh) 一种异常用户的识别方法及设备
US8490203B1 (en) Fingerprinting based entity extraction
CN108710613A (zh) 文本相似度的获取方法、终端设备及介质
CN105045781B (zh) 查询词相似度计算方法及装置、查询词搜索方法及装置
US10534931B2 (en) Systems, devices and methods for automatic detection and masking of private data
US20140351274A1 (en) Scalable lookup-driven entity extraction from indexed document collections
CN109670837A (zh) 债券违约风险的识别方法、装置、计算机设备和存储介质
CN109062936B (zh) 一种数据查询方法、计算机可读存储介质及终端设备
CN110929525B (zh) 一种网贷风险行为分析检测方法、装置、设备和存储介质
US8799237B2 (en) Identification disambiguation in databases
CN111460011A (zh) 页面数据展示方法、装置、服务器及存储介质
CN110175318B (zh) 一种保险理赔附件生成方法及装置
CN110083731B (zh) 图像检索方法、装置、计算机设备及存储介质
CN111259056A (zh) 一种区块链数据查询方法、系统及相关设备
CN108536665A (zh) 一种确定语句一致性的方法及装置
CN113032524A (zh) 商标侵权识别方法、终端设备及存储介质
CN111221690B (zh) 针对集成电路设计的模型确定方法、装置及终端
CN109829048B (zh) 电子装置、访谈辅助方法和计算机可读存储介质
CN105630762A (zh) 辨识机密数据的方法及电子装置
CN108304467A (zh) 用于文本间匹配的方法
CN114531340A (zh) 日志获取方法、装置、电子设备、芯片及存储介质
CN110990810B (zh) 一种用户操作数据处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant