CN115952547B - 基于协议分析的数据库脱敏装置及方法 - Google Patents

基于协议分析的数据库脱敏装置及方法 Download PDF

Info

Publication number
CN115952547B
CN115952547B CN202310114587.8A CN202310114587A CN115952547B CN 115952547 B CN115952547 B CN 115952547B CN 202310114587 A CN202310114587 A CN 202310114587A CN 115952547 B CN115952547 B CN 115952547B
Authority
CN
China
Prior art keywords
desensitization
data
database
user
field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310114587.8A
Other languages
English (en)
Other versions
CN115952547A (zh
Inventor
朱燚
庄恩贵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingan Yun Xin Technology Co ltd
Original Assignee
Beijing Jingan Yun Xin Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingan Yun Xin Technology Co ltd filed Critical Beijing Jingan Yun Xin Technology Co ltd
Priority to CN202310114587.8A priority Critical patent/CN115952547B/zh
Publication of CN115952547A publication Critical patent/CN115952547A/zh
Application granted granted Critical
Publication of CN115952547B publication Critical patent/CN115952547B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明涉及数据脱敏技术领域,尤其涉及一种基于协议分析的数据库脱敏装置及方法,在目标数据库连接有一数据库脱敏装置,并通过所述数据库脱敏装置对用户的请求数据进行数据脱敏后发送至用户,本发明提供的数据库脱敏方法对于现有的数据库、客户端及应用程序无需进行改动,通过设置在数据库数据出口端的数据库脱敏装置对用户的数据请求进行分析以对返回的需求数据进行脱敏后传递至用户端,使得用户获得需求数据的原始状态即为脱敏后的数据,实现了数据层面的脱敏,避免了原始数据从数据库流出造成隐私泄露。

Description

基于协议分析的数据库脱敏装置及方法
技术领域
本发明涉及数据脱敏技术领域,尤其涉及一种基于协议分析的数据库脱敏装置及方法。
背景技术
在大数据环境中,数据的海量、异构、实时处理将成为常态,能够在不影响数据使用的前提下,在用户层面实现数据屏蔽、加密、隐藏、审计或内容封锁的动态脱敏具有更强的优势。动态脱敏基于横向或纵向的安全等级要求,依据用户角色、职责和其他规则变换敏感数据,其能力的发挥对大数据的广泛、合规性应用至关重要。
现有技术中动态数据脱敏目前集中在应用层,主要对数据在应用、页面中的展示进行脱敏,其虽然能够实现对用户的数据脱敏,但是由于其可以被数据库工具直接绕过,因而存在数据泄露风险。
中国专利公开号CN112417476A公开了一种敏感数据的脱敏方法及数据脱敏系统,供客户业务系统调用,数据脱敏系统的脱敏方法包括:1)获取数据加载连接配置以及所述数据脱敏系统的链接地址;连接源数据库;2)拦截客户业务系统向所述数据脱敏系统发送的数据操作请求,以及数据加载连接配置向源数据库获取的待处理数据;3)分析出符合的敏感字段数据;解析形成AST语法树;4)将上述分析出的敏感字段数据与所述数据操作请求以及待处理数据进行比对,脱敏处理,得到最终的脱敏数据;5)将脱敏数据发送至目标数据库。由此可见,上述技术方案用于分布式客户端使用,其能够将客户端的数据脱敏后保存在目标数据库中,能够应用于上传数据至数据库中,但是,若数据库中保存了原始未脱敏数据,在客户端进行数据访问时,无法对数据进行脱敏处理,或仅在用户应用层进行数据脱敏后展示,由于能够获得原始数据,可能造成敏感数据泄漏。
发明内容
为此,本发明提供一种基于协议分析的数据库脱敏装置及方法,用以克服现有技术中仅在数据应用层进行数据脱敏导致的敏感数据泄露的问题。
为实现上述目的,一方面,本发明提供一种基于协议分析的数据库脱敏方法,在目标数据库连接有一数据库脱敏装置,并通过所述数据库脱敏装置对用户的请求数据进行数据脱敏后发送至用户,
所述数据库脱敏方法包括:
步骤S1,在所述数据库脱敏装置中根据目标数据库定义对数据脱敏策略进行预定义;
步骤S2,所述数据库脱敏装置接收用户对所述目标数据库的数据请求,并根据请求分析策略判断所述数据请求是否触发所述数据脱敏策略;
步骤S3,在第一预设条件下对所述目标数据库返回的用户需求数据执行数据脱敏分析,确定若干脱敏关键字段;
步骤S4,在第二预设条件下使用所述脱敏关键字段在所述用户需求数据中检索是否存在关联字段以确认关联脱敏字段,
步骤S5,根据所述脱敏关键字段和所述关联脱敏字段对所述用户需求数据进行敏感数据字段提取形成敏感数据包,并根据单个所述脱敏关键字段确认的关联脱敏字段的占比确认所述敏感数据字段的脱敏执行方式;
步骤S6,对所述用户需求数据按所述脱敏执行方式进行脱敏后生成返回数据,并将所述返回数据返回至用户;
步骤S7,根据用户的敏感级别,确定是否向用户发送所述敏感数据包中的关联脱敏字段内容;
步骤S8,在第三预设条件下将所述敏感数据包中的脱敏关键字段进行全隐藏并将关联脱敏字段依据脱敏协议中约定的加密方式进行加密运算以形成密文包,并将所述密文包发送至约定地址;
其中,所述第一预设条件为所述数据请求触发所述数据脱敏策略;
所述第二预设条件为所述脱敏关键字段确认完成;
所述第三预设条件为判定向用户发送所述敏感数据包中的关联脱敏字段内容;
所述数据脱敏策略包括敏感数据索引集以及与所述敏感数据索引集对应的数据脱敏规则,所述敏感数据索引集包含脱敏数据类别和脱敏关键字。
进一步地,所述数据库脱敏装置设置在用户与所述目标数据库之间,采用网关形式串入连接,并且,所述数据库脱敏装置设置在所述目标数据库的前端,其作为所述目标数据库与用户之间信息传递的中转点,用以接收用户对所述目标数据库的数据请求并识别用户数据请求的发送地址,执行数据脱敏策略,以及,返回脱敏后的用户需求数据。
进一步地,在所述步骤S1中,预定义所述数据脱敏策略的步骤包括:
步骤S11,获取所述目标数据库的数据库定义以确定数据库中数据类型和数据字段;
步骤S12,根据所述数据库定义在所述数据库脱敏装置设置对应的数据脱敏策略;
其中,所述数据库定义包括数据字段和数据类型。
进一步地,在所述步骤S2中,所述请求分析策略包括:
步骤S21,所述数据库脱敏装置对所述数据请求进行分析,将所述数据请求解析为所述数据请求对应的所述用户需求数据的数据字段和数据类型;
步骤S22,所述数据库脱敏装置通过判断所述数据字段和所述数据类型是否处于敏感数据索引集以判断所述数据请求是否触发所述数据脱敏策略,
若所述数据字段和/或所述数据类型属于所述敏感数据索引集,则判定所述数据请求触发所述数据脱敏策略;
若所述数据字段和所述数据类型中任一均未不属于所述敏感数据索引集,则判定所述数据请求不触发所述数据脱敏策略。
进一步地,在所述步骤S3中,确定脱敏关键字段的步骤包括:
步骤S31,所述数据库脱敏装置将所述数据请求发送至所述目标数据库并接收所述目标数据库返回的所述用户需求数据;
步骤S32,在所述第一预设条件下,所述数据库脱敏装置解析采用所述敏感数据索引集对所述用户需求数据中的数据字段和数据类型与进行查找以确定若干脱敏关键字段。
进一步地,在所述步骤S4中,所述关联脱敏字段为能够唯一对应所述脱敏关键字段中敏感数据若干指代特征中的至少一个指代特征的字段,单个所述脱敏关键字段设置有对应的关联脱敏字段集,关联字段集中包括关联脱敏字段的类型和若干关联脱敏词。
进一步地,在所述步骤S5中,形成敏感数据包的步骤包括:
步骤S51,在所述用户需求数据中依次提取单个所述脱敏关键字段以形成第一敏感数据包;
步骤S52,对单个所述脱敏关键字段对应的所述关联脱敏字段进行检索,并与对应的脱敏关键字段的指代特征进行匹配,若指代特征匹配,则将该关联脱敏字段提取至第二敏感数据包中;
步骤S53,将依次完成提取的所述第一敏感数据包和所述第二敏感数据包合并形成所述敏感数据包。
进一步地,在所述步骤S5中,根据单个所述脱敏关键字段确认的关联脱敏字段的占比b与预设占比标准的比对结果确认所述敏感数据字段的脱敏执行方式,所述数据库脱敏装置中设置有对应第i个脱敏关键字段的预设占比标准Bi,设定b=n1/n0,其中,n1为第i个脱敏关键字段对应的关联脱敏字段指代特征的数量,n0为第i个脱敏关键字段对应的指代特征的总数量,
若b<Bi,所述数据库脱敏装置判定敏感关联度低并采用第一脱敏执行方式;
若b≥Bi,所述数据库脱敏装置判定敏感关联度高并采用第二脱敏执行方式;
其中,所述第一脱敏执行方式为执行第一预设数据脱敏规则,将所述用户需求数据中的脱敏关键字段以及关联脱敏字段按预设替换位数进行脱敏替换;
所述第二脱敏执行方式为执行第二预设数据脱敏规则,将所述用户需求数据中的脱敏关键字段以及关联脱敏字段按全部位数进行脱敏替换。
进一步地,在所述步骤S7中,用户敏感级别的确认方式包括:
步骤S71,所述数据库脱敏装置向用户发送身份确认单;
步骤S72,所述数据库脱敏装置接收用户发送的身份确认信息;
步骤S73,所述数据库脱敏装置根据所述身份确认信息的完整程度确定用户的敏感等级;
其中,所述敏感等级包括第一敏感等级、第二敏感等级和第三敏感等级,且,
所述第一敏感等级满足所述完整程度处于第一区间;
所述第二敏感等级满足所述完整程度处于第二区间;
所述第三敏感等级满足所述完整程度处于第三区间;
所述第一区间、所述第二区间和所述第三区间互相不包含;
其中,所述身份确认信息中的信息类型≥3类。
进一步地,在所述步骤S7中,根据用户的敏感级别确定是否向用户发送所述敏感数据包中的关联脱敏字段内容,
若用户处于所述第一敏感等级,所述数据库脱敏装置判定不向用户发送所述敏感数据包中的关联脱敏字段内容;
若用户处于所述第二敏感等级,所述数据库脱敏装置判定向用户发送所述敏感数据包中的关联脱敏字段内容,并执行所述步骤S8;
若用户处于所述第三敏感等级,所述数据库脱敏装置判定直接向用户发送所述敏感数据包中的关联脱敏字段内容,并将所述第二敏感数据包打包发送至用户发送所述数据请求的地址。
另一方面,本发明提供一种数据库脱敏装置,应用于上述基于协议分析的数据库脱敏方法,所述数据库脱敏装置包括:
请求获取单元,其通过有线和/或无线方式与用户网络连接,用以获取用户对目标数据库的数据请求,以及,获取用户数据请求的发送地址;
请求分析单元,其与所述请求获取单元相连,用以根据请求分析策略对所述数据请求进行分析;
数据库连接单元,其与所述目标数据库相连,用以向所述目标数据库发送所述数据请求,并接收所述目标数据库返回的用户需求数据;
脱敏执行单元,其分别与所述数据库连接单元以及所述请求分析单元相连,用以根据所述请求分析单元对所述数据请求的分析结果对所述用户需求数据执行对应的数据脱敏规则,以生成脱敏后的返回数据;
数据回传单元,其与所述脱敏执行单元相连,用以向用户传递所述返回数据,或在第四预设条件下向用户传递无需脱敏的所述用户需求数据;
其中,所述第四预设条件为所述请求分析单元对所述数据请求的分析结果为不触发数据脱敏策略。
与现有技术相比,本发明的有益效果在于,本发明提供的数据库脱敏方法对于现有的数据库、客户端及应用程序无需进行改动,通过设置在数据库数据出口端的数据库脱敏装置对用户的数据请求进行分析以对返回的需求数据进行脱敏后传递至用户端,使得用户获得需求数据的原始状态即为脱敏后的数据,实现了数据层面的脱敏,避免了原始数据从数据库流出造成隐私泄露。
进一步地,本发明所述数据库脱敏方法在对用户的数据请求进行分析时,能够根据用户发送的身份确认信息为用户配置对应的脱敏后的需求数据,能够满足用户在不同场景的数据需求,进一步扩大了本发明数据库脱敏方法的应用场景。
进一步地,本发明所述数据库脱敏方法能够根据用户的敏感级别为用户生成对应的脱敏文件,并且对于用户身份确认信息的完整程度高的用户采用加密方式传输部分敏感数据以使用户得到的数据更加符合需要,通过发送至预先设定的约定地址,进一步地保证了敏感数据不会被窃取和滥用,保证本发明所述脱敏方法的灵活性。
附图说明
图1为本发明基于协议分析的数据库脱敏方法的步骤示意图;
图2为本发明形成敏感数据包的步骤示意图;
图3为本发明用户敏感级别的确认方式的步骤示意图;
图4为本发明所述数据库脱敏装置的结构框图。
具体实施方式
为了使本发明的目的和优点更加清楚明白,下面结合实施例对本发明作进一步描述;应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。
下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非在限制本发明的保护范围。
需要说明的是,在本发明的描述中,术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方向或位置关系的术语是基于附图所示的方向或位置关系,这仅仅是为了便于描述,而不是指示或暗示所述装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,还需要说明的是,在本发明的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域技术人员而言,可根据具体情况理解上述术语在本发明中的具体含义。
本发明提供一种基于协议分析的数据库脱敏方法,在目标数据库连接有一数据库脱敏装置,并通过所述数据库脱敏装置对用户的请求数据进行数据脱敏后发送至用户;
请参阅图1所示,其为本发明基于协议分析的数据库脱敏方法的步骤示意图,所述数据库脱敏方法包括:
步骤S1,在所述数据库脱敏装置中根据目标数据库定义对数据脱敏策略进行预定义;
步骤S2,所述数据库脱敏装置接收用户对所述目标数据库的数据请求,并根据请求分析策略判断所述数据请求是否触发所述数据脱敏策略;
步骤S3,在第一预设条件下对所述目标数据库返回的用户需求数据执行数据脱敏分析,确定若干脱敏关键字段;
步骤S4,在第二预设条件下使用所述脱敏关键字段在所述用户需求数据中检索是否存在关联字段以确认关联脱敏字段,
步骤S5,根据所述脱敏关键字段和所述关联脱敏字段对所述用户需求数据进行敏感数据字段提取形成敏感数据包,并根据单个所述脱敏关键字段确认的关联脱敏字段的占比确认所述敏感数据字段的脱敏执行方式;
步骤S6,对所述用户需求数据按所述脱敏执行方式进行脱敏后生成返回数据,并将所述返回数据返回至用户;
步骤S7,根据用户的敏感级别,确定是否向用户发送所述敏感数据包中的关联脱敏字段内容;
步骤S8,在第三预设条件下将所述敏感数据包中的脱敏关键字段进行全隐藏并将关联脱敏字段依据脱敏协议中约定的加密方式进行加密运算以形成密文包,并将所述密文包发送至约定地址;
其中,所述第一预设条件为所述数据请求触发所述数据脱敏策略;
所述第二预设条件为所述脱敏关键字段确认完成;
所述第三预设条件为判定向用户发送所述敏感数据包中的关联脱敏字段内容;
所述数据脱敏策略包括敏感数据索引集以及与所述敏感数据索引集对应的数据脱敏规则,所述敏感数据索引集包含脱敏数据类别和脱敏关键字,并且,所述数据脱敏策略符合国家规定。
可以理解的是,所述数据库脱敏装置能够通过指定起始字符、终止字符与脱敏字符支持目标字符串的自由位置脱敏。
具体而言,所述数据库脱敏装置设置在用户与所述目标数据库之间,采用网关形式串入连接,并且,所述数据库脱敏装置设置在所述目标数据库的前端,其作为所述目标数据库与用户之间信息传递的中转点,用以接收用户对所述目标数据库的数据请求并识别用户数据请求的发送地址,执行数据脱敏策略,以及,返回脱敏后的用户需求数据。
具体而言,在所述步骤S1中,预定义所述数据脱敏策略的步骤包括:
步骤S11,获取所述目标数据库的数据库定义以确定数据库中数据类型和数据字段;
步骤S12,根据所述数据库定义在所述数据库脱敏装置设置对应的数据脱敏策略;
其中,所述数据库定义包括数据字段和数据类型。
具体而言,在所述步骤S2中,所述请求分析策略包括:
步骤S21,所述数据库脱敏装置对所述数据请求进行分析,将所述数据请求解析为所述数据请求对应的所述用户需求数据的数据字段和数据类型;
步骤S22,所述数据库脱敏装置通过判断所述数据字段和所述数据类型是否处于敏感数据索引集以判断所述数据请求是否触发所述数据脱敏策略,
若所述数据字段和/或所述数据类型属于所述敏感数据索引集,则判定所述数据请求触发所述数据脱敏策略;
若所述数据字段和所述数据类型中任一均未不属于所述敏感数据索引集,则判定所述数据请求不触发所述数据脱敏策略。
可以理解的是,所述数据库脱敏装置能够支持语句分析,包括:
1.从表中查询
1.1单表:形如select 字段列表 from 表
1.2多表连接查询:形如 select 字段列表 from 多表连接 (含内连接innerjoin,外连接 left or right join)
1.3子查询:形如select 字段列表 from (select 字段列表 from表或子查询)
2.从视图中查询
2.1单表:形如select 字段列表 from 视图
2.2多表连接查询:形如 select 字段列表 from 多视图 (含内连接inner join,外连接 left or right join)
2.3子查询:形如select 字段列表 from (select 字段列表 from视图或子查询)
3.从存储过程及函数中查询 :形如call procedure
具体而言,在所述步骤S3中,确定脱敏关键字段的步骤包括:
步骤S31,所述数据库脱敏装置将所述数据请求发送至所述目标数据库并接收所述目标数据库返回的所述用户需求数据;
步骤S32,在所述第一预设条件下,所述数据库脱敏装置解析采用所述敏感数据索引集对所述用户需求数据中的数据字段和数据类型与进行查找以确定若干脱敏关键字段。
具体而言,在所述步骤S4中,所述关联脱敏字段为能够唯一对应所述脱敏关键字段中敏感数据若干指代特征中的至少一个指代特征的字段,单个所述脱敏关键字段设置有对应的关联脱敏字段集,关联字段集中包括关联脱敏字段的类型和若干关联脱敏词。
例如,脱敏关键字为身份证号码时,对应的身份证号码所有者的出生所在地、年龄、生日等均能与身份证中的某几位数字进行对应,此时,身份证号码的前三位的指代特征对应出生所在地省份信息,身份证号码的第四位至第六位的指代特征对应所有者的省份中对应地区的信息,身份证号码的第七位至第十位的指代特征对应年龄或或出生年份或含年龄的生日信息,身份证号码的第十一位至第十四位的指代特征对应出生日期信息;
再一个例子,脱敏关键字为电话号码时,其前三位指代特征为网络运营商信息,如移动或联通;脱敏关键字为姓名时,其第一位指代特征为姓氏。
请参阅图2所示,其为本发明形成敏感数据包的步骤示意图,在所述步骤S5中,形成敏感数据包的步骤包括:
步骤S51,在所述用户需求数据中依次提取单个所述脱敏关键字段以形成第一敏感数据包;
步骤S52,对单个所述脱敏关键字段对应的所述关联脱敏字段进行检索,并与对应的脱敏关键字段的指代特征进行匹配,若指代特征匹配,则将该关联脱敏字段提取至第二敏感数据包中;
步骤S53,将依次完成提取的所述第一敏感数据包和所述第二敏感数据包合并形成所述敏感数据包。
具体而言,指代特征匹配表示关联脱敏字段对应的指代特征能够对应至脱敏关键字段的对应位置,如脱敏关键字为身份证号码时,则该所有者的生日信息为对应的关联脱敏字段且特征匹配,其他人员的生日信息为对应的关联脱敏字段且特征不匹配。
具体而言,在所述步骤S5中,根据单个所述脱敏关键字段确认的关联脱敏字段的占比b与预设占比标准的比对结果确认所述敏感数据字段的脱敏执行方式,所述数据库脱敏装置中设置有对应第i个脱敏关键字段的预设占比标准Bi,设定b=n1/n0,其中,n1为第i个脱敏关键字段对应的关联脱敏字段指代特征的数量,n0为第i个脱敏关键字段对应的指代特征的总数量,
若b<Bi,所述数据库脱敏装置判定敏感关联度低并采用第一脱敏执行方式;
若b≥Bi,所述数据库脱敏装置判定敏感关联度高并采用第二脱敏执行方式;
其中,所述第一脱敏执行方式为执行第一预设数据脱敏规则,将所述用户需求数据中的脱敏关键字段以及关联脱敏字段按预设替换位数进行脱敏替换;
所述第二脱敏执行方式为执行第二预设数据脱敏规则,将所述用户需求数据中的脱敏关键字段以及关联脱敏字段按全部位数进行脱敏替换。
请参阅图3所示,其为本发明用户敏感级别的确认方式的步骤示意图,在所述步骤S7中,用户敏感级别的确认方式包括:
步骤S71,所述数据库脱敏装置向用户发送身份确认单;
步骤S72,所述数据库脱敏装置接收用户发送的身份确认信息;
步骤S73,所述数据库脱敏装置根据所述身份确认信息的完整程度确定用户的敏感等级;
其中,所述敏感等级包括第一敏感等级、第二敏感等级和第三敏感等级,且,
所述第一敏感等级满足所述完整程度处于第一区间;
所述第二敏感等级满足所述完整程度处于第二区间;
所述第三敏感等级满足所述完整程度处于第三区间;
所述第一区间、所述第二区间和所述第三区间互相不包含;
其中,所述身份确认信息中的信息类型≥3类;
在实施中,将完整程度记为A,A=m/M,M为全部身份确认信息包含的信息量,m为用户发送的身份确认信息的有效量;
例如,若用户发送的身份确认信息的有效量为5个有效确认信息,并且全部身份确认信息包含的信息量为10个,则用户的身份确认信息的完整程度为0.5,
此时,若第一区间∈[0,0.6),第二区间∈[0.6,0.8),第三区间∈[0.8,1],则,确认用户的身份确认信息的完整程度处于第一区间,此时,数据库脱敏装置判定用户处于第一敏感等级。
因而,在例子中,可以理解的是,第一区间、第二区间、第三区间能够根据不同的应用场景进行对应设置。
具体而言,在所述步骤S7中,根据用户的敏感级别确定是否向用户发送所述敏感数据包中的关联脱敏字段内容,
若用户处于所述第一敏感等级,所述数据库脱敏装置判定不向用户发送所述敏感数据包中的关联脱敏字段内容;
若用户处于所述第二敏感等级,所述数据库脱敏装置判定向用户发送所述敏感数据包中的关联脱敏字段内容,并执行所述步骤S8;
若用户处于所述第三敏感等级,所述数据库脱敏装置判定直接向用户发送所述敏感数据包中的关联脱敏字段内容,并将所述第二敏感数据包打包发送至用户发送所述数据请求的地址。
具体而言,在所述步骤S8中,在第三预设条件下将所述敏感数据包中的脱敏关键字段进行全隐藏并将关联脱敏字段依据脱敏协议中约定的加密方式进行加密运算以形成密文包,并将所述密文包发送至约定地址;
其中,约定的加密方式可以设置有若干种,当加密方式大于等于两种时,采用约定加密方式选择规则进行数据加密。并且,本发明所述加密方式不做限定,根据具体的应用场景能够灵活设置。
请参阅图4所示,其为本发明所述数据库脱敏装置的结构框图,本发明提供一种数据库脱敏装置,应用于上述基于协议分析的数据库脱敏方法,所述数据库脱敏装置包括:
请求获取单元,其通过有线和/或无线方式与用户网络连接,用以获取用户对目标数据库的数据请求,以及,获取用户数据请求的发送地址;
请求分析单元,其与所述请求获取单元相连,用以根据请求分析策略对所述数据请求进行分析;
数据库连接单元,其与所述目标数据库相连,用以向所述目标数据库发送所述数据请求,并接收所述目标数据库返回的用户需求数据;
脱敏执行单元,其分别与所述数据库连接单元以及所述请求分析单元相连,用以根据所述请求分析单元对所述数据请求的分析结果对所述用户需求数据执行对应的数据脱敏规则,以生成脱敏后的返回数据;
数据回传单元,其与所述脱敏执行单元相连,用以向用户传递所述返回数据,或在第四预设条件下向用户传递无需脱敏的所述用户需求数据;
其中,所述第四预设条件为所述请求分析单元对所述数据请求的分析结果为不触发数据脱敏策略。
现阶段所述数据库脱敏装置支持的所述目标数据库有如下版本:
1,MySQL5.0及以上版本;
2,Oracle11及以上版本;
3,SQL Server及以上版本。
并且,数据库脱敏装置对用户发送的身份确认信息以及数据请求的分析和处理符合国家相关规定,只限定用于本发明中目标数据库的数据脱敏,不会侵犯包括并不限于个人、用户、相关应用平台以及数据库中任何隐私数据。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
以上所述仅为本发明的优选实施例,并不用于限制本发明;对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种基于协议分析的数据库脱敏方法,其特征在于,目标数据库连接有一数据库脱敏装置并通过所述数据库脱敏装置对用户的请求数据进行数据脱敏后发送至用户,所述数据库脱敏方法包括:
步骤S1,在所述数据库脱敏装置中根据目标数据库定义对数据脱敏策略进行预定义;
步骤S2,所述数据库脱敏装置接收用户对所述目标数据库的数据请求,并根据请求分析策略判断所述数据请求是否触发所述数据脱敏策略;
步骤S3,在第一预设条件下对所述目标数据库返回的用户需求数据执行数据脱敏分析,确定若干脱敏关键字段;
步骤S4,在第二预设条件下使用所述脱敏关键字段在所述用户需求数据中检索是否存在关联字段以确认关联脱敏字段;
步骤S5,根据所述脱敏关键字段和所述关联脱敏字段对所述用户需求数据进行敏感数据字段提取形成敏感数据包,并根据单个所述脱敏关键字段确认的关联脱敏字段的占比确认所述敏感数据字段的脱敏执行方式;
步骤S6,对所述用户需求数据按所述脱敏执行方式进行脱敏后生成返回数据,并将所述返回数据返回至用户;
步骤S7,根据用户的敏感级别,确定是否向用户发送所述敏感数据包中的关联脱敏字段内容;
步骤S8,在第三预设条件下将所述敏感数据包中的脱敏关键字段进行全隐藏并将关联脱敏字段依据脱敏协议中约定的加密方式进行加密运算以形成密文包,并将所述密文包发送至约定地址;
其中,所述第一预设条件为所述数据请求触发所述数据脱敏策略;
所述第二预设条件为所述脱敏关键字段确认完成;
所述第三预设条件为判定向用户发送所述敏感数据包中的关联脱敏字段内容;
所述数据脱敏策略包括敏感数据索引集以及与所述敏感数据索引集对应的数据脱敏规则,所述敏感数据索引集包含脱敏数据类别和脱敏关键字;
在所述步骤S4中,所述关联脱敏字段为能够唯一对应所述脱敏关键字段中敏感数据若干指代特征中的至少一个指代特征的字段,单个所述脱敏关键字段设置有对应的关联脱敏字段集,关联字段集中包括关联脱敏字段的类型和若干关联脱敏词。
2.根据权利要求1所述的基于协议分析的数据库脱敏方法,其特征在于,所述数据库脱敏装置设置在用户与所述目标数据库之间,采用网关形式串入连接,并且,所述数据库脱敏装置设置在所述目标数据库的前端,其作为所述目标数据库与用户之间信息传递的中转点,用以接收用户对所述目标数据库的数据请求并识别用户数据请求的发送地址,执行数据脱敏策略,以及,返回脱敏后的用户需求数据。
3.根据权利要求2所述的基于协议分析的数据库脱敏方法,其特征在于,在所述步骤S2中,所述请求分析策略包括:
步骤S21,所述数据库脱敏装置对所述数据请求进行分析,将所述数据请求解析为所述数据请求对应的所述用户需求数据的数据字段和数据类型;
步骤S22,所述数据库脱敏装置通过判断所述数据字段和所述数据类型是否处于敏感数据索引集以判断所述数据请求是否触发所述数据脱敏策略,
若所述数据字段和/或所述数据类型属于所述敏感数据索引集,则判定所述数据请求触发所述数据脱敏策略;
若所述数据字段和所述数据类型中任一均不属于所述敏感数据索引集,则判定所述数据请求不触发所述数据脱敏策略。
4.根据权利要求3所述的基于协议分析的数据库脱敏方法,其特征在于,在所述步骤S3中,确定脱敏关键字段的步骤包括:
步骤S31,所述数据库脱敏装置将所述数据请求发送至所述目标数据库并接收所述目标数据库返回的所述用户需求数据;
步骤S32,在所述第一预设条件下,所述数据库脱敏装置解析采用所述敏感数据索引集对所述用户需求数据中的数据字段和数据类型进行查找以确定若干脱敏关键字段。
5.根据权利要求4所述的基于协议分析的数据库脱敏方法,其特征在于,在所述步骤S5中,形成敏感数据包的步骤包括:
步骤S51,在所述用户需求数据中依次提取单个所述脱敏关键字段以形成第一敏感数据包;
步骤S52,对单个所述脱敏关键字段对应的所述关联脱敏字段进行检索,并与对应的脱敏关键字段的指代特征进行匹配,若指代特征匹配,则将该关联脱敏字段提取至第二敏感数据包中;
步骤S53,将依次完成提取的所述第一敏感数据包和所述第二敏感数据包合并形成所述敏感数据包。
6.根据权利要求5所述的基于协议分析的数据库脱敏方法,其特征在于,在所述步骤S5中,根据单个所述脱敏关键字段确认的关联脱敏字段的占比b与预设占比标准的比对结果确认所述敏感数据字段的脱敏执行方式,所述数据库脱敏装置中设置有对应第i个脱敏关键字段的预设占比标准Bi,设定b=n1/n0,其中,n1为第i个脱敏关键字段对应的关联脱敏字段指代特征的数量,n0为第i个脱敏关键字段对应的指代特征的总数量,
若b<Bi,所述数据库脱敏装置判定敏感关联度低并采用第一脱敏执行方式;
若b≥Bi,所述数据库脱敏装置判定敏感关联度高并采用第二脱敏执行方式;
其中,所述第一脱敏执行方式为执行第一预设数据脱敏规则,将所述用户需求数据中的脱敏关键字段以及关联脱敏字段按预设替换位数进行脱敏替换;
所述第二脱敏执行方式为执行第二预设数据脱敏规则,将所述用户需求数据中的脱敏关键字段以及关联脱敏字段按全部位数进行脱敏替换。
7.根据权利要求6所述的基于协议分析的数据库脱敏方法,其特征在于,在所述步骤S7中,用户敏感级别的确认方式包括:
步骤S71,所述数据库脱敏装置向用户发送身份确认单;
步骤S72,所述数据库脱敏装置接收用户发送的身份确认信息;
步骤S73,所述数据库脱敏装置根据所述身份确认信息的完整程度确定用户的敏感等级;
其中,所述敏感等级包括第一敏感等级、第二敏感等级和第三敏感等级,且,
所述第一敏感等级满足所述完整程度处于第一区间;
所述第二敏感等级满足所述完整程度处于第二区间;
所述第三敏感等级满足所述完整程度处于第三区间;
所述第一区间、所述第二区间和所述第三区间互相不包含;
其中,所述身份确认信息中的信息类型≥3类。
8.根据权利要求7所述的基于协议分析的数据库脱敏方法,其特征在于,在所述步骤S7中,根据用户的敏感级别确定是否向用户发送所述敏感数据包中的关联脱敏字段内容,
若用户处于所述第一敏感等级,所述数据库脱敏装置判定不向用户发送所述敏感数据包中的关联脱敏字段内容;
若用户处于所述第二敏感等级,所述数据库脱敏装置判定向用户发送所述敏感数据包中的关联脱敏字段内容,并执行所述步骤S8;
若用户处于所述第三敏感等级,所述数据库脱敏装置判定直接向用户发送所述敏感数据包中的关联脱敏字段内容,并将所述第二敏感数据包打包发送至用户发送所述数据请求的地址。
9.一种数据库脱敏装置,应用于权利要求1-8任一项所述的基于协议分析的数据库脱敏方法,其特征在于,包括:
请求获取单元,其通过有线和/或无线方式与用户网络连接,用以获取用户对目标数据库的数据请求以及获取用户数据请求的发送地址;
请求分析单元,其与所述请求获取单元相连,用以根据请求分析策略对所述数据请求进行分析;
数据库连接单元,其与所述目标数据库相连,用以向所述目标数据库发送所述数据请求,并接收所述目标数据库返回的用户需求数据;
脱敏执行单元,其分别与所述数据库连接单元以及所述请求分析单元相连,用以根据所述请求分析单元对所述数据请求的分析结果对所述用户需求数据执行对应的数据脱敏规则,以生成脱敏后的返回数据;
数据回传单元,其与所述脱敏执行单元相连,用以向用户传递所述返回数据,或在第四预设条件下向用户传递无需脱敏的所述用户需求数据;
其中,所述第四预设条件为所述请求分析单元对所述数据请求的分析结果为不触发数据脱敏策略。
CN202310114587.8A 2023-02-15 2023-02-15 基于协议分析的数据库脱敏装置及方法 Active CN115952547B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310114587.8A CN115952547B (zh) 2023-02-15 2023-02-15 基于协议分析的数据库脱敏装置及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310114587.8A CN115952547B (zh) 2023-02-15 2023-02-15 基于协议分析的数据库脱敏装置及方法

Publications (2)

Publication Number Publication Date
CN115952547A CN115952547A (zh) 2023-04-11
CN115952547B true CN115952547B (zh) 2024-04-19

Family

ID=87289357

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310114587.8A Active CN115952547B (zh) 2023-02-15 2023-02-15 基于协议分析的数据库脱敏装置及方法

Country Status (1)

Country Link
CN (1) CN115952547B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117235781A (zh) * 2023-08-21 2023-12-15 广州市玄武无线科技股份有限公司 一种数据脱敏方法、系统、装置及存储介质
CN117093596B (zh) * 2023-10-12 2024-01-12 北京固加数字科技有限公司 一种债券交易数据收集和处理系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111400762A (zh) * 2020-03-18 2020-07-10 上海凯馨信息科技有限公司 一种针对oracle数据库的动态脱敏方法
CN112417476A (zh) * 2020-11-24 2021-02-26 广州华熙汇控小额贷款有限公司 敏感数据的脱敏方法及数据脱敏系统
CN112906024A (zh) * 2021-03-03 2021-06-04 江苏保旺达软件技术有限公司 一种数据脱敏方法、装置、存储介质及服务器
CN114239071A (zh) * 2021-12-27 2022-03-25 江苏苏宁银行股份有限公司 一种基于中英敏感字典的可控并发数据脱敏方法和装置
CN114357498A (zh) * 2020-10-13 2022-04-15 航天信息股份有限公司 一种数据脱敏方法及装置
CN114626092A (zh) * 2022-03-10 2022-06-14 上海上讯信息技术股份有限公司 具有关联关系的多字段数据的脱敏方法、系统、装置及计算机存储介质
CN115238298A (zh) * 2021-04-22 2022-10-25 中移动金融科技有限公司 一种实现数据库敏感字段脱敏的方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9043874B2 (en) * 2012-11-28 2015-05-26 Wal-Mart Stores, Inc. System and method for protecting data in an enterprise environment

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111400762A (zh) * 2020-03-18 2020-07-10 上海凯馨信息科技有限公司 一种针对oracle数据库的动态脱敏方法
CN114357498A (zh) * 2020-10-13 2022-04-15 航天信息股份有限公司 一种数据脱敏方法及装置
CN112417476A (zh) * 2020-11-24 2021-02-26 广州华熙汇控小额贷款有限公司 敏感数据的脱敏方法及数据脱敏系统
CN112906024A (zh) * 2021-03-03 2021-06-04 江苏保旺达软件技术有限公司 一种数据脱敏方法、装置、存储介质及服务器
CN115238298A (zh) * 2021-04-22 2022-10-25 中移动金融科技有限公司 一种实现数据库敏感字段脱敏的方法及装置
CN114239071A (zh) * 2021-12-27 2022-03-25 江苏苏宁银行股份有限公司 一种基于中英敏感字典的可控并发数据脱敏方法和装置
CN114626092A (zh) * 2022-03-10 2022-06-14 上海上讯信息技术股份有限公司 具有关联关系的多字段数据的脱敏方法、系统、装置及计算机存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
A Scheme of Relational Database Desensitization Based on Paillier and FPE;Miao Wu等;《 2021 3rd International Conference on Machine Learning, Big Data and Business Intelligence (MLBDBI)》;20220317;第374-378页 *
大数据环境下的智能数据脱敏系统;陈天莹等;《通信技术》;20160710;第49卷(第07期);第915-922页 *
数据脱敏技术研究及展望;沈传年等;《信息安全与通信保密》;20230228(第02期);第105-116页 *

Also Published As

Publication number Publication date
CN115952547A (zh) 2023-04-11

Similar Documents

Publication Publication Date Title
CN115952547B (zh) 基于协议分析的数据库脱敏装置及方法
US9710868B2 (en) System and methods for identifying compromised personally identifiable information on the internet
CN102598007B (zh) 有效检测采指纹数据和信息的系统和方法
CN107301551B (zh) 一种网络支付前搜索、查询、验证的方法、装置、系统
CA2471940C (en) Real time data warehousing
US7007174B2 (en) System and method for determining user identity fraud using similarity searching
CN111259036A (zh) 一种跨库跨表查询方法、设备、服务器及存储介质
US20040098405A1 (en) System and Method for Automated Link Analysis
CN101345751A (zh) 确定作为数据库活动的起源的应用程序用户
CN102057376B (zh) 用于进行分布式搜索的方法
US20040122807A1 (en) Methods and systems for performing search interpretation
CN111625559B (zh) 一种数据信息多维度查询方法及系统
EP3852332A1 (en) Processing request for personal data with data owner's permission
CN112839077A (zh) 一种敏感数据确定方法及装置
CN111427972A (zh) 搜索业务数据的方法、装置、业务搜索系统和存储介质
CN110737677B (zh) 一种数据搜索系统及方法
CN110784445A (zh) 利用wifi热点分享工具获取目标设备真实mac地址的方法
CN112446011B (zh) 一种水印识别及错误码版权判断方法
CN111738779B (zh) 一种基于标准sql语法的智能合约系统
CN117150569B (zh) 一种银行业务库的安全交互方法和系统
CN116702199A (zh) 数据处理方法、装置、服务器及存储介质
CN113986952A (zh) 数据查询方法、装置、设备与存储介质
CN113283794A (zh) 一种基于地理信息系统的电子政务处理系统
CN116701486A (zh) 一种分布式架构的数据存储和查询系统及方法
CN117390410A (zh) 数据识别方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant