CN114169309A - 修改行为数据表的方法、装置、计算机设备及存储介质 - Google Patents
修改行为数据表的方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN114169309A CN114169309A CN202111522375.0A CN202111522375A CN114169309A CN 114169309 A CN114169309 A CN 114169309A CN 202111522375 A CN202111522375 A CN 202111522375A CN 114169309 A CN114169309 A CN 114169309A
- Authority
- CN
- China
- Prior art keywords
- field
- data table
- behavior data
- audit
- original
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000012550 audit Methods 0.000 claims abstract description 215
- 230000006399 behavior Effects 0.000 claims description 292
- 238000007726 management method Methods 0.000 claims description 42
- 238000000605 extraction Methods 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 8
- 230000011218 segmentation Effects 0.000 claims description 4
- 230000008569 process Effects 0.000 description 10
- 238000012986 modification Methods 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 238000007792 addition Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/194—Calculation of difference between files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/40—Transformation of program code
- G06F8/41—Compilation
- G06F8/42—Syntactic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种修改行为数据表的方法、装置、计算机设备及存储介质,所述方法包括:获取原始行为数据表,以及目标业务审计场景所需的标准审计字段集合;将原始行为数据表中的各个原始字段与标准审计字段集合进行对比,以确定出差异审计字段,并将差异审计字段添加到原始行为数据表中,以得到更新行为数据表;获取与原始行为数据表对应的第一获取语句;基于差异审计字段,在第一获取语句的基础上形成可从用户行为信息中提取差异审计字段的数据的第二获取语句;当监测到用户行为信息时,使用第二获取语句从用户行为信息中提取更新行为数据表中各个字段的数据,并将提取到的数据添加到更新行为数据表中;本发明可以高效、快捷的修改行为数据表。
Description
技术领域
本发明涉及数据处理技术领域,特别涉及一种修改行为数据表的方法、装置、计算机设备及存储介质。
背景技术
在数据库中存在为业务数据表配置的行为数据表,行为数据表用于记录所有用户对业务数据表进行操作而产生的用户行为信息,以便于当业务数据表出现异常时可基于行为数据表中的审计字段进行异常分析和风险处理;但是在实际应用中为了减少行为数据表的开发工程量以及节约数据库的存储空间,往往行为数据表中只包括固定的几种审计字段的审计信息,难以满足在不同业务场景中对审计信息的需求,无法保障数据库中业务数据表的安全性。
因此在现有技术中,需要开发人员手动修改行为数据表,以符合特定业务场景的需求,但是这样会消耗大量人力去对数据库中的每张行为数据表进行逐一修改,效率不高。综上,如何更加高效的修改行为数据表以便于满足不同业务场景中对审计信息的需求成为本领域技术人员亟需解决的技术问题。
发明内容
本发明的目的在于提供一种修改行为数据表的方法、装置、计算机设备及存储介质,能够高效、快捷的修改行为数据表。
根据本发明的一个方面,提供了一种修改行为数据表的方法,该方法包括如下步骤:
获取原始行为数据表,以及目标业务审计场景所需的标准审计字段集合;
将所述原始行为数据表中的各个原始字段与所述标准审计字段集合进行对比,以确定出差异审计字段,并将所述差异审计字段添加到所述原始行为数据表中,以得到更新行为数据表;
获取与所述原始行为数据表对应的第一获取语句;其中,所述第一获取语句用于从用户行为信息中提取所述原始行为数据表中各个原始字段的数据;
基于所述差异审计字段,在所述第一获取语句的基础上形成可从用户行为信息中提取所述差异审计字段的数据的第二获取语句;
当监测到用户行为信息时,使用所述第二获取语句从所述用户行为信息中提取所述更新行为数据表中各个字段的数据,并将提取到的数据添加到所述更新行为数据表中。
可选的,所述将所述原始行为数据表中的各个原始字段与所述标准审计字段集合进行对比,以确定出差异审计字段,并将所述差异审计字段添加到所述原始行为数据表中,以得到更新行为数据表,具体包括:
获取所述原始行为数据表中的所有原始字段;
依次将每个原始字段分别与所述标准审计字段集合中的各个标准审计字段进行两两组合,生成字段对;
分别计算每个字段对中原始字段和标准审计字段的语义相似度;
将语义相似度大于预设阈值的字段对中的原始字段作为所述原始行为数据表的已有审计字段;
将所述标准审计字段集合中除所述已有审计字段之外的标准审计字段作为差异审计字段;
将所述差异审计字段添加到所述原始行为数据表中,以得到更新行为数据表。
可选的,所述分别计算每个字段对中原始字段和标准审计字段的语义相似度,具体包括:
根据预设词典分别获取所述标准审计字段的字段属性和所述原始字段的字段属性;其中,所述字段属性包括:分词结果、词义、词性;
基于所述标准审计字段的字段属性和所述原始字段的字段属性计算出所述字段对的语义相似度。
可选的,所述基于所述差异审计字段,在所述第一获取语句的基础上形成可从用户行为信息中提取所述差异审计字段的数据的第二获取语句,具体包括:
获取与所述原始行为数据表对应的语法树;其中,所述语法树包括多个节点,每个节点对应所述原始行为数据表中的一个原始字段,且每个节点绑定有对应的字段值提取规则;
在所述语法树中为每个差异审计字段新增对应的差异节点,并为每个差异节点绑定对应的字段值提取规则;
对所述语法树中所有节点的字段值提取规则进行编译形成第二获取语句。
可选的,在当监测到用户行为信息时,使用所述第二获取语句从所述用户行为信息中提取所述更新行为数据表中各个字段的数据,并将提取到的数据添加到所述更新行为数据表中之后,所述方法还包括:
按照设定时间间隔,定期将所述更新行为数据表中已有审计字段的数据和差异审计字段的数据形成审计日志,并将所述审计日志发送至审计终端。
可选的,在当监测到用户行为信息时,使用所述第二获取语句从所述用户行为信息中提取所述更新行为数据表中各个字段的数据,并将提取到的数据添加到所述更新行为数据表中之后,所述方法还包括:
判断在所述用户行为信息中是否包含预设的敏感信息,若是,则将使用所述第二获取语句从所述用户行为信息中提取出的所述已有审计字段的数据和所述差异审计字段的数据形成报警信息,并将所述报警信息发送至所述审计终端。
可选的,在当监测到用户行为信息时,使用所述第二获取语句从所述用户行为信息中提取所述更新行为数据表中各个字段的数据,并将提取到的数据添加到所述更新行为数据表中之后,所述方法还包括:
从所述更新行为数据表中获取字段名称为操作者ID的字段值,其中,所述操作者ID的字段值包括:管理ID、个人ID、程序ID;
当所述操作者ID的字段值为管理ID时,从所述更新行为数据表中获取包含所述管理ID的行信息,从用于记录用户行为信息的操作者的线程本地实例中,查找出与所述行信息对应的用户行为信息的操作者的Token管理令牌,并获取与所述Token管理令牌对应的管理账户ID,进而使用所述管理账户ID替换所述行为数据表中的所述管理ID;
当所述操作者ID的字段值为个人ID时,从所述更新行为数据表中获取包含所述个人ID的行信息,从用于记录用户行为信息的操作者的线程本地实例中,查找出与所述行信息对应的用户行为信息的操作者的Token个人令牌,并获取与所述Token个人令牌对应的个人账户ID,进而使用所述个人账户ID替换所述行为数据表中的所述个人ID;
当所述操作者ID的字段值为程序ID时,从所述更新行为数据表中获取包含所述程序ID的行信息,并从数据库中获取与所述程序ID对应的程序的连接字符串,并用所述连接字符串替换所述更新行为数据表中的所述程序ID。
为了实现上述目的,本发明还提供一种修改行为数据表的方法的装置,该装置具体包括以下组成部分:
第一获取模块,用于获取原始行为数据表,以及目标业务审计场景所需的标准审计字段集合;
字段对比模块,用于将所述原始行为数据表中的各个原始字段与所述标准审计字段集合进行对比,以确定出差异审计字段,并将所述差异审计字段添加到所述原始行为数据表中,以得到更新行为数据表;
第二获取模块,用于获取与所述原始行为数据表对应的第一获取语句;其中,所述第一获取语句用于从用户行为信息中提取所述原始行为数据表中各个原始字段的数据;
语句生成模块,用于基于所述差异审计字段,在所述第一获取语句的基础上形成可从用户行为信息中提取所述差异审计字段的数据的第二获取语句;
信息提取模块,用于当监测到用户行为信息时,使用所述第二获取语句从所述用户行为信息中提取所述更新行为数据表中各个字段的数据,并将提取到的数据添加到所述更新行为数据表中。
为了实现上述目的,本发明还提供一种计算机设备,该计算机设备具体包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述介绍的修改行为数据表的方法的步骤。
为了实现上述目的,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述介绍的修改行为数据表的方法的步骤。
本发明提供的修改行为数据表的方法、装置、计算机设备及存储介质,通过计算语义相似度的方式获取原始行为数据表中的已有审计字段,继而得到差异审计字段,根据差异审计字段来改造语法树上用于解析用户行为信息的第一获取语句所在的节点,并生成第二获取语句,进而使用第二获取语句从用户行为信息中提取全部审计字段信息,并填入更新行为数据表中的相应位置,本发明可以高效、快捷的修改行为数据表,并针对不同业务审计场景设置对应的标准审计字段集合,进而有针对性的修改行为数据表以满足各种业务审计场景的需求,保障数据库中业务数据表的安全性。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为实例一提供的修改行为数据表的方法的一种可选的流程示意图;
图2为实例二提供的修改行为数据表的装置的一种可选的程序模块示意图;
图3为实例三提供的计算机设备的一种可选的硬件架构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
本发明实施例提供了一种修改行为数据表的方法,如图1所示,该方法具体包括以下步骤:
步骤S101:获取原始行为数据表,以及目标业务审计场景所需的标准审计字段集合。
其中,所述原始行为数据表用于记录用户对数据库中的业务数据表进行插入、删除、修改等操作时产生的用户行为信息。原始行为数据表包含标准审计字段集合中的部分审计字段,所述原始行为数据表中的一列数据就是一个字段。所述审计字段为行为数据表中用于表征用户行为信息中的操作者、操作时间等审计信息的字段。
在本实施例中,行为数据表中的审计字段可以实时记录用户行为信息,对数据库中的业务数据表进行细粒度的监测和审计,在数据库遭到风险时可以通过分析审计字段的数据对风险进行溯源和记录,以达到追溯风险起因和预防类似风险发生的目的,从而保证数据库的安全性和稳定性。
步骤S102:将所述原始行为数据表中的各个原始字段与所述标准审计字段集合进行对比,以确定出差异审计字段,并将所述差异审计字段添加到所述原始行为数据表中,以得到更新行为数据表。
其中,所述差异审计字段是原始行为数据表中不存在的字段,基于所述原始行为数据表中的各个字段和所述标准审计字段集合,从所述标准审计字段集合中确定出不包含在所述原始行为数据表中的差异审计字段,并将所述差异审计字段添加到所述原始行为数据表中,以得到更新数据表。
具体的,所述将所述原始行为数据表中的各个原始字段与所述标准审计字段集合进行对比,以确定出差异审计字段,并将所述差异审计字段添加到所述原始行为数据表中,以得到更新行为数据表,包括以下步骤:
步骤A1:获取所述原始行为数据表中的所有原始字段;
步骤A2:依次将每个原始字段分别与所述标准审计字段集合中的各个标准审计字段进行两两组合,生成字段对;
步骤A3:分别计算每个字段对中原始字段和标准审计字段的语义相似度;
进一步的,所述步骤A3,具体包括以下步骤:
步骤A31:根据预设词典分别获取所述标准审计字段的字段属性和所述原始字段的字段属性;其中,所述字段属性包括:分词结果、词义、词性;
步骤A32:基于所述标准审计字段的字段属性和所述原始字段的字段属性计算出所述字段对的语义相似度。
步骤A4:将语义相似度大于预设阈值的字段对中的原始字段作为所述原始行为数据表的已有审计字段;
步骤A5:将所述标准审计字段集合中除所述已有审计字段之外的标准审计字段作为差异审计字段;
步骤A6:将所述差异审计字段添加到所述原始行为数据表中,以得到更新行为数据表。
在本实施例中,原始行为数据表中只存在目标业务审计场景所需的标准审计字段集合中的部分审计字段,无法满足目标审计场景的需求,并且由于开发人员对原始行为数据表中审计字段的名称的命名习惯不尽相同,所以用于表征相同审计字段的名称可以有多种表现形式,例如,一个审计字段用于表征操作时间,会存在Audit_Time、Operate_Time或Create_Time等多种不同的名称,所以存在难以直接从原始行为数据表获取已有审计字段的技术问题,也就难以确认该原始行为数据表与标准审计字段集合相比的差异审计字段。所以在本实施例中,使用计算标准审计字段和原始字段的语义相似度的方法,确定出已有审计字段和差异审计字段,进而基于差异审计字段更新原始行为数据表以得到更新行为数据表。
步骤S103:获取与所述原始行为数据表对应的第一获取语句;其中,所述第一获取语句用于从用户行为信息中提取所述原始行为数据表中各个原始字段的数据。
其中,所述第一获取语句是由与原始行为数据表对应的语法树生成的,语法树包括多个已有节点,每个已有节点对应所述原始行为数据表中的一个原始字段,且每个已有节点绑定有对应的字段值提取规则,第一获取语句由语法树生成的多条SQL语句构成,每条SQL语句用于从用户行为信息中提取所述原始行为数据表中一个原始字段的对应的数据,并将提取的数据填入原始行为数据表中的相应位置。
步骤S104:基于所述差异审计字段,在所述第一获取语句的基础上形成可从用户行为信息中提取所述差异审计字段的数据的第二获取语句。
其中,所述第二获取语句是由语法树中的节点生成的,该节点与更新行为数据表相对应,第二获取语句由各个节点对应的字段值提取规则构成。
具体的,所述基于所述差异审计字段,在所述第一获取语句的基础上形成可从用户行为信息中提取所述差异审计字段的数据的第二获取语句,包括以下步骤:
步骤B1:获取与所述原始行为数据表对应的语法树;其中,所述语法树包括多个已有节点,每个已有节点对应所述原始行为数据表中的一个原始字段,且每个已有节点绑定有对应的字段值提取规则;
步骤B2:在所述语法树中为每个差异审计字段新增对应的差异节点,并为每个差异节点绑定对应的字段值提取规则;
其中,所述差异节点需要添加在已有节点的相同位置,并根据差异审计字段生成字段值提取规则,字段值提取规则从用户行为信息中提取与差异审计字段对应的字段值,并将该字段值填入更新行为数据表中的对应位置。
步骤B3:对所述语法树中所有节点的字段值提取规则进行编译形成第二获取语句。
在本实施例中,通过修改与所述原始行为数据表对应的语法树,在语法树中添加差异节点,达到了生成第二获取语句的目的,以实现在用户行为信息中提取到与目标业务审计场景所需的所有标准审计字段,从而完成对目标业务审计场景进行完整的审计操作,这种修改语法树的操作可以对数据库中的行为数据表同时进行更新,提高了生成第二获取语句的效率。
步骤S105:当监测到用户行为信息时,使用所述第二获取语句从所述用户行为信息中提取所述更新行为数据表中各个字段的数据,并将提取到的数据添加到所述更新行为数据表中。
其中,所述用户行为信息是通过数据库触发器(Trigger)进行监测的,数据库触发器对数据库中的业务数据表进行监测,当用户登录数据库并对业务数据表进行增加、删除、修改等改动操作时,数据库触发器会获取执行所述改动操作的用户行为信息,并使用第二获取语句对所述用户行为信息进行提取。
进一步的,在所述步骤S105之后,所述方法还包括:
按照设定时间间隔,定期将所述更新行为数据表中已有审计字段的数据和差异审计字段的数据形成审计日志,并将所述审计日志发送至审计终端。
在本实施例中,按照设定时间间隔的方式生成审计日志,可以规律性的对更新行为数据表中审计字段进行汇编,以便运维人员在数据库运行过程中可以对用户行为信息进行查验,以及时发现异常数据变动、用户风险行为和数据库宕机情况,进而可以根据审计日志进行风险预警,达到规避风险的目的,从而保障数据库的安全性和稳定性。
更进一步的,在所述步骤S105之后,所述方法还包括:
判断在所述用户行为信息中是否包含预设的敏感信息,若是,则将使用所述第二获取语句从所述用户行为信息中提取出的所述已有审计字段的数据和所述差异审计字段的数据形成报警信息,并将所述报警信息发送至所述审计终端。
在本实施例中可以按照设定时间间隔将所述行为数据表中所有审计字段的数据打包成审计日志发送至审计终端,也可以当发现包含敏感信息的用户行为信息时,及时的将该用户行为信息在各个审计字段下的数据打包成报警信息发送至审计终端。
此外,在所述步骤S105之后,所述方法还包括:
步骤C1:从所述更新行为数据表中获取字段名称为操作者ID的字段值,其中,所述操作者ID的字段值包括:管理ID、个人ID、程序ID;
步骤C2:当所述操作者ID的字段值为管理ID时,从所述更新行为数据表中获取包含所述管理ID的行信息,从用于记录用户行为信息的操作者的线程本地实例中,查找出与所述行信息对应的用户行为信息的操作者的Token管理令牌,并获取与所述Token管理令牌对应的管理账户ID,进而使用所述管理账户ID替换所述行为数据表中的所述管理ID;
其中,所述线程本地实例(ThreadLocal)里面存有在数据库中登录并对数据库中的业务数据表进行修改的操作者的Token令牌,当操作者登录数据库时,数据库会将操作者的Token令牌存放到线程本地实例,以供随时查验。
具体的,数据库中存在用于记录Token管理令牌的管理系统,一个Token管理令牌对应着一个操作者的管理账户,在操作者使用该管理账户登录数据库并对数据库中的业务数据表进行增加、删除、修改操作时,是通过数据库中内置的固定账户直接进行数据交互的,因此用户行为信息中无法获取操作者的管理账户,只能获取到内置的三个固定账户(管理ID、个人ID、程序ID)中的任意一个固定账户,所以需要获取Token管理令牌来查询操作者的实际账户。
步骤C3:当所述操作者ID的字段值为个人ID时,从所述更新行为数据表中获取包含所述个人ID的行信息,从用于记录用户行为信息的操作者的线程本地实例中,查找出与所述行信息对应的用户行为信息的操作者的Token个人令牌,并获取与所述Token个人令牌对应的个人账户ID,进而使用所述个人账户ID替换所述行为数据表中的所述个人ID;
步骤C4:当所述操作者ID的字段值为程序ID时,从所述更新行为数据表中获取包含所述程序ID的行信息,并从数据库中获取与所述程序ID对应的程序的连接字符串,并用所述连接字符串替换所述更新行为数据表中的所述程序ID。
其中,当操作者ID的字段值为程序ID时,说明是系统中的程序在对数据库中的行为数据表进行增加、删除、修改等操作,由于程序不携带Token令牌,所以只需从数据库中获取与程序ID对应的程序的连接字符串,即可使用该连接字符串替换程序ID。
具体的,所述操作者ID在实际使用数据库的过程中,由于与数据库直接建立连接的账号为内置在数据库中的固定账号,所以真实存在以下三个账号程序ID、管理ID、个人ID,但实际上通过这三个账号进行对业务数据表的增加、删除、修改操作的操作者可能是千上万个真实的人或程序,所以在使用第二获取语句从用户行为信息中获取审计字段的数据的过程中,只能获取到程序ID或管理ID或个人ID这三个账号中的一个,无法定位更加详细的操作者,所以需要根据这三个账号,在线程本地实例(Dump文件)中获取与该账号对应的Token令牌,根据Token令牌可以获取对应的实际账户ID,以达到定位真实操作者的目的。
在本实施例中,通过计算语义相似度的方式获取原始行为数据表中的已有审计字段,继而得到差异审计字段,根据差异审计字段来改造语法树上用于解析用户行为信息的第一获取语句所在的节点,并生成第二获取语句,进而使用第二获取语句从用户行为信息中提取全部审计字段信息,并填入更新行为数据表中的相应位置,同时,按照设定时间间隔生成审计日志以供查验。本发明可以高效、快捷的修改行为数据表,并针对不同业务审计场景设置对应的标准审计字段集合,进而有针对性的修改行为数据表以满足各种业务审计场景的需求,保障数据库的安全性和稳定性。
实施例二
基于上述实施例一中提供的修改行为数据表的方法,本实施例中提供一种修改行为数据表的装置,具体地,图2示出了该修改行为数据表的装置的可选的结构框图,该修改行为数据表的装置被分割成一个或多个程序模块,一个或者多个程序模块被存储于存储介质中,并由一个或多个处理器所执行,以完成本发明。本发明所称的程序模块是指能够完成特定功能的一系列计算机程序指令段,比程序本身更适合描述修改行为数据表的装置在存储介质中的执行过程,以下描述将具体介绍本实施例各程序模块的功能。
如图2所示,所述修改行为数据表的装置,具体包括以下组成部分:
第一获取模块201,用于获取原始行为数据表,以及目标业务审计场景所需的标准审计字段集合;
字段对比模块202,用于将所述原始行为数据表中的各个原始字段与所述标准审计字段集合进行对比,以确定出差异审计字段,并将所述差异审计字段添加到所述原始行为数据表中,以得到更新行为数据表;
第二获取模块203,用于获取与所述原始行为数据表对应的第一获取语句;其中,所述第一获取语句用于从用户行为信息中提取所述原始行为数据表中各个原始字段的数据;
语句生成模块204,用于基于所述差异审计字段,在所述第一获取语句的基础上形成可从用户行为信息中提取所述差异审计字段的数据的第二获取语句;
信息提取模块205,用于当监测到用户行为信息时,使用所述第二获取语句从所述用户行为信息中提取所述更新行为数据表中各个字段的数据,并将提取到的数据添加到所述更新行为数据表中。
具体的,所述字段对比模块202,具体用于:
获取所述原始行为数据表中的所有原始字段;依次将每个原始字段分别与所述标准审计字段集合中的各个标准审计字段进行两两组合,生成字段对;分别计算每个字段对中原始字段和标准审计字段的语义相似度;将语义相似度大于预设阈值的字段对中的原始字段作为所述原始行为数据表的已有审计字段;将所述标准审计字段集合中除所述已有审计字段之外的标准审计字段作为差异审计字段;将所述差异审计字段添加到所述原始行为数据表中,以得到更新行为数据表。
此外,所述字段对比模块202在实现所述分别计算每个字段对中原始字段和标准审计字段的语义相似度的步骤时,具体用于:
根据预设词典分别获取所述标准审计字段的字段属性和所述原始字段的字段属性;其中,所述字段属性包括:分词结果、词义、词性;基于所述标准审计字段的字段属性和所述原始字段的字段属性计算出所述字段对的语义相似度。
进一步的,所述语句生成模块204,具体用于:
获取与所述原始行为数据表对应的语法树;其中,所述语法树包括多个节点,每个节点对应所述原始行为数据表中的一个原始字段,且每个节点绑定有对应的字段值提取规则;在所述语法树中为每个差异审计字段新增对应的差异节点,并为每个差异节点绑定对应的字段值提取规则;对所述语法树中所有节点的字段值提取规则进行编译形成第二获取语句。
进一步的,所述装置,还包括:
日志生成模块,用于按照设定时间间隔,定期将所述更新行为数据表中已有审计字段的数据和差异审计字段的数据形成审计日志,并将所述审计日志发送至审计终端。
此外,所述装置,还包括:
告警模块,用于判断在所述用户行为信息中是否包含预设的敏感信息,若是,则将使用所述第二获取语句从所述用户行为信息中提取出的所述已有审计字段的数据和所述差异审计字段的数据形成报警信息,并将所述报警信息发送至所述审计终端。
更进一步的,所述装置,还包括:
字段替换模块,用于从所述更新行为数据表中获取字段名称为操作者ID的字段值,其中,所述操作者ID的字段值包括:管理ID、个人ID、程序ID;当所述操作者ID的字段值为管理ID时,从所述更新行为数据表中获取包含所述管理ID的行信息,从用于记录用户行为信息的操作者的线程本地实例中,查找出与所述行信息对应的用户行为信息的操作者的Token管理令牌,并获取与所述Token管理令牌对应的管理账户ID,进而使用所述管理账户ID替换所述行为数据表中的所述管理ID;当所述操作者ID的字段值为个人ID时,从所述更新行为数据表中获取包含所述个人ID的行信息,从用于记录用户行为信息的操作者的线程本地实例中,查找出与所述行信息对应的用户行为信息的操作者的Token个人令牌,并获取与所述Token个人令牌对应的个人账户ID,进而使用所述个人账户ID替换所述行为数据表中的所述个人ID;当所述操作者ID的字段值为程序ID时,从所述更新行为数据表中获取包含所述程序ID的行信息,并从数据库中获取与所述程序ID对应的程序的连接字符串,并用所述连接字符串替换所述更新行为数据表中的所述程序ID。
实施例三
本实施例还提供一种计算机设备,如可以执行程序的智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)等。如图3所示,本实施例的计算机设备30至少包括但不限于:可通过系统总线相互通信连接的存储器301、处理器302。需要指出的是,图3仅示出了具有组件301-302的计算机设备30,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
本实施例中,存储器301(即可读存储介质)包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器301可以是计算机设备30的内部存储单元,例如该计算机设备30的硬盘或内存。在另一些实施例中,存储器301也可以是计算机设备30的外部存储设备,例如该计算机设备30上配备的插接式硬盘,智能存储卡(SmartMediaCard,SMC),安全数字(SecureDigital,SD)卡,闪存卡(FlashCard)等。当然,存储器301还可以既包括计算机设备30的内部存储单元也包括其外部存储设备。在本实施例中,存储器301通常用于存储安装于计算机设备30的操作系统和各类应用软件。此外,存储器301还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器302在一些实施例中可以是中央处理器(CentralProcessingUnit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器302通常用于控制计算机设备30的总体操作。
具体的,在本实施例中,处理器302用于执行存储器301中存储的修改行为数据表的方法的程序,所述修改行为数据表的方法的程序被执行时实现如下步骤:
获取原始行为数据表,以及目标业务审计场景所需的标准审计字段集合;
将所述原始行为数据表中的各个原始字段与所述标准审计字段集合进行对比,以确定出差异审计字段,并将所述差异审计字段添加到所述原始行为数据表中,以得到更新行为数据表;
获取与所述原始行为数据表对应的第一获取语句;其中,所述第一获取语句用于从用户行为信息中提取所述原始行为数据表中各个原始字段的数据;
基于所述差异审计字段,在所述第一获取语句的基础上形成可从用户行为信息中提取所述差异审计字段的数据的第二获取语句;
当监测到用户行为信息时,使用所述第二获取语句从所述用户行为信息中提取所述更新行为数据表中各个字段的数据,并将提取到的数据添加到所述更新行为数据表中。
上述方法步骤的具体实施例过程可参见第一实施例,本实施例在此不再重复赘述。
实施例四
本实施例还提供一种计算机可读存储介质,如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等,其上存储有计算机程序,所述计算机程序被处理器执行时实现如下方法步骤:
获取原始行为数据表,以及目标业务审计场景所需的标准审计字段集合;
将所述原始行为数据表中的各个原始字段与所述标准审计字段集合进行对比,以确定出差异审计字段,并将所述差异审计字段添加到所述原始行为数据表中,以得到更新行为数据表;
获取与所述原始行为数据表对应的第一获取语句;其中,所述第一获取语句用于从用户行为信息中提取所述原始行为数据表中各个原始字段的数据;
基于所述差异审计字段,在所述第一获取语句的基础上形成可从用户行为信息中提取所述差异审计字段的数据的第二获取语句;
当监测到用户行为信息时,使用所述第二获取语句从所述用户行为信息中提取所述更新行为数据表中各个字段的数据,并将提取到的数据添加到所述更新行为数据表中。
上述方法步骤的具体实施例过程可参见第一实施例,本实施例在此不再重复赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种修改行为数据表的方法,其特征在于,所述方法包括:
获取原始行为数据表,以及目标业务审计场景所需的标准审计字段集合;
将所述原始行为数据表中的各个原始字段与所述标准审计字段集合进行对比,以确定出差异审计字段,并将所述差异审计字段添加到所述原始行为数据表中,以得到更新行为数据表;
获取与所述原始行为数据表对应的第一获取语句;其中,所述第一获取语句用于从用户行为信息中提取所述原始行为数据表中各个原始字段的数据;
基于所述差异审计字段,在所述第一获取语句的基础上形成可从用户行为信息中提取所述差异审计字段的数据的第二获取语句;
当监测到用户行为信息时,使用所述第二获取语句从所述用户行为信息中提取所述更新行为数据表中各个字段的数据,并将提取到的数据添加到所述更新行为数据表中。
2.根据权利要求1所述的修改行为数据表的方法,其特征在于,所述将所述原始行为数据表中的各个原始字段与所述标准审计字段集合进行对比,以确定出差异审计字段,并将所述差异审计字段添加到所述原始行为数据表中,以得到更新行为数据表,具体包括:
获取所述原始行为数据表中的所有原始字段;
依次将每个原始字段分别与所述标准审计字段集合中的各个标准审计字段进行两两组合,生成字段对;
分别计算每个字段对中原始字段和标准审计字段的语义相似度;
将语义相似度大于预设阈值的字段对中的原始字段作为所述原始行为数据表的已有审计字段;
将所述标准审计字段集合中除所述已有审计字段之外的标准审计字段作为差异审计字段;
将所述差异审计字段添加到所述原始行为数据表中,以得到更新行为数据表。
3.根据权利要求2所述的修改行为数据表的方法,其特征在于,所述分别计算每个字段对中原始字段和标准审计字段的语义相似度,具体包括:
根据预设词典分别获取所述标准审计字段的字段属性和所述原始字段的字段属性;其中,所述字段属性包括:分词结果、词义、词性;
基于所述标准审计字段的字段属性和所述原始字段的字段属性计算出所述字段对的语义相似度。
4.根据权利要求1所述的修改行为数据表的方法,其特征在于,所述基于所述差异审计字段,在所述第一获取语句的基础上形成可从用户行为信息中提取所述差异审计字段的数据的第二获取语句,具体包括:
获取与所述原始行为数据表对应的语法树;其中,所述语法树包括多个节点,每个节点对应所述原始行为数据表中的一个原始字段,且每个节点绑定有对应的字段值提取规则;
在所述语法树中为每个差异审计字段新增对应的差异节点,并为每个差异节点绑定对应的字段值提取规则;
对所述语法树中所有节点的字段值提取规则进行编译形成第二获取语句。
5.根据权利要求2所述的修改行为数据表的方法,其特征在于,在当监测到用户行为信息时,使用所述第二获取语句从所述用户行为信息中提取所述更新行为数据表中各个字段的数据,并将提取到的数据添加到所述更新行为数据表中之后,所述方法还包括:
按照设定时间间隔,定期将所述更新行为数据表中已有审计字段的数据和差异审计字段的数据形成审计日志,并将所述审计日志发送至审计终端。
6.根据权利要求5所述的修改行为数据表的方法,其特征在于,在当监测到用户行为信息时,使用所述第二获取语句从所述用户行为信息中提取所述更新行为数据表中各个字段的数据,并将提取到的数据添加到所述更新行为数据表中之后,所述方法还包括:
判断在所述用户行为信息中是否包含预设的敏感信息,若是,则将使用所述第二获取语句从所述用户行为信息中提取出的所述已有审计字段的数据和所述差异审计字段的数据形成报警信息,并将所述报警信息发送至所述审计终端。
7.根据权利要求1所述的修改行为数据表的方法,其特征在于,在当监测到用户行为信息时,使用所述第二获取语句从所述用户行为信息中提取所述更新行为数据表中各个字段的数据,并将提取到的数据添加到所述更新行为数据表中之后,所述方法还包括:
从所述更新行为数据表中获取字段名称为操作者ID的字段值,其中,所述操作者ID的字段值包括:管理ID、个人ID、程序ID;
当所述操作者ID的字段值为管理ID时,从所述更新行为数据表中获取包含所述管理ID的行信息,从用于记录用户行为信息的操作者的线程本地实例中,查找出与所述行信息对应的用户行为信息的操作者的Token管理令牌,并获取与所述Token管理令牌对应的管理账户ID,进而使用所述管理账户ID替换所述行为数据表中的所述管理ID;
当所述操作者ID的字段值为个人ID时,从所述更新行为数据表中获取包含所述个人ID的行信息,从用于记录用户行为信息的操作者的线程本地实例中,查找出与所述行信息对应的用户行为信息的操作者的Token个人令牌,并获取与所述Token个人令牌对应的个人账户ID,进而使用所述个人账户ID替换所述行为数据表中的所述个人ID;
当所述操作者ID的字段值为程序ID时,从所述更新行为数据表中获取包含所述程序ID的行信息,并从数据库中获取与所述程序ID对应的程序的连接字符串,并用所述连接字符串替换所述更新行为数据表中的所述程序ID。
8.一种修改行为数据表的装置,其特征在于,所述装置包括:
第一获取模块,用于获取原始行为数据表,以及目标业务审计场景所需的标准审计字段集合;
字段对比模块,用于将所述原始行为数据表中的各个原始字段与所述标准审计字段集合进行对比,以确定出差异审计字段,并将所述差异审计字段添加到所述原始行为数据表中,以得到更新行为数据表;
第二获取模块,用于获取与所述原始行为数据表对应的第一获取语句;其中,所述第一获取语句用于从用户行为信息中提取所述原始行为数据表中各个原始字段的数据;
语句生成模块,用于基于所述差异审计字段,在所述第一获取语句的基础上形成可从用户行为信息中提取所述差异审计字段的数据的第二获取语句;
信息提取模块,用于当监测到用户行为信息时,使用所述第二获取语句从所述用户行为信息中提取所述更新行为数据表中各个字段的数据,并将提取到的数据添加到所述更新行为数据表中。
9.一种计算机设备,所述计算机设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111522375.0A CN114169309A (zh) | 2021-12-13 | 2021-12-13 | 修改行为数据表的方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111522375.0A CN114169309A (zh) | 2021-12-13 | 2021-12-13 | 修改行为数据表的方法、装置、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114169309A true CN114169309A (zh) | 2022-03-11 |
Family
ID=80486138
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111522375.0A Pending CN114169309A (zh) | 2021-12-13 | 2021-12-13 | 修改行为数据表的方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114169309A (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016115294A (ja) * | 2014-12-18 | 2016-06-23 | バイドゥ ネットコム サイエンス アンド テクノロジー(ペキン) カンパニー リミテッド | 情報検索方法及びデバイス |
CN108200220A (zh) * | 2018-04-08 | 2018-06-22 | 武汉斗鱼网络科技有限公司 | 一种数据同步方法、服务器及存储介质 |
CN109062883A (zh) * | 2018-07-18 | 2018-12-21 | 平安科技(深圳)有限公司 | 数据表动态导出方法、装置、计算机设备及存储介质 |
CN109977134A (zh) * | 2019-03-19 | 2019-07-05 | 福建省天奕网络科技有限公司 | MySQL数据追踪方法、存储介质 |
CN109992598A (zh) * | 2019-03-19 | 2019-07-09 | 福建省天奕网络科技有限公司 | MySQL数据审计方法、存储介质 |
CN110908997A (zh) * | 2019-10-09 | 2020-03-24 | 支付宝(杭州)信息技术有限公司 | 数据血缘构建方法、装置、服务器及可读存储介质 |
CN111090665A (zh) * | 2019-11-15 | 2020-05-01 | 广东数果科技有限公司 | 一种数据任务调度方法及调度系统 |
CN112948400A (zh) * | 2020-09-17 | 2021-06-11 | 深圳市明源云科技有限公司 | 一种数据库管理方法、数据库管理装置及终端设备 |
WO2021169272A1 (zh) * | 2020-02-27 | 2021-09-02 | 平安科技(深圳)有限公司 | 数据库表格变更方法、装置、计算机设备及存储介质 |
CN113434413A (zh) * | 2021-06-28 | 2021-09-24 | 平安银行股份有限公司 | 基于数据差异的数据测试方法、装置、设备及存储介质 |
-
2021
- 2021-12-13 CN CN202111522375.0A patent/CN114169309A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016115294A (ja) * | 2014-12-18 | 2016-06-23 | バイドゥ ネットコム サイエンス アンド テクノロジー(ペキン) カンパニー リミテッド | 情報検索方法及びデバイス |
CN108200220A (zh) * | 2018-04-08 | 2018-06-22 | 武汉斗鱼网络科技有限公司 | 一种数据同步方法、服务器及存储介质 |
CN109062883A (zh) * | 2018-07-18 | 2018-12-21 | 平安科技(深圳)有限公司 | 数据表动态导出方法、装置、计算机设备及存储介质 |
CN109977134A (zh) * | 2019-03-19 | 2019-07-05 | 福建省天奕网络科技有限公司 | MySQL数据追踪方法、存储介质 |
CN109992598A (zh) * | 2019-03-19 | 2019-07-09 | 福建省天奕网络科技有限公司 | MySQL数据审计方法、存储介质 |
CN110908997A (zh) * | 2019-10-09 | 2020-03-24 | 支付宝(杭州)信息技术有限公司 | 数据血缘构建方法、装置、服务器及可读存储介质 |
CN111090665A (zh) * | 2019-11-15 | 2020-05-01 | 广东数果科技有限公司 | 一种数据任务调度方法及调度系统 |
WO2021169272A1 (zh) * | 2020-02-27 | 2021-09-02 | 平安科技(深圳)有限公司 | 数据库表格变更方法、装置、计算机设备及存储介质 |
CN112948400A (zh) * | 2020-09-17 | 2021-06-11 | 深圳市明源云科技有限公司 | 一种数据库管理方法、数据库管理装置及终端设备 |
CN113434413A (zh) * | 2021-06-28 | 2021-09-24 | 平安银行股份有限公司 | 基于数据差异的数据测试方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10621212B2 (en) | Language tag management on international data storage | |
CN102804147B (zh) | 执行abap源代码的代码检查的代码检查执行系统 | |
US9400733B2 (en) | Pattern matching framework for log analysis | |
CN110764942A (zh) | 多种类数据校验方法、装置、计算机系统及可读存储介质 | |
US11036491B1 (en) | Identifying and resolving firmware component dependencies | |
CN110188135B (zh) | 文件生成方法及设备 | |
CN111078481B (zh) | 获取配置检查清单的方法、装置、电子设备及存储介质 | |
WO2022012327A1 (zh) | 代码分析的方法、系统及计算设备 | |
CN113157315A (zh) | 一种软件不同版本的差异信息识别方法、装置、设备及介质 | |
CN109284331B (zh) | 基于业务数据资源的制证信息获取方法、终端设备及介质 | |
CN111694612A (zh) | 配置检查方法、装置、计算机系统及存储介质 | |
CN107562429A (zh) | 一种基于编译规则的Android系统静态划分方法 | |
CN111737227A (zh) | 数据修改方法及系统 | |
CN111367890A (zh) | 一种数据迁移的方法、装置、计算机设备及可读存储介质 | |
CN114661423A (zh) | 集群配置检测方法、装置、计算机设备及存储介质 | |
CN112069052A (zh) | 一种异常对象检测方法、装置、设备及存储介质 | |
CN110866007B (zh) | 大数据应用和表的信息管理方法、系统和计算机设备 | |
CN116599881A (zh) | 云平台租户建模测试的方法、装置、设备及存储介质 | |
CN115757174A (zh) | 一种数据库的差异检测方法及装置 | |
CN116301799A (zh) | 一种代码生成方法、装置、计算机设备、存储介质及产品 | |
CN114169309A (zh) | 修改行为数据表的方法、装置、计算机设备及存储介质 | |
CN110321130B (zh) | 基于系统调用日志的不可重复编译定位方法 | |
US9471569B1 (en) | Integrating information sources to create context-specific documents | |
CN111352917A (zh) | 信息录入方法、装置、电子设备及存储介质 | |
CN116661758B (zh) | 一种优化日志框架配置的方法、装置、电子设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |