CN104462451B - 数据库文件敏感内容的检测方法和装置 - Google Patents

数据库文件敏感内容的检测方法和装置 Download PDF

Info

Publication number
CN104462451B
CN104462451B CN201410779643.0A CN201410779643A CN104462451B CN 104462451 B CN104462451 B CN 104462451B CN 201410779643 A CN201410779643 A CN 201410779643A CN 104462451 B CN104462451 B CN 104462451B
Authority
CN
China
Prior art keywords
hash value
record
field
row
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410779643.0A
Other languages
English (en)
Other versions
CN104462451A (zh
Inventor
彭建芬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CEC CYBERSPACE GREAT WALL Co Ltd
Original Assignee
CEC CYBERSPACE GREAT WALL Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CEC CYBERSPACE GREAT WALL Co Ltd filed Critical CEC CYBERSPACE GREAT WALL Co Ltd
Priority to CN201410779643.0A priority Critical patent/CN104462451B/zh
Publication of CN104462451A publication Critical patent/CN104462451A/zh
Application granted granted Critical
Publication of CN104462451B publication Critical patent/CN104462451B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6227Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database where protection concerns the structure of data, e.g. records, types, queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2221/00Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/21Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/2107File encryption

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种数据库文件敏感内容的检测方法和装置。该方法包括:对文件进行解析生成数据库表,数据库表包括n行行记录,每行行记录包括至少一个字段值,n为正整数;计算出当前行记录的杂凑值;将计算出的行记录的杂凑值和预先设置的行记录杂凑值表中的杂凑值进行匹配,若匹配成功时确定检测出文件包括数据库文件敏感内容。本发明避免了数据库文件敏感内容的外泄和了解数据库文件敏感内容的存储分布情况。

Description

数据库文件敏感内容的检测方法和装置
技术领域
本发明涉及计算机技术领域,特别涉及一种数据库文件敏感内容的检测方法和装置。
背景技术
随着信息化程度的提高,企业越来越多的利用计算机创建和处理敏感的文件,在方便快捷的同时也增加了信息被侦听、截获及非法拷贝的危险,通常该文件为业务电子信息。当前企业经营、市场竞争中面临的商业机密安全管理的形势严峻,尤其是企业在商业活动中使用的诸如经营分析材料、业务技术策略、营销方案、财务分析报表、投资计划、客户信息、研发数据库等隐私和敏感信息资源。这些企业商业机密信息经常第一时间就被竞争对手获取,给公司的业务关系带来危害,使公司的知识产权遭受损失,带来巨大的资产损失,同时给公司的声誉造成不良影响。
但是,现有技术中,还没有一种能够有效检测出该文件包括数据库文件敏感内容的方案,从而导致了敏感内容的外泄。
发明内容
本发明提供一种数据库文件敏感内容的检测方法和装置,用于避免数据库文件敏感内容的外泄。
为实现上述目的,本发明提供了一种数据库文件敏感内容的检测方法,包括:
对文件进行解析生成数据库表,所述数据库表包括n行行记录,每行行记录包括至少一个字段值,所述n为正整数;
计算出当前行记录的杂凑值;
将计算出的行记录的杂凑值和预先设置的行记录杂凑值表中的杂凑值进行匹配,若匹配成功时确定检测出文件包括数据库文件敏感内容;
若计算出的行记录的杂凑值和预先设置的行记录杂凑值表中的杂凑值匹配不成功时,计算出该行记录的每个字段值的杂凑值;
将计算出的该行记录的每个字段值的杂凑值和预先设置的字段杂凑值表中的杂凑值进行匹配,若匹配不成功时计算当前行的下一个行记录的杂凑值,并继续执行所述将计算出的行记录的杂凑值和预先设置的行记录杂凑值表中的杂凑值进行匹配的步骤。
可选地,还包括:
若计算出的该行记录的每个字段值的杂凑值和预先设置的字段杂凑值表中的杂凑值匹配成功时,从所述字段杂凑值表中查询出匹配的杂凑值所对应的数据库表标识、行记录标识和字段标识;
判断同一数据库表标识和同一行记录标识所对应的字段标识是否包括检测规则库中该数据库表标识和该行记录标识对应的全部字段标识,若是,确定检测出文件包括数据库文件敏感内容;若否,继续执行所述计算当前行的下一个行记录的杂凑值的步骤。
可选地,所述计算出当前行记录的杂凑值之前还包括:
判断当前行记录对应的行记录标识是否大于n,若否,继续执行所述计算出当前行记录的杂凑值的步骤;
所述计算当前行的下一个行记录的杂凑值之前还包括:
判断当前行的下一个行记录对应的行记录标识是否大于n,若否,继续执行所述计算当前行的下一个行记录的杂凑值的步骤。
可选地,所述对文件进行解析生成数据库表之后还包括:
对所述数据库表中的每个字段值的编码格式进行规格化处理。
为实现上述目的,本发明提供了一种数据库文件敏感内容的检测装置,包括:
生成模块,用于对文件进行解析生成数据库表,所述数据库表包括n行行记录,每行行记录包括至少一个字段值,所述n为正整数;
计算模块,用于计算出当前行记录的杂凑值;
第一匹配模块,用于将计算出的行记录的杂凑值和预先设置的行记录杂凑值表中的杂凑值进行匹配;
确定模块,用于若所述第一匹配模块匹配成功时确定检测出文件包括数据库文件敏感内容;
所述计算模块还用于若所述第一匹配模块匹配不成功时,计算出该行记录的每个字段值的杂凑值;
第二匹配模块,用于将计算出的该行记录的每个字段值的杂凑值和预先设置的字段杂凑值表中的杂凑值进行匹配;
所述计算模块还用于若所述第二匹配模块匹配不成功时计算当前行的下一个行记录的杂凑值,并触发所述第一匹配模块。
可选地,还包括:
查询模块,用于若所述第二匹配模块匹配成功时,从所述字段杂凑值表中查询出匹配的杂凑值所对应的数据库表标识、行记录标识和字段标识;
第一判断模块,用于判断同一数据库表标识和同一行记录标识所对应的字段标识是否包括检测规则库中该数据库表标识和该行记录标识对应的全部字段标识,若是,触发所述确定模块;若否,触发所述计算模块,由所述计算模块计算当前行的下一个行记录的杂凑值的步骤。
可选地,还包括:第二判断模块;
所述第二判断模块,用于在所述计算模块计算出当前行记录的杂凑值之前判断当前行记录对应的行记录标识是否大于n,若否,触发所述计算模块计算出当前行记录的杂凑值;
所述第二判断模块还用于在所述计算模块判断当前行的下一个行记录对应的行记录标识是否大于n,若否,触发所述计算模块计算当前行的下一个行记录的杂凑值。
可选地,还包括:
规格化模块,用于在所述生成模块对文件进行解析生成数据库表之后对所述数据库表中的每个字段值的编码格式进行规格化处理。
本发明具有以下有益效果:
本实施例提供的数据库文件敏感内容的检测方法和装置中,计算出当前行记录的杂凑值,将计算出的行记录的杂凑值和预先设置的行记录杂凑值表中的杂凑值进行匹配,若匹配成功时确定检测出文件包括数据库文件敏感内容,若匹配失败时计算出该行记录的每个字段的杂凑值,将计算出的该行记录的每个字段值的杂凑值和预先设置的字段杂凑值表中的杂凑值进行匹配,若匹配不成功时计算当前行的下一个行记录的杂凑值,并继续执行下一个行记录的杂凑值的匹配过程,实现了有效检测出该文件包括数据库文件敏感内容,从而避免了敏感内容的外泄和了解数据库文件敏感内容的存储分布情况。
附图说明
图1为本发明实施例一提供的一种数据库文件敏感内容的检测方法的流程图;
图2为本发明实施例二提供的一种数据库文件敏感内容的检测方法的流程图;
图3为本发明实施例三提供的一种数据库文件敏感内容的检测装置的结构示意图;
图4为本发明实施例四提供的一种数据库文件敏感内容的检测装置的结构示意图。
具体实施方式
为使本领域的技术人员更好地理解本发明的技术方案,下面结合附图对本发明提供的数据库文件敏感内容的检测方法和装置进行详细描述。
图1为本发明实施例一提供的一种数据库文件敏感内容的检测方法的流程图,如图1所示,该方法包括:
步骤101、对文件进行解析生成数据库表,数据库表包括n行行记录,每行行记录包括至少一个字段值,n为正整数。
本步骤具体可包括:根据该文件类型对应的数据结构对文件进行解析生成数据库表。
步骤102、计算出当前行记录的杂凑值。
步骤103、将计算出的行记录的杂凑值和预先设置的行记录杂凑值表中的杂凑值进行匹配,若匹配成功时执行步骤104,若匹配不成功时执行步骤105。
步骤104、确定检测出文件包括数据库文件敏感内容,流程结束。
优选地,在确定检测出文件包括数据库文件敏感内容之后,还可以从所述行记录杂凑值表中查询出匹配的杂凑值所对应的数据库表标识和行记录标识。
本实施例中,确定出文件包含敏感内容。若该文件是网络上捕捉到的,可及时阻止文件的传输,从而避免了文件中敏感内容的外泄;若该文件是在终端或服务器上存储的,可以通过这种方式发现数据库文件敏感内容的存储分布情况。
步骤105、计算出该行记录的每个字段值的杂凑值。
步骤106、将计算出的该行记录的每个字段值的杂凑值和预先设置的字段杂凑值表中的杂凑值进行匹配,若匹配不成功时执行步骤107。
步骤107、计算当前行的下一个行记录的杂凑值,并继续执行步骤103。
本实施例提供的数据库文件敏感内容的检测方法中,计算出当前行记录的杂凑值,将计算出的行记录的杂凑值和预先设置的行记录杂凑值表中的杂凑值进行匹配,若匹配成功时确定检测出该文件包括数据库文件敏感内容,若匹配失败时计算出该行记录的每个字段的杂凑值,将计算出的该行记录的每个字段值的杂凑值和预先设置的字段杂凑值表中的杂凑值进行匹配,若匹配不成功时计算当前行的下一个行记录的杂凑值,并继续执行下一个行记录的杂凑值的匹配过程,实现了有效检测出该文件包括数据库文件敏感内容,从而避免了敏感内容的外泄。
图2为本发明实施例二提供的一种数据库文件敏感内容的检测方法的流程图,如图2所示,该方法包括:
步骤201、对文件进行解析生成数据库表,数据库表包括n行行记录,每行行记录包括至少一个字段值,n为正整数。
本步骤中,由于n为正整数,因此数据库表可包括一行或者多行行记录,每行行记录即为一条记录。每行行记录中可包括一个或者多个字段值,每个字段值可形成一列。
本实施例中,每个数据库表对应于一个数据库表标识,该数据库表标识用于标识该数据库表;每行记录对应于一个行记录标识,该行记录标识用于标识该行记录;每个字段值对应于一个字段标识,该字段标识用于标识该字段值。其中,行记录标识为数据库表的行号,字段标识为数据库表中字段的列号。其中,n为数据库表中的行记录的总行数。
下面以一条行记录为例对记录中的字段进行描述。该记录为:
col 1:[3]c2 02 63,col 2:[6]44 6f 6e 61 6c 64,col 3:[8]4f 43 6f 6e 6e65 6c 6c。
该条行记录包括三个字段值。第一个字段值为col 1:[3]c2 02 63,其中,col 1为第一个字段值的字段标识,[3]表示该字段内容包括3个字节,c2 02 63为具体的字段内容;第二个字段值为col 2:[6]44 6f 6e61 6c 64,其中,col 2为第二个字段值的字段标识,[6]表示该字段内容包括6个字节,44 6f 6e 61 6c 64为具体的字段内容;第三个字段值为col 3:[8]4f 43 6f 6e 6e 65 6c 6c,其中,col 3为第三个字段值的字段标识,[8]表示该字段内容包括8个字节,4f 43 6f 6e 6e 65 6c 6c为具体的字段内容。
步骤202、对数据库表中的每个字段值的编码格式进行规格化处理。
若数据库表中的字段值的编码格式不统一,则需要对每个字段值的编码格式进行规格化处理,以使数据库表中的所有字段值的编码格式统一。例如:可将数据库表中的所有字段值的编码格式统一为UFT8编码格式。
步骤203、判断当前行记录对应的行记录标识是否大于n,若否则执行步骤204,若是则流程结束。
本实施例的数据库文件敏感内容的检测方法是采用对逐个行记录进行判断以确定是否检测出文件中包括数据库文件敏感内容的方法,则本步骤通过行记录标识判断是否已经对所有行记录进行了判断,若已经对所有行记录进行了判断则流程结束,若未完成对所有行记录的判断则需执行步骤204。
步骤204、计算出当前行记录的杂凑值。
本实施例中,可通过杂凑函数计算出当前行记录的杂凑值,例如:杂凑函数可以为SM3或者MD5。
步骤205、将计算出的行记录的杂凑值和预先设置的行记录杂凑值表中的杂凑值进行匹配,若匹配成功则执行步骤206,若匹配不成功则执行步骤207。
本实施例中,行记录杂凑值表中预先存储了多个杂凑值,则本步骤具体可包括:查询预先设置的行记录杂凑值表是否包括与计算出的行记录的杂凑值相同的杂凑值,若查询出预先设置的行记录杂凑值表包括与计算出的行记录的杂凑值相同的杂凑值,则表示匹配成功;反之,则表示匹配不成功。
步骤206、确定检测出文件包括数据库文件敏感内容,流程结束。
步骤207、计算出该行记录的每个字段值的杂凑值。
本实施例中,可通过杂凑函数计算出每个字段值的杂凑值,例如:杂凑函数可以为SM3或者MD5。
步骤208、将计算出的该行记录的每个字段值的杂凑值和预先设置的字段杂凑值表中的杂凑值进行匹配,若匹配成功则执行步骤209,若匹配不成功则执行步骤211。
本实施例中,字段杂凑值表中预先存储了多个字段值的杂凑值,则本步骤具体可包括:查询预先设置的字段杂凑值表是否包括与计算出的行记录的每个字段值的杂凑值相同的杂凑值,若查询出预先设置的字段杂凑值表包括与计算出的行记录的每个字段值的杂凑值相同的杂凑值,则表示匹配成功;反之,则表示匹配不成功。查询出的与计算出的行记录的每个字段值的杂凑值相同的杂凑值的数量可以为一个或者多个,并且查询出的所有杂凑值可位于同一个数据库表中的同一行或者不同行记录中,或者查询出的所有杂凑值可位于不同数据库表中。
步骤209、从字段杂凑值表中查询出匹配的杂凑值所对应的数据库表标识、行记录标识和字段标识。
本步骤具体可包括:查询出每一个匹配的杂凑值对应的数据库表标识、行记录标识和字段标识,以便于能够获知每一个匹配的杂凑值所对应的数据库表、行记录以及字段值。
步骤210、判断同一数据库表标识和同一行记录标识所对应的字段标识是否包括检测规则库中该数据库表标识和该行记录标识对应的全部字段标识,若是则执行步骤206,若否则执行步骤211。
本步骤具体可包括:从上述步骤209中查询出的数据库表标识、行记录标识和字段标识选择出同一数据库表标识和同一行记录标识所对应的字段标识,也就是说,选择出同一个数据库表中同一行记录中的字段。
其中,检测规则库中预先存储有不同的数据库标识和行记录标识所对应的字段标识。若判断出同一数据库表标识和同一行记录标识所对应的字段标识包括检测规则库中该数据库表标识和该行记录标识对应的全部字段标识,则表明文件包括数据库文件敏感内容;若判断出同一数据库表标识和同一行记录标识所对应的字段标识未包括检测规则库中该数据库表标识和该行记录标识对应的全部字段标识,则表明该行记录标识对应的记录未包括数据库文件敏感内容,此种情况下可进行下一行记录的检测。
步骤211、判断当前行的下一个记录对应的行记录标识是否大于n,若否则执行步骤212,若是则流程结束。
步骤212、计算当前行的下一个行记录的杂凑值,并继续执行步骤205。
本实施例中,可通过杂凑函数计算出当前行的下一个行记录的杂凑值,例如:杂凑函数可以为SM3或者MD5。
本实施例提供的数据库文件敏感内容的检测方法中,计算出当前行记录的杂凑值,将计算出的行记录的杂凑值和预先设置的行记录杂凑值表中的杂凑值进行匹配,若匹配成功时确定检测出文件包括数据库文件敏感内容,若匹配失败时计算出该行记录的每个字段的杂凑值,将计算出的该行记录的每个字段值的杂凑值和预先设置的字段杂凑值表中的杂凑值进行匹配,若匹配不成功时计算当前行的下一个行记录的杂凑值,并继续执行下一个行记录的杂凑值的匹配过程,实现了有效检测出该文件包括数据库文件敏感内容,从而避免了敏感内容的外泄。也可用于数据库文件敏感内容在终端或服务器的存储发现,从而了解数据资产的分布情况。
图3为本发明实施例三提供的一种数据库文件敏感内容的检测装置的结构示意图,如图3所示,该装置包括:生成模块11、计算模块12、第一匹配模块13、确定模块14和第二匹配模块15。
生成模块11用于对文件进行解析生成数据库表,所述数据库表包括n行行记录,每行行记录包括至少一个字段值,所述n为正整数;计算模块12用于计算出当前行记录的杂凑值;第一匹配模块13用于将计算出的行记录的杂凑值和预先设置的行记录杂凑值表中的杂凑值进行匹配;确定模块14用于若第一匹配模块13匹配成功时确定检测出文件包括数据库文件敏感内容;计算模块12还用于若第一匹配模块13匹配不成功时,计算出该行记录的每个字段的杂凑值;第二匹配模块15用于将计算出的该行记录的每个字段的杂凑值和预先设置的字段杂凑值表中的杂凑值进行匹配;计算模块12还用于若第二匹配模块15匹配不成功时计算当前行的下一个行记录的杂凑值,并触发第一匹配模块13。
优选地,确定模块14确定检测出文件包括数据库文件敏感内容之后,还可以从所述行记录杂凑值表中查询出匹配的杂凑值所对应的数据库表标识和行记录标识。
本实施例提供的数据库文件敏感内容的检测装置中,计算出当前行记录的杂凑值,将计算出的行记录的杂凑值和预先设置的行记录杂凑值表中的杂凑值进行匹配,若匹配成功时确定检测出文件包括数据库文件敏感内容,若匹配失败时计算出该行记录的每个字段的杂凑值,将计算出的该行记录的每个字段值的杂凑值和预先设置的字段杂凑值表中的杂凑值进行匹配,若匹配不成功时计算当前行的下一个行记录的杂凑值,并继续执行下一个行记录的杂凑值的匹配过程,实现了有效检测出该文件包括数据库文件敏感内容,从而避免了敏感内容的外泄。
图4为本发明实施例四提供的一种数据库文件敏感内容的检测装置的结构示意图,如图4所示,本实施例的装置在上述实施例三的基础上还包括:查询模块16和第一判断模块17。
查询模块16用于若第二匹配模块15匹配成功时,从所述字段杂凑值表中查询出匹配的杂凑值所对应的数据库表标识、行记录标识和字段标识;第一判断模块17用于判断同一数据库表标识和同一行记录标识所对应的字段标识是否包括检测规则库中该数据库表标识和该行记录标识对应的全部字段标识,若是,触发确定模块14,由触发模块14确定检测出文件包括数据库文件敏感内容;若否,触发计算模块12,由计算模块12计算当前行的下一个行记录的杂凑值。
该装置还包括:第二判断模块18。第二判断模块18用于在计算模块12计算出当前行记录的杂凑值之前判断当前行记录对应的行记录标识是否大于n,若否,触发计算模块12计算出当前行记录的杂凑值。第二判断模块18还用于在计算模块12判断当前行的下一个行记录对应的行记录标识是否大于n,若否,触发计算模块12计算当前行的下一个行记录的杂凑值。
进一步地,该装置还包括:规格化模块19。规格化模块19用于在生成模块11对文件进行解析生成数据库表之后对数据库表中的每个字段值的编码格式进行规格化处理。
本实施例提供的数据库文件敏感内容的检测装置中,计算出当前行记录的杂凑值,将计算出的行记录的杂凑值和预先设置的行记录杂凑值表中的杂凑值进行匹配,若匹配成功时确定检测出文件包括数据库文件敏感内容,若匹配失败时计算出该行记录的每个字段的杂凑值,将计算出的该行记录的每个字段值的杂凑值和预先设置的字段杂凑值表中的杂凑值进行匹配,若匹配不成功时计算当前行的下一个行记录的杂凑值,并继续执行下一个行记录的杂凑值的匹配过程,实现了有效检测出该文件包括数据库文件敏感内容,从而避免了敏感内容的外泄。
可以理解的是,以上实施方式仅仅是为了说明本发明的原理而采用的示例性实施方式,然而本发明并不局限于此。对于本领域内的普通技术人员而言,在不脱离本发明的精神和实质的情况下,可以做出各种变型和改进,这些变型和改进也视为本发明的保护范围。

Claims (6)

1.一种数据库文件敏感内容的检测方法,其特征在于,包括:
对文件进行解析生成数据库表,所述数据库表包括n行行记录,每行行记录包括至少一个字段值,所述n为正整数;
计算出当前行记录的杂凑值;
将计算出的行记录的杂凑值和预先设置的行记录杂凑值表中的杂凑值进行匹配,若匹配成功时确定检测出文件包括数据库文件敏感内容;
若计算出的行记录的杂凑值和预先设置的行记录杂凑值表中的杂凑值匹配不成功时,计算出该行记录的每个字段值的杂凑值;
将计算出的该行记录的每个字段值的杂凑值和预先设置的字段杂凑值表中的杂凑值进行匹配,若匹配不成功时计算当前行的下一个行记录的杂凑值,并继续执行所述将计算出的行记录的杂凑值和预先设置的行记录杂凑值表中的杂凑值进行匹配的步骤;
若计算出的该行记录的每个字段值的杂凑值和预先设置的字段杂凑值表中的杂凑值匹配成功时,从所述字段杂凑值表中查询出匹配的杂凑值所对应的数据库表标识、行记录标识和字段标识;
判断同一数据库表标识和同一行记录标识所对应的字段标识是否包括检测规则库中该数据库表标识和该行记录标识对应的全部字段标识,若是,确定检测出文件包括数据库文件敏感内容;若否,继续执行所述计算当前行的下一个行记录的杂凑值的步骤。
2.根据权利要求1所述的数据库文件敏感内容的检测方法,其特征在于,所述计算出当前行记录的杂凑值之前还包括:
判断当前行记录对应的行记录标识是否大于n,若否,继续执行所述计算出当前行记录的杂凑值的步骤;
所述计算当前行的下一个行记录的杂凑值之前还包括:
判断当前行的下一个行记录对应的行记录标识是否大于n,若否,继续执行所述计算当前行的下一个行记录的杂凑值的步骤。
3.根据权利要求1所述的数据库文件敏感内容的检测方法,其特征在于,所述对文件进行解析生成数据库表之后还包括:
对所述数据库表中的每个字段值的编码格式进行规格化处理。
4.一种数据库文件敏感内容的检测装置,其特征在于,包括:
生成模块,用于对文件进行解析生成数据库表,所述数据库表包括n行行记录,每行行记录包括至少一个字段值,所述n为正整数;
计算模块,用于计算出当前行记录的杂凑值;
第一匹配模块,用于将计算出的行记录的杂凑值和预先设置的行记录杂凑值表中的杂凑值进行匹配;
确定模块,用于若所述第一匹配模块匹配成功时确定检测出文件包括数据库文件敏感内容;
所述计算模块还用于若所述第一匹配模块匹配不成功时,计算出该行记录的每个字段值的杂凑值;
第二匹配模块,用于将计算出的该行记录的每个字段值的杂凑值和预先设置的字段杂凑值表中的杂凑值进行匹配;
所述计算模块还用于若所述第二匹配模块匹配不成功时计算当前行的下一个行记录的杂凑值,并触发所述第一匹配模块;
还包括查询模块和第一判断模块;
查询模块,用于若所述第二匹配模块匹配成功时,从所述字段杂凑值表中查询出匹配的杂凑值所对应的数据库表标识、行记录标识和字段标识;
第一判断模块,用于判断同一数据库表标识和同一行记录标识所对应的字段标识是否包括检测规则库中该数据库表标识和该行记录标识对应的全部字段标识,若是,触发所述确定模块;若否,触发所述计算模块,由所述计算模块计算当前行的下一个行记录的杂凑值的步骤。
5.根据权利要求4所述的数据库文件敏感内容的检测装置,其特征在于,还包括:第二判断模块;
所述第二判断模块,用于在所述计算模块计算出当前行记录的杂凑值之前判断当前行记录对应的行记录标识是否大于n,若否,触发所述计算模块计算出当前行记录的杂凑值;
所述第二判断模块还用于在所述计算模块判断当前行的下一个行记录对应的行记录标识是否大于n,若否,触发所述计算模块计算当前行的下一个行记录的杂凑值。
6.根据权利要求4所述的数据库文件敏感内容的检测装置,其特征在于,还包括:
规格化模块,用于在所述生成模块对文件进行解析生成数据库表之后对所述数据库表中的每个字段值的编码格式进行规格化处理。
CN201410779643.0A 2014-12-15 2014-12-15 数据库文件敏感内容的检测方法和装置 Active CN104462451B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410779643.0A CN104462451B (zh) 2014-12-15 2014-12-15 数据库文件敏感内容的检测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410779643.0A CN104462451B (zh) 2014-12-15 2014-12-15 数据库文件敏感内容的检测方法和装置

Publications (2)

Publication Number Publication Date
CN104462451A CN104462451A (zh) 2015-03-25
CN104462451B true CN104462451B (zh) 2017-12-05

Family

ID=52908486

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410779643.0A Active CN104462451B (zh) 2014-12-15 2014-12-15 数据库文件敏感内容的检测方法和装置

Country Status (1)

Country Link
CN (1) CN104462451B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104794204B (zh) * 2015-04-23 2018-11-09 上海新炬网络技术有限公司 一种数据库敏感数据自动识别方法
CN109472152B (zh) * 2017-09-07 2020-11-06 中国移动通信集团广东有限公司 一种数据敏感性的检测方法及服务器
CN107729456A (zh) * 2017-09-30 2018-02-23 武汉汉思信息技术有限责任公司 敏感信息检索方法、服务器及存储介质
CN110460583B (zh) * 2019-07-15 2022-06-03 中国平安人寿保险股份有限公司 一种敏感信息记录方法及装置、电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102354292A (zh) * 2011-09-21 2012-02-15 国家计算机网络与信息安全管理中心 主、备数据库记录一致性校验方法及系统
CN103309937A (zh) * 2013-04-19 2013-09-18 无锡成电科大科技发展有限公司 一种云平台内容监管的方法
CN103971061A (zh) * 2014-05-26 2014-08-06 中电长城网际系统应用有限公司 文本文件指纹获取方法及其装置、数据管理方法
CN103973708A (zh) * 2014-05-26 2014-08-06 中电长城网际系统应用有限公司 一种外泄事件的确定方法和系统
CN104123370A (zh) * 2014-07-24 2014-10-29 杭州安恒信息技术有限公司 数据库敏感信息探测方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8732473B2 (en) * 2010-06-01 2014-05-20 Microsoft Corporation Claim based content reputation service

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102354292A (zh) * 2011-09-21 2012-02-15 国家计算机网络与信息安全管理中心 主、备数据库记录一致性校验方法及系统
CN103309937A (zh) * 2013-04-19 2013-09-18 无锡成电科大科技发展有限公司 一种云平台内容监管的方法
CN103971061A (zh) * 2014-05-26 2014-08-06 中电长城网际系统应用有限公司 文本文件指纹获取方法及其装置、数据管理方法
CN103973708A (zh) * 2014-05-26 2014-08-06 中电长城网际系统应用有限公司 一种外泄事件的确定方法和系统
CN104123370A (zh) * 2014-07-24 2014-10-29 杭州安恒信息技术有限公司 数据库敏感信息探测方法及系统

Also Published As

Publication number Publication date
CN104462451A (zh) 2015-03-25

Similar Documents

Publication Publication Date Title
CN106062719B (zh) 根据使用数据的结构化日志模式的服务度量分析
WO2020220638A1 (zh) 链路系统与日志系统的关联方法、装置及存储介质
CN104462451B (zh) 数据库文件敏感内容的检测方法和装置
CN108062202A (zh) 一种文件分块存储方法及系统
US8412712B2 (en) Grouping methods for best-value determination from values for an attribute type of specific entity
WO2018177275A1 (zh) 一种多数据源用户信息整合方法和装置
CN105701096A (zh) 索引生成方法、数据查询方法、装置及系统
WO2020000743A1 (zh) 一种webshell检测方法及相关设备
WO2017101301A1 (zh) 数据信息处理方法及装置
KR20150084123A (ko) 이상행위 탐지 장치 및 방법
CN109446276B (zh) 基于关系数据模型的订单拦截方法、装置、设备及介质
CN110287696B (zh) 一种反弹shell进程的检测方法、装置和设备
GB2615049A (en) Method and system for access control in versioned configuration of computing cluster
CN107844409A (zh) 测试用例执行方法和装置
CN107220005A (zh) 一种数据操作方法及系统
CN110019340A (zh) 数据存储/读取方法、装置及系统
KR20130071617A (ko) 변종 악성 코드를 탐지하기 위한 시스템 및 방법
JPWO2019168599A5 (zh)
CN113591073B (zh) 一种Web API安全威胁检测方法及装置
JP6523799B2 (ja) 情報分析システム、情報分析方法
CN110619022A (zh) 基于区块链网络的节点检测方法、装置、设备及存储介质
CN104935603A (zh) 一种识别请求的方法及网站服务器
US20150234932A1 (en) Terminal and contact lookup method
CN114629690A (zh) 设备安全基线合规检测方法、装置和计算机设备
CN111985513A (zh) 一种快速判识网络资产归属系统及其识别分析方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant