CN110163013B - 一种检测敏感信息的方法和设备 - Google Patents

一种检测敏感信息的方法和设备 Download PDF

Info

Publication number
CN110163013B
CN110163013B CN201910429432.7A CN201910429432A CN110163013B CN 110163013 B CN110163013 B CN 110163013B CN 201910429432 A CN201910429432 A CN 201910429432A CN 110163013 B CN110163013 B CN 110163013B
Authority
CN
China
Prior art keywords
sensitive information
information
display interface
terminal
sensitive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910429432.7A
Other languages
English (en)
Other versions
CN110163013A (zh
Inventor
潘勇
张俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Shanghu Information Technology Co ltd
Original Assignee
Shanghai Shanghu Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Shanghu Information Technology Co ltd filed Critical Shanghai Shanghu Information Technology Co ltd
Priority to CN201910429432.7A priority Critical patent/CN110163013B/zh
Publication of CN110163013A publication Critical patent/CN110163013A/zh
Application granted granted Critical
Publication of CN110163013B publication Critical patent/CN110163013B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/70Protecting specific internal or peripheral components, in which the protection of a component leads to protection of the entire computer
    • G06F21/82Protecting input, output or interconnection devices
    • G06F21/84Protecting input, output or interconnection devices output devices, e.g. displays or monitors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/02Recognising information on displays, dials, clocks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Multimedia (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明公开了一种检测敏感信息的方法和设备,涉及信息安全技术领域,用以解决采用录屏的方式检测敏感信息,录屏内容时间长,且需要人工去查看录屏内容,检测效率低的问题,本发明方法包括:终端在检测到显示界面发生变化后,通过图像识别技术确定当前显示界面中的文字信息;所述终端根据至少一个敏感信息检测规则对所述文字信息进行敏感信息检测,由于本发明不需要进行录屏,而是由终端在显示界面发生变化后,提取显示界面终端的文字内容,并根据设定的至少一个检测规则进行敏感信息的检测,在操作人员的操作过程中由终端直接进行检测,不再需要人工查看,因而提高了检测效率。

Description

一种检测敏感信息的方法和设备
技术领域
本发明涉及信息安全技术领域,特别涉及一种检测敏感信息的方法和设备。
背景技术
数据安全是所有公司关心的问题,为了防止数据泄密,内控部门需要定期审计或者查看公司核心机密信息被查看的历史,通过数据手段有效发现数据泄漏的风险或者潜在漏洞。
针对传统的虚拟桌面,通过录屏方式来记录操作人员的历史操作,对用户操作从开始到结束进行完整录屏,录屏内容时间长,数据历史太过庞大,且大部分时间都是无效内容,需要在录屏结束后需要人工对录屏内容进行查看跟踪,效率低。
综上所述,采用录屏的方式检测敏感信息,录屏内容时间长,且需要人工去查看录屏内容,检测效率低。
发明内容
本发明提供一种检测敏感信息的方法和设备,用以解决现有技术中采用录屏的方式检测敏感信息,录屏内容时间长,且需要人工去查看录屏内容,检测效率低的问题。
第一方面,本发明实施例提供的一种检测敏感信息的方法包括:
终端在检测到显示界面发生变化后,通过图像识别技术确定当前显示界面中的文字信息;
所述终端根据至少一个敏感信息检测规则对所述文字信息进行敏感信息检测。
上述方法,不需要进行录屏,而是由终端在显示界面发生变化后,提取显示界面终端的文字内容,并根据设定的至少一个检测规则进行敏感信息的检测,在操作人员的操作过程中由终端直接进行检测,不再需要人工查看,因而提高了检测效率。
在一种可能的实现方式中,所述终端通过下列方式确定显示界面发生变化:
所述终端周期对所述显示界面进行截屏处理;
将相邻两次截屏得到的图像进行比对;
如果不相同,则确定所述显示界面发生变化。
上述方法,采用周期截屏处理的方式对终端的显示界面是否发生变化进行判断,提供了一种判断显示界面是否发生变化的方式,采用截屏的方式则不需要实时监测显示桌面,相比于实时监测更加节省资源。
在一种可能的实现方式中,所述终端根据至少一个敏感信息检测规则对所述文字信息进行敏感信息检测之后,还包括:
若所述终端检测到敏感信息,则确定所述敏感信息对应的特征信息;
其中,所述特征信息包括下列的部分或全部:
敏感信息的类型、敏感信息的内容、当前显示界面中出现敏感信息的应用的名称、敏感信息的出现时间、敏感信息的消失时间、用户登录当前系统所使用的用户名、用于表示当前显示界面中出现敏感信息的应用的自定义扩展参数。
上述方法,若检测到敏感信息,则确定检测到的敏感信息相对应的特征信息,以便对检测到的敏感信息进行统计,可以有效记录敏感信息暴露的时间和查看人员信息等,方便大数据分析解析,有利于事后审计。
在一种可能的实现方式中,所述终端确定所述敏感信息对应的特征信息,包括:
若所述特征信息包括敏感信息的类型,则所述终端将与所述敏感信息匹配的敏感信息检测规则的类型作为所述敏感信息的类型;或
若所述特征信息包括敏感信息的出现时间,且相邻两幅图像中前一幅图像中不存在所述敏感信息,后一幅图像中存在所述敏感信息,则所述终端将相邻两幅图像中后一幅图像生成的时间作为所述敏感信息的出现时间;或
若所述特征信息包括敏感信息的消失时间,其中所述相邻两幅图像中前一幅图像中存在所述敏感信息,后一幅图像中不存在所述敏感信息,则所述终端将相邻两幅图像中前一幅图像生成的时间作为所述敏感信息的消失时间。
上述方法,提出了一种由终端确定敏感信息的类型、敏感信息的出现时间、敏感信息的消失时间的方法,其中可以根据敏感信息的出现时间和消失时间确定用户查看敏感信息的时间等,可以有效的防止敏感信息的泄露。
在一种可能的实现方式中,所述终端周期对所述显示界面进行截屏处理之前,还包括:
所述终端根据应用和时长的对应关系,确定用户当前正在操作的应用对应的时长;
所述终端根据确定的所述时长设置进行截屏处理使用的周期。
上述方法,终端可以根据应用和时长的对应关系,确定用户当前正在操作的应用进行截屏处理使用的周期,针对不同的应用则可设置更具针对性,更加合适的截屏时间,以便更加准确地判断显示界面是否发生变化。
第二方面,本发明实施例提供的一种检测敏感信息的设备包括:至少一个处理单元以及至少一个存储单元,其中,所述存储单元存储有程序代码,当所述程序代码被所述处理单元执行时,使得所述处理单元执行下列过程:
在检测到显示界面发生变化后,通过图像识别技术确定当前显示界面中的文字信息;
根据至少一个敏感信息检测规则对所述文字信息进行敏感信息检测。
在一种可能的实现方式中,所述处理单元还用于通过下列方式确定显示界面发生变化:
周期对所述显示界面进行截屏处理;
将相邻两次截屏得到的图像进行比对;
如果不相同,则确定所述显示界面发生变化。
在一种可能的实现方式中,所述处理单元还用于:
在根据至少一个敏感信息检测规则对所述文字信息进行敏感信息检测之后,若检测到敏感信息,则确定所述敏感信息对应的特征信息;
其中,所述特征信息包括下列的部分或全部:
敏感信息的类型、敏感信息的内容、当前显示界面中出现敏感信息的应用的名称、敏感信息的出现时间、敏感信息的消失时间、用户登录当前系统所使用的用户名、用于表示当前显示界面中出现敏感信息的应用的自定义扩展参数。
在一种可能的实现方式中,所述处理单元具体用于:
若所述特征信息包括敏感信息的类型,则将与所述敏感信息匹配的敏感信息检测规则的类型作为所述敏感信息的类型;或
若所述特征信息包括敏感信息的出现时间,且相邻两幅图像中前一幅图像中不存在所述敏感信息,后一幅图像中存在所述敏感信息,则将相邻两幅图像中后一幅图像生成的时间作为所述敏感信息的出现时间;或
若所述特征信息包括敏感信息的消失时间,其中所述相邻两幅图像中前一幅图像中存在所述敏感信息,后一幅图像中不存在所述敏感信息,则将相邻两幅图像中前一幅图像生成的时间作为所述敏感信息的消失时间。
在一种可能的实现方式中,所述处理单元还用于:
对所述显示界面进行截屏处理之前,根据应用和时长的对应关系,确定用户当前正在操作的应用对应的时长;
根据确定的所述时长设置进行截屏处理使用的周期。
第三方面,本发明实施例还提供一种检测敏感信息的设备,该设备包括第一确定模块和检测模块:
第一确定模块,用于在检测到显示界面发生变化后,通过图像识别技术确定当前显示界面中的文字信息;
检测模块,用于根据至少一个敏感信息检测规则对所述文字信息进行敏感信息检测。
第四方面,本申请还提供一种计算机存储介质,其上存储有计算机程序,该程序被处理单元执行时实现第一方面所述方法的步骤。
另外,第二方面至第四方面中任一种实现方式所带来的技术效果可参见第一方面中不同实现方式所带来的技术效果,此处不再赘述。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种检测敏感信息的方法示意图;
图2为本发明实施例提供的一种显示界面的示意图;
图3为本发明实施例提供的另一种统计特征信息的示意图;
图4为本发明实施例提供的一种检测敏感信息的完整方法示意图;
图5为本发明实施例提供的一种检测敏感信息的设备示意图;
图6为本发明实施例提供的另一种检测敏感信息的设备示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部份实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
下面对文中出现的一些词语进行解释:
1、本发明实施例中术语“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
2、本发明实施例中术语“敏感信息”指其丢失、不当使用或未经授权被人接触或修改会不利于国家利益或联邦政府计划的实行或不利于个人依法享有的个人隐私权的所有信息。
3、本发明实施例中术语“正则表达式”,是计算机科学的一个概念,是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个"规则字符串",这个"规则字符串"用来表达对字符串的一种过滤逻辑,通常被用来检索、替换那些符合某个模式(规则)的文本。
4、本发明实施例中术语“终端”指移动通信设备,包含手机、计算机、平板、智能终端、多媒体设备、流媒体设备等。
5、本发明实施例中术语“分词技术”就是搜索引擎针对用户提交查询的关键词串进行的查询处理后根据用户的关键词串用各种匹配方法进行的一种技术。
本发明实施例描述的应用场景是为了更加清楚的说明本发明实施例的技术方案,并不构成对于本发明实施例提供的技术方案的限定,本领域普通技术人员可知,随着新应用场景的出现,本发明实施例提供的技术方案对于类似的技术问题,同样适用。其中,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
互联网飞速发展的时代,高新技术的深入发展与广泛运用,正在深刻地改变着人们几千年来形成的生活习惯,例如信息传递方式、生产结构方式、人际交流方式、社会方式,也深刻地改变着生活运作方式。互联网敏感信息的识别过滤对促进互联网舆情技术发展有重要意义。
敏感信息的安全问题一直受到人们的重视,但是目前对敏感信息的鉴别通常依赖人工鉴别,例如采用录屏的方式将操作人员的操作过程记录下来,之后由人工查看录屏内容判断是否具有敏感信息,工作效率较低,无法快速检测敏感信息区。
因此本发明实施例一种检测敏感信息的方法和设备,由终端根据预设的敏感信息检测规则直接对显示界面中的文字信息进行敏感信息的检测,不需要录屏,且不需要人工查看,检测效率较高。
针对上述场景,下面结合说明书附图对本发明实施例做进一步详细描述。
如图1所示,本发明实施例的一种检测敏感信息的方法,具体包括以下步骤:
步骤100:终端在检测到显示界面发生变化后,通过图像识别技术确定当前显示界面中的文字信息;
步骤101:所述终端根据至少一个敏感信息检测规则对所述文字信息进行敏感信息检测。
通过上述方案,不需要进行录屏,而是由终端在显示界面发生变化后,提取显示界面终端的文字内容,并根据设定的至少一个检测规则进行敏感信息的检测,在操作人员的操作过程中由终端直接进行检测,不再需要人工查看,因而提高了检测效率。
在本发明实施例中,终端需要当前操作系统的桌面或者特定应用(如浏览器)的显示界面进行监控。
可选的,终端可以通过实时监控显示界面的方式检测显示界面是否还是能变化,这种方式可以准确及时的确定显示界面发生变化。
可选的,终端也可以通过下列方式确定显示界面发生变化:
终端周期对显示界面进行截屏处理;将相邻两次截屏得到的图像进行比对;如果不相同,则确定显示界面发生变化。
例如,设置周期为0.1秒,则每0.1秒截一次屏,将相邻两次截屏得到的图像进行比对,假设在t=0.1s时对显示界面进行一次截屏处理得到第一幅图像,在t=0.2s时对显示界面进行一次截屏处理得到第二幅图像,通过将第一幅图像与第二幅图像进行对比确定t=0.2s时刻的显示界面没有发生变化,在t=0.3s时对显示界面进行一次截屏处理得到第三幅图像,且第二幅图像与第三幅图像的比对结果不相同,表明t=0.3s时刻的显示界面发生变化。
上述方法,终端只需周期性地对显示界面进行截屏处理,不需要实时地监控显示界面,可以节省系统的资源。
可选的,可以在终端预设应用和时间的对应关系,在终端周期对显示界面进行截屏处理之前,由终端根据应用和时长的对应关系,确定用户当前正在操作的应用对应的时长,并根据确定的所述时长设置进行截屏处理使用的周期。
以应用为阅读器和视频播放器为例,考虑到用户在使用阅读器阅读电子书或者在使用浏览器浏览某一页面时需要阅读的时间较长,此时显示界面刷新较慢,而在使用视频播放器时考虑到视频帧画面刷新的速度较快,因而可以设置阅读器对应的时长为30秒,设置视频播放器对应的时长为0.1秒。
可选的,终端根据确定的时长设置进行截屏处理使用的周期时,可以直接将确定的时长作为进行截屏处理使用的周期,也可以根据确定的时长设置一个合理的进行截屏处理使用的周期,该周期可以大于确定的时长,也可以小于确定的时长。
例如,用户当前正在操作的应用为某阅读器(例如用户正在使用电子书阅读)时,则可确定该阅读器对应的时长,假设该阅读器对应的时长为20秒(假设阅读器对应的时长是根据统计分析确定的人均阅读一页电子书的时长),考虑到有时用户对于已浏览的页面再次进行浏览时,有可能浏览速度较之前更快,因此可设置截屏处理的周期为15秒,即每15秒截一次屏;当用户当前正在操作的应用为某视频应用时,则可确定该视频应用对应的时长,假设该视频应用对应的时长为1秒,则可设置截屏处理的周期为1秒。
需要说明的是,本发明实施例中所列举的终端根据确定的时长设置进行截屏处理使用的周期的方式只是举例说明,任何一种终端根据确定的时长设置进行截屏处理使用的周期的方式都适用于本发明实施例。
在本发明实施例中,终端在检测到显示界面发生变化后,通过图像识别技术确定当前显示界面(发生变化后的显示界面)中的文字信息,例如通过图像识别技术将截屏获得的第三幅图像进行转换提取其中的文字信息。
可选的,终端可以通过分词技术将提取的文字信息进行分词处理,得到各个组成词。
例如,采用正向最大匹配法将一个词从左至右来分词,若文本信息为“不知道你在说什么”,则将这句话采用正向最大匹配法可分为多个组成词:不知道,你,在,说什么。
在得到各个组成词之后,判断各个组成词是否满足系统自定义的敏感信息检测规则,例如组成词“你”满足其中一条敏感信息检测规则,则将该组成词作为敏感信息。
可选的,也可以直接将文本信息分别与各个敏感信息检测规则进行匹配;若在文字信息中匹配到至少一个可以满足敏感信息检测规则的字段,则终端将满足敏感信息检测规则的字段作为当前显示界面中的敏感信息。
如图2所示的变化后的显示界面,提取到的文本信息为“地址:XX路407号”及“电话:022-6400XXXX”,则将提取到的文本信息与系统预定义的5个敏感信息检测规则进行匹配,可知字段“022-6400XXXX”满足敏感信息检测规则3(检测以预设目标数字0开头的连续的10位数字),因而可确定“022-6400XXXX”为敏感信息。
在本发明实施例中,用于检测敏感信息的敏感信息检测规则可以由系统自定义,例如系统自定义了4类敏感信息检测规则,分别为:
手机号检测规则:检测以预设目标数字开头的连续的十一位数字组成的字符串;
身份证号检测规则:检测由连续的十八位数字组成的字符串或检测由连续的十七位数字及字母组成的字符串;
银行卡号:检测由连续的十九位数字组成的字符串;
Email(电子邮箱)检测规则:检测由用户名、预定义符号和域名组成的字符串。
考虑到在许多程序设计语言都支持利用正则表达式进行字符串操作,例如,在Perl(Practical Extraction and Reporting Language,实际抽取与汇报语言)中就内建了一个功能强大的正则表达式引擎。
可选的,可以通过正则表达式的方式表示敏感信息检测规则,例如:手机号的正则表达式为:/^1(3|4|5|7|8)\d{9}$/,表示以1开头,第二位可能是3/4/5/7/8等的任意一个,后面的\d表示数字[0-9]的9位,总共加起来11位,下面再列举几种常见的正则表达式:
电话号码的正则表达式为:^(\(\d{3,4}\)|\d{3,4}-|\s)?\d{7,14}$;
15位身份证号的正则表达式:
isIDCard1=/^[1-9]\d{7}((0\d)|(1[0-2]))(([0|1|2]\d)|3[0-1])\d{3}$/;
18位身份证号的正则表达式:
isIDCard2=/^[1-9]\d{5}[1-9]\d{3}((0\d)|(1[0-2]))(([0|1|2]\d)|3[0-1])\d{4}$/;
以一个通用的正则表示15位或18位的身份证号,表示为:
/(^\d{15}$)|(^\d{17}([0-9]|X)$)/;
中国邮政编码的正则表达式:/[1-9]{1}(\d+){5}/。
需要说明的是,本发明实施例中所列举的以正则表达式表示敏感信息检测规则的方式只是举例说明,任何一种可以用于敏感信息检测的方式都适用于本发明实施例。
可选的,终端根据系统预定义的至少一个敏感信息检测规则对文字信息进行敏感信息检测,若终端检测到敏感信息,则确定敏感信息对应的特征信息。其中,在根据敏感信息检测规则对文字信息进行敏感信息检测时,需要将每一个检测规则都与文字信息进行一次匹配,例如文字信息中既有手机号,又有身份证号时,则可通过手机号的检测规则检测出敏感信息-手机号,通过身份证号的检测规则检测出敏感信息-身份证号。
例如,终端在对某一文本信息进行检测之后检测出两个敏感信息,分别为手机号1862XXXX222(敏感信息1),以及手机号1895XXXX 555(敏感信息2),则终端需要分别确定敏感信息1对应的特征信息,以及敏感信息2对应的特征信息。
其中,特征信息包括下列的部分或全部:
敏感信息的类型、敏感信息的内容、当前显示界面中出现敏感信息的应用的名称、敏感信息的出现时间、敏感信息的消失时间、用户登录当前系统所使用的用户名、用于表示当前显示界面中出现敏感信息的应用的自定义扩展参数。
在本发明实施例中,可以通过终端上的客户端对敏感信息进行检测,例如开发一款应用(脱敏应用)用于检测敏感信息。
其中,敏感信息的类型包括但不限于下列的部分或全部:
身份证号、手机号码、银行卡号、邮箱、网址、邮政编码。
可选的,敏感信息的类型可以通过系统自定义,且敏感信息的类型与敏感信息检测规则相对应,可以一种类型的敏感信息对应一种敏感信息检测规则。
在本发明实施例中,用户登录当前系统所使用的用户名通常为当前用户的域账号,例如客户端可以自动收集当前电脑登录的用户名,客户端所在的PC(PersonalComputer,个人计算机)用户名(例如用户所在PC的IP(Internet Protocol,网络之间互连的协议)地址信息)。
其中,用于表示当前显示界面中出现敏感信息的应用的自定义扩展参数可用于记录应用的一些补充信息,例如浏览器当前正在查看的URL(Uniform Resource Locator,统一资源定位符),或者是应用的标签信息,例如应用为微信时,微信的标签信息为:社交、新闻、通讯聊天、转账,等等,其中扩展参数是自定义的,用于扩展,由应用自定义。
可选的,特征信息还可以包括客户端地址信息,例如客户端的IP地址或用户登录客户端的账号名等,假设用户A使用账号1在PC1登录脱敏应用客户端,用户B使用账号2在PC2登录脱敏应用客户端,则用户A对应的客户端的地址信息为账号1,用户B对应的客户端的地址信息为账号2。
可选的,终端将相邻两幅图像中后一幅图像生成的时间作为敏感信息的出现时间,其中相邻两幅图像中前一幅图像中不存在该敏感信息,后一幅图像中存在该敏感信息,其中敏感信息的出现时间可以表示敏感信息开始出现在当前操作系统可视范围内的时间。
例如,在确定敏感信息1生成的时间时,由于在第一幅和第二幅图像中都不存在敏感信息1,在第三幅图像中存在敏感信息1,因而可以确定敏感信息1的生成时间即第三幅图像的生成时间。
可选的,终端将相邻两幅图像中前一幅图像生成的时间作为敏感信息的出现时间,其中相邻两幅图像中前一幅图像中存在该敏感信息,后一幅图像中不存在该敏感信息。
例如,在确定敏感信息2消失的时间时,由于在第一幅和第二幅图像中都存在敏感信息2,在第三幅图像中不存在敏感信息2,因而可以确定敏感信息2的消失时间即第三幅图像的生成时间。
可选的,在终端确定敏感信息对应的特征信息之后,将确定的特征信息发送给网络侧设备(例如服务器),由网络侧设备存储敏感信息,便于后期的大数据分析解析,或者用于后期查看人员的信息等,有利于事后审计。
如图3所示,其中用户名即用户登录当前系统所使用的用户名,网络侧设备将接收到的特征信息通过表格的形式进行统计,由图可知,用户1在15:11:00~15:11:05在浏览器1查看了手机号1,用户2在15:11:00~15:11:05在浏览器2查看了手机号2,其中的扩展参数为浏览器当前正在查看的URL。
在本发明实施例中,网络侧设备可以实现敏感信息对应的特征信息的查询与记录,在后期,可以通过查询特征信息的统计表格,确定某一敏感信息被查看的时间,被查看的次数,等等,以防敏感信息的泄露,例如,由图3所示的表格可知,其中手机号1被查看的次数为两次,分别由用户A及用户D进行查看,查看的时间段为:15:11:00~15:11:05,以及17:00:00~17:00:05,等。
本发明可以通过记录下用户查看敏感信息的具体的时间点,记录至专有系统,方便做数据统计或分析,方便找到泄密事件点的具体操作;并且这个记录数据可以用作大数据分析,比如分析一个人查看了敏感内容的频次,或者结合视频录屏,可以有效追查审计操作人员的操作,等等。
如图4所示,本发明实施例提供的一种检测敏感信息的完整方法包括:
步骤400、终端实时监测当前操作系统的显示界面;
步骤401、终端在检测到当前操作系统的显示界面发生变化后,通过图像识别技术确定当前显示界面的文字信息;
步骤402、终端根据至少一个敏感信息检测规则对确定的文字信息进行敏感信息检测;
步骤403、终端判断是否检测到敏感信息,如果是,则执行步骤404,否则,返回步骤400;
步骤404、终端确定检测到的敏感信息相对应的特征信息;
步骤405、终端将特征信息发送给服务器,以使服务器对特征信息进行统计分析。
基于相同的发明构思,本发明实施例中还提供了一种检测敏感信息的设备,由于该设备即是本发明实施例中的方法中的设备,并且该设备解决问题的原理与该方法相似,因此该设备的实施可以参见方法的实施,重复之处不再赘述。
如图5所示,本发明实施例还提供一种检测敏感信息的设备,该设备包括:至少一个处理单元500、以及至少一个存储单元501,其中,所述存储单元501存储有程序代码,当所述程序代码被所述处理单元500执行时,使得设备执行下列过程:
在检测到显示界面发生变化后,通过图像识别技术确定当前显示界面中的文字信息;
根据至少一个敏感信息检测规则对所述文字信息进行敏感信息检测。
可选的,所述处理单元500还用于通过下列方式确定显示界面发生变化:
周期对所述显示界面进行截屏处理;
将相邻两次截屏得到的图像进行比对;
如果不相同,则确定所述显示界面发生变化。
可选的,所述处理单元500还用于:
在根据至少一个敏感信息检测规则对所述文字信息进行敏感信息检测之后,若检测到敏感信息,则确定所述敏感信息对应的特征信息;
其中,所述特征信息包括下列的部分或全部:
敏感信息的类型、敏感信息的内容、当前显示界面中出现敏感信息的应用的名称、敏感信息的出现时间、敏感信息的消失时间、用户登录当前系统所使用的用户名、用于表示当前显示界面中出现敏感信息的应用的自定义扩展参数。
可选的,所述处理单元500具体用于:
若所述特征信息包括敏感信息的类型,则将与所述敏感信息匹配的敏感信息检测规则的类型作为所述敏感信息的类型;或
若所述特征信息包括敏感信息的出现时间,且相邻两幅图像中前一幅图像中不存在所述敏感信息,后一幅图像中存在所述敏感信息,则将相邻两幅图像中后一幅图像生成的时间作为所述敏感信息的出现时间;或
若所述特征信息包括敏感信息的消失时间,其中所述相邻两幅图像中前一幅图像中存在所述敏感信息,后一幅图像中不存在所述敏感信息,则将相邻两幅图像中前一幅图像生成的时间作为所述敏感信息的消失时间。
可选的,所述处理单元500还用于:
对所述显示界面进行截屏处理之前,根据应用和时长的对应关系,确定用户当前正在操作的应用对应的时长;
根据确定的所述时长设置进行截屏处理使用的周期。
基于相同的发明构思,本发明实施例中还提供了一种检测敏感信息的设备,由于该设备即是本发明实施例中的方法中的设备,并且该设备解决问题的原理与该方法相似,因此该设备的实施可以参见方法的实施,重复之处不再赘述。
如图6所示,本发明实施例还提供一种检测敏感信息的设备,该设备包括:第一确定模块600和检测模块601:
第一确定模块600:用于在检测到显示界面发生变化后,通过图像识别技术确定当前显示界面中的文字信息;
检测模块601:用于根据至少一个敏感信息检测规则对所述文字信息进行敏感信息检测。
可选的,所述第一确定模块600还用于通过下列方式确定显示界面发生变化:
周期对所述显示界面进行截屏处理;
将相邻两次截屏得到的图像进行比对;
如果不相同,则确定所述显示界面发生变化。
可选的,所述设备还包括:第二确定模块601:
第二确定模块602:用于在根据至少一个敏感信息检测规则对所述文字信息进行敏感信息检测之后,若检测到敏感信息,则确定所述敏感信息对应的特征信息;
其中,所述特征信息包括下列的部分或全部:
敏感信息的类型、敏感信息的内容、当前显示界面中出现敏感信息的应用的名称、敏感信息的出现时间、敏感信息的消失时间、用户登录当前系统所使用的用户名、用于表示当前显示界面中出现敏感信息的应用的自定义扩展参数。
可选的,所述第二确定模块601具体用于:
若所述特征信息包括敏感信息的类型,则将与所述敏感信息匹配的敏感信息检测规则的类型作为所述敏感信息的类型;或
若所述特征信息包括敏感信息的出现时间,且相邻两幅图像中前一幅图像中不存在所述敏感信息,后一幅图像中存在所述敏感信息,则将相邻两幅图像中后一幅图像生成的时间作为所述敏感信息的出现时间;或
若所述特征信息包括敏感信息的消失时间,其中所述相邻两幅图像中前一幅图像中存在所述敏感信息,后一幅图像中不存在所述敏感信息,则将相邻两幅图像中前一幅图像生成的时间作为所述敏感信息的消失时间。
可选的,所述第一处理模块600还用于:
对所述显示界面进行截屏处理之前,根据应用和时长的对应关系,确定用户当前正在操作的应用对应的时长;
根据确定的所述时长设置进行截屏处理使用的周期。
本发明实施例还提供一种计算机可读非易失性存储介质,包括程序代码,当所述程序代码在计算终端上运行时,所述程序代码用于使所述计算终端执行上述本发明实施例检测敏感信息的方法的步骤。
以上参照示出根据本申请实施例的方法、装置(系统)和/或计算机程序产品的框图和/或流程图描述本申请。应理解,可以通过计算机程序指令来实现框图和/或流程图示图的一个块以及框图和/或流程图示图的块的组合。可以将这些计算机程序指令提供给通用计算机、专用计算机的处理器和/或其它可编程数据处理装置,以产生机器,使得经由计算机处理器和/或其它可编程数据处理装置执行的指令创建用于实现框图和/或流程图块中所指定的功能/动作的方法。
相应地,还可以用硬件和/或软件(包括固件、驻留软件、微码等)来实施本申请。更进一步地,本申请可以采取计算机可使用或计算机可读存储介质上的计算机程序产品的形式,其具有在介质中实现的计算机可使用或计算机可读程序代码,以由指令执行系统来使用或结合指令执行系统而使用。在本申请上下文中,计算机可使用或计算机可读介质可以是任意介质,其可以包含、存储、通信、传输、或传送程序,以由指令执行系统、装置或设备使用,或结合指令执行系统、装置或设备使用。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (6)

1.一种检测敏感信息的方法,其特征在于,该方法包括:
终端在检测到显示界面发生变化后,通过图像识别技术确定当前显示界面中的文字信息;
所述终端根据至少一个敏感信息检测规则对所述文字信息进行敏感信息检测;
所述终端通过下列方式确定显示界面发生变化:
所述终端周期对所述显示界面进行截屏处理;
将相邻两次截屏得到的图像进行比对;
如果不相同,则确定所述显示界面发生变化;
所述终端根据至少一个敏感信息检测规则对所述文字信息进行敏感信息检测之后,还包括:
若所述终端检测到敏感信息,则确定所述敏感信息对应的特征信息;
其中,所述特征信息包括下列的部分或全部:
敏感信息的类型、敏感信息的内容、当前显示界面中出现敏感信息的应用的名称、敏感信息的出现时间、敏感信息的消失时间、用户登录当前系统所使用的用户名、用于表示当前显示界面中出现敏感信息的应用的自定义扩展参数。
2.如权利要求1所述的方法,其特征在于,所述终端确定所述敏感信息对应的特征信息,包括:
若所述特征信息包括敏感信息的类型,则所述终端将与所述敏感信息匹配的敏感信息检测规则的类型作为所述敏感信息的类型;或
若所述特征信息包括敏感信息的出现时间,且相邻两幅图像中前一幅图像中不存在所述敏感信息,后一幅图像中存在所述敏感信息,则所述终端将相邻两幅图像中后一幅图像生成的时间作为所述敏感信息的出现时间;或
若所述特征信息包括敏感信息的消失时间,其中所述相邻两幅图像中前一幅图像中存在所述敏感信息,后一幅图像中不存在所述敏感信息,则所述终端将相邻两幅图像中前一幅图像生成的时间作为所述敏感信息的消失时间。
3.如权利要求1所述的方法,其特征在于,所述终端周期对所述显示界面进行截屏处理之前,还包括:
所述终端根据应用和时长的对应关系,确定用户当前正在操作的应用对应的时长;
所述终端根据确定的所述时长设置进行截屏处理使用的周期。
4.一种检测敏感信息的设备,其特征在于,该设备包括:至少一个处理单元以及至少一个存储单元,其中,所述存储单元存储有程序代码,当所述程序代码被所述处理单元执行时,使得所述处理单元执行下列过程:
在检测到显示界面发生变化后,通过图像识别技术确定当前显示界面中的文字信息;
根据至少一个敏感信息检测规则对所述文字信息进行敏感信息检测;
所述处理单元还用于通过下列方式确定显示界面发生变化:
周期对所述显示界面进行截屏处理;
将相邻两次截屏得到的图像进行比对;
如果不相同,则确定所述显示界面发生变化;
所述处理单元还用于:
在根据至少一个敏感信息检测规则对所述文字信息进行敏感信息检测之后,若检测到敏感信息,则确定所述敏感信息对应的特征信息;
其中,所述特征信息包括下列的部分或全部:
敏感信息的类型、敏感信息的内容、当前显示界面中出现敏感信息的应用的名称、敏感信息的出现时间、敏感信息的消失时间、用户登录当前系统所使用的用户名、用于表示当前显示界面中出现敏感信息的应用的自定义扩展参数。
5.如权利要求4所述的设备,其特征在于,所述处理单元具体用于:
若所述特征信息包括敏感信息的类型,则将与所述敏感信息匹配的敏感信息检测规则的类型作为所述敏感信息的类型;或
若所述特征信息包括敏感信息的出现时间,且相邻两幅图像中前一幅图像中不存在所述敏感信息,后一幅图像中存在所述敏感信息,则将相邻两幅图像中后一幅图像生成的时间作为所述敏感信息的出现时间;或
若所述特征信息包括敏感信息的消失时间,其中所述相邻两幅图像中前一幅图像中存在所述敏感信息,后一幅图像中不存在所述敏感信息,则将相邻两幅图像中前一幅图像生成的时间作为所述敏感信息的消失时间。
6.如权利要求4所述的设备,其特征在于,所述处理单元还用于:
对所述显示界面进行截屏处理之前,根据应用和时长的对应关系,确定用户当前正在操作的应用对应的时长;
根据确定的所述时长设置进行截屏处理使用的周期。
CN201910429432.7A 2019-05-22 2019-05-22 一种检测敏感信息的方法和设备 Active CN110163013B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910429432.7A CN110163013B (zh) 2019-05-22 2019-05-22 一种检测敏感信息的方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910429432.7A CN110163013B (zh) 2019-05-22 2019-05-22 一种检测敏感信息的方法和设备

Publications (2)

Publication Number Publication Date
CN110163013A CN110163013A (zh) 2019-08-23
CN110163013B true CN110163013B (zh) 2021-08-03

Family

ID=67631911

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910429432.7A Active CN110163013B (zh) 2019-05-22 2019-05-22 一种检测敏感信息的方法和设备

Country Status (1)

Country Link
CN (1) CN110163013B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114257563B (zh) * 2021-12-20 2023-10-24 创盛视联数码科技(北京)有限公司 一种直播间聊天内容回调的过滤方法
CN114661934B (zh) * 2022-03-21 2024-03-01 重庆市规划和自然资源信息中心 基于数据挖掘分析技术多维度监控政务新媒体舆情预警的方法
CN115002508A (zh) * 2022-06-07 2022-09-02 中国工商银行股份有限公司 直播数据流方法、装置、计算机设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103916233A (zh) * 2014-03-28 2014-07-09 小米科技有限责任公司 一种信息加密方法及装置
CN103927182A (zh) * 2014-04-29 2014-07-16 朱林 一种利用屏幕截屏结合鼠标键盘操作进行录像的方法
CN107111539A (zh) * 2016-07-11 2017-08-29 深圳前海达闼云端智能科技有限公司 终端设备的监控方法及装置
CN108038396A (zh) * 2017-12-05 2018-05-15 广东欧珀移动通信有限公司 录屏方法、装置及终端

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101562109B1 (ko) * 2013-10-30 2015-10-21 김현우 스크린샷 픽셀 비교를 통한 웹페이지 위변조 점검 시스템
US9129327B1 (en) * 2014-02-18 2015-09-08 Splendid Labs, Inc. Screenshot-based e-commerce
CN104462945A (zh) * 2014-12-30 2015-03-25 宇龙计算机通信科技(深圳)有限公司 终端的监控方法和终端的监控装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103916233A (zh) * 2014-03-28 2014-07-09 小米科技有限责任公司 一种信息加密方法及装置
CN103927182A (zh) * 2014-04-29 2014-07-16 朱林 一种利用屏幕截屏结合鼠标键盘操作进行录像的方法
CN107111539A (zh) * 2016-07-11 2017-08-29 深圳前海达闼云端智能科技有限公司 终端设备的监控方法及装置
CN108038396A (zh) * 2017-12-05 2018-05-15 广东欧珀移动通信有限公司 录屏方法、装置及终端

Also Published As

Publication number Publication date
CN110163013A (zh) 2019-08-23

Similar Documents

Publication Publication Date Title
CN113098870B (zh) 一种网络诈骗检测方法、装置、电子设备及存储介质
CN110163013B (zh) 一种检测敏感信息的方法和设备
KR100848319B1 (ko) 웹 구조정보를 이용한 유해 사이트 차단 방법 및 장치
CN108833185B (zh) 一种网络攻击路线还原方法及系统
CN109194671A (zh) 一种异常访问行为的识别方法及服务器
CN104935494A (zh) 信息处理方法和装置
JP2014502753A (ja) ウェブページ情報の検出方法及びシステム
CN107590386B (zh) 安全事件信息的处理方法、装置、存储介质和计算机设备
CN113779481B (zh) 诈骗网站的识别方法、装置、设备及存储介质
CN107403108A (zh) 一种数据处理的方法及系统
CN112445870B (zh) 基于手机取证电子数据的知识图谱串并案分析方法
CN110716973A (zh) 基于大数据的安全事件上报平台及方法
CN110020161B (zh) 数据处理方法、日志处理方法和终端
CN103488947A (zh) 即时通信客户端盗号木马程序的识别方法及装置
CN115883223A (zh) 用户风险画像的生成方法及装置、电子设备、存储介质
CN114157568B (zh) 一种浏览器安全访问方法、装置、设备及存储介质
CN113015171A (zh) 一种具有网络舆情监控及分析功能的系统
CN112667875A (zh) 一种数据获取、数据分析方法、装置、设备及存储介质
CN111125704B (zh) 一种网页挂马识别方法及系统
US10313127B1 (en) Method and system for detecting and alerting users of device fingerprinting attempts
CN115114676A (zh) 一种远程网页篡改监测方法、系统、设备及存储介质
CN109194756A (zh) 应用程序特征信息提取方法及装置
CN114265759A (zh) 一种数据信息泄露后的溯源方法、系统及电子设备
CN114969450A (zh) 一种用户行为分析方法、装置、设备及存储介质
CN106789938A (zh) 一种实时监控手机端浏览器搜索痕迹的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant