CN107633380A - 一种数据防泄漏系统的任务审批方法和系统 - Google Patents

一种数据防泄漏系统的任务审批方法和系统 Download PDF

Info

Publication number
CN107633380A
CN107633380A CN201710765311.0A CN201710765311A CN107633380A CN 107633380 A CN107633380 A CN 107633380A CN 201710765311 A CN201710765311 A CN 201710765311A CN 107633380 A CN107633380 A CN 107633380A
Authority
CN
China
Prior art keywords
approval
target
document content
candidate
sensitive keys
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710765311.0A
Other languages
English (en)
Inventor
郭岩岭
王志海
喻波
秦凯
王志华
李静华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Wondersoft Technology Co Ltd
Original Assignee
Beijing Wondersoft Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Wondersoft Technology Co Ltd filed Critical Beijing Wondersoft Technology Co Ltd
Priority to CN201710765311.0A priority Critical patent/CN107633380A/zh
Publication of CN107633380A publication Critical patent/CN107633380A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种数据防泄漏系统的任务审批方法和系统,该方法包括:获取任务审批请求中的文档内容;按照预设规则提取文档内容中的候选敏感关键词;根据预设的敏感关键词与权重的对应关系和候选敏感关键词,计算文档内容的目标敏感度;根据预设的敏感度区间与审批结果的对应关系,查找目标敏感度对应的目标敏感度区间,以及目标敏感度区间对应的目标审批结果;响应任务审批请求,以返回目标审批结果。本发明实现了任务审批流程的全自动审批,提升了审批效率,而且避免了人工操作所导致的关键信息泄露问题,保证了重要信息的安全。

Description

一种数据防泄漏系统的任务审批方法和系统
技术领域
本发明涉及数据安全领域,特别是涉及一种数据防泄漏系统的任务审批方法和系统。
背景技术
目前,对于数据防泄漏系统(DLP,Data leakage prevention)中的任务审批流程主要是基于工作流或者模板规则。
其中,对于基于工作流的任务审批流程,在审批流程中全部按照预先定义的工作流执行,例如,在申请人提出任务审批申请(即申请人申请对某个文档进行何种操作)后,第一层审批人员收到审批请求,人工检视申请人所提出申请的文本内容,然后,执行“同意”或者“拒绝”的动作;如果“同意”,则继续按照预先定义的工作流将经过第一层同意的任务审批申请发送至下一层审批人员进行进一步审批处理。这种审批方案的缺点在于不能对申请审批的文档内容进行重要信息的自动识别,必须要由人工查看文档进行干预鉴定,只有在人工确定文档内容符合审批规则之后才能后续的自动审批流程,从而存在任务审批执行效率低的问题。
而对于基于模板规则的任务审批流程,在审批模板中预设了一定的审批规则,所有的审批申请都自动的按照该审批规则执行审批。例如,上述第一层审批人员出差或请假,则针对下发至该第一层审批人员的任务审批申请,按照自动审批规则自动执行审批通过的操作,进入下一层审批人员处进行继续审批。即,设置了自动审批后所有的审批申请都会默认审批通过,从而存在重要文档信息泄漏的风险。
由此可见,现有技术中面向数据防泄漏系统的任务审批方案普遍存在着审批效率和重要信息的安全不能兼顾的问题。
发明内容
本发明提供了一种数据防泄漏系统的任务审批方法和系统,以解决现有技术中面向数据防泄漏系统的任务审批方案所存在的审批效率和重要信息的安全不能兼顾的问题
为了解决上述问题,根据本发明的一个方面,本发明公开了一种数据防泄漏系统的任务审批方法,包括:
获取任务审批请求中的文档内容;
按照预设规则提取所述文档内容中的候选敏感关键词;
根据预设的敏感关键词与权重的对应关系和所述候选敏感关键词,计算所述文档内容的目标敏感度;
根据预设的敏感度区间与审批结果的对应关系,查找所述目标敏感度对应的目标敏感度区间,以及所述目标敏感度区间对应的目标审批结果;
响应所述任务审批请求,以返回所述目标审批结果。
根据本发明的另一方面,本发明还公开了一种数据防泄漏系统的任务审批系统,包括:
获取模块,用于获取任务审批请求中的文档内容;
提取模块,用于按照预设规则提取所述文档内容中的候选敏感关键词;
计算模块,用于根据预设的敏感关键词与权重的对应关系和所述候选敏感关键词,计算所述文档内容的目标敏感度;
查找模块,用于根据预设的敏感度区间与审批结果的对应关系,查找所述目标敏感度对应的目标敏感度区间,以及所述目标敏感度区间对应的目标审批结果;
响应模块,用于响应所述任务审批请求,以返回所述目标审批结果。
与现有技术相比,本发明包括以下优点:
本发明通过自动识别待审批的文档内容中的候选敏感关键词,并基于该候选敏感关键词和预设的敏感关键词与权重的对应关系计算该文档内容的敏感度,并通过查找不同审批结果所分别对应的敏感度区间来对文档内容进行自动审批,得到审批结果,不仅实现了任务审批流程的全自动审批,提升了审批效率,而且避免了人工操作所导致的关键信息泄露问题,保证了重要信息的安全。
附图说明
图1是本发明的一种DLP系统的任务审批方法实施例的步骤流程图;
图2是本发明的一种DLP系统实施例的任务审批流程图;
图3是本发明的另一种DLP系统实施例的任务审批流程图;
图4是本发明的一种DLP系统的任务审批系统实施例的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
参照图1,示出了本发明的一种DLP系统的任务审批方法实施例的步骤流程图,具体可以包括如下步骤:
步骤101,获取任务审批请求中的文档内容;
其中,任务审批请求中会包括附件文档,任务审批请求表示对该附件文档进行诸如外发、编辑等等处理的审批请求,这里,本发明实施例需要获取该附件文档中具体的文档内容。
步骤102,按照预设规则提取所述文档内容中的候选敏感关键词;
其中,可以按照预设规则提取该文档内容中可能涉及DLP系统安全性的敏感词,即候选敏感关键词。
步骤103,根据预设的敏感关键词与权重的对应关系和所述候选敏感关键词,计算所述文档内容的目标敏感度;
其中,本发明能够利用先验信息预先设置敏感关键词与权重的对应关系,即为DLP系统中的每个敏感关键词设置对应的一个权重值,这里,就可以利用该对应关系以及上述提取的候选敏感关键词来计算该文档内容的敏感度。
步骤104,根据预设的敏感度区间与审批结果的对应关系,查找所述目标敏感度对应的目标敏感度区间,以及所述目标敏感度区间对应的目标审批结果;
其中,本发明能够利用先验信息来预先设置不同的审批结果所分别对应的敏感度区间,得到敏感度区间与审批结果的对应关系,然后,在该对应关系中涉及的至少两个敏感度区间中查找包含该目标敏感度的目标敏感度区间,以及在该对应关系中查找对应该目标敏感度区间的目标审批结果。
步骤105,响应所述任务审批请求,以返回所述目标审批结果。
最后,就可以响应于该任务审批请求,将得到的目标审批结果返回至任务审批请求侧。
借助于本发明上述实施例的技术方案,本发明通过自动识别待审批的文档内容中的候选敏感关键词,并基于该候选敏感关键词和预设的敏感关键词与权重的对应关系计算该文档内容的敏感度,并通过查找不同审批结果所分别对应的敏感度区间来对文档内容进行自动审批,得到审批结果,不仅实现了任务审批流程的全自动审批,提升了审批效率,而且避免了人工操作所导致的关键信息泄露问题,保证了重要信息的安全。
可选地,在一个实施例中,在执行步骤102时,可以通过以下方式一来实现:
对所述文档内容进行分词处理,得到多个候选敏感关键词;
其中,在进行分词处理时所用的算法可以现有技术中任意一种分词方法,例如条件随机场(CRF,conditional random field)算法、MMSeg(Maximum MatchingSegmentation)算法等等,通过分词算法对文档内容进行分词处理,可以得到很多分词,这里的分词即为候选敏感关键词。
对所述多个候选敏感关键词分别作语义抽取处理,得到多个候选敏感语义;
其中,由于上述候选敏感关键词为文本模式,计算机并不能够理解其语义,因此,这里需要对每个候选敏感关键词进行语义抽取处理,具体的语义抽取方法可以是现有技术中任意一种语义抽取方法,其中,例如对“发展方向”这一候选敏感关键词抽取得到的候选敏感语义可以是一段计算机编码(例如xmrstp),“xmrstp”能够被计算机识别到其所表达的意思是“发展方向”。
相应的,在执行步骤103时,则可以根据预设的敏感语义与权重的对应关系和所述多个候选敏感语义,计算所述文档内容的目标敏感度。
也就是说,当提取候选敏感关键词时,提取的是候选敏感语义,则预先设置的就是敏感语义与权重的对应关系,其中,该对应关系可以是根据先验信息进行统计分析而得到的。例如在人工进行审批时,文档内容中涉及到敏感关键词A、敏感关键词B、敏感关键词C,则审核不通过;文档内容中涉及到敏感关键词D、敏感关键词E,则审核通过;那么利用这些在人工审核时的先验信息就可以对上述不同的敏感关键词设置不同的权重,其中,审核不通过涉及的敏感关键词的权重要高于审核通过的敏感关键词的权重。即,权重的大小与该敏感关键词的敏感程度成正比。
那么根据预设的敏感语义与权重的对应关系以及所述多个候选敏感语义,就可以计算所述文档内容的目标敏感度。
这样,本发明实施例能够通过抽取候选敏感关键词的语义来更加准确的识别哪些候选敏感关键词是真正的敏感关键词,从而保证关键信息在审批过程中不被泄露。
可选地,在另一个实施例中,在执行步骤102时,还可以通过以下方式二来实现:按照预设的正则表达式提取所述文档内容中的候选敏感关键词。
具体而言,本发明实施例可以利用上述提到的先验信息预先设置能够识别敏感关键词的正则表达式,并利用该正则表达式来提取文档内容中涉及信息安全的候选敏感关键词,即,将符合该正则表达式的格式规则的分词确定为候选敏感关键词。
这样,本发明实施例能够通过预设的正则表达式来抽取候选敏感关键词,从而可以更加准确的识别文档中哪些词汇为符合先验信息的敏感关键词,从而保证关键信息在审批过程中不被泄露。
另外,需要注意的是,上述实施例中,步骤102中提取到的词汇之所以称作候选敏感关键词,其原因在于这些候选敏感关键词并非100%是敏感关键词,有一些候选敏感关键词可能并不对信息安全造成影响。即步骤102中提取到的候选敏感关键词中可能有一些不太敏感的词汇并不属于步骤103的对应关系中涉及的敏感关键词。
可选地,在一个实施例中,在执行步骤102时,还可以同时采用上述方式一和方式二来实现。
可选地,在一个实施例中,在执行步骤103时,可以通过以下子步骤来实现:
S11,根据预设的敏感关键词与权重的对应关系,确定所述候选敏感关键词中存在对应权重的目标敏感关键词,以及所述目标敏感关键词对应的目标权重;
其中,数据库中可以存储预先设置的敏感关键词与权重的对照表,每个敏感关键词对应一个权重值;而由于并非所有候选敏感关键词均为敏感关键词,因此,这里可以将每个候选敏感关键词分别与对照表中的敏感关键词进行匹配,对于匹配到相应的敏感关键词的候选敏感关键词则是确定出的目标敏感关键词(也即,在匹配时,能够在对照表中匹配到对应的权重的候选敏感关键词),并进一步确定在对照表中,该目标敏感关键词所对应的权重。
例如,候选敏感词包括词1、词2、词3、词4,该对照表中词1的权重为w1,词2的权重为w2,词5的权重为5。那么候选敏感词中只有词1和词2为目标敏感关键词,而它们的权重分别为w1和w2。
S12,确定每个目标敏感关键词在所述文档内容中出现的目标次数;
此外,本发明实施例还需要确定词1和词2在文档内容中出现的次数,例如分别为N1和N2。
S13,根据每个目标敏感关键词的目标次数以及目标权重,计算所述文档内容的目标敏感度。
最后,在计算该文档内容的敏感度时,就可以对每个目标敏感关键词在文档中出现的次数和权重进行加权求和计算。
具体而言,以上述举例来说明:目标敏感度W=w1*N1+w2*N2。
其中,该目标敏感度可以理解为该文档内容的权重值。
需要注意的是,本发明对于对照表中的敏感关键词的数量以及提取的候选敏感关键词的数量并不做具体限制,上述举例只用于理解本发明的技术方案。
这样,本发明实施例可以借助于文档内容中的敏感关键词的敏感权重以及在文档中出现的次数来计算文档内容的敏感度权重值,从而以权重值的方式表达出文档内容的敏感程度,使得自动审批中计算出的文档内容的敏感程度能够符合人工审批时对关键信息的敏感认定程度,既实现了任务流程的自动审批,又提升了审批效率,并进一步保证了敏感信息的安全。
其中,上述步骤104中的所述目标审批结果包括以下之一:审批通过、审批驳回、人工复核。
具体而言,例如预先设置了三个敏感度区间,分别为(0,m]、(m,n]、(n,+∞),其中,(0,m]对应审批通过;(m,n]对应人工复核;(n,+∞)对应审批驳回。那么在执行步骤104、步骤105时,由于文档内容的敏感度(即目标敏感度)为W;那么当0<W<=m时,则确定审批结果为审批通过,在执行步骤105时,则将该审批流程通过(例如该任务审批请求为将该文档内容外发,则允许其外发该文档内容)的信息返回至请求者;当m<W<=n时,则确定审批结果为人工复核,在执行步骤105时,则将该审批流程需要人工复核的信息返回至请求者,并且系统还会自动将该审批流程转交给人工进行复核处理(具体可以将该审批任务下发至某个员工的审批任务栏中以便其进行审批);当W>n时,则确定审批结果为审批驳回,在执行步骤105时,则将审批驳回(例如该任务审批请求为将该文档内容外发,则不允许其外发该文档内容)的信息返回至请求者。
这里,以三种审批结果来具体说明的,而在实际应用时,本发明的审批结果并不限定上述三种,还可以包括更多的审批结果;此外,也可以包括更少的审批结果,例如审批结果中只有两个选项,一个为审批通过,另一个为审批驳回;或者,一个为审批通过,另一个为人工复核。
下面以图2和图3所示的具体实例来对本发明的上述技术方案进行阐述。
图2示出了本发明一个实施例的DLP系统的任务审批流程图。该DLP系统包括DLP数据核心管控服务器和DLP客户端。其中,DLP数据核心管控服务器包括:心跳服务模块、策略服务模块、日志服务模块、文件服务模块、状态服务模块、自动审批服务模块、附近汇聚服务模块和权值数据库模块。
心跳服务模块,用于保持DLP客户端和上述服务器的长连接;
策略服务模块,用于为所有用户进行数据计算、数据下发和数据维护管理;
日志服务模块,用于收集DLP客户端的日志数据;
文件服务模块,用于处理DLP客户端升级文件的下发任务;
状态服务模块,用于维护DLP客户端在线、离线,以及将心跳数据下发至DLP客户端。
其中,自动审批服务模块、附近汇聚服务模块和权值数据库模块是本发明任务流程自动审批的核心,其中,自动审批服务模块包括自动审批引擎,该自动审批引擎能够实现上述方法实施例中提到的所有对任务审批请求的自动审批处理步骤,直到得到目标审批结果,因此,这里对于自动审批引擎的自动审批流程不再赘述,具体参照上文。
而宏观上本发明实施例的DLP系统的自动审批实现的业务流程为:
DLP客户端发起审批流程申请,该审批流程申请中包括申请信息和文档附件,DLP客户端将申请信息发送到上述服务器的流程服务模块,将申请的文档附件发送到上述服务器的附件汇聚服务模块;
其中,申请信息包括谁在什么时间想要将哪个文档作何处理的信息,因此,该申请信息中包括审批申请者信息、申请处理的文档的信息(例如文档ID、文档名称等)、申请对该文档进行处理的处理方式(例如外发、内部共享等等)。
流程服务模块收到该申请信息后,将申请信息发送至自动审批服务模块以通知其开始执行自动审批服务;
自动审批服务模块根据申请信息中的文档信息(例如文档ID),从附件汇聚服务模块中抽取对应的待审批的附件文档,由自动审批引擎执行一系列的审批操作并得到最终的审批结果;
其中,在由自动审批引擎执行一系列的审批操作时,所用到的预设的敏感关键词与权重的对应关系则是来自于权值数据库模块。
其中,自动审批引擎在从附件汇聚服务模块中抽取对应的待审批的附件文档后,可以对附件文档进行扫描处理,从而获得文档的附属信息(例如时间、地址、文件大小、文档格式、作者等)和文档内容信息。
其中,附属信息会记录在权值数据库模块的数据库表中以备后续流程查询使用;文档内容信息则暂时存储在计算机的内存中。
自动审批服务模块将审批处理后得到的审批结果返回给流程服务模块,流程服务模块记录审批结果,并将审批结果发送至DLP客户端。
DLP客户端在收到该审批结果后就可以执行与该审批结果对应的后续操作。
例如审批流程申请为将该文档附件外发,若审批结果为审批通过,则DLP客户端将该文档附件外发;若审批结果为人工复核,则DLP客户端等待人工复核结果,不进行操作;若审批结果为审批驳回,DLP客户端不对该文档附件外发。
上述图2中的DLP系统中的审批流程的自动审批处理是集成在DLP数据核心管控服务器侧的,而在另一个实施例中,在图3中,还可以将审批流程的自动审批处理集成到DLP客户端侧,具体参照图3可以将图2中的自动审批服务模块集成到DLP客户端上。
在自动审批实现的业务流程上与图2所示的流程类似,在此不再赘述,而这里仅将与图2的流程区别做出以下说明:
首先,DLP客户端发起的审批流程申请将发送至DLP客户端的自动审批服务模块;
其次,在DLP客户端侧完成对审批流程申请的自动审批流程后,需要将审批流程的记录发送至DLP数据核心管控服务器的流程服务模块;并将审批流程中涉及的文件上传至DLP数据核心管控服务器的附件汇聚服务模块。
其他部分和流程则与图2中的描述类似,在此不再赘述。
本发明图2和图3实施例所述的DLP系统能够提高DLP系统中审批流程执行的效率;并避免审批人因为误操作或者查看附近内容不充分,而导致的关键信息资产泄漏问题;此外,由于关键信息都存储在权值数据库中,因此,还可以丰富并完善企业的关键信息资产特征数据,有助于数据管理部门风险数据整理工作的开展;对用户操作习惯无影响。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
与上述本发明实施例所提供的方法相对应,参照图4,示出了本发明一种DLP的任务审批系统实施例的结构框图,具体可以包括如下模块:
获取模块41,用于获取任务审批请求中的文档内容;
提取模块42,用于按照预设规则提取所述文档内容中的候选敏感关键词;
计算模块43,用于根据预设的敏感关键词与权重的对应关系和所述候选敏感关键词,计算所述文档内容的目标敏感度;
查找模块44,用于根据预设的敏感度区间与审批结果的对应关系,查找所述目标敏感度对应的目标敏感度区间,以及所述目标敏感度区间对应的目标审批结果;
响应模块45,用于响应所述任务审批请求,以返回所述目标审批结果。
可选地,所述提取模块42包括:
分词子模块,用于对所述文档内容进行分词处理,得到多个候选敏感关键词;
语义抽取子模块,用于对所述多个候选敏感关键词分别作语义抽取处理,得到多个候选敏感语义;
可选地,所述计算模块43包括:
第一计算子模块,用于根据预设的敏感语义与权重的对应关系和所述多个候选敏感语义,计算所述文档内容的目标敏感度。
可选地,所述提取模块42还包括:
提取子模块,用于按照预设的正则表达式提取所述文档内容中的候选敏感关键词。
可选地,所述计算模块43包括:
第一确定子模块,用于根据预设的敏感关键词与权重的对应关系,确定所述候选敏感关键词中存在对应权重的目标敏感关键词,以及所述目标敏感关键词对应的目标权重;
第二确定子模块,用于确定每个目标敏感关键词在所述文档内容中出现的目标次数;
第二计算子模块,用于根据每个目标敏感关键词的目标次数以及目标权重,计算所述文档内容的目标敏感度。
可选地,所述目标审批结果包括以下之一:审批通过、审批驳回、人工复核。
对于系统实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、系统、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种DLP系统的任务审批方法和一种DLP系统的任务审批系统,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种数据防泄漏系统的任务审批方法,其特征在于,包括:
获取任务审批请求中的文档内容;
按照预设规则提取所述文档内容中的候选敏感关键词;
根据预设的敏感关键词与权重的对应关系和所述候选敏感关键词,计算所述文档内容的目标敏感度;
根据预设的敏感度区间与审批结果的对应关系,查找所述目标敏感度对应的目标敏感度区间,以及所述目标敏感度区间对应的目标审批结果;
响应所述任务审批请求,以返回所述目标审批结果。
2.根据权利要求1所述的方法,其特征在于,所述按照预设规则提取所述文档内容中的候选敏感关键词,包括:
对所述文档内容进行分词处理,得到多个候选敏感关键词;
对所述多个候选敏感关键词分别作语义抽取处理,得到多个候选敏感语义;
所述根据预设的敏感关键词与权重的对应关系和所述候选敏感关键词,计算所述文档内容的目标敏感度,包括:
根据预设的敏感语义与权重的对应关系和所述多个候选敏感语义,计算所述文档内容的目标敏感度。
3.根据权利要求1所述的方法,其特征在于,所述按照预设规则提取所述文档内容中的候选敏感关键词,还包括:
按照预设的正则表达式提取所述文档内容中的候选敏感关键词。
4.根据权利要求1所述的方法,其特征在于,所述根据预设的敏感关键词与权重的对应关系和所述候选敏感关键词,计算所述文档内容的目标敏感度,包括:
根据预设的敏感关键词与权重的对应关系,确定所述候选敏感关键词中存在对应权重的目标敏感关键词,以及所述目标敏感关键词对应的目标权重;
确定每个目标敏感关键词在所述文档内容中出现的目标次数;
根据每个目标敏感关键词的目标次数以及目标权重,计算所述文档内容的目标敏感度。
5.根据权利要求1所述的方法,其特征在于,所述目标审批结果包括以下之一:审批通过、审批驳回、人工复核。
6.一种数据防泄漏系统的任务审批系统,其特征在于,包括:
获取模块,用于获取任务审批请求中的文档内容;
提取模块,用于按照预设规则提取所述文档内容中的候选敏感关键词;
计算模块,用于根据预设的敏感关键词与权重的对应关系和所述候选敏感关键词,计算所述文档内容的目标敏感度;
查找模块,用于根据预设的敏感度区间与审批结果的对应关系,查找所述目标敏感度对应的目标敏感度区间,以及所述目标敏感度区间对应的目标审批结果;
响应模块,用于响应所述任务审批请求,以返回所述目标审批结果。
7.根据权利要求6所述的任务审批系统,其特征在于,所述提取模块包括:
分词子模块,用于对所述文档内容进行分词处理,得到多个候选敏感关键词;
语义抽取子模块,用于对所述多个候选敏感关键词分别作语义抽取处理,得到多个候选敏感语义;
所述计算模块包括:
第一计算子模块,用于根据预设的敏感语义与权重的对应关系和所述多个候选敏感语义,计算所述文档内容的目标敏感度。
8.根据权利要求6所述的任务审批系统,其特征在于,所述提取模块还包括:
提取子模块,用于按照预设的正则表达式提取所述文档内容中的候选敏感关键词。
9.根据权利要求6所述的任务审批系统,其特征在于,所述计算模块包括:
第一确定子模块,用于根据预设的敏感关键词与权重的对应关系,确定所述候选敏感关键词中存在对应权重的目标敏感关键词,以及所述目标敏感关键词对应的目标权重;
第二确定子模块,用于确定每个目标敏感关键词在所述文档内容中出现的目标次数;
第二计算子模块,用于根据每个目标敏感关键词的目标次数以及目标权重,计算所述文档内容的目标敏感度。
10.根据权利要求6所述的任务审批系统,其特征在于,所述目标审批结果包括以下之一:审批通过、审批驳回、人工复核。
CN201710765311.0A 2017-08-30 2017-08-30 一种数据防泄漏系统的任务审批方法和系统 Pending CN107633380A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710765311.0A CN107633380A (zh) 2017-08-30 2017-08-30 一种数据防泄漏系统的任务审批方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710765311.0A CN107633380A (zh) 2017-08-30 2017-08-30 一种数据防泄漏系统的任务审批方法和系统

Publications (1)

Publication Number Publication Date
CN107633380A true CN107633380A (zh) 2018-01-26

Family

ID=61099892

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710765311.0A Pending CN107633380A (zh) 2017-08-30 2017-08-30 一种数据防泄漏系统的任务审批方法和系统

Country Status (1)

Country Link
CN (1) CN107633380A (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108664801A (zh) * 2018-03-15 2018-10-16 北京明朝万达科技股份有限公司 一种结合机器学习的数据防泄漏策略动态更新方法及装置
CN109101574A (zh) * 2018-07-18 2018-12-28 北京明朝万达科技股份有限公司 一种数据防泄漏系统的任务审批方法和系统
CN109446837A (zh) * 2018-10-12 2019-03-08 深圳前海微众银行股份有限公司 基于敏感信息的文本审核方法、设备及可读存储介质
WO2019153605A1 (zh) * 2018-02-06 2019-08-15 平安科技(深圳)有限公司 文本中敏感信息的鉴定方法、电子装置及可读存储介质
CN110163558A (zh) * 2019-04-16 2019-08-23 平安科技(深圳)有限公司 审批单审批方法、装置、计算机设备和存储介质
CN110674529A (zh) * 2019-09-24 2020-01-10 恩亿科(北京)数据科技有限公司 一种基于数据安全信息的文档审核方法及文档审核装置
CN111008401A (zh) * 2019-12-10 2020-04-14 中国银行股份有限公司 一种文本保存方法及装置
CN111031329A (zh) * 2018-10-10 2020-04-17 北京默契破冰科技有限公司 一种用于管理音频数据的方法、设备和计算机存储介质
CN111107380A (zh) * 2018-10-10 2020-05-05 北京默契破冰科技有限公司 一种用于管理音频数据的方法、设备和计算机存储介质
CN111695876A (zh) * 2020-06-16 2020-09-22 北京同邦卓益科技有限公司 审批流程处理方法、装置、设备及存储介质
CN112184159A (zh) * 2020-09-25 2021-01-05 浪潮云信息技术股份公司 基于国产cpu的审批意见设置方法、装置及介质
CN112507384A (zh) * 2020-12-22 2021-03-16 北京明朝万达科技股份有限公司 一种数据外发行为的处理方法和装置
CN112580092A (zh) * 2020-12-07 2021-03-30 北京明朝万达科技股份有限公司 一种敏感文件识别方法及装置
CN113094659A (zh) * 2021-03-17 2021-07-09 青岛海尔科技有限公司 用于应用文件发布的方法、装置、平台设备及系统
CN113344527A (zh) * 2021-06-04 2021-09-03 内蒙古自治区锡林郭勒盟中级人民法院 一体化管理存储司法建议信息的方法及平台
CN115277083A (zh) * 2022-06-23 2022-11-01 武汉联影医疗科技有限公司 数据传输控制方法、装置、系统、计算机设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101068229A (zh) * 2007-06-08 2007-11-07 北京工业大学 一种基于网络过滤器的内容过滤网关实现方法
CN104796290A (zh) * 2015-04-24 2015-07-22 广东电网有限责任公司信息中心 一种数据安全管控方法及平台
CN106446707A (zh) * 2016-08-31 2017-02-22 北京明朝万达科技股份有限公司 一种数据动态防泄漏系统及方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101068229A (zh) * 2007-06-08 2007-11-07 北京工业大学 一种基于网络过滤器的内容过滤网关实现方法
CN104796290A (zh) * 2015-04-24 2015-07-22 广东电网有限责任公司信息中心 一种数据安全管控方法及平台
CN106446707A (zh) * 2016-08-31 2017-02-22 北京明朝万达科技股份有限公司 一种数据动态防泄漏系统及方法

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019153605A1 (zh) * 2018-02-06 2019-08-15 平安科技(深圳)有限公司 文本中敏感信息的鉴定方法、电子装置及可读存储介质
CN108664801B (zh) * 2018-03-15 2020-07-10 北京明朝万达科技股份有限公司 一种结合机器学习的数据防泄漏策略动态更新方法及装置
CN108664801A (zh) * 2018-03-15 2018-10-16 北京明朝万达科技股份有限公司 一种结合机器学习的数据防泄漏策略动态更新方法及装置
CN109101574A (zh) * 2018-07-18 2018-12-28 北京明朝万达科技股份有限公司 一种数据防泄漏系统的任务审批方法和系统
CN109101574B (zh) * 2018-07-18 2020-09-25 北京明朝万达科技股份有限公司 一种数据防泄漏系统的任务审批方法和系统
CN111107380A (zh) * 2018-10-10 2020-05-05 北京默契破冰科技有限公司 一种用于管理音频数据的方法、设备和计算机存储介质
CN111031329A (zh) * 2018-10-10 2020-04-17 北京默契破冰科技有限公司 一种用于管理音频数据的方法、设备和计算机存储介质
CN111107380B (zh) * 2018-10-10 2023-08-15 北京默契破冰科技有限公司 一种用于管理音频数据的方法、设备和计算机存储介质
CN111031329B (zh) * 2018-10-10 2023-08-15 北京默契破冰科技有限公司 一种用于管理音频数据的方法、设备和计算机存储介质
CN109446837B (zh) * 2018-10-12 2022-04-26 深圳前海微众银行股份有限公司 基于敏感信息的文本审核方法、设备及可读存储介质
CN109446837A (zh) * 2018-10-12 2019-03-08 深圳前海微众银行股份有限公司 基于敏感信息的文本审核方法、设备及可读存储介质
CN110163558A (zh) * 2019-04-16 2019-08-23 平安科技(深圳)有限公司 审批单审批方法、装置、计算机设备和存储介质
CN110163558B (zh) * 2019-04-16 2024-05-07 平安科技(深圳)有限公司 审批单审批方法、装置、计算机设备和存储介质
CN110674529A (zh) * 2019-09-24 2020-01-10 恩亿科(北京)数据科技有限公司 一种基于数据安全信息的文档审核方法及文档审核装置
CN111008401A (zh) * 2019-12-10 2020-04-14 中国银行股份有限公司 一种文本保存方法及装置
CN111695876A (zh) * 2020-06-16 2020-09-22 北京同邦卓益科技有限公司 审批流程处理方法、装置、设备及存储介质
CN112184159A (zh) * 2020-09-25 2021-01-05 浪潮云信息技术股份公司 基于国产cpu的审批意见设置方法、装置及介质
CN112580092A (zh) * 2020-12-07 2021-03-30 北京明朝万达科技股份有限公司 一种敏感文件识别方法及装置
CN112507384B (zh) * 2020-12-22 2022-10-04 北京明朝万达科技股份有限公司 一种数据外发行为的处理方法和装置
CN112507384A (zh) * 2020-12-22 2021-03-16 北京明朝万达科技股份有限公司 一种数据外发行为的处理方法和装置
CN113094659A (zh) * 2021-03-17 2021-07-09 青岛海尔科技有限公司 用于应用文件发布的方法、装置、平台设备及系统
CN113344527A (zh) * 2021-06-04 2021-09-03 内蒙古自治区锡林郭勒盟中级人民法院 一体化管理存储司法建议信息的方法及平台
CN113344527B (zh) * 2021-06-04 2023-04-07 内蒙古自治区锡林郭勒盟中级人民法院 一体化管理存储司法建议信息的方法及平台
CN115277083A (zh) * 2022-06-23 2022-11-01 武汉联影医疗科技有限公司 数据传输控制方法、装置、系统、计算机设备
CN115277083B (zh) * 2022-06-23 2024-03-22 武汉联影医疗科技有限公司 数据传输控制方法、装置、系统、计算机设备

Similar Documents

Publication Publication Date Title
CN107633380A (zh) 一种数据防泄漏系统的任务审批方法和系统
CN110147726B (zh) 业务质检方法和装置、存储介质及电子装置
CN110399609B (zh) 意图识别方法、装置、设备及计算机可读存储介质
CN110083623B (zh) 一种业务规则生成方法及装置
CN108829682B (zh) 计算机可读存储介质、智能问答方法及智能问答装置
CN104750674B (zh) 一种人机会话满意度预测方法及系统
CN111640436B (zh) 向坐席提供通话对象的动态客户画像的方法
CN112035599B (zh) 基于垂直搜索的查询方法、装置、计算机设备及存储介质
CN108198017B (zh) 个性化客服处理方法及装置
KR102244938B1 (ko) 인공지능 채용 시스템 및 상기 시스템의 채용 방법
CN112464036B (zh) 一种违规数据的审核方法及装置
CN110334356A (zh) 文章质量的确定方法、文章筛选方法、以及相应的装置
CN115470338B (zh) 一种基于多路召回的多场景智能问答方法和系统
KR102155877B1 (ko) 인공지능 학습 데이터 생성을 위한 크라우드소싱 플랫폼의 참여 자격에 매칭되는 프로젝트 정보 제공 방법
CN116150349A (zh) 一种数据产品安全合规性检查方法、装置及服务器
CN114860742A (zh) 基于人工智能的ai客服交互方法、装置、设备及介质
CN105786929B (zh) 一种信息监测方法及装置
Wu et al. An eyeball diagram: Illustrating the common CSFs in e-commerce business satisfaction for successful adoption of e-commerce systems by SMEs
CN112668284B (zh) 一种法律文书分段方法及系统
CN110134866A (zh) 信息推荐方法及装置
JP2008282111A (ja) 類似文書検索方法、プログラムおよび装置
CN114417010A (zh) 面向实时工作流的知识图谱构建方法、装置和存储介质
CN109978302A (zh) 一种信用评分方法及设备
CN114356982A (zh) 营销合规性检查方法、装置、计算机设备及存储介质
WO2023272833A1 (zh) 一种数据检测方法、装置、设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180126