CN107172081B

CN107172081B - 一种数据校验的方法和装置

Info

Publication number: CN107172081B
Application number: CN201710510464.0A
Authority: CN
Inventors: 魏效征; 王志海; 喻波; 安鹏
Original assignee: Beijing Wondersoft Technology Co Ltd
Current assignee: Beijing Wondersoft Technology Co Ltd
Priority date: 2017-06-28
Filing date: 2017-06-28
Publication date: 2019-08-16
Anticipated expiration: 2037-06-28
Also published as: CN107172081A

Abstract

本发明实施例提供了一种数据校验的方法和装置，所述方法包括：代理服务器接收终端发送的对象获取请求，并将所述对象获取请求发送至内网服务器；其中，所述终端为处于外网的终端；接收所述内网服务器针对所述对象获取请求返回的目标业务对象；从所述目标业务对象中提取文本内容；对所述文本内容进行校验；在所述校验不通过时，阻断所述目标业务对象的发送；通过本发明实施例，实现了直接对应用层数据的内容分析，提升了数据分析的可靠性，避免了物理拓扑结构的限制，也避免了基于TCP的数据分析方式的流程复杂、适应性差等缺点。

Description

一种数据校验的方法和装置

技术领域

本发明涉及数据处理领域，特别是涉及一种数据校验的方法和装置。

背景技术

随着移动互联网的发展，越来越多的企业允许员工在企业外部进行移动办公，企业外部的手机、笔记本先连接到企业的反向代理，再通过反向代理连接到企业内网的资源服务器上。

由于企业外部的手机、笔记本已经脱离了企业内部环境的策略管控，反向代理一方面实现了移动办公，另一方面却引起了企业敏感数据外泄的风险，而在现有技术主要是通过对TCP(Transmission Control Protocol，传输控制协议)数据包的分析来阻止企业敏感数据外泄。

但是，采用现有技术的方法时，网关设备需要物理串接到特定的网络路径上，且基于TCP的分析程序处理流程复杂、适应性差，由于TCP超时机制的存在，处理过程必须近实时完成，导致无法完成数量较大的复杂策略的匹配，更加无法处理在TCP层之上的数据重传、超时等异常错误。

发明内容

鉴于上述问题，提出了本发明实施例以便提供克服上述问题或者至少部分地解决上述问题的一种数据校验的方法和装置。

为了解决上述问题，本发明实施例公开了一种数据校验的方法，所述方法包括：

代理服务器接收终端发送的对象获取请求，并将所述对象获取请求发送至内网服务器；其中，所述终端为处于外网的终端；

接收所述内网服务器针对所述对象获取请求返回的目标业务对象；

从所述目标业务对象中提取文本内容；

对所述文本内容进行校验；

在所述校验不通过时，阻断所述目标业务对象的发送。

优选地，所述接收所述内网服务器针对所述对象获取请求返回的目标业务对象的步骤包括：

接收所述内网服务器针对所述对象获取请求返回的一个或多个数据包；

将所述一个或多个数据包组织成会话数据；

从所述会话数据中提取出目标业务对象。

优选地，所述从所述会话数据中提取出目标业务对象的步骤包括：

采用ICAP和/或WebService接口从所述会话数据中提取出目标业务对象。

优选地，所述对所述文本内容进行校验的步骤包括：

确定所述文本内容的敏感等级；

基于所述敏感等级确定对所述文本内容进行校验的校验结果。

优选地，所述基于所述敏感等级确定对所述文本内容进行校验的校验结果的步骤包括：

判断所述敏感等级是否大于预设敏感等级值；

若是，则判定对所述文本内容进行校验不通过；

若否，则判定对所述文本内容进行校验通过。

优选地，所述对象获取请求包括用户标识，所述基于所述敏感等级确定对所述文本内容进行校验的校验结果的步骤包括：

获取所述用户标识对应的权限等级；

判断所述权限等级是否与所述敏感等级匹配；

若是，则判定对所述文本内容进行校验通过；

若否，则判定对所述文本内容进行校验不通过。

优选地，所述确定所述文本内容的敏感等级的步骤包括：

对所述文本内容进行分词操作，得到一个或多个分词；

从所述一个或多个分词中提取特征词；

在预置的敏感词数据库中匹配所述特征词；其中，所述敏感词数据库包括多个敏感等级以及每个敏感等级对应的一个或多个敏感词；

确定所述特征词对应的敏感等级，作为所述文本内容的敏感等级。

优选地，所述方法还包括：

在所述校验通过时，将所述目标业务对象发送至所述终端。

优选地，所述在所述校验通过时，将所述目标业务对象发送至所述终端的步骤包括：

在所述校验通过时，判断所述文本内容是否符合指定条件；

当所述文本内容符合指定条件时，对所述目标业务对象执行指定操作，并将所述执行指定操作后的目标业务对象发送至所述终端。

优选地，所述指定操作包括但不限于以下任一项：

加密、添加标识、修改。

本发明实施例还公开了一种数据校验的装置，所述装置包括：

对象获取请求发送模块，用于接收终端发送的对象获取请求，并将所述对象获取请求发送至内网服务器；其中，所述终端为处于外网的终端；

目标业务对象接收模块，用于接收所述内网服务器针对所述对象获取请求返回的目标业务对象；

文本内容提取模块，用于从所述目标业务对象中提取文本内容；

文本内容校验模块，用于对所述文本内容进行校验；

阻断发送模块，用于在所述校验不通过时，阻断所述目标业务对象的发送。

本发明实施例还公开了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现以下步骤：

接收终端发送的对象获取请求，并将所述对象获取请求发送至内网服务器；其中，所述终端为处于外网的终端；

从所述目标业务对象中提取文本内容；

对所述文本内容进行校验；

在所述校验不通过时，阻断所述目标业务对象的发送。

本发明实施例还公开了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如上所述方法的步骤。

本发明实施例包括以下优点：

在本发明实施例中，代理服务器可以接收处于外网的终端发送的对象获取请求，并将对象获取请求发送至内网服务器，然后接收内网服务器返回的目标业务对象，从目标业务对象中提取文本内容，对文本内容进行校验，在校验不通过时，阻断目标业务对象的发送，实现了直接对应用层数据的内容分析，提升了数据分析的可靠性，避免了物理拓扑结构的限制，也避免了基于TCP的数据分析方式的流程复杂、适应性差等缺点。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例的一种数据校验的方法的步骤流程图；

图2是本发明实施例的一种网络拓扑图；

图3是本发明实施例的一种数据校验的装置的结构框图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参照图1，示出了本发明实施例的一种数据校验的方法的步骤流程图。

在本发明实施例中，如图2所示，代理服务器201与一个或多个内网服务器202相连接，终端203可以通过互联网204连接到代理服务器201。

其中，代理服务器201可以为反向代理服务器，代理服务器201可以采用反向代理(Reverse Proxy)方式提供服务，反向代理方式是指以代理服务器来接受Internet上的连接请求，然后将请求转发给内部网络上的服务器，并将从服务器上得到的结果返回给Internet上请求连接的客户端。

需要说明的是，代理服务器201可以为虚拟服务或者实体服务器，也可以将代理服务器201的功能部署在其他服务器上，如DNS(Domain Name System，域名系统)服务器。

内网服务器202可以为处于企业内部网络中，可以向外提供服务的服务器，如Web服务器、应用服务器、邮件服务器等。

终端203可以具有特定的客户端，终端203可以通过客户端实现与代理服务器201的连接。

具体的，本发明实施例可以包括如下步骤：

步骤101，代理服务器接收终端发送的对象获取请求，并将所述对象获取请求发送至内网服务器；其中，所述终端为处于外网的终端；

在本发明实施例中，当处于外网的终端需要从企业的内部服务器获取业务对象时，可以先通过终端的客户端请求与代理服务器建立连接，如VPN(Virtual PrivateNetwork，虚拟专用网络)客户端，代理服务器验证终端的身份后，建立与终端的连接。

在建立连接之后，终端可以向代理服务器发送对象获取请求，代理服务器接收到对象获取请求之后，可以从对象获取请求中确定某一个内网服务器，将对象获取请求发送至内网服务器。

步骤102，接收所述内网服务器针对所述对象获取请求返回的目标业务对象；

在代理服务器将对象获取请求发送到内网服务器后，内网服务器可以查找到对象获取请求对应的目标业务对象，将目标业务对象返回给代理服务器，代理服务器可以在应用层直接获取目标业务对象。

作为一种示例，目标业务对象可以PDF(Portable Document Format，便携式文档格式)文件、TXT(文本文档)文件、邮件、网页、图片等，本发明对此不作限制。

在本发明一种优选实施例中，步骤102可以包括如下子步骤：

子步骤S11，接收所述内网服务器针对所述对象获取请求返回的一个或多个数据包；

在内网服务器查找到对象获取请求对应的目标业务对象后，内网服务器可以将目标业务对象划分成一个或多个数据包，将一个或多个数据包依次返回代理服务器。

子步骤S12，将所述一个或多个数据包组织成会话数据；

代理服务器在接收到目标业务对象的第一个数据包时，查看数据包的表头即可以确定最后一个数据包，在收到最后一个数据包时，将所有的数据包组织成会话数据，如HTTP(HyperText TransferProtocol，超文本传输协议)会话数据。

子步骤S13，从所述会话数据中提取出目标业务对象。

在获得会话数据之后，代理服务器可以在应用层上，从会话数据中提取出目标业务对象，如从HTTP会话数据中提取出PDF、DOC文件、表格诗句。

在本发明一种优选实施例中，子步骤S13可以包括如下子步骤：

采用ICAP(Internet ContentAdaptation Protocol)和/或Webservice接口从所述会话数据中提取出目标业务对象。

在本发明实施例中，代理服务器可以采用ICAP和/或WebService接口，在应用层上，从会话数据中提取出目标业务对象。

其中，ICAP在本质上是在HTTP message上执行RPC(Remote Procedure CallProtocol，远程过程调用协议)远程过程调用的一种轻量级的协议，也就是说，它让ICAPClient可以把HTTP Message传给ICAP Server,，然后ICAP Server可以对其进行某种变换或者其他处理，被变换的Message可以是HTTP请求，也可以是HTTP应答。ICAP是和HTTP协议在结构和用法上都相似的请求/应答式的协议，虽然和HTTP协议类似，但它并不是HTTP，也并不是以HTTP协议为底层协议在其上实现的应用层协议。

ICAP具有两种工作模式：

第一，请求修改模式：在请求修改模式中，ICAP Client把HTTP Request发送给ICAP Server，然后ICAP Server可以做以下处理之一:a、送回HTTP Request的一个修改后的版本，然后ICAP Client把修改后的HTTP Request交给一个Origin Server去处理，或者把修改后的Request排队送到另一个ICAP Server做进一步的修改；b、送回一个HTTPResponse，在错误发生需要给用户有用的提示信息的时侯.例如”你请求访问一个你没有权限访问的网页”；c、返回一个错误。

第二，应答修改模式：在应答修改模式中，ICAP client把HTTP Response(OriginServer所生成的)发送给ICAP Server，然后ICAP Server可以做以下之一:a、回送Response的一个修改后的版本；b、返回错误。

WebService接口可以与WebService应用程序连接，WebService是一个平台独立的、低耦合的、自包含的、基于可编程的Web的应用程序，可使用开放的XML(ExtensibleMarkup Language，可扩展标记语言)标准来描述、发布、发现、协调和配置应用程序，用于开发分布式的互操作的应用程序。

需要说明的是，代理服务器还可以通过jms(avaMessage Service)、与对端的代理服务器通过TCP Socket连接等方式来实现上述步骤。

步骤103，从所述目标业务对象中提取文本内容；

在提取出目标业务对象后，代理服务器可以从目标业务对象中提取出文本内容，如从PDF文件中提取出TXT文本内容。

步骤104，对所述文本内容进行校验；

在获得文本内容后，代理服务器可以对文本内容进行校验。

需要说明的是，代理服务器在接收到终端发送的对象获取请求时，也可以对象获取请求进行校验，但由于对象获取请求并不包含敏感内容，代理服务器并不会阻断其发送。

在本发明一种优选实施例中，步骤104可以包括如下子步骤：

子步骤S21，确定所述文本内容的敏感等级；

在本发明实施例中，不同的文本内容对应不同的敏感等级，代理服务器可以确定文本内容的敏感等级。

作为一种示例，子步骤S21可以包括如下子步骤：

子步骤S211，对所述文本内容进行分词操作，得到一个或多个分词；

由于文本内容可以由多个词组成，代理服务器可以对文本内容进行分词操作，在分词操作之后得到一个或多个分词。

子步骤S212，从所述一个或多个分词中提取特征词；

在得到一个或多个分词后，代理服务器可以从一个或多个分词中提取特征词，如代理服务器可以基于语料来提取特征词。

子步骤S213，在预置的敏感词数据库中匹配所述特征词；其中，所述敏感词数据库包括多个敏感等级以及每个敏感等级对应的一个或多个敏感词；

在本发明实施例中，代理服务器可以具有预置的敏感词数据库，敏感词数据库可以包括多个敏感等级以及每个敏感等级对应的一个或多个敏感词，在提取特征词后，代理服务器可以在敏感词数据库中的多个敏感词与特征词进行匹配。

子步骤S214，确定所述特征词对应的敏感等级，作为所述文本内容的敏感等级。

当查找到与特征词匹配的敏感词后，代理服务器可以确定敏感词对应的敏感等级，然后将敏感词对应的敏感等级作为特征词对应的敏感等级，再将特征词对应的敏感等级作为文本内容的敏感等级。

需要说明的是，本领域技术人员还可以根据实际需求，采用其他的方式确定文本内容的敏感等级，如正则引擎定义正则表达式、文件指纹以及机器学习特征等方式。

子步骤S22，基于所述敏感等级确定对所述文本内容进行校验的校验结果。

在确定文本内容的敏感等级后，代理服务器可以依据敏感等级来确定对文本内容进行校验的校验结果。

在一种实施方式中，子步骤S22可以包括如下子步骤：

判断所述敏感等级是否大于预设敏感等级值；若是，则判定对所述文本内容进行校验不通过；若否，则判定对所述文本内容进行校验通过。

在本发明实施例中，代理服务器可以具有预设敏感等级值，在确定文本内容的敏感等级后，代理服务器可以判断敏感等级是否大于预设敏感等级值，当敏感等级大于预设敏感等级值时，则判定对文本内容进行校验不通过，当敏感等级不大于预设敏感等级值时，则判定对文本内容进行校验通过。

在另一种实施方式中，对象获取请求可以包括用户标识，子步骤S22可以包括如下子步骤：

获取所述用户标识对应的权限等级；判断所述权限等级是否与所述敏感等级匹配；若是，则判定对所述文本内容进行校验通过；若否，则判定对所述文本内容进行校验不通过。

在本发明实施例中，终端发送的对象获取请求可以包括用户标识，如用户账号，代理服务器可以依据用户标识获取对应的权限等级，然后判断权限等级是否与敏感等级匹配，即判断终端是否有操作敏感等级对应的目标业务对象的权限，当权限等级与敏感等级匹配时，则判定对文本内容进行校验通过，当权限等级与敏感等级不匹配时，则判定对文本内容进行校验不通过。

步骤105，在所述校验不通过时，阻断所述目标业务对象的发送。

在校验不通过的情况下，代理服务器可以阻断目标业务对象的发送。

作为一种示例，在校验不通过的情况下，代理服务器可以向终端和/或内网服务器返回一个错误提示，然后终止会话。

本发明一种优选实施例中，所述方法还可以包括如下步骤：

在所述校验通过时，将所述目标业务对象发送至所述终端。

在检验通过的情况下，代理服务器可以将目标业务对象再划分成一个或多个数据包，再将一个或多个数据包发送给终端，终端接收到一个或多个数据包后，可以将一个或多个数据包组织成目标业务对象。

本发明一种优选实施例中，所述“在所述校验通过时，将所述目标业务对象发送至所述终端”的步骤可以包括如下子步骤：

子步骤S31，在所述校验通过时，判断所述文本内容是否符合指定条件；

在本发明实施例中，在校验通过的情况下，代理服务器可以进一步判断文本内容是否符合指定条件，如加密条件、添加标识条件、修改条件等。

子步骤S32，当所述文本内容符合指定条件时，对所述目标业务对象执行指定操作，并将所述执行指定操作后的目标业务对象发送至所述终端。

当文本内容符合指定条件时，代理服务器可以对目标业务对象执行指定操作，然后将执行指定操作后的目标业务对象发送至终端。

作为一种示例，指定操作包括但不限于以下任一项：加密、添加标识、修改。

其中，加密可以为对目标业务对象进行加密后替换原有的目标业务对象，添加标识可以包括添加水印，修改可以包括增加一个广告等，指定操作还可以包括审计、审批等操作。

为了使本领域技术人员更加清楚的理解本发明实施例，以下通过一个例子对本发明实施例加以示例性说明，但应当理解的是，本发明实施例并不限于此。

某银行的员工处于银行外的网络中，需要通过手机或者笔记本获取处于银行内的网络中邮件或者文档等数据，则具体可以包括如下步骤：

1、员工通过笔记本上的客户端请求与代理服务器建立连接，经过互联网传输到代理服务器后，代理服务器根据员工的账号、密码识别员工后，与笔记本建立连接；

2、员工再通过笔记本向代理服务器发送用于获取某个PDF文件的HTTP请求，经过互联网传输到代理服务器后，代理服务器将HTTP请求发送给对应的内部服务器，内部服务器查找到HTTP请求对应的PDF文件后，将PDF文件组成HTTP应答数据发送出去；

3、代理服务器接收到HTTP应答数据后，采用ICAP提取出HTTP应答数据中的PDF文件，然后采用纯文本转换工具，将PDF文件转换成TXT文件；

4、代理服务器采用预置的敏感词数据库中敏感词，对TXT文件中的文本内容进行校验；

5、当校验不通过时，阻断PDF文件的发送；当检验通过时，向员工的笔记本发送PDF文件。

需要说明的是，对于方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明实施例并不受所描述的动作顺序的限制，因为依据本发明实施例，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作并不一定是本发明实施例所必须的。

参照图3，示出了本发明实施例的一种数据校验的装置的结构框图，具体可以包括如下模块：

对象获取请求发送模块301，用于接收终端发送的对象获取请求，并将所述对象获取请求发送至内网服务器；其中，所述终端为处于外网的终端；

目标业务对象接收模块302，用于接收所述内网服务器针对所述对象获取请求返回的目标业务对象；

文本内容提取模块303，用于从所述目标业务对象中提取文本内容；

文本内容校验模块304，用于对所述文本内容进行校验；

阻断发送模块305，用于在所述校验不通过时，阻断所述目标业务对象的发送。

在本发明的一种优选实施例中，目标业务对象接收模块302可以包括：

数据包接收子模块，用于接收所述内网服务器针对所述对象获取请求返回的一个或多个数据包；

会话数据组织子模块，用于将所述一个或多个数据包组织成会话数据；

目标业务对象提取子模块，用于从所述会话数据中提取出目标业务对象。

在本发明的一种优选实施例中，目标业务对象提取子模块可以包括：

提取单元，用于采用ICAP和/或WebService接口从所述会话数据中提取出目标业务对象。

在本发明的一种优选实施例中，文本内容校验模块304可以包括：

敏感等级确定子模块，用于确定所述文本内容的敏感等级；

校验结果确定子模块，用于基于所述敏感等级确定对所述文本内容进行校验的校验结果。

在本发明的一种优选实施例中，校验结果确定子模块可以包括：

预设敏感等级值判断单元，用于判断所述敏感等级是否大于预设敏感等级值；

第一不通过判定单元，用于在所述敏感等级大于预设敏感等级值时，判定对所述文本内容进行校验不通过；

第一通过判定单元，用于在所述敏感等级不大于预设敏感等级值时，用于判定对所述文本内容进行校验通过。

在本发明的一种优选实施例中，对象获取请求可以包括用户标识，校验结果确定子模块可以包括：

权限等级获取单元，用于获取所述用户标识对应的权限等级；

敏感等级匹配单元，用于判断所述权限等级是否与所述敏感等级匹配；

第二通过判定单元，用于当所述权限等级与所述敏感等级匹配时，则判定对所述文本内容进行校验通过；

第二不通过判定单元，用于当所述权限等级与所述敏感等级不匹配时，判定对所述文本内容进行校验不通过。

在本发明的一种优选实施例中，敏感等级确定子模块可以包括：

分词得到单元，用于对所述文本内容进行分词操作，得到一个或多个分词；

特征词提取单元，用于从所述一个或多个分词中提取特征词；

特征词匹配单元，用于在预置的敏感词数据库中匹配所述特征词；其中，所述敏感词数据库包括多个敏感等级以及每个敏感等级对应的一个或多个敏感词；

敏感等级作为单元，用于确定所述特征词对应的敏感等级，作为所述文本内容的敏感等级。

在本发明的一种优选实施例中，所述装置还可以包括：

目标业务对象发送模块，用于在所述校验通过时，将所述目标业务对象发送至所述终端。

在本发明的一种优选实施例中，目标业务对象发送模块可以包括：

指定条件判断单元，用于在所述校验通过时，判断所述文本内容是否符合指定条件；

指定操作后发送单元，用于当所述文本内容符合指定条件时，对所述目标业务对象执行指定操作，并将所述执行指定操作后的目标业务对象发送至所述终端。

在本发明的一种优选实施例中，指定操作可以包括但不限于以下任一项：加密、添加标识、修改。

一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时可以实现以下步骤：

接收终端发送的对象获取请求，并将所述对象获取请求发送至内网服务器；其中，所述终端为处于外网的终端；接收所述内网服务器针对所述对象获取请求返回的目标业务对象；从所述目标业务对象中提取文本内容；对所述文本内容进行校验；在所述校验不通过时，阻断所述目标业务对象的发送。

优选地，所述处理器执行所述程序时还可以实现以下步骤：

接收所述内网服务器针对所述对象获取请求返回的一个或多个数据包；将所述一个或多个数据包组织成会话数据；从所述会话数据中提取出目标业务对象。

优选地，所述处理器执行所述程序时还可以实现以下步骤：

确定所述文本内容的敏感等级；基于所述敏感等级确定对所述文本内容进行校验的校验结果。

优选地，所述处理器执行所述程序时还可以实现以下步骤：

优选地，所述对象获取请求包括用户标识，所述处理器执行所述程序时还可以实现以下步骤：

优选地，所述处理器执行所述程序时还可以实现以下步骤：

对所述文本内容进行分词操作，得到一个或多个分词；从所述一个或多个分词中提取特征词；在预置的敏感词数据库中匹配所述特征词；其中，所述敏感词数据库包括多个敏感等级以及每个敏感等级对应的一个或多个敏感词；确定所述特征词对应的敏感等级，作为所述文本内容的敏感等级。

优选地，所述处理器执行所述程序时还可以实现以下步骤：

在所述校验通过时，将所述目标业务对象发送至所述终端。

优选地，所述处理器执行所述程序时还可以实现以下步骤：

在所述校验通过时，判断所述文本内容是否符合指定条件；当所述文本内容符合指定条件时，对所述目标业务对象执行指定操作，并将所述执行指定操作后的目标业务对象发送至所述终端。

优选地，所述指定操作包括但不限于以下任一项：加密、添加标识、修改。

一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时可以实现图1所述方法。

对于装置、电子设备、计算机可读存储介质实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

本领域内的技术人员应明白，本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此，本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上，使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明实施例的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

以上对本发明所提供的一种数据校验的方法和装置，进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种数据校验的方法，其特征在于，所述方法包括：

在应用层上，获取所述内网服务器针对所述对象获取请求返回的目标业务对象；

从所述目标业务对象中提取文本内容；

对所述文本内容进行校验；

在所述校验不通过时，阻断所述目标业务对象的发送；

其中，所述对所述文本内容进行校验的步骤包括：

确定所述文本内容的敏感等级；

基于所述敏感等级确定对所述文本内容进行校验的校验结果；

其中，所述基于所述敏感等级确定对所述文本内容进行校验的校验结果的步骤包括：

判断所述敏感等级是否大于预设敏感等级值；

若是，则判定对所述文本内容进行校验不通过；

若否，则判定对所述文本内容进行校验通过。

2.根据权利要求1所述的方法，其特征在于，所述获取所述内网服务器针对所述对象获取请求返回的目标业务对象的步骤包括：

将所述一个或多个数据包组织成会话数据；

从所述会话数据中提取出目标业务对象。

3.根据权利要求2所述的方法，其特征在于，所述从所述会话数据中提取出目标业务对象的步骤包括：

4.根据权利要求1所述的方法，其特征在于，所述对象获取请求包括用户标识，所述基于所述敏感等级确定对所述文本内容进行校验的校验结果的步骤包括：

获取所述用户标识对应的权限等级；

判断所述权限等级是否与所述敏感等级匹配；

若是，则判定对所述文本内容进行校验通过；

若否，则判定对所述文本内容进行校验不通过。

5.根据权利要求1或4所述的方法，其特征在于，所述确定所述文本内容的敏感等级的步骤包括：

对所述文本内容进行分词操作，得到一个或多个分词；

从所述一个或多个分词中提取特征词；

6.根据权利要求1所述的方法，其特征在于，所述方法还包括：

在所述校验通过时，将所述目标业务对象发送至所述终端。

7.根据权利要求6所述的方法，其特征在于，所述在所述校验通过时，将所述目标业务对象发送至所述终端的步骤包括：

在所述校验通过时，判断所述文本内容是否符合指定条件；

8.根据权利要求7所述的方法，其特征在于，所述指定操作包括但不限于以下任一项：

加密、添加标识、修改。

9.一种数据校验的装置，其特征在于，所述装置包括：

对象获取请求发送模块，用于代理服务器接收终端发送的对象获取请求，并将所述对象获取请求发送至内网服务器；其中，所述终端为处于外网的终端；

目标业务对象接收模块，用于在应用层上，获取所述内网服务器针对所述对象获取请求返回的目标业务对象；

文本内容校验模块，用于对所述文本内容进行校验；

阻断发送模块，用于在所述校验不通过时，阻断所述目标业务对象的发送；

其中，所述文本内容校验模块对所述文本内容进行校验的步骤具体包括：

确定所述文本内容的敏感等级；

判断所述敏感等级是否大于预设敏感等级值；

若是，则判定对所述文本内容进行校验不通过；

若否，则判定对所述文本内容进行校验通过。

10.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现以下步骤：

从所述目标业务对象中提取文本内容；

对所述文本内容进行校验；

在所述校验不通过时，阻断所述目标业务对象的发送

其中，所述对所述文本内容进行校验包括：

确定所述文本内容的敏感等级；

判断所述敏感等级是否大于预设敏感等级值；

若是，则判定对所述文本内容进行校验不通过；

若否，则判定对所述文本内容进行校验通过。

11.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1至8任一项所述方法的步骤。