CN106685910A

CN106685910A - 一种应用内容的自动化安全监管系统与方法

Info

Publication number: CN106685910A
Application number: CN201610597929.6A
Authority: CN
Inventors: 曾兵; 贾宇; 沈宜; 董文杰
Original assignee: CHENGDU 30KAITIAN COMMUNICATION INDUSTRY Co Ltd
Current assignee: CHENGDU 30KAITIAN COMMUNICATION INDUSTRY Co Ltd
Priority date: 2016-07-27
Filing date: 2016-07-27
Publication date: 2017-05-17

Abstract

本发明公开了一种应用内容的自动化安全监管系统与方法,所述的系统包括：应用抓取子系统，用于从互联网中抓取和下载应用程序；内容安全监管子系统，用于安装抓取到的应用程序，并对应用程序中的图片和文字进行抓包处理；内容识别子系统,用于记录当前监管的应用程序，并对文本、图片信息进行识别，在出现不良信息时通知管理员。本发明首先对互联网上存在的应用程序进行抓取和安装，再对安装好的应用程序中所有页面的文字和图像进行抓包操作，最后对抓包得到的文字图像进行识别，发现不良信息时通知管理员，实现了应用内容的自动化安全监管。

Description

一种应用内容的自动化安全监管系统与方法

技术领域

本发明涉及一种应用内容的自动化安全监管系统与方法。

背景技术

随着计算机技术，通信技术和多媒体技术的不断发展和融合，各种多媒体应用迅速在社会各个领域发展壮大；用户在享受海量应用带来的便利时，大量不法信息也随着这些应用广泛传播，严重干扰了正常的国家秩序，进而产生巨大的社会舆论压力，让任何政府部门和机构都无法忽视。

由于网络中海量的应用程序如果采用人工审核的方式，必然会造成大量人力和财力资源的浪费；因此如何有效实现对网上信息的监管，及时发现服务器上的反动、邪教、色情等不良内容, 提供一个健康的互联网成长环境, 是我们面临的一个严肃的问题。

发明内容

本发明的目的在于克服现有技术的不足，提供一种应用内容的自动化安全监管系统与方法，首先对互联网上存在的应用程序进行抓取和安装，再对安装好的应用程序中所有页面的文字和图像进行抓包操作，最后对抓包得到的文字图像进行识别，发现不良信息时通知管理员，实现了应用内容的自动化安全监管。

本发明的目的是通过以下技术方案来实现的：一种应用内容的自动化安全监管系统，包括：

应用抓取子系统，用于从互联网中抓取和下载应用程序；

内容安全监管子系统，用于安装抓取到的应用程序，并对应用程序中的图片和文字进行抓包处理；

内容识别子系统,用于记录当前监管的应用程序，并对文本、图片信息进行识别，在出现不良信息时通知管理员。

所述的应用抓取子系统包括：

抓取模块，用于抓取互联网中存在的应用程序；

下载模块，用于对抓取到的应用程序进行下载；

推送模块，用于将下载的应用程序推送给内容安全监管子系统并进行通知。

所述的内容安全监管子系统包括：

安装模块，用于对应用抓取子系统下载的应用程序进行安装；

抓包模块，用于启动安装好的应用程序，并对应用程序中所有页面的文字和图像进行抓包；

传输模块，用于将抓包得到的文字和图像传输给内容识别子系统。

所述的内容识别子系统包括：

记录模块，用于记录当前监管的应用程序；

识别模块，用于对抓包得到的文字和图像进行识别；

通知模块，用于在识别到不良信息时通知管理员。

所述的一种应用内容的自动化安全监管系统的监管方法，包括以下步骤：

S1.应用抓取子系统从互联网中抓取和下载应用程序；

S2.内容安全监管子系统安装抓取到的应用程序，并对应用程序中的图片和文字进行抓包处理；

S3.内容识别子系统记录当前监管的应用程序，并对文本、图片信息进行识别，在出现不良信息时通知管理员。

所述的步骤S1包括以下子步骤：

S11.应用抓取子系统抓取互联网中存在的应用程序；

S12.应用抓取子系统对抓取到的应用程序进行下载；

S13.应用抓取子系统将下载的应用程序推送给内容安全监管子系统并进行通知。

所述的步骤S2包括以下子步骤：

S21.内容安全监管子系统对应用抓取子系统下载的应用程序进行安装；

S22.内容安全监管子系统,启动安装好的应用程序，并对应用程序中所有页面的文字和图像进行抓包；

S23.内容安全监管子系统将抓包得到的文字和图像传输给内容识别子系统。

所述的步骤S3包括以下子步骤：

S31.内容识别子系统记录当前监管的应用程序；

S32.内容识别子系统对从当前监管的应用程序中抓包得到的文字和图像进行识别；

S33.内容识别子系统识别到不良信息时，对管理员进行通知。

所述的步骤S22包括以下子步骤：

S221.启动安装好的应用程序,进入应用程序首页；

S222.内容安全监管子系统抓取当前页面中的图片和文本信息，传输到内容识别子系统；

S223.内容安全监管子系统计算当前页面中能够点击的控件数量进行计算并记录每个控件的坐标信息；

S224.判断当前页面是否存在未点击的控件：

（1）如果当前页面中存在未点击的控件，点击对应控件，进入下一级页面，并转至步骤S222；

（2）如果当前页面不存在未点击的控件，进入步骤S225；

进一步地，本申请中的控件指的是应用程序中的界面按钮；点击控件即调用系统的API接口来实现。

S225.判断当前页面是否为应用程序首页；

（1）当前页面不是应用程序首页，返回上一级页面，并转至步骤S224；

（2）当前页面是应用程序首页，返回步骤S1，进行下一个应用程序的抓取。

本发明的有益效果是：本发明中首先对互联网上存在的应用程序进行抓取和安装，再对安装好的应用程序中所有页面的文字和图像进行抓包操作，最后对抓包得到的文字图像进行识别，发现不良信息时通知管理员，实现了应用内容的自动化安全监管。

附图说明

图1为本发明的系统原理框图；

图2为本发明的方法流程图；

图3为应用程序图片和文字的抓包流程图。

具体实施方式

下面结合附图进一步详细描述本发明的技术方案，但本发明的保护范围不局限于以下所述。

如图1所示，一种应用内容的自动化安全监管系统，包括：

应用抓取子系统，用于从互联网中抓取和下载应用程序；

本申请可以应用于android系统、iOS系统、以及PC端的各种操作系统中，其中在android系统中的应用尤为重要。

在一个实施例中，本申请的内容安全监管子系统可以只有一个，内容安全监管子系统分别与应用抓取子系统和内容识别子系统连接和通讯。

在另一个实施例中，本申请的内容安全监管子系统也可以是多个，每个内容安全监管子系统均分别与应用抓取子系统和内容识别子系统连接和通讯；这种情况下，可以同时对多个应用程序进行安装和文字图片的抓包。

所述的应用抓取子系统包括：

抓取模块，用于抓取互联网中存在的应用程序；

下载模块，用于对抓取到的应用程序进行下载；

在本申请中，可以通过网络爬虫的方式或者手动下载，并保存应用程序名称和MD5值，避免对相同应用做重复的鉴定。

MD5即Message-Digest Algorithm 5(信息-摘要算法5)，用于确保信息传输完整一致。是计算机广泛使用的杂凑算法之一(又译摘要算法、哈希算法)，主流编程语言普遍已有MD5实现。

所述的内容安全监管子系统包括：

所述的内容识别子系统包括：

记录模块，用于记录当前监管的应用程序；

识别模块，用于对抓包得到的文字和图像进行识别；

通知模块，用于在识别到不良信息时通知管理员。

如图2所示，所述的一种应用内容的自动化安全监管系统的监管方法，包括以下步骤：

S1.应用抓取子系统从互联网中抓取和下载应用程序；

所述的步骤S1包括以下子步骤：

S11.应用抓取子系统抓取互联网中存在的应用程序；

S12.应用抓取子系统对抓取到的应用程序进行下载；

所述的步骤S2包括以下子步骤：

所述的步骤S3包括以下子步骤：

S31.内容识别子系统记录当前监管的应用程序；

S33.内容识别子系统识别到不良信息时，对管理员进行通知。

如图3所示，所述的步骤S22包括以下子步骤：

S221.启动安装好的应用程序,进入应用程序首页；

S224.判断当前页面是否存在未点击的控件：

（1）如果当前页面中存在未点击的控件，点击对应控件（任意一个未点击控件），进入下一级页面，并转至步骤S222；

（2）如果当前页面不存在未点击的控件，进入步骤S225；

进一步地，本申请中的控件指的是应用程序中的界面按钮；点击控件通过调用系统的API接口来实现，如在android系统可调用android系统的API接口实现控件点击。

S225.判断当前页面是否为应用程序首页；

在本申请中，当某个页面不存在能够点击控件时，认为其未点击的控件为0（不存在未点击控件）。

基于图3所示的应用程序图片和文字的抓包流程，在启动应用程序后，首先对首页信息进行抓包，计算控件数量和坐标（此时首页必然存在未点击控件），点击其中一个控件进入下一级页面（二级页面），返回步骤S222，并按照步骤S222~S225进行循环操作：这样能够保证首页中各个控件对应的二级页面及其下属页面（三级页面、四级页面、五级页面等）的图像和文字全部被抓包；循环过程中如果返回了首页，且首页不存在未点击控件，说明整个应用程序抓包结束，这时返回步骤S1，进行下一个应用程序的抓取；对应用程序中所有页面的文字和图像实现了抓包。

需要说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本发明技术方案的宗旨和范围，其均应涵盖在本发明的权利要求范围当中。

Claims

1.一种应用内容的自动化安全监管系统，其特征在于：包括：

应用抓取子系统，用于从互联网中抓取和下载应用程序；

2.根据权利要求1所述的一种应用内容的自动化安全监管系统，其特征在于：所述的应用抓取子系统包括：

抓取模块，用于抓取互联网中存在的应用程序；

下载模块，用于对抓取到的应用程序进行下载；

3.根据权利要求1所述的一种应用内容的自动化安全监管系统，其特征在于：所述的内容安全监管子系统包括：

4.根据权利要求1所述的一种应用内容的自动化安全监管系统，其特征在于：所述的内容识别子系统包括：

记录模块，用于记录当前监管的应用程序；

识别模块，用于对抓包得到的文字和图像进行识别；

通知模块，用于在识别到不良信息时通知管理员。

5.如权利要求1~4中任意一项所述的一种应用内容的自动化安全监管系统的监管方法，其特征在于：包括以下步骤：

S1.应用抓取子系统从互联网中抓取和下载应用程序；

6.根据权利要求5所述的一种应用内容的自动化安全监管系统的监管方法，其特征在于：所述的步骤S1包括以下子步骤：

S11.应用抓取子系统抓取互联网中存在的应用程序；

S12.应用抓取子系统对抓取到的应用程序进行下载；

7.根据权利要求5所述的一种应用内容的自动化安全监管系统的监管方法，其特征在于：所述的步骤S2包括以下子步骤：

8.根据权利要求5所述的一种应用内容的自动化安全监管系统的监管方法，其特征在于：所述的步骤S3包括以下子步骤：

S31.内容识别子系统记录当前监管的应用程序；

S33.内容识别子系统识别到不良信息时，对管理员进行通知。

9.根据权利要求7所述的一种应用内容的自动化安全监管系统的监管方法，其特征在于：所述的步骤S22包括以下子步骤：

S221.启动安装好的应用程序,进入应用程序首页；

S223.内容安全监管子系统计算当前页面中能够点击的控件数量,并记录每个控件的坐标信息；

S224.判断当前页面是否存在未点击的控件：

（2）如果当前页面不存在未点击的控件，进入步骤S225；

S225.判断当前页面是否为应用程序首页；