CN106685910A - 一种应用内容的自动化安全监管系统与方法 - Google Patents

一种应用内容的自动化安全监管系统与方法 Download PDF

Info

Publication number
CN106685910A
CN106685910A CN201610597929.6A CN201610597929A CN106685910A CN 106685910 A CN106685910 A CN 106685910A CN 201610597929 A CN201610597929 A CN 201610597929A CN 106685910 A CN106685910 A CN 106685910A
Authority
CN
China
Prior art keywords
application program
subsystem
application
content
safety monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610597929.6A
Other languages
English (en)
Inventor
曾兵
贾宇
沈宜
董文杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CHENGDU 30KAITIAN COMMUNICATION INDUSTRY Co Ltd
Original Assignee
CHENGDU 30KAITIAN COMMUNICATION INDUSTRY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CHENGDU 30KAITIAN COMMUNICATION INDUSTRY Co Ltd filed Critical CHENGDU 30KAITIAN COMMUNICATION INDUSTRY Co Ltd
Priority to CN201610597929.6A priority Critical patent/CN106685910A/zh
Publication of CN106685910A publication Critical patent/CN106685910A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/30Network architectures or network communication protocols for network security for supporting lawful interception, monitoring or retaining of communications or communication related information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/30Network architectures or network communication protocols for network security for supporting lawful interception, monitoring or retaining of communications or communication related information
    • H04L63/306Network architectures or network communication protocols for network security for supporting lawful interception, monitoring or retaining of communications or communication related information intercepting packet switched data communications, e.g. Web, Internet or IMS communications

Abstract

本发明公开了一种应用内容的自动化安全监管系统与方法,所述的系统包括:应用抓取子系统,用于从互联网中抓取和下载应用程序;内容安全监管子系统,用于安装抓取到的应用程序,并对应用程序中的图片和文字进行抓包处理;内容识别子系统,用于记录当前监管的应用程序,并对文本、图片信息进行识别,在出现不良信息时通知管理员。本发明首先对互联网上存在的应用程序进行抓取和安装,再对安装好的应用程序中所有页面的文字和图像进行抓包操作,最后对抓包得到的文字图像进行识别,发现不良信息时通知管理员,实现了应用内容的自动化安全监管。

Description

一种应用内容的自动化安全监管系统与方法
技术领域
本发明涉及一种应用内容的自动化安全监管系统与方法。
背景技术
随着计算机技术,通信技术和多媒体技术的不断发展和融合,各种多媒体应用迅速在社会各个领域发展壮大;用户在享受海量应用带来的便利时,大量不法信息也随着这些应用广泛传播,严重干扰了正常的国家秩序,进而产生巨大的社会舆论压力,让任何政府部门和机构都无法忽视。
由于网络中海量的应用程序如果采用人工审核的方式,必然会造成大量人力和财力资源的浪费;因此如何有效实现对网上信息的监管,及时发现服务器上的反动、邪教、色情等不良内容, 提供一个健康的互联网成长环境, 是我们面临的一个严肃的问题。
发明内容
本发明的目的在于克服现有技术的不足,提供一种应用内容的自动化安全监管系统与方法,首先对互联网上存在的应用程序进行抓取和安装,再对安装好的应用程序中所有页面的文字和图像进行抓包操作,最后对抓包得到的文字图像进行识别,发现不良信息时通知管理员,实现了应用内容的自动化安全监管。
本发明的目的是通过以下技术方案来实现的: 一种应用内容的自动化安全监管系统,包括:
应用抓取子系统,用于从互联网中抓取和下载应用程序;
内容安全监管子系统,用于安装抓取到的应用程序,并对应用程序中的图片和文字进行抓包处理;
内容识别子系统,用于记录当前监管的应用程序,并对文本、图片信息进行识别,在出现不良信息时通知管理员。
所述的应用抓取子系统包括:
抓取模块,用于抓取互联网中存在的应用程序;
下载模块,用于对抓取到的应用程序进行下载;
推送模块,用于将下载的应用程序推送给内容安全监管子系统并进行通知。
所述的内容安全监管子系统包括:
安装模块,用于对应用抓取子系统下载的应用程序进行安装;
抓包模块,用于启动安装好的应用程序,并对应用程序中所有页面的文字和图像进行抓包;
传输模块,用于将抓包得到的文字和图像传输给内容识别子系统。
所述的内容识别子系统包括:
记录模块,用于记录当前监管的应用程序;
识别模块,用于对抓包得到的文字和图像进行识别;
通知模块,用于在识别到不良信息时通知管理员。
所述的一种应用内容的自动化安全监管系统的监管方法,包括以下步骤:
S1.应用抓取子系统从互联网中抓取和下载应用程序;
S2.内容安全监管子系统安装抓取到的应用程序,并对应用程序中的图片和文字进行抓包处理;
S3.内容识别子系统记录当前监管的应用程序,并对文本、图片信息进行识别,在出现不良信息时通知管理员。
所述的步骤S1包括以下子步骤:
S11.应用抓取子系统抓取互联网中存在的应用程序;
S12.应用抓取子系统对抓取到的应用程序进行下载;
S13.应用抓取子系统将下载的应用程序推送给内容安全监管子系统并进行通知。
所述的步骤S2包括以下子步骤:
S21.内容安全监管子系统对应用抓取子系统下载的应用程序进行安装;
S22.内容安全监管子系统,启动安装好的应用程序,并对应用程序中所有页面的文字和图像进行抓包;
S23.内容安全监管子系统将抓包得到的文字和图像传输给内容识别子系统。
所述的步骤S3包括以下子步骤:
S31.内容识别子系统记录当前监管的应用程序;
S32.内容识别子系统对从当前监管的应用程序中抓包得到的文字和图像进行识别;
S33.内容识别子系统识别到不良信息时,对管理员进行通知。
所述的步骤S22包括以下子步骤:
S221.启动安装好的应用程序,进入应用程序首页;
S222.内容安全监管子系统抓取当前页面中的图片和文本信息,传输到内容识别子系统;
S223.内容安全监管子系统计算当前页面中能够点击的控件数量进行计算并记录每个控件的坐标信息;
S224.判断当前页面是否存在未点击的控件:
(1)如果当前页面中存在未点击的控件,点击对应控件,进入下一级页面,并转至步骤S222;
(2)如果当前页面不存在未点击的控件,进入步骤S225;
进一步地,本申请中的控件指的是应用程序中的界面按钮;点击控件即调用系统的API接口来实现。
S225.判断当前页面是否为应用程序首页;
(1)当前页面不是应用程序首页,返回上一级页面,并转至步骤S224;
(2)当前页面是应用程序首页,返回步骤S1,进行下一个应用程序的抓取。
本发明的有益效果是:本发明中首先对互联网上存在的应用程序进行抓取和安装,再对安装好的应用程序中所有页面的文字和图像进行抓包操作,最后对抓包得到的文字图像进行识别,发现不良信息时通知管理员,实现了应用内容的自动化安全监管。
附图说明
图1为本发明的系统原理框图;
图2为本发明的方法流程图;
图3为应用程序图片和文字的抓包流程图。
具体实施方式
下面结合附图进一步详细描述本发明的技术方案,但本发明的保护范围不局限于以下所述。
如图1所示,一种应用内容的自动化安全监管系统,包括:
应用抓取子系统,用于从互联网中抓取和下载应用程序;
内容安全监管子系统,用于安装抓取到的应用程序,并对应用程序中的图片和文字进行抓包处理;
内容识别子系统,用于记录当前监管的应用程序,并对文本、图片信息进行识别,在出现不良信息时通知管理员。
本申请可以应用于android系统、iOS系统、以及PC端的各种操作系统中,其中在android系统中的应用尤为重要。
在一个实施例中,本申请的内容安全监管子系统可以只有一个,内容安全监管子系统分别与应用抓取子系统和内容识别子系统连接和通讯。
在另一个实施例中,本申请的内容安全监管子系统也可以是多个,每个内容安全监管子系统均分别与应用抓取子系统和内容识别子系统连接和通讯;这种情况下,可以同时对多个应用程序进行安装和文字图片的抓包。
所述的应用抓取子系统包括:
抓取模块,用于抓取互联网中存在的应用程序;
下载模块,用于对抓取到的应用程序进行下载;
在本申请中,可以通过网络爬虫的方式或者手动下载,并保存应用程序名称和MD5值,避免对相同应用做重复的鉴定。
MD5即Message-Digest Algorithm 5(信息-摘要算法5),用于确保信息传输完整一致。是计算机广泛使用的杂凑算法之一(又译摘要算法、哈希算法),主流编程语言普遍已有MD5实现。
推送模块,用于将下载的应用程序推送给内容安全监管子系统并进行通知。
所述的内容安全监管子系统包括:
安装模块,用于对应用抓取子系统下载的应用程序进行安装;
抓包模块,用于启动安装好的应用程序,并对应用程序中所有页面的文字和图像进行抓包;
传输模块,用于将抓包得到的文字和图像传输给内容识别子系统。
所述的内容识别子系统包括:
记录模块,用于记录当前监管的应用程序;
识别模块,用于对抓包得到的文字和图像进行识别;
通知模块,用于在识别到不良信息时通知管理员。
如图2所示,所述的一种应用内容的自动化安全监管系统的监管方法,包括以下步骤:
S1.应用抓取子系统从互联网中抓取和下载应用程序;
S2.内容安全监管子系统安装抓取到的应用程序,并对应用程序中的图片和文字进行抓包处理;
S3.内容识别子系统记录当前监管的应用程序,并对文本、图片信息进行识别,在出现不良信息时通知管理员。
所述的步骤S1包括以下子步骤:
S11.应用抓取子系统抓取互联网中存在的应用程序;
S12.应用抓取子系统对抓取到的应用程序进行下载;
S13.应用抓取子系统将下载的应用程序推送给内容安全监管子系统并进行通知。
所述的步骤S2包括以下子步骤:
S21.内容安全监管子系统对应用抓取子系统下载的应用程序进行安装;
S22.内容安全监管子系统,启动安装好的应用程序,并对应用程序中所有页面的文字和图像进行抓包;
S23.内容安全监管子系统将抓包得到的文字和图像传输给内容识别子系统。
所述的步骤S3包括以下子步骤:
S31.内容识别子系统记录当前监管的应用程序;
S32.内容识别子系统对从当前监管的应用程序中抓包得到的文字和图像进行识别;
S33.内容识别子系统识别到不良信息时,对管理员进行通知。
如图3所示,所述的步骤S22包括以下子步骤:
S221.启动安装好的应用程序,进入应用程序首页;
S222.内容安全监管子系统抓取当前页面中的图片和文本信息,传输到内容识别子系统;
S223.内容安全监管子系统计算当前页面中能够点击的控件数量进行计算并记录每个控件的坐标信息;
S224.判断当前页面是否存在未点击的控件:
(1)如果当前页面中存在未点击的控件,点击对应控件(任意一个未点击控件),进入下一级页面,并转至步骤S222;
(2)如果当前页面不存在未点击的控件,进入步骤S225;
进一步地,本申请中的控件指的是应用程序中的界面按钮;点击控件通过调用系统的API接口来实现,如在android系统可调用android系统的API接口实现控件点击。
S225.判断当前页面是否为应用程序首页;
(1)当前页面不是应用程序首页,返回上一级页面,并转至步骤S224;
(2)当前页面是应用程序首页,返回步骤S1,进行下一个应用程序的抓取。
在本申请中,当某个页面不存在能够点击控件时,认为其未点击的控件为0(不存在未点击控件)。
基于图3所示的应用程序图片和文字的抓包流程,在启动应用程序后,首先对首页信息进行抓包,计算控件数量和坐标(此时首页必然存在未点击控件),点击其中一个控件进入下一级页面(二级页面),返回步骤S222,并按照步骤S222~S225进行循环操作:这样能够保证首页中各个控件对应的二级页面及其下属页面(三级页面、四级页面、五级页面等)的图像和文字全部被抓包;循环过程中如果返回了首页,且首页不存在未点击控件,说明整个应用程序抓包结束,这时返回步骤S1,进行下一个应用程序的抓取;对应用程序中所有页面的文字和图像实现了抓包。
需要说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (9)

1.一种应用内容的自动化安全监管系统,其特征在于:包括:
应用抓取子系统,用于从互联网中抓取和下载应用程序;
内容安全监管子系统,用于安装抓取到的应用程序,并对应用程序中的图片和文字进行抓包处理;
内容识别子系统,用于记录当前监管的应用程序,并对文本、图片信息进行识别,在出现不良信息时通知管理员。
2.根据权利要求1所述的一种应用内容的自动化安全监管系统,其特征在于:所述的应用抓取子系统包括:
抓取模块,用于抓取互联网中存在的应用程序;
下载模块,用于对抓取到的应用程序进行下载;
推送模块,用于将下载的应用程序推送给内容安全监管子系统并进行通知。
3.根据权利要求1所述的一种应用内容的自动化安全监管系统,其特征在于:所述的内容安全监管子系统包括:
安装模块,用于对应用抓取子系统下载的应用程序进行安装;
抓包模块,用于启动安装好的应用程序,并对应用程序中所有页面的文字和图像进行抓包;
传输模块,用于将抓包得到的文字和图像传输给内容识别子系统。
4.根据权利要求1所述的一种应用内容的自动化安全监管系统,其特征在于:所述的内容识别子系统包括:
记录模块,用于记录当前监管的应用程序;
识别模块,用于对抓包得到的文字和图像进行识别;
通知模块,用于在识别到不良信息时通知管理员。
5.如权利要求1~4中任意一项所述的一种应用内容的自动化安全监管系统的监管方法,其特征在于:包括以下步骤:
S1.应用抓取子系统从互联网中抓取和下载应用程序;
S2.内容安全监管子系统安装抓取到的应用程序,并对应用程序中的图片和文字进行抓包处理;
S3.内容识别子系统记录当前监管的应用程序,并对文本、图片信息进行识别,在出现不良信息时通知管理员。
6.根据权利要求5所述的一种应用内容的自动化安全监管系统的监管方法,其特征在于:所述的步骤S1包括以下子步骤:
S11.应用抓取子系统抓取互联网中存在的应用程序;
S12.应用抓取子系统对抓取到的应用程序进行下载;
S13.应用抓取子系统将下载的应用程序推送给内容安全监管子系统并进行通知。
7.根据权利要求5所述的一种应用内容的自动化安全监管系统的监管方法,其特征在于:所述的步骤S2包括以下子步骤:
S21.内容安全监管子系统对应用抓取子系统下载的应用程序进行安装;
S22.内容安全监管子系统,启动安装好的应用程序,并对应用程序中所有页面的文字和图像进行抓包;
S23.内容安全监管子系统将抓包得到的文字和图像传输给内容识别子系统。
8.根据权利要求5所述的一种应用内容的自动化安全监管系统的监管方法,其特征在于:所述的步骤S3包括以下子步骤:
S31.内容识别子系统记录当前监管的应用程序;
S32.内容识别子系统对从当前监管的应用程序中抓包得到的文字和图像进行识别;
S33.内容识别子系统识别到不良信息时,对管理员进行通知。
9.根据权利要求7所述的一种应用内容的自动化安全监管系统的监管方法,其特征在于:所述的步骤S22包括以下子步骤:
S221.启动安装好的应用程序,进入应用程序首页;
S222.内容安全监管子系统抓取当前页面中的图片和文本信息,传输到内容识别子系统;
S223.内容安全监管子系统计算当前页面中能够点击的控件数量,并记录每个控件的坐标信息;
S224.判断当前页面是否存在未点击的控件:
(1)如果当前页面中存在未点击的控件,点击对应控件,进入下一级页面,并转至步骤S222;
(2)如果当前页面不存在未点击的控件,进入步骤S225;
S225.判断当前页面是否为应用程序首页;
(1)当前页面不是应用程序首页,返回上一级页面,并转至步骤S224;
(2)当前页面是应用程序首页,返回步骤S1,进行下一个应用程序的抓取。
CN201610597929.6A 2016-07-27 2016-07-27 一种应用内容的自动化安全监管系统与方法 Pending CN106685910A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610597929.6A CN106685910A (zh) 2016-07-27 2016-07-27 一种应用内容的自动化安全监管系统与方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610597929.6A CN106685910A (zh) 2016-07-27 2016-07-27 一种应用内容的自动化安全监管系统与方法

Publications (1)

Publication Number Publication Date
CN106685910A true CN106685910A (zh) 2017-05-17

Family

ID=58839234

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610597929.6A Pending CN106685910A (zh) 2016-07-27 2016-07-27 一种应用内容的自动化安全监管系统与方法

Country Status (1)

Country Link
CN (1) CN106685910A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111090404A (zh) * 2019-04-22 2020-05-01 广东小天才科技有限公司 一种显示屏的控制方法及终端设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103748998B (zh) * 2010-06-09 2012-02-08 北京理工大学 大型内部网络中不良信息和违规服务的监控系统
CN102547794A (zh) * 2012-01-12 2012-07-04 郑州金惠计算机系统工程有限公司 Wap手机传媒色情图像、视频及不良内容的识别监管平台
US20120311087A1 (en) * 2007-06-21 2012-12-06 Fedders Jeffrey G Distributing intelligence across networks
CN103810425A (zh) * 2012-11-13 2014-05-21 腾讯科技(深圳)有限公司 恶意网址的检测方法及装置
CN104462979A (zh) * 2014-12-26 2015-03-25 深圳数字电视国家工程实验室股份有限公司 一种应用程序的自动化动态检测方法及装置
CN105763543A (zh) * 2016-02-03 2016-07-13 百度在线网络技术(北京)有限公司 一种识别钓鱼网站的方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120311087A1 (en) * 2007-06-21 2012-12-06 Fedders Jeffrey G Distributing intelligence across networks
CN103748998B (zh) * 2010-06-09 2012-02-08 北京理工大学 大型内部网络中不良信息和违规服务的监控系统
CN102547794A (zh) * 2012-01-12 2012-07-04 郑州金惠计算机系统工程有限公司 Wap手机传媒色情图像、视频及不良内容的识别监管平台
CN103810425A (zh) * 2012-11-13 2014-05-21 腾讯科技(深圳)有限公司 恶意网址的检测方法及装置
CN104462979A (zh) * 2014-12-26 2015-03-25 深圳数字电视国家工程实验室股份有限公司 一种应用程序的自动化动态检测方法及装置
CN105763543A (zh) * 2016-02-03 2016-07-13 百度在线网络技术(北京)有限公司 一种识别钓鱼网站的方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111090404A (zh) * 2019-04-22 2020-05-01 广东小天才科技有限公司 一种显示屏的控制方法及终端设备

Similar Documents

Publication Publication Date Title
EP2729895B1 (en) Syntactical fingerprinting
CN101944167B (zh) 识别恶意程序的方法及系统
US9356941B1 (en) Systems and methods for detecting suspicious web pages
WO2019236802A1 (en) Threat mitigation system and method
CN106227780B (zh) 一种海量网页的自动化截图取证方法和系统
CN110177114B (zh) 网络安全威胁指标识别方法、设备、装置以及计算机可读存储介质
CN111049786A (zh) 一种网络攻击的检测方法、装置、设备及存储介质
CN111049781B (zh) 一种反弹式网络攻击的检测方法、装置、设备及存储介质
CN102708309A (zh) 恶意代码自动分析方法及系统
CN107528818B (zh) 媒体文件的数据处理方法和装置
WO2016010872A1 (en) Recognition of behavioural changes of online services
CN111049783A (zh) 一种网络攻击的检测方法、装置、设备及存储介质
CN106599270B (zh) 网络数据抓取方法和爬虫
US20170325003A1 (en) A video signal caption system and method for advertising
CN108920955B (zh) 一种网页后门检测方法、装置、设备及存储介质
CN111049780A (zh) 一种网络攻击的检测方法、装置、设备及存储介质
CN106685910A (zh) 一种应用内容的自动化安全监管系统与方法
CN106789301A (zh) 一种生成web网关的运行日志的方法及装置
CN106777228A (zh) 一种消息推送方法、装置及电子设备
CN108595957A (zh) 浏览器主页篡改检测方法、装置及存储介质
CN109246121B (zh) 攻击防御方法、装置、物联网设备及计算机可读存储介质
CN108985059B (zh) 一种网页后门检测方法、装置、设备及存储介质
CN105208002A (zh) 钓鱼网站拦截方法
CN109508548B (zh) 一种基于仿真器技术的威胁行为搜集系统及方法
CN106572462B (zh) 一种告警信息发送方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170517