CN108415807A

CN108415807A - 一种爬取监控电子设备是否浏览不良信息的方法

Info

Publication number: CN108415807A
Application number: CN201810146298.5A
Authority: CN
Inventors: 宣继托
Original assignee: Hangzhou Digital Peak Technology Co Ltd; Chengdu Rui Code Technology Co Ltd
Current assignee: Hangzhou Digital Peak Technology Co Ltd; Chengdu Rui Code Technology Co Ltd
Priority date: 2018-02-12
Filing date: 2018-02-12
Publication date: 2018-08-17

Abstract

本发明公开了一种爬取监控电子设备是否浏览不良信息的方法，所述方法包括：基于计算机训练出鉴别不良信息的深度学习模型；将训练出的深度学习模型转换到神经网络处理引擎对应的格式；获取用户在电子设备上的浏览内容，基于转换格式后的深度学习模型对用户浏览的内容进行识别，输出识别结果正常或存在不良信息；将识别结果发送到预设监控终端。实现了实时对用户浏览的内容进行监控，且能够智能识别判断用户浏览内容是否不良，识别速度快的技术效果。

Description

一种爬取监控电子设备是否浏览不良信息的方法

技术领域

本发明涉及电子设备信息安全监测领域，具体地，涉及一种爬取监控电子设备是否浏览不良信息的方法。

背景技术

据最新针对中小学生的调查，该群体手机拥有率达46.6％，手机上网普及率达39.5％。

面对纷繁复杂的互联网内容，中小学生在使用手机的过程中很有可能接触到一些不良信息，特别是一些涉黄的信息。在这方面各移动手机设备制造商很少对这些内容进行监控，市面上也缺少这样的第三方服务提供商,这使得使用移动手机设备的中小学生就有机会接触到这些涉黄信息，造成身心的伤害。在现有技术中，主要采用家长人工进行监测或者设置手机使用权限，监控效率较低，且监控的效果较差。

发明内容

本发明提供了一种爬取监控电子设备是否浏览不良信息的方法，解决了现有的监控方法存在的不足，实现了实时对用户浏览的内容进行监控，且能够智能识别判断用户浏览内容是否不良，识别速度快的技术效果。

为实现上述发明目的，本申请提供了一种爬取监控电子设备是否浏览不良信息的方法，所述方法包括：

基于计算机训练出鉴别不良信息的深度学习模型；

将训练出的深度学习模型转换到神经网络处理引擎对应的格式；

获取用户在电子设备上的浏览内容，基于转换格式后的深度学习模型对用户浏览的内容进行识别，输出识别结果正常或存在不良信息；

将识别结果发送到预设监控终端。

本申请基于人工智能深度学习方法，发明了一套电子设备，如手机、平板等的不良信息监控的方法，使得目标人群能够安全的浏览健康内容。本申请的突出优点是快速，在深度学习模型的推理运算上，启用GPU加速，可以达到对手机内容实时监控，可以跨App，只要是手机上安装的任何App，都可以对用户行为精准监控并上报。

本申请的方法在适配的手机上，能够实时识别用户浏览的内容。并且能够跨越App，是系统级别的方案，不仅限于某个应用内的内容识别。监控内容不受限于固定形式，图片，视频，gif等媒体类型都支持。

进一步的，所述基于计算机训练出鉴别不良信息的深度学习模型，具体包括：基于卷积神经网络，在inceptionV3的网络结构上，训练出深度学习神经网络；训练部分为：基于10万不良信息张图片的样本集训练，得出的模型在随机的1万张测试样本集中测试通过，准确率达到99.83％。

进一步的，将训练出的深度学习模型转换到神经网络处理引擎对应的DLC格式，神经网络处理引擎的使用流程包括：

(1)通过SNPE SDK加载DLC模型；

(2)准备图片，进行图片的通道转换，裁剪；

(3)将图片的byte格式数据通过SNPE SDK接口，输入推理引擎；

(4)解析推理的结果。(结果一般为float数组)

SNPE的使用流程为：

基于公司的图片数据库，挑选10万张各种类型的性感、色情图片。由样本标记团队标注。

将图片输入到基于caffe深度学习框架的训练引擎进行多次训练。基于1万张测试样本集合反复测试。得出最佳模型。

进一步的，采用系统API ImageReader，此API可以实时不间断获取系统当前界面(无关具体的App)，也就是动态抓屏，我们在抓屏回调函数里面，基于获取的屏幕图像信息(截屏)，进行深度学习网络的推理。得出当前屏幕图像信息是否是不良信息。

进一步的，所述方法实时截取电子设备显示屏显示内容，并将截取的内容传输给深度学习模型进行识别。

进一步的，在Android系统上，通过系统提供的API接口：ImageReader截取电子设备显示屏显示内容，通过此接口的回调函数ImageReader.OnImageAvailableListener，不断获取屏幕截图。

本申请提供的一个或多个技术方案，至少具有如下技术效果或优点：

由于做了速度优化，可以在200ms内连续抓取屏幕内容，生成图片，并将突破输入到识别引擎，通过深度学习网络的推理，输出结果；当检测到不良信息时，会在界面提示相关内容，并将结果上报到后台接口；能够智能识别判断用户浏览内容是否不良，识别速度快的技术效果。

附图说明

此处所说明的附图用来提供对本发明实施例的进一步理解，构成本申请的一部分，并不构成对本发明实施例的限定；

图1是本申请中爬取监控电子设备是否浏览不良信息的方法的流程示意图。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点，下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是，在相互不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是，本发明还可以采用其他不同于在此描述范围内的其他方式来实施，因此，本发明的保护范围并不受下面公开的具体实施例的限制。

请参考图1，本申请提供了不良信息监控方案示意图，当用户启动监控App，启动东手机屏幕获取服务，不断获取每用户浏览界面，进行解析，当遇到敏感信息时发出警告并通知到监控端。

假设通过深度学习框架(tensorflow或者caffe)训练出的鉴黄模型。基于这个模型我们分为几个步骤：

第一步，对PC上训练出来的深度学习模型进行格式转换。与直接利用PC上训练出来的模型，用CPU来运行模型的推理算法相比，本申请为了提高实时性，能够在用户浏览信息时，做到实时监控(每检测一次用户屏幕监控不到200ms)，本申请启用了GPU并发计算能力，利用GPU的高并发处理能力来处理推理过程中的耗时任务比如：卷积计算。如何利用GPU的并发处理卷积计算能力？高通芯片(骁龙835、625等)提供了最大化利用GPU的计算能力进行网络推理优化的框架SNPE，基于SNPE，本申请首先要利用其提供的格式转换工具，对模型做一个格式转换，由tensorflow或者caffe模型转换到SNPE的DLC格式。这是一种能够让SNPE引擎直接加载的格式。SNPE也提供了官方转换脚本snpe-caffe-to-dlc或snpe-tensorflow-to-dlc。神经网络处理引擎为SNPE。

SNPE的使用流程具体包括：

第二步，获取用户浏览内容,利用深度学习框架进行识别。

当用户穿梭于各个应用之间浏览不同的内容时，本申请中的方法通过截取屏幕内容，保存成图片。传给识别引擎，进行深度神经网络的推理。在Android系统上，截图方法用到了系统提供的API接口：ImageReader。通过此接口的回调函数ImageReader.OnImageAvailableListener，不断获取屏幕截图。

第三步，将识别结果通知到监控端。

从深度学习的识别引擎里输出结果，本方法获取到了当前屏幕内容的安全级别：正常、性感或者色情。当获取到这些信息后，通过后台API接口，发送到服务器，由服务器相应推送此消息到监控人所使用的终端(手机或电脑)。

本发明使用深度学习模型在手机上对用户浏览内容实施监控，如何获取系统范围的内容以及结合人工智能深度学习模型来对其进行精准识别，传统方法里，需要通过应用的数据获取接口来获取要监控的数据，进而进行推理分析，而这些数据接口都属于每个应用的隐私接口，不大可能提供给信息监控方，而且很难做到实时监控。本方案基于深度学习技术的模型，通过模型和推理优化方案，目前可以达到实时检测的效果。

尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种爬取监控电子设备是否浏览不良信息的方法，其特征在于，所述方法包括：

基于计算机训练出鉴别不良信息的深度学习模型；

将识别结果发送到预设监控终端。

2.根据权利要求1所述的爬取监控电子设备是否浏览不良信息的方法，其特征在于，所述基于计算机训练出鉴别不良信息的深度学习模型，具体包括：

基于卷积神经网络，在inceptionV3的网络结构上，训练出深度学习神经网络。

3.根据权利要求2所述的爬取监控电子设备是否浏览不良信息的方法，其特征在于，训练部分为：基于10万不良信息张图片的样本集训练，得出的模型在随机的1万张测试样本集中测试通过。

4.根据权利要求1所述的爬取监控电子设备是否浏览不良信息的方法，其特征在于，将训练出的深度学习模型转换到神经网络处理引擎对应的DLC格式，神经网络处理引擎的使用流程包括：

(1)通过SNPE SDK加载DLC模型；

(2)准备图片，进行图片的通道转换，裁剪；

(3)将图片的byte格式数据通过SNPE SDK接口，输入推理引擎；

(4)解析推理的结果。

5.根据权利要求1所述的爬取监控电子设备是否浏览不良信息的方法，其特征在于，所述方法采用系统API ImageReader，实时获取系统当前界面进行动态抓屏，在抓屏回调函数里面，基于获取的屏幕图像信息，进行深度学习网络的推理，得出当前屏幕图像信息是否是不良信息。

6.根据权利要求1所述的爬取监控电子设备是否浏览不良信息的方法，其特征在于，所述方法实时截取电子设备显示屏显示内容，并将截取的内容传输给深度学习模型进行识别。

7.根据权利要求6所述的爬取监控电子设备是否浏览不良信息的方法，其特征在于，在Android系统上，通过系统提供的API接口：ImageReader截取电子设备显示屏显示内容，通过此接口的回调函数ImageReader.OnImageAvailableListener，不断获取屏幕截图。