CN110222846B - 一种面向互联网终端的信息安防方法及信息安防系统 - Google Patents
一种面向互联网终端的信息安防方法及信息安防系统 Download PDFInfo
- Publication number
- CN110222846B CN110222846B CN201910393609.2A CN201910393609A CN110222846B CN 110222846 B CN110222846 B CN 110222846B CN 201910393609 A CN201910393609 A CN 201910393609A CN 110222846 B CN110222846 B CN 110222846B
- Authority
- CN
- China
- Prior art keywords
- information
- data
- sample
- harmful
- detected
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000012549 training Methods 0.000 claims abstract description 25
- 230000005540 biological transmission Effects 0.000 claims abstract description 23
- 230000008569 process Effects 0.000 claims abstract description 14
- 238000001514 detection method Methods 0.000 claims description 29
- 238000012545 processing Methods 0.000 claims description 15
- 238000012544 monitoring process Methods 0.000 claims description 12
- 230000000903 blocking effect Effects 0.000 claims description 10
- 238000004806 packaging method and process Methods 0.000 claims description 9
- 230000002159 abnormal effect Effects 0.000 claims description 6
- 230000010365 information processing Effects 0.000 abstract 1
- 238000010801 machine learning Methods 0.000 description 14
- 238000004891 communication Methods 0.000 description 10
- 238000013528 artificial neural network Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000013527 convolutional neural network Methods 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 231100000870 cognitive problem Toxicity 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000004630 mental health Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Medical Informatics (AREA)
- Evolutionary Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明提供一种面向互联网终端的信息安防方法及信息安防系统,其中,信息安防方法适用于用户的终端设备,信息安防方法包括:步骤1,终端设备获取用于检测有害信息的信息识别模型的离线训练结果,并根据该离线训练结果,初始化或更新信息识别模型的参数和权重;步骤2,终端设备接收外部的信息数据,并根据信息数据的数据种类,生成信息数据的待检测样本,并根据信息识别模型、参数以及权重,利用前向运算,检测待检测样本,生成信息识别结果;步骤3,终端设备根据信息识别结果,对接收到的信息数据进行处理。通过本发明的技术方案,有效阻止了有害信息的传播至用户,解决了由于数据量过大而导致云端或服务器端或路由器端信息处理遗漏问题。
Description
技术领域
本发明涉及机器学习技术领域,尤其涉及一种面向互联网终端的信息安防方法以及一种面向互联网终端的信息安防系统。
背景技术
包含暴恐与淫秽等有害信息的视频、图片以及文本传播对社会安定与未成年人心理健康造成巨大的负面影响,其可造成大量人员伤亡与财产损失,人才间接流失,不利于国家与社会的稳定与健康发展,暴恐与淫秽信息造成的潜在危害远超普通刑事案件。
随着移动设备的普及,互联网至移动终端这一传播途径成为了这些信息的一个新的重要传播渠道。目前对暴恐与淫秽信息可通过在服务器端进行自动识别或人工识别并制止信息传播,然而由于网络的超大规模数据量的传输,现有检测方法也难以完全并实时检测有害信息,并制止有害信息的传播。
互联网数据的超大规模流动与传输,对服务器实时防御有害信息提供了挑战;此外,针对点对点传输的数据流动机制如P2P等数据交换平台,其流动数据难以实时监控,容易造成有害信息泛滥的后果。因此,研究如何有效从终端设备对有害数据进行防御具有重大意义。
机器学习技术在近几年得到了飞速的发展,在解决高级抽象认知问题上,例如图像识别、语音识别、自然语言处理、文本识别和内容推荐等领域得到了广泛应用并具有出色的表现,因此成为了学术界和工业界的研究热点。
对于机器学习及其设备的低功耗与低成本的研究与发展,已经实现了利用加速器在移动终端进行集成,可有效实现针对机器学习技术的应用。因此,研究如何结合机器学习与移动终端对有害信息进行检测、识别以及过滤,具有重大社会意义。
发明内容
本发明的目的在于克服上述现有技术的缺陷,提供一种面向互联网终端的信息安防方法以及一种面向互联网终端的信息安防系统。
根据本发明的第一方面,提供了一种面向互联网终端的信息安防方法,信息安防方法适用于面向用户的终端设备,信息安防方法包括:步骤1,终端设备获取用于检测有害信息的信息识别模型的离线训练结果,并根据该离线训练结果,初始化或更新信息识别模型的参数和权重;
步骤2,终端设备接收外部的信息数据,并根据信息数据的数据种类,生成信息数据的待检测样本,并根据信息识别模型、参数以及权重,利用前向运算,检测待检测样本,生成信息识别结果;步骤3,终端设备根据信息识别结果,对接收到的信息数据进行处理,其中,处理的过程包括执行应用或阻断、打包、报文发送中的一种或多种操作。
在本发明的一个实施例中,信息安防方法还包括:步骤4,当判定信息识别结果为有害结果时,删除终端设备已经接收到的信息数据,并根据信息数据对应的信息源和信息识别结果,生成有害数据编码报文,发送有害数据编码报文至监管服务器。
在本发明的一个实施例中,用户通过终端设备中安装的应用程序接收信息数据,当判定信息数据对应的信息识别结果为有害结果时,步骤4中具体包括:步骤41,终端设备阻断并禁止已确认有害的信息数据传输至终端设备的内部,并停止应用程序结束信息数据,删除已接收的信息数据;步骤42,根据信息数据的信息源和信息识别结果,生成并发送有害数据编码报文至监管服务器。
在本发明的一个实施例中,用户通过终端设备中安装的应用程序接收信息数据,当终端设备判定信息识别结果正常时,信息安防方法还包括:步骤5,传输信息数据至应用程序,执行应用程序,并接收信息数据的后续传输数据,根据后续传输数据,生成待检测样本,利用前向运算,检测待检测样本,生成信息识别结果,直至数据检测结束或信息识别结果被判定为有害结果。
在本发明的一个实施例中,信息识别模型包括视图识别模型、文本识别模型以及语音识别模型,步骤2中具体包括:步骤21,当判定信息数据的数据种类为图形信息时,解析并获取信息数据的对应的子图形信息,根据子图形信息生成待检测样本,其中,待检测样本为图形样本;步骤22,选取视图识别模型,根据视图识别模型、参数以及权重,利用前向运算,检测待检测样本,生成信息识别结果。
在本发明的一个实施例中,该方法还包括:步骤23,当判定数据种类为文本信息时,抽取信息数据中的连续文本信息,根据连续文本信息生成待检测样本,其中,待检测样本为文本样本;步骤24,选取文本识别模型,根据文本识别模型、参数以及权重,利用前向运算,检测待检测样本,并生成信息识别结果。
在本发明的一个实施例中,该方法还包括:步骤25,当判定数据种类为语音信息时,随机抽取信息数据中的输入语音段,根据输入语音段生成待检测样本,其中,待检测样本为语音样本;步骤26,选取语音识别模型,根据语音识别模型、参数以及权重,利用前向运算,检测待监测样本,并生成信息识别结果。
在本发明的一个实施例中,获取离线训练结果的过程包括从外部接收离线训练结果和/或从终端设备的存储器中读取离线训练结果。
根据本发明的第二方面,提供了一种面向互联网终端的信息安防系统,信息安防系统适用于面向用户的终端设备,信息安防系统包括:数据接口,主控制模块,检测模块以及存储模块;数据接口用于接收终端设备的外部的信息数据,并发送终端设备生成的报文;主控制模块上安装有应用程序,用户运行应用程序后主控制模块利用数据接口接收信息数据,生成并发送信息数据的待检测样本至检测模块,并将信息数据暂存至存储模块中;检测模块包括缓存单元和检测单元,缓存单元用于载入存储模块中的信息识别模型、参数以及权重,检测单元用于根据信息识别模型、参数以及权重,利用前向运算,检测待检测样本,生成信息识别结果;主控制模块还用于根据信息识别结果,对接收到的信息数据执行应用或阻断、打包、报文发送中的一种或多种操作。
在本发明的一个实施例中,主控制模块还用于:当判定信息识别结果为有害结果时,删除存储模块中的信息数据,并根据信息数据对应的信息源和信息识别结果,生成有害数据编码报文,利用数据接口发送有害数据编码报文至监管服务器。
与现有技术相比,本发明的优点在于:通过在用户终端上设置有害信息检测机制,结合本发明提供的信息检测系统,在用户终端上对接收到的信息进行检测、分类,提高了信息过滤的全面性,有效阻止了有害信息的传播,解决了由于数据量过大而导致云端或服务器端或非终端图形、文本、语音等信息过滤遗漏问题,同时,还可以举报有害信息源,净化互联网。
附图说明
以下附图仅对本发明作示意性的说明和解释,并不用于限定本发明的范围,其中:
图1示出了根据本发明一个实施例的面向互联网终端的信息安防方法的示意流程图;
图2示出了根据本发明一个实施例的面向互联网终端的信息安防系统的示意框图;
图3示出了根据本发明另一个实施例的面向互联网终端的信息安防系统的示意框图;
图4示出了根据本发明另一个实施例的面向互联网终端的信息安防系统的结构示意框图;
图5示出了根据本发明另一个实施例的面向互联网终端的信息安防方法的示意流程图;
图6示出了根据本发明另一个实施例的数据处理过程的示意流程图。
具体实施方式
为了使本发明的目的、技术方案、设计方法及优点更加清楚明了,以下结合附图通过具体实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
实施例一:
如图1所示,本发明提供了一种面向互联网终端的信息安防方法,信息安防方法适用于面向用户的终端设备,信息安防方法包括:
步骤1,终端设备获取用于检测有害信息的信息识别模型的离线训练结果,并根据该离线训练结果,初始化或更新信息识别模型的参数和权重;
进一步地,获取离线训练结果的过程包括从外部接收离线训练结果和/或从终端设备的存储器中读取离线训练结果。
具体地,离线训练是指终端设备利用机械学习模型,对于不同数据种类(如有害文本、语音信息、图形信息)的信息数据进行离线识别训练与离线模型生成,包括模型的参数和权重,将生成的离线模型记作有害信息的信息识别模型,并且不同数据种类的信息识别模型均存于终端设备的存储器,以备选择。同时,终端设备根据离线训练的结果,对终端设备中的信息识别模型进行初始化或更新,或者,根据终端设备接收到的用于更新信息识别模型的外部传输数据,替换终端设备内旧版本的模型参数与权重。
步骤2,终端设备接收到外部的信息数据,并根据信息数据的数据种类,生成信息数据的待检测样本,并根据信息识别模型、参数以及权重,利用前向运算,检测待检测样本,生成信息识别结果;其中,前向运算是指信息数据输入信息识别模型后,执行信息识别模型内部的运算,并生成信息识别结果的过程。
具体地,互联网通过对应的网端,即网络端口,可以看成含有网络端口的设备,即所有联网的具有在互联网上传播信息功能的设备的网络端口,也可以视为目标地址,与网端下的多个终端设备进行数据通信。当用户通过终端设备中安装的应用程序,向网端发送数据通信请求后,网端接收到互联网发送至终端设备的通信信息,互联网和终端设备进行数据通信,网端对互联网发送至终端设备的通信信息进行第一次有害信息检测,但是由于网端面对的数据量过大,可能存在遗漏信息数据的情况,此时,有害信息仍然可以通过终端设备被用户获取。
将具有分类目标数据功能的机器学习模型,如卷积神经网、LSTM、深度神经网络,作为本实施例中的(有害)信息识别模型,将信息识别模型通过神经网络加速器植入于终端设备上,利用机器学习的学习机制和样本数据,对信息识别模型进行训练,生成对应的模型参数和权值,利用模型参数和权值对输入数据(终端设备接收到的外部的信息数据)进行检测。
进一步地,信息识别模型包括视图识别模型、文本识别模型以及语音识别模型,步骤2中具体包括:
具体地,根据待检测的信息数据的数据格式(数据种类)不同,将信息数据分为三类,一类是图形信息,一类是文本信息,一类是语音信息,对于这三种信息,分别建立三种不同的信息识别模型,以便于提高有害信息识别的准确性。需要说明的是,图形信息包括视频和/或图片。其中,视图识别模型可以为卷积神经网络模型中的ResNet模型,文本识别模型可以为机器学习模型,语音识别模型可以为循环神经网络模型中的LSTM模型。
以终端设备接收到的外部的信息数据为视频信息为例,首先在终端设备中利用有害信息图像进行离线训练,使得视图识别模型(神经网络模型)具备有害图形信息识别能力,将该模型的参数与权重暂存于终端设备的内存中。
步骤21,当判定信息数据的数据种类为图形信息时,解析并获取信息数据的对应的子图形信息,根据子图形信息生成待检测样本,其中,待检测样本为图形样本;
具体地,终端设备中安装的应用程序向外部网端(网址IP)发送视频请求,网端向终端设备连续输入视频数据并存于存储器中,终端设备解析接收到的外部的视频数据,并从中随机抽取视频帧(子图形信息),这些帧为图片格式,将作为待检测样本。
步骤22,选取视图识别模型,根据视图识别模型、参数以及权重,利用前向运算,检测待检测样本,生成信息识别结果。
当判定信息数据的数据种类为图形信息时,获取该信息数据中的子图形信息,生成待检测样本,并选定视图识别模型作为信息识别模型,对待检测样本进行有害信息识别。当待检测样本中不包含有害信息时,生成正常的信息识别结果,当待检测样本中包含有害信息时,生成有害(异常)的信息识别结果(有害结果)。
具体地,以卷积神经网络模型识别图形信息为例,其模型的参数包括卷积神经网络模型的层数、各层网络的深度、卷积核尺寸、窗口滑动步长;其模型的权重为卷积神经网络进行卷积运算时提供的训练值。
步骤23,当判定数据种类为文本信息时,抽取信息数据中的连续文本信息,根据连续文本信息生成待检测样本,其中,待检测样本为文本样本;
步骤24,选取文本识别模型,根据文本识别模型、参数以及权重,利用前向运算,检测待检测样本,并生成信息识别结果。
步骤25,当判定数据种类为语音信息时,随机抽取信息数据中的输入语音段,根据输入语音段生成待检测样本,其中,待检测样本为语音样本;
步骤26,选取语音识别模型,根据语音识别模型、参数以及权重,利用前向运算,检测待监测样本,并生成信息识别结果。
步骤3,终端设备根据信息识别结果,对接收到的信息数据进行处理,其中,处理的过程包括执行应用或阻断、打包、报文发送中的一种或多种操作。
具体地,对于图形信息、文本信息以及语音信息,当待检测样本中包含异常信息时,则标记对应的信息识别结果为有害信息,此时,确定该有害信息中目的IP地址对应的应用程序,阻断该应用程序的运行,并阻断该信息数据的传输,删除已载入的该信息数据,使其不在用户的终端设备上进行显示、播放,防止用户获取有害信息,终端设备执行的操作为阻断、打包、报文发送中的一种或多种。当待检测样本中不含有异常信息时,则标记对应的信息识别结果为正常信息,终端设备给予应用程序执行权,应用程序调取终端设备接收到的外部的传输数据,终端设备执行的操作为应用、打包、报文发送中的一种或多种。
当信息识别结果为正常时,终端设备基于应用程序继续执行权限,实现视频的相关应用处理,同时对后续载入的视频信息继续随机抽取帧数生成样本,输入从处理器识别,直至该视频检测结束或被识别为有害。
当信息识别结果为异常时,即为有害结果时,终端设备阻断针对该视频的应用程序,阻断该视频数据的继续输入,删除已载入至存储器的该视频数据,将该视频的来源信息(如源IP地址)与信息识别结果中的分类结果信息(如暴恐、淫秽或垃圾广告等)拼接为报文(打包),通过终端设备的网端传输至监管服务器。
进一步地,信息安防方法还包括:
步骤4,当判定信息识别结果为有害结果时,删除终端设备已经接收到的信息数据,并根据信息数据对应的信息源和信息识别结果,生成有害数据编码报文,发送有害数据编码报文至监管服务器。
具体地,以IPV4传输为例(可参见IPV4报头格式),本发明报文在IPV4的数据字段内部,该报文格式为[有害视频的来源信息(链接编码)+有害标识+有害信息类编码],而监管服务器IP地址在IPV4报文报头的目的IP地址段,终端设备IP地址在IPV4报文报头的源IP地址段。终端设备通过IPV4传输协议将含有该报文的IPV4报头发送至互联网,传输至监管服务器,实现有害数据编码报文发送。
优选地,用户通过终端设备中安装的应用程序接收信息数据,当判定信息数据对应的信息识别结果为有害结果时,步骤4中具体包括:
步骤41,终端设备阻断并禁止已确认有害的信息数据传输至终端设备的内部,并停止应用程序接收信息数据,删除已接收的信息数据;
步骤42,根据信息数据的信息源和信息识别结果,生成并发送有害数据编码报文至监管服务器。
具体地,当判定接收到的信息数据为有害信息时,将对应的信息识别结果标记为异常,获取互联网向终端设备发送的信息数据中包含的源IP地址,将对应的信息源和信息识别结果进行打包,生成有害数据编码报文,将该报文连同应用程序对应的备案号,发送至监管服务器,进行有害信息上报,以便于监管服务器对该信息源进行监管。同时,阻断针对该信息数据的接收,阻断该信息数据在终端设备、应用程序中的传输,并删除已经接收到的信息数据。
进一步地,用户通过终端设备中安装的应用程序接收信息数据,当终端设备判定信息识别结果正常时,信息安防方法还包括:步骤5,传输信息数据至应用程序,执行应用程序,并接收信息数据的后续传输数据,根据后续传输数据,生成待检测样本,利用前向运算,检测待检测样本,生成信息识别结果,直至数据检测结束或信息识别结果被判定为有害结果。
综上,当用户获取到信息数据后,先对信息数据进行缓存,对缓存的信息数据抽样并生成待检测样本,对每个待检测样本进行检测,当判定当前的待检测样本中不包含有害信息时,赋予对应应用程序的执行权限,通过安装在终端设备上的应用程序,显示检测后不包含有害信息的信息数据。
当判定当前的待检测样本中包含有害信息时,终端设备删除当前缓存的有害数据(信息数据),阻断该数据的输入,并将该输入数据的来源信息与有害标识进行打包成报文,终端设备将该报文发送至监管网端或服务器端(监管服务器),以便于该来源信息进行监管。
实施例二:
如图2所示,本发明提供了一种面向互联网终端的信息安防系统100,信息安防系统100适用于面向用户的终端设备,信息安防系统100包括:数据接口140,主控制模块110,检测模块120以及存储模块130;
数据接口140用于接收终端设备的外部的信息数据,并发送终端设备生成的报文;
主控制模块110上安装有应用程序,用户运行应用程序后主控制模块110利用数据接口140接收信息数据,生成并发送信息数据的待检测样本至检测模块120,并将信息数据暂存至存储模块130中;
检测模块120包括缓存单元121和检测单元122,缓存单元121用于载入存储模块130中的信息识别模型、参数以及权重,检测单元122用于根据信息识别模型、参数以及权重,利用前向运算,检测待检测样本,生成信息识别结果;
主控制模块110还用于根据信息识别结果,对接收到的信息数据进行处理,其中,处理的过程包括执行应用或阻断、打包、报文发送中的一种或多种操作。
具体地,互联网通过对应的网端,与网端下的多个终端设备进行数据通信。当用户通过终端设备中安装的应用程序,向网端发送数据通信请求后,网端接收到互联网发送至终端设备的通信信息,互联网和终端设备进行数据通信,网端对互联网发送至终端设备的通信信息进行第一次有害信息检测,但是由于网端面对的数据量过大,可能存在遗漏信息数据的情况,此时,有害信息仍然可以通过终端设备被用户获取。
将具有分类目标数据功能的机器学习模型,如卷积神经网、LSTM、深度神经网络,作为本实施例中的(有害)信息识别模型,将信息识别模型通过神经网络加速器植入于终端设备上,利用机器学习的学习机制和样本数据,对信息识别模型进行训练,生成对应的模型参数和权值,利用模型参数和权值对输入数据(终端设备接收到的外部的信息数据)进行检测。
根据待检测的信息数据的数据格式(数据种类)不同,将信息数据分为三类,一类是图形信息,一类是文本信息,一类是语音信息,对于这三种信息,分别建立三种不同的信息识别模型,以便于提高有害信息识别的准确性。需要说明的是,图形信息包括视频和/或图片。
进一步地,主控制模块110还用于:当判定信息识别结果为有害结果时,删除存储模块130中的信息数据,并根据信息数据对应的信息源和信息识别结果,生成有害数据编码报文,利用数据接口140发送有害数据编码报文至监管服务器。
进一步地,主控制模块110还用于:当判定检测结果正常时,将存储模块130中暂存的信息数据传输至应用程序,并执行应用程序的后续运行。
在本实施例中的终端设备上,采用缓存的方式对待检测样本、模型参数与权重进行存储,同时,可通过非易失性存储介质存储相关模型参数与权重;模型参数与权重可在服务器端离线训练,其更新的模型参数与权值可通过网络传输至终端设备。
综上,当用户获取到信息数据后,先对信息数据进行缓存,对缓存的信息数据抽样并生成待检测样本,进而对每个待检测样本进行检测,当判定当前缓存的待检测样本中不包含有害信息时,赋予对应应用程序的执行权限,通过终端设备上的应用程序,显示检测后不包含有害信息的信息数据。
当判定当前缓存的信息数据中包含有害信息时,终端设备删除当前缓存的有害数据(信息数据),阻断该数据输入应用程序,并将该输入数据的来源信息与有害标识进行打包成报文,终端设备将该报文发送至举报相关监管网端或服务器端。
实施例三:
如图3和图4所示,本发明提出了一种面向互联网终端的信息安防系统101,包括:至少一个存储模块102、至少一个通用处理器(主控制)模块103、至少一个专用分类处理器(检测)模块104以及至少一个输入输出接口105。此外,本发明提供的信息安防系统101还包括了缓存模块,缓存模块用于缓存参数与样本数据,加速数据处理。各模块间以总线形式连接,以保证数据的正确传递。
存储器模块102用于接收与暂存所接收的待检测数据,待检测数据包括图片、视频、文本、语音等数据,为通用处理器模块103以及专用分类处理器模块104提供输入数据,此外,该存储器模块102还存储了针对有害信息检测的已训练的模型参数与权值,供神经网络加速器载入机器学习模型使用。该存储器模块102可依据不同处理器分别设立,也可以以共享方式供各处理器使用。
通用处理器(主控制)模块103与存储器模块102相连,通用处理器模块103用于控制接收或进一步处理从输入输出接口105传输而来的数据;输入数据中抽取待测样本,并控制待测样本传递至专用的分类处理器模块104;控制从处理器的工作状态,向从处理器提供信息分类请求,并接收从处理器的分类结果;截断有害数据的传输,执行有害信息的删除操作;生成针对有害信息的检举报文,通过输入输出接口105传输至服务器终端;依据实际应用对无害信息做进一步处理。
专用分类处理器模块104与通用处理器模块103相连,专用分类处理器模块104用于接收信息分类请求,以及待检测数据的位置信息;该模块与存储器模块102相连,用于载入待测数据并执行信息分类操作,并输出分类结果至主处理器模块103。
输入输出接口105用于接收来自互联网输入数据,将数据传递至存储器模块102或各处理器缓存做进一步处理,同时响应主处理器模块103向外传输有害信息的检举报文。
实施例四:
如图5和图6所示,本发明提出了一种面向互联网终端的信息安防方法,包括:
步骤S10,将有害信息作为学习模型的训练样本,对学习模型进行训练,生成识别有害信息的模型参数与权值;
步骤S20,将训练好的多类模型参数与权值传递至信息安防系统的存储器中;
步骤S30,启动信息安防系统,向存储器中载入多类模型参数和权值,并接收外部待测数据;
步骤S40,主处理器依据所接收数据的种类生成测试样本数据,从处理器载入对应模型参数;
步骤S50,主处理器控制测试样本数据传递至从处理器并发送请求分类信号;
步骤S60,从处理器针对测试样本数据,执行前向推理的分类操作,生成分类结果并与分类完成信号传输至主处理器;
步骤S70,主处理器依据从处理器的分类结果对已接收的数据执行判决处理,对有害信息执行阻断、删除、打包以及检举等操作,对无害信息执行指定应用操作。
本发明提供的一种面向互联网终端的信息安防方法及信息安防系统可以是针对机器学习而设计的一个微处理器,也可以仅是微处理器的一部分,该机械学习微处理器可应用于文字处理、语音识别与处理、图像识别、智能控制等领域,可用作智能计算处理器、手机、平板、笔记本等移动设备,以及用于路由器、台式机、数字电视等具有图像与视频播放功能的媒体数据应用设备。
综上所述,在本发明提供的一种面向互联网终端的信息安防方法以及对应的安防系统,该信息安防方法适用于用户终端。通过利用机器学习模型,对有害数据样本进行训练,并产生对有害信息具有识别功能的模型参数和/或权值;对在线输入的数据进行前向分类操作,依据其结果对接收到的信息执行裁决;其中,对有害数据进行检举并删除,对无害数据作进一步处理。该面向互联网终端的信息安防方法及信息安防系统可有效阻止有害信息对终端的传递,并阻止有害信息传播至用户,同时还可检举有害信息源,以方便对有害信息源进行处理,净化互联网。
需要说明的是,虽然上文按照特定顺序描述了各个步骤,但是并不意味着必须按照上述特定顺序来执行各个步骤,实际上,这些步骤中的一些可以并发执行,甚至改变顺序,只要能够实现所需要的功能即可。
本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。
计算机可读存储介质可以是保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以包括但不限于电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。
Claims (8)
1.一种面向互联网终端的信息安防方法,其特征在于,所述信息安防方法适用于面向用户的终端设备,所述信息安防方法包括:
步骤1,所述终端设备获取用于检测有害信息的信息识别模型的离线训练结果,并根据该离线训练结果,初始化或更新所述信息识别模型的参数和权重;
步骤2,所述终端设备接收外部的信息数据,对信息数据进行缓存,并根据所述信息数据的数据种类,对缓存的信息数据抽样生成所述信息数据的待检测样本,并根据所述信息识别模型、所述参数以及所述权重,利用前向运算,检测所述待检测样本,生成信息识别结果,所述信息识别模型包括视图识别模型、文本识别模型以及语音识别模型;
步骤3,所述终端设备根据所述信息识别结果,对接收到的所述信息数据进行处理,其中,处理的过程包括执行应用或阻断、打包、报文发送中的一种或多种操作,其中,当待检测样本中包含异常信息时,则标记对应的信息识别结果为有害信息,确定该有害信息中目的IP地址对应的应用程序,阻断该应用程序的运行,并阻断该信息数据的传输,删除已载入的该信息数据,生成有害数据编码报文,发送所述有害数据编码报文至监管服务器。
2.根据权利要求1所述的面向互联网终端的信息安防方法,其特征在于,用户通过所述终端设备中安装的应用程序接收所述信息数据,当判定所述信息数据对应的所述信息识别结果为有害结果时,所述步骤4中具体包括:
步骤41,所述终端设备阻断并禁止已确认有害的所述信息数据传输至所述终端设备的内部,并停止所述应用程序接收所述信息数据,删除已接收的所述信息数据;
步骤42,根据所述信息数据的信息源和所述信息识别结果,生成并发送所述有害数据编码报文至所述监管服务器。
3.根据权利要求1所述的面向互联网终端的信息安防方法,其特征在于,用户通过所述终端设备中安装的应用程序接收所述信息数据,当所述终端设备判定所述信息识别结果正常时,所述信息安防方法还包括:
步骤5,传输所述信息数据至所述应用程序,执行所述应用程序,并接收所述信息数据的后续传输数据,根据所述后续传输数据,生成所述待检测样本,利用所述前向运算,检测所述待检测样本,生成所述信息识别结果,直至数据检测结束或所述信息识别结果被判定为有害结果。
4.根据权利要求1所述的面向互联网终端的信息安防方法,其特征在于,所述步骤2中包括:
步骤21,当判定所述信息数据的数据种类为图形信息时,解析并获取所述信息数据的对应的子图形信息,根据所述子图形信息生成所述待检测样本,其中,所述待检测样本为图形样本;
步骤22,选取所述视图识别模型,根据所述视图识别模型、所述参数以及所述权重,利用所述前向运算,检测所述待检测样本,生成所述信息识别结果。
5.根据权利要求4所述的面向互联网终端的信息安防方法,其特征在于,还包括:
步骤23,当判定所述数据种类为文本信息时,抽取所述信息数据中的连续文本信息,根据所述连续文本信息生成所述待检测样本,其中,所述待检测样本为文本样本;
步骤24,选取所述文本识别模型,根据所述文本识别模型、所述参数以及所述权重,利用所述前向运算,检测所述待检测样本,并生成所述信息识别结果。
6.根据权利要求3所述的面向互联网终端的信息安防方法,其特征在于,还包括:
步骤25,当判定所述数据种类为语音信息时,随机抽取所述信息数据中的输入语音段,根据所述输入语音段生成所述待检测样本,其中,所述待检测样本为语音样本;
步骤26,选取所述语音识别模型,根据所述语音识别模型、所述参数以及所述权重,利用所述前向运算,检测所述待检 测样本,并生成所述信息识别结果。
7.根据权利要求1所述的面向互联网终端的信息安防方法,其特征在于,获取离线训练结果的过程包括从外部接收所述离线训练结果和/或从终端设备的存储器中读取所述离线训练结果。
8.一种面向互联网终端的信息安防系统,其特征在于,所述信息安防系统适用于面向用户的终端设备,所述信息安防系统包括:数据接口,主控制模块,检测模块以及存储模块;
所述数据接口用于接收所述终端设备的外部的信息数据,并发送所述终端设备生成的报文;
所述主控制模块上安装有应用程序,用户运行应用程序后所述主控制模块利用所述数据接口接收所述信息数据,生成并发送所述信息数据的待检测样本至所述检测模块,并将所述信息数据暂存至所述存储模块中;
所述检测模块包括缓存单元和检测单元,所述缓存单元用于载入所述存储模块中的信息识别模型、参数以及权重,所述检测单元用于根据所述信息识别模型、所述参数以及所述权重,利用前向运算,检测所述待检测样本,生成信息识别结果,所述信息识别模型包括视图识别模型、文本识别模型以及语音识别模型;
所述主控制模块还用于根据所述信息识别结果,对接收到的所述信息数据进行处理,其中,处理的过程包括执行应用或阻断、打包、报文发送中的一种或多种操作,
所述主控制模块还用于:
当判定所述信息识别结果为有害结果时,则标记对应的信息识别结果为有害信息,删除所述存储模块中的所述信息数据,确定该有害信息中目的IP地址对应的应用程序,阻断该应用程序的运行,并根据所述信息数据对应的信息源和所述信息识别结果,生成有害数据编码报文,利用所述数据接口发送所述有害数据编码报文至监管服务器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910393609.2A CN110222846B (zh) | 2019-05-13 | 2019-05-13 | 一种面向互联网终端的信息安防方法及信息安防系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910393609.2A CN110222846B (zh) | 2019-05-13 | 2019-05-13 | 一种面向互联网终端的信息安防方法及信息安防系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110222846A CN110222846A (zh) | 2019-09-10 |
CN110222846B true CN110222846B (zh) | 2021-07-20 |
Family
ID=67821012
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910393609.2A Active CN110222846B (zh) | 2019-05-13 | 2019-05-13 | 一种面向互联网终端的信息安防方法及信息安防系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110222846B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116033184A (zh) * | 2022-12-28 | 2023-04-28 | 中国联合网络通信集团有限公司 | 视频的检测方法、装置、设备及可读存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1892675A (zh) * | 2005-06-30 | 2007-01-10 | 康佳集团股份有限公司 | 具色情图像过滤功能的移动终端及其方法 |
CN105022835A (zh) * | 2015-08-14 | 2015-11-04 | 武汉大学 | 一种群智感知大数据公共安全识别方法及系统 |
CN106203490A (zh) * | 2016-06-30 | 2016-12-07 | 江苏大学 | 一种安卓平台下基于属性学习和交互反馈的图像在线识别、检索方法 |
CN107547718A (zh) * | 2017-08-22 | 2018-01-05 | 电子科技大学 | 基于深度学习的电信诈骗识别与防御系统 |
CN107832765A (zh) * | 2017-09-13 | 2018-03-23 | 百度在线网络技术(北京)有限公司 | 对包括文字内容和图像内容的图片识别 |
CN108154134A (zh) * | 2018-01-11 | 2018-06-12 | 天格科技(杭州)有限公司 | 基于深度卷积神经网络的互联网直播色情图像检测方法 |
CN108595422A (zh) * | 2018-04-13 | 2018-09-28 | 卓望信息技术(北京)有限公司 | 一种过滤不良彩信的方法 |
CN108734184A (zh) * | 2017-04-17 | 2018-11-02 | 苏宁云商集团股份有限公司 | 一种对敏感图像进行分析的方法及装置 |
CN109327328A (zh) * | 2018-08-27 | 2019-02-12 | 深圳前海达闼云端智能科技有限公司 | 监管方法、装置、系统、云端服务器及存储介质 |
CN109558792A (zh) * | 2018-10-11 | 2019-04-02 | 成都三零凯天通信实业有限公司 | 一种基于样本和特征检测互联网徽标内容的方法和系统 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8498448B2 (en) * | 2011-07-15 | 2013-07-30 | International Business Machines Corporation | Multi-view object detection using appearance model transfer from similar scenes |
US9043918B2 (en) * | 2011-10-13 | 2015-05-26 | Mcafee, Inc. | System and method for profile based filtering of outgoing information in a mobile environment |
CN105144767B (zh) * | 2013-04-12 | 2019-07-02 | Sk电信有限公司 | 用于检查消息的装置和方法以及用户终端 |
KR102104123B1 (ko) * | 2013-07-15 | 2020-04-23 | 삼성전자주식회사 | 콘텐츠 디스플레이 장치 및 방법 |
US10089556B1 (en) * | 2017-06-12 | 2018-10-02 | Konica Minolta Laboratory U.S.A., Inc. | Self-attention deep neural network for action recognition in surveillance videos |
CN107256257A (zh) * | 2017-06-12 | 2017-10-17 | 上海携程商务有限公司 | 基于业务数据的异常用户生成内容识别方法及系统 |
-
2019
- 2019-05-13 CN CN201910393609.2A patent/CN110222846B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1892675A (zh) * | 2005-06-30 | 2007-01-10 | 康佳集团股份有限公司 | 具色情图像过滤功能的移动终端及其方法 |
CN105022835A (zh) * | 2015-08-14 | 2015-11-04 | 武汉大学 | 一种群智感知大数据公共安全识别方法及系统 |
CN106203490A (zh) * | 2016-06-30 | 2016-12-07 | 江苏大学 | 一种安卓平台下基于属性学习和交互反馈的图像在线识别、检索方法 |
CN108734184A (zh) * | 2017-04-17 | 2018-11-02 | 苏宁云商集团股份有限公司 | 一种对敏感图像进行分析的方法及装置 |
CN107547718A (zh) * | 2017-08-22 | 2018-01-05 | 电子科技大学 | 基于深度学习的电信诈骗识别与防御系统 |
CN107832765A (zh) * | 2017-09-13 | 2018-03-23 | 百度在线网络技术(北京)有限公司 | 对包括文字内容和图像内容的图片识别 |
CN108154134A (zh) * | 2018-01-11 | 2018-06-12 | 天格科技(杭州)有限公司 | 基于深度卷积神经网络的互联网直播色情图像检测方法 |
CN108595422A (zh) * | 2018-04-13 | 2018-09-28 | 卓望信息技术(北京)有限公司 | 一种过滤不良彩信的方法 |
CN109327328A (zh) * | 2018-08-27 | 2019-02-12 | 深圳前海达闼云端智能科技有限公司 | 监管方法、装置、系统、云端服务器及存储介质 |
CN109558792A (zh) * | 2018-10-11 | 2019-04-02 | 成都三零凯天通信实业有限公司 | 一种基于样本和特征检测互联网徽标内容的方法和系统 |
Non-Patent Citations (1)
Title |
---|
《网络不良信息过滤研究》;林建等;《信息系统》;20070430;第30卷(第4期);第534-539页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110222846A (zh) | 2019-09-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7018920B2 (ja) | 機密情報処理方法、装置、及び、サーバ、ならびに、セキュリティ決定システム | |
CN111917740B (zh) | 一种异常流量告警日志检测方法、装置、设备及介质 | |
CN113098870A (zh) | 一种网络诈骗检测方法、装置、电子设备及存储介质 | |
US11461995B2 (en) | Method and apparatus for inspecting burrs of electrode slice | |
CN107085549B (zh) | 故障信息生成的方法和装置 | |
CN107784205B (zh) | 一种用户产品审核的方法、装置、服务器和存储介质 | |
CN110768875A (zh) | 一种基于dns学习的应用识别方法及系统 | |
EP3331213A1 (en) | Access to data on a remote device | |
CN111835777A (zh) | 一种异常流量检测方法、装置、设备及介质 | |
CN114448830A (zh) | 一种设备检测系统及方法 | |
CN109657475A (zh) | 代码漏洞排查方法、装置、设备及存储介质 | |
CN113761527A (zh) | 一种反弹shell进程检测方法、装置、设备及存储介质 | |
CN113114680A (zh) | 用于文件上传漏洞的检测方法和检测装置 | |
CN110222846B (zh) | 一种面向互联网终端的信息安防方法及信息安防系统 | |
CN116800525A (zh) | 蜜罐防护方法、装置、存储介质及电子设备 | |
CN111045934A (zh) | 页面分析方法、装置、客户端、存储介质及电子设备 | |
CA2788100C (en) | Crawling of generated server-side content | |
CN113378025B (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN113111200B (zh) | 审核图片文件的方法、装置、电子设备和存储介质 | |
CN114510409A (zh) | 一种应用程序代码检测方法和计算机可读存储介质 | |
CN111475783A (zh) | 数据检测方法、系统及设备 | |
CN109523591A (zh) | 图片的处理方法、装置、设备和存储介质 | |
CN114070819B (zh) | 恶意域名检测方法、设备、电子设备及存储介质 | |
CN109495538B (zh) | 一种共享接入终端数量的检测方法及装置 | |
CN117171800B (zh) | 一种基于零信任防护体系的敏感数据识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |