CN101867932A - 一种基于移动互联网的有害信息过滤系统及其方法 - Google Patents

一种基于移动互联网的有害信息过滤系统及其方法 Download PDF

Info

Publication number
CN101867932A
CN101867932A CN201010184968.6A CN201010184968A CN101867932A CN 101867932 A CN101867932 A CN 101867932A CN 201010184968 A CN201010184968 A CN 201010184968A CN 101867932 A CN101867932 A CN 101867932A
Authority
CN
China
Prior art keywords
harmful information
unit
user
harmful
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201010184968.6A
Other languages
English (en)
Other versions
CN101867932B (zh
Inventor
胡凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HONGXU INFORMATION TECHNOLOGY Co Ltd WUHAN
Original Assignee
HONGXU INFORMATION TECHNOLOGY Co Ltd WUHAN
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HONGXU INFORMATION TECHNOLOGY Co Ltd WUHAN filed Critical HONGXU INFORMATION TECHNOLOGY Co Ltd WUHAN
Priority to CN2010101849686A priority Critical patent/CN101867932B/zh
Publication of CN101867932A publication Critical patent/CN101867932A/zh
Application granted granted Critical
Publication of CN101867932B publication Critical patent/CN101867932B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开了一种基于移动互联网的有害信息过滤系统及其方法,属于移动通信领域。本系统包括核心网,设置有数据采集单元、数据还原单元、存储单元、有害信息拦截单元、有害信息识别单元和有害信息展现与配置单元;核心网、数据采集单元、数据还原单元、有害信息识别单元、存储单元和有害信息展现与配置单元前后依次连接;有害信息识别单元、有害信息拦截单元和核心网前后依次连接。本发明能够对所有移动互联网用户的有害信息进行实时分析,并提供了相应的拦截功能,提高了移动互联网的有害信息过滤系统的自动化程度和精确度,可以作为电信运营商建设移动互联网淫秽色情信息发现和过滤的重要手段。

Description

一种基于移动互联网的有害信息过滤系统及其方法
技术领域
本发明属于移动通信领域,具体涉及一种基于移动互联网的有害信息过滤系统及其方法。
背景技术
随着移动互联网技术的迅猛发展,特别是3G网络在我国大规模部署,满足了人们对于移动上网的需求。但是移动互联网上也存在着一些有害信息如淫秽色情信息腐蚀了人们的心灵,极大地影响了和谐社会的发展,因此需要相关的系统和方法对于移动互联网的有害信息进行过滤。
传统的有害信息过滤方法是通过对重点WAP网站拨测的方式对有害信息的的WAP网站进行监测,存在两个问题:一是不易对所有WAP网站进行监控,二是即使发现某一WAP网站存在的有害信息,如果该WAP网站的服务器位于境外,不易进行封堵。这对于如何防止有害信息通过移动互联网进行传播提出了新的挑战。
可见,传统的有害信息过滤技术存在着一定的局限性,不能完全适用于移动互联网有害信息监控的需要,需要进行改进。
发明内容
本发明的目的在于克服现有技术存在的缺点和不足,提供一种基于移动互联网的有害信息过滤系统及其方法,以解决目前移动互联网中存在淫秽色情信息的问题。
实现本发明目的的技术方案是:
一、基于移动互联网的有害信息过滤系统(简称系统)
本系统包括核心网,
设置有数据采集单元、数据还原单元、存储单元、有害信息拦截单元、有害信息识别单元和有害信息展现与配置单元;
其连接和交互关系是:
核心网、数据采集单元、数据还原单元、有害信息识别单元、存储单元和有害信息展现与配置单元前后依次连接,实现有害信息的识别、存储和展现;
有害信息识别单元、有害信息拦截单元和核心网前后依次连接,实现有害信息的拦截;
数据采集单元负责从核心网中采集用户上网的信令和业务数据,分析用户的身份标识,对移动互联网承载协议和应用协议进行解析,并将解析的结果发给数据还原单元;
数据还原单元负责还原用户上网数据;
有害信息识别单元负责对数据还原单元发来的数据进行分析识别,包括有害文字识别、有害图像识别、有害视频识别、有害音频识别,并将有害信息写入到存储单元;
存储单元负责存储有害信息相关数据和有害系统的识别规则;
有害信息展现与配置单元负责展现系统分析到的移动互联网的有害信息的总体情况和具体记录,并可以根据需要设置有害系统的识别规则;
有害信息拦截单元负责接收有害信息识别单元的指令,采用一定的策略,向核心网发送拦截包来阻断用户访问移动互联网有害信息。
二移动互联网的有害信息过滤方法(简称方法)
本方法包括以下步骤:
①数据采集单元从核心网中采集用户上网的信令和业务数据,分析用户的身份标识,对移动互联网承载协议和应用协议进行解析,并将解析数据发送给数据还原单元;
②数据还原单元接收数据采集单元发来的用户数据,进行还原,并将还原后的数据发送给有害信息识别单元;
③有害信息识别单元对还原后的用户上网数据进行分析识别,并将分析出的有害信息数据保存到存储单元;
④有害信息拦截单元接收有害信息识别单元的指令,采用一定的策略,向核心网发送拦截包来阻断用户访问移动互联网有害信息;
⑤用户通过有害信息展现与配置单元浏览移动互联网有害信息的总体情况和具体记录,并可以根据需要设置有害系统的识别规则。
本发明具有下列优点和积极效果:
①通过在移动互联网的核心网中分析出用户上网数据,通过高效算法识别出有害信息,并向移动互联网的核心网发送拦截包来阻断用户访问移动互联网中的有害信息;
②提高了分析移动互联网有害信息的精确度,并设计出了一种有害信息的阻断方法。
总之,本发明能够对所有移动互联网用户的有害信息进行实时分析,并提供了相应的拦截功能,提高了移动互联网的有害信息过滤系统的自动化程度和精确度,可以作为电信运营商建设移动互联网淫秽色情信息发现和过滤的重要手段。
附图说明
图1是本系统的结构方框图;
图2是数据采集单元的工作流程图;
图3是有害信息识别单元和有害信息拦截单元的工作流程图。
其中:
000-核心网;
100-数据采集单元;
200-数据还原单元;
300-存储单元;
400-有害信息拦截单元;
500-有害信息识别单元;
600-有害展现与配置单元。
具体实施方式
以下结合附图和实施例详细说明:
一、系统
如图1,本系统包括核心网000,
设置有数据采集单元100、数据还原单元200、存储单元300、有害信息拦截单元400、有害信息识别单元500和有害信息展现与配置单元600;
其连接和交互关系是:
核心网000、数据采集单元100、数据还原单元200、有害信息识别单元500、存储单元300和有害信息展现与配置单元600前后依次连接,实现有害信息的识别,存储和展现;
有害信息识别单元500、有害信息拦截单元400、和核心网000前后依次连接,实现有害信息的拦截。
二、方法
1、数据采集单元100的工作流程
如图2,数据采集单元100的工作流程包括下列步骤:
①10,截获网络包,通过抓包的方式截获核心网中SGSN(GPRS服务支持节点)与GGSN(GPRS网关支持节点)之间的Gn接口的网络包;
②11,判断网络包中GTP(GPRS隧道协议)消息的类型,如果类型字段为0xff则为GTP数据包,跳转到步骤⑦16;否则为GTP信令包,跳转到步骤③12;
③12,判断信令包类型,
如果类型字段为0x10,则为创建PDP(分组数据协议)上下文请求包,跳转到步骤④13;
如果类型字段为0x11,则为创建PDP上下文响应包,跳转到步骤⑤(14);
如果类型为其他数值,则为其他信令包,跳转到步骤⑥(15);
④13,当信令包为创建PDP上下文请求包时,分析出用户的IMSI(国际移动用户识别码),下行的TEID-C(控制面隧道终点标识),下行的TEID-U(数据面隧道终点标识),并将这三项保存在该用户的上下文中,其中IMSI为用户的身份标识;
⑤14,当信令包为创建PDP上下文响应包,取出包中的下行的TEID-C,与用户上下文中的下行TEID-C比对,找到该用户的上下文;将包中分析出的上行的TEID-C,上行的TEID-U也保存在用户上下文中;
⑥15,当信令包为其他类型时,如果是上行包,取出包中上行的TEID-C,与用户上下文中的上行TEID-C比对,找到该用户的上下文;如果是下行包,取出包中下行的TEID-C,与用户上下文中的下行TEID-C比对,找到该用户的上下文;
⑦16,判断GTP数据包的类型,如果是上行包,则跳转到步骤⑧17;如果是下行包,则跳转到步骤⑨18;
⑧17,当数据包为上行包时,取出包中上行的TEID-U,与用户上下文中上行的TEID-U比对,找到该用户上下文,再转到步骤⑩19;
⑨18,当数据包为下行包时,取出包中下行的TEID-U,与用户上下文中下行的TEID-U比对,找到该用户上下文,再转到步骤⑩19;
⑩19,解析GTP数据包中上层IP包的内容,分析WAP,HTTP,MMS等协议,将用户上网应用包和用户身份标识IMSI发送给还原单元。
2、有害信息识别单元500和有害信息拦截单元400的工作流程
如图3,有害信息识别单元和有害信息拦截单元的工作流程包括下列步骤:
①20,有害信息识别单元接收数据还原单元发送的用户上网数据包;
②21,有害信息识别单元判断用户访问的页面是否包含有害信息,无则结束,有则跳转到步骤③22;
③22,有害信息识别单元判断该有害应用是否为网页,是则跳转到步骤④23,否则跳转到步骤⑤24;
④23,有害信息识别单元将该页面网址保存到有害信息过滤规则中;
⑤24,有害信息识别单元判断该应用是否是基于TCP协议的,如果是则跳转到步骤⑥25,否则跳转到步骤⑦26;
⑥25,有害信息识别单元通知有害信息拦截单元,有害信息拦截单元发送TCP的RESET包给用户,以便阻止用户进一步访问有害信息;
⑦26,有害信息识别单元判断该应用是否是基于WAP1。X的,是则跳转到步骤⑧27,否则跳转到步骤⑨28;
⑧27,有害信息识别单元通知有害信息拦截单元,有害信息拦截单元发送WTP的ABORT包给用户,以便阻止用户进一步访问有害信息;
⑨28,有害信息识别单元通知有害信息拦截单元,有害信息拦截单元发送ICMP不可达包给用户,以便阻止用户进一步访问有害信息。

Claims (4)

1.一种基于移动互联网的有害信息过滤系统,其特征在于:
包括核心网(000),
设置有数据采集单元(100)、数据还原单元(200)、存储单元(300)、有害信息拦截单元(400)、有害信息识别单元(500)和有害信息展现与配置单元(600);
其连接和交互关系是:
核心网(000)、数据采集单元(100)、数据还原单元(200)、有害信息识别单元(500)、存储单元(300)和有害信息展现与配置单元(600)前后依次连接,实现有害信息的识别存储和展现;
有害信息识别单元(500)、有害信息拦截单元(400)和核心网(000)前后依次连接,实现有害信息的拦截;
数据采集单元(100)负责从核心网000中采集用户上网的信令和业务数据,分析用户的身份标识,对移动互联网承载协议和应用协议进行解析,并将解析的结果发给数据还原单元(200);
数据还原单元(200)负责还原用户上网数据;
有害信息识别单元(500)负责对数据还原单元(200)发来的数据进行分析识别,包括有害文字识别、有害图像识别、有害视频识别、有害音频识别,并将有害信息写入到存储单元(300);
存储单元(300)负责存储有害信息相关数据和有害系统的识别规则;
有害信息展现与配置单元(600)负责展现系统分析到的移动互联网的有害信息的总体情况和具体记录,并可以根据需要设置有害系统的识别规则;
有害信息拦截单元(400)负责接收有害信息识别单元500的指令,采用一定的策略,向核心网(000)发送拦截包来阻断用户访问移动互联网有害信息。
2.根据权利要求1所述系统的有害信息过滤的方法,其特征在于包括以下步骤:
①数据采集单元从核心网中采集用户上网的信令和业务数据,分析用户的身份标识,对移动互联网承载协议和应用协议进行解析,并将解析数据发送给数据还原单元;
②数据还原单元接收数据采集单元发来的用户数据,进行还原,并将还原后的数据发送给有害信息识别单元;
③有害信息识别单元对还原后的用户上网数据进行分析识别,并将分析出的有害信息数据保存到存储单元;
④有害信息拦截单元接收有害信息识别单元的指令,采用一定的策略,向核心网发送拦截包来阻断用户访问移动互联网有害信息;
⑤用户通过有害信息展现与配置单元浏览移动互联网有害信息的总体情况和具体记录,并可以根据需要设置有害系统的识别规则。
3.根据权利要求2所述的方法,其特征在数据采集单元的工作流程包括下列步骤:
①(10),截获网络包,通过抓包的方式截获核心网中SGSN与GGSN之间的Gn接口的网络包;
②(11),判断网络包中GTP消息的类型,如果类型字段为0xff则为GTP数据包,跳转到步骤⑦16;否则为GTP信令包,跳转到步骤③12;
③(12),判断信令包类型,
如果类型字段为0x10,则为创建PDP上下文请求包,跳转到步骤④(13);
如果类型字段为0x11,则为创建PDP上下文响应包,跳转到步骤⑤(14);
如果类型为其他数值,则为其他信令包,跳转到步骤⑥(15);
④(13),当信令包为创建PDP上下文请求包时,分析出用户的IMSI,下行的TEID-C,下行的TEID-U,并将这三项保存在该用户的上下文中,其中IMSI为用户的身份标识;
⑤(14),当信令包为创建PDP上下文响应包,取出包中的下行的TEID-C,与用户上下文中的下行TEID-C比对,找到该用户的上下文;将包中分析出的上行的TEID-C,上行的TEID-U也保存在用户上下文中;
⑥(15),当信令包为其他类型时,如果是上行包,取出包中上行的TEID-C,与用户上下文中的上行TEID-C比对,找到该用户的上下文;如果是下行包,取出包中下行的TEID-C,与用户上下文中的下行TEID-C比对,找到该用户的上下文;
⑦(16),判断GTP数据包的类型,如果是上行包,则跳转到步骤⑧17;如果是下行包,则跳转到步骤⑨18;
⑧(17),当数据包为上行包时,取出包中上行的TEID-U,与用户上下文中上行的TEID-U比对,找到该用户上下文,再转到步骤⑩19;
⑨(18),当数据包为下行包时,取出包中下行的TEID-U,与用户上下文中下行的TEID-U比对,找到该用户上下文,再转到步骤⑩19;
⑩(19),解析GTP数据包中上层IP包的内容,分析WAP,HTTP,MMS等协议,将用户上网应用包和用户身份标识IMSI发送给还原单元。
4.根据权利要求2所述的方法,其特征在于有害信息识别单元和有害信息拦截单元的工作流程包括下列步骤:
①(20),有害信息识别单元接收数据还原单元发送的用户上网数据包;
②(21),有害信息识别单元判断用户访问的页面是否包含有害信息,无则结束,有则跳转到步骤③22;
③(22),有害信息识别单元判断该有害应用是否为网页,是则跳转到步骤④23,否则跳转到步骤⑤24;
④(23),有害信息识别单元将该页面网址保存到有害信息过滤规则中;
⑤(24),有害信息识别单元判断该应用是否是基于TCP协议的,如果是则跳转到步骤⑥25,否则跳转到步骤⑦26;
⑥(25),有害信息识别单元通知有害信息拦截单元,有害信息拦截单元发送TCP的RESET包给用户,以便阻止用户进一步访问有害信息;
⑦(26),有害信息识别单元判断该应用是否是基于WAP1.X的,是则跳转到步骤⑧27,否则跳转到步骤⑨28;
⑧(27),有害信息识别单元通知有害信息拦截单元,有害信息拦截单元发送WTP的ABORT包给用户,以便阻止用户进一步访问有害信息;
⑨(28),有害信息识别单元通知有害信息拦截单元,有害信息拦截单元发送ICMP不可达包给用户,以便阻止用户进一步访问有害信息。
CN2010101849686A 2010-05-21 2010-05-21 一种基于移动互联网的有害信息过滤系统及其方法 Active CN101867932B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010101849686A CN101867932B (zh) 2010-05-21 2010-05-21 一种基于移动互联网的有害信息过滤系统及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010101849686A CN101867932B (zh) 2010-05-21 2010-05-21 一种基于移动互联网的有害信息过滤系统及其方法

Publications (2)

Publication Number Publication Date
CN101867932A true CN101867932A (zh) 2010-10-20
CN101867932B CN101867932B (zh) 2012-11-28

Family

ID=42959440

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010101849686A Active CN101867932B (zh) 2010-05-21 2010-05-21 一种基于移动互联网的有害信息过滤系统及其方法

Country Status (1)

Country Link
CN (1) CN101867932B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103377339A (zh) * 2012-04-13 2013-10-30 腾讯科技(深圳)有限公司 消息处理的方法及用户设备
CN103473299A (zh) * 2013-09-06 2013-12-25 北京锐安科技有限公司 一种网站不良似然度获取方法和装置
WO2016058401A1 (zh) * 2014-10-16 2016-04-21 中兴通讯股份有限公司 一种超文本传输协议数据还原方法及装置
WO2019127652A1 (zh) * 2017-12-30 2019-07-04 惠州学院 基于用户id和片尾内容的识别有害视频的方法及系统
WO2019127661A1 (zh) * 2017-12-30 2019-07-04 惠州学院 一种基于用户ip识别有害视频的方法及其系统
CN112632355A (zh) * 2020-11-26 2021-04-09 武汉虹旭信息技术有限责任公司 有害信息的碎片内容处理方法及装置
CN114238962A (zh) * 2021-09-29 2022-03-25 睿贸恒诚(山东)科技发展有限责任公司 一种基于移动互联网的有害信息过滤系统及其方法
CN114461025A (zh) * 2021-12-28 2022-05-10 中科信息安全共性技术国家工程研究中心有限公司 一种能够进行拦截的网络违法信息识别服务器

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1761204A (zh) * 2005-11-18 2006-04-19 郑州金惠计算机系统工程有限公司 在互联网上堵截色情图像与不良信息的系统
CN1950812A (zh) * 2004-11-05 2007-04-18 芝兰之交软件有限公司 色情内容拦截方法
WO2009049678A1 (en) * 2007-10-18 2009-04-23 Telefonaktiebolaget Lm Ericsson (Publ) Methods and arrangements in a mobile telecommunications network
CN101610474A (zh) * 2009-07-27 2009-12-23 成都思维世纪科技有限责任公司 Wap内容监控方法及其监控装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1950812A (zh) * 2004-11-05 2007-04-18 芝兰之交软件有限公司 色情内容拦截方法
CN1761204A (zh) * 2005-11-18 2006-04-19 郑州金惠计算机系统工程有限公司 在互联网上堵截色情图像与不良信息的系统
WO2009049678A1 (en) * 2007-10-18 2009-04-23 Telefonaktiebolaget Lm Ericsson (Publ) Methods and arrangements in a mobile telecommunications network
CN101610474A (zh) * 2009-07-27 2009-12-23 成都思维世纪科技有限责任公司 Wap内容监控方法及其监控装置

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103377339A (zh) * 2012-04-13 2013-10-30 腾讯科技(深圳)有限公司 消息处理的方法及用户设备
CN103377339B (zh) * 2012-04-13 2016-01-20 腾讯科技(深圳)有限公司 消息处理的方法及用户设备
CN103473299A (zh) * 2013-09-06 2013-12-25 北京锐安科技有限公司 一种网站不良似然度获取方法和装置
CN103473299B (zh) * 2013-09-06 2017-02-08 北京锐安科技有限公司 一种网站不良似然度获取方法和装置
WO2016058401A1 (zh) * 2014-10-16 2016-04-21 中兴通讯股份有限公司 一种超文本传输协议数据还原方法及装置
WO2019127652A1 (zh) * 2017-12-30 2019-07-04 惠州学院 基于用户id和片尾内容的识别有害视频的方法及系统
WO2019127661A1 (zh) * 2017-12-30 2019-07-04 惠州学院 一种基于用户ip识别有害视频的方法及其系统
CN112632355A (zh) * 2020-11-26 2021-04-09 武汉虹旭信息技术有限责任公司 有害信息的碎片内容处理方法及装置
CN114238962A (zh) * 2021-09-29 2022-03-25 睿贸恒诚(山东)科技发展有限责任公司 一种基于移动互联网的有害信息过滤系统及其方法
CN114461025A (zh) * 2021-12-28 2022-05-10 中科信息安全共性技术国家工程研究中心有限公司 一种能够进行拦截的网络违法信息识别服务器

Also Published As

Publication number Publication date
CN101867932B (zh) 2012-11-28

Similar Documents

Publication Publication Date Title
CN101867932B (zh) 一种基于移动互联网的有害信息过滤系统及其方法
CN104488231B (zh) 用于有选择地监视流量的方法、设备和系统
CN108337652B (zh) 一种检测流量欺诈的方法及装置
CN101626551B (zh) 一种基于移动互联网的广告业务推送系统和方法
CN101977367B (zh) 移动增值业务访问控制策略的制定方法及相关装置和系统
EP2610767A1 (en) Web page download time analysis
CN103338249B (zh) 缓存方法及装置
KR101272670B1 (ko) 사용자 단말의 접속 네트워크 식별 장치, 방법 및 컴퓨터 판독 가능한 기록 매체
CN103491575A (zh) 会话感知GTPv1负载平衡
CN106656577B (zh) 一种app及浏览器的用户行为统计方法及智能路由器
EP2556632A1 (en) Real-time adaptive processing of network data packets for analysis
CN104394211A (zh) 一种基于Hadoop用户行为分析系统设计与实现方法
CN103974232A (zh) WiFi用户终端识别方法及系统
CN102387172A (zh) 用于为移动设备提供或获取网络资源的内容的方法和装置
CN103200231B (zh) 策略控制方法及系统
CN108153783A (zh) 一种数据缓存的方法和装置
CN103455600A (zh) 一种视频url抓取方法、装置及服务器设备
CN104967632B (zh) 网页异常数据处理方法、数据服务器及系统
CN107623745A (zh) 一种监控方法、系统及计算机可读存储介质
CN104901961A (zh) 一种数据推送方法、服务器、终端及系统
CN106357482A (zh) 一种基于网络协议实施监控网页访问的方法
CN109559121A (zh) 交易路径调用异常分析方法、装置、设备及可读存储介质
CN111884883A (zh) 一种用于业务接口的快速审计处理方法
CN112256734A (zh) 一种大数据处理方法、装置、系统、设备和存储介质
CN102395117B (zh) 内容类型识别的方法和设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant