CN101309280B - 信息过滤服务器、方法、系统及终端 - Google Patents

信息过滤服务器、方法、系统及终端 Download PDF

Info

Publication number
CN101309280B
CN101309280B CN200810129109A CN200810129109A CN101309280B CN 101309280 B CN101309280 B CN 101309280B CN 200810129109 A CN200810129109 A CN 200810129109A CN 200810129109 A CN200810129109 A CN 200810129109A CN 101309280 B CN101309280 B CN 101309280B
Authority
CN
China
Prior art keywords
information source
suspicious
information
junk
terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN200810129109A
Other languages
English (en)
Other versions
CN101309280A (zh
Inventor
罗光瑜
邱耀武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhongcai Wyse Education Technology Co ltd
Tongzhou District Nantong Xin Hao Industrial Co ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN200810129109A priority Critical patent/CN101309280B/zh
Publication of CN101309280A publication Critical patent/CN101309280A/zh
Application granted granted Critical
Publication of CN101309280B publication Critical patent/CN101309280B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种信息过滤服务器、方法、系统及终端,本发明公开的信息过滤服务器包括:第一接收单元,用于接收举报的垃圾信息源;分析单元,用于分析得出所述垃圾信息源的可疑度;第一更新单元,用于将所述垃圾信息源与所述垃圾信息源的可疑度对应更新到可疑信息源列表中。本发明减少用户的手工操作。

Description

信息过滤服务器、方法、系统及终端
技术领域
本发明涉及通信领域,尤其涉及信息过滤服务器、方法、系统及终端。
背景技术
随着通信技术的发展,短信越来越多地被人们应用作为沟通的一种方式;一些服务提供商利用短信向终端用户发送广告或者其他与用户无关的信息,影响终端用户正常的工作和生活,给终端用户带来不便;这些被发送到用户终端上,对用户无用的信息被称为垃圾信息。
现有技术一在短信网关处提供一个垃圾过滤器,如果服务提供商使用短信端口向终端用户推送垃圾信息,运营商收到用户的投诉后,拦截该端口向终端用户推送的信息,终端用户不会再收到该端口推送的信息;或者垃圾过滤器根据垃圾信息发送的特征比如:大面积群发、内容相同、广告信息为主等,对垃圾信息进行分析过滤,达到不影响终端用户的目的。但若服务提供商通过工具使用普通手机号码向终端用户发送垃圾信息,现有技术一就无法拦截通过普通号码发送的垃圾信息;另外,垃圾过滤器分析垃圾信息的特征实现对垃圾信息的过滤,由于没有经过用户的辨别和许可,准确度不高。
现有技术二,终端上设置黑名单列表,用户设置拒绝接收的信息源在黑白道列表中;设置黑名单列表后,凡在黑名单列表中的信息源发送的信息都会被当作垃圾信息过滤掉。在终端上设置黑名单列表,可以拒绝短信端口推送的垃圾信息,也可以拒绝普通手机号码发送的垃圾信息,且经用户的辨认和许可,准确度较高。但该方案,只有在终端用户接收到垃圾信息后才能进行黑名单列表的设置,不能预先过滤掉可能是发送垃圾信息的信息源;且每个终端用户在接收到垃圾信息后都需要设置一次黑名单列表,终端用户操作复杂、可实现行差。
发明内容
本发明实施例提供信息过滤服务器、方法、系统及终端,能够实现终端垃圾信息更有效、准确地过滤。
为解决上述技术问题,本发明所提供的一种信息过滤的系统及、终端、信息过滤服务器及信息过滤方法实施例是通过以下技术方案实现的:
本发明实施例提供一种信息过滤服务器,包括:
第一接收单元,用于接收举报的垃圾信息源;
分析单元,用于分析得出所述垃圾信息源的可疑度,可疑度H=(rM+tN+sP)/Q,其中,M是举报垃圾信息源的终端用户数目,N是重复举报垃圾信息源的终端用户数目,P是利用文本搜索技术中的关键字匹配技术计算出来的关键字匹配度,r、t、s是计算权值比例,r>t>s,Q为缩放比例;
第一更新单元,用于将所述垃圾信息源与所述垃圾信息源的可疑度对应更新到可疑信息源列表中。
本发明实施例还提供一种终端,包括:
第一获取单元,用于从信息过滤服务器获取可疑信息源列表,所述可疑信息源列表包括信息源以及与信息源对应的可疑度,其中,所述可疑度由所述信息过滤服务器分析得出,可疑度H=(rM+tN+sP)/Q,其中,M是举报垃圾信息源的终端用户数目,N是重复举报垃圾信息源的终端用户数目,P是利用文本搜索技术中的关键字匹配技术计算出来的关键字匹配度,r、t、s是计算权值比例,r>t>s,Q为缩放比例;
黑名单更新单元,用于依据所述可疑信息源列表更新黑名单列表,所述黑名单列表包括信息源以及与信息源对应的可疑度。
本发明实施例还提供一种信息过滤的方法,包括:
接收举报的垃圾信息源;
分析得出所述垃圾信息源的可疑度,可疑度H=(rM+tN+sP)/Q,其中,M是举报垃圾信息源的终端用户数目,N是重复举报垃圾信息源的终端用户数目,P是利用文本搜索技术中的关键字匹配技术计算出来的关键字匹配度,r、t、s是计算权值比例,r>t>s,Q为缩放比例;
将所述垃圾信息源与所述垃圾信息源的可疑度对应更新到可疑信息源列表中。
另外本发明实施例还一种信息过滤的系统,包括:能与终端通信的信息过滤服务器;
终端,用于向所述信息过滤服务器举报垃圾信息源;
所述信息过滤服务器:用于接收所述终端举报的垃圾信息源,分析得出所述垃圾信息源的可疑度,可疑度H=(rM+tN+sP)/Q,其中,M是举报垃圾信息源的终端用户数目,N是重复举报垃圾信息源的终端用户数目,P是利用文本搜索技术中的关键字匹配技术计算出来的关键字匹配度,r、t、s是计算权值比例,r>t>s,Q为缩放比例,将所述垃圾信息源与所述垃圾信息源的可疑度对应更新到可疑信息源列表中;
所述终端,依据所述更新的可疑信息源列表更新黑名单列表,所述黑名单列表包括信息源以及与信息源对应的可疑度。
上述技术方案具有如下有益效果:本发明实施例提供的信息过滤服务器分析终端举报的垃圾信息源,更新可疑信息源列表,终端依据信息过滤服务器更新的可疑信息源列表更新黑名单列表,相对于现有技术不必每个终端用户收到垃圾信息后都要设置一次黑名单列表,减少用户的手工操作。
附图说明
图1是本发明实施例提供的终端信息过滤实施例图;
图2是本发明实施例提供的终端与信息过滤服务器交互更新终端可疑度黑名单列表流程图;
图3是本发明实施例提供的终端获取可疑信息源列表流程图;
图4是本发明实施例提供的信息过滤服务器形成可疑信息源列表流程图;
图5是本发明实施例提供的获取可疑信息源列表的终端结构图;
图6是本发明实施例提供的信息过滤的终端结构图;
图7是本发明实施例提供的信息过滤服务器结构图。
具体实施方式
本发明实施例提供信息过滤服务器、方法、系统及终端,用于实现垃圾信息的过滤。
本发明实施例提供信息过滤服务器,信息过滤服务器与终端连接,接收终端的举报,对终端举报的垃圾信息源进行分析,形成可疑信息源列表;信息过滤服务器将可疑信息源列表发送给各个终端,或者终端定期向信息过滤服务器请求获取可疑信息源列表,终端根据可疑信息源列表更新自身的可疑度黑名单列表。当终端接收到垃圾信息时,若该垃圾信息源在终端的可疑度黑名单列表中,且可疑度达到预置程度,终端直接拦截该垃圾信息,不再向用户显示。
如下结合附图详细说明本发明实施例提供的信息过滤的方法及系统。
请参阅图1是本发明实施例提供的终端信息过滤流程图。
终端在收到新的信息时,首先做如下的处理:
步骤101、标识垃圾信息的信息源;
步骤102、将信息源与通讯录比较;
若信息源存在于通讯录中,向用户显示该信息,若信息源不存在于通讯录中,则执行步骤103。
在终端收到新的信息时,也可疑不执行步骤101和步骤102,直接执行步骤103,将信息源与可疑度黑名单列表比较,进行信息的过滤。
步骤103、将信息源与可疑度黑名单列表比较;
若信息源存在于可疑度黑名单列表中,根据该信息源在可疑度黑名单列表中对应的可疑度确定下一步的过滤处理;比如,本发明实施例可以将信息源的可疑度分为四级,终端对于信息源可疑度一到四级的过滤处理如下:
一级,显示信息;
二级,显示信息,同时提示该信息可能是垃圾信息;
三级,将该信息存储在一个固定的位置,并提示用户手动清理;
四级,直接将信息删除。
可疑度级别为一的信息源,终端直接显示该信息源发送的信息,直接向用户显示该信息;可疑度级别为二的信息源,终端显示该信息源发送的信息,并提示用户该信息可能是垃圾信息;可疑度级别为三的信息源,终端将该信息源发送的信息存储在一个固定的位置,并定期提示用户手动清理;可疑度级别为四的信息源,终端将该信息源发送的信息直接删除。
若信息源不存在于可疑度黑名单列表中,终端显示该信息源发送的信息。
终端根据信息源的可疑度提示用户执行举报垃圾信息源的操作,终端举报垃圾信息源,信息过滤服务器根据终端的举报更新可疑信息源列表,终端再根据更新的可疑信息源列表更新自身的可疑度黑名单列表。
具体请参阅图2是本发明实施例提供的终端与信息过滤服务器交互更新终端可疑度黑名单列表流程图。
步骤201、终端举报垃圾信息源;
网络中的任何一个终端都可以向信息过滤服务器举报用户认为是发送垃圾信息的信息源,经过终端用户的辨别和许可,增强垃圾信息源过滤的准确度;对于文本信息终端举报垃圾信息源的同时会举报该信息源发送的信息。网络中的任何一个终端都可以向信息过滤服务器举报垃圾信息源,信息过滤服务器可以收集整个网络终端举报的垃圾信息源;例如,终端A收到垃圾信息,向信息过滤服务器举报该垃圾信息源x,信息过滤服务器分析处理后,将x及对应其可疑度更新到可疑信息源列表中,信息过滤服务器将最新的可疑信息源列表发送到网络中所有的终端;当终端B收到x发送的信息时,终端不必再进行终端A的比较操作,直接根据可疑度黑名单列表中x对应的可疑度确定对x发送的信息的处理。将所有终端举报的垃圾信息源集中分析处理,一个终端或少数举报,网络中其他终端都可以避免再设置可疑度黑名单列表的操作,减少用户操作流程。
步骤202、信息过滤服务器分析得出垃圾信息源的可疑度;
信息过滤服务器根据终端的举报,定期分析处理终端举报的垃圾信息源,更新可疑信息源列表。
信息过滤服务器接收终端举报的信息源,同时统计举报该信息源的终端用户数目M,重复举报该信息源的终端用户数目N;若该信息源发送的信息是文本信息,信息过滤服务器同时进行关键词的匹配,确定关键字的匹配度P分析该信息源发送的文本信息进一步确定该信息源是否是垃圾信息源,具体解释如下:P:是利用文本搜索技术中的关键字匹配技术计算出来的关键字匹配度。是利用匹配和被匹配文本分解出来的关键字信息,进行比较。根据对应关键字的匹配程度反映两段文本之间的相识程度,并借此反映他们间语义上的相识程度。本发明约定P为一个0~1之间的数字。P若为1表示两段文本完全一样,P若为0表示两段文本完全不相关。关键字匹配度的实现原理大致分为两部分:语义拆词:将一段文本拆分出若干个字段,并抽取核心作为匹配关键字;关键字匹配:将拆分出来的关键字进行匹配。根据关键字的顺序和匹配数量来判断两段文本的匹配度。如果一个信息源被上报多篇不同文本,则该信息源的P为上报多篇不同文本的加权平均值。
最终确定可疑度H=(rM+tN+sP)/Q,其中M+N为垃圾信息服务器收到的关于一个信息源的总的举报数,r、t、s是计算权值比例,r>t>s由信息过滤服务器调整设定,Q是恒定比例。
上述公式参数说明如下:
r、t、s为权值,反映了对黑名单的各个判断因素的贡献度。r表示不同信息源的举报数量的贡献率,t表示这些信息源的重复次数贡献率。例如,同一个人对一个信息源举报过两次,那么在这个信息源的判断中,虽然举报总次数是2次,但实际只有一个人举报(M=1),大众化程度并不高,而重复举报的那一次(N=1)说明:单个人对这个信息源判断是比较肯定的。因此通常来说,r部分的贡献率是比t高,默认约定为r∶t=3∶1,通常情况下,r默认取1,t一般为0.33。
s代表黑名单的判断的扩散程度。例如一个黑名单源,只有5个人反馈了这是一个垃圾信息。但是这个文本信息和黑名单知识库里面的语义匹配度很高。因此,即时只有5个人反馈这是垃圾信息,但这5个人就很有代表信息,更能代表大众说明这就是垃圾信息。因此S值为长期举报垃圾信息源终端数目M的平均值。
Q为缩放比例,是保留的数值缩放比例,一般为1。
步骤203、信息过滤服务器更新可疑信息源列表;
将用户举报的信息源与分析得到的该信息源的可疑度对应,更新到可疑信息源列表中;信息过滤服务器同时更新可疑信息列表的时间戳。该可疑信息源列表中包含垃圾信息源及该垃圾信息源的可疑度。
步骤204、信息过滤服务器发送可疑信息源列表;
信息过滤服务器向网络中的终端发送可疑信息源列表。
步骤205、终端依据可疑信息源列表更新可疑度黑名单列表;
终端同时更新可疑度黑名单列表的时间戳。
终端举报垃圾信息源,信息过滤服务器根据终端举报的垃圾信息源以及举报垃圾信息源的终端数目和关键字匹配度计算得出垃圾信息源的可疑度,更新可疑信息源列表,信息过滤服务器将更新后的可疑信息源列表发送给终端,终端根据可疑信息源列表更新存储的可疑度黑名单列表。
终端再收到新信息,会与新的可疑度黑名单列表进行比较,按照可疑度黑名单列表中的可疑度处理信息源发送的信息;或者,终端更新了可疑度黑名单列表后,根据更新的可疑度黑名单列表生成黑名单子列表,黑名单子列表中将可疑度黑名单列表中的信息源按照不同的可疑度进行分类,举例来说:可疑度是一级的信息源归为一类,可疑度是二级的信息源归为一类,可疑度是三级的信息源归为一类,可疑度是四级的信息源归为一类。每一类对应每个可疑度对应的终端处理方式,具体来说,根据可疑度分类后的信息源分别对应终端的处理方式,对应一级可疑度的一类信息源直接向用户显示该信息;对应二级可疑度的一类信息源,终端显示该信息源发送的信息,并提示用户该信息可能是垃圾信息;对应三级可疑度的一类信息源,终端将该信息源发送的信息存储在一个固定的位置,并定期提示用户手动清理;对应四级可疑度的一类信息源,终端将该信息源发送的信息直接删除。这样终端在收到新信息后,直接查找新信息的信息源对应的处理方式,减少查找可疑度黑名单列表对应可疑度的处理方式的流程,减少终端收到新信息后的处理时间。
在整个过程中,网络中有终端定期向信息过滤服务器请求获取可疑信息源列表,信息过滤服务器会将可疑信息源列表的时间戳与终端提供的可疑度黑名单列表的时间戳进行比较,若可疑度黑名单列表的时间戳与可疑信息源列表的时间戳不一致,则信息过滤服务器向终端发送可疑信息源列表。具体的过程请参阅图3是本发明实施例提供的终端获取可疑信息源列表流程图。
步骤301、终端向信息过滤服务器发送可疑信息源列表请求;
终端向信息过滤服务器请求获取可疑信息源列表请求,其中携带终端可疑度黑名单列表的时间戳。
步骤302、信息过滤服务器比较时间戳;
信息过滤服务器将所述可疑度黑名单列表时间戳与所述可疑信息源列表时间戳进行比较,若所述可疑度黑名单列表时间戳与所述可疑信息源列表时间戳不一致,执行步骤303,若所述可疑度黑名单列表时间戳与所述可疑信息源列表时间戳一致,信息过滤服务器不向终端发送可疑信息源列表。
步骤303、接收获取可疑信息源列表请求。
信息过滤服务器接受终端获取可疑信息源列表的请求。终端获取可疑信息源列表后,依据可疑信息源列表更新可疑度黑名单列表,同时更新可疑度黑名单列表的时间戳。
以上描述本发明实施例提供的信息过滤的方法,如下提供本发明实施例提供的应用上述方法的系统、终端及信息过滤服务器实施例。
另外,本发明实施例提供信息过滤服务器侧实施的信息过滤方法实施例。
请参阅图4是本发明实施例提供的信息过滤服务器形成可疑信息源列表流程图。
步骤401、接收举报的垃圾信息源;
信息过滤服务器接收终端举报的垃圾信息源。
步骤402、分析得出所述垃圾信息源的可疑度;
信息过滤服务器根据终端的举报,定期分析处理终端举报的垃圾信息源,更新可疑信息源列表。
信息过滤服务器接收终端举报的信息源,同时统计举报该信息源的终端用户数目M,重复举报该信息源的终端用户数目N;若该信息源发送的信息是文本信息,信息过滤服务器同时进行关键词的匹配,确定管检测的匹配度P分析该信息源发送的文本信息进一步确定该信息源是否是垃圾信息源,具体解释如下:P:是利用文本搜索技术中的关键字匹配技术计算出来的关键字匹配度。是利用匹配和被匹配文本分解出来的关键字信息,进行比较。根据对应关键字的匹配程度反映两段文本之间的相识程度,并借此反映他们间语义上的相识程度。本发明约定P为一个0~1之间的数字。P若为1表示两段文本完全一样,P若为0表示两段文本完全不相关。关键字匹配度的实现原理大致分为两部分:语义拆词:将一段文本拆分出若干个字段,并抽取核心作为匹配关键字;关键字匹配:将拆分出来的关键字进行匹配。根据关键字的顺序和匹配数量来判断两段文本的匹配度。若一个信息源被上报多篇不同文本,则该信息源的P为上报多篇不同文本的加权平均值。
最终确定可疑度H=(rM+tN+sP)/Q,其中M+N为垃圾信息服务器收到的关于一个信息源的总的举报数,r、t、s是计算权值比例,r>t>s由信息过滤服务器调整设定,Q是恒定比例。
上述公式中参数说明如下:
r、t、s为权值,反映了对黑名单的各个判断因素的贡献度。r表示不同信息源的举报数量的贡献率,t表示这些信息源的重复次数贡献率。例如,同一个人对一个信息源举报过两次,那么在这个信息源的判断中,虽然举报总次数是2次,但实际只有一个人举报(M=1),大众化程度并不高,而重复举报的那一次(N=1)说明:单个人对这个信息源判断是比较肯定的。因此通常来说,r部分的贡献率是比t高,默认约定为r∶t=3∶1,通常情况下,r默认取1,t一般为0.33。
s代表黑名单的判断的扩散程度。例如一个黑名单源,只有5个人反馈了这是一个垃圾信息。但是这个文本信息和黑名单知识库里面的语义匹配度很高。因此,即时只有5个人反馈这是垃圾信息,但这5个人就很有代表信息,更能代表大众说明这就是垃圾信息。因此S值为长期举报垃圾信息源终端数目M的平均值。
Q为缩放比例,是保留的数值缩放比例,一般为1。
步骤403、更新可疑信息源列表;
将用户举报的信息源与分析得到的该信息源的可疑度对应,更新到可疑信息源列表中;信息过滤服务器同时更新可疑信息列表的时间戳。该可疑信息源列表中包含垃圾信息源及该垃圾信息源的可疑度。
本发明实施例还提供一种信息过滤系统。
请参阅图5是本发明实施例提供获取可疑信息源列表的终端结构图。
终端包括:第一获取单元121,用于请求获取可疑信息源列表;
黑名单更新单元130,用于依据所述可疑信息源列表更新黑名单列表。
进一步的,所述终端还包括:第二获取单元122,用于获取可疑信息源列表时间戳;
所述黑名单更新单元130依据所述可疑信息源列表时间戳更新所述黑名单列表的时间戳。
进一步的,所述第二获取单元获取可疑信息源列表时间戳时,所述黑名单列表时间戳。
请参阅图6是本发明实施例提供的信息过滤的终端结构图。
终端包括:
信息接收单元110,用于接收信息比较单元140,用于将所述接收信息的信息源与黑名单列表比较;
过滤单元150,用于在所述信息源存在于所述黑名单列表中时,依据所述黑名单列表中所述信息源的可疑度对所述信息源发送的信息进行过滤。
具体的,所述过滤单元依据所述黑名单列表中所述信息源的可疑度对所述信息源发送的信息进行过滤具体为:显示所述信息源发送的信息、显示所述信息源发送的信息并显示所述信息是垃圾信息、存储所述信息源发送的信息或删除所述信息源发送的信息。
进一步的,所述终端还包括:第一举报单元161、用于依据所述过滤单元的具体过滤信息举报所述信息源;
进一步的,所述终端还包括,第二举报单元162,用于举报所述接收信息。
进一步的,所述终端还包括:显示单元170,用于依据所述过滤单元的具体过滤信息显示所述信息源发送的信息、显示所述信息源发送的信息并显示所述信息是垃圾信息。
请参阅图7是本发明实施例提供的信息过滤服务器结构图。
第一接收单元211,用于接收举报的垃圾信息源;
分析单元220,用于分析得出所述垃圾信息源的可疑度;
第一更新单元231,用于将所述垃圾信息源与所述垃圾信息源的可疑度对应更新到可疑信息源列表中。
进一步的所述信息过滤服务器还包括:第二更新单元232,用于更新所述可疑信息源列表的可疑信息源列表时间戳。
进一步的所述信息过滤服务器还包括:
发送单元260,用于发送所述可疑信息源列表,所述可疑信息源列表携带可疑信息源时间戳。
所述终端向信息过滤服务器发送获取可疑信息源列表请求时,所述信息过滤服务器进一步包括:请求接收单元240、比较单元250和发送单元260;
请求接收单元240,用于接收终端发送获取可疑信息源列表请求,所述获取可疑信息源列表请求携带黑名单列表时间戳;
比较单元250,用于将所述黑名单列表时间戳与所述可疑信息源列表时间戳进行比较;
所述发送单元260,在所述比较单元比较所述黑名单列表时间戳与所述可疑信息源列表时间戳不一致时,发送所述可疑信息源列表,所述可疑信息源列表携带可疑信息源时间戳。
具体的,所述分析单元220包括:
举报用户统计单元,用于统计所述举报垃圾信息源的终端用户数目;
重复次数统计单元,用于统计所述举报垃圾信息源的终端用户的重复举报数目;
计算单元,用于依据所述举报垃圾信息源的终端用户数目和所述举报垃圾信息源的终端用户的重复举报数目计算所述垃圾信息源的可疑度。
进一步的,具体的,所述信息过滤服务器还包括:第二接收单元212,用于接收举报的垃圾信息
所述分析单元220,进一步分析所述垃圾信息。
所述分析单元还包括:匹配单元,用于分析得出所述垃圾信息与预置广告词的匹配度;
所述计算单元的计算进一步依据所述匹配度。
信息过滤系统包括:能与终端通信的信息过滤服务器;
终端:用于向所述信息过滤服务器举报垃圾信息源;
所述信息过滤服务器:用于分析得出所述垃圾信息源的可疑度,将所述垃圾信息源与所述垃圾信息源的可疑度对应更新到可疑信息源列表中;
所述终端,依据所述更新的可疑信息源列表更新黑名单列表。
以上对本发明所提供的信息过滤服务器、方法、系统及终端进行了详细介绍,对于本领域的一般技术人员,依据本发明实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (13)

1.一种信息过滤服务器,其特征在于,包括:
第一接收单元,用于接收举报的垃圾信息源;
分析单元,用于分析得出所述垃圾信息源的可疑度,可疑度H=(rM+tN+sP)/Q,其中,M是举报垃圾信息源的终端用户数目,N是重复举报垃圾信息源的终端用户数目,P是利用文本搜索技术中的关键字匹配技术计算出来的关键字匹配度,r、t、s是计算权值比例,r>t>s,Q为缩放比例;
第一更新单元,用于将所述垃圾信息源与所述垃圾信息源的可疑度对应更新到可疑信息源列表中。
2.根据权利要求1所述的信息过滤服务器,其特征在于,所述信息过滤服务器还包括:
第二更新单元,用于更新所述可疑信息源列表的可疑信息源列表时间戳。
3.根据权利要求2所述的信息过滤服务器,其特征在于,所述信息过滤服务器还包括:
发送单元,用于发送所述可疑信息源列表,所述可疑信息源列表携带可疑信息源时间戳。
4.根据权利要求2所述的信息过滤服务器,其特征在于,所述信息过滤服务器进一步包括:请求接收单元、比较单元和发送单元;
请求接收单元,用于接收终端发送获取可疑信息源列表请求,所述获取可疑信息源列表请求携带黑名单列表时间戳;
比较单元,用于将所述黑名单列表时间戳与所述可疑信息源列表时间戳进行比较;
所述发送单元,在所述比较单元比较所述黑名单列表时间戳与所述可疑信息源列表时间戳不一致时,发送所述可疑信息源列表,所述可疑信息源列表携带可疑信息源时间戳。
5.一种终端,其特征在于,包括:
第一获取单元,用于从信息过滤服务器获取可疑信息源列表,所述可疑信息源列表包括信息源以及与信息源对应的可疑度,其中,所述可疑度由所述信息过滤服务器分析得出,可疑度H=(rM+tN+sP)/Q,其中,M是举报垃圾信息源的终端用户数目,N是重复举报垃圾信息源的终端用户数目,P是利用文本搜索技术中的关键字匹配技术计算出来的关键字匹配度,r、t、s是计算权值比例,r>t>s,Q为缩放比例;
黑名单更新单元,用于依据所述可疑信息源列表更新黑名单列表,所述黑名单列表包括信息源以及与信息源对应的可疑度。
6.根据权利要求5所述的终端,其特征在于,所述终端还包括:第二获取单元,用于获取可疑信息源列表时间戳;
所述黑名单更新单元还用于依据所述可疑信息源列表时间戳更新所述黑名单列表的时间戳。
7.根据权利要求6所述的终端,其特征在于,所述第二获取单元获取可疑信息源列表时间戳时,携带所述黑名单列表的时间戳。
8.一种信息过滤的方法,其特征在于,包括:
接收举报的垃圾信息源;
分析得出所述垃圾信息源的可疑度,可疑度H=(rM+tN+sP)/Q,其中,M是举报垃圾信息源的终端用户数目,N是重复举报垃圾信息源的终端用户数目,P是利用文本搜索技术中的关键字匹配技术计算出来的关键字匹配度,r、t、s是计算权值比例,r>t>s,Q为缩放比例;
将所述垃圾信息源与所述垃圾信息源的可疑度对应更新到可疑信息源列表中。
9.根据权利要求8所述的信息过滤的方法,其特征在于,所述将垃圾信息源与所述垃圾信息源的可疑度对应更新到可疑信息源列表中时,更新所述可疑信息源列表时间戳。
10.根据权利要求9所述的信息过滤的方法,其特征在于,所述将所述垃圾信息源与所述垃圾信息源的可疑度对应更新到可疑信息源列表中后,发送所述可疑信息源列表,所述可疑信息源列表携带所述可疑信息源列表时间戳。
11.根据权利要求9所述的信息过滤的方法,其特征在于,接收获取可疑信息源列表请求,所述请求携带黑名单列表时间戳;
将所述黑名单列表时间戳与所述可疑信息源列表时间戳比较,若所述黑名单列表时间戳与所述可疑信息源列表时间戳不一致,接受所述获取可疑信息源列表的请求;
发送所述可疑信息源列表,所述可疑信息源列表携带所述可疑信息源列表时间戳。
12.根据权利要求8至11任一项所述的信息过滤的方法,其特征在于,进一步接收举报的垃圾信息;
进一步分析所述举报的垃圾信息。
13.一种信息过滤的系统,其特征在于,包括:能与终端通信的信息过滤服务器;
终端,用于向所述信息过滤服务器举报垃圾信息源;
所述信息过滤服务器:用于接收所述终端举报的垃圾信息源,分析得出所述垃圾信息源的可疑度,可疑度H=(rM+tN+sP)/Q,其中,M是举报垃圾信息源的终端用户数目,N是重复举报垃圾信息源的终端用户数目,P是利用文本搜索技术中的关键字匹配技术计算出来的关键字匹配度,r、t、s是计算权值比例,r>t>s,Q为缩放比例,将所述垃圾信息源与所述垃圾信息源的可疑度对应更新到可疑信息源列表中;
所述终端,依据所述更新的可疑信息源列表更新黑名单列表,所述黑名单列表包括信息源以及与信息源对应的可疑度。
CN200810129109A 2008-06-23 2008-06-23 信息过滤服务器、方法、系统及终端 Expired - Fee Related CN101309280B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200810129109A CN101309280B (zh) 2008-06-23 2008-06-23 信息过滤服务器、方法、系统及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200810129109A CN101309280B (zh) 2008-06-23 2008-06-23 信息过滤服务器、方法、系统及终端

Publications (2)

Publication Number Publication Date
CN101309280A CN101309280A (zh) 2008-11-19
CN101309280B true CN101309280B (zh) 2012-10-03

Family

ID=40125499

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200810129109A Expired - Fee Related CN101309280B (zh) 2008-06-23 2008-06-23 信息过滤服务器、方法、系统及终端

Country Status (1)

Country Link
CN (1) CN101309280B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102045706A (zh) * 2009-10-16 2011-05-04 华为技术有限公司 一种垃圾信息处理方法、系统及装置
CN101951673A (zh) * 2010-09-10 2011-01-19 威盛电子股份有限公司 移动装置及其搜寻网络数据的方法
CN102480705B (zh) * 2010-11-26 2015-11-25 卓望数码技术(深圳)有限公司 一种根据号码关系图过滤垃圾短信的方法及系统
CN102752732A (zh) * 2012-07-09 2012-10-24 江南大学 一种基于云架构的垃圾短信拒收方法
CN103729384B (zh) * 2012-10-16 2017-02-22 中国移动通信集团公司 信息过滤方法、系统与装置
CN104462062B (zh) * 2014-12-11 2018-02-13 珠海金山网络游戏科技有限公司 一种文本反垃圾的方法
CN106921556A (zh) * 2015-12-24 2017-07-04 北京奇虎科技有限公司 一种聊天信息的处理方法和服务器
CN105611513A (zh) * 2016-02-29 2016-05-25 宇龙计算机通信科技(深圳)有限公司 一种移动终端短信显示方法及系统
CN106446032A (zh) * 2016-08-30 2017-02-22 江苏博智软件科技有限公司 一种垃圾信息的处理方法和装置
CN109840316A (zh) * 2018-12-21 2019-06-04 上海诺悦智能科技有限公司 一种客户信息制裁名单匹配系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1725874A (zh) * 2004-07-23 2006-01-25 华为技术有限公司 一种实现短消息业务的方法
CN1913659A (zh) * 2006-07-31 2007-02-14 华为技术有限公司 一种优化的短消息过滤方法
CN1937671A (zh) * 2006-09-25 2007-03-28 华为技术有限公司 阻止垃圾电话的方法、系统、终端和服务器端

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1725874A (zh) * 2004-07-23 2006-01-25 华为技术有限公司 一种实现短消息业务的方法
CN1913659A (zh) * 2006-07-31 2007-02-14 华为技术有限公司 一种优化的短消息过滤方法
CN1937671A (zh) * 2006-09-25 2007-03-28 华为技术有限公司 阻止垃圾电话的方法、系统、终端和服务器端

Also Published As

Publication number Publication date
CN101309280A (zh) 2008-11-19

Similar Documents

Publication Publication Date Title
CN101309280B (zh) 信息过滤服务器、方法、系统及终端
US20010037385A1 (en) Apparatus and method for blocking a link to an unwholesome site in internet
CN101827346B (zh) 一种计费系统自动测试方法及装置
CN102404239B (zh) 一种用于在微博中提供广播消息的方法和系统
CN101784022A (zh) 短信过滤、分类方法及系统
CN104301896A (zh) 诈骗短信智能监控告警系统和方法
CN106789598B (zh) 基于社交关系链的公众号消息推送方法、装置及系统
CN109767081B (zh) 电力工单表生成方法及装置
CN101860822A (zh) 垃圾短信监控方法和系统
CN103763124A (zh) 一种互联网用户行为分析预警系统及方法
CN101335968B (zh) 一种垃圾短消息监控后续处理的方法及系统
CN101635886A (zh) 一种基于用户选择的垃圾短信过滤方法
CN102497435B (zh) 数据业务数据的分发方法及装置
CN102323940A (zh) 基于数据库的配置台实现方法、配置台及系统
CN105101124A (zh) 标注短信类别的方法及装置
CN101106784B (zh) 信息排序及建立初始网络通讯录的方法、系统和装置
CN105589845A (zh) 垃圾文本识别方法、装置及系统
CN110807085A (zh) 故障信息的查询方法及装置、存储介质、电子装置
CN109714393A (zh) 一种应用程序推荐的方法及装置
CN110442590A (zh) 一种用于提供检验检测服务的系统和方法
CN105138579A (zh) 获取关键词和基于该关键词进行信息推荐的方法及装置
CN102572806A (zh) 基于Msky平台的移动终端适配系统及其方法
CN101008946A (zh) 中文移动通信信息搜索方法及装置
CN101854298A (zh) 报文的自动链接方法、账务修正方法及系统
CN112766904A (zh) 政务审批辅助管理方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: NANTONG TONGZHOU XINZHIHAO INDUSTRIAL CO., LTD.

Free format text: FORMER OWNER: BEIJING ZHONGCAI WYSE EDUCATION TECHNOLOGY CO., LTD.

Effective date: 20141204

Owner name: BEIJING ZHONGCAI WYSE EDUCATION TECHNOLOGY CO., LT

Free format text: FORMER OWNER: HUAWEI TECHNOLOGY CO., LTD.

Effective date: 20141204

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 100083 HAIDIAN, BEIJING TO: 226314 NANTONG, JIANGSU PROVINCE

Free format text: CORRECT: ADDRESS; FROM: 518129 SHENZHEN, GUANGDONG PROVINCE TO: 100083 HAIDIAN, BEIJING

TR01 Transfer of patent right

Effective date of registration: 20141204

Address after: 226314 Jiangsu city of Nantong province Tongzhou District Chuan Jiang Zhen Zhi Hao Market

Patentee after: Tongzhou District Nantong Xin Hao Industrial Co.,Ltd.

Address before: 100083 Beijing Haidian District Zhongguancun Road No. 18 smartfortune International Building B706

Patentee before: Beijing Zhongcai Wyse Education Technology Co.,Ltd.

Effective date of registration: 20141204

Address after: 100083 Beijing Haidian District Zhongguancun Road No. 18 smartfortune International Building B706

Patentee after: Beijing Zhongcai Wyse Education Technology Co.,Ltd.

Address before: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen

Patentee before: HUAWEI TECHNOLOGIES Co.,Ltd.

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20121003

Termination date: 20170623

CF01 Termination of patent right due to non-payment of annual fee