CN103415004B - 一种检测垃圾短消息的方法及装置 - Google Patents

一种检测垃圾短消息的方法及装置 Download PDF

Info

Publication number
CN103415004B
CN103415004B CN201310319875.3A CN201310319875A CN103415004B CN 103415004 B CN103415004 B CN 103415004B CN 201310319875 A CN201310319875 A CN 201310319875A CN 103415004 B CN103415004 B CN 103415004B
Authority
CN
China
Prior art keywords
short message
contact details
spam
contact
junk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310319875.3A
Other languages
English (en)
Other versions
CN103415004A (zh
Inventor
张尼
张云勇
孙志光
刘镝
李正
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China United Network Communications Group Co Ltd
Original Assignee
China United Network Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China United Network Communications Group Co Ltd filed Critical China United Network Communications Group Co Ltd
Priority to CN201310319875.3A priority Critical patent/CN103415004B/zh
Publication of CN103415004A publication Critical patent/CN103415004A/zh
Application granted granted Critical
Publication of CN103415004B publication Critical patent/CN103415004B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W12/00Security arrangements; Authentication; Protecting privacy or anonymity
    • H04W12/40Security arrangements using identity modules
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W12/00Security arrangements; Authentication; Protecting privacy or anonymity
    • H04W12/12Detection or prevention of fraud
    • H04W12/126Anti-theft arrangements, e.g. protection against subscriber identity module [SIM] cloning

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种检测垃圾短消息的方法及装置,包括识别出短消息中包含的联系信息,根据短消息中的联系信息检查当前短消息是否具有垃圾特征;提取具有垃圾特征的垃圾短消息对应的主叫号码,并将该主叫号码加入垃圾短信列表。本发明提供的方案中,基于大量数据统计和分析得知,短消息中的联系信息对于正常短消息和垃圾短消息是存在本质区别的,而本发明正是利用短消息中的联系信息对短消息的垃圾特征进行准确的判断,提高了对垃圾短消息的识别准确率,从而更好地避免了用户和运营商的利益受到损害。

Description

一种检测垃圾短消息的方法及装置
技术领域
本发明涉及短消息处理技术,尤指一种检测垃圾短消息的方法及装置。
背景技术
短消息业务是移动通信领域的一个成功典范,它诞生时间不长却给人们的工作和生活的诸方面带来了深刻的变化。简单、易用、廉价、开放的设计理念,使短消息成为当今最重要的通信方式之一。据信息产业部统计显示,到2013年第一季度,全国手机用户数接近11亿户,而手机短消息发送量已达到上亿条。
短消息业务在给人们提供便捷通信手段的同时,也导致了手机间的垃圾信息泛滥成灾,比如各种色情暴力、政治谣言、反动言论、诈骗信息和非法广告大肆传播等,可见,垃圾短消息越来越成为影响社会稳定、危害公共安全的重要因素。垃圾短消息是指对接收者没有价值,不请自来的短消息。根据中国互联网协会发布的调查结果显示,我国手机用户平均每周收到8.29条垃圾短消息。因此,开发大规模的垃圾短消息过滤系统对保障手机用户、运营商的利益,促进移动通信行业和整个社会的和谐发展具有重大意义。
目前,垃圾短消息按照其发送的方式可以分为两种模式,一种模式是利用移动运营商的短消息网关进行发送,用户收到短消息时,其显示的发送号码为短消息的接入号,而不是普通用户的手机号码。通过这种模式发送的垃圾短消息具有速度快,操作简单,需要运营商许可等特点,短消息类型以商品广告、服务类居多。
另一种模式是点对点发送。使用者或是购买大量无需注册的手机卡(如动感地带、神州行等)来进行透支,或是通过优惠套餐利用群发工具大量发送短消息。通常不法分子能在很短的时间内群发上万条的短消息,因此运营商往往来不及计费就被恶意透支话费。用户在收到短消息时,其显示的发送号码为普通的手机号码。通过这种模式,发送的垃圾短消息具有号码多,速度快,不需运营商许可等特点,短消息类型以诈骗、谣言、色情信息为主,具有较大的危害性。
现有短消息过滤技术大致包括内容过滤技术、短信流量统计技术,以及话单分析机制。其中,
比较常用的过滤技术是内容过滤技术,比如基于规则的过滤方法,即通过预先设置一些过滤规则,如中奖、发财等,只要收到符合这些过滤规则的短消息,就认为是垃圾短信。采用基于规则的过滤技术,优点在于其原理和实现方式都较为简单,应用成本较低。但是其不足之处在于:首先,过滤规则都是人工指定的,需要人们不断去发现、总结和更新,付出较大的人工维护开销;再者,过滤规则选取难度大,仅通过关键字匹配很难判断出短信内容的合法性,因此很容易造成误判;最后,垃圾短消息发送者很容易通过使用拼音或同音字等方法即“变种”垃圾短息绕过过滤规则。
除此之外,人们还采用了散列技术、贝叶斯算法、支持向量机方法等。这些方法可以学习词的频率和模式,这样可以同垃圾短消息和正常短消息关联起来进行判断。这些又是一种相对于关键字来说,更复杂和更智能化的内容过滤技术,但其对垃圾短消息的识别效率低如速度慢较为明显,而且需要用户不断更新过滤规则库或训练集,随着垃圾短消息制造者的技术水平不断提高,这种方法很容易失效即降低了对垃圾短消息的识别准确率等。
可见,内容过滤技术需要付出较大的维护开销,需要用户不断更新过滤规则库或训练集,垃圾短信监测、分析的工作量大;而如果关键字更新不及时,未能及时拦截“变种”垃圾短信,将会导致不能发现新型垃圾短消息特征,很难识别垃圾短消息的局部变异。
另一种过滤技术是短信流量统计技术,即对某一个手机或某一个SP单位时间发送或接收的短信流量进行统计,一旦发现该统计值超过某一个预先设置的阈值就认为该短消息为垃圾短消息。如果检测到大量发送垃圾短信的个人或者服务商,立即对其进行监管和过滤。为了检测单位时间用户发送短信的数目,需要为每个用户配置一个计数器,每发送一条短信计数器自动加一,这样,如果发送短信条数达到规定数目,则由计数器自动报警。也可以用过检测两条短信发送的间隔时间,即对短信的发送频率进行监控,当两条短信间隔过短,即表示该用户发送短信频繁,则自动报警。但是,关键字与发送频次结合的监控和拦截机制模式单一、应变能力差,容易让犯罪分子找到过滤规律,“变种”垃圾短信也会从而频繁出现。另外,短消息流量统计存在风险,如果阀值设置过低,会容易造成误拦截,引起用户投诉,如果阀值设置过高,则又很难真正实现对垃圾短信的拦截。
还有一种过滤技术是话单分析机制,是将计费服务器上的原始话单文件作为统计数据源,统计各号码在一定时间段内的发送短消息的条数和发送的成功率,当均超过预先设置的域值则认为该号码为可疑用户,并提交给操作人员判定是否需要将该号码加入黑名单。话单分析机制的不足之处在于采用了离线处理方式,实时性较差,从短消息发送到话单采集存在时间差(大概超过15分钟),而不法分子可利用这个时间差,通过大量复制SIM卡的方式,发送数以万计的垃圾短消息。现有技术中,从短信中提取的手机号码、网址、账号信息,主要用于白名单比对(即比较这些信息是否为运营商、银行等特有号码),以及黑名单比对(即与预先建立的垃圾短信发送号码、网址等黑名单进行比较),以检测出垃圾短信。
从现有垃圾短消息的检测方法可以看出,要么对垃圾短消息的识别准确率低,要么实时性较差。这样,必然影响用户对业务提供商的满意度,同时,用户和运营商的利益也受到了损害。
发明内容
为了解决上述技术问题,本发明提供了一种检测垃圾短消息的方法及装置,能够提高对垃圾短消息的识别效率与识别准确率,更好地保护用户、运营商利益。
为了达到本发明目的,本发明提供了一种检测垃圾短消息的方法,其特征在于,包括:
识别出短消息中包含的联系信息;根据短消息中的联系信息检查当前短消息是否具有垃圾特征;
记录具有垃圾特征的垃圾短消息对应的信息。
该方法之前还包括:对所述短消息进行逐字节处理,记录短消息长度;在所述短消息长度不小于预先设置的门限值时,对当前短消息继续进行识别。
所述联系信息为手机号码或固定电话号码;所述检查当前短消息是否具有垃圾特征包括:
根据预先设置的联系信息表,通过比对得出短消息的主叫号码与联系信息中的号码不属于同一运营商,或者不属于同一归属地,则所述短消息具有垃圾特征,且将其标识为可疑垃圾短消息;或者,
所述联系信息为银行账号;所述检查当前短消息是否具有垃圾特征包括:
根据预先设置的联系信息表,通过比对得到短消息的主叫号码与联系信息中的银行账号不属于同一归属地,则所述短消息具有垃圾特征,且将其标识为可疑垃圾短消息;或者,
所述联系信息中包含手机号码或固定电话号码,以及银行账号;所述检查当前短消息是否具有垃圾特征包括:
根据预先设置的联系信息表,如果所述短消息的主叫号码与联系信息中的号码不属于同一运营商,或者不属于同一归属地,而且短消息的主叫号码与联系信息中的银行账号不属于同一归属地,则所述短消息具有垃圾特征,且将其标识为垃圾短消息。
该方法还包括:确定出所述短消息中包含有联系主体信息;
所述检查当前短消息是否具有垃圾特征还包括:
比对所述短消息中的联系主体信息与预先设置的联系主体表,如果联系主体所在的短消息中的联系信息与联系主体表中预先设置的与该联系主体对应的联系信息不一致,则所述短消息具有垃圾特征,且将其标识为垃圾短消息;
如果所述联系信息或联系主体信息采用变形手段;所述检查当前短消息是否具有垃圾特征还包括:所述短消息具有垃圾特征,且将其标识为垃圾短消息。
该方法还包括:结合预先设置的黑名单库和白名单库,对所述短消息中的联系信息进行进一步检测。
本发明还公开一种检测垃圾短消息的装置,包括识别模块、检测模块,以及处理模块,其中,
识别模块,用于识别出短消息中包含的联系信息,并输出给检测模块;
检测模块,用于根据识别出的联系信息检查当前短消息是否具有垃圾特征,并将垃圾特征信息输出给处理模块;
处理模块,用于根据垃圾特征信息,记录具有垃圾特征的垃圾短消息对应的信息;
所述识别模块,还用于对短消息的逐字节处理,记录短消息长度,在短消息长度不小于预先设置的门限值时,对当前短消息继续进行识别。
所述检测模块具体用于:
当接收到的联系信息为手机号码或固定电话号码时,根据预先设置的联系信息表,通过比对检查出短消息的主叫号码与联系信息中的号码不属于同一运营商,或者不属于同一归属地,则垃圾特征信息包括该条短消息具有垃圾特征且标识为可疑垃圾短消息;或者,
当接收到的联系信息为银行账号时,根据预先设置的联系信息表,通过比对检查出短消息的主叫号码与联系信息中的银行账号不属于同一归属地,则垃圾特征信息包括该条短消息具有垃圾特征且标识为可疑垃圾短消息;或者,
当接收到的联系信息中既包含手机号码或固定电话号码,也包含银行账号时,如果检查出短消息的主叫号码与联系信息中的号码不属于同一运营商,或者不属于同一归属地,而且短消息的主叫号码与联系信息中的银行账号不属于同一归属地,则垃圾特征信息包括该条短消息具有垃圾特征且标识为垃圾短消息。
所述识别模块,还用于识别出短消息中包含有联系主体信息,并输出给检测模块;所述检测模块,还用于比对接收到的联系主体信息与预先设置的联系主体表,如果联系主体所在的短消息中的联系信息与联系主体表中预先设置的与该联系主体对应的联系信息不一致,则所述垃圾特征信息包括该条短消息具有垃圾特征且标识为垃圾短消息;和/或,
所述识别模块,还用于识别出联系信息或联系主体信息采用变形手段,并输出给检测模块。检测模块,还用于将所述垃圾特征信息包括该条短消息具有垃圾特征且标识为垃圾短消息
所述检测模块,还用于结合黑名单库和白名单库,对所述短消息中的联系信息进行检查。
与现有技术相比,本发明包括识别出短消息中包含的联系信息,根据短消息中的联系信息检查当前短消息是否具有垃圾特征;提取具有垃圾特征的垃圾短消息对应的主叫号码,并将该主叫号码加入垃圾短信列表。本发明提供的方案中,从发明人的大量数据统计和分析得知,短消息中的联系信息对于正常短消息和垃圾短消息是存在本质区别的,而本发明正是利用短消息中的联系信息对短消息的垃圾特征进行准确的判断,提高了对垃圾短消息的识别准确率,从而更好地避免了用户和运营商的利益受到损害。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
图1为本发明检测垃圾短消息的方法的流程图;
图2为本发明检测垃圾短消息的装置的组成结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
发明人通过对大量垃圾短消息的分析统计得到,垃圾短消息中占比最大的为欺诈类短信。欺诈类短信一般具有如下特点:其发送者不断变换策略如使用同音字、替代符、加入随机字符、特别设计的字符来对抗现有过滤规则,大多数的垃圾短消息中均含有联系信息,如固定电话号码、手机号码、网址、QQ号码、银行卡账号等,联系信息用于诱使接收者与犯罪分子联系,以便犯罪分子利用欺骗手段从用户处获取经济利益。而且,根据统计可知,垃圾短消息的发送号码通常与联系信息中的电话号码或手机号码属于不同的地理区域(利用各省过滤策略的差异,跨省发送垃圾短消息);联系信息或短消息的其他内容常使用替换、逃避等手段;垃圾短消息中常出现公众机构,如社保部门、热门节目如“非常六加一”抽奖等。
正常短消息的发送是以正常社会交往为目的,用户正常的短消息中也会出现联系信息,如更换手机号码时,短消息中会包含有更换后的手机号码;通过短消息告知自己或他人的联系方式时,也会在短消息中携带有电话号码等;在正常交易汇款时,会在短消息中包含账号等。但是,正常短消息中不会出现特殊的字符等变形手段,而且,短消息的发送号码与短消息中的联系号码存在关联性,比如发送短消息的发送号码,与短消息中的联系信息中显示的更改后的手机号通常是属于同一个地区等。
从上述数据统计和分析可见,含有联系信息的正常短消息和垃圾短消息是存在本质区别的,而本发明正是利用这些联系信息的区别,对垃圾短消息进行检测,以高效、准确地识别垃圾短消息或可疑短消息。
图1为本发明检测垃圾短消息的方法的流程图,如图1所示,包括:
步骤100:识别出短消息中包含的联系信息。
本步骤中,对短消息进行逐字节处理,识别出短消息中包含的联系信息,如电话号码、手机号码、网址、QQ号码、银行卡账号等。如果短消息中未包含联系信息,则不对当前短消息进行检测,返回继续对下一条短消息进行检测。其中,逐字节处理的方法属于本领域技术人员的惯用技术手段,其具体实现并不用于限定本发明的保护范围,这里不再赘述。
进一步地,本步骤之前还包括对短消息的逐字节处理,记录短消息长度,并且,如果短消息长度小于预先设置的门限值L(如50字节),则不对当前短消息进行检测,对下一条短消息进行检测;否则,继续执行本步骤中的识别短消息中的联系信息。
进一步地,本步骤还包括:确定短消息中是否有联系主体信息,如个人如张经理、公司机构名如中国联通、热门节目如中国好声音等。
进一步识别联系信息或联系主体信息是否采用变形手段,如采用小写字母l或字母i替换数字1等,是否加入特殊字符、是否网址全部大写等。
本步骤中的具体识别方法属于本领域技术人员的惯用技术手段,并且其具体实现不用于限定本发明的保护范围,这里不再赘述。
步骤101:根据短消息中的联系信息检查当前短消息是否具有垃圾特征。
本发明方法之前还包括:预先设置联系信息表,用于存储国内运营商分配的手机号码段、固定电话号码段、银行卡账号段及其所对应的地理位置信息,可以精确到城市;进一步地,预先设置联系主体表,用于存储常见机构、公司及其对应的电话号码,热点节目名称等。
本步骤具体包括:
当联系信息为手机号码或固定电话号码时,根据预先设置的联系信息表,比对短消息的主叫号码与联系信息中的号码是否属于同一运营商,或者是否属于同一归属地如省份或城市,如果不属于同一运营商,或者不属于同一归属地如省份或城市,则认为该条短消息具有垃圾特征,且将其标识为可疑垃圾短消息;或者,
当联系信息为银行账号时,根据预先设置的联系信息表,比对短消息的主叫号码与联系信息中的银行账号是否属于同一归属地如省份或城市,如果不属于同一归属地如省份或城市,则认为该条短消息具有垃圾特征,且将其标识为可疑垃圾短消息;或者,
当联系信息中既包含手机号码或固定电话号码,也包含银行账号时,如果短消息的主叫号码与联系信息中的号码不属于同一运营商,或者不属于同一归属地如省份或城市,而且短消息的主叫号码与联系信息中的银行账号不属于同一归属地如省份或城市,则认为该条短消息具有垃圾特征,且将其标识为垃圾短消息。
进一步地,在根据联系信息确认短消息为可疑垃圾短消息,或者短消息中有联系信息但根据联系信息确认短消息为正常短消息后,如果确定出短消息中包含有联系主体信息,如个人如张经理、公司机构名如中国联通、热门节目如中国好声音等,本步骤还包括:
比对短消息中的联系主体信息与预先设置的联系主体表,如果联系主体为公司机构,而该联系主体信息所在的短消息中的联系信息与联系主体表中预先设置的与该公司机构对应的联系信息(如官方电话号码)不一致,则认为该条短消息具有垃圾特征,且将其标识为垃圾短消息;否则认为该条短消息不具有垃圾特征。
进一步地,在根据联系信息确认短消息为可疑垃圾短消息,或者短消息中有联系信息但根据联系信息确认短消息为正常短消息后,当识别出联系信息或联系主体信息采用变形手段时,本步骤还包括:如果联系信息存在变形手段,比如包括网址大写、加入特殊符号,号码形似字替换等,则认为该条短消息具有垃圾特征,且将其标识为垃圾短消息。
进一步地,本步骤也可以结合黑名单库和白名单库,对短消息中的联系信息做进一步判断,比如,虽然短消息的主叫号码与联系信息中号码属于同一运营商,或者属于同一归属地如省份或城市,但是该号码在黑名单库中,那么,认为该条短消息具有垃圾特征,且将其标识为垃圾短消息。再如,虽然短消息的主叫号码与联系信息中的银行账号属于同一归属地如城市,但是该银行账号在黑名单库中,那么,认为该条短消息具有垃圾特征,且将其标识为垃圾短消息。其中,黑名单库用于存储已知的恶意联系信息,包括恶意手机号码、电话号码、网址、银行账号等;白名单库用于存储直接放行的联系信息,包括手机号码、电话号码、网址。需要说明的是,这里只是举例说明,并不用于限定本发明中根据短消息中的联系信息检查当前短消息是否具有垃圾特征的方法,与现有垃圾短消息检测方法的结合使用方式。
本步骤中,如果确定短消息不具有垃圾特征,则可认为该短消息是正常短消息,继续对下一条短消息进行检测处理。
步骤102:记录具有垃圾特征的垃圾短消息对应的信息。
对于垃圾特征为可疑的垃圾短消息,记录该短消息对应的主叫号码,比如存储到预先指定的空间,以便后续管理人员离线验证联系信息及短消息内容,在被证实确实为垃圾短消息时,将该短消息的相应信息如主叫号码、联系信息等填入垃圾短信列表如黑名单库中。对于垃圾特征为垃圾短消息,将该短消息对应的主叫号码,以及联系信息等直接填入垃圾短信列表如黑名单库或采用人工核查方式进行处理等,具体实现方式很多,是本领域技术人员的惯用技术手段,并不用于限定本发明的保护范围。通过本发明对可疑短消息的处理,实现了对短消息的垃圾特征进一步的准确判断,提高了对垃圾短消息的识别准确率。
本发明方法还包括:定期更新黑名单库中的信息如号码、网址、账号信息等,去掉已经作废(如号码已销号等)的信息;定期更新联系主体表,比如管理人员结合近期舆论和实际情况,去掉或者替换相应规则,比如去掉过期的热点节目“非常六加一”等。
本发明中,从发明人的大量数据统计和分析得知,短消息中的联系信息对于正常短消息和垃圾短消息是存在本质区别的,而本发明正是利用短消息中的联系信息对短消息的垃圾特征进行准确的判断,提高了对垃圾短消息的识别准确率,从而更好地避免了用户和运营商的利益受到损害。
本发明还提供一种检测垃圾短消息的装置,本发明装置可以部署在用户终端上,也可以部署在运营商垃圾短信过滤网关中,如图2所示,包括识别模块、检测模块,以及处理模块,其中,
识别模块,用于识别出短消息中包含的联系信息,并输出给检测模块。
检测模块,用于根据识别出的联系信息检查当前短消息是否具有垃圾特征,并将垃圾特征信息输出给处理模块。
处理模块,用于根据垃圾特征信息,记录具有垃圾特征的垃圾短消息对应的信息。
其中,识别模块,还用于对短消息的逐字节处理,记录短消息长度,在短消息长度小于预先设置的门限值时,不对当前短消息进行检测,对下一条短消息进行检测;否则,对当前短消息继续进行识别。
识别模块,还用于识别出短消息中包含有联系主体信息,并输出给检测模块。
识别模块,还用于识别出联系信息或联系主体信息采用变形手段,并输出给检测模块。
检测模块,具体用于当接收到的联系信息为手机号码或固定电话号码时,根据预先设置的联系信息表,通过比对检查出短消息的主叫号码与联系信息中的号码不属于同一运营商,或者不属于同一归属地如省份或城市,则垃圾特征信息包括该条短消息具有垃圾特征且标识为可疑垃圾短消息;或者,
当接收到的联系信息为银行账号时,根据预先设置的联系信息表,通过比对检查出短消息的主叫号码与联系信息中的银行账号不属于同一归属地如省份或城市,则垃圾特征信息包括该条短消息具有垃圾特征且标识为可疑垃圾短消息;或者,
当接收到的联系信息中既包含手机号码或固定电话号码,也包含银行账号时,如果检查出短消息的主叫号码与联系信息中的号码不属于同一运营商,或者不属于同一归属地如省份或城市,而且短消息的主叫号码与联系信息中的银行账号不属于同一归属地如省份或城市,则垃圾特征信息包括该条短消息具有垃圾特征且标识为垃圾短消息。
检测模块,还用于比对接收到的联系主体信息与预先设置的联系主体表,如果联系主体为公司机构,而该联系主体信息所在的短消息中的联系信息与联系主体表中预先设置的与该公司机构对应的联系信息(如官方电话号码)不一致,则垃圾特征信息包括该条短消息具有垃圾特征且标识为垃圾短消息。
检测模块,还用于如果检查出变性手段包括网址大写、和/或加入特殊符号,和/或号码形似字替换等,则垃圾特征信息包括该条短消息具有垃圾特征且标识为垃圾短消息。
检测模块,还用于结合黑名单库和白名单库,对短消息中的联系信息进行检查
处理模块,具体用于在接收到的垃圾特征信息显示为可疑的垃圾短消息时,记录该短消息的主叫号码;或者,
在接收到的垃圾特征信息显示为垃圾短消息,将该短消息对应的主叫号码直接填入垃圾短信列表如黑名单库或采用人工核查方式进行处理等。
处理模块,还用于定期更新黑名单库,或定期更新联系主体表。
虽然本发明所揭露的实施方式如上,但所述的内容仅为便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式及细节上进行任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。

Claims (7)

1.一种检测垃圾短消息的方法,其特征在于,包括:
识别出短消息中包含的联系信息;根据短消息中的联系信息检查当前短消息是否具有垃圾特征;
记录具有垃圾特征的垃圾短消息对应的信息;
所述联系信息为手机号码或固定电话号码;所述检查当前短消息是否具有垃圾特征包括:
根据预先设置的联系信息表,通过比对得出短消息的主叫号码与联系信息中的号码不属于同一运营商,或者不属于同一归属地,则所述短消息具有垃圾特征,且将其标识为可疑垃圾短消息;或者,
所述联系信息为银行账号;所述检查当前短消息是否具有垃圾特征包括:
根据预先设置的联系信息表,通过比对得到短消息的主叫号码与联系信息中的银行账号不属于同一归属地,则所述短消息具有垃圾特征,且将其标识为可疑垃圾短消息;或者,
所述联系信息中包含手机号码或固定电话号码,以及银行账号;所述检查当前短消息是否具有垃圾特征包括:
根据预先设置的联系信息表,如果所述短消息的主叫号码与联系信息中的号码不属于同一运营商,或者不属于同一归属地,而且短消息的主叫号码与联系信息中的银行账号不属于同一归属地,则所述短消息具有垃圾特征,且将其标识为垃圾短消息;
其中,所述联系信息表包括:联系信息及其所对应运营商、归属地。
2.根据权利要求1所述的方法,其特征在于,该方法之前还包括:对所述短消息进行逐字节处理,记录短消息长度;在所述短消息长度不小于预先设置的门限值时,对当前短消息继续进行识别。
3.根据权利要求1所述的方法,其特征在于,该方法还包括:确定出所述短消息中包含有联系主体信息;
所述检查当前短消息是否具有垃圾特征还包括:
比对所述短消息中的联系主体信息与预先设置的联系主体表,如果联系主体所在的短消息中的联系信息与联系主体表中预先设置的与该联系主体对应的联系信息不一致,则所述短消息具有垃圾特征,且将其标识为垃圾短消息;
其中,所述联系主体包括:个人、公司机构或热门节目,所述联系主体表包括:联系主体及其所对应的联系信息;
如果所述联系信息或联系主体信息采用变形手段;所述检查当前短消息是否具有垃圾特征还包括:所述短消息具有垃圾特征,且将其标识为垃圾短消息。
4.根据权利要求1或2所述的方法,其特征在于,该方法还包括:结合预先设置的黑名单库和白名单库,对所述短消息中的联系信息进行进一步检测。
5.一种检测垃圾短消息的装置,其特征在于,包括识别模块、检测模块,以及处理模块,其中,
识别模块,用于识别出短消息中包含的联系信息,并输出给检测模块;
检测模块,用于根据识别出的联系信息检查当前短消息是否具有垃圾特征,并将垃圾特征信息输出给处理模块;
处理模块,用于根据垃圾特征信息,记录具有垃圾特征的垃圾短消息对应的信息;
所述检测模块具体用于:
当接收到的联系信息为手机号码或固定电话号码时,根据预先设置的联系信息表,通过比对检查出短消息的主叫号码与联系信息中的号码不属于同一运营商,或者不属于同一归属地,则所述短消息具有垃圾特征且标识为可疑垃圾短消息;或者,
当接收到的联系信息为银行账号时,根据预先设置的联系信息表,通过比对检查出短消息的主叫号码与联系信息中的银行账号不属于同一归属地,则所述短消息具有垃圾特征且标识为可疑垃圾短消息;或者,
当接收到的联系信息中既包含手机号码或固定电话号码,也包含银行账号时,如果检查出短消息的主叫号码与联系信息中的号码不属于同一运营商,或者不属于同一归属地,而且短消息的主叫号码与联系信息中的银行账号不属于同一归属地,则所述短消息具有垃圾特征且标识为垃圾短消息;
其中,所述联系信息表包括:联系信息及其所对应运营商、归属地。
6.根据权利要求5所述的装置,其特征在于,所述识别模块,还用于对短消息的逐字节处理,记录短消息长度,在短消息长度不小于预先设置的门限值时,对当前短消息继续进行识别。
7.根据权利要求5或6所述的装置,其特征在于,所述检测模块,还用于结合黑名单库和白名单库,对所述短消息中的联系信息进行检查。
CN201310319875.3A 2013-07-26 2013-07-26 一种检测垃圾短消息的方法及装置 Active CN103415004B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310319875.3A CN103415004B (zh) 2013-07-26 2013-07-26 一种检测垃圾短消息的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310319875.3A CN103415004B (zh) 2013-07-26 2013-07-26 一种检测垃圾短消息的方法及装置

Publications (2)

Publication Number Publication Date
CN103415004A CN103415004A (zh) 2013-11-27
CN103415004B true CN103415004B (zh) 2016-09-21

Family

ID=49607979

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310319875.3A Active CN103415004B (zh) 2013-07-26 2013-07-26 一种检测垃圾短消息的方法及装置

Country Status (1)

Country Link
CN (1) CN103415004B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105898752A (zh) * 2014-05-05 2016-08-24 王正伟 消息过滤方法
CN104168548A (zh) * 2014-08-21 2014-11-26 北京奇虎科技有限公司 短信拦截方法及装置、云端服务器
CN106507319A (zh) * 2015-08-04 2017-03-15 北京壹人壹本信息科技有限公司 一种恶意短信息的识别方法及装置
CN105246058B (zh) * 2015-09-01 2019-08-06 中国联合网络通信集团有限公司 短信的验证方法和短信服务器
CN105335354A (zh) * 2015-12-09 2016-02-17 中国联合网络通信集团有限公司 欺诈信息识别方法和装置
CN106157214A (zh) * 2016-06-24 2016-11-23 北京奇虎科技有限公司 信息追踪的方法及装置
CN109145284A (zh) * 2017-06-19 2019-01-04 阿里巴巴集团控股有限公司 信息处理方法和装置
CN108391240B (zh) * 2018-05-23 2021-08-24 中国联合网络通信集团有限公司 垃圾彩信判断方法和装置
CN108769933B (zh) * 2018-05-31 2021-06-04 中国联合网络通信集团有限公司 彩信识别方法和彩信识别系统
CN109660961B (zh) * 2018-12-17 2021-03-30 珠海市小源科技有限公司 短信号码及其归属信息的匹配方法、装置及存储介质
CN111093199A (zh) * 2019-11-25 2020-05-01 维沃移动通信有限公司 信息提示方法、电子设备

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101031102B (zh) * 2007-03-20 2010-05-26 华为技术有限公司 一种短消息处理的系统、装置和方法
CN101335920B (zh) * 2008-07-15 2011-04-13 中国联合网络通信集团有限公司 基于主叫号码位置和发送内容的垃圾短消息识别系统及方法
CN102711112A (zh) * 2012-06-18 2012-10-03 奇智软件(北京)有限公司 短信拦截方法及装置
CN102801859B (zh) * 2012-08-03 2014-05-07 陈伟 垃圾短信的识别方法、装置和具有该装置的移动通信终端

Also Published As

Publication number Publication date
CN103415004A (zh) 2013-11-27

Similar Documents

Publication Publication Date Title
CN103415004B (zh) 一种检测垃圾短消息的方法及装置
CN110517097B (zh) 识别异常用户的方法、装置、设备及存储介质
CN107872772B (zh) 诈骗短信的检测方法及装置
CN104462509A (zh) 垃圾评论检测方法及装置
CN103763690A (zh) 检测伪基站向移动终端发送短信息的方法和装置
CN102368853B (zh) 通信事件处理方法及系统
CN105246058B (zh) 短信的验证方法和短信服务器
CN103458412A (zh) 防止电话诈骗的系统、方法及移动终端、云端分析服务器
CN104301896A (zh) 诈骗短信智能监控告警系统和方法
CN106453061A (zh) 一种识别网络诈骗行为的方法及系统
CN103440458B (zh) 一种启发式静态识别Android系统恶意代码的方法
CN105335354A (zh) 欺诈信息识别方法和装置
CN105589845B (zh) 垃圾文本识别方法、装置及系统
CN110839216B (zh) 识别通讯信息诈骗的方法和装置
CN104244206B (zh) 一种短信处理方法、装置及终端设备
CN104883671A (zh) 一种垃圾短信的判断方法及系统
CN108259680B (zh) 诈骗电话识别方法、装置以及用于识别诈骗电话的服务器
CN105792152A (zh) 伪基站短信识别方法和装置
CN101389074A (zh) 基于社交网络机理确认发送者身份的短信息监控方法
CN103369486A (zh) 诈骗短信防范系统与防范方法
Tang et al. Clues in tweets: Twitter-guided discovery and analysis of SMS spam
CN107948451A (zh) 一种反电信诈骗方法、装置、设备及存储介质
CN107426732A (zh) 信息识别方法及装置、终端及可读存储介质
CN104580725A (zh) 一种提示诈骗电话的方法及通信终端
CN105554763A (zh) 一种检测伪基站中心号码的方法及服务器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant