CN101389074A - 基于社交网络机理确认发送者身份的短信息监控方法 - Google Patents
基于社交网络机理确认发送者身份的短信息监控方法 Download PDFInfo
- Publication number
- CN101389074A CN101389074A CNA2008101217585A CN200810121758A CN101389074A CN 101389074 A CN101389074 A CN 101389074A CN A2008101217585 A CNA2008101217585 A CN A2008101217585A CN 200810121758 A CN200810121758 A CN 200810121758A CN 101389074 A CN101389074 A CN 101389074A
- Authority
- CN
- China
- Prior art keywords
- short message
- note
- recipient
- authentication
- message monitoring
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 77
- 230000007246 mechanism Effects 0.000 title claims abstract description 48
- 238000012544 monitoring process Methods 0.000 title claims abstract description 37
- 238000001914 filtration Methods 0.000 claims abstract description 73
- 238000004891 communication Methods 0.000 claims abstract description 53
- 238000005516 engineering process Methods 0.000 claims abstract description 14
- 230000005540 biological transmission Effects 0.000 claims description 19
- 230000004044 response Effects 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 4
- 238000002203 pretreatment Methods 0.000 claims description 3
- 230000000903 blocking effect Effects 0.000 abstract 1
- 238000012423 maintenance Methods 0.000 abstract 1
- 230000008569 process Effects 0.000 description 25
- 230000006870 function Effects 0.000 description 12
- 230000000694 effects Effects 0.000 description 7
- 229910001369 Brass Inorganic materials 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000003542 behavioural effect Effects 0.000 description 2
- 239000010951 brass Substances 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000007717 exclusion Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000000682 scanning probe acoustic microscopy Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Landscapes
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种基于社交网络机理确认发送者身份的短信息监控方法。短信只是应用无线通信技术进行社交的一种快捷方法,与维系人脉的面对面沟通、书信往来、语音通话和Email交流等并无本质上的不同。社交网络属复杂网络范畴中的无标度网络,聚类现象是社交网络的基本特征。本发明从社交网络的聚类现象切入,以短信发送者与接受者、以及接受者之间的通信历史记录为依据,实施短信预处理和二度实时过滤,确认发送者的身份,拦截垃圾短信。短信息监控中心运行在采用对称多处理SMP技术的硬件平台上。监控中心具有免维护、高拦截率、低误判率的特点,不仅适用于文本短信过滤,而且对3G时代的语音短信、多媒体短信同样有效。
Description
技术领域
本发明涉及短信技术领域的短信息监控技术,尤其涉及一种基于社交网络机理确认发送者身份的短信息监控方法。
背景技术
2000年至2007年,我国短信业务量分别为:10亿、189亿、900亿、1371亿、2177亿、3046亿、4296亿、5921亿,2007年短信日均发送17亿,垃圾短信年总量高达3538亿,较2006年增加92.7%,占短信总量的59.75%(中国互联网协会《2007年手机短消息调查报告》)。2008年7月23日,全国手机用户达6.01亿(工业和信息化部统计快报)。2008年新增的1亿用户虽然大多是低端用户,对运行商的ARPU贡献有限,但低廉价格的短信无疑是新增用户的首选通信方式,因此2008年我国短信业务量仍将处在高速增长的轨道中。垃圾短信已成为严重的社会问题,引起社会各界和政府的广泛关注。解决垃圾短信是一项系统治理工程,除开展立法、执法、教育外,开发短信监控过滤系统是不可或缺的重要环节。
2003年原信息产业部为规范短信市场提出建立短信息监控中心,颁发了《短信息业务中心(SMSC)与短信息监控中心(SMMC)接口规范》,该规范规定手机用户的短信通过GSM/GPRS/CDMA到达SMSC时,需经SMMC处理,SMSC依据SMMC给出的指令进行拦截短信和发送短信操作。2006年,朗讯科技(中国)有限公司推出了Mulife Anti-SPAM产品(简称ASA),ASA基于贝尔实验室专利Vortex规则引擎拦截垃圾短信,具有自学习和动态调整规则功能,ASA已在国内运营商中得到实际应用。ASA投运初期取得一定效果,但随着时间推移每况愈下。这主要是由于:ASA基于关键字完全匹配规则,垃圾短信通过形近、音近、加分隔符等方式就可绕开ASA的拦截;ASA根据短信频率拦截,垃圾短信通过简单的程序控制也可绕开ASA的拦截;ASA的自学习功能,则因语言的差异始终差强人意。
鉴于垃圾短信已成为严重的社会问题,企业界、学术界均投入大量人力和物力展开短信息监控中心研究。以向国家知识产权局申请的发明专利为例,2003年至2008年的申请量呈逐年增长的态势。现就短信息监控中心领域申请专利所涉及的技术和策略综述如下:
一种处理垃圾短信的方法及系统(授权号ZL200510117449.7),提出在运营商网络侧建立关键字列表拦截垃圾短信的方法。
一种处理垃圾短信的方法及系统(授权号ZL200510117448.2),提出在运营商网络侧建立号码列表拦截垃圾短信的方法。
一种垃圾短信实时拦截的方法与系统(申请号200710135019.7),提出关键字结合流量、命中率拦截垃圾短信的方法。
垃圾短信中的关键词自动学习及更新方法(申请号200710156474.5),提出了自动学习关键词,更新关键词列表、实施拦截垃圾短信的方法。
基于内容的大规模垃圾短信实时过滤方法(申请号200710069930.2),提出采用语义分析短信内容拦截垃圾短信的方法。
一种垃圾短信过滤方法(申请号200710050448.4),提出依据短信用户信任度对短信内容进行不同强度抽样过滤的方法。
一种短信发送方法和应用该方法的手机及系统(授权号ZL200510000093.9),提出短信中嵌入人名,SMMC核查人名与接收号是否相关拦截垃圾短信的方法。
一种移动终端的垃圾短信处理方法及相关装置(申请号200810056523.2),提出手机用户快捷投诉垃圾短信的方法及装置,运营商汇集用户投诉拦截垃圾短信的方法。
上述研究成果和有益探索有一定的参考借鉴价值,其不足之处可归纳如下:
关键词和发送频率过滤方法的有限效用在ASA上已得到证实,一则易被垃圾短信规避,造成漏判;二则关键词的很多词语本身并未传达不良信息,充其量此类词语在垃圾短信中有较高的出现频率而已,因此易造成误判,误判较漏判对用户造成的损失更大。
基于短信内容的文本分类过滤方法存在三大缺陷:首先,文本分类过滤方法的软硬件资源开销太大,面对日均17亿条的处理量,运营商不堪重负;其次,以向量空间模型为例,文本分类需经分词、特征选取、特征权重计算、生成文本向量、训练分类模型和分类六步骤,文本分类无论在理论上,还是技术上远未达到完美成熟的程度;其三,我国宪法保护个人的通信自由、通信私密性,除非得到特殊授权,运营商无权查阅用户的短信内容,基于短信内容过滤方法的正确性无法考证,也不能保证避免误判。
手机用户共同参与拦截垃圾短信的方法,显然这会给用户带来麻烦,不能奢望得到手机用户的全面配合,况且还有运营商推卸应尽义务之嫌;同时也不能不质疑其有效性,因为危害最烈的是短信卡发送的垃圾短信,事实上用户投诉尚未生效,该短信卡可能早已寿终正寝。
网络概念由来已久,复杂网络是复杂系统(现实)的抽象。上世纪末科学家发现,描述现实世界的大量复杂网络既非传统的规则网络,亦非传统的随机网络,而是无标度网络。电力网、互联网、人际关系网、科学家协作网、社交网等无一例外均为无标度网络,无标度网络具有明显的聚类性质、网络节点的度则服从幂律形式。无标度网络由节点与连接两节点之间的边组成,其中节点用来代表现实世界中的不同个体,本发明中则代表某手机用户;边用来表示个体间的关系,本发明中则代表手机用户间的人际关系,即用户间的通信历史记录。进一步研究表明:由多种类型节点组合的复杂网络,相同类型节点间存在较多连接,而不同类型节点间存在较少的关系。经过大量的实验和理论分析已证实,处在社交网络中的任何两个人,最多通过6个人可建立彼此的关系,这就是著名的“六度分离”理论。本发明中采用二度实时过滤,其理论依据就是“六度分离”理论——聚类现象是社交网络的基本特征。
社交网络是一种典型的无标度网络。众所周知,人际关系的价值依赖三点:社交网络的身份和资料必须是真实的;网络中的人士必须在某种意义上是同质的,只有这种“关系”才能带来价值;网络中的人士数量必须适中,毕竟社交是有时间、精力、金钱成本的。通过手机短信进行社交是一种快捷的低成本方法,但交际和交流的主题、目的并没有因技术的进步发生任何改变。垃圾短信发送者对接收者而言,其身份和资料是虚假的,是不请自到的异类,由此不难确定垃圾短信发送者身份,这也是垃圾短信无法回避的固有特性——接收者社交圈外谋一己私利的闯入者,因此最简单直接的方法就是检查发送者与接收者的通信历史记录,作为短信预处理和第一度实时过滤的依据,进而确认发送者身份。
考虑到误判对用户、运营商的危害远大于漏判,因此对于介于垃圾和合法之间的可疑短信,选择加运行商提示语后放行策略为宜。
考虑到部分用户不使用短信,因此通信历史记录包括短信和语音两部分。
考虑到现实世界中上、下级通信,新手机用户和新手机用户人际关系网中的手机用户通信存在不对称性的事实,因此检查接收者之间的通信历史记录,作为第二度实时过滤确认发送者身份的依据是必要的。
发明内容
本发明的目的是克服现有技术不足,提供一种基于社交网络机理确认发送者身份的短信息监控方法。
包括如下步骤:
1)短信发送方发送短信至短信息业务中心,短信息业务中心经网关发送鉴权请求到短信息监控中心;
2)短信息监控中心对发送号进行黑白名单过滤,白名单下发送号,鉴权成功;黑名单下发送号,鉴权失败;非黑白名单的发送号,进入短信预处理和二度实时过滤;
3)根据接收方与发送方是否存在通信历史记录,对短信进行预处理;处理后的短信存入短信息监控中心数据库,进入基于社交网络机理确认发送者身份的第一度实时过滤;
4)基于社交网络机理确认发送者身份的第一度实时过滤,统计发送方与接收方存在通信历史记录的值,计算该值与短信总数的比值,如果比值大于指定阀值,鉴权成功;否则进入基于社交网络机理确认发送者身份的第二度实时过滤;
5)基于社交网络机理确认发送者身份的第二度实时过滤,接收者人数小于指定阀值时,附加运行商提示语,鉴权可疑;接收者人数大于指定阀值,统计发送号下接收者之间存在通信历史记录的值,计算该值与接收者总数的商值,如果商值大于指定阀值,附加运行商提示语,鉴权可疑;否则鉴权失败,进入黑白名单修改;
6)将短信发送号列入黑名单;
7)短信息监控中心经网关返回鉴权响应到短信息业务中心;
8)根据短信息监控中心返回的鉴权响应,若鉴权成功,短信息业务中心将短信发送至接收者;若鉴权失败,短信息业务中心将短信拦截;若鉴权可疑,短信息业务中心将该短信附加运行商提示语后发送给接收者。
所述的短信息监控中心对发送号进行黑白名单过滤步骤:短信息监控中心对发送号进行黑白名单过滤,即提取短信发送者的手机号与运行商的黑白名单比对,白名单下发送号,鉴权成功;黑名单下发送号,鉴权失败;非黑白名单的发送号,进入基于社交网络机理确认发送者身份的短信预处理和二度实时过滤;黑白名单可以人工设置,亦可通过短信预处理和二度实时过滤技术自动生成;黑白名单比对采用遍历查询方式。
所述的根据一接收方与发送方是否存在通信历史记录,对短信进行预处理步骤:若接收方与发送方有通信历史记录,做“有联系”标记,鉴权成功,存入短信息监控中心数据库;否则短信直接进入短信息监控中心数据库,即“有联系”标记短信与未标记短信都存入短信息监控中心数据库,并实施基于社交网络机理确认发送者身份的第一度实时过滤。
所述的基于社交网络机理确认发送者身份的第一度实时过滤步骤:如果“有联系”标记短信数与发送号下短信总数的商大于指定阀值,鉴权成功;否则进入基于社交网络机理确认发送者身份的第二度实时过滤。
所述的基于社交网络机理确认发送者身份的第二度实时过滤步骤:如果接受者人数小于指定阀值时,附加运行商提示语,鉴权可疑;如果接受者人数大于指定阀值,统计发送号下接受者之间存在通信历史记录值,该数值与接受者总数相除的商值大于指定阀值时,附加运行商提示语,鉴权可疑,否则鉴权失败,进入黑白名单修改,并将发送号码列入黑名单。
本发明与背景技术相比,具有的有益效果是:
1)基于社交网络机理确认发送者身份进行垃圾短信过滤,揭示了垃圾短信无法回避的固有属性;以短信发送者与接收者,以及接收者之间的通信历史记录为依据,实施短信的预处理和二度实时过滤,自动确认发送者的身份;过滤算法具有扎实的理论基础,免维护,高效有效,不仅适用于文本短信过滤,而且对3G时代的语音短信、多媒体短信同样有效;
2)鉴于合法短信误判远较垃圾短信漏判的负面影响更大的事实,考虑到我国相关法律法规,将短信划分为合法短信、可疑短信和垃圾短信;发送合法短信,拦截垃圾短信,可疑短信则采用附加运行商提示语后放行的策略,使误判率降至零,且能自动修正黑白名单;
3)短信息监控方法运行在对称多处理SMP技术的硬件平台上,采用并行过滤算法,减少了短信息监控中心SMMC对短信息业务中心SMSC业务处理能力的影响。
附图说明
图1是原信息产业部《规范》规定的短信息业务流程图;
图2是改进短信息处理策略的多个短信息业务中心与短信息监控中心的结构图;
图3是手机用户人际关系(社交网络)示意图;
图4是采用无标度网络描述的手机用户人际关系(社交网络)图;
图5是基于社交网络机理确认发送者身份的短信实时过滤流程图;
图6是黑白名单过滤模块流程图;
图7是短信预处理模块流程图;
图8是短信第一度实时过滤模块流程图;
图9是短信第二度实时过滤模块流程图;
图10是短信息监控中心结构示意图。
具体实施方式
基于社交网络机理确认发送者身份的短信息监控方法包括如下步骤:
1)短信发送方发送短信至短信息业务中心,短信息业务中心经网关发送鉴权请求到短信息监控中心;
2)短信息监控中心对发送号进行黑白名单过滤,白名单下的发送号,鉴权成功;黑名单下的发送号,鉴权失败;非黑白名单的发送号,进入短信预处理和二度实时过滤;
3)根据接收方与发送方是否存在通信历史记录,对短信进行预处理;处理后的短信存入短信息监控中心数据库,进入基于社交网络机理确认发送者身份的第一度实时过滤;
4)基于社交网络机理确认发送者身份的第一度实时过滤,统计发送方与接收方存在通信历史记录的值,计算该值与短信总数的比值,如果比值大于指定阀值,鉴权成功;否则进入基于社交网络机理确认发送者身份的第二度实时过滤;
5)基于社交网络机理确认发送者身份的第二度实时过滤,接收者人数小于指定阀值时,附加运行商提示语,鉴权可疑;接收者人数大于指定阀值,统计发送号下接收者之间存在通信历史记录的值,计算该值与接收者总数的商值,如果商值大于指定阀值,附加运行商提示语,鉴权可疑;否则鉴权失败,进入黑白名单修改;
6)将短信发送号列入黑名单;
7)短信息监控中心经网关返回鉴权响应到短信息业务中心;
8)根据短信息监控中心返回的鉴权响应,若鉴权成功,短信息业务中心将短信发送至接收者;若鉴权失败,短信息业务中心将短信拦截;若鉴权可疑,短信息业务中心将该短信附加运行商提示语后发送给接收者。
所述的短信息监控中心对发送号进行黑白名单过滤步骤:短信息监控中心对发送号进行黑白名单过滤,即提取短信发送者的手机号与运行商的黑白名单比对,白名单下发送号,鉴权成功;黑名单下发送号,鉴权失败;非黑白名单的发送号,进入基于社交网络机理确认发送者身份的短信预处理和二度实时过滤;黑白名单可以人工设置,亦可通过短信预处理和二度实时过滤技术自动生成;黑白名单比对采用遍历查询方式。
所述的根据一接收方与发送方是否存在通信历史记录,对短信进行预处理步骤:若接收方与发送方有通信历史记录,做“有联系”标记,鉴权成功,存入短信息监控中心数据库;否则短信直接进入短信息监控中心数据库,即“有联系”标记短信与未标记短信都存入短信息监控中心数据库,并实施基于社交网络机理确认发送者身份的第一度实时过滤。
所述的基于社交网络机理确认发送者身份的第一度实时过滤步骤:如果“有联系”标记短信数与发送号下短信总数的商大于指定阀值,鉴权成功;否则进入基于社交网络机理确认发送者身份的第二度实时过滤。
所述的基于社交网络机理确认发送者身份的第二度实时过滤步骤:如果接受者人数小于指定阀值时,附加运行商提示语,鉴权可疑;如果接受者人数大于指定阀值,统计发送号下接受者之间存在通信历史记录值,该数值与接受者总数相除的商值大于指定阀值时,附加运行商提示语,鉴权可疑,否则鉴权失败,进入黑白名单修改,并将发送号码列入黑名单。
虽然短信实时过滤的方法种类繁多,但过滤所依据的机理不外乎三种:短信内容、短信行为特征、用户参与下的发送者身份确认。基于社交网络机理确认发送者身份的解决方案是第二、第三种过滤机理的有机结合,该解决方案从垃圾短信无法回避的固有特性切入设计短信息监控方法,有望从根本上解决多年来困扰运营商过滤垃圾短信的难题。
基于社交网络机理确认发送者身份的短信息监控方法,首先用黑白名单对短信进行过滤;然后从垃圾短信无法回避的固有特性——接收者社交圈外谋一己私利的闯入者切入,以短信发送者与接收者,以及接收者之间的通信历史记录为依据,实施基于社交网络机理的短信预处理和二度实时过滤,确认发送者身份,拦截垃圾短信、发送合法短信、介于垃圾和合法之间的可疑短信则加运营商提示语后发送,并实时自动修正黑白名单。
下面结合附图对本发明作进一步说明。
原信息产业部《规范》规定的短消息业务流程图如图1所示,原信息产业部颁发的《短信息业务中心(SMSC)与短信息监控中心(SMMC)接口规范》规定:短信息业务中心SMSC接收到短信发送方(手机用户或实体)提交的短消息后,发送一个鉴权请求消息到短信息监控中心SMMC,SMMC对短消息的合法性进行判断,返回给SMSC鉴权响应。如果短消息合法,则返回鉴权成功,SMSC发送短消息至接收方;反之返回鉴权失败,SMSC拦截并丢弃短消息。
如图2示,本发明的短信息业务中心接收短信发送方提交短信后,均发送一个鉴权请求到汇接网关,汇接网关转发鉴权请求至短信息监控中心。短信息监控中心对短信内容、行为特征和发送者身份进行判断,经汇接网关返回给短信息业务中心鉴权响应。如果短消息合法,短信息监控中心返回鉴权成功消息,短信息业务中心将该短信发送给接收者;如果短消息可疑,短信息监控中心返回鉴权可疑消息,短信息业务中心将该短信附加运行商提示语后发送给接收者;如果短消息不合法,返回鉴权失败消息,短信息业务中心将该短信丢弃。根据原信息产业部《短信息业务中心与短信息监控中心接口规范》,短信息业务中心与短信息监控中心之间的信息交互采用标准的SMPP协议,短信息业务中心通过DELIVER_SM将起呼MO(Mobile Original)信息提交给短信息监控中心,短信息监控中心提取DELIVER_SM中short_message_test字段内容,按照既定规则处理后返回短信息业务中心一条SELIVER_SM_RESP鉴权响应消息。如果短信息业务中心等待响应的时间大于5s,则短信息业务中心记录日志,直接发送短信。
如图3、4所示,手机用户作为社会成员,出于情感诉求、学习交流、工作协助等需求,精心维护各自的人脉,短信仅仅是维护人脉的一种手段。“物以类聚,人以群分”,相同类型的节点之间存在较多连线,而不同类型的节点之间存在较少连接,社交网络具有明显的聚类特征。垃圾短信发送者是手机用户社交(人际)圈的外来闯入者,因此不存在或极少可能存在与手机用户的关系,即垃圾短信发送者与接收者的通信历史记录几乎为零是其无法规避的固有特性。
基于社交网络机理确认发送者身份的短信实时过滤流程如图5所示。流程依次经过8个步骤:
1.短信发送方发送短信至短信息业务中心SMSC,SMSC发送鉴权请求到SMMC;
2.SMMC对发送号进行黑白名单过滤;
3.短信预处理;
4.第一度实时过滤;
5.第二度实时过滤;
6.修改黑白名单;
7.SMMC返回鉴权响应到SMSC;
8.根据SMMC返回的鉴权响应,若鉴权成功,SMSC将短信发送至接收者;若鉴权失败,SMSC将短信拦截;若鉴权可疑,SMSC将该短信附加运行商提示语后发送给接收者。下面就各个模块具体进行说明。
黑白名单过滤模块流程如图6所示,SMMC对短信进行初次检测,即提取短信发送者的手机号与运行商的黑白名单比对,进行黑白名单过滤;若发送号在白名单之列,鉴权成功发送短信息;若在黑名单之列,鉴权失败拦截短信息;否则进入短信息预处理模块。黑白名单比对采用遍历查询方式。
短信息预处理模块流程如图7所示,当采用黑白名单无法确定短信发送者身份时,进入短信预处理,查询发送者与接收者是否有通信历史记录;若接收者呼叫过发送者,认定发送者与该接收者存在通信历史记录,即发送者与该接收者之间存在社交关系,则鉴权成功发送此条短信至该接收者并作“有联系”标记,短信存入SMMC内存数据库;否则,将短信直接存入SMMC内存数据库,进入第一度实时过滤模块。
短信息第一度实时过滤模块流程如图8所示,对于短信息预处理模块仍然无法判断的剩余短信,进行短信息第一度实时过滤作进一步判断。短信息第一度实时过滤仍基于发送者与接收者之间的通信历史记录(包括文本短信、语音短信和多媒体短信),按发送号对短信分类,统计“有联系”标记短信数量的值A,该值除以发送号下的短信总数B,当商值大于指定阀值时,发送与该发送号有关的未发送短信;否则实施基于社交网络机理确认发送者身份的第二度实时过滤。统计时只要发送者与接收者存在通信历史记录,其值为1,反之为0;因而商值代表发送者与接收者社交密切程度。
短信息第二度实时过滤模块流程如图9所示,经过黑白名单、短信息预处理和短信息第一度实时过滤之后,短信息监控中心已成功拦截垃圾短信。现实世界的多样性和复杂性导致短信通信存在一定数量的特例,短信息监控中心设计时必须对这些特例进行特殊处理,尤其要防止误判的发生,因为误判对用户和运行商造成的损失更大。故对介于垃圾和合法之间的可疑短信,选择加运行商提示语后发送的策略。第二度实时过滤借助于接收者之间是否存在社交关系作为判据,是一种发送者与接收者之间是否存在社交关系的间接判据,因而通过这一步发送的短信,我们归结于合法与非法短信之间的可疑短信,都采用附加提示语的办法发送。垃圾短信泛滥成灾的背后是实实在在的利益,利益驱动下的垃圾短信发送量特别巨大,因此当接收者总数小于阀值(例如5),则加运行商提示语后发送。因为手机用户结交新朋友,以往无通信历史记录是可能的,既然是初交,运行商提醒注意是合情合理的善意之举,毕竟杜绝误判是监控中心的第一目标。
垃圾短信的接收者之间不存在或几乎不存在联系(通信历史记录)是客观存在的基本事实,而上、下级之间,以及新手机用户与其关系网中手机用户通信时,下级间、关系网手机用户间存在一定的联系(通信历史记录)也是客观存在的基本事实,据此特征区分是可行的,可有效杜绝误判的发生。但发送方与接收方不存在直接关系,毕竟是少之又少的特例,因此加提示语是事出有因。对于发送方与接收方无或极少有通信历史记录,而接收方之间也无或极少有通信历史记录的短信,只能有一种解释——垃圾短信。从接收者之间的交往密切程度判断接收者之间是否存在社交关系,进而推断发送者与接收者之间的关系,仍然是基于社交网络机理。统计接收者之间所有通信历史记录值,该值除以统计的接收者数量,当商值大于指定阀值时,接收者之间交往较为密切,可知发送者与接收者之间存在某种社交关系,但发送方与接收方不存在直接关系毕竟可疑,因此附加运行商提示语后发送与该发送号有关的未发送短信。否则,可以断定一个与大量接收者不存在通信历史或通信历史极少,且大量接收者之间也不存在通信历史或极少通信的发送者发送的短信为垃圾短信,拦截该发送号未发送的短信,将发送号列入黑名单。统计时只要两个接收者存在通信历史记录,其值为1,反之为0;因而商值代表接收者之间社交密切程度。
短信息监控中心结构连接如图10所示。短信息监控中心的投运通常会导致短信息业务中心的吞吐量下降30%,随着短信用户和短信业务量的增长,SMMC对SMSC效率的负面影响日益凸现,采用平行技术是消除负面影响的有效技术手段。平行技术的难点是平行算法,幸运的是短信过滤本身具有平行特性,此类平行算法简单且成熟。SMMC的硬件平台采用浪潮英信NF 560 D2服务器,该服务器含有4颗英特尔四核志强7300处理器,是一种对称多处理架构SMP的硬件平台。
由于CPU数量已扩大至16个,因此短信息的并行处理采用多进程多线程处理的模式。在十六颗处理器上分别创建一个短信息实时过滤进程,所有发送短信进入短信息监控中心后,首选提取短信息发送号,与黑白名单进行遍历比较,至号码相同时遍历结束,执行相应操作。遍历结果发送号未在黑白名单中找到,则所有短信依次进入各个处理器的过滤进程。在各进程中创建多个线程并启动,线程执行短信息预处理、第一度实时过滤、第二度实时过滤、黑白名单修改等操作。不同进程中多线程之间的同步问题采用互斥解决,同时由于过滤程序常用到通信历史记录值以及已发送短信等,创建程序的全局变量,对全局变量进行实时修改。
以下是平行过滤算法中应用的主要函数及函数功能说明:
CreateProcess()创建一个新进程;
ExitProcess()中止一个进程;
GetCurrentProcess()获取当前进程的一个伪句柄;
GetCurrentProcessId()获取当前进程一个唯一的标识符;
GetExitCodeProcess()获取一个已中断进程的退出代码;
SetPriorityClass()设置一个进程的优先级别;
GetPriorityClass()获取特定进程的优先级别;
GetSartupInfo()获取一个进程的启动信息;
GetWindowThreadProcessId()获取与指定窗口关联在一起的一个进程和线程标识符;
///////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////
创建一个新的线程函数为:
HANLE CreateThread(
LPSECURITY_ATTRIBUTES lp ThreadAttributes,//线程安全属性
DWORD dwStackSize,//线程堆栈的初始化大小
LPTHREAD_START_ROUTINE lpStartAddress,//线程函数
LPVOID lpParameter,//传给线程函数的参数
DWORD dwCreationFlags,//创建方式,立即执行或挂起
LPDWORD lpThreadId//线程标识符
);
指向LPSECURITY_ATTRIBUTES结构的lpThreadAttributes决定了一个线程的返回句柄是否可以被子进程所继承,若该参数为NULL,则表明返回句柄不能被子进程继承。
CreateRemoteThread()创建在其他进程的虚拟地址空间运行的线程;
SuspendThread()暂停一个线程,ResumeThread()重启一个线程;
暂停和重启线程函数都带有一个HANDLE型的参数,参数值为要暂停或重启的线程的句柄。
GetExitCodeThread()获取线程的退出代码;
ExitThread()中止一个线程;
SetThreadPriority()设置一个线程的优先级别。
具体函数形式:
BOOL SetThreadPriority(
HANNDLE hThread,//线程句柄
Int nPriority//要设置的优先级
);
GetThreadPriority()获取特定线程的优先级别;
///////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////
线程间的通信有四种方法:全局变量法、参数传递法、消息传递法和同步变量法。同步变量法就是引入互斥量进行单个或多个进程中线程间的同步。CreateMutex()创建互斥对象;
HANDLE CreateMutex(
LPSECURITY_ATTRIBUTES lpMutexAttributes,
BOOL bInitialOwner,
LPCTSTR lpName
);
lpMutexAttributes函数返回句柄是否可被子程序继承;bInitialOwner说明对互斥对象的初始所有权,如果该参数设为True,则创建该互斥对象的线程拥有对该互斥对象的所有权;lpName指向一个字符串指针,该字符串为互斥对象的名字,为互斥对象起名字是为了在不同进程之间利用互斥对象进行同步。
OpenMutex()使多个进程共享通用的互斥对象;
HANDLE OpenMutex(
DWORD dwDesiredAccess,//指定访问互斥量所需要的访问权
BOOL bInheritHandle,//指定句柄是否可以被子进程继承
LPCTSTR lpName//指向将要打开的互斥对象名
);
如果函数调用成功则返回打开的互斥对象的句柄,否则返回值为NULL。Release Mutex()释放对特点互斥对象的所有权;
BOOL ReleaseMutex(
HANDLE hMutex//
);
hMutex为互斥对象句柄,该句柄是CreateMutex()或OpenMutex()的返回值。
此外,同一进程中只有当互斥对象被释放后,拥有互斥对象句柄的线程才可以获得互斥对象的控制权,在此之前一个线程通过等待函数
WaitForSingleObject()或WaitForMultiObject()函数中指定互斥句柄来试图获得对互斥对象的所有权。多个进程可以拥有同一互斥对象的句柄,从而允许在进程间进行同步。
Claims (5)
1.一种基于社交网络机理确认发送者身份的短信息监控方法,其特征在于包括如下步骤:
1)短信发送方发送短信至短信息业务中心,短信息业务中心经网关发送鉴权请求到短信息监控中心;
2)短信息监控中心对发送号进行黑白名单过滤,白名单下发送号,鉴权成功;黑名单下发送号,鉴权失败;非黑白名单的发送号,进入短信预处理和二度实时过滤;
3)根据接收方与发送方是否存在通信历史记录,对短信进行预处理;处理后的短信存入短信息监控中心数据库,进入基于社交网络机理确认发送者身份的第一度实时过滤;
4)基于社交网络机理确认发送者身份的第一度实时过滤,统计发送方与接收方存在通信历史记录的值,计算该值与短信总数的比值,如果比值大于指定阀值,鉴权成功;否则进入基于社交网络机理确认发送者身份的第二度实时过滤;
5)基于社交网络机理确认发送者身份的第二度实时过滤,接收者人数小于指定阀值时,附加运行商提示语,鉴权可疑;接收者人数大于指定阀值,统计发送号下接收者之间存在通信历史记录的值,计算该值与接收者总数的商值,如果商值大于指定阀值,附加运行商提示语,鉴权可疑;否则鉴权失败,进入黑白名单修改;
6)将短信发送号列入黑名单;
7)短信息监控中心经网关返回鉴权响应到短信息业务中心;
8)根据短信息监控中心返回的鉴权响应,若鉴权成功,短信息业务中心将短信发送至接收者;若鉴权失败,短信息业务中心将短信拦截;若鉴权可疑,短信息业务中心将该短信附加运行商提示语后发送给接收者。
2.根据权利要求1所述的一种基于社交网络机理确认发送者身份的短信息监控方法,其特征在于所述的短信息监控中心对发送号进行黑白名单过滤步骤:短信息监控中心对发送号进行黑白名单过滤,即提取短信发送者的手机号与运行商的黑白名单比对,白名单下的发送号,鉴权成功;黑名单下的发送号,鉴权失败;非黑白名单的发送号,进入基于社交网络机理确认发送者身份的短信预处理和二度实时过滤;黑白名单可以人工设置,亦可通过短信预处理和二度实时过滤技术自动生成;黑白名单比对采用遍历查询方式。
3.根据权利要求1所述的一种基于社交网络机理确认发送者身份的短信息监控方法,其特征在于所述的根据接收方与发送方是否存在通信历史记录,对短信进行预处理步骤:若接收方与发送方有通信历史记录,短信作“有联系”标记,鉴权成功,存入短信息监控中心数据库;否则短信直接进入短信息监控中心数据库,即“有联系”标记短信与未标记短信都存入短信息监控中心数据库,并实施基于社交网络机理确认发送者身份的第一度实时过滤。
4.根据权利要求1所述的一种基于社交网络机理确认发送者身份的短信息监控方法,其特征在于所述的基于社交网络机理确认发送者身份的第一度实时过滤步骤:即如果“有联系”标记短信数与发送号下短信总数的商大于指定阀值,鉴权成功;否则进入基于社交网络机理确认发送者身份的第二度实时过滤。
5.根据权利要求1所述的一种基于社交网络机理确认发送者身份的短信息监控方法,其特征在于所述的基于社交网络机理确认发送者身份的第二度实时过滤步骤:如果接受者人数小于指定阀值时,附加运行商提示语,鉴权可疑;如果接受者人数大于指定阀值,统计发送号下接受者之间存在通信历史记录值,该数值与接受者总数相除的商值大于指定阀值时,附加运行商提示语,鉴权可疑,否则鉴权失败,进入黑白名单修改,并将发送号码列入黑名单。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2008101217585A CN101389074B (zh) | 2008-10-17 | 2008-10-17 | 基于社交网络机理确认发送者身份的短信息监控方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2008101217585A CN101389074B (zh) | 2008-10-17 | 2008-10-17 | 基于社交网络机理确认发送者身份的短信息监控方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101389074A true CN101389074A (zh) | 2009-03-18 |
CN101389074B CN101389074B (zh) | 2011-08-24 |
Family
ID=40478191
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008101217585A Expired - Fee Related CN101389074B (zh) | 2008-10-17 | 2008-10-17 | 基于社交网络机理确认发送者身份的短信息监控方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101389074B (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101854609A (zh) * | 2010-05-17 | 2010-10-06 | 中兴通讯股份有限公司 | 一种短消息监控系统和方法 |
CN101873556A (zh) * | 2010-06-24 | 2010-10-27 | 北京安天电子设备有限公司 | 一种针对通信网络恶意信息的蜜罐捕获系统 |
WO2011022969A1 (zh) * | 2009-08-28 | 2011-03-03 | 中兴通讯股份有限公司 | 一种垃圾信息监控系统和方法 |
CN102088679A (zh) * | 2009-12-08 | 2011-06-08 | 北京网秦天下科技有限公司 | 自学习的移动终端智能化短信防火墙的工作方法及系统 |
CN102231874A (zh) * | 2011-06-23 | 2011-11-02 | 中兴通讯股份有限公司 | 一种短信处理方法、装置及系统 |
WO2014201872A1 (en) * | 2013-06-20 | 2014-12-24 | Tencent Technology (Shenzhen) Company Limited | Method and device for processing short messages |
CN104320766A (zh) * | 2014-10-16 | 2015-01-28 | 小米科技有限责任公司 | 垃圾短信识别方法、装置及设备 |
CN106454781A (zh) * | 2016-11-22 | 2017-02-22 | 北京小米移动软件有限公司 | 通讯消息来源方识别方法及装置 |
CN108230099A (zh) * | 2017-12-27 | 2018-06-29 | 黄祥皓 | 一种基于六度分离理论的交易平台 |
CN113762976A (zh) * | 2021-09-15 | 2021-12-07 | 中国银行股份有限公司 | 诈骗短信的识别方法、装置、电子设备及计算机存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1688150A (zh) * | 2005-05-08 | 2005-10-26 | 丁志辉 | 移动通信电话数据过滤处理方法 |
CN101052177A (zh) * | 2006-11-15 | 2007-10-10 | 深圳凯虹移动通信有限公司 | 过滤主叫干扰的移动终端及其方法 |
CN101257671B (zh) * | 2007-07-06 | 2010-12-08 | 浙江大学 | 基于内容的大规模垃圾短信实时过滤方法 |
-
2008
- 2008-10-17 CN CN2008101217585A patent/CN101389074B/zh not_active Expired - Fee Related
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011022969A1 (zh) * | 2009-08-28 | 2011-03-03 | 中兴通讯股份有限公司 | 一种垃圾信息监控系统和方法 |
CN102088679A (zh) * | 2009-12-08 | 2011-06-08 | 北京网秦天下科技有限公司 | 自学习的移动终端智能化短信防火墙的工作方法及系统 |
WO2011069438A1 (zh) * | 2009-12-08 | 2011-06-16 | 北京网秦天下科技有限公司 | 自学习的移动终端智能化短信防火墙的工作方法及系统 |
WO2011143847A1 (zh) * | 2010-05-17 | 2011-11-24 | 中兴通讯股份有限公司 | 一种短消息监控系统和方法 |
CN101854609B (zh) * | 2010-05-17 | 2014-03-19 | 中兴通讯股份有限公司南京分公司 | 一种短消息监控系统和方法 |
CN101854609A (zh) * | 2010-05-17 | 2010-10-06 | 中兴通讯股份有限公司 | 一种短消息监控系统和方法 |
CN101873556B (zh) * | 2010-06-24 | 2013-05-22 | 北京安天电子设备有限公司 | 一种针对通信网络恶意信息的蜜罐捕获系统 |
CN101873556A (zh) * | 2010-06-24 | 2010-10-27 | 北京安天电子设备有限公司 | 一种针对通信网络恶意信息的蜜罐捕获系统 |
WO2012174823A1 (zh) * | 2011-06-23 | 2012-12-27 | 中兴通讯股份有限公司 | 一种短信处理方法、装置及系统 |
CN102231874A (zh) * | 2011-06-23 | 2011-11-02 | 中兴通讯股份有限公司 | 一种短信处理方法、装置及系统 |
WO2014201872A1 (en) * | 2013-06-20 | 2014-12-24 | Tencent Technology (Shenzhen) Company Limited | Method and device for processing short messages |
CN104320766A (zh) * | 2014-10-16 | 2015-01-28 | 小米科技有限责任公司 | 垃圾短信识别方法、装置及设备 |
CN106454781A (zh) * | 2016-11-22 | 2017-02-22 | 北京小米移动软件有限公司 | 通讯消息来源方识别方法及装置 |
CN106454781B (zh) * | 2016-11-22 | 2020-02-28 | 北京小米移动软件有限公司 | 通讯消息来源方识别方法及装置 |
CN108230099A (zh) * | 2017-12-27 | 2018-06-29 | 黄祥皓 | 一种基于六度分离理论的交易平台 |
CN113762976A (zh) * | 2021-09-15 | 2021-12-07 | 中国银行股份有限公司 | 诈骗短信的识别方法、装置、电子设备及计算机存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN101389074B (zh) | 2011-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101389074B (zh) | 基于社交网络机理确认发送者身份的短信息监控方法 | |
CN104954322B (zh) | 一种账号的绑定处理方法、装置及系统 | |
US11063897B2 (en) | Method and system for analyzing electronic communications and customer information to recognize and mitigate message-based attacks | |
CN102164170B (zh) | 情境性相关引擎 | |
CN109274632B (zh) | 一种网站的识别方法及装置 | |
KR101328389B1 (ko) | 메신저 피싱을 탐지하는 장치 및 방법 | |
US20070266079A1 (en) | Content Upload Safety Tool | |
CN106295349A (zh) | 账号被盗的风险识别方法、识别装置及防控系统 | |
US9563770B2 (en) | Spammer group extraction apparatus and method | |
GB2455207A (en) | Collection of data from multiple sources for security analysis | |
Verma et al. | Email phishing: Text classification using natural language processing | |
Pandit et al. | Towards Measuring the Effectiveness of Telephony Blacklists. | |
CN104244206B (zh) | 一种短信处理方法、装置及终端设备 | |
KR102086936B1 (ko) | 사용자 데이터 공유 방법 및 디바이스 | |
Tang et al. | Clues in tweets: Twitter-guided discovery and analysis of SMS spam | |
Beck | Analyzing tweets to identify malicious messages | |
US20230179628A1 (en) | Conversation-depth social engineering attack detection using attributes from automated dialog engagement | |
CN101242658A (zh) | 移动信息化多层级网络安全审计系统 | |
Dritsas et al. | OntoSPIT: SPIT management through ontologies | |
Gupta et al. | Exploiting phone numbers and cross-application features in targeted mobile attacks | |
Prasad et al. | Diving into Robocall Content with {SnorCall} | |
US20130145289A1 (en) | Real-time duplication of a chat transcript between a person of interest and a correspondent of the person of interest for use by a law enforcement agent | |
Park et al. | Future Information Technology: 6th International Conference on Future Information Technology, FutureTech 2011, Crete, Greece, June 28-30, 2011. Proceedings | |
Gupta et al. | Abusing phone numbers and cross-application features for crafting targeted attacks | |
WO2023102105A1 (en) | Detecting and mitigating multi-stage email threats |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20110824 Termination date: 20141017 |
|
EXPY | Termination of patent right or utility model |