CN101257671B - 基于内容的大规模垃圾短信实时过滤方法 - Google Patents
基于内容的大规模垃圾短信实时过滤方法 Download PDFInfo
- Publication number
- CN101257671B CN101257671B CN2007100699302A CN200710069930A CN101257671B CN 101257671 B CN101257671 B CN 101257671B CN 2007100699302 A CN2007100699302 A CN 2007100699302A CN 200710069930 A CN200710069930 A CN 200710069930A CN 101257671 B CN101257671 B CN 101257671B
- Authority
- CN
- China
- Prior art keywords
- note
- refuse messages
- filtrating
- message
- hash
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000001914 filtration Methods 0.000 title claims description 49
- 239000013598 vector Substances 0.000 claims abstract description 18
- 238000012706 support-vector machine Methods 0.000 claims description 14
- 230000005540 biological transmission Effects 0.000 claims description 9
- 238000004422 calculation algorithm Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000011218 segmentation Effects 0.000 claims description 4
- 238000000151 deposition Methods 0.000 claims description 2
- 230000008569 process Effects 0.000 description 7
- 238000010295 mobile communication Methods 0.000 description 6
- 238000012544 monitoring process Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 2
- 230000032683 aging Effects 0.000 description 1
- 238000004380 ashing Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Landscapes
- Information Transfer Between Computers (AREA)
Abstract
本发明公开了一种基于内容的大规模垃圾短信实时过滤方法,其步骤如下:1)利用黑名单和白名单两个过滤模块进行预过滤;2)利用基于频率的过滤模块进行在线过滤;3)采用两次散列的方法对短信内容进行快速过滤;4)对“嫌疑短信”进行短信文本预处理,并将其转化为短语向量;5)采用朴素贝叶斯和支持向量机两种分类器相结合的方法对“嫌疑短信”进行判定。本发明可大幅度提高垃圾短信的过滤速度,并有效降低传统的关键字过滤方法所产生的误判率;可有效解决短时间内恶意群发垃圾短信的问题;可有效地避免将正常短信误作垃圾短信的情况发生,降低代价敏感的误判问题,并且从语义上分析短信内容,有效提高整个系统的过滤准确率。
Description
技术领域
本发明涉及垃圾短信过滤方法,尤其涉及一种基于内容的大规模垃圾短信实时过滤方法。
背景技术
随着移动通信技术的飞速发展和手机普及率的不断提高,手机短信以其短小、迅速、简便、价格低廉等诸多优点日益成为一种重要的通信和交流方式,越来越受到人们的青睐。短信业务在给广大用户带来便利的同时,出现了垃圾短信泛滥、短信诈骗、短信谣言等问题,给人们的工作生活带来了很多负面影响,甚至成了一大社会公害。据统计,一个省级移动通信运营商每年因垃圾短信问题而遭受的直接损失就高达近千万元,而垃圾短信造成的不良社会影响和引发的社会问题更是难以估计。因此,垃圾短信已超出人们可以容忍的限度,到了非治理不可的地步,一场反垃圾短信运动已成为人们的迫切需求。开发垃圾短信过滤系统对保障手机用户和移动运营商的利益,促进移动通信行业和整个社会的和谐发展意义重大。
当前,垃圾短信的监控和过滤主要有实时过滤机制、话单分析机制和协议监测机制,它们虽已在移动通信运营商的现网中普遍采用,但都存在较多的技术缺陷,仍未能满足垃圾短信过滤的实际需求。在传统的垃圾短信实时过滤方案中,主要利用基于关键字匹配的方法来进行过滤,但这种方法的主要缺点有:(1)效率低。每条短信必须与几十个甚至上百个关键字进行匹配,故效率十分低下,特别是在短信流量非常大时,该方法大大增加了业务流程。(2)误判率高。通常来说,称为关键字的很多词语本身并没有传达任何不良信息,只是此类词语在垃圾短信中出现概率比较高,因而,当正常短信包含任何关键词的时候就会被误判为垃圾短信而被过滤掉。
现有的商用垃圾短信过滤系统主要有朗讯科技(中国)有限公司于2006年初推出的垃圾短信过滤和拦截(ASA)解决方案。ASA虽在国内得到了一定的应用,但效果并不明显。其原因主要有:(1)ASA基于关键字完全匹配的方式,垃圾短信的发送者会采用多种变通方式,例如形近、音近、加分隔符等,绕开监控继续发送;(2)ASA根据发送频次和发送量阈值(即在一定时间内可发送的短信量)来拦截垃圾短信,与所发送的短信内容无关,而在实际应用中,短信发送频次或发送量阈值与具体内容相关,只是难以确定;(3)ASA虽具有一定的学习功能,但由于语言的差异,ASA的学习功能并不符合汉语言习惯,效果并不理想。显然,基于传统过滤技术的系统无法满足商用系统对大规模垃圾短信过滤系统所期望的准确、实时、高效的要求。
发明内容
本发明的目的是提供一种基于内容的大规模垃圾短信实时过滤方法。
基于内容的大规模垃圾短信实时过滤方法步骤如下:
1)利用黑名单和白名单两个过滤模块进行预过滤;
2)利用基于频率的过滤模块进行在线过滤;
3)采用两次散列的方法对短信内容进行快速过滤;
4)对“嫌疑短信”进行短信文本预处理,并将其转化为短语向量;
5)采用朴素贝叶斯和支持向量机两种分类器相结合的方法对“嫌疑短信”进行判定。
所述的利用黑名单和白名单两个过滤模块进行预过滤:短信首先进入白名单模块,若属白名单则直接放行;否则,进入黑名单模块,若属黑名单则拒绝该主叫号码,若不属黑名单,则该条短信进入下一步骤。
所述的利用基于频率的过滤模块进行在线过滤:首先,将该条短信插入该主叫号码对应的记录模型中,若该号码没有超过单位时间内发送短信量的阈值,则将该条短信立即下放给下一步骤;否则,将该主叫号码的记录模型中的所有短信都保存至垃圾短信数据库,且将该主叫号码列入黑名单中。
所述的采用两次散列(Hash)的方法对短信内容进行快速过滤:利用MD5算法将整条短信文本映射成一个散列值,对第一次散列得到的散列值再次散列,判断通过MD5算法得到的散列值是否和现有垃圾短信样本库中的样本一致,同时,保留一个短信散列值的计数器,当同一个散列值出现的次数过多,则认为该散列值代表了一条新的垃圾短信,且修改垃圾短信样本散列值。
所述的对“嫌疑短信”进行短信文本预处理,并将其转化为短语向量:对上述“嫌疑短信”进行短信清洗、去除停用词、自动分词、词性标注、特征项提取、特征项权重计算和生成短信向量预处理,以剔除短信文本,即由字、词、数字、标点符号构成的文字串中所有与分类任务无关的内容,并将文本转化为由其包含的基本语义单位组成的短语向量。
所述的采用朴素贝叶斯和支持向量机两种分类器相结合的方法对“嫌疑短信”进行判定,分别用朴素贝叶斯和支持向量机分类器对短信进行分类,并且把两个分类器的输出概率按照一定的权重组合,给出最终的分类结果。
本发明具有的有益效果:
1)提出一种基于两次散列的改进的关键字匹配过滤方法,可大幅度提高垃圾短信的过滤速度,并有效降低传统的关键字过滤方法所产生的误判率。
2)提出一种基于短信发送频率阈值监控的过滤方法,可有效解决短时间内恶意群发垃圾短信的问题;
3)提出一种基于内容的垃圾短信过滤方法,可有效地避免将正常短信误作垃圾短信的情况发生,降低代价敏感的误判问题,并且从语义上分析短信内容,有效提高整个系统的过滤准确率。
附图说明
图1是基于内容的大规模垃圾短信实时过滤方法的流程图;
图2是黑白名单过滤模块的原理图;
图3是基于频率过滤模块的原理图;
图4是采用两次散列的方法对短信内容进行快速过滤的原理图;
图5是短信预处理的流程图;
图6是朴素贝叶斯分类器的训练流程图;
图7是朴素贝叶斯分类器的分类流程图。
具体实施方式
本发明主要原理如下:
1)利用黑名单和白名单两个过滤模块进行预过滤。短信首先进入白名单模块,若属白名单则直接放行;否则,进入黑名单模块,若属黑名单则拒绝该主叫号码,若不属黑名单,则该条短信进入下一步骤。
2)当发生恶意短信群发事件时,传统的监控方案通常无法在短时间内做出反应以拦截垃圾短信,故此类事件往往会在短时间内给移动通信运营商造成巨大损失。基于频率的过滤模块的目标就是解决恶意短信群发问题,其核心思想是对所有实时在线的有效用户进行发送特征建模,对每个用户在一个滑动时间窗口内发送短信的数量进行记录,当窗口内发送短信的数量超过一个既定阈值时,即认为该主叫号码在进行恶意快速群发,随即可将该主叫号码列入黑名单,从而拒绝该主叫号码接下来的发送企图。
3)传统的关键词过滤主要存在着效率低和误判率高的问题。事实上,很多关键词本身并无不良语义,仅当其组成句子时才表达了不良信息,并构成了一条垃圾短信。同时,根据实际业务中的经验可知,通常一条垃圾短信将被重复发送成千上万次,与垃圾短信的数量相比,垃圾短信种类相对较少。因此,若能用将短信中心接收到的短信(称为待定短信)与已知的典型垃圾短信进行快速全文比对,并根据比较结果判断这条短信是否为已知的垃圾短信,则可有效防止关键词匹配方法所造成的误判,提高了匹配的准确性。基于这样的思想,本发明采取了两次散列的方法,首先对于整条短信文本运用MD5算法计算散列值,然后再对得到的散列值进行匹配。
4)在线过滤子系统对时效性要求较高,经其处理后,系统已能够快速地过滤掉大部分垃圾短信,对于正常的短信亦能快速下发,但由于在线过滤子系统主要是基于一些外部规则(如频率)或已有数据(如历史垃圾短信)进行短信分类,其不足之处在于规则或历史数据相对死板和僵化,其准确率也受到了限制。这时存在部分短信在发送次数等方面符合垃圾短信的特征,但难以确定其是否为垃圾短信,而这些短信有可能是正常用户发送的玩笑短信或问候短信等。此外,由于垃圾短信发送者也在不断衍化,垃圾短信的发送特征和内容也在变化,故上述在线过滤子系统的准确率有待进一步提高。因此,非常有必要在前述步骤基础上对短信内容进行分析,本发明引入文本分类的方法对嫌疑短信的内容进行过滤。
5)对上述“嫌疑短信”进行短信清洗、去除停用词、自动分词、词性标注、特征项提取、特征项权重计算和生成短信向量等预处理,以剔除短信文本(即由字、词、数字、标点符号等构成的文字串)中所有与分类任务无关的内容,并将文本转化为由其包含的基本语义单位组成的短语向量。
6)采用朴素贝叶斯(Nave Bayes)和支持向量机(SVM)两种分类器相结合的方法对“嫌疑短信”进行判定。由于这两个分类器呈互补关系,即朴素贝叶斯分类器速度快但准确率相对较低,而SVM的分类准确率较高但速度相对较慢,故在垃圾短信过滤时,可将这两个分类器的输出概率按照一定的权重组合,给出最终的分类结果。此时,即可对“嫌疑短信”做出明确的判定。
基于内容的大规模垃圾短信实时过滤方法的步骤如下:
1)黑白名单过滤模块可以对一些特殊号码发出的短信直接进行拦截/放行操作,以节约处理时间和系统资源。该模块包括两部分:白名单过滤模块和黑名单过滤模块,每个模块均维护一个独立的主叫号码列表。白名单模块中的主叫号码(即白名单)主要包括一些大客户或特殊客户等信息,一般是用户和移动通信运营商通过协议设定的,该列表通常由操作员手工维护,不存在失效期;黑名单则主要由系统自动添加,黑名单存在失效期,一段时间内无垃圾短信发送记录的主叫号码可自动从黑名单中去除,操作员亦可根据实际情况维护黑名单。
短信进入该模块后,首先进入白名单模块,若该短信所对应的主叫号码属于白名单则直接发送给短信接收方;否则,进入黑名单模块,如果是黑名单则拒绝该主叫号码,若不是黑名单则短信进入下一个模块——基于频率的过滤模块。详细的流程图如图2所示。
2)对于来自步骤1)的那些既不属于白名单又不属于黑名单的短信,首先将该短信插入该主叫号码对应的记录模型中,记录模型必须包含以下关键信息:主叫号码和该主叫号码在单位时间内已经发送的短信数量。如果该号码并没有超过该滑动窗内规定的短信发送量阈值,则将该短信立即下放给步骤3),否则,将该主叫号码的记录模型中的所有短信都保存至垃圾短信数据库,且将该主叫号码列入黑名单中。同时,对该模块设置一个计时器,对于所有在线用户的记录每隔一定时间间隔就进行重置,详细的流程如图3所示。
3)对于来自步骤2)的那些发送频率未超过预设阈值的短信,使用两次散列的方法来快速过滤短信。第一步是使用散列方法进行短信摘要的提取。本专利使用了MD5等散列算法将经确认的垃圾短信映射成一个唯一的散列值(即所谓的短信摘要),并存储起来。每条待定短信也进行同样的散列运算后获得一个短信摘要。第二步是进行短信摘要的匹配。由于垃圾短信的数量非常巨大,故所存储的垃圾短信摘要数量也非常多,通常数以万计,若直接将待定短信的摘要与垃圾短信摘要进行比对将耗费很长时间。因此,将第一次散列所获得的垃圾短信摘要再次进行散列,并存入一个散列表(可通过选择合适的散列函数和表空间使得该散列表足够大),待定短信摘要也进行散列后存入该散列表,若出现冲突,则说明待定短信摘要与某条垃圾短信摘要相同,即待定短信也是一条垃圾短信。同时,在上述散列表中保留了一个短信摘要计数器,当同一个待定短信摘要在一定时间内出现的次数过多,可认为该散列值又代表了一条疑似垃圾短信,可送入步骤4)进行更进一步的分析和判断。这样,在该模块中能够及时捕捉最新的垃圾短信内容,与后续模块配合实现了系统的自学习功能。
同时,在上述散列表中保留了一个短信摘要计数器,当同一个待定短信摘要在一定时间内出现的次数过多,就可以认为该散列值又代表了一条疑似垃圾短信,可送入后续模块(即基于内容的过滤子系统)中进行更进一步的分析和判断。这样,在该模块中能够及时捕捉最新的垃圾短信内容,与后续模块配合实现了系统的自学习功能,如图4所示。
4)在对短信进行内容分析和过滤之前,需要对文本进行预处理,使文本更适合后续分析的需要。文本预处理的主要任务是对进入分类器之前的短信进行前期处理,剔除所有与分类任务无关的内容,并将文本(即由字、词、数字、标点符号等构成的文字串)转化为由其包含的基本语义单位组成的表列。这里的主要工作包括把对于来自步骤3)的那些符合垃圾短信Hash值的“嫌疑短信”进行短信清洗、去除停用词、自动分词、词性标注、特征项提取、特征项权重计算和生成短信向量等步骤,经预处理后,系统可获得一系列待分类的短信向量,如图5所示。
5)采用朴素贝叶斯( Bayes)和支持向量机(SVM)两种分类器相结合的方法对“嫌疑短信”进行判定。把步骤4)中的短信向量分别送入朴素贝叶斯分类器和支持向量机分类器,并将两种分类器分别给出的判定该条“嫌疑短信”为垃圾短信的概率按照一定的权重结合起来,最终给出一个概率值,当该概率值超过设定的阈值时,就认为该短信是一条垃圾短信。
朴素贝叶斯分类器和支持向量机分类器虽然在具体实现机制上不同,但基本的流程是相同的,都分为训练过程和分类过程,如图6、7所示。训练过程都包括词频统计和特征选择。随后,朴素贝叶斯分类器生成特征集,而支持向量机分类器则生成支持向量模型。分类过程则都经历分词、词频统计和生成短信向量这三步。朴素贝叶斯分类器根据类别的先验概率和各个特征的类条件概率来计算“嫌疑短信”为垃圾短信的概率值,而支持向量机分类器则通过训练好的支持向量模型来计算“嫌疑短信”为垃圾短信的概率值,最后,再把这两个分类器给出的概率值按照一定的权重结合起来,以给出最终的判定结果。
Claims (1)
1.一种基于内容的大规模垃圾短信实时过滤方法,其步骤如下:
1)利用黑名单和白名单两个过滤模块进行预过滤;
2)利用基于频率的过滤模块进行在线过滤;
3)采用两次散列的方法对短信内容进行快速过滤;
4)对“疑似垃圾短信”进行短信文本预处理,并将其转化为短信向量;
5)采用朴素贝叶斯和支持向量机两种分类器相结合的方法对“疑似垃圾短信”进行判定;
所述的步骤1)为:短信首先进入白名单模块,若属白名单则直接放行;否则,进入黑名单模块,若属黑名单则拒绝主叫号码,若不属黑名单,则该条短信送入步骤2);
所述的步骤2)为:对于来自步骤1)的那些既不属于白名单又不属于黑名单的短信,首先将该短信插入该主叫号码对应的记录模型中,记录模型必须包含以下关键信息:主叫号码和该主叫号码在单位时间内已经发送的短信数量,如果该号码并没有超过该滑动窗内规定的短信发送量阈值,则将该短信立即下放给步骤3),否则,将该主叫号码的记录模型中的所有短信都保存至垃圾短信数据库;
所述的步骤3)为:对于来自步骤2)的那些发送频率未超过预设阈值的短信,使用两次散列的方法来快速过滤短信,使用了MD5等散列算法将经确认的垃圾短信映射成一个唯一的散列值,即所谓的短信摘要,每条待定短信也进行同样的散列运算后获得一个短信摘要,将第一次散列所获得的垃圾短信摘要再次进行散列,并存入一个散列表,待定短信摘要也进行散列后存入该散列表,若出现冲突,则说明待定短信摘要与某条垃圾短信摘要相同,即待定短信也是一条垃圾短信,当同一个待定短信摘要在一定时间内出现的次数过多,该散列值又代表了一条疑似垃圾短信,则送入步骤4)进行更进一步的分析和判断;
所述的步骤4)为:对上述“疑似垃圾短信”进行短信清洗、去除停用词、自动分词、词性标注、特征项提取、特征项权重计算和生成短信向量预处理,以剔除短信文本,即由字、词、数字、标点符号构成的文字串中所有与分类任务无关的内容,并将文本转化为由其包含的基本语义单位组成的短信向量;
所述的步骤5)为:把步骤4)中的短信向量分别送入朴素贝叶斯分类器和支持向量机分类器,并将两种分类器分别给出的判定该条“疑似垃圾短信”为垃圾短信的概率按照一定的权重结合起来,最终给出一个概率值,当该概率值超过设定的阈值时,就认为该短信是一条垃圾短信。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2007100699302A CN101257671B (zh) | 2007-07-06 | 2007-07-06 | 基于内容的大规模垃圾短信实时过滤方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2007100699302A CN101257671B (zh) | 2007-07-06 | 2007-07-06 | 基于内容的大规模垃圾短信实时过滤方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101257671A CN101257671A (zh) | 2008-09-03 |
CN101257671B true CN101257671B (zh) | 2010-12-08 |
Family
ID=39892074
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2007100699302A Expired - Fee Related CN101257671B (zh) | 2007-07-06 | 2007-07-06 | 基于内容的大规模垃圾短信实时过滤方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101257671B (zh) |
Families Citing this family (53)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101389085B (zh) * | 2008-10-14 | 2012-03-21 | 中国联合网络通信集团有限公司 | 基于发送行为的垃圾短消息识别系统及方法 |
CN101389074B (zh) * | 2008-10-17 | 2011-08-24 | 浙江大学 | 基于社交网络机理确认发送者身份的短信息监控方法 |
CN101730017B (zh) * | 2008-10-27 | 2012-12-05 | 中国移动通信集团吉林有限公司 | 一种垃圾短信发送用户确定方法与装置 |
CN101415188B (zh) * | 2008-11-28 | 2010-06-09 | 电子科技大学 | 一种群发垃圾短信的监管方法 |
CN101784022A (zh) * | 2009-01-16 | 2010-07-21 | 北京炎黄新星网络科技有限公司 | 短信过滤、分类方法及系统 |
CN101877837B (zh) * | 2009-04-30 | 2013-11-06 | 华为技术有限公司 | 一种短信过滤的方法和装置 |
CN101895828B (zh) * | 2009-05-20 | 2013-01-16 | 中兴通讯股份有限公司 | 一种短消息监控系统及方法 |
CN102065387B (zh) * | 2009-11-13 | 2013-10-02 | 华为技术有限公司 | 一种短信的识别方法和设备 |
CN101902523B (zh) * | 2010-07-09 | 2014-07-16 | 中兴通讯股份有限公司 | 一种移动终端及其短信的过滤方法 |
CN102340580B (zh) * | 2010-07-16 | 2016-04-13 | 希姆通信息技术(上海)有限公司 | 手机及利用该手机实现的防止手机重复发送的方法 |
CN102340424B (zh) * | 2010-07-21 | 2013-12-04 | 中国移动通信集团山东有限公司 | 不良报文的检测方法及不良报文的检测装置 |
CN101930458B (zh) * | 2010-08-18 | 2012-02-01 | 杭州东信北邮信息技术有限公司 | 一种基于特征值的短信匹配方法 |
CN101984647B (zh) * | 2010-12-06 | 2013-02-13 | 广州钜讯网络科技有限公司 | 短信查找方法与装置 |
CN102231873A (zh) * | 2011-06-22 | 2011-11-02 | 中兴通讯股份有限公司 | 垃圾短信监控方法、系统和监控处理装置 |
CN102857921B (zh) * | 2011-06-30 | 2016-03-30 | 国际商业机器公司 | 判断垃圾信息发送者的方法及装置 |
CN103001848B (zh) * | 2011-09-08 | 2015-10-21 | 中国电信股份有限公司 | 垃圾邮件过滤方法及装置 |
CN103166932A (zh) * | 2011-12-15 | 2013-06-19 | 上海粱江通信系统股份有限公司 | 识别并治理利用大量短信实施DDoS的系统及方法 |
CN103179530A (zh) * | 2011-12-26 | 2013-06-26 | 中国移动通信集团设计院有限公司 | 一种短信拦截方法及装置 |
CN103580939B (zh) * | 2012-07-30 | 2018-03-20 | 腾讯科技(深圳)有限公司 | 一种基于账号属性的异常消息检测方法及设备 |
CN102833713A (zh) * | 2012-08-31 | 2012-12-19 | 中国联合网络通信集团有限公司 | 识别垃圾短信的方法及装置 |
CN103796183B (zh) * | 2012-10-26 | 2017-08-04 | 中国移动通信集团上海有限公司 | 一种垃圾短信识别方法及装置 |
CN103813279A (zh) * | 2012-11-14 | 2014-05-21 | 中国移动通信集团设计院有限公司 | 一种垃圾短信检测方法及装置 |
CN103034626A (zh) * | 2012-12-26 | 2013-04-10 | 上海交通大学 | 情感分析系统及方法 |
CN103198217B (zh) * | 2013-03-26 | 2016-06-22 | X·Q·李 | 一种故障检测方法及系统 |
CN104216876B (zh) * | 2013-05-29 | 2017-11-17 | 中国电信股份有限公司 | 信息文本过滤方法及系统 |
CN104424208B (zh) * | 2013-08-22 | 2018-03-30 | 腾讯科技(北京)有限公司 | 对消息进行过滤处理的方法及装置 |
CN103516563A (zh) * | 2013-10-18 | 2014-01-15 | 北京奇虎科技有限公司 | 一种用于监控命令是否异常的设备和方法 |
WO2015054993A1 (zh) * | 2013-10-18 | 2015-04-23 | 中兴通讯股份有限公司 | 垃圾信息处理方法及装置 |
CN104703185B (zh) * | 2013-12-05 | 2018-04-10 | 中国联合网络通信集团有限公司 | 信息识别方法及系统、移动通信网络 |
CN103957516A (zh) * | 2014-05-13 | 2014-07-30 | 北京网秦天下科技有限公司 | 垃圾短信过滤方法及引擎 |
CN105323732B (zh) * | 2014-06-05 | 2018-12-04 | 中国移动通信集团公司 | 一种非正常短消息识别方法及装置 |
CN105307134B (zh) * | 2014-06-12 | 2019-04-23 | 中兴通讯股份有限公司 | 一种短信监控方法及装置 |
CN104168548A (zh) * | 2014-08-21 | 2014-11-26 | 北京奇虎科技有限公司 | 短信拦截方法及装置、云端服务器 |
CN105516940A (zh) * | 2014-09-22 | 2016-04-20 | 中兴通讯股份有限公司 | 一种短信处理的方法及装置 |
CN105592429A (zh) * | 2014-10-20 | 2016-05-18 | 中兴通讯股份有限公司 | 短信过滤方法及短信过滤装置 |
CN104539514B (zh) * | 2014-12-17 | 2018-07-17 | 广州酷狗计算机科技有限公司 | 消息过滤方法和装置 |
CN105786792A (zh) * | 2014-12-26 | 2016-07-20 | 中国移动通信集团公司 | 一种信息处理方法及装置 |
CN106376002B (zh) * | 2015-07-20 | 2021-10-12 | 中兴通讯股份有限公司 | 一种管理方法及装置、垃圾短信监控系统 |
CN105183831A (zh) * | 2015-08-31 | 2015-12-23 | 上海德唐数据科技有限公司 | 一种针对不同学科题目文本分类的方法 |
CN105163296A (zh) * | 2015-09-22 | 2015-12-16 | 电子科技大学 | 一种多维度的垃圾短信过滤方法及系统 |
CN106933924A (zh) * | 2015-12-31 | 2017-07-07 | 中国移动通信集团公司 | 一种信息识别方法及系统 |
CN105681290B (zh) * | 2016-01-08 | 2018-11-02 | 北京京东尚科信息技术有限公司 | 一种自动过滤网络运营商嵌入http响应内容的方法和装置 |
CN105959463B (zh) | 2016-04-20 | 2018-09-04 | 北京小米移动软件有限公司 | 信息过滤方法和装置、智能终端 |
CN106686264B (zh) * | 2016-11-04 | 2021-03-02 | 国家计算机网络与信息安全管理中心 | 一种诈骗电话筛选分析方法及系统 |
CN106682089A (zh) * | 2016-11-26 | 2017-05-17 | 山东大学 | 一种基于RNNs的短信自动安全审核的方法 |
CN108011805A (zh) * | 2016-12-29 | 2018-05-08 | 北京车和家信息技术有限责任公司 | 消息过滤的方法、装置、中间服务器及车联网系统 |
CN109040982A (zh) * | 2017-06-08 | 2018-12-18 | 梁小红 | 一种识别垃圾短信的方法及装置 |
CN107341753A (zh) * | 2017-07-04 | 2017-11-10 | 四川云物益邦科技有限公司 | 基于机器学习的政务精简方法 |
CN107194673A (zh) * | 2017-07-04 | 2017-09-22 | 四川云物益邦科技有限公司 | 采用svm技术的政务处理系统 |
CN109660961B (zh) * | 2018-12-17 | 2021-03-30 | 珠海市小源科技有限公司 | 短信号码及其归属信息的匹配方法、装置及存储介质 |
CN111198947B (zh) * | 2020-01-06 | 2024-02-13 | 南京中新赛克科技有限责任公司 | 基于朴素贝叶斯优化下的卷积神经网络诈骗短信分类方法和系统 |
CN111414520B (zh) * | 2020-03-19 | 2021-03-19 | 南京莱斯网信技术研究院有限公司 | 一种舆情信息中敏感信息的智能挖掘系统 |
CN111628859B (zh) * | 2020-06-05 | 2021-01-05 | 上海创蓝文化传播有限公司 | 一种基于分布式高并发条件下审核短信文本的方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6424829B1 (en) * | 1998-08-26 | 2002-07-23 | Nokia Mobile Phones Limited | Wireless communication terminal having sorting means for sorting short messages into an appropriate folder for storage |
CN1520214A (zh) * | 2003-09-02 | 2004-08-11 | �ź㴫 | 一种短信息防火墙系统及设立防火墙的方法 |
CN1777212A (zh) * | 2004-11-16 | 2006-05-24 | 华为技术有限公司 | 基于移动通信网的垃圾信息过滤方法及其过滤装置 |
-
2007
- 2007-07-06 CN CN2007100699302A patent/CN101257671B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6424829B1 (en) * | 1998-08-26 | 2002-07-23 | Nokia Mobile Phones Limited | Wireless communication terminal having sorting means for sorting short messages into an appropriate folder for storage |
CN1520214A (zh) * | 2003-09-02 | 2004-08-11 | �ź㴫 | 一种短信息防火墙系统及设立防火墙的方法 |
CN1777212A (zh) * | 2004-11-16 | 2006-05-24 | 华为技术有限公司 | 基于移动通信网的垃圾信息过滤方法及其过滤装置 |
Non-Patent Citations (2)
Title |
---|
周咏梅等.基于支持向量机的文本分类研究.《中国包装工业》.2002,119-120. * |
钱升华等.文本分类综述及手机垃圾短信过滤方法的研究.《河北工业大学学报》.2007,第36卷(第1期),35-41. * |
Also Published As
Publication number | Publication date |
---|---|
CN101257671A (zh) | 2008-09-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101257671B (zh) | 基于内容的大规模垃圾短信实时过滤方法 | |
CN101184259B (zh) | 垃圾短信中的关键词自动学习及更新方法 | |
CN102968439B (zh) | 一种推送微博的方法及装置 | |
CN102208992B (zh) | 面向互联网的不良信息过滤系统及其方法 | |
CN102609460B (zh) | 微博客数据采集方法及系统 | |
CN101447984B (zh) | 一种自反馈垃圾信息过滤方法 | |
CN101784022A (zh) | 短信过滤、分类方法及系统 | |
CN106550155A (zh) | 对可疑号码进行诈骗样本甄别归类及拦截的方法及系统 | |
CN103246735B (zh) | 一种异常数据处理方法及系统 | |
WO2021068831A1 (zh) | 一种业务告警方法、设备及存储介质 | |
CN103024746A (zh) | 一种电信运营商垃圾短信处理系统及处理方法 | |
WO2014066698A1 (en) | Method and system for social media burst classifications | |
CN104462509A (zh) | 垃圾评论检测方法及装置 | |
CN102231873A (zh) | 垃圾短信监控方法、系统和监控处理装置 | |
CN103279479A (zh) | 一种面向微博客平台文本流的突发话题检测方法及系统 | |
CN101909261A (zh) | 一种垃圾短信监控的方法和系统 | |
CN101860822A (zh) | 垃圾短信监控方法和系统 | |
CN101431434A (zh) | 基于wap的内容监控及封堵系统和方法 | |
CN113448812A (zh) | 微服务场景下的监控告警方法及装置 | |
CN106649338B (zh) | 信息过滤策略生成方法及装置 | |
CN107145568A (zh) | 一种快速的新闻事件聚类系统及方法 | |
WO2023273303A1 (zh) | 基于树模型的事件影响度获取方法、装置及计算机设备 | |
CN110941757A (zh) | 一种基于大数据的政策信息查询推送系统及方法 | |
Bin et al. | Behavior analysis based SMS spammer detection in mobile communication networks | |
CN108471355A (zh) | 一种基于海云计算架构的物联网信息互操作方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20101208 Termination date: 20140706 |
|
EXPY | Termination of patent right or utility model |