CN102547623B - 垃圾短信处理方法和系统 - Google Patents

垃圾短信处理方法和系统 Download PDF

Info

Publication number
CN102547623B
CN102547623B CN201110003289.9A CN201110003289A CN102547623B CN 102547623 B CN102547623 B CN 102547623B CN 201110003289 A CN201110003289 A CN 201110003289A CN 102547623 B CN102547623 B CN 102547623B
Authority
CN
China
Prior art keywords
refuse messages
note
processing platform
corpus
feedback
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110003289.9A
Other languages
English (en)
Other versions
CN102547623A (zh
Inventor
樊宁
周斯宁
刘东鑫
沈军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Corp Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN201110003289.9A priority Critical patent/CN102547623B/zh
Publication of CN102547623A publication Critical patent/CN102547623A/zh
Application granted granted Critical
Publication of CN102547623B publication Critical patent/CN102547623B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Transfer Between Computers (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明提供一种垃圾短信处理方法和系统,涉及信息处理系统。其中,垃圾短信处理方法,包括:移动终端的垃圾短信过滤客户端根据垃圾短信判决准则将接收到的短信中的垃圾短信过滤出来;垃圾短信过滤客户端将未能过滤出的垃圾短信反馈给垃圾短信处理平台;垃圾短信处理平台根据反馈短信分类准则对接收到的反馈短信进行分类;垃圾短信处理平台将不同属性的反馈短信分别存储到不同的语料库;垃圾短信处理平台基于语料库建立用户模型;通过对用户模型的训练,垃圾短信处理平台生成或更新反馈短信分类准则和垃圾短信判决准则;垃圾短信处理平台将垃圾短信判决准则发送给移动终端的垃圾短信过滤客户端。本发明能够对垃圾短信不断的提高过滤精度,适应用户的需求。

Description

垃圾短信处理方法和系统
技术领域
本发明涉及信息处理系统,特别是涉及一种垃圾短信处理方法和系统。
背景技术
随着移动通信的蓬勃发展,短信成为用户基础最为广泛的移动增值业务。然而繁荣滋生弊病,垃圾短信(即非用户所需要的,对用户造成骚扰的短信)泛滥使手机用户深受其扰。用户对垃圾短信治理有强烈需求。各类垃圾短信过滤系统应时而生。
然而现有的垃圾短信过滤系统对垃圾短信的判定大多基于面向所有用户统一的固定准则。这对于不良短信、非法短信的过滤还是有显著效果的。但对于如广告内容的短信,不同用户有着不同的定义与需求,对某用户造成骚扰的短信却可能是另一用户亟需的资讯。
发明内容
本发明的目的是提出一种垃圾短信处理方法和系统,以提供可以适应用户个性化过滤需求的垃圾短信过滤方案。
为实现上述目的,本发明提供了一种垃圾短信处理方法,包括:移动终端的垃圾短信过滤客户端根据垃圾短信判决准则将接收到的短信中的垃圾短信过滤出来;垃圾短信过滤客户端将未能过滤出的垃圾短信反馈给垃圾短信处理平台;垃圾短信处理平台根据反馈短信分类准则对接收到的反馈短信进行分类;垃圾短信处理平台根据对反馈短信的分类,将不同属性的反馈短信分别存储到不同的语料库;垃圾短信处理平台基于语料库建立用户模型;通过对用户模型的训练,垃圾短信处理平台生成或更新反馈短信分类准则和垃圾短信判决准则;垃圾短信处理平台将垃圾短信判决准则发送给移动终端的垃圾短信过滤客户端。
在一个实施例中,垃圾短信处理平台基于语料库建立用户模型,包括:垃圾短信处理平台通过提取短信的分词结构和使用词频对语料库存储的短信进行特征统计;垃圾短信处理平台根据对语料库的短信的特征统计建立用户模型。
在一个实施例中,通过对用户模型的训练,垃圾短信处理平台生成或更新反馈短信分类准则和垃圾短信判决准则,包括:垃圾短信处理平台通过采用统计模式识别方法对用户模型的训练选取出最优分词结构和函数参数;垃圾短信处理平台根据最优分词结构和函数参数生成或更新反馈短信分类准则和垃圾短信判决准则。
在一个实施例中,垃圾短信处理平台根据对反馈短信的分类,将不同属性的反馈短信分别存储到不同的语料库,包括:垃圾短信处理平台将反馈短信分类为公用短信和个性化短信;垃圾短信处理平台将公用短信存储到所有用户能够共享的公用短信语料库,将个性化短信存储到网络侧分别为不同用户设立的个性化语料库。
在一个实施例中,网络侧分别为不同用户设立的个性化语料库采用用户的移动识别码进行标识。
在一个实施例中,垃圾短信处理平台基于语料库建立用户模型,包括:垃圾短信处理平台通过提取短信的分词结构和使用词频分别对公用短信语料库和个性化语料库存储的短信进行特征统计;垃圾短信处理平台根据对公用短信语料库的短信的特征统计建立用户基本模型,根据对个性化语料库的短信的特征统计建立用户特性模型。
在一个实施例中,通过对用户模型的训练,垃圾短信处理平台生成或更新反馈短信分类准则和垃圾短信判决准则,包括:垃圾短信处理平台通过采用统计模式识别方法对用户基本模型的训练选取出第一最优分词结构和函数参数,根据第一最优分词结构和函数参数生成或更新反馈短信分类准则和垃圾短信判决基本准则;垃圾短信处理平台通过采用统计模式识别方法对用户基本模型和用户特性模型的线性联合训练选取出第二最优分词结构和函数参数,根据第二最优分词结构和函数参数生成或更新反馈短信分类准则和垃圾短信个性化判决准则。
在一个实施例中,垃圾短信处理平台将垃圾短信判决准则发送给移动终端的垃圾短信过滤客户端,包括:垃圾短信处理平台根据用户的定制情况,将垃圾短信判决基本准则和/或垃圾短信个性化判决准则发送给移动终端垃圾短信过滤客户端。
为实现上述目的,本发明还提供了一种垃圾短信处理系统,包括:移动终端的垃圾短信过滤客户端,用于根据垃圾短信判决准则将接收到的短信中的垃圾短信过滤出来,并发送反馈短信,反馈短信为所属垃圾短信过滤客户端未能过滤出的垃圾短信;垃圾短信处理平台,包括:接收模块,用于接收反馈短信;分类模块,用于根据反馈短信分类准则对反馈短信进行分类,根据对反馈短信的分类,将不同属性的反馈短信分别存储到不同的语料库;用户建模模块,用于基于语料库建立用户模型;训练机,用于通过对用户模型的训练,生成或更新反馈短信分类准则和垃圾短信判决准则;发送模块,用于将垃圾短信判决准则发送给垃圾短信过滤客户端。
在一个实施例中,用户建模模块,包括:特征统计单元,用于通过提取短信的分词结构和使用词频对语料库存储的短信进行特征统计;建模单元,用于根据对语料库的短信的特征统计建立用户模型。
在一个实施例中,训练机,包括:训练单元,用于通过采用统计模式识别方法对用户模型的训练选取出最优分词结构和函数参数;准则建立单元,用于根据最优分词结构和函数参数生成或更新反馈短信分类准则和垃圾短信判决准则。
在一个实施例中,语料库包括公用短信语料库和个性化语料库,其中,分类模块将反馈短信分类为公用短信和个性化短信,并将公用短信存储到所有用户能够共享的公用短信语料库,将个性化短信存储到网络侧分别为不同用户设立的个性化语料库。
基于上述技术方案,根据本发明的一方面,网络侧的垃圾短信处理平台可以基于用户反馈的短信进行用户建模,从而生成垃圾短信判决准则和反馈短信分类准则。移动终端的客户端可以根据垃圾短信判决准则对接收到的垃圾短信进行过滤。通过垃圾短信处理平台对垃圾短信判决准则和反馈短信分类准则的更新,不断的提高过滤精度,适应用户的需求。
附图说明
此处所说明的附图用来提供对本发明的进一步解释,构成本发明的一部分。本发明的示意性实施例及其说明仅用于解释本发明,但并不构成对本发明的不当限定。在附图中:
图1为根据本发明实施例的垃圾短信处理方法的流程图。
图2为根据本发明另一实施例的垃圾短信处理方法的流程图。
图3为根据本发明又一实施例的垃圾短信处理方法的流程图。
图4为根据本发明实施例的垃圾短信处理系统的结构示意图。
图5为根据本发明实施例的垃圾短信处理平台的结构示意图。
图6为根据本发明实施例的垃圾短信处理平台的结构示意图。
具体实施方式
下面参照附图对本发明进行更详细的描述,其中说明本发明的示例性实施例。在附图中,相同的标号表示相同或者相似的组件或者元素。
图1为根据本发明实施例的垃圾短信处理方法100的流程图。
在步骤102中,移动终端的垃圾短信过滤客户端根据垃圾短信判决准则将接收到的短信中的垃圾短信过滤出来。
在步骤104中,垃圾短信过滤客户端将未能过滤出的垃圾短信反馈给垃圾短信处理平台。
在步骤106中,垃圾短信处理平台根据反馈短信分类准则对接收到的反馈短信进行分类。
在步骤108中,垃圾短信处理平台根据对反馈短信的分类,将不同属性的反馈短信分别存储到不同的语料库。
在步骤110中,垃圾短信处理平台基于语料库建立用户模型。
在步骤112中,通过对用户模型的训练,垃圾短信处理平台生成或更新反馈短信分类准则和垃圾短信判决准则。
在步骤114中,垃圾短信处理平台将垃圾短信判决准则发送给移动终端的垃圾短信过滤客户端。
图2为根据本发明另一实施例的垃圾短信处理方法200的流程图。
在步骤202中,移动终端的垃圾短信过滤客户端根据垃圾短信判决准则将接收到的短信中的垃圾短信过滤出来。垃圾短信过滤客户端可以是安置在移动终端内的面向用户的应用软件。垃圾短信过滤客户端可以存储和维护垃圾短信判决准则。移动终端接收到短信时,垃圾短信过滤客户端可以根据垃圾短信判决准则对短信进行过滤判决,比如,将垃圾短信过滤至垃圾短信信箱,不向用户发通知信号音,正常短信正常接收。垃圾短信判决准则由后续流程中网络侧的垃圾短信处理平台基于用户模型生成和更新。不同用户的垃圾短信判决准则可以是有差异性的。
在步骤204中,垃圾短信过滤客户端将未能过滤出的垃圾短信反馈给垃圾短信处理平台。垃圾短信处理平台是网络侧的短信存储和处理系统。
在步骤206中,垃圾短信处理平台根据反馈短信分类准则对接收到的反馈短信进行分类。比如,垃圾短信处理平台可以将反馈短信分类为公用短信和个性化短信。垃圾短信处理平台可以保存维护反馈短信分类准则。反馈短信分类准则可以由后续流程中垃圾短信处理平台基于用户模型生成和更新。
在步骤208中,垃圾短信处理平台根据对反馈短信的分类,将不同属性的反馈短信分别存储到不同的语料库。语料库可以文件形式分类存储,不同类别不同用户的语料库可以彼此隔离。比如,垃圾短信处理平台可以将公用短信存储到所有用户能够共享的公用短信语料库,将个性化短信存储到网络侧分别为不同用户设立的个性化语料库。
在步骤210中,垃圾短信处理平台通过提取短信的分词结构和使用词频对语料库存储的短信进行特征统计。
在步骤212中,垃圾短信处理平台根据对语料库的短信的特征统计建立用户模型。垃圾短信处理平台可以数据库形式存储和索引用户短信特征。
在步骤214中,垃圾短信处理平台通过采用统计模式识别方法对用户模型的训练选取出最优分词结构和函数参数。
在步骤216中,垃圾短信处理平台根据最优分词结构和函数参数生成或更新反馈短信分类准则和垃圾短信判决准则。
在步骤218中,垃圾短信处理平台将垃圾短信判决准则发送给移动终端的垃圾短信过滤客户端。在一个实施例中,垃圾短信处理平台可以预定周期将垃圾短信判决准则发送给移动终端的垃圾短信过滤客户端。在另一个实施例中,垃圾短信处理平台可以根据移动终端的触发,对垃圾短信过滤客户端的垃圾短信判决准则进行更新。
图3为根据本发明又一实施例的垃圾短信处理方法300的流程图。
在步骤302中,移动终端的垃圾短信过滤客户端根据垃圾短信判决准则将接收到的短信中的垃圾短信过滤出来。不同用户的垃圾短信判决准则可以是有差异性的。
在步骤304中,垃圾短信过滤客户端将未能过滤出的垃圾短信反馈给垃圾短信处理平台。
在步骤306中,垃圾短信处理平台可以根据反馈短信分类准则将移动终端的反馈短信分类为公用短信和个性化短信。垃圾短信处理平台可以保存维护反馈短信分类准则。垃圾短信处理平台可以将与现有垃圾短信定义相似度较高的短信存储为公用短信,将反映用户个性化需求的短信存储为个性化短信。
在步骤308中,垃圾短信处理平台可以为所有用户建立能够共享的公用短信语料库,用于存储公用短信。
在步骤310中,垃圾短信处理平台通过提取短信的分词结构和使用词频对公用短信语料库的短信进行特征统计。
在步骤312中,垃圾短信处理平台根据对公用短信语料库的短信的特征统计建立用户基本模型。
在步骤314中,垃圾短信处理平台通过采用统计模式识别方法对用户基本模型的训练选取出第一最优分词结构和函数参数,根据第一最优分词结构和函数参数生成或更新反馈短信分类准则和垃圾短信判决基本准则。统计模式识别是人工智能和模式识别技术中一类传统的方法理论。其原理是将模式用n维向量来表示,即模式特征。模式类就是这些向量的集合。统计模式识别方法通过对有限数据样本做训练,研究模式类的统计概率模型,确定不同模式类在某一特征空间彼此隔离的最优决策界,从而确定统计模式识别的分类器。统计模式识别方法包括贝叶斯分类、线性判别函数、近邻法分类、最小距离分类、聚类分类等。垃圾短信处理平台可以通过对用户基本模型的训练选取出不同的最优分词结构和不同的函数参数,进而分别生成反馈短信分类准则和垃圾短信判决基本准则。在一个实施例中,反馈短信分类准则可以比垃圾短信判决基本准则精度要求略低一个比例。
在步骤316中,垃圾短信处理平台将垃圾短信判决基本准则发送给移动终端垃圾短信过滤客户端,该移动终端的用户可以是非个性化服务定制用户。
在步骤318中,垃圾短信处理平台为定制个性化服务的用户开辟个性化存储空间,即个性化语料库,存储个性化短信。其中,垃圾短信处理平台可以为不同的用户分别建设个性化语料库。在一个实施例中,网络侧分别为不同用户设立的个性化语料库可以采用用户的移动识别码进行标识。用虚拟化方法实现用户与其移动识别码标识的个性化语料库的一一对应关系。利用移动识别码可以对用户身份进行认证,实现个性化语料库的控制访问,保证彼此隔离。
在步骤320中,垃圾短信处理平台通过提取短信的分词结构和使用词频对个性化语料库存储的短信进行特征统计。
在步骤322中,垃圾短信处理平台根据对个性化语料库的短信的特征统计建立用户特性模型。
在步骤324中,垃圾短信处理平台通过采用统计模式识别方法对用户基本模型和用户特性模型的线性联合训练选取出第二最优分词结构和函数参数,根据第二最优分词结构和函数参数生成或更新反馈短信分类准则和垃圾短信个性化判决准则。垃圾短信处理平台可以通过对用户基本模型和用户特性模型的线性联合训练选取出不同的最优分词结构和不同的函数参数,进而分别生成反馈短信分类准则和垃圾短信个性化判决准则。在一个实施例中,用户基本模型和用户特性模型的双模型结构按训练学习出的权重,组合词频,参与后续的训练过程。
在步骤326中,垃圾短信处理平台可以将垃圾短信个性化判决准则发送给已定制个性化服务的移动终端垃圾短信过滤客户端。
图4为根据本发明实施例的垃圾短信处理系统400的结构示意图。垃圾短信处理系统400包括:垃圾短信过滤客户端402和垃圾短信处理平台404。
移动终端的垃圾短信过滤客户端402,用于根据垃圾短信判决准则将接收到的短信中的垃圾短信过滤出来,并发送反馈短信,反馈短信为所属垃圾短信过滤客户端未能过滤出的垃圾短信。
垃圾短信处理平台404,如图5所示,包括:接收模块502、分类模块504、用户建模模块505、训练机506和发送模块508。接收模块502,用于接收反馈短信。分类模块504,用于根据反馈短信分类准则对反馈短信进行分类,根据对反馈短信的分类,将不同属性的反馈短信分别存储到不同的语料库。用户建模模块505,用于基于语料库建立用户模型。训练机506,用于通过对用户模型的训练,生成或更新反馈短信分类准则和垃圾短信判决准则。发送模块508,用于将垃圾短信判决准则发送给垃圾短信过滤客户端。
图6为根据本发明另一实施例的垃圾短信处理平台600的结构示意图。垃圾短信处理平台600包括:接收模块602、分类模块604、用户建模模块605、训练机606和发送模块608。
接收模块602,用于接收反馈短信。
分类模块604,用于根据反馈短信分类准则对反馈短信进行分类,根据对反馈短信的分类,将不同属性的反馈短信分别存储到不同的语料库。
用户建模模块605,用于基于语料库建立用户模型。用户建模模块605可以包括特征统计单元12和建模单元14。特征统计单元12,用于通过提取短信的分词结构和使用词频对语料库存储的短信进行特征统计。建模单元14,用于根据对语料库的短信的特征统计建立用户模型。
训练机606,用于通过对用户模型的训练,生成或更新反馈短信分类准则和垃圾短信判决准则。训练机606可以包括训练单元22和准则建立单元24。训练单元22,用于通过采用统计模式识别方法对用户模型的训练选取出最优分词结构和函数参数。准则建立单元24,用于根据最优分词结构和函数参数生成或更新反馈短信分类准则和垃圾短信判决准则。
发送模块608,用于将垃圾短信判决准则发送给垃圾短信过滤客户端。
在一个实施例中,语料库可以包括公用短信语料库和个性化语料库。其中,分类模块604将反馈短信分类为公用短信和个性化短信,并将公用短信存储到所有用户能够共享的公用短信语料库,将个性化短信存储到网络侧分别为不同用户设立的个性化语料库。
用户建模模块605可以通过提取短信的分词结构和使用词频分别对公用短信语料库和个性化语料库存储的短信进行特征统计,并根据对公用短信语料库的短信的特征统计建立用户基本模型,根据对个性化语料库的短信的特征统计建立用户特性模型。
训练机606可以通过采用统计模式识别方法对用户基本模型的训练选取出第一最优分词结构和函数参数,根据第一最优分词结构和函数参数生成或更新反馈短信分类准则和垃圾短信判决基本准则。训练机606通过采用统计模式识别方法对用户基本模型和用户特性模型的线性联合训练选取出第二最优分词结构和函数参数,根据第二最优分词结构和函数参数生成或更新反馈短信分类准则和垃圾短信个性化判决准则。在一个实施例中,训练机606可以预定周期检查用户基本模型和用户特性模型,若有变化,则启动。
发送模块608可以根据用户的定制情况,将垃圾短信判决基本准则和/或垃圾短信个性化判决准则发送给移动终端垃圾短信过滤客户端。比如,将垃圾短信个性化判决准则发送给已定制个性化服务的用户移动终端,将垃圾短信判决基本准则发送给非个性化服务的用户移动终端。
基于上述技术方案,根据本发明的一方面,网络侧的垃圾短信处理平台可以基于用户反馈的短信进行用户建模,从而生成垃圾短信判决准则和反馈短信分类准则。移动终端的客户端可以根据垃圾短信判决准则对接收到的垃圾短信进行过滤。通过垃圾短信处理平台对垃圾短信判决准则和反馈短信分类准则的更新,不断的提高过滤精度,适应用户的需求。根据本发明的另一方面,垃圾短信处理平台还可以根据用户反馈的具有个性化特点的短信和具有公共特性的短信,分别建立用户特性模型和用户基本模型,通过对用户特性模型与用户基本模型的联合训练,生成垃圾短信个性化判决准则,为用户提供个性化服务,以适应用户的差异性要求。
本发明的描述是为了示例和描述起见而给出的,而并不是无遗漏的或者将本发明限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本发明的原理和实际应用,并且使本领域的普通技术人员能够理解本发明从而设计适于特定用途的带有各种修改的各种实施例。

Claims (8)

1.一种垃圾短信处理方法,其特征在于,包括:
移动终端的垃圾短信过滤客户端根据垃圾短信判决准则将接收到的短信中的垃圾短信过滤出来;
所述垃圾短信过滤客户端将未能过滤出的垃圾短信反馈给垃圾短信处理平台;
所述垃圾短信处理平台根据反馈短信分类准则对接收到的反馈短信进行分类;
所述垃圾短信处理平台根据对所述反馈短信的分类,将不同属性的所述反馈短信分别存储到不同的语料库;
所述垃圾短信处理平台基于所述语料库建立用户模型;
通过对所述用户模型的训练,所述垃圾短信处理平台生成或更新所述反馈短信分类准则和所述垃圾短信判决准则;
所述垃圾短信处理平台将所述垃圾短信判决准则发送给移动终端的所述垃圾短信过滤客户端
其中,所述垃圾短信处理平台根据对所述反馈短信的分类,将不同属性的所述反馈短信分别存储到不同的所述语料库,包括:
所述垃圾短信处理平台将所述反馈短信分类为公用短信和个性化短信;
所述垃圾短信处理平台将所述公用短信存储到所有用户能够共享的公用短信语料库,将所述个性化短信存储到网络侧分别为不同用户设立的个性化语料库。
2.根据权利要求1所述的垃圾短信处理方法,其特征在于,网络侧分别为不同用户设立的所述个性化语料库采用用户的移动识别码进行标识。
3.根据权利要求1所述的垃圾短信处理方法,其特征在于,所述垃圾短信处理平台基于所述语料库建立所述用户模型,包括:
所述垃圾短信处理平台通过提取短信的分词结构和使用词频分别对所述公用短信语料库和所述个性化语料库存储的短信进行特征统计;
所述垃圾短信处理平台根据对所述公用短信语料库的短信的特征统计建立用户基本模型,根据对所述个性化语料库的短信的特征统计建立用户特性模型。
4.根据权利要求3所述的垃圾短信处理方法,其特征在于,通过对所述用户模型的训练,所述垃圾短信处理平台生成或更新所述反馈短信分类准则和所述垃圾短信判决准则,包括:
所述垃圾短信处理平台通过采用统计模式识别方法对所述用户基本模型的训练选取出第一最优分词结构和函数参数,根据所述第一最优分词结构和函数参数生成或更新所述反馈短信分类准则和垃圾短信判决基本准则;
所述垃圾短信处理平台通过采用统计模式识别方法对所述用户基本模型和所述用户特性模型的线性联合训练选取出第二最优分词结构和函数参数,根据所述第二最优分词结构和函数参数生成或更新反馈短信分类准则和垃圾短信个性化判决准则。
5.根据权利要求4所述的垃圾短信处理方法,其特征在于,所述垃圾短信处理平台将所述垃圾短信判决准则发送给移动终端的所述垃圾短信过滤客户端,包括:
所述垃圾短信处理平台根据用户的定制情况,将所述垃圾短信判决基本准则和/或所述垃圾短信个性化判决准则发送给移动终端所述垃圾短信过滤客户端。
6.一种垃圾短信处理系统,其特征在于,包括:
移动终端的垃圾短信过滤客户端,用于根据垃圾短信判决准则将接收到的短信中的垃圾短信过滤出来,并发送反馈短信,所述反馈短信为所述垃圾短信过滤客户端未能过滤出的垃圾短信;
垃圾短信处理平台,包括:
接收模块,用于接收所述反馈短信;
分类模块,用于根据反馈短信分类准则对所述反馈短信进行分类,根据对所述反馈短信的分类,将不同属性的所述反馈短信分别存储到不同的语料库;
用户建模模块,用于基于所述语料库建立用户模型;
训练机,用于通过对所述用户模型的训练,生成或更新所述反馈短信分类准则和所述垃圾短信判决准则;
发送模块,用于将所述垃圾短信判决准则发送给所述垃圾短信过滤客户端;
所述语料库包括公用短信语料库和个性化语料库,其中,所述分类模块将所述反馈短信分类为公用短信和个性化短信,并将所述公用短信存储到所有用户能够共享的所述公用短信语料库,将所述个性化短信存储到网络侧分别为不同用户设立的所述个性化语料库。
7.根据权利要求6所述的垃圾短信处理系统,其特征在于,所述用户建模模块,包括:
特征统计单元,用于通过提取短信的分词结构和使用词频对所述语料库存储的短信进行特征统计;
建模单元,用于根据对所述语料库的短信的特征统计建立所述用户模型。
8.根据权利要求6所述的垃圾短信处理系统,其特征在于,所述训练机,包括:
训练单元,用于通过采用统计模式识别方法对所述用户模型的训练选取出最优分词结构和函数参数;
准则建立单元,用于根据最优分词结构和函数参数生成或更新所述反馈短信分类准则和所述垃圾短信判决准则。
CN201110003289.9A 2010-12-08 2011-01-10 垃圾短信处理方法和系统 Active CN102547623B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110003289.9A CN102547623B (zh) 2010-12-08 2011-01-10 垃圾短信处理方法和系统

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
CN2010105797746 2010-12-08
CN201010579774 2010-12-08
CN201010579774.6 2010-12-08
CN201110003289.9A CN102547623B (zh) 2010-12-08 2011-01-10 垃圾短信处理方法和系统

Publications (2)

Publication Number Publication Date
CN102547623A CN102547623A (zh) 2012-07-04
CN102547623B true CN102547623B (zh) 2015-05-20

Family

ID=46353341

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110003289.9A Active CN102547623B (zh) 2010-12-08 2011-01-10 垃圾短信处理方法和系统

Country Status (1)

Country Link
CN (1) CN102547623B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104284306B (zh) * 2013-07-04 2018-07-24 北京壹人壹本信息科技有限公司 一种垃圾短信过滤方法、系统、移动终端以及云服务器
CN103500195B (zh) * 2013-09-18 2016-08-17 小米科技有限责任公司 分类器更新方法、装置、系统及设备
CN103619001A (zh) * 2013-11-01 2014-03-05 宇龙计算机通信科技(深圳)有限公司 短信处理方法、装置及移动终端
CN104794125B (zh) * 2014-01-20 2018-09-11 中国科学院深圳先进技术研究院 一种垃圾短信的识别方法及装置
CN104156228B (zh) * 2014-04-01 2017-11-10 兰州工业学院 一种客户端短信过滤嵌入式特征库及更新方法
CN105516941A (zh) * 2014-10-13 2016-04-20 中兴通讯股份有限公司 一种垃圾短信的拦截方法及装置
CN106294394B (zh) * 2015-05-20 2019-10-15 北大方正集团有限公司 数据聚类方法和数据聚类系统
CN106470405A (zh) * 2015-08-18 2017-03-01 中兴通讯股份有限公司 短信拦截方法和装置
CN107517452A (zh) * 2017-09-04 2017-12-26 上海连尚网络科技有限公司 一种用于管理短信息的方法、设备和计算机存储介质
CN107943791A (zh) * 2017-11-24 2018-04-20 北京奇虎科技有限公司 一种垃圾短信的识别方法、装置和移动终端
CN111401075A (zh) * 2020-04-07 2020-07-10 上海创蓝文化传播有限公司 一种智能短信审核的方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101262648A (zh) * 2008-04-24 2008-09-10 中兴通讯股份有限公司 一种处理垃圾短信的方法和系统
CN101635886A (zh) * 2008-07-22 2010-01-27 北京光芒星空信息技术有限公司 一种基于用户选择的垃圾短信过滤方法
CN101668261A (zh) * 2008-09-04 2010-03-10 中国移动通信集团辽宁有限公司 长短信附加签名的方法、装置及系统
CN101730014A (zh) * 2008-10-31 2010-06-09 中兴通讯股份有限公司 一种应用于短信网关上的短消息发送方法
CN101784022A (zh) * 2009-01-16 2010-07-21 北京炎黄新星网络科技有限公司 短信过滤、分类方法及系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020143995A1 (en) * 2001-03-29 2002-10-03 Hao-Ming Yeh Method of sending mobile phone short message via electronic mail and method of transaction by using same
US20050020289A1 (en) * 2003-07-24 2005-01-27 Samsung Electronics Co., Ltd. Method for blocking spam messages in a mobile communication terminal
CN100466776C (zh) * 2003-12-11 2009-03-04 上海正前信息科技发展有限公司 身份注册手机短信息反向认证系统和反向认证方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101262648A (zh) * 2008-04-24 2008-09-10 中兴通讯股份有限公司 一种处理垃圾短信的方法和系统
CN101635886A (zh) * 2008-07-22 2010-01-27 北京光芒星空信息技术有限公司 一种基于用户选择的垃圾短信过滤方法
CN101668261A (zh) * 2008-09-04 2010-03-10 中国移动通信集团辽宁有限公司 长短信附加签名的方法、装置及系统
CN101730014A (zh) * 2008-10-31 2010-06-09 中兴通讯股份有限公司 一种应用于短信网关上的短消息发送方法
CN101784022A (zh) * 2009-01-16 2010-07-21 北京炎黄新星网络科技有限公司 短信过滤、分类方法及系统

Also Published As

Publication number Publication date
CN102547623A (zh) 2012-07-04

Similar Documents

Publication Publication Date Title
CN102547623B (zh) 垃圾短信处理方法和系统
CN101877837A (zh) 一种短信过滤的方法和装置
CN102024045B (zh) 信息分类处理方法、装置和终端
CN102236639B (zh) 更新语言模型的系统和方法
Uysal et al. A novel framework for SMS spam filtering
JP2005278146A5 (zh)
CN108766428A (zh) 一种语音播报控制方法及系统
CN101784022A (zh) 短信过滤、分类方法及系统
CN101719954B (zh) 一种实现短信置顶的方法及装置
CN101895630A (zh) 一种手机信息分类管理的方法
CN112597282B (zh) 一种应用于短信数据安全的管理方法
CN107145516A (zh) 一种文本聚类方法及系统
CN108475274A (zh) 生成和应用传出通信模板
CN101626576B (zh) 一种参数配置模板的生成方法及利用模板配置参数的方法
CN104702759A (zh) 通讯录的设置方法及装置
CN104284306A (zh) 一种垃圾短信过滤方法、系统、移动终端以及云服务器
CN105915440A (zh) 邮件识别方法及装置
CN101288238A (zh) 使用形象表示终端的状态的设备和方法
CN104038637B (zh) 一种铃声播放方法、装置及移动终端
JP4642903B2 (ja) 文脈認識が強化されたメッセージ変換システムおよび方法
CN106682058A (zh) 应用程序的筛选方法、装置和系统
CN103125103A (zh) 用于通信装置的数据过滤
CN108111491A (zh) 一种基于人工智能的手机app语音收纳管理系统
US20150094032A1 (en) Method and apparatus for managing interruptions from different modes of communication
CN107249067A (zh) 一种智能终端的通讯录清理方法及通讯录清理装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant