CN105101124A - 标注短信类别的方法及装置 - Google Patents

标注短信类别的方法及装置 Download PDF

Info

Publication number
CN105101124A
CN105101124A CN201510484721.9A CN201510484721A CN105101124A CN 105101124 A CN105101124 A CN 105101124A CN 201510484721 A CN201510484721 A CN 201510484721A CN 105101124 A CN105101124 A CN 105101124A
Authority
CN
China
Prior art keywords
note
classification
sms classified
classified device
classes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510484721.9A
Other languages
English (en)
Inventor
张金晶
常富洋
李强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd, Qizhi Software Beijing Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201510484721.9A priority Critical patent/CN105101124A/zh
Publication of CN105101124A publication Critical patent/CN105101124A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/12Messaging; Mailboxes; Announcements
    • H04W4/14Short messaging services, e.g. short message services [SMS] or unstructured supplementary service data [USSD]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种标注短信类别的方法及装置。该方法包括:采用预置的短信分类规则,构造多分类的短信分类器,其中,所述短信分类器中的各个参数依据短信内容的属性特征进行设置;获取多种类别的短信,其中,每种类别的短信包含多条;将所述多种类别的短信作为训练语料对所述短信分类器进行训练,计算所述短信分类器中的各个参数,得到训练后的短信分类器;当接收到一新短信时,利用所述训练后的短信分类器将所述新短信标注为所述多种类别中的一种。本发明实施例能够通过多分类的短信分类器对短信进行自动分类和标注,从而解决了现有技术中人工分类和标注费时费力、效率较低的问题。

Description

标注短信类别的方法及装置
技术领域
本发明涉及互联网应用技术领域,特别是一种标注短信类别的方法及装置。
背景技术
随着移动终端的应用发展,短信已经成为人与人之间交流的一种重要的手段,短信在加强彼此联系的同时,也出现了诸如中奖之类的骚扰短信,影响了用户的正常工作和生活,用户对此十分不满。
目前,主要由人工对短信标注类别,如中奖、诈骗、房地产、股票等类别,并利用人工标注好的类别对短信进行过滤,以实现骚扰短信的拦截。一般人工标注时,一天大概能标注5000条短信,对于大量过去的短信以及每天产生的新短信,通过人工标注的方式显然费时费力且效率较低,因而亟待提供一种有效的标注短信类别的方案。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的标注短信类别的方法及装置。
依据本发明的一方面,提供了一种标注短信类别的方法,包括:
采用预置的短信分类规则,构造多分类的短信分类器,其中,所述短信分类器中的各个参数依据短信的属性特征进行设置;
获取多种类别的短信,其中,每种类别的短信包含多条;
将所述多种类别的短信作为训练语料对所述短信分类器进行训练,计算所述短信分类器中的各个参数,得到训练后的短信分类器;
当接收到一新短信时,利用所述训练后的短信分类器将所述新短信标注为所述多种类别中的一种。
可选地,所述采用预置的短信分类规则,构造多分类的短信分类器,包括:
采用线性分类库Liblinear构造多分类的短信分类器;或者,
采用支持向量机分类库Libsvm构造多分类的短信分类器。
可选地,采用线性分类库Liblinear构造多分类的短信分类器,包括:
调用所述Liblinear中的动态分类库;
利用调用的动态分类库构造多分类的短信分类器。
可选地,所述获取多种类别的短信,包括:
获取人工标注的多种类别的短信;或者,
接收至少一个客户端上报的至少一种类别的短信。
可选地,接收至少一个客户端上报的至少一种类别的短信之前,还包括:
对各个客户端所在通信终端中的短信接收事件进行监测;
当监测到陌生电话号码发来的短信时,生成提示用户对陌生电话号码进行标注的提示信息;
接收用户对短信的标注类别。
可选地,监测到陌生电话号码发来的短信,包括:
获取当前接收的短信对应的电话号码;
确定当前接收到的短信对应的电话号码不属于预设的黑名单或者白名单中的电话号码时,确定电话号码为陌生电话号码。
可选地,接收至少一个客户端上报的至少一种类别的短信之前,还包括:
获取各个客户端所在通信终端的电话号码的归属地和/或地区编码号段;
对所述各个客户端所在通信终端中的短信接收事件进行监测;
判断当前接收到的短信对应的电话号码的归属地和/或地区编码号段是否与所述通信终端的电话号码的归属地和/或地区编码号段相同,如果不相同,则将所述当前接收到的短信标注为所述多种类别中的指定类别。
可选地,接收至少一个客户端上报的至少一种类别的短信之前,还包括:
获取各个客户端所在通信终端当前所在地信息;
对所述各个客户端所在通信终端中的短信接收事件进行监测;
判断当前接收到的短信对应的电话号码的归属地是否与所述通信终端当前所在地相同,如果不相同,则将所述当前接收到的短信标注为所述多种类别中的指定类别。
可选地,接收至少一个客户端上报的至少一种类别的短信之前,还包括:
获取各个客户端所在通信终端中保存的通讯录信息;
对所述各个客户端所在通信终端中的短信接收事件进行监测;
判断所述通讯录中是否存在与当前接收到的短信对应的电话号码具有相同归属地和/或地区编码号段的电话号码,如果不存在,则将所述当前接收到的短信标注为所述多种类别中的指定类别。
可选地,将所述多种类别的短信作为训练语料对所述短信分类器进行训练,包括:
从所述多种类别的短信中提取属性特征;
将提取的属性特征和对应的短信类别输入所述短信分类器进行训练。
可选地,利用所述训练后的短信分类器将所述新短信标注为所述多种类别中的一种之后,还包括:
将标注的所述新短信的类别下发给所述新短信的目的地址对应的客户端。
可选地,将标注的所述新短信的类别下发给所述新短信的目的地址对应的客户端之后,还包括:
接收所述客户端提交的关于标注的所述新短信的类别的反馈信息;
根据所述反馈信息确定是否更新所述训练语料。
可选地,根据所述反馈信息确定是否更新所述训练语料,包括:
若所述反馈信息为所述新短信的类别为不同于标注类别的其他类别,则确定根据所述新短信的其他类别更新所述训练语料。
依据本发明的另一方面,还提供了一种标注短信类别的装置,包括:
构造模块,适于采用预置的短信分类规则,构造多分类的短信分类器,其中,所述短信分类器中的各个参数依据短信的属性特征进行设置;
获取模块,适于获取多种类别的短信,其中,每种类别的短信包含多条;
训练模块,适于将所述多种类别的短信作为训练语料对所述短信分类器进行训练,计算所述短信分类器中的各个参数,得到训练后的短信分类器;
标注模块,适于当接收到一新短信时,利用所述训练后的短信分类器将所述新短信标注为所述多种类别中的一种。
可选地,所述构造模块还适于:
采用线性分类库Liblinear构造多分类的短信分类器;或者,
采用支持向量机分类库Libsvm构造多分类的短信分类器。
可选地,所述构造模块还适于:
调用所述Liblinear中的动态分类库;
利用调用的动态分类库构造多分类的短信分类器。
可选地,所述获取模块还适于:
获取人工标注的多种类别的短信;或者,
接收至少一个客户端上报的至少一种类别的短信。
可选地,所述获取模块包括:
监测单元,适于在接收至少一个客户端上报的至少一种类别的短信之前,对各个客户端所在通信终端中的短信接收事件进行监测;
生成单元,适于当监测到陌生电话号码发来的短信时,生成提示用户对陌生电话号码进行标注的提示信息;
接收单元,适于接收用户对短信的标注类别。
可选地,所述监测单元还适于:
获取当前接收的短信对应的电话号码;
确定当前接收到的短信对应的电话号码不属于预设的黑名单或者白名单中的电话号码时,确定电话号码为陌生电话号码。
可选地,所述获取模块包括:
第一获取单元,适于在接收至少一个客户端上报的至少一种类别的短信之前,获取各个客户端所在通信终端的电话号码的归属地和/或地区编码号段;
监测单元,适于对所述各个客户端所在通信终端中的短信接收事件进行监测;
第一判断单元,适于判断当前接收到的短信对应的电话号码的归属地和/或地区编码号段是否与所述通信终端的电话号码的归属地和/或地区编码号段相同,如果不相同,则将所述当前接收到的短信标注为所述多种类别中的指定类别。
可选地,所述获取模块包括:
第二获取单元,适于在接收至少一个客户端上报的至少一种类别的短信之前,获取各个客户端所在通信终端当前所在地信息;
监测单元,适于对所述各个客户端所在通信终端中的短信接收事件进行监测;
第二判断单元,适于判断当前接收到的短信对应的电话号码的归属地是否与所述通信终端当前所在地相同,如果不相同,则将所述当前接收到的短信标注为所述多种类别中的指定类别。
可选地,所述获取模块包括:
第三获取单元,适于在接收至少一个客户端上报的至少一种类别的短信之前,获取各个客户端所在通信终端中保存的通讯录信息;
监测单元,适于对所述各个客户端所在通信终端中的短信接收事件进行监测;
第三判断单元,适于判断所述通讯录中是否存在与当前接收到的短信对应的电话号码具有相同归属地和/或地区编码号段的电话号码,如果不存在,则将所述当前接收到的短信标注为所述多种类别中的指定类别。
可选地,所述训练模块还适于:
从所述多种类别的短信内容中提取属性特征;
将提取的属性特征和对应的短信类别输入所述短信分类器进行训练。
可选地,所述装置还包括:
下发模块,适于在所述标注模块利用所述训练后的短信分类器将所述新短信标注为所述多种类别中的一种之后,将标注的所述新短信的类别下发给所述新短信的目的地址对应的客户端。
可选地,所述装置还包括:
接收模块,适于接收所述客户端提交的关于标注的所述新短信的类别的反馈信息;
处理模块,适于根据所述反馈信息确定是否更新所述训练语料。
可选地,所述处理模块还适于:
若所述反馈信息为所述新短信的类别为不同于标注类别的其他类别,则确定根据所述新短信的其他类别更新所述训练语料。
本发明实施例中,采用预置的短信分类规则,构造多分类的短信分类器,获取多种类别的短信,将多种类别的短信作为训练语料对短信分类器进行训练,计算短信分类器中的各个参数,得到训练后的短信分类器。之后,当接收到一新短信时,利用训练后的短信分类器将新短信标注为多种类别中的一种。由此,本发明实施例能够通过短信分类器对短信进行自动分类和标注,从而解决了现有技术中人工分类和标注费时费力、效率较低的问题。并且,本发明实施例提供的短信分类器是多分类的,能够将短信细分成多种类别,满足短信细分类的需求。进一步,由于多种类别的短信是人工事先标注好的或者客户端的用户提交的,其准确性很高,本发明实施例将多种类别的短信作为训练语料对短信分类器进行训练,保证了短信分类器模型的准确性。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
根据下文结合附图对本发明具体实施例的详细描述,本领域技术人员将会更加明了本发明的上述以及其他目的、优点和特征。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一实施例的标注短信类别的方法的流程图;
图2示出了根据本发明另一实施例的标注短信类别的方法的流程图;
图3示出了根据本发明一实施例的标注短信类别的装置的结构示意图;以及
图4示出了根据本发明另一实施例的标注短信类别的装置的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
为解决上述技术问题,本发明实施例提供了一种标注短信类别的方法。图1示出了根据本发明一实施例的标注短信类别的方法的流程图。参见图1,该方法至少可以包括步骤S102至步骤S108。
步骤S102,采用预置的短信分类规则,构造多分类的短信分类器,其中,该短信分类器中的各个参数依据短信的属性特征进行设置。
步骤S104,获取多种类别的短信,其中,每种类别的短信包含多条。
步骤S106,将多种类别的短信作为训练语料对短信分类器进行训练,计算短信分类器中的各个参数,得到训练后的短信分类器。
步骤S108,当接收到一新短信时,利用训练后的短信分类器将新短信标注为多种类别中的一种。
本发明实施例中,采用预置的短信分类规则,构造多分类的短信分类器,获取多种类别的短信,将多种类别的短信作为训练语料对短信分类器进行训练,计算短信分类器中的各个参数,得到训练后的短信分类器。之后,当接收到一新短信时,利用训练后的短信分类器将新短信标注为多种类别中的一种。由此,本发明实施例能够通过短信分类器对短信进行自动分类和标注,从而解决了现有技术中人工分类和标注费时费力、效率较低的问题。并且,本发明实施例提供的短信分类器是多分类的,能够将短信细分成多种类别,满足短信细分类的需求。进一步,由于多种类别的短信是人工事先标注好的或者客户端的用户提交的,其准确性很高,本发明实施例将多种类别的短信作为训练语料对短信分类器进行训练,保证了短信分类器模型的准确性。
本发明实施例提供的标注短信类别的方法可以应用在服务器端,即在服务器端构造多分类的短信分类器,进而利用训练语料对该多分类的短信分类器进行训练,计算短信分类器中的各个参数,得到训练后的短信分类器。之后,利用训练后的短信分类器对新短信进行分类和标注,将标注结果下发给客户端,这里的训练语料即训练样本。在本发明实施例中,客户端所在的通信终端可以开发一款应用程序与服务器端进行信息交互,该应用程序可以是一个独立的应用程序,也可以是另一应用程序中的一个功能模块。
上文步骤S102中提及的多分类,可以是诈骗类、房产中介类、广告推销类、响一声类、公司电话类、教育培训类、商家促销类或保险类等,本发明并不限于此。进一步,短信分类器中的各个参数依据短信的属性特征进行设置,例如,可以收集不同类别的短信中文本内容的关键词,即,收集某个或多个关键词代表一种类别的短信,如“教育”、“学习”、“艺术班”、“文化课培训”等关键词作为教育培训类的短信,进而根据这些关键词设置各个参数。又例如,可以收集短信发送方的电话号码,根据电话号码设置各个参数。再如,可以将关键词和电话号码进行结合,设置各个参数,等等。
这里,根据电话号码设置各个参数,举例来说,可以通过对电话号码进行分类的方式,即将电话号码的分类来表示短信的分类。另外,陌生号码所属的分类信息包括:号码归属地信息和号码所属领域信息,或者号码归属地信息、号码所属领域信息和号码所属使用者的信息。例如:“15210xxxxxx,我爱我家”,则通过预先训练的分类器,通过信息匹配,可以得知此号码的所属分类信息为房产中介。
服务器可以统计一个星期或者一个月等时间段内多个监测装置上传的同一陌生号码所属的类别,据此可确定该陌生号码的分类信息。例如,云端服务器在一周内接收6次监测装置上报的同一陌生号码,以及该陌生号码的类别,此时有五个监测装置上报的同一陌生号码所属类别为“房产中介”,一个监测装置上报的该陌生号码的类别为“快递”,此时,可判定该陌生号码的分类信息为“房产中介”。
在本发明实施例中,也可以通过用户设备举报信息确定陌生号码的分类,例如,通过接收用户设备的举报信息,获知来电号码的类型,或者通过判断某一号码拨打的号码多为陌生号码,且通话时间很短(例如,通话时间小于20秒)来确定该号码为骚扰号码。在确定出来电号码的类型之后,对该号码进行标注,从而确定出指示来电号码的类型的标注。
步骤S102中采用预置的短信分类规则,构造多分类的短信分类器,本发明实施例可以采用Liblinear(线性分类库)构造多分类的短信分类器,或者采用Libsvm(支持向量机分类库)构造多分类的短信分类器。进一步,在采用Liblinear构造多分类的短信分类器时,可以调用Liblinear中的动态分类库,利用调用的动态分类库构造多分类的短信分类器,从而实现了从二类分类模型到多类分类模型的构造。
进一步,步骤S104中获取多种类别的短信可以通过多种方式来实现,例如可以获取人工标注的多种类别的短信,或者接收至少一个客户端上报的至少一种类别的短信。由于人工事先标注分类好的或者客户端的用户提交的分类短信,其准确性很高,本发明实施例将这些类别的短信作为训练语料对短信分类器进行训练,保证了短信分类器模型的准确性。
在本发明一实施例中,接收至少一个客户端上报的至少一种类别的短信之前,可以对各个客户端所在通信终端中的短信接收事件进行监测,当监测到陌生电话号码发来的短信时,生成提示用户对陌生电话号码进行标注的提示信息,接收用户对短信的标注类别。这里,可以获取当前接收的短信对应的电话号码,确定当前接收到的短信对应的电话号码不属于预设的黑名单或者白名单中的电话号码时,确定电话号码为陌生电话号码。
在本实施例中,预先设置的黑名单、白名单中的具体内容本实施例不限定,为了能够根据预先设置的黑、白名单来筛选需要拦截或放行的通信信息,本实施例提供的方法中,黑名单包括需要拦截的号码,用于筛选需要拦截的短信,白名单包括可放行的号码,用于筛选需要放行的短信。预先设置黑名单/白名单时,可根据通讯录中记录的电话号码来设置黑名单/白名单中的号码,或者,将用户输入的号码设置为黑名单/白名单中的号码,本实施例不对设置黑名单/白名单的方式进行限定。
本发明实施例中,对各个客户端所在通信终端中的短信接收事件进行监测,在具体实现时,通信终端设备中的操作系统一般会为应用程序开放一些接口,供应用程序从系统中获取所需的信息。因此,在本发明实施例中,为了能够对通信终端的短信接收情况进行监测,可以在通信终端中运行一应用程序,然后就可以利用通信终端系统的这一特点,在操作系统中对应用程序进行注册。这样,当操作系统广播通知消息时,应用程序就能够收听到这种通知消息,并从中获取所需的信息。例如,当接收短信时,通信终端的操作系统就会广播该短信接收消息,并携带短信发送方的电话号码,这样,应用程序就能够监测到该事件,并从中获取到短信发送方的电话号码。
在本发明的另一实施例中,接收至少一个客户端上报的至少一种类别的短信之前,可以获取各个客户端所在通信终端的电话号码的归属地和/或地区编码号段,对各个客户端所在通信终端中的短信接收事件进行监测,判断当前接收到的短信对应的电话号码的归属地和/或地区编码号段是否与通信终端的电话号码的归属地和/或地区编码号段相同,如果不相同,则将当前接收到的短信标注为多种类别中的指定类别,如标记为陌生类别短信。
在本发明的又一实施例中,接收至少一个客户端上报的至少一种类别的短信之前,可以获取各个客户端所在通信终端当前所在地信息,对各个客户端所在通信终端中的短信接收事件进行监测,判断当前接收到的短信对应的电话号码的归属地是否与通信终端当前所在地相同,如果不相同,则将当前接收到的短信标注为多种类别中的指定类别。
在本发明的又一实施例中,接收至少一个客户端上报的至少一种类别的短信之前,可以获取各个客户端所在通信终端中保存的通讯录信息,对各个客户端所在通信终端中的短信接收事件进行监测,判断通讯录中是否存在与当前接收到的短信对应的电话号码具有相同归属地和/或地区编码号段的电话号码,如果不存在,则将当前接收到的短信标注为多种类别中的指定类别。
在步骤S104获取多种类别的短信之后,步骤S106中将多种类别的短信作为训练语料对短信分类器进行训练,本发明实施例提供了一种可选的方案,在该方案中,从多种类别的短信中提取属性特征,随后将提取的属性特征和对应的短信类别输入短信分类器进行训练。这里的属性特征可以是短信文本内容的关键词,短信发送方的电话号码、名称、姓名或电话号码类别等,本发明不作限制。
在本发明的另一实施例中,步骤S108中服务器端接收到一新短信时,利用训练后的短信分类器将新短信标注为多种类别中的一种。之后,服务器端还将标注的新短信的类别下发给新短信的目的地址对应的客户端。
此外,本发明实施例中,当服务器将标注的新短信的类别下发给新短信的目的地址对应的客户端之后,可以接收客户端提交的关于标注的新短信的类别的反馈信息,进而根据反馈信息确定是否更新训练语料。例如,若反馈信息为新短信的类别为不同于标注类别的其他类别,则需要确定根据新短信的其他类别更新训练语料,利用更新的训练语料对短信分类器进行训练,以便进一步优化短信分类器,提高短信分类器自动分类的准确率。
下面通过一具体实施例详细介绍本发明的标注短信类别的方法的实现过程。图2示出了根据本发明另一实施例的标注短信类别的方法的流程图。参见图2,该方法至少可以包括步骤S202至步骤S212。
步骤S202,采用Liblinear构造多分类的短信分类器,其中,该短信分类器中的各个参数依据短信内容的属性特征进行设置。
该步骤中,可以调用Liblinear中的动态分类库,利用调用的动态分类库构造多分类的短信分类器,从而实现从二类分类模型到多类分类模型的构造。此外,多分类可以是诈骗类、房产中介类、广告推销类、响一声类、公司电话类、教育培训类、商家促销类或保险类等,本发明不限于此。
步骤S204,获取人工标注的多种类别的短信,其中,每种类别的短信包含多条。此外,还可以接收至少一个客户端上报的至少一种类别的短信。
步骤S206,从多种类别的短信中提取属性特征。
该步骤中,属性特征可以是短信文本内容的关键词,短信发送方的电话号码、名称、姓名或电话号码类别等,本发明不作限制。
此外,还可以从属性特征为短信发送方的电话号码中提取通信行为的特征,对行为特征数据不进行限制,包括但不限于通话时间、通话时长、被挂断占比、呼入占比、通讯录联系人占比、非长途通话占比、请求通话时向对方的平均请求次数。例如,可以收集200个号码的通话行为(通信行为)的呼入占比(行为特征数据),以及每个号码对应的标签(属性),然后输入短信分类器,训练该短信分类器的各个参数。
在提取属性特征时,还可以对短信文本内容进行处理,例如,号码D发送的短信文本内容中包含有以下内容:“……六五八七三二四……”,预设的过滤规则中,规定需要将汉字数字转换为阿拉伯数字,则转换后的短信为“……6587324……”,对转换后的短信进行分词提取,可以顺利提取到“6587324”(词语),根据预设的诈骗号码库,可以发现该号码为诈骗号码,所以可将号码D分类到“诈骗号码”之下。
步骤S208,将提取的属性特征和对应的短信类别输入短信分类器进行训练,计算短信分类器中的各个参数,得到训练后的短信分类器。
步骤S210,当接收到一新短信时,利用训练后的短信分类器将新短信标注为多种类别中的一种。
步骤S212,将标注的新短信的类别下发给新短信的目的地址对应的客户端。
在步骤S212之后,本发明实施例可以接收客户端提交的关于标注的新短信的类别的反馈信息,进而根据反馈信息确定是否更新训练语料。例如,若反馈信息为新短信的类别为不同于标注类别的其他类别,则需要确定根据新短信的其他类别更新训练语料,利用更新的训练语料对短信分类器进行训练,以便进一步优化短信分类器,提高短信分类器自动分类的准确率。
另外,本发明实施例提供的上述方案在对短信进行标注后,可以关联该短信的电话号码,从而标注出电话号码的类别。这样,可以应用在来电秀以及各种骚扰电话提醒等手机安全产品中,以尽量避免用户受到骚扰电话的侵扰。例如,对于响一声电话或诈骗电话,一旦用户回拨则可能蒙受经济损失,对于一些房产中介、保险中介等的电话,用户可能根本不想收到类似人群的电话。利用本发明方案,可直接在来电显示中展示企业名称、Logo(标识)等信息,还可展示最近的促销活动等信息,这些信息都可以一并显示给接收到或者正在拨打该电话的用户,使得用户能够获得更丰富的信息,以给用户提供全面的信息提示和操作指导。
基于同一发明构思,本发明实施例还提供一种标注短信类别的装置。图3示出了根据本发明一实施例的标注短信类别的装置的结构示意图。参见图3,该装置至少可以包括:构造模块310、获取模块320、训练模块330以及标注模块340。
现介绍本发明实施例的标注短信类别的装置的各组成或器件的功能以及各部分间的连接关系:
构造模块310,适于采用预置的短信分类规则,构造多分类的短信分类器,其中,短信分类器中的各个参数依据短信的属性特征进行设置;
获取模块320,与构造模块310相耦合,适于获取多种类别的短信,其中,每种类别的短信包含多条;
训练模块330,与获取模块320相耦合,适于将多种类别的短信作为训练语料对短信分类器进行训练,计算短信分类器中的各个参数,得到训练后的短信分类器;
标注模块340,与训练模块330相耦合,适于当接收到一新短信时,利用训练后的短信分类器将新短信标注为多种类别中的一种。
在本发明一实施例中,构造模块310构造的多分类的短信分类器,其多分类可以是诈骗类、房产中介类、广告推销类、响一声类、公司电话类、教育培训类、商家促销类或保险类等,本发明不限于此。
在本发明一实施例中,上述构造模块310还适于:
采用Liblinear构造多分类的短信分类器;或者,
采用Libsvm构造多分类的短信分类器。
在本发明一实施例中,上述构造模块310还适于:
调用Liblinear中的动态分类库;
利用调用的动态分类库构造多分类的短信分类器。
在本发明一实施例中,上述获取模块320还适于:
获取人工标注的多种类别的短信;或者,
接收至少一个客户端上报的至少一种类别的短信。
在本发明一实施例中,上述获取模块320包括:
监测单元,适于在接收至少一个客户端上报的至少一种类别的短信之前,对各个客户端所在通信终端中的短信接收事件进行监测;
生成单元,适于当监测到陌生电话号码发来的短信时,生成提示用户对陌生电话号码进行标注的提示信息;
接收单元,适于接收用户对短信的标注类别。
在本发明一实施例中,上述监测单元还适于:
获取当前接收的短信对应的电话号码;
确定当前接收到的短信对应的电话号码不属于预设的黑名单或者白名单中的电话号码时,确定电话号码为陌生电话号码。
在本发明一实施例中,上述获取模块320包括:
第一获取单元,适于在接收至少一个客户端上报的至少一种类别的短信之前,获取各个客户端所在通信终端的电话号码的归属地和/或地区编码号段;
监测单元,适于对各个客户端所在通信终端中的短信接收事件进行监测;
第一判断单元,适于判断当前接收到的短信对应的电话号码的归属地和/或地区编码号段是否与通信终端的电话号码的归属地和/或地区编码号段相同,如果不相同,则将当前接收到的短信标注为多种类别中的指定类别。
在本发明一实施例中,上述获取模块320包括:
第二获取单元,适于在接收至少一个客户端上报的至少一种类别的短信之前,获取各个客户端所在通信终端当前所在地信息;
监测单元,适于对各个客户端所在通信终端中的短信接收事件进行监测;
第二判断单元,适于判断当前接收到的短信对应的电话号码的归属地是否与通信终端当前所在地相同,如果不相同,则将当前接收到的短信标注为多种类别中的指定类别。
在本发明一实施例中,上述获取模块320包括:
第三获取单元,适于在接收至少一个客户端上报的至少一种类别的短信之前,获取各个客户端所在通信终端中保存的通讯录信息;
监测单元,适于对各个客户端所在通信终端中的短信接收事件进行监测;
第三判断单元,适于判断通讯录中是否存在与当前接收到的短信对应的电话号码具有相同归属地和/或地区编码号段的电话号码,如果不存在,则将当前接收到的短信标注为多种类别中的指定类别。
在本发明一实施例中,上述训练模块330还适于:
从多种类别的短信中提取属性特征;
将提取的属性特征和对应的短信类别输入短信分类器进行训练。
在本发明一实施例中,如图4所示,图3展示的装置还可以包括:
下发模块350,与标注模块340相耦合,适于在标注模块340利用训练后的短信分类器将新短信标注为多种类别中的一种之后,将标注的新短信的类别下发给新短信的目的地址对应的客户端。
在本发明一实施例中,如图4所示,图3展示的装置还可以包括:
接收模块360,与下发模块350相耦合,适于接收客户端提交的关于标注的新短信的类别的反馈信息;
处理模块370,与接收模块360相耦合,适于根据反馈信息确定是否更新训练语料。
在本发明一实施例中,上述处理模块370还适于:
若反馈信息为新短信的类别为不同于标注类别的其他类别,则确定根据新短信的其他类别更新训练语料。
根据上述任意一个优选实施例或多个优选实施例的组合,本发明实施例能够达到如下有益效果:
本发明实施例中,采用预置的短信分类规则,构造多分类的短信分类器,获取多种类别的短信,将多种类别的短信作为训练语料对短信分类器进行训练,计算短信分类器中的各个参数,得到训练后的短信分类器。之后,当接收到一新短信时,利用训练后的短信分类器将新短信标注为多种类别中的一种。由此,本发明实施例能够通过短信分类器对短信进行自动分类和标注,从而解决了现有技术中人工分类费时费力、效率较低的问题。并且,本发明实施例提供的短信分类器是多分类的,能够将短信细分成多种类别,满足短信细分类的需求。进一步,由于多种类别的短信是人工事先分类和标注好的或者客户端的用户提交的,其准确性很高,本发明实施例将多种类别的短信作为训练语料对短信分类器进行训练,保证了短信分类器模型的准确性。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的标注短信类别的装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
至此,本领域技术人员应认识到,虽然本文已详尽示出和描述了本发明的多个示例性实施例,但是,在不脱离本发明精神和范围的情况下,仍可根据本发明公开的内容直接确定或推导出符合本发明原理的许多其他变型或修改。因此,本发明的范围应被理解和认定为覆盖了所有这些其他变型或修改。
本发明实施例还公开了:A1、一种标注短信类别的方法,包括:
采用预置的短信分类规则,构造多分类的短信分类器,其中,所述短信分类器中的各个参数依据短信的属性特征进行设置;
获取多种类别的短信,其中,每种类别的短信包含多条;
将所述多种类别的短信作为训练语料对所述短信分类器进行训练,计算所述短信分类器中的各个参数,得到训练后的短信分类器;
当接收到一新短信时,利用所述训练后的短信分类器将所述新短信标注为所述多种类别中的一种。
A2、根据A1所述的方法,其中,所述采用预置的短信分类规则,构造多分类的短信分类器,包括:
采用线性分类库Liblinear构造多分类的短信分类器;或者,
采用支持向量机分类库Libsvm构造多分类的短信分类器。
A3、根据A2所述的方法,其中,采用线性分类库Liblinear构造多分类的短信分类器,包括:
调用所述Liblinear中的动态分类库;
利用调用的动态分类库构造多分类的短信分类器。
A4、根据A1-A3任一项所述的方法,其中,所述获取多种类别的短信,包括:
获取人工标注的多种类别的短信;或者,
接收至少一个客户端上报的至少一种类别的短信。
A5、根据A4所述的方法,其中,接收至少一个客户端上报的至少一种类别的短信之前,还包括:
对各个客户端所在通信终端中的短信接收事件进行监测;
当监测到陌生电话号码发来的短信时,生成提示用户对陌生电话号码进行标注的提示信息;
接收用户对短信的标注类别。
A6、根据A5所述的方法,其中,监测到陌生电话号码发来的短信,包括:
获取当前接收的短信对应的电话号码;
确定当前接收到的短信对应的电话号码不属于预设的黑名单或者白名单中的电话号码时,确定电话号码为陌生电话号码。
A7、根据A4所述的方法,其中,接收至少一个客户端上报的至少一种类别的短信之前,还包括:
获取各个客户端所在通信终端的电话号码的归属地和/或地区编码号段;
对所述各个客户端所在通信终端中的短信接收事件进行监测;
判断当前接收到的短信对应的电话号码的归属地和/或地区编码号段是否与所述通信终端的电话号码的归属地和/或地区编码号段相同,如果不相同,则将所述当前接收到的短信标注为所述多种类别中的指定类别。
A8、根据A4所述的方法,其中,接收至少一个客户端上报的至少一种类别的短信之前,还包括:
获取各个客户端所在通信终端当前所在地信息;
对所述各个客户端所在通信终端中的短信接收事件进行监测;
判断当前接收到的短信对应的电话号码的归属地是否与所述通信终端当前所在地相同,如果不相同,则将所述当前接收到的短信标注为所述多种类别中的指定类别。
A9、根据A4所述的方法,其中,接收至少一个客户端上报的至少一种类别的短信之前,还包括:
获取各个客户端所在通信终端中保存的通讯录信息;
对所述各个客户端所在通信终端中的短信接收事件进行监测;
判断所述通讯录中是否存在与当前接收到的短信对应的电话号码具有相同归属地和/或地区编码号段的电话号码,如果不存在,则将所述当前接收到的短信标注为所述多种类别中的指定类别。
A10、根据A1-A9任一项所述的方法,其中,将所述多种类别的短信作为训练语料对所述短信分类器进行训练,包括:
从所述多种类别的短信中提取属性特征;
将提取的属性特征和对应的短信类别输入所述短信分类器进行训练。
A11、根据A1-A10任一项所述的方法,其中,利用所述训练后的短信分类器将所述新短信标注为所述多种类别中的一种之后,还包括:
将标注的所述新短信的类别下发给所述新短信的目的地址对应的客户端。
A12、根据A11所述的方法,其中,将标注的所述新短信的类别下发给所述新短信的目的地址对应的客户端之后,还包括:
接收所述客户端提交的关于标注的所述新短信的类别的反馈信息;
根据所述反馈信息确定是否更新所述训练语料。
A13、根据A12所述的方法,其中,根据所述反馈信息确定是否更新所述训练语料,包括:
若所述反馈信息为所述新短信的类别为不同于标注类别的其他类别,则确定根据所述新短信的其他类别更新所述训练语料。
B14、一种标注短信类别的装置,包括:
构造模块,适于采用预置的短信分类规则,构造多分类的短信分类器,其中,所述短信分类器中的各个参数依据短信的属性特征进行设置;
获取模块,适于获取多种类别的短信,其中,每种类别的短信包含多条;
训练模块,适于将所述多种类别的短信作为训练语料对所述短信分类器进行训练,计算所述短信分类器中的各个参数,得到训练后的短信分类器;
标注模块,适于当接收到一新短信时,利用所述训练后的短信分类器将所述新短信标注为所述多种类别中的一种。
B15、根据B14所述的装置,其中,所述构造模块还适于:
采用线性分类库Liblinear构造多分类的短信分类器;或者,
采用支持向量机分类库Libsvm构造多分类的短信分类器。
B16、根据B15所述的装置,其中,所述构造模块还适于:
调用所述Liblinear中的动态分类库;
利用调用的动态分类库构造多分类的短信分类器。
B17、根据B14-B16任一项所述的装置,其中,所述获取模块还适于:
获取人工标注的多种类别的短信;或者,
接收至少一个客户端上报的至少一种类别的短信。
B18、根据B17所述的装置,其中,所述获取模块包括:
监测单元,适于在接收至少一个客户端上报的至少一种类别的短信之前,对各个客户端所在通信终端中的短信接收事件进行监测;
生成单元,适于当监测到陌生电话号码发来的短信时,生成提示用户对陌生电话号码进行标注的提示信息;
接收单元,适于接收用户对短信的标注类别。
B19、根据B18所述的装置,其中,所述监测单元还适于:
获取当前接收的短信对应的电话号码;
确定当前接收到的短信对应的电话号码不属于预设的黑名单或者白名单中的电话号码时,确定电话号码为陌生电话号码。
B20、根据B17所述的装置,其中,所述获取模块包括:
第一获取单元,适于在接收至少一个客户端上报的至少一种类别的短信之前,获取各个客户端所在通信终端的电话号码的归属地和/或地区编码号段;
监测单元,适于对所述各个客户端所在通信终端中的短信接收事件进行监测;
第一判断单元,适于判断当前接收到的短信对应的电话号码的归属地和/或地区编码号段是否与所述通信终端的电话号码的归属地和/或地区编码号段相同,如果不相同,则将所述当前接收到的短信标注为所述多种类别中的指定类别。
B21、根据B17所述的装置,其中,所述获取模块包括:
第二获取单元,适于在接收至少一个客户端上报的至少一种类别的短信之前,获取各个客户端所在通信终端当前所在地信息;
监测单元,适于对所述各个客户端所在通信终端中的短信接收事件进行监测;
第二判断单元,适于判断当前接收到的短信对应的电话号码的归属地是否与所述通信终端当前所在地相同,如果不相同,则将所述当前接收到的短信标注为所述多种类别中的指定类别。
B22、根据B17所述的装置,其中,所述获取模块包括:
第三获取单元,适于在接收至少一个客户端上报的至少一种类别的短信之前,获取各个客户端所在通信终端中保存的通讯录信息;
监测单元,适于对所述各个客户端所在通信终端中的短信接收事件进行监测;
第三判断单元,适于判断所述通讯录中是否存在与当前接收到的短信对应的电话号码具有相同归属地和/或地区编码号段的电话号码,如果不存在,则将所述当前接收到的短信标注为所述多种类别中的指定类别。
B23、根据B14-B22任一项所述的装置,其中,所述训练模块还适于:
从所述多种类别的短信中提取属性特征;
将提取的属性特征和对应的短信类别输入所述短信分类器进行训练。
B24、根据B14-B23任一项所述的装置,其中,还包括:
下发模块,适于在所述标注模块利用所述训练后的短信分类器将所述新短信标注为所述多种类别中的一种之后,将标注的所述新短信的类别下发给所述新短信的目的地址对应的客户端。
B25、根据B24所述的装置,其中,还包括:
接收模块,适于接收所述客户端提交的关于标注的所述新短信的类别的反馈信息;
处理模块,适于根据所述反馈信息确定是否更新所述训练语料。
B26、根据B25所述的装置,其中,所述处理模块还适于:
若所述反馈信息为所述新短信的类别为不同于标注类别的其他类别,则确定根据所述新短信的其他类别更新所述训练语料。

Claims (10)

1.一种标注短信类别的方法,包括:
采用预置的短信分类规则,构造多分类的短信分类器,其中,所述短信分类器中的各个参数依据短信的属性特征进行设置;
获取多种类别的短信,其中,每种类别的短信包含多条;
将所述多种类别的短信作为训练语料对所述短信分类器进行训练,计算所述短信分类器中的各个参数,得到训练后的短信分类器;
当接收到一新短信时,利用所述训练后的短信分类器将所述新短信标注为所述多种类别中的一种。
2.根据权利要求1所述的方法,其中,所述采用预置的短信分类规则,构造多分类的短信分类器,包括:
采用线性分类库Liblinear构造多分类的短信分类器;或者,
采用支持向量机分类库Libsvm构造多分类的短信分类器。
3.根据权利要求2所述的方法,其中,采用线性分类库Liblinear构造多分类的短信分类器,包括:
调用所述Liblinear中的动态分类库;
利用调用的动态分类库构造多分类的短信分类器。
4.根据权利要求1-3任一项所述的方法,其中,所述获取多种类别的短信,包括:
获取人工标注的多种类别的短信;或者,
接收至少一个客户端上报的至少一种类别的短信。
5.根据权利要求1-4任一项所述的方法,其中,将所述多种类别的短信作为训练语料对所述短信分类器进行训练,包括:
从所述多种类别的短信中提取属性特征;
将提取的属性特征和对应的短信类别输入所述短信分类器进行训练。
6.根据权利要求1-5任一项所述的方法,其中,利用所述训练后的短信分类器将所述新短信标注为所述多种类别中的一种之后,还包括:
将标注的所述新短信的类别下发给所述新短信的目的地址对应的客户端。
7.根据权利要求6所述的方法,其中,将标注的所述新短信的类别下发给所述新短信的目的地址对应的客户端之后,还包括:
接收所述客户端提交的关于标注的所述新短信的类别的反馈信息;
根据所述反馈信息确定是否更新所述训练语料。
8.根据权利要求7所述的方法,其中,根据所述反馈信息确定是否更新所述训练语料,包括:
若所述反馈信息为所述新短信的类别为不同于标注类别的其他类别,则确定根据所述新短信的其他类别更新所述训练语料。
9.一种标注短信类别的装置,包括:
构造模块,适于采用预置的短信分类规则,构造多分类的短信分类器,其中,所述短信分类器中的各个参数依据短信的属性特征进行设置;
获取模块,适于获取多种类别的短信,其中,每种类别的短信包含多条;
训练模块,适于将所述多种类别的短信作为训练语料对所述短信分类器进行训练,计算所述短信分类器中的各个参数,得到训练后的短信分类器;
标注模块,适于当接收到一新短信时,利用所述训练后的短信分类器将所述新短信标注为所述多种类别中的一种。
10.根据权利要求9所述的装置,其中,所述构造模块还适于:
采用线性分类库Liblinear构造多分类的短信分类器;或者,
采用支持向量机分类库Libsvm构造多分类的短信分类器。
CN201510484721.9A 2015-08-07 2015-08-07 标注短信类别的方法及装置 Pending CN105101124A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510484721.9A CN105101124A (zh) 2015-08-07 2015-08-07 标注短信类别的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510484721.9A CN105101124A (zh) 2015-08-07 2015-08-07 标注短信类别的方法及装置

Publications (1)

Publication Number Publication Date
CN105101124A true CN105101124A (zh) 2015-11-25

Family

ID=54580473

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510484721.9A Pending CN105101124A (zh) 2015-08-07 2015-08-07 标注短信类别的方法及装置

Country Status (1)

Country Link
CN (1) CN105101124A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105516499A (zh) * 2015-12-14 2016-04-20 北京奇虎科技有限公司 一种对短信进行分类的方法、装置、通信终端及服务器
CN105573978A (zh) * 2015-12-10 2016-05-11 温州雏鹰科技有限公司 短信文本信息处理方法以及装置
WO2018023618A1 (zh) * 2016-08-04 2018-02-08 汤隆初 一种分类短信时的技术权益提醒方法和手机
CN107770738A (zh) * 2016-08-23 2018-03-06 中国电信股份有限公司 用于实现短信自动分类的方法和用户终端
CN109284385A (zh) * 2018-10-15 2019-01-29 平安科技(深圳)有限公司 基于机器学习的文本分类方法及终端设备
CN111522942A (zh) * 2020-03-18 2020-08-11 大箴(杭州)科技有限公司 文本分类模型的训练方法、装置、存储介质及计算机设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101447984A (zh) * 2008-11-28 2009-06-03 电子科技大学 一种自反馈垃圾信息过滤方法
CN101516071A (zh) * 2008-02-18 2009-08-26 中国移动通信集团重庆有限公司 垃圾短消息的分类方法
CN101699432A (zh) * 2009-11-13 2010-04-28 黑龙江工程学院 基于排序策略的信息过滤系统
CN101794303A (zh) * 2010-02-11 2010-08-04 重庆邮电大学 采用特征扩展分类文本及构造文本分类器的方法和装置
CN102024045A (zh) * 2010-12-14 2011-04-20 成都市华为赛门铁克科技有限公司 信息分类处理方法、装置和终端
CN102194013A (zh) * 2011-06-23 2011-09-21 上海毕佳数据有限公司 一种基于领域知识的短文本分类方法及文本分类系统
CN103500195A (zh) * 2013-09-18 2014-01-08 小米科技有限责任公司 分类器更新方法、装置、系统及设备
CN103957516A (zh) * 2014-05-13 2014-07-30 北京网秦天下科技有限公司 垃圾短信过滤方法及引擎
CN104050240A (zh) * 2014-05-26 2014-09-17 北京奇虎科技有限公司 一种确定搜索查询词类别属性的方法和装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101516071A (zh) * 2008-02-18 2009-08-26 中国移动通信集团重庆有限公司 垃圾短消息的分类方法
CN101447984A (zh) * 2008-11-28 2009-06-03 电子科技大学 一种自反馈垃圾信息过滤方法
CN101699432A (zh) * 2009-11-13 2010-04-28 黑龙江工程学院 基于排序策略的信息过滤系统
CN101794303A (zh) * 2010-02-11 2010-08-04 重庆邮电大学 采用特征扩展分类文本及构造文本分类器的方法和装置
CN102024045A (zh) * 2010-12-14 2011-04-20 成都市华为赛门铁克科技有限公司 信息分类处理方法、装置和终端
CN102194013A (zh) * 2011-06-23 2011-09-21 上海毕佳数据有限公司 一种基于领域知识的短文本分类方法及文本分类系统
CN103500195A (zh) * 2013-09-18 2014-01-08 小米科技有限责任公司 分类器更新方法、装置、系统及设备
CN103957516A (zh) * 2014-05-13 2014-07-30 北京网秦天下科技有限公司 垃圾短信过滤方法及引擎
CN104050240A (zh) * 2014-05-26 2014-09-17 北京奇虎科技有限公司 一种确定搜索查询词类别属性的方法和装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105573978A (zh) * 2015-12-10 2016-05-11 温州雏鹰科技有限公司 短信文本信息处理方法以及装置
CN105516499A (zh) * 2015-12-14 2016-04-20 北京奇虎科技有限公司 一种对短信进行分类的方法、装置、通信终端及服务器
CN105516499B (zh) * 2015-12-14 2019-05-10 北京奇虎科技有限公司 一种对短信进行分类的方法、装置、通信终端及服务器
WO2018023618A1 (zh) * 2016-08-04 2018-02-08 汤隆初 一种分类短信时的技术权益提醒方法和手机
CN107770738A (zh) * 2016-08-23 2018-03-06 中国电信股份有限公司 用于实现短信自动分类的方法和用户终端
CN107770738B (zh) * 2016-08-23 2021-06-04 中国电信股份有限公司 用于实现短信自动分类的方法和用户终端
CN109284385A (zh) * 2018-10-15 2019-01-29 平安科技(深圳)有限公司 基于机器学习的文本分类方法及终端设备
CN111522942A (zh) * 2020-03-18 2020-08-11 大箴(杭州)科技有限公司 文本分类模型的训练方法、装置、存储介质及计算机设备
CN111522942B (zh) * 2020-03-18 2023-09-22 大箴(杭州)科技有限公司 文本分类模型的训练方法、装置、存储介质及计算机设备

Similar Documents

Publication Publication Date Title
CN105101124A (zh) 标注短信类别的方法及装置
CN105516499B (zh) 一种对短信进行分类的方法、装置、通信终端及服务器
US20070233861A1 (en) Method and apparatus for implementing SMS SPAM filtering
CN104717674A (zh) 号码属性识别方法、装置、终端和服务器
CN104270521A (zh) 对来电号码进行处理的方法和移动终端
CN105138611A (zh) 短信类别识别方法及装置
CN103763690A (zh) 检测伪基站向移动终端发送短信息的方法和装置
CN105898001B (zh) 一种通信信息的处理方法、装置和服务器
CN103957512A (zh) 一种向移动终端发送商户推广信息的方法、装置和系统
CN105007171A (zh) 基于通信领域大数据的用户数据分析系统及方法
CN101309280B (zh) 信息过滤服务器、方法、系统及终端
CN104580093A (zh) 网站通知消息的处理方法、装置及系统
CN105791099A (zh) 消息提示方法、装置和系统
CN105589845B (zh) 垃圾文本识别方法、装置及系统
CN102088697A (zh) 垃圾短信的处理方法和系统
CN106648698A (zh) 一种展示消息通知的方法、装置及电子设备
CN103957516A (zh) 垃圾短信过滤方法及引擎
CN104243661A (zh) 确定来电号码的类型的方法、服务器和移动终端
CN105979101A (zh) 一种未读消息选择性推送的系统
JP2016092816A (ja) 発信経路情報提供方法およびシステム
CN105915440A (zh) 邮件识别方法及装置
KR20130082953A (ko) 보이스피싱, 원링, 스팸 전화 및 문자 발신정보 수집 및 광고를 이용한 보상과 활용 방법 및 장치
CN104951944B (zh) 一种产品扫描检查的方法以及一种产品检查的方法
CN110677825A (zh) 基于推广短信触达率的处理方法以及装置、存储介质
CN106899947A (zh) 短消息清理方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20151125

RJ01 Rejection of invention patent application after publication