CN101895828B - 一种短消息监控系统及方法 - Google Patents

一种短消息监控系统及方法 Download PDF

Info

Publication number
CN101895828B
CN101895828B CN2009100841383A CN200910084138A CN101895828B CN 101895828 B CN101895828 B CN 101895828B CN 2009100841383 A CN2009100841383 A CN 2009100841383A CN 200910084138 A CN200910084138 A CN 200910084138A CN 101895828 B CN101895828 B CN 101895828B
Authority
CN
China
Prior art keywords
arbitration
short message
interface unit
result
modules
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2009100841383A
Other languages
English (en)
Other versions
CN101895828A (zh
Inventor
赵阳
陈苏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Luoyuan Product Quality Inspection Institute
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN2009100841383A priority Critical patent/CN101895828B/zh
Priority to PCT/CN2009/074516 priority patent/WO2010133063A1/zh
Publication of CN101895828A publication Critical patent/CN101895828A/zh
Application granted granted Critical
Publication of CN101895828B publication Critical patent/CN101895828B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/02Network architectures or network communication protocols for network security for separating internal from external traffic, e.g. firewalls
    • H04L63/0227Filtering policies
    • H04L63/0236Filtering by address, protocol, port number or service, e.g. IP-address or URL
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/58Message adaptation for wireless communication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/12Messaging; Mailboxes; Announcements

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种短消息监控系统,该系统中,接口单元用于根据各个仲裁单元返回的匹配后的仲裁结果进行加权运算,并判断出模糊短消息为违规短消息;仲裁单元用于经由接口单元的转发获取到模糊短消息;根据不同类别的仲裁规则分别与模糊短消息匹配,并将匹配后的各个仲裁结果返回接口单元。本发明还公开了一种短消息监控方法,该方法包括:仲裁单元根据不同类别的仲裁规则分别与所述模糊短消息匹配,并将匹配后的各个仲裁结果返回接口单元;接口单元根据匹配后的各个仲裁结果进行加权运算;当运算结果小于设置的第一阀值时,判断出模糊短消息为违规短消息。采用本发明的系统及方法,改善了对模糊短消息的监控能力。

Description

一种短消息监控系统及方法
技术领域
本发明涉及短消息监控技术,尤其涉及一种基于机器学习仲裁结果的短消息监控系统及方法。
背景技术
当前,各种监控系统已经在短信监控、彩信监控等各种领域中充分得到使用,其中也包括垃圾短信监控系统,这里需要指出的是短信也可以称为短消息。大多数垃圾短消息监控系统都是基于设置的有限关键字、和流量统计计数的监控规则实现对垃圾短消息的监控,比如,当达到设置的流量统计计数时确定当前短消息为垃圾短消息。
随着时代的发展,用户发送消息的行为和内容发生了很大的变化,呈现多样化和复杂化的特点,仅仅凭现有流量和有限的关键字这种仅体现简单逻辑的监控规则,是无法正确判断出短消息是否为垃圾短消息的。这里,通过流量规则和简单的关键字规则这种现有的监控规则,无法正确判断出是否为垃圾短消息的可疑消息称为模糊短消息。如果无上限的不断增加关键字的数量,以改善对模糊短消息的监控能力,则会大大影响监控系统的实时性能。目前,针对如何有效地判断出模糊短消息是否为垃圾短消息,并实现对垃圾短消息的监控,尚不存在有效的解决方案。
发明内容
有鉴于此,本发明的主要目的在于提供一种短消息监控系统及方法,改善了对模糊短消息的监控能力,能有效地判断出模糊短消息是否为垃圾短消息,并实现对垃圾短消息的监控。
为达到上述目的,本发明的技术方案是这样实现的:
一种短消息监控系统,该系统包括:接口单元和仲裁单元;其中,
接口单元,用于将模糊短消息转发给仲裁单元进行仲裁;根据所述仲裁单元返回的匹配后的各个仲裁结果进行加权运算;在运算结果小于设置的第一阀值状态下,判断出模糊短消息为违规短消息;
仲裁单元,用于经由所述接口单元的转发获取到模糊短消息;根据不同类别的仲裁规则分别与模糊短消息匹配,并将匹配后的各个仲裁结果返回接口单元。
其中,所述仲裁规则包括:关键字规则、用户号码类型信息规则、用户号段信息规则。
其中,所述仲裁单元,进一步包括至少两个仲裁模块,且各个仲裁模块中各自包含的所述仲裁规则分别属于不同类别;各个仲裁模块,用于分别根据各自包含的所述仲裁规则与模糊短消息匹配,并将匹配后的各个仲裁结果返回所述接口单元。
其中,所述各个仲裁模块,进一步用于分别根据所述各个仲裁结果对所述模糊短消息进行判断,并获得通过各个仲裁模块针对所述模糊短消息的判断结果;
获取通过所述接口单元针对所述模糊短消息的判断结果,在设置的系统运行时间内,在当前仲裁模块与接口单元判断结果相同的概率大于第一期望值状态下,增加当前仲裁模块的仲裁权值;在当前仲裁模块与接口单元判断结果相同的概率小于第一期望值状态下,减少当前仲裁模块的仲裁权值;将修改后的仲裁权值返回接口单元进行仲裁权值的更新。
其中,所述接口单元,进一步用于进行所述加权运算时所采用的运算公式为: Result = Σ i = 1 n Result i × ω i ; 其中,Result为所述运算结果,Resulti为所述各个仲裁结果,ωi为所述各个仲裁模块的仲裁权值,n为仲裁模块的个数。
其中,所述各个仲裁模块,进一步用于在所述仲裁结果大于设置的第二阀值状态下,判断出所述模糊短消息为违规短消息;其中,所述第二阀值为所述第一阀值的1/n倍;n为仲裁模块的个数。
其中,所述接口单元,进一步用于在设置的系统运行时间内,在接口单元判断出违规短消息的概率大于第二期望值1倍的状态下,增加当前第一阀值;在接口单元判断出违规短消息的概率小于第二期望值1倍的状态下,减少当前第一阀值;将修改后的第一阀值返回所述各个仲裁模块进行更新。
一种短消息监控方法,该方法包括:
仲裁单元根据不同类别的仲裁规则分别与所述模糊短消息匹配,并将匹配后的各个仲裁结果返回接口单元;
接口单元根据匹配后的各个仲裁结果进行加权运算;当运算结果小于设置的第一阀值时,判断出模糊短消息为违规短消息。
其中,所述仲裁规则包括:关键字规则、用户号码类型信息规则、用户号段信息规则。
其中,当所述仲裁单元包括至少两个仲裁模块,且各个仲裁模块中各自包含的所述仲裁规则分别属于不同类别情况下,所述仲裁单元进行所述匹配进一步包括:各个仲裁模块分别根据各自包含的所述仲裁规则与模糊短消息匹配,并将匹配后的各个仲裁结果返回所述接口单元。
其中,该方法进一步包括:
A、所述各个仲裁模块分别根据所述各个仲裁结果对所述模糊短消息进行判断,并获得通过各个仲裁模块针对所述模糊短消息的判断结果;
B、获取通过所述接口单元针对所述模糊短消息的判断结果;在设置的系统运行时间内,在当前仲裁模块与接口单元判断结果相同的概率大于第一期望值情况下,增加当前仲裁模块的仲裁权值;在当前仲裁模块与接口单元判断结果相同的概率小于第一期望值情况下,减少当前仲裁模块的仲裁权值;将修改后的仲裁权值返回接口单元进行仲裁权值的更新;
C、接口单元根据返回的更新后的仲裁权值进行加权运算,并继续执行针对所述模糊短消息的判断。
其中,所述接口单元进行所述加权运算时所采用的运算公式为: Result = Σ i = 1 n Result i × ω i ; 其中,Result为所述运算结果,Resulti为所述各个仲裁结果,ωi为所述各个仲裁模块的仲裁权值,n为仲裁模块的个数。
其中,所述A中,所述各个仲裁模块分别根据所述各个仲裁结果对所述模糊短消息进行判断进一步包括:
当所述仲裁结果大于设置的第二阀值时,判断出所述模糊短消息为违规短消息;其中,所述第二阀值为所述第一阀值的1/n倍;n为仲裁模块的个数。
其中,所述C后还包括:
在设置的系统运行时间内,在接口单元判断出违规短消息的概率大于第二期望值1倍的情况下,增加当前第一阀值;在接口单元判断出违规短消息的概率小于第二期望值1倍的情况下,减少当前第一阀值;将修改后的第一阀值返回各个仲裁模块进行更新。
本发明仲裁单元根据不同类别的仲裁规则分别与模糊短消息匹配,并将匹配后的各个仲裁结果返回接口单元;接口单元根据匹配后的各个仲裁结果进行加权运算;当运算结果小于设置的第一阀值时,判断出模糊短消息为违规短消息。
本发明提供了对模糊短消息的处理方案,是对当前监控系统很好的补充,可以在不影响当前监控系统功能的前提下大大提高其处理模糊短消息的能力,积极应对新的垃圾短消息对当前监控系统提出的挑战,并且最大限度的保证监控系统的实时性。采用本发明,克服了当前监控系统中对于模糊短消息无法判断或者依赖于人工判断的缺陷,提出根据不同类别的仲裁规则分别与模糊短消息匹配并进行自动判断的监控系统,以便更全面分析垃圾短消息的特征,并捕获违规短消息和违规用户。
附图说明
图1为本发明系统的组成结构示意图;
图2为本发明方法的实现流程示意图。
具体实施方式
本发明的基本思想是:根据不同类别的仲裁规则分别与模糊短消息匹配,并对模糊短消息进行自动判断。
下面结合附图对技术方案的实施作进一步的详细描述。
如图1所示,一种短消息监控系统,该系统包括:接口单元和仲裁单元。其中,接口单元,用于将模糊短消息转发给仲裁单元进行仲裁;根据仲裁单元返回的匹配后的各个仲裁结果进行加权运算;在运算结果小于接口单元中所设置的第一阀值状态下,判断出模糊短消息为违规短消息;在运算结果大于设置的第一阀值状态下,判断出模糊短消息为正常短消息。仲裁单元,用于经由接口单元的转发获取到模糊短消息;根据不同类别的仲裁规则分别与模糊短消息匹配,并将匹配后的各个仲裁结果返回接口单元,以便接口单元对匹配后的仲裁结果进行加权运算后,与接口单元中设置的第一阀值进行比较并对模糊短消息定性。其中,仲裁规则包括:关键字规则、用户号码类型信息规则、用户号段信息规则。
一种短消息监控系统,该系统还包括:监控单元和人机交互单元。其中,监控单元和人机交互单元都是现有的,在此对它们简单阐述,监控单元用于获取短消息并统计流量个数,将统计的短消息的流量个数与监控单元中所配置的流量规则匹配,以实现对短消息流量的过滤;将流量匹配成功的短消息发送给人机交互单元,以便人机交互单元按照关键字规则执行进一步的过滤。
人机交互单元,用于从监控单元接收流量匹配成功的短消息,将流量匹配成功的短消息的关键字与人机交互单元中所配置的关键字规则匹配,以实现对短消息内容的过滤;在匹配成功的状态下,判断出关键字匹配成功的短消息为违规短消息,并将发送违规短消息的用户直接添加入黑名单,后续该发送违规短消息的用户不能再发送短消息;在匹配不成功的状态下,判断出关键字匹配不成功的短消息为模糊短消息并发送给接口单元,以便后续通过接口单元与仲裁单元之间的交互执行进一步的过滤,并对模糊短消息定性,从而正确地、有效地判断出模糊短消息是违规短消息还是正常短消息。其中,所谓模糊短消息指:现阶段无法正确地、有效地判断出到底是违规短消息还是正常短消息的可疑消息。所涉及的违规短消息即为垃圾短消息,以下不作赘述。
这里需要指出的是,以上通过监控单元的流量规则进行过滤,以及通过人机交互单元的关键字规则进行过滤都是基于现有监控规则进行的过滤。尤其,这里的关键字规则是很简单的,区别于后续仲裁单元中采用的关键字规则。仲裁单元中采用的关键字规则是复杂的,不仅包括范围广泛的关键字,比如包括政治类、广告类、安全类中不同类别的关键字;而且还包括各个不同类别关键字之间复杂的逻辑运算关系。
针对以上本发明的系统组成结构而言,监控单元具体包括:监控处理模块和监控管理模块。其中,监控处理模块,用于从短信中心获取短消息并统计流量个数,将统计的短消息的流量个数与配置的流量规则匹配;将流量匹配成功的短消息发送给监控管理模块。监控管理模块,用于接收流量匹配成功的短消息并转发给人机交互单元;解析出流量匹配成功的短消息中的用户信息并存储。这里,所谓用户信息指:流量匹配成功的短消息中,所封装的所有与发送该短消息的用户有关的信息,包括:主、被叫用户号码;包含关键字的短消息具体内容;主、被叫用户号码类型;主、被叫用户号段信息等。
人机交互单元,进一步用于配置仲裁单元的仲裁规则并同步到仲裁单元,配置时可以采用命令行输入的方式进行配置,也可以采用批处理文件命令的方式进行配置,以便仲裁单元能及时获取到同步更新后的仲裁规则,根据同步更新后的仲裁规则,能及时地、正确地、有效地对模糊短消息进行仲裁。这里,仲裁规则即为上述涉及的包括关键字规则、用户号码类型信息规则、用户号段信息规则在内的多个类别的仲裁规则。人机交互单元,进一步用于显示包括模糊短消息、对模糊短消息仲裁后得到的判断结果在内的监控信息,以便对监控管理模块和接口单元返回人机交互单元的信息进行直观显示,及时调整人机交互单元中的配置信息,有利于高效的完成监控。
仲裁单元,进一步包括多个仲裁模块,且各个仲裁模块中各自包含的仲裁规则分别属于不同类别;各个仲裁模块,用于分别根据各自包含的仲裁规则与模糊短消息匹配,并将匹配后的各个仲裁结果返回接口单元。
这里,各个仲裁模块,进一步用于分别根据各个仲裁结果对模糊短消息进行判断,并获得通过各个仲裁模块针对所述模糊短消息的判断结果;获取通过接口单元针对模糊短消息的判断结果,在设置的系统运行时间内,在当前仲裁模块与接口单元判断结果相同的概率大于第一期望值状态下,增加当前仲裁模块的仲裁权值;在当前仲裁模块与接口单元判断结果相同的概率小于第一期望值状态下,减少当前仲裁模块的仲裁权值;将修改后的仲裁权值返回接口单元进行仲裁权值的更新。
相应地,接口单元,进一步用于根据返回的更新后的仲裁权值进行加权运算,并继续执行针对模糊短消息的判断。
这里,针对接口单元执行的加权运算而言,接口单元进一步用于进行加权运算时所采用的运算公式为: Result = Σ i = 1 n Result i × ω i ; 其中,Result为运算结果,Resulti为各个仲裁结果,ωi为各个仲裁模块的仲裁权值,n为仲裁模块的个数。
这里,针对各个仲裁模块根据各个仲裁结果对模糊短消息进行判断而言,各个仲裁模块进一步用于在仲裁结果大于设置的第二阀值状态下,判断出模糊短消息为违规短消息;其中,第二阀值为第一阀值的1/n倍。其中,各个仲裁结果即为Resulti
这里,针对仲裁模块的类型而言,仲裁模块具体包括:包含关键字规则的仲裁模块、包含用户号码类型信息规则的仲裁模块、包含用户号段信息规则的仲裁模块。其中,关键字规则包括:政治类、广告类、安全类中至少一种类别的关键字规则,也就是说,关键字规则既可以是这些类别中任一个单一类别的关键字规则,比如政治类的关键字规则;又可以是这些类别中组合类别的关键字规则,比如政治类加安全类这一组合类别的关键字规则,使用这种组合类别的关键字规则能表达复杂的逻辑运算关系,从而能更好地实现对模糊短消息的仲裁。用户号码类型信息规则包括:主、被叫用户号码类型信息规则。用户号段信息规则包括:主、被叫用户号段信息规则。
这里,针对接口单元根据更新后的仲裁权值继续执行针对模糊短消息的判断而言,接口单元进一步用于在设置的系统运行时间内,在接口单元判断出违规短消息的概率大于第二期望值1倍的状态下,增加当前第一阀值;在接口单元判断出违规短消息的概率小于第二期望值1倍的状态下,减少当前第一阀值。将修改后的第一阀值返回各个仲裁模块进行更新;通过与各个仲裁模块的交互,并更新仲裁权值、第一阀值、和实现接口单元针对模糊短消息的判断结果在第二期望值的上、下20%范围内收敛的方式,完成模糊短消息为违规短消息的判断。
综上所述,本发明系统的核心部件是仲裁单元,在仲裁单元包括至少一个仲裁模块情况下的仲裁模块,以及接口单元。针对仲裁模块而言,仲裁模块对模糊短消息是否为违规短消息的判断是:基于配置的关键字内容,以及模糊短消息中含有的关键字之间复杂逻辑关系的判断,并且加入了对模糊短消息主、被叫用户的状态判断等来综合的考量,并通过至少一个仲裁模块与接口单元的交互自动实现针对模糊短消息的判断。
进一步地,采用本发明,通过至少一个仲裁模块与接口单元的交互进行仲裁权值的学习,根据设置的系统运行时间系统运行一段时间后,最终可以得到结果最优的仲裁器和仲裁权值的组合。也就是说,通过至少一个仲裁模块与接口单元的交互,并更新仲裁权值、第一阀值、和实现接口单元针对模糊短消息的判断结果在第二期望值的上、下20%范围内收敛的方式,完成模糊短消息为违规短消息的判断。
如图2所示,一种短消息监控方法,该方法包括以下步骤:
步骤101、接口单元将模糊短消息转发给仲裁单元进行仲裁,仲裁单元根据不同类别的仲裁规则分别与模糊短消息匹配,并将匹配后的各个仲裁结果返回接口单元。
这里,仲裁规则包括:关键字规则、用户号码类型信息规则、用户号段信息规则。其中,关键字规则包括:政治类、广告类、安全类中至少一种类别的关键字规则;用户号码类型信息规则包括:主、被叫用户号码类型信息规则;用户号段信息规则包括:主、被叫用户号段信息规则。
步骤102、接口单元根据仲裁单元返回的匹配后的各个仲裁结果进行加权运算;在运算结果小于设置的第一阀值时,判断出模糊短消息为违规短消息。
这里,接口单元进行加权运算时所采用的运算公式为: Result = Σ i = 1 n Result i × ω i ; 其中,Result为运算结果,Resulti为各个仲裁结果,ωi为各个仲裁模块的仲裁权值,n为仲裁模块的个数。
针对由以上步骤101~步骤102所构成的技术方案而言,步骤101之前还可以包括:监控单元获取短消息并统计流量个数,将统计的短消息的流量个数与配置的流量规则匹配;将流量匹配成功的短消息发送给人机交互单元。之后,人机交互单元将流量匹配成功的短消息的关键字与配置的关键字规则匹配;将关键字匹配成功的短消息判断为违规短消息;将关键字匹配不成功的短消息判断为模糊短消息并发送给接口单元。
这里,人机交互单元进行关键字规则匹配之前还包括:初始配置仲裁规则并同步到仲裁单元。这里,当仲裁规则的配置修改后,人机交互单元将修改后的仲裁规则同步更新到仲裁单元。由于人机交互单元可以显示包括模糊短消息、对模糊短消息仲裁后得到的判断结果在内的监控信息,因此,在显示监控信息后,可以根据显示的监控信息有选择的修改仲裁规则的配置并同步更新到仲裁单元。
这里需要指出的是,当仲裁单元包括多个仲裁模块,且各个仲裁模块中各自包含的仲裁规则分别属于不同类别情况下,步骤101的处理过程进一步包括:各个仲裁模块分别根据各自包含的仲裁规则与模糊短消息匹配,并将匹配后的各个仲裁结果返回接口单元。
这里,步骤102后还包括:
步骤103、各个仲裁模块分别根据各个仲裁结果对模糊短消息进行判断,并获得通过各个仲裁模块针对模糊短消息的判断结果。
其中,各个仲裁模块分别根据各个仲裁结果对模糊短消息进行判断的具体处理过程包括:当仲裁结果大于设置的第二阀值时,判断出模糊短消息为违规短消息;其中,第二阀值为第一阀值的1/n倍,即第二阀值=1/n×第一阀值,且n为仲裁模块的个数。
步骤104、各个仲裁模块获取通过接口单元针对模糊短消息的判断结果。
步骤105、在设置的系统运行时间内,在当前仲裁模块与接口单元判断结果相同的概率大于第一期望值情况下,增加当前仲裁模块的仲裁权值;在当前仲裁模块与接口单元判断结果相同的概率小于第一期望值情况下,减少当前仲裁模块的仲裁权值;将修改后的仲裁权值返回接口单元进行仲裁权值的更新。
步骤106、接口单元根据返回的更新后的仲裁权值进行加权运算,并继续执行针对模糊短消息的判断。
这里,步骤106后还包括:
步骤107、在设置的系统运行时间内,在接口单元判断出违规短消息的概率大于第二期望值1倍的情况下,增加当前第一阀值;在接口单元判断出违规短消息的概率小于第二期望值1倍的情况下,减少当前第一阀值。
步骤108、接口单元将修改后的第一阀值返回各个仲裁模块进行更新;通过与各个仲裁模块的交互,并更新仲裁权值、第一阀值、和实现接口单元针对模糊短消息的判断结果在第二期望值的上、下20%范围内收敛的方式,完成模糊短消息为违规短消息的判断。
方法实施例一为:监控单元包括监控处理模块和监控管理模块,仲裁单元包括多个仲裁模块情况下,无需仲裁模块与接口单元的多次交互进行仲裁权值的学习及更新,本方法实施例中,实现短消息的监控流程包括以下步骤:
步骤201、监控处理模块从短消息中心接收用户发送的短消息。
这里,短消息中封装有主、被叫用户号码;包含关键字的短消息具体内容;主、被叫用户号码类型;主、被叫用户号段信息等信息。
步骤202、监控处理模块对接收到的短消息进行统计计数,并与系统配置的流量规则进行匹配,将流量匹配成功的短消息发送给监控管理模块,监控管理模块将流量匹配成功的短消息导入数据库存储,并将流量匹配成功的短消息发送给人机交互单元。这里,人机交互单元也可以称为控制台,流量匹配成功的短消息即为违规短消息,其所对应的用户为违规用户。
步骤203、人机交互单元显示违规用户,并对流量匹配成功的短消息的内容进行过滤,将流量匹配成功的短消息的关键字与人机交互单元中所配置的关键字规则匹配,以实现对短消息内容的过滤;在匹配成功的状态下,判断出关键字匹配成功的短消息为违规短消息;匹配不成功的状态下,判断出关键字匹配不成功的短消息为模糊短消息并发送给接口单元。
这里,人机交互单元中所配置的关键字规则与现有的关键字规则相同,也可以称为特定关键字规则。对含有特定关键字的违规短消息所对应的违规用户直接加入黑名单,后续该违规用户不能再发送短消息,对不含有特定关键字即主要包括政治类,安全类关键字的模糊短消息发送至接口单元处理。
步骤204、接口单元将需要仲裁的模糊短消息分别发送给n个仲裁模块,并配置好各个仲裁模块初始的仲裁权值,仲裁模块超时处理,第一阀值等信息后,等待各个仲裁模块的响应。
步骤205、各个仲裁模块对需仲裁的模糊短消息进行仲裁。
步骤206、各个仲裁器将仲裁结果返回至接口单元。
步骤207、接口单元根据各个仲裁模块返回的仲裁结果进行加权运算,与设置好的第一阀值进行比较及判断,并对模糊短消息进行定性。
这里,所谓对模糊短消息进行定性指:判断出模糊短消息的性质到底是违规短消息还是正常短消息。
步骤208、结束当前短消息监控流程。
方法实施例二为:仲裁单元包括多个仲裁模块情况下,需要仲裁模块与接口单元的多次交互进行仲裁权值的学习及更新,本方法实施例中,实现短消息的监控流程包括以下步骤:
步骤301、在短消息监控的人机交互单元完成系统基本属性配置、监控规则配置和仲裁模块的相关配置等,并进行监控规则的同步。
这里,举例来说,比如配置相关的流量和关键字规则;比如配置仲裁模块的号码,可以初始化为3个;配置各个仲裁模块的仲裁权值,可以初始化仲裁权值都为1;配置链路信息;配置超时处理信息,可以初始化为3秒,以判断发送短消息的用户是否为违规用户。
步骤302、各个仲裁模块导入针对仲裁模块的相关配置。
这里,导入的仲裁模块的相关配置中包括为仲裁模块配置的监控规则,监控规则包括关键字规则、用户类型信息规则、号段信息规则在内的至少一个类别的仲裁规则。针对关键字规则而言,这里仲裁模块中所配置的关键字规则与人机交互单元中人机交互单元中所配置的关键字规则不同,仲裁模块中所配置的关键字规则,其信息量很大,关键字基本包含:所有的政治类、广告类和安全类违规字符以及它们之间复杂的逻辑运算关系。针对用户类型信息规则而言,用户类型信息包含:所有的黑名单和白名单信息,在线计费系统(OCS)欠费用户信息,以及与营帐接口的数据包格式协议(H2)属性信息等用户类型信息。针对号段信息规则而言,号段信息包含:所有的预付费号段,本省号段,本网号段,特殊用户号段即白名单号段等。其中,用户类型信息规则主、被叫用户号码类型信息规则;用户号段信息规则包括:主、被叫用户号段信息规则。
步骤303、监控单元接收短消息中心的短消息,对短消息进行流量计数并与系统配置的流量规则进行匹配;将流量匹配成功的短消息确定为违规短消息,将达到该流量监控规则的违规短消息对应的违规用户通过人机交互单元进行显示。
步骤304、人机交互单元对违规短消息的内容进行过滤,也就是说,将流量匹配成功的短消息的关键字与人机交互单元中所配置的关键字规则匹配,以实现对短消息内容的过滤。
步骤305、过滤后产生的模糊短消息通过接口单元发送给各个仲裁模块进行仲裁处理,每个仲裁模块对需仲裁的模糊短消息进行仲裁。
这里,针对仲裁模块而言,初始化每个仲裁模块的仲裁结果为20,则仲裁模块可以分为以下五类,如下所示:
第一类仲裁模块为:包含关键字规则的仲裁模块,用于根据关键字规则对模糊短消息进行分类及仲裁,不同关键字根据其重要性不同划分为几个等级,分别为10分,8分,5分,2分四个等级。其中,政治类:如法轮功、天安门事件等配置为1类关键字;安全类:如自焚、静坐、手枪等配置为2类关键字;色情类:如成人、情色等配置为3类关键字;广告类:如卫星安装、发票等配置为4类关键字,并对各类逻辑关系关键字进行组合配置,如反对&共产党,色情&卫星安装,政府&(静坐|游行)等组合配置为高级别的关键字。对模糊短消息的内容进行所有关键字的匹配,对匹配到的关键字进行统计,对匹配得到的关键字进行扣分的仲裁处理,分数扣到0以后作为0分处理。
第二类仲裁模块为:包含主叫用户号码类型信息规则的主叫用户类型仲裁模块,用于根据主叫用户号码类型信息规则对主叫用户进行号码分类及仲裁。号码分为以下几个等级:白名单用户加10分、黑名单用户减20分、OCS欠费用户扣10分、H2属性为钻石卡用户的加10分、金卡用户加5、银卡用户加3分、普通卡用户不加分,对主被叫用户进行匹配后得到仲裁结果,分数扣到0以后作为0分处理。其中,钻石卡用户、金卡用户、银卡用户、普通卡用户是运营商在营帐系统中对用户所作的不同分级。
第三类仲裁模块为:包含被叫用户号码类型信息规则的被叫用户类型仲裁模块,用于根据被叫用户号码类型信息规则对被叫用户进行号码分类及仲裁。号码分为以下几个等级:白名单用户加10分、黑名单用户减20分、OCS欠费用户扣10分、H2属性为钻石卡用户的加10分、金卡用户加5、银卡用户加3分、普通卡不加分,对被叫用户进行匹配后得到仲裁结果,分数扣到0以后作为0分处理。
第四类仲裁模块为:包含主叫用户号段信息规则的主叫号段信息仲裁模块,用于根据主叫用户号段信息规则对主叫用户进行号段分类及仲裁。号段分为以下几个等级:VIP集团号段加10分、全球通号段加5分、梦网网关加5分、行业网关不加分、预付费号段不加分、外省号段减2分、外网号段减5分等,对主被叫用户进行匹配后得到仲裁结果,分数扣到0以后作为0分处理。上述这些号段信息全部是运营商配置的。其中,VIP集团号段是运营商对大的集团用户所提供的号段,号段内用户拨打电话资费低,且可以直接拨打短号;梦网网关是运营商直接经营的服务供应商;行业网关是非运营商经营的服务供应商;预付费号段是运营商设置的号段,号段中所有号码全部为预付费用户。
第五类仲裁模块为:包含被叫用户号段信息规则的被叫号段信息仲裁模块,用于根据被叫用户号段信息规则对被叫用户进行号段分类及仲裁。号段分为以下几个等级:VIP集团号段加10分、全球通号段加5分、梦网网关加5分、行业网关不加分、预付费号段不加分、外省号段减2分、外网号段减5分等,对被被叫用户进行匹配后得到仲裁结果,分数扣到0以后作为0分处理。
步骤306、各个仲裁模块将仲裁结果发送至接口单元,接口单元对仲裁结果进行加权运算。
在包括以上五类仲裁模块,仲裁模块个数为5情况下,加权运算采用的公式为:Result=Result1×ω1+Result2×ω2+Result3×ω3+Result4×ω4+Result5×ω5,其中,各个仲裁器的仲裁权值即ω1、ω2、ω3、ω4、ω5皆初始化为1,运算结果与设置的第一阈值进行比较,这里的第一阈值可以初始化为80。当运算结果小于设置的第一阀值时,判断出模糊短消息为违规短消息,否则为正常短消息。
步骤307、接口单元将运算结果返回至各个仲裁模块,仲裁模块首先将运算结果与设置的第二阀值比较,这里的各个仲裁模块的第二阀值是相同的,皆为接口单元设置的第一阈值的1/5倍。当运算结果小于设置的第二阀值时,判断出模糊短消息为正常短消息;当运算结果大于设置的第二阀值时,判断出模糊短消息为违规短消息。
步骤308、比较通过各个仲裁模块针对模糊短消息的判断结果与通过接口单元针对模糊短消息的判断结果是否相同,如果相同,则确定通过仲裁模块针对模糊短消息的判断结果正确,否则确定为错误。
步骤309、仲裁模块运行一段时间后进行权值学习,这段时间是指默认设置的系统运行时间,可以为1小时,将计算出的这段时间内当前仲裁模块判断正确的概率与第一期望值比较,这里的第一期望值可以设置为50%;如果当前仲裁模块判断正确的概率大于50%,则增加当前仲裁模块的仲裁权值,比如将下一阶段的仲裁权值增加0.1;如果当前仲裁模块判断正确的概率小于50%,则减少当前仲裁模块的仲裁权值,比如将下一阶段的仲裁权值减少0.1;将修改后的仲裁权值发送至接口单元,接口机进行仲裁权值的更新。
这里,计算当前仲裁模块判断正确的概率具体为:当前仲裁模块判断正确的概率=通过各个仲裁模块针对模糊短消息的判断结果正确的消息/判断的消息总量。
步骤310、接口机运行一段时间后,这段时间是指默认设置的系统运行时间,可以为1小时,将计算出的这段时间内违规短消息的概率与第二期望值比较,这里的第二期望值可以初始设置为40%,但不大于50%;如果违规短消息的概率小于第二期望值1倍的情况下,则减少当前第一阀值,比如将第一阀值减小5;如果违规短消息的概率大于第二期望值1倍的情况下,则增加当前第一阀值,比如将第一阀值增加5;将修改后的第一阀值发送至各个仲裁模块,各个仲裁模块进行第一阀值的更新。
步骤311、每天将24小时内违规短消息占总消息的百分比的结果写成文件,该文件即为包含接口单元针对模糊短消息的判断结果的文件,观察判断结果是否收敛在一个范围内,如果收敛的范围很小,且在第二期望值周围,比如在第二期望值的上、下20%范围内收敛,则认为系统的仲裁权值和第一、第二阈值训练结果正常;如果结果发散,则修改第二期望值后再进行训练,一天后再观察判断结果并进行相应的处理。
综上所述,采用本发明,在系统运行初期需要耗费一定时间进行训练,但是在训练出最优的期望值和仲裁权值后,系统对模糊短消息的自动仲裁结果相比较于现有的人工判断有了很大的提高,包括判断的准确性和自动化程度。对现有的短消息监控系统是一个很好的补充,同时可以分析用户发送垃圾短消息的一些行为习惯,对改进现有系统提供了一些经验。由于现有的短消息监控系统只能基于流量规则或简单的关键字规则,即上面所涉及到的人机交互单元中所配置的关键字规则进行监控,因此,很容易使监控失效,监控出违规短消息越来越少。如果一味降低流量的门限值会导致监控出来的违规短消息呈数量级增加,人工操作维护的工作量将会很大。新的违规短消息的内容层出不穷,仅仅增加有限的、个别的关键字必然无法满足监控的需求,特别是一些新的内容违规短消息的发送模式很难仅仅配置关键字进行监控。本发明正是增加了关键字之间的复杂运算关系后大大改善了系统的性能;而且本发明的监控系统是基于仲裁模块与接口单元之间的交互来通过机器自动地学习仲裁权值,从而能得到可靠的仲裁结果,对现有的监控系统是一个很大的改进。另外,本发明对违规短消息进行分类及仲裁,对发送数量仅仅达到流量规则,消息内容中不含有特定关键字的短消息即模糊短消息进行仲裁处理,由仲裁模块自动地对这类模糊短消息的消息内容,主、被叫号码类型,主、被叫号段类型等信息进行全面分析,最终对这类模糊短消息是否为垃圾短消息进行判断,采用本发明,比现有监控系统采用单一维护人员进行人工的、主观的判断方案,准确性和效率都有很大的提高。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (10)

1.一种短消息监控系统,其特征在于,该系统包括:接口单元和仲裁单元;其中,
接口单元,用于将模糊短消息转发给仲裁单元进行仲裁;根据所述仲裁单元返回的匹配后的各个仲裁结果进行加权运算;在运算结果小于设置的第一阀值状态下,判断出模糊短消息为违规短消息;
仲裁单元,用于经由所述接口单元的转发获取到模糊短消息;根据不同类别的仲裁规则分别与模糊短消息匹配,并将匹配后的各个仲裁结果返回接口单元;
所述仲裁单元,进一步包括至少两个仲裁模块,且各个仲裁模块中各自包含的所述仲裁规则分别属于不同类别;各个仲裁模块,用于分别根据各自包含的所述仲裁规则与模糊短消息匹配,并将匹配后的各个仲裁结果返回所述接口单元;
所述各个仲裁模块,进一步用于分别根据所述各个仲裁结果对所述模糊短消息进行判断,并获得通过各个仲裁模块针对所述模糊短消息的判断结果;获取通过所述接口单元针对所述模糊短消息的判断结果,在设置的系统运行时间内,在当前仲裁模块与接口单元判断结果相同的概率大于第一期望值状态下,增加当前仲裁模块的仲裁权值;在当前仲裁模块与接口单元判断结果相同的概率小于第一期望值状态下,减少当前仲裁模块的仲裁权值;将修改后的仲裁权值返回接口单元进行仲裁权值的更新。
2.根据权利要求1所述的系统,其特征在于,所述仲裁规则包括:关键字规则、用户号码类型信息规则、用户号段信息规则。
3.根据权利要求1所述的系统,其特征在于,所述接口单元,进一步用于进行所述加权运算时所采用的运算公式为:
Figure FDA00002083904100011
其中,Result为所述运算结果,Resulti为所述各个仲裁结果,ωi为所述各个仲裁模块的仲裁权值,n为仲裁模块的个数。
4.根据权利要求1所述的系统,其特征在于,所述各个仲裁模块,进一步用于在所述仲裁结果大于设置的第二阀值状态下,判断出所述模糊短消息为违规短消息;其中,所述第二阀值为所述第一阀值的1/n倍;n为仲裁模块的个数。
5.根据权利要求3所述的系统,其特征在于,所述接口单元,进一步用于在设置的系统运行时间内,在接口单元判断出违规短消息的概率大于第二期望值1倍的状态下,增加当前第一阀值;在接口单元判断出违规短消息的概率小于第二期望值1倍的状态下,减少当前第一阀值;将修改后的第一阀值返回所述各个仲裁模块进行更新。
6.一种短消息监控方法,其特征在于,该方法包括:
仲裁单元根据不同类别的仲裁规则分别与模糊短消息匹配,并将匹配后的各个仲裁结果返回接口单元;
接口单元根据匹配后的各个仲裁结果进行加权运算;当运算结果小于设置的第一阀值时,判断出模糊短消息为违规短消息;
当所述仲裁单元包括至少两个仲裁模块,且各个仲裁模块中各自包含的所述仲裁规则分别属于不同类别情况下,所述仲裁单元进行所述匹配进一步包括:各个仲裁模块分别根据各自包含的所述仲裁规则与模糊短消息匹配,并将匹配后的各个仲裁结果返回所述接口单元;
该方法进一步包括:
A、所述各个仲裁模块分别根据所述各个仲裁结果对所述模糊短消息进行判断,并获得通过各个仲裁模块针对所述模糊短消息的判断结果;
B、获取通过所述接口单元针对所述模糊短消息的判断结果;在设置的系统运行时间内,在当前仲裁模块与接口单元判断结果相同的概率大于第一期望值情况下,增加当前仲裁模块的仲裁权值;在当前仲裁模块与接口单元判断结果相同的概率小于第一期望值情况下,减少当前仲裁模块的仲裁权值;将修改后的仲裁权值返回接口单元进行仲裁权值的更新;
C、接口单元根据返回的更新后的仲裁权值进行加权运算,并继续执行针对所述模糊短消息的判断。
7.根据权利要求6所述的方法,其特征在于,所述仲裁规则包括:关键字规则、用户号码类型信息规则、用户号段信息规则。
8.根据权利要求6所述的方法,其特征在于,所述接口单元进行所述加权运算时所采用的运算公式为:
Figure FDA00002083904100031
其中,Result为所述运算结果,Resulti为所述各个仲裁结果,ωi为所述各个仲裁模块的仲裁权值,n为仲裁模块的个数。
9.根据权利要求6所述的方法,其特征在于,所述A中,所述各个仲裁模块分别根据所述各个仲裁结果对所述模糊短消息进行判断进一步包括:
当所述仲裁结果大于设置的第二阀值时,判断出所述模糊短消息为违规短消息;其中,所述第二阀值为所述第一阀值的1/n倍;n为仲裁模块的个数。
10.根据权利要求8所述的方法,其特征在于,所述C后还包括:
在设置的系统运行时间内,在接口单元判断出违规短消息的概率大于第二期望值1倍的情况下,增加当前第一阀值;在接口单元判断出违规短消息的概率小于第二期望值1倍的情况下,减少当前第一阀值;将修改后的第一阀值返回各个仲裁模块进行更新。
CN2009100841383A 2009-05-20 2009-05-20 一种短消息监控系统及方法 Expired - Fee Related CN101895828B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN2009100841383A CN101895828B (zh) 2009-05-20 2009-05-20 一种短消息监控系统及方法
PCT/CN2009/074516 WO2010133063A1 (zh) 2009-05-20 2009-10-19 一种短消息监控系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009100841383A CN101895828B (zh) 2009-05-20 2009-05-20 一种短消息监控系统及方法

Publications (2)

Publication Number Publication Date
CN101895828A CN101895828A (zh) 2010-11-24
CN101895828B true CN101895828B (zh) 2013-01-16

Family

ID=43104863

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009100841383A Expired - Fee Related CN101895828B (zh) 2009-05-20 2009-05-20 一种短消息监控系统及方法

Country Status (2)

Country Link
CN (1) CN101895828B (zh)
WO (1) WO2010133063A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102612007B (zh) * 2011-01-19 2015-06-24 中国电信股份有限公司 短信流量控制方法及装置
CN103067896B (zh) * 2013-01-17 2015-08-19 中国联合网络通信集团有限公司 垃圾短信过滤方法及装置
US20180197099A1 (en) * 2017-01-11 2018-07-12 Google Inc. User state predictions for presenting information
CN113965899B (zh) * 2021-12-21 2022-04-01 杭州云在线科技有限公司 一种检测短信扣量服务器及检测短信扣量的方法
CN115623485B (zh) * 2022-12-20 2023-04-07 杭州孝道科技有限公司 一种短信轰炸检测方法、系统、服务器及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1496655A2 (en) * 2003-06-20 2005-01-12 Microsoft Corporation Prevention of outgoing spam
CN1741526A (zh) * 2005-09-05 2006-03-01 北京启明星辰信息技术有限公司 网络异常流量的检测方法及系统
CN101136874A (zh) * 2007-07-25 2008-03-05 华南理工大学 基于综合决策的防垃圾邮件误过滤方法及系统
CN101335920A (zh) * 2008-07-15 2008-12-31 中国联合通信有限公司 基于主叫号码位置和发送内容的垃圾短消息识别系统及方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8396927B2 (en) * 2004-12-21 2013-03-12 Alcatel Lucent Detection of unwanted messages (spam)
CN101257671B (zh) * 2007-07-06 2010-12-08 浙江大学 基于内容的大规模垃圾短信实时过滤方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1496655A2 (en) * 2003-06-20 2005-01-12 Microsoft Corporation Prevention of outgoing spam
CN1741526A (zh) * 2005-09-05 2006-03-01 北京启明星辰信息技术有限公司 网络异常流量的检测方法及系统
CN101136874A (zh) * 2007-07-25 2008-03-05 华南理工大学 基于综合决策的防垃圾邮件误过滤方法及系统
CN101335920A (zh) * 2008-07-15 2008-12-31 中国联合通信有限公司 基于主叫号码位置和发送内容的垃圾短消息识别系统及方法

Also Published As

Publication number Publication date
WO2010133063A1 (zh) 2010-11-25
CN101895828A (zh) 2010-11-24

Similar Documents

Publication Publication Date Title
CN101895828B (zh) 一种短消息监控系统及方法
CN100576940C (zh) 短信息监控中心及监控方法
EP0894378B1 (en) Signature based fraud detection system
CN101686444B (zh) 垃圾短信发送号码实时检测系统及方法
CN104461742B (zh) 计算设备优化方法及装置
Wang et al. A behavior-based SMS antispam system
CN101321070B (zh) 一种可疑用户的监控系统及方法
CN105321249A (zh) 一种抽奖方法及装置
CN109857484A (zh) 针对接口调用请求的处理方法及系统
CN110401636A (zh) 一种监管异常访问的大数据风控方法和装置
CN104156442B (zh) 累计数据应用方法
CN109327325A (zh) 面向云平台可信性评估的多级数据采集与证据提取方法
CN110598982A (zh) 基于智能交互的主动风控方法和系统
CN110705988A (zh) 受侵害行为的交互式阻断方法和系统
CN109767227A (zh) 通过rds实现支付风险智能判断和控制的系统及方法
CN101389085A (zh) 基于发送行为的垃圾短消息识别系统及方法
CN109145050A (zh) 一种计算设备
CN110213152A (zh) 识别垃圾邮件的方法、装置、服务器及存储介质
CN105323751A (zh) 一种手机短信监控装置
CN104994220B (zh) 一种数据处理方法和系统
CN108259363B (zh) 一种阶梯式业务流量控制的方法及装置
CN103986603A (zh) 基于用户群消费体验的sp业务监控方法
CN201066901Y (zh) 短信息监控中心
CN106686246A (zh) 一种短消息处理方法及终端
CN101540697A (zh) 一种互联网信息服务管理系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20161130

Address after: 350600 Luoyuan, Fuzhou Province, nine central building, floor, floor, No. 2,

Patentee after: LUOYUAN COUNTY PRODUCTIVITY PROMOTION CENTER

Address before: 518057 Nanshan District Guangdong high tech Industrial Park, South Road, science and technology, ZTE building, Ministry of Justice

Patentee before: ZTE Corp.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20201020

Address after: 6 / F, No.1, Dongwai Road, Fengshan Town, Luoyuan County, Fuzhou City, Fujian Province

Patentee after: Luoyuan product quality inspection institute

Address before: 350600 Luoyuan, Fuzhou Province, nine central building, floor, floor, No. 2,

Patentee before: LUOYUAN COUNTY PRODUCTIVITY PROMOTION CENTER

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130116