WO2013075462A1

WO2013075462A1 - 用户身份的确定方法和装置

Info

Publication number: WO2013075462A1
Application number: PCT/CN2012/074640
Authority: WO
Inventors: 李冠军; 储昊明; 庞磊
Original assignee: 中兴通讯股份有限公司
Priority date: 2011-11-24
Filing date: 2012-04-25
Publication date: 2013-05-30
Also published as: CN102378180A

Abstract

本发明公开了一种用户身份的确定方法和装置。其中，该方法包括：统计规则时长内用户发送的短消息个数是否满足流量门限（S102）；如果是，统计规则时长内该用户首次下发短消息的失败率（S104）；如果失败率满足比值监控门限，确定该用户为黑名单用户（S106）。本发明解决了捕获可疑用户的策略过于简单，查全率和查准率存在矛盾的问题，提高了短消息监控系统的整体性能。

Description

用户身份的确定方法和装置技术领域本发明涉及通信领域，具体而言，涉及一种用户身份的确定方法和装置。背景技术目前，通讯领域的消息中心功能日臻壮大：应用范围从短消息中心、到多媒体消息中心、再到邮件中心；并且用户也日益增多；各个运营商、盈利集团和个人利用消息中心进行促销的手段也层出不穷；各网络之间互联互通的活动如火如荼；网上流动的消息量也随之成几何级数增长。在这种市场环境下，不可避免的会出现大量的垃圾消息、恶意消息、广告消息等，而发出这些消息的集体或个人就被认为是可疑用户，甚至是黑名单用户。短时间内的大量垃圾消息能够导致运营商的运营环境瘫痪；某些恶意用户甚至利用运营商计费系统的延迟，在接近欠费时发送大量短消息，进而使运营商蒙受巨额的经济损失。不仅如此，频繁的垃圾广告、恶意消息也会使用户烦不胜烦。鉴于此，垃圾短消息监控系统也就应运而生，其功能主要是能根据大量的受监控的短消息来自动地发现可疑用户，进而限制可疑用户发送短消息的行为。虽然目前市场上有很多商用的垃圾短消息监控系统，但就其核心功能"发现可疑用户"而言，判断的依据仍然比较简单，通常都是基于监控规则来判断用户在单位时间内发送的消息量是否达到了预设的监控门限，如果是，则认为该用户是可疑用户（这里预设的监控门限和单位时间的长度都是由监控规则来规定的），进而限制该可疑用户发送短消息的行为。这种监控方法的缺陷在于，仅简单的对用户在单位时间内发送的消息量进行计数，判断是否达到预设的门限值。通常情况下，为了满足正常用户的通信需求，对于规则中的流量违规门限通常不会设置太小，这样就使得一些恶意用户，利用系统的这种特性，长时间的以较低频率持续发送垃圾短信，从而逃脱系统的监控，相应垃圾监控的查全率就会降低，查准率相应提高；同时为了应对用户的垃圾短信投诉，对于规则中的流量违规门限又要避免设置太大，以确保监控到更多的可疑用户，这样使得一些发送正常短信的用户，例如发送商贸往来、换号、出生祝福等短信的用户被误判为可疑用户，甚至黑名单用户，从而被关停短信功能，相应垃圾监控的查全率就会提高，但是查准率会相应降低。针对相关技术中捕获可疑用户的策略过于简单，查全率和查准率存在矛盾的问题，目前尚未提出有效的解决方案。发明内容本发明实施例提供了一种用户身份的确定方法和装置，以至少解决捕获可疑用户的策略过于简单，查全率和查准率存在矛盾的问题。根据本发明实施例的一个方面，提供了一种用户身份的确定方法，包括：统计规则时长内用户发送的短消息个数是否满足流量门限；如果是，统计规则时长内该用户首次下发短消息的失败率；如果失败率满足比值监控门限，确定该用户为黑名单用户。优选地，统计规则时长内上述用户发送的短消息个数是否满足流量门限之前，上述方法还包括：配置首次下发失败率的比值监控门限和至少一条监控规则；其中，监控规则包括规则时长、时间粒度和规则时长内按流量监控的流量门限，规则时长为时间粒度的整数倍。优选地，统计规则时长内上述用户发送的短消息个数是否满足流量门限包括：当配置多条监控规则时，基于配置的各个监控规则分别对该用户发送的短消息进行计数统计。优选地，基于配置的各个监控规则分别对上述用户发送的短消息进行计数统计包括：逐一从多个监控规则中选取一个监控规则；以时间粒度为单位，对选取的监控规则的规则时长内该用户发送的短消息个数进行计数；如果当前时间粒度内该用户的计数达到流量门限，则确定规则时长内该用户的短消息个数满足流量门限；继续选取下一个监控规则进行计数，直至多个监控规则选取完毕。优选地，统计规则时长内上述用户首次下发短消息的失败率包括：对该用户在规则时长内发送的所有短消息数进行计算；对该用户在规则时长内所有首次下发短消息失败的次数进行计算；计算首次下发短消息失败的次数与所有短消息数的比值，将比值作为规则时长内该用户首次下发短消息的失败率。优选地，如果失败率不满足比值监控门限，上述方法还包括：获取规则时长内上述用户发送的短消息的关联信息，其中，关联信息至少包括以下之一：起呼频次、内容长度一致率、关键字出现频率和目的号码连续率；其中，起呼频次、内容长度一致率、关键字出现频率和目的号码连续率分别配置有一个关联门限；如果关联信息中有一个满足对应的关联门限，确定该用户为黑名单用户。根据本发明实施例的另一方面，提供了一种用户身份的确定装置，包括：流量统计模块，设置为统计规则时长内用户发送的短消息个数是否满足流量门限；失败率统计模块，设置为如果流量统计模块统计的结果为短消息个数满足流量门限，统计规则时长内该用户首次下发短消息的失败率；身份确定模块，设置为如果失败率统计模块统计的结构为失败率满足比值监控门限，确定该用户为黑名单用户。优选地，上述装置还包括：配置模块，设置为配置首次下发失败率的比值监控门限和至少一条监控规则；其中，监控规则包括规则时长、时间粒度和规则时长内按流量监控的流量门限，规则时长为时间粒度的整数倍。优选地，上述流量统计模块包括：流量统计单元，设置为当配置模块配置多条监控规则时，基于配置的各个监控规则分别对上述用户发送的短消息进行计数统计。优选地，上述失败率统计模块包括：短消息数计算单元，设置为对上述用户在规则时长内发送的所有短消息数进行计算；失败次数计算单元，设置为对该用户在规则时长内所有首次下发短消息失败的次数进行计算；失败率计算单元，设置为计算失败次数计算单元计算的首次下发短消息失败的次数与短消息数计算单元计算的所有短消息数的比值，将比值作为规则时长内该用户首次下发短消息的失败率。优选地，上述装置还包括：关联信息获取模块，设置为如果失败率统计模块统计的失败率不满足比值监控门限，获取规则时长内上述用户发送的短消息的关联信息，其中，关联信息至少包括以下之一：起呼频次、内容长度一致率、关键字出现频率和目的号码连续率；其中，起呼频次、内容长度一致率、关键字出现频率和目的号码连续率分别配置有一个关联门限；身份再次确认模块，设置为如果关联信息获取模块获取的关联信息中有一个满足对应的关联门限，确定该用户为黑名单用户。通过本发明实施例，采用在流量监控的基础上结合首发失败率的监控，解决了捕获可疑用户的策略过于简单，查全率和查准率存在矛盾的问题，进而提高了短消息监控系统的整体性能。附图说明此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：图 1是根据本发明实施例的用户身份的确定方法流程图; 图 2是根据本发明实施例的用户身份的确定装置的结构框图；图 3是根据本发明实施例的优选用户身份的确定装置的结构框图；图 4是根据本发明实施例的另一优选用户身份的确定装置的结构框图；图 5是根据本发明实施例的失败率统计模块的结构框图；图 6是根据本发明实施例的再一优选用户身份的确定装置的结构框图；图 7是根据本发明优选实施例的短消息监控系统的示意图；图 8是根据本发明优选实施例的短消息监控系统的架构示意图；图 9是根据本发明优选实施例的短消息监控方法的流程图；图 10 是根据本发明优选实施例的基于多条监控规则对用户发送的短消息进行计数的流程图。具体实施方式下文中将参考附图并结合实施例来详细说明本发明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。本发明实施例针对垃圾短信群发的特征，通常被叫号码中可能存在一部分无效号码（停机、无此号码等），发到这些号码的消息都会下发失败，提供了一种用户身份的确定方法和装置。下面通过具体实施例进行说明。如图 1所示的根据本发明实施例的用户身份的确定方法流程图，该方法可以在短消息监控系统中实现，包括以下步骤：步骤 S102，统计规则时长内用户发送的短消息个数是否满足流量门限；如果是，执行步骤 S104; 如果否，执行步骤 S108。步骤 S104, 统计上述规则时长内该用户首次下发短消息的失败率。步骤 S106, 如果上述失败率满足比值监控门限，确定该用户为黑名单用户。步骤 S108，确定该用户为合法用户。本实施例通过在流量监控的基础上结合首发失败率的监控，可以限制长时间以较低频率持续发送垃圾短信的行为，又可以避免误监控的出现，同时提高了查全率和查准率，解决了相关技术中捕获可疑用户的策略过于简单，查全率和查准率存在矛盾的问题，提高了短消息监控系统的整体性能。当统计规则时长内用户发送的短消息个数是否满足上述流量门限时，可以暂时确定该用户可能为可疑用户，如果该可疑用户的上述首发的失败率也满足设定的比值监控门限，则可以确定该用户为可疑用户，即该用户为上述黑名单用户。上述规则时长指一条监控规则的监控时长，本实施例的规则时长是时间粒度的倍数，它以时间粒度为计算单位。例如 1个时间粒度、 2个时间粒度等。因此一个规则时长内可以包含有 1个或多个时间粒度。而时间粒度用来表示设定的时间长度，它是监控时长的基本单位，如 10分钟、 1小时等。本实施例的时间粒度用粒度开始时间和粒度结束时间界定，粒度开始时间为时间粒度的起始时间；粒度结束时间为时间粒度的起始时间加上时间粒度。在进行上述统计规则时长内用户发送的短消息个数是否满足流量门限之前，可以根据需要对系统进行配置，例如：配置首次下发失败率的比值监控门限和至少一条监控规则；其中，监控规则包括规则时长、时间粒度和规则时长内按流量监控的流量门限，该规则时长为时间粒度的整数倍。这种配置方式可以根据系统的实际监控需要进行配置，使配置的参数更符合监控要求，增加了系统的灵活性。当然，对于普遍适用的场景，也可以采用系统默认的配置进行，即不需要单独进行上述配置。当配置多条监控规则时，可以基于配置的各个监控规则分别对用户发送的短消息进行计数统计。例如：逐一从多个监控规则中选取一个监控规则；以时间粒度为单位，对选取的监控规则的规则时长内用户发送的短消息个数进行计数；如果当前时间粒度内用户的计数达到流量门限，则确定规则时长内用户的短消息个数满足流量门限；继续选取下一个监控规则进行计数，直至多个监控规则选取完毕。通过配置多条监控规贝 1」，可以更加准确地确定用户的身份。本实施例可以通过短消息中心记录的用户的短消息发送情况，统计规则时长内用户首次下发短消息的失败率，具体采用下述过程完成： 1 )对该用户在规则时长内发送的所有短消息数进行计算； 2)对该用户在规则时长内所有首次下发短消息失败的次数进行计算； 3 )计算首次下发短消息失败的次数与所有短消息数的比值，将该比值作为规则时长内用户首次下发短消息的失败率。这种统计方式采用先取出一条监控规则，基于该监控规则对用户发送的短消息进行计数，然后，确定还存在其他监控规则时，再次取出一条监控规则，再基于该监控规则对用户发送的短消息数进行计数。这种统计方式比较有序，便于实现。由上述方案可知，本实施例的流量监控指对规则时长内的短消息量进行监控，它以预先设置的按流量监控的门限作为监控基础，分为单纯流量监控和复合流量监控。单纯流量监控主要是指直接将预先设置的按流量监控的门限作为可疑门限来进行监控，即当用户在规则时长内发送的短消息量大于或等于按流量监控的门限时，就认为相应用户为可疑用户，进而限制可疑用户发送短消息的行为。复合流量监控是指在单纯流量监控的基础上结合监控类型进行后续监控，即首先判断用户在规则时长内发送的短消息量是否达到按流量监控的门限，在达到了该按流量监控的门限的基础上，再根据不同的监控类型对已在规则时长内监控到的短消息进行后续监控。上述后续监控是相对于实时的按流量监控来说，后续监控是在一个时间粒度结束时间之前，对该时间粒度内违反单纯流量监控的用户在规则时长内发送的所有短消息进行进一步地判断和分析。在后续监控的过程中，涉及到监控类型的问题，监控类型是每一条监控规则中的属性之一，标志该监控规则是基于哪种类型设置的，对于后续监控而言，其包括的监控类型可以为按起呼频次监控、按关键字频次监控、按号码连续性监控等。基于此，如果失败率不满足比值监控门限，上述方法还包括：获取规则时长内用户发送的短消息的关联信息，其中，关联信息至少包括以下之一：起呼频次、内容长度一致率、关键字出现频率和目的号码连续率；其中，起呼频次、内容长度一致率、关键字出现频率和目的号码连续率分别配置有一个关联门限；如果获取的关联信息中有一个满足对应的关联门限，则确定该用户为黑名单用户。这种监控方式更具有综合性，可以准确地捕获可疑用户，查全率和查准率均可以得到保证。在实际实现时，可以按照下述方式设置监控规则：将上述步骤 S102中的统计规则时长内用户发送的短消息个数与流量门限的关系对应的规则作为父规则，将上述步骤 S104-S106 中的统计上述规则时长内该用户首次下发短消息的失败率与比值监控门限的关系作为子规则，其中，父规则指一个规则簇中，如果规则 A需要在规则 B之前执行，则称规则 A是规则 B的父规则。上述单纯流量监控规则就是后续监控的父规则。子规则指一个规则簇中，如果规则 A需要在规则 B之后执行，则称规则 A是规则 B 的子规则。后续监控就是单纯流量监控规则的子规则。上述黑名单指对于在一定时间内发送次数超过一定门限或发送关键字超过门限的用户定义为黑名单用户，该用户将被关闭短消息发送功能。相对于黑名单而言，监控系统中还有白名单，该白名单中的用户为不被监控的用户，即无论该用户如何发送短消息都不会被监控。上述用户身份的确定方法可以应用在短消息监控方法中，首先，基于监控规则对用户发送的短消息数进行计数，在一个时间粒度内，用户发送的短消息数达到规则时长内按流量监控的门限后，在该时间粒度结束内，记录该粒度结束时间之前的规则时长内用户发送的所有短消息；其次，该用户每发一条短消息，对首次终呼失败次数 / 所有短消息数（相当于上述用户首次下发短消息的失败率）进行计算，当计算得到的比值达到首次下发失败率监控门限时，将该用户标识为可疑用户。进而限制该可疑用户的发送行为。通过引入对用户短消息首次下发失败情况的判断，可以针对群发，被叫号码中可能存在一部分无效号码（停机、无此号码等）的特征进行有效地监控，如果终呼失败比例较高，则认为有发垃圾短信的嫌疑。由于首次下发失败率监控是在流量监控筛选的基础上进行的，因此配置较低流量门限时，既可以限制长时间的以较低频率持续发送垃圾短信的行为，又可以避免误监控的出现，同时提高查全率和查准率。总之，通过首次下发失败情况的判断，这样就达到了更全面的捕获可疑用户的监控效果，同时也提高了短消息监控系统的整体性能。对应于上述用户身份的确定方法，本实施例还提供了一种用户身份的确定装置。如图 2所示的根据本发明实施例的用户身份的确定装置的结构框图，该装置可以设置在短消息监控系统中，该装置包括：流量统计模块 22、失败率统计模块 24、身份确定模块 26。下面具体介绍上述模块的结构：流量统计模块 22，设置为统计规则时长内用户发送的短消息个数是否满足流量门限；失败率统计模块 24，与流量统计模块 22相连，设置为如果流量统计模块 22统计的结果为短消息个数满足流量门限，统计规则时长内用户首次下发短消息的失败率；身份确定模块 26，与失败率统计模块 24相连，设置为如果失败率统计模块 24统计的结构为失败率满足比值监控门限，确定用户为黑名单用户。本实施例的装置通过在流量统计模块 22 进行流量监控的基础上结合失败率统计模块 24对首发失败率的监控，可以限制长时间以较低频率持续发送垃圾短信的行为，又可以避免误监控的出现，同时提高了查全率和查准率，解决了相关技术中捕获可疑用户的策略过于简单，查全率和查准率存在矛盾的问题，提高了短消息监控系统的整体性能。如图 3所示的根据本发明实施例的优选用户身份的确定装置的结构框图，上述装置还可以包括：配置模块 32，与流量统计模块 22和身份确定模块 26相连，设置为配置首次下发失败率的比值监控门限和至少一条监控规则；其中，监控规则包括规则时长、时间粒度和规则时长内按流量监控的流量门限，规则时长为时间粒度的整数倍。如图 4所示的根据本发明实施例的另一优选用户身份的确定装置的结构框图，流量统计模块 22可以包括：流量统计单元 222，与配置模块 32相连，设置为当配置模块 32配置多条监控规则时，基于配置的各个监控规则分别对用户发送的短消息进行计数统计。如图 5所示的根据本发明实施例的失败率统计模块 24的结构框图，失败率统计模块 24可以包括：短消息数计算单元 242，设置为对用户在规则时长内发送的所有短消息数进行计算；失败次数计算单元 244，设置为对用户在规则时长内所有首次下发短消息失败的次数进行计算；失败率计算单元 246，与短消息数计算单元 242和失败次数计算单元 244相连，设置为计算失败次数计算单元 244计算的首次下发短消息失败的次数与短消息数计算单元 242计算的所有短消息数的比值，将比值作为规则时长内用户首次下发短消息的失败率。如图 6所示的根据本发明实施例的再一优选用户身份的确定装置的结构框图，上述装置还可以包括：关联信息获取模块 62，与失败率统计模块 24相连，设置为如果失败率统计模块 24 统计的失败率不满足比值监控门限，获取规则时长内用户发送的短消息的关联信息，其中，关联信息至少包括以下之一：起呼频次、内容长度一致率、关键字出现频率和目的号码连续率；其中，起呼频次、内容长度一致率、关键字出现频率和目的号码连续率分别配置有一个关联门限；身份再次确认模块 64，与关联信息获取模块 62相连，设置为如果关联信息获取模块 62获取的关联信息中有一个满足对应的关联门限，确定用户为黑名单用户。下面将结合一个优选实施例进行详细说明，该优选实施例结合了上述实施例及优选实施方式。在本优选实施例中，提供了上述用户身份的确定装置的另一种划分方式，如图 7 所示的根据本发明优选实施例的短消息监控系统的示意图，该系统包括：配置模块 70、初步分析模块 72、后续分析模块 74、显示模块 76。其中，配置模块 70，设置为配置首次下发失败率监控门限、以及配置至少一条监控规则，其中，监控规则包括：规则时长内按流量监控的门限、规则时长和时间粒度，并且规则时长为时间粒度的整数倍，并且将配置好的监控规则发送给初步分析模块 72、以及将配置好的用户级别监控门限发送给后续分析模块 76; 初步分析模块 72，与配置模块 70相连，设置为对用户发送的短消息数进行计数，当在一个时间粒度内，用户发送的短消息数达到规则时长内按流量监控的门限后，记录用户的用户信息，并且在该时间粒度结束内，记录粒度结束时间之前的规则时长内用户发送的所有短消息并发送给后续分析模块 74; 后续分析模块 74，与配置模块 70和初步分析模块 72相连，设置为对所有短消息和首次终呼失败次数进行计算，当计算首次终呼失败次数 /所有短消息数达到首次下发失败率监控门限时，将用户标识为可疑用户；显示模块 76，与后续分析模块 74相连，设置为显示可疑用户的用户信息。该优选实施例增加了后续分析模块 74，即引入了后续的首次下发失败率监控，因此配置较低流量门限时，既可以限制长时间的以较低频率持续发送垃圾短信的行为，又可以避免误监控的出现，同时提高查全率和查准率，这样就实现了提高监控系统可靠性的目的。配置模块 70配置了多条监控规则时，初步分析模块 72具体用于基于配置的各监控规则分别对用户发送的短消息进行计数，更具体地，取出一条监控规则，基于该监控规则分别对用户发送的短消息进行计数，确定存在其他监控规则时，再次取出一条监控规则，基于该监控规则对用户发送的短消息数进行计数。后续分析模块 76具体包括：计算单元，设置为对用户在一个规则时长内发送的所有短消息数和首次终呼失败次数进行计算；比较单元，设置为将首次终呼失败次数 / 所有短消息数与首次下发失败率监控门限进行比较，当计算得到的值达到首次下发失败率监控门限时，将该用户标识为可疑用户。对应于上述的短消息监控系统，本优选实施例还提供了一种短消息监控系统的架构。如图 8所示的根据本发明优选实施例的短消息监控系统的架构示意图，该系统包括：控制台（人机交互界面） 80，用于数据的配置以及用户信息的显示，即该控制台结合了如图 7所示的短消息监控系统中的配置模块 70和显示模块 76的功能，在该控制台上，既可以进行数据的配置，如监控规则、首次下发失败率监控门限的配置，又可以将监控系统所监控到的可疑用户的用户信息进行显示。控制台的数据配置完成后，将同步给分析模块和数据库管理操作模块。分析模块 82，其功能与如图 7所示的短消息监控系统中的初步分析模块 72的功能基本相同，用于负责接收短消息中心的消息，按照控制台配置的监控规则进行计数，当达到控制台配置的父规则一达到按流量监控的门限时，就将该用户的用户信息发送给数据库管理操作模块 84进行插入数据库 86操作，目的在于对用户信息进行记录。用户的短消息在一个时间粒度结束内把在该时间粒度被拦截用户在规则时长内发送的所有短消息发送给数据库管理操作模块，目的在于对所有短消息进行记录。数据库管理操作模块 86，该模块的功能与如图 7所示的短消息监控系统中的后续分析模块 74的功能基本相同，主要用于接收到分析模块 82的数据后进行插入数据库 86操作，并且进行后续分析，后续分析包括调用存储过程取出数据库 86中该用户在一个规则时长内的发送的短消息和首次终呼失败次数进行计算，并判断首次终呼失败次数 /所有短消息数是否达到首次下发失败率监控门限。基于上述短消息监控系统及其架构，本优选实施例还提供了一种短消息监控方法。如图 9所示的根据本发明优选实施例的短消息监控方法的流程图，该方法包括：步骤 S900, 配置首次下发失败率监控门限、以及配置至少一条监控规则，其中，监控规则包括：规则时长内按流量监控的门限、规则时长和时间粒度，并且规则时长为时间粒度的整数倍。对于首次下发失败率监控门限而言，如果配置的监控规则为多条，对于不同的监控规则，按流量监控的门限、规则时长、时间粒度三项中的至少一项是不同的。例如，配置有两条不同的监控规则，其中一条监控规则配置的参数为：按流量监控的门限是 100条短消息，规则时长是 10分钟；另一条监控规则配置的参数为：按流量监控的门限是 200条短消息，规则时长是 15分钟。步骤 S902, 从上述配置的至少一条监控规则中取出一条监控规则。取出的该条监控规则将为以下的计数过程提供依据。步骤 S904, 对用户发送的短消息数进行计数，并且实时判断在一个时间粒度内用户发送的短消息数是否达到规则时长内按流量监控的门限，如果是，则执行步骤 S906; 如果否，则结束。步骤 S906，记录该用户的用户信息，并且在时间粒度结束内，记录粒度结束时间之前的规则时长内用户发送的所有短消息。具体地，可以通过将用户信息利用数据库管理模块插入数据库的方式来完成用户信息的记录；同样可以通过将所有短消息利用数据库管理模块插入数据库的方式来完成短消息的记录。该过程可以认为是前述复合流量监控中的单纯流量监控，即只是判断用户在规则时长内发送的短消息数是否达到了按流量监控的门限。在该过程中，所有用户的计数过程都是在流量计数内存库中进行的，即流量内存库中保存有用户的计数记录，所以，在计数之前，要对用户的计数记录进行初始化设置，如果流量计数内存库中不存在该用户的计数记录，在初始化设置之前还需要在该流量计数内存库中生成一条该用户的计数记录，设置为之后对该用户发送的短消息数进行计数。步骤 S908,对记录的首次终呼失败次数 /所有短消息数进行计算，当计算得到的值达到与首次下发失败率监控门限时，将该用户标识为可疑用户。该过程可以认为是后续监控，即在单纯流量监控的基础上，再对已在规则时长内监控到的短消息进行首次下发失败率监控。步骤 S910, 显示上述可疑用户的用户信息。对于可疑用户，其发送短消息的行为将会受到限制，并且该可疑用户的用户信息会被显示出来。该优选实施例在按流量监控的基础上，引入了后续的首次下发失败率监控，因此配置较低流量门限时，既可以限制长时间的以较低频率持续发送垃圾短信的行为，又可以避免误监控的出现，同时提高查全率和查准率，进而可以更全面的捕获可疑用户。从上述的短消息监控方法的步骤 S900可以看出，配置的监控规则可以为多条。配置了多条监控规则时，将基于各监控规则分别对用户发送的短消息进行计数。对于存在多条监控规则的情况，该短消息监控方法对某个用户进行流量计数的过程，将在以下结合图 10做进一步的描述。如图 10 所示的根据本发明优选实施例的基于多条监控规则对用户发送的短消息进行计数的流程图，当存在多条监控规则时，对用户发送的短消息进行计数的过程包括：步骤 S1002, 从短消息中心获取短消息受控结构体，根据该短消息受控结构体解析出起呼用户号码；步骤 S1004, 分析模块从多条监控规则中取出一条监控规则；步骤 S1006, 基于监控规则对该起呼用户发送的短消息进行计数，即在该起呼用户该时间粒度的该监控规则的计数数值加一（正常情况下计数器没有溢出）；步骤 S1008, 判断短消息计数数值是否达到按流量监控的门限，如果达到，则继续执行步骤 S1010, 如果未达到，则继续执行步骤 S1012; 步骤 S1010, 记录该起呼用户的用户号码，并且在该时间粒度结束内，记录粒度结束时间之前的规则时长内用户发送的所有短消息，具体可以采取将该用户号码以及所有短消息发送给数据库管理操作模块由其完成插入数据库操作的方式来实现；步骤 S1012, 判断是否存在其他监控规则，如果是，则返回到步骤 S1004。通过该优选实施例，实现了在按流量监控的过程中，可以配置多条监控规则对用户发送的短消息进行监控，这样就有效地提高了监控的力度。从前面的描述可以知道，后续监控包括的监控类型有多种，可以为按内容长度一致性监控、按关键字频次监控、按号码连续性监控等。所以，下面将以监控类型为按首次下发失败率监控为例，对短消息监控方法做进一步的描述，该方法包括：步骤 1，首先，在短消息监控的人机交互界面上进行监控规则的配置，包括配置父规则-按流量监控的门限，即当某一号码在规则时长内发送的短消息达到该值后才进行后续监控；接着配置子规则-首次下发失败率监控门限。配置完成后，将配置好的上述参数同步给分析模块和数据库管理操作模块。步骤 2，对流量计数内存库中用户的计数记录进行初始化设置，如果存在不同的监控规则，基于每个规则进行计数的计数记录都要进行初始化设置，当然，如果流量计数内存库中不存在该用户的计数记录，则要在初始化之前在流量计数内存库中生成一条该用户的计数记录。步骤 3，获取待监控的短信受控结构体，在该结构体中必须包含起呼用户号码、消息体、首次终呼是否失败等用户信息。步骤 4，根据获取的短信受控结构体，解析出起呼用户号码，并且在时间粒度内在流量计数内存库中基于各监控规则针对该起呼用户号码进行计数。步骤 5，当在一个时间粒度内，流量计数内存库中的计数值达到子规则-首次下发失败率监控门限的父规则-按流量监控的门限后，即把该用户的用户信息发送给数据库管理操作模块进行物理数据库入库，目的在于记录该用户的用户信息。步骤 6，当到达步骤 5上述的粒度结束时间内，将该粒度结束时间之前的规则时长内用户发送的所有短消息进行记录，即将该用户在该粒度结束时间和该粒度结束时间向前倒退一个规则时长的时间范围内即一个规则时长内发送的所有短消息通知数据库管理操作模块，数据库管理操作模块会将所有短消息插入数据库。步骤 7，数据库管理操作模块调用存储过程取出物理数据库中该用户在一个规则时长内发送的所有短消息进行计算，对于首次下发失败率监控而言，此处需要分别对所有短消息进行求和、首次终呼失败次数进行求和计算，并且判断首次终呼失败次数 / 所有短消息数得到的值是否达到首次下发失败率监控门限，如果达到则将该用户标识为可疑用户，并且将该可疑用户的用户信息发送给显示模块进行显示，其发送短消息的行为将会受到限制。如果未达到，则表明相应用户不是可疑用户，不会对其发送短消息的行为进行限制。该优选实施例中所涉及的首次下发失败率监控是复合流量监控中的后续监控，其不仅适用于监控类型为首次下发失败率的监控，同样适用于监控类型为按内容长度一致性监控、按关键字频次监控、按号码连续性监控等其他复合流量监控，在此我们不再进行描述。从以上的描述中可以看出，本发明实现了如下技术效果：引入对用户短消息首次下发失败情况的判断，可以针对群发，被叫号码中可能存在一部分无效号码（停机、无此号码等）的特征进行有效地监控，如果终呼失败比例较高，则认为有发垃圾短信的嫌疑。由于首次下发失败率监控是在流量监控筛选的基础上进行的，因此配置较低流量门限时，既可以限制长时间的以较低频率持续发送垃圾短信的行为，又可以避免误监控的出现，同时提高查全率和查准率，进而提高系统的可靠性。综上所述可以看出，本实施例通过在流量监控的基础上结合首发失败率的监控，解决了相关技术中捕获可疑用户的策略过于简单，查全率和查准率存在矛盾的问题，提高了短消息监控系统的整体性能。显然，本领域的技术人员应该明白，上述的本发明的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件结合。以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

权利要求书

1. 一种用户身份的确定方法，包括：

统计规则时长内用户发送的短消息个数是否满足流量门限；如果是，统计所述规则时长内所述用户首次下发短消息的失败率；如果所述失败率满足比值监控门限，确定所述用户为黑名单用户。

2. 根据权利要求 1所述的方法，其中，统计规则时长内用户发送的短消息个数是否满足流量门限之前，所述方法还包括：

配置首次下发失败率的比值监控门限和至少一条监控规则；其中，所述监控规则包括规则时长、时间粒度和所述规则时长内按流量监控的流量门限，所述规则时长为所述时间粒度的整数倍。

3. 根据权利要求 2所述的方法，其中，统计规则时长内用户发送的短消息个数是否满足流量门限包括：

当配置多条监控规则时，基于配置的各个监控规则分别对用户发送的短消息进行计数统计。

4. 根据权利要求 3所述的方法，其中，基于配置的各个监控规则分别对用户发送的短消息进行计数统计包括：

逐一从所述多个监控规则中选取一个监控规则；

以时间粒度为单位，对选取的所述监控规则的规则时长内用户发送的短消息个数进行计数；

如果当前时间粒度内所述用户的计数达到所述流量门限，则确定所述规则时长内所述用户的短消息个数满足流量门限；

继续选取下一个监控规则进行计数，直至所述多个监控规则选取完毕。

5. 根据权利要求 1所述的方法，其中，统计所述规则时长内所述用户首次下发短消息的失败率包括：

对所述用户在所述规则时长内发送的所有短消息数进行计算；对所述用户在所述规则时长内所有首次下发短消息失败的次数进行计算；计算所述首次下发短消息失败的次数与所述所有短消息数的比值，将所述比值作为所述规则时长内所述用户首次下发短消息的失败率。

6. 根据权利要求 1-5任一项所述的方法，其中，如果所述失败率不满足比值监控门限，所述方法还包括：

获取所述规则时长内所述用户发送的短消息的关联信息，其中，所述关联信息至少包括以下之一：起呼频次、内容长度一致率、关键字出现频率和目的号码连续率；其中，所述起呼频次、所述内容长度一致率、所述关键字出现频率和所述目的号码连续率分别配置有一个关联门限；

如果所述关联信息中有一个满足对应的关联门限，确定所述用户为黑名单用户。

7. 一种用户身份的确定装置，包括：

流量统计模块，设置为统计规则时长内用户发送的短消息个数是否满足流量门限；

失败率统计模块，设置为如果所述流量统计模块统计的结果为所述短消息个数满足所述流量门限，统计所述规则时长内所述用户首次下发短消息的失败率；身份确定模块，设置为如果所述失败率统计模块统计的结构为所述失败率满足所述比值监控门限，确定所述用户为黑名单用户。

8. 根据权利要求 7所述的装置，其中，所述装置还包括：配置模块，设置为配置首次下发失败率的比值监控门限和至少一条监控规贝 U; 其中，所述监控规则包括规则时长、时间粒度和所述规则时长内按流量监控的流量门限，所述规则时长为所述时间粒度的整数倍。

9. 根据权利要求 8所述的装置，其中，所述流量统计模块包括：流量统计单元，设置为当所述配置模块配置多条监控规则时，基于配置的各个监控规则分别对用户发送的短消息进行计数统计。

10. 根据权利要求 7所述的装置，其中，所述失败率统计模块包括：

短消息数计算单元，设置为对所述用户在所述规则时长内发送的所有短消息数进行计算；失败次数计算单元，设置为对所述用户在所述规则时长内所有首次下发短消息失败的次数进行计算；

失败率计算单元，设置为计算所述失败次数计算单元计算的所述首次下发短消息失败的次数与所述短消息数计算单元计算的所述所有短消息数的比值，将所述比值作为所述规则时长内所述用户首次下发短消息的失败率。

11. 根据权利要求 7-10任一项所述的装置，其中，所述装置还包括：关联信息获取模块，设置为如果所述失败率统计模块统计的所述失败率不满足比值监控门限，获取所述规则时长内所述用户发送的短消息的关联信息，其中，所述关联信息至少包括以下之一：起呼频次、内容长度一致率、关键字出现频率和目的号码连续率；其中，所述起呼频次、所述内容长度一致率、所述关键字出现频率和所述目的号码连续率分别配置有一个关联门限；

身份再次确认模块，设置为如果所述关联信息获取模块获取的所述关联信息中有一个满足对应的关联门限，确定所述用户为黑名单用户。