CN106549851B - 一种违规信息发送群的判定方法及装置 - Google Patents

一种违规信息发送群的判定方法及装置 Download PDF

Info

Publication number
CN106549851B
CN106549851B CN201510599132.5A CN201510599132A CN106549851B CN 106549851 B CN106549851 B CN 106549851B CN 201510599132 A CN201510599132 A CN 201510599132A CN 106549851 B CN106549851 B CN 106549851B
Authority
CN
China
Prior art keywords
group
sending
preliminary
numbers
suspected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510599132.5A
Other languages
English (en)
Other versions
CN106549851A (zh
Inventor
粟栗
孙洋
张洋
周晶
张帆
王焕如
谭彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201510599132.5A priority Critical patent/CN106549851B/zh
Publication of CN106549851A publication Critical patent/CN106549851A/zh
Application granted granted Critical
Publication of CN106549851B publication Critical patent/CN106549851B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种违规信息发送群的判定方法及装置,该判定方法包括:获取已审核为违规的信息,并依据信息的内容,将发送相似内容的信息的发送号码设定为归属于同一发送群,形成多个发送群;分析发送群中的发送号码,使发送号码中疑似具有相同行为、且疑似属于同一用户的多个发送号码归属于同一初步疑似违规群;分析初步疑似违规群内发送号码的社交特征和与初步疑似违规群相对应的信息接收群的社交特征,判断初步疑似违规群是否为确定疑似违规群。在本发明提供的判定方法中,通过采用内容判定和社交关系判定的方式,能够对违规行为与正常行为进行准确区分,有效地判定低频违规信息发送者的确定疑似违规群,使得对违规信息发送群的判定更加准确。

Description

一种违规信息发送群的判定方法及装置
技术领域
本发明涉及通信安全技术领域,尤其涉及一种违规信息发送群的判定方法及装置。
背景技术
随着垃圾、骚扰信息的逐步发展,目前有大量的垃圾信息采用低频发送的方式,难以被发现与处置。例如在某月的数据分析中,发现大量的垃圾短信都采用低频发送的方式,占垃圾短信发送量比例的60%以上。其中,形成低频发送的原因是形成了固定的产业链。例如CO1为卡主,拥有1000张不同的SIM卡,当业务需要发送1000条广告信息时,CO1采用每张卡发送1条的方式;若CO1手中的卡不能满足需要,则进一步联系其他的卡主CO2、CO3…进行联合发送,其中,CO表示卡号拥有者,CO1、CO2表示不同的卡号拥有者。
由于低频垃圾短信发送者的行为比较隐蔽,采用低频发送的方式给垃圾短信治理带来的主要困难包括:
(1)单条垃圾短信涉及的号码多,难以被实时监控与发现;
(2)单号码发送量少,难以被判定与处罚;一个号码每天只发送5条以内,不符合现有的处置规定;
(3)一个号码既发送垃圾信息,也发送正常的信息,对一个号码的历史情况进行跟踪,很难进行判定。
其中,下述为目前对于垃圾短信发送者的主要发现方式及其对应缺点:
(1)基于短信内容发现垃圾短信,提取发送者信息,确定该发送者发送一定数量的垃圾短信后,对发送者进行处置。其中,该方法存在两个方面的局限,一是发现的信息不全,二是采用低频发送的方式,每个用户发送的违规数量很少,即使发现也不能处置。
(2)基于用户的发送行为进行筛选。该方法能对部分未知信息进行发现,但现有的垃圾短信发送者已能有效规避发送行为的筛选原则,导致筛选不准确,需要大量的人力辅助。
(3)基于收发者之间的社交联系判定。基于收发者之间的社交关系,能够有效发现异常,但目前的低频发送者不仅仅向未建立联系的用户发送,还与固定用户群通信,难以将违规行为与正常行为进行区分,导致收发者之间的社交关系判定失败。
因此,目前广告、垃圾信息的发送者采用该类型方法进行了有效逃避,导致采用现有的技术对占大部分比例的垃圾短信发送者难以进行有效处置。
发明内容
为了克服上述技术问题,本发明提供了一种违规信息发送群的判定方法及装置,通过采用内容判定和社交关系判定的方式,能够对违规行为与正常行为进行准确区分,并对违规信息发送群进行准确判定。
为了解决上述技术问题,本发明采用如下技术方案:
依据本发明的一个方面,提供了一种违规信息发送群的判定方法,所述判定方法包括:
获取已审核为违规的信息,并依据所述信息的内容,将发送相似内容的所述信息的发送号码设定为归属于同一发送群,形成多个发送群;
分析所述发送群中的发送号码,使所述发送号码中疑似具有相同行为、且疑似属于同一用户的多个发送号码归属于同一初步疑似违规群;
分析所述初步疑似违规群内发送号码的社交特征和与所述初步疑似违规群相对应的信息接收群的社交特征,判断所述初步疑似违规群是否为确定疑似违规群。
可选地,所述分析所述发送群中的发送号码,使所述发送号码中疑似具有相同行为、且疑似属于同一用户的多个发送号码归属于同一初步疑似违规群的步骤具体包括:
对所述多个发送群中的发送号码进行交叠分析,提取出同时出现在第一预定数量个发送群中的疑似违规发送号码;
对所提取出的所述疑似违规发送号码进行聚类分析,将同时出现在相同的第二预定数量个发送群中的所述疑似违规发送号码确定为疑似具有相似行为、且疑似属于同一用户,并归属于同一所述初步疑似违规群。
可选地,所述分析所述初步疑似违规群内发送号码的社交特征和与所述初步疑似违规群相对应的信息接收群的社交特征的步骤具体包括:
分析所述初步疑似违规群内发送号码的发送行为特征,获得第一特征值;
分析所述初步疑似违规群内发送号码的社交关系特征,获得第二特征值;
分析所述信息接收群内接收号码的社交关系特征,获取第三特征值;
分析所述初步疑似违规群内发送号码与所述信息接收群内接收号码之间的社交关系特征,获取第四特征值。
可选地,所述判断所述初步疑似违规群是否为确定疑似违规群的步骤具体包括:
依据预先设定的所述第一特征值、所述第二特征值、所述第三特征值以及所述第四特征值所占权重进行计算,得到所述初步疑似违规群的疑似度;
将所述疑似度与预设判断标准进行比较,判断所述初步疑似违规群是否为确定疑似违规群。
可选地,所述将所述疑似度与预设判断标准进行比较,判断所述初步疑似违规群是否为确定疑似违规群的步骤具体包括:
将所述疑似度与预设判断标准进行比较,判断所述疑似度所处区间,其中所述预设判断标准分为:正常区间、摇摆区间以及违规区间;
当所述疑似度处于所述违规区间时,则判定所述初步疑似违规群为确定疑似违规群。
可选地,所述分析所述初步疑似违规群内发送号码的发送行为特征,获得第一特征值的步骤具体包括:
根据所述初步疑似违规群内所有发送号码在预定时间内所有的信息发送量以及在所述预定时间内的信息接收量,计算所述初步疑似违规群的信息发送接收比;
计算所述初步疑似违规群内所有发送号码的单日平均信息发送量;
计算所述初步疑似违规群内所有发送号码的平均在网时长;
根据所述信息发送接收比、所述单日平均信息发送量以及所述平均在网时长,计算所述第一特征值。
可选地,所述分析所述初步疑似违规群内发送号码的社交关系特征,获得第二特征值的步骤具体包括:
根据所述初步疑似违规群内所有发送号码的归属地,获取所述初步疑似违规群的地域集中度;
根据所述初步疑似违规群内发送号码之间的单日平均互相通信的总通信次数以及所述初步疑似违规群内包含的发送号码的总数,计算所述初步疑似违规群的群内联系紧密度;
根据所述初步疑似违规群内至少两个发送号码进行统一操作的总次数以及所述初步疑似违规群内所有发送号码进行操作的总次数,计算所述初步疑似违规群的行为一致度;
根据所述初步疑似违规群的地域集中度、群内联系紧密度以及行为一致度,计算所述第二特征值。
可选地,所述分析所述信息接收群内接收号码的社交关系特征,获取第三特征值的步骤具体包括:
根据所述信息接收群内所有接收号码的归属地,获取所述信息接收群的地域集中度;
根据所述信息接收群内接收号码之间的单日平均互相通信的总通信次数以及所述信息接收群内包含的接收号码的总数,计算所述信息接收群的群内联系紧密度;
根据所述信息接收群的地域集中以及群内联系紧密度,计算所述第三特征值。
可选地,所述分析所述初步疑似违规群内发送号码与所述信息接收群内接收号码之间的社交关系特征,获取第二特征值的步骤具体包括:
根据所述初步疑似违规群内所有发送号码的直接交往用户和所述信息接收群内所有接收号码的直接交往用户,得到所述初步疑似违规群与所述信息接收群的共同交往用户和全部交往用户,计算所述初步疑似违规群与所述信息接收群的社交范围重合率;
计算所述初步疑似违规群内所有发送号码与所述信息接收群内所有接收号码首次建立联系的时间到目前分析的时间的平均间隔时间;
计算所述初步疑似违规群内其中一发送号码对应的接收号码的平均接收数量;
根据所述初步疑似违规群与所述信息接收群的社交范围重合率、所述平均时间间隔以及所述平均接收数量,计算所述第四特征值。
可选地,当判定所述初步疑似违规群为确定疑似违规群时,所述判定方法还包括:
对所述确定疑似违规群内所有发送号码的话单进行分析,当所述话单为异常话单,则判定所述确定疑似违规群为违规信息发送群。
依据本发明的另一个方面,还提供了一种违规信息发送群的判定装置,所述判定装置包括:
获取模块,用于获取已审核为违规的信息,并依据所述信息的内容,将发送相似内容的所述信息的发送号码设定为归属于同一发送群,形成多个发送群;
分析模块,用于分析所述发送群中的发送号码,使所述发送号码中疑似具有相同行为、且疑似属于同一用户的多个发送号码归属于同一初步疑似违规群;
判断模块,用于分析所述初步疑似违规群内发送号码的社交特征和与所述初步疑似违规群相对应的信息接收群的社交特征,判断所述初步疑似违规群是否为确定疑似违规群。
可选地,所述分析模块具体包括:
交叠分析单元,用于对所述多个发送群中的发送号码进行交叠分析,提取出同时出现在第一预定数量个发送群中的疑似违规发送号码;
聚类分析单元,用于对所提取出的所述疑似违规发送号码进行聚类分析,将同时出现在相同的第二预定数量个发送群中的所述疑似违规发送号码确定为疑似具有相似行为、且疑似属于同一用户,并归属于同一所述初步疑似违规群。
可选地,所述判断模块具体包括:
第一分析单元,用于分析所述初步疑似违规群内发送号码的发送行为特征,获得第一特征值;
第二分析单元,用于分析所述初步疑似违规群内发送号码的社交关系特征,获得第二特征值;
第三分析单元,用于分析所述信息接收群内接收号码的社交关系特征,获取第三特征值;
第四分析单元,用于分析所述初步疑似违规群内发送号码与所述信息接收群内接收号码之间的社交关系特征,获取第四特征值。
可选地,所述判断模块还包括:
计算单元,用于依据预先设定的所述第一特征值、所述第二特征值、所述第三特征值以及所述第四特征值所占权重进行计算,得到所述初步疑似违规群的疑似度;
判断单元,用于将所述疑似度与预设判断标准进行比较,判断所述初步疑似违规群是否为确定疑似违规群。
可选地,所述判断单元具体包括:
比较子单元,用于将所述疑似度与预设判断标准进行比较,判断所述疑似度所处区间,其中所述预设判断标准分为:正常区间、摇摆区间以及违规区间;
判定子单元,用于当所述疑似度处于所述违规区间时,则判定所述初步疑似违规群为确定疑似违规群。
可选地,所述第一分析单元具体包括:
第一计算子单元,用于根据所述初步疑似违规群内所有发送号码在预定时间内所有的信息发送量以及在所述预定时间内的信息接收量,计算所述初步疑似违规群的信息发送接收比;
第二计算子单元,用于计算所述初步疑似违规群内所有发送号码的单日平均信息发送量;
第三计算子单元,用于计算所述初步疑似违规群内所有发送号码的平均在网时长;
第四计算子单元,用于根据所述信息发送接收比、所述单日平均信息发送量以及所述平均在网时长,计算所述第一特征值。
可选地,所述第二分析单元具体包括:
第一获取子单元,用于根据所述初步疑似违规群内所有发送号码的归属地,获取所述初步疑似违规群的地域集中度;
第五计算子单元,用于根据所述初步疑似违规群内发送号码之间的单日平均互相通信的总通信次数以及所述初步疑似违规群内包含的发送号码的总数,计算所述初步疑似违规群的群内联系紧密度;
第六计算子单元,用于根据所述初步疑似违规群内至少两个发送号码进行统一操作的总次数以及所述初步疑似违规群内所有发送号码进行操作的总次数,计算所述初步疑似违规群的行为一致度;
第七计算子单元,用于根据所述初步疑似违规群的地域集中度、群内联系紧密度以及行为一致度,计算所述第二特征值。
可选地,所述第三分析单元具体包括:
第二获取子单元,用于根据所述信息接收群内所有接收号码的归属地,获取所述信息接收群的地域集中度;
第八计算子单元,用于根据所述信息接收群内接收号码之间的单日平均互相通信的总通信次数以及所述信息接收群内包含的接收号码的总数,计算所述信息接收群的群内联系紧密度;
第九计算子单元,用于根据所述信息接收群的地域集中以及群内联系紧密度,计算所述第三特征值。
可选地,所述第四分析单元具体包括:
第十计算子单元,用于根据所述初步疑似违规群内所有发送号码的直接交往用户和所述信息接收群内所有接收号码的直接交往用户,得到所述初步疑似违规群与所述信息接收群的共同交往用户和全部交往用户,计算所述初步疑似违规群与所述信息接收群的社交范围重合率;
第十一计算子单元,用于计算所述初步疑似违规群内所有发送号码与所述信息接收群内所有接收号码首次建立联系的时间到目前分析的时间的平均间隔时间;
第十二计算子单元,用于计算所述初步疑似违规群内其中一发送号码对应的接收号码的平均接收数量;
第十三计算子单元,用于根据所述初步疑似违规群与所述信息接收群的社交范围重合率、所述平均时间间隔以及所述平均接收数量,计算所述第四特征值。
可选地,当判定所述初步疑似违规群为确定疑似违规群时,所述判定装置还包括:
话单分析模块,用于对所述确定疑似违规群内所有发送号码的话单进行分析,当所述话单为异常话单,则判定所述确定疑似违规群为违规信息发送群。
本发明的有益效果是:
在本发明提供的一种违规信息发送群的判定方法中,首先通过对已审核为违规的信息的内容进行分析,可以将疑似具有相同行为、且疑似属于同一用户的多个发送号码归属于同一初步疑似违规群,然后通过进一步对初步疑似违规群内发送号码的社交特征和与初步疑似违规群相对应的信息接收群的社交特征进行分析,可以判断初步疑似违规群是否为确定疑似违规群。与现有技术相比,通过采用内容判定和社交关系判定的方式,能够对违规行为与正常行为进行准确区分,对正常信息进行过滤,有效地判定低频违规信息发送者的确定疑似违规群。另外,通过对确定疑似违规群的话单进行进一步分析,有效地避免了对发送正常信息的发送群进行误判情况的发生,使得对违规信息发送群的判定更加准确。
附图说明
图1表示本发明实施例中违规信息发送群的判定方法的流程图;
图2表示本发明实施例中初步疑似违规群的确定流程图;
图3表示本发明实施例中对初步疑似违规群和信息接收群的社交特征进行分析的流程图;
图4表示本发明实施例中获取第一特征值的计算流程图;
图5表示本发明实施例中获取第二特征值的计算流程图;
图6表示本发明实施例中获取第三特征值的计算流程图;
图7表示本发明实施例中获取第四特征值的计算流程图;
图8表示本发明实施例中对初步疑似违规群和信息接收群的社交特征进行分析的实现架构图;
图9表示本发明实施例中违规信息发送群的判定装置的结构框图;
图10表示本发明实施例中分析模块的结构框图;
图11表示本发明实施例中判断模块的结构框图;
图12表示本发明实施例中判断单元的结构框图;
图13表示本发明实施例中第一分析单元的结构框图;
图14表示本发明实施例中第二分析单元的结构框图;
图15表示本发明实施例中第三分析单元的结构框图;以及
图16表示本发明实施例中第四分析单元的结构框图;
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图及具体实施例对本发明进行详细描述。
实施例一
依据本发明的一个方面,提供了一种违规信息发送群的判定方法,如图1所示,该判定方法包括:
步骤S101、获取已审核为违规的信息,并依据信息的内容,将发送相似内容的信息的发送号码设定为归属于同一发送群,形成多个发送群;
步骤S103、分析发送群中的发送号码,使发送号码中疑似具有相同行为、且疑似属于同一用户的多个发送号码归属于同一初步疑似违规群;
步骤S105、分析初步疑似违规群内发送号码的社交特征和与初步疑似违规群相对应的信息接收群的社交特征,判断初步疑似违规群是否为确定疑似违规群。
在本发明实施例中,首先对已审核为违规的信息的内容进行分析,可以将疑似具有相同行为、且疑似属于同一用户的多个发送号码归属于同一初步疑似违规群,然后通过进一步对初步疑似违规群内发送号码的社交特征和与初步疑似违规群相对应的信息接收群的社交特征进行分析,可以判断初步疑似违规群是否为确定疑似违规群。与现有技术相比,本发明实施例提供的判定方法通过采用内容判定和社交关系判定的方式,能够对违规行为与正常行为进行准确区分,通过将违规行为进行聚类,能够有效地判定低频违规信息发送者的确定疑似违规群,增加了判定违规信息发送群的可靠性。
其中,如图2所示,在本发明实施例中,分析发送群中的发送号码,使发送号码中疑似具有相同行为、且疑似属于同一用户的多个发送号码归属于同一初步疑似违规群(步骤S103)具体包括:
步骤S1031、对多个发送群中的发送号码进行交叠分析,提取出同时出现在第一预定数量个发送群中的疑似违规发送号码;
步骤S1033、对所提取出的疑似违规发送号码进行聚类分析,将同时出现在相同的第二预定数量个发送群中的疑似违规发送号码确定为疑似具有相似行为、且疑似属于同一用户,并归属于同一初步疑似违规群。
由于任一发送群都是根据信息内容进行区分的,为找出疑似属于同一用户的发送号码,因此要从多个发送群中提取出出现次数大于等于第一预定数量的疑似违规号码,然后再对提取出的疑似违规号码进行聚类分析,若存在多个疑似违规号码同时出现在相同的第二预定数量个发送群中,则判定上述多个疑似违规号码疑似具有相似行为、且疑似属于同一用户。其中,可依据上述方式,划分出多个不同的初步疑似违规群,且每一初步疑似违规群均可判定为属于同一用户,因此可以有效地找出低频违规信息发送者的疑似群体,并对其进行统一判断。
具体地,为是本发明实施例中的方案更加清晰,特提供如下参考例,其中,为便于描述,在本发明实施例中定义了如下使用术语,且在后续说明中,如下使用术语可用。
CO:卡号拥有者,CO1、CO2表示不同的卡号拥有者;
SG:发送群,SG1、SG2表示不同的发送群群;
SSG:经分析确认为初步疑似违规群,SSG1、SSG2表示不同的初步疑似违规群;
RG:信息接收群,RG1、RG2表示不同的信息接收群;
SContent:表示一类短信内容,SContent-SG表示一类短信内容对应的发送群。
例如目前存在两类短信内容,其短信内容分别为如表1和表2所示。
Figure BDA0000806247450000101
Figure BDA0000806247450000111
表一
Figure BDA0000806247450000112
表二
根据上述信息内容,可确定发送群SG1=[13100000000,13100000002,13100000003,13812000001]和SG2=[13016000000,15020000000,13100000002,13812000001]。若设定第一预定数量为2,则可得到疑似违规号码为13100000002,13812000001,由于这两个号码同时出现在发送群SG1和SG2中,因此可判定号码13100000002,13812000001疑似具有相似行为、且疑似属于同一用户,使号码13100000002,13812000001归属于同一初步疑似违规群。
在确定初步疑似违规群后,还需要对初步疑似违规群内发送号码的社交特征和与初步疑似违规群相对应的信息接收群的社交特征进行分析,以对初步疑似违规群进行判定。其中,如图3所示,分析初步疑似违规群内发送号码的社交特征和与初步疑似违规群相对应的信息接收群的社交特征,具体包括如下步骤:
步骤S301、分析初步疑似违规群内发送号码的发送行为特征,获得第一特征值;
步骤S303、分析初步疑似违规群内发送号码的社交关系特征,获得第二特征值;
步骤S305、分析信息接收群内接收号码的社交关系特征,获取第三特征值;
步骤S307、分析初步疑似违规群内发送号码与信息接收群内接收号码之间的社交关系特征,获取第四特征值。
其中,由于第一特征值、第二特征值、第三特征值以及第四特征值分别代表不同的特征,而在判定过程中,每一特征在判定过程中所占权重不同,因此在判断初步疑似违规群是否为确定疑似违规群时,首先要依据预先设定的第一特征值、第二特征值、第三特征值以及第四特征值所占权重进行计算,得到初步疑似违规群的疑似度;然后将疑似度与预设判断标准进行比较,判断初步疑似违规群是否为确定疑似违规群。与现有技术相比,使判定过程更加严谨,而且还可根据不同的信息内容确定不同的标准,提高了判定过程的可靠性。
在本发明实施例中,在根据疑似度进行判定时,首先要使疑似度与预设判断标准进行比较,判断疑似度所处区间,其中预设判断标准分为:正常区间、摇摆区间以及违规区间;当疑似度处于违规区间时,则判定初步疑似违规群为确定疑似违规群。当然可以理解的是,在本发明实施例中,预设判定标准可根据不同的违规内容和违规场景进行划分,对此并不进行统一规定。
具体地,如图4所示,在本发明实施例中,分析初步疑似违规群内发送号码的发送行为特征,获得第一特征值(步骤S301)具体包括:
步骤S3011、根据初步疑似违规群内所有发送号码在预定时间内所有的信息发送量以及在预定时间内的信息接收量,计算初步疑似违规群的信息发送接收比;
步骤S3013、计算初步疑似违规群内所有发送号码的单日平均信息发送量;
步骤S3015、计算初步疑似违规群内所有发送号码的平均在网时长;
步骤S3017、根据信息发送接收比、单日平均信息发送量以及平均在网时长,计算第一特征值。
其中,信息发送接收比、单日平均信息发送量以及平均在网时长分别从不同的方面反映了初步疑似违规群的行为特征,通过分析可知,信息发送接收比越大、单日平均信息发送量越靠近预设处罚阈值,平均在网时长越小,则说明该初步疑似违规群的违规嫌疑越高。进一步地,还可根据关于信息发送接收比、单日平均信息发送量以及平均在网时长的自定义函数,计算出该初步疑似违规群的第一特征值,由于该定义函数与实际的违规场景有关,因此对该自定义函数并不进行具体限定。本领域技术人员应该能够根据上述参数计算第一特征值的具体计算方式,在此不详细描述。
具体地,如图5所示,在本发明实施例中,分析初步疑似违规群内发送号码的社交关系特征,获得第二特征值(步骤S303)具体包括:
步骤S3031、根据初步疑似违规群内所有发送号码的归属地,获取初步疑似违规群的地域集中度;
步骤S3033、根据初步疑似违规群内发送号码之间的单日平均互相通信的总通信次数以及初步疑似违规群内包含的发送号码的总数,计算初步疑似违规群的群内联系紧密度;
步骤S3035、根据初步疑似违规群内至少两个发送号码进行统一操作的总次数以及初步疑似违规群内所有发送号码进行操作的总次数,计算初步疑似违规群的行为一致度;
步骤S3037、根据初步疑似违规群的地域集中度、群内联系紧密度以及行为一致度,计算第二特征值。
其中,初步疑似违规群的地域集中度、群内联系紧密度以及行为一致度分别从不同的方面反映了初步疑似违规群的社交关系特征,其中在计算地域集中度时,可以同一地市为完全集中、同一省份为部分集中进行平均值进行计算。当地域集中度越高,群内联系紧密度越小,而行为一致度越大时,则说明该初步疑似违规群的违规嫌疑越高。进一步地,还可根据关于初步疑似违规群的地域集中度、群内联系紧密度以及行为一致度的自定义函数,计算出该初步疑似违规群的第二特征值,由于该定义函数与实际的违规场景有关,因此对该自定义函数并不进行具体限定。本领域技术人员应该能够根据上述参数计算第二特征值的具体计算方式,在此不详细描述。
具体地,如图6所示,在本发明实施例中,分析信息接收群内接收号码的社交关系特征,获取第三特征值(步骤S305)具体包括:
步骤S3051、根据信息接收群内所有接收号码的归属地,获取信息接收群的地域集中度;
步骤S3053、根据信息接收群内接收号码之间的单日平均互相通信的总通信次数以及信息接收群内包含的接收号码的总数,计算信息接收群的群内联系紧密度;
步骤S3055、根据信息接收群的地域集中以及群内联系紧密度,计算第三特征值。
其中,信息接收群的地域集中以及群内联系紧密度分别从不同的方面反映了信息接收群的社交关系特征,其中在计算地域集中度时,可以同一地市为完全集中、同一省份为部分集中进行平均值进行计算。当地域集中度越高,群内联系紧密度越小时,则说明该信息接收群被初步疑似违规群发送违规信息的可能性越大,而初步疑似违规群发送违规信息的可能性越大。进一步地,还可根据关于信息接收群的地域集中以及群内联系紧密度的自定义函数,计算出该初步疑似违规群的第三特征值,由于该定义函数与实际的违规场景有关,因此对该自定义函数并不进行具体限定。本领域技术人员应该能够根据上述参数计算第三特征值的具体计算方式,在此不详细描述。
具体地,如图7所示,在本发明实施例中,分析初步疑似违规群内发送号码与信息接收群内接收号码之间的社交关系特征,获取第四特征值(步骤S307)具体包括:
步骤S3071、根据初步疑似违规群内所有发送号码的直接交往用户和信息接收群内所有接收号码的直接交往用户,得到初步疑似违规群与信息接收群的共同交往用户和全部交往用户,计算初步疑似违规群与信息接收群的社交范围重合率;
步骤S3073、计算初步疑似违规群内所有发送号码与信息接收群内所有接收号码首次建立联系的时间到目前分析的时间的平均间隔时间;
步骤S3075、计算初步疑似违规群内其中一发送号码对应的接收号码的平均接收数量;
步骤S3077、根据初步疑似违规群与信息接收群的社交范围重合率、平均时间间隔以及平均接收数量,计算第四特征值。
其中,初步疑似违规群与信息接收群的社交范围重合率、平均时间间隔以及平均接收数量分别从不同的方面反映了初步疑似违规群与信息接收群之间的社交关系特征,通过分析可以得知,当初步疑似违规群与信息接收群的社交范围重合率越小,平均间隔时间越短,平均接收数量越大时,该初步疑似违规群的违规嫌疑越高。进一步地,还可根据关于初步疑似违规群与信息接收群的社交范围重合率、平均时间间隔以及平均接收数量的自定义函数,计算出该初步疑似违规群的第四特征值,由于该定义函数与实际的违规场景有关,因此对该自定义函数并不进行具体限定。本领域技术人员应该能够根据上述参数计算第四特征值的具体计算方式,在此不详细描述。
由上述可知,分别说明了分析初步疑似违规群内发送号码的社交特征和与初步疑似违规群相对应的信息接收群的社交特征时,应需要获取的相关计算量。其中,在对初步疑似违规群内发送号码的社交特征和与初步疑似违规群相对应的信息接收群的社交特征进行分析时,还可增加其他相关计算量,以使得对初步疑似违规群的判定更加明显,在后续计算初步疑似违规群的疑似度时更为精确。
其中,在分析初步疑似违规群内发送号码的社交特征和与初步疑似违规群相对应的信息接收群的社交特征时,其实现架构图如图8所示,即分别对初步疑似违规群的行为信息、群内社交关系、与初步疑似违规群相对应的接收群的群内社交关系信息以及初步疑似违规群与接收群之间的社交关系信息进行分析,并获取相应得分,最后通过每一项所占权重,计算得到初步疑似违规群的疑似度得分。与现有技术相比,涉及范围更加全面,判定更加准确,能够对违规行为与正常行为进行准确区分,有效地判定低频违规信息发送者的确定疑似违规群。
具体地,如图1所示,在本发明实施例中,当判定初步疑似违规群为确定疑似违规群时,该判定方法还包括:
步骤S107、对确定疑似违规群内所有发送号码的话单进行分析,当话单为异常话单,则判定确定疑似违规群为违规信息发送群。
通过对确定疑似违规群进一步持续追踪,并对其话单进行分析,当确定疑似违规群的话单出现异常,则可以判定该确定疑似违规群为违规信息发送群,因此避免了对发送正常信息的发送群进行误判情况的发生,使得对违规信息发送群的判定更加准确。
实施例二
依据本发明的另一个方面,还提供了一种违规信息发送群的判定装置,如图9所示,该判定装置900包括:
获取模块901,用于获取已审核为违规的信息,并依据信息的内容,将发送相似内容的信息的发送号码设定为归属于同一发送群,形成多个发送群;
分析模块903,用于分析发送群中的发送号码,使发送号码中疑似具有相同行为、且疑似属于同一用户的多个发送号码归属于同一初步疑似违规群;
判断模块905,用于分析初步疑似违规群内发送号码的社交特征和与初步疑似违规群相对应的信息接收群的社交特征,判断初步疑似违规是否为确定疑似违规群。
在本发明实施例中,可通过获取模块901和分析模块903提取出疑似具有相同行为、且疑似属于同一用户的多个发送号码,并使其归属于同一初步疑似违规群,然后通过判断模块905进一步对初步疑似违规群内发送号码的社交特征和与初步疑似违规群相对应的信息接收群的社交特征进行分析,可以判断初步疑似违规群是否为确定疑似违规群。因此,本发明提供的判定装置通过采用内容判定和社交关系判定的方式,能够对违规行为与正常行为进行准确区分,通过将违规行为进行聚类,能够有效地判定低频违规信息发送者的确定疑似违规群,增加了判定违规信息发送群的可靠性。
其中,如图10所示,该分析模块903具体包括:
交叠分析单元9031,用于对多个发送群中的发送号码进行交叠分析,提取出同时出现在第一预定数量个发送群中的疑似违规发送号码;
聚类分析单元9033,用于对所提取出的疑似违规发送号码进行聚类分析,将同时出现在相同的第二预定数量个发送群中的疑似违规发送号码确定为疑似具有相似行为、且疑似属于同一用户,并归属于同一初步疑似违规群。
通过交叠分析单元9031和聚类分析单元9033可划分出多个不同的初步疑似违规群,且每一初步疑似违规群均可判定为属于同一用户,因此可以有效地找出低频违规信息发送者的疑似群体,并对其进行统一判断。另外在确定初步疑似违规群后,还需要判断模块905对初步疑似违规群内发送号码的社交特征和与初步疑似违规群相对应的信息接收群的社交特征进行分析,以对初步疑似违规群进行判定。
具体地,如图11所示,在本发明实施例中,判断模块905具体包括:
第一分析单元9051,用于分析初步疑似违规群内发送号码的发送行为特征,获得第一特征值;
第二分析单元9052,用于分析初步疑似违规群内发送号码的社交关系特征,获得第二特征值;
第三分析单元9053,用于分析信息接收群内接收号码的社交关系特征,获取第三特征值;
第四分析单元9054,用于分析初步疑似违规群内发送号码与信息接收群内接收号码之间的社交关系特征,获取第四特征值。
由于第一特征值、第二特征值、第三特征值以及第四特征值分别代表不同的特征,而在判定过程中,每一特征在判定过程中所占权重不同,因此在判断初步疑似违规群是否为确定疑似违规群时,还要依据预先设定权重进行计算。因此,如图11所示,在本发明实施例中,判断模块905还包括:
计算单元9055,用于依据预先设定的第一特征值、第二特征值、第三特征值以及第四特征值所占权重进行计算,得到初步疑似违规群的疑似度;
判断单元9056,用于将疑似度与预设判断标准进行比较,判断初步疑似违规群是否为确定疑似违规群。
其中,如图12所示,判断单元9056具体包括:
比较子单元90561,用于将疑似度与预设判断标准进行比较,判断疑似度所处区间,其中预设判断标准分为:正常区间、摇摆区间以及违规区间;其中,在本发明实施例中,预设判定标准可根据不同的违规内容和违规场景进行划分,对此并不进行统一规定。
判定子单元90563,用于当疑似度处于违规区间时,则判定初步疑似违规群为确定疑似违规群。
与现有技术相比,使用该判定装置进行判定时,涉及更加全面,因此判定过程更加严谨,而且还可根据不同的信息内容确定不同的标准,提高了判定过程的可靠性。
具体地,如图13所示,在本发明实施例中,第一分析单元9051具体包括:
第一计算子单元90511,用于根据初步疑似违规群内所有发送号码在预定时间内所有的信息发送量以及在预定时间内的信息接收量,计算初步疑似违规群的信息发送接收比;
第二计算子单元90513,用于计算初步疑似违规群内所有发送号码的单日平均信息发送量;
第三计算子单元90515,用于计算初步疑似违规群内所有发送号码的平均在网时长;
第四计算子单元90517,用于根据信息发送接收比、单日平均信息发送量以及平均在网时长,计算第一特征值。
通过分析可知,信息发送接收比越大、单日平均信息发送量越靠近预设处罚阈值,平均在网时长越小,则说明该初步疑似违规群的违规嫌疑越高。进一步地,还可根据关于信息发送接收比、单日平均信息发送量以及平均在网时长的自定义函数,计算出该初步疑似违规群的第一特征值,由于该定义函数与实际的违规场景有关,因此对该自定义函数并不进行具体限定。本领域技术人员应该能够根据上述参数计算第一特征值的具体计算方式,在此不详细描述。
具体地,如图14所示,在本发明实施例中,第二分析单元9052具体包括:
第一获取子单元90521,用于根据初步疑似违规群内所有发送号码的归属地,获取初步疑似违规群的地域集中度;其中在计算地域集中度时,可以同一地市为完全集中、同一省份为部分集中进行平均值进行计算。
第五计算子单元90523,用于根据初步疑似违规群内发送号码之间的单日平均互相通信的总通信次数以及初步疑似违规群内包含的发送号码的总数,计算初步疑似违规群的群内联系紧密度;
第六计算子单元90525,用于根据初步疑似违规群内至少两个发送号码进行统一操作的总次数以及初步疑似违规群内所有发送号码进行操作的总次数,计算初步疑似违规群的行为一致度;
第七计算子单元90527,用于根据初步疑似违规群的地域集中度、群内联系紧密度以及行为一致度,计算第二特征值。
通过分析可知,当地域集中度越高,群内联系紧密度越小,而行为一致度越大时,则说明该初步疑似违规群的违规嫌疑越高。进一步地,还可根据关于初步疑似违规群的地域集中度、群内联系紧密度以及行为一致度的自定义函数,计算出该初步疑似违规群的第二特征值,由于该定义函数与实际的违规场景有关,因此对该自定义函数并不进行具体限定。本领域技术人员应该能够根据上述参数计算第二特征值的具体计算方式,在此不详细描述。
具体地,如图15所示,在本发明实施例中,第三分析单元9053具体包括:
第二获取子单元90531,用于根据信息接收群内所有接收号码的归属地,获取信息接收群的地域集中度;其中在计算地域集中度时,可以同一地市为完全集中、同一省份为部分集中进行平均值进行计算。
第八计算子单元90533,用于根据信息接收群内接收号码之间的单日平均互相通信的总通信次数以及信息接收群内包含的接收号码的总数,计算信息接收群的群内联系紧密度;
第九计算子单元90535,用于根据信息接收群的地域集中以及群内联系紧密度,计算第三特征值。
通过分析可知,当地域集中度越高,群内联系紧密度越小时,则说明该信息接收群被初步疑似违规群发送违规信息的可能性越大,而初步疑似违规群发送违规信息的可能性越大。进一步地,还可根据关于信息接收群的地域集中以及群内联系紧密度的自定义函数,计算出该初步疑似违规群的第三特征值,由于该定义函数与实际的违规场景有关,因此对该自定义函数并不进行具体限定。本领域技术人员应该能够根据上述参数计算第三特征值的具体计算方式,在此不详细描述。
具体地,如图16所示,在本发明实施例中,第四分析单元9054具体包括:
第十计算子单元90541,用于根据初步疑似违规群内所有发送号码的直接交往用户和信息接收群内所有接收号码的直接交往用户,得到初步疑似违规群与信息接收群的共同交往用户和全部交往用户,计算初步疑似违规群与信息接收群的社交范围重合率;
第十一计算子单元90543,用于计算初步疑似违规群内所有发送号码与信息接收群内所有接收号码首次建立联系的时间到目前分析的时间的平均间隔时间;
第十二计算子单元90545,用于计算初步疑似违规群内其中一发送号码对应的接收号码的平均接收数量;
第十三计算子单元90547,用于根据初步疑似违规群与信息接收群的社交范围重合率、平均时间间隔以及平均接收数量,计算第四特征值。
通过分析可以得知,当初步疑似违规群与信息接收群的社交范围重合率越小,平均间隔时间越短,平均接收数量越大时,该初步疑似违规群的违规嫌疑越高。进一步地,还可根据关于初步疑似违规群与信息接收群的社交范围重合率、平均时间间隔以及平均接收数量的自定义函数,计算出该初步疑似违规群的第四特征值,由于该定义函数与实际的违规场景有关,因此对该自定义函数并不进行具体限定。本领域技术人员应该能够根据上述参数计算第四特征值的具体计算方式,在此不详细描述。
其中,在本发明实施例中,在对初步疑似违规群内发送号码的社交特征和与初步疑似违规群相对应的信息接收群的社交特征进行分析时,还可增加其他相关计算量,以使得对初步疑似违规群的判定更加明显,在后续计算初步疑似违规群的疑似度时更为精确。
进一步地,如图9所示,当判定初步疑似违规群为确定疑似违规群时,判定装置还包括:
话单分析模块909,用于对确定疑似违规群内所有发送号码的话单进行分析,当话单为异常话单,则判定确定疑似违规群为违规信息发送群。
因此,通过话单分析模块909对确定疑似违规群进一步持续追踪,并对其话单进行分析,能够有效地从确定疑似违规群中确定出违规信息发送群,避免了对发送正常信息的发送群进行误判情况的发生,使得对违规信息发送群的判定更加准确。
以上所述的是本发明的优选实施方式,应当指出对于本技术领域的普通人员来说,在不脱离本发明所述的原理前提下还可以作出若干改进和润饰,这些改进和润饰也在本发明的保护范围内。

Claims (18)

1.一种违规信息发送群的判定方法,其特征在于,所述判定方法包括:
获取已审核为违规的信息,并依据所述信息的内容,将发送相似内容的所述信息的发送号码设定为归属于同一发送群,形成多个发送群;
分析所述发送群中的发送号码,使所述发送号码中疑似具有相同行为、且疑似属于同一用户的多个发送号码归属于同一初步疑似违规群;
分析所述初步疑似违规群内发送号码的社交特征和与所述初步疑似违规群相对应的信息接收群的社交特征,判断所述初步疑似违规群是否为确定疑似违规群;
对所述确定疑似违规群内所有发送号码的话单进行分析,当所述话单为异常话单,则判定所述确定疑似违规群为违规信息发送群。
2.如权利要求1所述的判定方法,其特征在于,所述分析所述发送群中的发送号码,使所述发送号码中疑似具有相同行为、且疑似属于同一用户的多个发送号码归属于同一初步疑似违规群的步骤具体包括:
对所述多个发送群中的发送号码进行交叠分析,提取出同时出现在第一预定数量个发送群中的疑似违规发送号码;
对所提取出的所述疑似违规发送号码进行聚类分析,将同时出现在相同的第二预定数量个发送群中的所述疑似违规发送号码确定为疑似具有相似行为、且疑似属于同一用户,并归属于同一所述初步疑似违规群。
3.如权利要求1所述的判定方法,其特征在于,所述分析所述初步疑似违规群内发送号码的社交特征和与所述初步疑似违规群相对应的信息接收群的社交特征的步骤具体包括:
分析所述初步疑似违规群内发送号码的发送行为特征,获得第一特征值;
分析所述初步疑似违规群内发送号码的社交关系特征,获得第二特征值;
分析所述信息接收群内接收号码的社交关系特征,获取第三特征值;
分析所述初步疑似违规群内发送号码与所述信息接收群内接收号码之间的社交关系特征,获取第四特征值。
4.如权利要求3所述的判定方法,其特征在于,所述判断所述初步疑似违规群是否为确定疑似违规群的步骤具体包括:
依据预先设定的所述第一特征值、所述第二特征值、所述第三特征值以及所述第四特征值所占权重进行计算,得到所述初步疑似违规群的疑似度;
将所述疑似度与预设判断标准进行比较,判断所述初步疑似违规群是否为确定疑似违规群。
5.如权利要求4所述的判定方法,其特征在于,所述将所述疑似度与预设判断标准进行比较,判断所述初步疑似违规群是否为确定疑似违规群的步骤具体包括:
将所述疑似度与预设判断标准进行比较,判断所述疑似度所处区间,其中所述预设判断标准分为:正常区间、摇摆区间以及违规区间;
当所述疑似度处于所述违规区间时,则判定所述初步疑似违规群为确定疑似违规群。
6.如权利要求3所述的判定方法,其特征在于,所述分析所述初步疑似违规群内发送号码的发送行为特征,获得第一特征值的步骤具体包括:
根据所述初步疑似违规群内所有发送号码在预定时间内所有的信息发送量以及在所述预定时间内的信息接收量,计算所述初步疑似违规群的信息发送接收比;
计算所述初步疑似违规群内所有发送号码的单日平均信息发送量;
计算所述初步疑似违规群内所有发送号码的平均在网时长;
根据所述信息发送接收比、所述单日平均信息发送量以及所述平均在网时长,计算所述第一特征值。
7.如权利要求3所述的判定方法,其特征在于,所述分析所述初步疑似违规群内发送号码的社交关系特征,获得第二特征值的步骤具体包括:
根据所述初步疑似违规群内所有发送号码的归属地,获取所述初步疑似违规群的地域集中度;
根据所述初步疑似违规群内发送号码之间的单日平均互相通信的总通信次数以及所述初步疑似违规群内包含的发送号码的总数,计算所述初步疑似违规群的群内联系紧密度;
根据所述初步疑似违规群内至少两个发送号码进行统一操作的总次数以及所述初步疑似违规群内所有发送号码进行操作的总次数,计算所述初步疑似违规群的行为一致度;
根据所述初步疑似违规群的地域集中度、群内联系紧密度以及行为一致度,计算所述第二特征值。
8.如权利要求3所述的判定方法,其特征在于,所述分析所述信息接收群内接收号码的社交关系特征,获取第三特征值的步骤具体包括:
根据所述信息接收群内所有接收号码的归属地,获取所述信息接收群的地域集中度;
根据所述信息接收群内接收号码之间的单日平均互相通信的总通信次数以及所述信息接收群内包含的接收号码的总数,计算所述信息接收群的群内联系紧密度;
根据所述信息接收群的地域集中以及群内联系紧密度,计算所述第三特征值。
9.如权利要求3所述的判定方法,其特征在于,所述分析所述初步疑似违规群内发送号码与所述信息接收群内接收号码之间的社交关系特征,获取第二特征值的步骤具体包括:
根据所述初步疑似违规群内所有发送号码的直接交往用户和所述信息接收群内所有接收号码的直接交往用户,得到所述初步疑似违规群与所述信息接收群的共同交往用户和全部交往用户,计算所述初步疑似违规群与所述信息接收群的社交范围重合率;
计算所述初步疑似违规群内所有发送号码与所述信息接收群内所有接收号码首次建立联系的时间到目前分析的时间的平均间隔时间;
计算所述初步疑似违规群内其中一发送号码对应的接收号码的平均接收数量;
根据所述初步疑似违规群与所述信息接收群的社交范围重合率、所述平均时间间隔以及所述平均接收数量,计算所述第四特征值。
10.一种违规信息发送群的判定装置,其特征在于,所述判定装置包括:
获取模块,用于获取已审核为违规的信息,并依据所述信息的内容,将发送相似内容的所述信息的发送号码设定为归属于同一发送群,形成多个发送群;
分析模块,用于分析所述发送群中的发送号码,使所述发送号码中疑似具有相同行为、且疑似属于同一用户的多个发送号码归属于同一初步疑似违规群;
判断模块,用于分析所述初步疑似违规群内发送号码的社交特征和与所述初步疑似违规群相对应的信息接收群的社交特征,判断所述初步疑似违规群是否为确定疑似违规群;
话单分析模块,用于对所述确定疑似违规群内所有发送号码的话单进行分析,当所述话单为异常话单,则判定所述确定疑似违规群为违规信息发送群。
11.如权利要求10所述的判定装置,其特征在于,所述分析模块具体包括:
交叠分析单元,用于对所述多个发送群中的发送号码进行交叠分析,提取出同时出现在第一预定数量个发送群中的疑似违规发送号码;
聚类分析单元,用于对所提取出的所述疑似违规发送号码进行聚类分析,将同时出现在相同的第二预定数量个发送群中的所述疑似违规发送号码确定为疑似具有相似行为、且疑似属于同一用户,并归属于同一所述初步疑似违规群。
12.如权利要求10所述的判定装置,其特征在于,所述判断模块具体包括:
第一分析单元,用于分析所述初步疑似违规群内发送号码的发送行为特征,获得第一特征值;
第二分析单元,用于分析所述初步疑似违规群内发送号码的社交关系特征,获得第二特征值;
第三分析单元,用于分析所述信息接收群内接收号码的社交关系特征,获取第三特征值;
第四分析单元,用于分析所述初步疑似违规群内发送号码与所述信息接收群内接收号码之间的社交关系特征,获取第四特征值。
13.如权利要求12所述的判定装置,其特征在于,所述判断模块还包括:
计算单元,用于依据预先设定的所述第一特征值、所述第二特征值、所述第三特征值以及所述第四特征值所占权重进行计算,得到所述初步疑似违规群的疑似度;
判断单元,用于将所述疑似度与预设判断标准进行比较,判断所述初步疑似违规群是否为确定疑似违规群。
14.如权利要求13所述的判定装置,其特征在于,所述判断单元具体包括:
比较子单元,用于将所述疑似度与预设判断标准进行比较,判断所述疑似度所处区间,其中所述预设判断标准分为:正常区间、摇摆区间以及违规区间;
判定子单元,用于当所述疑似度处于所述违规区间时,则判定所述初步疑似违规群为确定疑似违规群。
15.如权利要求12所述的判定装置,其特征在于,所述第一分析单元具体包括:
第一计算子单元,用于根据所述初步疑似违规群内所有发送号码在预定时间内所有的信息发送量以及在所述预定时间内的信息接收量,计算所述初步疑似违规群的信息发送接收比;
第二计算子单元,用于计算所述初步疑似违规群内所有发送号码的单日平均信息发送量;
第三计算子单元,用于计算所述初步疑似违规群内所有发送号码的平均在网时长;
第四计算子单元,用于根据所述信息发送接收比、所述单日平均信息发送量以及所述平均在网时长,计算所述第一特征值。
16.如权利要求12所述的判定装置,其特征在于,所述第二分析单元具体包括:
第一获取子单元,用于根据所述初步疑似违规群内所有发送号码的归属地,获取所述初步疑似违规群的地域集中度;
第五计算子单元,用于根据所述初步疑似违规群内发送号码之间的单日平均互相通信的总通信次数以及所述初步疑似违规群内包含的发送号码的总数,计算所述初步疑似违规群的群内联系紧密度;
第六计算子单元,用于根据所述初步疑似违规群内至少两个发送号码进行统一操作的总次数以及所述初步疑似违规群内所有发送号码进行操作的总次数,计算所述初步疑似违规群的行为一致度;
第七计算子单元,用于根据所述初步疑似违规群的地域集中度、群内联系紧密度以及行为一致度,计算所述第二特征值。
17.如权利要求12所述的判定装置,其特征在于,所述第三分析单元具体包括:
第二获取子单元,用于根据所述信息接收群内所有接收号码的归属地,获取所述信息接收群的地域集中度;
第八计算子单元,用于根据所述信息接收群内接收号码之间的单日平均互相通信的总通信次数以及所述信息接收群内包含的接收号码的总数,计算所述信息接收群的群内联系紧密度;
第九计算子单元,用于根据所述信息接收群的地域集中以及群内联系紧密度,计算所述第三特征值。
18.如权利要求12所述的判定装置,其特征在于,所述第四分析单元具体包括:
第十计算子单元,用于根据所述初步疑似违规群内所有发送号码的直接交往用户和所述信息接收群内所有接收号码的直接交往用户,得到所述初步疑似违规群与所述信息接收群的共同交往用户和全部交往用户,计算所述初步疑似违规群与所述信息接收群的社交范围重合率;
第十一计算子单元,用于计算所述初步疑似违规群内所有发送号码与所述信息接收群内所有接收号码首次建立联系的时间到目前分析的时间的平均间隔时间;
第十二计算子单元,用于计算所述初步疑似违规群内其中一发送号码对应的接收号码的平均接收数量;
第十三计算子单元,用于根据所述初步疑似违规群与所述信息接收群的社交范围重合率、所述平均时间间隔以及所述平均接收数量,计算所述第四特征值。
CN201510599132.5A 2015-09-18 2015-09-18 一种违规信息发送群的判定方法及装置 Active CN106549851B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510599132.5A CN106549851B (zh) 2015-09-18 2015-09-18 一种违规信息发送群的判定方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510599132.5A CN106549851B (zh) 2015-09-18 2015-09-18 一种违规信息发送群的判定方法及装置

Publications (2)

Publication Number Publication Date
CN106549851A CN106549851A (zh) 2017-03-29
CN106549851B true CN106549851B (zh) 2020-01-21

Family

ID=58362444

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510599132.5A Active CN106549851B (zh) 2015-09-18 2015-09-18 一种违规信息发送群的判定方法及装置

Country Status (1)

Country Link
CN (1) CN106549851B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109547319A (zh) * 2017-09-22 2019-03-29 中移(杭州)信息技术有限公司 一种消息处理方法及装置
CN107995192B (zh) * 2017-12-01 2020-12-04 贵州电网有限责任公司 一种网络边界违规内联的检测与阻断系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103067896A (zh) * 2013-01-17 2013-04-24 中国联合网络通信集团有限公司 垃圾短信过滤方法及装置
CN103139730A (zh) * 2011-11-23 2013-06-05 上海粱江通信系统股份有限公司 用于识别大量号码低频发送垃圾短信情况的方法
CN103838710A (zh) * 2012-11-22 2014-06-04 中国移动通信集团公司 基于关键词权值的文本过滤方法与系统
CN103974214A (zh) * 2014-04-11 2014-08-06 武汉科技大学 低频垃圾短信号码识别系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8364766B2 (en) * 2008-12-04 2013-01-29 Yahoo! Inc. Spam filtering based on statistics and token frequency modeling

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103139730A (zh) * 2011-11-23 2013-06-05 上海粱江通信系统股份有限公司 用于识别大量号码低频发送垃圾短信情况的方法
CN103838710A (zh) * 2012-11-22 2014-06-04 中国移动通信集团公司 基于关键词权值的文本过滤方法与系统
CN103067896A (zh) * 2013-01-17 2013-04-24 中国联合网络通信集团有限公司 垃圾短信过滤方法及装置
CN103974214A (zh) * 2014-04-11 2014-08-06 武汉科技大学 低频垃圾短信号码识别系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
垃圾短信过滤系统的设计与实现;吴世竞;《中国优秀硕士学位论文全文数据库(信息科技辑)》;20120815;全文 *

Also Published As

Publication number Publication date
CN106549851A (zh) 2017-03-29

Similar Documents

Publication Publication Date Title
CN107566358B (zh) 一种风险预警提示方法、装置、介质及设备
US8719940B1 (en) Collaborative phishing attack detection
US8825769B2 (en) Systems and methods for reporter-based filtering of electronic communications and messages
US8874649B2 (en) Determination of a spammer through social network characterization
CN107306306B (zh) 通信号码处理方法及装置
CN110839216B (zh) 识别通讯信息诈骗的方法和装置
CN105678455A (zh) 一种交易风险的监控方法和系统
CN109800320A (zh) 一种图像处理方法、设备及计算机可读存储介质
CN111629010B (zh) 一种恶意用户识别方法及装置
CN105824805B (zh) 一种识别方法及装置
WO2019052169A1 (zh) 坐席监控方法、装置、设备及计算机可读存储介质
CN104598595B (zh) 欺诈网页检测方法及相应装置
CN106952162A (zh) 洗钱风险等级计算方法及系统
CN109842858A (zh) 一种业务异常订购检测方法及装置
CN109889512A (zh) 一种充电桩can报文的异常检测方法及装置
CN105472618A (zh) 伪基站消息识别方法和装置
CN106549851B (zh) 一种违规信息发送群的判定方法及装置
CN110457601B (zh) 社交账号的识别方法和装置、存储介质及电子装置
CN112669187A (zh) 身份识别方法、装置、电子设备及相关产品
KR102297620B1 (ko) 게임 내 성희롱 모니터링 시스템
CN111160919A (zh) 一种区块链地址风险评估方法及装置
CN109242658B (zh) 可疑交易报告生成方法、系统、计算机设备和存储介质
CN109544179B (zh) 基于重要产品追溯数据服务的运行支撑系统
CN109871514B (zh) 一种数据处理方法、装置及存储介质
CN106804039B (zh) 用户安全指数获取方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant