CN105898085A

CN105898085A - 骚扰通信账号的识别方法及装置

Info

Publication number: CN105898085A
Application number: CN201610206839.XA
Authority: CN
Inventors: 李健; 王海波; 邵付东
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2016-04-05
Filing date: 2016-04-05
Publication date: 2016-08-24
Anticipated expiration: 2036-04-05
Also published as: CN105898085B

Abstract

本发明实施例公开了一种骚扰通信账号的识别方法，包括：接收待识别的目标通信账号以及与所述目标通信账号对应的目标设备标识；获取骚扰号码库，所述骚扰号码库中存储了骚扰设备标识以及与所述骚扰设备标识对应的骚扰通信账号；在所述骚扰号码库中查找与所述目标设备标识匹配的骚扰设备标识，获取查找到的骚扰设备标识对应的骚扰通信账号；获取所述骚扰通信账号的第一通信记录和所述目标通信账号的第二通信记录，计算所述第一通信记录与所述第二通信记录的相似度，根据所述相似度判定所述目标通信账号是否为骚扰通信账号。另外，本发明实施例还相应地公开了一种骚扰通信账号的识别装置。采用本发明，可提高识别骚扰通信账号的准确率。

Description

骚扰通信账号的识别方法及装置

技术领域

本发明涉及计算机技术领域，尤其涉及一种骚扰通信账号的识别方法及装置。

背景技术

在现有的通信和互联网的快速发展给人们生活带来越来越多的便利，例如可以使人与人的沟通成了随时随地的事，同时也给我们的生活带来更多的方便。与此同时，日益严重的骚扰电话、推销号码、中介号码给广大群众的正常生活增添了不少麻烦。因此，需要一种对骚扰电话号码识别的机制来减少骚扰电话对用户的干扰。

传统技术中的骚扰电话识别机制基于云安全服务器。当手机呼出/呼入一个陌生号码时，通过网络发起一次号码查询服务；服务器收到请求后，下发给后台查询模块，并匹配号码标记数据库；如果当一个号码被标记数据库匹配到，并且标记骚扰次数(假设为M次)大于等于给定的N次时，则返回骚扰电话和被标记次数；假如号码标记骚扰次数低于N或者标记数据库没有记录时，则作为普通号码返回结果。

然而，发明人经研究发现，当某一个骚扰电话号码被收录到云安全服务器数据库后，骚扰分子拨打电话的成功率将会严重降低，但是骚扰分子通常会快速换一张新的手机卡继续打电话。由于目前换电话号码的成本很低，骚扰分子可以随时买入大量的电话号码，每当其中一个号码被识别为骚扰电话并被拦截后，直接使用另一个号码继续拨打电话。因此，传统技术中的云安全服务器对于此种情况下的骚扰电话号码在识别时会遗漏，从而导致识别骚扰电话号码的准确度不高。

发明内容

基于此，为解决传统技术中骚扰用户通过更换电话号码等通信账号的方式来规避云安全服务屏蔽的方式所导致的识别骚扰通信账号的准确度不高的技术问题，特提出了一种骚扰通信账号的识别方法。

一种骚扰通信账号的识别方法，包括：

接收待识别的目标通信账号以及与所述目标通信账号对应的目标设备标识；

获取骚扰号码库，所述骚扰号码库中存储了骚扰设备标识以及与所述骚扰设备标识对应的骚扰通信账号；

在所述骚扰号码库中查找与所述目标设备标识匹配的骚扰设备标识，获取查找到的骚扰设备标识对应的骚扰通信账号；

获取所述骚扰通信账号的第一通信记录和所述目标通信账号的第二通信记录，计算所述第一通信记录与所述第二通信记录的相似度，根据所述相似度判定所述目标通信账号是否为骚扰通信账号。

可选的，在其中一个实施例中，所述通信记录包括通信账号对应的在预设的通信时间属性、通信对象属性和/或通信频率属性下的属性值。

可选的，在其中一个实施例中，所述计算所述第一通信记录与所述第二通信记录的相似度的步骤为：计算第一通信记录与所述第二通信记录各自在所述通信时间属性、通信对象属性和/或通信频率属性下的属性值的余弦相似度，以所述余弦相似度作为所述第一通信记录与所述第二通信记录的相似度。

可选的，在其中一个实施例中，所述计算第一通信记录与所述第二通信记录各自在所述通信时间属性、通信对象属性和/或通信频率属性下的属性值的余弦相似度为根据公式：

S_{i, j} = c o s (θ) = \frac{Σ_{k = 1}^{K} (f_{i, k} \times f_{j . k})}{\sqrt{Σ_{k = 1}^{K} {(f_{i, k})}^{2}} \times \sqrt{Σ_{k = 1}^{K} {(f_{j, k})}^{2}}}

计算余弦相似度S_i，j；其中，j和i分别表示目标通信账号和查找到的骚扰通信账号的标识，K为通信时间属性、通信对象属性和/或通信频率属性的数量，f_i，k和f_j，k分别为第一通信记录和第二通信记录在第k个属性下的属性值。

可选的，在其中一个实施例中，所述通信记录还包括通信账号对应的通信内容。

可选的，在其中一个实施例中，所述计算所述第一通信记录与所述第二通信记录的相似度的步骤还包括：计算所述第一通信记录中的通信内容与所述第二通信记录的通信内容的内容相似度，结合所述余弦相似度和所述内容相似度得到所述第一通信记录与所述第二通信记录的相似度。

可选的，在其中一个实施例中，所述根据所述相似度判定所述目标通信账号是否为骚扰通信账号的步骤为：判断所述相似度是否大于阈值，若是，则判定所述目标通信账号为骚扰通信账号。

可选的，在其中一个实施例中，所述方法还包括：获取所述目标通信账号对应的举报次数，在所述举报次数大于阈值时，判定所述目标通信账号为骚扰通信账号，将所述被判定为骚扰通信账号的目标通信账号及其对应的目标设备标识添加到所述骚扰号码库中。

可选的，在其中一个实施例中，所述目标通信账号为电话号码、即时通信应用的用户账号或社交网络应用的用户账号。

可选的，在其中一个实施例中，所述方法还包括：在所述目标通信账号与所述查找到的骚扰通信账号相同时，判定所述目标通信账号为骚扰通信账号。

此外，为解决传统技术中骚扰用户通过更换电话号码等通信账号的方式来规避云安全服务屏蔽的方式所导致的识别骚扰通信账号的准确度不高的技术问题，特提出了一种骚扰通信账号的识别装置。

一种骚扰通信账号的识别装置，包括：

目标设备标识接收模块，用于接收待识别的目标通信账号以及与所述目标通信账号对应的目标设备标识；

骚扰号码库获取模块，用于获取骚扰号码库，所述骚扰号码库中存储了骚扰设备标识以及与所述骚扰设备标识对应的骚扰通信账号；

骚扰通信账号获取模块，用于在所述骚扰号码库中查找与所述目标设备标识匹配的骚扰设备标识，获取查找到的骚扰设备标识对应的骚扰通信账号；

第一骚扰通信账号判定模块，用于获取所述骚扰通信账号的第一通信记录和所述目标通信账号的第二通信记录，计算所述第一通信记录与所述第二通信记录的相似度，根据所述相似度判定所述目标通信账号是否为骚扰通信账号。

可选的，在其中一个实施例中，所述第一骚扰通信账号判定模块还用于计算第一通信记录与所述第二通信记录各自在所述通信时间属性、通信对象属性和/或通信频率属性下的属性值的余弦相似度，以所述余弦相似度作为所述第一通信记录与所述第二通信记录的相似度。

可选的，在其中一个实施例中，所述第一骚扰通信账号判定模块还用于根据公式：

S_{i, j} = c o s (θ) = \frac{Σ_{k = 1}^{K} (f_{i, k} \times f_{j . k})}{\sqrt{Σ_{k = 1}^{K} {(f_{i, k})}^{2}} \times \sqrt{Σ_{k = 1}^{K} {(f_{j, k})}^{2}}}

可选的，在其中一个实施例中，所述第一骚扰通信账号判定模块还用于计算所述第一通信记录中的通信内容与所述第二通信记录的通信内容的内容相似度，结合所述余弦相似度和所述内容相似度得到所述第一通信记录与所述第二通信记录的相似度。

可选的，在其中一个实施例中，所述第一骚扰通信账号判定模块还用于判断所述相似度是否大于阈值，在所述相似度大于阈值时，判定所述目标通信账号为骚扰通信账号。

可选的，在其中一个实施例中，所述装置还包括骚扰通信账号添加模块，用于获取所述目标通信账号对应的举报次数，在所述举报次数大于阈值时，判定所述目标通信账号为骚扰通信账号，将所述被判定为骚扰通信账号的目标通信账号及其对应的目标设备标识添加到所述骚扰号码库中。

可选的，在其中一个实施例中，所述装置还包括第二骚扰通信账号判定模块，用于在所述目标通信账号与所述查找到的骚扰通信账号相同时，判定所述目标通信账号为骚扰通信账号。

实施本发明实施例，将具有如下有益效果：

采用了上述骚扰通信账号的识别方法及装置之后，即使骚扰用户更换了手机号等通信账号，但只要他仍然使用相同的设备传播骚扰信息，服务器也能够根据更换的手机号的通信记录与已被标记为骚扰账号的通信记录的相似性，将更换的手机号识别为骚扰号码，从而在骚扰用户采用低成本的更换通信账号的方式传播骚扰信息时，也能够准确地识别出骚扰号码，从而提高了骚扰通信账号识别的准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

其中：

图1为传统技术中依赖用户举报数据的云识别骚扰号码的系统架构图；

图2为一个实施例中一种骚扰通信账号的识别方法的流程示意图；

图3为一个实施例中一种骚扰通信账号的识别装置的结构示意图；

图4为一个实施例中运行前述骚扰通信账号的识别方法的计算机设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

传统技术中的依赖用户举报式的骚扰通信账号识别系统，如图1所示，终端上安装有通话应用、即时通信应用或社交网络应用的客户端程序。例如，用户在使用手机上的通话应用接听电话时，手机上的通话应用则将接听到的目标电话号码上传给处于云端的(用于处理骚扰号码的服务器集群)服务器上。服务器根据目标电话号码的历史记录中被举报的次数判定是否目标电话号码是否为骚扰号码。然后，服务器将根据用户举报检测到的骚扰电话号码存储为：

P＝{p₁,p₂...p_N}。

若需要识别某个号码是否为骚扰号码，则判断该号码是否属于P＝{p₁,p₂...p_N}，若是则该号码被识别为骚扰号码。但是，若骚扰用户更换了电话卡从而更改了电话号码之后，则存在j，则p_j在P＝{p₁,p₂...p_N}中查询不到，因此，对骚扰用户更换电话号码的方式，传统技术中只能等待漫长的举报过程才能对其进行识别，识别准确率较低。

为解决传统技术中骚扰用户通过更换电话号码等通信账号的方式来规避云安全服务屏蔽的方式所导致的识别骚扰通信账号的准确度不高的技术问题，特提出了一种骚扰通信账号的识别方法。该方法的实现可依赖于计算机程序，该计算机程序可运行于基于冯诺依曼体系的计算机系统之上，该计算机程序可以是手机自动屏蔽骚扰电话或者骚扰短信的应用程序的服务器程序，或者该计算机程序也可以是社交网络应用的服务器程序，该执行上述服务器程序的计算机系统可以是上述应用相应的服务器设备。

具体的，如图2所示，该骚扰通信账号的识别方法包括：

步骤S102：接收待识别的目标通信账号以及与目标通信账号对应的目标设备标识。

目标通信账号可以是电话号码、即时通信应用的用户账号或社交网络应用的用户账号。

在一个手机上自动屏蔽骚扰电话应用的应用场景中，自动屏蔽骚扰电话应用的客户端程序在手机接收到呼叫时，则通过API得到接收到的呼叫的电话号码，然后将该电话号码上传服务器作为目标通信账号输入。同时，也将该手机的设备标识，例如，IMEI号(即International Mobile Equipment Identity，国际移动设备标识，全球唯一的设备标识号)一并上传至服务器。

而在一个即时通信应用或社交网络应用自动屏蔽骚扰用户或广告用户的应用场景中，骚扰用户或广告用户通过即时通信应用或社交网络应用的客户端发布骚扰内容时，服务器会接收到骚扰用户或广告用户的用户账号作为目标通信账号，同时，服务器也可通过网络层获取骚扰用户或广告用户的MAC地址作为目标设备标识。

步骤S104：获取骚扰号码库，骚扰号码库中存储了骚扰设备标识以及与骚扰设备标识对应的骚扰通信账号。

在本实施例中，骚扰号码库基于前述的骚扰通信账号识别系统中根据用户举报的数据已统计的存储的骚扰通信账号的集合P得到：

P＝{p₁,p₂...p_N}；

另外，在建立骚扰号码库的过程中，还记录了相应的骚扰用户使用的设备的骚扰设备标识：

M＝{m₁,m₂...m_N}。

相应的，在骚扰号码库中存储的骚扰设备标识以及与所述骚扰设备标识对应的骚扰通信账号即为：

R_(P,M)＝{(p₁,m₁),(p₂,m₂)...(p_N,m_N)}；

号码p_i与设备m_i对应。

步骤S106：在骚扰号码库中查找与目标设备标识匹配的骚扰设备标识，获取查找到的骚扰设备标识对应的骚扰通信账号。

也就是说，若目标通信账号p和目标设备标识m为(p_i，m_i)，且则由于p_i已经存储于骚扰号码库中，因此可判定p_i为骚扰通信账号。而若目标通信账号p和目标设备标识m为(p_j，m_i)，即表示，持有骚扰设备m_i的骚扰用户更换了电话卡，使用了新的电话号码p_j，但是使用的手机仍然是原来的手机m_i。

在此情况下，若按照传统技术中的识别方式，由于p_j为新更换的电话卡，用户的举报资料还较少，因此无法识别出p_j为骚扰电话号码。而在本发明实施例中，则可通过前述的骚扰号码库中的R_(P，M)查找到与p_j对应同一骚扰设备m_i的骚扰通信账号p_i。

步骤S108：获取骚扰通信账号的第一通信记录和目标通信账号的第二通信记录，计算第一通信记录与第二通信记录的相似度，根据相似度判定目标通信账号是否为骚扰通信账号。

通信账号的通信记录即为通信账号历史的通信记录或操作记录，其表示的是用户在使用通信账号进行通信时的行为习惯。若两个通信账号的通信记录相似，则同一人使用该通信账号进行通信可能性较大。因此，若目标通信账号与骚扰通信账号的通信记录的相似度较高，例如，呼叫或发送消息的频率、时间点较吻合，则使用目标通信账号和骚扰通信账号的用户很可能为同一人，即骚扰用户。

在本实施例中，通信记录包括通信账号对应的在预设的通信时间属性、通信对象属性和/或通信频率属性下的属性值。

例如，在一个自动屏蔽骚扰电话的手机应用的应用场景中，由于骚扰电话号码相比与正常的电话号码而言，主要具有以下特点：

1.通信次数多或频率高(骚扰电话会向大量的设备发起呼叫)

2.接听电话少(骚扰电话只呼叫他人，但很少有正常用户拨打骚扰电话)

3.通话时间短(正常用户在接听骚扰电话之后通常会迅速挂断电话)

4.被挂断几率高(正常用户在接听骚扰电话之后很大几率会挂断电话，而不会等待骚扰用户挂断电话)

介于骚扰电话的上述4个特点，在一个实施例中，可分别设定多个通信时间属性、通信对象属性和/或通信频率属性来描述骚扰电话的通信行为。

例如，通信时间属性可包括：日平均每次呼入时间、日平均每次呼出时间、周平均每次呼入时间、周平均每次呼出时间、周{一、二、三、四、五、六、天}平均每次呼入时间等属性项。

例如，通信对象属性包括：呼叫用户人数、接听用户人数、被挂断次数/比例等属性项。

例如，通信频率属性包括：日呼入次数、日呼出次数、周呼入次数、周呼出次数、、周{一、二、三、四、五、六、天}呼入次数、周{一、二、三、四、五、六、天}呼出次数、周{一、二、三、四、五、六、天}等属性项。

设定上述这些属性项之后，可分别获取目标通信账号p_j和骚扰通信账号p_i在这些属性项下的属性值，然后再通过比较这些属性值的相似度得到目标通信账号和骚扰通信账号的通信记录的相似度。

例如，可计算第一通信记录与所述第二通信记录各自在所述通信时间属性、通信对象属性和/或通信频率属性下的属性值的余弦相似度，以所述余弦相似度作为所述第一通信记录与所述第二通信记录的相似度。

具体的，可根据公式：

S_{i, j} = c o s (θ) = \frac{Σ_{k = 1}^{K} (f_{i, k} \times f_{j . k})}{\sqrt{Σ_{k = 1}^{K} {(f_{i, k})}^{2}} \times \sqrt{Σ_{k = 1}^{K} {(f_{j, k})}^{2}}}

计算余弦相似度S_i，j。其中，j和i分别表示目标通信账号和查找到的骚扰通信账号的标识。K为通信时间属性、通信对象属性和/或通信频率属性的数量。例如前述的预设的“日平均每次呼出时间、周平均每次呼入时间、周平均每次呼出时间.......”等多个属性项的数量。f_i，k和f_j，k分别为第一通信记录和第二通信记录在第k个属性下的属性值。

若计算得到的S_i，j大于或等于阈值，则表示p_j和p_i的通信行为高度相似，可以判定为均为同一骚扰用户使用，因此可以判定目标通信账号为骚扰通信账号。

进一步的，对于使用电话号码发送骚扰短信，或者使用即时通信应用或社交网络应用发送骚扰信息的用户，其骚扰行为除了上述骚扰电话的4个特点之外，还具有发送的内容较单一的特点。

例如，利用短信、QQ、微信群发骚扰信息或广告信息的用户，通常不是手动发送，而是将一份文本信息复制多份，因此，即使用户的电话号码被屏蔽或QQ、微信账号被封，再使用新的通信账号进行骚扰行为时，仍会发送相同的骚扰内容。因此，通信账号的通信记录还包括通信账号对应的通信内容。

而在本实施例中，计算所述第一通信记录与所述第二通信记录的相似度的步骤还包括：

计算所述第一通信记录中的通信内容与所述第二通信记录的通信内容的内容相似度，结合所述余弦相似度和所述内容相似度得到所述第一通信记录与所述第二通信记录的相似度。

例如，在一个骚扰短信屏蔽应用或即时通信应用或社交网络应用的应用场景中，可获取目标用户账号和骚扰用户账号的短信文本或消息文本，然后通过doc2vec等工具计算短信文本或消息文本之间的相似度D_i，j，然后通过对S_i，j和D_i，j加权得到第一通信记录和第二通信记录整体的相似度。

这样，对于短信、即时通信消息或社交网络应用消息等可以获取通信内容的情况，在比较目标通信账号和骚扰通信账号的通信行为时，不仅可以从通信行为的习惯来比较，还可以通过通信的实质内容来比较两者的相似性，从而可更加准确地判断目标通信账号和骚扰通信账号是否为同一骚扰用户使用。

进一步的，若本发明实施例也支持通过用户举报来判定目标通信账号是否为骚扰通信账号。即，服务器可获取目标通信账号对应的举报次数，在举报次数大于阈值时，判定目标通信账号为骚扰通信账号，将被判定为骚扰通信账号的目标通信账号及其对应的目标设备标识添加到骚扰号码库中。

也就是说，若相似度比较的阈值较高，则很可能有部分“漏网之鱼”被漏检，此时，也可参考用户对目标通信账号的举报数据来判定骚扰用户。进一步的，还可根据举报数据来确定相似度比较的阈值是否合理，若根据举报数据得出上述识别方式的“漏网之鱼”较多，则可适当地调低阈值，从而使得识别的要求更加“严格”，进一步地提高识别的准确度。

此外，为解决传统技术中骚扰用户通过更换电话号码等通信账号的方式来规避云安全服务屏蔽的方式所导致的识别骚扰通信账号的准确度不高的技术问题，在一个实施例中，还提出了一种骚扰通信账号的识别装置，如图3所示，上述骚扰通信账号的识别装置包括目标设备标识接收模块102、骚扰号码库获取模块104、骚扰通信账号获取模块106以及第一骚扰通信账号判定模块108，其中：

目标设备标识接收模块102，用于接收待识别的目标通信账号以及与目标通信账号对应的目标设备标识；

骚扰号码库获取模块104，用于获取骚扰号码库，骚扰号码库中存储了骚扰设备标识以及与骚扰设备标识对应的骚扰通信账号；

骚扰通信账号获取模块106，用于在骚扰号码库中查找与目标设备标识匹配的骚扰设备标识，获取查找到的骚扰设备标识对应的骚扰通信账号；

第一骚扰通信账号判定模块108，用于获取骚扰通信账号的第一通信记录和目标通信账号的第二通信记录，计算第一通信记录与第二通信记录的相似度，根据相似度判定目标通信账号是否为骚扰通信账号。

在一个实施例中，通信记录包括通信账号对应的在预设的通信时间属性、通信对象属性和/或通信频率属性下的属性值。

在一个实施例中，第一骚扰通信账号判定模块108还用于计算第一通信记录与第二通信记录各自在通信时间属性、通信对象属性和/或通信频率属性下的属性值的余弦相似度，以余弦相似度作为第一通信记录与第二通信记录的相似度。

在一个实施例中，第一骚扰通信账号判定模块108还用于根据公式：

S_{i, j} = c o s (θ) = \frac{Σ_{k = 1}^{K} (f_{i, k} \times f_{j . k})}{\sqrt{Σ_{k = 1}^{K} {(f_{i, k})}^{2}} \times \sqrt{Σ_{k = 1}^{K} {(f_{j, k})}^{2}}}

在一个实施例中，通信记录还包括通信账号对应的通信内容。

在一个实施例中，第一骚扰通信账号判定模块108还用于计算第一通信记录中的通信内容与第二通信记录的通信内容的内容相似度，结合余弦相似度和内容相似度得到第一通信记录与第二通信记录的相似度。

在一个实施例中，第一骚扰通信账号判定模块108还用于判断相似度是否大于阈值，在相似度大于阈值时，判定目标通信账号为骚扰通信账号。

在一个实施例中，如图3所示，上述装置还包括骚扰通信账号添加模块110，用于获取目标通信账号对应的举报次数，在举报次数大于阈值时，判定目标通信账号为骚扰通信账号，将被判定为骚扰通信账号的目标通信账号及其对应的目标设备标识添加到骚扰号码库中。

在一个实施例中，目标通信账号为电话号码、即时通信应用的用户账号或社交网络应用的用户账号。

在一个实施例中，如图3所示，上述装置还包括第二骚扰通信账号判定模块112，用于在目标通信账号与查找到的骚扰通信账号相同时，判定目标通信账号为骚扰通信账号。

实施本发明实施例，将具有如下有益效果：

在一个实施例中，如图4所示，图4展示了一种运行上述骚扰通信账号的识别方法的基于冯诺依曼体系的计算机系统的终端10。该计算机系统可以是智能手机、平板电脑、掌上电脑，笔记本电脑或个人电脑等终端设备。具体的，可包括通过系统总线连接的外部输入接口1001、处理器1002、存储器1003和输出接口1004。其中，外部输入接口1001可选的可至少包括网络接口10012。存储器1003可包括外存储器10032(例如硬盘、光盘或软盘等)和内存储器10034。输出接口1004可至少包括显示屏10042等设备。

在本实施例中，本方法的运行基于计算机程序，该计算机程序的程序文件存储于前述基于冯诺依曼体系的计算机系统10的外存储器10032中，在运行时被加载到内存储器10034中，然后被编译为机器码之后传递至处理器1002中执行，从而使得基于冯诺依曼体系的计算机系统10中形成逻辑上的目标设备标识接收模块102、骚扰号码库获取模块104、骚扰通信账号获取模块106、第一骚扰通信账号判定模块108、骚扰通信账号添加模块110以及第二骚扰通信账号判定模块112。且在上述骚扰通信账号的识别方法执行过程中，输入的参数均通过外部输入接口1001接收，并传递至存储器1003中缓存，然后输入到处理器1002中进行处理，处理的结果数据或缓存于存储器1003中进行后续地处理，或被传递至输出接口1004进行输出。

以上所揭露的仅为本发明较佳实施例而已，当然不能以此来限定本发明之权利范围，因此依本发明权利要求所作的等同变化，仍属本发明所涵盖的范围。

Claims

1.一种骚扰通信账号的识别方法，其特征在于，包括：

2.根据权利要求1所述的骚扰通信账号的识别方法，其特征在于，所述通信记录包括通信账号对应的在预设的通信时间属性、通信对象属性和/或通信频率属性下的属性值。

3.根据权利要求1所述的骚扰通信账号的识别方法，其特征在于，所述计算所述第一通信记录与所述第二通信记录的相似度的步骤为：

计算第一通信记录与所述第二通信记录各自在所述通信时间属性、通信对象属性和/或通信频率属性下的属性值的余弦相似度，以所述余弦相似度作为所述第一通信记录与所述第二通信记录的相似度。

4.根据权利要求3所述的骚扰通信账号的识别方法，其特征在于，所述计算第一通信记录与所述第二通信记录各自在所述通信时间属性、通信对象属性和/或通信频率属性下的属性值的余弦相似度为根据公式：

S_{i, j} = \cos (θ) = \frac{Σ_{k = 1}^{K} (f_{i, k} \times f_{j . k})}{\sqrt{Σ_{k = 1}^{K} {(f_{i, k})}^{2}} \times \sqrt{Σ_{k = 1}^{K} {(f_{j, k})}^{2}}}

计算余弦相似度S_i，j；其中，j和i分别表示目标通信账号和查找到的骚扰通信账号的标识，K为通信时间属性、通信对象属性和/或通信频率属性的数量，f_i，k和f_j，k分别通信记录和第二通信记录在第k个属性下的属性值。

5.根据权利要求4所述的骚扰通信账号的识别方法，其特征在于，所述通信记录还包括通信账号对应的通信内容。

6.根据权利要求5所述的骚扰通信账号的识别方法，其特征在于，所述计算所述第一通信记录与所述第二通信记录的相似度的步骤还包括：

7.根据权利要求5所述的骚扰通信账号的识别方法，其特征在于，所述根据所述相似度判定所述目标通信账号是否为骚扰通信账号的步骤为：

判断所述相似度是否大于阈值，若是，则判定所述目标通信账号为骚扰通信账号。

8.根据权利要求1至7任一项所述的骚扰通信账号的识别方法，其特征在于，所述方法还包括：

获取所述目标通信账号对应的举报次数，在所述举报次数大于阈值时，判定所述目标通信账号为骚扰通信账号，将所述被判定为骚扰通信账号的目标通信账号及其对应的目标设备标识添加到所述骚扰号码库中。

9.根据权利要求1至7任一项所述的骚扰通信账号的识别方法，其特征在于，所述目标通信账号为电话号码、即时通信应用的用户账号或社交网络应用的用户账号。

10.根据权利要求1至7任一项所述的骚扰通信账号的识别方法，其特征在于，所述方法还包括：

在所述目标通信账号与所述查找到的骚扰通信账号相同时，判定所述目标通信账号为骚扰通信账号。

11.一种骚扰通信账号的识别装置，其特征在于，包括：

12.根据权利要求11所述的骚扰通信账号的识别装置，其特征在于，所述通信记录包括通信账号对应的在预设的通信时间属性、通信对象属性和/或通信频率属性下的属性值。

13.根据权利要求11所述的骚扰通信账号的识别装置，其特征在于，所述第一骚扰通信账号判定模块还用于计算第一通信记录与所述第二通信记录各自在所述通信时间属性、通信对象属性和/或通信频率属性下的属性值的余弦相似度，以所述余弦相似度作为所述第一通信记录与所述第二通信记录的相似度。

14.根据权利要求13所述的骚扰通信账号的识别装置，其特征在于，所述第一骚扰通信账号判定模块还用于根据公式：

S_{i, j} = \cos (θ) = \frac{Σ_{k = 1}^{K} (f_{i, k} \times f_{j . k})}{\sqrt{Σ_{k = 1}^{K} {(f_{i, k})}^{2}} \times \sqrt{Σ_{k = 1}^{K} {(f_{j, k})}^{2}}}

15.根据权利要求14所述的骚扰通信账号的识别装置，其特征在于，所述通信记录还包括通信账号对应的通信内容。

16.根据权利要求15所述的骚扰通信账号的识别装置，其特征在于，所述第一骚扰通信账号判定模块还用于计算所述第一通信记录中的通信内容与所述第二通信记录的通信内容的内容相似度，结合所述余弦相似度和所述内容相似度得到所述第一通信记录与所述第二通信记录的相似度。

17.根据权利要求15所述的骚扰通信账号的识别装置，其特征在于，所述第一骚扰通信账号判定模块还用于判断所述相似度是否大于阈值，在所述相似度大于阈值时，判定所述目标通信账号为骚扰通信账号。

18.根据权利要求11至17任一项所述的骚扰通信账号的识别装置，其特征在于，所述装置还包括骚扰通信账号添加模块，用于获取所述目标通信账号对应的举报次数，在所述举报次数大于阈值时，判定所述目标通信账号为骚扰通信账号，将所述被判定为骚扰通信账号的目标通信账号及其对应的目标设备标识添加到所述骚扰号码库中。

19.根据权利要求11至17任一项所述的骚扰通信账号的识别装置，其特征在于，所述目标通信账号为电话号码、即时通信应用的用户账号或社交网络应用的用户账号。

20.根据权利要求11至17任一项所述的骚扰通信账号的识别装置，其特征在于，所述装置还包括第二骚扰通信账号判定模块，用于在所述目标通信账号与所述查找到的骚扰通信账号相同时，判定所述目标通信账号为骚扰通信账号。