CN110855641A - 社区属性信息确定方法、装置及存储介质 - Google Patents

社区属性信息确定方法、装置及存储介质 Download PDF

Info

Publication number
CN110855641A
CN110855641A CN201911043415.6A CN201911043415A CN110855641A CN 110855641 A CN110855641 A CN 110855641A CN 201911043415 A CN201911043415 A CN 201911043415A CN 110855641 A CN110855641 A CN 110855641A
Authority
CN
China
Prior art keywords
community
node
information
determining
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911043415.6A
Other languages
English (en)
Other versions
CN110855641B (zh
Inventor
嵇方方
王维强
汲小溪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN201911043415.6A priority Critical patent/CN110855641B/zh
Publication of CN110855641A publication Critical patent/CN110855641A/zh
Application granted granted Critical
Publication of CN110855641B publication Critical patent/CN110855641B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
    • H04L63/1425Traffic logging, e.g. anomaly detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种社区属性信息确定方法,该方法包括:获取至少一个账户之间的关系数据;在从至少一个账户中确定出至少一个社区后,根据至少一个账户之间的关系数据确定至少一个社区的属性信息;其中,属性信息包括社区节点相关信息和/或社区结构相关信息;以及输出至少一个社区及其属性信息。本发明还公开了社区属性信息确定装置、计算设备以及计算机可读存储介质。

Description

社区属性信息确定方法、装置及存储介质
技术领域
本发明涉及互联网技术,特别涉及一种社区属性信息确定方法、装置和计算机可读存储介质。
背景技术
网络黑产通常是指以互联网为媒介,以网络技术为主要手段,为计算机信息系统安全和网络空间管理秩序带来潜在威胁的非法行为,例如包括暗扣话费、广告流量变现、手机应用分发、木马刷量、勒索病毒、控制肉鸡挖矿以及DDOS攻击等等。而存在于较大群体内部的集中在一起从事上述网络黑产行为的小团体或者小集团通常可被称为黑产团伙。由于网络黑产行为会给计算机信息系统安全和网络空间管理秩序带来重大安全隐患,因此,如何从较大的群体中识别出黑产团伙从而对其进行专项打击是当前需要解决的关键问题。
发明内容
有鉴于此,本发明提出了一种社区属性信息确定方法,可以包括:获取至少一个账户之间的关系数据;在从所述至少一个账户中确定出至少一个社区后,根据所述至少一个账户之间的关系数据确定所述至少一个社区的属性信息;其中,所述属性信息包括社区节点相关信息和社区结构相关信息中的至少一种;以及输出所述至少一个社区及其属性信息。
其中,上述至少一个账户之间的关系数据包括:所述账户之间的资金关系数据、介质关系数据和同位置关系数据中的至少一种。
其中,上述社区节点相关信息包括:社区的集线器HUB节点信息和社区的节点中心性信息中的至少一种;以及上述社区结构相关信息包括:社区拓扑信息和社区有效性信息中的至少一种。
其中,根据所述账户之间的关系数据确定社区的集线器节点信息包括:以所述社区中的各个账户作为网络的节点,根据账户之间的关系数据构建所述网络的边,生成社区对应的网络;确定所述网络中各个节点的度;确定所述网络的网络效率;以及根据每个节点对网络效率的影响程度,确定对网络效率影响最大的S个节点,将这S个节点作为社区HUB节点;其中,S是社区HUB节点的个数。
其中,确定对网络效率影响最大的S个节点包括:
按照网络中各个节点的度从大到小对上述各个节点进行排序;
初始化索引参数i为1;
A,按照网络中个节点排序后的顺序从网络中删除节点i;
计算删除节点i后网络的网络效率E(G)i
确定删除节点i后网络的网络效率E(G)i与原网络效率的差值E(G),将其作为网络效率的变化度Di
确定所述网络效率的变化度Di是否大于预先设置的网络效率变化度阈值D,如果是,则所述节点i为社区HUB节点;
在i<N且已确定为社区HUB节点的数目尚未达到预先设置的最大HUB节点数时,将节点i加回到网络中,令i=i+1,并返回A。
上述社区节点中心性信息包括社区内每个账户的度中心性;其中,根据所述至少一个账户之间的关系数据确定社区的节点中心性信息包括:以所述社区中的各个账户作为网络的节点,根据账户之间的关系数据构建所述网络的边,计算所述网络中各个节点的度Deg(i),并通过如下公式确定每个节点的度中心性:
Figure BDA0002253469910000021
其中,N为网络中节点的数目。
上述社区节点中心性信息包括社区内每个账户的节点排名值;其中,根据所述至少一个账户之间的关系数据确定社区的节点中心性信息包括:以所述社区中的各个账户作为网络的节点,根据账户之间的关系数据构建所述网络的边,计算所述网络中各个节点的度Deg(i),并通过如下公式确定每个节点的节点排名值:
Figure BDA0002253469910000022
其中,PR(i)为节点i的节点排名值;PR(j)为节点i的节点排名值;N为网络中节点的数目;Mi为与节点i具有关联关系的节点的集合;α为预先设置的系数;以及对网络中所有节点的排名值进行迭代计算,直至每个节点前后两次计算的排名值的差小于预先定义的误差阈值或者迭代的次数超过了预先设置的迭代次数阈值。
上述社区节点中心性信息包括社区内每个账户的中间中心性;其中,根据所述至少一个账户之间的关系数据确定社区的节点中心性信息包括:以所述社区中的各个账户作为网络的节点,根据账户之间的关系数据构建所述网络的边,并通过如下公式确定每个节点的中间中心性:
其中,BC(i)代表节点i的中间中心性;σ(s,t)代表网络中任意两个节点的所有最短距离;σ(s,t\i)代表网络中任意两个节点的所有最短距离中所有经过节点i的最短距离。
上述社区节点中心性信息包括社区内每个账户的接近中心性;其中,根据所述至少一个账户的关系数据确定社区的节点中心性信息包括:以所述社区中的各个账户作为网络的节点,根据账户之间的关系数据构建所述网络的边,并通过如下公式确定每个节点的接近中心性:
Figure BDA0002253469910000032
其中,C(i)代表节点i的接近中心性;d(u,i)代表网络中节点u和i的最短距离;N为网络中节点的数目。
上述确定社区有效性信息包括:通过如下公式确定所述网络效率:
Figure BDA0002253469910000033
其中,所述n表示整个网络的节点的度的和;d(i,j)表示节点i和节点j的最短路径的长度。
根据所述至少一个账户之间的关系数据确定社区拓扑信息包括:确定所述社区的传递性,由所述传递性确定所述社区拓扑信息。
在本发明的实施例中,上述方法进一步包括:根据所述至少一个社区的属性信息确定上述至少一个社区的属性指标;根据上述至少一个社区的属性指标,从上述至少一个社区中识别出疑似异常社区;以及输出上述疑似异常社区及其属性信息。
上述根据所述至少一个社区的属性信息确定上述至少一个社区的属性指标包括:对每个社区的属性信息进行归一化处理,确定每个社区的属性指标。
上述社区的属性信息包括:社区HUB节点信息、社区节点中心性信息和社区有效性信息中的至少一种;
对每个社区的特征信息进行归一化处理包括以下处理中的至少一个:
对于社区HUB节点数信息,求所述社区HUB节点数与社区内所有节点的数目的商,得到社区HUB节点比例,并将所述社区HUB节点比例作为所述社区HUB节点数属性指标;
对于社区节点中心性信息,求社区内各个节点中心性信息的平均值,将所述平均值作为所述社区节点中心性属性指标;
对于社区有效性信息,将社区有效性作为所述社区有效性属性指标;以及
所述确定每个社区的属性指标包括:将所述社区HUB节点属性指标、社区节点中心性属性指标和/或社区有效性属性指标进行合并,得到所述社区的属性指标。
上述根据至少一个社区的属性指标,从上述至少一个社区中识别出疑似异常社区包括:将所述至少一个社区的属性指标与预先设置的属性指标阈值进行比较,当一个社区的属性指标大于所述属性指标阈值时,将所述社区确定为疑似异常社区。
上述根据至少一个社区的属性指标,从上述至少一个社区中识别出疑似异常社区包括:根据已确定为异常社区的属性指标训练创建异常社区识别模型;将待识别社区的属性指标输入到经过训练的异常社区识别模型;以及根据所述异常社区识别模型输出,确定所述待识别社区是否为疑似异常社区。
本发明的实施例还提供了一种社区属性信息确定装置,该装置可以包括:
关系数据获取模块,用于获取至少一个账户之间的关系数据;
社区发现模块,用于根据所述至少一个账户之间的关系数据从所述至少一个账户中确定至少一个社区;
属性信息确定模块,用于根据所述至少一个账户之间的关系数据确定所述至少一个社区的属性信息;其中,所述属性信息包括社区节点相关信息和社区结构相关信息中的至少一种;以及
输出模块,用于输出所述至少一个社区及其属性信息。
上述属性信息确定模块包括以下两个单元中的至少一个:
社区节点信息确定单元,用于确定社区的节点相关信息;以及
社区结构信息确定单元,用于确定社区的结构相关信息。
上述社区节点信息确定单元包括以下两个子单元中的至少一个:社区的集线器HUB节点信息提取子单元,用于确定社区的HUB节点信息;以及社区的节点中心性信息提取子单元,用于确定社区的节点中心性信息;以及
上述社区结构信息确定单元包括以下两个子单元中的至少一个:社区拓扑信息提取子单元,用于确定社区拓扑信息;以及社区有效性信息提取子单元,用于确定社区有效性信息。
上述装置进一步包括:
社区属性指标确定模块,用于根据所述至少一个社区的属性信息确定所述至少一个社区的属性指标;以及
异常社区预测模块,用于根据所述至少一个社区的属性指标从所述至少一个社区中识别出疑似异常社区;其中,
上述输出模块进一步用于输出所述疑似异常社区及其所述疑似异常社区的属性信息。
上述社区属性指标确定模块包括:
归一化单元,用于对每个社区的属性信息进行归一化处理;以及
社区属性指标确定单元,用于根据归一化后的社区属性信息确定每个社区的属性指标。
上述异常社区预测模块包括:
比较单元,用于将每个社区的属性指标与预先设置的属性指标阈值进行比较;以及
预测单元,用于当一个社区的属性指标大于预先设置的属性指标阈值时,将所述社区确定为疑似异常社区。
上述异常社区预测模块包括:
训练单元,用于根据已确定为异常社区的属性指标训练创建异常社区识别模型;
输入单元,用于将待识别社区的属性指标输入到经过训练的异常社区识别模型;以及
输出模块,用于根据所述异常社区识别模型输出,确定所述待识别社区是否为疑似异常社区。
本发明的实施例还提供了一种计算设备,该计算设备包括:
至少一个处理器;
存储器;
网络通信装置;以及
连接所述至少一个处理器、存储器以及网络通信装置的总线;其中,
所述至少一个处理器用于执行存储器存储的机器可读指令模块,执行上述社区属性信息确定方法。
本发明的实施例还提供了一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述的社区属性信息确定方法。
通过上述社区属性信息确定方法、装置以及设备等,在社区发现之后,可以根据账户之间的关系数据确定的社区的属性信息,然后将上述社区及社区的属性信息输出给业务方的业务人员来进行异常社区的识别,从而有效地发现黑产团伙等社区。此外,本发明实施例所述的社区属性信息确定方法还可以将进一步根据社区属性信息自动进行疑似异常社区的检测,并将检测出的疑似异常社区及其属性信息输出给相关业务人员帮助其进行进一步的人工分析和调查。本发明实施例给出的社区属性信息确定方法可以高效地进行异常社区检测,减少人工操作成本,提高社区检测效率。
附图说明
图1显示了本发明实施例所应用系统100结构示意图;
图2显示了本发明实施例所述的社区属性信息确定方法流程图;
图3显示了本发明实施例所述的根据上述账户之间的关系数据确定社区的集线器(HUB)节点信息的方法;
图4显示了本发明实施例所述的确定对网络效率影响最大的S个节点的方法;
图5显示了本发明实施例所述的社区属性信息确定装置的内部结构;以及
图6显示了本发明实施例所述计算设备的内部结构。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
如前所述,由于网络黑产行为会给计算机信息系统安全和网络空间管理秩序带来重大安全隐患,因而如何从较大的群体中识别出黑产团伙以对其进行专项打击是需要解决的关键问题。通常,可以利用用户账户之间的各种资金关系、介质关系建立账户和账户之间的联系;然后,再通过无监督的方式进行图聚类进行社区发现从而得到一个或多个社区;最后,再对上述一个或多个社区进行分析,从而从上述一个或多个社区中识别出黑产团伙等异常社区。但是,由于上述社区发现的结果输出结果是黑箱的,业务方无法解读各个社区内部的结构以及特征,因此,进行社区解释以及异常社区的识别的成本非常高。为此,本发明提出了一种社区属性信息确定方法,从而在输出社区发现结果的基础之上进一步确定各个社区的属性信息,从而提高社区的可解释性,降低社区解释和异常社区识别的成本。
图1显示了本发明实施例所应用系统100的结构示意图。如图1所示,在本发明实施例所应用的系统100中,多个用户101可以通过互联网连接到的应用服务器102,并通过与应用服务器102的交互实现各种应用或与其他用户101交互。其中,每个用户101可以使用唯一的用户账户登录应用服务器102。从图1可以看出,不同的用户101可以通过同一个无线局域网的路由器1011连接到互联网上的应用服务器102。此外,不同的账户也可以通过同一个终端登录应用服务器102或者不同的账户也可以具有相同的唯一素材识别码(UMID,UniqueMaterial Identifier)等待。
此外,应用服务器102可以通过数据库103保存各个账户的相关信息以及表征各个账户之间关系的关系数据。具体地,在本发明的实施例中,上述各个账户之间的关系数据可以包括:账户之间的资金关系数据、介质关系数据和同位置关系数据等信息中的至少一种。其中,账户之间的资金关系表示了账户之间是否有资金交易;账户之间的介质关系数据代表了不同的账户所使用的通信介质是否有关联,例如是否使用了同一个设备、是否使用了相同的UMID或者是否属于同一个局域网等等;而账户之间的同位置关系数据代表了不同的账户是否位于相同的位置范围内。
为了进行社区检测,本发明实施例所应用的系统100还包括社区检测装置104。该社区检测装置104可以通过应用服务器102连接到数据库103或者直接连接到数据库103,从数据库103中读取各个账户之间的关系数据,并对其进行分析和处理,从各个账户中确定至少一个社区,并根据上述各个账户之间的关系数据确定各个社区的属性信息,并输出给业务方,从而辅助业务方从这些社区中识别出异常社区,以便发现黑产团伙等进行不轨行为的小团体或者小集团。
需要说明的是,在本发明的实施例中,上述社区检测装置104具体可以是一个具有计算功能的单独计算设备,例如工作站等,也可以是集成在应用服务器102上的一个功能模块。
下面就结合附图详细说明本发明实施例所述社区检测装置104进行社区属性信息确定的具体过程。
图2显示了本发明实施例所述的社区属性信息确定方法流程图。如前所述,该方法可以应用于上述社区检测装置104。如图2所示,该社区检测方法主要包括如下步骤:
步骤201:获取至少一个账户之间的关系数据。
如前所述,在本发明的实施例中,上述至少一个账户之间的关系数据可以包括:账户之间的资金关系数据、介质关系数据和同位置关系数据等信息中的至少一种。
其中,上述账户之间的资金关系表示了账户之间是否有资金交易。
上述账户之间的介质关系数据代表了不同的账户所使用的通信介质是否有关联,例如,不同的账户是否使用了同一个设备、是否使用了相同的UMID或者是否属于同一个局域网等等。
上述账户之间的同位置关系数据代表了不同的账户是否位于相同的位置。
在本发明的实施例中,上述社区检测装置104可以通过应用服务器102从数据库103读取上述至少一个账户之间的关系数据或者直接地从数据库103读取上述至少一个账户之间的关系数据。
步骤202:基于上述至少一个账户之间的关系数据,确定至少一个社区。
在本发明的实施例中,上述社区检测装置104可以通过图聚类的方式实现上述步骤202所述的社区发现。上述步骤202可以具体包括:
步骤2021:基于上述至少一个账户之间的关系数据生成账户关系图。
在本发明的实施例中,上述社区检测装置104可以根据上述账户之间的关系数据,在具有关联关系的两个账户之间建立关系对;然后,再基于所建立的关系对生成所述账户关系图,其中,在上述账户关系图中记录所有建立的账户关系对。
具体地,上述社区检测装置104可以根据账户的资金关系数据和/或介质关系数据和/或介质关系数据,找到具有资金关系和/或介质关系和/或介质关系的两个账户,在这两个账户之间建立一个账户关系对(每个账户对包括两个账户)。然后,上述社区检测装置104可以通过表格或者建立关系矩阵的方式记录所有账户关系对。其中,如果通过表格记录所有账户关系对,则可以以一个账户作为索引在上述表格中记录与其具有关联关系的其他账户。此时,该表格即可作为上述账户关系图。如果通过建立关系矩阵的方式记录所有账户关系对,则可以以账户分别作为矩阵的行和列建立一个二维的矩阵,矩阵上的点代表其行对应的账户与其列对应的账户知否具有关联关系。例如,矩阵上某点的值为1代表其行对应的账户与其列对应的账户具有关联关系;矩阵上某点的值为0代表其行对应的账户与其列对应的账户不具有关联关系。此时,通过上述方法建立的矩阵即可作为上述账户关系图。
步骤2022:对上述账户关系图进行图聚类,确定至少一个社区。
在本发明的实施例中,上述社区检测装置104可以采用Louvain算法、最大联通子图算法或标签传播算法(LPA)等等方法对上述账户关系图进行图聚类。上述各种图聚类的方法又可称为社区发现方法。通过上述图聚类方法可以对上述账户关系图进行分析从所有账户中得到至少一个社区。其中,每个社区为具有紧密关联关系的一组账户的集合。
步骤203:在确定上述至少一个社区后,根据上述至少一个账户之间的关系数据确定上述社区的属性信息。其中,上述社区的属性信息包括社区节点相关信息和社区结构相关信息中的至少一种。
其中,在本发明的实施例中,上述社区节点相关信息包括:社区集线器(HUB)节点信息以及社区节点中心性信息中的至少一种;上述社区结构相关信息可以包括:社区拓扑信息和社区有效性信息中的至少一种。
下面将在后文中结合附图详细说明根据上述账户之间的关系数据确定上述社区的特征信息的方法,在此暂且略过。
步骤204:输出上述至少一个社区及其属性信息。
至此,上述社区检测装置104可以基于图聚类的方式实现社区发现,并基于上述至少一个账户之间的关系数据确定社区的属性信息。在将发现的社区以及社区的属性信息发送给业务方之后,业务方可以根据社区的属性信息进行社区解释,从而高效实现异常社区的发现。
更进一步,本发明的实施例还可以进一步包括如下多个步骤,从而实现疑似异常社区的自动识别。具体地,基于上述社区属性信息确定方法,该方法还可以进一步包括:
步骤205:根据确定的社区属性信息确定上述至少一个社区的属性指标。
在本发明的实施例中,上述社区检测装置104可以通过多种方法根据社区的属性信息确定各个社区的属性指标。
具体地,在本发明的实施例中,上述社区检测装置104可以首先对每个社区的属性信息进行归一化处理,确定每个社区的属性指标。其中,上述社区的属性指标的取值范围可以在0~1之间。
具体地,如前所述,上述社区的属性信息可以包括:社区HUB节点信息、社区节点中心性信息、社区拓扑信息和社区有效性信息中的至少一种。则在该实施例中,针对每一个社区,可以首先分别对该社区的社区HUB节点信息、社区节点中心性信息、社区拓扑信息和/或社区有效性信息进行归一化处理,得到社区HUB节点属性指标、社区节点中心性属性指标、社区拓扑属性指标和/或社区有效性属性指标。其中,上述各项属性指标的取值范围可以在0~1之间,且各项属性指标的分值越大代表该社区是社区的概率越大。
然后,再将上述社区HUB节点属性指标、社区节点中心性属性指标、社区拓扑属性指标和/或社区有效性属性指标进行合并,得到上述社区的属性指标。其中,上述合并可以例如是求平均或者求加权平均等操作。
在本发明的实施例中,上述归一化处理是用于可以将社区的属性信息处理成取值范围可以在0~1之间的分值。
具体地,对于社区HUB节点数信息,可以求社区HUB节点数与社区内所有节点的数目的商,得到社区HUB节点比例,作为社区HUB节点属性指标。
对于社区节点中心性信息,可以求社区内各个节点中心性信息的平均值,将上述平均值作为社区节点中心性属性指标。
对于社区有效性信息,社区有效性本身就是取值范围在0~1之间的数值,因此,可以直接将社区有效性作为社区有效性属性指标。
对于社区拓扑信息,社区拓扑信息可以是社区的传递性,本身就是取值范围在0~1之间的数值,因此,可以直接将社区的传递性作为社区拓扑属性指标。
需要说明的是,由于社区拓扑信息通常是描述性的,因此,在本发明的一些实施例中,对于社区拓扑信息这项信息也可以不进行归一化处理,也即社区拓扑信息也可以不参与计算上述社区的属性指标。
步骤206:根据上述至少一个社区的属性指标,从上述至少一个社区中识别出疑似异常社区。
在本发明的实施例中,将上述社区的属性指标与预先设置的属性指标阈值进行比较,如果社区的属性指标大于属性指标阈值,则可以确定该社区为疑似异常社区。
此外,在本发明的实施例中,上述社区检测装置104还可以利用机器学习算法从各个社区中识别出疑似异常社区。在该实施例中,首先,上述社区检测装置104可以根据若干已确定为异常社区的社区HUB节点信息、社区节点中心性信息、社区拓扑信息和/或社区有效性信息等社区的特征信息训练创建异常社区识别模型;然后,将待识别社区的社区HUB节点信息、社区节点中心性信息、社区拓扑信息和/或社区有效性信息等社区的属性信息输入到经过训练的异常社区识别模型中。上述异常社区识别模型可以根据所输入的待识别社区的属性信息与已确认为异常社区的各个参数的匹配程度判定待识别社区是否为疑似异常社区。如此,上述社区检测装置104可以根据上述异常社区识别模型输出,分别确定每个社区是否为疑似异常社区。
步骤207:输出上述疑似异常社区及其属性信息。
在本发明的实施例中,上述疑似异常社区具体可以为至少一组账户的集合。
在本发明的实施例中,上述疑似异常社区以及上述疑似异常社区的属性信息可以通过社区检测装置104的显示设备显示给业务方的业务人员,也可以生成疑似异常社区报告通过网络发送给进行异常社区检测的业务人员或者相关部门,例如公安部门。
通过上述社区属性信息确定方法,在社区发现之后,可以根据账户之间的关系数据确定各个社区的属性信息,并输出给业务方的业务人员来进行异常社区的识别,从而有效地发现黑产团伙等社区。此外,本发明实施例所述的社区属性信息确定方法还可以进一步根据各个社区的属性信息自动进行疑似异常社区的检测,并将检测到的疑似异常社区输出给相关业务人员帮助其进行进一步的人工分析和调查。本发明实施例给出的社区属性信息确定方法可以高效地帮助业务人员进行异常社区检测,降低人工检测操作的成本,并且提高异常社区检测效率。
下面将结合附图分别详细说明上述步骤203所述的根据上述账户之间的关系数据确定社区属性信息的方法。如前所述,上述社区属性信息可以包括:包括社区节点相关信息和/或社区结构相关信息。其中,社区节点相关信息可以包括:社区HUB节点信息和社区节点中心性信息中的至少一种;社区结构相关信息可以包括:社区拓扑信息和社区有效性信息中的至少一种。因此,这些信息可以有效反映出社区节点和/或拓扑的特性,从而通过使用这些信息可以更加有效地帮助业务方从众多社区中发现黑产团伙等异常社区。
图3显示了本发明实施例所述的根据上述账户之间的关系数据确定社区的HUB节点信息的方法。如图3所示,该方法包括:
步骤301:以所述社区中的各个账户作为网络的节点,根据账户之间的关系数据构建所述网络的边,从而生成社区对应的网络。
在本发明的实施例中,可以根据账户之间的关系数据在具有关联关系的节点之间构建上述网络的边。
步骤302:确定所述网络中各个节点的度。
上述节点的度至指和该节点相关联的边的条数,又称为关联度。在本发明的实施例中,上述计算各个阶段的度可以是根据账户之间的关系数据来确定的。
步骤303:确定上述网络的网络效率E(G)。
在本发明的实施例中,上述网络效率可以通过如下公式(1)确定:
Figure BDA0002253469910000121
其中,上述n表示整个网络的节点的度的和;d(i,j)表示节点i和节点j的最短路径的长度。
步骤304:根据每个节点对上述网络的网络效率的影响程度,确定对上述网络的网络效率影响最大的S个节点,将这S个节点作为社区HUB节点;其中,S是社区HUB节点的个数。
在本发明的实施例中,上述步骤304的具体实现方法可以如图4所示,主要包括:
步骤401:按照上述网络中各个节点的度从大到小对上述各个节点进行排序。
在本发明的实施例中,假设网络中节点的数目为N,这样,经过排序后的第i个节点的度设置为Deg(i),则满足Deg(i)≥Deg(i+1),1<<i≤N-1。
步骤402:初始化索引参数i为1。
步骤403:按照上述网络中节点排序后的顺序从网络中删除节点i。
步骤404:计算删除节点i后网络的网络效率E(G)i
步骤405:确定删除节点i后网络的网络效率E(G)i与原网络效率的差值E(G),并将上述差值作为网络效率的变化度Di
步骤406:确定上述网络效率的变化度Di是否大于预先设置的网络效率变化度阈值D,如果是,则该节点i为社区HUB节点。
步骤407:在i<N时,将节点i加回到网络中,令i=i+1,并返回步骤403。
更进一步,还可以预先设定社区HUB节点数目的最大值M。这样,在上述步骤407还将进一步确定已确定为社区HUB节点的数目是否达到M,且只有在已确定为社区HUB节点的数目尚未达到M时,才会继续执行令i=i+1,并返回步骤403的操作。而且,在上述方法中根据节点的度预先对节点进行排序,从而能更快速地找到上述HUB节点。
由此可以看出,通过上述图3和图4所示的方法可以确定对网络效率影响最大的S个节点,从而将这些节点确定为社区HUB节点。
在本发明的实施例中,上述HUB节点的确定方法可以基于各个节点对于整个社区结构的影响,找到其中对社区结构影响最大的节点,也就是社区内最重要的节点作为社区的HUB节点。该方法主要从网络中各个节点所构成的图结构的本身特性出发,可以用最为简便的方法快速找到社区内重要的节点。
下面详细描述根据上述账户之间的关系数据确定社区节点中心性信息的方法。节点中心性定义了网络中一个节点的重要性。通过对网络节点中心性的识别可以量化去定义社区里节点的角色。在本发明的实施例中,可以采用多种方法度量网络中各个节点的中心性,从而得到社区节点中心性信息。具体而言,在实际的操作中,也可以根据业务方的需求选择适合的方法确定社区节点中心性信息。
在本发明的一个实施例中,上述社区节点中心性信息包括社区内每个账户的度中心性。具体地,在这种情况下,可以先通过上述步骤301和302,确定对应一个社区的网络中每个节点的度Deg(i);然后,再通过下面的公式(2)分别确定每个节点的度中心性:
Figure BDA0002253469910000131
其中,N为网络中节点的数目,也即社区中的账户数。
在上述计算方式下使用节点i的度除以其它N-1个节点最大可能的连接数,得到与节点i有直接联系的网络节点的比例。这个比例范围从0到1,其中,0表示与任何节点都没有联系(例如一个孤点);而1表示与每一个节点都有直接联系。
在本发明的另一个实施例中,上述社区节点中心性信息包括节点排名值。本实施例是将网页排名(PageRank)的计算方法应用到社区账户的节点排名上。具体地,在本实施例中,可以先通过上述步骤301和302,确定对应一个社区的网络中每个节点的度Deg(i);通过如下公式(3)确定社区内每个账户的节点排名值:
Figure BDA0002253469910000141
其中,PR(i)为节点i的节点排名值;PR(j)为节点i的节点排名值;N为网络中节点的数目,也即社区中的账户数;Mi为与节点i具有关联关系的节点的集合;α为预先设置的系数,一般可以取值为0.85。
接下来进一步对所有节点的排名值进行迭代计算,直至每个节点前后两次计算的排名值的差小于预先定义的误差阈值或者迭代的次数超过了预先设置的迭代次数阈值。
在本发明的又一个实施例中,上述社区节点中心性信息包括节点中间中心性(Betweenness Centrality),其度量方法是考虑节点在连接其他节点时所表现出的重要性。也即考察任意两个节点之间的最短距离是否都经过该节点,如果都经过这个节点则说明这个节点很重要。具体地,在这种情况下,可以先通过上述步骤301,确定对应一个社区的网络;然后,再利用下面的公式(4)确定该网络中每个节点的中间中心性:
Figure BDA0002253469910000142
其中,BC(i)代表节点i的中间中心性;σ(s,t)代表网络中任意两个节点s,t的所有最短距离;σ(s,t\i)代表网络中任意两个节点s,t的所有最短距离中所有经过节点i的最短距离。
在本发明的又一个实施例中,上述社区节点中心性信息包括节点接近中心性(Closeness Centrality)。其思想是一个节点越趋于中心,它越能快速地到达其他的节点。更形式化的描述,这些节点满足与其他节点之间有最小的平均最短路径。节点接近中心性越大说明越在中心,越能够很快到达其他点。具体地,在这种情况下,可以先通过上述步骤301,确定对应一个社区的网络;然后,再利用下面的公式(5)确定该网络中每个节点的接近中心性:
Figure BDA0002253469910000151
其中,C(i)代表节点i的接近中心性;d(u,i)代表网络中节点u和i的最短距离;N为网络中节点的数目,也即社区中的账户数。
下面详细描述根据上述账户之间的关系数据确定社区拓扑信息的方法。基于关系网络的社区结构是非常复杂的,因此,需要一些通用性的指标去表示社区的内部结构,使得社区结构可以用数值来刻画,例如基于社区的连接频率描述社区的网络的连通性、传递性或者紧密性等。其中,社区的传递性用于描述连接同一个节点的两个节点的联系程度,取值介于0-1之间,该值越大表示可传递性越高。例如,如果一个社区的传递性是1,则表示社区所对应网络里的任意两个节点都是直接相连的,拿掉任意一个节点都不影响其他节点的传递性,也即该网络是一个完全图。通常,在欺诈场景下存在一些接近完全图的社区,这样的社区内部结构紧密,连接性强。从而,通过已被识别出来为黑节点,可以寻找到更多的黑产。如果一个社区的传递性是0,则表示社区所对应网络是比较典型的星型结构。在这种情况下,如果该社区内有已暴露出来的黑产中介节点,则可以根据社区的这个网络拓扑结构准确识别出该黑产中介节点背后的黑产“头目”。因此,在本发明的实施例中,可以由社区的网络传递性来确定社区的网络拓扑结构。
而针对社区有效性信息可以通过上述步骤301-303所示的方法直接确定社区有效性作为上述社区有效性信息。
对应上述社区属性信息确定方法,本发明的实施例提出了一种社区属性信息确定装置500,其内部结构如图5所示,主要包括:
关系数据获取模块501,用于获取至少一个账户之间的关系数据;
社区发现模块502,用于根据账户之间的关系数据从上述至少一个账户中确定至少一个社区;
属性信息确定模块503,用于根据上述至少一个账户之间的关系数据确定上述至少一个社区的属性信息;以及
输出模块504,用于输出上述至少一个社区及其属性信息。
在本发明的一些实施例中,上述社区属性信息确定装置500可以进一步包括:
社区属性指标确定模块505,用于根据上述至少一个社区的属性信息确定上述至少一个社区的属性指标;以及
异常社区预测模块506,用于根据上述至少一个社区的属性指标从上述至少一个社区中识别出疑似异常社区。
在这些实施例中,上述输出模块504进一步用于输出上述疑似异常社区及其上述疑似异常社区的属性信息。
在本发明的实施例中,上述属性信息确定模块503可以包括以下两个单元中的至少一个:
社区节点信息确定单元5031,用于确定社区的节点相关信息;以及
社区结构信息确定单元5032,用于确定社区的结构相关信息。
在本发明的实施例中,上述社区节点信息确定单元5031可以包括以下两个子单元中的至少一个:
社区的集线器HUB节点信息提取子单元50311,用于确定社区的HUB节点信息;以及
社区的节点中心性信息提取子单元50312,用于确定社区的节点中心性信息。
在本发明的实施例中,上述社区结构信息确定单元5032可以包括以下两个子单元中的至少一个:
社区拓扑信息提取子单元50321,用于确定社区拓扑信息;以及
社区有效性信息提取子单元50322,用于确定社区有效性信息。
在本发明的实施例中,上述社区属性指标确定模块505可以包括:
归一化单元5051,用于对每个社区的属性信息进行归一化处理;以及
社区属性指标确定单元5052,用于根据归一化后的社区属性信息确定每个社区的属性指标。
在本发明的实施例中,上述异常社区预测模块506可以包括:
比较单元5061,用于将每个社区的属性指标与预先设置的属性指标阈值进行比较;以及
预测单元5062,用于当一个社区的属性指标大于预先设置的属性指标阈值时,将所述社区确定为疑似异常社区。
在本发明的另一个实施例中,上述异常社区预测模块506可以包括:
训练单元5063,用于根据已确定为异常社区的属性指标训练创建异常社区识别模型;
输入单元5064,用于将待识别社区的属性指标输入到经过训练的异常社区识别模型;以及
输出模块5065,用于根据所述异常社区识别模型输出,确定所述待识别社区是否为疑似异常社区。
需要说明的是,上述各个模块的具体实现方法可以参考上述社区属性信息确定方法,在此不再赘述。
本发明的实施例还提出了一种计算设备,该计算设备的内部结构如图6所示主要包括:至少一个处理器602,存储器604,网络通信装置606以及连接上述装置的总线608。其中,上述至少一个处理器602用于执行存储器存储的机器可读指令模块。在本发明的实施例中,上述一个或多个处理器执行的机器可读指令模块以实现上述图2至图4所示的社区属性信息确定方法。
本发明的实施例还提供了一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述图2至图4所示的社区属性信息确定方法。
通过上述社区属性信息确定装置以及设备等,在社区发现之后,可以根据账户之间关系数据确定社区的属性信息,并将社区的属性信息输出给业务人员来进行异常社区的识别,从而有效地发现黑产团伙等异常社区。此外,本发明实施例所述的社区属性信息确定方法还可以根据社区的属性信息自动进行疑似异常社区的识别,并将疑似异常社区及其属性信息输出给相关业务人员帮助其进行进一步的人工分析和调查。本发明实施例给出的社区属性信息确定方法可以高效地进行异常社区检测,降低人工操作的成本,提高异常社区检测效率。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明的不同方面的许多其它变化,为了简明它们没有在细节中提供。
另外,为简化说明和讨论,并且为了不会使本发明难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本发明难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本发明的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本发明的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本发明。因此,这些描述应被认为是说明性的而不是限制性的。
尽管已经结合了本发明的具体实施例对本发明进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
本发明的实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本发明的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (25)

1.一种社区属性信息确定方法,其特征在于,所述方法包括:
获取至少一个账户之间的关系数据;
在从所述至少一个账户中确定出至少一个社区后,根据所述至少一个账户之间的关系数据确定所述至少一个社区的属性信息;其中,所述属性信息包括社区节点相关信息和社区结构相关信息中的至少一种;以及
输出所述至少一个社区及其属性信息。
2.根据权利要求1所述的社区属性信息确定方法,其特征在于,所述账户的关系数据包括:所述账户之间的资金关系数据、介质关系数据和同位置关系数据中的至少一种。
3.根据权利要求1所述的社区属性信息确定方法,其特征在于,
所述社区节点相关信息包括:社区的集线器HUB节点信息和社区的节点中心性信息中的至少一种;以及
所述社区结构相关信息包括:社区拓扑信息和社区有效性信息中的至少一种。
4.根据权利要求3所述的社区属性信息确定方法,其特征在于,根据所述账户之间的关系数据确定社区的集线器节点信息包括:
以所述社区中的各个账户作为网络的节点,根据账户之间的关系数据构建所述网络的边,生成社区对应的网络;
确定所述网络中各个节点的度;
确定所述网络的网络效率;以及
根据每个节点对网络效率的影响程度,确定对网络效率影响最大的S个节点,将这S个节点作为社区HUB节点;其中,S是社区HUB节点的个数。
5.根据权利要求4所述的社区属性信息确定方法,其特征在于,所述确定对网络效率影响最大的S个节点包括:
按照网络中各个节点的度从大到小对上述各个节点进行排序;
初始化索引参数i为1;
A,按照网络中个节点排序后的顺序从网络中删除节点i;
计算删除节点i后网络的网络效率E(G)i
确定删除节点i后网络的网络效率E(G)i与原网络效率的差值E(G),将其作为网络效率的变化度Di
确定所述网络效率的变化度Di是否大于预先设置的网络效率变化度阈值D,如果是,则所述节点i为社区HUB节点;
在i<N且已确定为社区HUB节点的数目尚未达到预先设置的最大HUB节点数时,将节点i加回到网络中,令i=i+1,并返回A。
6.根据权利要求3所述的社区属性信息确定方法,其特征在于,所述社区节点中心性信息包括社区内每个账户的度中心性;其中,
根据所述至少一个账户之间的关系数据确定社区的节点中心性信息包括:
以所述社区中的各个账户作为网络的节点,根据账户之间的关系数据构建所述网络的边,计算所述网络中各个节点的度Deg(i),并通过如下公式确定每个节点的度中心性:
Figure FDA0002253469900000021
其中,N为网络中节点的数目。
7.根据权利要求3所述的社区属性信息确定方法,其特征在于,所述社区节点中心性信息包括社区内每个账户的节点排名值;其中,
根据所述至少一个账户之间的关系数据确定社区的节点中心性信息包括:
以所述社区中的各个账户作为网络的节点,根据账户之间的关系数据构建所述网络的边,计算所述网络中各个节点的度Deg(i),并通过如下公式确定每个节点的节点排名值:
Figure FDA0002253469900000022
其中,PR(i)为节点i的节点排名值;PR(j)为节点i的节点排名值;N为网络中节点的数目;Mi为与节点i具有关联关系的节点的集合;α为预先设置的系数;以及
对网络中所有节点的排名值进行迭代计算,直至每个节点前后两次计算的排名值的差小于预先定义的误差阈值或者迭代的次数超过了预先设置的迭代次数阈值。
8.根据权利要求3所述的社区属性信息确定方法,其特征在于,所述社区节点中心性信息包括社区内每个账户的中间中心性;其中,
根据所述至少一个账户之间的关系数据确定社区的节点中心性信息包括:
以所述社区中的各个账户作为网络的节点,根据账户之间的关系数据构建所述网络的边,并通过如下公式确定每个节点的中间中心性:
Figure FDA0002253469900000031
其中,BC(i)代表节点i的中间中心性;σ(s,t)代表网络中任意两个节点的所有最短距离;σ(s,t\i)代表网络中任意两个节点的所有最短距离中所有经过节点i的最短距离。
9.根据权利要求3所述的社区属性信息确定方法,其特征在于,所述社区节点中心性信息包括社区内每个账户的接近中心性;其中,
根据所述至少一个账户之间的关系数据确定社区的节点中心性信息包括:
以所述社区中的各个账户作为网络的节点,根据账户之间的关系数据构建所述网络的边,并通过如下公式确定每个节点的接近中心性:
Figure FDA0002253469900000032
其中,C(i)代表节点i的接近中心性;d(u,i)代表网络中节点u和i的最短距离;N为网络中节点的数目。
10.根据权利要求3或5所述的社区属性信息确定方法,其特征在于,所述确定社区有效性信息包括:通过如下公式确定所述网络效率:
其中,所述n表示整个网络的节点的度的和;d(i,j)表示节点i和节点j的最短路径的长度。
11.根据权利要求3所述的社区属性信息确定方法,其特征在于,根据所述至少一个账户之间的关系数据确定社区拓扑信息包括:确定所述社区的传递性,由所述传递性确定所述社区拓扑信息。
12.根据权利要求1所述的社区属性信息确定方法,其特征在于,所述方法进一步包括:
根据所述至少一个社区的属性信息确定上述至少一个社区的属性指标;
根据上述至少一个社区的属性指标,从上述至少一个社区中识别出疑似异常社区;以及
输出上述疑似异常社区及其属性信息。
13.根据权利要求12所述的社区属性信息确定方法,其特征在于,所述根据所述至少一个社区的属性信息确定上述至少一个社区的属性指标包括:对每个社区的属性信息进行归一化处理,确定每个社区的属性指标。
14.根据权利要求13所述的社区属性信息确定方法,其特征在于,所述属性信息包括:社区HUB节点信息、社区节点中心性信息和社区有效性信息中的至少一种;
对所述至少一个社区的属性信息进行归一化处理包括以下处理中的至少一个:
对于社区HUB节点数信息,求所述社区HUB节点数与社区内所有节点的数目的商,得到社区HUB节点比例,并将所述社区HUB节点比例作为所述社区HUB节点数属性指标;
对于社区节点中心性信息,求社区内各个节点中心性信息的平均值,将所述平均值作为所述社区节点中心性属性指标;
对于社区有效性信息,将社区有效性作为所述社区有效性属性指标;以及
所述确定每个社区的属性指标包括:将所述社区HUB节点属性指标、社区节点中心性属性指标和/或社区有效性属性指标进行合并,得到所述社区的属性指标。
15.根据权利要求12所述的社区属性信息确定方法,其特征在于,所述根据上述至少一个社区的属性指标,从上述至少一个社区中识别出疑似异常社区包括:将所述至少一个社区的属性指标与预先设置的属性指标阈值进行比较,当一个社区的属性指标大于所述属性指标阈值时,将所述社区确定为疑似异常社区。
16.根据权利要求12所述的社区属性信息确定方法,其特征在于,所述根据上述至少一个社区的属性指标,从上述至少一个社区中识别出疑似异常社区包括:
根据已确定为异常社区的属性指标训练创建异常社区识别模型;
将待识别社区的属性指标输入到经过训练的异常社区识别模型;以及
根据所述异常社区识别模型输出,确定所述待识别社区是否为疑似异常社区。
17.一种社区属性信息确定装置,其特征在于,包括:
关系数据获取模块,用于获取至少一个账户之间的关系数据;
社区发现模块,用于根据所述至少一个账户之间的关系数据从所述至少一个账户中确定至少一个社区;
属性信息确定模块,用于根据所述至少一个账户之间的关系数据确定所述至少一个社区的属性信息;其中,所述属性信息包括社区节点相关信息和社区结构相关信息中的至少一种;以及
输出模块,用于输出所述至少一个社区及其属性信息。
18.根据权利要求17所述的社区属性信息确定装置,其特征在于,所述属性信息确定模块包括以下两个单元中的至少一个:
社区节点信息确定单元,用于确定社区的节点相关信息;以及
社区结构信息确定单元,用于确定社区的结构相关信息。
19.根据权利要求18所述的社区属性信息确定装置,其特征在于,所述社区节点信息确定单元包括以下两个子单元中的至少一个:社区的集线器HUB节点信息提取子单元,用于确定社区的HUB节点信息;以及社区的节点中心性信息提取子单元,用于确定社区的节点中心性信息;以及
所述社区结构信息确定单元包括以下两个子单元中的至少一个:社区拓扑信息提取子单元,用于确定社区拓扑信息;以及社区有效性信息提取子单元,用于确定社区有效性信息。
20.根据权利要求17所述的社区属性信息确定装置,其特征在于,所述装置进一步包括:
社区属性指标确定模块,用于根据所述至少一个社区的属性信息确定所述至少一个社区的属性指标;以及
异常社区预测模块,用于根据所述至少一个社区的属性指标从所述至少一个社区中识别出疑似异常社区;其中,
所述输出模块进一步用于输出所述疑似异常社区及其所述疑似异常社区的属性信息。
21.根据权利要求20所述的社区属性信息确定装置,其特征在于,所述社区属性指标确定模块包括:
归一化单元,用于对每个社区的属性信息进行归一化处理;以及
社区属性指标确定单元,用于根据归一化后的社区属性信息确定每个社区的属性指标。
22.根据权利要求20所述的社区属性信息确定装置,其特征在于,所述异常社区预测模块包括:
比较单元,用于将每个社区的属性指标与预先设置的属性指标阈值进行比较;以及
预测单元,用于当一个社区的属性指标大于预先设置的属性指标阈值时,将所述社区确定为疑似异常社区。
23.根据权利要求20所述的社区属性信息确定装置,其特征在于,所述异常社区预测模块包括:
训练单元,用于根据已确定为异常社区的属性指标训练创建异常社区识别模型;
输入单元,用于将待识别社区的属性指标输入到经过训练的异常社区识别模型;以及
输出模块,用于根据所述异常社区识别模型输出,确定所述待识别社区是否为疑似异常社区。
24.一种计算设备,其特征在于,包括:
至少一个处理器;
存储器;
网络通信装置;以及
连接所述至少一个处理器、存储器以及网络通信装置的总线;其中,
所述至少一个处理器用于执行存储器存储的机器可读指令模块,执行如权利要求1至9或11至16中任一权利要求所述的社区属性信息确定方法。
25.一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如权利要求1至9或11至16中任一权利要求所述的社区属性信息确定方法。
CN201911043415.6A 2019-10-30 2019-10-30 社区属性信息确定方法、装置及存储介质 Active CN110855641B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911043415.6A CN110855641B (zh) 2019-10-30 2019-10-30 社区属性信息确定方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911043415.6A CN110855641B (zh) 2019-10-30 2019-10-30 社区属性信息确定方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN110855641A true CN110855641A (zh) 2020-02-28
CN110855641B CN110855641B (zh) 2022-07-01

Family

ID=69598883

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911043415.6A Active CN110855641B (zh) 2019-10-30 2019-10-30 社区属性信息确定方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN110855641B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114139022A (zh) * 2022-01-30 2022-03-04 支付宝(杭州)信息技术有限公司 子图抽取方法和装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170026343A1 (en) * 2015-07-22 2017-01-26 Paypal Inc. Anonymous Account Security Exchange
CN107093152A (zh) * 2017-04-24 2017-08-25 杭州创云智科技有限公司 电网结构脆弱性节点识别方法
CN107103403A (zh) * 2017-03-06 2017-08-29 广东工业大学 一种用cio/cto社交网络预测科技公司业绩的方法
CN107194623A (zh) * 2017-07-20 2017-09-22 深圳市分期乐网络科技有限公司 一种团伙欺诈的发现方法及装置
CN107438050A (zh) * 2016-05-26 2017-12-05 北京京东尚科信息技术有限公司 识别网站的潜在恶意用户的方法和系统
CN108492201A (zh) * 2018-03-29 2018-09-04 山东科技大学 一种基于社区结构的社交网络影响力最大化方法
US20190036938A1 (en) * 2016-01-29 2019-01-31 Entit Software Llc Communities on a security information sharing platform
WO2019081631A1 (en) * 2017-10-26 2019-05-02 Airbus Defence And Space Sas METHOD AND SYSTEM IMPLEMENTED BY COMPUTER FOR DETECTING A SET OF RELEVANT COMMUNITIES
CN110135853A (zh) * 2019-04-25 2019-08-16 阿里巴巴集团控股有限公司 团伙用户识别方法、装置和设备
CN110288358A (zh) * 2019-06-20 2019-09-27 武汉斗鱼网络科技有限公司 一种设备团体确定方法、装置、设备及介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170026343A1 (en) * 2015-07-22 2017-01-26 Paypal Inc. Anonymous Account Security Exchange
US20190036938A1 (en) * 2016-01-29 2019-01-31 Entit Software Llc Communities on a security information sharing platform
CN107438050A (zh) * 2016-05-26 2017-12-05 北京京东尚科信息技术有限公司 识别网站的潜在恶意用户的方法和系统
CN107103403A (zh) * 2017-03-06 2017-08-29 广东工业大学 一种用cio/cto社交网络预测科技公司业绩的方法
CN107093152A (zh) * 2017-04-24 2017-08-25 杭州创云智科技有限公司 电网结构脆弱性节点识别方法
CN107194623A (zh) * 2017-07-20 2017-09-22 深圳市分期乐网络科技有限公司 一种团伙欺诈的发现方法及装置
WO2019081631A1 (en) * 2017-10-26 2019-05-02 Airbus Defence And Space Sas METHOD AND SYSTEM IMPLEMENTED BY COMPUTER FOR DETECTING A SET OF RELEVANT COMMUNITIES
CN108492201A (zh) * 2018-03-29 2018-09-04 山东科技大学 一种基于社区结构的社交网络影响力最大化方法
CN110135853A (zh) * 2019-04-25 2019-08-16 阿里巴巴集团控股有限公司 团伙用户识别方法、装置和设备
CN110288358A (zh) * 2019-06-20 2019-09-27 武汉斗鱼网络科技有限公司 一种设备团体确定方法、装置、设备及介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114139022A (zh) * 2022-01-30 2022-03-04 支付宝(杭州)信息技术有限公司 子图抽取方法和装置

Also Published As

Publication number Publication date
CN110855641B (zh) 2022-07-01

Similar Documents

Publication Publication Date Title
CN108322473B (zh) 用户行为分析方法与装置
US9787640B1 (en) Using hypergraphs to determine suspicious user activities
Shi et al. H2-fdetector: A gnn-based fraud detector with homophilic and heterophilic connections
CN103608826B (zh) 利用网络信息挖掘的视频内产品注释
CN110415107B (zh) 数据处理方法、装置、存储介质及电子设备
Ren et al. Ensemfdet: An ensemble approach to fraud detection based on bipartite graph
CN111199474B (zh) 一种基于双方网络图数据的风险预测方法、装置和电子设备
CN104504335B (zh) 基于页面特征和url特征的钓鱼app检测方法及系统
CN104217160A (zh) 一种中文钓鱼网站检测方法及系统
CN112435137B (zh) 一种基于社团挖掘的欺诈信息检测方法及系统
CN110990683B (zh) 一种基于地域与情感特征的微博谣言集成识别方法及装置
CN111523831A (zh) 风险团伙的识别方法、装置、存储介质和计算机设备
CN111222976A (zh) 一种基于双方网络图数据的风险预测方法、装置和电子设备
Zhao et al. Chinese underground market jargon analysis based on unsupervised learning
CN109783805B (zh) 一种网络社区用户识别方法、装置和可读存储介质
CN111371767A (zh) 恶意账号识别方法、恶意账号识别装置、介质及电子设备
CN108961019B (zh) 一种用户账户的检测方法和装置
Abdel-Hafez et al. Product Reputation Model: An Opinion Mining Based Approach.
EP3361704A1 (en) User data sharing method and device
CN110855641B (zh) 社区属性信息确定方法、装置及存储介质
CN112560105B (zh) 保护多方数据隐私的联合建模方法及装置
Pei et al. Subgraph anomaly detection in financial transaction networks
CN111245815B (zh) 数据处理方法、装置、存储介质及电子设备
CN117611335A (zh) 金融风险识别方法、装置、电子设备和存储介质
CN110633410A (zh) 信息处理方法及装置、存储介质、电子装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant