CN111182522B - 一种团伙确定方法、装置、电子设备及计算机存储介质 - Google Patents

一种团伙确定方法、装置、电子设备及计算机存储介质 Download PDF

Info

Publication number
CN111182522B
CN111182522B CN201911194444.2A CN201911194444A CN111182522B CN 111182522 B CN111182522 B CN 111182522B CN 201911194444 A CN201911194444 A CN 201911194444A CN 111182522 B CN111182522 B CN 111182522B
Authority
CN
China
Prior art keywords
user node
target
label information
user
communication relation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911194444.2A
Other languages
English (en)
Other versions
CN111182522A (zh
Inventor
赵瑞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhizhi Heshu Technology Co ltd
Original Assignee
Beijing Zhizhi Heshu Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhizhi Heshu Technology Co ltd filed Critical Beijing Zhizhi Heshu Technology Co ltd
Priority to CN201911194444.2A priority Critical patent/CN111182522B/zh
Publication of CN111182522A publication Critical patent/CN111182522A/zh
Application granted granted Critical
Publication of CN111182522B publication Critical patent/CN111182522B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W8/00Network data management
    • H04W8/18Processing of user or subscriber data, e.g. subscribed services, user preferences or user profiles; Transfer of user or subscriber data
    • H04W8/183Processing at user equipment or user record carrier
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/52User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • General Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Databases & Information Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请提供了一种团伙确定方法、装置、电子设备及计算机存储介质,通过获取多个用户之间的通信关系网络,通信关系网络中包括多个用户节点且多个用户节点之间具有表征多个用户之间通信关系的连接路径;基于通信关系网络中每个用户节点对应的邻居节点的个数,对通信关系网络中的用户节点进行更新,得到目标通信关系网络;基于目标通信关系网络中每个用户节点接收到的该用户节点对应的邻居节点的标签信息,更新该用户节点的标签信息;基于目标通信关系网络中各个用户节点分别对应的更新后的目标标签信息,确定目标通信关系网络中的各个团伙。本申请降低了通信关系网络的复杂度,减少了团伙确定任务的执行时间,提高了任务的执行效率。

Description

一种团伙确定方法、装置、电子设备及计算机存储介质
技术领域
本申请涉及团伙挖掘技术领域,具体而言,涉及一种团伙确定方法、装置、电子设备及计算机存储介质。
背景技术
在日常生活中,用户之间周围存在很多网络关系,例如,微信好友,QQ好友,手机通讯录,通话记录等。这些网络中存在一些联系紧密的群体,这些群体的特征为“内部高内聚,外部松耦合”,挖掘复杂网络关系中这些群体称之为社区发现。社区发现是一个复杂而有意义的过程,在公安系统中,警察可以通过嫌疑人的通话记录,通讯录等,挖掘出潜在的嫌疑团伙,从而为案件侦破提供线索。
但是,在实际挖掘过程中,嫌疑人所对应的网络关系中节点数量可能会非常庞大,可能达到百万甚至千万节点,这就导致在挖掘嫌疑团伙时,数据计算复杂度高,任务执行时间长,执行效率低,进而无法满足实际需求。
发明内容
有鉴于此,本申请的目的在于提供一种团伙确定方法、装置、电子设备及计算机存储介质,通过对用户之间的通信关系网络进行简化,并基于简化后的通信关系网络确定各个团伙,降低了通信关系网络的计算复杂度,减少了任务的执行时间,提高了任务的执行效率。
第一方面,本申请实施例提供了一种团伙确定方法,所述方法包括:
获取多个用户之间的通信关系网络,所述通信关系网络中包括多个用户节点且多个所述用户节点之间具有表征多个用户之间通信关系的连接路径;
基于所述通信关系网络中每个用户节点对应的邻居节点的个数,对所述通信关系网络中的用户节点进行更新,得到目标通信关系网络;
基于所述目标通信关系网络中每个用户节点接收到的该用户节点对应的邻居节点的标签信息,更新该用户节点的标签信息;
基于所述目标通信关系网络中各个用户节点分别对应的更新后的目标标签信息,确定所述目标通信关系网络中的各个团伙。
在一种可选的实施方式中,所述基于所述通信关系网络中每个用户节点对应的邻居节点的个数,对所述通信关系网络中的用户节点进行更新,得到目标通信关系网络,包括:
获取所述通信关系网络中每一个用户节点对应的邻居节点的个数;
从所述通信关系网络中删除对应的邻居节点的个数小于第一阈值的第一目标用户节点,得到包括更新后的用户节点的更新通信关系网络;
若所述更新通信关系网络中包括所述第一目标用户节点,则将所述更新通信关系网络作为新的通信关系网络,返回获取所述通信关系网络中每一个用户节点对应的邻居节点个数的步骤,直至得到包括的每个用户节点对应的邻居节点的个数大于所述第一阈值的目标通信关系网络。
在一种可选的实施方式中,所述基于所述目标通信关系网络中每个用户节点接收到的该用户节点对应的邻居节点的标签信息,更新该用户节点的标签信息,包括:
针对所述目标通信关系网络中的每个用户节点,基于该用户节点接收到该用户节点对应的邻居节点的标签信息,确定每个标签信息对应的统计个数;
选取对应于该用户节点的统计个数最大的目标标签信息,基于所述目标标签信息更新该用户节点的标签信息。
在一种可选的实施方式中,所述选取对应于该用户节点的统计个数最大的目标标签信息,包括:
若存在多个对应于该用户节点的统计个数最大的候选标签信息,则基于多个所述候选标签信息分别对应的权重值,选取对应于该用户节点的权重值最大的候选标签信息作为所述目标标签信息。
在一种可选的实施方式中,所述方法还包括:
基于所述目标通信关系网络中各个用户节点分别对应的标签更新记录,获取对应的更新次数和目标标签信息满足预设条件的第二目标用户节点;
根据每个所述第二目标用户节点下各个目标标签信息分别对应的权重值,选取权重值最大的目标标签信息作为该目标用户节点的标签信息。
在一种可选的实施方式中,所述满足预设条件包括:
第二目标用户节点的更新次数大于第二阈值且所述第二目标用户节点的目标标签信息在多个标签信息之间循环切换。
在一种可选的实施方式中,通过以下方式确定每个用户节点的标签信息对应的权重值:
针对每个用户节点,获取该用户节点对应的邻居节点的个数;
根据该用户节点对应的邻居节点的个数,确定该用户节点的标签信息对应的权重值。
第二方面,本申请实施例还提供了一种团伙确定装置,所述装置包括:
获取模块,用于获取多个用户之间的通信关系网络,所述通信关系网络中包括多个用户节点且多个所述用户节点之间具有表征多个用户之间通信关系的连接路径;
第一更新模块,用于基于所述通信关系网络中每个用户节点对应的邻居节点的个数,对所述通信关系网络中的用户节点进行更新,得到目标通信关系网络;
第二更新模块,用于基于所述目标通信关系网络中每个用户节点接收到的该用户节点对应的邻居节点的标签信息,更新该用户节点的标签信息;
确定模块,用于基于所述目标通信关系网络中各个用户节点分别对应的更新后的目标标签信息,确定所述目标通信关系网络中的各个团伙。
第三方面,本申请实施例还提供了一种电子设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如第一方面任一项所述的团伙确定方法的步骤。
第四方面,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如第一方面任一项所述的团伙确定方法的步骤。
本申请实施例提供的一种团伙确定方法、装置、电子设备及计算机存储介质,在获取的多个用户之间的通信关系网络,基于通信关系网络中每个用户节点对应的邻居节点的个数,对通信关系网络中的用户节点进行更新,得到对通信关系网络进行简化后的目标通信关系网络,基于该目标通信关系网络中每个用户节点接收到的该用户节点对应的邻居节点的标签信息,更新该用户节点的标签信息,并基于目标通信关系网络中各个用户节点分别对应的更新后的目标标签信息,确定目标通信关系网络中的各个团伙。这样,通过对用户之间的通信关系网络进行简化,并基于简化后的通信关系网络确定各个团伙,降低了通信关系网络的计算复杂度,减少了团伙确定任务的执行时间,提高了团伙确定任务的执行效率。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1a示出了本申请实施例提供的一种团伙确定方法的流程图;
图1b示出了本申请实施例提供的一种通信关系网络的示意图;
图2示出了本申请实施例提供的另一种团伙确定方法的流程图;
图3示出了本申请实施例提供的另一种团伙确定方法的流程图;
图4示出了本申请实施例提供的另一种团伙确定方法的流程图;
图5示出了本申请实施例提供的另一种团伙确定方法的流程图;
图6示出了本申请实施例提供的一种团伙确定装置的结构示意图;
图7示出了本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解,本申请中附图仅起到说明和描述的目的,并不用于限定本申请的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。 应该理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。 此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。
另外,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,本申请实施例中将会用到术语“包括”,用于指出其后所声明的特征的存在,但并不排除增加其它的特征。
在公安团伙挖掘领域,在实际挖掘过程中,嫌疑人对应的网络关系中节点数量可能会非常庞大,比如百万甚至千万节点,这就导致在挖掘嫌疑团伙时,数据计算复杂度高,任务执行时间长,执行效率低,进而无法满足实际需求。基于此,本申请实施例提供了提供一种团伙确定方法、装置、电子设备及计算机存储介质。通过对用户之间的通信关系网络进行简化,并基于简化后的通信关系网络确定各个团伙,降低了计算复杂度,减少了任务的执行时间,提高了任务的执行效率。
参照图1a所示,为本申请实施例提供的一种团伙确定方法的流程示意图,所述方法具体包括如下步骤:
S101、获取多个用户之间的通信关系网络,所述通信关系网络中包括多个用户节点且多个所述用户节点之间具有表征多个用户之间通信关系的连接路径。
本申请实施例中,每个用户节点对应相应用户的通信信息,比如通信号码(比如手机号、微信号、QQ号等)。每两个用户节点之间具有一连接路径(即带有箭头的边),该连接路径表征该两个用户之间的通信关系。如图1b所示,针对用户节点1和用户节点2,这两个用户节点的连接路径的箭头从用户节点1指向用户节点2,表征是用户节点1向用户节点2发起通信;而针对用户节点1和用户节点3,这两个用户节点的连接路径的箭头从用户节点3指向用户节点1,表征是用户节点3向用户节点1发起通信,即用户节点1接收到用户节点3发起的通信。
其中,每两个用户节点每进行一次通信就对应有一条连接路径。如图1b所示,用户节点1向用户节点2发起两次通信,相应的用户节点1与用户节点2对应有两条连接路径。用户节点1接收到用户节点3发起一次通信,相应的用户节点1与用户节点3对应有一条连接路径。
其中,每个用户节点对应有一条或多条连接路径,并通过每个连接路径与该用户节点的邻居节点连接,以表征与邻居节点的通信关系。相应的,整个通信关系网络中多个用户节点之间的连接路径表征多个用户之间通信关系。
S102、基于所述通信关系网络中每个用户节点对应的邻居节点的个数,对所述通信关系网络中的用户节点进行更新,得到目标通信关系网络。
在本申请实施例中,针对每个用户节点,该用户节点指向其邻居节点的连接路径的个数(即该用户节点的出边条数)为该用户节点的出度,该用户节点的邻居节点指向该用户节点的连接路径的个数(即该用户节点的入边条数)为该用户节点的入度。
相应的,对于每个用户节点,统计该用户节点对应的连接路径(包括该用户节点对应的入度和出度)的个数,由于该用户节点的每一条连接路径都是用于连接该用户节点的邻居节点,因此,该用户节点对应的连接路径的个数即该用户节点对应的邻居节点的个数。
作为一种实施方式,基于每个用户节点对应的邻居节点的个数,将对应的邻居节点的个数较少的用户节点从通信关系网络中剔除,进而得到包括更新后的用户节点的目标通信关系网络。
S103、基于所述目标通信关系网络中每个用户节点接收到的该用户节点对应的邻居节点的标签信息,更新该用户节点的标签信息。
本申请实施例中,通信关系网络中的每个用户节点均对应有唯一的标签信息。可选的,将每个用户节点的编号作为该用户节点的标签信息,比如,用户节点1,其标签信息为1,用户节点2,其标签信息为2。
在本申请实施例中,每个用户节点按照通信关系网络中的通信关系,将其标签信息传播给其邻居节点。针对每个用户节点,获取该用户节点接收到的其邻居节点的标签信息,根据各个邻居节点的标签信息的数量和各个标签信息对应的权重值更新该用户节点的标签信息。
S104、基于所述目标通信关系网络中各个用户节点分别对应的更新后的目标标签信息,确定所述目标通信关系网络中的各个团伙。
这里,在确定了目标通信关系网络中每个用户节点对应的更新后的目标标签信息后,将目标标签信息相同的用户节点划分为一组,得到多组用户节点。其中,每组用户节即一个团伙,相应的,多组用户节点即确定多个团伙。
本申请实施例提供的一种团伙确定方法,在获取的多个用户之间的通信关系网络,基于通信关系网络中每个用户节点对应的邻居节点的个数,对通信关系网络中的用户节点进行更新,得到对通信关系网络进行简化后的目标通信关系网络,基于该目标通信关系网络中每个用户节点接收到的该用户节点对应的邻居节点的标签信息,更新该用户节点的标签信息,并基于目标通信关系网络中各个用户节点分别对应的更新后的目标标签信息,确定目标通信关系网络中的各个团伙。这样,通过对用户之间的通信关系网络进行简化,并基于简化后的通信关系网络确定各个团伙,降低了通信关系网络的计算复杂度,减少了团伙确定任务的执行时间,提高了团伙确定任务的执行效率。
进一步的,如图2所示,本申请实施例提供的团伙确定方法中,所述基于所述通信关系网络中每个用户节点对应的邻居节点的个数,对所述通信关系网络中的用户节点进行更新,得到目标通信关系网络,包括:
S201、获取所述通信关系网络中每一个用户节点对应的邻居节点的个数。
本申请实施例中,对于每个用户节点,统计该用户节点对应的连接路径(包括该用户节点对应的入度和出度)的个数,由于该用户节点的每一条连接路径都是用于连接该用户节点的邻居节点,因此,将该用户节点对应的连接路径的个数确定为该用户节点对应的邻居节点的个数。
如图1b所示,用户节点1与用户节点2具有三条连接路径,用户节点1与用户节点3具有一条连接路径,统计得出,用户节点1对应有4条连接路径,相应的,确定用户节点1对应的邻居节点的个数为4。
S202、从所述通信关系网络中删除对应的邻居节点的个数小于第一阈值的第一目标用户节点,得到包括更新后的用户节点的更新通信关系网络。
针对每个用户节点,将该用户节点对应的邻居节点的个数与预设的第一阈值进行比较,若该邻居节点的个数小于第一阈值,确定该用户节点为第一目标用户节点,并则从通信关系网络中删除该用户节点。
比如,用户节点1对应的邻居节点为4个,用户节点2对应的邻居节点为8个,用户节点3对应的邻居节点为12个,用户节点4对应的邻居节点为8个,比如,设置的第一阈值为5,相应的,用户节点1对应的邻居节点的个数小于5,确定该用户节点1为第一目标用户节点,相应的,从通信关系网络中删除该用户节点1。
在剔除了对应的邻居节点的个数小于第一阈值的第一目标用户节点之后,得到包括剩余的用户节点的更新通信关系网络;其中,更新通信关系网络的用户节点个数小于通信关系网络的用户节点个数。
S203、若所述更新通信关系网络中包括所述第一目标用户节点,则将所述更新通信关系网络作为新的通信关系网络,返回获取所述通信关系网络中每一个用户节点对应的邻居节点个数的步骤,直至得到包括的每个用户节点对应的邻居节点的个数大于所述第一阈值的目标通信关系网络。
本申请实施例中,在得到更新通信关系网络之后,针对更新通信关系网络中的每一个用户节点,获取该用户节点对应的邻居节点的个数,并判断该用户节点对应的邻居节点的个数是否小于第一阈值,若是,则确定更新通信关系网络中包括第一目标用户节点。
此时,将上述更新通信关系网络作为新的通信关系网络,返回获取所述通信关系网络中每一个用户节点对应的邻居节点个数的步骤,剔除更新通信关系网络中对应的邻居节点的个数小于第一阈值的第一目标用户节点之后,再次得到更新通信关系网络,再次检测该更新通信关系网络中是否存在第一目标用户节点,循环该过程,直至得到包括的每个用户节点对应的邻居节点的个数大于第一阈值的目标通信关系网络。
进一步的,如图3所示,本申请实施例提供的团伙确定方法中,所述基于所述目标通信关系网络中每个用户节点接收到的该用户节点对应的邻居节点的标签信息,更新该用户节点的标签信息,包括:
S301、针对所述目标通信关系网络中的每个用户节点,基于该用户节点接收到该用户节点对应的邻居节点的标签信息,确定每个标签信息对应的统计个数。
S302、选取对应于该用户节点的统计个数最大的目标标签信息,基于所述目标标签信息更新该用户节点的标签信息。
结合步骤301和步骤302,其中,在目标通信关系网络,每个用户节点对应有唯一的标签信息。可选的,将每个用户节点的编号作为该用户节点的标签信息,比如,用户节点1,其标签信息为1,用户节点2,其标签信息为2。
其中,a、每个用户节点向其邻居节点(即该用户节点对应的边另一端的用户节点)传播自己的标签,以通知其邻居节点自己是属于哪个社区的(即通知其邻居节点自己的标签信息)。b、相应的,针对每个用户节点,统计该用户节点接收到该用户节点对应的邻居节点的标签信息;其中,该用户节点的不同邻居节点发送的标签信息不同,且同一个邻居可能多次发送标签信息。相应的,确定对应于该用户节点的各个邻居节点的标签信息,并统计每个标签信息对应的统计个数。
其中,每个用户节点会根据其邻居节点的各个标签信息分别对应的统计个数,选择统计个数最大(也即重复数最多)的标签信息作为目标标签信息,并基于该目标标签信息更新该用户节点的标签信息,即哪个社区包含该用户节点最多的邻居节点,则该用户节点就属于哪个社区。
比如,用户节点2接收到的用户节点1的标签信息(即标签1)为2个、接收到的用户节点3的标签信息(即标签3)为1个,因此,确定目标标签信息为标签1,并通过标签1更新用户节点2的标签信息(即标签2),相应的,用户节点2原来的标签2即更新为标签1。
这里,针对每个用户节点,若该节点更新后的标签发生了变化,该用户节点仍然处于激活状态,继续向其邻居节点(即该用户节点对应的边另一端的用户节点)传播自己的标签,即激活状态的用户节点继续步骤上述a和上述b;而若该节点更新后的标签未发生变化,该用户节点进入非激活状态,即该用户节点不会向其邻居节点(即该用户节点对应的边另一端的用户节点)传播自己的标签。循环上述过程,直到目标通信关系网络中所有的用户节点都进入非激活状态,完成目标通信关系网络的收敛。
值得注意的是,进入非激活状态的每个用户节点,如果在收到其邻居节点的消息后,该用户节点的标签信息发生了变化,则该用户节点将再次进入激活状态,重新开始标签传播。
最终,当目标通信关系网络的收敛,也即迭代过程结束时,相似的用户节点的概率分布也趋于相似,这样,就可以将相似的用户节点(即标签信息相同的用户节点)划分到同一个类别中,完成团伙的确认,从而完成标签传播过程。
进一步的,本申请实施例提供的团伙确定方法中,所述选取对应于该用户节点的统计个数最大的目标标签信息,包括:
若存在多个对应于该用户节点的统计个数最大的候选标签信息,则基于多个所述候选标签信息分别对应的权重值,选取对应于该用户节点的权重值最大的候选标签信息作为所述目标标签信息。
在本申请实施例中,每个用户节点对应有唯一的标签信息且该用户节点还对应有唯一的权重值;其中,不同的用户节点对应的标签信息不同,不同的用户节点对应的权重值也不同。相应的,每个标签信息对应唯一的权重值,且不同的标签信息对应的权重值不同。
比如,用户节点1对应标签1,用户节点2对应标签2,用户节点3对应标签3;用户节点1对应权重值为0.8,用户节点2对应权重值为0.1,用户节点3对应权重值为0.3;相应的,标签1对应权重值为0.8,标签2对应权重值为0.1,标签3对应权重值为0.3。
针对每个用户节点,当该用户节点对应有多个统计个数最大的候选标签信息,则将这多个候选标签信息的权重值进行比较,选取对应最大权重值的候选标签信息,作为对应于该用户节点的目标标签信息,并基于目标标签信息更新该用户节点的标签信息。
比如,用户节点1对应的来自用户节点2的标签2为10个,对应的来自用户节点3的标签3为10个,此时,基于标签2和标签3的权重值,选择权重值最大的候选标签信息;比如,标签2的权重为0.8,标签3的权重值为0.1,则选择标签2作为用户节点1的目标标签信息,并基于标签2更新用户节点1的标签信息(即标签1);相应的,用户节点1原来的标签1即更新为标签2。
考虑到目标通信关系网络中存在特定的用户节点一直处于激活状态(即一直向其邻居节点发送标签信息),使整个目标通信关系网络算不收敛,基于此,本申请实施例采用了为该特定的节点决策标签信息,以达到使这些特定的节点收敛的目的。进一步的,如图4所示,本申请实施例提供的团伙确定方法中,所述方法还包括:
S401、基于所述目标通信关系网络中各个用户节点分别对应的标签更新记录,获取对应的更新次数和目标标签信息满足预设条件的第二目标用户节点。
在本申请实施例中,每个用户节点分别对应的标签更新记录包括:该用户节点的更新时间,以及每次更新前的标签信息和更新后的目标标签信息。
这里,满足预设条件指的是:第二目标用户节点的更新次数大于第二阈值且所述第二目标用户节点的目标标签信息在多个标签信息之间循环切换。也即,当某一用户节点对应的更新次数大于第二阈值(比如100次)且该用户节点在每次更新的目标标签信息在标签1和标签2之间重复,比如第一次更新后为1,第二次更新后为2,第三次更新后为1,第四次更新后为2,这样,确定该用户节点为第二目标用户节点。
S402、根据每个所述第二目标用户节点下各个目标标签信息分别对应的权重值,选取权重值最大的目标标签信息作为该目标用户节点的标签信息。
本申请实施例中,针对选取除的第二目标用户节点,基于该第二目标用户节点对应的标签更新记录,获取该第二目标用户节点对应的多个目标标签信息,将这多个目标标签信息的权重值进行比较,选择权重值最大的目标标签信息作为该目标用户节点的标签信息,并使该第二用户节点收敛(即使该第二用户节点不再向其邻居节点发送标签信息)。
比如,第二目标用户节点对应的多个目标标签信息分别为标签1和标签2,其中,标签1对应的权重为0.8,标签2的权重值为0.1,则选择标签1作为该第二目标用户节点的标签信息,并使该第二目标用户节点信息收敛(即使该第二用户节点不再向其邻居节点发送标签信息)。
在本申请实施例中,通过确定重要性最高的目标标签信息作为该第二目标用户节点的标签信息,既达到了使第二目标用户节点收敛,还能提高团伙划分的准确度。
进一步的,如图5所示,本申请实施例提供的团伙确定方法中,通过以下方式确定每个用户节点的标签信息对应的权重值:
S501、针对每个用户节点,获取该用户节点对应的邻居节点的个数。
S502、根据该用户节点对应的邻居节点的个数,确定该用户节点的标签信息对应的权重值。
在本申请实施例中,结合pageRank(网页排名)算法计算各个用户节点的“重要性”,给各个用户节点赋予不同的权重值。可选的,针对每个用户节点,获取该用户节点对应的邻居节点的个数,通过pageRank算法根据该用户节点对应的邻居节点的个数,确定该用户节点的标签信息对应的权重值。
如上所述,对于每个用户节点,统计该用户节点对应的连接路径(包括该用户节点对应的入度和出度)的个数,由于该用户节点的每一条连接路径都是用于连接该用户节点的邻居节点,因此,该用户节点对应的连接路径的个数即该用户节点对应的邻居节点的个数。
比如,有两个节点,用户节点A有10条边(即10条连接路径),用户节点B有5条边(即5条连接路径),相应的,基于pageRank算法确定的用户节点A的权值大于用户节点B的权值。
本申请实施例从实际工程问题出发,为了解决工程中碰到的大数据集处理困难,算法复杂度高,结果不准确等问题。预先对通信关系网络进行简化,并基于简化后的目标通信关系网络确定团伙,能够处理大规模数据集,降低了通信关系网络的计算复杂度,减少了团伙确定任务的执行时间,提高了团伙确定任务的执行效率,并且,还提高了团伙划分的准确度。
基于同一发明构思,本申请实施例中还提供了与团伙确定方法对应的游戏中虚拟对象的部署控制装置,由于本申请实施例中的装置解决问题的原理与本申请实施例上述团伙确定方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
如图6所示,本申请实施例提供的一种团伙确定装置,所述装置包括:
第一获取模块601,用于获取多个用户之间的通信关系网络,所述通信关系网络中包括多个用户节点且多个所述用户节点之间具有表征多个用户之间通信关系的连接路径;
第一更新模块602,用于基于所述通信关系网络中每个用户节点对应的邻居节点的个数,对所述通信关系网络中的用户节点进行更新,得到目标通信关系网络;
第二更新模块603,用于基于所述目标通信关系网络中每个用户节点接收到的该用户节点对应的邻居节点的标签信息,更新该用户节点的标签信息;
第一确定模块604,用于基于所述目标通信关系网络中各个用户节点分别对应的更新后的目标标签信息,确定所述目标通信关系网络中的各个团伙。
本申请实施例提供的一种团伙确定装置,在获取的多个用户之间的通信关系网络,基于通信关系网络中每个用户节点对应的邻居节点的个数,对通信关系网络中的用户节点进行更新,得到对通信关系网络进行简化后的目标通信关系网络,基于该目标通信关系网络中每个用户节点接收到的该用户节点对应的邻居节点的标签信息,更新该用户节点的标签信息,并基于目标通信关系网络中各个用户节点分别对应的更新后的目标标签信息,确定目标通信关系网络中的各个团伙。这样,通过对用户之间的通信关系网络进行简化,并基于简化后的通信关系网络确定各个团伙,降低了通信关系网络的计算复杂度,减少了团伙确定任务的执行时间,提高了团伙确定任务的执行效率。
在一种可选的实施方式中,第一更新模块602在基于所述通信关系网络中每个用户节点对应的邻居节点的个数,对所述通信关系网络中的用户节点进行更新,得到目标通信关系网络时,包括:
获取所述通信关系网络中每一个用户节点对应的邻居节点的个数;
从所述通信关系网络中删除对应的邻居节点的个数小于第一阈值的第一目标用户节点,得到包括更新后的用户节点的更新通信关系网络;
若所述更新通信关系网络中包括所述第一目标用户节点,则将所述更新通信关系网络作为新的通信关系网络,返回获取所述通信关系网络中每一个用户节点对应的邻居节点个数的步骤,直至得到包括的每个用户节点对应的邻居节点的个数大于所述第一阈值的目标通信关系网络。
在一种可选的实施方式中,第二更新模块603在基于所述目标通信关系网络中每个用户节点接收到的该用户节点对应的邻居节点的标签信息,更新该用户节点的标签信息时,包括:
针对所述目标通信关系网络中的每个用户节点,基于该用户节点接收到该用户节点对应的邻居节点的标签信息,确定每个标签信息对应的统计个数;
选取对应于该用户节点的统计个数最大的目标标签信息,基于所述目标标签信息更新该用户节点的标签信息。
在一种可选的实施方式中,第二更新模块603在选取对应于该用户节点的统计个数最大的目标标签信息时,包括:
若存在多个对应于该用户节点的统计个数最大的候选标签信息,则基于多个所述候选标签信息分别对应的权重值,选取对应于该用户节点的权重值最大的候选标签信息作为所述目标标签信息。
在一种可选的实施方式中,本申请实施例提供的团伙确定装置还包括:
第二获取模块,用于基于所述目标通信关系网络中各个用户节点分别对应的标签更新记录,获取对应的更新次数和目标标签信息满足预设条件的第二目标用户节点;
选取模块,用于根据每个所述第二目标用户节点下各个目标标签信息分别对应的权重值,选取权重值最大的目标标签信息作为该目标用户节点的标签信息。
在一种可选的实施方式中,所述满足预设条件包括:
第二目标用户节点的更新次数大于第二阈值且所述第二目标用户节点的目标标签信息在多个标签信息之间循环切换。
在一种可选的实施方式中,本申请实施例提供的团伙确定装置还包括:
第三获取模块,用于针对每个用户节点,获取该用户节点对应的邻居节点的个数;
第二确定模块,用于根据该用户节点对应的邻居节点的个数,确定该用户节点的标签信息对应的权重值。
本申请从实际工程问题出发,为了解决工程中碰到的大数据集处理困难,算法复杂度高,结果不准确等问题,预先对通信关系网络进行简化,并基于简化后的目标通信关系网络确定团伙,能够处理大规模数据集,降低了通信关系网络的计算复杂度,减少了团伙确定任务的执行时间,提高了团伙确定任务的执行效率,并且,还提高了团伙划分的准确度。
如图7所示,本申请实施例提供的一种电子设备700,包括:处理器701、存储器702和总线,所述存储器702存储有所述处理器701可执行的机器可读指令,当电子设备运行时,所述处理器701与所述存储器702之间通过总线通信,所述处理器701执行所述机器可读指令,以执行如上述团伙确定方法的步骤。
具体地,上述存储器702和处理器701能够为通用的存储器和处理器,这里不做具体限定,当处理器701运行存储器702存储的计算机程序时,能够执行上述团伙确定方法。
对应于上述团伙确定方法,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述团伙确定方法的步骤。
本申请实施例从实际工程问题出发,为了解决工程中碰到的大数据集处理困难,算法复杂度高,结果不准确等问题。预先对通信关系网络进行简化,并基于简化后的目标通信关系网络确定团伙,能够处理大规模数据集,降低了通信关系网络的计算复杂度,减少了团伙确定任务的执行时间,提高了团伙确定任务的执行效率,并且,还提高了团伙划分的准确度。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考方法实施例中的对应过程,本申请中不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (7)

1.一种团伙确定方法,其特征在于,所述方法包括:
获取多个用户之间的通信关系网络,所述通信关系网络中包括多个用户节点且多个所述用户节点之间具有表征多个用户之间通信关系的连接路径;
基于所述通信关系网络中每个用户节点对应的邻居节点的个数,对所述通信关系网络中的用户节点进行更新,得到目标通信关系网络;
基于所述目标通信关系网络中每个用户节点接收到的该用户节点对应的邻居节点的标签信息,更新该用户节点的标签信息;
基于所述目标通信关系网络中各个用户节点分别对应的更新后的目标标签信息,确定所述目标通信关系网络中的各个团伙;
所述基于所述通信关系网络中每个用户节点对应的邻居节点的个数,对所述通信关系网络中的用户节点进行更新,得到目标通信关系网络,包括:
获取所述通信关系网络中每一个用户节点对应的邻居节点的个数;
从所述通信关系网络中删除对应的邻居节点的个数小于第一阈值的第一目标用户节点,得到包括更新后的用户节点的更新通信关系网络;
若所述更新通信关系网络中包括所述第一目标用户节点,则将所述更新通信关系网络作为新的通信关系网络,返回获取所述通信关系网络中每一个用户节点对应的邻居节点个数的步骤,直至得到包括的每个用户节点对应的邻居节点的个数大于所述第一阈值的目标通信关系网络;
所述基于所述目标通信关系网络中每个用户节点接收到的该用户节点对应的邻居节点的标签信息,更新该用户节点的标签信息,包括:
针对所述目标通信关系网络中的每个用户节点,基于该用户节点接收到该用户节点对应的邻居节点的标签信息,确定每个标签信息对应的统计个数;
选取对应于该用户节点的统计个数最大的目标标签信息,基于所述目标标签信息更新该用户节点的标签信息;
所述方法还包括:
基于所述目标通信关系网络中各个用户节点分别对应的标签更新记录,获取对应的更新次数和目标标签信息满足预设条件的第二目标用户节点;
根据每个所述第二目标用户节点下各个目标标签信息分别对应的权重值,选取权重值最大的目标标签信息作为该目标用户节点的标签信息。
2.根据权利要求1所述的团伙确定方法,其特征在于,所述选取对应于该用户节点的统计个数最大的目标标签信息,包括:
若存在多个对应于该用户节点的统计个数最大的候选标签信息,则基于多个所述候选标签信息分别对应的权重值,选取对应于该用户节点的权重值最大的候选标签信息作为所述目标标签信息。
3.根据权利要求1所述的团伙确定方法,其特征在于,所述满足预设条件包括:
第二目标用户节点的更新次数大于第二阈值且所述第二目标用户节点的目标标签信息在多个标签信息之间循环切换。
4.根据权利要求2所述的团伙确定方法,其特征在于,通过以下方式确定每个用户节点的标签信息对应的权重值:
针对每个用户节点,获取该用户节点对应的邻居节点的个数;
根据该用户节点对应的邻居节点的个数,确定该用户节点的标签信息对应的权重值。
5.一种团伙确定装置,其特征在于,所述装置包括:
获取模块,用于获取多个用户之间的通信关系网络,所述通信关系网络中包括多个用户节点且多个所述用户节点之间具有表征多个用户之间通信关系的连接路径;
第一更新模块,用于基于所述通信关系网络中每个用户节点对应的邻居节点的个数,对所述通信关系网络中的用户节点进行更新,得到目标通信关系网络;
第二更新模块,用于基于所述目标通信关系网络中每个用户节点接收到的该用户节点对应的邻居节点的标签信息,更新该用户节点的标签信息;
确定模块,用于基于所述目标通信关系网络中各个用户节点分别对应的更新后的目标标签信息,确定所述目标通信关系网络中的各个团伙;
第一更新模块在基于所述通信关系网络中每个用户节点对应的邻居节点的个数,对所述通信关系网络中的用户节点进行更新,得到目标通信关系网络时,包括:
获取所述通信关系网络中每一个用户节点对应的邻居节点的个数;
从所述通信关系网络中删除对应的邻居节点的个数小于第一阈值的第一目标用户节点,得到包括更新后的用户节点的更新通信关系网络;
若所述更新通信关系网络中包括所述第一目标用户节点,则将所述更新通信关系网络作为新的通信关系网络,返回获取所述通信关系网络中每一个用户节点对应的邻居节点个数的步骤,直至得到包括的每个用户节点对应的邻居节点的个数大于所述第一阈值的目标通信关系网络;
第二更新模块在基于所述目标通信关系网络中每个用户节点接收到的该用户节点对应的邻居节点的标签信息,更新该用户节点的标签信息时,包括:
针对所述目标通信关系网络中的每个用户节点,基于该用户节点接收到该用户节点对应的邻居节点的标签信息,确定每个标签信息对应的统计个数;
选取对应于该用户节点的统计个数最大的目标标签信息,基于所述目标标签信息更新该用户节点的标签信息;
所述装置还包括:
第二获取模块,用于基于所述目标通信关系网络中各个用户节点分别对应的标签更新记录,获取对应的更新次数和目标标签信息满足预设条件的第二目标用户节点;
选取模块,用于根据每个所述第二目标用户节点下各个目标标签信息分别对应的权重值,选取权重值最大的目标标签信息作为该目标用户节点的标签信息。
6.一种电子设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如权利要求1至4任一项所述的团伙确定方法的步骤。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至4任一项所述的团伙确定方法的步骤。
CN201911194444.2A 2019-11-28 2019-11-28 一种团伙确定方法、装置、电子设备及计算机存储介质 Active CN111182522B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911194444.2A CN111182522B (zh) 2019-11-28 2019-11-28 一种团伙确定方法、装置、电子设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911194444.2A CN111182522B (zh) 2019-11-28 2019-11-28 一种团伙确定方法、装置、电子设备及计算机存储介质

Publications (2)

Publication Number Publication Date
CN111182522A CN111182522A (zh) 2020-05-19
CN111182522B true CN111182522B (zh) 2022-10-25

Family

ID=70651922

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911194444.2A Active CN111182522B (zh) 2019-11-28 2019-11-28 一种团伙确定方法、装置、电子设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN111182522B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111767321B (zh) * 2020-06-30 2024-02-09 北京百度网讯科技有限公司 节点关系网络的确定方法、装置、电子设备和存储介质
CN111984831A (zh) * 2020-08-21 2020-11-24 北京明略软件系统有限公司 用于盗窃事件信息挖掘的方法与装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103327092A (zh) * 2012-11-02 2013-09-25 中国人民解放军国防科学技术大学 一种信息网络上的社区发现方法和系统
CN105677648A (zh) * 2014-11-18 2016-06-15 四三九九网络股份有限公司 一种基于标签传播算法的社团发现方法及系统
CN107529656A (zh) * 2016-06-22 2018-01-02 腾讯科技(深圳)有限公司 一种社交网络社区的划分方法及服务器
CN108011735A (zh) * 2016-10-27 2018-05-08 腾讯科技(深圳)有限公司 社区发现方法及装置
CN110210867A (zh) * 2019-05-14 2019-09-06 无线生活(北京)信息技术有限公司 节点标签的确定方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103327092A (zh) * 2012-11-02 2013-09-25 中国人民解放军国防科学技术大学 一种信息网络上的社区发现方法和系统
CN105677648A (zh) * 2014-11-18 2016-06-15 四三九九网络股份有限公司 一种基于标签传播算法的社团发现方法及系统
CN107529656A (zh) * 2016-06-22 2018-01-02 腾讯科技(深圳)有限公司 一种社交网络社区的划分方法及服务器
CN108011735A (zh) * 2016-10-27 2018-05-08 腾讯科技(深圳)有限公司 社区发现方法及装置
CN110210867A (zh) * 2019-05-14 2019-09-06 无线生活(北京)信息技术有限公司 节点标签的确定方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于社交网络的犯罪团伙发现研究;潘潇;《中国优秀硕士学位论文全文数据库 (基础科学辑)》;20190915;第3章和第4章 *
复杂网络中社区发现方法研究;张鑫;《中国优秀博硕士学位论文全文数据库(博士) (基础科学辑)》;20180115;全文 *

Also Published As

Publication number Publication date
CN111182522A (zh) 2020-05-19

Similar Documents

Publication Publication Date Title
EP4080368A1 (en) Alarm information generation method and apparatus, electronic device, and storage medium
CN111182522B (zh) 一种团伙确定方法、装置、电子设备及计算机存储介质
JP2018528497A (ja) モバイルゲームのためのデータ処理方法および装置
US11956260B2 (en) Attack monitoring service that selectively analyzes connection graphs for suspected attack paths
EP4080842A1 (en) Method and apparatus for obtaining malicious event information, and electronic device
EP4075749A1 (en) Detection method and detection device for heavy flow data stream
CN114064668A (zh) 用于存储管理的方法、电子设备和计算机程序产品
US11656989B2 (en) Maintaining a cached version of a file at a router device
CN115883187A (zh) 网络流量数据中的异常信息识别方法、装置、设备和介质
CN111884843A (zh) 一种消息处理方法、装置、电子设备及存储介质
CN110674168A (zh) 一种缓存键异常检测方法、装置、存储介质以及终端
CN111178678B (zh) 基于社团影响力的网络节点重要性评估方法
CN111405007A (zh) Tcp会话管理方法、装置、存储介质及电子设备
CN113225356B (zh) 一种基于ttp的网络安全威胁狩猎方法及网络设备
CN113132241B (zh) Acl模板动态配置方法及装置
CN115423496A (zh) 一种id打通方法、装置、电子设备及存储介质
CN113271216B (zh) 一种数据处理方法及相关设备
CN112449057A (zh) 消息的提示方法和装置、存储介质及电子装置
WO2019042060A1 (zh) 成员角色确定方法、装置及存储介质
US12028240B2 (en) Method, electronic device, and computer program product for cross-regional data searching
CN110868384B (zh) 确定网络环境中易受攻击的资产的方法、装置及电子设备
CN113419992B (zh) 文件清除配置页面展示方法、装置、电子设备和介质
US20230403227A1 (en) Method, electronic device, and computer program product for cross-regional data searching
CN117914625B (zh) 基于关键信息基础设施的网络安全态势评估方法及系统
CN116361309B (zh) 数据查询系统和缓存数据更新方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20210914

Address after: 100000 room 650, 6th floor, building 11, Huashan Garden Cultural Media Industrial Park, 1376 folk culture street, Gaobeidian village, Gaobeidian Township, Chaoyang District, Beijing

Applicant after: Beijing Zhizhi Heshu Technology Co.,Ltd.

Address before: No.310, building 4, courtyard 8, Dongbei Wangxi Road, Haidian District, Beijing

Applicant before: MININGLAMP SOFTWARE SYSTEMS Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant