CN111475736A

CN111475736A - 社区挖掘的方法、装置和服务器

Info

Publication number: CN111475736A
Application number: CN202010191051.2A
Authority: CN
Inventors: 周亭亭; 应翔; 王工艺; 余思
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2020-03-18
Filing date: 2020-03-18
Publication date: 2020-07-31

Abstract

本申请提供一种社区挖掘的方法，包括：获取关系网络中新增边或删除边的节点信息；根据所述新增边或删除边的节点信息对所述新增边或删除边进行局部社区的划分，得到关系网络中的第一社区结果；根据所述第一社区结果对所述关系网络中的原始社区结果进行更新，得到全量社区结果。本申请中，对大数据的关系网络进行社区分析，在节省资源和时间开销的同时，还可得到更精确的结果，提高推送的精确度。

Description

社区挖掘的方法、装置和服务器

技术领域

本申请涉及大数据领域，并且更具体地，涉及一种社区挖掘的方法、装置和服务器。

背景技术

社区挖掘技术在线下推广、广告投放等领域占有越来越重要的作用。良好的社区挖掘结果可以有效提高线下推广、广告投放的成功率。

在日益膨胀的数字时代，对大规模数据的分析需要有近乎实时的性能要求，同时，不断增大的数字规模还对资源提出了更高的挑战。在一种传统的技术方案中，在网络中有新增关系数据时，需要进行全量数据的分析，其效率较低，占用的资源较多，时效较长，不适用于对实时性要求较高的场景，例如，警务平台、交通平台等。

发明内容

本申请实施例提供一种社区挖掘的方法、装置和服务器，可以对大数据的关系网络进行社区分析，在节省资源和时间开销的同时，还可得到精确的结果，提高推送的精确度够。

第一方面，提供了一种方法社区挖掘的方法，包括：获取关系网络中新增边或删除边的节点信息；根据所述新增边或删除边的节点信息对所述新增边或删除边进行局部社区的划分，得到关系网络中的第一社区结果；根据所述第一社区结果对所述关系网络中的原始社区结果进行更新，得到全量社区结果。

上述技术方案中，在网络中有新增关系数据时，可以先在局部网络中对目标节点进行增量计算，再对全局信息进行融合和更新，这样，在对数据的关系网络进行社区分析，在节省资源和时间开销的同时，还可以得到精确的结果，提高推送的精确度。

在一种可能的实现方式中，第一新增边包括第一节点和第二节点，该第一节点为第一原始社区中的原始节点，该第二节点属于第二原始社区中的原始节点，如果添加所述第一新增边后，所述第一原始社区和所述第二原始社区之间的模块度大于第一预设阈值，将该第一原始社区和该第二原始社区合并为一个社区。

在另一种可能的实现方式中，所述模块度为所述第一原始社区包含的原始节点和所述第二原始社区中的原始节点之间的联系程度。

在另一种可能的实现方式中，第一新增边包括第一节点和第二节点，该第一节点属于第一原始社区中的原始节点，该第二节点属于新增节点，确定与该第二节点直接关联的节点集合，该节点集合中包括该关系网络中的至少一个原始节点；根据该节点集合中至少一个原始节点所属的原始社区，确定该第二节点所属的原始社区。

在另一种可能的实现方式中，第一新增边包括第一节点和第二节点，该第一节点和该第二节点均属于新增节点，根据所述第一节点和所述第二节点与所述关系网络中的原始节点之间的联系程度确定将所述第一节点和所述第二节点划分到所述关系网络的原始社区中或划分为一个新的社区。

在另一种可能的实现方式中，第一删除边包括第三节点和第四节点，该第三节点和该第四节点均属于第一原始社区中的原始节点，如果删除所述第一删除边后，所述第一原始社区的模块度小于第二预设阈值，将所述第一原始社区分裂为两个社区，所述第三节点和所述第四节点分别属于所述两个社区。

在另一种可能的实现方式中，所述全量社区结果包括所述关系网络中的边所属的社区或所述关系网络中社区的划分结果。

第二方面，提供了一种社区挖掘的装置，包括：

获取模块，用于获取关系网络中新增边或删除边的节点信息；

确定模块，用于根据所述新增边或删除边的节点信息对所述新增边或删除边进行局部社区的划分，得到关系网络中的第一社区结果；

更新模块，用于根据所述第一社区结果对所述关系网络中的原始社区结果进行更新，得到全量社区结果。

在一种可能的实现方式中，第一新增边包括第一节点和第二节点，该第一节点属于第一原始社区中的原始节点，该第二节点属于第二原始社区中的原始节点，

该确定模块具体用于：如果添加所述第一新增边后，所述第一原始社区和所述第二原始社区之间的模块度大于第一预设阈值，将所述第一原始社区和所述第二原始社区合并为一个社区。

在另一种可能的实现方式中，第一新增边包括第一节点和第二节点，该第一节点属于第一原始社区中的原始节点，该第二节点属于新增节点，

该确定模块具体用于：确定与所述第二节点直接关联的节点集合，所述节点集合中包括所述关系网络中的至少一个原始节点；根据所述节点集合中至少一个原始节点所属的原始社区，确定所述第二节点所属的原始社区。

在另一种可能的实现方式中，第一新增边包括第一节点和第二节点，该第一节点和该第二节点均属于新增节点，

该确定模块具体用于：根据所述第一节点和所述第二节点与所述关系网络中的原始节点之间的联系程度确定将所述第一节点和所述第二节点划分到所述关系网络的原始社区中或划分为一个新的社区。

在另一种可能的实现方式中，第一删除边包括第三节点和第四节点，该第三节点和该第四节点均属于第一原始社区中的原始节点，

该确定模块具体用于：如果删除所述第一删除边后，所述第一原始社区的模块度小于第二预设阈值，将所述第一原始社区分裂为两个社区，所述第三节点和所述第四节点分别属于所述两个社区。

在另一种可能的实现方式中，该全量社区结果包括所述关系网络中的边所属的社区或所述关系网络中社区的划分结果。

第二方面和第二方面的任意一个可能的实现方式的有益效果和第一方面以及第一方面的任意一个可能的实现方式的有益效果是对应的，对此，不再赘述。

第三方面，提供了一种服务器，包括：至少一个处理器和存储器，其中该存储器用于存储计算机程序，该至少一个处理器用于从存储器中调用并运行该计算机程序，使得执行上述第一方面或第一方面任意一种可能的实现方式提供的方法。

可选地，在具体实现中，该处理器的个数不做限制。该处理器是通用处理器，可选地，该通用处理器能够通过硬件来实现或通过软件来实现。当通过硬件实现时，该处理器是逻辑电路、集成电路等；当通过软件来实现时，该处理器是一个通用处理器，通过读取存储器中存储的软件代码来实现，该存储器集成在处理器中，位于该处理器之外，独立存在。

第四方面，提供了一种计算机程序产品，该计算机程序产品包括：计算机程序代码，当该计算机程序代码在计算机上运行时，使得计算机执行上述第一方面或第一方面任意一种可能的实现方式中的方法。

第五方面，提供了一种计算机可读存储介质，该计算机可读存储介质存储有计算机程序代码，当该计算机程序代码在计算机上运行时，使得计算机执行上述第一方面或第一方面任意一种可能的实现方式中的方法。这些计算机可读存储包括但不限于如下的一个或者多个：只读存储器(read-only memory，ROM)、可编程ROM(programmable ROM，PROM)、可擦除的PROM(erasable PROM，EPROM)、Flash存储器、电EPROM(electrically EPROM，EEPROM)以及硬盘驱动器(hard drive)。

第六方面，提供一种芯片，该芯片包括处理器与数据接口，其中，处理器通过该数据接口读取存储器上存储的指令，以执行第一方面或第一方面任意一种可能的实现方式中的方法。

在具体实现过程中，该芯片可以以中央处理器(central processing unit，CPU)、微控制器(micro controller unit，MCU)、微处理器(micro processing unit，MPU)、数字信号处理器(digital signal processing，DSP)、片上系统(system on chip，SoC)、专用集成电路(application-specific integrated circuit，ASIC)、现场可编程门阵列(fieldprogrammable gate array，FPGA)或可编辑逻辑器件(programmable logic device，PLD)的形式实现。

附图说明

图1是本申请实施例提供的一种系统框架图。

图2是本申请实施例提供的一种社区挖掘的方法的示意性流程图。

图3是本申请实施例提供的一种关系网络中包含新增边的场景示意图。

图4是本申请实施例提供的一种另一种社区挖掘的方法的示意性流程图。

图5是本申请实施例提供的另一种关系网络中包含新增边的场景示意图。

图6是本申请实施例提供的另一种关系网络中包含新增边的场景示意图。

图7是本申请实施例提供的另一种社区挖掘的方法的示意性流程图。

图8是本申请实施例提供的另一种关系网络中包含新增边的场景示意图。

图9是本申请实施例提供的另一种社区挖掘的方法的示意性流程图。

图10是本申请实施例提供的一种对新旧社区进行融合得到全量社区结果的示意性框图。

图11是本申请实施例提供的一种服务器1100的架构示意图。

图12是本申请实施例提供的一种社区挖掘的装置1200的示意性框图。

具体实施方式

下面将结合附图，对本申请实施例中的技术方案进行描述。

为了便于描述，下面先对本申请实施例中涉及的部分概念进行说明。

社区挖掘(community mining)，用于探索关系网络中成员的密集程度，主要用于社交圈的挖掘及成员的人物画像等场景。同一个社区的节点和节点之间的连接很紧密，而社区与社区之间的连接比较稀疏。若任意两个社区的顶点集合的交集均为空，可以称为非重叠社区(non-overlapping community)，否则称为重叠社区(overlapping community)。

关系网络(relation network)，是指由一些节点和节点之间的边构成的图结构。应理解，网络中的节点表示系统中的个体，节点之间的边表示个体之间的关系。该关系可以是通话关系、路口连接关系等。

标签传播(label propagation)，是指将节点的信息按照其关联关系传播到相邻节点上，用于邻居节点的信息计算。

模块度(modularity)，也可称为模块化度量值，是目前常用的一种衡量网络中社区内包含的多个节点之间的联系程度的一种指标。模块度值的大小主要取决于网络中节点之间的联系紧密程度。其值越接近1，表示网络划分出的社区内包含的多个节点之间的联系程度越紧密，也就是该社区中包含的多个节点之间的关联程度较紧密。

社区挖掘技术是关系网络数据一个重要的研究方向，良好的社区挖掘结果可以有效提高线下推广、广告投放的成功率。社区挖掘的应用场景有多种，本申请不做具体限定，下面对几种可能的应用场景进行说明。

1、电商平台，采用社区发现算法构建产品关联库，对用户实现精准营销，用于搜索推荐产品以及广告投放中。

2、警务平台，结合多种社会网络数据对恐怖主义、犯罪活动进行社区分析，可以快速锁定犯罪团伙。

3、交通平台，通过对交通网络数据的分析，实现路线规划等应用。

在日益膨胀的数字时代，对大规模数据的分析需要有近乎实时的性能要求，同时，不断增大的数字规模还对资源提出了更高的挑战。一种相关的技术方案中，在网络中有新增关系数据时，需要进行全量数据的分析，其效率较低，占用的资源较多，时效较长，不适用于对实时性要求较高的场景，例如，警务平台、交通平台等。另一种相关的技术方案中。在网络中有新增关系数据时，支持在局部网络中对目标节点进行增量计算，可以节省资源，效率较高，但是仅考虑对目标节点进行局部网络的计算，丢失了全局信息，无法得到精确结果，影响推送准确度。

本申请实施例提供了一种社区挖掘的方法，可以对大数据的关系网络进行社区分析，在节省资源和时间开销的同时，还可得到精确的结果，提高推送的精确度。

在介绍本申请实施例提供的社区挖掘的方法之前，先对适用于本申请的系统架构进行详细描述。

图1是本申请实施例提供的一种系统框架图。如图1所示，该系统中可以包括存储平台110、分析平台120、应用平台130，下面分别进行详细说明。

存储平台110，可以包括多个数据库，例如，新增关系网络数据库111、原始社区数据库112、全量社区数据库113。其中，新增关系网络数据库111中用于存储新增边或删除边的节点信息。原始社区数据库112中存储有原始的社区结果，包括原始的社区划分结果，以及关系网络中的边所属的原始社区。全量社区数据库113中存储有全量社区结果，该全量社区结果是根据原始的社区结果和第一社区结果融合后得到的，该第一社区结果是根据新增关系网络数据库111中存储的新增边或删除边的节点信息对所述边或删除边进行局部社区的划分确定的。

分析平台120，包括动态点边分析模块121、结果融合模块122。其中，动态点边分析模块121用于从新增关系网络数据库111中获取新增边或删除边的节点信息，并根据该新增边或删除边的节点信息确定第一社区结果。结果融合模块122用于获取原始社区数据库112中存储的原始的社区结果，并对该原始的社区结果以及由动态点边分析模块121确定的第一社区结果进行融合，得到全量社区结果。应理解，该全量社区结果包括社区的划分情况，以及每个节点的标签信息。

分析平台120，还用于将得到的全量社区结果推送给应用平台130。

应用平台130，用于接收分析平台120推送的全量社区结果，并根据该全量社区结果进行数据分析、线下推广、广告投放等。应用平台130中可以根据不同的应用场景可以包括不同的应用平台。例如，应用平台130中包括电商平台131、警务平台132、交通平台133等。

下面结合图2，对本申请实施例提供的一种社区挖掘的方法进行详细描述。

图2是本申请实施例提供的一种社区挖掘的方法的示意性流程图。如图2所示，该方法可以包括步骤210-230，下面分别对步骤210-230进行详细描述。

步骤210：获取关系网络中新增边或删除边的节点信息。

本申请实施例中，动态点边分析模块121可以获取关系网络中新增边或删除边的节点信息，该新增边或删除边的节点信息存储在上述新增关系网络数据库111中。

应理解，边的顶点可以称为节点，该节点可以作为关系网络中的个体，节点之间的边表示个体之间的关系。

步骤220：根据所述新增边或删除边的节点信息对所述新增边或删除边进行局部社区的划分，得到关系网络中的第一社区结果。

本申请实施例中，动态点边分析模块121可以在获取到新增边或删除边的节点信息后，进行局部社区的划分。

一种可能的实现方式中，对于关系网络中的新增边，可以根据该新增边和现有社区的节点之间的连接强度，进行局部社区的划分。例如，如果新增边的节点中有一个节点是新增的节点，那么可以根据该新增边和现有社区的节点之间的连接强度，对该新增边所属的社区进行划分。又如，如果新增边的节点中有两个节点是新增的节点，那么可以根据该新增边和现有社区的节点之间的连接强度，对该新增边所属的社区进行划分，或者将所述新增边划分为一个新的社区。又如，如果新增边的节点没有新增的节点，那么可以根据该新增边和现有社区的节点之间的连接强度，对现有的社区进行合并。

另一种可能的实现方式中，对于关系网络中的删除边，可以根据该删除边和其所属的社区的节点之间的模块度，确定是否对该删除边所述的社区进行分裂。

步骤230：根据所述第一社区结果对所述关系网络中的原始社区结果进行更新，得到全量社区结果。

本申请实施例中，结果融合模块122可以获取原始社区数据库112中存储有原始的社区结果，并根据动态点边分析模块121确定的第一社区结果对该原始的社区结果进行更新，得到全量社区结果。

具体的，一种可能的实现方式中，结果融合模块122可以从原始社区数据库112中获取到原始的社区划分情况，并根据第一社区结果对该原始有的社区划分进行合并或分裂。另一种可能的实现方式中，结果融合模块122可以从原始社区数据库112中获取到原始的边所属的社区，并根据第一社区结果对该原始的边所属的社区进行更新。

结果融合模块122还可以将全量社区结果保存在全量社区数据库113中。

下面结合图3-图9中不同的场景，对步骤220中动态点边分析模块121的具体实施方式进行详细描述。应注意，图3-图9的例子仅仅是为了帮助本领域技术人员理解本申请实施例，而非要将申请实施例限制于所示例的具体数值或具体场景。本领域技术人员根据文所给出的图3-图9的例子，显然可以进行各种等价的修改或变化，这样的修改和变化也落入本申请实施例的范围内。

图3是本申请实施例提供的一种关系网络中包含新增边的场景示意图。如图3所示，(1)是在现有的关系网络中新增边的示意图，其中，节点A、节点B、节点C、节点D、节点E、节点F属于原始节点，“—”表示原始边。节点G、节点H、节点I、节点J属于新增节点，“---”表示新增边。

在原始节点中，节点A、节点B、节点C属于社区1，节点D、节点E、节点F属于社区2。

下面结合图4，以图3中的(1)为例，对3中的(1)中新增边所属的社区进行划分的实现方式进行详细描述。

图4是本申请实施例提供的一种另一种社区挖掘的方法的示意性流程图。如图4所示，该方法可以包括步骤410-460，下面分别对步骤410-460进行详细描述。

步骤410：动态点边分析模块121确定新增边的两个节点中仅包含一个新增节点的新增边集合。

以图3中的(1)为例，新增边中仅包含一个新增节点的边包括：新增边1、新增边2、新增边3、新增边4、新增边5、新增边6、新增边7。其中，新增边1对应的新增节点为节点G，新增边2、新增边3、新增边4、新增边5对应的新增节点均为节点H，新增边6、新增边7对应的新增节点均为节点J。

因此，新增边集合中可以包括：新增边1、新增边2、新增边3、新增边4、新增边5、新增边6、新增边7。

步骤420：对于每一个新增节点，动态点边分析模块121分别确定多个原始节点中与该新增节点直接关联的节点集合U。

以图3所示的节点H为例。在多个原始节点中，与节点H直接关联的原始节点集合U包括：节点A、节点B、节点C、节点E。

步骤430：动态点边分析模块121计算原始节点集合U中的节点属于每类标签分值S1。

本申请实施例中，标签可以对应于上文中的社区，每类标签可以理解为每一个原始社区。对于每一个节点集合U而言，动态点边分析模块121可以确定原始节点集合U中的多个节点属于每一个原始社区的概率。

具体的，以节点H为例。与节点H直接关联的原始节点集合U包括：节点A、节点B、节点C、节点E，动态点边分析模块121可以确定原始节点集合U中属于社区1的概率为3/4，属于社区2的概率为1/4。也就是说，与节点H直接关联的原始节点集合U中的节点在社区1的标签分值S1为3/4，在社区2的标签分值S1为1/4。

步骤440：动态点边分析模块121计算原始节点集合U中的相邻节点之间的连接强度，得到每类标签分值S2。

具体的，以节点H为例。与节点H直接关联的原始节点集合U包括：节点A、节点B、节点C、节点E，动态点边分析模块121确定原始节点集合U中的节点A、节点B、节点C在社区1中的连接强度为

节点E在社区2中的连接强度为1。因此，与节点H直接关联的原始节点集合U中的节点在社区1的标签分值S2为

在社区2的标签分值S2为1。

应理解，本申请实施例中，步骤430和步骤440之间可以仅执行一个，或者也可以同时执行两个步骤。例如，可以仅执行步骤430，又如，可以仅执行步骤440，又如，还可以同时执行步骤430和步骤440。

值得说明的是，如果同时执行步骤430和步骤440，步骤430和步骤440之间并无先后顺序关系，可以先执行步骤430，再执行步骤440；也可以先执行步骤440，再执行步骤430；或者，同时执行步骤430和步骤440，本申请对此不做限制。

步骤450：动态点边分析模块121计算每类标签分值S。

动态点边分析模块121可以根据每类标签分值S1和/或每类标签分值S2计算出一个每类标签分值S。具体的，以动态点边分析模块121同时执行步骤430和步骤440为例，也就是说，动态点边分析模块121通过上述步骤确定出每类标签分值S1和每类标签分值S2。一种可能的实现方式中，动态点边分析模块121可以根据每类标签分值S1和每类标签分值S2的加权平均值确定每类标签分值S。

步骤460：动态点边分析模块121根据每类标签分值S和预设阈值确定新增节点所属的社区。

对于给定的预设阈值，动态点边分析模块121可以结合每类标签分值S，确定大于预设阈值的标签分值S，并确定新增节点所属的社区为所述标签分值S对应的标签(社区)。

需要说明的是，一个新增节点可以属于一个社区，或者也可以属于多个社区，本申请不做具体限定。主要是取决于预设阈值的设定，只要大于预设阈值的标签分值S对应的标签(社区)都是该新增节点所属的社区。

本申请实施例中，可以通过上述图4所示的方法流程，对图3的(1)中新增边所属的社区进行划分。具体的请参见图3的(2)，其中，节点H属于社区1，节点G属于社区1，节点J属于社区2，因此，可以将节点H和节点G划分到社区1中，将节点J划分到社区2中。

本申请实施例中，对于新增边的两个节点而言，如果其中一个节点为原始节点，另一个节点为新增节点，可以通过上述图4所示的方法对新增边所属的社区进行划分。下面结合图5，对该新增边的两个节点均为新增节点的场景进行详细描述。

图5是本申请实施例提供的另一种关系网络中包含新增边的场景示意图。如图5所示，(1)是在图3的(1)中新增边的示意图，其中，节点K、节点L、节点M、节点N属于新增节点。

如图5的(1)所示，可以利用标签传播算法将新增边中与新增节点直接关联的节点信息进行传播，从而确定该新增节点所属的社区。

以新增节点I为例，与新增节点I直接关联的节点包括：节点H、节点G、节点J。其中，通过上述图4所示的方法流程确定的节点H、节点G属于社区1，节点J属于社区2。一种可能的实现方式中，动态点边分析模块121可以根据与新增节点I直接关联的节点属于社区1的概率为2/3，属于社区2的概率为1/3。因此，如图5的(2)所示，可以将节点I划分到社区1中。

以新增节点包括节点K、节点L、节点M、节点N为例。新增节点中仅有节点K与原始节点有直接关联，并且与节点K直接关联的原始节点仅为节点J。因此，如图5的(3)所示，由于节点K、节点L、节点M、节点N均和原始社区中的原始节点关联程度不是很紧密，可以将节点K、节点L、节点M、节点N划分为一个新的社区3。具体的，可以利用原始边分析模块将节点K、节点L、节点M、节点N划分为一个新的社区3。

下面结合图6，对新增边中不包括新增节点的场景进行详细描述。

图6是本申请实施例提供的另一种关系网络中包含新增边的场景示意图。在图6的(1)所示的关系网络中包括社区1和社区2，其中，社区1中包括节点A、节点B、节点C，社区2中包括节点D、节点E、节点F。节点A、节点B、节点C、节点D、节点E、节点F属于原始节点。“—”表示原始边，“---”表示新增边。

在图6的(1)所示的关系网络中，新增的一条边的两个节点均属于原始节点。也就是说，在关系网络中新增边但没有新增节点，该新增边的节点均在原始的不同社区网络中。本申请实施例中，如果新增边对该新增边的两个原始节点所属的社区起到紧密加强的作用，可以将该两个原始节点分别所在的两个社区进行合并。下面结合图7，对上述过程的具体方式进行详细描述。

图7是本申请实施例提供的另一种社区挖掘的方法的示意性流程图。如图7所示，该方法可以包括步骤710-730，下面分别对步骤710-730进行详细描述。

步骤710：动态点边分析模块121确定新增边中两个节点都是原始节点的边集合。

在图6的(1)中，为了便于描述，该场景中以包括一条新增边为例进行说明的。该新增边的两个原始节点分别为节点C和节点E。

步骤720：动态点边分析模块121确定该新增边的模块度。

本申请实施例中，动态点边分析模块121可以根据新增边的两个原始节点在关系网络中的邻域信息，确定新增边在原始关系网络中所起的紧密加强作用，也就是确定新增边的模块度。如果模块度越接近1，表示新增边在原始关系网络中所起的作用越强，关系网络的强度越强，可以将两个原始节点分别所在的两个社区进行合并。

具体的，动态点边分析模块121可以确定新增边后，该新增边的两个原始节点在原始关系网络中的邻域信息。并根据相似性度量函数，计算新增边给每类标签(社区)所带来的紧密程度，得到每类标签分值。基于给定的预设阈值以及上述确定的每类标签分值确定需要合并的标签集合。

应理解，该邻域信息可以是该原始节点与和其直接关联的节点之间的关联程度或紧密程度。

步骤730：动态点边分析模块121确定合并标签集合。

在图6的(1)中，根据上述方法确定的需要合并的标签集合为社区1和社区2。也就是说，动态点边分析模块121确定新增边在原始关系网络中所起的紧密加强作用较强，使得原始社区1和原始社区2之间的强度越强，可以将原始社区1和原始社区2之间进行合并为一个社区。

例如，参见图6的(2)中，可以将原始社区1和原始社区2合并为社区1。具体的，可以通过输入合并模块将原始社区1和原始社区2合并为一个社区。

下面结合图8，对删除边的场景进行详细描述。

图8是本申请实施例提供的另一种关系网络中包含新增边的场景示意图。在图8的(1)所示的关系网络中包括社区，该社区1中的原始节点包括：节点A、节点B、节点C、节点D、节点E、节点F、节点G、节点H。“—”表示原始边，“---”表示待删除边。

在图8的(1)所示的关系网络中，待删除的一条边的两个节点均属于一个原始社区中的原始节点。本申请实施例中，如果待删除边对该待删除边的两个原始节点所在的社区起到联系削弱的作用，可以将该两个原始节点分别所在的社区进行分裂。下面结合图9，对上述过程的具体方式进行详细描述。

图9是本申请实施例提供的另一种社区挖掘的方法的示意性流程图。如图9所示，该方法可以包括步骤910-930，下面分别对步骤910-930进行详细描述。

步骤910：动态点边分析模块121确定待删除边的两个节点所属的社区。

步骤920：动态点边分析模块121确定该待删除边的模块度。

本申请实施例中，动态点边分析模块121可以遍历原始社区中的每一条待删除边，并计算待删除边在删除后，该待删除边的两个节点的在关系网络中的邻域信息，从而确定待删除边在原始关系网络中所起的削弱作用。如果模块度越接近0，表示待删除边在原始关系网络中所起的作用越弱，关系网络的强度越弱，可以将两个原始节点所在的一个社区分裂成两个社区。

具体的，动态点边分析模块121可以确定待删除边后，该待删除边的两个原始节点在原始关系网络中的邻域信息。并根据相似性度量函数，计算待删除边给每类标签(社区)所带来的紧密程度，得到每类标签分值。基于给定的预设阈值以及上述确定的每类标签分值确定需要合并的标签集合。

步骤930：动态点边分析模块121确定分裂的标签集合。

在图8的(1)中，根据上述方法确定待删除边的两个节点所属的新的标签值。例如，节点A、节点C、节点G属于社区1，节点D、节点E属于社区2。也就是说，动态点边分析模块121确定待删除边在原始关系网络中所起的紧密加强作用较弱，使得原始社区1中的部分节点之间的连接强度较弱，可以将原始社区1分裂成两个社区。

例如，参见图8的(2)中，可以将原始社区1分裂成两个社区，其中，社区1中包括节点A、节点B、节点C、节点G、节点H，社区2中包括节点D、节点E、节点F。

下面结合图10，对步骤230中动态点边分析模块121根据所述第一社区结果对所述关系网络中原始的社区结果进行更新的具体实现过程进行详细说明。

应理解，对原始的社区结果进行更新得到的全量社区结果可以是以社区为粒度的，或者还可以是以社区中的边为粒度，本申请不做限定。

图10的(1)是从原始社区数据库112中获取到原始的社区划分情况，其中，包括原始社区1、原始社区2、原始社区3、原始社区5、原始社区6、原始社区7、原始社区8、原始社区9。

图10的(2)是根据第一社区结果对该原始有的社区划分进行合并的一种情况，例如，可以将原始社区1、原始社区2、原始社区3合并为社区1，将原始社区5、原始社区7合并为社区5，将原始社区6、原始社区8、原始社区9合并为社区6。

需要说明的是，图10是以构建图模型的方式呈现根据新旧社区进行融合得到全量社区结果。本申请实施例中还可以以映射数据表的形式来表示。具体的，请参见表1。

表1社区映射数据表

原始社区	新社区
		1	1
2	1
		3	1
6	6
		8	6
9	6
		5	5
7	5

下面以图6所示的场景为例，结合表2-表3，对以边为粒度的全量社区结果进行描述。

表2原始边标签信息表

边	所属的社区
		(A，B)	1
(A，C)	1
		(B，C)	1
(D，E)	2
		(D，F)	2
(E，F)	2

表3重新映射后的边标签信息表

边	所属的社区
		(A，B)	1
(A，C)	1
		(B，C)	1
(D，E)	1
		(D，F)	1
(E，F)	1

应理解，表2和表3中的(A，B)标识节点A和节点B相连的边。

应理解，在本申请的各种实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

下面将结合图11-图12，详细描述本申请装置的实施例。应理解，方法实施例的描述与装置实施例的描述相互对应，因此，未详细描述的部分可以参见前面方法实施例。

应理解，本申请实施例提供的上述社区挖掘的方法可以应用于服务器。应理解，该服务器可以是网络侧为用户提供服务的服务设备，其可能是多台服务器组成的服务器集群，也可能是单台服务器，本申请不做具体限定。

服务器也可以被称为计算机系统或计算机设备，包括硬件层、运行在硬件层之上的操作系统层，以及运行在操作系统层上的应用层。该硬件层包括处理单元、内存和内存控制单元等硬件，随后对该硬件的功能和结构进行详细说明。该操作系统是任意一种或多种通过进程(process)实现业务处理的计算机操作系统，例如，Linux操作系统、Unix操作系统、Android操作系统、iOS操作系统或windows操作系统等。该应用层包含浏览器、通讯录、文字处理软件、即时通信软件等应用程序。

本申请实施例提供社区挖掘的方法的执行主体可以是服务器，或者，是服务器中能够调用程序并执行程序的功能模块。

图11是本申请实施例提供的一种服务器1100的架构示意图。图11所示的服务器1100包括：至少一个处理器1110和内存1120。

可选地，服务器1100还包括系统总线，其中，处理器1110和内存1120分别与系统总线连接。处理器1110能够通过系统总线访问内存1120，例如，处理器1110能够通过系统总线在内存1120中进行数据读写或代码执行。该系统总线是快捷外设部件互连标准(peripheral component interconnect express，PCI)总线或扩展工业标准结构(extended industry standard architecture，EISA)总线等。所述系统总线分为地址总线、数据总线、控制总线等。为便于表示，图11中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

其中，处理器1110的功能主要是解释计算机程序的指令(或者说，代码)以及处理计算机软件中的数据。其中，该计算机程序的指令以及计算机软件中的数据能够保存在内存1120或者缓存单元1116中。

在本申请实施例中，处理器1110可能是集成电路芯片，具有信号的处理能力。作为示例而非限定，处理器1110是通用处理器、数字信号处理器(digital signal processor，DSP)、专用集成电路(application specific integrated circuit，ASIC)、现成可编程门阵列(field programmable gate array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。其中，通用处理器是微处理器等。例如，该处理器1110是中央处理单元(central processing unit，CPU)。

其中，每个处理器1110包括至少一个处理单元1112和内存控制单元1114。

可选地，处理单元1112也称为核心(core)或内核，是处理器最重要的组成部分。处理单元1112是由单晶硅以一定的生产工艺制造出来的，处理器所有的计算、接受命令、存储命令、处理数据都由核心执行。处理单元分别独立地运行程序指令，利用并行计算的能力加快程序的运行速度。各种处理单元都具有固定的逻辑结构，例如，处理单元包括例如，一级缓存、二级缓存、执行单元、指令级单元和总线接口等逻辑单元。

内存控制单元1114用于控制内存1120与处理单元1112之间的数据交互。具体地说，内存控制单元1114从处理单元1112接收内存访问请求，并基于该内存访问请求控制针对内存的访问。作为示例而非限定，在本申请实施例中，内存控制单元是内存管理单元(memory management unit，MMU)等器件。

在本申请实施例，各内存控制单元1114通过系统总线进行针对内存1120的寻址。并且在系统总线中配置仲裁器(未图示)，该仲裁器负责处理和协调多个处理单元1112的竞争访问。

在本申请实施例中，处理单元1112和内存控制单元1114通过芯片内部的连接线，例如地址线，通信连接，从而实现处理单元1112和内存控制单元1114之间的通信。

可选地，每个处理器1110还包括缓存单元1116，其中，缓存是数据交换的缓冲区(称作cache)。当处理单元1112要读取数据时，会首先从缓存中查找需要的数据，如果找到了则直接执行，找不到的话则从内存中找。由于缓存的运行速度比内存快得多，故缓存的作用就是帮助处理单元1112更快地运行。

内存(memory)1120能够为服务器1100中的进程提供运行空间，例如，内存1120中保存用于生成进程的计算机程序(具体地说，是程序的代码)。计算机程序被处理器运行而生成进程后，处理器在内存1120中为该进程分配对应的存储空间。进一步的，上述存储空间进一步包括文本段、初始化数据段、位初始化数据段、栈段、堆段等等。内存1120在上述进程对应的存储空间中保存进程运行期间产生的数据，例如，中间数据，或过程数据等等。

可选地，内存也称为内存储器，其作用是用于暂时存放处理器1110中的运算数据，以及与硬盘等外部存储器交换的数据。只要服务器在运行中，处理器1110就会把需要运算的数据调到内存中进行运算，当运算完成后处理单元1112再将结果传送出来。

作为示例而非限定，在本申请实施例中，内存1120是易失性存储器或非易失性存储器，或可包括易失性和非易失性存储器两者。其中，非易失性存储器是只读存储器(read-only memory，ROM)、可编程只读存储器(programmable ROM，PROM)、可擦除可编程只读存储器(erasable PROM，EPROM)、电可擦除可编程只读存储器(electrically EPROM，EEPROM)或闪存。易失性存储器是随机存取存储器(random access memory，RAM)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用，例如静态随机存取存储器(staticRAM，SRAM)、动态随机存取存储器(dynamic RAM，DRAM)、同步动态随机存取存储器(synchronous DRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(double data rateSDRAM，DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(synchlink DRAM，SLDRAM)和直接内存总线随机存取存储器(directrambus RAM，DR RAM)。应注意，本文描述的系统和方法的内存1120旨在包括但不限于这些和任意其它适合类型的存储器。

应理解，以上列举的服务器1100的结构仅为示例性说明，本申请并未限定于此，本申请实施例的服务器1100包括现有技术中服务器中的各种硬件，例如，服务器1100还包括除内存1120以外的其他存储器，例如，磁盘存储器等。

图12是本申请实施例提供的一种社区挖掘的装置1200的示意性框图。该社区挖掘的装置1200可以通过软件、硬件或者两者的结合实现成为装置中的部分或者全部。应理解，社区挖掘的装置1200作为服务器1100中的功能模块，用于执行上述服务器1100执行的方法流程。

该社区挖掘的装置1200包括：获取模块1210、确定模块1220、更新模块1230，其中：

获取模块1210，用于获取关系网络中新增边或删除边的节点信息；

确定模块1220，用于根据所述新增边或删除边的节点信息对所述新增边或删除边进行局部社区的划分，得到关系网络中的第一社区结果；

更新模块1230，用于根据所述第一社区结果对所述关系网络中的原始社区结果进行更新，得到全量社区结果。

可选地，第一新增边包括第一节点和第二节点，该第一节点为第一原始社区中的原始节点，该第二节点属于第二原始社区中的原始节点，该确定模块1220具体用于：所述第一原始社区和所述第二原始社区之间的模块度大于第一预设阈值，将所述第一原始社区和所述第二原始社区合并为一个社区。

可选地，所述模块度为所述第一原始社区包含的原始节点和所述第二原始社区中的原始节点之间的联系程度。

可选地，第一新增边包括第一节点和第二节点，该第一节点属于第一原始社区中的原始节点，该第二节点属于新增节点，该确定模块1220具体用于：确定与所述第二节点直接关联的节点集合，所述节点集合中包括所述关系网络中的至少一个原始节点；根据所述节点集合中至少一个原始节点所属的原始社区，确定所述第二节点所属的原始社区。

可选地，第一新增边包括第一节点和第二节点，该第一节点和该第二节点均属于新增节点，该确定模块1220具体用于：根据所述第一节点和所述第二节点与所述关系网络中的原始节点之间的联系程度确定将所述第一节点和所述第二节点划分到所述关系网络的原始社区中或划分为一个新的社区。

可选地，第一删除边包括第三节点和第四节点，该第三节点和该第四节点均属于第一原始社区中的原始节点，该确定模块1220具体用于：如果删除所述第一删除边后，所述第一原始社区的模块度小于第二预设阈值，将所述第一原始社区分裂为两个社区，所述第三节点和所述第四节点分别属于所述两个社区。

可选地，该全量社区结果包括所述关系网络中的边所属的社区或所述关系网络中社区的划分结果。

本实施例中，还提供了一种计算机可读存储介质，计算机可读存储介质存储有指令，当计算机可读存储介质中的指令在计算设备上被执行时，使得计算设备执行上述所提供的方法。

本实施例中，还提供了一种包含指令的计算机程序产品，当其在计算设备上运行时，使得计算设备执行上述所提供的方法。

本实施例中，还提供了一种芯片，该芯片包括处理器与数据接口，其中，处理器通过所述数据接口读取存储器上存储的指令，以执行第一方面或第一方面任意一种可能的实现方式中的方法。

上述实施例，全部或部分地通过软件、硬件、固件或其他任意组合来实现。当使用软件实现时，上述实施例全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令或计算机程序。在计算机上加载或执行所述计算机指令或计算机程序时，全部或部分地产生按照本申请实施例所述的流程或功能。

可选地，所述计算机为通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令能够存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令从一个网站站点、计算机、服务器或数据中心通过有线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。

所述计算机可读存储介质是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集合的服务器、数据中心等数据存储设备。所述可用介质是磁性介质(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质。半导体介质是固态硬盘。

应理解，本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示存在三种关系，例如，A和/或B，表示：单独存在A，同时存在A和B，单独存在B这三种情况，其中A，B是单数或者复数。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系，但也可能表示的是一种“和/或”的关系，具体可参考前后文进行理解。

本申请中，“至少一个”是指一个或者多个，“多个”是指两个或两个以上。“以下至少一项(个)”或其类似表达，是指的这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如，a，b，或c中的至少一项(个)，表示：a，b，c，a-b，a-c，b-c，或a-b-c，其中a，b，c是单个或者多个。

本领域普通技术人员能够意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员能够对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

所属领域的技术人员能够清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，请参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，能够通过其它的方式实现。

例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时能够有另外的划分方式，例如多个单元或组件结合或者集成到另一个系统，或一些特征能够被忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接是通过一些接口，装置或单元的间接耦合或通信连接，是电性，机械或其它的形式。

可选地，所述作为分离部件说明的单元是物理上分开的，或者不是物理上分开的，作为单元显示的部件是物理上分开的，或者不是物理单元，即位于一个地方，或者也分布到多个网络单元上。根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元能够集成在一个处理单元中，可选地，是各个单元单独物理存在，或者两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，能够存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分能够以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(read-only memory，ROM)、随机存取存储器(random access memory，RAM)、磁碟或者光盘等各种能够存储程序代码的介质。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种社区挖掘的方法，其特征在于，所述方法包括：

获取关系网络中新增边或删除边的节点信息；

根据所述新增边或删除边的节点信息对所述新增边或删除边进行局部社区的划分，得到关系网络中的第一社区结果；

根据所述第一社区结果对所述关系网络中的原始社区结果进行更新，得到全量社区结果。

2.根据权利要求1所述的方法，其特征在于，第一新增边包括第一节点和第二节点，所述第一节点属于第一原始社区中的原始节点，所述第二节点属于第二原始社区中的原始节点，

所述根据所述新增边或删除边的节点信息对所述新增边或删除边进行局部社区的划分，得到关系网络中的第一社区结果，包括：

如果添加所述第一新增边后，所述第一原始社区和所述第二原始社区之间的模块度大于第一预设阈值，将所述第一原始社区和所述第二原始社区合并为一个社区。

3.根据权利要求2所述的方法，其特征在于，所述模块度为所述第一原始社区包含的原始节点和所述第二原始社区中的原始节点之间的联系程度。

4.根据权利要求1所述的方法，其特征在于，第一新增边包括第一节点和第二节点，所述第一节点属于第一原始社区中的原始节点，所述第二节点属于新增节点，

确定与所述第二节点直接关联的节点集合，所述节点集合中包括所述关系网络中的至少一个原始节点；

根据所述节点集合中至少一个原始节点所属的原始社区，确定所述第二节点所属的原始社区。

5.根据权利要求1所述的方法，其特征在于，第一新增边包括第一节点和第二节点，所述第一节点和所述第二节点均属于新增节点，

根据所述第一节点和所述第二节点与所述关系网络中的原始节点之间的联系程度确定将所述第一节点和所述第二节点划分到所述关系网络的原始社区中或划分为一个新的社区。

6.根据权利要求1所述的方法，其特征在于，第一删除边包括第三节点和第四节点，所述第三节点和所述第四节点均属于第一原始社区中的原始节点，

如果删除所述第一删除边后，所述第一原始社区的模块度小于第二预设阈值，将所述第一原始社区分裂为两个社区，所述第三节点和所述第四节点分别属于所述两个社区。

7.根据权利要求1至6中任一项所述的方法，其特征在于，所述全量社区结果包括所述关系网络中的边所属的社区或所述关系网络中社区的划分结果。

8.一种社区挖掘的装置，其特征在于，包括：

9.根据权利要求8所述的装置，其特征在于，第一新增边包括第一节点和第二节点，所述第一节点属于第一原始社区中的原始节点，所述第二节点属于第二原始社区中的原始节点，

所述确定模块具体用于：

10.根据权利要求9所述的装置，其特征在于，所述模块度为所述第一原始社区包含的原始节点和所述第二原始社区中的原始节点之间的联系程度。

11.根据权利要求8所述的装置，其特征在于，第一新增边包括第一节点和第二节点，所述第一节点属于第一原始社区中的原始节点，所述第二节点属于新增节点，

所述确定模块具体用于：

12.根据权利要求8所述的装置，其特征在于，第一新增边包括第一节点和第二节点，所述第一节点和所述第二节点均属于新增节点，

所述确定模块具体用于：

13.根据权利要求8所述的装置，其特征在于，第一删除边包括第三节点和第四节点，所述第三节点和所述第四节点均属于第一原始社区中的原始节点，

所述确定模块具体用于：

14.根据权利要求8至13中任一项所述的装置，其特征在于，所述全量社区结果包括所述关系网络中的边所属的社区或所述关系网络中社区的划分结果。

15.一种服务器，其特征在于，包括：处理器和存储器，所述存储器用于存储程序，所述处理器用于从存储器中调用并运行所述程序以执行权利要求1至7中任一项所述的方法。

16.一种计算机可读存储介质，其特征在于，包括计算机程序，当所述计算机程序在计算机上运行时，使得所述计算机执行权利要求1至7中任一项所述的方法。