CN109712010A - 发现社团的方法和装置、计算设备、可读存储介质 - Google Patents
发现社团的方法和装置、计算设备、可读存储介质 Download PDFInfo
- Publication number
- CN109712010A CN109712010A CN201711000864.3A CN201711000864A CN109712010A CN 109712010 A CN109712010 A CN 109712010A CN 201711000864 A CN201711000864 A CN 201711000864A CN 109712010 A CN109712010 A CN 109712010A
- Authority
- CN
- China
- Prior art keywords
- edges
- relationship
- nodes
- dense structure
- cluster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000013507 mapping Methods 0.000 claims abstract description 55
- 238000004891 communication Methods 0.000 claims description 21
- 230000015654 memory Effects 0.000 claims description 19
- 238000000605 extraction Methods 0.000 claims 1
- 239000000284 extract Substances 0.000 abstract description 5
- 238000013461 design Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 10
- 238000012546 transfer Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000004900 laundering Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000004308 accommodation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供一种发现社团的方法和装置、计算设备、可读存储介质。在该方法中,计算设备获取对象关系网。该对象关系网包括多个节点和多条边,边用于连接节点,节点表示一个对象,边表示其连接的两个对象的关系。该计算设备根据稠密结构从该对象关系网中提取多个对象团,该稠密结构为多边形或者不同多边形的组合。该计算设备根据映射关系将该多个对象团映射为多个关系团,在该映射关系中该对象团包括的稠密结构的边对应该对象团映射的关系团中的节点。该计算设备从每个关系团中确定至少一个联通区域。该计算设备根据该映射关系将该联通区域在该对象关系网中映射为社团。该社团为该对象关系网中关系稳定并且关系紧密度强的对象团体。
Description
技术领域
本申请涉及计算领域,尤其涉及一种发现社团的方法和装置、计算设备、可读存储介质。
背景技术
人类社会活动会产生各式各样的关系,如果将人作为对象,将人与人之间发生的行为作为关系;这些关系和对象便形成了各种各样的对象关系网。比如,用户、用户之间在同一论坛的评论构成了一个对象关系网;再比如,用户、用户之间互相通信(打电话、发短信等)构成一个对象关系网。
在这些对象关系网中,具有共同特征的对象之间联系会相对紧密(对象之间直接或者间接发生的关系更多);比如,同一个班级的同学之间互相在同一论坛评论或者互相通信会更为频繁。
在任一个对象关系网中,具有共同特征的对象组成社团,因此,该对象关系网具有多个具有不同共同特征的社团。社团内对象之间的关系较社团间对象的关系更紧密。以论坛评论的对象关系网为例,每个班级的同学划分为一个社团,不同班级的同学被划分至不同社团,同一个班级的同学之间的评论比不同班级的同学之间的评论更多。
现有技术提供了一些社团发现算法,例如基于密度的算法、基于距离的算法、基于模块度的算法、启发式算法、基于标签传播原理的算法、并行算法等。这些算法对社团大小有要求,或者对样本数据的量有有要求。
发明内容
有鉴于此,本申请提供了一种发现社团的方法和装置、计算设备、可读存储介质,相对于现有技术的社团发现算法,可以更高效发现社团。
第一方面,本申请提供一种发现社团的方法。
在该方法中,计算设备获取对象关系网。该对象关系网包括多个节点和多条边,其中,边用于连接节点,并且,每个节点至少连接一条边。节点表示一个对象,边表示所述边连接的两个对象的关系。
该计算设备根据稠密结构从所述对象关系网中提取多个对象团,所述稠密结构为多边形或者不同多边形的组合。在每个对象团中包括至少一个稠密结构,对象团中每个稠密结构与其它的某个稠密结构通过节点或者边连接;因此,所述对象团中任意一个节点经过一条边或多条边到达其它节点。
计算设备使用稠密结构在对象关系网中提取对象团时,会筛除掉不能组成稠密结构、并且不用于连接两个稠密结构的边和节点。这样,对象团中的关系紧密度较强,大于对象关系网体现的关系紧密度。
该计算设备根据映射关系将所述多个对象团映射为多个关系团,在所述映射关系中所述对象团包括的稠密结构的边对应所述对象团映射的关系团中的节点。
由于在将对象团映射为关系团时,仅将稠密结构做映射;对于对象团中不属于稠密结构的边,则不映射为该关系团中的节点;即,筛除掉该对象团中不属于稠密结构的边。因此,关系团体现的关系紧密度大于或等于对象团体现的关系紧密度。
该计算设备从所述多个关系团的每个关系团中确定至少一个联通区域。联通区域中的任一节点可以通过一条边或多条边到达该联通区域中的其它节点。
该计算设备根据所述映射关系将所述联通区域在所述对象关系网中映射为社团。
联通区域在对象关系网中对应的社团,该社团体现的关系紧密度大于或等于关系团体现的关系紧密度。该社团为该对象关系网中关系稳定并且关系紧密度强的对象团体。
一种可能设计,所述稠密结构为三角形或者三角形与多边形的组合。
三角形作作为稠密结构,三角形体现的关系紧密度相对于其它多边形体现的关系紧密度更为紧密和稳定。
一种可能设计,所述对象关系网中的边是无向的,所述稠密结构中的边是无向的。
对于无向的对象关系网,使用无向的稠密结构来提取对象团。
一种可能设计,所述对象关系网中的边是有向的,所述稠密结构中的边是有向的。
对于有向的对象关系网,使用有向的稠密结构来提取对象团。
一种可能设计,计算设备在从所述对象关系网中提取多个对象团时,首先在所述对象关系网中匹配所述稠密结构;然后,将所述对象关系网中连接的多个所述稠密结构作为一个所述对象团,将所述对象关系网中未连接的两个所述稠密结构划入不同的所述对象团;如果一个稠密结构未与其它稠密结构连接,该个稠密结构作为单独一个对象图。
一种可能设计,计算设备在所述多个对象团映射为多个关系团时,如果所述对象团中的两条边属于同一个稠密结构,则将所述两条边映射为所述对象团对应的关系团中的两个节点,并在所述对象团对应的关系团中将所述两个节点通过边连接。
一种可能设计,计算设备在所述多个对象团映射为多个关系团时,如果所述对象团中的边不属于稠密结构,则不将所述对象团中不属于稠密结构的边映射为所述对象团对应的关系团中的节点;即筛除掉该对象团中不属于稠密结构的边,使得关系团体现的关系紧密度大于对象团体现的关系紧密度。
第二方面,本申请提供一种发现社团的装置,该装置包括实现第一方面或者第一方面的各种可能设计提供的发现社团的方法的各功能单元。
第三方面,本申请提供一种计算设备,所述计算设备包括处理器和存储器;
所述处理器执行所述存储器中存储的指令,使得所述计算设备执行第一方面或者第一方面的各种可能设计提供的发现社团的方法。
第四方面,本申请提供一种计算机可读存储介质。计算机可读存储介质中存储有指令。计算设备执行所述计算机可读存储介质中的指令,使得所述计算设备执行第一方面或者第一方面的各种可能设计提供的发现社团的方法。
第五方面,本申请提供一种计算机程序产品,该计算机程序产品包括指令,该指令存储在计算机可读存储介质中。计算设备执行该计算机程序产品中的指令,使得所述计算设备执行第一方面或者第一方面的各种可能设计提供的发现社团的方法。
附图说明
图1为计算设备的一种硬件架构示意图;
图2为本发明实施例提供的发现社团的一种流程示意图;
图3A为无向的对象关系图的一种示意图;
图3B为无向的对象团的一种示意图;
图3C为无向的关系团的一种示意图;
图3D为无向的社团的一种示意图;
图4A为有向的对象关系图的一种示意图;
图4B为有向的对象团的一种示意图;
图4C为有向的关系团的一种示意图;
图4D为有向的社团的一种示意图;
图5为本发明实施例提供的社团发现的装置的一种结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例提供的技术方案进行描述。
计算设备实施例
参见图1,计算设备100包括至少一个处理器101、存储器102、通信接口103和总线104。
计算设备100中的每个处理器101,可以是以下的任一种:中央处理器(CentralProcessing Unit,CPU)、ARM处理器、现场可编程门阵列(Field Programmable GateArray,FPGA)、专用处理器等具有计算处理能力的器件。
可选地,计算设备100中的处理器101的数量为多个;多个处理器101可以是不同类型的处理器101,或者可以是相同类型的处理器101。一种可选实施方式,该多个处理器101还可以集成为众核处理器。
存储器102存储计算机指令和数据;例如,存储器102存储操作系统(operatingsystem,OS)相关的计算机指令和数据。存储器102可以是以下的任一种或任一种组合:只读存储器(read only memory,ROM)、非易失性存储器(non-volatile memory,NVM)、固态硬盘(Solid State Drives,SSD)、机械硬盘、磁盘、磁盘整列等存储介质。
通信接口103可以是以下的任一种或任一种组合:网络接口(例如以太网接口)、无线网卡等具有网络接入功能的器件。
通信接口103用于计算设备100与其它设备(例如计算设备)进行数据交互。
总线104包括内存总线,还可以包括以下的任一种或任一种组合:工业标准体系结构(Industry Standard Architecture,ISA)总线、外设组件互连标准(PeripheralComponent Interconnect,PCI)总线、扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等有线数据传输的器件。图1用一条粗线表示总线104。
处理器101、存储器102和通信接口103通过总线104连接。这样,处理器101可以通过总线104访问存储器102,以及通过总线104利用通信接口103与其它设备(例如计算设备)进行数据交互。
在本发明实施例中,至少一个计算设备100运行各自的存储器102中的指令,使得该至少一个计算设备100实现方法实施例提供的发现社团的方法。
一种可能实现,可以是一个计算设备100执行该个计算设备100的存储器102中的指令,使得该个计算设备100实现方法实施例提供的发现社团的方法。
一种可能实现,还可以是多个计算设备100执行各自的存储器102中的指令,使得多个计算设备100协作来实现方法实施例提供的发现社团的方法。
方法实施例
本发明实施例提供的发现社团的方法,用于从对象关系网识别出社团。
对象关系网包括M个节点和N条边,M和N均为大于或等于2的正整数。N条边中,每条边连接M个节点中的两个节点;并且,M个节点中,每个节点连接N条边中的至少一条边。因此,N条边共连接M个节点。
例如,图3A示意了一个无向的对象关系网,并且标识出了无向的边a、边b、边c、边d和边e;其中,边b和边c共同连接一个节点p1,边a和边c共同连接一个节点p2。
对象关系网中,M个节点中的每个节点表示一个对象,N条边中每条边表示两个对象的关系。举例说明,图3A中,节点p1和节点p2表示两个对象,边c表示这两个对象(节点p1和节点p2)的关系。
一种应用场景,在人类社会活动中,可以将人作为对象,相应地,将人与人之间发生的行为作为关系。这样,人以及人与人之间发生的行为,分别构成了对象关系网中的节点和边。本发明实施例提供的发现社团的方法用于从对象关系网识别关系更为紧密的社团。
举例说明,社交网络中,用户(即人)作为对象,多个用户之间的社交动作(例如在同一论坛评论,例如相互通信)作为关系。在社交网络中,用户之间有社交动作、并且社交动作较为频繁的用户群为社团,这样从社交网络识别出的每个用户群均为一个社团。
对人类社会活动进行社团分析,已经广泛应用于各种领域,例如从犯罪网络中识别犯罪团伙,再例如从用户通信网络中识别朋友圈等。
举例说明,在公安领域,基于公安提供的同住宿、同上网、同航班、同车违章等关系数据中,通过识别社团来识别犯罪团伙。具体地,在这些关系数据中,将事件人作为对象,将事件作为关系,形成无向的对象关系网;其中,对象关系网中的节点表示事件人,对象关系网中的边表示事件。从该对象关系网中识别出的社团,可以作为可疑的犯罪团伙。
举例说明,在金融领域,基于交易记录、转账记录等数据,通过识别社团来识别洗钱团伙。具体地,将账号(用于标识人)作为对象,将交易记录和转账记录作为关系,形成有向的对象关系网;其中,对象关系网中的节点表示账号,对象关系网中的边表示交易记录或转账记录。从该对象关系网中识别出账务往来比较频繁的社团,识别出的社团可以作为可疑的洗钱团伙。
可选地,对象关系网中的边可以是无向的,如图3A所示。如果对象关系网中的边可以是无向的,本发明实施例称该对象关系网为无向的对象关系网。
举例说明,在上述的公安领域中,事件人之间发生的事件是没有方向的;相应地,在公安领域组建的对象关系网中,表示事件的边也是无向的。
可选地,对象关系网中的边可以是有向的,如图3B所示。如果对象关系网中的边可以是有向的,本发明实施例称该对象关系网为有向的对象关系网。
举例说明,在上述的金融领域中,交易记录或者转账记录具有方向性,需要从一个账号到另一个账号进行交易或转账;相应地,在金融领域组建的对象关系网中,表示交易记录或者转账记录的边也是有向的。
方法实施例一
本发明实施例提供的发现社团的方法,用于从对象关系网中识别社团。参见图2,该方法包括步骤S201、S202、S203、S204和S205。下面以计算设备(例如上述的计算设备100)为执行主体为例描述该方法包括的各步骤。
步骤S201,计算设备获取对象关系网。
描述对象关系网的数据,可以存储在计算设备,或者存储在其它设备或存储介质中。如果数据存储在计算设备本地,计算设备直接读取本地的数据来构成该对象关系网。如果数据存储其它设备,计算设备通过与该设备通信来获取描述该对象关系网的数据。如果数据存储在存储介质,计算设备直接访问该存储介质或者通过其它设备访问该存储介质来获取描述该对象关系网的数据。
描述对象关系网的数据,包括描述节点的数据和描述边的数据;其中,节点表示一个对象,边表示该边连接的两个对象的关系。实际应用场景中,该对象关系网的节点和边被赋予具体技术含义,例如该对象关系网的节点表示该实际应用场景中的人,该对象关系网的边表示该实际应用场景中人与人之间的社交动作。
图3A示意了一个对象关系网。图3A标识出了边a、边b、边c、边d和边e;其中,边b和边c共同连接一个节点p1,边a和边c共同连接一个节点p2。
步骤S202,计算设备根据稠密结构从所述对象关系网中提取多个对象团。
稠密结构是用来筛选多个对象之间关系紧密度的基础依据。对于对象关系网中属于稠密结构的多个节点,该多个节点所代表的多个对象发生的关系较多。
稠密结构可以是多边形,或者可以是不同多边形的组合。一种可能实现,所述稠密结构可以为三角形,或者可以是三角形与多边形的组合。一种可能实现,所述稠密结构可以为三角形。
稠密结构的边可以是无向的,或者可以是有向的。即作为稠密结构的每种多边形的边,可以是有向的,或者可以是无向的。如果稠密结构的边是无向的,本申请称该稠密结构为无向的稠密结构。如果稠密结构的边是有向的,本申请称该稠密结构为有向的稠密结构。
如果对象关系网的边是无向的,步骤S202中,计算设备使用无向的稠密结构在对象关系网中进行匹配,得到匹配结果;匹配结果中,如果多个稠密结构通过边或者节点连接,则该多个稠密结构一起作为一个对象团,并且将用于连接该多个稠密结构的边和点添加入该个对象团;匹配结果中,如果某个稠密结构没有通过边或者节点与其它稠密结构连接,则该个稠密结构单独作为一个对象团。因此,对象团中,任意一个节点可以经过一条边或多条边到达其它节点;即,对象团中任意两个节点可以通过一条边或多条边连接。
举例说明,从图3A到图3B示意了从对象关系网提取对象团的一种实现。图3A所示的对象关系网的边是无向的。以无向的三角形作为稠密结构,在图3A的对象关系网中进行匹配,匹配得到6个三角形。该6个三角形中,5个三角形直接或间接连接,例如边a、边b和边c形成的三角形通过边d连接其它两个三角形,再例如边a、边b和边c形成的三角形与另一个三角形共同拥有一条边c和节点p1和节点p2;因此,这5个三角形和边d共同作为一个对象团12,对象团12中任意一个节点可以经过一条边或多条边到达其它节点。另外,该6个三角形中,1个三角形未与其它5个三角形直接或间接连接,因此,该个三角形独立作为一个对象团11。
如果对象关系网的边是有向的,步骤S202中,计算设备使用有向的稠密结构在对象关系网中进行匹配,得到匹配结果;进行匹配时不但节点和边要匹配,而且边的方向也要匹配。匹配结果中,如果多个稠密结构通过边或者节点连接,则该多个稠密结构一起作为一个对象团,并且将用于连接该多个稠密结构的边和点添加入该个对象团;匹配结果中,如果某个稠密结构没有通过边或者节点与其它稠密结构连接,则该个稠密结构单独作为一个对象团。对象团中,任意一个节点可以经过一条边或多条边到达其它节点。
举例说明,从图4A到图4B示意了从对象关系网提取对象团的一种实现。图4A所示的对象关系网的边是有向的。以有向的三角形作为稠密结构,在图4A的对象关系网中进行匹配,匹配得到3个三角形。该3个三角形中,2个三角形通过边r连接,即边o、边q和边t形成的三角形通过边r连接另一个三角形,因此这2个三角形和边r共同作为一个对象团42,对象团42中任意一个节点可以经过一条边或多条边到达其它节点。另外,该3个三角形中,1个三角形未与其它2个三角形直接或间接连接,因此,该个三角形独立作为一个对象团41。
步骤S202中,计算设备使用稠密结构在对象关系网中提取对象团时,会筛除掉部分节点和边,该筛除掉的节点和边包括不能组成稠密结构并且不用于连接两个稠密结构的边和节点。例如,使用无向的三角形在图3A所示无向的对象关系网中提取对象团时,筛除掉边e和仅与边e连接的节点p3。例如,使用有向的三角形在图4A所示有向的对象关系网中提取对象团时,筛除不匹配的三角形,筛除不属于三角形的边和节点,例如边s和与该边s连接的节点p13。
步骤S203,计算设备根据映射关系将所述多个对象团映射为多个关系团。
在所述映射关系中,对象团包括的稠密结构的边对应该对象团映射的关系团中的节点。
可选地,计算设备根据映射关系,将多个对象团一一映射为多个关系团,即一个对象团映射为一个关系团。在映射关系中,对象团的边对应关系团的节点。
步骤S203中,计算设备将对象团映射为关系团时,如果该对象团中的两条边属于同一个稠密结构,则将该两条边映射为该关系团中的两个节点,并在该关系团中将该两个节点通过边连接。可选地,计算设备将对象团映射为关系团时,如果该对象团中的边不属于稠密结构,则不将该对象团中不属于稠密结构的边映射为该关系团中的节点,即筛除掉该对象团中不属于稠密结构的边,举例,筛除掉的边可以为在该对象团中不属于稠密结构的、并且用于连接多个稠密结构的边。
计算设备可以将无向的对象团映射为无向的关系团。无向的对象团是指该对象团中的边是无向的。无向的关系团是指该关系团中的边是无向的。
举例说明,从图3B到图3C示意了对象团映射为关系团的一种实现。对象团11映射为关系团21,对象团12映射为关系团22。以对象团12映射为关系团22为例,对象团12中的无向的边a、边b和边c,对应映射为关系团22的节点A、节点B和节点C;由于边a、边b和边c属于对象团12中的同一个稠密结构,因此在关系团22中,节点A、节点B和节点C之间分别具有一条边。但对象团12中不属于任何稠密结构的边d,没有在关系团22中映射为节点;即在对象团12映射为关系团22时,筛除掉了不属于稠密结构的边d。
计算设备可以将有向的对象团映射为有向的关系团。有向的对象团是指该对象团中的边是有向的。有向的关系团是指该关系团中的边是有向的。
举例说明,从图4B到图4C示意了对象团映射为关系团的一种实现。对象团41映射为关系团51,对象团42映射为关系团52。以对象团42映射为关系团52为例,对象团42中的边o、边q和边t,对应映射为关系团52的节点O、节点Q和节点T;由于有向的边o、边q和边t属于对象团42中的同一个稠密结构,因此在关系团52中,节点O、节点Q和节点T之间分别具有一条有向的边;该节点O、节点Q和节点T之间的边的方向根据稠密结构的边的方向确定,例如边o、边q和边t的方向为顺时针方向,节点O、节点Q和节点T之间的边的方向也为顺时针方向。另外,对象团42中不属于任何稠密结构的边r,没有在关系团52中映射为节点;即在对象团42映射为关系团52时,筛除掉了不属于稠密结构的边r。
可见,有向的对象团中有向的边都会映射为关系团中的节点,如果对象团中两个节点之间具有两条方向相反的边,则这两条方向相反的边在该关系团中会映射为两个节点。
由于在将对象团映射为关系团时,对于该对象团中不属于稠密结构的边,不会映射为该关系团中的节点,即筛除掉该对象团中不属于稠密结构的边,这样可以在关系团中体现的关系紧密度比在对象团中体现的关系紧密度更高。
步骤S204,计算设备从每个关系团中确定至少一个联通区域。
在该联通区域中,任意一个节点可以通过一条边或多条边到达该联通区域中的其它节点,即任意两个节点通过一条边或多条边连接。以图3C为例,联通区域222中,节点A、节点B和节点C之间分别通过一条边相互连接,节点A分别通过两条边连接除节点B和节点C以外的其它节点。以图4C为例,联通区域522中,节点O、节点T和节点Q之间分别通过一条边相互连接。
如果对象团只包含一个稠密结构,该个稠密结构在该对象团对应的关系团中映射为一个联通区域,并且该关系团也只具有该个联通区域。
如果对象团包含多个稠密结构,并且,该对象团中两个稠密结构或者多个稠密结构是通过不属于稠密结构的边连接的,则将该对象团映射为关系团时,筛除掉了不属于稠密结构的边,筛除掉的边在该关系团中没有映射为节点,因此在该关系团中具有多个联通区域。
举例说明,图3C示意了从关系团划分出联通区域的一种实现。对象团11仅包含一个稠密结构,对象团11对应的关系团21仅具有一个联通区域,即该关系团21为一个联通区域21。对象团12包含多个稠密结构,对象团12中具有不属于稠密结构的边d,该边d在关系团22没有对应的节点,因此,关系团22具有两个联通区域,即联通区域221和联通区域222。
举例说明,图4C示意了从关系团划分出联通区域的一种实现。对象团41仅包含一个稠密结构,对象团41对应的关系团51仅具有一个联通区域,即该关系团51为一个联通区域51。对象团42包含多个稠密结构,对象团42中具有不属于稠密结构的边r,该边r在关系团52没有对应的节点,因此,关系团52具有两个联通区域,即联通区域521和联通区域522。
由于在步骤S203中对该对象团中不属于稠密结构的边不会在该关系团中映射为节点,因此从关系团中确定的联通区域,该联通区域体现了很强的关系紧密度,比对象团体现的关系紧密度更高。
步骤S205,计算设备根据该映射关系将该联通区域在该对象关系网中映射为社团。
该映射关系为步骤S203中计算设备将多个对象团映射为多个关系团所使用的映射关系。在所述映射关系中,对象团包括的稠密结构的边对应该对象团映射的关系团中的节点。
对于该关系团中的每个联通区域,可以基于该映射关系,根据该联通区域的所有节点在该对象关系网中确定该所有节点对应的边,在该对象关系网中该所有节点对应的边、以及该所有节点对应的边所连接的节点共同组成一个社团。
举例说明,从图3C到图3D示意了根据联通区域在对象关系网中映射为社团的一种实现。根据映射关系,图3C中的联通区域21、联通区域221和联通区域222在图3D所示的对象关系网中映射为社团31、社团321和社团322。其中,联通区域222中的节点A、节点B和节点C,在对象关系网中确定为边a、边b和边c,边a、边b和边c为一个无向的三角形的稠密结构。联通区域222在对象关系网中映射的社团322包含两个稠密结构,两个稠密结构具有共同的边c,不具有不属于稠密结构的边d。类似地,联通区域221对应的社团321包含三个三角形的稠密结构,三个稠密结构中各自通过共同边和节点连接另一个稠密结构,社团321也不具有不属于稠密结构的边d。
举例说明,从图4C到图4D示意了根据联通区域在对象关系网中映射为社团的一种实现。根据映射关系,图4C中的联通区域51、联通区域521和联通区域522在图4D所示的对象关系网中映射为社团61、社团621和社团622。其中,联通区域522中的节点O、节点T和节点Q,在对象关系网中确定为边o、边t和边q,边o、边t和边q为一个有向的三角形的稠密结构。类似地,联通区域521对应的社团621包含一个有向的三角形的稠密结构。
在将对象团映射为关系团时,具体是将对象团中的稠密结构在关系团中进行映射,并且对该对象团中不属于稠密结构的边(例如图3B中用于连接多个稠密结构的边d,图4B中的边r)没有在关系团中进行映射。因此,在该关系团中识别出的联通区域仅对应该对象团中的稠密结构。如果联通区域对应多个稠密结构,并且该多个稠密结构具有连接关系,该多个结构作为一个社团,该社团可以是对象团的部分或全部。可见,社团体现的关系紧密度大于或等于对象团体现的关系紧密度。由于社团可能是具有一个独立的稠密结构;或者社团可能是具有多个稠密结构,该多个稠密结构具有共同边;因此,社团体现出更强的关系紧密度。
本申请通过稠密结构发现关系紧密的对象团,并通过两次映射(对象团映射为关系团,联通区域映射为社团)直接在对象关系网中确定社团,本申请识别社团的效率,相对于现有技术高,并且识别社团过程所需的特征(节点和边)少。
可选地,步骤S205在对象关系网中划分出社团之后,计算设备可以将该对象关系网中不属于稠密结构的每个节点,按照关系紧密度强的原则,归并到该节点关系紧密度最强的社团中。
对于无向的对象关系网,将不属于稠密结构的每个节点归并至社团的原则如下:
1)如果节点只连接一个稠密结构,则将该节点归并至该稠密结构所属的社团;
2)如果节点连接多个稠密结构,则根据归并概率阈值的最大值确定将该节点归并到哪个稠密结构,进而将该节点归并至该个稠密结构所属的社团;例如计算设备可以基于贡献度计算该归并概率阈值,计算贡献度所需考虑的因素包括:该节点和稠密结构的链接数与该节点的总度数的比值。
对于有向的对象关系网,将不属于稠密结构的每个节点归并至社团的原则如下:
1)该节点指向一个稠密结构,便将该节点归并至该个稠密结构所属的社团;
2)如果该节点连接多个稠密结构,则根据归并概率阈值的最大值确定归并到哪个稠密结构,进而将该节点归并至该个稠密结构所属的社团;例如计算设备可以基于贡献度计算该归并概率阈值,计算贡献度所需考虑的因素包括:该节点和稠密结构的出向链接数与该节点的总出度的比值。
这样,对象关系网中不属于稠密结构的所有节点分别归并至对应的社团,即该对象关系网社团被划分为了多个社团,对象关系网中的每个节点均具有所属的社团,并且每个节点被划入了与该节点关系最强的社团。
装置和设备实施例
本发明实施例提供一种发现社团的装置,参见图5,该装置500包括用于实施方法实施例提供的发现社团的方法包括的各步骤的功能单元;本发明实施例对在该装置500中如何划分功能单元不做限定,下面实例性地提供一种功能单元的划分,如图5所示。
如图5所示的发现社团的装置500,该装置500所述装置500包括:
获取单元501,用于获取对象关系网,所述对象关系网包括多个节点和多条边,所述多条边中的每条边用于连接所述多个节点中的两个节点,所述多个节点中的每个节点连接所述多条边中的至少一条边;所述多个节点中的节点表示一个对象,所述多条边中的边表示所述边连接的两个对象的关系;
提取单元502,用于根据稠密结构从所述对象关系网中提取多个对象团,所述多个对象团中的每个对象团包括至少一个所述稠密结构,所述稠密结构为多边形或者不同多边形的组合,所述对象团中任意一个节点经过一条边或多条边到达其它节点;
映射单元503,用于根据映射关系将所述多个对象团映射为多个关系团,在所述映射关系中所述对象团包括的稠密结构的边对应所述对象团映射的关系团中的节点;
确定单元504,用于从所述多个关系团的每个关系团中确定至少一个联通区域;
所述映射单元503,用于根据所述映射关系将所述联通区域在所述对象关系网中映射为社团。
可选地,所述稠密结构为三角形或者三角形与多边形的组合。
可选地,所述对象关系网中的边是无向的,所述稠密结构中的边是无向的;或者,
所述对象关系网中的边是有向的,所述稠密结构中的边是有向的。
可选地,所述提取单元502,用于:在所述对象关系网中匹配所述稠密结构;将所述对象关系网中连接的多个所述稠密结构作为一个所述对象团,和/或将所述对象关系网中未连接的两个所述稠密结构划入不同的所述对象团。
可选地,所述映射单元503,用于:如果所述对象团中的两条边属于同一个稠密结构,则将所述两条边映射为所述对象团对应的关系团中的两个节点,并在所述对象团对应的关系团中将所述两个节点通过边连接。
可选地,所述映射单元503,用于:如果所述对象团中的边不属于稠密结构,则不将所述对象团中不属于稠密结构的边映射为所述对象团对应的关系团中的节点。
在本发明实施例中,装置500包括的各功能单元的功能描述,参见上述方法实施例对发现社团的方法包括的各步骤的相关描述。
参见图1,本发明实施例提供一种计算设备100,计算设备包括处理器101和存储器102;
处理器101执行存储器102中存储的指令,使得计算设备100执行方法实施例提供的发现社团的方法。
本发明实施例提供一种可读存储介质(例如图1中的存储器102),所述可读存储介质中存储有指令,计算设备执行所述指令使得所述计算设备执行方法实施例提供述的发现社团的方法。
本发明实施例提供一种计算机程序产品,该计算机程序产品包括指令,该指令存储在计算机可读存储介质中。计算设备执行该计算机程序产品中的指令,使得所述计算设备执行方法实施例提供的发现社团的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的保护范围。
Claims (14)
1.一种发现社团的方法,其特征在于,所述方法包括:
获取对象关系网,所述对象关系网包括多个节点和多条边,所述多条边中的每条边用于连接所述多个节点中的两个节点,所述多个节点中的每个节点连接所述多条边中的至少一条边;所述多个节点中的节点表示一个对象,所述多条边中的边表示所述边连接的两个对象的关系;
根据稠密结构从所述对象关系网中提取多个对象团,所述多个对象团中的每个对象团包括至少一个所述稠密结构,所述稠密结构为多边形或者不同多边形的组合,所述对象团中任意一个节点经过一条边或多条边到达其它节点;
根据映射关系将所述多个对象团映射为多个关系团,在所述映射关系中所述对象团包括的稠密结构的边对应所述对象团映射的关系团中的节点;
从所述多个关系团的每个关系团中确定至少一个联通区域;
根据所述映射关系将所述联通区域在所述对象关系网中映射为社团。
2.根据权利要求1所述的方法,其特征在于,所述稠密结构为三角形或者三角形与多边形的组合。
3.根据权利要求1或2所述的方法,其特征在于,所述对象关系网中的边是无向的,所述稠密结构中的边是无向的;或者,
所述对象关系网中的边是有向的,所述稠密结构中的边是有向的。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述根据稠密结构从所述对象关系网中提取多个对象团,包括:
在所述对象关系网中匹配所述稠密结构;
将所述对象关系网中连接的多个所述稠密结构作为一个所述对象团,和/或将所述对象关系网中未连接的两个所述稠密结构划入不同的所述对象团。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述根据映射关系将所述多个对象团映射为多个关系团,包括:
如果所述对象团中的两条边属于同一个稠密结构,则将所述两条边映射为所述对象团对应的关系团中的两个节点,并在所述对象团对应的关系团中将所述两个节点通过边连接。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述根据映射关系将所述多个对象团映射为多个关系团,包括:
如果所述对象团中的边不属于稠密结构,则不将所述对象团中不属于稠密结构的边映射为所述对象团对应的关系团中的节点。
7.一种发现社团的装置,其特征在于,所述装置包括:
获取单元,用于获取对象关系网,所述对象关系网包括多个节点和多条边,所述多条边中的每条边用于连接所述多个节点中的两个节点,所述多个节点中的每个节点连接所述多条边中的至少一条边;所述多个节点中的节点表示一个对象,所述多条边中的边表示所述边连接的两个对象的关系;
提取单元,用于根据稠密结构从所述对象关系网中提取多个对象团,所述多个对象团中的每个对象团包括至少一个所述稠密结构,所述稠密结构为多边形或者不同多边形的组合,所述对象团中任意一个节点经过一条边或多条边到达其它节点;
映射单元,用于根据映射关系将所述多个对象团映射为多个关系团,在所述映射关系中所述对象团包括的稠密结构的边对应所述对象团映射的关系团中的节点;
确定单元,用于从所述多个关系团的每个关系团中确定至少一个联通区域;
所述映射单元,用于根据所述映射关系将所述联通区域在所述对象关系网中映射为社团。
8.根据权利要求7所述的装置,其特征在于,所述稠密结构为三角形或者三角形与多边形的组合。
9.根据权利要求7或8所述的装置,其特征在于,所述对象关系网中的边是无向的,所述稠密结构中的边是无向的;或者,
所述对象关系网中的边是有向的,所述稠密结构中的边是有向的。
10.根据权利要求7至9任一项所述的装置,其特征在于,
所述提取单元,用于:在所述对象关系网中匹配所述稠密结构;将所述对象关系网中连接的多个所述稠密结构作为一个所述对象团,和/或将所述对象关系网中未连接的两个所述稠密结构划入不同的所述对象团。
11.根据权利要求7至10任一项所述的装置,其特征在于,
所述映射单元,用于:如果所述对象团中的两条边属于同一个稠密结构,则将所述两条边映射为所述对象团对应的关系团中的两个节点,并在所述对象团对应的关系团中将所述两个节点通过边连接。
12.根据权利要求7至11任一项所述的装置,其特征在于,
所述映射单元,用于:如果所述对象团中的边不属于稠密结构,则不将所述对象团中不属于稠密结构的边映射为所述对象团对应的关系团中的节点。
13.一种计算设备,其特征在于,所述计算设备包括处理器和存储器;
所述处理器执行所述存储器中存储的指令,使得所述计算设备执行权利要求1至6任一项所述的发现社团的方法。
14.一种可读存储介质,其特征在于,所述可读存储介质中存储有指令,计算设备执行所述指令使得所述计算设备执行权利要求1至6任一项所述的发现社团的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711000864.3A CN109712010B (zh) | 2017-10-24 | 2017-10-24 | 发现社团的方法和装置、计算设备、可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711000864.3A CN109712010B (zh) | 2017-10-24 | 2017-10-24 | 发现社团的方法和装置、计算设备、可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109712010A true CN109712010A (zh) | 2019-05-03 |
CN109712010B CN109712010B (zh) | 2023-07-18 |
Family
ID=66252985
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711000864.3A Active CN109712010B (zh) | 2017-10-24 | 2017-10-24 | 发现社团的方法和装置、计算设备、可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109712010B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112598549A (zh) * | 2020-12-23 | 2021-04-02 | 广东技术师范大学 | 一种学习者潜在重叠社区检测方法、装置、设备及介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102662964A (zh) * | 2012-03-05 | 2012-09-12 | 北京千橡网景科技发展有限公司 | 对用户的好友进行分组的方法和装置 |
CN103810260A (zh) * | 2014-01-27 | 2014-05-21 | 西安理工大学 | 基于拓扑特性的复杂网络社团发现方法 |
CN105426375A (zh) * | 2014-09-22 | 2016-03-23 | 阿里巴巴集团控股有限公司 | 一种关系网络的计算方法及装置 |
US20170109703A1 (en) * | 2005-01-12 | 2017-04-20 | Linkedin Corporation | Method and system for leveraging the power of one's social network in an online marketplace |
US20170223040A1 (en) * | 2014-10-14 | 2017-08-03 | Nippon Telegraph And Telephone Corporation | Identifying device, identifying method and identifying program |
CN107194623A (zh) * | 2017-07-20 | 2017-09-22 | 深圳市分期乐网络科技有限公司 | 一种团伙欺诈的发现方法及装置 |
-
2017
- 2017-10-24 CN CN201711000864.3A patent/CN109712010B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170109703A1 (en) * | 2005-01-12 | 2017-04-20 | Linkedin Corporation | Method and system for leveraging the power of one's social network in an online marketplace |
CN102662964A (zh) * | 2012-03-05 | 2012-09-12 | 北京千橡网景科技发展有限公司 | 对用户的好友进行分组的方法和装置 |
CN103810260A (zh) * | 2014-01-27 | 2014-05-21 | 西安理工大学 | 基于拓扑特性的复杂网络社团发现方法 |
CN105426375A (zh) * | 2014-09-22 | 2016-03-23 | 阿里巴巴集团控股有限公司 | 一种关系网络的计算方法及装置 |
US20170223040A1 (en) * | 2014-10-14 | 2017-08-03 | Nippon Telegraph And Telephone Corporation | Identifying device, identifying method and identifying program |
CN107194623A (zh) * | 2017-07-20 | 2017-09-22 | 深圳市分期乐网络科技有限公司 | 一种团伙欺诈的发现方法及装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112598549A (zh) * | 2020-12-23 | 2021-04-02 | 广东技术师范大学 | 一种学习者潜在重叠社区检测方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109712010B (zh) | 2023-07-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109598509A (zh) | 风险团伙的识别方法和装置 | |
Fabbri et al. | The effect of homophily on disparate visibility of minorities in people recommender systems | |
CN109784636A (zh) | 欺诈用户识别方法、装置、计算机设备及存储介质 | |
CN111046429B (zh) | 基于隐私保护的关系网络构建方法及装置 | |
US20150188941A1 (en) | Method and system for predicting victim users and detecting fake user accounts in online social networks | |
CN110245787A (zh) | 一种目标群体预测方法、装置及设备 | |
Vega-Oliveros et al. | Influence maximization by rumor spreading on correlated networks through community identification | |
CN111932130B (zh) | 业务类型识别方法及装置 | |
Zubcsek et al. | Information communities: the network structure of communication | |
Bhuyan et al. | Privacy preserving sub-feature selection in distributed data mining | |
CN110209729B (zh) | 数据转移对象识别的方法及装置 | |
CN112508630B (zh) | 异常会话群的检测方法、装置、计算机设备和存储介质 | |
CN110222241B (zh) | 一种社区分割方法和装置 | |
US20150242532A1 (en) | Efficient link management for graph clustering | |
Zhang et al. | Skeleton of weighted social network | |
CN115271980A (zh) | 风险值预测方法、装置、计算机设备和存储介质 | |
Nathiya et al. | An effective way of cloud intrusion detection system using decision tree, support vector machine and Naïve bayes algorithm | |
CN109712010B (zh) | 发现社团的方法和装置、计算设备、可读存储介质 | |
Sánchez-Corcuera et al. | Analysing centralities for organisational role inference in online social networks | |
Ibrahim et al. | Identifying influential nodes in two-mode data networks using formal concept analysis | |
CN109325814A (zh) | 一种用于发现可疑交易网络的方法 | |
CN107908673B (zh) | 社交平台用户的现实关系匹配方法、装置及可读存储介质 | |
Malhotra et al. | Mitigating Iot attacks in Smart Medical Networks using Enhanced Dirichlet based algorithm for trust management system | |
Król | On modelling social propagation phenomenon | |
CN112541765A (zh) | 用于检测可疑交易的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20220228 Address after: 550025 Huawei cloud data center, jiaoxinggong Road, Qianzhong Avenue, Gui'an New District, Guiyang City, Guizhou Province Applicant after: Huawei Cloud Computing Technologies Co.,Ltd. Address before: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen Applicant before: HUAWEI TECHNOLOGIES Co.,Ltd. |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |