CN111641518A - 基于异质网络的社群划分方法、装置、计算机设备及介质 - Google Patents
基于异质网络的社群划分方法、装置、计算机设备及介质 Download PDFInfo
- Publication number
- CN111641518A CN111641518A CN202010356642.0A CN202010356642A CN111641518A CN 111641518 A CN111641518 A CN 111641518A CN 202010356642 A CN202010356642 A CN 202010356642A CN 111641518 A CN111641518 A CN 111641518A
- Authority
- CN
- China
- Prior art keywords
- node
- seed
- network
- accident
- community
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000003860 storage Methods 0.000 claims abstract description 12
- 230000011218 segmentation Effects 0.000 claims description 25
- 238000004364 calculation method Methods 0.000 claims description 17
- 238000012216 screening Methods 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 12
- 238000010276 construction Methods 0.000 claims description 5
- 230000000694 effects Effects 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 14
- 238000012423 maintenance Methods 0.000 description 11
- 238000004422 calculation algorithm Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 2
- 241001632427 Radiola Species 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0893—Assignment of logical groups to network elements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请属于智能决策领域,公开了一种基于异质网络的社群划分方法、装置、计算机设备及可读存储介质。所述方法包括获取预设事故节点,然后基于事故节点之间的事故相关度构建事故异质网络,并确定种子节点,根据种子节点生成的节点路径对事故异质网络进行切分,得到基于社群的社群节点网络;再通过根据同质网络的权重得到种子节点网络的关系权重,基于带关系权重的种子节点网络对种子节点进行最终社群的划分,最后通过种子节点的最终社群与其邻居节点的相似度划分异质节点完成节点的社群划分。采用本方法解决了容易丢失异质节点间信息,导致社群划分效果不理想的技术问题。
Description
技术领域
本申请涉及数据处理领域,特别是涉及一种基于异质网络的社群划分方法、装置、计算机设备和存储介质。
背景技术
异质节点网络是根据几类相互之间具有关联性的节点构建成的关系网络,现有技术中可以根据异质节点网络对其中的节点进行社群/类别划分,达到为节点分类的目的。已有的社群划分方式要求所要划分的关系网络的节点为同一类型,还有的虽然能够处理包含不同类型的节点的关系网络,但是只能处理两种不同类型的节点,且在社群划分期间容易丢失异质节点间的信息,使得最终划分准确率低的技术问题。
发明内容
基于此,有必要针对上述技术问题,本申请提供一种基于异质网络的社群划分方法、装置、计算机设备及存储介质,以解决现有技术中容易丢失异质节点间信息,导致社群划分准确率低技术问题。
一种基于异质网络的社群划分方法,所述方法包括:
构建基于预设事故节点的事故异质网络;
根据预设种子条件对所述预设事故节点进行筛选,得到所述事故异质网络的种子节点,并生成基于所述种子节点的节点路径;
根据所述节点路径对所述事故异质网络进行切分,得到同质网络;
对所述同质网络进行切分,得到社群节点网络,并为每一个所述社群节点网络中的搜产排名标记所属社群的社群标签;
基于每一条边的两端皆为种子节点的条件从事故异质网络中筛选得到种子节点网络;
根据所述社群节点网络计算所述种子节点网络中的种子节点对的权重,并根据所述权重设定所述种子节点网络的关系权重;
对设定有所述关系权重的种子节点网络进行社群划分,得到所述种子节点的最终社群以及最终社群所对应的最终社群标签;
计算所述种子节点网络中每个所述种子节点的邻居节点与所述最终社群标签的相似度,并将最高所述相似度对应的最终社群标签作为所述邻居节点的最终社群。
本申请从技术层面,通过元路径切分技术,能够将所有异质节点信息也作为社群划分的依据,弥补了传统方法的缺陷,有利于提升模型精准度。此外,由于算法的复杂度为O(n),对于海量数据集仍有较好的计算性能,比如可以做到更新100万个节点标签是5秒,更新1000万个就花50秒的时间。本申请对于用户分类、群体异常检测,都具有广泛的应用前景。
一种基于异质网络的社群划分装置,所述装置包括:
网络构建模块,用于构建基于预设事故节点的事故异质网络;
路径生成模块,用于根据预设种子条件对所述预设事故节点进行筛选,得到所述事故异质网络的种子节点,并生成基于所述种子节点的节点路径;
同质切分模块,用于根据所述节点路径对所述事故异质网络进行切分,得到同质网络;
社群切分模块,用于对所述同质网络进行切分,得到社群节点网络,并为每一社群节点网络中的种子节点标记所属社群的社群标签;
网络筛选模块,用于基于每一条边的两端皆为种子节点的条件从事故异质网络中筛选得到种子节点网络;
权重叠加模块,用于根据所述社群节点网络计算所述种子节点网络中的种子节点对的权重,并根据所述权重设定所述种子节点网络的关系权重;
标签生成模块,用于对设定有所述关系权重的种子节点网络进行社群划分,得到所述种子节点的最终社群以及最终社群所对应的最终社群标签;
异质划分模块,用于计算所述种子节点网络中每个所述种子节点的邻居节点与所述最终社群标签的相似度,并将最高所述相似度对应的最终社群标签作为所述邻居节点的最终社群。
一种计算机设备,包括存储器和处理器,以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于异质网络的社群划分方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于异质网络的社群划分方法的步骤。
上述基于异质网络的社群划分方法、装置、计算机设备和存储介质,通过获取预设事故节点,然后基于事故节点之间的事故相关度构建事故异质网络,并确定种子节点,根据种子节点生成的节点路径对事故异质网络进行切分,得到社群节点网络;再根据同质网络的权重得到种子节点网络的关系权重,基于带关系权重的种子节点网络对种子节点进行最终社群的划分,最后通过种子节点的最终社群与其邻居节点的相似度划分除种子节点外的预设事故节点完成节点的社群划分。解决了现有技术中容易丢失异质节点间信息,导致社群划分准确率低的技术问题。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为基于异质网络的社群划分方法的应用环境示意图;
图2为基于异质网络的社群划分方法的流程示意图;
图3为图2中步骤202的流程示意图;
图4为图2中步骤204的得到事故异质网络的种子节点的一实施例的流程示意图;
图5为图2中步骤204的得到事故异质网络的种子节点的另一实施例的流程示意图;
图6为图2中步骤204的生成基于种子节点的节点路径的一实施例的流程示意图;
图7为图2中步骤212的流程示意图;
图8为图2中步骤216的流程示意图;
图9为一实施例中事故异质网络的示意图;
图10为一实施例中种子节点的最终社群的示意图;
图11为一实施例中同质网络的示意图;
图12为一实施例中社群节点网络的示意图;
图13为一实施例中种子节点的最终社群在事故异质网络中的示意图;
图14为一实施例中以查勘员为种子节点得到的同质网络;
图15为一实施例中典型欺诈社群的结构的示意图;
图16为基于异质网络的社群划分装置的示意图;
图17为一个实施例中计算机设备的示意图。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
为了使本申请的目的、技术方案及优点更加清楚明白,下面结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的基于异质网络的社群划分方法,可以应用于如图1所示的应用环境中。其中,该应用环境可以包括终端102、网络106以及服务端104,网络106用于在终端102和服务端104之间提供通信链路介质,网络106可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端102通过网络106与服务端104交互,以接收或发送消息等。终端102上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端102可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts Group AudioLayer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts GroupAudio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务端104可以是提供各种服务的服务器,例如对终端102上显示的页面提供支持的后台服务器。
需要说明的是,本申请实施例所提供的基于异质网络的社群划分方法一般由服务端/终端执行,相应地,基于异质网络的社群划分装置一般设置于服务端/终端设备中。
应该理解,图1中的终端、网络和服务端的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
其中,终端102通过网络与服务端104进行通信。服务器104通过在终端102获取预设事故节点,然后基于事故节点之间的事故相关度构建事故异质网络,并确定种子节点,根据种子节点生成的节点路径对事故异质网络进行切分,得到社群节点网络;再通过根据同质网络的权重得到种子节点网络的关系权重,基于带关系权重的种子节点网络对种子节点进行最终社群的划分,最后通过种子节点的最终社群与其邻居节点的相似度划分除种子节点外的预设事故节点完成节点的社群划分。其中,终端102和服务端104之间通过网络进行连接,该网络可以是有线网络或者无线网络,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务端104可以用独立的服务器或者是多个组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种基于异质网络的社群划分方法,以该方法应用于图1中的服务端为例进行说明,包括以下步骤:
步骤202,构建基于预设事故节点的事故异质网络。
预设事故节点的类型至少为2类,比如车辆与驾驶员、电脑与电脑使用者、房屋与房屋所有者等等,一般与同一事件相关的各种节点之间具有直接或者间接的联系。本申请以一个具体实施例解释所要公开的技术方案。比如,以车险欺诈案件为具体应用场景。
业务经验表明,多车欺诈案件通常具有以下特点:
1.多辆车在不同案件中发生碰撞而形成环路;
2.发生同一起事故的多辆车在历史案件中有相同驾驶员进行操作;
3.案件查勘员本人与维修厂存在利益联系;
4.查勘员与车辆驾驶员存在联系;
5.欺诈案件容易指向同一种出险原因。
基于上述需求,本实施例可以引入5类节点:车辆(A)、驾驶员(B)、维修厂(C)、查勘员(D)和出险原因(E),6类关系:多车事故关系(A-A)、驾驶员-车辆关系(B-A)、维修厂-车辆关系(C-A)、查勘员-维修厂关系(D-C)、查勘员-车辆关系(D-A)、事故原因-车辆关系(E-A),基于上述预设事故节点完成事故异质网络构建,作为事故异质网络,如图9所示,图中A1、A2、……、A7代表不同的车辆,B1、B2、B3、B4……代表不同的驾驶员,其他以此类推,不再赘述。
当然存在符合上述节点关系的场景,也可以通过本实施例将此场景的数据节点引入作为预设事故节点,其中,预设事故节点的数量一般根据具体应用场景而定,并没有具体设定的数值。
一般,创建事故异质网络的样本数据可以是用户报案的案号所对应的数据库中的各个节点数据。每一个报案号关联预设事故节点的数据信息,比如包括车辆的车牌号、驾驶证证件号、维修厂的地址编号以及查勘员的工作证号等等,这些节点之间相互联系,对这些节点数据进行结构化处理后,存储到预设的数据库中,构建事故异质网络时,从预设数据库中获取案件号所对应的节点数据,按照节点与节点之间的关联生成节点-节点-节点这种多节点连接的事故异质网络。一般节点与节点之间的连接是依靠节点与节点之间的关系确定的,若车辆与驾驶员存在被驾驶与驾驶的关系,则说明节点A与节点B可以连接起来,以此类推,数个节点生成的事故异质网络是十分庞大的。
步骤204,根据预设种子条件对预设事故节点进行筛选,得到事故异质网络的种子节点,并生成基于种子节点的节点路径;
节点路径可以根据预设元路径长度得到。元路径长度是指在事故异质网络中从一个种子节点到另一个种子节点所需要走的最大步数。若元路径长度为2,节点路径可以是如图9所示的事故异质节点中的任何不大于2的节点路径,比如:A-A、A-B-A、A-C-A、A-D-A以及A-E-A。以上五种节点路径所需要元路径长度皆不大于2。
预设种子条件为:若某一预设事故节点与车险欺诈案件的直接关联则将此预设事故节点设为种子节点。比如事故车辆直接与车险欺诈案件直接相关,则可以选取车辆为本实施例的种子节点。其中,本实施例所说的选取一个预设事故节点是说从事故异质网络中选取同一类型的预设事故节点,作为种子节点,比如选取车辆A这个预设事故节点为种子节点。而非选取车辆A中的任意一个Ai作为种子节点。
比如,车险欺诈案件的首要因素是车辆,通过车辆节点可以直接通过一度关系串联到其它所有节点,在分析时可减少算法复杂度,例如若以驾驶员为种子节点,则分析维修厂信息时,需要通过B到A再到C的二度关系才能定位信息,而若以车辆A为种子节点,可直接通过A-C分析。其中,一度关系的意思是两个节点是否直接关联,直接关联则说明两个节点之间的关系是一度关系。
可选地,预设种子条件还可以是从算法性能的角度采用元路径切分网络时,选取具有最小的计算复杂度的预设事故节点作为种子节点。
比如,现在种子节点网络计算时间是t,如果选择驾驶员D作为种子节点,那么在切分网络时,对于B类节点,需要从D开始,先经过A,再到B,即D-A-B-D,而原先为A-B-A,所以如果从A到B平均有k个关系,那么现在网络的计算时间就是kt,扩大了k倍。算法本身可以自动尝试将所有类型节点分别作为种子节点,通过计算时长选取运行时间最短的节点作为种子节点。
步骤206,根据节点路径对事故异质网络进行切分,得到同质网络。
元路径切分方式为在事故异质网络中获取以节点种子节点i开始到种子节点j结束的节点路径,其中,需要设定种子节点i到种子节点j之间的元路径长度p的节点路径,一般通过该方式获得的节点路径的数量为多个。比如A-A、A-B-A、A-C-A或者A-D-A,都是属于节点路径,都可以作为元路径切分方式对事故异质网络切分的基础。
具体地,通过上述方式切分可以得到不包括异质节点信息的同质网络,即只包括节点路径A-A的网络,其中不包括异质节点信息;还可以得到包括异质节点信息的同质网络,包括A-B-A、A-C-A、A-D-A或者A-E-A,即,在从种子节点Ai出发需要经过一个异质节点B、C、D或者E到达另一个种子节点Aj,这样就会在种子节点Ai与种子节点Aj之间生成一条边的网络,例如种子节点A3通过异质节点B2到达种子节点A6,则在种子节点A3、A6之间就会生成一条边。此时该同质网络就包括了异质节点B的节点信息。
步骤208,对同质网络进行切分,得到社群节点网络,并为每一个社群节点网络中的种子节点标记所属社群的社群标签。
可以采用LPANNI_C算法对同质网络进行切分,LPANNI_C算法又叫基于邻居节点影响力的重叠社群划分算法;可以根据每个种子节点进行社群划分,并为社群中的种子标签打上其所属社群的社群标签;如图12所示,属于同一社群的种子节点构成一个社群节点网络,且该社群节点网络中至少包括一个种子节点,其中,图12里同一圆圈中的种子节点属于同一个社群。
步骤210,基于每一条边的两端皆为种子节点的条件从事故异质网络中筛选得到种子节点网络。
种子节点网络是从事故异质网络中筛选得到的。具体地,事故异质网络是由若干个边组成的,每一条边的两端都有一个节点,该节点可以是种子节点、也可以是非种子节点。本实施例可以使用两端皆是种子节点的边组成的网络这种限定从事故异质网络中筛选得到种子节点网络。
步骤212,根据社群节点网络计算种子节点网络中的种子节点对的权重,并根据权重设定种子节点网络的关系权重。
种子节点对是种子节点网络中一条边上的两个种子节点。根据基于社群的社群节点网络,对种子节点网络中的种子节点对分别进行计算权重的操作,并将在一条边上的两端的种子节点对在社群节点网络中计算出的权重进行叠加,取平均值作为种子节点网络的关系权重。
步骤214,对设定有关系权重的种子节点网络进行社群划分,得到种子节点的最终社群以及最终社群所对应的最终社群标签。
可以采用LPANNI_C算法对种子节点网络进行社群划分,划分的结果是得到种子节点的最终社群标签。
具体地,本实施例判定种子节点是否属于同一最终社群的方式是基于spark的graphx模块实现,判定两个种子节点属于同一社群的方式可以以种子节点网络为例,具体为:
同质网络在底层的数据存储包括两部分:一部分是关系表示部分,如A1赔偿A2(默认权重1),另一部分是节点属性。采用LPANNI_C算法对同质网络进行社群切分后,会为每个种子节点赋予其社群的标签集(如A属于标签号为1的社群)。如图10所示,若判断车辆Ai、Aj是否属于同一社群,可以计算Ai、Aj标签集的交集是否为空;例如A1和A2,Set(1)∩Set(1)=Set(1),说明A1和A2同属于社群1;对于A2和A4,Set(1)∩Set(2)=Set(),为空集,说明A2和A4不属于相同社群,其中,set(1)指A1的标签集,set(2)指A2的标签集。
Graphx模块中的triplets格式数据同时包含了关系信息和节点属性信息。对于每一个关系对(种子节点对),调用.srcAttr()可以获取赔偿车辆A即源节点A的标签集,调用.dstAttr()可获取被赔偿车辆A即目标节点A的标签集,若源节点A和目标节点A的标签集交集长度大于等于1,表示两者至少存在同一社群标签,即属于同一社群,则说明被赔偿车辆骗保的可能性过高。
步骤216,计算种子节点网络中每个种子节点的邻居节点与最终社群标签的相似度,并将最高相似度对应的最终社群标签作为邻居节点的最终社群。
对于每个包含带最终社群标签的种子节点i的异质节点j(邻居节点),可以将其视为一个节点对(i,j),比如节点对(A1,E1),若其中种子节点A1属于最终社群C1,且E1尚未被划分到最终社群中,需要设该节点对(i,j)的异质关系权重w11(默认为1),并计算器属于已划分的最终社群C1的相似度sim(ci,j),并将最高相似度对应的最终社群作为该邻居节点的最终社群,若最高相似度的数量为多个,说明该邻居节点对应多个最终社群,则可以为该邻居节点打上多个最终社群标签。
本实施例通过获取预设事故节点,然后基于事故节点之间的事故相关度构建事故异质网络,并确定种子节点,根据种子节点生成的节点路径对事故异质网络进行切分,得到基于社群的社群节点网络,社群节点网络中的每一个种子节点都被标记了其所属社群的社群标签;再通过同质网络的权重得到种子节点网络的关系权重,基于带关系权重的种子节点网络对种子节点进行最终社群的划分,最后通过种子节点的最终社群与其邻居节点的相似度划分除种子节点外的异质节点完成节点的最终社群的划分,使得为每一个预设事故节点划分社群,可以很好的分辨该事故节点所属的社群。
在一个实施例中,如图3所示,步骤202,包括:
步骤302,从事故数据库中获取预设事故节点。
事故数据库中保存有大量的不同事故的详细信息,比如车辆、车辆的驾驶人、车辆维修厂、查勘员等等,可以以编号的形式存储在数据库。其中,获取到的每一类的预设事故节点的数量至少为一个,且每一类预设事故节点的都需要获取。
步骤304,分析各预设事故节点之间的节点相关度。
预设事故节点间会节点相关度,比如某车辆与某驾驶员具有被驾驶与驾驶的关系、某车辆与某维修厂具有被维修与维修的关系,这种可以称作该车辆与该驾驶员具有一度关系,该车辆与该维修厂而具有一度关系;但是某车辆1的驾驶员也可能某车辆2具有一度关系,则该车辆1与车辆2则具备通过该驾驶员连接的二度关系。
步骤306,根据节点相关度生成事故异质网络。
将具有一度关系的两个节点直接连接,当节点数量足够多时,就构成了一个不同类型节点的构成的事故异质网络。创建事故异质网络的样本数据可以是用户报案的案号所对应的数据库中的各个节点数据。每一个报案号关联预设事故节点的数据信息,比如包括车辆的车牌号、驾驶证证件号、维修厂的地址编号以及查勘员的工作证号等等,这些节点之间相互联系,对这些节点数据进行结构化处理后,存储到预设的数据库中,构建事故异质网络时,从数据库中直接获取案件号所对应的节点数据,按照节点与节点之间的关联生成节点-节点-节点这种多节点连接的事故异质网络。一般节点与节点之间的连接是依靠节点与节点之间的关系确定的。比如,若车辆与驾驶员存在被驾驶与驾驶的关系,则说明节点A与节点B可以连接起来,以此类推,数个节点生成的事故异质网络是十分庞大的。
本实施例通过确定节点与节点之间的关系构建事故异质网络十分庞大,几乎可以囊括获取到的所有节点数据,庞大的网络也使得后续可以更快确定某一节点与事故异质网络中其他有社群中的节点是否具有关联,提高了社群划分识别的效率和准确率。
在一个实施例中,如图4所示,步骤204,还包括:
步骤402,获取预设事故节点与事故之间的事故相关度。
本实施例还可以从业务场景上进行考虑选取种子节点,比如将与事故具有事故相关度的节点作为种子节点,以保证该节点可以对接尽可能多的其他类型的节点。
步骤404,若事故相关度为预设事故节点与事故满足一度关系,则将预设事故节点作为种子节点,其中,一度关系为两个预设事故节点之间具有直接相关性。
事故相关度:比如,车辆A与参与了某事故,但是车辆A的驾驶员B1并非该事故中驾驶车辆A的驾驶员B2,那么车辆A的权重就比驾驶员B1的权重高。
本实施例通过节点与事故的关系确定种子节点,保证种子节点与尽可能多的异质节点具有相关性,保证后续对事故异质网络的切分效率。
在一个实施例中,如图5所示,步骤204,包括:
步骤502,将预设事故节点作为预设种子节点。
本实施例中有五类预设事故节点,将其中某一类预设事故节点作为预设种子节点,比如将车辆A作为预设种子节点。
步骤504,根据预设种子节点设定预设元路径长度,并根据预设元路径长度生成基于预设种子节点的预设节点路径。
预设元路径是一条包含关系序列的路径,而这些关系定义在不同类型节点之间。元路径长度是以同一类型的节点进行路径查找,可以得到首尾节点都是同一类型节点的节点路径,当元路径长度为2,种子节点为A时,其中一条节点路径为:A-B-A,车辆-驾驶员-车辆。
步骤506,根据预设节点路径对事故异质网络进行切分,得到每一个预设种子节点的切分时长。
在一个事故异质网络中获取种子节点i、种子节点j之间符合元路径长度p的路径长度p的节点路径,一般获得的节点路径的数量为多个。
若以车辆A为种子节点,则可以得到以下节点路径:A-A、A-B-A、A-C-A、A-D-A、A-E-A。通过该方式得到的节点路径,以事故异质网络为基础可以生成只包括车辆A类节点的预设同质网络,然后计算切分完成后总的切分时长,并将切分时长最短的预设种子节点作为种子节点。
步骤508,将最短切分时长所对应的预设种子节点,作为种子节点。
最短切分时长说明将该预设事故节点作为预设种子节点进行元路径切分时拥有最小的计算复杂度,比如同质网络的计算时间为t,若以查勘员D作为种子节点,那么在切分网络时,对于B驾驶员B类节点需要从D开始计算,先经过A,再到B,即D-A-B-D,而以车辆A为种子节点是A-B-A;所以如果从A到B均有K个关系,那么现在切分网络的计算时间就是Kt,扩大了K倍。
本实施例通过预先自动尝试将所有类型的节点作为预设种子节点通过计算时长选取运行时间最短的节点作为种子节点,保证了事故异质网络的切分效率。
在一个实施例中,如图6所示,步骤204,还包括:
步骤602,设定元路径长度,其中,元路径长度为节点路径所经过的最大步数。
元路径是一条包含关系序列的路径,而这些关系定义在不同类型节点之间。元路径长度是以同一类型的节点进行路径查找,可以得到首尾节点都是同一类型节点的节点路径。
本实施例可以将元路径长度设置为2,那么就可以通过元路径切分方式在一个事故异质网络中获取节点i,节点j之间符合元路径长度p的路径长度p的节点路径,一般获得的节点路径的数量为多个。比如,若以车辆A为种子节点,则可以得到以下节点路径:A-A、A-B-A、A-C-A、A-D-A、A-E-A。
步骤604,获取步数不超过元路径长度的所有基于种子节点的节点路径,其中,节点路径为事故异质网络中两个种子节点组成的路径。
节点路径是在一个异质网络中符合种子节点i,种子节点j之间符合元路径长度p的路径。通过以上得到的节点路径,以事故异质网络为基础可以生成只包括车辆A类节点的同质网络。其中,每一条边上包括一个源节点A和一个目标节点A,也可以理解成,每一个同质网络中都至少包括一条这样的边。
对如图9的事故异质网络进行切分后,可以得到如图11中11-1到11-5的同质网络。
其中,图11-1为A-A类同质网络,该同质网络中不包括异质节点信息,表示从A类节点出发直接到达A类节点的子网络,此时该网络中只包括A类节点的信息。
图11-2为子网络A-B-A,表示从A类节点的Ai出发,会经过B类节点再到达A类节点的Aj节点,那么就可以在节点Ai、Aj之间生成一条边的子网络,例如A3-B2-A6,那么在A3、A6之间生成一条边。但是也有A-B这类情况,可以直接将其视作与A-B-A同类的子网络作为同质网络。其中,对于A-B-A类同质网络中的A1,是指在进行元路径切分选取只走了1个步数得到的网络,A-D-A网络中的A1同理。
同理,对于A-C-A,如图11-3所示,该子网络包含异质节点C的信息,具体为:C1在A1-A2之间、A1-A3之间以及A2-A3之间,C2在A4-A6之间,C3在A5-A7之间。
对于A-D-A,该子网络包含异质节点D的信息,如图11-4所示。
对于A-E-A,该子网络包含异质节点E的信息,如图11-5所示。
通过本实施例通过节点路径对事故异质网络进行切分,将具有相关性的种子节点切分为一类同质网络,便于后续社群的划分。
在一个实施例中,如图7所示,步骤212,包括:
可以通过公式(1)得到每一种子节点对的权重:
其中,β为包括异质节点信息的同质网络的网络层数,wij k为第k层同质网络的权重值。
步骤702,获取包括异质节点信息的同质网络,作为权重计算网络。
包括异质节点信息的同质网络是除A-A类同质网络之外的同质网络,该类同质网络中包含异质节点信息B、C、D或者E中的一种。
步骤704,设置权重计算网络的权重值。
本实施例对于第k层包含异质节点信息的同质网络,可以将其默认权重值wij k设为1。
步骤706,根据社群节点网络中种子节点的社群标签计算种子节点网络中两个种子节点属于同一社群的相似值。
步骤708,根据权重值、相似值计算权重计算网络中每一种子节点对的权重,并根据权重设定关系权重。
以节点对A1、A2为例,在种子节点网络中这两点同属于一个社群的同质网络有A-A、A-C-A、A-D-A,故:
同理,可以计算出其他节点对的权重,然后将总的权重相加后叠加到种子节点网络上的种子节点对上,作为种子节点网络的关系权重。
本实施例根据同一条边上的种子节点对属于统一社群标签的相似值获得种子节点网络的关系权重,关系权重从一定程度上反映出种子节点的属于哪一个或多个最终社群的程度,对基于待关系权重的种子节点网络进行社群划分能够得到每一个种子节点的最终社群标签,提高种子节点社群划分的准确度。
在一个实施例中,如图8所示,步骤216,包括:
步骤802,获取与种子节点具有一度关系的异质节点作为种子节点的邻居节点,并将种子节点以及种子节点的邻居节点作为异质节点对,其中,种子节点包括所述最终社群标签。
步骤804,计算邻居节点属于异质节点对中种子节点的最终社群标签的相似度。
异质节点是种子节点外的预设事故节点,比如B、C、D、E。
已为种子节点划分最终社群的示意图如图13所示:
黑色圈中的种子节点为同一社群,其中,对于每个邻居节点包含带最终社群标签节点i的异质节点j,意思是异质节点对中有一个已经带有社群标签,另一个没有标签。如异质节点对(A1,E1),其中种子节点A1属于社群1,而E1还没有打标签,则可以设异质节点对的异质关系i、j权重为wij(默认为1),通过公式(2)计算其属于已划分社群ci的相似度sim(ci,j)为:
这里Ng(j)表示异质节点j的种子邻居节点i,例如,E1的种子邻居节点为A1,B2的种子邻居节点有A3、A6。
选取相似度最大的最终社群标签作为该异质节点j的标签,若最大值对应多个最终社群,则说明该异质节点属于重叠社群;例如E1到社群1的sim值为1,到社群2的sim值为0,所以E1应该打上社群1的标签;B2到两个社群均有两条边,sim值均为2,所以B2同时属于两个社群,即重叠社群,应对该节点打上两个社群标签。
进一步地,对于不与种子节点直接相连的异质节点,例如节点F通过节点D到达节点A,而节点F与节点A不相连(A是种子节点),那么节点D要先根据节点A计算得到其最终社群标签,然后节点F再根据节点D的最终社群标签计算标签,此时节点F的已划分社群不仅包含通过LPANNI_C得到的A类节点,也包括D类节点的产生标签。
通过这种方式对邻居节点进行打标签,将其归类到对应的标签下。
进一步地,还需要判断事故异质网络中是否仍然存在没有最终社群标签的节点,若仍然存在,则重复根据相似度将异质节点划分到对应的最终社群标签下的步骤。直到所有的异质节点都划分完毕为止。
如图14所示的以查勘员为种子节点得到的同质网络,在车险场景下,查勘员、车辆、维修厂之间通过隐蔽关系形成欺诈。例如:查勘员与某一车辆关联,同时出现在不同时间段的案件中;查勘员在负责的历史案件中,倾向于前往同一家维修厂;查勘员在历史案件中包含同一辆车,且查勘员与该辆车同时与某一家汽车维修厂相连。考虑车辆、查勘员、维修厂、驾驶员等节点信息,构建事故异质网络进行检测。如图15所示,通过本实施例的异质网络切分技术可以将图14的关系网络划分为多个独立的社群。
本实施例可将原先的关系网络划分成多个独立的社群(去掉社群标号不一样的边,如图15所示),如图15中所示的典型欺诈社群的结构,分析人与可直接据此排查切分后的社群中是否具有相似的结构,即可筛选出异常的群体。比如查到节点A1有在其他欺诈事件中出现,则A1本次的事故是欺诈案件的可能性比较大。如果有多次重叠,则可以将A1划分到异常群体中进行标记。其中,图15中,set(1)指A1、A2的社群标签集,set(2)指A4、A5、A6、A7的社群标签集。应该理解的是,虽然图2-图8的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-图8中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图16所示,提供了一种基于异质网络的社群划分装置,该基于异质网络的社群划分装置与上述实施例中基于异质网络的社群划分方法一一对应。该基于异质网络的社群划分装置包括:
网络构建模块1602,用于构建基于预设事故节点的事故异质网络。
路径生成模块1604,用于根据预设种子条件对预设事故节点进行筛选,得到事故异质网络的种子节点,并生成基于种子节点的节点路径。
同质切分模块1606,用于根据节点路径对事故异质网络进行切分,得到同质网络。
社群切分模块1608,用于对同质网络进行切分,得到社群节点网络,并为么一个社群节点网络中的种子节点标记所属社群的社群标签。
网络筛选模块1610,用于基于每一条边的两端皆为种子节点的条件从事故异质网络中筛选得到种子节点网络。
权重叠加模块1612,用于根据社群节点网络计算种子节点网络中的种子节点对的权重,并根据权重设定种子节点网络的关系权重。
标签生成模块1614,用于对设定有关系权重的种子节点网络进行社群划分,得到种子节点的最终社群以及最终社群所对应的最终社群标签。
异质划分模块1616,用于计算种子节点网络中每个种子节点的邻居节点与最终社群标签的相似度,并将最高相似度对应的最终社群标签作为邻居节点的最终社群。
进一步地,网络构建模块1602,包括:
节点获取子模块,用于从事故数据库中获取预设事故节点。
关系分析子模块,用于分析各预设事故节点之间的节点相关度。
网络构建子模块,用于根据节点相关度生成事故异质网络。
进一步地,路径生成模块1604,包括:
相关度获取子模块,用于获取预设事故节点与事故之间的事故相关度。
种子节点确认子模块,用于若事故相关度为预设事故节点与事故满足一度关系,则将预设事故节点作为种子节点,其中,一度关系为两个预设事故节点之间具有直接相关性。
进一步地,路径生成模块1604,还包括:
预设子模块,用于将预设事故节点作为预设种子节点。
预设路径生成子模块,用于根据预设种子节点设定预设元路径长度,并根据预设元路径长度生成基于预设种子节点的预设节点路径。
预设划分子模块,用于根据预设节点路径对事故异质网络进行切分,得到每一个预设种子节点的切分时长。
种子节点确认子模块,还用于将最短切分时长所对应的预设种子节点,作为种子节点。
进一步地,路径生成模块1604,还包括:
长度设定子模块,用于设定元路径长度,其中,元路径长度为节点路径所经过的最大步数。
路径获取子模块,用于获取步数不超过元路径长度的所有基于种子节点的节点路径,其中,节点路径为事故异质网络中两个种子节点组成的路径。
进一步地,同质网络中还包括:包括异质节点信息的同质网络和不包括异质节点信息的同质网络,其中,权重叠加模块1612,包括:
网络获取子模块,用于获取包括异质节点信息的同质网络,作为权重计算网络。
权重设置子模块,用于设置权重计算网络的权重值。
相似计算子模块,用于根据社群节点网络中种子节点的社群标签计算种子节点网络中两个种子节点属于同一社群的相似值。
权重叠加子模块,用于根据权重值、相似值计算权重计算网络中每一种子节点对的权重,并根据权重设定关系权重。
进一步地,异质划分模块1616,包括:
邻居确定子模块,用于获取与种子节点具有一度关系的异质节点作为种子节点的邻居节点,并将种子节点以及种子节点的邻居节点作为异质节点对,其中,种子节点包括最终社群标签。
相似确认子模块,用于计算邻居节点属于异质节点对中种子节点的最终社群标签的相似度。
上述基于异质网络的社群划分装置,通过获取预设事故节点,然后基于事故节点之间的事故相关度构建事故异质网络,并确定种子节点,根据种子节点生成的节点路径对事故异质网络进行切分,得到基于社群的社群节点网络;再通过根据同质网络的权重得到种子节点网络的关系权重,基于带关系权重的种子节点网络对种子节点进行最终社群的划分,最后通过种子节点的最终社群与其邻居节点的相似度划分除种子节点外的预设事故节点完成节点的社群划分。容易丢失异质节点间信息,导致社群划分效果不理想的技术问题。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图17所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储用户订单数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于异质网络的社群划分方法。通过获取预设事故节点,然后基于事故节点之间的事故相关度构建事故异质网络,并确定种子节点,根据种子节点生成的节点路径对事故异质网络进行切分,得到基于社群的社群节点网络;再通过根据同质网络的权重得到种子节点网络的关系权重,基于带关系权重的种子节点网络对种子节点进行最终社群的划分,最后通过种子节点的最终社群与其邻居节点的相似度划分除种子节点外的预设事故节点完成节点的社群划分。容易丢失异质节点间信息,导致社群划分效果不理想的技术问题。
其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
本领域技术人员可以理解,图17中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例中基于异质网络的社群划分方法的步骤,例如图2所示的步骤202至步骤216,或者,处理器执行计算机程序时实现上述实施例中基于异质网络的社群划分装置的各模块/单元的功能,例如图16所示模块1602至模块1616的功能。为避免重复,此处不再赘述。通过获取预设事故节点,然后基于事故节点之间的事故相关度构建事故异质网络,并确定种子节点,根据种子节点生成的节点路径对事故异质网络进行切分,得到基于社群的社群节点网络;再通过根据同质网络的权重得到种子节点网络的关系权重,基于带关系权重的种子节点网络对种子节点进行最终社群的划分,最后通过种子节点的最终社群与其邻居节点的相似度划分除种子节点外的预设事故节点完成节点的社群划分。容易丢失异质节点间信息,导致社群划分效果不理想的技术问题。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形、改进或者对部分技术特征进行等同替换,而这些修改或者替换,并不使相同技术方案的本质脱离本发明个实施例技术方案地精神和范畴,都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种基于异质网络的社群划分方法,其特征在于,所述方法包括:
构建基于预设事故节点的事故异质网络;
根据预设种子条件对所述预设事故节点进行筛选,得到所述事故异质网络的种子节点,并生成基于所述种子节点的节点路径;
根据所述节点路径对所述事故异质网络进行切分,得到同质网络;
对所述同质网络进行社群切分,得到社群节点网络,并为每一个所述社群节点网络中的种子节点标记所属社群的社群标签;
基于每一条边的两端皆为种子节点的条件从所述事故异质网络筛选得到种子节点网络;
根据所述社群节点网络计算所述种子节点网络中每一条边上的种子节点对的权重,并根据所述权重设定所述种子节点网络的关系权重;
对设定有所述关系权重的种子节点网络进行社群划分,得到所述种子节点的最终社群以及最终社群所对应的最终社群标签;
计算所述种子节点网络中每个所述种子节点的邻居节点与所述最终社群标签的相似度,并将最高所述相似度对应的最终社群标签作为所述邻居节点的最终社群。
2.根据权利要求1所述的方法,其特征在于,所述构建基于预设事故节点的事故异质网络,包括:
从事故数据库中获取所述预设事故节点;
分析各所述预设事故节点之间的节点相关度;
根据所述节点相关度生成所述事故异质网络。
3.根据权利要求2所述的方法,其特征在于,所述根据预设种子条件对所述预设事故节点进行筛选,得到所述事故异质网络的种子节点,包括:
获取所述预设事故节点与事故之间的事故相关度;
若所述事故相关度为所述预设事故节点与所述事故满足一度关系,则将所述预设事故节点作为所述种子节点,其中,所述一度关系为两个预设事故节点之间具有直接相关性。
4.根据权利要求1所述的方法,其特征在于,所述根据预设种子条件对所述预设事故节点进行筛选,得到所述事故异质网络的种子节点,包括:
将所述预设事故节点作为预设种子节点;
根据所述预设种子节点设定预设元路径长度,并根据所述预设元路径长度生成基于所述预设种子节点的预设节点路径;
根据所述预设节点路径对所述事故异质网络进行切分,得到每一个所述预设种子节点的切分时长;
将最短所述切分时长所对应的预设种子节点,作为所述种子节点。
5.根据权利要求1所述的方法,其特征在于,所述生成基于所述种子节点的节点路径,包括:
设定元路径长度,其中,所述元路径长度为节点路径所经过的最大步数;
获取步数不超过所述元路径长度的所有基于所述种子节点的节点路径,其中,所述节点路径为所述事故异质网络中两个种子节点组成的路径。
6.根据权利要求1所述的方法,其特征在于,所述同质网络为包括异质节点信息的同质网络;所述根据所述社群节点网络计算所述种子节点网络中的种子节点对的权重,并根据所述权重设定所述种子节点网络的关系权重,包括:
获取包括所述异质节点信息的同质网络,作为权重计算网络;
设置所述权重计算网络的权重值;
根据所述社群节点网络中种子节点的社群标签,计算所述种子节点网络中两个种子节点属于同一社群的相似值;
根据所述权重值、所述相似值计算所述权重计算网络中每一种子节点对的权重,并根据所述权重设定所述关系权重。
7.根据权利要求6所述的方法,其特征在于,所述计算每个所述种子节点的邻居节点与所述最终社群标签的相似度,包括:
获取与所述种子节点具有一度关系的所述异质节点作为所述种子节点的邻居节点,并将所述种子节点以及所述种子节点的邻居节点作为异质节点对,其中,所述种子节点包括所述最终社群标签;
计算所述邻居节点属于所述异质节点对中所述种子节点的最终社群标签的相似度。
8.一种基于异质网络的社群划分装置,其特征在于,包括:
网络构建模块,用于构建基于预设事故节点的事故异质网络;
路径生成模块,用于根据预设种子条件对所述预设事故节点进行筛选,得到所述事故异质网络的种子节点,并生成基于所述种子节点的节点路径;
同质切分模块,用于根据所述节点路径对所述事故异质网络进行切分,得到同质网络;
社群切分模块,用于对所述同质网络进行社群切分,得到社群节点网络,并为每一社群节点网络中的种子节点标记所属社群的社群标签;
网络筛选模块,用于基于每一条边的两端皆为种子节点的条件从事故异质网络中筛选得到种子节点网络;
权重叠加模块,用于根据所述社群节点网络计算所述种子节点网络中的种子节点对的权重,并根据所述权重设定所述种子节点网络的关系权重;
标签生成模块,用于对设定有所述关系权重的种子节点网络进行社群划分,得到所述种子节点的最终社群以及最终社群所对应的最终社群标签;
异质划分模块,用于计算所述种子节点网络中每个所述种子节点的邻居节点与所述最终社群标签的相似度,并将最高所述相似度对应的最终社群标签作为所述邻居节点的最终社群。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010356642.0A CN111641518A (zh) | 2020-04-29 | 2020-04-29 | 基于异质网络的社群划分方法、装置、计算机设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010356642.0A CN111641518A (zh) | 2020-04-29 | 2020-04-29 | 基于异质网络的社群划分方法、装置、计算机设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111641518A true CN111641518A (zh) | 2020-09-08 |
Family
ID=72330972
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010356642.0A Pending CN111641518A (zh) | 2020-04-29 | 2020-04-29 | 基于异质网络的社群划分方法、装置、计算机设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111641518A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112966910A (zh) * | 2021-02-24 | 2021-06-15 | 深圳大学 | 一种供需网络社团结构挖掘方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9749406B1 (en) * | 2013-03-13 | 2017-08-29 | Hrl Laboratories, Llc | System and methods for automated community discovery in networks with multiple relational types |
US20170286190A1 (en) * | 2016-03-31 | 2017-10-05 | International Business Machines Corporation | Structural and temporal semantics heterogeneous information network (hin) for process trace clustering |
CN107743070A (zh) * | 2016-08-12 | 2018-02-27 | 华为技术有限公司 | 一种双属性网络的社群划分方法及装置 |
CN108734479A (zh) * | 2018-04-12 | 2018-11-02 | 阿里巴巴集团控股有限公司 | 保险欺诈识别的数据处理方法、装置、设备及服务器 |
CN109816535A (zh) * | 2018-12-13 | 2019-05-28 | 中国平安财产保险股份有限公司 | 欺诈识别方法、装置、计算机设备及存储介质 |
CN110334264A (zh) * | 2019-06-27 | 2019-10-15 | 北京邮电大学 | 一种针对异构动态信息网络的社区检测方法及装置 |
CN110674183A (zh) * | 2019-08-23 | 2020-01-10 | 上海科技发展有限公司 | 科研社群划分及核心学者发现方法、系统、介质及终端 |
-
2020
- 2020-04-29 CN CN202010356642.0A patent/CN111641518A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9749406B1 (en) * | 2013-03-13 | 2017-08-29 | Hrl Laboratories, Llc | System and methods for automated community discovery in networks with multiple relational types |
US20170286190A1 (en) * | 2016-03-31 | 2017-10-05 | International Business Machines Corporation | Structural and temporal semantics heterogeneous information network (hin) for process trace clustering |
CN107743070A (zh) * | 2016-08-12 | 2018-02-27 | 华为技术有限公司 | 一种双属性网络的社群划分方法及装置 |
CN108734479A (zh) * | 2018-04-12 | 2018-11-02 | 阿里巴巴集团控股有限公司 | 保险欺诈识别的数据处理方法、装置、设备及服务器 |
CN109816535A (zh) * | 2018-12-13 | 2019-05-28 | 中国平安财产保险股份有限公司 | 欺诈识别方法、装置、计算机设备及存储介质 |
CN110334264A (zh) * | 2019-06-27 | 2019-10-15 | 北京邮电大学 | 一种针对异构动态信息网络的社区检测方法及装置 |
CN110674183A (zh) * | 2019-08-23 | 2020-01-10 | 上海科技发展有限公司 | 科研社群划分及核心学者发现方法、系统、介质及终端 |
Non-Patent Citations (4)
Title |
---|
MEILIAN LU;等: "LPANNI: Overlapping Community Detection Using Label Propagation in Large-Scale Complex Networks", 《 IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING》 * |
YUDI YANG;等: "Meta Path-Based Information Entropy for Modeling Social Influence in Heterogeneous Information Networks", 《 2019 20TH IEEE INTERNATIONAL CONFERENCE ON MOBILE DATA MANAGEMENT (MDM)》 * |
蒋宗礼;陈浩强;张津丽;: "基于融合元路径权重的异质网络表征学习", 计算机系统应用, no. 12 * |
郑玉艳;王明省;石川;王锐;: "异质信息网络中基于元路径的社团发现算法研究", 中文信息学报, no. 09 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112966910A (zh) * | 2021-02-24 | 2021-06-15 | 深圳大学 | 一种供需网络社团结构挖掘方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200342006A1 (en) | Higher-Order Graph Clustering | |
CN107577710B (zh) | 基于异构信息网络的推荐方法及装置 | |
Lima et al. | Domain knowledge integration in data mining using decision tables: case studies in churn prediction | |
CN112116155A (zh) | 基于智能决策的人口流动预测方法、装置及计算机设备 | |
CN112101169A (zh) | 基于注意力机制的道路图像目标检测方法及相关设备 | |
CN111985622A (zh) | 一种图神经网络训练方法和系统 | |
CN112989059A (zh) | 潜在客户识别方法及装置、设备及可读计算机存储介质 | |
CN112288572B (zh) | 业务数据处理方法及计算机设备 | |
CN112231416B (zh) | 知识图谱本体更新方法、装置、计算机设备及存储介质 | |
CN111626311B (zh) | 一种异构图数据处理方法和装置 | |
CN113643532B (zh) | 一种区域交通的预测方法以及设备 | |
CN111461164A (zh) | 样本数据集的扩容方法及模型的训练方法 | |
CN112529100A (zh) | 多分类模型的训练方法、装置、电子设备及存储介质 | |
CN110796269A (zh) | 一种生成模型的方法、装置、信息处理的方法及装置 | |
CN112383436B (zh) | 一种网络监控的方法和装置 | |
CN114880566A (zh) | 基于图神经网络的用户行为分析方法、装置、设备及介质 | |
CN111709415A (zh) | 目标检测方法、装置、计算机设备和存储介质 | |
WO2023000261A1 (zh) | 一种区域交通的预测方法以及设备 | |
CN113108806B (zh) | 路径规划方法、装置、设备及介质 | |
CN111641518A (zh) | 基于异质网络的社群划分方法、装置、计算机设备及介质 | |
CN113674152A (zh) | 图像处理方法、装置、电子设备和计算机可读存储介质 | |
CN111143568A (zh) | 一种论文分类时的缓冲方法、装置、设备及存储介质 | |
US20170330055A1 (en) | Sequential data analysis apparatus and program | |
CN114662009A (zh) | 一种基于图卷积的工业互联网工厂协同推荐算法 | |
CN112749005B (zh) | 资源数据处理方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |