CN111401775A

CN111401775A - 复杂关系网络的信息分析方法、装置、设备及存储介质

Info

Publication number: CN111401775A
Application number: CN202010226311.5A
Authority: CN
Inventors: 赵世泉
Original assignee: OneConnect Financial Technology Co Ltd Shanghai
Current assignee: OneConnect Financial Technology Co Ltd Shanghai
Priority date: 2020-03-27
Filing date: 2020-03-27
Publication date: 2020-07-10
Also published as: WO2021189729A1

Abstract

本发明涉及大数据领域，公开了一种复杂关系网络的信息分析方法、装置、设备及存储介质，用于增强对社区群组风险的识别和把控能力。复杂关系网络的信息分析方法包括：对待分析的复杂关系网络进行网络拓扑结构的划分获得社区以及社区信息；对社区信息进行线性降维处理得到社区特征，根据社区特征得到社区特征向量；计算每两个社区特征向量之间的目标相似度，根据目标相似度确定候选社区信息；获得目标社区信息，根据目标社区信息生成社区加权图；获取社区加权图中的待评估社区、加权风险值以及待评估社区的风险值，通过预置标签传播算法分析加权风险值以更新待评估社区的风险值，通过更新后的风险值获得待评估社区的风险程度和对于风险的识别度。

Description

复杂关系网络的信息分析方法、装置、设备及存储介质

技术领域

本发明涉及风险管控领域，尤其涉及一种复杂关系网络的信息分析方法、装置、设备及存储介质。

背景技术

社区发现是一种复杂关系网络进行群组识别的高效方法，许多高效的社区发现算法已被提出和运用。在反欺诈领域，社区发现算法的应用也是十分广泛，特别是在欺诈群组识别方向上。通过社区发现算法对复杂关系网络进行社区划分，对社区划分所得的社区进行风险传播和风险分析，得到社区的风险值。

在现有的技术中，由于对复杂关系网络中的风险传播往往局限在有实际联系的实体之间，仅对复杂关系网络中有实际联系的实体所划分的分析社区进行风险传播和风险分析，无法对于在复杂关系网络中不是相邻的但是具有与分析社区相同或相似特征的关联社区之间进行关联的风险值分析，而对于具有与分析社区相同或相似特征的关联社区来说，具有较大的社区风险事件的发生概率，对分析社区的风险分析具有较大影响，因而，导致对社区群组风险的识别和把控能力弱。

发明内容

本发明的主要目的在于解决对社区群组风险的识别和把控能力弱的问题。

本发明第一方面提供了一种复杂关系网络的信息分析方法，包括：

获取待分析的复杂关系网络，通过预置算法对所述复杂关系网络进行网络拓扑结构的划分，获得社区以及每个所述社区对应的社区信息；

对所述社区信息进行线性降维处理得到社区特征，对所述社区特征进行词向量转换处理，得到社区特征向量；

计算每两个社区特征向量之间的目标相似度，根据所述目标相似度确定候选社区信息；

对所述候选社区信息进行风险值标记得到目标社区信息，将所述目标社区信息和所述目标相似度填充至预置的领接表，根据所述领接表生成社区加权图，所述领接表用于指示所述社区加权图的数据域所对应的指针数组；

获取所述社区加权图中的待评估社区、加权风险值以及所述待评估社区的风险值，通过预置标签传播算法分析所述加权风险值以更新所述待评估社区的风险值，通过更新后的风险值获得所述待评估社区的风险程度和对于风险的识别度，所述加权风险值用于指示与所述待评估社区连接或相邻的社区的风险值乘以所述目标相似度后的值。

可选的，在本发明第一方面的第一种实现方式中，所述对所述候选社区信息进行风险值标记得到目标社区信息，将所述目标社区信息和所述相似度填充至预置的领接表，根据所述领接表生成社区加权图，包括：

对所述候选社区信息进行风险评估得到风险值，建立所述风险值与所述候选社区信息的对应关系，将建立对应关系的候选社区信息作为目标社区信息；

将所述目标社区信息中的任意一个目标社区信息作为第一社区信息，将所述目标社区信息中除所述第一社区信息之外的目标社区信息作为第二社区信息，获取所述第一社区信息对应的社区特征向量与所述第二社区信息对应的社区特征向量之间的目标相似度；

按照所述第一社区信息对应的社区特征向量与所述第二社区信息对应的社区特征向量之间的目标相似度的值从大到小对所述第一社区信息和所述第二社区信息进行排序，获得排序信息；

将所述第一社区信息对应的社区作为节点，根据所述排序信息依次将所述第二社区信息对应的社区作为所述节点的连接节点，将所述目标相似度作为连接两个社区的弧上的标记权重值；

将所述节点、所述连接节点和所述标记权重值存储至预置的领接表中，对所述领接表进行图像元素转换得到社区加权图。

可选的，在本发明第一方面的第二种实现方式中，所述获取所述社区加权图中的待评估社区、加权风险值以及所述待评估社区的风险值，通过预置标签传播算法分析所述加权风险值以更新所述待评估社区的风险值，通过更新后的风险值获得所述待评估社区的风险程度和对于风险的识别度，包括：

获取待评估需求，根据所述待评估需求遍历所述社区加权图，获得符合所述待评估需求的待评估社区以及所述待评估社区的风险值；

将所述待评估社区作为起始节点，根据所述起始节点对所述社区加权图进行随机游走，获得序列数据；

获取并标记所述序列数据中与所述起始节点连接的节点对应的社区，以及在目标社区中获取并标记与所述起始节点相邻的节点对应的社区，得到周边社区，所述目标社区用于指示所述序列数据中不与所述起始节点连接的节点对应的社区；

读取所述周边社区标记的风险值和所述标记权重值，计算所述风险值和所述标记权重值的乘积，将所述乘积作为所述周边社区的加权风险值；

将所述加权风险值代入预置标签传播算法的预设计算策略中进行计算，得到更新后的风险值，通过更新后的风险值获得所述待评估社区的风险程度和对于风险的识别度，所述预设计算策略包括累加型计算策略、最值型计算策略和众举型计算策略中的至少一种，以及预设加权比值计算策略。

可选的，在本发明第一方面的第三种实现方式中，所述将所述加权风险值代入预置标签传播算法的预设计算策略中进行计算，得到更新后的风险值，通过更新后的风险值获得所述待评估社区的风险程度和对于风险的识别度，包括：

根据所述累加型计算策略将所述加权风险值进行累加求和计算，得到第一风险值；或者，根据所述最值型计算策略按照值从大到小的顺序对所述加权风险值进行排序，将排序为第一顺位的加权风险值作为第二风险值；或者，根据众举型计算策略赋予所述加权风险值新的权重值，按照值从大到小的顺序对所述新的权重值进行排序，将所述新的权重值排序为第一顺位的加权风险值作为第三风险值；

根据所述预设加权比值计算策略计算所述第一风险值、所述第二风险值和第三风险值中的至少一项的加权值，将所述加权值作为所述待评估社区的更新后的风险值，通过更新后的风险值获得所述待评估社区的风险程度和对于风险的识别度。

可选的，在本发明第一方面的第四种实现方式中，在所述获取所述社区加权图中的待评估社区、加权风险值以及所述待评估社区的风险值，通过预置标签传播算法分析所述加权风险值以更新所述待评估社区的风险值，通过更新后的风险值获得所述待评估社区的风险程度和对于风险的识别度之后，还包括：

通过预置的聚类算法对所述目标风险值进行聚类分析，得到预警风险类别，根据所述预警风险类别和所述目标风险值从历史存储的历史策略方案中获取对应的目标策略方案，建立所述预警风险类别、所述目标策略方案和所述目标风险值三者之间的关联关系。

可选的，在本发明第一方面的第五种实现方式中，所述计算每两个社区特征向量之间的目标相似度，根据所述目标相似度确定候选社区信息，包括：

计算每两个社区特征向量之间的目标相似度，将所述每两个社区特征向量之间的目标相似度生成矩阵，得到相似度矩阵；

对所述相似度矩阵中每个元素的值与预设阈值进行对比分析，获得每个元素的值均大于预设阈值的目标相似度矩阵，将所述目标相似矩阵对应的社区信息作为候选社区信息。

可选的，在本发明第一方面的第六种实现方式中，所述获取待分析的复杂关系网络，通过预置算法对所述复杂关系网络进行网络拓扑结构的划分，获得社区以及每个所述社区对应的社区信息，包括：

获取业务信息和所述业务信息中的业务需求，根据所述业务需求获得对应的复杂关系网络；

获取所述复杂关系网络中的社区群组性质；

通过社区发现算法和所述社区群组性质对所述复杂关系网络进行网络拓扑结构的划分，得到社区；

获取所述复杂关系网络中的信息，通过分类算法对所述复杂关系网络中的信息进行社区分类，得到每个所述社区对应的社区信息，所述复杂关系网络中的信息包括网络拓扑结构信息和/或基于无监督学习算法学习到的指定维度的样本信息。

本发明第二方面提供了一种复杂关系网络的信息分析装置，包括：

第一获取模块，用于获取待分析的复杂关系网络，通过预置算法对所述复杂关系网络进行网络拓扑结构的划分，获得社区以及每个所述社区对应的社区信息；

处理模块，用于对所述社区信息进行线性降维处理得到社区特征，对所述社区特征进行词向量转换处理，得到社区特征向量；

计算模块，用于计算每两个社区特征向量之间的目标相似度，根据所述目标相似度确定候选社区信息；

生成模块，用于对所述候选社区信息进行风险值标记得到目标社区信息，将所述目标社区信息和所述目标相似度填充至预置的领接表，根据所述领接表生成社区加权图，所述领接表用于指示所述社区加权图的数据域所对应的指针数组；

第二获取模块，用于获取所述社区加权图中的待评估社区、加权风险值以及所述待评估社区的风险值，通过预置标签传播算法分析所述加权风险值以更新所述待评估社区的风险值，通过更新后的风险值获得所述待评估社区的风险程度和对于风险的识别度，所述加权风险值用于指示与所述待评估社区连接或相邻的社区的风险值乘以所述目标相似度后的值。

可选的，在本发明第二方面的第一种实现方式中，所述生成模块具体用于：

可选的，在本发明第二方面的第二种实现方式中，所述第二获取模块包括：

第一获取单元，用于获取待评估需求，根据所述待评估需求遍历所述社区加权图，获得符合所述待评估需求的待评估社区以及所述待评估社区的风险值；

第二获取单元，用于将所述待评估社区作为起始节点，根据所述起始节点对所述社区加权图进行随机游走，获得序列数据；

第三获取单元，用于获取并标记所述序列数据中与所述起始节点连接的节点对应的社区，以及在目标社区中获取并标记与所述起始节点相邻的节点对应的社区，得到周边社区，所述目标社区用于指示所述序列数据中不与所述起始节点连接的节点对应的社区；

第一计算单元，用于读取所述周边社区标记的风险值和所述标记权重值，计算所述风险值和所述标记权重值的乘积，将所述乘积作为所述周边社区的加权风险值；

第二计算单元，用于将所述加权风险值代入预置标签传播算法的预设计算策略中进行计算，得到更新后的风险值，通过更新后的风险值获得所述待评估社区的风险程度和对于风险的识别度，所述预设计算策略包括累加型计算策略、最值型计算策略和众举型计算策略中的至少一种，以及预设加权比值计算策略。

可选的，在本发明第二方面的第三种实现方式中，所述第二计算单元具体用于：

可选的，在本发明第二方面的第四种实现方式中，所述复杂关系网络的信息分析装置还包括：

分析模块，用于通过预置的聚类算法对所述目标风险值进行聚类分析，得到预警风险类别，根据所述预警风险类别和所述目标风险值从历史存储的历史策略方案中获取对应的目标策略方案，建立所述预警风险类别、所述目标策略方案和所述目标风险值三者之间的关联关系。

可选的，在本发明第二方面的第五种实现方式中，所述计算模块具体用于：

可选的，在本发明第二方面的第六种实现方式中，所述第一获取模块具体用于：

获取所述复杂关系网络中的社区群组性质；

本发明第三方面提供了一种复杂关系网络的信息分析设备，包括：存储器和至少一个处理器，所述存储器中存储有指令，所述存储器和所述至少一个处理器通过线路互连；所述至少一个处理器调用所述存储器中的所述指令，以使得所述复杂关系网络的信息分析设备执行上述的复杂关系网络的信息分析方法。

本发明的第四方面提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述的复杂关系网络的信息分析方法。

本发明提供的技术方案中，对待分析的复杂关系网络进行网络拓扑结构的划分，获得社区以及社区信息；对社区信息进行线性降维处理得到社区特征，根据社区特征得到社区特征向量；计算每两个社区特征向量之间的目标相似度，根据目标相似度确定候选社区信息；获得目标社区信息，根据目标社区信息生成社区加权图；获取社区加权图中的待评估社区、加权风险值以及待评估社区的风险值，通过预置标签传播算法分析加权风险值以更新待评估社区的风险值，通过更新后的风险值获得待评估社区的风险程度和对于风险的识别度。本发明中，通过将传统复杂关系网络中社区特征作为中间变量，在复杂关系网络的基础上重新构建新的社区加权图，以将原本没有关联的社区群体进行相似度关联，并采用标签传播算法对社区加权图进行风险识别，获得无关联社区的传播风险值，实现了对无关联社区之间的风险传播情况进行分析，增强了对社区群组风险的识别和把控能力。

附图说明

图1为本发明实施例中复杂关系网络的信息分析方法的一个实施例示意图；

图2为本发明实施例中复杂关系网络的信息分析方法的另一个实施例示意图；

图3为本发明实施例中复杂关系网络的信息分析装置的一个实施例示意图；

图4为本发明实施例中复杂关系网络的信息分析装置的另一个实施例示意图；

图5为本发明实施例中复杂关系网络的信息分析设备的一个实施例示意图。

具体实施方式

本发明实施例提供了一种复杂关系网络的信息分析方法、装置、设备及存储介质，通过将传统复杂关系网络中社区特征作为中间变量，在复杂关系网络的基础上重新构建新的社区加权图，以将原本没有关联的社区群体进行相似度关联，并采用标签传播算法对社区加权图进行风险识别，获得无关联社区的传播风险值，实现了对无关联社区之间的风险传播情况进行分析，增强了对社区群组风险的识别和把控能力。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外，术语“包括”或“具有”及其任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

为便于理解，下面对本发明实施例的具体流程进行描述，请参阅图1，本发明实施例中复杂关系网络的信息分析方法的一个实施例包括：

101、获取待分析的复杂关系网络，通过预置算法对复杂关系网络进行网络拓扑结构的划分，获得社区以及每个社区对应的社区信息；

服务器从数据库中读取已存储的复杂关系网络后，通过社区发现算法对该复杂关系网络进行网络拓扑结构的划分，或者服务器也可以通过预设的划分条件和分类算法对该复杂关系网络进行分群，该划分条件包括但不限于用户所处地的安全系数和用户数量，获得社区以及每个社区对应的社区信息。其中，社区信息可包括但不限于社区节点信息和社区关联信息，社区节点信息包括社区的用户信息和用户关联信息，社区关联信息包括社区中的用户之间的关联信息和社区之间的关联信息。

具体地，上述步骤101可以包括：获取业务信息和业务信息中的业务需求，根据业务需求获得对应的复杂关系网络；获取复杂关系网络中的社区群组性质；通过社区发现算法和社区群组性质对复杂关系网络进行网络拓扑结构的划分，得到社区；获取复杂关系网络中的信息，通过分类算法对复杂关系网络中的信息进行社区分类，得到每个社区对应的社区信息，复杂关系网络中的信息包括网络拓扑结构信息和/或基于无监督学习算法学习到的指定维度的样本信息。其中，服务器以哈希表的形式存储历史复杂关系网络信息，该历史复杂关系网络信息与业务需求建立有对应关系。服务器创建业务需求的哈希值，通过哈希值检索哈希表，从哈希表(即历史复杂关系网络信息)中获取哈希值(即业务需求)对应的复杂关系网络。服务器通过哈希表读取存储的复杂关系网络，以提高读取的效率和准确性。通过社区发现算法根据社区群组性质对复杂关系网络进行网络拓扑结构的划分，以便于将无关联的两个群组通过社区的形式直接或者间接的关联起来，以及准确而有效地将强关联和弱关联两个群组进行划分和组合。

可以理解的是，本发明的执行主体可以为复杂关系网络的信息分析装置，还可以是终端或者服务器，具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。

102、对社区信息进行线性降维处理得到社区特征，对社区特征进行词向量转换处理，得到社区特征向量；

服务器获得社区信息后，通过由特征提取模型和自然语言处理词向量模型组合而成的机器学习模型对社区信息进行特征提取，获得特征信息，该特征信息为高维数据，对特征信息进行线性投影到低维的空间中，得到社区特征，以较少的数据维度保留住较多的社区信息中的特征，对社区特征进行词向量转换处理，得到社区特征向量，社区特征向量为由多个社区对应的特征向量组合一起二成的多维数据。其中，社区特征向量可为网络拓扑结构指标向量，网络拓扑结构指标向量包括最大度数向量、平均度数向量、最大相关系数向量和平均相关系数的向量；社区特征向量也可为基于无监督学习算法学习到的指定维度的特征向量。

103、计算每两个社区特征向量之间的目标相似度，根据目标相似度确定候选社区信息；

服务器通过计算余弦相似度算法或计算欧氏距离的相似性度量算法计算每两个社区特征向量之间的目标相似度，目标相似度包括多个相似度，计算各个相似度的值与预设阈值的差值，对社区信息进行筛选，获取说是所有差值均大于或者等于0所对应的社区信息，得到候选社区信息。例如：甲社区特征向量包括社区特征向量1、社区特征向量2和社区特征向量3，乙社区特征向量包括社区特征向量4、社区特征向量5和社区特征向量6，对应地分别计算各甲社区特征向量与各乙社区特征向量之间的相似度，分别得到相似度14、相似度25和相似度36，计算相似度14、相似度25和相似度36分别与预设阈值的差值，分别得到差值14、差值25和差值36，差值14、差值25和差值36均大于或者等于0，则甲社区特征向量对应的甲社区信息以及乙社区特征向量对应的乙社区信息为候选社区信息。

具体地，上述步骤103可以包括：计算每两个社区特征向量之间的目标相似度，将每两个社区特征向量之间的目标相似度生成矩阵，得到相似度矩阵；对相似度矩阵中每个元素的值与预设阈值进行对比分析，获得每个元素的值均大于预设阈值的目标相似度矩阵，将目标相似矩阵对应的社区信息作为候选社区信息。服务器通过计算余弦相似度或计算欧氏距离的相似性度量算法计算每两个社区特征向量之间的目标相似度，得到多个相似度值，将多个相似度组合生成一个n×n维的相似度对称矩阵M，相似度矩阵中M的元素M_ij表示社区c_i和所述社区c_j之间的相似度，服务器根据专家规则或机器学习算法等来预先设置一个预设阈值，该预设阈值可为一个矩阵，相似度矩阵中的每个元素值对应预设阈值进行比较；该预设阈值也可为一个数值，相似度矩阵中的每个元素值均与该预设阈值进行比较。通过分析相似度矩阵中的每个元素值是否均大于预设阈值来对社区信息进行筛选，获得候选社区信息。

104、对候选社区信息进行风险值标记得到目标社区信息，将目标社区信息和目标相似度填充至预置的领接表，根据领接表生成社区加权图，领接表用于指示构造社区加权图的数据域所对应的指针数组；

服务器对候选社区信息进行风险评估，得到风险值，该风险评估的类型由业务需求确定，将该风险值标记在候选社区信息上，得到目标社区信息，将目标社区信息对应的社区作为顶点，以该目标社区信息对应的社区与其他的社区的目标相似度的值作为权重值，并以该权重值标记在连接该目标社区信息对应的社区与其他的目标社区信息对应的社区的连接边上，将该顶点和标记权重值以指针数组形式存储在领接表中，通过将领接表转换为无向图或有向图，从而得到一个标记权重值的社区加权图，其中，社区加权图的领接表是社区加权图的所有节点(即目标社区信息对应的社区)的邻接表的集合，而对每个节点的邻接表就是它的所有出弧(包括目标社区信息对应的社区、该社区与其他社区的连接指向，以及弧上的标记权重值)。

具体地，上述步骤104可以包括：对候选社区信息进行风险评估得到风险值，建立风险值与候选社区信息的对应关系，将建立对应关系的候选社区信息作为目标社区信息；将目标社区信息中的任意一个目标社区信息作为第一社区信息，将目标社区信息中除第一社区信息之外的目标社区信息作为第二社区信息，获取第一社区信息对应的社区特征向量与第二社区信息对应的社区特征向量之间的目标相似度；按照第一社区信息对应的社区特征向量与第二社区信息对应的社区特征向量之间的目标相似度的值从大到小对第一社区信息和第二社区信息进行排序，获得排序信息；将第一社区信息对应的社区作为节点，根据排序信息依次将第二社区信息对应的社区依次作为节点的连接节点，将目标相似度作为连接两个社区的弧上的标记权重值；将节点、连接节点和标记权重值存储至预置的领接表中对应的存储空间，对领接表进行图像元素转换得到社区加权图。

服务器通过将目标社区信息对应的社区连接起来，并标记其对应的目标相似度，构建新图(即社区加权图)，以使得在复杂关系网络中没有关联的社区之间进行网络拓扑结构相似度关联起来，从而实现无关联社区之间的风险传播，例如：在复杂关系网络中，甲社区和乙社区的地理位置关系上两者之间不存在关联，但是甲社区的网络拓扑结构和乙社区的网络拓扑结构相同或相似，则通过根据网络拓扑结构构建社区加权图将甲社区和乙社区关联起来。其中，通过按照值从大到小进行排序的目标相似度来连接社区，以便于后续对社区之间的风险传播以及提高其操作效率。通过将相似度作为权重值，以便于后续对于社区的风险值的加权求值，从而保证风险值的质量和准确性。

105、获取社区加权图中的待评估社区、加权风险值以及待评估社区的风险值，通过预置的标签传播算法分析加权风险值以更新待评估社区的风险值，通过更新后的风险值获得待评估社区的风险程度和对于风险的识别度，加权风险值用于指示与待评估社区连接或相邻的社区的风险值乘以相似度后的值。

服务器通过业务信息中的业务需求从社区加权图中选中待评估社区，以待评估社区为开始节点对社区加权图进行随机游走，得到多个序列数据，对多个序列数据进行筛选，获得与待评估社区连接或在预设相邻范围的周边社区，通过标签传播算法对周边社区进行风险传播，即对周边社区的加权风险值进行分析以更新待评估社区的风险值，根据更新后的风险值获取危险源，危险源为更新后的风险值对应风险类型的风险事件可能导致人员伤害和(或)健康损害和(或)财产损失的根源、状态和/或行为，对更新后的风险值进行等级划分得到风险等级，对危险源进行危险指数评估，得到危险指数，遍历预置的风险判断表，根据风险判断表中的风险等级、危险源和危险指数获得待评估社区的风险程度、对于风险的识别度和把控度，其中，识别度为对社区各风险类型所造成的风险程度的辨识度，把控度为对社区各风险类型所生成的风险的管控力度，识别度和把控度可用数值表示，也可用高中低的程度词表示，例如：当风险等级为8级，危险源为环境恶劣状态，危险指数为红色时，识别度为高，把控度为低。待评估社区与周边社区之间的风险传播遵循一个原则：每两个社区特征向量之间的相似度的值越大的两个社区之间对应的风险结果也越相似，即某个社区的风险值会向着与它的网络拓扑结构最相似的社区进行传播，不管这两个社区在复杂关系网络中是否相邻，只要这两个社区在社区加权图中的网络拓扑结构相似，那么就可以依据网络拓扑结构的相似度进行风险的传播，以对待评估社区待评估社区对于风险的识别度和把控度进行评估。随着社区之间的网络拓扑结构的不断变化，对应的风险值可能会随之逐渐消除或者会随之逐渐增加，即待评估社区对于风险的识别度和把控度随之逐渐减弱或随之逐渐增强，风险值的消除或增加决于与待评估社区的网络拓扑结构相似的其他社区的风险程度。

具体地，上述步骤105可以包括：获取待评估需求，根据待评估需求遍历社区加权图，获得符合待评估需求的待评估社区以及待评估社区的风险值；将待评估社区作为起始节点，根据起始节点对社区加权图进行随机游走，获得序列数据；获取并标记序列数据中与起始节点连接的节点对应的社区，以及在目标社区中获取并标记与起始节点相邻的节点对应的社区，得到周边社区，目标社区用于指示序列数据中不与起始节点连接的节点对应的社区；读取周边社区标记的风险值和标记权重值，计算风险值和标记权重值的乘积，将乘积作为周边社区的加权风险值；将加权风险值代入预置标签传播算法的预设计算策略中进行计算，得到更新后的风险值，通过更新后的风险值获得待评估社区的风险程度和对于风险的识别度，预设计算策略包括累加型计算策略、最值型计算策略和众举型计算策略中的至少一种，以及预设加权比值计算策略。其中，目标社区信息中标记有风险值，待评估社区的风险值即为待评估社区对应的目标社区信息中所标记的风险值。服务器通过以累加型计算策略、最值型计算策略和众举型计算策略中的至少一种，以及预设加权比值计算策略的预设计算策略(即预置标签传播算法)对社区加权图进行风险传播，将每个社团的风险性质(即风险值)作为标签传播出去，从而实现特征相似的社区之间的风险传播(即将通过预设计算策略对待评估社区的邻居节点的风险值进行计算所得的风险值作为待评估社区的目标风险值)，进一步对未达到表现期的社区进行提取风险预警和识别。通过按照预设计算策略获取待评估社区的目标风险值，以快速而准确地获取与待评估社区有群组关联关系或者无群组关联关系的社区之间的风险传播值，从而无联系的两个社区之间的风险传播得到识别和分析。

具体地，上述的将加权风险值代入预置标签传播算法的预设计算策略中进行计算，得到更新后的风险值，通过更新后的风险值获得待评估社区的风险程度和对于风险的识别度可以包括：根据累加型计算策略将加权风险值进行累加求和计算，得到第一风险值；或者，根据最值型计算策略按照值从大到小的顺序对加权风险值进行排序，将排序为第一顺位的加权风险值作为第二风险值；或者，根据众举型计算策略赋予加权风险值新的权重值，按照值从大到小的顺序对新的权重值进行排序，将新的权重值排序为第一顺位的加权风险值作为第三风险值；根据预设加权比值计算策略按照预设加权比值计算第一风险值、第二风险值和第三风险值中的至少一项的加权值，将加权值作为待评估社区的更新后的风险值，通过更新后的风险值获得待评估社区的风险程度和对于风险的识别度。通过以累加型计算策略、最值型计算策略和众举型计算策略，以便于适应各种业务场景下的对于无联系的两个社区之间的风险传播的识别和分析，以及保证其识别和分析的质量。通过按照预设加权比值计算目标风险值，以提高目标风险值的准确性。

本发明实施例中，通过将传统复杂关系网络中社区特征作为中间变量，在复杂关系网络的基础上重新构建新的社区加权图，以将原本没有关联的社区群体进行相似度关联，并采用标签传播算法对社区加权图进行风险识别，获得无关联社区的传播风险值，实现了对无关联社区之间的风险传播情况进行分析，增强了对社区群组风险的识别和把控能力。

请参阅图2，本发明实施例中复杂关系网络的信息分析方法的另一个实施例包括：

201、获取待分析的复杂关系网络，对复杂关系网络进行网络拓扑结构的划分，获得社区以及每个社区对应的社区信息；

202、对社区信息进行线性降维处理得到社区特征，对社区特征进行词向量转换处理，得到社区特征向量；

203、计算每两个社区特征向量之间的目标相似度，根据目标相似度确定候选社区信息；

204、对候选社区信息进行风险值标记得到目标社区信息，将目标社区信息和目标相似度填充至预置的领接表，根据领接表生成社区加权图，领接表用于指示构造社区加权图的数据域所对应的指针数组；

205、获取社区加权图中的待评估社区、加权风险值以及待评估社区的风险值，通过预置的标签传播算法分析加权风险值以更新待评估社区的风险值，通过更新后的风险值获得待评估社区的风险程度和对于风险的识别度，加权风险值用于指示与待评估社区连接或相邻的社区的风险值乘以相似度后的值；

本发明实施例中，201至205的方法可参见101至105，此处不再赘述。

206、通过预置的聚类算法对目标风险值进行聚类分析，得到预警风险类别，根据预警风险类别和目标风险值从历史存储的历史策略方案中获取对应的目标策略方案，建立预警风险类别、目标策略方案和目标风险值三者之间的关联关系。

服务器通过K均值聚类或其他的聚类算法对目标风险值进行聚类分析获得与目标风险值的类型相同或类似或关联的风险类型(即预警风险类别)，创建预警风险类别的哈希值，通过哈希值对数据库中由历史存储的创建的历史策略方案的哈希表进行检索，获得哈希值相同或相似的候选策略方案，或者通过标签提取算法对历史存储的历史策略方案的标签信息进行风险类型提取得到分析风险类型，计算预警风险类别与分析风险类型的第一相似度，获得第一相似度最大对应的预警风险类别的候选策略方案，计算候选策略方案对应的候选风险值以及计算候选风险值与目标风险值的差值，获取差值最小对应的候选策略方案，并将差值最小对应的候选策略方案作为目标策略方案，建立预警风险类别、目标策略方案和目标风险值三者之间的关联关系，通过对预警风险类别和/或目标风险值进行检索，便可获取对应的目标策略方案。通过聚类算法对目标风险值进行聚类分析，获得与目标风险值的类型相同或类似或关联的预警风险类别，以使得在展示目标风险值时能展示所潜在和所需注意的危险因素，通过获得对应的策略方案，增加目标风险值的多角度信息。

本发明实施例中，在实现了对无关联社区之间的风险传播情况进行分析，增强了对社区群组风险的识别和把控能力的基础上，通过聚类算法对目标风险值进行聚类分析，获得与目标风险值的类型相同或类似或关联的预警风险类别，以使得在展示目标风险值时能展示所潜在和所需注意的危险因素，通过获得对应的策略方案，增加目标风险值的多角度信息。

上面对本发明实施例中复杂关系网络的信息分析方法进行了描述，下面对本发明实施例中复杂关系网络的信息分析装置进行描述，请参阅图3，本发明实施例中复杂关系网络的信息分析装置一个实施例包括：

第一获取模块301，用于获取待分析的复杂关系网络，通过预置算法对复杂关系网络进行网络拓扑结构的划分，获得社区以及每个社区对应的社区信息；

处理模块302，用于对社区信息进行线性降维处理得到社区特征，对社区特征进行词向量转换处理，得到社区特征向量；

计算模块303，用于计算每两个社区特征向量之间的目标相似度，根据目标相似度确定候选社区信息；

生成模块304，用于对候选社区信息进行风险值标记得到目标社区信息，将目标社区信息和目标相似度填充至预置的领接表，根据领接表生成社区加权图，领接表用于指示社区加权图的数据域所对应的指针数组；

第二获取模块305，用于获取社区加权图中的待评估社区、加权风险值以及待评估社区的风险值，通过预置标签传播算法分析加权风险值以更新待评估社区的风险值，通过更新后的风险值获得待评估社区的风险程度和对于风险的识别度，加权风险值用于指示与待评估社区连接或相邻的社区的风险值乘以目标相似度后的值。

请参阅图4，本发明实施例中复杂关系网络的信息分析装置的另一个实施例包括：

第二获取模块305，用于获取社区加权图中的待评估社区、加权风险值以及待评估社区的风险值，通过预置标签传播算法分析加权风险值以更新待评估社区的风险值，通过更新后的风险值获得待评估社区的风险程度和对于风险的识别度，加权风险值用于指示与待评估社区连接或相邻的社区的风险值乘以目标相似度后的值；

分析模块306，用于通过预置的聚类算法对目标风险值进行聚类分析，得到预警风险类别，根据预警风险类别和目标风险值从历史存储的历史策略方案中获取对应的目标策略方案，建立预警风险类别、目标策略方案和目标风险值三者之间的关联关系。

可选的，生成模块304还可以具体用于：对候选社区信息进行风险评估得到风险值，建立风险值与候选社区信息的对应关系，将建立对应关系的候选社区信息作为目标社区信息；将目标社区信息中的任意一个目标社区信息作为第一社区信息，将目标社区信息中除第一社区信息之外的目标社区信息作为第二社区信息，获取第一社区信息对应的社区特征向量与第二社区信息对应的社区特征向量之间的目标相似度；按照第一社区信息对应的社区特征向量与第二社区信息对应的社区特征向量之间的目标相似度的值从大到小对第一社区信息和第二社区信息进行排序，获得排序信息；将第一社区信息对应的社区作为节点，根据排序信息依次将第二社区信息对应的社区作为节点的连接节点，将目标相似度作为连接两个社区的弧上的标记权重值；将节点、连接节点和标记权重值存储至预置的领接表中，对领接表进行图像元素转换得到社区加权图。

可选的，第二获取模块305包括：第一获取单元3051，用于获取待评估需求，根据待评估需求遍历社区加权图，获得符合待评估需求的待评估社区以及待评估社区的风险值；第二获取单元3052，用于将待评估社区作为起始节点，根据起始节点对社区加权图进行随机游走，获得序列数据；第三获取单元3053，用于获取并标记序列数据中与起始节点连接的节点对应的社区，以及在目标社区中获取并标记与起始节点相邻的节点对应的社区，得到周边社区，目标社区用于指示序列数据中不与起始节点连接的节点对应的社区；第一计算单元3054，用于读取周边社区标记的风险值和标记权重值，计算风险值和标记权重值的乘积，将乘积作为周边社区的加权风险值；第二计算单元3055，用于将加权风险值代入预置标签传播算法的预设计算策略中进行计算，得到更新后的风险值，通过更新后的风险值获得待评估社区的风险程度和对于风险的识别度，预设计算策略包括累加型计算策略、最值型计算策略和众举型计算策略中的至少一种，以及预设加权比值计算策略。

可选的，第二计算单元3055还可以具体用于：根据累加型计算策略将加权风险值进行累加求和计算，得到第一风险值；或者，根据最值型计算策略按照值从大到小的顺序对加权风险值进行排序，将排序为第一顺位的加权风险值作为第二风险值；或者，根据众举型计算策略赋予加权风险值新的权重值，按照值从大到小的顺序对新的权重值进行排序，将新的权重值排序为第一顺位的加权风险值作为第三风险值；根据预设加权比值计算策略计算第一风险值、第二风险值和第三风险值中的至少一项的加权值，将加权值作为待评估社区的更新后的风险值，通过更新后的风险值获得待评估社区的风险程度和对于风险的识别度。

可选的，计算模块303还可以具体用于：计算每两个社区特征向量之间的目标相似度，将每两个社区特征向量之间的目标相似度生成矩阵，得到相似度矩阵；对相似度矩阵中每个元素的值与预设阈值进行对比分析，获得每个元素的值均大于预设阈值的目标相似度矩阵，将目标相似矩阵对应的社区信息作为候选社区信息。

可选的，第一获取模块301还可以具体用于：获取业务信息和业务信息中的业务需求，根据业务需求获得对应的复杂关系网络；获取复杂关系网络中的社区群组性质；通过社区发现算法和社区群组性质对复杂关系网络进行网络拓扑结构的划分，得到社区；获取复杂关系网络中的信息，通过分类算法对复杂关系网络中的信息进行社区分类，得到每个社区对应的社区信息，复杂关系网络中的信息包括网络拓扑结构信息和/或基于无监督学习算法学习到的指定维度的样本信息。

上面图3和图4从模块化功能实体的角度对本发明实施例中的复杂关系网络的信息分析装置进行详细描述，下面从硬件处理的角度对本发明实施例中复杂关系网络的信息分析设备进行详细描述。

图5是本发明实施例提供的一种复杂关系网络的信息分析设备的结构示意图，该复杂关系网络的信息分析设备500可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器(central processing units，CPU)510(例如，一个或一个以上处理器)和存储器520，一个或一个以上存储应用程序533或数据532的存储介质530(例如一个或一个以上海量存储设备)。其中，存储器520和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对复杂关系网络的信息分析设备500中的一系列指令操作。更进一步地，处理器510可以设置为与存储介质530通信，在复杂关系网络的信息分析设备500上执行存储介质530中的一系列指令操作。

复杂关系网络的信息分析设备500还可以包括一个或一个以上电源540，一个或一个以上有线或无线网络接口550，一个或一个以上输入输出接口560，和/或，一个或一个以上操作系统531，例如Windows Serve，Mac OS X，Unix，Linux，FreeBSD等等。本领域技术人员可以理解，图5示出的复杂关系网络的信息分析设备结构并不构成对复杂关系网络的信息分析设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

本发明还提供一种计算机可读存储介质，该计算机可读存储介质可以为非易失性计算机可读存储介质，该计算机可读存储介质也可以为易失性计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在计算机上运行时，使得计算机执行所述复杂关系网络的信息分析方法的步骤。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(read-only memory，ROM)、随机存取存储器(random access memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种复杂关系网络的信息分析方法，其特征在于，所述复杂关系网络的信息分析方法包括：

2.根据权利要求1所述的复杂关系网络的信息分析方法，其特征在于，所述对所述候选社区信息进行风险值标记得到目标社区信息，将所述目标社区信息和所述相似度填充至预置的领接表，根据所述领接表生成社区加权图，包括：

3.根据权利要求2所述的复杂关系网络的信息分析方法，其特征在于，所述获取所述社区加权图中的待评估社区、加权风险值以及所述待评估社区的风险值，通过预置标签传播算法分析所述加权风险值以更新所述待评估社区的风险值，通过更新后的风险值获得所述待评估社区的风险程度和对于风险的识别度，包括：

4.根据权利要求3所述的复杂关系网络的信息分析方法，其特征在于，所述将所述加权风险值代入预置标签传播算法的预设计算策略中进行计算，得到更新后的风险值，通过更新后的风险值获得所述待评估社区的风险程度和对于风险的识别度，包括：

5.根据权利要求1-4中任一项所述的复杂关系网络的信息分析方法，其特征在于，在所述获取所述社区加权图中的待评估社区、加权风险值以及所述待评估社区的风险值，通过预置标签传播算法分析所述加权风险值以更新所述待评估社区的风险值，通过更新后的风险值获得所述待评估社区的风险程度和对于风险的识别度之后，还包括：

6.根据权利要求1所述的复杂关系网络的信息分析方法，其特征在于，所述计算每两个社区特征向量之间的目标相似度，根据所述目标相似度确定候选社区信息，包括：

7.根据权利要求1所述的复杂关系网络的信息分析方法，其特征在于，所述获取待分析的复杂关系网络，通过预置算法对所述复杂关系网络进行网络拓扑结构的划分，获得社区以及每个所述社区对应的社区信息，包括：

获取所述复杂关系网络中的社区群组性质；

8.一种复杂关系网络的信息分析装置，其特征在于，所述复杂关系网络的信息分析装置包括：

9.一种复杂关系网络的信息分析设备，其特征在于，所述复杂关系网络的信息分析设备包括：存储器和至少一个处理器，所述存储器中存储有指令，所述存储器和所述至少一个处理器通过线路互连；

所述至少一个处理器调用所述存储器中的所述指令，以使得所述复杂关系网络的信息分析设备执行如权利要求1-7中任意一项所述的复杂关系网络的信息分析方法。

10.一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述复杂关系网络的信息分析方法。