CN111401775A - 复杂关系网络的信息分析方法、装置、设备及存储介质 - Google Patents
复杂关系网络的信息分析方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN111401775A CN111401775A CN202010226311.5A CN202010226311A CN111401775A CN 111401775 A CN111401775 A CN 111401775A CN 202010226311 A CN202010226311 A CN 202010226311A CN 111401775 A CN111401775 A CN 111401775A
- Authority
- CN
- China
- Prior art keywords
- community
- information
- risk
- risk value
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 75
- 239000013598 vector Substances 0.000 claims abstract description 89
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 66
- 238000000034 method Methods 0.000 claims abstract description 19
- 230000009467 reduction Effects 0.000 claims abstract description 10
- 238000004364 calculation method Methods 0.000 claims description 83
- 239000011159 matrix material Substances 0.000 claims description 31
- 238000012545 processing Methods 0.000 claims description 22
- 238000009825 accumulation Methods 0.000 claims description 17
- 230000002093 peripheral effect Effects 0.000 claims description 14
- 238000006243 chemical reaction Methods 0.000 claims description 12
- 238000011156 evaluation Methods 0.000 claims description 9
- 238000007635 classification algorithm Methods 0.000 claims description 6
- 238000005295 random walk Methods 0.000 claims description 5
- 238000012358 sourcing Methods 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims 1
- 238000002372 labelling Methods 0.000 claims 1
- 238000000638 solvent extraction Methods 0.000 claims 1
- 230000002708 enhancing effect Effects 0.000 abstract description 5
- 238000010586 diagram Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 238000012502 risk assessment Methods 0.000 description 3
- 230000006378 damage Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000012954 risk control Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Health & Medical Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及大数据领域,公开了一种复杂关系网络的信息分析方法、装置、设备及存储介质,用于增强对社区群组风险的识别和把控能力。复杂关系网络的信息分析方法包括:对待分析的复杂关系网络进行网络拓扑结构的划分获得社区以及社区信息;对社区信息进行线性降维处理得到社区特征,根据社区特征得到社区特征向量;计算每两个社区特征向量之间的目标相似度,根据目标相似度确定候选社区信息;获得目标社区信息,根据目标社区信息生成社区加权图;获取社区加权图中的待评估社区、加权风险值以及待评估社区的风险值,通过预置标签传播算法分析加权风险值以更新待评估社区的风险值,通过更新后的风险值获得待评估社区的风险程度和对于风险的识别度。
Description
技术领域
本发明涉及风险管控领域,尤其涉及一种复杂关系网络的信息分析方法、装置、设备及存储介质。
背景技术
社区发现是一种复杂关系网络进行群组识别的高效方法,许多高效的社区发现算法已被提出和运用。在反欺诈领域,社区发现算法的应用也是十分广泛,特别是在欺诈群组识别方向上。通过社区发现算法对复杂关系网络进行社区划分,对社区划分所得的社区进行风险传播和风险分析,得到社区的风险值。
在现有的技术中,由于对复杂关系网络中的风险传播往往局限在有实际联系的实体之间,仅对复杂关系网络中有实际联系的实体所划分的分析社区进行风险传播和风险分析,无法对于在复杂关系网络中不是相邻的但是具有与分析社区相同或相似特征的关联社区之间进行关联的风险值分析,而对于具有与分析社区相同或相似特征的关联社区来说,具有较大的社区风险事件的发生概率,对分析社区的风险分析具有较大影响,因而,导致对社区群组风险的识别和把控能力弱。
发明内容
本发明的主要目的在于解决对社区群组风险的识别和把控能力弱的问题。
本发明第一方面提供了一种复杂关系网络的信息分析方法,包括:
获取待分析的复杂关系网络,通过预置算法对所述复杂关系网络进行网络拓扑结构的划分,获得社区以及每个所述社区对应的社区信息;
对所述社区信息进行线性降维处理得到社区特征,对所述社区特征进行词向量转换处理,得到社区特征向量;
计算每两个社区特征向量之间的目标相似度,根据所述目标相似度确定候选社区信息;
对所述候选社区信息进行风险值标记得到目标社区信息,将所述目标社区信息和所述目标相似度填充至预置的领接表,根据所述领接表生成社区加权图,所述领接表用于指示所述社区加权图的数据域所对应的指针数组;
获取所述社区加权图中的待评估社区、加权风险值以及所述待评估社区的风险值,通过预置标签传播算法分析所述加权风险值以更新所述待评估社区的风险值,通过更新后的风险值获得所述待评估社区的风险程度和对于风险的识别度,所述加权风险值用于指示与所述待评估社区连接或相邻的社区的风险值乘以所述目标相似度后的值。
可选的,在本发明第一方面的第一种实现方式中,所述对所述候选社区信息进行风险值标记得到目标社区信息,将所述目标社区信息和所述相似度填充至预置的领接表,根据所述领接表生成社区加权图,包括:
对所述候选社区信息进行风险评估得到风险值,建立所述风险值与所述候选社区信息的对应关系,将建立对应关系的候选社区信息作为目标社区信息;
将所述目标社区信息中的任意一个目标社区信息作为第一社区信息,将所述目标社区信息中除所述第一社区信息之外的目标社区信息作为第二社区信息,获取所述第一社区信息对应的社区特征向量与所述第二社区信息对应的社区特征向量之间的目标相似度;
按照所述第一社区信息对应的社区特征向量与所述第二社区信息对应的社区特征向量之间的目标相似度的值从大到小对所述第一社区信息和所述第二社区信息进行排序,获得排序信息;
将所述第一社区信息对应的社区作为节点,根据所述排序信息依次将所述第二社区信息对应的社区作为所述节点的连接节点,将所述目标相似度作为连接两个社区的弧上的标记权重值;
将所述节点、所述连接节点和所述标记权重值存储至预置的领接表中,对所述领接表进行图像元素转换得到社区加权图。
可选的,在本发明第一方面的第二种实现方式中,所述获取所述社区加权图中的待评估社区、加权风险值以及所述待评估社区的风险值,通过预置标签传播算法分析所述加权风险值以更新所述待评估社区的风险值,通过更新后的风险值获得所述待评估社区的风险程度和对于风险的识别度,包括:
获取待评估需求,根据所述待评估需求遍历所述社区加权图,获得符合所述待评估需求的待评估社区以及所述待评估社区的风险值;
将所述待评估社区作为起始节点,根据所述起始节点对所述社区加权图进行随机游走,获得序列数据;
获取并标记所述序列数据中与所述起始节点连接的节点对应的社区,以及在目标社区中获取并标记与所述起始节点相邻的节点对应的社区,得到周边社区,所述目标社区用于指示所述序列数据中不与所述起始节点连接的节点对应的社区;
读取所述周边社区标记的风险值和所述标记权重值,计算所述风险值和所述标记权重值的乘积,将所述乘积作为所述周边社区的加权风险值;
将所述加权风险值代入预置标签传播算法的预设计算策略中进行计算,得到更新后的风险值,通过更新后的风险值获得所述待评估社区的风险程度和对于风险的识别度,所述预设计算策略包括累加型计算策略、最值型计算策略和众举型计算策略中的至少一种,以及预设加权比值计算策略。
可选的,在本发明第一方面的第三种实现方式中,所述将所述加权风险值代入预置标签传播算法的预设计算策略中进行计算,得到更新后的风险值,通过更新后的风险值获得所述待评估社区的风险程度和对于风险的识别度,包括:
根据所述累加型计算策略将所述加权风险值进行累加求和计算,得到第一风险值;或者,根据所述最值型计算策略按照值从大到小的顺序对所述加权风险值进行排序,将排序为第一顺位的加权风险值作为第二风险值;或者,根据众举型计算策略赋予所述加权风险值新的权重值,按照值从大到小的顺序对所述新的权重值进行排序,将所述新的权重值排序为第一顺位的加权风险值作为第三风险值;
根据所述预设加权比值计算策略计算所述第一风险值、所述第二风险值和第三风险值中的至少一项的加权值,将所述加权值作为所述待评估社区的更新后的风险值,通过更新后的风险值获得所述待评估社区的风险程度和对于风险的识别度。
可选的,在本发明第一方面的第四种实现方式中,在所述获取所述社区加权图中的待评估社区、加权风险值以及所述待评估社区的风险值,通过预置标签传播算法分析所述加权风险值以更新所述待评估社区的风险值,通过更新后的风险值获得所述待评估社区的风险程度和对于风险的识别度之后,还包括:
通过预置的聚类算法对所述目标风险值进行聚类分析,得到预警风险类别,根据所述预警风险类别和所述目标风险值从历史存储的历史策略方案中获取对应的目标策略方案,建立所述预警风险类别、所述目标策略方案和所述目标风险值三者之间的关联关系。
可选的,在本发明第一方面的第五种实现方式中,所述计算每两个社区特征向量之间的目标相似度,根据所述目标相似度确定候选社区信息,包括:
计算每两个社区特征向量之间的目标相似度,将所述每两个社区特征向量之间的目标相似度生成矩阵,得到相似度矩阵;
对所述相似度矩阵中每个元素的值与预设阈值进行对比分析,获得每个元素的值均大于预设阈值的目标相似度矩阵,将所述目标相似矩阵对应的社区信息作为候选社区信息。
可选的,在本发明第一方面的第六种实现方式中,所述获取待分析的复杂关系网络,通过预置算法对所述复杂关系网络进行网络拓扑结构的划分,获得社区以及每个所述社区对应的社区信息,包括:
获取业务信息和所述业务信息中的业务需求,根据所述业务需求获得对应的复杂关系网络;
获取所述复杂关系网络中的社区群组性质;
通过社区发现算法和所述社区群组性质对所述复杂关系网络进行网络拓扑结构的划分,得到社区;
获取所述复杂关系网络中的信息,通过分类算法对所述复杂关系网络中的信息进行社区分类,得到每个所述社区对应的社区信息,所述复杂关系网络中的信息包括网络拓扑结构信息和/或基于无监督学习算法学习到的指定维度的样本信息。
本发明第二方面提供了一种复杂关系网络的信息分析装置,包括:
第一获取模块,用于获取待分析的复杂关系网络,通过预置算法对所述复杂关系网络进行网络拓扑结构的划分,获得社区以及每个所述社区对应的社区信息;
处理模块,用于对所述社区信息进行线性降维处理得到社区特征,对所述社区特征进行词向量转换处理,得到社区特征向量;
计算模块,用于计算每两个社区特征向量之间的目标相似度,根据所述目标相似度确定候选社区信息;
生成模块,用于对所述候选社区信息进行风险值标记得到目标社区信息,将所述目标社区信息和所述目标相似度填充至预置的领接表,根据所述领接表生成社区加权图,所述领接表用于指示所述社区加权图的数据域所对应的指针数组;
第二获取模块,用于获取所述社区加权图中的待评估社区、加权风险值以及所述待评估社区的风险值,通过预置标签传播算法分析所述加权风险值以更新所述待评估社区的风险值,通过更新后的风险值获得所述待评估社区的风险程度和对于风险的识别度,所述加权风险值用于指示与所述待评估社区连接或相邻的社区的风险值乘以所述目标相似度后的值。
可选的,在本发明第二方面的第一种实现方式中,所述生成模块具体用于:
对所述候选社区信息进行风险评估得到风险值,建立所述风险值与所述候选社区信息的对应关系,将建立对应关系的候选社区信息作为目标社区信息;
将所述目标社区信息中的任意一个目标社区信息作为第一社区信息,将所述目标社区信息中除所述第一社区信息之外的目标社区信息作为第二社区信息,获取所述第一社区信息对应的社区特征向量与所述第二社区信息对应的社区特征向量之间的目标相似度;
按照所述第一社区信息对应的社区特征向量与所述第二社区信息对应的社区特征向量之间的目标相似度的值从大到小对所述第一社区信息和所述第二社区信息进行排序,获得排序信息;
将所述第一社区信息对应的社区作为节点,根据所述排序信息依次将所述第二社区信息对应的社区作为所述节点的连接节点,将所述目标相似度作为连接两个社区的弧上的标记权重值;
将所述节点、所述连接节点和所述标记权重值存储至预置的领接表中,对所述领接表进行图像元素转换得到社区加权图。
可选的,在本发明第二方面的第二种实现方式中,所述第二获取模块包括:
第一获取单元,用于获取待评估需求,根据所述待评估需求遍历所述社区加权图,获得符合所述待评估需求的待评估社区以及所述待评估社区的风险值;
第二获取单元,用于将所述待评估社区作为起始节点,根据所述起始节点对所述社区加权图进行随机游走,获得序列数据;
第三获取单元,用于获取并标记所述序列数据中与所述起始节点连接的节点对应的社区,以及在目标社区中获取并标记与所述起始节点相邻的节点对应的社区,得到周边社区,所述目标社区用于指示所述序列数据中不与所述起始节点连接的节点对应的社区;
第一计算单元,用于读取所述周边社区标记的风险值和所述标记权重值,计算所述风险值和所述标记权重值的乘积,将所述乘积作为所述周边社区的加权风险值;
第二计算单元,用于将所述加权风险值代入预置标签传播算法的预设计算策略中进行计算,得到更新后的风险值,通过更新后的风险值获得所述待评估社区的风险程度和对于风险的识别度,所述预设计算策略包括累加型计算策略、最值型计算策略和众举型计算策略中的至少一种,以及预设加权比值计算策略。
可选的,在本发明第二方面的第三种实现方式中,所述第二计算单元具体用于:
根据所述累加型计算策略将所述加权风险值进行累加求和计算,得到第一风险值;或者,根据所述最值型计算策略按照值从大到小的顺序对所述加权风险值进行排序,将排序为第一顺位的加权风险值作为第二风险值;或者,根据众举型计算策略赋予所述加权风险值新的权重值,按照值从大到小的顺序对所述新的权重值进行排序,将所述新的权重值排序为第一顺位的加权风险值作为第三风险值;
根据所述预设加权比值计算策略计算所述第一风险值、所述第二风险值和第三风险值中的至少一项的加权值,将所述加权值作为所述待评估社区的更新后的风险值,通过更新后的风险值获得所述待评估社区的风险程度和对于风险的识别度。
可选的,在本发明第二方面的第四种实现方式中,所述复杂关系网络的信息分析装置还包括:
分析模块,用于通过预置的聚类算法对所述目标风险值进行聚类分析,得到预警风险类别,根据所述预警风险类别和所述目标风险值从历史存储的历史策略方案中获取对应的目标策略方案,建立所述预警风险类别、所述目标策略方案和所述目标风险值三者之间的关联关系。
可选的,在本发明第二方面的第五种实现方式中,所述计算模块具体用于:
计算每两个社区特征向量之间的目标相似度,将所述每两个社区特征向量之间的目标相似度生成矩阵,得到相似度矩阵;
对所述相似度矩阵中每个元素的值与预设阈值进行对比分析,获得每个元素的值均大于预设阈值的目标相似度矩阵,将所述目标相似矩阵对应的社区信息作为候选社区信息。
可选的,在本发明第二方面的第六种实现方式中,所述第一获取模块具体用于:
获取业务信息和所述业务信息中的业务需求,根据所述业务需求获得对应的复杂关系网络;
获取所述复杂关系网络中的社区群组性质;
通过社区发现算法和所述社区群组性质对所述复杂关系网络进行网络拓扑结构的划分,得到社区;
获取所述复杂关系网络中的信息,通过分类算法对所述复杂关系网络中的信息进行社区分类,得到每个所述社区对应的社区信息,所述复杂关系网络中的信息包括网络拓扑结构信息和/或基于无监督学习算法学习到的指定维度的样本信息。
本发明第三方面提供了一种复杂关系网络的信息分析设备,包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;所述至少一个处理器调用所述存储器中的所述指令,以使得所述复杂关系网络的信息分析设备执行上述的复杂关系网络的信息分析方法。
本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的复杂关系网络的信息分析方法。
本发明提供的技术方案中,对待分析的复杂关系网络进行网络拓扑结构的划分,获得社区以及社区信息;对社区信息进行线性降维处理得到社区特征,根据社区特征得到社区特征向量;计算每两个社区特征向量之间的目标相似度,根据目标相似度确定候选社区信息;获得目标社区信息,根据目标社区信息生成社区加权图;获取社区加权图中的待评估社区、加权风险值以及待评估社区的风险值,通过预置标签传播算法分析加权风险值以更新待评估社区的风险值,通过更新后的风险值获得待评估社区的风险程度和对于风险的识别度。本发明中,通过将传统复杂关系网络中社区特征作为中间变量,在复杂关系网络的基础上重新构建新的社区加权图,以将原本没有关联的社区群体进行相似度关联,并采用标签传播算法对社区加权图进行风险识别,获得无关联社区的传播风险值,实现了对无关联社区之间的风险传播情况进行分析,增强了对社区群组风险的识别和把控能力。
附图说明
图1为本发明实施例中复杂关系网络的信息分析方法的一个实施例示意图;
图2为本发明实施例中复杂关系网络的信息分析方法的另一个实施例示意图;
图3为本发明实施例中复杂关系网络的信息分析装置的一个实施例示意图;
图4为本发明实施例中复杂关系网络的信息分析装置的另一个实施例示意图;
图5为本发明实施例中复杂关系网络的信息分析设备的一个实施例示意图。
具体实施方式
本发明实施例提供了一种复杂关系网络的信息分析方法、装置、设备及存储介质,通过将传统复杂关系网络中社区特征作为中间变量,在复杂关系网络的基础上重新构建新的社区加权图,以将原本没有关联的社区群体进行相似度关联,并采用标签传播算法对社区加权图进行风险识别,获得无关联社区的传播风险值,实现了对无关联社区之间的风险传播情况进行分析,增强了对社区群组风险的识别和把控能力。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中复杂关系网络的信息分析方法的一个实施例包括:
101、获取待分析的复杂关系网络,通过预置算法对复杂关系网络进行网络拓扑结构的划分,获得社区以及每个社区对应的社区信息;
服务器从数据库中读取已存储的复杂关系网络后,通过社区发现算法对该复杂关系网络进行网络拓扑结构的划分,或者服务器也可以通过预设的划分条件和分类算法对该复杂关系网络进行分群,该划分条件包括但不限于用户所处地的安全系数和用户数量,获得社区以及每个社区对应的社区信息。其中,社区信息可包括但不限于社区节点信息和社区关联信息,社区节点信息包括社区的用户信息和用户关联信息,社区关联信息包括社区中的用户之间的关联信息和社区之间的关联信息。
具体地,上述步骤101可以包括:获取业务信息和业务信息中的业务需求,根据业务需求获得对应的复杂关系网络;获取复杂关系网络中的社区群组性质;通过社区发现算法和社区群组性质对复杂关系网络进行网络拓扑结构的划分,得到社区;获取复杂关系网络中的信息,通过分类算法对复杂关系网络中的信息进行社区分类,得到每个社区对应的社区信息,复杂关系网络中的信息包括网络拓扑结构信息和/或基于无监督学习算法学习到的指定维度的样本信息。其中,服务器以哈希表的形式存储历史复杂关系网络信息,该历史复杂关系网络信息与业务需求建立有对应关系。服务器创建业务需求的哈希值,通过哈希值检索哈希表,从哈希表(即历史复杂关系网络信息)中获取哈希值(即业务需求)对应的复杂关系网络。服务器通过哈希表读取存储的复杂关系网络,以提高读取的效率和准确性。通过社区发现算法根据社区群组性质对复杂关系网络进行网络拓扑结构的划分,以便于将无关联的两个群组通过社区的形式直接或者间接的关联起来,以及准确而有效地将强关联和弱关联两个群组进行划分和组合。
可以理解的是,本发明的执行主体可以为复杂关系网络的信息分析装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。
102、对社区信息进行线性降维处理得到社区特征,对社区特征进行词向量转换处理,得到社区特征向量;
服务器获得社区信息后,通过由特征提取模型和自然语言处理词向量模型组合而成的机器学习模型对社区信息进行特征提取,获得特征信息,该特征信息为高维数据,对特征信息进行线性投影到低维的空间中,得到社区特征,以较少的数据维度保留住较多的社区信息中的特征,对社区特征进行词向量转换处理,得到社区特征向量,社区特征向量为由多个社区对应的特征向量组合一起二成的多维数据。其中,社区特征向量可为网络拓扑结构指标向量,网络拓扑结构指标向量包括最大度数向量、平均度数向量、最大相关系数向量和平均相关系数的向量;社区特征向量也可为基于无监督学习算法学习到的指定维度的特征向量。
103、计算每两个社区特征向量之间的目标相似度,根据目标相似度确定候选社区信息;
服务器通过计算余弦相似度算法或计算欧氏距离的相似性度量算法计算每两个社区特征向量之间的目标相似度,目标相似度包括多个相似度,计算各个相似度的值与预设阈值的差值,对社区信息进行筛选,获取说是所有差值均大于或者等于0所对应的社区信息,得到候选社区信息。例如:甲社区特征向量包括社区特征向量1、社区特征向量2和社区特征向量3,乙社区特征向量包括社区特征向量4、社区特征向量5和社区特征向量6,对应地分别计算各甲社区特征向量与各乙社区特征向量之间的相似度,分别得到相似度14、相似度25和相似度36,计算相似度14、相似度25和相似度36分别与预设阈值的差值,分别得到差值14、差值25和差值36,差值14、差值25和差值36均大于或者等于0,则甲社区特征向量对应的甲社区信息以及乙社区特征向量对应的乙社区信息为候选社区信息。
具体地,上述步骤103可以包括:计算每两个社区特征向量之间的目标相似度,将每两个社区特征向量之间的目标相似度生成矩阵,得到相似度矩阵;对相似度矩阵中每个元素的值与预设阈值进行对比分析,获得每个元素的值均大于预设阈值的目标相似度矩阵,将目标相似矩阵对应的社区信息作为候选社区信息。服务器通过计算余弦相似度或计算欧氏距离的相似性度量算法计算每两个社区特征向量之间的目标相似度,得到多个相似度值,将多个相似度组合生成一个n×n维的相似度对称矩阵M,相似度矩阵中M的元素Mij表示社区ci和所述社区cj之间的相似度,服务器根据专家规则或机器学习算法等来预先设置一个预设阈值,该预设阈值可为一个矩阵,相似度矩阵中的每个元素值对应预设阈值进行比较;该预设阈值也可为一个数值,相似度矩阵中的每个元素值均与该预设阈值进行比较。通过分析相似度矩阵中的每个元素值是否均大于预设阈值来对社区信息进行筛选,获得候选社区信息。
104、对候选社区信息进行风险值标记得到目标社区信息,将目标社区信息和目标相似度填充至预置的领接表,根据领接表生成社区加权图,领接表用于指示构造社区加权图的数据域所对应的指针数组;
服务器对候选社区信息进行风险评估,得到风险值,该风险评估的类型由业务需求确定,将该风险值标记在候选社区信息上,得到目标社区信息,将目标社区信息对应的社区作为顶点,以该目标社区信息对应的社区与其他的社区的目标相似度的值作为权重值,并以该权重值标记在连接该目标社区信息对应的社区与其他的目标社区信息对应的社区的连接边上,将该顶点和标记权重值以指针数组形式存储在领接表中,通过将领接表转换为无向图或有向图,从而得到一个标记权重值的社区加权图,其中,社区加权图的领接表是社区加权图的所有节点(即目标社区信息对应的社区)的邻接表的集合,而对每个节点的邻接表就是它的所有出弧(包括目标社区信息对应的社区、该社区与其他社区的连接指向,以及弧上的标记权重值)。
具体地,上述步骤104可以包括:对候选社区信息进行风险评估得到风险值,建立风险值与候选社区信息的对应关系,将建立对应关系的候选社区信息作为目标社区信息;将目标社区信息中的任意一个目标社区信息作为第一社区信息,将目标社区信息中除第一社区信息之外的目标社区信息作为第二社区信息,获取第一社区信息对应的社区特征向量与第二社区信息对应的社区特征向量之间的目标相似度;按照第一社区信息对应的社区特征向量与第二社区信息对应的社区特征向量之间的目标相似度的值从大到小对第一社区信息和第二社区信息进行排序,获得排序信息;将第一社区信息对应的社区作为节点,根据排序信息依次将第二社区信息对应的社区依次作为节点的连接节点,将目标相似度作为连接两个社区的弧上的标记权重值;将节点、连接节点和标记权重值存储至预置的领接表中对应的存储空间,对领接表进行图像元素转换得到社区加权图。
服务器通过将目标社区信息对应的社区连接起来,并标记其对应的目标相似度,构建新图(即社区加权图),以使得在复杂关系网络中没有关联的社区之间进行网络拓扑结构相似度关联起来,从而实现无关联社区之间的风险传播,例如:在复杂关系网络中,甲社区和乙社区的地理位置关系上两者之间不存在关联,但是甲社区的网络拓扑结构和乙社区的网络拓扑结构相同或相似,则通过根据网络拓扑结构构建社区加权图将甲社区和乙社区关联起来。其中,通过按照值从大到小进行排序的目标相似度来连接社区,以便于后续对社区之间的风险传播以及提高其操作效率。通过将相似度作为权重值,以便于后续对于社区的风险值的加权求值,从而保证风险值的质量和准确性。
105、获取社区加权图中的待评估社区、加权风险值以及待评估社区的风险值,通过预置的标签传播算法分析加权风险值以更新待评估社区的风险值,通过更新后的风险值获得待评估社区的风险程度和对于风险的识别度,加权风险值用于指示与待评估社区连接或相邻的社区的风险值乘以相似度后的值。
服务器通过业务信息中的业务需求从社区加权图中选中待评估社区,以待评估社区为开始节点对社区加权图进行随机游走,得到多个序列数据,对多个序列数据进行筛选,获得与待评估社区连接或在预设相邻范围的周边社区,通过标签传播算法对周边社区进行风险传播,即对周边社区的加权风险值进行分析以更新待评估社区的风险值,根据更新后的风险值获取危险源,危险源为更新后的风险值对应风险类型的风险事件可能导致人员伤害和(或)健康损害和(或)财产损失的根源、状态和/或行为,对更新后的风险值进行等级划分得到风险等级,对危险源进行危险指数评估,得到危险指数,遍历预置的风险判断表,根据风险判断表中的风险等级、危险源和危险指数获得待评估社区的风险程度、对于风险的识别度和把控度,其中,识别度为对社区各风险类型所造成的风险程度的辨识度,把控度为对社区各风险类型所生成的风险的管控力度,识别度和把控度可用数值表示,也可用高中低的程度词表示,例如:当风险等级为8级,危险源为环境恶劣状态,危险指数为红色时,识别度为高,把控度为低。待评估社区与周边社区之间的风险传播遵循一个原则:每两个社区特征向量之间的相似度的值越大的两个社区之间对应的风险结果也越相似,即某个社区的风险值会向着与它的网络拓扑结构最相似的社区进行传播,不管这两个社区在复杂关系网络中是否相邻,只要这两个社区在社区加权图中的网络拓扑结构相似,那么就可以依据网络拓扑结构的相似度进行风险的传播,以对待评估社区待评估社区对于风险的识别度和把控度进行评估。随着社区之间的网络拓扑结构的不断变化,对应的风险值可能会随之逐渐消除或者会随之逐渐增加,即待评估社区对于风险的识别度和把控度随之逐渐减弱或随之逐渐增强,风险值的消除或增加决于与待评估社区的网络拓扑结构相似的其他社区的风险程度。
具体地,上述步骤105可以包括:获取待评估需求,根据待评估需求遍历社区加权图,获得符合待评估需求的待评估社区以及待评估社区的风险值;将待评估社区作为起始节点,根据起始节点对社区加权图进行随机游走,获得序列数据;获取并标记序列数据中与起始节点连接的节点对应的社区,以及在目标社区中获取并标记与起始节点相邻的节点对应的社区,得到周边社区,目标社区用于指示序列数据中不与起始节点连接的节点对应的社区;读取周边社区标记的风险值和标记权重值,计算风险值和标记权重值的乘积,将乘积作为周边社区的加权风险值;将加权风险值代入预置标签传播算法的预设计算策略中进行计算,得到更新后的风险值,通过更新后的风险值获得待评估社区的风险程度和对于风险的识别度,预设计算策略包括累加型计算策略、最值型计算策略和众举型计算策略中的至少一种,以及预设加权比值计算策略。其中,目标社区信息中标记有风险值,待评估社区的风险值即为待评估社区对应的目标社区信息中所标记的风险值。服务器通过以累加型计算策略、最值型计算策略和众举型计算策略中的至少一种,以及预设加权比值计算策略的预设计算策略(即预置标签传播算法)对社区加权图进行风险传播,将每个社团的风险性质(即风险值)作为标签传播出去,从而实现特征相似的社区之间的风险传播(即将通过预设计算策略对待评估社区的邻居节点的风险值进行计算所得的风险值作为待评估社区的目标风险值),进一步对未达到表现期的社区进行提取风险预警和识别。通过按照预设计算策略获取待评估社区的目标风险值,以快速而准确地获取与待评估社区有群组关联关系或者无群组关联关系的社区之间的风险传播值,从而无联系的两个社区之间的风险传播得到识别和分析。
具体地,上述的将加权风险值代入预置标签传播算法的预设计算策略中进行计算,得到更新后的风险值,通过更新后的风险值获得待评估社区的风险程度和对于风险的识别度可以包括:根据累加型计算策略将加权风险值进行累加求和计算,得到第一风险值;或者,根据最值型计算策略按照值从大到小的顺序对加权风险值进行排序,将排序为第一顺位的加权风险值作为第二风险值;或者,根据众举型计算策略赋予加权风险值新的权重值,按照值从大到小的顺序对新的权重值进行排序,将新的权重值排序为第一顺位的加权风险值作为第三风险值;根据预设加权比值计算策略按照预设加权比值计算第一风险值、第二风险值和第三风险值中的至少一项的加权值,将加权值作为待评估社区的更新后的风险值,通过更新后的风险值获得待评估社区的风险程度和对于风险的识别度。通过以累加型计算策略、最值型计算策略和众举型计算策略,以便于适应各种业务场景下的对于无联系的两个社区之间的风险传播的识别和分析,以及保证其识别和分析的质量。通过按照预设加权比值计算目标风险值,以提高目标风险值的准确性。
本发明实施例中,通过将传统复杂关系网络中社区特征作为中间变量,在复杂关系网络的基础上重新构建新的社区加权图,以将原本没有关联的社区群体进行相似度关联,并采用标签传播算法对社区加权图进行风险识别,获得无关联社区的传播风险值,实现了对无关联社区之间的风险传播情况进行分析,增强了对社区群组风险的识别和把控能力。
请参阅图2,本发明实施例中复杂关系网络的信息分析方法的另一个实施例包括:
201、获取待分析的复杂关系网络,对复杂关系网络进行网络拓扑结构的划分,获得社区以及每个社区对应的社区信息;
202、对社区信息进行线性降维处理得到社区特征,对社区特征进行词向量转换处理,得到社区特征向量;
203、计算每两个社区特征向量之间的目标相似度,根据目标相似度确定候选社区信息;
204、对候选社区信息进行风险值标记得到目标社区信息,将目标社区信息和目标相似度填充至预置的领接表,根据领接表生成社区加权图,领接表用于指示构造社区加权图的数据域所对应的指针数组;
205、获取社区加权图中的待评估社区、加权风险值以及待评估社区的风险值,通过预置的标签传播算法分析加权风险值以更新待评估社区的风险值,通过更新后的风险值获得待评估社区的风险程度和对于风险的识别度,加权风险值用于指示与待评估社区连接或相邻的社区的风险值乘以相似度后的值;
本发明实施例中,201至205的方法可参见101至105,此处不再赘述。
206、通过预置的聚类算法对目标风险值进行聚类分析,得到预警风险类别,根据预警风险类别和目标风险值从历史存储的历史策略方案中获取对应的目标策略方案,建立预警风险类别、目标策略方案和目标风险值三者之间的关联关系。
服务器通过K均值聚类或其他的聚类算法对目标风险值进行聚类分析获得与目标风险值的类型相同或类似或关联的风险类型(即预警风险类别),创建预警风险类别的哈希值,通过哈希值对数据库中由历史存储的创建的历史策略方案的哈希表进行检索,获得哈希值相同或相似的候选策略方案,或者通过标签提取算法对历史存储的历史策略方案的标签信息进行风险类型提取得到分析风险类型,计算预警风险类别与分析风险类型的第一相似度,获得第一相似度最大对应的预警风险类别的候选策略方案,计算候选策略方案对应的候选风险值以及计算候选风险值与目标风险值的差值,获取差值最小对应的候选策略方案,并将差值最小对应的候选策略方案作为目标策略方案,建立预警风险类别、目标策略方案和目标风险值三者之间的关联关系,通过对预警风险类别和/或目标风险值进行检索,便可获取对应的目标策略方案。通过聚类算法对目标风险值进行聚类分析,获得与目标风险值的类型相同或类似或关联的预警风险类别,以使得在展示目标风险值时能展示所潜在和所需注意的危险因素,通过获得对应的策略方案,增加目标风险值的多角度信息。
本发明实施例中,在实现了对无关联社区之间的风险传播情况进行分析,增强了对社区群组风险的识别和把控能力的基础上,通过聚类算法对目标风险值进行聚类分析,获得与目标风险值的类型相同或类似或关联的预警风险类别,以使得在展示目标风险值时能展示所潜在和所需注意的危险因素,通过获得对应的策略方案,增加目标风险值的多角度信息。
上面对本发明实施例中复杂关系网络的信息分析方法进行了描述,下面对本发明实施例中复杂关系网络的信息分析装置进行描述,请参阅图3,本发明实施例中复杂关系网络的信息分析装置一个实施例包括:
第一获取模块301,用于获取待分析的复杂关系网络,通过预置算法对复杂关系网络进行网络拓扑结构的划分,获得社区以及每个社区对应的社区信息;
处理模块302,用于对社区信息进行线性降维处理得到社区特征,对社区特征进行词向量转换处理,得到社区特征向量;
计算模块303,用于计算每两个社区特征向量之间的目标相似度,根据目标相似度确定候选社区信息;
生成模块304,用于对候选社区信息进行风险值标记得到目标社区信息,将目标社区信息和目标相似度填充至预置的领接表,根据领接表生成社区加权图,领接表用于指示社区加权图的数据域所对应的指针数组;
第二获取模块305,用于获取社区加权图中的待评估社区、加权风险值以及待评估社区的风险值,通过预置标签传播算法分析加权风险值以更新待评估社区的风险值,通过更新后的风险值获得待评估社区的风险程度和对于风险的识别度,加权风险值用于指示与待评估社区连接或相邻的社区的风险值乘以目标相似度后的值。
本发明实施例中,通过将传统复杂关系网络中社区特征作为中间变量,在复杂关系网络的基础上重新构建新的社区加权图,以将原本没有关联的社区群体进行相似度关联,并采用标签传播算法对社区加权图进行风险识别,获得无关联社区的传播风险值,实现了对无关联社区之间的风险传播情况进行分析,增强了对社区群组风险的识别和把控能力。
请参阅图4,本发明实施例中复杂关系网络的信息分析装置的另一个实施例包括:
第一获取模块301,用于获取待分析的复杂关系网络,通过预置算法对复杂关系网络进行网络拓扑结构的划分,获得社区以及每个社区对应的社区信息;
处理模块302,用于对社区信息进行线性降维处理得到社区特征,对社区特征进行词向量转换处理,得到社区特征向量;
计算模块303,用于计算每两个社区特征向量之间的目标相似度,根据目标相似度确定候选社区信息;
生成模块304,用于对候选社区信息进行风险值标记得到目标社区信息,将目标社区信息和目标相似度填充至预置的领接表,根据领接表生成社区加权图,领接表用于指示社区加权图的数据域所对应的指针数组;
第二获取模块305,用于获取社区加权图中的待评估社区、加权风险值以及待评估社区的风险值,通过预置标签传播算法分析加权风险值以更新待评估社区的风险值,通过更新后的风险值获得待评估社区的风险程度和对于风险的识别度,加权风险值用于指示与待评估社区连接或相邻的社区的风险值乘以目标相似度后的值;
分析模块306,用于通过预置的聚类算法对目标风险值进行聚类分析,得到预警风险类别,根据预警风险类别和目标风险值从历史存储的历史策略方案中获取对应的目标策略方案,建立预警风险类别、目标策略方案和目标风险值三者之间的关联关系。
可选的,生成模块304还可以具体用于:对候选社区信息进行风险评估得到风险值,建立风险值与候选社区信息的对应关系,将建立对应关系的候选社区信息作为目标社区信息;将目标社区信息中的任意一个目标社区信息作为第一社区信息,将目标社区信息中除第一社区信息之外的目标社区信息作为第二社区信息,获取第一社区信息对应的社区特征向量与第二社区信息对应的社区特征向量之间的目标相似度;按照第一社区信息对应的社区特征向量与第二社区信息对应的社区特征向量之间的目标相似度的值从大到小对第一社区信息和第二社区信息进行排序,获得排序信息;将第一社区信息对应的社区作为节点,根据排序信息依次将第二社区信息对应的社区作为节点的连接节点,将目标相似度作为连接两个社区的弧上的标记权重值;将节点、连接节点和标记权重值存储至预置的领接表中,对领接表进行图像元素转换得到社区加权图。
可选的,第二获取模块305包括:第一获取单元3051,用于获取待评估需求,根据待评估需求遍历社区加权图,获得符合待评估需求的待评估社区以及待评估社区的风险值;第二获取单元3052,用于将待评估社区作为起始节点,根据起始节点对社区加权图进行随机游走,获得序列数据;第三获取单元3053,用于获取并标记序列数据中与起始节点连接的节点对应的社区,以及在目标社区中获取并标记与起始节点相邻的节点对应的社区,得到周边社区,目标社区用于指示序列数据中不与起始节点连接的节点对应的社区;第一计算单元3054,用于读取周边社区标记的风险值和标记权重值,计算风险值和标记权重值的乘积,将乘积作为周边社区的加权风险值;第二计算单元3055,用于将加权风险值代入预置标签传播算法的预设计算策略中进行计算,得到更新后的风险值,通过更新后的风险值获得待评估社区的风险程度和对于风险的识别度,预设计算策略包括累加型计算策略、最值型计算策略和众举型计算策略中的至少一种,以及预设加权比值计算策略。
可选的,第二计算单元3055还可以具体用于:根据累加型计算策略将加权风险值进行累加求和计算,得到第一风险值;或者,根据最值型计算策略按照值从大到小的顺序对加权风险值进行排序,将排序为第一顺位的加权风险值作为第二风险值;或者,根据众举型计算策略赋予加权风险值新的权重值,按照值从大到小的顺序对新的权重值进行排序,将新的权重值排序为第一顺位的加权风险值作为第三风险值;根据预设加权比值计算策略计算第一风险值、第二风险值和第三风险值中的至少一项的加权值,将加权值作为待评估社区的更新后的风险值,通过更新后的风险值获得待评估社区的风险程度和对于风险的识别度。
可选的,计算模块303还可以具体用于:计算每两个社区特征向量之间的目标相似度,将每两个社区特征向量之间的目标相似度生成矩阵,得到相似度矩阵;对相似度矩阵中每个元素的值与预设阈值进行对比分析,获得每个元素的值均大于预设阈值的目标相似度矩阵,将目标相似矩阵对应的社区信息作为候选社区信息。
可选的,第一获取模块301还可以具体用于:获取业务信息和业务信息中的业务需求,根据业务需求获得对应的复杂关系网络;获取复杂关系网络中的社区群组性质;通过社区发现算法和社区群组性质对复杂关系网络进行网络拓扑结构的划分,得到社区;获取复杂关系网络中的信息,通过分类算法对复杂关系网络中的信息进行社区分类,得到每个社区对应的社区信息,复杂关系网络中的信息包括网络拓扑结构信息和/或基于无监督学习算法学习到的指定维度的样本信息。
本发明实施例中,在实现了对无关联社区之间的风险传播情况进行分析,增强了对社区群组风险的识别和把控能力的基础上,通过聚类算法对目标风险值进行聚类分析,获得与目标风险值的类型相同或类似或关联的预警风险类别,以使得在展示目标风险值时能展示所潜在和所需注意的危险因素,通过获得对应的策略方案,增加目标风险值的多角度信息。
上面图3和图4从模块化功能实体的角度对本发明实施例中的复杂关系网络的信息分析装置进行详细描述,下面从硬件处理的角度对本发明实施例中复杂关系网络的信息分析设备进行详细描述。
图5是本发明实施例提供的一种复杂关系网络的信息分析设备的结构示意图,该复杂关系网络的信息分析设备500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)510(例如,一个或一个以上处理器)和存储器520,一个或一个以上存储应用程序533或数据532的存储介质530(例如一个或一个以上海量存储设备)。其中,存储器520和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对复杂关系网络的信息分析设备500中的一系列指令操作。更进一步地,处理器510可以设置为与存储介质530通信,在复杂关系网络的信息分析设备500上执行存储介质530中的一系列指令操作。
复杂关系网络的信息分析设备500还可以包括一个或一个以上电源540,一个或一个以上有线或无线网络接口550,一个或一个以上输入输出接口560,和/或,一个或一个以上操作系统531,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图5示出的复杂关系网络的信息分析设备结构并不构成对复杂关系网络的信息分析设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行所述复杂关系网络的信息分析方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种复杂关系网络的信息分析方法,其特征在于,所述复杂关系网络的信息分析方法包括:
获取待分析的复杂关系网络,通过预置算法对所述复杂关系网络进行网络拓扑结构的划分,获得社区以及每个所述社区对应的社区信息;
对所述社区信息进行线性降维处理得到社区特征,对所述社区特征进行词向量转换处理,得到社区特征向量;
计算每两个社区特征向量之间的目标相似度,根据所述目标相似度确定候选社区信息;
对所述候选社区信息进行风险值标记得到目标社区信息,将所述目标社区信息和所述目标相似度填充至预置的领接表,根据所述领接表生成社区加权图,所述领接表用于指示所述社区加权图的数据域所对应的指针数组;
获取所述社区加权图中的待评估社区、加权风险值以及所述待评估社区的风险值,通过预置标签传播算法分析所述加权风险值以更新所述待评估社区的风险值,通过更新后的风险值获得所述待评估社区的风险程度和对于风险的识别度,所述加权风险值用于指示与所述待评估社区连接或相邻的社区的风险值乘以所述目标相似度后的值。
2.根据权利要求1所述的复杂关系网络的信息分析方法,其特征在于,所述对所述候选社区信息进行风险值标记得到目标社区信息,将所述目标社区信息和所述相似度填充至预置的领接表,根据所述领接表生成社区加权图,包括:
对所述候选社区信息进行风险评估得到风险值,建立所述风险值与所述候选社区信息的对应关系,将建立对应关系的候选社区信息作为目标社区信息;
将所述目标社区信息中的任意一个目标社区信息作为第一社区信息,将所述目标社区信息中除所述第一社区信息之外的目标社区信息作为第二社区信息,获取所述第一社区信息对应的社区特征向量与所述第二社区信息对应的社区特征向量之间的目标相似度;
按照所述第一社区信息对应的社区特征向量与所述第二社区信息对应的社区特征向量之间的目标相似度的值从大到小对所述第一社区信息和所述第二社区信息进行排序,获得排序信息;
将所述第一社区信息对应的社区作为节点,根据所述排序信息依次将所述第二社区信息对应的社区作为所述节点的连接节点,将所述目标相似度作为连接两个社区的弧上的标记权重值;
将所述节点、所述连接节点和所述标记权重值存储至预置的领接表中,对所述领接表进行图像元素转换得到社区加权图。
3.根据权利要求2所述的复杂关系网络的信息分析方法,其特征在于,所述获取所述社区加权图中的待评估社区、加权风险值以及所述待评估社区的风险值,通过预置标签传播算法分析所述加权风险值以更新所述待评估社区的风险值,通过更新后的风险值获得所述待评估社区的风险程度和对于风险的识别度,包括:
获取待评估需求,根据所述待评估需求遍历所述社区加权图,获得符合所述待评估需求的待评估社区以及所述待评估社区的风险值;
将所述待评估社区作为起始节点,根据所述起始节点对所述社区加权图进行随机游走,获得序列数据;
获取并标记所述序列数据中与所述起始节点连接的节点对应的社区,以及在目标社区中获取并标记与所述起始节点相邻的节点对应的社区,得到周边社区,所述目标社区用于指示所述序列数据中不与所述起始节点连接的节点对应的社区;
读取所述周边社区标记的风险值和所述标记权重值,计算所述风险值和所述标记权重值的乘积,将所述乘积作为所述周边社区的加权风险值;
将所述加权风险值代入预置标签传播算法的预设计算策略中进行计算,得到更新后的风险值,通过更新后的风险值获得所述待评估社区的风险程度和对于风险的识别度,所述预设计算策略包括累加型计算策略、最值型计算策略和众举型计算策略中的至少一种,以及预设加权比值计算策略。
4.根据权利要求3所述的复杂关系网络的信息分析方法,其特征在于,所述将所述加权风险值代入预置标签传播算法的预设计算策略中进行计算,得到更新后的风险值,通过更新后的风险值获得所述待评估社区的风险程度和对于风险的识别度,包括:
根据所述累加型计算策略将所述加权风险值进行累加求和计算,得到第一风险值;或者,根据所述最值型计算策略按照值从大到小的顺序对所述加权风险值进行排序,将排序为第一顺位的加权风险值作为第二风险值;或者,根据众举型计算策略赋予所述加权风险值新的权重值,按照值从大到小的顺序对所述新的权重值进行排序,将所述新的权重值排序为第一顺位的加权风险值作为第三风险值;
根据所述预设加权比值计算策略计算所述第一风险值、所述第二风险值和第三风险值中的至少一项的加权值,将所述加权值作为所述待评估社区的更新后的风险值,通过更新后的风险值获得所述待评估社区的风险程度和对于风险的识别度。
5.根据权利要求1-4中任一项所述的复杂关系网络的信息分析方法,其特征在于,在所述获取所述社区加权图中的待评估社区、加权风险值以及所述待评估社区的风险值,通过预置标签传播算法分析所述加权风险值以更新所述待评估社区的风险值,通过更新后的风险值获得所述待评估社区的风险程度和对于风险的识别度之后,还包括:
通过预置的聚类算法对所述目标风险值进行聚类分析,得到预警风险类别,根据所述预警风险类别和所述目标风险值从历史存储的历史策略方案中获取对应的目标策略方案,建立所述预警风险类别、所述目标策略方案和所述目标风险值三者之间的关联关系。
6.根据权利要求1所述的复杂关系网络的信息分析方法,其特征在于,所述计算每两个社区特征向量之间的目标相似度,根据所述目标相似度确定候选社区信息,包括:
计算每两个社区特征向量之间的目标相似度,将所述每两个社区特征向量之间的目标相似度生成矩阵,得到相似度矩阵;
对所述相似度矩阵中每个元素的值与预设阈值进行对比分析,获得每个元素的值均大于预设阈值的目标相似度矩阵,将所述目标相似矩阵对应的社区信息作为候选社区信息。
7.根据权利要求1所述的复杂关系网络的信息分析方法,其特征在于,所述获取待分析的复杂关系网络,通过预置算法对所述复杂关系网络进行网络拓扑结构的划分,获得社区以及每个所述社区对应的社区信息,包括:
获取业务信息和所述业务信息中的业务需求,根据所述业务需求获得对应的复杂关系网络;
获取所述复杂关系网络中的社区群组性质;
通过社区发现算法和所述社区群组性质对所述复杂关系网络进行网络拓扑结构的划分,得到社区;
获取所述复杂关系网络中的信息,通过分类算法对所述复杂关系网络中的信息进行社区分类,得到每个所述社区对应的社区信息,所述复杂关系网络中的信息包括网络拓扑结构信息和/或基于无监督学习算法学习到的指定维度的样本信息。
8.一种复杂关系网络的信息分析装置,其特征在于,所述复杂关系网络的信息分析装置包括:
第一获取模块,用于获取待分析的复杂关系网络,通过预置算法对所述复杂关系网络进行网络拓扑结构的划分,获得社区以及每个所述社区对应的社区信息;
处理模块,用于对所述社区信息进行线性降维处理得到社区特征,对所述社区特征进行词向量转换处理,得到社区特征向量;
计算模块,用于计算每两个社区特征向量之间的目标相似度,根据所述目标相似度确定候选社区信息;
生成模块,用于对所述候选社区信息进行风险值标记得到目标社区信息,将所述目标社区信息和所述目标相似度填充至预置的领接表,根据所述领接表生成社区加权图,所述领接表用于指示所述社区加权图的数据域所对应的指针数组;
第二获取模块,用于获取所述社区加权图中的待评估社区、加权风险值以及所述待评估社区的风险值,通过预置标签传播算法分析所述加权风险值以更新所述待评估社区的风险值,通过更新后的风险值获得所述待评估社区的风险程度和对于风险的识别度,所述加权风险值用于指示与所述待评估社区连接或相邻的社区的风险值乘以所述目标相似度后的值。
9.一种复杂关系网络的信息分析设备,其特征在于,所述复杂关系网络的信息分析设备包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述复杂关系网络的信息分析设备执行如权利要求1-7中任意一项所述的复杂关系网络的信息分析方法。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述复杂关系网络的信息分析方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010226311.5A CN111401775A (zh) | 2020-03-27 | 2020-03-27 | 复杂关系网络的信息分析方法、装置、设备及存储介质 |
PCT/CN2020/103199 WO2021189729A1 (zh) | 2020-03-27 | 2020-07-21 | 复杂关系网络的信息分析方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010226311.5A CN111401775A (zh) | 2020-03-27 | 2020-03-27 | 复杂关系网络的信息分析方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111401775A true CN111401775A (zh) | 2020-07-10 |
Family
ID=71431329
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010226311.5A Pending CN111401775A (zh) | 2020-03-27 | 2020-03-27 | 复杂关系网络的信息分析方法、装置、设备及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN111401775A (zh) |
WO (1) | WO2021189729A1 (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111860655A (zh) * | 2020-07-23 | 2020-10-30 | 中国联合网络通信集团有限公司 | 用户的处理方法、装置和设备 |
CN112017059A (zh) * | 2020-07-14 | 2020-12-01 | 北京淇瑀信息科技有限公司 | 一种分级优化的风险控制方法、装置和电子设备 |
CN112925899A (zh) * | 2021-02-09 | 2021-06-08 | 重庆中科云从科技有限公司 | 排序模型建立方法、案件线索推荐方法、装置及介质 |
CN113344697A (zh) * | 2021-06-29 | 2021-09-03 | 平安普惠企业管理有限公司 | 团伙检测方法、装置、设备及介质 |
WO2021189729A1 (zh) * | 2020-03-27 | 2021-09-30 | 深圳壹账通智能科技有限公司 | 复杂关系网络的信息分析方法、装置、设备及存储介质 |
CN113781235A (zh) * | 2021-09-01 | 2021-12-10 | 微民保险代理有限公司 | 一种数据处理方法、装置、计算机设备以及存储介质 |
CN114038144A (zh) * | 2021-10-12 | 2022-02-11 | 中国通信建设第三工程局有限公司 | 一种基于ai的社区安防监测系统及方法 |
CN114169458A (zh) * | 2021-12-13 | 2022-03-11 | 平安科技(深圳)有限公司 | 一种欺诈人员识别方法及装置、存储介质、计算机设备 |
WO2022156720A1 (zh) * | 2021-01-25 | 2022-07-28 | 百果园技术(新加坡)有限公司 | 群控账号挖掘方法、装置、设备及存储介质 |
CN115964582A (zh) * | 2022-11-03 | 2023-04-14 | 太平洋电信股份有限公司 | 一种网络安全风险评估方法及系统 |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114171139B (zh) * | 2021-10-20 | 2023-06-30 | 中国航发四川燃气涡轮研究院 | 压气机叶片选材方法 |
CN114095225A (zh) * | 2021-11-15 | 2022-02-25 | 中国电信股份有限公司 | 安全风险评估方法、装置及存储介质 |
CN114444873A (zh) * | 2021-12-28 | 2022-05-06 | 支付宝(杭州)信息技术有限公司 | 一种风险识别方法、装置以及设备 |
CN114491078B (zh) * | 2022-02-16 | 2022-08-02 | 松立控股集团股份有限公司 | 基于知识图谱的社区项目人员落脚点和同行人员分析方法 |
CN114219379B (zh) * | 2022-02-22 | 2022-05-24 | 北京融信数联科技有限公司 | 一种适用于社区服务圈的资源配套评估方法、及系统 |
CN114513426B (zh) * | 2022-03-02 | 2023-09-15 | 郑州轻工业大学 | 基于节点相似度和影响力的ccn社区划分方法 |
CN114637263B (zh) * | 2022-03-15 | 2024-01-12 | 中国石油大学(北京) | 一种异常工况实时监测方法、装置、设备及存储介质 |
CN114723269A (zh) * | 2022-03-31 | 2022-07-08 | 支付宝(杭州)信息技术有限公司 | 一种事件的风险防控方法、装置及设备 |
CN114844903A (zh) * | 2022-04-14 | 2022-08-02 | 重庆迈斯拓科技有限公司 | 一种网络信息安全保护系统 |
CN114625786B (zh) * | 2022-05-12 | 2022-08-09 | 杭银消费金融股份有限公司 | 一种基于风控技术的动态数据挖掘方法及系统 |
CN115242482B (zh) * | 2022-07-18 | 2024-01-30 | 中国电信股份有限公司 | 越权访问风险检测方法、装置、电子设备及可读存储介质 |
CN115632840B (zh) * | 2022-10-08 | 2023-07-04 | 北京天融信网络安全技术有限公司 | 基于零信任的风险处理方法、装置、设备及存储介质 |
CN116244284B (zh) * | 2022-12-30 | 2023-11-14 | 成都中轨轨道设备有限公司 | 一种基于立体内容的大数据处理方法 |
CN115689066B (zh) * | 2022-12-30 | 2023-04-28 | 湖南三湘银行股份有限公司 | 基于图数据算法的目标供应商风险预测方法及装置 |
CN116362127B (zh) * | 2023-03-31 | 2024-04-19 | 西南大学 | 一种cad模型运动部件及运动属性联合解析方法及装置 |
CN116109630B (zh) * | 2023-04-10 | 2023-06-16 | 创域智能(常熟)网联科技有限公司 | 基于传感器采集和人工智能的图像分析方法及系统 |
CN116383883B (zh) * | 2023-04-14 | 2023-12-22 | 水发科技信息(山东)有限公司 | 一种基于大数据的数据管理权限处理方法及系统 |
CN116663897B (zh) * | 2023-05-24 | 2023-11-14 | 中国矿业大学 | 一种基于贝叶斯网络的城市老旧社区安全风险评价方法 |
CN116894585B (zh) * | 2023-07-25 | 2024-02-20 | 浙江三网科技股份有限公司 | 一种应用于未来社区综合数据智能分析方法和系统 |
CN116761177B (zh) * | 2023-08-21 | 2023-10-20 | 云镝智慧科技有限公司 | 基于5g网关的数据采集方法及其相关装置 |
CN116882767B (zh) * | 2023-09-08 | 2024-01-05 | 之江实验室 | 一种基于不完善异构关系网络图的风险预测方法及装置 |
CN117272386B (zh) * | 2023-10-10 | 2024-02-27 | 广州工程技术职业学院 | 互联网大数据信息安全加密方法及装置、设备、系统 |
CN117273375B (zh) * | 2023-10-19 | 2024-04-02 | 国网安徽省电力有限公司铜陵供电公司 | 基于知识图谱的配网故障处置决策监管提升系统 |
CN117495083B (zh) * | 2023-10-24 | 2024-04-12 | 中交广州航道局有限公司 | 一种护岸边坡稳定性监测系统及方法 |
CN117789977A (zh) * | 2023-11-30 | 2024-03-29 | 华中科技大学同济医学院附属同济医院 | 一种新型压疮智能预警和预防一体化方法和系统 |
CN117439995B (zh) * | 2023-12-19 | 2024-03-15 | 广东博思信息技术股份有限公司 | 信息发布方法、装置、设备及存储介质 |
CN117592790B (zh) * | 2024-01-19 | 2024-04-09 | 全民认证科技(杭州)有限公司 | 一种区域告警方法及系统 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107292424B (zh) * | 2017-06-01 | 2020-01-21 | 四川新网银行股份有限公司 | 一种基于复杂社交网络的反欺诈和信用风险预测方法 |
CN108009915B (zh) * | 2017-12-21 | 2020-01-17 | 连连银通电子支付有限公司 | 一种欺诈用户社区的标记方法及相关装置 |
CN109784636A (zh) * | 2018-12-13 | 2019-05-21 | 中国平安财产保险股份有限公司 | 欺诈用户识别方法、装置、计算机设备及存储介质 |
CN110852584B (zh) * | 2019-10-30 | 2022-06-10 | 北京航空航天大学 | 一种基于复杂网络分析的风险识别方法 |
CN111401775A (zh) * | 2020-03-27 | 2020-07-10 | 深圳壹账通智能科技有限公司 | 复杂关系网络的信息分析方法、装置、设备及存储介质 |
-
2020
- 2020-03-27 CN CN202010226311.5A patent/CN111401775A/zh active Pending
- 2020-07-21 WO PCT/CN2020/103199 patent/WO2021189729A1/zh active Application Filing
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021189729A1 (zh) * | 2020-03-27 | 2021-09-30 | 深圳壹账通智能科技有限公司 | 复杂关系网络的信息分析方法、装置、设备及存储介质 |
CN112017059A (zh) * | 2020-07-14 | 2020-12-01 | 北京淇瑀信息科技有限公司 | 一种分级优化的风险控制方法、装置和电子设备 |
CN111860655A (zh) * | 2020-07-23 | 2020-10-30 | 中国联合网络通信集团有限公司 | 用户的处理方法、装置和设备 |
CN111860655B (zh) * | 2020-07-23 | 2023-05-30 | 中国联合网络通信集团有限公司 | 用户的处理方法、装置和设备 |
WO2022156720A1 (zh) * | 2021-01-25 | 2022-07-28 | 百果园技术(新加坡)有限公司 | 群控账号挖掘方法、装置、设备及存储介质 |
CN112925899A (zh) * | 2021-02-09 | 2021-06-08 | 重庆中科云从科技有限公司 | 排序模型建立方法、案件线索推荐方法、装置及介质 |
CN113344697A (zh) * | 2021-06-29 | 2021-09-03 | 平安普惠企业管理有限公司 | 团伙检测方法、装置、设备及介质 |
CN113781235A (zh) * | 2021-09-01 | 2021-12-10 | 微民保险代理有限公司 | 一种数据处理方法、装置、计算机设备以及存储介质 |
CN114038144A (zh) * | 2021-10-12 | 2022-02-11 | 中国通信建设第三工程局有限公司 | 一种基于ai的社区安防监测系统及方法 |
CN114038144B (zh) * | 2021-10-12 | 2023-04-14 | 中国通信建设第三工程局有限公司 | 一种基于ai的社区安防监测系统及方法 |
CN114169458A (zh) * | 2021-12-13 | 2022-03-11 | 平安科技(深圳)有限公司 | 一种欺诈人员识别方法及装置、存储介质、计算机设备 |
CN115964582A (zh) * | 2022-11-03 | 2023-04-14 | 太平洋电信股份有限公司 | 一种网络安全风险评估方法及系统 |
CN115964582B (zh) * | 2022-11-03 | 2023-09-19 | 太平洋电信股份有限公司 | 一种网络安全风险评估方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
WO2021189729A1 (zh) | 2021-09-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111401775A (zh) | 复杂关系网络的信息分析方法、装置、设备及存储介质 | |
CN109885692B (zh) | 知识数据存储方法、装置、计算机设备和存储介质 | |
Ahmed et al. | Learning role-based graph embeddings | |
CN101506843B (zh) | 图像中的对象的自动分类 | |
Topouzelis et al. | Oil spill feature selection and classification using decision tree forest on SAR image data | |
Liu et al. | Uncertainty and confidence in land cover classification using a hybrid classifier approach | |
CN111475680A (zh) | 检测异常高密子图的方法、装置、设备及存储介质 | |
JP4937395B2 (ja) | 特徴ベクトル生成装置、特徴ベクトル生成方法及びプログラム | |
CN114861788A (zh) | 一种基于dbscan聚类的负荷异常检测方法及系统 | |
Yilmaz et al. | Using ontology and sequence information for extracting behavior patterns from web navigation logs | |
CN113125903A (zh) | 线损异常检测方法、装置、设备及计算机可读存储介质 | |
CN110097120B (zh) | 网络流量数据分类方法、设备及计算机存储介质 | |
Luqman et al. | Subgraph spotting through explicit graph embedding: An application to content spotting in graphic document images | |
CN114399367A (zh) | 保险产品推荐方法、装置、设备及存储介质 | |
CN115905373B (zh) | 一种数据查询以及分析方法、装置、设备及存储介质 | |
Hamza et al. | Incremental classification of invoice documents | |
Schenker et al. | Comparison of distance measures for graph-based clustering of documents | |
CN116340586A (zh) | 基于云平台的汽车故障管理方法、系统及存储介质 | |
CN113095604B (zh) | 产品数据的融合方法、装置、设备及存储介质 | |
CN104978729A (zh) | 一种基于数据感知的图像哈希方法 | |
CN114881102A (zh) | 一种面向数值型数据的稀有类检测方法 | |
CN114117040A (zh) | 基于标签特定特征和相关性的文本数据多标签分类方法 | |
KR20230122739A (ko) | 지식 그래프와 딥러닝 기반 텍스트 마이닝을 이용한 유망 기술 발굴 시스템 및 방법 | |
Do et al. | Mining Very Large Datasets with SVM and Visualization. | |
Al-mamory et al. | A New Density Based Sampling to Enhance Dbscan Clustering Algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |