CN113222771A - 一种基于知识图谱确定目标群体的方法、装置及电子设备 - Google Patents
一种基于知识图谱确定目标群体的方法、装置及电子设备 Download PDFInfo
- Publication number
- CN113222771A CN113222771A CN202010665064.9A CN202010665064A CN113222771A CN 113222771 A CN113222771 A CN 113222771A CN 202010665064 A CN202010665064 A CN 202010665064A CN 113222771 A CN113222771 A CN 113222771A
- Authority
- CN
- China
- Prior art keywords
- target
- nodes
- determining
- node
- targets
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 239000013598 vector Substances 0.000 claims description 117
- 238000004891 communication Methods 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 8
- 238000012163 sequencing technique Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 abstract description 19
- 230000002159 abnormal effect Effects 0.000 description 25
- 238000012545 processing Methods 0.000 description 14
- 230000002093 peripheral effect Effects 0.000 description 10
- 230000001133 acceleration Effects 0.000 description 9
- 238000004422 calculation algorithm Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 230000005856 abnormality Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 206010000117 Abnormal behaviour Diseases 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 239000000919 ceramic Substances 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种基于知识图谱确定目标群体的方法、装置及电子设备,属于安防技术领域。所述方法包括:获取多个第一目标的历史联系记录,得到多个历史联系记录。基于多个历史联系记录构建关系网络图,关系网络图用于以知识图谱的形式表示多个第一目标、以及与多个第一目标存在联系的第二目标的关联关系。从关系网络图中确定多个目标路径,每个目标路径为关系网络图中的两个节点之间的最短路径。基于多个目标路径,确定与多个第一目标的关联度大于关联度阈值的目标群体。本申请中确定目标群体的方法可以适用于任何结构的关系网络图,使用起来更加灵活,且该方法能够更加准确地从多个目标中确定出目标群体。
Description
技术领域
本申请涉及安防技术领域,特别涉及一种基于知识图谱确定目标群体的方法、装置及电子设备。
背景技术
在安防技术领域,安防人员通常是根据已确定目标属性的异常人员的口供以及相关信息确定目标群体,可使用的资源有限,且比较耗费人力。随着大数据的发展,安防领域可以通过对各种数据库中的数据进行挖掘来确定目标群体。
相关技术中,可以基于一些与异常人员相关的数据构造关系网络图,该关系网络图可以以知识图谱的形式表示节点以及节点之间的关联关系。然后通过标签传播算法或GN(Girvan-Newman)算法根据节点之间的关系,对关系网络图中的节点进行社区划分,最后根据规则从社区中确定目标群体。但在该领域因为隐私等涉密原因获取到的关系网络图往往呈链式结构(即片段式的),如通话记录通常只能获取到已经确定的异常人员的通话记录,但无法获取与异常人员联系的非异常人员的通话记录,而上述两种常用的社区划分算法并不适用于链式结构的关系网络图,在划分社区的过程中可能会将非异常人员划分至目标群体中,导致确定的目标群体不准确。
发明内容
本申请提供了一种基于知识图谱确定目标群体的方法、装置及电子设备,可以解决相关技术的确定的目标群体不准确的问题。所述技术方案如下:
一方面,提供了一种基于知识图谱确定目标群体的方法,所述方法包括:
获取多个第一目标的历史联系记录,得到多个历史联系记录;
基于所述多个历史联系记录构建关系网络图,所述关系网络图用于以知识图谱的形式表示所述多个第一目标、以及与所述多个第一目标存在联系的第二目标的关联关系;
从所述关系网络图中确定多个目标路径,每个目标路径为所述关系网络图中的两个节点之间的最短路径;
基于所述多个目标路径,确定与所述多个第一目标的关联度大于关联度阈值的目标群体。
在本申请一种可能的实现方式中,所述从所述关系网络图中确定多个目标路径,包括:
确定所述关系网络图中包括的连通子图;
从所确定的连通子图中,选择节点数量最多的连通子图,得到连通关系图;
从所述连通关系图中确定所述多个目标路径。
在本申请一种可能的实现方式中,所述从所述连通关系图中确定所述多个目标路径,包括:
确定所述连通关系图中正样本目标对应的节点,所述正样本目标是指第一目标和/或已确定目标属性的第二目标;
对所确定的节点进行两两组对,得到多组节点;
确定每组节点中两个节点之间的最短路径,得到所述多个目标路径。
在本申请一种可能的实现方式中,每个目标路径包括至少两个节点,所述基于所述多个目标路径,确定与所述多个第一目标的关联度大于关联度阈值的目标群体,包括:
将所述多个目标路径输入词向量模型中,输出所述多个目标路径中每个节点的词向量,每个节点的词向量为相应的节点的向量表示形式,且所述多个目标路径中同一个节点对应同一个词向量;
基于所输出的每个节点的词向量,确定与所述多个第一目标的关联度大于关联度阈值的目标群体。
在本申请一种可能的实现方式中,将所述多个目标路径输入词向量模型中,输出所述多个目标路径中每个节点的词向量之前,还包括:
确定所述多个目标路径中每个目标路径的路径长度;
从所述多个目标路径中选择路径长度小于长度阈值的目标路径;
所述将所述多个目标路径输入词向量模型中,输出所述多个目标路径中每个节点的词向量,包括:
将选择的目标路径输入词向量模型中,输出所选择的目标路径中每个节点的词向量,且所选择的目标路径中同一个节点对应同一个词向量。
在本申请一种可能的实现方式中,所述历史联系记录包括相应的第一联系信息与至少一个第二联系信息中每个第二联系信息的联系频次,所述方法还包括:
基于所述多个历史联系记录中的联系频次,确定所述关系网络图中每条边的权重;
每个目标路径包括至少一条边,所述确定所述多个目标路径中每个目标路径的路径长度,包括:
将每个目标路径包括的边的权重之和作为相应的目标路径的路径长度,得到所述多个目标路径中每个目标路径的路径长度。
在本申请一种可能的实现方式中,所述基于所输出的每个节点的词向量,确定与所述多个第一目标的关联度大于关联度阈值的目标群体,包括:
基于所输出的每个节点的词向量,确定每个节点与其他节点的相似度;
将相似度大于相似度阈值的节点划分至同一个社区;
确定第一关注目标对应的节点所在的社区;
将所确定的社区内每个节点对应的目标确定为所述目标群体。
在本申请一种可能的实现方式中,所述基于所输出的每个节点的词向量,确定与所述多个第一目标的关联度大于关联度阈值的目标群体,包括:
基于所输出的每个节点的词向量,确定第一关注目标对应的节点与其他节点的相似度;
按照相似度从大到小的顺序对所述其他节点进行排序;
将排序后的其他节点中前第一数量个节点对应的目标和所述第一关注目标确定为所述目标群体。
在本申请一种可能的实现方式中,所述基于所输出的每个节点的词向量,确定与所述多个第一目标的关联度大于关联度阈值的目标群体,包括:
基于所输出的每个节点的词向量,通过聚类的方式对所述多个目标路径中的节点进行社区划分,得到多个社区,每个社区包括一个或多个节点;
将所述多个社区中包括的节点数量小于数量阈值的社区确定为候选社区;
基于所述候选社区确定所述目标群体。
在本申请一种可能的实现方式中,若所述候选社区的数量为多个,所述基于所述候选社区确定所述目标群体,包括:
确定每个候选社区中的每两个节点之间的相似度,得到每个候选社区对应的多个相似度;
基于每个候选社区对应的多个相似度,确定每个候选社区的相似度均值;
确定每个候选社区中正样本目标对应的节点所占的比例,得到每个候选社区的参考比例,所述正样本目标是指第一目标和/或已确定目标属性的第二目标;
将每个候选社区的相似度均值和相应的候选社区的参考比例进行加权求和,得到每个候选社区的分数;
按照分数从大到小的顺序对所述多个候选社区进行排序;
将排序后的多个候选社区中前第二数量个候选社区包括的所有节点对应的目标确定为所述目标群体。
在本申请一种可能的实现方式中,所述历史联系记录包括相应的第一目标的第一联系信息、以及与所述第一联系信息关联的第二联系信息,所述基于所述多个第一目标的历史联系记录构建关系网络图,包括:
将多个第一联系信息和多个第二联系信息作为所述关系网络图中的节点,得到多个节点;
根据所述多个历史联系记录,将所述多个节点中存在关联关系的节点相连,得到所述关系网络图。
另一方面,提供了一种基于知识图谱确定目标群体的装置,所述装置包括:
获取模块,用于获取多个第一目标的历史联系记录,得到多个历史联系记录;
图构建模块,用于基于所述多个历史联系记录构建关系网络图,所述关系网络图用于以知识图谱的形式表示所述多个第一目标、以及与所述多个第一目标存在联系的第二目标的关联关系;
第一确定模块,用于从所述关系网络图中确定多个目标路径,每个目标路径为所述关系网络图中的两个节点之间的最短路径;
第二确定模块,用于基于所述多个目标路径,确定与所述多个第一目标的关联度大于关联度阈值的目标群体。
在本申请一种可能的实现方式中,所述第一确定模块用于:
确定所述关系网络图中包括的连通子图;
从所确定的连通子图中,选择节点数量最多的连通子图,得到连通关系图;
从所述连通关系图中确定所述多个目标路径。
在本申请一种可能的实现方式中,所述第一确定模块用于:
确定所述连通关系图中正样本目标对应的节点,所述正样本目标是指第一目标和/或已确定目标属性的第二目标;
对所确定的节点进行两两组对,得到多组节点;
确定每组节点中两个节点之间的最短路径,得到所述多个目标路径。
在本申请一种可能的实现方式中,所述第二确定模块用于:
每个目标路径包括至少两个节点,将所述多个目标路径输入词向量模型中,输出所述多个目标路径中每个节点的词向量,每个节点的词向量为相应的节点的向量表示形式,且所述多个目标路径中同一个节点对应同一个词向量;
基于所输出的每个节点的词向量,确定与所述多个第一目标的关联度大于关联度阈值的目标群体。
在本申请一种可能的实现方式中,所述第二确定模块还用于:
确定所述多个目标路径中每个目标路径的路径长度;
从所述多个目标路径中选择路径长度小于长度阈值的目标路径;
将选择的目标路径输入词向量模型中,输出所选择的目标路径中每个节点的词向量,且所选择的目标路径中同一个节点对应同一个词向量。
在本申请一种可能的实现方式中,所述第二确定模块用于:
所述历史联系记录包括相应的第一联系信息与至少一个第二联系信息中每个第二联系信息的联系频次,基于所述多个历史联系记录中的联系频次,确定所述关系网络图中每条边的权重;
每个目标路径包括至少一条边,将每个目标路径包括的边的权重之和作为相应的目标路径的路径长度,得到所述多个目标路径中每个目标路径的路径长度。
在本申请一种可能的实现方式中,所述第二确定模块用于:
基于所输出的每个节点的词向量,确定每个节点与其他节点的相似度;
将相似度大于相似度阈值的节点划分至同一个社区;
确定第一关注目标对应的节点所在的社区;
将所确定的社区内每个节点对应的目标确定为所述目标群体。
在本申请一种可能的实现方式中,所述第二确定模块用于:
基于所输出的每个节点的词向量,确定第一关注目标对应的节点与其他节点的相似度;
按照相似度从大到小的顺序对所述其他节点进行排序;
将排序后的其他节点中前第一数量个节点对应的目标和所述第一关注目标确定为所述目标群体。
在本申请一种可能的实现方式中,所述第二确定模块用于:
基于所输出的每个节点的词向量,通过聚类的方式对所述多个目标路径中的节点进行社区划分,得到多个社区,每个社区包括一个或多个节点;
将所述多个社区中包括的节点数量小于数量阈值的社区确定为候选社区;
基于所述候选社区确定所述目标群体。
在本申请一种可能的实现方式中,所述第二确定模块用于:
若所述候选社区的数量为多个,确定每个候选社区中的每两个节点之间的相似度,得到每个候选社区对应的多个相似度;
基于每个候选社区对应的多个相似度,确定每个候选社区的相似度均值;
确定每个候选社区中正样本目标对应的节点所占的比例,得到每个候选社区的参考比例,所述正样本目标是指第一目标和/或已确定目标属性的第二目标;
将每个候选社区的相似度均值和相应的候选社区的参考比例进行加权求和,得到每个候选社区的分数;
按照分数从大到小的顺序对所述多个候选社区进行排序;
将排序后的多个候选社区中前第二数量个候选社区包括的所有节点对应的目标确定为所述目标群体。
在本申请一种可能的实现方式中,所述图构建模块用于:
所述历史联系记录包括相应的第一目标的第一联系信息、以及与所述第一联系信息关联的第二联系信息,将多个第一联系信息和多个第二联系信息作为所述关系网络图中的节点,得到多个节点;
根据所述多个历史联系记录,将所述多个节点中存在关联关系的节点相连,得到所述关系网络图。
另一方面,提供了一种电子设备,所述电子设备包括处理器、通信接口、存储器和通信总线,所述处理器、所述通信接口和所述存储器通过所述通信总线完成相互间的通信,所述存储器用于存放计算机程序,所述处理器用于执行所述存储器上所存放的程序,以实现上述所述的基于知识图谱确定目标群体的方法的步骤。
另一方面,提供了一种计算机可读存储介质,所述存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述所述的基于知识图谱确定目标群体的方法的步骤。
另一方面,提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述所述的基于知识图谱确定目标群体的方法的步骤。
本申请提供的技术方案至少可以带来以下有益效果:
对于已经确定存在异常的第一目标,要确定出与该第一目标关联密切的目标群体,需要确定与第一目标的关系比较密切的第二目标,因此可以获取多个第一目标的历史联系记录,确定第一目标常联系的第二目标。由于与第一目标联系的第二目标很可能与第一目标关联度较高,因此,可以基于多个历史联系记录构建关系网络图,该关系网络图可以以知识图谱的形式表示多个第一目标、以及第二目标之间的关联关系。每个节点表示一个目标,从该关系网络图中确定节点之间的最短路径,得到多个目标路径。由于节点之间的路径越短,表示两个节点的关联度可能越高,因此,可以基于多个目标路径,确定与该多个第一目标的关联度较大的目标群体。本申请中先构建以知识图谱的形式表示的关系网络图,然后基于关系网络图中确定的目标路径确定目标群体,该方法不仅适用于链式结构的关系网络图,也可以适用于其他结构的关系网络图,即对关系网络图的结构没有任何限制,使用起来更加方便灵活,且最短路径的方法可以衡量出两个节点之间的关联度,能够更加准确地从多个第二目标中确定与多个第一目标的关联度较高的目标群体。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据一示例性实施例示出的一种基于知识图谱确定目标群体的方法的流程图;
图2是根据一示例性实施例示出的一种关系网络图的示意图;
图3是根据另一示例性实施例示出的一种关系网络图的示意图;
图4是根据一示例性实施例示出的一种多个连通子图的示意图;
图5是根据另一示例性实施例示出的一种基于知识图谱确定目标群体的方法的流程图;
图6是根据一示例性实施例示出的一种基于知识图谱确定目标群体的装置的结构示意图;
图7是根据一示例性实施例示出的一种电子设备的结构示意图;
图8是根据另一示例性实施例示出的一种电子设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
在对本申请实施例提供的基于知识图谱确定目标群体的进行详细介绍之前,先对本申请实施例涉及的名词和本申请实施例提供的基于知识图谱确定目标群体的方法的执行主体进行简单介绍。
首先,对本申请实施例涉及的名词进行简单介绍。
知识图谱:本质上是一种语义网络,知识图谱的结点代表实体(entity)或者概念(concept),知识图谱的边代表实体/概念之间的各种语义关系。
社区划分:就是要在一个图(包含顶点与边)上发现其社区结构,也就是将图中的节点进行聚类,划分为一个个的小社区。关于社区,一般认为社区内部的点之间的连接相对稠密,而不同社区的点之间的连接则相对稀疏。
最短路径:对于图中的任意节点,都会有多条路径可达,将其中长度最短的定义为最短路径。
六度分割:又称小世界现象,通俗来说就是,你和任何一个陌生人之间所间隔的人不会超过六个。具体在图中,如果两个节点之间的最短路径长度大于6,我们倾向认为两个节点间的相似度很低。
词向量模型:在词典(语料库)中,会有很多句子,每个句子都是由单词组成,词向量模型将单词映射到一个词空间,每个词都用一个向量进行表示,词之间的相似性可通过向量间的距离进行衡量。
链式结构:在图中,节点之间的联系通过边来表示。如果一个节点的邻居节点之间的连边较少,直观来说是图的聚集系数指标较小,且这类的节点较多,本申请将类似结构的图定义为链式结构。
接下来,对本申请实施例提供的基于知识图谱确定目标群体的方法的执行主体进行简单介绍。
本申请实施例提供的基于知识图谱确定目标群体的方法的执行主体为电子设备,该电子设备可以为终端,也可以为服务器,本申请实施例对此不做限定。
在一些实施例中,若电子设备为终端,该终端可以存储有第一目标的历史联系记录,或者,该终端可以与服务器建立通信连接,该服务器中可以存储有第一目标的历史联系记录,终端可以从服务器中获取第一目标的历史联系记录,然后基于获取的第一目标的历史联系记录进行后续操作。作为一种示例,终端可以是任何一种可与用户通过键盘、触摸板、触摸屏、遥控器、语音交互或手写设备等一种或多种方式进行人机交互的电子产品,例如PC(Personal Computer,个人计算机)、手机、智能手机、PDA(Personal DigitalAssistant,个人数字助手)、可穿戴设备、掌上电脑PPC(Pocket PC)、平板电脑、智能车机、智能电视等。
在另一些实施例中,若电子设备为服务器,该服务器的数据库中可以存储有第一目标的历史联系记录,以供服务器进行后续操作。作为另一种示例,服务器可以是一台服务器,也可以是由多台服务器组成的服务器集群,或者是一个云计算服务中心,本申请实施例对此不做限定。
本领域技术人员应能理解上述终端和服务器仅为举例,其他现有的或今后可能出现的终端或服务器如可适用于本申请,也应包含在本申请保护范围以内,并在此以引用方式包含于此。
介绍完本申请实施例提供的执行主体后,接下来对本申请实施例提供的基于知识图谱确定目标群体的方法进行详细的解释说明。
图1是根据一示例性实施例示出的一种基于知识图谱确定目标群体的方法的流程图,该方法应用于上述电子设备中。请参考图1,该方法可以包括如下步骤:
步骤101:获取多个第一目标的历史联系记录,得到多个历史联系记录。
其中,第一目标可以为已确定目标属性的目标,示例性的,可以为存在异常行为的目标,例如,第一目标可以为异常人员。
其中,历史联系记录可以为第一目标与第二目标的联系记录。例如,历史联系记录可以为话单数据。
其中,第二目标为与第一目标存在联系的目标。若第一目标为异常人员,则第二目标可能是异常人员,也可能不是异常人员。
作为一种示例,电子设备可以在自身的数据库中存储有多个第一目标的历史联系记录,如此,可以直接从数据库中获取多个第一目标的历史联系记录。
作为另一种示例,电子设备自身没有存储多个第一目标的历史联系记录,可以从其他存储有该信息的电子设备中获取该多个第一目标的历史联系记录。
示例性地,若第一目标表示异常人员,可以获取多个异常人员的话单数据,得到多个话单数据,每个话单数据中包括与相应的异常人员联系的人员。
步骤102:基于多个历史联系记录构建关系网络图,该关系网络图用于以知识图谱的形式表示多个第一目标、以及与多个第一目标存在联系的第二目标的关联关系。
在实施中,历史联系记录可以包括相应的第一目标的第一联系信息、以及与第一联系信息关联的第二联系信息。基于多个第一目标的历史联系记录构建关系网络图的具体实现可以包括:将多个第一联系信息和多个第二联系信息作为关系网络图中的节点,得到多个节点。根据多个历史联系记录,将多个节点中存在关联关系的节点相连,得到关系网络图。
其中,第一联系信息可以为第一目标的电话号码或其他社交号码,相应的,第二联系信息可以为第二目标的电话号码或其他社交号码。
也就是说,可以根据多个历史联系记录包括的多个第一联系信息和多个第二联系信息确定关系网络图的多个节点,以及根据每个历史联系记录中第一联系信息与第二联系信息的关联关系,确定多个节点中存在关联关系的节点,并将存在关联关系的节点相连,可以得到关系网络图。
为了便于描述,若第一目标表示异常人员,可以将第一目标和已确定为异常人员的第二目标称为正样本目标,将未确定是否为异常人员的第二目标称为负样本目标。或者,将第一联系信息和已确定为异常人员的第二目标的第二联系信息称为正样本目标,将未确定是否为异常人员的第二目标的第二联系信息称为负样本目标。
作为一种示例,参见图2,图2是根据一示例性实施例示出的一种关系网络图的示意图。在图2中,圆形表示正样本目标,方形表示负样本目标,两个节点之间存在边表示两个节点对应的目标之间存在关联关系。例如,节点2和节点3之间存在边,可以说明节点2对应的第一目标和节点3对应的第一目标存在联系,节点2和节点7之间存在边,可以说明节点2对应的第一目标和节点7对应的未确定是否为异常人员的第二目标存在联系。
进一步地,若关系网络图中存在两个节点对应同一个目标,可以将这两个节点进行合并,得到对应的目标,然后将多个第一目标和多个第二目标作为关系网络图中的节点,得到多个节点。再根据关系网络图中节点之间的连接关系重新得到关系网络图。
也就是说,如果两个节点对应的联系信息属于同一个目标,可以将这两个节点进行合并,然后基于合并之前关系网络图中节点的连接关系重新确定关系网络图。
作为一种示例,参见图3,假设图2中节点2和节点3对应同一个目标,可以将图2中的节点2和节点3进行合并,假设合并后的节点称为节点2,可以得到图3中的关系网络图。
步骤103:从关系网络图中确定多个目标路径,每个目标路径为关系网络图中的两个节点之间的最短路径。
其中,每个目标路径可以包括至少两个节点。
在实施中,从关系网络图中确定多个目标路径可以包括如下几种实现方式:
第一种实现方式:从关系网络图中确定多个目标路径。
在一些实施例中,可以对关系网络图中的节点进行两两组队,得到多组节点,确定每组节点对应的两个节点之间的最短路径,可以得到多个目标路径。
也就是说,可以确定关系网络图中每个节点与其他节点之间的最短路径,得到多个目标路径。
在实施中,得到多组节点后,可以应用最短路径算法确定每组节点中两个节点之间的最短路径。示例性地,最短路径算法可以为BFS(Breadth First Search,广度优先搜索)、DFS(Depth First Search,深度优先搜索)、Dijkstra(迪杰斯特拉算法)等。
示例性地,参见图2,从图2中可以确定节点2和节点9之间的路径包括2-3-9、2-7-3-9和2-8-3-9,可以确定节点2和节点9之间的最短路径为2-3-9。同理可以确定关系网络图中每个节点与其他节点之间的最短路径,可以得到多个目标路径。
在另一些实施例中,可以确定该关系网络图中正样本目标对应的节点,然后对所确定的节点进行两两组队,得到多组节点,确定每组节点中两个节点之间的最短路径,得到多个目标路径。
其中,正样本目标是指第一目标和/或已确定目标属性的第二目标。
作为一种示例,已确定目标属性可以表示已确定为异常人员。正样本目标可以包括第一目标,或者,正样本目标可以包括为异常人员的第二目标,或者,正样本目标可以包括第一目标和为异常人员的第二目标。
也就是说,为了减少计算量,可以先确定关系网络图中正样本目标对应的节点,然后确定每个所确定的节点与其他所确定的节点之间的最短路径,可以得到多个目标路径。
示例性地,参见图2,从图2中可以看出节点2和节点4均为正样本目标对应的节点,可以确定节点2和节点4之间的路径包括2-3-4、2-7-3-4和2-8-3-4,可以确定节点2和节点4之间的最短路径为2-3-4。同理可以确定关系网络图中每个正样本目标对应的节点与其他正样本目标对应的节点之间的最短路径,可以得到多个目标路径。
第二种实现方式:确定关系网络图中包括的连通子图。从所确定的连通子图中,选择节点数量最多的连通子图,得到连通关系图。从连通关系图中确定多个目标路径。
其中,连通子图中任意两个节点之间都是路径可达的。
在一些实施例,可以先确定关系网络图中包括的连通子图,然后确定每个连通子图包括的节点数量,由于包括的节点数量多的连通子图可以包括关系网络图中的大多数节点,用来确定目标群体已经足够。因此,可以将节点数量最多的连通子图确定为连通关系图,再从连通关系图中确定多个目标路径。
示例性地,参见图4,图4是根据一示例性实施例示出的一种多个连通子图的示意图。在图4中,节点1、2、3、5和8构成一个连通子图,该连通子图包括的节点数量为5,节点6和9构成一个连通子图,该连通子图包括的节点数量为2,节点7单独为一个连通子图,该连通子图包括的节点数量为1。可以确定包括的节点数量最多的为包括5个节点的连通子图,即节点1、2、3、5和8构成的连通子图,将该连通子图确定为连通关系图,然后从该连通关系图中确定多个目标路径。
作为一种示例,从连通关系图中确定多个目标路径的具体实现可以包括:对连通关系图中的节点进行两两组队,得到多组节点,确定每组节点对应的两个节点之间的最短路径,可以得到多个目标路径。
也就是说,可以确定连通关系图中每个节点与其他节点之间的最短路径,得到多个目标路径。
示例性地,参见图4,从图4中可以确定节点3和节点8之间的路径包括3-1-8、3-2-1-8和3-5-2-1-8,可以确定节点3和节点8之间的最短路径为3-1-8。同理可以确定连通关系图中每个节点与其他节点之间的最短路径,可以得到多个目标路径。
在另一些实施例中,从连通关系图中确定多个目标路径的具体实现可以包括:确定连通关系图中正样本目标对应的节点。对所确定的节点进行两两组对,得到多组节点。确定每组节点中两个节点之间的最短路径,得到多个目标路径。
也就是说,为了减少计算量,可以先确定连通关系图中正样本目标对应的节点,然后确定每个所确定的节点与其他所确定的节点之间的最短路径,可以得到多个目标路径。
示例性地,参见图4,从图4中可以看出节点1和节点5均为正样本目标对应的节点,可以确定节点1和节点5之间的路径包括1-2-5和1-3-5,可以确定节点1和节点5之间的最短路径为1-2-5和1-3-5。同理可以确定连通关系图中每个正样本目标对应的节点与其他正样本目标对应的节点之间的最短路径,可以得到多个目标路径。
步骤104:基于多个目标路径,确定与多个第一目标的关联度大于关联度阈值的目标群体。
其中,关联度阈值可以由用户根据实际需求进行设置,也可以由电子设备默认设置,本申请实施例对此不做限定。
由于多个第一目标是已经确定目标属性的目标,如多个第一目标均是异常人员。若某目标与该多个第一目标的关联度大于关联度阈值,可以认为该目标可能是与异常人员常联系的人员,很有可能也是异常人员,因此需要确定与多个第一目标的关联度大于关联度阈值的目标群体,能够将潜在的异常人员识别出来。
在实施中,每个目标路径可以包括至少两个节点,基于多个目标路径,确定与多个第一目标的关联度大于关联度阈值的目标群体可以包括如下两个步骤:
(1)将多个目标路径输入词向量模型中,输出多个目标路径中每个节点的词向量,每个节点的词向量为相应的节点的向量表示形式,且多个目标路径中同一个节点对应同一个词向量。
其中,词向量模型可以为word2vec模型。
也就是说,可以通过词向量模型将多个目标路径包括的节点转换为向量表示形式,得到每个节点的词向量。
在实施中,由于每个目标路径包括至少两个节点,以及至少两个节点之间的连接关系,且词向量模型是基于目标路径中节点之间的连接关系确定各个节点的词向量,因此,需要将多个目标路径直接输入词向量模型中,可以得到多个目标路径中每个节点的词向量,且对于多个目标路径中的同一个节点对应同一个词向量。另外,由于词向量模型是基于目标路径中节点的关联关系确定目标路径中各个节点的词向量,因此,若两个节点的邻居节点中重复的节点的数量越多,两个节点的词向量之间的距离越短,即两个节点的相似度越大。
示例性地,参见图2,图2中,节点2和节点9之间的目标路径为2-3-9,节点2和节点4之间的目标路径为2-3-4,假设将2-3-9、2-3-4输入词向量模型中,可以分别得到节点2、节点3、节点4和节点9的词向量。
进一步地,将多个目标路径输入词向量模型中,输出多个目标路径中每个节点的词向量之前,为了减少计算量,还可以确定多个目标路径中每个目标路径的路径长度。从多个目标路径中选择路径长度小于长度阈值的目标路径。在这种情况下,将多个目标路径输入词向量模型中,输出多个目标路径中每个节点的词向量的具体实现可以包括:将选择的目标路径输入词向量模型中,输出所选择的目标路径中每个节点的词向量,且所选择的目标路径中同一个节点对应同一个词向量。
其中,长度阈值可以由用户根据实际需求进行设置,也可以由电子设备默认设置,本申请实施例对此不做限定。例如,基于六度分割理论,可以将长度阈值设置为6。
作为一种示例,可以对确定的多个目标路径进行筛选,如果两个节点需要通过路径长度很长的目标路径才能连接,这两个节点很可能是没有关联关系的,因此,可以从目标路径中选择路径长度小于长度阈值的目标路径。然后将选择的所有目标路径输入词向量模型中,得到所选择的目标路径中每个节点的词向量,且对于多个目标路径中的同一个节点对应同一个词向量。
如此,不仅可以减小冗余信息给词向量模型带来的干扰,也降低了词向量模型的时间复杂度,提高了确定节点的词向量的效率。
在一些实施例中,可以将目标路径中包括的边的数量确定为相应的目标路径的路径长度,或者,将目标路径包括的节点的总数量之和减1的值确定为相应的目标路径的路径长度。参见图4,在图4中,节点3和节点8之间的目标路径为3-1-8,可以确定节点3和节点8对应的目标路径的路径长度为2。节点5和节点8之间的目标路径为5-3-1-8和5-2-1-8,可以确定节点5和节点8对应的目标路径的路径长度为3。
在另一些实施例中,历史联系记录可以包括相应的第一联系信息与至少一个第二联系信息中每个第二联系信息的联系频次。因此,可以基于多个历史联系记录中的联系频次,确定关系网络图中每条边的权重。在这种情况下,每个目标路径包括至少一条边,确定多个目标路径中每个目标路径的路径长度的具体实现可以包括:将每个目标路径包括的边的权重之和作为相应的目标路径的路径长度,得到多个目标路径中每个目标路径的路径长度。
也就是说,对于多个历史联系记录中的任一历史联系记录,该任一历史联系记录不仅可以包括相应的第一联系信息和与该第一联系信息存在关联关系的至少一个第二联系信息,还可以包括相应的第一联系信息与该任一历史联系记录包括的至少一个第二联系信息中每个第二联系信息的联系频次,即每个历史联系记录可以包括联系频次。电子设备可以基于多个历史联系记录中的联系频次,确定每个联系频次对应的边,进而确定每条边的权重,然后将每个目标路径包括的边的权重之和作为相应的目标路径的路径长度,可以得到每个目标路径的路径长度。
作为一种示例,可以预先设置联系频次与权重的对应关系,可以直接根据联系频次从联系频次与权重的对应关系中查询该联系频次对应的边的权重。
作为一种示例,参见图4,在图4中,节点3和节点8之间的目标路径为3-1-8,假设节点3对应的第二联系信息与节点1对应的第一联系信息的联系频次为10次,可以基于联系频次10从联系频次与权重的对应关系中确定与联系频次10对应的权重,假设确定的权重为0.1,可以确定节点3与节点1之间的路径长度为0.1。假设节点1对应的第一联系信息与节点8对应的第一联系信息的联系频次为1次,可以基于联系频次1从联系频次与权重的对应关系中确定与联系频次1对应的权重,假设确定的权重为1,可以确定节点3与节点1之间的路径长度为1。进而可以确定节点3和节点8对应的目标路径的路径长度为1.1。
(2)基于所输出的每个节点的词向量,确定与多个第一目标的关联度大于关联度阈值的目标群体。
在实施中,基于所输出的每个节点的词向量,确定与多个第一目标的关联度大于关联度阈值的目标群体可以包括如下几种实现方式:
第一种实现方式:基于所输出的每个节点的词向量,确定每个节点与其他节点的相似度。将相似度大于相似度阈值的节点划分至同一个社区。确定第一关注目标对应的节点所在的社区。将所确定的社区内每个节点对应的目标确定为目标群体。
其中,相似度阈值可以由用户根据实际需求进行设置,也可以由电子设备默认设置,本申请实施例对此不做限定。
其中,第一关注目标为安防人员比较感兴趣的目标,是安防人员认为可能存在异常行为的人员。
也就是说,可以根据输出的每个节点的词向量,确定每个节点与其他节点的相似度,根据相似度与相似度阈值的关系对多个节点进行社区划分,然后确定第一关注目标对应的节点所在的社区,由于同一个社区内的节点之间的关联度较高,可以认为所确定的社区内其他节点对应的目标与该第一关注目标的关联度较高,因此,可以直接将所确定的社区中每个节点对应的目标确定为目标群体。
作为一种示例,可以通过计算两个词向量之间的距离来反映两个词向量对应的节点之间的相似度,且距离越远,相似度越小,距离越近,相似度越大。示例性地,可以将两个词向量之间的距离的倒数确定为两个词向量对应的节点之间的相似度。
需要说明的是,两个词向量之间的距离可以为欧式距离、马氏距离、曼哈顿距离等,本申请实施例对此不做限定。
第二种实现方式:基于所输出的每个节点的词向量,确定第一关注目标对应的节点与其他节点的相似度。按照相似度从大到小的顺序对其他节点进行排序。将排序后的其他节点中前第一数量个节点对应的目标和第一关注目标确定为目标群体。
其中,第一数量可以由用户根据实际需求进行设置,也可以由电子设备默认设置,本申请实施例对此不做限定。例如,第一数量可以为6。
也就是说,可以直接确定第一关注目标对应的节点与其他节点的相似度,可以得到多个相似度,然后按照多个相似度从大到小的顺序对其他节点进行排序,再从排序后的其他节点中选择前第一数量个节点,将选择的前第一数量个节点对应的目标和第一关注目标确定为目标群体。
需要说明的是,确定第一关注目标对应的节点与其他节点的相似度的方法与第一种实现方式中确定两个词向量对应的节点之间的相似度的方法相同,具体可参见第一种实现方式的相关描述,该实现方式在此不在赘述。
在该种实现方式中,可以只计算第一关注目标对应的节点与其他节点的相似度,现较于第一种实现方式,能够减少计算量,进而能够更快地确定出目标群体。
第三种实现方式:基于所输出的每个节点的词向量,通过聚类的方式对多个目标路径中的节点进行社区划分,得到多个社区,每个社区包括一个或多个节点。将多个社区中包括的节点数量小于数量阈值的社区确定为候选社区。基于候选社区确定目标群体。
其中,数量阈值可以由用户根据实际需求进行设置,也可以由电子设备默认设置,本申请实施例对此不做限定。
也就是说,可以基于所输出的每个节点的词向量,通过聚类的方式对所输出的多个节点进行社区划分,得到多个社区,然后从多个社区中选择包括的节点数量较少的社区作为候选社区,再从候选社区中确定目标群体。
作为一种示例,可以预先设置要聚类的类别个数,然后基于所输出的每个节点的词向量,通过K-means(K均值聚类)算法对多个节点进行聚类,将多个节点划分至多种类别中,每一个类别便称为一个社区。统计每个社区包括的节点数量,将节点数量小于数量阈值的社区确定为候选社区,基于候选社区确定目标群体。
在实施中,若候选社区的数量为多个,基于候选社区确定目标群体的具体实现可以包括:确定每个候选社区中的每两个节点之间的相似度,得到每个候选社区对应的多个相似度。基于每个候选社区对应的多个相似度,确定每个候选社区的相似度均值。确定每个候选社区中正样本目标对应的节点所占的比例,得到每个候选社区的参考比例,正样本目标是指第一目标和/或已确定目标属性的第二目标。将每个候选社区的相似度均值和相应的候选社区的参考比例比进行加权求和,得到每个候选社区的分数。按照分数从大到小的顺序对多个候选社区进行排序。将排序后的多个候选社区中前第二数量个候选社区包括的所有节点对应的目标确定为目标群体。
其中,第二数量可以由用户根据实际需求进行设置,也可以由电子设备默认设置,本申请实施例对此不做限定。例如,第二数量可以为2。
其中,相似度均值和参考比例的权重可以由用户根据实际需求进行设置,也可以由电子设备默认设置,本申请实施例对此不做限定。
也就是说,如果候选社区的数量为多个,对于多个候选社区中的任一候选社区,可以确定该任一候选社区中每两个节点之间的相似度,可以得到该任一候选社区对应的多个相似度,然后将该任一选社区对应的多个相似度求和取均值,得到该任一候选社区对应的相似度均值。再确定该任一候选社区中正样本目标对应的节点所占的比例,得到该任一候选社区的参考比例。将该任一候选社区的相似度均值和参考比例进行加权求和,可以得到该任一候选社区的分数。对每个候选社区均进行上述操作后,可以确定每个候选社区的分数,然后按照分数从大到小的顺序对多个候选社区进行排序,将排序后的前第二数量个候选社区包括的所有节点对应的目标确定为目标群体。
在该种实现方式中,不仅确定了候选社区中节点的相似度,还确定了候选社区中正样本目标对应的节点所占的比例,可以更快速地确定与多个目标关联度较高的目标群体。
进一步地,确定目标群体后,可以确定目标群体中负样本目标对应的节点与正样本目标对应的节点的相似度,对相似度较高的负样本目标进行重点关注,可以帮助安防人员缩小需要重点关注的目标的数量,提高安防效率。
在本申请实施例中,对于已经确定存在异常的第一目标,要确定出与该第一目标关联密切的目标群体,需要确定与第一目标的关系比较密切的第二目标,因此可以获取多个第一目标的历史联系记录,确定第一目标常联系的第二目标。由于与第一目标联系的第二目标很可能与第一目标关联度较高,因此,可以基于多个历史联系记录构建关系网络图,该关系网络图可以以知识图谱的形式表示多个第一目标、以及第二目标之间的关联关系。每个节点表示一个目标,从该关系网络图中确定节点之间的最短路径,得到多个目标路径。由于节点之间的路径越短,表示两个节点的关联度可能越高,因此,可以基于多个目标路径,确定与该多个第一目标的关联度较大的目标群体。本申请中先构建以知识图谱的形式表示的关系网络图,然后基于关系网络图中确定的目标路径确定目标群体,该方法不仅适用于链式结构的关系网络图,也可以适用于其他结构的关系网络图,即对关系网络图的结构没有任何限制,使用起来更加方便灵活,且最短路径的方法可以衡量出两个节点之间的关联度,能够更加准确地从多个目标中确定目标群体。
为了便于理解,接下来结合图5对本申请实施例提供的基于知识图谱确定目标群体的方法进行举例说明。
参见图5,本申请实施例提供的基于知识图谱确定目标群体的方法包括四个步骤。
步骤1,构建关系网络图。获取多个目标的历史联系记录,根据多个目标的历史联系记录构建关系网络图。
步骤2,确定目标路径及节点的词向量。从关系网络图中确定连通关系图,从连通关系图中确定多个目标路径,每个目标路径用于指示连通关系图中两个节点的最短路径。然后将确定的多个目标路径输入词向量模型中,输出多个目标路径中每个节点的词向量。
步骤3,社区划分。根据输出的多个节点的词向量,基于相似度计算的方式对多个节点进行社区划分,或者,根据输出的多个节点的词向量,基于聚类算法对多个节点进行社区划分。
步骤4,确定目标群体。基于划分后的社区确定目标群体。
图6是根据一示例性实施例示出的一种基于知识图谱确定目标群体的装置的结构示意图,该装置可以由软件、硬件或者两者的结合实现成为电子设备的部分或者全部。请参考图6,该装置可以包括:获取模块601、图构建模块602、第一确定模块和第二确定模块603。
获取模块601,用于获取多个第一目标的历史联系记录,得到多个历史联系记录;
图构建模块602,用于基于多个历史联系记录构建关系网络图,关系网络图用于以知识图谱的形式表示多个第一目标、以及与多个第一目标存在联系的第二目标的关联关系;
第一确定模块603,用于从关系网络图中确定多个目标路径,每个目标路径为关系网络图中的两个节点之间的最短路径;
第二确定模块604,用于基于多个目标路径,确定与多个第一目标的关联度大于关联度阈值的目标群体。
在本申请一种可能的实现方式中,第一确定模块603用于:
确定关系网络图中包括的连通子图;
从所确定的连通子图中,选择节点数量最多的连通子图,得到连通关系图;
从连通关系图中确定多个目标路径。
在本申请一种可能的实现方式中,第一确定模块603用于:
确定连通关系图中正样本目标对应的节点,正样本目标是指第一目标和/或已确定目标属性的第二目标;
对所确定的节点进行两两组对,得到多组节点;
确定每组节点中两个节点之间的最短路径,得到多个目标路径。
在本申请一种可能的实现方式中,第二确定模块604用于:
每个目标路径包括至少两个节点,将多个目标路径输入词向量模型中,输出多个目标路径中每个节点的词向量,每个节点的词向量为相应的节点的向量表示形式,且多个目标路径中同一个节点对应同一个词向量;
基于所输出的每个节点的词向量,确定与多个第一目标的关联度大于关联度阈值的目标群体。
在本申请一种可能的实现方式中,第二确定模块604还用于:
确定多个目标路径中每个目标路径的路径长度;
从多个目标路径中选择路径长度小于长度阈值的目标路径;
将选择的目标路径输入词向量模型中,输出所选择的目标路径中每个节点的词向量,且所选择的目标路径中同一个节点对应同一个词向量。
在本申请一种可能的实现方式中,第二确定模块604用于:
历史联系记录包括相应的第一联系信息与至少一个第二联系信息中每个第二联系信息的联系频次,基于多个历史联系记录中的联系频次,确定关系网络图中每条边的权重;
每个目标路径包括至少一条边,将每个目标路径包括的边的权重之和作为相应的目标路径的路径长度,得到多个目标路径中每个目标路径的路径长度。
在本申请一种可能的实现方式中,第二确定模块604用于:
基于所输出的每个节点的词向量,确定每个节点与其他节点的相似度;
将相似度大于相似度阈值的节点划分至同一个社区;
确定第一关注目标对应的节点所在的社区;
将所确定的社区内每个节点对应的目标确定为目标群体。
在本申请一种可能的实现方式中,第二确定模块604用于:
基于所输出的每个节点的词向量,确定第一关注目标对应的节点与其他节点的相似度;
按照相似度从大到小的顺序对其他节点进行排序;
将排序后的其他节点中前第一数量个节点对应的目标和第一关注目标确定为目标群体。
在本申请一种可能的实现方式中,第二确定模块604用于:
基于所输出的每个节点的词向量,通过聚类的方式对多个目标路径中的节点进行社区划分,得到多个社区,每个社区包括一个或多个节点;
将多个社区中包括的节点数量小于数量阈值的社区确定为候选社区;
基于候选社区确定目标群体。
在本申请一种可能的实现方式中,第二确定模块604用于:
若候选社区的数量为多个,确定每个候选社区中的每两个节点之间的相似度,得到每个候选社区对应的多个相似度;
基于每个候选社区对应的多个相似度,确定每个候选社区的相似度均值;
确定每个候选社区中正样本目标对应的节点所占的比例,得到每个候选社区的参考比例,正样本目标是指第一目标和/或已确定目标属性的第二目标;
将每个候选社区的相似度均值和相应的候选社区的参考比例进行加权求和,得到每个候选社区的分数;
按照分数从大到小的顺序对多个候选社区进行排序;
将排序后的多个候选社区中前第二数量个候选社区包括的所有节点对应的目标确定为目标群体。
在本申请一种可能的实现方式中,图构建模块602用于:
历史联系记录包括相应的第一目标的第一联系信息、以及与第一联系信息关联的第二联系信息,将多个第一联系信息和多个第二联系信息作为关系网络图中的节点,得到多个节点;
根据多个历史联系记录,将多个节点中存在关联关系的节点相连,得到关系网络图。
在本申请实施例中,对于已经确定存在异常的第一目标,要确定出与该第一目标关联密切的目标群体,需要确定与第一目标的关系比较密切的第二目标,因此可以获取多个第一目标的历史联系记录,确定第一目标常联系的第二目标。由于与第一目标联系的第二目标很可能与第一目标关联度较高,因此,可以基于多个历史联系记录构建关系网络图,该关系网络图可以以知识图谱的形式表示多个第一目标、以及第二目标之间的关联关系。每个节点表示一个目标,从该关系网络图中确定节点之间的最短路径,得到多个目标路径。由于节点之间的路径越短,表示两个节点的关联度可能越高,因此,可以基于多个目标路径,确定与该多个第一目标的关联度较大的目标群体。本申请中先构建以知识图谱的形式表示的关系网络图,然后基于关系网络图中确定的目标路径确定目标群体,该方法不仅适用于链式结构的关系网络图,也可以适用于其他结构的关系网络图,即对关系网络图的结构没有任何限制,使用起来更加方便灵活,且最短路径的方法可以衡量出两个节点之间的关联度,能够更加准确地从多个目标中确定与多个第一目标的关联度较高的目标群体。
需要说明的是:上述实施例提供的确定目标群体的装置在确定目标群体时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的确定目标群体的装置与确定目标群体的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图7是根据一示例性实施例示出的一种电子设备700的结构框图。该电子设备700可以是便携式移动终端,比如:智能手机、平板电脑、MP3播放器(Moving Picture ExpertsGroup Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving PictureExperts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。电子设备700还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,电子设备700包括有:处理器701和存储器702。
处理器701可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器701可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器701也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器701可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器701还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器702可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器702还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器702中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器701所执行以实现本申请中方法实施例提供的基于知识图谱确定目标群体的方法。
在一些实施例中,电子设备700还可选包括有:外围设备接口703和至少一个外围设备。处理器701、存储器702和外围设备接口703之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口703相连。具体地,外围设备包括:射频电路704、触摸显示屏705、摄像头706、音频电路707、定位组件708和电源709中的至少一种。
外围设备接口703可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器701和存储器702。在一些实施例中,处理器701、存储器702和外围设备接口703被集成在同一芯片或电路板上;在一些其他实施例中,处理器701、存储器702和外围设备接口703中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路704用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路704通过电磁信号与通信网络以及其他通信设备进行通信。射频电路704将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路704包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路704可以通过至少一种无线通信协议来与其它设备进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路704还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏705用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏705是触摸显示屏时,显示屏705还具有采集在显示屏705的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器701进行处理。此时,显示屏705还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏705可以为一个,设置电子设备700的前面板;在另一些实施例中,显示屏705可以为至少两个,分别设置在电子设备700的不同表面或呈折叠设计;在再一些实施例中,显示屏705可以是柔性显示屏,设置在电子设备700的弯曲表面上或折叠面上。甚至,显示屏705还可以设置成非矩形的不规则图形,也即异形屏。显示屏705可以采用LCD(Liquid Crystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件706用于采集图像或视频。可选地,摄像头组件706包括前置摄像头和后置摄像头。通常,前置摄像头设置在电子设备的前面板,后置摄像头设置在电子设备的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件706还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路707可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器701进行处理,或者输入至射频电路704以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在电子设备700的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器701或射频电路704的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路707还可以包括耳机插孔。
定位组件708用于定位电子设备700的当前地理位置,以实现导航或LBS(LocationBased Service,基于位置的服务)。定位组件708可以是基于美国的GPS(GlobalPositioning System,全球定位系统)、中国的北斗系统或俄罗斯的伽利略系统的定位组件。
电源709用于为电子设备700中的各个组件进行供电。电源709可以是交流电、直流电、一次性电池或可充电电池。当电源709包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
在一些实施例中,电子设备700还包括有一个或多个传感器710。该一个或多个传感器710包括但不限于:加速度传感器711、陀螺仪传感器712、压力传感器713、指纹传感器714、光学传感器715以及接近传感器716。
加速度传感器711可以检测以电子设备700建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器711可以用于检测重力加速度在三个坐标轴上的分量。处理器701可以根据加速度传感器711采集的重力加速度信号,控制触摸显示屏705以横向视图或纵向视图进行用户界面的显示。加速度传感器711还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器712可以检测电子设备700的机体方向及转动角度,陀螺仪传感器712可以与加速度传感器711协同采集用户对电子设备700的3D动作。处理器701根据陀螺仪传感器712采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器713可以设置在电子设备700的侧边框和/或触摸显示屏705的下层。当压力传感器713设置在电子设备700的侧边框时,可以检测用户对电子设备700的握持信号,由处理器701根据压力传感器713采集的握持信号进行左右手识别或快捷操作。当压力传感器713设置在触摸显示屏705的下层时,由处理器701根据用户对触摸显示屏705的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器714用于采集用户的指纹,由处理器701根据指纹传感器714采集到的指纹识别用户的身份,或者,由指纹传感器714根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器701授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器714可以被设置电子设备700的正面、背面或侧面。当电子设备700上设置有物理按键或厂商Logo时,指纹传感器714可以与物理按键或厂商Logo集成在一起。
光学传感器715用于采集环境光强度。在一个实施例中,处理器701可以根据光学传感器715采集的环境光强度,控制触摸显示屏705的显示亮度。具体地,当环境光强度较高时,调高触摸显示屏705的显示亮度;当环境光强度较低时,调低触摸显示屏705的显示亮度。在另一个实施例中,处理器701还可以根据光学传感器715采集的环境光强度,动态调整摄像头组件706的拍摄参数。
接近传感器716,也称距离传感器,通常设置在电子设备700的前面板。接近传感器716用于采集用户与电子设备700的正面之间的距离。在一个实施例中,当接近传感器716检测到用户与电子设备700的正面之间的距离逐渐变小时,由处理器701控制触摸显示屏705从亮屏状态切换为息屏状态;当接近传感器716检测到用户与电子设备700的正面之间的距离逐渐变大时,由处理器701控制触摸显示屏705从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图7中示出的结构并不构成对电子设备700的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
图8是根据一示例性实施例示出的一种电子设备的结构示意图。该电子设备可以为服务器。该电子设备800包括中央处理单元(CPU)801、包括随机存取存储器(RAM)802和只读存储器(ROM)803的系统存储器804,以及连接系统存储器804和中央处理单元801的系统总线805。电子设备800还包括帮助计算机内的各个器件之间传输信息的基本输入/输出系统(I/O系统)806,和用于存储操作系统813、应用程序814和其他程序模块815的大容量存储设备807。
基本输入/输出系统806包括有用于显示信息的显示器808和用于用户输入信息的诸如鼠标、键盘之类的输入设备809。其中显示器808和输入设备809都通过连接到系统总线805的输入输出控制器810连接到中央处理单元801。基本输入/输出系统806还可以包括输入输出控制器810以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地,输入输出控制器810还提供输出到显示屏、打印机或其他类型的输出设备。
大容量存储设备807通过连接到系统总线805的大容量存储控制器(未示出)连接到中央处理单元801。大容量存储设备807及其相关联的计算机可读介质为电子设备800提供非易失性存储。也就是说,大容量存储设备807可以包括诸如硬盘或者CD-ROM驱动器之类的计算机可读介质(未示出)。
不失一般性,计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、EPROM、EEPROM、闪存或其他固态存储其技术,CD-ROM、DVD或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知计算机存储介质不局限于上述几种。上述的系统存储器804和大容量存储设备807可以统称为存储器。
根据本申请的各种实施例,电子设备800还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即电子设备800可以通过连接在系统总线805上的网络接口单元811连接到网络812,或者说,也可以使用网络接口单元811来连接到其他类型的网络或远程计算机系统(未示出)。
上述存储器还包括一个或者一个以上的程序,一个或者一个以上程序存储于存储器中,被配置由CPU执行。
在一些实施例中,还提供了一种计算机可读存储介质,该存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例中基于知识图谱确定目标群体的方法的步骤。例如,所述计算机可读存储介质可以是ROM、RAM、CD-ROM、磁带、软盘和光数据存储设备等。
值得注意的是,本申请提到的计算机可读存储介质可以为非易失性存储介质,换句话说,可以是非瞬时性存储介质。
应当理解的是,实现上述实施例的全部或部分步骤可以通过软件、硬件、固件或者其任意结合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。所述计算机指令可以存储在上述计算机可读存储介质中。
也即是,在一些实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述所述的基于知识图谱确定目标群体的方法的步骤。
以上所述为本申请提供的实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (13)
1.一种基于知识图谱确定目标群体的方法,其特征在于,所述方法包括:
获取多个第一目标的历史联系记录,得到多个历史联系记录;
基于所述多个历史联系记录构建关系网络图,所述关系网络图用于以知识图谱的形式表示所述多个第一目标、以及与所述多个第一目标存在联系的第二目标的关联关系;
从所述关系网络图中确定多个目标路径,每个目标路径为所述关系网络图中的两个节点之间的最短路径;
基于所述多个目标路径,确定与所述多个第一目标的关联度大于关联度阈值的目标群体。
2.如权利要求1所述的方法,其特征在于,所述从所述关系网络图中确定多个目标路径,包括:
确定所述关系网络图中包括的连通子图;
从所确定的连通子图中,选择节点数量最多的连通子图,得到连通关系图;
从所述连通关系图中确定所述多个目标路径。
3.如权利要求2所述的方法,其特征在于,所述从所述连通关系图中确定所述多个目标路径,包括:
确定所述连通关系图中正样本目标对应的节点,所述正样本目标是指第一目标和/或已确定目标属性的第二目标;
对所确定的节点进行两两组对,得到多组节点;
确定每组节点中两个节点之间的最短路径,得到所述多个目标路径。
4.如权利要求1所述的方法,其特征在于,每个目标路径包括至少两个节点,所述基于所述多个目标路径,确定与所述多个第一目标的关联度大于关联度阈值的目标群体,包括:
将所述多个目标路径输入词向量模型中,输出所述多个目标路径中每个节点的词向量,每个节点的词向量为相应的节点的向量表示形式,且所述多个目标路径中同一个节点对应同一个词向量;
基于所输出的每个节点的词向量,确定与所述多个第一目标的关联度大于关联度阈值的目标群体。
5.如权利要求4所述的方法,其特征在于,将所述多个目标路径输入词向量模型中,输出所述多个目标路径中每个节点的词向量之前,还包括:
确定所述多个目标路径中每个目标路径的路径长度;
从所述多个目标路径中选择路径长度小于长度阈值的目标路径;
所述将所述多个目标路径输入词向量模型中,输出所述多个目标路径中每个节点的词向量,包括:
将选择的目标路径输入词向量模型中,输出所选择的目标路径中每个节点的词向量,且所选择的目标路径中同一个节点对应同一个词向量。
6.如权利要求5所述的方法,其特征在于,所述历史联系记录包括相应的第一联系信息与至少一个第二联系信息中每个第二联系信息的联系频次,所述方法还包括:
基于所述多个历史联系记录中的联系频次,确定所述关系网络图中每条边的权重;
每个目标路径包括至少一条边,所述确定所述多个目标路径中每个目标路径的路径长度,包括:
将每个目标路径包括的边的权重之和作为相应的目标路径的路径长度,得到所述多个目标路径中每个目标路径的路径长度。
7.如权利要求4或5所述的方法,其特征在于,所述基于所输出的每个节点的词向量,确定与所述多个第一目标的关联度大于关联度阈值的目标群体,包括:
基于所输出的每个节点的词向量,确定每个节点与其他节点的相似度;
将相似度大于相似度阈值的节点划分至同一个社区;
确定第一关注目标对应的节点所在的社区;
将所确定的社区内每个节点对应的目标确定为所述目标群体。
8.如权利要求4或5所述的方法,其特征在于,所述基于所输出的每个节点的词向量,确定与所述多个第一目标的关联度大于关联度阈值的目标群体,包括:
基于所输出的每个节点的词向量,确定第一关注目标对应的节点与其他节点的相似度;
按照相似度从大到小的顺序对所述其他节点进行排序;
将排序后的其他节点中前第一数量个节点对应的目标和所述第一关注目标确定为所述目标群体。
9.如权利要求4或5所述的方法,其特征在于,所述基于所输出的每个节点的词向量,确定与所述多个第一目标的关联度大于关联度阈值的目标群体,包括:
基于所输出的每个节点的词向量,通过聚类的方式对所述多个目标路径中的节点进行社区划分,得到多个社区,每个社区包括一个或多个节点;
将所述多个社区中包括的节点数量小于数量阈值的社区确定为候选社区;
基于所述候选社区确定所述目标群体。
10.如权利要求9所述的方法,其特征在于,若所述候选社区的数量为多个,所述基于所述候选社区确定所述目标群体,包括:
确定每个候选社区中的每两个节点之间的相似度,得到每个候选社区对应的多个相似度;
基于每个候选社区对应的多个相似度,确定每个候选社区的相似度均值;
确定每个候选社区中正样本目标对应的节点所占的比例,得到每个候选社区的参考比例,所述正样本目标是指第一目标和/或已确定目标属性的第二目标;
将每个候选社区的相似度均值和相应的候选社区的参考比例进行加权求和,得到每个候选社区的分数;
按照分数从大到小的顺序对所述多个候选社区进行排序;
将排序后的多个候选社区中前第二数量个候选社区包括的所有节点对应的目标确定为所述目标群体。
11.如权利要求1所述的方法,其特征在于,所述历史联系记录包括相应的第一目标的第一联系信息、以及与所述第一联系信息关联的第二联系信息,所述基于所述多个第一目标的历史联系记录构建关系网络图,包括:
将多个第一联系信息和多个第二联系信息作为所述关系网络图中的节点,得到多个节点;
根据所述多个历史联系记录,将所述多个节点中存在关联关系的节点相连,得到所述关系网络图。
12.一种基于知识图谱确定目标群体的装置,其特征在于,所述装置包括:
获取模块,用于获取多个第一目标的历史联系记录,得到多个历史联系记录;
图构建模块,用于基于所述多个历史联系记录构建关系网络图,所述关系网络图用于以知识图谱的形式表示所述多个第一目标、以及与所述多个第一目标存在联系的第二目标的关联关系;
第一确定模块,用于从所述关系网络图中确定多个目标路径,每个目标路径为所述关系网络图中的两个节点之间的最短路径;
第二确定模块,用于基于所述多个目标路径,确定与所述多个第一目标的关联度大于关联度阈值的目标群体。
13.一种电子设备,其特征在于,所述设备包括处理器、通信接口、存储器和通信总线,所述处理器、所述通信接口和所述存储器通过所述通信总线完成相互间的通信,所述存储器用于存放计算机程序,所述处理器用于执行所述存储器上所存放的程序,以实现权利要求1-11任一所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010665064.9A CN113222771B (zh) | 2020-07-10 | 2020-07-10 | 一种基于知识图谱确定目标群体的方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010665064.9A CN113222771B (zh) | 2020-07-10 | 2020-07-10 | 一种基于知识图谱确定目标群体的方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113222771A true CN113222771A (zh) | 2021-08-06 |
CN113222771B CN113222771B (zh) | 2023-10-20 |
Family
ID=77085791
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010665064.9A Active CN113222771B (zh) | 2020-07-10 | 2020-07-10 | 一种基于知识图谱确定目标群体的方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113222771B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114155049A (zh) * | 2022-02-08 | 2022-03-08 | 北京金堤科技有限公司 | 一种确定目标对象的方法和装置 |
CN115453906A (zh) * | 2022-10-09 | 2022-12-09 | 中国电信股份有限公司 | 设备控制方法及装置、计算机可存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106503035A (zh) * | 2016-09-14 | 2017-03-15 | 海信集团有限公司 | 一种知识图谱的数据处理方法和装置 |
CN107038262A (zh) * | 2017-05-30 | 2017-08-11 | 海南大学 | 一种关联频度计算的基于数据图谱、信息图谱和知识图谱框架的语义建模及抽象增强方法 |
US20180068011A1 (en) * | 2007-07-26 | 2018-03-08 | Hamid Hatami-Hanza | Association strengths and value significances of ontological subjects of networks and compositions |
CN108073711A (zh) * | 2017-12-21 | 2018-05-25 | 北京大学深圳研究生院 | 一种基于知识图谱的关系抽取方法和系统 |
CN108171213A (zh) * | 2018-01-22 | 2018-06-15 | 北京邮电大学 | 一种适用图文知识图谱的关系抽取方法 |
CN108717425A (zh) * | 2018-04-26 | 2018-10-30 | 国家电网公司 | 一种基于多数据源的知识图谱人物实体对齐方法 |
CN110659395A (zh) * | 2019-08-14 | 2020-01-07 | 平安科技(深圳)有限公司 | 关系网络图谱构建方法、装置、计算机设备和存储介质 |
-
2020
- 2020-07-10 CN CN202010665064.9A patent/CN113222771B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180068011A1 (en) * | 2007-07-26 | 2018-03-08 | Hamid Hatami-Hanza | Association strengths and value significances of ontological subjects of networks and compositions |
CN106503035A (zh) * | 2016-09-14 | 2017-03-15 | 海信集团有限公司 | 一种知识图谱的数据处理方法和装置 |
CN107038262A (zh) * | 2017-05-30 | 2017-08-11 | 海南大学 | 一种关联频度计算的基于数据图谱、信息图谱和知识图谱框架的语义建模及抽象增强方法 |
CN108073711A (zh) * | 2017-12-21 | 2018-05-25 | 北京大学深圳研究生院 | 一种基于知识图谱的关系抽取方法和系统 |
CN108171213A (zh) * | 2018-01-22 | 2018-06-15 | 北京邮电大学 | 一种适用图文知识图谱的关系抽取方法 |
CN108717425A (zh) * | 2018-04-26 | 2018-10-30 | 国家电网公司 | 一种基于多数据源的知识图谱人物实体对齐方法 |
CN110659395A (zh) * | 2019-08-14 | 2020-01-07 | 平安科技(深圳)有限公司 | 关系网络图谱构建方法、装置、计算机设备和存储介质 |
Non-Patent Citations (1)
Title |
---|
李小庆;: "客户关联关系知识图谱的构建及应用", 中国金融电脑, no. 06 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114155049A (zh) * | 2022-02-08 | 2022-03-08 | 北京金堤科技有限公司 | 一种确定目标对象的方法和装置 |
CN115453906A (zh) * | 2022-10-09 | 2022-12-09 | 中国电信股份有限公司 | 设备控制方法及装置、计算机可存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113222771B (zh) | 2023-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108924737B (zh) | 定位方法、装置、设备及计算机可读存储介质 | |
CN110083791B (zh) | 目标群组检测方法、装置、计算机设备及存储介质 | |
CN110471858B (zh) | 应用程序测试方法、装置及存储介质 | |
CN109918669B (zh) | 实体确定方法、装置及存储介质 | |
CN111104980B (zh) | 确定分类结果的方法、装置、设备及存储介质 | |
CN110705614A (zh) | 模型训练方法、装置、电子设备及存储介质 | |
CN113222771B (zh) | 一种基于知识图谱确定目标群体的方法、装置及电子设备 | |
CN112819103A (zh) | 基于图神经网络的特征识别方法、装置、存储介质及终端 | |
CN112989198A (zh) | 推送内容的确定方法、装置、设备及计算机可读存储介质 | |
CN110990728B (zh) | 兴趣点信息的管理方法、装置、设备及存储介质 | |
CN111475611A (zh) | 词典管理方法、装置、计算机设备及存储介质 | |
CN111563201A (zh) | 内容推送方法、装置、服务器及存储介质 | |
CN113343709B (zh) | 意图识别模型的训练方法、意图识别方法、装置及设备 | |
CN113742430B (zh) | 确定图数据中结点构成三角形结构个数的方法及系统 | |
CN113783909B (zh) | 数据需求的生成方法、装置、终端、服务器及存储介质 | |
CN114297493A (zh) | 对象推荐方法、对象推荐装置、电子设备及存储介质 | |
CN115221888A (zh) | 实体提及的识别方法、装置、设备及存储介质 | |
CN111159168A (zh) | 数据处理方法和装置 | |
CN111259252A (zh) | 用户标识识别方法、装置、计算机设备及存储介质 | |
CN111596925A (zh) | 自动生成代码的方法、装置、计算机设备及介质 | |
CN111984738A (zh) | 数据关联方法、装置、设备及存储介质 | |
CN110928867A (zh) | 一种数据融合的方法及装置 | |
CN113052408B (zh) | 一种社区聚合的方法及装置 | |
CN112925903B (zh) | 文本分类的方法、装置、电子设备及介质 | |
CN111753154B (zh) | 用户数据处理方法、装置、服务器及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |