CN115374940A - 基于知识图谱的风险标签确定方法以及装置 - Google Patents

基于知识图谱的风险标签确定方法以及装置 Download PDF

Info

Publication number
CN115374940A
CN115374940A CN202210947926.6A CN202210947926A CN115374940A CN 115374940 A CN115374940 A CN 115374940A CN 202210947926 A CN202210947926 A CN 202210947926A CN 115374940 A CN115374940 A CN 115374940A
Authority
CN
China
Prior art keywords
risk
path
target
node
paths
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210947926.6A
Other languages
English (en)
Inventor
张宇豪
齐翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ant Blockchain Technology Shanghai Co Ltd
Original Assignee
Ant Blockchain Technology Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ant Blockchain Technology Shanghai Co Ltd filed Critical Ant Blockchain Technology Shanghai Co Ltd
Priority to CN202210947926.6A priority Critical patent/CN115374940A/zh
Publication of CN115374940A publication Critical patent/CN115374940A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/027Frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Economics (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Strategic Management (AREA)
  • Artificial Intelligence (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书实施例提供基于知识图谱的风险标签确定方法以及装置,包括:基于目标对象的关联关系数据构建知识图谱,并在知识图谱中进行随机游走,获得路径集合;从路径集合中筛选出第一起始节点与第一终止节点之间的至少两条目标路径,其中,第一起始节点为所述知识图谱中的任意一个节点,第一终止节点为基于第一起始节点进行随机游走确定的终止节点;根据风险节点对每条目标路径对应的风险参数进行记录;根据记录结果计算每条目标路径对应的风险值,并基于风险值确定风险标签。通过基于知识图谱进行随机游走确定目标路径,进而对目标路径进行分析和记录确定风险标签,从而提高了风险标签的确定效率,确保了风险标签确定的准确性。

Description

基于知识图谱的风险标签确定方法以及装置
技术领域
本说明书实施例涉及计算机技术领域,特别涉及一种基于知识图谱的风险标签确定方法。
背景技术
随着大数据时代的到来,各个企业的数据相关数据逐渐透明化,根据企业公开的数据,能够获知较多有价值的数据,例如企业之间的投资关系、合作关系、企业的风险情况等数据。通过这些数据可以直观的了解到企业之间的关联关系,但并不能很好地发现企业之间潜在的风险关系。现有技术中对于企业的风险分析都依靠风险分析人员人工收集企业的相关数据,并基于收集到的数据对各个企业进行风险分析以及风险评估,然而这种方法将耗费大量的人力资源,还会导致风险分析不准确的问题,因此亟需一种基于知识图谱的风险标签确定方法以解决上述问题。
发明内容
有鉴于此,本说明书实施例提供了一种基于知识图谱的风险标签确定方法。本说明书一个或者多个实施例同时涉及一种基于知识图谱的风险标签确定装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序,以解决现有技术中存在的技术缺陷。
根据本说明书实施例的第一方面,提供了一种基于知识图谱的风险标签确定方法,包括:
基于目标对象的关联关系数据构建知识图谱,并在所述知识图谱中进行随机游走,获得路径集合;
从所述路径集合中筛选出第一起始节点与第一终止节点之间的至少两条目标路径,其中,所述第一起始节点为所述知识图谱中的任意一个节点,所述第一终止节点为基于所述第一起始节点进行随机游走确定的终止节点;
根据风险节点对每条目标路径对应的风险参数进行记录;
根据记录结果计算每条目标路径对应的风险值,并基于所述风险值确定风险标签。
根据本说明书实施例的第二方面,提供了一种基于知识图谱的风险标签确定装置,包括:
构建模块,被配置为基于目标对象的关联关系数据构建知识图谱,并在所述知识图谱中进行随机游走,获得路径集合;
筛选模块,被配置为从所述路径集合中筛选出第一起始节点与第一终止节点之间的至少两条目标路径,其中,所述第一起始节点为所述知识图谱中的任意一个节点,所述第一终止节点为基于所述第一起始节点进行随机游走确定的终止节点;
记录模块,被配置为根据风险节点对每条目标路径对应的风险参数进行记录;
计算模块,被配置为根据记录结果计算每条目标路径对应的风险值,并基于所述风险值确定风险标签。
根据本说明书实施例的第三方面,提供了一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现上述基于知识图谱的风险标签确定方法的步骤。
根据本说明书实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现上述基于知识图谱的风险标签确定方法的步骤。
根据本说明书实施例的第五方面,提供了一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述基于知识图谱的风险标签确定方法的步骤。
本说明书一个实施例通过基于目标对象的关联关系数据构建知识图谱,并在知识图谱中进行随机游走,获得路径集合;从路径集合中筛选出第一起始节点与第一终止节点之间的至少两条目标路径,其中,第一起始节点为所述知识图谱中的任意一个节点,第一终止节点为基于第一起始节点进行随机游走确定的终止节点;根据风险节点对每条目标路径对应的风险参数进行记录;根据记录结果计算每条目标路径对应的风险值,并基于风险值确定风险标签。通过基于知识图谱进行随机游走确定目标路径,进而对目标路径进行分析和记录确定风险标签,从而提高了风险标签的确定效率,确保了风险标签确定的准确性。
附图说明
图1是本说明书一个实施例提供的一种基于知识图谱的风险标签确定方法的流程图;
图2是本说明书一个实施例提供的一种基于知识图谱的风险标签确定方法的知识图谱示意图;
图3a是本说明书一个实施例提供的第一种基于知识图谱的风险标签确定方法的示意图;
图3b是本说明书一个实施例提供的第二种基于知识图谱的风险标签确定方法的示意图;
图3c是本说明书一个实施例提供的第三种基于知识图谱的风险标签确定方法的示意图;
图4是本说明书一个实施例提供的一种基于知识图谱的风险标签确定方法的处理过程流程图;
图5是本说明书一个实施例提供的一种基于知识图谱的风险标签确定装置的结构示意图;
图6是本说明书一个实施例提供的一种基于知识图谱的风险标签确定方法的处理流程图;
图7是本说明书一个实施例提供的一种计算设备的结构框图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
在本说明书中,提供了一种基于知识图谱的风险标签确定方法,本说明书同时涉及一种基于知识图谱的风险标签确定装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序,在下面的实施例中逐一进行详细说明。
参见图1,图1示出了根据本说明书一个实施例提供的一种基于知识图谱的风险标签确定方法的流程图,具体包括以下步骤。
步骤102,基于目标对象的关联关系数据构建知识图谱,并在所述知识图谱中进行随机游走,获得路径集合。
具体的,知识图谱在本实施例中是指以目标对象为节点,目标对象之间的关联关系为节点之间的边构建的有向图;在企业风险评估场景下,知识图谱是以企业、个人为节点,企业与企业,企业与个人之见的关系为边创建的知识图谱,相应的,目标对象包括企业或个人;在对人员信用进行信用风险评估的场景下,知识图谱是以风险人员、机构为节点,风险人员之间的关系,风险人员与机构之间的关系为边创建的知识图谱,相应的,目标对象包括风险人员、机构等。关联关系数据包括目标对象之间的关联关系数据,以及目标对象对应的风险数据;随机游走是指在知识图谱中以任意一个节点为起始点,根据知识图谱中起始点对应的边进行游走的过程,进行一次随机游走即可确定与起始点对应的多条游走路径,由多条游走路径构成路径集合。
基于此,在关联关系数据中确定至少两个目标对象,根据关联关系数据分别确定与每个目标对象存在关联关系的目标对象,根据关联关系数据确定目标对象之间的关联关系,根据目标对象之间的关联关系确定目标对象之间的有向边,以目标对象为节点,以目标对象之间的有向边为边,构建知识图谱。对知识图谱中的每个节点进行遍历,分别以知识图谱中的每个节点为起始节点进行随机游走,获得路径集合。在基于起始节点进行随机游走时,可以预先确定与起始节点对应的至少一个终止节点,根据起始节点和终止节点进行随机游走,获得路径集合;还可以基于确定的起始节点在知识图谱中进行随机游走,确定与起始节点对应的多个终止节点,根据随机游走结果确定路径集合。
举例说明,在目标对象分别为企业1、企业2、企业3、企业4、企业5、企业6、个人,目标对象之间的关系为企业1为企业3的股东,持股42.48%;企业2为企业1的股东,持股100%;企业2为企业3的股东,持股42.4%;企业4为企业3的股东,持股67.56%;企业4为企业5的股东,持股93.34%;企业4为企业6的股东,持股93.348%;企业5为企业3的股东,持股57.52%;企业5为企业6的股东,持股100%;个人为企业2的股东,持股11.1%;个人为企业5的投资人;以企业和个人为节点,关系为边构建如图2所示的知识图谱。分别以每个企业,个人节点为起始节点在知识图谱中进行随机游走,获得企业1-持股-企业3、企业2-持股-企业1-持股-企业3、企业2-持股-企业3、企业4-持股-企业3、企业4-持股-企业6、企业4-持股-企业5-持股-企业6、企业5-持股-企业3、企业5-持股-企业6、个人-投资-企业2-持股-企业1-持股-企业3、个人-投资-企业2-持股-企业3、个人-投资-企业5-持股-企业3、个人-投资-企业5-持股-企业6、等路径,构成路径集合。
进一步的,在知识图谱中进行随机游走时,为了获得覆盖范围较为全面的路径集合,可以分别以知识图谱中包含的每个节点为起始点进行随机游走,考虑到知识图谱中节点之间的关系具有指向性,还需要确定游走方向,进而根据游走方向在知识图谱中进行随机游走,具体实现如下:
分别以所述知识图谱中包含的每个节点为起始点,按照所述知识图谱中节点之间的关系确定游走方向,并根据所述游走方向在所述知识图谱中进行随机游走,获得每个节点对应的节点路径集合;将每个节点对应的节点路径集合整合为所述路径集合。
具体的,游走方向是根据节点与节点之间具有指向性的主从关系确定的,根据节点之间的主从关系对知识图谱进行随机游走,使得基于起始点在知识图谱中进行随机游走时,能够按照游走方向进行随机游走,进而获得随机游走的节点路径;由知识图谱中每个节点对应的节点路径构成路径集合。需要说明的是,知识图谱中的节点可以不存在节点路径。
基于此,在知识图谱中进行随机游走时,分别以知识图谱中的每个节点为起始点进行随机游走。在基于任意一个起始点进行随机游走时,可以先确定起始节点与知识图谱中其他节点之间具有指向性的主从关系,进而确定与起始点对应的游走方向,根据确定的游走方向在知识图谱中进行随机游走,获得起始点对应的节点路径集合,由知识图谱中每个节点对应的节点路径集合中的节点路径构成了路径集合,需要说明的是,知识图谱中节点对应的节点路径集合可以为空,即,不存在与节点路径集合为空的节点对应的终止节点。
沿用上例,在如图2所示的知识图谱中进行随机游走时,以企业1为起始点,则与企业1对应的游走方向即为企业1指向企业3的路径方向,则与节点企业1对应的节点路径集合中包含的路径为:企业1-持股-企业3;相应的,与节点企业2对应的节点路径集合中包含的路径为:企业2-持股-企业1-持股-企业3、企业2-持股-企业3;与节点企业3对应的节点路径集合为空;与节点企业4对应的节点路径集合中包含的路径为:企业4-持股-企业3、企业4-持股-企业6、企业4-持股-企业5-持股-企业6;与节点企业5对应的节点路径集合中包含的路径为:企业5-持股-企业3、企业5-持股-企业6;与节点企业6对应的节点路径集合为空;与节点个人对应的节点路径集合中包含的路径为:个人-投资-企业2-持股-企业1-持股-企业3、个人-投资-企业2-持股-企业3、个人-投资-企业5-持股-企业3、个人-投资-企业5-持股-企业6。由各个节点对应的节点路径集合中包含的路径构成了路径集合。
综上所述,在基于知识图谱中的任意一个起始点进行随机游走时,通过确定游走方向的方法进行随机游走,提高了随机游走的效率。
步骤104,从所述路径集合中筛选出第一起始节点与第一终止节点之间的至少两条目标路径,其中,所述第一起始节点为所述知识图谱中的任意一个节点,所述第一终止节点为基于所述第一起始节点进行随机游走确定的终止节点。
具体的,在上述构建了知识图谱,并在知识图谱中进行随机游走,确定了路径集合后,即可在路径集合中筛选出第一起始节点与第一终止节点之间的至少两条目标路径,其中,目标路径是指知识图谱中第一起始节点与第一终止节点之间的路径,其中,第一起始节点可以是知识图谱中包含的任意一个节点,相应的,终止节点为以第一起始节点为随机游走的起点进行随机游走确定的游走终点,终止节点也可以为知识图谱中除被确定为第一起始节点的节点之外的任意一个节点。
基于此,分别以知识图谱中的每个节点为第一起始节点,在路径集合中确定与第一起始节点对应的第一终止节点之间存在的所有目标路径,即,对知识图谱中包含的节点进行遍历,在遍历过程中,每确定一个节点,均确定与该节点对应的终止节点,在路径集合中确定目标路径,遍历结束后,获得第一起始节点与第一终止节点之间的至少两条目标路径。
例如,知识图谱中包含a,b,c,d四个节点,以a为起始节点,根据节点之间的指向性在知识图谱中进行随机游走,确定与节点a对应的至少一条游走路径;分别以节点b,节点c,节点d作为起始节点,进行随机游走,分别获得节点b,节点c,节点d对应的游走路径。在每个节点对应的游走路径中选择包含节点数量最少的游走路径作为目标路径,即可获得至少两条目标路径。
进一步的,在从路径集合中筛选目标路径时,可以根据路径集合中的路径包含的节点数量选择目标路径,可以选择包含的节点数量最少的路径作为目标路径,具体实现如下:
在所述路径集合中确定所述第一起始节点和所述第一终止节点之间的节点路径集合;在所述节点路径集合中筛选包含节点数量最少的节点路径作为所述至少两条目标路径。
具体的,节点路径集合是指第一起始节点和第一终止节点之间的全部路径构成的路径集合;节点数量是指节点路径中包含的节点数量,在节点路径集合中选择包含节点数量最少的节点路径则表示,筛选出的节点路径即为第一起始节点和第一终止节点之间的最短路径。
基于此,在确定至少两条目标路径时,分别以知识图谱中每个节点为第一起始节点,进而在路径集合中确定第一起始节点对应的节点路径,即可获得知识图谱中每个节点对应的节点路径集合。分别在每个节点路径集合中筛选包含的节点数量最少的节点路径,作为该节点对应的目标路径,因此针对知识图谱中包含的所有节点,可以获得至少两条目标路径。
沿用上例,分别以节点:企业1、企业2、企业3、企业4、企业5、企业6、个人为起始点,可以确定每个节点对应的节点路径集合,分别在每个节点路径集合中选择包含节点数量最少的路径作为目标路径,即可获得:企业1的目标路径:企业1-持股-企业3;企业2的目标路径:企业2-持股-企业3;企业4的目标路径:企业4-持股-企业3、企业4-持股-企业6;企业5的目标路径:企业5-持股-企业3、企业5-持股-企业6;个人的目标路径:个人-投资-企业2-持股-企业3、个人-投资-企业5-持股-企业3、个人-投资-企业5-持股-企业6;上述确定的目标路径即为至少两条目标路径。
综上所述,在节点路径集合中筛选包含节点数量最少的节点路径作为至少两条目标路径,进而减少了与第一起始节点关联的目标路径的数量,实现了路径筛选,保留了与第一起始节点关联度较高的目标路径,从而便于后续对目标路径对应的风险参数的记录。
步骤106,根据风险节点对每条目标路径对应的风险参数进行记录。
具体的,在上述确定了第一起始节点与第一终止节点之间的至少两条目标路径后,即可根据风险节点对每条目标路径对应的风险参数进行记录,其中,风险节点是指知识图谱中存在风险的节点,其中,在知识图谱中的节点为企业节点的情况下,企业节点的风险包括但不限于舆情风险、经营风险、技术风险、自然环境风险、产业风险、技术风险以及战略风险。风险参数是指基于目标路径中风险节点的存在情况确定的,与目标路径对应的参数值。
基于此,对目标路径进行遍历,确定目标路径中是否包含风险节点,在目标路径中包含风险节点的情况下,根据目标路径和目标路径中包含的风险节点对目标路径对应的风险参数进行记录;在在目标路径中不包含风险节点的情况下,根据目标路径对目标路径对应的风险参数进行记录。
进一步的,在路径集合中筛选第一起始节点与第一终止节点之间的路径时,为了便于后续对目路径进行记录,可以先将文字形式的路径转换为符号形式的元路径,将元路径作为第一起始节点与第一终止节点之间的目标路径,具体实现如下:
分别将所述至少两条目标路径中的每条目标路径转换为元路径,获得所述至少两条目标路径对应的至少两条元路径;相应的,所述根据风险节点对每条目标路径对应的风险参数进行记录,包括:根据所述风险节点对每条元路径对应的风险参数进行记录。
具体的,将目标路径中包含的节点,以及节点之间的关系分别以字符的形式表示,获得的字符表达式即为目标路径对应的元路径,其中,目标路径中包含的节点可以为企业或个人,节点之间的关系可以为投资、持股、法人、下游、子公司以及分公司等,相应的,企业节点可以用字符表示,如:C或其他任意字符,个人等节点也可以用字符表示,如:P或其他任意字符,投资关系可以用字符串表示,如inv或其他任意字符/字符串。
基于此,将路径中包含的节点以字符的形式表示,以不同的字符区分不同类型的节点,将路径中包含的边以字符/字符串的形式表示,以不同的字符/字符串区分不同类型的边,以此为转换规则,将每个目标路径转换为元路径。相应的,在后续记录,目标路径对应的风险参数时,即为记录元路径对应的风险参数,每个目标路径对应一个元路径,元路径与目标路径之间是一一对应的关系。
沿用上例,确定知识图谱中企业节点对应的字符C,个人节点对应的字符P,以及节点之间的关系持股对应的字符sh,投资对应的字符inv。分别对至少两条目标路径中的每条目标路径进行转换,转换为元路径,即可获得:企业1的目标路径企业1-持股-企业3对应元路径C-sh-C;企业2的目标路径企业2-持股-企业3对应元路径C-sh-C;企业4的目标路径企业4-持股-企业3对应元路径C-sh-C、目标路径企业4-持股-企业6对应元路径C-sh-C;企业5的目标路径企业5-持股-企业3对应元路径C-sh-C、目标路径企业5-持股-企业6对应元路径C-sh-C;个人的目标路径个人-投资-企业2-持股-企业3对应元路径P-inv-C-sh-C、目标路径个人-投资-企业5-持股-企业3对应元路径P-inv-C-sh-C、目标路径个人-投资-企业5-持股-企业6对应元路径P-inv-C-sh-C。在企业5为风险节点的情况下,记录包含节点企业5的所有元路径的风险参数。
综上所述,将文字表达形式的目标路径转换为字符表达形式的元路径,简化了目标路径的记录方式,便于后续根据节点类型、关系类型对目标路径进行分类。
进一步的,在对每条目标路径对应的风险参数进行记录时,可以对对每条目标路径进行遍历,并以字典的形式存储每条目标路径,以及每条目标路径对应的风险参数,具体实现如下:
在所述至少两条目标路径中选择第i目标路径,其中,i为大于等于1的正整数;判断路径字典中是否存在所述第i目标路径;若是,在所述第i目标路径包含风险节点的情况下,更新所述第i目标路径对应的风险参数中的路径数值和风险数值,i自增1,并执行所述在所述至少两条目标路径中选择第i目标路径的步骤;若否,将所述第i目标路径写入所述路径字典,并在所述第i目标路径包含风险节点的情况下,更新所述第i目标路径对应的风险参数中的路径数值和风险数值,i自增1,并执行所述在所述至少两条目标路径中选择第i目标路径的步骤;直至i自增至n,执行根据记录结果计算每条目标路径对应的风险值,并基于所述风险值确定风险标,其中,n为目标路径条数。
具体的,路径字典是指用于存储目标路径以及目标路径对应的风险参数的集合,其中,目标路径为字典中的键,目标路径对应的风险参数为值;第i目标路径可以为至少两条目标路径中的任意一条目标路径;路径数值是指目标路径对应的路径数量,风险数值用于表示目标路径中是否包含风险节点,在目标路径中。
基于此,在确定了至少两条目标路径后,即可对每条目标路径对应的风险参数进行记录。以n表示确定的目标路径条数,在至少两个目标路径中选择任意一个目标路径作为第i目标路径,判断路径字典中是否存在第i目标路径;若存在,则在第i目标路径包含风险节点的情况下,更新第i目标路径对应的风险参数中的路径数值和风险数值,i自增1,并继续在至少两条目标路径中选择第i+1目标路径,并判断路径字典中是否存在第i+1目标路径;若不存在,则将第i目标路径写入路径字典,并在第i目标路径包含风险节点的情况下,更新第i目标路径对应的风险参数中的路径数值和风险数值,i自增1,并继续在至少两条目标路径中选择第i+1目标路径,并判断路径字典中是否存在第i+1目标路径。直至i自增至n(n表示目标路径条数),表示每条目标路径对应的风险参数均进行了记录,即可根据记录结果计算每条目标路径对应的风险值,并确定风险标签。
沿用上例,在上述确定了至少两条目标路径:企业1的目标路径:企业1-持股-企业3;企业2的目标路径:企业2-持股-企业3;企业4的目标路径:企业4-持股-企业3、企业4-持股-企业6;企业5的目标路径:企业5-持股-企业3、企业5-持股-企业6;个人的目标路径:个人-投资-企业2-持股-企业3、个人-投资-企业5-持股-企业3、个人-投资-企业5-持股-企业6等9条目标路径后,可以对每条目标路径进行遍历,将企业1的目标路径:企业1-持股-企业3作为第i目标路径,判断路径字典中是否存在路径企业1-持股-企业3,经过判断,路径字典中不存在路径企业1-持股-企业3,因此将路径企业1-持股-企业3以“企业-持股-企业”的形式存储到路径字典中,或者将路径企业1-企业3以元路径,即C-sh-C的形式存储在路径字典中,并记录企业-持股-企业形式的路径数量,判断路径企业1-持股-企业3中不包含风险节点企业5,因此路径字典中存储的是,企业-持股-企业:路径数值=1,风险数值=0;或者C-sh-C:路径数值=1,风险数值=0。依次对其他8个目标路径进行处理获得的路径字典中存储的数据为:企业-持股-企业:路径数值=6,风险数值=2;个人-投资-企业-持股-企业:路径数值=3,风险数值=2;或者,C-sh-C:路径数值=6,风险数值=2;P-inv-C-sh-C:路径数值=3,风险数值=2。
需要说明的是,对9条目标路径的遍历过程为:企业1的目标路径:企业1-持股-企业3;C-sh-C/企业-持股-企业:路径数值=1,风险数值=0;企业2的目标路径:企业2-持股-企业3;C-sh-C/企业-持股-企业:路径数值=2,风险数值=0;企业4的目标路径:企业4-持股-企业3、C-sh-C/企业-持股-企业:路径数值=3,风险数值=0;企业4-持股-企业6;C-sh-C/企业-持股-企业:路径数值=4,风险数值=0;企业5的目标路径:企业5-持股-企业3、C-sh-C/企业-持股-企业:路径数值=5,风险数值=1;企业5-持股-企业6;C-sh-C/企业-持股-企业:路径数值=6,风险数值=2;个人的目标路径:个人-投资-企业2-持股-企业3、P-inv-C-sh-C/个人-投资-企业-持股-企业:路径数值=1,风险数值=0;个人-投资-企业5-持股-企业3:P-inv-C-sh-C/个人-投资-企业-持股-企业:路径数值=2,风险数值=1;个人-投资-企业5-持股-企业6:P-inv-C-sh-C/个人-投资-企业-持股-企业:路径数值=3,风险数值=2。
综上所述,通过遍历至少两条目标路径中的每条目标路径,实现将每条目标路径记录在路径字典中,进而对目标路径对应的风险参数进行记录,从而实现了对至少两条目标路径中的每条目标路径的风险参数进行分析和统计。
进一步的,在路径字典中存在第i目标路径的,且第i目标路径不包含风险节点情况下,可以仅对风险参数中的路径数值进行更新;相应的,在路径字典中不存在第i目标路径,且第i目标路径不包含风险节点的情况下,在将第i目标路径写入所述路径字典后,也可以仅对风险参数中的路径数值进行更新,具体实现如下:
在所述路径字典中存在第i目标路径的情况下,还包括:在所述第i目标路径不包含风险节点的情况下,更新所述第i目标路径对应的风险参数中的路径数值,i自增1,并执行所述在所述至少两条目标路径中选择第i目标路径的步骤;相应的,在所述路径字典中不存在第i目标路径的情况下,还包括:将所述第i目标路径写入所述路径字典,并在所述第i目标路径不包含风险节点的情况下,更新所述第i目标路径对应的风险参数中的路径数值,i自增1,并执行所述在所述至少两条目标路径中选择第i目标路径的步骤。
基于此,在路径字典中存在第i目标路径的,且第i目标路径不包含风险节点情况下,可以仅对风险参数中的路径数值进行更新,进而确定第i+1目标路径,在对第i+1目标路径对应的风险参数进行记录;相应的,在路径字典中不存在第i目标路径,且第i目标路径不包含风险节点的情况下,在将第i目标路径写入所述路径字典后,也可以仅对风险参数中的路径数值进行更新,进而确定第i+1目标路径,在对第i+1目标路径对应的风险参数进行记录。直至i自增至n(n表示目标路径条数),表示每条目标路径对应的风险参数均进行了记录,即可根据记录结果计算每条目标路径对应的风险值,并确定风险标签。
沿用上例,对目标路径的遍历过程中,企业1的目标路径:企业1-持股-企业3;C-sh-C/企业-持股-企业,路径中不包含风险节点,因此路径数值=1,风险数值=0;企业2的目标路径:企业2-持股-企业3;C-sh-C/企业-持股-企业,路径中不包含风险节点,路径数值=2,风险数值=0;企业4的目标路径:企业4-持股-企业3、C-sh-C/企业-持股-企业,路径中不包含风险节点,路径数值=3,风险数值=0;企业4-持股-企业6;C-sh-C/企业-持股-企业,路径中不包含风险节点,路径数值=4,风险数值=0。
综上所述,在路径字典中存在第i目标路径的,且第i目标路径不包含风险节点情况下,可以仅对风险参数中的路径数值进行更新;相应的,在路径字典中不存在第i目标路径,且第i目标路径不包含风险节点的情况下,在将第i目标路径写入所述路径字典后,也可以仅对风险参数中的路径数值进行更新,从而实现了对至少两条目标路径中的每条目标路径的风险参数进行分析和统计。
进一步的,在根据风险节点对每条目标路径对应的风险参数进行记录之前,为了便于对至少两条目标路径对应的风险参数进行记录,可以创建用于存储目标路径和风险参数的路径字典,在遍历至少两条目标路径的过程中,将相关数据记录在路径字典中,具体实现如下:
创建用于存储目标路径和风险参数的路径字典,其中,所述风险参数包括路径数值和风险数值。
基于此,在根据风险节点对每条目标路径对应的风险参数进行记录之前,创建路径字典,用于存储目标路径,以及目标路径对应的风险参数。目标路径以及目标路径对应的风险参数组成了路径字典中的键值对,风险参数中包含路径数值以及风险数值。
沿用上例,在根据风险节点对每条目标路径对应的风险参数进行记录之前,创建空字典,用于存储企业节点和个人节点对应的目标路径。
综上所述,遍历目标路径,并基于路径字典存储目标路径,实现了依次对目标路径的风险参数进行记录,避免了遗漏目标路径的情况,以字典的形式存储目标路径,进而提高了风险参数记录的规范性。
步骤108,根据记录结果计算每条目标路径对应的风险值,并基于所述风险值确定风险标签。
具体的,在上述记录了每条目标路径对应的风险参数后,即可根据记录结果计算每条目标路径对应的风险值,并基于风险值确定风险标签,其中,记录结果是指每条目标路径对应的风险参数构成的风险参数集合;风险值是指针对每条目标路径对应的风险参数以及记录结果进行计算,获得的每条目标路径对应的风险数值,根据风险数值的大小,可以将与风险值对应的目标路径划分为高风险路径、中风险路径和低风险路径;风险标签是指根据风险值对每条目标路径进行分析选择的至少一条目标路径,风险标签是包含至少两个节点、至少一条边的图谱结构,即风险标签为知识图谱中的局部知识图谱。
基于此,在根据风险节点对每条目标路径对应的风险参数进行记录后,获得针对全部目标路径的记录结果,根据记录结果中每条目标路径对应的子记录结果即可计算目标路径对应的风险值。根据风险值对目标路径进行排序,即可确定至少两条目标路径中,存在风险标签的风险目标路径,并将风险标签作为风险目标路径中起始点对应的风险标签,其中,风险目标路径为至少一个。
进一步的,在根据风险节点将每条目标路径对应的风险参数记录至路径字典后,即可根据记录结果计算每条目标路径对应的风险值,具体实现如下:
根据所述记录结果在所述路径字典中确定目标路径对应的路径数值和风险数值,并根据所述目标路径的路径数值和风险数值计算所述目标路径的路径风险值;确定所述路径字典对应的全局路径数值和全局风险数值,并根据所述全局路径数值和所述全局风险数值计算全局路径风险值;基于所述路径风险值和所述全局路径风险值,计算所述目标路径对应的风险值。
具体的,路径风险值是根据目标路径的路径数值和风险数值计算得到的,路径风险值可以是路径数值和风险数值的比值;全局路径风险值是根据全局路径数值和全局风险数值计算得到的,全局路径风险值可以是全局路径数值和全局风险数值的比值,相应的,目标路径对应的风险值可以是目标路径对应的路径风险值与全局路径风险值的比值。
基于此,根据记录结果在路径字典中确定目标路径的路径数值和风险数值,并计算路径数值和风险数值的比值,获得路径风险值;计算路径字典对应的全局路径数值和全局风险数值的比值,作为全局路径风险值,计算路径风险值和全局路径风险值之间的比值,获得目标路径对应的风险值。
沿用上例,路径字典中存储的数据为:企业-持股-企业:路径数值=6,风险数值=2;个人-投资-企业-持股-企业:路径数值=3,风险数值=2;或者,C-sh-C:路径数值=6,风险数值=2;P-inv-C-sh-C:路径数值=3,风险数值=2。因此,风险值的计算方法为:(风险数值除以路径数值)除以(风险数值除以路径数值)。相应的,计算每个目标路径对应的风险值,获得企业1的目标路径:企业1-持股-企业3;企业2的目标路径:企业2-持股-企业3;企业4的目标路径:企业4-持股-企业3、企业4-持股-企业6;以及个人的目标路径:个人-投资-企业2-持股-企业3的风险值均为0。企业5的目标路径:企业5-持股-企业3,风险值为(1/5)/(4/9)=0.45;企业5的目标路径:企业5-持股-企业6,风险值为(2/6)/(4/9)=0.75;个人的目标路径:个人-投资-企业5-持股-企业3,风险值为(1/2)/(4/9)=1.125;个人的目标路径:个人-投资-企业5-持股-企业6,风险值为(2/3)/(4/9)=1.5。
综上所述,基于目标路径的路径风险值和全局路径风险值,计算目标路径对应的风险值,从而提高了目标路径的风险值确定的准确性。
进一步的,在确定了每个目标路径对应的风险值后,即可根据风险值对至少两个目标路径进行排序,进而基于知识图谱确定风险标签,具体实现如下:
根据所述风险值对至少两个目标路径进行排序,并根据排序结果在所述至少两个目标路径中确定目标风险路径;在所述知识图谱中确定所述目标风险路径对应的图谱结构,并将所述图谱结构作为所述目标风险路径中目标起始点对应的风险标签。
具体的,目标风险路径是指在至少两个目标路径中,基于排序结果确定的至少一条目标路径;图谱结构是指根据目标风险路径在知识图谱中确定的部分知识图谱,即,基于目标风险路径中包含的节点和关系在知识图谱中确定图谱结构。
基于此,根据每个目标路径对应的风险值的数值大小对至少两个目标路径中的每个目标路径进行排序,获得风险值从大到小或从小到大的排序结果。根据排序结果在至少两个目标路径中确定风险值最高的至少一个目标路径作为目标风险路径;在知识图谱中确定目标风险路径对应的图谱结构,并将图谱结构作为目标风险路径中目标起始点对应的风险标签。
沿用上例,根据计算得到的风险值对目标路径按照风险值从高到低进行排序,获得排序结果:个人的目标路径:个人-投资-企业5-持股-企业6,风险值1.5;个人的目标路径:个人-投资-企业5-持股-企业3,风险值1.125;企业5的目标路径:企业5-持股-企业6,风险值0.75;企业5的目标路径:企业5-持股-企业3,风险值0.45;企业1的目标路径:企业1-持股-企业3;企业2的目标路径:企业2-持股-企业3;企业4的目标路径:企业4-持股-企业3、企业4-持股-企业6;以及个人的目标路径:个人-投资-企业2-持股-企业3的风险值均为0。进而选择风险值最高的目标路径作为风险标签,即目标路径:个人-投资-企业5-持股-企业6,在知识图谱中确定其图谱结构,风险标签即为图谱结构形式的目标路径:个人-投资-企业5-持股-企业6,风险标签如图3a所示。
综上所述,通过基于风险值对至少两个目标路径进行排序,从而确定至少一个风险值最高的目标路径作为目标风险路径,实现了基于风险值对至少两条目标路径进行筛选。以图谱结构作为风险标签,从而使得用户查看风险标签时更加直观,提高用户的视觉体验。
进一步的,在确定了每个目标路径对应的风险值后,还可以先将目标路径转换为风险元路径,再根据风险值对至少两个风险元路径进行排序,进而基于知识图谱确定风险标签,具体实现如下:
分别确定所述至少两个目标路径中每个目标路径对应的风险元路径,获得至少两个风险元路径;根据所述风险值对所述至少两个风险元路径进行排序,并根据元路径排序结果在所述至少两个风险元路径中确定目标风险元路径;在所述知识图谱中确定所述目标风险元路径对应的图谱结构。
具体的,风险元路径是符号形式的目标路径;目标风险元路径是指在至少两个目标路径中,基于排序结果确定的至少一条符号形式的目标路径。
基于此,分别确定所述至少两个目标路径中每个目标路径对应的风险元路径,获得至少两个风险元路径;根据所述风险值对所述至少两个风险元路径进行排序,并根据元路径排序结果在所述至少两个风险元路径中确定目标风险元路径;在所述知识图谱中确定所述目标风险元路径对应的图谱结构。
沿用上例,确定每个目标路径对应的风险元路径,根据计算得到的风险值对风险元路径按照风险值从高到低进行排序,获得排序结果:个人的目标路径:个人-投资-企业5-持股-企业6对应风险元路径:P-inv-C-sh-C,风险值1.5;个人的目标路径:个人-投资-企业5-持股-企业3对应风险元路径:P-inv-C-sh-C,风险值1.125;企业5的目标路径:企业5-持股-企业6对应风险元路径:C-sh-C,风险值0.75;企业5的目标路径:企业5-持股-企业3对应风险元路径:C-sh-C,风险值0.45;企业1的目标路径:企业1-持股-企业3对应风险元路径:C-sh-C;企业2的目标路径:企业2-持股-企业3对应风险元路径:C-sh-C;企业4的目标路径:企业4-持股-企业3对应风险元路径:C-sh-C、企业4-持股-企业6对应风险元路径:C-sh-C;以及个人的目标路径:个人-投资-企业2-持股-企业3对应风险元路径:P-inv-C-sh-C,风险值均为0。进而选择风险值最高的风险元路径作为风险标签,即目标路径:个人-投资-企业5-持股-企业6对应的风险元路径:P-inv-C-sh-C,在知识图谱中确定其图谱结构,风险标签即为图谱结构形式的风险元路径:个人-投资-企业5-持股-企业6,风险标签如图3a所示。
综上所述,通过基于风险值对至少两个风险元路径进行排序,从而确定至少一个风险值最高的风险元路径作为目标风险元路径,实现了基于风险值对至少两条风险元路径进行筛选。以图谱结构作为风险标签,从而使得用户查看风险标签时更加直观,提高用户的视觉体验,便于用户更加直观的查看风险情况。
进一步的,在确定了风险标签后,即可在风险评估界面中的风险提示区域展示风险标签,具体实现如下:
接收针对第一目标对象的查看指令,并基于所述查看指令生成风险评估界面;在接收到针对所述风险评估界面中风险柱状图的确认指令的情况下,判断是否存在与所述第一目标对象对应的风险标签;若是,在所述风险评估界面中的风险提示区域展示所述第一目标对象对应的风险标签;若否,在所述风险评估界面中的风险提示区域展示风险提示信息。
具体的,第一目标对象是指知识图谱中的任意一个节点,即任意一个目标对象;风险评估界面是指与第一目标对象对应的用于展示第一目标对象的相关风险评估信息的界面,界面中可以展示风险评分、风险类型、正面标签、负面标签等信息;风险柱状图是指风险评估信息的界面中任意一个风险类型对应的柱状图,以柱状图的形式表示该风险类型对应的风险评分;风险提示信息可以是用于提示用户是否存在风险,或风险等级的信息。
基于此,服务器接收针对第一目标对象的查看指令,基于查看指令生成风险评估界面并在客户端中展示风险评估界面。在接收到针对风险评估界面中展示的风险柱状图的确认指令的情况下,判断是否存在与第一目标对象对应的风险标签;若存在,则在风险评估界面中的风险提示区域展示第一目标对象对应的风险标签;若不存在,则在风险评估界面中的风险提示区域展示风险提示信息。
沿用上例,当企业1的相关工作人员,或其他人员查看企业1对应的风险评估报告时,点击企业1相应的控件,获得如图3b所示的风险评估界面。风险评估界面中展示风险评分55,评分等级为一般,正面标签,负面标签,以及经营状况、关联关系、企业资质、舆情信息、违规信息等风险类型对应的柱状图,每个风险类型对应一个评分,经营状况50、关联关系50、企业资质55、舆情信息50、违规信息50。当查看风险评估报告的人员点击或将鼠标移动到关联关系柱状图时,如图3c所示,会弹出一个窗口区域,展示图谱结构形式的风险标签。
综上所述,以图谱结构的方式展示风险标签,从而使得用户查看风险标签时更加直观,提高用户的视觉体验,便于用户更加直观的查看风险情况。
本说明书一个实施例通过基于目标对象的关联关系数据构建知识图谱,并在知识图谱中进行随机游走,获得路径集合;从路径集合中筛选出第一起始节点与第一终止节点之间的至少两条目标路径,其中,第一起始节点为所述知识图谱中的任意一个节点,第一终止节点为基于第一起始节点进行随机游走确定的终止节点;根据风险节点对每条目标路径对应的风险参数进行记录;根据记录结果计算每条目标路径对应的风险值,并基于风险值确定风险标签。通过基于知识图谱进行随机游走确定目标路径,进而对目标路径进行分析和记录确定风险标签,从而提高了风险标签的确定效率,确保了风险标签确定的准确性。
下述结合附图4,以本说明书提供的基于知识图谱的风险标签确定方法在企业风险评估的应用为例,对所述基于知识图谱的风险标签确定方法进行进一步说明。其中,图4示出了本说明书一个实施例提供的一种基于知识图谱的风险标签确定方法的处理过程流程图,具体包括以下步骤。
步骤402,基于企业数据构建知识图谱。
以企业、个人为节点,企业和企业、企业和个人之前的关系为边创建知识图谱,其中,关系包括但不限于持股sh,法人lp,投资inv,下游ds等。
步骤404,在知识图谱中确定第一起始点。
在知识图谱中选择第一起始节点,其中,第一起始点为知识图谱中的任意一个节点。
步骤406,基于第一起始点在知识图谱中进行随机游走获得路径集合。
基于第一起始点在知识图谱中进行随机游走,获得随机游走对应的路径集合,路径集合中包括以知识图谱中的每个节点为起始点进行随机游走获得的路径。
步骤408,在路径集合中确定每个节点对应的最短路径,构成目标路径集合。
针对知识图谱中的每个节点,在路径集合中选择节点数量最少的路径作为节点目标路径,由每个节点对应的节点目标路径,构成目标路径集合。
步骤410,将目标路径集合转换为目标元路径集合,确定目标元路径集合中的第i元路径。
将目标路径集合中的每条目标路径均转换为字符表达形式的元路径,获得目标元路径集合,在目标元路径集合中选择一个目标元路径作为第i元路径。
步骤412,判断第i元路径是否在路径字典中,若是,执行步骤414;若否,执行步骤416。
步骤414,对第i元路径对应的路径数值进行更新,在第i元路径中包含风险节点的情况下,对第i元路径对应的风险数值进行更新。
在路径字典中存在第i元路径的情况下,对路径字典中第i元路径对应的路径数值进行更新。再判断第i元路径中是否包含风险节点,若包含风险节点,则对第i元路径对应的风险数值进行更新。
步骤416,将第i元路径写入路径字典,并对第i元路径对应的路径数值进行更新,在第i元路径中包含风险节点的情况下,对第i元路径对应的风险数值进行更新。
在路径字典中不存在第i元路径的情况下,将第i元路径写入路径字典,对路径字典中第i元路径对应的路径数值进行更新。再判断第i元路径中是否包含风险节点,若包含风险节点,则对第i元路径对应的风险数值进行更新。
步骤418,i自增1,判断i是否大于n,若是,执行步骤420;若否,执行步骤410。
n为第i路径集合中的路径数量,i自增1,并判断i是否大于n,i大于n,表示目标元路径集合中包含的元路径对应的路径数值均已完成更新;i小于n,表示目标元路径集合中还存在未进行处理的元路径。
步骤420,分别计算路径字典中每个元路径对应的风险值。
根据路径字典中存储的路径数值和风险数值对每个元路径对应的风险值进行计算。即,计算元路径对应的路径数值和风险数值比值,获得元路径对应的路径风险值,计算路径字典中全局路径数值和全局风险数值之间的比值,获得目标全局风险值,再计算路径风险值和目标全局风险值之间的比值,获得元路径对应的风险值。
步骤422,基于风险值对元路径进行排序,并确定风险元路径。
根据计算得到的风险值对元路径进行排序,按照风险值排序结果选择风险值最高的一个元路径,或者按照风险值排序选择N个元路径,作为风险元路径。
步骤424,将风险元路径对应的图谱结构作为风险标签。
在知识图谱中确定风险元路径对应的图谱结构,将图谱结构作为风险元路径中起始点对应的风险标签。
综上所述,通过创建知识图谱,并基于知识图谱中每个节点为起始点在知识图谱中进行随机游走确定元路径,进而对元路径进行分析和记录确定风险标签,从而提高了风险标签的确定效率,确保了风险标签确定的准确性。将图谱结构作为风险标签,从而使得用户查看风险标签时更加直观,提高用户的视觉体验,便于用户更加直观的查看风险情况。
与上述方法实施例相对应,本说明书还提供了基于知识图谱的风险标签确定装置实施例,图5示出了本说明书一个实施例提供的一种基于知识图谱的风险标签确定装置的结构示意图。如图5所示,该装置包括:
构建模块502,被配置为基于目标对象的关联关系数据构建知识图谱,并在所述知识图谱中进行随机游走,获得路径集合;
筛选模块504,被配置为从所述路径集合中筛选出第一起始节点与第一终止节点之间的至少两条目标路径,其中,所述第一起始节点为所述知识图谱中的任意一个节点,所述第一终止节点为基于所述第一起始节点进行随机游走确定的终止节点;
记录模块506,被配置为根据风险节点对每条目标路径对应的风险参数进行记录;
计算模块508,被配置为根据记录结果计算每条目标路径对应的风险值,并基于所述风险值确定风险标签。
一个可选地实施例中,所述筛选模块504,进一步被配置为:
在所述路径集合中确定所述第一起始节点和所述第一终止节点之间的节点路径集合;在所述节点路径集合中筛选包含节点数量最少的节点路径作为所述至少两条目标路径。
一个可选地实施例中,所述记录模块506,还被配置为:
分别将所述至少两条目标路径中的每条目标路径转换为元路径,获得所述至少两条目标路径对应的至少两条元路径;相应的,所述根据风险节点对每条目标路径对应的风险参数进行记录,包括:根据所述风险节点对每条元路径对应的风险参数进行记录。
一个可选地实施例中,所述记录模块506,进一步被配置为:
在所述至少两条目标路径中选择第i目标路径,其中,i为大于等于1的正整数;
判断路径字典中是否存在所述第i目标路径;若是,在所述第i目标路径包含风险节点的情况下,更新所述第i目标路径对应的风险参数中的路径数值和风险数值,i自增1,并执行所述在所述至少两条目标路径中选择第i目标路径的步骤;若否,将所述第i目标路径写入所述路径字典,并在所述第i目标路径包含风险节点的情况下,更新所述第i目标路径对应的风险参数中的路径数值和风险数值,i自增1,并执行所述在所述至少两条目标路径中选择第i目标路径的步骤;直至i自增至n,执行根据记录结果计算每条目标路径对应的风险值,并基于所述风险值确定风险标签,其中,n为目标路径条数。
一个可选地实施例中,所述记录模块506,还被配置为:
在所述第i目标路径不包含风险节点的情况下,更新所述第i目标路径对应的风险参数中的路径数值,i自增1,并执行所述在所述至少两条目标路径中选择第i目标路径的步骤;相应的,在所述路径字典中不存在第i目标路径的情况下,还包括:将所述第i目标路径写入所述路径字典,并在所述第i目标路径不包含风险节点的情况下,更新所述第i目标路径对应的风险参数中的路径数值,i自增1,并执行所述在所述至少两条目标路径中选择第i目标路径的步骤。
一个可选地实施例中,所述记录模块506,还被配置为:
创建用于存储目标路径和风险参数的路径字典,其中,所述风险参数包括路径数值和风险数值。
一个可选地实施例中,所述记录模块506,进一步被配置为:
根据所述记录结果在所述路径字典中确定目标路径对应的路径数值和风险数值,并根据所述目标路径的路径数值和风险数值计算所述目标路径的路径风险值;确定所述路径字典对应的全局路径数值和全局风险数值,并根据所述全局路径数值和所述全局风险数值计算全局路径风险值;基于所述路径风险值和所述全局路径风险值,计算所述目标路径对应的风险值。
一个可选地实施例中,所述计算模块508,进一步被配置为:
根据所述风险值对至少两个目标路径进行排序,并根据排序结果在所述至少两个目标路径中确定目标风险路径;在所述知识图谱中确定所述目标风险路径对应的图谱结构,并将所述图谱结构作为所述目标风险路径中目标起始点对应的风险标签。
一个可选地实施例中,所述计算模块508,进一步被配置为:
分别确定所述至少两个目标路径中每个目标路径对应的风险元路径,获得至少两个风险元路径;根据所述风险值对所述至少两个风险元路径进行排序,并根据元路径排序结果在所述至少两个风险元路径中确定目标风险元路径;相应的,所述在所述知识图谱中确定所述目标风险路径对应的图谱结构,包括:在所述知识图谱中确定所述目标风险元路径对应的图谱结构。
一个可选地实施例中,所述构建模块502,进一步被配置为:
分别以所述知识图谱中包含的每个节点为起始点,按照所述知识图谱中节点之间的关系确定游走方向,并根据所述游走方向在所述知识图谱中进行随机游走,获得每个节点对应的节点路径集合;将每个节点对应的节点路径集合整合为所述路径集合。
一个可选地实施例中,所述计算模块508,还被配置为:
接收针对第一目标对象的查看指令,并基于所述查看指令生成风险评估界面;在接收到针对所述风险评估界面中风险柱状图的确认指令的情况下,判断是否存在与所述第一目标对象对应的风险标签;若是,在所述风险评估界面中的风险提示区域展示所述第一目标对象对应的风险标签;若否,在所述风险评估界面中的风险提示区域展示风险提示信息。
本说明书实施例提供基于知识图谱的风险标签确定装置,包括:基于目标对象的关联关系数据构建知识图谱,并在知识图谱中进行随机游走,获得路径集合;从路径集合中筛选出第一起始节点与第一终止节点之间的至少两条目标路径,其中,第一起始节点为所述知识图谱中的任意一个节点,第一终止节点为基于第一起始节点进行随机游走确定的终止节点;根据风险节点对每条目标路径对应的风险参数进行记录;根据记录结果计算每条目标路径对应的风险值,并基于风险值确定风险标签。通过基于知识图谱进行随机游走确定目标路径,进而对目标路径进行分析和记录确定风险标签,从而提高了风险标签的确定效率,确保了风险标签确定的准确性。
下述结合附图6,以本说明书提供的基于知识图谱的风险标签确定方法在人员信用风险评估的应用为例,对所述基于知识图谱的风险标签确定方法进行进一步说明。其中,图6示出了本说明书一个实施例提供的一种基于知识图谱的风险标签确定方法的处理流程图,具体包括以下步骤。
步骤602,基于人员信用数据构建知识图谱。
步骤604,在知识图谱中确定第一起始点。
步骤606,基于第一起始点在知识图谱中进行随机游走获得信用路径集合。
步骤408,在信用路径集合中确定每个人员节点对应的最短路径,构成目标路径集合。
步骤610,将目标路径集合转换为目标元路径集合,确定目标元路径集合中的第i元路径。
步骤412,判断第i元路径是否在路径字典中,若是,执行步骤414;若否,执行步骤416。
步骤614,对第i元路径对应的路径数值进行更新,在第i元路径中包含风险节点的情况下,对第i元路径对应的风险数值进行更新。
步骤616,将第i元路径写入路径字典,并对第i元路径对应的路径数值进行更新,在第i元路径中包含风险节点的情况下,对第i元路径对应的风险数值进行更新。
步骤418,i自增1,判断i是否大于n,若是,执行步骤420;若否,执行步骤410。
步骤620,分别计算路径字典中每个元路径对应的风险值。
步骤622,基于风险值对元路径进行排序,并确定风险元路径。
步骤624,将风险元路径对应的图谱结构作为风险标签。
综上所述,通过创建知识图谱,并基于知识图谱中每个节点为起始点在知识图谱中进行随机游走确定元路径,进而对元路径进行分析和记录确定风险标签,从而提高了风险标签的确定效率,确保了风险标签确定的准确性。将图谱结构作为风险标签,从而使得用户查看风险标签时更加直观,提高用户的视觉体验,便于用户更加直观的查看风险情况。
上述为本实施例的一种基于知识图谱的风险标签确定装置的示意性方案。需要说明的是,该基于知识图谱的风险标签确定装置的技术方案与上述的基于知识图谱的风险标签确定方法的技术方案属于同一构思,基于知识图谱的风险标签确定装置的技术方案未详细描述的细节内容,均可以参见上述基于知识图谱的风险标签确定方法的技术方案的描述。
图7示出了根据本说明书一个实施例提供的一种计算设备700的结构框图。该计算设备700的部件包括但不限于存储器710和处理器720。处理器720与存储器710通过总线730相连接,数据库750用于保存数据。
计算设备700还包括接入设备740,接入设备740使得计算设备700能够经由一个或多个网络760通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备740可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。
在本说明书的一个实施例中,计算设备700的上述部件以及图7中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图7所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
计算设备700可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或PC的静止计算设备。计算设备700还可以是移动式或静止式的服务器。
其中,处理器720用于执行如下计算机可执行指令,该计算机可执行指令被处理器执行时实现上述基于知识图谱的风险标签确定方法的步骤。
上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的基于知识图谱的风险标签确定方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述基于知识图谱的风险标签确定方法的技术方案的描述。
本说明书一实施例还提供一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现上述基于知识图谱的风险标签确定方法的步骤。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的基于知识图谱的风险标签确定方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述基于知识图谱的风险标签确定方法的技术方案的描述。
本说明书一实施例还提供一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述基于知识图谱的风险标签确定方法的步骤。
上述为本实施例的一种计算机程序的示意性方案。需要说明的是,该计算机程序的技术方案与上述的基于知识图谱的风险标签确定方法的技术方案属于同一构思,计算机程序的技术方案未详细描述的细节内容,均可以参见上述基于知识图谱的风险标签确定方法的技术方案的描述。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本说明书实施例并不受所描述的动作顺序的限制,因为依据本说明书实施例,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本说明书实施例所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书实施例的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本说明书实施例的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。

Claims (14)

1.一种基于知识图谱的风险标签确定方法,包括:
基于目标对象的关联关系数据构建知识图谱,并在所述知识图谱中进行随机游走,获得路径集合;
从所述路径集合中筛选出第一起始节点与第一终止节点之间的至少两条目标路径,其中,所述第一起始节点为所述知识图谱中的任意一个节点,所述第一终止节点为基于所述第一起始节点进行随机游走确定的终止节点;
根据风险节点对每条目标路径对应的风险参数进行记录;
根据记录结果计算每条目标路径对应的风险值,并基于所述风险值确定风险标签。
2.根据权利要求1所述的方法,所述从所述路径集合中筛选出第一起始节点与第一终止节点之间的至少两条目标路径,包括:
在所述路径集合中确定所述第一起始节点和所述第一终止节点之间的节点路径集合;
在所述节点路径集合中筛选包含节点数量最少的节点路径作为所述至少两条目标路径。
3.根据权利要求1所述的方法,所述从所述路径集合中筛选出第一起始节点与第一终止节点之间的至少两条目标路径步骤执行之后,还包括:
分别将所述至少两条目标路径中的每条目标路径转换为元路径,获得所述至少两条目标路径对应的至少两条元路径;
相应的,所述根据风险节点对每条目标路径对应的风险参数进行记录,包括:
根据所述风险节点对每条元路径对应的风险参数进行记录。
4.根据权利要求1所述的方法,所述根据风险节点对每条目标路径对应的风险参数进行记录,包括:
在所述至少两条目标路径中选择第i目标路径,其中,i为大于等于1的正整数;
判断路径字典中是否存在所述第i目标路径;
若是,在所述第i目标路径包含风险节点的情况下,更新所述第i目标路径对应的风险参数中的路径数值和风险数值,i自增1,并执行所述在所述至少两条目标路径中选择第i目标路径的步骤;
若否,将所述第i目标路径写入所述路径字典,并在所述第i目标路径包含风险节点的情况下,更新所述第i目标路径对应的风险参数中的路径数值和风险数值,i自增1,并执行所述在所述至少两条目标路径中选择第i目标路径的步骤;
直至i自增至n,执行根据记录结果计算每条目标路径对应的风险值,并基于所述风险值确定风险标签,其中,n为目标路径条数。
5.根据权利要求4所述的方法,在所述路径字典中存在第i目标路径的情况下,还包括:
在所述第i目标路径不包含风险节点的情况下,更新所述第i目标路径对应的风险参数中的路径数值,i自增1,并执行所述在所述至少两条目标路径中选择第i目标路径的步骤;
相应的,在所述路径字典中不存在第i目标路径的情况下,还包括:
将所述第i目标路径写入所述路径字典,并在所述第i目标路径不包含风险节点的情况下,更新所述第i目标路径对应的风险参数中的路径数值,i自增1,并执行所述在所述至少两条目标路径中选择第i目标路径的步骤。
6.根据权利要求4所述的方法,还包括:
创建用于存储目标路径和风险参数的路径字典,其中,所述风险参数包括路径数值和风险数值。
7.根据权利要求6所述的方法,所述至少两条目标路径中,任意一条目标路径对应的风险值的计算,包括:
根据所述记录结果在所述路径字典中确定目标路径对应的路径数值和风险数值,并根据所述目标路径的路径数值和风险数值计算所述目标路径的路径风险值;
确定所述路径字典对应的全局路径数值和全局风险数值,并根据所述全局路径数值和所述全局风险数值计算全局路径风险值;
基于所述路径风险值和所述全局路径风险值,计算所述目标路径对应的风险值。
8.根据权利要求1所述的方法,所述基于所述风险值确定风险标签,包括:
根据所述风险值对至少两个目标路径进行排序,并根据排序结果在所述至少两个目标路径中确定目标风险路径;
在所述知识图谱中确定所述目标风险路径对应的图谱结构,并将所述图谱结构作为所述目标风险路径中目标起始点对应的风险标签。
9.根据权利要求8所述的方法,所述根据所述风险值对至少两个目标路径进行排序,并根据排序结果在所述至少两个目标路径中确定目标风险路径,包括:
分别确定所述至少两个目标路径中每个目标路径对应的风险元路径,获得至少两个风险元路径;
根据所述风险值对所述至少两个风险元路径进行排序,并根据元路径排序结果在所述至少两个风险元路径中确定目标风险元路径;
相应的,所述在所述知识图谱中确定所述目标风险路径对应的图谱结构,包括:
在所述知识图谱中确定所述目标风险元路径对应的图谱结构。
10.根据权利要求1所述的方法,所述在所述知识图谱中进行随机游走,获得路径集合,包括:
分别以所述知识图谱中包含的每个节点为起始点,按照所述知识图谱中节点之间的关系确定游走方向,并根据所述游走方向在所述知识图谱中进行随机游走,获得每个节点对应的节点路径集合;
将每个节点对应的节点路径集合整合为所述路径集合。
11.根据权利要求1所述的方法,所述基于所述风险值确定风险标签步骤执行之后,还包括:
接收针对第一目标对象的查看指令,并基于所述查看指令生成风险评估界面;
在接收到针对所述风险评估界面中风险柱状图的确认指令的情况下,判断是否存在与所述第一目标对象对应的风险标签;
若是,在所述风险评估界面中的风险提示区域展示所述第一目标对象对应的风险标签;
若否,在所述风险评估界面中的风险提示区域展示风险提示信息。
12.一种基于知识图谱的风险标签确定装置,包括:
构建模块,被配置为基于目标对象的关联关系数据构建知识图谱,并在所述知识图谱中进行随机游走,获得路径集合;
筛选模块,被配置为从所述路径集合中筛选出第一起始节点与第一终止节点之间的至少两条目标路径,其中,所述第一起始节点为所述知识图谱中的任意一个节点,所述第一终止节点为基于所述第一起始节点进行随机游走确定的终止节点;
记录模块,被配置为根据风险节点对每条目标路径对应的风险参数进行记录;
计算模块,被配置为根据记录结果计算每条目标路径对应的风险值,并基于所述风险值确定风险标签。
13.一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1至11任意一项所述基于知识图谱的风险标签确定方法的步骤。
14.一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1至11任意一项所述基于知识图谱的风险标签确定方法的步骤。
CN202210947926.6A 2022-08-08 2022-08-08 基于知识图谱的风险标签确定方法以及装置 Pending CN115374940A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210947926.6A CN115374940A (zh) 2022-08-08 2022-08-08 基于知识图谱的风险标签确定方法以及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210947926.6A CN115374940A (zh) 2022-08-08 2022-08-08 基于知识图谱的风险标签确定方法以及装置

Publications (1)

Publication Number Publication Date
CN115374940A true CN115374940A (zh) 2022-11-22

Family

ID=84063068

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210947926.6A Pending CN115374940A (zh) 2022-08-08 2022-08-08 基于知识图谱的风险标签确定方法以及装置

Country Status (1)

Country Link
CN (1) CN115374940A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116094955A (zh) * 2022-11-25 2023-05-09 上海天旦网络科技发展有限公司 基于自演化网络知识库的运维故障链标注系统及方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116094955A (zh) * 2022-11-25 2023-05-09 上海天旦网络科技发展有限公司 基于自演化网络知识库的运维故障链标注系统及方法
CN116094955B (zh) * 2022-11-25 2024-06-11 上海天旦网络科技发展有限公司 基于自演化网络知识库的运维故障链标注系统及方法

Similar Documents

Publication Publication Date Title
CN109960810B (zh) 一种实体对齐方法及装置
US20150142423A1 (en) Phrase-based data classification system
EP2618296A1 (en) Social media data analysis system and method
US20200065710A1 (en) Normalizing text attributes for machine learning models
CN111160959B (zh) 一种用户点击转化预估方法及装置
CN111881688B (zh) 基于屏蔽泛化机制的事件因果关系识别方法、系统、装置
CN116611546B (zh) 基于知识图谱的目标研究区域滑坡预测方法及系统
CN112488003A (zh) 一种人脸检测方法、模型创建方法、装置、设备及介质
CN113269244A (zh) 针对工商登记信息中跨企业人员重名实现消歧处理方法、系统、装置、处理器及其存储介质
CN114138977A (zh) 日志处理方法、装置、计算机设备和存储介质
CN115374940A (zh) 基于知识图谱的风险标签确定方法以及装置
CN112115971A (zh) 一种基于异质学术网络进行学者画像的方法及系统
CN113392920A (zh) 生成作弊预测模型的方法、装置、设备、介质及程序产品
CN116777692A (zh) 基于数据分析的在线学习方法、装置、设备及存储介质
CN109918544B (zh) 基于粗糙集的职务犯罪社会关系网络智能分析方法及系统
CN114417974B (zh) 模型训练方法、信息处理方法、装置、电子设备和介质
CN116257758A (zh) 模型训练方法、人群拓展方法、介质、装置和计算设备
US11782923B2 (en) Optimizing breakeven points for enhancing system performance
US20190205195A1 (en) System for decomposing events from managed infrastructures with natural language processing
Miyoshi et al. Mining interesting patterns and rules in a time-evolving graph
CN115935231A (zh) 一种数据分类方法、装置、设备及存储介质
CN114611609A (zh) 一种图网络模型节点分类方法、装置、设备及存储介质
CN114240179A (zh) 一种基于事件图谱的财务流程挖掘方法和相关装置
CN113612777A (zh) 训练方法、流量分级方法、装置、电子设备以及存储介质
CN113190154A (zh) 模型训练、词条分类方法、装置、设备、存储介质及程序

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination