CN116167867A

CN116167867A - 基于知识图谱的保险业务风险识别方法、装置及电子设备

Info

Publication number: CN116167867A
Application number: CN202211675724.7A
Authority: CN
Inventors: 李超; 潘曦; 刘震; 刘伟鹏; 李朔
Original assignee: Peoples Insurance Company of China
Current assignee: Peoples Insurance Company of China
Priority date: 2022-12-26
Filing date: 2022-12-26
Publication date: 2023-05-26

Abstract

本申请公开了一种基于知识图谱的保险业务风险识别方法、装置及电子设备，所述方法包括：获取与目标保险业务相关的结构化数据；根据所述结构化数据查找包含所述结构化数据的知识图谱；基于所述知识图谱，对所述目标保险业务进行风险识别。通过本申请实施例，可以避免相关技术中由于需要使用SQL语句进行多表关联查询使得查询效率较低，从而导致的风险识别效率较低的问题。

Description

基于知识图谱的保险业务风险识别方法、装置及电子设备

技术领域

本申请涉及风险识别领域，尤其涉及一种基于知识图谱的保险业务风险识别方法、装置及电子设备。

背景技术

随着保险行业的快速发展，人们对各种保险产品的需求也日益增多。然而，经常有犯罪分子为了自己的非法利益，会进行保险欺诈，例如，个人欺诈和团伙欺诈。因此，为了保证保险行业的良好发展，需要采用相应的手段对相关保险业务进行风险识别。

相关技术中，在对保险业务进行风险识别时，通常是在关系型数据库中使用SQL语句进行多表关联，从而查找风险所在的个人、企业或指定目标等。例如，以车险承保业务为例，相关技术中通常是将车辆基本信息表与车辆信息变更记录表、保单表、理赔记录表等进行多表关联，查出车辆基本信息、关联信息视图，然后在视图中对车辆记录信息进行条件筛选，从而识别出风险车辆。

采用上述方法对保险业务进行风险识别时，由于需要使用SQL语句进行多表关联查询，这样会使得查询效率较低，从而导致风险识别的识别效率较低的问题。

发明内容

本申请实施例提供一种用以解决现有技术中由于需要使用SQL语句进行多表关联查询，这样会使得查询效率较低，从而导致风险识别的识别效率较低的问题。

本申请实施例还提供一种基于知识图谱的保险业务风险识别方法、装置及电子设备，以及一种计算机可读存储介质。

本申请实施例采用下述技术方案：

一种基于知识图谱的保险业务风险识别方法，包括：

获取与目标保险业务相关的结构化数据；

根据结构化数据查找包含结构化数据的知识图谱；

基于知识图谱，对目标保险业务进行风险识别。

可选的，在根据结构化数据查找包含结构化数据的知识图谱之前，方法还包括：

按照预先定义的与目标保险业务匹配的实体、关系以及知识层级结构，对结构化数据进行实体识别和实体之间的关系抽取，以得到多个层级的目标实体和目标实体之间的目标关系；

根据目标实体和目标实体之间的目标关系构建知识图谱。

可选的，知识图谱包括结构化数据中各目标实体的拓扑结构、目标关系，属性信息，各拓扑结构组成的全图，以及由全图的拓扑结构拆解的子图；则，

基于知识图谱，对目标保险业务进行风险识别，包括：

根据各目标实体的拓扑结构、目标关系，属性信息，全图以及子图，确定各目标实体的特征向量；

根据各目标实体的特征向量，通过预设的风险识别算法对目标保险业务进行风险识别。

可选的，根据各目标实体的拓扑结构、目标关系，属性信息，全图以及子图，确定各目标实体的特征向量，包括：

将各目标实体的拓扑结构、目标关系，属性信息，全图以及子图输入至预先训练完成的图神经网络，以从图神经网络的输出结果中确定各目标实体的特征向量；

其中，图神经网络是以不同实体的拓扑结构、不同实体之间的关系，以及不同实体的拓扑结构组成的目标全图，由目标全图的拓扑结构拆解的目标子图作为图神经网络的输入，以不同实体的特征向量作为图神经网络的输出结果训练得到。

可选的，根据各目标实体的特征向量，通过预设的风险识别算法对目标保险业务进行风险识别，包括：

确定目标保险业务的风险特征因子，并根据风险特征因子确定风险特征向量；

根据各目标实体的特征向量和风险特征向量，通过预设的风险识别算法对目标保险业务进行风险识别。

可选的，根据各目标实体的特征向量和风险特征向量，通过预设的风险识别算法对目标保险业务进行风险识别，包括：

通过预设的风险识别算法对各目标实体的特征向量进行分类，得到分类结果；

基于分类结果和风险特征向量的相似程度，对目标保险业务进行风险识别。

可选的，方法还包括：

根据风险特征向量进行加权运算，以得到风险特征向量的特征值权重；

根据特征值权重和各目标实体的特征向量，确定各目标实体的风险等级。

一种基于知识图谱的保险业务风险识别装置，包括获取模块、查找模块和识别模块，其中：

获取模块，用于获取与目标保险业务相关的结构化数据；

查找模块，用于根据结构化数据查找包含结构化数据的知识图谱；

识别模块，用于基于知识图谱，对目标保险业务进行风险识别。

可选的，装置还包括：

根据目标实体和目标实体之间的目标关系构建知识图谱。

识别模块，包括：

确定单元，用于根据各目标实体的拓扑结构、目标关系，属性信息，全图以及子图，确定各目标实体的特征向量；

识别单元，用于根据各目标实体的特征向量，通过预设的风险识别算法对目标保险业务进行风险识别。

可选的，确定单元，用于：

可选的，识别单元，包括：

确定子单元，用于确定目标保险业务的风险特征因子，并根据风险特征因子确定风险特征向量；

识别子单元，用于根据各目标实体的特征向量和风险特征向量，通过预设的风险识别算法对目标保险业务进行风险识别。

可选的，识别子单元，用于：

可选的，装置还用于：

一种电子设备，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如上所述的基于知识图谱的保险业务风险识别方法的步骤。

一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如上所述的基于知识图谱的保险业务风险识别方法的步骤。

本申请实施例采用的上述至少一个技术方案能够达到以下有益效果：

采用本申请实施例提供的方法，可以根据与目标保险业务相关的结构化数据查找包含该结构化数据的知识图谱；然后基于知识图谱对所述目标保险业务进行风险识别；由于结构化数据中的各个实体之间的关联作为知识图谱中的关系存储在知识图谱中，这样一来，若需要进行风险识别，则仅需要在同一知识图谱中进行查询，从而可以避免相关技术中由于需要使用SQL语句进行多表关联查询使得查询效率较低，从而导致的风险识别效率较低的问题。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1为本申请实施例提供的一种基于知识图谱的保险业务风险识别方法的实现流程示意图；

图2为本申请实施例提供的一种构建包含结构化数据的知识图谱的方法的实现流程示意图；

图3为本申请实施例提供的一种与目标保险业务匹配的实体、关系以及知识层级结构的示意图；

图4为本申请实施例提供的一种基于知识图谱的保险业务风险识别装置的具体结构示意图；

图5为本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

以下结合附图，详细说明本申请各实施例提供的技术方案。

实施例1

为解决现有技术中由于需要使用SQL语句进行多表关联查询，这样会使得查询效率较低，从而导致风险识别的识别效率较低的问题，本申请实施例提供一种基于知识图谱的保险业务风险识别方法。

该方法的执行主体，可以是各种类型的计算设备，或者，可以是安装于计算设备上的应用程序或应用(Application，APP)。所述的计算设备，比如可以是手机、平板电脑、智能可穿戴设备等用户终端，也可以是服务器等。

为便于描述，本申请实施例以该方法的执行主体为服务器为例，对该方法进行介绍。本领域技术人员可以理解，本申请实施例以该服务器为例对方法进行介绍，仅是一种示例性说明，并不对本方案对应的权利要求保护范围构成限制。

具体地，本申请实施例提供的该方法的实现流程如图1所示，包括如下步骤：

步骤11，获取与目标保险业务相关的结构化数据。

目标保险业务，可以理解为需要进行风险识别的保险业务。例如，若需要针对车险承保业务中的黑名单车辆、黑名单企业以及黑名单驾驶员等进行识别，则可以将车险承保业务作为目标保险业务，然后获取与车险承保业务相关的结构化数据。

其中，结构化数据是指表格、数据库等按照一定格式表示的数据，通常可以直接用来构建知识图谱。对应的，与目标保险业务相关的结构化数据，也即与目标保险业务相关的表格、数据库等按照一定格式表示的数据，通常可以包括关于实体的文本数据和关于关系的文本数据等两大类。可选的，关于实体的文本数据和关于关系的文本数据通常可以采用分隔的数据格式存储。

例如，以实体为车辆为例，则关于实体的文本数据可以包含车辆ID、车牌号、车架号、发动机号、车型、颜色外观等。

或者，以实体为保单为例，则关于实体的文本数据可以包含保单号、出单机构、投保日期、生效日期、总保费、适用条款等。

对应的，用于表征车辆与保单关系(合约)的描述文件，可以包含车辆ID(START_ID)、保单号(TARGET_ID)、起保日期、保障类型等属性。

本申请实施例中，以目标保险业务为车险承保业务或车险理赔业务为例，则获取与目标保险业务相关的结构化数据时，可以从车险承保、车险理赔业务系统化中提取车辆、理赔、保单、关系人、黑名单等结构化数据；或是从信用险系统中提取的企业、黑名单、保单等结构化数据。

步骤12，根据结构化数据查找包含结构化数据的知识图谱。

本申请中可以将各个保险险种的数据按照预先定义的风险领域的实体、关系与知识层级结构进行整合、处理和导入，以此形成存储在图数据库的各个保险险种的知识图谱。之后，则可以根据结构化数据，从预设的图数据库中查找包含结构化数据的知识图谱。为了提高查询效率，本申请实施例中，可以先根据结构化数据确定该结构化数据的所属领域/相关领域，然后再根据该结构化数据的相关领域信息，从预设的图数据库中查找包含结构化数据的知识图谱。

如图2所示，在一种可选的实施方式中，可以按照如下方式预先构建包含结构化数据的知识图谱：

步骤21，按照预先定义的与目标保险业务匹配的实体、关系以及知识层级结构，对结构化数据进行实体识别和实体之间的关系抽取，以得到多个层级的目标实体和目标实体之间的目标关系。

例如，以车险承保业务为例，本申请实施例可以根据业务需求预先定义车辆、关系人、车队、保单、代理人、理赔、归属机构等7种与目标保险业务匹配的实体；其次，对应的关系可以定义为：车主、拥有、持有、合约、代理、被保险人、投保人、禁止保存投保单、推送核保、出单、管理、出险等。

如图3所示，为本申请实施例提供的一种与目标保险业务匹配的实体、关系以及知识层级结构的示意图。图3中的每个圆形“节点”表示一个实体，不同圆形“节点”之间的“边”表示不同实体之间的关系。

步骤22，根据目标实体和目标实体之间的目标关系构建知识图谱。

本申请实施例中，可以根据目标实体和目标实体之间的目标关系，使用预设导入工具，例如neo4j-admin，将目标实体和目标实体之间的目标关系导入到图数据库，从而构建得到知识图谱。

可选的，在将目标实体和目标实体之间的目标关系导入到图数据库中之后，还可以进一步完善关于目标实体的索引的创建和部分属性数据类型的调整。

步骤13，基于知识图谱，对目标保险业务进行风险识别。

其中，知识图谱包括结构化数据中各目标实体的拓扑结构、目标关系，属性信息，各拓扑结构组成的全图，以及由全图的拓扑结构拆解的子图。

本申请实施例中，基于知识图谱对目标保险业务进行风险识别时，可以根据各目标实体的拓扑结构、目标关系，属性信息，全图以及子图，确定各目标实体的特征向量；然后再根据各目标实体的特征向量，通过预设的风险识别算法对目标保险业务进行风险识别。

预设的风险识别算法，可以包括标签传播算法和聚类算法，具体的，聚类算法可以包括K-means和SVM算法等。

其中，各目标实体的特征向量可以通过图神经网络(比如，GNN和graphembedding)得到。具体的，可以将各目标实体的拓扑结构、目标关系，属性信息，全图以及子图输入至预先训练完成的图神经网络，以从图神经网络的输出结果中确定各目标实体的特征向量。

图神经网络，是以不同实体的拓扑结构、不同实体之间的关系，以及不同实体的拓扑结构组成的目标全图，由目标全图的拓扑结构拆解的目标子图作为图神经网络的输入，以不同实体的特征向量作为图神经网络的输出结果训练得到。

可选的，本申请实施例中，图神经网络可以是3层的GNN模型，将各目标实体的拓扑结构、目标关系，属性信息，全图以及子图输入GNN模型中之后，每个实体的特征都会与邻近的实体特征相结合。经过第一层模型时，可以将每个实体特征与邻近的实体特征相结合；经过第二层模型时，可以将每个实体特征与邻近实体的邻近实体的特征相结合，以此类推，通过本申请实时提供的图神经网络，最终每个实体都可以输出一个带有多度邻近实体特征的特征向量。

本申请实施例中，根据各目标实体的特征向量，通过预设的风险识别算法对目标保险业务进行风险识别时，可以先确定目标保险业务的风险特征因子，并根据风险特征因子确定风险特征向量；根据各目标实体的特征向量和风险特征向量，通过预设的风险识别算法对目标保险业务进行风险识别。

例如，可以选取风险特征因子(是否跨省变更过投保机构，近3年出险次数，是否发生过酒驾，理赔金额，历史出险涉及总驾驶员人数，多人同车同店维修次数等)组成特征向量，作为风险特征向量；然后，再根据各目标实体的特征向量和风险特征向量，通过预设的风险识别算法对目标保险业务进行风险识别。

可选的，根据各目标实体的特征向量和风险特征向量，通过预设的风险识别算法对目标保险业务进行风险识别，包括：通过预设的风险识别算法对各目标实体的特征向量进行分类，得到分类结果；基于分类结果和风险特征向量的相似程度，对目标保险业务进行风险识别。

例如，本申请实施例中，可以将实体特征向量作为聚类的数据集，按照K-means和SVM算法，将实体分为有风险和无风险两类。

或者，本申请实施例中也可以根据各目标实体的特征向量和风险特征向量，使用标签传播算法对目标保险业务进行风险标记与预测。

在一种可选的实施方式中，还可以根据风险特征向量进行加权运算，以得到风险特征向量的特征值权重；根据特征值权重和各目标实体的特征向量，确定各目标实体的风险等级。

实施例2

为解决现有技术存在的由于需要使用SQL语句进行多表关联查询，这样会使得查询效率较低，从而导致风险识别的识别效率较低的问题，本申请实施例提供一种基于知识图谱的保险业务风险识别装置40，该装置40的具体结构示意图如图4所示，包括获取模块、查找模块和识别模块。各模块的功能如下：

获取模块41，用于获取与目标保险业务相关的结构化数据；

查找模块42，用于根据结构化数据查找包含结构化数据的知识图谱；

识别模块43，用于基于知识图谱，对目标保险业务进行风险识别。

可选的，装置还包括：

抽取模块，用于按照预先定义的与目标保险业务匹配的实体、关系以及知识层级结构，对结构化数据进行实体识别和实体之间的关系抽取，以得到多个层级的目标实体和目标实体之间的目标关系；

构建模块，用于根据目标实体和目标实体之间的目标关系构建知识图谱。

识别模块43，包括：

可选的，确定单元，用于：

可选的，识别单元，包括：

可选的，识别子单元，用于：

可选的，装置还用于：

采用本申请实施例提供的装置，可以根据与目标保险业务相关的结构化数据查找包含该结构化数据的知识图谱；然后基于知识图谱对所述目标保险业务进行风险识别；由于结构化数据中的各个实体之间的关联作为知识图谱中的关系存储在知识图谱中，这样一来，若需要进行风险识别，则仅需要在同一知识图谱中进行查询，从而可以避免相关技术中由于需要使用SQL语句进行多表关联查询使得查询效率较低，从而导致的风险识别效率较低的问题。

实施例3

图5为实现本申请各个实施例的一种电子设备的硬件结构示意图，该电子设备500包括但不限于：射频单元501、网络模块502、音频输出单元503、输入单元504、传感器505、显示单元506、用户输入单元507、接口单元508、存储器509、处理器510、以及电源511等部件。本领域技术人员可以理解，图5中示出的电子设备结构并不构成对电子设备的限定，电子设备可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。在本发明实施例中，电子设备包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、以及计步器等。

其中，处理器510，用于获取与目标保险业务相关的结构化数据；根据结构化数据查找包含结构化数据的知识图谱；基于知识图谱，对目标保险业务进行风险识别。

根据目标实体和目标实体之间的目标关系构建知识图谱。

基于知识图谱，对目标保险业务进行风险识别，包括：

可选的，方法还包括：

存储器509，用于存储可在处理器510上运行的计算机程序，该计算机程序被处理器510执行时，实现处理器510所实现的上述功能。

应理解的是，本发明实施例中，射频单元501可用于收发信息或通话过程中，信号的接收和发送，具体的，将来自基站的下行数据接收后，给处理器510处理；另外，将上行的数据发送给基站。通常，射频单元501包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外，射频单元501还可以通过无线通信系统与网络和其他设备通信。

电子设备通过网络模块502为用户提供了无线的宽带互联网访问，如帮助用户收发电子邮件、浏览网页和访问流式媒体等。

音频输出单元503可以将射频单元501或网络模块502接收的或者在存储器509中存储的音频数据转换成音频信号并且输出为声音。而且，音频输出单元503还可以提供与电子设备500执行的特定功能相关的音频输出(例如，呼叫信号接收声音、消息接收声音等等)。音频输出单元503包括扬声器、蜂鸣器以及受话器等。

输入单元505用于接收音频或视频信号。输入单元504可以包括图形处理器(Graphics Processing Unit，GPU)5041和麦克风5042，图形处理器5041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元506上。经图形处理器5041处理后的图像帧可以存储在存储器509(或其它存储介质)中或者经由射频单元501或网络模块502进行发送。麦克风5042可以接收声音，并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元501发送到移动通信基站的格式输出。

电子设备500还包括至少一种传感器505，比如光传感器、运动传感器以及其他传感器。具体地，光传感器包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板5061的亮度，接近传感器可在电子设备500移动到耳边时，关闭显示面板5061和/或背光。作为运动传感器的一种，加速计传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别电子设备姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；传感器505还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等，在此不再赘述。

显示单元506用于显示由用户输入的信息或提供给用户的信息。显示单元506可包括显示面板5061，可以采用液晶显示器(Liquid Crystal Display，LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板5061。

用户输入单元507可用于接收输入的数字或字符信息，以及产生与电子设备的用户设置以及功能控制有关的键信号输入。具体地，用户输入单元507包括触控面板5071以及其他输入设备5072。触控面板5071，也称为触摸屏，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板5071上或在触控面板5071附近的操作)。触控面板5071可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器510，接收处理器510发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板5071。除了触控面板5071，用户输入单元507还可以包括其他输入设备5072。具体地，其他输入设备5072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆，在此不再赘述。

进一步的，触控面板5071可覆盖在显示面板5061上，当触控面板5071检测到在其上或附近的触摸操作后，传送给处理器510以确定触摸事件的类型，随后处理器510根据触摸事件的类型在显示面板5061上提供相应的视觉输出。虽然在图5中，触控面板5071与显示面板5061是作为两个独立的部件来实现电子设备的输入和输出功能，但是在某些实施例中，可以将触控面板5071与显示面板5061集成而实现电子设备的输入和输出功能，具体此处不做限定。

接口单元508为外部装置与电子设备500连接的接口。例如，外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元508可以用于接收来自外部装置的输入(例如，数据信息、电力等等)并且将接收到的输入传输到电子设备500内的一个或多个元件或者可以用于在电子设备500和外部装置之间传输数据。

存储器509可用于存储软件程序以及各种数据。存储器509可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器509可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

处理器510是电子设备的控制中心，利用各种接口和线路连接整个电子设备的各个部分，通过运行或执行存储在存储器509内的软件程序和/或模块，以及调用存储在存储器509内的数据，执行电子设备的各种功能和处理数据，从而对电子设备进行整体监控。处理器510可包括一个或多个处理单元；优选的，处理器510可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器510中。

电子设备500还可以包括给各个部件供电的电源511(比如电池)，优选的，电源511可以通过电源管理系统与处理器510逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

另外，电子设备500包括一些未示出的功能模块，在此不再赘述。

优选的，本发明实施例还提供一种电子设备，包括处理器510，存储器509，存储在存储器509上并可在所述处理器510上运行的计算机程序，该计算机程序被处理器510执行时实现上述基于知识图谱的保险业务风险识别方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

以上所述仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

1.一种基于知识图谱的保险业务风险识别方法，其特征在于，包括：

获取与目标保险业务相关的结构化数据；

根据所述结构化数据查找包含所述结构化数据的知识图谱；

基于所述知识图谱，对所述目标保险业务进行风险识别。

2.根据权利要求1所述的方法，其特征在于，在所述根据所述结构化数据查找包含所述结构化数据的知识图谱之前，所述方法还包括：

按照预先定义的与所述目标保险业务匹配的实体、关系以及知识层级结构，对所述结构化数据进行实体识别和实体之间的关系抽取，以得到多个层级的目标实体和所述目标实体之间的目标关系；

根据所述目标实体和所述目标实体之间的所述目标关系构建知识图谱。

3.根据权利要求1所述的方法，其特征在于，所述知识图谱包括所述结构化数据中各目标实体的拓扑结构、目标关系，属性信息，各所述拓扑结构组成的全图，以及由所述全图的所述拓扑结构拆解的子图；则，

基于所述知识图谱，对所述目标保险业务进行风险识别，包括：

根据各所述目标实体的拓扑结构、所述目标关系，所述属性信息，所述全图以及所述子图，确定各所述目标实体的特征向量；

根据各所述目标实体的所述特征向量，通过预设的所述风险识别算法对所述目标保险业务进行风险识别。

4.根据权利要求3所述的方法，其特征在于，根据各所述目标实体的拓扑结构、所述目标关系，所述属性信息，所述全图以及所述子图，确定各所述目标实体的特征向量，包括：

将各所述目标实体的拓扑结构、所述目标关系，所述属性信息，所述全图以及所述子图输入至预先训练完成的图神经网络，以从所述图神经网络的输出结果中确定各所述目标实体的所述特征向量；

其中，所述图神经网络是以不同实体的拓扑结构、所述不同实体之间的关系，以及所述不同实体的拓扑结构组成的目标全图，由所述目标全图的所述拓扑结构拆解的目标子图作为所述图神经网络的输入，以所述不同实体的特征向量作为所述图神经网络的输出结果训练得到。

5.根据权利要求3所述的方法，其特征在于，根据各所述目标实体的所述特征向量，通过预设的所述风险识别算法对所述目标保险业务进行风险识别，包括：

确定所述目标保险业务的风险特征因子，并根据所述风险特征因子确定风险特征向量；

根据各所述目标实体的所述特征向量和所述风险特征向量，通过预设的所述风险识别算法对所述目标保险业务进行风险识别。

6.根据权利要求5所述的方法，其特征在于，根据各所述目标实体的所述特征向量和所述风险特征向量，通过预设的所述风险识别算法对所述目标保险业务进行风险识别，包括：

通过预设的所述风险识别算法对各所述目标实体的所述特征向量进行分类，得到分类结果；

基于所述分类结果和所述风险特征向量的相似程度，对所述目标保险业务进行风险识别。

7.根据权利要求5所述的方法，其特征在于，所述方法还包括：

根据所述风险特征向量进行加权运算，以得到所述风险特征向量的特征值权重；

根据所述特征值权重和各所述目标实体的所述特征向量，确定各所述目标实体的风险等级。

8.一种基于知识图谱的保险业务风险识别装置，其特征在于，所述装置包括：

获取模块，用于获取与目标保险业务相关的结构化数据；

查找模块，用于根据所述结构化数据查找包含所述结构化数据的知识图谱；

识别模块，用于基于所述知识图谱，对所述目标保险业务进行风险识别。

9.一种电子设备，其特征在于，包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述的基于知识图谱的保险业务风险识别方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储计算机程序，所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的基于知识图谱的保险业务风险识别方法的步骤。