CN116739795A - 基于知识图谱的保险风险评估方法、装置和电子设备 - Google Patents
基于知识图谱的保险风险评估方法、装置和电子设备 Download PDFInfo
- Publication number
- CN116739795A CN116739795A CN202310268667.9A CN202310268667A CN116739795A CN 116739795 A CN116739795 A CN 116739795A CN 202310268667 A CN202310268667 A CN 202310268667A CN 116739795 A CN116739795 A CN 116739795A
- Authority
- CN
- China
- Prior art keywords
- information
- fund
- funds
- target
- entity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000012502 risk assessment Methods 0.000 title claims abstract description 56
- 230000035515 penetration Effects 0.000 claims abstract description 68
- 238000004458 analytical method Methods 0.000 claims abstract description 58
- 238000012216 screening Methods 0.000 claims abstract description 19
- 238000012545 processing Methods 0.000 claims description 50
- 238000004422 calculation algorithm Methods 0.000 claims description 29
- 238000004364 calculation method Methods 0.000 claims description 24
- 238000004590 computer program Methods 0.000 claims description 18
- 230000006399 behavior Effects 0.000 claims description 12
- 230000000149 penetrating effect Effects 0.000 claims description 12
- 238000012797 qualification Methods 0.000 claims description 10
- 238000010606 normalization Methods 0.000 claims description 9
- 230000011218 segmentation Effects 0.000 claims description 5
- 238000001228 spectrum Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 10
- 238000012546 transfer Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 230000004927 fusion Effects 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 239000012773 agricultural material Substances 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Technology Law (AREA)
- Development Economics (AREA)
- Data Mining & Analysis (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Tourism & Hospitality (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本申请公开了一种基于知识图谱的保险风险评估方法、装置和电子设备。基于知识图谱的保险风险评估方法,包括:获取待分析的业务服务信息和交易要素信息;根据预设先构建的资金穿透模型和交易要素信息,对业务服务信息进行资金穿透分析,生成业务服务信息对应的资金流向信息;接下来,从至少一条资金链路中获取满足预设链路筛选条件的目标资金链路;接下来,再基于知识图谱对目标资金链路进行扩展,生成目标资金链路的目标分析图谱;之后,通过对目标分析图谱进行分割,得到多个子图谱;根据每个子图谱中是否包括标记信息对应的实体,识别潜在不具备保险资格的对象。根据本申请实施例,有效识别保险业务中潜在的不具备保险资格的对象。
Description
技术领域
本申请属于计算机技术领域,尤其涉及一种基于知识图谱的保险风险评估方法、装置和电子设备。
背景技术
随着社会的方法,保险作为一种保障业务,越来越多的应用在各种场景。以农业保险为例,农业保险能够有效地将保险分散风险的功能引入农业经营中,可以增加农户经营农业活动的抗风险能力,为我国的农业发展提供保障。
但由于涉农大数据来源繁杂,涉及实体众多,例如数据采集困难、数据来源多而散乱、数据质量差、数据融合共享效率低、数据安全缺乏保障等等。因此,面对众多的数据来源和分散杂乱的数据实体,从中挖掘实体间的真实关系,进而判断出潜在的不具备保险资格的对象,单靠人力进行数据分析,识别出不具备保险资格的对象已经十分困难,因此,如何根据众多来源的数据和分散杂乱的实体识别不具备保险资格的对象是当前亟待解决的重要问题。
发明内容
本申请实施例提供一种基于知识图谱的保险风险评估方法、装置和电子设备,能够有效识别保险业务存在的不具备保险资格的对象。
第一方面,本申请实施例提供一种基于知识图谱的保险风险评估方法,包括:
获取待分析的业务服务信息和交易要素信息,其中,业务服务信息包括业务费用信息和业务理赔信息;
根据预设先构建的资金穿透模型和交易要素信息,对业务服务信息进行资金穿透分析,生成业务服务信息对应的资金流向信息,资金流向信息包括至少一条资金链路,每条资金链路包括多个实体节点,以及节点之间的连接关系;
根据预设保险风险评估数据库,从至少一条资金链路中获取满足预设链路筛选条件的目标资金链路,其中,预设保险风险评估数据库包括存在目标风险行为的实体的标记信息,预设链路筛选条件为资金链路中存在标记信息对应的实体;
根据预设图谱扩展算法和知识图谱,对目标资金链路进行扩展,生成目标资金链路的目标分析图谱;
根据预设的社区发现算法对目标分析图谱进行切分处理,得到多个子图谱;
根据每个子图谱中是否包括标记信息对应的实体,识别潜在不具备保险资格的对象。
在第一方面的一些可实现方式中,根据预设先构建的资金穿透模型和交易要素信息,对业务服务信息进行资金穿透分析,生成业务服务信息对应的资金流向信息,包括:
根据交易要素信息,初始化资金穿透模型,其中,交易要素信息包括交易标识信息、交易对象信息、交易时间信息、交易资产信息;
基于初始化后的资金穿透模型对业务服务信息进行资金穿透计算,直到满足预设穿透终止条件,得到业务服务信息对应的资金流向信息;
其中,预设穿透终止条件包括资金穿透实体的次数达到预设次数和/或资金到达实体终点。
在第一方面的一些可实现方式中,预设先构建的资金穿透模型包括以下穿透分析中的至少一种:资金出账判断、资金出账分析、资金追踪分析。
在第一方面的一些可实现方式中,在所述获取待分析的业务服务信息和交易要素信息之前,方法还包括:
基于目标资源数据库,提取实体和实体对应的基本属性信息,其中,目标资源数据库包括保险业务数据库、商业登记数据库、保险参数数据库中的至少一个数据库,实体包括个人实体、法人实体和资产实体;
根据不同实体对应的基本属性信息的相似度,确定不同实体之间图谱关系,图谱关系包括投资关系、从属关系、交易关系、投保关系、资金关系和投保和理赔资金关系中的至少一种关系;
根据不同实体之的图谱关系,建立不同实体之间的连接,得到知识图谱。
在第一方面的一些可实现方式中,根据不同实体对应的基本属性信息的相似度,确定不同实体之间图谱关系,包括:
对目标资源库中每个实体的基本属性信息进行数据规范化处理,得到每个实体的属性集;
对于任一两个实体之间,计算同一属性的属性相似度;
根据属性集中属性相似度之和,确定不同实体之间的实体相似度;
根据不同实体之间的实体相似度,确定不同实体之间图谱关系。
在第一方面的一些可实现方式中,根据预设图谱扩展算法和知识图谱,对目标资金链路进行扩展,生成目标资金链路的目标分析图谱,包括:
将目标资金链路包括的实体作为目标实体;
从知识图谱中提取目标实体相关的目标图谱;
将每个目标实体相关的图谱增加至目标资金链路,得到目标资金链路的目标分析图谱。
第二方面,本申请实施例提供一种基于知识图谱的保险风险评估装置,包括:
获取模块,用于获取待分析的业务服务信息和交易要素信息,其中,业务服务信息包括业务费用信息和业务理赔信息;
处理模块,用于根据预设先构建的资金穿透模型和交易要素信息,对业务服务信息进行资金穿透分析,生成业务服务信息对应的资金流向信息,资金流向信息包括至少一条资金链路,每条资金链路包括多个实体节点,以及节点之间的连接关系;
处理模块,还用于根据预设保险风险评估数据库,从至少一条资金链路中获取满足预设链路筛选条件的目标资金链路,其中,预设保险风险评估数据库包括存在目标风险行为的实体的标记信息,预设链路筛选条件为资金链路中存在标记信息对应的实体;
处理模块,还用于根据预设图谱扩展算法和知识图谱,对目标资金链路进行扩展,生成目标资金链路的目标分析图谱;
处理模块,还用于根据预设的社区发现算法对目标分析图谱进行切分处理,得到多个子图谱;
处理模块,还用于根据每个子图谱中是否包括标记信息对应的实体,识别潜在不具备保险资格的对象。
在第二方面的一些可实现方式中,处理模块,还用于根据交易要素信息,初始化资金穿透模型,其中,交易要素信息包括交易标识信息、交易对象信息、交易时间信息、交易资产信息;
处理模块,还用于基于初始化后的资金穿透模型对业务服务信息进行资金穿透计算,直到满足预设穿透终止条件,得到业务服务信息对应的资金流向信息;
其中,预设穿透终止条件包括资金穿透实体的次数达到预设次数和/或资金到达实体终点。
第三方面,本申请提供一种电子设备,该设备包括:处理器以及存储有计算机程序指令的存储器;处理器执行计算机程序指令时实现第一方面或者第一方面任一可实现方式中的基于知识图谱的保险风险评估方法。
第四方面,本申请提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现第一方面或者第一方面任一可实现方式中的基于知识图谱的保险风险评估方法。
第五方面,本申请实施例提供了一种计算机程序产品,计算机程序产品中的指令由电子设备的处理器执行时,使得电子设备执行如第一方面或者第一方面任一可实现方式中的基于知识图谱的保险风险评估方法。
本申请实施例提供了一种基于知识图谱的保险风险评估方法、装置、设备及可读存储介质。在获取待分析的业务服务信息和交易要素信息后,可以先根据预设先构建的资金穿透模型和交易要素信息,对业务服务信息进行资金穿透分析,生成业务服务信息对应的资金流向信息,在资金流向信息中可以包括至少一条资金链路,在每条资金链路包括多个实体节点,以及节点之间的连接关系。接下来,结合预设保险风险评估数据库,从至少一条资金链路中获取满足预设链路筛选条件的目标资金链路,其中,预设保险风险评估数据库包括存在目标风险行为的实体的标记信息,预设链路筛选条件为资金链路中存在标记信息对应的实体。由此,可以对资金的流向进行有效预测。之后,由于知识图谱可以有效实现数据融合,因此,通过知识图谱对目标资金链路进行扩展后,再根据预设的社区发现算法对目标分析图谱进行切分处理,得到多个子图谱,最后通过分析每个子图谱包括的信息中是否标记信息对应的实体,生成每个子图谱的识别结果,从而可以充分识别潜在的不具备保险资格的对象。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种基于知识图谱的保险风险评估方法的流程示意图;
图2是本申请实施例提供的一种基于知识图谱的保险风险评估装置的结构示意图;
图3是本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将详细描述本申请的各个方面的特征和示例性实施例,为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本申请进行进一步详细描述。应理解,此处所描述的具体实施例仅意在解释本申请,而不是限定本申请。对于本领域技术人员来说,本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包括”或者其任何其他变体意在涵盖非排他性的包括,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
随着社会的方法,保险作为一种保障业务,越来越多的应用在各种场景。以农业保险为例,农业保险能够有效地将保险分散风险的功能引入农业经营中,可以增加农户经营农业活动的抗风险能力,为我国的农业发展提供保障。
但由于涉农大数据来源繁杂,涉及实体众多,例如数据采集困难、数据来源多而散乱、数据质量差、数据融合共享效率低、数据安全缺乏保障等等。因此,面对众多的数据来源和分散杂乱的数据实体,从中挖掘实体间的真实关系,进而判断出潜在的不具备保险资格的对象,单靠人力进行数据分析,识别出不具备保险资格的对象经十分困难,因此,如何根据众多来源的数据和分散杂乱的实体识别不具备保险资格的对象是当前亟待解决的重要问题。
针对于此,本申请实施例提供了一种基于知识图谱的保险风险评估方法、装置和电子设备,以及可读存储介质,能够有效识别保险业务存在的不具备保险资格的对象。
需要说明的是,本申请实施例中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
下面结合附图对本申请实施例所提供的基于知识图谱的保险风险评估方法进行介绍。图1示出了本申请一个实施例提供的基于知识图谱的保险风险评估方法的流程示意图。如图1所示,该方法可以包括步骤110至步骤160。
步骤110,获取待分析的业务服务信息和交易要素信息。
其中,业务服务信息包括业务费用信息和业务理赔信息;
步骤120,根据预设先构建的资金穿透模型和交易要素信息,对业务服务信息进行资金穿透分析,生成业务服务信息对应的资金流向信息。
其中,资金流向信息包括至少一条资金链路,每条资金链路包括多个实体节点,以及节点之间的连接关系;
步骤130,根据预设保险风险评估数据库,从至少一条资金链路中获取满足预设链路筛选条件的目标资金链路。
其中,预设保险风险评估数据库包括存在目标风险行为的实体的标记信息,预设链路筛选条件为资金链路中存在标记信息对应的实体。
步骤140,根据预设图谱扩展算法和知识图谱,对目标资金链路进行扩展,生成目标资金链路的目标分析图谱。
步骤150,根据预设的社区发现算法对目标分析图谱进行切分处理,得到多个子图谱。
步骤160,根据每个子图谱中是否包括标记信息对应的实体,识别潜在不具备保险资格的对象。
示例性的,涉及上述步骤110,业务服务信息包括业务费用信息和业务理赔信息。其中,业务费用信息例如保险业务支付的保费,业务理赔信息例如,例如具体的理赔资金。
业务要素信息,交易标识信息、交易对象信息、交易时间信息、交易资产信息。示例性的,交易标识信息可以包括实体标识、交易账号、机构编号、交易流水号;交易对象信息可以包括对方行号、对方名称、对方账号;交易时间信息可以包括具体交易时间;交易资产信息可以包括交易资金、账户余额等等。
作为一个具体地示例,实体可以包括个人实体、法人实体,以及其他资产实体。示例性的,在农业保险中,个人实体如农户。法人实体如农民专业合作社、家庭农场、农业企业等。其他的资产实体如与农业保险投保、核保、理赔等业务关系密切的土地、农产品、农资等。
在一些实施例中,基于资金穿透模型可以对特定入账交易资金分析其出账交易,并将出账交易输出为下一层的资金流向追踪的起点,从而支持资金流动的多层穿透计算,其中,可以通过穿透层数参数控制,对实体的穿透深度。
通过资金穿透模型可以在交易明细数据的基础上做挖掘计算的,计算过程中考虑账户的自有资金、往来资金对交易分析的影响,区分资金出账方式,考虑多种情况下的资金出账行为。
示例性的,资金穿透模型可以的输出结果为业务服务信息对应的资金流向信息。具体例如,资金流向信息包括至少一条资金链路,每条资金链路包括多个实体节点,以及节点之间的连接关系。
可选地,业务服务信息对应的资金流向信息可以以图谱的形式进行展示。具体地,在图谱中,可以以业务服务信息包括的业务费用信息和业务理赔信息作为起点,资金穿透模型对资金时序转账的过程交易进行预测计算,从而推测出资金可能流经的实体。其中,以实体作为节点,实体之间的连接关系为资金的流动路径,由此,构成资金流向的图谱。
在本申请实施例中,预设保险风险评估数据库包括了存在目标风险行为的实体的标记信息,由此,在得到资金流向信息后,可以根据预设保险风险评估数据库中的标记信息,判断每条资金链路是否存在目标风险行为的实体,进而从至少一条资金链路中获取满足预设链路筛选条件的目标资金链路。其中,预设链路筛选条件如:资金链路中存在标记信息对应的实体。
可以理解的是,目标资金链路的数量可以为一条,也可以为多条。当目标资金链路的数量为0时,说明本次业务服务信存在目标风险行为的风险较小。
在一些实施例中,在确定目标资金链路后,根据预设图谱扩展算法和知识图谱,对目标资金链路进行扩展,生成目标资金链路的目标分析图谱。
示例性的,根据预设图谱扩展算法和知识图谱,对目标资金链路进行扩展,生成目标资金链路的目标分析图谱,具体可以包括:将所述目标资金链路包括的实体作为目标实体;从所述知识图谱中提取所述目标实体相关的目标图谱;将每个所述目标实体相关的图谱增加至所述目标资金链路,得到所述目标资金链路的目标分析图谱。
最后,根据预设的社区发现算法对目标分析图谱进行切分处理,得到多个子图谱。分析每个子图谱包括的信息中是否标记信息对应的实体,生成每个子图谱的识别结果。
示例性的,当子图谱包括的信息中包括标记信息对应的实体,则子图谱中包括的实体是不具备保险资格的对象的风险较大,因此,可以将该子图谱中包括的实体做更加详细、细致的调查判断。当子图谱包括的信息中不包括标记信息对应的实体,则子图谱中包括的实体是不具备保险资格的对象的风险较小。由此,实现根据每个子图谱中是否包括标记信息对应的实体,识别潜在不具备保险资格的对象。
根据本申请实施例,由于知识图谱可以有效实现数据融合,因此,通过知识图谱对目标资金链路进行扩展后,再根据预设的社区发现算法对目标分析图谱进行切分处理,得到多个子图谱,最后通过分析每个子图谱包括的信息中是否标记信息对应的实体,生成每个子图谱的识别结果,从而可以充分识别潜在的不具备保险资格的对象。
在一些实施例中,所述根据预设先构建的资金穿透模型和所述交易要素信息,对所述业务服务信息进行资金穿透分析,生成所述业务服务信息对应的资金流向信息,具体可以包括:
根据交易要素信息,初始化资金穿透模型;其中,交易要素信息包括交易标识信息、交易对象信息、交易时间信息、交易资产信息;
基于初始化后的资金穿透模型对业务服务信息进行资金穿透计算,直到满足预设穿透终止条件,得到业务服务信息对应的资金流向信息;
其中,预设穿透终止条件包括资金穿透实体的次数达到预设次数和/或资金到达实体终点。
示例性的,所述预设先构建的资金穿透模型包括以下穿透分析中的至少一种:资金出账判断、资金出账分析、资金追踪分析。
作为一个具体的示例,资金出账判断例如可以包括以下步骤:
步骤1201,根据交易要素信息,初始化资金穿透模型。
交易要素信息例如交易时间N,笔次序号M,资金金额X,交易余额Y,自有资金Ys=Y-X;
步骤1202:取下一笔资金交易(初始n=1):
区分资金交易为转入交易,还是转出交易;并确定日期范围:N=N+n,如果N=15,则跳转S步骤1207资金追踪终止。
笔数范围:M=M+1,如果M=100,则跳转步骤1207资金追踪终止;
步骤1203:如果是贷方(C)转入交易,则交易要素更新为:交易时间N=N+n;笔次序号M=M+m;交易金额贷入C;交易余额Yn=Y+C。
步骤1204:如果是借方(D)转出交易,则交易要素更新为:
交易时间N+n;笔次序号M+m;交易金额借出D;交易余额Yn=Y-D。
步骤1205:判断资金是否出账:
如果Yn-Ys>0,则继续步骤1202步骤,
如果Yn-Ys≤0,则判断资金出账,终止后续资金交易分析。
步骤1206:出账截止的资金交易输出要素:
交易时间N+n;笔次序号M+m;交易金额D;交易余额Yn-Ys。
步骤1207:终止资金追踪分析。
作为一个具体的实例,在资金出账分析具体可以包括以下步骤:
步骤1211:确定资金出账截止交易,时序向前回顾分析,分析要素:
入账资金X;回顾时间N~N+n;回顾笔次M~M+m;出账交易金额D;出账交易余额Yn-Ys。
步骤1212:资金单笔出账:
1.1>D/X>0.9,则输出Xn=D;
步骤1213:资金拆分出账:
D/X<0.9,时序向前逐笔计算资金出账交易;Xn=D;Xn=D+Xn-1,逐笔回顾累加出账资金;
如果满足Xn-x/X>1,则终止累计。
输出D、Xn-1、Xn-2、Xn-3…Xn-x等转出资金;
步骤1214:资金归集出账:
D/X>1,则输出Xn=D。
作为一个具体的实例,资金追踪分析具体可以包括以下步骤:下一手的资金交易作为结果输出,含单笔资金输出和多笔资金输出。当前交易账户所属的实体作为起始节点,资金输出Xn作为交易转出边,对方账户所属。客户实体作为结束节点,构建资金流向关系。
根据本申请实施例,以业务费用信息和业务理赔信息作为起点,基于上述资金穿透模型包括穿透分析进行一次或多次计算,直到达到预设穿透终止条件,终止资金穿透分析,示例性的,预设穿透终止条件包括资金穿透实体的次数达到预设次数和/或资金到达实体终点。
在一些实施例中,在所述获取待分析的业务服务信息和交易要素信息之前,所述方法还包括:
基于目标资源数据库,提取实体和所述实体对应的基本属性信息,其中,所述目标资源数据库包括保险业务数据库、商业登记数据库、保险参数数据库中的至少一个数据库,所述实体包括个人实体、法人实体和资产实体;
根据不同实体对应的基本属性信息的相似度,确定不同实体之间图谱关系,所述图谱关系包括投资关系、从属关系、交易关系、投保关系和资金关系中的至少一种关系;
根据所述不同实体之的图谱关系,建立所述不同实体之间的连接,得到所述知识图谱。
示例性的,在农业保险中,个人实体如农户。法人实体如农民专业合作社、家庭农场、农业企业等。其他的资产实体如与农业保险投保、核保、理赔等业务关系密切的土地、农产品、农资等。
目标资源数据库包括保险业务数据库、商业登记数据库、保险参数数据库中的至少一个数据库。
继续以农业保险为例,农业保险的保险业务数据库,在保险业务数据库例如可以包括投保人主体信息、投保标的信息、保险费率和保额信息、赔付条件信息等。
商业登记数据库可以包括:工商数据,包括企业工商登记信息、企业股东投资信息(法人股东、自然人股东)、企业关联人信息(董监高法等)等。
保险参数数据库可以包括卫星遥感数据,具体如空间地理信息、农作物种植面积、农作物长势等;还可以包括农户数据,包括基本信息、土地权益信息等;还可以包括气象灾害数据,包括自然灾害、病虫害、疫病等信息等。
在一些实施例中,图谱关系包括投资关系、从属关系、交易关系、投保关系、资金关系、投保和理赔资金关系中的至少一种关系。
示例性的,投资关系可以是根据工商数据治理获得的企业股东头关系,包括法人投资和个人投资等。
从属关系可以是根据工商数据治理获得的企业董监高和法定代表人等关联关系。
交易关系可以是农业企业和农户之间的订单关系或者雇佣关系;根据行内交易流水构建的客户账户间的时序转账交易关系;保费支付、补贴支付等资金流动关系;土地流转关系等。
投保关系可以是农业保险公司或再保险公司内部数据挖掘出的保险投放关系等。
资金关系可以包括资金往来关系和资金流向关系。
资金往来关系可以是基于交易流水根据转出客户、转入客户、转账金额、转账笔数、统计周期(月/季/年)构建的两两客户间的资金交易关系等。
资金流向关系可以是基于资金交易关系数据,对两两客户间的资金交易数据按照交易方向、转账金额进行轧差计算,得出统计周期(月/季/年)两两客户间的资金流向、轧差金额、交易笔数等。
投保和理赔资金关系可以是个人和法人客户投保资金流向和所获得的理赔资金流向。
在知识图谱中可以包括每个实体的标签,示例性的,个人客户标签例如:中介、受保人、投保人等;法人客户标签例如:保险中介、农业经营主体、农业服务主体等。
通过对农业保险的业务数据进行实体识别和关系抽取,获得实体对象和图谱关系,实体之间通过关系连接,同时对具备相同概念的实体对象和图谱关系进行分类,从而得到本申请实施例所提供的知识图谱,示例性的,在知识图谱中可以包括农业种植图谱、人物关系图谱等子图谱。
根据本申请实施例,通过把相同概念的实体进行合并,生成知识图谱,从而可以实现数据融合。
在一些实施例中,所述根据不同实体对应的基本属性信息的相似度,确定不同实体之间图谱关系,可以包括:
对所述目标资源库中每个所述实体的基本属性信息进行数据规范化处理,得到每个实体的属性集;
对于任一两个实体之间,计算同一属性的属性相似度;
根据属性集中属性相似度之和,确定不同实体之间的实体相似度;
根据不同实体之间的实体相似度,确定所述不同实体之间图谱关系。
示例性的,数据规范化处理可以包括语法正规化,例如,通过语法匹配,将联系电话的表示方法规范化,将家庭地址的表达方式规范化。
数据规范化处理还可以包括数据正规化,例如,移除空格、《》、“”、-等符号;纠正输入错误类的拓扑错误;用正式名字替换昵称和缩写等。在此不一一列举。
在对目标资源库中每个实体的基本属性信息进行数据规范化处理,得到每个实体的属性集后,接下来可以进行相似度计算。示例性的,通过计算实体之间属性的相似度,进而确定实体的相似度。
可选地,属性相似度的计算方式可以是:
基于编辑距离(levenshtein)确定属性相似度。即最小编辑距离,目的是用最少的编辑操作将一个字符串转换成另一个。
基于集合相似度确定属性相似度计算。具体地,可以采用Dice系数度量两个集合的相似性。其中,属性中包括的字符串可以理解为一种集合,通过Dice距离可以用于度量字符串的相似性,Dice系数定义如下:
其中,S、T分别表示字符串的字符数量;S capT表示两个字符串中,各个位置字符相同的数量。
基于向量的相似度确定属性相似度。具体地,通过TF-IDF求余弦值来评估某个字或者用某个词对一个文档的重要程度,通过使用TF-IDF可以把属性向量化,再计算两个向量之间的余弦值获得属性相似度。其中,一个属性可以对应一个文档,计算方式例如:
TF-IDF=词频(tfi,j)*逆文档频率(idfi)
其中,词频(tfi,j)表示关键字在文本中出现的频率;ni,j,表示某个词在文档中出现的次数;∑knk,j,表示类目中所有的词条数目;逆文档频率(idfi)表示某一关键字的IDF,可以由总文件数目除以包括该词语的文件的数目,再将得到的商取对数得到,如果包括词条t的文档越少,IDF越大,则说明词条具有很好的类别区分能力;D表示文档总数;j:ti∈dj表示包括关键字的文档数。
在获的属性之间的相似度后,可以进一步确定实体的相似度。示例性的,再根据不同实体之间的实体相似度,确定不同实体之间图谱关系。可以给每一个相似度向量的分量设置一个阈值,若超过该阈值则将两实体相连。可选地,属性之间的可以根据具体应用需求,将阈值之间的计算方式进行和计算(and),或者进行或计算(or)。
sim(x1,y1)>T1 and(or)…sim(xN,yN)>TN
其中,sim(xN,yN)两个集合中第N个属性的相似度;TN为第N个属性的阈值。
可选地,实体相似度计算还可以使用聚类算法(Single Linkage,SL)。SL算法又称为最邻近算法(Nearest-neighbor),是用两个类数据点中距离最近的两个数据点间的相似度作为这两个类的距离。
可选地,实体相似度计算还可以基于分块(Blocking)的计算方式,建立实体之间的连接。分块计算是从给定的知识库中的所有实体对中,选出潜在匹配的记录对作为候选项,并将候选项的大小尽可能的缩小,最终将块内的实体进行连接。示例性的,分块计算例如基于Hash函数的分块计算、邻近分块计算等。
可选地,实体相似度计算还可以基于本体匹配系统进行计算,例如,Falcon-AO是一个自动的本体匹配系统。其匹配算法库包含V-Doc、I-sub、GMO、PBM四个算法。其中V-Doc即基于虚拟文档的语言学匹配,它是将实体及其周围的实体、名词、文本等信息作一个集合形成虚拟文档的形式。这样就可以用TD-IDF等算法进行操作。I-Sub是基于编辑距离的字符串匹配。可以看出,基于I-Sub和V-Doc是基于字符串或文本级别的处理。进一步通过GMO对RDF本体的图结构上做的匹配。示例性的,进行相似度的组合策略例如是:先经由PBM进行计算,输出结算结果;计算结果分别进入到V-Doc和I-Sub,再GMO接收V-Doc和I-Sub的输出做进一步处理,最后GMO的输出连同V-Doc和I-Sub的输出经由最终的贪心算法进行选取相匹配的实体。
可选地,实体相似度计算还可以基于度量空间的实体匹配。示例性的,先确定属性集S,目标数据集T,设定阈值θ;再进行样本选取步骤,在样本选取步骤中,从T中选取样本点E来代表T中数据,所谓样本点,也就是能代表距离空间的点,样本点应该在距离空间上均匀分布,各个样本点之间距离尽可能大。接下来,可以通过计算s与e之间的距离m(s,e),利用三角不等式过滤算法进行过滤,其中,s∈S,e∈E。
三角不等式过滤算法例如:
m(x,y)≤m(x,z)+m(z,y)
m(x,y)≤m(x,z)+m(z,y)
进行转换计算后,可以得到:
m(x,y)-m(y,z)>θ→m(x,z)>θ
m(x,y)-m(y,z)>θ→m(x,z)>θ
其中,x,y和z相当于三条属性,上式中y相当于样本点。因为样本点E的数量是远小于目标数据集T的数量,因此,通过过滤计算后会大量减少后续相似性比较的次数,进而提升知识图谱的生成速度。
基于相同的发明构思,本申请还提供了与上述基于知识图谱的保险风险评估方法对应的基于知识图谱的保险风险评估装置200。具体结合图2进行详细说明。
图2是本申请实施例提供的一种基于知识图谱的保险风险评估装置的结构示意图,如图2所示,该基于知识图谱的保险风险评估装置200可以包括:获取模块210和处理模块220。
获取模块210,用于获取待分析的业务服务信息和交易要素信息,其中,业务服务信息包括业务费用信息和业务理赔信息;
处理模块220,用于根据预设先构建的资金穿透模型和交易要素信息,对业务服务信息进行资金穿透分析,生成业务服务信息对应的资金流向信息,资金流向信息包括至少一条资金链路,每条资金链路包括多个实体节点,以及节点之间的连接关系;
处理模块220,还用于根据预设保险风险评估数据库,从至少一条资金链路中获取满足预设链路筛选条件的目标资金链路,其中,预设保险风险评估数据库包括存在目标风险行为的实体的标记信息,预设链路筛选条件为资金链路中存在标记信息对应的实体;
处理模块220,还用于根据预设图谱扩展算法和知识图谱,对目标资金链路进行扩展,生成目标资金链路的目标分析图谱;
处理模块220,还用于根据预设的社区发现算法对目标分析图谱进行切分处理,得到多个子图谱;
处理模块220,还用于根据每个子图谱中是否包括标记信息对应的实体,识别潜在不具备保险资格的对象。
在一些实施例中,处理模块220,还用于根据交易要素信息,初始化资金穿透模型,其中,交易要素信息包括交易标识信息、交易对象信息、交易时间信息、交易资产信息;
处理模块220,还用于基于初始化后的资金穿透模型对业务服务信息进行资金穿透计算,直到满足预设穿透终止条件,得到业务服务信息对应的资金流向信息;
其中,预设穿透终止条件包括资金穿透实体的次数达到预设次数和/或资金到达实体终点。
在一些实施例中,预设先构建的资金穿透模型包括以下穿透分析中的至少一种:资金出账判断、资金出账分析、资金追踪分析。
在一些实施例中,处理模块220,还用于基于目标资源数据库,提取实体和实体对应的基本属性信息,其中,目标资源数据库包括保险业务数据库、商业登记数据库、保险参数数据库中的至少一个数据库,实体包括个人实体、法人实体和资产实体;
处理模块220,还用于根据不同实体对应的基本属性信息的相似度,确定不同实体之间图谱关系,图谱关系包括投资关系、从属关系、交易关系、投保关系、资金关系和投保和理赔资金关系中的至少一种关系;
处理模块220,还用于根据不同实体之的图谱关系,建立不同实体之间的连接,得到知识图谱。
在一些实施例中,处理模块220,还用于对目标资源库中每个实体的基本属性信息进行数据规范化处理,得到每个实体的属性集;
对于任一两个实体之间,计算同一属性的属性相似度;
根据属性集中属性相似度之和,确定不同实体之间的实体相似度;
根据不同实体之间的实体相似度,确定不同实体之间图谱关系。
在一些实施例中,处理模块220,还用于将目标资金链路包括的实体作为目标实体;
处理模块220,还用于从知识图谱中提取目标实体相关的目标图谱;
处理模块220,还用于将每个目标实体相关的图谱增加至目标资金链路,得到目标资金链路的目标分析图谱。
可以理解的是,本申请实施例的基于知识图谱的保险风险评估装置200,可以对应于本申请实施例提供的基于知识图谱的保险风险评估方法的执行主体,基于知识图谱的保险风险评估装置200的各个模块/单元的操作和/或功能的具体细节可以参见上述本申请实施例提供的的基于知识图谱的保险风险评估方法中的相应部分的描述,为了简洁,在此不再赘述。
本申请实施例的基于知识图谱的保险风险评估装置,在获取待分析的业务服务信息和交易要素信息后,可以先根据预设先构建的资金穿透模型和交易要素信息,对业务服务信息进行资金穿透分析,生成业务服务信息对应的资金流向信息,在资金流向信息中可以包括至少一条资金链路,在每条资金链路包括多个实体节点,以及节点之间的连接关系。接下来,结合预设保险风险评估数据库,从至少一条资金链路中获取满足预设链路筛选条件的目标资金链路,其中,预设保险风险评估数据库包括存在目标风险行为的实体的标记信息,预设链路筛选条件为资金链路中存在标记信息对应的实体。由此,可以对资金的流向进行有效预测。
由于知识图谱可以有效实现数据融合,因此,通过知识图谱对目标资金链路进行扩展后,再根据预设的社区发现算法对目标分析图谱进行切分处理,得到多个子图谱,最后通过分析每个子图谱包括的信息中是否标记信息对应的实体,生成每个子图谱的识别结果,从而可以充分识别潜在的不具备保险资格的对象。
图3示出了本申请一个实施例提供的电子设备的结构示意图。如图3所示,该设备可以包括处理器301以及存储有计算机程序指令的存储器302。
具体地,上述处理器301可以包括中央处理器(Central Processing Unit,CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
存储器302可以包括用于信息或指令的大容量存储器。举例来说而非限制,存储器302可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在一个实例中,存储器302可以包括可移除或不可移除(或固定)的介质,或者存储器302是非易失性固态存储器。存储器302可在电子设备的内部或外部。
存储器可包括只读存储器(ROM),随机存取存储器(RAM),磁盘存储介质设备,光存储介质设备,闪存设备,电气、光学或其他物理/有形的存储器存储设备。因此,通常,存储器包括一个或多个编码有包括计算机可执行指令的软件的有形(非暂态)计算机可读存储介质(例如,存储器设备),并且当该软件被执行(例如,由一个或多个处理器)时,其可操作来执行参考根据本公开的一方面的方法所描述的操作。
处理器301通过读取并执行存储器302中存储的计算机程序指令,以实现本申请实施例所描述的方法,并达到本申请实施例执行其方法达到的相应技术效果,为简洁描述在此不再赘述。
在一个示例中,该电子设备还可包括通信接口303和总线304。其中,如图3所示,处理器301、存储器302、通信接口303通过总线304连接并完成相互间的通信。
通信接口303,主要用于实现本申请实施例中各模块、装置、单元和/或设备之间的通信。
总线304包括硬件、软件或两者,将在线信息流量计费设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(Accelerated Graphics Port,AGP)或其他图形总线、增强工业标准架构(Extended Industry Standard Architecture,EISA)总线、前端总线(Front Side Bus,FSB)、超传输(Hyper Transport,HT)互连、工业标准架构(Industry Standard Architecture,ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线304可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
该电子设备可以执行本申请实施例中的基于知识图谱的保险风险评估方法,从而实现本申请实施例描述的基于知识图谱的保险风险评估方法的相应技术效果。
另外,结合上述实施例中的基于知识图谱的保险风险评估方法,本申请实施例可提供一种可读存储介质来实现。该可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种基于知识图谱的保险风险评估方法。可读存储介质的示例可以是非暂态机器可读介质,如电子电路、半导体存储器设备、只读存储器(Read-Only Memory,ROM)、软盘、只读光盘(Compact Disc Read-Only Memory,CD-ROM)、光盘、硬盘等。
需要明确的是,本申请并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本申请的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本申请的精神后,做出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本申请的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、只读存储器(Read-Only Memory,ROM)、闪存、可擦除只读存储器(Erasable ReadOnly Memory,EROM)、软盘、只读光盘(Compact Disc Read-Only Memory,CD-ROM)、光盘、硬盘、光纤介质、射频(Radio Frequency,RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本申请中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本申请不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现本申请实施例提供的基于知识图谱的保险风险评估方法。
另外,结合上述实施例中的基于知识图谱的保险风险评估方法、装置,以及可读存储介质,本申请实施例可提供一种计算机程序产品来实现。所述计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备执行上述实施例中的任意一种基于知识图谱的保险风险评估方法。
上面参考根据本公开的实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各方面。应当理解,流程图和/或框图中的每个方框以及流程图和/或框图中各方框的组合可以由计算机程序指令实现。这些计算机程序指令可被提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器,以产生一种机器,使得经由计算机或其它可编程数据处理装置的处理器执行的这些指令使能对流程图和/或框图的一个或多个方框中指定的功能/动作的实现。这种处理器可以是但不限于是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电路。还可理解,框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合,也可以由执行指定的功能或动作的专用硬件来实现,或可由专用硬件和计算机指令的组合来实现。
以上所述,仅为本申请的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。
Claims (10)
1.一种基于知识图谱的保险风险评估方法,其特征在于,所述方法包括:
获取待分析的业务服务信息和交易要素信息,其中,所述业务服务信息包括业务费用信息和业务理赔信息;
根据预设先构建的资金穿透模型和所述交易要素信息,对所述业务服务信息进行资金穿透分析,生成所述业务服务信息对应的资金流向信息,所述资金流向信息包括至少一条资金链路,每条所述资金链路包括多个实体节点,以及所述节点之间的连接关系;
根据预设保险风险评估数据库,从所述至少一条资金链路中获取满足预设链路筛选条件的目标资金链路,其中,所述预设保险风险评估数据库包括存在目标风险行为的实体的标记信息,所述预设链路筛选条件为资金链路中存在所述标记信息对应的实体;
根据预设图谱扩展算法和知识图谱,对所述目标资金链路进行扩展,生成所述目标资金链路的目标分析图谱;
根据预设的社区发现算法对所述目标分析图谱进行切分处理,得到多个子图谱;
根据每个子图谱中是否包括所述标记信息对应的实体,识别潜在不具备保险资格的对象。
2.根据权利要求1所述的方法,其特征在于,所述根据预设先构建的资金穿透模型和所述交易要素信息,对所述业务服务信息进行资金穿透分析,生成所述业务服务信息对应的资金流向信息,包括:
根据所述交易要素信息,初始化所述资金穿透模型,其中,所述交易要素信息包括交易标识信息、交易对象信息、交易时间信息、交易资产信息;
基于初始化后的所述资金穿透模型对所述业务服务信息进行资金穿透计算,直到满足预设穿透终止条件,得到所述业务服务信息对应的资金流向信息;
其中,所述预设穿透终止条件包括资金穿透实体的次数达到预设次数和/或资金到达实体终点。
3.根据权利要求1所述的方法,其特征在于,所述预设先构建的资金穿透模型包括以下穿透分析中的至少一种:资金出账判断、资金出账分析、资金追踪分析。
4.根据权利要求1所述的方法,其特征在于,在所述获取待分析的业务服务信息和交易要素信息之前,所述方法还包括:
基于目标资源数据库,提取实体和所述实体对应的基本属性信息,其中,所述目标资源数据库包括保险业务数据库、商业登记数据库、保险参数数据库中的至少一个数据库,所述实体包括个人实体、法人实体和资产实体;
根据不同实体对应的基本属性信息的相似度,确定不同实体之间图谱关系,所述图谱关系包括投资关系、从属关系、交易关系、投保关系、资金关系和投保和理赔资金关系中的至少一种关系;
根据所述不同实体之的图谱关系,建立所述不同实体之间的连接,得到所述知识图谱。
5.根据权利要求4所述的方法,其特征在于,所述根据不同实体对应的基本属性信息的相似度,确定不同实体之间图谱关系,包括:
对所述目标资源库中每个所述实体的基本属性信息进行数据规范化处理,得到每个实体的属性集;
对于任一两个实体之间,计算同一属性的属性相似度;
根据属性集中属性相似度之和,确定不同实体之间的实体相似度;
根据不同实体之间的实体相似度,确定所述不同实体之间图谱关系。
6.根据权利要求1所述的方法,其特征在于,所述根据预设图谱扩展算法和知识图谱,对所述目标资金链路进行扩展,生成所述目标资金链路的目标分析图谱,包括:
将所述目标资金链路包括的实体作为目标实体;
从所述知识图谱中提取所述目标实体相关的目标图谱;
将每个所述目标实体相关的图谱增加至所述目标资金链路,得到所述目标资金链路的目标分析图谱。
7.一种基于知识图谱的保险风险评估装置,其特征在于,所述装置包括:
获取模块,用于获取待分析的业务服务信息和交易要素信息,其中,所述业务服务信息包括业务费用信息和业务理赔信息;
处理模块,用于根据预设先构建的资金穿透模型和所述交易要素信息,对所述业务服务信息进行资金穿透分析,生成所述业务服务信息对应的资金流向信息,所述资金流向信息包括至少一条资金链路,每条所述资金链路包括多个实体节点,以及所述节点之间的连接关系;
所述处理模块,还用于根据预设保险风险评估数据库,从所述至少一条资金链路中获取满足预设链路筛选条件的目标资金链路,其中,所述预设保险风险评估数据库包括存在目标风险行为的实体的标记信息,所述预设链路筛选条件为资金链路中存在所述标记信息对应的实体;
所述处理模块,还用于根据预设图谱扩展算法和知识图谱,对所述目标资金链路进行扩展,生成所述目标资金链路的目标分析图谱;
所述处理模块,还用于根据预设的社区发现算法对所述目标分析图谱进行切分处理,得到多个子图谱;
所述处理模块,还用于根据每个子图谱中是否包括所述标记信息对应的实体,识别潜在不具备保险资格的对象。
8.根据权利要求7所述的装置,其特征在于,
所述处理模块,还用于根据所述交易要素信息,初始化所述资金穿透模型,其中,所述交易要素信息包括交易标识信息、交易对象信息、交易时间信息、交易资产信息;
所述处理模块,还用于基于初始化后的所述资金穿透模型对所述业务服务信息进行资金穿透计算,直到满足预设穿透终止条件,得到所述业务服务信息对应的资金流向信息;
其中,所述预设穿透终止条件包括资金穿透实体的次数达到预设次数和/或资金到达实体终点。
9.一种电子设备,其特征在于,所述设备包括:处理器,以及存储有计算机程序指令的存储器;
所述处理器读取并执行所述计算机程序指令,以实现如权利要求1至6任意一项所述的基于知识图谱的保险风险评估方法。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1至6任意一项所述的基于知识图谱的保险风险评估方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310268667.9A CN116739795A (zh) | 2023-03-16 | 2023-03-16 | 基于知识图谱的保险风险评估方法、装置和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310268667.9A CN116739795A (zh) | 2023-03-16 | 2023-03-16 | 基于知识图谱的保险风险评估方法、装置和电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116739795A true CN116739795A (zh) | 2023-09-12 |
Family
ID=87915843
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310268667.9A Pending CN116739795A (zh) | 2023-03-16 | 2023-03-16 | 基于知识图谱的保险风险评估方法、装置和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116739795A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117710113A (zh) * | 2023-11-17 | 2024-03-15 | 中国人寿保险股份有限公司山东省分公司 | 基于法人业务知识图谱的异常投保行为识别方法及系统 |
-
2023
- 2023-03-16 CN CN202310268667.9A patent/CN116739795A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117710113A (zh) * | 2023-11-17 | 2024-03-15 | 中国人寿保险股份有限公司山东省分公司 | 基于法人业务知识图谱的异常投保行为识别方法及系统 |
CN117710113B (zh) * | 2023-11-17 | 2024-06-18 | 中国人寿保险股份有限公司山东省分公司 | 基于法人业务知识图谱的异常投保行为识别方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110489520B (zh) | 基于知识图谱的事件处理方法、装置、设备和存储介质 | |
CN111199474B (zh) | 一种基于双方网络图数据的风险预测方法、装置和电子设备 | |
CN109523153A (zh) | 非法集资企业的获取方法、装置、计算机设备和存储介质 | |
CN110046929B (zh) | 一种欺诈团伙识别方法、装置、可读存储介质及终端设备 | |
CN111222976B (zh) | 一种基于双方网络图数据的风险预测方法、装置和电子设备 | |
CN111368147B (zh) | 图特征处理的方法及装置 | |
CN108269122B (zh) | 广告的相似度处理方法和装置 | |
CN111401700A (zh) | 一种数据分析方法、装置、计算机系统及可读存储介质 | |
CN109919608B (zh) | 一种高危交易主体的识别方法、装置及服务器 | |
CN110909540A (zh) | 短信垃圾新词识别方法、装置及电子设备 | |
CN110675078A (zh) | 上市公司风险诊断方法、系统、计算机终端及存储介质 | |
CN110929525A (zh) | 一种网贷风险行为分析检测方法、装置、设备和存储介质 | |
CN116739795A (zh) | 基于知识图谱的保险风险评估方法、装置和电子设备 | |
CN116881430A (zh) | 一种产业链识别方法、装置、电子设备及可读存储介质 | |
CN109711849B (zh) | 以太坊地址画像生成方法、装置、电子设备及存储介质 | |
CN114118816A (zh) | 一种风险评估方法、装置、设备及计算机存储介质 | |
CN112990989B (zh) | 价值预测模型输入数据生成方法、装置、设备和介质 | |
Jeyaraman et al. | Practical Machine Learning with R: Define, build, and evaluate machine learning models for real-world applications | |
US20210073247A1 (en) | System and method for machine learning architecture for interdependence detection | |
CN114581209A (zh) | 财务分析模型的训练方法、装置、设备及存储介质 | |
CN113379212A (zh) | 基于区块链的物流信息平台违约风险评估方法、装置、设备及介质 | |
CN114219630A (zh) | 服务风险预测方法、装置、设备及介质 | |
CN113052604A (zh) | 一种对象检测方法、装置、设备及存储介质 | |
CN103164806A (zh) | 用于从社会内容获得市场情报的方法和设备 | |
CN110895564A (zh) | 一种潜在客户数据处理方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |