CN116308434A

CN116308434A - 一种保险欺诈识别方法及系统

Info

Publication number: CN116308434A
Application number: CN202310530655.9A
Authority: CN
Inventors: 修博; 吉炜; 陈真; 司金磊
Original assignee: Hangzhou Dayu Network Technology Co ltd
Current assignee: Hangzhou Dayu Network Technology Co ltd
Priority date: 2023-05-12
Filing date: 2023-05-12
Publication date: 2023-06-23
Anticipated expiration: 2043-05-12
Also published as: CN116308434B

Abstract

本发明公开了一种保险欺诈识别方法及系统，具体涉及保险欺诈识别技术领域，其中，本发明的保险欺诈识别方法，包括如下步骤：获取多源保险理赔数据；基于所述多源保险理赔数据，通过身份链接生成风险识别数据库；搭建系统诈骗风险识别模型；利用所述风险识别数据库结合所述系统诈骗风险识别模型，识别系统性保险诈骗；根据识别结果，链接敏感身份对应的保险理赔数据；追溯所述敏感身份的保险理赔数据来源，提示对应保险公司预防系统性保险诈骗。本发明所提供的保险欺诈识别方法，通过多源保险理赔数据挖掘、系统诈骗风险识别模型搭建等手段，全面且准确地识别出系统性保险欺诈风险，并及时采取措施预防和防止再次发生。

Description

一种保险欺诈识别方法及系统

技术领域

本发明涉及保险欺诈识别技术领域，尤其涉及一种保险欺诈识别方法及系统。

背景技术

保险欺诈是一种不道德、不合法的行为，严重影响了保险市场的健康发展和保险消费者的利益。与传统保险欺诈不同的是，系统性保险欺诈往往涉及多个保险产品和多个保险公司，并采取多种欺诈手段进行操作，例如虚构保险索赔、诈骗保险理赔、伪造保险合同等。这些欺诈行为往往涉及多个保险公司、保险代理人、医生、律师等多个行业的人员，且通常会持续一段时间，造成的经济损失往往非常巨大。系统性保险欺诈不仅对保险公司和消费者造成经济损失，还会影响整个保险市场的稳定和健康发展。因此，各国的保险监管机构和保险公司都非常重视对系统性保险欺诈的防范和打击。

发明内容

针对现有技术中的缺陷和实际应用的需求，第一方面，本发明提供了一种保险欺诈识别方法，旨在通过多家保险公司的保险理赔数据挖，识别出当前潜在的系统性保险欺诈风险，以及时采取措施预防并防止系统性保险欺诈的再次发生。所述保险欺诈识别方法，包括如下步骤：获取多源保险理赔数据；基于所述多源保险理赔数据，通过身份链接生成风险识别数据库；搭建系统诈骗风险识别模型；利用所述风险识别数据库结合所述系统诈骗风险识别模型，识别系统性保险诈骗；根据识别结果，链接敏感身份对应的保险理赔数据；追溯所述敏感身份的保险理赔数据来源，提示对应保险公司预防系统性保险诈骗。本发明提供的保险欺诈识别方法，通过多源保险理赔数据挖掘、系统诈骗风险识别模型搭建等手段，能够全面、准确地识别出系统性保险欺诈风险，并及时采取措施预防和防止再次发生。同时，这种方法还能够自动化地进行欺诈风险识别，减少人工干预，提高识别准确率和效率；追溯敏感身份的保险理赔数据来源，提示保险公司预防系统性保险诈骗，提高风险管理水平和信誉度。

可选地，所述获取多源保险理赔数据，包括如下步骤：确定多个数据源和数据类型；根据所述数据类型，分别从多个数据源获得对应的保险理赔数据。本发明通过确定多个数据源和数据类型，分别从多个数据源获取对应的保险理赔数据，实现了更全面、准确、可靠的数据获取，并且提高了数据的覆盖率和丰富程度。

可选地，所述根据所述数据类型，分别从多个数据源获得对应的保险理赔数据，包括如下步骤：搭建第三方数字中心，并使所述第三方数字中心获得各个数据源的授权；根据授权结果，令所述第三方数字中心向授权后的各个数据源发送随机加密协议；令各个数据源根据对应的随机加密协议对保险理赔数据进行加密，并将加密保险理赔数据发送至所述第三方数字中心；通过所述第三方数字中心解密并汇总多个数据源的加密保险理赔数据，获得多源保险理赔数据。本发明通过搭建第三方数字中心，使用随机加密协议等技术手段，实现保险理赔数据的安全加密和传输，保护数据隐私，避免数据泄露和滥用，提高数据的安全性和保密性。同时，本发明所提供的方法还能够避免各个数据源之间相互访问和传输数据，减少了数据泄露和误操作的风险，保证数据的准确性和可靠性。并且，能够让多个数据源在不泄露数据的情况下，实现数据的共享和整合，提高数据的综合利用效率，使得识别出的欺诈风险更加全面和真实。

可选地，所述对保险理赔数据进行加密，包括如下步骤：确定数据源所提供的保险理赔数据中包含的字符种类，并汇总所述字符种类生成字符库；利用所述字符库生成随机字符组，并获取所述随机字符组中的元素数量；根据所述元素数量设定映射中心位置，并基于映射中心位置生成正向映射加密规则；利用所述正向映射加密规则，加密所述保险理赔数据。本发明通过对保险理赔数据进行加密，可以提高数据的安全性、加密的可靠性，保证数据的准确性，同时也能保留一定的可读性。本发明还采用随机字符组和映射中心位置等方法，生成正向映射加密规则，能够确保数据在加密过程中不失真，并且能够防止未经授权的人员获取敏感数据，从而提高数据的安全性和可信度。

可选地，所述正向映射加密规则，满足如下模型：

，

，其中，/>

表示正向趋近映射中心位置/>

的第/>

个元素，/>

表示反向趋近映射中心位置/>

的第/>

个元素，/>

表示元素趋近映射中心位置/>

的位置标识，/>

表示元素数量，/>

表示取整函数。

可选地，解密所述加密保险理赔数据，包括如下步骤：获取所述加密保险理赔数据对应的地址信息；根据所述地址信息，确定所述加密保险理赔数据中的加密元素；利用反向映射加密规则解密加密元素，获得原始保险理赔数据。本发明对加密保险理赔数据进行解密可以获取原始数据，便于后续的数据处理和分析，同时采用反向映射加密规则能够提高解密的可靠性和准确性，保证数据的完整性和安全性。

可选地，所述反向映射加密规则，满足如下模型：

,

，其中，/>

表示正向趋近映射中心位置/>

的第/>

个元素，/>

表示反向趋近映射中心位置/>

的第/>

个元素，/>

表示元素趋近映射中心位置/>

的位置标识，/>

表示元素数量，/>

表示取整函数。

可选地，所述系统诈骗风险识别模型，满足如下公式：

，其中，/>

表示待评估人参与系统性保险诈骗的概率，/>

表示保险理赔数据单项风险系数，/>

,/>

表示保险理赔数据的理赔类型编号，/>

表示保险理赔数据的理赔类型总数量，/>

，/>

表示保险公司编号，/>

表示保险公司总数量，/>

表示待评估人在第j个保险公司中理赔的第/>

类保险的数量，/>

表示保险理赔数据汇聚风险系数,/>

表示待评估人在两个或者两个以上保险公司中理赔的同类型保险的理赔类型数量。

可选地，所述基于所述多源保险理赔数据，通过身份链接生成风险识别数据库，包括如下步骤：预处理所述多源保险理赔数据；识别预处理后多源保险理赔数据中的身份信息；根据所述身份信息链接同一人的保险理赔数据，生成个人保险理赔数据；汇总个人保险理赔数据，生成风险识别数据库。本发明通过身份链接生成风险识别数据库可以将同一人的保险理赔数据整合在一起，提高数据的准确性和可靠性，为后续的风险评估提供更全面和有针对性的数据分析，从而降低风险发生的可能性。

第二方面，为更好执行本发明所提供的保险欺诈识别方法，本发明还提供了一种保险欺诈识别系统。所述保险欺诈识别系统包括一个或多个处理器；一个或多个输入设备；一个或多个输出设备和存储器，所述处理器、所述输入设备、所述输出设备和所述存储器通过总线连接，所述存储器用于存储计算机程序，所述计算机程序包括程序指令，所述处理器被配置用于调用所述程序指令，执行本发明第一方面所提供的保险欺诈识别方法。本发明所提供的保险欺诈识别系统性能高、稳定，结构紧凑，能够高效且准确地实施保险欺诈识别方法。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中，类似的元件或部分一般由类似的附图标记标识。附图中，各元件或部分并不一定按照实际的比例绘制。

图1为本发明实施例所提供的保险欺诈识别方法流程图；

图2为本发明实施例所提供的步骤S01的实施流程图；

图3为本发明实施例所提供的步骤S012的实施流程图；

图4为本发明实施例所提供的随机加密协议生成规则示意图；

图5为本发明实施例所提供的保险欺诈识别系统结构图。

具体实施方式

下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案，因此只作为示例，而不能以此来限制本发明的保护范围。

需要注意的是，除非另有说明，本申请使用的技术术语或者科学术语应当为本发明所属领域技术人员所理解的通常意义。

在一个可选的实施例中，请参见图1，图1为本发明实施例所提供的保险欺诈识别方法流程图。如图1所示，所述保险欺诈识别方法，包括如下步骤：

S01、获取多源保险理赔数据。

由于实际保险理赔数据中包括了大量的用户隐私信息，因此，保险理赔数据需要进行加密处理，以形成后续用于挖掘并识别系统性保险欺诈的数据样本。

进一步地，请参见图2，图2为本发明实施例所提供的步骤S01的实施流程图。如图2所示，步骤S01所述的获取多源保险理赔数据，包括如下步骤：

S011、确定多个数据源和数据类型。

由于系统性保险欺诈往往涉及多个保险公司，因此，步骤S011中所述的多个数据源包括不同的保险公司，每个数据源都可以提供不同类型的保险数据。所述数据类型包括不同保险公司在不同地区的、不同理赔类型的保险数据。

上述保险数据包括车险理赔数据、医疗险理赔数据、家财险理赔数据、责任险理赔数据以及其他类型的保险理赔数据。其中，车险理赔数据包括车辆事故、车辆损失、车辆盗抢等相关理赔数据；医疗险理赔数据包括医疗事故、医疗损失、医疗诈骗等相关理赔数据；家财险理赔数据包括房屋损失、财产盗窃、火灾爆炸等相关理赔数据；责任险理赔数据包括公共交通事故、人身伤害等相关理赔数据。

S012、根据所述数据类型，分别从多个数据源获得对应的保险理赔数据。

由于各个保险公司的保险理赔数据是不互通的，为防止各保险公司之间的数据泄露，可以设定一个第三方公证机构来进行数据挖掘、分析、识别等工作。

在一个可选的实施例中，请参见图3，图3为本发明实施例所提供的步骤S012的实施流程图。如图3所示，步骤S012所述的根据所述数据类型，分别从多个数据源获得对应的保险理赔数据，包括如下步骤：

S0121、搭建第三方数字中心，并使所述第三方数字中心获得各个数据源的授权。

步骤S0121搭建的第三方数字中心可以是实体机构，也可以是虚拟云端数据处理网络。在本实施例中,步骤S0121包括根据实际需求和安全要求，选择合适的数字中心平台作为第三方数字中心，例如阿里云、AWS（Amazon Web Services，亚马逊云服务平台）等；步骤S0121还包括配置第三方数字中心，即对选择的第三方数字中心进行资源配置，包括搭建服务器、网络环境、安全设置等；步骤S0121还包括获取数据源授权，即第三方数字中与各个数据源的相关负责人联系，获得其授权认证，并取得相应的授权证书。

S0122、根据授权结果，令所述第三方数字中心向授权后的各个数据源发送随机加密协议。

随机加密协议是指第三方数字中心，以及与第三方数字中心相互授权的任一个数据源之间传输数据的加密规则与解密授权协议，即任一个接收所述随机加密协议的数据源，向第三方数字中心提供加密数据，并授权第三方数字中心解密该加密数据。其加密数据是通过数据源依照第三方数字中心提供的加密规则进行随机加密后的加密数据。因此，不同的数据源，其加密数据的解密秘钥是不同的；针对任一个数据源的加密数据，其具体的解密秘钥需要数据源授权，第三方数字中心才能对应获得。

S0123、令各个数据源根据对应的随机加密协议对保险理赔数据进行加密，并将加密保险理赔数据发送至所述第三方数字中心。

针对任一数据源，在本实施例中，步骤S0123所述的根据对应的随机加密协议对保险理赔数据进行加密，包括如下步骤：

S0123a、确定数据源所提供的保险理赔数据中包含的字符种类，并汇总所述字符种类生成字符库。

在对保险理赔数据进行加密处理之前，需要确定保险理赔数据中所包含的字符种类。例如，如果保险理赔数据是一段文本，则需要确定其中包含的字符有哪些，如英文字母、数字、标点符号等，再将其汇总成对应的字符库。步骤S0123a所生成的字符库是一个包含所有字符种类的元素列表，且在该字符库中每个字符只出现一次。

S0123b、利用所述字符库生成随机字符组，并获取所述随机字符组中的元素数量。

步骤S0123b利用所述字符库中的所有元素，可以随机生成一组包含所有字符种类的字符串，例如：“qwe123!a;skz,.:…”；也可以生成多组字符串，且多组字符串包含所有字符种类，每组字符串中的元素数量至少为两个，并且在所有的多组字符串中，每个字符只出现一次，例如：“qwe”，“123!a”，“skz,.:…”。

进一步地，随机字符组中元素数量的获取，可使用编程语言中与字符串相关函数或方法来实现。例如，利用Python中的内置函数len()来计算一个字符串（即随机字符组）中的元素数量，或者利用Python中的for循环和计数器来实现。

S0123c、根据所述元素数量设定映射中心位置，并基于映射中心位置生成正向映射加密规则。

在本实施例中，所述映射中心位置满足如下模型：

，其中，/>

表示映射中心位置，/>

表示第/>

个元素的位置，/>

表示取整函数，

表示元素数量，/>

表示/>

不能被2整除，/>

表示第/>

个元素与第

个元素的中间位置，/>

表示第/>

个元素的位置，/>

表示第/>

个元素的位置，/>

表示/>

能被2整除。

应当理解，步骤S0123c中基于映射中心位置不仅生成了正向映射加密规则，还生成了对应的反向映射加密规则。进一步地，正向映射加密规则与反向映射加密规则属于对称加密算法范畴。正向映射加密规则与反向映射加密规则，可分别对应设置为加密规则和解密规则。例如，若正向映射加密规则将原始字符映射为随机字符组中的对应字符，则反向映射加密规则可将加密后的字符映射回原始字符；同理，若反向映射加密规则将原始字符映射为随机字符组中的对应字符，则正向映射加密规则可将加密后的字符映射回原始字符。

在本实施例中，正向映射加密规则满足如下模型：

，

，其中，/>

表示正向趋近映射中心位置/>

的第/>

个元素，/>

表示反向趋近映射中心位置/>

的第/>

个元素，/>

表示元素趋近映射中心位置/>

的位置标识，/>

表示元素数量，/>

表示取整函数。应当理解，本实施例所述的正向趋近和反向趋近是以映射中心位置/>

为中心的相对说法。具体地，在本实施例中，以字符串的第一个元素到最后一个元素为正向。

同理，反向映射加密规则满足如下模型：

,/>

，其中，/>

表示正向趋近映射中心位置/>

的第/>

个元素，/>

表示反向趋近映射中心位置

的第/>

个元素，/>

表示元素趋近映射中心位置/>

的位置标识，/>

表示元素数量，/>

表示取整函数。具体地，在本实施例中，以字符串的最后一个元素到第一个元素为正向。

在一个具体的实施例中，请参见图4，图4为本发明实施例所提供的加密规则示意图，如图4中a部分所示，对于字符串“CEDFBA”：利用Python中的内置函数len()计算出该字符串的元素数量为6；基于该字符串的元素数量，获得了对应的映射中心位置

，即该字符串的映射中心位置/>

为第/>

个元素“D”与第4个元素“F”的中间位置。进而，对于字符串“CEDFBA”，其具体的正向映射加密规则为：

;则具体的反向映射加密规则为：/>

。

如图4中b部分所示，对于字符串“CEDGFBA”：利用Python中的内置函数len()计算出该字符串的元素数量为7；基于该字符串的元素数量，获得了对应的映射中心位置

，即该字符串的映射中心位置/>

为第/>

个元素“G”的位置。进而，对于字符串“CEDGFBA”：其具体的正向映射加密规则为：/>

;则具体的反向映射加密规则为：/>

。

S0123d、利用所述正向映射加密规则，加密所述保险理赔数据。

应当理解，步骤S0123c所提出的正向映射加密规则，只加密了数据的一部分元素，并没有对全部元素进行加密。因此，在进行加密时需要记录哪些元素已经被加密，以便在对应解密时能够正确地对这些元素进行解密。因此，步骤S0123c中所述的利用所述正向映射加密规则，加密所述保险理赔数据，包括如下步骤：

A01、利用所述正向映射加密规则，对所述保险理赔数据进行加密。

首先，将保险理赔数据按照预定的规则进行分组，每组包含若干个元素。对于每一组，使用步骤S024中生成的正向映射加密规则，将其中的部分元素加密，生成密文。未加密的元素保持原样，即作为明文。对所有组的密文和明文进行合并，生成加密保险理赔数据。

在一个具体的实施例中，要加密的保险理赔数据为字符串“511011199801”，将其分为两组，每组包含6个元素。使用步骤S024中生成的正向映射加密规则，将第一组“511011”中的第1、4个元素进行加密，生成密文“11171”；将第二组“199801”中的第2、3、4、5个元素进行加密，生成密文“122471”未加密的元素保持原样。再合并所有组的密文和明文，生成加密保险理赔数据“11171122471”。

A02、记录所述保险理赔数据中被加密元素的地址信息。

对于每一组，记录保险理赔数据中被加密的元素的地址信息。地址信息可以使用元素在原始保险理赔数据中的位置来表示，也可以使用其他方式。将所有被加密元素的地址信息进行合并，生成地址信息列表。

在一个具体的实施例中，对于上述加密保险理赔数据“11171122471””，记录被加密的元素的位置信息为第一组的1、4个元素，第二组的第2、3、4、5个元素。因此，地址信息列表包括：

,/>

。即对应的地址信息向量/>

中包含着与每个元素数量相同个数的加密表征值，其中，“1”表征经过加密的元素地址，“0”表征未经过加密的元素地址。

S0124、通过所述第三方数字中心解密并汇总多个数据源的加密保险理赔数据，获得多源保险理赔数据。

由于不同数据源所传输的加密保险理赔数据所涉及的具体加密规则不同，因此针对任一数据源所传输的加密保险理赔数据，在本实施例中，步骤S0124中解密所述加密保险理赔数据，包括如下步骤：

S0124a、获取所述加密保险理赔数据对应的地址信息。

S0124b、根据所述地址信息，确定所述加密保险理赔数据中的加密元素。

S0124c、利用反向映射加密规则解密加密元素，获得原始保险理赔数据。

需要注意的是，在步骤S0124b中，需要正确地识别哪些元素已经被加密。这可以通过记录的地址信息来实现，地址信息中记录了哪些地址对应的元素被加密，哪些地址对应的元素没有被加密，以便在解密时只对加密过的元素进行解密。同时，在步骤S0124c中，需要正确地使用反向映射加密规则进行解密，以确保解密后的数据正确无误。

本发明通过步骤S0121至步骤S0124来获取多源保险理赔数据。其中，通过使用第三方数字中心来协调各个数据源之间的授权认证和数据交换，可以保证数据的安全性和保密性。同时，通过随机加密协议的使用，可以防止数据被黑客攻击和窃取。本实施例提出的获取多源保险理赔数据方法还可以提高数据的准确性和完整性，通过数据的汇总和解密，可以更好地理解整个数据集，识别出潜在的系统性保险欺诈行为，在具有实用性和可行性的同时，也为保险行业提供更好的数据支持。

S02、基于所述多源保险理赔数据，通过身份链接生成风险识别数据库。

身份链接是指在不同数据源中，将具有共同身份特征的保险理赔数据进行链接，从而得到个人在多个保险公司中完整的保险理赔数据。身份链接可以基于传统的数据集成技术或者实体识别技术实现，其中，实体识别技术可以通过自然语言处理和机器学习算法来实现。

进一步地，在保险理赔领域中身份链接可以通过一些特征识别个人的身份，例如姓名、身份证号码、电话号码等，将来自不同数据源的保险理赔数据链接在一起，以便于系统性风险识别和欺诈的预防。通过身份链接，可以实现个人参与系统性保险欺诈行为的识别，从而为保险公司提供更加全面和准确的风险评估。在一个可选的实施例中，步骤S02所述的基于所述多源保险理赔数据，通过身份链接生成风险识别数据库，包括如下步骤：

S021、预处理所述多源保险理赔数据。

进一步地，步骤S021所述的预处理包括数据清洗、去重、格式转换、字段映射等处理手段。例如，将不同格式的保险理赔数据转换成同一格式，清除重复的数据，将数据存储在数据库中。

S022、识别预处理后多源保险理赔数据中的身份信息。

识别身份信息可以通过姓名、身份证号、电话号码等信息进行识别。可以使用现有的身份信息识别算法，例如基于姓名的相似度匹配算法、基于身份证号的一致性检查算法等。

S023、根据所述身份信息链接同一人的保险理赔数据，生成个人保险理赔数据。

身份链接是将同一人的保险理赔数据关联起来的过程。进一步地，由于，同名同姓的情况出现，因此，在本实施例中，将身份证号作为唯一身份链接的关联元素，将同一个人的在不同的保险公司中不同的保险理赔数据关联起来。

S024、汇总个人保险理赔数据，生成风险识别数据库。

步骤S024是汇总不同人的个人保险理赔数据，将其存储在风险识别数据库中。风险识别数据库包括每个人的保险理赔记录、统计信息等。例如，统计信息可以是每个人的理赔次数、理赔金额、理赔时间等统计信息。

S03、搭建系统诈骗风险识别模型。

在一个可选的实施例中，为了在实际应用中能够及时、准确地检测出可能存在的诈骗行为，从而帮助防范和降低诈骗风险，步骤S03所搭建的系统诈骗风险识别模型，满足如下公式：

，其中，/>

表示待评估人参与系统性保险诈骗的概率，/>

表示保险理赔数据单项风险系数，/>

,/>

表示保险理赔数据的理赔类型编号，/>

表示保险理赔数据的理赔类型总数量，/>

，/>

表示保险公司编号，/>

表示保险公司总数量，/>

表示待评估人在第j个保险公司中理赔的第/>

类保险的数量，/>

表示保险理赔数据汇聚风险系数,/>

表示待评估人在两个或者两个以上保险公司中理赔的同类型保险的理赔类型数量。具体地，系统诈骗风险识别模型中

部分，表征了待评估人在同一家保险公司进行的同类保险理赔所导致的系统性保险诈骗风险概率，系统诈骗风险识别模型中/>

部分，表征了待评估人在多家保险公司理赔多个同类型保险所导致的系统性保险诈骗风险概率。

本实施例所搭建的系统诈骗风险识别模型是基于统计学概率进行风险预测的，同时，该模型中的参数可以根据实际情况进行灵活调整，能够适应不同场景的需求，并且，该模型能够在较短的时间内对大量数据进行分析和预测，提高了检测和识别诈骗行为的效率。本实施例所搭建的系统诈骗风险识别模型可以通过多项参数识别个人存在的系统性保险诈骗风险，并预测出相应的概率，从而有助于预防和降低诈骗风险。

S04、利用所述风险识别数据库结合所述系统诈骗风险识别模型，识别系统性保险诈骗。

基于步骤S03中所提出的系统诈骗风险识别模型，代入步骤S03所获得的风险识别数据库中的数据，可识别出当前可能存在的系统性保险诈骗行为的敏感个人身份信息，并利用系统诈骗风险识别模型来计算对应的概率。通过该步骤的实施，可以及时发现可能存在的诈骗行为，提高保险公司的风险管理水平，降低被诈骗的风险和损失。

S05、根据识别结果，链接敏感身份对应的保险理赔数据。

步骤S05将步骤S04中所识别出的敏感个人身份信息和其对应的保险理赔数据进行关联，以便于更深入地分析和追溯可能存在的诈骗行为。进一步地，在一个可选的实施例中，步骤S05所述的根据系统性保险诈骗结果，链接敏感身份对应的保险理赔数据，包括如下步骤：

S051、设定风险评估阈值，根据所述风险评估阈值判定系统性保险诈骗识别结果中的敏感身份。

步骤S051设定的风险评估阈值

可以根据具体场景进行设置。例如，可以将风险评估阈值/>

设置为0.8，表示对于/>

大于0.8的敏感个人身份，链接其对应的保险理赔数据。即根据系统诈骗风险识别模型，评估待评估人参与系统性保险诈骗的概率，并判定系统性保险诈骗结果中的敏感身份是否需要进行链接保险理赔数据的操作。

S052、根据所述敏感身份，在所述风险识别数据库中查找对应的保险理赔数据。

根据步骤S052中所确定的敏感身份，到风险识别数据库中查找对应的保险理赔数据，获取敏感身份对应的保险理赔记录信息。例如，在步骤S052中识别出了敏感身份“张三”，则在风险识别数据库中查找“张三”对应的保险理赔数据。

S053、核查所述敏感身份的保险理赔数据，并根据核查结果确定是否存系统性保险诈骗的风险。

步骤S053对于获取到的敏感身份的保险理赔数据进行核查，确认是否存在系统性保险诈骗风险。核查的方式可以包括人工核查和系统自动核查，根据实际情况选择合适的核查方式。基于步骤S052中获取到“张三”对应的保险理赔数据，进行核查，确认是否存在系统性保险诈骗风险。例如，可以对该保险理赔数据进行人工核查，确认是否存在故意虚报理赔的情况，如果存在，则认定存在系统性保险诈骗风险。

S06、追溯所述敏感身份的保险理赔数据来源，提示对应保险公司预防系统性保险诈骗。

步骤S06通过对步骤S05中所链接的保险理赔数据的来源进行追溯和分析，发现可能存在的系统性保险诈骗行为的源头，向对应的保险公司提供相应的提示和建议，以便其采取相应的措施预防类似的诈骗事件再次发生。

本发明所提供的保险欺诈识别方法通过获取多源保险理赔数据，生成风险识别数据库，并搭建系统诈骗风险识别模型，实现了系统性保险诈骗的识别和预防。本发明所提供的保险欺诈识别方法的优点在于能够综合多方数据，精准识别系统性保险诈骗，提高保险公司对风险的识别和防范能力，从而降低保险欺诈带来的损失。同时，该方法也能追溯敏感身份的保险理赔数据来源，提醒保险公司对应用风险管理措施预防类似的欺诈行为，进一步提升保险公司的风险管理水平和服务质量，增强客户信任度。

为更好执行上述保险欺诈识别方法，在一个可选的实施例中，请参见图5，图5为本发明实施例所提供的保险欺诈识别系统结构图。如图5所示，本发明所提供的保险欺诈识别系统包括一个或多个处理器501；一个或多个输入设备502；一个或多个输出设备503和存储器504，所述处理器501、所述输入设备502、所述输出设备503和所述存储器504通过总线连接，所述存储器504用于存储计算机程序，所述计算机程序包括程序指令，所述处理器501被配置用于调用所述程序指令，执行本发明所提供的保险欺诈识别方法。本发明所提供的保险欺诈识别系统性能高、稳定，结构紧凑，能够高效且准确地实施保险欺诈识别方法。

在又一个可选的实施例中，处理器501可以是中央处理单元（Central ProcessingUnit，CPU），也可以是其他通用处理器、数字信号处理器（Digital Signal Processor，DSP）、专用集成电路（Application Specific Integrated Circuit，ASIC）、现成可编程门阵列（Field Programmable Gate Array，FPGA）或其他可编程逻辑器件、分立门或晶体管逻辑器件、分立硬件组件等。输入设备502可用于输入采集的保险理赔数据。输出设备503可显示通过本发明的方法识别的系统性保险欺诈的结果相关信息进行显示。该存储器504可以包括只读存储器和随机存取存储器，并向处理器501提供指令和数据。存储器504的一部分还可以包括非易失性随机存取存储器。例如，存储器504还可以储设备类型的信息。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围，其均应涵盖在本发明的权利要求和说明书的范围当中。

Claims

1.一种保险欺诈识别方法，其特征在于，所述保险欺诈识别方法，包括如下步骤：

获取多源保险理赔数据；

基于所述多源保险理赔数据，通过身份链接生成风险识别数据库；

搭建系统诈骗风险识别模型；

利用所述风险识别数据库结合所述系统诈骗风险识别模型，识别系统性保险诈骗；

根据识别结果，链接敏感身份对应的保险理赔数据；

追溯所述敏感身份的保险理赔数据来源，提示对应保险公司预防系统性保险诈骗。

2.根据权利要求1所述的保险欺诈识别方法，其特征在于，所述获取多源保险理赔数据，包括如下步骤：

确定多个数据源和数据类型；

根据所述数据类型，分别从多个数据源获得对应的保险理赔数据。

3.根据权利要求2所述的保险欺诈识别方法，其特征在于，所述根据所述数据类型，分别从多个数据源获得对应的保险理赔数据，包括如下步骤：

搭建第三方数字中心，并使所述第三方数字中心获得各个数据源的授权；

根据授权结果，令所述第三方数字中心向授权后的各个数据源发送随机加密协议；

令各个数据源根据对应的随机加密协议对保险理赔数据进行加密，并将加密保险理赔数据发送至所述第三方数字中心；

通过所述第三方数字中心解密并汇总多个数据源的加密保险理赔数据，获得多源保险理赔数据。

4.根据权利要求3所述的保险欺诈识别方法，其特征在于，所述对保险理赔数据进行加密，包括如下步骤：

确定数据源所提供的保险理赔数据中包含的字符种类，并汇总所述字符种类生成字符库；

利用所述字符库生成随机字符组，并获取所述随机字符组中的元素数量；

根据所述元素数量设定映射中心位置，并基于映射中心位置生成正向映射加密规则；

利用所述正向映射加密规则，加密所述保险理赔数据。

5.根据权利要求4所述的保险欺诈识别方法，其特征在于，所述正向映射加密规则，满足如下模型：

，/>

，

其中，

表示正向趋近映射中心位置/>

的第/>

个元素，/>

表示反向趋近映射中心位置/>

的第/>

个元素，/>

表示元素趋近映射中心位置/>

的位置标识，/>

表示元素数量，/>

表示取整函数。

6.根据权利要求5所述的保险欺诈识别方法，其特征在于，解密所述加密保险理赔数据，包括如下步骤：

获取所述加密保险理赔数据对应的地址信息；

根据所述地址信息，确定所述加密保险理赔数据中的加密元素；

利用反向映射加密规则解密加密元素，获得原始保险理赔数据。

7.根据权利要求6所述的保险欺诈识别方法，其特征在于，所述反向映射加密规则，满足如下模型：

,/>

，

其中，

表示正向趋近映射中心位置/>

的第/>

个元素，/>

表示反向趋近映射中心位置/>

的第/>

个元素，/>

表示元素趋近映射中心位置/>

的位置标识，/>

表示元素数量，/>

表示取整函数。

8.根据权利要求1所述的保险欺诈识别方法，其特征在于，所述系统诈骗风险识别模型，满足如下公式：

，

其中，

表示待评估人参与系统性保险诈骗的概率，/>

表示保险理赔数据单项风险系数，/>

,/>

表示保险理赔数据的理赔类型编号，/>

表示保险理赔数据的理赔类型总数量，/>

，/>

表示保险公司编号，/>

表示保险公司总数量，/>

表示待评估人在第j个保险公司中理赔的第/>

类保险的数量，/>

表示保险理赔数据汇聚风险系数,/>

9.根据权利要求1所述的保险欺诈识别方法，其特征在于，所述基于所述多源保险理赔数据，通过身份链接生成风险识别数据库，包括如下步骤：

预处理所述多源保险理赔数据；

识别预处理后多源保险理赔数据中的身份信息；

根据所述身份信息链接同一人的保险理赔数据，生成个人保险理赔数据；

汇总个人保险理赔数据，生成风险识别数据库。

10.一种保险欺诈识别系统，其特征在于，所述保险欺诈识别系统包括一个或多个处理器；一个或多个输入设备；一个或多个输出设备和存储器，所述处理器、所述输入设备、所述输出设备和所述存储器通过总线连接，所述存储器用于存储计算机程序，所述计算机程序包括程序指令，所述处理器被配置用于调用所述程序指令，执行如权利要求1-9任一所述的保险欺诈识别方法。