CN112801805A

CN112801805A - 基于深度自监督神经网络的医保小卡欺诈检测方法及系统

Info

Publication number: CN112801805A
Application number: CN202110078727.1A
Authority: CN
Inventors: 应豪超; 吴健; 姜晓红; 胡荷萍
Original assignee: Shandong Industrial Technology Research Institute of ZJU
Current assignee: Shandong Industrial Technology Research Institute of ZJU
Priority date: 2021-01-21
Filing date: 2021-01-21
Publication date: 2021-05-14

Abstract

本发明属于医疗保险数据处理技术领域，尤其是涉及基于深度自监督神经网络的医保小卡欺诈检测方法及系统。基于深度自监督神经网络的医保小卡欺诈检测方法，包括以下步骤：S1、数据生成和脱敏；S2、数据分析；S3、信息提取；S4、数据划分；S5、归一化处理；S6、构建网络；S7、概率预测；S8、导出结果。本发明提供了一种解决实际应用中刷小卡医保欺诈检测不够准确、自适应程度差的问题的基于深度自监督神经网络的医保小卡欺诈检测方法及系统。

Description

基于深度自监督神经网络的医保小卡欺诈检测方法及系统

技术领域

本发明属于医疗保险数据处理技术领域，尤其是涉及基于深度自监督神经网络的医保小卡欺诈检测方法及系统。

背景技术

医保是指社会医疗保险，是国家和社会根据一定的法律法规，为向保障范围内的劳动者提供患病时基本医疗需求保障而建立的社会保险制度。医保具有“低水平，广覆盖”的特点，缴费以低水平的绝大多数单位和个人能承受的费用为基准，广泛覆盖城镇所有单位和职工，不同性质单位的职工都能享有基本医疗保险的权利。近年来，国务院推进城镇居民医保和新农合制度整合，逐步在全国范围内建立起统一的城乡居民医保制度，不断推进全民医保的实现，且参保人员完成缴费年限后可以终身享受医保待遇。其次基本医疗保险具有“双方负担，统账结合”的特点；以“以收定支，收支平衡”为原则。

医保对解决民生问题发挥着重要作用。但伴随着医保的推进，我国基本医疗保险制度不断健全，已经建立起覆盖广泛的全民基本医疗保险体系。医保基金收入的增长的同时，受人口老龄化加护、保障水平提升等方面因素的影响，为医保基金的长期稳定运营带来较大的压力。受监管制度体系不健全，激励约束机制不完善等因素制约，医保基金使用效率不高，欺诈骗保问题频发普发，基金监管形势较为严峻，而医保欺诈是指参保人或组织机构在参加医疗保险、享受医疗保险待遇的过程中，弄虚作假、虚假开药、盗刷套刷并隐瞒真实情况等造成医疗保险基金损失的行为。

为了提升医保基金使用效率，遏制欺诈骗保问题频发普发的现象，并促进医保的智能监管，医保智能监管服务平台应运而生。它是能够通过大数据智能分析手段实时地为医保局相关人员提供机构基金消费分析、收支余分析、控费监管、成效评估等医保基金相关服务的一款应用平台系统。在很大程度上，能够解决医保人员面对海量数据时数据复杂、分析难度过高、耗时等问题。利用我们的模型和大数据分析手段，可以直接对欺诈骗保可疑案例进行核验和处理，另外也能对各类医改成效进行直观评估，从而获得便利、快捷、高效的医保监管流程。在所有类型的医保欺诈案件中，可以分为小卡购药异常、大额购药异常、诊疗异常、住院异常等，刷小卡的异常是针对药店或机构进行的小额刷卡异常的行为的简称，这种情况下一般为集卡的黄牛收集了一堆卡，在不同或相同的机构进行刷卡，一方面为降低机构的均次费用，另一方面则是参保人利用医保报销低价购买药品套现医保资金。本文主要想用大数据和人工智能的方式方便、快捷、有效地识别发生此类行为的可疑人员和对应机构，以保障医保资金的有效利用。

由于刷小卡这种异常情况复杂、多变、且不具备稳定的特征，而其关键的不变特征‘小额’、‘多次’也是一个相对泛化的概念，若针对不同的属性变量进行阈值的设定，则会发生阈值设定不合理，阈值对地域和时间变换没有自适应性等特点，因此我们从大数据和深度神经网络技术的角度出发，提取相关特征，并进行自监督网络的特征融合处理，以预测可疑性的个人和机构联合的医保欺诈行为。

从理论上来说，深度神经网络的发展历史是漫长的。神经网络的起源和基础来自1940年提出的MP模型和Hebb学习规则，随之，感知器于1960年由美国计算机科学家罗森布拉特提出，是最早的人工神经网络，其中神经元的计算当成是输入值的加权和，对应于突触的缩放值以及神经元所接收的值的组合。而后20年，神经网络的发展陷入了低谷，直到1980年，Boltzmann机和BP算法的提出，使得神经网络又回到了人们的视野当中，非线性的功能可以通过增加网络的深度来实现，但缺乏计算机算力的支持，训练出来的模型缺乏有效性，而这之后，深度神经网络(LeNet)在90年代末期的首次提出，且有了一定的应用场景，直到Hinton于2006年提出了DBN，并解决了深度网络的训练和实现问题，直接使得2012年深度神经网络快车的出发，这一漫长历史的发展为神经网络提供了必要的算力、算法和数据的支持。当我们需要用传统方法解决欺诈检测问题时，需要依赖于强大的经验背景，且当数据来源和时间发生变化之后，关于异常检测的阈值参数都需要做出适当的调整以满足不同场景的需求。

发明内容

本发明所要解决的技术问题是提供一种解决实际应用中刷小卡医保欺诈检测不够准确、自适应程度差的问题的基于深度自监督神经网络的医保小卡欺诈检测方法及系统。为此，本发明采用以下技术方案：

基于深度自监督神经网络的医保小卡欺诈检测方法，包括以下步骤：

S1、数据生成和脱敏，从医保系统中导出oracle数据，并进行脱敏处理，再转至工作使用的oracle数据；

S2、数据分析，基于参保人行为和步骤S1所得数据库中的字段变量，分析小卡欺诈检测的内容、范围和合理性；

S3、信息提取，将步骤S2所得分析结果以固定时间范围内的人为单位，再从oracle数据中进行相关属性的设置和提取；

S4、数据划分，以人及对应属性为基础数据，对步骤S3所得结果进行数据划分，得到训练集和验证集；

S5、归一化处理，对步骤S4所得的训练集和验证集进行数据归一化处理；

S6、构建网络，构建深度自监督的分类神经网络，并依次迭代训练集的所有样本更新模型参数直至收敛，得到训练好的分类模型；

S7、概率预测，将步骤S4所得的基础数据输入步骤S6所得的分类模型中进行标签预测，得到单人固定时间范围内小卡欺诈的概率；

S8、导出结果，根据欺诈检测的需求设定概率阈值，将步骤S7所得结果划分出超出该阈值的人员，该部分人员即为可疑人员，并导出可疑人员该时间段内医保结算的明细信息。

当依赖于强大的深度神经网络的背景，及其强大的模型学习能力时，能够自适应地学习医保欺诈相关的‘人-属性’类数据，且能够应对数据来源的变化。与传统算法相比，速度更快、效果更好。针对不同的应用场景，我们还需要在模型中融合进去各种相关类属性变量，使之适应性更好。

其中，oracle数据又名Oracle RDBMS，或简称Oracle。它是在数据库领域一直处于领先地位的产品。可以说Oracle数据库系统是目前世界上流行的关系数据库管理系统，系统可移植性好、使用方便、功能强，适用于各类大、中、小微机环境。它是一种高效率的、可靠性好的、适应高吞吐量的数据库方案。

在采用上述技术方案的基础上，本发明还可采用以下进一步的技术方案：

所述步骤S1还包括：将政府医保系统中带有个人敏感信息的原始数据进行脱敏处理，再导出到安全的工作系统中进行oracle数据的存储。带有个人敏感信息的原始数据存储在政府医保系统中，而要对这些数据进行处理，需要在进行数据充分脱敏的前提下导出，再转至安全的工作系统中进行oracle数据的存储。

所述步骤S2中小卡欺诈检测的范围阈值为就诊消费均次小于60元人民币。需要在提取属性前对系统包含的相关字段变量和小卡欺诈的内容和范围进行确定，由于刷小卡欺诈针对机构的小额且多频次刷卡，主要是机构为了降低单机构医疗就诊均次费用而进行的欺诈行为，而目前就诊消费均次为90多元，因此小卡的一个明显阈值必定在90元之内。

进一步地，oracle医保数据库中包含的字段变量包括机构编码、机构名称、机构地址、机构经纬度、医师姓名、医师编码、参保人编码、结算时间、不同项目的结算单价、项目数量、项目总价、项目各类医保相关费用、项目编码、项目名称等上百个数据库字段。

所述步骤S3中的属性设置至少包括：购药地址所围多边形面积、购药机构数、购药机构变换频次、机构变换频次率、机构辐射范围、刷卡数量、购药总量、购药均次数量、购药相似度、均次费用、单价相似度、药品种类数、同种疾病对应药品相似度、年龄、疾病种类数、疾病变换频次、购药时间集中度、购药时间间隔和时间点相似性。具体地，需要从oracle数据中进行相关属性的设置和提取，基于观察研究，设定的属性内容均针对单人，且在固定时间范围内。而固定时间范围一般指当年年初到最新数据截止这样一个时间段。

步骤S5是出于对步骤S3中各个属性的差异考虑，以及模型训练的需要，需要对数据进行适当的归一化操作。

所述步骤S6分类神经网络结合聚类网络、深度学习网络，并基于损失函数进行训练微调。

所述步骤S6还包括以下步骤：从输入开始，经过初步特征提取，将特征输入聚类网络得到伪标签，并将伪标签当成模型的真实标签，同时特征会继续输入到后续的特征提取模块和分类模块，得到是或否的输出，同时利用伪标签进行反向传播，依次迭代，直到模型收敛。

具体地，得到是或否的二分类输出及其对应置信度，再利用伪标签计算交叉熵损失并进行反向传播以更新模型参数，当参数更新完毕后，重新产生一个batch的数据作为输入输入当前更新参数后的模型，依次如上述方式迭代，直到模型收敛或达到训练设定的最大迭代次数100。

所述步骤S7中，将所有基础数据输入训练好的模型进行标签预测，得到单人固定时间范围内小卡欺诈的概率，取值范围在0-1之间。

所述步骤S8中，在单人小卡欺诈的概率获得的前提下，设定概率阈值0.5(若需要强可疑性的人员，可适当提高阈值)，并筛出可疑人员(概率超出阈值的人员)，同时需要将可疑人员的结算明细从医保数据库中提取出来供相关人员核验。

在实际操作过程中，由于目标对象是刷小卡这样一个复杂且专业的场景，因此，依赖于我们对应的数据库，首先我们先划定时间和区域范围，在此基础上，提取相关属性变量，包括：购药地址所围多边形面积、购药机构数、购药机构变换频次、机构变换频次率(购药机构变换频次/购药次数)、机构辐射范围、刷卡数量、购药总量、购药均次数量、购药相似度、均次费用、单价相似度、药品种类数、同种疾病对应药品相似度(多种疾病均值)、年龄、疾病种类数、疾病变换频次、购药时间集中度、购药时间间隔和时间点相似性等。在提取固定区域范围内有药店或机构购药记录的所有参保人对应的上述属性之后，需要搭建深度自监督网络模型。模型首先会经过几层特征编码层，得到特征编码后，特征会输入聚类网络产生伪标签，同时输入后续的特征转换网络，并贯通到最后的分类网络，得到预测标签，由于缺乏标注，聚类得到的伪标签当成是当前真实标注，由此计算损失并反向传播，更新完模型参数后继续进行网络学习，直到模型收敛。

本发明还同时提供以下技术方案：

基于深度自监督神经网络的医保小卡欺诈检测系统，于包括：

存储器，存储计算机可执行指令以及在执行所述计算机可执行指令时使用或生产的数据；

处理器，与所述存储器通信连接，并配置为执行存储器存储的计算机可执行指令；

所述计算机可执行指令在被执行时，实现上述的检测方法。

与现有技术相比，本发明具有以下有益效果：

1)将亿级数据转化为‘人-属性’模型的特征类数据，并基于提取的特征和聚类网络得到每次迭代的伪标签。

2)提出了深度自监督神经网络的小卡欺诈检测模型，有效利用模型处理多维特征的关联关系。

3)某种程度上，极大地减轻了医保稽查人员的工作量，为稽查提供了欺诈检测的更多可能性。

4)提升稽查人员的工作效率，阻止大量医保资金的滥用。

附图说明

图1为本发明基于深度自监督神经网络的医保小卡欺诈检测方法及系统的实施例中深度自监督神经网络模型结构图。

具体实施方式

为了进一步理解本发明，下面结合具体实施方式对本发明提供的基于深度自监督神经网络的医保小卡欺诈检测方法及系统进行具体描述，但本发明并不限于此，该领域技术人员在本发明核心指导思想下做出的非本质改进和调整，仍然属于本发明的保护范围。

实施例，基于深度自监督神经网络的医保小卡欺诈检测方法，包括以下步骤：

S1、数据生成和脱敏，从医保系统中导出oracle数据，并进行脱敏处理，再转至工作使用的oracle数据。

具体地，将政府医保系统中带有个人敏感信息的原始数据进行脱敏处理，再导出到安全的工作系统中进行oracle数据的存储。

S2、数据分析，基于参保人行为和步骤S1所得数据库中的字段变量，分析小卡欺诈检测的内容、范围和合理性。

具体地，需要在提取属性前对系统包含的相关字段变量和小卡欺诈的内容和范围进行确定，由于刷小卡欺诈针对机构的小额且多频次刷卡，主要是机构为了降低单机构医疗就诊均次费用而进行的欺诈行为，而目前就诊消费均次为90多元，因此小卡的一个明显阈值必定在90元之内。

具体地，oracle医保数据库中包含的字段变量包括机构编码、机构名称、机构地址、机构经纬度、医师姓名、医师编码、参保人编码、结算时间、不同项目的结算单价、项目数量、项目总价、项目各类医保相关费用、项目编码、项目名称等上百个数据库字段。

其中，需要对各个变量的含义做出具体解释。假设单人购药地点有5个，则5个点可以围成一个多边形，通过经纬度可以计算多边形的面积、两两机构之间的平均距离、最大距离和距离标准差等，而机构辐射范围则是两两机构间最大距离。机构变换频次则是针对同一个人的购药时间进行时间序列的排序，若机构之间的变换为A→B→C→C→A→A→D→B→E，则变换频次为6次。购药相似度通过两次购药列表的交集与并集的比例获得，单价相似度则是购药单价的标准差的倒数与常数k的乘积(k可取5)。购药时间集中度则根据购药时间计算年时间序列的间隔标准差，而时间点相似性则是换算为一天24小时，计算每次购药时间点的相似性(最常购药的时间点的购药次数/购药次数)。其他变量则是对应变量的字面含义。

S3、信息提取，将步骤S2所得分析结果以固定时间范围内的人为单位，再从oracle数据中进行相关属性的设置和提取。

具体地，以固定时间范围内的人为单位，再从oracle数据中进行相关属性的提取，属性具体包括：购药地址所围多边形面积、购药机构数、购药机构变换频次、机构变换频次率(购药机构变换频次/购药次数)、机构辐射范围、刷卡数量、购药总量、购药均次数量、购药相似度、均次费用、单价相似度、药品种类数、同种疾病对应药品相似度(多种疾病均值)、年龄、疾病种类数、疾病变换频次、购药时间集中度、购药时间间隔、时间点相似性、购药地点间的平均距离、购药地点间的最大距离、购药地点间的距离标准差。

S4、数据划分，以人及对应属性为基础数据，对步骤S3所得结果进行数据划分，得到训练集和验证集。

具体地，获得单人长为22的‘人-属性’数据，假设人员个数为N，进行数据划分，按7:3划分得到训练集和验证集。

S5、归一化处理，对步骤S4所得的训练集和验证集进行数据归一化处理。

S6、构建网络，构建深度自监督的分类神经网络，并依次迭代训练集的所有样本更新模型参数直至收敛，得到训练好的分类模型。

具体地，构建一个深度自监督的分类神经网络，该网络从输入开始，经过初步特征提取，将特征输入聚类网络得到伪标签，并将伪标签当成模型的真实标签，同时特征会继续输入到后续的特征提取模块和分类模块，得到是或否的二分类输出及其对应置信度，再利用伪标签计算交叉熵损失并进行反向传播以更新模型参数，当参数更新完毕后，重新产生一个batch的数据作为输入输入当前更新参数后的模型，依次如上述方式迭代，直到模型收敛或达到训练设定的最大迭代次数100。

其中，具体模型结构示意图如图1，其中标注为‘Train’的路线表示只在训练的时候通过，而标注为‘Test’的路线则在测试的通过。前期特征提取通过3个FC层，后期特征提取和分类模块包括3个FC层和一个Sigmoid模块，FC_n1表示该FC层有n1个神经元，K_Means是聚类方法用以得到伪标签，Sigmoid模块则用于得到预测概率值，损失则用交叉熵损失。

针对二分类的模型，损失设置为交叉熵损失函数，其表达式如下：

其中y_i表示样本i标签，正类为1，负类为0。p_i表示样本i预测为正类的概率。N表示样本总数量。

K-Means(K均值)聚类算法具体步骤介绍如下：

Step 1:确定聚类类别为2，并随机初始化2个中心点；

Step 2：计算每个数据点到2个中心点的距离，将每个数据点分配给距离该数据点较近的中心类中；

Step 3：重新计算2类各自的中心点；

Step 4:重复以上Step2→Step 3，直到每一类的中心点在每次迭代后变化不大或者达到设置的最大迭代次数；

Step 5：获取每个数据点所在的中心点的类别作为该数据点的伪标签。

在实际训练的过程中，分类模型迭代次数的上限设置为100次，当达到迭代次数的上限，或者验证集的损失不再下降或者验证集的效果不再提升，则停止训练，并保存模型作为该模型得到的模型，并继续进行接下来的预测步骤。

S7、概率预测，将步骤S4所得的基础数据输入步骤S6所得的分类模型中进行标签预测，得到单人固定时间范围内小卡欺诈的概率。

具体地，将所有基础数据输入训练好的模型进行标签预测，得到单人固定时间范围内小卡欺诈的概率，取值范围在0-1之间。

具体地，在单人小卡欺诈的概率获得的前提下，设定概率阈值0.5(若需要强可疑性的人员，可适当提高阈值)，并筛出可疑人员(概率超出阈值的人员)，同时需要将可疑人员的结算明细从医保数据库中提取出来供相关人员核验。

其中，初步阈值设置为0.5，若提取出的人员过多，则适当增加阈值(考虑到实际稽查的难度和医保局查处欺诈骗保行为的威慑作用)，以获取异常人员和异常机构。在提取明细的过程中，为了核验的便利，需要提取参保人、机构、购买项目名称、项目编码、单价、数量、时间、列支费用、医保报销费用、性别、参保类型等相关变量供医保局稽查人员核验，具体内容会与当地数据库表结构和需求相关。

虽然本发明已通过参考优选的实施例进行了图示和描述，但是，本专业普通技术人员应当了解，在权利要求书的范围内，可作形式和细节上的各种各样变化。

Claims

1.基于深度自监督神经网络的医保小卡欺诈检测方法，其特征在于包括以下步骤：

2.根据权利要求1所述的基于深度自监督神经网络的医保小卡欺诈检测方法，其特征在于所述步骤S1还包括：将政府医保系统中带有个人敏感信息的原始数据进行脱敏处理，再导出到安全的工作系统中进行oracle数据的存储。

3.根据权利要求1所述的基于深度自监督神经网络的医保小卡欺诈检测方法，其特征在于步骤S2中小卡欺诈检测的范围阈值为就诊消费均次小于60元人民币。

4.根据权利要求1所述的基于深度自监督神经网络的医保小卡欺诈检测方法，其特征在于所述步骤S3中的属性设置至少包括：购药地址所围多边形面积、购药机构数、购药机构变换频次、机构变换频次率、机构辐射范围、刷卡数量、购药总量、购药均次数量、购药相似度、均次费用、单价相似度、药品种类数、同种疾病对应药品相似度、年龄、疾病种类数、疾病变换频次、购药时间集中度、购药时间间隔和时间点相似性。

5.根据权利要求1所述的基于深度自监督神经网络的医保小卡欺诈检测方法，其特征在于所述步骤S6分类神经网络结合聚类网络、深度学习网络，并基于损失函数进行训练微调。

6.根据权利要求5所述的基于深度自监督神经网络的医保小卡欺诈检测方法，其特征在于所述步骤S6还包括以下步骤：从输入开始，经过初步特征提取，将特征输入聚类网络得到伪标签，并将伪标签当成模型的真实标签，同时特征会继续输入到后续的特征提取模块和分类模块，得到是或否的输出，同时利用伪标签进行反向传播，依次迭代，直到模型收敛。

7.基于深度自监督神经网络的医保小卡欺诈检测系统，其特征在于包括：

所述计算机可执行指令在被执行时，实现如权利要求1～6中任一一项所述的检测方法。