CN110827159B - 基于关系图的金融医疗保险诈骗预警方法、装置及终端 - Google Patents

基于关系图的金融医疗保险诈骗预警方法、装置及终端 Download PDF

Info

Publication number
CN110827159B
CN110827159B CN201911093161.9A CN201911093161A CN110827159B CN 110827159 B CN110827159 B CN 110827159B CN 201911093161 A CN201911093161 A CN 201911093161A CN 110827159 B CN110827159 B CN 110827159B
Authority
CN
China
Prior art keywords
doctor
patient
suspected
data
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911093161.9A
Other languages
English (en)
Other versions
CN110827159A (zh
Inventor
朱浩瑾
李晋雷
吴沛霖
李超
王健宗
黄章成
孔令炜
肖京
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN201911093161.9A priority Critical patent/CN110827159B/zh
Publication of CN110827159A publication Critical patent/CN110827159A/zh
Application granted granted Critical
Publication of CN110827159B publication Critical patent/CN110827159B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明提供了一种基于关系图的金融医疗保险诈骗预警方法,所述方法对医疗实体及实体间的统计相关数据之离散分布进行构图,通过对其关系网络进行分析,利用传播算法迭代寻找欺诈嫌疑人,并重新构图利用用户画像缩小嫌疑人范围,进一步筛选出具有欺诈行为的团伙,以便于相关人员分配资源推进下一步的调查。同时提供了一种用于执行上述基于关系图的金融医疗保险诈骗预警方法的金融医疗保险检测装置及终端。本发明利用图计算技术分析医疗保险关系网络,不需人工设定规则,能够实现更加高效、快速、灵活的欺诈侦测,满足相关行业的需求。

Description

基于关系图的金融医疗保险诈骗预警方法、装置及终端
技术领域
本发明涉及图计算技术领域,具体地,涉及一种将图计算应用于金融医疗保险检测中的一种基于数据关系图的金融医疗保险诈骗预警方法、装置及终端。
背景技术
随着时代的进步,金融医疗保险已成为人类生活中一个重要且快速发展的领域。然而,金融医疗保险的一个重要问题是由于欺诈和滥用造成的大量支出损失。欺诈问题的严重性吸引了金融医疗保险行业及数据分析行业为开发相关欺诈侦测方法做出许多努力,但欺诈侦测问题仍远未得到解决,成为了数据分析最有前景的应用领域之一。一个高效的金融医疗保险欺诈侦测方法将大大帮助相关分析人员利用有限的资源推进其调查工作。
金融医疗保险数据往往伴随着复杂的技术挑战。其数据集通常很大,而且多种多样。金融医疗保险数据往往涉及数百万以上的患者和其相应的各类就诊记录,这要求欺诈侦测系统需要能处理数据量大并具有多样性的数据。传统上,可以依靠专业的审计人员手工设定相应的规则集合,识别可疑的保险欺诈行为。这种通过预先定义的规则集合与数据进行比较的方法昂贵耗时,而且性能十分有限,容易被欺诈者所规避。以数据驱动,从真实数据中识别正常模式并检测异常状态的方法则更有效、更灵活,但其计算量也更大。
近年来,基于图的技术得到了大量的应用,尤其是在大规模的网络分析与社群交互分析中。对于金融医疗保险数据,侦测出异常的欺诈事件的关键在于发现有组织犯罪。患者与患者、患者与医生、医生与医生都有可能通过相互勾结共同参与欺诈行为。为了从团伙和社群的角度侦测诈骗,图分析和图计算的方法具有很大的潜力。
目前没有发现同本发明类似技术的说明或报道,也尚未收集到国内外类似的资料。
发明内容
针对现有技术中存在的上述不足,本发明的目的是提供一种基于数据关系图的金融医疗保险诈骗预警方法、装置及终端,该方法、装置及终端将图计算应用于金融医疗保险检测中,对医疗实体及实体间的关系进行构图,通过对其关系网络进行分析,能够在金融医疗保险欺诈导致了大量支出损失的情况下,帮助相关分析人员进行调查工作,高效侦测是否有欺诈行为发生,并侦测出潜在的欺诈团伙,以便于相关人员分配资源推进下一步的调查。
本发明是通过以下技术方案实现的。
根据本发明的一个方面,提供了一种基于关系图的金融医疗保险诈骗预警方法,包括如下步骤:
S1,获取患者数据和医生数据,并将患者数据和医生数据分别作为节点,统计数据的离散分布,根据该离散分布的距离构造边,分别构建形成关系图;
S2,利用传播算法迭代分别查找具有欺诈嫌疑的患者以及医生,得到嫌疑患者及嫌疑医生疑似数据;
S3,根据S2中得到的嫌疑患者及嫌疑医生疑似数据分别重新构图,并获取与嫌疑患者关联度满足设定条件A的嫌疑医生以及与嫌疑医生关联度满足设定条件B的嫌疑患者,分别构建嫌疑人关系图;
S4,根据S3中得到的嫌疑人关系图,利用传播算法进一步缩小嫌疑人范围,筛选出嫌疑患者及医生精确数据。
优选地,所述S1中,所述患者数据包括:患者及其就医科室和医嘱数据;所述医生数据包括:医生及其所在科室和所开具的每单医嘱中的药品总价数据;
其中:
将每一个患者及其就医科室作为一个节点,并将该患者在该就医科室下所接收的所有医嘱作为该节点的离散分布;
将每一个医生及其所在科室作为一个节点,并将该医生在该科室所开局的每单药品总价作为该节点的离散分布。
优选地,所述S1中,采用Hellinger距离作为离散分布的距离构造边,具体包括如下步骤:
对于患者数据部分,对各个节点的医嘱分布计算两两节点之间的Hellinger距离;若该距离大于固定阈值0.95,则在相应的两个节点之间添加一条边;
对于医生数据部分,对各个节点的药品总价分布计算两两节点之间的Hellinger距离;若该距离小于固定阈值0.3,则在相应的两个节点之间添加一条边;
其中,计算两两节点之间的Hellinger距离的公式为:
式中,P,Q为两个离散分布,P=(p1,…,pk),Q=(q1,…,qk),k为维数。
需要说明的是,S1中,固定阈值分别设定为0.95和0.3,是基于本地数据集测试后选定的,在相应数据集上效果最好,可以筛选出较多具有代表性的异常节点。
优选地,所述S2中,传播算法采用Personalized PageRank算法,具体包括如下步骤:
对于患者关系图,遍历其中出现过的所有科室,并将它们分别作为PersonalizedPageRank算法的种子,对整个图进行迭代;若某节点的排名结果大于种子中排名最大结果的90%,则对该节点添加欺诈嫌疑标签;
对于医生关系图,遍历其中出现过的所有科室,对每一个科室分别进行PageRank迭代;若某节点的最终排名在后5%且其包含的所有医嘱的平均药品总价大于设定价值时,对该节点添加欺诈嫌疑标签;
需要说明的是,S2中,分别设定阈值为90%和5%,是基于本地数据集测试后选定的,在相应数据集上效果最好,可以筛选出每个科室中具有代表性的异常节点。
优选地,所述S3中,将S2中得到的每一个嫌疑患者及每一个嫌疑医生分别作为一个节点,获取满足设定条件A的嫌疑医生,以及满足设定条件B的嫌疑患者;其中,所述设定条件A为:提供给嫌疑患者的医嘱中药品总价超过设定价值的医生,设定条件B为:与嫌疑医生有联系的医嘱数量大于等于设定数值的患者;
依据获取的嫌疑医生的医嘱数据及嫌疑患者的药品总价数据分别重新构图;
其中:
对于嫌疑医生部分,利用各个节点的医嘱分布的Hellinger距离作为两两节点间的距离,若该距离小于固定阈值0.3,则在相应的两个节点之间添加一条边;
对于嫌疑患者部分,利用各个节点的每单价格分布的Hellinger距离作为两两节点间的距离,若该距离小于固定阈值0.3,则在相应的两个节点之间添加一条边。
需要说明的是,S3中,固定阈值分别设置为0.3,是基于本地数据集测试后选定的,在相应数据集上效果最好,可以筛选出较多具有代表性的相似节点。
优选地,所述S4中,传播算法采用Personalized PageRank算法,具体包括如下步骤:
对于嫌疑医生图,遍历其中出现过的所有科室,将它们分别作为PersonalizedPageRank算法的种子,对整个图进行迭代;若某节点的排名结果大于种子节点中最小排名结果,则对该节点添加欺诈嫌疑标签;
对于嫌疑患者图,遍历其中出现过的所有科室,对每一个科室分别进行PageRank迭代;若某节点的最终排名在后5%,则对该节点添加欺诈嫌疑标签。
需要说明的是,S4中,设置阈值为5%,是基于本地数据集测试后选定的,在相应数据集上效果最好,可以筛选出每个科室中具有代表性的异常节点。
优选地,所述方法,还包括如下步骤:
S5,提交S4中得到的嫌疑患者及医生精确数据并输出预警信息。
根据本发明的另一个方面,提供了一种用于执行上述任一项所述方法的金融医疗保险诈骗预警系统,包括如下模块:
构建关系图模块,用于获取患者数据和医生数据,并将患者数据和医生数据分别作为节点,统计数据的离散分布,根据该离散分布的距离构造边,分别构建形成关系图;
欺诈嫌疑人检测模块,用于利用传播算法迭代分别查找具有欺诈嫌疑的患者以及医生,得到嫌疑患者及嫌疑医生疑似数据;
构建嫌疑人关系图模块,根据欺诈嫌疑人检测模块中得到的嫌疑患者及嫌疑医生疑似数据分别重新构图,并获取与嫌疑患者关联度满足设定条件A的嫌疑医生以及与嫌疑医生关联度满足设定条件B的嫌疑患者,分别构建嫌疑人关系图;
欺诈嫌疑团伙检测模块,根据构建嫌疑人关系图模块中得到的嫌疑人关系图,利用传播算法进一步缩小嫌疑人范围,筛选出嫌疑患者及医生精确数据。
优选地,所述系统,还包括:
检测结果提交模块,用于提交欺诈嫌疑团伙检测模块中得到的嫌疑患者及医生精确数据并输出预警信息。
根据本发明的第三个方面,提供了一种终端,包括存储器、处理器及存储在存储器上并能够在处理器上运行的计算机程序,所述处理器执行所述计算机程序时能够用于执行上述任一项所述的方法。
与现有技术相比,本发明具有如下有益效果:
本发明提供的基于关系图的金融医疗保险诈骗预警方法、装置及终端,利用图计算技术,对金融医疗保险数据中的各类实体分别构图,通过图的节点来表示患者、医生、医院等实体,图中的边则表示相关的服务、药物等,之间涉及多个实体的关系。并应用图计算方法分析医疗保险关系网络的结构,寻找具有共同异常行为的、或在聚合统计数据上有异常联系的社区,以此发现关联度高的欺诈团伙,从而实现高效、快速、灵活的欺诈侦测,满足相关行业的需求。
本发明提供的基于关系图的金融医疗保险诈骗预警方法、装置及终端,相对已知技术,能在更短的时间内,不需人工设定规则,自动高效准确地侦测出金融医疗保险欺诈行为,并发现相应欺诈团伙。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明实施例所提供的基于关系图的金融医疗保险诈骗预警方法的流程图。
具体实施方式
下面对本发明的实施例作详细说明:本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。
本发明实施例提供了一种基于数据关系图的金融医疗保险诈骗预警方法,将图分析应用于保险检测中,包括如下步骤:
步骤1,获取患者数据和医生数据,并将患者数据和医生数据分别作为节点,统计数据的离散分布,根据该离散分布的距离构造边,分别构建形成关系图;
步骤2,利用传播算法迭代分别查找具有欺诈嫌疑的患者以及医生,得到嫌疑患者及嫌疑医生疑似数据;
步骤3,根据步骤2中得到的嫌疑患者及嫌疑医生疑似数据分别重新构图,并获取与嫌疑患者关联度大于设定条件A(该条件可以根据要求进行设置,例如曾提供给嫌疑患者药品总价超过设定价值的医嘱)的嫌疑医生以及与嫌疑医生关联度大于设定条件B(该条件可以根据要求进行设置,例如与嫌疑医生有联系的医嘱数量大于定于设定数量)的嫌疑患者,分别构建嫌疑人关系图;
步骤4,根据步骤3中得到的嫌疑人关系图,利用传播算法进一步缩小嫌疑人范围,筛选出嫌疑患者及医生精确数据。
所述方法还包括:
步骤5,提交步骤4中得到的嫌疑患者及医生精确数据并输出预警信息。
下面结合附图对本发明实施例所提供的技术方案进一步详细描述。
如图1所示,本发明实施例提供的方法,包括如下五个步骤,分别为构建关系图、寻找欺诈嫌疑人、构建嫌疑人关系图、欺诈行为检测和检测结果提交。
其中:构建关系图和构建嫌疑人关系图又各自细分成患者关系图和医生关系图。其作用分别如下:
构建关系图:借由患者的就诊记录和医生的看诊记录,可分别刻画出他们各自的用户画像。基于用户画像来寻找患者之间的相似程度和医生之间的相似程度,并以图的形式表现出来。
欺诈嫌疑人检测:对上一步骤所构建出来的医生关系图和患者关系图分别使用Personalized PageRank算法,来分别推断出可能参与欺诈的医生和患者。
构建嫌疑人关系图:根据上一步骤检测出的嫌疑患者,找出与其相关联的医生,并基于医生的用户画像进行构图;对于上一步检测出的嫌疑医生,则将与其相关联的患者找出,并基于患者的用户画像进行构图。
欺诈嫌疑团伙检测:对上一步骤所构建出来的两幅图分别使用PersonalizedPageRank算法,进一步缩小嫌疑人范围,找出存在欺诈行为的医患。
检测结果提交:检测完毕后,系统将两种方案的检测结果相结合,返回参与医疗欺诈的嫌疑团伙,并提供与其相关的医疗记录。
为了保证可读性,本发明实施例将分别阐述基于患者构图以进行检测和基于医生构图以进行检测两种方案,两种方案的结果将在“检测结果提交”步骤中合并。
1、基于患者构图以进行检测:医保一一对应于患者个体的就医报销资金往来,通过对涉及医保欺诈案例的实际操作分析可知,发生的医保欺诈案例必定涉及到患者ID的参与,往往对应于患者、医患之间、医生和虚假患者实施的欺诈骗保行为,因此,从患者角度入手构图可以覆盖更多欺诈场景的检测。
1.1构建患者关系图:借由诊疗记录,将每一个(患者,就医科室)作为节点,将其在该科室下的接收的所有医嘱作为一个离散分布。若某一个医嘱出现次数小于2,将其剔除。之后,对各个节点的医嘱分布由公式(1)两两计算其Hellinger距离。Hellinger距离越大,则两个分布之间的相似度就越低。若该距离大于某一固定阈值(0.95),则在相应的两个节点之间添加一条边。
其中,P,Q为两个离散分布,P=(p1,…,pk),Q=(q1,…,qk),k为维数。
1.2欺诈嫌疑人检测:遍历1.1中所有出现过的科室,将他们分别作为Personalized PageRank算法的种子,对整个图进行迭代。若算法输出的某节点排名结果大于种子中排名最大结果的90%时,则对该节点添加欺诈嫌疑。
1.3构建嫌疑人关系图:在得到具有欺诈嫌疑标签的节点之后,利用患者节点与医生之间的关联性,来寻找具有欺诈嫌疑的医生。若某医生提供给嫌疑患者单价超过100元的医嘱,则认定该医生具有欺诈嫌疑可能。将所有具有欺诈嫌疑可能的(医生,部门)作为节点,将其在该科室下过的所有医嘱作为一个离散分布。对各个节点两两计算其Hellinger距离。利用Hellinger距离进行重新构图。因为具有较高相关性的医生有着较高属于某一欺诈团伙的可能,因此,若该距离小于某一定值(0.3),则在相应两节点上添加一条边。
1.4欺诈团伙检测:遍历1.3中所有出现过的科室,将他们分别作为PersonalizedPageRank算法的种子,对整个图进行迭代。当某节点的排名结果大于种子节点中最小排名结果时,对该节点添加欺诈嫌疑标签,并将其作为检测结果。
2.基于医生构图以检测欺诈团伙:医生在一个处方会开不同科室的药品,而有些科室的药品极为昂贵,往往一件该药品就有上千的价格。方法1中主要关注的是药品的数量而非药品的价格,难以检测出此类骗保行为。为了弥补此缺陷,本方法在构图的过程中主要考量医生在这个科室下的药品平均每单的总价格。
2.1构建医生关系图:遍历数据中的所有科室,对每个科室分别构图。将在该科室下过医嘱的医生作为节点,将其在该科室下过的每单平均药品总价作为该节点的离散分布。若该节点的医嘱数量小于该科室医嘱数的四分之一分位数,则将其剔除。对所有节点两两计算Hellinger距离,若该距离小于某一固定阈值(0.3),则为这两个节点添加一条边。
2.2欺诈嫌疑人检测:将2.1中构建的图轮流放入随机游走模型,并对其分别做PageRank迭代。若某节点的最终排名在后5%且其包含的平均医嘱总价大于100元时,对该节点添加欺诈嫌疑标签。
2.3构建嫌疑人关系图:在得到具有欺诈嫌疑标签的医生节点之后,可以利用这一结果对患者进行筛选,对筛选后的患者进行重新构图。其中具有较高相关性的患者有着较高属于某一欺诈团伙的可能。遍历每一个科室,利用医生的欺诈嫌疑标签对患者进行筛选,只保留与嫌疑医生具有不小于一个固定阈值医嘱数量(2次)联系的患者。将患者平均每单平均价格作为一个离散分布。当数量小于价格分布的四分之一分位数时,将其剔除。分别计算各节点两两之间的价格分布距离,如果该距离小于一定的阈值(0.3),在相应的两个节点之间添加一条边。
2.4欺诈团伙检测:将2.3中构建的图轮流放入随机游走模型,并对其分别做PageRank迭代。若某节点的最终排名在后5%,对该节点添加欺诈嫌疑标签。
3.检测结果提交:金融医疗保险欺诈侦测系统在接收到来自基于患者构图检测的结果和基于医生构图检测的结果之后,将向使用者展示检测出的嫌疑欺诈团体与其相关信息,以便使用者对其作进一步的分析与确认。
基于本发明上述实施例提供的基于数据关系图的金融医疗保险诈骗预警方法,本发明实施例同时提供了一种用于执行上述方法的金融医疗保险检测系统,包括如下模块:
构建关系图模块,用于获取患者数据和医生数据,并将患者数据和医生数据分别作为节点,统计数据的离散分布,根据该离散分布的距离构造边,分别构建形成关系图;
欺诈嫌疑人检测模块,用于利用传播算法迭代分别查找具有欺诈嫌疑的患者以及医生,得到嫌疑患者及嫌疑医生疑似数据;
构建嫌疑人关系图模块,根据欺诈嫌疑人检测模块中得到的嫌疑患者及嫌疑医生疑似数据分别重新构图,并获取与嫌疑患者关联度大于设定条件A(该条件可以根据要求进行设置,例如曾提供给嫌疑患者药品总价超过设定价值的医嘱)的嫌疑医生以及与嫌疑医生关联度大于设定条件B(该条件可以根据要求进行设置,例如与嫌疑医生有联系的医嘱数量大于定于设定数量)的嫌疑患者,分别构建嫌疑人关系图;
欺诈嫌疑团伙检测模块,根据构建嫌疑人关系图模块中得到的嫌疑人关系图,利用传播算法进一步缩小嫌疑人范围,筛选出嫌疑患者及医生精确数据。
所述装置还包括:
检测结果提交模块,用于提交欺诈嫌疑团伙检测模块中得到的嫌疑患者及医生精确数据并输出预警信息。
基于本发明上述实施例提供的基于数据关系图的金融医疗保险诈骗预警方法,本发明实施例同时提供了一种终端,包括存储器、处理器及存储在存储器上并能够在处理器上运行的计算机程序,所述处理器执行所述计算机程序时能够用于执行实施例中所述的方法。
基于本发明上述实施例提供的基于数据关系图的金融医疗保险诈骗预警方法,本发明实施例同时提供了另一种终端,包括存储器、处理器及存储在存储器上并可通过处理器运行的实施例中所提供的系统。进一步地,所述系统可用于执行实施例中所提供的方法。
本发明上述实施例提供的基于数据关系图的金融医疗保险诈骗预警方法,该方法对医疗实体及实体间的统计相关数据之离散分布进行构图,通过对其关系网络进行分析,利用传播算法迭代寻找欺诈嫌疑人,并重新构图利用用户画像缩小嫌疑人范围,进一步筛选出具有欺诈行为的团伙,以便于相关人员分配资源推进下一步的调查。本发明上述实施例同时提供了一种用于执行上述方法的金融医疗保险检测装置及终端。本发明上述实施例利用图计算技术分析医疗保险关系网络,不需人工设定规则,能够实现更加高效、快速、灵活的欺诈侦测,满足相关行业的需求。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。

Claims (8)

1.一种基于关系图的金融医疗保险诈骗预警方法,其特征在于,包括如下步骤:
S1,获取患者数据和医生数据,并将患者数据和医生数据分别作为节点,统计数据的离散分布,根据该离散分布的距离构造边,分别构建形成初始关系图;
S2,利用传播算法迭代分别查找具有欺诈嫌疑的患者以及医生,得到第一嫌疑患者及第一嫌疑医生疑似数据;其中,所述传播算法采用Personalized PageRank算法,包括:
对于患者初始关系图,遍历其中出现过的所有科室,并将它们分别作为PersonalizedPageRank算法的种子,对整个图进行迭代;若某节点的排名结果大于种子中排名最大结果的90%,则对该节点添加欺诈嫌疑标签;
对于医生初始关系图,遍历其中出现过的所有科室,对每一个科室分别进行PageRank迭代;若某节点的最终排名在后5%且其包含的所有医嘱的平均药品总价大于设定价值时,对该节点添加欺诈嫌疑标签;
S3,根据S2中得到的第一嫌疑患者及第一嫌疑医生疑似数据分别重新构图,并获取与第一嫌疑患者关联度满足设定条件A的第二嫌疑医生以及与第一嫌疑医生关联度满足设定条件B的第二嫌疑患者,分别构建嫌疑人关系图;
S4,根据S3中得到的嫌疑人关系图,利用传播算法进一步缩小嫌疑人范围,筛选出第三嫌疑患者及医生精确数据;
所述S1中,所述患者数据包括:患者及其就医科室和医嘱数据;所述医生数据包括:医生及其所在科室和所开具的每单医嘱中的药品总价数据;
其中:
将每一个患者及其就医科室作为一个节点,并将该患者在该就医科室下所接收的所有医嘱作为该节点的离散分布;
将每一个医生及其所在科室作为一个节点,并将该医生在该科室所开局的每单药品总价作为该节点的离散分布。
2.根据权利要求1所述的基于关系图的金融医疗保险诈骗预警方法,其特征在于,所述S1中,采用Hellinger距离作为离散分布的距离构造边,具体包括如下步骤:
对于患者数据部分,对各个节点的医嘱分布计算两两节点之间的Hellinger距离;若该距离大于固定阈值0.95,则在相应的两个节点之间添加一条边;
对于医生数据部分,对各个节点的药品总价分布计算两两节点之间的Hellinger距离;若该距离小于固定阈值0.3,则在相应的两个节点之间添加一条边;
其中,计算两两节点之间的Hellinger距离的公式为:
式中,P,Q为两个离散分布,P=(p1,…,pk),Q=(q1,…,qk),k为维数。
3.根据权利要求1所述的基于关系图的金融医疗保险诈骗预警方法,其特征在于,所述S3中,将S2中得到的每一个第一嫌疑患者及每一个第一嫌疑医生分别作为一个节点,获取满足设定条件A的第二嫌疑医生,以及满足设定条件B的第二嫌疑患者;其中,所述设定条件A为:提供给第一嫌疑患者的医嘱中药品总价超过设定价值的医生,设定条件B为:与第一嫌疑医生有联系的医嘱数量大于等于设定数值的患者;
依据获取的第二嫌疑医生的医嘱数据及第二嫌疑患者的药品总价数据分别重新构图;
其中:
对于第二嫌疑医生部分,利用各个节点的医嘱分布的Hellinger距离作为两两节点间的距离,若该距离小于固定阈值0.3,则在相应的两个节点之间添加一条边;
对于第二嫌疑患者部分,利用各个节点的每单价格分布的Hellinger距离作为两两节点间的距离,若该距离小于固定阈值0.3,则在相应的两个节点之间添加一条边。
4.根据权利要求1所述的基于关系图的金融医疗保险诈骗预警方法,其特征在于,所述S4中,传播算法采用Personalized PageRank算法,具体包括如下步骤:
对于第二嫌疑医生图,遍历其中出现过的所有科室,将它们分别作为PersonalizedPageRank算法的种子,对整个图进行迭代;若某节点的排名结果大于种子节点中最小排名结果,则对该节点添加欺诈嫌疑标签;
对于第二嫌疑患者图,遍历其中出现过的所有科室,对每一个科室分别进行PageRank迭代;若某节点的最终排名在后5%,则对该节点添加欺诈嫌疑标签。
5.根据权利要求1至4中任一项所述的基于关系图的金融医疗保险诈骗预警方法,其特征在于,还包括如下步骤:
S5,提交S4中得到的第三嫌疑患者及医生精确数据并输出预警信息。
6.一种用于执行权利要求1至5中任一项所述的基于关系图的金融医疗保险诈骗预警方法的金融医疗保险诈骗预警系统,其特征在于,包括如下模块:
构建关系图模块,用于获取患者数据和医生数据,并将患者数据和医生数据分别作为节点,统计数据的离散分布,根据该离散分布的距离构造边,分别构建形成初始关系图;
欺诈嫌疑人检测模块,用于利用传播算法迭代分别查找具有欺诈嫌疑的患者以及医生,得到第一嫌疑患者及第一嫌疑医生疑似数据;其中:所述传播算法采用PersonalizedPageRank算法,包括:
对于患者初始关系图,遍历其中出现过的所有科室,并将它们分别作为PersonalizedPageRank算法的种子,对整个图进行迭代;若某节点的排名结果大于种子中排名最大结果的90%,则对该节点添加欺诈嫌疑标签;
对于医生初始关系图,遍历其中出现过的所有科室,对每一个科室分别进行PageRank迭代;若某节点的最终排名在后5%且其包含的所有医嘱的平均药品总价大于设定价值时,对该节点添加欺诈嫌疑标签;
构建嫌疑人关系图模块,根据欺诈嫌疑人检测模块中得到的第一嫌疑患者及第一嫌疑医生疑似数据分别重新构图,并获取与第一嫌疑患者关联度满足设定条件A的第二嫌疑医生以及与第一嫌疑医生关联度满足设定条件B的第二嫌疑患者,分别构建嫌疑人关系图;
欺诈嫌疑团伙检测模块,根据构建嫌疑人关系图模块中得到的嫌疑人关系图,利用传播算法进一步缩小嫌疑人范围,筛选出第三嫌疑患者及医生精确数据。
7.根据权利要求6所述的金融医疗保险检测系统,其特征在于,还包括:
检测结果提交模块,用于提交欺诈嫌疑团伙检测模块中得到的第三嫌疑患者及医生精确数据并输出预警信息。
8.一种终端,包括存储器、处理器及存储在存储器上并能够在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时能够用于执行权利要求1至5中任一项所述的方法。
CN201911093161.9A 2019-11-11 2019-11-11 基于关系图的金融医疗保险诈骗预警方法、装置及终端 Active CN110827159B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911093161.9A CN110827159B (zh) 2019-11-11 2019-11-11 基于关系图的金融医疗保险诈骗预警方法、装置及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911093161.9A CN110827159B (zh) 2019-11-11 2019-11-11 基于关系图的金融医疗保险诈骗预警方法、装置及终端

Publications (2)

Publication Number Publication Date
CN110827159A CN110827159A (zh) 2020-02-21
CN110827159B true CN110827159B (zh) 2023-11-03

Family

ID=69553766

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911093161.9A Active CN110827159B (zh) 2019-11-11 2019-11-11 基于关系图的金融医疗保险诈骗预警方法、装置及终端

Country Status (1)

Country Link
CN (1) CN110827159B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111415241A (zh) * 2020-02-29 2020-07-14 深圳壹账通智能科技有限公司 欺诈人员识别方法、装置、设备和存储介质
CN111986034B (zh) * 2020-08-14 2022-05-10 江苏云脑数据科技有限公司 医疗保险群体欺诈监测方法、系统及存储介质
CN113282955B (zh) * 2021-06-01 2022-07-08 上海交通大学 隐私政策中隐私信息提取方法、系统、终端及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107403326A (zh) * 2017-08-14 2017-11-28 云数信息科技(深圳)有限公司 一种基于电信数据的保险欺诈识别方法及装置
CN108596770A (zh) * 2017-12-29 2018-09-28 山大地纬软件股份有限公司 基于离群值分析的医疗保险欺诈检测装置及方法
CN109636061A (zh) * 2018-12-25 2019-04-16 深圳市南山区人民医院 医保欺诈预测网络的训练方法、装置、设备及存储介质
CN109919780A (zh) * 2019-01-23 2019-06-21 平安科技(深圳)有限公司 基于图计算技术的理赔反欺诈方法、装置、设备及存储介质
CN110070364A (zh) * 2019-03-27 2019-07-30 北京三快在线科技有限公司 基于图模型检测团伙欺诈的方法和装置、存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107403326A (zh) * 2017-08-14 2017-11-28 云数信息科技(深圳)有限公司 一种基于电信数据的保险欺诈识别方法及装置
CN108596770A (zh) * 2017-12-29 2018-09-28 山大地纬软件股份有限公司 基于离群值分析的医疗保险欺诈检测装置及方法
CN109636061A (zh) * 2018-12-25 2019-04-16 深圳市南山区人民医院 医保欺诈预测网络的训练方法、装置、设备及存储介质
CN109919780A (zh) * 2019-01-23 2019-06-21 平安科技(深圳)有限公司 基于图计算技术的理赔反欺诈方法、装置、设备及存储介质
CN110070364A (zh) * 2019-03-27 2019-07-30 北京三快在线科技有限公司 基于图模型检测团伙欺诈的方法和装置、存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈亚琳 ; 王旭明 ; .基于数据挖掘的医保欺诈预警模型研究.电脑知识与技术.2016,(11),第1-4页. *

Also Published As

Publication number Publication date
CN110827159A (zh) 2020-02-21

Similar Documents

Publication Publication Date Title
Kumar et al. Blockchain-federated-learning and deep learning models for covid-19 detection using ct imaging
Ekin et al. Statistical medical fraud assessment: exposition to an emerging field
CN110827159B (zh) 基于关系图的金融医疗保险诈骗预警方法、装置及终端
US10546099B2 (en) Method of personalizing, individualizing, and automating the management of healthcare fraud-waste-abuse to unique individual healthcare providers
Waghade et al. A comprehensive study of healthcare fraud detection based on machine learning
US20140257846A1 (en) Identifying potential audit targets in fraud and abuse investigations
Sunitha et al. A comparative analysis of deep neural network architectures for the dynamic diagnosis of COVID‐19 based on acoustic cough features
CN112991079B (zh) 多卡共现就医欺诈行为检测方法、系统、云端及介质
CN109919780B (zh) 基于图计算技术的理赔反欺诈方法、装置、设备及存储介质
CN113808738B (zh) 一种基于自识别影像的疾病识别系统
Kalaivani et al. A three-stage ensemble boosted convolutional neural network for classification and analysis of COVID-19 chest x-ray images
CN114783580B (zh) 一种医疗数据质量评估方法及系统
Umemoto et al. A prescription trend analysis using medical insurance claim big data
CN113948168A (zh) 医疗数据评价实际应用系统及医疗数据评价实际应用方法
Corberán-Vallet Prospective surveillance of multivariate spatial disease data
CN113470775B (zh) 信息采集方法、装置、设备及存储介质
Rehman Khan et al. Cloud‐Based Framework for COVID‐19 Detection through Feature Fusion with Bootstrap Aggregated Extreme Learning Machine
Krivoruchko et al. Statistical tools for regional data analysis using GIS
US20160259896A1 (en) Segmented temporal analysis model used in fraud, waste, and abuse detection
US20150339602A1 (en) System and method for modeling health care costs
CN114360732B (zh) 医疗数据分析方法、装置、电子设备及存储介质
Margret et al. Implementation of Data mining in Medical fraud Detection
CN114550930A (zh) 疾病预测方法、装置、设备及存储介质
CN111986034B (zh) 医疗保险群体欺诈监测方法、系统及存储介质
CN115359897A (zh) 非接触式测量下基于多重注意力机制的患者识别方法及其系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant