CN109903169A - 基于图计算技术的理赔反欺诈方法、装置、设备及存储介质 - Google Patents

基于图计算技术的理赔反欺诈方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN109903169A
CN109903169A CN201910065014.4A CN201910065014A CN109903169A CN 109903169 A CN109903169 A CN 109903169A CN 201910065014 A CN201910065014 A CN 201910065014A CN 109903169 A CN109903169 A CN 109903169A
Authority
CN
China
Prior art keywords
doctor
node
patient
subgraph
advice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910065014.4A
Other languages
English (en)
Other versions
CN109903169B (zh
Inventor
王健宗
黄章成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910065014.4A priority Critical patent/CN109903169B/zh
Publication of CN109903169A publication Critical patent/CN109903169A/zh
Application granted granted Critical
Publication of CN109903169B publication Critical patent/CN109903169B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本申请涉及数据处理领域,具体使用了图计算技术实现理赔反欺诈以找出骗保行为,并公开了一种基于图计算技术的理赔反欺诈方法、装置、设备及存储介质,所述方法包括:根据医疗数据采用生成医生患者子图、医生医嘱子图以及融合大图;根据所述融合大图对所述医生患者子图进行投影以生成医生关系网络;并利用该医生关系网络构建影响力度量模型,通过影响力度量模型确定骗保行为。进而找出具有高嫌疑的骗保医生,为快速甄别骗保诈骗提供了重要的参考。

Description

基于图计算技术的理赔反欺诈方法、装置、设备及存储介质
技术领域
本申请涉及互联网金融领域,尤其涉及一种基于图计算技术的理赔反欺诈方法、装置、设备及存储介质。
背景技术
目前,金融社保领域的数据量庞大且数据复杂性很高。相对于传统数据库技术,图计算技术能更加高效地挖掘数据之间的关联价值。在图数据中,一般用节点(Vertex)代表实体对象,用边(Edge)代表实体对象之间的联系,根据不同的应用场景构建不同类型的图数据,这种图数据能够构建复杂的现实网络和模型,并完整映射现实问题。为了更好的维护金融社保安全,保障金融体系,打击骗保等违法犯罪行为,尤其是医生骗保行为。然而,现有确定骗保行为均需要人工进行调查,人工调查很难快速准确地确定骗保行为,同时又费时费力。因此,有必要提供一种基于图计算技术的理赔反欺诈方法,以甄别患者团体骗保行为。
发明内容
本申请提供了一种基于图计算技术的理赔反欺诈方法、装置、设备及存储介质,为甄别骗保欺诈提供了重要参考。
第一方面,本申请提供了一种基于图计算技术的理赔反欺诈方法,所述方法包括:
基于图计算技术,根据医疗数据生成医生患者子图和医生医嘱子图以及根据所述医生患者子图和医生医嘱子图生成融合大图;
根据所述融合大图,对所述医生患者子图进行投影以生成医生关系网络;
确定所述医生关系网络中每个节点的邻居节点,计算所述邻居节点对所述节点的影响力度量;
根据每个所述节点的影响力度量,建立影响力度量模型;
根据所述影响力度量模型确定种子节点集合,其中所述种子节点集合包括传播范围最广的K个种子节点,K为正整数;
根据传播范围最广的K个种子节点确定骗保行为。
第二方面,本申请还提供了一种基于图计算技术的理赔反欺诈装置,所述装置包括:
图生成单元,用于基于图计算技术,根据医疗数据生成医生患者子图和医生医嘱子图以及根据所述医生患者子图和医生医嘱子图生成融合大图;
网络生成单元,用于根据所述融合大图,对所述医生患者子图进行投影以生成医生关系网络;
影响计算单元,用于确定所述医生关系网络中每个节点的邻居节点,计算所述邻居节点对所述节点的影响力度量;
模型建立单元,用于根据每个所述节点的影响力度量,建立影响力度量模型;
节点确定单元,用于根据所述影响力度量模型确定种子节点集合,其中所述种子节点集合包括传播范围最广的K个种子节点,K为正整数;
骗保确定单元,用于根据传播范围最广的K个种子节点确定骗保行为。
第三方面,本申请还提供了一种计算机设备,所述计算机设备包括存储器和处理器;所述存储器用于存储计算机程序;所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如上述的理赔反欺诈方法。
第四方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如上述的理赔反欺诈方法。
本申请公开了一种基于图计算技术的理赔反欺诈方法、装置、设备及存储介质,通过根据医疗数据采用生成医生患者子图、医生医嘱子图以及融合大图;根据所述融合大图对所述医生患者子图进行投影以生成医生关系网络;并利用该医生关系网络构建影响力度量模型,通过影响力度量模型确定骗保行为。进而找出具有高嫌疑的骗保医生,为快速甄别骗保诈骗提供了重要的参考。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的基于图计算技术建立图数据的步骤示意流程图;
图2是本申请实施例提供的医生患者子图的结构示意图;
图3是本申请实施例提供的医生医嘱子图的结构示意图;
图4a是本申请实施例提供的子图融合成大图的原理示意图;
图4b是本申请实施例提供的融合大图的结构示意图;
图5是本申请实施例提供的一种基于图计算技术的理赔反欺诈方法的示意流程图;
图6是图5中提供的理赔反欺诈方法的子步骤示意流程图;
图7是本申请实施例提供的患者关系网的示意图;
图8是图5中提供的理赔反欺诈方法的子步骤示意流程图;
图9是本申请实施例提供的医生聚类的结果示意图;
图10是本申请实施例提供的聚类后的患者关系网络的示意图;
图11是本申请实施例提供的更新权值后的患者关系网络的示意图;
图12是本申请实施例提供的另一种基于图计算技术的理赔反欺诈方法的示意流程图;
图13是图12中提供的理赔反欺诈方法的子步骤示意流程图;
图14是本申请实施例提供的医生关系网络的结构示意图;
图15是图12中提供的理赔反欺诈方法的子步骤示意流程图;
图16为本申请实施例提供的一种基于图计算技术的理赔反欺诈装置的示意性框图;
图17为本申请实施例提供的另一种基于图计算技术的理赔反欺诈装置的示意性框图;
图18为本申请一实施例提供的一种计算机设备的结构示意性框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
本申请的实施例提供了一种基于图计算技术的理赔反欺诈方法、装置、计算机设备及存储介质。基于图计算技术的理赔反欺诈方法可用于针对患者和/或医生的骗保行为,为快速找出患者或医生骗保提供了重要的参考。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
请参阅图1,图1是本申请的实施例提供的基于图计算技术建立图数据的步骤示意流程图。该图数据建立方法是利用图计算技术,将存储在传统数据库中的结构化数据剥离出实体和联系,映射成节点和边,进而转变成图数据,并将图数据存储在网络中。其中,传统数据库比如为结构化查询语言(Structured Query Language、SQL)数据库。
如图1所示,该基于图计算技术建立图数据的步骤,用于根据医疗数据创建医疗图数据,以便基于该医疗图数据实现理赔反欺诈。其中,该基于图计算技术建立图数据的步骤,具体包括以下内容:
S101、获取医疗数据并对所述医疗数据进行分类得到分类数据。
在本实施例中,所述分类数据包括患者基本信息、医生基本信息和医嘱信息。当然,也可以包括其他类型信息。
具体地,患者基本信息、医生基本信息和医嘱信息均是以表的形式进行统计呈现,即为患者基本信息表、医生基本信息表和医嘱信息表。
其中,患者基本信息表包括患者编号、性别、年龄和医保卡号等信息;医生基本信息表包括医生编号和所在科室号等信息;医嘱信息表包括医嘱项、医嘱单价和医嘱子类等信息。具体地,如表1、表2和表3所示。
表1为患者基本信息表
在表1中,ID1栏中,是患者的唯一标识,可以用阿拉伯数字表示,也可以其他字母表示;患者编号栏中,患者编号用一串数字进行表示,也可用于标识患者;性别栏中,1代表男性,2代表女性;否死亡栏中,0代表未死亡,1代表死亡;医保卡号栏中,1代表缺失医保卡,其余为正常,用于表示医保卡号。
表2为医生基本信息表
ID2 医生编号 科室
1 1001 201
2 1002 201
3 1003 202
4 1004 203
5
在表2中,ID2栏中,是医生的唯一标识,可以用阿拉伯数字表示,也可以其他字母表示;医生编号栏中,医生编号用一串数字进行表示,也可用于标识患者;科室栏中,科室编号表示医生属于具体哪个科室。
表3为医嘱信息表
ID3 医嘱项 单价 医嘱子类
1 18275||1 0.77 6
2 10292||1 1.6 6
3 19022||1 2.6 1
4 12733||1 6.6 2
5
在表3中,ID3栏中,是医嘱的唯一标识,可以用阿拉伯数字表示,也可以其他字母表示;医嘱项栏中,用于一串编码数字表示,代表不同的医嘱项内容;单价栏中,表示看病所需金额,单位为元;医嘱子类栏中,表示医嘱信息的类别。
需要说明的是,上述表中的患者编号、医生编码、科室或者医嘱项,根据不同的医院或医疗机构,其对应的编号表示方式可能不同。
S102、根据所述分类数据的关联关系生成分类关系表。
其中,从患者基本信息、医生基本信息和医嘱信息提取关联信息生成关联关系,所述关联关系为所述分类数据的联系;根据所述分类数据的关联关系生成分类关系表,其中所述分类关系表包括患者医生关系表和医生医嘱关系表。
其中,关联关系是指分类数据之间的联系,比如,患者去找医生看病形成的患者医生关联关系,医生给患者看病开的医嘱信息进而生成医生医嘱关联关系。再比如,两个不同的患者去过同一家医院,或者看过同一个医生;或者,两个不同的医生,给同一个病人看过病。这些联系都是关联关系。
具体地,从患者基本信息、医生基本信息和医嘱信息提取关联信息,该关联信息用表的形式进行表示,即分类关系表。在本实施例中,该分类关系表主要包括:患者医生关系表和医生医嘱关系表。
患者医生关系表如表4所示,具体包括:看病时间、费别和账单号;医生医嘱关系表如表5所示,具体包括:下医嘱时间、开医嘱数量和账单号。
表4为患者医生关系表
ID1 ID2 看病日期 费别 账单号
1 4 2014-1-1 3 541212
2 1 2014-1-1 2 541243
3 1 2014-1-2 2 541266
4 2 2014-1-3 1 541276
5
在表4中,ID1栏中,表示患者标识;ID2栏中,表示医生标识;看病日期栏中,表示患者看病日期时间;费别栏中,1代表患者自费就诊,2、3均是医保卡报销;账单号栏,通过用账单号表示不同患者的账单。
表5为医生医嘱关系表
ID2 ID3 下医嘱时间 数量 账单号
1 3 7:59:45 32 543211
2 1 7:59:45 12 546533
4 2 7:59:55 9 541433
4 6 7:56:44 33 541565
5
在表5中,ID2栏中,表示医生标识;ID3栏中,表示医嘱;下医嘱时间栏中,表示医生给患者下医嘱的日期时间;数量中,具体数字表示医嘱数量;账单号栏,通过用账单号表示不同患者的账单。
S103、基于图计算技术,根据所述分类关系表生成二分图。
其中,所述二分图包括医生患者子图和医生医嘱子图。具体地,基于图计算技术,根据所述患者医生关系表生成医生患者子图以及根据医生医嘱关系表生成医生医嘱子图。
医生患者子图如图2所示,以患者和医生为节点,具体可以使用患者ID1和医生ID2进行标识,医生所在科室号作为节点的属性,患者的其他信息为属性,比如看病时间、费别等信息作为边属性。
医生医嘱子图如图3所示,以医生和医嘱为节点,具体可以使用医生ID2和医嘱ID3进行标识,医生所在科室号作为节点的属性,医嘱的其他信息为属性,比如下医嘱时间、开医嘱数量等信息作为边属性。
S104、基于图计算技术中的模型融合技术,将所述医生患者子图和医生医嘱子图融合生成融合大图。
具体地,如图4a和图4b所示,图4a和图4b展示了图计算技术中的模型融合技术的原理。在图4a中寻找两张子图(医生患者子图和医生医嘱子图)中的共同节点,比如图4a中虚线框中的两个相同的医生节点,即医生节点2和医生节点3,保留与该医生节点有联系的其他节点,即患者节点1、患者节点3、患者节点4、医嘱节点1和医嘱节点2,进行子图联通得到融合大图。其中,融合大图如图4b所示,由此根据模型融合技术将医生患者子图和医生医嘱子图融合完成的大图。
需要说明的是,上述图2、图3和图4b并不构成医生患者子图、医生医嘱子图和融合大图的形式限定,医生患者子图、医生医嘱子图和融合大图节点的数量以及节点之间的联系(边)也根据实际情况而定。
上述实施例利用图计算技术创建医疗图数据,具体将存储在传统数据库中的结构化数据剥离出实体和联系,映射成节点和边,进而转变成图数据,并存储在网络中,以便基于该医疗图数据实现理赔反欺诈方法。
请参阅图5,图5是本申请实施例提供的一种基于图计算技术的理赔反欺诈方法的示意流程图。该理赔反欺诈方法针对患者,通过理赔反欺诈方法甄别患者骗保,尤其是患者集体骗保行为,由此打击骗保等违法犯罪行为,更好地维护金融安全。
如图5所示,该基于图计算技术的理赔反欺诈方法,具体包括:步骤S201至步骤S205。
S201、基于图计算技术,根据医疗数据生成医生患者子图和医生医嘱子图以及根据所述医生患者子图和医生医嘱子图生成融合大图。
具体地,基于图计算技术,根据所述患者医生关系表生成医生患者子图以及根据医生医嘱关系表生成医生医嘱子图;以及,基于图计算技术中的模型融合技术,将所述医生患者子图和医生医嘱子图融合生成融合大图。
S202、根据所述融合大图,对所述医生患者子图进行投影以生成患者关系网络。
其中,所述患者关系网络包括多个社区封闭环,该社区封闭环表示不同的社区,不同的社区中包括多个患者和医生。
在一个实施例中,如图6所示,根据所述融合大图对所述医生患者子图进行投影以生成患者关系网络,具体包括子步骤S202a和S202b。
S202a、根据所述融合大图确定患者之间具有的相似就医行为。
其中,相似就医行为是指在医生的患者社区内的多个患者是否访问过同一个医生,如果多个患者访问过同一个医生,即表示多个患者之间具有的相似就医行为。
例如,如图4b所示,根据融合大图确定患者之间具有的相似就医行为,具体地,患者1与患者3均找过医生2看病,患者1及患者4均找过医生3,因此患者1与患者3以及患者4均具有相似就医行为;而患者3与患者4之间没有找过相同的医生看病,因此没有相似就医行为。
S202b、根据所述患者之间具有的相似就医行为,对所述医生患者子图进行投影以生成患者关系网络。
具体地,根据所述患者之间具有的相似就医行为,可以统计两个患者看过同一个医生对应的就医次数。比如,在图2中的医生患者子图,患者2和患者4均找过医生1和医生2,因此患者2和患者4的就医次数为2次;患者3和患者7均找过医生4,因此患者3和患者7的就医次数为1次。
由此,可根据图计算技术对所述医生患者子图进行投影以生成患者关系网络。投影生成的患者关系网络如图7所示,图7中包括七个节点分别为:患者1、患者2、患者3、患者4、患者5、患者6和患者7;患者节点之间的连线代表患者之间具有相似的就医行为;连线上的数字表示权重,该权重代表患者之间访问相同医生的就医次数,比如,患者2和患者4之间访问相同医生的次数为两次。
在一个实施例中,为了提高理赔反欺诈方法的准确度,需要对医生进行聚类处理,以改善患者关系网络。基于此,如图8所示,步骤S202b包括子步骤S202b1至S202b3。
S202b1、根据所述患者之间具有的相似就医行为,对所述医生患者子图进行投影以得到多个患者关系网;S202b2、对所述患者关系网中涉及的医生进行聚类得到医生聚类关系;S202b3、根据所述医生聚类关系,将多个所述患者关系网连接以生成患者关系网络。
根据所述患者之间具有的相似就医行为,对所述医生患者子图进行投影以得到多个患者关系网。比如,如图7所示,该图中包括两个患者关系网,分别为患者1、患者2、患者4和患者6组成患者关系网以及患者3、患者5和患者7组成患者关系网。
对所述患者关系网中涉及的医生进行聚类得到医生聚类关系,是需考虑医生所属科室,因为医生与科室是多对一的映射关系,根据科室情况将医生聚类,医生聚类的结果如图9所示。比如,医生4、医生5、医生8和医生9属于同一个科室;医生2、医生3和医生7属于另外一个科室,具体属于哪个科室既是得到的医生聚类关系。
需要说明的是,图9中的医生聚类包括10个医生,因此并不是针对图7中的医生进行聚类,图9只是对医生聚类进行说明。针对图7中医生进行聚类可以参考上述聚类方式。
根据所述医生聚类关系,将多个所述患者关系网连接以生成最终的患者关系网络,最终的患者关系网络如图10或图11所示,最终的患者关系网络中包括多个社区封闭环,该社区封闭环为强联通结构(即多个顶点构成一个封闭环结构,且环内的任意两个节点之间存在边,如10所示,包括三个封闭环结构,分别为1-2-4环、2-3-4-5-6环和3-5-7环),不同的封闭环结构代表不同的社区,社区中的“居民”都看过同一个医生(或同一类医生),即拥有相似的就医行为。
S203、根据所述患者关系网络中任意两个节点对应的患者的属性参数,计算所述患者关系网络中任意两个节点之间的相似度。
其中,患者关系网络中任意两个节点对应的患者的属性参数包括特征属性和就医行为属性。特征属性包括患者的年龄;就医行为属性包括患者的医嘱数量和看病费用。
在一个可选的实施例中,特征属性和就医行为属性还可包括其他参数,比如患者的性别,医嘱的类别等等。
具体地,基于相似度计算公式,根据所述患者关系网络中任意两个节点对应的患者的特征属性和就医行为属性,计算所述患者关系网络中任意两个节点之间的相似度。
其中,所述相似度计算公式为:
在公式(1)中,sim<A,B>为相似度,其中该相似度为余弦相似度,A和B为患者,A1为患者A的年龄;A2为患者A的医嘱数量,A3为患者A的看病费用;B1为患者B的年龄;B2为患者B的医嘱数量,B3为患者B的看病费用。
由此,可以基于公式1,根据所述患者关系网络中任意两个节点对应的患者的特征属性和就医行为属性,计算所述患者关系网络中任意两个节点之间的相似度。
S204、根据所述相似度计算每个所述社区封闭环对应的平均相似度。
具体地,基于平均相似度计算公式,根据所述相似度计算每个所述社区封闭环对应的平均相似度。
其中,所述平均相似度计算公式为:
在公式2中,φ(P)为社区封闭环对应的平均相似度,P为社区:N为P社区路径数,N为正整数;w为路径(边)上的权重值。
在一个实施例中,为了计算的方便,可在计算每个所述社区封闭环对应的平均相似度之前,还根据所述相似度更新所述患者关系网络中每条边对应的权重值。
具体地,采用公式1计算每个社区内任意两个患者之间的相似度计算公式,根据该计算公式1计算图10中每个社区内任意两个患者之间的相似度,并根据计算的相似度更新图10患者关系网络中任意两个患者之间权重值,得到权重更新后的患者关系网络,具体如图11所示。
相应地,步骤S204具体为:基于平均相似度计算公式,根据患者关系网络中更新后的权重值计算每个所述社区封闭环对应的平均相似度。当然,也是采用公式2进行平均相似度计算。在权重更新后的患者关系网络中,可以定量计算不同的社区的平均相似度,即社区行为一致性。
例如,社区3-5-7,根据公式2,可以计算该社区对应的平均相似度为即社区3-5-7的平均相似度为0.72,同理可以分别求出其他社区的平均相似度,并按照平均相似度的大小进行排序,具体如表6所示。
表6为不同社区的平均相似度排名表
社区名称 平均相似度φ
3-5-7 0.72
2-3-4-5-6 0.41
1-2-4 0.37
S205、根据所述平均相似度确定骗保行为。
具体地,根据平均相似度对所有社区的进行排序,按照排序大小方便找出具有高嫌疑的骗保团体,为进一步甄别欺诈提供了重要参考。患者团伙欺诈往往具有行为高度一致性的典型特点。基于社区聚类的嫌疑团伙挖掘,主要依据患者就医行为划分不同的社区,利用社区内患者之间的就医行为的相似度计算该社区的平均相似度,由此可以根据平均相似度以衡量社区的整体行为的一致性,以快速确认是否为骗保行为。
上述实施例提供的基于图计算技术的理赔反欺诈方法,通过根据医疗数据采用生成医生患者子图、医生医嘱子图以及融合大图;根据所述融合大图对所述医生患者子图进行投影以生成患者关系网络,所述患者关系网络包括多个社区封闭环;计算所述患者关系网络中任意两个节点之间的相似度以及每个所述社区封闭环对应的平均相似度;以及根据所述平均相似度确定骗保行为。进而找出具有高嫌疑的骗保患者团体,为快速甄别骗保诈骗提供了重要的参考。
请参阅图12,图12是本申请实施例提供的另一种基于图计算技术的理赔反欺诈方法的步骤示意流程图。该理赔反欺诈方法针对医生,通过理赔反欺诈方法甄别医生骗保,由此打击骗保等违法犯罪行为,更好地维护金融安全。
如图12所示,该基于图计算技术的理赔反欺诈方法,具体包括:步骤S301至步骤S306。
S301、基于图计算技术,根据医疗数据生成医生患者子图和医生医嘱子图以及根据所述医生患者子图和医生医嘱子图生成融合大图。
具体地,基于图计算技术,根据所述患者医生关系表生成医生患者子图以及根据医生医嘱关系表生成医生医嘱子图;以及,基于图计算技术中的模型融合技术,将所述医生患者子图和医生医嘱子图融合生成融合大图。
S302、根据所述融合大图,对所述医生患者子图进行投影以生成医生关系网络。
其中,除了患者可能骗保以外,医生同样有可能利用自己的影响力进行骗保,主要表现形式有患者访问量大、开医嘱数量大和开药金额大等。医生影响力关键因素包括:医生所接待病人数量、医生开医嘱数量和金额。
医生所接待病人数量,一个医生在一段时间内所接待的患者越多,说明该医生在专业领域越有影响力。医生开医嘱数量和金额,开医嘱数量和金额可以定量化一名医生的工作量,侧面反应了该医生的影响力。因此,可以通过医生关系网络,来计算医生的影响力,进而甄别是否有骗保行为。
具体地,如图13所示,根据所述融合大图对所述医生患者子图进行投影以生成患者关系网络,包括子步骤S302a和S302b。
S302a、根据所述融合大图确定医生之间具有的相似诊治行为;S302b、根据所述患者之间具有的相似诊治行为,对所述医生患者子图进行投影以生成医生关系网络。
其中,相似诊治行为是指两个医生接诊过同一个患者,当然也可以为其他行为,比如看过同一家庭的患者,或者同一社区内的患者。根据所述患者之间具有的相似诊治行为,利用图计算技术对所述医生患者子图进行投影以生成医生关系网络,生成的医生关系网络,如图14所示,比如,医生4和医生3接诊过同一个患者。
其中,根据医生关系网络生成医生网络模型,该医生网络模型表示为G=<V,E>,V表示医生节点集合,E表示两个医生接待过同一个病人形成的边。具体,具体如14所示的医生关系网络。
S303、确定所述医生关系网络中每个节点的邻居节点,计算所述邻居节点对所述节点的影响力度量。
具体地,如图15所示,所述确定所述医生关系网络中每个节点的邻居节点,计算所述邻居节点对所述节点的影响力度量,包括:子步骤S303a至S303d。
S303a、根据节点之间的边确定所述医生关系网络中每个节点的邻居节点。
例如,在图14中,节点4与节点1、节点2、节点3和节点6之间存在边,因此可以确定节点4包括四个邻居节点;同理可以确定:节点1包括两个邻居节点、节点2包括三个邻居节点、节点3包括三个邻居节点、节点5包括两个邻居节点、节点6包括两个邻居节点以及节点7包括两个邻居节点。
S303b、计算所述邻居节点在接待患者数量、开医嘱数据和开医嘱金额对所述节点的影响程度。
具体地,通过影响程度计算公式,计算所述邻居节点在接待患者数量、开医嘱数据和开医嘱金额对所述节点的影响程度。其中,影响程度计算公式包括三个公式,分别表示为:
其中,Acc(i,j)为节点j在接待患者数量上对节点i的影响程度,节点j为节点i的邻居节点;Amo(i,j)为节点j在开医嘱数量上对节点i的影响程度;Fin(i,j)为节点j在开医嘱金额上对节点i的影响程度。|Tj|表示节点j接待患者数量的总数,∑a∈A(i)|Ta|表示节点i的邻居节点所接待患者数量之和;|Zj|表示节点j开医嘱数量的总数,∑a∈A(i)|Za|表示节点i的邻居节点所开医嘱数量之和;|Mj|表示医生j开医嘱金额的总数,∑a∈A(i)|Ma|表示节点i的邻居节点所开医嘱金额之和。
S303c、根据所述影响程度计算所述邻居节点对所述节点的影响率。
其中,定义节点i的邻居节点:A(i)={j|(i,j)},为了衡量邻居节点j对节点i的影响能力,影响能力具体用影响率表示。
具体地,根据所述影响程度计算所述邻居节点对所述节点的影响率,包括:基于所述影响率计算公式,根据所述影响程度计算所述邻居节点对所述节点的影响率。
所述影响率计算公式为:
I(i,j)=Acc(i,j)*Amo(i,j)*Fin(i,j) (6)
在公式6中,I(i,j)为影响率,Acc(i,j)为节点j在接待患者数量上对节点i的影响程度,Amo(i,j)为节点j在开医嘱数量上对节点i的影响程度,Fin(i,j)为节点j在开医嘱金额上对节点i的影响程度。
S303d、根据所述影响率计算所述邻居节点对所述节点的影响力度量。
具体地,所述根据所述影响率计算所述邻居节点对所述节点的影响力度量,包括:基于影响力度量计算公式,根据所述影响率通过迭代计算所述邻居节点对所述节点的影响力度量。
其中,所述影响力度量计算公式为:
DIR(i)=d+(1-d)∑j∈N(i)[Sij*DIR(j)] (6)
其中,DIR(i)是节点i的影响力度量;N(i)是节点i的邻居节点集合;Sij是节点i的影响力分配给节点j的比例因子,为节点j在所有影响节点i的邻居节点中所占的比重;d是阻尼系数,具体为常量;∑a∈A(i)I(i,a)为节点i的邻居节点的影响率之和,a为正整数,表示节点i的所有邻居节点。
在本实施例中,将阻尼系数d设置为0.85,所有节点DIR值初始化为0.1,经过迭代可以得到全部医生节点的DIR值。
S304、根据每个所述节点的影响力度量,建立影响力度量模型。
具体地,根据每个所述节点的影响力度量建立影响力度量模型,包括:根据每个所述节点的影响力度量计算所述医生关系网络中每条边的影响力权值;根据计算的影响力权值构建线性阈值模型,所述线性阈值模型用于确定激活节点。
其中,影响力最大化问题定义为如何选择K个初始节点使得最终的传播影响范围最大化,通过计算医生的影响力度量(DIR值)可以得到医生的影响力排名,如果直接选择DIR值靠前的K个节点作为初始节点,并不能保证最终的影响范围最大化,因为由于某些科室比较热门,会导致K个节点有很大可能聚集在同一个簇内,忽略了网络结构中的弱连接节点。因此DIR值排序更容易将热门科室的医生排序到前几位,并不能影响范围最大化。
在本实施例中,为了准确地确定影响范围最大化的K个节点,建立影响力传播模型,具体为线性阈值模型。当然,也可以建立其他模型,比如,建立独立级联模型。
在医生关系网络中,高影响力的医生会对邻居医生造成影响,但这种影响的传播依赖于邻居医生节点是否被激活。通过计算的影响力权值构建线性阈值模型预测影响传播情况。
具体地,给定一个医生网络模型G=<V,E>,定义N(v)为节点v的邻居节点集合。被激活的节点u对邻居节点v存在影响为buv,该buv为影响力权值,其中一个节点v的所有邻居节点对v的影响力总和不大于1。定义A(v)为节点v的邻居节点中已激活的节点集合。为每一个节点v预先设置一个阈值θv,该θv为经验值,具体根据实际经验进行设定。如果影响力权值buv大于阈值θv,则表示节点v被激活。
其中,线性阈值模型中的buv体现了激活节点u对邻居节点v产生的影响力,即影响力权值。影响力权值的计算公式为:
在公式8中,DIR(u)表示节点u的影响力度量;N(v)表示节点v的邻居节点集合;buv为影响力权值,体现了节点u的影响力在集合N(v)中所占的比重大小;节点v被激活的概率取决于N(v)中已激活节点的影响力大小,影响力越大,v被激活的概率越大。
S305、根据所述影响力度量模型确定种子节点集合。
其中,所述种子节点集合包括传播范围最广的K个种子节点,K为正整数,传播范围最广K个种子节点,是指K个种子节点的传播影响范围最大化,相比于其他节点传播范围较广。
具体地,根据所述影响力度量模型确定种子节点集合,包括:基于贪心算法,根据所述影响力度量模型每一步选取传播影响范围增量最大的节点进行循环计算,以得到种子节点集合。
运用贪心算法可以实现对医生关系网络的影响力最大化算法,确定传播方位最广的K个种子节点。其中,该算法的核心步骤为:根据构建的线性阈值模型;利用贪心计算,每一步都选取传播影响范围增量最大的节点进行循环计算,最终挖掘出种子节点集合。
例如,定义医生网络G=<V,E>,S是包含K个节点的种子集合,Sv为v一次扩散得到的传播范围,IS{S}是种子集S最终影响范围。
利用贪心计算,最终挖掘出种子节点集合的伪代码为:
输入:医生网络G=<V,E>
输出:K个种子节点
通过选取传播影响范围增量最大的节点进行循环计算,最终反馈种子节点集合,该种子节点集合包括传播范围最广的K个种子节点。
S306、根据传播范围最广的K个种子节点确定骗保行为。
其中,在医保欺诈案例中,不乏有部分医生参与骗保,从医生影响力传播的角度对医生关系网络进行建模,进而找出具有较高影响力且在网络中传播范围最广的K个种子节点,这些K个种子节点对应的医生,其行为可能为骗保行为,因此这些医生有可能为骗保医生,由此为甄别医生欺诈提供了重要参考。
上述实施例提供的基于图计算技术的理赔反欺诈方法通过根据医疗数据采用生成医生患者子图、医生医嘱子图以及融合大图;根据所述融合大图对所述医生患者子图进行投影以生成医生关系网络;并利用该医生关系网络构建影响力度量模型,通过影响力度量模型确定骗保行为。进而找出具有高嫌疑的骗保医生,为快速甄别骗保诈骗提供了重要的参考。
需要说明的是,图5和图12提供的理赔反欺诈方法,可以单独使用以甄别患者或医生的骗保行为;当然也可一起使用以甄别患者和医生的骗保行为,由此打击骗保等违法犯罪行为,更好地维护金融安全。
譬如,本申请的实施例还提供又一种基于图计算技术的理赔反欺诈方法,该方法包括以下步骤:
基于图计算技术,根据医疗数据生成医生患者子图和医生医嘱子图以及根据所述医生患者子图和医生医嘱子图生成融合大图;根据所述融合大图,对所述医生患者子图进行投影以生成患者关系网络和医生关系网络,其中所述患者关系网络包括多个社区封闭环;根据所述患者关系网络中任意两个节点对应的患者的属性参数,计算所述患者关系网络中任意两个节点之间的相似度;根据所述相似度计算每个所述社区封闭环对应的平均相似度;以及确定所述医生关系网络中每个节点的邻居节点,计算所述邻居节点对所述节点的影响力度量;根据每个所述节点的影响力度量,建立影响力度量模型;根据所述影响力度量模型确定种子节点集合,所述种子节点集合包括传播范围最广的K个种子节点,K为正整数;根据所述平均相似度和/或传播范围最广的K个种子节点确定骗保行为。
请参阅图16,图16是本申请的实施例还提供一种基于图计算技术的理赔反欺诈装置的示意性框图,该理赔反欺诈装置用于执行前述的基于图计算技术的理赔反欺诈方法。其中,该理赔反欺诈装置可以配置于服务器或终端中。
其中,服务器可以为独立的服务器,也可以为服务器集群。该终端可以是手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等电子设备。
如图16所示,理赔反欺诈装置400包括:图生成单元401、网络生成单元402、第一计算单元403、第二计算单元404和骗保确定单元405。
图生成单元401,用于基于图计算技术,根据医疗数据生成医生患者子图和医生医嘱子图以及根据所述医生患者子图和医生医嘱子图生成融合大图。
其中,图生成单元401包括获取分类子单元4011、关系表生成子单元4012、二分图生成子单元4013和大图生成子单元4014。
具体地,获取分类子单元4011,用于获取医疗数据并对所述医疗数据进行分类得到分类数据;关系表生成子单元4012,根据所述分类数据的关联关系生成分类关系表;二分图生成子单元4013,用于基于图计算技术,根据所述分类关系表生成二分图;大图生成子单元4014,用于基于图计算技术中的模型融合技术,将所述医生患者子图和医生医嘱子图融合生成融合大图。
网络生成单元402,用于根据所述融合大图,对所述医生患者子图进行投影以生成患者关系网络,所述患者关系网络包括多个社区封闭环。
其中,网络生成单元402包括行为确定子单元4021和网络生成子单元4022;行为确定子单元4021,用于根据所述融合大图确定患者之间具有的相似就医行为。网络生成子单元4022,用于根据所述患者之间具有的相似就医行为,对所述医生患者子图进行投影以生成患者关系网络。
在一个实施例中,网络生成子单元4022,具体用于:根据所述患者之间具有的相似就医行为,对所述医生患者子图进行投影以得到多个患者关系网;对所述患者关系网中涉及的医生进行聚类得到医生聚类关系;根据所述医生聚类关系,将多个所述患者关系网连接以生成患者关系网络。
第一计算单元403,用于根据所述患者关系网络中任意两个节点对应的患者的属性参数,计算所述患者关系网络中任意两个节点之间的相似度。
具体地,第一计算单元403,用于:基于相似度计算公式,根据所述患者关系网络中任意两个节点对应的患者的特征属性和就医行为属性,计算所述患者关系网络中任意两个节点之间的相似度。
在一个实施例中,第一计算单元403,还用于:根据所述相似度更新所述患者关系网络中每条边对应的权重值。
第二计算单元404,用于根据所述相似度计算每个所述社区封闭环对应的平均相似度。
具体地,第二计算单元404,用于:基于平均相似度计算公式,根据所述相似度计算每个所述社区封闭环对应的平均相似度。
相应地,第二计算单元404,用于:基于平均相似度计算公式,根据患者关系网络中更新后的权重值计算每个所述社区封闭环对应的平均相似度。
骗保确定单元405,用于根据所述平均相似度确定骗保行为。
请参阅图17,图17是本申请的实施例还提供另一种基于图计算技术的理赔反欺诈装置的示意性框图,该理赔反欺诈装置用于执行前述的基于图计算技术的理赔反欺诈方法。其中,该理赔反欺诈装置可以配置于服务器中。
如图17所示,该理赔反欺诈装置500包括:图生成单元501、网络生成单元502、影响计算单元503、模型建立单元504、节点确定单元505和骗保确定单元506。
图生成单元501,用于基于图计算技术,根据医疗数据生成医生患者子图和医生医嘱子图以及根据所述医生患者子图和医生医嘱子图生成融合大图。
其中,在一个实施例中,图生成单元501包括获取分类子单元5011、关系表生成子单元5012、二分图生成子单元5013和大图生成子单元5014。
具体地,获取分类子单元5011,用于获取医疗数据并对所述医疗数据进行分类得到分类数据;关系表生成子单元5012,根据所述分类数据的关联关系生成分类关系表;二分图生成子单元5013,用于基于图计算技术,根据所述分类关系表生成二分图;大图生成子单元5014,用于基于图计算技术中的模型融合技术,将所述医生患者子图和医生医嘱子图融合生成融合大图。
网络生成单元502,用于根据所述融合大图,对所述医生患者子图进行投影以生成医生关系网络。
具体地,在一个实施例中,网络生成单元502,具体用于:根据所述融合大图确定医生之间具有的相似诊治行为;根据所述患者之间具有的相似诊治行为,对所述医生患者子图进行投影以生成医生关系网络。
影响计算单元503,用于确定所述医生关系网络中每个节点的邻居节点,计算所述邻居节点对所述节点的影响力度量。
其中,在一个实施例中,影响计算单元503包括:节点确定子单元5031、程度计算子单元5032、影响率计算子单元5033和度量计算子单元5034。
具体地,节点确定子单元5031,用于根据节点之间的边确定所述医生关系网络中每个节点的邻居节点;程度计算子单元5032,用于计算所述邻居节点在接待患者数量、开医嘱数据和开医嘱金额对所述节点的影响程度;影响率计算子单元5033,用于根据所述影响程度计算所述邻居节点对所述节点的影响率;度量计算子单元5034,用于根据所述影响率计算所述邻居节点对所述节点的影响力度量。
模型建立单元504,用于根据每个所述节点的影响力度量,建立影响力度量模型。
具体地,在一个实施例中,模型建立单元504,具体用于:根据每个所述节点的影响力度量计算所述医生关系网络中每条边的影响力权值;根据计算的影响力权值构建线性阈值模型,所述线性阈值模型用于确定激活节点。
节点确定单元505,用于根据所述影响力度量模型确定种子节点集合,其中所述种子节点集合包括传播范围最广的K个种子节点,K为正整数。
具体地,节点确定单元505,具体用于:基于贪心算法,根据所述影响力度量模型每一步选取传播影响范围增量最大的节点进行循环计算,以得到种子节点集合。
骗保确定单元506,用于根据传播范围最广的K个种子节点确定骗保行为。
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的基于图计算技术的理赔反欺诈装置和各单元的具体工作过程,可以参考前述基于图计算技术的理赔反欺诈方法实施例中的对应过程,在此不再赘述。
上述的理赔反欺诈装置可以实现为一种计算机程序的形式,该计算机程序可以在如图18所示的计算机设备上运行。
请参阅图18,图18是本申请实施例提供的一种计算机设备的结构示意性框图。该计算机设备可以是服务器或终端。
参阅图18,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口,其中,存储器可以包括非易失性存储介质和内存储器。
非易失性存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器执行任意一种理赔反欺诈方法。
处理器用于提供计算和控制能力,支撑整个计算机设备的运行。
内存储器为非易失性存储介质中的计算机程序的运行提供环境,该计算机程序被处理器执行时,可使得处理器执行任意一种理赔反欺诈方法。
该网络接口用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,图18中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
应当理解的是,处理器可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
其中,在一个实施例中,所述处理器用于运行存储在存储器中的计算机程序,以实现如下步骤:
基于图计算技术,根据医疗数据生成医生患者子图和医生医嘱子图以及根据所述医生患者子图和医生医嘱子图生成融合大图;根据所述融合大图,对所述医生患者子图进行投影以生成患者关系网络,所述患者关系网络包括多个社区封闭环;根据所述患者关系网络中任意两个节点对应的患者的属性参数,计算所述患者关系网络中任意两个节点之间的相似度;根据所述相似度计算每个所述社区封闭环对应的平均相似度;以及根据所述平均相似度确定骗保行为。
在一个实施例中,所述处理器在实现所述基于图计算技术,根据医疗数据生成医生患者子图和医生医嘱子图以及根据所述医生患者子图和医生医嘱子图生成融合大图时,用于实现:
获取医疗数据并对所述医疗数据进行分类得到分类数据,所述分类数据包括患者基本信息、医生基本信息和医嘱信息;根据所述分类数据的关联关系生成分类关系表,所述分类关系表包括患者医生关系表和医生医嘱关系表;基于图计算技术,根据所述分类关系表生成二分图,所述二分图包括医生患者子图和医生医嘱子图;以及基于图计算技术中的模型融合技术,将所述医生患者子图和医生医嘱子图融合生成融合大图。
在一个实施例中,所述处理器在实现所述根据所述融合大图,对所述医生患者子图进行投影以生成患者关系网络时,用于实现:
根据所述融合大图确定患者之间具有的相似就医行为;根据所述患者之间具有的相似就医行为,对所述医生患者子图进行投影以生成患者关系网络。
在一个实施例中,所述处理器在实现所述根据所述患者之间具有的相似就医行为,对所述医生患者子图进行投影以生成患者关系网络时,用于实现:
根据所述患者之间具有的相似就医行为,对所述医生患者子图进行投影以得到多个患者关系网;对所述患者关系网中涉及的医生进行聚类得到医生聚类关系;根据所述医生聚类关系,将多个所述患者关系网连接以生成患者关系网络。
在一个实施例中,所述处理器在实现所述计算所述患者关系网络中任意两个节点之间的相似度时,用于实现:
基于相似度计算公式,根据所述患者关系网络中任意两个节点对应的患者的特征属性和就医行为属性,计算所述患者关系网络中任意两个节点之间的相似度。
在一个实施例中,所述处理器在实现所述计算所述患者关系网络中任意两个节点之间的相似度之后,还用于实现:
根据所述相似度更新所述患者关系网络中每条边对应的权重值;基于平均相似度计算公式,根据患者关系网络中更新后的权重值计算每个所述社区封闭环对应的平均相似度。
其中,在另一实施例中,所述处理器用于运行存储在存储器中的计算机程序,以实现如下步骤:
基于图计算技术,根据医疗数据生成医生患者子图和医生医嘱子图以及根据所述医生患者子图和医生医嘱子图生成融合大图;根据所述融合大图,对所述医生患者子图进行投影以生成医生关系网络;确定所述医生关系网络中每个节点的邻居节点,计算所述邻居节点对所述节点的影响力度量;根据每个所述节点的影响力度量,建立影响力度量模型;根据所述影响力度量模型确定种子节点集合,所述种子节点集合包括传播范围最广的K个种子节点,K为正整数;根据传播范围最广的K个种子节点确定骗保行为。
在一个实施例中,所述处理器在实现所述根据所述融合大图,对所述医生患者子图进行投影以生成患者关系网络时,用于实现:
根据所述融合大图确定医生之间具有的相似诊治行为;根据所述患者之间具有的相似诊治行为,对所述医生患者子图进行投影以生成医生关系网络。
在一个实施例中,所述处理器在实现所述确定所述医生关系网络中每个节点的邻居节点,计算所述邻居节点对所述节点的影响力度量时,用于实现:
根据节点之间的边确定所述医生关系网络中每个节点的邻居节点;计算所述邻居节点在接待患者数量、开医嘱数据和开医嘱金额对所述节点的影响程度;根据所述影响程度计算所述邻居节点对所述节点的影响率;以及根据所述影响率计算所述邻居节点对所述节点的影响力度量。
在一个实施例中,所述处理器在实现所述根据所述影响程度计算所述邻居节点对所述节点的影响率时,用于实现:
基于所述影响率计算公式,根据所述影响程度计算所述邻居节点对所述节点的影响率。
在一个实施例中,所述处理器在实现所述根据所述影响率计算所述邻居节点对所述节点的影响力度量时,用于实现:
基于影响力度量计算公式,根据所述影响率通过迭代计算所述邻居节点对所述节点的影响力度量。
在一个实施例中,所述处理器在实现所述根据每个所述节点的影响力度量,建立影响力度量模型时,用于实现:
根据每个所述节点的影响力度量计算所述医生关系网络中每条边的影响力权值;根据计算的影响力权值构建线性阈值模型,所述线性阈值模型用于确定激活节点。
在一个实施例中,所述处理器在实现所述根据所述影响力度量模型确定种子节点集合时,用于实现:
基于贪心算法,根据所述影响力度量模型每一步选取传播影响范围增量最大的节点进行循环计算,以得到种子节点集合。
本申请的实施例中还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序中包括程序指令,所述处理器执行所述程序指令,实现本申请实施例提供的任一项基于图计算技术的理赔反欺诈方法。
其中,所述计算机可读存储介质可以是前述实施例所述的计算机设备的内部存储单元,例如所述计算机设备的硬盘或内存。所述计算机可读存储介质也可以是所述计算机设备的外部存储设备,例如所述计算机设备上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种基于图计算技术的理赔反欺诈方法,其特征在于,包括:
基于图计算技术,根据医疗数据生成医生患者子图和医生医嘱子图以及根据所述医生患者子图和医生医嘱子图生成融合大图;
根据所述融合大图,对所述医生患者子图进行投影以生成医生关系网络;
确定所述医生关系网络中每个节点的邻居节点,计算所述邻居节点对所述节点的影响力度量;
根据每个所述节点的影响力度量,建立影响力度量模型;
根据所述影响力度量模型确定种子节点集合,所述种子节点集合包括传播范围最广的K个种子节点,K为正整数;
根据传播范围最广的K个种子节点确定骗保行为。
2.根据权利要求1所述的理赔反欺诈方法,其特征在于,所述基于图计算技术,根据医疗数据生成医生患者子图和医生医嘱子图以及根据所述医生患者子图和医生医嘱子图生成融合大图,包括:
获取医疗数据并对所述医疗数据进行分类得到分类数据;
根据所述分类数据的关联关系生成分类关系表,所述分类关系表包括患者医生关系表和医生医嘱关系表;
基于图计算技术,根据所述分类关系表生成二分图,所述二分图包括医生患者子图和医生医嘱子图;以及
基于图计算技术中的模型融合技术,将所述医生患者子图和医生医嘱子图融合生成融合大图。
3.根据权利要求1或2所述的理赔反欺诈方法,其特征在于,所述根据所述融合大图,对所述医生患者子图进行投影以生成患者关系网络,包括:
根据所述融合大图确定医生之间具有的相似诊治行为;
根据所述患者之间具有的相似诊治行为,对所述医生患者子图进行投影以生成医生关系网络。
4.根据权利要求1所述的理赔反欺诈方法,其特征在于,所述确定所述医生关系网络中每个节点的邻居节点,计算所述邻居节点对所述节点的影响力度量,包括:
根据节点之间的边确定所述医生关系网络中每个节点的邻居节点;
计算所述邻居节点在接待患者数量、开医嘱数据和开医嘱金额对所述节点的影响程度;
根据所述影响程度计算所述邻居节点对所述节点的影响率;以及
根据所述影响率计算所述邻居节点对所述节点的影响力度量。
5.根据权利要求4所述的理赔反欺诈方法,其特征在于,所述根据所述影响程度计算所述邻居节点对所述节点的影响率,包括:
基于所述影响率计算公式,根据所述影响程度计算所述邻居节点对所述节点的影响率;
所述影响率计算公式为:
I(i,j)=Acc(i,j)*Amo(i,j)*Fin(i,j)
其中,I(i,j)为影响率,Acc(i,j)为节点j在接待患者数量上对节点i的影响程度,Amo(i,j)为节点j在开医嘱数量上对节点i的影响程度,Fin(i,j)为节点j在开医嘱金额上对节点i的影响程度;
其中,|Tj|表示节点j接待患者数量的总数,∑a∈A(i)|Ta|表示节点i的邻居节点所接待患者数量之和;|Zj|表示节点j开医嘱数量的总数,∑a∈A(i)|Za|表示节点i的邻居节点所开医嘱数量之和;|Mj|表示医生j开医嘱金额的总数,∑a∈A(i)|Ma|表示节点i的邻居节点所开医嘱金额之和。
6.根据权利要求4或5所述的理赔反欺诈方法,其特征在于,所述根据所述影响率计算所述邻居节点对所述节点的影响力度量,包括:
基于影响力度量计算公式,根据所述影响率通过迭代计算所述邻居节点对所述节点的影响力度量;
所述影响力度量计算公式为:
DIR(i)=d+(1-d)∑j∈N(i)[Sij*DIR(j)]
其中,DIR(i)是节点i的影响力度量;N(i)是节点i的邻居节点集合;Sij是节点i的影响力分配给节点j的比例因子,为节点j在所有影响节点i的邻居节点中所占的比重;d是阻尼系数,为常量。
7.根据权利要求1所述的理赔反欺诈方法,其特征在于,所述根据所述影响力度量模型确定种子节点集合,包括:
基于贪心算法,根据所述影响力度量模型每一步选取传播影响范围增量最大的节点进行循环计算,以得到种子节点集合。
8.一种基于图计算技术的理赔反欺诈装置,其特征在于,包括:
图生成单元,用于基于图计算技术,根据医疗数据生成医生患者子图和医生医嘱子图以及根据所述医生患者子图和医生医嘱子图生成融合大图;
网络生成单元,用于根据所述融合大图,对所述医生患者子图进行投影以生成医生关系网络;
影响计算单元,用于确定所述医生关系网络中每个节点的邻居节点,计算所述邻居节点对所述节点的影响力度量;
模型建立单元,用于根据每个所述节点的影响力度量,建立影响力度量模型;
节点确定单元,用于根据所述影响力度量模型确定种子节点集合,其中所述种子节点集合包括传播范围最广的K个种子节点,K为正整数;
骗保确定单元,用于根据传播范围最广的K个种子节点确定骗保行为。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器;
所述存储器用于存储计算机程序;
所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如权利要求1至7中任一项所述的理赔反欺诈方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如权利要求1至7中任一项所述的理赔反欺诈方法。
CN201910065014.4A 2019-01-23 2019-01-23 基于图计算技术的理赔反欺诈方法、装置、设备及存储介质 Active CN109903169B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910065014.4A CN109903169B (zh) 2019-01-23 2019-01-23 基于图计算技术的理赔反欺诈方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910065014.4A CN109903169B (zh) 2019-01-23 2019-01-23 基于图计算技术的理赔反欺诈方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN109903169A true CN109903169A (zh) 2019-06-18
CN109903169B CN109903169B (zh) 2024-06-04

Family

ID=66944071

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910065014.4A Active CN109903169B (zh) 2019-01-23 2019-01-23 基于图计算技术的理赔反欺诈方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN109903169B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110766557A (zh) * 2019-09-16 2020-02-07 平安科技(深圳)有限公司 基于图分析的数据异常解析方法、系统和计算机设备
CN110941664A (zh) * 2019-12-11 2020-03-31 北京百度网讯科技有限公司 知识图谱的构建方法、检测方法、装置、设备及存储介质
CN111369264A (zh) * 2020-02-13 2020-07-03 平安科技(深圳)有限公司 实体关联方法、装置、设备及计算机可读存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080172257A1 (en) * 2007-01-12 2008-07-17 Bisker James H Health Insurance Fraud Detection Using Social Network Analytics
US20140278479A1 (en) * 2013-03-15 2014-09-18 Palantir Technologies, Inc. Fraud detection in healthcare
CN106875281A (zh) * 2017-03-13 2017-06-20 哈尔滨工程大学 基于贪心子图的社会网络节点挖掘方法
US20170185735A1 (en) * 2015-12-29 2017-06-29 International Business Machines Corporation Analyzing doctor-doctor, patient-doctor, and patient-patient social networks
CN107682187A (zh) * 2017-09-29 2018-02-09 中科聚信信息技术(北京)有限公司 一种基于社交网络分析模型的反欺诈方法
CN107730262A (zh) * 2017-10-23 2018-02-23 阿里巴巴集团控股有限公司 一种欺诈识别方法和装置
CN107945036A (zh) * 2017-11-21 2018-04-20 中山大学 一种在线社交网络中有影响力传播者识别与量化的方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080172257A1 (en) * 2007-01-12 2008-07-17 Bisker James H Health Insurance Fraud Detection Using Social Network Analytics
US20140278479A1 (en) * 2013-03-15 2014-09-18 Palantir Technologies, Inc. Fraud detection in healthcare
US20170185735A1 (en) * 2015-12-29 2017-06-29 International Business Machines Corporation Analyzing doctor-doctor, patient-doctor, and patient-patient social networks
CN106875281A (zh) * 2017-03-13 2017-06-20 哈尔滨工程大学 基于贪心子图的社会网络节点挖掘方法
CN107682187A (zh) * 2017-09-29 2018-02-09 中科聚信信息技术(北京)有限公司 一种基于社交网络分析模型的反欺诈方法
CN107730262A (zh) * 2017-10-23 2018-02-23 阿里巴巴集团控股有限公司 一种欺诈识别方法和装置
CN107945036A (zh) * 2017-11-21 2018-04-20 中山大学 一种在线社交网络中有影响力传播者识别与量化的方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110766557A (zh) * 2019-09-16 2020-02-07 平安科技(深圳)有限公司 基于图分析的数据异常解析方法、系统和计算机设备
WO2021051938A1 (zh) * 2019-09-16 2021-03-25 平安科技(深圳)有限公司 基于图分析的数据异常解析方法、系统和计算机设备
CN110766557B (zh) * 2019-09-16 2024-03-19 平安科技(深圳)有限公司 基于图分析的数据异常解析方法、系统和计算机设备
CN110941664A (zh) * 2019-12-11 2020-03-31 北京百度网讯科技有限公司 知识图谱的构建方法、检测方法、装置、设备及存储介质
CN110941664B (zh) * 2019-12-11 2024-01-09 北京百度网讯科技有限公司 知识图谱的构建方法、检测方法、装置、设备及存储介质
CN111369264A (zh) * 2020-02-13 2020-07-03 平安科技(深圳)有限公司 实体关联方法、装置、设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN109903169B (zh) 2024-06-04

Similar Documents

Publication Publication Date Title
CN109919780A (zh) 基于图计算技术的理赔反欺诈方法、装置、设备及存储介质
Betzel et al. Specificity and robustness of long-distance connections in weighted, interareal connectomes
US20200126011A1 (en) Computer-implemented methods and systems for analyzing healthcare data
Wood et al. The general practice research database: role in pharmacovigilance
Zhang et al. The impact of client choice on preventive healthcare facility network design
US8214232B2 (en) Healthcare insurance claim fraud detection using datasets derived from multiple insurers
WO2021174944A1 (zh) 基于目标对象活跃度的消息推送方法及相关设备
CN105793856A (zh) 临床结果追踪和分析
Orlova Methodology and models for individuals’ creditworthiness management using digital footprint data and machine learning methods
CN109903169A (zh) 基于图计算技术的理赔反欺诈方法、装置、设备及存储介质
Feinhandler et al. Predictors of death rate during the COVID-19 pandemic
Ehrmann et al. ICF generic set as new standard for the system wide assessment of functioning in China: a multicentre prospective study on metric properties and responsiveness applying item response theory
Lin et al. Spatial pattern analysis of address quality: A study on the impact of rapid urban expansion in China
Hameed et al. A hybrid method integrating a discrete differential evolution algorithm with tabu search algorithm for the quadratic assignment problem: A new approach for locating hospital departments
Zou et al. Epidemic simulation of a large-scale social contact network on GPU clusters
del Castillo et al. The sustainability of Mexican municipal public debt
CN109543959A (zh) 审批链生成方法、装置、计算机设备及存储介质
Li et al. Application of a Mobile Chronic Disease Health‐Care System for Hypertension Based on Big Data Platforms
Dou et al. Multi-index evaluation for flood disaster from sustainable perspective: A case study of Xinjiang in China
Talaat et al. Datasets of simulated exhaled aerosol images from normal and diseased lungs with multi-level similarities for neural network training/testing and continuous learning
CN113643140B (zh) 确定医保支出影响因素的方法、装置、设备和介质
Wen et al. Effects of Healthcare Policies and Reforms at the Primary Level in China: From the Evidence of Shenzhen Primary Care Reforms from 2018 to 2019
dos Santos Marques et al. Public Innovation Policy Evaluation: Brazilian Electricity Tariff Paid by Consumers
Mei et al. Human disease clinical treatment network for the elderly: analysis of the medicare inpatient length of stay and readmission data
CN115221663A (zh) 数据处理方法、装置、设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant