CN111427926A

CN111427926A - 异常医保群组识别方法、装置、计算机设备及存储介质

Info

Publication number: CN111427926A
Application number: CN202010207776.6A
Authority: CN
Inventors: 董奕; 张旭
Original assignee: Ping An Medical and Healthcare Management Co Ltd
Current assignee: Ping An Medical and Healthcare Management Co Ltd
Priority date: 2020-03-23
Filing date: 2020-03-23
Publication date: 2020-07-17
Anticipated expiration: 2040-03-23
Also published as: CN111427926B

Abstract

本发明实施例提供了一种异常医保群组识别方法，包括：获取预设时间段内各个参保人的医保数据，所述医保数据包括医疗行为数据和身份识别数据；根据所述医疗行为数据和身份识别数据构建表征各个参保人之间关联关系的无向图；通过预设的极大团算法从所述无向图中查找出所有的极大团；将各个所述极大团中包含的所有身份识别数据所映射的参保人组成异常医保群组。本发明实施例可以降低识别群组欺诈行为所需要的计算资源。

Description

异常医保群组识别方法、装置、计算机设备及存储介质

技术领域

本发明实施例涉及数据处理技术领域，尤其涉及一种异常医保群组识别、装置、计算机设备及存储介质。

背景技术

目前，医疗保险已成为许多国家的主要支出，然而，在这些支出中存在一部分因医疗欺诈行为而产生。医保欺诈行为的发生对我国医保基金造成巨大冲击，每年将造成百亿元的经济损失。目前比较常见的医保欺诈行为有群组欺诈行为，其中，群组欺诈行为具体表现为多人成群结队去药店买药，成群结队去医院开药等。

现有针对群组欺诈行为的检测手段为通过构建参保人-医疗机构-离散时间到访矩阵的方法，通过相关性计算或内积计算挖掘参保人之间的相遇。然而，通过矩阵的方式来识别群组欺诈行为，其计算复杂度随着参保人数的增长大幅增加，需要较多的计算资源。

发明内容

有鉴于此，本发明实施例的目的是提供一种异常医保群组识别方法、装置、计算机设备及计算机可读存储介质，用于解决现有采用矩阵的方式来识别群组欺诈行为需要耗费大量的计算资源的问题。

为实现上述目的，本发明实施例提供了一种异常医保群组识别方法，包括：

获取预设时间段内各个参保人的医保数据，所述医保数据包括医疗行为数据和身份识别数据；

根据所述医疗行为数据和身份识别数据构建表征各个参保人之间关联关系的无向图；

通过预设的极大团算法从所述无向图中查找出所有的极大团；

将各个所述极大团中包含的所有身份识别数据所映射的参保人组成异常医保群组。

可选地，所述根据所述医疗行为数据和身份识别数据构建表征各个参保人之间关联关系的无向图包括：

对各个所述医疗行为数据进行分析，以确定各个所述参保人之间是否存在关联关系，其中，所述存在关联关系是指两个参保人在预设时间范围内同时出现在相同地点的事件发生的次数大于或者等于预设次数；

将各个所述参保人的身份识别数据作为顶点、所述关联关系作为边来构建所述无向图。

可选地，所述极大团算法为Bron–Kerbosch算法。

可选地，所述通过预设的极大团算法从所述无向图中查找出所有的极大团步骤之后，还包括：

通过Echart工具对所述所有的极大团进行可视化显示。

可选地，所述对所述医疗行为数据进行分析，以确定各个所述参保人之间是否存在关联关系包括：

根据所述医疗行为数据中的地点信息对所述医疗行为数据进行分类，得到多个第一医疗行为数据集，其中，每个第一医疗行为数据集中包含有至少一个医疗行为数据；

根据所述医疗行为数据中的时间信息对各个所述第一医疗行为数据集进行分类，得到多个第二医疗行为数据集，其中，每一个第二医疗行为数据集中包含有至少一个医疗行为数据；

对各个所述第二医疗行为数据集中的医疗行为数据进行分析，以确定各个所述参保人之间是否存在关联关系。

可选地，所述通过预设的极大团算法从所述无向图中查找出所有的极大团包括：

通过预设的分布式图计算框架中的极大团算法从所述无向图中查找出所有的极大团。

可选地，所述异常医保群组识别方法还包括：

发送警示信息给所述异常医保群组中的各个参保人。

为实现上述目的，本发明实施例还提供了一种异常医保群组识别装置，包括：

获取模块，用于获取预设时间段内各个参保人的医保数据，所述医保数据包括医疗行为数据和身份识别数据；

构建模块，用于根据所述医疗行为数据和身份识别数据构建表征各个参保人之间关联关系的无向图。

查找模块，用于通过预设的极大团算法从所述无向图中查找出所有的极大团；

组成模块，用于将各个所述极大团中包含的所有身份识别数据所映射的参保人组成异常医保群组。

为实现上述目的，本发明实施例还提供了一种计算机设备，包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如上所述的异常医保群组识别方法的步骤。

为实现上述目的，本发明实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序可被至少一个处理器所执行，以使所述至少一个处理器执行如上所述的异常医保群组识别方法的步骤。

本发明实施例提供的异常医保群组识别方法、装置、计算机设备及计算机可读存储介质，通过构建各个参保人之间关联关系的无向图的，然后通过极大团算法从所述无向图中查找出极大团，并将找到的完全子图中包含的所有身份识别数据所映射的参保人组成异常医保群组，从而完成异常医保群组的识别。由于通过极大团算法从所述无向图中挖掘出异常医保群组时，随着参保人数量的增加其计算量相对于通过矩阵的方式来挖掘出异常医保群组的计算量不会大幅增加，因此，通过本实施例的方法可以减少计算资源的消耗。

附图说明

图1为本发明异常医保群组识别方法的一实施方式的步骤流程示意图。

图2为本发明一实施方式中根据所述医疗行为数据和身份识别数据构建表征各个参保人之间关联关系的无向图的步骤细化流程示意图。

图3为本发明一实施方式中无向图的示意图。

图4为本发明一实施方式中对所有的极大团进行可视化显示的示意图。

图5为本发明一实施方式的异常医保群组识别装置的程序模块示意图。

图6为本发明一实施方式的计算机设备的硬件结构示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

以下结合附图与具体实施例进一步阐述本发明的优点。

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

在本公开使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本公开。在本公开和所附权利要求书中所使用的单数形式的“一种”、“所述”和“所述”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本公开可能采用术语第一、第二、第三等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本公开范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

在本发明的描述中，需要理解的是，步骤前的数字标号并不标识执行步骤的前后顺序，仅用于方便描述本发明及区别每一步骤，因此不能理解为对本发明的限制。

参阅图1，示出了本发明实施例一之异常医保群组识别方法的流程图。可以理解，本方法实施例中的流程图不用于对执行步骤的顺序进行限定。下面以计算机设备为执行主体进行示例性描述，所述计算机设备可以是移动电话、平板个人计算机(tablet personalcomputer)、膝上型计算机(laptop computer)、服务器等具有数据传输功能的设备。具体如下：

步骤S10，获取预设时间段内各个参保人的医保数据，所述医保数据包括医疗行为数据和身份识别数据。

具体地，可以从医保数据库中获取预设时间段内各个参保人的医保数据，其中，该医保数据库可以为某城市的医保数据库，也可以为全国联网的医保数据库(存储有全国参保人的医保数据)，在本实施例中，该医保数据库优选为某城市的医保数据库，该医保数据库中存储有所有在该城市参保的参保人的医保数据。

其中，所述医疗行为数据为参保人发生医疗行为的数据，所述医疗行为数据包括参保人发生医疗行为的时间信息以及地点信息。例如，某个参保人于2019年2月25日3点10分在医疗机构A通过医保卡购买了药品B，那么这个用户的购买行为所产生的数据即为医疗行为数据，其中，2019年2月25日3点10分为时间信息，医疗机构A为地点信息。

所述身份识别数据为用于唯一区别不同参保人的标识信息，在一具体应用中，该身份识别数据可以为参保人的身份证号，账户ID号等，在本实施例中不作限定。

需要说明的是，在本实施例中，所述预设时间段为预先设定的，其具体值可以根据实际情况进行设定，比如，该预设时间段设定为最近一个月。若所述预设时间段设定为最近一个月，则每隔一个月会获取一次各个参保人的医保数据。

步骤S11，根据所述医疗行为数据和身份识别数据构建表征各个参保人之间关联关系的无向图。

具体地，在获取到各个参保人的医疗行为数据以及身份识别数据之后，可以根据这些数据构建表征参保人之间关联关系的无向图G＝<V，E>，其中：

V是非空集合，称为顶点集；E是V中元素构成的无序二元组的集合，称为边集。

在一实施方式中，参照图2，所述根据所述医疗行为数据和身份识别数据构建表征各个参保人之间关联关系的无向图包括：

步骤S20，对所述医疗行为数据进行分析，以确定各个所述参保人之间是否存在关联关系，其中，所述存在关联关系是指两个参保人在预设时间范围内同时出现在相同地点的事件发生的次数大于或者等于预设次数；

具体地，在获取到所有参保人在预设时间段内的医疗行为数据之后，可以对所有的医疗行为数据进行分析来确定参保人之间是否存在关联关系。

在具体进行分析时，可以首先根据医疗行为数据中的地点信息进行分类，得到多个第一医疗行为数据集，其中，每个第一医疗行为数据集中包含有至少一个医疗行为数据，也就是说，将具有相同地点信息的医疗行为数据放在同一个类别下，比如，按照医疗机构的名称进行分大类；然后，可以根据所述医疗行为数据中的时间信息对各个所述第一医疗行为数据集进行分类，得到多个第二医疗行为数据集，其中，每一个第二医疗行为数据集中包含有至少一个医疗行为数据，也就是说，对各个大类别下的医疗行为数据再按照时间信息分成各个小类，比如，可以按照日期进行分小类，即将属于同一日的医疗行为数据分在同一个小类下；最后，可以对各个小类中的医疗行为数据进行分析，以确定是否存在两个参保人在预设时间范围内同时出现在相同地点，若存在，则记为所述两个参保人的一个事件。在完成所有的医疗行为数据的分析之后，统计各个参保人之间的事件所发生的次数，所统计得到的事件发生的次数大于或者等于预设次数时，则确定参保人之间存在关联关系。

其中，所述预设次数和所述预设时间范围为预先设定的值，两者的具体值可以根据实际情况进行设定，比如，设定所述预设次数为2次，设定所述预设时间范围为30分钟，则只有两个参保人在30分钟内同时出现在相同地点的事件发生的次数大于或者等于2次时，该两个参保人之间才存在关联关系。

在一示例中，假设存在参保人A、参保人B、参保人C、参保人D、参保人E、参保人F、参保人G，若在对这七个人的医疗行为数据进行分析后，若发现参保人A与参保人B在2019年1月10号2点10分-2点30分时间段内医疗机构A内都发生过医疗行为，且参保人A与参保人B在2019年1月11号2点10分-2点30分时间段内医疗机构A也发生过医疗行为，则可以确定参保人A与参保人B之间存在关联关系；若参保人B、参保人C在2019年1月11号2点30分-3点10分时间段内医疗机构B内都发生过医疗行为，且参保人B、参保人C在2019年1月12号2点30分-3点10分时间段内发生过医疗行为，则可以确定参保人B、参保人C之间存在关联关系；若参保人D、参保人E、参保人F在2019年1月12号42点10分-2点30分时间段内医疗机构A内都发生过医疗行为数据，且参保人D、参保人E、参保人F在2019年1月13号2点10分-2点30分时间段内医疗机构A内发生过医疗行为，则可以确定参保人D、参保人E、参保人F之间存在关联关系；若参保人E、参保人F、参保人G在2019年1月13号112点10分-2点30分时间段内医疗机构A内都发生过医疗行为，且参保人E、参保人F、参保人G在2019年1月14号2点10分-2点30分时间段内医疗机构A内都发生过医疗行为，则可以确定参保人E、参保人F、参保人G之间存在关联关系。

步骤S21，将各个所述参保人的身份识别数据作为顶点、所述关联关系作为边来构建所述无向图。

具体地，在构建无向图时，可以将各个所述参保人的身份识别数据作为无向图顶点，将参保人之间的关联关系作为无向图的边。

进一步地，在一实施方式中，可以将构建的无向图的边的粗细来表明两个参保人在预设时间范围内同时出现在相同地点的事件发生的次数，其中，边越粗，表明两个参保人在预设时间范围内同时出现在相同地点的事件发生的次数越多，边越细，表明两个参保人在预设时间范围内同时出现在相同地点的事件发生的次数越少。

步骤S12，通过预设的极大团算法从所述无向图中查找出所有的极大团。

具体地，极大团(maximal clique)算法为用于从无向图G中找出该无向图G中包含的所有的极大团的算法，其中团(clique)指的是一个无向图的完全子图，完全子图为一个简单的无向图，该完全子图中的每对顶点之间都有一条边相连。

如果一个团不被其他任一团所包含，即它不是其他任一团的真子集，则称该团为图G的极大团。

在本实施例中，所述极大团(maximal clique)算法优选为Bron-Kerbosch算法。

Bron-Kerbosch算法构造了三个集合来实现极大团的查找，该三个集合分别为R集合、P集合以及X集合，其中，

R集合记录的是当前极大团中已经加入的点。

P集合记录的是可能还能加入的点(也就是与R集合中所有点都有边存在的点，这样加入后，才会构成团)

X集合记录的是已经加入过某个极大团的点(作用是判重，因为会从每个顶点开始，枚举所有的团，如果不对已经加入某个极大团的点，进行标记，可能会有重复的极大团出现)。

需要说明的是，Bron-Kerbosch算法在通过R集合、P集合以及X集合来查找极大团时，只有当P集合与X集合都是空的时候，R集合才为极大团。

为了便于理解Bron-Kerbosch算法查找所有极大团的过程，本实施例结合一具体示例来说明Bron-Kerbosch算法查找极大团的过程。

在一示例中，参照图3，图3为一具有4个顶点的无向图，分别为顶点1、顶点2、顶点3、顶点4。通过Bron-Kerbosch算法找到所有的极大团的步骤具体如下：

步骤1、集合P会初始化为所有的顶点，其他集合为空集。

步骤2、将集合P中的第一个顶点，1号顶点，放入到R中。这个时候，我们的遍历要进入下一层了，所以要更新集合P和集合X，这里集合X没有变化，依然是空集。集合P中的点要是和集合R中的所有顶点都是连接的，显然我们只需要找到，原来的P集合中是1号集合的邻居顶点的那些点就行了，这里就是{2、3}，保证了P集合中的每个顶点都可以和R集合中的顶点想连接，其实X集合我们也会执行同样的操作，以保证X集合中的顶点都是和R集合中的所有顶点连接的。

步骤3、继续将P集合中的顶点放入R集合，这次放入2号顶点，R集合变为{1、2}，P集合取原P集合中且和2号顶点相连接的顶点，P集合就变为{3}，之后我们将P集合中的顶点3，放入R集合。此时P集合X集合都为空集，说明这个团已经不能再扩充了，所以{1、2、3}就是一个极大团。

步骤4、由于我们从1号顶点开始，先遍历了{1、2}，所以还要从1开始遍历{1、3}。按照DFS(深度优先遍历)的规则，会先退回到上一层，也就是R＝{1、2}，P＝{3}这一层，我们会将v顶点，也就是这一层里操作的顶点，在这里是3号顶点放入X集合中，表示它已经参与了极大团的构。在这一层里最后就变为了R＝{1、2}，P＝{}，X＝{3}，因为X不为空，且P为空，所以R＝{1、2}不是一个极大团，然后我们要回溯到上一层了，也就是R＝{1}、P＝{2、3}、X＝{}这一层，再将此时的操作顶点2号顶点，放入X中，表示它已经属于某个极大子图，这时的三个集合变为了R＝{1},P＝{3},X＝{2}。

只要P集合中，还有元素，我们就会一直执行将P集合中的元素加入R集合中的操作，所以这里将3号顶点加入，并且更新了P集合和X集合(就是保证P,X中的顶点和R集合中的所有顶点都连接)进入下一层。

在这里X＝{2}，不为空，所以{1、3}不是极大团，因为X集合中的在加入R集合后，都是会让R集合满足极大团的，显然{1、2、3}比{1、3}要大，所以只要X不为空，R就不会是极大团。

步骤5、在完成判断后，退回到上一层，也就是图中的R＝{1}，P＝{2、3}，X＝{}的这一层，不过刚才有说过，这一层其实在经过将P中的2号顶点加入到R后，以及后续的程序，已经变成了R＝{1},P＝{3},X＝{2},此时我们将正在操作的顶点3号顶点放入到X中，变为R＝{1}，P＝{}，X＝{2、3}，此时P中无顶点，X中有两个顶点。说明以1开始的遍历操作以及全部完成了，我们需要再去寻找其他顶点开始的遍历。

退回到上一层，也就是最开始的那一层，即R＝{}、P＝{1、2、3、4}、X＝{}的这一层。把操作的顶点，也就是1号顶点，放入X中，表示已经对其进行过查询。

再将P中的下一个顶点，也就是2号顶点，放入R中，同样的我们要更新P和X，保证P和X中的顶点，和R中的所有顶点，都是连接的，进入下一层，得到的如图所示，R＝{2}、P＝{3、4}、X＝{1}，表示我们要由2号顶点开始，寻找极大团了。

同样的，我们将P中的3号顶点放入R中，同时更新P和X，因为P中的4号顶点，不与3号顶点相连，所以P集合变为空集，X依然为{1}。此时我们发现P为空，但是X＝{1}，所以R＝{2、3}并不是一个极大团。这说明由2开始，再走3号顶点这条路是行不通的，所以需要退回到上一层，也就是R＝{2}、P＝{3、4}、X＝{1}这一层，再将3号顶点放入X中，表示已经搜过了，此时变为R＝{2}，P＝{4}，X＝{1、3}。下面就要走由2号顶点开始，在到4号顶点的这条路了。

将P中的4号顶点放入R中，同时更新P和X，因为1和3都不与4相连，所以X集合变为空集，此时P集合也为空集，所以R＝{2、4}是一个极大团。

步骤6、由于已经完成由节点1开始，以及节点2作为开始来寻找极大团，此时需要继续从3开始以及从4开始，寻找极大团。由3号顶点开始，R＝{3}、P＝{}、X＝{1、2}；由4号顶点开始，R＝{4}、P＝{}、X＝{2}。X集合都不为空，所以R集合不是极大团。

步骤7、在完成所有的遍历之后，将P、X都为空集合的时候所对应的所有的R集合找出，找到的R集合即为极大团。

进一步地，在一实施方式中，所述通过预设的极大团算法从所述无向图中查找出所有的极大团包括：

具体地，为了提高查找极大团的速度，可以通过调用分布式图计算框架中的极大团算法从所述无向图中查找出所有的极大团。在实施例中，所述分布式图计算框架可以为Spark GraphX框架，Hadoop Giraph,GraphLab框架等。

步骤S13，将各个所述极大团中包含的所有身份识别数据所映射的参保人组成异常医保群组。

具体地，在查找到所有的极大团之后，由于每一个极大团中的顶点都代表一个参保人的身份识别数据，因此，可以根据身份识别数据与参保人的映射关系可以确定对应的参保人，在确定该极大团对应的所有的参保人之后，即可以将所有的参保人组成一个异常医保群组。

需要说明的是，当有多个极大团时，则可以组成多个异常医保群组，即每一个极大团可以组建一个异常医保群组。

进一步地，在一实施方式中，为了使得用户可以更加直观地了解各个异常医保群组的规模，以及各个参保人之间的关系，所述通过预设的极大团算法从所述无向图中查找出所有的极大团步骤之后，还包括以下步骤：

通过Echart工具对所述所有的极大团进行可视化显示。

具体地，Echart工具一个开源的数据可视化工具，通过该工具可以方便快速的对所有的极大团进行可视化显示。参照图4所示，其为本发明实施例中对所有的极大团进行可视化显示的示意图。

在一实施方式中，当所述极大团存在多个时，在通过Echart工具对所述所有的极大团进行可视化显示之前，用户可以通过终端设备设定极大团的显示条件，所述显示条件用于确定需要显示哪些极大团，比如，用户需要显示只包含2个顶点的极大团，则可以设定该显示条件为为显示两个顶点的极大团；若用户需要显示只包含3个顶点的极大团，则可以设定所述显示条件为显示三个顶点的极大团；若用户需要显示包含2个或2个以上顶点的极大团，则可以设定所述显示条件为显示两个及两个顶点以上的极大团。在本实施例中，当用户完成显示条件的设置之后，当通过Echart工具对极大团进行可视化显示时，会首先判定当前待显示的极大团是否符合所述显示条件，当当前的极大团不符合所述显示条件时，将不对当前的极大团进行显示，然后判定下一个待显示的极大团是否符合显示条件，若符合显示条件，则对该极大团进行可视化显示，之后重复上述过程，直至所有的极大团显示完成。

进一步地，在一实施方式中，所述异常医保群组识别方法还包括：

发送警示信息给所述异常医保群组中的各个参保人。

具体地，为了让异常医保群组中的各个参保人不再进行医保欺诈行为，在得到医保欺诈群组之后，可以发送警示信息给所述异常医保群组中的各个参保人，以提醒他们已经被发现在诈骗医保基金，使得他们可以不再去实施诈骗行为，进而可以减少医保基金的损失。

在本实施例中，发送警示信息的方式有多种，比如，可以通过邮件、短信等方式进行发送。

本发明实施例所提出的异常医保群组识别方法，通过构建各个参保人之间关联关系的无向图的，然后通过极大团算法从所述无向图中查找出极大团，并将找到的完全子图中包含的所有身份识别数据所映射的参保人组成异常医保群组，从而完成异常医保群组的识别。由于通过极大团算法从所述无向图中挖掘出异常医保群组时，随着参保人数量的增加其计算量相对于通过矩阵的方式来挖掘出异常医保群组的计算量不会大幅增加，因此，通过本实施例的方法可以减少计算资源的消耗。

请参阅图5，示出了本发明实施例之异常医保群组识别装置500(以下简称为“识别装置500”)的程序模块示意图。所述识别装置500可以应用于计算机设备中，所述计算机设备可以是移动电话、平板个人计算机(tablet personal computer)、膝上型计算机(laptopcomputer)、服务器等具有数据传输功能的设备，所述计算机设备优选为服务器。在本实施例中，识别装置500可以包括或被分割成一个或多个程序模块，一个或者多个程序模块被存储于存储介质中，并由一个或多个处理器所执行，以完成本发明，并可实现上述异常医保群组识别方法。本发明实施例所称的程序模块是指能够完成特定功能的一系列计算机程序指令段，比程序本身更适合于描述异常医保群组识别方法在存储介质中的执行过程。以下描述将具体介绍本实施例各程序模块的功能：

获取模块501，用于获取预设时间段内各个参保人的医保数据，所述医保数据包括医疗行为数据和身份识别数据。

构建模块502，用于根据所述医疗行为数据和身份识别数据构建表征各个参保人之间关联关系的无向图。

具体地，在获取到各个参保人的医疗行为数据以及身份识别数据之后，可以根据这些数据构建参保人之间关联关系的无向图G＝<V，E>，其中：

在一实施方式中，构建模块502，还用于对所述医疗行为数据进行分析，以确定各个所述参保人之间是否存在关联关系，其中，所述存在关联关系是指两个参保人在预设时间范围内同时出现在相同地点的事件发生的次数大于或者等于预设次数；

构建模块502，还用于将各个所述参保人的身份识别数据作为顶点、所述关联关系作为边来构建所述无向图。

查找模块503，用于通过预设的极大团算法从所述无向图中查找出所有的极大团。

R集合记录的是当前极大团中已经加入的点。

步骤1、集合P会初始化为所有的顶点，其他集合为空集。

进一步地，在一实施方式中，查找模块503，还用于通过预设的分布式图计算框架中的极大团算法从所述无向图中查找出所有的极大团。

组成模块504，用于将各个所述极大团中包含的所有身份识别数据所映射的参保人组成异常医保群组。

进一步地，在一实施方式中，为了使得用户可以更加直观地了解各个异常医保群组的规模，以及各个参保人之间的关系，所述识别装置500还包括：显示模块。

所述显示模块，用于通过Echart工具对所述所有的极大团进行可视化显示。

进一步地，在一实施方式中，所述识别装置500还包括：发送模块。

所述发送模块，用于发送警示信息给所述异常医保群组中的各个参保人。

参阅图6，是本发明实施例之计算机设备600的硬件架构示意图。在本实施例中，所述计算机设备600是一种能够按照事先设定或者存储的指令，自动进行数值计算和/或信息处理的设备。如图所示，所述计算机设备600至少包括，但不限于，可通过装置总线相互通信连接存储器601、处理器602、网络接口603。其中：

本实施例中，存储器601至少包括一种类型的计算机可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，存储器601可以是计算机设备600的内部存储单元，例如所述计算机设备600的硬盘或内存。在另一些实施例中，存储器601也可以是计算机设备600的外部存储设备，例如所述计算机设备600上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。当然，存储器601还可以既包括计算机设备600的内部存储单元也包括其外部存储设备。本实施例中，存储器601通常用于存储安装于计算机设备600的操作装置和各类应用软件，例如异常医保群组识别装置500的程序代码等。此外，存储器601还可以用于暂时地存储已经输出或者将要输出的各类数据。

处理器602在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。所述处理器602通常用于控制计算机设备600的总体操作。本实施例中，处理器602用于运行存储器601中存储的程序代码或者处理数据，例如运行异常医保群组识别装置500，以实现上述各个实施例中的异常医保群组识别方法。

所述网络接口603可包括无线网络接口或有线网络接口，所述网络接口603通常用于在所述计算机设备600与其他电子装置之间建立通信连接。例如，所述网络接口603用于通过网络将所述计算机设备600与外部终端相连，在所述计算机设备600与外部终端之间的建立数据传输通道和通信连接等。所述网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯装置(Global System of Mobile communication，GSM)、宽带码分多址(Wideband Code Division Multiple Access，WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有线网络。

需要指出的是，图6仅示出了具有部件601-603的计算机设备600，但是应理解的是，并不要求实施所有示出的部件，可以替代的实施更多或者更少的部件。

在本实施例中，存储于存储器601中的所述异常医保群组识别装置500还可以被分割为一个或者多个程序模块，所述一个或者多个程序模块被存储于存储器601中，并由一个或多个处理器(本实施例为处理器602)所执行，以完成本发明之异常医保群组识别方法或者异常医保群组识别方法。

本实施例还提供一种计算机可读存储介质，如闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等，其上存储有计算机程序，程序被处理器执行时实现相应功能。本实施例的计算机可读存储介质用于存储异常医保群组识别装置500，以被处理器执行时实现本发明之异常医保群组识别方法或者异常医保群组识别方法。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种异常医保群组识别方法，其特征在于，包括：

2.如权利要求1所述的异常医保群组识别方法，其特征在于，所述根据所述医疗行为数据和身份识别数据构建表征各个参保人之间关联关系的无向图包括：

对所述医疗行为数据进行分析，以确定各个所述参保人之间是否存在关联关系，其中，所述存在关联关系是指两个参保人在预设时间范围内同时出现在相同地点的事件发生的次数大于或者等于预设次数；

3.如权利要求1所述的异常医保群组识别方法，其特征在于，所述极大团算法为Bron–Kerbosch算法。

4.如权利要求1所述的异常医保群组识别方法，其特征在于，所述通过预设的极大团算法从所述无向图中查找出所有的极大团步骤之后，还包括：

通过Echart工具对所述所有的极大团进行可视化显示。

5.如权利要求2所述的异常医保群组识别方法，其特征在于，所述对所述医疗行为数据进行分析，以确定各个所述参保人之间是否存在关联关系包括：

6.如权利要求1至5任一项所述的异常医保群组识别方法，其特征在于，所述通过预设的极大团算法从所述无向图中查找出所有的极大团包括：

7.如权利要求1至5任一项所述的异常医保群组识别方法，其特征在于，所述异常医保群组识别方法还包括：

发送警示信息给所述异常医保群组中的各个参保人。

8.一种异常医保群组识别装置，其特征在于，包括：

构建模块，用于根据所述医疗行为数据和身份识别数据构建表征各个参保人之间关联关系的无向图；

9.一种计算机设备，包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7任一项所述的异常医保群组识别方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质内存储有计算机程序，所述计算机程序可被至少一个处理器所执行，以使所述至少一个处理器执行如权利要求1-7中任一项所述的异常医保群组识别方法的步骤。