CN113239240A - 医保违规对象发现方法及装置 - Google Patents
医保违规对象发现方法及装置 Download PDFInfo
- Publication number
- CN113239240A CN113239240A CN202110277753.7A CN202110277753A CN113239240A CN 113239240 A CN113239240 A CN 113239240A CN 202110277753 A CN202110277753 A CN 202110277753A CN 113239240 A CN113239240 A CN 113239240A
- Authority
- CN
- China
- Prior art keywords
- target
- medical insurance
- graph
- nodes
- transaction data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 239000003814 drug Substances 0.000 claims abstract description 164
- 229940079593 drug Drugs 0.000 claims abstract description 73
- 241000208340 Araliaceae Species 0.000 claims abstract description 58
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims abstract description 58
- 235000003140 Panax quinquefolius Nutrition 0.000 claims abstract description 58
- 235000008434 ginseng Nutrition 0.000 claims abstract description 58
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 31
- 238000010586 diagram Methods 0.000 claims description 24
- 238000004590 computer program Methods 0.000 claims description 9
- 230000008520 organization Effects 0.000 claims description 9
- 238000010276 construction Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 abstract description 9
- 230000006399 behavior Effects 0.000 description 21
- 238000004458 analytical method Methods 0.000 description 12
- 239000006185 dispersion Substances 0.000 description 9
- 238000004891 communication Methods 0.000 description 5
- 238000005192 partition Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001012 protector Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- Development Economics (AREA)
- General Engineering & Computer Science (AREA)
- Technology Law (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Tourism & Hospitality (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明提供一种医保违规对象发现方法及装置,其方法包括:基于第一目标时段目标区域内医保参保人购买药品的交易数据,构建若干个关系图,并将至少一个所述关系图作为目标关系图;基于社区发现算法,对所述目标关系图进行社区发现,确定医保违规对象;其中,所述关系图中的结点表示医保参保人,所述关系图中的边表示所述边连接的两个结点所表示的医保参保人购买药品的交易之间的关系。本发明提供的医保违规对象发现方法及装置,通过获取目标关系图后,对目标关系图进行社区发现,确定医保违规对象,能更准确的发现医保违规对象,发现医保违规对象的过程简单,投入成本较低。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种医保违规对象发现方法及装置。
背景技术
利用他人医保卡套取医保药品牟利、指使参保人员开药再回收销售牟利以及医疗机构牟取医保基金等行为,将导致医保系统产生大量额外开支,严重影响了医保基金安全。
现有技术中,可以基于数据挖掘和机器学习的技术发现医保违规对象,例如:通过对某市医保局单月的全量门诊数据进行建模统计,若发现某位医生的看病频率曲线与平均频率曲线不一致,出现多天为同一群人看病且快速刷医保卡的非正常情况,则可以确定该医生为医保违规对象。还可以基于大数据挖掘发现医保违规对象,该方法可以解决基于商业规则的医保系统过于依赖专家知识水平,以及新的医保政策和新的违规策略对现有医保系统造成冲击等问题。但是现有技术中,均为针对个体的分析,难以准确地发现医保违规对象。
发明内容
本发明提供一种医保违规对象发现方法及装置,用以解决现有技术中难以准确地发现医保违规对象的缺陷,实现更准确地发现医保违规对象。
本发明提供一种医保违规对象发现方法,包括:
基于第一目标时段目标区域内医保参保人购买药品的交易数据,构建若干个关系图,并将至少一个所述关系图作为目标关系图;
基于社区发现算法,对所述目标关系图进行社区发现,确定医保违规对象;
其中,所述关系图中的结点表示医保参保人,所述关系图中的边表示所述边连接的两个结点所表示的医保参保人购买药品的交易之间的关系。
根据本发明提供的一种医保违规对象发现方法,所述基于社区发现算法,对所述目标关系图进行社区发现,确定医保违规对象,具体包括:
对所述目标关系图进行连通性判断,获取所述目标关系图的连通性判断结果;
根据所述目标关系图的连通性判断结果,确定所述医保违规对象;
其中,所述目标关系图的数量为一个。
根据本发明提供的一种医保违规对象发现方法,所述基于社区发现算法,对所述目标关系图进行社区发现,确定医保违规对象,具体包括:
对每一所述目标关系图进行连通性判断,获取各所述目标关系图的连通性判断结果;
根据各所述目标关系图的连通性判断结果,确定所述医保违规对象;
其中,所述目标关系图的数量为多个。
根据本发明提供的一种医保违规对象发现方法,所述基于第一目标时段目标区域内医保参保人购买药品的交易数据,构建若干个关系图,具体包括:
根据所述交易数据中各第二目标时段目标售药机构的交易数据,确定所述关系图中的各目标结点对;
通过连接每一所述目标结点对中的所述两个结点确定所述关系图中的边;
其中,所述第一目标时段包括多个所述第二目标时段;所述目标结点对由两个所述结点构成。
根据本发明提供的一种医保违规对象发现方法,所述基于第一目标时段目标区域内医保参保人购买药品的交易数据,构建若干个关系图,具体包括:
根据所述交易数据中目标售药机构目标药品的交易数据,确定所述关系图中的各目标结点对;
通过连接每一所述目标结点对中的所述两个结点确定所述关系图中的边;
其中,所述第一目标时段包括多个所述第二目标时段;所述目标结点对由两个所述结点构成。
根据本发明提供的一种医保违规对象发现方法,所述基于第一目标时段目标区域内医保参保人购买药品的交易数据,构建若干个关系图,具体包括:
根据所述交易数据中各第二目标时段目标售药机构目标药品的交易数据,确定所述关系图中的各目标结点对;
通过连接每一所述目标结点对中的所述两个结点确定所述关系图中的边;
其中,所述第一目标时段包括多个所述第二目标时段;所述目标结点对由两个所述结点构成。
根据本发明提供的一种医保违规对象发现方法,对所述目标关系图进行连通性判断,获取所述目标关系图的连通性判断结果,具体包括:
剔除所述目标关系图中不满足目标条件的所述结点和所述边;
对已剔除不满足所述目标条件的所述结点和所述边的所述目标关系图进行连通性判断,获取所述目标关系图的连通性判断结果。
本发明还提供一种医保违规对象发现装置,包括:
构建模块,用于基于第一目标时段目标区域内医保参保人购买药品的交易数据,构建若干个关系图,并将至少一个所述关系图作为目标关系图;
确定模块,用于基于社区发现算法,对所述目标关系图进行社区发现,确定医保违规对象;
其中,所述关系图中的结点表示医保参保人,所述关系图中的边表示所述边连接的两个结点所表示的医保参保人购买药品的交易之间的关系。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述医保违规对象发现方法的步骤。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述医保违规对象发现方法的步骤。
本发明提供的医保违规对象发现方法及装置,通过基于第一目标时段目标区域内医保参保人购买药品的交易数据获取目标关系图后,对目标关系图进行社区发现,确定医保违规对象,能更准确的发现医保违规对象,发现医保违规对象的过程简单,投入成本较低。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的医保违规对象发现方法的流程示意图;
图2是本发明提供的医保违规对象发现装置的结构示意图;
图3是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
为了便于对本发明各实施例的理解,下面对医保违规行为的基本情况进行说明。
常见的医保违规行为包括:医保违规对象使用医保卡大量购买不需要的药品,再将使用医保卡购买的药品卖出以获取利润。
需要说明的是,医保违规对象可以包括多个进行医保违规行为并具有相关性的对象。
医保违规对象一般是从同一地区开始的,医保违规对象进行医保违规行为时具有较强的时间相似性和地域相似性,即医保违规对象可能在较短的时间周期内,在小范围内的若干家医院或药店同时使用医保卡购买药品。医保违规对象还具有身份信息相近的特点,例如:医保违规对象中包括亲戚、朋友或邻居等。
由于同类药品便于倒卖,医保违规对象经常在药店或医院使用医保卡购买同类的药品,或收购他人使用医保卡购买的同类药品用于倒卖。医保违规对象进行医保违规行为时,具有在短时间内多次使用医保卡购买药品,每次购买药品的时间相近的特点。
由此可知,医保违规对象使用医保卡购买药品的行为具有地址相近、信息分散和时间相近等特点。
图1是本发明提供的医保违规对象发现方法的流程示意图。下面结合图1描述本发明的医保违规对象发现方法。如图1所示,该方法包括:步骤101、基于第一目标时段目标区域内医保参保人购买药品的交易数据,构建若干个关系图,并将至少一个关系图作为目标关系图。
其中,关系图中的结点表示医保参保人,关系图中的边表示边连接的两个结点所表示的医保参保人购买药品的交易之间的关系。
具体地,医保参保人可以在售药机构使用医保卡购买药品。售药机构可以包括医院和药店等。
医保参保人在医院门诊购买药品时,依照医生开具的处方使用医保卡购买药品。根据医保卡在医院门诊就诊过程中的交易结算记录,可以获取医保参保人的购买药品的交易数据,例如:就诊时间、就诊间隔时间、看病医生、病种、购药种类和医保参保人的参保信息等。
医保参保人在药店购药的过程中,仅在交易结束留下一处交易结算记录。根据上述医保卡的交易结算记录,可以获取医保参保人的购买药品的交易数据,例如:购药时间、购药间隔、购药药店、购药药品、药品种类和医保参保人的参保信息等。
需要说明的是,从目标区域的社会保障局等机构可以获取第一目标时段目标区域内,所有医保参保人购买药品的原始交易数据。
获取第一目标时段目标区域内所有医保参保人购买药品的原始交易数据后,可以对原始交易数据进行数据处理:例如:剔除异常数据或根据经验分析剔除医保参保人正常购药行为产生的购药的交易数据。对原始交易数据进行数据处理后,可以获取目标时段目标区域内医保参保人购买药品的交易数据。
基于第一目标时段目标区域内医保参保人购买药品的交易数据,可以构建若干个关系图。上述关系图可以用以发现使用医保卡购买药品过程具有地址相近、信息分散和时间相近等特点的人群。
具体地,分别将每一医保参保人作为构建的关系图中的一个结点。每一结点可以包括每一医保参保人的属性信息,例如:医保卡号、姓名、出生年月日以及人员类型等。若任意两个医保参保人购买药品的交易之间具有相关性,则可以通过边连接上述两个医保参保人。关系图中的边可以表示上述两个医保参保人购买药品的交易之间的关系。
第一目标时段可以是预设的时间区间。第一目标时段的确定可以影响发现的医保违规对象的准确性。若第一目标时段过短,医保参保人购买药品的交易数据较少,难以全面的发现潜在的医保违规行为;若第一目标时段过长,医保参保人购买药品的交易数据过多,则可能将某些正常的购药行为,视为医保违规行为。本发明实施中第一目标时段可以根据实际情况确定,例如:第一目标时段可以为过去一年或过去6个月。
目标区域可以是预设的区域范围。目标区域的确定可以影响发现的医保违规对象的准确性。若目标区域过小,医保参保人购买药品的交易数据较少,难以全面的发现潜在的医保违规行为;若目标区域过大,医保参保人购买药品的交易数据过多,则可能将某些正常的购药行为,视为医保违规行为。本发明实施中目标区域可以根据实际情况确定,例如:目标区域可以为某一市或某一市的某一区。
目标关系图,用于确定医保违规对象。
构建若干个关系图后,可以根据不同的分析维度选择关系图中的一张或多张关系图作为目标关系图。
基于医保违规对象使用医保卡购买药品的行为具有地址相近、信息分散和时间相近等特点,分析维度可以包括时间分析维度和/或购药种类分析维度等。相应地,关系图中的边连接的两个结点之间的关系可以是上述两个结点对应的医保参保人购买药品的交易之间的时间关系、药品关系和时间药品关系等。
步骤102、基于社区发现算法,对目标关系图进行社区发现,确定医保违规对象。
社区可以反映网络中的个体行为的局部性特征以及其相互之间的关联关系。基于社区发现算法可以分析及预测整个网络各元素间的交互关系。常用的社区发现算法有分裂式GN算法、基于贪心算法与快速模块度最大化的Louvain算法等。
GN算法是由Girvan和Newman提出的用边介数来标记每条边对网络连通性的影响。社区的内部结点的连接稠密,而与其他社团内的结点连接稀疏。社团与社团之间联系的通道比较少,一个社团到另一个社团至少要通过这些通道中的一条。若找出连接不同社团的通道,并将它们移除,则网络可以分出每一社团。某条边的边介数是指网络中通过这条边的最短路径的数目。两结点间的最短路径在无权网中为连接该结点对的边数最少的路径。由此定义可知,社团间结点对的最短路径必然通过社团间连边,因此社团间连边的边介数比较大,而社团内部边的边介数则较小。
Louvain算法与GN算法类似。首先将网络中的每一结点都单独作为一个社区,此时网络中有几个结点便有几个社区,计算此时的模块度。然后将网络中的每个连通部分作为一个社区,将还未加入网络的边分别重新加回网络,每次加入一条边,如果加入网络的边连接了两个不同的社区,则合并两个社区,并计算形成新社区划分的模块度增量,选择使模块度增量最大的两个社区进行合并。若一直能够找到使得模块度增大的合并,则继续迭代,反之则遍历每种社区划分对应的模块度值,选取模块度最大的社区划分作为网络的最优划分。
本发明实施例中,可以通过任一社区发现算法,对目标关系图进行社区发现,并将通过社区发现确定的社区包括的各结点对应的医保参保人作为医保违规对象。
需要说明的是,本发明实施例中社区可以由目标关系图中多个内部连通的结点构成,且任意两个社区之间不连通。本发明实施例中,一个结点不能构成社区。
本发明实施例通过基于第一目标时段目标区域内医保参保人购买药品的交易数据获取目标关系图后,对目标关系图进行社区发现,确定医保违规对象,能更准确的发现医保违规对象,发现医保违规对象的过程简单,投入成本较低。
基于上述各实施例的内容,基于社区发现算法,对目标关系图进行社区发现,确定医保违规对象,具体包括:对目标关系图进行连通性判断,获取目标关系图的连通性判断结果。
其中,目标关系图的数量为一个。
具体地,结点的连通性指若任意两个结点通过边连接,则称上述两个结点连通。
构建若干个关系图后,可以根据不同的分析维度选择关系图中的一张作为目标关系图。通过对上述目标关系图进行连通性判断,可以发现目标关系图中若干个社区。可以将上述若干个社区作为目标关系图的连通性判断结果。
本发明实施例中,通过深度优先搜索(Depth First Search,DFS)、宽度优先搜索(Breadth First Search,BFS)和并查集等方法可以对目标关系图进行连通性判断。
深度优先搜索可以通过深度优先遍历得到图的一个连通分量。具体地,从目标关系图中的某一结点出发,依次从该结点未被访问的邻接点出发,对目标关系图进行深度优先遍历,直至目标关系图中和该结点有路径相通的结点都被访问。若此时目标关系图中尚有结点未被访问,则从一个未被访问的结点出发,重新进行深度优先遍历,直至目标关系图中所有结点均被访问过为止,从而获得目标关系图的连通性判断结果。
宽度优先搜索通过系统地展开并检查目标关系图中的所有结点,获得目标关系图的连通性判断结果。
并查集是一种树型的数据结构,可以用于处理一些不相交集合的合并及查询。基于并查集可以获取目标关系图的连通性判断结果。
获取目标关系图的连通性判断结果后,根据目标关系图的连通性判断结果,可以确定医保违规对象。
具体地,对于目标关系图中的任一社区,提取该社区中包括的所有结点。
获取上述所有结点对应的医保参保人,并将上述所有医保参保人作为一个医保违规对象。
根据目标关系图的连通性判断结果中任一内部连通的社区,可以确定一个医保违规对象。因此,根据目标关系图的连通性判断结果,可以确定若干个医保违规对象。
需要说明的是,通过GN算法或Louvain算法等社区发现算法对目标关系图进行社区发现确定的医保违规对象,与对目标关系图进行连通性判断确定的医保违规对象类似。但连通性判断的计算过程更为简单,计算速度更快,本发明实施例中通过对目标关系图进行连通性判断确定医保违规对象。
本发明实施例通过对一张目标关系图进行连通性判断,并根据目标关系图的连通性判断结果,确定医保违规对象,能更方便、快捷的发现医保违规对象。
基于上述各实施例的内容,基于社区发现算法,对目标关系图进行社区发现,确定医保违规对象,具体包括:对每一目标关系图进行连通性判断,获取各目标关系图的连通性判断结果。
其中,目标关系图的数量为多个。
构建若干个关系图后,可以根据多个分析维度将多张关系图作为目标关系图。通过对上述各目标关系图进行连通性判断,可以发现每一目标关系图中的若干个社区。可以将上述若干个社区作为每一目标关系图的连通性判断结果。
具体地,可以通过深度优先搜索(Depth First Search,DFS)、宽度优先搜索(Breadth First Search,BFS)和并查集等方法分别对每一目标关系图进行连通性判断。
获取目标关系图的连通性判断结果后,根据各目标关系图的连通性判断结果,可以确定医保违规对象。
具体地,根据每一目标关系图的连通性判断结果,分别确定若干个社区之后,可以对各社区分别取重叠,获取医保违规对象。
若根据目标关系图A确定的任一社区和根据目标关系图B确定的任一社区有至少两个相同的结点,则将上述至少两个相同的结点对应的医保参保人作为一个医保违规对象。例如:若根据目标关系图A 确定的任一社区有甲、乙、丙、丁、戊五个结点,根据目标关系图B 确定的另一社区有甲、乙、丙、丁四个结点,则将甲、乙、丙、丁结点对应的医保参保人作为一个医保违规对象。
本发明实施例通过对多张目标关系图进行连通性判断,并各目标关系图的连通性结果中均确定的医保违规对象作为最终发现结果,能更准确的发现医保违规对象。
基于上述各实施例的内容,基于第一目标时段目标区域内医保参保人购买药品的交易数据,构建若干个关系图,具体包括:根据交易数据中各第二目标时段目标售药机构的交易数据,确定关系图中的各目标结点对。
其中,第一目标时段包括多个第二目标时段;所述目标结点对由两个所述结点构成。
具体地,基于医保违规对象进行医保违规行为时具有地址相近和信息分散的特点,本发明实施例根据交易数据中各第二目标时段目标售药机构的交易数据,构建关系图。
第一目标时段可以平均划分为多个第二目标时段。因此,第二目标时段可以是一个较短的时间周期,例如:半天、一天或两天。
目标售药机构可以指在一个小范围内的各医院或药店,例如:药店甲,或者药店甲及药店甲周边的医院乙和药店丙。
根据交易数据中各第二目标时段目标售药机构的交易数据,可以获知任意两个医保参保人之间是否存在关联,例如:根据某市过去一年的交易数据中药店甲每一天的交易数据,可以获知该市的任意两个医保参保人在过去一年内,是否在同一天在药店甲使用医保卡购买药品;或者,根据某辖区过去6个月的交易数据中药店甲、医院乙或药店丙每两天的交易数据,可以获知该辖区的任意两个医保参保人在过去6个月内,是否在相同的两天内在药店甲、医院乙或药店丙使用医保卡购买药品。
若获知任意两个医保参保人之间存在关联,则将关系图中上述两个医保参保人对应的两个结点确定为一个目标结点对。
若获知任意两个医保参保人之间不存在关联,则关系图中上述两个医保参保人对应的两个结点彼此独立。
通过连接每一目标结点对中的两个结点确定关系图中的边。
具体地,确定关系图中的每一目标结点对后,通过边连接每一目标结点对中的两个结点,可以确定关系图中的所有边。
需要说明的是,可以根据任意两个医保参保人之间关联的强度,为关系图中的边赋值。例如,根据某市过去一年的交易数据中药店甲每一天的交易数据,可以获取该市的任意两个医保参保人在过去一年内,在同一天在药店甲使用医保卡购买药品的次数,则连接上述两个医保参保人对应的结点的边的值,即为上述次数。
本发明实施例通过根据第二目标时段目标售药机构的交易数据,确定关系图中的各目标结点对和关系图中的边,能构建反映地址相近和信息分散特点的关系图,能基于构建好的关系图发现医保违规对象。
基于上述各实施例的内容,基于第一目标时段目标区域内医保参保人购买药品的交易数据,构建若干个关系图,具体包括:根据交易数据中目标售药机构目标药品的交易数据,确定关系图中的各目标结点对。
其中,第一目标时段包括多个第二目标时段;所述目标结点对由两个所述结点构成。
具体地,基于医保违规对象进行医保违规行为时具有地址相近和信息分散的特点,本发明实施例根据交易数据中目标售药机构目标药品的交易数据,可以构建关系图。
目标售药机构可以指在一个小范围内的各医院或药店,例如:药店甲,或者药店甲及药店甲周边的医院乙和药店丙。
目标药品可以是具有相关性的若干种药品,例如:药品A,或者药品A以及需要与药品A同时服用的药品B。
根据交易数据中目标售药机构目标药品的交易数据,可以获知任意两个医保参保人之间是否存在关联,例如:根据某市过去一年的交易数据中在药店甲购买药品A的交易数据,可以获知该市的任意两个医保参保人在过去一年内,是否均在药店甲使用医保卡购买药品A;或者,根据某辖区过去6个月的交易数据中在药店甲、医院乙或药店丙购买药品A和药品B的交易数据,可以获知该市的任意两个医保参保人在过去6个月内,是否均在药店甲、医院乙或药店丙使用医保卡购买药品A或药品B。
若获知任意两个医保参保人之间存在关联,则将关系图中上述两个医保参保人对应的两个结点确定为一个目标结点对。
若获知任意两个医保参保人之间不存在关联,则关系图中上述两个医保参保人对应的两个结点彼此独立。
通过连接每一目标结点对中的两个结点确定关系图中的边。
具体地,确定关系图中的每一目标结点对后,通过边连接每一目标结点对中的两个结点,可以确定关系图的所有边。
需要说明的是,可以根据任意两个医保参保人之间关联的强度,为关系图中的边赋值。例如,根据某市过去一年的交易数据中药店甲购买药品A的交易数据,可以获取该市的任意两个医保参保人在过去一年内,在药店甲使用医保卡购买药品A的次数,则连接上述两个医保参保人对应的结点的边的值,即为上述次数。
本发明实施例通过根据目标售药机构目标药品的交易数据,确定关系图中的各目标结点对和关系图中的边,能构建反映地址相近和信息分散特点的关系图,能基于构建好的关系图发现医保违规对象。
基于上述各实施例的内容,基于第一目标时段目标区域内医保参保人购买药品的交易数据,构建若干个关系图,具体包括:根据交易数据中各第二目标时段目标售药机构目标药品的交易数据,确定关系图中的各目标结点对。
其中,第一目标时段包括多个第二目标时段;所述目标结点对由两个所述结点构成。
具体地,基于医保违规对象进行医保违规行为时具有地址相近、信息分散和时间相近的特点,本发明实施例根据交易数据中各第二目标时段目标售药机构目标药品的交易数据,可以构建关系图。
第一目标时段可以平均划分为多个第二目标时段。因此,第二目标时段可以指一个较短的时间周期,例如:半天、一天或两天。
目标售药机构可以指在一个小范围内的若干家医院或药店,例如:药店甲,或者药店甲及药店甲周边的医院乙和药店丙。
目标药品可以是具有相关性的若干种药品,例如:药品A,或者药品A和需要和药品A同时服用的药品B。
根据交易数据中各第二目标时段目标售药机构目标药品的交易数据,可以获知任意两个医保参保人之间是否存在关联,例如:根据某市过去一年的交易数据中每一在药店甲购买药品A的交易数据,可以获知该市的任意两个医保参保人在过去一年内,是否在同一天在药店甲使用医保卡购买药品A;或者,根据某辖区过去6个月的交易数据中每两天在药店甲、医院乙或药店丙购买药品A和药品B的交易数据,可以获知该市的任意两个医保参保人在过去6个月内,是否在相同的两天内在药店甲、医院乙或药店丙使用医保卡购买药品A或药品B。
若获知任意两个医保参保人之间存在关联,则将关系图中上述两个医保参保人对应的两个结点确定为一个目标结点对。
若获知任意两个医保参保人之间不存在关联,则关系图中上述两个医保参保人对应的两个结点彼此独立。
通过连接每一目标结点对中的两个结点确定关系图中的边。
具体地,确定关系图中的每一目标结点对后,通过边连接每一目标结点对中的两个结点,可以确定关系图的所有边。
需要说明的是,可以根据任意两个医保参保人之间关联的强度,为关系图中的边赋值。例如,根据某市过去一年的交易数据中每一天在药店甲购买药品A的交易数据,可以获取该市的任意两个医保参保人在过去一年内,在同一天在药店甲使用医保卡购买药品A的次数,则连接上述两个医保参保人对应的结点的边的值,即为上述次数。
本发明实施例通过根据第二目标时段目标售药机构目标药品的交易数据,确定关系图中的各目标结点对和关系图中的边,能构建反映地址相近、信息分散和时间相近特点的关系图,能基于构建好的关系图发现医保违规对象。
基于上述各实施例的内容,对目标关系图进行连通性判断,获取目标关系图的连通性判断结果,具体包括:剔除目标关系图中不满足目标条件的结点和边。
具体地,基于第一目标时段目标区域内医保参保人购买药品的交易数据,获取目标关系图后,可以发现任意两个医保参保人,同一第二目标时段在目标售药机构使用医保卡购买药品或在目标售药机构购买目标药品的情况较为普遍,但是通常情况下关联的强度较小。例如:若将目标条件设置为5,则表示任意两个医保参保人,在某市过去一年内,同一天在药店甲使用医保卡购买药品的次数为5次以下,可以分别将上述两个医保参保人的购药行为视为正常的购药行为。
因此,可以根据经验预设目标条件,将目标关系图中边的值小于目标条件的边删除,保留边的值大于目标条件的边。
在关系图中,没有边的结点可以说明该结点对应的参保人在第一目标时段目标区域内没有购药行为。可以将关系图中所有没有边的结点删除。
对已剔除不满足目标条件的结点和边的目标关系图进行连通性判断,获取目标关系图的连通性判断结果。
具体地,对已剔除不满足目标条件的结点和边的目标关系图,可以通过深度优先搜索(Depth First Search,DFS)、宽度优先搜索 (Breadth First Search,BFS)和并查集等方法分别对每一目标关系图进行连通性判断,获取目标关系图的连通性判断结果。
本发明实施例通过剔除目标关系图中不满足目标条件的结点和边,能基于已剔除不满足目标条件的结点和边的目标关系图,更准确的发现医保违规对象。
图2是本发明提供的医保违规对象发现装置的结构示意图。下面结合图2对本发明提供的医保违规对象发现装置进行描述,下文描述的医保违规对象发现装置与上文描述的医保违规对象发现方法可相互对应参照。如图2所示,该装置包括:构建模块201和确定模块202。
构建模块201,用于基于第一目标时段目标区域内医保参保人购买药品的交易数据,构建若干个关系图,并将至少一个关系图作为目标关系图。
确定模块202,用于基于社区发现算法,对目标关系图进行社区发现,确定医保违规对象。
其中,关系图中的结点表示医保参保人,关系图中的边表示边连接的两个结点所表示的医保参保人购买药品的交易之间的关系。
具体地,构建模块201和确定模块202电连接。
构建模块201可以基于第一目标时段目标区域内医保参保人购买药品的交易数据,可以构建若干个关系图。上述关系图可以用以发现使用医保卡购买药品过程具有地址相近、信息分散和时间相近等特点的人群。
具体地,分别将每一医保参保人作为构建的关系图中的一个结点。每一结点可以包括每一医保参保人的属性信息,例如:医保卡号、姓名、出生年月日以及人员类型等。若任意两个医保参保人购买药品的交易之间具有相关性,则可以通过边连接上述两个医保参保人。关系图中的边可以表示上述两个医保参保人购买药品的交易之间的关系。
第一目标时段可以是预设的时间区间。第一目标时段的确定可以影响发现的医保违规对象的准确性。若第一目标时段过短,医保参保人购买药品的交易数据较少,难以全面的发现潜在的医保违规行为;若第一目标时段过长,医保参保人购买药品的交易数据过多,则可能将某些正常的购药行为,视为医保违规行为。本发明实施中可以将过去一年作为第一目标时段。本发明实施中第一目标时段可以根据实际情况确定,例如:第一目标时段可以为过去一年或过去6个月。
目标区域可以是预设的区域范围。目标区域的确定也可以影响发现的医保违规对象的准确性。若目标区域过小,医保参保人购买药品的交易数据较少,难以全面的发现潜在的医保违规行为;若目标区域过大,医保参保人购买药品的交易数据过多,则可能将某些正常的购药行为,视为医保违规行为。本发明实施中可以将某一市作为目标区域。本发明实施中目标区域可以根据实际情况确定,例如:目标区域可以为某一市或某一市的某一区。
目标关系图,用于确定医保违规对象。
构建若干个关系图后,可以根据不同的分析维度选择关系图中的一张或多张关系图作为目标关系图。
基于医保违规对象使用医保卡购买药品的行为具有地址相近、信息分散和时间相近等特点,分析维度可以包括时间分析维度和/或购药种类分析维度等。相应地,关系图中的边连接的两个结点之间的关系可以是上述两个结点对应的医保参保人购买药品的交易之间的时间关系、药品关系和时间药品关系等。
确定模块202可以通过GN算法或Louvain算法等社区发现算法,对目标关系图进行社区发现,并将通过社区发现确定的社区作为医保违规对象。
本发明实施例通过基于第一目标时段目标区域内医保参保人购买药品的交易数据获取目标关系图后,对目标关系图进行社区发现,确定医保违规对象,能更准确的发现医保违规对象,发现医保违规对象的过程简单,投入成本较低。
图3示例了一种电子设备的实体结构示意图,如图3所示,该电子设备可以包括:处理器(processor)310、通信接口(Communications Interface)320、存储器(memory)330和通信总线340,其中,处理器310,通信接口320,存储器330通过通信总线340完成相互间的通信。处理器310可以调用存储器330中的逻辑指令,以执行医保违规对象发现方法,该方法包括:基于第一目标时段目标区域内医保参保人购买药品的交易数据,构建若干个关系图,并将至少一个关系图作为目标关系图;基于社区发现算法,对目标关系图进行社区发现,确定医保违规对象;其中,关系图中的结点表示医保参保人,关系图中的边表示边连接的两个结点所表示的医保参保人购买药品的交易之间的关系。
此外,上述的存储器330中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的医保违规对象发现方法,该方法包括:基于第一目标时段目标区域内医保参保人购买药品的交易数据,构建若干个关系图,并将至少一个关系图作为目标关系图;基于社区发现算法,对目标关系图进行社区发现,确定医保违规对象;其中,关系图中的结点表示医保参保人,关系图中的边表示边连接的两个结点所表示的医保参保人购买药品的交易之间的关系。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各提供的医保违规对象发现方法,该方法包括:基于第一目标时段目标区域内医保参保人购买药品的交易数据,构建若干个关系图,并将至少一个关系图作为目标关系图;基于社区发现算法,对目标关系图进行社区发现,确定医保违规对象;其中,关系图中的结点表示医保参保人,关系图中的边表示边连接的两个结点所表示的医保参保人购买药品的交易之间的关系。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种医保违规对象发现方法,其特征在于,包括:
基于第一目标时段目标区域内医保参保人购买药品的交易数据,构建若干个关系图,并将至少一个所述关系图作为目标关系图;
基于社区发现算法,对所述目标关系图进行社区发现,确定医保违规对象;
其中,所述关系图中的结点表示医保参保人,所述关系图中的边表示所述边连接的两个结点所表示的医保参保人购买药品的交易之间的关系。
2.根据权利要求1所述的医保违规对象发现方法,其特征在于,所述基于社区发现算法,对所述目标关系图进行社区发现,确定医保违规对象,具体包括:
对所述目标关系图进行连通性判断,获取所述目标关系图的连通性判断结果;
根据所述目标关系图的连通性判断结果,确定所述医保违规对象;
其中,所述目标关系图的数量为一个。
3.根据权利要求1所述的医保违规对象发现方法,其特征在于,所述基于社区发现算法,对所述目标关系图进行社区发现,确定医保违规对象,具体包括:
对每一所述目标关系图进行连通性判断,获取各所述目标关系图的连通性判断结果;
根据各所述目标关系图的连通性判断结果,确定所述医保违规对象;
其中,所述目标关系图的数量为多个。
4.根据权利要求1所述的医保违规对象发现方法,其特征在于,所述基于第一目标时段目标区域内医保参保人购买药品的交易数据,构建若干个关系图,具体包括:
根据所述交易数据中各第二目标时段目标售药机构的交易数据,确定所述关系图中的各目标结点对;
通过连接每一所述目标结点对中的所述两个结点确定所述关系图中的边;
其中,所述第一目标时段包括多个所述第二目标时段;所述目标结点对由两个所述结点构成。
5.根据权利要求1所述的医保违规对象发现方法,其特征在于,所述基于第一目标时段目标区域内医保参保人购买药品的交易数据,构建若干个关系图,具体包括:
根据所述交易数据中目标售药机构目标药品的交易数据,确定所述关系图中的各目标结点对;
通过连接每一所述目标结点对中的所述两个结点确定所述关系图中的边;
其中,所述第一目标时段包括多个所述第二目标时段;所述目标结点对由两个所述结点构成。
6.根据权利要求1所述的医保违规对象发现方法,其特征在于,所述基于第一目标时段目标区域内医保参保人购买药品的交易数据,构建若干个关系图,具体包括:
根据所述交易数据中各第二目标时段目标售药机构目标药品的交易数据,确定所述关系图中的各目标结点对;
通过连接每一所述目标结点对中的所述两个结点确定所述关系图中的边;
其中,所述第一目标时段包括多个所述第二目标时段;所述目标结点对由两个所述结点构成。
7.根据权利要求2或3所述的医保违规对象发现方法,其特征在于,对所述目标关系图进行连通性判断,获取所述目标关系图的连通性判断结果,具体包括:
剔除所述目标关系图中不满足目标条件的所述结点和所述边;
对已剔除不满足所述目标条件的所述结点和所述边的所述目标关系图进行连通性判断,获取所述目标关系图的连通性判断结果。
8.一种医保违规对象发现装置,其特征在于,包括:
构建模块,用于基于第一目标时段目标区域内医保参保人购买药品的交易数据,构建若干个关系图,并将至少一个所述关系图作为目标关系图;
确定模块,用于基于社区发现算法,对所述目标关系图进行社区发现,确定医保违规对象;
其中,所述关系图中的结点表示医保参保人,所述关系图中的边表示所述边连接的两个结点所表示的医保参保人购买药品的交易之间的关系。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述医保违规对象发现方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述医保违规对象发现方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110277753.7A CN113239240A (zh) | 2021-03-15 | 2021-03-15 | 医保违规对象发现方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110277753.7A CN113239240A (zh) | 2021-03-15 | 2021-03-15 | 医保违规对象发现方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113239240A true CN113239240A (zh) | 2021-08-10 |
Family
ID=77130305
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110277753.7A Pending CN113239240A (zh) | 2021-03-15 | 2021-03-15 | 医保违规对象发现方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113239240A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115689761A (zh) * | 2023-01-03 | 2023-02-03 | 华侨大学 | 一种电子商务流向路径多线程并行检测方法及设备 |
CN117035945A (zh) * | 2023-09-08 | 2023-11-10 | 广东海洋大学 | 基于深度学习的电子信息管理方法及相关设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109544373A (zh) * | 2018-10-30 | 2019-03-29 | 平安科技(深圳)有限公司 | 基于人工智能的医保违规行为检测方法及相关装置 |
CN109615540A (zh) * | 2018-12-13 | 2019-04-12 | 平安医疗健康管理股份有限公司 | 违规购药的识别方法、装置、终端及计算机可读存储介质 |
CN110766557A (zh) * | 2019-09-16 | 2020-02-07 | 平安科技(深圳)有限公司 | 基于图分析的数据异常解析方法、系统和计算机设备 |
CN112435133A (zh) * | 2020-11-18 | 2021-03-02 | 厦门理工学院 | 基于图分析的医保联合欺诈检测方法、装置及设备 |
-
2021
- 2021-03-15 CN CN202110277753.7A patent/CN113239240A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109544373A (zh) * | 2018-10-30 | 2019-03-29 | 平安科技(深圳)有限公司 | 基于人工智能的医保违规行为检测方法及相关装置 |
CN109615540A (zh) * | 2018-12-13 | 2019-04-12 | 平安医疗健康管理股份有限公司 | 违规购药的识别方法、装置、终端及计算机可读存储介质 |
CN110766557A (zh) * | 2019-09-16 | 2020-02-07 | 平安科技(深圳)有限公司 | 基于图分析的数据异常解析方法、系统和计算机设备 |
CN112435133A (zh) * | 2020-11-18 | 2021-03-02 | 厦门理工学院 | 基于图分析的医保联合欺诈检测方法、装置及设备 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115689761A (zh) * | 2023-01-03 | 2023-02-03 | 华侨大学 | 一种电子商务流向路径多线程并行检测方法及设备 |
CN117035945A (zh) * | 2023-09-08 | 2023-11-10 | 广东海洋大学 | 基于深度学习的电子信息管理方法及相关设备 |
CN117035945B (zh) * | 2023-09-08 | 2024-05-14 | 广东海洋大学 | 基于深度学习的电子信息管理方法及相关设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11615288B2 (en) | Secure broker-mediated data analysis and prediction | |
Thornton et al. | Categorizing and describing the types of fraud in healthcare | |
Amponsah et al. | Improving the financial security of national health insurance using cloud-based blockchain technology application | |
Espinosa | Scamming and the reputation of drug dealers on Darknet Markets | |
CN107918905A (zh) | 异常交易识别方法、装置及服务器 | |
Kaper et al. | Healthcare financing systems for increasing the use of tobacco dependence treatment | |
US20050119920A1 (en) | Method and apparatus for automated insurance processing | |
Trueblood et al. | The role of risk preferences in responses to messaging about COVID-19 vaccine take-up | |
CN113239240A (zh) | 医保违规对象发现方法及装置 | |
CN112801498A (zh) | 风险识别模型的训练方法、风险识别方法、装置及设备 | |
CN110766557A (zh) | 基于图分析的数据异常解析方法、系统和计算机设备 | |
Bocoum et al. | The health care burden in rural Burkina Faso: consequences and implications for insurance design | |
CN114782161A (zh) | 识别风险用户的方法、装置、存储介质及电子装置 | |
CN113704731A (zh) | 面向医院的患者异常就医行为检测方法及系统 | |
Haddad Soleymani et al. | Detecting medical prescriptions suspected of fraud using an unsupervised data mining algorithm | |
Singh et al. | Exploring applications of blockchain in healthcare: road map and future directions | |
El Orche et al. | Approach to use ontology based on electronic payment system and machine learning to prevent Fraud | |
CN112991079A (zh) | 多卡共现就医欺诈行为检测方法、系统、云端及介质 | |
Khurjekar et al. | Detection of fraudulent claims using hierarchical cluster analysis | |
Baser et al. | Use of open claims vs closed claims in health outcomes research | |
Hasegawa | Risk‐Coping Measures Against Health Shocks during the Process of Penetration of Health Insurance in Vietnam | |
WO2019223082A1 (zh) | 客户类别分析方法、装置、计算机设备和存储介质 | |
Usharani et al. | Blockchain Technology Use Cases in Healthcare Management: State-of-the-Art Framework and Performance Evaluation | |
CN114912983A (zh) | 购药订单处理方法及装置、电子设备及可读存储介质 | |
Payne et al. | Technology, white-collar cybercrime, and white-collar crime: an analysis of Utah’s white-collar crime registry data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |