CN109635113A - 异常参保人购药数据检测方法、装置、设备及存储介质 - Google Patents
异常参保人购药数据检测方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN109635113A CN109635113A CN201811530814.0A CN201811530814A CN109635113A CN 109635113 A CN109635113 A CN 109635113A CN 201811530814 A CN201811530814 A CN 201811530814A CN 109635113 A CN109635113 A CN 109635113A
- Authority
- CN
- China
- Prior art keywords
- detected
- insured people
- medicine data
- group
- exception
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000003814 drug Substances 0.000 title claims abstract description 322
- 238000001514 detection method Methods 0.000 title claims abstract description 133
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 78
- 238000012549 training Methods 0.000 claims abstract description 101
- 229940079593 drug Drugs 0.000 claims abstract description 65
- 238000000034 method Methods 0.000 claims description 35
- 238000004458 analytical method Methods 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 238000004140 cleaning Methods 0.000 claims description 8
- 238000000465 moulding Methods 0.000 claims description 8
- 238000005406 washing Methods 0.000 claims description 8
- 241000208340 Araliaceae Species 0.000 claims description 7
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims description 7
- 235000003140 Panax quinquefolius Nutrition 0.000 claims description 7
- 235000008434 ginseng Nutrition 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 201000010099 disease Diseases 0.000 description 11
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 11
- 230000006870 function Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000003058 natural language processing Methods 0.000 description 5
- 230000005856 abnormality Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 238000012797 qualification Methods 0.000 description 2
- 208000017667 Chronic Disease Diseases 0.000 description 1
- 241001269238 Data Species 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明属于人工智能领域,提供一种异常参保人购药数据检测方法、装置、设备及存储介质,包括:获取待检测参保人购药数据,该数据包括限额使用率、购药时间和药品单价;将待检测参保人购药数据输入预先训练完成的聚类模型进行聚类,以将待检测参保人购药数据划分为若干个基于不同限额使用率范围的待检测群组;根据各个待检测群组的限额使用率范围从各个待检测群组中确定异常待检测群组,并根据异常待检测群组包含的各个待检测参保人购药数据的购药时间确定待检测时间段;对待检测时间段内异常待检测群组包含的各个待检测参保人购药数据中的药品单价种类个数进行分析,以从所述异常待检测群组中检测出异常参保人购药数据。本发明可提高检测效率。
Description
技术领域
本发明涉及人工智能领域,尤其涉及一种异常参保人购药数据检测方法、装置、设备及存储介质。
背景技术
医保体系中,对于具有慢门(慢性病门诊)资格的参保人,每年均有一定的报销额度,若按照正常疾病治疗方案,部分参保人通常不会使用完限额,但存在参保人为了私利通过取药凑数的方式使用报销额度的现象,造成医保基金的浪费。为保障医保基金的合理支出,需要对具有慢门资格的参保人的医保数据进行异常检测,由于需要检测的数据量大,现有依靠人工检测的方式,检测速度较慢,效率很低。
发明内容
本发明的主要目的在于提供一种异常参保人购药数据检测方法、装置、设备及存储介质,旨在解决现有依靠人工检测参保人医保数据的方式效率低的技术问题。
为实现上述目的,本发明提供一种异常参保人购药数据检测方法,所述异常参保人购药数据检测方法包括以下步骤:
获取待检测参保人购药数据,其中,所述待检测参保人购药数据包括限额使用率、购药时间和药品单价;
将所述待检测参保人购药数据输入预先训练完成的聚类模型进行聚类,以将所述待检测参保人购药数据划分为若干个基于不同限额使用率范围的待检测群组;
根据各个待检测群组的限额使用率范围从各个待检测群组中确定异常待检测群组,并根据所述异常待检测群组包含的各个待检测参保人购药数据的购药时间,确定待检测时间段;
对所述待检测时间段内所述异常待检测群组包含的各个待检测参保人购药数据中的药品单价种类个数进行分析,以从所述异常待检测群组中检测出异常参保人购药数据。
可选地,所述获取待检测参保人购药数据的步骤之前,包括:
获取待检测参保人医保数据;
将所述待检测参保人医保数据输入预设清洗模型依次进行数据切片、数据分词、文本转换、字段填充的清洗处理,得到待检测参保人购药数据。
可选地,所述获取待检测参保人购药数据的步骤之前,还包括:
采用无监督学习方法训练聚类模型。
可选地,所述所述采用无监督学习方法训练聚类模型的步骤包括:
获取用于训练聚类模型的参保人购药数据;
根据用于训练聚类模型的参保人购药数据,建立用于训练聚类模型的训练样本;
根据所述训练样本,采用预设无监督学习聚类算法训练聚类模型。
可选地,所述根据所述训练样本,采用预设无监督学习聚类算法训练聚类模型的步骤之后,包括:
根据预设成熟度计算公式mature=ε*rate计算训练完成的聚类模型的成熟度,其中,mature表示成熟度,rate表示准确率,ε表示权重值;
判断训练完成的聚类模型的成熟度是否达到预设成熟度阈值;
若训练完成的聚类模型的成熟度达到预设成熟度阈值,则执行步骤:获取待检测参保人购药数据。
可选地,所述根据各个待检测群组的限额使用率范围从各个待检测群组中确定异常待检测群组的步骤包括:
分别将各个待检测群组对应的限额使用率范围与预设限额使用率阈值进行比对;
将限额使用率范围下限值超出预设限额使用率阈值的待检测群组确定为异常待检测群组。
可选地,所述对所述待检测时间段内所述异常待检测群组包含的各个待检测参保人购药数据中的药品单价种类个数进行分析,以从所述异常待检测群组中检测出异常参保人购药数据的步骤包括:
分别统计所述异常待检测群组包含的各个待检测参保人购药数据中所述待检测时间段内的药品单价种类个数;
分别将统计的各个药品单价种类个数与预设个数阈值进行比对;
对于所述异常待检测群组中药品单价种类个数超出预设个数阈值的待检测参保人购药数据转由人工进行二次检测,以检测出异常参保人购药数据。
此外,为实现上述目的,本发明还提供异常参保人购药数据检测装置,所述异常参保人购药数据检测装置包括:
第一获取模块,用于获取待检测参保人购药数据,其中,所述待检测参保人购药数据包括限额使用率和购药时间;
聚类模块,用于将所述待检测参保人购药数据输入预先训练完成的聚类模型进行聚类,以将所述待检测参保人购药数据划分为若干个基于不同限额使用率范围的待检测群组;
确定模块,用于根据各个待检测群组的限额使用率范围从各个待检测群组中确定异常待检测群组,并根据所述异常待检测群组包含的各个待检测参保人购药数据的购药时间,确定待检测时间段;
分析模块,用于对所述待检测时间段内所述异常待检测群组包含的各个待检测参保人购药数据中的药品单价种类个数进行分析,以从所述异常待检测群组中检测出异常参保人购药数据。
此外,为实现上述目的,本发明还提供一种异常参保人购药数据检测设备,所述异常参保人购药数据检测设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的异常参保人购药数据检测程序,其中所述异常参保人购药数据检测程序被所述处理器执行时,实现如上述的异常参保人购药数据检测方法的步骤。
此外,为实现上述目的,本发明还提供一种存储介质,所述存储介质上存储有异常参保人购药数据检测程序,其中所述异常参保人购药数据检测程序被处理器执行时,实现如上述的异常参保人购药数据检测方法的步骤。
本发明提供一种异常参保人购药数据检测方法,从限额使用率的角度,基于聚类模型,先将大量的待检测参保人购药数据划分为若干个基于不同限额使用率范围的待检测群组,然后基于各个待检测群组的限额使用率范围确定异常待检测群组,并根据异常待检测群组包含的各个待检测参保人购药数据的购药时间,确定待检测时间段;之后,基于待检测时间段,从药品单价种类个数的角度,对异常待检测群组包含的各个待检测参保人购药数据进行分析,从而从异常待检测群组中检测出以购药凑数消耗医保额度的异常参保人购药数据,相比于仅依赖人工检测参保人医保数据的传统方式,不仅可以提高检测效率,降低了难度,还为有效检测出以购药凑数消耗医保额度的异常参保人购药数据提供了精确的分析依据,提高了检测的准确性。
附图说明
图1为本发明实施例方案中涉及的异常参保人购药数据检测设备的硬件结构示意图;
图2为本发明异常参保人购药数据检测方法第一实施例的流程示意图;
图3为本发明异常参保人购药数据检测方法第一实施例的细化流程示意图;
图4为本发明异常参保人购药数据检测装置第一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例涉及的异常参保人购药数据检测方法主要应用于异常参保人购药数据检测设备,该异常参保人购药数据检测设备可以是个人计算机(personal computer,PC)、服务器等具有数据处理功能的设备。
参照图1,图1为本发明实施例方案中涉及的异常参保人购药数据检测设备的硬件结构示意图。本发明实施例中,异常参保人购药数据检测设备可以包括处理器1001(例如中央处理器Central Processing Unit,CPU),通信总线1002,用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信;用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard);网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真WIreless-FIdelity,WI-FI接口);存储器1005可以是高速随机存取存储器(random access memory,RAM),也可以是稳定的存储器(non-volatilememory),例如磁盘存储器,存储器1005可选的还可以是独立于前述处理器1001的存储装置。本领域技术人员可以理解,图1中示出的硬件结构并不构成对本发明的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
继续参照图1,图1中作为一种存储介质的存储器1005可以包括操作系统、网络通信模块以及异常参保人购药数据检测程序。在图1中,网络通信模块可用于连接人社系统,与人社系统进行数据通信;而处理器1001可以调用存储器1005中存储的异常参保人购药数据检测程序,并执行本发明各实施例提供的异常参保人购药数据检测方法。
本发明实施例提供了一种异常参保人购药数据检测方法。
参照图2,图2为本发明异常参保人购药数据检测方法第一实施例的流程示意图。
本实施例中,所述异常参保人购药数据检测方法应用于检测系统,所述检测系统搭载于异常参保人购药数据检测设备中,比如检测系统可以搭载于服务器或PC等设备中,检测系统对接人社系统。所述异常参保人购药数据检测方法包括以下步骤:
步骤S10,获取待检测参保人购药数据;
在实际中,参保人的医保数据都会上传至人社系统,保存至人社系统的数据库中。参保人的医保数据包括参保人信息(比如姓名、性别、年龄、身份证号码等)、就诊时间、就诊结果、疾病信息、疾病用药、药品单价、药品总费用、购药时间、限额使用率等。本实施例提出一种异常参保人购药数据检测方法,通过训练完成的聚类模型,从限额使用率和药品单价种类个数的角度,对参保人医保数据中的购药数据进行异常检测,以判断其中是否存在突击购药凑数以消耗完医保报销额度的异常数据。
在本实施例中,步骤S10之前,还包括获取待检测参保人医保数据的步骤,检测系统可以从人社系统数据库中获取需要检测的参保人医保数据(定义为待检测参保人医保数据)。应当理解,由于医保报销额度通常是以一年为周期计算的,在本实施例中,待检测参保人医保数据是参保人在一年内的医保数据。
将所述待检测参保人医保数据输入预设清洗模型依次进行数据切片、数据分词、文本转换、字段填充的清洗处理,得到待检测参保人购药数据。
由于参保人医保数据中包括购药数据、购药数据、疾病数据等几部分信息,为了提高检测的效率和准确性,需要先对待检测参保人医保数据进行预处理,从而仅从待检测参保人医保数据中的购药数据入手进行异常检测。具体的,本实施例检测系统中预先设置有清洗模型,该清洗模型采用了NLP(natural language processing,自然语言处理)技术,NLP技术可自动化处理大量文本数据,从中提炼出有价值的信息。检测系统可以利用该预设清洗模型,通过NLP技术对待检测参保人医保数据进行清洗处理,清洗处理的过程如下:
a、数据切片,即,去除待检测参保人医保数据中的不相关数据,也就是去除医保数据中的性别、年龄、身份证号码、就诊时间、就诊结果、疾病信息字段的数据;
b、数据分词,即,将数据切片后的待检测参保人医保数据拆分为各个独立的词,得到基于参保人姓名、疾病用药、药品单价、药品总费用、购药时间和限额使用率的独立字段的数据;
c、文本转换,即,将数据分词后的待检测参保人医保数据中的英文转换为中文;
d、字段填充,即,预先设置标准化模板,该标准化模板包括了为进行异常检测定义的需求数据类型(即需要从文本转换后的购药数据中得到什么数据)、以及需求数据对应的需求字段名称。将文本转换后的待检测参保人医保数据填充至标准化模板中,即得到进行检测时的需求数据(定义为待检测参保人购药数据),待检测参保人购药数据包括参保人姓名、疾病用药、药品单价、药品总费用、购药时间和限额使用率。
在本实施例中,步骤S10之前,还需预先训练聚类模型。在一种优选的实现方式中,可以采用无监督学习方法训练聚类模型。
具体地,参照图3,采用无监督学习方法训练聚类模型的步骤可以包括:
步骤S50,获取用于训练聚类模型的参保人购药数据;
即,先获取用于训练聚类模型的参保人购药数据。本步骤中,检测系统可以从人社系统的数据库中获取某一时间段内的历史参保人医保数据,作为训练聚类模型的参保人医保数据,然后同样先将用于训练聚类模型的参保人医保数据输入预设清洗模型中依次进行数据切片、数据分词、文本转换、字段填充的清洗处理,得到用于训练聚类模型的需求数据,也就是得到用于训练聚类模型的参保人购药数据,用于训练聚类模型的参保人购药数据包括参保人姓名、疾病用药、药品单价、药品总费用、购药时间和限额使用率。
步骤S60,根据用于训练聚类模型的参保人购药数据,建立用于训练聚类模型的训练样本;
进一步地,根据用于训练聚类模型的参保人购药数据,建立用于训练聚类模型的训练样本。本步骤中,根据用于训练聚类模型的参保人购药数据,建立用于训练聚类模型的训练样本的方式例如,该训练样本是一个集合,集合里面的元素是一个个预处理后的参保人购药数据样例:
训练样本={购药数据样例1,购药数据样例2,...,购药数据n}
={(姓名1,疾病用药1,药品单价1、药品总费用1,购药时间1,限额使用率1),(姓名2,疾病用药2,药品单价2、药品总费用2,购药时间2,限额使用率2)...,(姓名n,疾病用药n,药品单价n,药品总费用n,购药时间n,限额使用率n)}。
步骤S70,根据所述训练样本,采用预设无监督学习聚类算法训练聚类模型。
进一步地,根据训练样本,采用预设无监督学习聚类算法训练聚类模型。本步骤中,预设无监督学习聚类算法可以是K-means算法。K-means算法属于无监督学习,是很典型的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大,该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。通过K-means算法训练聚类模型的过程如下:
A、从训练样本中任意选择k个限额使用率作为初始聚类中心;
B、计算训练样本中每个购药数据样例的限额使用率与各个初始聚类中心之间的距离;
C、将训练样本中每个购药数据样例分配给对应限额使用率距离最近的初始聚类中心,当训练样本中的全部购药数据样例分配完成时,得到k个群组;
D、根据每个群组中现有购药数据样例的限额使用率重新计算每个群组的聚类中心,计算训练样本中每个购药数据样例的限额使用率与聚类中心的距离,并将训练样本中每个购药数据样例分配给对应限额使用率距离最近的聚类中心,当训练样本中的全部购药数据样例分配完成时,得到k个群组;
E、重复步骤D,直至满足终止条件,表示聚类模型训练模型检测完成。
即,检测系统从训练样本中的n个购药数据样例的限额使用率中任意选择k个限额使用率作为初始聚类中心,计算训练样本中每个购药数据样例的限额使用率与各个初始聚类中心之间的距离,把训练样本中每个购药数据样例分配给对应限额使用率距离最近的聚类中心(聚类中心以及分配给它们的对象就代表一个聚类),一旦训练样本中的全部购药数据样例都被分配了,每个聚类的聚类中心会根据聚类中现有的购药数据样例被重新计算,这个过程将不断重复直到满足终止条件:(1)没有对象被重新分配给不同的聚类,(2)没有聚类中心再发生变化,(3)误差平方和局部最小,三者任选其一。如此,通过K-means算法对训练样本进行聚类分析,可以将训练样本划分为k个基于不同限额使用率范围的群组,得到训练完成的聚类模型。当然,也可以采用无监督学习的其他聚类算法训练聚类模型,本发明对训练聚类模型的聚类算法不作限定。
步骤S20,将所述待检测参保人购药数据输入预先训练完成的聚类模型进行聚类,以将所述待检测参保人购药数据划分为若干个基于不同限额使用率范围的待检测群组;
聚类模型训练完成之后,本步骤中,检测系统将获取的待检测参保人购药数据输入预先训练完成的聚类模型,从而对待检测参保人购药数据进行聚类,可以将待检测参保人购药数据划分为若干个基于不同限额使用率范围的待检测群组。
步骤S30,根据各个待检测群组的限额使用率范围从各个待检测群组中确定异常待检测群组,并根据所述异常待检测群组包含的各个待检测参保人购药数据的购药时间,确定待检测时间段;
得到若干个基于不同限额使用率范围的待检测群组之后,本步骤中,检测系统基于各个待检测群组的限额使用率范围从各个待检测群组中确定异常待检测群组。
在一种优选的实现方式中,所述根据各个待检测群组的限额使用率范围从各个待检测群组中确定异常待检测群组的步骤包括:
分别将各个待检测群组对应的限额使用率范围与预设限额使用率阈值进行比对;
由于人工检测经验中,限额使用率相对来说能更好的反映实际情况,出现突击购药以消耗完医保报销额度情况的概率越高,由此,本实施例中检测系统可以结合人工检测经验而预先设置限额使用率阈值作为判定阈值,可灵活设置(比如90%),此处不作限定。在本步骤中,检测系统分别将各个待检测群组对应的限额使用率范围与预设限额使用率阈值进行比对。
将限额使用率范围下限值超出预设限额使用率阈值的待检测群组确定为异常待检测群组。
在本步骤中,检测系统分别将各个待检测群组对应的限额使用率范围与预设限额使用率阈值进行比对之后,对于限额使用率范围下限值超出预设限额使用率阈值的待检测群组,则作为重点检测群组,也就是确定为异常待检测群组。
在步骤S30中,检测系统还基于异常待检测群组包含的各个待检测参保人购药数据的购药时间,确定待检测时间段。由于实际中参保人为了私利而突击购药消耗医保额度的现象多发生在下半年,为了提高检测的效率,并不会对参保人一整年的购药数据进行检测,而只将年底的购药数据进行检测。由此,可基于异常待检测群组包含的各个待检测参保人购药数据的购药时间,将年底时间段(比如10月至12月)作为需要检测的时间段(定义为待检测时间)。
步骤S40,对所述待检测时间段内所述异常待检测群组包含的各个待检测参保人购药数据中的药品单价种类个数进行分析,以从所述异常待检测群组中检测出异常参保人购药数据。
由于每一种药品对应一个单价,单价种类越多,药品种类越多,相比于核对药品的名称来检测为消耗医保额度而买药凑数的情况,从单价种类个数的角度来检测相对更容易,从而能提高检测效率,且能保证检测准确性。在本步骤中,检测系统确定异常待检测群组,并确定待检测时间段之后,对异常待检测群组包含的各个待检测参保人购药数据中待检测时间段内的药品单价种类个数进行分析,从而从待异常待检测群组中检测出通过购药凑数消耗医保报销额度的异常数据。
在一种优选的实现方式中,所述步骤S40,可以包括:
分别统计所述异常待检测群组包含的各个待检测参保人购药数据中所述待检测时间段内的药品单价种类个数;
本步骤中,检测系统统计述异常待检测群组包含的各个待检测参保人购药数据中待检测时间段内的药品单价种类个数。
分别将统计的各个药品单价种类个数与预设个数阈值进行比对;
然后分别将统计的各个药品单价种类个数与预设个数阈值进行比对,其中,该个数阈值是结合人工检测经验而预先设置的判定阈值,可根据实际灵活设置,此处不作限定。
对于所述异常待检测群组中药品单价种类个数超出预设个数阈值的待检测参保人购药数据转由人工进行二次检测,以检测出异常参保人购药数据。
为了提高检测的准确性,本步骤中,对于异常待检测群组中药品单价种类个数超出预设个数阈值的待检测参保人购药数据,则转由人工进行二次检测,由人工仔细核对其中的明细,从而检测出以购药凑数消耗医保额度的异常参保人购药数据。
通过上述方式,本实施例先从待检测参保人医保数据中提取出待检测参保人购药数据,从限额使用率的角度出发,基于聚类模型,可以先将大量的待检测参保人购药数据划分为若干个基于不同限额使用率范围的待检测群组,然后基于各个待检测群组的限额使用率范围,先确定异常待检测群组,并根据异常待检测群组包含的各个待检测参保人购药数据的购药时间,确定待检测时间段;之后,从单价种类个数的角度,对异常待检测群组包含的各个待检测参保人购药数据进行分析,从而从异常待检测群组中检测出以购药凑数消耗医保额度的异常参保人购药数据。相比于仅依赖人工检测参保人医保数据的传统方式,不仅可以提高检测效率,降低了难度,还为有效检测出以购药凑数消耗医保额度的异常参保人购药数据提供了精确的分析依据,提高了检测的准确性。
之后,检测系统可以将检测出的异常数据发送至人社系统,供人社系统针对相应的医保报销费用作出相应决策,可利于医保基金的有效管控。
在本实施例中,获取待检测参保人购药数据,其中,所述待检测参保人购药数据包括限额使用率、购药时间和药品单价;将所述待检测参保人购药数据输入预先训练完成的聚类模型进行聚类,以将所述待检测参保人购药数据划分为若干个基于不同限额使用率范围的待检测群组;根据各个待检测群组的限额使用率范围从各个待检测群组中确定异常待检测群组,并根据所述异常待检测群组包含的各个待检测参保人购药数据的购药时间,确定待检测时间段;对所述待检测时间段内所述异常待检测群组包含的各个待检测参保人购药数据中的药品单价种类个数进行分析,以从所述异常待检测群组中检测出异常参保人购药数据。通过上述方式,本实施例从限额使用率的角度,基于聚类模型,先将大量的待检测参保人购药数据划分为若干个基于不同限额使用率范围的待检测群组,然后基于各个待检测群组的限额使用率范围确定异常待检测群组,并根据异常待检测群组包含的各个待检测参保人购药数据的购药时间,确定待检测时间段;之后,基于待检测时间段,从药品单价种类个数的角度,对异常待检测群组包含的各个待检测参保人购药数据进行分析,从而从异常待检测群组中检测出以购药凑数消耗医保额度的异常参保人购药数据,相比于仅依赖人工检测参保人医保数据的传统方式,不仅可以提高检测效率,降低了难度,还为有效检测出以购药凑数消耗医保额度的异常参保人购药数据提供了精确的分析依据,提高了检测的准确性。
进一步地,基于第一实施例提出本发明异常参保人购药数据检测方法的第二实施例。异常参保人购药数据检测方法的第一实施例与异常参保人购药数据检测方法的第二实施例的区别在于,所述步骤S70之后,包括:
根据预设成熟度计算公式mature=ε*rate计算训练完成的聚类模型的成熟度,其中,mature表示成熟度,rate表示准确率,ε表示权重值;
即,聚类模型训练完成后,并不立即投入使用,而是先检测训练完成的聚类模型的成熟度,可通过成熟度计算公式mature=ε*rate计算得到聚类模型的成熟度,其中,mature表示训练完成的聚类模型的成熟度,rate表示聚类模型的准确率(也就是样本检测结果与原始的差距),ε表示权重值(可根据原始进行设定)。
判断训练完成的聚类模型的成熟度是否达到预设成熟度阈值;
之后,将训练完成的聚类模型的成熟度与预设成熟度阈值进行比对,其中,该成熟度阈值是根据原始需要预先设定的,比如80%。
若训练完成的聚类模型的成熟度达到预设成熟度阈值,则执行步骤:获取待检测参保人购药数据。
如果训练完成的聚类模型的成熟度大于预设成熟度阈值,则判定训练完成的聚类模型的成熟度满足条件,可以投入使用,即可获取原始待检测参保人购药数据,再按照第一实施例中所述的处理方法对待检测参保人购药数据进行分析检测。
在本实施例中,聚类模型训练完成后需先检测其对应的成熟度,当训练完成的聚类成熟度满足条件时才用于分析需要检测的参保人购药数据,从而提高检测准确度。
此外,本发明实施例还提供一种异常参保人购药数据检测装置。
参照图4,图4为本发明异常参保人购药数据检测装置第一实施例的功能模块示意图。
本实施例中,所述异常参保人购药数据检测装置包括:
第一获取模块10,用于获取待检测参保人购药数据,其中,所述待检测参保人购药数据包括限额使用率和购药时间;
聚类模块20,用于将所述待检测参保人购药数据输入预先训练完成的聚类模型进行聚类,以将所述待检测参保人购药数据划分为若干个基于不同限额使用率范围的待检测群组;
确定模块30,用于根据各个待检测群组的限额使用率范围从各个待检测群组中确定异常待检测群组,并根据所述异常待检测群组包含的各个待检测参保人购药数据的购药时间,确定待检测时间段;
分析模块40,用于对所述待检测时间段内所述异常待检测群组包含的各个待检测参保人购药数据中的药品单价种类个数进行分析,以从所述异常待检测群组中检测出异常参保人购药数据。
其中,上述异常参保人购药数据检测装置的各虚拟功能模块存储于图1所示异常参保人购药数据检测设备的存储器1005中,用于实现异常参保人购药数据检测程序的所有功能;各模块被处理器1001执行时,实现了从限额使用率和药品单价种类个数的角度,基于聚类模型对大量的参保人购药数据进行分析检测,不仅可以提高检测效率,降低检测难度,还为有效检测出以购药凑数消耗医保额度的异常参保人购药数据提供了精确的分析依据,提高了检测的准确性。
进一步的,所述异常参保人购药数据检测装置还包括:
第二获取模块,用于获取待检测参保人医保数据;
清洗处理模块,用于将所述待检测参保人医保数据输入预设清洗模型依次进行数据切片、数据分词、文本转换、字段填充的清洗处理,得到待检测参保人购药数据。
进一步的,所述异常参保人购药数据检测装置还包括:
训练模块,用于采用无监督学习方法训练聚类模型。
进一步的,所述第一训练模块包括:
获取单元,用于获取用于训练聚类模型的参保人购药数据;
建立单元,用于根据用于训练聚类模型的参保人购药数据,建立用于训练聚类模型的训练样本;
训练单元,用于根据所述训练样本,采用预设无监督学习聚类算法训练聚类模型。
进一步的,所述异常参保人购药数据检测装置还包括:
计算模块,用于根据预设成熟度计算公式mature=ε*rate计算训练完成的聚类模型的成熟度,其中,mature表示成熟度,rate表示准确率,ε表示权重值;
判断模块,用于判断训练完成的聚类模型的成熟度是否达到预设成熟度阈值;
第三获取模块,用于若训练完成的聚类模型的成熟度达到预设成熟度阈值,则执行步骤:获取待检测参保人购药数据。
进一步的,所述确定模块30包括:
第一比对单元,用于分别将各个待检测群组对应的限额使用率范围与预设限额使用率阈值进行比对;
确定单元,用于将限额使用率范围下限值超出预设限额使用率阈值的待检测群组确定为异常待检测群组。
进一步的,所述分析模块40包括:
统计单元,用于分别统计所述异常待检测群组包含的各个待检测参保人购药数据中所述待检测时间段内的药品单价种类个数;
第二比对单元,用于分别将统计的各个药品单价种类个数与预设个数阈值进行比对;
检测单元,用于对于所述异常待检测群组中药品单价种类个数超出预设个数阈值的待检测参保人购药数据转由人工进行二次检测,以检测出异常参保人购药数据。
其中,上述异常参保人购药数据检测装置中各个模块的功能实现与上述异常参保人购药数据检测方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。
此外,本发明实施例还提供一种存储介质。
本发明存储介质上存储有异常参保人购药数据检测程序,其中所述异常参保人购药数据检测程序被处理器执行时,实现如上述的异常参保人购药数据检测方法的步骤。
其中,异常参保人购药数据检测程序被执行时所实现的方法可参照本发明异常参保人购药数据检测方法的各个实施例,此处不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种异常参保人购药数据检测方法,其特征在于,所述异常参保人购药数据检测方法包括以下步骤:
获取待检测参保人购药数据,其中,所述待检测参保人购药数据包括限额使用率、购药时间和药品单价;
将所述待检测参保人购药数据输入预先训练完成的聚类模型进行聚类,以将所述待检测参保人购药数据划分为若干个基于不同限额使用率范围的待检测群组;
根据各个待检测群组的限额使用率范围从各个待检测群组中确定异常待检测群组,并根据所述异常待检测群组包含的各个待检测参保人购药数据的购药时间,确定待检测时间段;
对所述待检测时间段内所述异常待检测群组包含的各个待检测参保人购药数据中的药品单价种类个数进行分析,以从所述异常待检测群组中检测出异常参保人购药数据。
2.如权利要求1所述的异常参保人购药数据检测方法,其特征在于,所述获取待检测参保人购药数据的步骤之前,包括:
获取待检测参保人医保数据;
将所述待检测参保人医保数据输入预设清洗模型依次进行数据切片、数据分词、文本转换、字段填充的清洗处理,得到待检测参保人购药数据。
3.如权利要求1所述的异常参保人购药数据检测方法,其特征在于,所述获取待检测参保人购药数据的步骤之前,还包括:
采用无监督学习方法训练聚类模型。
4.如权利要求3所述的异常参保人购药数据检测方法,其特征在于,所述采用无监督学习方法训练聚类模型的步骤包括:
获取用于训练聚类模型的参保人购药数据;
根据用于训练聚类模型的参保人购药数据,建立用于训练聚类模型的训练样本;
根据所述训练样本,采用预设无监督学习聚类算法训练聚类模型。
5.如权利要求4所述的异常参保人购药数据检测方法,其特征在于,所述根据所述训练样本,采用预设无监督学习聚类算法训练聚类模型的步骤之后,包括:
根据预设成熟度计算公式mature=ε*rate计算训练完成的聚类模型的成熟度,其中,mature表示成熟度,rate表示准确率,ε表示权重值;
判断训练完成的聚类模型的成熟度是否达到预设成熟度阈值;
若训练完成的聚类模型的成熟度达到预设成熟度阈值,则执行步骤:获取待检测参保人购药数据。
6.如权利要求1至5中任一项所述的异常参保人购药数据检测方法,其特征在于,所述根据各个待检测群组的限额使用率范围从各个待检测群组中确定异常待检测群组的步骤包括:
分别将各个待检测群组对应的限额使用率范围与预设限额使用率阈值进行比对;
将限额使用率范围下限值超出预设限额使用率阈值的待检测群组确定为异常待检测群组。
7.如权利要求1至5中任一项所述的异常参保人购药数据检测方法,其特征在于,所述对所述待检测时间段内所述异常待检测群组包含的各个待检测参保人购药数据中的药品单价种类个数进行分析,以从所述异常待检测群组中检测出异常参保人购药数据的步骤包括:
分别统计所述异常待检测群组包含的各个待检测参保人购药数据中所述待检测时间段内的药品单价种类个数;
分别将统计的各个药品单价种类个数与预设个数阈值进行比对;
对于所述异常待检测群组中药品单价种类个数超出预设个数阈值的待检测参保人购药数据转由人工进行二次检测,以检测出异常参保人购药数据。
8.一种异常参保人购药数据检测装置,其特征在于,所述异常参保人购药数据检测装置包括:
第一获取模块,用于获取待检测参保人购药数据,其中,所述待检测参保人购药数据包括限额使用率和购药时间;
聚类模块,用于将所述待检测参保人购药数据输入预先训练完成的聚类模型进行聚类,以将所述待检测参保人购药数据划分为若干个基于不同限额使用率范围的待检测群组;
确定模块,用于根据各个待检测群组的限额使用率范围从各个待检测群组中确定异常待检测群组,并根据所述异常待检测群组包含的各个待检测参保人购药数据的购药时间,确定待检测时间段;
分析模块,用于对所述待检测时间段内所述异常待检测群组包含的各个待检测参保人购药数据中的药品单价种类个数进行分析,以从所述异常待检测群组中检测出异常参保人购药数据。
9.一种异常参保人购药数据检测设备,其特征在于,所述异常参保人购药数据检测设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的异常参保人购药数据检测程序,其中所述异常参保人购药数据检测程序被所述处理器执行时,实现如权利要求1至7中任一项所述的异常参保人购药数据检测方法的步骤。
10.一种存储介质,其特征在于,所述存储介质上存储有异常参保人购药数据检测程序,其中所述异常参保人购药数据检测程序被处理器执行时,实现如权利要求1至7中任一项所述的异常参保人购药数据检测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811530814.0A CN109635113A (zh) | 2018-12-13 | 2018-12-13 | 异常参保人购药数据检测方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811530814.0A CN109635113A (zh) | 2018-12-13 | 2018-12-13 | 异常参保人购药数据检测方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109635113A true CN109635113A (zh) | 2019-04-16 |
Family
ID=66073868
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811530814.0A Pending CN109635113A (zh) | 2018-12-13 | 2018-12-13 | 异常参保人购药数据检测方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109635113A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111739648A (zh) * | 2020-06-24 | 2020-10-02 | 平安医疗健康管理股份有限公司 | 数据异常检测方法、装置、电子设备及存储介质 |
CN112289403A (zh) * | 2020-10-19 | 2021-01-29 | 浙江大学山东工业技术研究院 | 一种基于两阶段筛查流程的医保异常购药的检测方法及装置 |
CN112991075A (zh) * | 2021-02-04 | 2021-06-18 | 浙江大学山东工业技术研究院 | 一种基于FP-growth及图网络的套餐式购药异常检测方法 |
CN113537363A (zh) * | 2021-07-20 | 2021-10-22 | 北京奇艺世纪科技有限公司 | 一种异常对象检测方法及装置、电子设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104537764A (zh) * | 2014-12-31 | 2015-04-22 | 浙江大学 | 一种医保卡异常使用的检测方法和检测系统 |
CN105279382A (zh) * | 2015-11-10 | 2016-01-27 | 成都数联易康科技有限公司 | 一种医疗保险异常数据在线智能检测方法 |
CN107133437A (zh) * | 2017-03-03 | 2017-09-05 | 平安医疗健康管理股份有限公司 | 监控药品使用的方法及装置 |
CN107657536A (zh) * | 2017-02-20 | 2018-02-02 | 平安科技(深圳)有限公司 | 社保欺诈行为的识别方法和装置 |
CN108921710A (zh) * | 2018-06-08 | 2018-11-30 | 东莞迪赛软件技术有限公司 | 医保异常检测的方法及系统 |
-
2018
- 2018-12-13 CN CN201811530814.0A patent/CN109635113A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104537764A (zh) * | 2014-12-31 | 2015-04-22 | 浙江大学 | 一种医保卡异常使用的检测方法和检测系统 |
CN105279382A (zh) * | 2015-11-10 | 2016-01-27 | 成都数联易康科技有限公司 | 一种医疗保险异常数据在线智能检测方法 |
CN107657536A (zh) * | 2017-02-20 | 2018-02-02 | 平安科技(深圳)有限公司 | 社保欺诈行为的识别方法和装置 |
CN107133437A (zh) * | 2017-03-03 | 2017-09-05 | 平安医疗健康管理股份有限公司 | 监控药品使用的方法及装置 |
CN108921710A (zh) * | 2018-06-08 | 2018-11-30 | 东莞迪赛软件技术有限公司 | 医保异常检测的方法及系统 |
Non-Patent Citations (1)
Title |
---|
唐璟宜,孙有坤,周海林: "医保欺诈行为的主动发现", 《合作经济与科技》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111739648A (zh) * | 2020-06-24 | 2020-10-02 | 平安医疗健康管理股份有限公司 | 数据异常检测方法、装置、电子设备及存储介质 |
CN112289403A (zh) * | 2020-10-19 | 2021-01-29 | 浙江大学山东工业技术研究院 | 一种基于两阶段筛查流程的医保异常购药的检测方法及装置 |
CN112991075A (zh) * | 2021-02-04 | 2021-06-18 | 浙江大学山东工业技术研究院 | 一种基于FP-growth及图网络的套餐式购药异常检测方法 |
CN113537363A (zh) * | 2021-07-20 | 2021-10-22 | 北京奇艺世纪科技有限公司 | 一种异常对象检测方法及装置、电子设备及存储介质 |
CN113537363B (zh) * | 2021-07-20 | 2023-12-15 | 北京奇艺世纪科技有限公司 | 一种异常对象检测方法及装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109635113A (zh) | 异常参保人购药数据检测方法、装置、设备及存储介质 | |
CN110781298B (zh) | 药品分类方法、装置、计算机设备及存储介质 | |
CN111008640A (zh) | 图像识别模型训练及图像识别方法、装置、终端及介质 | |
CN111080360B (zh) | 行为预测方法、模型训练方法、装置、服务器及存储介质 | |
CN109460514A (zh) | 用于推送信息的方法和装置 | |
CN109712711A (zh) | 基于机器学习的健康评估方法、装置、电子设备及介质 | |
CN107194158A (zh) | 一种基于图像识别的疾病辅助诊断方法 | |
CN107689008A (zh) | 一种用户投保行为预测的方法及装置 | |
CN109256192A (zh) | 一种基于神经网络的大学生心理行为异动监测预警方法 | |
CN107895168A (zh) | 数据处理的方法、数据处理的装置及计算机可读存储介质 | |
CN111028016A (zh) | 销量数据预测方法、装置以及相关设备 | |
CN110210194A (zh) | 电子合同显示方法、装置、电子设备及存储介质 | |
CN108764710A (zh) | 教学质量评价方法及装置 | |
CN110458594A (zh) | 一种基于用户权重的网络调查问卷生成方法和装置 | |
CN109615504A (zh) | 产品推荐方法、装置、电子设备和计算机可读存储介质 | |
CN110473049A (zh) | 理财产品推荐方法、装置、设备及计算机可读存储介质 | |
CN117557331A (zh) | 一种产品推荐方法、装置、计算机设备及存储介质 | |
CN109657059A (zh) | 异常参保人购药数据检测方法、装置、设备及存储介质 | |
CN118247544A (zh) | 头颅mri图像的分类方法、装置、计算机设备及存储介质 | |
CN117457159A (zh) | 医疗主体推荐方法、装置、计算机设备及存储介质 | |
CN111340540A (zh) | 广告推荐模型的监控方法、推荐方法及装置 | |
CN113821641B (zh) | 基于权重分配的药品分类的方法、装置、设备及存储介质 | |
CN115691793A (zh) | 一种舌象数据处理方法、装置及相关设备 | |
CN117251558A (zh) | 信息推荐方法、装置、设备及存储介质 | |
CN112116441B (zh) | 金融风险分类模型的训练方法、分类方法、装置及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190416 |