CN109583510A - 病种违规用药检测方法、装置、设备及计算机存储介质 - Google Patents
病种违规用药检测方法、装置、设备及计算机存储介质 Download PDFInfo
- Publication number
- CN109583510A CN109583510A CN201811530941.0A CN201811530941A CN109583510A CN 109583510 A CN109583510 A CN 109583510A CN 201811530941 A CN201811530941 A CN 201811530941A CN 109583510 A CN109583510 A CN 109583510A
- Authority
- CN
- China
- Prior art keywords
- detected
- diagnosis
- treatment data
- disease
- insured people
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 201000010099 disease Diseases 0.000 title claims abstract description 159
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 159
- 238000001514 detection method Methods 0.000 title claims abstract description 120
- 239000003814 drug Substances 0.000 title claims abstract description 115
- 229940079593 drug Drugs 0.000 title claims abstract description 111
- 238000003745 diagnosis Methods 0.000 claims abstract description 198
- 238000012549 training Methods 0.000 claims abstract description 137
- 238000000034 method Methods 0.000 claims abstract description 32
- 238000000465 moulding Methods 0.000 claims abstract description 21
- 238000005406 washing Methods 0.000 claims abstract description 21
- 230000008569 process Effects 0.000 claims abstract description 14
- 230000002159 abnormal effect Effects 0.000 claims description 15
- 238000004458 analytical method Methods 0.000 claims description 14
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000004140 cleaning Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 6
- 238000007689 inspection Methods 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 claims description 4
- 241000208340 Araliaceae Species 0.000 claims description 3
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims description 3
- 235000003140 Panax quinquefolius Nutrition 0.000 claims description 3
- 235000008434 ginseng Nutrition 0.000 claims description 3
- 230000005856 abnormality Effects 0.000 abstract description 5
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000012545 processing Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000003058 natural language processing Methods 0.000 description 5
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000008520 organization Effects 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 206010029164 Nephrotic syndrome Diseases 0.000 description 3
- 208000009928 nephrosis Diseases 0.000 description 3
- 231100001027 nephrosis Toxicity 0.000 description 3
- 230000035800 maturation Effects 0.000 description 2
- 238000003032 molecular docking Methods 0.000 description 2
- 102000009027 Albumins Human genes 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 241001269238 Data Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000012550 audit Methods 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000005713 exacerbation Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000002483 medication Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明属于人工智能领域,提供一种病种违规用药检测方法、装置、设备及计算机存储介质,该方法包括:获取原始待检测参保人诊疗数据;将原始待检测参保人诊疗数据输入预设清洗模型进行预处理,得到待检测参保人诊疗数据,其中,待检测参保人诊疗数据包括住院率;将待检测参保人诊疗数据输入训练完成的聚类模型进行聚类,以将待检测参保人诊疗数据划分为若干个基于不同住院率范围的待检测群组;对待检测群组及其包含的待检测参保人诊疗数据的特征指标进行分析,以从待检测群组中检测出病种与用药不符的异常参保人诊疗数据。本发明从住院率的角度,基于聚类模型对大量的参保人诊疗数据进行异常检测,可降低检测难度,提高检测效率和准确性。
Description
技术领域
本发明涉及人工智能领域,尤其涉及一种病种违规用药检测方法、装置、设备及计算机存储介质。
背景技术
医保体系中,针对不同的病种,其用药有一定限制范围,比如白蛋白仅用于低蛋白血症,病种和用药范围相符时,相关药品可进行医保报销。为保障医保基金的合理支出,需要对参保人诊疗数据进行异常检测,以核验参保人的药品报销费用。由于需要检测的数据量大,传统仅依靠人工检测的方式,难度大,效率低。
发明内容
本发明的主要目的在于提供一种病种违规用药检测方法、装置、设备及计算机存储介质,旨在解决传统仅依靠人工检测参保人诊疗数据的方式,难度大,效率低的技术问题。
为实现上述目的,本发明提供一种病种违规用药检测方法,所述病种违规用药检测方法包括以下步骤:
获取原始待检测参保人诊疗数据;
将所述原始待检测参保人诊疗数据输入预设清洗模型进行预处理,得到待检测参保人诊疗数据,其中,所述待检测参保人诊疗数据包括住院率;
将所述待检测参保人诊疗数据输入训练完成的聚类模型进行聚类,以将所述待检测参保人诊疗数据划分为若干个基于不同住院率范围的待检测群组;
对所述待检测群组及其包含的待检测参保人诊疗数据的特征指标进行分析,以从所述待检测群组中检测出病种与用药不符的异常参保人诊疗数据。
可选地,所述获取原始待检测参保人诊疗数据的步骤之前,包括:
采用无监督学习方法训练聚类模型,得到所述训练完成的聚类模型。
可选地,所述采用无监督学习方法训练聚类模型,得到所述训练完成的聚类模型的步骤包括:
获取用于训练聚类模型的参保人诊疗数据;
将所述用于训练聚类模型的参保人诊疗数据输入预设清洗模型进行预处理;
根据预处理后的用于训练聚类模型的参保人诊疗数据,建立用于训练聚类模型的训练样本;
根据所述训练样本,采用预设无监督学习聚类算法训练聚类模型,得到得到所述训练完成的聚类模型。
可选地,所述根据所述训练样本,采用预设无监督学习聚类算法训练聚类模型,得到所述训练完成的聚类模型的步骤之后,包括:
根据预设成熟度计算公式mature=ε*rate计算训练训练完成的聚类模型的成熟度,其中,mature表示成熟度,rate表示准确率,ε表示权重值;
判断训练完成的聚类模型的成熟度是否达到预设成熟度阈值;
若训练完成的聚类模型的成熟度达到预设成熟度阈值,则执行步骤:获取原始待检测参保人诊疗数据。
可选地,所述将所述原始待检测参保人诊疗数据输入预设清洗模型进行预处理,得到待检测参保人诊疗数据的步骤包括:
将所述原始待检测参保人诊疗数据输入预设清洗模型中依次进行数据切片、数据分词、文本转换、字段填充的清洗处理,得到待检测参保人诊疗数据。
可选地,所述待检测参保人诊疗数据包括各病种费用占比差额;
所述对所述待检测群组及其包含的待检测参保人诊疗数据的特征指标进行分析,以从所述待检测群组中检测出病种与用药不符的异常参保人诊疗数据的步骤包括:
分别将各个待检测群组对应的住院率范围与预设住院率阈值进行比对;
将住院率范围下限值超出预设住院率阈值的待检测群组确定为异常待检测群组;
从所述异常待检测群组包含的各个待检测参保人诊疗数据中分别提取对应的各病种费用占比差额作为特征指标;
分别将提取的各病种费用占比差额与预设各病种费用占比差额阈值进行比对;
对于所述异常待检测群组中各病种费用占比差额超出预设各病种费用占比差额阈值的待检测参保人诊疗数据,则转由人工进行二次检测,以检测出病种与用药不符的异常参保人诊疗数据。
可选地,所述病种违规用药检测方法还包括以下步骤:
将所述待检测参保人诊疗数据与预处理后的用于训练聚类模型的参保人诊疗数据进行合并,以更新用于训练聚类模型的训练样本;
根据更新的训练样本,对聚类模型进行进一步训练。
此外,为实现上述目的,本发明还提供病种违规用药检测装置,所述病种违规用药检测装置包括:
第一获取模块,用于获取原始待检测参保人诊疗数据;
预处理模块,用于将所述原始待检测参保人诊疗数据输入预设清洗模型进行预处理,得到待检测参保人诊疗数据,其中,所述所述待检测参保人诊疗数据包括住院率;
聚类模块,用于将所述待检测参保人诊疗数据输入训练完成的聚类模型进行聚类,以将所述待检测参保人诊疗数据划分为若干个基于不同住院率范围的待检测群组;
分析模块,用于对所述待检测群组及其包含的待检测参保人诊疗数据的特征指标进行分析,以从所述待检测群组中检测出病种与用药不符的异常参保人诊疗数据。
此外,为实现上述目的,本发明还提供一种病种违规用药检测设备,所述病种违规用药检测设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的病种违规用药检测程序,其中所述病种违规用药检测程序被所述处理器执行时,实现如上述的病种违规用药检测方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机存储介质,所述计算机存储介质上存储有病种违规用药检测程序,其中所述病种违规用药检测程序被处理器执行时,实现如上述的病种违规用药检测方法的步骤。
本发明提供一种病种违规用药检测方法,从住院率的角度,基于聚类模型,可以先将大量的待检测参保人诊疗数据划分为若干个基于不同住院率范围的待检测群组,然后结合待检测群组及其包含的待检测参保人诊疗数据的特征指标进行异常检测,从而从待检测群组中检测出病种与用药不符的异常参保人诊疗数据,不仅降低了检测难度,还可提高检测效率,也为有效检测出病种与用药不符的异常参保人诊疗数据提供了精确的分析依据,提高了检测的准确性。
附图说明
图1为本发明实施例方案中涉及的病种违规用药检测设备的硬件结构示意图;
图2为本发明病种违规用药检测方法第一实施例的流程示意图;
图3为本发明病种违规用药检测方法第一实施例的细化流程示意图;
图4为本发明病种违规用药检测方法第三实施例的流程示意图;
图5为本发明病种违规用药检测装置第一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例涉及的病种违规用药检测方法主要应用于病种违规用药检测设备,该病种违规用药检测设备可以是个人计算机(personal computer,PC)、服务器等具有数据处理功能的设备。
参照图1,图1为本发明实施例方案中涉及的病种违规用药检测设备的硬件结构示意图。本发明实施例中,病种违规用药检测设备可以包括处理器1001(例如中央处理器Central Processing Unit,CPU),通信总线1002,用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信;用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard);网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真WIreless-FIdelity,WI-FI接口);存储器1005可以是高速随机存取存储器(random access memory,RAM),也可以是稳定的存储器(non-volatile memory),例如磁盘存储器,存储器1005可选的还可以是独立于前述处理器1001的存储装置。本领域技术人员可以理解,图1中示出的硬件结构并不构成对本发明的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
继续参照图1,图1中作为一种计算机存储介质的存储器1005可以包括操作系统、网络通信模块以及病种违规用药检测程序。在图1中,网络通信模块可用于连接人社系统,与人社系统进行数据通信;而处理器1001可以调用存储器1005中存储的病种违规用药检测程序,并执行本发明各实施例提供的病种违规用药检测方法。
本发明实施例提供了一种病种违规用药检测方法。
参照图2,图2为本发明病种违规用药检测方法第一实施例的流程示意图。
本实施例中,所述病种违规用药检测方法应用于检测系统,所述检测系统搭载于病种违规用药检测设备中,比如检测系统可以搭载于服务器或PC等设备中,检测系统对接人社系统,而人社系统对接已在人社系统备案的定点医疗机构。所述病种违规用药检测方法包括以下步骤:
步骤S10,获取原始待检测参保人诊疗数据;
在实际中,参保人在定点医疗机构进行诊疗后,定点医疗机构会将参保人诊疗数据上传至人社系统,其中,参保人诊疗数据包括参保人信息、病种数、病种用药信息、病种费用占比差额、住院率、就诊间隔均值、月就诊次数均值、月就诊次数差、月支出差额等。人社系统会将定点医疗机构上传的参保人诊疗数据保存至人社系统的数据库中。本实施例提出一种病种违规用药检测方法,由于传统人工检测经验中,会将住院率过高的参保人作为重点检测对象,本实施例通过训练完成的聚类模型,从住院率的角度,对参保人诊疗数据进行异常检测,从而确定出病种与用药不符的异常参保人诊疗数据。
在本实施例中,步骤S10之前,需预先训练聚类模型,得到训练完成的聚类模型。在一种优选的实现方式中,可以采用无监督学习方法训练聚类模型。
具体地,参照图3,采用无监督学习方法训练聚类模型的步骤可以包括:
步骤S50,获取用于训练聚类模型的参保人诊疗数据;
即,先获取用于训练聚类模型的参保人诊疗数据。本步骤中,检测系统可以从人社系统的数据库中获取某一时间段内的历史参保人诊疗数据,作为训练聚类模型的参保人诊疗数据,如表1所示:
表1用于训练聚类模型的参保人诊疗数据
步骤S60,将所述用于训练聚类模型的参保人诊疗数据输入预设清洗模型进行预处理;
之后,检测系统将用于训练聚类模型的参保人诊疗数据输入预设清洗模型进行预处理。本实施例检测系统中预先设置有清洗模型,该清洗模型采用了NLP(naturallanguage processing,自然语言处理)技术,NLP技术可自动化处理大量文本数据,从中提炼出有价值的信息。检测系统可以利用该预设清洗模型,通过NLP技术对用于训练聚类模型的参保人诊疗数据进行清洗处理,清洗处理的过程如下:
a、数据切片,即,去除参保人诊疗数据中的不相关字段,例如对于上表中所示的数据,需要去除姓名、性别、时间、就诊间隔均值、月就诊次数均值、月就诊次数差、月支出差额字段的数据;
b、数据分词,即,将数据切片后的诊疗数据拆分为各个独立的词,例如对于上表中去除不相关字段后的诊疗数据,将其拆分为各个独立的词,得到编号、各病种费用占比差额和住院率的独立字段的数据;
c、文本转换,即,将数据分词后的参保人诊疗数据中的英文转换为中文;
d、字段填充,即,预先设置标准化模板,该标准化模板包括了为用于训练聚类模型的训练样本定义的需求数据类型(即需要从文本转换后的诊疗数据中得到什么数据)、以及需求数据对应的需求字段名称。将文本转换后的诊疗数据填充至标准化模板中,即得到为用于训练聚类模型的训练样本定义的需求数据,如表2所示:
表2预处理后的用于训练聚类模型的参保人诊疗数据
步骤S70,根据预处理后的用于训练聚类模型的参保人诊疗数据,建立用于训练聚类模型的训练样本;
进一步地,根据预处理后的用于训练聚类模型的参保人诊疗数据,建立用于训练聚类模型的训练样本。本步骤中,根据预处理后的用于训练聚类模型的参保人诊疗数据,建立用于训练聚类模型的训练样本的方式例如,该训练样本是一个集合,集合里面的元素是一个个预处理后的参保人诊疗数据样例:
训练样本={诊疗数据样例1,诊疗数据样例2,...,诊疗数据n}
={(病种数1,病种用药信息1,各病种费用占比差额1,住院率1),(病种数2,病种用药信息2,各病种费用占比差额2,住院率2)...,(病种数n,病种用药信息n,各病种费用占比差额n,住院率n)}。
步骤S80,根据所述训练样本,采用预设无监督学习聚类算法训练聚类模型。
进一步地,根据训练样本,采用预设无监督学习聚类算法训练聚类模型。本步骤中,预设无监督学习聚类算法可以是K-means算法。K-means算法属于无监督学习,是很典型的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大,该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。通过K-means算法训练聚类模型的过程如下:
A、从训练样本中任意选择k个住院率作为初始聚类中心;
B、计算训练样本中每个诊疗数据样例的住院率与各个初始聚类中心之间的距离;
C、将训练样本中每个诊疗数据样例,将训练样本中每个诊疗数据样例分配给对应住院率距离最近的初始聚类中心,当训练样本中的全部诊疗数据样例分配完成时,得到k个群组;
D、根据每个群组中现有诊疗数据样例的住院率重新计算每个群组的聚类中心,计算训练样本中每个诊疗数据样例的住院率与聚类中心的距离,并将训练样本中每个诊疗数据样例分配给对应住院率距离最近的聚类中心,当训练样本中的全部诊疗数据样例分配完成时,得到k个群组;
E、重复步骤D,直至满足终止条件,表示聚类模型训练模型检测完成。
即,检测系统从训练样本中的n个诊疗数据样例的住院率中任意选择k个住院率作为初始聚类中心,计算训练样本中每个诊疗数据样例的住院率与各个初始聚类中心之间的距离,把训练样本中每个诊疗数据样例分配给对应住院率距离最近的聚类中心(聚类中心以及分配给它们的对象就代表一个聚类),一旦训练样本中的全部诊疗数据样例都被分配了,每个聚类的聚类中心会根据聚类中现有的诊疗数据样例被重新计算,这个过程将不断重复直到满足终止条件:(1)没有对象被重新分配给不同的聚类,(2)没有聚类中心再发生变化,(3)误差平方和局部最小,三者任选其一。如此,通过K-means算法对训练样本进行聚类分析,可以将训练样本划分为k个基于不同住院率范围的群组,得到训练完成的聚类模型。当然,也可以采用无监督学习的其他聚类算法训练聚类模型,本发明对训练聚类模型的聚类算法不作限定。
聚类模型训练完成之后,检测系统从人社系统数据库中获取需要检测的参保人诊疗数据(定义为原始待检测参保人诊疗数据),原始待检测参保人诊疗数据如表3所示:
表3待检测参保人诊疗数据
步骤S20,将所述原始待检测参保人诊疗数据输入预设清洗模型进行预处理,得到待检测参保人诊疗数据,其中,所述待检测参保人诊疗数据包括住院率;
本步骤中,在获取原始待检测参保人诊疗数据之后,检测系统同样先将原始待检测参保人诊疗数据输入预设清洗模型中进行数据清洗的预处理,即对原始待检测参保人诊疗数据依次进行数据切片、数据分词、文本转换、字段填充的处理,得到聚类模型进行检测时的需求数据(定义为待检测参保人诊疗数据),如表4所示:
表4预处理后的待检测参保人诊疗数据
步骤S30,将所述待检测参保人诊疗数据输入训练完成的聚类模型进行聚类,以将所述待检测参保人诊疗数据划分为若干个基于不同住院率范围的待检测群组;
对原始待检测参保人诊疗数据进行预处理得到待检测参保人诊疗数据之后,本步骤中,检测系统将待检测参保人诊疗数据输入预先训练完成的聚类模型,从而对预处理后的待检测参保人诊疗数据进行聚类,可以将待检测参保人诊疗数据划分为若干个基于不同住院率范围的待检测群组。
步骤S40,对所述待检测群组及其包含的待检测参保人诊疗数据的特征指标进行分析,以从所述待检测群组中检测出病种与用药不符的异常参保人诊疗数据。
得到若干个待检测群组之后,本步骤中,检测系统对各个待检测群组及其包含的待检测参保人诊疗数据的特征指标进行分析,以从各个待检测群组中检测出病种与用药不符的异常参保人诊疗数据。
在一种优选的实现方式中,步骤S40可以包括:
分别将各个待检测群组对应的住院率范围与预设住院率阈值进行比对;
在本步骤中,由于实际中会将住院率过高的参保人作为重点检测对象,因此,在得到若干个基于不同住院率的待检测群组后,检测系统可以将各个待检测群组对应的住院率范围与预设住院率阈值进行比对,其中,住院率阈值是结合人工检测经验而预先设置的判定阈值,可灵活设置(比如65%),此处不作限定。
将住院率范围下限值超出预设住院率阈值的待检测群组确定为异常待检测群组;
在本步骤中,检测系统可以将各个待检测群组对应的住院率范围与预设住院率阈值进行比对之后,对于住院率范围下限值超出预设住院率阈值的待检测群组则作为重点检测群组,即,将住院率范围下限值超出预设住院率阈值的待检测群组确定为异常待检测群组。
从所述异常待检测群组包含的各个待检测参保人诊疗数据中分别提取对应的各病种费用占比差额作为特征指标;
由于传统人工检测经验中,各病种费用占比差额相对来说能更好的反映实际情况,各病种费用占比差额越大,越可能存在病种与用药不符的情况,因此可以将待检测参保人诊疗数据的各病种费用占比差额作为特征指标。在本步骤中,检测系统从异常待检测群组包含的各个待检测参保人诊疗数据中分别提取对应的各病种费用占比差额作为特征指标。
分别将提取的各病种费用占比差额与预设各病种费用占比差额阈值进行比对;
之后,检测系统分别将提取出的每个各病种费用占比差额与预设各病种费用占比差额阈值进行比对,其中,各病种费用占比差额阈值是结合人工检测经验而预先设置的判定阈值,可灵活设置(比如50%),此处不作限定。
对于所述异常待检测群组中各病种费用占比差额超出预设各病种费用占比差额阈值的待检测参保人诊疗数据,则转由人工进行二次检测,以检测出病种与用药不符的异常参保人诊疗数据。
本步骤中,检测系统分别将提取的各病种费用占比差额与预设各病种费用占比差额阈值进行比对之后,对于异常待检测群组中各病种费用占比差额超出预设各病种费用占比差额阈值的待检测参保人诊疗数据,可能出现病种与用药不符情况的概率越大,因而将异常待检测群组中各病种费用占比差额超出预设各病种费用占比差额阈值的待检测参保人诊疗数据转由人工进行二次检测,由人工仔细核对其中的病种用药信息,从而检测出病种与用药不符的异常参保人诊疗数据。
通过上述方式,本实施例从住院率的角度出发,基于聚类模型,可以先将大量的待检测参保人肾病诊疗数据划分为若干个基于不同住院率的待检测群组,然后基于住院率,先确定异常待检测群组,然后从异常待检测群组包含的各个待检测参保人诊疗数据中分别提取对应的各病种费用占比差额作为特征指标,从而对异常待检测群组包含的待检测参保人诊疗数据的特征指标(各病种费用占比差额)进行分析,对于异常待检测群组中特征指标不满足条件的待检测参保人诊疗数据转由人工进行加重审核,从而检测出病种与用药不符的异常参保人肾病诊疗数据,相比于仅依赖人工核验参保人肾病诊疗数据的传统方式,不仅降低了检测难度,还可提高检测效率,也为有效检测出病种与用药不符的异常数据提供了精确的分析依据,提高了检测的准确性。
之后,检测系统可以将确定出的异常数据发送至人社系统,供人社系统针对相应的医保报销费用作出相应决策,可利于医保基金的有效管控。
在本实施例中,获取原始待检测参保人诊疗数据;将所述原始待检测参保人诊疗数据输入预设清洗模型进行预处理,得到待检测参保人诊疗数据;将所述待检测参保人诊疗数据输入训练完成的聚类模型进行聚类,以将所述待检测参保人诊疗数据划分为若干个基于不同住院率范围的待检测群组;对所述待检测群组及其包含的待检测参保人诊疗数据的特征指标进行分析,以从所述待检测群组中检测出病种与用药不符的异常参保人诊疗数据。通过上述方式,本实施例从住院率的角度,基于聚类模型,可以先将大量的待检测参保人诊疗数据划分为若干个基于不同住院率的待检测群组,然后结合待检测群组及其包含的待检测参保人诊疗数据的特征指标进行异常检测,从而从待检测群组中检测出病种与用药不符的异常参保人诊疗数据,不仅降低了检测难度,还可提高检测效率,也为有效检测出病种与用药不符的异常数据提供了精确的分析依据,提高了检测的准确性。
进一步地,基于第一实施例提出本发明病种违规用药检测方法的第二实施例。病种违规用药检测方法的第二实施例与病种违规用药检测方法的第一实施例的区别在于,所述病种违规用药检测方法还可以包括以下步骤:
将所述待检测参保人诊疗数据与预处理后的用于训练聚类模型的参保人诊疗数据进行合并,以更新用于训练聚类模型的训练样本;
根据更新的训练样本,对聚类模型进行进一步训练。
即,将检测过的参保人诊疗数据与原有训练聚类模型的参保人诊疗数据进行合并,从而将检测过的参保人诊疗数据并入到原有训练聚类模型时的训练样本中,利用不断新增的训练样本,按照第一实施例中的K-means算法对聚类模型进行不断调整和优化,可增加分析数据,有助于在后续分析待检测参保人诊疗数据时,提高更多典型以及精确度高的分析依据,进而提高检测的准确度。
在本实施例中,通过加入检测过的参保人诊疗数据,实现实时更新训练样本,进而优化聚类模型,提高后续检测的准确度。
进一步地,基于第一实施例提出本发明病种违规用药检测方法的第三实施例。病种违规用药检测方法的第三实施例与病种违规用药检测方法的第一实施例的区别在于,参照图4,所述步骤S80之后,包括:
步骤S90,根据预设成熟度计算公式mature=ε*rate计算训练训练完成的聚类模型的成熟度,其中,mature表示成熟度,rate表示准确率,ε表示权重值;
即,聚类模型训练完成后,并不立即投入使用,而是先检测训练完成的聚类模型的成熟度,可通过成熟度计算公式mature=ε*rate计算得到聚类模型的成熟度,其中,mature表示训练完成的聚类模型的成熟度,rate表示聚类模型的准确率(也就是样本检测结果与实际的差距),ε表示权重值(可根据实际进行设定)。
步骤S91,判断训练完成的聚类模型的成熟度是否达到预设成熟度阈值;
之后,将训练完成的聚类模型的成熟度与预设成熟度阈值进行比对,其中,该成熟度阈值是根据实际需要预先设定的,比如80%。
步骤S92,若训练完成的聚类模型的成熟度达到预设成熟度阈值,则执行步骤:获取原始待检测参保人诊疗数据。
如果训练完成的聚类模型的成熟度大于预设成熟度阈值,则判定训练完成的聚类模型的成熟度满足条件,可以投入使用,即可获取原始待检测参保人诊疗数据,再按照第一实施例中所述的处理方法对原始待检测参保人诊疗数据进行分析检测。
在本实施例中,聚类模型训练完成后需先检测其对应的成熟度,当训练完成的聚类成熟度满足条件时才用于分析需要检测的参保人诊疗数据,从而提高检测准确度。
此外,本发明实施例还提供一种病种违规用药检测装置。
参照图5,图5为本发明病种违规用药检测装置第一实施例的功能模块示意图。
本实施例中,所述病种违规用药检测装置包括:
第一获取模块10,用于获取原始待检测参保人诊疗数据;
预处理模块20,用于将所述原始待检测参保人诊疗数据输入预设清洗模型进行预处理,得到待检测参保人诊疗数据,其中,所述待检测参保人诊疗数据包括住院率;
聚类模块30,用于将所述待检测参保人诊疗数据输入训练完成的聚类模型进行聚类,以将所述待检测参保人诊疗数据划分为若干个基于不同住院率范围的待检测群组;
分析模块40,用于对所述待检测群组及其包含的待检测参保人诊疗数据的特征指标进行分析,以从所述待检测群组中检测出病种与用药不符的异常参保人诊疗数据。
其中,上述病种违规用药检测装置的各虚拟功能模块存储于图1所示病种违规用药检测设备的存储器1005中,用于实现病种违规用药检测程序的所有功能;各模块被处理器1001执行时,实现了基于聚类模型对大量的参保人诊疗数据进行分析检测,不仅降低了检测难度,提高了检测效率,也为有效检测出病种与用药不符的异常参保人诊疗数据提供了精确的分析依据,提高了检测的准确性。
进一步的,所述病种违规用药检测装置还包括:
第一训练模块,用于采用无监督学习方法训练聚类模型,得到所述训练完成的聚类模型。
进一步的,所述第一训练模块包括:
获取单元,用于获取用于训练聚类模型的参保人诊疗数据;
输入单元,用于将所述用于训练聚类模型的参保人诊疗数据输入预设清洗模型进行预处理;
建立单元,用于根据预处理后的用于训练聚类模型的参保人诊疗数据,建立用于训练聚类模型的训练样本;
训练单元,用于根据所述训练样本,采用预设无监督学习聚类算法训练聚类模型,得到所述训练完成的聚类模型。
进一步的,所述病种违规用药检测装置还包括:
计算模块,用于根据预设成熟度计算公式mature=ε*rate计算训练训练完成的聚类模型的成熟度,其中,mature表示成熟度,rate表示准确率,ε表示权重值;
判断模块,用于判断训练完成的聚类模型的成熟度是否达到预设成熟度阈值;
第二获取模块,用于若训练完成的聚类模型的成熟度达到预设成熟度阈值,则执行步骤:获取原始待检测参保人诊疗数据。
进一步的,所述预处理模块20包括:
清洗单元,用于将所述原始待检测参保人诊疗数据输入预设清洗模型中依次进行数据切片、数据分词、文本转换、字段填充的清洗处理,得到待检测参保人诊疗数据。
进一步的,所述分析模块40包括:
第一比对单元,用于分别将各个待检测群组对应的住院率范围与预设住院率阈值进行比对;
确定单元,用于将住院率范围下限值超出预设住院率阈值的待检测群组确定为异常待检测群组;
提取单元,用于从所述异常待检测群组包含的各个待检测参保人诊疗数据中分别提取对应的各病种费用占比差额作为特征指标;
第二比对单元,用于分别将提取的各病种费用占比差额与预设各病种费用占比差额阈值进行比对;
检测单元,用于对于所述异常待检测群组中各病种费用占比差额超出预设各病种费用占比差额阈值的待检测参保人诊疗数据,则转由人工进行二次检测,以检测出病种与用药不符的异常参保人诊疗数据。
进一步的,所述病种违规用药检测装置还包括:
更新模块,用于将所述待检测参保人诊疗数据与预处理后的用于训练聚类模型的参保人诊疗数据进行合并,以更新用于训练聚类模型的训练样本;
第二训练模块,用于根据更新的训练样本,对聚类模型进行进一步训练。
其中,上述病种违规用药检测装置中各个模块的功能实现与上述病种违规用药检测方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。
此外,本发明实施例还提供一种计算机存储介质。
本发明计算机存储介质上存储有病种违规用药检测程序,其中所述病种违规用药检测程序被处理器执行时,实现如上述的病种违规用药检测方法的步骤。
其中,病种违规用药检测程序被执行时所实现的方法可参照本发明病种违规用药检测方法的各个实施例,此处不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种病种违规用药检测方法,其特征在于,所述病种违规用药检测方法包括以下步骤:
获取原始待检测参保人诊疗数据;
将所述原始待检测参保人诊疗数据输入预设清洗模型进行预处理,得到待检测参保人诊疗数据,其中,所述待检测参保人诊疗数据包括住院率;
将所述待检测参保人诊疗数据输入训练完成的聚类模型进行聚类,以将所述待检测参保人诊疗数据划分为若干个基于不同住院率范围的待检测群组;
对所述待检测群组及其包含的待检测参保人诊疗数据的特征指标进行分析,以从所述待检测群组中检测出病种与用药不符的异常参保人诊疗数据。
2.如权利要求1所述的病种违规用药检测方法,其特征在于,所述获取原始待检测参保人诊疗数据的步骤之前,包括:
采用无监督学习方法训练聚类模型,得到所述训练完成的聚类模型。
3.如权利要求2所述的病种违规用药检测方法,其特征在于,所述采用无监督学习方法训练聚类模型,得到所述训练完成的聚类模型的步骤包括:
获取用于训练聚类模型的参保人诊疗数据;
将所述用于训练聚类模型的参保人诊疗数据输入预设清洗模型进行预处理;
根据预处理后的用于训练聚类模型的参保人诊疗数据,建立用于训练聚类模型的训练样本;
根据所述训练样本,采用预设无监督学习聚类算法训练聚类模型,得到所述训练完成的聚类模型。
4.如权利要求3所述的病种违规用药检测方法,其特征在于,所述根据所述训练样本,采用预设无监督学习聚类算法训练聚类模型,得到所述训练完成的聚类模型的步骤之后,包括:
根据预设成熟度计算公式mature=ε*rate计算训练训练完成的聚类模型的成熟度,其中,mature表示成熟度,rate表示准确率,ε表示权重值;
判断训练完成的聚类模型的成熟度是否达到预设成熟度阈值;
若训练完成的聚类模型的成熟度达到预设成熟度阈值,则执行步骤:获取原始待检测参保人诊疗数据。
5.如权利要求1所述的病种违规用药检测方法,其特征在于,所述将所述原始待检测参保人诊疗数据输入预设清洗模型进行预处理,得到待检测参保人诊疗数据的步骤包括:
将所述原始待检测参保人诊疗数据输入预设清洗模型中依次进行数据切片、数据分词、文本转换、字段填充的清洗处理,得到待检测参保人诊疗数据。
6.如权利要求1所述的病种违规用药检测方法,其特征在于,所述待检测参保人诊疗数据包括各病种费用占比差额;
所述对所述待检测群组及其包含的待检测参保人诊疗数据的特征指标进行分析,以从所述待检测群组中检测出病种与用药不符的异常参保人诊疗数据的步骤包括:
分别将各个待检测群组对应的住院率范围与预设住院率阈值进行比对;
将住院率范围下限值超出预设住院率阈值的待检测群组确定为异常待检测群组;
从所述异常待检测群组包含的各个待检测参保人诊疗数据中分别提取对应的各病种费用占比差额作为特征指标;
分别将提取的各病种费用占比差额与预设各病种费用占比差额阈值进行比对;
对于所述异常待检测群组中各病种费用占比差额超出预设各病种费用占比差额阈值的待检测参保人诊疗数据,则转由人工进行二次检测,以检测出病种与用药不符的异常参保人诊疗数据。
7.如权利要求1至6中任一项所述的病种违规用药检测方法,其特征在于,所述病种违规用药检测方法还包括以下步骤:
将所述待检测参保人诊疗数据与预处理后的用于训练聚类模型的参保人诊疗数据进行合并,以更新用于训练聚类模型的训练样本;
根据更新的训练样本,对聚类模型进行进一步训练。
8.一种病种违规用药检测装置,其特征在于,所述病种违规用药检测装置包括:
第一获取模块,用于获取原始待检测参保人诊疗数据;
预处理模块,用于将所述原始待检测参保人诊疗数据输入预设清洗模型进行预处理,得到待检测参保人诊疗数据,其中,所述待检测参保人诊疗数据包括住院率;
聚类模块,用于将所述待检测参保人诊疗数据输入预先训练完成的聚类模型进行聚类,以将所述待检测参保人诊疗数据划分为若干个基于不同住院率范围的待检测群组;
分析模块,用于对所述待检测群组及其包含的待检测参保人诊疗数据的特征指标进行分析,以从所述待检测群组中检测出病种与用药不符的异常参保人诊疗数据。
9.一种病种违规用药检测设备,其特征在于,所述病种违规用药检测设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的病种违规用药检测程序,其中所述病种违规用药检测程序被所述处理器执行时,实现如权利要求1至7中任一项所述的病种违规用药检测方法的步骤。
10.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有病种违规用药检测程序,其中所述病种违规用药检测程序被处理器执行时,实现如权利要求1至7中任一项所述的病种违规用药检测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811530941.0A CN109583510A (zh) | 2018-12-13 | 2018-12-13 | 病种违规用药检测方法、装置、设备及计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811530941.0A CN109583510A (zh) | 2018-12-13 | 2018-12-13 | 病种违规用药检测方法、装置、设备及计算机存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109583510A true CN109583510A (zh) | 2019-04-05 |
Family
ID=65929576
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811530941.0A Pending CN109583510A (zh) | 2018-12-13 | 2018-12-13 | 病种违规用药检测方法、装置、设备及计算机存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109583510A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105279382A (zh) * | 2015-11-10 | 2016-01-27 | 成都数联易康科技有限公司 | 一种医疗保险异常数据在线智能检测方法 |
CN106897935A (zh) * | 2017-02-27 | 2017-06-27 | 上海源烁信息科技有限公司 | 一种职工医疗保险基金支出平衡算法及模型 |
CN107895168A (zh) * | 2017-10-13 | 2018-04-10 | 平安科技(深圳)有限公司 | 数据处理的方法、数据处理的装置及计算机可读存储介质 |
CN108629593A (zh) * | 2018-04-28 | 2018-10-09 | 招商银行股份有限公司 | 基于深度学习的欺诈交易识别方法、系统及存储介质 |
CN108921710A (zh) * | 2018-06-08 | 2018-11-30 | 东莞迪赛软件技术有限公司 | 医保异常检测的方法及系统 |
-
2018
- 2018-12-13 CN CN201811530941.0A patent/CN109583510A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105279382A (zh) * | 2015-11-10 | 2016-01-27 | 成都数联易康科技有限公司 | 一种医疗保险异常数据在线智能检测方法 |
CN106897935A (zh) * | 2017-02-27 | 2017-06-27 | 上海源烁信息科技有限公司 | 一种职工医疗保险基金支出平衡算法及模型 |
CN107895168A (zh) * | 2017-10-13 | 2018-04-10 | 平安科技(深圳)有限公司 | 数据处理的方法、数据处理的装置及计算机可读存储介质 |
CN108629593A (zh) * | 2018-04-28 | 2018-10-09 | 招商银行股份有限公司 | 基于深度学习的欺诈交易识别方法、系统及存储介质 |
CN108921710A (zh) * | 2018-06-08 | 2018-11-30 | 东莞迪赛软件技术有限公司 | 医保异常检测的方法及系统 |
Non-Patent Citations (4)
Title |
---|
唐璟宜 等: "医保欺诈行为的主动发现", 《合作经济与科技》, 31 August 2016 (2016-08-31), pages 188 - 190 * |
谢筱筱: "基于 K-means 聚类算法的住院费用数据挖掘", 《现代计算机》 * |
谢筱筱: "基于 K-means 聚类算法的住院费用数据挖掘", 《现代计算机》, 30 September 2017 (2017-09-30), pages 54 - 56 * |
霍雨佳: "《大数据科学》", 电子科技大学出版社, pages: 162 - 167 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110021439A (zh) | 基于机器学习的医疗数据分类方法、装置和计算机设备 | |
CN109635113A (zh) | 异常参保人购药数据检测方法、装置、设备及存储介质 | |
CN110147732A (zh) | 指静脉识别方法、装置、计算机设备及存储介质 | |
CN110136842A (zh) | 急性传染病的发病预测方法、装置及计算机可读存储介质 | |
CN107895168A (zh) | 数据处理的方法、数据处理的装置及计算机可读存储介质 | |
CN104155596A (zh) | 一种基于随机森林的模拟电路故障诊断系统 | |
CN109615012A (zh) | 基于机器学习的就诊数据异常识别方法、设备及存储介质 | |
CN110222782A (zh) | 基于密度聚类的有监督二分类数据分析方法及系统 | |
CN106777909A (zh) | 妊娠期健康风险评估系统 | |
CN110009224A (zh) | 嫌疑人违规概率预测方法、装置、计算机设备及存储介质 | |
CN116910172B (zh) | 基于人工智能的随访量表生成方法及系统 | |
CN111785366A (zh) | 患者治疗方案的确定方法、装置及计算机设备 | |
CN111833982A (zh) | 基于健康数据的健康报告生成方法及其相关设备 | |
CN114783618A (zh) | 基于知识结构及四诊性状的中医模型训练方法、装置 | |
CN110473631B (zh) | 基于真实世界研究的智能睡眠监测方法和系统 | |
CN116189866A (zh) | 一种基于数据分析的远程医用护理分析系统 | |
CN114628033A (zh) | 疾病风险预测方法、装置、设备及存储介质 | |
CN114416929A (zh) | 实体召回模型的样本生成方法、装置、设备及存储介质 | |
CN113903423A (zh) | 用药方案推荐方法、装置、设备及介质 | |
CN109657059A (zh) | 异常参保人购药数据检测方法、装置、设备及存储介质 | |
CN110135313A (zh) | 一种基于卷积神经网络的年龄判断方法 | |
CN109583510A (zh) | 病种违规用药检测方法、装置、设备及计算机存储介质 | |
CN116313086A (zh) | 一种亚健康预测模型构建方法、装置、设备及存储介质 | |
CN109993365A (zh) | 患病概率预测方法、装置、计算机设备及存储介质 | |
CN114388125A (zh) | 基于人机交互的体质辨识方法、系统及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190405 |