CN109559242A - 异常数据的处理方法、装置、设备及计算机可读存储介质 - Google Patents
异常数据的处理方法、装置、设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN109559242A CN109559242A CN201811526901.9A CN201811526901A CN109559242A CN 109559242 A CN109559242 A CN 109559242A CN 201811526901 A CN201811526901 A CN 201811526901A CN 109559242 A CN109559242 A CN 109559242A
- Authority
- CN
- China
- Prior art keywords
- data
- abnormal data
- medical
- checked
- abnormal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 135
- 238000003672 processing method Methods 0.000 title claims abstract description 30
- 238000002558 medical inspection Methods 0.000 claims abstract description 82
- 238000012545 processing Methods 0.000 claims abstract description 41
- 230000008520 organization Effects 0.000 claims abstract description 37
- 238000007689 inspection Methods 0.000 claims description 35
- 238000000034 method Methods 0.000 claims description 17
- 230000035479 physiological effects, processes and functions Effects 0.000 claims description 17
- 238000012360 testing method Methods 0.000 claims description 11
- 239000011159 matrix material Substances 0.000 claims description 7
- 238000013528 artificial neural network Methods 0.000 claims description 5
- 230000002457 bidirectional effect Effects 0.000 claims description 3
- 238000011176 pooling Methods 0.000 abstract description 13
- 238000010586 diagram Methods 0.000 description 7
- 238000001514 detection method Methods 0.000 description 5
- 239000002699 waste material Substances 0.000 description 5
- 241000208340 Araliaceae Species 0.000 description 4
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 4
- 235000003140 Panax quinquefolius Nutrition 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 235000008434 ginseng Nutrition 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 241001269238 Data Species 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000035935 pregnancy Effects 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 108010001267 Protein Subunits Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000002671 adjuvant Substances 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013481 data capture Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000035558 fertility Effects 0.000 description 1
- 210000003754 fetus Anatomy 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 208000019622 heart disease Diseases 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明属于大数据技术领域,公开了一种异常数据的处理方法,包括:获取参保人员的就诊检查数据;将所述就诊检查数据输入预设模型中,基于所述预设模型对所述就诊检查数据进行识别,并判断所述就诊检查数据中是否存在疑似假检查的异常数据;若是,则基于所述疑似假检查的异常数据确定扣费依据,以便基于所述扣费依据向对应的定点医疗机构出具扣费通知。本发明还公开了一种异常数据的处理装置、设备及计算机可读存储介质。本发明实现了有效管理门诊统筹基金的支出,防止有不合理的门诊费用支出。
Description
技术领域
本发明涉及大数据技术领域,尤其涉及一种异常数据的处理方法、装置、设备及计算机可读存储介质。
背景技术
医疗保险一般指基本医疗保险,是为了补偿劳动者因疾病风险造成的经济损失而建立的一项社会保险制度。通过用人单位与个人缴费,建立医疗保险基金,参保人员患病就诊发生医疗费用后,由医疗保险机构对其给予一定的经济补偿。现有技术中都是配备监管人员对参保人员的社保行为进行监控,以及对医保结算单据进行核算,以便管理门诊统筹基金的支出。但是,由于医保参保人员基数大,仅依靠监管人员对参保数据进行监管,力度不够,例如,在参保医疗数据中可能会出现疑似假检查的情况,对门诊统筹基金造成极大的浪费。
发明内容
本发明的主要目的在于提供一种异常数据的处理方法、装置、设备及计算机可读存储介质,旨在解决现有技术中仅依靠监管人员对参保数据进行监管,力度不够,造成门诊统筹基金管理存在缺陷的技术问题。
为实现上述目的,本发明提供一种异常数据的处理方法,所述异常数据的处理方法包括:
获取参保人员的就诊检查数据;
将所述就诊检查数据输入预设模型中,基于所述预设模型对所述就诊检查数据进行识别,并判断所述就诊检查数据中是否存在疑似假检查的异常数据;
若是,则基于所述疑似假检查的异常数据确定扣费依据,以便基于所述扣费依据向对应的定点医疗机构出具扣费通知。
可选地,所述获取参保人员的就诊检查数据的步骤包括:
获取定点医疗机构上传的参保人员的就诊检查数据,其中,所述就诊检查数据至少包括就诊检查的定点医疗机构、参保人信息、检查项目、检查次数、参保人员当前生理时期。
可选地,所述将所述就诊检查数据输入预设模型中,基于所述预设模型对所述就诊检查数据进行识别,并判断所述就诊检查数据中是否存在疑似假检查的异常数据的步骤包括:
将所述就诊检查数据输入预设模型中,基于所述预设模型将所述就诊检查数据中的文本数据转化为标准数据,其中,所述标准数据至少包括检查项目、参保人员当前生理时期;
通过嵌套循环算法对所述标准数据进行检测,得到检测结果,并基于所述检测结果判断所述标准数据中是否存在疑似假检查的异常数据。
可选地,所述将所述就诊检查数据输入预设模型中,基于所述预设模型将所述就诊检查数据中的文本数据转化为标准数据的步骤包括:
将所述就诊检查数据输入预设模型中,并对所述就诊检查数据进行清洗,以得到清洗后的规范数据;
基于所述规范数据构造文本特征,以得到对应的词向量;
基于所述预设模型中的双向循环神经网络RNN模型将所述词向量编码为向量矩阵,以便基于所述向量矩阵确定对应的标准数据。
可选地,所述通过嵌套循环算法对所述标准数据进行检测,得到检测结果,并基于所述检测结果判断所述标准数据中是否存在疑似假检查的异常数据的步骤包括:
通过嵌套循环算法对所述标准数据进行检测,判断其中是否存在参保人员当前生理时期为妊娠期的标准数据;
若是,则判断所述参保人员当前生理时期为妊娠期的标准数据对应的检查项目是否为CT检查和/或X光。
可选地,所述基于所述疑似假检查的异常数据确定扣费依据,以便基于所述扣费依据向对应的定点医疗机构出具扣费通知的步骤包括:
获取预设扣费规则,并基于所述预设扣费规则和所述疑似假检查的异常数据确定扣费依据;
基于所述扣费依据生成扣费通知,并将所述扣费通知发送至对应的定点医疗机构。
可选地,所述基于所述疑似假检查的异常数据确定扣费依据,以便基于所述扣费依据向对应的定点医疗机构出具扣费通知的步骤之后,所述方法还包括:
获取所述疑似假检查的异常数据对应的检查次数,并确定所述检查次数所在的次数范围;
基于预设处罚规则确定所述次数范围对应的违规等级,并获取所述违规等级对应的处罚措施;
基于所述处罚措施对相应的定点医疗机构进行处罚。
此外,为实现上述目的,本发明还提供一种异常数据的处理装置,所述异常数据的处理装置包括:
检查数据获取模块,用于获取参保人员的就诊检查数据;
异常数据判断模块,用于将所述就诊检查数据输入预设模型中,基于所述预设模型对所述就诊检查数据进行识别,并判断所述就诊检查数据中是否存在疑似假检查的异常数据;
扣费依据确定模块,用于若是,则基于所述疑似假检查的异常数据确定扣费依据,以便基于所述扣费依据向对应的定点医疗机构出具扣费通知。
此外,为实现上述目的,本发明还提供一种异常数据的处理设备,所述异常数据的处理设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的异常数据处理程序,所述异常数据处理程序被所述处理器执行时实现如上所述的异常数据的处理方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有异常数据处理程序,所述异常数据处理程序被处理器执行时实现如上所述的异常数据的处理方法的步骤。
本发明提出的一种异常数据的处理方法,首先获取参保人员的就诊检查数据,并将其输入预设模型中,基于预设模型对就诊检查数据进行识别,以判断就诊检查数据中是否存在疑似假检查的异常数据,如果存在,则基于疑似假检查的异常数据确定扣费依据,以便基于扣费依据向对应的定点医疗机构出具扣费通知。通过本发明提出的异常数据的处理方法,对参保人员的就诊检查情况进行检测,判断其中是否存在疑似假检查的异常数据,并对出现疑似假检查异常数据的定点医疗机构出具扣费通知,以防止有不合理的门诊费用支出,有效管理门诊统筹基金的支出,避免对门诊统筹基金造成浪费。
附图说明
图1为本发明实施例方案中涉及的异常数据的处理设备的硬件结构示意图;
图2为本发明异常数据的处理方法第一实施例的流程示意图;
图3为图2中的步骤S20的细化流程示意图;
图4为本发明异常数据的处理方法第二实施例的流程示意图;
图5为本发明异常数据的处理装置第一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例的主要解决方案是:获取参保人员的就诊检查数据;将所述就诊检查数据输入预设模型中,基于所述预设模型对所述就诊检查数据进行识别,并判断所述就诊检查数据中是否存在疑似假检查的异常数据;若是,则基于所述疑似假检查的异常数据确定扣费依据,以便基于所述扣费依据向对应的定点医疗机构出具扣费通知。通过本发明实施例的技术方案,解决了现有技术中仅依靠监管人员对参保数据进行监管,力度不够,造成门诊统筹基金管理存在缺陷的技术问题。
如图1所示,图1为本发明实施例方案中涉及的异常数据的处理设备的硬件结构示意图。
本发明实施例涉及的异常数据的处理方法主要应用于异常数据的处理设备,该异常数据的处理设备可以是PC、便携计算机、移动终端等具有显示和处理功能的设备。
如图1所示,该异常数据的处理可以包括:处理器1001,例如CPU,通信总线1002,用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,异常数据的处理设备还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、Wi-Fi模块等等。其中,传感器比如光传感器、运动传感器以及其他传感器。当然,异常数据的处理设备还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
本领域技术人员可以理解,图1中示出的异常数据的处理设备结构并不构成对异常数据的处理设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及异常数据处理程序。在图1中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001、存储器1005可以设置在异常数据的处理装置中,所述异常数据的处理装置通过处理器1001调用存储器1005中存储的异常数据处理程序,并执行本发明实施例提供的异常数据的处理方法。
本实施例提供的方案,首先获取参保人员的就诊检查数据,并将其输入预设模型中,基于预设模型对就诊检查数据进行识别,以判断就诊检查数据中是否存在疑似假检查的异常数据,如果存在,则基于疑似假检查的异常数据确定扣费依据,以便基于扣费依据向对应的定点医疗机构出具扣费通知。通过本发明提出的异常数据的处理方法,对参保人员的就诊检查情况进行检测,判断其中是否存在疑似假检查的异常数据,并对出现疑似假检查异常数据的定点医疗机构出具扣费通知,以防止有不合理的门诊费用支出,有效管理门诊统筹基金的支出,避免对门诊统筹基金造成浪费。
基于上述硬件结构,提出本发明异常数据的处理方法实施例。
参照图2,图2为本发明异常数据的处理方法第一实施例的流程示意图,在该实施例中,所述方法包括:
步骤S10,获取参保人员的就诊检查数据;
现有技术中,参保人员在定点医疗机构,例如医院、药店等地方使用医保卡进行就诊费用结算时,定点医疗机构的收费终端设备即可将对应的就诊数据上传至人社核心系统,以便人社核心系统对参保人员相应的医疗数据进行核对,以此管理门诊统筹基金的支出。在本实施例中,是通过对参保人员的就诊检查情况进行检测,因此,本实施例中的就诊数据具体指的是就诊检查数据。
具体地,就诊检查数据中至少包括就诊检查的定点医疗机构、参保人信息、检查项目、检查次数、参保人员当前生理时期等,其中,参保人信息具体可以包括参保人的姓名、年龄以及参保人医保卡信息等。
步骤S20,将所述就诊检查数据输入预设模型中,基于所述预设模型对所述就诊检查数据进行识别,并判断所述就诊检查数据中是否存在疑似假检查的异常数据;若是,则执行步骤S30;
在本实施例中,是通过将就诊检查数据放入预设模型中运行,来判断参保人员的就诊检查数据中是否存在疑似假检查的异常数据,例如,检测妊娠期的参保人员是否发生X光或CT检查收费的行为,若是,则视为不符合常理,疑似为虚假检查项目的行为。具体地,本实施例中所使用的预设模型主要是偏差检测模型,偏差具体指分类样本中的反常实例、不满足规则的特例,或者观测结果与模型预测值不一致且观测结果随时间变化而变化等,偏差检测的基本目标是寻找观测结果与参照值之间有意义的差别。
具体地,如图3所示,所述步骤S20具体包括:
步骤S21,将所述就诊检查数据输入预设模型中,基于所述预设模型将所述就诊检查数据中的文本数据转化为标准数据,其中,所述标准数据至少包括检查项目、参保人员当前生理时期;
具体地,对于上传至人社核心系统的就诊检查数据中,存在一些不必要的信息,并且原始的就诊检查数据均是文本数据,不利于模型对数据的处理,因此,首先通过偏差检测模型对原始的就诊检查数据进行处理,将其转化为标准数据。
首先,将就诊检查数据输入偏差检测模型中,并对就诊检查数据进行清洗。就诊检查数据中存在一些不必要的数据或者不规范的数据,数据清洗主要是删除原始数据集中的无关数据、重复数据,平滑噪声数据,并筛选掉与模型检测主题无关的数据,以及处理缺失值、异常值等,例如,就诊检查数据中包含的与就诊检查无关的信息,如辅助用药信息、住院信息等。通过数据清洗,得到原始的就诊检查数据对应的规范数据。
进一步地,基于得到的规范数据构造文本特征,以得到对应的词向量。首先,利用RNN(Recurrent Neural Network,循环神经网络)模型对清洗后的就诊检查数据进行分词处理及去除无用词。对于中文文本数据,比如一个包含中文的句子,词与词之间是连续的,而数据分析的最小单位粒度是词语,因此,需要对就诊检查数据进行分词处理。进一步地,对分词处理后的数据进行无用词的去除,无用词是指对文本特征没有任何贡献作用的词语,比如:啊、的、是的、你、我,当然,还有一些标点符号,这些无用词并不能反应出文本的意思,因此,需要进行无用词的去除处理。经过分词处理及去除无用词后,即可得到就诊检查数据对应的文本数据,以便根据该文本数据进行文本特征的构造,以进一步得到其对应的词向量。
基于处理后的就诊检查数据对应的文本数据构造文本特征,将文本用一个向量的序列表示,将词语用词向量表示,通过正向计算及逆向计算拼接得到完整的词向量,以便进一步确定词向量的序列,然后使用双向RNN模型将词向量编码为一个句子向量矩阵,以便从该句子向量矩阵中得到最终的标准数据。在本实施例中,标准数据中至少包括检查项目、参保人当前生理时期。例如,某一参保人员的就诊检查的标准数据为当前处于妊娠期,检查项目为CT检查。
步骤S22,通过嵌套循环算法对所述标准数据进行检测,得到检测结果,并基于所述检测结果判断所述标准数据中是否存在疑似假检查的异常数据。
在本实施例中,是通过嵌套循环算法对标准数据进行检测,嵌套循环算法是从一个循环的表中读取其中一行,并将每行传递给嵌套循环,以处理连接中的下一个表,在多次嵌套循环的过程中,判断该标准数据中是否存在疑似假检查的异常数据。
步骤S30,基于所述疑似假检查的异常数据确定扣费依据,以便基于所述扣费依据向对应的定点医疗机构出具扣费通知。
在本实施例中,若检测到就诊检查数据中存在疑似假检查的异常数据,则获取预设扣费规则,并根据该预设扣费规则以及异常数据确定扣费依据,可以理解的是,对于不同的异常数据可以对应有不同的预设扣费规则。例如,如上所述的当前处于妊娠期的参保人员进行了CT检查,或者是进行了X光检查,可以根据该参保人员检查项目的不同,以及检查的次数等,对应有不同的扣费规则。
进一步地,依据扣费依据生成扣费通知,该扣费通知中可以包括进行扣费处罚的定点医疗机构、扣费原因、扣费措施及时间等,并将该扣费通知发送至对应的定点医疗机构,以便对其进行处罚。
在本实施例中,首先获取参保人员的就诊检查数据,并将其输入预设模型中,基于预设模型对就诊检查数据进行识别,以判断就诊检查数据中是否存在疑似假检查的异常数据,如果存在,则基于疑似假检查的异常数据确定扣费依据,以便基于扣费依据向对应的定点医疗机构出具扣费通知。通过本发明提出的异常数据的处理方法,对参保人员的就诊检查情况进行检测,判断其中是否存在疑似假检查的异常数据,并对出现疑似假检查异常数据的定点医疗机构出具扣费通知,以防止有不合理的门诊费用支出,有效管理门诊统筹基金的支出,避免对门诊统筹基金造成浪费。
进一步的,参照图4,基于上述实施例,提出本发明异常数据的处理方法第二实施例,在本实施例中,所述步骤S22具体包括:
步骤S221,通过嵌套循环算法对所述标准数据进行检测,判断其中是否存在参保人员当前生理时期为妊娠期的标准数据;若是,则执行步骤S222;
在本实施例中,是通过嵌套循环算法对标准数据进行检测,嵌套循环算法是从一个循环的表中读取其中一行,并将每行传递给嵌套循环,以处理连接中的下一个表,在多次嵌套循环的过程中,判断该标准数据中是否存在疑似假检查的异常数据。
首先,通过嵌套循环算法对标准数据进行检测,判断上述标准数据中是否存在参保人员当前生理时期为妊娠期的情况,以便进一步对处于妊娠期的参保人员的检查项目进行判断。
步骤S222,判断所述参保人员当前生理时期为妊娠期的标准数据对应的检查项目是否为CT检查和/或X光;若是,则执行步骤S30。
进一步地,判断该处于妊娠期的参保人员的检查项目中是否存在CT检查和/或X光的检查项目,因为X光检查或CT检查是有一定辐射的,妊娠期间的孕妇应避免辐射,以免对胎儿造成影响,因此,若出现妊娠或生育的参保人发生X光或CT检查项目,即可视为该数据为疑似假检查的异常数据。
在本实施例的另一实施方式中,还可以是先通过嵌套循环算法对标准数据进行检测,判断其中是否存在检查项目为CT检查和/或X光的标准数据;若存在,则进一步地确认该标准数据对应的参保人员是否是可以进行CT检查和/或X光的人群,例如,处于妊娠期的参保人则不是适宜进行CT检查和/或X光的人群,当然还包括其他的不适宜人群,如60岁以上的老人、存在心脏病变的人群等。若存在检查项目为CT检查和/或X光的标准数据对应的参保人员中存在这些不适宜进行CT检查和/或X光检查的人群,则同样可以将其视为疑似假检查的异常数据。如果存在疑似假检查的异常数据,则基于该异常数据中的明细确定扣费依据。
进一步地,在本实施例中,当基于扣费依据向对应的定点医疗机构出具扣费通知之后,还可以通过统计该疑似假检查的异常数据对应的检查次数,判断该异常数据对应的违规等级,以便根据不同的违规等级向相应的定点医疗机构进行处罚。
具体地,获取该疑似假检查的标准数据所对应的检查次数,并确定该检查次数所在的次数范围,以根据该次数范围确定其对应的违规等级,可以理解的是,不同的次数范围对应的违规等级不同,次数范围对应的次数越高,对应的违规等级越高,并根据不同的违规等级确定相应的处罚措施对定点医疗机构进行处罚,违规等级越高,处罚措施越严厉。
在本实施例中,通过嵌套循环算法对标准数据进行检测,判断其中是否存在参保人员当前生理时期为妊娠期的标准数据,若是,则进一步判断该标准数据对应的检查项目是否为CT检查和/或X光,若其对应的检查项目是CT检查和/或X光,则将其视为疑似假检查的异常数据,以便基于该异常数据中的明细确定扣费依据、出具扣费通知,对门诊统筹基金的支付进行管理,防止不合理的疑似假检查的费用支出。
此外,本发明实施例还提供一种异常数据的处理装置。
参照图5,图5为本发明异常数据的处理装置第一实施例的功能模块示意图。
本实施例中,所述异常数据的处理装置包括:
检查数据获取模块10,用于获取参保人员的就诊检查数据;
异常数据判断模块20,用于将所述就诊检查数据输入预设模型中,基于所述预设模型对所述就诊检查数据进行识别,并判断所述就诊检查数据中是否存在疑似假检查的异常数据;
扣费依据确定模块30,用于若是,则基于所述疑似假检查的异常数据确定扣费依据,以便基于所述扣费依据向对应的定点医疗机构出具扣费通知。
进一步地,所述检查数据获取模块10具体包括:
数据获取单元,用于获取定点医疗机构上传的参保人员的就诊检查数据,其中,所述就诊检查数据至少包括就诊检查的定点医疗机构、参保人信息、检查项目、检查次数、参保人员当前生理时期。
进一步地,所述异常数据判断模块20具体包括:
数据转化单元,用于将所述就诊检查数据输入预设模型中,基于所述预设模型将所述就诊检查数据中的文本数据转化为标准数据,其中,所述标准数据至少包括检查项目、参保人员当前生理时期;
数据检测单元,用于通过嵌套循环算法对所述标准数据进行检测,得到检测结果,并基于所述检测结果判断所述标准数据中是否存在疑似假检查的异常数据。
进一步地,所述数据转化单元具体包括:
数据清洗子单元,用于将所述就诊检查数据输入预设模型中,并对所述就诊检查数据进行清洗,以得到清洗后的规范数据;
文本特征构造子单元,用于基于所述规范数据构造文本特征,以得到对应的词向量;
标准数据确定子单元,用于基于所述预设模型中的双向循环神经网络RNN模型将所述词向量编码为向量矩阵,以便基于所述向量矩阵确定对应的标准数据。
进一步地,所述数据检测单元具体包括:
生理时期检测子单元,用于通过嵌套循环算法对所述标准数据进行检测,判断其中是否存在参保人员当前生理时期为妊娠期的标准数据;
检查项目检测子单元,用于若是,则判断所述参保人员当前生理时期为妊娠期的标准数据对应的检查项目是否为CT检查和/或X光。
进一步地,所述扣费依据确定模块30具体包括:
扣费单元,用于获取预设扣费规则,并基于所述预设扣费规则和所述疑似假检查的异常数据确定扣费依据;
扣费通知单元,用于基于所述扣费依据生成扣费通知,并将所述扣费通知发送至对应的定点医疗机构。
进一步地,所述异常数据的处理装置还包括:
次数范围确定模块,用于获取所述疑似假检查的异常数据对应的检查次数,并确定所述检查次数所在的次数范围;
处罚措施确定模块,用于基于预设处罚规则确定所述次数范围对应的违规等级,并获取所述违规等级对应的处罚措施;
处罚模块,用于基于所述处罚措施对相应的定点医疗机构进行处罚。
其中,上述异常数据的处理装置中各个模块与上述异常数据的处理方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有异常数据处理程序,所述异常数据处理程序被处理器执行时实现如上所述的异常数据的处理方法的步骤。
其中,异常数据处理程序被执行时所实现的方法可参照本发明异常数据的处理方法的各个实施例,此处不再赘述。
本实施例提供的方案,首先获取参保人员的就诊检查数据,并将其输入预设模型中,基于预设模型对就诊检查数据进行识别,以判断就诊检查数据中是否存在疑似假检查的异常数据,如果存在,则基于疑似假检查的异常数据确定扣费依据,以便基于扣费依据向对应的定点医疗机构出具扣费通知。通过本发明提出的异常数据的处理方法,对参保人员的就诊检查情况进行检测,判断其中是否存在疑似假检查的异常数据,并对出现疑似假检查异常数据的定点医疗机构出具扣费通知,以防止有不合理的门诊费用支出,有效管理门诊统筹基金的支出,避免对门诊统筹基金造成浪费。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种异常数据的处理方法,其特征在于,所述异常数据的处理方法包括以下步骤:
获取参保人员的就诊检查数据;
将所述就诊检查数据输入预设模型中,基于所述预设模型对所述就诊检查数据进行识别,并判断所述就诊检查数据中是否存在疑似假检查的异常数据;
若是,则基于所述疑似假检查的异常数据确定扣费依据,以便基于所述扣费依据向对应的定点医疗机构出具扣费通知。
2.如权利要求1所述的异常数据的处理方法,其特征在于,所述获取参保人员的就诊检查数据的步骤包括:
获取定点医疗机构上传的参保人员的就诊检查数据,其中,所述就诊检查数据至少包括就诊检查的定点医疗机构、参保人信息、检查项目、检查次数、参保人员当前生理时期。
3.如权利要求1所述的异常数据的处理方法,其特征在于,所述将所述就诊检查数据输入预设模型中,基于所述预设模型对所述就诊检查数据进行识别,并判断所述就诊检查数据中是否存在疑似假检查的异常数据的步骤包括:
将所述就诊检查数据输入预设模型中,基于所述预设模型将所述就诊检查数据中的文本数据转化为标准数据,其中,所述标准数据至少包括检查项目、参保人员当前生理时期;
通过嵌套循环算法对所述标准数据进行检测,得到检测结果,并基于所述检测结果判断所述标准数据中是否存在疑似假检查的异常数据。
4.如权利要求3所述的异常数据的处理方法,其特征在于,所述将所述就诊检查数据输入预设模型中,基于所述预设模型将所述就诊检查数据中的文本数据转化为标准数据的步骤包括:
将所述就诊检查数据输入预设模型中,并对所述就诊检查数据进行清洗,以得到清洗后的规范数据;
基于所述规范数据构造文本特征,以得到对应的词向量;
基于所述预设模型中的双向循环神经网络RNN模型将所述词向量编码为向量矩阵,以便基于所述向量矩阵确定对应的标准数据。
5.如权利要求3所述的异常数据的处理方法,其特征在于,所述通过嵌套循环算法对所述标准数据进行检测,得到检测结果,并基于所述检测结果判断所述标准数据中是否存在疑似假检查的异常数据的步骤包括:
通过嵌套循环算法对所述标准数据进行检测,判断其中是否存在参保人员当前生理时期为妊娠期的标准数据;
若是,则判断所述参保人员当前生理时期为妊娠期的标准数据对应的检查项目是否为CT检查和/或X光。
6.如权利要求5所述的异常数据的处理方法,其特征在于,所述基于所述疑似假检查的异常数据确定扣费依据,以便基于所述扣费依据向对应的定点医疗机构出具扣费通知的步骤包括:
获取预设扣费规则,并基于所述预设扣费规则和所述疑似假检查的异常数据确定扣费依据;
基于所述扣费依据生成扣费通知,并将所述扣费通知发送至对应的定点医疗机构。
7.如权利要求1-6中任一项所述的异常数据的处理方法,其特征在于,所述基于所述疑似假检查的异常数据确定扣费依据,以便基于所述扣费依据向对应的定点医疗机构出具扣费通知的步骤之后,所述方法还包括:
获取所述疑似假检查的异常数据对应的检查次数,并确定所述检查次数所在的次数范围;
基于预设处罚规则确定所述次数范围对应的违规等级,并获取所述违规等级对应的处罚措施;
基于所述处罚措施对相应的定点医疗机构进行处罚。
8.一种异常数据的处理装置,其特征在于,所述异常数据的处理装置包括:
检查数据获取模块,用于获取参保人员的就诊检查数据;
异常数据判断模块,用于将所述就诊检查数据输入预设模型中,基于所述预设模型对所述就诊检查数据进行识别,并判断所述就诊检查数据中是否存在疑似假检查的异常数据;
扣费依据确定模块,用于若是,则基于所述疑似假检查的异常数据确定扣费依据,以便基于所述扣费依据向对应的定点医疗机构出具扣费通知。
9.一种异常数据的处理设备,其特征在于,所述异常数据的处理设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的异常数据处理程序,所述异常数据处理程序被所述处理器执行时实现如权利要求1至7中任一项所述的异常数据的处理方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有异常数据处理程序,所述异常数据处理程序被处理器执行时实现如权利要求1至7中任一项所述的异常数据的处理方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811526901.9A CN109559242A (zh) | 2018-12-13 | 2018-12-13 | 异常数据的处理方法、装置、设备及计算机可读存储介质 |
PCT/CN2019/096076 WO2020119118A1 (zh) | 2018-12-13 | 2019-07-16 | 异常数据的处理方法、装置、设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811526901.9A CN109559242A (zh) | 2018-12-13 | 2018-12-13 | 异常数据的处理方法、装置、设备及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109559242A true CN109559242A (zh) | 2019-04-02 |
Family
ID=65869922
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811526901.9A Pending CN109559242A (zh) | 2018-12-13 | 2018-12-13 | 异常数据的处理方法、装置、设备及计算机可读存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN109559242A (zh) |
WO (1) | WO2020119118A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110727711A (zh) * | 2019-10-14 | 2020-01-24 | 平安医疗健康管理股份有限公司 | 基金数据库中异常数据检测方法、装置和计算机设备 |
WO2020119118A1 (zh) * | 2018-12-13 | 2020-06-18 | 平安医疗健康管理股份有限公司 | 异常数据的处理方法、装置、设备及计算机可读存储介质 |
CN113515588A (zh) * | 2020-04-10 | 2021-10-19 | 富泰华工业(深圳)有限公司 | 表单数据检测方法、计算机装置及存储介质 |
CN114707608A (zh) * | 2021-04-14 | 2022-07-05 | 内蒙古卫数数据科技有限公司 | 医疗质控数据处理方法、装置、设备、介质及程序产品 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102013084A (zh) * | 2010-12-14 | 2011-04-13 | 江苏大学 | 用于检测医疗保险门诊欺诈性交易的系统和方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6159872B2 (ja) * | 2014-03-05 | 2017-07-05 | 株式会社日立製作所 | 医療データ分析システム、医療データ分析方法及び記憶媒体 |
CN107392304A (zh) * | 2017-08-04 | 2017-11-24 | 中国电力科学研究院 | 一种风电机组异常数据识别方法及装置 |
CN107910068A (zh) * | 2017-11-29 | 2018-04-13 | 平安健康保险股份有限公司 | 投保用户的健康风险预测方法、装置、设备及存储介质 |
CN108492196B (zh) * | 2018-03-08 | 2020-11-10 | 平安医疗健康管理股份有限公司 | 通过数据分析推断医疗保险违规行为的风控方法 |
CN108921710A (zh) * | 2018-06-08 | 2018-11-30 | 东莞迪赛软件技术有限公司 | 医保异常检测的方法及系统 |
CN109559242A (zh) * | 2018-12-13 | 2019-04-02 | 平安医疗健康管理股份有限公司 | 异常数据的处理方法、装置、设备及计算机可读存储介质 |
-
2018
- 2018-12-13 CN CN201811526901.9A patent/CN109559242A/zh active Pending
-
2019
- 2019-07-16 WO PCT/CN2019/096076 patent/WO2020119118A1/zh active Application Filing
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102013084A (zh) * | 2010-12-14 | 2011-04-13 | 江苏大学 | 用于检测医疗保险门诊欺诈性交易的系统和方法 |
Non-Patent Citations (2)
Title |
---|
周如意: ""基于BP神经网络和关联规则的智能医疗保险稽核系统研究"", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
林源: ""新型农村合作医疗保险欺诈风险管理研究"", 《中国优秀博硕士学位论文全文数据库(博士) 经济与管理科学辑》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020119118A1 (zh) * | 2018-12-13 | 2020-06-18 | 平安医疗健康管理股份有限公司 | 异常数据的处理方法、装置、设备及计算机可读存储介质 |
CN110727711A (zh) * | 2019-10-14 | 2020-01-24 | 平安医疗健康管理股份有限公司 | 基金数据库中异常数据检测方法、装置和计算机设备 |
CN110727711B (zh) * | 2019-10-14 | 2023-10-27 | 深圳平安医疗健康科技服务有限公司 | 基金数据库中异常数据检测方法、装置和计算机设备 |
CN113515588A (zh) * | 2020-04-10 | 2021-10-19 | 富泰华工业(深圳)有限公司 | 表单数据检测方法、计算机装置及存储介质 |
CN114707608A (zh) * | 2021-04-14 | 2022-07-05 | 内蒙古卫数数据科技有限公司 | 医疗质控数据处理方法、装置、设备、介质及程序产品 |
CN114707608B (zh) * | 2021-04-14 | 2023-08-01 | 内蒙古卫数数据科技有限公司 | 医疗质控数据处理方法、装置、设备、介质及程序产品 |
Also Published As
Publication number | Publication date |
---|---|
WO2020119118A1 (zh) | 2020-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11900473B2 (en) | Method of personalizing, individualizing, and automating the management of healthcare fraud-waste-abuse to unique individual healthcare providers | |
US11631152B2 (en) | Security check system and method for configuring security check device | |
CN109559242A (zh) | 异常数据的处理方法、装置、设备及计算机可读存储介质 | |
CN109635044A (zh) | 住院数据异常检测方法、装置、设备及可读存储介质 | |
CN106104555A (zh) | 用于保护外围设备的行为分析 | |
CN110689438A (zh) | 企业类金融风险评分方法、装置、计算机设备及存储介质 | |
CN102013084A (zh) | 用于检测医疗保险门诊欺诈性交易的系统和方法 | |
Fariss et al. | Human rights texts: Converting human rights primary source documents into data | |
CN106096657A (zh) | 基于机器学习来预测数据审核目标的方法及系统 | |
CN105069308A (zh) | 医疗设备智能监控系统 | |
Lee et al. | Using Mahalanobis–Taguchi system, logistic regression, and neural network method to evaluate purchasing audit quality | |
CN109685670A (zh) | 社保违规检测方法、装置、设备及计算机可读存储介质 | |
CN109409619A (zh) | 舆情动向的预测方法、装置、介质及电子设备 | |
CN112801498A (zh) | 风险识别模型的训练方法、风险识别方法、装置及设备 | |
US20140149129A1 (en) | Healthcare fraud detection using language modeling and co-morbidity analysis | |
CN109636648A (zh) | 社保违规检测方法、装置、设备及计算机存储介质 | |
Cao et al. | Using PCA to improve the detection of medical insurance fraud in SOFM neural networks | |
CN114220555A (zh) | 风险人群分类方法和设备、系统、电子设备、存储介质 | |
CN109598633A (zh) | 社保违规检测方法、装置、设备及计算机存储介质 | |
Yoo et al. | Medicare fraud detection using graph analysis: a comparative study of machine learning and graph neural networks | |
Jing et al. | A Novel Prediction Method Based on Artificial Intelligence and Internet of Things for Detecting Coronavirus Disease (COVID‐19) | |
CN112907308B (zh) | 数据检测方法和装置、计算机可读存储介质 | |
CN108447533A (zh) | 一种多功能智慧医疗系统 | |
CN109636627B (zh) | 基于区块链的保险产品管理方法、装置、介质及电子设备 | |
CN109615538A (zh) | 社保违规检测方法、装置、设备及计算机存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190402 |
|
RJ01 | Rejection of invention patent application after publication |