CN110729054A - 异常就诊行为检测方法、装置、计算机设备及存储介质 - Google Patents
异常就诊行为检测方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN110729054A CN110729054A CN201910972523.5A CN201910972523A CN110729054A CN 110729054 A CN110729054 A CN 110729054A CN 201910972523 A CN201910972523 A CN 201910972523A CN 110729054 A CN110729054 A CN 110729054A
- Authority
- CN
- China
- Prior art keywords
- treatment
- abnormal
- diagnosis
- data
- under
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H40/00—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
- G16H40/20—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Epidemiology (AREA)
- Data Mining & Analysis (AREA)
- Primary Health Care (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本申请涉及数据分析技术领域,提供了一种异常就诊行为检测方法、装置、计算机设备和存储介质,首先,根据病种有针对性地完成就诊数据的分类,然后根据CART算法构建各就诊病种对应的就诊次数决策树,得到各就诊病种属性特征下的就诊次数,并采用箱形图算法基于各就诊病种的属性特征确定了异常就诊次数范围,最后,基于异常就诊次数范围对各就诊病种属性特征下的就诊次数进行检测,得到异常就诊行为的检测结果,减小因人的主观经验给定阈值范围筛选带来的误差,实现了根据病种的不同有针对性且合理地检测出异常就诊行为。
Description
技术领域
本申请涉及数据分析技术领域,特别是涉及一种异常就诊行为检测方法、装置、计算机设备及存储介质。
背景技术
随着社会医疗保险制度的普及,越来越多的居民使用医保卡到医疗机构就诊以便报销,为避免医疗资源的浪费,每次报销费用都设置有报销限额,但是,为了达到顶额报销,于是,出现了很多患者频繁就诊报销的行为,造成了医疗资源的过度滥用。
为避免医疗资源的过度滥用,需要对大量的就诊明细数据进行审核,来判断居民的就诊行为是否异常,目前已有学者(技术)提出能够识别用户异常就诊行为的方案,但是现有的识别用户异常就诊的方案,仅是凭借历史经验设置固定的阈值判定用户就诊次数是否异常,判定方式过于简单误差较大。
发明内容
基于此,有必要针对现有的识别异常就诊用户方法误差较大的问题,提供一种误差小的异常就诊行为检测方法、装置、计算机设备和存储介质。
一种异常就诊行为检测方法,方法包括:
获取就诊数据,就诊数据包括就诊病种;
根据就诊病种对就诊数据进行分类,得到各就诊病种下的就诊明细数据;
基于各就诊病种下的就诊明细数据,采用CART(Classification And RegressionTree,分类回归树)算法,构建各就诊病种对应的就诊次数决策树,就诊次数决策树的叶节点为各就诊病种属性特征下的就诊次数;
根据箱形图算法对就诊次数决策树中各就诊病种属性特征下的就诊次数进行划分,由划分结果确定异常就诊次数范围;
根据异常就诊次数范围对各就诊病种属性特征下的就诊次数进行检测,得到异常就诊行为检测结果。
在其中一个实施例中,基于各就诊病种下的就诊明细数据,采用CART算法,构建各就诊病种对应的就诊次数决策树包括:
对各就诊病种下的就诊明细数据进行字段整理,构建各就诊病种下的属性集;
根据就诊数据,构建训练集;
将各就诊病种下的属性集与训练集进行属性测试,得到测试结果;
根据测试结果和CART算法,完成对训练集的划分,得到各就诊病种对应的就诊次数决策树。
在其中一个实施例中,根据箱形图算法对就诊次数决策树中各就诊病种属性特征下的就诊次数进行划分,由划分结果确定异常就诊次数范围包括:
将就诊次数按照升序排列,得到就诊次数数列;
采用箱形图算法对就诊次数数列进行划分,得到上四分位数、下四分位数、上边缘数以及下边缘数;
将上四分位数至上边缘数对应的就诊次数范围以及下四分位数至下边缘数对应的就诊次数范围确定为第一异常就诊次数范围,将大于上边缘数和小于下边缘数对应的就诊次数范围确定为第二异常就诊次数范围。
在其中一个实施例中,根据异常就诊次数范围对各就诊病种属性特征下的就诊次数进行检测,得到异常就诊行为检测结果包括:
将各就诊病种属性特征下的就诊次数与第一异常就诊次数范围以及第二异常就诊次数范围进行比较;
将处于第一异常就诊次数范围之外的就诊次数标记为第一异常就诊次数、并将处于第二异常就诊次数范围之外的就诊次数标记为第二异常就诊次数;
根据第一异常就诊次数以及第二异常就诊次数查找出对应的就诊行为异常用户。
在其中一个实施例中,将就诊数据按照就诊病种进行分类,得到各就诊病种下的就诊明细数据之前,还包括:
对就诊数据进行数据预处理,数据预处理包括根据预设关联字段进行唯一性检查、根据预设比较公式进行勾稽关系检查以及根据预设标准进行统一化处理。
在其中一个实施例中,根据异常就诊次数范围对各就诊病种属性特征下的就诊次数进行检测,得到异常就诊行为检测结果之后,还包括:
调用数据抽取工具,抽取出就诊行为异常用户对应的异常就诊行为特征数据;
将抽取的异常就诊行为特征数据推送至可视化工具。
一种异常就诊行为检测装置,装置包括:
数据获取模块,用于获取就诊数据,就诊数据包括就诊病种;
数据分类模块,用于根据就诊病种对就诊数据进行分类,得到各就诊病种下的就诊明细数据;
数据处理模块,用于基于各就诊病种下的就诊明细数据,采用CART算法,构建各就诊病种对应的就诊次数决策树,就诊次数决策树的叶节点为各就诊病种属性特征下的就诊次数;
数据划分模块,用于根据箱形图算法对就诊次数决策树中各就诊病种属性特征下的就诊次数进行划分,得到异常就诊次数范围;
异常检测模块,用于根据异常就诊次数范围对各就诊病种属性特征下的就诊次数进行检测,得到异常就诊行为检测结果。
在其中一个实施例中,装置还包括:
数据预处理模块,用于对就诊数据进行数据预处理,数据预处理包括:根据预设的关联字段进行唯一性检查、根据预设的比较公式进行勾稽关系检查以及根据预设的标准进行统一化处理。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取就诊数据,就诊数据包括就诊病种;
根据就诊病种对就诊数据进行分类,得到各就诊病种下的就诊明细数据;
基于各就诊病种下的就诊明细数据,采用CART算法,构建各就诊病种对应的就诊次数决策树,就诊次数决策树的叶节点为各就诊病种属性特征下的就诊次数;
根据箱形图算法对就诊次数决策树中各就诊病种属性特征下的就诊次数进行划分,由划分结果确定异常就诊次数范围;
根据异常就诊次数范围对各就诊病种属性特征下的就诊次数进行检测,得到异常就诊行为检测结果。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取就诊数据,就诊数据包括就诊病种;
根据就诊病种对就诊数据进行分类,得到各就诊病种下的就诊明细数据;
基于各就诊病种下的就诊明细数据,采用CART算法,构建各就诊病种对应的就诊次数决策树,就诊次数决策树的叶节点为各就诊病种属性特征下的就诊次数;
根据箱形图算法对就诊次数决策树中各就诊病种属性特征下的就诊次数进行划分,由划分结果确定异常就诊次数范围;
根据异常就诊次数范围对各就诊病种属性特征下的就诊次数进行检测,得到异常就诊行为检测结果。
上述异常就诊行为检测方法、装置、计算机设备和存储介质,首先,根据病种完成就诊数据的分类,然后根据CART算法构建数据结构分明的就诊次数决策树,得到各就诊病种属性特征下的就诊次数,并采用箱形图算法基于各就诊病种的属性特征确定了异常就诊次数范围,实现了根据病种的不同设置不同的异常阈值,最后,基于异常就诊次数范围对各就诊病种属性特征下的就诊次数进行检测,得到异常就诊行为的检测结果,减小因人的主观经验给定阈值范围筛选带来的误差,实现了根据病种的不同有针对性且合理地检测出异常就诊行为。
附图说明
图1为一个实施例中异常就诊行为检测方法的应用环境图;
图2为一个实施例中异常就诊行为检测方法的流程示意图;
图3为另一个实施例中异常就诊行为检测方法的详细流程示意图;
图4为一个实施例中异常就诊行为检测装置的结构框图;
图5为另一个实施例中异常就诊行为检测装置的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的异常就诊行为检测方法,可应用于如图1所示的应用环境图中,应用场景可以是各大医疗机构的后台服务器将病患的就诊数据实时上传至服务器102,当稽核人员于终端104上操作,通过终端104向服务器102发送异常急诊行为检测的指令时,服务器102获取就诊数据,就诊数据包括就诊病种,根据就诊病种对就诊数据进行分类,得到各就诊病种下的就诊明细数据,然后,基于各就诊病种下的就诊明细数据,采用CART算法,构建各就诊病种对应的就诊次数决策树,其中,就诊次数决策树的叶节点为各就诊病种属性特征下的就诊次数,再根据箱形图算法对就诊次数决策树中各就诊病种属性特征下的就诊次数进行划分,由划分结果确定异常就诊次数范围,根据异常就诊次数范围对各就诊病种属性特征下的就诊次数进行检测,筛选出异常的就诊行为数据。其中,终端104可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器102可以用独立的服务器或者是多个服务器组成的服务器集群来实现
在其中一个实施例中,如图2所示,提供了一种异常就诊行为检测方法,以该方法应用于服务器为例包括以下步骤:
步骤S100,获取就诊数据,就诊数据包括就诊病种。
在实际应用中,可以是工作人员通过电脑终端进行异常就诊行为检测操作,服务器响应用户异常就诊行为检测的操作,获取数据库中存储的海量的就诊数据,其中,就诊数据可以包括患者的个人信息、就诊时间、地点、单据号、就诊病种等。
步骤S200,根据就诊病种对就诊数据进行分类,得到各就诊病种下的就诊明细数据。
为有针对性地检测出异常就诊行为,可以是在获取患者的就诊数据之后,根据就诊病种对就诊数据进行分类,得到就诊明细数据,就诊病种包括糖尿病、高血压以及冠心病等等。
如图3所示,在其中一个实施例中,将就诊数据按照就诊病种进行分类,得到各就诊病种下的就诊明细数据之前,还包括:步骤S150,对就诊数据进行数据预处理,数据预处理包括根据预设关联字段进行唯一性检查、根据预设比较公式进行勾稽关系检查以及根据预设标准进行统一化处理。
在获取就诊数据之后,为便于异常数据的筛选,需要将获取到的就诊数据进行预处理(数据清洗),具体的,数据预处理过程包括:通过预设的关联字段对原始数据进行唯一性检查,去除重复数据;根据报表项目间的预设的比较公式进行勾稽关系检查,如检测自费金额、自负金额、公务员补贴、企业补助、医保基金支出等各项支出是否等于总费用,所购项目单价和数量是否等于总价等勾稽关系的检查,将不满足勾稽关系的数据通过勾稽关系等式补足数据,在金额影响不大的情况下剔除不满足勾稽关系的数据;根据预设标准进行统一化处理,如将数据库中的病种名称清洗为以ICD.10为统一标准的疾病名称,将数据库中的项目名称(药品、材料及检查检验等)清洗为以社保目录为统一标准的通用名。
步骤S300,基于各就诊病种下的就诊明细数据,采用CART算法,构建各就诊病种对应的就诊次数决策树,就诊次数决策树的叶节点为各就诊病种属性特征下的就诊次数。
CART算法采用的是一种二分递归分割的技术,将当前样本分成两个子样本集,使得生成的非叶子节点都有两个分支。本实施例中,将就诊数据按照就诊病种进行分类,得到每个病种对应的患者信息分布情况(包括就诊明细数据)之后,根据决策树模型下CART算法,针对每个病种,生成就诊次数决策树,就诊次数决策树的叶节点为各个病种对应的每个属性特征下的就诊次数。具体的,属性特征包括患者患病年限,收入等级,并发症个数,患病等级,当年就诊暴露时间等。患病年限(患者患病年限不同,其就诊的规律性可能会有不同,其年、月就诊次数可能存在差异),并发症个数(患者所患病种是否有并发症这一属性可能会影响患者的就诊次数,如有并发症的患者月就诊次数可能较无并发症的患者多),患病等级(如高血压病患者,高血压分为三期,高血压三期患者可能叫一期患者就诊更为频繁),当年就诊暴露时间(暴露时间长的患者可能较暴露时间短的患者就诊更为频繁等)。
如图3所示,在其中一个实施例中,基于各就诊病种下的就诊明细数据,采用CART算法,构建各就诊病种对应的就诊次数决策树包括:步骤S320,对各就诊病种下的就诊明细数据进行字段整理,构建各就诊病种下的属性集,根据就诊数据,构建训练集,将各就诊病种下的属性集与训练集进行属性测试,得到测试结果,根据测试结果和CART算法,完成对训练集的划分,得到各就诊病种对应的就诊次数决策树。
为便于更具体的说明决策树构建过程,下面具体的病种以糖尿病为例,可以是在得到数据预处理后的就诊明细数据后,将就诊明细数据构建为训练集D,然后,根据分类后的糖尿病病种下的就诊明细数据,进行患病年限、参保人收入等级、并发症个数、糖尿病等级等字段整理,得到糖尿病下的患者属性集A,根据训练集D以及属性集A构成过程函数TreeGenerate(D,A),然后将训练集D以及属性集A进行属性测试,然后根据决策树CART算法,按照属性测试结果,将训练集D划分到各个子节点,最终生成包含各就诊病种的属性特征下的就诊次数的就诊次数决策树。具体可以是:首先,创建结点node;若D中样本全属于同一类别C,则将node标记为C类叶节点;若A为空集或者D中样本在A上取值相同,则将node标记为叶节点,其类别标记为D中样本数最多的类;从A中选择最优划分属性a**(a*为各个属性集),遍历a*是否存在取值为a*V(a*V单指某个属性,如并发症个数和患病等级)的样本,为node生成一个分支;令Dv表示D中在a*上取值为a*V的样本子集(Dv为训练集D中,属性为a*V的样本子集);若Dv为空,则将分支结点标记为叶节点,将其类别标记为D中样本最多的类;否则以(TreeGenerate(D,A)\{a*})为分支结点,输出以node为根节点的一棵关于糖尿病人的决策树,生成的决策树为每个节点下的各糖尿病参保人就诊次数。本实施例中,通过分类回归树算法进行数据划分,能够清晰地显示出重要数据。
步骤S400,根据箱形图算法对就诊次数决策树中各就诊病种属性特征下的就诊次数进行划分,由划分结果确定异常就诊次数范围。
箱形图又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图。其主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比较。箱线图的绘制方法是:先找出一组数据的最大值、最小值、中位数和两个四分位数;然后,连接两个四分位数画出箱子;再将最大值和最小值与箱子相连接,中位数在箱子中间。本实施例中,根据箱形图算法对就诊次数决策树中各就诊病种属性特征下的就诊次数进行划分,由划分结果确定异常就诊次数范围,其中,划分结果包括上四分位数、下四分位数、上边缘数以及下边缘数。
在其中一个实施例中,根据箱形图算法对就诊次数决策树中各就诊病种属性特征下的就诊次数进行划分,由划分结果确定异常就诊次数范围包括:将就诊次数按照升序排列,得到就诊次数数列,采用箱形图算法对就诊次数数列进行划分,得到上四分位数、下四分位数、上边缘数以及下边缘数,将上四分位数至上边缘数对应的就诊次数范围以及下四分位数至下边缘数对应的就诊次数范围确定为第一异常就诊次数范围,将大于上边缘数和小于下边缘数对应的就诊次数范围确定为第二异常就诊次数范围。
首先,将就诊次数决策树包括的就诊次数按照升序关系,从小到大排列时候,调用箱形图算法,对就诊次数进行划分,绘制出箱形图,得到上四分位数、下四分位数、上边缘数(最大值)以及下边缘数(最小值),然后,将将上四分位数至上边缘数对应的就诊次数范围以及下四分位数至下边缘数对应的就诊次数范围确定为第一异常就诊次数范围(即可疑就诊次数范围,也就是表明该就诊次数可能存在有频繁就诊报销行为),将大于上边缘数和小于下边缘数对应的就诊次数范围确定为第二异常就诊次数范围(即异常就诊次数范围),然后,依据第一异常就诊次数范围以及第二异常就诊次数范围识别出异常的就诊行为数据。本实施例中,箱形图的绘制依靠实际数据,不需要事先假定数据服从特定的分布形式,没有对数据作任何限制性要求,能够真实直观地表现数据形状的本来面貌,并且,箱形图判断异常值的标准以四分位数和四分位距为基础,四分位数具有一定的耐抗性,多达25%的数据可以变得任意远而不会很大地扰动四分位数,所以异常值不能对这个标准施加影响,箱形图识别异常值的结果客观性强。
步骤S500,根据异常就诊次数范围对各就诊病种属性特征下的就诊次数进行检测,得到异常就诊行为检测结果。
如上述实施例所述,确定异常就诊次数范围之后,遍历就诊次数决策树的各就诊病种属性特征下的就诊次数,将所有的就诊次数数值与异常就诊次数范围进行比较,若就诊次数大于上四分位数或小于下四分位数,则表明该病种下的就诊次数可疑,若就诊次数大于上边缘值或小于下边缘值,则表明该病种下的就诊次数异常,然后以此标记各就诊病种属性特征下的就诊次数,得到异常就诊行为检测结果。
在其中一个实施例中,根据异常就诊次数范围对各就诊病种属性特征下的就诊次数进行检测,得到异常就诊行为检测结果包括:将各就诊病种属性特征下的就诊次数与第一异常就诊次数范围以及第二异常就诊次数范围进行比较,将处于第一异常就诊次数范围之外的就诊次数标记为第一异常就诊次数、并将处于第二异常就诊次数范围之外的就诊次数标记为第二异常就诊次数,根据第一异常就诊次数以及第二异常就诊次数查找出对应的就诊行为异常用户。
在实际应用中,可以是查找出异常的就诊次数之后,根据异常就诊次数查找出存在异常就诊行为的患者信息。具体的,可以是:将各就诊病种属性特征下的就诊次数与第一异常就诊次数范围以及第二异常就诊次数范围进行比较,将处于第一异常就诊次数范围之外的就诊次数标记为第一异常就诊次数、并将处于第二异常就诊次数范围之外的就诊次数标记为第二异常就诊次数,根据第一异常就诊次数以及第二异常就诊次数查找出对应的就诊行为异常的患者,进一步的,还可以是将根据第一异常就诊次数查找出的就诊行为异常的患者标记为就诊行为可疑患者,将根据第二异常就诊次数查找出的就诊行为异常的患者标记为就诊行为异常患者,以此将存在异常就诊行为的患者划分为两个群体,便于稽核工作的展开。本实施例中,通过异常就诊次数,关联查询定位出存在异常就诊行为的患者,能够直观地反映出存在异常就诊行为的患者,有利于工作人员对其进行提示或警告,在一定程度上防止了医疗资源的过度浪费。
上述异常就诊行为检测方法,首先,根据病种完成就诊数据的分类,然后根据CART算法构建数据结构分明的就诊次数决策树,得到各就诊病种属性特征下的就诊次数,并采用箱形图算法基于各就诊病种的属性特征确定了异常就诊次数范围,实现了根据病种的不同设置不同的异常阈值,最后,基于异常就诊次数范围对各就诊病种属性特征下的就诊次数进行检测,得到异常就诊行为的检测结果,减小因人的主观经验给定阈值范围筛选带来的误差,实现了根据病种的不同有针对性且合理地检测出异常就诊行为。
在其中一个实施例中,根据异常就诊次数范围对各就诊病种属性特征下的就诊次数进行检测,得到异常就诊行为检测结果之后,还包括:调用数据抽取工具,抽取出就诊行为异常用户对应的异常就诊行为特征数据,将抽取的异常就诊行为特征数据推送至可视化工具。
异常就诊行为特征数据包括就诊时间、就诊机构、患者的就诊病种,所涉及的就医项目以及涉及的违规金额等数据。可以是通过预设的数据抽取工具,将上述数据从数据库中抽取出来,并推送至预设的可视化工具中进行可视化展示。本实施例中,对异常就诊行为特征数据进行抽取和可视化展示,能够更直观地反映出异常就诊行为的信息分布情况。具体的,可以是根据kettle流程工具和预设的数据定时预跑规则,抽取出就诊次数异常的参保人对应的异常就诊行为特征数据,并将异常就诊行为特征数据推送至tableau按照预设维度进行可视化展示。其中,预设的数据定时预跑规则可以为每周、每月或每日进行数据更新,使新推送异常就诊行为特征数据在更新后并推送到tableau可视化界面,预设的维度可以是就诊时间分布,就诊机构分布,异常就诊的病种分布,所涉及的就医项目分布以及人群-违规金额线性分布等。本实施例中,通过预设的数据抽取工具以及可视化工具能够定时将异常就诊行为特征数据进行多维度展示,便于稽核人员开展稽核工作,对异常数据进行精确定位。
应该理解的是,虽然图2至图3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2至图3中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在其中一个实施例中,如图4所示,提供了一种异常就诊行为检测装置,包括:数据获取模块410、数据分类模块420、数据处理模块430、数据划分模块440以及异常检测模块450,其中:
数据获取模块410,用于获取就诊数据,就诊数据包括就诊病种。
数据分类模块420,用于根据就诊病种对就诊数据进行分类,得到各就诊病种下的就诊明细数据。
数据处理模块430,用于基于各就诊病种下的就诊明细数据,采用CART算法,构建各就诊病种对应的就诊次数决策树,就诊次数决策树的叶节点为各就诊病种属性特征下的就诊次数。
数据划分模块440,用于根据箱形图算法对就诊次数决策树中各就诊病种属性特征下的就诊次数进行划分,得到异常就诊次数范围。
异常检测模块450,用于根据异常就诊次数范围对各就诊病种属性特征下的就诊次数进行检测,得到异常就诊行为检测结果。
如图5所示,在其中一个实施例中,异常就诊行为检测装置还包括数据预处理模块460,用于数据预处理模块,用于对就诊数据进行数据预处理,数据预处理包括:根据预设的关联字段进行唯一性检查、根据预设的比较公式进行勾稽关系检查以及根据预设的标准进行统一化处理。
如图5所示,在其中一个实施例中,异常就诊行为检测装置还包括数据可视化模块470,用于调用数据抽取工具,抽取出就诊行为异常用户对应的异常就诊行为特征数据,将抽取的异常就诊行为特征数据推送至可视化工具。
在其中一个实施例中,数据处理模块430还用于对各就诊病种下的就诊明细数据进行字段整理,构建各就诊病种下的属性集,根据就诊数据,构建训练集,将各就诊病种下的属性集与训练集进行属性测试,得到测试结果,根据测试结果和CART算法,完成对训练集的划分,得到各就诊病种对应的就诊次数决策树。
在其中一个实施例中,数据划分模块440还用于将就诊次数按照升序排列,得到就诊次数数列,采用箱形图算法对就诊次数数列进行划分,得到上四分位数、下四分位数、上边缘数以及下边缘数,将上四分位数至上边缘数对应的就诊次数范围以及下四分位数至下边缘数对应的就诊次数范围确定为第一异常就诊次数范围,将大于上边缘数和小于下边缘数对应的就诊次数范围确定为第二异常就诊次数范围。
在其中一个实施例中,异常检测模块450还用于将各就诊病种属性特征下的就诊次数与第一异常就诊次数范围以及第二异常就诊次数范围进行比较,将处于第一异常就诊次数范围之外的就诊次数标记为第一异常就诊次数、并将处于第二异常就诊次数范围之外的就诊次数标记为第二异常就诊次数,根据第一异常就诊次数以及第二异常就诊次数查找出对应的就诊行为异常用户。
关于异常就诊行为检测装置的具体限定可以参见上文中对于异常就诊行为检测方法的限定,在此不再赘述。上述异常就诊行为检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在其中一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储异常就诊行为检测结果以及各大医疗机构上传的就诊数据等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种异常就诊行为检测方法。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在其中一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:获取就诊数据,就诊数据包括就诊病种,根据就诊病种对就诊数据进行分类,得到各就诊病种下的就诊明细数据,基于各就诊病种下的就诊明细数据,采用CART算法,构建各就诊病种对应的就诊次数决策树,就诊次数决策树的叶节点为各就诊病种属性特征下的就诊次数,根据箱形图算法对就诊次数决策树中各就诊病种属性特征下的就诊次数进行划分,由划分结果确定异常就诊次数范围,根据异常就诊次数范围对各就诊病种属性特征下的就诊次数进行检测,得到异常就诊行为检测结果。
在其中一个实施例中,处理器执行计算机程序时还实现以下步骤:对各就诊病种下的就诊明细数据进行字段整理,构建各就诊病种下的属性集,根据就诊数据,构建训练集,将各就诊病种下的属性集与训练集进行属性测试,得到测试结果,根据测试结果和CART算法,完成对训练集的划分,得到各就诊病种对应的就诊次数决策树。
在其中一个实施例中,处理器执行计算机程序时还实现以下步骤:将就诊次数按照升序排列,得到就诊次数数列,采用箱形图算法对就诊次数数列进行划分,得到上四分位数、下四分位数、上边缘数以及下边缘数,将上四分位数至上边缘数对应的就诊次数范围以及下四分位数至下边缘数对应的就诊次数范围确定为第一异常就诊次数范围,将大于上边缘数和小于下边缘数对应的就诊次数范围确定为第二异常就诊次数范围。
在其中一个实施例中,处理器执行计算机程序时还实现以下步骤:将各就诊病种属性特征下的就诊次数与第一异常就诊次数范围以及第二异常就诊次数范围进行比较,将处于第一异常就诊次数范围之外的就诊次数标记为第一异常就诊次数、并将处于第二异常就诊次数范围之外的就诊次数标记为第二异常就诊次数,根据第一异常就诊次数以及第二异常就诊次数查找出对应的就诊行为异常用户。
在其中一个实施例中,处理器执行计算机程序时还实现以下步骤:对就诊数据进行数据预处理,数据预处理包括根据预设关联字段进行唯一性检查、根据预设比较公式进行勾稽关系检查以及根据预设标准进行统一化处理。
在其中一个实施例中,处理器执行计算机程序时还实现以下步骤:调用数据抽取工具,抽取出就诊行为异常用户对应的异常就诊行为特征数据,将抽取的异常就诊行为特征数据推送至可视化工具。
在其中一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取就诊数据,就诊数据包括就诊病种,根据就诊病种对就诊数据进行分类,得到各就诊病种下的就诊明细数据,基于各就诊病种下的就诊明细数据,采用CART算法,构建各就诊病种对应的就诊次数决策树,就诊次数决策树的叶节点为各就诊病种属性特征下的就诊次数,根据箱形图算法对就诊次数决策树中各就诊病种属性特征下的就诊次数进行划分,由划分结果确定异常就诊次数范围,根据异常就诊次数范围对各就诊病种属性特征下的就诊次数进行检测,得到异常就诊行为检测结果。
在其中一个实施例中,计算机程序被处理器执行时还实现以下步骤:对各就诊病种下的就诊明细数据进行字段整理,构建各就诊病种下的属性集,根据就诊数据,构建训练集,将各就诊病种下的属性集与训练集进行属性测试,得到测试结果,根据测试结果和CART算法,完成对训练集的划分,得到各就诊病种对应的就诊次数决策树。
在其中一个实施例中,计算机程序被处理器执行时还实现以下步骤:将就诊次数按照升序排列,得到就诊次数数列,采用箱形图算法对就诊次数数列进行划分,得到上四分位数、下四分位数、上边缘数以及下边缘数,将上四分位数至上边缘数对应的就诊次数范围以及下四分位数至下边缘数对应的就诊次数范围确定为第一异常就诊次数范围,将大于上边缘数和小于下边缘数对应的就诊次数范围确定为第二异常就诊次数范围。
在其中一个实施例中,计算机程序被处理器执行时还实现以下步骤:将各就诊病种属性特征下的就诊次数与第一异常就诊次数范围以及第二异常就诊次数范围进行比较,将处于第一异常就诊次数范围之外的就诊次数标记为第一异常就诊次数、并将处于第二异常就诊次数范围之外的就诊次数标记为第二异常就诊次数,根据第一异常就诊次数以及第二异常就诊次数查找出对应的就诊行为异常用户。
在其中一个实施例中,计算机程序被处理器执行时还实现以下步骤:对就诊数据进行数据预处理,数据预处理包括根据预设关联字段进行唯一性检查、根据预设比较公式进行勾稽关系检查以及根据预设标准进行统一化处理。
在其中一个实施例中,计算机程序被处理器执行时还实现以下步骤:调用数据抽取工具,抽取出就诊行为异常用户对应的异常就诊行为特征数据,将抽取的异常就诊行为特征数据推送至可视化工具。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种异常就诊行为检测方法,其特征在于,所述方法包括:
获取就诊数据,所述就诊数据包括就诊病种;
根据所述就诊病种对所述就诊数据进行分类,得到各就诊病种下的就诊明细数据;
基于所述各就诊病种下的就诊明细数据,采用分类回归树CART算法,构建各就诊病种对应的就诊次数决策树,所述就诊次数决策树的叶节点为各就诊病种属性特征下的就诊次数;
根据箱形图算法对所述就诊次数决策树中各就诊病种属性特征下的就诊次数进行划分,由划分结果确定异常就诊次数范围;
根据所述异常就诊次数范围对所述各就诊病种属性特征下的就诊次数进行检测,得到异常就诊行为检测结果。
2.根据权利要求1所述的异常就诊行为检测方法,其特征在于,所述基于所述各就诊病种下的就诊明细数据,采用分类回归树CART算法,构建各就诊病种对应的就诊次数决策树包括:
对所述各就诊病种下的就诊明细数据进行字段整理,构建各就诊病种下的属性集;
根据所述就诊数据,构建训练集;
将所述各就诊病种下的属性集与所述训练集进行属性测试,得到测试结果;
根据所述测试结果和所述分类回归树CART算法,完成对所述训练集的划分,得到各就诊病种对应的就诊次数决策树。
3.根据权利要求1所述的异常就诊行为检测方法,其特征在于,所述根据箱形图算法对所述就诊次数决策树中各就诊病种属性特征下的就诊次数进行划分,由划分结果确定异常就诊次数范围包括:
将所述就诊次数按照升序排列,得到就诊次数数列;
采用箱形图算法对所述就诊次数数列进行划分,得到上四分位数、下四分位数、上边缘数以及下边缘数;
将所述上四分位数至所述上边缘数对应的就诊次数范围以及所述下四分位数至所述下边缘数对应的就诊次数范围确定为第一异常就诊次数范围,将大于所述上边缘数和小于所述下边缘数对应的就诊次数范围确定为第二异常就诊次数范围。
4.根据权利要求3所述的异常就诊行为检测方法,其特征在于,所述根据所述异常就诊次数范围对所述各就诊病种属性特征下的就诊次数进行检测,得到异常就诊行为检测结果包括:
将所述各就诊病种属性特征下的就诊次数与所述第一异常就诊次数范围以及所述第二异常就诊次数范围进行比较;
将处于所述第一异常就诊次数范围之外的就诊次数标记为第一异常就诊次数、并将处于所述异常就诊次数范围之外的就诊次数标记为第二异常就诊次数;
根据所述第一异常就诊次数以及所述第二异常就诊次数查找出对应的异常就诊行为异常用户。
5.根据权利要求4所述的异常就诊行为检测方法,其特征在于,所述根据所述异常就诊次数范围对所述各就诊病种属性特征下的就诊次数进行检测,得到异常就诊行为检测结果之后,还包括:
调用数据抽取工具,抽取出所述就诊行为异常用户对应的异常就诊行为特征数据;
将抽取的异常就诊行为特征数据推送至可视化工具。
6.根据权利要求1所述的异常就诊行为检测方法,其特征在于,所述将所述就诊数据按照所述就诊病种进行分类,得到各就诊病种下的就诊明细数据之前,还包括:
对所述就诊数据进行数据预处理,所述数据预处理包括根据预设关联字段进行唯一性检查、根据预设比较公式进行勾稽关系检查以及根据预设标准进行统一化处理。
7.一种异常就诊行为检测装置,其特征在于,所述装置包括:
数据获取模块,用于获取就诊数据,所述就诊数据包括就诊病种;
数据分类模块,用于根据所述就诊病种对所述就诊数据进行分类,得到各就诊病种下的就诊明细数据;
数据处理模块,用于基于所述各就诊病种下的就诊明细数据,采用分类回归树CART算法,构建各就诊病种对应的就诊次数决策树,所述就诊次数决策树的叶节点为各就诊病种属性特征下的就诊次数;
数据划分模块,用于根据箱形图算法对所述就诊次数决策树中各就诊病种属性特征下的就诊次数进行划分,得到异常就诊次数范围;
异常检测模块,用于根据所述异常就诊次数范围对所述各就诊病种属性特征下的就诊次数进行检测,得到异常就诊行为检测结果。
8.根据权利要求7所述的异常就诊行为检测装置,其特征在于,所述装置还包括:
数据预处理模块,用于对所述就诊数据进行数据预处理,所述数据预处理包括:根据预设的关联字段进行唯一性检查、根据预设的比较公式进行勾稽关系检查以及根据预设的标准进行统一化处理。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910972523.5A CN110729054B (zh) | 2019-10-14 | 2019-10-14 | 异常就诊行为检测方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910972523.5A CN110729054B (zh) | 2019-10-14 | 2019-10-14 | 异常就诊行为检测方法、装置、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110729054A true CN110729054A (zh) | 2020-01-24 |
CN110729054B CN110729054B (zh) | 2023-04-11 |
Family
ID=69221105
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910972523.5A Active CN110729054B (zh) | 2019-10-14 | 2019-10-14 | 异常就诊行为检测方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110729054B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111539633A (zh) * | 2020-04-26 | 2020-08-14 | 北京思特奇信息技术股份有限公司 | 一种业务数据质量的稽核方法、系统、装置和存储介质 |
CN113469697A (zh) * | 2021-06-30 | 2021-10-01 | 重庆富民银行股份有限公司 | 基于知识图谱的无监督异常检测方法及装置 |
CN113780457A (zh) * | 2021-09-18 | 2021-12-10 | 平安医疗健康管理股份有限公司 | 中医资源消耗的异常检测方法、装置、设备及介质 |
CN114332742A (zh) * | 2022-03-08 | 2022-04-12 | 西安科技大学 | 一种基于深度神经网络的异常视频大数据清洗方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106845098A (zh) * | 2017-01-17 | 2017-06-13 | 天津艾登科技有限公司 | 一种基于决策树算法的疾病诊断分组的实现方法 |
CN109346182A (zh) * | 2018-08-28 | 2019-02-15 | 昆明理工大学 | 一种基于cs-rf的地中海贫血病的风险预警方法 |
CN109447187A (zh) * | 2018-12-25 | 2019-03-08 | 中南大学 | 电机故障诊断方法及系统 |
CN109887122A (zh) * | 2019-02-19 | 2019-06-14 | 南京洛普股份有限公司 | 一种船闸机电故障远程智能诊断方法及系统 |
-
2019
- 2019-10-14 CN CN201910972523.5A patent/CN110729054B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106845098A (zh) * | 2017-01-17 | 2017-06-13 | 天津艾登科技有限公司 | 一种基于决策树算法的疾病诊断分组的实现方法 |
CN109346182A (zh) * | 2018-08-28 | 2019-02-15 | 昆明理工大学 | 一种基于cs-rf的地中海贫血病的风险预警方法 |
CN109447187A (zh) * | 2018-12-25 | 2019-03-08 | 中南大学 | 电机故障诊断方法及系统 |
CN109887122A (zh) * | 2019-02-19 | 2019-06-14 | 南京洛普股份有限公司 | 一种船闸机电故障远程智能诊断方法及系统 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111539633A (zh) * | 2020-04-26 | 2020-08-14 | 北京思特奇信息技术股份有限公司 | 一种业务数据质量的稽核方法、系统、装置和存储介质 |
CN113469697A (zh) * | 2021-06-30 | 2021-10-01 | 重庆富民银行股份有限公司 | 基于知识图谱的无监督异常检测方法及装置 |
CN113469697B (zh) * | 2021-06-30 | 2022-12-06 | 重庆富民银行股份有限公司 | 基于知识图谱的无监督异常检测方法及装置 |
CN113780457A (zh) * | 2021-09-18 | 2021-12-10 | 平安医疗健康管理股份有限公司 | 中医资源消耗的异常检测方法、装置、设备及介质 |
CN113780457B (zh) * | 2021-09-18 | 2024-05-14 | 平安医疗健康管理股份有限公司 | 中医资源消耗的异常检测方法、装置、设备及介质 |
CN114332742A (zh) * | 2022-03-08 | 2022-04-12 | 西安科技大学 | 一种基于深度神经网络的异常视频大数据清洗方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110729054B (zh) | 2023-04-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110729054B (zh) | 异常就诊行为检测方法、装置、计算机设备及存储介质 | |
CN111339126B (zh) | 医疗数据筛选方法、装置、计算机设备和存储介质 | |
JP5586373B2 (ja) | 支払請求を処理するコンポーネントの機能をコンピュータシステムに実現させるプログラムが記録されているコンピュータ読み取り可能な記憶媒体、およびコンピュータシステムに支払請求を処理させるコンピュータシステムの動作方法 | |
CN108876636B (zh) | 理赔智能风控方法、系统、计算机设备及存储介质 | |
US20020133441A1 (en) | Methods and systems for identifying attributable errors in financial processes | |
WO2014201515A1 (en) | Medical data processing for risk prediction | |
EP3072089A1 (en) | Methods, systems, and articles of manufacture for the management and identification of causal knowledge | |
CN111180065A (zh) | 保险用户评估方法、装置、电子设备及计算机可读介质 | |
CN111767192B (zh) | 基于人工智能的业务数据检测方法、装置、设备和介质 | |
CN111210356B (zh) | 医保数据分析方法、装置、计算机设备和存储介质 | |
CN111383761A (zh) | 医疗数据分析方法、装置、电子设备及计算机可读介质 | |
WO2020049404A2 (en) | Visualization of social determinants of health | |
CN112035619A (zh) | 基于人工智能的医疗问诊单筛选方法、装置、设备和介质 | |
Idris et al. | Validating dimensions of operations flexibility in Malaysian service firms: a confirmatory factor analytics approach | |
CN111221876A (zh) | 数据降维处理方法、装置、计算机设备和存储介质 | |
US11646121B2 (en) | Systems and methods for analyzing and validating patient information trends | |
CN113642672A (zh) | 医保数据的特征加工方法、装置、计算机设备及存储介质 | |
CN112086175A (zh) | 医疗物价费用监管方法、系统、计算机设备及存储介质 | |
CN109615204B (zh) | 医疗数据的质量评估方法、装置、设备及可读存储介质 | |
CN110727711B (zh) | 基金数据库中异常数据检测方法、装置和计算机设备 | |
US11514068B1 (en) | Data validation system | |
CN111274231B (zh) | 异常医保数据排查方法、装置、计算机设备和存储介质 | |
US20210350468A1 (en) | Network graph outlier detection for identifying suspicious behavior | |
CN114170000A (zh) | 信用卡用户风险类别识别方法、装置、计算机设备和介质 | |
JP6770012B2 (ja) | 情報分析システムおよび情報分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20220520 Address after: 518048 China Aviation Center 2901, No. 1018, Huafu Road, Huahang community, Huaqiang North Street, Futian District, Shenzhen, Guangdong Province Applicant after: Shenzhen Ping An medical and Health Technology Service Co.,Ltd. Address before: Room 12G, Area H, 666 Beijing East Road, Huangpu District, Shanghai 200001 Applicant before: PING AN MEDICAL AND HEALTHCARE MANAGEMENT Co.,Ltd. |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |