CN107194184B - 基于时间序列相似性分析的在院人次异常检测方法及系统 - Google Patents

基于时间序列相似性分析的在院人次异常检测方法及系统 Download PDF

Info

Publication number
CN107194184B
CN107194184B CN201710397683.2A CN201710397683A CN107194184B CN 107194184 B CN107194184 B CN 107194184B CN 201710397683 A CN201710397683 A CN 201710397683A CN 107194184 B CN107194184 B CN 107194184B
Authority
CN
China
Prior art keywords
hospital
time
sliding window
module
people
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710397683.2A
Other languages
English (en)
Other versions
CN107194184A (zh
Inventor
刘晓冰
罗林
吕德涛
赵和章
王利亚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Shulian Yikang Technology Co ltd
Original Assignee
Chengdu Shulian Yikang Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Shulian Yikang Technology Co ltd filed Critical Chengdu Shulian Yikang Technology Co ltd
Priority to CN201710397683.2A priority Critical patent/CN107194184B/zh
Publication of CN107194184A publication Critical patent/CN107194184A/zh
Application granted granted Critical
Publication of CN107194184B publication Critical patent/CN107194184B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了基于时间序列相似性分析的在院人次异常检测方法及系统,涉及在院人次异常检测领域。包括如下步骤:在院人次时间序列提取、滑动窗口时间序列构建、序列间DTW距离计算、标准化、异常指数计算和异常输出。在院人次异常检测装置包括:在院人次时间序列提取模块、滑动窗口时间序列构建模块、序列间DTW距离计算模块、标准化模块、异常指数计算模块、异常输出模块和结果呈现模块。本发明通过构建时间序列相似度识别异常模型,动态检测在院人次异常情况,为医疗保险欺诈提供科学防范手段;同时,对同级别医院在院人次进行异常检测,能够掌握同级别医院在院人次的变化趋势,从而为突发性传染疾病爆发及其在人群中的传播态势感知提供预测依据。

Description

基于时间序列相似性分析的在院人次异常检测方法及系统
技术领域
本发明涉及在院人次异常检测领域,尤其是基于时间序列相似性分析的在院人次异常检测方法及系统。
背景技术
为促进社会的稳定与发展、保障人民基本权益,我国建立了完善的社会保障体系,其中医疗保险是社会保障体系中的一个重要组成部分。鉴于医疗保险的优惠政策,不少违规者通过虚假就医进行医疗保险欺诈获取高额利润,造成医疗保险基金严重损失,影响医疗保险基金的公平性与公正性。因此,有效检测虚假就医行为,对促进医疗保险体系的健康运作具有重要现实意义。
目前,骗保人运用多种手段进行医疗保险欺诈,比如说贩卖药品、挂床住院、摞床住院、虚报费用,如何有效检测医疗保险欺诈行为成为医疗保险体系的研究重点。一般地,可通过“病人”就医数据,如在院人次来检测医疗保险欺诈行为。而医院每天都会增加大量的原始数据,且医院每天的数据都是动态增加。因此,必须采用一种有效的方式动态检测医院在院人次的异常情况。
时间序列相似性问题最早由Agrawal等人于1993年提出,近年来已成为研究热点问题之一。时间序列相似性问题是数据挖掘中的一个重要而基础的问题,为其他挖掘手段提供了必要的技术支持,现已广泛应用于金融、医学、生物、网络等多个领域。时间序列相似性度量方式中,动态时间弯曲(Dynamic Time Warping,DTW)距离根据最小代价的时间弯曲路径进行对齐匹配,能够支持时间序列的时间轴伸缩;同时,滑动窗口(Sliding Window,SW)技术能很好地处理动态时间序列的相似性问题。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于时间序列相似性分析的在院人次异常检测方法及系统,通过精确检测在院人次的异常变化,为医疗保险欺诈提供科学防范手段;同时,可为突发性传染疾病爆发及其在人群中的传播态势感知提供预测依据。
本发明是通过以下技术方案来实现的:基于时间序列相似性分析的在院人次异常检测方法,它具体包括如下步骤:
S1:在院人次时间序列提取:从数据库中提取同级别医院的住院信息,构建在院人次时间序列,并对数据进行预处理;
S2:滑动窗口SW时间序列构建:分别计算被检测医院和同级别医院在滑动窗口SW的在院人次环比增长率,并重复所述内容,进而得到不同长度的滑动窗口时间序列,选择最优的滑动窗口长度;
S3:序列间DTW距离计算:基于被检测医院与同级别的医院的在院人次环比增长率序列,计算序列间DTW距离;
S4:标准化:对序列间DTW值进行极差标准化,并对被检测医院当前时间在院人次的环比增长率进行极差标准化;
S5:异常指数计算:当前时间i、被检测医院k的异常指数
Figure DEST_PATH_GDA0001343519780000021
α+β=1,α、β分别为当前时间和滑动窗口历史时间的权重;
S6:异常输出:异常阈值为Ti,若
Figure DEST_PATH_GDA0001343519780000022
则输出异常的被检测医院k和时间i。
进一步限定,所述的步骤S1具体包括如下子步骤:
S11:数据收集和预处理,选定一个医院等级,从数据库中提取同级别医院住院信息的以下特征:就诊ID、医院ID、医院名称、医院等级、入院时间和出院时间;
S12:构建在院人次时间序列Dn,具体表示为:
Dn=<d1=(v1,t1),...,di=(vi,ti),...,dn=(vn,tn)>
其中di=(vi,ti)表示时间ti的在院人次vi
被检测医院k的在院人次
Figure DEST_PATH_GDA0001343519780000023
上午12点以前出院的患者,不计入当天的在院人次;上午 12点以后出院的患者,计入当天的在院人次,具体表示如下:
Figure DEST_PATH_GDA0001343519780000024
进一步限定,所述的步骤S2具体包括如下子步骤:
S21:医院k∈(1,...,k,...,w)(w表示共w家医院),在长度为s的滑动窗口SW的在院人次环比增长率,构成长度为s-1的序列,记为
Figure DEST_PATH_GDA0001343519780000025
Figure DEST_PATH_GDA0001343519780000026
S22:医院k同级别医院(共w家医院)在滑动窗口SW(长度为s)的在院人次环比增长率,构成长度为s-1的序列,记为
Figure DEST_PATH_GDA0001343519780000027
Figure DEST_PATH_GDA0001343519780000031
S23:调整滑动窗口长度,重复步骤S21、S22,得到不同长度的滑动窗口时间序列,根据在院人次异常预测准确率指标,选择最优的滑动窗口长度。
所述的滑动窗口长度的选择具体为:
S231:设定滑动窗口长度初始值;
S232:通过人工打标签方式,判断预测准确率,并据此进一步调整滑动窗口长度;
S233:根据所设定的在院人次异常预测准确率指标,选择滑动窗口长度。
进一步限定,所述的步骤S3具体包括如下子步骤:
医院k和同级别医院在长度为s的滑动窗口SW的在院人次环比增长率序列分别为:
Figure DEST_PATH_GDA0001343519780000032
其DTW距离记为
Figure DEST_PATH_GDA0001343519780000033
Figure DEST_PATH_GDA0001343519780000034
f(0,0)=0,f(i,0)=f(0,j)=∞
Figure DEST_PATH_GDA0001343519780000035
所述的
Figure DEST_PATH_GDA0001343519780000036
可通过不同的距离进行定义。
进一步限定,所述的步骤S4具体包括如下子步骤:
S41:对滑动窗口历史时期的DTW距离标准化,
Figure DEST_PATH_GDA0001343519780000037
进行极差标准化,记为
Figure DEST_PATH_GDA0001343519780000038
Figure DEST_PATH_GDA0001343519780000039
S42:将当前时期的环比增长率标准化,医院k∈(1,...,k,...,w)当前时间i的在院人次环比增长率
Figure DEST_PATH_GDA00013435197800000310
Figure DEST_PATH_GDA00013435197800000311
进行极差标准化,记为
Figure DEST_PATH_GDA00013435197800000312
Figure DEST_PATH_GDA00013435197800000313
基于时间序列相似性分析的在院人次异常检测装置,它包括在院人次时间序列提取模块、滑动窗口时间序列构建模块、序列间DTW距离计算模块、标准化模块、异常指数计算模块、异常输出模块和结果呈现模块;
所述的在院人次时间序列提取模块,提取同级别医院的住院信息,构建在院人次时间序列,并对数据进行预处理;
所述的滑动窗口时间序列构建模块,计算被检测医院和同级别医院在滑动窗口SW的在院人次环比增长率,并重复所述内容,进而得到不同长度的滑动窗口时间序列,选择最优的滑动窗口长度;
所述的序列间DTW距离计算模块,基于被检测医院与同级别医院的在院人次环比增长率序列,计算序列间DTW距离;
所述的标准化模块,对序列间DTW值进行极差标准化,并对被检测医院当前时间在院人次的环比增长率进行极差标准化;
所述的异常指数计算模块,基于当前时间与滑动窗口历史时间,计算当前时间i、被检测医院k的异常指数;
所述的异常输出模块,输出异常指数大于阈值的被检测医院k和时间i;
所述的结果呈现模块,对输出结果进行呈现。
基于时间序列相似性分析的在院人次异常检测系统,它包括:
处理器,用于执行程序;
存储器,用于存储由处理器执行的程序;
进一步限定,所述的处理器,程序在执行时包括以下步骤:
S1:在院人次时间序列提取:从数据库中提取同级别医院的住院信息,构建在院人次时间序列,并对数据进行预处理;
S2:滑动窗口SW时间序列构建:分别计算被检测医院和同级别医院在滑动窗口SW的在院人次环比增长率,并重复所述内容,进而得到不同长度的滑动窗口时间序列,选择最优的滑动窗口长度;
S3:序列间DTW距离计算:基于被检测医院与同级别的医院的在院人次环比增长率序列,计算序列间DTW距离;
S4:标准化:对序列间DTW值进行极差标准化,并对被检测医院当前时间在院人次的环比增长率进行极差标准化;
S5:异常指数计算:当前时间i、被检测医院k的异常指数
Figure DEST_PATH_GDA0001343519780000041
α+β=1,α、β分别为当前时间和滑动窗口历史时间的权重;
S6:异常输出:异常阈值为Ti,若
Figure DEST_PATH_GDA0001343519780000051
则输出异常的被检测医院k和时间i。
进一步限定,所述的存储器,程序在执行时包括以下步骤:
S1:在院人次时间序列提取:从数据库中提取同级别医院的住院信息,构建在院人次时间序列,并对数据进行预处理;
S2:滑动窗口SW时间序列构建:分别计算被检测医院和同级别医院在滑动窗口SW的在院人次环比增长率,并重复所述内容,进而得到不同长度的滑动窗口时间序列,选择最优的滑动窗口长度;
S3:序列间DTW距离计算:基于被检测医院与同级别的医院的在院人次环比增长率序列,计算序列间DTW距离;
S4:标准化:对序列间DTW值进行极差标准化,对被检测医院当前时间在院人次的环比增长率进行极差标准化;
S5:异常指数计算:当前时间i、被检测医院k的异常指数
Figure DEST_PATH_GDA0001343519780000052
α+β=1,α、β分别为当前时间和滑动窗口历史时间的权重;
S6:异常输出:异常阈值为Ti,若
Figure DEST_PATH_GDA0001343519780000053
则输出异常的被检测医院k和时间i。
本发明的有益效果是:
(1)基于当前时间和滑动窗口历史时间,构建时间序列相似度识别异常模型,动态检测在院人次异常情况,为医疗保险欺诈提供科学防范手段;
(2)对同级别医院的在院人次进行异常检测,能够掌握同级别医院在院人次的变化趋势,从而为突发性传染疾病爆发及其在人群中的传播态势感知提供预测依据。
附图说明
图1为基于时间序列相似性分析的在院人次异常检测方法流程图;
图2为滑动窗口长度的选择流程图;
图3为异常指数计算流程图;
图4为新住院的异常检测流程流程图;
图5为基于时间序列相似性分析的在院人次异常检测装置框架图。
具体实施方式
下面将详细描述本发明的具体实施例,应当注意,这里描述的实施例只用于举例说明,并不用于限制本发明。在以下描述中,为了提供对本发明的透彻理解,阐述了大量特定细节。
在整个说明书中,对“一个实施例”、“实施例”、“一个示例”或“示例”的提及意味着:结合该实施例或示例描述的特定特征、结构或特性被包含在本发明至少一个实施例中。因此,在整个说明书出现的短语“在一个实施例中”、“在实施例中”、“一个示例”或“示例”不一定都指同一实施例或示例。此外,可以以任何适当的组合、或子组合将特定的特征、结构或特性组合在一个或多个实施例或示例中。此外,本领域普通技术人员应当理解,在此提供的示图都是为了说明的目的,并且示图不一定是按比例绘制的。
如图1所示,在一个实施例中,一种基于时间序列相似性分析的在院人次异常检测方法包括以下步骤:
S1:在院人次时间序列提取,具体为:
S11:数据收集和预处理,四川省信息化建设起步时间早,医保的相关信息库数据准确性高,因此数据准确性有保障,故使用四川省医保局提供的医保数据。选定一个医院等级,从数据库中提取同级别医院住院信息的以下特征:就诊ID、医院ID、医院名称、医院等级、入院时间、出院时间。
S12:构建在院人次时间序列,在院人次时间序列Dn
Dn=<d1=(v1,t1),...,di=(vi,ti),...,dn=(vn,tn)>
其中di=(vi,ti)表示时间ti的在院人次vi。医院k的在院人次
Figure DEST_PATH_GDA0001343519780000061
具体表示为:
Figure DEST_PATH_GDA0001343519780000062
根据医保结算要求,上午12点以前出院的患者,不计入当天的在院人次;上午12点以后出院的患者,计入当天的在院人次。
S2:滑动窗口时间序列构建,具体为:
滑动窗口SW的环比增长率时间序列,针对某一天/周的历史增长率数据,采用一种滑动窗口技术,选取该天/周之前的一个滑动窗口范围内的数据作为历史数据,滑动窗口SW的大小会影响最后异常结果的计算。
S21:医院k∈(1,...,k,...,w)在滑动窗口SW(长度为s)的在院人次环比增长率,构成长度为 s-1的序列,记为
Figure DEST_PATH_GDA0001343519780000063
Figure DEST_PATH_GDA0001343519780000064
S22:医院k同级别医院(共w家医院)在滑动窗口SW(长度为s)的在院人次环比增长率,构成长度为s-1的序列,记为
Figure DEST_PATH_GDA0001343519780000071
Figure DEST_PATH_GDA0001343519780000072
S23:调整滑动窗口长度,重复步骤S21、S22,得到不同长度的滑动窗口时间序列。根据在院人次异常预测准确率指标,选择最优的滑动窗口长度。
如图2所示,所述的滑动窗口长度的选择包括如下子步骤:
S231:根据专家判别法,设定滑动窗口长度初始值;
S232:通过人工打标签方式,判断预测准确率,并据此进一步调整滑动窗口长度;
S233:根据在院人次异常预测准确率指标,选择最优滑动窗口长度。
S3:序列间DTW距离计算,具体为:
动态时间弯曲DTW距离作为衡量不同序列间相似性的度量,是通过弯曲时间轴来获取不同序列间的最小距离,能较好地解决欧式距离难以处理的伸缩、弯曲和线性飘移等问题。
医院k和同级别医院在滑动窗口SW(长度为s)的在院人次环比增长率序列分别为
Figure DEST_PATH_GDA0001343519780000073
其DTW距离记为
Figure DEST_PATH_GDA0001343519780000074
Figure DEST_PATH_GDA0001343519780000075
f(0,0)=0,f(i,0)=f(0,j)=∞
Figure DEST_PATH_GDA0001343519780000076
其中,
Figure DEST_PATH_GDA0001343519780000077
可以使用不同的距离定义。
在一个实施例中,令
Figure DEST_PATH_GDA0001343519780000078
S4:标准化,具体为:
S41:滑动窗口的DTW距离标准化。
Figure DEST_PATH_GDA0001343519780000079
进行极差标准化,记为
Figure DEST_PATH_GDA00013435197800000710
Figure DEST_PATH_GDA00013435197800000711
S42:当前时期的环比增长率标准化。医院k∈(1,...,k,...,w)当前时间i的在院人次环比增长率
Figure DEST_PATH_GDA0001343519780000081
Figure DEST_PATH_GDA0001343519780000082
进行极差标准化,记为
Figure DEST_PATH_GDA0001343519780000083
Figure DEST_PATH_GDA0001343519780000084
如图3所示,S5:异常指数计算,具体为:
当前时间i、医院k的异常指数
Figure DEST_PATH_GDA0001343519780000085
α+β=1。α、β分别为当前时间和滑动窗口历史时间的权重。
S51:根据专家判别法,设定当前时间和滑动窗口历史时间权重的初始值。
S52:通过人工打标签方式,判断预测准确率,并据此进一步调整当前时间和滑动窗口历史时间的权重。
S53:根据在院人次异常预测准确率指标,选择最优的当前时间和滑动窗口历史时间的权重。
如图4所示,S6:异常输出,具体为:
异常阈值为Ti,若
Figure DEST_PATH_GDA0001343519780000086
则输出异常的医院k和时间i。
S61:收集新的每天/每周医院在院人次。
S62:基于时间序列相似度识别异常的模型,输出异常医院k及时间i。
如图5所示,基于时间序列相似性分析的在院人次异常检测装置,它包括在院人次时间序列提取模块、滑动窗口时间序列构建模块、序列间DTW距离计算模块、标准化模块、异常指数计算模块、异常输出模块和结果呈现模块;
所述的在院人次时间序列提取模块,提取同级别医院的住院信息,构建在院人次时间序列,并对数据进行预处理提取同级别医院的住院信息,构建在院人次时间序列,并对数据进行预处理;
所述的滑动窗口时间序列构建模块,计算被检测医院和同级别医院在滑动窗口SW的在院人次环比增长率,并重复所述内容,进而得到不同长度的滑动窗口时间序列,选择最优的滑动窗口长度;
所述的序列间DTW距离计算模块,基于被检测医院与同级别的医院的在院人次环比增长率序列,计算序列间DTW距离;
所述的标准化模块,对序列间DTW的值进行极差标准化,并对被检测医院当前时间在院人次的环比增长率进行极差标准化;
所述的异常指数计算模块,基于当前时间和滑动窗口历史时间,计算当前时间i、被检测医院k的异常指数;
所述的异常输出模块,输出异常指数大于阈值的被检测医院k和时间i;
所述的结果呈现模块,对输出结果进行呈现。
基于时间序列相似性分析的在院人次异常检测系统,其特征在于,所述的终端系统包括:
处理器,用于执行程序;
存储器,用于存储由处理器执行的程序;
进一步地,所述的处理器,程序在执行时包括以下步骤:
S1:在院人次时间序列提取:从数据库中提取同级别医院的住院信息,构建在院人次时间序列,并对数据进行预处理;
S2:滑动窗口SW时间序列构建:分别计算被检测医院和同级别医院在滑动窗口SW的在院人次环比增长率,并重复所述内容,进而得到不同长度的滑动窗口时间序列,选择最优的滑动窗口长度;
S3:序列间DTW距离计算:基于被检测医院与同级别的医院的在院人次环比增长率序列,计算序列间DTW距离;
S4:标准化:对序列间DTW值进行极差标准化,并对被检测医院当前时间在院人次的环比增长率进行极差标准化;
S5:异常指数计算:当前时间i、被检测医院k的异常指数
Figure DEST_PATH_GDA0001343519780000091
α+β=1,α、β分别为当前时间和滑动窗口历史时间的权重;
S6:异常输出:异常阈值为Ti,若
Figure DEST_PATH_GDA0001343519780000092
则输出异常的被检测医院k和时间i。
所述的存储器,程序在执行时包括以下步骤:
S1:在院人次时间序列提取:从数据库中提取同级别医院的住院信息,构建在院人次时间序列,并对数据进行预处理;
S2:滑动窗口SW时间序列构建:分别计算被检测医院和同级别医院在滑动窗口SW的在院人次环比增长率,并重复所述内容,进而得到不同长度的滑动窗口时间序列,选择最优的滑动窗口长度;
S3:序列间DTW距离计算:基于被检测医院与同级别的医院的在院人次环比增长率序列,计算序列间DTW距离;
S4:标准化:对序列间DTW值进行极差标准化,并对被检测医院当前时间在院人次的环比增长率进行极差标准化;
S5:异常指数计算:当前时间i、被检测医院k的异常指数
Figure DEST_PATH_GDA0001343519780000093
α+β=1,α、β分别为当前时间和滑动窗口历史时间的权重;
S6:异常输出:异常阈值为Ti,若
Figure DEST_PATH_GDA0001343519780000101
则输出异常的被检测医院k和时间i。
本发明所揭露的方法、模块和系统,也可以通过其它方式实现。例如,以上所描述的实施例仅是示意性的;所述模块的划分,可以仅仅是一种逻辑功能划分,实际实现时也可以有另外的划分方式;多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
所述的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例的方案目的。另外,在本发明各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。
所述的方法如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、制度存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random AccessMemory,RAM)、磁碟或者光盘等可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,比如用于各种其他组合、修改和环境,并能够在本文所述构想范围内,此外通过上述技术启示或相关领域的技术或知识进行的改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。

Claims (7)

1.基于时间序列相似性分析的在院人次异常检测方法,其特征在于,它具体包括如下步骤:
S1:在院人次时间序列提取:从数据库中提取同级别医院的住院信息,构建在院人次时间序列,并对数据进行预处理;
S2:滑动窗口SW时间序列构建:分别计算被检测医院和同级别医院在滑动窗口SW的在院人次环比增长率,并重复此计算过程,进而得到不同长度的滑动窗口时间序列,选择最优的滑动窗口长度;
S3:序列间DTW距离计算:基于被检测医院与同级别医院的在院人次环比增长率时间序列,计算序列间DTW距离;
S4:标准化:对序列间DTW值进行极差标准化,并对被检测医院当前时间在院人次的环比增长率进行极差标准化;
S5:异常指数计算:当前时间i、被检测医院k的异常指数
Figure FDA0002653205640000011
α+β=1,α、β分别为当前时间和滑动窗口历史时间的权重;
S6:异常输出:异常阈值为Ti,若
Figure FDA0002653205640000012
则输出异常的被检测医院k和时间i。
2.根据权利要求1所述的基于时间序列相似性分析的在院人次异常检测方法,其特征在于,所述的步骤S1具体包括如下子步骤:
S11:数据收集和预处理,选定一个医院等级,从数据库中提取同级别医院住院信息的以下特征:就诊ID、医院ID、医院名称、医院等级、入院时间和出院时间;
S12:构建在院人次时间序列Dn,具体表示为:
Dn=<d1=(v1,t1),...,di=(vi,ti),...,dn=(vn,tn)>
其中di=(vi,ti)表示时间ti的在院人次vi
被检测医院k的在院人次
Figure FDA0002653205640000013
上午12点以前出院的患者,不计入当天的在院人次;上午12点以后出院的患者,计入当天的在院人次。
3.根据权利要求1所述的基于时间序列相似性分析的在院人次异常检测方法,其特征在于,所述的步骤S2具体包括如下子步骤:
S21:医院k∈(1,…,k,…,w),其中w表示共w家同级别医院,在长度为s的滑动窗口SW的在院人次环比增长率,构成长度为s-1的序列,记为
Figure FDA0002653205640000014
Figure FDA0002653205640000021
S22:医院k同级别医院,共w家医院,在长度为s的滑动窗口SW的在院人次环比增长率,构成长度为s-1的序列,记为
Figure FDA0002653205640000022
Figure FDA0002653205640000023
S23:调整滑动窗口长度,重复步骤S21、S22,得到不同长度的滑动窗口时间序列,根据在院人次异常预测准确率指标,选择最优的滑动窗口长度;
所述的滑动窗口长度的选择包括如下子步骤:
S231:设定滑动窗口长度初始值;
S232:通过人工打标签方式,判断预测准确率,并据此进一步调整滑动窗口长度;
S233:根据所设定的在院人次异常预测准确率指标,选择滑动窗口长度。
4.根据权利要求1所述的基于时间序列相似性分析的在院人次异常检测方法,其特征在于,所述的步骤S3具体为:
医院k和同级别医院在长度为s的滑动窗口SW的在院人次环比增长率序列分别为:
Figure FDA0002653205640000024
其DTW距离记为
Figure FDA0002653205640000025
Figure FDA0002653205640000026
f(0,0)=0,f(i,0)=f(0,j)=∞
Figure FDA0002653205640000027
所述的
Figure FDA0002653205640000028
可通过不同的距离进行定义。
5.根据权利要求1所述的基于时间序列相似性分析的在院人次异常检测方法,其特征在于,所述的步骤S4具体包括如下子步骤:
S41:对滑动窗口历史时期的DTW距离标准化,
Figure FDA0002653205640000029
进行极差标准化,记为
Figure FDA00026532056400000210
Figure FDA0002653205640000031
S42:将当前时期的环比增长率标准化,医院k∈(1,…,k,…,w)在当前时间i的在院人次环比增长率
Figure FDA0002653205640000032
Figure FDA0002653205640000033
进行极差标准化,记为
Figure FDA0002653205640000034
Figure FDA0002653205640000035
6.根据权利要求1-5任一项所述的基于时间序列相似性分析的在院人次异常检测方法的装置,其特征在于,它包括在院人次时间序列提取模块、滑动窗口时间序列构建模块、序列间DTW距离计算模块、标准化模块、异常指数计算模块、异常输出模块和结果呈现模块;
所述的在院人次时间序列提取模块,提取同级别医院的住院信息,构建在院人次时间序列,并对数据进行预处理;
所述的滑动窗口时间序列构建模块,计算被检测医院和同级别医院在滑动窗口SW的在院人次环比增长率,并重复此计算过程,进而得到不同长度的滑动窗口时间序列,选择最优的滑动窗口长度;
所述的序列间DTW距离计算模块,基于被检测医院与同级别医院的在院人次环比增长率序列,计算序列间DTW距离;
所述的标准化模块,对序列间DTW值进行极差标准化,并对被检测医院当前时间在院人次的环比增长率进行极差标准化;
所述的异常指数计算模块,基于当前时间和滑动窗口历史时间,计算当前时间i、被检测医院k的异常指数;
所述的异常输出模块,输出异常指数大于阈值的被检测医院k和时间i;
所述的结果呈现模块,对输出结果进行呈现。
7.根据权利要求1-5任一项所述的基于时间序列相似性分析的在院人次异常检测方法的系统,其特征在于,所述的系统包括:
处理器,用于执行程序;
存储器,用于存储由处理器执行的程序;
进一步地,所述的处理器和存储器,程序在执行时包括以下步骤:
S1:在院人次时间序列提取:从数据库中提取同级别医院的住院信息,构建在院人次时间序列,并对数据进行预处理;
S2:滑动窗口SW时间序列构建:分别计算被检测医院和同级别医院在滑动窗口SW的在院人次环比增长率,并重复此计算过程,进而得到不同长度的滑动窗口时间序列,选择最优的滑动窗口长度;
S3:序列间DTW距离计算:基于被检测医院与同级别医院的在院人次环比增长率序列,计算序列间DTW距离;
S4:标准化:对序列间DTW值进行极差标准化,并对被检测医院当前时间在院人次的环比增长率进行极差标准化;
S5:异常指数计算:当前时间i、被检测医院k的异常指数
Figure FDA0002653205640000041
α+β=1,α、β分别为当前时间和滑动窗口历史时间的权重;
S6:异常输出:异常阈值为Ti,若
Figure FDA0002653205640000042
则输出异常的被检测医院k和时间i。
CN201710397683.2A 2017-05-31 2017-05-31 基于时间序列相似性分析的在院人次异常检测方法及系统 Active CN107194184B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710397683.2A CN107194184B (zh) 2017-05-31 2017-05-31 基于时间序列相似性分析的在院人次异常检测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710397683.2A CN107194184B (zh) 2017-05-31 2017-05-31 基于时间序列相似性分析的在院人次异常检测方法及系统

Publications (2)

Publication Number Publication Date
CN107194184A CN107194184A (zh) 2017-09-22
CN107194184B true CN107194184B (zh) 2020-11-17

Family

ID=59877259

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710397683.2A Active CN107194184B (zh) 2017-05-31 2017-05-31 基于时间序列相似性分析的在院人次异常检测方法及系统

Country Status (1)

Country Link
CN (1) CN107194184B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107958699A (zh) * 2017-11-06 2018-04-24 余帝乾 一种基于大数据时代患者体检的方法和装置
CN109065179B (zh) * 2018-08-22 2021-10-22 昆明理工大学 一种疾病传染过程的空时动态模拟方法
CN109636613A (zh) * 2018-10-19 2019-04-16 平安医疗健康管理股份有限公司 医疗数据异常识别方法、装置、终端及存储介质
CN109559806B (zh) * 2018-10-30 2024-07-09 平安医疗健康管理股份有限公司 异常住院行为的判定方法及相关产品
CN109460942A (zh) * 2018-12-13 2019-03-12 平安医疗健康管理股份有限公司 基于数据分析评价医院的方法及相关产品
CN109636646A (zh) * 2018-12-13 2019-04-16 平安医疗健康管理股份有限公司 异常就诊的识别方法、装置、终端及计算机可读存储介质
CN109934723B (zh) * 2019-02-27 2021-06-18 生活空间(沈阳)数据技术服务有限公司 一种医保欺诈行为识别方法、装置及设备
CN112131274B (zh) * 2020-09-22 2024-01-19 平安科技(深圳)有限公司 时间序列异常点的检测方法、装置、设备及可读存储介质
CN112347425B (zh) * 2021-01-08 2021-05-28 同盾控股有限公司 基于时间序列的密集子图检测的方法和系统
CN114357008A (zh) * 2021-12-16 2022-04-15 上海金仕达卫宁软件科技有限公司 医疗行为一致性识别模型建立方法及风险识别方法
CN117115757B (zh) * 2023-10-24 2024-02-02 中安创科(深圳)技术有限公司 一种枪支实时监控系统及监控方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN202075864U (zh) * 2011-04-28 2011-12-14 北京市劳动保护科学研究所 异常交通状态自动检测系统
CN103440489A (zh) * 2013-09-16 2013-12-11 南京大学 基于像素级sar影像时间序列相似性分析的水体提取方法
CN103561418A (zh) * 2013-11-07 2014-02-05 东南大学 基于时间序列的异常检测方法
CN104317681A (zh) * 2014-09-02 2015-01-28 上海交通大学 针对计算机系统的行为异常自动检测方法及检测系统
CN104462217A (zh) * 2014-11-09 2015-03-25 浙江大学 一种基于分段统计近似表示的时间序列相似性度量方法
CN104914467A (zh) * 2015-05-22 2015-09-16 中国石油天然气股份有限公司 提取分类模型道的地震相聚类分析方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9984334B2 (en) * 2014-06-16 2018-05-29 Mitsubishi Electric Research Laboratories, Inc. Method for anomaly detection in time series data based on spectral partitioning
KR102195070B1 (ko) * 2014-10-10 2020-12-24 삼성에스디에스 주식회사 시계열 데이터의 분석을 통한 이상 감지 및 예측 시스템 및 방법
JP6599727B2 (ja) * 2015-10-26 2019-10-30 株式会社Screenホールディングス 時系列データ処理方法、時系列データ処理プログラム、および、時系列データ処理装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN202075864U (zh) * 2011-04-28 2011-12-14 北京市劳动保护科学研究所 异常交通状态自动检测系统
CN103440489A (zh) * 2013-09-16 2013-12-11 南京大学 基于像素级sar影像时间序列相似性分析的水体提取方法
CN103561418A (zh) * 2013-11-07 2014-02-05 东南大学 基于时间序列的异常检测方法
CN104317681A (zh) * 2014-09-02 2015-01-28 上海交通大学 针对计算机系统的行为异常自动检测方法及检测系统
CN104462217A (zh) * 2014-11-09 2015-03-25 浙江大学 一种基于分段统计近似表示的时间序列相似性度量方法
CN104914467A (zh) * 2015-05-22 2015-09-16 中国石油天然气股份有限公司 提取分类模型道的地震相聚类分析方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Mining abnormal patterns for heterogeneous time series with irrelevant features for fault event detection;Fujimaki R等;《Statistic Analysis and Data Mining》;20091231;全文 *
基于相似性分析的时间序列异常检测方法;孙焱等;《山东农业大学学报》;20170411;第48卷(第2期);全文 *

Also Published As

Publication number Publication date
CN107194184A (zh) 2017-09-22

Similar Documents

Publication Publication Date Title
CN107194184B (zh) 基于时间序列相似性分析的在院人次异常检测方法及系统
Bloch et al. Machine learning models for analysis of vital signs dynamics: a case for sepsis onset prediction
Mao et al. An integrated data mining approach to real-time clinical monitoring and deterioration warning
CN108876636B (zh) 理赔智能风控方法、系统、计算机设备及存储介质
Warren Reverse migration to Mexico led to US undocumented population decline: 2010 to 2018
Alostad et al. Directional prediction of stock prices using breaking news on twitter
US20170083670A1 (en) Drug adverse event extraction method and apparatus
Li et al. Automated assessment of levodopa-induced dyskinesia: Evaluating the responsiveness of video-based features
Bai et al. A two‐stage model for wearable device data
Konharn et al. Differences between weekday and weekend levels of moderate-to-vigorous physical activity in Thai adolescents
CN109119137A (zh) 一种异常检测方法、装置、服务器及存储介质
Edwardson et al. Measuring the impact of electronic health record adoption on charge capture
Mancini et al. Marked point process models for the admissions of heart failure patients
Yih et al. Sequential data-mining for adverse events after recombinant herpes zoster vaccination using the tree-based scan statistic
Hajihashemi et al. An early illness recognition framework using a temporal Smith Waterman algorithm and NLP
Hsieh et al. A new drug safety signal detection and triage system integrating sequence symmetry analysis and tree-based scan statistics with longitudinal data
Ray et al. Physical activity classification with dynamic discriminative methods
CN112884593A (zh) 一种基于图聚类分析的医保骗保行为检测方法及预警装置
CN115862897B (zh) 一种基于临床数据的症候群监测方法及系统
Lewis et al. The feasibility of deriving the electronic frailty index from Australian general practice records
CN111383725B (zh) 不良反应数据鉴别方法、装置、电子设备及可读介质
US20230229937A1 (en) Ai training data creation support system, ai training data creation support method, and ai training data creation support program
Lim A smart healthcare-based system for classification of dementia using deep learning
Mason et al. A review of some individual-and community-level effect size indices for the study of risk factors for child and adolescent development
Johns et al. Clustering clinical and health care processes using a novel measure of dissimilarity for variable-length sequences of ordinal states

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant