WO2019196282A1 - 疾病异常数据检测方法及装置、计算机装置及存储介质 - Google Patents

疾病异常数据检测方法及装置、计算机装置及存储介质 Download PDF

Info

Publication number
WO2019196282A1
WO2019196282A1 PCT/CN2018/099653 CN2018099653W WO2019196282A1 WO 2019196282 A1 WO2019196282 A1 WO 2019196282A1 CN 2018099653 W CN2018099653 W CN 2018099653W WO 2019196282 A1 WO2019196282 A1 WO 2019196282A1
Authority
WO
WIPO (PCT)
Prior art keywords
disease
data
quantile
time point
abnormal value
Prior art date
Application number
PCT/CN2018/099653
Other languages
English (en)
French (fr)
Inventor
阮晓雯
徐亮
肖京
Original Assignee
平安科技(深圳)有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 平安科技(深圳)有限公司 filed Critical 平安科技(深圳)有限公司
Publication of WO2019196282A1 publication Critical patent/WO2019196282A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu

Landscapes

  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

一种疾病异常数据检测方法,所述方法包括:获取疾病监测的时间序列数据X(101),X=[x 0,x 1,x 2,…,x t];选取时间窗大小w,对于任意时间点i计算所述时间点i对应的时间窗内疾病监测数据的第一分位数Q1和第二分位数Q2(102);计算所述第二分位数Q2与所述第一分位数Q1的差值D(103);计算所述时间点i对应的疾病监测数据x i的上界T1和下界T2(104);将时间点i对应的疾病监测数据x i和所述上界T1及所述下界T2进行比较,若时间点i对应的疾病监测数据x i大于所述上界T1或者小于所述下界T2,则所述时间点i对应的疾病监测数据x i为异常值(105)。还提供一种疾病异常数据检测装置、计算机装置及可读存储介质。所述方法可以实现高效准确的疾病监测数据异常检测。

Description

疾病异常数据检测方法及装置、计算机装置及存储介质
本申请要求于2018年04月11日提交中国专利局,申请号为201810321079.6发明名称为“疾病异常数据检测方法及装置、计算机装置及存储介质”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本申请涉及数据处理技术领域,具体涉及一种疾病异常数据检测方法及装置、计算机装置和可读存储介质。
背景技术
随着全球经济一体化进程的加快,经济与交流活动增加,人群流动日益频繁,为疾病的传播与爆发提供了有利环境,公共卫生健康问题越来越严峻。同时,社会与自然环境也发生着变化,环境污染、自然灾害等影响公众健康事件的增多也增加了突发公共卫生事件爆发的可能性。
如何检测出疾病异常数据,以便能够早期识别到疾病流行或爆发的突发公共卫生事件,尽早采取相应的控制措施,将突发公共卫生事件造成的损失降到最低,成为亟待解决的问题。
现有的异常检测方法,例如zscore异常检测方法、格拉布斯(Grubbs)异常检测方法都要求数据满足正态分布,而实际上很多时候无法满足这个要求。对于传统的四分位法,会用到所有的数据,而过去久远的数据对当前数据的参考价值低,结果更容易出现偏差。
发明内容
鉴于以上内容,有必要提出一种疾病异常数据检测方法及装置、计算机装置和非易失性可读存储介质,其可以实现高效准确的疾病监测数据异常检测。
本申请的第一方面提供一种疾病异常数据检测方法,所述方法包括:
获取疾病监测的时间序列数据X,X=[x 0,x 1,x 2,…,x t],其中x 0,x 1,x 2,…,x t为对应于时间点0,1,2,…,t的疾病监测数据;
选取时间窗大小w,对于任意时间点i,i=w,w+1,…,t,计算所述时间点i对应的时间窗内疾病监测数据的第一分位数Q1和第二分位数Q2,所述时间点i 对应的时间窗的大小为w,所述第一分位数Q1小于所述第二分位数Q2;
计算所述第二分位数Q2与所述第一分位数Q1的差值D;
计算所述时间点i对应的疾病监测数据x i的上界T1和下界T2,其中,所述上界T1=Q2+k*D,所述下界T2=Q1-k*D,k为可调参数;
将时间点i对应的疾病监测数据x i和所述上界T1及所述下界T2进行比较,若时间点i对应的疾病监测数据x i大于所述上界T1或者小于所述下界T2,则所述时间点i对应的疾病监测数据x i为异常值。
本申请的第二方面提供一种疾病异常数据检测装置,所述装置包括:
获取单元,用于获取疾病监测的时间序列数据X,X=[x 0,x 1,x 2,…,x t],其中x 0,x 1,x 2,…,x t为对应于时间点0,1,2,…,t的疾病监测数据;
计算单元,用于选取时间窗大小w,对于任意时间点i,i=w,w+1,…,t,计算所述时间点i对应的时间窗内疾病监测数据的第一分位数Q1和第二分位数Q2,所述时间点i对应的时间窗的大小为w,所述第一分位数Q1小于所述第二分位数Q2;
所述计算单元,还用于计算所述第二分位数Q2与所述第一分位数Q1的差值D;
所述计算单元,还用于计算所述时间点i对应的疾病监测数据x i的上界T1和下界T2,其中,所述上界T1=Q2+k*D,所述下界T2=Q1-k*D,k为可调参数;
第一比较单元,用于将时间点 i对应的疾病监测数据x i和所述上界T1及所述下界T2进行比较,若时间点i对应的疾病监测数据x i大于所述上界T1或者小于所述下界T2,则所述时间点i对应的疾病监测数据x i为异常值。
本申请的第三方面提供一种计算机装置,所述计算机装置包括存储器和处理器,所述存储器用于存储至少一个计算机可读指令,所述处理器用于执行所述至少一个计算机可读指令以实现所述疾病异常数据检测方法。
本申请的第四方面提供一种非易失性可读存储介质,所述非易失性可读存储介质存储有至少一个计算机可读指令,所述至少一个计算机可读指令被处理器执行时实现所述疾病异常数据检测方法。
本申请获取疾病监测的时间序列数据X,X=[x 0,x 1,x 2,…,x t],其中x 0,x 1,x 2,…,x t为对应于时间点0,1,2,…,t的疾病监测数据;选取时间窗大小w,对于任意时间点i,i=w,w+1,…,t,计算所述时间点i对应的时间窗内疾病监测数据的第一分位数Q1和第二分位数Q2,所述时间点i对应的时间窗的大小为w,所述第一分位数Q1小于所述第二分位数Q2;计算所述第二分位数Q2与所述第一分位数Q1的差值D;计算所述时间点i对应的疾病监测数据x i的上界T1和下界T2,其中,所述上界T1=Q2+k*D,所述下界T2=Q1-k*D, k为可调参数;将时间点i对应的疾病监测数据x i和所述上界T1及所述下界T2进行比较,若时间点i对应的疾病监测数据x i大于所述上界T1或者小于所述下界T2,则所述时间点i对应的疾病监测数据x i为异常值。
对于时间序列数据,越邻近的数据对当前越具有参考价值,越久远的参考价值越低。本申请考虑到时间序列的特点,将邻近的历史数据分布作为参考来对当前数据进行异常的判定,可以得到较好的检测结果。并且,本申请对数据分布没有要求,并不要求是正态分布,可以直接对短时期内的疾病监测数据进行异常检测,克服了要求时间窗内数据满足正态分布的限制,对于疾病监测数据的异常检测具有更高的可适用性。因此,本申请实现了高效准确的疾病监测数据异常检测。
附图说明
图1是本申请实施例一提供的疾病异常数据检测方法的流程图。
图2是本申请实施例二提供的疾病异常数据检测装置的结构图。
图3是本申请实施例四提供的计算机装置的示意图。
具体实施方式
为了能够更清楚地理解本申请的上述目的、特征和优点,下面结合附图和具体实施例对本申请进行详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本申请,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请。
优选地,本申请的疾病异常数据检测方法应用在一个或者多个计算机装置中。所述计算机装置是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述计算机装置可以是桌上型计算机、笔记本、掌上电脑及云端服务器 等计算设备。所述计算机装置可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
实施例一
图1是本申请实施例一提供的疾病异常数据检测方法的流程图。所述疾病异常数据检测方法应用于计算机装置。所述疾病异常数据检测方法检测疾病监测数据中的异常值,以便能够早期识别到疾病流行或爆发的突发公共卫生事件,尽早采取相应的控制措施,将突发公共卫生事件造成的损失降到最低。
如图1所示,所述疾病异常数据检测方法具体包括以下步骤:
步骤101,获取疾病监测的时间序列数据X,X=[x 0,x 1,x 2,…,x t],其中x 0,x 1,x 2,…,x t为时间点0,1,2,…,t的疾病监测数据。
所述疾病监测数据可以包括流感、手足口病、麻疹、流行性腮腺炎等疾病的监测数据。
可以在预设区域(例如省市、地区)建立由多个监测点组成的疾病监测网络,从所述监测点获取疾病监测数据,由所述疾病监测数据构成疾病监测的时间序列数据。可以选择医疗机构、学校和幼托机构、药店等作为监测点,分别对相应的目标人群进行疾病监测及数据采集。可以选择满足预设条件的场所作为监测点。所述预设条件可以包括人数、规模等。例如,选择学生人数达到预设数量的学校和幼托机构作为监控点。又如,选择规模(例如以日营业额统计)达到预设规模的药店作为监控点。再如,选择规模(例如以日就医人数统计)达到预设规模的医院作为监控点。
不同时间的疾病监测数据构成疾病监测的时间序列数据。例如,可以将以日为单位采集到的疾病监测数据构成疾病监测的时间序列数据。或者,可以将以周为单位采集到的疾病监测数据构成疾病监测的时间序列数据。
医疗机构(主要包括医院)是最能捕捉疾病早期暴发预兆的场所,是开展疾病监测的首选。可以根据病人就诊情况,获取疾病监测数据。
一部分疾病人会自行去药店购药来缓解早期症状,因此,可以根据药店的药品销售情况,获取疾病监测数据。
儿童和青少年是疾病的高危人群以及疾病传播过程中的重要环节,也应该加强对该人群的监测。学校和幼托机构是监测儿童和青少年疾病发病情况的较佳场所。可以根据学校和幼托机构的儿童和青少年的请假情况,获得疾病监测数据。
因此,本申请中主要选择医疗机构、学校和幼托机构、药店这三类场所进行疾病监测数据的采集。当然,上述对数据源的选择,并不能限制在另外 的实施方案中增加或替换其他重点关注人群或场所作为监测的数据源。例如,可以将宾馆纳入疾病监测范围,获取宾馆入住人员的疾病监测数据。
根据需要,可以取任意一类监控点(例如医疗机构)采集的疾病监测数据构成疾病监测的时间序列数据。例如,可以取医院采集的疾病监测数据构成疾病监测的时间序列数据。或者,可以结合多类监控点采集的疾病监测数据构成疾病监测的时间序列数据。例如,可以以医院采集的疾病监测数据为主,以药店参加的疾病监测数据作为补充,构成疾病监测的时间序列数据。
疾病监测数据可以包括疾病的就诊数、就诊率、发病数、发病率等患病数据。例如,可以从医疗机构(例如医院)获取疾病(例如流感)的每日就诊数,将疾病(例如流感)的每日就诊数作为疾病监测数据。又如,可以从学校获取学生的疾病(例如流感)的每日发病数,将疾病(例如流感)的每日发病数作为疾病监测数据。
需要说明的是,时间点0和时间点t表示时间序列数据的起始时间和终止时间,并非对时间序列数据时间上的限定。可以将任意时间点作为时间点0。
步骤102,选取时间窗大小w,针对时间点w至时间点t中的每个时间点i,计算所述时间点i对应的时间窗内疾病监测数据的第一分位数Q1和第二分位数Q2,所述时间点i对应的时间窗的大小为w,所述第一分位数Q1小于所述第二分位数Q2。
时间窗为给定时间点之前邻近的一段时间。例如,设时间窗大小w为4,给定时间点为t=10,时间窗就是t=6到t=9这段时间;给定时间点为t=11,时间窗就是t=7到t=11这段时间;依此类推。
时间点i的取值从w开始,是因为从t=0到t=w-1这段时间内得到的时间窗的长度小于w,没有足够的w个疾病监测数据来计算疾病监测数据的第一分位数Q1和第二分位数Q2。
时间窗大小w是可调参数,可以根据实际情况进行调节。
在一实施例中,所述疾病监测数据为每日的疾病监测数据(例如疾病的每日就诊数),所述时间窗大小w可以取为7(即一周),因而计算给定时间点前一周的疾病监测数据的第一分位数Q1和第二分位数Q2。
在另一实施例中,所述疾病监测数据为每周的疾病监测数据(例如疾病的每周就诊数),所述时间窗大小w可以取为3(即三周),因而计算给定时间点前3周的疾病监测数据的第一分位数Q1和第二分位数Q2。
在一实施例中,所述第一分位数Q1可以是0.25分位数,所述第二分位数Q2可以是0.75分位数。
在另一实施例中,所述第一分位数Q1可以是0.2分位数,所述第二分位数Q2可以是0.7分位数。
步骤103,计算所述第二分位数Q2与所述第一分位数Q1的差值D。
例如,所述第二分位数Q2为3,所述第一分位数Q1为1,则所述第二分位数Q2与所述第一分位数Q1的差值D为3-1=2。
又如,所述第二分位数Q2为50,所述第一分位数Q1为30,则所述第二分位数Q2与所述第一分位数Q1的差值D为50-30=20。
步骤104,计算所述时间点i对应的疾病监测数据x i的上界T1和下界T2,其中,所述上界T1=Q2+k*D,所述下界T2=Q1-k*D,k为可调参数。
在一实施例中,所述第一分位数Q1是0.25分位数,所述第二分位数Q2是0.75分位数,对应的k可以在[1.5,3]区间取值,例如取值为2。
步骤105,将时间点i对应的疾病监测数据x i和所述上界T1及所述下界T2进行比较,若时间点i对应的疾病监测数据x i大于所述上界T1或者小于所述下界T2,则所述时间点i对应的疾病监测数据x i为异常值。
例如,时间点9对应的疾病监测数据x 9为5,对应的上界T1为10,对应所述下界T2为7,则该疾病监测数据x 9为异常值。
又如,时间点8对应的疾病监测数据x 8为6,对应的上界T1为9,对应所述下界T2为57,则该疾病监测数据x 8为非异常值。
实施例一的疾病异常数据检测方法获取疾病监测的时间序列数据X,X=[x 0,x 1,x 2,…,x t],其中x 0,x 1,x 2,…,x t为对应于时间点0,1,2,…,t的疾病监测数据;选取时间窗大小w,对于任意时间点i,i=w,w+1,…,t,计算所述时间点i对应的时间窗内疾病监测数据的第一分位数Q1和第二分位数Q2,所述时间点i对应的时间窗的大小为w,所述第一分位数Q1小于所述第二分位数Q2;计算所述第二分位数Q2与所述第一分位数Q1的差值D;计算所述时间点i对应的疾病监测数据x i的上界T1和下界T2,其中,所述上界T1=Q2+k*D,所述下界T2=Q1-k*D,k为可调参数;将时间点i对应的疾病监测数据x i和所述上界T1及所述下界T2进行比较,若时间点i对应的疾病监测数据x i大于所述上界T1或者小于所述下界T2,则所述时间点i对应的疾病监测数据x i为异常值。
对于时间序列数据,越邻近的数据对当前越具有参考价值,越久远的参考价值越低。实施例一考虑到时间序列的特点,将邻近的历史数据分布作为参考来对当前数据进行异常的判定,可以得到较好的检测结果。并且,实施例一对数据分布没有要求,并不要求是正态分布,可以直接对短时期内的疾病监测数据进行异常检测,克服了要求时间窗内数据满足正态分布的限制, 对于疾病监测数据的异常检测具有更高的可适用性。因此,实施例一实现了高效准确的疾病监测数据异常检测。
在另一实施例中,可以结合其他的疾病异常数据检测方法(不同于实施例一的疾病异常数据检测方法,例如Grubbs检测方法)进行疾病异常数据检测。具体地,实施例一的疾病异常数据检测方法还可以包括以下步骤:获取其他的疾病异常数据检测方法对所述时间序列数据进行检测得到的异常值;将实施例一的疾病异常数据检测方法得到的异常值与其他的疾病异常数据检测方法得到的异常值进行比较;根据实施例一的疾病异常数据检测方法得到的异常值与其他的疾病异常数据检测方法得到的异常值的比较结果得到最终的异常值。其他的疾病异常数据检测方法可以包括一种,也可以包括多种。每种其他的疾病异常数据检测方法可以得到一组对应的异常值。
例如,采用实施例一的疾病异常数据检测方法对疾病监测的时间序列数据进行疾病异常数据检测得到第一异常值,采用与实施例一的疾病异常数据检测方法不同的第二疾病异常数据检测方法(例如Grubbs检验方法)对所述疾病监测的时间序列数据进行疾病异常数据检测得到第二异常值,比较所述第一异常值和所述到第二异常值得到最终的异常值。若所述第一异常值和所述到第二异常值一致,则以所述第一异常值/到第二异常值作为最终的异常值;否则,若所述第一异常值和所述到第二异常值不一致,则舍弃所述第一异常值与所述第二异常值。
又如,采用实施例一的疾病异常数据检测方法对疾病监测的时间序列数据进行疾病异常数据检测得到第一异常值,采用与实施例一的疾病异常数据检测方法不同的第二疾病异常数据检测方法(例如Grubbs检测方法)对所述疾病监测的时间序列数据进行疾病异常数据检测得到第二异常值,采用与实施例一的疾病异常数据检测方法不同的第三疾病异常数据检测方法(例如贝叶斯检测方法)对所述疾病监测的时间序列数据进行疾病异常数据检测得到第三异常值,比较所述第一异常值、所述第二异常值和所述第三异常值得到最终的异常值。若所述第一异常值、所述第二异常值和所述第三异常值中至少两个异常值一致,则以一致的异常值作为最终的异常值。
在实施例一的疾病异常数据检测方法的基础上,结合其他的疾病异常数据检测方法进行疾病异常数据检测,可以获得更加准确的疾病异常数据检测结果。
在另一实施例中,可以采用实施例一的疾病异常数据检测方法分别对地区和地区下属医院进行疾病异常数据检测,得到针对地区的检测结果(即地区异常值)和针对地区下属医院的检测结果(即地区下属医院异常值),比 较所述地区异常值和所述地区下属医院异常值,根据所述地区异常值和所述地区下属医院异常值的比较结果得到最终的异常值。若针对地区的检测结果和针对地区下属医院的检测结果一致,则以针对地区的检测结果/针对地区下属医院的检测结果作为最终的检测结果;否则,若针对地区的检测结果和针对地区下属医院的检测结果不一致,则舍弃所述针对地区的检测结果和针对地区下属医院的检测结果。
其中,对地区进行疾病异常数据检测是根据所述地区的疾病监测的时间序列数据(例如地区的疾控部门从各个地区下属医院收集到的疾病监测数据)得到地区异常值,对地区下属医院进行疾病异常数据检测是根据所述地区下属医院的疾病监测的时间序列数据得到所述地区下属医院的异常值。
具体来说,按照实施例一的疾病异常数据检测方法,从地区某时间段内的疾病监测数据(例如病例数)中找出异常值,从该地区下属医院同样时间段内的疾病监测数据中找出异常值,取两个维度的交集来作为最终的检测结果。
例如,地区在2014-3-3,2014-3-4,2014-3-5,2014-3-6病例数分别为160,250,170,180,该地区下属医院(例如该地区下该疾病累计就诊次数最多的医院)在这段时间的病例数分别为130,180,125,140。从地区病例数分布来看,在2014-3-4这天出现了异常病例数,同时下属医院在这天也出现了异常病例数,所以综合判定在这天出现了疾病就诊异常的现象。
又如,地区在2014-3-3,2014-3-4,2014-3-5,2014-3-6病例数分别为160,210,170,180,该地区下属医院(例如该地区下该疾病累计就诊次数最多的医院)在这段时间病例数分别为130,140,125,140。从地区病例数分布来看,在2014-3-4这天出现了异常病例数,但是下属医院在这天并未出现异常病例数。这是由于地区下有很多家医院,地区在这一天的就诊病例数是由下属所有的医院的病例数的总和,部分医院在这一天有一个小幅度的增长,在医院维度上并不是异常,但是所有的小幅度增长后的总和在地区维度上就表现为异常了。
采用实施例一的疾病异常数据检测方法分别对地区和地区下属医院进行疾病异常数据检测,根据针对地区的检测结果和针对地区下属医院的检测结果得到最终的检测结果,可以获得更加准确的疾病异常数据检测结果。
实施例二
图2为本申请实施例二提供的疾病异常数据检测装置的结构图。如图2所示,所述疾病异常数据检测装置10可以包括:获取单元201、计算单元202、第一比较单元203。
获取单元201,用于获取疾病监测的时间序列数据X,X=[x 0,x 1,x 2,…,x t],其中x 0,x 1,x 2,…,x t为时间点0,1,2,…,t的疾病监测数据。
所述疾病监测数据可以包括流感、手足口病、麻疹、流行性腮腺炎等疾病的监测数据。
可以在预设区域(例如省市、地区)建立由多个监测点组成的疾病监测网络,从所述监测点获取疾病监测数据,由所述疾病监测数据构成疾病监测的时间序列数据。可以选择医疗机构、学校和幼托机构、药店等作为监测点,分别对相应的目标人群进行疾病监测及数据采集。可以选择满足预设条件的场所作为监测点。所述预设条件可以包括人数、规模等。例如,选择学生人数达到预设数量的学校和幼托机构作为监控点。又如,选择规模(例如以日营业额统计)达到预设规模的药店作为监控点。再如,选择规模(例如以日就医人数统计)达到预设规模的医院作为监控点。
不同时间的疾病监测数据构成疾病监测的时间序列数据。例如,可以将以日为单位采集到的疾病监测数据构成疾病监测的时间序列数据。或者,可以将以周为单位采集到的疾病监测数据构成疾病监测的时间序列数据。
医疗机构(主要包括医院)是最能捕捉疾病早期暴发预兆的场所,是开展疾病监测的首选。可以根据病人就诊情况,获取疾病监测数据。
一部分疾病人会自行去药店购药来缓解早期症状,因此,可以根据药店的药品销售情况,获取疾病监测数据。
儿童和青少年是疾病的高危人群以及疾病传播过程中的重要环节,也应该加强对该人群的监测。学校和幼托机构是监测儿童和青少年疾病发病情况的较佳场所。可以根据学校和幼托机构的儿童和青少年的请假情况,获得疾病监测数据。
因此,本申请中主要选择医疗机构、学校和幼托机构、药店这三类场所进行疾病监测数据的采集。当然,上述对数据源的选择,并不能限制在另外的实施方案中增加或替换其他重点关注人群或场所作为监测的数据源。例如,可以将宾馆纳入疾病监测范围,获取宾馆入住人员的疾病监测数据。
根据需要,可以取任意一类监控点(例如医疗机构)采集的疾病监测数据构成疾病监测的时间序列数据。例如,可以取医院采集的疾病监测数据构成疾病监测的时间序列数据。或者,可以结合多类监控点采集的疾病监测数据构成疾病监测的时间序列数据。例如,可以以医院采集的疾病监测数据为主,以药店参加的疾病监测数据作为补充,构成疾病监测的时间序列数据。
疾病监测数据可以包括疾病的就诊数、就诊率、发病数、发病率等患病数据。例如,可以从医疗机构(例如医院)获取疾病(例如流感)的每日就 诊数,将疾病(例如流感)的每日就诊数作为疾病监测数据。又如,可以从学校获取学生的疾病(例如流感)的每日发病数,将疾病(例如流感)的每日发病数作为疾病监测数据。
需要说明的是,时间点0和时间点t表示时间序列数据的起始时间和终止时间,并非对时间序列数据时间上的限定。可以将任意时间点作为时间点0。
计算单元202,用于选取时间窗大小w,针对时间点w至时间点t中的每个时间点i,计算所述时间点i对应的时间窗内疾病监测数据的第一分位数Q1和第二分位数Q2,所述时间点i对应的时间窗的大小为w,所述第一分位数Q1小于所述第二分位数Q2。
时间窗为给定时间点之前邻近的一段时间。例如,设时间窗大小w为4,给定时间点为t=10,时间窗就是t=6到t=9这段时间;给定时间点为t=11,时间窗就是t=7到t=11这段时间;依此类推。
时间点i的取值从w开始,是因为从t=0到t=w-1这段时间内得到的时间窗的长度小于w,没有足够的w个疾病监测数据来计算疾病监测数据的第一分位数Q1和第二分位数Q2。
时间窗大小w是可调参数,可以根据实际情况进行调节。
在一实施例中,所述疾病监测数据为每日的疾病监测数据(例如疾病的每日就诊数),所述时间窗大小w可以取为7(即一周),因而计算给定时间点前一周的疾病监测数据的第一分位数Q1和第二分位数Q2。
在另一实施例中,所述疾病监测数据为每周的疾病监测数据(例如疾病的每周就诊数),所述时间窗大小w可以取为3(即三周),因而计算给定时间点前3周的疾病监测数据的第一分位数Q1和第二分位数Q2。
在一实施例中,所述第一分位数Q1可以是0.25分位数,所述第二分位数Q2可以是0.75分位数。
在另一实施例中,所述第一分位数Q1可以是0.2分位数,所述第二分位数Q2可以是0.7分位数。
计算单元202,还用于计算所述第二分位数Q2与所述第一分位数Q1的差值D。
例如,所述第二分位数Q2为3,所述第一分位数Q1为1,则所述第二分位数Q2与所述第一分位数Q1的差值D为3-1=2。
又如,所述第二分位数Q2为50,所述第一分位数Q1为30,则所述第二分位数Q2与所述第一分位数Q1的差值D为50-30=20。
计算单元202,还用于计算所述时间点i对应的疾病监测数据x i的上界T1 和下界T2,其中,所述上界T1=Q2+k*D,所述下界T2=Q1-k*D,k为可调参数。
在一实施例中,所述第一分位数Q1是0.25分位数,所述第二分位数Q2是0.75分位数,对应的k可以在[1.5,3]区间取值,例如取值为2。
第一比较单元203,用于将时间点i对应的疾病监测数据x i和所述上界T1及所述下界T2进行比较,若时间点i对应的疾病监测数据x i大于所述上界T1或者小于所述下界T2,则所述时间点i对应的疾病监测数据x i为异常值。
例如,时间点9对应的疾病监测数据x 9为5,对应的上界T1为10,对应所述下界T2为7,则该疾病监测数据x 9为异常值。
又如,时间点8对应的疾病监测数据x 8为6,对应的上界T1为9,对应所述下界T2为57,则该疾病监测数据x 8为非异常值。
实施例二的疾病异常数据检测装置获取疾病监测的时间序列数据X,X=[x 0,x 1,x 2,…,x t],其中x 0,x 1,x 2,…,x t为对应于时间点0,1,2,…,t的疾病监测数据;选取时间窗大小w,对于任意时间点i,i=w,w+1,…,t,计算所述时间点i对应的时间窗内疾病监测数据的第一分位数Q1和第二分位数Q2,所述时间点i对应的时间窗的大小为w,所述第一分位数Q1小于所述第二分位数Q2;计算所述第二分位数Q2与所述第一分位数Q1的差值D;计算所述时间点i对应的疾病监测数据x i的上界T1和下界T2,其中,所述上界T1=Q2+k*D,所述下界T2=Q1-k*D,k为可调参数;将时间点i对应的疾病监测数据x i和所述上界T1及所述下界T2进行比较,若时间点i对应的疾病监测数据x i大于所述上界T1或者小于所述下界T2,则所述时间点i对应的疾病监测数据x i为异常值。
对于时间序列数据,越邻近的数据对当前越具有参考价值,越久远的参考价值越低。实施例二考虑到时间序列的特点,将邻近的历史数据分布作为参考来对当前数据进行异常的判定,可以得到较好的检测结果。并且,实施例二对数据分布没有要求,并不要求是正态分布,可以直接对短时期内的疾病监测数据进行异常检测,克服了要求时间窗内数据满足正态分布的限制,对于疾病监测数据的异常检测具有更高的可适用性。因此,实施例二实现了高效准确的疾病监测数据异常检测。
在另一实施例中,可以结合其他的疾病异常数据检测装置(其他的疾病异常数据检测装置采用不同于实施例一的疾病异常数据检测方法)进行疾病异常数据检测。具体地,实施例二的疾病异常数据检测装置还可以包括:检测单元,用于获取其他的疾病异常数据检测装置对所述时间序列数据进行检测得到的异常值;第二比较单元,用于将实施例二的疾病异常数据检测装置 得到的异常值与所述其他的疾病异常数据检测装置得到的异常值进行比较,根据实施例二的疾病异常数据检测装置得到的异常值与所述其他的疾病异常数据检测装置得到的异常值的比较结果得到最终的异常值。
例如,采用实施例二的疾病异常数据检测装置对疾病监测的时间序列数据进行疾病异常数据检测得到第一异常值,采用其他的疾病异常数据检测装置对所述疾病监测的时间序列数据进行疾病异常数据检测得到第二异常值,第二比较单元比较所述第一异常值和所述到第二异常值得到最终的异常值。若所述第一异常值和所述到第二异常值一致,则以所述第一异常值/到第二异常值作为最终的异常值;否则,若所述第一异常值和所述到第二异常值不一致,则舍弃所述第一异常值与所述第二异常值。
又如,采用实施例二的疾病异常数据检测装置对疾病监测的时间序列数据进行疾病异常数据检测得到第一异常值,采用第二疾病异常数据检测装置(该第二疾病异常数据检测装置例如采用Grubbs检测方法)对所述疾病监测的时间序列数据进行疾病异常数据检测得到第二异常值,采用第三疾病异常数据检测装置(该第三疾病异常数据检测装置例如采用叶斯检测方法)对所述疾病监测的时间序列数据进行疾病异常数据检测得到第三异常值,第二比较单元比较所述第一异常值、所述第二异常值和所述第三异常值得到最终的异常值。若所述第一异常值、所述第二异常值和所述第三异常值中至少两个异常值一致,则以一致的异常值作为最终的异常值。
在实施例一的疾病异常数据检测装置的基础上,结合其他的疾病异常数据检测装置进行疾病异常数据检测,可以获得更加准确的疾病异常数据检测结果。
在另一实施例中,可以采用实施例二的疾病异常数据检测装置分别对地区和地区下属医院进行疾病异常数据检测,得到针对地区的检测结果(即地区异常值)和针对地区下属医院的检测结果(即地区下属医院异常值)。所述疾病异常数据检测装置还包括第三比较单元,用于比较所述地区异常值和所述地区下属医院异常值,根据所述地区异常值和所述地区下属医院异常值的比较结果得到最终的异常值。若针对地区的检测结果和针对地区下属医院的检测结果一致,则以针对地区的检测结果/针对地区下属医院的检测结果作为最终的检测结果;否则,若针对地区的检测结果和针对地区下属医院的检测结果不一致,则舍弃所述针对地区的检测结果和针对地区下属医院的检测结果。
其中,对地区进行疾病异常数据检测是根据所述地区的疾病监测的时间序列数据(例如地区的疾控部门从各个地区下属医院收集到的疾病监测数据) 得到地区异常值,对地区下属医院进行疾病异常数据检测是根据所述地区下属医院的疾病监测的时间序列数据得到所述地区下属医院的异常值。
具体来说,实施例二的疾病异常数据检测装置从地区某时间段内的疾病监测数据(例如病例数)中找出异常值,从该地区下属医院同样时间段内的疾病监测数据中找出异常值,取两个维度的交集来作为最终的检测结果。
例如,地区在2014-3-3,2014-3-4,2014-3-5,2014-3-6病例数分别为160,250,170,180,该地区下属医院(例如该地区下该疾病累计就诊次数最多的医院)在这段时间的病例数分别为130,180,125,140。从地区病例数分布来看,在2014-3-4这天出现了异常病例数,同时下属医院在这天也出现了异常病例数,所以综合判定在这天出现了疾病就诊异常的现象。
又如,地区在2014-3-3,2014-3-4,2014-3-5,2014-3-6病例数分别为160,210,170,180,该地区下属医院(例如该地区下该疾病累计就诊次数最多的医院)在这段时间病例数分别为130,140,125,140。从地区病例数分布来看,在2014-3-4这天出现了异常病例数,但是下属医院在这天并未出现异常病例数。这是由于地区下有很多家医院,地区在这一天的就诊病例数是由下属所有的医院的病例数的总和,部分医院在这一天有一个小幅度的增长,在医院维度上并不是异常,但是所有的小幅度增长后的总和在地区维度上就表现为异常了。
采用实施例二的疾病异常数据检测装置分别对地区和地区下属医院进行疾病异常数据检测,根据针对地区的检测结果和针对地区下属医院的检测结果得到最终的检测结果,可以获得更加准确的疾病异常数据检测结果。
实施例三
本实施例提供一种非易失性可读存储介质,该非易失性可读存储介质上存储有计算机可读指令,该计算机可读指令被处理器执行时实现上述疾病异常数据检测方法实施例中的步骤,例如图1所示的步骤101-105:
步骤101,获取疾病监测的时间序列数据X,X=[x 0,x 1,x 2,…,x t],其中x 0,x 1,x 2,…,x t为对应于时间点0,1,2,…,t的疾病监测数据;
步骤102,选取时间窗大小w,对于任意时间点i,i=w,w+1,…,t,计算所述时间点i对应的时间窗内疾病监测数据的第一分位数Q1和第二分位数Q2,所述时间点i对应的时间窗的大小为w,所述第一分位数Q1小于所述第二分位数Q2;
步骤103,计算所述第二分位数Q2与所述第一分位数Q1的差值D;
步骤104,计算所述时间点i对应的疾病监测数据x i的上界T1和下界T2,其中,所述上界T1=Q2+k*D,所述下界T2=Q1-k*D,k为可调参数;
步骤105,将时间点i对应的疾病监测数据x i和所述上界T1及所述下界T2进行比较,若时间点i对应的疾病监测数据x i大于所述上界T1或者小于所述下界T2,则所述时间点i对应的疾病监测数据x i为异常值。
或者,该计算机可读指令被处理器执行时实现上述装置实施例中各模块/单元的功能,例如图2中的单元201-203:
获取单元201,用于获取疾病监测的时间序列数据X,X=[x 0,x 1,x 2,…,x t],其中x 0,x 1,x 2,…,x t为对应于时间点0,1,2,…,t的疾病监测数据;
计算单元202,用于选取时间窗大小w,对于任意时间点i,i=w,w+1,…,t,计算所述时间点i对应的时间窗内疾病监测数据的第一分位数Q1和第二分位数Q2,所述时间点i对应的时间窗的大小为w,所述第一分位数Q1小于所述第二分位数Q2;
计算单元202,还用于计算所述第二分位数Q2与所述第一分位数Q1的差值D;
计算单元202,还用于计算所述时间点i对应的疾病监测数据x i的上界T1和下界T2,其中,所述上界T1=Q2+k*D,所述下界T2=Q1-k*D,k为可调参数;
第一比较单元203,用于将时间点i对应的疾病监测数据x i和所述上界T1及所述下界T2进行比较,若时间点i对应的疾病监测数据x i大于所述上界T1或者小于所述下界T2,则所述时间点i对应的疾病监测数据x i为异常值。
实施例四
图3为本申请实施例四提供的计算机装置的示意图。所述计算机装置1包括存储器20、处理器30以及存储在所述存储器20中并可在所述处理器30上运行的计算机可读指令40,例如疾病异常数据检测程序。所述处理器30执行所述计算机可读指令40时实现上述疾病异常数据检测方法实施例中的步骤,例如图1所示的步骤101-105:
步骤101,获取疾病监测的时间序列数据X,X=[x 0,x 1,x 2,…,x t],其中x 0,x 1,x 2,…,x t为对应于时间点0,1,2,…,t的疾病监测数据;
步骤102,选取时间窗大小w,对于任意时间点i,i=w,w+1,…,t,计算所述时间点i对应的时间窗内疾病监测数据的第一分位数Q1和第二分位数Q2,所述时间点i对应的时间窗的大小为w,所述第一分位数Q1小于所述第二分位数Q2;
步骤103,计算所述第二分位数Q2与所述第一分位数Q1的差值D;
步骤104,计算所述时间点i对应的疾病监测数据x i的上界T1和下界T2,其中,所述上界T1=Q2+k*D,所述下界T2=Q1-k*D,k为可调参数;
步骤105,将时间点i对应的疾病监测数据x i和所述上界T1及所述下界T2进行比较,若时间点i对应的疾病监测数据xi大于所述上界T1或者小于所述下界T2,则所述时间点i对应的疾病监测数据x i为异常值。
或者,所述处理器30执行所述计算机可读指令40时实现上述装置实施例中各模块/单元的功能,例如图2中的单元201-203:
获取单元201,用于获取疾病监测的时间序列数据X,X=[x 0,x 1,x 2,…,x t],其中x 0,x 1,x 2,…,x t为对应于时间点0,1,2,…,t的疾病监测数据;
计算单元202,用于选取时间窗大小w,对于任意时间点i,i=w,w+1,…,t,计算所述时间点i对应的时间窗内疾病监测数据的第一分位数Q1和第二分位数Q2,所述时间点i对应的时间窗的大小为w,所述第一分位数Q1小于所述第二分位数Q2;
计算单元202,还用于计算所述第二分位数Q2与所述第一分位数Q1的差值D;
计算单元202,还用于计算所述时间点i对应的疾病监测数据x i的上界T1和下界T2,其中,所述上界T1=Q2+k*D,所述下界T2=Q1-k*D,k为可调参数;
第一比较单元203,用于将时间点i对应的疾病监测数据x i和所述上界T1及所述下界T2进行比较,若时间点i对应的疾病监测数据x i大于所述上界T1或者小于所述下界T2,则所述时间点i对应的疾病监测数据x i为异常值。
示例性的,所述计算机可读指令40可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器20中,并由所述处理器30执行,以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机可读指令段,该指令段用于描述所述计算机可读指令40在所述计算机装置1中的执行过程。例如,所述计算机可读指令40可以被分割成图2中的获取单元201、计算单元202、第一比较单元203,各单元具体功能参见实施例二。
所述计算机装置1可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。本领域技术人员可以理解,所述示意图3仅仅是计算机装置1的示例,并不构成对计算机装置1的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述计算机装置1还可以包括输入输出设备、网络接入设备、总线等。
所称处理器30可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门 阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器30也可以是任何常规的处理器等,所述处理器30是所述计算机装置1的控制中心,利用各种接口和线路连接整个计算机装置1的各个部分。
所述存储器20可用于存储所述计算机可读指令40和/或模块/单元,所述处理器30通过运行或执行存储在所述存储器20内的计算机可读指令和/或模块/单元,以及调用存储在存储器20内的数据,实现所述计算机装置1的各种功能。所述存储器20可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据计算机装置1的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器20可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
所述计算机装置1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机可读指令来指令相关的硬件来完成,所述的计算机可读指令可存储于一非易失性可读存储介质中,该计算机可读指令在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机可读指令包括计算机可读指令代码,所述计算机可读指令代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机可读指令代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
在本申请所提供的几个实施例中,应该理解到,所揭露的计算机装置和方法,可以通过其它的方式实现。例如,以上所描述的计算机装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
另外,在本申请各个实施例中的各功能单元可以集成在相同处理单元中, 也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在相同单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其他的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。计算机装置权利要求中陈述的多个单元或计算机装置也可以由同一个单元或计算机装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本申请的技术方案而非限制,尽管参照较佳实施例对本申请进行了详细说明,本领域的普通技术人员应当理解,可以对本申请的技术方案进行修改或等同替换,而不脱离本申请技术方案的精神和范围。

Claims (20)

  1. 一种疾病异常数据检测方法,其特征在于,所述方法包括:
    获取疾病监测的时间序列数据X,X=[x 0,x 1,x 2,…,x t],其中x 0,x 1,x 2,…,x t为对应于时间点0,1,2,…,t的疾病监测数据;
    选取时间窗大小w,对于任意时间点i,i=w,w+1,…,t,计算所述时间点i对应的时间窗内疾病监测数据的第一分位数Q1和第二分位数Q2,所述时间点i对应的时间窗的大小为w,所述第一分位数Q1小于所述第二分位数Q2;
    计算所述第二分位数Q2与所述第一分位数Q1的差值D;
    计算所述时间点i对应的疾病监测数据x i的上界T1和下界T2,其中,所述上界T1=Q2+k*D,所述下界T2=Q1-k*D,k为可调参数;
    将时间点i对应的疾病监测数据x i和所述上界T1及所述下界T2进行比较,若时间点i对应的疾病监测数据x i大于所述上界T1或者小于所述下界T2,则所述时间点i对应的疾病监测数据x i为异常值。
  2. 如权利要求1所述的方法,其特征在于,所述第一分位数Q1是0.25分位数,所述第二分位数Q2是0.75分位数,所述k在[1.5,3]区间取值。
  3. 如权利要求1所述的方法,其特征在于,所述方法还包括:
    获取其他的疾病异常数据检测方法对所述时间序列数据进行检测得到的异常值;
    将所述疾病异常数据检测方法得到的异常值与所述其他的疾病异常数据检测方法得到的异常值进行比较;
    根据所述疾病异常数据检测方法得到的异常值与所述其他的疾病异常数据检测方法得到的异常值的比较结果得到最终的异常值。
  4. 如权利要求1所述的方法,其特征在于,所述方法还包括:
    分别对地区和地区下属医院进行疾病异常数据检测,得到针对地区的地区异常值和针对地区下属医院的地区下属医院异常值;
    比较所述地区异常值和所述地区下属医院异常值,根据所述地区异常值和所述地区下属医院异常值的比较结果得到最终的异常值。
  5. 如权利要求1-4中任一项所述的方法,其特征在于,所述疾病监测数据包括疾病的就诊数、就诊率、发病数、发病率。
  6. 如权利要求1-4中任一项所述的方法,其特征在于,所述获取疾病监测的时间序列数据包括:
    在预设区域建立由多个监测点组成的疾病监测网络,从所述监测点获取疾病监测数据,由所述疾病监测数据构成所述时间序列数据。
  7. 如权利要求6所述的方法,其特征在于,所述监测点包括满足预设人数或规模的医疗机构、学校和幼托机构、药店。
  8. 一种疾病异常数据检测装置,其特征在于,所述装置包括:
    获取单元,用于获取疾病监测的时间序列数据X,X=[x 0,x 1,x 2,…,x t],其中x 0,x 1,x 2,…,x t为对应于时间点0,1,2,…,t的疾病监测数据;
    计算单元,用于选取时间窗大小w,对于任意时间点i,i=w,w+1,…,t,计算所述时间点i对应的时间窗内疾病监测数据的第一分位数Q1和第二分位数Q2,所述时间点i对应的时间窗的大小为w,所述第一分位数Q1小于所述第二分位数Q2;
    所述计算单元,还用于计算所述第二分位数Q2与所述第一分位数Q1的差值D;
    所述计算单元,还用于计算所述时间点i对应的疾病监测数据x i的上界T1和下界T2,其中,所述上界T1=Q2+k*D,所述下界T2=Q1-k*D,k为可调参数;
    第一比较单元,用于将时间点i对应的疾病监测数据x i和所述上界T1及所述下界T2进行比较,若时间点i对应的疾病监测数据x i大于所述上界T1或者小于所述下界T2,则所述时间点i对应的疾病监测数据x i为异常值。
  9. 一种计算机装置,其特征在于,所述计算机装置包括存储器及处理器,所述存储器用于存储至少一个计算机可读指令,所述处理器用于执行所述至少一个计算机可读指令以实现以下步骤:
    获取疾病监测的时间序列数据X,X=[x 0,x 1,x 2,…,x t],其中x 0,x 1,x 2,…,x t为对应于时间点0,1,2,…,t的疾病监测数据;
    选取时间窗大小w,对于任意时间点i,i=w,w+1,…,t,计算所述时间点i对应的时间窗内疾病监测数据的第一分位数Q1和第二分位数Q2,所述时间点i对应的时间窗的大小为w,所述第一分位数Q1小于所述第二分位数Q2;
    计算所述第二分位数Q2与所述第一分位数Q1的差值D;
    计算所述时间点i对应的疾病监测数据x i的上界T1和下界T2,其中,所述上界T1=Q2+k*D,所述下界T2=Q1-k*D,k为可调参数;
    将时间点i对应的疾病监测数据x i和所述上界T1及所述下界T2进行比较,若时间点i对应的疾病监测数据x i大于所述上界T1或者小于所述下界T2,则所述时间点i对应的疾病监测数据x i为异常值。
  10. 如权利要求9所述的计算机装置,其特征在于,所述第一分位数Q1是 0.25分位数,所述第二分位数Q2是0.75分位数,所述k在[1.5,3]区间取值。
  11. 如权利要求9所述的计算机装置,其特征在于,所述处理器还用于执行所述至少一个计算机可读指令,以实现以下步骤:
    获取其他的疾病异常数据检测方法对所述时间序列数据进行检测得到的异常值;
    将所述疾病异常数据检测方法得到的异常值与所述其他的疾病异常数据检测方法得到的异常值进行比较;
    根据所述疾病异常数据检测方法得到的异常值与所述其他的疾病异常数据检测方法得到的异常值的比较结果得到最终的异常值。
  12. 如权利要求9所述的计算机装置,其特征在于,所述处理器还用于执行所述至少一个计算机可读指令,以实现以下步骤:
    分别对地区和地区下属医院进行疾病异常数据检测,得到针对地区的地区异常值和针对地区下属医院的地区下属医院异常值;
    比较所述地区异常值和所述地区下属医院异常值,根据所述地区异常值和所述地区下属医院异常值的比较结果得到最终的异常值。
  13. 如权利要求9-12中任一项所述的计算机装置,其特征在于,所述疾病监测数据包括疾病的就诊数、就诊率、发病数、发病率。
  14. 如权利要求9-12中任一项所述的计算机装置,其特征在于,所述获取疾病监测的时间序列数据包括:
    在预设区域建立由多个监测点组成的疾病监测网络,从所述监测点获取疾病监测数据,由所述疾病监测数据构成所述时间序列数据。
  15. 一种非易失性可读存储介质,其特征在于,所述非易失性可读存储介质存储有至少一个计算机可读指令,所述至少一个计算机可读指令被处理器执行时实现以下步骤:
    获取疾病监测的时间序列数据X,X=[x 0,x 1,x 2,…,x t],其中x 0,x 1,x 2,…,x t为对应于时间点0,1,2,…,t的疾病监测数据;
    选取时间窗大小w,对于任意时间点i,i=w,w+1,…,t,计算所述时间点i对应的时间窗内疾病监测数据的第一分位数Q1和第二分位数Q2,所述时间点i对应的时间窗的大小为w,所述第一分位数Q1小于所述第二分位数Q2;
    计算所述第二分位数Q2与所述第一分位数Q1的差值D;
    计算所述时间点i对应的疾病监测数据x i的上界T1和下界T2,其中,所述上界T1=Q2+k*D,所述下界T2=Q1-k*D,k为可调参数;
    将时间点i对应的疾病监测数据x i和所述上界T1及所述下界T2进行比较, 若时间点i对应的疾病监测数据x i大于所述上界T1或者小于所述下界T2,则所述时间点i对应的疾病监测数据x i为异常值。
  16. 如权利要求15所述的存储介质,其特征在于,所述第一分位数Q1是0.25分位数,所述第二分位数Q2是0.75分位数,所述k在[1.5,3]区间取值。
  17. 如权利要求15所述的存储介质,其特征在于,所述至少一个计算机可读指令被处理器执行时,还实现以下步骤:
    获取其他的疾病异常数据检测方法对所述时间序列数据进行检测得到的异常值;
    将所述疾病异常数据检测方法得到的异常值与所述其他的疾病异常数据检测方法得到的异常值进行比较;
    根据所述疾病异常数据检测方法得到的异常值与所述其他的疾病异常数据检测方法得到的异常值的比较结果得到最终的异常值。
  18. 如权利要求15所述的存储介质,其特征在于,所述至少一个计算机可读指令被处理器执行时,还实现以下步骤:
    分别对地区和地区下属医院进行疾病异常数据检测,得到针对地区的地区异常值和针对地区下属医院的地区下属医院异常值;
    比较所述地区异常值和所述地区下属医院异常值,根据所述地区异常值和所述地区下属医院异常值的比较结果得到最终的异常值。
  19. 如权利要求15-18中任一项所述的存储介质,其特征在于,所述疾病监测数据包括疾病的就诊数、就诊率、发病数、发病率。
  20. 如权利要求15-18中任一项所述的存储介质,其特征在于,所述获取疾病监测的时间序列数据包括:
    在预设区域建立由多个监测点组成的疾病监测网络,从所述监测点获取疾病监测数据,由所述疾病监测数据构成所述时间序列数据。
PCT/CN2018/099653 2018-04-11 2018-08-09 疾病异常数据检测方法及装置、计算机装置及存储介质 WO2019196282A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201810321079.6A CN108320810A (zh) 2018-04-11 2018-04-11 疾病异常数据检测方法及装置、计算机装置及存储介质
CN201810321079.6 2018-04-11

Publications (1)

Publication Number Publication Date
WO2019196282A1 true WO2019196282A1 (zh) 2019-10-17

Family

ID=62897313

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2018/099653 WO2019196282A1 (zh) 2018-04-11 2018-08-09 疾病异常数据检测方法及装置、计算机装置及存储介质

Country Status (2)

Country Link
CN (1) CN108320810A (zh)
WO (1) WO2019196282A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108320810A (zh) * 2018-04-11 2018-07-24 平安科技(深圳)有限公司 疾病异常数据检测方法及装置、计算机装置及存储介质
CN109545387B (zh) * 2018-10-30 2024-02-27 平安科技(深圳)有限公司 一种基于神经网络的异常病例识别方法及计算设备
CN111367747B (zh) * 2018-12-25 2023-07-04 中国移动通信集团浙江有限公司 基于时间标注的指标异动检测预警的装置
CN110851503B (zh) * 2019-11-19 2022-07-05 天津开心生活科技有限公司 医疗模式转换识别方法及装置、电子设备、存储介质
CN111625413A (zh) * 2020-04-23 2020-09-04 平安科技(深圳)有限公司 指标异常分析方法、装置及存储介质
CN112598883B (zh) * 2021-02-07 2021-12-31 国网江苏省电力有限公司苏州供电分公司 基于贝叶斯网络的输电线路落雷概率预警方法及预警系统
CN116701383B (zh) * 2023-08-03 2023-10-27 中航信移动科技有限公司 一种数据实时质量监测方法、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100274308A1 (en) * 2009-04-24 2010-10-28 Scott Timothy L Use of cardiac parameters in methods and systems for treating a chronic medical condition
CN106510619A (zh) * 2016-10-11 2017-03-22 天津大学 基于复杂网络的心电信号分析方法及在智能穿戴上的应用
CN107252313A (zh) * 2017-05-25 2017-10-17 深圳市卡迪赛克科技有限公司 一种安全驾驶的监测方法及系统、汽车、可读存储介质
CN107610779A (zh) * 2017-10-25 2018-01-19 医渡云(北京)技术有限公司 疾病评价及患病风险评估方法及装置
CN108320810A (zh) * 2018-04-11 2018-07-24 平安科技(深圳)有限公司 疾病异常数据检测方法及装置、计算机装置及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102195070B1 (ko) * 2014-10-10 2020-12-24 삼성에스디에스 주식회사 시계열 데이터의 분석을 통한 이상 감지 및 예측 시스템 및 방법
CN104915846A (zh) * 2015-06-18 2015-09-16 北京京东尚科信息技术有限公司 一种电子商务时间序列数据的异常检测方法及系统
CN106095655B (zh) * 2016-05-31 2018-06-12 北京蓝海讯通科技股份有限公司 一种异常检测方法、应用和监控设备
CN106368813B (zh) * 2016-08-30 2018-09-25 北京协同创新智能电网技术有限公司 一种基于多元时间序列的异常报警数据检测方法
CN106909793A (zh) * 2017-03-03 2017-06-30 北京北青厚泽数据科技有限公司 检验服从近似正态分布的时间序列的异常的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100274308A1 (en) * 2009-04-24 2010-10-28 Scott Timothy L Use of cardiac parameters in methods and systems for treating a chronic medical condition
CN106510619A (zh) * 2016-10-11 2017-03-22 天津大学 基于复杂网络的心电信号分析方法及在智能穿戴上的应用
CN107252313A (zh) * 2017-05-25 2017-10-17 深圳市卡迪赛克科技有限公司 一种安全驾驶的监测方法及系统、汽车、可读存储介质
CN107610779A (zh) * 2017-10-25 2018-01-19 医渡云(北京)技术有限公司 疾病评价及患病风险评估方法及装置
CN108320810A (zh) * 2018-04-11 2018-07-24 平安科技(深圳)有限公司 疾病异常数据检测方法及装置、计算机装置及存储介质

Also Published As

Publication number Publication date
CN108320810A (zh) 2018-07-24

Similar Documents

Publication Publication Date Title
WO2019196282A1 (zh) 疾病异常数据检测方法及装置、计算机装置及存储介质
Huter et al. Effectiveness of digital technologies to support nursing care: results of a scoping review
Spinelli et al. Missed visits associated with future preexposure prophylaxis (PrEP) discontinuation among PrEP users in a municipal primary care health network
CN108597617B (zh) 流行病分级预测方法及装置、计算机装置和可读存储介质
US20180301228A1 (en) Geographic utilization of artificial intelligence in real-time for disease identification and alert notification
Mazzoni et al. Effect of a multi-modal intervention on immunization rates in obstetrics and gynecology clinics
Tai-Seale et al. Technology-enabled consumer engagement: promising practices at four health care delivery organizations
Hatah et al. The influence of cultural and religious orientations on social support and its potential impact on medication adherence
WO2019196279A1 (zh) 疾病异常数据检测方法及装置、计算机装置及存储介质
Salleron et al. Effectiveness research in inflammatory bowel disease: a necessity and a methodological challenge
Goh et al. Unplanned reattendances at the paediatric emergency department within 72 hours: a one-year experience in KKH
Li et al. Improving influenza vaccination coverage among patients with COPD: a pilot project
WO2019196283A1 (zh) 流行病预测方法、计算机装置及非易失性可读存储介质
Axelsson et al. Cost-effectiveness and long-term follow-up of three forms of minimal-contact cognitive behaviour therapy for severe health anxiety: Results from a randomised controlled trial
Zucker et al. Impact of stewardship interventions on antiretroviral medication errors in an urban medical center: A 3‐year, multiphase study
Tanenbaum et al. Association of a regional health improvement collaborative with ambulatory care–sensitive hospitalizations
Kimera et al. An Overview of Data Science Innovations, Challenges and Limitations Towards Real-World Implementations in Global Health
Whidden et al. Proactive community case management and child survival: protocol for a cluster randomised controlled trial
Crisafulli et al. Digital therapeutics in perspective: from regulatory challenges to post-marketing surveillance
Grimmer et al. Identifying functional decline: a methodological challenge
Kang et al. Filial caregiving is associated with greater neuroendocrine dysfunction: Evidence from the 2005 National Survey of Midlife in the United States
Fort et al. Locally informed modeling to predict hospital and intensive care unit capacity during the COVID-19 epidemic
Saberi et al. The effect of an HIV preexposure prophylaxis panel management strategy to increase preexposure prophylaxis prescriptions
Morris Smart biomedical sensors, big healthcare data analytics, and virtual care technologies in monitoring, detection, and prevention of COVID-19
US20180349558A1 (en) Systems and methods for autonomous discharge queue management

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18914444

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

32PN Ep: public notification in the ep bulletin as address of the adressee cannot be established

Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205A DATED 21/01/2021)

122 Ep: pct application non-entry in european phase

Ref document number: 18914444

Country of ref document: EP

Kind code of ref document: A1