CN112347813A - 高信噪比时间序列的基线检测方法、设备及存储介质 - Google Patents

高信噪比时间序列的基线检测方法、设备及存储介质 Download PDF

Info

Publication number
CN112347813A
CN112347813A CN201910727069.7A CN201910727069A CN112347813A CN 112347813 A CN112347813 A CN 112347813A CN 201910727069 A CN201910727069 A CN 201910727069A CN 112347813 A CN112347813 A CN 112347813A
Authority
CN
China
Prior art keywords
subsequence
baseline
subsequences
baselines
corrected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910727069.7A
Other languages
English (en)
Other versions
CN112347813B (zh
Inventor
苗圣法
陈晓安
潘盛合
胡泽柱
罗剑江
王亮
陈春璐
周奇
王南飞
尹东富
李杏
张硕硕
罗仁士
马敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SF Technology Co Ltd
Original Assignee
SF Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SF Technology Co Ltd filed Critical SF Technology Co Ltd
Priority to CN201910727069.7A priority Critical patent/CN112347813B/zh
Publication of CN112347813A publication Critical patent/CN112347813A/zh
Application granted granted Critical
Publication of CN112347813B publication Critical patent/CN112347813B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/02Preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/29Graphical models, e.g. Bayesian networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)

Abstract

本申请实施例公开了一种高信噪比时间序列的基线检测方法、高信噪比时间序列的基线检测设备及存储介质。本申请实施例可以通过滑动窗口将原始时间序列分为多个子序列,获取所述多个子序列各自的子序列基线;连接相邻滑动窗口的子序列基线,以获取初步基线模型;及根据所述子序列的绝对斜率的概率密度分布来设定阈值,当所述子序列的绝对斜率大于所述阈值时,更正所述初步基线模型。本申请通过数据点的概率密度分布,对有实际意义的数据点和噪音点进行了有效的区分,适用于高信噪比时间序列的基线探测及自动校正。

Description

高信噪比时间序列的基线检测方法、设备及存储介质
技术领域
本申请涉及时间序列的基线检测技术领域,具体涉及一种高信噪比时间序列的基线检测方法、高信噪比时间序列的基线检测设备及存储介质。
背景技术
随着计算机、数据处理和传感技术的发展,越来越多的智能设备(传感器)被应用到现实生活中。这些设备在给我们提供便利的同时,也按照时间的顺序记录着主体的活动。这些数字化的记录被称为时间序列。时间序列在金融、智慧城市、智慧物流等关注时效规律的领域都发挥着极其重要的作用。使用时间序列进行模式识别或预测时,最大的挑战是来自环境因素的干扰(基线漂移)。如图1所示,时间序列的基线检测会受到大尺度及中尺度的干扰而使得检测出的基线与实际的时间序列之间距有相当程度的飘移/误差。
目前也有许多检测技术,例如中值滤波(Median Filter)方法、迭代多项式拟合方法及求导方法等,运用在时间序列的基线检测上,但是这些方法都不适用于信噪比(Signal-to-Noise Ratio(SNR))高或存在多尺度模式的时间序列。此外,以图2所示,在相同的窗口的时间序列,利用不同的数据特征(例如,如最小值、中值及均值)来提取时间系列的基线也有相当差异。均值基线及中值基线赋予窗口中所有的数据点相同的权值,也就是不对基线与波峰上的数据点区别对待,波峰上的数据点会影响中值及均值,因此均值基线及中值基线无法稳地的呈现信噪比高的时间序列的实际状态。同样地,当所有的波峰都向上时,最小值基线才稳定,一旦遇到双向混合波峰(波峰及波谷),最小值基线也无法呈现时间序列的实际状态。
为了克服现有方法存在的问题,需要一种针对高信噪比时间序列的基线检测方法及设备。
发明内容
本申请实施例提供一种高信噪比时间序列的基线检测方法、高信噪比时间序列的基线检测设备及存储介质,根据数据的概率密度分布,对有实际意义的数据点及噪音点进行了有效的区分。本申请实施例适用于高信噪比时间序列的基线检测及自动校正,具有较高的现实应用价值。
第一方面,本申请实施例提供了一种高信噪比时间序列的基线检测方法,包括:
通过滑动窗口将原始时间序列分为多个子序列,获取所述多个子序列各自的子序列基线;
连接相邻滑动窗口的子序列基线,以获取初步基线模型;及
根据所述子序列的绝对斜率的概率密度分布来设定阈值,当所述子序列的绝对斜率大于所述阈值时,更正所述初步基线模型。
在一些实施方式中,所述通过滑动窗口将原始时间序列分为多个子序列,获取所述多个子序列各自的子序列基线包括:
通过最小描述长度(MDL)来自动设置滑动窗口长度,将所述原始时间序列划分为所述多个子序列;及
通过核密度估计法(KDE)来分析每一个所述子序列中的数据点,以获得核平滑概率密度分布,所述核平滑概率密度分布包括多个波峰,其中振幅最大的波峰为概率密度最高的点,选定所述概率密度最高的点作为每一个所述子序列的所述子序列基线。
在一些实施方式中,所述连接相邻滑动窗口的子序列基线,以获取初步基线模型包括:
通过最小描述长度(MDL)来计算跨度值,并且根据所述跨度值移动所述滑动窗口;及
通过线性插值连接所述相邻滑动窗口的子序列基线。
在一些实施方式中,所述根据所述子序列的绝对斜率的概率密度分布来设定阈值,当所述子序列的绝对斜率大于所述阈值时,更正所述初步基线模型包括:
延长所述相邻滑动窗口的两个子序列各自的所述子序列基线,以形成两个虚拟子序列基线;
定义所述两个虚拟子序列基线与所述原始时间序列的交点中最相邻的两个为两个转折点,所述两个子序列与所述各自的转折点形成两个更正后子序列;
获取两个更正后子序列基线,并且所述两个转折点之间,以相对应的所述原始时间序列作为转折点基线;及
连接所述两个更正后子序列基线及所述转折点基线,以形成更正后基线模型。
在一些实施方式中,所述高信噪比时间序列的基线检测方法,更包括:
将时间序列在前的第一子序列的所述子序列基线往后延长一个所述滑动窗口长度,以形成第一虚拟子序列基线,及将时间序列在后的第二子序列的所述子序列基线往前延长一个所述滑动窗口长度,以形成一第二虚拟子序列基线;
定义所述第一虚拟子序列基线与所述原始时间序列的最后交点为第一转折点,及定义所述第二虚拟子序列基线与所述原始时间序列的最前交点为第二转折点,其中所述第一子序列与所述第一转折点形成第一更正后子序列,所述第二子序列与所述第二转折点形成第二更正后子序列;
获取所述第一更正后子序列及所述第二更正后子序列各自的第一更正后子序列基线及第二更正后子序列基线,并且所述第一转折点与所述第二转折点之间,以相对应的所述原始时间序列作为转折点基线;及
连接所述第一更正后子序列基线、所述第二更正后子序列基线及所述转折点基线,以形成所述更正后基线模型。
在一些实施方式中,所述阈值为所述子序列的绝对斜率的均值加/减一倍标准差的和。
在一些实施方式中,所述高信噪比时间序列的基线检测方法,还包括:
将所述多个子序列基线、所述初步基线模型从所述原始时间序列上消除。
第二方面,本申请实施例还提供了一种高信噪比时间序列的基线检测设备,包括处理器及储存器,所述处理器调用所述储存器中的计算机程序以执行本申请实施例提供的任一种高信噪比时间序列的基线检测方法。
在一些实施方式中,所述计算机程序包括:
基线识别模块,用以通过滑动窗口将原始时间序列分为多个子序列,获取所述多个子序列各自的子序列基线;
基线建模模块,用以连接相邻通过滑动窗口的子序列基线,以获取初步基线模型;
基线更正模块,根据所述子序列的绝对斜率的概率密度分布来设定阈值,当所述子序列的绝对斜率大于所述阈值时,更正所述初步基线模型;
基线消除模块,用以将所述多个子序列基线、所述初步基线模型从所述原始时间序列上消除。
第三方面,本申请还提供一种存储介质,所述存储介质用于存储计算机程序,所述计算机程序适于处理器进行加载,以执行本申请实施例提供的任一种高信噪比时间序列的基线检测方法。
本申请实施例基于MDL的最多穿越法,将时间序列分割成小的子序列,并且对每个子序列进行概率密度分析,以获取子序列的基线。接着把相邻子序列的基线通过线性插值方法连接起来,从而得到整个时间序列的初步基线模型。借助相邻滑动窗口的绝对斜率的密度分布,自动设置阈值,来触发初步基线模型的基线更正操作,以解决其中可能存在的边界问题。藉此,本申请实施例可以对有实际意义的数据点及噪音点进行有效的区分,适用于高信噪比时间序列的基线检测及自动校正。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是多尺度干扰因素对时间序列的基线所造成的飘移现象;
图2是利用不同的数据特征所提取的时间序列的基线的差异;
图3是本申请实施例提供的高信噪比时间序列的基线检测方法的流程示意图;
图4是本申请实施例中所获得的核平滑概率密度分布的示意图;
图5a及图5b是本申请实施例中局部时间序列的初步基线模型及更正后基线模型;
图6a及图6b是本申请实施例中更正初步基线模型的时机;
图7是本申请实施例中更正初步基线模型的操作示意;
图8是根据申请实施例提供的高信噪比时间序列的基线检测方法所提取的时间序列的基线。
图9是本申请实施例提供的高信噪比时间序列的基线检测设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参阅图3至图8,图3是本申请实施例提供的高信噪比时间序列的基线检测方法的流程示意图。图4是本申请实施例中所获得的核平滑概率密度分布的示意图。图5a及图5b是本申请实施例中局部时间序列的初步基线模型及更正后基线模型。图6a及图6b是本申请实施例中更正初步基线模型的时机。图7是本申请实施例中更正初步基线模型的操作示意。图8是根据申请实施例提供的高信噪比时间序列的基线检测方法所提取的时间序列的基线。
所述高信噪比时间序列的基线检测方法的执行主体可以是本申请实施例提供的高信噪比时间序列的基线检测设备。如图3所示,所述高信噪比时间序列的基线检测方法可以包括:
步骤S110、通过滑动窗口将原始时间序列分为多个子序列,获取所述多个子序列各自的子序列基线;
步骤S120、连接相邻滑动窗口的子序列基线,以获取初步基线模型;以及
步骤S130、根据所述子序列的绝对斜率的概率密度分布来设定阈值,当所述子序列的绝对斜率大于所述阈值时,更正所述初步基线模型。
透过分析所述多个子序列,并且连接所述多个子序列各自的子序列基线,可以获得所述初步基线模型。这样一来,可以避免如图1所示,因中尺度干扰或大尺度干扰所造成的大幅度基线飘移。随后透过所述阈值来辨别干扰发生时机,进而更正所述初步基线模型。
所述子序列数量会影响所述初步基线模型的精准度及或获取初步基线模型所耗费的时间(例如所述子序列数量多,所获取的所述初步基线模型的精准度较高,但是需要耗费较多的时间)。因此,为了精准且有效率的划分所述原始时间序列,如图3所示,步骤S110还可以包括:
步骤S112、通过最小描述长度(Minimum Description Length,MDL)来自动设置滑动窗口长度,将所述原始时间序列划分为所述多个子序列;以及
步骤S114、通过核密度估计法(Kernel Density Estimation,KDE)来分析每一个所述子序列中的数据点,以获得核平滑概率密度分布,所述核平滑概率密度分布包括多个波峰,其中振幅最大的波峰为概率密度最高的点,选定所述概率密度最高的点作为每一个所述子序列的所述子序列基线。
在步骤S112中,通常来说,现有技术的分段方法大多根据经验来设置所述滑动窗口长度,而本申请实施例可以透过MDL来自动设定所述滑动窗口长度。根据最小描述长度(MDL)的理论,时间序列T最佳的实例模型IM是能使编码总和L(IM)+L(T/IM)最小的那个。其中,L(IM)是实例模型的描述成本,以位(Bit)为单位;L(T/IM)是去除实例模型能够表示的部分后,时间序列中剩余成分的描述成本,也是以位(Bit)为单位。一般来说,一个复杂的实例模型,能够从目标时间序列中捕捉到更多的细节,从而降低L(T/IM)的描述成本。但是,复杂的模型也意味着高的实例模型成本。因此,总体描述成本促使我们在模型的精确度和复杂度之间做出权衡。意即,步骤S112,透过MDL可以获得机兼具精确度及成本控制的所述滑动窗口长度。
在步骤S114中,所述核密度估计法KDE
Figure BDA0002159276210000061
是一种无参数的概率密度估计方法,可以表示为以下公式:
Figure BDA0002159276210000062
其中,K代表核函数、h代表代表平滑参数(也叫带宽)、xi代表振幅区间上等值分布的第i个点、n代表振幅区间的仓库数。核函数K可以高斯(Gaussian)、平均(Uniform)及双权(Biweight)等。带宽的选择对KDE的影响也很大,我们选择能使平均集成方误差(MeanIntegrated Squared Error(MISE))为最小的带宽,以下称为最优带宽。平均集成方误差可由以下公式来估计:
Figure BDA0002159276210000071
其中的f选用正态分布N(μ,σ2),最优带宽
Figure BDA0002159276210000072
可以根据希而弗曼的拇指法则(Silverman’s Rule of Thumb)来确定:
Figure BDA0002159276210000073
基于上述最优带宽及正态分布,可以获得所述核平滑概率密度分布,如图4所示。其中振幅最大的波峰就是代表对应的所述子序列中最多的穿越点,而且对应最多的穿越点的数值即作为所述子序列的基线常量。如此一来,步骤S114可以避免如图2所示的问题,让所述原始时间序列的实际状态可以完整地呈现。
在步骤S120中、连接相邻滑动窗口的子序列基线,以获取初步基线模型。一般来说可以通过逐点移动所述滑动窗口,便可得到整个所述原始时间序列的基线。但是,这种操作(逐点移动)非常费时,为了更高效地完成基线探测,其中步骤S120还可以包括:
步骤S122、通过最小描述长度(MDL)来计算跨度值,并且根据所述跨度值移动所述滑动窗口。透过MDL所述算出的所述跨度值,可以让所述滑动窗口的移动更有效率。
步骤S124、通过线性插值连接所述相邻滑动窗口的子序列基线。藉此,解决步骤S122可能会产生的子序列基线不连续问题。
如此一来,不需要逐点移动所述滑动窗口,可以更有效率地获得所述初步基线模型。此外,这样的方法并不对基线的形状或功能形式作任何假设,并且即便信噪比较高时,这样的方法也有较好的表现。
在步骤S130中、根据所述子序列的绝对斜率的概率密度分布来设定阈值,当所述子序列的绝对斜率大于所述阈值时,更正所述初步基线模型。在现有技术中,所述阈值是根据经验进行人为指定的,可能会受到使用者经验影响而产生误差。而本申请实施例基于绝对斜率的概率密度分布,提出一种智能的阈值选取方法。如图6a及图6b所示,当干扰发生时(例如图6a中的中尺度干扰发生时),图6b中对应的斜率会会明显地高于斜率均值。本申请实施例设定所述阈值为所述子序列的绝对斜率的均值加/减一倍标准差的和。意即当所述子序列的绝对斜率大于所述阈值时,即有干扰产生,这样的干扰会使产生干扰的所述子序列基线与所述原始的时间基线之间发生飘移,如图5a所示,因此,需要调整产生干扰的所述子序列基线来更正所述初步基线模型。应当理解的是,本文中所提到的绝对斜率指的是斜率的绝对值。
因此,为了更正所述初步基线模型,其中步骤S130还可以包括:
步骤S132、延长所述相邻滑动窗口的两个子序列各自的所述子序列基线,以形成两个虚拟子序列基线;
步骤S134、定义所述两个虚拟子序列基线与所述原始时间序列的交点中最相邻的两个为两个转折点,所述两个子序列与所述各自的转折点形成两个更正后子序列;
步骤S136、获取两个更正后子序列基线,并且所述两个转折点之间,以相对应的所述原始时间序列作为转折点基线;以及
步骤S138、连接所述两个更正后子序列基线及所述转折点基线,以形成更正后基线模型。
藉此,可以成功地解决相邻的所述子序列基线之间的边界问题,如图5a中的局部时间序列的所述初步基线模型可以调整为如图5b中的更正后基线模型。
以下将以图7为例,详细的说明更正所述初步基线模型的操作。如图7所示,所述初步基线模型干扰发生的相邻的所述子序列基线有边界问题。也就是时间序列在前的第一子序列的子序列基线TB1的数据点A及时间序列在后的第二子序列的子序列基线TB2的数据点D与所述原始时间序列有误差。
为了修正这样的误差,本申请实施例将时间序列在前的第一子序列的所述子序列基线TB1往后延长一个所述滑动窗口长度,以形成第一虚拟子序列基线VB1,及将时间序列在后的第二子序列的所述子序列基线TB2往前延长一个所述滑动窗口长度,以形成一第二虚拟子序列基线VB2。
定义所述第一虚拟子序列基线VB1与所述原始时间序列的最后交点为第一转折点(即数据点B),及定义所述第二虚拟子序列基线VB2与所述原始时间序列的最前交点为第二转折点(即数据点C),其中所述第一子序列与所述第一转折点(即数据点B)形成第一更正后子序列,所述第二子序列与所述第二转折点(即数据点B)形成第二更正后子序列。
获取所述第一更正后子序列及所述第二更正后子序列各自的第一更正后子序列基线及第二更正后子序列基线,并且所述第一转折点与所述第二转折点之间,以相对应的所述原始时间序列作为转折点基线。
连接所述第一更正后子序列基线、所述第二更正后子序列基线及所述转折点基线,以形成所述更正后基线模型。如图8所示,所述更正后基线模型可以更贴近所述原始时间序列,解决现有技术会面临的飘移/误差问题,也可以呈现时间序列的实际状态。
此外,本申请实施例还可以将所述多个子序列基线、所述初步基线模型从原始时间序列上消除。如此一来,可以让所述原始时间序列及所述更正后基线模型更清晰以利于判读。应当理解的是,为了更清晰的呈现所述原始时间序列也可以删除所述更正后基线模型。
为了更好地实施本申请实施例提供的所述高信噪比时间序列的基线检测方法,本申请实施例还提供一种高信噪比时间序列的基线检测设备,其中名词的含义与前述的高信噪比时间序列的基线检测方法中相同,具体实现细节可以参考方法实施例中的说明。
请参阅图9,图9是本申请实施例提供的高信噪比时间序列的基线检测设备的结构示意图。所述高信噪比时间序列的基线检测设备200可以包括一个或一个以上处理核心的处理器210、一个或一个以上计算机可读存储介质的储存器220、输入单元230、显示单元240、电源250等部件。本领域技术人员可以理解,图9中示出的结构示意图并不构成对高信噪比时间序列的基线检测设备200的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
所述处理器210是所述高信噪比时间序列的基线检测设备200的控制中心,利用各种接口和线路连接整个所述高信噪比时间序列的基线检测设备200的各个部分,通过运行或执行存储在所述存储器220内的软件程序和/或模块,以及调用存储在所述存储器220内的数据,执行所述高信噪比时间序列的基线检测设备200的各种功能和处理数据,从而对所述高信噪比时间序列的基线检测设备200进行整体监控。可选的,所述处理器210可包括一个或多个处理核心;优选的,所述处理器210可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到所述处理器210中。
所述存储器220可用于存储软件程序以及模块,所述处理器401通过运行存储在所述存储器220的软件程序以及模块,从而执行各种功能应用以及数据处理。所述存储器220可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据服务器的使用所创建的数据等。此外,所述存储器220可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,所述存储器220还可以包括存储器控制器,以提供所述处理器210对所述存储器220的访问。
所述输入单元230可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
所述显示单元240可用于显示由用户输入的信息或提供给用户的信息以及分拣设备的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元240可包括显示面板,可选的,可以采用液晶显示器(LCD,Liquid CrystalDisplay)、有机发光二极管(OLED,Organic Light-Emitting Diode)等形式来配置显示面板。
所述电源250用以对所述高信噪比时间序列的基线检测设备200的各个部件供电,优选的,电源403可以通过电源管理系统与处理器401逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
具体在本实施例中,所述高信噪比时间序列的基线检测设备200中的所述处理器210会按照如下的指令,将一个或一个以上的应用程序/模块的进程对应的可执行文件加载到所述存储器220中,并由所述处理器210来运行存储在所述存储器220中的应用程序/模块,从而实现各种功能,如下:
所述处理器调用所述储存器中的计算机程序以执行前述的高信噪比时间序列的基线检测方法。所述计算机程序包括:基线识别模块222、基线建模模块224、基线更正模块226及基线消除模块228。
所述基线识别模块222用以通过滑动窗口将原始时间序列分为多个子序列,获取所述多个子序列各自的子序列基线。所述基线建模模块224用以连接相邻通过滑动窗口的子序列基线,以获取初步基线模型。所述基线更正模块226根据所述子序列的绝对斜率的概率密度分布来设定阈值,当所述子序列的绝对斜率大于所述阈值时,更正所述初步基线模型。所述基线消除模块228用以将所述多个子序列基线、所述初步基线模型从所述原始时间序列上消除。
所述高信噪比时间序列的基线检测设备的操作的具体实施可参见前面的实施例,在此不再赘述。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,指令可以存储于一计算机可读存储介质中,并由所述处理器进行加载和执行。
为此,本申请实施例还提供一种存储介质,所述存储介质用于存储计算机程序,所述计算机程序适于处理器进行加载,以执行本申请实施例提供所述高信噪比时间序列的基线检测方法。例如,所述计算机程序被所述处理器加载,可以执行如下步骤:
通过滑动窗口将原始时间序列分为多个子序列,获取所述多个子序列各自的子序列基线;连接相邻滑动窗口的子序列基线,以获取初步基线模型;及根据所述子序列的绝对斜率的概率密度分布来设定阈值,当所述子序列的绝对斜率大于所述阈值时,更正所述初步基线模型。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,本领域普通技术人员应当理解,所述存储介质可以包括存储器,例如,只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
本申请实施例提供的所述存储介质执行存储在其中的计算机程序的有益效果,详见前述实施例,在此不再赘述。
以上对本申请实施例所提供的一种高信噪比时间序列的基线检测方法、高信噪比时间序列的基线检测设备及存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种高信噪比时间序列的基线检测方法,其特征在于,包括:
通过滑动窗口将原始时间序列分为多个子序列,获取所述多个子序列各自的子序列基线;
连接相邻滑动窗口的子序列基线,以获取初步基线模型;及
根据所述子序列的绝对斜率的概率密度分布来设定阈值,当所述子序列的绝对斜率大于所述阈值时,更正所述初步基线模型。
2.根据权利要求1所述的高信噪比时间序列的基线检测方法,其特征在于,所述通过滑动窗口将原始时间序列分为多个子序列,获取所述多个子序列各自的子序列基线包括:
通过最小描述长度(MDL)来自动设置滑动窗口长度,将所述原始时间序列划分为所述多个子序列;及
通过核密度估计法(KDE)来分析每一个所述子序列中的数据点,以获得核平滑概率密度分布,所述核平滑概率密度分布包括多个波峰,其中振幅最大的波峰为概率密度最高的点,选定所述概率密度最高的点作为每一个所述子序列的所述子序列基线。
3.根据权利要求2所述的高信噪比时间序列的基线检测方法,其特征在于,所述连接相邻滑动窗口的子序列基线,以获取初步基线模型包括:
通过最小描述长度(MDL)来计算跨度值,并且根据所述跨度值移动所述滑动窗口;及
通过线性插值连接所述相邻滑动窗口的子序列基线。
4.根据权利要求2所述的高信噪比时间序列的基线检测方法,其特征在于,所述根据所述子序列的绝对斜率的概率密度分布来设定阈值,当所述子序列的绝对斜率大于所述阈值时,更正所述初步基线模型包括:
延长所述相邻滑动窗口的两个子序列各自的所述子序列基线,以形成两个虚拟子序列基线;
定义所述两个虚拟子序列基线与所述原始时间序列的交点中最相邻的两个为两个转折点,所述两个子序列与所述各自的转折点形成两个更正后子序列;
获取两个更正后子序列基线,并且所述两个转折点之间,以相对应的所述原始时间序列作为转折点基线;及
连接所述两个更正后子序列基线及所述转折点基线,以形成更正后基线模型。
5.根据权利要求4所述的高信噪比时间序列的基线检测方法,其特征在于,更包括:
将时间序列在前的第一子序列的所述子序列基线往后延长一个所述滑动窗口长度,以形成第一虚拟子序列基线,及将时间序列在后的第二子序列的所述子序列基线往前延长一个所述滑动窗口长度,以形成一第二虚拟子序列基线;
定义所述第一虚拟子序列基线与所述原始时间序列的最后交点为第一转折点,及定义所述第二虚拟子序列基线与所述原始时间序列的最前交点为第二转折点,其中所述第一子序列与所述第一转折点形成第一更正后子序列,所述第二子序列与所述第二转折点形成第二更正后子序列;
获取所述第一更正后子序列及所述第二更正后子序列各自的第一更正后子序列基线及第二更正后子序列基线,并且所述第一转折点与所述第二转折点之间,以相对应的所述原始时间序列作为转折点基线;及
连接所述第一更正后子序列基线、所述第二更正后子序列基线及所述转折点基线,以形成所述更正后基线模型。
6.根据权利要求1所述的高信噪比时间序列的基线检测方法,其特征在于,所述阈值为所述子序列的绝对斜率的均值加/减一倍标准差的和。
7.根据权利要求1所述的高信噪比时间序列的基线检测方法,其特征在于,还包括:
将所述多个子序列基线、所述初步基线模型从所述原始时间序列上消除。
8.一种高信噪比时间序列的基线检测设备,其特征在于,包括处理器及储存器,所述处理器调用所述储存器中的计算机程序以执行如权利要求1至7项任一项所述的高信噪比时间序列的基线检测方法。
9.根据权利要求8所述的高信噪比时间序列的基线检测设备,其特征在于,所述计算机程序包括:
基线识别模块,用以通过滑动窗口将原始时间序列分为多个子序列,获取所述多个子序列各自的子序列基线;
基线建模模块,用以连接相邻滑动窗口的子序列基线,以获取初步基线模型;
基线更正模块,根据所述子序列的绝对斜率的概率密度分布来设定阈值,当所述子序列的绝对斜率大于所述阈值时,更正所述初步基线模型;
基线消除模块,用以将所述多个子序列基线、所述初步基线模型从所述原始时间序列上消除。
10.一种存储介质,其特征在于,所述存储介质用于存储计算机程序,所述计算机程序适于处理器进行加载,以执行权利要求1至7任一项所述的高信噪比时间序列的基线检测方法。
CN201910727069.7A 2019-08-07 2019-08-07 高信噪比时间序列的基线检测方法、设备及存储介质 Active CN112347813B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910727069.7A CN112347813B (zh) 2019-08-07 2019-08-07 高信噪比时间序列的基线检测方法、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910727069.7A CN112347813B (zh) 2019-08-07 2019-08-07 高信噪比时间序列的基线检测方法、设备及存储介质

Publications (2)

Publication Number Publication Date
CN112347813A true CN112347813A (zh) 2021-02-09
CN112347813B CN112347813B (zh) 2024-07-09

Family

ID=74367299

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910727069.7A Active CN112347813B (zh) 2019-08-07 2019-08-07 高信噪比时间序列的基线检测方法、设备及存储介质

Country Status (1)

Country Link
CN (1) CN112347813B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022176086A1 (ja) * 2021-02-18 2022-08-25 三菱電機株式会社 時系列データ分析装置、時系列データ分析方法、及び時系列データ分析プログラム
CN115778337B (zh) * 2022-10-28 2023-06-16 北京津发科技股份有限公司 人体生物信号数据处理方法、装置、设备及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL109566A0 (en) * 1993-05-06 1994-08-26 Hutson William H A method and system to enhance medical signals
CN102289558A (zh) * 2011-05-23 2011-12-21 公安部第一研究所 一种基于随机信号处理的基线调整方法
KR20130107889A (ko) * 2012-03-23 2013-10-02 삼성전자주식회사 이상 서브시퀀스 검출 장치 및 방법
US20140032506A1 (en) * 2012-06-12 2014-01-30 Quality Attributes Software, Inc. System and methods for real-time detection, correction, and transformation of time series data
CN104132884A (zh) * 2013-10-16 2014-11-05 深圳市帝迈生物技术有限公司 一种用于信号处理系统中信号基线的快速处理方法及装置
CN105513095A (zh) * 2015-12-30 2016-04-20 山东大学 一种行为视频无监督时序分割方法
US20170364614A1 (en) * 2016-06-16 2017-12-21 International Business Machines Corporation Adaptive forecasting of time-series
CN108937902A (zh) * 2018-07-10 2018-12-07 传世未来(北京)信息科技有限公司 一种胎心率基线估算方法、装置、电子设备及存储介质
CN109271913A (zh) * 2018-09-05 2019-01-25 南京信息工程大学 一种基于偏微分方程的maldi质谱峰检测方法
CN109784042A (zh) * 2018-12-29 2019-05-21 北京奇安信科技有限公司 时间序列中异常点的检测方法、装置、电子设备及存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL109566A0 (en) * 1993-05-06 1994-08-26 Hutson William H A method and system to enhance medical signals
CN102289558A (zh) * 2011-05-23 2011-12-21 公安部第一研究所 一种基于随机信号处理的基线调整方法
KR20130107889A (ko) * 2012-03-23 2013-10-02 삼성전자주식회사 이상 서브시퀀스 검출 장치 및 방법
US20140032506A1 (en) * 2012-06-12 2014-01-30 Quality Attributes Software, Inc. System and methods for real-time detection, correction, and transformation of time series data
CN104132884A (zh) * 2013-10-16 2014-11-05 深圳市帝迈生物技术有限公司 一种用于信号处理系统中信号基线的快速处理方法及装置
CN105513095A (zh) * 2015-12-30 2016-04-20 山东大学 一种行为视频无监督时序分割方法
US20170364614A1 (en) * 2016-06-16 2017-12-21 International Business Machines Corporation Adaptive forecasting of time-series
CN108937902A (zh) * 2018-07-10 2018-12-07 传世未来(北京)信息科技有限公司 一种胎心率基线估算方法、装置、电子设备及存储介质
CN109271913A (zh) * 2018-09-05 2019-01-25 南京信息工程大学 一种基于偏微分方程的maldi质谱峰检测方法
CN109784042A (zh) * 2018-12-29 2019-05-21 北京奇安信科技有限公司 时间序列中异常点的检测方法、装置、电子设备及存储介质

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
O\'BRIEN, TA: "《A fast and objective multidimensional kernel density estimation method: fastKDE》", COMPUTATIONAL STATISTICS & DATA ANALYSIS, no. 101, pages 148 - 160, XP029553062, DOI: 10.1016/j.csda.2016.02.014 *
付进;梁国龙;: "调频斜率方差检测器及其性能分析", 哈尔滨工业大学学报, no. 11 *
刘雪梅;王亚茹;: "基于异常因子的时间序列异常模式检测", 计算机技术与发展, no. 03 *
张贝贝;: "基于核密度估计的非线性时间序列聚类", 统计教育, no. 04 *
陈晓云;: "基于核密度估计的时间序列多模式发现", 山东大学学报(工学版), no. 05 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022176086A1 (ja) * 2021-02-18 2022-08-25 三菱電機株式会社 時系列データ分析装置、時系列データ分析方法、及び時系列データ分析プログラム
JPWO2022176086A1 (zh) * 2021-02-18 2022-08-25
JP7274064B2 (ja) 2021-02-18 2023-05-15 三菱電機株式会社 時系列データ分析装置、時系列データ分析方法、及び時系列データ分析プログラム
CN115778337B (zh) * 2022-10-28 2023-06-16 北京津发科技股份有限公司 人体生物信号数据处理方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN112347813B (zh) 2024-07-09

Similar Documents

Publication Publication Date Title
CN106547852B (zh) 异常数据检测方法及装置、数据预处理方法及系统
US10082787B2 (en) Estimation of abnormal sensors
US20230013170A1 (en) Method and apparatus for detecting jitter in video, electronic device, and storage medium
US20160255109A1 (en) Detection method and apparatus
CN113780466A (zh) 模型迭代优化方法、装置、电子设备和可读存储介质
US9626631B2 (en) Analysis device, analysis method, and program
CN114580263A (zh) 基于知识图谱的信息系统故障预测方法及相关设备
CN112347813A (zh) 高信噪比时间序列的基线检测方法、设备及存储介质
CN108491875A (zh) 一种数据异常检测方法、装置、设备及介质
US20230117088A1 (en) Method and device for improving performance of data processing model, storage medium and electronic device
CN112783616A (zh) 一种并发冲突处理方法、装置及计算机存储介质
CN113468592A (zh) 一种基于深度学习的差分隐私保护方法及装置
CN113240076A (zh) 一种基于聚类和神经网络算法的钟差异常数据检测方法
CN110764652A (zh) 红外触摸屏及其触摸点预测方法
CN112651172B (zh) 一种降雨峰值类型划分方法、装置、设备和存储介质
CN115841343A (zh) 一种销售额度的确定方法及装置
CN112783508A (zh) 文件的编译方法、装置、设备以及存储介质
JP2020525963A (ja) メディア特徴の比較方法及び装置
US20230022253A1 (en) Fast and accurate prediction methods and systems based on analytical models
US20180129975A1 (en) Apparatus and method of adjusting a sensitivity buffer of semi-supervised machine learning principals for remediation of issues in a computer environment
CN114692987A (zh) 一种时序数据分析方法、装置、设备及存储介质
CN111027680B (zh) 基于变分自编码器的监控量不确定性预测方法及系统
CN110320800B (zh) 控制系统补偿方法、装置、介质及智能设备
WO2012162200A2 (en) Identifying contacts and contact attributes in touch sensor data using spatial and temporal features
US11037066B2 (en) Estimation of abnormal sensors

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant