CN109697207B - 时序数据的异常监控方法及系统 - Google Patents

时序数据的异常监控方法及系统 Download PDF

Info

Publication number
CN109697207B
CN109697207B CN201811588464.3A CN201811588464A CN109697207B CN 109697207 B CN109697207 B CN 109697207B CN 201811588464 A CN201811588464 A CN 201811588464A CN 109697207 B CN109697207 B CN 109697207B
Authority
CN
China
Prior art keywords
data
monitoring
periodic
value
trend
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811588464.3A
Other languages
English (en)
Other versions
CN109697207A (zh
Inventor
覃江
陈琪瑶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sipic Technology Co Ltd
Original Assignee
AI Speech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AI Speech Ltd filed Critical AI Speech Ltd
Priority to CN201811588464.3A priority Critical patent/CN109697207B/zh
Publication of CN109697207A publication Critical patent/CN109697207A/zh
Application granted granted Critical
Publication of CN109697207B publication Critical patent/CN109697207B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明公开时序数据的异常监控方法及系统,包括:剔除历史周期性监控数据中的异常值,获取历史周期性监控平滑数据;根据历史周期性监控平滑数据进行周期性分解,获取多重周期的变化趋势数据及周期性变化数据序列;通过ARIMA模型对变化趋势数据进行训练,获取设定预测时间端的趋势值;根据所述趋势值及预测周期性变化数据序列值,通过随机森林算法进行训练,生成最终预测值;根据所述最终预测值设定监控阈值,对所述设定预测时间端的数据进行监测。本申请通过对时序数据的多重周期的时序性分析,将趋势性变化数据的特征引入了监测数据的属性中,从而提高了监测数据阀值的可靠性。从而更便于机器学习方法的实施。

Description

时序数据的异常监控方法及系统
技术领域
本发明属于数据处理技术领域,尤其涉及时序数据的异常监控方法及系统。
背景技术
目前针对有周期性规律的数据的异常监控,市面上最多的解决方案是利用统计学方法比如同环比的比较,根据经验设置阈值,或者时间序列分析方法(滑动平均模型(MA,moving average)或者ARMA)来预测下一个周期的数据,接着通过设置阈值来进行异常监控。有的,则通过建立神经网络(Long Short-Term Memory,长短期记忆网络)模型进行预测和监控。
同环比的预测主要是把过去同期数据作对比,比如这周五和上周五的数据进行对比,超过一定阈值(根据经验定),则认为是异常数据。MA和ARMA是用统计分析的方法,将一定时期的数据加以平均,并把不同时间的平均值连接起来,根据趋势来预测未来的销量或者请求量。即将数据序列变成一个平稳的序列(通过差分转换),根据平稳的序列通过统计的方法来预测。
机器学习的时间序列方法(如LSTM)大多数是通过特征的选择,将已有的数值与特征建立线性方程。通过有监督学习的训练,得出相应的权重模型(即方程)。根据已知模型,来预测某时间段的周期性的数据。
滑动平均模型(MA)以及ARMA的一方面稳定性较差,另一方面在多重周期性的数据的中表现较差。LSTM对数据稳定性不敏感,一方面要达到较好效果需要人工标注异常(有监督的学习),另一方面训练网络较复杂,耗时较长。
同环比对比是一种粗略的估计,主要依靠主观经验进行阈值的设定,监控的效果较差。ARMA等统计学算法一方面,对时序数据的平稳性有要求,需要进行特殊的数据预处理(求导,白噪声检测),如果时序数据的稳定性不够或者波动,预测结果偏差就会较大,另一方面,特殊的数据预处理(将多重周期性的非平稳的数据序列变成平稳的数据序列),会丢失多周期的信息,造成在多周期数据集的预测上表现较差。lstm是有监督的机器学习,一方面要达到预期效果需要人为标注作为输入,另一方面作为深度神经网络算法,需要构建神经网络进行训练,且只有在网络达到一定量级,训练效果才能达到预期,但这同样意味着较多的计算资源和较长的计算时间。
发明人在实现本申请的过程中发现:行业从业人员大多采用统计学方法进行数据监控,比如数据的同环比(与过去同期数据对比),进行简单的监控,亦或是ARMA等统计学算法进行预测,计算资源较多的公司,则采用复杂的LSTM等深度神经网络进行预测。对于传统企业针对时间序列数据预测方面的探索大多数是通过统计分析的手段来达到目的,并且对预测的精准度的要求不高,通过一定的阈值的限制可以达到要求。机器学习的方法在近些年开始被从业人员广泛用于生产环境,但效果应用不佳。
由此可知,现有的时序数据的监控方式,多以监控的均值或差分值作为对比依据。缺乏对趋势性数据的统计属性,降低了数据监控样本数据的准确性及可靠性。
发明内容
本发明实施例提供一种语音信号处理方法及装置,用于至少解决上述技术问题之一。
第一方面,本发明实施例提供时序数据的异常监控方法,包括:
步骤S101,剔除历史周期性监控数据中的异常值,获取历史周期性监控平滑数据;
步骤S102,根据所述历史周期性监控平滑数据进行周期性分解,获取多重周期的变化趋势数据及周期性变化数据序列;
步骤S103,通过ARIMA模型对所述变化趋势数据进行训练,获取设定预测时间端的趋势值;
步骤S104,根据所述趋势值及预测周期性变化数据序列值,通过随机森林算法进行训练,生成最终预测值;
步骤S105,根据所述最终预测值设定监控阈值,对所述设定预测时间端的数据进行监测。
在一种优选的实施方式中,所述步骤S101中包括:
步骤S1011,通过孤立森林算法获取历史周期性监控数据中的异常值;
步骤S1012,从所述历史周期性监控数据中剔除所述异常值;
步骤S1013,通过z-score算法对所述剔除后的所述历史周期性监控数据进行平滑处理,获取历史周期性监控平滑数据。
在一种优选的实施方式中,步骤S102中还包括:根据设定周期参数,对所述历史周期性监控平滑数据进行周期性分解。
在一种优选的实施方式中,所述步骤S104中包括:根据所述趋势值及预测周期性变化数据序列值求和获取监测阀值数据。
在一种优选的实施方式中,所述步骤S105中包括:
步骤S1051,根据监测阀值及监测上限百分比获取上限监测阀值;
步骤S1052,根据监测阀值及监测下限百分比获取下限监测阀值;
步骤S1053,根据所述上限监测阀值及所述下限监测阀值对所述设定预测时间端的数据进行监测。
第二方面,本发明实施例提供一种时序数据的异常监控系统,包括:平滑数据单元、多重周期的变化趋势数据及周期性变化数据序列获取单元、趋势值获取单元、监测阀值获取单元及监测单元,其中:
所述平滑数据单元,配置为剔除历史周期性监控数据中的异常值,获取历史周期性监控平滑数据;
多重周期的变化趋势数据及周期性变化数据序列获取单元,配置为根据所述平滑数据单元获取的所述历史周期性监控平滑数据进行周期性分解,获取多重周期的变化趋势数据及周期性变化数据序列;
所述趋势值获取单元,配置为通过ARIMA模型对所述多重周期的变化趋势数据及周期性变化数据序列获取单元获取的所述变化趋势数据进行训练,获取设定预测时间端的趋势值;
所述监测阀值获取单元,配置为根据所述趋势值及预测周期性变化数据序列值,通过随机森林算法进行训练,生成最终预测值;
所述监测单元,配置为根据所述最终预测值设定监控阈值,对所述设定预测时间端的数据进行监测。
在一种优选的实施方式中,所述平滑数据单元还配置为:通过孤立森林算法获取历史周期性监控数据中的异常值;从所述历史周期性监控数据中剔除所述异常值;通过z-score算法对所述剔除后的所述历史周期性监控数据进行平滑处理,获取历史周期性监控平滑数据。
在一种优选的实施方式中,多重周期的变化趋势数据及周期性变化数据序列获取单元还配置为:根据设定周期参数,对所述历史周期性监控平滑数据进行周期性分解。
在一种优选的实施方式中,所述监测阀值获取单元还配置为:根据所述趋势值及预测周期性变化数据序列值求和获取监测阀值数据。
在一种优选的实施方式中,所述监测单元还配置为:根据监测阀值及监测上限百分比获取上限监测阀值;根据监测阀值及监测下限百分比获取下限监测阀值;根据所述上限监测阀值及所述下限监测阀值对所述设定预测时间端的数据进行监测。
第三方面,提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例的方法的步骤。
第四方面,本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行本发明任一实施例的方法的步骤。
本申请通过对时序数据的多重周期的时序性分析,将趋势性变化数据的特征引入了监测数据的属性中,从而提高了监测数据阀值的可靠性。从而更便于机器学习方法的实施。对于时序数据,例如销量,服务请求量等的异常监控方案来说,能够达到的效果就是监控数据质量,提高了数据的准确性。对于销量这种时序类型的数据,由于方案能预测未来某时间段的数据,能辅助商家进行市场评估和决策。对于互联网服务的数据,如服务请求数等,可以预警服务的异常,提高异常问题的处理效率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的时序数据的异常监控方法的流程图;
图2为本发明一实施例提供的另一种时序数据的异常监控方法的流程图;
图3为本发明一实施例提供的又一种时序数据的异常监控方法的流程图;
图4为为本发明一实施例提供的时序数据的异常监控系统组成图;
图5为本发明一实施例提供的时序数据的异常监控方法数据处理流程图;
图6是本发明一实施例提供的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面,先介绍本申请的实施方式,之后将用实验数据证实本申请的方案与现有技术相比有什么不同,能实现什么有益效果。
本发明中所出现的英文缩写的英文全称及中文定义。
LSTM:Long short term memory,长短记忆网络。
MA:Moving Average,滑动平均。
ARMA:Auto-Regressive and Moving Average Model,自回归滑动平均模型。
ARIMA:Auto-Regressive Integrated Moving Average Model,自回归积分滑动平均模型。
z-score:标准分数。
请参考图1,其示出了本申请的时序数据的异常监控方法一实施例的流程图,本实施例的时序数据的异常监控方法可以适用于时序类型数据的监控。
如图1所示,本发明实施例提供时序数据的异常监控方法,包括:
步骤S101,获取监控平滑数据。
本步骤中,剔除历史周期性监控数据中的异常值,获取历史周期性监控平滑数据。
步骤S102,获取多重周期的变化趋势数据及周期性变化数据序列。
本步骤中,根据所述历史周期性监控平滑数据进行周期性分解,获取多重周期的变化趋势数据及周期性变化数据序列。
步骤S103,获取设定预测时间端的趋势值。
本步骤中,通过ARIMA模型对所述变化趋势数据进行训练,获取设定预测时间端的趋势值。
步骤S104,获取监测阀值。
本步骤中,根据所述趋势值及预测周期性变化数据序列值,通过随机森林算法进行训练,生成最终预测值。
步骤S105,进行监测。
本步骤中,根据所述最终预测值设定监控阈值,对所述设定预测时间端的数据进行监测。
在一种优选的实施方式中,如图2所示,所述步骤S101中包括:
步骤S1011,获取异常值。
本步骤中,通过孤立森林算法获取历史周期性监控数据中的异常值。
步骤S1012,剔除异常值。
本步骤中,从所述历史周期性监控数据中剔除所述异常值。
步骤S1013,平滑数据。
本步骤中,通过z-score算法对所述剔除后的所述历史周期性监控数据进行平滑处理,获取历史周期性监控平滑数据。
在一种优选的实施方式中,步骤S102中还包括:根据设定周期参数,对所述历史周期性监控平滑数据进行周期性分解。
在一种优选的实施方式中,所述步骤S104中包括:根据所述趋势值及预测周期性变化数据序列值求和获取监测阀值数据。
在一种优选的实施方式中,如图3所示,所述步骤S105中包括:
步骤S1051,获取上限监测阀值;
本步骤中,根据监测阀值及监测上限百分比获取上限监测阀值。
步骤S1052,获取上限监测阀值;
本步骤中,根据监测阀值及监测下限百分比获取上限监测阀值。
步骤S1053,根据阀值进行数据监控。
本步骤中,根据所述上限监测阀值及所述下限监测阀值对所述设定预测时间端的数据进行监测。
第二方面,本发明实施例提供一种时序数据的异常监控系统,如图4所示,包括:平滑数据单元101、多重周期的变化趋势数据及周期性变化数据序列获取单元102、趋势值获取单元103、监测阀值获取单元104及监测单元105,其中:
所述平滑数据单元101,配置为剔除历史周期性监控数据中的异常值,获取历史周期性监控平滑数据;
多重周期的变化趋势数据及周期性变化数据序列获取单元102,配置为根据所述平滑数据单元101获取的所述历史周期性监控平滑数据进行周期性分解,获取多重周期的变化趋势数据及周期性变化数据序列;
所述趋势值获取单元103,配置为通过ARIMA模型对所述多重周期的变化趋势数据及周期性变化数据序列获取单元102获取的所述变化趋势数据进行训练,获取设定预测时间端的趋势值;
所述监测阀值获取单元104,配置为根据所述趋势值及预测周期性变化数据序列值,通过随机森林算法进行训练,生成最终预测值;
所述监测单元105,配置为根据所述最终预测值设定监控阈值,对所述设定预测时间端的数据进行监测。
在一种优选的实施方式中,所述平滑数据单元101还配置为:通过孤立森林算法获取历史周期性监控数据中的异常值;从所述历史周期性监控数据中剔除所述异常值;通过z-score算法对所述剔除后的所述历史周期性监控数据进行平滑处理,获取历史周期性监控平滑数据。
在一种优选的实施方式中,多重周期的变化趋势数据及周期性变化数据序列获取单元102还配置为:根据设定周期参数,对所述历史周期性监控平滑数据进行周期性分解。
在一种优选的实施方式中,所述监测阀值获取单元还配置为:根据所述趋势值及预测周期性变化数据序列值求和获取监测阀值数据。
在一种优选的实施方式中,所述监测单元还配置为:根据监测阀值及监测上限百分比获取上限监测阀值;根据监测阀值及监测下限百分比获取下限监测阀值;根据所述上限监测阀值及所述下限监测阀值对所述设定预测时间端的数据进行监测。
在本发明的另一个实施方式中,在本发明中,先通过时间序列的分析分解,得到平稳的多周期性变化的序列,并且根据分解得到的趋势序列来进行差分分析,预测某时间段内的相对平稳的趋势变化作为需要预测阶段的特征。同时,通过分析得到数据的周期性变化的特征数据,作为机器学习算法(此处我们使用的是随机森林回归算法)的特征的一部分。使用随机森林的回归算法来处理多周期性的数据预测。
在本发明的一种实施例中,其主要步骤包括:
1)异常数据清洗。
对数据中的异常值使用孤立森林(IsolationForest)来获取异常值,然后使用z-score(标准分数,standard score,是一个数与平均数的差再除以标准差的过程)来使得数据初步平滑,使其周期性特性更明显。
2)时间序列分析方法分解。
将平滑后的数据进行时间序列分解,得到其周期性变化的序列数据,以及趋势序列数据。其中周期性变化的序列数据是平稳的周期性数据,使得数据从非平稳的多周期性数据转化成平稳的周期性数据特征。
3)arima预测。
将上一步的趋势序列数据通过ARIMA方法进行然后趋势预测,预测出的值作为随机森林的预测部分的特征。趋势也是非平稳状态,通过arima变成平稳的数据特征。
4)随机森林方法预测。
将多重周期性特征值,分解出的趋势数据和周期性数据通过随机森林回归算法来训练模型。预测出趋势序列数据,根据最近时间的周期性数据和需预测时间段的多重周期性特征值预测未来时间段的请求量。在此算法的过程中,通过使用多重周期的特征值作为训练数据,使得传统的统计分析方法中无法预测多重周期性的数据的缺陷得到改善。
5)阈值选择。
根据预测出的值,进行阈值的选择。在我们的算法中,根据历史数据的波动情况,选择预测值的125%作为上阈值,预测值的75%作为下阈值。一旦超出阈值范围就会异常告警。
使用统计分析方法ARMA(auto-regressive moving average,自回归滑动平均模型)。ARIMA模型是在平稳的时间序列基础上建立起来的,因此时间序列的平稳性是建模的重要前提。检验时间序列模型平稳的方法一般采用ADF单位根检验模型去检验。由于数据的时间序列不稳定,通过取对数,差分使得时间序列稳定,然后进行ARIMA模型预测,得到稳定的时间序列的预测结果,然后对预测结果进行之前使序列稳定的操作的逆操作(取指数,差分的逆操作),就可以得到原始数据的预测结果。
具体过程如下:
1、对数据进行平滑处理
剔除异常值,并且使用相同特征的均值代替。
2、对数据进行周期性分解
将平滑处理后的数据进行周期性分解,得到趋势部分以及周期性变化数据序列;
3、ARIMA模型训练
将趋势部分使用ARIMA模型进行训练,并且预测出需预测时间段的趋势。
4、预测
将预测出的趋势数据与周期数据求和,得到预测值。报警区间选择分解出的残差序列值的25%-75%分位的值。
优点:
①模型十分简单,只需要内生变量而不需要借助其他外生变量;
②此方法对数据有一个平滑处理。将数据处理成相对稳定的周期性时间序列数据。
可完善之处在于:
①要求时序数据是稳定的,或者是通过差分化后是稳定的;
②本质上只能捕捉线性关系,而不能捕捉非线性关系。
采用ARIMA模型预测时序数据,必须是稳定的,如果不稳定的数据,是无法捕捉到规律的。
本发明的实施方式中,将数据进行时间序列分解,得到其周期性变化的序列数据,以及趋势序列数据。将上一步的趋势序列数据通过ARIMA方法进行然后趋势预测。将多重周期性特征值,趋势序列数据,周期性数据通过随机森林回归算法训练模型,使用arima预测后的趋势数据,分解后的平滑的周期性数据以及提取的多重周期性特征来预测。并根据预测出的值,进行阈值的选择。显著的优势在于:此方法解决了数据多重性特征,和非平稳数据(即对历史数据敏感)的问题。同时当历史数据的影响的权重还是较大时。使得历史数据还是对预测值的周期性变化会有些许影响。
值得注意的是,本公开的实施例中的模块并不用于限制本公开的方案,例如分离模块可以描述为获取并分离出与原始输入语音信号对应的多个源信号的模块。另外,还可以通过硬件处理器来实现相关功能模块,例如分离模块也可以用处理器实现,在此不再赘述。
在另一些实施例中,本发明实施例还提供了一种非易失性计算机存储介质,计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的语音信号处理和使用方法;
作为一种实施方式,本发明的非易失性计算机存储介质存储有计算机可执行指令,计算机可执行指令设置为:
步骤S101,剔除历史周期性监控数据中的异常值,获取历史周期性监控平滑数据;
步骤S102,根据所述历史周期性监控平滑数据进行周期性分解,获取多重周期的变化趋势数据及周期性变化数据序列;
步骤S103,通过ARIMA模型对所述变化趋势数据进行训练,获取设定预测时间端的趋势值;
步骤S104,根据所述趋势值及预测周期性变化数据序列值,通过随机森林算法进行训练,生成最终预测值;
步骤S105,根据所述最终预测值设定监控阈值,对所述设定预测时间端的数据进行监测。
基于所述步骤S101中包括:
步骤S1011,通过孤立森林算法获取历史周期性监控数据中的异常值;
步骤S1012,从所述历史周期性监控数据中剔除所述异常值;
步骤S1013,通过z-score算法对所述剔除后的所述历史周期性监控数据进行平滑处理,获取历史周期性监控平滑数据。
基于步骤S102中还包括:根据设定周期参数,对所述历史周期性监控平滑数据进行周期性分解。
基于所述步骤S104中包括:根据所述趋势值及预测周期性变化数据序列值求和获取监测阀值数据。
基于所述步骤S105中包括:
步骤S1051,根据监测阀值及监测上限百分比获取上限监测阀值;
步骤S1052,根据监测阀值及监测下限百分比获取下限监测阀值;
步骤S1053,根据所述上限监测阀值及所述下限监测阀值对所述设定预测时间端的数据进行监测。
作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本发明实施例中的语音信号处理方法对应的程序指令/模块。一个或者多个程序指令存储在非易失性计算机可读存储介质中,当被处理器执行时,执行上述任意方法实施例中的语音信号处理方法。
非易失性计算机可读存储介质可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据语音信号处理装置的使用所创建的数据等。此外,非易失性计算机可读存储介质可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,非易失性计算机可读存储介质可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至语音信号处理装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本发明实施例还提供一种计算机程序产品,计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令被计算机执行时,使计算机执行上述任一项语音信号处理方法。
图6是本发明实施例提供的电子设备的结构示意图,如图6所示,该设备包括:一个或多个处理器610以及存储器620,图6中以一个处理器610为例。语音信号处理方法的设备还可以包括:输入装置630和输出装置640。处理器610、存储器620、输入装置630和输出装置640可以通过总线或者其他方式连接,图6中以通过总线连接为例。存储器620为上述的非易失性计算机可读存储介质。处理器610通过运行存储在存储器620中的非易失性软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例语音信号处理方法。输入装置630可接收输入的数字或字符信息,以及产生与信息投放装置的用户设置以及功能控制有关的键信号输入。输出装置640可包括显示屏等显示设备。
上述产品可执行本发明实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明实施例所提供的方法。
作为一种实施方式,上述电子设备可以应用于智能语音对话平台中,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够:
获取并分离出与原始输入语音信号对应的多个源信号;
对某一源信号进行预设处理区分出所述某一源信号中的至少一个第一语音信号和至少一个第一噪音信号;
将所述第一语音信号输入至唤醒引擎中,并获取所述唤醒引擎输出的所述第一语音信号的置信度,其中,所述唤醒引擎能够被置信度大于或等于阈值的唤醒词唤醒;
基于所述第一语音信号中置信度最大的信号,所述第一语音信号中未唤醒的信号和所述至少一个第一噪音信号中能量最大的信号,计算所述置信度最大的信号和所述能量最大的信号信噪比;
基于与所述至少一个第一语音信号对应的至少一个信噪比计算与所述某一源信号中的语音存在概率;
基于与各源信号对应的语音存在概率对所述各源信号进行加权并利用加权后的所述各源信号计算所述原始输入信号的波达方向。
本申请实施例的电子设备以多种形式存在,包括但不限于:
(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机,以及低端手机等。
(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等,例如iPad。
(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器(例如iPod),掌上游戏机,电子书,以及智能玩具和便携式车载导航设备。
(4)服务器:提供计算服务的设备,服务器的构成包括处理器、硬盘、内存、系统总线等,服务器和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。
(5)其他具有数据交互功能的电子装置。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种时序数据的异常监控方法,包括:
步骤S101,剔除历史周期性监控数据中的异常值,获取历史周期性监控平滑数据;
步骤S102,根据所述历史周期性监控平滑数据进行周期性分解,获取多重周期的变化趋势数据及周期性变化数据序列;
步骤S103,通过ARIMA模型对所述变化趋势数据进行训练,获取设定预测时间段的趋势值;
步骤S104,根据所述趋势值及预测周期性变化数据序列值,通过随机森林算法进行训练,生成最终预测值;
步骤S105,根据所述最终预测值设定监控阈值,对所述设定预测时间段的数据进行监测。
2.根据权利要求1所述的异常监控方法,所述步骤S101中包括:
步骤S1011,通过孤立森林算法获取历史周期性监控数据中的异常值;
步骤S1012,从所述历史周期性监控数据中剔除所述异常值;
步骤S1013,通过z-score算法对所述剔除后的所述历史周期性监控数据进行平滑处理,获取历史周期性监控平滑数据。
3.根据权利要求1所述的异常监控方法,步骤S102中还包括:根据设定周期参数,对所述历史周期性监控平滑数据进行周期性分解。
4.根据权利要求1所述的异常监控方法,所述步骤S104中包括:根据所述趋势值及预测周期性变化数据序列值求和获取监测阀值数据。
5.根据权利要求4所述的异常监控方法,所述步骤S105中包括:
步骤S1051,根据监测阀值及监测上限百分比获取上限监测阀值;
步骤S1052,根据监测阀值及监测下限百分比获取下限监测阀值;
步骤S1053,根据所述上限监测阀值及所述下限监测阀值对所述设定预测时间段的数据进行监测。
6.一种时序数据的异常监控系统,包括:平滑数据单元、多重周期的变化趋势数据及周期性变化数据序列获取单元、趋势值获取单元、监测阀值获取单元及监测单元,其中:
所述平滑数据单元,配置为剔除历史周期性监控数据中的异常值,获取历史周期性监控平滑数据;
多重周期的变化趋势数据及周期性变化数据序列获取单元,配置为根据所述平滑数据单元获取的所述历史周期性监控平滑数据进行周期性分解,获取多重周期的变化趋势数据及周期性变化数据序列;
所述趋势值获取单元,配置为通过ARIMA模型对所述多重周期的变化趋势数据及周期性变化数据序列获取单元获取的所述变化趋势数据进行训练,获取设定预测时间段的趋势值;
所述监测阀值获取单元,配置为根据所述趋势值及预测周期性变化数据序列值,通过随机森林算法进行训练,生成最终预测值;
所述监测单元,配置为根据所述最终预测值设定监控阈值,对所述设定预测时间段的数据进行监测。
7.根据权利要求6所述的异常监控系统,所述平滑数据单元还配置为:通过孤立森林算法获取历史周期性监控数据中的异常值;从所述历史周期性监控数据中剔除所述异常值;通过z-score算法对所述剔除后的所述历史周期性监控数据进行平滑处理,获取历史周期性监控平滑数据。
8.根据权利要求6所述的异常监控系统,多重周期的变化趋势数据及周期性变化数据序列获取单元还配置为:根据设定周期参数,对所述历史周期性监控平滑数据进行周期性分解。
9.根据权利要求6所述的异常监控系统,所述监测阀值获取单元还配置为:根据所述趋势值及预测周期性变化数据序列值求和获取监测阀值数据。
10.根据权利要求9所述的异常监控系统,所述监测单元还配置为:根据监测阀值及监测上限百分比获取上限监测阀值;根据监测阀值及监测下限百分比获取下限监测阀值;根据所述上限监测阀值及所述下限监测阀值对所述设定预测时间段的数据进行监测。
CN201811588464.3A 2018-12-25 2018-12-25 时序数据的异常监控方法及系统 Active CN109697207B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811588464.3A CN109697207B (zh) 2018-12-25 2018-12-25 时序数据的异常监控方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811588464.3A CN109697207B (zh) 2018-12-25 2018-12-25 时序数据的异常监控方法及系统

Publications (2)

Publication Number Publication Date
CN109697207A CN109697207A (zh) 2019-04-30
CN109697207B true CN109697207B (zh) 2020-08-28

Family

ID=66231993

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811588464.3A Active CN109697207B (zh) 2018-12-25 2018-12-25 时序数据的异常监控方法及系统

Country Status (1)

Country Link
CN (1) CN109697207B (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110289090A (zh) * 2019-05-31 2019-09-27 华东理工大学 事件发现方法及装置、存储介质、终端
CN112311611B (zh) * 2019-07-29 2022-04-12 中国移动通信集团广东有限公司 数据异常的监测方法、装置和电子设备
CN112445832B (zh) * 2019-08-28 2024-02-23 北京达佳互联信息技术有限公司 数据异常检测方法、装置、电子设备及存储介质
CN110533108A (zh) * 2019-09-02 2019-12-03 四川长虹电器股份有限公司 一种基于孤立森林算法的销量异常值检测方法
CN110728458B (zh) * 2019-10-18 2022-07-29 支付宝(杭州)信息技术有限公司 一种目标对象的风险监测方法、装置及电子设备
CN110912775B (zh) * 2019-11-26 2021-03-16 中盈优创资讯科技有限公司 物联网企业网络故障的监控方法及装置
CN111092891B (zh) * 2019-12-20 2022-04-01 杭州安恒信息技术股份有限公司 一种网络中异常点的检测方法、检测系统及相关装置
CN111276247B (zh) * 2020-01-16 2023-12-19 超越科技股份有限公司 一种基于大数据处理的飞参数据健康评估方法及设备
CN111768031B (zh) * 2020-06-24 2023-09-19 中电科华云信息技术有限公司 一种基于arma算法预测人群聚集趋势的方法
CN112131075B (zh) * 2020-09-15 2023-04-28 上海上讯信息技术股份有限公司 一种用于存储监控数据异常检测的方法及设备
CN112506752A (zh) * 2020-12-10 2021-03-16 山东海量信息技术研究院 基于时序数据趋势预测的运维方法、装置及设备
CN112882795A (zh) * 2021-02-25 2021-06-01 深信服科技股份有限公司 虚拟机异常诊断方法、装置、设备及存储介质
CN113536042B (zh) * 2021-07-28 2022-06-21 云智慧(北京)科技有限公司 一种时间序列异常检测方法、装置及设备
CN113391982B (zh) * 2021-08-17 2021-11-23 云智慧(北京)科技有限公司 一种监控数据的异常检测方法、装置及设备
CN113915153A (zh) * 2021-09-30 2022-01-11 山东浪潮通软信息科技有限公司 一种矿用通风机异常检测的方法、系统、设备和存储介质
CN116431369A (zh) * 2022-11-09 2023-07-14 北京新数科技有限公司 一种基于动态场景的数据库运维异常检测方法
CN116010485B (zh) * 2023-03-28 2024-06-14 杭州比智科技有限公司 一种动态周期时序的无监督异常检测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106059661A (zh) * 2015-12-25 2016-10-26 国家电网公司 一种基于时序分析的光传输网络趋势预测方法
CN108052528A (zh) * 2017-11-09 2018-05-18 华中科技大学 一种存储设备时序分类预警方法
CN108304966A (zh) * 2018-01-18 2018-07-20 沈阳工程学院 一种短期月售电量预测方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9785719B2 (en) * 2014-07-15 2017-10-10 Adobe Systems Incorporated Generating synthetic data
CN104156473B (zh) * 2014-08-25 2017-05-03 哈尔滨工业大学 一种基于ls‑svm的传感器检测数据异常片段检测方法
CN106953766B (zh) * 2017-03-31 2020-06-26 北京奇艺世纪科技有限公司 一种报警方法及装置
US10817568B2 (en) * 2017-06-05 2020-10-27 International Business Machines Corporation Domain-oriented predictive model feature recommendation system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106059661A (zh) * 2015-12-25 2016-10-26 国家电网公司 一种基于时序分析的光传输网络趋势预测方法
CN108052528A (zh) * 2017-11-09 2018-05-18 华中科技大学 一种存储设备时序分类预警方法
CN108304966A (zh) * 2018-01-18 2018-07-20 沈阳工程学院 一种短期月售电量预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于机器学习的机票购买决策预测系统的研究与实现;李玉玲;《中国优秀硕士学位论文全文数据库 信息科技辑》;20181015;第I138-126页 *

Also Published As

Publication number Publication date
CN109697207A (zh) 2019-04-30

Similar Documents

Publication Publication Date Title
CN109697207B (zh) 时序数据的异常监控方法及系统
US11991194B2 (en) Cognitive neuro-linguistic behavior recognition system for multi-sensor data fusion
CN108108743B (zh) 异常用户识别方法和用于识别异常用户的装置
US11115295B2 (en) Methods and systems for online monitoring using a variable data
CN108595406B (zh) 一种用户状态的提醒方法、装置、电子设备及存储介质
CN111582341B (zh) 用户异常操作预测方法及装置
CN114118287A (zh) 样本生成方法、装置、电子设备以及存储介质
CN115145812A (zh) 测试用例生成方法、装置、电子设备和存储介质
CN112800919A (zh) 一种检测目标类型视频方法、装置、设备以及存储介质
CN112509566A (zh) 一种语音识别方法、装置、设备、存储介质及程序产品
CN109271495B (zh) 问答识别效果检测方法、装置、设备及可读存储介质
CN117235371A (zh) 视频推荐方法、模型训练方法及装置
CN114443896B (zh) 数据处理方法和用于训练预测模型的方法
CN114141236B (zh) 语言模型更新方法、装置、电子设备及存储介质
CN112463964B (zh) 文本分类及模型训练方法、装置、设备及存储介质
CN113901456A (zh) 一种用户行为安全性预测方法、装置、设备及介质
CN115204381A (zh) 弱监督模型训练方法及装置、电子设备
CN113112311A (zh) 训练因果推断模型的方法、信息提示方法以装置
CN112541705B (zh) 生成用户行为评估模型的方法、装置、设备以及存储介质
CN117357104B (zh) 一种基于用户特征的音频分析方法
CN116738241B (zh) 基于时间粒度的阈值生成方法、装置、终端及介质
CN113722496B (zh) 一种三元组抽取方法、装置、可读存储介质及电子设备
CN113553407B (zh) 事件追溯方法、装置、电子设备及存储介质
CN117873891A (zh) 一种异常页面的检测方法、装置、设备及存储介质
CN116432069A (zh) 信息处理方法、服务提供方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 215123 14 Tengfei Innovation Park, 388 Xinping street, Suzhou Industrial Park, Suzhou, Jiangsu.

Patentee after: Sipic Technology Co.,Ltd.

Address before: 215123 14 Tengfei Innovation Park, 388 Xinping street, Suzhou Industrial Park, Suzhou, Jiangsu.

Patentee before: AI SPEECH Ltd.