CN114610572A - 服务异常检测方法、装置、计算机设备和存储介质 - Google Patents

服务异常检测方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN114610572A
CN114610572A CN202210237284.0A CN202210237284A CN114610572A CN 114610572 A CN114610572 A CN 114610572A CN 202210237284 A CN202210237284 A CN 202210237284A CN 114610572 A CN114610572 A CN 114610572A
Authority
CN
China
Prior art keywords
data
sub
service
service data
time sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210237284.0A
Other languages
English (en)
Inventor
宋宇
黄生平
刘作蕊
李娇娇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202210237284.0A priority Critical patent/CN114610572A/zh
Publication of CN114610572A publication Critical patent/CN114610572A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请涉及一种服务异常检测方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取待检测的服务数据时间序列;根据服务数据时间序列对应的多个数据切分点,将服务数据时间序列拆分为多个子服务数据时间序列;根据各子服务数据时间序列对应的数据特征向量,确定异常检测信息,并采用异常检测信息,构建不同异常数据类型各自对应的异常检测模型;基于各异常检测模型,分别对各子服务数据时间序列进行数据检测,将各子服务数据时间序列的异常数据信息,作为服务数据时间序列的服务异常检测结果。采用本方法实现了基于模型参数对服务异常进行有效识别,无需人工标注数据,能够根据具体业务场景灵活调整阈值,且具有良好的可解释性。

Description

服务异常检测方法、装置、计算机设备和存储介质
技术领域
本申请涉及金融科技领域或其他相关领域,特别是涉及一种服务异常检测方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
在金融信息系统中,为了保障构成信息系统各服务的高可用性,通常需要对服务进行监控以获得服务的多项性能指标,针对多项性能指标产生的海量数据进行异常检测,以实现服务异常发现,提醒相关技术人员进行维护。
然而,传统的服务异常检测是采用静态阈值方法,其需要依赖生产运行实践及专家经验,大量依赖人工操作,或是采用基于监督学习的服务异常检测方法,其也需要通过人工方式完成标注,且存在解释性差的问题。
因此,相关技术中存在服务异常检测依赖人工效率低的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够解决上述问题的服务异常检测方法、装置、计算机设备、存储介质和计算机程序产品。
第一方面,本申请提供了一种服务异常检测方法,所述方法包括:
获取待检测的服务数据时间序列;所述服务数据时间序列为对金融信息系统中服务性能参数连续进行数据采集得到的;
根据所述服务数据时间序列对应的多个数据切分点,将所述服务数据时间序列拆分为多个子服务数据时间序列;
根据各所述子服务数据时间序列对应的数据特征向量,确定异常检测信息,并采用所述异常检测信息,构建不同异常数据类型各自对应的异常检测模型;所述异常检测信息包括不同异常数据类型各自对应的检测阈值参数,各所述检测阈值参数用于构建对应的异常数据类型的异常检测模型;
基于各所述异常检测模型,分别对各所述子服务数据时间序列进行数据检测,将各所述子服务数据时间序列的异常数据信息,作为所述服务数据时间序列的服务异常检测结果。
在其中一个实施例中,所述根据所述服务数据时间序列对应的多个数据切分点,将所述服务数据时间序列拆分为多个子服务数据时间序列,包括:
将所述服务数据时间序列作为当前待切分数据,确定所述当前待切分数据对应的当前数据切分点,并根据所述当前数据切分点,将所述当前待切分数据拆分为两个子数据组;
分别将各所述子数据组作为当前待切分数据,并返回确定所述当前待切分数据对应的当前数据切分点,并根据所述当前数据切分点,将所述当前待切分数据拆分为两个子数据组的步骤,直至所述当前待切分数据满足切分终止条件,以将所述当前待切分数据作为所述子服务数据时间序列。
在其中一个实施例中,所述确定所述当前待切分数据对应的当前数据切分点,包括:
以所述当前待切分数据中的任意一个服务数据为候选切分点,确定所述候选切分点对应的误差值;所述误差值为第一子数据组与第二子数据组的中位数差值,所述第一子数据组和所述第二子数据组为根据所述候选切分点拆分所述当前待切分数据得到的;
从多个所述候选切分点各自对应的误差值中,确定最小误差值,并将所述最小误差值对应的候选切分点,作为所述当前数据切分点。
在其中一个实施例中,所述异常检测信息包括异常波动阈值、异常离群点阈值,所述根据各所述子服务数据时间序列对应的数据特征向量,确定异常检测信息,包括:
对各所述子服务数据时间序列对应的离散评估值进行聚类处理,得到聚类评估值,并结合所述聚类评估值和第一预设参数得到所述异常波动阈值;
针对每个子服务数据时间序列,结合所述子服务数据时间序列对应的离散评估值和第二预设参数,得到所述子服务数据时间序列对应的异常离群点阈值。
在其中一个实施例中,当所述异常检测模型为偏移异常检测模型,所述异常数据信息包括异常偏移结果,所述基于各所述异常检测模型,分别对各所述子服务数据时间序列进行数据检测,包括:
确定任意两个相邻的子服务数据时间序列的偏移值;所述偏移值根据所述任意两个相邻的子服务数据时间序列各自对应的中位数得到;
若所述偏移值大于异常偏移阈值,确定所述任意两个相邻的子服务数据时间序列的偏移检测结果为所述异常偏移结果。
在其中一个实施例中,当所述异常检测模型为离群点异常检测模型,所述异常数据信息包括异常离群点,所述基于各所述异常检测模型,分别对各所述子服务数据时间序列进行数据检测,包括:
针对每个子服务数据时间序列,采样所述子服务数据时间序列中的任意一个服务数据,得到所述任意一个服务数据对应的数据值;
若所述数据值大于所述异常离群点阈值,确定所述任意一个服务数据为所述异常离群点。
在其中一个实施例中,当所述异常检测模型为波动异常检测模型,所述异常数据信息包括异常波动群组,所述基于各所述异常检测模型,分别对各所述子服务数据时间序列进行数据检测,包括:
针对每个子服务数据时间序列,确定所述子服务数据时间序列对应的离散评估值;
若所述离散评估值大于所述异常波动阈值,确定所述子服务数据时间序列为所述异常波动群组。
第二方面,本申请还提供了一种服务异常检测装置,所述装置包括:
服务数据获取模块,用于获取待检测的服务数据时间序列;所述服务数据时间序列为对金融系统中服务性能参数连续进行数据采集得到的;
数据拆分模块,用于根据所述服务数据时间序列对应的多个数据切分点,将所述服务数据时间序列拆分为多个子服务数据时间序列;
异常检测模型构建模块,用于根据各所述子服务数据时间序列对应的数据特征向量,确定异常检测信息,并采用所述异常检测信息,构建不同异常数据类型各自对应的异常检测模型;所述异常检测信息包括不同异常数据类型各自对应的检测阈值参数,各所述检测阈值参数用于构建对应的异常数据类型的异常检测模型;
数据检测模块,用于基于各所述异常检测模型,分别对各所述子服务数据时间序列进行数据检测,将各所述子服务数据时间序列的异常数据信息,作为所述服务数据时间序列的服务异常检测结果。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如上所述的服务异常检测方法的步骤。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的服务异常检测方法的步骤。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上所述的服务异常检测方法的步骤。
上述一种服务异常检测方法、装置、计算机设备、存储介质和计算机程序产品,通过获取待检测的服务数据时间序列,服务数据时间序列为对金融信息系统中服务性能参数连续进行数据采集得到的,然后根据服务数据时间序列对应的多个数据切分点,将服务数据时间序列拆分为多个子服务数据时间序列,根据各子服务数据时间序列对应的数据特征向量,确定异常检测信息,并采用异常检测信息,构建不同异常数据类型各自对应的异常检测模型,异常检测信息包括不同异常数据类型各自对应的检测阈值参数,各检测阈值参数用于构建对应的异常数据类型的异常检测模型,进而基于各异常检测模型,分别对各子服务数据时间序列进行数据检测,将各子服务数据时间序列的异常数据信息,作为服务数据时间序列的服务异常检测结果,实现了基于模型参数对服务异常进行有效识别,无需人工标注数据,能够根据具体业务场景灵活调整阈值,且具有良好的可解释性。
附图说明
图1为一个实施例中一种服务异常检测方法的流程示意图;
图2a为一个实施例中一种异常检测处理流程的示意图;
图2b为一个实施例中一种整体偏移情况的示意图;
图2c为一个实施例中一种服务异常检测系统的示意图;
图3a为一个实施例中一种数据切分流程的示意图;
图3b为一个实施例中一种数据切分点比较的示意图;
图4a为一个实施例中一种异常整体偏移判断的示意图;
图4b为一个实施例中一种异常波动判断的示意图;
图4c为一个实施例中一种异常离群点判断的示意图;
图4d为一个实施例中一种异常检测效果的示意图;
图5为一个实施例中另一种服务异常检测方法的流程示意图;
图6为一个实施例中一种服务异常检测装置的结构框图;
图7为一个实施例中一种计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于展示的数据、分析的数据等),均为经用户授权或者经过各方充分授权的信息和数据;对应的,本申请还提供有相应的用户授权入口,供用户选择授权或者选择拒绝。
在一个实施例中,如图1所示,提供了一种服务异常检测方法,本实施例以该方法应用于终端进行举例说明,可以理解的是,该方法也可以应用于服务器,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。本实施例中,该方法包括以下步骤:
步骤101,获取待检测的服务数据时间序列;所述服务数据时间序列为对金融信息系统中服务性能参数连续进行数据采集得到的;
作为一示例,待检测的服务数据时间序列可以为对金融信息系统中各服务运行情况监测得到的KPI数据(key performance indicator,衡量服务可用性的关键性能指标),如访问量、访问耗时、服务调用耗时、交易成功率等。
在具体实现中,通过对金融信息系统中服务性能参数连续进行数据采集,可以得到待检测的服务数据时间序列,例如,如图2a所示,可以获取历史KPI数据,作为待异常检测的待测数据集S={s1,s2,s3,…sn}。
例如,待测数据可以为对某一具体的KPI指标进行采样所获得的数值,如对服务调用耗时进行采样,可以获取服务调用耗时数据;按照时间顺序排列连续的待测数据可以得到待测数据集。
步骤102,根据所述服务数据时间序列对应的多个数据切分点,将所述服务数据时间序列拆分为多个子服务数据时间序列;
在实际应用中,可以根据服务数据时间序列对应的多个数据切分点,对该服务数据时间序列进行分组,进而可以将服务数据时间序列拆分为多个子服务数据时间序列。
具体地,如图2a所示,针对待异常检测的待测数据集S,可以通过决策树回归方法进行分组处理,得到在时间序列上连续的分组数据G1,G2,G3,…Gm,即多个子服务数据时间序列。
在一示例中,由于版本投产、网络环境变化、上下游服务异常等原因,可能使KPI数据发生非异常整体偏移,会导致预设的异常检测阈值失效,则可以通过分组处理,将KPI数据发生非异常整体偏移前与偏移后的指标数据进行区分,进而可以针对分组后的指标数据分别进行服务异常检测,从而能够提高异常检测的准确性。
例如,以某服务在生产环境下的访问耗时数据为例,如图2b中(a)所示,由于时刻t对应的耗时数据发生了整体上移,若采用预设的异常检测阈值对待测数据进行判断,以确定待测数据是否异常,会出现偏移后的全部待测数据均超过阈值而被识别为异常数据的情况,如存在“假告警”问题。而本实施例的技术方案,通过对待测数据集进行分组处理,可以对各分组数据分别单独进行异常检测,如图2b中(b)所示,可以将待测数据集分组得到两个子数据集G1、G2,进而可以分别对G1和G2进行单独的异常检测。
步骤103,根据各所述子服务数据时间序列对应的数据特征向量,确定异常检测信息,并采用所述异常检测信息,构建不同异常数据类型各自对应的异常检测模型;
其中,异常检测信息可以包括不同异常数据类型各自对应的检测阈值参数,各检测阈值参数可以用于构建对应的异常数据类型的异常检测模型。
在得到多个子服务数据时间序列后,可以根据各子服务数据时间序列对应的数据特征向量,确定异常检测信息,进而可以采用该异常检测信息构建不同异常数据类型各自对应的异常检测模型。
具体地,如图2a所示,可以对各分组G1,G2,G3,…Gm分别计算,得到具有统计特征的特征向量V1,V2,V3,…Vm,即各子服务数据时间序列对应的数据特征向量,然后可以针对特征向量序列V1,V2,V3,…Vm配置出相对偏移阈值参数,即异常检测信息,如整体偏移判断模块参数设置、离群点异常判断模块参数设置、波动异常判断模块参数设置,进而可以采用异常检测信息中不同异常数据类型各自对应的检测阈值参数,分别构建异常检测模型,如整体偏移异常检测模型、离群点异常检测模型、异常波动异常检测模型,并可以将多个异常检测模型汇总得到服务异常检测模型。
步骤104,基于各所述异常检测模型,分别对各所述子服务数据时间序列进行数据检测,将各所述子服务数据时间序列的异常数据信息,作为所述服务数据时间序列的服务异常检测结果。
在实际应用中,基于各异常检测模型,可以分别对各子服务数据时间序列进行数据检测,进而可以将各子服务数据时间序列的异常数据信息,作为服务数据时间序列的服务异常检测结果,并可以存储该服务异常检测结果,以便于后续相关技术人员对异常情况进行检查。
在一个可选实施例中,服务数据时间序列的服务异常检测结果可以包括多个异常项,可以对服务异常检测结果中的各异常项生成对应的告警信息,以使得相关技术人员获取该告警信息以进行处理。
例如,如图2c所示,可以基于服务异常检测系统进行服务异常检测处理,该服务异常检测系统可以包括服务数据采集单元,其可以用于对待检测指标数据进行采集;服务数据存储单元,其可以用于对采集得到的待测指标数据(即待检测的服务数据时间序列)进行存储;服务异常检测单元,其可以用于从服务数据存储单元中读取指定数据,如各子服务数据时间序列,并执行异常检测处理;服务异常检测结果存储单元,其可以用于对检测出的异常结果进行存储,以便于相关技术人员后续检查;异常告警单元,其可以用于对服务异常检测结果存储单元中的各异常项生成告警信息,并通知相关技术人员进行处理。
相较于传统方法通过预先对系统关键指标设置静态阈值,当指标超过静态阈值时触发报警,如将某KPI指标的绝对值作为基准来判断待测数据是否异常,其针对指标整体偏移异常场景无法自动调整阈值,如当新版本投产后,服务耗时整体增加,但由于固定的静态阈值仍维持不变,则可能出现误报警现象;针对指标异常波动场景也无法自动识别,如某指标出现异常波动,但波动范围未超过静态阈值,也无法通过静态阈值进行识别;且静态阈值需要对服务的各个指标逐个进行阈值设置,随着版本投产,往往还需要对阈值进行跟踪调整,大量依赖人工操作。
或是采用基于监督学习的服务异常检测方法,其需要预先对异常数据进行标注,使得训练数据集中同时存在正常数据和异常数据,再通过监督学习分类方法训练得到异常数据分类模型,而针对海量KPI数据,难以通过人工方式完成标注,且其也存在解释性差的问题。
本实施例的技术方案,通过有限的模型参数即可实现对离群点异常、整体偏移异常、波动异常等多种异常类型进行有效识别,同时本实施例方法属于无监督学习方法,无需人工标注数据,并具有良好的可解释性,有助于保障金融信息系统中各类交易的稳定性、可用性,也能够根据管理规范和具体业务场景进行灵活调整。
上述服务异常检测方法中,通过获取待检测的服务数据时间序列,服务数据时间序列为对金融系统中服务性能参数连续进行数据采集得到的,然后根据服务数据时间序列对应的多个数据切分点,将服务数据时间序列拆分为多个子服务数据时间序列,根据各子服务数据时间序列对应的数据特征向量,确定异常检测信息,并采用异常检测信息,构建不同异常数据类型各自对应的异常检测模型,异常检测信息包括不同异常数据类型各自对应的检测阈值参数,各检测阈值参数用于构建对应的异常数据类型的异常检测模型,进而基于各异常检测模型,分别对各子服务数据时间序列进行数据检测,将各子服务数据时间序列的异常数据信息,作为服务数据时间序列的服务异常检测结果,实现了基于模型参数对服务异常进行有效识别,无需人工标注数据,能够根据具体业务场景灵活调整阈值,且具有良好的可解释性。
在一个实施例中,所述根据所述服务数据时间序列对应的多个数据切分点,将所述服务数据时间序列拆分为多个子服务数据时间序列,可以包括如下步骤:
将所述服务数据时间序列作为当前待切分数据,确定所述当前待切分数据对应的当前数据切分点,并根据所述当前数据切分点,将所述当前待切分数据拆分为两个子数据组;
分别将各所述子数据组作为当前待切分数据,并返回确定所述当前待切分数据对应的当前数据切分点,并根据所述当前数据切分点,将所述当前待切分数据拆分为两个子数据组的步骤,直至所述当前待切分数据满足切分终止条件,以将所述当前待切分数据作为所述子服务数据时间序列。
在实际应用中,针对待检测的服务数据时间序列,通过决策树回归方法进行分组处理时,具体可以采用基于CART回归树的优化方法,可以将服务数据时间序列作为当前待切分数据,根据对应的当前数据切分点可以得到两个子数据组,进而可以分别对两个子数据组进一步执行数据拆分的步骤,以继续向下切分,直至满足切分终止条件,得到最终的分组数据,即多个子服务数据时间序列。
在一示例中,针对切分终止条件,可以采用待切分集合(即当前待切分数据)中的采样数据点数量作为停止条件,如待切分集合中的数据点数量小于指定值,如分组最小数据量,则停止对该待切分集合进行切分,并将待切分集合内的采样数据点作为一个分组数据,即子服务数据时间序列;若待切分集合中的采样数据点大于分组最小数据量,则继续向下切分,直至待切分集合中的采样数据点小于分组最小数据量。
例如,如图3a所示,可以预设切分终止条件为分组最小数据量3,针对数据集S(即当前待切分数据),可以根据切分点拆分为{s0,s1,s2}和{s3,s4,s5,s6,s7,s8,s9}两个子集合(即两个子数据组),由于子集合{s0,s1,s2}中的数据点数量为3,满足切分终止条件,则对该子集合不继续向下切分;针对子集合{s3,s4,s5,s6,s7,s8,s9},其数据点数量为7,未满足切分终止条件,则可以继续向下拆分,进而可以将数据集S拆分为分组数据G1、G2、G3、G4(即子服务数据时间序列)。
在又一示例中,分组最小数据量可以基于金融信息系统中服务的最小变更周期进行设置,如可以预设为版本发布间隔周期最小值、系统架构变更周期最小值、异常故障率最小值、交易请求变化周期最小值等。
本实施例中,通过将服务数据时间序列作为当前待切分数据,确定当前待切分数据对应的当前数据切分点,并根据当前数据切分点,将当前待切分数据拆分为两个子数据组,进而分别将各子数据组作为当前待切分数据,并返回确定当前待切分数据对应的当前数据切分点,并根据当前数据切分点,将当前待切分数据拆分为两个子数据组的步骤,直至当前待切分数据满足切分终止条件,以将当前待切分数据作为子服务数据时间序列,可以将服务数据时间序列拆分为多个子数据,为后续异常检测提供了数据支持,便于并行处理,提升了处理效率。
在一个实施例中,所述确定所述当前待切分数据对应的当前数据切分点,可以包括如下步骤:
以所述当前待切分数据中的任意一个服务数据为候选切分点,确定所述候选切分点对应的误差值;所述误差值为第一子数据组与第二子数据组的中位数差值,所述第一子数据组和所述第二子数据组为根据所述候选切分点拆分所述当前待切分数据得到的;
在一示例中,可以针对待测数据集S(即当前待切分数据),选取第j个数据点x(j)及其取值s作为切分点(即任意一个服务数据为候选切分点),然后可以将整个空间切分为两个子区域R1(j,s)={x|x(j)≤s}和R2(j,s)={x|x(j)>s}(即第一子数据组和第二子数据组),进而可以分别针对子区域R1和R2计算出中位数c1=median(R1)、c2=median(R2),并可以通过如下方式计算出当前切分点(j,s)对应的误差值:
Figure BDA0003540407960000111
相较于传统CART回归树算法,其采用平均数计算误差,若各分组采样数据点数量较少时,会导致个别离群异常点对平均数产生剧烈影响,造成分组错误。
本实施例的技术方案,基于金融信息系统中服务调用常较稳定或具有周期性的因素,通过采用中位数计算误差,可以减少个别离群异常点对群组整体情况的干扰,避免出现分组错误,且中位数也能够较好地表征分区内采样点的总体特征。
从多个所述候选切分点各自对应的误差值中,确定最小误差值,并将所述最小误差值对应的候选切分点,作为所述当前数据切分点。
在一示例中,通过遍历待测数据集S(即当前待切分数据)中的每个数据点,可以将各数据点作为切分点(即候选切分点),以分别计算出对应的误差值,进而可以从全部误差值中选取出最小误差值,并将最小误差值对应的数据点作为当前数据切分点。
例如,可以采用如下方式确定当前数据切分点:
Figure BDA0003540407960000112
在又一示例中,如图3b所示,可以在待测数据集(即当前待切分数据)中任取一数据点,获取该数据点的横坐标j和纵坐标s,然后可以基于选取的数据点将待测数据集对应的空间切分为两个子区域R1和R2,并可以对两个子区域分别得到中位数c1和c2。通过误差计算公式
Figure BDA0003540407960000113
可以分别得到图3b中(1)和图3b中(2)的误差值,可以看出(1)的误差值小于(2)的误差值,则可以将(1)对应的(j,s)作为当前数据切分点,以能够较好地对待测数据集进行分组,切分为两个子数据集S1={x|x≤j}和S2={x|x>j},并可以对S1和S2继续执行上述切分步骤直至满足切分终止条件。
本实施例中,通过以当前待切分数据中的任意一个服务数据为候选切分点,确定候选切分点对应的误差值,进而从多个候选切分点各自对应的误差值中,确定最小误差值,并将最小误差值对应的候选切分点,作为当前数据切分点,能够高效且准确地进行数据分组,提升了数据处理效率。
在一个实施例中,异常检测信息可以包括异常波动阈值、异常离群点阈值,所述根据各所述子服务数据时间序列对应的数据特征向量,确定异常检测信息,可以包括如下步骤:
对各所述子服务数据时间序列对应的离散评估值进行聚类处理,得到聚类评估值,并结合所述聚类评估值和第一预设参数得到所述异常波动阈值;
在实际应用中,可以获取各子服务数据时间序列对应的离散评估值,如ρ1234,为了将正常波动情况与异常波动情况进行区分,可以对多个离散评估值组成的集合进行k-means聚类,得到最大簇的心点ρ(即聚类评估值),该值可以表征待测数据指标的平均波动程度,进而可以确定异常波动阈值,以判断群组(即子服务数据时间序列)是否出现波动异常,如当群组的离散评估值ρi满足ρi>α·ρ,则可以判断该群组出现波动异常,其中,α为常量参数(即第一预设参数),表示当超过α倍时,判断为波动异常。
在一示例中,可以设置k=2,则可以得到由ρ1234组成的最大簇,其簇心的离散值为ρ=0.43。
针对每个子服务数据时间序列,结合所述子服务数据时间序列对应的离散评估值和第二预设参数,得到所述子服务数据时间序列对应的异常离群点阈值。
在一示例中,可以获取各子服务数据时间序列对应的离散评估值,进而可以针对每个子服务数据时间序列,确定该子服务数据时间序列对应的异常离群点阈值,例如,当采样数据点s的值超过当前群组(即子服务数据时间序列)的离散评估值的β倍时,即s>β·ρi,则可以判断该采样数据点为离群点,其中,β为常量参数(即第二预设参数),表示当超过β倍时,判断为离群点异常。
本实施例中,通过对各子服务数据时间序列对应的离散评估值进行聚类处理,得到聚类评估值,并结合聚类评估值和第一预设参数得到异常波动阈值,以及针对每个子服务数据时间序列,结合子服务数据时间序列对应的离散评估值和第二预设参数,得到子服务数据时间序列对应的异常离群点阈值,可以基于特征向量序列配置相对偏移阈值参数,能够灵活调整阈值。
在一个实施例中,当异常检测模型为偏移异常检测模型,异常数据信息可以包括异常偏移结果,所述基于各所述异常检测模型,分别对各所述子服务数据时间序列进行数据检测,可以包括如下步骤:
确定任意两个相邻的子服务数据时间序列的偏移值;所述偏移值根据所述任意两个相邻的子服务数据时间序列各自对应的中位数得到;若所述偏移值大于异常偏移阈值,确定所述任意两个相邻的子服务数据时间序列的偏移检测结果为所述异常偏移结果。
在实际应用中,可以获得每个分组(即子服务数据时间序列)的中位数,当相邻分组的中位数超过偏移阈值(即异常偏移阈值)时,则可以判断两个分组出现整体偏移。
例如,按时间顺序排列的待测数据集中,若存在某个时刻t,使得该时刻t前数据点和该时刻t后数据点的整体情况发生了偏移的异常现象,即为整体偏移异常。
在一示例中,如图4a所示,通过将待测数据集划分为两个分组子集合G1和G2(即任意两个相邻的子服务数据时间序列),可以比较两个分组子集合的中位数,得到两个分组子集合的偏移量Delta,若该偏移量超过偏移阈值,则可以判断为两个分组子集合出现整体偏移,即异常偏移结果。
本实施例中,通过确定任意两个相邻的子服务数据时间序列的偏移值,若偏移值大于异常偏移阈值,确定任意两个相邻的子服务数据时间序列的偏移检测结果为异常偏移结果,能够有效地识别出整体偏移异常情况。
在一个实施例中,当异常检测模型为离群点异常检测模型,异常数据信息可以包括异常离群点,所述基于各所述异常检测模型,分别对各所述子服务数据时间序列进行数据检测,可以包括如下步骤:
针对每个子服务数据时间序列,采样所述子服务数据时间序列中的任意一个服务数据,得到所述任意一个服务数据对应的数据值;若所述数据值大于所述异常离群点阈值,确定所述任意一个服务数据为所述异常离群点。
在实际应用中,可以针对每个子服务数据时间序列,确定该子服务数据时间序列对应的异常离群点阈值,如β*ρi,当采样数据点s对应的数据值超过当前群组(即子服务数据时间序列)的离散评估值的β倍时,即s>β·ρi,则可以判断该采样数据点为异常离群点。
例如,在待测数据集中,若某个采样数据点的值明显偏离其它采样数据点的异常现象,即为离群点异常。
在一示例中,如图4b所示,根据同一分组(即各子服务数据时间序列)内的数据点,可以计算得到该分组数据集的离散评估值ρi,该离散评估值可以表征对应的分组数据集中采样数据点的离散程度,可以取β=2,即当离散评估值(即任意一个服务数据对应的数据值)超过ρi的2倍时,可以判断为离群点异常,通过遍历分组数据集中的全部采样数据点,可以对每个采样数据点均进行离群点检查,进而可以检测出该分组数据集中的离群采样点,即异常离群点。
本实施例中,通过针对每个子服务数据时间序列,采样子服务数据时间序列中的任意一个服务数据,得到任意一个服务数据对应的数据值,若数据值大于异常离群点阈值,确定任意一个服务数据为异常离群点,能够有效地识别出离群点异常情况。
在一个实施例中,当异常检测模型为波动异常检测模型,异常数据信息可以包括异常波动群组,所述基于各所述异常检测模型,分别对各所述子服务数据时间序列进行数据检测,可以包括如下步骤:
针对每个子服务数据时间序列,确定所述子服务数据时间序列对应的离散评估值;若所述离散评估值大于所述异常波动阈值,确定所述子服务数据时间序列为所述异常波动群组。
在一示例中,波动异常检测模型可以采用如下步骤进行处理:
1、计算每个群组的离散评估值ρ123,…ρm,该离散评估值可以表征群组(即每个子服务数据时间序列)内采样数据点的波动程度,可以采用如下方式计算得到:
Figure BDA0003540407960000151
其中,m为采样数据点si在其所属群组的中位数,基于获取中位数可以避免个别异常采样值对群组平均情况的影响。
2、对每个群组的离散评估值组成的集合进行k-means聚类,获取最大簇的心点ρ,该值可以表征待测数据指标的平均波动程度。
3、判断群组是否出现波动异常,若群组的离散评估值ρi满足ρi>α·ρ,α*ρi为异常波动阈值,则判断该群组出现波动异常。
在又一示例中,如图4c所示,通过待测数据集得到多个分组数据集,如ρ1234,为了将正常波动情况与异常波动情况进行区分,可以对多个离散评估值组成的集合ρ1234进行k-means聚类,可以设置k=2,则可以得到由ρ1234组成的最大簇,其簇心的离散值为ρ=0.43,进而可以判断各分组数据集是否存在波动异常,可以取α=2.0,即超过簇心ρ的2倍时,则可以判断为异常波动,由于ρ2>2×0.43,可以将第二个分组数据集识别为异常波动,即异常波动群组。
在实际应用中,基于多个异常检测模型汇总得到服务异常检测模型,对实际生产案例进行检测,如图4d所示,可以看出该服务异常检测模型具有良好的异常检测效果。
本实施例的技术方案,解决了针对金融信息系统中服务异常的识别问题,其可以有效识别出离群点异常、整体偏移异常、波动异常等情况,具有如下优点:
(1)该服务异常检测模型使用无监督学习方法,无需异常数据标注,仅需少量模型参数即可实现异常检测,减少了维护人员工作量;
(2)在对待测数据集进行数据分组后,可以针对各分组进行独立运算,便于并行处理,计算处理涉及一维空间运算,运算速度快;
(3)采用基于决策树和动态阈值的异常检测方法,模型易于理解,可解释性强,能够灵活结合管理规范和业务场景的具体要求对模型的灵敏性进行调整。
本实施例中,通过针对每个子服务数据时间序列,确定子服务数据时间序列对应的离散评估值,若离散评估值大于异常波动阈值,确定子服务数据时间序列为异常波动群组,能够有效地识别出波动异常情况。
在一个实施例中,如图5所示,提供了另一种服务异常检测方法的流程示意图。本实施例中,该方法包括以下步骤:
在步骤501中,获取待检测的服务数据时间序列。在步骤502中,将服务数据时间序列作为当前待切分数据,确定当前待切分数据对应的当前数据切分点,并根据当前数据切分点,将当前待切分数据拆分为两个子数据组。在步骤503中,分别将各子数据组作为当前待切分数据,并返回确定当前待切分数据对应的当前数据切分点,并根据当前数据切分点,将当前待切分数据拆分为两个子数据组的步骤,直至当前待切分数据满足切分终止条件,以将当前待切分数据作为子服务数据时间序列。在步骤504中,根据各子服务数据时间序列对应的数据特征向量,确定异常检测信息,并采用异常检测信息,构建不同异常数据类型各自对应的异常检测模型。在步骤505中,当异常检测模型为偏移异常检测模型,确定任意两个相邻的子服务数据时间序列的偏移值,若偏移值大于异常偏移阈值,确定任意两个相邻的子服务数据时间序列的偏移检测结果为异常偏移结果。在步骤506中,当异常检测模型为离群点异常检测模型,针对每个子服务数据时间序列,采样子服务数据时间序列中的任意一个服务数据,得到任意一个服务数据对应的数据值,若数据值大于异常离群点阈值,确定任意一个服务数据为所述异常离群点。在步骤507中,当异常检测模型为波动异常检测模型,针对每个子服务数据时间序列,确定子服务数据时间序列对应的离散评估值,若离散评估值大于异常波动阈值,确定子服务数据时间序列为异常波动群组。需要说明的是,上述步骤的具体限定可以参见上文对一种服务异常检测方法的具体限定,在此不再赘述。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的服务异常检测方法的服务异常检测装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个服务异常检测装置实施例中的具体限定可以参见上文中对于服务异常检测方法的限定,在此不再赘述。
在一个实施例中,如图6所示,提供了一种服务异常检测装置,包括:
服务数据获取模块601,用于获取待检测的服务数据时间序列;所述服务数据时间序列为对金融系统中服务性能参数连续进行数据采集得到的;
数据拆分模块602,用于根据所述服务数据时间序列对应的多个数据切分点,将所述服务数据时间序列拆分为多个子服务数据时间序列;
异常检测模型构建模块603,用于根据各所述子服务数据时间序列对应的数据特征向量,确定异常检测信息,并采用所述异常检测信息,构建不同异常数据类型各自对应的异常检测模型;所述异常检测信息包括不同异常数据类型各自对应的检测阈值参数,各所述检测阈值参数用于构建对应的异常数据类型的异常检测模型;
数据检测模块604,用于基于各所述异常检测模型,分别对各所述子服务数据时间序列进行数据检测,将各所述子服务数据时间序列的异常数据信息,作为所述服务数据时间序列的服务异常检测结果。
在一个实施例中,所述数据拆分模块602包括:
第一切分处理子模块,用于将所述服务数据时间序列作为当前待切分数据,确定所述当前待切分数据对应的当前数据切分点,并根据所述当前数据切分点,将所述当前待切分数据拆分为两个子数据组;
第二切分处理子模块,用于分别将各所述子数据组作为当前待切分数据,并返回确定所述当前待切分数据对应的当前数据切分点,并根据所述当前数据切分点,将所述当前待切分数据拆分为两个子数据组的步骤,直至所述当前待切分数据满足切分终止条件,以将所述当前待切分数据作为所述子服务数据时间序列。
在一个实施例中,所述第一切分处理子模块包括:
误差值得到单元,用于以所述当前待切分数据中的任意一个服务数据为候选切分点,确定所述候选切分点对应的误差值;所述误差值为第一子数据组与第二子数据组的中位数差值,所述第一子数据组和所述第二子数据组为根据所述候选切分点拆分所述当前待切分数据得到的;
当前数据切分点确定单元,用于从多个所述候选切分点各自对应的误差值中,确定最小误差值,并将所述最小误差值对应的候选切分点,作为所述当前数据切分点。
在一个实施例中,所述异常检测信息包括异常波动阈值、异常离群点阈值,所述异常检测模型构建模块603包括:
异常波动阈值得到子模块,用于对各所述子服务数据时间序列对应的离散评估值进行聚类处理,得到聚类评估值,并结合所述聚类评估值和第一预设参数得到所述异常波动阈值;
异常离群点阈值得到子模块,用于针对每个子服务数据时间序列,结合所述子服务数据时间序列对应的离散评估值和第二预设参数,得到所述子服务数据时间序列对应的异常离群点阈值。
在一个实施例中,当所述异常检测模型为偏移异常检测模型,所述异常数据信息包括异常偏移结果,所述数据检测模块604包括:
偏移值得到子模块,用于确定任意两个相邻的子服务数据时间序列的偏移值;所述偏移值根据所述任意两个相邻的子服务数据时间序列各自对应的中位数得到;
异常偏移结果确定子模块,用于若所述偏移值大于异常偏移阈值,确定所述任意两个相邻的子服务数据时间序列的偏移检测结果为所述异常偏移结果。
在一个实施例中,当所述异常检测模型为离群点异常检测模型,所述异常数据信息包括异常离群点,所述数据检测模块604包括:
离群点检测子模块,用于针对每个子服务数据时间序列,采样所述子服务数据时间序列中的任意一个服务数据,得到所述任意一个服务数据对应的数据值;
异常离群点确定子模块,用于若所述数据值大于所述异常离群点阈值,确定所述任意一个服务数据为所述异常离群点。
在一个实施例中,当所述异常检测模型为波动异常检测模型,所述异常数据信息包括异常波动群组,所述数据检测模块604包括:
异常波动检测子模块,用于针对每个子服务数据时间序列,确定所述子服务数据时间序列对应的离散评估值;
异常波动群组确定子模块,用于若所述离散评估值大于所述异常波动阈值,确定所述子服务数据时间序列为所述异常波动群组。
上述服务异常检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种服务异常检测方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取待检测的服务数据时间序列;所述服务数据时间序列为对金融信息系统中服务性能参数连续进行数据采集得到的;
根据所述服务数据时间序列对应的多个数据切分点,将所述服务数据时间序列拆分为多个子服务数据时间序列;
根据各所述子服务数据时间序列对应的数据特征向量,确定异常检测信息,并采用所述异常检测信息,构建不同异常数据类型各自对应的异常检测模型;所述异常检测信息包括不同异常数据类型各自对应的检测阈值参数,各所述检测阈值参数用于构建对应的异常数据类型的异常检测模型;
基于各所述异常检测模型,分别对各所述子服务数据时间序列进行数据检测,将各所述子服务数据时间序列的异常数据信息,作为所述服务数据时间序列的服务异常检测结果。
在一个实施例中,处理器执行计算机程序时还实现上述其他实施例中的服务异常检测方法的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取待检测的服务数据时间序列;所述服务数据时间序列为对金融信息系统中服务性能参数连续进行数据采集得到的;
根据所述服务数据时间序列对应的多个数据切分点,将所述服务数据时间序列拆分为多个子服务数据时间序列;
根据各所述子服务数据时间序列对应的数据特征向量,确定异常检测信息,并采用所述异常检测信息,构建不同异常数据类型各自对应的异常检测模型;所述异常检测信息包括不同异常数据类型各自对应的检测阈值参数,各所述检测阈值参数用于构建对应的异常数据类型的异常检测模型;
基于各所述异常检测模型,分别对各所述子服务数据时间序列进行数据检测,将各所述子服务数据时间序列的异常数据信息,作为所述服务数据时间序列的服务异常检测结果。
在一个实施例中,计算机程序被处理器执行时还实现上述其他实施例中的服务异常检测方法的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取待检测的服务数据时间序列;所述服务数据时间序列为对金融信息系统中服务性能参数连续进行数据采集得到的;
根据所述服务数据时间序列对应的多个数据切分点,将所述服务数据时间序列拆分为多个子服务数据时间序列;
根据各所述子服务数据时间序列对应的数据特征向量,确定异常检测信息,并采用所述异常检测信息,构建不同异常数据类型各自对应的异常检测模型;所述异常检测信息包括不同异常数据类型各自对应的检测阈值参数,各所述检测阈值参数用于构建对应的异常数据类型的异常检测模型;
基于各所述异常检测模型,分别对各所述子服务数据时间序列进行数据检测,将各所述子服务数据时间序列的异常数据信息,作为所述服务数据时间序列的服务异常检测结果。
在一个实施例中,计算机程序被处理器执行时还实现上述其他实施例中的服务异常检测方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (11)

1.一种服务异常检测方法,其特征在于,所述方法包括:
获取待检测的服务数据时间序列;所述服务数据时间序列为对金融信息系统中服务性能参数连续进行数据采集得到的;
根据所述服务数据时间序列对应的多个数据切分点,将所述服务数据时间序列拆分为多个子服务数据时间序列;
根据各所述子服务数据时间序列对应的数据特征向量,确定异常检测信息,并采用所述异常检测信息,构建不同异常数据类型各自对应的异常检测模型;所述异常检测信息包括不同异常数据类型各自对应的检测阈值参数,各所述检测阈值参数用于构建对应的异常数据类型的异常检测模型;
基于各所述异常检测模型,分别对各所述子服务数据时间序列进行数据检测,将各所述子服务数据时间序列的异常数据信息,作为所述服务数据时间序列的服务异常检测结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述服务数据时间序列对应的多个数据切分点,将所述服务数据时间序列拆分为多个子服务数据时间序列,包括:
将所述服务数据时间序列作为当前待切分数据,确定所述当前待切分数据对应的当前数据切分点,并根据所述当前数据切分点,将所述当前待切分数据拆分为两个子数据组;
分别将各所述子数据组作为当前待切分数据,并返回确定所述当前待切分数据对应的当前数据切分点,并根据所述当前数据切分点,将所述当前待切分数据拆分为两个子数据组的步骤,直至所述当前待切分数据满足切分终止条件,以将所述当前待切分数据作为所述子服务数据时间序列。
3.根据权利要求2所述的方法,其特征在于,所述确定所述当前待切分数据对应的当前数据切分点,包括:
以所述当前待切分数据中的任意一个服务数据为候选切分点,确定所述候选切分点对应的误差值;所述误差值为第一子数据组与第二子数据组的中位数差值,所述第一子数据组和所述第二子数据组为根据所述候选切分点拆分所述当前待切分数据得到的;
从多个所述候选切分点各自对应的误差值中,确定最小误差值,并将所述最小误差值对应的候选切分点,作为所述当前数据切分点。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述异常检测信息包括异常波动阈值、异常离群点阈值,所述根据各所述子服务数据时间序列对应的数据特征向量,确定异常检测信息,包括:
对各所述子服务数据时间序列对应的离散评估值进行聚类处理,得到聚类评估值,并结合所述聚类评估值和第一预设参数得到所述异常波动阈值;
针对每个子服务数据时间序列,结合所述子服务数据时间序列对应的离散评估值和第二预设参数,得到所述子服务数据时间序列对应的异常离群点阈值。
5.根据权利要求1至3任一项所述的方法,其特征在于,当所述异常检测模型为偏移异常检测模型,所述异常数据信息包括异常偏移结果,所述基于各所述异常检测模型,分别对各所述子服务数据时间序列进行数据检测,包括:
确定任意两个相邻的子服务数据时间序列的偏移值;所述偏移值根据所述任意两个相邻的子服务数据时间序列各自对应的中位数得到;
若所述偏移值大于异常偏移阈值,确定所述任意两个相邻的子服务数据时间序列的偏移检测结果为所述异常偏移结果。
6.根据权利要求4所述的方法,其特征在于,当所述异常检测模型为离群点异常检测模型,所述异常数据信息包括异常离群点,所述基于各所述异常检测模型,分别对各所述子服务数据时间序列进行数据检测,包括:
针对每个子服务数据时间序列,采样所述子服务数据时间序列中的任意一个服务数据,得到所述任意一个服务数据对应的数据值;
若所述数据值大于所述异常离群点阈值,确定所述任意一个服务数据为所述异常离群点。
7.根据权利要求4所述的方法,其特征在于,当所述异常检测模型为波动异常检测模型,所述异常数据信息包括异常波动群组,所述基于各所述异常检测模型,分别对各所述子服务数据时间序列进行数据检测,包括:
针对每个子服务数据时间序列,确定所述子服务数据时间序列对应的离散评估值;
若所述离散评估值大于所述异常波动阈值,确定所述子服务数据时间序列为所述异常波动群组。
8.一种服务异常检测装置,其特征在于,所述装置包括:
服务数据获取模块,用于获取待检测的服务数据时间序列;所述服务数据时间序列为对金融系统中服务性能参数连续进行数据采集得到的;
数据拆分模块,用于根据所述服务数据时间序列对应的多个数据切分点,将所述服务数据时间序列拆分为多个子服务数据时间序列;
异常检测模型构建模块,用于根据各所述子服务数据时间序列对应的数据特征向量,确定异常检测信息,并采用所述异常检测信息,构建不同异常数据类型各自对应的异常检测模型;所述异常检测信息包括不同异常数据类型各自对应的检测阈值参数,各所述检测阈值参数用于构建对应的异常数据类型的异常检测模型;
数据检测模块,用于基于各所述异常检测模型,分别对各所述子服务数据时间序列进行数据检测,将各所述子服务数据时间序列的异常数据信息,作为所述服务数据时间序列的服务异常检测结果。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
11.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202210237284.0A 2022-03-10 2022-03-10 服务异常检测方法、装置、计算机设备和存储介质 Pending CN114610572A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210237284.0A CN114610572A (zh) 2022-03-10 2022-03-10 服务异常检测方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210237284.0A CN114610572A (zh) 2022-03-10 2022-03-10 服务异常检测方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN114610572A true CN114610572A (zh) 2022-06-10

Family

ID=81862277

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210237284.0A Pending CN114610572A (zh) 2022-03-10 2022-03-10 服务异常检测方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN114610572A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116149896A (zh) * 2023-03-27 2023-05-23 阿里巴巴(中国)有限公司 时序数据异常检测方法、存储介质和电子设备
CN117171589A (zh) * 2023-11-02 2023-12-05 腾讯科技(深圳)有限公司 一种数据分割方法、装置、设备及存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116149896A (zh) * 2023-03-27 2023-05-23 阿里巴巴(中国)有限公司 时序数据异常检测方法、存储介质和电子设备
CN116149896B (zh) * 2023-03-27 2023-07-21 阿里巴巴(中国)有限公司 时序数据异常检测方法、存储介质和电子设备
CN117171589A (zh) * 2023-11-02 2023-12-05 腾讯科技(深圳)有限公司 一种数据分割方法、装置、设备及存储介质
CN117171589B (zh) * 2023-11-02 2024-01-02 腾讯科技(深圳)有限公司 一种数据分割方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN111064614B (zh) 一种故障根因定位方法、装置、设备及存储介质
US11367022B2 (en) System and method for evaluating and deploying unsupervised or semi-supervised machine learning models
US11151014B2 (en) System operational analytics using additional features for health score computation
US11048729B2 (en) Cluster evaluation in unsupervised learning of continuous data
CN114610572A (zh) 服务异常检测方法、装置、计算机设备和存储介质
CN113518011B (zh) 异常检测方法和装置、电子设备及计算机可读存储介质
CN105320727A (zh) 用于检测实时序列中的异常的方法
US10599501B2 (en) Information processing device, information processing method, and recording medium
CN110032490A (zh) 用于检测系统异常的方法及其装置
US20210042585A1 (en) Abnormality detection device, abnormality detection method and computer readable medium
CN111367777B (zh) 告警处理的方法、装置、设备及计算机可读存储介质
JP7285187B2 (ja) 履歴及び時系列の共同分析に基づく異常の特性評価のためのシステム及び方法
EP2963552B1 (en) System analysis device and system analysis method
CN110858072B (zh) 设备运行状态的确定方法及装置
US11265232B2 (en) IoT stream data quality measurement indicator and profiling method and system therefor
CN116804957A (zh) 一种系统监控方法及装置
CN109976986B (zh) 异常设备的检测方法及装置
CN117235664A (zh) 配电通信设备的故障诊断方法、系统和计算机设备
CN117170915A (zh) 数据中心设备故障预测方法、装置和计算机设备
CN112416896A (zh) 数据异常的报警方法和装置、存储介质、电子装置
CN110874601B (zh) 识别设备运行状态的方法、状态识别模型训练方法及装置
CN116700955A (zh) 作业处理方法、装置、计算机设备及可读存储介质
JP7222939B2 (ja) 時系列パターンの説明情報生成装置
CN114692783B (zh) 基于分层图偏差网络的智能服务异常检测方法
CN113806495B (zh) 一种离群机器检测方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination