CN108762959B - 一种选取系统参数的方法、装置及设备 - Google Patents

一种选取系统参数的方法、装置及设备 Download PDF

Info

Publication number
CN108762959B
CN108762959B CN201810284741.5A CN201810284741A CN108762959B CN 108762959 B CN108762959 B CN 108762959B CN 201810284741 A CN201810284741 A CN 201810284741A CN 108762959 B CN108762959 B CN 108762959B
Authority
CN
China
Prior art keywords
system parameter
value
parameter
characterization
historical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810284741.5A
Other languages
English (en)
Other versions
CN108762959A (zh
Inventor
周扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Advanced New Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Advanced New Technologies Co Ltd filed Critical Advanced New Technologies Co Ltd
Priority to CN201810284741.5A priority Critical patent/CN108762959B/zh
Publication of CN108762959A publication Critical patent/CN108762959A/zh
Application granted granted Critical
Publication of CN108762959B publication Critical patent/CN108762959B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3452Performance evaluation by statistical analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Hardware Design (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本说明书实施例公开了一种选取系统参数的方法、装置及设备。在本说明实施例中,针对系统的每个系统参数,根据该系统参数在历史上的取值分布集中程度,和/或该系统参数与其他参数的相关程度,确定该系统参数的评分,然后选取评分大于指定阈值的系统参数。其中,针对每个系统参数,若该系统参数在历史上的取值分布越集中,则该系统参数对应的第一表征值越大;若该系统参数与其他参数越相关,则该系统参数对应的第二表征值越大;若该系统参数对应的第一表征值和/或第二表征值越大,该系统参数对应的评分就越大。

Description

一种选取系统参数的方法、装置及设备
技术领域
本说明书涉及信息技术领域,尤其涉及一种选取系统参数的方法、装置及设备。
背景技术
目前,技术人员需要经常对系统(如业务系统、操作系统等)进行技术更新。举例来说,所述技术更新可以是对系统的底层代码进行更新、对系统的数据库进行更新等。众所周知,对系统进行技术更新有可能导致系统异常(如系统发生故障)。
为了保证系统正常运行,技术人员通常会对技术更新后的系统进行异常性检测。具体地,由于系统异常往往是由系统的系统参数异常导致的,因此,技术人员一般会采用对技术更新后的系统的全部系统参数进行分析的方式,对技术更新后的系统进行异常性检测。
基于现有技术,需要一种选取系统参数的方法,以提升对系统进行异常性检测的准确性。
发明内容
本说明书实施例提供一种选取系统参数的方法、装置及设备,以解决现有技术中存在的对系统进行异常性检测的准确性不高的问题。
为解决上述技术问题,本说明书实施例是这样实现的:
本说明书实施例提供的一种选取系统参数的方法,包括:
针对系统的每个系统参数,获取该系统参数的各历史取值;
根据该系统参数的各历史取值,确定该系统参数对应的参数表征值;所述参数表征值包括第一表征值和/或第二表征值;所述第一表征值用于表征该系统参数在历史上的取值分布集中程度,该系统参数在历史上的取值分布越集中,该系统参数对应的第一表征值越大;所述第二表征值用于表征该系统参数与除该系统参数外的其他参数的相关程度,该系统参数与其他参数越相关,该系统参数对应的第二表征值越大;
根据该系统参数对应的参数表征值,确定该系统参数对应的评分;所述参数表征值越大,所述评分越大;
选取评分大于指定阈值的系统参数,用于对所述系统进行异常性检测。
本说明书实施例提供的一种选取系统参数的装置,包括:
获取模块,针对系统的每个系统参数,获取该系统参数的各历史取值;
第一确定模块,根据该系统参数的各历史取值,确定该系统参数对应的参数表征值;所述参数表征值包括第一表征值和/或第二表征值;所述第一表征值用于表征该系统参数在历史上的取值分布集中程度,该系统参数在历史上的取值分布越集中,该系统参数对应的第一表征值越大;所述第二表征值用于表征该系统参数与除该系统参数外的其他参数的相关程度,该系统参数与其他参数越相关,该系统参数对应的第二表征值越大;
第二确定模块,根据该系统参数对应的参数表征值,确定该系统参数对应的评分;所述参数表征值越大,所述评分越大;
选取模块,选取评分大于指定阈值的系统参数,用于对所述系统进行异常性检测。
本说明书实施例提供的一种选取系统参数的设备,包括一个或多个处理器及存储器,所述存储器存储有程序,并且被配置成由所述一个或多个处理器执行以下步骤:
针对系统的每个系统参数,获取该系统参数的各历史取值;
根据该系统参数的各历史取值,确定该系统参数对应的参数表征值;所述参数表征值包括第一表征值和/或第二表征值;所述第一表征值用于表征该系统参数在历史上的取值分布集中程度,该系统参数在历史上的取值分布越集中,该系统参数对应的第一表征值越大;所述第二表征值用于表征该系统参数与除该系统参数外的其他参数的相关程度,该系统参数与其他参数越相关,该系统参数对应的第二表征值越大;
根据该系统参数对应的参数表征值,确定该系统参数对应的评分;所述参数表征值越大,所述评分越大;
选取评分大于指定阈值的系统参数,用于对所述系统进行异常性检测。
由以上本说明书实施例提供的技术方案可见,在本说明书实施例中,针对系统的每个系统参数,根据该系统参数在历史上的取值分布集中程度(第一表征值),和/或该系统参数与除该系统参数外的其他参数的相关程度(第二表征值),确定该系统参数的评分,然后选取评分大于指定阈值的系统参数,用于对系统进行异常性检测。其中,针对每个系统参数,若该系统参数在历史上的取值分布越集中,则该系统参数对应的第一表征值越大;若该系统参数与其他参数越相关,则该系统参数对应的第二表征值越大;若该系统参数对应的第一表征值和/或第二表征值越大,该系统参数对应的评分就越大。由于业务经验表明,针对每个系统参数,若该系统参数在历史上的取值分布越集中,则该系统参数与系统是否异常的相关性就越强,若该系统参数与其他参数越相关,则该系统参数与系统是否异常的相关性就越强,因此,通过本说明书实施例,可以从全部系统参数中选取出与系统是否异常相关性较强的系统参数,排除掉与系统是否异常相关性较弱的系统参数。将选取的系统参数用于对系统的异常性检测,可以一方面减少需要分析的系统参数的数量,有效避免维数灾难,另一方面尽可能保留与系统是否异常相关性较强的系统参数,综合这两个方面,可以显著提升异常性检测的准确性。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本说明书实施例提供的一种选取系统参数的方法流程图;
图2是本说明书实施例提供的系统参数A的各历史取值的概率分布曲线和系统参数B的各历史取值的概率分布曲线示意图;
图3是本说明书实施例提供的一种选取系统参数的装置示意图;
图4是本说明书实施例提供的一种选取系统参数的设备示意图。
具体实施方式
在现有技术中,为了对每次技术更新是否会导致系统异常进行检测,技术人员可以机器学习的方式或其他技术手段,对系统的全部系统参数进行分析,以判断系统是否会出现异常。
以机器学习的方式为例,技术人员通常以系统对应的若干特征向量为样本,训练用于对系统进行异常性检测的模型(本文称之为检测模型)。其中,系统对应的特征向量的各维度与系统的各系统参数一一对应,假设系统的系统参数共有N个,则系统对应的特征向量具有N个维度。历史上每进行一次技术更新后,系统的至少部分系统参数的取值通常会发生变化,可以据此得到一个对应于系统的特征向量。
例如,系统有5000个系统参数,因此,系统的特征向量具有5000个维度。针对系统的每个特征向量,该特征向量的各维度的取值即是历史上某次技术更新后,系统的各系统参数的取值。
但是,实践中,系统的系统参数较多(通常可以达到数千个),这导致用于检测模型训练的特征向量的维数过多,容易引发“维数灾难”。在机器学习领域,所谓“维数灾难”是指在涉及到向量的计算时,随着维数的增加,计算量呈指数倍增长,反而会导致模型训练的效果越来越差的一种现象。也就是说,用于训练检测模型的特征向量的维度并不是越多越好,使用维度过多的特征向量训练得到的检测模型,对系统进行异常性检测的准确性并不高。
此外需要说明的是,不限于机器学习的方式,当系统的系统参数的数量过多时,采用其他技术手段(如人工分析),根据系统的全部系统参数对系统进行异常性检测,也存在“维数灾难”的问题。
而本发明的核心思想是,从系统的全部系统参数中,选取与系统是否异常相关性较强的系统参数(本说明书认为,历史上的取值分布较为集中、与其他参数的相关性较强的系统参数,往往是与系统是否异常相关性较强的系统参数),将选取的系统参数用于对系统进行异常性检测(如将选取的系统参数的取值作为系统对应的特征向量的维度的取值)。如此,可以大为降低对系统进行异常性检测时所需要分析的系统参数的数量,避免维数灾难,提升对系统进行异常性检测的准确性。
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书一个或多个实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。通过本说明书实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
以下结合附图,详细说明本说明书各实施例提供的技术方案。
图1是本说明书实施例提供的一种选取系统参数的方法流程图,包括以下步骤:
S100:针对系统的每个系统参数,获取该系统参数的各历史取值。
本方法的执行主体可以是能够进行数据分析计算的设备(如移动终端、服务器等),本文将之称为分析设备。
在本说明书实施例中,系统的系统参数一般是指与系统的运行状态、功能实现等有关的变量(可以是连续型变量,也可以是离散型变量)。对系统进行技术更新时会导致系统的系统参数的取值发生改变,进而导致系统当前的运行状态或功能发生改变。针对每个系统参数,该系统参数的历史取值是指历史上(具体可以是指定历史期间内,如过去一年内)出现过的该系统参数的取值。
S102:根据该系统参数的各历史取值,确定该系统参数对应的参数表征值。
本说明书认为,针对每个系统参数,若该系统参数在历史上的取值分布越集中,则该系统参数与系统是否异常的相关性就越强,若该系统参数与除该系统参数外的其他参数越相关,则该系统参数与系统是否异常的相关性就越强。
其中,针对每个系统参数而言,除该系统参数外的其他参数即是全部系统参数中,除该系统参数外的其他系统参数。
某个系统参数与系统是否异常的相关性是指,当该系统参数的取值异常时,导致系统发生异常的可能性。该系统参数与系统是否异常的相关性越强,该系统参数的取值异常时,系统发生异常的可能性就越大。
针对每个系统参数而言,该系统参数在历史上的取值分布越集中,即说明该系统参数的各历史取值中,大小相差不大的历史取值的数量越多。
图2是本说明书实施例提供的系统参数A的各历史取值的概率分布曲线和系统参数B的各历史取值的概率分布曲线示意图。如图2所示,系统参数A的各历史取值的概率分布曲线的顶部较为平缓,也即系统参数A的各历史取值分布较为分散,大小与系统参数A的各历史取值的平均值较为接近的历史取值的数量较少。而系统参数B的各历史取值的概率分布曲线的顶部较为陡峭,也即系统参数B的各历史取值分布较为集中,大小与系统参数B的各历史取值的平均值较为接近的历史取值的数量较多。
针对每个系统参数,该系统参数与其他参数越相关,即说明该系统参数的取值发生变化越容易导致其他参数的取值发生变化,和/或其他参数的取值发生变化越容易导致该系统参数的取值发生变化。
在本说明书实施例中,使用参数表征值(包括第一表征值和/或第二表征值)来表征每个系统参数与系统是否异常的相关性的强弱。其中,针对每个系统参数,该系统参数的第一表征值用于表征该系统参数在历史上的取值分布集中程度,该系统参数在历史上的取值分布越集中,说明该系统参数与系统是否异常的相关性就越强,该系统参数对应的第一表征值也就越大。该系统参数对应的第二表征值用于表征该系统参数与其他参数的相关程度,该系统参数与其他参数越相关,说明该系统参数与系统是否异常的相关性就越强,该系统参数对应的第二表征值也就越大。
在本说明书实施例中,针对每个系统参数,可以采用以下两种方法,根据该系统参数的各历史取值,确定该系统参数对应的第一表征值:
1、根据该系统参数的各历史取值,计算该系统参数的各历史取值的概率分布对应的峰度,根据计算得到的峰度,确定该系统参数对应的第一表征值。
为本领域技术人员所熟知的是,峰度Kurtosis是用于表征某组数值的概率分布曲线的顶部高低的概念。某组数值的峰度越高,概率分布曲线的顶部就越高越尖锐,也就说明该组数值分布越集中。
需要说明的是,在本说明书实施例中,若该系统参数为连续型变量,则通常采用方法1确定该系统参数对应的第一表征值。此时,各历史取值的概率分布其实就是各历史取值的概率密度分布。
具体地,可以采用如下公式计算该系统参数的各历史取值的概率密度分布对应的峰度:
Figure BDA0001615677640000071
其中,X为该系统参数,xi为X的历史取值,n为X的各历史取值的数量,K(X)为X的各历史取值的概率分布对应的峰度,μ为X的各历史取值的平均值,σ为X的各历史取值的标准差。
当然,还可以通过其他公式计算该系统参数的各历史取值的概率分布对应的峰度,此处不再一一列举。
在计算得到该系统参数的各历史取值的概率分布对应的峰度后,可以将计算得到的峰度直接作为该系统参数对应的第一表征值。
也可以将计算得到的峰度的大小与指定数值进行比较,根据比较结果,将计算得到的峰度和所述指定数值之一作为该系统参数对应的第一表征值。其中,所述指定数值可以是技术人员根据业务经验指定的,可以为10。
例如,可以将计算得到的峰度与10进行比较,将二者中的最大值作为该系统参数对应的第一表征值。
2、根据该系统参数的各历史取值,计算该系统参数的各历史取值的熵,根据计算得到的熵,确定该系统参数对应的第一表征值。
为本领域技术人员所熟知的是,熵可以表征一组数值分布混乱程度。
需要说明的是,若该系统参数为离散型变量,则通常采用方法2确定该系统参数对应的第一表征值。
具体地,可以采用如下公式计算该系统参数的各历史取值的熵:
Figure BDA0001615677640000081
其中,X为该系统参数,xi为X的历史取值,P(xi)为xi在各历史取值中出现的概率,n为X的历史取值的数量,H(X)为X的各历史取值的熵,b为指定底数(b具体可以是2)。
当然,还可以通过其他公式计算该系统参数的各历史取值的熵,此处不再一一列举。
由于该系统参数在历史上的取值分布越集中,该系统参数的各历史取值的熵就越小,因此,在本说明书实施例中,为了使得该系统参数在历史上的取值分布越集中,该系统参数对应的第一表征值越大,可以在计算得到该系统参数的各历史取值的熵之后,将1-H(X),或将-H(X)作为该系统参数对应的第一表征值。
此外,在本说明书实施例中,确定第二表征值的方法可以是:针对每个系统参数,以该系统参数的各历史取值和其他参数的历史取值为样本,以该系统参数的各历史取值和其他参数的历史取值为样本训练模型,所述模型用于根据其他参数的取值预测该系统参数的取值。然后,对训练后的所述模型进行准确性测试,然后根据测试结果,确定该系统参数对应的第二表征值,所述测试结果表明所述模型准确性越高,所述第二表征值越大。
其中,用于根据其他参数的取值预测该系统参数的取值的模型可以是回归模型。具体地,若该系统参数是连续型变量,则可以训练线性回归模型,若该系统参数是离散型变量,则可以训练逻辑回归模型。
以该系统参数的各历史取值和其他参数的历史取值为样本,训练得到的所述模型的准确性,可以反映出该系统参数与其他参数的相关性。所述模型越准确,就越容易依据其他参数的取值对该系统参数的取值进行预测,因而,该系统参数与其他参数也就越相关。在本说明书实施例中,可以对训练后的所述模型进行准确性测试,测试结果表明所述模型的准确性越高,就说明该系统参数与其他参数越相关,据此就可以确定该系统参数对应的第二表征值。
具体地,可以将上述样本分为训练样本和测试样本,使用训练样本训练模型,然后使用测试样本对训练后的模型的准确性进行测试,得到的测试结果可以是测试误差(即测试失败率,如测试10次,失败5次,测试误差就是0.5)。显然,该系统参数与其他参数越相关,所述测试误差就越小。而为了使得该系统参数与其他参数越相关,该系统参数对应的第二表征值越大,可以将“1-测试误差”作为该系统参数对应的第二表征值。
值得强调的是,上文仅仅对第一表征值和第二表征值的确定方法进行了示例性地说明,对本领域技术人员而言,其在获悉第一表征值和第二表征值所表征的含义之后,容易想到采用除上述方法之外的其他方法确定第一表征值和第二表征值,本文在此不再一一列举。
S104:根据该系统参数对应的参数表征值,确定该系统参数对应的评分。
S106:选取评分大于指定阈值的系统参数,用于对所述系统进行异常性检测。
在本申请实施例中,该系统参数对应的参数表征值越大,该系统参数对应的评分越大。该系统参数的评分用于评价该系统参数与系统是否异常的相关性的强弱。该系统参数的评分越大,该系统参数与系统是否异常的相关性就越强。
具体地,针对每个系统参数,可以仅根据该系统参数对应的第一表征值,确定该系统参数对应的评分,也可以仅根据该系统参数对应的第二表征值,确定该系统参数对应的评分。例如,将该系统参数对应的第一表征值进行归一化处理,将处理后的第一表征值作为该系统参数对应的评分。
此外,还可以根据该系统参数对应的第一表征值和第二表征值,确定该系统参数对应的评分。具体地,可以根据预设的对应于第一表征值的第一权重和对应于第二表征值的第二权重,计算该系统参数对应的第一表征值和第二表征值的加权和,作为该系统参数对应的评分。其中,第一表征值和第二表征值分别对应的权重可以根据需要指定。
进一步地,在计算该系统参数对应的第一表征值和第二表征值的加权和之前,可以对该系统参数对应的第一表征值和第二表征值进行归一化处理,然后计算处理后的第一表征值和第二表征值的加权和,作为该系统参数对应的评分。如此,归一化处理后的第一表征值和第二表征值的量纲可以保持一致,使得在计算第一表征值和第二表征值的加权和时,不会出现如下情况:第一表征值与第二表征值的大小差距过大,使得最终得到的评分的大小主要是由第一表征值(或第二表征值)决定的。
例如,该系统参数对应的第一表征值和第二表征值分别为100和6,可以对该系统参数对应的第一表征值和第二表征值进行归一化处理,得到1和0.6。
在本说明实施例中,可以设置指定阈值,选取评分大于所述指定阈值的系统参数。其中,所述指定阈值可以是根据需要指定的,也可以是根据各系统参数分别对应的评分的大小,由大到小对各系统参数进行排序,然后由前到后选取指定数量的系统参数,将选取的最后一个系统参数的下一个系统参数对应的评分作为所述指定阈值。
被选取的系统参数会用于对系统进行异常性检测,未被选取的系统参数不会被用于对系统进行异常性检测。例如,系统共有1000个系统参数,通过本说明书实施例,从这1000个系统参数中选取了20个与系统是否异常相关性较强的系统参数,这20个系统参数可以作为系统对应的特征向量的20个维度。如此,技术人员仅需要根据这20个系统参数的历史取值确定若干特征向量,然后使用这些特征向量训练用于对系统进行异常性检测的模型。
通过图1所示的选取系统参数的方法,针对系统的每个系统参数,根据该系统参数在历史上的取值分布集中程度(第一表征值),和/或该系统参数与其他参数的相关程度(第二表征值),确定该系统参数的评分,然后选取评分大于指定阈值的系统参数,用于对系统进行异常性检测。其中,针对每个系统参数,若该系统参数在历史上的取值分布越集中,则该系统参数对应的第一表征值越大;若该系统参数与其他参数越相关,则该系统参数对应的第二表征值越大;若该系统参数对应的第一表征值和/或第二表征值越大,该系统参数对应的评分就越大。由于业务经验表明,针对每个系统参数,若该系统参数在历史上的取值分布越集中,和/或该系统参数与其他参数越相关,则该系统参数与系统是否异常的相关性就越强,因此,通过本说明书实施例,可以从全部系统参数中选取出与系统是否异常相关性较强的系统参数,排除掉与系统是否异常相关性较弱的系统参数。将选取的系统参数用于对系统的异常性检测,可以减少需要分析的系统参数的数量,有效避免维数灾难,提升异常性检测的准确性。
基于图1所示的选取系统参数的方法,本说明书实施例还对应提供了一种选取系统参数的装置,如图3所示,包括:
获取模块301,针对系统的每个系统参数,获取该系统参数的各历史取值;
第一确定模块302,根据该系统参数的各历史取值,确定该系统参数对应的参数表征值;所述参数表征值包括第一表征值和/或第二表征值;所述第一表征值用于表征该系统参数在历史上的取值分布集中程度,该系统参数在历史上的取值分布越集中,该系统参数对应的第一表征值越大;所述第二表征值用于表征该系统参数与其他参数的相关程度,该系统参数与其他参数越相关,该系统参数对应的第二表征值越大;
第二确定模块303,根据该系统参数对应的参数表征值,确定该系统参数对应的评分;所述参数表征值越大,所述评分越大;
选取模块304,选取评分大于指定阈值的系统参数,用于对所述系统进行异常性检测。
所述第一确定模块302,根据该系统参数的各历史取值,计算该系统参数的各历史取值的概率分布对应的峰度,根据计算得到的峰度,确定该系统参数对应的第一表征值;或根据该系统参数的各历史取值,计算该系统参数的各历史取值的熵,根据计算得到的熵,确定该系统参数对应的第一表征值。
所述第一确定模块302,以该系统参数的各历史取值和其他参数的历史取值为样本,训练模型;所述模型用于根据其他参数的取值预测该系统参数的取值;对训练后的回归模型进行准确性测试;根据测试结果,确定该系统参数对应的第二表征值;所述模型准确性越高,所述第二表征值越大。
所述参数表征值包括第一表征值和第二表征值;
所述第二确定模块303,根据预设的对应于第一表征值的第一权重和对应于第二表征值的第二权重,计算该系统参数对应的第一表征值和第二表征值的加权和,作为该系统参数对应的评分。
所述第二确定模块303,对该系统参数对应的第一表征值和第二表征值进行归一化处理;计算处理后的第一表征值和第二表征值的加权和,作为该系统参数对应的评分。
基于图1所示的选取系统参数的方法,本说明书实施例还对应提供了一种选取系统参数的设备,如图4所示,该设备包括一个或多个处理器及存储器,所述存储器存储有程序,并且被配置成由所述一个或多个处理器执行以下步骤:
针对系统的每个系统参数,获取该系统参数的各历史取值;
根据该系统参数的各历史取值,确定该系统参数对应的参数表征值;所述参数表征值包括第一表征值和/或第二表征值;所述第一表征值用于表征该系统参数在历史上的取值分布集中程度,该系统参数在历史上的取值分布越集中,该系统参数对应的第一表征值越大;所述第二表征值用于表征该系统参数与其他参数的相关程度,该系统参数与其他参数越相关,该系统参数对应的第二表征值越大;
根据该系统参数对应的参数表征值,确定该系统参数对应的评分;所述参数表征值越大,所述评分越大;
选取评分大于指定阈值的系统参数,用于对所述系统进行异常性检测。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于图4所示的设备而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字符系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字符助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和硬件中实现。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字符多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。

Claims (7)

1.一种选取系统参数的方法,包括:
针对系统的每个系统参数,获取该系统参数的各历史取值;
根据该系统参数的各历史取值,确定该系统参数对应的参数表征值;所述参数表征值包括第一表征值和/或第二表征值;所述第一表征值用于表征该系统参数在历史上的取值分布集中程度,该系统参数在历史上的取值分布越集中,该系统参数对应的第一表征值越大;所述第二表征值用于表征该系统参数与除该系统参数外的其他参数的相关程度,该系统参数与其他参数越相关,该系统参数对应的第二表征值越大;其中,根据该系统参数的各历史取值,确定该系统参数对应的第一表征值,具体包括:根据该系统参数的各历史取值,计算该系统参数的各历史取值的概率分布对应的峰度,根据计算得到的峰度,确定该系统参数对应的第一表征值;或根据该系统参数的各历史取值,计算该系统参数的各历史取值的熵,根据计算得到的熵,确定该系统参数对应的第一表征值;根据该系统参数的各历史取值,确定该系统参数对应的第二表征值,具体包括:以该系统参数的各历史取值和其他参数的历史取值为样本,训练模型;所述模型用于根据其他参数的取值预测该系统参数的取值;对训练后的所述模型进行准确性测试;根据测试结果,确定该系统参数对应的第二表征值;所述模型准确性越高,所述第二表征值越大;
根据该系统参数对应的参数表征值,确定该系统参数对应的评分;所述参数表征值越大,所述评分越大;
选取评分大于指定阈值的系统参数,用于对所述系统进行异常性检测。
2.如权利要求1所述的方法,所述参数表征值包括第一表征值和第二表征值;
根据该系统参数对应的参数表征值,确定该系统参数对应的评分,具体包括:
根据预设的对应于第一表征值的第一权重和对应于第二表征值的第二权重,计算该系统参数对应的第一表征值和第二表征值的加权和,作为该系统参数对应的评分。
3.如权利要求2所述的方法,在计算该系统参数对应的第一表征值和第二表征值的加权和之前,所述方法还包括:
对该系统参数对应的第一表征值和第二表征值进行归一化处理。
4.一种选取系统参数的装置,包括:
获取模块,针对系统的每个系统参数,获取该系统参数的各历史取值;
第一确定模块,根据该系统参数的各历史取值,确定该系统参数对应的参数表征值;所述参数表征值包括第一表征值和/或第二表征值;所述第一表征值用于表征该系统参数在历史上的取值分布集中程度,该系统参数在历史上的取值分布越集中,该系统参数对应的第一表征值越大;所述第二表征值用于表征该系统参数与除该系统参数外的其他参数的相关程度,该系统参数与其他参数越相关,该系统参数对应的第二表征值越大;其中,根据该系统参数的各历史取值,确定该系统参数对应的第一表征值,具体包括:根据该系统参数的各历史取值,计算该系统参数的各历史取值的概率分布对应的峰度,根据计算得到的峰度,确定该系统参数对应的第一表征值;或根据该系统参数的各历史取值,计算该系统参数的各历史取值的熵,根据计算得到的熵,确定该系统参数对应的第一表征值;根据该系统参数的各历史取值,确定该系统参数对应的第二表征值,具体包括:以该系统参数的各历史取值和其他参数的历史取值为样本,训练模型;所述模型用于根据其他参数的取值预测该系统参数的取值;对训练后的所述模型进行准确性测试;根据测试结果,确定该系统参数对应的第二表征值;所述模型准确性越高,所述第二表征值越大;
第二确定模块,根据该系统参数对应的参数表征值,确定该系统参数对应的评分;所述参数表征值越大,所述评分越大;
选取模块,选取评分大于指定阈值的系统参数,用于对所述系统进行异常性检测。
5.如权利要求4所述的装置,所述参数表征值包括第一表征值和第二表征值;
所述第二确定模块,根据预设的对应于第一表征值的第一权重和对应于第二表征值的第二权重,计算该系统参数对应的第一表征值和第二表征值的加权和,作为该系统参数对应的评分。
6.如权利要求5所述的装置,所述第二确定模块,对该系统参数对应的第一表征值和第二表征值进行归一化处理。
7.一种选取系统参数的设备,包括一个或多个处理器及存储器,所述存储器存储有程序,并且被配置成由所述一个或多个处理器执行以下步骤:
针对系统的每个系统参数,获取该系统参数的各历史取值;
根据该系统参数的各历史取值,确定该系统参数对应的参数表征值;所述参数表征值包括第一表征值和/或第二表征值;所述第一表征值用于表征该系统参数在历史上的取值分布集中程度,该系统参数在历史上的取值分布越集中,该系统参数对应的第一表征值越大;所述第二表征值用于表征该系统参数与除该系统参数外的其他参数的相关程度,该系统参数与其他参数越相关,该系统参数对应的第二表征值越大;其中,根据该系统参数的各历史取值,确定该系统参数对应的第一表征值,具体包括:根据该系统参数的各历史取值,计算该系统参数的各历史取值的概率分布对应的峰度,根据计算得到的峰度,确定该系统参数对应的第一表征值;或根据该系统参数的各历史取值,计算该系统参数的各历史取值的熵,根据计算得到的熵,确定该系统参数对应的第一表征值;根据该系统参数的各历史取值,确定该系统参数对应的第二表征值,具体包括:以该系统参数的各历史取值和其他参数的历史取值为样本,训练模型;所述模型用于根据其他参数的取值预测该系统参数的取值;对训练后的所述模型进行准确性测试;根据测试结果,确定该系统参数对应的第二表征值;所述模型准确性越高,所述第二表征值越大;
根据该系统参数对应的参数表征值,确定该系统参数对应的评分;所述参数表征值越大,所述评分越大;
选取评分大于指定阈值的系统参数,用于对所述系统进行异常性检测。
CN201810284741.5A 2018-04-02 2018-04-02 一种选取系统参数的方法、装置及设备 Active CN108762959B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810284741.5A CN108762959B (zh) 2018-04-02 2018-04-02 一种选取系统参数的方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810284741.5A CN108762959B (zh) 2018-04-02 2018-04-02 一种选取系统参数的方法、装置及设备

Publications (2)

Publication Number Publication Date
CN108762959A CN108762959A (zh) 2018-11-06
CN108762959B true CN108762959B (zh) 2021-07-06

Family

ID=63980556

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810284741.5A Active CN108762959B (zh) 2018-04-02 2018-04-02 一种选取系统参数的方法、装置及设备

Country Status (1)

Country Link
CN (1) CN108762959B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110033093B (zh) * 2019-02-19 2023-10-17 创新先进技术有限公司 超参数确定方法、装置及设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105117602A (zh) * 2015-08-28 2015-12-02 国家电网公司 一种计量装置运行状态预警方法
CN106094749A (zh) * 2016-06-17 2016-11-09 浙江大学 基于改进核熵成分分析的非线性故障检测方法及应用
CN106971240A (zh) * 2017-03-16 2017-07-21 河海大学 一种变量选择与高斯过程回归的短期负荷预测方法
CN107301243A (zh) * 2017-07-07 2017-10-27 西安电子科技大学 基于大数据平台的开关设备故障特征提取方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8677191B2 (en) * 2010-12-13 2014-03-18 Microsoft Corporation Early detection of failing computers

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105117602A (zh) * 2015-08-28 2015-12-02 国家电网公司 一种计量装置运行状态预警方法
CN106094749A (zh) * 2016-06-17 2016-11-09 浙江大学 基于改进核熵成分分析的非线性故障检测方法及应用
CN106971240A (zh) * 2017-03-16 2017-07-21 河海大学 一种变量选择与高斯过程回归的短期负荷预测方法
CN107301243A (zh) * 2017-07-07 2017-10-27 西安电子科技大学 基于大数据平台的开关设备故障特征提取方法

Also Published As

Publication number Publication date
CN108762959A (zh) 2018-11-06

Similar Documents

Publication Publication Date Title
CN108305158B (zh) 一种训练风控模型和风控的方法、装置及设备
CN109242135B (zh) 一种模型运营方法、装置、及业务服务器
CN110008080B (zh) 基于时间序列的业务指标异常检测方法、装置和电子设备
CN110472802B (zh) 一种数据特征评估方法、装置及设备
CN108596410B (zh) 一种风控事件自动处理方法及装置
CN109711440B (zh) 一种数据异常检测方法和装置
CN108573355B (zh) 模型更新后替换运行的方法、装置、及业务服务器
CN109242519B (zh) 一种异常行为识别方法、装置和设备
CN109062782B (zh) 一种回归测试用例的选择方法、装置及设备
CN110245475B (zh) 身份验证方法和装置
CN111783867A (zh) 机器学习算法选择方法及装置
CN112035341A (zh) 一种自动化测试方法及装置
CN111506731B (zh) 一种训练字段分类模型的方法、装置及设备
CN108762959B (zh) 一种选取系统参数的方法、装置及设备
US7844932B2 (en) Method to identify timing violations outside of manufacturing specification limits
CN116166967B (zh) 基于元学习与残差网络的数据处理方法、设备和存储介质
CN110188793B (zh) 数据异常分析方法及装置
CN115567371B (zh) 一种异常检测方法、装置、设备及可读存储介质
US10853538B2 (en) Model generation system and model generation method
CN109829051B (zh) 一种数据库相似语句筛选的方法和装置
CN111368837B (zh) 一种图像质量评价方法、装置、电子设备及存储介质
CN108985379B (zh) 分类器的性能评估方法、装置和计算机可读存储介质
CN111898626B (zh) 模型确定方法、装置和电子设备
CN115456801A (zh) 个人信用的人工智能大数据风控系统、方法和存储介质
CN110032624B (zh) 一种样本筛选方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20201021

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20201021

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant