CN113554090A - 一种基于机器学习的银行设备故障预警方法及系统 - Google Patents

一种基于机器学习的银行设备故障预警方法及系统 Download PDF

Info

Publication number
CN113554090A
CN113554090A CN202110833583.6A CN202110833583A CN113554090A CN 113554090 A CN113554090 A CN 113554090A CN 202110833583 A CN202110833583 A CN 202110833583A CN 113554090 A CN113554090 A CN 113554090A
Authority
CN
China
Prior art keywords
information
obtaining
unit
training model
instruction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110833583.6A
Other languages
English (en)
Inventor
刘英杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Citic Bank Corp Ltd
Original Assignee
China Citic Bank Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Citic Bank Corp Ltd filed Critical China Citic Bank Corp Ltd
Priority to CN202110833583.6A priority Critical patent/CN113554090A/zh
Publication of CN113554090A publication Critical patent/CN113554090A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Evolutionary Biology (AREA)
  • Software Systems (AREA)
  • Marketing (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Strategic Management (AREA)
  • Probability & Statistics with Applications (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Technology Law (AREA)
  • Medical Informatics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明公开了一种基于机器学习的银行设备故障预警方法及系统,获得第一训练模型信息,获得来自第一银行设备信息的第一样本数据,采用SVM和朴素贝叶斯算法,对第一训练模型进行训练;获得第一原始数据信息;将所述第一原始数据信息输入至训练完成后的所述第一训练模型中,获得输出信息;获得第一特征信息;获得第二分类结果信息;根据所述第二分类结果信息,需要发出第一警告指令,则将第一警告指令通过告警接口发送给人工核查单元,获得人工排查的第一核查结果;根据第一核查结果、第一预测分类结果,对所述第一训练模型进行调整。解决了现有技术中存在对于银行的可能出现的异常不能或不能准确的进行主动预警,进而影响运维效率的技术问题。

Description

一种基于机器学习的银行设备故障预警方法及系统
技术领域
本发明涉及银行设备故障预警相关领域,尤其涉及一种基于机器学习的银行设备故障预警方法及系统。
背景技术
在银行系统中,设备的异常警报对于异常控制起着至关重要的作用。目前银行设备及软件系统的告警,主要有两种方式:(1)监测系统异常日志,若系统捕获到异常触发短信或者邮件告警;(2)对于无法捕获到的异常或者硬件设备故障,以来人为主动发现。
但本申请发明人在实现本申请实施例中发明技术方案的过程中,发现上述技术至少存在如下技术问题:
现有技术中存在对于银行的可能出现的异常不能或不能准确进行主动预警,进而影响运维效率的技术问题。
发明内容
本申请实施例通过提供一种基于机器学习的银行设备故障预警方法及系统,解决了现有技术中存在对于银行的可能出现的异常不能或不能准确的进行主动预警,进而影响运维效率的技术问题,达到对可能出现的异常进行主动准确的预警,降低故障对系统的影响,达到提高运维效率的技术效果。
鉴于上述问题,提出了本申请实施例提供一种基于机器学习的银行设备故障预警方法及系统。
第一方面,本申请实施例提供了一种基于机器学习的银行设备故障预警方法,所述方法应用于一风险评估系统,且所述系统包括模型训练单元、原始数据监测单元、特征工程单元、分类算法单元、预警单元、人工核查单元,其中,所述方法包括:获得第一训练模型信息,其中,所述第一训练模型为二分类预测模型;获得来自第一银行设备信息的第一样本数据,其中,所述第一样本数据包括负样本数据和正样本数据;根据所述第一样本数据,采用SVM和朴素贝叶斯算法,对所述第一训练模型进行训练;通过所述原始数据监测单元,获得第一原始数据信息;将所述第一原始数据信息输入至训练完成后的所述第一训练模型中,获得所述第一训练模型的输出信息,其中,所述输出信息为第一预测分类结果信息;根据所述第一原始数据信息,通过所述特征工程单元,获得第一特征信息;根据所述第一特征信息,获得第二分类结果信息;根据所述第二分类结果信息,确定是否发出第一警告指令;如果需要发出第一警告指令,则将所述第一警告指令通过告警接口发送给所述人工核查单元,以使管理员在接收到所述第一警告指令之后进行人工排查;获得所述人工排查的第一核查结果;根据所述第一核查结果、所述第一预测分类结果,对所述第一训练模型进行调整。
另一方面,本申请还提供了一种基于机器学习的银行设备故障预警系统,所述系统包括:第一获得单元,所述第一获得单元用于获得第一训练模型信息,其中,所述第一训练模型为二分类预测模型;第二获得单元,所述第二获得单元用于获得来自第一银行设备信息的第一样本数据,其中,所述第一样本数据包括负样本数据和正样本数据;第一训练单元,所述第一训练单元用于根据所述第一样本数据,采用SVM和朴素贝叶斯算法,对所述第一训练模型进行训练;第三获得单元,所述第三获得单元用于通过原始数据监测单元,获得第一原始数据信息;第一输入单元,所述第一输入单元用于将所述第一原始数据信息输入至训练完成后的所述第一训练模型中,获得所述第一训练模型的输出信息,其中,所述输出信息为第一预测分类结果信息;第四获得单元,所述第四获得单元用于根据所述第一原始数据信息,通过特征工程单元,获得第一特征信息;第五获得单元,所述第五获得单元用于根据所述第一特征信息,获得第二分类结果信息;第一确定单元,所述第一确定单元用于根据所述第二分类结果信息,确定是否发出第一警告指令;第六获得单元,所述第六获得单元用于如果需要发出第一警告指令,则将所述第一警告指令通过告警接口发送给人工核查单元,以使管理员在接收到所述第一警告指令之后进行人工排查;第七获得单元,所述第七获得单元用于获得所述人工排查的第一核查结果;第一调整单元,所述第一调整单元用于根据所述第一核查结果、所述第一预测分类结果,对所述第一训练模型进行调整。
第三方面,本发明提供了一种基于机器学习的银行设备故障预警系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现第一方面所述方法的步骤。
本申请实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
由于采用了根据第一样本数据,采用SVM和朴素贝叶斯算法对第一训练模型进行训练,将第一原始数据输入所述第一训练模型,获得所述第一训练模型的输出信息,将所述第一原始数据通过特征工程单元获得第二分类结果信息,根据所述第二分类结果信息判断是否进行人工排查,根据所述人工排查结果对所述第一训练模型进行调整,进而获得更加准确的第一训练模型处理所述输入数据,达到对可能出现的异常进行主动准确的预警,降低故障对系统的影响,达到提高运维效率的技术效果。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
图1为本申请实施例一种基于机器学习的银行设备故障预警方法的流程示意图;
图2为本申请实施例一种基于机器学习的银行设备故障预警系统的结构示意图;
图3为本申请实施例示例性电子设备的结构示意图。
附图标记说明:第一获得单元11,第二获得单元12,第一训练单元13,第三获得单元14,第一输入单元15,第四获得单元16,第五获得单元17,第一确定单元18,第六获得单元19,第七获得单元20,第一调整单元21,总线300,接收器301,处理器302,发送器303,存储器304,总线接口306。
具体实施方式
本申请实施例通过提供一种基于机器学习的银行设备故障预警方法及系统,解决了现有技术中存在对于银行的可能出现的异常不能或不能准确的进行主动预警,进而影响运维效率的技术问题,达到对可能出现的异常进行主动准确的预警,降低故障对系统的影响,达到提高运维效率的技术效果。下面,将参考附图详细的描述根据本申请的示例实施例。显然,所描述的实施例仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
申请概述
在银行系统中,设备的异常警报对于异常控制起着至关重要的作用。目前银行设备及软件系统的告警,主要有两种方式:(1)监测系统异常日志,若系统捕获到异常触发短信或者邮件告警;(2)对于无法捕获到的异常或者硬件设备故障,以来人为主动发现。但现有技术中存在对于银行的可能出现的异常不能或不能准确进行主动预警,进而影响运维效率的技术问题。
针对上述技术问题,本申请提供的技术方案总体思路如下:
本申请实施例提供了一种基于机器学习的银行设备故障预警方法,所述方法应用于一风险评估系统,且所述系统包括模型训练单元、原始数据监测单元、特征工程单元、分类算法单元、预警单元、人工核查单元,其中,所述方法包括:获得第一训练模型信息,其中,所述第一训练模型为二分类预测模型;获得来自第一银行设备信息的第一样本数据,其中,所述第一样本数据包括负样本数据和正样本数据;根据所述第一样本数据,采用SVM和朴素贝叶斯算法,对所述第一训练模型进行训练;通过所述原始数据监测单元,获得第一原始数据信息;将所述第一原始数据信息输入至训练完成后的所述第一训练模型中,获得所述第一训练模型的输出信息,其中,所述输出信息为第一预测分类结果信息;根据所述第一原始数据信息,通过所述特征工程单元,获得第一特征信息;根据所述第一特征信息,获得第二分类结果信息;根据所述第二分类结果信息,确定是否发出第一警告指令;如果需要发出第一警告指令,则将所述第一警告指令通过告警接口发送给所述人工核查单元,以使管理员在接收到所述第一警告指令之后进行人工排查;获得所述人工排查的第一核查结果;根据所述第一核查结果、所述第一预测分类结果,对所述第一训练模型进行调整。
在介绍了本申请基本原理后,下面将结合说明书附图来具体介绍本申请的各种非限制性的实施方式。
实施例一
如图1所示,本申请实施例提供了一种基于机器学习的银行设备故障预警方法,所述方法应用于一风险评估系统,且所述系统包括模型训练单元、原始数据监测单元、特征工程单元、分类算法单元、预警单元、人工核查单元,其中,所述方法包括:
步骤S100:获得第一训练模型信息,其中,所述第一训练模型为二分类预测模型;
具体而言,所述第一训练模型为可以不断的进行监督训练而进行修正处理的模型,所述第一训练模型为二分类预测模型。所述二分类预测模型是基于混淆矩阵进行机器学习的预测模型,可以获得更加准确的预测结果。所述第一训练模型是使用SVM结合朴素贝叶斯算法进行二分类预测模型训练获得的。
步骤S200:获得来自第一银行设备信息的第一样本数据,其中,所述第一样本数据包括负样本数据和正样本数据;
具体而言,所述负样本数据为银行各大系统报错日志,举例而言,可以是异常发生之前10小时内的日志,正样本数据为系统或设备正常运行期间的日志。
步骤S300:根据所述第一样本数据,采用SVM和朴素贝叶斯算法,对所述第一训练模型进行训练;
具体而言,通过上述第一样本数据,使用SVM结合朴素贝叶斯算法进行二分类预测模型训练,根据以上两种算法特性:SVM用于少量样本时的预测;朴素贝叶斯用于样本量较大时的预测,通过SVM和朴素贝叶斯算法结合使用,达到以提高模型分类的准确性的技术效果,为后续进行设备故障准确的预测夯实了基础。
步骤S400:通过所述原始数据监测单元,获得第一原始数据信息;
具体而言,所述原始数据监测单元为进行日志监测,获得原始数据的单元,从所述监测的日志,获得第一原始数据信息。
步骤S500:将所述第一原始数据信息输入至训练完成后的所述第一训练模型中,获得所述第一训练模型的输出信息,其中,所述输出信息为第一预测分类结果信息;
具体而言,将所述第一原始数据信息输入所述经过样本数据训练而后获得的第一训练模型中,获得所述第一训练模型的输出结果,所述输出结果包括所述第一训练模型对于第一原始数据信息进行预测后的分类结果,即第一预测分类结果信息。
步骤S600:根据所述第一原始数据信息,通过所述特征工程单元,获得第一特征信息;
步骤S700:根据所述第一特征信息,获得第二分类结果信息;
具体而言,所述特征工程单元为进行特征比对筛选的单元,所述筛选过程具体为先进行数据清洗、向量化、缺失值补充、删除影响因子小的特征过程,用完全搜索、启发式搜索、随机算法三种方式筛选出高影响力的特征,为下一步分类的工作做准备。所述根据第一特征信息获得第二分类结果,包括将所述特征信息输入分类算法单元,采用两种分类算法,对所述特征进行分析,获得第二分类结果信息。
步骤S800:根据所述第二分类结果信息,确定是否发出第一警告指令;
步骤S900:如果需要发出第一警告指令,则将所述第一警告指令通过告警接口发送给所述人工核查单元,以使管理员在接收到所述第一警告指令之后进行人工排查;
具体而言,根据所述进行特征比分析后的输出结果,即所述第二分类结果信息,判断所述第二分类结果是否需要发出第一警告指令,当所述第二分类结果为所述第一原始数据信息存在异常可能时,获得第一警告指令,根据所述第一警告指令,通过告警接口发送给所述人工核查单元,通过预警单元可发出警告指令,此预警单元主要用于在系统预测出异常后,发送告警功能,一般银行都有自己的短信、邮件等告警接口,配置对应的告警内容后直接调用。所述人工核查单元为根据所述警告指令对所述第一原始数据的特征信息进行人工排查的单元,来核查计算结果的准确性。
步骤S1000:获得所述人工排查的第一核查结果;
步骤S1100:根据所述第一核查结果、所述第一预测分类结果,对所述第一训练模型进行调整。
具体而言,所述根据第一核查结果、所述第一预测分类结果,对所述第一训练模型进行调整,具体包括,收到告警预测的异常后,及时进行人工排查,计算核查结果的准确率、召回率,最终计算F1-Score表示综合准确程度,根据F1-Score结果对训练的模型进行重新训练(微调):(1)如果准确度达标,说明训练模型的各个权重准确,此时只需增加训练数据即可;(2)如果准确度不达标,此时需要根据预测的偏差对模型训练参数作出微调,重新对所述第一训练模型进行训练,最终获得更加准确的第一训练模型来进行原始数据的预测,对可能出现的异常进行主动准确的预警,降低故障对系统的影响,达到提高运维效率的技术效果。
进一步而言,所述获得来自第一银行设备信息的第一样本数据,本申请实施例步骤S200还包括:
步骤S210:获得第一预设时间段;
步骤S220:根据所述第一预设时间段,获得第一异常事件信息;
步骤S230:根据所述第一异常事件信息,获得第二预设时间段,其中,所述第二预设时间段处于所述第一异常事件发生之前;
步骤S240:根据所述第二预设时间段,获得所述负样本数据;
步骤S250:获得第三预设时间段;
步骤S260:根据所述第三预设时间段,获得所述正样本数据;
步骤S270:根据所述负样本数据、所述正样本数据,获得所述第一样本数据。
具体而言,为保证二分类模型的训练准确性,所述训练的样本数据需基于混淆矩阵进行,此时对于训练的样本数据就有了一定的需求,即包含正样本数据和负样本数据。通过时间对所述数据进行分段,获得第一预设时间段内的第一异常事件信息,获得第一异常事件信息发生前的第二预设时间段,获得此时时间段的数据作为负样本数据,获得第三预定时间段,所述第三预设时间段为一切正常的时间段,即所述第三时间段不与上述存在异常事件的时间段相邻,将所述第三时间段的数据作为正样本数据,将所述正样本数据和所述负样本数据进行整合,获得第一样本数据。
进一步而言,所述根据所述第一原始数据信息,通过所述特征工程单元,获得第一特征信息,本申请实施例步骤S600还包括:
步骤S610:获得第一清洗指令;
步骤S620:根据所述第一清洗指令,对所述第一原始数据进行清洗之后,获得第一有效数据;
步骤S630:获得第一处理指令;
步骤S640:根据所述第一处理指令,对所述第一有效数据进行向量化处理。
具体而言,所述获得第一数据清洗指令,对所述第一原始数据进行清洗,实际上是在采集到的数据中,对数据的完整性和是否有效进行判断,当所述采集数据中存在不完整,即缺损数据时,对所述缺损数据进行删除,如检测到无效数据,同样根据所述第一数据清洗指令,对所述无效数据进行删除处理。通过对所述第一数据进行数据清洗,达到保证数据的完整性和可靠性的技术效果,将所述进行数据清洗后的第一有效数据根据所述第一处理指令进行向量化处理,筛选出高影响力的特征,为后续准确判断数据夯实了基础。
进一步而言,本申请实施例还包括:
步骤S650:根据所述第一银行设备信息,获得第一影响因子信息,其中,所述第一影响因子信息与所述第一银行设备之间具有第一影响度;
步骤S660:获得第二处理指令;
步骤S670:根据所述第二处理指令,对所述向量化处理之后的所述第一有效数据进行缺失值补充,以补充所述第一影响因子信息的缺失值。
具体而言,根据所述第一银行设备信息,获得与所述第一设备具有第一影响度的影响因子信息,根据所述影响因子信息,获得第二处理指令,根据所述第二处理指令对所述第一有效数据进行判断,判断所述第一有效数据是否存在影响因子缺失的情况,当存在时,对所述第一有效数据进行缺失值的补充,以补充所述第一影响因子信息的缺失值,获得更加完整的第一有效数据,为后续对所述数据进行进一步的判断奠定了基础。
进一步而言,本申请实施例还包括:
步骤S671:获得所述缺失值补充之后的所述第一有效数据中的第二影响因子信息;
步骤S672:获得第一预设影响阈值信息;
步骤S673:获得第一删除指令;
步骤S674:根据所述第一删除指令,对所述第二影响因子信息中不满足所述第一预设影响阈值信息的影响因子进行删除;
步骤S675:获得第二预设影响阈值信息;
步骤S676:获得第一筛选指令;
步骤S677:根据所述第一筛选指令,采用完全搜索、启发式搜索、随机算法方式,对所述删除影响因子之后的所述第二影响因子信息中满足所述第二预设影响阈值信息的影响因子进行筛选,获得所述第一特征信息。
具体而言,所述影响因子的影响度的判别是根据所述第一预设影响阈值信息进行的,进一步而言,先设定所述第一预设影响阈值信息,根据所述第一预设影响阈值信息对所述不满足阈值的影响因子进行删除处理,即为删除影响因子小的特征过程,根据所述进行过删除处理的影响因子,获得第二预设影响阈值信息,根据所述第二预设影响阈值信息,获得第一筛选指令,根据所述第一筛选指令,采用完全搜索、启发式搜索、随机算法方式,对所述删除影响因子之后的所述第二影响因子信息中满足所述第二预设影响阈值信息的影响因子进行筛选,获得所述第一特征信息,从而通过完全搜索、启发式搜索、随机算法三种方式筛选出高影响力的特征,为下一步分类的工作做准备。通过上述对于所述影响因子阈值的设定,基于所述第一预设影响阈值信息、第二预设影响阈值信息对所述影响因子进行删除和筛选,达到获得更加准确,对数据的异变影响度更大的特征,为后续数据分析奠定了基础。
进一步而言,所述根据所述第一核查结果、所述第一预测分类结果,对所述第一训练模型进行调整,本申请实施例步骤S1100还包括:
步骤S1110:根据所述第一核查结果、所述第一预测分类结果,获得所述第一核查结果的第一准确率和第一召回率;
步骤S1120:根据所述第一准确率和第一召回率,计算得到F1-Score值;
步骤S1130:获得预设准确度阈值信息;
步骤S1140:判断所述F1-Score值是否满足所述预设准确度阈值信息;
步骤S1150:如果所述F1-Score值满足所述预设准确度阈值信息,则将所述第一原始数据信息添加至所述第一训练模型中,对所述第一训练模型进行调整。
进一步而言,本申请实施例还包括:
步骤S1160:如果所述F1-Score值不满足所述预设准确度阈值信息,则获得第一偏差信息;
步骤S1170:根据所述第一偏差信息,获得第一修正指令;
步骤S1180:根据所述第一修正指令、第一偏差信息,对所述第一训练模型进行调整和训练。
具体而言,根据所述第一核查结果、所述第一预测分类结果,获得所述第一核查结果的第一准确率和第一召回率,根据所述第一准确率和第一召回率,最终计算F1-Score表示综合准确程度,根据F1-Score结果对训练的模型进行重新训练(微调)。详细而言,获得预设准确度阈值信息,判断所述F1-Score值是否满足所述预设准确度阈值信息,当所述F1-Score值满足所述预设准确度阈值信息,表明所述基于所述第一样本数据通过SVM和朴素贝叶斯算法训练获得的训练模型在针对第一原始数据处理时准确,此时,将所述第一原始数据信息作为样本数据,继续训练所述第一训练模型,使得所述第一训练模型可以进行更加准确的分析判断;如果所述F1-Score值不满足所述预设准确度阈值信息,则获得第一偏差信息,根据所述第一偏差信息,获得第一修正指令,根据所述第一修正指令,对所述第一训练模型进行调整处理,以保证所述第一训练模型对于输入数据处理的准确性,进而达到对可能出现的异常进行主动准确的预警,降低故障对系统的影响,达到提高运维效率的技术效果。
综上所述,本申请实施例所提供的一种基于机器学习的银行设备故障预警方法及系统具有如下技术效果:
1、由于采用了根据第一样本数据,采用SVM和朴素贝叶斯算法对第一训练模型进行训练,将第一原始数据输入所述第一训练模型,获得所述第一训练模型的输出信息,将所述第一原始数据通过特征工程单元获得第二分类结果信息,根据所述第二分类结果信息判断是否进行人工排查,根据所述人工排查结果对所述第一训练模型进行调整,进而获得更加准确的第一训练模型处理所述输入数据,达到对可能出现的异常进行主动准确的预警,降低故障对系统的影响,达到提高运维效率的技术效果。
2、由于采用了通过对所述第一数据进行数据清洗的方式,达到保证数据的完整性和可靠性的技术效果,将所述进行数据清洗后的第一有效数据根据所述第一处理指令进行向量化处理,筛选出高影响力的特征,为后续准确判断数据夯实了基础。
3、由于采用了基于F1-Score值进行判断,对所述第一训练模型进行调整处理的方式,达到保证所述第一训练模型对于输入数据处理的准确性,进而达到对可能出现的异常进行主动准确的预警,降低故障对系统的影响,达到提高运维效率的技术效果。
实施例二
基于与前述实施例中一种基于机器学习的银行设备故障预警方法同样发明构思,本发明还提供了一种基于机器学习的银行设备故障预警系统,如图2所示,所述系统包括:
第一获得单元11,所述第一获得单元11用于获得第一训练模型信息,其中,所述第一训练模型为二分类预测模型;
第二获得单元12,所述第二获得单元12用于获得来自第一银行设备信息的第一样本数据,其中,所述第一样本数据包括负样本数据和正样本数据;
第一训练单元13,所述第一训练单元13用于根据所述第一样本数据,采用SVM和朴素贝叶斯算法,对所述第一训练模型进行训练;
第三获得单元14,所述第三获得单元14用于通过原始数据监测单元,获得第一原始数据信息;
第一输入单元15,所述第一输入单元15用于将所述第一原始数据信息输入至训练完成后的所述第一训练模型中,获得所述第一训练模型的输出信息,其中,所述输出信息为第一预测分类结果信息;
第四获得单元16,所述第四获得单元16用于根据所述第一原始数据信息,通过特征工程单元,获得第一特征信息;
第五获得单元17,所述第五获得单元17用于根据所述第一特征信息,获得第二分类结果信息;
第一确定单元18,所述第一确定单元18用于根据所述第二分类结果信息,确定是否发出第一警告指令;
第六获得单元19,所述第六获得单元19用于如果需要发出第一警告指令,则将所述第一警告指令通过告警接口发送给人工核查单元,以使管理员在接收到所述第一警告指令之后进行人工排查;
第七获得单元20,所述第七获得单元20用于获得所述人工排查的第一核查结果;
第一调整单元21,所述第一调整单元21用于根据所述第一核查结果、所述第一预测分类结果,对所述第一训练模型进行调整。
进一步的,所述系统还包括:
第八获得单元,所述第八获得单元用于获得第一预设时间段;
第九获得单元,所述第九获得单元用于根据所述第一预设时间段,获得第一异常事件信息;
第十获得单元,所述第十获得单元用于根据所述第一异常事件信息,获得第二预设时间段,其中,所述第二预设时间段处于所述第一异常事件发生之前;
第十一获得单元,所述第十一获得单元用于根据所述第二预设时间段,获得所述负样本数据;
第十二获得单元,所述第十二获得单元用于获得第三预设时间段;
第十三获得单元,所述第十三获得单元用于根据所述第三预设时间段,获得所述正样本数据;
第十四获得单元,所述第十四获得单元用于根据所述负样本数据、所述正样本数据,获得所述第一样本数据。
进一步的,所述系统还包括:
第十五获得单元,所述第十五获得单元用于获得第一清洗指令;
第十六获得单元,所述第十六获得单元用于根据所述第一清洗指令,对所述第一原始数据进行清洗之后,获得第一有效数据;
第十七获得单元,所述第十七获得单元用于获得第一处理指令;
第一处理单元,所述第一处理单元用于根据所述第一处理指令,对所述第一有效数据进行向量化处理。
进一步的,所述系统还包括:
第十八获得单元,所述第十八获得单元用于根据所述第一银行设备信息,获得第一影响因子信息,其中,所述第一影响因子信息与所述第一银行设备之间具有第一影响度;
第十九获得单元,所述第十九获得单元用于获得第二处理指令;
第一补充单元,所述第一补充单元用于根据所述第二处理指令,对所述向量化处理之后的所述第一有效数据进行缺失值补充,以补充所述第一影响因子信息的缺失值。
进一步的,所述系统还包括:
第二十获得单元,所述第二十获得单元用于获得所述缺失值补充之后的所述第一有效数据中的第二影响因子信息;
第二十一获得单元,所述第二十一获得单元用于获得第一预设影响阈值信息;
第二十二获得单元,所述第二十二获得单元用于获得第一删除指令;
第一删除单元,所述第一删除单元用于根据所述第一删除指令,对所述第二影响因子信息中不满足所述第一预设影响阈值信息的影响因子进行删除;
第二十三获得单元,所述第二十三获得单元用于获得第二预设影响阈值信息;
第二十四获得单元,所述第二十四获得单元用于获得第一筛选指令;
第二十五获得单元,所述第二十五获得单元用于根据所述第一筛选指令,采用完全搜索、启发式搜索、随机算法方式,对所述删除影响因子之后的所述第二影响因子信息中满足所述第二预设影响阈值信息的影响因子进行筛选,获得所述第一特征信息。
进一步的,所述系统还包括:
第二十六获得单元,所述第二十六获得单元用于根据所述第一核查结果、所述第一预测分类结果,获得所述第一核查结果的第一准确率和第一召回率;
第二十七获得单元,所述第二十七获得单元用于根据所述第一准确率和第一召回率,计算得到F1-Score值;
第二十八获得单元,所述第二十八获得单元用于获得预设准确度阈值信息;
第一判断单元,所述第一判断单元用于判断所述F1-Score值是否满足所述预设准确度阈值信息;
第二调整单元,所述第二调整单元用于如果所述F1-Score值满足所述预设准确度阈值信息,则将所述第一原始数据信息添加至所述第一训练模型中,对所述第一训练模型进行调整。
进一步的,所述系统还包括:
第二十九获得单元,所述第二十九获得单元用于如果所述F1-Score值不满足所述预设准确度阈值信息,则获得第一偏差信息;
第三十获得单元,所述第三十获得单元用于根据所述第一偏差信息,获得第一修正指令;
第三调整单元,所述第三调整单元用于根据所述第一修正指令、第一偏差信息,对所述第一训练模型进行调整和训练。
前述图1实施例一中的一种基于机器学习的银行设备故障预警方法的各种变化方式和具体实例同样适用于本实施例的一种基于机器学习的银行设备故障预警系统,通过前述对一种基于机器学习的银行设备故障预警方法的详细描述,本领域技术人员可以清楚的知道本实施例中一种基于机器学习的银行设备故障预警系统的实施方法,所以为了说明书的简洁,在此不再详述。
示例性电子设备
下面参考图3来描述本申请实施例的电子设备。
图3图示了根据本申请实施例的电子设备的结构示意图。
基于与前述实施例中一种基于机器学习的银行设备故障预警方法的发明构思,本发明还提供一种基于机器学习的银行设备故障预警系统,其上存储有计算机程序,该程序被处理器执行时实现前文所述一种基于机器学习的银行设备故障预警方法的任一方法的步骤。
其中,在图3中,总线架构(用总线300来代表),总线300可以包括任意数量的互联的总线和桥,总线300将包括由处理器302代表的一个或多个处理器和存储器304代表的存储器的各种电路链接在一起。总线300还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口306在总线300和接收器301和发送器303之间提供接口。接收器301和发送器303可以是同一个元件,即收发机,提供用于在传输介质上与各种其他系统通信的单元。
处理器302负责管理总线300和通常的处理,而存储器304可以被用于存储处理器302在执行操作时所使用的数据。
本发明实施例提供的一种基于机器学习的银行设备故障预警方法,所述方法应用于一风险评估系统,且所述系统包括模型训练单元、原始数据监测单元、特征工程单元、分类算法单元、预警单元、人工核查单元,其中,所述方法包括:获得第一训练模型信息,其中,所述第一训练模型为二分类预测模型;获得来自第一银行设备信息的第一样本数据,其中,所述第一样本数据包括负样本数据和正样本数据;根据所述第一样本数据,采用SVM和朴素贝叶斯算法,对所述第一训练模型进行训练;通过所述原始数据监测单元,获得第一原始数据信息;将所述第一原始数据信息输入至训练完成后的所述第一训练模型中,获得所述第一训练模型的输出信息,其中,所述输出信息为第一预测分类结果信息;根据所述第一原始数据信息,通过所述特征工程单元,获得第一特征信息;根据所述第一特征信息,获得第二分类结果信息;根据所述第二分类结果信息,确定是否发出第一警告指令;如果需要发出第一警告指令,则将所述第一警告指令通过告警接口发送给所述人工核查单元,以使管理员在接收到所述第一警告指令之后进行人工排查;获得所述人工排查的第一核查结果;根据所述第一核查结果、所述第一预测分类结果,对所述第一训练模型进行调整。解决了现有技术中存在对于银行的可能出现的异常不能或不能准确的进行主动预警,进而影响运维效率的技术问题,达到对可能出现的异常进行主动准确的预警,降低故障对系统的影响,达到提高运维效率的技术效果。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的系统。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令系统的制造品,该指令系统实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (9)

1.一种基于机器学习的银行设备故障预警方法,所述方法应用于一风险评估系统,且所述系统包括模型训练单元、原始数据监测单元、特征工程单元、分类算法单元、预警单元、人工核查单元,其中,所述方法包括:
获得第一训练模型信息,其中,所述第一训练模型为二分类预测模型;
获得来自第一银行设备信息的第一样本数据,其中,所述第一样本数据包括负样本数据和正样本数据;
根据所述第一样本数据,采用SVM和朴素贝叶斯算法,对所述第一训练模型进行训练;
通过所述原始数据监测单元,获得第一原始数据信息;
将所述第一原始数据信息输入至训练完成后的所述第一训练模型中,获得所述第一训练模型的输出信息,其中,所述输出信息为第一预测分类结果信息;
根据所述第一原始数据信息,通过所述特征工程单元,获得第一特征信息;
根据所述第一特征信息,获得第二分类结果信息;
根据所述第二分类结果信息,确定是否发出第一警告指令;
如果需要发出第一警告指令,则将所述第一警告指令通过告警接口发送给所述人工核查单元,以使管理员在接收到所述第一警告指令之后进行人工排查;
获得所述人工排查的第一核查结果;
根据所述第一核查结果、所述第一预测分类结果,对所述第一训练模型进行调整。
2.如权利要求1所述的方法,其中,所述获得来自第一银行设备信息的第一样本数据,包括:
获得第一预设时间段;
根据所述第一预设时间段,获得第一异常事件信息;
根据所述第一异常事件信息,获得第二预设时间段,其中,所述第二预设时间段处于所述第一异常事件发生之前;
根据所述第二预设时间段,获得所述负样本数据;
获得第三预设时间段;
根据所述第三预设时间段,获得所述正样本数据;
根据所述负样本数据、所述正样本数据,获得所述第一样本数据。
3.如权利要求1所述的方法,其中,所述根据所述第一原始数据信息,通过所述特征工程单元,获得第一特征信息,包括:
获得第一清洗指令;
根据所述第一清洗指令,对所述第一原始数据进行清洗之后,获得第一有效数据;
获得第一处理指令;
根据所述第一处理指令,对所述第一有效数据进行向量化处理。
4.如权利要求3所述的方法,其中,所述方法还包括:
根据所述第一银行设备信息,获得第一影响因子信息,其中,所述第一影响因子信息与所述第一银行设备之间具有第一影响度;
获得第二处理指令;
根据所述第二处理指令,对所述向量化处理之后的所述第一有效数据进行缺失值补充,以补充所述第一影响因子信息的缺失值。
5.如权利要求4所述的方法,其中,所述方法还包括:
获得所述缺失值补充之后的所述第一有效数据中的第二影响因子信息;
获得第一预设影响阈值信息;
获得第一删除指令;
根据所述第一删除指令,对所述第二影响因子信息中不满足所述第一预设影响阈值信息的影响因子进行删除;
获得第二预设影响阈值信息;
获得第一筛选指令;
根据所述第一筛选指令,采用完全搜索、启发式搜索、随机算法方式,对所述删除影响因子之后的所述第二影响因子信息中满足所述第二预设影响阈值信息的影响因子进行筛选,获得所述第一特征信息。
6.如权利要求1所述的方法,其中,所述根据所述第一核查结果、所述第一预测分类结果,对所述第一训练模型进行调整,包括:
根据所述第一核查结果、所述第一预测分类结果,获得所述第一核查结果的第一准确率和第一召回率;
根据所述第一准确率和第一召回率,计算得到F1-Score值;
获得预设准确度阈值信息;
判断所述F1-Score值是否满足所述预设准确度阈值信息;
如果所述F1-Score值满足所述预设准确度阈值信息,则将所述第一原始数据信息添加至所述第一训练模型中,对所述第一训练模型进行调整。
7.如权利要求6所述的方法,其中,所述方法还包括:
如果所述F1-Score值不满足所述预设准确度阈值信息,则获得第一偏差信息;
根据所述第一偏差信息,获得第一修正指令;
根据所述第一修正指令、第一偏差信息,对所述第一训练模型进行调整和训练。
8.一种基于机器学习的银行设备故障预警系统,其中,所述系统包括:
第一获得单元,所述第一获得单元用于获得第一训练模型信息,其中,所述第一训练模型为二分类预测模型;
第二获得单元,所述第二获得单元用于获得来自第一银行设备信息的第一样本数据,其中,所述第一样本数据包括负样本数据和正样本数据;
第一训练单元,所述第一训练单元用于根据所述第一样本数据,采用SVM和朴素贝叶斯算法,对所述第一训练模型进行训练;
第三获得单元,所述第三获得单元用于通过原始数据监测单元,获得第一原始数据信息;
第一输入单元,所述第一输入单元用于将所述第一原始数据信息输入至训练完成后的所述第一训练模型中,获得所述第一训练模型的输出信息,其中,所述输出信息为第一预测分类结果信息;
第四获得单元,所述第四获得单元用于根据所述第一原始数据信息,通过特征工程单元,获得第一特征信息;
第五获得单元,所述第五获得单元用于根据所述第一特征信息,获得第二分类结果信息;
第一确定单元,所述第一确定单元用于根据所述第二分类结果信息,确定是否发出第一警告指令;
第六获得单元,所述第六获得单元用于如果需要发出第一警告指令,则将所述第一警告指令通过告警接口发送给人工核查单元,以使管理员在接收到所述第一警告指令之后进行人工排查;
第七获得单元,所述第七获得单元用于获得所述人工排查的第一核查结果;
第一调整单元,所述第一调整单元用于根据所述第一核查结果、所述第一预测分类结果,对所述第一训练模型进行调整。
9.一种基于机器学习的银行设备故障预警系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现权利要求1-7任一项所述方法的步骤。
CN202110833583.6A 2021-07-23 2021-07-23 一种基于机器学习的银行设备故障预警方法及系统 Pending CN113554090A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110833583.6A CN113554090A (zh) 2021-07-23 2021-07-23 一种基于机器学习的银行设备故障预警方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110833583.6A CN113554090A (zh) 2021-07-23 2021-07-23 一种基于机器学习的银行设备故障预警方法及系统

Publications (1)

Publication Number Publication Date
CN113554090A true CN113554090A (zh) 2021-10-26

Family

ID=78132552

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110833583.6A Pending CN113554090A (zh) 2021-07-23 2021-07-23 一种基于机器学习的银行设备故障预警方法及系统

Country Status (1)

Country Link
CN (1) CN113554090A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117290801A (zh) * 2023-11-27 2023-12-26 浪潮软件科技有限公司 一种基于高斯过程回归的时序监控指标异常检测方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110807468A (zh) * 2019-09-19 2020-02-18 平安科技(深圳)有限公司 检测异常邮件的方法、装置、设备和存储介质
CN111294332A (zh) * 2020-01-13 2020-06-16 交通银行股份有限公司 一种流量异常检测与dns信道异常检测系统及方法
CN112200538A (zh) * 2020-10-10 2021-01-08 深圳前海微众银行股份有限公司 数据处理方法、装置、设备及存储介质
CN112436956A (zh) * 2020-10-23 2021-03-02 苏州浪潮智能科技有限公司 一种网络设备故障预测的方法、装置、设备及可读介质
US20210166140A1 (en) * 2018-12-13 2021-06-03 Advanced New Technologies Co., Ltd. Method and apparatus for training risk identification model and server
CN112950350A (zh) * 2021-02-06 2021-06-11 中国建设银行股份有限公司 一种基于机器学习的贷款产品推荐方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210166140A1 (en) * 2018-12-13 2021-06-03 Advanced New Technologies Co., Ltd. Method and apparatus for training risk identification model and server
CN110807468A (zh) * 2019-09-19 2020-02-18 平安科技(深圳)有限公司 检测异常邮件的方法、装置、设备和存储介质
CN111294332A (zh) * 2020-01-13 2020-06-16 交通银行股份有限公司 一种流量异常检测与dns信道异常检测系统及方法
CN112200538A (zh) * 2020-10-10 2021-01-08 深圳前海微众银行股份有限公司 数据处理方法、装置、设备及存储介质
CN112436956A (zh) * 2020-10-23 2021-03-02 苏州浪潮智能科技有限公司 一种网络设备故障预测的方法、装置、设备及可读介质
CN112950350A (zh) * 2021-02-06 2021-06-11 中国建设银行股份有限公司 一种基于机器学习的贷款产品推荐方法及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117290801A (zh) * 2023-11-27 2023-12-26 浪潮软件科技有限公司 一种基于高斯过程回归的时序监控指标异常检测方法

Similar Documents

Publication Publication Date Title
US10109122B2 (en) System for maintenance recommendation based on maintenance effectiveness estimation
CN107992410B (zh) 软件质量监测方法、装置、计算机设备和存储介质
WO2023065584A1 (zh) 设备的剩余使用寿命的确定方法、装置和电子设备
CN113590429B (zh) 一种服务器故障诊断方法、装置及电子设备
CN111625516A (zh) 检测数据状态的方法、装置、计算机设备和存储介质
EP4131094A1 (en) Prediction method and apparatus, readable medium, and electronic device
KR20190008515A (ko) 개선된 sax 기법 및 rtc 기법을 이용한 공정 모니터링 장치 및 방법
CN114333317B (zh) 一种交通事件的处理方法、装置、电子设备及存储介质
CN115470079A (zh) 一种系统故障预警方法、装置及服务器
CN113554090A (zh) 一种基于机器学习的银行设备故障预警方法及系统
CN113282920B (zh) 日志异常检测方法、装置、计算机设备和存储介质
CN114548280A (zh) 故障诊断模型的训练、故障诊断方法及电子设备
CN112100037B (zh) 告警级别识别方法、装置、电子设备及存储介质
CN110704614B (zh) 对应用中的用户群类型进行预测的信息处理方法及装置
CN114157486B (zh) 通信流量数据异常检测方法、装置、电子设备及存储介质
CN111783883A (zh) 一种异常数据的检测方法及装置
CN114819619A (zh) 车联网系统服务健康分析方法和装置
CN113850428A (zh) 作业调度的预测处理方法、装置和电子设备
Wani et al. Data Drift Monitoring for Log Anomaly Detection Pipelines
CN112906765A (zh) 一种基于rbf神经网络的客户洗钱风险等级划分方法及系统
CN114443398B (zh) 内存故障预测模型的生成方法、检测方法、装置及设备
CN110865939A (zh) 应用程序质量监测方法、装置、计算机设备和存储介质
CN118378164B (zh) 一种车辆故障预测方法、装置、电子设备和存储介质
CN116149971B (zh) 设备故障预测方法、装置、电子设备及存储介质
CN118171917B (zh) 网络资产的风险评估方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination