CN116225958A - 故障预测方法、装置、存储介质及电子设备 - Google Patents

故障预测方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN116225958A
CN116225958A CN202310295283.6A CN202310295283A CN116225958A CN 116225958 A CN116225958 A CN 116225958A CN 202310295283 A CN202310295283 A CN 202310295283A CN 116225958 A CN116225958 A CN 116225958A
Authority
CN
China
Prior art keywords
production problem
historical
fault
group
fault prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310295283.6A
Other languages
English (en)
Inventor
李达
葛佳伟
赵爱新
卢晓露
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202310295283.6A priority Critical patent/CN116225958A/zh
Publication of CN116225958A publication Critical patent/CN116225958A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3668Software testing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3668Software testing
    • G06F11/3672Test management
    • G06F11/3684Test management for test design, e.g. generating new test cases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3668Software testing
    • G06F11/3696Methods or tools to render software testable
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Computing Systems (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请公开了一种故障预测方法、装置、存储介质及电子设备。涉及金融科技领域,该方法包括:获取目标应用程序的第一生产问题数据;对第一生产问题数据进行特征提取处理,得到第一生产问题特征;基于第一生产问题特征,采用故障预测模型,得到目标应用程序的故障预测结果,其中,故障预测模型是基于N个应用程序分别对应的至少一组历史生产问题数据,以及至少一组历史生产问题数据分别对应的实际历史故障结果训练得到的,其中,N为正整数,N个应用程序中至少包括目标应用程序。通过本申请,解决了相关技术中在应用投产后对应用进行故障预测的方法,导致无法全面合理的预估应用程序实体投产后的风险,故障预测不全面的问题。

Description

故障预测方法、装置、存储介质及电子设备
技术领域
本申请涉及金融科技领域,具体而言,涉及一种故障预测方法、装置、存储介质及电子设备。
背景技术
对于程序投产上线运行,可以分为三个阶段,一是程序实体投产之前,二是程序的投产流程中,三是程序平稳运行时期,而察觉生产问题出现往往在第三阶段。相关技术中着眼点往往在于问题出现后的应急处置,比如限流降级等动作;增加生产运行时的运维监控途径,比如埋点监控等。导致无法全面合理的预估应用程序实体投产后的风险。
针对相关技术中在应用投产后对应用进行故障预测的方法,导致无法全面合理的预估应用程序实体投产后的风险,故障预测不全面的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种故障预测方法、装置、存储介质及电子设备,以解决相关技术中在应用投产后对应用进行故障预测的方法,导致无法全面合理的预估应用程序实体投产后的风险,故障预测不全面的问题。
为了实现上述目的,根据本申请的一个方面,提供了一种故障预测方法。该方法包括:获取目标应用程序的第一生产问题数据;对上述第一生产问题数据进行特征提取处理,得到第一生产问题特征;基于上述第一生产问题特征,采用故障预测模型,得到上述目标应用程序的故障预测结果,其中,上述故障预测模型是基于N个应用程序分别对应的至少一组历史生产问题数据,以及上述至少一组历史生产问题数据分别对应的实际历史故障结果训练得到的,其中,N为正整数,上述N个应用程序中至少包括上述目标应用程序。
为了实现上述目的,根据本申请的另一方面,提供了一种故障预测装置。该装置包括:获取模块,用于获取目标应用程序的第一生产问题数据;特征提取模块,用于对上述第一生产问题数据进行特征提取处理,得到第一生产问题特征;测试模块,用于基于上述第一生产问题特征,采用故障预测模型,得到上述目标应用程序的故障预测结果,其中,上述故障预测模型是基于N个应用程序分别对应的至少一组历史生产问题数据,以及上述至少一组历史生产问题数据分别对应的实际历史故障结果训练得到的,其中,N为正整数,上述N个应用程序中至少包括上述目标应用程序。
为了实现上述目的,根据本申请的另一方面,还提供了一种非易失性存储介质,上述非易失性存储介质存储有多条指令,上述指令适于由处理器加载并执行任意一项上述的故障预测方法。
为了实现上述目的,根据本申请的另一方面,还提供了一种电子设备,包括一个或多个处理器和存储器,上述存储器用于存储一个或多个程序,其中,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器实现任意一项上述的故障预测方法。
通过本申请,采用以下步骤:获取目标应用程序的第一生产问题数据;对上述第一生产问题数据进行特征提取处理,得到第一生产问题特征;基于上述第一生产问题特征,采用故障预测模型,得到上述目标应用程序的故障预测结果,其中,上述故障预测模型是基于N个应用程序分别对应的至少一组历史生产问题数据,以及上述至少一组历史生产问题数据分别对应的实际历史故障结果训练得到的,其中,N为正整数,上述N个应用程序中至少包括上述目标应用程序,达到了基于业务应用投产动作中的生产问题数据,全面进行应用故障预测的目的,解决了相关技术中在应用投产后对应用进行故障预测的方法,导致无法全面合理的预估应用程序实体投产后的风险,故障预测不全面的问题。进而达到了全面进行业务应用故障预测的效果。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例提供的故障预测方法的流程图;以及
图2是根据本申请实施例的一种可选的故障预测方法的示意图;
图3是根据本申请实施例的一种可选的执行过程示意图;
图4是根据本申请实施例的一种可选的执行结果示意图;
图5是根据本申请实施例提供的故障预测装置的示意图;
图6是根据本申请实施例提供的电子设备的示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为了便于描述,以下对本申请实施例涉及的部分名词或术语进行说明:
Embedding,用一个数值向量“表示”一个对象(Object)的方法,通过Spark(使用矩阵分解算法实现)训练得到物品的Embedding向量。
PaaS(Platform as a Service),是指平台即服务。把服务器平台作为一种服务提供的商业模式,通过网络进行程序提供的服务称之为SaaS(Software as a Service),是云计算三种服务模式之一,而云计算时代相应的服务器平台或者开发环境作为服务进行提供就成为了PaaS(Platform as a Service)。
CMC,数字货币监管平台。
Kevacoin,简称KVA币,一种用于区块链的加密货币。
GTP(Gigabit Transceiver with Low Power,吉比特收发器),一种面向分布式应用的数据传输平台,可以根据需求提供满足企业级应用需要的通用传输功能。
NCF(NeuralCF)模型,一种基于深度学习的协同过滤模型,可以用多层神经网络替代矩阵分解模型中的点积操作。
需要说明的是,本申请所涉及的相关信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于展示的数据、分析的数据等),均为经用户授权或者经过各方充分授权的信息和数据。例如,本系统和相关用户或机构间设置有接口,在获取相关信息之前,需要通过接口向前述的用户或机构发送获取请求,并在接收到前述的用户或机构反馈的同意信息后,获取相关信息。
下面结合优选的实施步骤对本申请进行说明,图1是根据本申请实施例提供的故障预测方法的流程图,如图1所示,该方法包括如下步骤:
步骤S101,获取目标应用程序的第一生产问题数据。
可选的,从广义上看,上述第一生产问题数据为两类数据特征:第一类是类别、ID型特征(以下简称类别型特征),第二类是数值型特征(即能用数字直接表示的特征就是数值型特征)。上述第一生产问题数据为上述目标应用程序在投产过程中产生的问题数据,可以但不限于包括:投产过程中产生的生产问题行为数据,问题关系数据,属性、标签类数据,内容类数据,场景信息。
通过以上方式,在目标应用程序投产的过程中获取第一生产问题数据,基于生产问题数据,在应用投产过程中对目标应用程序进行故障预测,使得预测更加全面。
步骤S102,对上述第一生产问题数据进行特征提取处理,得到第一生产问题特征。
在一种可选的实施例中,上述第一生产问题特征包括以下至少之一:对上述目标应用程序进行测试的对象类别,对象等级,测试问题数量,涉及的上游应用数量,上游应用级别,下游应用数量,下游应用级别,释放平台,网络公共服务类型,每秒查询率级别。
可选的,上述对象类别为开发人员类别,可以但不限于通过开发人员是否为企业内人员、以及开发人员工作时间等因素确定开发人员类别;对象等级为开发人员能力级别。释放平台可以但不限于为PaaS平台即服务,CMC数字货币监管平台,KVA币交易平台,GTP吉比特收发器等技术平台等技术平台;网络公共服务类型可以但不限于为公共分支涉及内容,如前端,存储过程,核心程序;每秒查询率级别等级划分,例如100以内为第一等级,100以外为第二等级。
可选的,对上述目标应用程序进行测试的对象类别,对象等级,测试问题数量,涉及的上游应用数量,上游应用级别,下游应用数量,下游应用级别,释放平台,网络公共服务类型,每秒查询率级别等因素是影响应用程序投产后运行状况的重要因素,将上述因素作为应用故障预测的关键问题特征,在一定程度上有助于提升故障预测准确率。
在一种可选的实施例中,上述对上述第一生产问题数据进行特征提取处理,得到第一生产问题特征,包括:采用Word2vec神经网络模型对上述第一生产问题数据进行特征提取处理,得到上述第一生产问题特征。
可以理解,Word2vec神经网络模型为一种用于产生词向量的神经网络模型,通过上述Word2vec神经网络模型,提取到通过词向量形式表征的第一生产问题特征,用于后续通过故障预测模型进行故障预测。
可选的,可以但不限于采用基于Scala语言的Spark框架对上述第一生产问题数据进行特征提取处理,得到第一生产问题特征。可以理解,Scala语言为一门多范式的编程语言,Spark框架为一种基于内存的快速、通用、可扩展的大数据计算引擎,集批处理、实时流处理、交互式查询、图计算与机器学习于一体。
步骤S103,基于上述第一生产问题特征,采用故障预测模型,得到上述目标应用程序的故障预测结果,其中,上述故障预测模型是基于N个应用程序分别对应的至少一组历史生产问题数据,以及上述至少一组历史生产问题数据分别对应的实际历史故障结果训练得到的,其中,N为正整数,上述N个应用程序中至少包括上述目标应用程序。
在一种可选的实施例中,在上述第一生产问题特征包括类别型特征和数值型特征的情况下,上述基于上述第一生产问题特征,采用故障预测模型,得到上述目标应用程序的故障预测结果,包括:获取上述第一生产问题特征对应的特征标识;对上述类别型特征进行编码处理,得到处理后的类别型特征;基于上述处理后的类别型特征,上述数值型特征,以及上述特征标识,采用上述故障预测模型,得到上述目标应用程序的上述故障预测结果。
可选的,在获取到上述N个应用程序分别对应的至少一组历史生产问题特征,以及对应的故障预测结果之后,将上述N个应用程序分别对应的至少一组历史生产问题特征和对应的故障预测结果存储至目标数据库,用于丰富数据库。
可以理解,在实际场景中,获取到的第一生产问题特征既包括类别型特征,又包括数值型特征。例如,对象类别、上游应用级别、下游应用级别、释放平台、网络公共服务类型以及每秒查询率等为类别型特征,对象级别、测试问题数量、涉及上游应用的数量、涉及下游应用的数量等为数值型特征。针对上述数值型特征,可以直接作为模型输入,针对上述类别型特征,则需要将其转化为0-1编码向量的格式;将0-1编码向量的格式的类别型特征、数值型特征以及每一个生产问题特征的特征标识(即特征ID)作为模型输入进行测试,得到目标应用程序的故障预测结果。各生产问题特征与特征类型、特征标识以及处理方法的对应关系如表1所示。
表1
Figure BDA0004142911760000061
在一种可选的实施例中,在上述基于上述第一生产问题特征,采用故障预测模型,得到上述目标应用程序的故障预测结果之前,上述方法还包括:获取上述N个应用程序分别对应的上述至少一组历史生产问题数据,以及上述至少一组历史生产问题数据分别对应的实际历史故障结果;对上述N个应用程序分别对应的上述至少一组历史生产问题数据进行特征提取处理,得到上述N个应用程序分别对应的至少一组历史生产问题特征;基于上述N个应用程序分别对应的至少一组历史生产问题特征,以及上述至少一组历史生产问题数据分别对应的实际历史故障结果进行训练,得到上述故障预测模型。
可选的,采用Word2vec神经网络模型对上述N个应用程序分别对应的上述至少一组历史生产问题数据进行特征提取处理,得到通过词向量形式表征(即Embedding)的N个应用程序分别对应的至少一组历史生产问题特征。
可选的,在获取到上述N个应用程序分别对应的至少一组历史生产问题特征之后,将上述N个应用程序分别对应的至少一组历史生产问题特征存储至目标数据库。
在一种可选的实施例中,上述基于上述N个应用程序分别对应的至少一组历史生产问题特征,以及上述至少一组历史生产问题数据分别对应的实际历史故障结果进行训练,得到上述故障预测模型,包括:基于上述N个应用程序分别对应的上述至少一组历史生产问题特征,以及上述至少一组历史生产问题数据分别对应的实际历史故障结果,对基于深度学习的协同过滤NCF模型进行训练,得到上述故障预测模型。
可选的,在对NCF模型进行训练之前,需要对输入数据(即上述N个应用程序分别对应的上述至少一组历史生产问题特征)进行处理,即针对上述N个应用程序分别对应的上述至少一组历史生产问题特征中的类别型特征进行0-1编码处理,将处理后的历史生产文体特征作为模型输入对NCF模型进行训练,得到故障预测模型。
可选的,在模型训练部分,可以但不限于采用基于Python语言的TensorFlow平台(一个端到端开源机器学习平台)进行模型训练。TensorFlow平台部署在镜像Docker上。
在一种可选的实施例中,上述基于上述N个应用程序分别对应的上述至少一组历史生产问题特征,以及上述至少一组历史生产问题数据分别对应的实际历史故障结果,对基于深度学习的协同过滤NCF模型进行训练,得到上述故障预测模型,包括:基于上述N个应用程序分别对应的上述至少一组历史生产问题特征,以及上述至少一组历史生产问题数据分别对应的实际历史故障结果,对NCF模型进行训练,得到训练后的NCF模型,以及上述N个应用程序分别对应的上述至少一组历史生产问题数据分别对应的预测历史故障结果;根据上述N个应用程序分别对应的上述至少一组历史生产问题数据分别对应的实际历史故障结果和预测历史故障结果,确定模型损失;在上述模型损失满足预设损失条件的情况下,将上述训练后的NCF模型作为上述故障预测模型。
通过以上方式,基于上述N个应用程序分别对应的上述至少一组历史生产问题特征,以及上述至少一组历史生产问题数据分别对应的实际历史故障结果,对NCF模型进行预定轮次的训练之后,输出最后一轮训练输出的训练后的NCF模型,以及N个应用程序分别对应的上述至少一组历史生产问题数据分别对应的预测历史故障结果;基于实际历史故障结果和对应的预测历史故障结果确定模型损失,若模型损失满足预设损失条件(例如小于预设损失阈值),则将训练后的NCF模型作为故障预测模型。若模型损失未满足预设损失条件,可通过修改模型参数、增加训练集数据、增加训练轮次等方式继续对训练后的NCF模型进行训练,直至新的训练后的NCF模型满足预设损失条件,将新的训练后的NCF模型作为故障预测模型。
上述步骤S101至步骤S103,通过获取目标应用的第一生产问题数据;对上述第一生产问题数据进行特征提取处理,得到第一生产问题特征;基于上述第一生产问题特征,采用故障预测模型,得到上述目标应用的故障预测结果,其中,上述故障预测模型是基于N个应用分别对应的至少一组历史生产问题数据,以及上述至少一组历史生产问题数据分别对应的实际历史故障结果训练得到的,其中,N为正整数,上述N个应用中至少包括上述目标应用的方式,可以达到基于业务应用投产动作中的生产问题数据,全面进行应用故障预测的目的,解决相关技术中在应用投产后对应用进行故障预测的方法,导致无法全面合理的预估应用程序实体投产后的风险,故障预测不全面的问题。进而达到全面进行业务应用故障预测的效果。
基于上述实施例和可选实施例,本申请提出一种可选实施方式,图2是根据本申请实施例的一种可选的故障预测方法的流程图,如图2所示,该方法包括:
步骤S1,在目标数据库(故障库)中获取N个应用程序分别对应的上述至少一组历史生产问题数据,以及每一组历史生产问题数据对应的实际测历史故障结果;
步骤S2,采用Word2vec神经网络模型对N个应用程序分别对应的上述至少一组历史生产问题数据进行特征提取处理,得到N个应用程序分别对应词向量形式表征的至少一组历史生产问题特征;
步骤S3,基于N个应用程序分别对应的上述至少一组历史生产问题特征,以及每一组历史生产问题数据对应的实际测历史故障结果,对NCF模型进行训练,得到故障预测模型;
步骤S4,获取目标应用程序的第一生产问题数据,采用Word2vec神经网络模型对上述第一生产问题数据进行特征提取处理,得到词向量形式表征的第一生产问题特征,其中,第一生产问题特征可以但不限于包括对象类别、上游应用级别、下游应用级别、释放平台、网络公共服务类型以及每秒查询率等为类别型特征,以及对象级别、测试问题数量、涉及上游应用的数量、涉及下游应用的数量等为数值型特征;
步骤S5,将类别型特征转化为0-1编码向量的格式;将0-1编码向量的格式的类别型特征、数值型特征以及每一个生产问题特征的特征标识(即特征ID)作为故障预测输入进行测试,得到目标应用程序的故障预测结果。
需要说明的是,本申请实施例中,生产故障的出现往往伴随着改变,业务应用投产动作是引起生产故障的主要问题,而产生这些生产问题的原因都往往有着相似性,关联性,计划通过海量生产问题进行归纳特征,预估生产隐患,尽量避免生产隐患。从预测方法的根本要解决的问题出发,是要处理“因”和“故障”之间的关系问题,也就是基于“内因”和“故障结果”,构建出一个更为智能的错题本。这里“故障结果”的定义非常多样,它在不同场景下的具体含义也千差万别,比如说,网络故障,就要分为不同层级服务器之间的网络,内网,外网,常见的就是由于火墙不通,服务器负载均衡配置有误,请求分发,忘记互联协议漂移等;还有服务器故障,是由于地址错误,配置报错等,而以上只是生产故障中的九牛一毛,都算是基础环境问题,还未列举编码导致的错误,所以方法预测的结果会输出生产已发生的生产问题实例,然后再根据实例中的根本原因回顾“内因”,以保证正确预测风险。
本申请还提出了另一种可选的实施例,图3是根据本申请实施例的一种可选的执行过程示意图,图4是根据本申请实施例的一种可选的执行结果示意图,通过日常生产运行中积累的生产问题场景,抽取特征,举例说明具体生产问题案例:企业网数字资产应用,某月度版本投产之后,生产上出现代发工资业务手续费多扣收的情况,分析定位该收费过程通过批量操作完成,检查在扣费的存储过程中将历史上主键冲突分支修改正常,但对条件判断的编码没有进行赋值清空,导致某些特殊批次(网点撤并)如有一批次进入该主键冲突分支,后续所有批次都会进入该计费分支,都会计算两次扣费,对生产问题数据进行特征提取,结合特征归纳如下:
devloperType:(0,1,0)
devloperLevel:3
testQnum:2
upperReaNum:1
......
具体的执行过程如图3所示,该图中显示了每一个生产问题特征,以及对应的结果值,进一步触发下一步操作,即输出对应的故障预测结果,对应的显示形式如图4所示。上述方法可以充分利用生产出现过的问题经验,起到“错题本”的效应,以最小的代价来应对生产即将出现的风险,有利于系统运行的问题,已经生产业务的顺畅完成。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例还提供了一种故障预测装置,需要说明的是,本申请实施例的故障预测装置可以用于执行本申请实施例所提供的用于故障预测方法。以下对本申请实施例提供的故障预测装置进行介绍。
图5是根据本申请实施例的故障预测装置的示意图。如图5所示,该装置包括:获取模块500、特征提取模块502、测试模块504,其中,
上述获取模块500,用于获取目标应用程序的第一生产问题数据;
上述特征提取模块502,连接于上述获取模块500,用于对上述第一生产问题数据进行特征提取处理,得到第一生产问题特征;
上述测试模块504,连接于上述特征提取模块502,用于基于上述第一生产问题特征,采用故障预测模型,得到上述目标应用程序的故障预测结果,其中,上述故障预测模型是基于N个应用程序分别对应的至少一组历史生产问题数据,以及上述至少一组历史生产问题数据分别对应的实际历史故障结果训练得到的,其中,N为正整数,上述N个应用程序中至少包括上述目标应用程序。
本申请中,通过设置上述获取模块500,用于获取目标应用程序的第一生产问题数据;上述特征提取模块502,连接于上述获取模块500,用于对上述第一生产问题数据进行特征提取处理,得到第一生产问题特征;上述测试模块504,连接于上述特征提取模块502,用于基于上述第一生产问题特征,采用故障预测模型,得到上述目标应用程序的故障预测结果,其中,上述故障预测模型是基于N个应用程序分别对应的至少一组历史生产问题数据,以及上述至少一组历史生产问题数据分别对应的实际历史故障结果训练得到的,其中,N为正整数,上述N个应用程序中至少包括上述目标应用程序,达到了基于业务应用投产动作中的生产问题数据,全面进行应用故障预测的目的,解决了相关技术中在应用投产后对应用进行故障预测的方法,导致无法全面合理的预估应用程序实体投产后的风险,故障预测不全面的问题。进而达到了全面进行业务应用故障预测的效果。
可选的,上述装置还包括:第一获取单元,用于获取上述N个应用程序分别对应的上述至少一组历史生产问题数据,以及上述至少一组历史生产问题数据分别对应的实际历史故障结果;第一特征提取单元,用于对上述N个应用程序分别对应的上述至少一组历史生产问题数据进行特征提取处理,得到上述N个应用程序分别对应的至少一组历史生产问题特征;第一训练单元,用于基于上述N个应用程序分别对应的至少一组历史生产问题特征,以及上述至少一组历史生产问题数据分别对应的实际历史故障结果进行训练,得到上述故障预测模型。
可选的,上述第一训练单元,包括:第一训练子单元,用于基于上述N个应用程序分别对应的上述至少一组历史生产问题特征,以及上述至少一组历史生产问题数据分别对应的实际历史故障结果,对基于深度学习的协同过滤NCF模型进行训练,得到上述故障预测模型。
可选的,上述第一训练子单元,包括:第二训练子单元,用于基于上述N个应用程序分别对应的上述至少一组历史生产问题特征,以及上述至少一组历史生产问题数据分别对应的实际历史故障结果,对上述NCF模型进行训练,得到训练后的NCF模型,以及上述N个应用程序分别对应的上述至少一组历史生产问题数据分别对应的预测历史故障结果;第一确定单元,用于根据上述N个应用程序分别对应的上述至少一组历史生产问题数据分别对应的实际历史故障结果和预测历史故障结果,确定模型损失;第二确定单元,用于在上述模型损失满足预设损失条件的情况下,将上述训练后的NCF模型作为上述故障预测模型。
可选的,上述第一特征提取单元,包括:第一特征提取子单元,用于采用Word2vec神经网络模型对上述第一生产问题数据进行特征提取处理,得到上述第一生产问题特征。
可选的,在上述第一生产问题特征包括类别型特征和数值型特征的情况下,上述测试模块,包括:第二获取单元,用于获取上述第一生产问题特征对应的特征标识;编码单元,用于对上述类别型特征进行编码处理,得到处理后的类别型特征;测试单元,用于基于上述处理后的类别型特征,上述数值型特征,以及上述特征标识,采用上述故障预测模型,得到上述目标应用程序的上述故障预测结果。
需要说明的是,上述各个模块、单元是可以通过软件或硬件来实现的,例如,对于后者,可以通过以下方式实现:上述各个模块可以位于同一处理器中;或者,上述各个模块以任意组合的方式位于不同的处理器中。
此处需要说明的是,上述获取模块500、特征提取模块502、测试模块504对应于实施例中的步骤S101至步骤S103,上述模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在计算机终端中。
需要说明的是,本实施例的可选或优选实施方式可以参见实施例1中的相关描述,此处不再赘述。
上述故障预测装置包括处理器和存储器,上述单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来(本申请的目的)。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本申请实施例提供了一种非易失性存储介质,其上存储有程序,该程序被处理器执行时实现以下步骤:获取目标应用程序的第一生产问题数据;对上述第一生产问题数据进行特征提取处理,得到第一生产问题特征;基于上述第一生产问题特征,采用故障预测模型,得到上述目标应用程序的故障预测结果,其中,上述故障预测模型是基于N个应用程序分别对应的至少一组历史生产问题数据,以及上述至少一组历史生产问题数据分别对应的实际历史故障结果训练得到的,其中,N为正整数,上述N个应用程序中至少包括上述目标应用程序。本文中的设备可以是服务器、PC、PAD、手机等。
本申请实施例提供了一种处理器,上述处理器用于运行程序,其中,上述程序运行时执行上述故障预测方法。
如图6所示,本申请实施例提供了一种电子设备,该电子设备10包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:获取目标应用程序的第一生产问题数据;对上述第一生产问题数据进行特征提取处理,得到第一生产问题特征;基于上述第一生产问题特征,采用故障预测模型,得到上述目标应用程序的故障预测结果,其中,上述故障预测模型是基于N个应用程序分别对应的至少一组历史生产问题数据,以及上述至少一组历史生产问题数据分别对应的实际历史故障结果训练得到的,其中,N为正整数,上述N个应用程序中至少包括上述目标应用程序。本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:获取目标应用程序的第一生产问题数据;对上述第一生产问题数据进行特征提取处理,得到第一生产问题特征;基于上述第一生产问题特征,采用故障预测模型,得到上述目标应用程序的故障预测结果,其中,上述故障预测模型是基于N个应用程序分别对应的至少一组历史生产问题数据,以及上述至少一组历史生产问题数据分别对应的实际历史故障结果训练得到的,其中,N为正整数,上述N个应用程序中至少包括上述目标应用程序。
可选的,上述计算机程序产品还适于执行初始化有如下方法步骤的程序:获取上述N个应用程序分别对应的上述至少一组历史生产问题数据,以及上述至少一组历史生产问题数据分别对应的实际历史故障结果;对上述N个应用程序分别对应的上述至少一组历史生产问题数据进行特征提取处理,得到上述N个应用程序分别对应的至少一组历史生产问题特征;基于上述N个应用程序分别对应的至少一组历史生产问题特征,以及上述至少一组历史生产问题数据分别对应的实际历史故障结果进行训练,得到上述故障预测模型。
可选的,上述计算机程序产品还适于执行初始化有如下方法步骤的程序:基于上述N个应用程序分别对应的上述至少一组历史生产问题特征,以及上述至少一组历史生产问题数据分别对应的实际历史故障结果,对基于深度学习的协同过滤NCF模型进行训练,得到上述故障预测模型。
可选的,上述计算机程序产品还适于执行初始化有如下方法步骤的程序:基于上述N个应用程序分别对应的上述至少一组历史生产问题特征,以及上述至少一组历史生产问题数据分别对应的实际历史故障结果,对NCF模型进行训练,得到训练后的NCF模型,以及上述N个应用程序分别对应的上述至少一组历史生产问题数据分别对应的预测历史故障结果;根据上述N个应用程序分别对应的上述至少一组历史生产问题数据分别对应的实际历史故障结果和预测历史故障结果,确定模型损失;在上述模型损失满足预设损失条件的情况下,将上述训练后的NCF模型作为上述故障预测模型。
可选的,上述计算机程序产品还适于执行初始化有如下方法步骤的程序:采用Word2vec神经网络模型对上述第一生产问题数据进行特征提取处理,得到上述第一生产问题特征。
可选的,上述计算机程序产品还适于执行初始化有如下方法步骤的程序:获取上述第一生产问题特征对应的特征标识;对上述类别型特征进行编码处理,得到处理后的类别型特征;基于上述处理后的类别型特征,上述数值型特征,以及上述特征标识,采用上述故障预测模型,得到上述目标应用程序的上述故障预测结果。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种故障预测方法,其特征在于,包括:
获取目标应用程序的第一生产问题数据;
对所述第一生产问题数据进行特征提取处理,得到第一生产问题特征;
基于所述第一生产问题特征,采用故障预测模型,得到所述目标应用程序的故障预测结果,其中,所述故障预测模型是基于N个应用程序分别对应的至少一组历史生产问题数据,以及所述至少一组历史生产问题数据分别对应的实际历史故障结果训练得到的,其中,N为正整数,所述N个应用程序中至少包括所述目标应用程序。
2.根据权利要求1所述的方法,其特征在于,在所述基于所述第一生产问题特征,采用故障预测模型,得到所述目标应用程序的故障预测结果之前,所述方法还包括:
获取所述N个应用程序分别对应的所述至少一组历史生产问题数据,以及所述至少一组历史生产问题数据分别对应的实际历史故障结果;
对所述N个应用程序分别对应的所述至少一组历史生产问题数据进行特征提取处理,得到所述N个应用程序分别对应的至少一组历史生产问题特征;
基于所述N个应用程序分别对应的至少一组历史生产问题特征,以及所述至少一组历史生产问题数据分别对应的实际历史故障结果进行训练,得到所述故障预测模型。
3.根据权利要求2所述的方法,其特征在于,所述基于所述N个应用程序分别对应的至少一组历史生产问题特征,以及所述至少一组历史生产问题数据分别对应的实际历史故障结果进行训练,得到所述故障预测模型,包括:
基于所述N个应用程序分别对应的所述至少一组历史生产问题特征,以及所述至少一组历史生产问题数据分别对应的实际历史故障结果,对基于深度学习的协同过滤NCF模型进行训练,得到所述故障预测模型。
4.根据权利要求3所述的方法,其特征在于,所述基于所述N个应用程序分别对应的所述至少一组历史生产问题特征,以及所述至少一组历史生产问题数据分别对应的实际历史故障结果,对基于深度学习的协同过滤NCF模型进行训练,得到所述故障预测模型,包括:
基于所述N个应用程序分别对应的所述至少一组历史生产问题特征,以及所述至少一组历史生产问题数据分别对应的实际历史故障结果,对所述NCF模型进行训练,得到训练后的NCF模型,以及所述N个应用程序分别对应的所述至少一组历史生产问题数据分别对应的预测历史故障结果;
根据所述N个应用程序分别对应的所述至少一组历史生产问题数据分别对应的实际历史故障结果和预测历史故障结果,确定模型损失;
在所述模型损失满足预设损失条件的情况下,将所述训练后的NCF模型作为所述故障预测模型。
5.根据权利要求1所述的方法,其特征在于,所述对所述第一生产问题数据进行特征提取处理,得到第一生产问题特征,包括:
采用Word2vec神经网络模型对所述第一生产问题数据进行特征提取处理,得到所述第一生产问题特征。
6.根据权利要求1所述的方法,其特征在于,在所述第一生产问题特征包括类别型特征和数值型特征的情况下,所述基于所述第一生产问题特征,采用故障预测模型,得到所述目标应用程序的故障预测结果,包括:
获取所述第一生产问题特征对应的特征标识;
对所述类别型特征进行编码处理,得到处理后的类别型特征;
基于所述处理后的类别型特征,所述数值型特征,以及所述特征标识,采用所述故障预测模型,得到所述目标应用程序的所述故障预测结果。
7.根据权利要求1至6中任意一项所述的方法,其特征在于,所述第一生产问题特征包括以下至少之一:对所述目标应用程序进行测试的对象类别,对象等级,测试问题数量,涉及的上游应用数量,上游应用级别,下游应用数量,下游应用级别,释放平台,网络公共服务类型,每秒查询率级别。
8.一种故障预测装置,其特征在于,包括:
获取模块,用于获取目标应用程序的第一生产问题数据;
特征提取模块,用于对所述第一生产问题数据进行特征提取处理,得到第一生产问题特征;
测试模块,用于基于所述第一生产问题特征,采用故障预测模型,得到所述目标应用程序的故障预测结果,其中,所述故障预测模型是基于N个应用程序分别对应的至少一组历史生产问题数据,以及所述至少一组历史生产问题数据分别对应的实际历史故障结果训练得到的,其中,N为正整数,所述N个应用程序中至少包括所述目标应用程序。
9.一种非易失性存储介质,其特征在于,所述非易失性存储介质存储有多条指令,所述指令适于由处理器加载并执行权利要求1至7中任意一项所述的故障预测方法。
10.一种电子设备,其特征在于,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至7中任意一项所述的故障预测方法。
CN202310295283.6A 2023-03-23 2023-03-23 故障预测方法、装置、存储介质及电子设备 Pending CN116225958A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310295283.6A CN116225958A (zh) 2023-03-23 2023-03-23 故障预测方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310295283.6A CN116225958A (zh) 2023-03-23 2023-03-23 故障预测方法、装置、存储介质及电子设备

Publications (1)

Publication Number Publication Date
CN116225958A true CN116225958A (zh) 2023-06-06

Family

ID=86584466

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310295283.6A Pending CN116225958A (zh) 2023-03-23 2023-03-23 故障预测方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN116225958A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117250942A (zh) * 2023-11-15 2023-12-19 成都态坦测试科技有限公司 故障预测方法、模型的确定方法、装置、设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117250942A (zh) * 2023-11-15 2023-12-19 成都态坦测试科技有限公司 故障预测方法、模型的确定方法、装置、设备及存储介质
CN117250942B (zh) * 2023-11-15 2024-02-27 成都态坦测试科技有限公司 故障预测方法、模型的确定方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
US11132624B2 (en) Model integration method and device
US20230289828A1 (en) Data processing method, computer device, and readable storage medium
CN109409836A (zh) 数据申请处理方法及装置、电子设备、存储介质
CN111181757B (zh) 信息安全风险预测方法、装置以及计算设备、存储介质
CN110674188A (zh) 一种特征提取方法、装置及设备
WO2023016147A1 (zh) 多目标预测方法、装置、设备、存储介质及程序产品
US20230315618A1 (en) Data processing method and device, computing device, and test reduction device
CN110413635A (zh) 一种数据处理方法以及装置
CN116225958A (zh) 故障预测方法、装置、存储介质及电子设备
CN112200465A (zh) 基于多媒体信息智能分析的电力ai方法及系统
CN117688155A (zh) 业务问题的回复方法、装置、存储介质以及电子设备
CN112905987B (zh) 账号识别方法、装置、服务器及存储介质
CN111309576A (zh) 一种压力测试方法和装置
CN111984519A (zh) 一种用于业务系统的测试方法及其装置
CN116188020A (zh) 异常账户识别方法、装置以及存储介质
CN111461346B (zh) 一种网络节点表征方法、装置和设备
CN113052509A (zh) 模型评估方法、模型评估装置、电子设备和存储介质
CN112801406A (zh) 数据处理方法及装置、计算设备
CN113835730B (zh) 一种更新审核程序的方法、装置、设备及介质
CN111784503B (zh) 一种通信征信数据的运营变现方法、系统和存储介质
CN116433020A (zh) 资源主体风险预警的方法及设备
CN117455618A (zh) 对象的处理方法和装置及电子设备
CN116594873A (zh) 业务的判断方法、装置、处理器以及电子设备
CN116362753A (zh) 交易风险处理方法、装置及存储介质
CN114693321A (zh) 画像标签预测方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination