CN116599861A - 检测云服务异常的方法、服务器设备和存储介质 - Google Patents

检测云服务异常的方法、服务器设备和存储介质 Download PDF

Info

Publication number
CN116599861A
CN116599861A CN202310877640.XA CN202310877640A CN116599861A CN 116599861 A CN116599861 A CN 116599861A CN 202310877640 A CN202310877640 A CN 202310877640A CN 116599861 A CN116599861 A CN 116599861A
Authority
CN
China
Prior art keywords
event
key
events
cloud service
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310877640.XA
Other languages
English (en)
Inventor
宁贯一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Haima Cloud Tianjin Information Technology Co Ltd
Original Assignee
Haima Cloud Tianjin Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Haima Cloud Tianjin Information Technology Co Ltd filed Critical Haima Cloud Tianjin Information Technology Co Ltd
Priority to CN202310877640.XA priority Critical patent/CN116599861A/zh
Publication of CN116599861A publication Critical patent/CN116599861A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供一种检测云服务异常的方法、服务器设备和存储介质,属于计算机技术领域,该方法包括:获取用户在使用云服务时触发的关键事件的标识;将关键事件的标识添加至事件标识序列中;将事件标识序列输入预测模型,以确定所述预测模型是否输出异常值;其中,预测模型为使用历史云服务数据训练得到的机器学习模型,预测模型用于根据事件标识序列对应的关键事件的序列中的小概率转移事件的数量确定是否输出异常值;在预测模型输出异常值时,生成关于用户本次使用云服务的异常告警消息。本申请有助于及早地发现云服务过程中存在的异常状况。

Description

检测云服务异常的方法、服务器设备和存储介质
技术领域
本申请涉及计算机技术领域,特别涉及一种检测云服务异常的方法、服务器设备和存储介质。
背景技术
在例如云游戏、云应用、云手机和云电脑的云服务应用场景中,用户终端可以通过网络连接远程使用运行在云服务器上虚拟化或容器化的操作系统中的应用程序——云服务器以视频流的形式将操作系统渲染的显示画面实时传输到用户终端上进行显示,用户终端则向云服务器发送用户操作数据,使得用户能够使用低配置终端通过网络享受到云服务器高配置的计算资源,远程运行三维建模、视频剪辑、软件编程、大型游戏等配置要求很高的应用软件。
但是,由于云服务通常涉及数量众多的设备、网络、平台和服务商,在大量用户同时使用云服务的过程中,很容易出现各式各样难以发现的异常状况,其通常只有在出现大量用户投诉或上报之后才能以人工的方式通过调取各类日志文件等手段来发现并修复,严重影响了云服务的服务质量。
发明内容
本申请提供了一种检测云服务异常的方法、服务器设备和存储介质,有助于及早地发现云服务过程中存在的异常状况。
本申请实施例的至少一个方面提供了一种检测云服务异常的方法,所述方法包括:获取用户在使用云服务时触发的关键事件的标识;将所述关键事件的标识添加至所述用户本次使用云服务的事件标识序列中,所述事件标识序列中的标识按照关键事件的时间先后顺序排列;将所述事件标识序列输入预测模型,以确定所述预测模型是否输出异常值;其中,所述预测模型为使用历史云服务数据训练得到的机器学习模型,所述预测模型用于根据所述事件标识序列对应的关键事件的序列中的小概率转移事件的数量确定是否输出异常值,所述小概率转移事件为基于所述历史云服务数据确定的发生概率低于阈值的转移事件,所述转移事件为至少两个连续的关键事件的标识所对应的关键事件按照标识的排列顺序依次被触发的事件;在所述预测模型输出异常值时,生成关于所述用户本次使用云服务的异常告警消息。
本申请实施例的至少一个方面提供了一种检测云服务异常的装置,所述装置包括:获取模块,用于获取用户在使用云服务时触发的关键事件的标识;添加模块,用于将所述关键事件的标识添加至所述用户本次使用云服务的事件标识序列中,所述事件标识序列中的标识按照关键事件的时间先后顺序排列;输入模块,用于将所述事件标识序列输入预测模型;其中,所述预测模型为使用历史云服务数据训练得到的机器学习模型,所述预测模型用于根据所述事件标识序列对应的关键事件的序列中的小概率转移事件的数量确定是否输出异常值,所述小概率转移事件为基于所述历史云服务数据确定的发生概率低于阈值的转移事件,所述转移事件为至少两个连续的关键事件的标识所对应的关键事件按照标识的排列顺序依次被触发的事件;生成模块,用于在所述预测模型输出异常值时,生成关于所述用户本次使用云服务的异常告警消息。
本申请实施例的至少一个方面提供了一种服务器设备,所述服务器设备包括:处理器;用于存储所述处理器的可执行指令的存储器;其中,所述处理器用于执行所述可执行指令,以实现上述检测云服务异常的方法。
本申请实施例的至少一个方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有处理器的可执行指令,所述可执行指令被配置为在被处理器执行时使所述处理器实现上述检测云服务异常的方法。
本申请实施例中,用户使用云服务时触发的关键事件被用来检测云服务中存在的异常,使用历史云服务数据训练得到的预测模型能够识别当前云服务中出现的小概率转移事件(比如关键事件A在正常的云服务过程中很少会紧接着关键事件B之后被触发,那么“关键事件B→关键事件A”就是一个小概率转移事件),从而利用预测模型就能实时判断用户本次使用云服务的过程中是否存在异常,在海量的日志数据中精确地找到可能存在异常的云服务并进行告警,使得云服务的提供商能够及时地发现并处理云服务中存在的异常状况,帮助减少云服务中异常状况的发生,提升云服务的服务质量。
附图说明
图1是本申请实施例提供的一种云服务的应用场景示意图;
图2是本申请实施例提供的一种检测云服务异常的方法的步骤流程示意图;
图3是本申请实施例提供的又一种检测云服务异常的方法的步骤流程示意图;
图4是本申请实施例提供的一种一元子模型的生成原理示意图;
图5是本申请实施例提供的又一种检测云服务异常的方法的部分步骤流程示意图;
图6是本申请实施例提供的一种检测云服务异常的装置的结构框图;
图7是本申请实施例提供的一种服务器设备的结构框图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
图1是本申请实施例提供的一种传递视频数据的方法和一种获取视频数据的方法的应用场景示意图。在如图1所示的网络系统中,服务器设备100(可以为单个服务器设备或多个设备的组合)与终端设备200(可以为任何一种具备显示和通信功能的电子设备,如手机、平板电脑、笔记本电脑等等)之间具有网络连接300,使得服务器设备100与终端设备200之间能够利用和依照规定的协议传输数据。在一个示例中,服务器设备100向终端设备200实时发送待形成显示画面的视频数据,并接收来自终端设备200发送的用户输入数据,以提供包括云电脑、云手机、云应用、云游戏中至少一种的云服务。在该示例中,终端设备200向服务器设备100发送包括键盘输入、触控屏输入、鼠标输入、按钮输入、麦克风输入、摄像头输入、传感器输入中的至少一种用户输入数据;服务器设备100通过向终端设备200发送包括电脑界面、手机界面、操作系统界面、应用界面、游戏界面中的至少一个的显示画面的视频数据,来向终端设备200提供可供交互的用户界面。以云游戏为例,终端设备200通过网络连接300使用运行在服务器设备100上的容器系统(服务器上运行的容器化的操作系统)中的云游戏,终端设备200向服务器设备100发送用户操作数据,服务器设备100以视频流的形式将云游戏的游戏画面实时传输到终端设备200上进行显示,从而终端设备200能够凭借极低的配置游玩各类配置要求很高的游戏应用,而不需要受限于终端设备200的性能和系统类型(比如,能够使用低配置的安卓手机使用三维建模、视频剪辑、软件编程、大型游戏等配置要求很高的应用软件)。
在一个云游戏应用场景中,终端设备200上的云游戏平台应用通过网络连接300向软件即服务(SaaS,Software as a Service)系统发出申请,使得SaaS系统调用平台即服务(PaaS,Platform as a Service)系统为该终端设备200的用户分配云游戏实例(Pod,可以包括一个或多个容器),然后将其返回给终端设备200,使得终端设备200能够通过云游戏平台应用连接到云游戏实例并开始游玩,终端设备200会在游玩过中持续地与SaaS系统、PaaS系统及云游戏实例进行交互。本示例中,服务器设备100通常无法由单个的硬件设备实现,而可以被实现为由众多不同平台的众多网络设备所组成的网络系统。
可见,云服务通常会同时涉及数量众多的设备、网络、平台和服务商,这使得大量处于不同地理位置的终端设备200在同时使用云服务时(比如众多玩家在云游戏平台上同时游玩时),难免在各个设备节点或流程节点处发生一些严重影响用户体验又难以被发现的异常状况。由于没有适当的手段及时发现这些异常状况,通常需要等到游戏上线后用户因为体验不佳而大量投诉上报后才能被服务商认识到,此后才能通过人工调查日志文件等方式找到并修复发生的问题,而未被发现的问题则会一直持续存在,严重影响了云服务的服务质量。
图2是本申请实施例提供的一种检测云服务异常的方法的步骤流程示意图。参见图2,该方法可以例如由服务器设备100执行,并包括以下步骤。
在步骤201中,获取用户在使用云服务时触发的关键事件的标识。
在步骤202中,将关键事件的标识添加至用户本次使用云服务的事件标识序列中,事件标识序列中的标识按照关键事件的时间先后顺序排列。
在步骤203中,将事件标识序列输入预测模型,以确定预测模型是否输出异常值。
在步骤204中,在预测模型输出异常值时,生成关于用户本次使用云服务的异常告警消息。
其中,上述预测模型为使用历史云服务数据训练得到的机器学习模型,预测模型用于根据事件标识序列对应的关键事件的序列中的小概率转移事件的数量确定是否输出异常值,小概率转移事件为基于历史云服务数据确定的发生概率低于阈值的转移事件,转移事件为至少两个连续的关键事件的标识所对应的关键事件按照标识的排列顺序依次被触发的事件。
需要说明的是,上述关键事件指的是用户在使用云服务时终端主动上报和/或服务器主动收集的重要事件(比如,在运行所述云服务的云服务器上完成对所述视频数据的第一帧的渲染操作产生的事件)。在一个示例中,可以通过人工筛选的方式确定若干个需要被监测的关键事件,并将其标识配置在终端和/或云服务器中,使得某个关键事件被触发时能够由终端或云服务器获取到该关键事件的标识,并借助必要的数据传递过程添加到缓存于云服务器内的事件标识序列中。
可以看出,本申请实施例中,用户使用云服务时触发的关键事件被用来检测云服务中存在的异常,使用历史云服务数据训练得到的预测模型能够识别当前云服务中出现的小概率转移事件(比如关键事件A在正常的云服务过程中很少会紧接着关键事件B之后被触发,那么“关键事件B→关键事件A”就是一个小概率转移事件),从而利用预测模型就能实时判断用户本次使用云服务的过程中是否存在异常,在海量的日志数据中精确地找到可能存在异常的云服务并进行告警,使得云服务的提供商能够及时地发现并处理云服务中存在的异常状况,帮助减少云服务中异常状况的发生,提升云服务的服务质量。
图3是本申请实施例提供的又一种检测云服务异常的方法的步骤流程示意图。参见图3,该方法可以例如由服务器设备100(即云服务器)执行,并包括以下步骤。
在步骤301中,获取用户在使用云服务时触发的关键事件的标识。
在步骤302中,将关键事件的标识添加至用户本次使用云服务的事件标识序列中,事件标识序列中的标识按照关键事件的时间先后顺序排列。
在一个示例中,用户在使用云游戏的云服务时用户使用的终端设备持续地与SaaS系统、PaaS系统及云游戏实例进行交互,在此过程中终端、SaaS系统、PaaS系统及云游戏实例中均会产生一些关键事件,从而在服务器设备100上运行的云服务异常检测程序能够通过主动获取和/或被动接收的方式监测单个用户在一次云游戏过程中依次触发了哪些关键事件,并将其以标识的序列的形式进行缓存,该标识的序列即上述事件标识序列。在一些实现方式中,将关键事件的名称直接用作关键事件的标识;在另一些实现方式中,经过筛选的各个关键事件事前被分配有不同的编号,在监测到任一关键事件时通过预先存储在服务器设备100上的编号对应关系得到相对应的关键事件的编号,以添加到由关键事件的编号组成的事件标识序列当中。
在步骤303中,在事件标识序列中标识的数量达到数量阈值时,将事件标识序列分别输入至预测模型的至少一个子模型,以得到预测模型的输出值。
其中,预测模型的子模型例如包括一元子模型、二元子模型和三元子模型中的至少一个;一元子模型用于在事件标识序列对应的关键事件的序列中一元小概率转移事件占一元转移事件的数量比例大于第一阈值时输出异常值,一元转移事件为两个连续的关键事件的标识所对应的关键事件按照标识的排列顺序依次被触发的事件,一元小概率转移事件为基于历史云服务数据确定的发生概率低于阈值的一元转移事件;二元子模型用于在事件标识序列对应的关键事件的序列中二元小概率转移事件占二元转移事件的数量比例大于第二阈值时输出异常值,二元转移事件为三个连续的关键事件的标识所对应的关键事件按照标识的排列顺序依次被触发的事件,二元小概率转移事件为基于历史云服务数据确定的发生概率低于阈值的二元转移事件;三元子模型用于在事件标识序列对应的关键事件的序列中三元小概率转移事件占三元转移事件的数量比例大于第三阈值时输出异常值,三元转移事件为四个连续的关键事件的标识所对应的关键事件按照标识的排列顺序依次被触发的事件,三元小概率转移事件为基于历史云服务数据确定的发生概率低于阈值的三元转移事件;预测模型用于在预测模型的子模型中的至少一个输出异常值时输出异常值。
举例来说,预测模型的子模型包括一元子模型、二元子模型和三元子模型,并且预测模型用于在一元子模型、二元子模型和三元子模型中的至少两个输出异常值时输出异常值。
一个事件标识序列{e12045,e12046,e12047,e12048,e12049}表示用户本次使用云服务中依次触发了对应标识为e12045、e12046、e12047、e12048和e12049的关键事件,其中一元转移事件为两个连续的关键事件的标识所对应的关键事件按照标识的排列顺序依次被触发的事件,因此该事件标识序列对应的关键事件的序列中一共存在有“e12045→e12046”、“e12046→e12047”、“e12047→e12048”、“e12048→e12049”四个一元转移事件。如果其中只有“e12046→e12047”属于一元小概率转移事件,且上述第一阈值被设置为0.2,那么该事件标识序列对应的关键事件的序列中一元小概率转移事件占一元转移事件的数量比例为1/4=0.25,由于该数量比例0.25大于第一阈值0.2,因此将该事件标识序列输入至一元子模型后该一元子模型输出异常值。
上述事件标识序列对应的关键事件的序列中,二元转移事件包括“e12045→e12046→e12047”、“e12046→e12047→e12048”和“e12047→e12048→e12049”共三个。如果其中没有二元小概率转移事件,且上述第二阈值被设置为0.15,那么由于二元小概率转移事件占二元转移事件的数量比例0小于第二阈值0.15,因而将该事件标识序列输入至二元子模型后该二元子模型不输出异常值。
上述事件标识序列对应的关键事件的序列中,三元转移事件包括“e12045→e12046→e12047→e12048”和“e12046→e12047→e12048→e12049”共两个。如果其中存在一个三元小概率转移事件,且上述第二阈值被设置为0.3,那么由于三元小概率转移事件占三元转移事件的数量比例0.5大于第三阈值0.3,因而将该事件标识序列输入至三元子模型后该三元子模型输出异常值。
此时,由于第一子模型和第三子模型输出异常值,满足了上述一元子模型、二元子模型和三元子模型中的至少两个输出异常值时输出异常值的条件,因而预测模型输出异常值。
在其他示例中,预测模型可以包括更多或更少的子模型。例如,预测模型可以仅包括二元子模型和三元子模型,从而上述步骤303中不再包含与一元子模型或一元转移事件相关的操作,而且预测模型在二元子模型和/或三元子模型输出异常值时输出异常值,云服务器上也不需要进行与上述第一阈值或一元小概率转移事件有关的配置。
在步骤304中,在预测模型输出异常值时,生成关于用户本次使用云服务的异常告警消息。
在一个示例中,在服务器设备100上运行的云服务异常检测程序在预测模型输出异常值时,生成关于用户本次使用云服务的异常告警消息,以进行记录和上报,并由此触发相关的响应操作。在一些实现方式中,响应于该异常告警消息,服务器向终端的用户发送“系统检测到云服务可能存在异常,请问您是否需要帮助?”的问询消息,并提供包括刷新画面、重新启动程序、重新启动系统等操作选项,由此触发问题上报和排除流程。
在步骤305中,在生成任一异常告警消息之后,获取并记录从异常告警消息生成到用户结束本次云服务的使用之间的时长,以及用户本次使用云服务的总时长。
在一个示例中,在生成任一异常告警消息之后,为了验证该异常告警消息的有效性,获取并记录从异常告警消息生成到用户结束本次云服务的使用之间的时长,以及用户本次使用云服务的总时长;如果用户在生成异常告警消息后很快结束了本次云服务的使用,或是用户本次使用云服务的总时长远远小于平均值,那么可以确定用户在本次使用云服务期间有很高的可能性发生了异常状况,从而响应于该异常告警消息,在服务器设备100上运行的云服务异常检测程序可以收集相关信息(包括上述时长)并生成异常检测报告以进行上报或存储,用来由后台人员进行异常状况的分析和排查。
可以看出,上述一元子模型、二元子模型和三元子模型能够以不同层次排查小概率转移事件,并在小概率转移事件的数量占比大于相应的阈值时输出异常值,从而具备能够灵敏识别出可能存在异常状况的云服务过程的能力——为了排除偶然出现的小概率转移事件被视作异常状况的情况发生,可以将一元、二元、三元中的至少两个层次上均出现小概率转移事件过多的情形视为异常状况,以减小偶然事件引发误报的可能性,提升检测云服务异常的准确率。而且,借助用户本次使用云服务的总时长和/或从异常告警消息生成到用户结束本次云服务的使用之间的时长,能够进一步提升被记录和上报的异常告警消息的真实性,帮助后台人员快速排查到问题所在并进行修复。
在一些可能的实现方式中,对于事件标识序列中标识数量过少的情形,预测模型可以直接判定正常而不输出异常值。示例性地,该标识数量阈值可以是4、5、6、7、8、9、10等等的数值,并可以依照应用需求进行选择。
此外,为了避免事件标识序列长度过大,可以限制事件标识序列的最大长度和/或删除事件标识序列中过期的标识。例如,在事件标识序列的标识数量超出最大限制数量时,可以从事件标识序列中第一个标识开始顺序进行标识删除直至符合小于最大限制数量;和/或,设置事件标识序列中的标识携带时间标记,并基于标识的时间标记周期性地删除事件标识序列中过期的标识。
图4是本申请实施例提供的一种一元子模型的生成原理示意图。为了方便说明,这里以关键事件仅有e12045、e12046、e12047、e12048和e12049标识的五种作为示例,应理解的是实际应用中关键事件的种类可能远远大于五种。参见图4,图4中上半部分的矩阵示出了一种示例性的关于历史云服务数据的统计信息。在一个示例中,历史云服务数据包括数量庞大的事件标识序列,其中每个事件标识序列均是由e12045、e12046、e12047、e12048和e12049五种元素按照用户使用云服务期间关键事件的触发时间顺序排列而成的。由此,可以对这些事件标识序列进行统计,分别确定每一种一元转移事件在这些事件标识序列对应的关键事件的序列中发生的次数。
例如,在图4中上半部分的矩阵,第一行和第一列分别为五种关键事件的标识,而第二行第二列的“859”代表了一元转移事件“e12045→e12045”在事件标识序列中一共发生了859次(即,这些事件标识序列中存在有859个两个e12045在同一事件标识序列连续出现的情形),第二行第三列的“10760”代表了一元转移事件“e12045→e12046”在事件标识序列中一共发生了10760次(即,这些事件标识序列中存在有10760个形如{e12045,e12046}的序列部分),矩阵中的其他数字含义依此类推。
在图4所示的示例中,下半部分的矩阵示出了每个一元转移事件的发生概率。例如,第二行第二列的“0.006”是通过859/(859+10760+366+84602+57376)计算得到的,即在五种一元转移事件“e12045→e12045”、“e12045→e12046”、“e12045→e12047”、“e12045→e12048”、“e12045→e12049”中,一元转移事件“e12045→e12045”发生的概率是通过其发生次数占e12045标识的关键事件发生后发生所有其它可能的关键事件对应的所有一元转移事件的总发生次数的数量比例计算得到的。类似地,第三行第二列的“0.510”是通过15132/(15132+1164+1053+1524+10774)计算得到的,其他数字含义依此类推。
基于上述统计和计算,可以看出不同一元转移事件在云服务期间的发生概率是存在很大差异的,由此可以根据应用需求选择不同的方式确定出一元小概率转移事件的判定条件。
作为一种一元小概率转移事件的判定条件示例,规定发生概率在起点为相同关键事件的一元转移事件中不为最大值的一元转移事件均为一元小概率转移事件。比如,五种一元转移事件“e12045→e12045”、“e12045→e12046”、“e12045→e12047”、“e12045→e12048”、“e12045→e12049”中,除了发生概率最大的“e12045→e12048”,其他四种一元转移事件“e12045→e12045”、“e12045→e12046”、“e12045→e12047”、“e12045→e12049”按照上述规定均属于一元小概率转移事件。由此,第一子模型记录四种一元小概率转移事件“e12045→e12045”、“e12045→e12046”、“e12045→e12047”、“e12045→e12049”,并在上述步骤303中用来判定事件标识序列中一元小概率转移事件占一元转移事件的数量比例是否大于第一阈值。
作为一种第一阈值的确定方式示例,在上述小概率转移事件的判定条件的基础上,使用历史云服务数据包括的带有正常标记的若干个第一事件标识序列和/或带有异常标记的若干个第二事件标识序列,来对一元子模型进行测试——通过把每个第一事件标识序列和/或每个第二事件标识序列输入一元子模型,能够得到每个第一事件标识序列和/或每个第二事件标识序列所对应的一元小概率转移事件的数量比例,比如三个第一事件标识序列的数量比例为0.32、0.15和0.35,三个第二事件标识序列的数量比例为0.66、0.96和0.73,从而可以例如取最接近两个数字之间平均值的方式,规定(0.66+0.35)/2=0.505作为上述第一阈值,用来在上述步骤303中判定事件标识序列中一元小概率转移事件占一元转移事件的数量比例是否大于第一阈值。
在又一示例中,通过下述方式确定第一阈值:使用历史云服务数据包括的带有正常标记的若干个第一事件标识序列和/或带有异常标记的若干个第二事件标识序列,分别计算第一阈值为1%、2%、3%、…、99%时第一事件标识序列和/或第二事件标识序列的识别准确率,从而将其中准确率最高的第一阈值确定为所要使用的第一阈值。
应当理解的是,上文以示例说明了得到一元子模型的可选方式,对于二元子模型和三元子模型,均可以按照同样的原理来获得,在此不再一一赘述。
图5是本申请实施例提供的又一种检测云服务异常的方法的部分步骤流程示意图,其提供了一种在用户不断触发新的关键事件时简便的检测云服务异常的方式。参见图5,其步骤流程可以应用于上述任意一种检测云服务异常的方法,并包括以下步骤流程。
在步骤501中,在将任一事件标识序列输入预测模型之后,获取并记录该事件标识序列对应的关键事件的序列中一元小概率转移事件、二元小概率转移事件和三元小概率转移事件中至少一类小概率转移事件的数量。
例如,在预测模型的子模型包括一元子模型、二元子模型和三元子模型时,需要获取并记录一元小概率转移事件、二元小概率转移事件和三元小概率转移事件的数量;在预测模型的子模型仅包括二元子模型和三元子模型时,仅需要获取并记录二元小概率转移事件和三元小概率转移事件的数量。
在步骤502中,在将一个新的关键事件的标识添加至事件标识序列之后,将第一关键事件、第二关键事件、第三关键事件和第四关键事件组成的三元转移事件输入三元子模型,以确定该三元转移事件是否为三元小概率转移事件。
其中,第四关键事件为上述新的关键事件,第三关键事件为事件标识序列中第四关键事件的标识的前一个标识对应的关键事件,第二关键事件为事件标识序列中第三关键事件的标识的前一个标识对应的关键事件,第一关键事件为事件标识序列中第二关键事件的标识的前一个标识对应的关键事件。
在步骤503中,将第二关键事件、第三关键事件和第四关键事件组成的二元转移事件输入二元子模型,以确定该二元转移事件是否为二元小概率转移事件。
在步骤504中,将第三关键事件和第四关键事件组成的一元转移事件输入一元子模型,以确定该一元转移事件是否为一元小概率转移事件。
在步骤505中,根据该三元转移事件、该二元转移事件以及该一元转移事件中至少一类转移事件的确定结果更新所记录的对应类型小概率转移事件的数量,并基于更新后的数量确定预测模型是否输出异常值。
需要说明的是,图5所示的步骤流程可以根据预测模型的子模型配置的不同而增加或减少。例如,在预测模型的子模型仅包括二元子模型和三元子模型时,上述步骤504可以被省去。
可以看出,上述步骤流程中,在将新的关键事件的标识添加至事件标识序列之后,预测模型对于添加后的事件标识序列的输出结果可以基于添加前的事件标识序列的输出结果来确定。例如,在将某个事件标识序列输入至预测模型之后,可以在上述步骤501中通过预测模型分别确定并记录其中一元小概率转移事件、二元小概率转移事件和三元小概率转移事件的数量A1、A2和A3;在该事件标识序列中被添加一个新的关键事件的标识时,可以按照上述步骤502、503和504将与该新的关键事件对应的一元转移事件、二元转移事件、三元转移事件分别输入至一元子模型、二元子模型和三元子模型,以确定是否出现了新的小概率转移事件;从而,在步骤505中,可以通过简单的数学运算就确定预测模型对于被添加一个新的关键事件的标识的事件标识序列的输出结果——例如,在与该新的关键事件对应的一元转移事件、二元转移事件均为小概率转移事件,而与该新的关键事件对应的三元转移事件不是小概率转移事件时,可以分别计算得到上述数量比例(A1+1)/(Nx-1)、(A2+1)/(Nx-2)和A3/(Nx-3),其中Nx为被添加一个新的关键事件的标识的事件标识序列中标识的总数量,从而由此确定预测模型是否输出异常值。通过上述计算方式,可以省去将一整个添加后的事件标识序列重新输入到预测模型进行复杂运算的麻烦,能够帮助减少计算量并加快跟踪式检测用户云服务异常的响应速度。
图6是本申请实施例提供的一种检测云服务异常的装置的结构框图。参见图6,该装置例如应用于服务器设备,并包括:获取模块61,用于获取用户在使用云服务时触发的关键事件的标识;添加模块62,用于将关键事件的标识添加至用户本次使用云服务的事件标识序列中,事件标识序列中的标识按照关键事件的时间先后顺序排列;输入模块63,用于将事件标识序列输入预测模型;其中,预测模型为使用历史云服务数据训练得到的机器学习模型,预测模型用于根据事件标识序列对应的关键事件的序列中的小概率转移事件的数量确定是否输出异常值,小概率转移事件为基于历史云服务数据确定的发生概率低于阈值的转移事件,转移事件为至少两个连续的关键事件的标识所对应的关键事件按照标识的排列顺序依次被触发的事件;生成模块64,用于在预测模型输出异常值时,生成关于用户本次使用云服务的异常告警消息。
在一些可能的实现方式中,预测模型包括一元子模型、二元子模型和三元子模型中的至少一个子模型,一元子模型用于在事件标识序列对应的关键事件的序列中一元小概率转移事件占一元转移事件的数量比例大于第一阈值时输出异常值,一元转移事件为两个连续的关键事件的标识所对应的关键事件按照标识的排列顺序依次被触发的事件,一元小概率转移事件为基于历史云服务数据确定的发生概率低于阈值的一元转移事件;二元子模型用于在事件标识序列对应的关键事件的序列中二元小概率转移事件占二元转移事件的数量比例大于第二阈值时输出异常值,二元转移事件为三个连续的关键事件的标识所对应的关键事件按照标识的排列顺序依次被触发的事件,二元小概率转移事件为基于历史云服务数据确定的发生概率低于阈值的二元转移事件;三元子模型用于在事件标识序列对应的关键事件的序列中三元小概率转移事件占三元转移事件的数量比例大于第三阈值时输出异常值,三元转移事件为四个连续的关键事件的标识所对应的关键事件按照标识的排列顺序依次被触发的事件,三元小概率转移事件为基于历史云服务数据确定的发生概率低于阈值的三元转移事件;预测模型用于在预测模型的子模型中的至少一个输出异常值时输出异常值。
在一些可能的实现方式中,输入模块63还用于:在将任一事件标识序列输入预测模型之后,获取并记录该事件标识序列对应的关键事件的序列中一元小概率转移事件、二元小概率转移事件和三元小概率转移事件中至少一类小概率转移事件的数量;以及,在将一个新的关键事件的标识添加至该事件标识序列之后,将第一关键事件、第二关键事件、第三关键事件和第四关键事件组成的三元转移事件输入三元子模型,以确定该三元转移事件是否为三元小概率转移事件;其中,第四关键事件为新的关键事件,第三关键事件为事件标识序列中第四关键事件的标识的前一个标识对应的关键事件,第二关键事件为事件标识序列中第三关键事件的标识的前一个标识对应的关键事件,第一关键事件为事件标识序列中第二关键事件的标识的前一个标识对应的关键事件;和/或将第二关键事件、第三关键事件和第四关键事件组成的二元转移事件输入二元子模型,以确定该二元转移事件是否为二元小概率转移事件;和/或将第三关键事件和第四关键事件组成的一元转移事件输入一元子模型,以确定该一元转移事件是否为一元小概率转移事件;根据该三元转移事件、该二元转移事件以及该一元转移事件中至少一类转移事件的确定结果更新所记录的对应类型小概率转移事件的数量,并基于更新后的数量确定预测模型是否输出异常值。
在一些可能的实现方式中,历史云服务数据包括带有正常标记的若干个第一事件标识序列和/或带有异常标记的若干个第二事件标识序列,第一阈值通过利用至少一个第一事件标识序列和/或至少一个第二事件标识序列对一元子模型进行测试来确定,第二阈值通过利用至少一个第一事件标识序列和/或至少一个第二事件标识序列对二元子模型进行测试来确定,第三阈值通过利用至少一个第一事件标识序列和/或至少一个第二事件标识序列对三元子模型进行测试而确定。
在一些可能的实现方式中,生成模块64还用于:在生成任一异常告警消息之后,获取并记录从异常告警消息生成到用户结束本次云服务的使用之间的时长;和/或,在生成任一异常告警消息之后,获取并记录用户本次使用云服务的总时长。
在一些可能的实现方式中,云服务包括通过接收用户使用的终端设备的用户输入数据并向终端设备发送包括应用程序的用户界面的视频数据、以使用户能够远程运行应用程序的服务,关键事件包括在运行云服务的云服务器上完成对视频数据的第一帧的渲染操作产生的事件。
本申请实施例提供的检测云服务异常的装置,其实现过程与本申请实施例提供的检测云服务异常的方法一致,所能达到的效果也与本申请实施例提供的检测云服务异常的方法相同,在此不再赘述。
图7是本申请实施例提供的一种服务器设备的结构框图。参见图7,该服务器设备包括处理器71和用于存储该处理器71的可执行指令的存储器72;其中,该处理器71用于执行所述可执行指令,以实现上述任意一种检测云服务异常的方法。以上文所述的任意一种服务器设备为例,本申请实施例的服务器设备能够利用预测模型实时判断用户本次使用云服务的过程中是否存在异常,在海量的日志数据中精确地找到可能存在异常的云服务并进行告警,使得云服务的提供商能够及时地发现并处理云服务中存在的异常状况,帮助减少云服务中异常状况的发生,提升云服务的服务质量。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质为非易失性的存储介质,且该存储介质存储有处理器的可执行指令,该可执行指令被配置为在被处理器执行时使处理器实现上述任意一种的方法。以上述存储器62为例,本申请实施例的计算机可读存储介质能够用来实现上述任意一种检测云服务异常的方法,因而能够利用预测模型实时判断用户本次使用云服务的过程中是否存在异常,在海量的日志数据中精确地找到可能存在异常的云服务并进行告警,使得云服务的提供商能够及时地发现并处理云服务中存在的异常状况,帮助减少云服务中异常状况的发生,提升云服务的服务质量。
以上所述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种检测云服务异常的方法,其特征在于,所述方法包括:
获取用户在使用云服务时触发的关键事件的标识;
将所述关键事件的标识添加至所述用户本次使用云服务的事件标识序列中,所述事件标识序列中的标识按照关键事件的时间先后顺序排列;
将所述事件标识序列输入预测模型,以确定所述预测模型是否输出异常值;其中,所述预测模型为使用历史云服务数据训练得到的机器学习模型,所述预测模型用于根据所述事件标识序列对应的关键事件的序列中的小概率转移事件的数量确定是否输出异常值,所述小概率转移事件为基于所述历史云服务数据确定的发生概率低于阈值的转移事件,所述转移事件为至少两个连续的关键事件的标识所对应的关键事件按照标识的排列顺序依次被触发的事件;
在所述预测模型输出异常值时,生成关于所述用户本次使用云服务的异常告警消息。
2.根据权利要求1所述的方法,其特征在于,所述预测模型包括一元子模型、二元子模型和三元子模型中的至少一个子模型,
所述一元子模型用于在所述事件标识序列对应的关键事件的序列中一元小概率转移事件占一元转移事件的数量比例大于第一阈值时输出异常值,所述一元转移事件为两个连续的关键事件的标识所对应的关键事件按照标识的排列顺序依次被触发的事件,所述一元小概率转移事件为基于所述历史云服务数据确定的发生概率低于阈值的一元转移事件;
所述二元子模型用于在所述事件标识序列对应的关键事件的序列中二元小概率转移事件占二元转移事件的数量比例大于第二阈值时输出异常值,所述二元转移事件为三个连续的关键事件的标识所对应的关键事件按照标识的排列顺序依次被触发的事件,所述二元小概率转移事件为基于所述历史云服务数据确定的发生概率低于阈值的二元转移事件;
所述三元子模型用于在所述事件标识序列对应的关键事件的序列中三元小概率转移事件占三元转移事件的数量比例大于第三阈值时输出异常值,所述三元转移事件为四个连续的关键事件的标识所对应的关键事件按照标识的排列顺序依次被触发的事件,所述三元小概率转移事件为基于所述历史云服务数据确定的发生概率低于阈值的三元转移事件;
所述预测模型用于在所述预测模型的子模型中至少一个输出异常值时输出异常值。
3.根据权利要求2所述的方法,其特征在于,所述预测模型包括所述一元子模型、所述二元子模型和所述三元子模型,所述预测模型用于在所述一元子模型、所述二元子模型和所述三元子模型中的至少两个输出异常值时输出异常值,所述方法还包括:
在将任一所述事件标识序列输入预测模型之后,获取并记录该事件标识序列对应的关键事件的序列中所述一元小概率转移事件、所述二元小概率转移事件和所述三元小概率转移事件的数量;
在将一个新的关键事件的标识添加至该事件标识序列之后,所述将所述事件标识序列输入预测模型,以确定所述预测模型是否输出异常值,包括:
将第一关键事件、第二关键事件、第三关键事件和第四关键事件组成的三元转移事件输入所述三元子模型,以确定该三元转移事件是否为所述三元小概率转移事件;其中,所述第四关键事件为所述新的关键事件,所述第三关键事件为所述事件标识序列中所述第四关键事件的标识的前一个标识对应的关键事件,所述第二关键事件为所述事件标识序列中所述第三关键事件的标识的前一个标识对应的关键事件,所述第一关键事件为所述事件标识序列中所述第二关键事件的标识的前一个标识对应的关键事件;
将所述第二关键事件、所述第三关键事件和所述第四关键事件组成的二元转移事件输入所述二元子模型,以确定该二元转移事件是否为所述二元小概率转移事件;
将所述第三关键事件和所述第四关键事件组成的一元转移事件输入所述一元子模型,以确定该一元转移事件是否为所述一元小概率转移事件;
根据该三元转移事件、该二元转移事件以及该一元转移事件的确定结果更新所记录的所述一元小概率转移事件、所述二元小概率转移事件和所述三元小概率转移事件的数量,并基于更新后的数量确定所述预测模型是否输出异常值。
4.根据权利要求2所述的方法,其特征在于,所述历史云服务数据包括带有正常标记的若干个第一事件标识序列和/或带有异常标记的若干个第二事件标识序列,所述第一阈值通过利用至少一个所述第一事件标识序列和/或至少一个第二事件标识序列对所述一元子模型进行测试来确定,所述第二阈值通过利用至少一个所述第一事件标识序列和/或至少一个第二事件标识序列对所述二元子模型进行测试来确定,所述第三阈值通过利用至少一个所述第一事件标识序列和/或至少一个第二事件标识序列对所述三元子模型进行测试而确定。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述方法还包括:
在生成任一所述异常告警消息之后,获取并记录从所述异常告警消息生成到所述用户结束本次云服务的使用之间的时长。
6.根据权利要求1至4中任一项所述的方法,其特征在于,所述方法还包括:
在生成任一所述异常告警消息之后,获取并记录所述用户本次使用云服务的总时长。
7.根据权利要求1所述的方法,其特征在于,所述云服务包括通过接收所述用户使用的终端设备的用户输入数据并向所述终端设备发送包括应用程序的用户界面的视频数据、以使所述用户能够远程运行所述应用程序的服务,所述关键事件包括在运行所述云服务的云服务器上完成对所述视频数据的第一帧的渲染操作产生的事件。
8.一种检测云服务异常的装置,其特征在于,所述装置包括:
获取模块,用于获取用户在使用云服务时触发的关键事件的标识;
添加模块,用于将所述关键事件的标识添加至所述用户本次使用云服务的事件标识序列中,所述事件标识序列中的标识按照关键事件的时间先后顺序排列;
输入模块,用于将所述事件标识序列输入预测模型;其中,所述预测模型为使用历史云服务数据训练得到的机器学习模型,所述预测模型用于根据所述事件标识序列对应的关键事件的序列中的小概率转移事件的数量确定是否输出异常值,所述小概率转移事件为基于所述历史云服务数据确定的发生概率低于阈值的转移事件,所述转移事件为至少两个连续的关键事件的标识所对应的关键事件按照标识的排列顺序依次被触发的事件;
生成模块,用于在所述预测模型输出异常值时,生成关于所述用户本次使用云服务的异常告警消息。
9.一种服务器设备,其特征在于,所述服务器设备包括:
处理器;
用于存储所述处理器的可执行指令的存储器;
其中,所述处理器用于执行所述可执行指令,以实现如权利要求1至7中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有处理器的可执行指令,所述可执行指令被配置为在被处理器执行时使所述处理器实现如权利要求1至7中任一项所述的方法。
CN202310877640.XA 2023-07-18 2023-07-18 检测云服务异常的方法、服务器设备和存储介质 Pending CN116599861A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310877640.XA CN116599861A (zh) 2023-07-18 2023-07-18 检测云服务异常的方法、服务器设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310877640.XA CN116599861A (zh) 2023-07-18 2023-07-18 检测云服务异常的方法、服务器设备和存储介质

Publications (1)

Publication Number Publication Date
CN116599861A true CN116599861A (zh) 2023-08-15

Family

ID=87590344

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310877640.XA Pending CN116599861A (zh) 2023-07-18 2023-07-18 检测云服务异常的方法、服务器设备和存储介质

Country Status (1)

Country Link
CN (1) CN116599861A (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106713312A (zh) * 2016-12-21 2017-05-24 深圳市深信服电子科技有限公司 检测非法域名的方法及装置
CN106911668A (zh) * 2017-01-10 2017-06-30 同济大学 一种基于用户行为模型的身份认证方法及系统
WO2018066661A1 (ja) * 2016-10-06 2018-04-12 日本電気株式会社 ログ分析方法、システムおよび記録媒体
CN109889538A (zh) * 2019-03-20 2019-06-14 中国工商银行股份有限公司 用户异常行为检测方法及系统
CN111368290A (zh) * 2018-12-26 2020-07-03 中兴通讯股份有限公司 一种数据异常检测方法、装置及终端设备
CN111476610A (zh) * 2020-04-16 2020-07-31 腾讯科技(深圳)有限公司 一种信息检测方法、装置及计算机可读存储介质
CN112231174A (zh) * 2020-09-30 2021-01-15 中国银联股份有限公司 异常告警方法、装置、设备及存储介质
CN113992340A (zh) * 2021-09-09 2022-01-28 奇安信科技集团股份有限公司 用户异常行为识别方法、装置、设备、存储介质和程序
CN114357849A (zh) * 2020-10-13 2022-04-15 华为终端有限公司 用户行为异常检测方法、系统及终端设备
CN115238831A (zh) * 2022-09-21 2022-10-25 中国南方电网有限责任公司超高压输电公司广州局 故障预测方法、装置、计算机设备、存储介质和程序产品
CN115834156A (zh) * 2022-11-07 2023-03-21 北京云集智造科技有限公司 一种基于web访问日志的异常行为检测方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018066661A1 (ja) * 2016-10-06 2018-04-12 日本電気株式会社 ログ分析方法、システムおよび記録媒体
CN106713312A (zh) * 2016-12-21 2017-05-24 深圳市深信服电子科技有限公司 检测非法域名的方法及装置
CN106911668A (zh) * 2017-01-10 2017-06-30 同济大学 一种基于用户行为模型的身份认证方法及系统
CN111368290A (zh) * 2018-12-26 2020-07-03 中兴通讯股份有限公司 一种数据异常检测方法、装置及终端设备
CN109889538A (zh) * 2019-03-20 2019-06-14 中国工商银行股份有限公司 用户异常行为检测方法及系统
CN111476610A (zh) * 2020-04-16 2020-07-31 腾讯科技(深圳)有限公司 一种信息检测方法、装置及计算机可读存储介质
CN112231174A (zh) * 2020-09-30 2021-01-15 中国银联股份有限公司 异常告警方法、装置、设备及存储介质
CN114357849A (zh) * 2020-10-13 2022-04-15 华为终端有限公司 用户行为异常检测方法、系统及终端设备
CN113992340A (zh) * 2021-09-09 2022-01-28 奇安信科技集团股份有限公司 用户异常行为识别方法、装置、设备、存储介质和程序
CN115238831A (zh) * 2022-09-21 2022-10-25 中国南方电网有限责任公司超高压输电公司广州局 故障预测方法、装置、计算机设备、存储介质和程序产品
CN115834156A (zh) * 2022-11-07 2023-03-21 北京云集智造科技有限公司 一种基于web访问日志的异常行为检测方法

Similar Documents

Publication Publication Date Title
US9672085B2 (en) Adaptive fault diagnosis
CN106656536B (zh) 一种用于处理服务调用信息的方法与设备
JP4942939B2 (ja) 他のコンピュータシステムのコンフィギュレーションに基づいてコンピュータシステムのミスコンフィギュレーションをトラブルシューティングする方法およびシステム
CN110209820B (zh) 用户标识检测方法、装置及存储介质
US8516499B2 (en) Assistance in performing action responsive to detected event
TW201941058A (zh) 異常檢測方法及裝置
US11310140B2 (en) Mitigating failure in request handling
US11057787B2 (en) Method and test system for mobile network testing as well as prediction system
CN110224885B (zh) 设备监控的告警方法、装置、存储介质及电子设备
CN111694644A (zh) 基于机器人操作系统的消息处理方法、装置及计算机设备
CN112737800B (zh) 服务节点故障定位方法、调用链生成方法及服务器
CN112751711B (zh) 告警信息处理方法和装置、存储介质和电子设备
CN112040506B (zh) 一种无线传感网络的可靠性评估方法、装置及存储介质
CN113986595A (zh) 一种异常定位方法及装置
CN110222513B (zh) 一种线上活动的异常监测方法、装置及存储介质
CN111611140A (zh) 埋点数据的上报验证方法、装置、电子设备及存储介质
CN110113392A (zh) 一种监控app客户端埋点采集完整性的方法及设备
CN116418653A (zh) 基于多指标根因定位算法的故障定位方法及装置
CN116599861A (zh) 检测云服务异常的方法、服务器设备和存储介质
WO2020227985A1 (en) Real-time fault detection on network devices and circuits based on traffic volume statistics
CN113901153B (zh) 数据处理方法及相关设备
CN113609202B (zh) 数据处理方法及装置
CN111935279B (zh) 基于区块链和大数据的物联网络维护方法及计算节点
AU2014200806B1 (en) Adaptive fault diagnosis
CN115587010A (zh) 一种告警收敛方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20230815