CN114546759B - 数据库访问错误监测、分析方法、装置和电子设备 - Google Patents

数据库访问错误监测、分析方法、装置和电子设备 Download PDF

Info

Publication number
CN114546759B
CN114546759B CN202210041051.3A CN202210041051A CN114546759B CN 114546759 B CN114546759 B CN 114546759B CN 202210041051 A CN202210041051 A CN 202210041051A CN 114546759 B CN114546759 B CN 114546759B
Authority
CN
China
Prior art keywords
error
database
database access
command
clustering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210041051.3A
Other languages
English (en)
Other versions
CN114546759A (zh
Inventor
杨金全
韦远奎
李磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Keynote Network Inc
Original Assignee
Beijing Keynote Network Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Keynote Network Inc filed Critical Beijing Keynote Network Inc
Priority to CN202210041051.3A priority Critical patent/CN114546759B/zh
Publication of CN114546759A publication Critical patent/CN114546759A/zh
Application granted granted Critical
Publication of CN114546759B publication Critical patent/CN114546759B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification

Abstract

本公开提供一种数据库访问错误监测、分析方法、装置和电子设备,其中,数据库访问错误监测方法,包括:监听业务请求的数据库访问;在监听到数据库访问的情况下,获取数据库访问对应的数据库实例信息和数据库命令;在检测到数据库访问发生错误的情况下,获取错误的错误类型和错误消息;将错误类型和错误消息与数据库实例信息和数据库命令关联,形成业务请求对应的数据库访问错误数据。通过本公开的一个或多个技术方案,可监测数据库访问错误。

Description

数据库访问错误监测、分析方法、装置和电子设备
技术领域
本公开涉及数据处理技术领域,尤其涉及数据库访问错误监测、分析方法、装置和电子设备。
背景技术
很多应用使用数据库,当访问数据库时出现错误时,很难定位该错误发生的原因,导致用户体验下降,业务受损。
相关技术中,处理方法根据应用的异常日志进行分析。然而,基于数据库访问错误日志分析错误原因难以实时准确的分析数据库错误发生的根因。
发明内容
本公开提供了一种数据库访问错误监测、分析方法、装置和电子设备,以至少实现数据库访问的监测。
根据本公开的一方面,提供了一种数据库访问错误监测方法,包括:监听业务请求的数据库访问;在监听到数据库访问的情况下,获取数据库访问对应的数据库实例信息和数据库命令;在检测到数据库访问发生错误的情况下,获取错误的错误类型和错误消息;将错误类型和错误消息与数据库实例信息和数据库命令关联,形成业务请求对应的数据库访问错误数据。
根据本公开的另一方面,提供了一种数据库访问错误分析方法,包括:在数据库实例的数据库访问错误数据的第一集合中,确定目标错误类型在第一集合中对应的第二集合,其中,数据库访问错误数据包括错误类型、错误消息、数据库实例信息和数据库命令,目标错误类型选自第一集合中的错误类型;对第二集合中的数据库命令进行第一聚类,得到命令聚类表示及其在第二集合中对应的第三集合;对目标命令聚类表示对应的第三集合中的错误消息进行第二聚类,得到目标命令聚类表示对应的消息聚类表示,其中,目标命令聚类表示选自第一聚类得到的命令聚类表示。
根据本公开的又一方面,提供了一种数据库访问错误分析方法,包括:对数据库实例的数据库访问错误数据的第一集合中的数据库命令进行第一聚类,得到命令聚类表示及其在第一集合中对应的第二集合,其中,数据库访问错误数据包括:错误类型、错误消息、数据库实例信息和数据库命令;在目标命令聚类表示对应的第二集合中,确定目标命令聚类表示包含的错误类型及其在第二集合中对应的第三集合,其中,目标命令聚类表示选自第一聚类得到的命令聚类表示;对目标错误类型对应的第三集合中的错误消息进行第二聚类,得到目标错误类型对应的消息聚类表示,其中,目标错误类型选自目标命令聚类表示包含的错误类型。
根据本公开的又一方面,提供了一种数据库访问错误监测装置,包括:监听模块,用于监听业务请求的数据库访问;第一获取模块,用于在监听到数据库访问的情况下,获取数据库访问对应的数据库实例信息和数据库命令;第二获取模块,用于在检测到数据库访问发生错误的情况下,获取错误的错误类型和错误消息;关联模块,用于将错误类型和错误消息与数据库实例信息和数据库命令关联,形成业务请求对应的数据库访问错误数据。
根据本公开的又一方面,提供了一种数据库访问错误分析装置,包括:确定模块,用于在数据库实例的数据库访问错误数据的第一集合中,确定目标错误类型在第一集合中对应的第二集合,其中,数据库访问错误数据包括错误类型、错误消息、数据库实例信息和数据库命令,目标错误类型选自第一集合中的错误类型;第一聚类模块,用于对第二集合中的数据库命令进行第一聚类,得到命令聚类表示及其在第二集合中对应的第三集合;第二聚类模块,用于对目标命令聚类表示对应的第三集合中的错误消息进行第二聚类,得到目标命令聚类表示对应的消息聚类表示,其中,目标命令聚类表示选自第一聚类得到的命令聚类表示。
根据本公开的又一方面,提供了一种数据库访问错误分析装置,包括:第一聚类模块,用于对数据库实例的数据库访问错误数据的第一集合中的数据库命令进行第一聚类,得到命令聚类表示及其在第一集合中对应的第二集合,其中,数据库访问错误数据包括:错误类型、错误消息、数据库实例信息和数据库命令;确定模块,用于在目标命令聚类表示对应的第二集合中,确定目标命令聚类表示包含的错误类型及其在第二集合中对应的第三集合,其中,目标命令聚类表示选自第一聚类得到的命令聚类表示;第二聚类模块,用于对目标错误类型对应的第三集合中的错误消息进行第二聚类,得到目标错误类型对应的消息聚类表示,其中,目标错误类型选自目标命令聚类表示包含的错误类型。
根据本公开的又一方面,提供了一种电子设备,包括:处理器;以及存储程序的存储器,其中,程序包括指令,指令在由处理器执行时使处理器执行本公开实施例的数据库访问错误监测方法或数据库访问错误分析方法。
根据本公开的再一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行本公开实施例的数据库访问错误监测方法或数据库访问错误分析方法。
本公开实施例中提供的一个或多个技术方案,实现对业务请求的数据库访问的监测,将错误类型和错误消息与数据库实例信息和数据库命令关联,形成业务请求对应的数据库访问错误数据,便于分析数据库访问错误原因。
附图说明
在下面结合附图对于示例性实施例的描述中,本公开的更多细节、特征和优点被公开,在附图中:
图1示出了本公开示例性实施例的数据库访问错误监测方法的流程图;
图2示出了本公开示例性实施例的基于调用链追踪的数据库访问错误监测方法的流程图;
图3示出了本公开示例性实施例的基于APM Agent获取数据库访问错误数据的方法的流程图;
图4示出了本公开示例性实施例的数据库访问错误分析方法的流程图;
图5示出了本公开示例性实施例的错误类型的统计指标的图形用户界面;
图6示出了本公开示例性实施例的命令聚类表示的统计指标的图形用户界面;
图7示出了本公开示例性实施例的数据库访问错误分析方法的另一流程图;
图8示出了本公开示例性实施例的数据库访问错误监测装置的示意性框图;
图9示出了本公开示例性实施例的数据库访问错误分析装置的示意性框图;
图10示出了本公开示例性实施例的数据库访问错误分析装置的另一示意性框图;
图11示出了能够用于实现本公开的实施例的示例性电子设备的结构框图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
本公开的一些实施例涉及数据库访问错误监测的改进,本公开的另一些实施例涉及数据库访问错误分析的改进。下面结合附图对本公开的方案进行描述。
本公开示例性实施例提供了一种数据库访问错误监测方法,下面以采集探针实现数据库访问错误监测方法为例进行说明,采集探针采集应用的数据,对应用的业务请求进行监测,该应用可包括但不限于单体应用、微服务系统中的服务单元。
图1示出了本公开示例性实施例的数据库访问错误监测方法的流程图,如图1所示,该方法包括步骤S101至步骤S104。
步骤S101,采集探针监听业务请求的数据库访问。
步骤S102,采集探针在监听到数据库访问的情况下,获取数据库访问对应的数据库实例信息和数据库命令。
步骤S103,采集探针在检测到数据库访问发生错误的情况下,获取错误的错误类型和错误消息。
步骤S104,采集探针将错误类型和错误消息与数据库实例信息和数据库命令关联,形成业务请求对应的数据库访问错误数据。
在本实施例中,实现了数据库访问错误数据的采集和关联,可降低数据库访问错误分析的成本,提高数据库访问错误分析的效果。
作为一种实施方式,在步骤S101中,响应于业务请求,监听数据库驱动中被标识为数据库访问的方法。采集探针可采用埋点等方式监听被标识为数据库访问的方法,本实施例对此不作限定。
在步骤S102中,数据库实例信息可用于标识数据库实例,数据库实例信息可包括但不限于:数据库类型(例如MySQL、Oracle、TiDB等)、数据库地址(例如数据库服务所在的主机IP或域名,比如10.2.193.214,db.demo.com)和数据库服务进程对应的端口(例如3306,1521等)。作为一种实施方式,将数据库实例信息联合形成数据库实例的标识。作为一个示例,数据库实例的标识可表示为MySQL/10.2.193.214:3306。
在一些实施例中,采集探针在监听到数据库访问的情况下,还可获取数据库访问对应的数据库库名(Schema),将数据库库名与数据库访问错误数据关联。对于一个数据库实例操作多个数据库的情形,可分别分析数据库实例的不同数据库库名对应的数据库访问错误,实现更为精细化的分析。作为一种实施方式,将数据库实例信息和数据库库名联合形成不同数据库实例的数据库库名的标识。作为一个示例,数据库实例的数据库库名的标识可表示为MySQL/10.2.193.214:3306/vens_conf,其中vens_conf为数据库库名。
在一些实施例中,采集探针响应于业务请求,获取业务请求对应的用户信息;将用户信息与数据库访问错误数据关联。将用户信息和数据库访问关联,可用于分析数据库访问错误对用户的影响,例如,一个或多个数据库访问错误影响的用户数。作为一种示例,用户信息可包括用户标识,用户标识的示例可包括但不限于用户名、手机号、卡号等。
作为一种实施方式,通过调用链追踪将用户信息与数据库访问错误数据关联。作为一中示例,微服务系统中,在业务请求开始时,进行调用链跟踪,创建业务请求对应的调用链ID,采集探针将业务请求的用户信息与调用链ID关联。调用链在服务单元之间传递,采集探针从传递的调用链中获取用户信息,或者将数据库访问错误数据关联到调用链,在调用链路上传递。例如,采集探针在调用链路上的首个服务单元获取用户信息并关联到调用链,并在调用链路上传递,采集探针在调用链下游监测到数据库访问错误时将数据库访问错误数据与调用链关联,并在调用链路上传递。
在一些实施例中,采集探针响应于业务请求,获取业务请求对应的业务数据,将业务数据与数据库访问错误数据关联。将业务请求过程中产生的业务数据采集出来与数据库访问关联,可用于评估数据库访问错误对业务的影响。业务数据的示例可包括但不限于:租户ID、渠道号、订单号、产品ID、转账金额等。数据库访问错误对业务的影响可包括但不限于:受影响的租户、受影响的订单号、受影响的转账总金额等。
作为一种实施方式,通过调用链追踪将业务数据与数据库访问错误数据关联。对于业务数据分布于不同的服务单元的情形,调用链追踪可获得完整的业务数据。作为一种示例,微服务系统中,在业务请求开始时,进行调用链跟踪,创建业务请求对应的调用链ID,采集探针在一个或多个服务单元获取业务请求的业务数据并与调用链ID关联。调用链在服务单元之间传递,采集探针从传递的调用链中获取业务数据,或者将数据库访问错误数据关联到调用链,在调用链路上传递。例如,采集探针将调用链路上的一个或多个服务单元中获取部分业务数据关联到调用链,并在调用链路上传递,采集探针在监测到数据库访问错误时将数据库访问错误数据与调用链关联,并在调用链路上传递,可获得完整的业务数据并将其与数据库访问错误数据关联。
在一些实施例中,采集探针将数据库访问错误数据与业务请求对应的调用链关联。在微服务系统中,通过将数据库访问错误数据关联到调用链,可将多个服务单元的数据库访问错误数据关联起来,可用于对业务请求全过程分析。作为一种实施方式,数据库访问错误数据作为调用链数据的一部分。作为另一种实施方式,将数据库访问错误数据与调用链ID关联起来,从而基于数据库访问错误数据关联的调用链ID,获得对应的调用链数据。
下面对基于调用链追踪的数据库访问错误监测方法进行说明。
图2示出了本公开示例性实施例的基于调用链追踪的数据库访问错误监测方法的流程图,如图2所示,该方法包括步骤S201至步骤S208。
步骤S201,响应于业务请求,采集探针为该业务请求创建调用链。调用链具有调用链ID。
步骤S202,采集探针在执行该业务请求的一个或多个服务单元采集用户信息和/或业务数据,并将用户信息和/或业务数据关联到调用链。
在步骤S202中,用户信息可包括用户名等,业务数据可包括购买的商品名称、支付的订单金额等。
步骤S203,采集探针监听是否出现数据库访问,在监听到数据库访问的情况下,进入步骤S204。
步骤S204,采集探针获取数据库访问的数据库实例信息。在步骤S204中,可获取数据库类型、数据库地址和数据库服务进程对应的端口,还可获取数据库库名。
步骤S205,采集探针获取数据库访问的数据库命令。数据库命令可包括SQL语句及SQL参数。
步骤S206,采集探针监听数据库访问是否出现错误,在监听到数据库访问出现错误的情况下,进入步骤S207。
步骤S207,采集探针获取错误类型及错误消息。例如通过对Exception Handler进行Hook来获取错误类型及错误消息,但不限于此。
步骤S208,采集探针将获取的数据关联到调用链。
请求结束后,采集探针将调用链的数据发送到服务器。该调用链的数据中包括调用链ID、数据库实例信息、数据库库名(可选)、数据库命令、错误类型和错误消息,以及其他一项或多项调用链监测数据。
图3示出了本公开示例性实施例的基于APM Agent(代理)获取数据库访问错误数据的方法的流程图,如图3所示,该方法包括步骤S301至步骤S304。
步骤S301,应用启动时,嵌入APM Agent,APM Agent启动开始。
步骤S302,对Exception Handler进行Hook。
步骤S303,对数据库驱动进行适配,标识数据库驱动中特定方法的执行为数据库访问。
步骤S304,APM agent启动结束。
APM agent启动结束后进行调用链追踪和数据库访问错误监测。
本公开示例性实施例提供了一种数据库访问错误分析方法,该方法由一个或多个位置中一个或多个计算机上实现。该一个或多个位置中的一个或多个计算机可包括终端和/或服务端及其他具备计算能力的设备。下面以服务端实现数据库访问错误分析方法为例进行说明。
图4示出了本公开示例性实施例的数据库访问错误分析方法的流程图,该方法可定位数据库访问错误的原因,如图4所示,该方法包括步骤S401至步骤S403。
步骤S401,服务器在数据库实例的数据库访问错误数据的第一集合中,确定目标错误类型在第一集合中对应的第二集合。
数据库访问错误数据包括错误类型、错误消息、数据库实例信息和数据库命令。数据库访问错误数据可通过本公开前述实施例的方法采集。
步骤S401中基于数据库实例信息确定数据库访问错误数据对应的数据库实例。
步骤S401中的第一集合可根据一个或多个条件确定,例如时间范围等,本实施例对此不作限定。
第一集合中可包含一种或多种错误类型,可选择一种或多种错误类型作为目标错误类型,对选择的目标错误类型进行分析。
在本实施例中,对每个目标错误类型分别进行分析。每个目标错误类型对应于一个第二集合。例如,选择第一错误类型为目标错误类型,则第二集合为错误类型为第一错误类型的数据库访问错误数据。选择第一错误类型为第一目标错误类型,同时选择第二错误类型为第二目标错误类型,则第一目标错误类型对应的第二集合为错误类型为第一错误类型的数据库访问错误数据,则第二目标错误类型对应的第二集合为错误类型为第二错误类型的数据库访问错误数据。
在本实施例中,以选择一个目标错误类型为例进行说明。在选择多个目标错误类型时,多个目标错误类型可分别进行类似的分析。
步骤S402,服务器对第二集合中的数据库命令进行第一聚类,得到命令聚类表示及其在第二集合中对应的第三集合。
在步骤S402中,通过进行第一聚类将第二集合中的数据库命令分成由类似的数据库命令组成的多个类。由聚类所生成的簇是一组数据库命令的集合,这些数据库命令与同一个簇中的数据库命令彼此相似,与其他簇中的数据库命令相异。
命令聚类表示用于描述聚类生成的簇,命令聚类表示描述簇中的数据库命令的相似特征。
在步骤S402中,多个数据库命令可聚类为一个命令聚类表示。例如,第二集合中包括M个数据库访问错误数据,具有M个数据库命令,经过第一聚类可得到N个命令聚类表示,其中,N一般小于或远远小于M。N个命令聚类表示中的每个命令聚类表示由相应的数据库命令聚类得到,例如,命令聚类表示N1由M1个数据库命令得到,命令聚类表示N1则对应于该M1个数据库访问错误数据,命令聚类表示N1在第二集合中对应的第三集合为该M1个数据库访问错误数据。其中,该M1个数据库命令为聚类生成的簇,命令聚类表示N1为该M1个数据库命令的相似特征的描述。
步骤S403,服务器对目标命令聚类表示对应的第三集合中的错误消息进行第二聚类,得到目标命令聚类表示对应的消息聚类表示。
步骤S403中,目标命令聚类表示选自步骤S402进行第一聚类得到的一个或多个命令聚类表示。
步骤S403中,可选择一个或多个目标命令聚类表示。在本实施例中,以选择一个目标命令聚类表示为例进行说明。在选择多个目标命令聚类表示时,可对每个目标命令聚类表示分别进行处理。
在步骤S403中,通过进行第二聚类将目标命令聚类表示对应的第三集合中的错误消息分成由类似的错误消息组成的多个类。由聚类所生成的簇是一组错误消息的集合,这些错误消息与同一个簇中的错误消息彼此相似,与其他簇中的错误消息相异。
消息聚类表示用于描述聚类生成的簇,消息聚类表示描述簇中的错误消息的相似特征。
接前述示例,选择命令聚类表示N1为目标命令聚类表示,目标命令聚类表示对应的第三集合为前述M1个数据库访问错误数据,对该M1个数据库访问错误数据中的错误消息进行第二聚类,得到消息聚类表示。
进一步的示例,该M1个数据库访问错误数据中可包含M1个错误消息,M1个错误消息可聚类得到P个消息聚类表示,一般P小于或远远小于M1。
在本实施例中,对一个或多个错误类型分别进行分析,对于每个错误类型,对错误类型对应的数据库命令进行聚类,确定出该错误类型对应的命令聚类表示,从而得到导致该错误类型的数据库命令的归类,也就是哪几类数据库命令导致了该错误类型;进一步的,对一个或多个命令聚类表示分别进行分析,对于每个命令聚类表示,对命令聚类表示对应的数据库命令关联的错误消息进行聚类,确定出消息聚类表示,从而得到该类数据库命令导致数据库访问错误的原因归类。由此定位出数据库访问错误的原因。并且,基于错误类型和数据库命令的分析,缩小分析范围,可得到更精确的错误原因。
在一些实施例中,可确定第二聚类得到的消息聚类表示的第一统计指标。该第一统计指标可包括但不限于各个消息聚类表示在目标命令聚类表示对应的第三集合中的数据库访问错误出现的次数和/或占比。作为一种示例,P个消息聚类表示对应于目标命令聚类表示对应的第三集合所包含的Q个数据库访问错误,其中,消息聚类表示P1对应于Q1个数据库访问错误,则消息聚类表示P1对应的占比为Q1/Q。类似的,P2对应于Q2个数据库访问错误,P2对应的占比为Q2/Q。
在一些实施例中,可确定第一集合中包含的错误类型的第二统计指标。该第二统计指标可包括但不限于第一集合中包含的各个错误类型在第一集合中的数据库访问错误出现的次数和/或占比。
作为一种实施方式,基于第二统计指标和第一预设规则确定目标错误类型。作为一种示例,将第二统计指标中次数最多的错误类型作为目标错误类型。作为另一种示例,将第二统计指标中次数超过预设次数的错误类型作为目标错误类型。在确定出多个目标错误类型时,对每个目标错误类型分别进行步骤S402和步骤S403的处理。
作为另一种实施方式,将第二统计指标提供给用户,例如显示第二统计指标的图形用户界面,示例性的图形用户界面如图5所示。由此,可使用户获知每个错误类型的严重程度。进一步的,接收用户选择的错误类型,例如,第二统计指标中次数最多的错误类型,以用户选择的错误类型为目标错误类型。在确定出多个目标错误类型时,对每个目标错误类型分别进行步骤S402和步骤S403的处理。
在一些实施例中,可确定第一聚类得到的命令聚类表示的第三统计指标。该第三统计指标包括第一聚类得到的各个命令聚类表示在第二集合中的数据库访问错误出现的次数和/或占比。
作为一种实施方式,基于第三统计指标和第二预设规则确定目标命令聚类表示。作为一种示例,将第三统计指标中次数最多的命令聚类表示作为目标命令聚类表示。作为另一种示例,将第三统计指标中次数超过预设次数的命令聚类表示作为目标命令聚类表示。在确定出多个目标命令聚类表示时,对每个目标命令聚类表示分别进行步骤S403的处理。
作为另一种实施方式,将第三统计指标提供给用户,例如显示第三统计指标的图形用户界面,示例性的图形用户界面如图6所示。由此,可使用户获知每个命令聚类表示的严重程度。进一步的,接收用户选择的命令聚类表示,例如,第三统计指标中次数最多的命令聚类表示,以用户选择的命令聚类表示为目标命令聚类表示。在确定出多个目标命令聚类表示时,对每个命令聚类表示类型分别进行步骤S403的处理。
在一些实施例中,可确定第一集合中包含的错误类型的第二统计指标,该第二统计指标可包括但不限于第一集合中包含的错误类型在第一集合中的数据库访问错误出现的次数和/或占比,基于第二统计指标和第一预设规则确定目标错误类型。进一步的,可确定第一聚类得到的命令聚类表示的第三统计指标,该第三统计指标包括第一聚类得到的各个命令聚类表示在第二集合中的数据库访问错误出现的次数和/或占比,基于第三统计指标和第二预设规则确定目标命令聚类表示。进一步的,可确定第二聚类得到的消息聚类表示的第一统计指标,该第一统计指标可包括但不限于各个消息聚类表示在目标命令聚类表示对应的第三集合中的数据库访问错误出现的次数和/或占比。
在一些实施例,可确定第一集合中包含的错误类型的第二统计指标,该第二统计指标可包括但不限于第一集合中包含的各个错误类型在第一集合中的数据库访问错误出现的次数和/或占比,将第二统计指标提供给用户,例如显示第二统计指标的图形用户界面,示例性的图形用户界面如图5所示;接收用户选择的错误类型,例如,第二统计指标中次数最多的错误类型,以用户选择的错误类型为目标错误类型。进一步的,可确定第一聚类得到的命令聚类表示的第三统计指标,该第三统计指标包括第一聚类得到的各个命令聚类表示在第二集合中的数据库访问错误出现的次数和/或占比,将第三统计指标提供给用户,例如显示第三统计指标的图形用户界面,示例性的图形用户界面如图6所示;接收用户选择的命令聚类表示,例如,第三统计指标中次数最多的命令聚类表示,以用户选择的命令聚类表示为目标命令聚类表示。进一步的,可确定第二聚类得到的消息聚类表示的第一统计指标,该第一统计指标可包括但不限于各个消息聚类表示在目标命令聚类表示对应第三集合中的数据库访问错误出现的次数和/或占比,将第一统计指标提供给用户。
在一些实施例中,数据库访问错误数据与用户信息关联。可基于数据库访问错误数据关联的用户信息,分析数据库访问错误对用户的影响。
作为一种实施方式,根据用户信息确定第二聚类得到的消息聚类表示在目标命令聚类表示对应的第三集合中的用户统计信息,该用户统计信息可提供给用户。作为一种示例,确定各个消息聚类表示对应的用户,并统计每个用户对应的数据库访问错误的次数和/或占比。例如,接前述示例,消息聚类表示P1对应于目标命令聚类表示对应的第三集合所包含的Q1个数据库访问错误,Q1个数据库访问错误对应于X个用户,用户X1对应于X11次数据库访问错误,用户X2对应于X21次数据库访问错误。
作为一种实施方式,根据用户信息确定第一集合中包含的错误类型在第一集合中的用户统计信息,该用户统计信息可提供给用户。作为一种示例,确定各个错误类型对应的用户,并统计每个用户对应的数据库访问错误的次数和/或占比。例如,第一集合包括Y种错误类型,错误类型Y1对应于Y11个数据库访问错误,Y11个数据库访问错误对应于X个用户,用户X1对应于X11次数据库访问错误,用户X2对应于X21次数据库访问错误。
作为一种实施方式,根据用户信息确定第一聚类得到的命令聚类表示在第二集合的用户统计信息,该用户统计信息可提供给用户。作为一种示例,确定各个命令聚类表示对应的用户,并统计每个用户对应的数据库访问错误的次数和/或占比。例如,接前述示例,命令聚类表示N1对应于第二集合所包含的M1个数据库访问错误,M1个数据库访问错误对应于X个用户,用户X1对应于X11次数据库访问错误,用户X2对应于X21次数据库访问错误。
在一些实施中,数据库访问错误数据与业务数据关联。可基于数据库访问错误数据关联的业务数据分析数据库访问错误对业务的影响。
作为一种实施方式,根据业务数据确定第二聚类得到的消息聚类表示在目标命令聚类表示对应的第三集合中的业务统计信息。作为一种示例,确定各个消息聚类表示对应的商品,并统计每个商品对应的数据库访问错误的次数和/或占比。例如,消息聚类表示P1对应于目标命令聚类表示对应的第三集合所包含的Q1个数据库访问错误,Q1个数据库访问错误对应于X个商品,商品X1对应于X11次数据库访问错误,商品X2对应于X21次数据库访问错误。作为另一种示例,确定各个消息聚类表示对应的转账金额,确定每个消息聚类表示对应的转账总金额。例如,消息聚类表示P1对应于目标命令聚类表示对应的第三集合所包含的Q1个数据库访问错误,Q1个数据库访问错误包括X个转账金额,则消息聚类表示P1对应的转账总金额可为X个转账金额之和。
作为一种实施方式,根据业务数据确定第一集合中包含的错误类型在第一集合中的业务统计信息。作为一种示例,确定各个错误类型对应的商品,并统计每个商品对应的数据库访问错误的次数和/或占比。例如,第一集合包括Y种错误类型,错误类型Y1对应于Y11个数据库访问错误,Y11个数据库访问错误对应于X个商品,商品X1对应于X11次数据库访问错误,商品X2对应于X21次数据库访问错误。作为另一种示例,确定各个错误类型对应的转账金额,确定每个消息聚类表示对应的转账总金额。例如,第一集合包括Y种错误类型,错误类型Y1对应于Y11个数据库访问错误,Y11个数据库访问错误对应于X个转账金额,则错误类型Y1对应的转账总金额可为X个转账金额之和。
作为一种实施方式,根据业务数据确定第一聚类得到的命令聚类表示在第二集合的业务统计信息。作为一种示例,确定各个命令聚类表示对应的商品,并统计每个商品对应的数据库访问错误的次数和/或占比。例如,命令聚类表示N1对应于第二集合所包含的M1个数据库访问错误,M1个数据库访问错误对应于X个商品,商品X1对应于X11次数据库访问错误,商品X2对应于X21次数据库访问错误。作为另一种示例,确定各个命令聚类表示对应的转账金额,确定每个命令聚类表示对应的转账总金额。例如,命令聚类表示N1对应于第二集合所包含的M1个数据库访问错误,M1个数据库访问错误对应于X个转账金额,则命令聚类表示N1对应的转账总金额可为X个转账金额之和。
本公开示例性实施例还提供了另一种数据库访问错误分析方法。
图7示出了本公开示例性实施例的数据库访问错误分析方法的另一流程图,如图7所示,该方法包括步骤S701至步骤S703。
步骤S701,服务器对数据库实例的数据库访问错误数据的第一集合中的数据库命令进行第一聚类,得到命令聚类表示及其在第一集合中对应的第二集合。
数据库访问错误数据包括:错误类型、错误消息、数据库实例信息和数据库命令。数据库访问错误数据可通过本公开前述实施例的方法采集。
步骤S701中基于数据库实例信息确定数据库访问错误数据对应的数据库实例。
步骤S701中的第一集合可根据一个或多个条件确定,例如时间范围等,本实施例对此不作限定。
在步骤S701中,通过进行第一聚类将第一集合中的数据库命令分成由类似的数据库命令组成的多个类。由聚类所生成的簇是一组数据库命令的集合,这些数据库命令与同一个簇中的数据库命令彼此相似,与其他簇中的数据库命令相异。
命令聚类表示用于描述聚类生成的簇,命令聚类表示描述簇中的数据库命令的相似特征。
在步骤S701中,多个数据库命令可聚类为一个命令聚类表示。例如,第一集合中包括M个数据库访问错误数据,具有M个数据库命令,经过第一聚类可得到N个命令聚类表示,其中,N一般小于或远远小于M。N个命令聚类表示中的每个命令聚类表示由相应的数据库命令聚类得到,例如,命令聚类表示N1由M1个数据库命令得到,命令聚类表示N1则对应于该M1个数据库访问错误数据,命令聚类表示N1在第一集合中对应的第二集合为该M1个数据库访问错误数据。其中,该M1个数据库命令为聚类生成的簇,命令聚类表示N1为该M1个数据库命令的相似特征的描述。
步骤S702,服务器在目标命令聚类表示对应的第二集合中,确定目标命令聚类表示包含的错误类型及其在第二集合中对应的第三集合。
在步骤S702中,目标命令聚类表示选自第一聚类得到的命令聚类表示。
在步骤S702中,可选择一个或多个目标命令聚类表示。在本实施例中,以选择一个目标命令聚类表示为例进行说明。在选择多个目标命令聚类表示时,可对每个目标命令聚类表示分别进行处理。
接前述示例,选择命令聚类表示N1为目标命令聚类表示,目标命令聚类表示对应的第二集合为前述M1个数据库访问错误数据。该M1个数据库访问错误可包含P种错误类型,每种错误类型包含一个或多个数据库访问错误数据。例如,错误类型P1,包含前述M1个数据库访问错误中的Q1个数据库访问错误数据,该Q1个数据库访问错误数据即为错误类型P1在第二集合中的第三集合。类似的,错误类型P2,包含前述M1个数据库访问错误中的Q2个数据库访问错误数据,该Q2个数据库访问错误数据即为错误类型P2在第二集合中的第三集合。
步骤S703,服务器对目标错误类型对应的第三集合中的错误消息进行第二聚类,得到目标错误类型对应的消息聚类表示。
在步骤S703中,目标错误类型选自目标命令聚类表示包含的错误类型。
在本实施例中,对每个目标错误类型分别进行分析。每个目标错误类型对应于一个第三集合。例如,选择第一错误类型为目标错误类型,则第三集合为错误类型为第一错误类型的数据库访问错误数据。选择第一错误类型为第一目标错误类型,同时选择第二错误类型为第二目标错误类型,则第一目标错误类型对应的第三集合为错误类型为第一错误类型的数据库访问错误数据,则第二目标错误类型对应的第三集合为错误类型为第二错误类型的数据库访问错误数据。
在本实施例中,以选择一个目标错误类型为例进行说明。在选择多个目标错误类型时,多个目标错误类型可分别进行类似的分析。
在步骤S703中,通过进行第二聚类将目标错误类型对应的第三集合中的错误消息分成由类似的错误消息组成的多个类。由聚类所生成的簇是一组错误消息的集合,这些错误消息与同一个簇中的错误消息彼此相似,与其他簇中的错误消息相异。
消息聚类表示用于描述聚类生成的簇,消息聚类表示描述簇中的错误消息的相似特征。
接前述示例,选择错误类型P1为目标错误类型,目标错误类型对应的第三集合为前述Q1个数据库访问错误数据,对该Q1个数据库访问错误数据中的错误消息进行第二聚类,得到消息聚类表示。
进一步的示例,该Q1个数据库访问错误数据中可包含Y1个错误消息,Y1个错误消息可聚类得到Z个消息聚类表示,一般Z小于或远远小于Y1。
在本实施例中,对数据库访问错误数据的集合中数据库命令进行聚类,得到数据库命令的归类,确定归类包含的错误类型,可获得数据库命令发生的错误类型。进一步的,对错误类型对应的错误消息进行聚类,得到错误消息的归类,可定位得到错误类型的原因。并且,基于错误类型和数据库命令的分析,缩小分析范围,可得到更精确的错误原因。
在一些实施例中,可确定第二聚类得到的消息聚类表示的第一统计指标。该第一统计指标可包括但不限于各个消息聚类表示在目标错误类型对应的第三集合中的数据库访问错误出现的次数和/或占比。作为一种示例,Z个消息聚类表示对应于在目标错误类型对应的第三集合所包含的Q个数据库访问错误,其中,消息聚类表示Z1对应于Q1个数据库访问错误,则消息聚类表示Z1对应的占比为Q1/Q。类似的,Z2对应于Q2个数据库访问错误,Z2对应的占比为Q2/Q。
在一些实施例中,可确定目标命令聚类表示包含的错误类型的第二统计指标。该第二统计指标可包括该各个错误类型在目标命令聚类表示对应的第二集合中的数据库访问错误出现的次数和/或占比。
作为一种实施方式,基于第二统计指标和第一预设规则确定目标错误类型。作为一种示例,将第二统计指标中次数最多的错误类型作为目标错误类型。作为另一种示例,将第二统计指标中次数超过预设次数的错误类型作为目标错误类型。在确定出多个目标错误类型时,对每个目标错误类型分别进行步骤S703的处理。
作为另一种实施方式,将第二统计指标提供给用户,例如显示第二统计指标的图形用户界面,示例性的图形用户界面如图5所示。由此,可使用户获知每个错误类型的严重程度。进一步的,接收用户选择的错误类型,例如,第二统计指标中次数最多的错误类型,以用户选择的错误类型为目标错误类型。在确定出多个目标错误类型时,对每个目标错误类型分别进行步骤S703的处理。
在一些实施例中,可确定第一聚类得到的命令聚类表示的第三统计指标,第三统计指标包括第一聚类得到的命令聚类表示在第一集合中的数据库访问错误出现的次数和/或占比。
作为一种实施方式,基于第三统计指标和第二预设规则确定目标命令聚类表示。作为一种示例,将第三统计指标中次数最多的命令聚类表示作为目标命令聚类表示。作为另一种示例,将第三统计指标中次数超过预设次数的命令聚类表示作为目标命令聚类表示。在确定出多个目标命令聚类表示时,对每个目标命令聚类表示分别进行步骤S702和步骤S703的处理。
作为另一种实施方式,将第三统计指标提供给用户,例如显示第三统计指标的图形用户界面,示例性的图形用户界面如图6所示。由此,可使用户获知每个命令聚类表示的严重程度。进一步的,接收用户选择的命令聚类表示,例如,第三统计指标中次数最多的命令聚类表示,以用户选择的命令聚类表示为目标命令聚类表示。在确定出多个目标命令聚类表示时,对每个命令聚类表示类型分别进行步骤S702和步骤S703的处理。
在一些实施例中,可确定第一聚类得到的命令聚类表示的第三统计指标,该第三统计指标包括第一聚类得到的命令聚类表示在第一集合中的数据库访问错误出现的次数和/或占比,基于第三统计指标和第二预设规则确定目标命令聚类表示。进一步的,可确定目标命令聚类表示对应的第二集合中包含的各个错误类型的第二统计指标,该第二统计指标可包括但不限于该各个错误类型在目标命令聚类表示对应的第二集合中的数据库访问错误出现的次数和/或占比,基于第二统计指标和第一预设规则确定目标错误类型。进一步的,可确定第二聚类得到的消息聚类表示的第一统计指标,该第一统计指标可包括但不限于各个消息聚类表示在目标错误类型对应的第三集合中的数据库访问错误出现的次数和/或占比。
在一些实施例,可确定第一聚类得到的命令聚类表示的第三统计指标,该第三统计指标包括各个命令聚类表示在第一集合中的数据库访问错误出现的次数和/或占比,将第三统计指标提供给用户,例如显示第三统计指标的图形用户界面,示例性的图形用户界面如图6所示;接收用户选择的命令聚类表示,例如,第三统计指标中次数最多的命令聚类表示,以用户选择的命令聚类表示为目标命令聚类表示。进一步的,可确定目标命令聚类表示对应的第二集合中包含的各个错误类型的第二统计指标,该第二统计指标可包括但不限于该各个错误类型在目标命令聚类表示对应的第二集合中的数据库访问错误出现的次数和/或占比,将第二统计指标提供给用户,例如显示第二统计指标的图形用户界面,示例性的图形用户界面如图5所示;接收用户选择的错误类型,例如,第二统计指标中次数最多的错误类型,以用户选择的错误类型为目标错误类型。进一步的,可确定第二聚类得到的消息聚类表示的第一统计指标,该第一统计指标可包括但不限于各个消息聚类表示在目标错误类型对应的第三集合中的数据库访问错误出现的次数和/或占比,将第一统计指标提供给用户。
在一些实施例中,数据库访问错误数据于用户信息关联。可基于数据库访问错误数据关联的用户信息,分析数据库访问错误对用户的影响。
作为一种实施方式,根据用户信息确定第二聚类得到的消息聚类表示在目标错误类型对应的第三集合中的用户统计信息,该用户统计信息可提供给用户。作为一种示例,确定各个消息聚类表示对应的用户,并统计每个用户对应的数据库访问错误的次数和/或占比。例如,接前述示例,消息聚类表示P1对应于目标错误类型对应的第三集合所包含的Q1个数据库访问错误,Q1个数据库访问错误对应于X个用户,用户X1对应于X11次数据库访问错误,用户X2对应于X21次数据库访问错误。
作为一种实施方式,根据用户信息确定目标命令聚类表示包含的各个错误类型在目标命令聚类表示对应的第二集合中的用户统计信息,该用户统计信息可提供给用户。作为一种示例,确定该各个错误类型对应的用户,并统计每个用户对应的数据库访问错误的次数和/或占比。例如,目标命令聚类表示对应的第二集合包括Y种错误类型,错误类型Y1对应于Y11个数据库访问错误,Y11个数据库访问错误对应于X个用户,用户X1对应于X11次数据库访问错误,用户X2对应于X21次数据库访问错误。
作为一种实施方式,根据用户信息确定第一聚类得到的各个命令聚类表示在第一集合中的用户统计信息,该用户统计信息可提供给用户。作为一种示例,确定各个命令聚类表示对应的用户,并统计每个用户对应的数据库访问错误的次数和/或占比。例如,命令聚类表示N1对应于M1个数据库访问错误,M1个数据库访问错误对应于X个用户,用户X1对应于X11次数据库访问错误,用户X2对应于X21次数据库访问错误。
在一些实施中,数据库访问错误数据与业务数据关联。可基于数据库访问错误数据关联的业务数据分析数据库访问错误对业务的影响。
作为一种实施方式,根据业务数据确定第二聚类得到的消息聚类表示在目标错误类型对应的第三集合中的业务统计信息。作为一种示例,确定各个消息聚类表示对应的商品,并统计每个商品对应的数据库访问错误的次数和/或占比。例如,消息聚类表示P1对应于Q1个数据库访问错误,Q1个数据库访问错误对应于X个商品,商品X1对应于X11次数据库访问错误,商品X2对应于X21次数据库访问错误。作为另一种示例,确定各个消息聚类表示对应的转账金额,确定每个消息聚类表示对应的转账总金额。例如,消息聚类表示P1对应于Q1个数据库访问错误,Q1个数据库访问错误包括X个转账金额,则消息聚类表示P1对应的转账总金额可为X个转账金额之和。
作为一种实施方式,根据业务数据确定第二集合中包含的错误类型在目标命令聚类表示对应的第二集合中的业务统计信息。作为一种示例,确定各个错误类型对应的商品,并统计每个商品对应的数据库访问错误的次数和/或占比。例如,目标命令聚类表示对应的第二集合包括Y种错误类型,错误类型Y1对应于该第二集合包含的Y11个数据库访问错误,Y11个数据库访问错误对应于X个商品,商品X1对应于X11次数据库访问错误,商品X2对应于X21次数据库访问错误。作为另一种示例,确定各个错误类型对应的转账金额,确定每个消息聚类表示对应的转账总金额。例如,目标命令聚类表示对应的第二集合包括Y种错误类型,错误类型Y1对应于Y11个数据库访问错误,Y11个数据库访问错误对应于X个转账金额,则错误类型Y1对应的转账总金额可为X个转账金额之和。
作为一种实施方式,根据业务数据确定第一聚类得到的命令聚类表示在第一集合中的业务统计信息。作为一种示例,确定各个命令聚类表示对应的商品,并统计每个商品对应的数据库访问错误的次数和/或占比。例如,命令聚类表示N1对应于第一集合中的M1个数据库访问错误,M1个数据库访问错误对应于X个商品,商品X1对应于X11次数据库访问错误,商品X2对应于X21次数据库访问错误。作为另一种示例,确定各个命令聚类表示对应的转账金额,确定每个命令聚类表示对应的转账总金额。例如,命令聚类表示N1对应于第一集合中的M1个数据库访问错误,M1个数据库访问错误对应于X个转账金额,则命令聚类表示N1对应的转账总金额可为X个转账金额之和。
下面对本公开示例性实施例的第一聚类和第二聚类进行说明。
在一些实施例中,基于第一预设规则进行第一聚类,其中,第一预设规则基于数据库命令的语法。作为一种实施方式,基于第一预设规则进行第一聚类,包括以下至少之一:将数据库命令中的参数(Parameters)替换为第一字符(例如占位符“?”);将数据库命令中的字段名替换为第二字符(例如“…”);删除数据库命令中对数据库对象的操作之外的其余操作;在数据库命令超过预设字符数时,对数据库命令进行截取,得到预设字符数的部分,例如,数据库命令超过2000个字符时进行截断,预设字符数可配置,如将2000调整为20000。
在一些实施例中,基于第一聚类模型进行第一聚类。第一聚类模型为机器学习模型。作为一种实施方式,第一聚类模型包括划分聚类模型,例如K-Means模型等。作为另一种实施方式,第一聚类模型为神经网络模型,例如自组织映射网络(Self-Organizing Maps,简称为SOM)模型等。
在一些实施例中,基于第一聚类模型和第一预设规则进行第一聚类。
在一些实施例中,基于第二预设规则进行第二聚类,其中,第二预设规则基于数据库驱动中错误消息的定义。作为一种实施方式,第二预设规则为对错误消息中的变量(例如,纯数字、通用唯一识别码(UUID)、MD5等)进行模糊化混淆处理。
在一些实施例中,基于第二聚类模型进行第二聚类。作为一种实施方式,基于第二聚类模型识别错误消息中的变量;对识别到的变量进行模糊化混淆处理。第二聚类模型可包括划分聚类模型、SOM模型等。
在一些实施例中,基于第二聚类模型和第二预设规则进行第二聚类。作为一种实施方式,基于第二预设规则对数据库系统返回的错误消息进行第二聚类,基于第二聚类模型对用户定义的错误的错误消息进行第二聚类。
下面对公开的一个具体实施例进行描述。
在本实施例中,通过APM探针实时获取IT应用在访问数据库过程中发生的各种错误,将错误的产生都关联访问IT系统的用户,请求参数、上下文、业务数据(如订单号、手机号、卡号等),以及完整调用链的数据,数据库访问SQL语句,数据库访问SQL参数,错误日志、错误消息、代码堆栈、主机、中间件、进程等数据。通过对SQL语句、错误消息、代码调用栈进行聚合算法学习、训练,推导错误的根因;通过时序多指标关联分析,分析多指标的相关性分析。
在本实施例中,自动分析数据库访问错误根因的方法,包括:步骤(1)获取数据库访问错误数据;步骤(2)对错误进行趋势分析;步骤(3)对错误类型进行分类统计汇总;步骤(4)对数据库访问SQL进行分类统计汇总;步骤(5)对错误消息进行聚合分析;步骤(6)得出根因。
步骤(1)中获取数据库访问错误数据使用APM探针,自动注入、拦截Exceptionhandle、获取方法参数等。在本实施例中将数据库访问错误定义为:应用在使用数据库驱动访问(查询、插入、更新等)数据库系统时,产生的数据库错误。本步骤中APM探针对不同数据库系统厂商(如:Oracle、MySQL、SQL Server、PostgreSQL等)提供的驱动进行适配,拦截数据库访问核心方法,从而获取数据库访问时发生的代码错误,并将该错误归类为数据库类型错误,获取错误类型、错误消息、代码堆栈、数据库实例、数据库Schema、SQL语句、SQL参数等信息。
其中,步骤(1)使用APM代理(Agent)获取数据库访问错误数据,包括以下几个步骤:1)、启动时,嵌入APM Agent,对Exception Handler进行Hook;2)、对数据库驱动进行适配,标识数据库驱动中特定方法的执行为数据库访问;3)、运行时,当数据库驱动中特定方法的执行发出错误时,获取错误类型和错误消息,数据库实例、数据库Schema、SQL语句等信息。
步骤(2)中识别到数据类型错误后,关联到某一个数据库实例和Schema上,首先对数据库实例统计错误次数;以数据库实例为单位,对数据库实例进行数据库访问错误的趋势分析。错误相关指标可包括:请求数、错误数、错误率等。
其中,步骤(2)对数据库访问错误进行汇总统计,可包括1)、数据库实例维度汇总数据库访问错误次数,计算错误占比;2)、数据库实例错误分析维度、按时间序列,统计每分钟数据库访问次数,错误次数,错误率等。
步骤(3)中对错误类型进行分类统计汇总。对于数据库访问错误类型分类的统计则关注各个分类的错误次数、错误率、影响的用户数(例如,共6位用户受到影响,可列出用户信息和对应的错误次数、错误占比)、业务影响范围(例如,共6个产品受到影响,可列出产品ID和对应的错误次、错误占比)。
在上述步骤中,数据库访问错误的采集中,包含了数据库访问SQL语句信息,同一个错误类型,可能有多个SQL语句的执行导致,因此在步骤(4)对SQL语句进行聚类分析,以缩小根因分析的范围。
其中,步骤(3)对数据库访问错误类型,通过聚类算法,统计每个错误类型的次数,计算其在所有数据库访问错误中的占比。按照占比倒序排序,列出错误类型列表。同时需要列出影响用户数和业务影响范围。
用户为访问当前业务的真实用户,通过用户名、手机号、卡号等信息标识。依托APM全链路监控能力,将用户和数据库访问关联,当数据库访问出现错误的时候,即可以知道,该数据库访问错误影响的用户数。
业务数据是企业服务数据中的核心数据。业务数据经常存储在调用链的各个节点,如:请求参数、方法入参、方法返回值等。依托APM探针的数据采集能力,结合全链路监控能力,将业务访问过程中产生的业务数据(如:租户ID、渠道号、订单号、基金产品ID、转账金额等)采集出来跟数据库访问关联,当数据库访问出现错误时,即可以评估对业务的影响(如:受影响的租户、受影响的订单号、受影响的转账总金额等)。
步骤(4)中通过针对某一个特定数据库错误类型,分析引起该错误的SQL语句的分类占比。每一次数据库异常发生时,APM探针都可获取SQL语句,通过对多次SQL的聚合分析,可以得到SQL语句的分布情况。例如,如下表所示。
SQL语句(聚类表示) 次数
insert into test_user2 values(?,to_char(sysdate,?)) 1232
select x from test_user 387
insert into test_user(?)values(?) 195
insert into test_user(id)values(?) 195
insert into test_user(id,name)values(?,to_char(sysdate,?)) 195
步骤(4)在上述步骤(3)中,列出了数据库访问错误类型的名称及其占比,选择一个错误类型,分析该类型哪些SQL语句产生,包括SQL语句、发出错误的次数、以及占比。包含以下几个步骤:1)、采集SQL语句;2)、关联SQL语句与数据库访问错误;3)、SQL聚类统计,统计SQL引发数据库访问错误的次数;4)、计算错误占比。
SQL的聚类分析,基于规则或基于机器学习模型,可将SQL语句中的变量(如:纯数字、UUID、AI学习的变量等)混淆模糊处理,以保证统计的准确性。
在步骤(4)中,同一类型的SQL参数的错误类型通常一致,基于错误类型+SQL语句的分析,缩小根因分析的范围,以便得到更精确的错误根本原因。
步骤(5)是依据在上述步骤(4)的SQL语句的分析,分析该SQL在执行过程中,抛出数据库错误的错误消息。错误消息经常包含变量,因此,对错误消息进行聚合学习,例如基于规则或基于机器学习模型,从而得到错误消息的占比,根据占比排序,推导数据库访问异常的根本原因,例如,“100%因为ORA-*:table or view does not exist”。
其中,步骤(5)对错误消息进行聚合分析。经过步骤(4)的联合分析,已经锁定一类SQL发生的具体错误类型,本步骤将该错误类型的错误消息(指Exception Message)进行聚合分析。错误消息具备多样性,分为两种类型:
类型一由数据库系统返回,数据库驱动中定义,具有一定的规则。类似:
“ORA-0001:Dup_val_on_index”
“ORA-6533:Subscript-beyond-count”
“ORA-00019:超出最大会话许可数”
“……”
类型二用户定义的错误等,具有随机性,没有规则。
因此,对错误消息基于规则或基于机器学习模型进行分词、聚类和识别变量。规则包括纯数字、UUID,MD5等;基于机器学习模型,可经过学习,以识别错误消息中的变量。识别到变量后,进行模糊化混淆处理,处理的结果再次进行聚合分析统计。统计的结果包含,聚合后的错误消息及其占比。
步骤(6)根据上述步骤,即可得出数据库访问错误的根因。例如前述的“100%因为ORA-*:table or view does not exist”。可以得到错误类型的占比、SQL分布占比以及错误消息占比,三项占比最高的即可认为该错误的根因。
下面对实现本公开实施例的方法的装置进行描述。
图8示出了本公开示例性实施例的数据库访问错误监测装置的示意性框图,如图8所示,该装置包括:监听模块810,用于监听业务请求的数据库访问。第一获取模块820,与舰艇模块810连接,用于在监听到数据库访问的情况下,获取数据库访问对应的数据库实例信息和数据库命令。第二获取模块830,与第一获取模块820连接,用于在检测到数据库访问发生错误的情况下,获取错误的错误类型和错误消息。关联模块840,与第一获取模块820和第二获取模块830连接,用于将错误类型和错误消息与数据库实例信息和数据库命令关联,形成业务请求对应的数据库访问错误数据。
在一些实施例中,数据库访问错误监测装置还包括:用于在监听到数据库访问的情况下,获取数据库访问对应的数据库库名的模块。关联模块840,还用于将数据库库名与数据库访问错误数据关联。
在一些实施例中,数据库访问错误监测装置还包括:用于响应于业务请求,获取业务请求对应的用户信息的模块。关联模块840,还用于将用户信息与数据库访问错误数据关联。
在一些实施例中,数据库访问错误监测装置还包括:用于响应于业务请求,获取业务请求对应的业务数据的模块。关联模块840,还用于将业务数据与数据库访问错误数据关联。
在一些实施例中,关联模块840,还用于将数据库访问错误数据与业务请求对应的调用链关联。
在一些实施例中,监听模块810,用于响应于业务请求,监听数据库驱动中被标识为数据库访问的方法。
图9示出了本公开示例性实施例的数据库访问错误分析装置的示意性框图,如图9所示,该装置包括:确定模块910,用于在数据库实例的数据库访问错误数据的第一集合中,确定目标错误类型在第一集合中对应的第二集合,目标错误类型选自第一集合中的错误类型。第一聚类模块920,与确定模块910连接,用于对第二集合中的数据库命令进行第一聚类,得到命令聚类表示及其在第二集合中对应的第三集合。第二聚类模块930,与第一聚类模块920相连,用于对目标命令聚类表示对应的第三集合中的错误消息进行第二聚类,得到目标命令聚类表示对应的消息聚类表示,其中,目标命令聚类表示选自第一聚类得到的命令聚类表示。
在一些实施例中,确定模块910还用于:
确定第二聚类得到的消息聚类表示的第一统计指标,第一统计指标包括各个消息聚类表示在目标命令聚类表示对应的第三集合中的数据库访问错误出现的次数和/或占比;和/或
确定第一集合中包含的错误类型的第二统计指标,第二统计指标包括第一集合中包含的错误类型在第一集合中的数据库访问错误出现的次数和/或占比;和/或
确定第一聚类得到的命令聚类表示的第三统计指标,第三统计指标包括第一聚类得到的命令聚类表示在第二集合中的数据库访问错误出现的次数和/或占比。
在一些实施例中,确定模块910还用于:
根据用户信息确定第二聚类得到的消息聚类表示在目标命令聚类表示对应的第三集合中的用户统计信息;和/或
根据用户信息确定第一集合中包含的错误类型在第一集合中的用户统计信息;和/或
根据用户信息确定第一聚类得到的命令聚类表示在第二集合中的用户统计信息。
在一些实施例中,确定模块910还用于:
根据业务数据确定第二聚类得到的消息聚类表示在目标命令聚类表示对应的第三集合中的业务统计信息;和/或
根据业务数据确定第一集合中包含的错误类型在第一集合中的业务统计信息;和/或
根据业务数据确定第一聚类得到的命令聚类表示在第二集合中的业务统计信息。
在一些实施例中,第一聚类模块920,用于基于第一预设规则和/或第一聚类模型进行第一聚类,其中,第一预设规则基于数据库命令的语法。
在一些实施例中,第一聚类模块920,用于基于第一预设规则进行第一聚类,包括以下至少之一:将数据库命令中的参数替换为第一字符;将数据库命令中的字段名替换为第二字符;删除数据库命令中对数据库对象的操作之外的其余操作;在数据库命令超过预设字符数时,对数据库命令进行截取,得到预设字符数的部分。
在一些实施例中,第二聚类模块930,用于基于第二预设规则和/或第二聚类模型进行第二聚类,其中,第二预设规则基于数据库驱动中错误消息的定义。
在一些实施例中,第二聚类模块930,用于基于第二聚类模型进行第二聚类,包括:基于第二聚类模型识别错误消息中的变量;对识别到的变量进行模糊化混淆处理。
图10示出了本公开示例性实施例的数据库访问错误分析装置的另一示意性框图,如图10所示,该装置包括:第一聚类模块1010,用于对数据库实例的数据库访问错误数据的第一集合中的数据库命令进行第一聚类,得到命令聚类表示及其在第一集合中对应的第二集合。确定模块1020,与第一聚类模块1010连接,用于在目标命令聚类表示对应的第二集合中,确定目标命令聚类表示包含的错误类型及其在第二集合中对应的第三集合,其中,目标命令聚类表示选自第一聚类得到的命令聚类表示。第二聚类模块1030,与确定模块1020连接,用于对目标错误类型对应的第三集合中的错误消息进行第二聚类,得到目标错误类型对应的消息聚类表示,其中,目标错误类型选自目标命令聚类表示包含的错误类型。
在一些实施例中,确定模块1020还用于:
根据用户信息确定第二聚类得到的消息聚类表示在目标错误类型对应的第三集合中的用户统计信息;和/或
根据用户信息确定目标命令聚类表示包含的错误类型在目标命令聚类表示对应的第二集合中的用户统计信息;和/或
根据用户信息确定第一聚类得到的命令聚类表示在第一集合中的用户统计信息。
在一些实施例中,确定模块1020还用于:
根据业务数据确定第二聚类得到的消息聚类表示在目标错误类型对应的第三集合中的业务统计信息;和/或
根据业务数据确定目标命令聚类表示包含的错误类型在目标命令聚类表示对应的第二集合中的业务统计信息;和/或
根据业务数据确定第一聚类得到的命令聚类表示在第一集合中的业务统计信息。
在一些实施例中,第一聚类模块1010,用于基于第一预设规则和/或第一聚类模型进行第一聚类,其中,第一预设规则基于数据库命令的语法。
在一些实施例中,第一聚类模块1010,用于基于第一预设规则进行第一聚类,包括以下至少之一:将数据库命令中的参数替换为第一字符;将数据库命令中的字段名替换为第二字符;删除数据库命令中对数据库对象的操作之外的其余操作;在数据库命令超过预设字符数时,对数据库命令进行截取,得到预设字符数的部分。
在一些实施例中,第二聚类模块1030,用于基于第二预设规则和/或第二聚类模型进行第二聚类,其中,第二预设规则基于数据库驱动中错误消息的定义。
在一些实施例中,第二聚类模块1030,用于基于第二聚类模型进行第二聚类,包括:基于第二聚类模型识别错误消息中的变量;对识别到的变量进行模糊化混淆处理。
本公开示例性实施例还提供一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器。存储器存储有能够被至少一个处理器执行的计算机程序,计算机程序在被至少一个处理器执行时用于使电子设备执行根据本公开实施例的方法。
本公开示例性实施例还提供一种存储有计算机程序的非瞬时计算机可读存储介质,其中,计算机程序在被计算机的处理器执行时用于使计算机执行根据本公开实施例的方法。
本公开示例性实施例还提供一种计算机程序产品,包括计算机程序,其中,计算机程序在被计算机的处理器执行时用于使计算机执行根据本公开实施例的方法。
参考图11,现将描述可以作为本公开的服务器或客户端的电子设备1100的结构框图,其是可以应用于本公开的各方面的硬件设备的示例。电子设备旨在表示各种形式的数字电子的计算机设备,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图11所示,电子设备1100包括计算单元1101,其可以根据存储在只读存储器(ROM)1102中的计算机程序或者从存储单元1108加载到随机访问存储器(RAM)1103中的计算机程序,来执行各种适当的动作和处理。在RAM 1103中,还可存储设备1100操作所需的各种程序和数据。计算单元1101、ROM 1102以及RAM 1103通过总线1104彼此相连。输入/输出(I/O)接口1105也连接至总线1104。
电子设备1100中的多个部件连接至I/O接口1105,包括:输入单元1106、输出单元1107、存储单元1108以及通信单元1109。输入单元1106可以是能向电子设备1100输入信息的任何类型的设备,输入单元1106可以接收输入的数字或字符信息,以及产生与电子设备的用户设置和/或功能控制有关的键信号输入。输出单元1107可以是能呈现信息的任何类型的设备,并且可以包括但不限于显示器、扬声器、视频/音频输出终端、振动器和/或打印机。存储单元1104可以包括但不限于磁盘、光盘。通信单元1109允许电子设备1100通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据,并且可以包括但不限于调制解调器、网卡、红外通信设备、无线通信收发机和/或芯片组,例如蓝牙TM设备、WiFi设备、WiMax设备、蜂窝通信设备和/或类似物。
计算单元1101可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1101的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1101执行上文所描述的各个方法和处理。例如,在一些实施例中,数据库访问错误监测方法、数据库访问错误分析方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1108。在一些实施例中,计算机程序的部分或者全部可以经由ROM 1102和/或通信单元1109而被载入和/或安装到电子设备1100上。在一些实施例中,计算单元1101可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行数据库访问错误监测方法、数据库访问错误分析方法。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
如本公开使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

Claims (22)

1.一种数据库访问错误监测方法,其特征在于,包括:
监听业务请求的数据库访问;
在监听到所述数据库访问的情况下,获取所述数据库访问对应的数据库实例信息和数据库命令;
在检测到所述数据库访问发生错误的情况下,获取所述错误的错误类型和错误消息;
将所述错误类型和所述错误消息与所述数据库实例信息和数据库命令关联,形成所述业务请求对应的数据库访问错误数据。
2.如权利要求1所述的数据库访问错误监测方法,其特征在于,还包括:
在监听到所述数据库访问的情况下,获取所述数据库访问对应的数据库库名;
将所述数据库库名与所述数据库访问错误数据关联。
3.如权利要求1或2所述的数据库访问错误监测方法,其特征在于,还包括:
响应于所述业务请求,获取所述业务请求对应的用户信息;将所述用户信息与所述数据库访问错误数据关联;和/或
响应于所述业务请求,获取所述业务请求对应的业务数据;将所述业务数据与所述数据库访问错误数据关联;和/或
将所述数据库访问错误数据与所述业务请求对应的调用链关联。
4.如权利要求1或2所述的数据库访问错误监测方法,其特征在于,所述监听业务请求的数据库访问,包括:响应于业务请求,监听数据库驱动中被标识为数据库访问的方法。
5.如权利要求1或2所述的数据库访问错误监测方法,其特征在于,所述数据库实例信息包括:数据库类型、数据库地址和数据库服务进程对应的端口。
6.一种数据库访问错误分析方法,其特征在于,包括:
在数据库实例的数据库访问错误数据的第一集合中,确定目标错误类型在所述第一集合中对应的第二集合,其中,所述数据库访问错误数据包括错误类型、错误消息、数据库实例信息和数据库命令,所述目标错误类型选自所述第一集合中的错误类型;
对所述第二集合中的数据库命令进行第一聚类,得到命令聚类表示及其在所述第二集合中对应的第三集合;
对目标命令聚类表示对应的所述第三集合中的错误消息进行第二聚类,得到所述目标命令聚类表示对应的消息聚类表示,其中,所述目标命令聚类表示选自所述第一聚类得到的命令聚类表示。
7.如权利要求6所述的数据库访问错误分析方法,其特征在于,还包括:
确定所述第二聚类得到的消息聚类表示的第一统计指标,所述第一统计指标包括各个消息聚类表示在所述目标命令聚类表示对应的所述第三集合中的数据库访问错误出现的次数和/或占比;和/或
确定所述第一集合中包含的错误类型的第二统计指标,所述第二统计指标包括所述第一集合中包含的错误类型在所述第一集合中的数据库访问错误出现的次数和/或占比;和/或
确定所述第一聚类得到的命令聚类表示的第三统计指标,所述第三统计指标包括所述第一聚类得到的命令聚类表示在所述第二集合中的数据库访问错误出现的次数和/或占比。
8.如权利要求6所述的数据库访问错误分析方法,其特征在于,所述数据库访问错误数据与用户信息关联,所述数据库访问错误分析方法,还包括:
根据所述用户信息确定所述第二聚类得到的消息聚类表示在所述目标命令聚类表示对应的所述第三集合中的用户统计信息;和/或
根据所述用户信息确定所述第一集合中包含的错误类型在所述第一集合中的用户统计信息;和/或
根据所述用户信息确定所述第一聚类得到的命令聚类表示在所述第二集合中的用户统计信息。
9.如权利要求6或8所述的数据库访问错误分析方法,其特征在于,所述数据库访问错误数据与业务数据关联,所述数据库访问错误分析方法,还包括:
根据所述业务数据确定所述第二聚类得到的消息聚类表示在所述目标命令聚类表示对应的所述第三集合中的业务统计信息;和/或
根据所述业务数据确定所述第一集合中包含的错误类型在所述第一集合中的业务统计信息;和/或
根据所述业务数据确定所述第一聚类得到的命令聚类表示在所述第二集合中的业务统计信息。
10.如权利要求6所述的数据库访问错误分析方法,其特征在于,基于第一预设规则和/或第一聚类模型进行所述第一聚类,其中,所述第一预设规则基于数据库命令的语法。
11.如权利要求10所述的数据库访问错误分析方法,其特征在于,基于第一预设规则进行所述第一聚类,包括以下至少之一:
将数据库命令中的参数替换为第一字符;
将数据库命令中的字段名替换为第二字符;
删除数据库命令中对数据库对象的操作之外的其余操作;
在数据库命令超过预设字符数时,对所述数据库命令进行截取,得到所述预设字符数的部分。
12.如权利要求6所述的数据库访问错误分析方法,其特征在于,基于第二预设规则和/或第二聚类模型进行所述第二聚类,其中,所述第二预设规则基于数据库驱动中错误消息的定义。
13.如权利要求12所述的数据库访问错误分析方法,其特征在于,基于第二聚类模型进行所述第二聚类,包括:
基于第二聚类模型识别错误消息中的变量;
对识别到的变量进行模糊化混淆处理。
14.一种数据库访问错误分析方法,其特征在于,包括:
对数据库实例的数据库访问错误数据的第一集合中的数据库命令进行第一聚类,得到命令聚类表示及其在所述第一集合中对应的第二集合,其中,所述数据库访问错误数据包括:错误类型、错误消息、数据库实例信息和数据库命令;
在目标命令聚类表示对应的所述第二集合中,确定所述目标命令聚类表示包含的错误类型及其在所述第二集合中对应的第三集合,其中,所述目标命令聚类表示选自所述第一聚类得到的命令聚类表示;
对目标错误类型对应的所述第三集合中的错误消息进行第二聚类,得到所述目标错误类型对应的消息聚类表示,其中,所述目标错误类型选自所述目标命令聚类表示包含的错误类型。
15.如权利要求14所述的数据库访问错误分析方法,其特征在于,还包括:
确定所述第二聚类得到的消息聚类表示的第一统计指标,所述第一统计指标包括各个消息聚类表示在所述目标错误类型对应的所述第三集合中的数据库访问错误出现的次数和/或占比;和/或
确定所述目标命令聚类表示包含的错误类型的第二统计指标,所述第二统计指标包括各个错误类型在所述目标命令聚类表示对应的所述第二集合中的数据库访问错误出现的次数和/或占比;和/或
确定所述第一聚类得到的命令聚类表示的第三统计指标,所述第三统计指标包括各个命令聚类表示在所述第一集合中的数据库访问错误出现的次数和/或占比。
16.如权利要求14所述的数据库访问错误分析方法,其特征在于,所述数据库访问错误数据与用户信息关联,所述数据库访问错误分析方法,还包括:
根据所述用户信息确定所述第二聚类得到的消息聚类表示在所述目标错误类型对应的所述第三集合中的用户统计信息;和/或
根据所述用户信息确定所述目标命令聚类表示包含的错误类型在所述目标命令聚类表示对应的所述第二集合中的用户统计信息;和/或
根据所述用户信息确定所述第一聚类得到的命令聚类表示在所述第一集合中的用户统计信息。
17.如权利要求14或16所述的数据库访问错误分析方法,其特征在于,所述数据库访问错误数据与业务数据关联,所述数据库访问错误分析方法,还包括:
根据所述业务数据确定所述第二聚类得到的消息聚类表示在所述目标错误类型对应的所述第三集合中的业务统计信息;和/或
根据所述业务数据确定所述目标命令聚类表示包含的错误类型在所述目标命令聚类表示对应的所述第二集合中的业务统计信息;和/或
根据所述业务数据确定所述第一聚类得到的命令聚类表示在所述第一集合中的业务统计信息。
18.一种数据库访问错误监测装置,其特征在于,包括:
监听模块,用于监听业务请求的数据库访问;
第一获取模块,用于在监听到所述数据库访问的情况下,获取所述数据库访问对应的数据库实例信息和数据库命令;
第二获取模块,用于在检测到所述数据库访问发生错误的情况下,获取所述错误的错误类型和错误消息;
关联模块,用于将所述错误类型和所述错误消息与所述数据库实例信息和数据库命令关联,形成所述业务请求对应的数据库访问错误数据。
19.一种数据库访问错误分析装置,其特征在于,包括:
确定模块,用于在数据库实例的数据库访问错误数据的第一集合中,确定目标错误类型在所述第一集合中对应的第二集合,其中,所述数据库访问错误数据包括错误类型、错误消息、数据库实例信息和数据库命令,所述目标错误类型选自所述第一集合中的错误类型;
第一聚类模块,用于对所述第二集合中的数据库命令进行第一聚类,得到命令聚类表示及其在所述第二集合中对应的第三集合;
第二聚类模块,用于对目标命令聚类表示对应的所述第三集合中的错误消息进行第二聚类,得到所述目标命令聚类表示对应的消息聚类表示,其中,所述目标命令聚类表示选自所述第一聚类得到的命令聚类表示。
20.一种数据库访问错误分析装置,其特征在于,包括:
第一聚类模块,用于对数据库实例的数据库访问错误数据的第一集合中的数据库命令进行第一聚类,得到命令聚类表示及其在所述第一集合中对应的第二集合,其中,所述数据库访问错误数据包括:错误类型、错误消息、数据库实例信息和数据库命令;
确定模块,用于在目标命令聚类表示对应的所述第二集合中,确定所述目标命令聚类表示包含的错误类型及其在所述第二集合中对应的第三集合,其中,所述目标命令聚类表示选自所述第一聚类得到的命令聚类表示;
第二聚类模块,用于对目标错误类型对应的所述第三集合中的错误消息进行第二聚类,得到所述目标错误类型对应的消息聚类表示,其中,所述目标错误类型选自所述目标命令聚类表示包含的错误类型。
21.一种电子设备,其特征在于,包括:
处理器;以及
存储程序的存储器,
其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行根据权利要求1-17中任一项所述的方法。
22.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行根据权利要求1-17中任一项所述的方法。
CN202210041051.3A 2022-01-14 2022-01-14 数据库访问错误监测、分析方法、装置和电子设备 Active CN114546759B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210041051.3A CN114546759B (zh) 2022-01-14 2022-01-14 数据库访问错误监测、分析方法、装置和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210041051.3A CN114546759B (zh) 2022-01-14 2022-01-14 数据库访问错误监测、分析方法、装置和电子设备

Publications (2)

Publication Number Publication Date
CN114546759A CN114546759A (zh) 2022-05-27
CN114546759B true CN114546759B (zh) 2022-09-02

Family

ID=81670642

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210041051.3A Active CN114546759B (zh) 2022-01-14 2022-01-14 数据库访问错误监测、分析方法、装置和电子设备

Country Status (1)

Country Link
CN (1) CN114546759B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107193833A (zh) * 2016-03-15 2017-09-22 阿里巴巴集团控股有限公司 数据库访问的监控方法和装置
CN108334436A (zh) * 2018-01-31 2018-07-27 平安普惠企业管理有限公司 应用软件的优化方法、装置、设备及计算机可读存储介质
CN110515808A (zh) * 2019-09-02 2019-11-29 北京博睿宏远数据科技股份有限公司 数据库监控方法、装置、计算机设备及存储介质
CN113132311A (zh) * 2019-12-31 2021-07-16 中国移动通信集团陕西有限公司 异常访问检测方法、装置和设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10417441B2 (en) * 2016-04-29 2019-09-17 International Business Machines Corporation Effectively validating dynamic database queries through database activity monitoring
US10425274B2 (en) * 2017-05-11 2019-09-24 Salesforce.Com, Inc. Techniques and architectures for recovering from a service disruption in a multi-server environment

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107193833A (zh) * 2016-03-15 2017-09-22 阿里巴巴集团控股有限公司 数据库访问的监控方法和装置
CN108334436A (zh) * 2018-01-31 2018-07-27 平安普惠企业管理有限公司 应用软件的优化方法、装置、设备及计算机可读存储介质
CN110515808A (zh) * 2019-09-02 2019-11-29 北京博睿宏远数据科技股份有限公司 数据库监控方法、装置、计算机设备及存储介质
CN113132311A (zh) * 2019-12-31 2021-07-16 中国移动通信集团陕西有限公司 异常访问检测方法、装置和设备

Also Published As

Publication number Publication date
CN114546759A (zh) 2022-05-27

Similar Documents

Publication Publication Date Title
CN110362455B (zh) 一种数据处理方法和数据处理装置
EP4099170B1 (en) Method and apparatus of auditing log, electronic device, and medium
CN110362473B (zh) 测试环境的优化方法及装置、存储介质、终端
CN113328872A (zh) 故障修复方法、装置和存储介质
CN109495291B (zh) 调用异常的定位方法、装置和服务器
US9235463B2 (en) Device and method for fault management of smart device
US11416321B2 (en) Component failure prediction
CN108306749B (zh) 一种监控系统报警方法、监控系统和监控装置
CN111444072A (zh) 客户端的异常识别方法、装置、计算机设备和存储介质
WO2023071761A1 (zh) 一种异常定位方法及装置
CN112737800A (zh) 服务节点故障定位方法、调用链生成方法及服务器
CN111338888B (zh) 一种数据统计方法、装置、电子设备及存储介质
CN112306833A (zh) 应用程序的崩溃统计方法、装置、计算机设备及存储介质
CN111506455B (zh) 服务发布结果的查验方法及装置
CN114546759B (zh) 数据库访问错误监测、分析方法、装置和电子设备
CN106681894B (zh) 智能设备的监控方法和监控装置
CN112966056B (zh) 一种信息处理方法、装置、设备、系统及可读存储介质
CN112612679A (zh) 系统运行状态监控方法、装置、计算机设备和存储介质
CN114595765A (zh) 数据处理方法、装置、电子设备及存储介质
CN114301904A (zh) 大数据集群的监控方法、装置、监控系统及可读存储介质
KR102464688B1 (ko) 모니터링 결과의 이벤트 등급 결정 방법 및 장치
CN112069017A (zh) 业务系统监控方法及装置
CN116702121B (zh) 一种云桌面场景下增强访问控制安全性的方法
CN115396280B (zh) 告警数据的处理方法、装置、设备及存储介质
CN113037550B (zh) 一种服务故障监控方法、系统及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant