CN111581045A - 数据库异常监测方法、装置、计算机装置及存储介质 - Google Patents
数据库异常监测方法、装置、计算机装置及存储介质 Download PDFInfo
- Publication number
- CN111581045A CN111581045A CN202010192822.XA CN202010192822A CN111581045A CN 111581045 A CN111581045 A CN 111581045A CN 202010192822 A CN202010192822 A CN 202010192822A CN 111581045 A CN111581045 A CN 111581045A
- Authority
- CN
- China
- Prior art keywords
- monitoring
- database
- data
- model
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 280
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000012549 training Methods 0.000 claims abstract description 45
- 230000002159 abnormal effect Effects 0.000 claims abstract description 42
- 230000005856 abnormality Effects 0.000 claims abstract description 14
- 238000012806 monitoring device Methods 0.000 claims abstract description 10
- 238000004422 calculation algorithm Methods 0.000 claims description 53
- 238000004590 computer program Methods 0.000 claims description 16
- 230000009467 reduction Effects 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 8
- 238000012795 verification Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 4
- 238000000513 principal component analysis Methods 0.000 claims description 3
- 230000008030 elimination Effects 0.000 claims description 2
- 238000003379 elimination reaction Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 5
- 239000003795 chemical substances by application Substances 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000013467 fragmentation Methods 0.000 description 2
- 238000006062 fragmentation reaction Methods 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/302—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3051—Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3466—Performance evaluation by tracing or monitoring
- G06F11/3495—Performance evaluation by tracing or monitoring for systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Quality & Reliability (AREA)
- Data Mining & Analysis (AREA)
- Computer Hardware Design (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Debugging And Monitoring (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
本发明提供一种数据库异常监测方法,包括:获取上一监测周期内数据库的监测数据;确定每个监测数据的数据指标类别和异常等级;将每种数据指标类别对应的所有监测数据和异常等级生成一个样本数据集;利用所述样本数据集为每一种数据指标类别训练一个数据库监测子模型,根据每一数据库监测子模型及其对应的权重生成目标数据库监测模型;获取当前监测周期内监测数据,通过所述目标数据库监测模型计算当前监测周期内数据库异常等级;基于当前监测周期内监测数据及异常等级更新目标数据库监测模型,并基于更新后的模型对数据库进行异常监测。本发明还提供一种数据库异常监测装置、计算机装置及可读存储介质。本发明能够准确、智能的监测数据库异常。
Description
技术领域
本发明涉及数据库监测技术领域,具体涉及一种数据库异常监测方法、数据库异常监测装置、计算机装置及计算机可读存储介质。
背景技术
随着数据的指数式爆发增长,数据库作为存储管理数据的主要角色,压力与日俱增,一旦数据库出现异常,数据不能被正常的读取和存储,会给系统带来巨大影响,因此,运维人员通常需要人工对数据库进行异常监测。目前对数据库的异常监测准确率不高,不够智能化。
发明内容
鉴于以上内容,有必要提出一种数据库异常监测方法、装置、计算机装置和计算机可读存储介质,以准确、智能的监测数据库的异常。
本申请的第一方面提供一种数据库异常监测方法,所述方法包括:
获取上一监测周期内数据库的多个监测数据;
识别每个监测数据对应的数据指标类别,并计算每个监测数据的异常等级;
将每种数据指标类别对应的所有监测数据和异常等级作为一个样本数据集;
遍历算法模型池中的多个算法模型,利用所述样本数据集为每一种数据指标类别训练一个数据库监测子模型,并计算每一数据库监测子模型对应的权重;
根据每一数据库监测子模型及每一数据库监测子模型对应的权重生成目标数据库监测模型;
获取当前监测周期内所述数据库中的多个监测数据,并通过所述目标数据库监测模型计算当前监测周期内每个监测数据的异常等级;
基于所述当前监测周期内每个监测数据及对应的异常等级更新所述目标数据库监测模型,并基于更新后的目标数据库监测模型利用下一监测周期内所述数据库中的多个监测数据对所述数据库进行异常监测。
本申请的第二方面提供一种数据库异常监测装置,包括:
数据获取模块,用于获取上一监测周期内数据库的多个监测数据,识别每个监测数据对应的数据指标类别,并计算每个监测数据的异常等级;
模型训练模块,用于将每个数据指标类别对应的所有监测数据和异常等级作为一个样本数据集;遍历算法模型池中的多个算法模型,利用所述样本数据集为每一种数据指标类别训练一个数据库监测子模型,并计算每一数据库监测子模型对应的权重;根据每一数据库监测子模型及对应的权重生成目标数据库监测模型;
异常监测模块,用于获取当前监测周期内所述数据库中的多个监测数据,并通过所述目标数据库监测模型计算当前监测周期内每个监测数据的异常等级;
更新模块,用于基于所述当前监测周期内每个监测数据及对应的异常等级更新所述目标数据库监测模型,所述更新后的目标数据库监测模型用于利用下一监测周期内所述数据库中的多个监测数据对所述数据库进行异常监测。
本申请的第三方面提供一种计算机装置,所述计算机装置包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如前所述数据库异常监测方法。
本申请的第四方面提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如前所述的数据库异常监测方法。
本发明利用数据库的监测数据进行自适应的学习,生成数据库监测模型,通过所述监测模型自动监测数据库异常,使得数据库的异常监测更加准确和智能化。另外,基于实时获取的监测数据确定数据库异常情况后,还将所述监测数据实时更新数据库监测模型,使得模型不断改善,不断提高数据库异常监测的准确性。
附图说明
图1是本发明一实施例提供的数据库异常监测方法流程图。
图2是本发明一实施例提供的数据库异常监测装置的结构示意图。
图3是本发明一实施例提供的计算机装置示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施例对本发明进行详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
本发明数据库异常监测方法应用在一个或者多个计算机装置中。所述计算机装置是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(DigitalSignal Processor,DSP)、嵌入式设备等。
所述计算机装置可以是桌上型计算机、笔记本电脑、平板电脑、云端服务器等电子设备。所述计算机装置可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。所述计算机装置还可以通过网络与至少一个其他电子设备建立通信连接,其中,所述网络可以是有线网络,也可以是无线网络,例如无线电、无线保真(WirelessFidelity,WIFI)、蜂窝、卫星、广播等。
参阅图1所示,是本发明一实施例提供的数据库异常监测方法的流程图。根据不同的需求,所述流程图中步骤的顺序可以改变,某些步骤可以省略。
步骤S11、获取上一监测周期内数据库的多个监测数据。
所述数据库的监测数据是指能够体现和评价数据库的异常状况的监测数据,可以包括但不限于CPU使用率、共享池命中率、日志缓冲区大小、表空间碎片率等多种监测数据。
所述数据库的监测数据可以是通过部署Agent采集的。所述监测周期的时长可以根据需要设置,本发明对此不做具体限制。例如,所述监测周期可以为一天、一个星期、一个月。通过部署Agent实时采集数据库的监测数据,能够在所述监测周期内获取大量的监测数据。
步骤S12、识别每个监测数据对应的数据指标类别,并计算每个监测数据的异常等级。
所述监测数据对应的数据指标类别包括但不限于:合规指标、安全指标、容量指标、性能指标、以及告警情况指标。其中,所述合规指标包括但不限于规定数据库相关参数的规则指标,例如,数据库的表空间存放位置。所述安全指标包括但不限于用于限定数据库相关权限的监测数据,例如表空间的访问权限等。所述容量指标包括但不限于用于显示数据库相关存储容量的监测数据,例如文件大小、存储空间的存储容量等。性能指标是指CPU使用率、响应时间等各种反应数据库性能的监测数据。告警情况指标包括各种数据库报警信息等。
在一个实施方式中,确定所述监测数据对应的数据指标类别的方法为:获取分类学习模型,将所述监测数据输入至分类学习模型,通过所述分类学习模型确定所述监测数据对应的数据指标类别。
在一个实施方式中,在确定所述监测数据对应的数据指标类别之前,所述方法还包括训练所述分类学习模型。其中,训练所述学习模型的方法包括:
获取分类样本集,所述分类样本集中包括监测数据及监测数据对应的数据指标类别标签;
将所述分类样本集按照预设比例划分为训练集和验证集;
建立分类学习模型,利用所述训练集训练所述分类学习模型,并利用所述验证集验证所述分类学习模型,所述分类学习模型用于输出所述每个监测数据对应的数据指标类别。
其中,所述分类学习模型可以是支持向量机模型、朴素贝叶斯分类模型等分类模型。
在另一个实施方式中,识别所述监测数据对应的数据指标类别的方法为:将所述监测数据与预先建立的类别关键字库中的类别关键字进行比对,其中,所述类别关键字库中存储有类别关键字与数据指标类别的对应关系;当所述监测数据中存在与类别关键字相匹配的内容时,将所述类别关键字对应的数据指标类别确定为所述监测数据对应的监测指标类别。
不同数据指标类别及不同的数值范围的监测数据能够反应数据库不同程度的异常,例如,CPU使用率100%代表数据库异常,而CPU使用率5%代表数据库没有异常。因此,每个监测数据均对应有数据库的异常等级。
在一个实施方式中,计算每个监测数据的异常等级是根据预先存储的异常等级对应关系表确定的,所述关系表中存储有监测数据与异常等级的对应关系。另一个实施方式中,也可以是通过人工的方式确定监测数据的异常等级的。其中,所述异常等级可以是以分数值、等级名称等方式呈现的。
步骤S13、将每种数据指标类别对应的所有监测数据和异常等级生成一个样本数据集。
在所述样本数据集中有一些数据指标类别对应的监测数据是非数值化的,例如,数据库是否可用这一监测指标的结果分为可用和不可用。因此,所述方法还包括:将监测指标对应的非数值化监测数据转换为数值化数据。
其中,将非数值化监测数据转换为数值化数据的方法可用是利用计算机程序语言中的map函数,将非数值化数据映射为对应的数值化数据。
例如,针对“数据库是否可用”这一监测指标,当监测数据为可用时,将“可用”这一非数值化数据转化为数值化数据“1”,将不可用转化为0。同样的,也将数据库的健康结果由非数值化数据转换为数值化,例如数据库健康为1,不健康为0。
由于不同监测数据之间的单位或者量级不同,不方便统一评判数据库的异常情况,因此,为方便对数据的统一处理,本发明一些实施方式中所述方法还进一步包括如下步骤:对所述监测数据的数值进行标准化处理。
具体地,通过Z-score的方法对所述监测数据的数值标准化处理,具体公式如下:
其中,x为标准化之前的数据,x*为标准化之后的数据,μ为监测数据的均值,σ为监测数据的方差。
进一步地,在本发明一些实施方式中,所述方法还可以包括:对所述样本数据集中的监测数据进行降维处理。
在一个实施方案中,所述降维处理的方法为主成分分析法。主成分分析是一个统计过程,该过程通过正交变换将原始的n维数据集变换到一个新的被称做主成分的数据集中。变换后的结果中,第一个主成分具有最大的方差值,每个后续的成分在与前述主成分正交条件限制下与具有最大方差。降维时仅保存前m(m<n)个主成分即可保持最大的数据信息量。
具体地,设x1,x2,…,xn是n项检查指标,计算它们的协方差矩阵如下:
然后对协方差矩阵进行奇异值分解,即可得到对应的m个主成分向量x1,x2,…,xm。
在本发明另一实施方式中,所述降维处理的方法为反向特征消除法。在该方法中,所有分类算法先用n个特征进行训练。每次降维操作,采用n-1个特征对分类器训练n次,得到新的n个分类器。将新分类器中错分率变化最小的分类器所用的n-1维特征作为降维后的特征集。不断的对该过程进行迭代,即可得到降维后的结果。第k次迭代过程中得到的是n-k维特征分类器。
可以理解,在其他实施方式中,还可以通过其他降维算法实现样本数据集中数据的降维。
步骤S14、遍历算法模型池中的多个算法模型,利用所述样本数据集为每一种数据指标类别训练一个数据库监测子模型,并计算每一数据库监测子模型对应的权重,根据每一数据库监测子模型及每一数据库监测子模型对应的权重生成目标数据库监测模型。
所述遍历算法模型池中的多个算法模型,利用所述样本数据集为每一种数据指标类别训练一个数据库监测子模型包括:
利用所述样本数据集训练算法模型池中的每一种算法模型;
遍历算法模型池中的每一算法模型后,基于每一种算法模型的训练参数确定其中一个算法模型作为所述监测指标类别对应的数据库监测子模型,其中,所述训练参数包括如下至少一种:训练模型所耗时长、模型的输出准确率。
其中,所述算法模型池中的算法模型包括但不限于神经网络算法模型、逻辑回归算法模型等深度学习算法模型。比较训练出的每一种所述算法模型的性能,根据预设的模型性能要求在所述算法模型池中选择满足模型性能要求的优选算法模型。
也就是说,针对每种数据指标类别选择出一种针对该类别的优选算法模型,从而得到该类别对应的数据库监测子模型。
所述每个数据指标类别对应的数据库监测子模型训练完成后,再利用上述样本数据集训练得出所述每个数据库监测子模型对应的权重。
步骤S15、获取当前监测周期内所述数据库中的多个监测数据,并通过所述目标数据库监测模型计算当前监测周期内每个监测数据的异常等级。
通过将当前监测周期获取的数据库监测数据输入至目标数据库监测模型即可得到数据库当前的异常等级。
在一些实施方式中,当所述异常等级达到预设的告警标准时,所述方法还包括:生成数据库异常告警信息,并通过预设方式发送至预设人员。举例而言,所述数据库监测模型通过分数值来代表数据库的异常等级时,若数据库的评分值低于预设分数值时生成数据库异常警告信息。举例而言,数据库异常等级为100分制,所述模型输出的数据库的异常等级对应的分值为50分,低于预设分数值70分时,生成异常警告信息,并通过短信、邮件等方式发送至预设人员。
步骤S16、基于所述当前监测周期内每个监测数据及对应的异常等级更新所述目标数据库监测模型,并基于更新后的目标数据库监测模型利用下一监测周期内所述数据库中的多个监测数据对所述数据库进行异常监测。
本发明利用数据库的监测数据进行自适应的学习,生成数据库监测模型,通过所述监测模型自动监测数据库异常,使得数据库的异常监测更加准确和智能化。另外,基于实时获取的监测数据确定数据库异常情况后,还将所述监测数据实时更新数据库监测模型,使得模型不断改善,不断提高数据库异常监测的准确性。
上述图1详细介绍了本发明的数据库异常监测方法,下面结合第2-3图,对实现所述数据库异常监测方法的软件装置的功能模块以及实现所述数据库异常监测方法的硬件装置架构进行介绍。
应所述了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
图2为本发明数据库异常监测装置较佳实施例的结构图。
在一些实施例中,数据库异常监测装置10运行于至少一个计算机装置中。所述数据库异常监测装置10可以包括多个由程序代码段所组成的功能模块。所述数据库异常监测装置10中的各个程序段的程序代码可以存储于所示至少一个计算机装置的存储器中,并由所述至少一个处理器所执行,以实现数据库异常监测功能。
本实施例中,所述数据库异常监测装置10根据其所执行的功能,可以被划分为多个功能模块。参阅图2所示,所述功能模块可以包括:数据获取模块101、模型训练模块102、异常监测模块103以及更新模块104。本发明所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段,其存储在存储器中。在本实施例中,关于各模块的功能将在后续的实施例中详述。一个实施方式中,所述数据获取模块101、模型训练模块102、异常监测模块103以及更新模块104均运行于同一计算机装置中。另一实施方式中,所述数据获取模块101、异常监测模块103运行于一个计算机装置中,所述模型训练模块102和更新模块104运行于另一计算机装置中。
所述数据获取模块101获取上一监测周期内数据库的多个监测数据,识别每个监测数据对应的数据指标类别,并计算每个监测数据的异常等级。
所述数据库的监测数据是指能够体现和评价数据库的异常状况的监测数据,可以包括但不限于CPU使用率、共享池命中率、日志缓冲区大小、表空间碎片率等多种监测数据。
所述数据库的监测数据可以是通过部署Agent采集的。所述监测周期的时长可以根据需要设置,本发明对此不做具体限制。例如,所述监测周期可以为一天、一个星期、一个月。通过部署Agent实时采集数据库的监测数据,能够在所述监测周期内获取大量的监测数据。
所述监测数据对应的数据指标类别包括但不限于:合规指标、安全指标、容量指标、性能指标、以及告警情况指标。其中,所述合规指标包括但不限于规定数据库相关参数的规则指标,例如,数据库的表空间存放位置。所述安全指标包括但不限于用于限定数据库相关权限的监测数据,例如表空间的访问权限等。所述容量指标包括但不限于用于显示数据库相关存储容量的监测数据,例如文件大小、存储空间的存储容量等。性能指标是指CPU使用率、响应时间等各种反应数据库性能的监测数据。告警情况指标包括各种数据库报警信息等。
在一个实施方式中,所述数据获取模块101确定所述监测数据对应的数据指标类别包括:获取分类学习模型,将所述监测数据输入至分类学习模型,通过所述分类学习模型确定所述监测数据对应的数据指标类别。
在一个实施方式中,在确定所述监测数据对应的数据指标列表之前,所述数据获取模块101还训练所述分类学习模型。其中,训练所述学习模型的包括:获取分类样本集,所述分类样本集中包括监测数据及监测数据对应的数据指标类别标签;将所述分类样本集按照预设比例划分为训练集和验证集;建立分类学习模型,利用所述训练集训练所述分类学习模型,并利用所述验证集验证所述分类学习模型,所述分类学习模型用于输出所述每个监测数据对应的数据指标类别。
所述模型训练模块102用于将每个数据指标类别对应的所有监测数据和异常等级作为一个样本数据集,遍历算法模型池中的多个算法模型,利用所述样本数据集为每一种数据指标类别训练一个数据库监测子模型,并计算每一数据库监测子模型对应的权重,根据每一数据库监测子模型及对应的权重生成目标数据库监测模型。
其中,所述模型训练模块102所述遍历算法模型池中的多个算法模型,利用所述样本数据集为每一种数据指标类别训练一个数据库监测子模型包括:
利用所述样本数据集训练算法模型池中的每一种算法模型;
遍历算法模型池中的每一算法模型后,基于每一种算法模型的训练参数确定其中一个算法模型作为所述监测指标类别对应的数据库监测子模型,其中,所述训练参数包括如下至少一种:训练模型所耗时长、模型的输出准确率。
其中,所述算法模型池中的算法模型包括但不限于神经网络算法模型、逻辑回归算法模型等深度学习算法模型。比较训练出的每一种所述算法模型的性能,根据预设的模型性能要求在所述算法模型池中选择满足模型性能要求的优选算法模型。
也就是说,针对每种数据指标类别选择出一种针对该类别的优选算法模型,从而得到该类别对应的数据库监测子模型。
所述每个数据指标类别对应的数据库监测子模型训练完成后,再利用上述样本数据集训练得出所述每个数据库监测子模型对应的权重。
异常监测模块103,用于获取当前监测周期内所述数据库中的多个监测数据,并通过所述目标数据库监测模型计算当前监测周期内每个监测数据的异常等级。
更新模块104,用于基于所述当前监测周期内每个监测数据及对应的异常等级更新所述目标数据库监测模型。
图3为本发明计算机装置较佳实施例的示意图。
所述计算机装置1包括存储器20、处理器30以及存储在所述存储器20中并可在所述处理器30上运行的计算机程序40,例如数据库异常监测程序。所述处理器30执行所述计算机程序40时实现上述数据库异常监测方法实施例中的步骤,例如图1所示的步骤S11~S16。或者,所述处理器30执行所述计算机程序40时实现上述数据库异常监测装置实施例中各模块/单元的功能,例如图2中的模块101-104。
示例性的,所述计算机程序40可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器20中,并由所述处理器30执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,所述指令段用于描述所述计算机程序40在所述计算机装置1中的执行过程。例如,所述计算机程序40可以被分割成图2各模块。
所述计算机装置1可以是桌上型计算机及云端服务器等计算设备。本领域技术人员可以理解,所述示意图仅仅是计算机装置1的示例,并不构成对计算机装置1的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述计算机装置1还可以包括输入输出设备、网络接入设备、总线等。
所称处理器30可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者所述处理器30也可以是任何常规的处理器等,所述处理器30是所述计算机装置1的控制中心,利用各种接口和线路连接整个计算机装置1的各个部分。
所述存储器20可用于存储所述计算机程序40和/或模块/单元,所述处理器30通过运行或执行存储在所述存储器20内的计算机程序和/或模块/单元,以及调用存储在存储器20内的数据,实现所述计算机装置1的各种功能。所述存储器20可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据计算机装置1的使用所创建的数据(比如音频数据等)等。此外,存储器20可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
在本发明所提供的几个实施例中,应所述理解到,所揭露的计算机装置和方法,可以通过其它的方式实现。例如,以上所描述的计算机装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (10)
1.一种数据库异常监测方法,其特征在于,所述方法包括:
获取上一监测周期内数据库的多个监测数据;
识别每个监测数据对应的数据指标类别,并计算每个监测数据的异常等级;
将每种数据指标类别对应的所有监测数据和异常等级生成一个样本数据集;
遍历算法模型池中的多个算法模型,利用所述样本数据集为每一种数据指标类别训练一个数据库监测子模型,并计算每一数据库监测子模型对应的权重;
根据每一数据库监测子模型及每一数据库监测子模型对应的权重生成目标数据库监测模型;
获取当前监测周期内所述数据库中的多个监测数据,并通过所述目标数据库监测模型计算当前监测周期内每个监测数据的异常等级;
基于所述当前监测周期内每个监测数据及对应的异常等级更新所述目标数据库监测模型,并基于更新后的目标数据库监测模型利用下一监测周期内所述数据库中的多个监测数据对所述数据库进行异常监测。
2.如权利要求1所述的数据库异常监测方法,其特征在于,在所述识别每个监测数据对应的数据指标类别之前,所述方法还包括:
获取分类样本集,所述分类样本集中包括监测数据及监测数据对应的数据指标类别标签;
将所述分类样本集按照预设比例划分为训练集和验证集;
建立分类学习模型,利用所述训练集训练所述分类学习模型,并利用所述验证集验证所述分类学习模型,所述分类学习模型用于输出所述每个监测数据对应的数据指标类别。
3.如权利要求1所述的数据库异常监测方法,其特征在于,所述遍历算法模型池中的多个算法模型,利用所述样本数据集为每一种数据指标类别训练一个数据库监测子模型包括:
利用所述样本数据集训练所述算法模型池中的每一种算法模型;
遍历算法模型池中的每一算法模型后,基于每一种算法模型的训练参数确定其中一个算法模型作为所述数据指标类别对应的数据库监测子模型,其中,所述训练参数包括如下至少一种:训练模型所耗时长、模型的输出准确率。
4.如权利要求1所述的数据库异常监测方法,其特征在于,利用所述样本数据集为每一种数据指标类别训练一个数据库监测子模型之前,所述方法还包括:
识别所述样本数据集中非数值监测数据并将所述非数值监测数据转换为数值化监测数据。
6.如权利要求1所述的数据库异常监测方法,其特征在于,利用所述样本数据集为每一种数据指标类别训练一个数据库监测子模型之前,所述方法还包括:
执行降维操作指令,对所述样本数据集中的监测数据进行降维处理。
7.如权利要求6所述的数据库异常监测方法,其特征在于,利用主成分分析法或反向特征消除法对所述监测数据进行降维处理。
8.一种数据库异常监测装置,其特征在于,所述装置包括:
数据获取模块,用于获取上一监测周期内数据库的多个监测数据,识别每个监测数据对应的数据指标类别,并计算每个监测数据的异常等级;
模型训练模块,用于将每种数据指标类别对应的所有监测数据和异常等级作为一个样本数据集;遍历算法模型池中的多个算法模型,利用所述样本数据集为每一种数据指标类别训练一个数据库监测子模型,并计算每一数据库监测子模型对应的权重;根据每一数据库监测子模型及每一数据库监测子模型对应的权重生成目标数据库监测模型;
异常监测模块,用于获取当前监测周期内所述数据库中的多个监测数据,并通过所述目标数据库监测模型计算当前监测周期内每个监测数据的异常等级;
更新模块,用于基于所述当前监测周期内每个监测数据及对应的异常等级更新所述目标数据库监测模型,所述更新后的目标数据库监测模型用于利用下一监测周期内所述数据库中的多个监测数据对所述数据库进行异常监测。
9.一种计算机装置,其特征在于:所述计算机装置包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1-7中任一项所述的数据库异常监测方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的数据库异常监测方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010192822.XA CN111581045B (zh) | 2020-03-18 | 2020-03-18 | 数据库异常监测方法、装置、计算机装置及存储介质 |
PCT/CN2020/093331 WO2021184554A1 (zh) | 2020-03-18 | 2020-05-29 | 数据库异常监测方法、装置、计算机装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010192822.XA CN111581045B (zh) | 2020-03-18 | 2020-03-18 | 数据库异常监测方法、装置、计算机装置及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111581045A true CN111581045A (zh) | 2020-08-25 |
CN111581045B CN111581045B (zh) | 2024-05-28 |
Family
ID=72124845
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010192822.XA Active CN111581045B (zh) | 2020-03-18 | 2020-03-18 | 数据库异常监测方法、装置、计算机装置及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN111581045B (zh) |
WO (1) | WO2021184554A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112214378A (zh) * | 2020-10-23 | 2021-01-12 | 珠海格力电器股份有限公司 | 数据收集方法、装置、电子设备及存储介质 |
CN116125298A (zh) * | 2022-11-28 | 2023-05-16 | 伏瓦科技(苏州)有限公司 | 电池故障检测方法及装置 |
CN117056171A (zh) * | 2023-09-22 | 2023-11-14 | 北京博点智合科技有限公司 | 一种基于AI算法的Kafka异常监控方法及装置 |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114112030A (zh) * | 2021-12-06 | 2022-03-01 | 江西省纳米技术研究院 | 基于人工智能的光电探测器性能测试装置 |
CN114726749B (zh) * | 2022-03-02 | 2023-10-31 | 阿里巴巴(中国)有限公司 | 数据异常检测模型获取方法、装置、设备及介质 |
CN114638728B (zh) * | 2022-03-25 | 2022-11-22 | 国网河北省电力有限公司 | 一种基于大数据的电力服务中心运营实时监测方法 |
CN115167327B (zh) * | 2022-09-05 | 2022-11-18 | 安徽省产品质量监督检验研究院 | 一种新能源汽车零件生产设备的控制方法及系统 |
CN116011703B (zh) * | 2023-02-08 | 2024-01-23 | 莒县环境监测站 | 一种动态环境监测站的管理方法及系统 |
CN115860579B (zh) * | 2023-02-27 | 2023-05-09 | 山东金利康面粉有限公司 | 一种用于面粉加工的生产质量监测系统 |
CN115881574B (zh) * | 2023-03-08 | 2023-05-05 | 广东仁懋电子有限公司 | 提升碳化硅mos管制备效果的方法、系统、设备及介质 |
CN116405269B (zh) * | 2023-03-22 | 2024-01-26 | 中国华能集团有限公司北京招标分公司 | 一种网络撞库攻击检测方法 |
CN116302661B (zh) * | 2023-05-15 | 2023-10-13 | 合肥联宝信息技术有限公司 | 一种异常预测方法、装置、电子设备及存储介质 |
CN116562715B (zh) * | 2023-07-07 | 2024-01-23 | 美云智数科技有限公司 | 指标数据监测方法、装置、计算机设备和存储介质 |
CN116760195B (zh) * | 2023-08-18 | 2024-01-02 | 国网浙江省电力有限公司宁波供电公司 | 电力系统全要素资源监控方法、系统、设备和存储介质 |
CN117235760B (zh) * | 2023-09-19 | 2024-04-02 | 安徽诺中科技股份有限公司 | 企业数据的加密存储方法、装置、计算机设备及存储介质 |
CN117375147B (zh) * | 2023-09-25 | 2024-03-15 | 南方电网调峰调频(广东)储能科技有限公司 | 一种储能电站的安全监测预警与运行管理方法及系统 |
CN117579704B (zh) * | 2024-01-15 | 2024-04-12 | 深圳市检验检疫科学研究院 | 基于物联网的检测数据的采集方法及其系统 |
CN117909852B (zh) * | 2024-03-19 | 2024-05-24 | 山东省地矿工程勘察院(山东省地质矿产勘查开发局八〇一水文地质工程地质大队) | 一种用于水工环生态数据分析的监测数据状态划分方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104077371A (zh) * | 2014-06-24 | 2014-10-01 | 用友优普信息技术有限公司 | 监测数据库异常数据的方法及系统 |
US20170139806A1 (en) * | 2015-11-18 | 2017-05-18 | Nec Laboratories America, Inc. | Automated Anomaly Detection Service on Heterogeneous Log Streams |
CN108388503A (zh) * | 2018-02-13 | 2018-08-10 | 中体彩科技发展有限公司 | 数据库性能监控方法、系统、设备及计算机可读存储介质 |
JP2018190245A (ja) * | 2017-05-09 | 2018-11-29 | 株式会社日立製作所 | 設備機器の異常診断システム |
CN109271374A (zh) * | 2018-10-19 | 2019-01-25 | 国网江苏省电力有限公司信息通信分公司 | 一种基于机器学习的数据库健康度打分方法和打分系统 |
CN109542742A (zh) * | 2018-11-14 | 2019-03-29 | 国网江苏省电力有限公司信息通信分公司 | 基于专家模型的数据库服务器硬件健康评估方法 |
US20190138423A1 (en) * | 2018-12-28 | 2019-05-09 | Intel Corporation | Methods and apparatus to detect anomalies of a monitored system |
CN109787846A (zh) * | 2019-03-27 | 2019-05-21 | 湖北大学 | 一种5g网络服务质量异常监测和预测方法及系统 |
CN110262939A (zh) * | 2019-05-14 | 2019-09-20 | 苏宁金融服务(上海)有限公司 | 算法模型运行监控方法、装置、计算机设备和存储介质 |
CN110297178A (zh) * | 2018-05-11 | 2019-10-01 | 宫文峰 | 基于深度学习的柴油发电机组故障诊断与检测装置及方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101981310B1 (ko) * | 2016-12-27 | 2019-05-22 | 주식회사 씨에스리 | 데이터베이스 시스템의 이상을 탐지하는 장치 및 방법 |
CN107908533B (zh) * | 2017-06-15 | 2019-11-12 | 平安科技(深圳)有限公司 | 一种数据库性能指标的监测方法、装置、计算机可读存储介质及设备 |
CN109582529A (zh) * | 2018-09-29 | 2019-04-05 | 阿里巴巴集团控股有限公司 | 一种报警阈值的设置方法及装置 |
CN109800139A (zh) * | 2018-12-18 | 2019-05-24 | 东软集团股份有限公司 | 服务器健康度分析方法,装置,存储介质及电子设备 |
CN109947615A (zh) * | 2019-01-11 | 2019-06-28 | 阿里巴巴集团控股有限公司 | 分布式系统的监控方法和装置 |
-
2020
- 2020-03-18 CN CN202010192822.XA patent/CN111581045B/zh active Active
- 2020-05-29 WO PCT/CN2020/093331 patent/WO2021184554A1/zh active Application Filing
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104077371A (zh) * | 2014-06-24 | 2014-10-01 | 用友优普信息技术有限公司 | 监测数据库异常数据的方法及系统 |
US20170139806A1 (en) * | 2015-11-18 | 2017-05-18 | Nec Laboratories America, Inc. | Automated Anomaly Detection Service on Heterogeneous Log Streams |
JP2018190245A (ja) * | 2017-05-09 | 2018-11-29 | 株式会社日立製作所 | 設備機器の異常診断システム |
CN108388503A (zh) * | 2018-02-13 | 2018-08-10 | 中体彩科技发展有限公司 | 数据库性能监控方法、系统、设备及计算机可读存储介质 |
CN110297178A (zh) * | 2018-05-11 | 2019-10-01 | 宫文峰 | 基于深度学习的柴油发电机组故障诊断与检测装置及方法 |
CN109271374A (zh) * | 2018-10-19 | 2019-01-25 | 国网江苏省电力有限公司信息通信分公司 | 一种基于机器学习的数据库健康度打分方法和打分系统 |
CN109542742A (zh) * | 2018-11-14 | 2019-03-29 | 国网江苏省电力有限公司信息通信分公司 | 基于专家模型的数据库服务器硬件健康评估方法 |
US20190138423A1 (en) * | 2018-12-28 | 2019-05-09 | Intel Corporation | Methods and apparatus to detect anomalies of a monitored system |
CN109787846A (zh) * | 2019-03-27 | 2019-05-21 | 湖北大学 | 一种5g网络服务质量异常监测和预测方法及系统 |
CN110262939A (zh) * | 2019-05-14 | 2019-09-20 | 苏宁金融服务(上海)有限公司 | 算法模型运行监控方法、装置、计算机设备和存储介质 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112214378A (zh) * | 2020-10-23 | 2021-01-12 | 珠海格力电器股份有限公司 | 数据收集方法、装置、电子设备及存储介质 |
CN112214378B (zh) * | 2020-10-23 | 2023-03-24 | 珠海格力电器股份有限公司 | 数据收集方法、装置、电子设备及存储介质 |
CN116125298A (zh) * | 2022-11-28 | 2023-05-16 | 伏瓦科技(苏州)有限公司 | 电池故障检测方法及装置 |
CN117056171A (zh) * | 2023-09-22 | 2023-11-14 | 北京博点智合科技有限公司 | 一种基于AI算法的Kafka异常监控方法及装置 |
CN117056171B (zh) * | 2023-09-22 | 2024-01-09 | 北京博点智合科技有限公司 | 一种基于AI算法的Kafka异常监控方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2021184554A1 (zh) | 2021-09-23 |
CN111581045B (zh) | 2024-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111581045B (zh) | 数据库异常监测方法、装置、计算机装置及存储介质 | |
WO2021174835A1 (zh) | 告警信息处理方法、装置、计算机装置及存储介质 | |
US10311044B2 (en) | Distributed data variable analysis and hierarchical grouping system | |
CN103513983B (zh) | 用于预测性警报阈值确定工具的方法和系统 | |
US11037080B2 (en) | Operational process anomaly detection | |
CN109918279B (zh) | 电子装置、基于日志数据识别用户异常操作的方法及存储介质 | |
JP2021504789A (ja) | Esg基盤の企業評価遂行装置及びその作動方法 | |
CN111506723A (zh) | 问答响应方法、装置、设备及存储介质 | |
CN110781922A (zh) | 用于机器学习模型的样本数据生成方法、装置及电子设备 | |
CN111489517A (zh) | 螺丝锁附异常警报方法、装置、计算机装置及存储介质 | |
CN113177700A (zh) | 一种风险评估方法、系统、电子设备及存储介质 | |
CN113807728A (zh) | 基于神经网络的绩效考核方法、装置、设备及存储介质 | |
CN113268597A (zh) | 文本分类方法、装置、设备及存储介质 | |
US11227062B2 (en) | Data management method, apparatus and system for machine learning system | |
CN113590484B (zh) | 算法模型服务测试方法、系统、设备及存储介质 | |
US20070179922A1 (en) | Apparatus and method for forecasting control chart data | |
US20190180180A1 (en) | Information processing system, information processing method, and recording medium | |
CN113159419A (zh) | 一种群体特征画像分析方法、装置、设备及可读存储介质 | |
CN113780675A (zh) | 一种消耗预测方法、装置、存储介质及电子设备 | |
CN113033938A (zh) | 确定资源分配策略的方法、装置、终端设备及存储介质 | |
US20230334362A1 (en) | Self-adaptive multi-model approach in representation feature space for propensity to action | |
Korolev et al. | Applying Time Series for Background User Identification Based on Their Text Data Analysis | |
CN117407750A (zh) | 基于元数据的数据质量监控方法、装置、设备及存储介质 | |
CN112559487A (zh) | 财务数据分析预警方法、装置、计算机设备和存储介质 | |
CN117785250A (zh) | 系统变更的质控方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40029468 Country of ref document: HK |
|
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |