CN108376553A - 一种视频服务器的磁盘的监控方法及系统 - Google Patents

一种视频服务器的磁盘的监控方法及系统 Download PDF

Info

Publication number
CN108376553A
CN108376553A CN201810165994.0A CN201810165994A CN108376553A CN 108376553 A CN108376553 A CN 108376553A CN 201810165994 A CN201810165994 A CN 201810165994A CN 108376553 A CN108376553 A CN 108376553A
Authority
CN
China
Prior art keywords
disk
value
data
target variable
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810165994.0A
Other languages
English (en)
Other versions
CN108376553B (zh
Inventor
丁浩
吴岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201810165994.0A priority Critical patent/CN108376553B/zh
Publication of CN108376553A publication Critical patent/CN108376553A/zh
Application granted granted Critical
Publication of CN108376553B publication Critical patent/CN108376553B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C29/00Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
    • G11C29/04Detection or location of defective memory elements, e.g. cell constructio details, timing of test signals
    • G11C29/08Functional testing, e.g. testing during refresh, power-on self testing [POST] or distributed testing
    • G11C29/10Test algorithms, e.g. memory scan [MScan] algorithms; Test patterns, e.g. checkerboard patterns 

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种视频服务器的磁盘的监控方法及系统,该方法包括:获取视频服务器磁盘的磁盘物理监控数据;预先训练训练模型,将磁盘物理监控数据作为特征值输入到训练模型得到与磁盘物理监控数据对应的磁盘损坏概率值。本发明通过视频业务的下载数据为目标变量,以物理层的磁盘的下载数据为特征值进行机器学习训练;将训练得到的模型应用于磁盘状态的监控,能够给出磁盘损坏的概率值,从而将现有技术中依靠运维人员经验处理方法转化为依靠机器学习方法判断视频服务器磁盘是否发生损坏,增加监控准确性。

Description

一种视频服务器的磁盘的监控方法及系统
技术领域
本发明涉及服务器监控技术领域,特别是涉及一种视频服务器的磁盘的监控方法及系统。
背景技术
目前国内的主流视频网站,其视频服务器使用的大都是linux操作系统;在linux操作系统下,服务器监控磁盘运行状况一般使用的是SMART命令。SMART命令查看某个磁盘的状态的结果通过部分参数进行显示。但与磁盘是否损坏相关的重要参数有多个,而如何根据这多个参数决定磁盘是否“损坏”,一直是一个难题。
目前的做法是运维人员根据经验通过观察多个参数的值,来决定是否对磁盘进行维修。但是由于数值的累积直至磁盘完全损坏是一个量变产生质变的过程,因此在很多情况,磁盘的实际服务情况已经很差了,但是相关数值仍难以观察到明显的问题;或是,某项值比较异常但是其他值较为正常,很难决定是否维修磁盘,视频服务器的磁盘的监控准确性不高。
发明内容
本发明的目的在于提出一种视频服务器的磁盘的监控方法及系统,以实现提高视频服务器磁盘的监控准确性。
为达到上述目的,本发明提供了以下技术方案:
一种视频服务器的磁盘的监控方法,包括:
获取所述视频服务器的磁盘的磁盘物理监控数据;
预先训练训练模型,将所述磁盘物理监控数据作为特征值输入到所述训练模型得到与所述磁盘物理监控数据对应的磁盘损坏概率值。
优选的,根据机器学习方法进行所述训练模型的训练,包括:
获取训练数据,所述训练数据包括磁盘物理监控样本数据以及与所述磁盘物理监控样本数据对应的磁盘损坏样本概率值;
将所述磁盘物理监控样本数据作为特征值,以与所述磁盘物理监控样本数据对应的磁盘损坏样本概率值作为目标变量通过机器学习进行模型训练,得到训练模型。
优选的,所述获取所述磁盘物理监控样本数据,包括:
通过SMART命令获取预设时间内的磁盘物理状态数据,所述磁盘物理状态数据包括:磁盘坏道元素数、磁盘健康状态、磁盘带电时间、非介质错误、读操作的错误次数以及写操作的错误次数;
根据所述磁盘物理状态数据的数据类型确定所述磁盘物理监控样本数据。
优选的,所述获取所述磁盘物理监控样本数据对应的磁盘损坏样本概率值,包括:
获取预设时间内向服务器发送的所有下载请求对应的下载数据,并根据预设条件对所述下载数据进行过滤,所述下载数据包括:处理对应下载请求的磁盘标识、下载数据的文件数量、所述下载请求对应的下载时间以及网络延迟;
根据预设公式对过滤后的所有下载请求进行计算得到与每个下载请求对应的下载速度,将每条所述下载请求表示为二元组,所述二元组包括:处理对应下载请求的所述磁盘标识和对应的下载速度;
将所有下载请求按照所述磁盘标识进行分集合,得到包含多个下载速度值的N个集合,其中N为大于等于1的正整数;
针对每个磁盘的所述集合计算出下载速度值小于预设阈值的元素数,确定每个磁盘的所述集合占整个集合元素数的慢速比,得到包含所述磁盘标识和所述慢速比的N个二元组;
设定目标变量值,根据所述慢速比判断所述磁盘标识对应的磁盘损坏样本概率值。
优选的,所述设定目标变量,根据所述慢速比判断所述磁盘标识对应的磁盘损坏样本概率值,包括:
预先设定所述目标变量值为第一目标变量值、第二目标变量值、第三目标变量值,所述第一目标变量值、所述第二目标变量值和所述第三目标变量值的数值依次增大,所述目标变量值的数值越大,则对应的所述磁盘损坏的概率越大;
计算N个所述磁盘的慢速比的平均值;
预先设定第一预设比例和第二预设比例,逐个将所述磁盘的慢速比与所述平均值进行对比;
当所述磁盘的慢速比比所述平均值高所述第一预设比例时,则所述磁盘的目标变量值为所述第三目标变量值;
当所述磁盘的慢速比比所述平均值高所述第二预设比例但小于等于所述第一预设比例时,则所述磁盘的目标变量值为所述第二目标变量值;
当所述磁盘的慢速比比所述平均值高所述第二预设比例时,则所述磁盘的目标变量值为所述第一目标变量值;
根据所述目标变量值确定所述磁盘标识对应的磁盘损坏样本概率值。
一种视频服务器的磁盘的监控系统,包括:
获取模块,用于获取所述视频服务器的磁盘的磁盘物理监控数据;
确定模块,用于预先训练训练模型,将所述磁盘物理监控数据作为特征值输入到所述训练模型得到与所述磁盘物理监控数据对应的磁盘损坏概率值。
优选的,所述确定模块包括:训练模块,用于根据机器学习方法进行所述训练模型的训练,所述训练模块包括:
获取单元,用于获取训练数据,所述训练数据包括磁盘物理监控样本数据以及与所述磁盘物理监控样本数据对应的磁盘损坏样本概率值;
训练单元,用于将所述磁盘物理监控样本数据作为特征值,以与所述磁盘物理监控样本数据对应的磁盘损坏样本概率值作为目标变量通过机器学习进行模型训练,得到训练模型。
优选的,所述获取单元包括:
第一获取子单元,用于通过SMART命令获取预设时间内的磁盘物理状态数据,所述磁盘物理状态数据包括:磁盘坏道元素数、磁盘健康状态、磁盘带电时间、非介质错误、读操作的错误次数以及写操作的错误次数;
第一确定单元,用于根据所述磁盘物理状态数据的数据类型确定所述磁盘物理监控样本数据。
优选的,所述获取单元包括:
第二获取子单元,用于获取预设时间内向服务器发送的所有下载请求对应的下载数据,并根据预设条件对所述下载数据进行过滤,所述下载数据包括:处理对应下载请求的磁盘标识、下载文件的大小、所述下载请求对应的下载时间以及网络延迟;
第一计算单元,用于根据预设公式对过滤后的所有下载请求进行计算得到与每个下载请求对应的下载速度,将每条所述下载请求表示为二元组,所述二元组包括:处理对应下载请求的所述磁盘标识和对应的下载速度;
分集合单元,用于将所有下载请求按照所述磁盘标识进行分集合,得到包含多个下载速度值的N个集合,其中N为大于等于1的正整数;
第二计算单元,用于针对每个磁盘的所述集合计算出下载速度值小于预设阈值的元素数,确定每个磁盘的所述集合占整个集合元素数的慢速比,得到包含所述磁盘标识和所述慢速比的N个二元组;
第二确定单元,用于设定目标变量值,根据所述慢速比判断所述磁盘标识对应的磁盘损坏样本概率值。
优选的,所述第二确定单元包括:
预设单元,用于预先设定所述目标变量值为第一目标变量值、第二目标变量值、第三目标变量值,所述第一目标变量值、所述第二目标变量值和所述第三目标变量值的数值依次增大,所述目标变量值的数值越大,则对应的所述磁盘损坏的概率越大;
第三计算单元,用于计算N个所述磁盘的慢速比的平均值;
对比单元,用于预先设定第一预设比例和第二预设比例,逐个将所述磁盘的慢速比与所述平均值进行对比;
当所述磁盘的慢速比比所述平均值高所述第一预设比例时,则所述磁盘的目标变量值为所述第三目标变量值;
当所述磁盘的慢速比比所述平均值高所述第二预设比例但小于等于所述第一预设比例时,则所述磁盘的目标变量值为所述第二目标变量值;
当所述磁盘的慢速比比所述平均值高所述第二预设比例时,则所述磁盘的目标变量值为所述第一目标变量值;
第三确定单元,用于根据所述目标变量值确定所述磁盘标识对应的磁盘损坏样本概率值。
经由上述的技术方案可知,与现有技术相比,本发明公开了一种视频服务器的磁盘的监控方法及系统,该方法包括:获取视频服务器的磁盘的磁盘物理监控数据;预先训练训练模型,将磁盘物理监控数据作为特征值输入到训练模型得到与磁盘物理监控数据对应的磁盘损坏概率值。本发明通过视频业务的下载数据为目标变量,以物理层的磁盘的下载数据为特征值进行机器学习训练;将训练得到的模型应用于磁盘状态的监控,能够给出磁盘损坏的概率值,从而将现有技术中依靠运维人员经验处理方法转化为依靠机器学习方法判断视频服务器磁盘是否发生损坏,增加监控准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种视频服务器的磁盘的监控方法流程示意图;
图2为本发明实施例提供的根据机器学习方法进行训练模型的训练方法流程示意图;
图3为本发明实施例提供的图2中的步骤S201获取磁盘物理监控样本数据的具体流程示意图;
图4为本发明实施例提供的图2中的步骤S201获取磁盘物理监控样本数据对应的磁盘损坏样本概率值的具体流程示意图;
图5为本发明实施例提供的图4中的步骤S405判断磁盘标识对应的磁盘损坏样本概率值的具体流程示意图;
图6为本发明实施例提供的一种视频服务器的磁盘的监控系统结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅附图1,图1为本发明实施例提供的一种视频服务器的磁盘的监控方法流程示意图。如图1所示,本发明公开了一种视频服务器的磁盘的监控方法,该方法具体包括如下步骤:
S101、获取视频服务器的磁盘的磁盘物理监控数据。
需要说明的是,在本实施例中,磁盘物理监控数据可通过SMART命令获取预设时间内的磁盘物理状态数据,磁盘物理状态数据包括:磁盘坏道元素数、磁盘健康状态、磁盘带电时间、非介质错误、读操作的错误次数以及写操作的错误次数。
具体的,磁盘坏道元素数(Elements in grown defect list):实际含义为与磁盘坏道有关的参数,其为数值型整数变量;磁盘健康状态(SMART Health Status):SMART系统给出的磁盘是否健康的判断,无法直接利用此参数决定磁盘是否健康,只能参考,其为标称型变量,标记“磁盘健康”记为0,其他所有状态记为1;磁盘带电时间(number of hourspowered up):其为数值型小数变量,训练的时候将小数四舍五入变为数值型整数变量;非介质错误(Non-medium error count):其为数值型整数变量;读操作的错误次数(Correction algorithm invocations(read)):其为数值型整数变量;写操作的错误次数(Correction algorithm invocations(write)):其为数值型整数变量。
S102、预先训练训练模型,将磁盘物理监控数据作为特征值输入到训练模型得到与磁盘物理监控数据对应的磁盘损坏概率值。
需要说明的是,在本实施例中,请参阅附图2所示,具体还包括:
根据机器学习方法进行训练训练模型,则根据机器学习方法进行训练训练模型,该步骤具体的包括如下:
S201、获取训练数据,训练数据包括磁盘物理监控样本数据以及与磁盘物理监控样本数据对应的磁盘损坏样本概率值。
S202、将磁盘物理监控样本数据作为特征值,以与磁盘物理监控样本数据对应的磁盘损坏样本概率值作为目标变量通过机器学习进行模型训练,得到训练模型。
需要说明的是,上述机器学习方法为监督学习算法中的CART(ClassificationAnd Regression Tree,分类回归树)算法、朴素贝叶斯算法、SVM(Support VectorMachine,支持向量机)算法、ID3算法等等。得到的训练模型具体为决策树模型。
由于下载速度的计算是以时间t为间隔进行的,在此时间间隔内,可以获得多次的SMART命令得到的磁盘物理状态的结果,因此在实际训练的过程中对于多次SMART的结果,若特征值为1、3、4、5、6,由于是数值型变量,取其平均值即可。对于特征值2,多次结果中只有出现一次取值为2的情况,就取值2,则确定了特征值和目标变量,就可以用相应的机器学习方法进行训练。
具体的,请参阅附图3,步骤S201中获取磁盘物理监控样本数据,该步骤包括如下步骤:
S301、通过SMART命令获取预设时间内的磁盘物理状态数据,磁盘物理状态数据包括:磁盘坏道元素数、磁盘健康状态、磁盘带电时间、非介质错误、读操作的错误次数以及写操作的错误次数;
S302、根据磁盘物理状态数据的数据类型确定磁盘物理监控样本数据。
需要说明的是,该数据类型为磁盘物理状态数据的类型,步骤S301中已说明磁盘物理状态数据包括:磁盘坏道元素数、磁盘健康状态、磁盘带电时间、非介质错误、读操作的错误次数以及写操作的错误次数。
具体的,请参阅附图4,步骤S201中获取磁盘物理监控样本数据对应的磁盘损坏样本概率值,该步骤包括如下步骤:
需要说明的是,目标变量是视频服务器应用层分磁盘的下载速度状况统计,相关数据可以从视频服务器的相关日志中获得。日志应当针对每一条下载请求相关信息,目前可以通过使用Nginx服务器能够记录下相关所有信息,具体的,确定训练使用的目标变量的值使用的是如下方法:
S401、获取预设时间内向服务器发送的所有下载请求对应的下载数据,并根据预设条件对所述下载数据进行过滤,所述下载数据包括:处理对应下载请求的磁盘标识、下载文件的大小、所述下载请求对应的下载时间以及网络往返延迟。
需要说明的是,上述预设时间可以根据实际情况进行预设,一般设置为5分钟,并对在5分钟之内获取的相关信息进行过滤,过滤条件可以设置为下载文件的大小小于某个值的记录进行过滤掉,具体可以设置为100Kbytes,即将下载文件的大小小于100Kbytes的下载请求去除。
S402、根据预设公式对过滤后的所有下载请求进行计算得到与每个下载请求对应的下载速度,将每条下载请求表示为二元组,该二元组包括:处理对应下载请求的磁盘标识和对应的下载速度。
需要说明的是,上述预设公式具体为:下载速度=下载文件大小/(整体下载时间+网络延迟),则通过预设公式计算后得到每条下载请求可以变为一个二元组,即:(处理对应下载请求的磁盘标识,下载速度)。
S403、将所有下载请求按照磁盘标识进行分集合,得到包含多个下载速度值的N个集合,其中N为大于等于1的正整数。
分集合是将所有下载请求按照磁盘标识进行分配,一个磁盘可以看作一个集合,举例说明:假设有8块磁盘,则将其一共分成8个集合,每个集合中的数值为一系列的下载速度值。
S404、针对每个磁盘的集合计算出下载速度值小于预设阈值的元素数,确定每个磁盘的集合占整个集合元素数的慢速比,得到包含磁盘标识和慢速比的N个二元组。
需要说明的是,针对每个磁盘的集合,算出其中下载速度数值小于某个阈值的元素数占整个集合元素数的比例。这个比例一般称为“慢速比”,阈值一般称为“慢速阈值”。假设慢速阈值为100,某个磁盘的速度集合为:{50,80,,101,250,463,356,1200,2100,99,456},则其慢速比为3/10=30%。
由此得到了n个磁盘慢速比二元组。假设有8个磁盘,则8个二元组可以为:(磁盘一,14%),(磁盘二,15%),(磁盘三,15%),(磁盘四,20%),(磁盘五,17%),(磁盘六,14%),(磁盘七,13%),(磁盘八,12%)。
S405、设定目标变量值,根据慢速比判断磁盘标识对应的磁盘损坏样本概率值。
需要说明的是,请参阅附图5,步骤S405中设定目标变量,根据慢速比判断磁盘标识对应的磁盘损坏样本概率值,该步骤包括如下步骤:
S501、预先设定目标变量值为第一目标变量值、第二目标变量值、第三目标变量值,第一目标变量值、第二目标变量值和第三目标变量值的数值依次增大,目标变量值的数值越大,则对应的磁盘损坏的概率越大。
S502、计算N个磁盘的慢速比的平均值。
S503、预先设定第一预设比例和第二预设比例,逐个将磁盘的慢速比与平均值进行对比。
S504、当磁盘的慢速比比平均值高第一预设比例时,则磁盘的目标变量值为第三目标变量值;当磁盘的慢速比比平均值高第二预设比例但小于等于第一预设比例时,则磁盘的目标变量值为第二目标变量值;当磁盘的慢速比比平均值高第二预设比例时,则磁盘的目标变量值为第一目标变量值。
S505、根据目标变量值确定磁盘标识对应的磁盘损坏样本概率值。
具体的,需要说明的是,由于下载速度是一个与网络条件、IDC状况息息相关的量,所以看速度的绝对值或者慢速比例的绝对值,因此需要进行不同磁盘的慢速比的对比。本实施例定义目标变量有三个值,分别为1、2、3,数值越大,则对应的磁盘损坏的概率越大,代表磁盘服务质量越差。
根据慢速比例判断磁盘取值的方法为:以以上8个磁盘为例:计算8个磁盘慢速比的均值,然后逐个磁盘的慢速比与此均值对比,若磁盘慢速比比均值高m%,则磁盘目标变量值为3;若慢速比比均值高n%但小于等于m%,则取值为2;若慢速比比均值高小于等于n%,则取值为1;其中100>m>n>0。上述的例子中,若m=4,n=2;则根据计算得到磁盘慢速比均值为15%,最后计算中,磁盘一、磁盘二、磁盘三、磁盘六、磁盘七、磁盘八的目标变量值均为1,磁盘五为2,磁盘四为3。
在应用的过程中,实际使用效果是这样的:给出一组磁盘物理监控数据,模型将给出的结果是“根据这组数据来看,该磁盘有x%的概率处于1状态,y%的概率处于2状态,z%的概率处于3状态”。根据这组数据,运维人员可以决定继续决定是否对磁盘进行维修。
本实施例公开了一种视频服务器的磁盘的监控方法,该方法包括:获取视频服务器磁盘的磁盘物理监控数据;预先训练训练模型,将磁盘物理监控数据作为特征值输入到训练模型得到与磁盘物理监控数据对应的磁盘损坏概率值。本实施例通过视频业务的下载数据为目标变量,以物理层的磁盘的下载数据为特征值进行机器学习训练;将训练得到的模型应用于磁盘状态的监控,能够给出磁盘损坏的概率值,从而将现有技术中依靠运维人员经验处理方法转化为依靠机器学习方法判断视频服务器磁盘是否发生损坏,增加监控准确性。
本发明在上述公开的方法的基础上,还公开了对应的系统。
下面对本发明实施例提供的一种视频服务器的磁盘的监控系统进行介绍,需要说明的是,有关该视频服务器的磁盘的监控系统的说明可参照上文提供的视频服务器的磁盘的监控方法,以下并不做赘述。
请参阅附图6,图6为本发明实施例提供的一种视频服务器的磁盘的监控系统结构示意图。如图6所示,本实施例公开了一种视频服务器的磁盘的监控系统,具体的,该系统包括:获取模块601和确定模块602,其中:
获取模块601,用于获取视频服务器的磁盘的磁盘物理监控数据;
确定模块602,用于预先训练训练模型,将磁盘物理监控数据作为特征值输入到训练模型得到与磁盘物理监控数据对应的磁盘损坏概率值。
优选的,所述确定模块包括:训练模型,用于根据机器学习方法进行训练训练模型,则训练模块包括:
获取单元,用于获取训练数据,训练数据包括磁盘物理监控数据以及与磁盘物理监控数据对应的磁盘损坏样本概率值;
训练单元,用于将磁盘物理监控样本数据作为特征值,以与磁盘物理监控样本数据对应的磁盘损坏样本概率值作为目标变量通过机器学习进行模型训练,得到训练模型。
可选的,上述获取单元包括:
第一获取子单元,用于通过SMART命令获取预设时间内的磁盘物理状态数据,磁盘物理状态数据包括:磁盘坏道元素数、磁盘健康状态、磁盘带电时间、非介质错误、读操作的错误次数以及写操作的错误次数;
第一确定单元,用于根据磁盘物理状态数据的数据类型确定磁盘物理监控数据。
可选的,上述获取单元包括:
第二获取子单元,用于获取预设时间内向服务器发送的所有下载请求对应的下载数据,并根据预设条件对所述下载数据进行过滤,所述下载数据包括:处理对应下载请求的磁盘标识、下载文件的大小、所述下载请求对应的下载时间以及网络延迟;
第一计算单元,用于根据预设公式对过滤后的所有下载请求进行计算得到与每个下载请求对应的下载速度,将每条下载请求表示为二元组,所述二元组包括:处理对应下载请求的磁盘标识和对应的下载速度;
分集合单元,用于将所有下载请求按照磁盘标识进行分集合,得到包含多个下载速度值的N个集合,其中N为大于等于1的正整数;
第二计算单元,用于针对每个磁盘的集合计算出下载速度值小于预设阈值的元素数,确定每个磁盘的集合占整个集合元素数的慢速比,得到包含磁盘标识和慢速比的N个二元组;
第二确定单元,用于设定目标变量值,根据慢速比判断磁盘标识对应的磁盘损坏样本概率值。
可选的,上述第二确定单元包括:
预设单元,用于预先设定目标变量值为第一目标变量值、第二目标变量值、第三目标变量值,所述第一目标变量值、所述第二目标变量值和所述第三目标变量值的数值依次增大,目标变量值的数值越大,则对应的磁盘损坏的概率越大。
第三计算单元,用于计算N个磁盘的慢速比的平均值。
对比单元,用于预先设定第一预设比例和第二预设比例,逐个将磁盘的慢速比与平均值进行对比。
当磁盘的慢速比比平均值高第一预设比例时,则磁盘的目标变量值为第三目标变量值;
当磁盘的慢速比比平均值高第二预设比例但小于等于第一预设比例时,则磁盘的目标变量值为第二目标变量值;
当磁盘的慢速比比平均值高第二预设比例时,则磁盘的目标变量值为第一目标变量值;
第三确定单元,用于根据目标变量值确定磁盘标识对应的磁盘损坏样本概率值。
本实施例公开了一种视频服务器的磁盘的监控系统,通过该系统获取视频服务器磁盘的磁盘物理监控数据;预先训练训练模型,将磁盘物理监控数据作为特征值输入到训练模型得到与磁盘物理监控数据对应的磁盘损坏概率值。本实施例通过视频业务的下载数据为目标变量,以物理层的磁盘的下载数据为特征值进行机器学习训练;将训练得到的模型应用于磁盘状态的监控,能够给出磁盘损坏的概率值,从而将现有技术中依靠运维人员经验处理方法转化为依靠机器学习方法判断视频服务器磁盘是否发生损坏,增加监控准确性。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括上述要素的物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种视频服务器的磁盘的监控方法,其特征在于,包括:
获取所述视频服务器的磁盘的磁盘物理监控数据;
预先训练训练模型,将所述磁盘物理监控数据作为特征值输入到所述训练模型得到与所述磁盘物理监控数据对应的磁盘损坏概率值。
2.根据权利要求1所述的监控方法,其特征在于,根据机器学习方法进行所述训练模型的训练,包括:
获取训练数据,所述训练数据包括磁盘物理监控样本数据以及与所述磁盘物理监控样本数据对应的磁盘损坏样本概率值;
将所述磁盘物理监控样本数据作为特征值,以与所述磁盘物理监控样本数据对应的磁盘损坏样本概率值作为目标变量通过机器学习进行模型训练,得到训练模型。
3.根据权利要求2所述的监控方法,其特征在于,所述获取所述磁盘物理监控样本数据,包括:
通过SMART命令获取预设时间内的磁盘物理状态数据,所述磁盘物理状态数据包括:磁盘坏道元素数、磁盘健康状态、磁盘带电时间、非介质错误、读操作的错误次数以及写操作的错误次数;
根据所述磁盘物理状态数据的数据类型确定所述磁盘物理监控样本数据。
4.根据权利要求2所述的监控方法,其特征在于,所述获取所述磁盘物理监控样本数据对应的磁盘损坏样本概率值,包括:
获取预设时间内向服务器发送的所有下载请求对应的下载数据,并根据预设条件对所述下载数据进行过滤,所述下载数据包括:处理对应下载请求的磁盘标识、下载数据的文件数量、所述下载请求对应的下载时间以及网络延迟;
根据预设公式对过滤后的所有下载请求进行计算得到与每个下载请求对应的下载速度,将每条所述下载请求表示为二元组,所述二元组包括:处理对应下载请求的所述磁盘标识和对应的下载速度;
将所有下载请求按照所述磁盘标识进行分集合,得到包含多个下载速度值的N个集合,其中N为大于等于1的正整数;
针对每个磁盘的所述集合计算出下载速度值小于预设阈值的元素数,确定每个磁盘的所述集合占整个集合元素数的慢速比,得到包含所述磁盘标识和所述慢速比的N个二元组;
设定目标变量值,根据所述慢速比判断所述磁盘标识对应的磁盘损坏样本概率值。
5.根据权利要求4所述的监控方法,其特征在于,所述设定目标变量,根据所述慢速比判断所述磁盘标识对应的磁盘损坏样本概率值,包括:
预先设定所述目标变量值为第一目标变量值、第二目标变量值、第三目标变量值,所述第一目标变量值、所述第二目标变量值和所述第三目标变量值的数值依次增大,所述目标变量值的数值越大,则对应的所述磁盘损坏的概率越大;
计算N个所述磁盘的慢速比的平均值;
预先设定第一预设比例和第二预设比例,逐个将所述磁盘的慢速比与所述平均值进行对比;
当所述磁盘的慢速比比所述平均值高所述第一预设比例时,则所述磁盘的目标变量值为所述第三目标变量值;
当所述磁盘的慢速比比所述平均值高所述第二预设比例但小于等于所述第一预设比例时,则所述磁盘的目标变量值为所述第二目标变量值;
当所述磁盘的慢速比比所述平均值高所述第二预设比例时,则所述磁盘的目标变量值为所述第一目标变量值;
根据所述目标变量值确定所述磁盘标识对应的磁盘损坏样本概率值。
6.一种视频服务器的磁盘的监控系统,其特征在于,包括:
获取模块,用于获取所述视频服务器的磁盘的磁盘物理监控数据;
确定模块,用于预先训练训练模型,将所述磁盘物理监控数据作为特征值输入到所述训练模型得到与所述磁盘物理监控数据对应的磁盘损坏概率值。
7.根据权利要求6所述的监控系统,其特征在于,所述确定模块包括:训练模块,用于根据机器学习方法进行所述训练模型的训练,所述训练模块包括:
获取单元,用于获取训练数据,所述训练数据包括磁盘物理监控样本数据以及与所述磁盘物理监控样本数据对应的磁盘损坏样本概率值;
训练单元,用于将所述磁盘物理监控样本数据作为特征值,以与所述磁盘物理监控样本数据对应的磁盘损坏样本概率值作为目标变量通过机器学习进行模型训练,得到训练模型。
8.根据权利要求7所述的监控系统,其特征在于,所述获取单元包括:
第一获取子单元,用于通过SMART命令获取预设时间内的磁盘物理状态数据,所述磁盘物理状态数据包括:磁盘坏道元素数、磁盘健康状态、磁盘带电时间、非介质错误、读操作的错误次数以及写操作的错误次数;
第一确定单元,用于根据所述磁盘物理状态数据的数据类型确定所述磁盘物理监控样本数据。
9.根据权利要求7所述的监控系统,其特征在于,所述获取单元包括:
第二获取子单元,用于获取预设时间内向服务器发送的所有下载请求对应的下载数据,并根据预设条件对所述下载数据进行过滤,所述下载数据包括:处理对应下载请求的磁盘标识、下载文件的大小、所述下载请求对应的下载时间以及网络延迟;
第一计算单元,用于根据预设公式对过滤后的所有下载请求进行计算得到与每个下载请求对应的下载速度,将每条所述下载请求表示为二元组,所述二元组包括:处理对应下载请求的所述磁盘标识和对应的下载速度;
分集合单元,用于将所有下载请求按照所述磁盘标识进行分集合,得到包含多个下载速度值的N个集合,其中N为大于等于1的正整数;
第二计算单元,用于针对每个磁盘的所述集合计算出下载速度值小于预设阈值的元素数,确定每个磁盘的所述集合占整个集合元素数的慢速比,得到包含所述磁盘标识和所述慢速比的N个二元组;
第二确定单元,用于设定目标变量值,根据所述慢速比判断所述磁盘标识对应的磁盘损坏样本概率值。
10.根据权利要求9所述的监控系统,其特征在于,所述第二确定单元包括:
预设单元,用于预先设定所述目标变量值为第一目标变量值、第二目标变量值、第三目标变量值,所述第一目标变量值、所述第二目标变量值和所述第三目标变量值的数值依次增大,所述目标变量值的数值越大,则对应的所述磁盘损坏的概率越大;
第三计算单元,用于计算N个所述磁盘的慢速比的平均值;
对比单元,用于预先设定第一预设比例和第二预设比例,逐个将所述磁盘的慢速比与所述平均值进行对比;
当所述磁盘的慢速比比所述平均值高所述第一预设比例时,则所述磁盘的目标变量值为所述第三目标变量值;
当所述磁盘的慢速比比所述平均值高所述第二预设比例但小于等于所述第一预设比例时,则所述磁盘的目标变量值为所述第二目标变量值;
当所述磁盘的慢速比比所述平均值高所述第二预设比例时,则所述磁盘的目标变量值为所述第一目标变量值;
第三确定单元,用于根据所述目标变量值确定所述磁盘标识对应的磁盘损坏样本概率值。
CN201810165994.0A 2018-02-28 2018-02-28 一种视频服务器的磁盘的监控方法及系统 Active CN108376553B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810165994.0A CN108376553B (zh) 2018-02-28 2018-02-28 一种视频服务器的磁盘的监控方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810165994.0A CN108376553B (zh) 2018-02-28 2018-02-28 一种视频服务器的磁盘的监控方法及系统

Publications (2)

Publication Number Publication Date
CN108376553A true CN108376553A (zh) 2018-08-07
CN108376553B CN108376553B (zh) 2020-11-03

Family

ID=63018377

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810165994.0A Active CN108376553B (zh) 2018-02-28 2018-02-28 一种视频服务器的磁盘的监控方法及系统

Country Status (1)

Country Link
CN (1) CN108376553B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109245943A (zh) * 2018-10-19 2019-01-18 北京奇艺世纪科技有限公司 一种故障定位方法及装置
CN109614284A (zh) * 2018-10-25 2019-04-12 北京奇艺世纪科技有限公司 一种数据处理方法及装置
CN110197698A (zh) * 2019-05-23 2019-09-03 东莞记忆存储科技有限公司 自动测试ssd不同电源状态影响的方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150074450A1 (en) * 2013-09-09 2015-03-12 International Business Machines Corporation Hard disk drive (hdd) early failure detection in storage systems based on statistical analysis
CN105589795A (zh) * 2014-12-31 2016-05-18 中国银联股份有限公司 基于预测模型的磁盘故障预测方法及装置
US20170139792A1 (en) * 2015-11-17 2017-05-18 International Business Machines Corporation Instant recovery in a multi-grained caching framework
CN107025154A (zh) * 2016-01-29 2017-08-08 阿里巴巴集团控股有限公司 磁盘的故障预测方法和装置
CN107066365A (zh) * 2017-02-20 2017-08-18 阿里巴巴集团控股有限公司 一种系统异常的监测方法及装置
CN107479836A (zh) * 2017-08-29 2017-12-15 郑州云海信息技术有限公司 磁盘故障监控方法、装置以及存储系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150074450A1 (en) * 2013-09-09 2015-03-12 International Business Machines Corporation Hard disk drive (hdd) early failure detection in storage systems based on statistical analysis
CN105589795A (zh) * 2014-12-31 2016-05-18 中国银联股份有限公司 基于预测模型的磁盘故障预测方法及装置
US20170139792A1 (en) * 2015-11-17 2017-05-18 International Business Machines Corporation Instant recovery in a multi-grained caching framework
CN107025154A (zh) * 2016-01-29 2017-08-08 阿里巴巴集团控股有限公司 磁盘的故障预测方法和装置
CN107066365A (zh) * 2017-02-20 2017-08-18 阿里巴巴集团控股有限公司 一种系统异常的监测方法及装置
CN107479836A (zh) * 2017-08-29 2017-12-15 郑州云海信息技术有限公司 磁盘故障监控方法、装置以及存储系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
叶茂: "基于磁盘I_O负载特征的磁盘故障分析与预警方法研究", 《中国优秀硕士学位论文全文数据库(电子期刊)》 *
柳永康: "基于机器学习的磁盘故障预测系统", 《中国优秀硕士学位论文全文数据库(电子期刊)》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109245943A (zh) * 2018-10-19 2019-01-18 北京奇艺世纪科技有限公司 一种故障定位方法及装置
CN109245943B (zh) * 2018-10-19 2022-02-01 北京奇艺世纪科技有限公司 一种故障定位方法及装置
CN109614284A (zh) * 2018-10-25 2019-04-12 北京奇艺世纪科技有限公司 一种数据处理方法及装置
CN109614284B (zh) * 2018-10-25 2022-06-14 北京奇艺世纪科技有限公司 一种数据处理方法及装置
CN110197698A (zh) * 2019-05-23 2019-09-03 东莞记忆存储科技有限公司 自动测试ssd不同电源状态影响的方法及装置
CN110197698B (zh) * 2019-05-23 2021-03-05 东莞记忆存储科技有限公司 自动测试ssd不同电源状态影响的方法及装置

Also Published As

Publication number Publication date
CN108376553B (zh) 2020-11-03

Similar Documents

Publication Publication Date Title
EP3557819B1 (en) Server failure detection method and system
CN108376553A (zh) 一种视频服务器的磁盘的监控方法及系统
US7502844B2 (en) Abnormality indicator of a desired group of resource elements
CN110874674B (zh) 一种异常检测方法、装置及设备
CN107992410B (zh) 软件质量监测方法、装置、计算机设备和存储介质
CN112130892A (zh) 产品灰度发布方法、装置、设备及存储介质
CN103649960B (zh) 用于确定即刻发布结果的最优qc策略的系统与方法
CN110513958B (zh) 一种确定设备健康状况方法及装置
CN108234247A (zh) 一种检测网络质量的方法和系统
CN109617758B (zh) 节点网络质量计算方法及装置、服务器、计算机存储介质
CN108809760A (zh) 数据采样系统中采样周期的控制方法和装置
CN112365361A (zh) 一种基于规则库的电力计量数据质量体检方法
JP2020068025A (ja) 履歴及び時系列の共同分析に基づく異常の特性評価のためのシステム及び方法
CN113835626B (zh) 一种确定磁盘可使用时长的方法及装置
CN108027760B (zh) 数据存储设备监视的方法及系统
CN105101276B (zh) 一种移动网络信号稳定性的监控方法及装置
CN116771611A (zh) 一种风电机组功率监测方法及装置
CN113722179B (zh) 一种磁盘健康状态监测方法、系统及装置
CN111176950A (zh) 一种监控服务器集群的网卡的方法和设备
CN115701890A (zh) 调整告警规则的方法及相关设备
CN114237098B (zh) 一种电气产品的智能化数字管理系统
CN114064413B (zh) 容器组调控方法、装置及电子设备
CN115690681A (zh) 异常判断依据的处理方法、异常判断方法及装置
CN108765140A (zh) 批量业务异常监控方法以及第一电子设备
CN111651316B (zh) 一种资源监控方法、系统、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant