CN110209558B - 基于软件定义存储的智能运维方法和装置 - Google Patents

基于软件定义存储的智能运维方法和装置 Download PDF

Info

Publication number
CN110209558B
CN110209558B CN201910339968.XA CN201910339968A CN110209558B CN 110209558 B CN110209558 B CN 110209558B CN 201910339968 A CN201910339968 A CN 201910339968A CN 110209558 B CN110209558 B CN 110209558B
Authority
CN
China
Prior art keywords
maintenance
characteristic information
storage
storage resource
access
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910339968.XA
Other languages
English (en)
Other versions
CN110209558A (zh
Inventor
张旭明
王豪迈
胥昕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xingchen Tianhe Technology Co ltd
Original Assignee
Xsky Beijing Data Technology Corp ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xsky Beijing Data Technology Corp ltd filed Critical Xsky Beijing Data Technology Corp ltd
Publication of CN110209558A publication Critical patent/CN110209558A/zh
Application granted granted Critical
Publication of CN110209558B publication Critical patent/CN110209558B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3438Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment monitoring of user actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Computer Hardware Design (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种基于软件定义存储的智能运维方法和装置。其中,该方法包括:获取对象操作运维工具时的行为特征信息和/或业务程序访问存储资源的访问特征信息,其中,所述存储资源表示用于存储数据的资源;基于所述行为特征信息和/或访问特征信息调整存储资源对应的处理等级;根据所述处理等级调整用于对所述存储资源进行运维的运维策略。本发明解决了现有技术中对软件定义存储的运维是按照一定的策略无差异化的进行系统运维,导致运维效率低的技术问题。

Description

基于软件定义存储的智能运维方法和装置
本申请要求于2019年04月10日提交中国专利局、申请号为201910285423.5、申请名称“数据的处理方法和装置”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本发明涉及数据处理领域,具体而言,涉及一种基于软件定义存储的智能运维方法和装置。
背景技术
软件定义存储是通过软件定义的方式,将存储软件部署在通用服务器之上,构建高可用的存储系统。软件定义存储具有如下几个特点:软件运行在通用操作系统之上;整套系统构建在通用服务器之上;采用分布式设计,支持横向扩展;支持大规模集群:通过横向扩展可以达到数百甚至上千台服务器的规模。
其中,大规模存储集群涉及大量的资源管理需求,例如,集群由数百台的服务器及数十台网络设备构成,每台服务器中还包括若干CPU、内存、硬盘、网卡等组件;同时,大规模存储集群给业务提供数据存储空间也非常巨大,这些海量的资源都需要高效的运维系统来支撑。通常情况下,由运维系统扫描系统,识别硬件问题,以及资源使用情况,并显示在管理界面上,以便运维人员掌握系统运行情况。但由于资源非常多,因此运维系统往往也被开发成非常庞大的系统,在此背景下,如何提升运维效率,以及如何降低运维资源的消耗则非常重要。
针对现有技术中对软件定义存储的运维是按照一定的策略无差异化的进行系统运维,导致运维效率低的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种基于软件定义存储的智能运维方法和装置,以至少解决现有技术中对软件定义存储的运维是按照一定的策略无差异化的进行系统运维,导致运维效率低的技术问题。
根据本发明实施例的一个方面,提供了一种基于软件定义存储的智能运维方法,包括:获取对象操作运维工具时的行为特征信息和/或业务程序访问存储资源的访问特征信息,其中,存储资源表示用于存储数据的资源;基于行为特征信息和/或访问特征信息调整存储资源对应的处理等级;根据处理等级调整用于对存储资源进行运维的运维策略。
进一步地,通过运维工具中的埋点,采集对象操作运维工具时的行为数据;对行为数据进行画像,得到对象的第一画像,其中,第一画像用于表示行为特征信息。
进一步地,通过业务程序中的埋点,采集业务程序访问存储资源时的访问数据;对访问数据进行画像,得到业务程序的第二画像,其中,第二画像用于表示访问特征信息。
进一步地,基于行为特征信息和/或访问特征信息为存储资源进行打分;根据打分结果,调整存储资源对应的处理等级。
进一步地,运维策略包括运维参数,运维参数包括如下至少一个:监控频率、预测级别、告警级别和提示级别。
进一步地,在处理等级提高的情况下,根据处理等级调整对存储资源进行运维的运维策略,包括如下至少一项:提高存储资源的监控频率;增加预测算法中的步伐,以提高预测级别;改变告警信息的类型,以提高告警级别;改变提示信息的显示位置,以提高提示级别。
进一步地,获取存储资源被访问时的跳转关系,其中,跳转关系用于记录不同存储资源被访问的前后顺序;基于跳转关系调整运维工具的显示界面。
进一步地,获取存储资源被访问时的集中程度参数,其中,集中程度参数用于表示对存储资源的所有操作的密集程度;基于集中程度参数调整运维工具的显示界面。
根据本发明实施例的另一方面,还提供了一种基于软件定义存储的智能运维装置,包括:获取模块,用于获取对象操作运维工具时的行为特征信息和/或业务程序访问存储资源的访问特征信息,其中,存储资源表示用于存储数据的资源;第一调整模块,用于基于行为特征信息和/或访问特征信息调整存储资源对应的处理等级;第二调整模块,用于根据处理等级调整用于对存储资源进行运维的运维策略。
根据本发明实施例的另一方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述的基于软件定义存储的智能运维方法。
根据本发明实施例的另一方面,还提供了一种处理器,处理器用于运行程序,其中,程序运行时执行上述的基于软件定义存储的智能运维方法。
在本发明实施例中,获取对象操作运维工具时的行为特征信息和/或业务程序访问存储资源的访问特征信息,其中,存储资源表示用于存储数据的资源;基于行为特征信息和/或访问特征信息调整存储资源对应的处理等级;根据处理等级调整对存储资源进行运维的运维策略。上述方案通过运维人员的行为特征信息和/或业务程序访问存储资源的访问特征信息调整存储资源的处理等级,进而调整存储资源的运维参数,实现了根据运维人员或业务程序的关注情况调整运维资源的效果,进而实现了对存储资源进行靶向运维的效果,提升了运维系效率,且降低了运维成本。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种基于软件定义存储的智能运维方法的流程图;
图2是根据本发明实施例的一种可选的对存储资源进行运维的示意图;以及
图3是根据本发明实施例的一种基于软件定义存储的智能运维装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
首先,先对本申请下述实施例中出现的专业名词进行解释:
软件定义存储(Software Defined Storage,SDS):是一种数据存储方式,所有存储相关的控制工作都仅在相对于物理存储硬件的外部软件中。这个软件不是作为存储设备中的固件,而是在一个服务器上或者作为操作系统(OS)或hypervisor的一部分。
画像:大数据中的画像用于表示真实对象的虚拟代表,是建立在一系列属性数据之上的目标对象模型。构建画像即为通过采集到的对象数据给对象贴标签,这一标签用于表示对象在某一个维度上的特征标识。本申请中的画像包括运维人员的用户画像和业务系统的业务画像,其中,运维人员的用户画像根据运维人员在运维工具上的操作行为来确定,业务系统的业务画像根据业务系统对存储资源的访问数据来确定。
埋点:是一种数据采集方法,指的是针对特定用户行为或事件的扑捉、处理和发送的相关技术及其实施过程。埋点的实质是先监听应用运行过程中的事件,当需要关注的事件发生时进行判断和捕获,然后获取必要的上下文信息,最后将信息整理后发送置服务器端。
实施例1
根据本发明实施例,提供了一种基于软件定义存储的智能运维方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的一种基于软件定义存储的智能运维方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,获取对象操作运维工具时的行为特征信息和/或业务程序访问存储资源的访问特征信息,其中,存储资源表示用于存储数据的资源。
具体的,上述运维工具可以是用于对存储资源进行运维的系统所呈现的人机交互界面。上述对象可以为操作运维工具的工作人员。
上述存储资源表示用于表示存储数据的资源,尤其是软件定义存储中存储数据的资源,其至少包括如下两部分:一部分为硬件存储资源,例如:服务器、CPU、内存等硬件设备;另一部分是为业务程序所虚拟出的虚拟磁盘,虚拟磁盘与实体磁盘具有对应的映射关系。
在一种可选的实施例中,上述存储资源包括但不局限于:
1、资源特征:卷、文件夹、桶、存储池、缓存、端口;
2、硬件组件特征:硬盘,包括HDD硬盘和SSD硬盘、网络,包括内部Cluster网络、业务Gateway网络、管理Admin网络、CPU、内存、FC设备;
3、业务资源:客户端:iSCSI、FC、用户:S3用户、NAS用户;
4、任务特征:定时快照、定位备份、定时复制;
5、其他特征。
上述业务程序用于表示基于存储资源构建的应用程序,业务程序的执行需要基于对存储资源的访问来进行。
在上述方案中,获取了对象操作运维工具的行为特征信息,该行为特征信息可以从对象对运维工具的操作中提取,例如,运维人员在运维工具上的点击行为、滑动行为等,该行为特征信息用于表示的是对象,即运维人员对存储资源的关注情况。
在上述方案中,还获取了业务程序访问存储资源的访问特征信息,该访问特征信息可以从业务程序的访问日志中提取,该访问特征信息表示的是,业务程序对存储资源的关注情况。
由此,本申请上述方案通过获取对象的行为特征信息和/或业务程序的访问特征信息,能够得到对象所关注的存储资源和/或业务程序所关注的存储资源。因此基于行为特征信息和/或业务特征信息,可以对对象和/或业务程序所关注的存储资源进行具有针对性的运维。下面继续进行说明。
步骤S104,基于行为特征信息和/或访问特征信息调整存储资源对应的处理等级。
具体的,上述处理等级用于表示在对存储资源进行运维时的运维策略。在一种可选的实施例中,将存储资源作为被运维的对象,需要对存储资源进行状态监测以及状态预测等。不同处理等级对应着不同的运维策略,上述方案根据行为特征信息和/或访问特征信息确定处理等级,从而来确定存储资源的运维策略。
上述步骤可以由运维定级系统实现,在获取到行为特征信息和/或访问特征信息后,需要将特征信息持续的、迭代的导入运维定级系统,运维定级系统根据画像进行定级,即调整存储资源的处理等级,定级以存储资源为粒度,包括硬件资源:CPU、磁盘、网络。存储资源:卷容量使用,池容量使用,组件之间的网络状态等。
在一种可选的实施例中,定级可以分为时间维度和运维深度两类,其中,时间维度的处理等级对应的运维参数包括监控频率等,运维深度的处理等级对应的运维参数包括对同一个资源监控的项目种类,例如,对处理等级较高的网络进行深度监控,深度监控包括网络延时、网络带宽、网络丢包;对处理等级较低的网络进行轻度监控,轻度监控可以只包括网络丢包。
步骤S106,根据处理等级调整对存储资源进行运维的运维策略。
具体的,上述运维策略用于表示在至少一个运维维度上的运维参数。上述运维参数用于表征在对存储资源运维的过程中所投入的运维资源。
上述方案为了实现精准运维,对存储资源进行定级,从而在众多的监控对象(即存储资源)中识别出当前情况下最需要投入运维资源的对象,再通过改变运维参数,针对重点监控对象和非重点监控对象区分投入,达到提升运维效率的目的。
在一种可选实施例中,处理等级与运维策略具有一一对应的关系,不同运维策略中的运维参数不同。如果存储资源的处理等级发生变动,则根据存储资源的处理等级调取当前处理等级对应的运维策略,并依据运维策略中的运维参数对存储资源进行运维。
需要说明的是,目前现有的运维系统按照一定的策略无差异化的进行系统运维,将系统信息反馈显示在界面上,无法感知运维人员关注的信息。具体的,现有运维系统一视同仁的扫描所有存储资源,获取所有信息,并将所有信息呈现给运维人员,无法把握运维人员的核心关注点;例如,运维人员比较关心服务器硬盘的使用状态,并不关注服务器网络状态(可能的原因是,硬盘使用时间较长,网络是新架设的),而运维系统仍旧花大量的时间去检测网络状态。同时,目前现有的运维系统也无法感知业务系统关注的资源;大规模集群中,有部分服务器承担重要的业务访问,这部分服务器的状态需要获得更高优先级的运维检测,而另外一部分服务器几乎不承担业务,这部分服务器的运维检测需求很低,现有运维体系无法区分对待。由此,目前的运维系统无法感知运维人员关注度以及业务关注度,无法把握系统运维热点,将导致运维效率底下,有效性不高,浪费大量资源在无效运维之上。
与传统的运维方式向相比,上述方案首先提升了运维效率,传统运维系统无法识别客户及业务的重点关注热点资源,本发明的运维系统通过智能的方式主动能识别客户和业务关注的资源,能更加准确的保护客户重点资源;上述方案还降低了运维成本,减少了运维需要消耗资源,例如,运维系统需要周期性的扫描设备状态,扫描过程是需要消耗CPU、内存等服务器资源的,当面对庞大的设备集群系统,运维对资源的消耗往往过大,从而导致传统的运维系统无法过高频率的对所有设备进行监控,本发明通过智能分析的方式找到系统中的热点资源,靶向对热点资源进行高级别运维,保证系统稳定的同时可以很好的控制资源的消耗。
由上可知,本申请上述实施例获取对象操作运维工具时的行为特征信息和/或业务程序访问存储资源的访问特征信息,其中,存储资源表示用于存储数据的资源;基于行为特征信息和/或访问特征信息调整存储资源对应的处理等级;根据处理等级调整对存储资源进行运维的运维策略。上述方案通过运维人员的行为特征信息和/或业务程序访问存储资源的访问特征信息调整存储资源的处理等级,进而调整存储资源的运维参数,实现了根据运维人员或业务程序的关注情况调整运维资源的效果,进而实现了对存储资源进行靶向运维的效果,提升了运维系效率,且降低了运维成本。
作为一种可选的实施例,获取对象操作运维工具时的行为特征信息,包括:通过运维工具中的埋点,采集对象操作运维工具时的行为数据;对行为数据进行画像,得到对象的第一画像,其中,第一画像用于表示行为特征信息。
具体的,上述埋点操作用于开发阶段将需要监测的对象写入代码中,以在运维工具运行的过程中,实时监测监测对象。
在一种可选的实施例中,在运维工具设计之初,就对其内嵌统计函数,以实现埋点,针对运维工具,可以通过埋点采集运维人员访问的界面、界面中停留的时间、关联操作等信息进行采集,从而得到对运维工具对各个存储资源在单位时间内的访问频率,以及对各个存储资源的访问时间。
在通过埋点采集得到对象的行为特征信息后,可以根据预设的运维人员画像系统,通过模糊算法从行为特征信息中选择出重点特征(模糊算法可以预设经验值在运行过程中根据对象的行为调整算法输入值)对运维人员操作运维工具的行为进行画像,刻画出运维人员的行为特征信息。在一种可选的实施例中,上述行为特征信息可以包括:关注的资源类型、告警类型,以及关注范围等。
作为一种可选的实施例,获取业务程序访问存储资源的访问特征信息,包括:通过业务程序中的埋点,采集业务程序访问存储资源时的访问数据;对访问数据进行画像,得到业务程序的第二画像,其中,第二画像用于表示访问特征信息。
具体的,上述埋点操作用于开发阶段将需要监测的对象写入代码中,以在业务程序运行的过程中,实时监测检测对象。
在一种可选的实施例中,在业务程序设计之初,就对其内嵌统计函数,以实现埋点,针对业务程序,可以通过埋点采集业务程序访问IO的大小、频率、区域等数据,从而得到业务程序对各个存储资源的访问特征信息。
再通过埋点得到业务程序的访问特征信息后,可以根据预设的业务画像系统,通过模糊算法从访问特征信息中选择出重点特征(模糊算法可以预设经验值在运行过程中根据业务程序的访问调整算法输入值)对其进行画像,刻画出使用存储的业务系统的访问特征信息。在一种可选的实施例中,访问特征信息可以包括:访问数据模型、数据热点区域、热点出现的频次以及范围等。
本申请上述实施例实现了对运维人员的行为和业务程序的持续的画像,并根据画像结果智能调整运维策略,将运维系统和业务以及运维人员相结合,相互感知形成运维智能化,提升运维有效性的同时降低运维系统对系统资源的消耗。
作为一种可选的实施例,基于行为特征信息和/或访问特征信息调整存储资源对应的处理等级,包括:基于行为特征信息和/或访问特征信息为存储资源进行打分;根据打分结果,调整存储资源对应的处理等级。
在一种可选的实施例中,上述特征信息具有不同类型,可以预设每个类型的特征信息对应的权重,并结合每个类型的特征信息对应的数据进行加权,从而得到打分结果。
还在上述实施例中,每个处理等级可以对应一个分数区间,当某个存储资源的打分由一个区间提升至另一个区间时,提升该存储资源的处理等级,同理的,当某个存储资源的打分由一个区间降低至另一个区间时,降低该存储资源的处理等级。
作为一种可选的实施例,运维策略包括运维参数,运维参数包括如下至少一个:监控频率、预测级别、告警级别和提示级别。
具体的,监控频率用于表示单位时间内采集数据的次数;预测等级用于表示用于对存储资源未来状态进行预测的算法的等级,高等级的预测算法更加激进,即在迭代过程中具有更大的步长;告警级别用于表示对于同一个事件的通知级别,例如对于同一个事件,如果告警级别低,则正常通知即可,但如果告警级别高,则需要进行“告警”通知,正常通知和“告警”通知的通知方式不同;提示级别用于表示提示信息在界面中显示方式,级别高的提示信息的显示位置更加居中、窗口更大,或具有其他用于提示的颜色、图案、动画、声音等特征。
作为一种可选的实施例,在处理等级提高的情况下,根据处理等级调整对存储资源进行运维的运维策略,包括如下至少一项:提高存储资源的监控频率;增加预测算法中的步伐,以提高预测级别;改变告警信息的类型,以提高告警级别;改变提示信息的显示位置,以提高提示级别。
在上述方案中,对于监控频率,当识别出某个存储资源volume1是用户行为的重要特征,即volume1的处理等级提升,则提升对volume1的监控频度,提升对volume1状态的探寻频率;对于预测级别,可以启动对Volume1的预测功能,使用更加激进的算法预测volume1在未来一段时间的使用状态,防止意外发生;对于告警级别,可以当volume1出现异常时,提升告警级别,例如,原本是『通知』级别的告警,提升为『警告』级别;对于提示级别,可以调整界面显示,将volume1的信息显示在显著的位置,以便提示用户。
需要说明的是,在在处理等级降低的情况下,降低上述一个或多个维度的运维参数。
作为一种可选的实施例,上述方法还包括:获取存储资源被访问时的跳转关系,其中,跳转关系用于记录不同存储资源被访问的前后顺序;基于跳转关系调整运维工具的显示界面。
上述跳转关系可以从运维工具中获取,跳转关系可以表示一个运维人员的习惯。例如,某个运维人员习惯查看网络带宽后紧接着查看网络丢包率,因此可以根据这样的跳转关系,将相关联的可查看的项目按照一定的排布方式显示在显示界面中。以符合运维人员的习惯,使运维人员查看更加便捷。
作为一种可选的实施例,上述方法还包括:获取存储资源被访问时的集中程度参数,其中,集中程度参数用于表示对存储资源的所有操作的密集程度;基于集中程度参数调整运维工具的显示界面。
具体的,存储资源的集中程度参数用于表示对存储资源的所有操作的密集程度,该密集程度越高,说明其被运维人员关注或被访问的频率较高,因此,可以将集中程度参数大于预设值的存储资源对应的运维项目显示在运显示界面中,从而无需运维人员反复查找,提高运维人员的效率。
图2是根据本发明实施例的一种可选的对存储资源进行运维的示意图,结合图2所示,运维人员通过运维工具(通常为GUI人机交互界面)对存储系统进行运维管理工作;业务程序通过存储系统提供的业务接口访问存储资源。运维工具与存储资源之间构建埋点机制;在业务接口与存储资源之间构建埋点机制。
S21,通过埋点机制捕获用户行为以及业务行为;并将埋点数据导入到画像埋点系统的核心数据库中;
S22,运维画像系统和业务画像系统从画像埋点系统数据库中分别读取用户行为数据以及业务行为数据,进行画像;
S23,将画像输入到智能运维分级系统中,由分级系统实时调整存储资源的处理级别;
S24,将调整的结果发送至运维工具,运维工具根据调整后的结果进行运维;
S24,通过运维工具将调整结果反馈到运维人员,提升运维效率。
根据运维人员和业务程序的访问情况持续上述过程,实现迭代的更新运维模式。
实施例2
根据本发明实施例,提供了一种基于软件定义存储的智能运维装置的实施例,图3是根据本发明实施例的一种基于软件定义存储的智能运维装置的示意图,如图3所示,该装置包括:
获取模块30,用于获取对象操作运维工具时的行为特征信息和/或业务程序访问存储资源的访问特征信息,其中,存储资源表示用于存储数据的资源。
第一调整模块32,用于基于行为特征信息和/或访问特征信息调整存储资源对应的处理等级。
第二调整模块34,用于根据处理等级调整用于对存储资源进行运维的运维策略。
作为一种可选的实施例,获取模块包括:第一采集子模块,用于通过运维工具中的埋点,采集对象操作运维工具时的行为数据;第一画像子模块,用于对行为数据进行画像,得到对象的第一画像,其中,第一画像用于表示行为特征信息。
作为一种可选的实施例,获取模块包括:第二采集子模块,用于通过业务程序中的埋点,采集业务程序访问存储资源时的访问数据;第二画像子模块,对访问数据进行画像,得到业务程序的第二画像,其中,第二画像用于表示访问特征信息。
作为一种可选的实施例,第一调整模块包括:打分子模块,用于基于行为特征信息和/或访问特征信息为存储资源进行打分;调整子模块,用于根据打分结果,调整存储资源对应的处理等级。
作为一种可选的实施例,运维策略包括运维参数,运维参数包括如下至少一个:监控频率、预测级别、告警级别和提示级别。
作为一种可选的实施例,在处理等级提高的情况下,第二调整模块包括如下至少一项:提高子模块,用于提高存储资源的监控频率;增加提高子模块,用于增加预测算法中的步伐,以提高预测级别;第一改变子模块,用于改变告警信息的类型,以提高告警级别;第二改变子模块,用于改变提示信息的显示位置,以提高提示级别。
作为一种可选的实施例,上述装置还包括:跳转关系获取模块,用于获取存储资源被访问时的跳转关系,其中,跳转关系用于记录不同存储资源被访问的前后顺序;第一显示界面调整模块,用于基于跳转关系调整运维工具的显示界面。
作为一种可选的实施例,上述装置还包括:集中程度获取模块,用于获取存储资源被访问时的集中程度参数,其中,集中程度参数用于表示对存储资源的所有操作的密集程度;第二显示界面调整模块,用于基于集中程度参数调整运维工具的显示界面。
实施例3
根据本发明实施例,提供了一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行实施例1中所述的基于软件定义存储的智能运维方法。
实施例4
根据本发明实施例,提供了一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行实施例1中所述的基于软件定义存储的智能运维方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (11)

1.一种基于软件定义存储的智能运维方法,其特征在于,包括:
获取对象操作运维工具时的行为特征信息和/或业务程序访问存储资源的访问特征信息,其中,所述存储资源表示用于存储数据的资源;
基于所述行为特征信息和/或访问特征信息调整存储资源对应的处理等级;
根据所述处理等级调整用于对所述存储资源进行运维的运维策略;
其中,获取对象操作运维工具时的行为特征信息,包括:从所述对象对所述运维工具的操作中提取所述行为特征信息,所述行为特征信息用于表示所述对象对所述存储资源的关注情况;
获取业务程序访问存储资源的访问特征信息,包括:从所述业务程序的访问日志中提取出所述访问特征信息,所述访问特征信息用于表示所述业务程序对所述存储资源的关注情况。
2.根据权利要求1所述的方法,其特征在于,获取对象操作运维工具时的行为特征信息,包括:
通过所述运维工具中的埋点,采集所述对象操作所述运维工具时的行为数据;
对所述行为数据进行画像,得到所述对象的第一画像,其中,所述第一画像用于表示所述行为特征信息。
3.根据权利要求1所述的方法,其特征在于,获取业务程序访问存储资源的访问特征信息,包括:
通过所述业务程序中的埋点,采集所述业务程序访问所述存储资源时的访问数据;
对所述访问数据进行画像,得到所述业务程序的第二画像,其中,所述第二画像用于表示所述访问特征信息。
4.根据权利要求1至3中任意一项所述的方法,其特征在于,基于所述行为特征信息和/或访问特征信息调整存储资源对应的处理等级,包括:
基于所述行为特征信息和/或所述访问特征信息为所述存储资源进行打分;
根据打分结果,调整所述存储资源对应的处理等级。
5.根据权利要求4所述的方法,其特征在于,所述运维策略包括运维参数,所述运维参数包括如下至少一个:监控频率、预测级别、告警级别和提示级别。
6.根据权利要求5所述的方法,其特征在于,在所述处理等级提高的情况下,根据所述处理等级调整对所述存储资源进行运维的运维策略,包括如下至少一项:
提高所述存储资源的监控频率;
增加预测算法中的步伐,以提高所述预测级别;
改变告警信息的类型,以提高所述告警级别;
改变提示信息的显示位置,以提高所述提示级别。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述存储资源被访问时的跳转关系,其中,所述跳转关系用于记录不同存储资源被访问的前后顺序;
基于所述跳转关系调整所述运维工具的显示界面。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述存储资源被访问时的集中程度参数,其中,所述集中程度参数用于表示对所述存储资源的所有操作的密集程度;
基于所述集中程度参数调整所述运维工具的显示界面。
9.一种基于软件定义存储的智能运维装置,其特征在于,包括:
获取模块,用于获取对象操作运维工具时的行为特征信息和/或业务程序访问存储资源的访问特征信息,其中,所述存储资源表示用于存储数据的资源;
第一调整模块,用于基于所述行为特征信息和/或访问特征信息调整存储资源对应的处理等级;
第二调整模块,用于根据所述处理等级调整用于对所述存储资源进行运维的运维策略;
其中,所述获取模块用于通过以下步骤来获取对象操作运维工具时的行为特征信息:从所述对象对所述运维工具的操作中提取所述行为特征信息,所述行为特征信息用于表示所述对象对所述存储资源的关注情况;
所述获取模块用于通过以下步骤来获取业务程序访问存储资源的访问特征信息:从所述业务程序的访问日志中提取出所述访问特征信息,所述访问特征信息用于表示所述业务程序对所述存储资源的关注情况。
10.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至8中任意一项所述的基于软件定义存储的智能运维方法。
11.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行权利要求1至8中任意一项所述的基于软件定义存储的智能运维方法。
CN201910339968.XA 2019-04-10 2019-04-25 基于软件定义存储的智能运维方法和装置 Active CN110209558B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2019102854235 2019-04-10
CN201910285423 2019-04-10

Publications (2)

Publication Number Publication Date
CN110209558A CN110209558A (zh) 2019-09-06
CN110209558B true CN110209558B (zh) 2021-06-15

Family

ID=67786475

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910339968.XA Active CN110209558B (zh) 2019-04-10 2019-04-25 基于软件定义存储的智能运维方法和装置

Country Status (1)

Country Link
CN (1) CN110209558B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111798348A (zh) * 2020-06-22 2020-10-20 重庆跃途科技有限公司 一种基于软件定义的校园安全防御方法及系统
CN113687920B (zh) * 2021-08-30 2024-02-13 济南浪潮数据技术有限公司 一种分布式系统的对象策略操作方法、装置及设备

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512788A (zh) * 2015-05-04 2016-04-20 上海北塔软件股份有限公司 一种智能运维管理方法及系统
CN105512792A (zh) * 2015-09-25 2016-04-20 上海北塔软件股份有限公司 一种智能运维管理方法及系统
CN106980567A (zh) * 2017-04-01 2017-07-25 广东浪潮大数据研究有限公司 一种查询ceph集群硬件状态的方法及装置
CN108681830B (zh) * 2018-06-14 2021-11-09 深圳供电局有限公司 一种变电站巡视智能作业动态指挥方法及系统
CN109460325A (zh) * 2018-10-19 2019-03-12 南京机敏软件科技有限公司 Ceph集群磁盘故障恢复方法及计算机、恢复系统

Also Published As

Publication number Publication date
CN110209558A (zh) 2019-09-06

Similar Documents

Publication Publication Date Title
US11405301B1 (en) Service analyzer interface with composite machine scores
US9479518B1 (en) Low false positive behavioral fraud detection
US20210157666A1 (en) Determining server error types
JP6165886B2 (ja) 動的ストレージサービスレベル・モニタリングの管理システムおよび方法
AU2019201687B2 (en) Network device vulnerability prediction
EP3465515B1 (en) Classifying transactions at network accessible storage
US20150347214A1 (en) Determining Suspected Root Causes of Anomalous Network Behavior
US10091231B1 (en) Systems and methods for detecting security blind spots
US11756404B2 (en) Adaptive severity functions for alerts
US11943235B2 (en) Detecting suspicious user logins in private networks using machine learning
CN108039959A (zh) 一种数据的态势感知方法、系统及相关装置
CA3074996A1 (en) Apparatus and method for real time analysis, predicting and reporting of anomalous database transaction log activity
CN104272266A (zh) 对具有多个监视对象器件的计算机系统进行管理的管理系统
CN110209558B (zh) 基于软件定义存储的智能运维方法和装置
CN109495479A (zh) 一种用户异常行为识别方法及装置
EP3202091B1 (en) Operation of data network
CN113141276A (zh) 一种基于知识图谱的信息安全方法
US20180300199A1 (en) System and method for maintaining the health of a machine
CN109388949B (zh) 一种数据安全集中管控方法和系统
CN101464833A (zh) 用于管理在存储器架构中的存储器虚拟化的方法和系统
CN110363381B (zh) 一种信息处理方法和装置
CN116895046B (zh) 基于虚拟化的异常运维数据处理方法
JP2020109636A (ja) 互換性のあるモジュールを特定するシステムおよび方法
CN114398343A (zh) 数据库异常键处理方法、装置、设备及介质
CN110955577A (zh) 一种页面展示方法、装置、设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: 100094 101, floors 1-5, building 7, courtyard 3, fengxiu Middle Road, Haidian District, Beijing

Patentee after: Beijing Xingchen Tianhe Technology Co.,Ltd.

Address before: 100097 office building 805-806, area B, Jinyuan times business center, lantianchang Road, Haidian District, Beijing

Patentee before: XSKY BEIJING DATA TECHNOLOGY Corp.,Ltd.