CN115203001A - 一种设备健康管理的方法和系统 - Google Patents
一种设备健康管理的方法和系统 Download PDFInfo
- Publication number
- CN115203001A CN115203001A CN202211098459.0A CN202211098459A CN115203001A CN 115203001 A CN115203001 A CN 115203001A CN 202211098459 A CN202211098459 A CN 202211098459A CN 115203001 A CN115203001 A CN 115203001A
- Authority
- CN
- China
- Prior art keywords
- health
- equipment
- management
- information
- health management
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3466—Performance evaluation by tracing or monitoring
- G06F11/3476—Data logging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/32—Monitoring with visual or acoustical indication of the functioning of the machine
- G06F11/324—Display of status information
- G06F11/327—Alarm or error message display
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/32—Monitoring with visual or acoustical indication of the functioning of the machine
- G06F11/324—Display of status information
- G06F11/328—Computer systems status display
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3452—Performance evaluation by statistical analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3466—Performance evaluation by tracing or monitoring
- G06F11/3495—Performance evaluation by tracing or monitoring for systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/20—Administration of product repair or maintenance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/80—Database-specific techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Computer Hardware Design (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Databases & Information Systems (AREA)
- Strategic Management (AREA)
- Operations Research (AREA)
- Computing Systems (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Computer And Data Communications (AREA)
Abstract
本发明公开了一种设备健康管理的方法和系统,涉及设备管理技术领域,该方法包括定义以及下发系统台账、设备台账和采集规则;根据采集规则采集设备健康参数,并根据设备健康参数和第一模型评估设备健康状况;根据系统台账、设备健康指数和第二模型评估系统健康状况;响应于上报规则或查询指令,上传设备健康参数、设备健康状况和系统健康状况;根据上传数据和第三模型评估全系统健康状况。本申请的方法采用系统端和设备端的架构模式对设备使用过程进行健康管理,可基于设备运行健康状况的实时监测结果以及科学的评估系统的健康状况及时发现系统存在的问题,为设备参试、维修和更新换代提供决策依据,保障设备有效工作。
Description
技术领域
本申请涉及设备管理技术领域,特别涉及一种设备健康管理的方法和系统。
背景技术
早期的机载测控试验训练任务参试设备通过巡检人员观、听、感来根据经验判断设备的运行状态,但是随着信息技术的飞速发展,参试设备越来越多且内部结构日益复杂,依靠人工检查的方式已不能满足应用和技术发展的需要。后来采用设备运管软件来自动监视设备的运行情况,但是设备运管软件只能监测设备使用过程中的故障或者异常,这种事中或者事后发现设备异常的方式往往会阻碍测控试验训练任务的顺利执行。针对上述两种方式的弊端,需要产生一种事前且能够自动进行设备运行状况监测的方法,提前发现设备可能发生的异常,及时进行设备维修或者更新改造。
发明内容
针对目前机载测控试验训练任务参试设备发展现状和未来自动化、智能化的发展趋势,本发明提供了一种设备健康管理方法和系统,该方法监测设备的运行情况,科学地评估设备的健康状况,及时发现设备存在的故障隐患,为设备及时维修、资源合理调配、任务的顺利开展和设备更新改造提供科学的数据支持。
基于此,本发明提供了一种设备健康管理方法,其特征在于,所述方法包括:
定义系统台账、设备台账和采集规则;
下发所述系统台账、所述设备台账和所述采集规则;
根据所述采集规则采集设备健康参数,并且根据所述设备健康参数和第一模型评估设备健康状况;
根据所述系统台账和所述设备健康状况,并且根据第二模型评估系统健康状况;
响应于上报规则或查询指令,上传所述设备健康参数、所述设备健康状况和所述系统健康状况;
根据所述设备健康参数、所述设备健康状况和所述系统健康状况,并且根据第三模型评估全系统健康状况。
在一个实施例中,所述第一模型为:
其中,H(s)为待评估设备健康指数,s为待评估设备,x为所述待评估设备中的部件或软件的权重值,y为所述待评估设备中部件或软件的健康度,m为s设备中部件或软件的数量总数。
在另一个实施例中,所述设备健康参数包括待评估设备中部件的利用率、温度、运行速度、存储空间等。
在另一个实施例中,所述采集规则包括获取所述设备运行数据的时间间隔。
在另一个实施例中,所述系统台账包括所述系统的基本信息、系统健康参数、系统健康等级和系统健康评估规则。
在另一个实施例中,可视化显示所述设备健康参数、所述设备健康状况和所述系统健康状况。
在另一个实施例中,根据设备运行数据、设备健康评估信息和系统健康评估信息,评估所述全系统健康状况。
另外,本发明提供了一种设备健康管理系统,其特征在于,所述系统包括:
全系统健康管理装置和分系统健康管理装置,所述全系统健康管理装置分别与一个或多个所述分系统健康管理装置相连,所述分系统健康管理装置分别与一个或多个设备相连;
所述全系统健康管理装置用于定义设备台账、分系统台账、管理指令和查询指令,并将所述设备台账、所述分系统台账、所述管理指令和所述查询指令发送至所述分系统健康管理装置;
所述分系统健康管理装置用于采集所述一个或多个设备的设备运行数据,评估设备和分系统的健康状况,生成设备健康信息和分系统健康信息,并将设备运行数据、所述设备健康信息和所述分系统健康信息反馈至所述全系统健康管理装置。
在一个实施例中,所述全系统健康管理装置包括:系统健康管理模块、信息传输模块和健康管理数据库,其中,系统健康管理模块用于定义所述设备台账、分系统台账,所述信息传输模块用于与所述分系统健康管理装置传输数据信息,所述健康管理数据库用于存储所述运行数据、所述设备健康信息和所述分系统健康信息。
在另一个实施例中,所述分系统健康管理装置包括:设备健康管理模块、设备代理模块和设备管理信息库,其中,所述设备健康管理模块用于采集所述设备运行数据、评估所述设备健康状况、生成所述设备健康信息,并与所述全系统健康管理装置的信息传输模块传输数据信息,所述设备代理模块用于采集所述设备的部件或者部署软件的运行数据,所述设备管理信息库用于存储所述设备运行数据、和所述设备健康信息。
本发明具有以下优点:
本发明提供了一种设备健康管理方法和系统,该方法构建设备健康评估规则,定义设备健康参数、健康级别、健康判定标准,在线采集和接收各设备的健康参数和健康状况,基于设备运行健康状况的实时监测结果,科学的评估系统的健康状况,及时发现和预测系统可能存在的问题,为设备参试、维修和更新换代提供决策依据,保障设备有效工作,极大的提高了参试设备运行管理的智能化水平。
附图说明
为了更清楚地说明本申请实施例或现有的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明设备健康管理方法流程图;
图2为本发明设备健康管理方法架构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合具体实施例及相应的附图对本申请的技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
下面结合附图1-2以机载测控试验训练任务数据处理与运行管理系统设备健康管理为例对本发明的具体实施步骤进行进一步说明。
步骤一,定义系统台账、设备台账和数据采集规则。
根据机载测控试验训练任务涉及的参试系统和参试设备,定义系统台账和设备台账。台账内容包括系统和设备的基本信息、健康参数、健康等级、健康评估规则。
具体地,根据机载测控试验训练任务涉及的参试系统和参试设备,定义系统台账和设备台账。其中,一个参试系统可以包括一个或多个参试设备,多个参试设备组成其中一个系统。其中,所有的系统组成一全系统。
本发明不仅对参试设备做健康管理,也对设备所在的系统进行健康管理,通过设备和系统的管理,进而可以对全系统的健康情况进行评估。
在本申请的一个实施例中,在系统端系统健康管理软件中定义参试系统台账,系统台账包括定义参试系统基本信息、系统健康参数、系统健康等级、系统健康评估规则。
其中,系统基本信息包括参试系统编码、系统名称、系统Mib、系统简介、系统主设备地址、系统设备健康管理软件部署地址。
具体地,机载测控试验训练任务数据处理与运行管理系统由数据处理系统、指挥显示系统、运管系统组成。
数据处理系统包含3台数据处理服务器、1台KVM切换器、综合处理软件、安控处理软件、双工管理软件和模拟仿真软件。数据处理系统的设备健康管理软件部署在数据处理服务器1上,IP地址为192.168.32.50。数据处理服务器2、数据处理服务器3上分别部署设备代理软件。
指挥显示系统包含2台工作站,每个工作站配置2台LCD和指挥显示软件,指挥显示系统的设备健康管理软件部署在工作站1上,IP地址为192.168.32.60。工作站2上部署设备代理软件。
运管系统包含2台运管服务器、2台运管终端、系统健康管理软件和联调测试软件,运管系统的设备健康管理软件部署在运管服务器1上,IP地址为192.168.32.70。运管服务器2、运管终端1、运管终端2上分别部署设备代理软件。
其中,系统健康参数包含参数名称、单位、设计值、健康条件、亚健康条件、危险条件和失效条件。
具体地,机载测控试验训练任务数据处理与运行管理系统的健康参数包括数据处理系统、指挥显示系统、运管系统。
数据处理系统健康指数:单位是小数、设计值为0-1、健康条件数据处理系统健康指数≥0.80、亚健康条件0.60≤数据处理系统健康指数<0.80、危险条件0.40≤数据处理系统健康指数<0.60、失效条件数据处理系统健康指数<0.40。
指挥显示系统健康指数:单位是小数、设计值为0-1、健康条件指挥显示系统健康指数≥0.80、亚健康条件0.60≤指挥显示系统健康指数<0.80、危险条件0.40≤指挥显示系统健康指数<0.60、失效条件指挥显示系统健康指数<0.40。
运管系统健康指数:单位是小数、设计值为0-1、健康条件运管系统健康指数≥0.80、亚健康条件0.60≤运管系统健康指数<0.80、危险条件0.40≤运管系统健康指数<0.60、失效条件运管系统健康指数<0.40。
系统健康评估规则包括系统健康评估计划公式,定义系统健康等级健康、亚健康、危险和失效的评估规则。
在本申请的另一个实施例中,在系统端系统健康管理软件中定义参试设备台账,包括定义参试设备的基本信息、设备健康参数、设备健康等级、设备健康评估规则。
其中,设备基本信息包括设备所属系统、设备类型、设备IP地址、设备编码、设备名称、设备Mib、设备用途、设备使用时间、设备型号、设备技战术指标。
设备健康参数包括参数名称、单位、设计值、健康条件、亚健康条件、危险条件和失效条件。
以数据处理服务器为例,影响数据处理服务器健康状况的参数有内存、CPU、主板、硬盘、电源板。
内存利用率:单位是百分比、设计值为0%-100%、健康条件内存利用率≤70%、亚健康条件70%<内存利用率≤90%、危险条件内存利用率>90%。
CPU利用率:单位是百分比、设计值为0%-100%、健康条件CPU利用率≤75%、亚健康条件75%<CPU利用率≤90%、危险条件CPU利用率>90%。
CPU温度:单位是℃、设计值为≤70℃、健康条件CPU温度≤50℃、亚健康条件50℃<CPU温度≤70℃、危险条件CPU温度>70℃。
主板温度:单位是℃、设计值为≤70℃、健康条件主板温度≤50℃、亚健康条件50℃<主板温度≤70℃、危险条件主板温度>70℃。
主板供电电压:单位是VDC、设计值为22VDC-34VDC、健康条件26VDC≤主板供电电压≤30VDC、亚健康条件22VDC≤主板供电电压<26VDC或者30VDC<主板供电电压≤34VDC、危险条件主板供电电压<22VDC或者主板供电电压>34VDC。
硬盘存取速度:单位是MB/s、设计值为≥100MB/s、健康条件硬盘存取速率≥100MB/s、亚健康条件10MB/s ≤硬盘存取速率<100MB/s、危险条件硬盘存取速率<10MB/s。
硬盘剩余存储空间:单位是GB、设计值为0-1024GB、健康条件硬盘剩余存储空间≥200GB、亚健康条件硬盘剩余存储空间≥50GB、危险条件硬盘剩余存储空间<50GB。
综合处理软件:单位是整数、设计值为0或1、健康条件综合处理软件正常运行为1、失效条件综合处理软件运行异常为0。
双工管理软件:单位是整数、设计值为0或1、健康条件双工管理软件正常运行为1、失效条件双工管理软件运行异常为0。
在本申请的一个实施例中,系统和设备的健康等级统一划分为健康、亚健康、危险、失效共四个等级。
设备健康评估规则包括设备的健康评估计算公式。设备的健康状况是由各个部件和部署软件影响的,采用设备健康指数来计算设备的健康度,通过设备健康度评估设备的健康状况,定义设备健康、亚健康、危险和失效的评估规则。
在本申请的另一个实施例中,健康数据采集规则是对各设备或系统健康数据采集的规则,本发明中主要定义各设备或系统采集健康数据的时间间隔。
步骤二,下发系统台账、设备台账和采集规则。
具体地,将定义的系统和设备台账同步到设备端的设备健康管理软件和设备代理软件,将定义的设备健康数据采集规则下发给各设备对应的设备代理软件。
将系统端定义的系统和设备台账信息同步到设备端,保持系统端和设备端的健康参数、健康评估规则保持一致。当系统端定义的系统和设备台账信息有变化时,同样需要同步到设备端。
在本申请的另一个实施例中,系统端系统健康管理软件定义设备健康数据采集规则,比如定义各设备采集健康数据的时间间隔为120秒。
系统端系统健康管理软件向信息传输软件发送健康数据采集规则,信息传输软件采用SNMP协议的GetRequest命令下发健康数据采集规则到各系统设备健康管理软件。在SNMP协议中,信息交换以SNMP消息的形式进行。每一个SNMP消息都包含协议版本号(Version)、团体标识符(Community)和协议数据单元(PDU)。本方法中发送或者反馈健康信息采集规则的SNMP协议数据单元(PDU)变量绑定格式定义如表1和表2所示。
表1发送/反馈健康数据采集规则信息变量绑定
MIB变量编码 | 变量名称 | 数据类型 | 取值 |
1.6.2.3.2.7.3.2.0 | 指令发送或反馈时间 | int | 量化单位0.1ms,当日北京时间(24h制) |
1.6.2.3.2.7.3.2.1 | 分支入口 | String | 系统分支入口 |
分支入口.3.0 | 系统标识 | String | 指令发送的标识 |
分支入口.3.1 | 健康数据采集规则 | int | 设备采集健康数据时间间隔,单位是s |
分支入口.3.2 | 执行编码 | int | 指令执行信息编码,见表2 |
比如系统端下发健康数据采集规则到数据处理系统的PDU数据包中变量绑定内容如下:
{
1.6.2.3.2.7.3.2.0:32600 //指令发送或反馈时间
1.6.2.3.2.7.3.2.1:’ 1.3.6.1.4.1.732.17’ //数据处理系统的分支入口
1.3.6.1.4.1.732.17.3.0:’ SJCL’ //数据处理系统的标识
1.3.6.1.4.1.732.17.3.1:120 //健康数据采集时间间隔
1.3.6.1.4.1.732.17.3.2: //执行编码,下发健康数据采集规则时该参数为空,反馈规则接收情况时才填入内容
}
表2 执行编码格式
序号 | 执行编码 | 执行内容 |
1 | 0 | 接收到规则,开始实施规则 |
2 | 1 | 接收到规则,无法实施规则 |
步骤三,根据采集规则采集设备健康参数,并且根据设备健康参数和第一模型评估设备健康状况。
具体地,设备端设备健康管理软件接收到信息传输软件发送的健康数据采集规则,向信息传输软件反馈健康数据采集规则接收情况。设备健康管理软件解析健康数据采集规则,提取健康数据采集时间间隔,将健康数据采集时间间隔分发给管辖范围内所有的设备代理软件,设备代理软件根据最新的健康数据采集时间更新本地配置文件,并按最新的健康数据采集时间间隔进行健康数据采集。
各设备对应的设备代理软件根据定义的设备健康参数,获取设备内部各传感器和控制系统的运行数据,通过数据处理、数据筛选和规则判断,提取设备健康参数对应的数值并判断健康状态。
在本申请的一个实施例中,通过内部数据接口获取设备各组成部件的运行数据。以数据处理服务器为例,通过软件抓取CPU温度、CPU的利用率、主板供电电压、内存利用率、硬盘数据存储速度、硬盘剩余存储空间,通过硬件检测主板温度,获取数据处理服务器的内存、CPU、主板、硬盘的运行数据,通过软件抓取进程方式获取数据处理服务器上部署的综合处理软件、双工管理软件的运行状况。
提取健康参数信息后,对采集的部件运行数据进行信息处理,筛选出影响设备健康状态的参数信息,提取出设备健康参数值并判断健康参数的运行状态。根据第一模型判断数据处理服务器各部件或者部署软件的健康状态。
在本申请的一个实施例中,第一模型为:
其中,H(s)为待评估设备健康指数,s为待评估设备,x为待评估设备中的部件或软件的权重值,y为待评估设备中部件或软件的健康度,m为s设备中部件或软件的数量总数。
具体地,数据处理服务器健康指数=内存权重*内存健康度+CPU权重*CPU健康度+主板权重*主板健康度+硬盘权重*硬盘健康度+综合处理软件权重*综合处理软件健康度+双工管理软件权重*双工管理软件健康度。其中权重值初始根据经验设定,内存、CPU、主板的权重设为0.2,硬盘权重设为0.1,综合处理软件权重设为0.2,双工管理软件权重设为0.1,在运行过程中根据统计结果进行适当调整。各部件健康度在3.2中已计算得出,假设内存健康度为0.90,CPU健康度为0.89,主板健康度为0.91,硬盘健康度为0.88,综合处理软件健康度为1,双工管理软件健康度为1,则数据处理服务器健康指数为0.2*0.90+0.2*0.89+0.2*0.91+0.1*0.91+0.2*1+0.1*1=0.93。
进一步地,设备健康状况评估规则为:健康判定规则:健康指数≥0.80,亚健康判定规则:0.60≤健康指数<0.80,危险判定规则:0.40≤健康指数<0.60,失效判定规则:健康度<0.40。因此,评估数据处理服务器的健康状况为健康。
步骤四,根据系统台账和设备健康状况,并且根据第二模型评估系统健康状况。
具体地,设备健康管理软件根据系统健康评估规则,基于系统管辖范围内各设备代理软件上报的设备健康参数,采用第二模型评估系统的健康状况进行系统级的健康评估,将系统健康评估信息进行格式化处理,生成MIB格式保存到设备管理信息库。
在本申请的一个实施例中,第二模型为:
其中,H’为待测系统的健康指数,M’i为待测系统中i设备的权重,H’i为待系统中i设备的健康指数。
具体地,以数据处理系统的健康评估规则定义为例:采用系统健康指数计算公式评估系统的健康状况,数据处理系统健康指数=数据处理服务器1权重*数据处理服务器1健康指数+数据处理服务器2权重*数据处理服务器2健康指数+数据处理服务器3权重*数据处理服务器3健康指数+KVM切换器权重*KVM切换器健康指数。其中权重值根据各服务器上部署软件对外接口占比确定,数据处理系统与其它系统之间的外部接口共有8个,数据处理服务器1提供4个外部接口,数据处理服务器2提供2个外部接口,数据处理服务器3提供1个外部接口,KVM切换器对外提供1个外部接口,则数据处理服务器1的权重4/8=0.5,数据处理服务器2的权重2/8=0.25,数据处理服务器3的权重1/8=0.125,KVM切换器的权重=1/8=0.125。数据处理系统各设备的健康指数是根据各设备运行状况由设备端设备代理软件上报的。数据处理系统健康状况评估规则为:健康判定规则:健康指数≥0.80,亚健康判定规则:0.60≤健康指数<0.80,危险判定规则:0.40≤健康指数<0.60,失效判定规则:健康指数<0.40。保存系统健康评估结果。将评估的系统健康状况信息进行格式化处理,生成MIB格式保存到设备管理信息库。
步骤五,响应于上报规则或查询指令,上传设备健康参数、设备健康状况和系统健康状况。
在本申请的一个实施例中,根据定义的系统健康等级、设备健康等级和主动上报规则,将达到上报规则的设备健康评估信息和系统健康评估信息上报给系统端的信息传输软件。信息传输软件接收健康参数和健康评估信息后存储到健康管理数据库,向系统健康管理软件发送信息到达通知。
具体地,根据定义的系统健康等级、设备健康等级和主动上报规则,将达到上报规则的设备健康评估信息和系统健康评估信息生成SNMP协议的Trap PDU数据包。将达到上报规则的健康评估信息Trap PDU数据包上报给系统端的信息传输软件。信息传输软件接收健康参数和健康评估信息的Trap PDU后进行解析,将解析后的数据存储到健康管理数据库,向系统健康管理软件发送信息到达通知。
以数据处理服务器为例,主动上报数据处理服务器的Trap PDU变量绑定如表3所示。
表 3 主动上报/查询反馈健康数据信息变量绑定
在本申请的另一个实施例中,系统健康评估软件通过信息传输软件将健康信息查询条件下发给设备健康管理软件,设备健康管理软件从设备管理信息库中检索到满足条件的健康评估信息和健康参数,将满足条件的健康评估信息和健康参数反馈给信息传输软件,信息传输软件接收健康参数和健康评估信息后存储到健康管理数据库,向系统健康管理软件发送信息到达通知。
具体地,系统健康评估软件想要获取设备或者系统最新健康状况信息,向信息传输软件发送健康评估信息查询指令。信息传输软件将健康状况查询指令封装成SNMP协议的Get PDU发送给设备端的设备健康管理软件。
设备健康管理软件接收到健康状况查询指令,到设备管理信息库中检索满足条件的健康状况信息。
设备健康管理软件将满足条件的健康参数和健康评估信息封装成SNMP协议的Response PDU发送给信息传输软件。信息传输软件解析数据包,将反馈的健康状况信息保存到健康管理数据库,并向系统健康管理软件发送信息到达通知。
步骤六,根据设备健康参数、设备健康状况和系统健康状况,并且根据第三模型评估全系统健康状况。
在本申请的一个实施例中,第三模型为:
其中,H全系统的健康指数,Mi为i系统的权重,Hi为i系统的健康指数。
具体地,机载测控试验训练任务数据处理与运行管理系统健康指数=数据处理系统权重*数据处理系统健康指数+指挥显示系统权重*指挥显示系统健康指数+运管系统权重*运管系统健康指数。数据处理系统的权重0.5,健康指数为0.93;指挥显示系统权重为0.31,健康指数为0.89;运管系统权重0.19,健康指数为0.90,则机载测控试验训练任务数据处理与运行管理系统健康指数=0.5*0.93+0.31*0.89+0.19*0.90=0.91。
其中,权重根据各系统外部接口数量占比确定,数据处理系统与其它系统之间的外部接口有8个,指挥显示系统与其它系统之间的外部接口有5个,运管系统与其它系统之间的外部接口有3个,则数据处理系统的权重=8/(8+5+3)=0.5,指挥显示系统权重=5/(8+5+3)=0.31,运管系统权重=3/(8+5+3)=0.19。各系统健康指数是根据各系统运行状况由设备端上报的。机载测控试验训练任务数据处理与运行管理系统健康状况评估规则为:健康判定规则:健康指数≥0.80,亚健康判定规则:0.60≤健康指数<0.80,危险判定规则:0.40≤健康指数<0.60,失效判定规则:健康指数<0.40。因此,以机载测控试验训练任务数据处理与运行管理系统为例,机载测控试验训练任务数据处理与运行管理系统的健康指数为0.91,则机载测控试验训练任务数据处理与运行管理系统健康状况为健康。
在本申请的一个实施例中,在步骤五之前或之后,可视化显示所述设备健康参数、所述设备健康状况和所述系统健康状况。
具体地,系统健康管理软件监听到信息传输软件发送的信息到达通知,到健康管理数据库中获取最新的健康参数和健康评估信息,在健康状态监视界面中显示最新的系统或设备健康状况。
系统健康管理软件监听到信息传输软件发送的信息到达通知,到健康管理数据库中获取最新的健康参数和健康评估信息。在健康状态监视界面中显示最新的系统或设备健康状况。对于健康的系统或设备界面中以绿色字体显示,对于亚健康的系统或设备界面中以橙色字体显示,对于危险和失效状态的系统或设备界面中以红色字体显示。
在进一步地实施例中,健康状态监视界面中不仅显示系统或设备最新的健康状况,而且以图形、数表等直观的数据可视化形式展示系统或设备历史运行健康状况,结合历史数据分析系统或设备健康状况,提前发现设备可能发生的异常,及时进行设备维修或者更新改造。
在本申请的一个实施例中,在步骤六之后,基于最新的系统或设备健康参数和健康评估信息,自动生成健康评估报告。
健康评估报告格式编辑以所见即所得的图形化编辑方式制定健康评估报告的格式,可以插入文本、表格、图片、分析图形等类型的报告内容,支持不同类型内容的混合排版。健康评估报告格式编辑最终形成一个格式模板。
在健康评估报告格式模板的基础上,依据其动态内容与健康评估结果数据的关联关系,查询健康评估数据,动态生成所需内容,并按照排版要求,与静态内容融合在一起自动生成完整的健康评估报告。
本申请进一步公开了一种设备健康管理系统,具体地如图2所示。
该系统包括总系统健康管理装置和分系统健康管理装置,总系统健康管理装置分别与一个或多个分系统健康管理装置相连,分系统健康管理装置分别与一个或多个设备相连,总系统健康管理装置用于定义设备台账、分系统台账、管理指令和查询指令,并将设备台账、分系统台账、管理指令和查询指令发送至分系统健康管理装置,分系统健康管理装置用于采集一个或多个设备的设备运行数据,评估设备和分系统的健康状况,生成设备健康信息和分系统健康信息,并将设备运行数据、设备健康信息和分系统健康信息反馈至总系统健康管理装置。
具体地,该管理系统利用系统端健康管理A(全系统)和设备端健康管理B(分系统)的架构模式实现。系统端健康管理A负责对各设备或系统上报的健康数据进行综合处理和分析,在系统层面实现全系统综合性的健康管理,管理范围为所有纳入健康管理系统的设备或系统。设备端健康管理B负责各设备内部的健康管理,管理范围为设备内部各系统、软件和部件,按系统、软件和部件三个级别实施,并按这三个级别向系统端健康管理上报健康数据,具备数据主动上报和响应系统端健康数据查询的功能。系统端健康管理和设备端健康管理之间采用SNMP协议进行管理指令、健康数据的传递。
在本申请的一个实施例中,系统端健康管理A包括:系统健康管理软件a1、信息传输软件a2和健康管理数据库a3。系统健康管理软件a1负责定义设备台账、设备健康参数、设备健康级别、健康判定标准,采集和接收各系统的健康参数和健康评估信息,进行全系统健康评估,对可能的故障和亚健康状态进行影响域分析,为设备的运行、维修、改造提供决策依据。信息传输软件a2是连接系统端健康管理和设备端健康管理的桥梁,实现基于SNMP协议的健康数据的采集、传输、转发和存储。健康管理数据库a3存储定义的设备台账信息、设备健康参数、设备健康级别、健康判定标准,存储采集的健康参数、运行状态和健康评估信息。
其中,系统端系统健康管理软件a1包括:设备管理台账a11、健康状态监测a12、健康状态评估a13。设备管理台账a11对整个系统所有的软硬件资源进行管理,定义软硬件资源的基本信息、健康等级、健康参数、健康评估规则。健康状态监视a12采集系统或设备健康参数、健康评估信息,在可视化的界面上监视系统或设备的健康状况。由于机载测控试验训练任务参试设备众多,设备端每次产生的健康信息全部上报到系统端,势必会增加网络数据传输负担,影响任务数据的传输,本发明中采用设备端主动上报健康状况异常的健康信息和系统端根据需要查询最新健康信息两种相结合的方式进行设备端健康信息的采集。健康状态评估a13在获取的各系统/设备健康参数基础上对全系统健康状况进行评估,从而掌握全系统所处的健康等级以及性能劣化的程度。
其中,信息传输软件a2包括:数据接收a21、数据转发a22、数据存储a23。数据接收a21负责接收其它软件上报或下发的数据信息,包括接收系统健康管理软件a1下发的健康管理指令或者健康查询指令,接收设备端设备健康管理软件b1上报的设备健康参数和健康评估信息。数据转发a22负责将系统健康管理软件a1发出的健康查询指令、健康管理指令下发到设备端的设备健康管理软件b1。数据存储a23负责将接收到的设备端设备健康管理软件b1上报的健康参数和健康评估信息存储到健康管理数据库a3,向系统健康管理软件a1发送信息到达通知。
考虑到试验训练参试系统和设备众多,全部由系统端直接管理,系统端压力较大,系统端和设备端信息传输频繁可能会造成网络阻塞,本发明中设备端健康管理采用主从模式实现,以参试系统为单位分组管理设备。
在本申请的一个实施例中,设备端每个参试系统包含一套设备健康管理软件b1、设备管理信息库(MIB)b2和该系统管辖的设备分别部署设备代理软件b3。设备健康管理软件b1实现采集各设备代理软件b3上报的健康参数、健康评估信息,存储到设备管理信息库b2中;基于各设备代理软件b3上报的健康参数进行系统健康评估,生成系统健康评估信息存储到设备管理信息库b2中;将本系统内生成的健康参数、健康评估信息上报给系统端信息传输软件a2;接收系统端信息传输软件a2下发的管理指令,控制各设备代理软件b3按照管理指令执行。设备代理软件b3采集设备各部件或者部署软件的运行数据,进行处理后生成设备健康评估信息上报给设备健康管理软件b1;接收设备健康管理软件b1的管理指令,按照管理指令控制健康数据的采集和生成。设备管理信息库(MIB)b2用于存储MIB格式的健康参数、健康评估信息。
其中设备端设备健康管理软件b1包括:数据接收b11、数据处理b12、数据存储b13和数据发送b14。数据接收b11接收系统端信息传输软件a2转发的健康管理指令或健康查询指令。数据处理b12对接收到的指令进行解析,如果是健康查询指令则从设备管理信息库b2中获取最新的设备健康参数和健康评估信息,如果是健康管理指令,则将管理指令分发到各设备代理软件b3上执行;接收本系统内各个设备代理软件b3发送的设备健康参数和健康评估信息,对数据进行格式化处理,生成MIB格式;根据各个设备代理软件b3上报的健康参数和健康评估信息评估本系统的健康状况,将本系统的健康状况进行格式化处理,生成MIB格式。数据存储b13将处理后的各设备代理软件b3上报的健康参数和健康评估信息以MIB格式存储到设备管理信息库(MIB)b2中;将处理后的本系统的健康评估信息以MIB格式存储到设备管理信息库(MIB)b2中。数据发送b14对于满足主动上报条件的健康数据,将健康数据生成SNMP协议的Trap PDU发送给系统端的信息传输软件a2;接收系统端系统健康管理软件a1的查询指令后,将查询的数据生成SNMP协议的Response PDU发送给系统端的信息传输软件a2。
其中设备端设备代理软件b3包括:数据接收b31、数据处理b32和数据发送b33。数据接收b31负责接收设备健康管理软件b1发送的健康管理指令。数据处理b32解析健康管理指令中健康数据采集时间间隔,将健康数据采集时间间隔写入本地配置文件;按照健康数据采集时间间隔采集设备内部各部件的原始信息,通过信号处理和数据筛选,提取健康管理所需参数,对采集的数据进行融合、计算处理,生成设备健康评估信息。数据发送b33负责将采集的设备健康参数、健康评估信息上报给设备健康管理软件b1。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种设备健康管理方法,其特征在于,所述方法包括:
定义系统台账、设备台账和采集规则;
下发所述系统台账、所述设备台账和所述采集规则;
根据所述采集规则采集设备健康参数,并且根据所述设备健康参数和第一模型评估设备健康状况;
根据所述系统台账和所述设备健康状况,并且根据第二模型评估系统健康状况;
响应于上报规则或查询指令,上传所述设备健康参数、所述设备健康状况和所述系统健康状况;
根据所述设备健康参数、所述设备健康状况和所述系统健康状况,并且根据第三模型评估全系统健康状况。
3.如权利要求1所述的设备健康管理方法,其特征在于,所述设备健康参数包括待评估设备中部件的利用率、温度、运行速度、存储空间等。
4.如权利要求1所述的设备健康管理方法,其特征在于,所述采集规则包括获取设备运行数据的时间间隔。
5.如权利要求1所述的设备健康管理方法,其特征在于,所述系统台账包括所述系统的基本信息、系统健康参数、系统健康等级和系统健康评估规则。
6.如权利要求1所述的设备健康管理方法,其特征在于,进一步包括:可视化显示所述设备健康参数、所述设备健康状况和所述系统健康状况。
7.如权利要求1所述的设备健康管理方法,其特征在于,根据设备运行数据、设备健康评估信息和系统健康评估信息,评估所述全系统健康状况。
8.一种设备健康管理系统,其特征在于,所述系统包括:
总系统健康管理装置和分系统健康管理装置,所述总系统健康管理装置分别与一个或多个所述分系统健康管理装置相连,所述分系统健康管理装置分别与一个或多个设备相连;
所述总系统健康管理装置用于定义设备台账、分系统台账、管理指令和查询指令,并将所述设备台账、所述分系统台账、所述管理指令和所述查询指令发送至所述分系统健康管理装置;
所述分系统健康管理装置用于采集所述一个或多个设备的设备运行数据,评估设备和分系统的健康状况,生成设备健康信息和分系统健康信息,并将所述设备运行数据、所述设备健康信息和所述分系统健康信息反馈至所述总系统健康管理装置。
9.如权利要求8所述的设备健康管理系统,其特征在于,所述总系统健康管理装置包括:系统健康管理模块、信息传输模块和健康管理数据库,其中,系统健康管理模块用于定义所述设备台账、分系统台账,所述信息传输模块用于与所述分系统健康管理装置传输数据信息,所述健康管理数据库用于存储所述运行数据、所述设备健康信息和所述分系统健康信息。
10.如权利要求9所述的设备健康管理系统,其特征在于,所述分系统健康管理装置包括:设备健康管理模块、设备代理模块和设备管理信息库,其中,所述设备健康管理模块用于采集所述设备运行数据、评估设备健康状况、生成所述设备健康信息,并与所述总系统健康管理装置的所述信息传输模块传输数据信息,所述设备代理模块用于采集所述设备的部件或者部署软件的运行数据,所述设备管理信息库用于存储所述设备运行数据和所述设备健康信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211098459.0A CN115203001A (zh) | 2022-09-09 | 2022-09-09 | 一种设备健康管理的方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211098459.0A CN115203001A (zh) | 2022-09-09 | 2022-09-09 | 一种设备健康管理的方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115203001A true CN115203001A (zh) | 2022-10-18 |
Family
ID=83573240
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211098459.0A Pending CN115203001A (zh) | 2022-09-09 | 2022-09-09 | 一种设备健康管理的方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115203001A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160378615A1 (en) * | 2015-06-29 | 2016-12-29 | Ca, Inc. | Tracking Health Status In Software Components |
CN109814537A (zh) * | 2019-03-01 | 2019-05-28 | 中国航空无线电电子研究所 | 一种无人机地面站健康评估方法 |
CN112651605A (zh) * | 2020-12-10 | 2021-04-13 | 河钢乐亭钢铁有限公司 | 设备监控与状态分析系统 |
CN113872813A (zh) * | 2021-09-29 | 2021-12-31 | 广东电网有限责任公司韶关供电局 | 一种载波通信设备全生命周期管理方法及系统 |
CN114239734A (zh) * | 2021-12-21 | 2022-03-25 | 中国人民解放军63963部队 | 一种分布式车载健康管理系统 |
-
2022
- 2022-09-09 CN CN202211098459.0A patent/CN115203001A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160378615A1 (en) * | 2015-06-29 | 2016-12-29 | Ca, Inc. | Tracking Health Status In Software Components |
CN109814537A (zh) * | 2019-03-01 | 2019-05-28 | 中国航空无线电电子研究所 | 一种无人机地面站健康评估方法 |
CN112651605A (zh) * | 2020-12-10 | 2021-04-13 | 河钢乐亭钢铁有限公司 | 设备监控与状态分析系统 |
CN113872813A (zh) * | 2021-09-29 | 2021-12-31 | 广东电网有限责任公司韶关供电局 | 一种载波通信设备全生命周期管理方法及系统 |
CN114239734A (zh) * | 2021-12-21 | 2022-03-25 | 中国人民解放军63963部队 | 一种分布式车载健康管理系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110011829B (zh) | 综合机载任务系统健康管理子系统 | |
US20150078178A1 (en) | Software platform for implementation and control of satellite communication systems | |
US10809753B2 (en) | Real-time simulator and controller of power system using distributed data streaming server | |
CN1992636B (zh) | 一种处理告警信息的系统及方法 | |
CN106789323A (zh) | 一种通信网络管理方法及其装置 | |
CN108931972A (zh) | 一种基于模型驱动的变电站二次设备状态智能诊断方法 | |
CN114787875A (zh) | 用于与数据中心运营或云基础设施一起使用虚拟或增强现实的系统和方法 | |
US20170024400A1 (en) | Method for automatic processing of a number of protocol files of an automation system | |
CN110723166A (zh) | 一种道岔监测方法及系统 | |
CN110768845A (zh) | 一种智能变电站过程层虚拟连接故障定位系统 | |
CN103914057B (zh) | 一种工控设备自动化系统的故障诊断和分析方法及系统 | |
CN108107292B (zh) | 电能质量在线监测系统的业务数据监测系统及方法 | |
CN109905268B (zh) | 网络运维的方法及装置 | |
CN108418891A (zh) | 一种高压发生器监控系统和方法 | |
CN110609761B (zh) | 确定故障源的方法、装置、存储介质和电子设备 | |
CN115203001A (zh) | 一种设备健康管理的方法和系统 | |
CN106293975B (zh) | 信息处理方法、信息处理装置和信息处理系统 | |
CN111953525A (zh) | 专有设备运维监控系统 | |
CN108258802A (zh) | 一种配电网中配电设备的运行状况的监测方法和装置 | |
CN116187774A (zh) | 一种数据中心人工智能运维管理系统 | |
CN109982284A (zh) | 用于线路巡检的通讯系统及方法 | |
CN206237041U (zh) | 一种输变电设备电力数据的聚类系统 | |
CN109686070A (zh) | 用电信息采集系统的终端自动调试方法及其介质和设备 | |
CN115343558A (zh) | 一种低压电器的故障分析检测系统 | |
CN116028295A (zh) | 设备监控方法、网管系统、存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |