CN112383412A - 一种用于it监控运维的智能语音系统和方法 - Google Patents
一种用于it监控运维的智能语音系统和方法 Download PDFInfo
- Publication number
- CN112383412A CN112383412A CN202011155034.XA CN202011155034A CN112383412A CN 112383412 A CN112383412 A CN 112383412A CN 202011155034 A CN202011155034 A CN 202011155034A CN 112383412 A CN112383412 A CN 112383412A
- Authority
- CN
- China
- Prior art keywords
- maintenance
- monitoring
- user
- prediction
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 279
- 238000012423 maintenance Methods 0.000 title claims abstract description 180
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000012545 processing Methods 0.000 claims abstract description 105
- 238000012549 training Methods 0.000 claims abstract description 18
- 238000007726 management method Methods 0.000 claims description 53
- 230000008569 process Effects 0.000 claims description 28
- 230000003993 interaction Effects 0.000 claims description 27
- 238000004364 calculation method Methods 0.000 claims description 26
- 238000012216 screening Methods 0.000 claims description 17
- 238000003860 storage Methods 0.000 claims description 10
- 230000015572 biosynthetic process Effects 0.000 claims description 8
- 238000005516 engineering process Methods 0.000 claims description 8
- 238000003786 synthesis reaction Methods 0.000 claims description 8
- 238000004422 calculation algorithm Methods 0.000 claims description 7
- 238000004140 cleaning Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 claims description 6
- 238000009826 distribution Methods 0.000 claims description 5
- 238000007689 inspection Methods 0.000 claims description 5
- 238000007619 statistical method Methods 0.000 claims description 4
- 238000001514 detection method Methods 0.000 claims description 3
- 239000000284 extract Substances 0.000 abstract description 2
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 230000005856 abnormality Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 241000282414 Homo sapiens Species 0.000 description 2
- 241001435619 Lile Species 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000013179 statistical model Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000000546 chi-square test Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/302—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3024—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a central processing unit [CPU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3037—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a memory, e.g. virtual memory, cache
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3058—Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/32—Monitoring with visual or acoustical indication of the functioning of the machine
- G06F11/324—Display of status information
- G06F11/327—Alarm or error message display
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0677—Localisation of faults
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明涉及一种用于IT监控运维的智能语音系统和方法,包括:与被监控设备依次连接的智能监控运维平台、监控运维APP、意图APP;监控运维APP包括:消息接收模块、逻辑处理模块、UI展示模块、故障预测模块、监控运维意图库、设备类型库和告警等级库,意图APP包括:语音播报模块,语音识别模块。本发明通过规划和训练了一个监控运维意图库,以识别运维人员与运维相关的语音,提取有用的运维信息,形成运维指令对被监控设备进行远程监控和维护,同时通过训练对常见故障进行预测,并结合其他同类型设备进行比较,用以对本设备的故障进行预测,并根据运维人员专业情况和监测习惯对运维人员提出存在的故障点,实现运维的个性化和关键性提示。
Description
技术领域
本发明涉及一种用于IT监控运维的智能语音系统和方法,是一种电子数字计算系统和方法,是一种用于对软件运行状态进行监控的系统和方法。
背景技术
随着各行各业积极的推进信息化建设,IT系统及其硬件设备日益成为业务稳定进行的基础设施和关键因素。为保障诸如网络、服务器、数据库等IT资源的正常运行,运维人员需要时常对其进行维护,特别是当异常发生时,能及时收到报警,并对异常进行快速定位、诊断和修复尤为重要。
目前市面主流的监控运维系统,其告警的方式有短信告警、电子邮件告警、网页屏幕显示告警等多种方式,运维人员需要不时地关注手机,电子邮箱、电脑屏幕或投屏等,容易造成告警信息无法及时获知的情况。
由于IT机房设施内相对较为嘈杂,运维人员通常在远离设备的办公环境中工作,当需要对设备进行远程操作或对设备信息诸如告警记录、设备状态进行查询操作时,需要频繁在各种远程界面之间切换上操作,耗时而费力,且效率较低。
此外,目前市面主流的监控运维系统大部分没有故障预警的功能,没有办法在即将发生故障前就对用户进行预警,使用户能及时预先采取措施,从而避免故障的发生,保证业务的稳定运行。因此,在运维过程中如何在故障出现前后有效的提醒运维人员,是一个需要解决的问题。
发明内容
为了克服现有技术的问题,本发明提出了一种用于IT监控运维的智能语音系统和方法。所述的系统和方法通过故障预测、监控运维意图等一系列设施,利用语言进行故障判断和指令交互,使维修人员能够十分方便在任何时间和地点对被维护设备进行监测和远程维护,使设备维护更加方便快捷。
本发明的目的是这样实现的:一种用于IT监控运维的智能语音系统,包括:与被监控设备依次连接的智能监控运维平台、监控运维APP、意图APP;所述的监控运维APP包括:消息接收模块、逻辑处理模块、UI展示模块、故障预测模块、监控运维意图库、设备类型库和告警等级库,所述的意图APP包括:语音播报模块,语音识别模块;
所述的智能监控运维平台,用于定时从被监控设备采集监控项数据,响应故障预警的指令对所指定的设备监控项进行历史数据处理,利用不同监控项的故障预测模型对用户最关心的监控项进行故障的预警,并与监控APP进行数据交互和操作以及各种消息发布;
所述的消息接收模块:通过私有协议与智能监控运维平台连接,用于订阅和接受来自所述智能监控运维平台的消息;
所述的逻辑处理模块:与智能监控运维平台连接,用于将用户意图和设备参数转化为请求和参数从所述智能监控运维平台获取相应的处理结果和返回数据,并将处理结果和返回数据进行逻辑处理交由语音播放模块和UI展示模块用于播放和展示;
所述的UI展示模块,用于将所述逻辑处理模块的处理结果在界面进行展示,并支持用户通过触屏操作来实现查看数据、操作设备和系统设置;
所述的监控运维意图库,用于为相关的信息查询、设备及其监控项和告警相关的操作、定期巡检以及如网络管理、文件系统、存储管理、带宽限制和备份等高级操作的用户意图集;
所述的设备类型库,用于存储被监控设备中的各类设备的参数;
所述的告警等级库,用于存储告警信息的等级,将告警信息等级划分为:信息等级、警告等级、错误等级、紧急等级和灾难等级;
所述的故障预警模块,用于记录用户的语音交互操作和触屏操作然后通过基于时变权重的数据统计方法计算获得用户的关心度列表,结合其他相似用户的关心度推荐列表,以频率加权的混合算法来计算获得最终的预警管理表,并向逻辑处理模块发送预测指令经由监控运维平台按照预测管理表对用户最关心的监控项信息进行预测,并对达到预警标准的预警信息进行播报和展示;
所述的语音播报模块,用于将符合用户设置的设备告警信息,用户关心度最高的设备预警消息以及其他系统消息以自然人声的方式对用户进行播报;
所述的语音识别模块,用于将经由麦克风收到的用户说法,理解和识别为用户意图和设备参数信息,交由逻辑处理模块进行处理。
一种使用上述系统的用于IT监控运维的智能语音提示方法,所述方法的步骤如下:
告警和处理过程:
步骤1,用户设置:监控开始之前,用户或进行设置,以确定接收哪些被监控设备的哪个告警等级的告警信息,或默认接收所有告警信息;
步骤2,发送告警信息列表:智能监控运维平台对被监控设备进行检测轮询,将所有被检测设备发生的故障不论大小全部列入告警信息列表中,并将告警信息列表发送至监控运维APP的消息接收模块;所述的告警信息列表除告警信息外,还包括预测告警信息;
步骤3,告警筛选:筛选出一条告警等级最高的记录,准备播报和展示;
步骤4,告警判断:判断欲播报告警记录是否符合用户设置,如果符合则进入下一步,如果不符合则回到步骤3,重新进行筛选;
步骤5,播报展示:通过语言进行告警播报,同时通过显示屏进行告警故障显示;
步骤6,交互:或通过语音识别模块接收运维人员的语音指令,并将语音指令转化为文字,或通过UI展示模块的触摸屏操作获取操作指令;
步骤7,运维指令判断:对于文字则将文字与监控运维意图库进行比对,判断是否为运维指令,对于触摸屏操作则直接判断是否为运维指令,如果是则进入下一步骤,如果否则忽略;
步骤8,执行运维指令:获取收到的运维指令的相关参数,提交给逻辑处理模块,经逻辑处理后发送至智能监控运维平台,通过智能监控运维平台对被监控设备进行维护;
步骤9,维护返回:智能监控运维平台维护被监控设备之后,将维护处理结果和数据返回给逻辑处理模块,逻辑处理模块交由语音播报模块进行播报并通过UI模块进行展示;
故障预警训练过程:
步骤01,记录用户历史操作:列表记录用户的语音交互操作和触屏操作的内容;
步骤02,数据筛选和清理:定时对用户历史操作记录进行筛选和清理,将其中不涉及监控项的操作剔除;
步骤03,数据分类:根据监控项类型,对用户历史操作进行分类处理;
步骤04,计算关心度排序表和模型训练;将用户历史操作记录带入故障预测模型进行用户关心度计算和模型训练,根据监控项目的重要程度以及操作时间总和分析计算用户的关心度排序表;关心度计算公式如下:
其中:i为监控项的序列号,i=1,2,……,n;n为监控项个数,为正整数;Gi为用户对第i个监控项的关心度评分,Zi为第i个监控项的重要程度;Qi为遵循遗忘曲线计算所得的时间权重值;T为参考历史数据的最大时长周期,ti为第i个监控项的历史数据点所在时间与当前时间的时长差距,λ为遗忘参数;
步骤05,确定预测管理表:结合智能监控运维平台推送的其他相似用户的关心度排序表确定本系统的预测管理表;
在线模式(即可以连通外网)时,通过与第三方语音技术平台的交互实现语言的识别和合成;离线模式(无法连通外网)时,通过访问本地资源库实现简单的语音识别和合成。因此,智能语音系统并不依赖于外部网络,可以在内外网严格隔离的情况下,在内网环境中正常运行。
步骤06,使用预测管理表进行故障预测:向逻辑处理模块发送预测管理表和预测指令,智能监控运维平台按照预测管理表进行故障预测;
故障预测过程:
步骤A1,记录历史数据:记录系统各个监控项的运行数据;
步骤A2,确定预测顺序:按照预测管理表中的排列顺序依次对需要进行故障预测的监控项进行预测计算;
步骤A3,优化调节因子:如果是第一次预测则将调节因子初始为1,如果为第二次以上的预测则将上次的预测值与实际数字进行对比,以高斯分布误差反馈优化调节因子,从而优化预测模型;
步骤A4,预测计算:通过基于时变权重的优化后的预测模型对一定时期的历史数据进行预测计算;
步骤A5,判断是否预报警:将计算获得的预测值与告警阈值比较,大于告警阈值则进行预报警,反之则不进行预报警。
进一步的,所述的故障预测模型如下:
预测时长t后的监控项数据预测数值为:
进一步的,所述的预测管理表中监控项的关心度评分为:
Yi=B Gi+X Si
其中,Yi为预测管理表中的最终关心度评分,Si为相似用户的关心度评分,B为用户操作频率权重,X为相似用户的权重;
当无法获得其他相似用户的关心度排序表时,B为1,X为0;
当能够获得其他相似用户的关心度排序表时,X为1,B是一个动态权重值,计算公式为:
其中:P为给定频率中位值,pt为到当前时刻为止的预测时长t内用户的平均操作频率。
进一步的,所述的语音指令的识别包括如下子步骤:
子步骤1,唤醒:收到语音指令后首先语音识别唤醒,启动语音识别,语音识别优先使用在线语音识别,如果在离线状态下则使用本地语音识别;
子步骤2,解析意图:语音识别启动之后解析语音指令的意图,首先判断是否为监控运维意图,如果是则在监控运维意图库中查找语音指令所要求的监控项,分析指令中所针对的设备类型,如果不是则进行其他逻辑操作;
子步骤3,查找:在设备类型库和监控运维意图库中监控项中查找语音指令中所要求的设备类型和监控项;
子步骤4,提取参数和数据:根据设备类型和监控项逻辑处理模块以所述意图和相关参数向监控运维平台要求相关数据;
子步骤5,提示:根据用户特点选择用户关心的相关监控项提示用户;
子步骤6,推送,将需要展示和播报的信息推送至语音播报模块和UI展示模块。
本发明的优点和有益效果是:本发明通过规划和训练了一个监控运维意图库,以识别运维人员与运维相关的语音,提取有用的运维信息,形成运维指令对被监控设备进行远程监控和维护,同时通过记录用户的历史操作,从中筛选和统计用户最关心的监控项列表,并结合其他相似用户最关心的监控项列表通过加权计算获得用户的预测管理表,按照该预测管理表对用户最关心的监控项进行故障预测,从而实现运维的个性化和关键性提示,使运维更加精确、快速、便捷。
附图说明
下面结合附图和实施例对本发明作进一步说明。
图1是本发明实施例一所述智能语音系统的架构图;
图2是本发明实施例二所述智能语音方法的流程图;
图3是本发明实施例五所述智能语音方法的语音指令的识别流程图。
具体实施方式
实施例一:
本实施例是一种用于IT监控运维的智能语音系统,如图1所示。
本实施例涉及IT监控运维领域的相关信息查询、设备及其监控项和告警相关的操作、定期巡检以及如网络管理、文件系统、存储管理、带宽限制和备份等高级操作的用户意图集。设备类型库包括windows机,Linux机,网络交换机,服务器,工作站以及存储设备、虚拟机和超融合平台等。所述监控项库包括CPU、内存、磁盘的利用率和温度,电源和风扇的状态,机房温湿度,UPS状态,文件系统、逻辑卷、共享和网卡的状态等。告警等级库包括信息等级、警告等级、错误等级、紧急等级和灾难等级。设备参数信息为通过与设备类型库、监控项库和告警等级库进行比对所确定的设备类型参数、监控项参数、告警等级参数,如果没有比对成功,则相应参数信息不存在。业务处理流程指针对上述监控运维意图库中规划的各种用户意图所进行的一系列的操作过程,以及将处理结果反馈给用户。
本实施例所述系统能够构成一种计算机程序产品,所述计算机程序产品可以运行在基于安卓系统的带屏智能音箱、PAD平板电脑和手机上,包括意图APP和监控运维APP。所述意图APP除可以识别有关监控运维的用户意图之外,还可以识别听音乐,设闹钟,看电视,看直播等其他生活和娱乐类用户意图。监控运维APP能够处理监控运维相关的业务逻辑并播放和展示相关的处理结果。
本实施例包括:与被监控设备依次连接的智能监控运维平台、监控运维APP、意图APP;所述的监控运维APP包括:消息接收模块、逻辑处理模块、UI展示模块、故障预测模块、监控运维意图库、设备类型库和告警等级库,所述的意图APP包括:语音播报模块,语音识别模块。
所述的智能监控运维平台,用于定时从被监控设备采集监控项数据,响应故障预警的指令对所指定的设备监控项进行历史数据处理,利用不同监控项的故障预测模型对用户最关心的监控项进行故障的预警,并与监控APP进行数据交互和操作以及各种消息发布。
所述的消息接收模块:通过私有协议与智能监控运维平台连接,用于订阅和接受来自所述智能监控运维平台的消息。
消息接收模块,通过私有协议所述智能监控运维平台相连接,订阅和接受来自该平台的消息,包括设备告警消息,app更新消息,平台名称或LOGO更新消息以及其他监控运维消息。其中设备告警消息包括设备性能告警、设备故障告警、数据库出错告警、服务/程序出错告警、网络告警、机房温湿度告警和UP(电源)故障告警等。
所述的逻辑处理模块:与智能监控运维平台连接,用于将用户意图和设备参数转化为请求和参数从所述平台获取相应的处理结果和返回数据,并将处理结果和返回数据进行逻辑处理交由语音播放模块和UI展示模块用于播放和展示。
逻辑处理模块,通过第二种私有协议与所述的智能监控运维平台相连接,并将客户端指令和参数转化为请求和参数从平台获取相应的处理结果和返回数据,并将处理结果和返回数据进行逻辑处理交由语音播放模块和UI显示及模块用于播放和展示。
所述的UI展示模块,用于将所述逻辑处理模块的处理结果在界面进行展示,并支持用户通过触屏操作来实现查看数据、操作设备和系统设置。
UI展示模块,将所述逻辑处理模块的处理结果在界面进行展示,并支持用户通过触屏操作来实现查看数据、操作设备和系统设置。
所述的监控运维意图库,用于为相关的信息查询、设备及其监控项和告警相关的操作、定期巡检以及如网络管理、文件系统、存储管理、带宽限制和备份等高级操作的用户意图集。
用户意图集包含如设备状态、告警信息和设备监控项的查询和查看,设备的开始/停止监控、关闭、重启和取消关闭/取消重启操作,设备监控项的启停,告警器的启停和阈值修改,定时巡检,网卡的激活和禁用,文件系统目录的管理、共享的创建和删除等,虚拟机的创建和删除,节点、RAID、OSD以及存储池的管理,带宽限制、高可用和热备等高级操作,license管理操作意图。
所述的设备类型库,用于存储被监控设备中的各类设备的参数。各类设备包括windows机,Linux机,网络交换机,服务器,工作站以及存储设备、虚拟机和超融合平台等。
所述的告警等级库,用于存储各类告警信息的等级,将告警信息等级划分为:信息等级、警告等级、错误等级、紧急等级和灾难等级。
所述的故障预警模块,用于记录用户的语音交互操作和触屏操作然后通过基于时变权重的数据统计方法计算获得用户的关心度列表,结合其他相似用户的关心度推荐列表,以频率加权的混合算法来计算获得最终的预警管理表,并向逻辑处理模块发送预测指令经由监控运维平台按照预测管理表对用户最关心的监控项信息进行预测,并对达到预警标准的预警信息进行播报和展示。
所述的语音播报模块,用于将符合用户设置的设备告警信息,用户关心度最高的设备预警消息以及其他系统消息以自然人声的方式对用户进行播报。
语音播报模块,将从所述消息接收模块或逻辑处理模块收到的故障告警消息和故障预测消息以及其他消息对用户进行播报,并根据用户的设置,总是把当前发生的、用户关心的、最高告警等级的信息以用户定义的语速,语调通过扬声器播放。
所述的语音识别模块,用于将经由麦克风收到的用户说法,理解和识别为用户意图和设备参数信息,交由逻辑处理模块进行处理。
语音识别模块,将经由麦克风收到的用户说法,理解和识别为用户意图和设备参数,交由逻辑处理模块进行处理。
语音播报和语音识别的模块可以在在线和离线两种模式下工作。在线模式(即可以连通外网)时,通过与第三方语音技术平台的交互实现语言的识别和合成;离线模式(无法连通外网)时,通过内置在设备中的语音训练资源库实现相对简洁的语音识别和语音合成。
本实施例所述提供的智能语音系统可以运行在基于android的带屏智能音箱、智能手机或PAD平板电脑上,可以供多个运维人员通过不同的方式等订阅和接收所述告警消息。告警消息包括设备性能告警、设备故障告警、数据库出错告警、服务/程序出错告警、网络告警、机房温湿度告警和UPS电源故障告警等。
本实施例所述系统能够在设备发生故障产生告警的时候,第一时间以自然人声的形式向用户进行语音告警,同时系统会根据用户的设置,总是把当前发生的、用户关心的、最高告警等级的一条设备告警信息对用户进行播报,提高了用户的获取设备告警的时效性和灵活性的同时,避免了多余告警信息对用户产生的纷扰,丰富了用户的体验。
针对不同类型的IT设备,本实施例所述系统提供了一个统一的操作平台,避免了用户在不同设备的风格各异的操作界面之间来回切换,实现了一站式的对各种设备的信息查询和远程操作。
本实施例所述系统通过两种私有协议与同一局域网内的、部署在用户机房环境内的监控运维平台相连接,同时对用户语音指令的识别和响应可以在在线和离线两种环境下运行,避免了系统对外部网络的依赖,适应了行业内一些需要严格的内外网隔离措施的用户和项目的需求,减少了此类用户的担忧。
智能语音系统还提供了故障预警模块,记录用户的语音交互操作和触屏操作,并对其筛选和处理,通过对基于时变权重的统计模型来计算获得用户的关心度列表,并结合其他相似用户的关心度列表采用基于频率权重的混合算法计算获得预警管理表。按照预测管理表对用户最关心的监控项信息进行预测,避免了用户不在意的信息对用户的打扰。
智能语音系统提供了智能监控运维平台,针对不同的监控项的预测误差反馈不断调节参数因子从而不断优化故障预警模型,能够对监控项最近一段时长的历史数据进行分析和计算,来实现对未来一段时长后是否到达告警阈值的预警判断,能够在故障未发生前的一定时长对用户进行提前预警,有利于保证业务的稳定运行。
实施例二:
本实施例是一种使用权利要求1所示系统的用于IT监控运维的智能语音提示方法。
本实施例所述方法的基本过程有三个:告警和处理过程、故障预警训练过程、故障预测过程,三个过程同时进行,在告警和处理过程中,不断进行故障预警训练过程,不断的完善预测模型,同时不断的进行故障预测。
告警和处理过程的运行过程大致为:当设备发送故障或异常时,会产生故障告警消息并被写入数据库相关的告警信息表中,智能监控运维平台会定时轮询所述告警信息表,并通过第一种私有协议推送所有未发送的告警消息到订阅相关消息的连接的客户端。所述第一种私有协议为一种发布/订阅式的协议,涉及服务器端和客户端。所述服务器端为一个消息的中转机构,可以接受来自所有客户端的各种类型的消息并转发给订阅了此种消息的客户端,当客户端中途断开时,可在一定的时间内为客户端缓存相关消息。所述消息的类型包括但不限于设备告警消息。
假如轮询的频率为10秒1次(可修改),在此期间产生的告警信息可能不止一条,所涉及的告警设备和告警等级也可能不一致。客户端接受到的告警消息列表包含了一次轮询期间发生的所有告警信息,可能涉及不止一台设备的一条告警记录。如果所有告警记录都播报的话,由于播报语速和告警条数的关系,播报会变得冗长并影响其后产生告警的播报,因此,系统会筛选一条告警等级最高的记录予以播报,并提示用户告警总条数。
由于设备类型的不同和运维人员的分工和专长各异,系统允许运维人员针对不同的设备和告警等级进行设置。例如,张三和李四同为运维人员,张三只接受交换机产生的告警等级为警告及以上的消息,而李四只接受来自存储设备的告警等级为错误及以上的消息。因此,系统会判断所筛选的一条告警记录是否符合用户的设置,如符合则进行语音播报和屏幕展示,如不符合,则剔除该条记录重复进行新一轮筛选。
所述方法的具体步骤如下:
一、告警和处理过程:
步骤1,用户设置:监控开始之前,用户或进行设置,以确定接收哪些被监控设备的哪个告警等级的告警信息,或默认接收所有告警信息。
允许运维人员针对不同的设备和告警等级进行个性化设置,语音播报模块会筛选符合用户个性化设置的告警信息中的一条告警等级最高的记录予以播报,并提示用户告警总条数,如无符合要求的告警信息则不予播报。
步骤2,发送告警信息列表:智能监控运维平台对被监控设备进行检测轮询,将所有被检测设备发生的故障不论大小全部列入告警信息列表中,并将告警信息列表发送至监控运维APP的消息接收模块;所述的告警信息列表除告警信息外,还包括预测告警信息。
告警信息包括设备性能告警、设备故障告警、数据库出错告警、服务/程序出错告警、网络告警、机房温湿度告警和UPS电源故障告警等。
步骤3,告警筛选:筛选出一条告警等级最高的记录,准备播报和展示。
步骤4,告警判断:判断欲播报告警记录是否符合用户设置,如果符合则进入下一步,如果不符合则回到步骤3,重新进行筛选。
步骤5,播报展示:通过语言进行告警播报,同时通过显示屏进行告警故障显示。
步骤6,交互:或通过语音识别模块接收运维人员的语音指令,并将语音指令转化为文字,或通过UI展示模块的触摸屏操作获取操作指令。
响应经由麦克风接收到的语音说法,进行识别和理解为文字指令信息,并与监控运维意图库、设备类型库、监控项库和告警等级库进行对比,确定用户的意图和设备参数信息,并支持多轮对话,默认保留上下文,从而避免了每次语音交互之前都先要进行语音唤醒的重复操作,以及每次交互之前重复选择设备的步骤,更符合人类对话习惯。
语音指令包括语音唤醒指令,语音唤醒指令是使设备准备好接受其他语音指令的一种指令,它是通过对本地预制唤醒词的识别来实现的,是不依赖于外部网络的离线唤醒。语音识别模块对于用户通过麦克风输入的语音信号的转化和识别可以工作在在线和离线两种环境下。在外网在线工作环境下,语音识别模块可以通过经由网络连接的第三方的语音技术平台来实现语言识别。在内网离线工作环境下,语音识别模块则通过本地语音训练资源实现对用户指令的识别。由于本地存储空间的限制,本地离线语音识别仅支持离线语音唤醒以及监控运维意图库中涉及的相关意图的识别。在外网在线环境下,优先采用第三方语音技术平台进行语音识别。
所述触屏操作是指用户在本发明所涉及智能语音系统所运行的设备的屏幕上直接进行触屏操作以获取处理结果和数据信息的一种操作。触屏操作包括但不限于涉及IT监控运维领域相关的操作,还包括诸如WIFI设置、监控运维平台服务器地址设置、版本更新、唤醒词修改等其他丰富用户体验的系统设置操作。因此,所述触屏操作并非都需要与监控运维平台进行数据交互。
触屏操作的具体交互流程如下:首先,用户通过UI界面发起触屏操作,然后由逻辑处理模块判断是否为监控运维相关的操作。如果是,则先向监控运维平台发起请求获取相关处理结果和返回数据,之后再由逻辑处理模块处理相关逻辑,将返回数据和处理结果以合适的数据结构分别返回UI展示模块和语音播报模块进行处理。如果不是,则直接交由逻辑处理模块进行相关的处理,并将处理结果和数据以合适的数据结构分别返回UI展示模块和语音播报模块进行处理。
步骤7,运维指令判断:对于文字则将文字与监控运维意图库进行比对,判断是否为运维指令,对于触摸屏操作则直接判断是否为运维指令,如果是则进入下一步骤,如果否则忽略。
判断用户意图是否属于监控运维意图,如果不是,则进行其他逻辑操作,如果是,则将用户意图以及识别到的其他参数信息提交给逻辑处理模块。其他参数信息指用户说法中除去意图之外的涉及操作对象的信息和参数,包括设备类型、监控项名称、告警等级等相关信息。相关数据或参数为与设备类型库、监控项库或告警等级库等相匹配从而确定的设备类型、监控项或告警等级。如首轮对话中未确定设备或监控项等信息,在意图的下轮对话中系统将根据业务处理流程的需要提示用户对设备或监控项进行选择加以确定。
逻辑处理模块将通过第二种私有协议与智能监控运维平台相连接,并根据用户的意图和相关数据和参数向监控运维平台发起请求并获取处理结果和返回数据。之后,处理相关的结果和返回数据,需要屏幕向用户展示的,处理成合适的数据结构向UI展示模块提交并在屏幕进行展示,需要语音播报的,处理成文字信息然后调用语音播报模块向用户进行播报。
步骤8,执行运维指令:获取收到的运维指令的相关参数,提交给逻辑处理模块,经逻辑处理后发送至智能监控运维平台,通过智能监控运维平台对被监控设备进行维护。
步骤9,维护返回:智能监控运维平台维护被监控设备之后,将维护处理结果和数据返回给逻辑处理模块,逻辑处理模块交由语音播报模块进行播报并通过UI模块进行展示。
二、故障预警训练过程:
随着监控设备的增多以及监控服务的深入,监控项越来越多,监控服务的负担也越来越大。另外,由于行业特点,一些用户希望设备在严格的内外网隔离的环境下运行,因此一些基于云平台进行大数据计算和故障预测的方式就变得不太现实。在这种情况下,利用本地有限的计算资源,对所有监控项进行故障预测,就将涉及到大量历史数据的计算,会严重影响监控平台的性能。因此基于用户关心度,只针对用户关心的若干监控项进行故障预测就显得十分有必要了。
故障预警训练过程原理为:故障预测模块会不停的记录用户所有的触屏操作和语音操作,然后定时进行数据的筛选,将与监控项无关的操作剔除出去。然后根据监控项的重要程度(主要指监控项的告警等级)以及用户进行此类操作的次数、频率,通过基于时变权重的统计模型来计算用户的关心度排序表,并结合其他相似用户的关心度排序表(如果有外网连接,可以接收到平台推送的其他相似用户的关心度排序表)利用基于频率加权的混合算法进行加权计算(例如用户操作较频繁,本人的加权值为1.5,相似用户的加权值为1)获得用户最终的预警管理表,并向逻辑处理模块发送故障预警管理表和故障预警指令,经由监控平台按照所述管理表进行故障预测。
具体过程如下:
步骤01,记录用户历史操作:列表记录用户的语音交互操作和触屏操作的内容。
步骤02,数据筛选和清理:定时对用户历史操作记录进行筛选和清理,将其中不涉及监控项的操作剔除。
步骤03,数据分类:根据监控项类型,对用户历史操作进行分类处理。
步骤04,计算关心度排序表和模型训练;将用户历史操作记录带入故障预测模型进行用户关心度计算和模型训练,根据监控项目的重要程度(告警等级)以及操作时间总和分析计算用户的关心度排序表;关心度计算公式如下:
其中:i为监控项的序列号,i=1,2,……,n;n为监控项个数,为正整数;Gi为用户对第i个监控项的关心度评分,Zi为第i个监控项的重要程度;,通常根据监控项的告警等级和用户设置来确定,Qi为遵循遗忘曲线计算所得的时间权重值;T为参考历史数据的最大时长周期(以小时为单位),ti为第i个监控项的历史数据点所在时间与当前时间的时长差距(以小时为单位取整),λ为遗忘参数;数值越大,遗忘速度越快,收敛越快,反之遗忘速度越慢,收敛越慢。
上述方法是一种基于时变权重的数学统计方法,是基于用户新近查询的内容显然为用户当前较为关心的内容为依据,对用户的不同时间段的历史操作赋予不同的加权值从而计算获得用户的关心度排序表。所建立模型为,用户的关心度为监控项的重要度与历史操作的时间权重的结合,而历史操作的时间权重遵循艾宾浩斯遗忘曲线。
步骤05,确定预测管理表:结合智能监控运维平台推送的其他相似用户的关心度排序表确定本系统的预测管理表。
在线模式(即可以连通外网)时,通过与第三方语音技术平台的交互实现语言的识别和合成;离线模式(无法连通外网)时,通过访问本地资源库实现简单的语音识别和合成。因此,智能语音系统并不依赖于外部网络,可以在内外网严格隔离的情况下,在内网环境中正常运行。
步骤06,使用预测管理表进行故障预测:向逻辑处理模块发送预测管理表和预测指令,智能监控运维平台按照预测管理表进行故障预测。
下面结合一次具体的故障预测管理表的计算过程进行详细的描述。
假设当前时间为2020-05-08 23:00:00,如下表所示,为截止当前时刻一天内用户的操作记录。
第一步,剔除掉与监控项无法的操作(序号4,5,6,10)。
第二步,对操作进行分类处理,操作分为5类:CPU,内存,磁盘温度,磁盘利用率,设备状态。
第三部分别统计用户对不同监控项的关心度。以CPU为例,假设我们设置λ为遗忘曲线经典的数值1.25,即λ=1.25,代入公式进行计算:
由此计算获得权重和关心度数据如下表所示。
由此获得用户的关心度排序表为:
监控项 | 关心度 |
CPU利用率 | 0.30 |
设备状态 | 0.29 |
内存利用率 | 0.15 |
磁盘温度 | 0.13 |
磁盘利用率 | 0.13 |
假定,系统处于纯内网的环境中运行,无法收到其他相似用户的关心度推荐表,系统则按照上表中的排序进行故障预测。
三、故障预测过程:
步骤A1,记录历史数据:记录系统各个监控项的运行数据。
步骤A2,确定预测顺序:按照预测管理表中的排列顺序依次对需要进行故障预测的监控项进行预测计算。
步骤A3,优化调节因子:如果是第一次预测则将调节因子初始为1,如果为第二次以上的预测则将上次的预测值与实际数字进行对比,以高斯分布误差反馈优化调节因子,从而优化预测模型。
步骤A4,预测计算:通过基于时变权重的优化后的预测模型对一定时期的历史数据进行预测计算。
步骤A5,判断是否预报警:将计算获得的预测值与告警阈值比较,大于告警阈值则进行预报警,反之则不进行预报警。
下面以内存利用率为例来说明故障预警的预测过程。假定不断优化获得的内存利用率的故障预警模型的三项重要参数为:最近历史数据时长T为1小时、预警阈值为70%、预警时长为0.5小时。首先,,监控平台定时(如每分钟一次)获取设备的内存利用率数据。当收到逻辑处理模块发送过来的故障预警指令时,系统首先将上次预测结果与实际数据进行对比,从而以高斯分布的误差反馈调节参数,优化某一监控项的故障预测模型(第一次时,此步骤忽略,调节因子初始值为1)。之后会统计1小时内的历史数据(每分钟一次数据,因此历史数据为60个)。然后根据历史数据推算从现在开始0.5小时之后的数值。最后,判断该数值是否到达阈值70%,如到达或超过70%,则调用相关模块对用户进行预警播报和UI屏幕展示,否则,将在1分钟后返回并重复上述操作。
以内存利用率为例,具体的预测过程如下:
第一步,根据参数T获取一小时的历史数据。如下表所示。
根据公式:
其中T为1小时(以分钟为单位,即T=60),假设λ为遗忘曲线经典的数值1.25,即λ=1.25。
第三步,根据历史数据进行故障预测计算,如下图(中间省略部分行):
由于预测值未达到阈值的70%,因此不预报警。
值得说明的一点是,每次进行预测之前,都将上次预测结果与实际结果进行对比,从而以高斯分布的误差反馈不断优化调节因子的取值,不断与H进行迭代优化,从而完成不同监控项的故障预测模型的构建。本应用实例中,经过长时间迭代优化,内存利用率的监控项在的取值约为1.08时,预测准确率最高。并以卡方检验验证该模型的预测结果与实际结果的拟合度为98.59%。
实施例三:
本实施例是实施例二的改进,是实施例二关于故障预测模型的细化。本实施例所述的故障预测模型是用户的关心度为监控项的重要度与历史操作的时间权重的结合,而历史操作的时间权重遵循艾宾浩斯遗忘曲线,建立模型如下:
其中,Gi为用户对某一监控项的关心度评分,Zi为监控项的重要程度,通常根据监控项的告警等级和用户设置来确定,Qi为遵循遗忘曲线计算所得的时间权重值,T为参考历史数据的最大时长周期(以小时为单位),ti为历史数据点所在时间与当前时间的时长差距(以小时为单位取整),λ为遗忘参数;数值越大,遗忘速度越快,收敛越快,反之遗忘速度越慢,收敛越慢。
预测时长t后的监控项数据预测数值为:
实施例四:
本实施例是上述实施例的改进,是上述实施例关于关心度评分的细化。本实施例所述的预测管理表中监控项的关心度评分为:
Yi=B Gi+X Si
其中,Yi为预测管理表中的最终关心度评分,Si为相似用户的关心度评分,B为用户操作频率权重,X为相似用户的权重;
当无法获得其他相似用户的关心度排序表时,B为1,X为0;
当能够获得其他相似用户的关心度排序表时,X为1,B是一个动态权重值,计算公式为:
其中:P为给定频率中位值,pt为到当前时刻为止的预测时长t内用户的平均操作频率。
本实施例所述关心度评分方法是一种基于频率加权的混合算法,是对用户自己的关心度排序表和平台发来了其他相似用户的关心度排序表进行加权混合计算生成最终故障预测管理表的一种混合算法。所述加权值并不是一个固定的值,而是根据用户的操作频率以及所处网络环境的状况而动态调整。
当用户处于纯内网环境时,由于无法获得其他相似用户的关心度排序表,因此其他相似用户的关系度推荐列表的权重为0,系统按照用户自己的关心度列表进行预测管理。
当用户处于外网连接状态时,则综合考虑用户的操作频率,当用户操作频率高时,用户自己的关心度权重较高,优先按照自己的关心度列表进行故障预测管理,当用户操作频率低时,其他相似用户的关心度推荐列表权重较高,优先按照相似用户的关心度推荐列表进行故障预测管理。
智能监控运维平台,一方面通过私有协议与所监控设备建立链接,定时从监控设备采集监控项数据,然后响应故障预警的指令对所指定的设备监控项进行历史数据的处理,利用不同监控项的故障预测模型对用户最关心的监控项进行故障的预警。另一方面,通过私有协议与智能语音系统进行数据和操作的交互和各种消息的发布。
故障预测模型是通过对不同监控项的历史数据进行数据的筛选和处理从而不断优化而来的。所述故障预测模型包括监控项的三项重要的参数指标,分别为预警判断所参考的历史数据的时长,所设置的告警阈值以及所设置的预警时长。所述故障预警模型是通过参考和分析监控项一定时长的历史数据来进行预测的,最近一定时长的历史数据的参考价值较大,因此在预测模型中权重较高,而过去较长时间段的历史数据则相对权重较低。当所预测的到达时长低于所设置的预警时长时就会触发预警。
实施例五:
本实施例是上述实施例的改进,是上述实施例关于语音指令识别的细化。本实施例所述的语音指令的识别包括如下子步骤,流程如图3所示:
子步骤1,唤醒:收到语音指令后首先语音识别唤醒,启动语音识别,语音识别优先使用在线语音识别,如果在离线状态下则使用本地语音识别;
语音指令包括语音唤醒指令。语音唤醒指令是使设备准备好接受其他语音指令的一种指令,它是通过对本地预制唤醒词的识别来实现的,是不依赖于外部网络的离线唤醒。语音识别模块对于用户通过麦克风输入的语音信号的转化和识别可以工作在在线和离线两种环境下。在在线外网工作环境下,语音识别模块可以通过经由网络连接的第三方的语音技术平台来实现语言识别。在离线本地工作环境下,语音识别模块则通过本地语音训练资源实现对用户指令的识别。由于本地存储空间的限制,本地离线语音识别仅支持离线语音唤醒以及监控运维意图库中涉及的相关意图的识别。在外网连接在线环境下,优先采用第三方语音技术平台进行语音识别。
子步骤2,解析意图:语音识别启动之后解析语音指令的意图,首先判断是否为监控运维意图,如果是则在监控运维意图库中查找语音指令所要求的监控项,分析指令中所针对的设备类型,如果不是则进行其他逻辑操作。
判断用户意图是否属于监控运维意图,如果不是,则进行其他逻辑操作,如果是则将用户意图以及识别到的其他参数信息提交给逻辑处理模块。所述其他参数信息指用户说法中除去意图之外的涉及操作对象的信息和参数,包括设备类型、监控项名称、告警等级等相关信息。本发明规划了设备类型库、监控项库和告警等级库,所述相关数据或参数为与所述设备类型库、监控项库或告警等级库等相匹配从而确定的设备类型、监控项或告警等级。如首轮对话中未确定设备或监控项等信息,在意图的下轮对话中系统将根据业务处理流程的需要提示用户对设备或监控项进行选择加以确定。
子步骤3,查找:在设备类型库和监控运维意图库中的监控项中查找语音指令中所要求的设备类型和监控项。
只是本实施例的关键步骤,经过语言识别后并不一定能够完全识别运维人员的意图,主要是针对设备和监控项不够明晰,还需要在设备类型库中进行查找,并确定哪些类型的设备符合语音指令的要求,在经过分析确定这些类型的设备中那些确实是语音指令中所需要的,如果还不能完全确定,可以通过列表的方式将这些设备类型全部列出,运维人员可以通过UI交互或再次发出语音指令进行修正和确认。设备类型确认则可以继续确定监控项,如果在被确定设备的监控项能够确定语音指令所要求的监控项,则直接进行确认即可,如果并能找到则需要进一步的分析确认,如果还没有找到对应的监控项则也同样可以列表展示,并通过语音或UI交互解决。
子步骤4,提取参数和数据:根据设备类型和监控项逻辑处理模块以所述意图和相关参数向监控运维平台要求相关数据。
提起数据是本实施例的目的,通过获取的设备和相关监控项的数据和参数进行展示,以便运维人员参考和分析设备的状态。
子步骤5,提示:根据用户特点选择用户关心的相关监控项提示用户。
在确认设备类型和监控项之后,本实施例还提供了相关监控项的提示,用于对该设备和该监控项针对该运维人员经常关注的一些内容进行个性化提示,提高监控质量。
子步骤6,推送,将需要展示和播报的信息推送至语音播报模块和UI展示模块。
逻辑处理模块根据用户的意图和相关数据和参数向监控运维平台发起请求并获取处理结果和返回数据。之后处理相关的结果和返回数据,需要屏幕向用户展示的,处理成合适的数据结构向UI展示模块提交并在屏幕进行展示,需要语音播报的,处理成文字信息然后调用语音播报模块向用户进行播报。
以“我想查看交换机的CPU利用率”为例来说明整个的语音交互过程。由于交换机以及CPU利用率分属于设备类型库和监控项库,用户说法可以解析为“我想查看某种设备的某一监控项”,而在监控运维库中规划了此类的说法,因此可以确定用户的意图是查看监控项信息,设备类型为交换机,监控项信息为CPU利用率。逻辑处理模块会以所述意图和相关参数向监控运维平台获取相关数据。但由于交换机类型下可能存在多个交换机,逻辑处理模块会首先获取交换机类型的设备列表,并提示用户选择要查看的具体设备,之后再根据用户所选择的设备以及监控项信息向所述平台获取相关用户指定设备的指定监控项的最新数据,然后对用户进行播报和展示。
最后应说明的是,以上仅用以说明本发明的技术方案而非限制,尽管参照较佳布置方案对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案(比如智能监控平台的形式、各种公式的运用、步骤的先后顺序等)进行修改或者等同替换,而不脱离本发明技术方案的精神和范围。
Claims (5)
1.一种用于IT监控运维的智能语音系统,其特征在于,包括:与被监控设备依次连接的智能监控运维平台、监控运维APP、意图APP;所述的监控运维APP包括:消息接收模块、逻辑处理模块、UI展示模块、故障预测模块、监控运维意图库、设备类型库和告警等级库,所述的意图APP包括:语音播报模块,语音识别模块;
所述的智能监控运维平台,用于定时从被监控设备采集监控项数据,响应故障预警的指令对所指定的设备监控项进行历史数据处理,利用不同监控项的故障预测模型对用户最关心的监控项进行故障的预警,并与监控APP进行数据交互和操作以及各种消息发布;
所述的消息接收模块:通过私有协议与智能监控运维平台连接,用于订阅和接受来自所述智能监控平台的消息;
所述的逻辑处理模块:与智能监控运维平台连接,用于将用户意图和设备参数转化为请求和参数从所述平台获取相应的处理结果和返回数据,并将处理结果和返回数据进行逻辑处理交由语音播放模块和UI展示模块用于播放和展示;
所述的UI展示模块,用于将所述逻辑处理模块的处理结果在界面进行展示,并支持用户通过触屏操作来实现查看数据、操作设备和系统设置;
所述的监控运维意图库,用于为相关的信息查询、设备及其监控项和告警相关的操作、定期巡检以及如网络管理、文件系统、存储管理、带宽限制和备份等高级操作的用户意图集;
所述的设备类型库,用于存储被监控设备中的各类设备的参数;
所述的告警等级库,用于存储告警信息的等级,将告警信息等级划分为:信息等级、警告等级、错误等级、紧急等级和灾难等级;
所述的故障预警模块,用于记录用户的语音交互操作和触屏操作然后通过基于时变权重的数据统计方法计算获得用户的关心度列表,结合其他相似用户的关心度推荐列表,以频率加权的混合算法来计算获得最终的预警管理表,并向逻辑处理模块发送预测指令经由监控运维平台按照预测管理表对用户最关心的监控项信息进行预测,并对达到预警标准的预警信息进行播报和展示;
所述的语音播报模块,用于将符合用户设置的设备告警信息,用户关心度最高的设备预警消息以及其他系统消息以自然人声的方式对用户进行播报;
所述的语音识别模块,用于将经由麦克风收到的用户说法,理解和识别为用户意图和设备参数信息,交由逻辑处理模块进行处理。
2.一种使用权利要求1所述系统的用于IT监控运维的智能语音提示方法,其特征在于,所述方法的步骤如下:
告警和处理过程:
步骤1,用户设置:监控开始之前,用户或进行设置,以确定接收哪些被监控设备的哪个告警等级的告警信息,或默认接收所有告警信息;
步骤2,发送告警信息列表:智能监控运维平台对被监控设备进行检测轮询,将所有被检测设备发生的故障不论大小全部列入告警信息列表中,并将告警信息列表发送至监控运维APP的消息接收模块;所述的告警信息列表除告警信息外,还包括预测告警信息;
步骤3,告警筛选:筛选出一条告警等级最高的记录,准备播报和展示;
步骤4,告警判断:判断欲播报告警记录是否符合用户设置,如果符合则进入下一步,如果不符合则回到步骤3,重新进行筛选;
步骤5,播报展示:通过语言进行告警播报,同时通过显示屏进行告警故障显示;
步骤6,交互:或通过语音识别模块接收运维人员的语音指令,并将语音指令转化为文字,或通过UI展示模块的触摸屏操作获取操作指令;
步骤7,运维指令判断:对于文字则将文字与监控运维意图库进行比对,判断是否为运维指令,对于触摸屏操作则直接判断是否为运维指令,如果是则进入下一步骤,如果否则忽略;
步骤8,执行运维指令:获取收到的运维指令的相关参数,提交给逻辑处理模块,经逻辑处理后发送至智能监控运维平台,通过智能监控运维平台对被监控设备进行维护;
步骤9,维护返回:智能监控运维平台维护被监控设备之后,将维护处理结果和数据返回给逻辑处理模块,逻辑处理模块交由语音播报模块进行播报并通过UI模块进行展示;
故障预警训练过程:
步骤01,记录用户历史操作:列表记录用户的语音交互操作和触屏操作的内容;
步骤02,数据筛选和清理:定时对用户历史操作记录进行筛选和清理,将其中不涉及监控项的操作剔除。
步骤03,数据分类:根据监控项类型,对用户历史操作进行分类处理;
步骤04,计算关心度排序表和模型训练;将用户历史操作记录带入故障预测模型进行用户关心度计算和模型训练,根据监控项目的重要程度以及操作时间总和分析计算用户的关心度排序表;关心度计算公式如下:
其中:i为监控项的序列号,i=1,2,……,n;n为监控项个数,为正整数;Gi为用户对第i个监控项的关心度评分,Zi为第i个监控项的重要程度;Qi为遵循遗忘曲线计算所得的时间权重值;T为参考历史数据的最大时长周期,ti为第i个监控项的历史数据点所在时间与当前时间的时长差距,λ为遗忘参数;
步骤05,确定预测管理表:结合智能监控运维平台推送的其他相似用户的关心度排序表确定本系统的预测管理表;
在线模式(即可以连通外网)时,通过与第三方语音技术平台的交互实现语言的识别和合成;离线模式(无法连通外网)时,通过访问本地资源库实现简单的语音识别和合成。因此,智能语音系统并不依赖于外部网络,可以在内外网严格隔离的情况下,在内网环境中正常运行。
步骤06,使用预测管理表进行故障预测:向逻辑处理模块发送预测管理表和预测指令,智能监控运维平台按照预测管理表进行故障预测;
故障预测过程:
步骤A1,记录历史数据:记录系统各个监控项的运行数据;
步骤A2,确定预测顺序:按照预测管理表中的排列顺序依次对需要进行故障预测的监控项进行预测计算;
步骤A3,优化调节因子:如果是第一次预测则将调节因子初始为1,如果为第二次以上的预测则将上次的预测值与实际数字进行对比,以高斯分布误差反馈优化调节因子,从而优化预测模型;
步骤A4,预测计算:通过基于时变权重的优化后的预测模型对一定时期的历史数据进行预测计算;
步骤A5,判断是否预报警:将计算获得的预测值与告警阈值比较,大于告警阈值则进行预报警,反之则不进行预报警。
5.根据权利要求2-4所述的方法,其特征在于,所述的语音指令的识别包括如下子步骤:
子步骤1,唤醒:收到语音指令后首先语音识别唤醒,启动语音识别,语音识别优先使用在线语音识别,如果在离线状态下则使用本地语音识别;
子步骤2,解析意图:语音识别启动之后解析语音指令的意图,首先判断是否为监控运维意图,如果是则在监控运维意图库中查找语音指令所要求的监控项,分析指令中所针对的设备类型,如果不是则进行其他逻辑操作;
子步骤3,查找:在设备类型库和监控运维意图库中监控项中查找语音指令中所要求的设备类型和监控项;
子步骤4,提取参数和数据:根据设备类型和监控项逻辑处理模块以所述意图和相关参数向监控运维平台要求相关数据;
子步骤5,提示:根据用户特点选择用户关心的相关监控项提示用户;
子步骤6,推送,将需要展示和播报的信息推送至语音播报模块和UI展示模块。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011155034.XA CN112383412B (zh) | 2020-10-26 | 2020-10-26 | 一种用于it监控运维的智能语音系统和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011155034.XA CN112383412B (zh) | 2020-10-26 | 2020-10-26 | 一种用于it监控运维的智能语音系统和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112383412A true CN112383412A (zh) | 2021-02-19 |
CN112383412B CN112383412B (zh) | 2022-04-22 |
Family
ID=74577613
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011155034.XA Active CN112383412B (zh) | 2020-10-26 | 2020-10-26 | 一种用于it监控运维的智能语音系统和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112383412B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113468022A (zh) * | 2021-07-01 | 2021-10-01 | 丁鹤 | 一种对产品集中监控的自动化运维方法 |
CN113808375A (zh) * | 2021-09-18 | 2021-12-17 | 重庆允成互联网科技有限公司 | 一种基于不同流程状态的可视化语音播报方法 |
CN114050963A (zh) * | 2021-10-28 | 2022-02-15 | 上海市安装工程集团有限公司 | 一种数据中心设备运维管理现场定位找寻系统 |
CN114359271A (zh) * | 2022-03-10 | 2022-04-15 | 天津市北海通信技术有限公司 | 一种列车显示设备图像播放质量的检测方法和装置 |
CN115001948A (zh) * | 2022-08-05 | 2022-09-02 | 深圳市博科思智能股份有限公司 | 基于数据分析的设备健康状态检测方法及相关装置 |
CN115311826A (zh) * | 2022-07-28 | 2022-11-08 | 广东电力信息科技有限公司 | 一种基于智能识别的语音平台电力灾情预警方法 |
CN115330002A (zh) * | 2022-10-14 | 2022-11-11 | 山东力拓智能科技有限公司 | 智能建筑运维管理系统 |
CN117033592A (zh) * | 2023-08-09 | 2023-11-10 | 北京百度网讯科技有限公司 | 运维处理方法、装置、系统、电子设备及存储介质 |
CN117615281A (zh) * | 2024-01-24 | 2024-02-27 | 赣州得辉达科技有限公司 | 基于物联网的智能音响快速切换方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015043441A1 (zh) * | 2013-09-24 | 2015-04-02 | 许继集团有限公司 | 基于多场景分析的智能告警推理方法 |
CN106504753A (zh) * | 2015-09-07 | 2017-03-15 | 上海隆通网络系统有限公司 | 一种在it运维管理系统中的语音识别方法及系统 |
CN107045469A (zh) * | 2017-03-28 | 2017-08-15 | 北京精强远科技有限公司 | 一种智能语音报警系统和方法 |
CN109165136A (zh) * | 2018-07-25 | 2019-01-08 | 平安科技(深圳)有限公司 | 终端运行数据的监控方法、终端设备及介质 |
-
2020
- 2020-10-26 CN CN202011155034.XA patent/CN112383412B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015043441A1 (zh) * | 2013-09-24 | 2015-04-02 | 许继集团有限公司 | 基于多场景分析的智能告警推理方法 |
CN106504753A (zh) * | 2015-09-07 | 2017-03-15 | 上海隆通网络系统有限公司 | 一种在it运维管理系统中的语音识别方法及系统 |
CN107045469A (zh) * | 2017-03-28 | 2017-08-15 | 北京精强远科技有限公司 | 一种智能语音报警系统和方法 |
CN109165136A (zh) * | 2018-07-25 | 2019-01-08 | 平安科技(深圳)有限公司 | 终端运行数据的监控方法、终端设备及介质 |
Non-Patent Citations (1)
Title |
---|
杨战胜等: "基于移动运维IT综合监控系统实现研究", 《信息通信》 * |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113468022A (zh) * | 2021-07-01 | 2021-10-01 | 丁鹤 | 一种对产品集中监控的自动化运维方法 |
CN113468022B (zh) * | 2021-07-01 | 2024-02-09 | 丁鹤 | 一种对产品集中监控的自动化运维方法 |
CN113808375A (zh) * | 2021-09-18 | 2021-12-17 | 重庆允成互联网科技有限公司 | 一种基于不同流程状态的可视化语音播报方法 |
CN114050963A (zh) * | 2021-10-28 | 2022-02-15 | 上海市安装工程集团有限公司 | 一种数据中心设备运维管理现场定位找寻系统 |
CN114050963B (zh) * | 2021-10-28 | 2024-05-17 | 上海市安装工程集团有限公司 | 一种数据中心设备运维管理现场定位找寻系统 |
CN114359271A (zh) * | 2022-03-10 | 2022-04-15 | 天津市北海通信技术有限公司 | 一种列车显示设备图像播放质量的检测方法和装置 |
CN115311826A (zh) * | 2022-07-28 | 2022-11-08 | 广东电力信息科技有限公司 | 一种基于智能识别的语音平台电力灾情预警方法 |
CN115311826B (zh) * | 2022-07-28 | 2023-09-22 | 广东电力信息科技有限公司 | 一种基于智能识别的语音平台电力灾情预警方法 |
CN115001948B (zh) * | 2022-08-05 | 2022-10-21 | 深圳市博科思智能股份有限公司 | 基于数据分析的设备健康状态检测方法及相关装置 |
CN115001948A (zh) * | 2022-08-05 | 2022-09-02 | 深圳市博科思智能股份有限公司 | 基于数据分析的设备健康状态检测方法及相关装置 |
CN115330002A (zh) * | 2022-10-14 | 2022-11-11 | 山东力拓智能科技有限公司 | 智能建筑运维管理系统 |
CN115330002B (zh) * | 2022-10-14 | 2023-01-31 | 山东力拓智能科技有限公司 | 智能建筑运维管理系统 |
CN117033592A (zh) * | 2023-08-09 | 2023-11-10 | 北京百度网讯科技有限公司 | 运维处理方法、装置、系统、电子设备及存储介质 |
CN117615281A (zh) * | 2024-01-24 | 2024-02-27 | 赣州得辉达科技有限公司 | 基于物联网的智能音响快速切换方法及系统 |
CN117615281B (zh) * | 2024-01-24 | 2024-04-12 | 赣州得辉达科技有限公司 | 基于物联网的智能音响快速切换方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112383412B (zh) | 2022-04-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112383412B (zh) | 一种用于it监控运维的智能语音系统和方法 | |
US11860913B2 (en) | Streaming real-time dialog management | |
US20220138591A1 (en) | Developing event-specific provisional knowledge graphs | |
WO2015074540A1 (zh) | 页面操作数据处理方法及装置 | |
CA2886421C (en) | Computer-implemented system and method for detecting events for use in an automated call center environment | |
US20150278706A1 (en) | Method, Predictive Analytics System, and Computer Program Product for Performing Online and Offline Learning | |
US9760838B1 (en) | Trend identification and behavioral analytics system and methods | |
JP2021051715A (ja) | 情報プッシュ方法、装置、電子デバイス、記憶媒体、及びプログラム | |
CN103714813A (zh) | 短语辨认系统和方法 | |
JP2023506341A (ja) | 音声コマンド推奨を提供するためのシステムおよび方法 | |
US20220417342A1 (en) | System and method for pushing information, and device and storage medium thereof | |
EP4297030A2 (en) | Polling questions for a conference call discussion | |
US20220060526A1 (en) | Systems and methods for dynamic allocation of computing resources for microservice architecture type applications | |
US20180336915A1 (en) | Mechanism and instrumentation for metering conversations | |
CN113704063A (zh) | 一种云手机的性能监控方法、装置、设备及存储介质 | |
CN112767916A (zh) | 智能语音设备的语音交互方法、装置、设备、介质及产品 | |
CN113672748A (zh) | 多媒体信息播放方法及装置 | |
US11206236B2 (en) | Systems and methods to prioritize chat rooms using machine learning | |
US20230169272A1 (en) | Communication framework for automated content generation and adaptive delivery | |
CN113572841B (zh) | 信息推送方法及装置 | |
CN106375363A (zh) | 社交应用客户端中消除消息提醒的方法、系统和装置 | |
WO2022150573A1 (en) | Providing ambient information based on learned user context and interaction, and associated systems and devices | |
US20230009182A1 (en) | System for identifying and diagnosing a degradation of a performance metric associated with providing a service | |
JP6994531B2 (ja) | コールセンタ装置、処理方法及びプログラム | |
US11829412B2 (en) | Methods, systems, and media for determining a coverage score for a system that receives a stream of requests |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |