CN114971530A - 基于自然语言处理的协同运维方法及装置 - Google Patents

基于自然语言处理的协同运维方法及装置 Download PDF

Info

Publication number
CN114971530A
CN114971530A CN202210463041.9A CN202210463041A CN114971530A CN 114971530 A CN114971530 A CN 114971530A CN 202210463041 A CN202210463041 A CN 202210463041A CN 114971530 A CN114971530 A CN 114971530A
Authority
CN
China
Prior art keywords
target
corpus
processing
maintenance
processed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210463041.9A
Other languages
English (en)
Inventor
易存道
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baolande Software Co ltd
Original Assignee
Beijing Baolande Software Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baolande Software Co ltd filed Critical Beijing Baolande Software Co ltd
Priority to CN202210463041.9A priority Critical patent/CN114971530A/zh
Publication of CN114971530A publication Critical patent/CN114971530A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • Marketing (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Tourism & Hospitality (AREA)
  • Evolutionary Computation (AREA)
  • Quality & Reliability (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Operations Research (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Economics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供一种基于自然语言处理的协同运维方法及装置,该方法包括:接收待处理工单,并将所述待处理工单输入目标模型,得到分析结果;根据所述分析结果指示的处理部门确定目标成员,并创建包含所述目标成员的目标群组;向所述目标群组中的群组成员发送处理通知,通知所述目标成员处理所述待处理工单指示的待处理运维工作;其中,所述目标模型为:自然语言处理模型基于包含历史运维日志以及对应的工作交流记录的训练样本训练后得到的。本申请提供的基于自然语言处理的协同运维方法及装置,用于在故障发生后,简化运维过程中确定对应的处理人员的沟通过程,提高运维效率。

Description

基于自然语言处理的协同运维方法及装置
技术领域
本申请涉及运维故障处理领域,尤其涉及一种基于自然语言处理的协同运维方法及装置。
背景技术
在移动端的智能运维领域中,当故障发生后,运维人员会对故障进行分析和处理,以保证系统的正常运行。
在相关技术中的故障处理方法包括:运维平台的监控模块能够针对一系列可能发生的故障进行监控,自动创建相应的故障工单,或者接收用户手动创建的故障工单,然后将故障工单发送至运维平台的处理模块,由相关人员对其进行处理。
然而,在相关技术中,运维平台的处理模块在接收到故障工单后,该故障工单的具体处理人员需要由人工进行确认,并通过聊天工具通知处理人员进行处理,处理效率较低。
发明内容
本申请的目的是提供一种基于自然语言处理的协同运维方法及装置,用于在故障发生后,简化运维过程中确定对应的处理人员的沟通过程,提高运维效率。
本申请提供一种基于自然语言处理的协同运维方法,包括:
接收待处理工单,并将所述待处理工单输入目标模型,得到分析结果;根据所述分析结果指示的处理部门确定目标成员,并创建包含所述目标成员的目标群组;向所述目标群组中的群组成员发送处理通知,通知所述目标成员处理所述待处理工单指示的待处理运维工作;其中,所述目标模型为:自然语言处理模型基于包含历史运维日志以及对应的工作交流记录的训练样本训练后得到的。
可选地,所述接收待处理工单,并将所述待处理工单输入自然语言处理模型,得到分析结果之前,所述方法还包括:根据历史运维日志以及对应的工作交流记录,创建语料库;对所述语料库中的语料进行预处理,并将预处理后的语料转换为特征向量,得到第一特征集合;按照预设特征选择方法,从所述第一特征集合中筛选出能够提升模型的训练过程的相关特征,并得到第二特征集合。
可选地,所述对所述语料库中的语料进行预处理,包括:对所述语料库中的语料进行语料清洗,去除所述语料库中的无关语料以及重复语料;对进行语料清洗后的语料库中的每个语料进行分词处理;所述分词处理用于将文本分割为词或词语;对每个分词后的语料进行词性标注;词性标注用于对词或词语添加词类标签;所述词类标签包括以下至少一项:形容词、动词、名词;对每个分词后的语料执行去停用词操作。
可选地,所述按照预设特征选择方法,从所述第一特征集合中筛选出能够提升模型的训练过程的相关特征,并得到第二特征集合之后,所述方法还包括:基于所述第二特征集合构建目标样本集;使用所述目标样本集对所述自然语言处理模型进行训练,得到所述目标模型。
可选地,所述向所述目标群组中的群组成员发送处理通知,通知所述目标成员处理所述待处理工单指示的待处理运维工作之后,所述方法还包括:接收目标群组成员在所述目标群组中的发送的群组消息;对所述群组消息执行自然语言处理,将所述群组消息转化为查询指令,并向所述目标群组发送所述查询指令所查询的目标信息;其中,所述目标群组成员为所述目标群组中的任一群组成员。
本申请还提供一种基于自然语言处理的协同运维装置,包括:
故障分析模块,用于接收待处理工单,并将所述待处理工单输入目标模型,得到分析结果;群组管理模块,用于根据所述分析结果指示的处理部门确定目标成员,并创建包含所述目标成员的目标群组;消息通知模块,用于向所述目标群组中的群组成员发送处理通知,通知所述目标成员处理所述待处理工单指示的待处理运维工作;其中,所述目标模型为:自然语言处理模型基于包含历史运维日志以及对应的工作交流记录的训练样本训练后得到的。
可选地,所述装置还包括:创建模块、处理模块和特征筛选模块;所述创建模块,用于根据历史运维日志以及对应的工作交流记录,创建语料库;所述处理模块,用于对所述语料库中的语料进行预处理,并将预处理后的语料转换为特征向量,得到第一特征集合;所述特征筛选模块,用于按照预设特征选择方法,从所述第一特征集合中筛选出能够提升模型的训练过程的相关特征,并得到第二特征集合。
可选地,所述处理模块,具体用于对所述语料库中的语料进行语料清洗,去除所述语料库中的无关语料以及重复语料;所述处理模块,具体还用于对进行语料清洗后的语料库中的每个语料进行分词处理;所述分词处理用于将文本分割为词或词语;所述处理模块,具体还用于对每个分词后的语料进行词性标注;词性标注用于对词或词语添加词类标签;所述词类标签包括以下至少一项:形容词、动词、名词;所述处理模块,具体还用于对每个分词后的语料执行去停用词操作。
可选地,所述装置还包括:模型训练模块;所述构建模块,还用于基于所述第二特征集合构建目标样本集;所述模型训练模块,用于使用所述目标样本集对所述自然语言处理模型进行训练,得到所述目标模型。
可选地,所述装置还包括:接收模块;所述接收模块和发送模块,用于接收目标群组成员在所述目标群组中的发送的群组消息;所述处理模块,还用于对所述群组消息执行自然语言处理,将所述群组消息转化为查询指令;所述发送模块,用于向所述目标群组发送所述查询指令所查询的目标信息。
本申请还提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现如上述任一种所述基于自然语言处理的协同运维方法的步骤。
本申请还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述基于自然语言处理的协同运维方法的步骤。
本申请还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述基于自然语言处理的协同运维方法的步骤。
本申请提供的基于自然语言处理的协同运维方法及装置,在监控平台发出待处理工单后,接收待处理工单,并将待处理工单输入目标模型,得到分析结果。之后,根据所述分析结果指示的处理部门确定目标成员,并创建包含所述目标成员的目标群组。最后,向所述目标群组中的群组成员发送处理通知,通知所述目标成员处理所述待处理工单指示的待处理运维工作。使得运维系统能够在接收到待处理工单后,由系统根据该待处理工单自动判断对应的处理人员,创建包含处理人员的群组,并在群组中对其进行通知,简化了运维过程中确定对应的处理人员的沟通过程,提高了运维效率。
附图说明
为了更清楚地说明本申请或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请提供的基于自然语言处理的协同运维方法的流程示意图;
图2是本申请提供的故障处理流程示意图;
图3是本申请提供的基于自然语言处理的协同运维装置的结构示意图;
图4是本申请提供的电子设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请中的附图,对本申请中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
运维平台的监控模块能够针对一系列可能发生的故障进行监控,自动创建相应的故障工单,或者接收用户手动创建的故障工单,然后将故障工单发送至运维平台的处理模块,由相关人员对其进行处理。然而,在相关技术中,运维平台的处理模块在接收到故障工单后,该故障工单的具体处理人员需要由人工进行确认,并通过聊天工具通知处理人员进行处理,处理效率较低。
为了解决相关技术中存在的因为沟通效率低下影响运维故障处理效率的技术问题,本申请实施例提供了一种基于自然语言处理的协同运维方法,能够在故障发生后,自动判断相关处理人员,并以群组的方式通知其进行处理,减少了人员确认及沟通过程中浪费的时间,提高了运维故障的处理效率。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的基于自然语言处理的协同运维方法进行详细地说明。
如图1所示,本申请实施例提供的一种基于自然语言处理的协同运维方法,该方法可以包括下述步骤101至步骤103:
步骤101、接收待处理工单,并将所述待处理工单输入目标模型,得到分析结果。
其中,所述目标模型为:自然语言处理模型基于包含历史运维日志以及对应的工作交流记录的训练样本训练后得到的。
示例性地,上述待处理工单可以为运维平台的监控模块在故障发生时生成的,也可以是由用户在遇到无法解决的问题时手动创建的。
示例性地,在接收到上述待处理工单后,将该待处理工单输入目标模型,由目标模型对该待处理工单进行分析,确定能够对该待处理工单进行处理的部门以及目标成员。
示例性地,上述目标模型为使用包含历史运维日志以及对应的工作交流记录的训练样本对自然语言处理模型训练后得到的。
示例性地,上述分析结果可以包括以下至少一项:待处理工单对应故障的产生原因,故障的类型,故障的处理部分,故障的处理人员。
步骤102、根据所述分析结果指示的处理部门确定目标成员,并创建包含所述目标成员的目标群组。
步骤103、向所述目标群组中的群组成员发送处理通知,通知所述目标成员处理所述待处理工单指示的待处理运维工作。
示例性地,上述目标群组可以为企微应用中创建的群组,运维平台可以通过企微应用的网络钩子webhook地址,向目标群组发送上述处理通知。
需要说明的是,webhook是一个应用程序接口(application programminginterface,API),是企微服务API的使用范式之一,也被成为反向API,即前端不主动发送请求,完全由后端推送。举例说明,例如,通讯录成员发布了一条朋友圈,后端将该消息推送给所有其他好友的客户端,就是webhook的典型场景。
简单来说,webhook就是一个接收HTTP-POST(或GET,PUT, DELETE)的URL,一个实现了webhook的API提供商就是在当事件发生的时候会向这个配置好的URL发送一条信息,与请求-响应式不同,使用webhook可以实时接收到变化。
示例性地,在确定能够对该待处理工单进行处理的目标成员之后,创建包含上述目标成员的目标群组,并在目标群组中通知目标成员对该待处理工单进行处理。
需要说明的是,上述目标群组中除包含目标人员之外,还可以包含其他固定成员,例如,上级主管或其他负责人,方便其实时掌握故障处理进度。
举例说明,如图2所示,为采用本申请实施例提供的基于自然语言处理的协同运维方法的故障处理流程:包括:在后台发出告警工单后,运维平台将告警工单输入模型(即上述目标模型),确定相关处理人员,之后,创建包含处理人员的群组(即上述目标群组),并在群组中发布处理通知。
可选地,在本申请实施例中,上述目标成员不仅可以通过该目标群组接收上述待处理工单的处理通知,还可以在该目标群组中通过发送查询指令的方式,查询相关信息。
示例性地,上述步骤103之后,本申请实施例提供的基于自然语言处理的协同运维方法,还可以包括以下步骤104和步骤105:
步骤104、接收目标群组成员在所述目标群组中的发送的群组消息。
步骤105、对所述群组消息执行自然语言处理,将所述群组消息转化为查询指令,并向所述目标群组发送所述查询指令所查询的目标信息。
其中,所述目标群组成员为所述目标群组中的任一群组成员。
示例性地,监控平台在接收到上述群组消息后,可以通过自然语言分析技术将上述群组消息转化为查询指令,并根据该查询指令确定上述目标信息,之后,将该目标信息发送至目标群组中。
在一种可能的方式中,可以使用上述目标模型对上述群组消息进行自然语言处理。
可选地,在本申请实施例中,上述目标模型可以根据以下步骤得到。
示例性地,上述步骤101之前,本申请实施例提供的基于自然语言处理的协同运维方法,还可以包括以下步骤106至步骤108:
步骤106、根据历史运维日志以及对应的工作交流记录,创建语料库。
步骤107、对所述语料库中的语料进行预处理,并将预处理后的语料转换为特征向量,得到第一特征集合。
步骤108、按照预设特征选择方法,从所述第一特征集合中筛选出能够提升模型的训练过程的相关特征,并得到第二特征集合。
示例性地,上述历史运维日志可以包括:故障所在资源、发生故障的设备的网际互连协议(Internet Protocol,IP)地址,故障处理部门,故障处理结果等。
示例性地,可以根据历史运维日志对应的工作交流记录,确定每个故障的具体处理人员。
需要说明的是,上述语料,即语言材料,是构成语料库的基本单元。上述语料可以为文本,并将文本中的上下文关系作为实际沟通过程的上下文关系的替代品。包含多个文本的文本集合称为语料库,按语料来源,可以将语料分为以下两种:
1、已有语料:通过对纸质或者电子文本资料进行电子化后得到的语料库,包括历史运维日志、工作交流记录、企业知识库以及新增相关交流信息。
2、外部获取的语料:国内外标准开放的数据集或通过爬虫抓取到的文本集合。
示例性地,在根据历史运维日志以及对应的工作交流记录创建语料库之后,需要对语料进行预处理。
示例性地,对语料的预处理过程可以包括以下步骤,即上述步骤 107可以包括以下步骤107a1至步骤107a4:
步骤107a1、对所述语料库中的语料进行语料清洗,去除所述语料库中的无关语料以及重复语料。
步骤107a2、对进行语料清洗后的语料库中的每个语料进行分词处理。
其中,所述分词处理用于将文本分割为词或词语。
步骤107a3、对每个分词后的语料进行词性标注。
其中,词性标注用于对词或词语添加词类标签;所述词类标签包括以下至少一项:形容词、动词、名词。
步骤107a4、对每个分词后的语料执行去停用词操作。
示例性地,上述语料清洗过程包括:在语料中找到运维交流的内容,将不感兴趣、视为噪音的内容清洗删除。例如,对于原始文本执行提取标题、摘要、正文信息等操作,对于爬虫获取的文本:执行去除广告、标签、HTML、JS等代码和注释等操作。
常见数据清洗方式包括人工去重、对齐、删除和标注等,或规则提取内容、正则表达式匹配、根据词性和命名实体提取,编写脚本或代码批处理等。
示例性地,上述分词是指将短文本和长文本处理为最小单位粒度(词或词语)的过程。常见方法包括:基于字符串匹配的分词方法、基于理解的分词方法、基于统计的分词方法和基于规则的分词方法。分词难点在于歧义识别和新词识别,例如,“羽毛球拍卖完了”,这个可以切分成“羽毛|球拍|卖|完|了”,也可切分成“羽毛球|拍卖|完|了”,在实践中需要结合上下文进行分词。
示例性地,上述词性标注包括:对每个词或词语打上形容词、动词、名词等词类标签,是一个经典的序列标注问题,有助于在后面的处理中融入更多有用的语言信息。
示例性地,上述去停用词:去除标点符号、语气、人称等对文本特征没有任何贡献的字词。
示例性地,在对上述语料库中的语料进行预处理后,需要将各个分词转化为特征向量,并得到第一特征集合。
示例性地,将各个分词转化为特征向量的过程中所使用的特征工程包括以下两种常用表示模型:
1、词袋模型
词袋模型(bag of word,BOW):不考虑词语原本在句子中的顺序,直接将每一个词语或者符号统一放置在一个集合中,然后按照计数的方式对出现的次数进行统计。统计词频是最基本的方式,词频- 逆文本频率指数(term frequency–inverse documentfrequency,TF-IDF) 是词袋模型的一个经典用法。
2、词向量
词向量是一种将字、词语转换为向量矩阵的计算模型,特征提取方法包括:独热码One-Hot和词转换为向量(word to vector,Word2Vec)。
One-Hot:把每个词表示为一个很长的向量。这个向量的维度是词表大小,其中绝大多数元素为0,只有一个维度的值为1,这个维度就代表了当前的词。eg:[0 0 0 0 0 0 00 1 0 0 0 0...0]。
Word2Vec:其主要包含两个模型:跳字模型(Skip-Gram)和连续词袋模型(Continuous Bag of Words,简称CBOW),以及两种高效训练的方法:负采样(NegativeSampling)和层序Softmax(Hierarchical Softmax)。值得一提的是,Word2Vec词向量可以较好地表达不同词之间的相似和类比关系。
示例性地,通过上述特征工程将分词后得到的词或词语转换为特征向量后,还需要通过特征选择,筛选出合适的、表达能力强的特征。常见的特征选择方法类型包括:过滤式Filter方法、包裹式Wrapper方法、嵌入式Embedded方法。
示例性地,通过上述特征选择方法,可以从所述第一特征集合中筛选出能够提升模型的训练过程的相关特征,并得到第二特征集合。
进一步地,在得到上述第二特征集合后,可以基于该第二特征集合构建目标样本集,并使用该目标样本集对上述自然语言处理模型进行训练。
示例性地,上述步骤108之后,本申请实施例提供的基于自然语言处理的协同运维方法,还可以包括以下步骤109和步骤110:
步骤109、基于所述第二特征集合构建目标样本集。
步骤110、使用所述目标样本集对所述自然语言处理模型进行训练,得到所述目标模型。
示例性地,对于不同的应用需求,需要使用不同的模型。传统的有监督和无监督等机器学习模型:k最邻近分类算法(k-Nearest Neighbor,KNN)、支持向量机(SupportVector Machine,SVM)、朴素贝叶斯法Naive Bayes、决策树、梯度提升决策树(GradientBoosting Decision Tree,GBDT)、K均值聚类算法K-means等模型。深度学习模型:卷积神经网络(Convolutional Neural Networks,CNN)、循环神经网络(Recurrent NeuralNetwork,RNN)、长短期记忆人工神经网络(Long Short-Term Memory,LSTM)、快速文本分类FastText、卷文本积神经网络TextCNN等模型。
示例性地,在该流程中关键的自然语言处理(Natural Language Processing,NLP)使用的是词典匹配算法和循环神经网络算法RNN:前者适用于已有的命令转化,如读取到命令中的“查询XX信息”、“建立XX相关群组”等关键词时,自动能够匹配到词典内已有命令上,快速做出反应;词典内未匹配到的命令则采用后者,类似人类文本浏览阅读,一次输入一个单词,然后不停的循环输入单词,直到整个句子结束。首先将一个文字经过词嵌入处理转换成向量x,然后传入给神经网络参数矩阵A,输出状态向量h,接着再输入下一个文字数据,如此反复的循环处理文字便是RNN的主要思想。其中每个输出状态h 仅包含前面所有单词的信息,最后的输出状态h则包含整个句子的信息,再将其与词典进行匹配。整个RNN只有一个参数矩阵A,右边的是将左边网络的展开。由于此场景下的运维命令较为简单,命令包含的关键词含量高,停用词少,聊天框上方也有命令提示语句,所以使用了这两种适合处理简短的文字信息。
示例性地,在得到上述目标模型后,便可以使用该目标模型对待处理工单进行分析处理,确定故障处理的相关人员。
本申请实施例提供的基于自然语言处理的协同运维方法,在运维系统能够在接收到待处理工单后,由系统根据该待处理工单自动判断对应的处理人员,创建包含处理人员的群组,并在群组中对其进行通知,简化了运维过程中确定对应的处理人员的沟通过程,提高了运维效率。
需要说明的是,本申请实施例提供的基于自然语言处理的协同运维方法,执行主体可以为基于自然语言处理的协同运维装置,或者该基于自然语言处理的协同运维装置中的用于执行基于自然语言处理的协同运维方法的控制模块。本申请实施例中以基于自然语言处理的协同运维装置执行基于自然语言处理的协同运维方法为例,说明本申请实施例提供的基于自然语言处理的协同运维装置。
需要说明的是,本申请实施例中,上述各个方法附图所示的。基于自然语言处理的协同运维方法均是以结合本申请实施例中的一个附图为例示例性的说明的。具体实现时,上述各个方法附图所示的基于自然语言处理的协同运维方法还可以结合上述实施例中示意的其它可以结合的任意附图实现,此处不再赘述。
下面对本申请提供的基于自然语言处理的协同运维装置进行描述,下文描述的与上文描述的基于自然语言处理的协同运维方法可相互对应参照。
图3为本申请一实施例提供的基于自然语言处理的协同运维装置的结构示意图,如图3所示,具体包括:
故障分析模块301,用于接收待处理工单,并将所述待处理工单输入目标模型,得到分析结果;群组管理模块302,用于根据所述分析结果指示的处理部门确定目标成员,并创建包含所述目标成员的目标群组;消息通知模块303,用于向所述目标群组中的群组成员发送处理通知,通知所述目标成员处理所述待处理工单指示的待处理运维工作;其中,所述目标模型为:自然语言处理模型基于包含历史运维日志以及对应的工作交流记录的训练样本训练后得到的。
可选地,所述装置还包括:创建模块、处理模块和特征筛选模块;所述创建模块,用于根据历史运维日志以及对应的工作交流记录,创建语料库;所述处理模块,用于对所述语料库中的语料进行预处理,并将预处理后的语料转换为特征向量,得到第一特征集合;所述特征筛选模块,用于按照预设特征选择方法,从所述第一特征集合中筛选出能够提升模型的训练过程的相关特征,并得到第二特征集合。
可选地,所述处理模块,具体用于对所述语料库中的语料进行语料清洗,去除所述语料库中的无关语料以及重复语料;所述处理模块,具体还用于对进行语料清洗后的语料库中的每个语料进行分词处理;所述分词处理用于将文本分割为词或词语;所述处理模块,具体还用于对每个分词后的语料进行词性标注;词性标注用于对词或词语添加词类标签;所述词类标签包括以下至少一项:形容词、动词、名词;所述处理模块,具体还用于对每个分词后的语料执行去停用词操作。
可选地,所述装置还包括:模型训练模块;所述构建模块,还用于基于所述第二特征集合构建目标样本集;所述模型训练模块,用于使用所述目标样本集对所述自然语言处理模型进行训练,得到所述目标模型。
可选地,所述装置还包括:接收模块;所述接收模块和发送模块,用于接收目标群组成员在所述目标群组中的发送的群组消息;所述处理模块,还用于对所述群组消息执行自然语言处理,将所述群组消息转化为查询指令;所述发送模块,用于向所述目标群组发送所述查询指令所查询的目标信息。
本申请提供的基于自然语言处理的协同运维装置,在运维系统能够在接收到待处理工单后,由系统根据该待处理工单自动判断对应的处理人员,创建包含处理人员的群组,并在群组中对其进行通知,简化了运维过程中确定对应的处理人员的沟通过程,提高了运维效率。
图4示例了一种电子设备的实体结构示意图,如图4所示,该电子设备可以包括:处理器(processor)410、通信接口(Communications Interface)420、存储器(memory)430和通信总线440,其中,处理器410,通信接口420,存储器430通过通信总线440完成相互间的通信。处理器410可以调用存储器430中的逻辑指令,以执行基于自然语言处理的协同运维方法,该方法包括:接收待处理工单,并将所述待处理工单输入目标模型,得到分析结果;根据所述分析结果指示的处理部门确定目标成员,并创建包含所述目标成员的目标群组;向所述目标群组中的群组成员发送处理通知,通知所述目标成员处理所述待处理工单指示的待处理运维工作;其中,所述目标模型为:自然语言处理模型基于包含历史运维日志以及对应的工作交流记录的训练样本训练后得到的。
此外,上述的存储器430中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本申请还提供一种计算机程序产品,所述计算机程序产品包括存储在计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的基于自然语言处理的协同运维方法,该方法包括:接收待处理工单,并将所述待处理工单输入目标模型,得到分析结果;根据所述分析结果指示的处理部门确定目标成员,并创建包含所述目标成员的目标群组;向所述目标群组中的群组成员发送处理通知,通知所述目标成员处理所述待处理工单指示的待处理运维工作;其中,所述目标模型为:自然语言处理模型基于包含历史运维日志以及对应的工作交流记录的训练样本训练后得到的。
又一方面,本申请还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各提供的基于自然语言处理的协同运维方法,该方法包括:接收待处理工单,并将所述待处理工单输入目标模型,得到分析结果;根据所述分析结果指示的处理部门确定目标成员,并创建包含所述目标成员的目标群组;向所述目标群组中的群组成员发送处理通知,通知所述目标成员处理所述待处理工单指示的待处理运维工作;其中,所述目标模型为:自然语言处理模型基于包含历史运维日志以及对应的工作交流记录的训练样本训练后得到的。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.一种基于自然语言处理的协同运维方法,其特征在于,包括:
接收待处理工单,并将所述待处理工单输入目标模型,得到分析结果;
根据所述分析结果指示的处理部门确定目标成员,并创建包含所述目标成员的目标群组;
向所述目标群组中的群组成员发送处理通知,通知所述目标成员处理所述待处理工单指示的待处理运维工作;
其中,所述目标模型为:自然语言处理模型基于包含历史运维日志以及对应的工作交流记录的训练样本训练后得到的。
2.根据权利要求1所述的方法,其特征在于,所述接收待处理工单,并将所述待处理工单输入自然语言处理模型,得到分析结果之前,所述方法还包括:
根据历史运维日志以及对应的工作交流记录,创建语料库;
对所述语料库中的语料进行预处理,并将预处理后的语料转换为特征向量,得到第一特征集合;
按照预设特征选择方法,从所述第一特征集合中筛选出能够提升模型的训练过程的相关特征,并得到第二特征集合。
3.根据权利要求2所述的方法,其特征在于,所述对所述语料库中的语料进行预处理,包括:
对所述语料库中的语料进行语料清洗,去除所述语料库中的无关语料以及重复语料;
对进行语料清洗后的语料库中的每个语料进行分词处理;所述分词处理用于将文本分割为词或词语;
对每个分词后的语料进行词性标注;词性标注用于对词或词语添加词类标签;所述词类标签包括以下至少一项:形容词、动词、名词;
对每个分词后的语料执行去停用词操作。
4.根据权利要求2或3所述的方法,其特征在于,所述按照预设特征选择方法,从所述第一特征集合中筛选出能够提升模型的训练过程的相关特征,并得到第二特征集合之后,所述方法还包括:
基于所述第二特征集合构建目标样本集;
使用所述目标样本集对所述自然语言处理模型进行训练,得到所述目标模型。
5.根据权利要求1所述的方法,其特征在于,所述向所述目标群组中的群组成员发送处理通知,通知所述目标成员处理所述待处理工单指示的待处理运维工作之后,所述方法还包括:
接收目标群组成员在所述目标群组中的发送的群组消息;
对所述群组消息执行自然语言处理,将所述群组消息转化为查询指令,并向所述目标群组发送所述查询指令所查询的目标信息;
其中,所述目标群组成员为所述目标群组中的任一群组成员。
6.一种基于自然语言处理的协同运维装置,其特征在于,所述装置包括:
故障分析模块,用于接收待处理工单,并将所述待处理工单输入目标模型,得到分析结果;
群组管理模块,用于根据所述分析结果指示的处理部门确定目标成员,并创建包含所述目标成员的目标群组;
消息通知模块,用于向所述目标群组中的群组成员发送处理通知,通知所述目标成员处理所述待处理工单指示的待处理运维工作;
其中,所述目标模型为:自然语言处理模型基于包含历史运维日志以及对应的工作交流记录的训练样本训练后得到的。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:创建模块、处理模块和特征筛选模块;
所述创建模块,用于根据历史运维日志以及对应的工作交流记录,创建语料库;
所述处理模块,用于对所述语料库中的语料进行预处理,并将预处理后的语料转换为特征向量,得到第一特征集合;
所述特征筛选模块,用于按照预设特征选择方法,从所述第一特征集合中筛选出能够提升模型的训练过程的相关特征,并得到第二特征集合。
8.根据权利要求7所述的装置,其特征在于,
所述处理模块,具体用于对所述语料库中的语料进行语料清洗,去除所述语料库中的无关语料以及重复语料;
所述处理模块,具体还用于对进行语料清洗后的语料库中的每个语料进行分词处理;所述分词处理用于将文本分割为词或词语;
所述处理模块,具体还用于对每个分词后的语料进行词性标注;词性标注用于对词或词语添加词类标签;所述词类标签包括以下至少一项:形容词、动词、名词;
所述处理模块,具体还用于对每个分词后的语料执行去停用词操作。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述基于自然语言处理的协同运维方法的步骤。
10.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至5任一项所述基于自然语言处理的协同运维方法的步骤。
CN202210463041.9A 2022-04-28 2022-04-28 基于自然语言处理的协同运维方法及装置 Pending CN114971530A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210463041.9A CN114971530A (zh) 2022-04-28 2022-04-28 基于自然语言处理的协同运维方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210463041.9A CN114971530A (zh) 2022-04-28 2022-04-28 基于自然语言处理的协同运维方法及装置

Publications (1)

Publication Number Publication Date
CN114971530A true CN114971530A (zh) 2022-08-30

Family

ID=82978586

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210463041.9A Pending CN114971530A (zh) 2022-04-28 2022-04-28 基于自然语言处理的协同运维方法及装置

Country Status (1)

Country Link
CN (1) CN114971530A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116483955A (zh) * 2023-06-20 2023-07-25 北京中科朗易科技有限责任公司 基于运维工单的运维方法、装置、设备及可读存储介质
CN117591659A (zh) * 2024-01-18 2024-02-23 卓望数码技术(深圳)有限公司 基于ChatGLM运维场景的信息处理方法、装置、设备及介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116483955A (zh) * 2023-06-20 2023-07-25 北京中科朗易科技有限责任公司 基于运维工单的运维方法、装置、设备及可读存储介质
CN117591659A (zh) * 2024-01-18 2024-02-23 卓望数码技术(深圳)有限公司 基于ChatGLM运维场景的信息处理方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
CN114971530A (zh) 基于自然语言处理的协同运维方法及装置
CN111966796B (zh) 问答对提取方法、装置、设备及可读存储介质
WO2022134832A1 (zh) 地址信息抽取方法、装置、设备及存储介质
CN113051374B (zh) 一种文本匹配优化方法及装置
CN111767725A (zh) 一种基于情感极性分析模型的数据处理方法及装置
CN116628173B (zh) 一种基于关键字提取的智能客服信息生成系统及生成方法
CN113780007A (zh) 语料筛选方法、意图识别模型优化方法、设备及存储介质
CN111460162B (zh) 一种文本分类方法、装置、终端设备及计算机可读存储介质
CN117235228A (zh) 客服问答交互方法、装置、设备及存储介质
CN113283238A (zh) 文本数据处理的方法和装置、电子设备和存储介质
CN111782793A (zh) 智能客服处理方法和系统及设备
CN117009524A (zh) 一种基于舆情情感分析的互联网大数据分析方法及系统
CN115238799A (zh) 基于ai随机森林恶意流量检测方法和系统
CN109977370B (zh) 一种基于文档结构树的问答对自动构建方法
CN110796565A (zh) 监理日志的分析方法及分析系统
KR20220041702A (ko) 인공지능 챗봇 서버
CN113378024A (zh) 一种基于深度学习面向公检法领域的相关事件识别方法
CN117113973A (zh) 一种信息处理方法及相关装置
CN116432099A (zh) 日志分类方法、装置、电子设备及存储介质
CN111464687A (zh) 一种陌生呼叫请求的处理方法及装置
CN115438147A (zh) 面向轨道交通领域的信息检索方法及系统
CN114791945A (zh) 智能运维方法及其装置、电子设备及存储介质
CN109597879B (zh) 一种基于“引文关系”数据的业务行为关系抽取方法及装置
CN115080732A (zh) 投诉工单处理方法、装置、电子设备和存储介质
CN114722817A (zh) 事件处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication