CN115796172B - 一种故障案例推荐方法、装置和系统 - Google Patents

一种故障案例推荐方法、装置和系统 Download PDF

Info

Publication number
CN115796172B
CN115796172B CN202310079088.XA CN202310079088A CN115796172B CN 115796172 B CN115796172 B CN 115796172B CN 202310079088 A CN202310079088 A CN 202310079088A CN 115796172 B CN115796172 B CN 115796172B
Authority
CN
China
Prior art keywords
fault
word segmentation
data
fault case
case
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310079088.XA
Other languages
English (en)
Other versions
CN115796172A (zh
Inventor
张宇驰
曾伟刚
陈振安
杨军红
刘浩
王家赞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Guangdong Hong Kong Macao Dawan District Hard Science And Technology Innovation Research Institute
Original Assignee
Guangdong Guangdong Hong Kong Macao Dawan District Hard Science And Technology Innovation Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Guangdong Hong Kong Macao Dawan District Hard Science And Technology Innovation Research Institute filed Critical Guangdong Guangdong Hong Kong Macao Dawan District Hard Science And Technology Innovation Research Institute
Priority to CN202310079088.XA priority Critical patent/CN115796172B/zh
Publication of CN115796172A publication Critical patent/CN115796172A/zh
Application granted granted Critical
Publication of CN115796172B publication Critical patent/CN115796172B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Machine Translation (AREA)

Abstract

本发明公开了一种故障案例推荐方法、装置和系统,该方法通过响应故障信息触发信号,调取第一分词数据与第二分词数据组合形成词典数据,并根据所述词典数据对故障信息进行分词处理,获得分词结果;将所述分词结果与若干个所述故障案例进行匹配,确定是否匹配到对应的第一故障案例,根据匹配结果确定向用户推荐的是第一故障案例还是热门故障案例。本发明技术方案可动态调用数据库中的自定义分词数据,且动态调用数据库中的分词数据时无需对搜索引擎进行重启,因此本发明分词使用词典数据更加方便快捷且词典数据更加充分丰富;同时本发明还提供了热门故障案例的推荐,扩充了用户的选择范围,进一步优化了该推荐方法。

Description

一种故障案例推荐方法、装置和系统
技术领域
本发明涉及故障诊断领域,尤其涉及一种故障案例推荐方法、装置和系统。
背景技术
目前,在各行业的故障诊断系统中会预设有大量具有故障特征的案例库,故障诊断系统依照诊断算法推导出故障信息,用户可以根据不同的故障信息在案例库中寻求最优解决方案进行故障修复。
现有技术多是针对特定业务系统设定专有关键词及停用词,结合分词器对故障信息进行分词,最后通过搜索引擎的得分机制找出最相关的故障案例信息并将其推荐给用户。
然而现有技术还存在以下两种缺点,一方面需要通过XML文档对数据库进行维护,一旦新增或者删除分词器中的分词数据就需要重启搜索引擎才能生效,而大数据搜索引擎频繁重启会导致其他业务系统的搜索服务无法正常运行。
发明内容
本发明提供了一种故障案例推荐方法、装置和系统,以实现动态从数据库中获取更新的分词数据以此优化故障案例推荐的技术效果。
为了解决上述技术问题,本发明实施例提供了一种故障案例推荐方法,包括以下步骤:
响应于故障信息触发信号,调取第一分词数据,将所述第一分词数据与第二分词数据组合形成词典数据,根据所述词典数据对所述故障信息进行分词处理,获得分词结果;其中,所述第一分词数据为数据库中的分词数据,所述第二分词数据为分词器中的分词数据;
将所述分词结果与若干个所述故障案例进行匹配,确定是否匹配到对应的第一故障案例;
若匹配到对应的所述第一故障案例,则将所述第一故障案例推荐给用户;
若没有匹配到对应的所述第一故障案例,则根据热门权重值,向用户推荐热门故障案例;
其中,所述热门权重值为用户将各故障案例选定为最优故障案例的频率。
本发明提供的故障案例推荐方法,通过响应故障信息触发信号,调取数据库中的第一分词数据,将其与分词器中的第二分词数据组合形成词典数据,根据词典数据对故障信息进行处理获得分词结果,根据所述分词结果与若干个所述故障案例进行匹配,确定是否匹配到对应的第一故障案例,若匹配到对应的第一故障案例,则将第一故障案例推荐给用户,若没有匹配到对应的第一故障案例,则根据热门权重值将热门故障案例推荐给用户。本发明技术方案通过调用词典数据对故障信息进行处理获得分词结果,与现有技术只能调用分词器中的分词数据不同,本发明技术方案调用的分词数据不仅包括分词器中原本自带的原生分词数据即第二分词数据,还包括数据库中的自定义分词数据即第一分词数据,并且本发明动态调用数据库中的分词数据与现有技术相比更加方便快捷,因此本发明技术方案调用的分词数据相较现有技术而言更加充分丰富且快捷,从而优化了对故障案例的推荐。
同时,在本发明中,若没有匹配到第一故障案例时,则向用户推荐热门故障案例,该热门故障案例是根据热门权重值选定的,而热门权重值则代表用户将各个故障案例选定为最优故障案例的频率,与现有技术若没有匹配到对应的第一故障案例则不推荐对比而言,本发明技术方案在现有技术的基础上给予了用户更多的选择,扩充了用户的选择范围。
作为优选例子,在所述响应于故障信息触发信号之前,还包括:
接收故障诊断数据,通过诊断算法对所述故障诊断数据进行计算,根据计算结果判断是否出现故障;
若确定出现故障,则根据所述故障诊断数据获得故障信息并发送所述故障信息触发信号;
若确定未出现故障,则返回至接收故障诊断数据,以使所述故障诊断数据被判断是否出现故障。
在本发明中,在响应触发信号之前还包括接收故障诊断数据,通过诊断算法对所述故障诊断数据进行计算,根据计算结果判断是否出现故障,若判断出现故障则触发信号并获取故障信息,若判断未出现故障,则返回接收故障诊断数据的步骤。本发明所提供的一种根据诊断数据进行故障告警判断的方法,可实现对故障的自动化判断,以及自动化从诊断数据中提取故障信息为后期获取分词结果提供数据支持。
作为优选例子,所述调取第一分词数据,将所述第一分词数据与第二分词数据组合形成词典数据,具体为:
根据所述故障信息从所述数据库中调取所述第一分词数据,将所述第一分词数据加载进临时集合中;其中,所述临时集合储存有所述第二分词数据;
对所述临时集合中的各分词数据进行组合,生成所述词典数据。
在本发明中,所述词典数据不仅包含分词器中的原生分词数据即第二分词数据,还包括数据库中的自定义分词数据即第一分词数据。本发明可直接调用数据库中的分词数据,因此当用户对数据库中的分词数据进行更新后,与现有技术需要对搜索引擎进行重启才能将数据库中更新后的数据加载至分词器中不同,本发明技术方案可实现自动化动态从数据库中获取更新后的分词数据即动态刷新执行分词操作时调用的词典数据,而不需要对搜索引擎进行更新,因此本发明可实现在不影响服务进程的情况下维护分词逻辑,进而避免因为频繁对大数据搜索引擎进行重启所导致的系统搜索业务无法进行的情况的发生。
同时,本发明所提供的词典数据不仅包括分词器中的第二分词数据,还包括数据库中的第一分词数据,因此本发明所使用的分词数据相比现有技术更加充分且丰富,使得根据本发明的分词方法所获得的分词结果相比现有技术也更加精确,进而使得推荐给用户的故障案例也更加符合用户的需求,进一步提升了用户的体验感。
作为优选例子,所述根据所述词典数据对所述故障信息进行分词处理,获得分词结果,具体为:
其中,所述词典数据包括关键词数据和停用词数据;
根据所述关键词数据和所述停用词数据对所述故障信息进行分词处理,获得所述分词结果;
其中,所述分词结果包括故障关键词、词性统计结果和词频统计结果。
本发明提供的一种分词方法,根据前文中整合而成的词典数据对故障信息进行分词,该词典数据中包括停用词数据和关键词数据,利用词典数据中的停用词数据与故障信息进行匹配,过滤掉故障信息中的无意义词语;利用词典数据中的关键词数据与故障信息进行匹配,获得故障关键词;对切分故障信息获得的词语进行词性标注并统计成果,获得词性统计结果;根据故障关键词的故障关键词匹配结果进行词频统计,获得词频统计结果,上述各项成果综合起来便是分词结果。
作为优选例子,所述将所述分词结果与若干个所述故障案例进行匹配,确定是否匹配到对应的第一故障案例,具体为:
根据所述分词结果,获得对应索引和搜索条件,分别根据所述索引和所述搜索条件对若干个所述故障案例进行检索匹配;
通过计算获得所述索引和所述搜索条件在若干个所述故障案例中出现的频率,按照对应的所述频率由大到小对若干个所述故障案例进行排序,将所述频率超过第一频率阈值的所述故障案例确定为所述第一故障案例。
本发明所提供的判断是否匹配到对应的第一故障案例的方法,根据分词结果获得索引和搜索条件,根据索引和搜索条件对故障案例进行检索匹配,通过本发明所提供的一种得分机制确定对应的第一故障案例。本发明技术方案所提供的索引和搜索条件为后期匹配第一故障案例做好了基本的数据支撑。
本发明所提供的得分机制,通过计算索引和搜索条件在每个故障案例中出现的次数,根据对应次数算出对应频率,根据频率的大小对故障案例进行排序,将对应频率超过预设的第一频率阈值对应的故障案例确定为第一故障案例。
作为优选例子,所述根据热门权重值,向用户推荐热门故障案例,具体为:
根据用户选择所述故障案例为最优故障案例的次数对所述故障案例进行热门权重值的计算,根据所述热门权重值对所述故障案例进行由大到小排序,将所述热门权重值超过第一权重阈值的所述故障案例确定为所述热门故障案例。
本发明所提供的根据热门权重值确定热门故障案例的方法,通过统计各个故障案例被用户选定为最优故障案例的次数进行热门权重值的累加,对获得的热门权重值进行排序,将热门权重值超过第一权重阈值对应的故障案例确定为热门故障案例,若根据索引和搜索条件检索发现没有匹配到对应的第一故障案例,则将热门故障案例推荐给用户,与现有技术没有匹配到第一故障案例则不对用户进行故障案例推荐相比较而言,本发明技术方案为用户提供了更多的选择,进一步扩大了用户的选择范围。
作为优选例子,在所述将所述第一故障案例推荐给用户之后,还包括:
接收用户输入的关于推荐的所述第一故障案例的评分和评价,根据所述评分和所述评价对推荐所述第一故障案例的准确性进行评估,根据评估结果调整所述第一分词数据的更新范围。
本发明提供的一种根据用户评价调整分词数据的方法,通过用户的评价形成对故障案例推荐结果的评估,通过评估调整数据库中的第一分词数据下一次进行更新时的范围,进而使得推荐的匹配故障案例更加符合用户的需求,通过优化的词典数据提升推荐的故障案例的匹配度,从而提升用户的体验度。
相应的,本发明还提供了一种故障案例推荐装置,所述装置包括以下模块:分词模块、匹配模块、推荐模块;
其中,所述分词模块用于响应于故障信息触发信号,调取第一分词数据,将所述第一分词数据与第二分词数据组合形成词典数据,根据所述词典数据对所述故障信息进行分词处理,获得分词结果;其中,所述第一分词数据为数据库中的分词数据,所述第二分词数据为分词器中的分词数据;
所述匹配模块用于将所述分词结果与若干个所述故障案例进行匹配,确定是否匹配到对应的第一故障案例;
所述推荐模块用于若匹配到对应的所述第一故障案例,则将所述第一故障案例推荐给用户;若没有匹配到对应的所述第一故障案例,则根据热门权重值,向用户推荐热门故障案例;其中,所述热门权重值为用户将各故障案例选定为最优故障案例的频率。
本发明所提供的一种故障案例推荐装置,实现了动态获取数据库中的分词数据,规避了更新分词数据时需要重启搜索引擎的问题,进而提高了推荐的故障案例的匹配度。
相应的,本发明还提供了一种故障案例推荐系统,所述系统包括分词器、数据库和搜索引擎;其中,所述分词器分别与所述数据库和所述搜索引擎连接;
所述分词器用于响应于故障信息触发信号,调取第一分词数据,将所述第一分词数据与第二分词数据组合形成词典数据,根据所述词典数据对所述故障信息进行分词处理,获得分词结果;其中,所述第一分词数据为数据库中的分词数据,所述第二分词数据为分词器中的分词数据;
所述数据库用于向所述分词器提供第一分词数据;
所述搜索引擎用于将所述分词结果与若干个所述故障案例进行匹配,确定是否匹配到对应的第一故障案例,并且若匹配到对应的所述第一故障案例,则将所述第一故障案例推荐给用户;而若没有匹配到对应的所述第一故障案例,则根据热门权重值,向用户推荐热门故障案例;其中,所述热门权重值为用户将各故障案例选定为最优故障案例的频率。
本发明提供的一种故障案例推荐系统,包含的分词器、数据库和搜索引擎可执行上述装置所有模块的对应功能。
附图说明
图1 :为本发明提供的一种故障案例推荐方法的一种实施例的流程示意图;
图2 :为本发明提供的一种根据故障信息获得分词结果的一种实施例的流程示意图;
图3 :为本发明提供的一种根据匹配结果确定所要推荐的故障案例的一种实施例的流程示意图;
图4 :为本发明提供的一种故障案例推荐方法的另一种实施例的流程示意图;
图5 :为本发明提供的一种通过反馈调整数据库中数据更新范围的一种实施例的流程示意图;
图6 :为本发明提供的一种故障案例推荐装置的一种实施例的结构示意图;
图7 :为本发明提供的一种故障案例推荐系统的一种实施例的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
请参照图1,为本发明实施例提供的一种故障案例推荐方法的一种实施例的流程示意图,包括步骤101至步骤103,各步骤具体如下:
步骤101:响应于故障信息触发信号,调取第一分词数据,将所述第一分词数据与第二分词数据组合形成词典数据,根据所述词典数据对所述故障信息进行分词处理,获得分词结果。
在本实施例中,通过响应故障信息触发信号,调取数据库中的第一分词数据,将其与分词器中的第二分词数据组合形成词典数据,根据词典数据对故障信息进行处理获得分词结果,根据所述分词结果与若干个所述故障案例进行匹配,确定是否匹配到对应的第一故障案例,若匹配到对应的第一故障案例,则将第一故障案例推荐给用户,若没有匹配到对应的第一故障案例,则根据热门权重值将热门故障案例推荐给用户。
本发明实施例所提供的故障案例推荐方法通过调用词典数据对故障信息进行处理获得分词结果,与现有技术只能调用分词器中的分词数据相比,本发明技术方案调用的分词数据不仅包括分词器中原本自带的原生分词数据即第二分词数据,还包括数据库中的自定义分词数据即第一分词数据,因此本发明实施例调用的分词数据相较现有技术而言更加充分且丰富,从而优化了对故障案例的推荐。
同时,在本发明中,若没有匹配到第一故障案例时,则向用户推荐热门故障案例,该热门故障案例是根据热门权重值选定的,而热门权重值则代表用户将各个故障案例选定为最优故障案例的频率,与现有技术若没有匹配到对应的第一故障案例则不推荐对比而言,本发明技术方案在现有技术的基础上给予了用户更多的选择,扩充了用户的选择范围。
本实施例所提供的故障案例推荐方法可直接调取数据库中的第一分词数据,因此系统可实时更新执行分词处理操作时所使用的分词数据,使得由分词处理操作得来的分词结果更加精确。而将第一分词数据与分词器中原本的第二分词数据结合形成词典数据,由词典数据对故障信息进行分词处理,使得进行分词操作的词典数据更为完整丰富。
步骤102:将所述分词结果与若干个所述故障案例进行匹配,确定是否匹配到对应的第一故障案例。
本实施例将分词结果与各个故障案例分别进行匹配,并以此确定是否有匹配到对应的第一故障案例。
步骤103:若匹配到对应的所述第一故障案例,则将所述第一故障案例推荐给用户;若没有匹配到对应的所述第一故障案例,则根据热门权重值,向用户推荐热门故障案例。
本实施例根据是否匹配到对应的第一故障案例确定的两种不同的推荐方案,若是匹配到第一故障案例,则将第一故障案例推荐给用户,若是没有匹配到第一故障案例,则根据热门权重值推荐热门故障案例给用户,以此确保不管有没有匹配到第一故障案例,用户均可接收到推荐的故障案例,与现有技术若是没有匹配到第一故障案例便不向用户进行故障案例推荐相比,本实施例所提供的推荐方法扩大了用户的选择范围,同时提升了用户的体验感。
作为本实施例的另一种举例,参见图2,图2为本发明提供的一种根据故障信息获得分词结果的一种实施例的流程示意图,包括步骤201至步骤203。
步骤201:根据所述故障信息从所述数据库中调取所述第一分词数据,将所述第一分词数据加载进临时集合中。
在本实施例中,分词器通过提取数据库的配置文件并与数据库进行连接,从而得以动态从数据库中获取更新的第一分词数据。本发明技术方案不对所述分词器和数据库的具体型号进行进一步限定,用户可根据实际需要调整上述两者的具体型号。
在本实施例中,所述数据库型号优选为MySQL数据库,分词器型号优选为IK分词器。其中,IK分词器使用Properties配置文件存储资源信息,并在需要使用所述资源信息时将其从配置文件中读取出来,此种使用方式实现数据与代码的分离,即实现了解耦,因此若需要对资源信息进行修改调整,则可避免对程序重新进行打包,使得所述资源信息不再以硬编码的方式暴露在类中。
本实施例中的IK分词器通过JDBC与MySQL数据库进行直连,从而实现了动态获取数据库中的第一分词数据的功能,而现有技术中对数据库中的第一分词数据进行更新时需要进入虚拟机中进行相应的XML文档维护操作,同时在将数据库中的第一分词数据更新至分词器中时需要对搜索引擎进行重启。本实施例的方法不仅规避了更新时的XML文档操作,还因此避免了修改词典数据时需要对搜索引擎进行重启的问题,进而避免了因为频繁对大数据搜索引擎进行重启所导致的系统搜索业务无法进行的情况的发生。
步骤202:对所述临时集合中的各分词数据进行组合,生成所述词典数据。
本实施例实现了自动化动态从数据库中获取更新后的分词数据即动态刷新执行分词操作时调用的词典数据,因此本实施例可实现在不影响服务进程的情况下维护分词逻辑。同时,本发明所提供的词典数据不仅包括分词器中的第二分词数据,还包括数据库中的第一分词数据,因此本发明所使用的分词数据相比现有技术更加充分且丰富,使得根据本发明的分词方法所获得的分词结果相比现有技术也更加精确,进而使得推荐给用户的故障案例也更加符合用户的需求,进一步提升了用户的体验感。
步骤203:根据所述词典数据中的关键词数据和停用词数据对所述故障信息进行分词处理,获得所述分词结果。
本实施例提供的词典数据包括关键词数据和停用词数据,分词器利用词典中的关键词数据和停用词数据对故障信息进行分词处理,从而获得分词结果。本发明技术方案不对分词处理的具体方式做进一步限定,用户可根据实际需要进行调整。
出于故障诊断分词逻辑的客观性原则,本实施例优选IK分词器中的智能模式对故障信息进行分词处理,所述智能模式也为最小切分策略,若所述故障信息为“关键器部件统计信息异常”,则根据智能模式对该故障信息进行分词处理后所得结果为“关键”、“器部件”、“统计”、“信息”和“异常”。该IK分词器不仅包括智能模式,还包括细粒度模式,若根据细粒度模式对上述故障信息进行分词处理,则获得的分词结果为“关键”、“器部件”、“部件”、“统计”、“信息”和“异常”,因此以上两种结果对比可知智能模式更加符合本实施例的需要,而根据智能模式获得的分词结果也更加精确,可大幅提升故障案例推荐查询效率。
根据智能模式对故障信息进行分词处理时,还包括以下8个步骤。
第一个步骤为对输入的故障信息进行分词,按照信息文本中的空格和标点符号对信息文本进行切分;
第二个步骤为对上述步骤每一个切分出来的词语进行词性标注,判断该词语是否为名词、动词或是形容词等;
第三个步骤为对于上述步骤标注出来的名词和动词,根据词典数据进行匹配,获得各词语对应的词性和词频;
第四个步骤为对于未能根据词典数据进行匹配的词语进行分词算法处理,将其进行二次分词,切分为多个词语;
第五个步骤为将分词结束获得的词语以词语本身为单位进行组合,形成相应的句子;
第六个步骤为利用词典数据中的停用词数据与上述步骤中获得的句子进行匹配,过滤掉句子中的无意义词语;
第七个步骤为利用词典数据中的关键词数据与上述步骤中获得的句子进行匹配,确定句子中的关键词;
第八个步骤为对上述步骤中获得的关键词进行统计,获得故障关键词,对上述步骤中获得的词语的词性和词频也分别进行统计,获得词性统计结果和词频统计结果。而以上各种结果综合起来,获得的便是分词结果。
作为本发明实施例的又一举例,参见图3,图3为本发明提供的一种根据匹配结果确定所要推荐的故障案例的一种实施例的流程示意图,包括步骤301至步骤302,其中步骤302分为步骤302A和步骤302B,各步骤具体如下:
步骤301:根据所述分词结果,获得对应索引和搜索条件,分别根据所述索引和所述搜索条件对若干个所述故障案例进行检索匹配。
在本实施例中,所述索引与搜索条件即为所述分词结果中的故障关键词、词性与词频等信息,系统将根据上述信息对若干故障案例进行检索匹配,并根据一种得分机制确定第一故障案例。本发明技术方案不对用于检索匹配的搜索引擎的型号作进一步限定,用户可根据需要进行调整。
在本实施例中,所述搜索引擎型号为Elasticsearch搜索引擎,该搜索引擎中录入有若干个不同的故障案例,系统将相应索引和搜索条件输入该搜索引擎,则该搜索引擎将自行对各故障案例进行检索匹配。
步骤301A:通过计算获得所述索引和所述搜索条件在所述若干个故障案例中出现的频率,按照对应的所述频率由大到小对所述若干个故障案例进行排序,将所述频率超过第一频率阈值的所述故障案例确定为所述第一故障案例。
在本实施例中,是否匹配到对应的第一故障案例,决定了系统将要向用户推荐的故障案例为第一个故障案例还是热门故障案例。如图3步骤301A所示,即为确定匹配到对应的第一故障案例,则向用户推荐第一故障案例。本实施例所提供的得分机制,通过计算索引和搜索条件在每个故障案例中出现的次数,根据对应次数算出对应频率,根据频率的大小对故障案例进行排序,将对应频率超过预设的第一频率阈值对应的故障案例确定为第一故障案例。
本实施例所提供的得分机制为一个基于词频和逆文档频率指数的公式,也被称为TF-IDF算法,作为一种用于信息检索与数据挖掘的常用加权技术,所述TF即为词频,所述词频为某个词语于被检索的文章中出现的次数,若出现次数越多,则词频越大。为了使得该词频更加便于比较,因此有相应词频公式如下:
Figure SMS_1
所述IDF即为逆文档频率指数,所述逆文档频率指数即为某个词语在检索出来的文章中出现的次数,若出现次数越多,则意味着该词语越不重要也越不相关,则逆文档频率指数也越小。同样为了使得该逆文档频率指数更加便于比较,因此有相应逆文档频率指数公式如下:
Figure SMS_2
其中,公式中语料库的文档总数即为搜索引擎中包含的故障案例总数。
步骤302B:根据用户选择所述故障案例为最优故障案例的次数对所述故障案例进行热门权重值的计算,根据所述热门权重值对所述故障案例进行由大到小排序,将所述热门权重值超过第一权重阈值的所述故障案例确定为所述热门故障案例。
在本实施例中,若没有匹配到相关故障案例,或是匹配到相关故障案例但是该故障案例的频率没有超过第一频率阈值,即根据所属得分机制计算获得的数值未超过第一频率阈值,则向用户推荐热门故障案例。本实施例所提供的根据热门权重值确定热门故障案例的方法,通过统计各个故障案例被用户选定为最优故障案例的次数进行热门权重值的累加,对获得的热门权重值进行排序,将热门权重值超过第一权重阈值对应的故障案例确定为热门故障案例,与现有技术没有匹配到第一故障案例则不对用户进行故障案例推荐即返回空值,相比较而言,本发明技术方案为用户提供了更多的选择,进一步扩大了用户的选择范围。
实施例二
请参照图4,为本发明提供的一种故障案例推荐方法的另一种实施例的流程示意图,如图4所示,该实施例为在实施例一的步骤101之前所执行的方法,具体为通过诊断算法对故障诊断数据进行计算,根据计算结果判断是否需要触发故障信息触发信号,若确定出现故障,则根据故障诊断数据获得故障信息并发送故障信息触发信号,若确定没有出现故障,则返回接收故障诊断数据的步骤,等待下一次的故障诊断数据的接收。
上述方法为本实施例提供的一种根据诊断数据进行故障告警判断的方法,可实现对故障的自动化判断,以及自动化从诊断数据中提取故障信息为后期获取分词结果提供数据支持。
作为本实施例的另一种举例,参见图5,图5为本发明提供的一种通过反馈调整数据库中数据更新范围的一种实施例的流程示意图,包括步骤501至步骤503。在本实施例中,系统优选将推荐的故障案例以图文结合的形式展示给用户,方便用户对推荐结果进行查看,并根据推荐结果分析故障产生原因,同时系统还提供更多关于故障问题的案例数据和说明文字。
如步骤501至步骤503所述,系统接收来自用户对于推荐的故障案例的评价和评分,并根据所述评分和评价对推荐结果的准确性进行评估,根据平湖结果调整第一分词数据的更新范围,即数据库中自定义分词数据的更新范围。该调整方式通过用户的评价形成对故障案例推荐结果的评估,通过评估调整数据库中的第一分词数据下一次进行更新时的范围,进而使得推荐的匹配故障案例更加符合用户的需求,通过优化的词典数据提升推荐的故障案例的匹配度,从而提升用户的体验度。
为了更好地说明本发明提供的一种故障案例推荐方法、装置和系统的工作原理与步骤流程,可以但不限于参见上文的相关记载。
相应的,参见图6,图6为本发明提供的一种故障案例推荐装置的一种实施例的结构示意图,所述推荐装置包括以下模块:分词模块601、匹配模块602、推荐模块603;
其中,所述分词模块601用于响应于故障信息触发信号,调取第一分词数据,将所述第一分词数据与第二分词数据组合形成词典数据,根据所述词典数据对所述故障信息进行分词处理,获得分词结果;其中,所述第一分词数据为数据库中的分词数据,所述第二分词数据为分词器中的分词数据;
所述匹配模块602用于将所述分词结果与若干个所述故障案例进行匹配,确定是否匹配到对应的第一故障案例;
所述推荐模块603用于若匹配到对应的所述第一故障案例,则将所述第一故障案例推荐给用户;若没有匹配到对应的所述第一故障案例,则根据热门权重值,向用户推荐热门故障案例;其中,所述热门权重值为用户将各故障案例选定为最优故障案例的频率。
本实施例所提供的一种故障案例推荐装置,实现了动态获取数据库中的分词数据,规避了更新分词数据时需要重启搜索引擎的问题,进而提高了推荐的故障案例的匹配度。
作为本实施例的又一种实施例,参见图7,图7为本发明提供的一种故障案例推荐系统的一种实施例的结构示意图。所述系统包括分词器701、数据库702和搜索引擎703;其中,所述分词器701分别与所述数据库702和所述搜索引擎703连接;
所述分词器701用于响应于故障信息触发信号,调取第一分词数据,将所述第一分词数据与第二分词数据组合形成词典数据,根据所述词典数据对所述故障信息进行分词处理,获得分词结果;其中,所述第一分词数据为数据库中的分词数据,所述第二分词数据为分词器中的分词数据;
所述数据库702用于向所述分词器701提供第一分词数据;
所述搜索引擎703用于将所述分词结果与若干个所述故障案例进行匹配,确定是否匹配到对应的第一故障案例,并且若匹配到对应的所述第一故障案例,则将所述第一故障案例推荐给用户;而若没有匹配到对应的所述第一故障案例,则根据热门权重值,向用户推荐热门故障案例;其中,所述热门权重值为用户将各故障案例选定为最优故障案例的频率。
本发明提供的一种故障案例推荐系统,包含的分词器、数据库和搜索引擎可分别执行上述装置相应模块的对应功能。
综上所述,本发明实施例所提供的一种故障案例推荐方法、装置和系统,通过响应故障信息触发信号,调取第一分词数据与第二分词数据结合形成词典数据,并根据词典数据对故障信息进行分词处理获得分词结果,然后将分词结果与若干个故障案例进行匹配,根据匹配结果确定向用户推荐第一故障案例还是热门故障案例。本发明技术方案可动态调用数据库中的自定义分词数据,且动态调用数据库中的分词数据时无需对搜索引擎进行重启,因此本发明分词使用词典数据更加方便快捷且词典数据更加充分丰富;同时本发明还提供了热门故障案例的推荐,扩充了用户的选择范围,进一步优化了该推荐方法。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步的详细说明,应当理解,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围。特别指出,对于本领域技术人员来说,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种故障案例推荐方法,其特征在于,包括以下步骤:
响应于故障信息触发信号,根据故障信息从数据库中调取第一分词数据,将所述第一分词数据加载进临时集合中,对所述临时集合中的各分词数据进行组合,生成词典数据,根据所述词典数据对所述故障信息进行分词处理,获得分词结果;其中,所述临时集合储存有第二分词数据;所述第一分词数据为数据库中的分词数据,所述第二分词数据为分词器中的分词数据;
将所述分词结果与若干个所述故障案例进行匹配,确定是否匹配到对应的第一故障案例;
若匹配到对应的所述第一故障案例,则将所述第一故障案例推荐给用户;
若没有匹配到对应的所述第一故障案例,则根据热门权重值,向用户推荐热门故障案例;
其中,所述热门权重值为用户将各故障案例选定为最优故障案例的频率。
2.如权利要求1所述的一种故障案例推荐方法,其特征在于,在所述响应于故障信息触发信号之前,还包括:
接收故障诊断数据,通过诊断算法对所述故障诊断数据进行计算,根据计算结果判断是否出现故障;
若确定出现故障,则根据所述故障诊断数据获得所述故障信息并发送所述故障信息触发信号;
若确定未出现故障,则返回至接收故障诊断数据,以使所述故障诊断数据被判断是否出现故障。
3.如权利要求1所述的一种故障案例推荐方法,其特征在于,所述根据所述词典数据对所述故障信息进行分词处理,获得分词结果,具体为:
其中,所述词典数据包括关键词数据和停用词数据;
根据所述关键词数据和所述停用词数据对所述故障信息进行分词处理,获得所述分词结果;
其中,所述分词结果包括故障关键词、词性统计结果和词频统计结果。
4.如权利要求1所述的一种故障案例推荐方法,其特征在于,所述将所述分词结果与若干个所述故障案例进行匹配,确定是否匹配到对应的第一故障案例,具体为:
根据所述分词结果,获得对应索引和搜索条件,分别根据所述索引和所述搜索条件对若干个所述故障案例进行检索匹配;
通过计算获得所述索引和所述搜索条件在若干个所述故障案例中出现的频率,按照对应的所述频率由大到小对若干个所述故障案例进行排序,将所述频率超过第一频率阈值的所述故障案例确定为所述第一故障案例。
5.如权利要求1所述的一种故障案例推荐方法,其特征在于,所述根据热门权重值,向用户推荐热门故障案例,具体为:
根据用户选择所述故障案例为最优故障案例的次数对所述故障案例进行热门权重值的计算,根据所述热门权重值对所述故障案例进行由大到小排序,将所述热门权重值超过第一权重阈值的所述故障案例确定为所述热门故障案例。
6.如权利要求1所述的一种故障案例推荐方法,其特征在于,在所述将所述第一故障案例推荐给用户之后,还包括:
接收用户输入的关于推荐的所述第一故障案例的评分和评价,根据所述评分和所述评价对推荐所述第一故障案例的准确性进行评估,根据评估结果调整所述第一分词数据的更新范围。
7.一种故障案例推荐装置,其特征在于,所述装置包括以下模块:分词模块、匹配模块、推荐模块;
其中,所述分词模块用于响应于故障信息触发信号,根据故障信息从数据库中调取第一分词数据,将所述第一分词数据加载进临时集合中,对所述临时集合中的各分词数据进行组合,生成词典数据,根据所述词典数据对所述故障信息进行分词处理,获得分词结果;其中,所述临时集合储存有第二分词数据;所述第一分词数据为数据库中的分词数据,所述第二分词数据为分词器中的分词数据;
所述匹配模块用于将所述分词结果与若干个所述故障案例进行匹配,确定是否匹配到对应的第一故障案例;
所述推荐模块用于若匹配到对应的所述第一故障案例,则将所述第一故障案例推荐给用户;若没有匹配到对应的所述第一故障案例,则根据热门权重值,向用户推荐热门故障案例;其中,所述热门权重值为用户将各故障案例选定为最优故障案例的频率。
8.一种计算机系统,其特征在于,所述计算机系统包括存储器、处理器以及存储在所述存储器上并在所述处理器上运行的计算机程序,所述处理器处理所述计算机程序时实现如权利要求1-6任一项所述的一种故障案例推荐方法。
CN202310079088.XA 2023-02-08 2023-02-08 一种故障案例推荐方法、装置和系统 Active CN115796172B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310079088.XA CN115796172B (zh) 2023-02-08 2023-02-08 一种故障案例推荐方法、装置和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310079088.XA CN115796172B (zh) 2023-02-08 2023-02-08 一种故障案例推荐方法、装置和系统

Publications (2)

Publication Number Publication Date
CN115796172A CN115796172A (zh) 2023-03-14
CN115796172B true CN115796172B (zh) 2023-06-02

Family

ID=85430428

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310079088.XA Active CN115796172B (zh) 2023-02-08 2023-02-08 一种故障案例推荐方法、装置和系统

Country Status (1)

Country Link
CN (1) CN115796172B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106294868A (zh) * 2016-08-23 2017-01-04 达而观信息科技(上海)有限公司 一种基于搜索引擎的个性化推荐方法及系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107220295B (zh) * 2017-04-27 2020-02-07 银江股份有限公司 一种人民矛盾调解案例搜索和调解策略推荐方法
CN109388796B (zh) * 2017-08-11 2023-04-18 北京国双科技有限公司 裁判文书的推送方法及装置
CN109902153B (zh) * 2019-04-02 2020-11-06 杭州安脉盛智能技术有限公司 基于自然语言处理和案例推理的设备故障诊断方法及系统
CN110059319B (zh) * 2019-04-22 2022-11-18 上海化学工业区公共管廊有限公司 一种基于关键词共现的管廊故障分析方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106294868A (zh) * 2016-08-23 2017-01-04 达而观信息科技(上海)有限公司 一种基于搜索引擎的个性化推荐方法及系统

Also Published As

Publication number Publication date
CN115796172A (zh) 2023-03-14

Similar Documents

Publication Publication Date Title
US9846748B2 (en) Searching for information based on generic attributes of the query
US11182435B2 (en) Model generation device, text search device, model generation method, text search method, data structure, and program
CN110083688B (zh) 搜索结果召回方法、装置、服务器及存储介质
CN107247745B (zh) 一种基于伪相关反馈模型的信息检索方法及系统
US20140372349A1 (en) Method of machine learning classes of search queries
JP6355840B2 (ja) ストップワード識別方法および装置
CN113110866A (zh) 一种数据库变更脚本的评估方法及装置
US7324988B2 (en) Method of generating a distributed text index for parallel query processing
CN107577755B (zh) 一种搜索方法
CN111324689A (zh) 问答系统的索引更新方法、装置、设备及存储介质
CN105653701A (zh) 模型生成方法及装置、词语赋权方法及装置
CN109508456B (zh) 一种文本处理方法和装置
CN113722478A (zh) 多维度特征融合相似事件计算方法、系统及电子设备
CN108804550B (zh) 一种查询词拓展方法、装置以及电子设备
CN110781673A (zh) 文档验收方法、装置、计算机设备及存储介质
CN116414968A (zh) 信息搜索方法、装置、设备、介质及产品
Ikeda et al. Person name disambiguation on the web by two-stage clustering
CN109977397B (zh) 基于词性组合的新闻热点提取方法、系统及存储介质
CN111324705A (zh) 自适应性调整关连搜索词的系统及其方法
CN111506705B (zh) 一种信息查询方法、装置及电子设备
CN115796172B (zh) 一种故障案例推荐方法、装置和系统
CN111930884A (zh) 一种确定回复语句的方法、设备和人机对话系统
US11314794B2 (en) System and method for adaptively adjusting related search words
CN114491215A (zh) 基于搜索的近义词库更新方法、装置、设备及存储介质
JP7305077B2 (ja) 情報処理装置、要約文出力方法、及び要約文出力プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant