CN102346756B - 一种设备故障解决方案知识管理与检索系统及方法 - Google Patents

一种设备故障解决方案知识管理与检索系统及方法 Download PDF

Info

Publication number
CN102346756B
CN102346756B CN 201110089547 CN201110089547A CN102346756B CN 102346756 B CN102346756 B CN 102346756B CN 201110089547 CN201110089547 CN 201110089547 CN 201110089547 A CN201110089547 A CN 201110089547A CN 102346756 B CN102346756 B CN 102346756B
Authority
CN
China
Prior art keywords
descriptor
equipment failure
solution
module
failure solution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN 201110089547
Other languages
English (en)
Other versions
CN102346756A (zh
Inventor
郑宇飞
乔冬春
王石
王卫民
符建辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongke national power (Zhenjiang) Intelligent Technology Co., Ltd.
Original Assignee
KNOWOLOGY INTELLIGENT TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KNOWOLOGY INTELLIGENT TECHNOLOGY Co Ltd filed Critical KNOWOLOGY INTELLIGENT TECHNOLOGY Co Ltd
Priority to CN 201110089547 priority Critical patent/CN102346756B/zh
Publication of CN102346756A publication Critical patent/CN102346756A/zh
Application granted granted Critical
Publication of CN102346756B publication Critical patent/CN102346756B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种设备故障解决方案知识管理与检索系统及方法,其具有特殊语义关系的多语种设备故障分类主题词管理模块形成一主题词表;通过分类主题词表中的主题词进行亚主题词化模块形成的亚主题词,通过对设备故障解决方案的主题词进行亚主题词化模块形成的亚主题词写入“亚主题词-主题词-故障解决方案”索引文件,上述主题词表及索引文件供对用户检索输入串预处理模块G、对用户检索输入串分词模块H、检索设备故障解决方案模块I使用;通过设备故障解决方案检查点创建模块创建故障解决方案存入故障解决方案库,供模块I调用;通过设备故障解决方案单角色化模块产生适合于不同角色的解决方案,通过呈现设备故障解决方案模块J呈现给不同角色的方案用户。

Description

一种设备故障解决方案知识管理与检索系统及方法
技术领域
本发明涉及自动知识管理和基于语义的知识检索领域,特别是涉及一种设备故障解决方案的管理和检索系统及方法。
背景技术
问题1:在现代社会中,设备的复杂性越来越高,各类机构和企业中的设备出现的故障解决的成本也越来越高。因此,设备生产商、设备维修商、各类设备的使用机构等面临着设备故障带来的-诊断、维护上的巨大负担。同时对设备故障诊断人员、维修人员的要求也越来越高。
问题2:随着各类机构和企业的发展,机构和企业所积累了知识资源往往是大量的,大型机构和企业尤为如此。与实体性资源(如硬件装备、工具)一样,知识资源也具有重要的实际价值。但是,如何有效地管理机构和企业的知识资源,便于企业内部检索和使用、便于企业产品客户检索和使用,是各类机构和企业面临的一个重要的、具有挑战性的难题。
在各行各业的知识资源管理方面,一般面临着两类不同的知识资源(以下也称资料):陈述性知识资源、过程性知识资源,统称知识文档。它们的管理方式也不完全一致。下面分别阐述。
(1)陈述性知识资源:也称文档性知识资源,这类资源以文本形式表述的文件,是企业中最普遍的一种资料。它们一般以Word文档、XSL表格、HTML网页、数据库表等形式存储。
这种资源的管理一般采用元数据管理,针对不同的领域,资源管理人员首先设计一套元数据标准,然后对数据进行元数据标引。在资源检索时,可根据元数据比较确定地检索到所需要的知识资源。
(2)过程性知识资源:过程性知识资源描述某个过程的信息,在机构或者企业中是一种常见的知识形式,它们通常以图形、图像、操作规程(如诊断过程、手术过程、操作规范等)等形式出现。在存储上,大多采用图形、Word文档、XSL表格、HTML网页、数据库表等等形式存储。
这类资源的管理也可以采用元数据管理。但是,由于过程性知识资源具有步骤性,这些步骤可用于引导用户进行某种活动、操作,因此对过程性知识资源比一般文档性知识资源的管理更复杂,也更为困难。为此,本发明提出了一种对过程性知识资源进行结构化管理的方法,目的在于方便用户(即企业内部人员、企业产品客户等)准确地检索到相关的过程性知识资源,也便于他们学习有关技术,解决在生产实践、产品使用中出现的问题。
另一方面,无论是对陈述性知识资源的检索,还是对过程性知识资源的检索,基于主题词的检索是一种常见的基于元数据检索方法。但是,在实际的使用过程中,往往存在许多缺陷。事实上,在本发明中,我们首先分析了大量的用户检索输入项、检索习惯。我们发现,机构员工、企业客户直接使用主题词检索的比例较少,他们所偏好的检索词多为自由词、通俗词,或者主题词的“片断”,我们称为亚主题词。例如,“设备硬盘”、“设备电源”为主题词,大量的用户更喜欢使用“硬盘”、“电源”来检索知识文档。又如,对“电源故障”而言,机构员工、企业客户更喜欢使用“电源坏了”。
因此,如果不能有效地解决上述用户所使用的检索语言与正式主题词之间的差异性,则即使我们对机构或者企业知识进行了有效的管理,用户也难以检索到相关知识。为此,在本发明中,我们设计了基于亚主题词和主题词的检索方法,详细参见“具体实施方式”。
问题3:除上述两个共性问题之外,本发明所涉及的设备故障诊断解决方案具有多个方面的复杂因素,需要加以克服:
第一,由于设备故障诊断解决方案是一种特殊的过程性知识,因此对它的建模和管理较为复杂。第二,为了确保本发明中的方法和系统具有通用性,我们需要从多个方面考虑设备故障诊断解决方案的模型、管理方法。
第三,设备故障诊断解决方案需要服务于多种不同的用户(如客服人员、咨询工程师、设备用户),由于他们的权限、解决能力存在差异,因此他们所看到和检索到的设备故障诊断解决方案有较大的差异性。如何采用统计的管理方法,从而降低设备故障诊断解决方案管理成本,是本发明需要克服的难点之一。
发明内容
本发明所要解决的技术问题:
针对问题1,本发明借助计算机技术,提出了一种设备故障解决方案的管理与检索的方法和系统,以便为故障咨询工程师、设备用户、客服人员提供在线帮助,提高他们的故障诊断和处理能力,提供机构的工作效率,企业的设备售后服务水平,提升设备故障诊断人员、维修人员的工作能力。
针对问题2, 为了便于用户检索相关的设备故障解决方案这种特殊的过程性知识资源,本发明提出了一种基于亚主题词和主题词的检索系统及方法,且提出了几种全新的主题词之间的语义关系技术,同时提出了亚主题词化技术,它们有效地解决了用户检索词与主题词之间的差异性。
针对问题3,为了便于有效地创建设备故障解决方案,根据设备用户提供的故障现象准确地在设备故障解决方案知识库中检索到设备故障解决方案,我们发明了一种细粒度、分层次、面向多用户的设备故障解决方案结构建模方法和管理技术。
技术方案:
一种设备故障解决方案知识管理与检索系统包括具有特殊语义关系的多语种设备故障分类主题词管理模块、设备故障解决方案创建模块、基于主题词和亚主题词的设备故障解决方案检索模块;
具有特殊语义关系的多语种设备故障分类主题词管理模块又包括建立主题词的常见关系模块A、建立主题词的特殊语义关系模块B;
设备故障解决方案创建模块又包括设备故障解决方案检查点创建模块块C、设备故障解决方案单角色化模块D;
基于主题词和亚主题词的设备故障解决方案检索模块又包括分类主题词表中的主题词进行亚主题词化模块E、对设备故障解决方案的主题词进行亚主题词化模块F、对用户检索输入串预处理模块G、对用户检索输入串分词模块H、检索设备故障解决方案模块I、呈现设备故障解决方案模块J;
建立主题词的常见关系模块A和建立主题词的特殊语义关系模块B一起工作,形成一个《设备故障解决方案分类主题词表》,供对用户检索输入串预处理模块G、对用户检索输入串分词模块H、检索设备故障解决方案模块I使用;分类主题词表中的主题词进行亚主题词化模块E对《设备故障解决方案分类主题词表》进行亚主题词化,形成亚主题词,并将亚主题词写入“亚主题词-主题词-故障解决方案”索引文件,这一索引文件将被对用户检索输入串预处理模块G、对用户检索输入串分词模块H、检索设备故障解决方案模块I使用;对设备故障解决方案的主题词进行亚主题词化模块F对设备故障解决方案中标引的主题词进行亚主题词化,也同样形成设备故障解决方案亚主题词,并将这些亚主题词写入“亚主题词-主题词-故障解决方案”索引文件,这一索引文件将被对用户检索输入串预处理模块G、对用户检索输入串分词模块H、检索设备故障解决方案模块I使用;设备故障解决方案检查点创建模块块C为设备故障解决方案的创建模块,负责创建所有的设备故障解决方案,并且存入设备故障解决方案库,供检索设备故障解决方案模块I调用;设备故障解决方案单角色化模块D为设备故障解决方案单角色化模块,该模块根据设备故障解决方案库中的解决方案中的角色说明,产生适合于不同角色的解决方案,以便呈现设备故障解决方案模块J呈现给不同角色的方案用户。
所述的设备故障解决方案检查点创建模块C包括设备故障解决方案最上层检查点创建模块C1、设备故障解决方案检查点创建模块C2、设备故障解决方案的提示性检查点创建模块C3;其中,设备故障解决方案最上层检查点创建模块C1创建设备故障解决方案最上层检查点后,由设备故障解决方案检查点创建模块C2接着对设备故障解决方案最上层检查点进行细化,同时由设备故障解决方案的提示性检查点创建模块C3创建设备故障解决方案中的提示性检查点。
所述的对用户检索输入串分词模块H包括对预处理过后的检索输入串进行受限的最大前向分词模块H1、对用户检索输入串中的分词进行过滤模块H2;其中,对预处理过后的检索输入串进行受限的最大前向分词模块H1对对预处理过后的检索输入串进行受限的最大前向分词后,将分词结果传给对用户检索输入串中的分词进行过滤模块H2,由对用户检索输入串中的分词进行过滤模块H2对分词结果进行过滤。
所述的检索设备故障解决方案模块I包括用户检索输入串完善化处理模块I1、根据用户检索输入项中的亚主题词计算对应《设备故障解决方案分类主题词表》中的主题词模块I2、根据加权主题词集合检索出符合用户输入串Q’的设备故障解决方案检索模块I3;其中,用户检索输入串完善化处理模块I1对用户检索输入串完善化处理后,有根据用户检索输入项中的亚主题词计算对应《设备故障解决方案分类主题词表》中的主题词模块I2找到用户检索输入串中的亚主题词所对应的《设备故障解决方案分类主题词表》中的主题词,再由根据加权主题词集合检索出符合用户输入串Q’的设备故障解决方案检索模块I3最后检索到上述主题词对应的设备故障解决方案检索。
一种设备故障解决方案知识管理与检索方法包括以下步骤:
步骤1:建立主题词的常见关系,对任意一个主题词,知识管理员给出该主题词与其它主题词之间的属、分、参、用、代五种语义关系,并且将上述关系存入《设备故障解决方案分类主题词表》;
步骤2:建立主题词的特殊语义关系,对任意一个主题词,知识管理员按照系统提示给出该主题词4种简称关系、俗称关系、错别字关系、多语种翻译关系,并且将上述关系存入《设备故障解决方案分类主题词表》;
步骤3:设备故障解决方案检查点创建,所述步骤又包括以下实施子步骤:
步骤3-1:设备故障解决方案最上层检查点创建:首先建立设备故障解决方案最上层的检查点,根据检查点的具体内涵,采用四元组即<序号>,<权限>,<任务>,<子检查点序列>的形式,或者四元组即<序号>,<权限>,<任务>,<任务结果—建议>的形式,建立所有设备故障解决方案最上层的检查点;
步骤3-2:设备故障解决方案检查点创建
所述“任务结果—建议”,具体包括以下两种不同的技术形式,采用两种不同的创建子步骤:
步骤3-2-1:创建“任务结果—建议”Result:权限::转检查点<序号>
其含义为,当所述子任务问题的子任务结果为Result,并且方案用户具有“权限”时,设备故障解决方案的“后续动作”为转到序号为<序号>的检查点继续解决设备故障;
步骤3-2-2:创建“任务结果—建议”Result::故障排除
其含义为,当所述任务结果为Result时,设备故障解决方案的“后续动作”为“故障排除”,也即设备故障解决方案已经成功地解决了设备故障;
步骤3-3:设备故障解决方案的提示性检查点创建
     所述设备故障解决方案检查点,还包括以下六种特殊的提示性的检查点,作为整个设备故障解决方案的补充部分,具体创建子步骤如下:
步骤3-3-1:建立CC话务员诊断成功提示:“CC话务员→诊断成功,故障单元为{<故障单元1>,…,<故障单元j>,…, <故障单元m>};但是,无法排除故障,需要为设备用户产生上门服务派单,由咨询工程师与设备用户确定上门服务时间”;
步骤3-3-2:建立CC话务员诊断失败提示:“CC话务员→诊断失败,已经发现的故障单元为{<故障单元1>,…,<故障单元j>,…, <故障单元m>},为设备用户产生上门服务派单,由咨询工程师与设备用户确定上门服务时间”;
步骤3-3-3:建立设备用户诊断成功提示:“设备用户→诊断成功,故障单元为{<故障单元1>,…,<故障单元j>,…, <故障单元m>};但是,无法排除故障,需要为设备用户产生上门服务派单,由咨询工程师与设备用户确定上门服务时间”;
步骤3-3-4:建立设备用户诊断失败提示:“设备用户→诊断失败,已经发现的故障单元为{<故障单元1>,…,<故障单元j>,…, <故障单元m>},需要派单上门或到维修站服务,请拨打咨询电话<咨询电话号>进行预约”;
步骤3-3-5:建立咨询工程师诊断失败提示:“咨询工程师→诊断失败,已经发现的故障单元为{<故障单元1>,…,<故障单元j>,…, <故障单元m>}。请咨询工程师,电话为<咨询工程师电话号>”;
     步骤3-3-6:建立权限参见提示:“权限→参见<设备故障解决方案号>”;
步骤4:设备故障解决方案单角色化,对给定的一个角色和一条设备故障解决方案,从该解决方案中删除与给定角色无关的内容,所保留下来的内容就是给定角色的设备故障解决方案单角色化结果;
步骤5:对分类主题词表中的主题词进行亚主题词化,从分类主题词表中逐一取出主题词,记为Subject;对该主题词调用前向最大匹配分词算法进行分词,形成亚主题词;将亚主题词写入“亚主题词-主题词-故障解决方案”索引文件;
步骤6:对设备故障解决方案的主题词进行亚主题词化,从设备故障解决方案知识库中逐一读入标引了主题词的设备故障解决方案,记为Solution,将Solution中的主题词写入“亚主题词-主题词-故障解决方案”索引文件,从而建立了从主题词到Solution的倒排索引;
步骤7:接收用户输入串,记为Q;
步骤8:对用户检索输入串预处理,具体包括包括以下4个实施子步骤:
步骤8-1:消除检索输入串Q前、后的空白字符;
步骤8-2:消除检索输入串Q中的两个连续ASCII串之间的多个空白字符,使得它们之间只保留一个ASCII空格符;
步骤8-3:将检索输入串Q中的全角字符统一转换为半角字符,同时对检索输入串Q中的ASCII字母全部转化为小写形式;
步骤8-4:针对用户在检索输入Q’中可能输入的错别字,本模块从《设备故障解决方案分类主题词表》中找到对应的正确的主题词,替代错别字;
以下为了方便起见,在以下步骤中,我们使用“用户检索输入串Q’”来指代经过所述的上述步骤8-1至步骤8-4处理过后所得到的用户检索输入串Q’;
步骤9:对用户检索输入串分词,对经过预处理后的用户检索输入串Q’=W1 W2 W3…Wn中的每一个Wi(1≤i≤n)进行分词,分词策略采用前向最大匹配方法,该匹配方法分词依赖于词典的设计,为了分词的准确性,我们除了采用《设备故障解决方案分类主题词表》外,还需要使用《通用检索词典》和《用户检索停用字词表》;
对用户检索输入串分词包括以下重要的实施子步骤:
步骤9-1:对预处理过后的检索输入串进行受限的最大前向分词,即对检索输入串Q’=“W1 W2 W3…Wn”进行最大前向分词,记Wi的分词结果为[Wi]={Wi1, Wi2,…, Wij},在分词过程中要求连续的ASCII子串不分开;
步骤9-2:对用户检索输入串中的分词进行过滤
首先根据《用户检索中的停用字词表》中的停用字、停用词,删除[Wi]中的停用字、停用词;
步骤10:检索设备故障解决方案,具体包括以下子步骤:
步骤10-1:用户检索输入串完善化处理,在用户检索输入串Q’=“W1 W2 W3…Wn”的任意一个Wi的分词结果为[Wi]={Wi1, Wi2,…, Wij}中,对任一一个X?[Wi],如果X在《设备故障解决方案分类主题词表》中存在对应的一个或多个主题词Yk,并且X是Yk的简称或俗称,或代词,则将上述所有的Yk都加入[Wi]中;
步骤10-2:根据用户检索输入项中的亚主题词计算对应《设备故障解决方案分类主题词表》中的主题词;在获得了用户检索输入项Q’中的亚主题词集QSS={[W1], [W2], …, [Wi], …, [Wk]}后,通过二级索引获得{[W1], …, [Wk]}所对应的《设备故障解决方案分类主题词表》中的主题词,记为QS={S1, S2, …, Sm};具体实施子步骤如下:
步骤10-2-1:基于亚主题词的主题词识别,对QSS={[W1], …, [Wk]}中的每个[Wi]={Wi1, …, Wij},通过二级索引,从《设备故障解决方案分类主题词表》中找到含有[Wi]中的某个亚主题词的所有主题词,记为Subj[Wi1], …, Subj[Wij];即Subj[Wi1], …, Subj[Wij]为分别含有亚主题词Wi1, …, Wij的集合,并且称Subj[Wi1], …, Subj[Wij]分别为Wi1, …, Wij所命中的主题词集合;令Subjects[Wi]=Subj[Wi1]è…èSubj[Wij],称Subjects[Wi]为[Wi]中的亚主题词所命中的主题词集合;
为方便起见,我们用Subjects[QSS]=Subjects[W1]è…èSubjects[Wk]表示QSS所命中的主题词集合;
步骤10-2-2:命中的主题词的权重计算,根据亚主题词命中的主题词的出现次数,计算各个被命中的主题词的加权值;具体步骤如下:令QSS={[W1], [W2], …, [Wi], …, [Wk]}中的每个[Wi]={Wi1, …, Wij},计算QSS的加权主题词集合如下:
Wsubjects[QSS]={(S,a)|$Wi S?Subjects[Wi],且a=?S’?Subjects[S]?Subjects[QSS] log2(N/NS’) / ?S’?Subjects[S] log2(N/NS’)},其中,N为《设备故障解决方案分类主题词表》中的主题词个数,NS’为《设备故障解决方案分类主题词表》中含有亚主题词S’的主题词的个数;
步骤10-2-3:基于特异性消耗因子的主题词扩展,对Wsubjects[QSS]={(S1, a1), …, (Si, ai), … ,(Sn, an)}每个元素(Si, ai),在《设备故障解决方案分类主题词表》中,获得Si的上位主题词Si’,然后将(Si’, ai’)加入到Wsubjects[QSS]中,其中ai’=ai / |Si’|,|Si’|为直接下位主题词的个数,称为特异性消耗因子;
步骤10-3:根据加权主题词集合,检索出符合用户输入串Q’的设备故障解决方案;从Wsubjects[QSS]出发,利用二级索引结构在设备故障解决方案知识库中检索符合用户检索输入串Q’的故障解决方案;具体实施子步骤如下:
步骤10-3-1. 候选的设备故障解决方案检索,对Wsubjects[QSS]={(S1, a1), …, (Si, ai), … ,(Sn, an)}中的每个元素(Si, ai),从设备故障解决方案知识库中检索标有主题词Si的解决方案;记含有Wsubjects[QSS]中主题词的解决方案的集合为Solutions[QSS];
步骤10-3-2. 判断候选的设备故障解决方案集合Solutions[QSS]是否为空,如果Solutions[QSS]为空集合,则用户检索输入项Q’没有对应的解决方案,则直接提示用户未检索到所需的解决方案;
步骤10-3-3:候选的设备故障解决方案分值计算,即该步骤对Solutions[QSS]={Sol1, …, Solj, … Soln}中的解决方案进行评分;对Solutions[QSS]={Sol1, …, Solj, … Soln}中的任一元素Solj,令Subjects[Solj]为Solj中的所有主题词,HSubjects[Solj]为Solj中的出现于Wsubjects[QSS]={(S1, a1), …, (Si, ai), … ,(Sn, an)}中的主题词,记MSubjects[Solj]为Subjects[Solj]与HSubjects[Solj]的差集,即 MSubjects[Solj]=Subjects[Solj] \ HSubjects[Solj];此时,MSubjects[Solj]为Solj中的没有出现于Wsubjects[QSS]的主题词;定义的设备故障解决方案Solj的分值按照以下公式计算:
score(Solj) = ?S?HSubjects[Solj] a-value(S, QSS) / ?S?Subjects[Solj] a-value(S, QSS)
步骤10-3-4:根据候选的设备故障解决方案的分值,返回最好的设备故障解决方案,从Solutions[QSS]={Sol1, …, Solj, … Soln}选择q个分值最高的设备解决方案,作为用户检索输入串Q’对应的检索结果返回给用户;其中,q是一个具体阈值,可以根据不同的应用具体设置。在本发明中q的缺省值设为5,即按照top5的最好检索结果返回给用户;
步骤11:呈现设备故障解决方案,设备故障解决方案单角色化模块对设备故障解决方案进行单角色的自动分解后,本模块将对其按照不同角色的特点和习惯,提供友好的访问界面,分别进行呈现,以便不同角色进行检索和浏览。
所述步骤9中的《通用检索词典》包括以下常见词:总是、经常、时常;为什么、什么、怎么、哪些、这些;系统、过程、技术、方法、方案、模块;因为、所以、如果、那么;是、不是、没有、尚未;《用户检索停用字词表》中停用字包括:“的”、“了”、“过”、“从”、“或”、“和”、“与”、“且”;停用词包括“按照”、“并且”、“或者”、“否则”。
有益效果:
本发明提出并且实现了一种具有特殊语义关系的主题词管理系统,提高了方案用户检索设备故障解决方案的准确性和灵活性。提出的亚主题词化方法,不仅降低了方案用户使用的负担,也极大地提高了检索设备故障解决方案检索的查全率。
本发明提出了一种细粒度、分层次、面向多用户的设备故障解决方案结构建模和管理方法。在细粒度方面,本发明引入了支持细粒度知识管理的方法,将复杂的设备故障解决方案分解为细粒度的知识管理。所述细粒度的知识管理不仅便于设备故障解决方案的管理,而且也便于用户的快速而又精确的检索。在结构化方面,本发明设计了一种分层的、自顶向下的设备故障解决方案创建方式,知识管理员可以逐层地创建复杂的设备故障解决方案,从而降低了工作强度,提高了知识管理的效率。在针对多用户,本发明在设备故障解决方案的步骤中设置了“角色条件”的技术,知识管理员根据设备故障解决方案步骤所适合的用户角色,创建不同的步骤内容。极大地提高了设备故障解决方案的重用性和管理效率。
   在细粒度、分层次、面向多用户的设备故障解决方案结构建模方法和管理基础上,本发明提出并且实现的设备故障解决方案管理系统和检索系统,不仅提高了设备故障解决方案知识的管理效率,也提高了设备故障解决方案知识服务的性能。
另外,本发明在家电电子设备、计算机设备等领域做了大量的实验,体现了本发明所具有的显著的实际使用效果和通用性。
在经过多达1000多个设备故障解决方案检索测试后,当q=5时,设备故障解决方案用户的top5检索准确性为90.1%,当q=10时,用户检索的top10准确性为95.6%。
因此,本发明取得了较好的检索性能,已经达到了实际应用的目的。
附图说明
图1是本发明的设备故障解决方案管理和检索系统的模块结构图;
图2是本发明的多语种主题词编辑模块;
图3是本发明针对某设备的INTERPT产品线的关于“安装OA系统时报错”解决方案的例子,说明面向多角色的故障解决方案结构图;
图4是本发明针对某设备的INTERPT产品线的关于“安装OA系统时报错” 解决方案的例子,说明面向单一角色设备用户的故障解决方案结构图;
图5是本发明的设备故障解决方案检查点创建模块结构示意图;
图6是本发明的“亚主题词—主题词—故障解决方案”的二级索引结构示意图;
图7是本发明的基于主题词的设备故障解决方案检索结构示意图;
图8是本发明的用户检索输入串预处理流程图;
图9是本发明的由亚主题词计算对应主题词的流程图;
图10是本发明的由加权主题词集合检索设备故障解决方案的流程图。  
具体实施方式
为了能够更清楚的说明本发明,以下定义并解释如下的术语:
(1)主题词:是对一个领域中的领域事物(主题)进行描述的规范化的术语。根据领域事物内在的关系,通过属、分、参、用、代等关系,在这些主题词之间建立多种语义关系。
(2)亚主题词:在实际检索时,机构员工或企业客户直接使用主题词检索的比例不高,他们更偏向于使用主题词的“片断”。例如,“设备硬盘”、“设备电源”为主题词,大量的用户更喜欢使用“硬盘”、“电源”来检索设备故障解决方案。在本发明中,我们将上述主题词中有意义的“片断”称为亚主题词。
(3)设备故障解决方案:简称解决方案。此处的解决方案专指根据不同的设备故障给出的相应解决方法。例如,针对“安装OA系统时报错”这一设备故障,我们有一个针对某设备的INTERPT产品线的故障解决方案“安装OA系统时报错故障解决方案(INTERPT)”,参见图3。
(4)设备故障解决方案知识库:简称解决方案知识库(或者解决方案库)。解决方案知识库专指由设备故障解决方案所构成的知识库。
(5)设备故障解决方案知识库管理系统:简称故障解决方案管理系统。设备故障解决方案知识库管理系统专指对设备故障解决方案知识库进行创建、修改、检索的系统。
(6)设备故障解决方案知识库管理员,简称知识管理员。他们主要使用设备故障解决方案知识库管理系统中的创建和修改功能,创建和修改设备故障解决方案。
(7)设备服务商:为设备用户提供故障咨询服务、解决设备用户遇到的设备故障的服务性企业。
(8)呼叫中心客服人员,简称CC客服人员、CC话务员、话务员。他们是设备服务商雇用的专门接听设备用户的电话咨询,在接听电话的过程中,引导和协助设备用户解决遇到的设备故障。在此过程中,CC客服人员使用设备故障解决方案知识库管理系统中的检索功能,检索适合解决设备用户所遇的设备故障,并且根据所检索到的故障解决方案,一步一步地引导设备用户进行故障诊断、故障排除等工作。
(9)咨询工程师:他们使用设备故障解决方案知识库管理系统中的检索功能,检索针对设备用户所遇到的设备故障的解决方案,或者根据设备故障解决方案所提示的电话号码,向有经验的咨询工程请教(参见下文)。
(10)设备用户:他们使用设备故障解决方案知识库管理系统中的检索功能,自助式地解决设备故障。
(11)设备故障解决方案用户,简称方案用户(在无歧义的情况下也称用户),是CC客服人员、咨询工程师、设备用户的统称。
(12)故障单元:设备中出现故障的部件。例如,在空调故障诊断中,如果空调的压缩机出现故障,则我们称压缩机为空调的故障单元。
本发明的一种设备故障解决方案管理系统及其工作方法,通过定义知识库中设备故障解决方案的结构,方便知识管理员管理设备故障解决方案知识库,方便方案用户准确地检索到设备故障解决方案。本发明采用网络接入方式,对设备故障解决方案编辑人员、话务员、设备用户等多种角色细分,具有多种业务展现界面,并融合设备故障解决方案的业务特征,支撑中英文不同界面的设备故障创建和检索功能,为适合中英文用户的国际化服务提供强有力的支撑。通过引入设备故障解决方案树,根据对设备故障方案的分析,为其建立匹配相应的故障检查点、跳转条件等,大大加快用户的检索、了解解决方案内容的速度,提高用户的工作效率,同时有助于降低CC客服人员的压力,达到内、外部用户的满意度的双双提高。
下面结合附图和具体实施方式对本发明作进一步详细地说明。
如图1所示,本发明系统包括具有特殊语义关系的多语种设备故障分类主题词管理模块、设备故障解决方案创建模块、基于主题词和亚主题词的设备故障解决方案检索模块;
具有特殊语义关系的多语种设备故障分类主题词管理模块又包括建立主题词的常见关系模块A、建立主题词的特殊语义关系模块B;
设备故障解决方案创建模块又包括设备故障解决方案检查点创建模块块C、设备故障解决方案单角色化模块D;
基于主题词和亚主题词的设备故障解决方案检索模块又包括分类主题词表中的主题词进行亚主题词化模块E、对设备故障解决方案的主题词进行亚主题词化模块F、对用户检索输入串预处理模块G、对用户检索输入串分词模块H、检索设备故障解决方案模块I、呈现设备故障解决方案模块J;
其中,模块A和模块B一起工作,形成一个《设备故障解决方案分类主题词表》,供模块G、模块H、模块I使用;模块E对《设备故障解决方案分类主题词表》进行亚主题词化,形成亚主题词,并将亚主题词写入“亚主题词-主题词-故障解决方案”索引文件(如图6所示),这一索引文件将被模块G、模块H、模块I使用;模块F对设备故障解决方案中标引的主题词进行亚主题词化,也同样形成设备故障解决方案亚主题词,并将这些亚主题词写入“亚主题词-主题词-故障解决方案”索引文件(如图6所示),这一索引文件将被模块G、模块H、模块I使用;模块C为设备故障解决方案的创建模块,负责创建所有的设备故障解决方案,并且存入设备故障解决方案库,供模块I调用;模块D为设备故障解决方案单角色化模块,该模块根据设备故障解决方案库中的解决方案中的角色说明,产生适合于不同角色的解决方案,以便模块J呈现给不同角色的方案用户。
(一)、具有特殊语义关系的多语种设备故障分类主题词管理模块
一般而言,一个领域中的分类主题词表是经过该领域多个专家共同整理的主题结构的一个词表,可用于公文主题词标引、电子文档主题词标引、语义检索等具体计算机应用中。在传统的分类主题词表编制中,主题词之间有属(也称属项)、分(也称分项)、参(也称参项)、用(也称用项)、代(也称代项)等五种常见的语义关系,分类主题词表中的主题词由这些关系形成一个具有结构层次的网络结构。
但是,在实际应用中,我们发现,还有其它一些有用的语义关系,反映主题之间的简称关系、俗称关系、错别字关系、多语种翻译关系。
因此,在本发明中,我们在传统的主题词关系基础上,引入了以下特殊的关系,用于加强灵活的语义检索的能力。下面详细说明这些新的语义关系,以及它们的功用:
1. 简称关系:英文名为short name,是对复杂名称的简化称呼,如“设备电源”可以简称为“电源”。简称词是把较长、复杂的词语压缩简化而成的短的、简单的词语,可以节省我们表达其意义的时间,在保证不发生歧义的情况下使用简称词是可以的。
主题词的简称不能用来标引设备故障解决方案,但是用户在检索设备故障解决方案却可不受限制地使用简称来检索设备故障解决方案,这无疑减轻了用户检索的难度。
2. 俗称关系:“俗称”是对事物通俗的或非正式的称呼,如“SD512手机内存卡”俗称“大卡”,它与“简称”的不同是:“简称”一般来自于其“全称”的几个有代表意义的字,而“俗称”是总结性的、概括性的,具有较为明显的外部描述特征。通常在广告、媒体的宣传中为了拉近与用户的距离,激发用户的购买欲望,往往采用“俗称”来代替事物。我们引入俗称就是为了能将用户听到的这些不被用来标引的词汇能转化到分类主题词表的词。
3. 错别字关系:在用户输入中,另一个常见的问题是错别字。根据产生错别字的原因,我们将错别字分为以下常见几类:
(1) 形近错别字:如将“撤单”误写为“撒单”;
(2) 音似错别字:用户按照拼音输入法,输入了同音或近音字或词,如将“电源” 误写为“店员”等;
(3)英文字母序的错误:如将“BLUE”误写为“BLEU”等。
这些问题在面对互联网检索时是较为常见的错误,因此我们在主题词关系中加入了“错别字”这个关系,以此来对用户的输入进行纠错。
4. 多语种翻译关系:简称翻译关系。为了适应企业的国际化,我们在设计主题词表结构的时候,以英语主题词为基础,其它语种的主题词去寻找对应的英语主题词,当该主题词在英语中不存在时,加入该主题词的同时向编辑英语主题词的人员发送消息通知,告知其进行主题词的增补。
在主题词存储方面,本发明设计了一种简便的主题词存储结构,参见表1。在表1中,“关联关系”表示了“主题词”与其它主题词之间的关系,所关联的主题词采用编号ID表示。表2给出了一个具体的主题词关系的例子。其中,可以看出,“通电死机”的属词为“设备故障”(编号ID为Sub002),“通电死机”的简称为“通电”(编号ID为Sub003)。
表1  分类主题词表存储表结构示意
编号ID 主题词 关联关系 关联主题词ID
Sub001 Subject1 Rel1 RelSubjectID1
Sub001 Subject1 Rel2 RelSubjectID3
Sub002 Subject2 Rel2 RelSubjectID4
Sub003 Subject3 Rel3 RelSubjectID9
表2  分类主题词表存储表(部分)
编号ID 主题词 关联关系 关联主题词ID
Sub001 通电死机 上位 Sub002
Sub001 通电死机 简称 Sub003
Sub002 设备故障 下位 Sub001
Sub003 通电 全称 Sub001
针对多语种,本发明引入了一中多语种主题词表存储表结构,参见表3。在表3中,“编号ID”是指主题词的编号,“主题词”是指实际存储的主题词,“对应语种主题词”主题词的对应语种的翻译所对应的主题词的编号ID,“语种编号”为不同语种的唯一编号(例如,德语的语种编号为“German”,美国英语的语种编号为“US-English”,英国英语的语种编号为“UK-English”等)。这种方式便于多语种的扩充。
表3 多语种分类主题词表结构设计示意
编号ID 主题词 对应语种主题词 语种编号
001 Sub001 LangSubjectID1 Lang1
002 Sub002 LangSubjectID2 Lang2
003 Sub003 LangSubjectID2 Lang3
根据上述说明,在本发明中,多语种分类主题词管理中的子模块及其工作方式如下(参见图2):
模块A:建立主题词的常见关系
对任意一个主题词,知识管理员给出该主题词与其它主题词之间的语义关系,即前文所述的属、分、参、用、代。
模块B:建立主题词的特殊语义关系
对任意一个主题词,本发明引入在知识检索中发挥重要作用的4种特殊的语义关系,即简称关系、俗称关系、错别字关系、多语种翻译关系。参见图2。
经过上述两个模块后,形成一个《设备故障解决方案分类主题词表》,简称《分类主题词表》。该词表将在设备故障解决方案检索中被模块G、模块H、模块I调用。具体参见(三)。
(二)、设备故障解决方案创建模块
2.1 通用设备故障解决方案建模方法
本发明所涉及的设备故障诊断解决方案具有多个方面的复杂因素:第一,设备故障诊断解决方案是一种特殊的过程性知识,因此对它的建模和管理较为复杂。第二,为了确保本发明中的方法和系统具有通用性,我们需要从多个方面考虑设备故障诊断解决方案的模型、管理方法。第三,设备故障诊断解决方案需要服务于多类用户服务,不同的用户(如CC客服人员、咨询工程师、设备用户)所看到的设备故障诊断解决方案有较大的差异性。
为了解决上述问题,为了便于有效地创建设备故障解决方案,根据设备用户提供的故障现象准确地在设备故障解决方案知识库中检索到设备故障解决方案,本发明对设备故障解决方案进行准确地描述,以及有效的创建。在本发明中,我们发明了一种“细粒度”、“结构化”、“针对多用户”的设备故障解决方案结构建模方法。
在细粒度方面,本发明引入了支持细粒度知识管理的方法,将复杂的设备故障解决方案分解为细粒度的知识管理,参见图3、图4。所述细粒度的知识管理不仅便于设备故障解决方案的管理,而且也便于用户的快速而又精确的检索。
在结构化方面,本发明设计了一种分层的、自顶向下的设备故障解决方案创建方式,知识管理员可以逐层地创建复杂的设备故障解决方案,从而降低了工作强度,提高了创建的效率。
在针对多用户,本发明在设备故障解决方案的步骤中设置了“角色条件”的技术,知识管理员根据设备故障解决方案步骤所适合的用户角色(即CC话务员、咨询工程师、设备用户),创建不同的步骤内容,具体参见下面的内容。
具体而言,设备故障解决方案由一系列的设备故障解决方案检查点(简称检查点)构成的一个语义网络,参见图3;在该语义网络引导下,方案用户可以诊断和解决设备中存在的相关故障。
所述设备故障解决方案检查点,从总体刻画解决方案详细内容看,有助于对设备故障解决方案的结构化组织、管理,使得设备故障解决方案具有很强的层次性、用户可理解性。
例如,图3给出了一个完整的关于故障“安装OA系统时报错”故障解决方案,其中的“1. 确认报错代码是否为ERR0011003或者报错日志存在‘初始化失败’提示”、…、“6.设备用户::诊断失败,已经发现的故障单元为{设备主板, Func按纽},需要派单上门或到维修站服务,请拨打咨询电话400-100-888进行预约”为检查点。
所述“故障解决方案检查点”,包括两种四元组表示技术方案,因而具有两种类似但不同的形态:第一种形态是四元组(<序号>,<权限>,<任务>,<子检查点序列>),称此种故障解决方案检查点为复合检查点。第二种形态是(<序号>,<权限>,<任务>,<任务结果—建议>),称此种故障解决方案检查点为原子检查点(即不可细化的检查点)。其中,
所述“序号”,为自然数以及由自然数和“.”的构成序列,它唯一地标识检查点,编码技术如下:第一,最高层的检查点采用自然数从小到大按照顺序编码;第二,组织型的检查点的编码由上位检查点的编码M,其后添加“.N”(其中的“N”为一个自然数)形成;第三,属于同一个检查点的下位检查点的编码从小到大按照顺序编码。
例如,在图3中,“1.确认报错代码是否为ERR0011003或者报错日志存在‘初始化失败’提示”的编码为“1”,它的下位检查点的编码分别为“1.1”、“1.2”、“1.3”。这样,便于知识管理员创建设备故障解决方案,也便于方案用户阅读和理解设备故障解决方案。
所述“任务”,例如图3中的“1.确认报错代码是否为ERR0011003或者报错日志存在‘初始化失败’提示”,是一个有关设备故障解决过程中的一个任务;该任务可以通过内嵌于用户设备中的程序自动检测来回答,也可以是向方案用户提出一个问题,由方案用户给出答案。当任务比较复杂时,需要可以进一步分解,形成由一组具有顺序关系的、相对简单的检查点构成,称为“子检查点序列”。
例如,在图3中,“1.确认报错代码是否为ERR0011003或者报错日志存在‘初始化失败’提示”为“安装OA系统时报错故障解决方案(INTERPT)”的一个(复杂)检查点,而“1.1 确认报错代码是否为ERR0011003?”、“1.2 报错日志存在‘初始化失败’提示”、“1.3 将设备的Func按纽设置为ON,然后重新启动设备”为所述检查点的细化,并且它们相对简单。
所述“权限”,是指检查点的角色权限,检查点的权限包括CC话务员、咨询工程师、设备用户。检查点的权限的缺省值为“所有用户”;此时,检查点的权限等于{CC话务员,咨询工程师,设备用户}。当检查点的权限的取值为{CC话务员,咨询工程师,设备用户}的子集(如{CC话务员,咨询工程师})时,所述检查点只能为该子集中指明的用户所使用,而该子集之外的用户则看不到所述检查点,当然就不能使用它了。
所述“任务结果—建议”,是根据所有可能的不同答案{Result1,…,Resulti,…,Resultk},按照不同的权限要求,均一一地指明其对应的后续建议,在本发明中,这些建议为一些故障解决相关的后续动作{Action1,…, Actioni,…,Actionk}。
例如,图4中所示的“1.1 报错代码是否为ERR0011003?”,是一个有关故障的子检查点;该子检查点可以通过内嵌于用户设备中的程序自动检测来回答,也可以是向方案用户提出一个问题,由方案用户给出答案。“任务结果—建议”根据所有可能的不同答案{Result1,…,Resulti,…,Resultk},按照不同的权限要求,均一一地指明其对应的后续动作{Action1,…, Actioni,…,Actionk}。
所述“任务结果—建议”,具体包括以下两种不同的技术形式:
(1) Result:权限::转检查点<序号>
其含义为,当所述子任务问题的子任务结果为Result,并且方案用户具有“权限”时,设备故障解决方案的“后续动作”为转到序号为<序号>的检查点继续解决设备故障。
例如,在图3,“1.1 报错代码是否为ERR0011003?”即为一个子检查点,该检查点向方案用户提出一个问题,而方案用户给出的答案只可能为“是”、 “否”。因此,如图3所示,我们有一条如下所示的执行型检查点:
         1.1 报错代码是否为ERR0011003?                    
             ○ 是: 所有::转检查点1.3                     
             ○ 否: 所有::转检查点1.2                     
其中,“1.1 报错代码是否为ERR0011003?”是一个子检查点,方案用户根据其设备显示幕上出现的报错代码是否为ERR0011003,分别执行转到不同的检查点继续完成相应的检查。其中,“○ 是: 所有::检查点1.3”和“○ 否:所有::检查点1.2”为所述子检查点的两条“任务结果—建议”。
(2)Result:故障排除
其含义为,当所述任务结果为Result时,设备故障解决方案的“后续动作”为“故障排除”,也即设备故障解决方案已经成功地解决了设备故障。
     例如,在图3中,我们有一条如下所示的执行型检查点:
         1.1 启动设备自检测功能。
               ○成功:故障排除
             ○失败:转步骤4
其中,“○成功:故障排除”表示故障通过“启动设备自检测功能”,所出现的故障被排除了。当然,如果失败,则转步骤4继续下去。
     所述设备故障解决方案检查点,还包括以下六种特殊的提示性的检查点,作为整个设备故障解决方案的补充部分:
(1) CC话务员→诊断成功,故障单元为{<故障单元1>,…,<故障单元j>,…, <故障单元m>};但是,无法排除故障,需要为设备用户产生上门服务派单,由咨询工程师与设备用户确定上门服务时间
其含义为,当设备故障解决方案正确地诊断出设备用户的设备故障<故障单元1>,…,<故障单元j>,…, <故障单元m>,但是无法自己解决上述故障(如电源损坏或网卡损坏),设备销售商需要派单上门为设备用户进行服务,或者请设备用户到指定维修站去接受服务。
(2) CC话务员→诊断失败,已经发现的故障单元为{<故障单元1>,…,<故障单元j>,…, <故障单元m>},为设备用户产生上门服务派单,由咨询工程师与设备用户确定上门服务时间
其含义为,当方案用户为CC话务员时,设备故障解决方案不能诊断出设备用户遇到的设备故障,需要派单上门为设备用户进行服务,由咨询工程师与设备用户确定上门服务时间。
上述失败意味着目前设备故障解决方案知识库还不完备,不能解决设备用户所遇到的所有设备故障。此时,设备故障解决方案系统会将整个交互记录转知识管理员,等到得出结论后再将研究出来的新的设备故障解决方案编入知识库,供后续使用。
(3)设备用户→诊断成功,故障单元为{<故障单元1>,…,<故障单元j>,…, <故障单元m>};但是,无法排除故障,需要为设备用户产生上门服务派单,由咨询工程师与设备用户确定上门服务时间
其含义为,当设备故障解决方案正确地诊断出设备用户的设备故障<故障单元1>,…,<故障单元j>,…, <故障单元m>,但是无法自己解决上述故障(如电源损坏或网卡损坏),设备销售商需要派单上门为设备用户进行服务,或者请设备用户到指定维修站去接受服务。
(4)设备用户→诊断失败,已经发现的故障单元为{<故障单元1>,…,<故障单元j>,…, <故障单元m>},需要派单上门或到维修站服务,请拨打咨询电话<咨询电话号>进行预约
其含义为,当所述子任务问题的子任务结果为Result,并且方案用户为设备用户时,设备故障解决方案不能诊断出设备用户遇到的设备故障,需要派单上门为设备用户进行服务,或者请设备用户到指定维修站去接受服务。
上述失败意味着目前设备故障解决方案知识库还不完备,不能解决设备用户所遇到的所有设备故障。此时,设备故障解决方案系统会将整个交互记录转知识管理员,等到得出结论后再将研究出来的新的设备故障解决方案编入知识库,供后续使用。
(5)咨询工程师→诊断失败,已经发现的故障单元为{<故障单元1>,…,<故障单元j>,…, <故障单元m>}。请咨询工程师,电话为<咨询工程师电话号>
     其含义为,当方案用户为咨询工程师,设备故障解决方案不能解决设备故障,方案用户需要向电话号码为<咨询工程师电话号>的咨询工程师请教。这一种情况通常出现在新的咨询工程师在工作过程遇到不能解决的问题,或者设备故障解决方案本身不完善,需要有经验的咨询工程师帮助指导;当此情形出现时,设备故障解决方案可以告知新的咨询工程师的电话,便于前者能及时寻找到帮助,从而增强了企业的工作效率。
(6)权限→参见<设备故障解决方案号>
其含义为,当方案用户具有“权限”时,设备故障解决方案建议方案用户参见编号为<设备故障解决方案号>的设备故障解决方案。在本发明中,设备故障解决方案中的某个操作型检查点可能比较复杂,需要参考另一个相关的设备故障解决方案,所述方法能够指明这样相关的设备故障解决方案。
2.2 设备故障解决方案创建
在上述“细粒度”、“结构化”、“多角色”的设备故障解决方案的建模基础上,我们实现了一个方法设备故障解决方案创建系统,包括如下核心模块:“模块C:设备故障解决方案检查点创建模块”、“模块D:设备故障解决方案单角色化模块”。
模块C:设备故障解决方案检查点创建模块
设备故障解决方案检查点创建模块包括了3个子模块,分别是设备故障解决方案最上层检查点、检查点、提示性检查点的创建模块。图5是设备故障解决方案检查点创建模块的结构示意图。
模块C1:设备故障解决方案最上层检查点创建模块
首先建立设备故障解决方案最上层的检查点,根据检查点的具体内涵,采用四元组(<序号>,<权限>,<任务>,<子检查点序列>)的形式,或者四元组(<序号>,<权限>,<任务>,<任务结果—建议>)的形式,建立所有设备故障解决方案最上层的检查点。
例如,图3给出了一个完整的关于故障“安装OA系统时报错”故障解决方案,其中的“1. 确认报错代码是否为ERR0011003或者报错日志存在‘初始化失败’提示”、…、“6.设备用户::诊断失败,已经发现的故障单元为{设备主板, Func按纽},需要派单上门或到维修站服务,请拨打咨询电话400-100-888进行预约”为检查点为该方案最上层的6个检查点。
模块C2:设备故障解决方案检查点创建模块
所述“任务结果—建议”,具体包括以下两种不同的技术形式,采用两种不同的创建步骤:
步骤C21:创建“任务结果—建议”Result:权限::转检查点<序号>
其含义为,当所述子任务问题的子任务结果为Result,并且方案用户具有“权限”时,设备故障解决方案的“后续动作”为转到序号为<序号>的检查点继续解决设备故障。
例如,在图3,“1.1 报错代码是否为ERR0011003?”即为一个子检查点,该检查点向方案用户提出一个问题,而方案用户给出的答案只可能为“是”、 “否”。因此,如图3所示,我们有一条如下所示的执行型检查点:
         1.1 报错代码是否为ERR0011003?                    
             ○ 是: 所有::转检查点1.3                     
             ○ 否: 所有::转检查点1.2                     
其中,“1.1 报错代码是否为ERR0011003?”是一个子检查点,方案用户根据其设备显示幕上出现的报错代码是否为ERR0011003,分别执行转到不同的检查点继续完成相应的检查。其中,“○ 是: 所有::检查点1.3”和“○ 否:所有::检查点1.2”为所述子检查点的两条“任务结果—建议”。
步骤C22:创建“任务结果—建议”Result::故障排除
其含义为,当所述任务结果为Result时,设备故障解决方案的“后续动作”为“故障排除”,也即设备故障解决方案已经成功地解决了设备故障。
     例如,在图3中,我们有一条如下所示的执行型检查点:
         1.1 启动设备自检测功能。
               ○成功:故障排除
             ○失败:转步骤4
其中,“○成功:故障排除”表示故障通过“启动设备自检测功能”,所出现的故障被排除了。当然,如果失败,则转步骤4继续下去。
模块C3:设备故障解决方案的提示性检查点创建模块
     所述设备故障解决方案检查点,还包括以下六种特殊的提示性的检查点,作为整个设备故障解决方案的补充部分,具体创建步骤如下:
步骤C31:建立CC话务员诊断成功提示:CC话务员→诊断成功,故障单元为{<故障单元1>,…,<故障单元j>,…, <故障单元m>};但是,无法排除故障,需要为设备用户产生上门服务派单,由咨询工程师与设备用户确定上门服务时间
其含义为,当设备故障解决方案正确地诊断出设备用户的设备故障<故障单元1>,…,<故障单元j>,…, <故障单元m>,但是无法自己解决上述故障(如电源损坏或网卡损坏),设备销售商需要派单上门为设备用户进行服务,或者请设备用户到指定维修站去接受服务。
步骤C32:建立CC话务员诊断失败提示:CC话务员→诊断失败,已经发现的故障单元为{<故障单元1>,…,<故障单元j>,…, <故障单元m>},为设备用户产生上门服务派单,由咨询工程师与设备用户确定上门服务时间
其含义为,当方案用户为CC话务员时,设备故障解决方案不能诊断出设备用户遇到的设备故障,需要派单上门为设备用户进行服务,由咨询工程师与设备用户确定上门服务时间。
上述失败意味着目前设备故障解决方案知识库还不完备,不能解决设备用户所遇到的所有设备故障。此时,设备故障解决方案系统会将整个交互记录转知识管理员,等到得出结论后再将研究出来的新的设备故障解决方案编入知识库,供后续使用。
步骤C33:建立设备用户诊断成功提示:设备用户→诊断成功,故障单元为{<故障单元1>,…,<故障单元j>,…, <故障单元m>};但是,无法排除故障,需要为设备用户产生上门服务派单,由咨询工程师与设备用户确定上门服务时间
其含义为,当设备故障解决方案正确地诊断出设备用户的设备故障<故障单元1>,…,<故障单元j>,…, <故障单元m>,但是无法自己解决上述故障(如电源损坏或网卡损坏),设备销售商需要派单上门为设备用户进行服务,或者请设备用户到指定维修站去接受服务。
步骤C34:建立设备用户诊断失败提示:设备用户→诊断失败,已经发现的故障单元为{<故障单元1>,…,<故障单元j>,…, <故障单元m>},需要派单上门或到维修站服务,请拨打咨询电话<咨询电话号>进行预约
其含义为,当所述子任务问题的子任务结果为Result,并且方案用户为设备用户时,设备故障解决方案不能诊断出设备用户遇到的设备故障,需要派单上门为设备用户进行服务,或者请设备用户到指定维修站去接受服务。
上述失败意味着目前设备故障解决方案知识库还不完备,不能解决设备用户所遇到的所有设备故障。此时,设备故障解决方案系统会将整个交互记录转知识管理员,等到得出结论后再将研究出来的新的设备故障解决方案编入知识库,供后续使用。
步骤C35:建立咨询工程师诊断失败提示:咨询工程师→诊断失败,已经发现的故障单元为{<故障单元1>,…,<故障单元j>,…, <故障单元m>}。请咨询工程师,电话为<咨询工程师电话号>
     其含义为,当方案用户为咨询工程师,设备故障解决方案不能解决设备故障,方案用户需要向电话号码为<咨询工程师电话号>的咨询工程师请教。这一种情况通常出现在新的咨询工程师在工作过程遇到不能解决的问题,或者设备故障解决方案本身不完善,需要有经验的咨询工程师帮助指导;当此情形出现时,设备故障解决方案可以告知新的咨询工程师的电话,便于前者能及时寻找到帮助,从而增强了企业的工作效率。
步骤C36:建立权限参见提示:权限→参见<设备故障解决方案号>
其含义为,当方案用户具有“权限”时,设备故障解决方案建议方案用户参见编号为<设备故障解决方案号>的设备故障解决方案。在本发明中,设备故障解决方案中的某个操作型检查点可能比较复杂,需要参考另一个相关的设备故障解决方案,所述方法能够指明这样相关的设备故障解决方案。
模块D:设备故障解决方案单角色化模块
所述“多角色”的细粒度、结构化的设备故障解决方案技术,还提供了一种自动分解(包括从设备故障解决方案中去除其它角色相关的内容)为不同角色的设备故障解决方案,以供不同角色的用户进行检索和浏览。
设备故障解决方案单角色化,就是对给定的一个角色,和一条设备故障解决方案,从该解决方案中删除与给定角色无关的内容,所保留下来的内容就是给定角色的设备故障解决方案单角色化结果。这种解决方案单角色化快捷而又有效地创建设备故障解决方案,同时为单个角色的设备故障解决方案提供的有效的单角色技术手段。
例如,在图3中,针对“设备用户”这一角色,去除检查点3、检查点4、检查点5。然后,去除检查点2.1中的“咨询工程师::转步骤3,CC话务员::转步骤5,设备用户::转步骤6”不相关内容。最后,重新确定检查点序号,即将“6.设备用户::诊断失败,已经发现的故障单元为{设备主板, Func按纽},需要派单上门或到维修站服务,请拨打咨询电话400-100-888进行预约”改为“3.设备用户::诊断失败,已经发现的故障单元为{设备主板, Func按纽},需要派单上门或到维修站服务,请拨打咨询电话400-100-888进行预约”,同时将“○失败:设备用户::转步骤6”改为“○失败:转步骤3”,最终结果在图4中给出。
(三)、基于主题词和亚主题词的设备故障解决方案检索模块
3.1 亚主题词化方法
正如我们在前面所讨论,直接基于分类主题词进行知识文挡的检索效果并不好,需要对分类主题词进行必要的亚主题词化。下面,我们首先介绍一种建立“亚主题词—主题词—故障解决方案”之间的二级索引(下文简称二级索引)的方法,通过该方法实现了亚主题词化,为解决方案的检索提供基础。
所述“亚主题词-主题词-故障解决方案”二级索引创建,包括以下模块E和模块F:
模块E:对分类主题词表中的主题词进行亚主题词化
从分类主题词表中逐一取出主题词,记为Subject;对该主题词调用前向最大匹配分词算法进行分词,形成亚主题词;将亚主题词写入索引文件,如图6所示。
例如,对主题词“通电死机”进行前向最大匹配分词得到“通电”、“死机”,则将“通电”、“死机”加入到第一级倒排索引中,如图6所示。
模块F:对设备故障解决方案的主题词进行亚主题词化
从设备故障解决方案知识库中逐一读入标引了主题词的设备故障解决方案,记为Solution,将Solution中的主题词写入索引文件,从而建立了从主题词到Solution的倒排索引。如图6所示。
例如,名为“安装OA系统时报错解决方案(INTERPT)”的解决方案标有“INTERPT”、“OA系统”、“解决方案”,则从分类主题词表中找到上述三个主题词,并且建立上述三个主题词“INTERPT”、“OA系统”、“解决方案”到“安装OA系统时报错解决方案(INTERPT)”的倒排索引。
3.2 基于主题词和亚主题词的设备故障解决方案检索
基于主题词的设备故障解决方案检索,是建立在“亚主题词—主题词—解决方案”二级索引基础上的语义检索模块,它主要分为四个核心模块(即模块G、模块H、模块I、模块J),结构示意图如图7所示。
模块G:对用户检索输入串预处理
对用户检索输入串预处理模块主要是接受用户提交的检索输入串Q(如“159.120.12.0是什么IP地址”或者“通电死机”),并且对检索输入串Q进行必要的预处理。处理流程图如图8所示,具体步骤包括以下四个步骤:
步骤G1:消除检索输入串Q前、后的空白字符;
步骤G2:消除检索输入串Q中的两个连续ASCII串之间的多个空白字符,使得它们之间只保留一个ASCII空格符;
步骤G3:将检索输入串Q中的全角字符统一转换为半角字符,同时对检索输入串Q中的ASCII字母全部转化为小写形式。
例如,经过上述三步之后,对检索输入串Q =“159.120.12.0是什么IP地址”进行预处理后,我们获得预处理过后的检索输入串Q’=159.120.12.0是什么IP地址。同时,用户检索输入串Q’=“W1 W2 W3…Wn”其中对于任意的Wi(1≤i≤n)均不包含空格。
步骤G4:针对用户在检索输入Q’中可能输入的错别字,本模块从《设备故障解决方案分类主题词表》中找到对应的正确的主题词,替代错别字。
例如,我们假设《设备故障解决方案分类主题词表》中有“通电”的错别字有“通点”、“同电”,当用户检索输入串Q为“通点死机如何解决”, 将其中的“通点”修正为“通电”。
以下为了方便起见,我们使用“用户检索输入串Q’”来指代经过所述的上述步骤G1—步骤G4处理过后所得到的用户检索输入串Q’。
模块H:对用户检索输入串分词
对经过预处理后的用户检索输入串Q’=W1 W2 W3…Wn中的每一个Wi(1≤i≤n)进行分词,分词策略采用前向最大匹配方法,该匹配方法分词依赖于词典的设计,为了分词的准确性,我们处理采用《设备故障解决方案分类主题词表》外,还设计了另两部词典,称为《通用检索词典》和《用户检索停用字词表》(简称《停用词表》)。
在本发明中,在《通用检索词典》中,我们收集了与具体行业无关的、常用的汉语词汇,它们参与对用户检索输入串的分词过程中。例如,《通用检索词典》包括以下常见词:总是、经常、时常;为什么、什么、怎么、哪些、这些;系统、过程、技术、方法、方案、模块;因为、所以、如果、那么;是、不是、没有、尚未。当然,在本发明的系统的使用过程中,管理员可以随时增加词汇。
在本发明中,我们设计和实现了一个《用户检索停用字词表》技术。许多文本处理系统都有过滤停用词这道工序,把对文本信息内容不起作用的高频词过滤。停用词策略能节省存储空间和计算时间,不影响系统精度。在《用户检索停用字词表》中,我们收集了与用户检索关系不密切的字、词。所谓“关系不密切”,是指在对用户检索输入串Q分词,并且删除Q中属于《用户检索停用字词表》的分词项后,不影响用户检索输入串Q的最终检索结果。我们将这种词、字称为停用字或停用词(stop words)。在本发明中,我们收集了100多个停用词(字),其中,停用字包括:“的”、“了”、“过”、“从”、“或”、“和”、“与”、“且”,等等;停用词包括“按照”、“并且”、“或者”、“否则”,等等。下面将具体讨论《用户检索中的停用字词表》的用途。
所述对用户检索输入串分词包括以下重要的子模块:
模块H1:对预处理过后的检索输入串进行受限的最大前向分词
对检索输入串Q’=“W1 W2 W3…Wn”进行最大前向分词,记Wi的分词结果为[Wi]={Wi1, Wi2,…, Wij},在分词过程中要求连续的ASCII子串不分开。
例如,令Wi=“159.120.12.0是什么IP地址”,则Wi的分词结果[Wi]={ 159.120.12.0, 是, 什么, IP, 地址},其中连续的ASCII子串“159.120.12.0”和“IP”没有分开,仍然作为一个有意义的分词单位。
模块H2:对用户检索输入串中的分词进行过滤
首先根据《用户检索中的停用字词表》中的停用字、停用词,删除[Wi]中的停用字、停用词。
例如,Wi的分词结果[Wi]={159.120.12.0, 是,什么,IP, 地址},则根据《用户检索中的停用字词表》,从[Wi]删除“是”、“什么”,得到[Wi]’={159.120.12.0, IP, 地址}。可以看出,采用[Wi]或[Wi]’检索知识库所得到的检索结果应该是一致的。
为方便起见,我们在下文中仍然使用[Wi]表示[Wi]’。
模块I:检索设备故障解决方案
所述模块包括三个子模块,即“模块I1:用户检索输入串完善化处理”、“模块I2:根据用户检索输入项中的亚主题词计算对应《设备故障解决方案分类主题词表》中的主题词”、“模块I3:根据加权主题词集合,检索出符合用户输入串Q’的设备故障解决方案检索”构成。
模块I1:用户检索输入串完善化处理
在经过了上述模块G和模块H处理后,我们准确地获得用户检索输入串的分词结果后。但是,由于设备故障解决方案采用正式的主题词进行标引,而用户检索输入项Q’中可能出现简称词、代词、俗称词等不规范的词语,从而影响检索的准确性,因此需要对用户检索输入项Q’进行规范化处理。
另一方面,为了保证针对用户检索输入项Q’的查全率,我们需要对用户检索输入项Q’进行必要的语义扩展。
具体而言,所述用户检索输入串完善化处理包括以下步骤:对用户检索输入Q’中的出现的简称词、代词、俗称词进行规范,根据前述所建的《设备故障解决方案分类主题词表》,将它们转换为对应的正式主题词。具体步骤做法如下:
在用户检索输入串Q’=“W1 W2 W3…Wn”的任意一个Wi的分词结果为[Wi]={Wi1, Wi2,…, Wij}中,对任一一个X?[Wi],如果X在《设备故障解决方案分类主题词表》中存在对应的一个或多个主题词Yk,并且X是Yk的简称(或俗称,或代词),则将上述所有的Yk都加入[Wi]中。
模块I2:根据用户检索输入项中的亚主题词计算对应《设备故障解决方案分类主题词表》中的主题词
首先需要注意,正如前文所述,在《设备故障解决方案分类主题词表》中,每个主题词关联着一组亚主题词。例如,对主题词“通电死机”而言,它所关联的亚主题词集合为{通电,死机}。
在获得了用户检索输入项Q’中的亚主题词集QSS={[W1], [W2], …, [Wi], …, [Wk]}后,本发明需要通过二级索引获得{[W1], …, [Wk]}所对应的《设备故障解决方案分类主题词表》中的主题词,记为QS={S1, S2, …, Sm}。处理流程图如图9所示,具体步骤如下:
步骤I21:基于亚主题词的主题词识别
对QSS={[W1], …, [Wk]}中的每个[Wi]={Wi1, …, Wij},通过图6所示的二级索引,从《设备故障解决方案分类主题词表》中找到含有[Wi]中的某个亚主题词的所有主题词,记为Subj[Wi1], …, Subj[Wij]。即Subj[Wi1], …, Subj[Wij]为分别含有亚主题词Wi1, …, Wij的集合,并且称Subj[Wi1], …, Subj[Wij]分别为Wi1, …, Wij所命中的主题词集合。令Subjects[Wi]=Subj[Wi1]è…èSubj[Wij],称Subjects[Wi]为[Wi]中的亚主题词所命中的主题词集合。
为方便起见,我们用Subjects[QSS]=Subjects[W1]è…èSubjects[Wk]表示QSS所命中的主题词集合。
例如,如果QSS={[W1], [W2]},其中[W1]={W11},W11=“通电”,[W2]={W21},W21=“死机”,并且《设备故障解决方案分类主题词表》中含有“通电”的主题词为“通电故障”、“报错代码”、“通电死机”,含有“死机”的主题词为“开机时死机”、“通电死机”,则Subjects[W1]=Subj[W11]={通电故障,报错代码,通电死机},Subjects[W2]=Subj[W21]={开机时死机,通电死机}。
步骤I22:命中的主题词的权重计算
根据亚主题词命中的主题词的出现次数,计算各个被命中的主题词的加权值。具体步骤如下:令QSS={[W1], [W2], …, [Wi], …, [Wk]}中的每个[Wi]={Wi1, …, Wij},计算QSS的加权主题词集合如下:
Wsubjects[QSS]={(S,a)|$Wi S?Subjects[Wi],且a=?S’?Subjects[S]?Subjects[QSS] log2(N/NS’) / ?S’?Subjects[S] log2(N/NS’)},
其中,N为《设备故障解决方案分类主题词表》中的主题词个数,NS’为《设备故障解决方案分类主题词表》中含有亚主题词S’的主题词的个数。
为方便起见,我们在Wsubjects[QSS]引入一个函数a-value(S, QSS):
如果(S, a) ? Wsubjects[QSS],a-value(S, QSS) = a;
如果(S, a) ? Wsubjects[QSS],a-value(S, QSS) = 0。
步骤I23:基于特异性消耗因子的主题词扩展
按照上述步骤I22确定了Wsubjects[QSS]后,本发明对Wsubjects[QSS]中出现的主题词进行扩展;扩展的目的是增强对Q检索的查全率。
其方法如下:对Wsubjects[QSS]={(S1, a1), …, (Si, ai), … ,(Sn, an)}每个元素(Si, ai),在《设备故障解决方案分类主题词表》中,获得Si的上位主题词Si’,然后将(Si’, ai’)加入到Wsubjects[QSS]中,其中ai’=ai / |Si’|,|Si’|为直接下位主题词的个数,称为特异性消耗因子。
例如,Wsubjects[QSS]={(通电死机, 0.7),(报错代码, 0.45), (通电故障, 0.64)}。令S1=“通电死机”,S1上位主题词为“设备故障”,而“设备故障”的直接下位主题词的个数为4个,则按照上述步骤I23,本发明将(设备故障, 0.7/4),即(设备故障, 0.175)添加到Wsubjects[QSS]中。
模块I3:根据加权主题词集合,检索出符合用户输入串Q’的设备故障解决方案
从Wsubjects[QSS]出发,利用二级索引结构(参见图6)在设备故障解决方案知识库中检索符合用户检索输入串Q’的故障解决方案。处理流程图如图10所示,具体实施步骤如下:
步骤I31. 候选的设备故障解决方案检索
对Wsubjects[QSS]={(S1, a1), …, (Si, ai), … ,(Sn, an)}中的每个元素(Si, ai),从设备故障解决方案知识库中检索标有主题词Si的解决方案。记含有Wsubjects[QSS]中主题词的解决方案的集合为Solutions[QSS]。
步骤I32. 判断候选的设备故障解决方案集合Solutions[QSS]是否为空
如果Solutions[QSS]为空集合,则用户检索输入项Q’没有对应的解决方案,本发明直接提示用户未检索到所需的解决方案。
步骤I33:候选的设备故障解决方案分值计算
该步骤对Solutions[QSS]={Sol1, …, Solj, … Soln}中的解决方案进行评分。对Solutions[QSS]={Sol1, …, Solj, … Soln}中的任一元素Solj,令Subjects[Solj]为Solj中的所有主题词,HSubjects[Solj]为Solj中的出现于Wsubjects[QSS]={(S1, a1), …, (Si, ai), … ,(Sn, an)}中的主题词,记MSubjects[Solj]为Subjects[Solj]与HSubjects[Solj]的差集,即 MSubjects[Solj]=Subjects[Solj] \ HSubjects[Solj]。此时,MSubjects[Solj]为Solj中的没有出现于Wsubjects[QSS]的主题词。本发明定义的设备故障解决方案Solj的分值按照以下公式计算:
score(Solj) = ?S?HSubjects[Solj] a-value(S, QSS) / ?S?Subjects[Solj] a-value(S, QSS)。
步骤I34:根据候选的设备故障解决方案的分值,返回最好的设备故障解决方案
从Solutions[QSS]={Sol1, …, Solj, … Soln}选择q个分值最高的设备解决方案,作为用户检索输入串Q’对应的检索结果返回给用户。其中,q是一个具体阈值,可以根据不同的应用具体设置。在本发明中q的缺省值设为5,即按照top5的最好检索结果返回给用户。
模块J:呈现设备故障解决方案
设备故障解决方案单角色化模块对设备故障解决方案进行单角色的自动分解后,本模块将对其按照不同角色的特点和习惯,提供友好的访问界面,分别进行呈现,以便不同角色(如CC客服人员、咨询工程师、设备用户等)进行检索和浏览。

Claims (6)

1.一种设备故障解决方案知识管理与检索系统,其特征在于:包括具有特殊语义关系的多语种设备故障分类主题词管理模块、设备故障解决方案创建模块、基于主题词和亚主题词的设备故障解决方案检索模块;
具有特殊语义关系的多语种设备故障分类主题词管理模块又包括建立主题词的常见关系模块A、建立主题词的特殊语义关系模块B;
设备故障解决方案创建模块又包括设备故障解决方案检查点创建模块C、设备故障解决方案单角色化模块D;
基于主题词和亚主题词的设备故障解决方案检索模块又包括分类主题词表中的主题词进行亚主题词化模块E、对设备故障解决方案的主题词进行亚主题词化模块F、对用户检索输入串预处理模块G、对用户检索输入串分词模块H、检索设备故障解决方案模块I、呈现设备故障解决方案模块J;
建立主题词的常见关系模块A和建立主题词的特殊语义关系模块B一起工作,形成一个《设备故障解决方案分类主题词表》,供对用户检索输入串预处理模块G、对用户检索输入串分词模块H、检索设备故障解决方案模块I使用;分类主题词表中的主题词进行亚主题词化模块E对《设备故障解决方案分类主题词表》进行亚主题词化,形成亚主题词,并将亚主题词写入“亚主题词-主题词-故障解决方案”索引文件,这一索引文件将被对用户检索输入串预处理模块G、对用户检索输入串分词模块H、检索设备故障解决方案模块I使用;对设备故障解决方案的主题词进行亚主题词化模块F对设备故障解决方案中标引的主题词进行亚主题词化,也同样形成设备故障解决方案亚主题词,并将这些亚主题词写入“亚主题词-主题词-故障解决方案”索引文件,这一索引文件将被对用户检索输入串预处理模块G、对用户检索输入串分词模块H、检索设备故障解决方案模块I使用;设备故障解决方案检查点创建模块块C为设备故障解决方案的创建模块,负责创建所有的设备故障解决方案,并且存入设备故障解决方案库,供检索设备故障解决方案模块I调用;设备故障解决方案单角色化模块D为设备故障解决方案单角色化模块,该模块根据设备故障解决方案库中的解决方案中的角色说明,产生适合于不同角色的解决方案,以便呈现设备故障解决方案模块J呈现给不同角色的方案用户。
2.根据权利要求1所述的一种设备故障解决方案知识管理与检索系统,其特征在于:所述的设备故障解决方案检查点创建模块C包括设备故障解决方案最上层检查点创建模块C1、设备故障解决方案检查点创建模块C2、设备故障解决方案的提示性检查点创建模块C3;其中,设备故障解决方案最上层检查点创建模块C1创建设备故障解决方案最上层检查点后,由设备故障解决方案检查点创建模块C2接着对设备故障解决方案最上层检查点进行细化,同时由设备故障解决方案的提示性检查点创建模块C3创建设备故障解决方案中的提示性检查点。
3.根据权利要求1所述的一种设备故障解决方案知识管理与检索系统,其特征在于: 所述的对用户检索输入串分词模块H包括对预处理过后的检索输入串进行受限的最大前向分词模块H1、对用户检索输入串中的分词进行过滤模块H2;其中,对预处理过后的检索输入串进行受限的最大前向分词模块H1对对预处理过后的检索输入串进行受限的最大前向分词后,将分词结果传给对用户检索输入串中的分词进行过滤模块H2,由对用户检索输入串中的分词进行过滤模块H2对分词结果进行过滤。
4.根据权利要求1所述的一种设备故障解决方案知识管理与检索系统,其特征在于:所述的检索设备故障解决方案模块I包括用户检索输入串完善化处理模块I1、根据用户检索输入项中的亚主题词计算对应《设备故障解决方案分类主题词表》中的主题词模块I2、根据加权主题词集合检索出符合用户输入串Q’的设备故障解决方案检索模块I3;其中,用户检索输入串完善化处理模块I1对用户检索输入串完善化处理后,根据用户检索输入项中的亚主题词计算对应《设备故障解决方案分类主题词表》中的主题词模块I2找到用户检索输入串中的亚主题词所对应的《设备故障解决方案分类主题词表》中的主题词,再由设备故障解决方案检索模块I3根据加权主题词集合检索出符合用户输入串Q’的检索出上述主题词对应的设备故障解决方案。
5.一种设备故障解决方案知识管理与检索方法,其特征在于:包括以下步骤:
步骤1:建立主题词的常见关系,对任意一个主题词,知识管理员给出该主题词与其它主题词之间的属、分、参、用、代五种语义关系,并且将上述关系存入《设备故障解决方案分类主题词表》;
步骤2:建立主题词的特殊语义关系,对任意一个主题词,知识管理员按照系统提示给出该主题词4种简称关系、俗称关系、错别字关系、多语种翻译关系,并且将上述关系存入《设备故障解决方案分类主题词表》;
步骤3:设备故障解决方案检查点创建,所述步骤又包括以下实施子步骤:
步骤3-1:设备故障解决方案最上层检查点创建:首先建立设备故障解决方案最上层的检查点,根据检查点的具体内涵,采用四元组即<序号>,<权限>,<任务>,<子检查点序列>的形式,或者四元组即<序号>,<权限>,<任务>,<任务结果—建议>的形式,建立所有设备故障解决方案最上层的检查点;
步骤3-2:设备故障解决方案检查点创建
所述“任务结果—建议”,具体包括以下两种不同的技术形式,采用两种不同的创建子步骤:
步骤3-2-1:创建“任务结果—建议”Result:权限::转检查点<序号>
其含义为,当所述任务问题的子任务结果为Result,并且方案用户具有“权限”时,设备故障解决方案的“后续动作”为转到序号为<序号>的检查点继续解决设备故障;
步骤3-2-2:创建“任务结果—建议”Result::故障排除
其含义为,当所述任务结果为Result时,设备故障解决方案的“后续动作”为“故障排除”,也即设备故障解决方案已经成功地解决了设备故障;
步骤3-3:设备故障解决方案的提示性检查点创建
     所述设备故障解决方案检查点,还包括以下六种特殊的提示性的检查点,作为整个设备故障解决方案的补充部分,具体创建子步骤如下:
步骤3-3-1:建立CC话务员诊断成功提示:“CC话务员→诊断成功,故障单元为{<故障单元1>,…,<故障单元j>,…, <故障单元m>};但是,无法排除故障,需要为设备用户产生上门服务派单,由咨询工程师与设备用户确定上门服务时间”;
步骤3-3-2:建立CC话务员诊断失败提示:“CC话务员→诊断失败,已经发现的故障单元为{<故障单元1>,…,<故障单元j>,…, <故障单元m>},为设备用户产生上门服务派单,由咨询工程师与设备用户确定上门服务时间”;
步骤3-3-3:建立设备用户诊断成功提示:“设备用户→诊断成功,故障单元为{<故障单元1>,…,<故障单元j>,…, <故障单元m>};但是,无法排除故障,需要为设备用户产生上门服务派单,由咨询工程师与设备用户确定上门服务时间”;
步骤3-3-4:建立设备用户诊断失败提示:“设备用户→诊断失败,已经发现的故障单元为{<故障单元1>,…,<故障单元j>,…, <故障单元m>},需要派单上门或到维修站服务,请拨打咨询电话<咨询电话号>进行预约”;
步骤3-3-5:建立咨询工程师诊断失败提示:“咨询工程师→诊断失败,已经发现的故障单元为{<故障单元1>,…,<故障单元j>,…, <故障单元m>};请咨询工程师,电话为<咨询工程师电话号>”;
     步骤3-3-6:建立权限参见提示:“权限→参见<设备故障解决方案号>”;
步骤4:设备故障解决方案单角色化,对给定的一个角色和一条设备故障解决方案,从该解决方案中删除与给定角色无关的内容,所保留下来的内容就是给定角色的设备故障解决方案单角色化结果;
步骤5:对分类主题词表中的主题词进行亚主题词化,从分类主题词表中逐一取出主题词,记为Subject;对该主题词调用前向最大匹配分词算法进行分词,形成亚主题词;将亚主题词写入“亚主题词-主题词-故障解决方案”索引文件;
步骤6:对设备故障解决方案的主题词进行亚主题词化,从设备故障解决方案知识库中逐一读入标引了主题词的设备故障解决方案,记为Solution,将Solution中的主题词写入“亚主题词-主题词-故障解决方案”索引文件,从而建立了从主题词到Solution的倒排索引;
步骤7:接收用户输入串,记为Q;
步骤8:对用户检索输入串预处理,具体包括包括以下4个实施子步骤:
步骤8-1:消除检索输入串Q前、后的空白字符;
步骤8-2:消除检索输入串Q中的两个连续ASCII串之间的多个空白字符,使得它们之间只保留一个ASCII空格符;
步骤8-3:将检索输入串Q中的全角字符统一转换为半角字符,同时对检索输入串Q中的ASCII字母全部转化为小写形式;
步骤8-4:针对用户在检索输入串Q’中可能输入的错别字,本模块从《设备故障解决方案分类主题词表》中找到对应的正确的主题词,替代错别字;
以下为了方便起见,在以下步骤中,我们使用“用户检索输入串Q’”来指代经过所述的上述步骤8-1至步骤8-4处理过后所得到的用户检索输入串Q’;
步骤9:对用户检索输入串分词,对经过预处理后的用户检索输入串Q’=W1 W2 W3…Wn中的每一个Wi(1≤i≤n)进行分词,分词策略采用前向最大匹配方法,该匹配方法分词依赖于词典的设计,为了分词的准确性,我们除了采用《设备故障解决方案分类主题词表》外,还需要使用《通用检索词典》和《用户检索停用字词表》;
对用户检索输入串分词包括以下重要的实施子步骤:
步骤9-1:对预处理过后的检索输入串进行受限的最大前向分词,即对检索输入串Q’=“W1 W2 W3…Wn”进行最大前向分词,记Wi的分词结果为[Wi]={Wi1, Wi2,…, Wij},在分词过程中要求连续的ASCII子串不分开;
步骤9-2:对用户检索输入串中的分词进行过滤
首先根据《用户检索中的停用字词表》中的停用字、停用词,删除[Wi]中的停用字、停用词;
步骤10:检索设备故障解决方案,具体包括以下子步骤:
步骤10-1:用户检索输入串完善化处理,在用户检索输入串Q’=“W1 W2 W3…Wn”的任意一个Wi的分词结果为[Wi]={Wi1, Wi2,…, Wij}中,对任一一个X?[Wi],如果X在《设备故障解决方案分类主题词表》中存在对应的一个或多个主题词Yk,并且X是Yk的简称或俗称,或代词,则将上述所有的Yk都加入[Wi]中;
步骤10-2:根据用户检索输入项中的亚主题词计算对应《设备故障解决方案分类主题词表》中的主题词;在获得了用户检索输入项Q’中的亚主题词集QSS={[W1], [W2], …, [Wi], …, [Wk]}后,通过二级索引获得{[W1], …, [Wk]}所对应的《设备故障解决方案分类主题词表》中的主题词,记为QS={S1, S2, …, Sm};具体实施子步骤如下:
步骤10-2-1:基于亚主题词的主题词识别,对QSS={[W1], …, [Wk]}中的每个[Wi]={Wi1, …, Wij},通过二级索引,从《设备故障解决方案分类主题词表》中找到含有[Wi]中的某个亚主题词的所有主题词,记为Subj[Wi1], …, Subj[Wij];即Subj[Wi1], …, Subj[Wij]为分别含有亚主题词Wi1, …, Wij的集合,并且称Subj[Wi1], …, Subj[Wij]分别为Wi1, …, Wij所命中的主题词集合;令Subjects[Wi]=Subj[Wi1]è…èSubj[Wij],称Subjects[Wi]为[Wi]中的亚主题词所命中的主题词集合;
为方便起见,我们用Subjects[QSS]=Subjects[W1]è…èSubjects[Wk]表示QSS所命中的主题词集合;
步骤10-2-2:命中的主题词的权重计算,根据亚主题词命中的主题词的出现次数,计算各个被命中的主题词的加权值;具体步骤如下:令QSS={[W1], [W2], …, [Wi], …, [Wk]}中的每个[Wi]={Wi1, …, Wij},计算QSS的加权主题词集合如下:
Wsubjects[QSS]={(S,a)|$Wi S?Subjects[Wi],且a=?S’ log2(N/NS’) / ?S’ log2(N/NS’)},其中,N为《设备故障解决方案分类主题词表》中的主题词个数,NS’为《设备故障解决方案分类主题词表》中含有亚主题词S’的主题词的个数;
步骤10-2-3:基于特异性消耗因子的主题词扩展,对Wsubjects[QSS]={(S1, a1), …, (Si, ai), … ,(Sn, an)}每个元素(Si, ai),在《设备故障解决方案分类主题词表》中,获得Si的上位主题词Si’,然后将(Si’, ai’)加入到Wsubjects[QSS]中,其中ai’=ai / |Si’|,|Si’|为直接下位主题词的个数,称为特异性消耗因子;
步骤10-3:根据加权主题词集合,检索出符合用户输入串Q’的设备故障解决方案;从Wsubjects[QSS]出发,利用二级索引结构在设备故障解决方案知识库中检索符合用户检索输入串Q’的故障解决方案;具体实施子步骤如下:
步骤10-3-1. 候选的设备故障解决方案检索,对Wsubjects[QSS]={(S1, a1), …, (Si, ai), … ,(Sn, an)}中的每个元素(Si, ai),从设备故障解决方案知识库中检索标有主题词Si的解决方案;记含有Wsubjects[QSS]中主题词的解决方案的集合为Solutions[QSS];
步骤10-3-2. 判断候选的设备故障解决方案集合Solutions[QSS]是否为空,如果Solutions[QSS]为空集合,则用户检索输入项Q’没有对应的解决方案,则直接提示用户未检索到所需的解决方案;
步骤10-3-3:候选的设备故障解决方案分值计算,即该步骤对Solutions[QSS]={Sol1, …, Solj, … Soln}中的解决方案进行评分;对Solutions[QSS]={Sol1, …, Solj, … Soln}中的任一元素Solj,令Subjects[Solj]为Solj中的所有主题词,HSubjects[Solj]为Solj中的出现于Wsubjects[QSS]={(S1, a1), …, (Si, ai), … ,(Sn, an)}中的主题词,记MSubjects[Solj]为Subjects[Solj]与HSubjects[Solj]的差集,即 MSubjects[Solj]=Subjects[Solj] \ HSubjects[Solj];此时,MSubjects[Solj]为Solj中的没有出现于Wsubjects[QSS]的主题词;定义的设备故障解决方案Solj的分值按照以下公式计算:
score(Solj) = ?S?HSubjects[Solj] a-value(S, QSS) / ?S?Subjects[Solj] a-value(S, QSS)
步骤10-3-4:根据候选的设备故障解决方案的分值,返回最好的设备故障解决方案,从Solutions[QSS]={Sol1, …, Solj, … Soln}选择q个分值最高的设备解决方案,作为用户检索输入串Q’对应的检索结果返回给用户;其中,q是一个具体阈值,可以根据不同的应用具体设置;在本处q的缺省值设为5,即按照top5的最好检索结果返回给用户;
步骤11:呈现设备故障解决方案,设备故障解决方案单角色化模块对设备故障解决方案进行单角色的自动分解后,本模块将对其按照不同角色的特点和习惯,提供友好的访问界面,分别进行呈现,以便不同角色进行检索和浏览。
6.根据权利要求5所述的一种设备故障解决方案知识管理与检索方法,其特征在于:所述步骤9中的《通用检索词典》包括以下常见词:总是、经常、时常;为什么、什么、怎么、哪些、这些;系统、过程、技术、方法、方案、模块;因为、所以、如果、那么;是、不是、没有、尚未;《用户检索停用字词表》中停用字包括:“的”、“了”、“过”、“从”、“或”、“和”、“与”、“且”;停用词包括“按照”、“并且”、“或者”、“否则”。
CN 201110089547 2010-12-24 2011-04-10 一种设备故障解决方案知识管理与检索系统及方法 Active CN102346756B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110089547 CN102346756B (zh) 2010-12-24 2011-04-10 一种设备故障解决方案知识管理与检索系统及方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201010606839.1 2010-12-24
CN201010606839 2010-12-24
CN 201110089547 CN102346756B (zh) 2010-12-24 2011-04-10 一种设备故障解决方案知识管理与检索系统及方法

Publications (2)

Publication Number Publication Date
CN102346756A CN102346756A (zh) 2012-02-08
CN102346756B true CN102346756B (zh) 2013-04-03

Family

ID=45545439

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110089547 Active CN102346756B (zh) 2010-12-24 2011-04-10 一种设备故障解决方案知识管理与检索系统及方法

Country Status (1)

Country Link
CN (1) CN102346756B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103365910B (zh) * 2012-04-06 2017-02-15 腾讯科技(深圳)有限公司 一种信息检索的方法和系统
CN105447016B (zh) * 2014-08-18 2018-09-14 北大方正集团有限公司 一种组件的快速搜索及重用的办法
CN105528349B (zh) * 2014-09-29 2019-02-01 华为技术有限公司 知识库中问句解析的方法及设备
CN106294038B (zh) * 2015-05-25 2019-10-18 阿里巴巴集团控股有限公司 一种故障谱的生成、基于故障谱的检测方法和装置
CN105894747B (zh) * 2016-03-25 2020-05-08 国家电网公司 一种基于监控专家知识库的告警信号处置决策建议方法
CN108574585B (zh) * 2017-03-08 2021-07-06 中国移动通信集团内蒙古有限公司 一种系统故障解决方案获取方法及装置
CN109213773B (zh) * 2017-07-06 2023-02-10 阿里巴巴集团控股有限公司 一种在线故障的诊断方法、装置及电子设备
US20200210855A1 (en) * 2018-12-28 2020-07-02 Robert Bosch Gmbh Domain knowledge injection into semi-crowdsourced unstructured data summarization for diagnosis and repair
CN110135598A (zh) * 2019-05-16 2019-08-16 兰州交通大学 一种基于知识服务的高速铁路电务维护辅助系统
CN114726899A (zh) * 2022-03-09 2022-07-08 上海有间建筑科技有限公司 一种智慧运维用日常巡检的管理系统及管理方法
CN114818666B (zh) * 2022-04-26 2023-03-28 广东外语外贸大学 一种汉语语法纠错的评估方法、装置、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030041277A (ko) * 2001-11-19 2003-05-27 김남준 가상 데이터베이스를 이용한 이아이피 솔루션 제공방법
CN1650274A (zh) * 2002-12-26 2005-08-03 富士通株式会社 操作管理方法和操作管理服务器
CN1658167A (zh) * 2004-02-16 2005-08-24 松下电器产业株式会社 故障管理方法及装置
JP2006244404A (ja) * 2005-03-07 2006-09-14 Nec Corp 障害復旧システム、障害復旧装置、ルール作成方法、および障害復旧プログラム
CN101582811A (zh) * 2008-05-13 2009-11-18 新奥特(北京)视频技术有限公司 一种建立网络监控和运维管理一体化的方法
CN101582812A (zh) * 2008-05-13 2009-11-18 新奥特(北京)视频技术有限公司 一种监控运维管理系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030041277A (ko) * 2001-11-19 2003-05-27 김남준 가상 데이터베이스를 이용한 이아이피 솔루션 제공방법
CN1650274A (zh) * 2002-12-26 2005-08-03 富士通株式会社 操作管理方法和操作管理服务器
CN1658167A (zh) * 2004-02-16 2005-08-24 松下电器产业株式会社 故障管理方法及装置
JP2006244404A (ja) * 2005-03-07 2006-09-14 Nec Corp 障害復旧システム、障害復旧装置、ルール作成方法、および障害復旧プログラム
CN101582811A (zh) * 2008-05-13 2009-11-18 新奥特(北京)视频技术有限公司 一种建立网络监控和运维管理一体化的方法
CN101582812A (zh) * 2008-05-13 2009-11-18 新奥特(北京)视频技术有限公司 一种监控运维管理系统

Also Published As

Publication number Publication date
CN102346756A (zh) 2012-02-08

Similar Documents

Publication Publication Date Title
CN102346756B (zh) 一种设备故障解决方案知识管理与检索系统及方法
CN104408093B (zh) 一种新闻事件要素抽取方法与装置
US9740685B2 (en) Generation of natural language processing model for an information domain
US20130311467A1 (en) System and method for resolving entity coreference
CN107430612A (zh) 查找描述对计算问题的解决方案的文档
BR112014028739B1 (pt) Sistema e método para criar objetos estruturados de evento
CN111899829B (zh) 一种基于icd9/10分词词库的全文检索匹配引擎
CN102439590A (zh) 用于自然语言文本的自动语义标注的系统和方法
Sahu et al. Prashnottar: a Hindi question answering system
CN112163681A (zh) 设备故障原因确定方法、存储介质以及电子设备
CN103593335A (zh) 基于本体一致性验证推理的中文语义校对方法
WO2022095637A1 (zh) 一种故障日志分类方法、系统、设备以及介质
US20070136220A1 (en) Apparatus for learning classification model and method and program thereof
CN111369980A (zh) 语音检测方法、装置、电子设备及存储介质
CN109522396B (zh) 一种面向国防科技领域的知识处理方法及系统
CN112433874A (zh) 一种故障定位方法、系统、电子设备及存储介质
AU2019200371A1 (en) Utilizing artificial intelligence to integrate data from multiple diverse sources into a data structure
CN102693314B (zh) 一种基于事件搜索的敏感信息监控方法
CN113157860A (zh) 一种基于小规模数据的电力设备检修知识图谱构建方法
CN111190873B (zh) 一种用于云原生系统日志训练的日志模式提取方法及系统
CN117436440A (zh) 一种日志识别方法、系统、终端设备及存储介质
WO2014020833A1 (ja) 不具合発生原因抽出装置、不具合発生原因抽出方法および不具合発生原因抽出プログラム
Yangarber et al. Redundancy-based correction of automatically extracted facts
Gong et al. VB-PTC: Visual Block Multi-Record Text Extraction Based on Sensor Network Page Type Conversion
Wang et al. FastTransLog: A Log-based Anomaly Detection Method based on Fastformer

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP03 Change of name, title or address

Address after: 212009 Zhenjiang high tech Industrial Development Zone, Jiangsu, No. 668, No. twelve road.

Patentee after: Zhongke national power (Zhenjiang) Intelligent Technology Co., Ltd.

Address before: 212009 18 building, North Tower, Twin Tower Rd 468, twelve road 468, Ding Mo Jing, Jiangsu.

Patentee before: Knowology Intelligent Technology Co., Ltd.

CP03 Change of name, title or address