CN109471929A - 一种基于图谱匹配进行设备维修记录语义搜索的方法 - Google Patents
一种基于图谱匹配进行设备维修记录语义搜索的方法 Download PDFInfo
- Publication number
- CN109471929A CN109471929A CN201811311502.0A CN201811311502A CN109471929A CN 109471929 A CN109471929 A CN 109471929A CN 201811311502 A CN201811311502 A CN 201811311502A CN 109471929 A CN109471929 A CN 109471929A
- Authority
- CN
- China
- Prior art keywords
- failure
- equipment
- map
- search
- record
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012423 maintenance Methods 0.000 title claims abstract description 77
- 238000000034 method Methods 0.000 title claims abstract description 56
- 230000015556 catabolic process Effects 0.000 claims abstract description 37
- 230000003595 spectral effect Effects 0.000 claims abstract description 36
- 238000007781 pre-processing Methods 0.000 claims abstract description 5
- 230000008569 process Effects 0.000 claims description 13
- 239000012634 fragment Substances 0.000 claims description 11
- 238000003860 storage Methods 0.000 claims description 7
- 238000010191 image analysis Methods 0.000 claims description 6
- 239000002773 nucleotide Substances 0.000 claims description 4
- 125000003729 nucleotide group Chemical group 0.000 claims description 4
- 238000001228 spectrum Methods 0.000 claims description 4
- 230000004888 barrier function Effects 0.000 claims 1
- 238000003825 pressing Methods 0.000 description 10
- 238000005286 illumination Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 241000406668 Loxodonta cyclotis Species 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/20—Administration of product repair or maintenance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/04—Manufacturing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Marketing (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Manufacturing & Machinery (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种基于图谱匹配进行设备维修记录语义搜索的方法。所述方法包括如下步骤:(一)、构建工业设备分类体系和词典,并录入数据库存储;(二)、故障维修记录预处理;(三)、获取故障描述的图谱片段;(四)、获取故障描述的扩展图谱片段;(五)、获取故障描述的模板信息;(六)、组合搜索策略,至少包括精准搜索、语义容纳搜索、设备组合搜索、设备向下搜索、故障向下搜索、设备向上搜索、故障向上搜索。该方法在将自然语言描述的故障现象图谱化的基础上,针对不同的应用场景,提供图谱匹配搜索的基础方法,能够实现精准理解用户意图的、快速的设备维修记录语义搜索。
Description
技术领域
本发明涉及信息利用技术,具体涉及一种在将自然语言描述的故障现象图谱化的基础上,针对不同的应用场景,提供图谱匹配搜索的基础方法,能够实现精准理解用户意图的、快速的设备维修记录语义搜索。
背景技术
智能运维是智能制造的重要环节,也是企业产业转型升级的重要方面。在长期的生产运行中,企业积累了大量设备维修历史数据,包括设备故障现象、故障原因和维修方案等信息。如何最大化的利用这些大量的设备维修历史数据,对企业在后续运维中快速、精准地发现设备故障原因、并采取维修对策具有重要意义。
由于这些维修记录大多采用自然语言描述,在运维期间由不同的报修人员、维修人员按不同的方式表达。按照关键词的传统搜索方法,很难找到或找全语义相同或相近的维修记录来辅助维修,以往积累的丰富的维修知识只能封存在历史维修记录中,无法充分发挥其应有的价值。
我们发明的“一种将设备故障语句描述转换为知识图谱表达的方法”,将历史维修文本记录结构化、语义化和知识化。本发明就是在此基础上,针对不同的应用场景,提供图谱匹配搜索的基础方法,帮助人们快速准确的搜索到语义相同或相近的维修知识,为维修人员提供有价值的维修信息,极大地提高运维效率。
发明内容
本发明的目的是为了帮助人们针对不同的应用场景快速准确的搜索到语义相同或相近的维修知识,提供一种基于图谱匹配进行设备维修记录语义搜索的方法,该方法在将自然语言描述的故障现象图谱化的基础上,针对不同的应用场景,提供图谱匹配搜索的基础方法,能够实现精准理解用户意图的、快速的设备维修记录语义搜索。
为了解决上述现有技术问题,本发明的技术方案是:
本发明一种基于图谱匹配进行设备维修记录语义搜索的方法,
所述方法包括如下步骤:
(一)、构建工业设备分类体系和词典,并录入数据库存储;
(二)、故障维修记录预处理,在数据库中创建故障维修记录表,所述故障维修记录表至少包括故障描述、图谱片段、扩展图谱片段、模板信息四个字段,然后利用语义图谱生成工具对故障维修记录表进行预处理;
(三)、获取故障描述的图谱片段;
(四)、获取故障描述的扩展图谱片段;
(五)、获取故障描述的模板信息;
(六)、组合搜索策略,至少包括精准搜索、语义容纳搜索、设备组合搜索、设备向下搜索、故障向下搜索、设备向上搜索、故障向上搜索。
所述步骤(一)包括:构建全面的工业设备分类体系,所述工业设备分类体系优选包括分类大纲、主从类表、类目索引、类目注释以及后控制词表,优选设置3级~5级,对具有纵向关系的类目进行设计,需要充分体现出各类目间的上下位类关系或者从属等级关系,对具有横向关系的类目进行设计,体现出各类目间的同位类关系或并列相关关系,然后根据工业设备分类体系构建设备及组件词典、状态词典、程度词词典、同义词词典,还包括构建关系词典,然后将上述所有词典通过数据库的对应数据表存储,所述数据库为文档型数据库。
所述步骤(二)包括:所述语义图谱生成工具以接口的方式提供服务,所述预处理由接口对故障维修记录表的若干故障描述进行处理,并返回若干故障描述分别相对应的图谱片段、扩展图谱片段、模板信息并存储进故障维修记录表中相对应的图谱片段、扩展图谱片段、模板信息字段;所述预处理采用POST查询方式,所述预处理返回值为json格式,所述POST查询方式的Header中设置Content-Type健值为application/x-www-form-urlencoded,所述POST查询方式还包括开始编号、处理条数两个输入参数;
所述步骤(三)、步骤(四)、步骤(五)通过语义图谱接口实现,所述接口输入参数至少包括用户输入的故障描述;
所述步骤(三)的接口返回值包括所述故障描述的图谱片段序列,所述图谱片段序列优选为图谱片段的标识符序列,所述图谱片段序列优选为按照从左到右的规律返回;
所述步骤(四)的接口返回值包括所述故障描述的扩展图谱片段序列,所述扩展图谱片段序列优选为扩展图谱片段的标识符序列,所述扩展图谱用于从设备的组合关系角度对故障描述进行简化表示;
所述步骤(五)的接口返回值包括输入的故障描述对应的句型模板ID,该语义图谱接口将故障描述归纳为9个句型模板,在搜索中选择其中占比最重的三个模板来分析,这三个模板分别为实体—属性、实体—实体—属性、实体-实体-属性,模板信息主要在上下层搜索策略中使用其返回值是一个整型的模板序号。
所述组合搜索策略用于满足更具体、更复杂的用户需求,所述组合搜索策略采用接口方式;
所述精准搜索用于搜索与输入故障描述语义完全相同的记录,所述精准搜索包括首先获取输入故障描述的图谱化序列,然后在经过预处理的故障维修记录中查找与输入故障描述的图谱化序列完全一致的记录,最后将搜索结果以json的形式返回给用户;
所述语义容纳搜索是指搜索结果包含有输入故障描述语义的记录,首先获取输入故障描述的图谱化序列,然后在经过预处理的故障维修记录中查找包括输入故障描述的图谱化序列的记录,最后将搜索结果以json的形式返回给用户;
所述设备容器搜索是指依据设备的组成关系搜索是否有对输入故障描述进行细化扩展的故障记录,首先获取输入故障描述的扩展图谱序列,然后在经过预处理的故障维修记录中查找包括输入故障描述的扩展图谱序列的记录,最后将搜索结果以json的形式返回给用户;
所述设备向下搜索是指依据设备的分类体系搜索设备的下层设备发生该故障的记录,此过程分为四个阶段:第一阶段,确定设备主体,首先获取输入故障描述的图谱序列和模板序号,然后根据模板确定设备主体一般我们认为最后一个设备实体为设备主体;第二阶段,在设备分类体系中查找设备主体的下层设备列表,设备体系以树的形式存储在数据库中;第三阶段,将原图谱片段中所有设备主体所在的位置都替换成其下层设备,生成新的图谱片段,然后在经过预处理的故障维修记录中查找与新的图谱化序列完全一致的记录,最后将搜索结果以json的形式返回给用户。
所述故障向下搜索是指依据故障的分类体系搜索故障的下层故障发生在该设备上的记录,此过程分为四个阶段:第一阶段,确定故障主体,首先获取输入故障描述的图谱序列和模板序号;第二阶段,在故障分类体系中查找故障主体的下层故障列表,故障分类体系以树的形式存储在数据库中;第三阶段,将原图谱片段中所有故障主体所在的位置都替换成其下层故障,生成新的图谱片段;第四阶段,在经过预处理的故障维修记录中查找与新的图谱化序列完全一致的记录,最后将搜索结果以json的形式返回给用户。
所述设备向上搜索是指依据设备的分类体系搜索设备的下层设备发生该故障现象的记录,此过程分为四个阶段:第一阶段,确定设备主体,首先获取输入故障描述的图谱序列和模板序号,然后根据模板确定设备主体,一般我们认为最后一个设备实体为设备主体;第二阶段,在设备分类体系中查找设备主体的上层设备列表,设备分类体系以树的形式存储在数据库中;第三阶段,将原图谱片段中所有设备主体所在的位置都替换成其上层设备,生成新的图谱片段;第四阶段,在经过预处理的故障维修记录中查找与新的图谱化序列完全一致的记录,最后将搜索结果以json的形式返回给用户。
所述故障向上搜索是指依据故障的分类体系搜索故障的上层故障发生在该设备上的记录,此过程分为四个阶段:第一阶段,确定故障主体。首先获取输入故障描述的图谱序列和模板序号,然后根据模板确定设备主体一般我们认为第一个故障实体为故障主体;第二阶段,在故障分类体系中查找故障主体的上层故障列表,故障分类体系以树的形式存储在数据库中;第三阶段,将原图谱片段中所有故障主体所在的位置都替换成其上层故障,生成新的图谱片段;第四阶段,在经过预处理的故障维修记录中查找与新的图谱化序列完全一致的记录,最后将搜索结果以json的形式返回给用户。
本发明一种基于图谱匹配进行设备维修记录语义搜索的方法,其有益效果有:
1、本发明提供图谱匹配搜索的基础方法,实现能够精准理解用户意图的、快速的语义搜索,帮助人们从自然语言描述的设备维修记录中快速准确的搜索到语义相同或相近的维修知识,为维修人员提供有价值的维修信息,提高运维效率;
2、提供七种基础搜索策略,用于满足用户的一般搜索需求,在更复杂的应用场景和需求下,可以组合多个基础搜索策略;
3、该方法使得设备维修知识检索简单方便,不要求使用者联机采集设备运行状态数据或了解每种设备运行状态数据的专业知识,就能高效精准地获得需要的设备维修知识。
附图说明
图1,为本发明一种基于图谱匹配进行设备维修记录语义搜索的方法的流程图;
图2,为本发明一种基于图谱匹配进行设备维修记录语义搜索的方法的获取故障描述的图谱片段的实例流程图;
图3,为本发明一种基于图谱匹配进行设备维修记录语义搜索的方法的获取故障描述的扩展图谱片段的实例流程图;
图4,为本发明一种基于图谱匹配进行设备维修记录语义搜索的方法的获取故障描述的模板信息的实例流程图。
具体实施方式
下面结合实施例对本发明作进一步说明:
实施例
一种基于图谱匹配进行设备维修记录语义搜索的方法,涉及工业设备智能维修、医疗智能诊断、智能决策等多个领域,实现步骤如下:
(一)、构建工业设备分类体系和词典,并录入数据库存储;
(二)、故障维修记录预处理;
(三)、获取故障描述的图谱片段;
(四)、获取故障描述的扩展图谱片段;
(五)、获取故障描述的模板信息;
(六)、组合搜索策略。
(一)、构建工业设备分类体系和词典,并录入数据库存储
工业设备分类体系是进行语义搜索的基础,分类体系类目设置的科学与否,将直接关系到知识图谱构建的效果,工业设备分类体系结构由分类大纲、主从类表、类目索引、类目注释以及后控制词表等组成;在类目层级的划分上,设置3级~5级;如果类目层级设置太少,则可能会影响到分类体系的清晰度,不便于用户的选择和应用;如果设置地过多,又可能会影响到用户的检索效率。对具有纵向关系的类目进行设计,需要充分体现出各类目间的上下位类关系或者从属等级关系,这样,类目间的逻辑关系一目了然,也便于用户进行收缩或扩展检索;而对具有横向关系的类目进行设计,则应尽量体现出各类目间的同位类关系或并列相关关系这样,可以达到触类旁通的效果,有助于启发用户进行其他相关检索。
考虑到具有同位类关系的类目可能较多,因此工业设备分类体系采用文档型数据库存储;文档型数据库相比较关系型数据库,有以下几个优势:1、文档型数据库可以通过增加普通服务器来分布式地无限水平扩展,而关系型数据库只能纵向扩展,想扩展容量需要购买容量更大的服务器,因此在数据量大的时候文档型数据库更加经济,2、文档型数据库的存储模式更加灵活,无需像关系型数据库遵循固定的数据模式,能够支持更加复杂的建模和查询方式,3、文档型数据库去结构化的存储方式节约了存储空间,对存取速度的支持远高于关系型数据库。
(二)、故障维修记录预处理;
对数据库中的故障维修记录进行批量的预处理,要求故障维修记录表必须含有的字段为fault_description(故障描述字段)、kg_id(存储图谱描述片段)、ext_kg_id(存储扩展图谱片段)、template_id(存储模板信息);语义图谱生成工具以接口的方式提供服务,其接口说明如下:
·请求方式
POST
·Header
KEY | VALUE |
Content-Type | application/x-www-form-urlencoded |
·Body
KEY | NULL | TYPE | EXAMPLE | DESCRIPTION |
start | N | int | 0 | 开始编号 |
num | N | int | 10 | 处理条数 |
·返回示例(JSON)
{
"error":5
}
·响应码列表
(三)、获取故障描述的图谱片段;
利用语义图谱工具,可以对用户输入的故障描述进行图谱化,返回该描述语句对应的图谱片段序列,图谱片段序列一般按照从左到右的规律返回,图谱片段是所有搜索策略的最小操作粒度。
如图2,例如当输入“压装机照明灯故障”这句话时,该故障描述可以分解为两个图谱片段:“压装机—照明灯”、“照明灯——故障”,而输出的kg_id字符串中的2840和367就分别代表这两个图谱片段的序号,kg_id即返回的图谱片段序列,每个分号代表一句话,每个逗号代表一个图谱片段。
(四)、获取故障描述的扩展图谱片段;
利用语义图谱工具,可以获取用户输入描述对应的扩展图谱,扩展图谱主要在组合搜索策略中,是从设备的组合关系角度对故障描述进行简化表示,扩展图谱的返回格式与图谱化一致。
如图3,ext_kg_id即返回的扩展图谱序列,由于压装机与照明灯为组合关系,“压装机照明灯故障”就可以简化为“压装机故障”,而1362即“压装机—故障”这个图谱片段的序号。
(五)、获取故障描述的模板信息;
利用语义图谱工具,可以获取用户输入描述对应的模板ID,该工具将故障描述归纳为9个模板,我们在搜索中选择其中占比最重的三个模板来分析,这三个模板分别为实体—属性、实体—实体—属性、实体—实体—属性。模板信息主要在上下层搜索策略中使用其返回值是一个整型的模板序号。
如图4,template_id即返回的模板序号,“压装机照明灯故障”由语义图谱工具识别为“实体—实体-属性”模板,因此返回序列号为2。
(六)、组合搜索策略。
七个基础搜索策略来满足用户的日常搜索需求,在更复杂的应用场景下,还可以用多个基础搜索策略的组合,达到理想的搜索结果。这七个搜索策略为:精准搜索、语义容纳搜索、设备组合搜索、设备向下搜索、故障向下搜索、设备向上搜索、故障向上搜索。这些搜索策略都以接口的方式对用户提供服务。
(1)精准搜索
精准搜索是指搜索与输入故障描述语义完全相同的记录。首先获取输入故障描述的图谱化序列,然后在经过预处理的故障维修记录中查找kg_id字段与输入故障描述的图谱化序列完全一致的记录,最后将搜索结果以json的形式返回给用户。
·请求方法
POST
·Header
KEY | VALUE |
Content-Type | application/x-www-form-urlencoded |
·Body
KEY | NULL | TYPE | EXAMPLE |
kw | N | String | 压装机故障 |
·返回示例(JSON)
(2)语义容纳搜索
语义容纳搜索是指搜索结果包含有输入故障描述语义的记录。首先获取输入故障描述的图谱化序列,然后在经过预处理的故障维修记录中查找kg_id字段的值包括输入故障描述的图谱化序列的记录,最后将搜索结果以json的形式返回给用户。
·请求方法
POST
·Header
KEY | VALUE |
Content-Type | application/x-www-form-urlencoded |
·Body
KEY | NULL | TYPE | EXAMPLE |
kw | N | String | 压装机故障 |
·返回示例(Json)
(3)设备容器搜索
设备容器搜索是指依据设备的组成关系搜索是否有对输入故障描述进行细化扩展的故障记录。首先获取输入故障描述的扩展图谱序列,然后在经过预处理的故障维修记录中查找ext_kg_id字段的值包括输入故障描述的扩展图谱序列的记录,最后将搜索结果以json的形式返回给用户。
·请求方法
POST
·Header
KEY | VALUE |
Content-Type | application/x-www-form-urlencoded |
·Body
KEY | NULL | TYPE | EXAMPLE |
kw | N | String | 压装机故障 |
·返回示例(Json)
(4)设备向下搜索
设备向下搜索是指依据设备的分类体系搜索设备的下层设备发生该故障的记录。此过程分为四个阶段:第一阶段,确定设备主体。首先获取输入故障描述的图谱序列和模板序号,然后根据模板确定设备主体一般我们认为最后一个设备实体为设备主体,例如在“E1E2P1”模板(E代表设备,P代表故障)中,E2即为设备主体。第二阶段,在设备分类体系中查找设备主体的下层设备列表,设备体系以树的形式存储在MongoDB中。第三阶段,将原图谱片段中所有设备主体所在的位置都替换成其下层设备,生成新的图谱片段,然后在经过预处理的故障维修记录中查找kg_id字段与新的图谱化序列完全一致的记录,最后将搜索结果以json的形式返回给用户。
·请求方法
POST
·Header
KEY | VALUE |
Content-Type | application/x-www-form-urlencoded |
·Body
·返回示例(Json)
(5)故障向下搜索
故障向下搜索是指依据故障的分类体系搜索故障的下层故障发生在该设备上的记录。此过程分为四个阶段:第一阶段,确定故障主体。首先获取输入故障描述的图谱序列和模板序号,然后根据模板确定设备主体一般我们认为第一个故障实体为故障主体,例如在“E1P1P2”模板(E代表设备,P代表故障)中,P1即为故障主体。第二阶段,在故障分类体系中查找故障主体的下层故障列表,故障分类体系以树的形式存储在MongoDB中。第三阶段,将原图谱片段中所有故障主体所在的位置都替换成其下层故障,生成新的图谱片段。第四阶段,在经过预处理的故障维修记录中查找kg_id字段与新的图谱化序列完全一致的记录,最后将搜索结果以json的形式返回给用户。
·请求方法
POST
·Header
KEY | VALUE |
Content-Type | application/x-www-form-urlencoded |
·Body
·返回示例(Json)
(6)设备向上搜索
设备向上搜索是指依据设备的分类体系搜索设备的下层设备发生该故障现象的记录。此过程分为四个阶段:第一阶段,确定设备主体。首先获取输入故障描述的图谱序列和模板序号,然后根据模板确定设备主体,一般我们认为最后一个设备实体为设备主体,例如在“E1P1P2”模板(E代表设备,P代表故障)中,E2即为设备主体。第二阶段,在设备分类体系中查找设备主体的上层设备列表,设备分类体系以树的形式存储在MongoDB中。第三阶段,将原图谱片段中所有设备主体所在的位置都替换成其上层设备,生成新的图谱片段。第四阶段,在经过预处理的故障维修记录中查找kg_id字段与新的图谱化序列完全一致的记录,最后将搜索结果以json的形式返回给用户。
·请求方法
POST
·Header
KEY | VALUE |
Content-Type | application/x-www-form-urlencoded |
·Body
·返回示例(Json)
(7)故障向上搜索
故障向上搜索是指依据故障的分类体系搜索故障的上层故障发生在该设备上的记录。此过程分为四个阶段:第一阶段,确定故障主体。首先获取输入故障描述的图谱序列和模板序号,然后根据模板确定设备主体一般我们认为第一个故障实体为故障主体,例如在“E1P1P2”模板(E代表设备,P代表故障)中,P1即为故障主体。第二阶段,在故障分类体系中查找故障主体的上层故障列表,故障分类体系以树的形式存储在MongoDB中。第三阶段,将原图谱片段中所有故障主体所在的位置都替换成其上层故障,生成新的图谱片段。第四阶段,在经过预处理的故障维修记录中查找kg_id字段与新的图谱化序列完全一致的记录,最后将搜索结果以json的形式返回给用户。
·请求方法
POST
·Header
KEY | VALUE |
Content-Type | application/x-www-form-urlencoded |
·Body
KEY | NULL | TYPE | EXAMPLE |
kw | N | String | 压装机坏了 |
·返回示例(Json)
以上已将本发明做一详细说明,以上所述,仅为本发明之较佳实施例而已,当不能限定本发明实施范围,即凡依本申请范围所作一般技术手段的增减或替换,皆应仍属本发明涵盖范围内。
Claims (10)
1.一种基于图谱匹配进行设备维修记录语义搜索的方法,其特征在于,所述方法包括如下步骤:
(一)、构建工业设备分类体系和词典,并录入数据库存储;
(二)、故障维修记录预处理,在数据库中创建故障维修记录表,所述故障维修记录表至少包括故障描述、图谱片段、扩展图谱片段、模板信息四个字段,然后利用语义图谱生成工具对故障维修记录表进行预处理;
(三)、获取故障描述的图谱片段;
(四)、获取故障描述的扩展图谱片段;
(五)、获取故障描述的模板信息;
(六)、组合搜索策略,至少包括精准搜索、语义容纳搜索、设备组合搜索、设备向下搜索、故障向下搜索、设备向上搜索、故障向上搜索。
2.根据权利要求1所述的一种基于图谱匹配进行设备维修记录语义搜索的方法,其特征在于,所述步骤(一)包括:构建全面的工业设备分类体系,所述工业设备分类体系优选包括分类大纲、主从类表、类目索引、类目注释以及后控制词表,优选设置3级~5级,对具有纵向关系的类目进行设计,构建出各类目间的上下位类关系或者从属等级关系,对具有横向关系的类目进行设计,构建出各类目间的同位类关系或并列相关关系,然后根据工业设备分类体系构建设备及组件词典、状态词典、程度词词典、同义词词典,还包括构建关系词典,然后将上述所有词典通过数据库的对应数据表存储,所述数据库为文档型数据库。
3.根据权利要求1所述的一种基于图谱匹配进行设备维修记录语义搜索的方法,其特征在于,所述步骤(二)包括:所述语义图谱生成工具以接口的方式提供服务,所述预处理由接口对故障维修记录表的若干故障描述进行处理,并返回若干故障描述分别相对应的图谱片段、扩展图谱片段、模板信息并存储进故障维修记录表中相对应的图谱片段、扩展图谱片段、模板信息字段;所述预处理采用POST查询方式,所述预处理返回值为json格式,所述POST查询方式的Header中设置Content-Type健值为application/x-www-form-urlencoded,所述POST查询方式还包括开始编号、处理条数两个输入参数。
4.根据权利要求1所述的一种基于图谱匹配进行设备维修记录语义搜索的方法,其特征在于,所述步骤(三)、步骤(四)、步骤(五)通过语义图谱接口实现,所述接口输入参数至少包括用户输入的故障描述;
所述步骤(三)的接口返回值包括所述故障描述的图谱片段序列,所述图谱片段序列优选为图谱片段的标识符序列,所述图谱片段序列优选为按照从左到右的规律返回;
所述步骤(四)的接口返回值包括所述故障描述的扩展图谱片段序列,所述扩展图谱片段序列优选为扩展图谱片段的标识符序列,所述扩展图谱用于从设备的组合关系角度对故障描述进行简化表示;
所述步骤(五)的接口返回值包括输入的故障描述对应的句型模板ID,该语义图谱接口将故障描述归纳为9个句型模板,所述句型模板在搜索中占比最重的三个模板分别为实体—属性、实体—实体—属性、实体—实体—属性,模板信息主要在上下层搜索策略中使用其返回值是一个整型的模板序号。
5.根据权利要求1所述的一种基于图谱匹配进行设备维修记录语义搜索的方法,其特征在于,所述组合搜索策略用于满足更具体、更复杂的用户需求。
6.根据权利要求1所述的一种基于图谱匹配进行设备维修记录语义搜索的方法,其特征在于,所述精准搜索用于搜索与输入故障描述语义完全相同的记录,所述精准搜索包括首先获取输入故障描述的图谱化序列,然后在经过预处理的故障维修记录中查找与输入故障描述的图谱化序列完全一致的记录,最后将搜索结果以json的形式返回给用户;
所述语义容纳搜索是指搜索结果包含有输入故障描述语义的记录,首先获取输入故障描述的图谱化序列,然后在经过预处理的故障维修记录中查找包括输入故障描述的图谱化序列的记录,最后将搜索结果以json的形式返回给用户;
所述设备容器搜索是指依据设备的组成关系搜索是否有对输入故障描述进行细化扩展的故障记录,首先获取输入故障描述的扩展图谱序列,然后在经过预处理的故障维修记录中查找包括输入故障描述的扩展图谱序列的记录,最后将搜索结果以json的形式返回给用户。
7.根据权利要求1所述的一种基于图谱匹配进行设备维修记录语义搜索的方法,其特征在于,所述设备向下搜索是指依据设备的分类体系搜索设备的下层设备发生该故障的记录,此过程分为四个阶段:第一阶段,确定设备主体,首先获取输入故障描述的图谱序列和模板序号,然后根据模板确定设备主体一般我们认为最后一个设备实体为设备主体;第二阶段,在设备分类体系中查找设备主体的下层设备列表,设备体系以树的形式存储在数据库中;第三阶段,将原图谱片段中所有设备主体所在的位置都替换成其下层设备,生成新的图谱片段,然后在经过预处理的故障维修记录中查找与新的图谱化序列完全一致的记录,最后将搜索结果以json的形式返回给用户。
8.根据权利要求1所述的一种基于图谱匹配进行设备维修记录语义搜索的方法,其特征在于,所述故障向下搜索是指依据故障的分类体系搜索故障的下层故障发生在该设备上的记录,此过程分为四个阶段:第一阶段,确定故障主体,首先获取输入故障描述的图谱序列和模板序号;第二阶段,在故障分类体系中查找故障主体的下层故障列表,故障分类体系以树的形式存储在数据库中;第三阶段,将原图谱片段中所有故障主体所在的位置都替换成其下层故障,生成新的图谱片段;第四阶段,在经过预处理的故障维修记录中查找与新的图谱化序列完全一致的记录,最后将搜索结果以json的形式返回给用户。
9.根据权利要求1所述的一种基于图谱匹配进行设备维修记录语义搜索的方法,其特征在于,所述设备向上搜索是指依据设备的分类体系搜索设备的下层设备发生该故障现象的记录,此过程分为四个阶段:第一阶段,确定设备主体,首先获取输入故障描述的图谱序列和模板序号,然后根据模板确定设备主体,一般我们认为最后一个设备实体为设备主体;第二阶段,在设备分类体系中查找设备主体的上层设备列表,设备分类体系以树的形式存储在数据库中;第三阶段,将原图谱片段中所有设备主体所在的位置都替换成其上层设备,生成新的图谱片段;第四阶段,在经过预处理的故障维修记录中查找与新的图谱化序列完全一致的记录,最后将搜索结果以json的形式返回给用户。
10.根据权利要求1所述的一种基于图谱匹配进行设备维修记录语义搜索的方法,其特征在于,所述故障向上搜索是指依据故障的分类体系搜索故障的上层故障发生在该设备上的记录,此过程分为四个阶段:第一阶段,确定故障主体,首先获取输入故障描述的图谱序列和模板序号,然后根据模板确定设备主体一般我们认为第一个故障实体为故障主体;第二阶段,在故障分类体系中查找故障主体的上层故障列表,故障分类体系以树的形式存储在数据库中;第三阶段,将原图谱片段中所有故障主体所在的位置都替换成其上层故障,生成新的图谱片段;第四阶段,在经过预处理的故障维修记录中查找与新的图谱化序列完全一致的记录,最后将搜索结果以json的形式返回给用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811311502.0A CN109471929B (zh) | 2018-11-06 | 2018-11-06 | 一种基于图谱匹配进行设备维修记录语义搜索的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811311502.0A CN109471929B (zh) | 2018-11-06 | 2018-11-06 | 一种基于图谱匹配进行设备维修记录语义搜索的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109471929A true CN109471929A (zh) | 2019-03-15 |
CN109471929B CN109471929B (zh) | 2021-08-17 |
Family
ID=65672054
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811311502.0A Active CN109471929B (zh) | 2018-11-06 | 2018-11-06 | 一种基于图谱匹配进行设备维修记录语义搜索的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109471929B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110187678A (zh) * | 2019-04-19 | 2019-08-30 | 广东省智能制造研究所 | 一种制造业加工设备信息存储和数字化应用系统 |
CN110929149A (zh) * | 2019-11-12 | 2020-03-27 | 广东工业大学 | 一种工业设备故障维修推荐方法和系统 |
CN111259149A (zh) * | 2020-01-19 | 2020-06-09 | 清华大学 | 化学品事故分类方法、装置、计算机设备和存储介质 |
CN111984847A (zh) * | 2020-08-21 | 2020-11-24 | 上海风秩科技有限公司 | 信息搜索方法、装置、存储介质和电子装置 |
CN113570404A (zh) * | 2021-06-30 | 2021-10-29 | 深圳市东信时代信息技术有限公司 | 一种目标用户定位的方法、装置及相关设备 |
CN116756383A (zh) * | 2023-08-18 | 2023-09-15 | 凯尔菱电(山东)电梯有限公司 | 基于物联网的电梯数据管理系统及方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103226608A (zh) * | 2013-04-28 | 2013-07-31 | 北京航空航天大学 | 一种基于目录级可伸缩的Bloom Filter位图表的并行文件搜索方法 |
CN108182295A (zh) * | 2018-02-09 | 2018-06-19 | 重庆誉存大数据科技有限公司 | 一种企业知识图谱属性抽取方法及系统 |
US20180218011A1 (en) * | 2017-02-02 | 2018-08-02 | Kensho Technologies, Inc. | Content Search Engine |
CN108446367A (zh) * | 2018-03-15 | 2018-08-24 | 湖南工业大学 | 一种基于知识图谱的包装行业数据搜索方法及设备 |
-
2018
- 2018-11-06 CN CN201811311502.0A patent/CN109471929B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103226608A (zh) * | 2013-04-28 | 2013-07-31 | 北京航空航天大学 | 一种基于目录级可伸缩的Bloom Filter位图表的并行文件搜索方法 |
US20180218011A1 (en) * | 2017-02-02 | 2018-08-02 | Kensho Technologies, Inc. | Content Search Engine |
CN108182295A (zh) * | 2018-02-09 | 2018-06-19 | 重庆誉存大数据科技有限公司 | 一种企业知识图谱属性抽取方法及系统 |
CN108446367A (zh) * | 2018-03-15 | 2018-08-24 | 湖南工业大学 | 一种基于知识图谱的包装行业数据搜索方法及设备 |
Non-Patent Citations (1)
Title |
---|
张华 等: "信息设计背景下的包装大数据可视化研究", 《湖南工业大学学报(社会科学版)》 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110187678A (zh) * | 2019-04-19 | 2019-08-30 | 广东省智能制造研究所 | 一种制造业加工设备信息存储和数字化应用系统 |
CN110929149A (zh) * | 2019-11-12 | 2020-03-27 | 广东工业大学 | 一种工业设备故障维修推荐方法和系统 |
CN110929149B (zh) * | 2019-11-12 | 2023-04-07 | 广东工业大学 | 一种工业设备故障维修推荐方法和系统 |
CN111259149A (zh) * | 2020-01-19 | 2020-06-09 | 清华大学 | 化学品事故分类方法、装置、计算机设备和存储介质 |
CN111259149B (zh) * | 2020-01-19 | 2024-03-12 | 清华大学 | 化学品事故分类方法、装置、计算机设备和存储介质 |
CN111984847A (zh) * | 2020-08-21 | 2020-11-24 | 上海风秩科技有限公司 | 信息搜索方法、装置、存储介质和电子装置 |
CN113570404A (zh) * | 2021-06-30 | 2021-10-29 | 深圳市东信时代信息技术有限公司 | 一种目标用户定位的方法、装置及相关设备 |
CN113570404B (zh) * | 2021-06-30 | 2023-12-05 | 深圳市东信时代信息技术有限公司 | 一种目标用户定位的方法、装置及相关设备 |
CN116756383A (zh) * | 2023-08-18 | 2023-09-15 | 凯尔菱电(山东)电梯有限公司 | 基于物联网的电梯数据管理系统及方法 |
CN116756383B (zh) * | 2023-08-18 | 2023-11-21 | 凯尔菱电(山东)电梯有限公司 | 基于物联网的电梯数据管理系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109471929B (zh) | 2021-08-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109471929A (zh) | 一种基于图谱匹配进行设备维修记录语义搜索的方法 | |
CN111428054B (zh) | 一种网络空间安全领域知识图谱的构建与存储方法 | |
CN109492077B (zh) | 基于知识图谱的石化领域问答方法及系统 | |
CN101542475B (zh) | 用于对具有象形表意内容的数据进行搜索和匹配的系统和方法 | |
CN107798387B (zh) | 一种适用于高端装备全生命周期的知识服务系统及方法 | |
CN111597347B (zh) | 知识嵌入的缺陷报告重构方法及装置 | |
CN109002516A (zh) | 一种搜索方法及装置 | |
CN110442676A (zh) | 基于多轮对话的专利检索方法及装置 | |
CN107665217A (zh) | 一种用于搜索业务的词汇处理方法及系统 | |
CN104657439A (zh) | 用于自然语言精准检索的结构化查询语句生成系统及方法 | |
CN102968465A (zh) | 网络信息服务平台及其基于该平台的搜索服务方法 | |
CN108536682B (zh) | 一种应用于服务业撮合交易的识别分类系统 | |
CN111159330A (zh) | 一种数据库查询语句的生成方法及装置 | |
CN113032418B (zh) | 一种基于树状模型的复杂自然语言查询转sql方法 | |
CN116991869A (zh) | 一种基于nlp语言模型自动生成数据库查询语句的方法 | |
CN105335510A (zh) | 文本数据高效搜索方法 | |
Rak et al. | Multilabel associative classification categorization of MEDLINE articles into MeSH keywords | |
CN115757464B (zh) | 一种基于深度强化学习的智能物化视图查询方法 | |
Tang et al. | Risk minimization based ontology mapping | |
CN102637202A (zh) | 一种迭代式概念属性名称自动获取方法和系统 | |
CN112668836B (zh) | 一种面向风险图谱的关联风险证据高效挖掘与监控方法和装置 | |
CN113947061A (zh) | 一种基于多模组文本智能编码算法的海关进出口商品归类方法 | |
CN115860697B (zh) | 一种基于智能识别的自动化数据管理系统 | |
CN115408506B (zh) | 联合语义解析和语义成分匹配的nl2sql的方法 | |
CN117151659B (zh) | 一种基于大语言模型的生态修复工程全生命周期追溯方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |