CN109492115A - 一种汽修知识实体网络构建方法、装置及设备 - Google Patents
一种汽修知识实体网络构建方法、装置及设备 Download PDFInfo
- Publication number
- CN109492115A CN109492115A CN201811407803.3A CN201811407803A CN109492115A CN 109492115 A CN109492115 A CN 109492115A CN 201811407803 A CN201811407803 A CN 201811407803A CN 109492115 A CN109492115 A CN 109492115A
- Authority
- CN
- China
- Prior art keywords
- automobile service
- entity
- relationship
- automobile
- structuring
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种汽修知识实体网络构建方法,能够从结构化汽修数据中识别出多个汽修实体,并提取汽修实体之间的逻辑关系即关系实体对,最终基于汽修实体及其对应的关系实体对构建汽修知识实体网络,其中,汽修实体包括以下任意一项或任意组合:汽修部件名词、汽修现象名词、汽修步骤。可见,该方法能够提取汽修部件、汽修现象、以及汽修步骤彼此之间的关系,并基于此构建汽修知识实体网络,从而实现为汽修人员提供丰富准确的汽修知识的目的,降低了汽修行业的门槛,节省了汽修成本,缓解了专业维修人员稀缺的问题。本申请还提供了一种汽修知识实体网络构建装置、设备及计算机可读存储介质,其作用与上述方法的作用相对应。
Description
技术领域
本申请涉及知识实体构建领域,特别涉及一种汽修知识实体网络构建方法、装置、设备、及计算机可读存储介质。
背景技术
进入21世纪以来,随着我国生产力的进一步发展,经济水平的提高,中国汽车保有量的急剧增长,轿车快速地进入普通中国百姓家庭,因此汽车维修需求量急剧增加。
由于汽修知识庞大复杂,普通员工需要数年的学习才能成为专业的维修人员,导致汽修行业门槛较高、维修人员稀缺、汽修成本高等问题。
发明内容
本申请的目的是提供一种汽修知识实体网络构建方法、装置、设备、及计算机可读存储介质,用以解决由于汽修知识庞大复杂,导致汽修行业门槛较高、维修人员稀缺、汽修成本高等问题。具体方案如下:
第一方面,本申请提供了一种汽修知识实体网络构建方法,包括:
获取结构化汽修数据;
对所述结构化汽修数据进行实体识别,确定所述结构化汽修数据中的多个汽修实体,其中,所述汽修实体包括以下任意一项或任意组合:汽修部件名词、汽修现象名词、汽修步骤;
遍历各个所述汽修实体,提取在所述汽修结构化数据中与所述汽修实体相关联的关系实体对,其中,所述关系实体对包括与所述汽修实体相关联的目标汽修实体,还包括用于描述所述汽修实体与所述目标汽修实体之间关系的关系实体;
根据所述汽修实体和所述关系实体对,构建汽修知识实体网络。
可选的,在所述获取结构化汽修数据之后,所述方法还包括:
将结构化汽修数据按照数据内容类型分为以下四种类型:概念类型、检查类型、维修类型、以及拆装类型;
根据结构化汽修数据的数据内容类型,为所述结构化汽修数据增加类型标记。
可选的,所述对所述结构化汽修数据进行实体识别,确定所述结构化汽修数据中的多个汽修实体,具体包括:
根据所述结构化汽修数据的类型标记,确定所述结构化汽修数据的识别内容;
对所述结构化汽修数据的识别内容进行实体识别,确定所述结构化汽修数据中的多个汽修实体。
可选的,在所述对所述结构化汽修数据进行实体识别,确定所述结构化汽修数据中的多个汽修实体之后,所述方法还包括:
在所述汽修实体为所述汽修步骤时,生成所述汽修实体的步骤代码;
所述根据所述汽修实体和所述关系实体对,构建汽修知识实体网络,具体包括:
根据所述步骤代码和所述关系实体对,构建汽修知识实体网络。
可选的,所述根据所述汽修实体和所述关系实体对,构建汽修知识实体网络,具体包括:
确定目标汽修实体为所述汽修现象名词的多个关系实体对;
以所述目标汽修实体为汽修现象名词的关系实体对为汽修知识实体网络的起点,将各个汽修实体和关系实体对关联起来,得到汽修知识实体网络。
可选的,所述根据所述汽修实体和所述关系实体对,构建汽修知识实体网络,具体包括:
生成包括所述汽修实体和所述关系实体对的多元实体结构,其中,多元实体结构包括所述汽修实体与所述关系实体对之间的关系权重,所述关系权重与所述多元实体结构出现的频数相关;
基于所述多元实体结构,构建汽修知识实体网络。
可选的,在所述基于所述多元实体结构,构建汽修知识实体网络之后,所述方法还包括:
基于所述汽修实体和所述关系实体,创建所述多元实体结构的索引。
第二方面,本申请提供了一种汽修知识实体网络构建装置,包括:
数据获取模块:用于获取结构化汽修数据;
实体识别模块:用于对所述结构化汽修数据进行实体识别,确定所述结构化汽修数据中的多个汽修实体,其中,所述汽修实体包括以下任意一项或任意组合:汽修部件名词、汽修现象名词、汽修步骤;
关系实体对提取模块:用于遍历各个所述汽修实体,提取在所述汽修结构化数据中与所述汽修实体相关联的关系实体对,其中,所述关系实体对包括与所述汽修实体相关联的目标汽修实体,还包括用于描述所述汽修实体与所述目标汽修实体之间关系的关系实体;
网络构建模块:用于根据所述汽修实体和所述关系实体对,构建汽修知识实体网络。
可选的,所述装置还包括:
分类模块:用于将结构化汽修数据按照数据内容类型分为以下四种类型:概念类型、检查类型、维修类型、以及拆装类型;
标记模块:用于根据结构化汽修数据的数据内容类型,为所述结构化汽修数据增加类型标记。
可选的,所述实体识别模块具体包括:
识别内容确定单元:用于根据所述结构化汽修数据的类型标记,确定所述结构化汽修数据的识别内容;
实体识别单元:用于对所述结构化汽修数据的识别内容进行实体识别,确定所述结构化汽修数据中的多个汽修实体。
可选的,所述装置还包括:
步骤代码生成模块:用于在所述汽修实体为所述汽修步骤时,生成所述汽修实体的步骤代码;
所述网络构建模块具体用于:
根据所述步骤代码和所述关系实体对,构建汽修知识实体网络。
可选的,所述网络构建模块具体包括:
第一构建单元:用于确定目标汽修实体为所述汽修现象名词的多个关系实体对;
第二构建单元:用于以所述目标汽修实体为汽修现象名词的关系实体对为汽修知识实体网络的起点,将各个汽修实体和关系实体对关联起来,得到汽修知识实体网络。
可选的,所述网络构建模块具体包括:
多元实体结构生成单元:用于生成包括所述汽修实体和所述关系实体对的多元实体结构,其中,多元实体结构包括所述汽修实体与所述关系实体对之间的关系权重,所述关系权重与所述多元实体结构出现的频数相关;
构建单元:用于基于所述多元实体结构,构建汽修知识实体网络。
可选的,所述装置还包括:
索引构建模块:用于基于所述汽修实体和所述关系实体,创建所述多元实体结构的索引。
第三方面,本申请还提供了一种汽修知识实体网络构建设备,包括:
存储器:用于存储计算机程序;
处理器:用于在执行所述计算机程序时实现以下步骤:
获取结构化汽修数据;对所述结构化汽修数据进行实体识别,确定所述结构化汽修数据中的多个汽修实体,其中,所述汽修实体包括以下任意一项或任意组合:汽修部件名词、汽修现象名词、汽修步骤;遍历各个所述汽修实体,提取在所述汽修结构化数据中与所述汽修实体相关联的关系实体对,其中,所述关系实体对包括与所述汽修实体相关联的目标汽修实体,还包括用于描述所述汽修实体与所述目标汽修实体之间关系的关系实体;根据所述汽修实体和所述关系实体对,构建汽修知识实体网络。
可选的,所述处理器执行所述存储器中存储的计算机程序时,可以具体实现以下步骤:
将结构化汽修数据按照数据内容类型分为以下四种类型:概念类型、检查类型、维修类型、以及拆装类型;
根据结构化汽修数据的数据内容类型,为所述结构化汽修数据增加类型标记。
可选的,所述处理器执行所述存储器中存储的计算机程序时,可以具体实现以下步骤:
根据所述结构化汽修数据的类型标记,确定所述结构化汽修数据的识别内容;
对所述结构化汽修数据的识别内容进行实体识别,确定所述结构化汽修数据中的多个汽修实体。
可选的,所述处理器执行所述存储器中存储的计算机程序时,可以具体实现以下步骤:
在所述汽修实体为所述汽修步骤时,生成所述汽修实体的步骤代码;
根据所述步骤代码和所述关系实体对,构建汽修知识实体网络。
可选的,所述处理器执行所述存储器中存储的计算机程序时,可以具体实现以下步骤:
确定目标汽修实体为所述汽修现象名词的多个关系实体对;
以所述目标汽修实体为汽修现象名词的关系实体对为汽修知识实体网络的起点,将各个汽修实体和关系实体对关联起来,得到汽修知识实体网络。
可选的,所述处理器执行所述存储器中存储的计算机程序时,可以具体实现以下步骤:
生成包括所述汽修实体和所述关系实体对的多元实体结构,其中,多元实体结构包括所述汽修实体与所述关系实体对之间的关系权重,所述关系权重与所述多元实体结构出现的频数相关;
基于所述多元实体结构,构建汽修知识实体网络。
可选的,所述处理器执行所述存储器中存储的计算机程序时,可以具体实现以下步骤:
基于所述汽修实体和所述关系实体,创建所述多元实体结构的索引。
第四方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质上保存有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取结构化汽修数据;对所述结构化汽修数据进行实体识别,确定所述结构化汽修数据中的多个汽修实体,其中,所述汽修实体包括以下任意一项或任意组合:汽修部件名词、汽修现象名词、汽修步骤;遍历各个所述汽修实体,提取在所述汽修结构化数据中与所述汽修实体相关联的关系实体对,其中,所述关系实体对包括与所述汽修实体相关联的目标汽修实体,还包括用于描述所述汽修实体与所述目标汽修实体之间关系的关系实体;根据所述汽修实体和所述关系实体对,构建汽修知识实体网络。
可选的,所述计算机可读存储介质中保存的计算机程序被处理器执行时,可以具体实现以下步骤:
将结构化汽修数据按照数据内容类型分为以下四种类型:概念类型、检查类型、维修类型、以及拆装类型;
根据结构化汽修数据的数据内容类型,为所述结构化汽修数据增加类型标记。
可选的,所述计算机可读存储介质中保存的计算机程序被处理器执行时,可以具体实现以下步骤:
根据所述结构化汽修数据的类型标记,确定所述结构化汽修数据的识别内容;
对所述结构化汽修数据的识别内容进行实体识别,确定所述结构化汽修数据中的多个汽修实体。
可选的,所述计算机可读存储介质中保存的计算机程序被处理器执行时,可以具体实现以下步骤:
在所述汽修实体为所述汽修步骤时,生成所述汽修实体的步骤代码;
根据所述步骤代码和所述关系实体对,构建汽修知识实体网络。
可选的,所述计算机可读存储介质中保存的计算机程序被处理器执行时,可以具体实现以下步骤:
确定目标汽修实体为所述汽修现象名词的多个关系实体对;
以所述目标汽修实体为汽修现象名词的关系实体对为汽修知识实体网络的起点,将各个汽修实体和关系实体对关联起来,得到汽修知识实体网络。
可选的,所述计算机可读存储介质中保存的计算机程序被处理器执行时,可以具体实现以下步骤:
生成包括所述汽修实体和所述关系实体对的多元实体结构,其中,多元实体结构包括所述汽修实体与所述关系实体对之间的关系权重,所述关系权重与所述多元实体结构出现的频数相关;
基于所述多元实体结构,构建汽修知识实体网络。
可选的,所述计算机可读存储介质中保存的计算机程序被处理器执行时,可以具体实现以下步骤:
基于所述汽修实体和所述关系实体,创建所述多元实体结构的索引。
本申请所提供的一种汽修知识实体网络构建方法,能够从结构化汽修数据中识别出多个汽修实体,并提取汽修实体之间的逻辑关系即关系实体对,最终基于汽修实体及其对应的关系实体对构建汽修知识实体网络,其中,汽修实体包括以下任意一项或任意组合:汽修部件名词、汽修现象名词、汽修步骤。可见,该方法能够提取汽修部件、汽修现象、以及汽修步骤彼此之间的关系,并基于此构建汽修知识实体网络,从而实现为汽修人员提供丰富准确的汽修知识的目的,降低了汽修行业的门槛,节省了汽修成本,缓解了专业维修人员稀缺的问题。
此外,本申请还提供了一种汽修知识实体网络构建装置、设备及计算机可读存储介质,其作用与上述方法的作用相对应,这里不再赘述。
附图说明
为了更清楚的说明本申请实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请所提供的一种汽修知识实体网络构建方法实施例一的实现流程图;
图2为本申请所提供的一种汽修知识实体网络构建方法实施例一中简单汽修知识实体网络示意图;
图3为本申请所提供的一种汽修知识实体网络构建方法实施例二的实现流程图;
图4为本申请所提供的一种汽修知识实体网络构建方法实施例三中的汽修知识实体网络的模块示意图;
图5为本申请所提供的一种汽修知识实体网络构建装置实施例的结构框图。
具体实施方式
本申请的核心是提供一种汽修知识实体网络构建方法、装置、设备及计算机可读存储介质,实现了从结构化数据中提取汽修知识的目的,从而为汽修人员提供丰富准确的汽修知识,降低了汽修行业的门槛,节省了汽修成本,缓解了专业维修人员稀缺的问题。
为了使本技术领域的人员更好地理解本申请方案,下面结合附图和具体实施方式对本申请作进一步的详细说明。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
首先,对知识实体网络的概念进行简要介绍,知识实体网络旨在知识抽象成实体以及实体之间的关系,假设将知识实体网络看成一个网状图,在网状图中,节点表示实体,节电之间的连线表示实体之间的关系。本申请的目的在于从汽修数据中抽取出汽修知识,并构建汽修知识实体网络,所述汽修知识实体网络有多个基本单元组成,所述基本单元包括汽修实体、以及与该汽修实体相关联汽修实体对。
下面对本申请提供的一种汽修知识实体网络构建方法实施例一进行介绍,参见图1,实施例一包括:
步骤S101:获取结构化汽修数据。
需要说明的是,本实施例将结构化汽修数据作为输入,并从中提取汽修知识,但在实际场景中,输入的可能是汽修文本,例如海量汽修手册或汽修网页上的汽修文本,在这种情况下,可以通过对文本进行分词、过滤停用词等预处理操作,得到结构化的汽修文本。因此,本实施例中获取结构化汽修数据只是一种实现方式,本申请对此不做限定。
步骤S102:对所述结构化汽修数据进行实体识别,确定所述结构化汽修数据中的多个汽修实体。
具体的,本申请所涉及到的汽修实体包括以下任意一项或任意组合:汽修部件名词、汽修现象名词、汽修步骤。其中,汽修部件名词是指汽车各个部件的名称,汽修现象名词是指各个汽车部件可能发生的现象,汽修步骤是指汽车故障时需要进行的一些维修操作。
步骤S103:遍历各个所述汽修实体,提取在所述汽修结构化数据中与所述汽修实体相关联的关系实体对。
上述关系实体对包括与所述汽修实体相关联的目标汽修实体,还包括用于描述所述汽修实体与所述目标汽修实体之间关系的关系实体。显然,汽修实体为关系起点,而目标汽修实体为关系终点,需要说明,上述目标汽修实体实际上也属于汽修实体,将其称为目标汽修实体是为了与作为关系起点的汽修实体进行区分。
步骤S104:根据所述汽修实体和所述关系实体对,构建汽修知识实体网络。
经过上述步骤,得到了汽修实体以及与该汽修实体对应的关系实体对,形成了(汽修实体,关系实体,目标汽修实体)的三元结构,基于该三元结构,即可实现构建汽修知识网络的目的。参见图2,图2为一个简单的汽修知识实体网络,其中实线框表示汽修实体,包括汽修部件名词和汽修现象名词(此处仅作为举例说明,因此汽修步骤未画出),虚线框表示关系实体。
本实施例所提供一种汽修知识实体网络构建方法,能够从结构化汽修数据中识别出多个汽修实体,并提取汽修实体之间的逻辑关系即关系实体对,最终基于汽修实体及其对应的关系实体对构建汽修知识实体网络,其中,汽修实体包括以下任意一项或任意组合:汽修部件名词、汽修现象名词、汽修步骤。可见,该方法能够提取汽修部件、汽修现象、以及汽修步骤彼此之间的关系,并基于此构建汽修知识实体网络,从而实现为汽修人员提供丰富准确的汽修知识的目的,降低了汽修行业的门槛,节省了汽修成本,缓解了专业维修人员稀缺的问题。
下面开始详细介绍本申请提供的一种汽修知识实体网络构建方法实施例二,实施例二基于实施例一实现,并在实施例一的基础上进行了一定程度的拓展。
如图3所示,本申请提供的一种汽修知识实体网络构建方法实施例二具体包括:
步骤S201:获取结构化汽修数据,对其进行分类,并根据分类结果对结构化汽修数据进行标记。
实际上,步骤S201可以作为预处理步骤,具体包括:预先将结构化汽修数据按照数据内容类型分为以下四种类型:概念类型、检查类型、维修类型、以及拆装类型,并根据结构化汽修数据的数据内容类型,为结构化汽修数据增加类型标记。
基于数据内容类型对结构化汽修数据记性分类的目的在于提高后续提取汽修知识的效率,其原理在于,不同数据内容的结构化汽修数据包含不同的汽修知识,经过分类操作之后,后续提取汽修知识时,可以进行更加有针对性的提取,减少运算量。例如,上述概念类型的结构化汽修数据主要用于描述一些汽修概念信息,例如汽修部件的作用、组成、汽修部件之间的关系等等,而检查类型主要用于针对某一故障现象的检查过程,相似的,维修类型主要用于描述维修过程,拆装类型主要用于描述拆卸安装汽车部件的过程。
步骤S202:判断当前结构化数据为何种数据内容类型。
具体的,在提取汽修知识过程中,获取被标记的结构化汽修数据,根据类型标记,判断当前结构化数据为何种数据内容类型。
步骤S203:根据数据内容类型的分类,确定识别内容,针对该识别内容从结构化汽修数据中识别出多个汽修实体,并提取对应的关系实体对。
具体的,根据数据内容类型确定当前结构化汽修数据的识别内容,并对当前结构化汽修数据的识别内容进行实体识别,确定多个汽修实体。然后,遍历各个所述汽修实体,提取在所当前汽修结构化数据中与所述汽修实体相关联的关系实体对。其中,所述汽修实体包括以下任意一项或任意组合:汽修部件名词、汽修现象名词、汽修步骤。所述关系实体对包括与所述汽修实体相关联的目标汽修实体,还包括用于描述所述汽修实体与所述目标汽修实体之间关系的关系实体。
由于上述步骤将结构化汽修数据分为了四类,包括概念类型、检查类型、维修类型、以及拆装类型,依据各种类型的数据内容,可以大概确定各种类型的结构化汽修数据的主要识别内容,例如,概念类型主要识别汽修部件、汽修现象,而检查类型主要识别汽修步骤,还可能识别汽修现象,此处不再一一说明。
作为一种优选方式,本实施例考虑到部分汽修实体例如汽修步骤可能数据量较大,因此,可以在识别出汽修步骤之后,生成汽修步骤的步骤代码,建立步骤代码与汽修步骤之间的一一对应关系,以实现减小后续步骤运算量的目的。
步骤S204:根据汽修实体、以及该汽修实体对应的关系实体对,构建多元实体结构。
其中,多元实体结构还可以包括所述汽修实体与所述关系实体对之间的关系权重,所述关系权重与所述多元实体结构出现的频数相关。
下面对上述关系权重的含义进行解释,多元实体结构的核心包括两个汽修实体,以及反应两个汽修实体之间关系的关系实体,本实施例在生成多元实体结构的时候,会对多元实体结构进行统计。举例来说,与汽修实体A相关联的汽修实体有汽修实体B和汽修实体C,在统计过程中,包括汽修实体A和汽修实体B的第一多元实体结构出现了3次(本实施例将多元实体结构出现的次数称为频数),而包括汽修实体A和汽修实体C的第二多元实体结构出现了21次,那么,可以认为汽修实体A与汽修实体C的关联程度大于汽修实体B,而上述关系权重就反映了这种关联程度的强弱。步骤S205:以多元实体结构中目标汽修实体为汽修现象名词的多元实体结构为汽修知识实体网络的起点,将各个多元实体结构关联起来,得到汽修知识实体网络。
步骤S206:基于所述汽修实体和所述关系实体,创建所述多元实体结构的索引。
具体的,可以采用key-value算法来创建多元实体结构的索引。通过该索引的创建,可以实现在汽修知识实体结构网络中准确查找相关汽修知识的目的。
下面介绍本申请提供的一种汽修知识实体网络创建方法实施例三,相较于前述两个实施例,实施例三主要侧重描述在实际应用场景中的实现过程。
具体的,实施例三包括:
步骤S301:获取结构化汽修数据。
步骤S302:判断其数据内容类型为何种类型,如果为概念类型,进入步骤S303,如果为检查类型,进入步骤S304,如果为维修类型进入步骤S305,如果为拆装类型,进入步骤S306。这里需要说明的是,以下四个步骤为互异的,因此,相同的参数在不同的步骤可能有不同的含义,具体请参见参数在其自身所在的步骤中的含义解释。
步骤S303:针对汽修部件名词和汽修现象名词进行实体识别,得到由多个汽修实体组成的序列{x1,x2,...,xm}。并提取各个汽修实体的关系实体对,得到包括多个关系实体对的序列该关系实体对反映了如下信息:汽修部件之间的关系,或汽修部件可能发生哪些汽修故障。
其中,xm表示第m个汽修实体,ym表示第m个关系实体,关系实体对中x的下角标r1,r2,...,rm均为1到m之间的任意数值。显然,两个序列中相同位置的参数为互相对应的,也就是说,x1对应实际上就是三元结构
步骤S304:针对汽修步骤中的检查步骤进行实体识别,得到由多个检查步骤组成的序列{X1,X2,...,Xm}。并提取各个检查步骤的关系实体对,得到包括多个检查步骤的序列该关系实体对反映了如下信息:检查步骤之间的关系。
其中,Xm表示第m个检查步骤,ym表示第m个关系实体,关系实体对中X的下角标r1,r2,...,rm均为1到m之间的任意数值。显然,两个序列中相同位置的参数为互相对应的,也就是说,X1对应实际上就是三元结构
除了上述序列之外,还可以提取到逻辑实体序列{b1,b2,...,bm},其中,bm表示第m个逻辑实体,本实施例中,逻辑实体只存在两种取值:0或1,具体的,逻辑实体b1反映了上述三元结构中X1到之间的跳转关系为常规还是非常规,依此类推。
当然在步骤S304中,关系实体对还可能反应汽修现象与检查步骤之间的关系,此处不再做展开介绍。
步骤S305:针对汽修步骤中的维修步骤进行实体识别,得到由多个维修步骤组成的序列{X1,X2,...,Xm}。并提取各个维修步骤的关系实体对,得到包括多个关系实体对的序列该关系实体对反映了如下信息:维修步骤之间的先后顺序。
其中,Xm表示第m个维修步骤,ym表示第m个关系实体,关系实体对中X的下角标r1,r2,...,rm均为1到m之间的任意数值。显然,两个序列中相同位置的参数为互相对应的,也就是说,X1对应实际上就是三元结构
除了上述序列之外,还可以提取到逻辑实体序列{b1,b2,...,bm},其中,bm表示第m个逻辑实体,本实施例中,逻辑实体只存在两种取值:0或1,具体的,逻辑实体b1反映了上述三元结构中X1到之间的跳转关系为常规还是非常规,依此类推。
当然在步骤S305中,关系实体对还可能反应汽修现象与维修步骤之间的关系,此处不再做展开介绍。
步骤S306:针对汽修步骤中的拆装步骤进行实体识别,得到由多个拆装步骤组成的序列{X1,X2,...,Xm}。并提取各个拆装步骤的关系实体对,得到包括多个关系实体对的序列该关系实体对反映了如下信息:拆装步骤之间的先后顺序。
其中,Xm表示第m个拆装步骤,ym表示第m个关系实体,关系实体对中X的下角标r1,r2,...,rm均为1到m之间的任意数值。显然,两个序列中相同位置的参数为互相对应的,也就是说,X1对应实际上就是三元结构
与步骤S304和步骤S305不同,步骤S306不需要提取逻辑实体序列,因为在汽修领域,汽车部件的拆装顺序是有严格要求的,因此不存在非常规的拆装步骤跳转情况。
步骤S307:从步骤S303中的关系实体对中筛选出包含汽修现象名词的多个关系实体对,以所述目标汽修实体为汽修现象名词的关系实体对为汽修知识实体网络的起点,将各个汽修实体和关系实体对关联起来,得到汽修知识实体网络,该汽修知识实体网络包括由n个多元实体结构的序列{O1,O2,...,On}。
其中,所述多元实体结构包括但不限于上述三元实体结构,当所述多元实体结构为三元实体结构时,当然,多元实体结构还可以包含其他参数,包括但不限于以下情况:
多元实体结构可以包含关系权重w,此时其中,num为Oi出现的频数;当该多元实体结构中存在检查步骤或维修步骤时,多元实体结构可能包含逻辑实体b,此时
此外,还需要特别说明的一点,可以汽修知识实体网络进行上层封装,例如将其拆分成多个模块,举例来说,如图4所示,可以将有关ECM的所有检查步骤作为一个模块,该模块还包括各个检查步骤之间的关系。这种情况下,当ECM故障时,需要跳转到该模块,其本质就相当于跳转到ECM检查步骤中的第一步。此时,作为一个汽修实体,检查步骤的第一步多了另一个描述方式,即模块名称,甚至还可以为该模块中的所有检查步骤都增加该描述,作为一种实现方式,本实施例只为检查步骤的第一步增加该描述。
因此,对于上述多元实体结构,还可能存在另一种参数,即当该多元实体结构中存在汽修步骤中的第一步时,多元实体结构还包括模块名称,此时其中表示所在模块的模块名称。
步骤S308:为序列{O1,O2,...,On}中的各个多种实体结构生成索引。
具体的,基于中的xi和yi创建key-value形式,生成{(k1,O1),(k2,O2),...,(kn,On)},后续可以将其输出并进行保存。
下面对本申请实施例提供的一种汽修知识实体网络构建装置进行介绍,下文描述的一种汽修知识实体网络构建装置与上文描述的一种汽修知识实体网络构建方法可相互对应参照。
如图5所示,该装置包括:
数据获取模块501:用于获取结构化汽修数据;
实体识别模块502:用于对所述结构化汽修数据进行实体识别,确定所述结构化汽修数据中的多个汽修实体,其中,所述汽修实体包括以下任意一项或任意组合:汽修部件名词、汽修现象名词、汽修步骤;
关系实体对提取模块503:用于遍历各个所述汽修实体,提取在所述汽修结构化数据中与所述汽修实体相关联的关系实体对,其中,所述关系实体对包括与所述汽修实体相关联的目标汽修实体,还包括用于描述所述汽修实体与所述目标汽修实体之间关系的关系实体;
网络构建模块504:用于根据所述汽修实体和所述关系实体对,构建汽修知识实体网络。
在本实施例中,所述装置还可以包括:
分类模块505:用于将结构化汽修数据按照数据内容类型分为以下四种类型:概念类型、检查类型、维修类型、以及拆装类型;
标记模块506:用于根据结构化汽修数据的数据内容类型,为所述结构化汽修数据增加类型标记。
在本实施例中,所述实体识别模块502可以包括:
识别内容确定单元5021:用于根据所述结构化汽修数据的类型标记,确定所述结构化汽修数据的识别内容;
实体识别单元5022:用于对所述结构化汽修数据的识别内容进行实体识别,确定所述结构化汽修数据中的多个汽修实体。
在本实施例中,所述装置还可以包括:
步骤代码生成模块507:用于在所述汽修实体为所述汽修步骤时,生成所述汽修实体的步骤代码;
所述网络构建模块504具体用于:
根据所述步骤代码和所述关系实体对,构建汽修知识实体网络。
在本实施例中,所述网络构建模块504可以包括:
第一构建单元:用于确定目标汽修实体为所述汽修现象名词的多个关系实体对;
第二构建单元:用于以所述目标汽修实体为汽修现象名词的关系实体对为汽修知识实体网络的起点,将各个汽修实体和关系实体对关联起来,得到汽修知识实体网络。
在本实施例中,所述网络构建模块504可以包括:
多元实体结构生成单元:用于生成包括所述汽修实体和所述关系实体对的多元实体结构,其中,多元实体结构包括所述汽修实体与所述关系实体对之间的关系权重,所述关系权重与所述多元实体结构出现的频数相关;
构建单元:用于基于所述多元实体结构,构建汽修知识实体网络。
在本实施例中,所述装置还可以包括:
索引构建模块508:用于基于所述汽修实体和所述关系实体,创建所述多元实体结构的索引。
本实施例的一种汽修知识实体网络构建装置用于实现前述的一种汽修知识实体网络构建方法,因此其作用与上述方法的作用相对应,这里不再赘述。
此外,本申请还提供了一种汽修知识实体网络构建设备,包括:
存储器:用于存储计算机程序;
处理器:用于在执行所述计算机程序时实现以下步骤:
获取结构化汽修数据;对所述结构化汽修数据进行实体识别,确定所述结构化汽修数据中的多个汽修实体,其中,所述汽修实体包括以下任意一项或任意组合:汽修部件名词、汽修现象名词、汽修步骤;遍历各个所述汽修实体,提取在所述汽修结构化数据中与所述汽修实体相关联的关系实体对,其中,所述关系实体对包括与所述汽修实体相关联的目标汽修实体,还包括用于描述所述汽修实体与所述目标汽修实体之间关系的关系实体;根据所述汽修实体和所述关系实体对,构建汽修知识实体网络。
在一些具体的实施例中,所述处理器执行所述存储器中存储的计算机程序时,可以具体实现以下步骤:
将结构化汽修数据按照数据内容类型分为以下四种类型:概念类型、检查类型、维修类型、以及拆装类型;
根据结构化汽修数据的数据内容类型,为所述结构化汽修数据增加类型标记。
在一些具体的实施例中,所述处理器执行所述存储器中存储的计算机程序时,可以具体实现以下步骤:
根据所述结构化汽修数据的类型标记,确定所述结构化汽修数据的识别内容;
对所述结构化汽修数据的识别内容进行实体识别,确定所述结构化汽修数据中的多个汽修实体。
在一些具体的实施例中,所述处理器执行所述存储器中存储的计算机程序时,可以具体实现以下步骤:
在所述汽修实体为所述汽修步骤时,生成所述汽修实体的步骤代码;
根据所述步骤代码和所述关系实体对,构建汽修知识实体网络。
在一些具体的实施例中,所述处理器执行所述存储器中存储的计算机程序时,可以具体实现以下步骤:
确定目标汽修实体为所述汽修现象名词的多个关系实体对;
以所述目标汽修实体为汽修现象名词的关系实体对为汽修知识实体网络的起点,将各个汽修实体和关系实体对关联起来,得到汽修知识实体网络。
在一些具体的实施例中,所述处理器执行所述存储器中存储的计算机程序时,可以具体实现以下步骤:
生成包括所述汽修实体和所述关系实体对的多元实体结构,其中,多元实体结构包括所述汽修实体与所述关系实体对之间的关系权重,所述关系权重与所述多元实体结构出现的频数相关;
基于所述多元实体结构,构建汽修知识实体网络。
在一些具体的实施例中,所述处理器执行所述存储器中存储的计算机程序时,可以具体实现以下步骤:
基于所述汽修实体和所述关系实体,创建所述多元实体结构的索引。
本实施例的一种汽修知识实体网络构建设备用于实现前述的一种汽修知识实体网络构建方法,因此其作用与上述方法的作用相对应,这里不再赘述。
最后,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质上保存有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取结构化汽修数据;对所述结构化汽修数据进行实体识别,确定所述结构化汽修数据中的多个汽修实体,其中,所述汽修实体包括以下任意一项或任意组合:汽修部件名词、汽修现象名词、汽修步骤;遍历各个所述汽修实体,提取在所述汽修结构化数据中与所述汽修实体相关联的关系实体对,其中,所述关系实体对包括与所述汽修实体相关联的目标汽修实体,还包括用于描述所述汽修实体与所述目标汽修实体之间关系的关系实体;根据所述汽修实体和所述关系实体对,构建汽修知识实体网络。
作为一种实现方式,所述计算机可读存储介质中保存的计算机程序被处理器执行时,可以具体实现以下步骤:
将结构化汽修数据按照数据内容类型分为以下四种类型:概念类型、检查类型、维修类型、以及拆装类型;
根据结构化汽修数据的数据内容类型,为所述结构化汽修数据增加类型标记。
作为一种实现方式,所述计算机可读存储介质中保存的计算机程序被处理器执行时,可以具体实现以下步骤:
根据所述结构化汽修数据的类型标记,确定所述结构化汽修数据的识别内容;
对所述结构化汽修数据的识别内容进行实体识别,确定所述结构化汽修数据中的多个汽修实体。
作为一种实现方式,所述计算机可读存储介质中保存的计算机程序被处理器执行时,可以具体实现以下步骤:
在所述汽修实体为所述汽修步骤时,生成所述汽修实体的步骤代码;
根据所述步骤代码和所述关系实体对,构建汽修知识实体网络。
作为一种实现方式,所述计算机可读存储介质中保存的计算机程序被处理器执行时,可以具体实现以下步骤:
确定目标汽修实体为所述汽修现象名词的多个关系实体对;
以所述目标汽修实体为汽修现象名词的关系实体对为汽修知识实体网络的起点,将各个汽修实体和关系实体对关联起来,得到汽修知识实体网络。
作为一种实现方式,所述计算机可读存储介质中保存的计算机程序被处理器执行时,可以具体实现以下步骤:
生成包括所述汽修实体和所述关系实体对的多元实体结构,其中,多元实体结构包括所述汽修实体与所述关系实体对之间的关系权重,所述关系权重与所述多元实体结构出现的频数相关;
基于所述多元实体结构,构建汽修知识实体网络。
作为一种实现方式,所述计算机可读存储介质中保存的计算机程序被处理器执行时,可以具体实现以下步骤:
基于所述汽修实体和所述关系实体,创建所述多元实体结构的索引。
本实施例的一种计算机可读存储介质用于实现前述的一种汽修知识实体网络构建方法,因此其作用与上述方法的作用相对应,这里不再赘述。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本申请所提供的一种汽修知识实体网络构建方法、装置、设备以及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。
Claims (10)
1.一种汽修知识实体网络构建方法,其特征在于,所述方法包括:
获取结构化汽修数据;
对所述结构化汽修数据进行实体识别,确定所述结构化汽修数据中的多个汽修实体,其中,所述汽修实体包括以下任意一项或任意组合:汽修部件名词、汽修现象名词、汽修步骤;
遍历各个所述汽修实体,提取在所述汽修结构化数据中与所述汽修实体相关联的关系实体对,其中,所述关系实体对包括与所述汽修实体相关联的目标汽修实体,还包括用于描述所述汽修实体与所述目标汽修实体之间关系的关系实体;
根据所述汽修实体和所述关系实体对,构建汽修知识实体网络。
2.如权利要求1所述的方法,其特征在于,在所述获取结构化汽修数据之后,所述方法还包括:
将结构化汽修数据按照数据内容类型分为以下四种类型:概念类型、检查类型、维修类型、以及拆装类型;
根据结构化汽修数据的数据内容类型,为所述结构化汽修数据增加类型标记。
3.如权利要求2所述的方法,其特征在于,所述对所述结构化汽修数据进行实体识别,确定所述结构化汽修数据中的多个汽修实体,具体包括:
根据所述结构化汽修数据的类型标记,确定所述结构化汽修数据的识别内容;
对所述结构化汽修数据的识别内容进行实体识别,确定所述结构化汽修数据中的多个汽修实体。
4.如权利要求3所述的方法,其特征在于,在所述对所述结构化汽修数据进行实体识别,确定所述结构化汽修数据中的多个汽修实体之后,所述方法还包括:
在所述汽修实体为所述汽修步骤时,生成所述汽修实体的步骤代码;
所述根据所述汽修实体和所述关系实体对,构建汽修知识实体网络,具体包括:
根据所述步骤代码和所述关系实体对,构建汽修知识实体网络。
5.如权利要求1所述的方法,其特征在于,所述根据所述汽修实体和所述关系实体对,构建汽修知识实体网络,具体包括:
确定目标汽修实体为所述汽修现象名词的多个关系实体对;
以所述目标汽修实体为汽修现象名词的关系实体对为汽修知识实体网络的起点,将各个汽修实体和关系实体对关联起来,得到汽修知识实体网络。
6.如权利要求1-5任意一项所述的方法,其特征在于,所述根据所述汽修实体和所述关系实体对,构建汽修知识实体网络,具体包括:
生成包括所述汽修实体和所述关系实体对的多元实体结构,其中,多元实体结构包括所述汽修实体与所述关系实体对之间的关系权重,所述关系权重与所述多元实体结构出现的频数相关;
基于所述多元实体结构,构建汽修知识实体网络。
7.如权利要求6所述的方法,其特征在于,在所述基于所述多元实体结构,构建汽修知识实体网络之后,所述方法还包括:
基于所述汽修实体和所述关系实体,创建所述多元实体结构的索引。
8.一种汽修知识实体网络构建装置,其特征在于,包括:
数据获取模块:用于获取结构化汽修数据;
实体识别模块:用于对所述结构化汽修数据进行实体识别,确定所述结构化汽修数据中的多个汽修实体,其中,所述汽修实体包括以下任意一项或任意组合:汽修部件名词、汽修现象名词、汽修步骤;
关系实体对提取模块:用于遍历各个所述汽修实体,提取在所述汽修结构化数据中与所述汽修实体相关联的关系实体对,其中,所述关系实体对包括与所述汽修实体相关联的目标汽修实体,还包括用于描述所述汽修实体与所述目标汽修实体之间关系的关系实体;
网络构建模块:用于根据所述汽修实体和所述关系实体对,构建汽修知识实体网络。
9.一种汽修知识实体网络构建设备,其特征在于,包括:
存储器:用于存储计算机程序;
处理器:用于执行所述计算机程序以实现如权利要求1-7任意一项所述的一种汽修知识实体网络构建方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上保存有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-7任意一项所述的一种汽修知识实体网络构建方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811407803.3A CN109492115A (zh) | 2018-11-23 | 2018-11-23 | 一种汽修知识实体网络构建方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811407803.3A CN109492115A (zh) | 2018-11-23 | 2018-11-23 | 一种汽修知识实体网络构建方法、装置及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109492115A true CN109492115A (zh) | 2019-03-19 |
Family
ID=65696544
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811407803.3A Pending CN109492115A (zh) | 2018-11-23 | 2018-11-23 | 一种汽修知识实体网络构建方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109492115A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110727804A (zh) * | 2019-10-11 | 2020-01-24 | 北京明略软件系统有限公司 | 利用知识图谱处理维修案例的方法、装置及电子设备 |
CN110765135A (zh) * | 2019-10-28 | 2020-02-07 | 深圳市元征科技股份有限公司 | 汽修资料结构标准化方法、装置及电子设备和存储介质 |
CN112560408A (zh) * | 2020-12-18 | 2021-03-26 | 广东轩辕网络科技股份有限公司 | 一种文本标注方法、装置、终端及存储介质 |
CN112800755A (zh) * | 2021-02-05 | 2021-05-14 | 北京明略软件系统有限公司 | 一种数据治理方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105045933A (zh) * | 2015-09-08 | 2015-11-11 | 中国人民解放军海军工程大学 | 船舶装备维修保障信息关系数据库模式与本体间映射方法 |
US20160147763A1 (en) * | 2014-11-20 | 2016-05-26 | International Business Machines Corporation | Entity-relation based passage scoring in a question answering computer system |
CN108509483A (zh) * | 2018-01-31 | 2018-09-07 | 北京化工大学 | 基于知识图谱的机械故障诊断知识库构建方法 |
-
2018
- 2018-11-23 CN CN201811407803.3A patent/CN109492115A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160147763A1 (en) * | 2014-11-20 | 2016-05-26 | International Business Machines Corporation | Entity-relation based passage scoring in a question answering computer system |
CN105045933A (zh) * | 2015-09-08 | 2015-11-11 | 中国人民解放军海军工程大学 | 船舶装备维修保障信息关系数据库模式与本体间映射方法 |
CN108509483A (zh) * | 2018-01-31 | 2018-09-07 | 北京化工大学 | 基于知识图谱的机械故障诊断知识库构建方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110727804A (zh) * | 2019-10-11 | 2020-01-24 | 北京明略软件系统有限公司 | 利用知识图谱处理维修案例的方法、装置及电子设备 |
CN110765135A (zh) * | 2019-10-28 | 2020-02-07 | 深圳市元征科技股份有限公司 | 汽修资料结构标准化方法、装置及电子设备和存储介质 |
CN112560408A (zh) * | 2020-12-18 | 2021-03-26 | 广东轩辕网络科技股份有限公司 | 一种文本标注方法、装置、终端及存储介质 |
CN112800755A (zh) * | 2021-02-05 | 2021-05-14 | 北京明略软件系统有限公司 | 一种数据治理方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109492115A (zh) | 一种汽修知识实体网络构建方法、装置及设备 | |
CN106709345B (zh) | 基于深度学习方法推断恶意代码规则的方法、系统及设备 | |
CN105069056B (zh) | 基于字符串匹配的身份证住址信息解析方法及系统 | |
CN106202028B (zh) | 一种地址信息识别方法及装置 | |
Liu et al. | A branch-and-bound algorithm for minimizing the energy consumption in the PFS problem | |
CN106469282A (zh) | 数据访问权限控制方法及装置 | |
CN103020295A (zh) | 一种问题标签标注方法及装置 | |
CN103152401B (zh) | 移动终端及通过其进行登录的方法、系统和云端服务器 | |
CN101794318A (zh) | Url解析方法及设备 | |
CN103605609A (zh) | 一种适用于云计算的自动化测试框架 | |
CN103309893A (zh) | 一种字符串的比较方法及装置 | |
CN104778528A (zh) | 利用大数据获取智慧城市评估指标的方法及系统 | |
CN105282207B (zh) | 一种基于可拼装通信协议栈的通信方法及系统 | |
CN110674503B (zh) | 一种基于图卷积神经网络的智能合约死循环检测方法 | |
CN106802927A (zh) | 一种数据存储方法及查询方法 | |
CN104519056B (zh) | 一种基于双跳跃的单模式匹配方法 | |
CN103455964B (zh) | 一种基于案件信息的案件线索分析系统及方法 | |
CN104778252A (zh) | 索引的存储方法和装置 | |
CN106168946A (zh) | 一种识别用户名缩写现象的方法 | |
CN103258255A (zh) | 一种适用于电网管理系统的知识发现方法 | |
CN107918675A (zh) | 一种搜索方法及搜索系统 | |
CN104932982B (zh) | 一种消息访存的编译方法及相关装置 | |
CN111178615A (zh) | 一种企业风险识别模型的构建方法及系统 | |
CN105740390A (zh) | 一种逆向提取plist格式数据的方法 | |
CN110472385A (zh) | 一种口令破解方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190319 |