CN117474093A - 一种汽车故障知识图谱构建方法及系统 - Google Patents
一种汽车故障知识图谱构建方法及系统 Download PDFInfo
- Publication number
- CN117474093A CN117474093A CN202311444847.4A CN202311444847A CN117474093A CN 117474093 A CN117474093 A CN 117474093A CN 202311444847 A CN202311444847 A CN 202311444847A CN 117474093 A CN117474093 A CN 117474093A
- Authority
- CN
- China
- Prior art keywords
- fault
- entity
- automobile
- knowledge graph
- generalized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010276 construction Methods 0.000 title claims abstract description 18
- 239000013598 vector Substances 0.000 claims abstract description 112
- 238000000034 method Methods 0.000 claims abstract description 32
- 238000012549 training Methods 0.000 claims abstract description 14
- 238000000605 extraction Methods 0.000 claims description 7
- 238000012098 association analyses Methods 0.000 claims description 6
- 241000157593 Milvus Species 0.000 claims description 3
- 230000008569 process Effects 0.000 abstract description 9
- 238000004364 calculation method Methods 0.000 abstract description 7
- 230000007246 mechanism Effects 0.000 abstract description 3
- 238000012423 maintenance Methods 0.000 description 30
- 238000004458 analytical method Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
- G06N5/025—Extracting rules from data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于知识图谱技术领域,具体涉及一种汽车故障知识图谱构建方法,通过对故障实体进行泛化,解决了实体名称描述中同义词和近义词的匹配问题,实现“举一反三”,降低了匹配难度,并且利用从泛化汽车故障知识图谱中获取的故障实体原名称数据集以及故障实体泛化名称数据集训练得到实体语义索引模型,实体语义索引模型可对故障实体的词向量进行预测,然后用实体语义索引模型计算出的词向量在向量数据库进行检索后返回距离值最小的一个或多个的故障实体,不需要进行相似度计算,简化过程且效率高、准确度高。另外构建了汽车故障知识图谱反馈及更新机制,自动优化和修正汽车故障知识图谱。本发明还提供一种汽车故障知识图谱构建系统。
Description
技术领域
本发明涉及知识图谱技术领域,具体涉及一种汽车故障知识图谱构建方法及系统。
背景技术
随着知识图谱技术的逐步成熟,在金融、电商、教育等行业得到了广泛的应用,近年来智能汽车领域也在探索知识图谱技术的使用,如汽车制造、汽车维修、汽车营销等场景。
目前,大部分技术只讲述了基于汽车故障知识图谱的应用,并未细化如何构建汽车故障知识图谱,如专利CN114691831A提出了一种基于知识图谱的任务型汽车故障智能问答系统,利用图谱知识库的内容根据用户提问信息进行自主回答;专利CN115033679A提出了一种基于知识图谱搜索汽车维修数据的方法,对用户输入信息进行故障识别得到故障对,并将所述故障对及发生条件输入到知识图谱中生成侯选答案,进一步对候选答案进行排序,最终输出最匹配的N个答案。
现有技术公开了一种基于知识图谱表示学习的搜索召回方法和系统,所述方法采用基于知识图谱的表示学习得到图谱中实体对应的向量,根据向量建立目标文档对应的索引库,再通过实体链接、向量的查询与检索、向量相似度精细计算和文档检索,实现用户输入查询语句到获得检索结果,提升了搜索召回的语义召回能力以及实现冷启动的效果。通过表示学习能够获得实体对应的向量,以及通过实体链接精准匹配出查询语句中的实体,相对于现有技术,能够解决现有技术中由于切词导致召回不准确的问题,实现“一词多义”和“多词一义”场景下文档的有效召回,同时减少了召回过程中训练模型对语料的依赖性,在保证召回过程响应时间的基础上,提升可解释性。该专利的知识图谱泛化能力弱,匹配难度大,并且该专利是在先进行实体匹配,再将实体用所述索引库进行查询,获取准确向量和候选的相似向量,需要进行相似度计算,过程复杂且效率低。
发明内容
本发明的目的在于提供一种汽车故障知识图谱构建方法及系统,以现有技术中的匹配难度大且计算复杂的问题,提供降低匹配难度且效率高的汽车故障知识图谱构建方法及系统。
为了实现上述目的,本发明采用的技术方案如下:
一种汽车故障知识图谱构建方法,包括:
S1:获取初始汽车故障知识,从初始汽车故障知识中提取故障实体以及多个故障实体之间的关联关系,生成初始汽车故障知识图谱;
S2:将初始汽车故障知识图谱中的故障实体原名称使用词向量模型进行泛化,得到故障实体泛化名称,将故障实体泛化名称和故障实体原名称一并存入初始汽车故障知识图谱中,并建立故障实体泛化名称与故障实体原名称之间的关系,生成泛化汽车故障知识图谱;
S3:从泛化汽车故障知识图谱中获取各故障实体原名称,由各故障实体原名称组成故障实体原名称数据集;从泛化汽车故障知识图谱中获取各故障实体泛化名称,由各故障实体泛化名称组成故障实体泛化名称数据集;构建微调语言模型,利用故障实体原名称数据集和故障实体泛化名称数据集一起对微调语言模型进行训练,得到一个用于既能计算故障实体原名称的词向量又能计算故障实体泛化名称的词向量的实体语义索引模型;
S4:通过实体语义索引模型计算故障实体原名称数据集中各故障实体原名称对应的词向量,并将故障实体原名称与其词向量对应的关系存入向量数据库中;
S5:获取新增实体,先提取新增实体原名称,将提取到的新增实体原名称输入实体语义索引模型计算其词向量,得到新增实体的词向量;将新增实体的词向量输入向量数据库中进行查询,获取距离值最小的故障实体原名称,若最小距离值小于预设阈值,则认为新增实体与故障实体原名称对应的故障实体相同,向泛化汽车故障知识图谱更新相关信息;否则,向泛化汽车故障知识图谱新增实体及相关信息。
进一步地,在步骤S1中,通过实体识别模型从初始汽车故障知识中提取故障实体以及多个故障实体之间的关联关系。
进一步地,在步骤S3中,微调语言模型采用SimCSE模型。
进一步地,在步骤S4中,故障实体原名称与其词向量对应的关系存入的向量数据库为Milvus向量数据库。
进一步地,在步骤S5中,若新增实体与故障实体原名称对应的故障实体相同,向泛化汽车故障知识图谱中增加该新增实体原名称和与之相同的故障实体之间的对应关系;若新增实体与故障实体原名称对应的故障实体并无相同,对新增实体的名称使用词向量模型进行泛化,得到新增实体泛化名称,将新增实体泛化名称和新增实体原名称以及新增实体泛化名称与新增实体原名称之间的关系存入泛化汽车故障知识图谱中,并且通过实体语义索引模型计算新增实体原名称对应的词向量,并将新增实体原名称与其词向量对应的关系存入向量数据库中。
进一步地,在步骤S5中,新知识为用户输入信息,使用W2NER模型对用户输入信息进行实体提取;在用户进行实体检索时,向用户返回距离值最小的一个或多个对应的故障实体原名称,并且使用故障实体原名称对应的故障实体向泛化汽车故障知识图谱获取知识。
进一步地,还包括:
S6:从用户的反馈信息中提取新的汽车故障知识,并结合已有汽车故障知识进行关联分析,建立新的语义链路,并在泛化汽车故障知识图谱中进行关联更新,同时更新向量数据库。
进一步地,还包括:
S7:当泛化汽车故障知识图谱中的新增实体的数量或距离上次更新实体语义索引模型的时间大于预设阈值,则执行步骤S3进行实体语义索引模型的更新。
本发明还提供一种汽车故障知识图谱构建系统,包括:
初始汽车故障知识图谱生成模块,用于获取初始汽车故障知识,从初始汽车故障知识中提取故障实体以及多个故障实体之间的关联关系,生成初始汽车故障知识图谱;
泛化汽车故障知识图谱生成模块,用于将初始汽车故障知识图谱中的故障实体原名称使用词向量模型进行泛化,得到故障实体泛化名称,将故障实体泛化名称和故障实体原名称一并存入初始汽车故障知识图谱中,并建立故障实体泛化名称与故障实体原名称之间的关系,生成泛化汽车故障知识图谱;
实体语义索引模型生成模块,用于从泛化汽车故障知识图谱中获取各故障实体原名称,由各故障实体原名称组成故障实体原名称数据集;从泛化汽车故障知识图谱中获取各故障实体泛化名称,由各故障实体泛化名称组成故障实体泛化名称数据集;构建微调语言模型,利用故障实体原名称数据集和故障实体泛化名称数据集一起对微调语言模型进行训练,得到一个用于既能计算故障实体原名称的词向量又能计算故障实体泛化名称的词向量的实体语义索引模型;
向量数据库生成模块,用于通过实体语义索引模型计算故障实体原名称数据集中各故障实体原名称对应的词向量,并将故障实体原名称与其词向量对应的关系存入向量数据库中;
更新模块,用于获取新增实体,先提取新增实体原名称,将提取到的新增实体原名称输入实体语义索引模型计算其词向量,得到新增实体的词向量;将新增实体的词向量输入向量数据库中进行查询,获取距离值最小的故障实体原名称,若最小距离值小于预设阈值,则认为新增实体与故障实体原名称对应的故障实体相同,向泛化汽车故障知识图谱更新相关信息;否则,向泛化汽车故障知识图谱新增实体及相关信息。
进一步地,汽车故障知识图谱构建系统还包括:
知识反馈模块,从用户的反馈信息中提取新的汽车故障知识,并结合已有汽车故障知识进行关联分析,建立新的语义链路,并在泛化汽车故障知识图谱中进行关联更新,同时更新向量数据库;
翻新模块,用于判断泛化汽车故障知识图谱中的新增实体的数量或距离上次更新实体语义索引模型的时间是否大于预设阈值,当泛化汽车故障知识图谱中的新增实体的数量或距离上次更新实体语义索引模型的时间大于预设阈值,则进行实体语义索引模型的更新。
本发明的有益效果:
本发明通过对故障实体进行泛化,提高了知识图谱的泛化能力,解决了实体名称描述中同义词和近义词的匹配问题,实现“举一反三”,降低了匹配难度,并且利用从泛化汽车故障知识图谱中获取各故障实体原名称组成的故障实体原名称数据集以及从泛化汽车故障知识图谱中获取各故障实体泛化名称组成的故障实体泛化名称数据集训练得到实体语义索引模型,实体语义索引模型可对故障实体的词向量进行预测,然后用实体语义索引模型计算出的词向量在向量数据库进行检索后返回距离值最小的一个或多个的故障实体,不需要进行相似度计算,简化过程且效率高、准确度高。实体语义索引模型是由故障实体原名称数据集和故障实体泛化名称数据集训练得到的,泛化能力强,提高了其准确度。
附图说明
图1为本发明的汽车故障知识图谱构建方法的流程图。
图2为本发明的汽车故障知识图谱构建系统的原理框图。
具体实施方式
以下将参照附图和优选实施例来说明本发明的实施方式,本领域技术人员可由本说明书中所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。应当理解,优选实施例仅为了说明本发明,而不是为了限制本发明的保护范围。
本发明实施例的相关术语解释如下:
汽车故障知识:包含车辆基本信息、汽车用户手册、维修记录、保养记录、整车故障诊断方案、整车零部件清单、车况记录、故障记录等;
汽车故障知识图谱:包含故障本体和知识链路;
故障本体:包含对故障本体概念、本体属性和本体关系的描述;本发明的故障本体概念包含品牌、车系、车型、部件、故障、根因、现象、方案、维修、保养、车辆、车况;
具体地:
品牌:表示汽车品牌;
车系:表示表示车型系列;
车型:表示汽车型号,具体指根据不同的配置和配置组合推出的不同款式或不同版本的车;
部件:表示汽车车身模块或零部件,如,VCU、ECU、发动机、轮胎、中控屏等;
故障:表示汽车可能出现的各种问题和故障,如,启动困难、冷却系统故障、制动失灵、刹车盘异响、中控屏死机等;
根因:表示导致汽车故障现象的根本原因,具体指与汽车部件或系统的失效、损坏、改变等相关的问题,故障根因可分为机械故障、电气故障、电子控制系统故障等多种类型;
现象:表示汽车故障现象,具体指汽车在使用过程中,出现突然失效、运行不正常、无法正常行驶等情况,常见故障现象包括发动机启动困难、行驶抖动、油耗过高、制动失灵等;
方案:表示汽车故障根因的排除方法和技术;
维修:表示汽车的故障维修信息;
保养:表示汽车的日常保养信息;
车辆:表示燃油车或新能源车;
车况:表示车辆的车况信息,具体车况信息包括不限于车辆状态、充电状态、加油状态、运行模式、车速、累计里程、SOC、总电压、总电流、档位、发动机状态、驱动电机状态等;
本体属性:是对本体特征的进一步描述;如“品牌”具体属性有名称、编码等;“车辆”具体属性有车架号、车型、车长、车宽、车高、轴距等;
本体关系:包含汽车车型、车辆部件、车辆故障、子模块、故障根因、故障现象、维修案例、维修建议、维修建议、维修记录、保养记录、车况记录、故障记录、故障信号;具体地:所述汽车车型表示品牌与车型的关系,由品牌实体指向车型实体,建立品牌与车型的关系,可以便捷的根据品牌确定车型或根据车型确定品牌;所述车辆部件表示车型与部件的关系,由车型实体指向部件实体,建立车型与部件的关系,描述每个车型下面有哪些部件;所述车辆故障表示部件与故障的关系,由部件实体指向故障实体,建立部件与故障的关系,描述每个部件可能产生哪些故障;所述子模块表示部件与部件的关系,由父部件实体指向子部件实体,建立部件与部件的关系,描述每个部件的子部件的组成;所述故障根因表示故障与根因的关系,由故障实体指向根因实体,建立故障与根因的关系,描述每个故障可能由哪些因素导致;所述故障现象表示故障与现象的关系,由故障实体指向现象实体,建立故障与现象的关系,描述每个故障的具体现象,可用于通过故障现象描述找到具体故障实体;所述维修案例表示故障与维修的关系,由故障实体指向维修实体,建立故障与维修的关系,描述每个故障的维修案例,可用于根据用户检索故障内容,推荐相关故障维修案例;所述故障维修建议表示故障与方案的关系,由故障实体指向方案实体,建立故障与方案的关系,描述每个故障的具体解决方法或维修建议;所述部件维修建议表示部件与方案的关系,由部件实体指向方案实体,建立部件与解决方案的关系,描述部件的维修方法或维修建议;所述维修记录表示车辆与维修的关系,由车辆实体指向维修实体,构建车辆与维修的关系,描述车辆的具体维修信息;所述保养记录表示车辆与保养的关系,由车辆实体指向保养实体,构建车辆与保养的关系,描述车辆的具体保养信息;所述车况记录表示车辆与车况的关系,由车辆实体指向车况实体,构建车辆与车况的关系,描述车辆的具体车况信息;所述故障记录表示车辆与故障的关系,由车辆实体指向故障实体,构建车辆与故障的关系,描述车辆的具体故障信息;所述故障信号表示车况与故障的关系,由车况实体指向故障实体,构建车况与故障的关系,描述车况信号对应的故障信息;所述知识链路使用所述故障本体、本体属性、本体关系构建,具体包含汽车故障分析、故障检测、故障预警、故障咨询等;
知识链路:使用所述故障本体、本体属性、本体关系构建,具体包含汽车故障分析、故障检测、故障预警、故障咨询等;
实体链接:是将不同数据源中的实体进行标准化和链接的过程;
知识合并:是将不同数据源中的知识点进行整合;
知识加工:是将从不同数据源中提取出的故障实体和实体关系进行知识推理和知识补充;
汽车故障知识组织类型包含结构化、半结构化和非结构化数据;所述结构化数据通过建立故障本体映射、本体属性映射和本体关系映射将一个或多个数据源中的结构化数据转换成实体、实体属性值、实体关系数据实时同步至所述汽车故障知识图谱中;所述半结构化、非结构化数据通过对样本数据进行打标,分别使用样本数据训练汽车故障实体识别模型、汽车故障实体属性提取模型和汽车故障实体关系抽取模型。
如图1所示,本发明优选实施例的一种汽车故障知识图谱构建方法,包括:
S1:获取初始汽车故障知识,从初始汽车故障知识中提取故障实体以及多个故障实体之间的关联关系,生成初始汽车故障知识图谱;
S2:将初始汽车故障知识图谱中的故障实体原名称使用词向量模型进行泛化,得到故障实体泛化名称,将故障实体泛化名称和故障实体原名称一并存入初始汽车故障知识图谱中,并建立故障实体泛化名称与故障实体原名称之间的关系,生成泛化汽车故障知识图谱;
S3:从泛化汽车故障知识图谱中获取各故障实体原名称,由各故障实体原名称组成故障实体原名称数据集;从泛化汽车故障知识图谱中获取各故障实体泛化名称,由各故障实体泛化名称组成故障实体泛化名称数据集;构建微调语言模型,利用故障实体原名称数据集和故障实体泛化名称数据集一起对微调语言模型进行训练,得到一个用于既能计算故障实体原名称的词向量又能计算故障实体泛化名称的词向量的实体语义索引模型;
S4:通过实体语义索引模型计算故障实体原名称数据集中各故障实体原名称对应的词向量,并将故障实体原名称与其词向量对应的关系存入向量数据库中;
S5:获取新增实体,先提取新增实体原名称,将提取到的新增实体原名称输入实体语义索引模型计算其词向量,得到新增实体的词向量;将新增实体的词向量输入向量数据库中进行查询,获取距离值最小的故障实体原名称,若最小距离值小于预设阈值,则认为新增实体与故障实体原名称对应的故障实体相同,向泛化汽车故障知识图谱更新相关信息;否则,向泛化汽车故障知识图谱新增实体及相关信息;本步骤实现了获取新知识,根据新知识更新泛化汽车故障知识图谱和向量数据库;
S6:从用户的反馈信息中提取新的汽车故障知识,并结合已有汽车故障知识进行关联分析,建立新的语义链路,并在泛化汽车故障知识图谱中进行关联更新,同时更新向量数据库;实现获取用户的反馈信息,根据用户的反馈信息进行知识修正;
S7:当泛化汽车故障知识图谱中的新增实体的数量或距离上次更新实体语义索引模型的时间大于预设阈值,则执行步骤S3进行实体语义索引模型的更新。预设阈值由自主设定。
本实施例通过对故障实体进行泛化,提高了知识图谱的泛化能力,解决了实体名称描述中同义词和近义词的匹配问题,实现“举一反三”,降低了匹配难度,并且利用从泛化汽车故障知识图谱中获取各故障实体的原名称得到的故障实体原名称数据集以及从泛化汽车故障知识图谱中获取各故障实体泛化后的名称得到故障实体泛化名称数据集训练得到实体语义索引模型,实体语义索引模型可对故障实体的词向量进行预测,然后用实体语义索引模型计算出的词向量在向量数据库进行检索后返回距离值最小的一个或多个的故障实体,不需要进行相似度计算,简化过程且效率高、准确度高。实体语义索引模型是由故障实体原名称数据集和故障实体泛化名称数据集训练得到的,泛化能力强,提高了其准确度。
另外,根据新知识更新泛化汽车故障知识图谱和向量数据库,用户的反馈信息更新知识图谱,以及当泛化汽车故障知识图谱中的新增实体的数量或距离上次更新实体语义索引模型的时间大于预设阈值时更新实体语义索引模型,构建了汽车故障知识图谱反馈及更新机制,实现了汽车故障本体、故障实体、知识链路的自动更新,自动优化和修正汽车故障知识图谱,可为汽车故障分析、故障检测、故障预警、故障咨询等场景提供更加准确的知识。
具体地,在步骤S1中,通过实体识别模型从初始汽车故障知识中提取故障实体以及多个故障实体之间的关联关系。
在步骤S3中,微调语言模型采用SimCSE模型。
在步骤S4中,故障实体原名称与其词向量对应的关系存入的向量数据库为Milvus向量数据库。
在步骤S5中,若新增实体与故障实体原名称对应的故障实体相同,向泛化汽车故障知识图谱中增加该新增实体原名称和与之相同的故障实体之间的对应关系;若新增实体与故障实体原名称对应的故障实体并无相同,对新增实体的名称使用词向量模型进行泛化,得到新增实体泛化名称,将新增实体泛化名称和新增实体原名称以及新增实体泛化名称与新增实体原名称之间的关系存入泛化汽车故障知识图谱中,并且通过实体语义索引模型计算新增实体原名称对应的词向量,并将新增实体原名称与其词向量对应的关系存入向量数据库中。
在步骤S5中,新知识为用户输入信息,使用W2NER模型对用户输入信息进行实体提取;在用户进行实体检索时,向用户返回距离值最小的一个或多个对应的故障实体原名称,并且使用故障实体原名称对应的故障实体向泛化汽车故障知识图谱获取知识。
如图2所示,本发明实施例还提供一种汽车故障知识图谱构建系统,包括:
初始汽车故障知识图谱生成模块,用于获取初始汽车故障知识,从初始汽车故障知识中提取故障实体以及多个故障实体之间的关联关系,生成初始汽车故障知识图谱;
泛化汽车故障知识图谱生成模块,用于将初始汽车故障知识图谱中的故障实体原名称使用词向量模型进行泛化,得到故障实体泛化名称,将故障实体泛化名称和故障实体原名称一并存入初始汽车故障知识图谱中,并建立故障实体泛化名称与故障实体原名称之间的关系,生成泛化汽车故障知识图谱;
实体语义索引模型生成模块,用于从泛化汽车故障知识图谱中获取各故障实体原名称,由各故障实体原名称组成故障实体原名称数据集;从泛化汽车故障知识图谱中获取各故障实体泛化名称,由各故障实体泛化名称组成故障实体泛化名称数据集;构建微调语言模型,利用故障实体原名称数据集和故障实体泛化名称数据集一起对微调语言模型进行训练,得到一个用于既能计算故障实体原名称的词向量又能计算故障实体泛化名称的词向量的实体语义索引模型;
向量数据库生成模块,用于通过实体语义索引模型计算故障实体原名称数据集中各故障实体原名称对应的词向量,并将故障实体原名称与其词向量对应的关系存入向量数据库中;
更新模块,用于获取新增实体,先提取新增实体原名称,将提取到的新增实体原名称输入实体语义索引模型计算其词向量,得到新增实体的词向量;将新增实体的词向量输入向量数据库中进行查询,获取距离值最小的故障实体原名称,若最小距离值小于预设阈值,则认为新增实体与故障实体原名称对应的故障实体相同,向泛化汽车故障知识图谱更新相关信息;否则,向泛化汽车故障知识图谱新增实体及相关信息;
知识反馈模块,用于获取用户的反馈信息,根据用户的反馈信息进行知识修正,具体为,从用户的反馈信息中提取新的汽车故障知识,并结合已有汽车故障知识进行关联分析,建立新的语义链路,并在泛化汽车故障知识图谱中进行关联更新,同时更新向量数据库;
翻新模块,用于判断泛化汽车故障知识图谱中的新增实体的数量或距离上次更新实体语义索引模型的时间是否大于预设阈值,当泛化汽车故障知识图谱中的新增实体的数量或距离上次更新实体语义索引模型的时间大于预设阈值,则进行实体语义索引模型的更新。
具体地,初始汽车故障知识图谱生成模块包括知识抽取单元、知识存储单元和知识管理单元,知识抽取单元用于从一个或多个数据源获取结构化、半结构化、非结构化知识,并进行汽车故障知识抽取、融合后写入知识存储单元;知识存储单元,主要是使用图数据库存储三元组故障知识;知识管理单元主要是管理汽车故障知识的元数据信息。
综上所述,本发明实施例提供一种汽车故障知识图谱构建方法,通过对故障实体进行泛化,提高了知识图谱的泛化能力,解决了实体名称描述中同义词和近义词的匹配问题,实现“举一反三”,降低了匹配难度,并且利用从泛化汽车故障知识图谱中获取各故障实体的原名称得到的故障实体原名称数据集以及从泛化汽车故障知识图谱中获取各故障实体泛化后的名称得到故障实体泛化名称数据集训练得到实体语义索引模型,实体语义索引模型可对故障实体的词向量进行预测,然后用实体语义索引模型计算出的词向量在向量数据库进行检索后返回距离值最小的一个或多个的故障实体,不需要进行相似度计算,简化过程且效率高、准确度高。实体语义索引模型是由故障实体原名称数据集和故障实体泛化名称数据集训练得到的,泛化能力强,提高了其准确度。另外,根据新知识更新泛化汽车故障知识图谱和向量数据库,用户的反馈信息更新知识图谱,以及当泛化汽车故障知识图谱中的新增实体的数量或距离上次更新实体语义索引模型的时间大于预设阈值时更新实体语义索引模型,构建了汽车故障知识图谱反馈及更新机制,实现了汽车故障本体、故障实体、知识链路的自动更新,自动优化和修正汽车故障知识图谱,可为汽车故障分析、故障检测、故障预警、故障咨询等场景提供更加准确的知识。本发明实施例还提供一种基于上述方法的汽车故障知识图谱构建系统。
以上实施例仅是为充分说明本发明而所举的较佳的实施例,本发明的保护范围不限于此。本技术领域的技术人员在本发明基础上所作的等同替代或变换,均在本发明的保护范围之内。
Claims (10)
1.一种汽车故障知识图谱构建方法,其特征在于,包括:
S1:获取初始汽车故障知识,从初始汽车故障知识中提取故障实体以及多个故障实体之间的关联关系,生成初始汽车故障知识图谱;
S2:将初始汽车故障知识图谱中的故障实体原名称使用词向量模型进行泛化,得到故障实体泛化名称,将故障实体泛化名称和故障实体原名称一并存入初始汽车故障知识图谱中,并建立故障实体泛化名称与故障实体原名称之间的关系,生成泛化汽车故障知识图谱;
S3:从泛化汽车故障知识图谱中获取各故障实体原名称,由各故障实体原名称组成故障实体原名称数据集;从泛化汽车故障知识图谱中获取各故障实体泛化名称,由各故障实体泛化名称组成故障实体泛化名称数据集;构建微调语言模型,利用故障实体原名称数据集和故障实体泛化名称数据集一起对微调语言模型进行训练,得到一个用于既能计算故障实体原名称的词向量又能计算故障实体泛化名称的词向量的实体语义索引模型;
S4:通过实体语义索引模型计算故障实体原名称数据集中各故障实体原名称对应的词向量,并将故障实体原名称与其词向量对应的关系存入向量数据库中;
S5:获取新增实体,先提取新增实体原名称,将提取到的新增实体原名称输入实体语义索引模型计算其词向量,得到新增实体的词向量;将新增实体的词向量输入向量数据库中进行查询,获取距离值最小的故障实体原名称,若最小距离值小于预设阈值,则认为新增实体与故障实体原名称对应的故障实体相同,向泛化汽车故障知识图谱更新相关信息;否则,向泛化汽车故障知识图谱新增实体及相关信息。
2.根据权利要求1所述的汽车故障知识图谱构建方法,其特征在于,在步骤S1中,通过实体识别模型从初始汽车故障知识中提取故障实体以及多个故障实体之间的关联关系。
3.根据权利要求1所述的汽车故障知识图谱构建方法,其特征在于,在步骤S3中,微调语言模型采用SimCSE模型。
4.根据权利要求1所述的汽车故障知识图谱构建方法,其特征在于,在步骤S4中,故障实体原名称与其词向量对应的关系存入的向量数据库为Milvus向量数据库。
5.根据权利要求1所述的汽车故障知识图谱构建方法,其特征在于,在步骤S5中,若新增实体与故障实体原名称对应的故障实体相同,向泛化汽车故障知识图谱中增加该新增实体原名称和与之相同的故障实体之间的对应关系;若新增实体与故障实体原名称对应的故障实体并无相同,对新增实体的名称使用词向量模型进行泛化,得到新增实体泛化名称,将新增实体泛化名称和新增实体原名称以及新增实体泛化名称与新增实体原名称之间的关系存入泛化汽车故障知识图谱中,并且通过实体语义索引模型计算新增实体原名称对应的词向量,并将新增实体原名称与其词向量对应的关系存入向量数据库中。
6.根据权利要求1所述的汽车故障知识图谱构建方法,其特征在于,在步骤S5中,新知识为用户输入信息,使用W2NER模型对用户输入信息进行实体提取;在用户进行实体检索时,向用户返回距离值最小的一个或多个对应的故障实体原名称,并且使用故障实体原名称对应的故障实体向泛化汽车故障知识图谱获取知识。
7.根据权利要求1所述的汽车故障知识图谱构建方法,其特征在于,还包括:
S6:从用户的反馈信息中提取新的汽车故障知识,并结合已有汽车故障知识进行关联分析,建立新的语义链路,并在泛化汽车故障知识图谱中进行关联更新,同时更新向量数据库。
8.根据权利要求1所述的汽车故障知识图谱构建方法,其特征在于,还包括:
S7:当泛化汽车故障知识图谱中的新增实体的数量或距离上次更新实体语义索引模型的时间大于预设阈值,则执行步骤S3进行实体语义索引模型的更新。
9.一种汽车故障知识图谱构建系统,其特征在于,包括:
初始汽车故障知识图谱生成模块,用于获取初始汽车故障知识,从初始汽车故障知识中提取故障实体以及多个故障实体之间的关联关系,生成初始汽车故障知识图谱;
泛化汽车故障知识图谱生成模块,用于将初始汽车故障知识图谱中的故障实体原名称使用词向量模型进行泛化,得到故障实体泛化名称,将故障实体泛化名称和故障实体原名称一并存入初始汽车故障知识图谱中,并建立故障实体泛化名称与故障实体原名称之间的关系,生成泛化汽车故障知识图谱;
实体语义索引模型生成模块,用于从泛化汽车故障知识图谱中获取各故障实体原名称,由各故障实体原名称组成故障实体原名称数据集;从泛化汽车故障知识图谱中获取各故障实体泛化名称,由各故障实体泛化名称组成故障实体泛化名称数据集;构建微调语言模型,利用故障实体原名称数据集和故障实体泛化名称数据集一起对微调语言模型进行训练,得到一个用于既能计算故障实体原名称的词向量又能计算故障实体泛化名称的词向量的实体语义索引模型;
向量数据库生成模块,用于通过实体语义索引模型计算故障实体原名称数据集中各故障实体原名称对应的词向量,并将故障实体原名称与其词向量对应的关系存入向量数据库中;
更新模块,用于获取新增实体,先提取新增实体原名称,将提取到的新增实体原名称输入实体语义索引模型计算其词向量,得到新增实体的词向量;将新增实体的词向量输入向量数据库中进行查询,获取距离值最小的故障实体原名称,若最小距离值小于预设阈值,则认为新增实体与故障实体原名称对应的故障实体相同,向泛化汽车故障知识图谱更新相关信息;否则,向泛化汽车故障知识图谱新增实体及相关信息。
10.根据权利要求9所述的汽车故障知识图谱构建系统,其特征在于,还包括:
知识反馈模块,用于从用户的反馈信息中提取新的汽车故障知识,并结合已有汽车故障知识进行关联分析,建立新的语义链路,并在泛化汽车故障知识图谱中进行关联更新,同时更新向量数据库;
翻新模块,用于判断泛化汽车故障知识图谱中的新增实体的数量或距离上次更新实体语义索引模型的时间是否大于预设阈值,当泛化汽车故障知识图谱中的新增实体的数量或距离上次更新实体语义索引模型的时间大于预设阈值,则进行实体语义索引模型的更新。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311444847.4A CN117474093A (zh) | 2023-11-01 | 2023-11-01 | 一种汽车故障知识图谱构建方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311444847.4A CN117474093A (zh) | 2023-11-01 | 2023-11-01 | 一种汽车故障知识图谱构建方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117474093A true CN117474093A (zh) | 2024-01-30 |
Family
ID=89635925
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311444847.4A Pending CN117474093A (zh) | 2023-11-01 | 2023-11-01 | 一种汽车故障知识图谱构建方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117474093A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117873909A (zh) * | 2024-03-13 | 2024-04-12 | 上海爱可生信息技术股份有限公司 | 故障诊断执行方法、故障诊断执行系统、电子设备及存储介质 |
CN118245608A (zh) * | 2024-03-19 | 2024-06-25 | 上海森亿医疗科技有限公司 | 基于语义分析及知识图谱的疾病研究数据集融合方法、系统及终端 |
CN118378964A (zh) * | 2024-06-27 | 2024-07-23 | 南方科技大学 | 一种基于树状思维链的汽车质检生命周期管理方法 |
CN118428368A (zh) * | 2024-04-30 | 2024-08-02 | 重庆大学 | 一种汽车系统故障知识图谱命名实体识别重组方法及系统 |
-
2023
- 2023-11-01 CN CN202311444847.4A patent/CN117474093A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117873909A (zh) * | 2024-03-13 | 2024-04-12 | 上海爱可生信息技术股份有限公司 | 故障诊断执行方法、故障诊断执行系统、电子设备及存储介质 |
CN117873909B (zh) * | 2024-03-13 | 2024-05-28 | 上海爱可生信息技术股份有限公司 | 故障诊断执行方法、故障诊断执行系统、电子设备及存储介质 |
CN118245608A (zh) * | 2024-03-19 | 2024-06-25 | 上海森亿医疗科技有限公司 | 基于语义分析及知识图谱的疾病研究数据集融合方法、系统及终端 |
CN118428368A (zh) * | 2024-04-30 | 2024-08-02 | 重庆大学 | 一种汽车系统故障知识图谱命名实体识别重组方法及系统 |
CN118378964A (zh) * | 2024-06-27 | 2024-07-23 | 南方科技大学 | 一种基于树状思维链的汽车质检生命周期管理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111414477B (zh) | 车辆故障自动诊断方法、装置以及设备 | |
CN117474093A (zh) | 一种汽车故障知识图谱构建方法及系统 | |
CN111159249A (zh) | 基于知识图谱的目标识别方法、装置、系统、存储介质 | |
Chougule et al. | An integrated framework for effective service and repair in the automotive domain: An application of association mining and case-based-reasoning | |
CN113051382A (zh) | 一种基于知识图谱的电力故障智能问答方法及装置 | |
Rajpathak et al. | A domain-specific decision support system for knowledge discovery using association and text mining | |
CN117522372B (zh) | 基于深度学习的汽车故障模型的维修建议生成方法及系统 | |
US20170213222A1 (en) | Natural language processing and statistical techniques based methods for combining and comparing system data | |
CN116644192B (zh) | 基于航空器部件可靠性的知识图谱构建方法 | |
US20190130028A1 (en) | Machine-based extraction of customer observables from unstructured text data and reducing false positives therein | |
CN110032620A (zh) | 基于图搜索算法的自适应学习方法及计算机学习系统 | |
CN115858807A (zh) | 一种基于航空装备故障知识图谱的问答系统 | |
CN115048532A (zh) | 基于知识图谱的汽车维修场景智能问答机器人及设计方法 | |
Ahaggach et al. | Information extraction from automotive reports for ontology population | |
CN114818707A (zh) | 一种基于知识图谱的自动驾驶决策方法和系统 | |
CN117332858A (zh) | 基于知识图谱的汽车故障智能诊断系统的构建方法 | |
Li et al. | Driving cycle prediction based on Markov chain combined with driving information mining | |
Qi et al. | Towards Efficient Use Case Modeling with Automated Domain Classification and Term Recommendation | |
Song et al. | A data-driven fault prediction method for lng engine city buses | |
Noering | Unsupervised Pattern Discovery in Automotive Time Series | |
Tang et al. | Construction and Accurate Retrieval Method of Knowledge Graph of Automobile Engine Fault | |
Noering | Unsupervised Pattern Discovery in Automotive Time Series: Pattern-based Construction of Representative Driving Cycles | |
CN117390199A (zh) | 一种基于知识图谱的汽车故障智能诊断方法及系统 | |
Jiao | A framework for finding and summarizing product defects, and ranking helpful threads from online customer forums through machine learning | |
CN118035458A (zh) | 一种车辆故障自助查询方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |