CN117474093A - 一种汽车故障知识图谱构建方法及系统 - Google Patents

一种汽车故障知识图谱构建方法及系统 Download PDF

Info

Publication number
CN117474093A
CN117474093A CN202311444847.4A CN202311444847A CN117474093A CN 117474093 A CN117474093 A CN 117474093A CN 202311444847 A CN202311444847 A CN 202311444847A CN 117474093 A CN117474093 A CN 117474093A
Authority
CN
China
Prior art keywords
fault
entity
automobile
knowledge graph
generalized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311444847.4A
Other languages
English (en)
Inventor
冯生
曾红霞
白林
张豪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Changan Automobile Co Ltd
Original Assignee
Chongqing Changan Automobile Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Changan Automobile Co Ltd filed Critical Chongqing Changan Automobile Co Ltd
Priority to CN202311444847.4A priority Critical patent/CN117474093A/zh
Publication of CN117474093A publication Critical patent/CN117474093A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于知识图谱技术领域,具体涉及一种汽车故障知识图谱构建方法,通过对故障实体进行泛化,解决了实体名称描述中同义词和近义词的匹配问题,实现“举一反三”,降低了匹配难度,并且利用从泛化汽车故障知识图谱中获取的故障实体原名称数据集以及故障实体泛化名称数据集训练得到实体语义索引模型,实体语义索引模型可对故障实体的词向量进行预测,然后用实体语义索引模型计算出的词向量在向量数据库进行检索后返回距离值最小的一个或多个的故障实体,不需要进行相似度计算,简化过程且效率高、准确度高。另外构建了汽车故障知识图谱反馈及更新机制,自动优化和修正汽车故障知识图谱。本发明还提供一种汽车故障知识图谱构建系统。

Description

一种汽车故障知识图谱构建方法及系统
技术领域
本发明涉及知识图谱技术领域,具体涉及一种汽车故障知识图谱构建方法及系统。
背景技术
随着知识图谱技术的逐步成熟,在金融、电商、教育等行业得到了广泛的应用,近年来智能汽车领域也在探索知识图谱技术的使用,如汽车制造、汽车维修、汽车营销等场景。
目前,大部分技术只讲述了基于汽车故障知识图谱的应用,并未细化如何构建汽车故障知识图谱,如专利CN114691831A提出了一种基于知识图谱的任务型汽车故障智能问答系统,利用图谱知识库的内容根据用户提问信息进行自主回答;专利CN115033679A提出了一种基于知识图谱搜索汽车维修数据的方法,对用户输入信息进行故障识别得到故障对,并将所述故障对及发生条件输入到知识图谱中生成侯选答案,进一步对候选答案进行排序,最终输出最匹配的N个答案。
现有技术公开了一种基于知识图谱表示学习的搜索召回方法和系统,所述方法采用基于知识图谱的表示学习得到图谱中实体对应的向量,根据向量建立目标文档对应的索引库,再通过实体链接、向量的查询与检索、向量相似度精细计算和文档检索,实现用户输入查询语句到获得检索结果,提升了搜索召回的语义召回能力以及实现冷启动的效果。通过表示学习能够获得实体对应的向量,以及通过实体链接精准匹配出查询语句中的实体,相对于现有技术,能够解决现有技术中由于切词导致召回不准确的问题,实现“一词多义”和“多词一义”场景下文档的有效召回,同时减少了召回过程中训练模型对语料的依赖性,在保证召回过程响应时间的基础上,提升可解释性。该专利的知识图谱泛化能力弱,匹配难度大,并且该专利是在先进行实体匹配,再将实体用所述索引库进行查询,获取准确向量和候选的相似向量,需要进行相似度计算,过程复杂且效率低。
发明内容
本发明的目的在于提供一种汽车故障知识图谱构建方法及系统,以现有技术中的匹配难度大且计算复杂的问题,提供降低匹配难度且效率高的汽车故障知识图谱构建方法及系统。
为了实现上述目的,本发明采用的技术方案如下:
一种汽车故障知识图谱构建方法,包括:
S1:获取初始汽车故障知识,从初始汽车故障知识中提取故障实体以及多个故障实体之间的关联关系,生成初始汽车故障知识图谱;
S2:将初始汽车故障知识图谱中的故障实体原名称使用词向量模型进行泛化,得到故障实体泛化名称,将故障实体泛化名称和故障实体原名称一并存入初始汽车故障知识图谱中,并建立故障实体泛化名称与故障实体原名称之间的关系,生成泛化汽车故障知识图谱;
S3:从泛化汽车故障知识图谱中获取各故障实体原名称,由各故障实体原名称组成故障实体原名称数据集;从泛化汽车故障知识图谱中获取各故障实体泛化名称,由各故障实体泛化名称组成故障实体泛化名称数据集;构建微调语言模型,利用故障实体原名称数据集和故障实体泛化名称数据集一起对微调语言模型进行训练,得到一个用于既能计算故障实体原名称的词向量又能计算故障实体泛化名称的词向量的实体语义索引模型;
S4:通过实体语义索引模型计算故障实体原名称数据集中各故障实体原名称对应的词向量,并将故障实体原名称与其词向量对应的关系存入向量数据库中;
S5:获取新增实体,先提取新增实体原名称,将提取到的新增实体原名称输入实体语义索引模型计算其词向量,得到新增实体的词向量;将新增实体的词向量输入向量数据库中进行查询,获取距离值最小的故障实体原名称,若最小距离值小于预设阈值,则认为新增实体与故障实体原名称对应的故障实体相同,向泛化汽车故障知识图谱更新相关信息;否则,向泛化汽车故障知识图谱新增实体及相关信息。
进一步地,在步骤S1中,通过实体识别模型从初始汽车故障知识中提取故障实体以及多个故障实体之间的关联关系。
进一步地,在步骤S3中,微调语言模型采用SimCSE模型。
进一步地,在步骤S4中,故障实体原名称与其词向量对应的关系存入的向量数据库为Milvus向量数据库。
进一步地,在步骤S5中,若新增实体与故障实体原名称对应的故障实体相同,向泛化汽车故障知识图谱中增加该新增实体原名称和与之相同的故障实体之间的对应关系;若新增实体与故障实体原名称对应的故障实体并无相同,对新增实体的名称使用词向量模型进行泛化,得到新增实体泛化名称,将新增实体泛化名称和新增实体原名称以及新增实体泛化名称与新增实体原名称之间的关系存入泛化汽车故障知识图谱中,并且通过实体语义索引模型计算新增实体原名称对应的词向量,并将新增实体原名称与其词向量对应的关系存入向量数据库中。
进一步地,在步骤S5中,新知识为用户输入信息,使用W2NER模型对用户输入信息进行实体提取;在用户进行实体检索时,向用户返回距离值最小的一个或多个对应的故障实体原名称,并且使用故障实体原名称对应的故障实体向泛化汽车故障知识图谱获取知识。
进一步地,还包括:
S6:从用户的反馈信息中提取新的汽车故障知识,并结合已有汽车故障知识进行关联分析,建立新的语义链路,并在泛化汽车故障知识图谱中进行关联更新,同时更新向量数据库。
进一步地,还包括:
S7:当泛化汽车故障知识图谱中的新增实体的数量或距离上次更新实体语义索引模型的时间大于预设阈值,则执行步骤S3进行实体语义索引模型的更新。
本发明还提供一种汽车故障知识图谱构建系统,包括:
初始汽车故障知识图谱生成模块,用于获取初始汽车故障知识,从初始汽车故障知识中提取故障实体以及多个故障实体之间的关联关系,生成初始汽车故障知识图谱;
泛化汽车故障知识图谱生成模块,用于将初始汽车故障知识图谱中的故障实体原名称使用词向量模型进行泛化,得到故障实体泛化名称,将故障实体泛化名称和故障实体原名称一并存入初始汽车故障知识图谱中,并建立故障实体泛化名称与故障实体原名称之间的关系,生成泛化汽车故障知识图谱;
实体语义索引模型生成模块,用于从泛化汽车故障知识图谱中获取各故障实体原名称,由各故障实体原名称组成故障实体原名称数据集;从泛化汽车故障知识图谱中获取各故障实体泛化名称,由各故障实体泛化名称组成故障实体泛化名称数据集;构建微调语言模型,利用故障实体原名称数据集和故障实体泛化名称数据集一起对微调语言模型进行训练,得到一个用于既能计算故障实体原名称的词向量又能计算故障实体泛化名称的词向量的实体语义索引模型;
向量数据库生成模块,用于通过实体语义索引模型计算故障实体原名称数据集中各故障实体原名称对应的词向量,并将故障实体原名称与其词向量对应的关系存入向量数据库中;
更新模块,用于获取新增实体,先提取新增实体原名称,将提取到的新增实体原名称输入实体语义索引模型计算其词向量,得到新增实体的词向量;将新增实体的词向量输入向量数据库中进行查询,获取距离值最小的故障实体原名称,若最小距离值小于预设阈值,则认为新增实体与故障实体原名称对应的故障实体相同,向泛化汽车故障知识图谱更新相关信息;否则,向泛化汽车故障知识图谱新增实体及相关信息。
进一步地,汽车故障知识图谱构建系统还包括:
知识反馈模块,从用户的反馈信息中提取新的汽车故障知识,并结合已有汽车故障知识进行关联分析,建立新的语义链路,并在泛化汽车故障知识图谱中进行关联更新,同时更新向量数据库;
翻新模块,用于判断泛化汽车故障知识图谱中的新增实体的数量或距离上次更新实体语义索引模型的时间是否大于预设阈值,当泛化汽车故障知识图谱中的新增实体的数量或距离上次更新实体语义索引模型的时间大于预设阈值,则进行实体语义索引模型的更新。
本发明的有益效果:
本发明通过对故障实体进行泛化,提高了知识图谱的泛化能力,解决了实体名称描述中同义词和近义词的匹配问题,实现“举一反三”,降低了匹配难度,并且利用从泛化汽车故障知识图谱中获取各故障实体原名称组成的故障实体原名称数据集以及从泛化汽车故障知识图谱中获取各故障实体泛化名称组成的故障实体泛化名称数据集训练得到实体语义索引模型,实体语义索引模型可对故障实体的词向量进行预测,然后用实体语义索引模型计算出的词向量在向量数据库进行检索后返回距离值最小的一个或多个的故障实体,不需要进行相似度计算,简化过程且效率高、准确度高。实体语义索引模型是由故障实体原名称数据集和故障实体泛化名称数据集训练得到的,泛化能力强,提高了其准确度。
附图说明
图1为本发明的汽车故障知识图谱构建方法的流程图。
图2为本发明的汽车故障知识图谱构建系统的原理框图。
具体实施方式
以下将参照附图和优选实施例来说明本发明的实施方式,本领域技术人员可由本说明书中所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。应当理解,优选实施例仅为了说明本发明,而不是为了限制本发明的保护范围。
本发明实施例的相关术语解释如下:
汽车故障知识:包含车辆基本信息、汽车用户手册、维修记录、保养记录、整车故障诊断方案、整车零部件清单、车况记录、故障记录等;
汽车故障知识图谱:包含故障本体和知识链路;
故障本体:包含对故障本体概念、本体属性和本体关系的描述;本发明的故障本体概念包含品牌、车系、车型、部件、故障、根因、现象、方案、维修、保养、车辆、车况;
具体地:
品牌:表示汽车品牌;
车系:表示表示车型系列;
车型:表示汽车型号,具体指根据不同的配置和配置组合推出的不同款式或不同版本的车;
部件:表示汽车车身模块或零部件,如,VCU、ECU、发动机、轮胎、中控屏等;
故障:表示汽车可能出现的各种问题和故障,如,启动困难、冷却系统故障、制动失灵、刹车盘异响、中控屏死机等;
根因:表示导致汽车故障现象的根本原因,具体指与汽车部件或系统的失效、损坏、改变等相关的问题,故障根因可分为机械故障、电气故障、电子控制系统故障等多种类型;
现象:表示汽车故障现象,具体指汽车在使用过程中,出现突然失效、运行不正常、无法正常行驶等情况,常见故障现象包括发动机启动困难、行驶抖动、油耗过高、制动失灵等;
方案:表示汽车故障根因的排除方法和技术;
维修:表示汽车的故障维修信息;
保养:表示汽车的日常保养信息;
车辆:表示燃油车或新能源车;
车况:表示车辆的车况信息,具体车况信息包括不限于车辆状态、充电状态、加油状态、运行模式、车速、累计里程、SOC、总电压、总电流、档位、发动机状态、驱动电机状态等;
本体属性:是对本体特征的进一步描述;如“品牌”具体属性有名称、编码等;“车辆”具体属性有车架号、车型、车长、车宽、车高、轴距等;
本体关系:包含汽车车型、车辆部件、车辆故障、子模块、故障根因、故障现象、维修案例、维修建议、维修建议、维修记录、保养记录、车况记录、故障记录、故障信号;具体地:所述汽车车型表示品牌与车型的关系,由品牌实体指向车型实体,建立品牌与车型的关系,可以便捷的根据品牌确定车型或根据车型确定品牌;所述车辆部件表示车型与部件的关系,由车型实体指向部件实体,建立车型与部件的关系,描述每个车型下面有哪些部件;所述车辆故障表示部件与故障的关系,由部件实体指向故障实体,建立部件与故障的关系,描述每个部件可能产生哪些故障;所述子模块表示部件与部件的关系,由父部件实体指向子部件实体,建立部件与部件的关系,描述每个部件的子部件的组成;所述故障根因表示故障与根因的关系,由故障实体指向根因实体,建立故障与根因的关系,描述每个故障可能由哪些因素导致;所述故障现象表示故障与现象的关系,由故障实体指向现象实体,建立故障与现象的关系,描述每个故障的具体现象,可用于通过故障现象描述找到具体故障实体;所述维修案例表示故障与维修的关系,由故障实体指向维修实体,建立故障与维修的关系,描述每个故障的维修案例,可用于根据用户检索故障内容,推荐相关故障维修案例;所述故障维修建议表示故障与方案的关系,由故障实体指向方案实体,建立故障与方案的关系,描述每个故障的具体解决方法或维修建议;所述部件维修建议表示部件与方案的关系,由部件实体指向方案实体,建立部件与解决方案的关系,描述部件的维修方法或维修建议;所述维修记录表示车辆与维修的关系,由车辆实体指向维修实体,构建车辆与维修的关系,描述车辆的具体维修信息;所述保养记录表示车辆与保养的关系,由车辆实体指向保养实体,构建车辆与保养的关系,描述车辆的具体保养信息;所述车况记录表示车辆与车况的关系,由车辆实体指向车况实体,构建车辆与车况的关系,描述车辆的具体车况信息;所述故障记录表示车辆与故障的关系,由车辆实体指向故障实体,构建车辆与故障的关系,描述车辆的具体故障信息;所述故障信号表示车况与故障的关系,由车况实体指向故障实体,构建车况与故障的关系,描述车况信号对应的故障信息;所述知识链路使用所述故障本体、本体属性、本体关系构建,具体包含汽车故障分析、故障检测、故障预警、故障咨询等;
知识链路:使用所述故障本体、本体属性、本体关系构建,具体包含汽车故障分析、故障检测、故障预警、故障咨询等;
实体链接:是将不同数据源中的实体进行标准化和链接的过程;
知识合并:是将不同数据源中的知识点进行整合;
知识加工:是将从不同数据源中提取出的故障实体和实体关系进行知识推理和知识补充;
汽车故障知识组织类型包含结构化、半结构化和非结构化数据;所述结构化数据通过建立故障本体映射、本体属性映射和本体关系映射将一个或多个数据源中的结构化数据转换成实体、实体属性值、实体关系数据实时同步至所述汽车故障知识图谱中;所述半结构化、非结构化数据通过对样本数据进行打标,分别使用样本数据训练汽车故障实体识别模型、汽车故障实体属性提取模型和汽车故障实体关系抽取模型。
如图1所示,本发明优选实施例的一种汽车故障知识图谱构建方法,包括:
S1:获取初始汽车故障知识,从初始汽车故障知识中提取故障实体以及多个故障实体之间的关联关系,生成初始汽车故障知识图谱;
S2:将初始汽车故障知识图谱中的故障实体原名称使用词向量模型进行泛化,得到故障实体泛化名称,将故障实体泛化名称和故障实体原名称一并存入初始汽车故障知识图谱中,并建立故障实体泛化名称与故障实体原名称之间的关系,生成泛化汽车故障知识图谱;
S3:从泛化汽车故障知识图谱中获取各故障实体原名称,由各故障实体原名称组成故障实体原名称数据集;从泛化汽车故障知识图谱中获取各故障实体泛化名称,由各故障实体泛化名称组成故障实体泛化名称数据集;构建微调语言模型,利用故障实体原名称数据集和故障实体泛化名称数据集一起对微调语言模型进行训练,得到一个用于既能计算故障实体原名称的词向量又能计算故障实体泛化名称的词向量的实体语义索引模型;
S4:通过实体语义索引模型计算故障实体原名称数据集中各故障实体原名称对应的词向量,并将故障实体原名称与其词向量对应的关系存入向量数据库中;
S5:获取新增实体,先提取新增实体原名称,将提取到的新增实体原名称输入实体语义索引模型计算其词向量,得到新增实体的词向量;将新增实体的词向量输入向量数据库中进行查询,获取距离值最小的故障实体原名称,若最小距离值小于预设阈值,则认为新增实体与故障实体原名称对应的故障实体相同,向泛化汽车故障知识图谱更新相关信息;否则,向泛化汽车故障知识图谱新增实体及相关信息;本步骤实现了获取新知识,根据新知识更新泛化汽车故障知识图谱和向量数据库;
S6:从用户的反馈信息中提取新的汽车故障知识,并结合已有汽车故障知识进行关联分析,建立新的语义链路,并在泛化汽车故障知识图谱中进行关联更新,同时更新向量数据库;实现获取用户的反馈信息,根据用户的反馈信息进行知识修正;
S7:当泛化汽车故障知识图谱中的新增实体的数量或距离上次更新实体语义索引模型的时间大于预设阈值,则执行步骤S3进行实体语义索引模型的更新。预设阈值由自主设定。
本实施例通过对故障实体进行泛化,提高了知识图谱的泛化能力,解决了实体名称描述中同义词和近义词的匹配问题,实现“举一反三”,降低了匹配难度,并且利用从泛化汽车故障知识图谱中获取各故障实体的原名称得到的故障实体原名称数据集以及从泛化汽车故障知识图谱中获取各故障实体泛化后的名称得到故障实体泛化名称数据集训练得到实体语义索引模型,实体语义索引模型可对故障实体的词向量进行预测,然后用实体语义索引模型计算出的词向量在向量数据库进行检索后返回距离值最小的一个或多个的故障实体,不需要进行相似度计算,简化过程且效率高、准确度高。实体语义索引模型是由故障实体原名称数据集和故障实体泛化名称数据集训练得到的,泛化能力强,提高了其准确度。
另外,根据新知识更新泛化汽车故障知识图谱和向量数据库,用户的反馈信息更新知识图谱,以及当泛化汽车故障知识图谱中的新增实体的数量或距离上次更新实体语义索引模型的时间大于预设阈值时更新实体语义索引模型,构建了汽车故障知识图谱反馈及更新机制,实现了汽车故障本体、故障实体、知识链路的自动更新,自动优化和修正汽车故障知识图谱,可为汽车故障分析、故障检测、故障预警、故障咨询等场景提供更加准确的知识。
具体地,在步骤S1中,通过实体识别模型从初始汽车故障知识中提取故障实体以及多个故障实体之间的关联关系。
在步骤S3中,微调语言模型采用SimCSE模型。
在步骤S4中,故障实体原名称与其词向量对应的关系存入的向量数据库为Milvus向量数据库。
在步骤S5中,若新增实体与故障实体原名称对应的故障实体相同,向泛化汽车故障知识图谱中增加该新增实体原名称和与之相同的故障实体之间的对应关系;若新增实体与故障实体原名称对应的故障实体并无相同,对新增实体的名称使用词向量模型进行泛化,得到新增实体泛化名称,将新增实体泛化名称和新增实体原名称以及新增实体泛化名称与新增实体原名称之间的关系存入泛化汽车故障知识图谱中,并且通过实体语义索引模型计算新增实体原名称对应的词向量,并将新增实体原名称与其词向量对应的关系存入向量数据库中。
在步骤S5中,新知识为用户输入信息,使用W2NER模型对用户输入信息进行实体提取;在用户进行实体检索时,向用户返回距离值最小的一个或多个对应的故障实体原名称,并且使用故障实体原名称对应的故障实体向泛化汽车故障知识图谱获取知识。
如图2所示,本发明实施例还提供一种汽车故障知识图谱构建系统,包括:
初始汽车故障知识图谱生成模块,用于获取初始汽车故障知识,从初始汽车故障知识中提取故障实体以及多个故障实体之间的关联关系,生成初始汽车故障知识图谱;
泛化汽车故障知识图谱生成模块,用于将初始汽车故障知识图谱中的故障实体原名称使用词向量模型进行泛化,得到故障实体泛化名称,将故障实体泛化名称和故障实体原名称一并存入初始汽车故障知识图谱中,并建立故障实体泛化名称与故障实体原名称之间的关系,生成泛化汽车故障知识图谱;
实体语义索引模型生成模块,用于从泛化汽车故障知识图谱中获取各故障实体原名称,由各故障实体原名称组成故障实体原名称数据集;从泛化汽车故障知识图谱中获取各故障实体泛化名称,由各故障实体泛化名称组成故障实体泛化名称数据集;构建微调语言模型,利用故障实体原名称数据集和故障实体泛化名称数据集一起对微调语言模型进行训练,得到一个用于既能计算故障实体原名称的词向量又能计算故障实体泛化名称的词向量的实体语义索引模型;
向量数据库生成模块,用于通过实体语义索引模型计算故障实体原名称数据集中各故障实体原名称对应的词向量,并将故障实体原名称与其词向量对应的关系存入向量数据库中;
更新模块,用于获取新增实体,先提取新增实体原名称,将提取到的新增实体原名称输入实体语义索引模型计算其词向量,得到新增实体的词向量;将新增实体的词向量输入向量数据库中进行查询,获取距离值最小的故障实体原名称,若最小距离值小于预设阈值,则认为新增实体与故障实体原名称对应的故障实体相同,向泛化汽车故障知识图谱更新相关信息;否则,向泛化汽车故障知识图谱新增实体及相关信息;
知识反馈模块,用于获取用户的反馈信息,根据用户的反馈信息进行知识修正,具体为,从用户的反馈信息中提取新的汽车故障知识,并结合已有汽车故障知识进行关联分析,建立新的语义链路,并在泛化汽车故障知识图谱中进行关联更新,同时更新向量数据库;
翻新模块,用于判断泛化汽车故障知识图谱中的新增实体的数量或距离上次更新实体语义索引模型的时间是否大于预设阈值,当泛化汽车故障知识图谱中的新增实体的数量或距离上次更新实体语义索引模型的时间大于预设阈值,则进行实体语义索引模型的更新。
具体地,初始汽车故障知识图谱生成模块包括知识抽取单元、知识存储单元和知识管理单元,知识抽取单元用于从一个或多个数据源获取结构化、半结构化、非结构化知识,并进行汽车故障知识抽取、融合后写入知识存储单元;知识存储单元,主要是使用图数据库存储三元组故障知识;知识管理单元主要是管理汽车故障知识的元数据信息。
综上所述,本发明实施例提供一种汽车故障知识图谱构建方法,通过对故障实体进行泛化,提高了知识图谱的泛化能力,解决了实体名称描述中同义词和近义词的匹配问题,实现“举一反三”,降低了匹配难度,并且利用从泛化汽车故障知识图谱中获取各故障实体的原名称得到的故障实体原名称数据集以及从泛化汽车故障知识图谱中获取各故障实体泛化后的名称得到故障实体泛化名称数据集训练得到实体语义索引模型,实体语义索引模型可对故障实体的词向量进行预测,然后用实体语义索引模型计算出的词向量在向量数据库进行检索后返回距离值最小的一个或多个的故障实体,不需要进行相似度计算,简化过程且效率高、准确度高。实体语义索引模型是由故障实体原名称数据集和故障实体泛化名称数据集训练得到的,泛化能力强,提高了其准确度。另外,根据新知识更新泛化汽车故障知识图谱和向量数据库,用户的反馈信息更新知识图谱,以及当泛化汽车故障知识图谱中的新增实体的数量或距离上次更新实体语义索引模型的时间大于预设阈值时更新实体语义索引模型,构建了汽车故障知识图谱反馈及更新机制,实现了汽车故障本体、故障实体、知识链路的自动更新,自动优化和修正汽车故障知识图谱,可为汽车故障分析、故障检测、故障预警、故障咨询等场景提供更加准确的知识。本发明实施例还提供一种基于上述方法的汽车故障知识图谱构建系统。
以上实施例仅是为充分说明本发明而所举的较佳的实施例,本发明的保护范围不限于此。本技术领域的技术人员在本发明基础上所作的等同替代或变换,均在本发明的保护范围之内。

Claims (10)

1.一种汽车故障知识图谱构建方法,其特征在于,包括:
S1:获取初始汽车故障知识,从初始汽车故障知识中提取故障实体以及多个故障实体之间的关联关系,生成初始汽车故障知识图谱;
S2:将初始汽车故障知识图谱中的故障实体原名称使用词向量模型进行泛化,得到故障实体泛化名称,将故障实体泛化名称和故障实体原名称一并存入初始汽车故障知识图谱中,并建立故障实体泛化名称与故障实体原名称之间的关系,生成泛化汽车故障知识图谱;
S3:从泛化汽车故障知识图谱中获取各故障实体原名称,由各故障实体原名称组成故障实体原名称数据集;从泛化汽车故障知识图谱中获取各故障实体泛化名称,由各故障实体泛化名称组成故障实体泛化名称数据集;构建微调语言模型,利用故障实体原名称数据集和故障实体泛化名称数据集一起对微调语言模型进行训练,得到一个用于既能计算故障实体原名称的词向量又能计算故障实体泛化名称的词向量的实体语义索引模型;
S4:通过实体语义索引模型计算故障实体原名称数据集中各故障实体原名称对应的词向量,并将故障实体原名称与其词向量对应的关系存入向量数据库中;
S5:获取新增实体,先提取新增实体原名称,将提取到的新增实体原名称输入实体语义索引模型计算其词向量,得到新增实体的词向量;将新增实体的词向量输入向量数据库中进行查询,获取距离值最小的故障实体原名称,若最小距离值小于预设阈值,则认为新增实体与故障实体原名称对应的故障实体相同,向泛化汽车故障知识图谱更新相关信息;否则,向泛化汽车故障知识图谱新增实体及相关信息。
2.根据权利要求1所述的汽车故障知识图谱构建方法,其特征在于,在步骤S1中,通过实体识别模型从初始汽车故障知识中提取故障实体以及多个故障实体之间的关联关系。
3.根据权利要求1所述的汽车故障知识图谱构建方法,其特征在于,在步骤S3中,微调语言模型采用SimCSE模型。
4.根据权利要求1所述的汽车故障知识图谱构建方法,其特征在于,在步骤S4中,故障实体原名称与其词向量对应的关系存入的向量数据库为Milvus向量数据库。
5.根据权利要求1所述的汽车故障知识图谱构建方法,其特征在于,在步骤S5中,若新增实体与故障实体原名称对应的故障实体相同,向泛化汽车故障知识图谱中增加该新增实体原名称和与之相同的故障实体之间的对应关系;若新增实体与故障实体原名称对应的故障实体并无相同,对新增实体的名称使用词向量模型进行泛化,得到新增实体泛化名称,将新增实体泛化名称和新增实体原名称以及新增实体泛化名称与新增实体原名称之间的关系存入泛化汽车故障知识图谱中,并且通过实体语义索引模型计算新增实体原名称对应的词向量,并将新增实体原名称与其词向量对应的关系存入向量数据库中。
6.根据权利要求1所述的汽车故障知识图谱构建方法,其特征在于,在步骤S5中,新知识为用户输入信息,使用W2NER模型对用户输入信息进行实体提取;在用户进行实体检索时,向用户返回距离值最小的一个或多个对应的故障实体原名称,并且使用故障实体原名称对应的故障实体向泛化汽车故障知识图谱获取知识。
7.根据权利要求1所述的汽车故障知识图谱构建方法,其特征在于,还包括:
S6:从用户的反馈信息中提取新的汽车故障知识,并结合已有汽车故障知识进行关联分析,建立新的语义链路,并在泛化汽车故障知识图谱中进行关联更新,同时更新向量数据库。
8.根据权利要求1所述的汽车故障知识图谱构建方法,其特征在于,还包括:
S7:当泛化汽车故障知识图谱中的新增实体的数量或距离上次更新实体语义索引模型的时间大于预设阈值,则执行步骤S3进行实体语义索引模型的更新。
9.一种汽车故障知识图谱构建系统,其特征在于,包括:
初始汽车故障知识图谱生成模块,用于获取初始汽车故障知识,从初始汽车故障知识中提取故障实体以及多个故障实体之间的关联关系,生成初始汽车故障知识图谱;
泛化汽车故障知识图谱生成模块,用于将初始汽车故障知识图谱中的故障实体原名称使用词向量模型进行泛化,得到故障实体泛化名称,将故障实体泛化名称和故障实体原名称一并存入初始汽车故障知识图谱中,并建立故障实体泛化名称与故障实体原名称之间的关系,生成泛化汽车故障知识图谱;
实体语义索引模型生成模块,用于从泛化汽车故障知识图谱中获取各故障实体原名称,由各故障实体原名称组成故障实体原名称数据集;从泛化汽车故障知识图谱中获取各故障实体泛化名称,由各故障实体泛化名称组成故障实体泛化名称数据集;构建微调语言模型,利用故障实体原名称数据集和故障实体泛化名称数据集一起对微调语言模型进行训练,得到一个用于既能计算故障实体原名称的词向量又能计算故障实体泛化名称的词向量的实体语义索引模型;
向量数据库生成模块,用于通过实体语义索引模型计算故障实体原名称数据集中各故障实体原名称对应的词向量,并将故障实体原名称与其词向量对应的关系存入向量数据库中;
更新模块,用于获取新增实体,先提取新增实体原名称,将提取到的新增实体原名称输入实体语义索引模型计算其词向量,得到新增实体的词向量;将新增实体的词向量输入向量数据库中进行查询,获取距离值最小的故障实体原名称,若最小距离值小于预设阈值,则认为新增实体与故障实体原名称对应的故障实体相同,向泛化汽车故障知识图谱更新相关信息;否则,向泛化汽车故障知识图谱新增实体及相关信息。
10.根据权利要求9所述的汽车故障知识图谱构建系统,其特征在于,还包括:
知识反馈模块,用于从用户的反馈信息中提取新的汽车故障知识,并结合已有汽车故障知识进行关联分析,建立新的语义链路,并在泛化汽车故障知识图谱中进行关联更新,同时更新向量数据库;
翻新模块,用于判断泛化汽车故障知识图谱中的新增实体的数量或距离上次更新实体语义索引模型的时间是否大于预设阈值,当泛化汽车故障知识图谱中的新增实体的数量或距离上次更新实体语义索引模型的时间大于预设阈值,则进行实体语义索引模型的更新。
CN202311444847.4A 2023-11-01 2023-11-01 一种汽车故障知识图谱构建方法及系统 Pending CN117474093A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311444847.4A CN117474093A (zh) 2023-11-01 2023-11-01 一种汽车故障知识图谱构建方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311444847.4A CN117474093A (zh) 2023-11-01 2023-11-01 一种汽车故障知识图谱构建方法及系统

Publications (1)

Publication Number Publication Date
CN117474093A true CN117474093A (zh) 2024-01-30

Family

ID=89635925

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311444847.4A Pending CN117474093A (zh) 2023-11-01 2023-11-01 一种汽车故障知识图谱构建方法及系统

Country Status (1)

Country Link
CN (1) CN117474093A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117873909A (zh) * 2024-03-13 2024-04-12 上海爱可生信息技术股份有限公司 故障诊断执行方法、故障诊断执行系统、电子设备及存储介质
CN118245608A (zh) * 2024-03-19 2024-06-25 上海森亿医疗科技有限公司 基于语义分析及知识图谱的疾病研究数据集融合方法、系统及终端
CN118378964A (zh) * 2024-06-27 2024-07-23 南方科技大学 一种基于树状思维链的汽车质检生命周期管理方法
CN118428368A (zh) * 2024-04-30 2024-08-02 重庆大学 一种汽车系统故障知识图谱命名实体识别重组方法及系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117873909A (zh) * 2024-03-13 2024-04-12 上海爱可生信息技术股份有限公司 故障诊断执行方法、故障诊断执行系统、电子设备及存储介质
CN117873909B (zh) * 2024-03-13 2024-05-28 上海爱可生信息技术股份有限公司 故障诊断执行方法、故障诊断执行系统、电子设备及存储介质
CN118245608A (zh) * 2024-03-19 2024-06-25 上海森亿医疗科技有限公司 基于语义分析及知识图谱的疾病研究数据集融合方法、系统及终端
CN118428368A (zh) * 2024-04-30 2024-08-02 重庆大学 一种汽车系统故障知识图谱命名实体识别重组方法及系统
CN118378964A (zh) * 2024-06-27 2024-07-23 南方科技大学 一种基于树状思维链的汽车质检生命周期管理方法

Similar Documents

Publication Publication Date Title
CN111414477B (zh) 车辆故障自动诊断方法、装置以及设备
CN117474093A (zh) 一种汽车故障知识图谱构建方法及系统
CN111159249A (zh) 基于知识图谱的目标识别方法、装置、系统、存储介质
Chougule et al. An integrated framework for effective service and repair in the automotive domain: An application of association mining and case-based-reasoning
CN113051382A (zh) 一种基于知识图谱的电力故障智能问答方法及装置
Rajpathak et al. A domain-specific decision support system for knowledge discovery using association and text mining
CN117522372B (zh) 基于深度学习的汽车故障模型的维修建议生成方法及系统
US20170213222A1 (en) Natural language processing and statistical techniques based methods for combining and comparing system data
CN116644192B (zh) 基于航空器部件可靠性的知识图谱构建方法
US20190130028A1 (en) Machine-based extraction of customer observables from unstructured text data and reducing false positives therein
CN110032620A (zh) 基于图搜索算法的自适应学习方法及计算机学习系统
CN115858807A (zh) 一种基于航空装备故障知识图谱的问答系统
CN115048532A (zh) 基于知识图谱的汽车维修场景智能问答机器人及设计方法
Ahaggach et al. Information extraction from automotive reports for ontology population
CN114818707A (zh) 一种基于知识图谱的自动驾驶决策方法和系统
CN117332858A (zh) 基于知识图谱的汽车故障智能诊断系统的构建方法
Li et al. Driving cycle prediction based on Markov chain combined with driving information mining
Qi et al. Towards Efficient Use Case Modeling with Automated Domain Classification and Term Recommendation
Song et al. A data-driven fault prediction method for lng engine city buses
Noering Unsupervised Pattern Discovery in Automotive Time Series
Tang et al. Construction and Accurate Retrieval Method of Knowledge Graph of Automobile Engine Fault
Noering Unsupervised Pattern Discovery in Automotive Time Series: Pattern-based Construction of Representative Driving Cycles
CN117390199A (zh) 一种基于知识图谱的汽车故障智能诊断方法及系统
Jiao A framework for finding and summarizing product defects, and ranking helpful threads from online customer forums through machine learning
CN118035458A (zh) 一种车辆故障自助查询方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination