CN114691831A - 一种基于知识图谱的任务型汽车故障智能问答系统 - Google Patents
一种基于知识图谱的任务型汽车故障智能问答系统 Download PDFInfo
- Publication number
- CN114691831A CN114691831A CN202210333258.8A CN202210333258A CN114691831A CN 114691831 A CN114691831 A CN 114691831A CN 202210333258 A CN202210333258 A CN 202210333258A CN 114691831 A CN114691831 A CN 114691831A
- Authority
- CN
- China
- Prior art keywords
- maintenance
- unit
- question
- data
- knowledge base
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012423 maintenance Methods 0.000 claims abstract description 126
- 230000003993 interaction Effects 0.000 claims abstract description 34
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 19
- 238000012549 training Methods 0.000 claims description 28
- 238000010276 construction Methods 0.000 claims description 16
- 238000000605 extraction Methods 0.000 claims description 15
- 238000004140 cleaning Methods 0.000 claims description 13
- 230000006870 function Effects 0.000 claims description 11
- 238000003860 storage Methods 0.000 claims description 9
- 238000012360 testing method Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 5
- 238000002372 labelling Methods 0.000 claims description 2
- 238000013024 troubleshooting Methods 0.000 claims 1
- 238000003745 diagnosis Methods 0.000 abstract description 4
- 206010063385 Intellectualisation Diseases 0.000 abstract description 2
- 230000008901 benefit Effects 0.000 description 7
- 239000013598 vector Substances 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000011161 development Methods 0.000 description 5
- 230000018109 developmental process Effects 0.000 description 5
- 230000008439 repair process Effects 0.000 description 5
- 238000000034 method Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000013145 classification model Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 208000000044 Amnesia Diseases 0.000 description 1
- 208000026139 Memory disease Diseases 0.000 description 1
- RTAQQCXQSZGOHL-UHFFFAOYSA-N Titanium Chemical compound [Ti] RTAQQCXQSZGOHL-UHFFFAOYSA-N 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013079 data visualisation Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000006984 memory degeneration Effects 0.000 description 1
- 208000023060 memory loss Diseases 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 238000010223 real-time analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Human Computer Interaction (AREA)
- Bioinformatics & Computational Biology (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于汽车故障诊断技术领域,公开了一种基于知识图谱的任务型汽车故障智能问答系统,包括:用户交互单元,收集用户故障维修查询信息和售后问答信息,向用户展示系统反馈结果;图谱知识库,存储汽车故障维修知识图谱和在线问答知识图谱;故障维修查询单元,基于来自用户交互单元的故障维修查询信息,从图谱知识库内容构建出维修方案和维修案例,并将方案、案例反馈给用户交互单元进行显示;智能问答单元,对来自用户交互单元的售后问答文本进行分析,基于图谱知识库内容通过智能算法推算出最佳答案并反馈给用户交互单元进行展示。解决了汽车故障的维修咨询智能化,提高了汽车故障问题的定位能力,使售后咨询节省人力,提升了行业服务质量。
Description
技术领域
本发明属于汽车故障诊断技术领域,尤其涉及一种基于知识图谱的任务型汽车故障智能问答系统。
背景技术
知识图谱,本质上,是一种揭示实体之间关系的语义网络。知识图谱在逻辑结构上可分为模式层与数据层两个层次,数据层主要是由一系列的事实组成,而知识将以事实为单位进行存储。存储方式通常以三元组方式存储(实体1,关系,实体2)或者(实体、属性,属性值),存储方式一般为图数据库。
随着大数据人工智能的崛起,知识图谱的出现将以前的图论理论得到了延伸,同时加速了会话式智能问答系统的发展。首先在电商,金融,移动互联网;然后随着国家开始振兴智能制造领域,移动互联网在汽车制造行业开始得到应用,与汽车相关的智能问答系统的需求也开始出现了。
智能问答系统是将积累的无序语料信息,进行有序和科学的整理,并建立基于知识的分类模型;这些分类模型可以指导新增加的语料咨询和服务信息,节约人力资源,提高信息处理的自动性,降低网站运行成本。
目前汽车行业,关于汽车故障维修咨询的技术领域,还主要处于人工服务阶段,咨询、故障诊断、售后服务消耗大量的人力资源和时间成本,不能提高办事效率,而且服务质量对咨询服务人员的技术专业水平十分依赖,限制了整体服务质量的提高。因此急需一种具有汽车故障智能诊断、智能问答功能的任务型汽车故障智能问答系统。
发明内容
为克服上述现有技术存在的不足,本发明之目的在于提供一种基于知识图谱的任务型汽车故障智能问答系统。本发明采用任务型智能问答系统,依托知识图谱,精确的定位车主关于汽车维修的问题,然后给出解决方案,解决了汽车故障的维修咨询智能化,提高了咨询中汽车故障问题的定位能力,使售后咨询节省人力,大大缩短了售后服务时间,提升了行业服务质量。
为实现上述目的,本发明实施例提供如下技术方案。
一种基于知识图谱的任务型汽车故障智能问答系统,包括:
用户交互单元,分别与故障维修查询单元和智能问答单元连接,用于收集用户故障维修查询信息和售后问答信息,向用户展示系统反馈结果;
图谱知识库,用于存储汽车故障维修知识图谱和在线问答知识图谱;
所述故障维修查询单元,与所述图谱知识库连接,基于来自用户交互单元的故障维修查询信息,从所述图谱知识库内容构建出维修方案和维修案例,并将方案和/或案例反馈给所述用户交互单元进行显示;
所述智能问答单元,与所述图谱知识库连接,对来自用户交互单元的售后问答文本进行分析,基于所述图谱知识库内容通过智能算法推算出最佳答案,将最佳答案反馈给所述用户交互单元进行展示。
进一步地,还包括依次连接的标准维修数据单元、结构化单元和故障维修图谱构建单元;其中,所述故障维修图谱构建单元与所述图谱知识库连接;
其中,所述标准维修数据单元,还包括:维修保养手册库和售后维修记录库;
所述结构化单元,用于来自标准维修数据单元的数据进行结构化处理、数据清洗和关系抽取,获得实体信息和目标关系集,以及结构化故障维修数据;
所述故障维修图谱构建单元,基于所述实体信息和目标关系集,以及结构化故障维修数据,构建维修方案和/或维修案例,将所述维修方案和/或维修案例存储于所述图谱知识库。
进一步地,所述结构化单元,还包括依次连接的数据清洗模块和关系抽取模块;所述结构化单元,将所述维修保养手册库和售后维修记录库的数据进行结构化处理,通过所述数据清洗模块对所述维修保养手册库和售后维修记录库的数据进行数据清洗,通过所述关系抽取模块对清洗后的数据根据数据关系进行关系抽取,获得所述实体信息和目标关系集,以及所述结构化故障维修数据。
进一步地,所述故障维修查询单元,还包括:
维修方案构建模块,用于从所述图谱知识库内容构建出符合用户当前需求的维修方案;
维修案例构建模块,用于从所述图谱知识库内容构建出符合用户当前需求的维修案例。
进一步地,还包括:图谱知识库查询单元,用于提供对所述图谱知识库的查询界面和功能。
进一步地,所述智能问答单元,还包括:
快速文本分类模块,用于对来自所述用户交互单元的售后问答文本进行快速文本分类,获得分类结果。
进一步地,所述智能问答单元,还包括:模型训练模块,用于基于所述分类结果进行模型训练,判断模型训练结果,如果准确率大于90%,则给售后问答文本数据打上标签结构化,整合进所述图谱知识库中。
进一步地,所述智能问答单元,还包括:
模型测试模块,用于对模型训练模块和所述图谱知识库进行准确性测试。
进一步地,所述智能问答单元,还包括:
智能检索模块,用于基于所述分类结果进行在所述图谱知识库中进行检索,获得智能检索结果,反馈给所述用户交互单元。
本发明的另一目的在于提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述基于知识图谱的任务型汽车故障智能问答系统的功能。
与现有技术相比,本发明的有益效果是:
本发明提供了一种基于知识图谱的任务型汽车故障智能问答系统,相对现有技术,能够降低汽车故障售后维修时候的沟通成本,在短时间内定位到汽车故障的相关问题,节省了售后维修的时间。通过结合自然语言处理技术,实现了汽车维修故障原因的自动发现,并且取代了客服人员,彻底实现了自动化。在和问答系统的提问和回答中,该发明还能将无法回答提问者的问题收集进行分析,重新定位并且搜索正确的结果,同时加入到现有知识库中,实现了自我进化。本发明首次将智能问答和知识图谱相结合,通过前后端通信的方式,将后台查询结果返回到用户,实现自动化回答客户问题,缩短售后人力沟通成本。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例。
图1为可选的基于知识图谱的任务型汽车故障智能问答系统结构示意图;
图2为结构化单元结构示意图;
图3为智能问答单元结构示意图;
图4为智能问答系统的知识图谱关系示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在本发明提供的一个优选实施方式中,一种基于知识图谱的任务型汽车故障智能问答系统,包括:用户交互单元、图谱知识库、故障维修查询单元和智能问答单元;其中,所述用户交互单元分别与所述故障维修查询单元和智能问答单元连接;所述故障维修查询单元和智能问答单元分别与所述图谱知识库连接。见图1所示的一种可选的一种基于知识图谱的任务型汽车故障智能问答系统结构示意图。
其中,所述用户交互单元,用于收集用户故障维修查询信息和售后问答信息,向用户展示系统反馈结果。
所述故障维修查询单元,基于来自用户交互单元的故障维修查询信息,从所述图谱知识库内容构建出维修方案和维修案例,并将方案和/或案例反馈给所述用户交互单元进行显示。
所述智能问答单元,对来自用户交互单元的售后问答文本进行分析,基于所述图谱知识库内容通过智能算法推算出最佳答案,将最佳答案反馈给所述用户交互单元进行展示。
所述图谱知识库,用于存储汽车故障维修知识图谱和在线问答知识图谱。
所述基于知识图谱的任务型汽车故障智能问答系统,还包括依次连接的标准维修数据单元、结构化单元和故障维修图谱构建单元;其中,所述故障维修图谱构建单元与所述图谱知识库连接。
所述标准维修数据单元,还包括:维修保养手册库和售后维修记录库。
所述结构化单元,还包括依次连接的数据清洗模块和关系抽取模块。见图2 所示。
所述结构化单元,用于将所述维修保养手册库和售后维修记录库的数据进行结构化处理,通过所述数据清洗模块对所述维修保养手册库和售后维修记录库的数据进行数据清洗,通过所述关系抽取模块对清洗后的数据根据数据关系进行关系抽取,获得实体信息和目标关系集,以及结构化故障维修数据。
所述故障维修图谱构建单元,基于所述实体信息和目标关系集,以及结构化故障维修数据,构建维修方案和/或维修案例,将所述维修方案和/或维修案例存储于所述图谱知识库。
所述故障维修查询单元,还包括:维修方案构建模块和维修案例构建模块。
所述维修方案构建模块,用于从所述图谱知识库内容构建出符合用户当前需求的维修方案。
所述维修案例构建模块,用于从所述图谱知识库内容构建出符合用户当前需求的维修案例。
所述基于知识图谱的任务型汽车故障智能问答系统,还包括图谱知识库查询单元。所述图谱知识库查询单元,提供对所述图谱知识库的查询界面和功能。
所述智能问答单元,还包括:依次连接的快速文本分类模块、模型训练模块、模型测试模块和智能检索模块。见图3所示。
所述快速文本分类模块,用于对来自所述用户交互单元的售后问答文本进行快速文本分类,获得分类结果。
所述模型训练模块,用于基于所述分类结果进行模型训练,判断模型训练结果,如果准确率大于90%,则给在线数据打上标签结构化,整合进所述图谱知识库中。
所述模型测试模块,用于对模型训练模块和所述图谱知识库进行准确性测试。
所述智能检索模块,用于基于所述分类结果进行在所述图谱知识库中进行检索,获得智能检索结果,反馈给所述用户交互单元。
本发明数据集由离线和在线两部分构成,离线部分主要用于构建售后知识图谱,数据基本是售后维修手册、售后维修记录、4S店的维修记录,分别存储于维修保养手册库和售后维修记录库中,通过结构化单元数据清洗模块进行数据清洗后,根据数据的关系,通过结构化单元关系抽取模块进行关系抽取。
关系抽取模块,在实体识别的基础上,从非结构化文本中抽取出预先定义的实体关系。实体对的关系可被形式化描述为关系三元组<e1,r,e2>,其中,e1和 e2是实体,r属于目标关系集R{r1,r2,r3,...,ri}。关系抽取模块从自然语言文本中抽取出关系三元组<e1,r,e2>,从而提取文本信息。
本发明中,实体信息和目标关系集如表1和表2所示:
表1实体信息
表2目标关系集
确定好实体信息和目标关系集之后,通过结构化单元处理的结构化故障维修数据就可以用于故障维修图谱构建单元构建知识图谱了。
故障维修图谱构建单元,涉及的故障维修图谱内容由维修保养手册内容及售后维修记录内容两部分组成。每一款车型都有售后维修保养服务手册,根据售后维修的经验,每一款车车型都有易发生故障、一般发生故障、偶发故障、特殊故障这几类,针对这些类,建立准确的维修方案;在准确的维修方案的基础上,增加完整的维修案例,让业主维修时进行参考。智能问答系统的知识图谱关系示意图见图4。
较佳地,故障维修图谱构建单元,将结构化故障维修数据按照附图1的形式进行知识图谱构建,然后写入图谱知识库。
较佳地,所述图谱知识库,可采用neo4j数据库。Neo4j是一个高性能的, NOSQL图形数据库,它将结构化数据存储在网络上而不是表中。它是一个嵌入式的、基于磁盘的、具备完全的事务特性的Java持久化引擎,但是它将结构化数据存储在网络(从数学角度叫做图)上而不是表中。Neo4j也可以被看作是一个高性能的图引擎,该引擎具有成熟数据库的所有特性。程序员工作在一个面向对象的、灵活的网络结构下而不是严格、静态的表中——但是他们可以享受到具备完全的事务特性、企业级的数据库的所有好处。知识图谱的三元组存储的方式有很多种,除了neo4j,还有FlockDB、AllegroGrap、GraphDB、InfiniteGraph、TITAN、OrientDb。本发明使用neo4j作为存储载体,容易部署而且免费,具有嵌入式、高性能、轻量级等优势。
较佳地,所述图谱知识库,还包括图谱知识库查询单元。所述图谱知识库查询单元,提供查询界面和功能。
较佳地,所述图谱知识库查询单元的查询页面可视化使用shiny框架实现。
Shiny是R语言中的一种Web开发框架,使得R的使用者不必太了解css、 js只需要了解一些html的知识就可以快速完成web开发,且shiny包集成了 bootstrap、jquery、ajax等特性,极大解放了作为统计语言的R的生产力。使得非传统程序员的R使用者不必依赖于前端、后端工程师就可以自己依照业务完成一些简单的数据可视化工作,快速验证想法的可靠性。由于shiny由以上的优点,所以知识库的查询页面使用shiny框架实现,并且支持两轮查询。知识库的设计除了用shiny,还可以使用传统的前端web框架,或者Django。Shiny的优势是前后端不分离,开发周期较短。
如果有问题查询都得不到解决,即所述故障维修查询单元,基于来自用户交互单元的故障维修查询需求,不能从所述图谱知识库内容构建出维修方案和维修案例,则可直接从智能问答单元获取最佳答案,或者直接通过智能问答单元,对来自用户交互单元的售后问答文本进行分析,基于所述图谱知识库内容通过智能算法推算出最佳答案,将最佳答案反馈给所述用户交互单元进行显示。
智能问答单元具有快速文本分类模块,用于对来自所述用户交互单元的售后问答文本进行快速文本分类,获得分类结果。
较佳地,快速文本分类模块,采用使用fasttext算法进行快速文本分类。
Fasttext是Facebook AI Research最近推出的文本分类和词训练工具,其源码已经托管在Github上。Fasttext最大的特点是模型简单,只有一层的隐层以及输出层,因此训练速度非常快,在普通的CPU上可以实现分钟级别的训练,比深度模型的训练要快几个数量级。同时,在多个标准的测试数据集上,Fasttext 在文本分类的准确率上,和现有的一些深度学习的方法效果相当或接近。
Fasttext主要有两个功能,一个是训练词向量,另一个是文本分类。词向量的训练,Fasttext在传统的word2vec改良了word2vec的ngram算法的模式——引入了char-level,比如单词”hello”,长度至少为3的char-level的ngram有” hel”,”ell”,”llo”,”hell”,”ello”以及本身”hello”。组成的词向量为:(” hel”,”ell”,”llo”,”hell”,”ello”,”hello”)。而传统的word2vec的ngram 算法的模式是word-level:比如“I have anapple”,组成长度至少为3的词向量为:(“<start>I have”,“I have an”,“have anapple”,“an apple<end>”)(“start 和end表示一句话的开头和结束”)。两者的本质区别就是前者是字符维度的,后者是单词维度的。字符维度的优势就是不需要分词也不需要去停用词,这两步在计算的时候会损耗大量的内存。所以使用fasttext会大大降低内存损耗,提升计算速度。
使用fasttext进行快速文本分类之后,采用所述模型训练模块,用于基于所述分类结果进行模型训练,判断模型训练结果,如果准确率大于90%,则给在线数据打上标签结构化,整合进所述图谱知识库中。同时把打上标签结构化的在线数据与已有的离线数据整合,作为新的训练数据,为下一次训练做准备。
原始模型训练需要离线数据进行计算整合,然后根据机器学习可以得出一个训练的准确率,原则上准确率如果能达到90%,那模型就可以使用,然后使用快速文本分类模块,增加了语料和标签——这个标签是fasttext算法打的,不一定对,然后加入进离线数据重新计算模型的准确率,如果依然在90%以上,那这些在线数据就是可用的,就认为它们的标签是正确的。
优选地,所述模型训练模块,模型训练使用知识表示学习类算法中最新的 TransD算法,TransD算法是Trans家族算法中最新的一种,Trans系列算法全称是:知识图谱向量化表示,就是把头实体,关系,尾实体看成空间中的向量,通过向量化表示,进行一系列的计算,最早也是最基础的Trans系列算法是 TransE。
TransE算法的原理简述如下:
1把头实体,关系,尾实体放到一个空间中,分别用向量表示。
2根据头实体,关系,尾实体中三者已知的两者,寻找与之最接近的剩下的那个。
3计算损失函数,获得相关的概率——这个概率就是表示结果与实际的匹配度或者准确度。
TransE的算法有个假设前提,就是实体和关系之间,必须存在于同一个空间中,而现实中这一点假设很难做到,于是数学家们提出了TransR算法,采用向量空间投影的方法,将不同空间中的实体和关系信息,投影到了同一个空间中。而TransD的出现,又对其进行了改进,使得相同的实体,根据关系的不同可以对应不同的映射——这样我们在提问的时候,就会出现很多不同的答案,然后就可以在其中选一个最可能的答案了,然后根据提问者的实际情况选择一个最可靠的,这样就增加了回答的不确定性,更符合人性了。
使用TransD算法通过三元组中头实体,关系,尾实体元素中的任意两个,推算出剩下一个元素的结果,并且给出相关的概率。
优选地,所述智能检索模块,使用Elasticsearch数据库进行后台查询:
使用Elasticsearch搜索查询的两个优点是:1.他的查询搜索模式是分片搜索的,就是将内存分区,然后几个区同时查询数据。这个与mysql不同,mysql是对数据进行分区查找。2.特有的倒排索引模式,以关键词查找数据整体,而不是类似mysql的精确搜索,因为这个原理,Elasticsearch自带了搜索相似度得分指数——因为输入的需求是五花八门的,必须跟数据库中的问题进行匹配,获得精准定位,如果要精准定位问题如果使用mysql搜索,要把先做搜索查询,然后把结果遍历一遍分别计算相似度。而使用Elasticsearch,可以直接搜索出最相似的结果。大大简化的步骤,提高了查询时间。
考虑到后期数据量会很大,所以使用Elasticsearch架构分布式存储,然后使用它进行问题搜索,给到模型做测试,然后返回结果,由所述用户交互单元进行前端展示。
Elasticsearch的作用是将neo4j中的图谱数据存储起来,因为Elasticsearch 天生分布式,查询速度要比图谱数据库要快,并且能返回查询的相似度,支持模糊查询。neo4j只是用来展示图谱数据,但是数据量太大的话,neo4j的查询速度会下降;而智能问答的时候,客户需要的是需求的快速反馈,所以使用 Elasticsearch用来在大数据的情况下提高查询效率,并且能返回查询的相似度,而原来的neo4j还需要对查询结果进行相似度计算,而用Elasticsearch就不需要了,自动出结果。
示例性地,所述用户交互单元,具有socketio即时通信架构。socketio是一个基于Node.js的实时应用程序框架,在即时通讯、通知与消息推送,实时分析等场景中有较为广泛的应用。socketio支持websocket、polling两种数据传输方式以兼容浏览器不支持WebSocket场景下的通信需求,本发明使用websocket 方式。webSocket的产生源于Web开发中日益增长的实时通信需求,对比基于 http的轮询方式,它大大节省了网络带宽,同时也降低了服务器的性能消耗。
本发明的另一个实施例,在前述的基于知识图谱的任务型汽车故障智能问答系统的基础上,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现前述的基于知识图谱的任务型汽车故障智能问答系统的功能。
本领域普通技术人员可以理解实现上述实施例中的全部或部分流程及模块,是可以通过计算机和手机程序、硬件及其组合来实现。所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可实现包括如上述各模块实施例的功能。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于知识图谱的任务型汽车故障智能问答系统,其特征在于,包括:
用户交互单元,分别与故障维修查询单元和智能问答单元连接,用于收集用户故障维修查询信息和售后问答信息,向用户展示系统反馈结果;
图谱知识库,用于存储汽车故障维修知识图谱和在线问答知识图谱;
所述故障维修查询单元,与所述图谱知识库连接,基于来自用户交互单元的故障维修查询信息,从所述图谱知识库内容构建出维修方案和维修案例,并将方案和/或案例反馈给所述用户交互单元进行显示;
所述智能问答单元,与所述图谱知识库连接,对来自用户交互单元的售后问答文本进行分析,基于所述图谱知识库内容通过智能算法推算出最佳答案,将最佳答案反馈给所述用户交互单元进行展示。
2.根据权利要求1所述的系统,其特征在于:还包括依次连接的标准维修数据单元、结构化单元和故障维修图谱构建单元;其中,所述故障维修图谱构建单元与所述图谱知识库连接;
其中,所述标准维修数据单元,还包括:维修保养手册库和售后维修记录库;
所述结构化单元,用于来自标准维修数据单元的数据进行结构化处理、数据清洗和关系抽取,获得实体信息和目标关系集,以及结构化故障维修数据;
所述故障维修图谱构建单元,基于所述实体信息和目标关系集,以及结构化故障维修数据,构建维修方案和/或维修案例,将所述维修方案和/或维修案例存储于所述图谱知识库。
3.根据权利要求2所述的系统,其特征在于:所述结构化单元,还包括依次连接的数据清洗模块和关系抽取模块;所述结构化单元,将所述维修保养手册库和售后维修记录库的数据进行结构化处理,通过所述数据清洗模块对所述维修保养手册库和售后维修记录库的数据进行数据清洗,通过所述关系抽取模块对清洗后的数据根据数据关系进行关系抽取,获得所述实体信息和目标关系集,以及所述结构化故障维修数据。
4.根据权利要求1所述的系统,其特征在于,所述故障维修查询单元,还包括:
维修方案构建模块,用于从所述图谱知识库内容构建出符合用户当前需求的维修方案;
维修案例构建模块,用于从所述图谱知识库内容构建出符合用户当前需求的维修案例。
5.根据权利要求1所述的系统,其特征在于,还包括:图谱知识库查询单元,用于提供对所述图谱知识库的查询界面和功能。
6.根据权利要求1所述的系统,其特征在于,所述智能问答单元,还包括:
快速文本分类模块,用于对来自所述用户交互单元的售后问答文本进行快速文本分类,获得分类结果。
7.根据权利要求6所述的系统,其特征在于,所述智能问答单元,还包括:模型训练模块,用于基于所述分类结果进行模型训练,判断模型训练结果,如果准确率大于90%,则给售后问答文本数据打上标签结构化,整合进所述图谱知识库中。
8.根据权利要求7所述的系统,其特征在于,所述智能问答单元,还包括:
模型测试模块,用于对模型训练模块和所述图谱知识库进行准确性测试。
9.根据权利要求8所述的系统,其特征在于:所述智能问答单元,还包括:
智能检索模块,用于基于所述分类结果进行在所述图谱知识库中进行检索,获得智能检索结果,反馈给所述用户交互单元。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现如权利要求1至9任一项所述的智能问答系统的功能。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210333258.8A CN114691831B (zh) | 2022-03-31 | 2022-03-31 | 一种基于知识图谱的任务型汽车故障智能问答系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210333258.8A CN114691831B (zh) | 2022-03-31 | 2022-03-31 | 一种基于知识图谱的任务型汽车故障智能问答系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114691831A true CN114691831A (zh) | 2022-07-01 |
CN114691831B CN114691831B (zh) | 2024-07-16 |
Family
ID=82140417
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210333258.8A Active CN114691831B (zh) | 2022-03-31 | 2022-03-31 | 一种基于知识图谱的任务型汽车故障智能问答系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114691831B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115033679A (zh) * | 2022-08-10 | 2022-09-09 | 深圳联友科技有限公司 | 基于知识图谱搜索汽车维修数据的方法 |
CN115659056A (zh) * | 2022-12-28 | 2023-01-31 | 北京百车宝科技有限公司 | 基于大数据的用户服务精准匹配系统 |
CN117112769A (zh) * | 2023-10-23 | 2023-11-24 | 南京国睿信维软件有限公司 | 基于大语言模型的故障维修智能问答系统及方法 |
CN117149501A (zh) * | 2023-10-31 | 2023-12-01 | 中邮消费金融有限公司 | 问题修复系统及方法 |
CN117171365A (zh) * | 2023-11-02 | 2023-12-05 | 北京纷扬科技有限责任公司 | 一种基于知识图谱的故障问题智能定位方法及系统 |
CN117290484A (zh) * | 2023-10-10 | 2023-12-26 | 深圳市明睿数据科技有限公司 | 一种用于汽车故障定位及维修建议的智能问答系统及方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110727804A (zh) * | 2019-10-11 | 2020-01-24 | 北京明略软件系统有限公司 | 利用知识图谱处理维修案例的方法、装置及电子设备 |
CN113505209A (zh) * | 2021-07-09 | 2021-10-15 | 吉林大学 | 一种面向汽车领域的智能问答系统 |
-
2022
- 2022-03-31 CN CN202210333258.8A patent/CN114691831B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110727804A (zh) * | 2019-10-11 | 2020-01-24 | 北京明略软件系统有限公司 | 利用知识图谱处理维修案例的方法、装置及电子设备 |
CN113505209A (zh) * | 2021-07-09 | 2021-10-15 | 吉林大学 | 一种面向汽车领域的智能问答系统 |
Non-Patent Citations (2)
Title |
---|
D. KOUTRA等: "Summarizing Graphs at Multiple Scales: New Trends", IEEE INTERNATIONAL CONFERENCE ON DATA MINING (ICDM), vol. 2018, 30 December 2018 (2018-12-30), pages 1097 - 1097 * |
黄巍等: "知识图谱在汽车维修领域的应用", 信息技术与标准化, vol. 2021, no. 5, 10 May 2021 (2021-05-10), pages 30 - 34 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115033679A (zh) * | 2022-08-10 | 2022-09-09 | 深圳联友科技有限公司 | 基于知识图谱搜索汽车维修数据的方法 |
CN115033679B (zh) * | 2022-08-10 | 2023-01-13 | 深圳联友科技有限公司 | 基于知识图谱搜索汽车维修数据的方法 |
CN115659056A (zh) * | 2022-12-28 | 2023-01-31 | 北京百车宝科技有限公司 | 基于大数据的用户服务精准匹配系统 |
CN117290484A (zh) * | 2023-10-10 | 2023-12-26 | 深圳市明睿数据科技有限公司 | 一种用于汽车故障定位及维修建议的智能问答系统及方法 |
CN117112769A (zh) * | 2023-10-23 | 2023-11-24 | 南京国睿信维软件有限公司 | 基于大语言模型的故障维修智能问答系统及方法 |
CN117112769B (zh) * | 2023-10-23 | 2024-04-09 | 南京国睿信维软件有限公司 | 基于大语言模型的故障维修智能问答系统及方法 |
CN117149501A (zh) * | 2023-10-31 | 2023-12-01 | 中邮消费金融有限公司 | 问题修复系统及方法 |
CN117149501B (zh) * | 2023-10-31 | 2024-02-06 | 中邮消费金融有限公司 | 问题修复系统及方法 |
CN117171365A (zh) * | 2023-11-02 | 2023-12-05 | 北京纷扬科技有限责任公司 | 一种基于知识图谱的故障问题智能定位方法及系统 |
CN117171365B (zh) * | 2023-11-02 | 2024-02-02 | 北京纷扬科技有限责任公司 | 一种基于知识图谱的故障问题智能定位方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN114691831B (zh) | 2024-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114691831B (zh) | 一种基于知识图谱的任务型汽车故障智能问答系统 | |
JP7127106B2 (ja) | 質問応答処理、言語モデルの訓練方法、装置、機器および記憶媒体 | |
CN108345690B (zh) | 智能问答方法与系统 | |
CN109726274B (zh) | 问题生成方法、装置及存储介质 | |
CN112749266B (zh) | 一种工业问答方法、装置、系统、设备及存储介质 | |
JP2020521210A (ja) | 情報処理方法及び端末、コンピュータ記憶媒体 | |
CN110866093A (zh) | 机器问答方法及装置 | |
CN111708869A (zh) | 人机对话的处理方法及装置 | |
US11461317B2 (en) | Method, apparatus, system, device, and storage medium for answering knowledge questions | |
CN109902087B (zh) | 用于问答的数据处理方法及装置、服务器 | |
CN112115252B (zh) | 智能辅助写作处理方法、装置、电子设备及存储介质 | |
CN112632239A (zh) | 基于人工智能技术的类脑问答系统 | |
CN112699645B (zh) | 语料标注方法、装置及设备 | |
CN112182145A (zh) | 文本相似度确定方法、装置、设备和存储介质 | |
CN113673256B (zh) | 问询语句改写方法及装置 | |
CN109522396B (zh) | 一种面向国防科技领域的知识处理方法及系统 | |
CN111767334A (zh) | 信息抽取方法、装置、电子设备及存储介质 | |
CN116662495A (zh) | 问答处理方法、训练问答处理模型的方法及装置 | |
CN118035056A (zh) | 一种面向多模态数据查询的基准测试方法和测试框架 | |
CN113535916A (zh) | 一种基于表格的问答方法、装置及计算机设备 | |
CN112507139A (zh) | 基于知识图谱的问答方法、系统、设备及存储介质 | |
CN117312521A (zh) | 用于智能客服对话的处理方法及相关产品 | |
CN110674275B (zh) | 一种知识问答的方法及装置 | |
CN111309773A (zh) | 一种车辆信息的查询方法、装置、系统及存储介质 | |
CN115757720A (zh) | 基于知识图谱的项目信息搜索方法、装置、设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |