CN111831794A - 一种基于知识图谱的综合管廊行业知识问答系统构建方法 - Google Patents

一种基于知识图谱的综合管廊行业知识问答系统构建方法 Download PDF

Info

Publication number
CN111831794A
CN111831794A CN202010660544.6A CN202010660544A CN111831794A CN 111831794 A CN111831794 A CN 111831794A CN 202010660544 A CN202010660544 A CN 202010660544A CN 111831794 A CN111831794 A CN 111831794A
Authority
CN
China
Prior art keywords
question
pipe gallery
knowledge
entity
comprehensive pipe
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010660544.6A
Other languages
English (en)
Inventor
朱安安
邱彦林
陈尚武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Xujian Science And Technology Co ltd
Original Assignee
Hangzhou Xujian Science And Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Xujian Science And Technology Co ltd filed Critical Hangzhou Xujian Science And Technology Co ltd
Priority to CN202010660544.6A priority Critical patent/CN111831794A/zh
Publication of CN111831794A publication Critical patent/CN111831794A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种基于知识图谱的综合管廊行业知识问答系统构建方法,收集综合管廊相关文档,包括综合管廊规划、设计、施工、运维这四个模块的规范文档、案例文档、法律法规、政策标准,综合管廊相关新闻,抽取上述文档中的实体及属性,生成综合管廊知识图谱数据,并存储于图数据库;本发明通过构建综合管廊行业知识图谱,基于此实现一个管廊行业的KBQA系统,该系统进行问答输出的同时,通过相似度及语义关联,向用户输出相关文献与答案出处文档,增强知识问答结果的可靠性,解决综合管廊领域知识问答空白的问题。本发明通过对领域内相关政策法规,国家及地方标准的文档抽取,增加了问答结果出处的环节,从标准中找答案,提高了回答的准确性。

Description

一种基于知识图谱的综合管廊行业知识问答系统构建方法
技术领域
本发明涉及知识图谱构建技术领域,尤其是涉及一种基于知识图谱的综合管廊行业知识问答系统构建方法。
背景技术
随着自然语言处理与人工智能技术的飞速发展,人们更加习惯于运用网络解决工作生活中的问题。问答系统在各个领域中的应用越来越广泛。对话问答系统是人工智能的一个重要分支与应用,现有的问答系统主要包括开放域问答、基于知识图谱的问答系统等。问答系统的出现为人们带来了极大的便捷,但专业领域内的问题解决速度与用户体验却往往受限。如何在某一专业领域为特定用户提供更为专业和准备的问题答案是一个亟待解决的问题。
现有技术的缺陷和不足:目前,关于知识问答的探讨与建设都是侧重于开放域问答或百科类问答,而基于特定领域的知识图谱问答的探讨还不多。例如:申请号CN201711459522.8的专利是关于金融理财产品领域,申请号CN201710318042.3的专利是关于厨房领域,而关于综合管廊领域KBQA的探讨还是空白。另外,目前问答系统的答案更多来源于各大网站信息、网友回复等,其准确性无法考证,如何从法律法规及相关标准中找出更为准确的专业领域问答内容是一个急需解决的问题。
发明内容
本发明要解决的问题是综合管廊领域知识问答系统空白,以及问答回答可信度不足的问题。
为解决上述问题,本发明针对综合管廊领域构建了基于知识图谱的知识问答系统,解决包含管廊的规划、设计、施工及维护等相关方面的知识问答,根据用户的实时提问,提供回答以及相关的参考文献,并给出答案所出自的相关政策、标准,提高问答的准确性与可靠度。
为实现上述目的,本发明提供了一种基于知识图谱的综合管廊行业知识问答系统构建方法,包括如下步骤:
步骤(1)、数据采集:
收集综合管廊相关文档,包括综合管廊规划、设计、施工、运维这四个模块的规范文档、案例文档、法律法规、政策标准,综合管廊相关新闻等,抽取上述文档中的实体及属性,生成综合管廊知识图谱数据,并存储于图数据库;
步骤(2)、查询模板构建:
针对上述抽取的实体与属性内容,构建问题回复标准模板,生成问题在不同情形下回答语句;如当用户询问问题为实体的某一属性时则根据实体与属性分类结果可匹配模板[实体]的[属性]是[属性值],如询问“综合管廊是什么”,得到“综合管廊的名词解释是...”;
步骤(3)、问句分析:
获取用户在问答系统问句输入界面输入的问句,对用户问句进行分析理解;其中,问句分析理解主要包括问句意图识别、实体识别与标准化以及问句属性分类;
具体步骤如下:
步骤(3.1)、问句意图识别步骤,针对含有实体的问句进行意图识别,判断用户所问问题为新闻科普类问题还是管廊专业性问题,针对新闻科普类问题将问题语义与知识库新闻类问题进行语义关联,计算语义余弦相似度,选择相似度大于预设阈值的最佳候选答案输出;
具体做法如下:运用BERT预训练模型提取句子的向量作为问句的句向量,同理计算知识库中每个新闻类问题的句向量,运用余弦相似度比较两个句子的相似度。具体计算公式如下:
Figure BDA0002578382460000021
其中,x,y分别为BERT所提取出的两个句子的句向量,长度为n,xi和yi分别表示句向量每一维度的具体数值;
阈值的设定方式如下:计算出两句子的余弦相似度后,通过计算余弦相似度,先设定一个较低阈值,当相似度值高于阈值,则表示两个句子相似,反之则不相似。取出已标注“相似”和“不相似”的部分数据集,通过计算余弦相似度,不断调整阈值,使得相似度准确率提高,最终以准确率最高时的阈值作为设定阈值。
如用户询问“我国综合管廊第一批试点城市是什么”,该问句被分为新闻类问题,则进入新闻类语义关联相似度匹配,最终得到与我国第一批综合管廊试点城市名单是...”该新闻的相似度最高且高于预设阈值,表明这两句话相似;
步骤(3.2)、连续问句处理步骤,针对管廊专业性问题,首先判断是否为连续问句模式,将连续问句拆分为多个单一问句,逐句进行分析;问句分析首先将问句分词并将每个词与知识库中的每个实体词进行匹配,查找问句中是否包含知识库中的实体词,如果包含则将问句中的实体词取出,即为实体;
如用户询问“综合管廊是什么?”,“综合管廊”为知识库中的一实体,则该问句分词后与知识库中的实体词进行匹配可得到该问句中的实体为“综合管廊”;
进一步,根据字符串的编辑距离比,找出编辑距离比大于阈值的作为最佳候选实体,并通过知识图谱产生的实体关联关系,对识别出的实体进行标准化,阈值的设定与余弦相似度阈值设定方式一致;
编辑距离,又称Levenshtein距离,是指两个字符串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。句子string_a和句子string_b的编辑距离比公式如(1-2)所示。
Figure BDA0002578382460000031
其中,different_step(string_a,string_b)为编辑操作次数;
len(string_a),len(string_b)分别表示string_a和string_b的字符串长度;
特别地,当连续问句拆分为单一问句时往往会出现某些问句中不包含实体的现象,因此在实体标准化后需对连续问句进行实体关联。
如用户询问“雨水管道和排水管道的关系是什么?设计上都有什么要求”,则该句话最终应输出“排水管道与雨水管道同属于综合管廊入廊管线;排水管道的设计要求为...;雨水管道的设计要求为...”;即为多问句回答;
步骤(3.3)、问题属性分类步骤,根据属性分类及标准化后实体,进入知识库进行语义关联,选出最佳答案,匹配答案模板向用户输出;另外,在输出最佳答案的同时,还输出与问句语义关联程度较高的其他检索内容供用户选择性查阅,在一定程度上避免了语义关联不准确的问题,提高了本发明所构建的基于知识图谱的知识问答系统回答的准确性与泛化能力。
此外本发明根据用户提出问题输出可供预览的问题相关文献,以及可供预览的答案出处相关文档,所述方法包括:
1、相关期刊检索模块:根据综合管廊领域知识体系内容,通过爬取、下载等方式收集包括但不限于综合管廊规划、设计、施工、运维等方面的期刊文献,存储于搜索引擎中,获取用户问句后,在进行知识问答的同时对搜索引擎中的期刊与问句进行相似度检索,输出相似度较高的相关候选期刊供用户浏览。如当用户询问“综合管廊排水设施”时,在输出相关答案的同时,还输出与该问句相似度匹配排名前三的期刊资料,如《住房城乡建设部鼓励支持地下综合管廊和排水防涝设施建设》,《综合管廊内排水对象分析及排水系统的选择》,《专题询问公共设施管理》;
2、答案出处模块:在抽取实体及属性阶段,记录实体及属性来源,来源主要为国家及地方标准、法律法规、相关政策等可靠性较高的文献,在向用户输出最佳候选答案的同时,关联答案出处一同输出可供预览的文献,方便用户查阅并增强了答案可靠性。如用户询问“管廊内消防系统的设计有什么要求”,在输出答案的同时还需输出“答案出处”,如《GB50016-2014建筑设计防火规范》,《火灾自动报警系统设计规范》等。
与现有技术相比,本发明的技术方案具有如下有益效果:
本发明提供了一种基于知识图谱的综合管廊行业知识问答系统构建方法,通过构建综合管廊行业知识图谱,基于此实现一个管廊行业的KBQA系统,该系统进行问答输出的同时,通过相似度及语义关联,向用户输出相关文献与答案出处文档,增强知识问答结果的可靠性,解决了综合管廊领域知识问答空白的问题。本发明通过对领域内相关政策法规,国家及地方标准的文档抽取,增加了问答结果出处的环节,从标准中找答案,提高了回答的准确性。本发明提供的技术方案还可以从综合管廊行业泛化到其他行业中。
附图说明
图1是本发明的整体方案框架示意图;
图2是本发明的具体工作流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1~2所示,本发明提供了一种基于知识图谱的综合管廊行业知识问答系统构建方法的具体实施例,包括如下步骤:
步骤(1)、数据采集:
收集综合管廊相关文档,包括综合管廊规划、设计、施工、运维这四个模块的规范文档、案例文档、法律法规、政策标准,综合管廊相关新闻等,抽取上述文档中的实体及属性,生成综合管廊知识图谱数据,并存储于图数据库;
步骤(2)、查询模板构建:
针对上述抽取的实体与属性内容,构建问题回复标准模板,生成问题在不同情形下回答语句;如当用户询问问题为实体的某一属性时则根据实体与属性分类结果可匹配模板[实体]的[属性]是[属性值],如询问“综合管廊是什么”,得到“综合管廊的名词解释是...”;
步骤(3)、问句分析:
获取用户在问答系统问句输入界面输入的问句,对用户问句进行分析理解;其中,问句分析理解主要包括问句意图识别、实体识别与标准化以及问句属性分类;
具体步骤如下:
步骤(3.1)、问句意图识别步骤,针对含有实体的问句进行意图识别,判断用户所问问题为新闻科普类问题还是管廊专业性问题,针对新闻科普类问题将问题语义与知识库新闻类问题进行语义关联,计算语义余弦相似度,选择相似度大于预设阈值的最佳候选答案输出;
具体做法如下:运用BERT预训练模型提取句子的向量作为问句的句向量,同理计算知识库中每个新闻类问题的句向量,运用余弦相似度比较两个句子的相似度。具体计算公式如下:
Figure BDA0002578382460000051
其中,x,y分别为BERT所提取出的两个句子的句向量,长度为n,xi和yi分别表示句向量每一维度的具体数值;
阈值的设定方式如下:计算出两句子的余弦相似度后,通过计算余弦相似度,先设定一个较低阈值,当相似度值高于阈值,则表示两个句子相似,反之则不相似。取出已标注“相似”和“不相似”的部分数据集,通过计算余弦相似度,不断调整阈值,使得相似度准确率提高,最终以准确率最高时的阈值作为设定阈值。
如用户询问“我国综合管廊第一批试点城市是什么”,该问句被分为新闻类问题,则进入新闻类语义关联相似度匹配,最终得到与我国第一批综合管廊试点城市名单是...”该新闻的相似度最高且高于预设阈值,表明这两句话相似;
步骤(3.2)、连续问句处理步骤,针对管廊专业性问题,首先判断是否为连续问句模式,将连续问句拆分为多个单一问句,逐句进行分析;问句分析首先将问句分词并将每个词与知识库中的每个实体词进行匹配,查找问句中是否包含知识库中的实体词,如果包含则将问句中的实体词取出,即为实体;
如用户询问“综合管廊是什么?”,“综合管廊”为知识库中的一实体,则该问句分词后与知识库中的实体词进行匹配可得到该问句中的实体为“综合管廊”;
进一步,根据字符串的编辑距离比,找出编辑距离比大于阈值的作为最佳候选实体,并通过知识图谱产生的实体关联关系,对识别出的实体进行标准化,阈值的设定与余弦相似度阈值设定方式一致;
编辑距离,又称Levenshtein距离,是指两个字符串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。句子string_a和句子string_b的编辑距离比公式如(1-2)所示。
Figure BDA0002578382460000061
其中,different_step(string_a,string_b)为编辑操作次数;
len(string_a),len(string_b)分别表示string_a和string_b的字符串长度;
特别地,当连续问句拆分为单一问句时往往会出现某些问句中不包含实体的现象,因此在实体标准化后需对连续问句进行实体关联。
如用户询问“雨水管道和排水管道的关系是什么?设计上都有什么要求”,则该句话最终应输出“排水管道与雨水管道同属于综合管廊入廊管线;排水管道的设计要求为...;雨水管道的设计要求为...”;即为多问句回答;
步骤(3.3)、问题属性分类步骤,根据属性分类及标准化后实体,进入知识库进行语义关联,选出最佳答案,匹配答案模板向用户输出;另外,在输出最佳答案的同时,还输出与问句语义关联程度较高的其他检索内容供用户选择性查阅,在一定程度上避免了语义关联不准确的问题,提高了本发明所构建的基于知识图谱的知识问答系统回答的准确性与泛化能力。
此外本发明根据用户提出问题输出可供预览的问题相关文献,以及可供预览的答案出处相关文档,所述方法包括:
1、相关期刊检索模块:根据综合管廊领域知识体系内容,通过爬取、下载等方式收集包括但不限于综合管廊规划、设计、施工、运维等方面的期刊文献,存储于搜索引擎中,获取用户问句后,在进行知识问答的同时对搜索引擎中的期刊与问句进行相似度检索,输出相似度较高的相关候选期刊供用户浏览。如当用户询问“综合管廊排水设施”时,在输出相关答案的同时,还输出与该问句相似度匹配排名前三的期刊资料,如《住房城乡建设部鼓励支持地下综合管廊和排水防涝设施建设》,《综合管廊内排水对象分析及排水系统的选择》,《专题询问公共设施管理》;
2、答案出处模块:在抽取实体及属性阶段,记录实体及属性来源,来源主要为国家及地方标准、法律法规、相关政策等可靠性较高的文献,在向用户输出最佳候选答案的同时,关联答案出处一同输出可供预览的文献,方便用户查阅并增强了答案可靠性。如用户询问“管廊内消防系统的设计有什么要求”,在输出答案的同时还需输出“答案出处”,如《GB50016-2014建筑设计防火规范》,《火灾自动报警系统设计规范》等。
与现有技术相比,本发明的技术方案具有如下有益效果:
本发明提供了一种基于知识图谱的综合管廊行业知识问答系统构建方法,通过构建综合管廊行业知识图谱,基于此实现一个管廊行业的KBQA系统,该系统进行问答输出的同时,通过相似度及语义关联,向用户输出相关文献与答案出处文档,增强知识问答结果的可靠性,解决了综合管廊领域知识问答空白的问题。本发明通过对领域内相关政策法规,国家及地方标准的文档抽取,增加了问答结果出处的环节,从标准中找答案,提高了回答的准确性。本发明提供的技术方案还可以从综合管廊行业泛化到其他行业中。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实例的说明只是用于帮助理解本发明的方法及其核心思想,以上所述仅是本发明的优选实施方式,应当指出,由于文字表达的有限性,而客观上存在无限的具体结构,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进、润饰或变化,也可以将上述技术特征以适当的方式进行组合;这些改进润饰、变化或组合,或未经改进将发明的构思和技术方案直接应用于其它场合的,均应视为本发明的保护范围。

Claims (2)

1.一种基于知识图谱的综合管廊行业知识问答系统构建方法,其特征在于,包括如下步骤:
步骤(1)、数据采集:
收集综合管廊相关文档,包括综合管廊规划、设计、施工、运维这四个模块的规范文档、案例文档、法律法规、政策标准,综合管廊相关新闻,抽取上述文档中的实体及属性,生成综合管廊知识图谱数据,并存储于图数据库;
步骤(2)、查询模板构建:
针对上述抽取的实体与属性内容,构建问题回复标准模板,生成问题在不同情形下回答语句;
步骤(3)、问句分析:
获取用户在问答系统问句输入界面输入的问句,对用户问句进行分析理解;其中,问句分析理解主要包括问句意图识别、实体识别与标准化以及问句属性分类。
2.根据权利要求1中所述的一种基于知识图谱的综合管廊行业知识问答系统构建方法,其特征在于,步骤(3)中问句分析的具体步骤如下:
步骤(3.1)、问句意图识别
针对含有实体的问句进行意图识别,判断用户所问问题为新闻科普类问题还是管廊专业性问题,针对新闻科普类问题将问题语义与知识库新闻类问题进行语义关联,计算语义余弦相似度,选择相似度大于预设阈值的最佳候选答案输出;
具体做法如下:运用BERT预训练模型提取句子的向量作为问句的句向量,同理计算知识库中每个新闻类问题的句向量,运用余弦相似度比较两个句子的相似度;
具体计算公式如下:
Figure FDA0002578382450000011
其中,x,y分别为BERT所提取出的两个句子的句向量,长度为n,xi和yi分别表示句向量每一维度的具体数值;
阈值的设定方式如下:计算出两句子的余弦相似度后,通过计算余弦相似度,先设定一个较低阈值,当相似度值高于阈值,则表示两个句子相似,反之则不相似;
取出已标注“相似”和“不相似”的部分数据集,通过计算余弦相似度,不断调整阈值,使得相似度准确率提高,最终以准确率最高时的阈值作为设定阈值;
步骤(3.2)、连续问句处理
针对管廊专业性问题,首先判断是否为连续问句模式,将连续问句拆分为多个单一问句,逐句进行分析;问句分析首先将问句分词并将每个词与知识库中的每个实体词进行匹配,查找问句中是否包含知识库中的实体词,如果包含则将问句中的实体词取出,即为实体;
进一步,根据字符串的编辑距离比,找出编辑距离比大于阈值的作为最佳候选实体,并通过知识图谱产生的实体关联关系,对识别出的实体进行标准化,阈值的设定与余弦相似度阈值设定方式一致;
编辑距离,又称Levenshtein距离,是指两个字符串之间,由一个转成另一个所需的最少编辑操作次数;许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符;
句子string_a和句子string_b的编辑距离比公式如(1-2)所示:
Figure FDA0002578382450000021
其中,different_step(string_a,string_b)为编辑操作次数;len(string_a),len(string_b)分别表示string_a和string_b的字符串长度;
特别地,当连续问句拆分为单一问句时往往会出现某些问句中不包含实体的现象,因此在实体标准化后需对连续问句进行实体关联;
步骤(3.3)、问题属性分类
根据属性分类及标准化后实体,进入知识库进行语义关联,选出最佳答案,匹配答案模板向用户输出;另外,在输出最佳答案的同时,还输出与问句语义关联程度较高的其他检索内容供用户选择性查阅。
CN202010660544.6A 2020-07-10 2020-07-10 一种基于知识图谱的综合管廊行业知识问答系统构建方法 Pending CN111831794A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010660544.6A CN111831794A (zh) 2020-07-10 2020-07-10 一种基于知识图谱的综合管廊行业知识问答系统构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010660544.6A CN111831794A (zh) 2020-07-10 2020-07-10 一种基于知识图谱的综合管廊行业知识问答系统构建方法

Publications (1)

Publication Number Publication Date
CN111831794A true CN111831794A (zh) 2020-10-27

Family

ID=72901245

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010660544.6A Pending CN111831794A (zh) 2020-07-10 2020-07-10 一种基于知识图谱的综合管廊行业知识问答系统构建方法

Country Status (1)

Country Link
CN (1) CN111831794A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112579600A (zh) * 2020-12-21 2021-03-30 广州橙行智动汽车科技有限公司 一种基于车载问答的数据处理方法和装置
CN112905774A (zh) * 2021-02-22 2021-06-04 武汉市聚联科软件有限公司 一种基于事理图谱的人机对话深度意图理解方法
CN112948561A (zh) * 2021-03-29 2021-06-11 建信金融科技有限责任公司 一种问答知识库自动扩建的方法和装置
CN112988704A (zh) * 2021-03-05 2021-06-18 无锡星凝互动科技有限公司 一种基于ai咨询数据库集群搭建方法和系统
CN113468307A (zh) * 2021-06-30 2021-10-01 网易(杭州)网络有限公司 文本处理方法、装置、电子设备及存储介质
CN114860917A (zh) * 2022-07-06 2022-08-05 中化现代农业有限公司 农业知识问答方法、装置、电子设备和存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108804521A (zh) * 2018-04-27 2018-11-13 南京柯基数据科技有限公司 一种基于知识图谱的问答方法及农业百科问答系统
US20190065576A1 (en) * 2017-08-23 2019-02-28 Rsvp Technologies Inc. Single-entity-single-relation question answering systems, and methods
CN109492077A (zh) * 2018-09-29 2019-03-19 北明智通(北京)科技有限公司 基于知识图谱的石化领域问答方法及系统
CN110019844A (zh) * 2019-02-20 2019-07-16 众安信息技术服务有限公司 一种保险行业知识图谱问答系统构建方法及装置
CN110083690A (zh) * 2019-04-10 2019-08-02 华侨大学 一种基于智能问答的对外汉语口语训练方法及系统
CN110209787A (zh) * 2019-05-29 2019-09-06 袁琦 一种基于宠物知识图谱的智能问答方法及系统
CN110659357A (zh) * 2019-09-12 2020-01-07 北京四海心通科技有限公司 一种基于本体语义相似度的地理知识问答系统
CN111008272A (zh) * 2019-12-04 2020-04-14 深圳市新国都金服技术有限公司 基于知识图谱的问答方法、装置、计算机设备及存储介质
CN111259653A (zh) * 2020-01-15 2020-06-09 重庆邮电大学 基于实体关系消歧的知识图谱问答方法、系统以及终端

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190065576A1 (en) * 2017-08-23 2019-02-28 Rsvp Technologies Inc. Single-entity-single-relation question answering systems, and methods
CN108804521A (zh) * 2018-04-27 2018-11-13 南京柯基数据科技有限公司 一种基于知识图谱的问答方法及农业百科问答系统
CN109492077A (zh) * 2018-09-29 2019-03-19 北明智通(北京)科技有限公司 基于知识图谱的石化领域问答方法及系统
CN110019844A (zh) * 2019-02-20 2019-07-16 众安信息技术服务有限公司 一种保险行业知识图谱问答系统构建方法及装置
CN110083690A (zh) * 2019-04-10 2019-08-02 华侨大学 一种基于智能问答的对外汉语口语训练方法及系统
CN110209787A (zh) * 2019-05-29 2019-09-06 袁琦 一种基于宠物知识图谱的智能问答方法及系统
CN110659357A (zh) * 2019-09-12 2020-01-07 北京四海心通科技有限公司 一种基于本体语义相似度的地理知识问答系统
CN111008272A (zh) * 2019-12-04 2020-04-14 深圳市新国都金服技术有限公司 基于知识图谱的问答方法、装置、计算机设备及存储介质
CN111259653A (zh) * 2020-01-15 2020-06-09 重庆邮电大学 基于实体关系消歧的知识图谱问答方法、系统以及终端

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
方卿,徐丽芳: "《出版学研究进展》", 武汉大学出版社, pages: 296 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112579600A (zh) * 2020-12-21 2021-03-30 广州橙行智动汽车科技有限公司 一种基于车载问答的数据处理方法和装置
CN112905774A (zh) * 2021-02-22 2021-06-04 武汉市聚联科软件有限公司 一种基于事理图谱的人机对话深度意图理解方法
CN112988704A (zh) * 2021-03-05 2021-06-18 无锡星凝互动科技有限公司 一种基于ai咨询数据库集群搭建方法和系统
CN112948561A (zh) * 2021-03-29 2021-06-11 建信金融科技有限责任公司 一种问答知识库自动扩建的方法和装置
CN112948561B (zh) * 2021-03-29 2023-07-07 建信金融科技有限责任公司 一种问答知识库自动扩建的方法和装置
CN113468307A (zh) * 2021-06-30 2021-10-01 网易(杭州)网络有限公司 文本处理方法、装置、电子设备及存储介质
CN113468307B (zh) * 2021-06-30 2023-06-30 网易(杭州)网络有限公司 文本处理方法、装置、电子设备及存储介质
CN114860917A (zh) * 2022-07-06 2022-08-05 中化现代农业有限公司 农业知识问答方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
CN108804521B (zh) 一种基于知识图谱的问答方法及农业百科问答系统
CN111831794A (zh) 一种基于知识图谱的综合管廊行业知识问答系统构建方法
CN111753099B (zh) 一种基于知识图谱增强档案实体关联度的方法及系统
CN110941692B (zh) 互联网政治外交类新闻事件抽取方法
CN106649260B (zh) 基于评论文本挖掘的产品特征结构树构建方法
CN103544255B (zh) 基于文本语义相关的网络舆情信息分析方法
CN111967761B (zh) 一种基于知识图谱的监控预警方法、装置及电子设备
CN110502642B (zh) 一种基于依存句法分析与规则的实体关系抽取方法
CN105718585B (zh) 文档与标签词语义关联方法及其装置
CN113190687B (zh) 知识图谱的确定方法、装置、计算机设备及存储介质
CN113312922B (zh) 一种改进的篇章级三元组信息抽取方法
CN110956033A (zh) 一种文本相似度计算方法及装置
CN111177401A (zh) 一种电网自由文本知识抽取方法
CN112307364B (zh) 一种面向人物表征的新闻文本发生地抽取方法
CN107562774A (zh) 小语种词嵌入模型的生成方法、系统及问答方法和系统
CN109460467B (zh) 一种网络信息分类体系构建方法
CN114238735B (zh) 一种互联网数据智能采集方法
CN111401047A (zh) 法律文书的争议焦点生成方法、装置及计算机设备
CN111949781B (zh) 一种基于自然语句句法分析的智能交互方法及装置
CN114417008A (zh) 一种面向建设工程领域的知识图谱构建方法及系统
CN114638225A (zh) 一种基于科技文献图网络的关键词自动抽取方法
CN113536772A (zh) 一种文本处理方法、装置、设备及存储介质
CN110569061A (zh) 一种基于大数据的软件工程知识库的自动化构建系统
Veltmeijer et al. SentiMap: Domain-Adaptive Geo-Spatial Sentiment Analysis
Hamdulla et al. A hierarchical clustering based relation extraction method for domain ontology

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination