CN108804521A - 一种基于知识图谱的问答方法及农业百科问答系统 - Google Patents

一种基于知识图谱的问答方法及农业百科问答系统 Download PDF

Info

Publication number
CN108804521A
CN108804521A CN201810392883.3A CN201810392883A CN108804521A CN 108804521 A CN108804521 A CN 108804521A CN 201810392883 A CN201810392883 A CN 201810392883A CN 108804521 A CN108804521 A CN 108804521A
Authority
CN
China
Prior art keywords
question
answer
predicate
entity
collection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810392883.3A
Other languages
English (en)
Other versions
CN108804521B (zh
Inventor
花云程
吴刚
杨成彪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Ke Data Technology Co Ltd
Original Assignee
Nanjing Ke Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Ke Data Technology Co Ltd filed Critical Nanjing Ke Data Technology Co Ltd
Priority to CN201810392883.3A priority Critical patent/CN108804521B/zh
Publication of CN108804521A publication Critical patent/CN108804521A/zh
Application granted granted Critical
Publication of CN108804521B publication Critical patent/CN108804521B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Marine Sciences & Fisheries (AREA)
  • General Business, Economics & Management (AREA)
  • Animal Husbandry (AREA)
  • Agronomy & Crop Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Mining & Mineral Resources (AREA)
  • Economics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出一种基于知识图谱的问答方法及农业百科问答系统,可以自动分析用户提出的自然语言问题,形成基于句法树的拓扑结构,通过拓扑结构与语法库中的问题模板进行检索和比对,根据拓扑结构与谓词指称的映射关系、同义词集合与知识图谱中关系或属性的映射关系,得到问题映射的谓词,并结合问题中识别的实体,生成最终的结构化的知识图谱查询语句,根据该查询语句到知识图谱中进行检索,返回最终的结果。当在问题模板库中无法检索到相关拓扑结构时,会调用FAQ问题库的常问问答对,进行问题的回答。该问答系统能够针对用户提出的问句给出精确的答案检索,提高用户对农业百科问题检索的满意度。

Description

一种基于知识图谱的问答方法及农业百科问答系统
技术领域
本发明涉及基于人工智能的问答方法,更具体地涉及基于知识图谱的问答方法和基于该方法的农业问答系统。
背景技术
当前的互联网中,海量信息分布于不同的信息源,相关性较为稀疏,使用传统搜索引擎,准确、快速地获得有价值的信息变得愈发困难。传统的基于人工的知识管理方式,并不能实时高效地满足用户对于农业领域知识的获取需求。此外,很多社区问答中遇到的问题,并不能保证答案的准确性,且一些答案已不具备时效性。相较而言,问答系统的出现,旨在快速得到高质量信息或答案。其中,基于知识图谱的智能问答系统,通过引入自然语言处理技术,方便高效地从农业领域知识图谱中搜索相关答案,并推送给用户,辅助用户学习相关知识。
目前,农业知识管理系统中的知识问答,主要以网页检索、文档检索的方式为主,导致一些在线交流的问题无法得到及时回复或者延时太长,影响用户知识获取的效率。目前,随着人工智能技术的成熟,有必要在知识管理系统中增加智能问答功能,系统自动分析问题(规则分析、模型等方式),通过模板匹配、推理机、神经网络等技术,从知识库中搜索相关答案,并推送给用户,辅助用户学习和获取精确的农业百科相关知识。
对于农业领域,目前已有的问答系统,如专利《一种基于移动互联网的农业专家问答平台》是通过软件实现用户与农业专家的信息交互,建立其普通用户与农业技术人员的联系,并解决用户的农业相关问题。这样的系统,需要时刻有专家在软件服务端提供咨询服务,会耗费大量的人力,并且无法自动地为用户提供服务。
发明内容
为了克服现有技术的低效,以及已有农业问答系统的弊端,本发明提供一种能够自动化理解用户的问句并快速准确地检索到知识图谱中答案的问答方法及基于该方法的农业问答系统。
本发明解决上述技术问题所采用的技术方案为:一种基于知识图谱的问答方法,包括以下步骤:
1)构建用于存储农业领域知识的数据库、用于存储同义词集合和问题模板的语法库以及用于存储常问问题集的FAQ问题库,具体为:
1.1构建农业领域知识图谱,并将知识图谱数据存储到结构化的RDF数据库TDB中,利用TDB服务进行知识图谱三元组的检索;
1.2构建用于存储同义词集合和问题模板的语法库,将同义词集合与问题模板存储到语法库,所述的同义词集合包括与知识图谱中关系和属性相关的关键字,并提取问题中的拓扑结构形成问题模板库,存储到语法库,所述同义词集合和问题模板的具体建立步骤为:
1.2.1首先收集领域相关问题的样本,形成样本集,并根据样本所涉及的关系或属性,对所述样本集进行分类,对问题样本进行命名实体识别后,去除实体指称,再将剩余部分进行分词、去除停用词操作,得到仅含有关键字的精简问题样例,并将涉及同一个关系或属性的精简问题样例归为一类,再将属于这些精简问题样例的关键字合并为一个集合,即得到一个同义词集合,而每一个同义词集合对应知识图谱中的一个关系或属性;
1.2.2对每一个问题样本,进行命名实体识别,实体指称以通配符替代,再对问题样本进行分词和词性标注,并根据分词和词性标注结果建立句法树;分析句法树的结构,对问题样本进行分类,分类的依据为:归为一类的问题样本,其句法树中都有相同的子树,即这些子树的结构相同,且子树中相同位置的树节点,其词性也相同,这些相同的子树表示一种拓扑结构;对于每一类问题样本,记录下句法树拓扑结构中谓词指称所对应的部分,以此得到拓扑结构与谓词指称的对应关系,该对应关系即为问题模板,并形成问题模板库;
1.3通过网络收集社区问答所提供的、用户交互衍生的大规模问题答案对,从中统计出高频的问题答案对,形成常问问题集,并将常问问题及相关答案存储到问题库,每一个问题对应一个标准答案,即为问题与答案的映射,以此构建FAQ问题库;;
2)对问题进行解析,具体步骤为:
2.1对问题进行命名实体识别操作,将问句与知识图谱中的实体进行字符串匹配,得到问题的实体指称部分;
2.2对问题进行实体链接操作,将实体指称链接到知识图谱中的某个实体;
2.3问题的实体指称部分以通配符替代,并对问题的剩余部分进行分词,即将问句分割为一系列分词词组,并对所述分词词组进行词性标注;
2.4用标注词性的分词词组,进行句法分析,建立句法树;
2.5用句法树的词性拓扑结构,与步骤1.2.2中得到的问题模板库中的问题模板进行检索,判断问题对应的句法树拓扑结构,是否与某个问题模板中的结构相同,若是则视为匹配到模板,进入步骤3.1;否则进入步骤3.2;
3)检索答案,具体步骤为:
3.1从农业领域知识库中检索答案,具体步骤为:
3.1.1根据步骤2.5检索匹配到的模板,得到问题的句法树拓扑结构中对应的谓词指称部分;
3.1.2根据所述谓词指称部分对应的词性,从步骤2.3标注词性的分词词组中,取出问题中谓词指称部分的词组;
3.1.3将问题中谓词指称部分的词组,与步骤1.2.1得到的同义词集合,进行相似度计算,对于相似度最大的同义词集合,其对应于知识图谱的关系或属性,即为问题映射到知识图谱的关系或属性;
3.1.4将步骤2.2得到的实体视为主语或宾语,与步骤3.1.3得到的谓词相结合,生成SPARQL查询,从知识图谱中检索并找到对应的三元组,若将步骤2.2得到的实体视为主语,则以该三元组中的宾语作为问题的答案;若将步骤2.2得到的实体视为宾语,则以该三元组中的主语作为问题的答案,若没有检索到对应的三元组,则进入步骤3.3;
3.2从FAQ问题库中检索答案,具体步骤为:
3.2.1基于编辑距离,计算原始问题与FAQ问题库常问问题的相似度;
3.2.2取相似度最大的常问问题为候选问题,若原始问题与候选问题的相似度大于问句相似度阈值,则视为原始问题匹配到该常问问题,进入步骤3.2.3;否则进入步骤3.3;
3.2.3根据匹配得到的常问问题,以及FAQ问题库中常问问题与答案的映射关系,得到常问问题对应的答案,即作为原始问题的答案;
3.3给出提示,无法回答问题。
进一步的,本发明方法中,步骤3.1.3中计算谓词指称部分词组与同义词集合的相似度的具体过程为:
X=(x1,x2,…,xn,xn+1,…)为自然问句谓词指称部分的词组,其中xn表示问句谓词指称部分中的一个词;令Yi=(yi1,yi2,…,yim,yim+1,…)表示第i个同义词集合,共有L个同义词集合;yim表示第i个同义词集合中的一个词;xn与yim的相似度计算是基于词向量的语义相似度,即xn与yim都以k维词向量表示,有xn=(xn1,xn2,…,xnk),yim=(yim1,yim2,…,yimk),根据下式计算xn与yim的相似度:
其中T为同义词相似度阈值,为一个超参数,表示当两个词的相似度超过这个阈值时,则视为两个词是同义词或近义词,否则就将相似度置为0;
谓词指称部分的词组与同义词集合的相似度为:
其中|X|表示谓词指称部分词组的词个数,|Yi|表示一个同义词集合Yi的词个数,sim(xj,yim)为问句谓词指称部分中的一个词xj与第i个同义词集合中的一个词yim的词向量相似度。
进一步的,本发明方法中,步骤3.2.1中计算原始问题与FAQ问题库常问问题的相似度的具体过程为:
对原始问题q与FAQ问题库中第i个常问问题xi进行预处理,去除问题中的非中文字符;使用基于编辑距离的相似度计算公式,计算原始问题与FAQ问题库中第i个常问问题的相似度:其中|q|、|xi|分别表示两个问题的字符串长度,EditDistance(q,xi)是使用编辑距离计算得到的两个问题相互转换的最小操作次数。
本发明的农业百科问答系统,包括离线模块和在线模块,所述离线模块用以利用事先得到的问题-答案对,生成拓扑结构-谓词指称的映射关系以及生成谓词-同义词集合的映射关系,形成问题模板库和同义词集合,建立农业百科知识相关的知识图谱;所述的在线模块用以对用户输入的问句进行预处理和解析,根据解析结果匹配问题模板,根据模板找到问句中谓词指称部分,匹配与谓词指称最相近的同义词集合,得到谓词指称对应于知识图谱中的某个关系或属性,将问句映射为知识图谱中的实体-关系/属性组合,生成结构化查询语句。
进一步的,本发明系统中,离线模块包括知识图谱建立单元、问题样本处理单元、问题模板训练单元和同义词集合生成单元;所述的知识图谱建立单元用以结合百度百科、维基百科、或互动百科中已有的农业概念分类体系,进行人工建立农业分类树,并从百度百科、维基百科、或互动百科的网页中通过网络爬虫抽取农业分类树相关的农业百科知识,且通过三大百科网页的信息框数据和网页文本自动生成表达农业实体关系或属性的三元组,形成农业知识图谱;所述的问题样本处理单元用以通过网络爬虫挖掘农业问答社区网站、农业百科垂直网站、百科知道类网站的农业相关问题,形成问题样本集,并通过众包形式的分析与审核,找到可以映射为知识图谱中关系或属性的问题,形成问题样本集;所述的问题模板训练单元用以对问题样本进行命名实体识别、实体链接、替换命名实体指称、去除停用词、分词、词性标注和句法树构建等的预处理,并借助机器学习或审核的方法找到句法树中的特定句法子树以及句法子树的谓词指称部分,形成拓扑结构与结构中谓词指称部分的映射关系,这种映射关系即为一种问题模板,形成问题模板集合,所述特定句法子树被称为一种拓扑结构;所述的同义词集合生成单元用以分析问题样本处理单元形成的问题样本集,找到知识图谱中某个属性或关系所对应的一类问题样本,并对这类问题样本进行命名实体识别后,去除实体指称,再将剩余部分进行分词、去除停用词操作,得到仅含有关键字的精简问题样例,并把属于这些精简问题样例的关键字合并为一个集合,从而得到一个同义词集合,每一个同义词集合对应知识图谱中的一个关系或属性。
进一步的,本发明系统中,在线模块包括I/O单元、命名实体识别单元、问句预处理单元、问题模板匹配单元、答案检索单元、FAQ问题库答案获取单元和答案处理单元,所述的I/O单元用于接受用户输入的问题并展示检索答案给用户,所述的命名实体识别单元用于识别问句中的实体指称部分、并将实体指称与知识图谱的实体进行链接,所述的问句预处理单元用以将问句中的实体指称以通配符替换、并对问句进行分词和去除停用词,所述的问题模板匹配单元用以对预处理后的问句进行词性标注并生成句法树、根据句法树在问题模板库中检索匹配的问题模板并确定问句的谓词指称部分、根据问句的谓词指称词组检索匹配的同义词集合并确定同义词集合映射的知识图谱关系或属性,所述的答案检索单元用以根据识别出的问题实体和属性/关系组成结构化查询语句、并根据结构化查询语句在知识图谱中检索对应的三元组后返回答案实体,所述的FAQ问题库答案获取单元用于从FAQ问题库获取问题的答案,所述的答案处理单元用以根据问句的谓词指称与同义词集合的相似度计算答案可信度、计算问句与FAQ问题库中常问问题的相似度作为答案可信度。
本发明的基于知识图谱的问答方法及基于该方法的农业百科问答系统,可以自动分析用户提出的自然语言问题,并形成基于句法树的拓扑结构,通过拓扑结构与语法库中的问题模板进行检索和比对,根据所述的拓扑结构与谓词指称的映射关系、以及同义词集合与知识图谱中关系或属性的映射关系,得到问题映射的谓词,并结合问题中识别的实体,生成最终的结构化的知识图谱查询语句,根据该查询语句到知识图谱中进行检索,返回最终的结果。当在问题模板库中无法检索到相关拓扑结构时,会调用FAQ问题库的问答对,进行问题的回答。该问答系统能够针对用户提出的问句给出精确的答案检索,提高用户对农业百科问题检索的满意度。该方法用于农科百科问答时,能够涵盖知识图谱范围内99%以上的问题,通过测试准确率达到93%以上。
附图说明
图1为本发明基于知识图谱的问答方法的步骤流程图;
图2为本发明农业百科问答系统的结构示意图。
具体实施方式
以下结合附图实施例对本发明作进一步阐述,本发明的目的和效果将变得更明显。
一种基于知识图谱的问答方法,如图1所示,包括:
构建数据库,解析问题和检索答案,具体步骤为:
1)构建用于存储农业领域知识的数据库、用于存储同义词集合和问题模板的语法库以及用于存储常问问题集(frequent asked questions,FAQ)的FAQ问题库,具体为:
1.1构建农业领域知识图谱,并将知识图谱数据存储到结构化的RDF(ResourceDescription Framework)数据库TDB(Triple Database)中,利用TDB服务进行知识图谱三元组的检索;
1.2构建用于存储同义词集合和问题模板的语法库,将同义词集合与问题模板存储到语法库,所述的同义词集合包括与知识图谱中关系和属性相关的关键字,并提取问题中的拓扑结构形成问题模板库,存储到语法库,所述同义词集合和问题模板的具体建立步骤为:
1.2.1首先收集领域相关问题的样本,形成样本集,并根据样本所涉及的关系或属性,对所述样本集进行分类,对问题样本进行命名实体识别后,去除实体指称,再将剩余部分进行分词、去除停用词操作,得到仅含有关键字的精简问题样例,并将涉及同一个关系或属性的精简问题样例归为一类,再将属于这些精简问题样例的关键字合并为一个集合,即得到一个同义词集合,而每一个同义词集合对应知识图谱中的一个关系或属性;例如对于知识图谱中的属性“别名”,其对应的同义词集合为“名字、姓名、别名、名称、其他、名、别称、又名”等;
1.2.2对每一个问题样本,进行命名实体识别,实体指称以通配符替代,再对问题样本进行分词和词性标注,并根据分词和词性标注结果建立句法树;分析句法树的结构,对问题样本进行分类,分类的依据为:归为一类的问题样本,其句法树中都有相同的子树,即这些子树的结构相同,且子树中相同位置的树节点,其词性也相同,这些相同的子树表示一种拓扑结构;对于每一类问题样本,记录下句法树拓扑结构中谓词指称所对应的部分,以此得到拓扑结构与谓词指称的对应关系,该对应关系即为问题模板,并形成问题模板库;
1.3通过网络收集社区问答(community question answering,CQA)所提供的、用户交互衍生的大规模问题答案对(question-answer pair,QA pair),从中统计出高频的问题答案对,形成常问问题集(frequent asked questions,FAQ),并将常问问题及相关答案存储到问题库,每一个问题对应一个标准答案,即为问题与答案的映射,以此构建FAQ问题库;;
2)对问题进行解析,具体步骤为:
2.1对问题进行命名实体识别操作,将问句与知识图谱中的实体进行字符串匹配,得到问题的实体指称部分;
2.2对问题进行实体链接操作,将实体指称链接到知识图谱中的某个实体;
2.3问题的实体指称部分以通配符替代,并对问题的剩余部分进行分词,即将问句分割为一系列分词词组,并对所述分词词组进行词性标注;
2.4用标注词性的分词词组,进行句法分析,建立句法树;
2.5用句法树的词性拓扑结构,与步骤1.2.2中得到的问题模板库中的问题模板进行检索,判断问题对应的句法树拓扑结构,是否与某个问题模板中的结构相同,若是则视为匹配到模板,进入步骤3.1;否则进入步骤3.2;例如问题“翠菊的颜色是什么?”,经过命名实体识别后,实体指称“翠菊”被通配符“ENTITY”替代,问题转化为“ENTITY的颜色是什么?”,再进行分词和词性标注,问题被分词为{"ENTITY","的","颜色","是","什么"},对应的词性标注为{"en","uj","n","v","r"},生成的句法树为“[IP[NP[DNP[NP[NN ENTITY]][DEG的]][NP[NN颜色]]][VP[VC是][NP[PN什么]]]]”,匹配到的拓扑结构为“NP->DNP+NP”;
3)检索答案,具体步骤为:
3.1从农业领域知识库中检索答案,具体步骤为:
3.1.1根据步骤2.5检索匹配到的模板,得到问题的句法树拓扑结构中对应的谓词指称部分;
3.1.2根据谓词指称部分对应的词性,从步骤2.3标注词性的分词词组中,取出问题中谓词指称部分的词组;如前所述的例子,拓扑结构为“NP->DNP+NP”,其中的谓词指称部分为叶节点的“NP”,即问句中的“[NP[NN颜色]]”部分,所以这个问题的谓词指称部分词组为“颜色”;
3.1.3将问题中谓词指称部分的词组,与步骤1.2.1得到的同义词集合,进行相似度计算,对于相似度最大的同义词集合,其对应于知识图谱的关系或属性,即为问题映射到知识图谱的关系或属性;如前所述的例子,谓词指称部分词组“颜色”,根据计算,相似度最大的同义词集合为“颜色、花色、色彩、色”,而这个同义词集合对应知识图谱的属性为“花色”,即得到问题所映射到知识图谱的谓词为“花色”;
3.1.4将步骤2.2得到的实体视为主语或宾语,与步骤3.1.3得到的谓词相结合,生成SPARQL查询,从知识图谱中检索并找到对应的三元组,若将步骤2.2得到的实体视为主语,则以该三元组中的宾语作为问题的答案;若将步骤2.2得到的实体视为宾语,则以该三元组中的主语作为问题的答案,若没有检索到对应的三元组,则进入步骤3.3;
3.2从FAQ问题库中检索答案,具体步骤为:
3.2.1基于编辑距离,计算原始问题与FAQ问题库常问问题的相似度;
3.2.2取相似度最大的常问问题为候选问题,若原始问题与候选问题的相似度大于问句相似度阈值,则视为原始问题匹配到该常问问题,进入步骤3.2.3;否则进入步骤3.3;本系统中,基于问题样本集,设置不同的问句相似度阈值,评估正确回答样本问题的召回率(recall)、精确率(precision)和综合评价指标F1-Measure,取使得F1-Measure最大时设置的阈值参数,为系统中使用的问句相似度阈值;在本系统中,问句相似度阈值为0.60。
3.2.3根据匹配得到的常问问题,以及FAQ问题库中常问问题与答案的映射关系,得到常问问题对应的答案,即作为原始问题的答案;
3.3给出提示,无法回答问题。
本发明方法的优选实施例中,步骤3.1.3中计算谓词指称部分词组与同义词集合的相似度的具体过程为:
令X=(x1,x2,…,xn,xn+1,…)为自然问句谓词指称部分的词组,其中xn表示问句谓词指称部分中的一个词;令Yi=(yi1,yi2,…,yim,yim+1,…)表示第i个同义词集合,共有L个同义词集合;yim表示第i个同义词集合中的一个词;xn与yim的相似度计算是基于词向量的语义相似度,即将xn与yim都以k维词向量表示,有xn=(xn1,xn2,…,xnk),yim=(yim1,yim2,…,yimk),根据下式计算xn与yim的相似度:
其中T为同义词相似度阈值,为一个超参数,表示当两个词的相似度超过这个阈值,则视为两个词是同义词或近义词,否则就将相似度置为0;本系统中,基于问题样本集,设置不同的同义词相似度阈值,评估正确回答样本问题的召回率(recall)、精确率(precision)和综合评价指标F1-Measure,取使得F1-Measure最大时设置的阈值参数,为系统中使用的同义词相似度阈值;在本系统中,同义词相似度阈值为0.55。
谓词指称部分的词组与同义词集合的相似度为:
其中|X|表示谓词指称部分词组的词个数,|Yi|表示一个同义词集合Yi的词个数,sim(xj,yim)为问句谓词指称部分中的一个词xj与第i个同义词集合中的一个词yim的词向量相似度。
本发明方法的优选实施例中,步骤3.2.1中计算原始问题与FAQ问题库常问问题的相似度的具体过程为:
对原始问题q与FAQ问题库中第i个常问问题xi进行预处理,去除问题中的非中文字符;使用基于编辑距离的相似度计算公式,计算原始问题与FAQ问题库中第i个常问问题的相似度:其中|q|、|xi|分别表示两个问题的字符串长度,EditDistance(q,xi)是使用编辑距离计算得到的两个问题相互转换的最小操作次数。
如图2所示,本发明的农业百科问答系统,是基于上述知识图谱问答方法,包括离线模块和在线模块,所述离线模块用以利用事先得到的问题-答案对,生成拓扑结构-谓词指称的映射关系以及生成谓词-同义词集合的映射关系,形成问题模板库和同义词集合,建立农业百科知识相关的知识图谱;所述的在线模块用以对用户输入的问句进行预处理和解析,根据解析结果匹配问题模板,根据模板找到问句中谓词指称部分,匹配与谓词指称最相近的同义词集合,得到谓词指称对应于知识图谱中的某个关系或属性,将问句映射为知识图谱中的实体-关系/属性组合,生成结构化查询语句。
本发明系统的优选实施例中,离线模块包括知识图谱建立单元、问题样本处理单元、问题模板训练单元和同义词集合生成单元;所述的知识图谱建立单元用以结合百度百科、维基百科、或互动百科中已有的农业概念分类体系,进行人工建立农业分类树,并从百度百科、维基百科、或互动百科的网页中通过网络爬虫抽取农业分类树相关的农业百科知识,且通过三大百科网页的信息框数据和网页文本自动生成表达农业实体关系或属性的三元组,形成农业知识图谱;所述的问题样本处理单元用以通过网络爬虫挖掘农业问答社区网站、农业百科垂直网站、百科知道类网站的农业相关问题,形成问题样本集,并通过众包形式的分析与审核,找到可以映射为知识图谱中关系或属性的问题,形成问题样本集;所述的问题模板训练单元用以对问题样本进行命名实体识别、实体链接、替换命名实体指称、去除停用词、分词、词性标注和句法树构建等的预处理,并借助机器学习或审核的方法找到句法树中的特定句法子树以及句法子树的谓词指称部分,形成拓扑结构与结构中谓词指称部分的映射关系,这种映射关系即为一种问题模板,形成问题模板集合,所述特定句法子树被称为一种拓扑结构;所述的同义词集合生成单元用以分析问题样本处理单元形成的问题样本集,找到知识图谱中某个属性或关系所对应的一类问题样本,并对这类问题样本进行命名实体识别后,去除实体指称,再将剩余部分进行分词、去除停用词操作,得到仅含有关键字的精简问题样例,并把属于这些精简问题样例的关键字合并为一个集合,从而得到一个同义词集合,每一个同义词集合对应知识图谱中的一个关系或属性。
本发明系统的优选实施例中,在线模块包括I/O单元、命名实体识别单元、问句预处理单元、问题模板匹配单元、答案检索单元、FAQ问题库答案获取单元和答案处理单元,所述的I/O单元用于接受用户输入的问题并展示检索答案给用户,所述的命名实体识别单元用于识别问句中的实体指称部分、并将实体指称与知识图谱的实体进行链接,所述的问句预处理单元用以将问句中的实体指称以通配符替换、并对问句进行分词和去除停用词,所述的问题模板匹配单元用以对预处理后的问句进行词性标注并生成句法树、根据句法树在问题模板库中检索匹配的问题模板并确定问句的谓词指称部分、根据问句的谓词指称词组检索匹配的同义词集合并确定同义词集合映射的知识图谱关系或属性,所述的答案检索单元用以根据识别出的问题实体和属性/关系组成结构化查询语句、并根据结构化查询语句在知识图谱中检索对应的三元组后返回答案实体,所述的FAQ问题库答案获取单元用于从FAQ问题库获取问题的答案,所述的答案处理单元用以根据问句的谓词指称与同义词集合的相似度计算答案可信度、计算问句与FAQ问题库中常问问题的相似度作为答案可信度。
虽然本发明的一些实施方式已经在本申请文件中予以了描述,但是对本领域技术人员显而易见的是,这些实施方式仅仅是作为示例示出的。本领域技术人员可以想到众多的变型方案、替代方案和改进方案而不超出本发明的范围。所附权利要求书旨在限定本发明的范围,并藉此涵盖这些权利要求本身及其等同变换的范围内的方法和结构。

Claims (6)

1.一种基于知识图谱的问答方法,其特征在于,该方法包括以下步骤:
1)构建用于存储农业领域知识的数据库、用于存储同义词集合和问题模板的语法库以及用于存储常问问题集的FAQ问题库,具体为:
1.1构建农业领域知识图谱,并将知识图谱数据存储到结构化的RDF数据库TDB中,利用TDB服务进行知识图谱三元组的检索;
1.2构建用于存储同义词集合和问题模板的语法库,将同义词集合与问题模板存储到语法库,所述的同义词集合包括与知识图谱中关系和属性相关的关键字,并提取问题中的拓扑结构形成问题模板库,存储到语法库,所述同义词集合和问题模板的具体建立步骤为:
1.2.1首先收集领域相关问题的样本,形成样本集,并根据样本所涉及的关系或属性,对所述样本集进行分类,对问题样本进行命名实体识别后,去除实体指称,再将剩余部分进行分词、去除停用词操作,得到仅含有关键字的精简问题样例,并将涉及同一个关系或属性的精简问题样例归为一类,再将属于这些精简问题样例的关键字合并为一个集合,即得到一个同义词集合,而每一个同义词集合对应知识图谱中的一个关系或属性;
1.2.2对每一个问题样本,进行命名实体识别,实体指称以通配符替代,再对问题样本进行分词和词性标注,并根据分词和词性标注结果建立句法树;分析句法树的结构,对问题样本进行分类,分类的依据为:归为一类的问题样本,其句法树中都有相同的子树,即这些子树的结构相同,且子树中相同位置的树节点,其词性也相同,这些相同的子树表示一种拓扑结构;对于每一类问题样本,记录下句法树拓扑结构中谓词指称所对应的部分,以此得到拓扑结构与谓词指称的对应关系,该对应关系即为问题模板,并形成问题模板库;
1.3通过网络收集社区问答所提供的、用户交互衍生的大规模问题答案对,从中统计出高频的问题答案对,形成常问问题集,并将常问问题及相关答案存储到问题库,每一个问题对应一个标准答案,即为问题与答案的映射,以此构建FAQ问题库;
2)对问题进行解析,具体步骤为:
2.1对问题进行命名实体识别操作,将问句与知识图谱中的实体进行字符串匹配,得到问题的实体指称部分;
2.2对问题进行实体链接操作,将实体指称链接到知识图谱中的某个实体;
2.3问题的实体指称部分以通配符替代,并对问题的剩余部分进行分词,即将问句分割为一系列分词词组,并对所述分词词组进行词性标注;
2.4用标注词性的分词词组,进行句法分析,建立句法树;
2.5用句法树的词性拓扑结构,与步骤1.2.2中得到的问题模板库中的问题模板进行检索,判断问题对应的句法树拓扑结构,是否与某个问题模板中的结构相同,若是则视为匹配到模板,进入步骤3.1;否则进入步骤3.2;
3)检索答案,具体步骤为:
3.1从农业领域知识库中检索答案,具体步骤为:
3.1.1根据步骤2.5检索匹配到的模板,得到问题的句法树拓扑结构中对应的谓词指称部分;
3.1.2根据所述谓词指称部分对应的词性,从步骤2.3标注词性的分词词组中,取出问题中谓词指称部分的词组;
3.1.3将问题中谓词指称部分的词组,与步骤1.2.1得到的同义词集合,进行相似度计算,对于相似度最大的同义词集合,其对应于知识图谱的关系或属性,即为问题映射到知识图谱的关系或属性;
3.1.4将步骤2.2得到的实体视为主语或宾语,与步骤3.1.3得到的谓词相结合,生成SPARQL查询,从知识图谱中检索并找到对应的三元组,若将步骤2.2得到的实体视为主语,则以该三元组中的宾语作为问题的答案;若将步骤2.2得到的实体视为宾语,则以该三元组中的主语作为问题的答案,若没有检索到对应的三元组,则进入步骤3.3;
3.2从FAQ问题库中检索答案,具体步骤为:
3.2.1基于编辑距离,计算原始问题与FAQ问题库常问问题的相似度;
3.2.2取相似度最大的常问问题为候选问题,若原始问题与候选问题的相似度大于问句相似度阈值,则视为原始问题匹配到该常问问题,进入步骤3.2.3;否则进入步骤3.3;
3.2.3根据匹配得到的常问问题,以及FAQ问题库中常问问题与答案的映射关系,得到常问问题对应的答案,即作为原始问题的答案;
3.3给出提示,无法回答问题。
2.如权利要求1所述的一种基于知识图谱的问答方法,其特征在于,所述步骤3.1.3中计算谓词指称部分的词组与同义词集合的相似度的具体过程为:
X=(x1,x2,…,xn,xn+1,…)为自然问句谓词指称部分的词组,其中xn表示问句谓词指称部分中的一个词;令Yi=(yi1,yi2,…,yim,yim+1,…)表示第i个同义词集合,共有L个同义词集合;yim表示第i个同义词集合中的一个词;xn与yim的词相似度计算是基于词向量的语义相似度,即xn与yim都以k维词向量表示,有xn=(xn1,xn2,…,xnk),yim=(yim1,yim2,…,yimk),根据下式计算xn与yim的相似度:
其中T为同义词相似度阈值,为一个超参数,表示当两个词的相似度超过这个阈值时,则视为两个词是同义词或近义词,否则就将相似度置为0;
谓词指称部分的词组与同义词集合的相似度为:
其中|X|表示谓词指称部分词组的词个数,|Yi|表示一个同义词集合Yi的词个数,sim(xj,yim)为问句谓词指称部分中的一个词xj与第i个同义词集合中的一个词yim的词向量相似度。
3.如权利要求1所述的一种基于知识图谱的问答方法,其特征在于,所述步骤3.2.1中计算原始问题与FAQ问题库常问问题的相似度的具体过程为:
对原始问题q与FAQ问题库中第i个常问问题xi进行预处理,去除问题中的非中文字符;使用基于编辑距离的相似度计算公式,计算原始问题与FAQ问题库中第i个常问问题的相似度:其中|q|、|xi|分别表示两个问题的字符串长度,EditDistance(q,xi)是使用编辑距离计算得到的两个问题相互转换的最小操作次数。
4.一种农业百科问答系统,其特征在于,该系统包括离线模块和在线模块,所述离线模块用以利用事先得到的问题-答案对,生成拓扑结构-谓词指称的映射关系以及生成谓词-同义词集合的映射关系,形成问题模板库和同义词集合,建立农业百科知识相关的知识图谱;所述的在线模块用以对用户输入的问句进行预处理和解析,根据解析结果匹配问题模板,根据模板找到问句中谓词指称部分,匹配与谓词指称最相近的同义词集合,得到谓词指称对应于知识图谱中的某个关系或属性,将问句映射为知识图谱中的实体-关系/属性组合,生成结构化查询语句。
5.如权利要求4所述的农业百科问答系统,其特征在于,所述的离线模块包括知识图谱建立单元、问题样本处理单元、问题模板训练单元和同义词集合生成单元;所述的知识图谱建立单元用以结合百度百科、维基百科、或互动百科中已有的农业概念分类体系,进行人工建立农业分类树,并从百度百科、维基百科、或互动百科的网页中通过网络爬虫抽取农业分类树相关的农业百科知识,且通过三大百科网页的信息框数据和网页文本自动生成表达农业实体关系或属性的三元组,形成农业知识图谱;所述的问题样本处理单元用以通过网络爬虫挖掘农业问答社区网站、农业百科垂直网站、百科知道类网站的农业相关问题,形成问题样本集,并通过众包形式的分析与审核,找到可以映射为知识图谱中关系或属性的问题,形成问题样本集;所述的问题模板训练单元用以对问题样本进行命名实体识别、实体链接、替换命名实体指称、去除停用词、分词、词性标注和句法树构建等的预处理,并借助机器学习或审核的方法找到句法树中的特定句法子树以及句法子树的谓词指称部分,形成拓扑结构与结构中谓词指称部分的映射关系,这种映射关系即为一种问题模板,形成问题模板集合,所述特定句法子树被称为一种拓扑结构;所述的同义词集合生成单元用以分析问题样本处理单元形成的问题样本集,找到知识图谱中某个属性或关系所对应的一类问题样本,并对这类问题样本进行命名实体识别后,去除实体指称,再将剩余部分进行分词、去除停用词操作,得到仅含有关键字的精简问题样例,并把属于这些精简问题样例的关键字合并为一个集合,从而得到一个同义词集合,每一个同义词集合对应知识图谱中的一个关系或属性。
6.如权利要求4所述的农业百科问答系统,其特征在于,所述的在线模块包括I/O单元、命名实体识别单元、问句预处理单元、问题模板匹配单元、答案检索单元、FAQ问题库答案获取单元和答案处理单元,所述的I/O单元用于接受用户输入的问题并展示检索答案给用户,所述的命名实体识别单元用于识别问句中的实体指称部分、并将实体指称与知识图谱的实体进行链接,所述的问句预处理单元用以将问句中的实体指称以通配符替换、并对问句进行分词和去除停用词,所述的问题模板匹配单元用以对预处理后的问句进行词性标注并生成句法树、根据句法树在问题模板库中检索匹配的问题模板并确定问句的谓词指称部分、根据问句的谓词指称词组检索匹配的同义词集合并确定同义词集合映射的知识图谱关系或属性,所述的答案检索单元用以根据识别出的问题实体和属性/关系组成结构化查询语句、并根据结构化查询语句在知识图谱中检索对应的三元组后返回答案实体,所述的FAQ问题库答案获取单元用于从FAQ问题库获取问题的答案,所述的答案处理单元用以根据问句的谓词指称与同义词集合的相似度计算答案可信度、计算问句与FAQ问题库中常问问题的相似度作为答案可信度。
CN201810392883.3A 2018-04-27 2018-04-27 一种基于知识图谱的问答方法及农业百科问答系统 Active CN108804521B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810392883.3A CN108804521B (zh) 2018-04-27 2018-04-27 一种基于知识图谱的问答方法及农业百科问答系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810392883.3A CN108804521B (zh) 2018-04-27 2018-04-27 一种基于知识图谱的问答方法及农业百科问答系统

Publications (2)

Publication Number Publication Date
CN108804521A true CN108804521A (zh) 2018-11-13
CN108804521B CN108804521B (zh) 2021-05-14

Family

ID=64093054

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810392883.3A Active CN108804521B (zh) 2018-04-27 2018-04-27 一种基于知识图谱的问答方法及农业百科问答系统

Country Status (1)

Country Link
CN (1) CN108804521B (zh)

Cited By (75)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109284342A (zh) * 2018-11-22 2019-01-29 北京百度网讯科技有限公司 用于输出信息的方法和装置
CN109299289A (zh) * 2018-11-30 2019-02-01 国信优易数据有限公司 一种查询图构建方法、装置、电子设备及计算机存储介质
CN109598384A (zh) * 2018-12-06 2019-04-09 同方知网(北京)技术有限公司 一种农业产业创新服务图谱构建系统
CN109670033A (zh) * 2019-02-01 2019-04-23 青岛海信电器股份有限公司 内容的检索方法、装置、设备及存储介质
CN109766453A (zh) * 2019-01-18 2019-05-17 广东小天才科技有限公司 一种用户语料语义理解的方法及系统
CN109766551A (zh) * 2019-01-08 2019-05-17 广东小天才科技有限公司 一种多义词语义的确定方法和系统
CN109783775A (zh) * 2019-01-18 2019-05-21 广东小天才科技有限公司 一种标记用户语料的内容的方法及系统
CN109800291A (zh) * 2018-12-12 2019-05-24 平安科技(深圳)有限公司 问题应答方法及装置、电子设备和存储介质
CN109886294A (zh) * 2019-01-11 2019-06-14 平安科技(深圳)有限公司 知识融合方法、装置、计算机设备和存储介质
CN109947916A (zh) * 2019-03-01 2019-06-28 河北尚云信息科技有限公司 基于气象领域知识图谱的问答系统装置及问答方法
CN110019844A (zh) * 2019-02-20 2019-07-16 众安信息技术服务有限公司 一种保险行业知识图谱问答系统构建方法及装置
CN110083690A (zh) * 2019-04-10 2019-08-02 华侨大学 一种基于智能问答的对外汉语口语训练方法及系统
CN110134775A (zh) * 2019-05-10 2019-08-16 中国联合网络通信集团有限公司 问答数据生成方法及装置、存储介质
CN110147437A (zh) * 2019-05-23 2019-08-20 北京金山数字娱乐科技有限公司 一种基于知识图谱的搜索方法及装置
CN110209839A (zh) * 2019-06-18 2019-09-06 卓尔智联(武汉)研究院有限公司 农业知识图谱构建装置、方法及计算机可读存储介质
CN110222165A (zh) * 2019-06-14 2019-09-10 言图科技有限公司 基于即时聊天实现员工日常管理的方法和系统
CN110309321A (zh) * 2019-07-10 2019-10-08 电子科技大学 一种基于图谱表示学习的知识表示学习方法
CN110334272A (zh) * 2019-05-29 2019-10-15 平安科技(深圳)有限公司 基于知识图谱的智能问答方法、装置及计算机存储介质
CN110347803A (zh) * 2019-07-18 2019-10-18 北京百度网讯科技有限公司 获得阅读理解素材的方法和装置、电子设备、可读介质
CN110399457A (zh) * 2019-07-01 2019-11-01 吉林大学 一种智能问答方法和系统
CN110413636A (zh) * 2019-08-01 2019-11-05 北京香侬慧语科技有限责任公司 一种数据处理方法和装置
CN110413732A (zh) * 2019-07-16 2019-11-05 扬州大学 面向软件缺陷知识的知识搜索方法
CN110457487A (zh) * 2019-07-10 2019-11-15 北京邮电大学 专利知识图谱的构建方法及装置
CN110489538A (zh) * 2019-08-27 2019-11-22 腾讯科技(深圳)有限公司 基于人工智能的语句应答方法、装置及电子设备
CN110489513A (zh) * 2019-06-24 2019-11-22 覃立万 一种智能机器人社交信息处理方法及与人的社交系统
CN110532362A (zh) * 2019-08-20 2019-12-03 北京齐尔布莱特科技有限公司 基于产品使用手册的问答方法、装置及计算设备
CN110555153A (zh) * 2019-08-20 2019-12-10 暨南大学 一种基于领域知识图谱的问答系统及其构建方法
CN110674274A (zh) * 2019-09-23 2020-01-10 中国农业大学 一种针对食品安全法规问答系统的知识图谱构建方法
CN110727779A (zh) * 2019-10-16 2020-01-24 信雅达系统工程股份有限公司 基于多模型融合的问答方法及系统
CN110909140A (zh) * 2019-11-13 2020-03-24 国网江苏省电力有限公司电力科学研究院 一种图谱问答与检索问答结合的中枢路由方法及装置
CN110991183A (zh) * 2019-12-06 2020-04-10 北京百度网讯科技有限公司 问题的谓词确定方法、装置、设备及存储介质
CN110990527A (zh) * 2019-11-26 2020-04-10 泰康保险集团股份有限公司 自动问答方法及装置、存储介质及电子设备
CN111104504A (zh) * 2019-12-25 2020-05-05 天津中科智能识别产业技术研究院有限公司 一种基于自然语言处理和知识图谱的对话方法
CN111125150A (zh) * 2019-12-26 2020-05-08 成都航天科工大数据研究院有限公司 一种工业领域问答系统检索方法
CN111177345A (zh) * 2019-12-19 2020-05-19 中国平安财产保险股份有限公司 基于知识图谱的智能问答方法、装置和计算机设备
CN111241839A (zh) * 2020-01-16 2020-06-05 腾讯科技(深圳)有限公司 实体识别方法、装置、计算机可读存储介质和计算机设备
CN111291192A (zh) * 2020-01-15 2020-06-16 北京百度网讯科技有限公司 知识图谱中三元组置信度计算方法和装置
CN111309863A (zh) * 2020-02-10 2020-06-19 北京声智科技有限公司 基于知识图谱的自然语言问答方法及装置
CN111339267A (zh) * 2020-02-17 2020-06-26 京东方科技集团股份有限公司 基于知识图谱的问答方法及系统、计算机设备及介质
CN111400395A (zh) * 2020-02-17 2020-07-10 浙江大学 一种基于分布式账本的知识图谱众包平台
CN111488441A (zh) * 2020-04-08 2020-08-04 北京百度网讯科技有限公司 问题解析方法、装置、知识图谱问答系统和电子设备
CN111522910A (zh) * 2020-04-14 2020-08-11 浙江大学 一种基于文物知识图谱的智能语义检索方法
CN111581365A (zh) * 2020-05-07 2020-08-25 北京理工大学 一种谓词抽取方法
CN111708869A (zh) * 2020-05-12 2020-09-25 北京明略软件系统有限公司 人机对话的处理方法及装置
CN111708800A (zh) * 2020-05-27 2020-09-25 北京百度网讯科技有限公司 查询方法、装置及电子设备
CN111753063A (zh) * 2020-02-28 2020-10-09 北京沃东天骏信息技术有限公司 一种应答方法、装置、服务器及存储介质
CN111767334A (zh) * 2020-06-30 2020-10-13 北京百度网讯科技有限公司 信息抽取方法、装置、电子设备及存储介质
CN111831794A (zh) * 2020-07-10 2020-10-27 杭州叙简科技股份有限公司 一种基于知识图谱的综合管廊行业知识问答系统构建方法
CN111930959A (zh) * 2020-07-14 2020-11-13 上海明略人工智能(集团)有限公司 用于图谱知识生成文本的方法与装置
CN111930913A (zh) * 2020-08-14 2020-11-13 上海茂声智能科技有限公司 一种基于知识图谱的问答方法、系统、装置、设备及介质
CN111949758A (zh) * 2019-05-16 2020-11-17 北大医疗信息技术有限公司 医疗问答推荐方法、推荐系统和计算机可读存储介质
CN112052311A (zh) * 2019-05-20 2020-12-08 天津科技大学 一种基于词向量技术和知识图谱检索的短文本问答方法及装置
CN112182180A (zh) * 2020-09-27 2021-01-05 京东方科技集团股份有限公司 问答处理的方法、电子设备、计算机可读介质
CN112199508A (zh) * 2020-08-10 2021-01-08 淮阴工学院 一种基于远程监督的参数自适应农业知识图谱推荐方法
CN112214590A (zh) * 2020-10-20 2021-01-12 重庆邮电大学 一种基于知识图谱的子图匹配自然问答方法
CN112231460A (zh) * 2020-10-27 2021-01-15 中国科学院合肥物质科学研究院 一种基于农业百科知识图谱的问答系统的构建方法
CN112287669A (zh) * 2020-12-28 2021-01-29 深圳追一科技有限公司 文本处理方法、装置、计算机设备和存储介质
CN112328762A (zh) * 2020-11-04 2021-02-05 平安科技(深圳)有限公司 基于文本生成模型的问答语料生成方法和装置
CN112434200A (zh) * 2020-11-30 2021-03-02 北京思特奇信息技术股份有限公司 一种数据展示方法、系统及电子设备
CN112445899A (zh) * 2019-08-29 2021-03-05 南京大学 一种基于神经网络的知识库问答中的属性匹配方法
CN112541085A (zh) * 2020-12-07 2021-03-23 北京左医科技有限公司 问卷的结构化方法、问卷的结构化装置及存储介质
WO2021053457A1 (en) * 2019-09-18 2021-03-25 International Business Machines Corporation Language statement processing in computing system
CN112685434A (zh) * 2020-12-21 2021-04-20 福建新大陆软件工程有限公司 一种基于知识图谱的运维问答方法
CN112966087A (zh) * 2021-03-15 2021-06-15 中国美术学院 一种灵感素材的智能问答系统及方法
CN113590783A (zh) * 2021-07-28 2021-11-02 复旦大学 基于nlp自然语言处理的中医养生智能问答系统
CN114090759A (zh) * 2022-01-19 2022-02-25 北京中科深智科技有限公司 一种基于知识库的电商直播实时问答系统和方法
CN114153993A (zh) * 2022-02-07 2022-03-08 杭州远传新业科技有限公司 一种用于智能问答的知识图谱自动化构建方法及系统
TWI759598B (zh) * 2019-05-20 2022-04-01 南一書局企業股份有限公司 綜合學生習題發問頻率以整合回應的智能客服系統
CN114417387A (zh) * 2022-01-24 2022-04-29 中国电子科技集团公司第五十四研究所 基于语义内涵的消息加密方法
CN114579710A (zh) * 2022-03-15 2022-06-03 西南交通大学 一种高速列车问题查询模板生成方法
CN114860917A (zh) * 2022-07-06 2022-08-05 中化现代农业有限公司 农业知识问答方法、装置、电子设备和存储介质
CN116028597A (zh) * 2023-03-27 2023-04-28 南京燧坤智能科技有限公司 对象检索方法、装置、非易失性存储介质及计算机设备
CN116167605A (zh) * 2023-04-26 2023-05-26 北京中关村科金技术有限公司 业务流程生成方法、装置、设备及介质
CN117194647A (zh) * 2023-11-03 2023-12-08 深圳墨影科技有限公司 一种用于离线环境的智能问答系统、方法及装置
CN112434200B (zh) * 2020-11-30 2024-06-04 北京思特奇信息技术股份有限公司 一种数据展示方法、系统及电子设备

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115795018B (zh) * 2023-02-13 2023-05-09 广州海昇计算机科技有限公司 一种面向电网领域的多策略智能搜索问答方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010034015A1 (en) * 2000-02-11 2001-10-25 Raichur Arvind A. Network based anonymous question and answer system
CN104050256A (zh) * 2014-06-13 2014-09-17 西安蒜泥电子科技有限责任公司 基于主动学习的问答方法及采用该方法的问答系统
CN105868313A (zh) * 2016-03-25 2016-08-17 浙江大学 一种基于模板匹配技术的知识图谱问答系统及方法
CN106909662A (zh) * 2017-02-27 2017-06-30 腾讯科技(上海)有限公司 知识图谱构建方法及装置
CN107451276A (zh) * 2017-08-05 2017-12-08 龙飞 一种基于深度学习的智能自助导游系统及其方法
CN107766483A (zh) * 2017-10-13 2018-03-06 华中科技大学 一种基于知识图谱的交互式问答方法及系统
CN107885842A (zh) * 2017-11-10 2018-04-06 上海智臻智能网络科技股份有限公司 智能问答的方法、装置、服务器及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010034015A1 (en) * 2000-02-11 2001-10-25 Raichur Arvind A. Network based anonymous question and answer system
CN104050256A (zh) * 2014-06-13 2014-09-17 西安蒜泥电子科技有限责任公司 基于主动学习的问答方法及采用该方法的问答系统
CN105868313A (zh) * 2016-03-25 2016-08-17 浙江大学 一种基于模板匹配技术的知识图谱问答系统及方法
CN106909662A (zh) * 2017-02-27 2017-06-30 腾讯科技(上海)有限公司 知识图谱构建方法及装置
CN107451276A (zh) * 2017-08-05 2017-12-08 龙飞 一种基于深度学习的智能自助导游系统及其方法
CN107766483A (zh) * 2017-10-13 2018-03-06 华中科技大学 一种基于知识图谱的交互式问答方法及系统
CN107885842A (zh) * 2017-11-10 2018-04-06 上海智臻智能网络科技股份有限公司 智能问答的方法、装置、服务器及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ZHOU ZHAO.ETC: "Expert Finding for Question Answering via GraphRegularized Matrix Completion", 《TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERIN》 *
康准等: "基于知识图谱的生物学科知识问答系统", 《软件》 *

Cited By (117)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109284342A (zh) * 2018-11-22 2019-01-29 北京百度网讯科技有限公司 用于输出信息的方法和装置
CN109299289B (zh) * 2018-11-30 2021-04-06 国信优易数据股份有限公司 一种查询图构建方法、装置、电子设备及计算机存储介质
CN109299289A (zh) * 2018-11-30 2019-02-01 国信优易数据有限公司 一种查询图构建方法、装置、电子设备及计算机存储介质
CN109598384A (zh) * 2018-12-06 2019-04-09 同方知网(北京)技术有限公司 一种农业产业创新服务图谱构建系统
CN109800291A (zh) * 2018-12-12 2019-05-24 平安科技(深圳)有限公司 问题应答方法及装置、电子设备和存储介质
CN109800291B (zh) * 2018-12-12 2024-03-15 平安科技(深圳)有限公司 问题应答方法及装置、电子设备和存储介质
CN109766551A (zh) * 2019-01-08 2019-05-17 广东小天才科技有限公司 一种多义词语义的确定方法和系统
CN109886294A (zh) * 2019-01-11 2019-06-14 平安科技(深圳)有限公司 知识融合方法、装置、计算机设备和存储介质
CN109886294B (zh) * 2019-01-11 2024-01-23 平安科技(深圳)有限公司 知识融合方法、装置、计算机设备和存储介质
CN109783775A (zh) * 2019-01-18 2019-05-21 广东小天才科技有限公司 一种标记用户语料的内容的方法及系统
CN109783775B (zh) * 2019-01-18 2023-07-28 广东小天才科技有限公司 一种标记用户语料的内容的方法及系统
CN109766453A (zh) * 2019-01-18 2019-05-17 广东小天才科技有限公司 一种用户语料语义理解的方法及系统
CN109670033A (zh) * 2019-02-01 2019-04-23 青岛海信电器股份有限公司 内容的检索方法、装置、设备及存储介质
CN110019844A (zh) * 2019-02-20 2019-07-16 众安信息技术服务有限公司 一种保险行业知识图谱问答系统构建方法及装置
CN109947916A (zh) * 2019-03-01 2019-06-28 河北尚云信息科技有限公司 基于气象领域知识图谱的问答系统装置及问答方法
CN109947916B (zh) * 2019-03-01 2023-08-08 河北尚云信息科技有限公司 基于气象领域知识图谱的问答系统装置及问答方法
CN110083690A (zh) * 2019-04-10 2019-08-02 华侨大学 一种基于智能问答的对外汉语口语训练方法及系统
CN110083690B (zh) * 2019-04-10 2022-05-03 华侨大学 一种基于智能问答的对外汉语口语训练方法及系统
CN110134775A (zh) * 2019-05-10 2019-08-16 中国联合网络通信集团有限公司 问答数据生成方法及装置、存储介质
CN111949758A (zh) * 2019-05-16 2020-11-17 北大医疗信息技术有限公司 医疗问答推荐方法、推荐系统和计算机可读存储介质
CN112052311A (zh) * 2019-05-20 2020-12-08 天津科技大学 一种基于词向量技术和知识图谱检索的短文本问答方法及装置
TWI759598B (zh) * 2019-05-20 2022-04-01 南一書局企業股份有限公司 綜合學生習題發問頻率以整合回應的智能客服系統
CN110147437B (zh) * 2019-05-23 2022-09-02 北京金山数字娱乐科技有限公司 一种基于知识图谱的搜索方法及装置
CN110147437A (zh) * 2019-05-23 2019-08-20 北京金山数字娱乐科技有限公司 一种基于知识图谱的搜索方法及装置
CN110334272B (zh) * 2019-05-29 2022-04-12 平安科技(深圳)有限公司 基于知识图谱的智能问答方法、装置及计算机存储介质
CN110334272A (zh) * 2019-05-29 2019-10-15 平安科技(深圳)有限公司 基于知识图谱的智能问答方法、装置及计算机存储介质
CN110222165A (zh) * 2019-06-14 2019-09-10 言图科技有限公司 基于即时聊天实现员工日常管理的方法和系统
CN110222165B (zh) * 2019-06-14 2021-10-26 言图科技有限公司 基于即时聊天实现员工日常管理的方法和系统
CN110209839A (zh) * 2019-06-18 2019-09-06 卓尔智联(武汉)研究院有限公司 农业知识图谱构建装置、方法及计算机可读存储介质
CN110209839B (zh) * 2019-06-18 2021-07-27 卓尔智联(武汉)研究院有限公司 农业知识图谱构建装置、方法及计算机可读存储介质
CN110489513A (zh) * 2019-06-24 2019-11-22 覃立万 一种智能机器人社交信息处理方法及与人的社交系统
CN110399457A (zh) * 2019-07-01 2019-11-01 吉林大学 一种智能问答方法和系统
CN110399457B (zh) * 2019-07-01 2023-02-03 吉林大学 一种智能问答方法和系统
CN110309321B (zh) * 2019-07-10 2021-05-18 电子科技大学 一种基于图谱表示学习的知识表示学习方法
CN110309321A (zh) * 2019-07-10 2019-10-08 电子科技大学 一种基于图谱表示学习的知识表示学习方法
CN110457487A (zh) * 2019-07-10 2019-11-15 北京邮电大学 专利知识图谱的构建方法及装置
CN110413732A (zh) * 2019-07-16 2019-11-05 扬州大学 面向软件缺陷知识的知识搜索方法
CN110413732B (zh) * 2019-07-16 2023-11-24 扬州大学 面向软件缺陷知识的知识搜索方法
WO2021008180A1 (zh) * 2019-07-16 2021-01-21 扬州大学 面向软件缺陷知识的知识搜索方法
CN110347803A (zh) * 2019-07-18 2019-10-18 北京百度网讯科技有限公司 获得阅读理解素材的方法和装置、电子设备、可读介质
CN110413636A (zh) * 2019-08-01 2019-11-05 北京香侬慧语科技有限责任公司 一种数据处理方法和装置
CN110555153A (zh) * 2019-08-20 2019-12-10 暨南大学 一种基于领域知识图谱的问答系统及其构建方法
CN110532362A (zh) * 2019-08-20 2019-12-03 北京齐尔布莱特科技有限公司 基于产品使用手册的问答方法、装置及计算设备
CN110532362B (zh) * 2019-08-20 2022-06-10 北京齐尔布莱特科技有限公司 基于产品使用手册的问答方法、装置及计算设备
CN110489538B (zh) * 2019-08-27 2020-12-25 腾讯科技(深圳)有限公司 基于人工智能的语句应答方法、装置及电子设备
CN110489538A (zh) * 2019-08-27 2019-11-22 腾讯科技(深圳)有限公司 基于人工智能的语句应答方法、装置及电子设备
CN112445899A (zh) * 2019-08-29 2021-03-05 南京大学 一种基于神经网络的知识库问答中的属性匹配方法
CN112445899B (zh) * 2019-08-29 2024-05-03 南京大学 一种基于神经网络的知识库问答中的属性匹配方法
US11379738B2 (en) 2019-09-18 2022-07-05 International Business Machines Corporation Using higher order actions to annotate a syntax tree with real data for concepts used to generate an answer to a question
US11842290B2 (en) 2019-09-18 2023-12-12 International Business Machines Corporation Using functions to annotate a syntax tree with real data used to generate an answer to a question
WO2021053457A1 (en) * 2019-09-18 2021-03-25 International Business Machines Corporation Language statement processing in computing system
GB2602238A (en) * 2019-09-18 2022-06-22 Ibm Language statement processing in computing system
CN110674274A (zh) * 2019-09-23 2020-01-10 中国农业大学 一种针对食品安全法规问答系统的知识图谱构建方法
CN110674274B (zh) * 2019-09-23 2022-07-01 中国农业大学 一种针对食品安全法规问答系统的知识图谱构建方法
CN110727779A (zh) * 2019-10-16 2020-01-24 信雅达系统工程股份有限公司 基于多模型融合的问答方法及系统
CN110909140B (zh) * 2019-11-13 2022-08-23 国网江苏省电力有限公司电力科学研究院 一种图谱问答与检索问答结合的中枢路由方法及装置
CN110909140A (zh) * 2019-11-13 2020-03-24 国网江苏省电力有限公司电力科学研究院 一种图谱问答与检索问答结合的中枢路由方法及装置
CN110990527A (zh) * 2019-11-26 2020-04-10 泰康保险集团股份有限公司 自动问答方法及装置、存储介质及电子设备
CN110991183A (zh) * 2019-12-06 2020-04-10 北京百度网讯科技有限公司 问题的谓词确定方法、装置、设备及存储介质
CN111177345A (zh) * 2019-12-19 2020-05-19 中国平安财产保险股份有限公司 基于知识图谱的智能问答方法、装置和计算机设备
CN111104504A (zh) * 2019-12-25 2020-05-05 天津中科智能识别产业技术研究院有限公司 一种基于自然语言处理和知识图谱的对话方法
CN111125150B (zh) * 2019-12-26 2023-12-26 成都航天科工大数据研究院有限公司 一种工业领域问答系统检索方法
CN111125150A (zh) * 2019-12-26 2020-05-08 成都航天科工大数据研究院有限公司 一种工业领域问答系统检索方法
CN111291192A (zh) * 2020-01-15 2020-06-16 北京百度网讯科技有限公司 知识图谱中三元组置信度计算方法和装置
CN111291192B (zh) * 2020-01-15 2023-08-25 北京百度网讯科技有限公司 知识图谱中三元组置信度计算方法和装置
CN111241839A (zh) * 2020-01-16 2020-06-05 腾讯科技(深圳)有限公司 实体识别方法、装置、计算机可读存储介质和计算机设备
CN111309863B (zh) * 2020-02-10 2020-12-18 北京声智科技有限公司 基于知识图谱的自然语言问答方法及装置
CN111309863A (zh) * 2020-02-10 2020-06-19 北京声智科技有限公司 基于知识图谱的自然语言问答方法及装置
CN111339267A (zh) * 2020-02-17 2020-06-26 京东方科技集团股份有限公司 基于知识图谱的问答方法及系统、计算机设备及介质
CN111400395B (zh) * 2020-02-17 2023-06-13 浙江大学 一种基于分布式账本的知识图谱众包平台
CN111400395A (zh) * 2020-02-17 2020-07-10 浙江大学 一种基于分布式账本的知识图谱众包平台
CN111753063A (zh) * 2020-02-28 2020-10-09 北京沃东天骏信息技术有限公司 一种应答方法、装置、服务器及存储介质
CN111488441A (zh) * 2020-04-08 2020-08-04 北京百度网讯科技有限公司 问题解析方法、装置、知识图谱问答系统和电子设备
CN111522910A (zh) * 2020-04-14 2020-08-11 浙江大学 一种基于文物知识图谱的智能语义检索方法
CN111581365B (zh) * 2020-05-07 2023-04-25 北京理工大学 一种谓词抽取方法
CN111581365A (zh) * 2020-05-07 2020-08-25 北京理工大学 一种谓词抽取方法
CN111708869B (zh) * 2020-05-12 2023-07-14 北京明略软件系统有限公司 人机对话的处理方法及装置
CN111708869A (zh) * 2020-05-12 2020-09-25 北京明略软件系统有限公司 人机对话的处理方法及装置
CN111708800A (zh) * 2020-05-27 2020-09-25 北京百度网讯科技有限公司 查询方法、装置及电子设备
CN111767334A (zh) * 2020-06-30 2020-10-13 北京百度网讯科技有限公司 信息抽取方法、装置、电子设备及存储介质
CN111767334B (zh) * 2020-06-30 2023-07-25 北京百度网讯科技有限公司 信息抽取方法、装置、电子设备及存储介质
CN111831794A (zh) * 2020-07-10 2020-10-27 杭州叙简科技股份有限公司 一种基于知识图谱的综合管廊行业知识问答系统构建方法
CN111930959A (zh) * 2020-07-14 2020-11-13 上海明略人工智能(集团)有限公司 用于图谱知识生成文本的方法与装置
CN111930959B (zh) * 2020-07-14 2024-02-09 上海明略人工智能(集团)有限公司 用于图谱知识生成文本的方法与装置
CN112199508B (zh) * 2020-08-10 2024-01-19 淮阴工学院 一种基于远程监督的参数自适应农业知识图谱推荐方法
CN112199508A (zh) * 2020-08-10 2021-01-08 淮阴工学院 一种基于远程监督的参数自适应农业知识图谱推荐方法
CN111930913A (zh) * 2020-08-14 2020-11-13 上海茂声智能科技有限公司 一种基于知识图谱的问答方法、系统、装置、设备及介质
CN112182180A (zh) * 2020-09-27 2021-01-05 京东方科技集团股份有限公司 问答处理的方法、电子设备、计算机可读介质
CN112214590A (zh) * 2020-10-20 2021-01-12 重庆邮电大学 一种基于知识图谱的子图匹配自然问答方法
CN112231460B (zh) * 2020-10-27 2022-07-12 中国科学院合肥物质科学研究院 一种基于农业百科知识图谱的问答系统的构建方法
CN112231460A (zh) * 2020-10-27 2021-01-15 中国科学院合肥物质科学研究院 一种基于农业百科知识图谱的问答系统的构建方法
CN112328762A (zh) * 2020-11-04 2021-02-05 平安科技(深圳)有限公司 基于文本生成模型的问答语料生成方法和装置
CN112328762B (zh) * 2020-11-04 2023-12-19 平安科技(深圳)有限公司 基于文本生成模型的问答语料生成方法和装置
CN112434200A (zh) * 2020-11-30 2021-03-02 北京思特奇信息技术股份有限公司 一种数据展示方法、系统及电子设备
CN112434200B (zh) * 2020-11-30 2024-06-04 北京思特奇信息技术股份有限公司 一种数据展示方法、系统及电子设备
CN112541085B (zh) * 2020-12-07 2021-08-24 北京左医科技有限公司 问卷的结构化方法、问卷的结构化装置及存储介质
CN112541085A (zh) * 2020-12-07 2021-03-23 北京左医科技有限公司 问卷的结构化方法、问卷的结构化装置及存储介质
CN112685434A (zh) * 2020-12-21 2021-04-20 福建新大陆软件工程有限公司 一种基于知识图谱的运维问答方法
CN112287669A (zh) * 2020-12-28 2021-01-29 深圳追一科技有限公司 文本处理方法、装置、计算机设备和存储介质
CN112287669B (zh) * 2020-12-28 2021-05-25 深圳追一科技有限公司 文本处理方法、装置、计算机设备和存储介质
CN112966087A (zh) * 2021-03-15 2021-06-15 中国美术学院 一种灵感素材的智能问答系统及方法
CN112966087B (zh) * 2021-03-15 2023-10-13 中国美术学院 一种灵感素材的智能问答系统及方法
CN113590783B (zh) * 2021-07-28 2023-10-03 复旦大学 基于nlp自然语言处理的中医养生智能问答系统
CN113590783A (zh) * 2021-07-28 2021-11-02 复旦大学 基于nlp自然语言处理的中医养生智能问答系统
CN114090759A (zh) * 2022-01-19 2022-02-25 北京中科深智科技有限公司 一种基于知识库的电商直播实时问答系统和方法
CN114417387A (zh) * 2022-01-24 2022-04-29 中国电子科技集团公司第五十四研究所 基于语义内涵的消息加密方法
CN114417387B (zh) * 2022-01-24 2023-09-22 中国电子科技集团公司第五十四研究所 基于语义内涵的消息加密方法
CN114153993A (zh) * 2022-02-07 2022-03-08 杭州远传新业科技有限公司 一种用于智能问答的知识图谱自动化构建方法及系统
CN114579710B (zh) * 2022-03-15 2023-04-25 西南交通大学 一种高速列车问题查询模板生成方法
CN114579710A (zh) * 2022-03-15 2022-06-03 西南交通大学 一种高速列车问题查询模板生成方法
CN114860917B (zh) * 2022-07-06 2022-10-18 中化现代农业有限公司 农业知识问答方法、装置、电子设备和存储介质
CN114860917A (zh) * 2022-07-06 2022-08-05 中化现代农业有限公司 农业知识问答方法、装置、电子设备和存储介质
CN116028597A (zh) * 2023-03-27 2023-04-28 南京燧坤智能科技有限公司 对象检索方法、装置、非易失性存储介质及计算机设备
CN116028597B (zh) * 2023-03-27 2023-07-21 南京燧坤智能科技有限公司 对象检索方法、装置、非易失性存储介质及计算机设备
CN116167605A (zh) * 2023-04-26 2023-05-26 北京中关村科金技术有限公司 业务流程生成方法、装置、设备及介质
CN117194647A (zh) * 2023-11-03 2023-12-08 深圳墨影科技有限公司 一种用于离线环境的智能问答系统、方法及装置
CN117194647B (zh) * 2023-11-03 2024-02-20 深圳墨影科技有限公司 一种用于离线环境的智能问答系统、方法及装置

Also Published As

Publication number Publication date
CN108804521B (zh) 2021-05-14

Similar Documents

Publication Publication Date Title
CN108804521A (zh) 一种基于知识图谱的问答方法及农业百科问答系统
CN110825881B (zh) 一种建立电力知识图谱的方法
CN110377715A (zh) 基于法律知识图谱的推理式精准智能问答方法
CN109284363A (zh) 一种问答方法、装置、电子设备及存储介质
CN108717433A (zh) 一种面向程序设计领域问答系统的知识库构建方法及装置
CN106776797A (zh) 一种基于本体推理的知识问答系统及其工作方法
CN105045875B (zh) 个性化信息检索方法及装置
CN107609052A (zh) 一种基于语义三角的领域知识图谱的生成方法及装置
CN111881290A (zh) 一种基于加权语义相似度的配网多源网架实体融合方法
CN108304372A (zh) 实体提取方法和装置、计算机设备和存储介质
CN102866990A (zh) 一种主题对话方法和装置
CN106991161A (zh) 一种自动生成开放式问题答案的方法
CN101118554A (zh) 智能交互式问答系统及其处理方法
CN117271767B (zh) 基于多智能体的运维知识库的建立方法
CN114218402B (zh) 一种计算机硬件故障更换件推荐的方法
CN116737967B (zh) 一种基于自然语言的知识图谱构建和完善系统及方法
CN112507076A (zh) 一种语义分析搜索方法、装置及存储介质
Zhao RETRACTED ARTICLE: Application of deep learning algorithm in college English teaching process evaluation
CN112685440B (zh) 标记搜索语义角色的结构化查询信息表达方法
CN116628173B (zh) 一种基于关键字提取的智能客服信息生成系统及生成方法
CN117494760A (zh) 一种基于超大规模语言模型的富语义标签数据增广方法
CN115905187B (zh) 一种面向云计算工程技术人员认证的智能化命题系统
CN117473054A (zh) 基于知识图谱的通用智能问答方法及装置
Nguyen et al. Grammatical evolution to mine OWL disjointness axioms involving complex concept expressions
CN116049376A (zh) 一种信创知识检索回复的方法、装置和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant