CN107748757B - 一种基于知识图谱的问答方法 - Google Patents
一种基于知识图谱的问答方法 Download PDFInfo
- Publication number
- CN107748757B CN107748757B CN201710858596.2A CN201710858596A CN107748757B CN 107748757 B CN107748757 B CN 107748757B CN 201710858596 A CN201710858596 A CN 201710858596A CN 107748757 B CN107748757 B CN 107748757B
- Authority
- CN
- China
- Prior art keywords
- entity
- question
- candidate
- relation
- entities
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种基于知识图谱的问答方法。本发明提供的一种基于知识图谱的问答方法由主体实体匹配,关系匹配以及答案确定来实现。主题实体匹配主要包括命名实体识别和实体链接两个部分。命名实体识别旨在识别自然语言问句q中人名、地名、组织机构名等命名实体。实体链接将识别出的命名实体对应到知识库中的某一个实体上,即找到三元组中的实体s,关系匹配是通过自然语言理解技术理解问句q所表达的语义,并且与搜索空间中三元组(s,p,o)中的关系p进行匹配,以此确定问句所表达的语义及其与知识库中对应的关系。通过实体识别和实体链接得到候选主题实体,关系匹配能够得到候选关系,由此得到若干候选三元组,答案确定需要根据实体识别得分,关系匹配得分等特征对这些候选三元组进行排序,确定最后答案。
Description
技术领域
本发明涉及一种检索方法,尤其涉及一种基于知识图谱的问答方法。
背景技术
问答系统(Question Answering System,QA)是信息检索系统的一种高级形式。它能用准确、简洁的自然语言回答用户用自然语言提出的问题。其研究兴起的主要原因是人们对快速、准确地获取信息的需求。问答系统是目前人工智能和自然语言处理领域中一个倍受关注并具有广泛发展前景的研究方向。
上世纪五六十年代计算机诞生的初期,人们对问答系统就有所研究与尝试。其中有代表性的包括Baseball和Lunar,但早期的系统多是针对特定领域设计,数据规模比较小,语义理解能力较弱。总体来说,系统功能有限,很难被广泛引用。
随着大规模网络数据资源的出现,尤其是知识图谱的出现,使得基于知识图谱的问答系统更加智能化,知识库是一种储存复杂结构化信息的新型技术。知识库中存储了大量事实型知识,其内部使用知识图谱(knowledge graph)模型对实体及实体间的关系间的关系信息进行建模。如今,知识库多以RDF(Resource Description Framework)的格式存储数据,一条事实(fact)被表示为一个(S,P,O)三元组,形如(subject,predicate,object),其中主体(subject)和客体(object)为命名实体,客体(object)有时会是属性值,述语(predicate)是主体(subject)和客体(object)间的关系。目前基于知识图谱的问答方法在国内外的研究中大致可以被分为两类,基于语义解析的知识库问答方法、基于信息抽取的知识库问答方法。
基于语义解析的知识库问答方法的核心在于自然语言问句的形式化表示,即将自然语言问句转化为某种基于符号的逻辑表达式,比如lambda-DCS(基于依赖关系的语义标注),再转化为知识库查询语言比如SPARQL查询知识库得到答案。此种方法通常会利用监督学习的方法训练出一个语义解析器,来生成自然语言问句的候选逻辑表达式,之后利用基于模板的方式抽取大量文本中表示关系的表达,提出匹配算法来构建知识库中的表达与自然语言表达的匹配,逻辑表达式转换为知识库中的表达后即可在知识库中查找到对应的答案。
基于信息抽取的知识库问答方法不使用逻辑表达式来表示问句,减少人工特征干预,直接将知识库中的事实与自然语言问句都转化为某种表达形式(比如向量),然后通过计算相似度来寻找最可能回答问句的答案。这种方法一般会利用词嵌入将单词转换为向量形式,再使用神经网络对自然语言问句进行编码,意在学习到问句不同维度的信息,编码后再同答案及答案子图的向量表示计算相似度,选择相似度高的匹配。
两者对比,基于语义解析的问答方法人工干预更多,对自然语言问句要求的形式更为严格,但是优势是对训练语料的依赖性不强。随着深度学习在自然语言处理领域的发展,基于信息抽取的问答方法是现在普遍的探索方式,这种方法的优势在于不局限于问题的严格表达,能够通过深度学习理解问句表达的语义从而找到正确的答案,但会依赖于训练数据。
随着互联网技术的发展,大规模网络数据资源的出现,人们希望从海量的互联网数据中准确、快速地获取有价值的信息,推动检索式的问答技术被广泛的应用。这种系统的主要特点是:利用信息检索以及浅层自然语言处理技术从大规模文本或网页库中抽取答案。但是这样的系统存在不少局限性:首先,检索出来的信息只是成千上万相关文件的链接,答案可能在这些文件中,也可能不在,相关信息太多,用户无法快速准确定位到所需信息。其次,检索系统通过几个关键字的组合这种浅层的语义分析,无法准确理解用户的检索意图。尤其是面对复杂的自然语言,检索系统往往会导致疏漏信息,返回错误信息,返回信息太多。这些局限性使得问答系统的效果总是差强人意。
近些年来,互联网出现越来越多的高质量知识资源,比如wikipedia,这些资源以自动或半自动的方式被利用起来,构建成为结构化的开源知识库,出现在人们的视野中,比如Freebase,Yago,DBPedia等。随着知识库的出现,对问答系统的研究也可以被分为基于信息抽取的问答系统,基于社区问答的问答系统以及基于知识库的问答系统。由于知识库中知识信息的结构优势为问答系统提供了新的研究方向。与此同时,自然语言处理随着机器学习技术的发展,取得了突飞猛进的效果,使得机器理解自然语言问句成为可能。这两方面的进步能够促进改变传统检索系统基于关键字组合和浅层语义分析的检索技术,从而以更智能的方式梳理人与信息的关系,理解用户的检索意图,有效利用知识库的信息与结构,直接提供给用户想知道的问题的答案,而不是使用户在返回的信息中自己寻找答案,从而实现更为快速准确简洁的基于知识库的问答系统。
发明内容
本发明提供一种基于知识图谱的问答方法。本发明提供了一种基于知识图谱的问答方法由主体实体匹配,关系匹配以及答案确定来实现。主题实体匹配包括命名实体识别(NER)和实体链接(EL)两个部分。命名实体识别是识别出自然语言问句q中人名、地名、组织机构名等命名实体。实体链接是将识别出的命名实体对应到知识库中的某一个实体上,即找到三元组中的实体s,关系匹配是通过自然语言理解技术理解问句q所表达的语义,并且与搜索空间中三元组(s,p,o)中的关系p进行匹配,以此确定问句所表达的语义及其与知识库中对应的关系。通过命名实体识别和实体链接得到候选主题实体,关系匹配能够得到候选关系,由此得到若干候选三元组,答案确定需要根据实体识别得分,关系匹配得分等特征对这些候选三元组进行排序,确定最后答案。
附图说明
图1为本发明的整体框架图。
图2为本发明的整体流程图。
图3为本发明中命名实体识别GRU-CRF(融合条件随机场的循环神经网络)模型图。
图4为本发明中BiGRU(双向循环神经网络)词向量表示图。
图5为本发明中关系匹配注意力机制的序列到序列模型。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
本发明提供了一种基于知识图谱的问答方法。该方法整体框架图如图1。主题实体匹配主要包括命名实体识别(NER)和实体链接(EL)两个部分。命名实体识别是识别出自然语言问句q中人名、地名、组织机构名等命名实体。实体链接是将识别出的命名实体对应到知识库中的某一个实体上,即找到三元组中的实体s,关系匹配是通过自然语言理解技术理解问句q所表达的语义,并且与搜索空间中三元组(s,p,o)中的关系p进行匹配,以此确定问句所表达的语义及其与知识库中对应的关系。通过实体识别和实体链接得到候选主题实体,关系匹配能够得到候选关系,由此得到若干候选三元组,答案确定需要根据实体识别得分,关系匹配得分等特征对这些候选三元组进行排序,确定最后答案。该方法的运行流程图如图2所示,具体步骤如下:
步骤1:用户输入自然语言问句,经过字符串预处理。
步骤2:通过命名实体模块获得问句中的命名实体词。
步骤3:通过实体链接模块,利用命名实体词查询别名词典,返回候选主题实体及其根据知名度的排名。
步骤4:得到使用实体类型代替命名实体词的问句模式(pattern),经过关系匹配模型配到问句所表达语义的知识库中的关系及其得分。
步骤5:找到候选实体和候选关系后,根据关系得分和实体排序,及其在知识库中的查找确定答案。
主体实体匹配主要包括命名实体识别和实体链接两个子任务。
命名实体识别任务是一个自然语言处理中的序列标注任务,通过序列标注识别出自然语言问句q中的命名实体词,例如,给定一个问句“where was brad pitt born”,需要识别出“brad pitt”是一个命名实体词。实体链接是将命名实体词链接到知识库中的某一个确定的实体。例如,在知识库Freebase中,将实体词“brad pitt”对应到实体实例为“m.0c6qh”这个实体的唯一标识,确定实例就可以提取出知识库中所有以“m.0c6qh”为s的三元组(s,p,o)作为答案的候选搜索空间。
命名实体识别采用基于字符和单词级别的GRU-CRF(融合条件随机场的循环神经网络)神经网络模型来识别问句q中的命名实体词。传统的序列标注问题常用条件随机场(CRF)来完成,条件随机场更多的是考虑整个句子的局部特征的线性加权组合,计算条件概率,优化整个序列,而不是每个时刻的最优值。但GRU-RNN(门控循环神经网络)比起条件随机场更能考虑到长远的上下文信息,并且具备非线性的拟合能力。所以,将门控循环神经网络与条件随机场组合起来能够结合优势,取得不错的效果。
如图3所示,GRU-CRF(融合条件随机场的循环神经网络)的输入是问句q中的单词的向量序列和字符级别的向量序列。考虑字符级别是由于实体词标注语料有限,但词表规模较大,存在很多低频词,如果只使用单词级别的向量表示可能难以得到充分的训练,所以我们考虑字符级别的特征信息;另外,很多单词词意相近,但词形相似却不同,在词表中是完全不同的词,但字符组成相似度很高。与此同时,一些单词词形相似,但词意完全不同,所以单词级别的向量也是很有价值。综上,我们使用单词级别的向量和字符级别的向量相结合来共同构造词向量,作为序列标注模型的输入。
单词级别的向量表示是直接通过查词表的嵌入(embedding)矩阵得到,矩阵中的词向量是随机初始化的。如图4表示,字符级别的单词向量表示分别通过单词每个字符正序输入的正向门控循环神经网络和逆序输入的反向门控循环神经网络最后时刻输出的向量经过拼接成为整个单词的字符级别向量表示。字符表中每个字符的初始向量是随机初始化的。
给定问句q:X=(x1,x2,···,xn),xi表示问句中的每个词,使用IOB(头部,中部,外部)标注方式标注命名实体词,”B”是命名实体词的开始,”I”表示命名实体词中,”O”表示不是命名实体词。y=(y1,y2,···,yn)表示标注的结果,标注模型得到的标注结果的得分为:
其中矩阵即为条件随机场的状态特征矩阵,Pi,j表示句子中的第j个词标被注为第i种标签的得分,表示状态转移矩阵,其元素Ai,j表示从第i种标签转移到第j种标签的得分。对于所有可能的标注结果集合Y,使用了softmax回归函数得到每种标注的概率:
模型的训练目标是最大化正确的标注序列的对数条件概率:
其中YX表示由句子X所有可能的标签序列组成的集合。在预测时,我们使用维特比算法求解最优的标注序列。
实体链接需要将命名实体词与知识库中的实体相对应起来,受到我们通过别名词典完成这部分任务。知识库中存在每个实体实例及其对应的名字和别名,获取别名信息,反向构建别名字符串到实体实例的词典用于实体链接,构建词典时,需要对别名字符串进行统一化处理,比如转化为小写字符,删去特殊字符等等。并且通过获取实体在知识库中出现的频率作为知名度对别名词典中的实体进行排序。
经过命名实体识别得到命名实体词后,我们使用命名实体词在别名词典中查找得到候选主题实体,并且根据实体的知名度选取排名前k的作为候选实体。
关系匹配是通过语义理解找到与问句语义相匹配的知识库中三元组中的关系。例如,给定一个问句”where was brad pitt born”,需要确定”where was brad pitt born”与知识库中的关系“people.person.place_of_birth”的匹配。
图5所示为基于注意力机制的序列到序列(Sequence-to-Sequence或Seq2Seq)模型,模型具体是由一个两层的LSTM(长短期记忆网络)编码器和一个有注意力机制的LSTM(长短期记忆网络)解码器组成。
给定一个问句q=(x1,x2,···,xn),解码器的输入是问句中每个单词的词向量序列,由于问句中表示实体的词对关系语义贡献度不大,并且由于扩大词表但是词频低,影响训练,所以我们考虑使用占位符“<e>”代替问句中的命名实体词。修改后q_pattern=(x1,x2,···,<e>,···,xn}。另外,根据观察,实体的类型对关系匹配起着重要的作用,例如,问句“what position dose carlosgomez play”以及问句“what position dosedavidbeckham play”,它们有同样的q_pattern,但是由于主题实体类型的不同,所对应的知识库中的关系不同,分别是“baseball.baseball_player.position_s”以及“soccer.football_player.position_s”。所以考虑另一种q_pattern,使用主题实体类型替代占位符“<e>”,为了证明这种表达方式的有效性,实验部分对比了分别使用两种不同输入方式的结果。
解码过程使用了一个带有注意力机制的解码器,解码的目标直接是与问句表达语义相匹配的目标关系。给定一个问句q,经过编码器编码,解码器解码能够直接得到问句相对应的关系。加入注意力机制的优势是序列输入随着序列的不断增长,隐层单元状态向量所携带的信息会不断损失,所以不同时间点的信息量会有差别,注意力机制刚好解决了这个问题,它会对输入上下文进行一次基于权重的筛选,让解码器更专注找到输入数据中与当前输出有关的有用信息,从而提高输出数据的质量。
在基于注意力机制的解码过程中,某个时刻t的输出
p(yt|y1,...,yt-1,q)=g(yt-1,st,ct)
其中g是softmax激活函数,st是隐藏层变量
St=f(yt-1,St-1,Ct)
hj是编码过程中第j个单词的隐藏层变量
etj=va T tanh WaSt-1+Uahj
整个序列到序列模型训练的目标是最大化
综上,问句改写成q_pattern模型后,得到排名前k的问句所对应的关系作为问句q的候选关系,同时得到每个候选关系的得分。
给定一个问句q,经过命名实体识别和实体链接得到候选主题实体集合E及每个候选实体e∈E的得分,使用其中每个候选实体的类型信息及问句q经过序列到序列模型得到候选关系集合P及每个候选p∈P的得分,然后先选择得分最高的pi,再选择其对应的{e1,e2,…,en}中得分最高的ei。以此确定三元组的前两元(s,p,?),然后去知识库中根据s和p查找,得到答案集合{oi},其中i、j、n是正整数。
知识库中分别使用了FB2M和FB5M两个Freebase的子集,FB2M包含了2,150,604实体,6701中关系,以及14,180,927条三元组。FB5M包含了4,904,397个实体,7523中关系,22,441,880条三元组。
问答方法训练数据和测试数据使用了SimpleQuestions(SQ)数据集,包含了108,442个问句三元组对(75910用于训练,10845用于测试)此数据集用来训练5.1提及的命名实体识别模型和5.2所提到的基于注意力机制的序列到序列关系匹配模型,并用来评估整体问答的效果。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (6)
1.一种基于知识图谱的问答方法,其特征在于,所述方法包括以下步骤:
步骤1:用户输入自然语言问句,经过字符串预处理;
步骤2:通过命名实体模块获得问句中的命名实体词;
步骤3:通过实体链接模块,利用命名实体词查询别名词典,返回候选实体及其根据知名度的排名;所述返回候选实体及其根据知名度的排名的具体方式为知识库中存在每个实体实例及其对应的名字和别名,获取别名信息,反向构建别名字符串到实体实例的词典用于实体链接,构建词典时对别名字符串进行统一化处理,通过获取实体在知识库中出现的频率作为知名度对别名词典中的实体进行排序,经过命名实体识别得到命名实体词后,使用命名实体词在别名词典中查找得到候选实体,并且根据实体的知名度的排名选出候选实体;
步骤4:得到使用实体类型代替命名实体词的问句模式(pattern),经过关系匹配模型匹配得到问句所表达语义的知识库中的候选关系及其得分;所述关系匹配模型匹配得到问句所表达语义的知识库中的候选关系具体方式为关系匹配模型通过自然语言理解技术理解问句q所表达的语义,并且与搜索空间中三元组(s,p,o)中的关系p进行匹配,以此确定问句所表达的语义及其与知识库中对应的关系;
步骤5:找到候选实体和候选关系后,根据关系得分和实体排序,及其在知识库中的查找确定答案。
2.如权利要求1所述的方法,其特征在于,主题实体匹配包括命名实体识别模块和实体链接模块两个部分,命名实体识别模块识别自然语言问句q中人名、地名、组织机构名命名实体,实体链接模块将识别出的命名实体对应到知识库中的某一个实体上,即找到三元组中的实体s,通过命名实体识别模块和实体链接模块得到候选实体,关系匹配得到候选关系,由此得到若干候选三元组,最后根据实体识别得分,关系匹配得分特征对候选三元组进行排序,确定最后答案。
3.如权利要求2所述的方法,其特征在于,所述命名实体识别模块采用基于字符和单词级别的GRU-CRF(融合条件随机场的循环神经网络)模型来识别问句q中的命名实体词,所述GRU-CRF(融合条件随机场的循环神经网络)模型中使用单词级别的向量和字符级别的向量相结合来共同构造词向量,作为序列标注模型的输入。
4.如权利要求3所述的方法,其特征在于,所述字符级别的单词向量表示分别通过单词每个字符正序输入的正向RNN(循环神经网络)和逆序输入的反向RNN(循环神经网络)最后时刻输出的向量经过拼接成为整个单词的字符级别向量表示,字符表中每个字符的初始向量随机进行初始化。
5.如权利要求2所述的方法,其特征在于,所述关系匹配是通过语义理解找到与问句语义相匹配的知识库中三元组中的关系,使用了一个基于注意力机制的序列到序列模型,这个模型具体是由一个两层的LSTM(长短期记忆网络)编码器和一个有注意力机制的LSTM(长短期记忆网络)解码器组成,在所述解码器中,使用主题实体类型替代占位符“<e>”。
6.如权利要求2所述的方法,其特征在于,确定答案的过程为给定一个问句q,经过命名实体识别和实体链接得到候选实体集合E及每个候选实体e∈E的得分,使用其中每个候选实体的类型信息及问句q经过序列到序列模型得到候选关系集合P及每个候选p∈P的得分,然后先选择得分最高的pi,再选择其对应的{e1,e2,…,en}中得分最高的ei,以此确定三元组的前两元(s,p,?),然后去知识库中根据s和p查找,得到答案集合{oi}。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710858596.2A CN107748757B (zh) | 2017-09-21 | 2017-09-21 | 一种基于知识图谱的问答方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710858596.2A CN107748757B (zh) | 2017-09-21 | 2017-09-21 | 一种基于知识图谱的问答方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107748757A CN107748757A (zh) | 2018-03-02 |
CN107748757B true CN107748757B (zh) | 2021-05-07 |
Family
ID=61254671
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710858596.2A Active CN107748757B (zh) | 2017-09-21 | 2017-09-21 | 一种基于知识图谱的问答方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107748757B (zh) |
Families Citing this family (105)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110309271A (zh) * | 2018-03-06 | 2019-10-08 | 微软技术许可有限责任公司 | 智能知识学习及问答技术 |
CN108681544A (zh) * | 2018-03-07 | 2018-10-19 | 中山大学 | 一种基于图谱拓扑结构和实体文本描述的深度学习方法 |
CN108628823B (zh) * | 2018-03-14 | 2022-07-01 | 中山大学 | 结合注意力机制和多任务协同训练的命名实体识别方法 |
CN108388560B (zh) * | 2018-03-17 | 2021-08-20 | 北京工业大学 | 基于语言模型的gru-crf会议名称识别方法 |
CN110569335B (zh) | 2018-03-23 | 2022-05-27 | 百度在线网络技术(北京)有限公司 | 基于人工智能的三元组校验方法、装置及存储介质 |
CN108647233B (zh) * | 2018-04-02 | 2020-11-17 | 北京大学深圳研究生院 | 一种用于问答系统的答案排序方法 |
CN108763284B (zh) * | 2018-04-13 | 2021-07-20 | 华南理工大学 | 一种基于深度学习和主题模型的问答系统实现方法 |
CN108665506B (zh) * | 2018-05-10 | 2021-09-28 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、计算机存储介质及服务器 |
CN110609902B (zh) * | 2018-05-28 | 2021-10-22 | 华为技术有限公司 | 一种基于融合知识图谱的文本处理方法及装置 |
CN108710704B (zh) * | 2018-05-28 | 2021-04-02 | 出门问问信息科技有限公司 | 对话状态的确定方法、装置、电子设备及存储介质 |
CN109002434A (zh) * | 2018-05-31 | 2018-12-14 | 青岛理工大学 | 客服问答匹配方法、服务器及存储介质 |
CN108959396B (zh) * | 2018-06-04 | 2021-08-17 | 众安信息技术服务有限公司 | 机器阅读模型训练方法及装置、问答方法及装置 |
CN108763567A (zh) * | 2018-06-05 | 2018-11-06 | 北京玄科技有限公司 | 应用于智能机器人交互的知识推理方法及装置 |
CN108845990A (zh) * | 2018-06-12 | 2018-11-20 | 北京慧闻科技发展有限公司 | 基于双向注意力机制的答案选择方法、装置和电子设备 |
CN109033156B (zh) * | 2018-06-13 | 2021-06-15 | 腾讯科技(深圳)有限公司 | 一种信息处理方法、装置及终端 |
CN108959461B (zh) * | 2018-06-15 | 2021-07-27 | 东南大学 | 一种基于图模型的实体链接方法 |
CN110609995B (zh) * | 2018-06-15 | 2023-06-27 | 中央民族大学 | 构建藏语问答语料库的方法及装置 |
CN109062939A (zh) * | 2018-06-20 | 2018-12-21 | 广东外语外贸大学 | 一种面向汉语国际教育的智能导学方法 |
CN108920587B (zh) * | 2018-06-26 | 2021-09-24 | 清华大学 | 融合外部知识的开放域视觉问答方法及装置 |
CN108874782B (zh) * | 2018-06-29 | 2019-04-26 | 北京寻领科技有限公司 | 一种层次注意力lstm和知识图谱的多轮对话管理方法 |
CN110765271B (zh) * | 2018-07-09 | 2024-02-09 | 株式会社理光 | 一种实体发现与实体链接的联合处理方法及装置 |
CN109271524B (zh) * | 2018-08-02 | 2021-10-15 | 中国科学院计算技术研究所 | 知识库问答系统中的实体链接方法 |
CN109065100A (zh) * | 2018-08-20 | 2018-12-21 | 广州小云软件科技有限公司 | 一种基于区块链的中医健康个性化问卷智能生成与加密系统 |
CN109344242B (zh) * | 2018-09-28 | 2021-10-01 | 广东工业大学 | 一种对话问答方法、装置、设备及存储介质 |
CN110019843B (zh) * | 2018-09-30 | 2020-11-06 | 北京国双科技有限公司 | 知识图谱的处理方法及装置 |
CN110110092B (zh) * | 2018-09-30 | 2021-03-09 | 北京国双科技有限公司 | 一种知识图谱构建方法及相关设备 |
CN109543181B (zh) * | 2018-11-09 | 2023-01-31 | 中译语通科技股份有限公司 | 一种基于主动学习和深度学习相结合的命名实体模型和系统 |
CN109492227A (zh) * | 2018-11-16 | 2019-03-19 | 大连理工大学 | 一种基于多头注意力机制和动态迭代的机器阅读理解方法 |
CN109299289B (zh) * | 2018-11-30 | 2021-04-06 | 国信优易数据股份有限公司 | 一种查询图构建方法、装置、电子设备及计算机存储介质 |
CN109614615B (zh) * | 2018-12-04 | 2022-04-22 | 联想(北京)有限公司 | 实体匹配方法、装置及电子设备 |
CN109740149B (zh) * | 2018-12-11 | 2019-12-13 | 英大传媒投资集团有限公司 | 一种基于远程监督的同义词提取方法 |
CN110032623B (zh) * | 2018-12-12 | 2023-02-24 | 创新先进技术有限公司 | 用户问句与知识点标题的匹配方法和装置 |
CN110162772B (zh) * | 2018-12-13 | 2020-06-26 | 北京三快在线科技有限公司 | 命名实体识别方法及装置 |
CN109670024B (zh) * | 2018-12-17 | 2021-06-04 | 北京百度网讯科技有限公司 | 逻辑表达式确定方法、装置、设备和介质 |
CN109657037A (zh) * | 2018-12-21 | 2019-04-19 | 焦点科技股份有限公司 | 一种基于实体类型和语义相似度的知识图谱问答方法及系统 |
CN109710738A (zh) * | 2018-12-24 | 2019-05-03 | 广州天鹏计算机科技有限公司 | 药物问询方法、装置、系统、计算机设备和存储介质 |
CN109753557B (zh) * | 2018-12-26 | 2021-01-01 | 出门问问信息科技有限公司 | 问答系统的答案输出方法、装置、设备及存储介质 |
CN111382264B (zh) * | 2018-12-27 | 2023-06-09 | 阿里巴巴集团控股有限公司 | 会话质量评价方法、装置及电子设备 |
CN109783624A (zh) * | 2018-12-27 | 2019-05-21 | 联想(北京)有限公司 | 基于知识库的答案生成方法、装置和智能会话系统 |
CN109726276A (zh) * | 2018-12-29 | 2019-05-07 | 中山大学 | 一种基于深度网络学习的任务型对话系统 |
CN109857845B (zh) * | 2019-01-03 | 2021-06-22 | 北京奇艺世纪科技有限公司 | 模型训练及数据检索方法、装置、终端及计算机可读存储介质 |
CN109919175B (zh) * | 2019-01-16 | 2020-10-23 | 浙江大学 | 一种结合属性信息的实体多分类方法 |
CN111563209B (zh) | 2019-01-29 | 2023-06-30 | 株式会社理光 | 一种意图识别的方法、装置及计算机可读存储介质 |
US11727243B2 (en) | 2019-01-30 | 2023-08-15 | Baidu Usa Llc | Knowledge-graph-embedding-based question answering |
CN109885627A (zh) * | 2019-02-13 | 2019-06-14 | 北京航空航天大学 | 一种神经网络训练实体间关系的方法及装置 |
CN109872816A (zh) * | 2019-02-13 | 2019-06-11 | 广州天鹏计算机科技有限公司 | 基于知识图谱的慢阻肺疾病咨询方法、装置和系统 |
CN109992629B (zh) * | 2019-02-28 | 2021-08-06 | 中国科学院计算技术研究所 | 一种融合实体类型约束的神经网络关系抽取方法及系统 |
CN110069631B (zh) * | 2019-04-08 | 2022-11-29 | 腾讯科技(深圳)有限公司 | 一种文本处理方法、装置以及相关设备 |
CN109992658B (zh) * | 2019-04-09 | 2023-04-11 | 智言科技(深圳)有限公司 | 一种知识驱动的sparql查询构建方法 |
CN110059160B (zh) * | 2019-04-17 | 2021-02-09 | 东南大学 | 一种端到端的基于上下文的知识库问答方法及装置 |
CN110059173A (zh) * | 2019-04-19 | 2019-07-26 | 辽宁工程技术大学 | 一种基于知识图谱的智能厨房问答助手系统 |
CN110147437B (zh) * | 2019-05-23 | 2022-09-02 | 北京金山数字娱乐科技有限公司 | 一种基于知识图谱的搜索方法及装置 |
CN110209787B (zh) * | 2019-05-29 | 2023-09-22 | 袁琦 | 一种基于宠物知识图谱的智能问答方法及系统 |
CN110222343A (zh) * | 2019-06-13 | 2019-09-10 | 电子科技大学 | 一种中药种植资源命名实体识别方法 |
CN110427467B (zh) * | 2019-06-26 | 2022-10-11 | 深圳追一科技有限公司 | 问答处理方法、装置、计算机设备和存储介质 |
CN110502621B (zh) * | 2019-07-03 | 2023-06-13 | 平安科技(深圳)有限公司 | 问答方法、问答装置、计算机设备及存储介质 |
CN110442710B (zh) * | 2019-07-03 | 2021-09-17 | 广州探迹科技有限公司 | 一种基于知识图谱的短文本语义理解与精准匹配方法及装置 |
CN110413732B (zh) * | 2019-07-16 | 2023-11-24 | 扬州大学 | 面向软件缺陷知识的知识搜索方法 |
CN110532360A (zh) * | 2019-07-19 | 2019-12-03 | 平安科技(深圳)有限公司 | 医疗领域知识图谱问答处理方法、装置、设备及存储介质 |
CN110532397B (zh) * | 2019-07-19 | 2023-06-09 | 平安科技(深圳)有限公司 | 基于人工智能的问答方法、装置、计算机设备及存储介质 |
CN110569345B (zh) * | 2019-09-04 | 2022-07-29 | 淮阴工学院 | 一种基于实体链接和关系预测的时政知识智能问答方法 |
CN110532368B (zh) * | 2019-09-04 | 2023-03-14 | 达闼机器人股份有限公司 | 问答方法、电子设备及计算机可读存储介质 |
CN110837550B (zh) * | 2019-11-11 | 2023-01-17 | 中山大学 | 基于知识图谱的问答方法、装置、电子设备及存储介质 |
CN110851604B (zh) * | 2019-11-12 | 2022-09-13 | 鼎富智能科技有限公司 | 一种文本分类方法、装置、电子设备及存储介质 |
CN110990525A (zh) * | 2019-11-15 | 2020-04-10 | 华融融通(北京)科技有限公司 | 一种基于自然语言处理的舆情信息抽取及知识库生成方法 |
CN111159345B (zh) * | 2019-12-27 | 2023-09-05 | 中国矿业大学 | 一种中文知识库答案获取方法及其装置 |
CN111259653B (zh) * | 2020-01-15 | 2022-06-24 | 重庆邮电大学 | 基于实体关系消歧的知识图谱问答方法、系统以及终端 |
CN111339266A (zh) * | 2020-02-13 | 2020-06-26 | 深圳市人马互动科技有限公司 | 聊天机器人的开发系统和聊天机器人模块 |
CN111309882B (zh) * | 2020-02-13 | 2023-06-09 | 支付宝(杭州)信息技术有限公司 | 用于实现智能客服问答的方法和装置 |
CN111353298A (zh) * | 2020-02-17 | 2020-06-30 | 杭州网易再顾科技有限公司 | 字符序列生成方法、装置、设备及计算机可读存储介质 |
CN111368048B (zh) * | 2020-02-26 | 2024-06-25 | 京东方科技集团股份有限公司 | 信息获取方法、装置、电子设备及计算机可读存储介质 |
CN111563147B (zh) * | 2020-04-03 | 2023-09-22 | 北京明略软件系统有限公司 | 一种知识问答系统中实体链接方法和装置 |
CN111488741A (zh) * | 2020-04-14 | 2020-08-04 | 税友软件集团股份有限公司 | 一种税收知识数据语义标注方法及相关装置 |
CN111553159B (zh) * | 2020-04-24 | 2021-08-06 | 中国科学院空天信息创新研究院 | 一种问句生成方法及系统 |
CN111651569B (zh) * | 2020-04-24 | 2022-04-08 | 中国电力科学研究院有限公司 | 一种电力领域的知识库问答方法及系统 |
CN111651348B (zh) * | 2020-05-06 | 2023-09-29 | 深圳市人马互动科技有限公司 | 一种聊天机器人的调试系统 |
CN111639254A (zh) * | 2020-05-28 | 2020-09-08 | 华中科技大学 | 一种医疗领域的sparql查询语句的生成系统和方法 |
CN111639171B (zh) * | 2020-06-08 | 2023-10-27 | 吉林大学 | 一种知识图谱问答方法及装置 |
CN111813914B (zh) * | 2020-07-13 | 2021-07-06 | 龙马智芯(珠海横琴)科技有限公司 | 基于字典树的问答方法、装置、识别设备及可读存储介质 |
CN111813916B (zh) * | 2020-07-21 | 2024-03-05 | 华润数字科技有限公司 | 一种智能问答方法、装置、计算机设备和介质 |
CN112035627B (zh) * | 2020-07-27 | 2023-11-17 | 深圳技术大学 | 自动问答方法、装置、设备及存储介质 |
CN111949781B (zh) * | 2020-08-06 | 2021-11-19 | 贝壳找房(北京)科技有限公司 | 一种基于自然语句句法分析的智能交互方法及装置 |
CN111897944B (zh) * | 2020-08-17 | 2024-03-22 | 哈尔滨工业大学 | 基于语义空间共享的知识图谱问答系统 |
CN112015868B (zh) * | 2020-09-07 | 2022-08-26 | 重庆邮电大学 | 基于知识图谱补全的问答方法 |
CN112214685B (zh) * | 2020-09-27 | 2023-03-28 | 电子科技大学 | 一种基于知识图谱的个性化推荐方法 |
CN112256847B (zh) * | 2020-09-30 | 2023-04-07 | 昆明理工大学 | 融合事实文本的知识库问答方法 |
CN112328759A (zh) * | 2020-10-29 | 2021-02-05 | 平安科技(深圳)有限公司 | 自动问答方法、装置、设备及存储介质 |
CN112328773A (zh) * | 2020-11-26 | 2021-02-05 | 四川长虹电器股份有限公司 | 基于知识图谱的问答实现方法和系统 |
CN112579752A (zh) * | 2020-12-10 | 2021-03-30 | 上海明略人工智能(集团)有限公司 | 实体关系的抽取方法及装置、存储介质、电子设备 |
CN112579600A (zh) * | 2020-12-21 | 2021-03-30 | 广州橙行智动汽车科技有限公司 | 一种基于车载问答的数据处理方法和装置 |
CN112287043B (zh) * | 2020-12-29 | 2021-06-18 | 成都数联铭品科技有限公司 | 基于领域知识的图编码自动生成方法及系统、电子设备 |
CN112650846A (zh) * | 2021-01-13 | 2021-04-13 | 北京智通云联科技有限公司 | 一种基于问句框架的问答意图知识库构建系统及方法 |
CN112766507B (zh) * | 2021-01-20 | 2023-04-25 | 河海大学 | 基于嵌入式和候选子图剪枝的复杂问题知识库问答方法 |
CN112818675A (zh) * | 2021-02-01 | 2021-05-18 | 北京金山数字娱乐科技有限公司 | 一种基于知识库问答的实体抽取方法及装置 |
CN112883172B (zh) * | 2021-02-03 | 2022-04-12 | 大连理工大学 | 一种基于双重知识选择的生物医学问答方法 |
CN113590779B (zh) * | 2021-06-30 | 2023-04-25 | 四川大学 | 一种空管领域知识图谱的智能问答系统构建方法 |
CN113255294B (zh) * | 2021-07-14 | 2021-10-12 | 北京邮电大学 | 命名实体识别模型训练方法、识别方法及装置 |
CN114510558A (zh) * | 2022-01-26 | 2022-05-17 | 北京博瑞彤芸科技股份有限公司 | 一种基于中医知识图谱的问答方法及系统 |
CN114925186A (zh) * | 2022-05-24 | 2022-08-19 | 华侨大学 | 一种知识图谱的问句生成方法、装置、设备和存储介质 |
CN115577091A (zh) * | 2022-12-08 | 2023-01-06 | 成都晓多科技有限公司 | 基于知识图谱的复杂条件问题作答方法及系统 |
CN116049447B (zh) * | 2023-03-24 | 2023-06-13 | 中科雨辰科技有限公司 | 一种基于知识库的实体链接系统 |
CN116187446B (zh) * | 2023-05-04 | 2023-07-04 | 中国人民解放军国防科技大学 | 基于自适应注意力机制的知识图谱补全方法、装置和设备 |
CN116303976B (zh) * | 2023-05-12 | 2023-08-08 | 中国人民解放军国防科技大学 | 基于网络安全知识图谱的渗透测试问答方法、系统及介质 |
CN116720519B (zh) * | 2023-06-08 | 2023-12-19 | 吉首大学 | 一种苗医药命名实体识别方法 |
CN117194633A (zh) * | 2023-09-12 | 2023-12-08 | 河海大学 | 基于多层级多路径的大坝应急响应知识问答系统及实现方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104915340A (zh) * | 2014-03-10 | 2015-09-16 | 北京大学 | 自然语言问答方法及装置 |
CN105095195A (zh) * | 2015-07-03 | 2015-11-25 | 北京京东尚科信息技术有限公司 | 基于知识图谱的人机问答方法和系统 |
CN105528349A (zh) * | 2014-09-29 | 2016-04-27 | 华为技术有限公司 | 知识库中问句解析的方法及设备 |
CN105701253A (zh) * | 2016-03-04 | 2016-06-22 | 南京大学 | 中文自然语言问句语义化的知识库自动问答方法 |
CN105868313A (zh) * | 2016-03-25 | 2016-08-17 | 浙江大学 | 一种基于模板匹配技术的知识图谱问答系统及方法 |
CN106919655A (zh) * | 2017-01-24 | 2017-07-04 | 网易(杭州)网络有限公司 | 一种答案提供方法和装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10586156B2 (en) * | 2015-06-25 | 2020-03-10 | International Business Machines Corporation | Knowledge canvassing using a knowledge graph and a question and answer system |
US10248689B2 (en) * | 2015-10-13 | 2019-04-02 | International Business Machines Corporation | Supplementing candidate answers |
-
2017
- 2017-09-21 CN CN201710858596.2A patent/CN107748757B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104915340A (zh) * | 2014-03-10 | 2015-09-16 | 北京大学 | 自然语言问答方法及装置 |
CN105528349A (zh) * | 2014-09-29 | 2016-04-27 | 华为技术有限公司 | 知识库中问句解析的方法及设备 |
CN105095195A (zh) * | 2015-07-03 | 2015-11-25 | 北京京东尚科信息技术有限公司 | 基于知识图谱的人机问答方法和系统 |
CN105701253A (zh) * | 2016-03-04 | 2016-06-22 | 南京大学 | 中文自然语言问句语义化的知识库自动问答方法 |
CN105868313A (zh) * | 2016-03-25 | 2016-08-17 | 浙江大学 | 一种基于模板匹配技术的知识图谱问答系统及方法 |
CN106919655A (zh) * | 2017-01-24 | 2017-07-04 | 网易(杭州)网络有限公司 | 一种答案提供方法和装置 |
Non-Patent Citations (2)
Title |
---|
Neural Architecture for Question Answering Using a Knowledge Graph and Web Corpus;Uma Sawant等;《ArXiv》;20170605;第1-8页 * |
基于中文知识图谱的电商领域问答系统;杜泽宇等;《计算机应用与软件》;20170531;第34卷(第5期);第153-159页 * |
Also Published As
Publication number | Publication date |
---|---|
CN107748757A (zh) | 2018-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107748757B (zh) | 一种基于知识图谱的问答方法 | |
CN114020862B (zh) | 一种面向煤矿安全规程的检索式智能问答系统及方法 | |
CN110825721A (zh) | 大数据环境下高血压知识库构建与系统集成方法 | |
CN110765775A (zh) | 一种融合语义和标签差异的命名实体识别领域自适应的方法 | |
CN110750635B (zh) | 一种基于联合深度学习模型的法条推荐方法 | |
CN110083710A (zh) | 一种基于循环神经网络与潜变量结构的词语定义生成方法 | |
CN112328766B (zh) | 一种基于路径搜索的知识图谱问答方法和装置 | |
CN109271524B (zh) | 知识库问答系统中的实体链接方法 | |
CN111159345B (zh) | 一种中文知识库答案获取方法及其装置 | |
CN115599902B (zh) | 一种基于知识图谱的油气百科问答方法及系统 | |
CN114238653B (zh) | 一种编程教育知识图谱构建、补全与智能问答的方法 | |
CN113282729B (zh) | 基于知识图谱的问答方法及装置 | |
Sifa et al. | Towards contradiction detection in german: a translation-driven approach | |
CN114818717A (zh) | 融合词汇和句法信息的中文命名实体识别方法及系统 | |
CN114661872A (zh) | 一种面向初学者的api自适应推荐方法与系统 | |
CN115599899A (zh) | 基于飞行器知识图谱的智能问答方法、系统、设备及介质 | |
CN114757184B (zh) | 实现航空领域知识问答的方法和系统 | |
Li et al. | Using context information to enhance simple question answering | |
Kshirsagar et al. | A Review on Application of Deep Learning in Natural Language Processing | |
Ding et al. | A knowledge-enriched and span-based network for joint entity and relation extraction | |
CN110909174B (zh) | 一种基于知识图谱的简单问答中实体链接的改进方法 | |
CN112926323A (zh) | 基于多级残差卷积与注意力机制的中文命名实体识别方法 | |
CN116562280A (zh) | 一种基于通用信息抽取的文献分析系统及方法 | |
CN116029300A (zh) | 一种强化中文实体语义特征的语言模型训练方法和系统 | |
CN115033706A (zh) | 一种知识图谱自动补全和更新的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |