CN109033305A - 问题回答方法、设备及计算机可读存储介质 - Google Patents
问题回答方法、设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN109033305A CN109033305A CN201810782426.5A CN201810782426A CN109033305A CN 109033305 A CN109033305 A CN 109033305A CN 201810782426 A CN201810782426 A CN 201810782426A CN 109033305 A CN109033305 A CN 109033305A
- Authority
- CN
- China
- Prior art keywords
- predicate
- question
- keyword
- answering
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
本发明公开了一种问题回答方法、设备及计算机可读存储介质,该方法包括步骤:当接收到待回答问题后,以提取待回答问题中的关键词;根据关键词在预设意图词库中查找对应的意图词汇,根据意图词汇确定待回答问题对应的目标意图;根据待回答问题中主语实体词和目标意图在预设知识图谱中确定谓词候选集,并在关键词中确定谓语关键词;若根据预设算法在谓词候选集中查找到与谓语关键词对应的目标谓词,则根据目标谓词确定待回答问题对应的答案,并输出答案。本发明在利用知识图谱回答问题过程中,对用户问题意图进行分析,以回答用户原因类或者解释类等类型的问题,提高了问题回答的准确率。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种问题回答方法、设备及计算机可读存储介质。
背景技术
现有的知识图谱是通过三元组进行问题匹配,得到对应的答案。每一个三元组表示事实陈述,如三元组可为(小A,国籍,中国)、(小A,民族,汉族)和(小A,星座,处女座)。当问题为“请问小A的星座是什么”,知识图谱所在系统会先识别出问题中的命名实体词“小A”,然后识别出谓语“星座”,然后将“小A”和“星座”去匹配知识图谱中的三元组,从而匹配到的三元组为(小A,星座,处女座),得到对应的答案为“处女座”。由此可知,现有知识图谱只能回答事实型问题,如“请问小A的国籍是什么?”而不能对用户意图进行分析,回答一些原因类或者怎么办等类型的问题,导致回答问题准确率低下。
发明内容
本发明的主要目的在于提供一种问题回答方法、设备及计算机可读存储介质,旨在解决现有的问题回答方法,在利用知识图谱回答问题过程中,仅仅是通过三元组进行问题匹配,导致回答问题准确率低下的技术问题。
为实现上述目的,本发明提供一种问题回答方法,所述问题回答方法包括步骤:
当接收到待回答问题后,提取所述待回答问题中的关键词;
根据所述关键词在预设意图词库中查找对应的意图词汇,根据所述意图词汇确定所述待回答问题对应的目标意图;
确定所述待回答问题中的主语实体词,根据所述主语实体词和所述目标意图在预设知识图谱中确定谓词候选集,并在所述关键词中确定谓语关键词;
根据预设算法检测是否在所述谓词候选集中查找到与所述谓语关键词对应的目标谓词;
若在所述谓词候选集中查找到所述目标谓词,则根据所述目标谓词确定所述待回答问题对应的答案,并输出所述答案。
优选地,所述根据预设算法检测是否在所述谓词候选集中查找到与所述谓语关键词对应的目标谓词的步骤包括:
确定所述谓词候选集中各个谓词词组对应的正则表达式,将所述谓语关键词与所述正则表达式进行匹配;
若所述谓语关键词与所述正则表达式匹配成功,则将匹配成功的正则表达式对应的谓词词组记为目标谓词;
若所述谓语关键词与所述正则表达式匹配失败,则确定在所述谓词候选集中未查找到所述目标谓词。
优选地,所述根据预设算法检测是否在所述谓词候选集中查找到与所述谓语关键词对应的目标谓词的步骤包括:
确定所述谓词候选集中的候选谓词,将所述谓语关键词和所述候选谓词输入预设的词向量模型中,对应得到谓语关键词向量和候选谓词向量;
将所述谓语关键词和所述候选谓词输入预设的字向量模型中,对应得到谓语关键词字向量和候选谓词字向量;
根据所述谓语关键词向量和所述候选谓词向量计算词向量余弦距离,以及根据所述谓语关键词字向量和所述候选谓词字向量计算字向量余弦距离;
根据所述词向量余弦距离和所述字向量余弦距离确定所述谓语关键词和所述候选谓词之间的相似度;
若所述相似度大于或者等于预设阈值,则确定与所述相似度对应的候选谓词为目标谓词;
若所述相似度小于所述预设阈值,则确定在所述谓词候选集中未查找到所述目标谓词。
优选地,所述根据所述词向量余弦距离和所述字向量余弦距离确定所述谓语关键词和所述候选谓词之间的相似度的步骤包括:
判断所述词向量余弦距离是否大于所述字向量余弦距离;
若所述词向量余弦距离大于所述字向量余弦距离,则确定所述词向量余弦距离为所述谓语关键词和所述候选谓词之间的相似度;
若所述词向量余弦距离小于所述字向量余弦距离,则确定所述字向量余弦距离为所述谓语关键词和所述候选谓词之间的相似度。
优选地,所述根据所述词向量余弦距离和所述字向量余弦距离确定所述谓语关键词和所述候选谓词之间的相似度的步骤包括:
确定所述词向量余弦距离对应的第一权重,以及确定所述字向量余弦距离对应的第二权重;
计算所述第一权重和所述词向量余弦距离的乘积,得到第一乘积;
计算所述第二权重和所述字向量余弦距离的乘积,得到第二乘积;
计算所述第一乘积和所述第二乘积之间的和,以确定所述谓语关键词和所述候选谓词之间的相似度。
优选地,所述当接收到待回答问题后,提取所述待回答问题中的关键词的步骤之前,还包括:
获取所述预设知识图谱中的预设问题,将所述预设问题转换成字符串序列,得到所述预设问题对应的字符列表,并利用结巴分词对所述预设问题进行分词,得到分词后的预设问题;
将所述字符列表输入至预设的语言处理工具中进行训练,得到所述字向量模型;
将所述分词后的预设问题输入至所述语言处理工具中进行训练,得到所述词向量模型。
优选地,所述当接收到待回答问题后,提取所述待回答问题中的关键词的步骤包括:
当接收到待回答问题后,将所述待回答问题进行分词划分,得到所述待回答问题中的分词词语;
将所述分词词语与预设停用词进行对比,将与所述预设停用词一致的词语从所述分词词语中删除,得到所述待回答问题中的关键词。
优选地,所述根据预设算法检测是否在所述谓词候选集中查找到与所述谓语关键词对应的目标谓词的步骤之后,还包括:
若在所述谓词候选集中未查找到所述目标谓词,则输出提示信息,以根据所述提示信息提示用户未查找到与所述待回答问题对应的答案。
此外,为实现上述目的,本发明还提供一种问题回答设备,所述问题回答设备包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的问题回答程序,所述问题回答程序被所述处理器执行时实现如上所述的问题回答方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有问题回答程序,所述问题回答程序被处理器执行时实现如上所述的问题回答方法的步骤。
本发明通过当接收到待回答问题后,删除待回答问题中的停用词,以提取待回答问题中的关键词;根据关键词在预设意图词库中查找对应的意图词汇,根据意图词汇确定待回答问题对应的目标意图;确定待回答问题中主语实体词,根据主语实体词和目标意图在预设知识图谱中确定谓词候选集,并确定关键词中的谓语关键词;根据预设算法检测是否在谓词候选集中查找到与谓语关键词对应的目标谓词;若在谓词候选集中查找到目标谓词,则根据目标谓词确定待回答问题对应的答案,并输出答案。在利用知识图谱回答问题过程中,对用户问题意图进行分析,以根据分析结果确定待回答问题的目标谓词,从而确定答案,回答用户原因类或者解释类等类型的问题,提高了问题回答的准确率。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的结构示意图;
图2为本发明问题回答方法较佳实施例的流程示意图;
图3为本发明实施例中根据预设算法检测是否在所述谓词候选集中查找到与所述谓语关键词对应的目标谓词的一种流程示意图;
图4为本发明实施例中根据预设算法检测是否在所述谓词候选集中查找到与所述谓语关键词对应的目标谓词的另一种流程示意图;
图5为本发明实施例中根据所述词向量余弦距离和所述字向量余弦距离确定所述谓语关键词和所述候选谓词之间的相似度的一种流程示意图;
图6为本发明实施例中Skip-Gram模型的一种示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的结构示意图。
需要说明的是,图1即可为问题回答设备的硬件运行环境的结构示意图。本发明实施例问题回答设备可以是PC,便携计算机等终端设备。
如图1所示,该问题回答设备可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的问题回答设备结构并不构成对问题回答设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及问题回答程序。其中,操作系统是管理和控制问题回答设备硬件和软件资源的程序,支持问题回答程序以及其它软件或程序的运行。
在图1所示的问题回答设备中,用户接口1003主要用于获取用户输入的待回答问题,以及输出提示信息等;网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信,如查找待回答问题对应的答案;而处理器1001可以用于调用存储器1005中存储的问题回答程序,并执行以下操作:
当接收到待回答问题后,提取所述待回答问题中的关键词;
根据所述关键词在预设意图词库中查找对应的意图词汇,根据所述意图词汇确定所述待回答问题对应的目标意图;
确定所述待回答问题中的主语实体词,根据所述主语实体词和所述目标意图在预设知识图谱中确定谓词候选集,并在所述关键词中确定谓语关键词;
根据预设算法检测是否在所述谓词候选集中查找到与所述谓语关键词对应的目标谓词;
若在所述谓词候选集中查找到所述目标谓词,则根据所述目标谓词确定所述待回答问题对应的答案,并输出所述答案。
进一步地,所述根据预设算法检测是否在所述谓词候选集中查找到与所述谓语关键词对应的目标谓词的步骤包括:
确定所述谓词候选集中各个谓词词组对应的正则表达式,将所述谓语关键词与所述正则表达式进行匹配;
若所述谓语关键词与所述正则表达式匹配成功,则将匹配成功的正则表达式对应的谓词词组记为目标谓词;
若所述谓语关键词与所述正则表达式匹配失败,则确定在所述谓词候选集中未查找到所述目标谓词。
进一步地,所述根据预设算法检测是否在所述谓词候选集中查找到与所述谓语关键词对应的目标谓词的步骤包括:
确定所述谓词候选集中的候选谓词,将所述谓语关键词和所述候选谓词输入预设的词向量模型中,对应得到谓语关键词向量和候选谓词向量;
将所述谓语关键词和所述候选谓词输入预设的字向量模型中,对应得到谓语关键词字向量和候选谓词字向量;
根据所述谓语关键词向量和所述候选谓词向量计算词向量余弦距离,以及根据所述谓语关键词字向量和所述候选谓词字向量计算字向量余弦距离;
根据所述词向量余弦距离和所述字向量余弦距离确定所述谓语关键词和所述候选谓词之间的相似度;
若所述相似度大于或者等于预设阈值,则确定与所述相似度对应的候选谓词为目标谓词;
若所述相似度小于所述预设阈值,则确定在所述谓词候选集中未查找到所述目标谓词。
进一步地,所述根据所述词向量余弦距离和所述字向量余弦距离确定所述谓语关键词和所述候选谓词之间的相似度的步骤包括:
判断所述词向量余弦距离是否大于所述字向量余弦距离;
若所述词向量余弦距离大于所述字向量余弦距离,则确定所述词向量余弦距离为所述谓语关键词和所述候选谓词之间的相似度;
若所述词向量余弦距离小于所述字向量余弦距离,则确定所述字向量余弦距离为所述谓语关键词和所述候选谓词之间的相似度。
进一步地,所述根据所述词向量余弦距离和所述字向量余弦距离确定所述谓语关键词和所述候选谓词之间的相似度的步骤包括:
确定所述词向量余弦距离对应的第一权重,以及确定所述字向量余弦距离对应的第二权重;
计算所述第一权重和所述词向量余弦距离的乘积,得到第一乘积;
计算所述第二权重和所述字向量余弦距离的乘积,得到第二乘积;
计算所述第一乘积和所述第二乘积之间的和,以确定所述谓语关键词和所述候选谓词之间的相似度。
进一步地,所述当接收到待回答问题后,提取所述待回答问题中的关键词的步骤之前,处理器1001还可以用于调用存储器1005中存储的问题回答程序,并执行以下步骤:
获取所述预设知识图谱中的预设问题,将所述预设问题转换成字符串序列,得到所述预设问题对应的字符列表,并利用结巴分词对所述预设问题进行分词,得到分词后的预设问题;
将所述字符列表输入至预设的语言处理工具中进行训练,得到所述字向量模型;
将所述分词后的预设问题输入至所述语言处理工具中进行训练,得到所述词向量模型。
进一步地,所述当接收到待回答问题后,提取所述待回答问题中的关键词的步骤包括:
当接收到待回答问题后,将所述待回答问题进行分词划分,得到所述待回答问题中的分词词语;
将所述分词词语与预设停用词进行对比,将与所述预设停用词一致的词语从所述分词词语中删除,得到所述待回答问题中的关键词。
进一步地,所述根据预设算法检测是否在所述谓词候选集中查找到与所述谓语关键词对应的目标谓词的步骤之后,处理器1001还可以用于调用存储器1005中存储的问题回答程序,并执行以下步骤:
若在所述谓词候选集中未查找到所述目标谓词,则输出提示信息,以根据所述提示信息提示用户未查找到与所述待回答问题对应的答案。
基于上述的结构,提出问题回答方法的各个实施例。问题回答方法应用于问题回答设备,问题回答设备可为PC,便携计算机等终端设备。为了描述的简便,在以下问题回答方法的各个实施例中,省略问题回答设备这个执行主体。
参照图2,图2为本发明问题回答方法较佳实施例的流程示意图。
本发明实施例提供了问题回答方法的实施例,需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
问题回答方法包括:
步骤S10,当接收到待回答问题后,提取所述待回答问题中的关键词。
当接收到用户输入的待回答问题后,解析待回答问题,并直接提取待回答问题中的关键词,其中,待回答问题是由用户在问题回答设备中输入的。在本实施例中,用户可在问题回答设备的显示界面中手动输入待回答问题,或者通过问题回答设备的麦克风等语音接收装置以语音的方式输入待回答问题。
进一步地,为了提高关键词提取的准确性,步骤S10包括:
步骤a,当接收到待回答问题后,将所述待回答问题进行分词划分,得到所述待回答问题中的分词词语。
具体地:当接收到用户输入的待回答问题后,将待回答问题进行划分,得到待回答问题中的分词词语。在本实施例中,并不限制对待回答问题进行分词划分的算法,如进行分词划分的算法包括但不限于基于理解的分词方法、基于字标注的中文分词方法和基于字符串匹配的分词方法。如当待回答问题为“为什么A产品购买失败了呢?”,划分后所得的分词词组可为“为什么/A/产品/购买/失败/了/呢”,或者“为什么/A产品/购买失败/了/呢”等。
步骤b,将所述分词词语与预设停用词进行对比,将与所述预设停用词一致的词语从所述分词词语中删除,得到所述待回答问题中的关键词。
当得到待回答问题中的分词词语后,将所得的分词词语与预设停用词进行对比,得到与预设停用词一致的词语,将与预设停用词一致的词语从分词词语中删除,以得到待回答问题中的关键词。其中,预设停用词预先存储在问题回答设备中,预设停用词可为“了”、“呢”、“的”、“是”、“啊”、“吗”等。如当划分后的分词词语为“为什么/A产品/购买失败/了/呢”时,删除与预设停用词一致的词语“了”和“呢”,得到待回答问题中的关键词为“为什么”、“A产品”和“购买失败”。
步骤S20,根据所述关键词在预设意图词库中查找对应的意图词汇,根据所述意图词汇确定所述待回答问题对应的目标意图。
当得到待回答问题中的关键词后,根据关键词在预设意图词库中查找对应的意图词汇,根据所查找到的意图词汇确定待回答问题对应的目标意图。其中,在问题回答设备中,预先存储了意图词库,在意图词库中,每一意图词汇都存在对应的意图。因此,通过在预设意图词库中所查找的意图词汇即可确定待回答问题对应的目标意图。如预设意图词库中存储了“为什么”,“怎么办”等意图词汇,“为什么”对应的意图为原因意图,“怎么办”对应的意图为解释意图。如当在预设意图词库中查找到与关键词“为什么”一致的意图词汇“为什么”时,即可确定待回答问题对应的目标意图为原因意图。
步骤S30,确定所述待回答问题中的主语实体词,根据所述主语实体词和所述目标意图在预设知识图谱中确定谓词候选集,并在所述关键词中确定谓语关键词。
当根据关键词确定目标意图后,通过命名实体识别算法确定待回答问题中的主语实体词。当确定待回答问题中的主语实体词后,根据主语实体词和目标意图在预设知识图谱中确定谓词候选集,并在关键词中确定谓语关键词。其中,在预设知识图谱中,共有四个槽位,其中三个槽位为三元组,另一个槽位是增加在三元组外面的意图槽位,即这四个槽位分别为:意图→主语→谓词→答案。由此可知,当确定目标意图和主语实体词后,根据主语实体词和目标意图即可在知识图谱中确定谓词候选集,谓词候选集是由谓词和答案组成的。在谓词候选集中,同一个意图和同一个主语可能对应着不同的谓词,不同的谓词对应着不同的答案。
在本实施例中,在所提取的关键词中,除了与目标意图对应的意图词汇和主语实体词外,将剩下的分词词语确定为谓语关键词。如将待回答问题中的“为什么”、“A产品”和“购买失败”中的意图词汇“为什么”和主语实体词“A产品”去掉,得到谓语关键词为“购买失败”。
进一步,当待回答问题中的关键词存在至少两个谓语关键词时,则将该谓语关键词进行拼接,得到一个最终的谓语关键词。如待回答问题的关键词中存在的谓语关键词为“转入”、“账户”和“失败”,则将“转入”、“账户”和“失败”进行拼接,所得为谓语关键词为“转入账户失败”。
步骤S40,根据预设算法检测是否在所述谓词候选集中查找到与所述谓语关键词对应的目标谓词。
当得到谓语关键词后,根据预设算法检测是否在谓词候选集中查找到与谓语关键词对应的目标谓词。如预设算法可为:将谓语关键词与谓词候选集中的谓词进行匹配,当在谓词候选集中查找到与谓语关键词相同的谓词时,将在谓词候选集中所查找到的谓词作为目标谓词;若在谓词候选集中未查找到与谓语关键词相同的谓词时,确定在谓词候选集中未查找到目标谓词。
步骤S50,若在所述谓词候选集中查找到所述目标谓词,则根据所述目标谓词确定所述待回答问题对应的答案,并输出所述答案。
若确定在谓词候选集中查找到目标谓词,则根据所确定的目标谓词确定待回答问题对应的答案,并在其显示界面中输出该答案,以供用户查看。可以理解的是,在谓词候选集中,一个谓词对应一个答案,因此在确定目标谓词后,即可确定对应的答案。
进一步地,所述步骤S40之后,问题回答方法还包括:
步骤c,若在所述谓词候选集中未查找到所述目标谓词,则输出提示信息,以根据所述提示信息提示用户未查找到与所述待回答问题对应的答案。
即,若在谓词候选集中未查找到目标谓词,则生成提示信息,并将该提示信息输出至显示界面中,以根据所述提示信息提示用户未查找到与待回答问题对应的答案。其中,提示信息的输出形式包括但不限于文字形式和语音形式,如可在显示界面中输出“未查找到答案”的文字信息提示用户。
本实施例通过当接收到待回答问题后,删除待回答问题中的停用词,以提取待回答问题中的关键词;根据关键词在预设意图词库中查找对应的意图词汇,根据意图词汇确定待回答问题对应的目标意图;确定待回答问题中主语实体词,根据主语实体词和目标意图在预设知识图谱中确定谓词候选集,并确定关键词中的谓语关键词;根据预设算法检测是否在谓词候选集中查找到与谓语关键词对应的目标谓词;若在谓词候选集中查找到目标谓词,则根据目标谓词确定待回答问题对应的答案,并输出答案。实现了在利用知识图谱回答问题过程中,对用户问题意图进行分析,以根据分析结果确定待回答问题的目标谓词,从而确定答案,回答用户原因类或者解释类等类型的问题,提高了问题回答的准确率。
进一步地,提出本发明问题回答方法第二实施例。
所述问题回答方法第二实施例与所述问题回答方法第一实施例的区别在于,参照图3,步骤S40包括:
步骤S41,确定所述谓词候选集中各个谓词词组对应的正则表达式,将所述谓语关键词与所述正则表达式进行匹配。
当确定谓词候选集后,确定谓词候选集中各个谓词词组对应的正则表达式,将所确定的谓语关键词与谓词候选集中的正则表达式进行匹配。正则表达式通常用来检索、替换符合某个模式(规则)的文本。如若谓词词组“转入失败”,对应的正则表达式为“转入*失败”;谓词词组“购买失败”,对应的正则表达式为“购买*失败”。
需要说明的是,若谓语关键词的表达模式符合正则表达式的表达逻辑,则确定谓语关键词与正则表达式匹配成功;若谓语关键词的表达模式不符合正则表达式的表达逻辑,则确定谓语关键词与正则表达式匹配失败。如当谓语关键词为“转入账户失败”,则可确定“转入账户失败”与正则表达式“转入*失败”匹配成功。可以理解的是,正则表达式中的“*”表示其它任意字符。
步骤S42,若所述谓语关键词与所述正则表达式匹配成功,则将匹配成功的正则表达式对应的谓词词组记为目标谓词。
步骤S43,若所述谓语关键词与所述正则表达式匹配失败,则确定在所述谓词候选集中未查找到所述目标谓词。
若确定谓语关键词与正则表达式匹配成功,则将匹配成功的正则表达式对应的谓词词组记为目标谓词;若确定谓语关键词与正则表达式匹配失败,则确定在谓词候选集中未查找到目标谓词。如若确定正则表达式“购买*失败”与谓语关键词匹配成功,则确定的目标谓词为“购买失败”。
需要说明的是,本实施例是通过正则表达式算法进行匹配,在通过正则表达式算法匹配失败的时候,还可通过下文第三实施例中的相似度算法的方式进行目标谓词的查找。
本实施例通过正则表达式在谓词候选集中查找对应的目标谓词,以实现谓语关键词的正则软匹配,提高了在谓词候选集中查找到目标谓词的成功率,进一步地提高了问题回答的准确率,以及提高了回答问题的召回率(召回率为根据待回答问题在知识图谱中查找到答案的数量与知识图谱中答案总数量之间的比例)。
进一步地,提出本发明问题回答方法第三实施例。
所述问题回答方法第三实施例与所述问题回答方法第一或第二实施例的区别在于,参照图4,步骤S40还包括:
步骤S44,确定所述谓词候选集中的候选谓词,将所述谓语关键词和所述候选谓词输入预设的词向量模型中,对应得到谓语关键词向量和候选谓词向量。
当得到谓语关键词和确定谓词候选集后,确定谓词候选集中的候选谓词。可以理解的是,在谓语候选集中,存在多个候选谓词。将谓语关键词输入预设的词向量模型中,得到谓语关键词向量;将候选谓词输入预设的词向量模型中,得到候选谓词向量。其中,词向量模型是预先训练好,存储在问题回答设备中的。
步骤S45,将所述谓语关键词和所述候选谓词输入预设的字向量模型中,对应得到谓语关键词字向量和候选谓词字向量。
当得到谓语关键词和候选谓词后,将谓语关键词输入预设的字向量模型中,得到谓语关键词字向量;并将候选谓词输入预设的字向量模型中,得到候选谓词字向量。其中,字向量模型是预先训练好,存储在问题回答设备中的。
步骤S46,根据所述谓语关键词向量和所述候选谓词向量计算词向量余弦距离,以及根据所述谓语关键词字向量和所述候选谓词字向量计算字向量余弦距离。
当得到谓语关键词向量和候选谓词向量后,通过余弦距离公式计算谓语关键词向量和候选谓词向量之间的词向量余弦距离。当得到谓语关键词字向量和候选谓词字向量后,通过余弦距离公式计算谓语关键词字向量和候选谓词字向量之间的字向量余弦距离。
在本实施例中,余弦距离公式的表达式为:
其中,(x1,y1),(x2,y2)分别表示两个向量的坐标。如(x1,y1)可用于表示谓语关键词向量或谓语关键字向量,(x2,y2)可用于表示候选谓词向量或谓语字向量。
步骤S47,根据所述词向量余弦距离和所述字向量余弦距离确定所述谓语关键词和所述候选谓词之间的相似度。
当计算出词向量余弦距离和字向量余弦距离后,根据词向量余弦距离和字向量余弦距离确定谓语关键词和候选谓词之间的相似度。
需要说明的是,本实施例是通过相似度算法进行匹配,在通过相似度算法匹配失败的时候,还可通过上文第二实施例所述的正则表达式算法的方式进行目标谓词的查找。
进一步地,步骤S47包括:
步骤d,判断所述词向量余弦距离是否大于所述字向量余弦距离。
步骤e,若所述词向量余弦距离大于所述字向量余弦距离,则确定所述词向量余弦距离为所述谓语关键词和所述候选谓词之间的相似度。
步骤f,若所述词向量余弦距离小于所述字向量余弦距离,则确定所述字向量余弦距离为所述谓语关键词和所述候选谓词之间的相似度。
进一步地,根据词向量余弦距离和字向量余弦距离确定谓语关键词和候选谓词之间的相似度的具体过程为:判断词向量余弦距离是否大于字向量余弦距离,若词向量余弦距离大于字向量余弦距离,则确定词向量余弦距离为谓语关键词和候选谓词之间的相似度;若词向量余弦距离小于字向量余弦距离,则确定字向量余弦距离为谓语关键词和候选谓词之间的相似度。可以理解的是,当词向量余弦距离等于字向量余弦距离时,可将词向量余弦距离或者字向量余弦距离作为谓语关键词和候选谓词之间的相似度。需要说明的是,词向量余弦距离和字向量余弦距离对应的值为大于或者等于0,小于或者等于1的值,因此,在确定字向量余弦距离为谓语关键词和候选谓词之间的相似度过程中,可将词向量余弦距离或字向量余弦距离转换成百分数的形式。
步骤S48,若所述相似度大于或者等于预设阈值,则确定与所述相似度对应的候选谓词为目标谓词。
步骤S49,若所述相似度小于所述预设阈值,则确定在所述谓词候选集中未查找到所述目标谓词。
当确定谓语关键词和候选谓词之间的相似度后,判断谓语关键词和候选谓词之间的相似度是否大于或者等于预设阈值。若确定谓语关键词和候选谓词之间的相似度大于或者等于预设阈值,则确定与相似度对应的候选谓词为目标谓词;若确定谓语关键词和候选谓词之间的相似度小于预设阈值,则确定在谓词候选集中未查找到目标谓词。其中,预设阈值可根据具体需要而设置,如可设置为70%,75%或者85%等。如当存在3个候选谓语,分别为A候选谓语、B候选谓语和C候选谓语,预设阈值为85%时,A候选谓语与谓语关键词之间的相似度分为60%,B候选谓语与谓语关键词之间的相似度分为67%,C候选谓语与谓语关键词之间的相似度分为86%,确定C候选谓语为目标谓词。
进一步地,若存在至少两个相似度大于或者等于预设阈值的相似度,即存在多个满足条件的候选谓词,则将最大相似度对应的候选谓词作为目标谓词。
本实施例通过词向量模型和字向量模型得到对应的谓语关键词向量、候选谓词向量、谓语关键词字向量和候选谓词字向量,以计算出词向量余弦距离和字向量余弦距离,从而得到谓语关键词和候选谓词之间的相似度,根据该相似度确定待回答问题对应的目标谓词。以通过词向量模型和字向量模型在知识图谱中查找目标谓词,以确定待回答问题对应的答案,提高了回答待回答问题的准确率。
应理解,现有的知识图谱构建,需要由人工通过大量数据构建,成本较高。本发明的实施例中,通过优化后的相似度算法,对知识图谱中的候选集的少量数据进行构建即可,人工计算的数据减少,效率更高,花费的成本也较低。
进一步地,提出本发明问题回答方法第四实施例。
所述问题回答方法第四实施例与所述问题回答方法第三实施例的区别在于,参照图5,步骤S47还包括:
步骤S471,确定所述词向量余弦距离对应的第一权重,以及确定所述字向量余弦距离对应的第二权重。
在本实施例中,预先为词向量余弦距离和字向量余弦距离设置了权重。其中,将词向量余弦距离对应的权重记为第一权重,将字向量余弦距离对应的权重记为第二权重。第一权重和第二权重之间的和等于1。第一权重和第二权重之间的比例值可根据具体需要而设置,在本实施例中不做具体限制。如可将第一权重设置为0.5,第二权重也设置为0.5;或者将第一权重设置为0.4,将第二权重设置为0.6。
当得到词向量余弦距离和字向量余弦距离后,确定词向量余弦距离对应的第一权重,以及确定字向量余弦距离对应的第二权重。
步骤S472,计算所述第一权重和所述词向量余弦距离的乘积,得到第一乘积。
步骤S473,计算所述第二权重和所述字向量余弦距离的乘积,得到第二乘积。
步骤S474,计算所述第一乘积和所述第二乘积之间的和,以确定所述谓语关键词和所述候选谓词之间的相似度。
当确定第一权重和第二权重后,计算第一权重和词向量余弦距离之间的乘积,将第一权重和词向量余弦距离之间的乘积记为第一乘积;并计算第二权重和字向量余弦距离之间的乘积,将第二权重和字向量余弦距离之间的乘积记为第二乘积。当得到第一乘积和第二乘积后,将第一乘积和第二乘积相加,得到第一乘积和第二乘积之间的和,将第一乘积和第二乘积之间的和作为谓语关键词和候选谓词之间的相似度。
本实施例通过词向量余弦距离对应的第一权重,以及字向量余弦距离对应的第二权重计算出谓语关键词和候选谓词之间的相似度,根据该相似度确定待回答问题对应的目标谓词,以确定待回答问题对应的答案。应理解,本实施例中的第一权重和第二权重是根据多次试验得到的数值,通过加权求和的方式计算谓语关键词和候选谓词之间的相似度,使得相似度准确性的计算方式更高,从而提高了回答待回答问题的准确率。
进一步地,提出本发明问题回答方法第五实施例。
所述问题回答方法第五实施例与所述问题回答方法第第三或第四实施例的区别在于,问题回答方法还包括:
步骤g,获取所述预设知识图谱中的预设问题,利用结巴分词对所述预设问题进行分词,得到分词后的预设问题,并将所述预设问题转换成字符串序列,得到所述预设问题对应的字符列表。
当侦测到训练字向量模型和词向量模型之间的训练指令后,获取预设知识图谱中的预设问题,利用结巴分词对预设问题进行分词,以得到分词后的预设问题。其中,预设问题是知识图谱中预先存储的问题。结巴分词的过程为:①加载字典,生成trie树;②给定待分词的句子,即预设问题,使用正则获取连续的中文字符和英文字符,切分成短语列表,对每个短语使用DAG(Directed Acyclic Graph,有向无环图)和动态规划,得到最大概率路径,对DAG中那些没有在字典中查到的字,组合成一个新的片段短语,使用HMM(HiddenMarkov Model,隐马尔可夫模型)模型进行分词;③使用python的yield语法生成一个词语生成器,逐词语返回。进一步,在本实施例中,还可用基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法等方法对预设问题进行分词。
当获取到预设问题后,将预设问题转换成字符串序列,得到预设问题对应的字符列表。如当预设问题为“为什么转账失败”,则对应的字符列表为“为/什/么/转/账/失/败”,即将预设问题转换成一个个单独的词。
步骤h,将所述字符列表输入至预设的语言处理工具中进行训练,得到所述字向量模型。
步骤i,将所述分词后的预设问题输入至所述语言处理工具中进行训练,得到所述词向量模型。
当得到字符列表后,将字符列表输入至预先设置好的语言处理工具中进行训练,以得到字向量模型。当得到分词后的预设问题后,将分词后的预设问题输入至预设的语言处理工具中进行训练,得到对应的词向量模型。
在本实施例中,语言处理工具为word2vec,word2vec是一个计算word vector的开源工具。在word2vec中,word2vec主要分为CBOW(Continuous Bag of Words)和Skip-Gram两种模型。CBOW是从原始语句推测目标字词,CBOW模型等价于一个词袋模型的向量乘以一个embedding矩阵,从而得到一个连续的embedding向量;而Skip-Gram正好相反,是从目标字词推测出原始语句。在本实施例中,采用Skip-Gram模型。具体地,如图6所示,Skip-Gram模型在训练时会对上下文环境里的word(词)进行采样。如当需要训练的当前词为:wt,所需采样的词为wt-2,wt-1,wt+1,wt+2(语境窗口为2),通过Skip-Gram模型,会得到一个目标函数,然后优化这个目标函数,最后得到向量表征。其中,优化算法可为层次Softmax(Hierarchical Softmax)和负采样(Negative Sampling)。需要说明的是,在通过word2vec训练出字向量模型和词向量模型过程中,可结合深度学习和神经网络训练语言的方式进行训练。可以理解的是,在本实施例中,语言处理工具也可为其它可以实现与word2vec同样功能的工具,此处不做赘述。
本实施例将知识图谱中的预设问题进行处理后,输入语言处理工具中,以得到对应的字向量模型和词向量模型,以便于在后续确定待回答问题对应的答案过程中,结合字向量模型和词向量模型所得的结果确定对应的答案,提高了确定待回答问题对应答案的准确率。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有问题回答程序,所述问题回答程序被处理器执行时实现如上所述的奖励发送方法的步骤。
本发明计算机可读存储介质具体实施方式与上述问题回答方法各实施例基本相同,在此不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种问题回答方法,其特征在于,所述问题回答方法包括以下步骤:
当接收到待回答问题后,提取所述待回答问题中的关键词;
根据所述关键词在预设意图词库中查找对应的意图词汇,根据所述意图词汇确定所述待回答问题对应的目标意图;
确定所述待回答问题中的主语实体词,根据所述主语实体词和所述目标意图在预设知识图谱中确定谓词候选集,并在所述关键词中确定谓语关键词;
根据预设算法检测是否在所述谓词候选集中查找到与所述谓语关键词对应的目标谓词;
若在所述谓词候选集中查找到所述目标谓词,则根据所述目标谓词确定所述待回答问题对应的答案,并输出所述答案。
2.如权利要求1所述的问题回答方法,其特征在于,所述根据预设算法检测是否在所述谓词候选集中查找到与所述谓语关键词对应的目标谓词的步骤包括:
确定所述谓词候选集中各个谓词词组对应的正则表达式,将所述谓语关键词与所述正则表达式进行匹配;
若所述谓语关键词与所述正则表达式匹配成功,则将匹配成功的正则表达式对应的谓词词组记为目标谓词;
若所述谓语关键词与所述正则表达式匹配失败,则确定在所述谓词候选集中未查找到所述目标谓词。
3.如权利要求1所述的问题回答方法,其特征在于,所述根据预设算法检测是否在所述谓词候选集中查找到与所述谓语关键词对应的目标谓词的步骤包括:
确定所述谓词候选集中的候选谓词,将所述谓语关键词和所述候选谓词输入预设的词向量模型中,对应得到谓语关键词向量和候选谓词向量;
将所述谓语关键词和所述候选谓词输入预设的字向量模型中,对应得到谓语关键词字向量和候选谓词字向量;
根据所述谓语关键词向量和所述候选谓词向量计算词向量余弦距离,以及根据所述谓语关键词字向量和所述候选谓词字向量计算字向量余弦距离;
根据所述词向量余弦距离和所述字向量余弦距离确定所述谓语关键词和所述候选谓词之间的相似度;
若所述相似度大于或者等于预设阈值,则确定与所述相似度对应的候选谓词为目标谓词;
若所述相似度小于所述预设阈值,则确定在所述谓词候选集中未查找到所述目标谓词。
4.如权利要求3所述的问题回答方法,其特征在于,所述根据所述词向量余弦距离和所述字向量余弦距离确定所述谓语关键词和所述候选谓词之间的相似度的步骤包括:
判断所述词向量余弦距离是否大于所述字向量余弦距离;
若所述词向量余弦距离大于所述字向量余弦距离,则确定所述词向量余弦距离为所述谓语关键词和所述候选谓词之间的相似度;
若所述词向量余弦距离小于所述字向量余弦距离,则确定所述字向量余弦距离为所述谓语关键词和所述候选谓词之间的相似度。
5.如权利要求3所述的问题回答方法,其特征在于,所述根据所述词向量余弦距离和所述字向量余弦距离确定所述谓语关键词和所述候选谓词之间的相似度的步骤包括:
确定所述词向量余弦距离对应的第一权重,以及确定所述字向量余弦距离对应的第二权重;
计算所述第一权重和所述词向量余弦距离的乘积,得到第一乘积;
计算所述第二权重和所述字向量余弦距离的乘积,得到第二乘积;
计算所述第一乘积和所述第二乘积之间的和,以确定所述谓语关键词和所述候选谓词之间的相似度。
6.如权利要求3所述的问题回答方法,其特征在于,所述当接收到待回答问题后,提取所述待回答问题中的关键词的步骤之前,还包括:
获取所述预设知识图谱中的预设问题,将所述预设问题转换成字符串序列,得到所述预设问题对应的字符列表,并利用结巴分词对所述预设问题进行分词,得到分词后的预设问题;
将所述字符列表输入至预设的语言处理工具中进行训练,得到所述字向量模型;
将所述分词后的预设问题输入至所述语言处理工具中进行训练,得到所述词向量模型。
7.如权利要求1所述的问题回答方法,其特征在于,所述当接收到待回答问题后,提取所述待回答问题中的关键词的步骤包括:
当接收到待回答问题后,将所述待回答问题进行分词划分,得到所述待回答问题中的分词词语;
将所述分词词语与预设停用词进行对比,将与所述预设停用词一致的词语从所述分词词语中删除,得到所述待回答问题中的关键词。
8.如权利要求1至7任一项所述的问题回答方法,其特征在于,所述根据预设算法检测是否在所述谓词候选集中查找到与所述谓语关键词对应的目标谓词的步骤之后,还包括:
若在所述谓词候选集中未查找到所述目标谓词,则输出提示信息,以根据所述提示信息提示用户未查找到与所述待回答问题对应的答案。
9.一种问题回答设备,其特征在于,所述问题回答设备包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的问题回答程序,所述问题回答程序被所述处理器执行时实现如权利要求1至8中任一项所述的问题回答方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有问题回答程序,所述问题回答程序被处理器执行时实现如权利要求1至8中任一项所述的问题回答方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810782426.5A CN109033305B (zh) | 2018-07-16 | 2018-07-16 | 问题回答方法、设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810782426.5A CN109033305B (zh) | 2018-07-16 | 2018-07-16 | 问题回答方法、设备及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109033305A true CN109033305A (zh) | 2018-12-18 |
CN109033305B CN109033305B (zh) | 2022-04-01 |
Family
ID=64643375
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810782426.5A Active CN109033305B (zh) | 2018-07-16 | 2018-07-16 | 问题回答方法、设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109033305B (zh) |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110046235A (zh) * | 2019-03-18 | 2019-07-23 | 阿里巴巴集团控股有限公司 | 一种知识库评估方法、装置及设备 |
CN110059243A (zh) * | 2019-03-21 | 2019-07-26 | 广东瑞恩科技有限公司 | 数据引擎优化方法、装置、设备和计算机可读存储介质 |
CN110069631A (zh) * | 2019-04-08 | 2019-07-30 | 腾讯科技(深圳)有限公司 | 一种文本处理方法、装置以及相关设备 |
CN110197196A (zh) * | 2019-04-15 | 2019-09-03 | 阿里巴巴集团控股有限公司 | 问题处理方法、装置、电子设备以及存储介质 |
CN110263127A (zh) * | 2019-06-21 | 2019-09-20 | 北京创鑫旅程网络技术有限公司 | 基于用户查询词进行文本搜索方法及装置 |
CN110309378A (zh) * | 2019-06-28 | 2019-10-08 | 深圳前海微众银行股份有限公司 | 一种问题答复的处理方法、装置及系统 |
CN110502608A (zh) * | 2019-07-05 | 2019-11-26 | 平安科技(深圳)有限公司 | 基于知识图谱的人机对话方法及人机对话装置 |
CN110807325A (zh) * | 2019-10-18 | 2020-02-18 | 腾讯科技(深圳)有限公司 | 谓词识别方法、装置及存储介质 |
CN110991183A (zh) * | 2019-12-06 | 2020-04-10 | 北京百度网讯科技有限公司 | 问题的谓词确定方法、装置、设备及存储介质 |
CN111325037A (zh) * | 2020-03-05 | 2020-06-23 | 苏宁云计算有限公司 | 文本意图识别方法、装置、计算机设备和存储介质 |
CN111353290A (zh) * | 2020-02-28 | 2020-06-30 | 支付宝(杭州)信息技术有限公司 | 一种自动响应用户询问的方法和系统 |
CN111538844A (zh) * | 2020-03-20 | 2020-08-14 | 华为技术有限公司 | 目标领域知识库的生成、问题解答方法及装置 |
CN111552819A (zh) * | 2020-04-28 | 2020-08-18 | 腾讯科技(深圳)有限公司 | 一种实体提取方法、装置及可读存储介质 |
CN111581365A (zh) * | 2020-05-07 | 2020-08-25 | 北京理工大学 | 一种谓词抽取方法 |
CN111881266A (zh) * | 2019-07-19 | 2020-11-03 | 马上消费金融股份有限公司 | 一种应答方法及装置 |
CN111914073A (zh) * | 2020-07-15 | 2020-11-10 | 中国联合网络通信集团有限公司 | 客服应答方法、装置、设备及存储介质 |
CN113268563A (zh) * | 2021-05-24 | 2021-08-17 | 平安科技(深圳)有限公司 | 基于图神经网络的语义召回方法、装置、设备及介质 |
CN113468306A (zh) * | 2021-06-30 | 2021-10-01 | 西安乾阳电子科技有限公司 | 语音对话方法、装置、电子设备及存储介质 |
CN113742447A (zh) * | 2021-07-19 | 2021-12-03 | 暨南大学 | 基于查询路径生成的知识图谱问答方法、介质和设备 |
CN116739003A (zh) * | 2023-06-01 | 2023-09-12 | 中国南方电网有限责任公司 | 电网管理智能问答实现方法、装置、电子设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105653671A (zh) * | 2015-12-29 | 2016-06-08 | 畅捷通信息技术股份有限公司 | 相似信息推荐方法及系统 |
CN106095932A (zh) * | 2016-06-13 | 2016-11-09 | 竹间智能科技(上海)有限公司 | 百科知识问句识别方法及装置 |
CN106934012A (zh) * | 2017-03-10 | 2017-07-07 | 上海数眼科技发展有限公司 | 一种基于知识图谱的自然语言问答实现方法和系统 |
CN107451230A (zh) * | 2017-07-24 | 2017-12-08 | 宗晖(上海)机器人有限公司 | 一种问答方法以及问答系统 |
US20180082183A1 (en) * | 2011-02-22 | 2018-03-22 | Thomson Reuters Global Resources | Machine learning-based relationship association and related discovery and search engines |
CN107977393A (zh) * | 2017-05-22 | 2018-05-01 | 海南大学 | 一种面向5w问答的基于数据图谱、信息图谱、知识图谱和智慧图谱的推荐引擎设计方法 |
CN107977415A (zh) * | 2017-11-22 | 2018-05-01 | 北京寻领科技有限公司 | 自动问答方法及装置 |
-
2018
- 2018-07-16 CN CN201810782426.5A patent/CN109033305B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180082183A1 (en) * | 2011-02-22 | 2018-03-22 | Thomson Reuters Global Resources | Machine learning-based relationship association and related discovery and search engines |
CN105653671A (zh) * | 2015-12-29 | 2016-06-08 | 畅捷通信息技术股份有限公司 | 相似信息推荐方法及系统 |
CN106095932A (zh) * | 2016-06-13 | 2016-11-09 | 竹间智能科技(上海)有限公司 | 百科知识问句识别方法及装置 |
CN106934012A (zh) * | 2017-03-10 | 2017-07-07 | 上海数眼科技发展有限公司 | 一种基于知识图谱的自然语言问答实现方法和系统 |
CN107977393A (zh) * | 2017-05-22 | 2018-05-01 | 海南大学 | 一种面向5w问答的基于数据图谱、信息图谱、知识图谱和智慧图谱的推荐引擎设计方法 |
CN107451230A (zh) * | 2017-07-24 | 2017-12-08 | 宗晖(上海)机器人有限公司 | 一种问答方法以及问答系统 |
CN107977415A (zh) * | 2017-11-22 | 2018-05-01 | 北京寻领科技有限公司 | 自动问答方法及装置 |
Cited By (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110046235A (zh) * | 2019-03-18 | 2019-07-23 | 阿里巴巴集团控股有限公司 | 一种知识库评估方法、装置及设备 |
CN110046235B (zh) * | 2019-03-18 | 2023-06-02 | 创新先进技术有限公司 | 一种知识库评估方法、装置及设备 |
CN110059243A (zh) * | 2019-03-21 | 2019-07-26 | 广东瑞恩科技有限公司 | 数据引擎优化方法、装置、设备和计算机可读存储介质 |
CN110059243B (zh) * | 2019-03-21 | 2024-05-07 | 广东瑞恩科技有限公司 | 数据引擎优化方法、装置、设备和计算机可读存储介质 |
CN110069631A (zh) * | 2019-04-08 | 2019-07-30 | 腾讯科技(深圳)有限公司 | 一种文本处理方法、装置以及相关设备 |
CN110069631B (zh) * | 2019-04-08 | 2022-11-29 | 腾讯科技(深圳)有限公司 | 一种文本处理方法、装置以及相关设备 |
CN110197196A (zh) * | 2019-04-15 | 2019-09-03 | 阿里巴巴集团控股有限公司 | 问题处理方法、装置、电子设备以及存储介质 |
CN110197196B (zh) * | 2019-04-15 | 2023-02-07 | 创新先进技术有限公司 | 问题处理方法、装置、电子设备以及存储介质 |
CN110263127A (zh) * | 2019-06-21 | 2019-09-20 | 北京创鑫旅程网络技术有限公司 | 基于用户查询词进行文本搜索方法及装置 |
CN110309378A (zh) * | 2019-06-28 | 2019-10-08 | 深圳前海微众银行股份有限公司 | 一种问题答复的处理方法、装置及系统 |
WO2021003819A1 (zh) * | 2019-07-05 | 2021-01-14 | 平安科技(深圳)有限公司 | 基于知识图谱的人机对话方法及人机对话装置 |
CN110502608A (zh) * | 2019-07-05 | 2019-11-26 | 平安科技(深圳)有限公司 | 基于知识图谱的人机对话方法及人机对话装置 |
CN110502608B (zh) * | 2019-07-05 | 2023-10-10 | 平安科技(深圳)有限公司 | 基于知识图谱的人机对话方法及人机对话装置 |
CN111881266A (zh) * | 2019-07-19 | 2020-11-03 | 马上消费金融股份有限公司 | 一种应答方法及装置 |
CN110807325A (zh) * | 2019-10-18 | 2020-02-18 | 腾讯科技(深圳)有限公司 | 谓词识别方法、装置及存储介质 |
CN110807325B (zh) * | 2019-10-18 | 2023-05-26 | 腾讯科技(深圳)有限公司 | 谓词识别方法、装置及存储介质 |
CN110991183A (zh) * | 2019-12-06 | 2020-04-10 | 北京百度网讯科技有限公司 | 问题的谓词确定方法、装置、设备及存储介质 |
CN111353290B (zh) * | 2020-02-28 | 2023-07-14 | 支付宝(杭州)信息技术有限公司 | 一种自动响应用户询问的方法和系统 |
CN111353290A (zh) * | 2020-02-28 | 2020-06-30 | 支付宝(杭州)信息技术有限公司 | 一种自动响应用户询问的方法和系统 |
CN111325037B (zh) * | 2020-03-05 | 2022-03-29 | 苏宁云计算有限公司 | 文本意图识别方法、装置、计算机设备和存储介质 |
CN111325037A (zh) * | 2020-03-05 | 2020-06-23 | 苏宁云计算有限公司 | 文本意图识别方法、装置、计算机设备和存储介质 |
CN111538844B (zh) * | 2020-03-20 | 2022-03-25 | 华为技术有限公司 | 目标领域知识库的生成、问题解答方法及装置 |
CN111538844A (zh) * | 2020-03-20 | 2020-08-14 | 华为技术有限公司 | 目标领域知识库的生成、问题解答方法及装置 |
CN111552819A (zh) * | 2020-04-28 | 2020-08-18 | 腾讯科技(深圳)有限公司 | 一种实体提取方法、装置及可读存储介质 |
CN111552819B (zh) * | 2020-04-28 | 2022-07-15 | 腾讯科技(深圳)有限公司 | 一种实体提取方法、装置及可读存储介质 |
CN111581365B (zh) * | 2020-05-07 | 2023-04-25 | 北京理工大学 | 一种谓词抽取方法 |
CN111581365A (zh) * | 2020-05-07 | 2020-08-25 | 北京理工大学 | 一种谓词抽取方法 |
CN111914073A (zh) * | 2020-07-15 | 2020-11-10 | 中国联合网络通信集团有限公司 | 客服应答方法、装置、设备及存储介质 |
CN113268563A (zh) * | 2021-05-24 | 2021-08-17 | 平安科技(深圳)有限公司 | 基于图神经网络的语义召回方法、装置、设备及介质 |
CN113268563B (zh) * | 2021-05-24 | 2022-06-17 | 平安科技(深圳)有限公司 | 基于图神经网络的语义召回方法、装置、设备及介质 |
CN113468306A (zh) * | 2021-06-30 | 2021-10-01 | 西安乾阳电子科技有限公司 | 语音对话方法、装置、电子设备及存储介质 |
CN113742447A (zh) * | 2021-07-19 | 2021-12-03 | 暨南大学 | 基于查询路径生成的知识图谱问答方法、介质和设备 |
CN113742447B (zh) * | 2021-07-19 | 2024-04-02 | 暨南大学 | 基于查询路径生成的知识图谱问答方法、介质和设备 |
CN116739003A (zh) * | 2023-06-01 | 2023-09-12 | 中国南方电网有限责任公司 | 电网管理智能问答实现方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109033305B (zh) | 2022-04-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109033305A (zh) | 问题回答方法、设备及计算机可读存储介质 | |
CN110096570B (zh) | 一种应用于智能客服机器人的意图识别方法及装置 | |
CN110377911B (zh) | 对话框架下的意图识别方法和装置 | |
CN108874782B (zh) | 一种层次注意力lstm和知识图谱的多轮对话管理方法 | |
CN108304372B (zh) | 实体提取方法和装置、计算机设备和存储介质 | |
US8750489B2 (en) | System and method for automatic call segmentation at call center | |
CN111325029B (zh) | 一种基于深度学习集成模型的文本相似度计算方法 | |
CN111708869B (zh) | 人机对话的处理方法及装置 | |
CN110276023B (zh) | Poi变迁事件发现方法、装置、计算设备和介质 | |
CN110222178A (zh) | 文本情感分类方法、装置、电子设备及可读存储介质 | |
CN111444344B (zh) | 实体分类方法、装置、计算机设备和存储介质 | |
CN113094578B (zh) | 基于深度学习的内容推荐方法、装置、设备及存储介质 | |
CN106294344A (zh) | 视频检索方法和装置 | |
CN110825867B (zh) | 相似文本推荐方法、装置、电子设备和存储介质 | |
CN109299228A (zh) | 计算机执行的文本风险预测方法及装置 | |
CN113505200B (zh) | 一种结合文档关键信息的句子级中文事件检测的方法 | |
CN108959305A (zh) | 一种基于互联网大数据的事件抽取方法及系统 | |
CN113254643B (zh) | 文本分类方法、装置、电子设备和 | |
CN113742733B (zh) | 阅读理解漏洞事件触发词抽取和漏洞类型识别方法及装置 | |
CN111222330B (zh) | 一种中文事件的检测方法和系统 | |
CN112732871A (zh) | 一种机器人催收获取客户意向标签的多标签分类方法 | |
CN109933792A (zh) | 基于多层双向lstm和验证模型的观点型问题阅读理解方法 | |
CN111274822A (zh) | 语义匹配方法、装置、设备及存储介质 | |
CN111177402A (zh) | 基于分词处理的评价方法、装置、计算机设备及存储介质 | |
CN112100377A (zh) | 文本分类方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |