CN110866093A - 机器问答方法及装置 - Google Patents

机器问答方法及装置 Download PDF

Info

Publication number
CN110866093A
CN110866093A CN201810910961.4A CN201810910961A CN110866093A CN 110866093 A CN110866093 A CN 110866093A CN 201810910961 A CN201810910961 A CN 201810910961A CN 110866093 A CN110866093 A CN 110866093A
Authority
CN
China
Prior art keywords
entity
question
intention
determining
probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810910961.4A
Other languages
English (en)
Inventor
陈明威
谭泽汉
马雅奇
陈彦宇
陈功
孙秀丹
仲丽君
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gree Electric Appliances Inc of Zhuhai
Original Assignee
Gree Electric Appliances Inc of Zhuhai
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gree Electric Appliances Inc of Zhuhai filed Critical Gree Electric Appliances Inc of Zhuhai
Priority to CN201810910961.4A priority Critical patent/CN110866093A/zh
Publication of CN110866093A publication Critical patent/CN110866093A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本申请提供了一种机器问答方法及装置,其中,该方法包括:接收输入的问题,使用第一模型获取问题的实体信息,使用第二模型确定问题的问题意图,然后依据获取的实体信息和/或问题意图,在预设的空调领域的知识图谱中确定该问题的答案,后续可以将该答案输出,其中,第一模型和第二模型是之前训练好的。采用上述技术方案,解决了相关技术中机器问答系统的精准性较低的问题,将问题的实体信息和问题意图相结合,更为精准地确定了问题的答案。

Description

机器问答方法及装置
技术领域
本申请涉及通信领域,具体而言,涉及一种机器问答方法及装置。
背景技术
在相关技术中,随着人工智能、深度学习的快速发展,搜索引擎从全文搜索逐渐向精准搜索转变。越来越多的企业借助互联网提供在线客服来解决用户常规问题;很明显对于全国甚至全球的用户请求,人工客服耗费巨大,时效性差;智能问答系统通过自动回复来解决用户常用问题,能够很好地解决这个问题。
常规智能问答系统的流程为:
1、根据用户问题,提取关键词;
2、提取的关键词与数据库中的答案关键词进行匹配得到相似度,
3、对相似度进行排序,得到最终答案返回。
其中在关键词提取可以利用tf-idf等方法为关键词设定权重。
对于方法一,关键词仍然不能作为整个句子关键信息,许多句子关键词相似但是句子语义完全不同,实际效果较差。
对于方法二,虽然添加了权重信息,但并没有很好的与答案信息进行整合,得到的结果也是差强人意。
因此需要一个既涵盖了整体数据的知识又能包含问题上下文场景的领域智能问答系统,来提升领域智能问答的准确性。
针对相关技术中机器问答系统的精准性较低的问题,目前还没有有效的解决方案。
发明内容
本申请实施例提供了一种机器问答方法及装置,以至少解决相关技术中机器问答系统的精准性较低的问题。
根据本申请的一个实施例,提供了一种机器问题方法及装置,包括:接收输入的问题;使用第一模型获取所述问题的实体信息;使用第二模型确定所述问题的问题意图;依据所述实体信息和/或所述问题意图,搜索预设空调领域的知识图谱,确定所述问题的答案。
根据本发明的另一个实施例,还提供了一种机器问答的装置,包括:接收模块,用于接收输入的问题;获取模块,用于使用第一模型获取所述问题的实体信息;第一确定模块,用于使用第二模型确定所述问题的问题意图;第二确定模块,用于依据所述实体信息和/或所述问题意图,搜索预设空调领域的知识图谱,确定所述问题的答案。
根据本申请的又一个实施例,还提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
根据本申请的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
通过本申请,接收输入的问题,使用第一模型获取问题的实体信息,使用第二模型确定问题的问题意图,然后依据获取的实体信息和/或问题意图,在预设的空调领域的知识图谱中确定该问题的答案,后续可以将该答案输出,其中,第一模型和第二模型是之前训练好的。采用上述技术方案,解决了相关技术中机器问答系统的精准性较低的问题,将问题的实体信息和问题意图相结合,更为精准地确定了问题的答案。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是本申请实施例的一种机器问答的方法的计算机终端的硬件结构框图;
图2是根据本申请实施例的一种机器问答的方法的流程图;
图3是根据本申请另一个实施例的基于知识图谱开放域问答系统的架构示意图;
图4是根据本申请另一个实施例的整个问答系统流程图;
图5是根据本申请另一个实施例的空调领域知识库训练数据集的示意图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本申请。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
实施例一
本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在计算机终端上为例,图1是本申请实施例的一种机器问答的方法的计算机终端的硬件结构框图。如图1所示,计算机终端10可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,可选地,上述计算机终端还可以包括用于通信功能的传输装置106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述计算机终端的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储应用软件的软件程序以及模块,如本申请实施例中的一种机器问答的方法对应的程序指令/模块,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
本申请针对空调专有领域构建基于知识图谱问答系统,解决实体抽取不够具有领域性,并且对于基于模板的意图没有考虑上下文的问题进行研究解决。
本申请文件的技术方案,可以运行于智能机器人等智能终端中,也可以应用于终端的应用程序APP中,不局限于上述举例。
在本实施例中提供了一种运行于上述计算机终端的一种机器问答的方法,图2是根据本申请实施例的一种机器问答的方法的流程图,如图2所示,该流程包括如下步骤:
步骤S202,接收输入的问题;
该问题可以是文本形式,或者语音形式输入等。
步骤S204,使用第一模型获取所述问题的实体信息;
步骤S206,使用第二模型确定所述问题的问题意图;
步骤S208,依据所述实体信息和/或所述问题意图,搜索预设空调领域的知识图谱,确定所述问题的答案。
该预设空调领域的知识图谱可以是依据大量的空调领域的数据建立的。
通过上述步骤,接收输入的问题,使用第一模型获取问题的实体信息,使用第二模型确定问题的问题意图,然后依据获取的实体信息和/或问题意图,在预设的空调领域的知识图谱中确定该问题的答案,后续可以将该答案输出,其中,第一模型和第二模型是之前训练好的。采用上述技术方案,解决了相关技术中机器问答系统的精准性较低的问题,将问题的实体信息和问题意图相结合,更为精准地确定了问题的答案。
可选地,上述步骤的执行主体可以为计算机终端,机器人等,但不限于此。
可选地,步骤S204和步骤S206的执行顺序是可以互换的,即可以先执行步骤S206,然后再执行S204,也可以同步执行,不限定使用第一模型和第二模型的顺序。
可选地,依据第一模型获取所述问题的实体信息,包括:将所述问题的整句进行编码形成多个字符向量;将所述多个字符向量输入第一LSTM-CRF模型进行识别,依据识别结果确定多个字符向量是否为实体位置的实体概率;依据所述多个字符向量的实体概率确定所述问题的实体信息。上述识别实体位置可以是,识别问题中的哪几个字词拥有实际含义,例如“格力电器总部位于哪里”的问题中,“格力电器总部”是实体信息,可以对应“珠海市什么区什么街道”的地址的。当然不排除还对应其他信息,例如格力电器总部的员工人数等,可以依据该问题的意图进一步确定问题的答复。
每个字符向量是否为实体位置,可以包括是实体信息的开始位置,或者是实体信息的中间位置,或者是实体信息的结束位置,或者是非实体信息。
依据每个字符向量是否为实体信息的概率,确定该问题中是实体信息中字符向量,最终确定该问题中的实体信息。
可选地,依据所述多个字符向量的实体概率确定所述问题的实体信息,包括:依据所述多个字符向量的实体概率确定切割实体分词的位置信息;依据所述实体分词形成所述问题的问题模板,其中,依据所述实体分词的实体概率,和所述实体信息的在概念库中不同概念的概率确定所述问题模板的概率。采用上述技术方案,依据字符向量的实体概率,将该问题进行切割实体分词,依据实体分词形成问题模板,问题模板可以是预设的多个模板,例如问地址的模板,问公司规模的模板,介绍某款产品的模板等。
可选地,依据所述实体分词的实体概率,和所述实体分词的对应不同概念的概率确定所述问题模板的概率,包括:确定所述问题模板的概率等于,所述实体分词的实体概率乘以所述实体分词的不同概念的概率。
可选地,所述实体分词的不同概念的不同概率,包括:所述实体分词对应的实体信息在预设问题求解系统KB知识库中的不同概念的分布概率。
在KB知识库中,同一个词语可能存在不同含义,例如:空调可以包括室内空调,中央空调等。假设依据之前的大数据确定,空调是室内空调的概率为百分之八十,中央空调的概率为百分之二十,可以记此为同一实体信息在KB知识库中不同概念的分布概率。
可选地,使用第二模型确定所述问题的问题意图,包括:将所述问题的整句进行编码形成多个字符向量;将所述多个字符向量输入第二LSTM-CRF模型进行分类,依据分类结果确定多个字符向量各自的问题意图的意图概率;依据所述多个字符向量的意图概率确定所述问题的问题意图。
问题意图可以包括问题的想要问的事情,例如确定该问题是问地址的,或者是问法人代表的,或者是问空调性能参数的。
可以选取多个字符向量的意图概率最大的问题意图。
可选地,使用第二模型确定所述问题的问题意图,包括:依据所述实体分词形成所述问题的问题模板,确定所述问题模板的概率;依据所述问题模板的概率,和所述字符向量的意图概率,确定最终意图概率。
可以使用softmax函数确定最终意图概率。
可选地,依据所述实体信息和/或所述问题意图,搜索预设空调领域的知识图谱,确定所述问题的答案,包括:依据所述最终意图概率,和所述实体信息,搜索预设空调领域的知识图谱,确定所述问题的答案。
可选地,所述第一模型和所述第二模型通过以下方式获取:接收空调领域的文档信息;通过自然语言处理NLP对所述文档信息进行处理;针对处理后的所述文档信息,在确定所述文档信息存在所述知识图谱中时,将其进行实体标注或者意图标注,输出实体标注文档信息和意图标注文档信息;使用所述实体标注文档信息进行机器学习,获取所述第一模型;使用所述意图标注文档信息进行机器学习,获取所述第二模型。
上述的文档信息包括空调领域的信息,例如空调款式,空调公司信息等。
下面结合本申请另一个实施例进一步说明。
图3是根据本申请另一个实施例的基于知识图谱开放域问答系统的架构示意图,如图3所示,包括以下步骤:
步骤301,接收用户问题question;
步骤302,运用斯坦福大学模型stanford_ner进行处理;
步骤303,识别问题实体entity;
步骤304,获取到问题模板template;
步骤305,复旦大学离线模型;
步骤306,获取问题模板概率;
步骤307,依据该问题模板概率在KB知识库中获取所述用户问题的答案。
图4是根据本申请另一个实施例的整个问答系统流程图。
步骤401:本专利问答系统A(在此叙述问答系统A代表本专利系统)实现是基于FLASK框架,用户从前台输入问题question传入后台,执行步骤402、403;
进一步说明,其中查询信息可以是用户在对话框输入的空调领域文字信息,系统后台获取用户文本信息,也可以是推荐给用户文本信息,系统后台获取用户文本信息,通过语音识别软件获取用户文本信息,系统后台获取文本信息。
步骤402:根据用户问题和训练好的LSTM-CRF模型判断查询信息的实体信息概率向量,执行步骤404;
进一步说明,其中LSTM-CRF模型不在本发明之内,但是把实体识别应用在空调领域在本申请保护范围之内,数据集构造方法在本申请保护范围之内;
进一步说明,LSTM-CRF训练方法将会在附图5进行详细说明;
进一步说明,其中一个问题,例如“格力电器的总部在哪里”,首先对整个问句进行编码形成单个字符向量,以及对整个句子词性进行编码作为模型的输入,然后得到实体对应位置的概率;得到的结果形式如下:
[格:{B:0.94,I:0.01,E:0.02,O:0.03},力:{B:0.0.11,I:0.84,E:0.03,O:0.02},…,里:{B:0.01,I:0.09,E:0.10,O:0.80}]这样四类结果,其中B表示实体的开始位置,I表示实体的中间位置,E表示实体的结束位置,O表示非实体。本申请减少类别的判定增加了模型分类的准确性,同时对于复旦大学的直接使用Stanford命名实体识别的限制做了改进,提高了模型的召回率;
步骤403:根据用户问题和训练好的LSTM-CRF模型判断用户查询信息的意图概率向量,执行步骤405;
进一步说明,此步骤可与402同时进行并且思路与步骤402基本相同,此处不再详细赘述,只是得到方法结果不同,本申请采用了并行运算思想进行计算,加快搜索速度;
此步骤中的方法结果不同做进一步说明,发明把构建好的空调知识图谱的属性作为类别,进行标注最终得到问题的意图概率,例如“格力电器的总部在哪里”,最终意图分类结果为:[董事长:0.001,特性:0.0003,…,地址:0.75]。
步骤404:此步骤直接利用实体信息概率向量求取最大可能概率作为实体切割分词位置信息,在术语中为mention,执行步骤406;
步骤405:此步骤直接利用意图概率向量求取最大可能概率作为问题意图,执行步骤409;
步骤406:根据实体分词,利用mention2entity数据,找到实体唯一标识,然后利用实体对应的概念替代,形成模板,模板的概率等于实体切词概率乘以实体对应的概念的概率结果,执行步骤408;
进一步说明,mention2entity数据集映射过程属于知识图谱的知识融合过程,在此运用融合结果,得到mention对实际实体的映射,例如“格力电器的总部在哪里”中“格力电器”对应唯一标识“珠海格力电器股份有限公司”,
例如另一个问法:“格力总部地点”,“格力”唯一标识为“珠海格力电器股份有限公司”。
进一步说明,实体切词概率为405执行结果;
进一步说明,其中实体对应概率采用实体不同概念在KB中的概念分布概率;而不同于附图3的304采用微软的概念概率;
步骤408:根据步骤409的意图概率以及利用复旦大学的最大似然估计方法得到基于模板的意图概率,两个相乘得到意图部分可能概率结果;执行步骤410;
进一步说明,步骤407为复旦大学训练模块,不在本专利保护的范围内;
步骤410:利用408的意图概率和步骤409的意图概率结果,利用softmax函数求得最终意图概率,执行步骤411;
进一步说明,其中利用softmax函数添加步骤409的原因是复旦大学的模型是基于整体数据训练的意图概率,但并没有考虑当前用户问题上下文信息,因此需要添加当前问题上下文信息。Softmax函数具有在线学习功能,根据用户满意答案反馈学习,调节两个意图概率的权重。
步骤411:根据意图概率以及实际实体,搜索空调领域知识图谱,得到最终答案;
进一步说明,其中KB知识库是以三元组形式存在,根据实体以及意图得到最终答案,例如以上问题转化为:“珠海格力电器股份有限公司”,“地址”,在KB中确定答案为:广东省珠海市前山金鸡西路6号。
进一步说明,本问答系统A属于专有领域问答系统,不同答案推送要根据权限进行推送,所以得KB知识库要比开放域多权限限制。
对于本申请最重要模块,采用了空调领域知识库以及大量文档进行序列标注构造训练数据集;图5是根据本申请另一个实施例的空调领域知识库训练数据集的示意图,如图5所示,包括以下步骤:
步骤501:根据公司网站信息,公司产品信息,以及大量技术文档,得到语料库,执行步骤502;
进一步说明,此模块可以根据具体场景进行变换,展示了整个系统的可移植性,这也是整个系统的可实施的优势所在。
步骤502:对语料库进行初步nlp处理,进行整句切割,形成陈述语句,根据以句号为结束符号进行句法分析,筛选基本的主谓宾结构的语句作为序列标注候选语料。执行步骤504、505;
进一步说明,句法分析采用哈工大句法树,方法不在本专利保护范围之内。
步骤504:对于候选预料,在步骤503中进行搜索,若出现503中实体,进行序列标注;最终的标注结果输入步骤505中。
进一步说明,其中在步骤503搜索采用mapreduce思想进行并行搜索,由于KB数据非常巨大,并且搜索任务相同,满足分布式搜索条件。针对搜索的会得到两个结果,一个是实体标注结果,一个是意图标注结果。
步骤505:根据标注结果进行整理,最终得到训练数据集,执行步骤506;
进一步说明,其中训练数据集有两种结果,实体训练数据集标注例如:
“格力电器的总部在哪里”标注结果为:[格:{B:1.0,I:0.0,E:0.0,O:0.0},力:{B:0.0,I:1.0,E:0.0,O:0.0},…,里:{B:0.0,I:0.0,E:0.0,O:1.0}];意图表示实例如:[董事长:0.0,特性:0.0,…,地址:1]。
步骤506:根据标注数据,训练LSTM-CRF模型;得到步骤508,步骤507。
进一步说明:LSTM-CRF不在本专利保护范围之内;训练模型的参数调节要依据数据大小进行适当调整。模型结果不能作为不同领域的评价标准。
本实施例提供的自动问答系统,对用户的查询语句进行特定场景模型训练,提取意图以及实体,利用领域知识库做为问答候选数据集,进一步提高了自动问答系统的准确率和召回率。
上述系统中的第503、504步骤,可以有如下步骤509替代,形成替代实施例。
步骤509:收集用户常用查询信息日志,可以利用大量人工标注数据集,在已有设定意图的情况下,对每一个查询信息归类查询类别,以及对查询信息的实体进行标注,最终的到意图和实体的标注训练数据,执行505;
其中,收集用户日志信息以及意图设定方式包括但不限于如下方式:
本申请是基于公司已有的问答系统收集数据为基础进行设计;已有系统含有用户上传问题功能,因此积累的大量的用户查询信息;然后利用jieba工具对每个查询信息进行关键词提取,词性标注以及句法分析等工作;利用这三个特征,由领域专家进行标注部分数据;利用弱监督方法对未打标数据进行预测;再由专家进行修正,继而训练弱监督模型。
本方案在大量空调领域文本语料以及KB基础上,确定KB比较规整的情况下,通过KB三元组寻找包含三元组关系的文档句子,基于以上句子,对句子进行实体和意图标注,形成意图和实体的序列标注训练集,采用LSTM-CRF算法训练模型,得到实体以及问题意图关键词汇的模型。发明构建了新的训练数据集构造的方法,运用LSTM-CRF模型训练,得到实体抽取model模块,抽取更为准确。同时对问题意图增加意图识别模块和复旦大学意图模块相结合,采用softmax在线学习得到最终意图预测模型。
因此该方案对于用户问题实体抽取更为准确,实体识别更切合实际场景,为提供了不同场景的迁移模型提供了可能。
关键词或者自创词汇解释:实体识别LSTM-CRF KB知识库训练集构造。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
根据本申请的另一个实施例,还提供了一种机器问答的装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
本申请文件中的一种机器问答的装置,包括:
接收模块,用于接收输入的问题;
获取模块,用于使用第一模型获取所述问题的实体信息;
第一确定模块,用于使用第二模型确定所述问题的问题意图;
第二确定模块,用于依据所述实体信息和/或所述问题意图,搜索预设空调领域的知识图谱,确定所述问题的答案。
采用上述技术方案,解决了相关技术中机器问答系统的精准性较低的问题,将问题的实体信息和问题意图相结合,更为精准地确定了问题的答案。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
根据本申请的又一个实施例,还提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
根据本申请的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
显然,本领域的技术人员应该明白,上述的本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (12)

1.一种机器问答的方法,其特征在于,包括:
接收输入的问题;
使用第一模型获取所述问题的实体信息;
使用第二模型确定所述问题的问题意图;
依据所述实体信息和/或所述问题意图,搜索预设空调领域的知识图谱,确定所述问题的答案。
2.根据权利要求1所述的方法,其特征在于,依据第一模型获取所述问题的实体信息,包括:
将所述问题的整句进行编码形成多个字符向量;
将所述多个字符向量输入第一LSTM-CRF模型进行识别,依据识别结果确定多个字符向量是否为实体位置的实体概率;
依据所述多个字符向量的实体概率确定所述问题的实体信息。
3.根据权利要求2所述的方法,其特征在于,依据所述多个字符向量的实体概率确定所述问题的实体信息,包括:
依据所述多个字符向量的实体概率确定切割实体分词的位置信息;
依据所述实体分词形成所述问题的问题模板,其中,依据所述实体分词的实体概率,和所述实体信息的在概念库中不同概念的概率确定所述问题模板的概率。
4.根据权利要求3所述的方法,其特征在于,依据所述实体分词的实体概率,和所述实体分词的对应不同概念的概率确定所述问题模板的概率,包括:
确定所述问题模板的概率等于,所述实体分词的实体概率乘以所述实体分词的不同概念的概率。
5.根据权利要求4所述的方法,其特征在于,所述实体分词的不同概念的不同概率,包括:
所述实体分词对应的实体信息在预设问题求解系统KB知识库中的不同概念的分布概率。
6.根据权利要求1所述的方法,其特征在于,使用第二模型确定所述问题的问题意图,包括:
将所述问题的整句进行编码形成多个字符向量;
将所述多个字符向量输入第二LSTM-CRF模型进行分类,依据分类结果确定多个字符向量各自的问题意图的意图概率;
依据所述多个字符向量的意图概率确定所述问题的问题意图。
7.根据权利要求6所述的方法,其特征在于,使用第二模型确定所述问题的问题意图,包括:
依据所述实体分词形成所述问题的问题模板,确定所述问题模板的概率;
依据所述问题模板的概率,和所述字符向量的意图概率,确定最终意图概率。
8.根据权利要求7所述的方法,其特征在于,依据所述实体信息和/或所述问题意图,搜索预设空调领域的知识图谱,确定所述问题的答案,包括:
依据所述最终意图概率,和所述实体信息,搜索预设空调领域的知识图谱,确定所述问题的答案。
9.根据权利要求1所述的方法,其特征在于,所述第一模型和所述第二模型通过以下方式获取:
接收空调领域的文档信息;
通过自然语言处理NLP对所述文档信息进行处理;
针对处理后的所述文档信息,在确定所述文档信息存在所述知识图谱中时,将其进行实体标注或者意图标注,输出实体标注文档信息和意图标注文档信息;
使用所述实体标注文档信息进行机器学习,获取所述第一模型;
使用所述意图标注文档信息进行机器学习,获取所述第二模型。
10.一种机器问答的装置,其特征在于,包括:
接收模块,用于接收输入的问题;
获取模块,用于使用第一模型获取所述问题的实体信息;
第一确定模块,用于使用第二模型确定所述问题的问题意图;
第二确定模块,用于依据所述实体信息和/或所述问题意图,搜索预设空调领域的知识图谱,确定所述问题的答案。
11.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至9任一项中所述的方法。
12.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述权利要求1至9任一项中所述的方法。
CN201810910961.4A 2018-08-10 2018-08-10 机器问答方法及装置 Pending CN110866093A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810910961.4A CN110866093A (zh) 2018-08-10 2018-08-10 机器问答方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810910961.4A CN110866093A (zh) 2018-08-10 2018-08-10 机器问答方法及装置

Publications (1)

Publication Number Publication Date
CN110866093A true CN110866093A (zh) 2020-03-06

Family

ID=69650881

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810910961.4A Pending CN110866093A (zh) 2018-08-10 2018-08-10 机器问答方法及装置

Country Status (1)

Country Link
CN (1) CN110866093A (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110866094A (zh) * 2018-08-13 2020-03-06 珠海格力电器股份有限公司 指令识别方法、装置、存储介质、电子装置
CN111475631A (zh) * 2020-04-05 2020-07-31 北京亿阳信通科技有限公司 一种基于知识图谱与深度学习的疾病问答方法及装置
CN111506722A (zh) * 2020-06-16 2020-08-07 平安科技(深圳)有限公司 基于深度学习技术的知识图谱问答方法、装置及设备
CN111563150A (zh) * 2020-04-30 2020-08-21 广东美的制冷设备有限公司 空调器知识库更新方法、空调器、服务器及系统
CN111611806A (zh) * 2020-05-06 2020-09-01 北京智通云联科技有限公司 一种用于知识图谱问答的语义解析方法、系统及设备
CN112104734A (zh) * 2020-09-15 2020-12-18 北京百度网讯科技有限公司 用于推送信息的方法、装置、设备以及存储介质
CN112328755A (zh) * 2020-09-28 2021-02-05 厦门快商通科技股份有限公司 一种问答系统、问答机器人及其faq问答库召回方法
CN112347232A (zh) * 2020-11-18 2021-02-09 武汉贝多多网络科技有限公司 一种基于云计算对客体进行意图识别的方法
WO2021135429A1 (zh) * 2020-07-28 2021-07-08 平安科技(深圳)有限公司 基于知识图谱的健康信息推荐方法、装置、设备及介质
CN113297360A (zh) * 2021-04-29 2021-08-24 天津汇智星源信息技术有限公司 基于弱监督学习和联合学习机制的法律问答方法及设备
WO2022038497A1 (en) * 2020-08-18 2022-02-24 Cognius Ai Pte Ltd System and a method to create conversational artificial intelligence
CN115292461A (zh) * 2022-08-01 2022-11-04 北京伽睿智能科技集团有限公司 基于语音识别的人机交互学习方法及系统
CN111563150B (zh) * 2020-04-30 2024-04-16 广东美的制冷设备有限公司 空调器知识库更新方法、空调器、服务器及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160247068A1 (en) * 2013-11-01 2016-08-25 Tencent Technology (Shenzhen) Company Limited System and method for automatic question answering
CN106934012A (zh) * 2017-03-10 2017-07-07 上海数眼科技发展有限公司 一种基于知识图谱的自然语言问答实现方法和系统
CN107644014A (zh) * 2017-09-25 2018-01-30 南京安链数据科技有限公司 一种基于双向lstm和crf的命名实体识别方法
CN107766483A (zh) * 2017-10-13 2018-03-06 华中科技大学 一种基于知识图谱的交互式问答方法及系统
CN107977353A (zh) * 2017-10-12 2018-05-01 北京知道未来信息技术有限公司 一种基于lstm-cnn的混合语料命名实体识别方法
CN108153876A (zh) * 2017-12-26 2018-06-12 爱因互动科技发展(北京)有限公司 智能问答方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160247068A1 (en) * 2013-11-01 2016-08-25 Tencent Technology (Shenzhen) Company Limited System and method for automatic question answering
CN106934012A (zh) * 2017-03-10 2017-07-07 上海数眼科技发展有限公司 一种基于知识图谱的自然语言问答实现方法和系统
CN107644014A (zh) * 2017-09-25 2018-01-30 南京安链数据科技有限公司 一种基于双向lstm和crf的命名实体识别方法
CN107977353A (zh) * 2017-10-12 2018-05-01 北京知道未来信息技术有限公司 一种基于lstm-cnn的混合语料命名实体识别方法
CN107766483A (zh) * 2017-10-13 2018-03-06 华中科技大学 一种基于知识图谱的交互式问答方法及系统
CN108153876A (zh) * 2017-12-26 2018-06-12 爱因互动科技发展(北京)有限公司 智能问答方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
GUL KHAN SAFI QAMAS 等: "基于深度神经网络的命名实体识别方法研究", 《技术研究》 *
孙鑫等: "问答中的问句意图识别和约束条件分析", 《中文信息学报》 *
王蕾: "基于神经网络的中文命名实体识别研究", 《中国优秀硕士学位论文全文数据库 信息科技辑(月刊)计算机软件及计算机应用》 *

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110866094B (zh) * 2018-08-13 2021-04-09 珠海格力电器股份有限公司 指令识别方法、装置、存储介质、电子装置
CN110866094A (zh) * 2018-08-13 2020-03-06 珠海格力电器股份有限公司 指令识别方法、装置、存储介质、电子装置
CN111475631A (zh) * 2020-04-05 2020-07-31 北京亿阳信通科技有限公司 一种基于知识图谱与深度学习的疾病问答方法及装置
CN111563150B (zh) * 2020-04-30 2024-04-16 广东美的制冷设备有限公司 空调器知识库更新方法、空调器、服务器及系统
CN111563150A (zh) * 2020-04-30 2020-08-21 广东美的制冷设备有限公司 空调器知识库更新方法、空调器、服务器及系统
CN111611806A (zh) * 2020-05-06 2020-09-01 北京智通云联科技有限公司 一种用于知识图谱问答的语义解析方法、系统及设备
CN111611806B (zh) * 2020-05-06 2023-08-11 北京智通云联科技有限公司 一种用于知识图谱问答的语义解析方法、系统及设备
WO2021139283A1 (zh) * 2020-06-16 2021-07-15 平安科技(深圳)有限公司 基于深度学习技术的知识图谱问答方法、装置及设备
CN111506722A (zh) * 2020-06-16 2020-08-07 平安科技(深圳)有限公司 基于深度学习技术的知识图谱问答方法、装置及设备
CN111506722B (zh) * 2020-06-16 2024-03-08 平安科技(深圳)有限公司 基于深度学习技术的知识图谱问答方法、装置及设备
WO2021135429A1 (zh) * 2020-07-28 2021-07-08 平安科技(深圳)有限公司 基于知识图谱的健康信息推荐方法、装置、设备及介质
WO2022038497A1 (en) * 2020-08-18 2022-02-24 Cognius Ai Pte Ltd System and a method to create conversational artificial intelligence
CN112104734A (zh) * 2020-09-15 2020-12-18 北京百度网讯科技有限公司 用于推送信息的方法、装置、设备以及存储介质
CN112328755B (zh) * 2020-09-28 2022-08-23 厦门快商通科技股份有限公司 一种问答系统、问答机器人及其faq问答库召回方法
CN112328755A (zh) * 2020-09-28 2021-02-05 厦门快商通科技股份有限公司 一种问答系统、问答机器人及其faq问答库召回方法
CN112347232A (zh) * 2020-11-18 2021-02-09 武汉贝多多网络科技有限公司 一种基于云计算对客体进行意图识别的方法
CN113297360A (zh) * 2021-04-29 2021-08-24 天津汇智星源信息技术有限公司 基于弱监督学习和联合学习机制的法律问答方法及设备
CN115292461A (zh) * 2022-08-01 2022-11-04 北京伽睿智能科技集团有限公司 基于语音识别的人机交互学习方法及系统
CN115292461B (zh) * 2022-08-01 2024-03-12 北京伽睿智能科技集团有限公司 基于语音识别的人机交互学习方法及系统

Similar Documents

Publication Publication Date Title
CN110866093A (zh) 机器问答方法及装置
KR102288249B1 (ko) 정보 처리 방법, 단말기, 및 컴퓨터 저장 매체
CN110727779A (zh) 基于多模型融合的问答方法及系统
CN109325040B (zh) 一种faq问答库泛化方法、装置及设备
CN107656996B (zh) 基于人工智能的人机交互方法和装置
CN110781204B (zh) 目标对象的标识信息确定方法、装置、设备及存储介质
CN109308321A (zh) 一种知识问答方法、知识问答系统及计算机可读存储介质
CN110895559A (zh) 模型训练、文本处理方法、装置以及设备
CN114840671A (zh) 对话生成方法、模型的训练方法、装置、设备及介质
US20220358292A1 (en) Method and apparatus for recognizing entity, electronic device and storage medium
CN110765247A (zh) 一种用于问答机器人的输入提示方法及装置
CN110874528B (zh) 文本相似度的获取方法及装置
CN111310440A (zh) 文本的纠错方法、装置和系统
CN112632239A (zh) 基于人工智能技术的类脑问答系统
CN115470338B (zh) 一种基于多路召回的多场景智能问答方法和系统
CN108959529A (zh) 问题答案类型的确定方法、装置、设备及存储介质
CN111813923A (zh) 文本摘要方法、电子设备及存储介质
CN116737908A (zh) 知识问答方法、装置、设备和存储介质
CN114647713A (zh) 基于虚拟对抗的知识图谱问答方法、设备及存储介质
CN110866094B (zh) 指令识别方法、装置、存储介质、电子装置
CN113312924A (zh) 一种基于nlp高精解析标签的风险规则分类方法及装置
CN106407332B (zh) 基于人工智能的搜索方法和装置
CN113239698A (zh) 基于rpa及ai的信息提取方法、装置、设备及介质
CN112989829A (zh) 一种命名实体识别方法、装置、设备及存储介质
CN112749556B (zh) 多语言模型的训练方法和装置、存储介质和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200306

RJ01 Rejection of invention patent application after publication