CN110674276A

CN110674276A - 机器人自学习方法、机器人终端、装置及可读存储介质

Info

Publication number: CN110674276A
Application number: CN201910900576.6A
Authority: CN
Inventors: 周楠楠; 杨海军; 徐倩
Original assignee: WeBank Co Ltd
Current assignee: WeBank Co Ltd
Priority date: 2019-09-23
Filing date: 2019-09-23
Publication date: 2020-01-10

Abstract

本发明公开了一种机器人自学习方法，包括以下步骤：获取待回答问题，对所述待回答问题进行预处理，得到预处理后的待回答问题，而后在确定预处理后的待回答问题为有效问题时，生成预处理后的待回答问题对应的备选答案列表，接下来在获取到预处理后的待回答问题对应的用户答案时，将所述用户答案与所述备选答案列表中各个备选答案进行相似度匹配，根据匹配结果确定预处理后的待回答问题对应的目标答案。本发明还公开了一种装置、机器人终端及可读存储介质。实现了机器人终端的知识库及时更新的同时，提高了机器人回答用户问题的准确率。

Description

机器人自学习方法、机器人终端、装置及可读存储介质

技术领域

本发明涉及机器学习技术领域，尤其涉及一种机器人自学习方法、机器人终端、装置及可读存储介质。

背景技术

近年来，随着语音识别技术在机器人终端控制中的应用，机器人终端的应用领域不断扩大，广泛应用于工业、家电、通信、汽车电子、医疗、家庭服务和消费电子类产品等领域。智能机器人终端语音交互是基于语音输入的新一代交互模式，通过人机交互就可以得到反馈结果。

目前，机器人终端当被问到不在知识库中的问题时，一般都会先给出类似“我不知道哦”、“我还在学习”等默认回复，同时将这些不会的问题记录下来，由人工定期对这些问题审核，选出其中一些有意义的问题，配上回复答案更新到机器人终端的知识库中，这样不仅使得机器人终端的知识库更新具有一定的滞后性，而且耗费人力物力。

上述内容仅用于辅助理解本发明的技术方案，并不代表承认上述内容是现有技术。

发明内容

本发明的主要目的在于提供一种机器人自学习方法、机器人终端、装置及可读存储介质，旨在解决现有智能机器人终端采用人工方式定期更新知识库，导致更新滞后且效率低的技术问题。

为实现上述目的，本发明提供一种机器人自学习方法，所述的机器人自学习方法包括以下步骤：

获取待回答问题，对所述待回答问题进行预处理，得到预处理后的待回答问题；

在确定预处理后的待回答问题为有效问题时，生成预处理后的待回答问题对应的备选答案列表，其中，所述备选答案列表包括N个备选答案，所述N是正整数；

在获取到预处理后的待回答问题对应的用户答案时，将所述用户答案与所述备选答案列表中各个备选答案进行相似度匹配，根据匹配结果确定预处理后的待回答问题对应的目标答案。

进一步地，在一实施方式中，所述获取待回答问题，对所述待回答问题进行预处理，得到预处理后的待回答问题的步骤包括：

获取待回答问题，对所述待回答问题进行去口语化处理；

对去口语化后的待回答问题进行分词，得到去口语化后的待回答问题对应的词汇列表；

基于目标纠错模型确定所述词汇列表中各个词汇的评分值；

基于所述各个词汇的评分值对去口语化后的待回答问题进行纠错，得到预处理后的待回答问题。

进一步地，在一实施方式中，所述基于各个词汇的评分值对去口语化后的待回答问题进行纠错，得到预处理后的待回答问题的步骤包括：

在所述各个词汇中存在评分值小于预设分数的错误词汇时，获取所述错误词汇对应的前驱词；

基于预设的语料库以及所述前驱词，确定所述错误词汇对应的备选词汇列表；

基于所述目标纠错模型确定所述备选词汇列表中各个备选词汇的得分，并获取所述各个备选词汇的得分中的最大值；

将所述最大值对应的备选词汇替换所述错误词汇，得到预处理后的待回答问题。

进一步地，在一实施方式中，所述在确定预处理后的待回答问题为有效问题时，生成预处理后的待回答问题对应的备选答案列表的步骤包括：

在确定预处理后的待回答问题为有效问题时，获取预处理后的待回答问题对应的初始答案列表；

基于预设聚类算法对所述初始答案列表进行聚类，得到所述备选答案列表。

进一步地，在一实施方式中，所述在确定预处理后的待回答问题为有效问题时，生成预处理后的待回答问题对应的备选答案列表，与所述在获取到预处理后的待回答问题对应的用户答案时，将所述用户答案与所述备选答案列表中各个备选答案进行相似度匹配，根据匹配结果确定预处理后的待回答问题对应的目标答案的步骤之间，还包括：

在所述机器人终端当前进行人机对话时，获取人机对话的语音数据，并基于所述人机对话的语音数据确定所述用户答案。

进一步地，在一实施方式中，所述在所述机器人终端当前进行人机对话时，获取人机对话的语音数据，并基于所述人机对话的语音数据确定所述用户答案的步骤包括：

在所述机器人终端当前进行人机对话时，获取预处理后的待回答问题对应的对话问题，将所述对话问题播放给用户；

在获取到所述对话问题对应的语音数据时，确定所述对话问题对应的语音数据是否满足获取用户答案的获取条件；

在确定满足获取条件时，将预处理后的待回答问题播放给用户，并基于预处理后的待回答问题对应的语音数据确定所述用户答案。

进一步地，在一实施方式中，其特征在于，所述在获取到预处理后的待回答问题对应的用户答案时，将所述用户答案与所述备选答案列表中各个备选答案进行相似度匹配，根据匹配结果确定预处理后的待回答问题对应的目标答案的步骤包括：

基于预设算法计算所述用户答案与所述备选答案列表中各个备选答案的相似度，并确定最大相似度；

在所述最大相似度大于或等于阈值时，将所述最大相似度对应的备选答案作为所述目标答案。

进一步地，在一实施方式中，所述基于预设算法计算所述用户答案与所述备选答案列表中各个备选答案的相似度，并确定最大相似度的步骤之后，还包括：

在所述最大相似度小于阈值时，关联保存预处理后的待回答问题、所述备选答案列表以及所述用户答案至预设存储区，并发送人工检核请求处理。

进一步地，在一实施方式中，所述机器人自学习装置包括：

更新模块，用于获取待回答问题，对所述待回答问题进行预处理，得到预处理后的待回答问题；

生成模块，用于在确定预处理后的待回答问题为有效问题时，生成预处理后的待回答问题对应的备选答案列表，其中，所述备选答案列表包括N个备选答案，其中，所述N是正整数；

确定模块，用于在获取到预处理后的待回答问题对应的用户答案时，将所述用户答案与所述备选答案列表中各个备选答案进行相似度匹配，根据匹配结果确定预处理后的待回答问题对应的目标答案。

此外，为实现上述目的，本发明还提供一种机器人终端，所述机器人终端包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的机器人自学习程序，所述机器人自学习程序被所述处理器执行时实现上述任一项所述的机器人自学习方法的步骤。

此外，为实现上述目的，本发明还提供一种可读存储介质，所述可读存储介质上存储有机器人自学习程序，所述机器人自学习程序被处理器执行时实现上述任一项所述的机器人自学习方法的步骤。

本发明获取待回答问题，对所述待回答问题进行预处理，得到预处理后的待回答问题，而后在确定预处理后的待回答问题为有效问题时，生成预处理后的待回答问题对应的备选答案列表，接下来在获取到预处理后的待回答问题对应的用户答案时，将所述用户答案与所述备选答案列表中各个备选答案进行相似度匹配，根据匹配结果确定预处理后的待回答问题对应的目标答案。通过对待回答问题进行去口语化及纠错，从而确定正确的待回答问题，再根据待回答问题自动获取备选答案列表以及用户答案，进一步根据用户答案与所述备选答案列表中各个备选答案的相似度分数确定待回答问题的目标答案，在保证机器人终端的知识库及时更新的同时，提高了机器人回答用户问题的准确率。

附图说明

图1是本发明实施例方案涉及的硬件运行环境中机器人终端的结构示意图；

图2为本发明机器人自学习方法第一实施例的流程示意图；

图3为本发明机器人自学习方法第二实施例的流程示意图；

图4为本发明机器人自学习装置实施例的功能模块示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

如图1所示，图1是本发明实施例方案涉及的硬件运行环境中机器人终端的结构示意图。

如图1所示，该机器人终端可以包括：处理器1001，例如CPU，网络接口1004，用户接口1003，存储器1005，通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图1中示出的目标检测系统结构并不构成对终端的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及机器人自学习程序。

在图1所示的终端中，网络接口1004主要用于连接后台服务器，与后台服务器进行数据通信；用户接口1003主要用于连接用户端，与用户端进行数据通信；而处理器1001可以用于调用存储器1005中存储的机器人自学习程序。

在本实施例中，机器人终端包括：存储器1005、处理器1001及存储在所述存储器1005上并可在所述处理器1001上运行的机器人自学习程序，其中，处理器1001调用存储器1005中存储的机器人自学习程序时，执行本申请各个实施例提供的机器人自学习方法的步骤。

本发明还提供一种机器人自学习方法，参照图2，图2为本发明机器人自学习方法第一实施例的流程示意图。

本发明实施例提供了机器人自学习方法的实施例，需要说明的是，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

在本实施例中，该机器人自学习方法包括：

步骤S10，获取待回答问题，对所述待回答问题进行预处理，得到预处理后的待回答问题；

在本实施例中，语音作为人类所特有的能力，是人类之间交流及获取外界信息资源的重要的工具和渠道，对于人类文明的发展具有重要的意义。语音识别技术作为人机交互分支的重要组成，是人机交互的重要接口，对于人工智能的发展具有重要的实际意义。目前，人机对话进入第三代，人机交流的内容主要是人习惯的自然交流语言，机器人终端可以根据问答知识库中的内容，对用户提出的问题进行解答，但是，目前各公司的机器人当被问到不在知识库中的问题时，一般都会先给出类似“我不知道哦”、“我还在学习”等默认回复，同时将这些不会的问题记录下来，由人工定期对这些问题审核，选出其中一些有意义的问题，配上回复答案更新到机器人终端的知识库中，这样不仅使得机器人的知识库更新具有一定的滞后性，而且耗费了人力物力。有鉴于此，本发明根据待回答问题自动获取备选答案列表以及用户答案，进一步根据用户答案与所述备选答案列表中各个备选答案的相似度分数确定待回答问题的目标答案，在保证机器人终端的知识库及时更新的同时，提高了机器人回答用户问题的准确率。

具体地，在人机对话的过程中，如果用户的问题在机器人终端的知识库中找不到答案，此时机器人终端将未回答出来的问题保存到预设存储区。机器人终端从预设存储区获取一个待回答的问题，然后对该待回答的问题进行纠错、去口语化等处理。

具体地，步骤S10包括：

步骤S11，获取待回答问题，对所述待回答问题进行去口语化处理；

在本实施例中，口语化词是指一些感叹词、助词和一些修饰词等，去掉口语化词不影响整句话的主题，比如通用场景下：嗯我看一下明天的天气吧，去掉口语化词变成：明天天气，这里把"嗯、我、看一下、的、吧"等口语化词都去掉了。具体地，在获取待回答问题后，根据预设的去口语化规则，过滤掉待回答问题中的口语化词，以此来提高对待回答问题解析的精准率。

步骤S12，对去口语化后的待回答问题进行分词，得到去口语化后的待回答问题对应的词汇列表；

在本实施例中，N-Gram(有时也称为N元模型)是自然语言处理中一个非常重要的概念，通常在NLP中，人们基于一定的语料库，可以利用N-Gram来预计或者评估一个句子是否合理。另外一方面，N-Gram的另外一个作用是用来评估两个字符串之间的差异程度，这是模糊匹配中常用的一种手段。N-Gram用来根据前(n-1)个item来预测第n个item。N-Gram语言模型的思想，可以追溯到信息论大师香农的研究工作，他提出一个问题：给定一串字母，如”for ex”，下一个最大可能性出现的字母是什么。从训练语料数据中，我们可以通过极大似然估计的方法，得到N个概率分布：是a的概率是0.4，是b的概率是0.0001，是c的概率是......当然，别忘记约束条件：所有的N个概率分布的总和为1。

进一步地，利用N-Gram模型对待回答问题进行纠错处理，N-Gram模型需要输入待回答问题对应的词汇列表，故在对待回答问题去口语化后，进一步对待回答问题进行长句剪断、分词等处理，生成词汇列表，然后再利用N-Gram模型进行下一步操作。

步骤S13，基于目标纠错模型确定所述词汇列表中各个词汇的评分值；

在本实施例中，从预设的语料库中获取训练样本，预设的语料库可以是大规模文本或音频语料库，然后利用训练样本对初始N-Gram模型进行模型训练，得到模型参数生成目标纠错模型。

进一步地，将待回答问题对应的词汇列表中的词汇导入到目标纠错模型中，目标纠错模型对词汇列表中的各个词汇进行评分，给出各个词汇的评分值，根据这些评分值可以确定哪些词汇是错误词汇。

步骤S14，基于所述各个词汇的评分值对去口语化后的待回答问题进行纠错，得到预处理后的待回答问题。

在本实施例中，词汇的评分值大于或等于预设分数时，则判定该词汇是正确的词汇，反正，如果词汇的评分值小于预设分数时，则判定该词汇是错误词汇，需要对该错误词汇进行纠错，以得到纠错后的待回答问题。

具体地，步骤S14包括：

步骤a，在所述各个词汇中存在评分值小于预设分数的错误词汇时，获取所述错误词汇对应的前驱词；

步骤b，基于预设的语料库以及所述前驱词，确定所述错误词汇对应的备选词汇列表；

步骤c，基于所述目标纠错模型确定所述备选词汇列表中各个备选词汇的得分，并获取所述各个备选词汇的得分中的最大值；

步骤d，将所述最大值对应的备选词汇替换所述错误词汇，得到预处理后的待回答问题。

在本实施例中，预设分数根据实际经验值确定，在本发明中不做限定。当某个词汇评分值小于预设分数时，则认定该词汇是错误词汇，在待回答问题中获取该错误词汇对应的前驱词，并在预设的备选词汇语料库中，根据前驱词获取错误词汇对应的正确词，所有正确词汇作为备选词汇，从而生成备选词汇列表，其中，备选词汇列表包括多个备选词汇，具体的数量可根据实际情况确定。

进一步地，对备选词汇列表中每个词汇的拼音和错误词汇的拼音求编辑距离，然后对各个距离按从小到大进行排序，并将前M个距离对应的备选词汇导入目标纠错模型进行评分，取最高分数对应的备选词汇作为替换错误词汇的正确词，其中，M根据经验值设置。需要说明的是，如果待回答问题中有多个错误词汇时，需要依次对所有错误词汇进行替换，完成对待回答问题的纠错。

步骤S20，在确定预处理后的待回答问题为有效问题时，生成预处理后的待回答问题对应的备选答案列表，其中，所述备选答案列表包括N个备选答案，所述N是正整数；

在本实施例中，在对待回答问题进行预处理后，需要进一步判断该预处理后的待回答问题是否为有效问题，如果该问题是无效问题，则直接删除，如果该问题是有效问题，则生成预处理后的待回答问题对应的备选答案列表，并进一步确定该问题对应的答案。优选地，备选答案由机器人终端网上搜索查询，选取答案评分或者点赞数较高的答案进行聚类后得到的，其中，N可以根据实际需求确定，N是正整数。

进一步地，为了识别无意义的问题，可以通过一个训练好的判断模型对待回答问题进行问题有效性的判断。具体地，根据历史的人工检查出来的无意义问题数据集和有意义问题数据集为训练样本，然后根据这些训练样本训练一个初始的二分类模型，现有技术中有很多二分类模型，例如逻辑回归，当模型收敛后，得到目标判断模型。将待回答问题作为目标判断模型的输入导入到模型中，得到问题的判断结果，从判定结果可以直接确定问题的是否有效。

步骤S30，在获取到预处理后的待回答问题对应的用户答案时，将所述用户答案与所述备选答案列表中各个备选答案进行相似度匹配，根据匹配结果确定预处理后的待回答问题对应的目标答案。

在本实施例中，机器人终端可以通过人机对话的方式获取到语音数据，并提取用户答案后，进一步将用户答案与各个备选答案进行相似度匹配，根据匹配结果，从而确定待回答问题的目标答案。

具体地，步骤S30包括：

步骤S31，基于预设算法计算所述用户答案与所述备选答案列表中各个备选答案的相似度，并确定最大相似度；

在本实施例中，根据人机对话获取待回答问题对应的用户答案，并进一步计算用户答案与各个备选答案的相似度。具体地，举例说明答案之间的相似度计算，对备选答案Is和用户答案p使用词嵌入等模型进行向量表示，Ws＝g(Is)，Wc＝g(c)，其中g(.)代表文本向量化算法，文本向量化算法为现有算法，如采用word2vec的方式对词进行向量表示，可根据实际情况选择，在本发明中不做限定。假如备选答案Is由[A,B,C]三个词构成，同时设定词向量的维度为3维，则A＝[-0.2 0.9 0.7]，B＝[-0.5 0.7 0.6],C＝[0.2 -0.3 0.5]，此处的数值只用于示意，则备选答案Is的向量表示Ws可由A、B、C的词向量加权求平均得到，权重可由TF-IDF等算法求得，其中，TF意思是词频(Term Frequency)，IDF意思是逆文本频率指数(Inverse Document Frequency)。优选地，对两个向量使用余弦相似度等相似度计算方法进行相似度计算，得到相似度s，采用余弦相似度算法进行相似度计算，则s＝(Ws·Wc)/(||Ws||*||Wc||)。

步骤S32，在所述最大相似度大于或等于阈值时，将所述最大相似度对应的备选答案作为所述目标答案。

在本实施例中，根据预设算法计算了用户答案与备选答案列表中各个备选答案的相似度后，从全部相似度数据中挑选出最大值，也就是最大相似度，然后将该最大相似度与阈值进行比较，根据比较结果确定待回答问题的最终答案。具体地，当最大相似度大于或等于阈值时，表示该最大相似度对应的备选答案与用户答案内容非常相似，也就是说，机器人终端自动搜索获取到的备选答案与用户答案可以共同确定待回答问题的答案，此时，将最大相似度对应的备选答案作为待回答问题的目标答案。

进一步地，在一实施例中，步骤S31之后，还包括：

步骤S33，在所述最大相似度小于阈值时，关联保存预处理后的待回答问题、所述备选答案列表以及所述用户答案至预设存储区，并发送人工检核请求处理。

在本实施例中，根据预设算法计算了用户答案与备选答案列表中各个备选答案的相似度后，从全部相似度数据中挑选出最大值，也就是最大相似度，然后将该最大相似度与阈值进行比较，根据比较结果确定待回答问题的最终答案。具体地，当最大相似度小于阈值时，表示该最大相似度对应的备选答案与用户答案内容差异较大，也就是说，机器人终端自动搜索获取到的备选答案与用户答案无法确定待回答问题的答案，需要人工处理，故关联保存预处理后的待回答问题、备选答案列表以及用户答案至预设存储区，并发送人工检核请求至预设管理终端，提醒管理员进行人工处理。可选地，管理员查看遗留的待回答问题，若遗留的待回答问题对应的备选答案中有正确答案，则直接选择正确的备选答案作为待回答问题的答案，反之，管理员手动添加正确答案。

本实施例提出的机器人自学习方法，通过获取待回答问题，对所述待回答问题进行预处理，得到预处理后的待回答问题，而后在确定预处理后的待回答问题为有效问题时，生成预处理后的待回答问题对应的备选答案列表，接下来在获取到预处理后的待回答问题对应的用户答案时，将所述用户答案与所述备选答案列表中各个备选答案进行相似度匹配，根据匹配结果确定预处理后的待回答问题对应的目标答案。通过对待回答问题进行去口语化及纠错，从而确定正确的待回答问题，再根据待回答问题自动获取备选答案列表以及用户答案，进一步根据用户答案与所述备选答案列表中各个备选答案的相似度分数确定待回答问题的目标答案，在保证机器人终端的知识库及时更新的同时，提高了机器人回答用户问题的准确率。

基于第一实施例，参照图3，提出本发明机器人自学习方法的第二实施例，在本实施例中，步骤S20包括：

步骤S21，在确定预处理后的待回答问题为有效问题时，获取预处理后的待回答问题对应的初始答案列表；

在本实施例中，根据目标判断模型确定了预处理后的待回答问题为有效问题后，机器人终端获取待回答问题对应的初始答案列表，其中，初始答案列表包括多个备选答案，由机器人终端在网上搜索查询，选取答案评分或者点赞数较高的答案进行聚类后得到的。

步骤S22，基于预设聚类算法对所述初始答案列表进行聚类，得到所述备选答案列表。

在本实施例中，根据预设聚类算法对初始答案列表进行聚类，得到备选答案列表。可选地，K-Means算法是一种迭代求解的聚类分析算法，其步骤是随机选取k个对象作为初始的聚类中心，然后计算每个对象与各个种子聚类中心之间的距离，把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本，聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有(或最小数目)对象被重新分配给不同的聚类，没有(或最小数目)聚类中心再发生变化，误差平方和局部最小。在本发明中，在初始答案列表中随机选取N个答案作为聚类中心，N根据实际情况确定，在本发明中不做限定，然后分别计算初始答案列表中每一个剩余答案与各个聚类中心的距离，将剩余答案分配给距离它最近的聚类中心，并将距离聚类中心最近的答案作为此类的备选答案，N个聚类中心就有N个备选答案，将N个备选答案保存在备选答案列表中。

进一步地，在一实施例中，步骤S20与步骤S30之间，还包括：

步骤S40，在所述机器人终端当前进行人机对话时，获取人机对话的语音数据，并基于所述人机对话的语音数据确定所述用户答案。

在本实施例中，机器人终端通过人机对话，实时获取人机对话的语音，根据语音内容判断用户的职业、专业等相关信息，进而决定用户是否适合回答待回答问题。若合适，则对该用户提问待回答问题，收集用户的答案，并作为用户答案，若不合适，则不进行提问。

具体地，步骤S40包括：

步骤S41，在所述机器人终端当前进行人机对话时，获取预处理后的待回答问题对应的对话问题，将所述对话问题播放给用户；

步骤S42，在获取到所述对话问题对应的语音数据时，确定所述对话问题对应的语音数据是否满足获取用户答案的获取条件；

步骤S43，在确定满足获取条件时，将预处理后的待回答问题播放给用户，并基于预处理后的待回答问题对应的语音数据确定所述用户答案。

在本实施例中，在机器人终端与用户进行人机对话时，机器人终端可以实时获取人机对话的语音数据，根据语音数据，利用现有的语音识别技术可以确定该语音数据对应的对话内容。

具体地，在人机对话时，机器人终端可以通过提问的方式询问用户的职业、专业等信息，进而决定该用户是否适合回答某个待回答问题。当用户的职业、专业等信息与某个待回答问题所需的专业或职业匹配时，机器人终端输出该待回答问题，可以采用语音读取或屏幕显示的方式，用户针对该待回答问题，以语音的方式给出问题的答案，该答案作为待回答问题对应的用户答案。以机器人终端在与用户交流时主动向用户提问获取用户答案的方式，提升了用户体验，同时扩展了获取答案的途径。

本实施例提出的机器人自学习方法，通过在确定预处理后的待回答问题为有效问题时，获取预处理后的待回答问题对应的初始答案列表，而后基基于预设聚类算法对所述初始答案列表进行聚类，得到所述备选答案列表。实现了根据待回答问题自动获取备选答案列表以及用户答案。

本发明进一步提供一种机器人自学习装置，参照图4，图4为本发明机器人自学习装置实施例的功能模块示意图。

更新模块10，用于获取待回答问题，对所述待回答问题进行预处理，得到预处理后的待回答问题；

生成模块20，用于在确定预处理后的待回答问题为有效问题时，生成预处理后的待回答问题对应的备选答案列表，其中，所述备选答案列表包括N个备选答案，其中，所述N是正整数；

确定模块30，用于在获取到预处理后的待回答问题对应的用户答案时，将所述用户答案与所述备选答案列表中各个备选答案进行相似度匹配，根据匹配结果确定预处理后的待回答问题对应的目标答案。

进一步地，所述更新模块10还用于：

获取待回答问题，对所述待回答问题进行去口语化处理；

基于目标纠错模型确定所述词汇列表中各个词汇的评分值；

进一步地，所述更新模块10还用于：

进一步地，所述生成模块20还用于：

进一步地，所述机器人自学习装置还包括：

获取模块，在所述机器人终端当前进行人机对话时，获取人机对话的语音数据，并基于所述人机对话的语音数据确定所述用户答案。

进一步地，所述获取模块还用于：

进一步地，所述确定模块30还用于：

此外，本发明实施例还提出一种可读存储介质，所述可读存储介质上存储有机器人自学习程序，所述机器人自学习程序被处理器执行时实现上述各个实施例中机器人自学习方法的步骤。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个可读存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台系统设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种机器人自学习方法，应用于机器人终端，其特征在于，所述的机器人自学习方法包括以下步骤：

2.如权利要求1所述的机器人自学习方法，其特征在于，所述获取待回答问题，对所述待回答问题进行预处理，得到预处理后的待回答问题的步骤包括：

获取待回答问题，对所述待回答问题进行去口语化处理；

基于目标纠错模型确定所述词汇列表中各个词汇的评分值；

3.如权利要求2所述的机器人自学习方法，其特征在于，所述基于各个词汇的评分值对去口语化后的待回答问题进行纠错，得到预处理后的待回答问题的步骤包括：

4.如权利要求1所述的机器人自学习方法，其特征在于，所述在确定预处理后的待回答问题为有效问题时，生成预处理后的待回答问题对应的备选答案列表的步骤包括：

5.如权利要求1所述的机器人自学习方法，其特征在于，所述在确定预处理后的待回答问题为有效问题时，生成预处理后的待回答问题对应的备选答案列表，与所述在获取到预处理后的待回答问题对应的用户答案时，将所述用户答案与所述备选答案列表中各个备选答案进行相似度匹配，根据匹配结果确定预处理后的待回答问题对应的目标答案的步骤之间，还包括：

6.如权利要求5所述的机器人自学习方法，其特征在于，所述在所述机器人终端当前进行人机对话时，获取人机对话的语音数据，并基于所述人机对话的语音数据确定所述用户答案的步骤包括：

7.如权利要求1至6中任一项所述的机器人自学习方法，其特征在于，所述在获取到预处理后的待回答问题对应的用户答案时，将所述用户答案与所述备选答案列表中各个备选答案进行相似度匹配，根据匹配结果确定预处理后的待回答问题对应的目标答案的步骤包括：

8.如权利要求7所述的机器人自学习方法，其特征在于，所述基于预设算法计算所述用户答案与所述备选答案列表中各个备选答案的相似度，并确定最大相似度的步骤之后，还包括：

9.一种机器人自学习装置，其特征在于，所述机器人自学习装置包括：

10.一种机器人终端，其特征在于，所述机器人终端包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的机器人自学习程序，所述机器人自学习程序被所述处理器执行时实现如权利要求1至8中任一项所述的机器人自学习方法的步骤。

11.一种可读存储介质，其特征在于，所述可读存储介质上存储有所述机器人自学习程序，所述机器人自学习程序被处理器执行时实现如权利要求1至8中任一项所述的机器人自学习方法的步骤。