CN111814490A

CN111814490A - 一种机器人自学习提升语义识别能力的方法与系统

Info

Publication number: CN111814490A
Application number: CN202010506782.1A
Authority: CN
Inventors: 郭志扬; 张发兰
Original assignee: Jiangsu Aoxin Technology Co ltd
Current assignee: Jiangsu Aoxin Technology Co ltd
Priority date: 2020-06-05
Filing date: 2020-06-05
Publication date: 2020-10-23

Abstract

本发明公开了一种机器人自学习提升语义识别能力的方法包括：通过机器人终端接收到用户的提问语音信息，将所述提问语音信息传送至云端服务器，云端服务器将语音信息传送给语音网关，语音网关将提问语音信息识别转换为提问文字语句，进而回传给云端服务器，云端服务器将提问文字语句传送给关键词分析网关，关键词分析网关进行对提问文字语句提取提问关键词，进而给云端服务器返回若干个提问关键词，云端服务器选取1至5个权重较大的关键词，与题库中预先存好的关键词做匹配，若完全匹配则云端服务器向机器人终端发送命令，让机器人终端发控制机器人回答题库中的答案。

Description

一种机器人自学习提升语义识别能力的方法与系统

技术领域

本发明涉及一种自学习提升语义识别能力的方法，具体是一种机器人自学习提升语义识别能力的方法。

背景技术

机器人是一种能够半自主或全自主工作的智能机器,具有感知、决策、执行等基本特征,可以辅助甚至替代人类完成危险、繁重、复杂的工作,提高工作效率与质量,服务人类生活,扩大或延伸人的活动及能力范围。

而机器人按照控制方式分类可分为：操作型机器人、程控型机器人、示教再现型机器人、数控型机器人、感觉控制型机器人、适应控制型机器人、学习控制型机器人、智能机器人。

现有的机器人有许多放置在各大商场进行取代人工进行对用户问题进行回答，而现有机器人基本通过人工预先进行对机器人录入问题与答案，而无法进行对用户问题和答案进行学习，进而使得现有的机器人使用率降低。

发明内容

发明目的：提供一种机器人自学习提升语义识别能力的方法，以解决现有技术存在的上述问题。

技术方案：一种机器人自学习提升语义识别能力的方法，包括：

步骤1、机器人终端接收到用户的提问语音信息，将所述提问语音信息传送至云端服务器；

步骤2、云端服务器将语音信息传送给语音网关，语音网关将提问语音信息识别转换为提问文字语句，进而回传给云端服务器；

步骤3、云端服务器将提问文字语句传送给关键词分析网关，关键词分析网关进行对提问文字语句提取提问关键词，进而给云端服务器返回若干个提问关键词；

步骤4、云端服务器选取1至5个权重较大的关键词，与题库中预先存好的关键词做匹配，若完全匹配则云端服务器向机器人终端发送命令，让机器人终端发控制机器人回答题库中的答案；

步骤5、若没有完全匹配，则判断提问关键词匹配失败数量；

步骤6、当提问关键词匹配失败数量大于1时，则云端服务器认定此提问为新问题；

步骤7、当提问关键词匹配失败数量为1 时，则云端服务器认定此提问的问题与题库中已有的问题为相似问题，并将相似问题以文字方式传送给机器人，机器人在屏幕上显示所有相似问题；

步骤8、用户判断机器人屏幕上显示的相似问题中有无相同问题，若无则可放弃选择；当机器人屏幕上显示的相似问题有相同问题时，用户点击选中一个相同问题，机器人通过云端服务器调取答案回答用户；

步骤9、而当机器人屏幕上显示的相似问题中无相同问题时，云端服务器将用户提问问题中相差的那个关键词作为并列关键词，填入用户选中问题题库中并列关键词位置中去，作为题库中的临时并列关键词；

步骤10、云端服务器定期将临时并列关键词批量提交机器人系统管理员作审核，审核通过则变更为正式并列关键词；当审核不通过时，系统管理员可以修改或删除临时并列关键词。

在进一步的实施例中，所述云端服务器题库中保存了若干个问题及答案，每个问题设置A、B、C、D、E五级主关键词空间，用于存放每个问题相对应的1至5个主关键词，每级主关键词设置8个并列关键词空间，用于存放各级主关键词相对应的并列关键词，通过设计云端服务器题库件对若干问题件预先录入，以及给与8个并列关键词空间用户提出不同问题的关键词进行存储，进而使得机器人具有自行学习的空间。

在进一步的实施例中，所述步骤3中还包括关键词分析网关提取关键词步骤，步骤如下：

步骤301、首先进行对步骤2提问语音信息识别转换为提问文字语句进行预处理的处理步骤；所述处理步骤包括分词、去除停用词，然后将分词、去除停用词后剩下的词语作为关键词的候选词；

步骤302、当提问文字语句预处理完成后，进行构建无向有权图；

步骤303、当无向有权图构建完成后进行图排序；

在进一步的实施例中，使用步骤301预处理之后，候选词被表示为图的顶点，如果两个词在一个句子内同时出现，则两个候选词表示的图顶点之间存在边，而边的权重值为两个候选词之间的词引值；

文本中词语

和

的引力

计算公式如下：

=

其中，

表示词语

在文本中出现的频率，

表示词语

在文本中出现的频率，

表示为词语

和

之间的欧氏距离；

而经常以固定模式出现的多个词语为一个短语，即某个模式出现的频率越高，这个模式为短语的可能性越高，而两个样本的间的相关性通常用

系数进行表示，

系数定义如下：

其中，

表示为词语

和

共同出现的频率；

此时使用

算法进行图排序；在有权重的

算法中，边的权重值越高，顶点的得分将越高，此时选取得分最高的1至5个主关键词。

一种机器人自学习提升语义识别能力的系统，包括：

用于接收客户的提问语音，并发送回答语音或/和合成视频的机器人终端；

用于将提问语音信息识别转换为提问文字语句的语音网关；

用于分析提取提问文字语句关键词的分析网关；

以及用于存储问题及存放每个问题相对应的1至5个主关键词和用于存放各级主关键词相对应的并列关键词的云端服务器。

在进一步的实施例中，所述云端服务器包括：处理器、录音单元、触控显示单元和通信单元，所述处理器分别与所述录音单元、所述触控显示单元和通信单元连接；

在进一步的实施例中，所述录音单元用于获取客户的提问语音；所述触控显示单元用于客户操作以及播放视频；所述通信单元用于与所述云端服务器进行数据传输。

在进一步的实施例中，所述云端服务器包括：

用于接收所述机器人终端发送的数据、及向所述机器人终端发送数据的接收推送模块；

用于将所述提问语句从云端服务器中的题库中匹配对应的答案语音或答案视频的匹配模块；当提问关键词匹配失败数量大于1时，则云端服务器认定此提问为新问题；

当提问关键词匹配失败数量为1 时，则云端服务器认定此提问的问题与题库中已有的问题为相似问题，并将相似问题以文字方式传送给机器人，机器人在屏幕上显示所有相似问题；

用于存储客户的提问语音、回答语音、回答文字、合成视频和关键词的存储模块。

在进一步的实施例中，所述语音网关包括用于识别提问语音信息的语音识别模块；用于纠错语音识别模块识别语音信息错误的纠错模块；所述纠错模块与云端服务器电信连接，通过云端服务器预先录入的问题进行匹配对比，进而将语音识别模块识别错误的提问文字语句纠改为云端服务器内相近问题，进而通过触控显示进行显示给用户，以供用户选择。

有益效果：本发明公开了一种机器人自学习提升语义识别能力的方法，通过机器人终端接收到用户的提问语音信息，将所述提问语音信息传送至云端服务器，云端服务器将语音信息传送给语音网关，语音网关将提问语音信息识别转换为提问文字语句，进而回传给云端服务器，云端服务器将提问文字语句传送给关键词分析网关，关键词分析网关进行对提问文字语句提取提问关键词，进而给云端服务器返回若干个提问关键词，云端服务器选取1至5个权重较大的关键词，与题库中预先存好的关键词做匹配，若完全匹配则云端服务器向机器人终端发送命令，让机器人终端发控制机器人回答题库中的答案，若没有完全匹配，则判断提问关键词匹配失败数量，当提问关键词匹配失败数量大于1时，则云端服务器认定此提问为新问题，当提问关键词匹配失败数量为1 时，则云端服务器认定此提问的问题与题库中已有的问题为相似问题，并将相似问题以文字方式传送给机器人，机器人在屏幕上显示所有相似问题，用户判断机器人屏幕上显示的相似问题中有无相同问题，若无则可放弃选择；当机器人屏幕上显示的相似问题有相同问题时，用户点击选中一个相同问题，机器人通过云端服务器调取答案回答用户，而当机器人屏幕上显示的相似问题中无相同问题时，云端服务器将用户提问问题中相差的那个关键词作为并列关键词，填入用户选中问题题库中并列关键词位置中去，作为题库中的临时并列关键词，云端服务器定期将临时并列关键词批量提交机器人系统管理员作审核，审核通过则变更为正式并列关键词；当审核不通过时，系统管理员可以修改或删除临时并列关键词，机器人通过以上方法接受用户培训，不断增强理解用户不同方式问话语义的能力，使机器人变得更聪明。

附图说明

图1是本发明的结构示意图。

图2是本发明的关键词匹配流程示意图。

图3是本发明的机器人自学习提升语义识别能力系统结构示意图。

具体实施方式

经过申请人的研究分析，出现这一问题（现有机器人使用率降低）的原因在于，现有的机器人有许多放置在各大商场进行取代人工进行对用户问题进行回答，而现有机器人基本通过人工预先进行对机器人录入问题与答案，而无法进行对用户问题和答案进行学习，进而使得现有的机器人使用率降低，而本发明通过机器人终端接收到用户的提问语音信息，将所述提问语音信息传送至云端服务器，云端服务器将语音信息传送给语音网关，语音网关将提问语音信息识别转换为提问文字语句，进而回传给云端服务器，云端服务器将提问文字语句传送给关键词分析网关，关键词分析网关进行对提问文字语句提取提问关键词，进而给云端服务器返回若干个提问关键词，云端服务器选取1至5个权重较大的关键词，与题库中预先存好的关键词做匹配，若完全匹配则云端服务器向机器人终端发送命令，让机器人终端发控制机器人回答题库中的答案，若没有完全匹配，则判断提问关键词匹配失败数量，当提问关键词匹配失败数量大于1时，则云端服务器认定此提问为新问题，当提问关键词匹配失败数量为1 时，则云端服务器认定此提问的问题与题库中已有的问题为相似问题，并将相似问题以文字方式传送给机器人，机器人在屏幕上显示所有相似问题，用户判断机器人屏幕上显示的相似问题中有无相同问题，若无则可放弃选择；当机器人屏幕上显示的相似问题有相同问题时，用户点击选中一个相同问题，机器人通过云端服务器调取答案回答用户，而当机器人屏幕上显示的相似问题中无相同问题时，云端服务器将用户提问问题中相差的那个关键词作为并列关键词，填入用户选中问题题库中并列关键词位置中去，作为题库中的临时并列关键词，云端服务器定期将临时并列关键词批量提交机器人系统管理员作审核，审核通过则变更为正式并列关键词；当审核不通过时，系统管理员可以修改或删除临时并列关键词，机器人通过以上方法接受用户培训，不断增强理解用户不同方式问话语义的能力，使机器人变得更聪明。

一种机器人自学习提升语义识别能力的方法，包括：

步骤5、若没有完全匹配，则判断提问关键词匹配失败数量；

所述云端服务器题库中保存了若干个问题及答案，每个问题设置A、B、C、D、E五级主关键词空间，用于存放每个问题相对应的1至5个主关键词，每级主关键词设置8个并列关键词空间，用于存放各级主关键词相对应的并列关键词。

所述步骤3中还包括关键词分析网关提取关键词步骤，步骤如下：

步骤303、当无向有权图构建完成后进行图排序；

使用步骤301预处理之后，候选词被表示为图的顶点，如果两个词在一个句子内同时出现，则两个候选词表示的图顶点之间存在边，而边的权重值为两个候选词之间的词引值；

文本中词语

和

的引力

计算公式如下：

=

其中，

表示词语

在文本中出现的频率，

表示词语

在文本中出现的频率，

表示为词语

和

之间的欧氏距离；

系数进行表示，

系数定义如下：

其中，

表示为词语

和

共同出现的频率；

此时使用

算法进行图排序；在有权重的

一种机器人自学习提升语义识别能力的系统，包括：

用于将提问语音信息识别转换为提问文字语句的语音网关；

用于分析提取提问文字语句关键词的分析网关；

所述云端服务器包括：处理器、录音单元、触控显示单元和通信单元，所述处理器分别与所述录音单元、所述触控显示单元和通信单元连接；

所述录音单元用于获取客户的提问语音；所述触控显示单元用于客户操作以及播放视频；所述通信单元用于与所述云端服务器进行数据传输。

所述云端服务器包括：

所述语音网关包括用于识别提问语音信息的语音识别模块；用于纠错语音识别模块识别语音信息错误的纠错模块；所述纠错模块与云端服务器电信连接，通过云端服务器预先录入的问题进行匹配对比，进而将语音识别模块识别错误的提问文字语句纠改为云端服务器内相近问题，进而通过触控显示进行显示给用户，以供用户选择。

工作原理说明：机器人终端接收到用户的提问语音信息，将所述提问语音信息传送至云端服务器；云端服务器将语音信息传送给语音网关，语音网关将提问语音信息识别转换为提问文字语句，进而回传给云端服务器；云端服务器将提问文字语句传送给关键词分析网关，关键词分析网关进行对提问文字语句提取提问关键词，进而给云端服务器返回若干个提问关键词；云端服务器选取1至5个权重较大的关键词，与题库中预先存好的关键词做匹配，若完全匹配则云端服务器向机器人终端发送命令，让机器人终端发控制机器人回答题库中的答案；若没有完全匹配，则判断提问关键词匹配失败数量；当提问关键词匹配失败数量大于1时，则云端服务器认定此提问为新问题；当提问关键词匹配失败数量为1时，则云端服务器认定此提问的问题与题库中已有的问题为相似问题，并将相似问题以文字方式传送给机器人，机器人在屏幕上显示所有相似问题；用户判断机器人屏幕上显示的相似问题中有无相同问题，若无则可放弃选择；当机器人屏幕上显示的相似问题有相同问题时，用户点击选中一个相同问题，机器人通过云端服务器调取答案回答用户；而当机器人屏幕上显示的相似问题中无相同问题时，云端服务器将用户提问问题中相差的那个关键词作为并列关键词，填入用户选中问题题库中并列关键词位置中去，作为题库中的临时并列关键词；云端服务器定期将临时并列关键词批量提交机器人系统管理员作审核，审核通过则变更为正式并列关键词；当审核不通过时，系统管理员可以修改或删除临时并列关键词。

以上结合附图详细描述了本发明的优选实施方式，但是，本发明并不限于上述实施方式中的具体细节，在本发明的技术构思范围内，可以对本发明的技术方案进行多种等同变换，这些等同变换均属于本发明的保护范围。

Claims

1.一种机器人自学习提升语义识别能力的方法，其特征是，包括：

步骤5、若没有完全匹配，则判断提问关键词匹配失败数量；

2.根据权利要求1所述的一种机器人自学习提升语义识别能力的方法，其特征是：所述云端服务器题库中保存了若干个问题及答案，每个问题设置A、B、C、D、E五级主关键词空间，用于存放每个问题相对应的1至5个主关键词，每级主关键词设置8个并列关键词空间，用于存放各级主关键词相对应的并列关键词。

3.根据权利要求1所述的一种机器人自学习提升语义识别能力的方法，其特征是：所述步骤3中还包括关键词分析网关提取关键词步骤，步骤如下：

步骤303、当无向有权图构建完成后进行图排序。

4.根据权利要求3所述的一种机器人自学习提升语义识别能力的方法，其特征是：使用步骤301预处理之后，候选词被表示为图的顶点，如果两个词在一个句子内同时出现，则两个候选词表示的图顶点之间存在边，而边的权重值为两个候选词之间的词引值；

文本中词语

和

的引力

计算公式如下：

=

其中，

表示词语

在文本中出现的频率，

表示词语

在文本中出现的频率，

表示为词语

和

之间的欧氏距离；

系数进行表示，

系数定义如下：

其中，

表示为词语

和

共同出现的频率；

此时使用

算法进行图排序；在有权重的

5.一种机器人自学习提升语义识别能力的系统，其特征是，包括：

用于将提问语音信息识别转换为提问文字语句的语音网关；

用于分析提取提问文字语句关键词的分析网关；

6.根据权利要求5所述的一种机器人自学习提升语义识别能力的系统，其特征在于，所述云端服务器包括：处理器、录音单元、触控显示单元和通信单元，所述处理器分别与所述录音单元、所述触控显示单元和通信单元连接。

7.根据权利要求6所述的一种机器人自学习提升语义识别能力的系统，其特征在于，所述录音单元用于获取客户的提问语音；所述触控显示单元用于客户操作以及播放视频；所述通信单元用于与所述云端服务器进行数据传输。

8.根据权利要求5所述的一种机器人自学习提升语义识别能力的系统，其特征在于，所述云端服务器包括：

9.根据权利要求5所述的一种机器人自学习提升语义识别能力的系统，其特征在于，所述语音网关包括用于识别提问语音信息的语音识别模块；用于纠错语音识别模块识别语音信息错误的纠错模块；所述纠错模块与云端服务器电信连接，通过云端服务器预先录入的问题进行匹配对比，进而将语音识别模块识别错误的提问文字语句纠改为云端服务器内相近问题，进而通过触控显示进行显示给用户，以供用户选择。