CN117301074A

CN117301074A - 智能机器人的控制方法及芯片

Info

Publication number: CN117301074A
Application number: CN202311536549.8A
Authority: CN
Inventors: 贾国强; 施洪锐; 程巧
Original assignee: Zhejiang Fubao Intelligent Technology Co ltd
Current assignee: Zhejiang Fubao Intelligent Technology Co ltd
Priority date: 2023-11-17
Filing date: 2023-11-17
Publication date: 2023-12-29
Anticipated expiration: 2043-11-17
Also published as: CN117301074B

Abstract

本发明提供了智能机器人的控制方法及芯片。其中，所述方法包括：第一机器人和第二机器人接收并解析目标对象的第一对话语音；第一机器人或第二机器人执行针对第一对话语音的第一应答语音；在第一应答语音满足指定条件时，未执行第一应答语音的第一机器人或第二机器人执行针对第一对话语音的第二应答语音。本发明的方案可以通过多个智能机器人的协同语音解析与应答，解决了部分智能机器人语音解析能力不足所带来的语音沟通不畅的技术问题，给用户带来了更佳的语音交互体验。

Description

智能机器人的控制方法及芯片

技术领域

本发明涉及智能机器人技术领域，具体而言，涉及一种智能机器人的控制方法及芯片。

背景技术

智能机器人具备形形色色的内部信息传感器和外部信息传感器，如视觉、听觉、触觉、嗅觉。除具有感受器外，还有效应器，作为作用于周围环境的手段，例如电动机，它使手、脚、长鼻子、触角等动起来。

随着机器人技术的快速发展，智能机器人越来越多的被应用到生产、生活中的各个场景、环节，给生产、生活带来了更多的智能化体验。智能机器人一般可以实现与用户的语音交互，对用户的语句进行语义分析，并提供对应的语音对话，例如，许多银行、医院、政府部门等场景中，均配置了这些智能机器人，这类智能机器人可以收听现场人员的语音话语，并通过内置或在线的语义解析数据库来解析该语音话语，进而了解现场人员的会话意图，然后再确定应当回答的内容，从而实现语音交互，上述这些场景就不需要在场景中布置太多的服务人员，现场人员可以通过与智能机器人的语音交互而获得有益的信息。

经检索发现，已经存在了涉及智能机器人的部分专利技术，例如，CN116931728A公开了一种类人机器人的多模态人机交互控制系统，包括数据采集模块，多模态人机交互管理模块，具身智能模块以及对话策略模块；所述数据采集模块，用于获取机器人服务范围内的环境数据；所述多模态机器人交互管理模块，用于根据输入的环境数据，以生成机器人与用户的相对位姿和状态信息；所述对话策略模块，根据用户的状态信息，生成对应的对话策略，所述对话策略包括启动对话，暂停对话和恢复对话；所述具身智能模块，用于根据输入的相对位姿和状态信息，以控制机器人完成交互任务，所述交互任务包括与用户进行动作和语音交互。

但是，受限于智能机器人厂家技术实力的不同，智能机器人的语义解析识别能力差别较大，智能机器人与用户的语音交互往往不够顺畅，导致用户的使用体验无法得到进一步提升，而例如上述的现有专利等现有技术，缺乏对该问题的研究。

发明内容

对此，本发明提供了一种智能机器人的控制方案，以解决上述技术问题。

本发明的第一方面提供了一种智能机器人的控制方法，包括如下方法步骤：

第一机器人和第二机器人接收并解析目标对象的第一对话语音；

所述第一机器人或所述第二机器人执行针对所述第一对话语音的第一应答语音；

在所述第一应答语音满足指定条件时，未执行所述第一应答语音的所述第一机器人或所述第二机器人执行针对所述第一对话语音的第二应答语音；

其中，所述第一机器人、所述第二机器人具有不同的对话语音解析能力。

在一些实施例中，所述第一机器人和第二机器人接收并解析目标对象的第一对话语音，包括：

S10，判断所述第一机器人和所述第二机器人是否能够通信互联，若是，则转S11；若否，则转S12；

S11，控制所述第一机器人与所述第二机器人进行通信互联并判断所述第一机器人与所述第二机器人是否属于相同型号；若是，则转S13；若否，则转S12；

S12，所述第一机器人与所述第二机器人均接收并解析所述目标对象的所述第一对话语音；

S13，控制所述第一机器人或所述第二机器人接收并解析所述目标对象的所述第一对话语音。

在一些实施例中，步骤S13中，所述控制所述第一机器人或所述第二机器人接收并解析所述目标对象的所述第一对话语音，包括：

分别计算所述第一机器人和所述第二机器人与所述目标对象的脸部的朝向偏差；

控制所述朝向偏差最小的所述第一机器人或所述第二机器人接收并解析所述目标对象的所述第一对话语音。

在一些实施例中，在所述目标对象周围还存在若干候选对象时，所述控制所述朝向偏差最小的所述第一机器人或所述第二机器人接收并解析所述目标对象的所述第一对话语音，包括：

对所述目标对象和各所述候选对象的脸部的分布位置进行曲线拟合，得到针对所述第一机器人和所述第二机器人的包围曲线；

确定得出所述包围曲线的中心轴线，并计算所述第一机器人或所述第二机器人与所述中心轴线的所述朝向偏差；

在一些实施例中，所述第一机器人或所述第二机器人执行针对所述第一对话语音的第一应答语音，包括：

所述第一机器人或所述第二机器人基于从所述第一对话语音中解析得出的语义特征与语义数据库进行匹配计算，得出若干匹配结果；

所述第一机器人或所述第二机器人根据当前所处场景从若干所述匹配结果中筛选出若干目标匹配结果，根据若干所述目标匹配结果生成第一应答语音并执行输出。

在一些实施例中，所述在所述第一应答语音满足指定条件时，未执行所述第一应答语音的所述第一机器人或所述第二机器人执行针对所述第一对话语音的第二应答语音，包括：

未执行所述第一应答语音的所述第一机器人或所述第二机器人监听所述目标对象发出的第二对话语音；

计算所述第二对话语音和所述第一对话语音的语义相似度，在所述语义相似度高于第一阈值时，判定所述第一应答语音满足指定条件，未执行所述第一应答语音的所述第一机器人或所述第二机器人执行针对所述第一对话语音的所述第二应答语音。

在一些实施例中，所述方法，还包括：

未执行所述第一应答语音的所述第一机器人或所述第二机器人在接收到所述目标对象的所述第一对话语音之后开始计时，并监听所述第一应答语音；

在计时时长达到第二阈值时未监听到所述第一应答语音，则所述第一机器人或所述第二机器人执行针对所述第一对话语音的所述第二应答语音。

本发明的第二方面提供了一种芯片，包括：至少一个处理器和接口；

所述接口，用于为所述至少一个处理器提供程序指令或者数据；

所述至少一个处理器用于执行所述程序指令，以实现如前任一所述的方法。

本发明的第三方面提供了一种电子设备，包括：至少一个处理器、存储器以及存储在所述存储器中并可在所述至少一个处理器上运行的计算机程序，所述处理器执行所述计算机程序以实现如前任一所述的方法。

本发明的第四方面提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于：所述计算机程序被处理器执行以实现如前任一所述的方法。

本发明的第五方面提供了一种计算机程序产品，当计算机程序产品在终端上运行时，使得终端执行时以实现如前任一所述的方法。

本发明的有益效果在于：

本发明的方案可以通过多个智能机器人的协同语音解析与应答，解决了部分智能机器人语音解析能力不足所带来的语音沟通不畅的技术问题，给用户带来了更佳的语音交互体验。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它相关的附图。

图1是本发明实施例公开的一种智能机器人的控制方法的流程示意图；

图2是本发明实施例公开的第一机器人和第二机器人接收并解析目标对象的第一对话语音的流程示意图。

具体实施方式

以下由特定的具体实施例说明本申请的实施方式，熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本申请的其他优点及功效，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

此外，下面所描述的本申请不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。

如图1所示，本发明实施例公开了一种智能机器人的控制方法，包括如下步骤：

在本发明实施例中，智能机器人会因生产厂家的技术实力差距或者机器人型号的差异而具有不同等级的准确解析语音的能力，这会导致部分智能机器人对于目标对象的语音的真实含义的提取容易出现偏差，进而输出的应答语音也就与目标对象的真实意图不符。

针对该技术问题，本发明利用场景中存在的多个智能机器人的不同解析能力来向目标对象提供更顺畅的语音交互体验。具体地，场景中可能会包含多个智能机器人，这些智能机器人可能来自不同的厂家或归属于不同的型号，从而具有不同的语音解析能力；在目标对象向智能机器人输出第一对话语音时，至少两个智能机器人均接收并解析其对话含义，从而通过内置存储器或网络服务器匹配得出对应的应答语句，智能机器人二者之一进行输出；同时，另一未进行应答输出的智能机器人在适当条件下进行补充应答。于是，本发明的方案就可以通过多个智能机器人的协同语音解析与应答，解决了部分智能机器人语音解析能力不足所带来的语音沟通不畅的技术问题，给用户带来了更佳的语音交互体验。

需要说明的是，实际场景中可能并不止配置两台智能机器人，也可能是多于两台的智能机器人。因此，本发明的方案也可以包括第三机器人、第四机器人…例如，在以第一机器人为基准的情况下，第二机器人可以是单一机器人，也可以是多个其他机器人的统称，这是容易理解的。

另外，本发明中的智能机器人一般配备基础部件、处理部件和通信部件。其中，基础部件指的是机器人的壳体、行走驱动模组、麦克风、喇叭、电源模组等；处理部件指的是用于进行语音交互即完成本发明的技术方案的各类处理器或处理器组，处理器可以是由各类芯片组成的处理装置，例如CPU、DSP、单片机、FPGA等；通信部件指的是用于实现智能机器人与服务器、其它智能机器人进行通信连接的装置，这类装置可以采用WiFi技术、蓝牙技术、无线电技术、ZigBee技术等构建，具体不作限定。

以及，本发明的方案可以由第一机器人或第二机器人实施，也可以由与场景配对的服务器实施。其中，对于后者，服务器可以通过对机器人定位数据的接收或场景中配置的摄像头来确定各机器人与目标对象的位置关联关系，也可以通过各机器人的收音麦克风（收音信号的强弱、方位）来确定目标对象与各机器人的位置关联关系，进而调度对应的一台或多台机器人与该目标对象进行语音交互。

在一些实施例中，如图2所示，所述第一机器人和第二机器人接收并解析目标对象的第一对话语音，包括：

在本发明实施例中，首先判断位于现场的第一机器人和第二机器人能否进行通信互联，例如通过蓝牙、WiFi等进行通信连接的尝试（通过发送握手信号实现），如果不能进行通信互联，说明第一机器人和第二机器人可能是不同厂家的产品或者是同一厂家的不同产品型号，由于通信方式、软件设置及配置情况的不同而无法实现通信互联。这种情况下，单一机器人是无法知晓对方机器人的语音解析能力的，此时，本发明设置第一机器人和第二机器人均接收并解析目标对象的第一对话语音；而在可以建立通信互联时，则进一步判断二者是否属于相同厂家的产品（还可以具体到具体的型号），若是，则说明二者的语音解析能力是相同或高度相近的，此时仅需要一个机器人进行语音接收、解析即可，若否，则仍需要第一机器人和第二机器人同时进行语音接收、解析。通过上述方案，本发明可以实现基于语音解析能力的分析而对第一机器人和第二机器人进行合理的调度，可以达到尽量降低数据处理能力的无益浪费的效果，同时也可以使得智能机器人可以同时实现对更多人员的语音对话服务。

其中，对于步骤S11，在第一机器人和第二机器人属于相同厂家、不同型号的产品时，还可以通过互联网查询来确定二者型号所采用的语音解析数据库是否相同，相同时可执行步骤S13，不同时可执行步骤S12。

在本发明实施例中，目标对象与各机器人具有不同的朝向关系，一般情况下，目标对象的脸部正对的机器人是其需要进行语音交互的目标机器人。对此，本发明计算各机器人与目标对象的脸部的朝向偏差，并将朝向偏差最小的机器人作为目标机器人，并控制该目标机器人接收并解析目标对象的第一对话语音。另外，其他机器人实际上也接收了第一对话语音，但出于前述降低数据处理负荷的目的可以暂时不对其进行语义解析。

其中，该实施例可以由机器人自行实施，也可以由服务器实施。对于前者，机器人可以通过配备的传感器（如摄像机）确定场景中对象与其它机器人的分布情况，据此确定出自身是否为目标机器人，进而执行上述方法。对于后者，服务器也可以通过布置于场景中的摄像机来确定场景中各对象与各机器人的分布情况，据此确定出目标机器人，并通过与各机器人的通信而执行上述方法。

在本发明实施例中，实际场景中可能有多个对象面对着机器人，除了目标对象以外，其它候选对象也有可能会在后续进行与机器人的语音交互。针对该情况，本发明对全部对象的位置进行曲线拟合，并计算各机器人与拟合得出的包围曲线的中心轴线的朝向偏差，将偏差最小的作为目标机器人。这样，可以使得确定出的目标机器人在应对全部对象时都是最接近的、正朝向度最佳的。

需要说明的是，包围曲线不是仅基于单一机器人视角采集的对象分布位置来定的，而是基于所有涉及的机器人视角采集的对象分布位置来定的。具体来说，不同位置的机器人视角下采集到的对象数量及分布是不同的，例如某机器人的视角下某对象会因被遮挡而无法被采集到，通过整合所有机器人的视角下的对象数量、分布等信息，可以拟合得出上述包围曲线。另外，上述涉及的机器人可以通过计算各机器人与目标对象的距离而定，具体可以圈定距离小于某一设定值的机器人。

在本发明实施例中，机器人采用通用的语义解析方法可以提取得出对应的语义特征，基于其可以从预设的语义数据库中匹配得出若干个匹配结果。与此同时，再考虑机器人当前所处场景从这些匹配结果中进一步筛选出更少数量的目标匹配结果，据此便可以生成针对目标对象的第一对话语音的第一应答语音并执行输出。

其中，当前所处场景可以是场所的行业类型，如银行、政府机关、邮局、电信营业厅等，据此可以从若干匹配结果中筛选出于当前场所所处的行业类型筛选出目标匹配结果。以及，当前所处场景还可以包括这些场所的空间大小，空间大的场所所能承接的业务类型更多、目标对象需要询问的问题也更多样化，于是，在空间越大时，筛选出数量更多的目标匹配结果，反之则筛选出数量更少的目标匹配结果，即目标匹配结果的数量与当前所处场景对应的场所的空间大小正相关。这样可以通过输出更多的应答语音来满足目标对象的真实对话意图，提升其使用体验。其中，场所空间的大小可以根据柜台的数量来确定，柜台数量越多，显然场所空间越大。

在本发明实施例中，在通过前述方式选中的目标机器人回答了目标对象的第一对话语音之后，没有被选中的机器人对目标对象发出的第二对话语音进行监听，在识别到第二对话语音和第一对话语音语义相似度过高时，说明目标机器人的语义解析能力不够高，导致输出的应答对话不够准确，目标对象不得不重复之前的问题。此时，即便让目标机器人再次进行应答也存在较大的概率不能准确应答，所以，本发明设置没有被选中的机器人可以开启对第一对话语音的解析并输出对应的第二应答语音。于是，通过机器人间替换协作的方式确保目标对象获得良好的语音交互体验。

在一些实施例中，所述方法，还包括：

在本发明实施例中，第一机器人和第二机器人是在大体相同的时刻接收到目标对象发出的第一对话语音的，在确定出目标机器人之后，非目标机器人便可以对目标机器人进行输出计时，在超出指定时长还没有输出第一应答语音时，非目标机器人便可以判定目标机器人对于第一对话语音的解析因出现故障或其它原因（如网络不畅）而不顺畅，此时，非目标机器人便可以接替目标机器人进行第一对话语音的解析及应答的输出。于是，本发明通过设置非目标机器人适时进行“抢答”的方式确保了目标对象获得良好的语音交互体验。

另外，在目标对象周围指定范围内的智能机器人较多时，过小的第二阈值可能会导致过多的机器人同时“抢答”，导致应答语音过于杂乱，而第二阈值过大时，又会导致目标对象迟迟得不到应答。对此，本发明设置第二阈值可以根据智能机器人的数量而定，智能机器人的数量越多，则第二阈值越大，反之则越小，即第二阈值的大小与智能机器人的数量负相关。

本发明实施例还公开了一种芯片，包括：至少一个处理器和接口；

所述至少一个处理器用于执行所述程序指令，以实现如前述实施例所述的方法。

本发明实施例还公开了一种电子设备，包括：至少一个处理器、存储器以及存储在所述存储器中并可在所述至少一个处理器上运行的计算机程序，其特征在于：所述处理器执行所述计算机程序以实现如前述实施例所述的方法。

本发明实施例还公开了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于：所述计算机程序被处理器执行以实现如前述实施例所述的方法。

本发明实施例还公开了一种计算机程序产品，当计算机程序产品在终端上运行时，使得终端执行时以实现如前述实施例所述的方法。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述，仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。

Claims

1.一种智能机器人的控制方法，其特征在于：包括如下方法步骤：

2.根据权利要求1所述的一种智能机器人的控制方法，其特征在于：所述第一机器人和第二机器人接收并解析目标对象的第一对话语音，包括：

3.根据权利要求2所述的一种智能机器人的控制方法，其特征在于：步骤S13中，所述控制所述第一机器人或所述第二机器人接收并解析所述目标对象的所述第一对话语音，包括：

4.根据权利要求3所述的一种智能机器人的控制方法，其特征在于：在所述目标对象周围还存在若干候选对象时，所述控制所述朝向偏差最小的所述第一机器人或所述第二机器人接收并解析所述目标对象的所述第一对话语音，包括：

5.根据权利要求1所述的一种智能机器人的控制方法，其特征在于：所述第一机器人或所述第二机器人执行针对所述第一对话语音的第一应答语音，包括：

6.根据权利要求5所述的一种智能机器人的控制方法，其特征在于：所述在所述第一应答语音满足指定条件时，未执行所述第一应答语音的所述第一机器人或所述第二机器人执行针对所述第一对话语音的第二应答语音，包括：

7.根据权利要求5或6所述的一种智能机器人的控制方法，其特征在于：所述方法，还包括：

8.一种芯片，其特征在于，包括：至少一个处理器和接口；

所述至少一个处理器用于执行所述程序指令，以实现如权利要求1-7任一所述的方法。

9.一种电子设备，包括：至少一个处理器、存储器以及存储在所述存储器中并可在所述至少一个处理器上运行的计算机程序，其特征在于：所述处理器执行所述计算机程序以实现如权利要求1-7任一所述的方法。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于：所述计算机程序被处理器执行以实现如权利要求1-7任一所述的方法。