CN107799120A

CN107799120A - 服务机器人识别唤醒方法及装置

Info

Publication number: CN107799120A
Application number: CN201711107918.6A
Authority: CN
Inventors: 刘雪楠; 覃立万
Original assignee: Beijing Kngli Youlan Robot Technology Co Ltd
Current assignee: Beijing Kngli Youlan Robot Technology Co Ltd
Priority date: 2017-11-10
Filing date: 2017-11-10
Publication date: 2018-03-13

Abstract

本发明公开了一种服务机器人识别唤醒方法和装置，涉及机器人领域，能够减少错误识别次数、提高识别通过率。本发明的方法包括：语音消息获取步骤；语音消息解析步骤；暗语匹配步骤：声纹特征信息匹配步骤：二次声纹特征信息匹配步骤：提示用户二次输入语音信息，然后解析语音信息得到声纹特征信息，形成暂存声纹特征信息模板，降低匹配阈值，将该暂存声纹信息模板与预设的声纹特征信息进行二次匹配；若匹配成功，则生成唤醒指令以指示机器人由待机转为服务状态。本发明主要用于机器人在家庭/商业服务中，机器人能够快速从待机状态经过识别唤醒，转变为服务状态。

Description

服务机器人识别唤醒方法及装置

技术领域

本发明涉及一种机器人，更具体地说，它涉及一种服务机器人识别唤醒方法及装置。

背景技术

近些年，机器人产业呈爆发式增长，人工智能逐渐走进普通老百姓的生活。随着市场需求的不断增大，服务机器人产业的规模持续增长。伴随着语音识别、计算机视觉、人脸识别等人工智能技术的准确率的提高，以及他们在服务机器人上的更好地融合，人类的方方面面正在被服务机器人所“侵蚀”。由于机器人均采用电池作为供电电源，因此，如何降低耗电量一直是研究的课题之一，为了能够有效的节约电量，在人们不需要机器人进行服务时，机器人一般处于待机待唤醒状态。

当用户需要对机器人进行唤醒时，目前的一般采用手动输入启动指令启动、语音识别唤醒、人脸识别唤醒等多种方式。现有的可参考公开号为CN106502649A的中国发明专利申请，其公开了一种机器人服务唤醒方法及装置，其方法包括获取用户输入的语音交互信息、对语音信息进行解析，得到唤醒词好声纹特征信息，之后通过利用唤醒词和声纹特征信息与预设的唤醒词和声纹特征信息进行比对，从而唤醒机器人。

上述唤醒方式只是通过语音识别对待机状态的机器人进行语音唤醒，但是存在不足之处，一旦用户感冒生病、情绪变化，很容易产生语音识别错误，经常会出现多次识别、难以通过或者拒绝通过的情况，用户体验较差。

发明内容

针对现有技术存在的不足，本发明的目的在于提供一种服务机器人识别唤醒方法，其具有的优势是能够减少错误识别次数、提高识别通过率。

为了实现上述目的，本发明的第一方面，提供了一种服务机器人识别唤醒方法，包括：

语音消息获取步骤：在待机状态下，获取用户的语音消息；

语音消息解析步骤：解析获取到的用户的语音消息，得到暗语以及声纹特征信息；

暗语匹配步骤：将解析之后得到的暗语与预设的暗语进行匹配；若暗语匹配成功，则生成声纹特征信息匹配指令以指示机器人进行声纹特征信息匹配；

声纹特征信息匹配步骤：将解析之后得到的声纹特征信息与预设的声纹特征信息进行匹配；若声纹特征信息匹配成功，则生成唤醒指令以指示机器人由待机状态转为服务状态；若声纹特征信息匹配失败，则进行二次声纹特征信息匹配；

二次声纹特征信息匹配步骤：提示用户二次输入语音信息，然后解析语音信息得到声纹特征信息，形成暂存声纹特征信息模板，降低匹配阈值，将该暂存声纹信息模板与预设的声纹特征信息进行二次匹配；若匹配成功，则生成唤醒指令以指示机器人由待机转为服务状态。

优选地，所述语音消息解析步骤中，得到的暗语与预存的暗语一致或者包含于预存的暗语之中。

优选地，在二次声纹特征信息匹配步骤中，匹配成功的声纹特征信息模板更新至声纹特征信息模板库中。

优选地，在暗语匹配步骤之前，还包括语音消息预处理步骤：将获取的语音消息经过预滤波、预加重、加窗、端点检测处理。

优选地，在进入二次声纹特征信息匹配步骤之前，还包括用户身份核准步骤：获取用户的身份信息，与预存的身份特征信息进行匹配。

优选地，所述用户身份核准步骤中，包括指纹识别、二代身份证识别和人脸识别。

为实现上述目的，本发明的第二方面，提供了如下技术方案：

一种服务机器人识别唤醒装置，包括：语音消息获取模块，其用于在待机状态下，获取用户的语音消息；

语音消息解析模块，其用于解析获取到的用户的语音消息，以得到暗语以及声纹特征信息；

暗语匹配模块，其用于将解析之后得到的暗语与预设的暗语进行匹配；若暗语匹配成功，则生成声纹特征信息匹配指令以指示机器人进行声纹特征信息匹配；

声纹特征信息匹配模块，其用于将解析之后得到的声纹特征信息与预设的声纹特征信息进行匹配；若声纹特征信息匹配成功，则生成唤醒指令以指示机器人由待机状态转为服务状态；若声纹特征信息匹配失败，则进入二次声纹特征信息匹配；

二次声纹特征信息匹配模块，其用于提示用户二次输入语音信息，然后解析语音信息得到声纹特征信息，形成暂存声纹特征信息模板，降低匹配阈值，将该暂存声纹信息模板与预设的声纹特征信息进行二次匹配；若匹配成功，则生成唤醒指令以指示机器人由待机转为服务状态。

优选地，所述语音解析模块解析之后得到的暗语与预存的暗语一致或者包含于预存的暗语之中。

优选地，所述二次声纹特征信息匹配模块包括

语音采集单元，其用于采集用户二次输入的语音信息；

语音解析单元，其用于将用户二次输入的语音消息进行解析得到声纹特征信息，形成暂存声纹特征信息模板；

匹配调整单元，其用于降低匹配阈值；

声纹特征信息匹配单元，其用于将暂存的声纹特征信息模板与预设的声纹特征信息进行二次匹配，若匹配成功，则生成唤醒指令以指示机器人由待机转为服务状态。

优选地，该装置还包括用户身份核准模块，其用于在进入二次声纹特征信息匹配之前获取用户的身份信息，与预存的身份特征信息进行匹配；若匹配成功，则进行二次声纹特征信息匹配。

综上所述，本发明具有以下有益效果：

1、本发明通过对用户语音信息进行解析得到暗语与声纹特征信息，并且对二者进行分别匹配，对机器人进行唤醒识别，当用户由于感冒、情绪等变化导致声音发生变化时，能够进行二次声音识别，通过调整阈值来对用户的声纹特征信息进行识别，能够有效的减少错误识别次数，提高识别通过率；

2、本发明通过在对用户语音消息进行二次声纹特征信息识别时，仅识别用户的声纹特征信息，而不对用户的暗语进行识别，节省了识别步骤，避免了二次识别时由于暗语造成的识别错误，在一定程度提高了识别通过率；

3、本发明通过设置用户身份信息核准步骤，能够对用户的身份进行有效的识别，提升了机器人的安全级别，对个人隐私具有良好的保障。

附图说明

图1为本发明一个实施例中的一种服务机器人识别唤醒方法流程图；

图2为本发明一个实施例中的一种服务机器人具体地识别唤醒方法流程图；

图3为本发明另一个实施例中的一种服务机器人识别唤醒方法流程图；

图4为本发明实施例中的一种服务机器人识别唤醒装置的组成示意图；

图5为本发明实施例中的二次声纹特征信息匹配模块的组成示意图。

具体实施方式

下面将结合本发明实施例汇总的附图，对本发明实施例中的技术方案进行清除、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

本发明一实施例提供了一种服务机器人识别唤醒方法，其可以应用服务中，如图1所示，该方法包括：

S101、语音消息获取步骤：在待机状态下，获取用户的语音消息。

S102、语音消息解析步骤：解析获取到的用户的语音消息，得到暗语以及声纹特征信息。

S103、暗语匹配步骤：将解析之后得到的暗语与预设的暗语进行匹配；若暗语匹配成功，则生成声纹特征信息匹配指令以指示机器人进行声纹特征信息匹配。

S104、声纹特征信息匹配步骤：将解析之后得到的声纹特征信息与预设的声纹特征信息进行匹配；若声纹特征信息匹配成功，则生成唤醒指令以指示机器人由待机状态转为服务状态；若声纹特征信息匹配失败，则进行二次声纹特征信息匹配。

S105、二次声纹特征信息匹配步骤：提示用户二次输入语音信息，然后解析语音信息得到声纹特征信息，形成暂存声纹特征信息模板，降低匹配阈值，将该暂存声纹信息模板与预设的声纹特征信息进行二次匹配；若匹配成功，则生成唤醒指令以指示机器人由待机转为服务状态。

此处，声纹特征匹配指令是用于指示机器人开启声纹特征信息匹配。声纹特征匹配指令通过人机进行暗语交互获得，其中，暗语包括但不限于词语和/或数字以及二者形成的短句，通过步骤S102解析得到的暗语需要与预先设定的暗语保持一致或者包含在设定的暗语之中。在一示例中，用户预先设定暗语为“小优”，当用户向机器人发出语音消息为“小优”或者“醒醒，小优”，均能够匹配成功。唤醒指令用于指示机器人开启服务进程，由待机转变为服务状态。需要明白，待机状态下指的是服务进程处于关闭状态，此时机器人不接受任何服务信息，但是其接受用户语音消息的模块处于始终保持开启状态。

需要注意的是，本发明所指代的机器人服务进程包括但不限于机器人操作系统的中枢服务、机器人应用、交互界面的一种或多种。

为了详细阐述本发明实施例的识别唤醒方法，如图2所示，具体地，该识别唤醒方法包括

S201、待机状态时，获取用户的语音消息。

S202、解析获取到的用户的语音消息，得到暗语以及声纹特征信息。具体地，解析得到暗语和声纹特征信息应该分别与预设的暗语和声纹特征信息进行对应对立的匹配，能够明确用户的错误类别，即暗语错误或者非用户本人。

S203、将暗语与预设的暗语进行匹配。

S204、判断是否暗语匹配成功。具体地，在本发明实施例中，暗语匹配应该作为第一优先级进行匹配验证，若暗语匹配失败，则认为用户不清楚暗语，则机器人保持待机状态；若暗语匹配成功，则会生成声纹特征匹配指令指示机器人进行声纹特征信息匹配。

S205、将声纹特征信息与预设声纹特征信息进行匹配。若声纹特征信息匹配成功，则发出唤醒指令以指示机器人由待机状态转变为运行服务状态；若声纹特征信息匹配失败，需要了解的是，声纹特征信息匹配失败的情况有多重，例如：用户感冒、情绪变化大等，此时机器人会发生误识别，造成难以通过或者拒绝通过的情况。

S206、提示用户二次输入语音消息，解析语音消息得到声纹特征信息，形成暂存的声纹特征信息模板。具体地，用户二次输入语音消息，需要说明的是，此时用户二次输入的语音消息并不一定需要包含暗语，为了提高识别通过率，降低暗语造成误判的概率，这里只针对客户的声纹特征信息进行再次识别，解析得到声纹特征信息形成暂存的声纹特征信息模板，此模板将用户此次声纹特征信息进行暂时记录以供与声纹特征信息模板库中的预存的声纹特征信息模板进行匹配验证。

S207、降低匹配阈值，将暂存的声纹特征信息模板与预设的声纹特征信息进行二次匹配。当然，匹配阈值的降低幅度可以进行调节，以用户所需的识别级别进行确定。通过降低匹配阈值能够提高用户的识别通过率，避免出现难以识别、拒绝通过的情况。

S208、判断是否二次匹配成功。若二次匹配成功，则发出唤醒指令以用于指示机器人由待机状态转变为运行服务状态；反之，确定非用户本人使用机器人，机器人拒绝通过，仍然保持待机状态。

本发明实施例中，通过采用二次声纹特征匹配的方式，在这之中，通过降低阈值来保证机器人能够提高识别通过率，我们需要明白，服务机器人，在满足一定的安全识别的基础上，更多的还是能够快速响应用户的命令，因此，保证识别通过率仍然是重点，以此提高用户的使用体验。

本发明另一实施例提供了一种服务机器人识别唤醒方法，如图3所示，该方法中步骤S301至S307是对用户的语音消息进行解析，并且分别对暗语以及声纹特征信息进行独立匹配，其步骤与上一实施例的步骤相同，且原理相同，在此不在赘述。

优选地，在步骤S301之后，步骤S303之前，该方法还包括步骤302、将获取的语音消息经过预滤波、预加重、加窗、端点检测处理。通过对用户的语音消息进行预处理。

优选地，在本发明实施例中，该方法还包括S308、用户身份核准步骤：获取用户的身份信息，与预存的身份特征信息进行匹配。具体地，当用户的声纹特征信息匹配失败之后，需要验证用户的身份信息，确保用户为本人，进一步地提升了机器人的安全使用级别。

当然，应该理解的是，本发明实施例的用户身份核准步骤并不是仅仅限定在用户进行第一次语音失败的情况下便直接开始，也可以在用户进行有限次语音验证失败后开始运行，与之相关联的，本发明实施例中所述的二次语音验证不仅限于表述两次，而应该是身份核准步骤通过之后开始进行的声纹特征信息的匹配验证。

S309、判断是否身份信息匹配成功。此处的身份信息包括指纹、二代身份证以及人脸。若身份信息匹配失败，则确定使用者非用户本人，则机器人保持待机状态，若身份信息匹配成功，则对用户进行二次语音识别。

S310、提示用户二次输入语音消息，解析语音消息得到声纹特征信息，形成暂存声纹特征信息模板。

S311、降低匹配阈值，将暂存声纹特征信息模板与预设的声纹特征信息进行二次匹配。

S312、判断是否声纹特征信息匹配成功。

其中，步骤S310与S312与上一实施例中的所述的步骤相同，原理相同，故不在此赘述。

进一步地，还包括步骤S313、将匹配成功的声纹特征信息模板更新至声纹特征信息模板库中。

容易理解的，将此时用户状态下的用户声纹特征信息模板更新至声纹特征模板库中，能够更多的存储用户不同状态下的声纹特征信息，在今后的使用过程中，一旦再次出现用户此次状态，机器人能够一步识别用户，有利于减少错误识别次数，提高机器人的识别通过率，避免出现难以识别或者拒绝识别的情况，提高了用户体验。

本发明另一实施例提供了一种服务机器人识别唤醒装置，如图4所示，该装置包括：

语音消息获取模块41，其用于在待机状态下，获取用户的语音消息。

语音消息解析模块42，其用于解析获取到的用户的语音消息，以得到暗语以及声纹特征信息。

暗语匹配模块43，其用于将解析之后得到的暗语与预设的暗语进行匹配；若暗语匹配成功，则生成声纹特征信息匹配指令以指示机器人进行声纹特征信息匹配。

声纹特征信息匹配模块44，其用于将解析之后得到的声纹特征信息与预设的声纹特征信息进行匹配；若声纹特征信息匹配成功，则生成唤醒指令以指示机器人由待机状态转为服务状态；若声纹特征信息匹配失败，则进入二次声纹特征信息匹配。

二次声纹特征信息匹配模块46，其用于提示用户二次输入语音信息，然后解析语音信息得到声纹特征信息，形成暂存声纹特征信息模板，降低匹配阈值，将该暂存声纹信息模板与预设的声纹特征信息进行二次匹配；若匹配成功，则生成唤醒指令以指示机器人由待机转为服务状态。

优选地，该装置还包括用户身份核准模块45，其用于在进入二次声纹特征信息匹配之前获取用户的身份信息，与预存的身份特征信息进行匹配；若匹配成功，则进行二次声纹特征信息匹配。

优选地，如图5所示，本发明实施例提供了二次声纹特征信息匹配模块46的组成示意图，该二次声纹特征信息匹配模块46包括：

语音采集单元461，其用于采集用户二次输入的语音信息。其在机器人处于待机状态时，始终保持开启状态。优选地，语音采集单元461可以选择音频采集装置，例如：高灵敏度的麦克风。

语音解析单元462，其用于将用户二次输入的语音消息进行解析得到声纹特征信息，形成暂存声纹特征信息模板。

匹配调整单元463，其用于降低匹配阈值。

声纹特征信息匹配单元464，其用于将暂存的声纹信息模板与预设的声纹特征信息进行二次匹配，若匹配成功，则生成唤醒指令以指示机器人由待机转为服务状态。

本发明实施例中提供的服务机器人识别唤醒装置与上述识别唤醒方法一样，能够有效的减少错误识别次数，提高识别通过率；提升了机器人的安全级别，对个人隐私具有良好的保障。

通过以上实施方式的描述，所述领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在可读取的存储介质中，如计算机的软盘、硬盘或光盘等，包括若干指令用以使得一台计算机设别（可以是个人计算机，服务器，或者网络设备等）执行本发明各个实施例所述的方法。

以上所述，仅仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易的变化或者替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种服务机器人识别唤醒方法，其特征在于，包括：

语音消息获取步骤：在待机状态下，获取用户的语音消息；

2.根据权利要求1所述的服务机器人识别唤醒方法，其特征在于，所述语音消息解析步骤中，得到的暗语与预存的暗语一致或者包含于预存的暗语之中。

3.根据权利要求1所述的服务机器人识别唤醒方法，其特征在于，在二次声纹特征信息匹配步骤中，匹配成功的声纹特征信息模板更新至声纹特征信息模板库中。

4.根据权利要求1所述的服务机器人识别唤醒方法，其特征在于，在暗语匹配步骤之前，还包括

语音消息预处理步骤：将获取的语音消息经过预滤波、预加重、加窗、端点检测处理。

5.根据权利要求1至4任意一项所述的服务机器人识别唤醒方法，其特征在于，在进入二次声纹特征信息匹配步骤之前，还包括

用户身份核准步骤：获取用户的身份信息，与预存的身份特征信息进行匹配。

6.根据权利要求5所述的服务机器人识别唤醒方法，其特征在于，所述用户身份核准步骤中，包括指纹识别、二代身份证识别和人脸识别。

7.一种服务机器人识别唤醒装置，其特征在于，包括：

语音消息获取模块（41），其用于在待机状态下，获取用户的语音消息；

语音消息解析模块（42），其用于解析获取到的用户的语音消息，以得到暗语以及声纹特征信息；

暗语匹配模块（43），其用于将解析之后得到的暗语与预设的暗语进行匹配；若暗语匹配成功，则生成声纹特征信息匹配指令以指示机器人进行声纹特征信息匹配；

声纹特征信息匹配模块（44），其用于将解析之后得到的声纹特征信息与预设的声纹特征信息进行匹配；若声纹特征信息匹配成功，则生成唤醒指令以指示机器人由待机状态转为服务状态；若声纹特征信息匹配失败，则进入二次声纹特征信息匹配；

二次声纹特征信息匹配模块（46），其用于提示用户二次输入语音信息，然后解析该语音信息得到声纹特征信息，形成暂存声纹特征信息模板，降低匹配阈值，将该暂存声纹信息模板与预设的声纹特征信息进行二次匹配；若匹配成功，则生成唤醒指令以指示机器人由待机转为服务状态。

8.根据权利要求7所述的服务机器人识别唤醒装置，其特征在于，所述语音解析模块（42）解析之后得到的暗语与预存的暗语一致或者包含于预存的暗语之中。

9.根据权利要求7所述的服务机器人识别唤醒装置，其特征在于，所述二次声纹特征信息匹配模块（46）包括

语音采集单元（461），其用于采集用户二次输入的语音信息；

语音解析单元（462），其用于将用户二次输入的语音消息进行解析得到声纹特征信息，形成暂存声纹特征信息模板；

匹配调整单元（463），其用于降低匹配阈值；

声纹特征信息匹配单元（464），其用于将暂存的声纹特征信息模板与预设的声纹特征信息进行二次匹配，若匹配成功，则生成唤醒指令以指示机器人由待机转为服务状态。

10.根据权利要求7至9任意一项所述的服务机器人识别唤醒装置，其特征在于，该装置还包括

用户身份核准模块（45），其用于在进入二次声纹特征信息匹配之前获取用户的身份信息，与预存的身份特征信息进行匹配；若匹配成功，则进行二次声纹特征信息匹配。