CN105957535A

CN105957535A - 机器人语音信号探测识别系统

Info

Publication number: CN105957535A
Application number: CN201610230162.3A
Authority: CN
Inventors: 王运志
Original assignee: Qingdao Krund Robot Co Ltd
Current assignee: Qingdao Krund Robot Co Ltd
Priority date: 2016-04-15
Filing date: 2016-04-15
Publication date: 2016-09-21

Abstract

本发明涉及语音信号探测识别技术领域，具体公开了一种机器人语音信号探测识别系统，包括机器人主体、摄像头、触摸屏、麦克风线阵、信号处理电路、控制电路和上位机，机器人主体的前侧设有斜面结构，麦克风线阵设在斜面结构的下部，信号处理电路用于对麦克风线阵采集的声信号进行声源定位和降噪处理、将声源定位结果和硬件唤醒信号传递给控制电路以及将降噪后的声信号传递给上位机，控制电路用于将声源定位结果和硬件唤醒信号传递给上位机以及将软件睡眠信号传递给信号处理电路，上位机用于对降噪后的声信号进行语音识别以及将软件睡眠信号传递给控制电路。本发明能够在适应机器人具体外观条件的情况下完成语音信号的探测识别。

Description

机器人语音信号探测识别系统

技术领域

本发明涉及语音信号探测识别技术领域，尤其涉及一种机器人语音信号探测识别系统。

背景技术

随着仿人机器人研究的不断发展，用于机器人听觉的声探测识别系统成为了智能机器人的组成部分，是实现人机交互以及机器人与环境交互的重要手段。声探测系统的定位和识别技术在现代军事系统、残疾人辅助以及智能设备中有重要的应用价值，发挥了极为重要的作用。

现有机器人为了与人类进行语音交互以及对周围事件发生进行监测，需要采用麦克风阵列(即传声器阵列)进行声源定位检测和语音信号识别。目前，机器人已采用的麦克风阵型根据采用麦克风个数不同和阵型不同，可包括，二元阵、多元线阵、多元平面阵和立体阵等。对于不同的机器人，要根据其特定的外观条件，根据其特定的声探测和处理的需求，进行麦克风阵设计和实现。

部分机器人采用安装在机器人头部两侧的两个麦克风构成的二元阵进行声探测和处理，该阵型利用声信号到达不同麦克风的时间差异和位相差异等信息对声源进行定位，进而进行后续处理。其他类型机器人有的将线阵、面阵或立体阵布置于机器人身体不同位置，构成声探测识别系统。实际上，对于不同的机器人，采用何种麦克风阵型进行布阵是需要结合具体外观条件具体设计的。

综上所述，现有机器人声探测识别技术已可对声源进行定位探测，亦可对语音信号进行识别，但是，针对一些机器人的具体情况，现有机器人声探测系统需要改造以适应机器人外观设计条件和语音应用需求。

发明内容

本发明的目的是提供一种机器人语音信号探测识别系统，以在适应机器人具体外观条件的情况下进行声信号降噪和声源定位，从而完成语音信号的探测识别。

为了解决上述技术问题，本发明提供了一种机器人语音信号探测识别系统，包括机器人主体、摄像头、触摸屏和麦克风线阵，还包括信号处理电路、控制电路和上位机；

所述机器人主体的前侧设有斜面结构，所述触摸屏设在所述斜面结构的中部，所述摄像头设在所述斜面结构的上部，所述麦克风线阵设在所述斜面结构的下部；所述麦克风线阵中的各麦克风的信号线与所述信号处理电路连接，所述信号处理电路又分别与所述控制电路和上位机连接，所述控制电路又与所述上位机连接；

所述信号处理电路用于对所述麦克风线阵采集的声信号进行声源定位和降噪处理、将声源定位结果和硬件唤醒信号传递给所述控制电路以及将降噪后的声信号传递给所述上位机，所述控制电路用于将声源定位结果和硬件唤醒信号传递给所述上位机以及将软件睡眠信号传递给所述信号处理电路，所述上位机设有声信号处理识别软件，所述上位机用于对降噪后的声信号进行语音识别以及将软件睡眠信号传递给所述控制电路。

优选地，所述麦克风线阵为四元麦克风线阵。

优选地，所述麦克风线阵设在所述斜面结构下部的长方形安装凹槽中。

优选地，所述声源定位结果为声源方位角度。

优选地，在所述信号处理电路和控制电路处于睡眠状态时，所述信号处理电路仅对麦克风线阵采集的声信号进行唤醒词识别。

优选地，所述上位机通过所述声信号处理识别软件识别降噪后的声信号并将声信号分为命令信号和人机交互信号。

优选地，当声信号为命令信号时，所述上位机评价命令信号识别率的高低，如果命令信号识别率高于预设的阈值，则该命令信号识别可信度高，所述上位机执行所识别的用户交与的相应命令，如果命令信号识别率低于预设的阈值，则该命令信号识别可信度低，所述上位机提问用户以确认是否执行其所识别的命令。

优选地，当声信号为人机交互信号时，所述上位机执行人机交互功能，完成用户交于的任务。

本发明的机器人语音信号探测识别系统能够利用固定在机器人主体胸部前侧斜面结构下半部分的麦克风线阵对机器人主体前方半球内的声源进行探测，当有背景声源干扰存在时，可对干扰噪声信号进行有效抑制，突出目标声源的声信号，即进行声信号降噪和声源定位，然后将降噪后的声信号传给上位机，通过上位机的声信号处理识别软件对声信号的内容进行语音识别，从而完成用户交与的任务，实现在适应机器人具体外观条件的情况下机器人的智能语音交互功能。

附图说明

图1为本发明实施例的机器人主体与摄像头、触摸屏及麦克风线阵的安装左视图；

图2为本发明实施例的机器人主体与摄像头、触摸屏及麦克风线阵的安装前视图；

图3为本发明实施例的机器人语音信号探测识别系统的工作原理图；

图4为本发明实施例的机器人语音信号探测识别系统的上位机的工作原理图。

图中，1：机器人主体；2：斜面结构；3：摄像头；4：触摸屏；5：麦克风线阵。

具体实施方式

下面结合附图和实施例对本发明的实施方式作进一步详细描述。以下实施例用于说明本发明，但不能用来限制本发明的范围。

如图1所示，本实施例的机器人语音信号探测识别系统包括：机器人主体1、摄像头3、触摸屏4、麦克风线阵5、信号处理电路、控制电路和上位机；

机器人主体1的胸部的前侧设有斜面结构2，如图2所示，触摸屏4设在斜面结构2的中部，摄像头3设在斜面结构2的上部，摄像头3为监控摄像头，用于进行图像检测和监控，麦克风线阵5设在斜面结构2的下部，具体的，麦克风线阵5可以设在斜面结构2下部的长方形安装凹槽中，信号处理电路、控制电路和上位机可设在机器人主体1中。

如图3所示，麦克风线阵5中的各麦克风的信号线与信号处理电路连接，具体的，麦克风线阵5可以为四元麦克风线阵，信号处理电路又分别与控制电路和上位机连接，控制电路又与上位机连接。

信号处理电路用于对麦克风线阵采集的声信号进行声源定位和降噪处理、将声源定位结果和硬件唤醒信号传递给控制电路以及将降噪后的声信号传递给上位机，其中，声源定位结果为声源方位角度，控制电路用于将声源定位结果和硬件唤醒信号传递给上位机以及将软件睡眠信号传递给信号处理电路，上位机设有声信号处理识别软件，上位机用于对降噪后的声信号进行语音识别以及将软件睡眠信号传递给控制电路。

具体的，当信号处理电路在睡眠状态时接收到并识别出唤醒词命令，则信号处理电路定位出发出唤醒词的声源，给出声源的方位角度。信号处理电路将硬件唤醒信号输出给控制电路，控制电路被唤醒。信号处理电路被唤醒词命令唤醒后，就开始对麦克风阵输出的声信号进行降噪等处理，并将降噪后的处理结果输出给上位机。在上位机发给控制电路软件睡眠信号后，控制电路会控制信号处理电路进入睡眠状态。进入睡眠状态后，信号处理电路仅对麦克风输入的声信号进行唤醒词识别，不对声信号做声定位和降噪等高级处理。当控制电路被硬件唤醒信号唤醒后，控制电路向上位机发出硬件唤醒信号，将上位机唤醒。上位机被唤醒之后，上位机开始读取信号处理电路输出的、降噪处理后的语音信号，进行语音识别等处理。同时，控制电路从信号处理电路读取声定位结果，将声源的方位角度结果输出给上位机。当上位机需要控制机器人进入睡眠状态时，上位机将软件睡眠信号发给控制电路。控制电路从上位机得到软件睡眠信号后，控制电路将控制信号处理电路进入睡眠状态。

上位机通过同控制电路进行通信，从控制电路获得硬件唤醒信号后被唤醒，进入到语音信号识别的工作状态中。当上位机判断机器人应该进入睡眠状态时，上位机通过和控制电路的通信，发给控制电路软件睡眠信号，则控制电路和信号处理电路会进入睡眠状态，降低功耗。控制电路和信号处理电路将处理结果传给上位机。在上位机中有语音识别软件系统，该系统可完成对语音信号识别和识别结果输出工作。在识别工作过程中，当机器人被唤醒后，用户发出人机交互语音，机器人接收、发送、处理语音数据，生成并解析语音处理结果，判定语音类型是命令类型或者是人机交互类型。如果是命令类型，则机器人执行用户交给的相应命令。如果是人机交互类型，则机器人执行用户交给的相应人机交互操作(如聊天、查询、播放音乐)。

如图4所示，在信号处理电路和控制电路处于睡眠状态时，信号处理电路仅对麦克风线阵采集的声信号进行唤醒词识别。上位机通过声信号处理识别软件识别降噪后的声信号并将声信号分为命令信号和人机交互信号。当声信号为命令信号时，上位机评价命令信号识别率的高低，如果命令信号识别率高于预设的阈值，则该命令信号识别可信度高，上位机执行所识别的用户交与的相应命令，如果命令信号识别率低于预设的阈值，则该命令信号识别可信度低，上位机提问用户以确认是否执行其所识别的命令，让用户做出判断，如果用户说识别的命令就是用户交与的命令，则上位机执行该命令，满足用户需求，如果用户说识别的命令不是用户交与的命令，则上位机不执行所识别的命令，重新开始语音信号识别，接收用户的命令。当声信号为人机交互信号时，上位机执行人机交互功能，完成用户交予的任务。

本发明的机器人语音信号探测识别系统能够利用固定在机器人主体胸部前侧斜面结构下半部分的麦克风线阵对机器人主体前方半球内的声源进行探测，当有背景声源干扰存在时，可对干扰噪声信号进行有效抑制，突出目标声源的声信号，即进行声信号降噪和声源定位，然后将降噪后的声信号传给上位机，通过上位机的声信号处理识别软件对声信号的内容进行语音识别，从而完成用户交与的任务，实现在适应机器人具体外观条件(如针对哇欧机器人特定的外观条件)的情况下机器人的智能语音交互功能。

本发明的实施例是为了示例和描述起见而给出的，而并不是无遗漏的或者将本发明限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显而易见的。选择和描述实施例是为了更好说明本发明的原理和实际应用，并且使本领域的普通技术人员能够理解本发明从而设计适于特定用途的带有各种修改的各种实施例。

Claims

1.一种机器人语音信号探测识别系统，包括机器人主体、摄像头、触摸屏和麦克风线阵，其特征在于，还包括信号处理电路、控制电路和上位机；

2.根据权利要求1所述的机器人语音信号探测识别系统，其特征在于，所述麦克风线阵为四元麦克风线阵。

3.根据权利要求1所述的机器人语音信号探测识别系统，其特征在于，所述麦克风线阵设在所述斜面结构下部的长方形安装凹槽中。

4.根据权利要求1所述的机器人语音信号探测识别系统，其特征在于，所述声源定位结果为声源方位角度。

5.根据权利要求1-4中任何一项所述的机器人语音信号探测识别系统，其特征在于，在所述信号处理电路和控制电路处于睡眠状态时，所述信号处理电路仅对麦克风线阵采集的声信号进行唤醒词识别。

6.根据权利要求5所述的机器人语音信号探测识别系统，其特征在于，所述上位机通过所述声信号处理识别软件识别降噪后的声信号并将声信号分为命令信号和人机交互信号。

7.根据权利要求6所述的机器人语音信号探测识别系统，其特征在于，当声信号为命令信号时，所述上位机评价命令信号识别率的高低，如果命令信号识别率高于预设的阈值，则该命令信号识别可信度高，所述上位机执行所识别的用户交与的相应命令，如果命令信号识别率低于预设的阈值，则该命令信号识别可信度低，所述上位机提问用户以确认是否执行其所识别的命令。

8.根据权利要求6所述的机器人语音信号探测识别系统，其特征在于，当声信号为人机交互信号时，所述上位机执行人机交互功能，完成用户交于的任务。