CN109448708A

CN109448708A - 远场语音唤醒系统

Info

Publication number: CN109448708A
Application number: CN201811198363.5A
Authority: CN
Inventors: 李超凡; 黄为
Original assignee: Sichuan Changhong Electric Co Ltd
Current assignee: Sichuan Changhong Electric Co Ltd
Priority date: 2018-10-15
Filing date: 2018-10-15
Publication date: 2019-03-08

Abstract

本发明提出一种远场语音唤醒系统，属于智能设备的语音唤醒领域。本发明解决了目前在不同的噪声环境下，智能设备的唤醒识别易受干扰、识别不准的问题，其技术方案要点为：包括麦克风模块、语音处理模块及唤醒引擎模块，语音处理模块包括多个并行的处理模块，多个并行的处理模块分别通过使用不同的算法对语音识别信息进行处理，并将处理结果均传输至唤醒引擎模块；唤醒语音模块包括与多个并行的处理模块相对应多个唤醒识别模块，多个唤醒识别模块用于接收到所述处理结果后，分别通过每个唤醒识别模块对相应的处理结果进行语音唤醒命令的识别处理，若存在至少一个处理结果被识别成功，则表示能够通过识别的语音识别信息唤醒该系统所在的智能装置。

Description

远场语音唤醒系统

技术领域

本发明涉及语音处理技术，特别涉及远场语音唤醒系统的技术。

背景技术

随着科技的发展，智能设备的应用越来越广泛，在智能设备上使用语音唤醒技术的应用也越来越普遍。随着用户对语音唤醒体验的要求越来越高，用户不再只满足与近场语音的唤醒体验，也开始追求远场语音的唤醒体验。

相对于近场语音的唤醒，远场语音的唤醒碰到的困难更多，比如环境噪声，混响，其他人的话语干扰等等都会影响智能设备对用户唤醒命令的识别，导致智能设备唤醒率的降低。现在有很多算法能够对远场语音数据进行处理，比如波束形成算法，去混响算法，降噪算法，回声消除算法等等，但这些算法在对这些干扰进行去除的同时，对用户的语音也带来了损伤。在不同的噪声环境下，这些算法的输出，对智能设备的唤醒识别带来的影响是不确定的。

发明内容

本发明的目的是提供一种远场语音唤醒系统，解决目前在不同的噪声环境下，智能设备的唤醒识别易受干扰、识别不准的问题。

本发明解决其技术问题，采用的技术方案是：远场语音唤醒系统，包括麦克风模块，还包括语音处理模块及唤醒引擎模块，所述麦克风模块通过语音处理模块与唤醒引擎模块连接；

所述麦克风模块用于识别语音数据信息，并将识别的语音识别信息传输至语音处理模块；

所述语音处理模块包括多个并行的处理模块，所述多个并行的处理模块分别通过使用不同的算法对麦克风模块传输来的语音识别信息进行处理，并将处理结果均传输至唤醒引擎模块；

所述唤醒引擎模块包括与多个并行的处理模块相对应多个唤醒识别模块，所述多个唤醒识别模块用于接收到所述处理结果后，分别通过每个唤醒识别模块对相应的处理结果进行语音唤醒命令的识别处理，若存在至少一个处理结果被识别成功，则表示能够通过识别的语音识别信息唤醒该系统所在的智能装置。

具体地，所述麦克风模块包括多个麦克风芯片，多个麦克风芯片呈线性阵列设置。

进一步地，所述麦克风芯片的个数为4个，相邻麦克风芯片之间的间距为3.5厘米。

具体地，所述多个处理模块包括不作处理模块、进行回声消除算法模块、进行波束形成算法模块、进行去混响算法模块及进行降噪算法模块。

再进一步地，该远场语音唤醒系统还包括LED提示模块，所述LED提示模块与唤醒引擎模块连接，当处理结果识别成功后，通过LED提示模块对用户进行提醒。

本发明的有益效果是，通过上述远场语音唤醒系统，首先，通过麦克风模块用于识别语音数据信息，并将识别的语音识别信息传输至语音处理模块；其次，语音处理模块包括多个并行的处理模块，多个并行的处理模块分别通过使用不同的算法对麦克风模块传输来的语音识别信息进行处理，并将处理结果均传输至唤醒引擎模块；然后，唤醒语音模块包括与多个并行的处理模块相对应多个唤醒识别模块，所述多个唤醒识别模块用于接收到所述处理结果后，分别通过每个唤醒识别模块对相应的处理结果进行语音唤醒命令的识别处理，若存在至少一个处理结果被识别成功，则表示能够通过识别的语音识别信息唤醒该系统所在的智能装置。每个唤醒识别流程，使用多线程的技术，每个流程使用一个线程，互不影响。每个处理流程，获取不同的语音数据，即不同的算法处理流程输出的语音数据。

针对现实生活中的多种噪声环境，使用多个不同算法处理后的多路数据，进行综合的唤醒识别，能够得到最高的唤醒率。如此，提高了智能设备的唤醒率，提高了智能设备唤醒系统的稳定性，进而提升了用户体验。

附图说明

图1为本发明远场语音唤醒系统的结构框图。

具体实施方式

下面结合实施例及附图，详细描述本发明的技术方案。

本发明所述远场语音唤醒系统，包括麦克风模块，还包括语音处理模块及唤醒引擎模块，麦克风模块通过语音处理模块与唤醒引擎模块连接，其结构框图参见图1，其中：

麦克风模块用于识别语音数据信息，并将识别的语音识别信息传输至语音处理模块；

语音处理模块包括多个并行的处理模块，多个并行的处理模块分别通过使用不同的算法对麦克风模块传输来的语音识别信息进行处理，并将处理结果均传输至唤醒引擎模块；

唤醒引擎模块包括与多个并行的处理模块相对应多个唤醒识别模块，多个唤醒识别模块用于接收到处理结果后，分别通过每个唤醒识别模块对相应的处理结果进行语音唤醒命令的识别处理，若存在至少一个处理结果被识别成功，则表示能够通过识别的语音识别信息唤醒该系统所在的智能装置。

这里，在智能设备上，麦克风录取到的数据，输入给语音处理模块，得到多路的输出。这多路的输出，作为唤醒引擎模块的输入，唤醒引擎模块识别为唤醒成功，就对智能设备进行唤醒操作。

上述系统中，为了能识别到更精准的语音数据信息，麦克风模块包括多个麦克风芯片，多个麦克风芯片呈线性阵列设置，并且，麦克风芯片的个数为4个，相邻麦克风芯片之间的间距为3.5厘米。

多个处理模块包括不作处理模块、进行回声消除算法模块、进行波束形成算法模块、进行去混响算法模块及进行降噪算法模块。

为了避免在不能唤醒智能装置时，影响用户体验，该远场语音唤醒系统还包括LED提示模块，其中，LED提示模块与唤醒引擎模块连接，当处理结果识别成功后，通过LED提示模块对用户进行提醒。

实施例

本发明实施例所提出的远场语音唤醒系统，应用的操作系统为：Android 8.0，麦克风模块为：麦克风芯片的个数优选为4个，相邻麦克风芯片之间的间距为3.5厘米，芯片平台为：MST848。

处理模块分别进行按以下算法进行处理：不作处理、进行回声消除算法处理、进行波束形成算法处理、进行去混响算法处理及进行降噪算法处理。

本实施例采用4个呈线性阵列设置的麦克风芯片作为声音采集模块，采集到的4路语音数据送入语音处理模块，语音处理模块包含并行的四路处理流程，分别是：不作处理、进行回声消除算法处理、进行波束形成算法处理、进行去混响算法处理。四路处理后的语音数据送入唤醒引擎模块，唤醒引擎模块包含并行的四路唤醒识别流程，任何一路唤醒识别成功，就对智能设备进行唤醒操作。

Claims

1.远场语音唤醒系统，包括麦克风模块，其特征在于，还包括语音处理模块及唤醒引擎模块，所述麦克风模块通过语音处理模块与唤醒引擎模块连接；

2.根据权利要求1所述的远场语音唤醒系统，其特征在于，所述麦克风模块包括多个麦克风芯片，多个麦克风芯片呈线性阵列设置。

3.根据权利要求1所述的远场语音唤醒系统，其特征在于，所述麦克风芯片的个数为4个，相邻麦克风芯片之间的间距为3.5厘米。

4.根据权利要求1所述的远场语音唤醒系统，其特征在于，所述多个处理模块包括不作处理模块、进行回声消除算法模块、进行波束形成算法模块、进行去混响算法模块及进行降噪算法模块。

5.根据权利要求1-4任意一项所述的远场语音唤醒系统，其特征在于，还包括LED提示模块，所述LED提示模块与唤醒引擎模块连接，当处理结果识别成功后，通过LED提示模块对用户进行提醒。