CN108091327A

CN108091327A - 一种智能语音设备控制方法

Info

Publication number: CN108091327A
Application number: CN201810153077.0A
Authority: CN
Inventors: 陈思应; 何云鹏; 高君效; 孙振奎; 陈跃华; 余杰
Original assignee: Chengdu Leader Technology Co Ltd
Current assignee: Chengdu Leader Technology Co Ltd; Chipintelli Technology Co Ltd
Priority date: 2018-02-22
Filing date: 2018-02-22
Publication date: 2018-05-29

Abstract

本发明涉及语音识别领域，特别是涉及到一种智能语音设备控制方法，由声音采集模块采集外部语音数据并传输给语音识别模块进行识别，语音识别模块中嵌入有语音识别引擎，语音识别引擎采用DNN算法对语音数据进行识别，使用该方法能够锁定声源的声音去掉其他非声源的声音并可不用将客户的语音数据传输至云端，提高语音识别的准确性并避免泄露客户隐私。

Description

一种智能语音设备控制方法

技术领域

本发明涉及智能语音识别技术领域，特别是涉及到一种能够利用DNN算法来剔除突发噪音的新型语音除噪方法。

背景技术

随着人们生活水平的提高以及对电器的需求量不断增大，家用电器经过不断地改革和创新，拥有了更多使用的功能，比如微波炉，以往仅单纯的用于加热，到如今，微波炉增加了蒸煮、烧烤、热奶等功能且变得更加智能，市面出现的各种品牌的智能微波炉，主要由控制面板、观察窗、炉门安全锁系统、电源线和插头这四大部分组成，控制面板主要有功能设定、时间设定、重量设定等功能，功能设定主要是通过功能菜单实现，比如直接按清蒸鱼、蒸排骨、煮米饭等按钮，自动实现不同的加热方式，各类不同品牌的智能微波炉使用步骤都大同小异。

语音交互作为最有效的沟通控制方式，可以帮助用户把家中的各种终端设备无缝连接起来，智能语音微波炉就是其中之一，以微波炉为例，随着微波炉功能的增加，为了将微波炉的所有功能都在微波炉控制面板上体现出来，生产厂家不得不将微波炉控制面板上的字体和按钮的面积缩小，或者减少一些不常用的功能，当字体和按钮变小后，在查找和使用微波炉某项功能时会非常不方便，这对视力不好的老年人来说更是个挑战；但如果减少功能，又不能完全满足消费者的需求，智能微波炉面板上的可使用面积和不断增加的智能功能之间产生了矛盾。

现有技术中存在以下不足：

1、随着设备功能的不断增加，功能按钮增多，由于面积有限，按钮的面积只能减小，这样对视力不好的人来说非常不方便；

2、随着设备功能的不断增加，功能按钮增多，由于面积有限，只能减少一部分不常用的功能按钮，这样不能完全满足消费者需求；

3、目前市面上的语音交互大多采用云端识别方式，需要将用户的语音数据上传到云端，这样增加了用户隐私泄漏的风险。

发明内容

为了解决上述现有技术中存在的不足，发明了一种能够使用语音控制设备进行相关操作的智能语音设备控制方法。

一种智能语音设备控制方法，其包括以下步骤：

步骤一语音采集模块采集外部语音数据并发送给语音识别模块，；

步骤二所述语音数据经傅立叶变换后输入所述语音识别模块的语音识别引擎；

步骤三所述语音识别引擎采用DNN（深度神经网络）算法在本地终端对所述语音数据进行识别；

步骤四所述语音识别模块将步骤三的识别结果发送给设备控制电路；

步骤五所述设备控制电路根据所述识别结果控制所述设备执行操作；

步骤六所述设备将执行结果反馈给语音播放模块；

步骤七所述语音播放模块播放所述执行结果。

作为本发明的优选方案，所述语音识别模块包含有语音识别引擎，所述语音识别引擎使用DNN算法对所述语音数据进行识别，所述DNN算法对所述语音数据的识别包括语音预处理、特征提取、发音字典及语音模型四个过程。

作为本发明的优选方案，所述语音采集模块集成在设备上，所述语音采集模块包含有N个语音采集设备，所述N为大于等于2的整数，所述语音播放模块集成在操作者能听到的位置，所述语音播放模块包含有M个语音播放设备，其中M为大于等于1的整数。

所述DNN算法包括有语音预处理、特征提取、形成发音字典及建立语音模型等四个过程，其中语音预处理过程包括对语音信号或语音数据的采样、反混叠滤波、语音增强和端点检测，特征提取过程的作用是从语音信号或语音数据的波形中提取一组能够描述语音信号或语音数据特征的参数，以便训练和识别，形成发音字典则是根据发音的音素，得到相应的文本集合即为发音字典，建立语音模型则是利用语法知识调整声学模型所识别出的不合逻辑的词语。

为了使音频数据容易被神经网络处理，需要把复杂的声波分解成一个个组成部分，为实现声波分解，需要利用到傅里叶变换，傅立叶变换将复杂的声波分解为简单的声波，然后将每一份频段所包含的能量加在一起，得到的结果便是从低音到高音的一个频谱，再将该频谱输入深度神经网络，对于每个小的音频切片，神经网络都将尝试找出当前正在说的声音所对应的声母或韵母，当通过神经网络跑完我们的整个音频剪辑之后，最终得到一份映射，其中标明了每个音频块和其最有可能对应的声母或韵母，然后将这些基于发音的预测与基于标注的文本数据库的可能性得分相结合，去掉最不可能的结果，留下最实际的结果。

当对设备说出相应的语音指令时，所述语音识别模块对接收到的语音指令进行识别，所述语音识别模块通过对语音指令的识别对声源进行锁定，声源之外的其他声源则进行过滤剔除，降低了外界其他声源对语音识别的干扰，所述语音识别模块将识别到的语音识别结果通过串口发送给设备的控制芯片，所述控制芯片根据预先设定的程序控制所述设备的各个部分进行协调工作，同时

与现有技术相比，本发明的有益效果：

由于在语音识别模块中嵌入了语音识别引擎，语音识别引擎采用独有的DNN算法对语音数据进行识别，该方法的使用可以方便是设备的功能不再受面积的限制，增加了设备的使用功能，方便了视障人群，还保护了客户的隐私。

附图说明

图1为本发明只能语音设备控制方法流程图；

图2为本发明DNN算法框图；

图3为本发明实施例微波炉工作原理图。

具体实施方式

下面结合实施例及具体实施方式对本发明作进一步的详细描述，但不应将此理解为本发明上述主体的范围仅限于以下的实施例，凡基于本发明内容所实现的技术均属于本发明的范围。

如图1所示，一种智能语音设备控制方法，其包括以下步骤：

步骤一语音采集模块采集外部语音数据并发送给语音识别模块；

步骤四所述语音识别模块将步骤三的识别结果发送给设备控制电路，本实施例中的设备为微波炉，即所述语音识别模块将步骤三的识别结果发送给微波炉控制电路；

步骤五所述微波炉控制电路根据所述识别结果控制微波炉执行操作；

步骤六所述微波炉将执行结果反馈给语音播放模块；

步骤七所述语音播放模块播放所述执行结果。

如图2所示，DNN算法包括语音预处理、特征提取、形成发音字典及建立语音模型等四个过程，其中语音预处理过程包括对语音信号或语音数据的采样、反混叠滤波、语音增强和端点检测，特征提取过程的作用是从语音信号或语音数据的波形中提取一组能够描述语音信号或语音数据特征的参数，以便训练和识别，形成发音字典则是根据发音的音素，得到相应的文本集合即为发音字典，建立语音模型则是利用语法知识调整声学模型所识别出的不合逻辑的词语。。

如图3所示，智能语音微波炉工作时，语音识别模块识别语音数据，并将语音数据的识别结果发送给微波炉控制IC，微波炉控制IC控制微波炉的磁控管、门控及数码显示器件等的正常运行，微波炉运行结束后，通过喇叭播报运行结果，智能语音微波炉设置了数条语音指令和一条唤醒词，语音指令中，包括加热时间、快捷菜单等，当微波炉开机、语音识别系统和电控系统启动成功后，操作者使用唤醒词将语音识别模块唤醒，先使用唤醒词的目的是为了防止误操作，微波炉被唤醒后，操作者对着微波炉说出设定的每一条指令，微波炉都能完全识别并立刻按预先设定的控制流程作出反馈并播报相应的提示音，当A、B两人以不同的角度站在微波炉前时，A通过说唤醒词将微波炉唤醒，语音识别模块对说话人的声音具有锁定功能，一旦语音识别模组识别到A声后，它就会将A的声音进行锁定，此时A可以再连续说数个命令词对微波炉进行控制，此时如果B在旁边讲话，微波炉会把B的声音当成噪声去除掉，这样就算B的讲话中带了微波炉的命令词，微波炉也不会响应其控制，这是为了防止突然的噪音导致无法识别的情况。

Claims

1.一种智能语音设备控制方法，其包括以下步骤：

步骤五所述设备控制电路根据所述识别结果控制设备执行操作；

步骤六所述设备将执行结果反馈给语音播放模块；

步骤七所述语音播放模块播放所述执行结果。

2.根据权利要求1所述的一种新型语音除噪方法，其特征在于：所述语音识别模块包含有语音识别引擎，所述语音识别引擎使用DNN算法对所述语音数据进行识别，所述DNN算法对所述语音数据的识别包括语音预处理、特征提取、发音字典及语音模型四个过程。

3.根据权利要求1所述的一种新型语音除噪方法，其特征在于：所述语音采集模块集成在设备上，所述语音采集模块包含有N个语音采集设备，其中述N为大于等于2的整数，所述语音播放模块集成在操作者能听到的位置，所述语音播放模块包含有M个语音播放设备，其中M为大于等于1的整数。