CN108417211A

CN108417211A - 一种多功能语音识别控制器

Info

Publication number: CN108417211A
Application number: CN201810090860.7A
Authority: CN
Inventors: 操太伟; 白恩健; 沈俊; 赵轶
Original assignee: Donghua University
Current assignee: Donghua University; National Dong Hwa University
Priority date: 2018-01-30
Filing date: 2018-01-30
Publication date: 2018-08-17

Abstract

本发明涉及一种多功能语音识别控制器，包括主控制器，所述主控制器外接有孤立词语音识别芯片，所述主控制器还外接有录音模块；所述录音模块和主控制器相连后具有完全的语音识别功能，通过编程实现说话人的识别，用于识别说话人身份；所述孤立词语音识别芯片将识别的语意发送给主控制器；所述录音模块和孤立词语音识别芯片同时获得语音数据并进行识别；所述主控制器根据语意和说话人身份确定说话人是否有权限执行该语意对应的命令，整合这些信息后发送控制指令。本发明通过两个模块分别对语意和说话人身份进行识别，大大减少了反应时间。

Description

一种多功能语音识别控制器

技术领域

本发明涉及语音控制技术领域，特别是涉及一种多功能语音识别控制器。

背景技术

随着物联网的快速发展，各种电子产品不断深入到人们的生活中，使人民的生活水平和生活质量得到很大的提高，人们对智能家居产品的实用性和功能多样性要求也越来越高。语音控制是一种比较新颖的控制方式，在以后的智能家居领域将扮演更重要的角色。但是目前的家具控制方式存在很多不便，不能满足人民对智能家居产品的要求。

发明内容

本发明所要解决的技术问题是提供一种多功能语音识别控制器，能够减少反应时间。

本发明解决其技术问题所采用的技术方案是：提供一种多功能语音识别控制器，包括主控制器，所述主控制器外接有孤立词语音识别芯片，所述主控制器还外接有录音模块；所述录音模块和主控制器相连后具有完全的语音识别功能，通过编程实现说话人的识别；所述录音模块和孤立词语音识别芯片同时获得语音数据并进行识别；所述孤立词语音识别芯片将识别的语意发送给主控制器；所述主控制器根据语意和说话人身份确定说话人是否有权限执行该语意对应的命令，整合这些信息后发送控制指令。

所述主控制器还外接存储器，所述存储器包括Nand Flash和SDRAM，所述NandFlash用于存储程序和数据，所述程序用于完成系统的初始化和说话人识别算法，并最终发送控制命令；所述数据包括提前训练的说话人特征矩阵和隐马尔可夫模型数据；所述SDRAM作为主控制器的内存使用。

所述录音模块还与音频播放模块相连，所述音频播放模块在录音模块录音后能播放录音结果，并在产生最终的控制指令后通过语音的形式通知用户命令的执行情况。

所述主控制器还连接有串口模块，所述串口模块与外部设备相连，用于将主控制器的控制指令发送给外部设备。

有益效果

由于采用了上述的技术方案，本发明与现有技术相比，具有以下的优点和积极效果：本发明具有高速的语意识别功能，用户可以将需要识别的孤立词通过编程写入到LD3320中，芯片能自动识别并将结果传送给主控制器。本发明具有说话人识别功能，MCU可以得到录音数据，并根据识别算法识别说话人身份，MCU将两种信息融合发出最终的控制命令。主控制器可以通过声卡WM8976发出语音通知，反馈识别结果，主控制器通过通用的串口与其他设备相连，使其他设备具有了语音识别功能。

附图说明

图1为本发明的系统结构方框图；

图2为外接的孤立词语音识别芯片框图。

具体实施方式

下面结合具体实施例，进一步阐述本发明。应理解，这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解，在阅读了本发明讲授的内容之后，本领域技术人员可以对本发明作各种改动或修改，这些等价形式同样落于本申请所附权利要求书所限定的范围。

本发明的实施方式涉及一种多功能语音识别控制器，包括主控制器，所述主控制器外接有孤立词语音识别芯片，所述主控制器还外接有录音模块；所述录音模块和主控制器相连后具有完全的语音识别功能，通过编程实现说话人的识别，用于识别说话人身份；所述孤立词语音识别芯片将识别的语意发送给主控制器；所述录音模块和孤立词语音识别芯片同时获得语音数据并进行识别；所述主控制器根据语意和说话人身份确定说话人是否有权限执行该语意对应的命令，整合这些信息后发送控制指令。

如图1所示，该多功能语音识别控制器由主控芯片和外部语音识别芯片LD3320组成，各个模块的连接方式也在图中标明。以主控制器MCU为核心，包括外部孤立词语音识别模块、USB模块、录音和放音模块、串口模块以及外设LED等。

外部孤立词语音识别模块具有录音功能，能独立完成语意识别。与主控制器相连的WM8976芯片是一个声卡芯片，具有录音和放音功能。主控制器和LD3320同时完成识别任务，LD3320将结果通过GPIO发送给主控制器，主控制器融合这些信息，发出命令控制给直接相连的外设或者通过串口发送给其它设备。

如图2，LD3320系列芯片是单芯片语音识别芯片，芯片内置了完整的识别引擎和语音识别特征库，因此，用户可以编辑任意内容的关键词语列表来进行识别。芯片内置有AD/DA转换，麦克风接口，音频输出接口，不需要外接RAM或FLASH，单个芯片即可完成声音采集，播放，识别并输出识别结果等功能。

所述的多功能语音识别控制器还包括外接的存储器，包括Nand Flash和SDRAM，Nand Flash存储程序和数据，这些程序完成系统的初始化和说话人识别算法，并最终发送控制命令；数据包括提前训练的说话人特征矩阵和隐马尔可夫模型数据。SDRAM作为内存使用，存储空间大，能够满足说话人识别和存储大量数据的作用。

所述的多功能语音识别控制器还包括与录音模块相连的音频播放模块，该模块在录音后能播放录音结果，在产生最终的控制命令后也可以以语音的形式通知用户命令的执行情况。

所述的多功能语音识别控制器还包括与主控制器相连的串口模块，串口模块提供一个通用的外接接口，与其他设备相连后能进一步扩大本发明的应用范围。

所述外接的孤立词语音识别模块与主控通过USB口连接，同时USB接口也是外接芯片的编程接口；外接模块通过IO口与主控制器连接后发送识别结果。

不难发现，本发明具有以下功能：

一、高速的语意识别功能，用户可以将需要识别的孤立词通过编程写入到LD3320中，芯片能自动识别并将结果传送给主控制器。

二、说话人识别功能，MCU可以得到录音数据，并根据识别算法识别说话人身份，MCU将两种信息融合发出最终的控制命令。

三、主控制器可以通过声卡WM8976发出语音通知，反馈识别结果。

四、主控制器通过通用的串口与其他设备相连，使其他设备具有了语音识别功能。

Claims

1.一种多功能语音识别控制器，包括主控制器，其特征在于，所述主控制器外接有孤立词语音识别芯片，所述主控制器还外接有录音模块；所述录音模块和主控制器相连后具有完全的语音识别功能，通过编程实现说话人的识别；所述孤立词语音识别芯片将识别的语意发送给主控制器；所述录音模块和孤立词语音识别芯片同时获得语音数据并进行识别；所述主控制器根据语意和说话人身份确定说话人是否有权限执行该语意对应的命令，整合这些信息后发送控制指令。

2.根据权利要求1所述的多功能语音识别控制器，其特征在于，所述主控制器还外接存储器，所述存储器包括Nand Flash和SDRAM，所述Nand Flash用于存储程序和数据，所述程序用于完成系统的初始化和说话人识别算法，并最终发送控制命令；所述数据包括提前训练的说话人特征矩阵和隐马尔可夫模型数据；所述SDRAM作为主控制器的内存使用。

3.根据权利要求1所述的多功能语音识别控制器，其特征在于，所述录音模块还与音频播放模块相连，所述音频播放模块在录音模块录音后能播放录音结果，并在产生最终的控制指令后通过语音的形式通知用户命令的执行情况。

4.根据权利要求1所述的多功能语音识别控制器，其特征在于，所述主控制器还连接有串口模块，所述串口模块与外部设备相连，用于将主控制器的控制指令发送给外部设备。