CN112141837A

CN112141837A - 一种基于多层字典学习的智能语音电梯系统

Info

Publication number: CN112141837A
Application number: CN202010943827.1A
Authority: CN
Inventors: 李永琳; 吴凡; 姜玉东
Original assignee: Jinling Institute of Technology
Current assignee: Jinling Institute of Technology
Priority date: 2020-09-08
Filing date: 2020-09-08
Publication date: 2020-12-29

Abstract

本发明涉及一种基于多层字典学习的智能语音电梯系统。本发明利用字典学习的去噪与特征优化能力，建立基于多层字典学习的智能语音电梯系统。首先建立语音电梯硬件系统，硬件系统主要包括语音采集模块、步进电机控制模块、ARM控制模块、陀螺仪模块、LCD模块、和语音模块等；ARM控制模块通过控制语音采集模块读取外界语音指令；对采集的语音信号进行多层字典学习，对语音信号去噪并提取关键特征；进一步的把提取的特征送人SVM模型进行语音识别，实现语音对电梯系统的控制。

Description

一种基于多层字典学习的智能语音电梯系统

技术领域

本发明涉及智能电梯领域，特别设计基于多层字典学习的智能语音电梯系统。

背景技术

随着科技的高速发展，智能机器人被越来越多的关注，如今随着城市化的发展，电梯成为最为关机的一种工具，如今市场的电梯只需我们键入自己想去的楼层，但是，在特殊时期，人们对电梯的接触可能会造成病毒的传播，例如，疫情期间，电梯的按键上可能会残留大量病毒，对用户健康造成威胁，因此，无接触电梯控制是目前一个很有研究价值的应用技术。

发明内容

为了解决上述存在问题。本发明提出一种基于多层字典学习的智能语音电梯系统，利用嵌入式系统集成化、低功耗、高频率、多功能的特点，建立了一个智能电梯交互系统，利用多层学习字典对采集语音信号进行去噪与特征提取，进而增加语音识别的准确度，实现电梯的语音控制。为达此目的：

本发明提出基于多层字典学习的智能语音电梯系统，具体步骤如下：

步骤1：建立语音电梯硬件系统，硬件系统主要包括语音采集模块、步进电机控制模块、ARM控制模块、陀螺仪模块，LCD模块，和语音模块等；

步骤2：语音采集模块采集用户语音信息，对语音信息进行灰度归一化；

步骤3：对语音信息进行第一层字典学习，并把第一层训练的编码系数作为下一层训练的输入；

步骤4：对语音信息进行第二层字典学习，并把第二层训练的编码系数作为下一层训练的输入；

步骤5：对语音信息进行第三层字典学习，并把第三层训练的编码系数作为SVM分类器的输入；

步骤6：使用SVM对语音信号进行分类识别，控制系统根据识别结果进行电梯控制，如果识别失败，提醒用户重新输入语音。

作为本发明进一步改进，所述步骤2中语音归一化公式为：

其中，x(i)是采集的语音信号，max(·)是计算最大值。

作为本发明进一步改进，所述步骤3，4，5中每层字典学习输出公式为：

其中，D_l是第l训练字典，X是归一化语音信号，μ是正规化参数。

作为本发明进一步改进，所述步骤3，4，5中每层字典学习的投影矩阵为：

其中，G_l是第l层图拉普拉斯矩阵，α是正规化参数。

作为本发明进一步改进，所述步骤3，4，5中总投影矩阵公式为：

P＝P₁P₂P₃ (4)

其中，P_l是第l层投影矩阵。

作为本发明进一步改进，所述步骤6中SVM分类器公式为：

其中，W是权值，θ是惩罚因子。

本发明基于多层字典学习的智能语音电梯系统，有益效果在于：

1.本发明利用语音识别技术，电梯控制更加便捷。

2.本发明使用多层字典学习，对语音信号能够有效去除噪声。

3.本发明使用多层字典对特征进行多层编码，使得SVM识别率更高。

4.本发明硬件系统实现简单，成本低。

附图说明

图1是智能语音电梯系统框图；

图2是智能语音电梯系统流程图；

图3是不同语音信号经多层字典编码后特征分布图；

具体实施方式

本发明提出一种基于多层字典学习的智能语音电梯系统，利用嵌入式系统集成化、低功耗、高频率、多功能的特点，建立了一个智能电梯交互系统，利用多层学习字典对采集语音信号进行去噪与特征提取，进而增加语音识别的准确度，实现电梯的语音控制。如图1是智能语音电梯系统框图，图2是智能语音电梯系统流程图。

首先，建立语音电梯硬件系统，硬件系统主要包括语音采集模块、步进电机控制模块、ARM控制模块、陀螺仪模块，LCD模块，和语音模块等；接着，语音采集模块采集用户语音信息，对语音信息进行灰度归一化。

语音归一化公式为：

其中，x(i)是采集的语音信号，max(·)是计算最大值。

然后，对语音信息进行第一层字典学习，并把第一层训练的编码系数作为下一层训练的输入；对语音信息进行第二层字典学习，并把第二层训练的编码系数作为下一层训练的输入；对语音信息进行第三层字典学习，并把第三层训练的编码系数作为SVM分类器的输入，如图3是不同语音信号经多层字典编码后特征分布图。

每层字典学习输出公式为：

每层字典学习的投影矩阵为：

其中，G_l是第l层图拉普拉斯矩阵，α是正规化参数。

总投影矩阵公式为：

P＝P₁P₂P₃ (4)

其中，P_l是第l层投影矩阵。

最后，使用SVM对语音信号进行分类识别，控制系统根据识别结果进行电梯控制，如果识别失败，提醒用户重新输入语音。

SVM分类器公式为：

其中，W是权值，θ是惩罚因子。

以上所述，仅是本发明的较佳实施例而已，并非是对本发明作任何其他形式的限制，而依据本发明的技术实质所作的任何修改或等同变化，仍属于本发明所要求保护的范围。

Claims

1.基于多层字典学习的智能语音电梯系统，具体步骤如下，其特征在于；

步骤1：建立语音电梯硬件系统，硬件系统主要包括语音采集模块、步进电机控制模块、ARM控制模块、陀螺仪模块、LCD模块、和语音模块等；

2.根据权利要求1所述的基于多层字典学习的智能语音电梯系统，其特征在于；

所述步骤2中语音归一化公式为：

其中，x(i)是采集的语音信号，max(·)是计算最大值。

3.根据权利要求1所述的基于多层字典学习的智能语音电梯系统，其特征在于；

所述步骤3，4，5中每层字典学习输出公式为：

4.根据权利要求1所述的基于多层字典学习的智能语音电梯系统，其特征在于；

所述步骤3，4，5中每层字典学习的投影矩阵为：

其中，G_l是第l层图拉普拉斯矩阵，α是正规化参数。

5.根据权利要求1所述的基于多层字典学习的智能语音电梯系统，其特征在于；

所述步骤3，4，5中总投影矩阵公式为：

P＝P₁P₂P₃ (4)

其中，P_l是第l层投影矩阵。

6.根据权利要求1所述的基于多层字典学习的智能语音电梯系统，其特征在于；

所述步骤6中SVM分类器公式为：

其中，W是权值，θ是惩罚因子。