CN107564529B

CN107564529B - 一种基于语音识别的智能家居控制系统

Info

Publication number: CN107564529B
Application number: CN201710987529.0A
Authority: CN
Inventors: 潘柏霖
Original assignee: Foshan Shunde Miluo Furniture Co ltd
Current assignee: Foshan Shunde Miluo Furniture Co.,Ltd.
Priority date: 2017-10-20
Filing date: 2017-10-20
Publication date: 2021-08-31
Anticipated expiration: 2037-10-20
Also published as: CN107564529A

Abstract

本发明提供了一种基于语音识别的智能家居控制系统，包括信息中心、控制中心、指令执行中心和智能家居装置。所述信息中心用于接收外部语音信号，并对语音信号进行处理，将语音信号转换成文本信息；控制中心对文本信息进行解析生成控制指令并判断传递方式；指令执行中心用于根据控制中心生成的指令向智能家居装置发出动作指令。本发明可以通过语音识别方式实现对智能家居的控制，使现有的智能家居具有更加智能、简单、方便的操作方式，让人们的生活更加的舒适。

Description

一种基于语音识别的智能家居控制系统

技术领域

本发明涉及智能家居领域，尤其是涉及一种基于语音识别的智能家居控制系统。

背景技术

当今社会智能家居给人们带来的愉悦舒适的生活，慢慢成为人们日常生活中不可或缺的一部分。例如：空调可以让人冬暖夏凉，冰箱可以储存各种食物且保鲜，电视让人在家观看世界等等。

但是，传统的智能家居一般都需要人近身去主动操作或控制，而不能远程操作，并且实际上智能家居仍然依赖于面板控制，但这些对于特殊的人群，就失去了智能控制的功能。可见，智能家居并未真正做到智能。

发明内容

针对上述问题，本发明旨在提供一种基于语音识别的智能家居控制系统。

本发明的目的采用以下技术方案来实现：

一种基于语音识别的智能家居控制系统，其特征是，包括信息中心、控制中心、指令执行中心和智能家居装置；

所述信息中心用于对接收到的语音信号进行处理，将语音信号转换成文本信息；

所述控制中心用于对文本信息进行解析并生成控制指令；

指令执行中心用于根据控制中心生成的控制指令向智能家居装置发出动作指令；

所述智能家居装置用于根据动作指令执行相应的动作。

本发明的有益效果：本发明可以通过语音识别方式实现对智能家居的控制，使现有的智能家居具有更加智能、简单、方便的操作方式，让人们的生活更加的舒适。

附图说明

图1是本发明的框架结构图；

图2是本发明的信息中心的框架结构图；

图3是本发明的智能家居装置的框架结构图；

图4是本发明的语音处理单元的框架结构图。

附图标记：

信息中心1；控制中心2；指令执行中心3；智能家居装置4；语音输入单元11；语音处理单元12；转换单元13；语音预处理模块120；语音片段提取模块121；语音识别模块122；远程接收指令模块41；动作执行装置42。

具体实施方式

结合以下应用场景对本发明作进一步描述。

参见图1，一种基于语音识别的智能家居控制系统，其特征是，包括信息中心1、控制中心2、指令执行中心3和智能家居装置4；所述信息中心1用于对接收到的语音信号进行处理，将语音信号转换成文本信息；所述控制中心2用于对文本信息进行解析并生成控制指令；指令执行中心3用于根据控制中心生成的控制指令向智能家居装置4发出动作指令；所述智能家居装置4用于根据动作指令执行相应的动作。

优选地，参见图2，所述信息中心包括语音输入单元11、语音处理单元12和转换单元13；所述语音输入单元11用于接收外部语音信号；所述语音处理单元12用于对外部语音信号进行处理，并将处理后的外部语音信号与声学模型进行匹配，输出匹配结果；所述转换模块13用于将语音处理单元12得到的匹配结果转换成为文本信息。

优选地，参见图3，所述智能家居装置4包括远程接收指令模块41和动作执行装置42；所述远程接收指令模块41用于接收指令执行中心3传递的动作指令；所述动作执行装置42用于执行所述远程接收指令41传递的动作。

优选地，参见图4，所述语音处理单元,12包括语音预处理模120块、语音片段提取模块121、语音识别模块122；所述语音预处理模块120用于对外部语音信号进行预处理；所述语音片段提取模块121用于从预处理后的外部语音信号中提取有效语音片段；所述语音识别模块122用于从有效语音片段中提取语音特征参数，并与声学模型进行匹配，输出匹配结果。

优选地，所述语音预处理模块120用于对语音输入单元11接收的外部语音信号进行预处理，具体为：

1)采用小波变换对接收的外部语音信号进行N层小波分解，得到一组小波系数T＝{T₁,T₂,…T_d}，d为小波系数的个数；

2)利用下列筛选函数对小波系数的高频分量系数进行筛选，得到一组新的小波系数高频分量的估计值T＇；

其中，T＇为小波系数高频分量的估计值，T为小波系数，τ为自设筛选函数值，r为筛选函数调节因子，且r∈[0,1],ε为修正因子；

3)将得到的小波系数高频分量的估计值T＇和第N层的小波系数低频分量部分进行小波重构，得到去噪后的语音信号；

4)对去噪后的语音信号依次进行数模转换、预加重、分帧和加窗，即可得到加窗后的语音信号。

本优选实施例，采用筛选函数对小波变换得到的高频分量进行筛选，能够有效去除高频段的随机噪声，且根据小波系数的绝对值与筛选函数值的大小关系选择不同的筛选函数对语音信号进行筛选处理，能够使获得的估计小波系数在边界处连续，符合声音信号连续性的特征。且利用筛选函数对小波系数处理后，能够有效去除语音信号中的背景噪声，节约了系统存储空间，同时也提高了对语音信号的处理速率。

优选地，所述语音片段提取模块121用于从预处理后的外部语音信号中提取有效语音片段，具体为：

1)对加窗后的语音信号中的有效语音片段的起点进行标记，设当前检测帧的初始状态值Status＝0，如果满足M_i＞M_low或N_i＞N_low，则标记当前检测帧为有效语音片段的起点，进入过渡段；进入过渡段后，如果M_low或者N_low被超越且持续被超越的时间长度大于自定义的最小语音长度，则对有效语音片段进行标记，并设置状态值Status为1；令i＝i+1,对下一帧进行操作，并计算第i帧的M_i和N_i；其中，Status为检测的当前状态，数值不同，对应不同的检测状态；M_i是第i帧的平均振幅值，M_low为M_i的自定义的最低门限值，N_i为第i帧的帧间平均过零率，N_low为N_i的自定义的最低门限值，M_i和N_i可利用帧的平均振幅公式和帧间平均过零率公式计算得到，其中，帧的平均振幅公式为：

其中，H为帧的长度，s_i(k)为加窗前第i帧中第k个频谱处的声音信号的幅度值，N为窗口的宽度；w(·)为汉明窗函数；i为正在检测的第i帧声音信号，k为第i帧声音信号中第k个频谱；

帧间平均过零率计算公式为：

其中，sgn[·]是符号函数，它的表达式为：

2)在状态值Status为1时，如果M_i＜M_low或N_i＜N_low，则令Status＝0，执行步骤1，否则，如果M_i＞M_High或N_m＞N_High，则标记为声音段，并将状态值Status设为2，且令i＝i+1，计算下一帧的M_i和N_i的值；其中M_High为M_i的自定义的最高门限值，N_High为N_i的自定义的最高门限值；

3)在状态值Status为2时，如果M_i＜M_low或N_i＜N_low，且满足声音的回落时间持续超多自定义的最大静音长度，则可以标记声音结束，并将状态值Status设为3；否则跳转至步骤2，执行步骤2；当状态值Status为3时，对应处理的帧即为该有效语音片段的终点，输出检测结果，即可得到有效语音片段。

本优选实施例，选择帧的平均幅度值和帧间过零率两个参数来对加窗后的语音信号逐帧进行检测，根据Status值、帧的平均幅度值和帧间过零率与预设的门限值的关系来确定有效语音片段的起点和终点，此算法能够有效的去除语音信号中一些不必要的冗余信息，也能够有效的避免一些噪声和语音停顿等干扰引起的误判，减少了系统的运算量并且提高了系统的工作效率和正确率，为后续语音特征参数的精准提取奠定了基础。

优选地，所述语音识别模块122用于提取有效语音片段中的语音特征参数，并与声学模型进行匹配对比，输出匹配结果，具体为：

1)采用功率谱函数获取效语音片段中的纯净语音信号的功率谱|S(p)|²，其中，功率谱的计算公式为：

其中，u(t)为有效语音片段，U(p)为u(t)的功率谱，N(p)为有效语音片段中的残留噪声的功率谱，λ为设定的修正因子；

2)按照MFCC提取方法对S(p)进行处理，获得MFCC系数，即将S(p)通过Mel滤波器组后取对数，对对数功率谱进行DCT变换从而得到MFCC系数；

3)对MFCC系数求一阶差分系数，并将MFCC系数和MFCC的一阶差分系数作为有效声音信号的特征参数；

4)将提取得到的有效语音片段的语音特征参数与声学模型进行匹配对比，输出匹配结果。

本优选实施例，上述的语音特征参数提取做法能够提高语音信号的纯度和有效性，在功率谱函数中，λ为一个修正因子，它的取值灵活性反映了当前环境中的噪声特征，通过动态调整λ的大小，可以动态的描述带噪声的语音信号中的随机噪声，使语音特征参数能够更好的表述外部语音信号中的有效声音特征，方便后续对智能家居设备的控制。

最后应当说明的是，以上实施例仅用以说明本发明的技术方案，而非对本发明保护范围的限制，尽管参照较佳实施例对本发明作了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本发明技术方案的实质和范围。

Claims

1.一种基于语音识别的智能家居控制系统，其特征是，包括信息中心、控制中心、指令执行中心和智能家居装置；

所述控制中心用于对文本信息进行解析并生成控制指令；

所述智能家居装置用于根据动作指令执行相应的动作；

所述信息中心包括语音输入单元、语音处理单元和转换单元；所述语音输入单元用于接收外部语音信号；所述语音处理单元用于对外部语音信号进行处理，并将处理后的外部语音信号与声学模型进行匹配，输出匹配结果；所述转换模块用于将语音处理单元得到的匹配结果转换成为文本信息；

所述语音处理单元包括语音预处理模块、语音片段提取模块、语音识别模块；所述语音预处理模块用于对外部语音信号进行预处理；所述语音片段提取模块用于从预处理后的外部语音信号中提取有效语音片段；所述语音识别模块用于从有效语音片段中提取语音特征参数，并与声学模型进行匹配，输出匹配结果；

所述语音预处理模块用于对语音输入单元接收的外部语音信号进行预处理，具体为：

1)采用小波变换对接收的外部语音信号进行N层小波分解，得到一组小波系数T＝{T₁，T₂，...T_d}，d为小波系数的个数；

2)利用下列筛选函数对小波系数的高频分量系数进行筛选，得到一组新的小波系数高频分量的估计值T′；

其中，T′为小波系数高频分量的估计值，T为小波系数，τ为自设筛选函数值，r为筛选函数调节因子，且r∈[0，1]，ε为修正因子；

3)将得到的小波系数高频分量的估计值T′和第N层的小波系数低频分量部分进行小波重构，得到去噪后的语音信号；

4)对去噪后的语音信号依次进行数模转换、预加重、分帧和加窗，即可得到加窗后的语音信号；

所述语音片段提取模块用于从预处理后的外部语音信号中提取有效语音片段，具体为：

1)对加窗后的语音信号中的有效语音片段的起点进行标记，设当前检测帧的初始状态值Status＝0，如果满足M_i＞M_low或N_i＞N_low，则标记当前检测帧为有效语音片段的起点，进入过渡段；进入过渡段后，如果M_low或者N_low被超越且持续被超越的时间长度大于自定义的最小语音长度，则对有效语音片段进行标记，并设置状态值Status为1；令i＝i+1，对下一帧进行操作，并计算第i帧的M_i和N_i；其中，Status为检测的当前状态，数值不同，对应不同的检测状态；M_i是第i帧的平均振幅值，M_low为M_i的自定义的最低门限值，N_i为第i帧的帧间平均过零率，N_low为N_i的自定义的最低门限值，M_i和N_i可利用帧的平均振幅公式和帧间平均过零率公式计算得到，其中，帧的平均振幅公式为：

帧间平均过零率计算公式为：

其中，sgn[·]是符号函数，它的表达式为：

2.根据权利要求1所述的一种智能家居控制系统，其特征是，所述智能家居装置包括远程接收指令模块和动作执行装置；所述远程接收指令模块用于接收指令执行中心传递的动作指令；所述动作执行装置用于执行所述远程接收指令传递的动作。

3.根据权利要求1所述的智能家居控制系统，其特征是，从有效语音片段中提取语音特征参数，并与声学模型进行匹配，输出匹配结果，具体包括：

1)采用功率谱函数获取效语音片段中的纯净语音信号的功率谱|S(p)|²；

3)对MFCC系数求一阶差分系数，并将MFCC系数和MFCC的一阶差分系数作为有效语音片段的特征参数；

4.根据权利要求3所述的智能家居控制系统，其特征是，所述功率谱|S(p)|²的计算公式为：

其中，u(t)为有效语音片段，U(p)为u(t)的功率谱，N(p)为有效语音片段中的残留噪声的功率谱，λ为设定的修正因子。