CN110631064B

CN110631064B - 一种声音识别方法及应用有该声音识别方法的吸油烟机的自动控制方法

Info

Publication number: CN110631064B
Application number: CN201810552003.4A
Authority: CN
Inventors: 杜杉杉
Original assignee: Ningbo Fotile Kitchen Ware Co Ltd
Current assignee: Ningbo Fotile Kitchen Ware Co Ltd
Priority date: 2018-05-31
Filing date: 2018-05-31
Publication date: 2021-01-15
Anticipated expiration: 2038-05-31
Also published as: CN110631064A

Abstract

本发明涉及一种声音识别方法，对声音采样信号X进行一阶差分计算，获取一阶差分数据组Y，进而将一阶差分数据组Y中各一阶差分数据y_j与一阶差分数据阈值y_th进行比较计算而获取一阶差分特征数据组V_Y＝[v₁,v₂,...,v_j,...v_n]，获取一阶差分特征数据组中v_j＝K₂的序号数据组，进而获取待识别声音信号的识别特征向量V，将该待识别声音信号的识别特征向量V与声音模板特征向量V_sam进行契合度比较计算，进而确定待识别的声音信号内容。该声音识别方法能够有效减少数据处理量。本发明还涉及一种应用有该声音识别方法的吸油烟机的控制方法，吸油烟机根据识别的声音内容对吸油烟机进行操作控制。该吸油烟机的自动控制方法的声音识别性能好、成本低。

Description

一种声音识别方法及应用有该声音识别方法的吸油烟机的自动控制方法

技术领域

本发明涉及声音识别技术领域，特别涉及一种声音识别方法，还涉及应有有该声音识别方法的吸油烟机的自动控制方法。

背景技术

在日常生活中，吸油烟机和燃气灶通常情况下是同时使用的，现有烟灶联动使得吸油烟机和燃气灶配合工作。常见的烟灶联动方式是在燃气灶中使用红外线、射频通信发射模块，在吸油烟机中安装相应的接收模块。当燃气灶开启时通信发射模块向吸油烟机发射控制信号，吸油烟机接收到控制信号后开启，从而完成烟灶联动。但此方法存在一定的缺陷：通信发射接收模块必须匹配，若吸油烟机和燃气灶不是同一品牌，这就导致无法配合使用，而且无线通信模块也容易收到电磁干扰，在电磁复杂环境下可靠性难以保证。

授权公布号为CN103673008B(申请号为201310422741.4)的中国发明专利《一种智能吸油烟机以及该吸油烟机的控制方法》，以及申请公布号为CN107031533A(申请号为201710348689.0)的中国发明专利申请《一种吸油烟机的自动驱动系统及其控制方法》，其中均公开了采用声音检测识别的方法来实现对吸油烟机的自动控制，如此则解决了需要吸油烟机和燃气灶配合的问题，但是公开的文件中并未给出声音识别的具体方法，而采用现有的声音识别方法，往往需要将采集的声音数据转换为频域信号进行处理，数据处理量以及存储量大。而应用在吸油烟机中声音处理模块通常采用单片机作为处理核心，而常见的单片机的内存有限，处理能力也有限，如果增加内存则相应成本较高。

发明内容

本发明所要解决的第一个技术问题是针对上述现有技术提供一种能够有效减少数据处理量的声音识别方法。

本发明所要解决的第二个技术问题是针对上述现有技术提供一种声音识别性能好、成本低的吸油烟机的自动控制方法。

本发明解决上述第一个技术问题所采用的技术方案为：一种声音识别方法，其特征在于：包括

对采集的待识别声音信号进行采样，进而获取待识别声音信号的采样信号X＝[x₀,x₁,x₂,...,x_i,...x_n]，其中，i和n为自然数，0≤i≤n；

计算采样信号X的一阶差分数据组Y＝[y₁,y₂,...,y_j,...y_n],y_j＝x_j-x_j-1，其中j为正整数，1≤j≤n；

计算一阶差分数据组Y中各一阶差分数据y_j的一阶差分特征数据

进而获取一阶差分数据组Y的特征向量V_Y＝[v₁,v₂,...,v_j,...v_n]，其中y_th为一阶差分数据阈值；

获取V_Y中满足v_j＝K₂的一阶差分数据y_j对应的序号数据组，进而获取待识别声音信号的识别特征向量V：

V＝[m₁,m₂,...,m_p,...,m_a]，其中a和p为正整数，m₁≤m_p≤m_a，m_a∈[1,2,3,...,j,...,n]；

将该待识别声音信号的识别特征向量V与声音模板特征向量V_sam进行契合度比较计算，进而确定待识别的声音信号内容。

为了有效截取出待识别的声音信号，当前待识别声音信号的识别特征向量V是否获取结束的判断方法为：

计算当前采样信号

对应的一阶差分特征数据

如果

则获取当前一阶差分特征数据

对应的序号m_b与前一个一阶差分特征数据

对应的序号m_c进行差值计算，如果m_b-m_c>M，则判断当前一段待识别声音信号的识别特征向量V获取完毕；

其中m_b∈[1,2,3,...,j,...,n]，m_c∈[1,2,3,...,j,...,n]，M为设置的结束点序号差判断阈值。

优选地，该待识别声音信号的识别特征向量V与声音模板特征向量V_sam进行契合度比较计算的方法为：

判断V与V_sam的向量长度是否相同；

如果不同，则判断待识别声音信号与声音模板特征向量V_sam对应的声音内容不同；

如果相同，则计算V与V_sam的之间的契合度值S；

其中，V_sam＝[r₁,r₂,...,r_p,...,r_a]，r₁≤r_p≤r_a，r_a∈[1,2,3,...,j,...,n]；

判断是否S<S_th，其中S_th为设定的契合度阈值；

如果是，则表示V与V_sam的之间的契合度满足要求，判断待识别声音信号为声音模板特征向量V_sam对应的声音内容，如果否，则判断待识别声音信号与声音模板特征向量V_sam对应的声音内容不同。

本发明解决上述第二个技术问题所采用的技术方案为：一种应用有所述的声音识别方法的吸油烟机的控制方法，其特征在于：

设置存储有各种声音模板对应的声音模板特征向量的模板库；

将待识别声音信号的识别特征向量V与模板库中各声音模板特征向量进行比较计算，进而获取待识别声音信号对应的声音内容；

吸油烟机根据识别的声音内容对吸油烟机进行操作控制。

更智能化地，利用红外检测装置检测人体是否靠近烹饪区域，如果是则吸油烟机启动声音采集工作，开始采集待识别声音信号，并利用所述的声音识别方法进行声音识别；如果否则进行计时，如果在设定时间阈值的时长内未检测到人体靠近烹饪区则控制吸油烟机进入休眠状态。

与现有技术相比，本发明的优点在于：本发明中的声音识别方法，对采样的待识别声音信号进行一阶差分计算，进而减少了数据量，在此基础上再对获取的一阶差分数据组进行特征量计算，进而获取数据量更少的识别特征向量，识别特征向量中均存储一阶差分特征时间点序号而并非声音信号本身，该过程中无需将声音信号转换为频率信号，大大减少了数据计算量，同时在进行识别时，是通过向量中序号的比对进行识别，声音模板特征向量数据的存储量也大大减小。该声音识别方法特别适用于家电中声音特点比较单一的声音的识别，识别准确率、效率高。

本发明中应用有声音识别方法的吸油烟机的控制方法，根据对声音的识别实现对吸油烟机的控制，由于声音识别方法对数据处理量、数据存储量要求低，则大大减少了吸油烟机的生产成本。

附图说明

图1为本发明实施例中声音识别方法的流程图。

具体实施方式

以下结合附图实施例对本发明作进一步详细描述。

本实施例中的声音识别方法可以应用在各种环境中，特别适合应用在声音特征比较单调的家电中。本实施例中以该声音识别方法在吸油烟机中的使用为例进行说明。

吸油烟机中可以设置红外检测装置、声音采集装置以及控制器，红外检测装置、声音采集装置分别与控制器电连接，进而向控制器内传送数据，控制器可以针对声音采集装置采集的声音信号利用下述的声音识别方法进行识别，进而控制吸油烟机进行启动、吸油烟工作、调节档位、关闭吸油烟机等操作。

该红外检测装置可以用来检测是否有人体靠近烹饪区域，该烹饪区域根据具体需要进行设置，如该烹饪区域可以为厨房整个空间区域，也可以为吸油烟机附近的区域。红外检测装置的检测范围与需求相匹配。

在使用时，红外检测装置检测人体是否靠近烹饪区域，如果是则吸油烟机启动声音采集工作，开始采集待识别声音信号，并利用下述声音识别方法进行声音识别；如果否则进行计时，如果在设定时间阈值的时长内未检测到人体靠近烹饪区则控制吸油烟机进入休眠状态。

在吸油烟机出厂前，提前训练吸油烟机使用过程中会遇到的各种操作对应的声音模板信号，计算获取各声音模板对应的声音模板特征向量，进而存储形成模板库。

声音采集装置启动声音采集工作后，则通过下述的声音识别方法将待识别声音信号的识别特征向量V与模板库中各声音模板特征向量进行比较计算，进而获取待识别声音信号对应的声音内容，吸油烟机根据识别的声音内容对吸油烟机进行操作控制。

如图1所示，本实施例中的声音识别方法的具体内容为：

按照设定的采样周期对吸油烟机中声音采集装置采集的待识别声音信号进行AD采样，进而获取待识别声音信号的采样信号为X＝[x₀,x₁,x₂,...,x_i,...x_n]，其中，i和n为自然数，0≤i≤n；

对采样信号X进行一阶差分计算，进而获取采样信号X对应的一阶差分数据组Y＝[y₁,y₂,...,y_j,...y_n],y_j＝x_j-x_j-1，其中j为正整数，1≤j≤n；

获得采样信号X的一节查分数据组Y后，为了提取出该一段采样的语音信号的特征，进一步计算一阶差分数据组Y中各一阶差分数据y_j的一阶差分特征数据v_j，本实施例中，即将各一阶差分数据y_j与一个经测试设定的一阶差分数据阈值y_th进行比较即获得相应的一阶差分特征数据v_j，具体计算为：

v_j即为各一阶差分数据y_j对应的特征向量数据，K₁和K₂可以根据需要设置成任意不相同的数值，简单地，本实施例中K₁＝0,K₂＝1；

对各一阶差分数据y_j对应的特征向量值v_j进行统计计算，进而获取一阶差分数据组Y对应的特征向量V_Y＝[v₁,v₂,...,v_j,...v_n]；

V＝[m₁,m₂,...,m_p,...,m_a]，其中a和p为正整数，m₁≤m_p≤m_a，m_a∈[1,2,3,...,j,...,n]。

举例说明如下：如果X＝[x₀,x₁,x₂,x₃,x₄,x₅]，对应的Y＝[y₁,y₂,y₃,y₄,y₅]，相应获取的V_Y＝[1,0,0,1,1]，则V＝[1,4,5]，其中m₁＝1，m₂＝4，m₃＝5。

将该待识别声音信号的识别特征向量V与声音模板特征向量V_sam进行契合度比较计算，进而确定待识别的声音信号内容。当然，在模板库中可以存储多个声音模板特征向量，待识别声音信号的识别特征向量V与各个声音模板特征向量分别进行比较，均采用下述的方法进行契合度的比较计算。本实施例中，待识别声音信号的识别特征向量V与声音模板特征向量V_sam进行契合度比较计算的方法具体为：

首先判断V与V_sam的向量长度是否相同；或者根据实际情况可以判断V与V_sam的向量长度差是否在允许的向量长度差阈值范围内；

如果V与V_sam的向量长度不同，则直接判断待识别声音信号与声音模板特征向量V_sam对应的声音内容不同；

如果V与V_sam的向量长度相同或者在允许的向量长度差阈值范围内，则计算V与V_sam的之间的契合度值S；

判断是否S<S_th，其中S_th为设定的契合度阈值；

如果是，则表示V与V_sam的之间的契合度满足要求，判断待识别声音信号为声音模板特征向量V_sam对应的声音内容；如果否，则判断待识别声音信号与声音模板特征向量V_sam对应的声音内容不同。

以上的数据处理过程为实时处理过程，即在按照采样周期对声音信号进行采样的同时，实时进行对当前采样信号的计算，如此在采样过程中则需要对当前待识别声音信号是否采样结束进行判断。本实施中，当前待识别声音信号是否采样结束，可以直接通过对当前待识别声音信号的识别特征向量V是否获取结束进行判断而获取结果。当前待识别声音信号的识别特征向量V是否获取结束的判断方法为：

先计算当前采样信号

对应的一阶差分数据

进而再计算一阶差分数据

对应的一阶差分特征数据

如果

则获取当前一阶差分特征数据

对应的序号m_b与前一个一阶差分特征数据

对应的序号m_c进行差值计算，如果m_b-m_c>M，则判断当前一段待识别声音信号的识别特征向量V获取完毕。

通过前述的声音识别方法可以对灶具的打火声音等类周期声音信号、炒菜声音等突发声音信号进行有效的检测，如当识别出打火声音后，则控制开启吸油烟机按照小档位进行工作，当检测到炒菜声音后，则控制吸油烟机调高档位进行工作。