CN106094598B - 声控开关控制方法、系统及声控开关 - Google Patents
声控开关控制方法、系统及声控开关 Download PDFInfo
- Publication number
- CN106094598B CN106094598B CN201610651767.XA CN201610651767A CN106094598B CN 106094598 B CN106094598 B CN 106094598B CN 201610651767 A CN201610651767 A CN 201610651767A CN 106094598 B CN106094598 B CN 106094598B
- Authority
- CN
- China
- Prior art keywords
- audio
- slope
- audio signal
- signal samples
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/04—Programme control other than numerical control, i.e. in sequence controllers or logic controllers
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Automation & Control Theory (AREA)
- Circuit For Audible Band Transducer (AREA)
- Selective Calling Equipment (AREA)
Abstract
本发明涉及一种声控开关控制方法、系统及声控开关,其中,方法包括以下步骤:获取多个音频信号样本,按照预设的采样频率对各个音频信号样本进行采样,分别获取各个音频信号样本对应的若干个样本点;分别对各个音频信号样本的样本点的幅度值进行检测,根据所述幅度值计算对应音频信号样本中样本点的幅度的斜率;将所述斜率与预存的参考斜率进行比较,若所述斜率大于所述参考斜率,计算获取各个相邻音频信号样本的时间差;若所述时间差满足预设的时间约束条件,控制声控开关动作。所述声控开关控制方法、系统及声控开关能够有效排除环境干扰,减少误操作,节约电能。
Description
技术领域
本发明涉及电子设备技术领域,特别是涉及一种声控开关控制方法、系统及声控开关。
背景技术
声控开关是在特定环境光线下采用声响效果激发拾音器进行声电转换来控制用电器的开启,并经过延时后能自动断开电源的节能电子开关。现有的对声控开关的控制方式一般包括两种:
一种是当声音传感器接收到声音信号时,控制器即控制声控开关动作,使声控开关闭合,用电器通过闭合的声控开关连接外部电源,外部电源对用电器供电。这种控制方式容易受到外部环境的干扰,难以判断声音信号是噪声还是有效控制信号,从而导致误操作,浪费电能。
另一种方式是当声音传感器接收到声音信号时,控制器先对声音信号的节奏进行判断,如果节奏符合预设条件,再控制声控开关动作。这种方式较前一种控制方式能够一定程度上减少误操作,但是,这种方式依然难以有效判断声音信号是噪声还是有效控制信号。当环境噪声或干扰声恰好发出接近预设条件的节奏声时,依然容易导致误操作,浪费电能。
综上所述,现有的声控开关的控制方式控制效果较差。
发明内容
基于此,有必要针对现有的声控开关的控制方式控制效果较差的问题,提供一种声控开关控制方法、系统及声控开关。
一种声控开关控制方法,包括以下步骤:
获取多个音频信号样本,按照预设的采样频率对各个音频信号样本进行采样,分别获取各个音频信号样本对应的若干个样本点;
分别对各个音频信号样本的样本点的幅度值进行检测,根据所述幅度值计算对应音频信号样本中样本点的幅度的斜率;
将所述斜率与预存的参考斜率进行比较,若所述斜率大于所述参考斜率,计算获取各个相邻音频信号样本的时间差;
若所述时间差满足预设的时间约束条件,控制声控开关动作。
一种声控开关控制系统,包括:
采样模块,用于获取多个音频信号样本,按照预设的采样频率对各个音频信号样本进行采样,分别获取各个音频信号样本对应的若干个样本点;
幅值检测模块,用于分别对各个音频信号样本的样本点的幅度值进行检测,根据所述幅度值计算对应音频信号样本中样本点的幅度的斜率;
比较模块,用于将所述斜率与预存的参考斜率进行比较,若所述斜率大于所述参考斜率,计算获取各个相邻音频信号样本的时间差;
控制模块,用于若所述时间差满足预设的时间约束条件,控制声控开关动作。
一种声控开关,包括:
传声器、检波电路、微控制单元和电子开关;
所述传声器的输出端与所述检波电路的输入端相连接,所述检波电路的输出端与所述微控制单元的输入端相连接,所述微控制单元的输出端与所述电子开关相连接;
所述传声器从周围环境获取多个音频信号样本并输出至所述检波电路;
所述检波电路将所述音频信号样本转换为直流信号,并输出至所述微控制单元;
所述微控制单元按照预设的采样频率对各个音频信号样本进行采样,分别获取各个音频信号样本对应的若干个样本点,分别对各个音频信号样本的样本点的幅度值进行检测,根据所述幅度值计算对应音频信号样本中样本点的幅度的斜率,将所述斜率与预存的参考斜率进行比较,若所述斜率大于所述参考斜率,计算获取各个相邻音频信号样本的时间差,并当所述时间差满足预设的时间约束条件时,控制声控开关动作。
上述声控开关控制方法、系统及声控开关,首先对声音信号的幅度的斜率进行检测,当斜率符合预设条件时,初步判定该声音信号为控制信号,再进一步对声音信号的节奏进行判断,若节奏也符合预设条件,才最终判定该声音信号为控制声控开关的控制信号,并根据该声音信号控制声控开关动作。上述声控开关控制方法、系统及声控开关,能够有效排除环境干扰,减少误操作,节约电能。
附图说明
图1为一个实施例的声控开关控制方法流程图;
图2为一个实施例的掌声和说话声的对比图;
图3为一个实施例的连续噪声和间歇噪声的示意图;
图4为一个实施例的掌声判断方法流程图;
图5为一个实施例的两快一慢或两慢一快的判定方法流程图;
图6为一个实施例的声控开关控制系统的结构示意图;
图7为一个实施例的声控开关的结构示意图。
具体实施方式
下面结合附图对本发明的声控开关控制方法、系统及声控开关的实施例进行说明。
图1为一个实施例的声控开关控制方法流程图。如图1所示,所述声控开关控制方法可包括以下步骤:
S1,获取多个音频信号样本,按照预设的采样频率对各个音频信号样本进行采样,分别获取各个音频信号样本对应的若干个样本点;
在本步骤中,所述音频信号样本中可以包括对声控开关进行控制的控制信号,还可以包括噪声(例如,鼓掌产生的掌声噪声,以及说话产生的说话噪声)。所述控制信号可以是掌声或者具有某种特定属性的声音信号,例如,有节奏的敲打声。为了便于说明,下面以控制信号是掌声为例对本发明的方案进行阐述。当所述音频信号样本为掌声时,每个音频信号样本可表示一声掌声。
可以按照预设的采样频率对各个音频信号样本进行采样,例如,可以每隔5ms对所述音频信号样本进行一次采样。采样所得的样本点的个数可以根据实际需要设置,例如,可以取30个样本点。
S2,分别对各个音频信号样本的样本点的幅度值进行检测,根据所述幅度值计算对应音频信号样本中样本点的幅度的斜率;
由于音频信号样本中除了掌声之外,还可能包括噪声和干扰,因此,可首先对所述音频信号样本的类型进行判断。可以根据掌声和说话声等噪声的特征来判断所述音频信号样本属于掌声还是说话声。掌声和说话声的特征如图2所示。从图2可以看出,掌声和说话声有以下区别:
(1)斜率:掌声的斜率明显大于说话声;
(2)稳定性:掌声的稳定性较好,所以通过判断声音是否有波动,也可以区分;
(3)时间:同一幅度下,掌声持续的时间会比说话声持续的时间短。
因此,可以检测音频信号样本中样本点的幅度的斜率。具体地,可以根据以下方式计算所述斜率:
式中,x[j]和x[i]分别为音频信号样本中的第j个样本点和第i个样本点的幅值,Δt为相邻两个样本点之间的采样时间间隔,k为幅度的斜率。
例如,可以根据音频信号样本中第5个样本点和第3个样本点的幅值计算所述斜率。在实际应用中,经过数据处理分析,第1个点和第2个点可能处在不稳定阶段,在小幅度(声音比较小)情况下第6个点、第7个点有可能已经超过最大值,这样就不能用作前面计算斜率的点了,因此,通过计算第5个样本点和第3个样本点之间的斜率可以较为精确地反映声音样本的斜率。另外,还可以计算多个斜率值求平均值,比如算第3个样本点和第4个样本点的斜率,并计算第4个样本点和第5个样本点的斜率,然后求平均值。假设采样间隔为5ms,则上述斜率为:
为了进一步提高检测精确度,还可以进一步根据音频信号样本的波动性判断音频信号样本是否为掌声。具体地,可以计算所述音频信号样本中各个样本点的幅值,若所述幅值在最大幅值前单调递增,在最大幅值后单调递减,则说明所述音频信号样本为掌声;否则,说明所述音频信号样本为说话声或环境噪声。
为了进一步提高检测精确度,还可以进一步根据音频信号样本中声音的持续时间判断音频信号样本是否为掌声。例如,掌声一般读取100个样本点后,后续读取的样本点已经递减到0,而说话声则可能在读取150个样本点之后递减到0。具体地,可以计算所述音频信号样本中幅值小于预设的幅度阈值的样本点的数量,若所述数量大于预设的数量阈值,则说明所述音频信号样本为掌声;否则,说明所述音频信号样本为说话声或环境噪声。
另外,当环境噪声较大,而掌声较小时,可能导致无法分辨出掌声。因此,还可以进一步将掌声幅度与噪音幅度作比较,以区分有效掌声和无效掌声。当掌声幅度大于噪声幅度时,可以认为掌声是有效掌声,反之,可以认为掌声是无效掌声。在一个实施例中,可以将噪声分为持续噪声和间歇噪声,如图3所示。持续噪声指的是一些比较连续的噪声,比如放音乐、连续敲鼓或鼓掌等声音;间歇噪声是指一些没有规律、但又时不时会发出的声音。
对掌声进行判定的具体方式如图4所示。图中Y表示符合条件,N表示不符合条件。例如,判断斜率时,Y表示音频信号样本的斜率大于参考斜率。
S3,将所述斜率与预存的参考斜率进行比较,若所述斜率大于所述参考斜率,计算获取各个相邻音频信号样本的时间差;
在步骤S2计算出所述音频信号样本的斜率之后,可以将所述斜率与预存的参考斜率进行比较。根据图2可知,掌声的斜率一般大于说话声,因此,可以将参考斜率设为小于掌声斜率,且大于说话声斜率的值。若计算出的所述音频信号样本的斜率大于该参考斜率,则可以判定所述音频信号样本为掌声,并开始对所述音频信号样本的节奏进行检测。
若步骤S2中进一步检测了音频信号样本的波动性,还可以在根据波动性判定所述音频信号样本为掌声后,开始对所述音频信号样本的节奏进行检测。
同样地,若步骤S2中进一步检测了音频信号样本的持续时间,还可以在根据持续时间判定所述音频信号样本为掌声后,开始对所述音频信号样本的节奏进行检测。
同样地,若步骤S2中进一步检测了音频信号样本的幅值,还可以在根据幅值判定所述音频信号样本为掌声后,开始对所述音频信号样本的节奏进行检测。
其中,所述节奏可以看作是每一声掌声之间的时间间隔。因此,可以记录每次检测到掌声响起的时间,并计算相邻掌声响起的时间间隔,所述时间间隔即为获取各个相邻音频信号样本的时间差。
S4,若所述时间差满足预设的时间约束条件,控制声控开关动作。
在本步骤中,可以根据步骤S2中的时间差进一步判断所述音频信号样本是否为掌声。具体地,可以根据所述时间差生成时间向量,分别将所述时间向量中各个元素与预存的参考时间向量中对应元素进行比较,若所述时间向量中各个元素与所述参考时间向量中对应元素的差值均小于预设的差值阈值,且所述时间向量的维度与所述参考时间向量的维度相同,控制声控开关动作。
由于掌声是间歇的,因此,在生成时间向量之前,还可以进一步将所述时间差与预设的时间阈值进行比较。若所述时间差大于所述时间阈值,则说明各个音频信号样本是离散生成的,从而可以根据所述时间差生成时间向量。若所述时间差小于或等于所述时间阈值,则说明各个音频信号样本是连续生成的,从而可以判断音频信号样本不符合条件。
例如,当所述音频信号样本的节奏满足两快一慢或两慢一快时,判定符合预设的节奏条件。
两快一慢:
第一声掌声与第二声掌声的间隔时间X1:大于100ms且小于600ms,记录时间为X1;
第二声掌声与第三声掌声间隔时间X2:大于X1的1.4倍,小于2.5倍X1,记录时间为X2;
等待间隔时间X3(X3可以是1s或其他时间间隔),检测是否会出现第4声,若没有,则控制声控开关动作,否则认为不符合节奏。
两慢一快:
第一声掌声与第二声掌声间隔时间X1:大于250ms且小于1000ms,记录时间为X1;
第二声掌声与第三声掌声间隔时间X2:大于100ms且小于X1的0.5倍,记录时间为X2;
等待间隔时间X3(X3可以是1s或其他时间间隔),检测是否会出现第4声,若没有,则控制声控开关动作,否则认为不符合节奏。
两快一慢或两慢一快的判定方法如图5所示。在图5中,若当前为第一声掌声,则开始计时,当收到第二声掌声时,计算与收到第一声掌声时的时间差X1,并计时,当收到第三声掌声时,计算与收到第二声掌声时的时间差X2,并计时,若又间隔时间X3后收到第四声掌声,判定不符合节奏,消除之前收到的三声节奏,若间隔时间X3后未收到第四声掌声,判定符合节奏。
上述根据3声节奏的掌声控制声控开关,具有较强的抗干扰能力。在实际应用中,掌声节奏也可以设置为其他值,例如,4声或5声。但是,掌声节奏太多,一方面时延较长,另一方面控制过程较为繁琐,容易影响用户体验。
可以设置更新时间,对所述噪声进行更新。例如,持续噪声变化情况较多,可以将持续噪声的更新时间设置为3秒;间歇噪声变化较小,可以将间歇噪声的更新时间设置为6秒。也可以根据实际需要设置其他更新时间。
在一个实施例中,当没有掌声或者掌声不符合节奏的时候,可以开始噪声更新程序。进入噪声更新程序后,首先可以判断声音信号样本是掌声噪声还是说话噪声,再判断不同的次数来定义持续噪声还是间歇噪声。一般,在同一时间段内,持续噪声产生噪声的次数会大于间歇噪声产生噪声的次数。有噪声的时候,噪声值会增加,声控开关的灵敏度就会降低。为了声控开关的保持灵敏度,可以设定当掌声噪声或说话噪声超过一定次数才记录噪声值。记录噪声值之后,可以判断噪声是持续噪声还是间歇噪声,可以分别为持续噪声和间歇噪声设置不同的更新时间,例如,可以将持续噪声的更新时间设置为3秒,将间歇噪声的更新时间设置为6秒。若噪声为持续噪声,且连续3秒检测到无噪声时,可以清除所述持续噪声;类似地,若噪声为间歇噪声,且连续6秒检测到无噪声时,可以清除所述间歇噪声。若噪声为持续噪声,且3秒内检测到有噪声时,可以根据噪声的最大值对噪声进行更新;类似地,若噪声为间歇噪声,且6秒内检测到有噪声时,可以根据噪声的最大值对噪声进行更新。
更新时间也可以设置为其他值,经过试验可知,若更新时间太短,则读取的数据量较少,更新的值准确性较差;若更新时间太长,则可能影响体验感。当更新时间取上述值时,既能够保证准确性,又能够保证体验感。
若所述幅度的斜率小于或等于所述参考斜率,或者所述时间向量中存在至少一个元素与所述参考时间向量中对应元素的差值均大于或等于预设的差值阈值,或者所述时间向量的维度与所述参考时间向量的维度不相同,从而可以判断音频信号样本不符合条件,可以清空所述音频信号样本。
本发明的声控开关可以用于房间、客厅、会议室等场所,抗干扰能力强,能够有效区分掌声、说话声等噪声和干扰。
在一个实施例中,还可以设置对所述声控开关进行控制的按键。所述按键可以由用户认为操作。用户可以通过按下所述按键的方式直接控制所述声控开关动作,无需发动掌声控制。
与上述声控开关控制方法相对应地,本发明还提供一种声控开关控制系统。如图6所示,所述声控开关控制系统可包括:
采样模块10,用于获取多个音频信号样本,按照预设的采样频率对各个音频信号样本进行采样,分别获取各个音频信号样本对应的若干个样本点;
所述音频信号样本中可以包括对声控开关进行控制的控制信号,还可以包括噪声(例如,鼓掌产生的掌声噪声,以及说话产生的说话噪声)。所述控制信号可以是掌声或者具有某种特定属性的声音信号,例如,有节奏的敲打声。为了便于说明,下面以控制信号是掌声为例对本发明的方案进行阐述。当所述音频信号样本为掌声时,每个音频信号样本可表示一声掌声。
可以按照预设的采样频率对各个音频信号样本进行采样,例如,可以每隔5ms对所述音频信号样本进行一次采样。采样所得的样本点的个数可以根据实际需要设置,例如,可以取30个样本点。
幅值检测模块20,用于分别对各个音频信号样本的样本点的幅度值进行检测,根据所述幅度值计算对应音频信号样本中样本点的幅度的斜率;
由于音频信号样本中除了掌声之外,还可能包括噪声和干扰,因此,可首先对所述音频信号样本的类型进行判断。可以根据掌声和说话声等噪声的特征来判断所述音频信号样本属于掌声还是说话声。掌声和说话声的特征如图2所示。从图2可以看出,掌声和说话声有以下区别:
(1)斜率:掌声的斜率明显大于说话声;
(2)稳定性:掌声的稳定性较好,所以通过判断声音是否有波动,也可以区分;
(3)时间:同一幅度下,掌声持续的时间会比说话声持续的时间短。
因此,可以检测音频信号样本中样本点的幅度的斜率。具体地,可以根据以下方式计算所述斜率:
式中,x[j]和x[i]分别为音频信号样本中的第j个样本点和第i个样本点的幅值,Δt为相邻两个样本点之间的采样时间间隔,k为幅度的斜率。
例如,可以根据音频信号样本中第5个样本点和第3个样本点的幅值计算所述斜率。在实际应用中,经过数据处理分析,第1个点和第2个点可能处在不稳定阶段,在小幅度(声音比较小)情况下第6个点、第7个点有可能已经超过最大值,这样就不能用作前面计算斜率的点了,因此,通过计算第5个样本点和第3个样本点之间的斜率可以较为精确地反映声音样本的斜率。另外,还可以计算多个斜率值求平均值,比如算第3个样本点和第4个样本点的斜率,并计算第4个样本点和第5个样本点的斜率,然后求平均值。假设采样间隔为5ms,则上述斜率为:
为了进一步提高检测精确度,还可以进一步根据音频信号样本的波动性判断音频信号样本是否为掌声。具体地,可以计算所述音频信号样本中各个样本点的幅值,若所述幅值在最大幅值前单调递增,在最大幅值后单调递减,则说明所述音频信号样本为掌声;否则,说明所述音频信号样本为说话声或环境噪声。
为了进一步提高检测精确度,还可以进一步根据音频信号样本中声音的持续时间判断音频信号样本是否为掌声。例如,掌声一般读取100个样本点后,后续读取的样本点已经递减到0,而说话声则可能在读取150个样本点之后递减到0。具体地,可以计算所述音频信号样本中幅值小于预设的幅度阈值的样本点的数量,若所述数量大于预设的数量阈值,则说明所述音频信号样本为掌声;否则,说明所述音频信号样本为说话声或环境噪声。
另外,当环境噪声较大,而掌声较小时,可能导致无法分辨出掌声。因此,还可以进一步将掌声幅度与噪音幅度作比较,以区分有效掌声和无效掌声。当掌声幅度大于噪声幅度时,可以认为掌声是有效掌声,反之,可以认为掌声是无效掌声。在一个实施例中,可以将噪声分为持续噪声和间歇噪声,如图3所示。持续噪声指的是一些比较连续的噪声,比如放音乐、连续敲鼓或鼓掌等声音;间歇噪声是指一些没有规律、但又时不时会发出的声音。
对掌声进行判定的具体方式如图4所示。
比较模块30,用于将所述斜率与预存的参考斜率进行比较,若所述斜率大于所述参考斜率,计算获取各个相邻音频信号样本的时间差;
在计算出所述音频信号样本的斜率之后,可以将所述斜率与预存的参考斜率进行比较。根据图2可知,掌声的斜率一般大于说话声,因此,可以将参考斜率设为小于掌声斜率,且大于说话声斜率的值。若计算出的所述音频信号样本的斜率大于该参考斜率,则可以判定所述音频信号样本为掌声,并开始对所述音频信号样本的节奏进行检测。
若进一步检测了音频信号样本的波动性,还可以在根据波动性判定所述音频信号样本为掌声后,开始对所述音频信号样本的节奏进行检测。
同样地,若进一步检测了音频信号样本的持续时间,还可以在根据持续时间判定所述音频信号样本为掌声后,开始对所述音频信号样本的节奏进行检测。
同样地,若进一步检测了音频信号样本的幅值,还可以在根据幅值判定所述音频信号样本为掌声后,开始对所述音频信号样本的节奏进行检测。
其中,所述节奏可以看作是每一声掌声之间的时间间隔。因此,可以记录每次检测到掌声响起的时间,并计算相邻掌声响起的时间间隔,所述时间间隔即为获取各个相邻音频信号样本的时间差。
控制模块40,用于若所述时间差满足预设的时间约束条件,控制声控开关动作。
在本步骤中,可以根据时间差进一步判断所述音频信号样本是否为掌声。具体地,可以根据所述时间差生成时间向量,分别将所述时间向量中各个元素与预存的参考时间向量中对应元素进行比较,若所述时间向量中各个元素与所述参考时间向量中对应元素的差值均小于预设的差值阈值,且所述时间向量的维度与所述参考时间向量的维度相同,控制声控开关动作。
由于掌声是间歇的,因此,在生成时间向量之前,还可以进一步将所述时间差与预设的时间阈值进行比较。若所述时间差大于所述时间阈值,则说明各个音频信号样本是离散生成的,从而可以根据所述时间差生成时间向量。若所述时间差小于或等于所述时间阈值,则说明各个音频信号样本是连续生成的,从而可以判断音频信号样本不符合条件。
例如,当所述音频信号样本的节奏满足两快一慢或两慢一快时,判定符合预设的节奏条件。
两快一慢:
第一声掌声与第二声掌声的间隔时间X1:大于100ms且小于600ms,记录时间为X1;
第二声掌声与第三声掌声间隔时间X2:大于X1的1.4倍,小于2.5倍X1,记录时间为X2;
等待间隔时间X3(X3可以是1s或其他时间间隔),检测是否会出现第4声,若没有,则控制声控开关动作,否则认为不符合节奏。
两慢一快:
第一声掌声与第二声掌声间隔时间X1:大于250ms且小于1000ms,记录时间为X1;
第二声掌声与第三声掌声间隔时间X2:大于100ms且小于X1的0.5倍,记录时间为X2;
等待间隔时间X3(X3可以是1s或其他时间间隔),检测是否会出现第4声,若没有,则控制声控开关动作,否则认为不符合节奏。
两快一慢或两慢一快的判定方法如图5所示。
上述根据3声节奏的掌声控制声控开关,具有较强的抗干扰能力。在实际应用中,掌声节奏也可以设置为其他值,例如,4声或5声。但是,掌声节奏太多,一方面时延较长,另一方面控制过程较为繁琐,容易影响用户体验。
可以设置更新时间,对所述噪声进行更新。例如,持续噪声变化情况较多,可以将持续噪声的更新时间设置为3秒;间歇噪声变化较小,可以将间歇噪声的更新时间设置为6秒。也可以根据实际需要设置其他更新时间。
在一个实施例中,当没有掌声或者掌声不符合节奏的时候,可以开始噪声更新程序。进入噪声更新程序后,首先可以判断声音信号样本是掌声噪声还是说话噪声,再判断不同的次数来定义持续噪声还是间歇噪声。一般,在同一时间段内,持续噪声产生噪声的次数会大于间歇噪声产生噪声的次数。有噪声的时候,噪声值会增加,声控开关的灵敏度就会降低。为了保持声控开关的灵敏度,可以设定当掌声噪声或说话噪声超过一定次数才记录噪声值。记录噪声值之后,可以判断噪声是持续噪声还是间歇噪声,可以分别为持续噪声和间歇噪声设置不同的更新时间,例如,可以将持续噪声的更新时间设置为3秒,将间歇噪声的更新时间设置为6秒。若噪声为持续噪声,且连续3秒检测到无噪声时,可以清除所述持续噪声;类似地,若噪声为间歇噪声,且连续6秒检测到无噪声时,可以清除所述间歇噪声。若噪声为持续噪声,且3秒内检测到有噪声时,可以根据噪声的最大值对噪声进行更新;类似地,若噪声为间歇噪声,且6秒内检测到有噪声时,可以根据噪声的最大值对噪声进行更新。
更新时间也可以设置为其他值,经过试验可知,若更新时间太短,则读取的数据量较少,更新的值准确性较差;若更新时间太长,则可能影响体验感。当更新时间取上述值时,既能够保证准确性,又能够保证体验感。
若所述幅度的斜率小于或等于所述参考斜率,或者所述时间向量中存在至少一个元素与所述参考时间向量中对应元素的差值均大于或等于预设的差值阈值,或者所述时间向量的维度与所述参考时间向量的维度不相同,从而可以判断音频信号样本不符合条件,可以清空所述音频信号样本。
本发明的声控开关可以用于房间、客厅、会议室等场所,抗干扰能力强,能够有效区分掌声、说话声等噪声和干扰。
在一个实施例中,还可以设置对所述声控开关进行控制的按键。所述按键可以由用户认为操作。用户可以通过按下所述按键的方式直接控制所述声控开关动作,无需发动掌声控制。
如图7所示,本发明还提供一种声控开关,可包括:
传声器110、检波电路120、微控制单元130和电子开关140;
所述传声器110的输出端与所述检波电路120的输入端相连接,所述检波电路120的输出端与所述微控制单元130的输入端相连接,所述微控制单元130的输出端与所述电子开关140相连接;
所述传声器110从周围环境获取多个音频信号样本并输出至所述检波电路120;
所述检波电路120将所述音频信号样本转换为直流信号,并输出至所述微控制单元130;
所述微控制单元130按照预设的采样频率对各个音频信号样本进行采样,分别获取各个音频信号样本对应的若干个样本点,分别对各个音频信号样本的样本点的幅度值进行检测,根据所述幅度值计算对应音频信号样本中样本点的幅度的斜率,将所述斜率与预存的参考斜率进行比较,若所述斜率大于所述参考斜率,计算获取各个相邻音频信号样本的时间差,并当所述时间差满足预设的时间约束条件时,控制声控开关140动作。
所述音频信号样本中可以包括对声控开关140进行控制的控制信号,还可以包括噪声(例如,鼓掌产生的掌声噪声,以及说话产生的说话噪声)。所述控制信号可以是掌声或者具有某种特定属性的声音信号,例如,有节奏的敲打声。为了便于说明,下面以控制信号是掌声为例对本发明的方案进行阐述。当所述音频信号样本为掌声时,每个音频信号样本可表示一声掌声。
所述微控制单元130可以按照预设的采样频率对各个音频信号样本进行采样,例如,可以每隔5ms对所述音频信号样本进行一次采样。采样所得的样本点的个数可以根据实际需要设置,例如,可以取30个样本点。
由于音频信号样本中除了掌声之外,还可能包括噪声和干扰,因此,所述微控制单元130可首先对所述音频信号样本的类型进行判断。可以根据掌声和说话声等噪声的特征来判断所述音频信号样本属于掌声还是说话声。掌声和说话声的特征如图2所示。从图2可以看出,掌声和说话声有以下区别:
(1)斜率:掌声的斜率明显大于说话声;
(2)稳定性:掌声的稳定性较好,所以通过判断声音是否有波动,也可以区分;
(3)时间:同一幅度下,掌声持续的时间会比说话声持续的时间短。
因此,可以检测音频信号样本中样本点的幅度的斜率。具体地,可以根据以下方式计算所述斜率:
式中,x[j]和x[i]分别为音频信号样本中的第j个样本点和第i个样本点的幅值,Δt为相邻两个样本点之间的采样时间间隔,k为幅度的斜率。
例如,可以根据音频信号样本中第5个样本点和第3个样本点的幅值计算所述斜率。假设采样间隔为5ms,则上述斜率为:
为了进一步提高检测精确度,所述微控制单元130还可以进一步根据音频信号样本的波动性判断音频信号样本是否为掌声。具体地,可以计算所述音频信号样本中各个样本点的幅值,若所述幅值在最大幅值前单调递增,在最大幅值后单调递减,则说明所述音频信号样本为掌声;否则,说明所述音频信号样本为说话声或环境噪声。
为了进一步提高检测精确度,所述微控制单元130还可以进一步根据音频信号样本中声音的持续时间判断音频信号样本是否为掌声。例如,掌声一般读取100个样本点后,后续读取的样本点已经递减到0,而说话声则可能在读取150个样本点之后递减到0。具体地,可以计算所述音频信号样本中幅值小于预设的幅度阈值的样本点的数量,若所述数量大于预设的数量阈值,则说明所述音频信号样本为掌声;否则,说明所述音频信号样本为说话声或环境噪声。
另外,当环境噪声较大,而掌声较小时,可能导致无法分辨出掌声。因此,所述微控制单元130还可以进一步将掌声幅度与噪音幅度作比较,以区分有效掌声和无效掌声。当掌声幅度大于噪声幅度时,可以认为掌声是有效掌声,反之,可以认为掌声是无效掌声。在一个实施例中,可以将噪声分为持续噪声和间歇噪声,如图3所示。
对掌声进行判定的具体方式如图4所示。
所述微控制单元130计算出所述音频信号样本的斜率之后,可以将所述斜率与预存的参考斜率进行比较。根据图2可知,掌声的斜率一般大于说话声,因此,可以将参考斜率设为小于掌声斜率,且大于说话声斜率的值。若计算出的所述音频信号样本的斜率大于该参考斜率,则可以判定所述音频信号样本为掌声,并开始对所述音频信号样本的节奏进行检测。
若所述微控制单元130进一步检测了音频信号样本的波动性,还可以在根据波动性判定所述音频信号样本为掌声后,开始对所述音频信号样本的节奏进行检测。
同样地,若所述微控制单元130进一步检测了音频信号样本的持续时间,还可以在根据持续时间判定所述音频信号样本为掌声后,开始对所述音频信号样本的节奏进行检测。
同样地,若所述微控制单元130进一步检测了音频信号样本的幅值,还可以在根据幅值判定所述音频信号样本为掌声后,开始对所述音频信号样本的节奏进行检测。
其中,所述节奏可以看作是每一声掌声之间的时间间隔。因此,可以记录每次检测到掌声响起的时间,并计算相邻掌声响起的时间间隔,所述时间间隔即为获取各个相邻音频信号样本的时间差。
所述微控制单元130可以根据所述时间差进一步判断所述音频信号样本是否为掌声。具体地,可以根据所述时间差生成时间向量,分别将所述时间向量中各个元素与预存的参考时间向量中对应元素进行比较,若所述时间向量中各个元素与所述参考时间向量中对应元素的差值均小于预设的差值阈值,且所述时间向量的维度与所述参考时间向量的维度相同,控制声控开关动作。
由于掌声是间歇的,因此,在生成时间向量之前,还可以进一步将所述时间差与预设的时间阈值进行比较。若所述时间差大于所述时间阈值,则说明各个音频信号样本是离散生成的,从而可以根据所述时间差生成时间向量。若所述时间差小于或等于所述时间阈值,则说明各个音频信号样本是连续生成的,从而可以判断音频信号样本不符合条件。
例如,当所述音频信号样本的节奏满足两快一慢或两慢一快时,判定符合预设的节奏条件。
两快一慢:
第一声掌声与第二声掌声的间隔时间X1:大于100ms且小于600ms,记录时间为X1;
第二声掌声与第三声掌声间隔时间X2:大于X1的1.4倍,小于2.5倍X1,记录时间为X2;
等待间隔时间X3(X3可以是1s或其他时间间隔),检测是否会出现第4声,若没有,则控制声控开关动作,否则认为不符合节奏。
两慢一快:
第一声掌声与第二声掌声间隔时间X1:大于250ms且小于1000ms,记录时间为X1;
第二声掌声与第三声掌声间隔时间X2:大于100ms且小于X1的0.5倍,记录时间为X2;
等待间隔时间X3(X3可以是1s或其他时间间隔),检测是否会出现第4声,若没有,则控制声控开关动作,否则认为不符合节奏。
两快一慢或两慢一快的判定方法如图5所示。
上述根据3声节奏的掌声控制声控开关,具有较强的抗干扰能力。在实际应用中,掌声节奏也可以设置为其他值,例如,4声或5声。但是,掌声节奏太多,一方面时延较长,另一方面控制过程较为繁琐,容易影响用户体验。
所述微控制单元130可以设置更新时间,对所述噪声进行更新。例如,持续噪声变化情况较多,可以将持续噪声的更新时间设置为3秒;间歇噪声变化较小,可以将间歇噪声的更新时间设置为6秒。也可以根据实际需要设置其他更新时间。
在一个实施例中,当没有掌声或者掌声不符合节奏的时候,可以开始噪声更新程序。进入噪声更新程序后,首先可以判断声音信号样本是掌声噪声还是说话噪声,再判断不同的次数来定义持续噪声还是间歇噪声。为了保持灵敏度,可以设定当掌声噪声或说话噪声超过一定次数才记录噪声值。记录噪声值之后,可以判断噪声是持续噪声还是间歇噪声,可以分别为持续噪声和间歇噪声设置不同的更新时间,例如,可以将持续噪声的更新时间设置为3秒,将间歇噪声的更新时间设置为6秒。若噪声为持续噪声,且连续3秒检测到无噪声时,可以清除所述持续噪声;类似地,若噪声为间歇噪声,且连续6秒检测到无噪声时,可以清除所述间歇噪声。若噪声为持续噪声,且3秒内检测到有噪声时,可以根据噪声的最大值对噪声进行更新;类似地,若噪声为间歇噪声,且6秒内检测到有噪声时,可以根据噪声的最大值对噪声进行更新。
更新时间也可以设置为其他值,经过试验可知,若更新时间太短,则读取的数据量较少,更新的值准确性较差;若更新时间太长,则可能影响体验感。当更新时间取上述值时,既能够保证准确性,又能够保证体验感。
若所述幅度的斜率小于或等于所述参考斜率,或者所述时间向量中存在至少一个元素与所述参考时间向量中对应元素的差值均大于或等于预设的差值阈值,或者所述时间向量的维度与所述参考时间向量的维度不相同,从而可以判断音频信号样本不符合条件,可以清空所述音频信号样本。
本发明的声控开关可以用于房间、客厅、会议室等场所,抗干扰能力强,能够有效区分掌声、说话声等噪声和干扰。
在一个实施例中,还可以设置对所述声控开关进行控制的按键。所述按键可以由用户认为操作。用户可以通过按下所述按键的方式直接控制所述声控开关动作,无需发动掌声控制。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种声控开关控制方法,包括以下步骤:获取多个音频信号样本,按照预设的采样频率对各个音频信号样本进行采样,分别获取各个音频信号样本对应的若干个样本点;其特征在于,还包括:
分别对各个音频信号样本的样本点的幅度值进行检测,根据所述幅度值计算对应音频信号样本中样本点的幅度的斜率;
将所述斜率与预存的参考斜率进行比较,若所述斜率大于所述参考斜率,计算获取各个相邻音频信号样本的时间差;
若所述时间差满足预设的时间约束条件,控制声控开关动作。
2.根据权利要求1所述的声控开关控制方法,其特征在于,计算所述音频信号样本中样本点的幅度的斜率的步骤包括:
根据如下公式计算幅度的斜率:
式中,x[j]和x[i]分别为音频信号样本中的第j个样本点和第i个样本点的幅值,Δt为相邻两个样本点之间的采样时间间隔,k为幅度的斜率。
3.根据权利要求1所述的声控开关控制方法,其特征在于,还包括以下步骤:
计算所述音频信号样本中各个样本点的幅值;
若所述幅值在最大幅值前单调递增,在最大幅值后单调递减,且所述幅度的斜率大于所述参考斜率,计算获取各个相邻音频信号样本的时间差。
4.根据权利要求1所述的声控开关控制方法,其特征在于,还包括以下步骤:
计算所述音频信号样本中幅值小于预设的幅度阈值的样本点的数量;
若所述数量大于预设的数量阈值,且所述幅度的斜率大于所述参考斜率,计算获取各个相邻音频信号样本的时间差。
5.根据权利要求1所述的声控开关控制方法,其特征在于,还包括以下步骤:
将所述音频信号样本的幅值与噪声信号的幅值相比较;
若所述音频信号样本的幅值大于所述噪声信号的幅值,且所述幅度的斜率大于所述参考斜率,计算获取各个相邻音频信号样本的时间差。
6.根据权利要求1所述的声控开关控制方法,其特征在于,若所述时间差满足预设的时间约束条件,控制声控开关动作的步骤包括:
根据所述时间差生成时间向量,分别将所述时间向量中各个元素与预存的参考时间向量中对应元素进行比较;
若所述时间向量中各个元素与所述参考时间向量中对应元素的差值均小于预设的差值阈值,且所述时间向量的维度与所述参考时间向量的维度相同,控制声控开关动作。
7.根据权利要求6所述的声控开关控制方法,其特征在于,还包括以下步骤:
将所述时间差与预设的时间阈值进行比较;
若所述时间差大于所述时间阈值,根据所述时间差生成时间向量。
8.根据权利要求6所述的声控开关控制方法,其特征在于,还包括以下步骤:
若所述幅度的斜率小于或等于所述参考斜率,或者
所述时间向量中存在至少一个元素与所述参考时间向量中对应元素的差值均大于或等于预设的差值阈值,或者
所述时间向量的维度与所述参考时间向量的维度不相同,
清空所述音频信号样本。
9.一种声控开关控制系统,包括:采样模块,用于获取多个音频信号样本,按照预设的采样频率对各个音频信号样本进行采样,分别获取各个音频信号样本对应的若干个样本点;其特征在于,还包括:
幅值检测模块,用于分别对各个音频信号样本的样本点的幅度值进行检测,根据所述幅度值计算对应音频信号样本中样本点的幅度的斜率;
比较模块,用于将所述斜率与预存的参考斜率进行比较,若所述斜率大于所述参考斜率,计算获取各个相邻音频信号样本的时间差;
控制模块,用于若所述时间差满足预设的时间约束条件,控制声控开关动作。
10.一种声控开关,包括:
传声器、检波电路、微控制单元和电子开关;
所述传声器的输出端与所述检波电路的输入端相连接,所述检波电路的输出端与所述微控制单元的输入端相连接,所述微控制单元的输出端与所述电子开关相连接;
所述传声器从周围环境获取多个音频信号样本并输出至所述检波电路;
所述检波电路将所述音频信号样本转换为直流信号,并输出至所述微控制单元;
所述微控制单元按照预设的采样频率对各个音频信号样本进行采样,分别获取各个音频信号样本对应的若干个样本点,其特征在于,所述微控制单元还用于分别对各个音频信号样本的样本点的幅度值进行检测,根据所述幅度值计算对应音频信号样本中样本点的幅度的斜率,将所述斜率与预存的参考斜率进行比较,若所述斜率大于所述参考斜率,计算获取各个相邻音频信号样本的时间差,并当所述时间差满足预设的时间约束条件时,控制声控开关动作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610651767.XA CN106094598B (zh) | 2016-08-10 | 2016-08-10 | 声控开关控制方法、系统及声控开关 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610651767.XA CN106094598B (zh) | 2016-08-10 | 2016-08-10 | 声控开关控制方法、系统及声控开关 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106094598A CN106094598A (zh) | 2016-11-09 |
CN106094598B true CN106094598B (zh) | 2018-12-14 |
Family
ID=57455381
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610651767.XA Active CN106094598B (zh) | 2016-08-10 | 2016-08-10 | 声控开关控制方法、系统及声控开关 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106094598B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107844066A (zh) * | 2017-11-08 | 2018-03-27 | 陈永 | 一种节拍开关控制系统 |
CN108846106A (zh) * | 2018-06-21 | 2018-11-20 | 深圳大普微电子科技有限公司 | 一种判断多个音频中是否存在相同音频的方法和装置 |
CN110597395B (zh) * | 2019-09-19 | 2021-02-12 | 腾讯科技(深圳)有限公司 | 对象交互控制方法和装置、存储介质及电子装置 |
CN111243584B (zh) * | 2020-01-03 | 2023-07-07 | 广州大学 | 一种多维声音信号控制的智能插座及多维声音信号的控制方法 |
CN113541688A (zh) * | 2020-04-22 | 2021-10-22 | 炬芯科技股份有限公司 | 检测器、检测方法、检测设备和音频的调制装置 |
CN112272019A (zh) * | 2020-10-22 | 2021-01-26 | 广东美的制冷设备有限公司 | 声控敲击开关的控制方法、装置、家用电器及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104507237A (zh) * | 2014-12-29 | 2015-04-08 | 古龙辉 | 一种声控的灯光场景效果实现方法 |
JP5762479B2 (ja) * | 2013-07-10 | 2015-08-12 | 日本電信電話株式会社 | 音声スイッチ装置、音声スイッチ方法、及びそのプログラム |
-
2016
- 2016-08-10 CN CN201610651767.XA patent/CN106094598B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5762479B2 (ja) * | 2013-07-10 | 2015-08-12 | 日本電信電話株式会社 | 音声スイッチ装置、音声スイッチ方法、及びそのプログラム |
CN104507237A (zh) * | 2014-12-29 | 2015-04-08 | 古龙辉 | 一种声控的灯光场景效果实现方法 |
Also Published As
Publication number | Publication date |
---|---|
CN106094598A (zh) | 2016-11-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106094598B (zh) | 声控开关控制方法、系统及声控开关 | |
CN111210021B (zh) | 一种音频信号处理方法、模型训练方法以及相关装置 | |
JP6177253B2 (ja) | ハーモニシティベースの単一チャネルスピーチ品質評価 | |
CN110268470A (zh) | 音频设备滤波器修改 | |
US8155968B2 (en) | Voice recognition apparatus and method for performing voice recognition comprising calculating a recommended distance range between a user and an audio input module based on the S/N ratio | |
RU2376722C2 (ru) | Способ многосенсорного улучшения речи на мобильном ручном устройстве и мобильное ручное устройство | |
CN109410977B (zh) | 一种基于EMD-Wavelet的MFCC相似度的语音段检测方法 | |
CN111149370B (zh) | 会议系统中的啸叫检测 | |
CN111837179B (zh) | 捕获噪声用于模式识别处理的系统和方法 | |
CN109920419B (zh) | 语音控制方法和装置、电子设备及计算机可读介质 | |
CN110265064A (zh) | 音频爆音检测方法、装置和存储介质 | |
CN113674761B (zh) | 设备确定方法及设备确定系统 | |
CN203882609U (zh) | 基于语音激活检测的唤醒装置 | |
CN110244833A (zh) | 麦克风组件 | |
CN102635999B (zh) | 一种通过语音管理冰箱的方法 | |
CN107484068B (zh) | 一种家用智能音箱及其控制方法 | |
GB2346999A (en) | Communication device for endpointing speech utterances | |
US20090132250A1 (en) | Robot apparatus with vocal interactive function and method therefor | |
CN104364845B (zh) | 处理装置、处理方法、程序、计算机可读信息记录介质以及处理系统 | |
CN105096946A (zh) | 基于语音激活检测的唤醒装置及方法 | |
CN110473544A (zh) | 一种低功耗语音唤醒方法及装置 | |
WO2020056329A1 (en) | Energy efficient custom deep learning circuits for always-on embedded applications | |
CN117294985B (zh) | 一种tws蓝牙耳机控制方法 | |
CN109994129A (zh) | 语音处理系统、方法和设备 | |
KR20110061987A (ko) | 로봇의 음성인식 성능 평가장치 및 평가 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |