CN110049395B

CN110049395B - 耳机控制方法及耳机设备

Info

Publication number: CN110049395B
Application number: CN201910340744.0A
Authority: CN
Inventors: 尚岸奇
Original assignee: Vivo Mobile Communication Co Ltd
Current assignee: Vivo Mobile Communication Co Ltd
Priority date: 2019-04-25
Filing date: 2019-04-25
Publication date: 2020-06-05
Anticipated expiration: 2039-04-25
Also published as: CN110049395A

Abstract

本发明实施例提供了一种耳机控制方法及耳机设备，涉及通信技术领域，以解决耳机设备实时对采集到的数据进行监测、判断，导致功耗较大的问题。其中，所述耳机控制方法，包括：分别获取左耳传感器采集的第一数据和右耳传感器采集的第二数据；根据时间戳信息分别对所述第一数据和所述第二数据进行分帧处理；对经所述分帧处理后的所述第一数据和所述第二数据在时域上进行减法处理，得到第三数据；在所述第三数据与预设人声数据特征匹配的情况下，唤醒所述耳机设备的语音识别功能。本发明实施例中的耳机控制方法应用于耳机设备中。

Description

耳机控制方法及耳机设备

技术领域

本发明实施例涉及通信技术领域，尤其涉及一种耳机控制方法及耳机设备。

背景技术

随着通信技术的发展，穿戴类设备的智能化趋势进程也是越来越快，其中语音助手功能已成为必不可少的一个功能。

其中，耳机设备作为穿戴类设备也可实现语音助手功能。在语音助手功能中，目前一般都是开启语音活动检测，以实时对耳机设备的麦克风、骨传导或者震动传感器采集到的数据进行监测，并依据此判断用户是否在说话。当监测到的数据超过一定阈值后，会对此时段的音频数据进行语音识别，看用户是否有提到激活的关键字，若有对应关键字，则唤醒耳机系统执行对应动作。

对于耳机设备而言，本身体积较小，因此电池一般都非常小，而实时对采集到的数据进行监测、判断，会导致耳机设备功耗较大。

发明内容

本发明实施例提供一种耳机控制方法，以解决耳机设备实时对采集到的数据进行监测、判断，导致功耗较大的问题。

为了解决上述技术问题，本发明是这样实现的：

本发明实施例提供了一种耳机控制方法，应用于耳机设备，所述耳机设备包括左耳传感器和右耳传感器，包括：分别获取所述左耳传感器采集的第一数据和所述右耳传感器采集的第二数据；根据时间戳信息分别对所述第一数据和所述第二数据进行分帧处理；对经所述分帧处理后的所述第一数据和所述第二数据在时域上进行减法处理，得到第三数据；在所述第三数据与预设人声数据特征匹配的情况下，唤醒所述耳机设备的语音识别功能。

本发明实施例还提供了一种耳机设备，包括左耳传感器和右耳传感器，还包括：获取模块，用于分别获取所述左耳传感器采集的第一数据和所述右耳传感器采集的第二数据；分帧模块，用于根据时间戳信息分别对所述第一数据和所述第二数据进行分帧处理；消减模块，用于对经所述分帧处理后的所述第一数据和所述第二数据在时域上进行减法处理，得到第三数据；唤醒模块，用于在所述第三数据与预设人声数据特征匹配的情况下，唤醒所述耳机设备的语音识别功能。

本发明实施例还提供了一种耳机设备，包括处理器，存储器，存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现所述耳机控制方法的步骤。

本发明实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现所述耳机控制方法的步骤。

在本发明实施例中，基于人体发出来的声音在人体耳中产生的震动，与人体其它动作(如晃头)在人体耳中产生的震动的本质区别，即：人体发出来的声音在左右耳中震动分别产生的两组数据具有大小相等、方向相反的特点，而其它动作在左右耳中震动分别产生的两组数据具有大小相等、方向相同的特点，本发明实施例分别获取左耳传感器在人体左耳采集的第一数据，以及右耳传感器在人体右耳采集的第二数据。进一步地，基于获取的第一数据和第二数据，根据数据中的时间戳信息，分别对第一数据和第二数据进行分帧处理，再对经分帧处理后的第一数据和第二数据在时域上进行减法处理。在减法处理后，若该时段是由人体发出来的声音在耳中震动产生的数据，则该数据被放大；若该时段是由人体其它动作在耳中震动产生的数据，则该数据被消减掉。而本实施例在对第一数据和第二数据进行减法处理后，对得到的第三数据进行预设人声数据特征的匹配，从而可排除其它动作的震动干扰，仅对传感器采集的人声数据进行匹配，进而在人声数据与预设人声数据特征匹配的情况下，才会唤醒语音识别功能。可见，本实施例中的耳机控制方法节省了对其它动作的震动数据进行匹配的步骤，降低误匹配现象的概率，提高匹配精准度，减少语音识别功能的开启动作，降低耳机设备功耗。

附图说明

图1是本发明实施例的耳机控制方法的流程图之一；

图2是本发明实施例的耳机设备的结构示意图；

图3是本发明实施例的第一数据和第二数据的示意图之一；

图4是本发明实施例的第三数据的示意图；

图5是本发明实施例的第一数据和第二数据的示意图之二；

图6是本发明实施例的第一数据和第二数据的示意图之三；

图7是本发明实施例的耳机控制方法的流程图之二；

图8是本发明实施例的耳机控制方法的流程图之三；

图9是本发明实施例的耳机控制方法的步骤示意图；

图10是本发明实施例的耳机设备的框图之一；

图11是本发明实施例的耳机设备的框图之二。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参见图1，示出了本发明一个实施例的耳机控制方法的流程图，应用于耳机设备，耳机设备包括左耳传感器和右耳传感器，方法包括：

步骤S1：分别获取左耳传感器采集的第一数据和右耳传感器采集的第二数据。

在本实施例中，耳机设备包括左耳机和右耳机。参见图2，简易地示出了左耳机1和右耳机2中的各个零件。其中，左耳机1和右耳机2中均设有多个传感器(sensor)，例如，骨传导传感器、佩戴传感器，以及其他传感器。左耳机1和右耳机2中的其它零件为常规设置，在此不再赘述。

在本实施例中，优选针对骨传导传感器采集的数据进行获取、分析、计算等一系列处理。因此本实施例中的左耳传感器和右耳传感器可优选为骨传导传感器。

另外，实施例中的左耳传感器和右耳传感器还可以是震动传感器、加速度传感器等。

在本实施例中，以骨传导传感器为例，进行详细说明。骨传导路径如下：人体发出的声音从声带发出，途经咽鼓管传导到耳朵里面。在传导过程中，既有空气传导的路径，也有硬介质(骨传导)的路径。对于耳机设备而言，较佳的骨传导传输位置为耳屏，即人体发出的声音对耳屏引起的震动，此处的硬传导能量较大，所以一般的骨传导传感器会对应耳屏或者耳道位置摆放。

在现有技术中，对于骨传导检测或者震动检测，判断用户是否说话的依据主要是：监测传感器采集的震动信号频段是否在人声频段范围内。其中，人声频段范围通常为50Hz～4KHz。

而对于耳机较为复杂的佩戴环境而言，用户在执行其它动作，如跑步、较为快速的头部晃动等时，引起的震动信号频段也会落在此范围内，而基于现有技术，会实时监测传感器采集的震动信号频段是否在人声频段范围内，此时引发的误判断次数会有很多，从而引起的语音活动检测(Voice Activity Detection，简称VAD)的开启动作也会非常多，此时对功耗是一个极大的浪费。而用户在运动类场景或者活动类场景使用耳机的情况占比非常高，降低此类场景的语音监测功耗成为一种强需求。

因此，本实施例主要从上述问题入手，考虑从减少误判断次数、提高VAD动作开启的精准度，来降低耳机设备的功耗。

从而在该步骤中，耳机设备连接后，进入工作状态，则分别获取左耳传感器采集的第一数据和右耳传感器采集的第二数据。

步骤S2：根据时间戳信息分别对第一数据和第二数据进行分帧处理。

在耳机设备的常规使用中，至少会实时同步两个耳机的音频数据、传感器采集数据及对应的时间戳信息。对应地，本实施例中的第一数据和第二数据均为传感器采集数据。

因此在该步骤中，可根据时间戳信息，分别对第一数据和第二数据进行分帧处理。

优选地，本实施例中的第一数据和第二数据可以是包括传感器采集数据及对应的时间戳信息。

在时域上，对于佩戴在人耳上耳机传感器，在平行于外耳道的方向上，实时监测到的数据可以视为由时间t和幅度X组成的二维数据。

参见图3，X_L(t)表示左耳传感器采集到的第一数据；X_R(t)表示右耳传感器采集到的第二数据。

在该步骤中，对第一数据和第二数据分帧对齐处理。

步骤S3：对经分帧处理后的第一数据和第二数据在时域上进行减法处理，得到第三数据。

在该步骤中，经分帧对齐处理后的第一数据和第二数据在时域上进行减法处理，即XL(t)-XR(t)，得到的第三数据，记为：如图4所示的X(t)。

需要说明的是，因对于人声引起的震动，因为左右耳的对称关系，声波传输到耳屏位置的距离是相等的，又因为声波是纵波，所以在两边耳屏位置的到咽喉距离相等的质点震动可以认为是大小相等、方向相反的两个震动量，如图5所示。且平行于传播方向有最大震动量，方向上平行于外耳道。

而对于佩戴者的其它动作引起的震动，如跑步等活动引起的震动，相对于左右耳的运动方向是一致的，且大小可以近似于相等，可以认为是大小相等、方向相同的两个震动量，如图6所示。

依据上述的数据分析，对分帧处理后的第一数据和第二数据在时域上进行减法处理后，因人声在左右耳产生的震动数据相位相反，从而减法处理后而被放大，而因其它动作在左右耳产生的震动数据相位相同，从而减法处理后会被消减掉。

另外，不管用户是出于坐姿还是躺姿，重力加速度在此方向上产生的分量都是大小相等、方向相同的，因为是两个传感器数据上做减法，所以此时重力加速度不会对结果产生干扰。

可见，在该步骤中，通过对第一数据和第二数据进行减法处理，可消减掉因其它动作产生的震动数据，仅对人声产生的震动数据进行判断，排除干扰后，减少误判断次数，VAD动作开启的精准度提高，从而有效降低耳机设备的功耗。

步骤S4：在第三数据与预设人声数据特征匹配的情况下，唤醒耳机设备的语音识别功能。

基于以上数据分析，综合同步两个耳机传感器的监测数据，在消减因其它动作的产生的数据后，与预设人声数据做特征匹配，并在第三数据与预设人声数据特征匹配的情况下，唤醒耳机设备的语音识别功能。

在图1所示实施例的基础上，图7示出了本发明另一个实施例的耳机控制方法的流程图，步骤S1包括：

步骤S11：按照预设周期分别获取左耳传感器采集的第一数据和右耳传感器采集的第二数据。

其中，预设周期小于传感器采样周期的2倍。

耳机传感器以周期T1定期采集数据，周期T1为传感器采样周期。在本实施例中，以周期T2获取传感器的采集数据。周期T2所表示的间隔时长不易过长，以避免获取的数据不具有实时性，从而避免对数据的延迟处理；周期T2所表示的间隔时长也不易过短，以避免频繁获取的数据不稳定，从而避免因数据不稳定导致的误判断现象发生。

优选地，周期T2小于周期T1的2倍为最佳，确保获取数据的有效性。

步骤S12：同步获取的第一数据和第二数据。

在根据时间戳信息分别对第一数据和第二数据进行分帧处理之前，需要同步第一数据和第二数据。同步方式包括无线方式和有线方式。

优选地，耳机设备可以是运用真正无线立体声(True Wireless Stereo，简称TWS)技术而来的TWS耳机设备，对应地，TWS耳机设备在该步骤采用的同步方式为无线方式。进一步地，无线方式建议使用蓝牙低功耗(Bluetooth Low Energy，简称BLE)模式，因为BLE模式本身功耗非常低，有助于降低耳机功耗，从而进一步降低功耗。

示例性地，为了实现第一数据和第二数据的同步，可在左耳机和右耳机中选定一个作为主耳机，从而由主耳机根据时间戳信息分别对第一数据和第二数据进行分帧处理。

优选地，第一数据和第二数据均为沿平行于外耳道延伸方向传播的数据。

为减少通信数据量，对于传感器数据只选取平行于外耳道方向上的轴上数据(记为X轴)，因为对于佩戴用户说话产生的震动能量，此方向上可以获得最大能量，相对信噪比S/N最大。

优选地，步骤S2中，分帧的帧长范围为10ms～30ms。

在步骤S2中的分帧处理过程，对应分帧的帧长T-frame，T-frame长度可以根据实际情况进行调整，一般长度选取在10ms～30ms之间。因为语音信号是短时平稳信号，其在10ms～30ms之间可看成平稳信号。

在图1所示实施例的基础上，图8示出了本发明另一个实施例的耳机控制方法的流程图，步骤S4包括：

步骤S41：依次对第三数据进行分帧、加窗、FFT处理，得到第四数据。

在本实施例中，将得到的第三数据X(t)进行分帧、加窗处理，再经过快速傅氏变换(Fast Fourier Transformation，简称FFT)处理后即可得到第四数据，即频域上的幅度，其中，第四数据记为Y(f，n)，f为频率，n为时域上的帧数。连续判断帧的个数越多，对应的结果越准确，但是时延上也越大，帧数的选取可以依据实际噪声环境及用户的使用人群进行拟合调试来选取。

进一步地，对应做FFT的帧计算，得到第四数据对应人声特征频率的能量，判断第四数据对应的人声特征频率的能量是否超过预设阈值。此预设阈值可用出厂前通过较大数量的样本测试综合取得，做出佩戴者是否说话的判断。

步骤S42：在第四数据对应人声特征频率的能量超过预设阈值的情况下，唤醒耳机设备的语音识别功能。

参见图9，(a)表示步骤S2中的第一数据和第二数据的分帧对齐示意图；(b)表示步骤S2中的第一数据和第二数据减法处理后得到的第三数据的示意图；(c)表示步骤S41中的第三数据FFT处理后得到的第四数据的示意图；(d)表示第四数据对应人声特征频率的能量比对的示意图。其中，(d)中的曲线表示Y(f，n)，K1、K2和K3分别表示对应时段内的第四数据通过计算得到的人声特征频率的能量，从而可判断减法处理后的数据对应做FFT的帧计算对应人声特征频率的能量是否超过预设阈值，若超过预设阈值，则认为佩戴者说话，为用户在位语音，从而唤醒耳机设备的语音识别功能。

优选地，语音识别功能唤醒后，耳机设备开启关键词检测模式，以在检测到关键词时，控制耳机设备执行对应的动作。

综上，因耳机传感器本身功耗也很低，对于双耳的耳机设备而言，双耳的同步机制本身就是需要的。再者，TWS耳机设备加入传感器数据同步需要消耗的额外功耗非常低，对应FFT一般会有硬件浮点单元，所以计算对应消耗的功耗也可以做到非常低的数值，相对于误触发而频繁开启语音检测消耗的功耗会节省很多。

进一步地，本发明实施例基本不用增加硬件成本，达到较低的误识别率。

图10示出了本发明另一个实施例的耳机设备的框图，包括左耳传感器和右耳传感器；

获取模块10，用于分别获取左耳传感器采集的第一数据和右耳传感器采集的第二数据；

分帧模块20，用于根据时间戳信息分别对第一数据和第二数据进行分帧处理；

消减模块30，用于对经分帧处理后的第一数据和第二数据在时域上进行减法处理，得到第三数据；

唤醒模块40，用于在第三数据与预设人声数据特征匹配的情况下，唤醒耳机设备的语音识别功能。

优选地，获取模块10包括：

周期获取单元，用于按照预设周期分别获取左耳传感器采集的第一数据和右耳传感器采集的第二数据；其中，预设周期小于传感器采样周期的2倍；

同步数据单元，用于同步获取的第一数据和第二数据。

优选地，分帧模块20在根据时间戳信息分别对第一数据和第二数据进行分帧处理的步骤中，分帧的帧长范围为10ms～30ms。

优选地，唤醒模块40包括：

处理单元，用于依次对第三数据进行分帧、加窗、FFT处理，得到第四数据；

识别单元，用于在第四数据对应人声特征频率的能量超过预设阈值的情况下，唤醒耳机设备的语音识别功能。

本发明实施例提供的耳机设备能够实现图1至图9的方法实施例中耳机设备实现的各个过程，为避免重复，这里不再赘述。

图11为实现本发明各个实施例的一种耳机设备的硬件结构示意图，该耳机设备100包括但不限于：射频单元101、网络模块102、音频输出单元103、输入单元104、传感器105、显示单元106、用户输入单元107、接口单元108、存储器109、处理器110、以及电源111等部件。本领域技术人员可以理解，图11中示出的耳机设备结构并不构成对耳机设备的限定，耳机设备可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。在本发明实施例中，耳机设备包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载耳机设备、可穿戴设备、以及计步器等。

其中，处理器110，用于分别获取所述左耳传感器采集的第一数据和所述右耳传感器采集的第二数据；根据时间戳信息分别对所述第一数据和所述第二数据进行分帧处理；对经所述分帧处理后的所述第一数据和所述第二数据在时域上进行减法处理，得到第三数据；在所述第三数据与预设人声数据特征匹配的情况下，唤醒所述耳机设备的语音识别功能。

应理解的是，本发明实施例中，射频单元101可用于收发信息或通话过程中，信号的接收和发送，具体的，将来自基站的下行数据接收后，给处理器110处理；另外，将上行的数据发送给基站。通常，射频单元101包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外，射频单元101还可以通过无线通信系统与网络和其他设备通信。

耳机设备通过网络模块102为用户提供了无线的宽带互联网访问，如帮助用户收发电子邮件、浏览网页和访问流式媒体等。

音频输出单元103可以将射频单元101或网络模块102接收的或者在存储器109中存储的音频数据转换成音频信号并且输出为声音。而且，音频输出单元103还可以提供与耳机设备100执行的特定功能相关的音频输出(例如，呼叫信号接收声音、消息接收声音等等)。音频输出单元103包括扬声器、蜂鸣器以及受话器等。

输入单元104用于接收音频或视频信号。输入单元104可以包括图形处理器(Graphics Processing Unit，GPU)1041和麦克风1042，图形处理器1041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元106上。经图形处理器1041处理后的图像帧可以存储在存储器109(或其它存储介质)中或者经由射频单元101或网络模块102进行发送。麦克风1042可以接收声音，并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元101发送到移动通信基站的格式输出。

耳机设备100还包括至少一种传感器105，比如光传感器、运动传感器以及其他传感器。具体地，光传感器包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板1061的亮度，接近传感器可在耳机设备100移动到耳边时，关闭显示面板1061和/或背光。作为运动传感器的一种，加速计传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别耳机设备姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；传感器105还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等，在此不再赘述。

显示单元106用于显示由用户输入的信息或提供给用户的信息。显示单元106可包括显示面板1061，可以采用液晶显示器(Liquid Crystal Display，LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板1061。

用户输入单元107可用于接收输入的数字或字符信息，以及产生与耳机设备的用户设置以及功能控制有关的键信号输入。具体地，用户输入单元107包括触控面板1071以及其他输入设备1072。触控面板1071，也称为触摸屏，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1071上或在触控面板1071附近的操作)。触控面板1071可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器110，接收处理器110发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1071。除了触控面板1071，用户输入单元107还可以包括其他输入设备1072。具体地，其他输入设备1072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆，在此不再赘述。

进一步的，触控面板1071可覆盖在显示面板1061上，当触控面板1071检测到在其上或附近的触摸操作后，传送给处理器110以确定触摸事件的类型，随后处理器110根据触摸事件的类型在显示面板1061上提供相应的视觉输出。虽然在图11中，触控面板1071与显示面板1061是作为两个独立的部件来实现耳机设备的输入和输出功能，但是在某些实施例中，可以将触控面板1071与显示面板1061集成而实现耳机设备的输入和输出功能，具体此处不做限定。

接口单元108为外部装置与耳机设备100连接的接口。例如，外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元108可以用于接收来自外部装置的输入(例如，数据信息、电力等等)并且将接收到的输入传输到耳机设备100内的一个或多个元件或者可以用于在耳机设备100和外部装置之间传输数据。

存储器109可用于存储软件程序以及各种数据。存储器109可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器109可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

处理器110是耳机设备的控制中心，利用各种接口和线路连接整个耳机设备的各个部分，通过运行或执行存储在存储器109内的软件程序和/或模块，以及调用存储在存储器109内的数据，执行耳机设备的各种功能和处理数据，从而对耳机设备进行整体监控。处理器110可包括一个或多个处理单元；优选的，处理器110可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器110中。

耳机设备100还可以包括给各个部件供电的电源111(比如电池)，优选的，电源111可以通过电源管理系统与处理器110逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

另外，耳机设备100包括一些未示出的功能模块，在此不再赘述。

优选的，本发明实施例还提供一种耳机设备，包括处理器110，存储器109，存储在存储器109上并可在所述处理器110上运行的计算机程序，该计算机程序被处理器110执行时实现上述耳机控制方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

本发明实施例还提供一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述耳机控制方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。其中，所述的计算机可读存储介质，如只读存储器(Read-Only Memory，简称ROM)、随机存取存储器(Random Access Memory，简称RAM)、磁碟或者光盘等。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台耳机设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

上面结合附图对本发明的实施例进行了描述，但是本发明并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本发明的启示下，在不脱离本发明宗旨和权利要求所保护的范围情况下，还可做出很多形式，均属于本发明的保护之内。

Claims

1.一种耳机控制方法，应用于耳机设备，所述耳机设备包括左耳传感器和右耳传感器，所述左耳传感器和所述右耳传感器均为采集震动信号的传感器，其特征在于，包括：

分别获取所述左耳传感器采集的第一数据和所述右耳传感器采集的第二数据；

根据时间戳信息分别对所述第一数据和所述第二数据进行分帧处理；

对经所述分帧处理后的所述第一数据和所述第二数据在时域上进行减法处理，得到第三数据；

在所述第三数据与预设人声数据特征匹配的情况下，唤醒所述耳机设备的语音识别功能。

2.根据权利要求1所述的方法，其特征在于，所述分别获取所述左耳传感器采集的第一数据和所述右耳传感器采集的第二数据，包括：

按照预设周期分别获取所述左耳传感器采集的第一数据和所述右耳传感器采集的第二数据；其中，所述预设周期小于传感器采样周期的2倍；

同步获取的所述第一数据和所述第二数据。

3.根据权利要求1所述的方法，其特征在于，所述第一数据和所述第二数据均为沿平行于外耳道延伸方向传播的数据。

4.根据权利要求1所述的方法，其特征在于，在所述根据时间戳信息分别对所述第一数据和所述第二数据进行分帧处理的步骤中，分帧的帧长范围为10ms～30ms。

5.根据权利要求1所述的方法，其特征在于，所述在所述第三数据与预设人声数据特征匹配的情况下，唤醒所述耳机设备的语音识别功能，包括：

依次对所述第三数据进行分帧、加窗、FFT处理，得到第四数据；

在所述第四数据对应人声特征频率的能量超过预设阈值的情况下，唤醒所述耳机设备的语音识别功能。

6.一种耳机设备，包括左耳传感器和右耳传感器，所述左耳传感器和所述右耳传感器均为采集震动信号的传感器，其特征在于，还包括：

获取模块，用于分别获取所述左耳传感器采集的第一数据和所述右耳传感器采集的第二数据；

分帧模块，用于根据时间戳信息分别对所述第一数据和所述第二数据进行分帧处理；

消减模块，用于对经所述分帧处理后的所述第一数据和所述第二数据在时域上进行减法处理，得到第三数据；

唤醒模块，用于在所述第三数据与预设人声数据特征匹配的情况下，唤醒所述耳机设备的语音识别功能。

7.根据权利要求6所述的耳机设备，其特征在于，所述获取模块包括：

周期获取单元，用于按照预设周期分别获取所述左耳传感器采集的第一数据和所述右耳传感器采集的第二数据；其中，所述预设周期小于传感器采样周期的2倍；

同步数据单元，用于同步获取的所述第一数据和所述第二数据。

8.根据权利要求6所述的耳机设备，其特征在于，所述第一数据和所述第二数据均为沿平行于外耳道延伸方向传播的数据。

9.根据权利要求6所述的耳机设备，其特征在于，所述分帧模块在根据时间戳信息分别对所述第一数据和所述第二数据进行分帧处理的步骤中，分帧的帧长范围为10ms～30ms。

10.根据权利要求6所述的耳机设备，其特征在于，所述唤醒模块包括：

处理单元，用于依次对所述第三数据进行分帧、加窗、FFT处理，得到第四数据；

识别单元，用于在所述第四数据对应人声特征频率的能量超过预设阈值的情况下，唤醒所述耳机设备的语音识别功能。

11.一种耳机设备，其特征在于，包括处理器，存储器，存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如权利要求1至5中任一项所述的耳机控制方法的步骤。

12.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述的耳机控制方法的步骤。