CN111432303B

CN111432303B - 单耳耳机、智能电子设备、方法和计算机可读介质

Info

Publication number: CN111432303B
Application number: CN202010198596.6A
Authority: CN
Inventors: 喻纯; 史元春
Original assignee: Interactive Future Beijing Technology Co ltd
Current assignee: Interactive Future Beijing Technology Co ltd
Priority date: 2020-03-19
Filing date: 2020-03-19
Publication date: 2023-01-10
Anticipated expiration: 2040-03-19
Also published as: WO2021184549A1; CN111432303A

Abstract

能够识别用户捂嘴手势下发声的单耳耳机、智能电子便携设备和语音交互唤醒方法。单耳耳机具有耳内麦克风和耳外麦克风，以及具有一块电路板，电路板上具有存储器和处理器，存储器上存储有计算机可执行指令，计算机可执行指令被处理器执行时能够执行如下操作：接收所述耳内麦克风和耳外麦克风采集的信号；分析耳内麦克风和耳外麦克风采集的信号，识别用户是否在做捂嘴手势的状态下发声。所述识别结果可以触发语音输入。本发明能够准确地识别出捂嘴手势下的语音输入；另外在由耳机自身电路板对信号进行接受和处理的情况下，不需要额外解决数据传输和信号的时间同步问题，节省电能，且保证高识别精度；使用效率更高、收音质量高、隐私性与社会性高。

Description

单耳耳机、智能电子设备、方法和计算机可读介质

技术领域

本发明总的来说涉及语音输入领域，且更为具体地，涉及智能电子设备、语音输入触发方法。

背景技术

随着计算机技术的发展，语音识别算法日益成熟，语音输入因其在交互方式上的高自然性与有效性而正变得越来越重要。用户可以通过语音与移动设备(手机、手表等)进行交互，完成指令输入、信息查询、语音聊天等多种任务。

而在何时触发语音输入这一点上，现有的解决方案都有一些缺陷：

1.物理按键触发

按下(或按住)移动设备的某个(或某些)物理按键后，激活语音输入。

该方案的缺点是：需要物理按键；容易误触发；需要用户按键。

2.界面元素触发

点击(或按住)移动设备的屏幕上的界面元素(如图标)，激活语音输入。

该方案的缺点是：需要设备具备屏幕；触发元素占用屏幕内容；受限于软件UI限制，可能导致触发方式繁琐；容易误触发。

3.唤醒词(语音)检测

以某个特定词语(如产品昵称)为唤醒词，设备检测到对应的唤醒词后激活语音输入。

该方案的缺点是：隐私性和社会性较差；交互效率较低。

发明内容

针对上述问题，本申请人先前提交了几份专利申请，在如下四个方面上提出了多项新的技术方案：1、基于人类说话时风噪声特征的语音输入触发，具体地，通过识别人说话时候的语音和风噪声音来直接启动语音输入并将接收的声音信号作为语音输入处理；2、基于多个麦克风接收的声音信号的差别的语音输入触发；3、基于低声说话方式识别的语音输入触发；4、基于麦克风的声音信号的距离判断的语音输入触发，相关专利申请公开案号为CN110262767A、CN110223711A、CN110428806A、CN110111776A、CN110097875A、CN110164440A，本文将这几篇专利文献全文并入，作为本公开的内容。

根据本发明的一个方面，提供了一种单耳耳机，具有耳内麦克风和耳外麦克风，以及具有一块电路板，电路板上具有存储器和处理器，存储器上存储有计算机可执行指令，计算机可执行指令被处理器执行时能够执行如下操作：接收所述耳内麦克风和耳外麦克风采集的信号；分析耳内麦克风和耳外麦克风采集的信号，识别用户是否在做捂嘴手势的状态下发声。

可选地，耳机还具备用于检测佩戴耳机的用户说话的说话检测模块，其中在分析耳内麦克风和耳外麦克风采集的声音信号，识别用户是否在做捂嘴手势的状态下发声动作之前，所述耳机上的耳内麦克风和耳外麦克风处于关闭状态，所述说话检测模块检测佩戴耳机的用户是否在说话，以及在识别到用户开始说话之后，打开耳机上的耳内麦克风和耳外麦克风，进行声音信号采集并识别。

可选地，所述“分析耳内麦克风和耳外麦克风采集的信号，识别用户是否在做捂嘴手势的状态下发声”，包括：对从耳内麦克风和耳外麦克风采集到的两路声音信号做人声信号增强，分别计算两路增强后信号的能量幅值，计算所述两路信号的能量幅值比值，识别耳外麦克风采集的用户声音信号在从用户口腔发出通过空气传到耳外麦克风之间的路径上有没有被遮挡，并基于此判断用户是否在做捂嘴手势的状态下发声。

可选地，所述耳外的麦克风是空气传导麦克风。

可选地，所述耳内的麦克风为空气传导麦克风或骨传导麦克风。

可选地，所述分析耳内麦克风和耳外麦克风采集的声音信号，识别用户是否在做捂嘴手势的状态下发声包括：计算耳机上耳内和耳外麦克风接收到的用户声音信号能量幅值比值；在耳内麦克风和耳外麦克风接收到的用户声音信号能量幅值比值超过预设阈值时，判断用户是在做捂嘴手势的状态下发声。

可选地，所述耳机可操作来与智能电子设备无线连接，其中当耳机识别出用户是在做捂嘴手势的状态下发声时，将指示识别结果的信号传递给智能电子设备，用于控制智能电子设备上的程序执行，包括触发相应的控制指令。

可选地，还包括处理所述耳内麦克风和耳外麦克风信号以检测用户是否去除捂嘴手势；响应于检测到用户去除捂嘴手势，发送信号给智能电子设备结束所述交互过程。

根据本发明的另一方面，提供了一种电子设备，特征在于：可操作来与下面的单个耳机无线连接，或者集成有所述单个耳机，所述单个耳机具有两个麦克风，耳内麦克风和耳外麦克风，电子设备具有存储器和中央处理器，存储器上存储有计算机可执行指令，计算机可执行指令被中央处理器执行时能够执行如下操作：接收所述耳内麦克风和耳外麦克风采集的声音信号，分析耳内麦克风和耳外麦克风采集的声音信号，识别用户是否在做捂嘴手势的状态下发声。

可选地，电子设备还具备用于检测佩戴耳机的用户说话的说话检测模块，其中在分析耳内麦克风和耳外麦克风采集的声音信号，识别用户是否在做捂嘴手势的状态下发声之前，所述耳机上的耳内麦克风和耳外麦克风处于关闭状态，所述说话检测模块检测佩戴耳机的用户是否在说话，以及在识别到用户开始说话之后，打开耳机上的耳内麦克风和耳外麦克风，进行声音信号采集并识别。

可选地，所述“分析耳内麦克风和耳外麦克风采集的信号，识别用户是否在做捂嘴手势”，包括：对从耳内麦克风和耳外麦克风采集到的两路声音信号做人声信号增强；分别计算两路增强后信号的能量幅值，计算所述两路信号的能量幅值比值，识别耳外麦克风采集的用户声音信号在从用户口腔发出通过空气传到耳外麦克风之间的路径上有没有被遮挡，并基于此判断用户是否在做捂嘴手势的状态下发声。

可选地，所述耳外的麦克风是空气传导麦克风。

可选地，所述分析耳内麦克风和耳外麦克风采集的声音信号，识别用户是否在做捂嘴手势的状态下发声包括：计算耳机上耳内麦克风和耳外接收到的用户声音信号能量幅值比值；在耳内麦克风和耳外麦克风接收到的用户声音信号能量幅值比值超过预设阈值时，判断用户是在做捂嘴手势的状态下发声。

可选地，计算机可执行指令被中央处理器执行时能够执行的操作还包括：响应于识别出用户是在做出捂嘴手势的状态下，将指示识别结果的信号作为用户交互输入控制的指示，控制智能电子设备上的程序执行，包括触发相应的控制指令。

可选地，执行的控制指令为触发除捂嘴手势外的其它输入方式，即处理其它输入方式输入的信息。

可选地，所述其他输入方式包括语音输入、非捂嘴手势输入、视线输入、眨眼输入、头动输入之一或者其组合。

可选地，执行的控制指令还包括：处理所述信号以检测用户是否去除捂嘴手势；响应于检测到用户去除捂嘴手势，智能电子设备结束所述交互过程。

可选地，执行的控制指令还包括：提供包括视觉、听觉任一项反馈，提示用户智能电子设备已经触发其他输入方式。

可选地，执行的控制指令还包括：智能电子设备对用户在保持捂嘴手势同时进行的语音输入进行处理。

可选地，所述智能电子设备为手机、手表、智能戒指、腕表中的一种智能穿戴设备。

可选地，所述智能电子设备为头戴式智能显示设备，装备有所述耳内麦克风和耳外麦克风。

根据本发明的另一方面，提供了一种如上所述的智能电子设备的语音交互唤醒方法，所述智能电子设备执行的语音交互唤醒方法包括：接收所述耳内麦克风和耳外麦克风采集的声音信号；分析耳内麦克风和耳外麦克风采集的声音信号，识别用户是否在做捂嘴手势的状态下发声；响应于识别到用户在做捂嘴手势的状态下发声，智能设备触发语音输入处理，分析及做出相应的内容输出；响应用户捂嘴手势后，在用户与智能设备交互情况下，处理所述耳内麦克风和耳外麦克风采集的声音信号，以确定用户去除捂嘴手势；响应于确定用户去除捂嘴手势，结束所述交互过程。

可选地，所述内容输出形式包括语音、图像中一种或其组合。

根据本发明另一方面，提供了一种计算机可读介质，其上存储有计算机可执行指令，计算机可执行指令被计算机执行时能够执行如上所述的语音交互唤醒方法。

本发明的技术方案具有至少下述优势中的一个或多个：

1.本发明利用同一个耳机内部的两个麦克风——耳内麦克风和耳外麦克风——来识别用户是否在做捂嘴手势的状态下发声，进而触发语音输入，这样能够准确地识别出捂嘴手势下的语音输入，能够非常便利准确地触发语音输入。

2.在由耳机自身电路板对耳机上的耳内麦克风和耳外麦克风的两路信号进行接受和处理的情况下，不需要额外解决数据传输和信号的时间同步问题，会节省电能，且保证高识别精度，

3.使用效率更高。单手即可使用。无需在不同的用户界面/应用之间切换，也不需按住某个按键，直接抬起手到嘴边就能使用。

4.收音质量高。耳机的耳内麦克风和耳外麦克风收取的语音输入信号清晰，受环境音的影响较小。

5.高隐私性与社会性。基于同一耳机配置的耳内麦克风和耳外麦克风捕捉的声音内在特征，来确定是否触发语音输入应用，其中无需传统的物理按键触发、界面元素触发、唤醒词检测，交互更加自然。

6.做出捂嘴手势，用户进行语音输入对他人的干扰较小，同时具有较好的隐私保护，降低用户语音输入时的心理负担。

附图说明

从下面结合附图对本发明实施例的详细描述中，本发明的上述和/或其它目的、特征和优势将变得更加清楚并更容易理解。其中：

图1示意性地示出了如下情境，用户佩戴单耳耳机，单耳耳机上同时配置有耳内麦克风和耳外麦克风，以及用户做出捂嘴手势并同时低声说话。这种情况可能发生在例如一种会议室中，用户不想影响他人但仍需要低声或无声说话的时候。

图2示意了示出了捂嘴动作对于用户发出的声音在空气中传播时能量的改变，让进入到耳机外麦克风的声音变小；相比而言，耳机内部的麦克风接收到通过耳道和头部传播的声音，不受捂嘴动作的影响。

图3示意性地示出了耳内麦克风所接收的用户说话声音的不同来源，其中耳内麦克风所接收到的用户说话声音是喉咙或口腔发出、通过耳道传出的声音或者通过头部的肌肉、骨骼传导的声音。

图4示出了根据本发明实施例的利用配备有耳内麦克风和耳外麦克风的单耳耳机来识别用户是否在做捂嘴手势的状态下发声的总体流程图。

具体实施方式

为了使本领域技术人员更好地理解本发明，下面结合附图和具体实施方式对本发明作进一步详细说明。

为便于理解，在详细介绍之前，首先介绍下本发明的发明构思。在用户佩戴单耳耳机的情况下，当用户做捂嘴动作时，主要改变的是用户声音达到耳外麦克风的路径，对耳内麦克风接受人声的传播路径影响相对较小，耳内麦克风和耳外麦克风接受用户说话声音的传导路径不同，因此，可以通过耳机上耳内麦克风和耳外麦克风接收到的用户声音信号能量幅值比值来判断用户是否在做捂嘴动作的状态下发声。进而，可以在识别到用户在做捂嘴动作的状态下发声的初始时刻，触发语音输入。

图1示意性地示出了如下情境，用户佩戴单耳耳机，单耳耳机上同时配置有耳内麦克风和耳外麦克风，以及用户做出捂嘴手势并同时低声说话。这种情况可能发生在例如一种会议室中，用户不想影响他人但仍需要低声说话的时候。如图1所示，用户佩戴该耳机时，耳内麦克风的收音方向朝着耳朵内，收集耳朵内的声音；耳外麦克风的收音方向向外，采集环境中的声音，也包括通过外部空气传导的用户说话声音。

图3示意性地示出了耳内麦克风所接收的用户说话声音的不同来源，其中耳内麦克风所接收到的用户说话声音是喉咙或口腔发出，通过耳道传出的声音或者通过头部的肌肉、骨骼传导的声音。

所述方法优选是在单耳耳机上执行的，此时单耳耳机具有一块电路板，电路板上具有存储器和处理器，存储器上存储有计算机可执行指令，计算机可执行指令被处理器执行时能够执行所述方法。

不过所述方法也可以在与单耳耳机协作的智能电子设备上执行，例如在智能手机上执行，此时在方法执行之前，需要将所述单耳耳机的所述耳内麦克风和耳外麦克风采集的这两路信号发送到智能电子设备上。

如图4所示，在步骤S401中，接收所述耳内麦克风和耳外麦克风采集的信号。

在步骤S402中，分析耳内麦克风和耳外麦克风采集的信号，识别用户是否在做捂嘴手势的状态下发声。

在一个示例中，耳外的麦克风可以是空气传导麦克风，耳内的麦克风为空气传导麦克风或骨传导麦克风。

在一个示例中，分析耳内麦克风和耳外麦克风采集的声音信号，识别用户是否在做捂嘴手势的状态下发声包括：计算耳机上耳内麦克风和耳外麦克风接收到的用户声音信号能量幅值比值；在耳内麦克风和耳外麦克风接收到的用户声音信号能量幅值比值超过预设阈值时，判断用户是在做捂嘴手势的状态下发声。

在一个示例中，分析耳内麦克风和耳外麦克风采集的信号，识别用户是否在做捂嘴手势的状态下发声可以包括：对从耳内麦克风和耳外麦克风采集到的两路声音信号做人声信号增强；分别计算两路增强后信号的能量幅值，计算所述两路信号的能量幅值比值，识别耳外麦克风采集的用户声音信号在从用户口腔发出通过空气传到耳外麦克风之间的路径上有没有被遮挡，并基于此判断用户是否在做捂嘴手势的状态下发声。

在一个示例中，耳机还具备用于检测佩戴耳机的用户说话的说话检测模块，其中在分析耳内麦克风和耳外麦克风采集的声音信号，识别用户是否在做捂嘴手势的状态下发声动作之前，所述耳机上的耳内麦克风和耳外麦克风处于关闭状态，所述说话检测模块检测佩戴耳机的用户是否在说话，以及在识别到用户开始说话之后，打开耳机上的耳内麦克风和耳外麦克风，进行声音信号采集并识别。

在一个示例中，所述耳机可操作来与智能电子设备无线连接，其中当耳机识别出用户是在做捂嘴手势的状态下发声时，将指示识别结果的信号传递给智能电子设备，用于控制智能电子设备上的程序执行，包括触发相应的控制指令。

在一个示例中，耳机执行操作还包括处理所述耳内麦克风和耳外麦克风信号以检测用户是否去除捂嘴手势；响应于检测到用户去除捂嘴手势，发送信号给智能电子设备结束所述交互过程。

根据本发明另一实施例，提供了一种电子设备，可操作来与下面的单个耳机无线连接，或者集成有所述单个耳机，所述单个耳机具有两个麦克风，耳内麦克风和耳外麦克风，电子设备具有存储器和中央处理器，存储器上存储有计算机可执行指令，计算机可执行指令被中央处理器执行时能够执行如下操作：接收所述耳内麦克风和耳外麦克风采集的声音信号，分析耳内麦克风和耳外麦克风采集的声音信号，识别用户是否在做捂嘴手势。

电子设备还可以具备用于检测佩戴耳机的用户说话的说话检测模块，其中在分析耳内麦克风和耳外麦克风采集的声音信号，识别用户是否在做捂嘴手势的状态下发声之前，所述耳机上的耳内麦克风和耳外麦克风处于关闭状态，所述说话检测模块检测佩戴耳机的用户是否在说话，以及在识别到用户开始说话之后，打开耳机上的耳内麦克风和耳外麦克风，进行声音信号采集并识别。

在一个示例中，所述“分析耳内麦克风和耳外麦克风采集的信号，识别用户是否在做捂嘴手势”，包括：对从耳内麦克风和耳外麦克风采集到的两路声音信号做人声信号增强；分别计算两路增强后信号的能量幅值，计算所述两路信号的能量幅值比值，识别耳外麦克风采集的用户声音信号在从用户口腔发出通过空气传到耳外麦克风之间的路径上有没有被遮挡，并基于此判断用户是否在做捂嘴手势的状态下发声。

例如，所述耳外的麦克风是空气传导麦克风，所述耳内的麦克风为空气传导麦克风或骨传导麦克风。

作为示例，所述分析耳内麦克风和耳外麦克风采集的声音信号，识别用户是否在做捂嘴手势的状态下发声包括：

计算耳机上耳内麦克风和耳外麦克风接收到的用户声音信号能量幅值比值；

在耳内麦克风和耳外麦克风接收到的用户声音信号能量幅值比值超过预设阈值时，判断用户是在做捂嘴手势的状态下发声。

作为示例，计算机可执行指令被中央处理器执行时能够执行的操作还包括：响应于识别出用户是在做出捂嘴手势的状态下，将指示识别结果的信号作为用户交互输入控制的指示，控制智能电子设备上的程序执行，包括触发相应的控制指令或者触发其他输入方式。

作为示例，执行的控制指令为触发除捂嘴手势外的其它输入方式，即处理其它输入方式输入的信息。

作为示例，所述其他输入方式包括语音输入、非捂嘴手势输入、视线输入、眨眼输入、头动输入之一或者其组合。

智能电子设备还处理所述耳内麦克风信号和耳外麦克风信号以检测用户是否去除捂嘴手势；响应于检测到用户去除捂嘴手势，智能电子设备结束所述交互过程。

作为示例，提供包括视觉、听觉任一项反馈，提示用户智能电子设备已经触发其他输入方式。

所述智能电子设备例如为手机、手表、智能戒指、腕表中的一种智能穿戴设备。

例如，所述智能电子设备为头戴式智能显示设备，装备有所述耳内麦克风和耳外麦克风。

根据本发明另一实施例，提供了一种智能电子设备的语音交互唤醒方法，所述智能电子设备执行的语音交互唤醒方法包括：接收所述耳内麦克风和耳外麦克风采集的声音信号，分析耳内麦克风和耳外麦克风采集的声音信号，识别用户是否在做捂嘴手势的状态下发声；响应于确定用户将手放在嘴边持续保持捂嘴手势，根据所做捂嘴手势类别、智能设备当前应用的交互内容，对于用户的交互意图进行解析；根据解析得到的交互意图，智能设备将对于用户的输入信息进行接收，分析及做出相应的内容输出；响应用户捂嘴手势后，在用户与智能设备交互情况下，处理所述耳内麦克风和耳外麦克风采集的声音信号，信号以确定用户去除捂嘴手势；响应于确定用户去除捂嘴手势，结束所述交互过程。

作为示例，内容输出形式包括语音、图像中一种或其组合。

根据本发明的另一方面，提供了一种计算机可读介质，其上存储有计算机可执行指令，计算机可执行指令被计算机执行时能够执行上述语音交互唤醒方法。

本发明各个实施例的方案可以提供下述一种或几种优势：

以上已经描述了本发明的各实施例，上述说明是示例性的，并非穷尽性的，并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。因此，本发明的保护范围应该以权利要求的保护范围为准。

Claims

1.一种单耳耳机，具有耳内麦克风和耳外麦克风，以及具有一块电路板，电路板上具有存储器和处理器，存储器上存储有计算机可执行指令，计算机可执行指令被处理器执行时能够执行如下操作：

接收所述耳内麦克风和耳外麦克风采集的信号；

分析耳内麦克风和耳外麦克风采集的信号，识别用户是否在做捂嘴手势的状态下发声，其中，捂嘴动作对于用户发出的声音在空气中传播时能量的改变，让进入到耳外麦克风的声音变小；耳内麦克风所接收到的用户说话声音是喉咙或口腔发出，通过耳道传出的声音或者通过头部的肌肉、骨骼传导的声音，不受捂嘴动作影响；

其中所述“分析耳内麦克风和耳外麦克风采集的信号，识别用户是否在做捂嘴手势的状态下发声”，包括：

对从耳内麦克风和耳外麦克风采集到的两路声音信号做人声信号增强，分别计算两路增强后信号的能量幅值，计算所述两路信号的能量幅值比值，识别耳外麦克风采集的用户声音信号在从用户口腔发出通过空气传到耳外麦克风之间的路径上有没有被遮挡，并基于此判断用户是否在做捂嘴手势的状态下发声。

2.根据权利要求1的耳机，还具备用于检测佩戴耳机的用户说话的说话检测模块，其中在分析耳内麦克风和耳外麦克风采集的声音信号，识别用户是否在做捂嘴手势的状态下发声动作之前，所述耳机上的耳内麦克风和耳外麦克风处于关闭状态，所述说话检测模块检测佩戴耳机的用户是否在说话，以及在识别到用户开始说话之后，打开耳机上的耳内麦克风和耳外麦克风，进行声音信号采集并识别。

3.根据权利要求1的耳机，所述耳外的麦克风是空气传导麦克风。

4.根据权利要求1的耳机，所述耳内的麦克风为空气传导麦克风或骨传导麦克风。

5.根据权利要求1的耳机，所述耳机可操作来与智能电子设备无线连接，其中当耳机识别出用户是在做捂嘴手势的状态下发声时，将指示识别结果的信号传递给智能电子设备，用于控制智能电子设备上的程序执行，包括触发相应的控制指令。

6.根据权利要求5的耳机，还包括处理所述耳内麦克风和耳外麦克风信号以检测用户是否去除捂嘴手势；响应于检测到用户去除捂嘴手势，发送信号给智能电子设备结束所述交互过程。

7.一种单耳耳机，具有耳内麦克风和耳外麦克风，以及具有一块电路板，电路板上具有存储器和处理器，存储器上存储有计算机可执行指令，计算机可执行指令被处理器执行时能够执行如下操作：

接收所述耳内麦克风和耳外麦克风采集的信号；

所述分析耳内麦克风和耳外麦克风采集的声音信号，识别用户是否在做捂嘴手势的状态下发声包括：

计算耳机上的耳内麦克风和耳外麦克风接收到的用户声音信号能量幅值比值；

8.一种智能电子设备，特征在于：可操作来与下面的单个耳机无线连接，或者集成有所述单个耳机，所述单个耳机具有两个麦克风，耳内麦克风和耳外麦克风，智能电子设备具有存储器和中央处理器，存储器上存储有计算机可执行指令，计算机可执行指令被中央处理器执行时能够执行如下操作：接收所述耳内麦克风和耳外麦克风采集的声音信号，分析耳内麦克风和耳外麦克风采集的声音信号，识别用户是否在做捂嘴手势的状态下发声，其中，捂嘴动作对于用户发出的声音在空气中传播时能量的改变，让进入到耳外麦克风的声音变小；耳内麦克风所接收到的用户说话声音是喉咙或口腔发出，通过耳道传出的声音或者通过头部的肌肉、骨骼传导的声音，不受捂嘴动作影响；

所述“分析耳内麦克风和耳外麦克风采集的信号，识别用户是否在做捂嘴手势”，包括：

对从耳内麦克风和耳外麦克风采集到的两路声音信号做人声信号增强分别计算两路增强后信号的能量幅值，计算所述两路信号的能量幅值比值，识别耳外麦克风采集的用户声音信号在从用户口腔发出通过空气传到耳外麦克风之间的路径上有没有被遮挡，并基于此判断用户是否在做捂嘴手势的状态下发声。

9.根据权利要求8的智能电子设备，还具备用于检测佩戴耳机的用户说话的说话检测模块，其中在分析耳内麦克风和耳外麦克风采集的声音信号，识别用户是否在做捂嘴手势的状态下发声之前，所述耳机上的耳内麦克风和耳外麦克风处于关闭状态，所述说话检测模块检测佩戴耳机的用户是否在说话，以及在识别到用户开始说话之后，打开耳机上的耳内麦克风和耳外麦克风，进行声音信号采集并识别。

10.根据权利要求8的智能电子设备，所述耳外的麦克风是空气传导麦克风。

11.根据权利要求8的智能电子设备，所述耳内的麦克风为空气传导麦克风或骨传导麦克风。

12.根据权利要求8的智能电子设备，计算机可执行指令被中央处理器执行时能够执行的操作还包括：

响应于识别出用户是在做出捂嘴手势的状态下，将指示识别结果的信号作为用户交互输入控制的指示，控制智能电子设备上的程序执行，包括触发相应的控制指令。

13.根据权利要求12的智能电子设备，执行的控制指令为触发除捂嘴手势外的其它输入方式，即处理其它输入方式输入的信息。

14.根据权利要求13的智能电子设备，所述其它输入方式包括语音输入、非捂嘴手势输入、视线输入、眨眼输入、头动输入之一或者其组合。

15.根据权利要求12的智能电子设备，处理所述信号以检测用户是否去除捂嘴手势；

响应于检测到用户去除捂嘴手势，智能电子设备结束所述交互过程。

16.根据权利要求12所述的智能电子设备，提供包括视觉、听觉任一项反馈，提示用户智能电子设备已经触发其他输入方式。

17.根据权利要求12的智能电子设备，智能电子设备对用户在保持捂嘴手势同时进行的语音输入进行处理。

18.根据权利要求8的智能电子设备，所述智能电子设备为手机、手表、智能戒指、腕表中的一种智能穿戴设备。

19.根据权利要求8的智能电子设备，所述智能电子设备为头戴式智能显示设备，装备有所述耳内麦克风和耳外麦克风。

20.一种智能电子设备，特征在于：可操作来与下面的单个耳机无线连接，或者集成有所述单个耳机，所述单个耳机具有两个麦克风，耳内麦克风和耳外麦克风，智能电子设备具有存储器和中央处理器，存储器上存储有计算机可执行指令，计算机可执行指令被中央处理器执行时能够执行如下操作：接收所述耳内麦克风和耳外麦克风采集的声音信号，分析耳内麦克风和耳外麦克风采集的声音信号，识别用户是否在做捂嘴手势的状态下发声，其中，捂嘴动作对于用户发出的声音在空气中传播时能量的改变，让进入到耳外麦克风的声音变小；耳内麦克风所接收到的用户说话声音是喉咙或口腔发出，通过耳道传出的声音或者通过头部的肌肉、骨骼传导的声音，不受捂嘴动作影响；

21.一种如权利要求8到20任一项所述的智能电子设备的语音交互唤醒方法，所述智能电子设备执行的语音交互唤醒方法包括：

接收所述耳内麦克风和耳外麦克风采集的声音信号，分析耳内麦克风和耳外麦克风采集的声音信号，识别用户是否在做捂嘴手势的状态下发声；

响应于识别到用户在做捂嘴手势的状态下发声，智能设备触发语音输入处理，分析及做出相应的内容输出；

响应用户捂嘴手势后，在用户与智能设备交互情况下，处理所述耳内麦克风和耳外麦克风采集的声音信号，以确定用户去除捂嘴手势；

响应于确定用户去除捂嘴手势，结束所述交互过程。

22.根据权利要求21的语音交互唤醒方法，所述内容输出形式包括语音、图像中一种或其组合。

23.一种计算机可读介质，其上存储有计算机可执行指令，计算机可执行指令被计算机执行时能够执行权利要求21-22任一项所述的语音交互唤醒方法。