CN104715757A

CN104715757A - 一种终端声控操作方法及装置

Info

Publication number: CN104715757A
Application number: CN201310687006.6A
Authority: CN
Inventors: 刘媛媛
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2013-12-13
Filing date: 2013-12-13
Publication date: 2015-06-17
Also published as: KR20150069535A; JP2015135667A; US20150170672A1; JP6023780B2; EP2884385A1

Abstract

本发明实施例提供了一种终端声控操作方法及装置，涉及音频技术领域，所述方法包括：启动所述终端设备上的应用程序，并激活所述终端设备上的麦克风；监测所述被激活的麦克风的信号状态；当所述麦克风的信号状态发生跳变时，则输出控制指令以改变所述应用程序当前的操作状态。本发明利用麦克风拾取环境噪音的变化对终端应用程序进行操作，避免了环境噪音对音频信号的获取造成干扰，也减少了用户的按键操作，提高了用户体验。

Description

一种终端声控操作方法及装置

技术领域

本发明实施例涉及音频技术领域，尤其涉及一种终端声控操作方法及装置。

背景技术

现在的终端设备，如手机或平板电脑，大多是触摸屏的，几乎所有操作都是在屏幕上完成的，例如，拍照时的快门操作、摄像时的拍摄按键操作等。用户对终端应用功能进行操作时，无论拍照还是摄像，当用户徒手拿稳手机后都需要至少空出一个手指来按操作键，如果按键在空闲手指不方便操作的位置，则会出现操作困难的情况，比如用户用手机后置摄像头进行自拍时想要准确找到触摸屏上的虚拟按键是很困难的。现有技术提供了语音控制来解决按键困难的问题，但语音控制在嘈杂环境下受到的干扰比较大容易导致语音识别率下降从而使操作的控制命令失效。

发明内容

本发明实施例提供一种终端声控操作方法及装置，利用麦克风采集到的环境噪音的变化状况来决定是否输出控制指令对终端进行操作，使得终端操作高效便捷。

第一方面，本发明实施例提供了一种终端声控操作方法，包括如下步骤：

启动所述终端设备上的应用程序，并激活所述终端设备上的麦克风；

监测所述被激活的麦克风的信号状态；

当所述麦克风的信号状态发生跳变时，则输出控制指令以改变所述应用程序当前的操作状态。

结合第一方面，在第一方面的第一种可能的实现方式中，所述监测所述被激活的麦克风的信号状态，具体为：

通过所述被激活的麦克风采集音频信号，并计算所述音频信号特征值；

判断所述音频信号特征值是否大于或等于预设门限值；当判断结果为是时，则所述麦克风信号状态为第一状态；当判断结果为否时，则所述麦克风信号状态为第二状态；

对应，所述当所述麦克风的信号状态发生跳变时，则输出控制指令以改变所述应用程序当前的操作状态具体包括：

当所述麦克风信号状态由第一状态跳变为第二状态，或，由第二状态跳变为第一状态时，则输出控制指令以改变所述应用程序当前的操作状态。

结合第一方面的第一种可能的实现方式，在第一方面的第二种可能的实现方式中，所述计算所述音频信号特征值包括：计算音频信号的信号能量值，或，信号幅度值，或，信号能量的波动值，或，信号幅度的波动值。

结合第一方面或第一方面的第一种可能的实现方式或第一方面的第二种可能的实现方式，在第一方面的第三种可能的实现方式中，所述麦克风为多个：

对应地，所述启动终端设备上的应用程序，并激活所述终端设备上的麦克风具体包括：

启动所述终端设备上的应用程序，并激活所述终端设备上的多个麦克风中的至少两个麦克风。

结合第一方面的第三种可能的实现方式，在第一方面的第四种可能的实现方式中，所述监测所述被激活的麦克风的信号状态具体包括：

监测所述被激活的至少两个麦克风的麦克风信号状态；

所述当所述麦克风的信号状态发生跳变时，则输出控制指令以改变所述应用程序当前的操作状态，具体包括：

当所述被激活的至少两个麦克风的麦克风信号状态中的至少两个信号状态发生跳变，则输出控制指令以改变所述应用程序当前的操作状态。

结合第一方面的第四种可能的实现方式中，在第一方面的第五种可能的实现方式中，所述当所述被激活的至少两个麦克风的麦克风信号状态中的至少两个信号状态发生跳变，则输出控制指令以改变所述应用程序当前的操作状态具体包括：

当所述被激活的至少两个麦克风的麦克风信号状态中的至少两个信号状态在预定的时间间隔内发生跳变，则输出控制指令以改变所述应用程序当前的操作状态。

结合第一方面，或第一方面的第一种可能的实现方式至第一方面的第五种可能的实现方式中的任意一种方式，在第一方面的第六种可能的实现方式中，当所述麦克风的信号状态发生跳变时，则输出控制指令以改变所述应用程序当前的操作状态具体包括：

当所述麦克风的信号状态发生跳变时，进行计时，并在计时至预设的时间段t时输出控制指令以改变所述应用程序当前的操作状态。

结合第一方面，或第一方面的第一种可能的实现方式至第一方面的第六种可能的实现方式中的任意一种方式，在第一方面的第七种可能的实现方式中，所述方法还包括：

当所述麦克风信号状态发生跳变时，发出提示信息提示经过所述时间段t之后将输出控制指令，其中，所述提示信息为语音提示，或者震动提示，或者文字提示，或者灯光提示。

结合第一方面，或第一方面的第一种可能的实现方式至第一方面的第七种可能的实现方式中的任意一种方式，在第一方面的第八种可能的实现方式中，所述启动所述终端设备上的应用程序，并激活所述终端设备上的麦克风，具体包括：启动所述终端设备上的应用程序，并经过预设时间激活所述终端设备上的麦克风。

第二方面，本发明实施例提供一种终端，包括麦克风，还包括如下装置：

启动单元，用于启动所述终端设备上的应用程序，用于激活所述终端设备上的麦克风；

监测单元，用于监测所述被激活的麦克风的信号状态；

操作单元，用于当所述麦克风的信号状态发生跳变时，则输出控制指令以改变所述应用程序当前的操作状态。

结合第二方面，在第二方面的第一种可能的实现方式中，所述监测单元包括：

采集子单元，用于通过所述被激活的麦克风采集音频信号；

计算子单元，用于计算所述采集的音频信号特征值；

判断子单元，用于判断所述音频信号特征值是否大于或等于预设门限值；当判断结果为是时，则所述麦克风信号状态为第一状态；当判断结果为否时，则所述麦克风信号状态为第二状态；

对应，所述操作单元，用于当所述麦克风信号状态由第一状态跳变为第二状态时输出控制指令以改变所述应用程序当前的操作状态；或，

用于当所述麦克风信号状态由第二状态跳变为第一状态时输出控制指令以改变所述应用程序当前的操作状态。

结合第二方面的第一种可能的实现方式，在第二方面的第二种可能的实现方式中，所述计算子单元包括：

能量计算子单元，用于计算音频信号的信号能量值；或，

幅度计算子单元，用于计算音频信号的信号幅度值；或，

能量波动计算子单元，用于计算音频信号的信号能量的波动值；或，

幅度波动计算子单元，用于计算音频信号的信号幅度的波动值。

结合第二方面或第二方面的第一种可能的实现方式或第二方面的第二种可能的实现方式，在第二方面的第三种可能的实现方式中，所述麦克风为多个：

对应地，所述启动单元包括：

激活子单元，用于激活所述终端设备上的多个麦克风中的至少两个麦克风。

结合第二方面的第三种可能的实现方式，在第二方面的第四种可能的实现方式中，所述监测单元，用于监测所述被激活的至少两个麦克风的麦克风信号状态；

对应地、所述操作单元，具体用于当所述被激活的至少两个麦克风的麦克风信号状态中的至少两个信号状态发生跳变，则输出控制指令以改变所述应用程序当前的操作状态。

结合第二方面的第四种可能的实现方式中，在第二方面的第五种可能的实现方式中，所述操作单元，还用于当所述被激活的至少两个麦克风的麦克风信号状态中的至少两个信号状态在预定的时间间隔内发生跳变，则输出控制指令以改变所述应用程序当前的操作状态。

结合第二方面，或第二方面的第一种可能的实现方式至第二方面的第五种可能的实现方式中的任意一种方式，在第二方面的第六种可能的实现方式中，所述操作单元，还用于当所述麦克风的信号状态发生跳变时，进行计时，并在计时至预设的时间段t时输出控制指令以改变所述应用程序当前的操作状态。

结合第二方面，或第二方面的第一种可能的实现方式至第二方面的第六种可能的实现方式中的任意一种方式，在第二方面的第七种可能的实现方式中，所述装置还包括：

提示单元，用于当所述麦克风信号状态发生跳变时，发出提示信息提示经过所述时间段t之后将输出控制指令，其中，所述提示信息为语音提示，或者震动提示，或者文字提示，或者灯光提示。

结合第二方面，或第二方面的第一种可能的实现方式至第二方面的第七种可能的实现方式中的任意一种方式，在第二方面的第八种可能的实现方式中，所述激活子单元：

还用于当启动单元启动所述终端设备上的应用程序后，经过预设时间激活所述终端设备上的麦克风。

本发明实施例利用麦克风拾取环境噪音的变化对终端应用程序进行操作，避免了环境噪音对音频信号的获取造成干扰，并减少了用户按键操作带来的麻烦。此外，当终端设备上有多个麦克风时，由至少两个麦克风信号状态的跳变决定输出指令，有利于操作的准确性，避免了用户操作过程中的单手操作失误造成的触发操作。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是一种承载并实现本发明的终端设备框图；

图2是图1中的终端设备100的系统架构框图；

图3为本发明实施例提供的一种终端声控操作方法流程框图；

图4为本发明实施例提供的一种终端声控操作装置框图；

图5为图4本发明实施例提供的一种终端声控操作装置的监测单元框图；

图6为图4本发明实施例提供的一种终端声控操作装置的计算子单元框图本发明实施例提供；

图7为本发明实施例提供的另一种终端声控操作装置框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1，为用以承载并实施本发明的终端设备100框图。所述终端设备100，可以是平板电脑、个人数字助理、蜂窝电话、网络家电、相机、智能电话、增强型通用分组无线业务(EGPRS)移动电话、网络基站、媒体播放器、导航设备、电子邮件设备、游戏控制中心、电子相框、数据卡等数据处理设备，或这些数据处理设备或其它数据处理设备中的任意两者或多者的组合。

所述终端设备100包括触敏显示器102。所述触敏显示器102可以是液晶显示器(LCD)技术、发光二极管(LPD)技术、碳纳米管显示器或某些其它显示器技术。触敏显示器102可以是对与用户的触摸和／或触觉接触敏感的集显示与触摸响应一体的设备。所述触敏显示器102可以包括多点触敏响应功能，所述多点触敏响应是指所述触敏显示器102可以处理多个同时的触摸点，包括处理与每个触摸点的压力、面积和／或位置有关的数据，这样的多点触摸功能便于利用多个手指的手势或动作与所述终端设备100进行交互。所述终端设备100可以在所述触敏显示器102上显示一个或多个图形化用户界面，以用于向用户提供对各种系统对象的访问以及用于向用户传达信息。所述图形用户界面可以包括一个或多个可选对象即显示对象。所述显示对象通过图像化的方式为用户提供启用某个功能的入口，所述可选对象包括设备功能、应用、窗口、文件、警报、事件或其它可识别的系统对象。

所述终端设备100可以实现多个设备功能，例如，电话设备、电子邮件设备、网络数据通信设备、Wi-Fi基站设备和媒体处理设备。在某些实现方式中，可以在一用户界面的菜单栏中显示具体的显示对象。在某些实现方式中，可以从顶层图形用户界面访问所述设备功能，比如通过触摸的方式调用与所述设备对应的功能。

在一些场景下，当所述终端设备100的某个设备功能被调用之后，所述终端设备100的图形用户界面改变，或者被扩大或用另一用户界面或用户界面元素取代，以辅助用户对与相对应的设备功能相关联的具体功能的访问和操作。例如，响应于用户触摸电话对象，触敏显示器102的图形用户界面可以呈现与各种电话功能有关的显示对象；同样，触摸电子邮件对象可以使得图形用户界面呈现与各种电子邮件功能有关的显示对象；触摸网络对象可以使得图形用户界面呈现与浏览网页功能有关的显示对象；而触摸媒体播放器对象可以使得图形用户界面呈现与各种媒体处理功能有关的显示对象。

在另一些场景下，图1的顶层图形用户界面环境或状态可以通过按压位于终端设备100底部附近的按钮120或者虚拟的Home键恢复。在另一些场景下，每个相对应的设备功能可以具有显示在触敏显示器102上的相对应的“主界面”显示对象，并且图1的图形用户界面环境可以通过按压“主界面”显示对象来恢复。在另一些场景下，所述终端设备100的顶层图形用户界面可以包括另外的显示对象106，例如，短消息服务(SMS)对象、日历对象、照片对象、相机对象、计算器对象、股票对象、天气对象、地图对象、笔记对象、时钟对象、地址薄对象和设置对象。触摸地图对象例如可以调用地图绘制和基于位置的服务环境和支持功能；同样，选择任意显示对象106可以调用相对应的对象环境和功能。请参阅图2，为图1中终端设备100的系统架构200，所述终端设备100的系统架构200可以包括存储器接口202、一个或多个数据处理器、图像处理器和／或中央处理单元204和外围接口206。所述存储器接口202、一个或多个处理器204和／或外围接口206可以是分离的组件或可以被集成到一个或多个集成电路中。所述系统架构200中的各个组件可以用一个或多个通信总线或信号线来连接。感测器、设备和子系统可以连接到外围接口206来辅助实现所述终端设备所具有的各种功能。例如，运动感测器210、光感测器212和位置感测器214可以连接到外围接口206来辅助实现终端设备关于运动感测功能、环境亮度感测功能以及位置感测等同能，也可以相互协作的完成特定的功能。其它辅助感测器216也可以连接到外围接口206，例如，定位系统(例如，GPS接收机)、温度感测器、生物特征计量感测器、气压感测器、海拔感测器，来辅助完成所述终端设备所具有的各种相关的功能。所述终端设备100的系统架构200中还包括相机子系统220，所述相机子系统220通过光感测器212如电荷耦合装置CCD或互补金属氧化物半导体CMOS光学感测器来辅助所述相机子系统来实现相应的图像获取功能。所述终端设备100的系统架构200中还包括无线通信子系统224，所述无线通信子系统224用以使所述终端设备具有无线通讯的功能，所述无线通信子系统224可以包括射频接收机和发射机和／或光学(例如，红外)接收机和发射机。所述终端设备100的系统架构200中还包括音频子系统226，所述音频子系统226，用来实现所述终端设备的声音拾取或者音频信号播放的功能，所述音频子系统226包括扬声器228和麦克风230来辅助实现上述的语音拾取及音频信号播放功能。具体的，麦克风230是一种将声音信号转换成电信号的能量转换器件，即由声音的振动传到麦克风的振膜上，推动麦克风里面的磁铁形成变化的电流，这种变化的电流传送到后面的声音处理电路进行放大处理；麦克风由此将空气中的变动压力波转化成变动电信号。所述终端设备100的系统架构中还包括I／O子系统240，所述I／O子系统240用以使所述终端设备100实现输入输出控制。所述I／O子系统240可以包括触摸屏控制器242和／或其它(一个或多个)输入控制器244。触摸屏控制器242可以连接到触摸屏246。触摸屏246和触摸屏控制器242可以使用多种触敏技术中的任一者来检测触摸以及触摸的移动或中断，所述触摸技术包括但不限于容性的、抗性的、红外的和表面声波技术，以及用于利用触摸屏246来实现确定一个或多个触摸点的其它接近感测阵列或其它元件。所述输入控制器244可以连接到其它输入／控制设备248，所述其他输入／控制设备248可以是一个或多个按钮、摇臂开关、拇指旋转开关、红外端口、USB端口和／或诸如铁笔之类的点选设备。此外，所述触摸屏246也可以用来呈现虚拟的按钮和／或键盘以实现对所述终端设备的输入控制。所述终端设备100的系统架构200的存储器接口202可以连接到存储器250。存储器250可以是高速随机存取存储器和／或非易失性存储器，例如一个或多个磁盘存储设备，一个或多个光学存储设备和／或闪存。存储器可以存储操作系统252，所述操作系统252可以包括用于处理基本系统服务和用于执行依赖硬件的任务的指令。所述存储器250还可存储多个可执行程序，所述可执行程序可以是音乐播放程序254、网络浏览程序256、图像处理程序258、语音通信程序260、短消息通信程序262、文件索引／查找程序264、图形化用户界面生成程序266，或者其他具有各种功能的应用程序。

以上，介绍了应用本发明的终端声控操作的方法的一种示例性的终端设备100以及所述终端设备的系统架构200。以下，将以依托上述示例性的终端设备100为基础来介绍本发明的具体实施例。

实施例一：

如图3所示，本发明实施例提供了一种终端声控操作的方法，包括如下步骤：

S301，启动所述终端设备上的应用程序，并激活所述终端设备上的麦克风；

用户通过按键、触模或者其它方式触发终端设备上应用程序，以使所述被启动的应用程序进入准备阶段，这里的应用程序可以是终端设备上拍照程序，录音程序，摄像程序，也可以是闹钟程序，还可以是一切其它可以由触发型控制指令操作的程序，即该应用程序一旦被启动就进入该程序的准备、预备模式并等待接下来的触发控制指令对其进行应用操作以改变其当前的操作状态。在具体的应用场景中，如前面所述的终端设备100，用户可以通过终端设备100的系统架构200上的触摸屏246或其他输入／控制设备248触发终端设备100上的应用程序，该应用程序可以是终端设备100的系统架构200上的外围接口206上所连接的相机220、或音频子系统226等。

为了方便用户的操作，本发明中采用通过监测麦克风所拾取信号的变化幅度、变化状况等来作为触发所述被启动且进入准备阶段的应用程序是否改变当前操作状态的依据。具体地，激活所述终端上的至少一个麦克风以使麦克风进入信号采集模式，即对环境中的音频信号进行采集，这里环境中的音频信号可是来自环境中的一切音频信号。

S302，监测所述被激活的麦克风的信号状态；

当终端设备中被启动的应用程序进入了声控操作模式时，即，此时所述终端设备中的麦克风被激活进入了信号采集模式，在该模式下所述麦克风作为声音环境监测设备来对环境声音进行监控，即通过对环境进行收音，拾取所述终端设备周围的环境声音状况，如果周围环境相对喧闹，则输出相对较高的环境声音监测结果，比如输出较高电压、电流水平、或者代表目前声音环境的数字信号，如果周围的环境相对安静，则输出相对较低的声音监测结果，比如输出较低电压、电流水平、或者代表目前声音环境的数字信号，或者在绝对安静的环境中，不输出任何的信号，或者仅输出电子噪声信号，以代表当前的所述麦克风所处环境的声音状况，所述麦克风是否输出的信号，或麦克风输出信号的幅度称之为麦克风的信号状态。可选的，所述麦克风的信号状态或会被直接存储在寄存器、或者存储器中，或者经过处理，比如平滑、降噪、均值后存储在寄存器或者存储器中。

S303，当所述麦克风的信号状态发生跳变时，则输出控制指令以改变所述应用程序当前的操作状态。

在获取麦克风的信号状态后，所述终端设备将对所述的麦克风的信号状态进行时实时的监测，并根据监测的结果来激活所述已经启动的所述应用程序的下一个执行动作。可选的，以S202步骤中获得的麦克风信号状态作为初始状态，并对这个初始状态进行实时监测，在现实的应用场景中，麦克风信号会随着用户操作和环境的变化而产生变化，这里我们以S102记录下来的麦克风信号状态作为基础，监测麦克风采集到的音频信号是否在该基础上发生变化，并对所发生的变化进行处理得到麦克风新的状态，由于环境噪音是不可控的，因此麦克风在变化的环境中采集的音频信号大小也是不可控的，因此需要对其进行处理才能读取麦克风实时的信号状态，这里的处理可以由很多种方法来实现，处理的结果是使复杂的环境噪音可以由系统识别和读取出来，例如，设定预设门限值对复杂的环境音频信号进行简单划分从而使得这样的经过划分后的变化可以由系统识别和读取；作为一种可选的实施方式，可以通过预设门限值在初始状态的基础上对麦克风的信号状态进行划分，监测发现麦克风信号状态在初始状态的基础上经变化跨过了该预设门限值，则读取其为一次状态跳变，可选的，这里的预设门限值可以根据环境噪音的状况自行进行调节，如果环境比较安静这个阈值可以设置的比较小，如果环境比较喧闹这个阈值可以设置的比较大，这样使得对麦克风的监测可以在不同环境状况下都有较好的读取能力，这种读取能力使得终端对麦克风信号状态的变化都可以准确的进行读取，终端在读取到麦克风信号状态变化后则输出触发控制指令对上述开启的应用程序进行应用操作以改变其当前的操作状态，从而完成利用终端上麦克风对终端设备上应用功能的操作。

本发明实施例提供了一种终端声控操作的方法，通过启动终端设备上的应用程序并激活终端设备上的麦克风，利用麦克风采集的音频信号以及对信号状态进行监测从而判断是否输出控制指令对所述应用程序进行操作；本发明实施例利用麦克风拾取环境噪音的变化对终端应用程序进行操作，避免了环境噪音对音频信号的获取造成干扰，并减少了用户按键操作带来的麻烦。

具体地，如步骤S301所述，启动终端设备上的应用程序，并激活所述终端设备上的麦克风中，麦克风的激活可以是在启动了终端设备上的应用程序的同时触发激活从而使得终端进入声控操作模式，也可以在启动了终端设备上的应用程序之后的一段时间后才触发激活麦克风，还可以由用户手动的触发使得麦克风被激活。从而使终端进入声控操作模式；可选的，在启动应用程序之后预留一段时间再进入麦克风的声控操作模式有利于用户在操作前有足够的时间做准备动作，使得用户对终端设备的操作便捷灵活。具体地，激活所述终端上的至少一个麦克风以使麦克风进入信号采集模式，即对环境中的音频信号进行采集，这里环境中的音频信号可是来自环境中的一切音频信号。

如步骤S302所述、监测所述被激活的麦克风的信号状态；具体包括：

通过所述被激活的麦克风采集音频信号，并计算所述音频信号的能量值；

判断所述能量值是否大于或等于预设门限值；当判断结果为是时，则所述麦克风信号状态为第一状态；当判断结果为否时，则所述麦克风信号状态为第二状态。

如步骤S303所述、当所述麦克风的信号状态发生跳变时，则输出控制指令以改变所述应用程序当前的操作状态，具体包括：

当终端设备中被启动的应用程序进入了声控操作模式时，此时所述终端设备中的麦克风被激活进入了信号采集模式，该终端设备进入了声控操作模式，在该模式下所述麦克风作为声音环境监测设备来对环境声音进行监控，即通过对环境进行收音，拾取所述终端设备周围的环境声音状况，如果周围环境相对喧闹，则输出相对较高的环境声音监测结果，比如输出较高电压、电流水平、或者代表目前声音环境的数字信号，如果周围的环境相对安静，则输出相对较低的声音监测结果，比如输出较低电压、电流水平、或者代表目前声音环境的数字信号，或者在绝对安静的环境中，不输出任何的信号，或者仅输出电子噪声信号，以代表当前的所述麦克风所处环境的声音状况，所述麦克风是否输出的信号，或麦克风输出信号的幅度称之为麦克风的信号状态，作为一种可选的实施方式，本发明实施例将复杂多变的麦克风信号状态根据预设门限值进行简单划分，使得经过划分后的信号状态可以由系统识别和读取出来，可选的，该预设门限值可以根据环境噪音情况进行调节；在终端获取麦克风的信号状态后，所述终端设备将对所述的麦克风的信号状态进行时实时的监测，并根据监测的结果来激活所述已经启动的所述应用程序的下一个执行动作。可选的，以初始的麦克风信号状态为例，大于或等于上述预设门限值的为第一状态，小于上述预设门限值的为第二状态，具体的，进行这样的状态划分一方面是为了让根据复杂的环境噪音输出的麦克风信号状态可以被系统识别并读取，另一方面是为了直观的体现麦克风所处环境的噪音水平的高低，举例来说，如果所述麦克风信号状态处于第一状态则认为当前噪音水平较高，如果所述麦克风信号状态处于第二状态则认为当前噪音水平较低。可选的，该获取的麦克风的初始信号状态或会被直接存储在寄存器、或者存储器中，或者经过处理，比如平滑、降噪、均值后存储在寄存器或者存储器中。获取麦克风信号状态之后对麦克风信号状态进行实时监测，一旦发现麦克风信号状态的变化跨过了预设门限值，即从较高噪音水平的第一状态跳变为较低噪音水平的第二状态，或，从较低噪音水平的第二状态跳变为较高噪音水平的第一状态；具体来说是指：所述麦克风信号状态原本高于所述的预设门限，发生跳变之后，所述麦克风信号状态低于所述预设门限值，或者，所述麦克风信号状态原本低于所述的预设门限，发生跳变之后，所述麦克风信号状态高于所述预设门限值；上述状态跳变一旦被终端监测到，则终端输出触发控制指令对所述开启的应用程序进行应用操作以改变其当前的操作状态，从而完成利用终端上麦克风对终端设备上应用功能的操作。在现实的应用场景中，这种状态的跳变可以根据用户对终端设备麦克风的控制来实现，例如，终端读取的初始的麦克风信号状态为噪音水平较低的第二状态时，可能是由于用户堵住了该麦克风，使得该声音拾取通道为闭合状态；或者终端读取的初始的麦克风信号状态为噪音水平较高的第二状态时，可能是由于用户没有堵住该麦克风，使得该声音拾取通道为打开状态；可选的，在现实的应用场景下，麦克风信号状态的跳变也可以由多种原因带来，如原先闭合的声音拾取通道现在被打开了，则麦克风信号状态从第二状态跳变到第一状态，或，原先打开的声音拾取通道现在被闭合了，则麦克风信号状态从第一状态跳变到第二状态，或，环境噪音突然发生很大的变化，该变化可以为骤降或者骤升，使得麦克风信号状态发生状态跳变。

进一步可选的，在具体的实现过程中，计算所述麦克风采集的音频信号特征值具体为：所述计算的是信号的能量值，或，所述计算的是信号的幅度值，或，所述计算的是信号能量的波动值，或，所述计算的是信号幅度的波动值；所述计算得到的音频信号值用来反应麦克风的信号状态。

本发明实施例提供了一种终端声控操作的方法，利用麦克风采集的音频信号以及对信号状态进行监测从而判断是否输出控制指令对所述应用程序进行操作；本发明实施例利用麦克风拾取环境噪音的变化对终端应用程序进行操作，避免了环境噪音对音频信号的获取造成干扰，并减少了用户按键操作带来的麻烦。

在上述任意一个发明实施例的基础上，本发明实施例提供又一种终端声控操作的方法。

在上述任意一个发明实施例的基础上，进一步的，本发明实施例中所述麦克风为多个；

在这种情况下，多个麦克风形成麦克风阵列，当激活的为多个麦克风时，则监测的为由该多个被激活的麦克风形成的麦克风阵列的信号状态，当其中至少一个麦克风信号状态发生跳变时输出控制指令对所述应用程序进行操作，可选的，还可以是当其中至少两个麦克风信号状态发生跳变时输出控制指令对所述应用程序进行操作。

在本发明实施例中，当终端设备上有多个麦克风形成麦克风阵列时，监测麦克风阵列的信号状态，其中至少两个麦克风信号状态发生跳变时输出控制指令，相对于由一个麦克风信号状态的跳变决定输出指令，本发明实施例由至少两个麦克风信号状态的跳变决定输出指令，有利于操作的准确性，避免了用户操作过程中的单手操作失误造成的触发操作。

进一步可选的，本发明实施例中当至少两个麦克风初始信号的状态发生跳变的情况下，可选的，该至少两个麦克风可以同时发生跳变，也可以间隔预设时长发生跳变。预设时长依据实践中的经验值取得，设置所述时间间隔的目的在于提供设备的容错能力，因为通常设备的麦克风会设置在终端设备的不同位置，如果声源的位置离某个麦克风比较近，离其他的比较远的情况下，那么麦克风信号状态发生跳变的时间则会不同，虽然间隔很短，但是如果不设置的话，在终端设备较为灵敏的情况下，就可能出现设备无法准确的执行控制指令的情况，因此设置所述间隔时间，在间隔时间内先后发生的麦克风信号状态的跳变认为是同时／同一次跳变，如此便可提高设备容错能力，便于使用。

在上述实施例带来的技术效果的基础上，多个麦克风信号状态可以同时发生跳变也可以间隔预设时长发生跳变来触发控制指令的输出，有利于用户在操作过程中的便捷多样性，进一步增强了用户体验。

进一步可选的，本发明实施例中当监测到所述麦克风信号状态发生跳变时发出提示信息提示t秒之后将输出控制指令，所述提示信息可以为语音提示，或者震动提示，或者文字提示，或者灯光提示，或其他任何可以用来提示用户的方式对用户进行提醒，其中t为经验值。

在上述实施例带来的技术效果的基础上，增加提示信息能让用户更清楚终端的操作发出时间，避免了由于用户操作失误带来的控制指令触发，使得用户对终端设备的操作更加便捷灵活，进一步增强了用户体验。

在上述任意一个实施例的基础上，作为一种可选的实施方式，所述技术方案还可以包括如下方法：

如步骤S302所述的：监测所述被激活的麦克风的信号状态的方法中，包括通过所述被激活的麦克风采集音频信号，并计算所述音频信号特征值，由于所述的音频信号特征值具体可以为：所述计算的是信号的能量值，或，所述计算的是信号的幅度值，或，所述计算的是信号能量的波动值，或，所述计算的是信号幅度的波动值；可选的，在本发明实施例中，所述计算的所述音频信号特征值为信号能量值。

本发明实施例中仍选择以终端设备上的拍照应用程序为例进行具体说明，即用户启动终端设备拍照功能，该启动动作触发终端设备麦克风进入信号采集模式从而进行音频信号的采集，并计算该音频信号的信号能量值，从而判断该麦克风的信号状态并记录下该麦克风信号状态，此时终端设备的摄像头处于拍照准备状态，等待系统发出按快门进行拍照操作的控制指令。

当通过被激活的麦克风采集到音频信号后，本发明实施例选择对麦克风采集的音频信号的信号能量值E_i(n)进行计算，具体通过如下公式进行：

E_{i} (n) = 10 * \log_{10} Σ_{k = 1}^{k = K} x_{k}^{2}

其中n表示麦克风的序列号，i表示系统进行信号分析的分析帧序号，所述分析帧的长度可以根据经验设定，即根据经验每隔多长时间对信号能量的能量值进行一次计算得到该信号能量E_i(n)的能量值。其中k表示分析帧内采集的信号样点的序号(1≤k≤K)，这里K可以取值320，x_k表示第k个样点的幅度值。

将计算得到的信号能量的能量值E_i(n)与预设门限值T1进行比较判断，当E_i(n)≥T1，判断所述麦克风为第一状态；当E_i(n)<T1，判断所述麦克风为第二状态，将判断得到的麦克风初始信号的状态记录并存储下来。

相应地，如步骤S303所述，当所述麦克风的信号状态发生跳变时，则输出控制指令以改变所述应用程序当前的操作状态具体为：

对所述记录的麦克风信号状态进行监测，可选的，所述麦克风可以为一个，也可以为多个，当麦克风数量为多个时，激活该多个麦克风中的至少两个麦克风，该至少两个麦克风形成麦克风阵列，监测该至少两个麦克风的麦克风信号状态，当至少一个或者至少两个麦克风信号状态发生跳变时，输出控制指令对所述拍照应用程序进行快门操作。在具体的实现过程中，跳变是否发生以预设门限值T1为门槛，一旦信号能量的能量值变化之后跨过了预设门限值T1则视为一次跳变的发生，具体的：在对麦克风信号状态进行监控的过程中，通过麦克风采集到的信号能量的能量值可能会发生变化，这个变化若发生在预设门限值以内，即信号能量值大于或等于预设门限值的，变化之后仍然大于或等于预设门限值，或，信号能量值小于预设门限值的，变化之后仍然小于预设门限值，则状态不发生跳变；但当该信号能量值原本高于所述的预设门限，发生跳变之后低于所述预设门限值，或者，该信号能量值原本低于所述的预设门限，发生跳变之后高于所述预设门限值则，则视为发生状态跳变，系统监控检测到该状态跳变则输出触发快门的控制指令对拍照应用程序进行拍照操作，从而完成利用麦克风对终端设备上的拍照功能进行操作。

本发明实施例利用麦克风拾取的环境噪音的音频信号的信号能量值的变化触发对应用程序的操作，避开了环境噪音干扰的同时还充分利用了环境噪音对终端应用程序进行操作，减少了用户按键操作带来的麻烦，使得对终端设备的操作更加便捷灵活。

在上述任意一个实施例的基础上，作为另一种可选的实施方式，所述技术方案还可以包括如下方法：

如步骤S302所述的：监测所述被激活的麦克风的信号状态的方法中，包括通过所述被激活的麦克风采集音频信号，并计算所述音频信号特征值，由于所述的音频信号特征值具体可以为：所述计算的是信号的能量值，或，所述计算的是信号的幅度值，或，所述计算的是信号能量的波动值，或，所述计算的是信号幅度的波动值；可选的，在本发明实施例中，所述计算的所述音频信号特征值为信号能量的波动值。

和上面一种实施方式一样，在本实施方式中仍选择以终端设备上的拍照应用程序为例进行具体说明，即用户启动终端设备拍照功能，该启动动作触发终端设备麦克风进入信号采集模式从而进行音频信号的采集，并计算该音频信号的信号能量值，从而判断该麦克风的信号状态并记录下该麦克风信号状态，此时终端设备的摄像头处于拍照准备状态，等待系统发出按快门进行拍照操作的控制指令。

当通过被激活的麦克风采集到音频信号后，本发明实施例选择对麦克风采集的音频信号的信号能量的波动值flux_E_i(n)进行计算，具体通过如下步骤进行：

第一步，对麦克风采集的音频信号的信号能量值E_i(n)进行计算，具体通过如下公式进行：

E_{i} (n) = 10 * \log_{10} Σ_{k = 1}^{k = K} x_{k}^{2}

第二步，计算信号能量的滑动平均值mov_E_i(n)，其中α为更新系数，且0<α<1，可选的，本发明实施例可以取α=0.97：

mov_E_i(n)=α*mov_E_i-1(n)+(1-α)*E_i(n)

其中，mov_E_i(n)第一次计算时可以初始化E_i(n)，i=1。

第三步，计算信号能量的波动值：

flux_E_i(n)=E_i(n)-mov_E_i(n)

将计算得到的信号能量的能量值与预设门限值T2进行比较判断，当，判断所述麦克风为第一状态；当，判断所述麦克风为第二状态，将判断得到的麦克风初始信号的状态记录并存储下来。接下来的步骤与上一种实施方式中对应步骤103的相应步骤相似，不再赘述。

本发明实施例利用麦克风拾取的环境噪音的音频信号的信号能量波动值的变化触发对应用程序的操作，避开了环境噪音干扰的同时还充分利用了环境噪音对终端应用程序进行操作，减少了用户按键操作带来的麻烦，使得对终端设备的操作更加便捷灵活。

实施例二

如图4所示，本发明实施例提供了一种终端声控操作装置，该装置包括：麦克风，以及：

启动单元401，用于启动所述终端设备上的应用程序，并激活所述终端设备上的麦克风；

监测单元403，用于监测所述被激活的麦克风的信号状态；

操作单元405，用于当所述麦克风的信号状态发生跳变时，则输出控制指令以改变所述应用程序当前的操作状态。

具体的，在本发明实施例中，用户通过按键、触模或者其它方式触发终端设备上应用程序，以使所述被启动的应用程序进入准备阶段，这里的应用程序可以是终端设备上拍照程序，录音程序，摄像程序，也可以是闹钟程序，还可以是一切其它可以由触发型控制指令操作的程序，即该应用程序一旦被启动就进入该程序的准备、预备模式并等待接下来的触发控制指令对其进行应用操作以改变其当前的操作状态。在具体的应用场景中，如前面所述的终端设备100，用户可以通过终端设备100的系统架构200上的触摸屏246或其他输入／控制设备248触发终端设备100上的应用程序，该应用程序可以是终端设备100的系统架构200上的外围接口206上所连接的相机220、或音频子系统226等。

为了方便用户的操作，本发明实施例通过所述监测单元监测麦克风所拾取信号的变化幅度或其他的变化状况来作为触发使操作单元输出指令对所述被启动且进入准备阶段的应用程序进行操作。具体地，所述启动单元401激活所述终端上的至少一个麦克风以使麦克风进入信号采集模式，即对环境中的音频信号进行采集，这里环境中的音频信号可是来自环境中的一切音频信号。

具体的，请参阅图5，所述监测单元403可以包括：

采集子单元4031，用于通过所述被激活的麦克风采集音频信号；

计算子单元4033，用于计算所述采集的音频信号特征值；

判断子单元4035，用于判断所述音频信号特征值是否大于或等于预设门限值；当判断结果为是时，则所述麦克风信号状态为第一状态；当判断结果为否时，则所述麦克风信号状态为第二状态；

对应，所述操作单元405，具体用于当所述麦克风信号状态由第一状态跳变为第二状态时输出控制指令以改变所述应用程序当前的操作状态；或，

具体用于当所述麦克风信号状态由第二状态跳变为第一状态时输出控制指令以改变所述应用程序当前的操作状态。

即当启动单元启动应用程序使所述终端进入了声控操作模式，激活单元将麦克风激活使其进入了信号采集模式，在该模式下所述麦克风作为声音环境监测设备来对环境声音进行监控，即通过采集子单元对环境进行收音，拾取所述终端设备周围的环境声音状况，如果周围环境相对喧闹，则输出相对较高的环境声音监测结果，比如输出较高电压、电流水平、或者代表目前声音环境的数字信号，如果周围的环境相对安静，则输出相对较低的声音监测结果，比如输出较低电压、电流水平、或者代表目前声音环境的数字信号，或者在绝对安静的环境中，不输出任何的信号，或者仅输出电子噪声信号，以代表当前的所述麦克风所处环境的声音状况，所述麦克风是否输出的信号，或麦克风输出信号的幅度称之为麦克风的信号状态，在本发明实施例中，所述判断子单元将复杂多变的麦克风信号状态根据预设门限值进行简单划分，即判断所述音频信号特征值是否大于或等于预设门限值，当判断结果为是时，则所述麦克风信号状态为第一状态；当判断结果为否时，则所述麦克风信号状态为第二状态，使得经过判断划分后的信号状态可以由系统识别和读取出来。可选的，该判断子单元中所取的预设门限值可以根据环境噪音情况进行调节；在终端获取麦克风的信号状态后，所述监测单元对所述的麦克风的信号状态进行时实时的监测，并根据监测的结果来触发操作单元进行相应操作。其中将复杂多变的麦克风信号状态根据预设门限值进行简单划分具体的，进行这样的状态划分一方面是为了让根据复杂的环境噪音输出的麦克风信号状态可以被系统识别并读取，另一方面是为了直观的体现麦克风所处环境的噪音水平的高低，举例来说，如果所述麦克风信号状态处于第一状态则认为当前噪音水平较高，如果所述麦克风信号状态处于第二状态则认为当前噪音水平较低。可选的，该获取的麦克风的初始信号状态或会被直接存储在寄存器、或者存储器中，或者经过处理，比如平滑、降噪、均值后存储在寄存器或者存储器中。获取麦克风信号状态之后监测单元对麦克风信号状态进行实时监测，一旦发现麦克风信号状态的变化跨过了预设门限值，即从较高噪音水平的第一状态跳变为较低噪音水平的第二状态，或，从较低噪音水平的第二状态跳变为较高噪音水平的第一状态；具体来说是指：所述麦克风信号状态原本高于所述的预设门限，发生跳变之后，所述麦克风信号状态低于所述预设门限值，或者，所述麦克风信号状态原本低于所述的预设门限，发生跳变之后，所述麦克风信号状态高于所述预设门限值；上述状态跳变一旦被终端监测到，则操作单元输出触发控制指令对所述开启的应用程序进行应用操作以改变其当前的操作状态，从而完成利用终端上麦克风对终端设备上应用功能的操作。在现实的应用场景中，这种状态的跳变可以根据用户对终端设备麦克风的控制来实现，例如，终端读取的初始的麦克风信号状态为噪音水平较低的第二状态时，可能是由于用户堵住了该麦克风，使得该声音拾取通道为闭合状态；或者终端读取的初始的麦克风信号状态为噪音水平较高的第二状态时，可能是由于用户没有堵住该麦克风，使得该声音拾取通道为打开状态；可选的，在现实的应用场景下，麦克风信号状态的跳变也可以由多种原因带来，如原先闭合的声音拾取通道现在被打开了，则麦克风信号状态从第二状态跳变到第一状态，或，原先打开的声音拾取通道现在被闭合了，则麦克风信号状态从第一状态跳变到第二状态，或，环境噪音突然发生很大的变化，该变化可以为骤降或者骤升，使得麦克风信号状态发生状态跳变。

具体的，请参阅图6，所述计算子单元4033可以包括：

能量计算子单元4033a，用于计算音频信号的信号能量值；或，

幅度计算子单元4033b，用于计算音频信号的信号幅度值；或，

能量波动计算子单元4033c，用于计算音频信号的信号能量的波动值；或，

幅度波动计算子单元4033d，用于计算音频信号的信号幅度的波动值。

由于在具体的实现过程中，计算所述麦克风采集的音频信号特征值可以为：所述计算的是信号的能量值，或，所述计算的是信号的幅度值，或，所述计算的是信号能量的波动值，或，所述计算的是信号幅度的波动值；所以相应的计算子单元对相应的音频信号特征值进行计算。

可选的，所述激活子单元，用于当所述的麦克风为多个时激活所述终端设备上的多个麦克风中的至少两个麦克风；相应地，所述监测单元还用于监测所述被激活的至少两个麦克风的麦克风信号状态；相应地，所述操作单元，用于当所述被激活的至少两个麦克风的麦克风信号状态中的至少两个信号状态发生跳变，则输出控制指令以改变所述应用程序当前的操作状态。

可选的，所述操作单元，还用于当所述被激活的至少两个麦克风的麦克风信号状态中的至少两个信号状态在预定的时间间隔内发生跳变，则输出控制指令以改变所述应用程序当前的操作状态。

可选的，所述操作单元，还用于当所述麦克风的信号状态发生跳变时，进行计时，并在计时至预设的时间段t时输出控制指令以改变所述应用程序当前的操作状态。

在上述实施例的基础上，请参阅图7，所述装置还可以包括：提示单元407，用于当所述麦克风信号状态发生跳变时，发出提示信息提示经过所述时间段t之后将输出控制指令，其中，所述提示信息为语音提示，或者震动提示，或者文字提示，或者灯光提示。

在上述实施例的基础上，可选的，所述激活子单元，还用于当启动单元启动所述终端设备上的应用程序后，经过预设时间激活所述终端设备上的麦克风。

本发明实施例利用麦克风拾取环境噪音的变化对终端应用程序进行操作，避免了环境噪音对音频信号的获取造成干扰，并减少了用户按键操作带来的麻烦。此外，当终端设备上有多个麦克风时，由至少两个麦克风信号状态的跳变决定输出指令，有利于操作的准确性，避免了用户操作过程中的单手操作失误造成的触发操作。并且，由于多个麦克风信号状态可以同时发生跳变也可以间隔预设时长发生跳变来触发控制指令的输出，有利于用户在操作过程中的便捷多样性，进一步增强了用户体验。

Claims

1.一种终端声控操作方法，其特征在于：

监测所述被激活的麦克风的信号状态；

2.根据权利要求1所述的方法，其特征在于，所述监测所述被激活的麦克风的信号状态，具体为：

3.根据权利要求2所述的方法，其特征在于，所述计算所述音频信号特征值包括：计算音频信号的信号能量值，或，信号幅度值，或，信号能量的波动值，或，信号幅度的波动值。

4.根据权利要求1至3所述的任意一种方法，其特征在于，所述麦克风为多个：

5.根据权利要求4所述的方法，其特征在于，所述监测所述被激活的麦克风的信号状态具体包括：

监测所述被激活的至少两个麦克风的麦克风信号状态；

6.根据权利要求5所述的方法，其特征在于，所述当所述被激活的至少两个麦克风的麦克风信号状态中的至少两个信号状态发生跳变，则输出控制指令以改变所述应用程序当前的操作状态具体包括：

7.根据权利要求1至6所述的任意一种方法，其特征在于，当所述麦克风的信号状态发生跳变时，则输出控制指令以改变所述应用程序当前的操作状态具体包括：

8.根据权利要求1至7所述的任意一种方法，其特征在于，所述方法还包括：

9.根据权利要求1至8所述的任意一种方法，其特征在于，所述启动所述终端设备上的应用程序，并激活所述终端设备上的麦克风，具体包括：启动所述终端设备上的应用程序，并经过预设时间激活所述终端设备上的麦克风。

10.一种终端，包括麦克风，其特征在于：

启动单元，用于启动所述终端设备上的应用程序，并激活所述终端设备上的麦克风；

监测单元，用于监测所述被激活的麦克风的信号状态；

11.根据权利要求10所述的装置，其特征在于，所述监测单元包括：

采集子单元，用于通过所述被激活的麦克风采集音频信号；

计算子单元，用于计算所述采集的音频信号特征值；

对应，所述操作单元用于当所述麦克风信号状态由第一状态跳变为第二状态时输出控制指令以改变所述应用程序当前的操作状态；或，

12.根据权利要求11所述的装置，其特征在于，所述计算子单元包括：

能量计算子单元，用于计算音频信号的信号能量值；或，

幅度计算子单元，用于计算音频信号的信号幅度值；或，

13.根据权利要求10至12所述的任意一种装置，其特征在于，所述麦克风为多个：

对应地，所述启动单元包括：

14.根据权利要求13所述的装置，其特征在于，所述监测单元，用于监测所述被激活的至少两个麦克风的麦克风信号状态；

15.根据权利要求14所述的装置，其特征在于，所述操作单元，还用于当所述被激活的至少两个麦克风的麦克风信号状态中的至少两个信号状态在预定的时间间隔内发生跳变，则输出控制指令以改变所述应用程序当前的操作状态。

16.根据权利要求10至15所述的任意一种装置，其特征在于，所述操作单元，还用于当所述麦克风的信号状态发生跳变时，进行计时，并在计时至预设的时间段t时输出控制指令以改变所述应用程序当前的操作状态。

17.根据权利要求10至16所述的任意一种装置，其特征在于，所述装置还包括：

18.根据权利要求10至17所述的任意一种装置，其特征在于，所述激活子单元，还用于所述终端设备上的应用程序被启动后，经过预设时间激活所述终端设备上的麦克风。