发明内容
本发明的目的是提供一种移动终端及移动终端控制方法,实现吹气控制的功能且具有较高准确度和可靠性。
本发明的另一目的是提供一种吹气控制移动终端,从环境噪音中准确识别吹气声音信号。
本发明的另一目的是提供一种具有较高准确度和可靠性的吹气控制移动终端。
本发明的另一目的是提供一种使用便利的人机互动方式。
本发明的另一目的是提供一种吹气控制移动终端的吹气控制的准确性和可靠性。
本发明的另一目的是提供一种准确的吹气信号识别方法。
本发明的另一目的是滤除吹气控制中的噪音或干扰信号,对吹气信号进行准确识别。
本发明的另一目的是提供一种移动终端控制方法,利用吹气行为控制移动终端的运行。
本发明提供一种移动终端,包括:声音采集模块,噪音处理模块,信号识别模块,系统控制模块;所述声音采集模块采集声音信号并输出至噪音处理模块;所述噪音处理模块对所述声音信号进行处理后输出至信号识别模块;所述信号识别模块根据预置吹气信号特征对经过所述噪音处理模块处理后的声音信号进行识别,符合所述预置吹气信号特征时向系统控制模块发出控制指令。
优选地,所述声音采集模块包括背景音采集模块和吹气音采集模块,所述噪音处理模块包括信号反向叠加模块,所述信号反向叠加模块接收所述背景音采集模块和吹气音采集模块输出的信号并进行反向叠加以滤除噪音。
优选地,所述噪音处理模块包括信号预处理模块,所述信号预处理模块接收所述反向叠加模块输出的信号并采用异点剔除法、零均值变换法、算术平均值法、中位值法、加权平均值法其中之一或者其组合对接收到的信号进行预处理。
优选地,所述信号识别模块包括吹气信号特征模块,声音特征解析模块和声音特征比对模块;所述吹气信号特征模块中预置吹气信号特征;所述声音特征解析模块接收噪音处理模块输出的信号并解析出声音特征;所述声音特征比对模块将所述声音特征与所述吹气信号特征进行对比,以确定是否符合所述预置吹气信号特征。
优选地,所述吹气信号特征包括吹气声音时域参数,幅域参数或频域参数中的一种或者其组合;所述声音特征解析模块解析出时域参数,幅域参数或频域参数中的之一或其组合。
优选地,所述时域参数包括周期,概率或概率密度中之一种或其组合。
优选地,所述幅域参数包括均值、均方值或均方差中之一或其组合。
优选地,所述频域参数包括单一谐波分量、信号频率结构、各谐波幅值或相位中之一或其组合。
优选地,所述信号识别模块包括声纹特征模块,声纹特征解析模块和声纹特征比对模块;所述声纹特征模块中预置声纹信号特征,所述声纹信号解析模块接收噪音处理模块输出的信号并解析出声纹特征;所述声纹特征比对模块将所述声纹特征与所述声纹信号特征进行对比,以确定是否符合所述预置声纹信号特征。
优选地,所述声纹信号特征为可量化的声纹识别参数,所述声纹信号解析模块接收噪音处理模块输出的信号并解析出可量化的声纹特征参数。
优选地,所述可量化的声纹识别参数或声纹特征参数包括基频,共振峰,即时功率谱,音强,音长,频率倒谱系数,频率或振幅中的一种或其组合。
优选地,所述吹气音采集模块为电话语音话筒,背景音采集模块为麦克风,且设置于电话语音话筒所在面的相对面或移动终端设有显示屏的一面的相对面。
优选地,所述移动终端接到吹气控制信号后根据当前运行状态运行下一步指令。
本发明提供一种移动终端的控制方法,包括如下步骤:
接收吹气音信号和背景音信号;
对接收到的吹气音信号和背景音信号进行滤除噪音,得到声音信号;
解析出所述声音信号得到声音信号特征并与预置吹气信号特征进行比对;
判断所述声音信号特征与所述预置吹气信号特征是否符合;若符合,则根据移动终端当前状态运行下一步指令。
优选地,还包括如下步骤:将所述吹气音信号和背景音信号进行反向叠加。
优选地,还包括如下步骤:采用异点剔除、零均值变换、算术平均、取中位值法或取加权平均值其中之一或者其组合对所述吹气音信号和背景音信号反向叠加后的信号进行去噪处理得到声音信号。
优选地,还包括如下步骤:
解析所述声音信号的时域参数、频域参数、幅域参数其中之一或其组合,并判断所述时域参数、频域参数、或幅域参数其中之一或其组合与所述预置信号特征是否一致。
本发明提供的移动终端和控制方法,对吹气信号进行采集,去噪,识别并用以控制移动终端,提供了一种新型的人机交互方式,且大大提高了吹气控制移动终端的可靠性,准确性和稳定性。可以大大提升人机交互方式的便捷性,提升了用户体验。
具体实施方式
下文将结合附图详细描述本发明的当前实施例。其中相同的标号代表相同的对象。下文参照附图描述实施例来解释本发明。本发明中提及的吹气,指的是从使用者口中吹出的气流。
图1示出了本发明的移动终端的第一个实施例的结构框图。本发明的移动终端包括:声音采集模块101,噪音处理模块102,信号识别模块103,系统控制模块104。
其中,本实施例所称的移动终端,包括但不限于智能手机,数码相机,PDA,平板电脑,MP3,MP4,小型掌上电脑等电子装置。
所述声音采集模块101采集声音信号并输出至噪音处理模块;其中,声音采集模块101采用移动终端上常设的语音话筒装置或者可以采用单独设立在移动终端上的麦克风,用以把声音信息转换为电信号输出至移动终端的系统控制模块104。现有移动终端一般是在拨打电话或者启动录音功能或录像功能时,开启语音话筒并采集环境中的声音,在待机的情况下,不采集环境中的声音。在本实施例中,所述声音采集模块101设置为间断或者不间断地采集环境中的声音或声音信号。
一般情况下,环境中总是会存在噪音。本实施例中的移动终端的吹气控制有几种模式:第一种为使用者的嘴巴近距离对着声音采集模块101吹气,从使用者口喷出的气流直接进入声音采集模块101造成麦克风震膜的剧烈震动,产生远高于环境噪音的信号,此时所产生的信号包含环境噪音信号,但环境噪音可以忽略不计。采用此种吹气控制模式,相应的传感电路设计和吹气行为识别方法比较简单,但是使用者在操作时必须使嘴巴近距离地靠近移动终端,操作会不太便利。第二种为使用者的嘴巴对着移动终端进行吹气,在此情形下,环境中的空气震动,以及从使用者的嘴巴喷出的气流带动的移动终端周围的空气的震动,造成麦克风的震膜震动,此时会产生中等强度并混合了环境噪音的信号,环境噪音也即背景音需要过滤。第三种模式为使用者的嘴巴在移动终端附近吹气,但从使用者口中喷出的气流不对着移动终端。此时移动终端周围空气的震动带动麦克风震膜的震动,产生包括使用者吹气气流和背景噪音混合后的声音信号。此时背景音(环境噪音)需要过滤。采用后两种吹气控制模式,相应的传感电路设计和吹气行为识别方法有一定的难度,但是使用者使用这种吹气控制模式比较便利,也会有较好的用户体验。
在本实施例中,对前述三种吹气控制模式下的任意一种模式下的吹气声音进行采集和识别。其中,本实施例的移动终端包括噪音处理模块102,所述噪音处理模块102对所述声音采集模块101采集到的声音信号进行处理,滤除背景音即环境噪音,并输出至信号识别模块103;所述信号识别模块103根据预置吹气信号特征对经过所述噪音处理模块102处理后的声音信号进行识别。其中,所述的预置吹气信号特征包括前述三种吹气控制模式下的吹气信号特征,即分别对三种吹气模式分别进行试验,并提取三组声音信号的频率范围,振幅范围和时域范围作为预置信号特征:第一组:模拟使用者手持移动终端,嘴巴以0~15cm的距离正对着声音采集模块101吹气所产生的声音信号的特征参数范围;第二组:模拟使用者手持移动终端,嘴巴以10cm~50cm的距离对着移动终端吹气所产生的声音信号的特征参数范围;第三组:模拟使用者手持移动终端,嘴巴以10cm~50cm的距离在移动终端附近但不对着移动终端吹气所产生的声音信号的特征参数范围。所述特征参数范围包括频率范围,振幅范围和时域范围中的其中之一或其组合。
所述信号识别模块103对经过所述噪音处理模块102处理后的声音信号进行解析,解析出声音信号的声音参数范围,并与预置的吹气信号特征进行比对;当所述声音参数范围符合任一组预置信号特征时,即确认为使用者有吹气控制行为。此时,信号识别模块103向系统控制模块104发出控制指令,移动终端根据当前运行状态运行下一步指令。例如,移动终端在待机状态收到电话呼叫,此时如果信号识别模块103确认有吹气控制行为并向系统控制模块104发出下一步指令,则移动终端启动接听电话功能。如果移动终端当前是锁屏状态,则运行解锁功能,如果移动终端当前状态是节目播放状态,则暂停或关闭节目播放状态。另外,信号识别模块103可以根据吹气信号时间的长短组合设定控制指令,例如,如果确认收到的声音信号为长时吹气信号,则向系统控制模块104发出关机的指令。
图2示出本发明的移动终端第二个实施例的结构框图。本实施例的移动终端结构框图与第一个实施例在基本设置上大体相同,其主要区别在于,本实施例中的移动终端包括背景音采集模块2011和吹气音采集模块2012和信号反响叠加模块2021。所述背景音采集模块2011和吹气音采集模块2012可以采用移动终端上的语言话筒或麦克风。所述背景音采集模块2011采集环境声音信号,吹气音采集模块2012采集叠加了环境声音的吹气音信号,所述信号反向叠加模块2021通过反向叠加背景音采集模块2011和吹气音采集模块2012所采集到的声音信号,从而得到吹气行为所产生的吹气声音信号。
优选地,所述背景音采集模块2011设置在不易被吹气气流波及的地方。例如,图2a示出本发明的移动终端10的正视图,图2b示出本发明的移动终端10的侧视图。其中,吹气音采集模块2012可以设置于显示屏11所在的那一面的下方。应当理解的是,吹气音采集模块2012也可以设置于移动终端10的下端侧面12。与吹气音采集模块2012的位置相对应,背景音采集模块2011的位置可以设置于显示屏11所在面的背面或移动终端10的上端侧面13,或者显示屏12的两边侧面(图中未示出)。
优选地,本实施例的移动终端还包括一个信号预处理模块2022(如图2所示)。所述信号预处理模块(2022)接收所述反向叠加模块(2021)输出的声音信号并采用异点剔除法、零均值变换法、算术平均值法、中位值法、加权平均值法其中之一或者其组合对接收到的信号进行预处理以进一步滤除环境噪音。
图3示出了本发明的第二个实施例中的信号识别模块103的优选结构框图。如图3所示,信号识别模块103包括吹气信号特征模块3031,声音特征解析模块3032和声音特征比对模块3033。其中,吹气信号特征模块3031中预置吹气行为所产生吹气信号特征。优选地,所述吹气信号特征为根据本发明第一个实施例中描述的三种吹气控制模式,分别确定的三组特征参数范围,包括频率范围,振幅范围和时域范围其中之一或者其组合。声音特征解析模块3032接收吹气声音信号并进行解析。优选地,声音特征解析模块3032对吹气声音信号进行时域解析,即根据数据产生的时间顺序,分析信号的周期性,概率密度,概率分布等得到吹气声音信号的时域参数;或者可选地,声音特征模块3032对吹气声音信号进行幅域解析,即通过分析幅域的均值、均方值、均方差,得到吹气声音信号的幅域参数;可选地,声音特征模块3032对吹气声音信号进行频域解析,即将吹气声音信号波形通过傅里叶变换,分解成若干单一的谐波分量,得到信号的频率结构以及各谐波幅值和相位信息等频率参数。应当注意的是,可以选择时域解析,幅域解析和频域解析中的一种解析模型,也可以选择其组合。
所述声音特征比对模块3033接收声音特征解析模块3032所解析出的时域参数,幅域参数和频域参数或者其组合,并与吹气信号特征模块3031中预置的吹气信号特征进行比对,如果相符合,则声音特征比对模块3033向系统控制模块104发出运行下一步的指令,移动终端根据当前状态运行下一步指令。
本实施例利用背景音采集模块2011和吹气音采集模块2012进行反向相加,滤除环境噪音,避免移动终端的误操作。另外,利用吹气信号特征模块3031,声音特征解析模块3032和声音特征比对模块3033对吹气声音信号进行识别,解决了吹气声音信号难以精确识别的问题,大大提高了吹气控制的可靠性和稳定性,并使用户体验获得了大大的提升。
图4示出了本发明的移动终端的第四个实施例的信号识别模块的优选结构框图。本实施例的移动终端的结构框图与其他实施例大体相同,此处不再赘述。其区别之处在于,本实施例采用声纹识别技术对吹气声音信号进行识别。使用者的发声器官包括声带,软腭,舌头,牙齿,唇,鼻,耳,喉咙等,在吹气时,因为使用者发声器官与自然界中其他生物或物体的结构有诸多的不同,这些不同使得使用者类的吹气声音中携带了独特的声纹特征。
如图4所示,信号识别模块103包括声纹特征模块4031,声纹特征解析模块4032,声纹特征比对模块4033。所述声纹特征模块4031中预置声纹信号特征,所述声纹信号解析模块4032接收噪音处理模块102输出的信号并解析出声纹特征;声纹特征比对模块(4033)将所述声纹特征与所述声纹信号特征进行对比,以确定是否符合所述预置声纹信号特征。优选地,所述声纹信号特征为可量化的声纹识别参数,所述声纹信号解析模块4032接收噪音处理模块102输出的信号并解析出可量化的声纹特征参数。所述可量化的声纹识别参数或声纹特征参数包括基频,共振峰,即时功率谱,音强,音长,频率倒谱系数,频率或振幅中的一种或其组合。
本实施例中利用声纹识别技术,能够从环境中存在的诸多噪音中抽取出使用者为吹气声音信号并用以进行移动终端的智能控制,提高了吹气控制功能的准确性,提高了人机交互的趣味性,提升了用户体验。
本发明还提供一种移动终端控制方法。
图5示出了本发明移动终端控制方法的第一个实施例的方法流程图。如图5所示,本实施例的移动终端控制方法包括如下步骤:
S501:接收吹气音信号和背景音信号;在本步骤中,可以采用一路声音采集模块,例如语音话筒,或者麦克风同时对吹气音和背景音进行采集;优选地,可以采用两路声音采集模块对吹气音和背景音进行采集。
S502:对接收到的吹气音信号和背景音信号进行滤除噪音,得到声音信号;在本步骤中,所述滤除噪音可以采用这样的方式:对采集到的吹气音信号和背景音信号进行反向叠加,从而滤除环境中的噪音;优选地,本步骤中还包括一个信号预处理步骤,即在完成对吹气音信号和背景音信号的滤除噪音后,对处理后的信号进行预处理,即通过采用异点剔除、零均值变换、算术平均、取中位值法或取加权平均值其中之一或者其组合对所述吹气音信号和背景音信号反向叠加后的信号进行去噪处理得到声音信号。
S503:解析出所述声音信号得到声音信号特征并与预置吹气信号特征进行比对;本步骤中,解析所述声音信号的时域参数、频域参数、幅域参数其中之一或其组合,并判断所述时域参数、频域参数、或幅域参数其中之一或其组合与所述预置信号特征是否一致。如果不一致,则结束指令;如果一致,则进入步骤S504;优选地,在本步骤中,根据步骤S502中得到的声音信号产生的时间顺序,解析出声音信号的周期、概率密度、概率分布以得到时域参数;可选地,解析步骤S502中得到的声音信号的幅域特性,解析出幅域的均值、均方值、均方差,信号能量,变动范围中之一或其组合作为幅域参数;可选地,将步骤S502中得到的声音信号进行傅里叶变换,解析出若干单一的谐波分量,得到信号的频率结构以及各谐波幅值和相位信息作为频域参数;
S504:判断所述声音信号特征与所述预置吹气信号特征是否符合;若符合,则根据移动终端当前状态运行下一步指令。在此步骤中,若所述声音信号特征与所述预置吹气信号特征符合,则向系统控制模块104发出控制指令,移动终端根据当前运行状态运行下一步指令。例如,移动终端在待机状态收到电话呼叫,此时如果信号识别模块103确认有吹气控制行为并向系统控制模块104发出下一步指令,则移动终端启动接听电话功能。如果移动终端当前是锁屏状态,在运行解锁功能,如果移动终端当前状态是节目播放状态,则暂停或关闭节目播放状态。另外,信号识别模块103可以根据吹气信号时间的长短组合设定控制指令,例如,如果确认收到的声音信号为长时吹气信号,则向系统控制模块104发出关机的指令。
图6示出了本发明移动终端的控制方法的第二个实施例的方法流程图。本实施例的方法流程和第一个方法流程实施例大体相同,主要区别在于,本实施例的移动终端控制方法中,利用声纹参数特征识别吹气声音信号。与前述移动终端的四个实施例的相关描述相关或相似的部分不再赘述。
如图6所示,本实施例的控制方法包括如下步骤:
S601:接收背景音信号和吹气音信号;优选地,采用两路声音采集模块采集背景音信号和吹气音信号;
S602:对接收到的背景音信号和吹气音信号进行滤除噪音,得到声音信号;
S603:解析出所述声音信号的声纹信号特征;优选地,所述声纹信号特征和所述预置声纹信号特征为可量化的声纹参数;优选地,所述声纹参数为基频,共振峰,即时功率谱,音强,音长,频率倒谱系数,频率或振幅其中之一或其组合;
S604:判断所述声纹信号特征是否与预置声纹信号特征一致;若一致,则根据移动终端当前状态运行下一步指令。
图7示出了本发明移动终端的控制方法的第三个实施例的方法流程图。本实施例的控制方法和前述两个实施例所描述的移动终端控制方法的主要区别在于,本实施例的移动终端控制方法适用于前述三种吹气控制模式中的第一种吹气模式。即使用者嘴巴对着声音采集模块近距离吹气,利用这种吹气模式对移动终端进行声控。本实施例的控制方法包括如下步骤:
S701:利用移动终端的语音话筒采集吹气控制信号;
S702:解析出所述吹气控制信号的振幅;
S703:判断所述吹气控制信号的振幅是否在预置振幅范围;如果所述吹气控制信号的振幅在预置振幅范围,则进入步骤S704;否则结束指令。在此步骤中,所述预置的振幅范围模拟第一种吹气控制模式进行设定。即模拟使用者嘴巴近距离对着移动终端的语音话筒吹气的情形,从使用者口喷出的气流直接进入声音采集模块造成麦克风震膜的剧烈震动,产生远高于环境噪音的信号,此时所产生的信号包含环境噪音信号,但环境噪音可以忽略不计。所述预置振幅范围参照如下方式进行设定:模拟使用者手持移动终端,嘴巴以0~15cm的距离正对着移动终端的语音话筒吹气所产生的声音信号的振幅范围。
优选地,在步骤S702中也解析出所述吹气控制信号的频率;并与预置的吹气控制型号的频率范围进行比较,当吹气控制信号的振幅和频率同时都在所述预置振幅范围和预置频率范围,进入步骤S704,否则结束指令。所述预置频率范围参照所述预置振幅范围的设定模式设定。
S704:移动终端根据当前运行状态运行下一步指令。
本实施例的控制方法,可以最大限度地降低电路和控制算法的简易程度,并且使本发明的控制方法取得很高的可靠性。
虽然已经示出了本发明的一些实施例,但是本领域技术使用者员应理解,在不脱离本发明的精神的情况下,可以对实施例进行改变。上述实施例只是例示性的。不应以本发明的实施例作为本发明权利范围的限定。