CN105306815A - 一种拍摄模式切换装置、方法及移动终端 - Google Patents

一种拍摄模式切换装置、方法及移动终端 Download PDF

Info

Publication number
CN105306815A
CN105306815A CN201510641660.2A CN201510641660A CN105306815A CN 105306815 A CN105306815 A CN 105306815A CN 201510641660 A CN201510641660 A CN 201510641660A CN 105306815 A CN105306815 A CN 105306815A
Authority
CN
China
Prior art keywords
screening
vocal print
pattern
voiceprint feature
feature model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510641660.2A
Other languages
English (en)
Inventor
徐桃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nubia Technology Co Ltd
Original Assignee
Nubia Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nubia Technology Co Ltd filed Critical Nubia Technology Co Ltd
Priority to CN201510641660.2A priority Critical patent/CN105306815A/zh
Publication of CN105306815A publication Critical patent/CN105306815A/zh
Pending legal-status Critical Current

Links

Abstract

本发明公开了一种拍摄模式切换装置、方法及移动终端,属于通信技术领域。该装置包括:解析模块,用于接收语音输入,对所述语音的声纹特征进行解析;切换模块,用于根据所述声纹特征的解析结果选择拍摄模式,本发明通过对用户的语音的声纹特征进行解析,针对不同年龄段人群采用不同的拍摄模式,且不需要事先建立个人声纹资料库,只要提供输入的声纹即可进行声纹特征类型的辨识,减少用户操作。

Description

一种拍摄模式切换装置、方法及移动终端
技术领域
本发明涉及通信技术领域,尤其涉及一种拍摄模式切换装置、方法及移动终端。
背景技术
声纹识别(VoiceprintRecognition,即VPR):是一项根据语音波形中反映说话人生理和行为特征的语音参数,而自动识别说话人身份的技术,主要包括特征提取和模式匹配两个部分。这项技术自研究发展至今,以其特有的方便性、经济性、安全性和准确性等优点收到特别关注。作为生物特征识别技术的一种,该技术在声音拨号、电话银行、电话购物、数据库访问、信息服务、安全控制等互联网及通信领域得到广泛应用。
传感器耗电:如今智能终端CPU越来越快的同时,耗电也越来越多,而传感器是耗电大户。传感器或硬件的每次操作都要通过CPU,如果长时间保持开启非常费电。
因此,为了省电,终端内置传感器和硬件都保持关闭状态。然而,传感器和硬件保持关闭状态带来的问题就是这些传感器的应用场景受限。例如,不能在息屏状态下导航,不能在息屏状态下通过特定的手势快捷唤醒应用。而采用SensorHub技术则可以保持在低功耗状态下保持终端的传感器和指定硬件保持开启状态,并在必要的时候做出正确的响应。
SensorHub:基本上为微控制器(MCU)的一种应用,在系统设计中,其主要功能在于处理各种来自各种感测器的信息,必要时才将主处理器自休眠模式中唤醒,借此降低系统功耗。目前市场上有多款智慧型手机与平板电脑均已导入这类解决方案,例如苹果(Apple)的最新款iPhone便搭载自家开发的M7芯片。除了苹果外,大陆行动装置品牌厂魅族的MX3智慧型手机、微软(Microsoft)的Surface平板电脑、三星电子的GalaxyNoteII与GalaxyS4均有搭载这类芯片。SensorHub的协处理器芯片的功耗,仅仅为CPU的1-2%。
目前,市场上的相机仅注重功能的多样化,并没有考虑到不同年龄段的群体对相机的需求和使用习惯有较大差异,对界面的呈现方式更是不一而足;也有采用基于语音传感器的声纹识别的方案来解决这一问题,但采用基于语音传感器的声纹识别的方案存在的问题是传感器并不能常开,因为常开会导致终端功耗增大,续航不足。
发明内容
本发明的主要目的在于提出一种拍摄模式切换装置、方法及移动终端,通过对用户的语音的声纹特征进行解析,针对不同年龄段人群采用不同的拍摄模式,提高用户对相机的适应速度。
本发明解决上述技术问题的技术方案如下:
根据本发明的一个方面,提供的一种拍摄模式切换装置,包括:
解析模块,用于接收语音输入,对所述语音的声纹特征进行解析;
切换模块,用于根据所述声纹特征的解析结果选择拍摄模式。
优选地,还包括:
预设模块,用于预设声纹特征模型及相应的拍摄模式。
优选地,所述解析模块包括:
实时接收单元,用于利用感测集线器保持语音传感器开启,实时接收用户的语音输入;
预处理单元,用于对所述语音进行预处理,并提取所述语音的声纹特征;
匹配单元,用于对所述声纹特征进行解析,并与预设的声纹特征模型进行匹配,判断出所述语音对应的声纹特征模型。
优选地,所述预设模块包括:
采集单元,用于采集三个不同年龄段的声纹特征,所述三个不同年龄段为儿童、成人和老人,所述声纹特征包括:频谱、倒频谱、共振峰、基音和反射系数;
建模单元,用于利用数学方法建模,构建三个不同年龄段的声纹特征模型:儿童声纹特征模型、成人声纹特征模型和老人声纹特征模型;
预设单元,用于设置三种拍摄模式:童趣模式、成年模式和老年模式。
优选地,所述童趣模式具体为:去掉复杂的参数调节选项,默认自动拍照模式;开启卡通风格的画框和特效;字体采取卡通文字,且在文字上加注拼音,适应儿童的识字范围;
所述成年模式具体为:采用专业摄影模式和自动摄影模式,采用美颜特效和画框;
所述老年模式具体为:结合“一键拍摄”按钮,实现自动变焦功能,去掉复杂的参数调整;相机界面增大按钮触控区域,界面显示放大字体,易于老人识别。
根据本发明的另一个方面,提供的一种拍摄模式切换方法,包括:
接收语音输入,对所述语音的声纹特征进行解析;
根据所述声纹特征的解析结果选择拍摄模式。
优选地,所述接收语音输入,对所述语音的声纹特征进行解析之前还包括:
预设声纹特征模型及相应的拍摄模式。
优选地,所述接收语音输入,对所述语音的声纹特征进行解析包括:
利用感测集线器保持语音传感器开启,实时接收用户的语音输入;
对所述语音进行预处理,并提取所述语音的声纹特征;
对所述声纹特征进行解析,并与预设的声纹特征模型进行匹配,判断出所述语音对应的声纹特征模型。
优选地,所述预设声纹特征模型及相应的拍摄模式包括:
采集三个不同年龄段的声纹特征,所述三个不同年龄段为儿童、成人和老人,所述声纹特征包括:频谱、倒频谱、共振峰、基音和反射系数;
利用数学方法建模,构建三个不同年龄段的声纹特征模型:儿童声纹特征模型、成人声纹特征模型和老人声纹特征模型;
设置三种拍摄模式:童趣模式、成年模式和老年模式。
根据本发明的另一个方面,提供的一种移动终端,包括以上所述的装置。
本发明提供了一种拍摄模式切换装置、方法及移动终端,该装置包括:解析模块,用于接收语音输入,对所述语音的声纹特征进行解析;切换模块,用于根据所述声纹特征的解析结果选择拍摄模式,本发明通过对用户的语音的声纹特征进行解析,针对不同年龄段人群采用不同的拍摄模式,且不需要事先建立个人声纹资料库,只要提供输入的声纹即可进行声纹特征类型的辨识,减少用户操作。
附图说明
图1为实现本发明各个实施例的移动终端的硬件结构示意图;
图2为如图1所示的移动终端的无线通信系统示意图;
图3为本发明的实施例一的一种拍摄模式切换装置的示范性结构框图;
图4为本发明的实施例一的老年模式界面图;
图5为本发明的实施例一的童趣模式界面图;
图6为本发明的实施例二的解析模块的示范性结构框图;
图7为本发明的实施例三的预设模块的示范性结构框图;
图8为本发明的实施例四的一种拍摄模式切换方法的流程图;
图9为本发明的实施例四的整体流程示意图;
图10为本发明的实施例五的一种拍摄模式切换方法的流程图;
图11为本发明的实施例五的不同年龄段声纹特征识别流程图。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。移动终端可以以各种形式来实施。例如,本发明中描述的终端可以包括诸如移动电话、智能电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、导航装置等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。下面,假设终端是移动终端。然而,本领域技术人员将理解的是,除了特别用于移动目的的元件之外,根据本发明的实施方式的构造也能够应用于固定类型的终端。
图1为实现本发明各个实施例的移动终端的硬件结构示意。
移动终端100可以包括无线通信单元110、A/V(音频/视频)输入单元120、用户输入单元130、感测单元140、输出单元150、存储器160、接口单元170、控制器180和电源单元190等等。图1示出了具有各种组件的移动终端,但是应理解的是,并不要求实施所有示出的组件。可以替代地实施更多或更少的组件。将在下面详细描述移动终端的元件。
无线通信单元110通常包括一个或多个组件,其允许移动终端100与无线通信系统或网络之间的无线电通信。例如,无线通信单元可以包括广播接收模块111、移动通信模块112、无线互联网模块113、短程通信模块114和位置信息模块115中的至少一个。
广播接收模块111经由广播信道从外部广播管理服务器接收广播信号和/或广播相关信息。广播信道可以包括卫星信道和/或地面信道。广播管理服务器可以是生成并发送广播信号和/或广播相关信息的服务器或者接收之前生成的广播信号和/或广播相关信息并且将其发送给终端的服务器。广播信号可以包括TV广播信号、无线电广播信号、数据广播信号等等。而且,广播信号可以进一步包括与TV或无线电广播信号组合的广播信号。广播相关信息也可以经由移动通信网络提供,并且在该情况下,广播相关信息可以由移动通信模块112来接收。广播信号可以以各种形式存在,例如,其可以以数字多媒体广播(DMB)的电子节目指南(EPG)、数字视频广播手持(DVB-H)的电子服务指南(ESG)等等的形式而存在。广播接收模块111可以通过使用各种类型的广播系统接收信号广播。特别地,广播接收模块111可以通过使用诸如多媒体广播-地面(DMB-T)、数字多媒体广播-卫星(DMB-S)、数字视频广播-手持(DVB-H),前向链路媒体(MediaFLO)的数据广播系统、地面数字广播综合服务(ISDB-T)等等的数字广播系统接收数字广播。广播接收模块111可以被构造为适合提供广播信号的各种广播系统以及上述数字广播系统。经由广播接收模块111接收的广播信号和/或广播相关信息可以存储在存储器160(或者其它类型的存储介质)中。
移动通信模块112将无线电信号发送到基站(例如,接入点、节点B等等)、外部终端以及服务器中的至少一个和/或从其接收无线电信号。这样的无线电信号可以包括语音通话信号、视频通话信号、或者根据文本和/或多媒体消息发送和/或接收的各种类型的数据。
无线互联网模块113支持移动终端的无线互联网接入。该模块可以内部或外部地耦接到终端。该模块所涉及的无线互联网接入技术可以包括WLAN(无线LAN)(Wi-Fi)、Wibro(无线宽带)、Wimax(全球微波互联接入)、HSDPA(高速下行链路分组接入)等等。
短程通信模块114是用于支持短程通信的模块。短程通信技术的一些示例包括蓝牙TM、射频识别(RFID)、红外数据协会(IrDA)、超宽带(UWB)、紫蜂TM等等。
位置信息模块115是用于检查或获取移动终端的位置信息的模块。位置信息模块的典型示例是GPS(全球定位系统)。根据当前的技术,GPS模块115计算来自三个或更多卫星的距离信息和准确的时间信息并且对于计算的信息应用三角测量法,从而根据经度、纬度和高度准确地计算三维当前位置信息。当前,用于计算位置和时间信息的方法使用三颗卫星并且通过使用另外的一颗卫星校正计算出的位置和时间信息的误差。此外,GPS模块115能够通过实时地连续计算当前位置信息来计算速度信息。
A/V输入单元120用于接收音频或视频信号。A/V输入单元120可以包括相机121和麦克风1220,相机121对在视频捕获模式或图像捕获模式中由图像捕获装置获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示模块151上。经相机121处理后的图像帧可以存储在存储器160(或其它存储介质)中或者经由无线通信单元110进行发送,可以根据移动终端的构造提供两个或更多相机1210。麦克风122可以在电话通话模式、记录模式、语音识别模式等等运行模式中经由麦克风接收声音(音频数据),并且能够将这样的声音处理为音频数据。处理后的音频(语音)数据可以在电话通话模式的情况下转换为可经由移动通信模块112发送到移动通信基站的格式输出。麦克风122可以实施各种类型的噪声消除(或抑制)算法以消除(或抑制)在接收和发送音频信号的过程中产生的噪声或者干扰。
用户输入单元130可以根据用户输入的命令生成键输入数据以控制移动终端的各种操作。用户输入单元130允许用户输入各种类型的信息,并且可以包括键盘、锅仔片、触摸板(例如,检测由于被接触而导致的电阻、压力、电容等等的变化的触敏组件)、滚轮、摇杆等等。特别地,当触摸板以层的形式叠加在显示模块151上时,可以形成触摸屏。
感测单元140检测移动终端100的当前状态,(例如,移动终端100的打开或关闭状态)、移动终端100的位置、用户对于移动终端100的接触(即,触摸输入)的有无、移动终端100的取向、移动终端100的加速或减速移动和方向等等,并且生成用于控制移动终端100的操作的命令或信号。例如,当移动终端100实施为滑动型移动电话时,感测单元140可以感测该滑动型电话是打开还是关闭。另外,感测单元140能够检测电源单元190是否提供电力或者接口单元170是否与外部装置耦接。感测单元140可以包括接近传感器1410将在下面结合触摸屏来对此进行描述。
接口单元170用作至少一个外部装置与移动终端100连接可以通过的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。识别模块可以是存储用于验证用户使用移动终端100的各种信息并且可以包括用户识别模块(UIM)、客户识别模块(SIM)、通用客户识别模块(USIM)等等。另外,具有识别模块的装置(下面称为"识别装置")可以采取智能卡的形式,因此,识别装置可以经由端口或其它连接装置与移动终端100连接。接口单元170可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到移动终端100内的一个或多个元件或者可以用于在移动终端和外部装置之间传输数据。
另外,当移动终端100与外部底座连接时,接口单元170可以用作允许通过其将电力从底座提供到移动终端100的路径或者可以用作允许从底座输入的各种命令信号通过其传输到移动终端的路径。从底座输入的各种命令信号或电力可以用作用于识别移动终端是否准确地安装在底座上的信号。输出单元150被构造为以视觉、音频和/或触觉方式提供输出信号(例如,音频信号、视频信号、警报信号、振动信号等等)。输出单元150可以包括显示模块151、音频输出模块152、警报模块153等等。
显示模块151可以显示在移动终端100中处理的信息。例如,当移动终端100处于电话通话模式时,显示模块151可以显示与通话或其它通信(例如,文本消息收发、多媒体文件下载等等)相关的用户界面(UI)或图形用户界面(GUI)。当移动终端100处于视频通话模式或者图像捕获模式时,显示模块151可以显示捕获的图像和/或接收的图像、示出视频或图像以及相关功能的UI或GUI等等。
同时,当显示模块151和触摸板以层的形式彼此叠加以形成触摸屏时,显示模块151可以用作输入装置和输出装置。显示模块151可以包括液晶显示器(LCD)、薄膜晶体管LCD(TFT-LCD)、有机发光二极管(OLED)显示器、柔性显示器、三维(3D)显示器等等中的至少一种。这些显示器中的一些可以被构造为透明状以允许用户从外部观看,这可以称为透明显示器,典型的透明显示器可以例如为TOLED(透明有机发光二极管)显示器等等。根据特定想要的实施方式,移动终端100可以包括两个或更多显示模块(或其它显示装置),例如,移动终端可以包括外部显示模块(未示出)和内部显示模块(未示出)。触摸屏可用于检测触摸输入压力以及触摸输入位置和触摸输入面积。
音频输出模块152可以在移动终端处于呼叫信号接收模式、通话模式、记录模式、语音识别模式、广播接收模式等等模式下时,将无线通信单元110接收的或者在存储器160中存储的音频数据转换音频信号并且输出为声音。而且,音频输出模块152可以提供与移动终端100执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出模块152可以包括扬声器、蜂鸣器等等。
警报模块153可以提供输出以将事件的发生通知给移动终端100。典型的事件可以包括呼叫接收、消息接收、键信号输入、触摸输入等等。除了音频或视频输出之外,警报模块153可以以不同的方式提供输出以通知事件的发生。例如,警报模块153可以以振动的形式提供输出,当接收到呼叫、消息或一些其它进入通信(incomingcommunication)时,警报模块153可以提供触觉输出(即,振动)以将其通知给用户。通过提供这样的触觉输出,即使在用户的移动电话处于用户的口袋中时,用户也能够识别出各种事件的发生。警报模块153也可以经由显示模块151或音频输出模块152提供通知事件的发生的输出。
存储器160可以存储由控制器180执行的处理和控制操作的软件程序等等,或者可以暂时地存储己经输出或将要输出的数据(例如,电话簿、消息、静态图像、视频等等)。而且,存储器160可以存储关于当触摸施加到触摸屏时输出的各种方式的振动和音频信号的数据。
存储器160可以包括至少一种类型的存储介质,所述存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等等。而且,移动终端100可以与通过网络连接执行存储器160的存储功能的网络存储装置协作。
控制器180通常控制移动终端的总体操作。例如,控制器180执行与语音通话、数据通信、视频通话等等相关的控制和处理。另外,控制器180可以包括用于再现(或回放)多媒体数据的多媒体模块1810,多媒体模块1810可以构造在控制器180内,或者可以构造为与控制器180分离。控制器180可以执行模式识别处理,以将在触摸屏上执行的手写输入或者图片绘制输入识别为字符或图像。
电源单元190在控制器180的控制下接收外部电力或内部电力并且提供操作各元件和组件所需的适当的电力。
这里描述的各种实施方式可以以使用例如计算机软件、硬件或其任何组合的计算机可读介质来实施。对于硬件实施,这里描述的实施方式可以通过使用特定用途集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理装置(DSPD)、可编程逻辑装置(PLD)、现场可编程门阵列(FPGA)、处理器、控制器、微控制器、微处理器、被设计为执行这里描述的功能的电子单元中的至少一种来实施,在一些情况下,这样的实施方式可以在控制器180中实施。对于软件实施,诸如过程或功能的实施方式可以与允许执行至少一种功能或操作的单独的软件模块来实施。软件代码可以由以任何适当的编程语言编写的软件应用程序(或程序)来实施,软件代码可以存储在存储器160中并且由控制器180执行。
至此,己经按照其功能描述了移动终端。下面,为了简要起见,将描述诸如折叠型、直板型、摆动型、滑动型移动终端等等的各种类型的移动终端中的滑动型移动终端作为示例。因此,本发明能够应用于任何类型的移动终端,并且不限于滑动型移动终端。
如图1中所示的移动终端100可以被构造为利用经由帧或分组发送数据的诸如有线和无线通信系统以及基于卫星的通信系统来操作。
现在将参考图2描述其中根据本发明的移动终端能够操作的通信系统。
这样的通信系统可以使用不同的空中接口和/或物理层。例如,由通信系统使用的空中接口包括例如频分多址(FDMA)、时分多址(TDMA)、码分多址(CDMA)和通用移动通信系统(UMTS)(特别地,长期演进(LTE))、全球移动通信系统(GSM)等等。作为非限制性示例,下面的描述涉及CDMA通信系统,但是这样的教导同样适用于其它类型的系统。
参考图2,CDMA无线通信系统可以包括多个移动终端100、多个基站(BS)270、基站控制器(BSC)275和移动交换中心(MSC)280。MSC280被构造为与公共电话交换网络(PSTN)290形成接口。MSC280还被构造为与可以经由回程线路耦接到基站270的BSC275形成接口。回程线路可以根据若干己知的接口中的任一种来构造,所述接口包括例如E1/T1、ATM,IP、PPP、帧中继、HDSL、ADSL或xDSL。将理解的是,如图2中所示的系统可以包括多个BSC2750。
每个BS270可以服务一个或多个分区(或区域),由多向天线或指向特定方向的天线覆盖的每个分区放射状地远离BS270。或者,每个分区可以由用于分集接收的两个或更多天线覆盖。每个BS270可以被构造为支持多个频率分配,并且每个频率分配具有特定频谱(例如,1.25MHz,5MHz等等)。
分区与频率分配的交叉可以被称为CDMA信道。BS270也可以被称为基站收发器子系统(BTS)或者其它等效术语。在这样的情况下,术语"基站"可以用于笼统地表示单个BSC275和至少一个BS270。基站也可以被称为"蜂窝站"。或者,特定BS270的各分区可以被称为多个蜂窝站。
如图2中所示,广播发射器(BT)295将广播信号发送给在系统内操作的移动终端100。如图1中所示的广播接收模块111被设置在移动终端100处以接收由BT295发送的广播信号。在图2中,示出了几个全球定位系统(GPS)卫星300。卫星300帮助定位多个移动终端100中的至少一个。
在图2中,描绘了多个卫星300,但是理解的是,可以利用任何数目的卫星获得有用的定位信息。如图1中所示的GPS模块115通常被构造为与卫星300配合以获得想要的定位信息。替代GPS跟踪技术或者在GPS跟踪技术之外,可以使用可以跟踪移动终端的位置的其它技术。另外,至少一个GPS卫星300可以选择性地或者额外地处理卫星DMB传输。
作为无线通信系统的一个典型操作,BS270接收来自各种移动终端100的反向链路信号。移动终端100通常参与通话、消息收发和其它类型的通信。特定基站270接收的每个反向链路信号被在特定BS270内进行处理。获得的数据被转发给相关的BSC275。BSC提供通话资源分配和包括BS270之间的软切换过程的协调的移动管理功能。BSC275还将接收到的数据路由到MSC280,其提供用于与PSTN290形成接口的额外的路由服务。类似地,PSTN290与MSC280形成接口,MSC与BSC275形成接口,并且BSC275相应地控制BS270以将正向链路信号发送到移动终端100。
基于上述移动终端硬件结构以及通信系统,提出本发明方法各个实施例。
实施例一
图3为本实施例的一种拍摄模式切换装置的示范性结构框图,下面结合图3来描述本实施例的一种拍摄模式切换装置,如图3所示,一种相机拍摄模式切换装置,包括:
解析模块20,用于接收语音输入,对所述语音的声纹特征进行解析;
切换模块30,用于根据所述声纹特征的解析结果选择拍摄模式。
在本实施例中,还包括:
预设模块10,用于预设声纹特征模型及相应的拍摄模式。
在本实施例中,所述拍摄模式切换装置适用于带有相机功能的移动终端,首先根据三个不同年龄段的声纹特征,如频谱、倒频谱、共振峰、基音、反射系数等等,利用数学方法建模,预先构建三个不同年龄段声纹特征的模型库:儿童声纹特征模型、成人声纹特征模型、老人声纹特征模型;当接收到用户语音输入时,通过对所述语音进行预处理、提取声纹特征、对所述声纹特征进行解析,并与上述预设的声纹特征模型进行匹配,即可判断出所述语音对应的声纹特征模型是哪种年龄段的声纹特征模型,不需要事先建立个人声纹资料库,只要提供输入的声纹即可进行声纹特征类型的辨识,减少用户操作。
作为另一种实施例,还可以根据不同性别的声纹特征,利用数学方法建模,预先构建两个不同性别的声纹特征的模型库:男性声纹特征模型、女性声纹特征模型。
在本实施例中,通过语音传感器来接收用户的语音输入,为了保证语音传感器在低功耗的情况下实时监测用户的声纹变化,本申请利用感测集线器(sensorhub)保持语音传感器开启,保证了移动终端的低功耗状态,且能实时监测声纹变化,做到不同相机拍摄模式根据声纹变化的无缝切换。
针对上述三个声纹特征模型,相应设置了三种相机拍摄模式:童趣模式、成年模式和老年模式。
在本实施例中,所述童趣模式具体为:去掉复杂的参数调节选项,默认自动拍照模式;开启卡通风格的画框和特效;字体采取卡通文字,且在文字上加注拼音,适应儿童的识字范围;
所述成年模式具体为:采用专业摄影模式和自动摄影模式,采用美颜特效和画框;
所述老年模式具体为:结合“一键拍摄”按钮,实现自动变焦功能,去掉复杂的参数调整;相机界面增大按钮触控区域,界面显示放大字体,易于老人识别。
在本实施例中,通过设置三种不同年龄段的相机拍摄模式,全面的覆盖所有人群,针对不同年龄段人群采用不同拍摄模式。
如图4所示,当设置有拍摄模式切换装置的移动终端从年轻人转到老年人手里时,语音传感器监测到用户声纹的变化,相机界面由成年模式无缝切换到老年模式,界面字体变大,打开自动对焦功能,老人操控相机更为容易便捷。
如图5所示,当设置有拍摄模式切换装置的移动终端从年轻人转到儿童手里时,语音传感器监测到用户声纹的变化,相机界面由成人模式切换到童趣模式,开启默认自动拍照功能,界面文字加入拼音标注,儿童使用更加轻松易懂。
实施例二
如图6所示,在本实施例中,所述解析模块20包括:
实时接收单元21,用于利用感测集线器保持语音传感器开启,实时接收用户的语音输入;
预处理单元22,用于对所述语音进行预处理,并提取所述语音的声纹特征;
匹配单元23,用于对所述声纹特征进行解析,并与预设的声纹特征模型进行匹配,判断出所述语音对应的声纹特征模型。
实施例三
如图7所示,在本实施例中,所述预设模块10包括:
采集单元11,用于采集三个不同年龄段的声纹特征,所述三个不同年龄段为儿童、成人和老人,所述声纹特征包括:频谱、倒频谱、共振峰、基音和反射系数;
建模单元12,用于利用数学方法建模,构建三个不同年龄段的声纹特征模型:儿童声纹特征模型、成人声纹特征模型和老人声纹特征模型;
预设单元13,用于设置三种拍摄模式:童趣模式、成年模式和老年模式。
实施例四
如图8所示,在本实施例中,一种拍摄模式切换方法,包括:
S20、接收语音输入,对所述语音的声纹特征进行解析;
S30、根据所述声纹特征的解析结果选择拍摄模式。
在本实施例中,所述步骤S20之前还包括:
S10、预设声纹特征模型及相应的拍摄模式。
如图9所示,为本发明整体流程示意图,首先根据三个不同年龄段的声纹特征,如频谱、倒频谱、共振峰、基音、反射系数等等,利用数学方法建模,预先构建三个不同年龄段声纹特征的模型库:儿童声纹特征模型、成人声纹特征模型、老人声纹特征模型;当接收到用户语音输入时,通过对所述语音进行预处理、提取声纹特征、对所述声纹特征进行解析,并与上述预设的声纹特征模型进行匹配,即可判断出所述语音对应的声纹特征模型是哪种年龄段的声纹特征模型,不需要事先建立个人声纹资料库,只要提供输入的声纹即可进行声纹特征类型的辨识,减少用户操作。
实施例五
如图10所示,在本实施例中,所述步骤S20包括:
S21、利用感测集线器保持语音传感器开启,实时接收用户的语音输入;
S22、对所述语音进行预处理,并提取所述语音的声纹特征;
S23、对所述声纹特征进行解析,并与预设的声纹特征模型进行匹配,判断出所述语音对应的声纹特征模型。
在本实施例中,所述预设声纹特征模型及相应的拍摄模式包括:
采集三个不同年龄段的声纹特征,所述三个不同年龄段为儿童、成人和老人,所述声纹特征包括:频谱、倒频谱、共振峰、基音和反射系数;
利用数学方法建模,构建三个不同年龄段的声纹特征模型:儿童声纹特征模型、成人声纹特征模型和老人声纹特征模型;
设置三种拍摄模式:童趣模式、成年模式和老年模式。
如图11所示,为本发明不同年龄段声纹特征识别流程图,与图10结合,可以更好的了解本方案。
实施例五
在本实施例中,一种移动终端,包括以上实施例所述的装置。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种拍摄模式切换装置,其特征在于,包括:
解析模块,用于接收语音输入,对所述语音的声纹特征进行解析;
切换模块,用于根据所述声纹特征的解析结果选择拍摄模式。
2.根据权利要求1所述的一种拍摄模式切换装置,其特征在于,还包括:
预设模块,用于预设声纹特征模型及相应的拍摄模式。
3.根据权利要求2所述的一种拍摄模式切换装置,其特征在于,所述解析模块包括:
实时接收单元,用于利用感测集线器保持语音传感器开启,实时接收用户的语音输入;
预处理单元,用于对所述语音进行预处理,并提取所述语音的声纹特征;
匹配单元,用于对所述声纹特征进行解析,并与预设的声纹特征模型进行匹配,判断出所述语音对应的声纹特征模型。
4.根据权利要求2所述的一种拍摄模式切换装置,其特征在于,所述预设模块包括:
采集单元,用于采集三个不同年龄段的声纹特征,所述三个不同年龄段为儿童、成人和老人,所述声纹特征包括:频谱、倒频谱、共振峰、基音和反射系数;
建模单元,用于利用数学方法建模,构建三个不同年龄段的声纹特征模型:儿童声纹特征模型、成人声纹特征模型和老人声纹特征模型;
预设单元,用于设置三种拍摄模式:童趣模式、成年模式和老年模式。
5.根据权利要求4所述的一种拍摄模式切换装置,其特征在于,所述童趣模式具体为:去掉复杂的参数调节选项,默认自动拍照模式;开启卡通风格的画框和特效;字体采取卡通文字,且在文字上加注拼音,适应儿童的识字范围;
所述成年模式具体为:采用专业摄影模式和自动摄影模式,采用美颜特效和画框;
所述老年模式具体为:结合“一键拍摄”按钮,实现自动变焦功能,去掉复杂的参数调整;相机界面增大按钮触控区域,界面显示放大字体,易于老人识别。
6.一种拍摄模式切换方法,其特征在于,包括:
接收语音输入,对所述语音的声纹特征进行解析;
根据所述声纹特征的解析结果选择相机拍摄模式。
7.根据权利要求6所述的一种拍摄模式切换方法,其特征在于,所述接收语音输入,对所述语音的声纹特征进行解析之前还包括:
预设声纹特征模型及相应的拍摄模式。
8.根据权利要求7所述的一种拍摄模式切换方法,其特征在于,所述接收语音输入,对所述语音的声纹特征进行解析包括:
利用感测集线器保持语音传感器开启,实时接收用户的语音输入;
对所述语音进行预处理,并提取所述语音的声纹特征;
对所述声纹特征进行解析,并与预设的声纹特征模型进行匹配,判断出所述语音对应的声纹特征模型。
9.根据权利要求7所述的一种拍摄模式切换方法,其特征在于,所述预设声纹特征模型及相应的拍摄模式包括:
采集三个不同年龄段的声纹特征,所述三个不同年龄段为儿童、成人和老人,所述声纹特征包括:频谱、倒频谱、共振峰、基音和反射系数;
利用数学方法建模,构建三个不同年龄段的声纹特征模型:儿童声纹特征模型、成人声纹特征模型和老人声纹特征模型;
设置三种拍摄模式:童趣模式、成年模式和老年模式。
10.一种移动终端,其特征在于,包括权利要求1-9所述的装置。
CN201510641660.2A 2015-09-30 2015-09-30 一种拍摄模式切换装置、方法及移动终端 Pending CN105306815A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510641660.2A CN105306815A (zh) 2015-09-30 2015-09-30 一种拍摄模式切换装置、方法及移动终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510641660.2A CN105306815A (zh) 2015-09-30 2015-09-30 一种拍摄模式切换装置、方法及移动终端

Publications (1)

Publication Number Publication Date
CN105306815A true CN105306815A (zh) 2016-02-03

Family

ID=55203519

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510641660.2A Pending CN105306815A (zh) 2015-09-30 2015-09-30 一种拍摄模式切换装置、方法及移动终端

Country Status (1)

Country Link
CN (1) CN105306815A (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105576778A (zh) * 2016-03-11 2016-05-11 努比亚技术有限公司 移动终端充电控制方法及移动终端
CN105895105A (zh) * 2016-06-06 2016-08-24 北京云知声信息技术有限公司 语音处理方法及装置
CN106128467A (zh) * 2016-06-06 2016-11-16 北京云知声信息技术有限公司 语音处理方法及装置
CN106525064A (zh) * 2016-12-23 2017-03-22 北京云知声信息技术有限公司 导航模式选择方法及装置
CN107193972A (zh) * 2017-05-25 2017-09-22 山东浪潮云服务信息科技有限公司 一种基于大数据的分类用户方法及装置
CN107656461A (zh) * 2016-07-26 2018-02-02 青岛海尔洗衣机有限公司 一种基于用户年龄调节语音的方法及洗衣机
CN108830059A (zh) * 2018-05-23 2018-11-16 出门问问信息科技有限公司 媒体访问的控制方法、装置及电子设备
CN109324561A (zh) * 2018-11-29 2019-02-12 奥克斯空调股份有限公司 厨房电器的监控方法、监控系统及厨房系统
CN109671185A (zh) * 2017-10-17 2019-04-23 杭州海康威视数字技术股份有限公司 一种门禁控制方法及装置
CN109688300A (zh) * 2017-10-18 2019-04-26 纬创资通股份有限公司 拍摄装置和拍摄功能切换方法
CN110398897A (zh) * 2018-04-25 2019-11-01 北京快乐智慧科技有限责任公司 一种智能产品的多模式切换方法和系统
CN110895942A (zh) * 2018-09-05 2020-03-20 武汉斗鱼网络科技有限公司 语音控制美颜美型的方法、存储介质、设备及系统
CN113727018A (zh) * 2021-06-24 2021-11-30 荣耀终端有限公司 一种拍摄方法及设备
WO2023124200A1 (zh) * 2021-12-27 2023-07-06 北京荣耀终端有限公司 视频处理方法与电子设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050195309A1 (en) * 2004-03-08 2005-09-08 Samsung Techwin Co., Ltd. Method of controlling digital photographing apparatus using voice recognition, and digital photographing apparatus using the method
CN1797535A (zh) * 2004-12-27 2006-07-05 奥林巴斯映像株式会社 显示控制装置及方法
CN101378455A (zh) * 2007-08-31 2009-03-04 卡西欧计算机株式会社 根据取得的图像确定主要拍摄物的图像区域的装置及方法
CN102047652A (zh) * 2009-03-31 2011-05-04 松下电器产业株式会社 摄像装置、集成电路、摄像方法、程序及记录介质
CN103413270A (zh) * 2013-08-15 2013-11-27 北京小米科技有限责任公司 一种图像的处理方法、装置和终端设备
CN103959761A (zh) * 2012-01-06 2014-07-30 旭化成株式会社 摄像装置以及信息处理装置
CN104092932A (zh) * 2013-12-03 2014-10-08 腾讯科技(深圳)有限公司 一种声控拍摄方法及装置
CN104135619A (zh) * 2014-08-12 2014-11-05 广东欧珀移动通信有限公司 一种摄像头控制方法及装置
CN104935819A (zh) * 2015-06-11 2015-09-23 广东欧珀移动通信有限公司 一种控制摄像头拍摄方法及终端

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050195309A1 (en) * 2004-03-08 2005-09-08 Samsung Techwin Co., Ltd. Method of controlling digital photographing apparatus using voice recognition, and digital photographing apparatus using the method
CN1797535A (zh) * 2004-12-27 2006-07-05 奥林巴斯映像株式会社 显示控制装置及方法
CN101378455A (zh) * 2007-08-31 2009-03-04 卡西欧计算机株式会社 根据取得的图像确定主要拍摄物的图像区域的装置及方法
CN102047652A (zh) * 2009-03-31 2011-05-04 松下电器产业株式会社 摄像装置、集成电路、摄像方法、程序及记录介质
CN103959761A (zh) * 2012-01-06 2014-07-30 旭化成株式会社 摄像装置以及信息处理装置
CN103413270A (zh) * 2013-08-15 2013-11-27 北京小米科技有限责任公司 一种图像的处理方法、装置和终端设备
CN104092932A (zh) * 2013-12-03 2014-10-08 腾讯科技(深圳)有限公司 一种声控拍摄方法及装置
CN104135619A (zh) * 2014-08-12 2014-11-05 广东欧珀移动通信有限公司 一种摄像头控制方法及装置
CN104935819A (zh) * 2015-06-11 2015-09-23 广东欧珀移动通信有限公司 一种控制摄像头拍摄方法及终端

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105576778A (zh) * 2016-03-11 2016-05-11 努比亚技术有限公司 移动终端充电控制方法及移动终端
CN105576778B (zh) * 2016-03-11 2019-10-29 努比亚技术有限公司 移动终端充电控制方法及移动终端
CN105895105A (zh) * 2016-06-06 2016-08-24 北京云知声信息技术有限公司 语音处理方法及装置
CN106128467A (zh) * 2016-06-06 2016-11-16 北京云知声信息技术有限公司 语音处理方法及装置
CN107656461A (zh) * 2016-07-26 2018-02-02 青岛海尔洗衣机有限公司 一种基于用户年龄调节语音的方法及洗衣机
CN106525064A (zh) * 2016-12-23 2017-03-22 北京云知声信息技术有限公司 导航模式选择方法及装置
CN107193972A (zh) * 2017-05-25 2017-09-22 山东浪潮云服务信息科技有限公司 一种基于大数据的分类用户方法及装置
CN109671185A (zh) * 2017-10-17 2019-04-23 杭州海康威视数字技术股份有限公司 一种门禁控制方法及装置
CN109671185B (zh) * 2017-10-17 2021-12-14 杭州海康威视数字技术股份有限公司 一种门禁控制方法及装置
CN109688300A (zh) * 2017-10-18 2019-04-26 纬创资通股份有限公司 拍摄装置和拍摄功能切换方法
CN110398897A (zh) * 2018-04-25 2019-11-01 北京快乐智慧科技有限责任公司 一种智能产品的多模式切换方法和系统
CN108830059A (zh) * 2018-05-23 2018-11-16 出门问问信息科技有限公司 媒体访问的控制方法、装置及电子设备
CN110895942A (zh) * 2018-09-05 2020-03-20 武汉斗鱼网络科技有限公司 语音控制美颜美型的方法、存储介质、设备及系统
CN109324561A (zh) * 2018-11-29 2019-02-12 奥克斯空调股份有限公司 厨房电器的监控方法、监控系统及厨房系统
CN113727018A (zh) * 2021-06-24 2021-11-30 荣耀终端有限公司 一种拍摄方法及设备
CN113727018B (zh) * 2021-06-24 2022-12-02 荣耀终端有限公司 一种拍摄方法及设备
WO2023124200A1 (zh) * 2021-12-27 2023-07-06 北京荣耀终端有限公司 视频处理方法与电子设备
EP4231622A4 (en) * 2021-12-27 2024-04-03 Beijing Honor Device Co Ltd VIDEO PROCESSING METHOD AND ELECTRONIC DEVICE

Similar Documents

Publication Publication Date Title
CN105306815A (zh) 一种拍摄模式切换装置、方法及移动终端
CN105159533A (zh) 一种移动终端及其验证码自动输入方法
CN104917896A (zh) 一种推送数据的方法和终端设备
CN105100892A (zh) 视频播放装置及方法
CN104915096A (zh) 应用界面显示方法及装置
CN104902212A (zh) 一种视频通信方法及装置
CN105208194A (zh) 语音播报装置及方法
CN105225457A (zh) 通过智能家居设备进行信息提示的系统、装置和方法
CN105100482A (zh) 一种实现手语识别的移动终端、系统及其通话实现方法
CN105100269A (zh) 一种移动终端及基于不同用户的内容推荐方法
CN105100491A (zh) 一种处理照片的装置和方法
CN104935747A (zh) 应用图标的处理方法、装置及终端
CN104735255A (zh) 分屏显示方法和系统
CN105049637A (zh) 一种控制即时通讯的装置和方法
CN104809221A (zh) 音乐信息的推荐方法及装置
CN106356065A (zh) 一种移动终端及语音转换方法
CN105718071A (zh) 输入法中推荐联想词汇的终端及方法
CN105138261A (zh) 拍摄参数的调节装置及方法
CN104766604A (zh) 语音数据的标记方法及装置
CN104968033A (zh) 终端网络处理方法及装置
CN105100428A (zh) 一种联系人显示方法和系统
CN105100619A (zh) 一种调整拍摄参数的装置和方法
CN105357367A (zh) 基于压力传感器的按键识别装置及方法
CN105100468A (zh) 一种移动终端的操作方法及装置
CN104811565A (zh) 实现变声通话的方法及终端

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160203