CN105072335B - 一种拍照方法及用户终端 - Google Patents

一种拍照方法及用户终端 Download PDF

Info

Publication number
CN105072335B
CN105072335B CN201510456471.8A CN201510456471A CN105072335B CN 105072335 B CN105072335 B CN 105072335B CN 201510456471 A CN201510456471 A CN 201510456471A CN 105072335 B CN105072335 B CN 105072335B
Authority
CN
China
Prior art keywords
voice signal
terminal
angle
photographing mode
mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510456471.8A
Other languages
English (en)
Other versions
CN105072335A (zh
Inventor
周璇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority to CN201510456471.8A priority Critical patent/CN105072335B/zh
Publication of CN105072335A publication Critical patent/CN105072335A/zh
Application granted granted Critical
Publication of CN105072335B publication Critical patent/CN105072335B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Studio Devices (AREA)

Abstract

本发明实施例公开了一种拍照方法及用户终端,包括:当终端进入录像模式时,可以获取在当前环境中采集到的第一语音信号;再检测第一语音信号与预设的用于开启拍照模式的语音信号是否相匹配;若检测到第一语音信号与预设的用于开启拍照模式的语音信号相匹配,则控制终端进入拍照模式,并对目标拍照对象进行拍照,以得到至少一张图像。本发明实施例中,当需要控制终端从录像模式进入拍照模式时,无需用户手动输入操作指令,而只需要获取当前环境中的第一语音信号,且第一语音信号与预设的用于开启拍照模式的语音信号相匹配时,则可以控制终端从录像模式进入拍照模式。实施本发明实施例能够简化终端从录像模式进入拍照模式时的操作步骤。

Description

一种拍照方法及用户终端
技术领域
本发明涉及电子技术领域,尤其涉及一种拍照方法及用户终端。
背景技术
随着电子技术的快速发展以及终端的迅速普及,终端的功能日益增强,例如,用户可以利用终端访问外部网络数据资源、与好友进行通信联系、拍照以及录像等等。当用户利用终端进行录像时,则可以将当前美好的时光记录下来,若后续需要,则可以将该录像文件调取出来即可。然而,在实际应用中,当用户使用终端进行录像时,若想通过拍照,以记录某一时刻的美好时光,则需要用户手动控制终端退出录像模式,再进入拍照模式进行拍照。可见,当利用终端录像过程中,若需要控制终端从录像模式进入拍照模式时,操作繁琐。
发明内容
本发明实施例提供了一种拍照方法及用户终端,能够简化终端从录像模式切换至拍照模式时的操作步骤。
第一方面,本发明实施例公开一种拍照方法,包括:
当终端进入录像模式时,获取在当前环境中采集到的第一语音信号;
检测所述第一语音信号与预设的用于开启拍照模式的语音信号是否相匹配;
若检测到所述第一语音信号与所述预设的用于开启拍照模式的语音信号相匹配时,则控制所述终端进入所述拍照模式,并对目标拍照对象进行拍照,以得到至少一张图像。
结合第一方面的实现方式,在第一方面的第一种可能的实现方式中,执行步骤所述控制所述终端进入所述拍照模式之后,执行步骤所述对目标拍照对象进行拍照之前,所述方法还可以包括以下步骤:
获取所述第一语音信号的声源区域;
确定所述声源区域中的第一目标点与配置在所述终端中的摄像头中的第二目标点所连成的直线,以及确定所述直线与所述摄像头的垂直线的夹角;
根据所述夹角和预设的角度阈值确定所述摄像头当前需要旋转的旋转角度,并控制所述摄像头旋转所述旋转角度。
结合第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,执行步骤所述确定所述直线与所述摄像头的垂直线的夹角之后,执行步骤所述根据所述夹角和预设的角度阈值确定所述摄像头当前需要旋转的旋转角度之前,所述方法还可以包括以下步骤:
检测所述夹角是否大于所述预设的角度阈值;
若检测所述夹角大于所述角度阈值,则执行所述根据所述夹角和预设的角度阈值确定所述摄像头当前需要旋转的旋转角度的步骤。
结合第一方面的实现方式、第一方面的第一种可能的实现方式以及第一方面的第二种可能的实现方式中的任意一种实现方式,在第一方面的第三种可能的实现方式中,所述方法还可以包括以下步骤:
当检测到所述终端拍照完毕后,控制所述终端再次进入所述录像模式,以录制录像文件;
当检测终端播放所述录像文件时,获取第二语音信号;
检测所述第一语音信号与所述第二语音信号是否一致;
若检测所述第一语音信号与所述第二语音信号一致,则显示所述至少一张图像中与所述第二语音信号相匹配的图像。
结合第一方面的实现方式、第一方面的第一种可能的实现方式以及第一方面的第二种可能的实现方式中的任意一种实现方式,在第一方面的第四种可能的实现方式中,所述控制所述终端进入所述拍照模式,包括:
控制所述终端由所述录像模式切换至所述拍照模式;或者,
控制所述终端进入包括所述拍照模式和所述录像模式的组合模式。
第二方面,本发明实施例还公开了一种用户终端,包括:
第一获取单元,用于当终端进入录像模式时,获取在当前环境中采集到的第一语音信号;
第一检测单元,用于检测所述第一语音信号与预设的用于开启拍照模式的语音信号是否相匹配;
第一控制单元,用于若所述第一检测单元检测到所述第一语音信号与所述预设的用于开启拍照模式的语音信号相匹配时,则控制所述终端进入所述拍照模式,并对目标拍照对象进行拍照,以得到至少一张图像。
结合第二方面的用户终端,在第二方面的第一种可能的用户终端中,所述用户终端还包括:
第二获取单元,用于获取所述第一语音信号的声源区域;
第一确定单元,用于确定所述声源区域中的第一目标点与配置在所述终端中的摄像头中的第二目标点所连成的直线,以及确定所述直线与所述摄像头的垂直线的夹角;
第二确定单元,用于根据所述夹角和预设的角度阈值确定所述摄像头当前需要旋转的旋转角度;
所述第一控制单元还用于控制所述摄像头旋转所述旋转角度。
结合第二方面的第一种可能的用户终端,在第二方面的第二种可能的用户终端中,所述用户终端还包括:
第二检测单元,用于检测所述夹角是否大于所述预设的角度阈值;
所述第一控制单元用于若所述第二检测单元检测所述夹角大于所述角度阈值,则根据所述夹角和预设的角度阈值确定所述摄像头当前需要旋转的旋转角度。
结合第二方面的用户终端、第二方面的第一种可能的用户终端以及第二方面的第二种可能的用户终端中的任意一种用户终端,在第二方面的第三种可能的用户终端中,所述用户终端还包括:
第二控制单元,用于当所述第一检测单元检测到所述终端拍照完毕后,控制所述终端再次进入所述录像模式,以录制录像文件;
第三获取单元,用于当检测终端播放所述录像文件时,获取第二语音信号;第三检测单元,用于检测所述第一语音信号与所述第二语音信号是否一致;
显示单元,用于若所述第三检测单元检测所述第一语音信号与所述第二语音信号一致,则显示所述至少一张图像中与所述第二语音信号相匹配的图像。
结合第二方面的用户终端、第二方面的第一种可能的用户终端以及第二方面的第二种可能的用户终端中的任意一种用户终端,在第二方面的第四种可能的用户终端中,所述第一控制单元具体用于控制所述终端由所述录像模式切换至所述拍照模式;或者,
所述第一控制单元具体用于控制所述终端进入包括所述拍照模式和所述录像模式的组合模式。
本发明实施例中,当终端进入录像模式时,则可以获取在当前环境中采集到的第一语音信号;再检测第一语音信号与预设的用于开启拍照模式的语音信号是否相匹配;若检测到第一语音信号与预设的用于开启拍照模式的语音信号相匹配时,则控制终端进入拍照模式,并对目标拍照对象进行拍照,以得到至少一张图像。在本发明实施例中,当需要控制终端从录像模式进入拍照模式时,无需用户手动输入操作指令,而只需要获取当前环境中的第一语音信号,且第一语音信号与预设的用于开启拍照模式的语音信号相匹配时,则可以控制终端从录像模式进入拍照模式。由此可见,实施本发明实施例能够简化终端从录像模式进入拍照模式时的操作步骤。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种拍照方法的流程示意图;
图2是本发明实施例公开的另一种拍照方法的流程示意图;
图3是本发明实施例公开的一种用户终端的结构示意图;
图4是本发明实施例公开的另一种用户终端的结构示意图;
图5是本发明实施例公开的又一种用户终端的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种拍照方法及用户终端,在本发明实施例中,当需要控制终端从录像模式进入拍照模式时,无需用户手动输入操作指令,而只需要获取当前环境中的第一语音信号,且第一语音信号与预设的用于开启拍照模式的语音信号相匹配时,则可以控制终端从录像模式进入拍照模式。由此可见,实施本发明实施例能够简化终端从录像模式进入拍照模式时的操作步骤。
请参阅图1,图1是本发明实施例公开的一种拍照方法的流程示意图。其中,图1所示的方法可以应用于智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等安装有摄像头的用户终端中。如图1所示,该拍照方法可以包括以下步骤:
S101、当终端进入录像模式时,获取在当前环境中采集到的第一语音信号。
本发明实施例中,第一语音信号的确定可以是终端根据当前环境的环境信息来确定。举例来说,若终端检测到当前环境是一个比较嘈杂的环境,也即,当前环境中有很多不同音色的语音信号,且各语音信号对应的响度也不尽相同;则终端可以将响度最大的语音信号作为第一语音信号;终端也可以将音调最高的语音信号作为第一语音信号;终端还可以将音色最为独特的语音信号作为第一语音信号。若终端检测到当前环境是一个比较安静的环境,则终端可以将获取到的语音信号中任意一组信号作为第一语音信号,本发明不作限定。
本发明实施例中,当终端进入录像模式时,则可以获取在当前环境中采集到的第一语音信号。其中,该录像模式可以是已经开始录制视频文件的模式,也可以是只进入录像模式,但还没接收到开始录制的指令,也即,还未开始录制视频文件的模式。
S102、检测第一语音信号与预设的用于开启拍照模式的语音信号是否相匹配。
本发明实施例中,可以在终端中预先存储用于开启拍照模式的语音信号。其中,该预先存储的用于开启拍照模式的语音信号可以是用户根据需要进行存储,也可以是终端根据用户的历史存储记录进行设定。
本发明实施例中,当终端根据用户的历史存储记录进行设定用于开启拍照模式的语音信号时,可以包括以下步骤:
11)获取终端中针对,用于开启拍照模式的语音信号的历史设定记录;
12)根据上述历史设定记录确定用户针对用于开启拍照模式的语音信号的偏好类型;
13)根据上述偏好类型设定用于开启拍照模式的语音信号,并存储在终端中。
本发明实施例中,终端会根据用户的历史设定记录进行设定用于开启拍照模式的语音信号。具体地,终端主要是根据用户设定的每一个用于开启拍照模式的语音信号的历史设定频率来确定。因此,可以在终端中预先设定一个频率阈值,只有当某一语音信号的设定频率达到上述频率阈值时,终端在根据历史设定记录设定用于开启拍照模式的语音信号时,才可将该语音信号作为用于开启拍照模式的语音信号。举例来说,若在终端中设定的频率阈值为10次,终端检测到语音信号“我要拍照”在终端中设定的频率为11次,则说明该语音信号的设定频率达到上述频率阈值,则终端在根据历史设定记录进行设定用于开启拍照模式的语音信号时,可以将该语音信号设定为用于开启拍照模式的语音信号。
S103、若检测到第一语音信号与预设的用于开启拍照模式的语音信号相匹配时,则控制终端进入拍照模式,并对目标拍照对象进行拍照,以得到至少一张图像。
本发明实施例中,控制终端进入拍照模式,主要是包括:控制终端由录像模式切换至拍照模式;或者,控制终端进入包括拍照模式和录像模式的组合模式。
本发明实施例中,当控制终端进入拍照模式包括控制终端由录像模式切换至拍照模式时,则录像模式在此阶段自动关闭。且在检测到拍照模式关闭时,终端可又可以自动开启录像模式。当控制终端进入拍照模式包括控制终端进入包括拍照模式和录像模式的组合模式时,则此时拍照模式与录像模式同时开启,也即,在终端进行拍照时,也进行录像,也即,最终,终端可以得到录像文件,也可以有针对目标对象进行拍照得到的图像。
本发明实施例中,当终端检测到第一语音信号与预设的用于开启拍照模式的语音信号相匹配时,则控制终端进入拍照模式,并对目标拍照对象进行拍照,以得到至少一张图像。
在图1中,当终端进入录像模式时,则可以获取在当前环境中采集到的第一语音信号;再检测第一语音信号与预设的用于开启拍照模式的语音信号是否相匹配;若检测到第一语音信号与预设的用于开启拍照模式的语音信号相匹配时,则控制终端进入拍照模式,并对目标拍照对象进行拍照,以得到至少一张图像。在本发明实施例中,当需要控制终端从录像模式进入拍照模式时,无需用户手动输入操作指令,而只需要获取当前环境中的第一语音信号,且第一语音信号与预设的用于开启拍照模式的语音信号相匹配时,则可以控制终端从录像模式进入拍照模式。由此可见,实施本发明实施例能够简化终端从录像模式进入拍照模式时的操作步骤。
请参阅图2,图2是本发明实施例公开的另一种拍照方法的流程示意图。如图2所示,该拍照方法可以包括以下步骤:
S201、当终端进入录像模式时,获取在当前环境中采集到的第一语音信号。
本发明实施例中,第一语音信号的确定可以是终端根据当前环境的环境信息来确定。举例来说,若终端检测到当前环境是一个比较嘈杂的环境,也即,当前环境中有很多不同音色的语音信号,且各语音信号对应的响度也不尽相同;则终端可以将响度最大的语音信号作为第一语音信号;终端也可以将音调最高的语音信号作为第一语音信号;终端还可以将音色最为独特的语音信号作为第一语音信号。若终端检测到当前环境是一个比较安静的环境,则终端可以将获取到的语音信号中任意一组信号作为第一语音信号,本发明不作限定。
S202、检测第一语音信号与预设的用于开启拍照模式的语音信号是否相匹配。
S203、若检测到第一语音信号与预设的用于开启拍照模式的语音信号相匹配时,则控制终端进入拍照模式。
S204、在拍照模式下获取第一语音信号的声源区域。
本发明实施例中,在拍照模式下获取第一语音信号的声源区域主要包括以下步骤:
21)通过图像采集设备采集目标发言人的图像;
22)从该图像中确定目标发言人的嘴部区域,作为声源区域。
本发明实施例中,图像采集设备可以是一个或多个,可以集成在语音信号处理装置内部,也可以是独立于语音信号处理装置的外部设备;图像采集设备可以是配备有摄像头的用户设备,本发明实施例不作限定。
本发明实施例中,可以在从该图像中确定目标发言人的嘴部区域之前,检测该图像中是否包含目标发言人的人脸图像,即人脸检测的过程。常见的人脸检测有以下几种方法:基于特征的人脸检测法、模板匹配的人脸检测法、基于外观的人脸检测法等等。其中,基于特征的人脸检测法的实现过程为将提取的图像的特征信息与预先存储的人脸特征信息进行比较,以判断是否包含人脸;模板匹配的人脸检测法的实现过程为将图像与预先建立的人脸模板进行匹配,以判断是否包含人脸;基于外观的人脸检测法的实现过程为将图像与预先训练的人脸和非人脸分类器进行比对,以判断是否包含人脸。在该实施例中,上述人脸检测方法可以单独使用,也可以结合使用。
本发明实施例中,当该图像中包含人脸图像时,在该人脸图像区域,采用哈尔Haar嘴部特征分类器,定位嘴部在该人脸图像上的大致位置;根据人脸面部特征分布满足三分之一比例的原则,将获取的嘴部的大致位置中满足在人脸下部1/3区域的位置,确定为嘴部的最终位置,并将其划定为嘴部区域,该嘴部区域即为声源区域。
S205、确定声源区域中的第一目标点与配置在终端中的摄像头中的第二目标点所连成的直线,以及确定直线与摄像头的垂直线的夹角。
本发明实施例中,确定声源区域中的第一目标点与配置在终端中的摄像头中的第二目标点所连成的直线,以及确定直线与摄像头的垂直线的夹角可以具体为:确定声源区域的中心点与配置在终端中的摄像头中的中心点所成的直线,以及确定该直线与摄像头的垂直线的夹角。
作为一种可选的实施方式,当确定采集到的语音信号的声源区域后,还可以通过确定该声源区域的预设区域与配置在终端中的摄像头的预设区域的直线,再确定该直线与配置在终端中的摄像头的预设区域的垂直线所成的夹角。在该实施例中,预设区域可以是以声源区域中心点作为依据,向四周扩展,且该预设区域的大小可以依据确定的声源区域的大小来决定。其中,预设区域可以是规则图形也可以是不规则图形,对于预设区域的形状本发明不作限定。
本发明实施例中,在执行步骤确定直线与摄像头的垂直线的夹角之后,还可以执行以下步骤:
31)检测该夹角是否大于预设的角度阈值;
32)若检测夹角大于角度阈值,则执行根据夹角和预设的角度阈值确定摄像头当前需要旋转的旋转角度的步骤。
本发明实施例中,可以在用户终端中预先设定一个角度阈值,用于作为配置在终端中摄像头是否旋转的依据。只有在检测该夹角大于预先设定的角度阈值时,才控制该摄像头旋转。若检测该夹角小于或等于预先设定的角度阈值时,则输出用于提示当前无需控制该摄像头旋转的提示信息。
本发明实施例中,在用户终端中预先设定的角度阈值可以是用户根据需要进行设定,也可以是用户终端根据用户的历史设定记录进行设定,还可以是用户终端中预先存储的系统默认的一个角度阈值。
S206、根据夹角和预设的角度阈值确定摄像头当前需要旋转的旋转角度,并控制摄像头旋转上述旋转角度。
本发明实施例中,当根据夹角和预设的角度阈值确定摄像头当前需要旋转的旋转角度后,则可以确定摄像头的旋转角度,则可以控制摄像头进行旋转。举例来说,当上述夹角为20度时,当预设角度为5度时,则可以控制摄像头以摄像头成像区域的第一垂直线作为起始线进行旋转,直到旋转后得到的摄像头的第二垂直线,并检测第一垂直线与第二垂直线的夹角为小于5度即停止旋转。
S207、控制终端对目标拍照对象进行拍照,以得到至少一张图像。
本发明实施例中,当根据夹角和预设的角度阈值确定摄像头当前需要旋转的旋转角度,并控制摄像头旋转上述旋转角度之后,则可以控制终端对目标拍照对象进行拍照,以得到至少一张图像,并存储在终端中。
本发明实施例中,当控制终端进入拍照模式包括控制终端由录像模式切换至拍照模式时,还可以包括以下步骤:
41)当检测到终端拍照完毕后,控制终端再次进入录像模式,以录制录像文件;
42)当检测终端播放录像文件时,获取第二语音信号;
43)检测第一语音信号与第二语音信号是否一致;
44)若检测第一语音信号与第二语音信号一致,则显示至少一张图像中与第二语音信号相匹配的图像。
本发明实施例中,第二语音信号的确定可以是终端根据当前环境的环境信息来确定。举例来说,若终端检测到当前环境是一个比较嘈杂的环境,也即,当前环境中有很多不同音色的语音信号,且各语音信号对应的响度也不尽相同;则终端可以将响度最大的语音信号作为第二语音信号;终端也可以将音调最高的语音信号作为第二语音信号;终端还可以将音色最为独特的语音信号作为第二语音信号。若终端检测到当前环境是一个比较安静的环境,则终端可以将获取到的语音信号中任意一组信号作为第二语音信号,本发明不作限定。
本发明实施例中,当终端在播放录制的录像文件时,同样可以通过输入第二语音信号,然后从与该录像文件对应的图像中获取与第二信号相匹配的图像。通过本发明实施例,无需用户手动从与该录像文件对应的图像获取图像。由此可见,实施本发明实施例提高用户查阅图像的便捷性,从而大大提高了用户的体验。
在图2中,详细描述了在使用终端进行拍照或者录像时,终端可以先确定声源区域,再确定声源区域中的第一目标点与配置在终端中的摄像头中的第二目标点所连成的直线,以及确定直线与摄像头的垂直线的夹角;再根据夹角和预设的角度阈值确定摄像头当前需要旋转的旋转角度,最后控制摄像头旋转该旋转角度。由此可见,实施本发明实施例,无需用户手动控制摄像头旋转,从而提高了使用终端拍照或者录像的便捷性,大大提高了用户体验。
请参阅图3,图3是本发明实施例公开的一种用户终端的结构示意图,用于执行上述拍照方法。其中,图3所示的用户终端可以包括但不限于智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等安装有摄像头的用户终端。如图3所示,该用户终端可以包括:第一获取单元301、第一检测单元302以及第一控制单元303,其中,
第一获取单元301,用于当终端进入录像模式时,获取在当前环境中采集到的第一语音信号。
本发明实施例中,第一语音信号的确定可以是终端根据当前环境的环境信息来确定。举例来说,若终端检测到当前环境是一个比较嘈杂的环境,也即,当前环境中有很多不同音色的语音信号,且各语音信号对应的响度也不尽相同;则终端可以将响度最大的语音信号作为第一语音信号;终端也可以将音调最高的语音信号作为第一语音信号;终端还可以将音色最为独特的语音信号作为第一语音信号。若终端检测到当前环境是一个比较安静的环境,则终端可以将获取到的语音信号中任意一组信号作为第一语音信号,本发明不作限定。
本发明实施例中,当终端进入录像模式时,则第一获取单元301可以获取在当前环境中采集到的第一语音信号。其中,该录像模式可以是已经开始录制视频文件的模式,也可以是只进入录像模式,但还没接收到开始录制的指令,也即,还未开始录制视频文件的模式。
第一检测单元302,用于检测第一语音信号与预设的用于开启拍照模式的语音信号是否相匹配。
本发明实施例中,可以在终端中预先存储用于开启拍照模式的语音信号。其中,该预先存储的用于开启拍照模式的语音信号可以是用户根据需要进行存储,也可以是终端根据用户的历史存储记录进行设定。
本发明实施例中,当根据用户的历史存储记录进行设定用于开启拍照模式的语音信号时,可以包括以下步骤:
11)获取终端中针对,用于开启拍照模式的语音信号的历史设定记录;
12)根据上述历史设定记录确定用户针对用于开启拍照模式的语音信号的偏好类型;
13)根据上述偏好类型设定用于开启拍照模式的语音信号,并存储在终端中。
本发明实施例中,可以根据用户的历史设定记录进行设定用于开启拍照模式的语音信号。具体地,终端主要是根据用户设定的每一个用于开启拍照模式的语音信号的历史设定频率来确定。因此,可以在终端中预先设定一个频率阈值,只有当某一语音信号的设定频率达到上述频率阈值时,终端在根据历史设定记录设定用于开启拍照模式的语音信号时,才可将该语音信号作为用于开启拍照模式的语音信号。举例来说,若在终端中设定的频率阈值为10次,终端检测到语音信号“我要拍照”在终端中设定的频率为11次,则说明该语音信号的设定频率达到上述频率阈值,则终端在根据历史设定记录进行设定用于开启拍照模式的语音信号时,可以将该语音信号设定为用于开启拍照模式的语音信号。
第一控制单元303,用于若第一检测单元302检测到第一语音信号与预设的用于开启拍照模式的语音信号相匹配时,则控制终端进入拍照模式,并对目标拍照对象进行拍照,以得到至少一张图像。
本发明实施例中,第一控制单元303控制终端进入拍照模式,主要是包括:第一控制单元303控制终端由录像模式切换至拍照模式;或者,第一控制单元303控制终端进入包括拍照模式和录像模式的组合模式。
本发明实施例中,当第一控制单元303控制终端进入拍照模式包括第一控制单元303控制终端由录像模式切换至拍照模式时,则录像模式在此阶段自动关闭。且在检测到拍照模式关闭时,又可以自动开启录像模式。当第一控制单元303控制终端进入拍照模式包括控制终端进入包括拍照模式和录像模式的组合模式时,则此时拍照模式与录像模式同时开启,也即,在终端进行拍照时,也进行录像,也即,最终,终端可以得到录像文件,也可以有针对目标对象进行拍照得到的图像。
本发明实施例中,当第一检测单元302检测到第一语音信号与预设的用于开启拍照模式的语音信号相匹配时,则第一控制单元303控制终端进入拍照模式,并对目标拍照对象进行拍照,以得到至少一张图像。
在图3中,当终端进入录像模式时,则第一获取单元301可以获取在当前环境中采集到的第一语音信号;第一检测单元302再检测第一语音信号与预设的用于开启拍照模式的语音信号是否相匹配;若第一检测单元302检测到第一语音信号与预设的用于开启拍照模式的语音信号相匹配时,则第一控制单元303控制终端进入拍照模式,并对目标拍照对象进行拍照,以得到至少一张图像。在本发明实施例中,当需要控制终端从录像模式进入拍照模式时,无需用户手动输入操作指令,而只需要获取当前环境中的第一语音信号,且第一语音信号与预设的用于开启拍照模式的语音信号相匹配时,则第一控制单元303可以则可以控制终端从录像模式进入拍照模式。由此可见,实施本发明实施例能够简化终端从录像模式进入拍照模式时的操作步骤。
请参阅图4,图4是本发明实施例公开的另一种用户终端的结构示意图,用于执行上述拍照方法。其中,图4是在图3的基础上进一步细化得到,除包括图3所示的所有单元外,还可以包括:第二获取单元304、第一确定单元305、第二检测单元306、第二确定单元307、第二控制单元308、第三获取单元309、第三检测单元310以及显示单元311,其中,
第二获取单元304,用于获取第一语音信号的声源区域。
第一确定单元305,用于确定声源区域中的第一目标点与配置在终端中的摄像头中的第二目标点所连成的直线,以及确定直线与摄像头的垂直线的夹角。
第二检测单元306,用于检测夹角是否大于预设的角度阈值。
第二确定单元307,用于根据夹角和预设的角度阈值确定摄像头当前需要旋转的旋转角度。
本发明实施例中,在拍照模式下获取第一语音信号的声源区域主要包括以下步骤:
21)第二获取单元304通过图像采集设备采集目标发言人的图像;
22)第二获取单元304从该图像中确定目标发言人的嘴部区域,作为声源区域。
本发明实施例中,图像采集设备可以是一个或多个,可以集成在语音信号处理装置内部,也可以是独立于语音信号处理装置的外部设备;图像采集设备可以是配备有摄像头的用户设备,本发明实施例不作限定。
本发明实施例中,可以在从该图像中确定目标发言人的嘴部区域之前,检测该图像中是否包含目标发言人的人脸图像,即人脸检测的过程。常见的人脸检测有以下几种方法:基于特征的人脸检测法、模板匹配的人脸检测法、基于外观的人脸检测法等等。其中,基于特征的人脸检测法的实现过程为将提取的图像的特征信息与预先存储的人脸特征信息进行比较,以判断是否包含人脸;模板匹配的人脸检测法的实现过程为将图像与预先建立的人脸模板进行匹配,以判断是否包含人脸;基于外观的人脸检测法的实现过程为将图像与预先训练的人脸和非人脸分类器进行比对,以判断是否包含人脸。在该实施例中,上述人脸检测方法可以单独使用,也可以结合使用。
本发明实施例中,当该图像中包含人脸图像时,在该人脸图像区域,采用哈尔Haar嘴部特征分类器,定位嘴部在该人脸图像上的大致位置;根据人脸面部特征分布满足三分之一比例的原则,将获取的嘴部的大致位置中满足在人脸下部1/3区域的位置,确定为嘴部的最终位置,并将其划定为嘴部区域,该嘴部区域即为声源区域。
本发明实施例中,第一确定单元305确定声源区域中的第一目标点与配置在终端中的摄像头中的第二目标点所连成的直线,以及确定直线与摄像头的垂直线的夹角可以具体为:第一确定单元305确定声源区域的中心点与配置在终端中的摄像头中的中心点所成的直线,以及确定该直线与摄像头的垂直线的夹角。
作为一种可选的实施方式,当第一确定单元305确定采集到的语音信号的声源区域后,还可以通过确定该声源区域的预设区域与配置在终端中的摄像头的预设区域的直线,再确定该直线与配置在终端中的摄像头的预设区域的垂直线所成的夹角。在该实施例中,预设区域可以是以声源区域中心点作为依据,向四周扩展,且该预设区域的大小可以依据确定的声源区域的大小来决定。其中,预设区域可以是规则图形也可以是不规则图形,对于预设区域的形状本发明不作限定。
本发明实施例中,可以在用户终端中预先设定一个角度阈值,用于作为配置在终端中摄像头是否旋转的依据。只有在第二检测单元306检测该夹角大于预先设定的角度阈值时,才控制该摄像头旋转。若第二检测单元306检测该夹角小于或等于预先设定的角度阈值时,则输出用于提示当前无需控制该摄像头旋转的提示信息。
本发明实施例中,在用户终端中预先设定的角度阈值可以是用户根据需要进行设定,也可以是用户终端根据用户的历史设定记录进行设定,还可以是用户终端中预先存储的系统默认的一个角度阈值。
本发明实施例中,当根据夹角和预设的角度阈值确定摄像头当前需要旋转的旋转角度后,则第二确定单元307可以确定摄像头的旋转角度,则可以控制摄像头进行旋转。举例来说,当上述夹角为20度时,当预设角度为5度时,则可以控制摄像头以摄像头成像区域的第一垂直线作为起始线进行旋转,直到旋转后得到的摄像头的第二垂直线,并检测第一垂直线与第二垂直线的夹角为小于5度即停止旋转。
第二控制单元308,用于当第一检测单元302检测到终端拍照完毕后,控制终端再次进入所述录像模式,以录制录像文件。
第三获取单元309,用于当检测终端播放录像文件时,获取第二语音信号。
第三检测单元310,用于检测第一语音信号与第二语音信号是否一致。
显示单元311,用于若第三检测单元310检测第一语音信号与第二语音信号一致,则显示至少一张图像中与第二语音信号相匹配的图像。
本发明实施例中,第二语音信号的确定可以是终端根据当前环境的环境信息来确定。举例来说,若终端检测到当前环境是一个比较嘈杂的环境,也即,当前环境中有很多不同音色的语音信号,且各语音信号对应的响度也不尽相同;则终端可以将响度最大的语音信号作为第二语音信号;终端也可以将音调最高的语音信号作为第二语音信号;终端还可以将音色最为独特的语音信号作为第二语音信号。若终端检测到当前环境是一个比较安静的环境,则终端可以将获取到的语音信号中任意一组信号作为第二语音信号,本发明不作限定。
本发明实施例中,当终端在播放录制的录像文件时,同样可以通过输入第二语音信号,然后从与该录像文件对应的图像中获取与第二信号相匹配的图像。通过本发明实施例,无需用户手动从与该录像文件对应的图像获取图像。由此可见,实施本发明实施例提高用户查阅图像的便捷性,从而大大提高了用户的体验。
在图4中,详细描述了在使用终端进行拍照或者录像时,可以先获取声源区域,第一确定单元305再确定声源区域中的第一目标点与配置在终端中的摄像头中的第二目标点所连成的直线,以及确定直线与摄像头的垂直线的夹角;第二确定单元307再根据夹角和预设的角度阈值确定摄像头当前需要旋转的旋转角度,最后控制摄像头旋转该旋转角度。由此可见,实施本发明实施例,无需用户手动控制摄像头旋转,从而提高了使用终端拍照或者录像的便捷性,大大提高了用户体验。
请参阅图5,图5是本发明实施例公开的又一种用户终端的结构示意图,用于执行上述拍照方法。如图5所示,该终端500可以包括:至少一个处理器501,至少一个输入装置502,至少一个输出装置503,存储器505等组件。其中,这些组件通过一条或多条总线504进行通信连接。本领域技术人员可以理解,图5中示出的终端的结构并不构成对本发明实施例的限定,它既可以是总线形结构,也可以是星型结构,还可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器501为终端的控制中心,利用各种接口和线路连接整个终端的各个部分,通过运行或执行存储在存储器505内的程序和/或模块,以及调用存储在存储器505内的数据,以执行终端的各种功能和处理数据。处理器501可以由集成电路(Integrated Circuit,简称IC)组成,例如可以由单颗封装的IC所组成,也可以由连接多颗相同功能或不同功能的封装IC而组成。举例来说,处理器501可以仅包括中央处理器(Central Processing Unit,简称CPU),也可以是CPU、数字信号处理器(digital signal processor,简称DSP)、图形处理器(Graphic Processing Unit,简称GPU)及各种控制芯片的组合。在本发明实施方式中,CPU可以是单运算核心,也可以包括多运算核心。
输入装置502可以包括标准的触摸屏、键盘等,也可以包括有线接口、无线接口等。
输出装置503可以包括显示屏、扬声器等,也可以包括有线接口、无线接口等。
存储器505可用于存储软件程序以及模块,处理器501、输入装置502以及输出装置503通过调用存储在存储器505中的软件程序以及模块,从而执行终端的各项功能应用以及实现数据处理。存储器505主要包括程序存储区和数据存储区,其中,程序存储区可存储操作系统、至少一个功能所需的应用程序等;数据存储区可存储根据终端的使用所创建的数据等。在本发明实施例中,操作系统可以是Android系统、iOS系统或Windows操作系统等等。
具体的,处理器501调用存储在存储器505中的应用程序,用于执行以下操作:
当终端进入录像模式时,处理器501控制输入装置502获取在当前环境中采集到的第一语音信号;
处理器501检测第一语音信号与预设的用于开启拍照模式的语音信号是否相匹配;
若处理器501检测到第一语音信号与预设的用于开启拍照模式的语音信号相匹配时,则处理器501控制终端进入拍照模式,并对目标拍照对象进行拍照,以得到至少一张图像。
本发明实施例中,处理器501调用存储在存储器505中的应用程序,在执行步骤处理器501控制终端进入拍照模式之后,对目标拍照对象进行拍照之前,还可以执行以下步骤:
处理器501控制输入装置502获取第一语音信号的声源区域;
处理器501确定声源区域中的第一目标点与配置在终端中的摄像头中的第二目标点所连成的直线,以及确定直线与摄像头的垂直线的夹角;
处理器501根据夹角和预设的角度阈值确定摄像头当前需要旋转的旋转角度,并控制摄像头旋转该旋转角度。
本发明实施例中,处理器501调用存储在存储器505中的应用程序,执行步骤处理器501确定直线与摄像头的垂直线的夹角之后,根据夹角和预设的角度阈值确定摄像头当前需要旋转的旋转角度之前,还可以执行以下步骤:
处理器501检测夹角是否大于预设的角度阈值;
若处理器501检测夹角大于角度阈值,则执行处理器501根据夹角和预设的角度阈值确定摄像头当前需要旋转的旋转角度的步骤。
本发明实施例中,处理器501调用存储在存储器505中的应用程序,还可以执行以下步骤:
当检测到终端拍照完毕后,处理器501控制终端再次进入录像模式,以录制录像文件;
当处理器501检测终端播放录像文件时,处理器501控制输入装置502获取第二语音信号;
处理器501检测第一语音信号与第二语音信号是否一致;
若处理器501检测第一语音信号与第二语音信号一致,则处理器501控制输出装置503显示至少一张图像中与第二语音信号相匹配的图像。
本发明实施例中,处理器501调用存储在存储器505中的应用程序,处理器501控制终端进入拍照模式,包括:
处理器501控制终端由录像模式切换至拍照模式;或者,
处理器501控制终端进入包括拍照模式和录像模式的组合模式。
具体的,本发明实施例中介绍的终端可以实施本发明结合图1、图2介绍的拍照方法实施例中的部分或全部流程。
本发明所有实施例中的模块或子模块,可以通过通用集成电路,例如CPU(CentralProcessing Unit,中央处理器),或通过ASIC(Application Specific IntegratedCircuit,专用集成电路)来实现。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本发明实施例终端中的单元可以根据实际需要进行合并、划分和删减。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存取存储器(Random AccessMemory,简称RAM)等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (8)

1.一种拍照方法,其特征在于,包括:
当终端进入录像模式时,获取在当前环境中采集到的第一语音信号;
检测所述第一语音信号与预设的用于开启拍照模式的语音信号是否相匹配;
若检测到所述第一语音信号与所述预设的用于开启拍照模式的语音信号相匹配时,则控制所述终端进入所述拍照模式;
获取所述第一语音信号的声源区域;确定所述声源区域中的第一目标点与配置在所述终端中的摄像头中的第二目标点所连成的直线,以及确定所述直线与所述摄像头的垂直线的夹角;根据所述夹角和预设的角度阈值确定所述摄像头当前需要旋转的旋转角度,并控制所述摄像头旋转所述旋转角度;
对目标拍照对象进行拍照,以得到至少一张图像。
2.根据权利要求1所述的方法,其特征在于,所述确定所述直线与所述摄像头的垂直线的夹角之后,所述根据所述夹角和预设的角度阈值确定所述摄像头当前需要旋转的旋转角度之前,所述方法还包括:
检测所述夹角是否大于所述预设的角度阈值;
若检测所述夹角大于所述角度阈值,则执行所述根据所述夹角和预设的角度阈值确定所述摄像头当前需要旋转的旋转角度的步骤。
3.根据权利要求1~2中任意一项所述的方法,其特征在于,所述方法还包括:
当检测到所述终端拍照完毕后,控制所述终端再次进入所述录像模式,以录制录像文件;
当检测所述终端播放所述录像文件时,获取第二语音信号;
检测所述第一语音信号与所述第二语音信号是否一致;
若检测所述第一语音信号与所述第二语音信号一致,则显示所述至少一张图像中与所述第二语音信号相匹配的图像。
4.根据权利要求1~2中任意一项所述的方法,其特征在于,所述控制所述终端进入所述拍照模式,包括:
控制所述终端由所述录像模式切换至所述拍照模式;或者,
控制所述终端进入包括所述拍照模式和所述录像模式的组合模式。
5.一种用户终端,其特征在于,包括:
第一获取单元,用于当终端进入录像模式时,获取在当前环境中采集到的第一语音信号;
第一检测单元,用于检测所述第一语音信号与预设的用于开启拍照模式的语音信号是否相匹配;
第二获取单元,用于获取所述第一语音信号的声源区域;
第一确定单元,用于确定所述声源区域中的第一目标点与配置在所述终端中的摄像头中的第二目标点所连成的直线,以及确定所述直线与所述摄像头的垂直线的夹角;
第二确定单元,用于根据所述夹角和预设的角度阈值确定所述摄像头当前需要旋转的旋转角度;
第一控制单元,用于若所述第一检测单元检测到所述第一语音信号与所述预设的用于开启拍照模式的语音信号相匹配时,则控制所述终端进入所述拍照模式,控制所述摄像头旋转所述旋转角度,对目标拍照对象进行拍照,以得到至少一张图像。
6.根据权利要求5所述的用户终端,其特征在于,所述用户终端还包括:
第二检测单元,用于检测所述夹角是否大于所述预设的角度阈值;
所述第一控制单元用于若所述第二检测单元检测所述夹角大于所述角度阈值,则根据所述夹角和预设的角度阈值确定所述摄像头当前需要旋转的旋转角度。
7.根据权利要求5~6中任意一项所述的用户终端,其特征在于,所述用户终端还包括:
第二控制单元,用于当所述第一检测单元检测到所述终端拍照完毕后,控制所述终端再次进入所述录像模式,以录制录像文件;
第三获取单元,用于当检测终端播放所述录像文件时,获取第二语音信号;第三检测单元,用于检测所述第一语音信号与所述第二语音信号是否一致;
显示单元,用于若所述第三检测单元检测所述第一语音信号与所述第二语音信号一致,则显示所述至少一张图像中与所述第二语音信号相匹配的图像。
8.根据权利要求5~6中任意一项所述的用户终端,其特征在于,所述第一控制单元具体用于控制所述终端由所述录像模式切换至所述拍照模式;或者,
所述第一控制单元具体用于控制所述终端进入包括所述拍照模式和所述录像模式的组合模式。
CN201510456471.8A 2015-07-29 2015-07-29 一种拍照方法及用户终端 Active CN105072335B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510456471.8A CN105072335B (zh) 2015-07-29 2015-07-29 一种拍照方法及用户终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510456471.8A CN105072335B (zh) 2015-07-29 2015-07-29 一种拍照方法及用户终端

Publications (2)

Publication Number Publication Date
CN105072335A CN105072335A (zh) 2015-11-18
CN105072335B true CN105072335B (zh) 2019-02-12

Family

ID=54501604

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510456471.8A Active CN105072335B (zh) 2015-07-29 2015-07-29 一种拍照方法及用户终端

Country Status (1)

Country Link
CN (1) CN105072335B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105611167B (zh) * 2015-12-30 2020-01-31 联想(北京)有限公司 一种对焦平面调整方法及电子设备
CN105516605A (zh) * 2016-01-20 2016-04-20 广东欧珀移动通信有限公司 一种拍摄方法和装置
CN105635482A (zh) * 2016-01-26 2016-06-01 广东欧珀移动通信有限公司 一种来电处理方法和装置
CN105760154A (zh) * 2016-01-27 2016-07-13 广东欧珀移动通信有限公司 一种音频控制方法和装置
CN110493517A (zh) * 2019-08-14 2019-11-22 广州三星通信技术研究有限公司 图像捕获装置的辅助拍摄方法和图像捕获装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3733258B2 (ja) * 1999-02-23 2006-01-11 キヤノン株式会社 画像撮影装置、画像撮影方法、記憶媒体、テレビ会議システム
CN102881288A (zh) * 2012-10-12 2013-01-16 长春指南针科技有限公司 一种具有照相、录像功能的电子设备
CN104104796A (zh) * 2014-07-17 2014-10-15 广东欧珀移动通信有限公司 移动设备方向的智能提醒方法、装置及移动设备
CN104679245A (zh) * 2015-02-12 2015-06-03 深圳市金立通信设备有限公司 一种终端

Also Published As

Publication number Publication date
CN105072335A (zh) 2015-11-18

Similar Documents

Publication Publication Date Title
CN105072335B (zh) 一种拍照方法及用户终端
CN108833818B (zh) 视频录制方法、装置、终端及存储介质
CN107846519B (zh) 用于基于手势的管理的系统和方法
CN105049709B (zh) 一种大视角摄像头控制方法及用户终端
WO2016177154A1 (zh) 一种切换移动终端工作模式的方法及装置
CN104853111B (zh) 一种拍摄方法及终端
WO2019185003A1 (zh) 一种显示控制方法及设备
WO2017070971A1 (zh) 一种面部验证的方法和电子设备
CN108563941A (zh) 一种智能家居设备控制方法、智能音箱及智能家居系统
CN103986835A (zh) 一种移动终端及其多用户场景切换的方法和装置
CN105631804B (zh) 图片处理方法及装置
WO2020249038A1 (zh) 音频流的处理方法、装置、移动终端及存储介质
CN110263617B (zh) 三维人脸模型获取方法及装置
CN109788138A (zh) 屏幕控制方法、装置、终端及存储介质
EP3340077B1 (en) Method and apparatus for inputting expression information
CN109379623A (zh) 视频内容生成方法、装置、计算机设备和存储介质
EP3328062A1 (en) Photo synthesizing method and device
CN106101526A (zh) 录屏方法及装置
WO2019237747A1 (zh) 图像裁剪方法、装置、电子设备及计算机可读存储介质
WO2018098968A9 (zh) 一种拍照方法、装置及终端设备
CN112425156A (zh) 一种基于连拍选择图像的方法及电子设备
CN109151309A (zh) 一种摄像头的转动控制方法、装置、设备和存储介质
CN108021905A (zh) 图片处理方法、装置、终端设备及存储介质
WO2021120626A1 (zh) 一种图像处理方法、终端及计算机存储介质
CN107529699A (zh) 电子设备控制方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 523860 No. 18, Wu Sha Beach Road, Changan Town, Dongguan, Guangdong

Applicant after: OPPO Guangdong Mobile Communications Co., Ltd.

Address before: 523860 No. 18, Wu Sha Beach Road, Changan Town, Dongguan, Guangdong

Applicant before: Guangdong OPPO Mobile Communications Co., Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant