WO2016188304A1

WO2016188304A1 - 拍照的方法及装置

Info

Publication number: WO2016188304A1
Application number: PCT/CN2016/080762
Authority: WO
Inventors: 钟宇恒
Original assignee: 中兴通讯股份有限公司
Priority date: 2016-03-04
Filing date: 2016-04-29
Publication date: 2016-12-01
Also published as: CN107155056A

Abstract

一种拍照的方法，包括：在通过摄像头对拍照对象进行拍照时，对拍照对象的人脸状态进行识别，其中，人脸状态包括笑脸状态和非笑脸状态（S102）；根据识别到的人脸状态确定是否播放用于使拍摄对象呈现笑脸状态的语音提示音（S104）；在获取到拍照对象的笑脸状态时，对拍照对象进行拍照（S106）。还公开了拍照方法相应的装置。

Description

拍照的方法及装置

技术领域

本文涉及但不限于通信领域，具体而言，涉及一种拍照的方法及装置。

背景技术

随着科技的发展，终端的功能也越来越多，人们可以通过终端购物、出行、拍照等等，其中，拍照是人们使用终端最多的一个应用，即用手机拍照或自拍成了大多数人离不开娱乐方式。无论是出于解压、无聊消遣，还是逗小孩子玩的目的，主要还是想拍出心情最佳的瞬间。往往在没有心情状态下的照片都是一样，显得极其无味和平淡，不值得留下珍贵回忆，也不值得留下影像，所以大多都是拍了删，删了拍，没有乐趣。这样降低了人们通过终端拍照的体验效果，而且在有限的手机内存空间里，提高质量是很需要的。

针对相关技术中通过终端拍照难以捕捉到拍照对象最佳状态的问题，目前尚未存在有效的解决方案。

发明内容

以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。

本发明实施例提供了一种拍照的方法及装置，能够在终端拍照时捕捉到拍照对象最佳状态。

根据本发明实施例的一个方面，提供了一种拍照的方法，包括：在通过摄像头对拍照对象进行拍照时，对所述拍照对象的人脸状态进行识别，其中，所述人脸状态包括笑脸状态和非笑脸状态；根据识别到的人脸状态确定是否播放用于使拍摄对象呈现笑脸状态的语音提示音；在获取到所述拍照对象的笑脸状态时，对所述拍照对象进行拍照。

可选地，根据识别到的人脸状态确定是否播放用于使拍摄对象呈现笑脸状态的语音提示音包括：在识别到人脸状态为笑脸状态时，禁止播放所述语音提示音；在识别到人脸状态为非笑脸状态时，播放所述语音提示音。

可选地，所述方法还包括：在对所述拍照对象的人脸状态进行识别时，识别所述拍照对象的性别和/或年龄。

可选地，播放所述语音提示音包括：播放与所述拍照对象的性别和/或年龄匹配的语音提示音。

可选地，对所述拍照对象进行拍照包括：对所述拍照对象以预定时间间隔进行连拍直到所述拍照对象为非笑脸状态。

根据本发明实施例的另一个方面，提供了一种拍照的装置，包括：

第一识别模块，设置为在通过摄像头对拍照对象进行拍照时，对所述拍照对象的人脸状态进行识别，其中，所述人脸状态包括笑脸状态和非笑脸状态；播放模块，用于根据识别到的人脸状态确定是否播放用于使拍摄对象呈现笑脸状态的语音提示音；

拍照模块，设置为在获取到所述拍照对象的笑脸状态时，对所述拍照对象进行拍照。

可选地，所述播放模块包括：

禁止单元，设置为在识别到人脸状态为笑脸状态时，禁止播放所述语音提示音；

第一播放单元，设置为在识别到人脸状态为非笑脸状态时，播放所述语音提示音。

可选地，所述装置还包括：第二识别模块，设置为在对所述拍照对象的人脸状态进行识别时，识别所述拍照对象的性别和/或年龄。

可选地，所述播放模块还包括：第二播放单元，设置为在识别到人脸状态为非笑脸状态时，播放与所述拍照对象的性别和/或年龄匹配的语音提示音。

可选地，所述拍照模块包括：拍照单元，设置为对所述拍照对象以预定时间间隔进行连拍直到所述拍照对象为非笑脸状态。

通过本发明实施例，采用在通过摄像头对拍照对象进行拍照时，对拍照对象的人脸状态进行识别，根据识别到的人脸状态确定是否播放用于使拍摄对象呈现笑脸状态的语音提示音；从而在获取到拍照对象的笑脸状态时，对拍照对象进行拍照，也就是说，在对拍照对象进行拍照前，会识别拍照对象的人脸状态，并根据人脸状态确定是否播放促使拍照对象呈现笑脸状态的语音提示音，在拍照对象是笑脸状态时直接拍照，而在非笑脸状态时，通过提示音逗乐拍照对象，进而呈现笑脸以拍照，从而在终端拍照时捕捉到了拍照对象最佳状态，提高了用户体验。

在阅读并理解了附图和详细描述后，可以明白其他方面。

附图概述

图1是根据本发明实施例的拍照的方法的流程图；

图2是根据本发明实施例的拍照的装置结构框图；

图3是根据本发明实施例的拍照的装置可选结构框图一；

图4是根据本发明实施例的拍照的装置可选结构框图二；

图5是根据本发明实施例的拍照的装置可选结构框图三；

图6是根据本发明实施例的拍照的装置可选结构框图四。

本发明的实施方式

下文中将参考附图并结合实施例来详细说明本发明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。

在本实施例中提供了一种拍照的方法，图1是根据本发明实施例的拍照的方法的流程图，如图1所示，该流程包括如下步骤：

步骤S102：在通过摄像头对拍照对象进行拍照时，对拍照对象的人脸状态进行识别，其中，人脸状态包括笑脸状态和非笑脸状态；

步骤S104：根据识别到的人脸状态确定是否播放用于使拍摄对象呈现笑脸状态的语音提示音；

步骤S106：在获取到拍照对象的笑脸状态时，对拍照对象进行拍照。

通过本实施例的步骤S102至步骤S106，采用在通过摄像头对拍照对象进行拍照时，对拍照对象的人脸状态进行识别，根据识别到的人脸状态确定是否播放用于使拍摄对象呈现笑脸状态的语音提示音；从而在获取到拍照对象的笑脸状态时，对拍照对象进行拍照，也就是说，在对拍照对象进行拍照前，会识别拍照对象的人脸状态，并根据人脸状态确定是否播放促使拍照对象呈现笑脸状态的语音提示音，在拍照对象是笑脸状态时直接拍照，而在非笑脸状态时，通过提示音逗乐拍照对象，进而呈现笑脸以拍照，从而实现了在终端拍照时捕捉到了拍照对象的最佳状态，提高了用户体验。

在本实施例的可选实施方式中，对于本本实施例步骤S104中涉及到的根据识别到的人脸状态确定是否播放用于使拍摄对象呈现笑脸状态的语音提示音的方式，可以包括：

步骤S104-1，在识别到人脸状态为笑脸状态时，禁止播放语音提示音；

步骤S104-2，在识别到人脸状态为非笑脸状态时，播放语音提示音。

需要说明的是，本实施例中涉及到的语音提示音可以是利用成熟的网络搜索引擎搜索到适合拍照人年龄段的笑话文本、搞笑视频、图像交换格式(gif，Graphics Interchange Format)格式动画、逗乐自动抓怕快乐值最高时的照片或保留这段小录像。

而在本实施例的另一个可选实施方式中，本实施例的方法还包括：

步骤S11：在对拍照对象的人脸状态进行识别时，识别拍照对象的性别和/或年龄；

步骤S12：而在识别到人脸状态为非笑脸状态时，播放与拍照对象的性别和/或年龄匹配的语音提示音。

也就是说，对于上述涉及到的语音提示音可以根据拍照对象的性别和/或年龄进行分类，终端可以自动播放相应的语音提示音，也可以是用户手动调整语音提示音。

上述方法中，播放与拍照对象的性别和/或年龄匹配的语音提示音可以通过在终端中预先设置性别和/或年龄、语音提示音之间的对应关系来实现，当识别出拍照对象的性别和/或年龄后，如果识别到人脸状态为非笑脸状态，则在对应关系中查找拍照对象的性别和/或年龄对应的语音提示音，并播放。

而在本实施例的另一个可选实施方式中，对于本实施例步骤S106中涉及到对拍照对象进行拍照的方式，可以通过如下方式来实现：对拍照对象以预定时间间隔进行连拍直到拍照对象为非笑脸状态。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明每一个实施例所述的方法。

上述方法可以通过终端实现。

在本实施例中还提供了一种拍照的装置，该装置用于实现上述实施例及可选实施方式，已经进行过说明的不再赘述。如以下所使用的，术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。

图2是根据本发明实施例的拍照的装置结构框图，如图2所示，该装置包括：第一识别模块22，设置为在通过摄像头对拍照对象进行拍照时，对拍照对象的人脸状态进行识别，其中，人脸状态包括笑脸状态和非笑脸状态；播放模块24，与第一识别模块22耦合连接，设置为根据识别到的人脸状态确定是否播放用于使拍摄对象呈现笑脸状态的语音提示音；拍照模块26，与第一识别模块22耦合连接，设置为在获取到拍照对象的笑脸状态时，对拍照对象进行拍照。

图3是根据本发明实施例的拍照的装置可选结构框图一，如图3所示，该播放模块24包括：禁止单元32，与第一识别模块22耦合连接，设置为在识别到人脸状态为笑脸状态时，禁止播放语音提示音；第一播放单元34，与第一识别模块22耦合连接，设置为在识别到人脸状态为非笑脸状态时，播放语音提示音。

图4是根据本发明实施例的拍照的装置可选结构框图二，如图4所示，该装置还包括：第二识别模块42，与第一识别模块22和播放模块24耦合连接，设置为在对拍照对象的人脸状态进行识别时，识别拍照对象的性别和/或年龄。

图5是根据本发明实施例的拍照的装置可选结构框图三，如图5所示，该播放模块24还包括：第二播放单元52，与第一识别模块22和第二识别模块42耦合连接，设置为在识别到人脸状态为非笑脸状态时，播放与拍照对象的性别和/或年龄匹配的语音提示音。

需要说明的是，该第二播放单元52是第一播放单元34更下位的播放单元。

图6是根据本发明实施例的拍照的装置可选结构框图四，如图6所示，该拍照模块26包括：拍照单元62，设置为对拍照对象以预定时间间隔进行连拍直到拍照对象为非笑脸状态。

需要说明的是，上述每一个模块是可以通过软件或硬件来实现的，对于后者，可以通过以下方式实现，但不限于此：上述模块均位于同一处理器中；或者，上述模块分别位于多个处理器中。

下面结合本发明的可选实施例对本发明进行举例说明；

本可选实施例提供了一种拍照方法，在该方法中启动相机的笑脸或笑声检测模块捕捉后自动拍照，提高了拍摄成功率和出片率，降低内存负担，并减少人工删除差片的冗余流程，且整个拍摄过程乐趣十足，给拍摄者和被拍摄者带来快乐感，达到更好的拍照心情或拍照瞬间。

本可选实施例涉及到了终端的摄像头，内置笑脸或笑声检测模块(后面以快乐值定义)；在拍照的过程中，启动上述笑脸或笑声检测功能，并灵活运用语音对话等人机交互，利用成熟的网络搜索引擎搜索到适合拍照人年龄段的笑话文本或者搞笑视频，以逗乐自动抓怕快乐值最高时的照片，或连拍，或保留快乐值最高时前后一段时间的小录像。或者随机搜索并预览本机收藏的图片、视频或笑声朗朗的录音段子，来增加拍照人的幸福感或存在感进行拍照或连拍或小录像。

本可选实施例的拍照方法的的方法包括：

步骤S702，开启和检测。

其中，开启拍照功能，即开启笑脸或笑声检测模块，只要在一段时间内识别到无笑脸或者快乐值低，后台自动进入人机交互模块。

步骤S704，当检测到被拍摄者无笑脸时，启动人机交互模块。

其中，根据拍照人(即上述拍照对象)不同的状态或场景给予不同的语音提示，根据拍照人的年龄，性格等特点给出适合的检索内容：搞笑文本、搞笑视频或gif、搞笑录音小段子，或者展示收藏过的本地视频或图片或录音。可按拍照人的需求进行人机交互选择，达到任意展示或者轮番展示。

步骤S706，当捕捉到拍照人的笑脸或者笑声时，快速拍照；

其中，也可以是连拍，或小录像。

下面结合本可选实施例涉及到的硬件和软件，在具体应用场景中对本可选实施例进行详细说明；本可选实施例涉及到的硬件包括：摄像头、内置笑脸或笑声检测模块、语音模块；软件：网络搜索引擎等。

启动摄像头，在拍照的过程中，启动笑脸或(or)笑声检测功能，判断快乐值情况，运用语音对话、笑话展示、笑脸笑声捕捉等人机交互，利用成熟的网络搜索引擎(含文本和视频等格式)，搜索到适合拍照人年龄段(适当参考性别)的笑话文本、搞笑视频、gif格式动画，逗乐自动抓怕快乐值最高时的照片或保留这段小录像。或者随机搜索并预览本机收藏的图片or视频，or笑声朗朗的录音段子，来增加拍照人的幸福感或存在感进行拍照。该具体实施例的方法包括：

步骤S802，开启拍照功能，此时笑脸或笑声检测(可以利用情绪识别)开启，只要识别到无笑脸或者情绪值低(对应于上述实施例中的非笑脸状态)，例如，记录快乐值的初值HAPPY(TN+0)，后台自动进入人机交互模块。

其中，如果当拍照人拍过一组照片后，根据快乐值得出，此人状态一直不笑，很酷，记录当前笑脸值并进入S804的人机交互模块。

步骤S804，语音小助手会发音提示(对应于上述实施例中的语音提示音)，同时弹出小图标“点我试试”，当拍照人选择，进入步骤S806。

其中，该提示音可以是：主人，给自己一个笑脸吧？美美哒；需要说明的是，可以根据不同性别、年龄来给出不同提示。

整个过程中，为不打扰拍照人情绪，可以不中断逗笑过程，不停的去对比前一秒或前几秒的快乐值，取最优的值，作为最终图片。也可以连拍不同状态的照片，由拍照人自己选择留哪一组或一张照片。

步骤S806，随机弹出后台已经根据参考年龄or性别检索出的内容，给予展示。同时，在后台不断捕捉拍照人的笑脸或笑声。一旦捕捉到就进入步骤S808。

其中，检索分网络检索和本地检索；网络检索，主要检索的内容为：文本笑话，或语音，或视频、或搞笑图片组合。本地检索的内容是本机中已经标记为收藏的图片或照片、视频或录音。根据网络和本地检索内容分别做以下说明：

1，网络检索包括：文本：搜索到当前比较热门的小段子笑话；视频：搜索到并播放搞笑视频or gif动画；搞笑图片集：搜索到搞笑图片集；小段子录音：名人小段子；

2，本地检索包括：本机标记为已经收藏的图片；已经录制的视频(可以根据播放次数排优先级等)；录音段子(可以根据播放次数，本录音笑点评分等)；

上述检索的内容可以按拍照人需求次序或者随机轮流播放，也可以根据所检索到的某一类内容轮流播放，如第一个文本笑话达不到效果，即将拍照人快乐值的初值Happy(Tn+0)和现在的值HAPPY(Tn+1)进行比较:

当Happy(Tn+1)>HAPPY(Tn+0)时，保存当前照片；

当Happy(Tn+1)<＝HAPPY(Tn+0)时，继续下一展示(且此时的N值自动加1)；继续记录快乐值，继续对比本次记录的快乐值和上一次记录的快乐值，保留分值较高(可以更具拍照人自己选择模式，进行覆盖或者保留)。

在没有明显提升或者比初始值还低时，语音提示再来一组视频，直到当前快乐值比初始值高，进入步骤S808。需要说明的是，在本实施例中涉及到的初始值和现在的值统一称为快乐值，即取快乐值最高的。

此外，在终端的搜索一栏中可以增加定位一个拍照人的籍贯或生长地点，可以有更多的当地文化内容搜索，如脱口秀之类的。如四川的李白清—适合大多数四川重庆人，老少皆宜。如上海的周立波脱口秀之类的。

对于小孩可以有小动画以供选择，设计出小孩哭闹的时候，逗逗小朋友，留下前后哭和笑的照片，值得做一组对比照保存展现。

步骤S808，快乐值前后对比选取最佳记录图片或图片流。

其中，在步骤S806的展示过程中，拍照人的情绪会逐渐变化，摄像头不断记录，拍下快乐值最高画面，即不断记录现有值，和下一时刻笑脸值对比，保留最佳时刻图片或图片流(达到连拍效果)。当捕捉到拍照人笑声时(可以用受话器感应等方式获取笑声入口)，同样流程处理，记录下最佳值的。即当人脸识别到快乐值最高或捕捉到笑声，就进入步骤S810。

步骤S810，呈现抓拍笑中的拍照对象，呈现连拍变化中的拍照对象，呈现录制快乐中的拍照对象。

其中，每一个快乐值的提升点都可以作为连拍的一个点记录。为了不打扰欣赏的雅兴，可以选择后台一直抓拍，或录制笑声的瞬间片段视频，然后等结束后，提示：例如，主人，真替你高兴，(弹出高兴的鬼脸)来看看你的魅力容颜吧，精彩一瞬间等提示。

需要说明的是，对于上述涉及到的语音小助手，是以语音形式给予每一种情况下的语音提示，语音语调适合不同判断场景、弹出鬼脸、萌脸，调皮脸。

后台搜索：可以根据拍照人的网络情况选择搜索的范围、内容大小等。也可以根据拍照人网络情况选择，例如wifi情况下，网络优先。拍照人同意情况下，网络优先等。

笑脸检测功能：这里可以和快乐值(happy值)高低直接关联，当微笑、大笑、为快乐值高，不笑时定义为快乐值很一般，不笑且有沮丧表情为快乐值低，哭泣为快乐值负数等。实现中快乐值可以取-1到1区间，Happy＝[-1，1]。

本发明的实施例还提供了一种存储介质。可选地，在本实施例中，上述存储介质可以被设置为存储用于执行以下步骤的程序代码：

步骤S1：在通过摄像头对拍照对象进行拍照时，对拍照对象的人脸状态进行识别，其中，人脸状态包括笑脸状态和非笑脸状态；

步骤S2：根据识别到的人脸状态确定是否播放用于使拍摄对象呈现笑脸状态的语音提示音；

步骤S3：在获取到拍照对象的笑脸状态时，对拍照对象进行拍照。

可选地，本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例，本实施例在此不再赘述。

显然，本领域的技术人员应该明白，上述的本发明的每一个模块或每一个步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件结合。

本发明实施例还提出了一种计算机可读存储介质，存储有计算机可执行指令，计算机可执行指令用于执行上述描述的任意一个方法。

本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件(例如处理器)完成，所述程序可以存储于计算机可读存储介质中，如只读存储器、磁盘或光盘等。可选地，上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地，上述实施例中的各模块/单元可以采用硬件的形式实现，例如通过集成电路来实现其相应功能，也可以采用软件功能模块的形式实现，例如通过处理器执行存储与存储器中的程序/指令来实现其相应功能。本发明不限于任何特定形式的硬件和软件的结合。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

工业实用性

上述技术方案在终端拍照时捕捉到了拍照对象最佳状态，提高了用户体验。

Claims

一种拍照的方法，包括：

在通过摄像头对拍照对象进行拍照时，对所述拍照对象的人脸状态进行识别，其中，所述人脸状态包括笑脸状态和非笑脸状态；

根据识别到的人脸状态确定是否播放用于使拍摄对象呈现笑脸状态的语音提示音；

在获取到所述拍照对象的笑脸状态时，对所述拍照对象进行拍照。
根据权利要求1所述的方法，其中，根据识别到的人脸状态确定是否播放用于使拍摄对象呈现笑脸状态的语音提示音包括：

在识别到人脸状态为笑脸状态时，禁止播放所述语音提示音；

在识别到人脸状态为非笑脸状态时，播放所述语音提示音。
根据权利要求2所述的方法，所述方法还包括：

在对所述拍照对象的人脸状态进行识别时，识别所述拍照对象的性别和/或年龄。
根据权利要求3所述的方法，其中，播放所述语音提示音包括：

播放与所述拍照对象的性别和/或年龄匹配的语音提示音。
根据权利要求1所述的方法，其中，对所述拍照对象进行拍照包括：

对所述拍照对象以预定时间间隔进行连拍直到所述拍照对象为非笑脸状态。
一种拍照的装置，包括：

第一识别模块，设置为在通过摄像头对拍照对象进行拍照时，对所述拍照对象的人脸状态进行识别，其中，所述人脸状态包括笑脸状态和非笑脸状态；

播放模块，设置为根据识别到的人脸状态确定是否播放用于使拍摄对象呈现笑脸状态的语音提示音；

拍照模块，设置为在获取到所述拍照对象的笑脸状态时，对所述拍照对象进行拍照。
根据权利要求6所述的装置，其中，所述播放模块包括：

禁止单元，设置为在识别到人脸状态为笑脸状态时，禁止播放所述语音提示音；

第一播放单元，设置为在识别到人脸状态为非笑脸状态时，播放所述语音提示音。
根据权利要求7所述的装置，所述装置还包括：

第二识别模块，设置为在对所述拍照对象的人脸状态进行识别时，识别所述拍照对象的性别和/或年龄。
根据权利要求8所述的装置，所述播放模块还包括：

第二播放单元，设置为在识别到人脸状态为非笑脸状态时，播放与所述拍照对象的性别和/或年龄匹配的语音提示音。
根据权利要求6所述的装置，其中，所述拍照模块包括：

拍照单元，设置为对所述拍照对象以预定时间间隔进行连拍直到所述拍照对象为非笑脸状态。