CN106603919A

CN106603919A - 调整拍摄对焦的方法及终端

Info

Publication number: CN106603919A
Application number: CN201611189220.9A
Authority: CN
Inventors: 陈喜玲
Original assignee: JRD Communication Shenzhen Ltd
Current assignee: JRD Communication Shenzhen Ltd
Priority date: 2016-12-21
Filing date: 2016-12-21
Publication date: 2017-04-26

Abstract

本发明公开了一种调整拍摄对焦的方法及终端。其中，所述方法包括：在拍摄过程中获得现场声音；判断是否存在与现场声音匹配的预存声音；若存在匹配的预存声音，则判断拍摄获得的图像数据中是否存在与预存声音对应的被拍摄对象数据；若存在对应的被拍摄对象数据，自动将拍摄的焦点对准或避开被拍摄对象。通过上述方式，本发明能够智能调整对焦，方便拍摄。

Description

调整拍摄对焦的方法及终端

技术领域

本发明涉及电子信息技术领域，特别是涉及一种调整拍摄对焦的方法及终端。

背景技术

一般情况下，在录像的时候，往往希望重点突出说话的人在说话时的画面。目前主要是由摄影师手动的寻找说话的人，然后将摄像头转向这个方向并手动对焦，这个过程比较麻烦。而且在对焦的过程中，焦距会不断地变化，直到画面达到系统要求的清晰度为止。对于录像来说，会严重破坏画面的整体稳定性和流程性，影响拍摄的质量和进程。

发明内容

本发明主要解决的技术问题是提供一种调整拍摄对焦的方法及终端，能够智能调整对焦，方便拍摄。

为解决上述技术问题，本发明采用的一个技术方案是：提供一种调整拍摄对焦的方法，包括：在拍摄过程中获得现场声音；判断是否存在与现场声音匹配的预存声音；若存在匹配的预存声音，则判断拍摄获得的图像数据中是否存在与预存声音对应的被拍摄对象数据；若存在对应的被拍摄对象数据，自动将拍摄的焦点对准或避开被拍摄对象。

其中，判断拍摄获得的图像数据中是否存在与预存声音对应的被拍摄对象数据包括：获得拍摄获得的图像数据中每一被拍摄对象数据的特征；将拍摄获得的图像数据中的所有被拍摄对象数据的特征一一与预存声音对应的预设被拍摄对象数据的特征匹配；若拍摄获得的图像数据中存在匹配的拍摄对象数据的特征，则判断为拍摄获得的图像数据中存在与预存声音对应的被拍摄对象数据。

其中，获得拍摄获得的图像数据中每一被拍摄对象数据的特征之前包括：判断拍摄获得的图像数据中是否存在被拍摄对象数据；若不存在被拍摄对象数据，则结束流程；若存在被拍摄对象数据，则继续执行获得拍摄获得的图像数据中每一被拍摄对象数据的特征的步骤。

其中，判断是否存在与现场声音匹配的预存声音包括：获得现场声音的特征；判断预存的声音特征数据集合中是否存在与现场声音的特征匹配的预存声音特征；若存在匹配的预存声音特征，则判断为存在与现场声音匹配的预存声音。

其中，存在与预存声音对应的被拍摄对象数据包括：预存声音是在映射表中查找对应的被拍摄对象数据而得到，映射表预设各个对应的被拍摄对象数据与预存声音的映射关系。

其中，自动将拍摄的焦点对准或避开被拍摄对象包括：在拍摄画面中获得被拍摄对象的位置；将拍摄焦点移动至被拍摄对象的位置进行对焦；或，将拍摄设备的拍摄角度旋转、或移动至被拍摄对象的位置或方向进行对焦。

其中，自动将拍摄的焦点对准或避开被拍摄对象之后，包括：调整被拍摄对象在拍摄画面中的位置、大小，使被拍摄对象在拍摄画面中占据主要区域/以主角形式显示。

为解决上述技术问题，本发明采用的另一个技术方案是：提供一种调整拍摄对焦的终端，包括：获得声音模块，用于在拍摄过程中获得现场声音；第一判断模块，用于判断是否存在与现场声音匹配的预存声音；第二判断模块，用于在存在匹配的预存声音时，判断拍摄获得的图像数据中是否存在与预存声音对应的被拍摄对象数据；拍摄模块，用于在存在对应的被拍摄对象数据时，自动将拍摄的焦点对准或避开被拍摄对象。

其中，第二判断模块具体包括：获得图像数据特征单元，用于获得拍摄获得的图像数据中每一被拍摄对象数据的特征；比对单元，用于将拍摄获得的图像数据中的所有被拍摄对象数据的特征一一与预存声音对应的预设被拍摄对象数据的特征匹配；匹配单元，用于在拍摄获得的图像数据中存在匹配的拍摄对象数据的特征时，判断拍摄获得的图像数据中存在与预存声音对应的被拍摄对象数据。

其中，获得图像数据特征单元之前包括：判断单元，用于判断拍摄获得的图像数据中是否存在被拍摄对象数据；继续单元，用于在不存在被拍摄对象数据时，结束流程；在存在被拍摄对象数据时，继续执行获得拍摄获得的图像数据中每一被拍摄对象数据的特征的步骤。

其中，第一判断模块具体用于：获得现场声音的特征；判断预存的声音特征数据集合中是否存在与现场声音的特征匹配的预存声音特征；若存在匹配的预存声音特征，则判断为存在与现场声音匹配的预存声音。

以上方案，终端设备在拍摄过程中获得现场声音，并判断是否存在与该现场声音匹配的预存声音；若存在匹配的预存声音，则判断拍摄获得的图像数据中是否存在与预存声音对应的被拍摄对象数据；若存在对应的被拍摄对象数据，自动将拍摄的焦点对准或避开被拍摄对象，实现了终端设备的快速对焦，并智能地将焦点对焦或避开到指定的人脸，方便拍摄。

附图说明

图1是本发明调整拍摄对焦的方法一实施方式的流程示意图；

图2是本发明调整拍摄对焦的方法另一实施方式的流程示意图；

图3是本发明调整拍摄对焦的方法又一实施方式的流程示意图；

图4是本发明调整拍摄对焦的终端一实施方式的结构示意图；

图5是本发明调整拍摄对焦的终端另一实施方式的结构示意图；

图6是本发明调整拍摄对焦的终端又一实施方式的结构示意图。

具体实施方式

下面结合附图和实施方式对本发明进行详细说明。

请参阅图1，图1是本发明调整拍摄对焦的方法一实施方式的流程示意图。需注意的是，若有实质上相同的结果，本发明的方法并不以图1所示的流程顺序为限。如图1所示，该方法包括如下步骤：

S101：在拍摄过程中获得现场声音。

其中，现场声音可以是指人类讲话的声音，也可以是动物的叫声，还可以是其他的声音。

S102：判断是否存在与现场声音匹配的预存声音。

其中，预存声音是用户预先采集的感兴趣的声音，预存声音可以是人类讲话的声音，也可以是动物的叫声，还可以是其他的声音。

在其中一个应用场景中，以预存的声音是人类讲话的声音为例。人类语言的产生是人体语言中枢与发音器官之间一个复杂的生理物理过程。人的发声器官存在着大小、形态及功能上的差异。发声控制器官包括声带、软颚、舌头、牙齿、唇等，发声共鸣器包括咽腔、口腔、鼻腔。这些器官的微小差异都会导致发声气流的改变，造成音质、音色的差别。此外，人发声的习惯亦有快有慢，用力有大有小，也造成音强、音长的差别。音高、音强、音长、音色在语言学中被称为语音“四要素”，这些因素又可分解成九十余种特征。这些特征表现了不同声音的不同波长、频率、强度、节奏。电声学仪器可以把声波的变化转换成电讯号的强度、波长、频率、节奏变化，仪器又把这些电讯号的变化绘制成声波频谱图形，也即是声纹图。

其中，判断现场声音与预存声音是否匹配，也即是提取声音的声纹特征进行比较。

S103：若存在匹配的预存声音，则判断拍摄获得的图像数据中是否存在与预存声音对应的被拍摄对象数据。

其中，拍摄获得的图像数据与预存声音对应的被拍摄对象数据可以是指人，也可以指动物，还可以其他的物体。

其中，在判断拍摄获得的图像数据中是否存在与预存声音对应的被拍摄对象数据都指人时，可以采用人脸识别技术进行比对。

其中，预存声音是在映射表中查找对应的被拍摄对象数据而得到，映射表预设各个对应的被拍摄对象数据与预存声音的映射关系。

S104：若存在对应的被拍摄对象数据，自动将拍摄的焦点对准或避开被拍摄对象。

其中，自动将拍摄的焦点对准被拍摄对象是指，在拍摄画面中获得被拍摄对象的位置，并将拍摄焦点移动至被拍摄对象的位置进行对焦。自动将拍摄的焦点避开被拍摄对象是指，在拍摄画面中获得被拍摄对象的位置，将对焦位置避开被拍摄对象。

在另外一种实现方式中，可以将拍摄设备的拍摄角度旋转、或移动至被拍摄对象的位置或方向进行对焦。

在自动将拍摄的焦点对准或避开被拍摄对象之后，调整被拍摄对象在拍摄画面中的位置、大小，使被拍摄对象在拍摄画面中占据主要区域/以主角形式显示。

具体地，终端设备自动将拍摄的焦点的对准指定的物体，例如正在讲话的人。

本实施方式中，终端设备在拍摄过程中获得现场声音，并判断是否存在与该现场声音匹配的预存声音；若存在匹配的预存声音，则判断拍摄获得的图像数据中是否存在与预存声音对应的被拍摄对象数据；若存在对应的被拍摄对象数据，自动将拍摄的焦点对准或避开被拍摄对象，实现了终端设备的快速对焦，并智能地将焦点对焦或避开到指定的人脸，方便拍摄。

请参阅图2，图2是本发明调整拍摄对焦的方法另一实施方式的流程示意图。本实施方式是判断拍摄获得的图像数据中是否存在与预存声音对应的被拍摄对象数据的其中一个方法，该方法包括以下步骤：

S201：获得拍摄获得的图像数据中每一被拍摄对象数据的特征。

其中，在获得拍摄获得的图像数据中每一被拍摄对象数据的特征之前，先判断拍摄获得的图像数据中是否存在被拍摄对象数据。若不存在被拍摄对象数据，则结束流程；若存在被拍摄对象数据，则继续提取拍摄获得的图像数据中每一被拍摄对象数据的特征。

其中，当被拍摄对象数据是指人脸时，拍摄获得的图像数据中每一被拍摄对象数据的特征是指人脸的特征。人脸的特征可以是眼虹膜、鼻翼、嘴角等面像五官轮廓的大小、位置、距离等特征，进一步计算其几何特征量。也可以是，拍摄获得的人脸的几何特征量与数据库中标准面部模板或面部器官的模板的几何特征量的差异。

S202：将拍摄获得的图像数据中的所有被拍摄对象数据的特征一一与预存声音对应的预设被拍摄对象数据的特征匹配。

其中，将拍摄获得的图像数据中的被拍摄对象数据与预存声音对应的预设被拍摄对象数据的特征进行匹配，也就是将拍摄获得的人脸数据与预存声音对应的人脸数据进行特征匹配。

其中，进行人脸特征对比的方法有Adaboost法(实质是一种迭代算法)、特征向量法和面纹模板法等。其中，特征向量法是先确定眼虹膜、鼻翼、嘴角等面像五官轮廓的大小、位置、距离等特征，再计算出它们的几何特征量，这些几何特征量的集合即组成描述脸部特征的几何特征向量。面纹模板法是在数据库中存放一些标准面部模板或面部器官的模板，采集待测面部图片的特征向量集等与模板的数据进行对比。

S203：若拍摄获得的图像数据中存在匹配的拍摄对象数据的特征，则判断为拍摄获得的图像数据中存在与预存声音对应的被拍摄对象数据。

本实施方式中，终端设备先获得拍摄获得的图像数据中每一所被拍摄对象数据的特征，然后将拍摄获得的图像数据中的所有被拍摄对象数据的特征一一与预存声音对应的预设被拍摄对象数据的特征匹配；若拍摄获得的图像数据中存在匹配的拍摄对象数据的特征，则判断为拍摄获得的图像数据中存在与预存声音对应的被拍摄对象数据，为终端设备的快速对焦做了准备。

请参阅图3，图3是本发明调整拍摄对焦的方法又一实施方式的流程示意图。本实施方式是判断是否存在与现场声音匹配的预存声音的其中一个方法，该方法包括以下步骤：

S301：获得现场声音的特征。

其中，现场声音的特征是指声纹特征。

S302：判断预存的声音特征数据集合中是否存在与现场声音的特征匹配的预存声音特征。

其中，提取预存的声音的声纹特征与现场声音的声纹特征进行比对。

S303：若存在匹配的预存声音特征，则判断为存在与现场声音匹配的预存声音。

其中，若是所提取的预存的声音的声纹特征与现场声音的声纹特征的匹配度大于等于匹配阈值，则判断预存的声音数据库中存在与现场声音匹配的预存声音。

其中，由于每个人的语音声学特征既有相对稳定性，又有变异性，不是绝对的、一成不变的。这种变异可来自生理、病理、心理、模拟、伪装，也与环境干扰有关。例如，不同的麦克风和信道、环境噪音、混合说话人的情形等等，均会对人的声纹特征提取进行一定程度的干扰。因此，预存的声音的声纹特征与现场声音的声纹特征的匹配度有可能达不到100％，所以终端系统会预设一个声纹特征匹配阈值。

本实施方式中，终端设备先获得现场声音的特征，并判断预存的声音特征数据集合中是否存在与现场声音的特征匹配的预存声音特征；若存在匹配的预存声音特征，则判断为存在与现场声音匹配的预存声音，为在录制过程中，能突出录制说话的人做了准备。

请参阅图4，图4是本发明调整拍摄对焦的终端一实施方式的结构示意图。本实施方式中，该终端40是上述实施方式中的终端，该终端40包括获得声音模块41、第一判断模块42、第二判断模块43及拍摄模块44。

获得声音模块41用于在拍摄过程中获得现场声音。

第一判断模块42用于判断是否存在与现场声音匹配的预存声音。

第二判断模块43用于在存在匹配的预存声音时，判断拍摄获得的图像数据中是否存在与预存声音对应的被拍摄对象数据。

拍摄模块44用于在存在对应的被拍摄对象数据时，自动将拍摄的焦点对准或避开被拍摄对象。

其中，第一判断模块42具体用于获得现场声音的特征；判断预存的声音特征数据集合中是否存在与现场声音的特征匹配的预存声音特征；若存在匹配的预存声音特征，则判断为存在与现场声音匹配的预存声音。

其中，获得声音模块41所获得的声音可以是指人类讲话的声音，也可以是动物的叫声，还可以是其他的声音。

其中，第一判断模块42具体用于提取现场声音的声纹特征，并与预存的声音的声纹特征进行比对。

其中，第二判断模块43还具有一张映射表，该映射表预存各个对应的被拍摄对象数据与预存声音的映射关系。

其中，拍摄模块44还用于调整被拍摄对象在拍摄画面中的位置、大小，使被拍摄对象在拍摄画面中占据主要区域/以主角形式显示。

请参阅图5，图5本发明调整拍摄对焦的终端另一实施方式的结构示意图。区别于上一实施方式，本实施方式所述终端50还包括：判断单元51、继续单元52，终端50中的第二判断模块53包括：获得图像数据特征单元531、比对单元532及匹配单元533。

判断单元51用于判断拍摄获得的图像数据中是否存在被拍摄对象数据。

继续单元52用于在不存在被拍摄对象数据时，结束流程；若存在被拍摄对象数据时，继续执行获得图像数据特征单元531。

获得图像数据特征单元531用于获得拍摄获得的图像数据中每一被拍摄对象数据的特征。

比对单元532用于将拍摄获得的图像数据中的所有被拍摄对象数据的特征一一与预存声音对应的预设被拍摄对象数据的特征匹配。

匹配单元533用于在拍摄获得的图像数据中存在匹配的拍摄对象数据的特征时，判断拍摄获得的图像数据中存在与预存声音对应的被拍摄对象数据。

上述通信终端40/50的各个模块可分别执行上述方法实施例中对应步骤，故在此不对各模块进行赘述，详细请参阅以上对应步骤的说明。

请参阅图6，图6是本发明调整拍摄对焦的终端又一实施方式的结构示意图。该终端可以执行上述方法中终端执行的步骤。相关内容请参见上述方法中的详细说明，在此不再赘叙。

本实施方式中，该处理装置包括：处理器61、与处理器61耦合的存储器62及摄像头63。

存储器62用于存储操作系统、处理器61执行的指令以及接收到的消息等。

具体地，存储器62还用于预存各个对应的被拍摄对象数据与预存声音的映射关系。

摄像头63用于执行处理器61的指令，在拍摄画面中获得被拍摄对象的位置，对选中的被拍摄对象数据进行对焦拍摄，或，将拍摄角度旋转、或移动至被拍摄对象的位置或方向进行对焦。

处理器61用于在拍摄过程中获得现场声音；判断是否存在与现场声音匹配的预存声音；若存在匹配的预存声音，则判断拍摄获得的图像数据中是否存在与预存声音对应的被拍摄对象数据；若存在对应的被拍摄对象数据，自动将拍摄的焦点对准或避开被拍摄对象。

具体地，处理器61用于获得拍摄获得的图像数据中每一被拍摄对象数据的特征；将拍摄获得的图像数据中的所有被拍摄对象数据的特征一一与预存声音对应的预设被拍摄对象数据的特征匹配；若拍摄获得的图像数据中存在匹配的拍摄对象数据的特征，则判断为拍摄获得的图像数据中存在与预存声音对应的被拍摄对象数据。

具体地，处理器61用于判断拍摄获得的图像数据中是否存在被拍摄对象数据；若不存在被拍摄对象数据，则结束流程；若存在被拍摄对象数据，则继续执行获得拍摄获得的图像数据中每一被拍摄对象数据的特征的步骤。

具体地，处理器61用于获得现场声音的特征；判断预存的声音特征数据集合中是否存在与现场声音的特征匹配的预存声音特征；若存在匹配的预存声音特征，则判断为存在与现场声音匹配的预存声音。

具体地，处理器61用于调整被拍摄对象在拍摄画面中的位置、大小，使被拍摄对象在拍摄画面中占据主要区域/以主角形式显示。

以上所述仅为本发明的实施方式，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种调整拍摄对焦的方法，其特征在于，包括：

在拍摄过程中获得现场声音；

判断是否存在与所述现场声音匹配的预存声音；

若存在匹配的所述预存声音，则判断所述拍摄获得的图像数据中是否存在与所述预存声音对应的被拍摄对象数据；

若存在对应的所述被拍摄对象数据，自动将所述拍摄的焦点对准或避开所述被拍摄对象。

2.根据权利要求1所述的方法，其特征在于，

判断所述拍摄获得的图像数据中是否存在与所述预存声音对应的被拍摄对象数据包括：

获得所述拍摄获得的图像数据中每一所述被拍摄对象数据的特征；

将所述拍摄获得的图像数据中的所有所述被拍摄对象数据的特征一一与所述预存声音对应的预设被拍摄对象数据的特征匹配；

若所述拍摄获得的图像数据中存在匹配的所述拍摄对象数据的特征，则判断为所述拍摄获得的图像数据中存在与所述预存声音对应的被拍摄对象数据。

3.根据权利要求2所述的方法，其特征在于，

所述获得所述拍摄获得的图像数据中每一所述被拍摄对象数据的特征之前包括：

判断所述拍摄获得的图像数据中是否存在被拍摄对象数据；

若不存在所述被拍摄对象数据，则结束流程；若存在所述被拍摄对象数据，则继续执行所述获得所述拍摄获得的图像数据中每一所述被拍摄对象数据的特征的步骤。

4.根据权利要求1至3任一项所述的方法，其特征在于，

所述判断是否存在与所述现场声音匹配的预存声音包括：

获得所述现场声音的特征；

判断预存的声音特征数据集合中是否存在与所述现场声音的特征匹配的预存声音特征；

若存在匹配的所述预存声音特征，则判断为存在与所述现场声音匹配的预存声音。

5.根据权利要求1至3任一项所述的方法，其特征在于，

所述存在与所述预存声音对应的被拍摄对象数据包括：

所述预存声音是在映射表中查找所述对应的被拍摄对象数据而得到，所述映射表预设各个所述对应的被拍摄对象数据与所述预存声音的映射关系。

6.根据权利要求1至3任一项所述的方法，其特征在于，

所述自动将所述拍摄的焦点对准或避开所述被拍摄对象包括：

在所述拍摄画面中获得所述被拍摄对象的位置；

将拍摄焦点移动至所述被拍摄对象的位置进行对焦；或

将拍摄设备的拍摄角度旋转、或移动至被拍摄对象的位置或方向进行对焦。

7.一种调整拍摄对焦的终端，其特征在于，包括：

获得声音模块，用于在拍摄过程中获得现场声音；

第一判断模块，用于判断是否存在与所述现场声音匹配的预存声音；

第二判断模块，用于在存在匹配的所述预存声音时，判断所述拍摄获得的图像数据中是否存在与所述预存声音对应的被拍摄对象数据；

拍摄模块，用于在存在对应的所述被拍摄对象数据时，自动将所述拍摄的焦点对准或避开所述被拍摄对象。

8.根据权利要求7所述的终端，其特征在于，

所述第二判断模块具体包括：

获得图像数据特征单元，用于获得所述拍摄获得的图像数据中每一所述被拍摄对象数据的特征；

比对单元，用于将所述拍摄获得的图像数据中的所有所述被拍摄对象数据的特征一一与所述预存声音对应的预设被拍摄对象数据的特征匹配；

匹配单元，用于在所述拍摄获得的图像数据中存在匹配的所述拍摄对象数据的特征时，判断所述拍摄获得的图像数据中存在与所述预存声音对应的被拍摄对象数据。

9.根据权利要求8所述的终端，其特征在于，

所述获得图像数据特征单元之前包括：

判断单元，用于判断所述拍摄获得的图像数据中是否存在被拍摄对象数据；

继续单元，用于在不存在所述被拍摄对象数据时，结束流程；在存在所述被拍摄对象数据时，继续执行所述获得所述拍摄获得的图像数据中每一所述被拍摄对象数据的特征的步骤。

10.根据权利要求7至9任一项所述的终端，其特征在于，

所述第一判断模块具体用于：

获得所述现场声音的特征；