CN114049878A

CN114049878A - 一种基于语音识别的自动对焦方法、系统及移动终端

Info

Publication number: CN114049878A
Application number: CN202111335109.7A
Authority: CN
Inventors: 林泽嘉; 孔德尚
Original assignee: Huizhou TCL Mobile Communication Co Ltd
Current assignee: Huizhou TCL Mobile Communication Co Ltd
Priority date: 2021-11-11
Filing date: 2021-11-11
Publication date: 2022-02-15
Anticipated expiration: 2041-11-11
Also published as: WO2023082846A1

Abstract

本发明公开了一种基于语音识别的自动对焦方法、系统及移动终端，所述方法包括：当检测到移动终端的相机开始拍摄时，控制所述移动终端进入语音对焦模式，所述移动终端开启语音识别功能；在所述移动终端拍摄过程中，所述移动终端实时获取用户的语音信息，并识别所述语音信息中的对焦指令；所述移动终端根据所述对焦指令，控制马达推动镜头到所述对焦指令指定的位置完成对焦。本发明利用语音识别功能，用户通过语音反馈给移动终端需要对焦的距离，之后马达推动镜头到相应的位置，能弥补了马达自动对焦的不足，同时用户能够自由下发对焦距离，增加相机拍摄的便捷性和趣味性。

Description

一种基于语音识别的自动对焦方法、系统及移动终端

技术领域

本发明涉及相机对焦技术领域，尤其涉及一种基于语音识别的自动对焦方法、系统、移动终端及计算机可读存储介质。

背景技术

移动终端或者叫移动通信终端是指可以在移动中使用的计算机设备，广义的讲包括手机、笔记本、平板电脑、POS机甚至包括车载电脑。但是大部分情况下是指手机或者具有多种应用功能的智能手机以及平板电脑。随着网络和技术朝着越来越宽带化的方向的发展，移动通信产业将走向真正的移动信息时代。另一方面，随着集成电路技术的飞速发展，移动终端的处理能力已经拥有了强大的处理能力，移动终端正在从简单的通话工具变为一个综合信息处理平台。这也给移动终端增加了更加宽广的发展空间。

移动终端作为简单通信设备伴随移动通信发展已有几十年的历史。自2007年开始，智能化引发了移动终端基因突变，从根本上改变了终端作为移动网络末梢的传统定位。移动智能终端几乎在一瞬之间转变为互联网业务的关键入口和主要创新平台，新型媒体、电子商务和信息服务平台，互联网资源、移动网络资源与环境交互资源的最重要枢纽，其操作系统和处理器芯片甚至成为当今整个ICT产业的战略制高点。移动智能终端引发的颠覆性变革揭开了移动互联网产业发展的序幕，开启了一个新的技术产业周期。随着移动智能终端的持续发展，其影响力将比肩收音机、电视和互联网(PC)，成为人类历史上第4个渗透广泛、普及迅速、影响巨大、深入至人类社会生活方方面面的终端产品。

移动终端设备上都配备有语音识别功能和马达自动对焦系统。其中马达自动对焦是指使用相机拍照时，相机通过马达实现自动推动调焦镜头(focus lens)，改变物距与像距，从而使被拍物成像清晰的过程。目前马达实现自动对焦的方式主要有Contrast AF(Contrast Detection Auto Focus，反差对焦，通过对焦区域进行对比度检测，同时通过对焦马达驱动镜头模组镜片逐步移动，并实时记录对比度数值，当完成一次镜片全部位移之后系统就会得出反差最大的位置，最后再回到对比最大值的地方来完成对焦过程)、PDAF(Phase Detection Auto Focus，相位检测自动对焦，通过感光元件上预留出一些遮蔽像素点来充当自动对焦传感器，专门用来进行相位检测，通过比对左右两侧像素点的距离及其变化等来决定对焦的偏移值从而实现准确对焦)、LDAF(Laser Detection Auto Focus，激光对焦，通过单独的红外激光传感器向被摄物体发射红外激光，经过反射后被传感器接收，在计算出被摄物体之间的距离之后，对焦马达便会将镜片组驱动到相应位置完成对焦)等。但是无论是哪一种对焦方式，都存在缺陷，比如Contrast AF和PDAF在拍摄点光源场景或是平坦无细节场景容易失焦，LDAF只能在较短距离范围内进行准确对焦等，这无疑给用户带来困扰。

因此，现有技术还有待于改进和发展。

发明内容

本发明的主要目的在于提供一种基于语音识别的自动对焦方法、系统、移动终端及计算机可读存储介质，旨在解决现有技术中实现自动对焦时容易失焦以及无法实现长距离范围内准确对焦的问题。

为实现上述目的，本发明提供一种基于语音识别的自动对焦方法，所述基于语音识别的自动对焦方法包括如下步骤：

当检测到移动终端的相机开始拍摄时，控制所述移动终端进入语音对焦模式，所述移动终端开启语音识别功能；

在所述移动终端拍摄过程中，所述移动终端实时获取用户的语音信息，并识别所述语音信息中的对焦指令；

所述移动终端根据所述对焦指令，控制马达推动镜头到所述对焦指令指定的位置完成对焦。

可选地，所述的基于语音识别的自动对焦方法，其中，所述当检测到移动终端的相机开始拍摄时，控制所述移动终端进入语音对焦模式，所述移动终端开启语音识别功能，具体包括：

所述移动终端实时检测所述相机是否开启拍摄模式；

若所述移动终端检测到所述相机开启拍摄模式开始拍摄时，所述移动终端进入所述语音对焦模式，所述语音对焦模式为根据用户语音指令实现自动对焦的对焦模式；

当所述移动终端进入所述语音对焦模式后，所述移动终端开启语音识别功能以实时检测用户发出的语音。

可选地，所述的基于语音识别的自动对焦方法，其中，所述移动终端进入所述语音对焦模式，之后还包括：

所述移动终端通过弹框的方式在所述移动终端拍摄界面上在预设时间内显示所述移动终端已进入所述语音对焦模式。

可选地，所述的基于语音识别的自动对焦方法，其中，所述在所述移动终端拍摄过程中，所述移动终端实时获取用户的语音信息，并识别所述语音信息中的对焦指令，具体包括：

在所述移动终端拍摄过程中，若所述相机当前的对焦距离无法满足用户需求，则所述移动终端提示用户通过语音发出对焦指令；

所述移动终端实时获取用户发出的语音信息，并对用户发出的语音信息进行语音识别，根据预先设置的语音识别规则获取所述语音信息中的对焦指令。

可选地，所述的基于语音识别的自动对焦方法，其中，所述移动终端根据所述对焦指令，控制马达推动镜头到所述对焦指令指定的位置完成对焦，具体包括：

预先设置马达的驱动值和对焦距离的线性关系，所述线性关系用于所述马达根据对焦距离获取对应的驱动值；

所述移动终端获取到所述对焦指令后，根据所述对焦指令中的所述对焦距离在所述线性关系中获取所述马达对应的驱动值；

所述移动终端根据所述马达的驱动值控制所述马达推动镜头到所述驱动值指定的位置完成对焦。

可选地，所述的基于语音识别的自动对焦方法，其中，所述根据所述对焦指令中的所述对焦距离在所述线性关系中获取所述马达对应的驱动值，具体包括：

获取马达无穷远位置dis_inf、无穷远端驱动值dac_inf、超近焦位置dis_macro、以及超近焦位置驱动值dac_macro；

依据无穷远位置dis_inf和超近焦位置dis_macro，计算对应的distance值；

无穷远位置的distance值为distance_inf＝1/dis_inf；

超近焦位置的distance值为distance_macro＝1/dis_macro；

将通过语音获得的对焦距离dis转化为可用于计算的distance：distance＝1/dis；

根据驱动值和distance之间的线性关系，当用户下发对焦距离dis，则马达的驱动值：

dac_code＝dac_macro+(distance-distance_macro)/(distance_inf-distance_macro)*(dac_inf-dac_macro)。

可选地，所述的基于语音识别的自动对焦方法，其中，所述预设时间为3秒。

此外，为实现上述目的，本发明还提供一种基于语音识别的自动对焦系统，其中，所述基于语音识别的自动对焦系统包括：

对焦模式控制模块，用于当检测到移动终端的相机开始拍摄时，控制所述移动终端进入语音对焦模式，所述移动终端开启语音识别功能；

语音识别模块，用于在所述移动终端拍摄过程中，所述移动终端实时获取用户的语音信息，并识别所述语音信息中的对焦指令；

对焦控制模块，用于所述移动终端根据所述对焦指令，控制马达推动镜头到所述对焦指令指定的位置完成对焦。

此外，为实现上述目的，本发明还提供一种移动终端，其中，所述移动终端包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于语音识别的自动对焦程序，所述基于语音识别的自动对焦程序被所述处理器执行时实现如上所述的基于语音识别的自动对焦方法的步骤。

此外，为实现上述目的，本发明还提供一种计算机可读存储介质，其中，所述计算机可读存储介质存储有基于语音识别的自动对焦程序，所述基于语音识别的自动对焦程序被处理器执行时实现如上所述的基于语音识别的自动对焦方法的步骤。

本发明中，当检测到移动终端的相机开始拍摄时，控制所述移动终端进入语音对焦模式，所述移动终端开启语音识别功能；在所述移动终端拍摄过程中，所述移动终端实时获取用户的语音信息，并识别所述语音信息中的对焦指令；所述移动终端根据所述对焦指令，控制马达推动镜头到所述对焦指令指定的位置完成对焦。本发明利用语音识别功能，用户通过语音反馈给移动终端需要对焦的距离，之后马达推动镜头到相应的位置，能弥补了马达自动对焦的不足，同时用户能够自由下发对焦距离，增加相机拍摄的便捷性和趣味性。

附图说明

图1是本发明基于语音识别的自动对焦方法的较佳实施例的流程图；

图2是本发明基于语音识别的自动对焦方法的较佳实施例中步骤S10的流程图；

图3是本发明基于语音识别的自动对焦方法的较佳实施例中步骤S20的流程图；

图4是本发明基于语音识别的自动对焦方法的较佳实施例中步骤S30的流程图；

图5是本发明基于语音识别的自动对焦系统的较佳实施例的原理示意图；

图6为本发明移动终端的较佳实施例的运行环境示意图。

具体实施方式

为使本发明的目的、技术方案及优点更加清楚、明确，以下参照附图并举实施例对本发明进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本发明较佳实施例所述的基于语音识别的自动对焦方法，如图1所示，所述基于语音识别的自动对焦方法包括以下步骤：

步骤S10、当检测到移动终端的相机开始拍摄时，控制所述移动终端进入语音对焦模式，所述移动终端开启语音识别功能。

具体的过程请参阅图2，其为本发明提供的基于语音识别的自动对焦中步骤S10的流程图。

如图2所示，所述步骤S10包括：

S11、所述移动终端实时检测所述相机是否开启拍摄模式；

S12、若所述移动终端检测到所述相机开启拍摄模式开始拍摄时，所述移动终端进入所述语音对焦模式，所述语音对焦模式为根据用户语音指令实现自动对焦的对焦模式；

S13、当所述移动终端进入所述语音对焦模式后，所述移动终端开启语音识别功能以实时检测用户发出的语音。

具体地，所述移动终端(例如智能手机)实时检测所述相机是否开启拍摄模式，例如用户点击相机后即进入拍摄模式，若所述移动终端检测到所述相机开启拍摄模式开始拍摄时，所述移动终端进入所述语音对焦模式(相当于自动切换到语音对焦模式)，所述语音对焦模式为根据用户语音指令实现自动对焦的对焦模式，即用户可以通过语音发出指令控制所述移动终端进行自动对焦，当所述移动终端进入所述语音对焦模式后，所述移动终端开启语音识别功能以实时检测用户发出的语音，即开始实时监测用户发出的语音。

进一步地，所述移动终端通过弹框的方式在所述移动终端拍摄界面上在预设时间内显示所述移动终端已进入所述语音对焦模式，即所述移动终端进入所述语音对焦模式时，在所述移动终端的界面上显示一下所述移动终端已进入所述语音对焦模式的提示，显示的时间可以是3秒，便于用户知道此事已经进入语音对焦模式。

步骤S20、在所述移动终端拍摄过程中，所述移动终端实时获取用户的语音信息，并识别所述语音信息中的对焦指令。

具体的过程请参阅图3，其为本发明提供的基于语音识别的自动对焦中步骤S20的流程图。

如图3所示，所述步骤S20包括：

S21、在所述移动终端拍摄过程中，若所述相机当前的对焦距离无法满足用户需求，则所述移动终端提示用户通过语音发出对焦指令；

S22、所述移动终端实时获取用户发出的语音信息，并对用户发出的语音信息进行语音识别，根据预先设置的语音识别规则获取所述语音信息中的对焦指令。

具体地，在所述移动终端拍摄过程中，例如智能手机开启相机进行拍摄时，若所述相机当前的对焦距离无法满足用户需求，即用户发现当前拍摄的画面不清晰或者角度不对，无法满足对焦距离的要求时，则所述移动终端提示用户通过语音发出对焦指令，那么用户就可以根据提示发出相关的语音，所述移动终端实时获取用户发出的语音信息，并对用户发出的语音信息进行语音识别，根据预先设置的语音识别规则获取所述语音信息中的对焦指令，因为用户发出的语音中可能并不是仅仅包括了对焦指令，很可能还有其他不是对焦指令的语音，所以需要对用户发出的对焦指令进行提取。

步骤S30、所述移动终端根据所述对焦指令，控制马达推动镜头到所述对焦指令指定的位置完成对焦。

具体的过程请参阅图4，其为本发明提供的基于语音识别的自动对焦中步骤S30的流程图。

如图4所示，所述步骤S30包括：

S31、预先设置马达的驱动值和对焦距离的线性关系，所述线性关系用于所述马达根据对焦距离获取对应的驱动值；

S32、所述移动终端获取到所述对焦指令后，根据所述对焦指令中的所述对焦距离在所述线性关系中获取所述马达对应的驱动值；

S33、所述移动终端根据所述马达的驱动值控制所述马达推动镜头到所述驱动值指定的位置完成对焦。

具体地，预先设置马达的驱动值和对焦距离的线性关系，所述线性关系用于所述马达根据对焦距离获取对应的驱动值，因为对对焦距离进行调整是通过马达的驱动值(daccode值)来实现的，所以就需要预先设置好马达的驱动值和对焦距离的线性关系，然后所述移动终端获取到所述对焦指令后，根据所述对焦指令中的所述对焦距离在所述线性关系中获取所述马达对应的驱动值(dac code值)，最后所述移动终端根据所述马达的驱动值(daccode值)控制所述马达推动镜头(lens)到所述驱动值指定的位置完成对焦。

进一步地，根据所述对焦指令中的所述对焦距离在所述线性关系中获取所述马达对应的驱动值，具体包括：

(1)通过读取摄像头模组OTP，获取马达无穷远位置dis_inf(单位：m)、无穷远端dac code值dac_inf(单位：dac)及超近焦位置dis_macro(单位：m)、超近焦位置dac code值dac_macro(单位：dac)。

(2)依据无穷远位置dis_inf和超近焦位置dis_macro，计算其对应的distance值；

即是无穷远位置的distance为：distance_inf＝1/dis_inf；

超近焦位置的distance为distance_macro＝1/dis_macro。

(3)将通过语音获得的对焦距离dis转化为可用于计算的distance，即：distance＝1/dis。

(4)利用dac code和distance之间的线性关系，当用户下发对焦距离dis(单位：m)，可用以下公式计算出马达dac code值：dac_code＝dac_macro+(distance-distance_macro)/(distance_inf-distance_macro)*(dac_inf-dac_macro)。

通过以上计算，用户只需要通过语音下发对焦距离，马达会非常快速准确地将lens推动到相应的位置，从而获取清晰的图像。

本发明中，当用户打开相机开始拍摄时，进入“语音对焦”模式，移动终端会自动开启语音识别功能，持续获取用户语音信息，此时用户就可以通过语音下发对焦命令，比如“对焦到3米”，下发成功后，马达就会自动推动lens到相应的位置完成对焦。

本发明是基于智能语音识别功能对马达对焦方式进行优化开发，具备实时性、便利性和有效性。利用马达的dac code值与distance之间的线性关系，通过语音识别功能向终端设备下发对焦距离，终端设备通过计算获取相应的dac code值，之后马达推动lens到相应的位置完成对焦。

进一步地，如图5所示，基于上述基于语音识别的自动对焦方法，本发明还相应提供了一种基于语音识别的自动对焦系统，其中，所述基于语音识别的自动对焦系统包括：

对焦模式控制模块51，用于当检测到移动终端的相机开始拍摄时，控制所述移动终端进入语音对焦模式，所述移动终端开启语音识别功能；

语音识别模块52，用于在所述移动终端拍摄过程中，所述移动终端实时获取用户的语音信息，并识别所述语音信息中的对焦指令；

对焦控制模块53，用于所述移动终端根据所述对焦指令，控制马达推动镜头到所述对焦指令指定的位置完成对焦。

进一步地，如图6所示，基于上述基于语音识别的自动对焦方法和系统，本发明还相应提供了一种移动终端，所述移动终端包括处理器10、存储器20及显示器30。图6仅示出了移动终端的部分组件，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。

所述存储器20在一些实施例中可以是所述移动终端的内部存储单元，例如移动终端的硬盘或内存。所述存储器20在另一些实施例中也可以是所述移动终端的外部存储设备，例如所述移动终端上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。进一步地，所述存储器20还可以既包括所述移动终端的内部存储单元也包括外部存储设备。所述存储器20用于存储安装于所述移动终端的应用软件及各类数据，例如所述安装移动终端的程序代码等。所述存储器20还可以用于暂时地存储已经输出或者将要输出的数据。在一实施例中，存储器20上存储有基于语音识别的自动对焦程序40，该基于语音识别的自动对焦程序40可被处理器10所执行，从而实现本申请中基于语音识别的自动对焦方法。

所述处理器10在一些实施例中可以是一中央处理器(Central Processing Unit,CPU)，微处理器或其他数据处理芯片，用于运行所述存储器20中存储的程序代码或处理数据，例如执行所述基于语音识别的自动对焦方法等。

所述显示器30在一些实施例中可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode，有机发光二极管)触摸器等。所述显示器30用于显示在所述移动终端的信息以及用于显示可视化的用户界面。所述移动终端的部件10-30通过系统总线相互通信。

在一实施例中，当处理器10执行所述存储器20中基于语音识别的自动对焦程序40时实现以下步骤：

其中，所述当检测到移动终端的相机开始拍摄时，控制所述移动终端进入语音对焦模式，所述移动终端开启语音识别功能，具体包括：

所述移动终端实时检测所述相机是否开启拍摄模式；

其中，所述移动终端进入所述语音对焦模式，之后还包括：

其中，所述在所述移动终端拍摄过程中，所述移动终端实时获取用户的语音信息，并识别所述语音信息中的对焦指令，具体包括：

其中，所述移动终端根据所述对焦指令，控制马达推动镜头到所述对焦指令指定的位置完成对焦，具体包括：

其中，所述根据所述对焦指令中的所述对焦距离在所述线性关系中获取所述马达对应的驱动值，具体包括：

无穷远位置的distance值为distance_inf＝1/dis_inf；

超近焦位置的distance值为distance_macro＝1/dis_macro；

其中，所述预设时间为3秒。

本发明还提供一种计算机可读存储介质，其中，所述计算机可读存储介质存储有基于语音识别的自动对焦程序，所述基于语音识别的自动对焦程序被处理器执行时实现如上所述的基于语音识别的自动对焦方法的步骤。

综上所述，本发明提供一种基于语音识别的自动对焦方法、系统及移动终端，所述方法包括：当检测到移动终端的相机开始拍摄时，控制所述移动终端进入语音对焦模式，所述移动终端开启语音识别功能；在所述移动终端拍摄过程中，所述移动终端实时获取用户的语音信息，并识别所述语音信息中的对焦指令；所述移动终端根据所述对焦指令，控制马达推动镜头到所述对焦指令指定的位置完成对焦。本发明利用语音识别功能，用户通过语音反馈给移动终端需要对焦的距离，之后马达推动镜头到相应的位置，能弥补了马达自动对焦的不足，同时用户能够自由下发对焦距离，增加相机拍摄的便捷性和趣味性。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者移动终端不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者移动终端所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者移动终端中还存在另外的相同要素。

当然，本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关硬件(如处理器，控制器等)来完成，所述的程序可存储于一计算机可读取的计算机可读存储介质中，所述程序在执行时可包括如上述各方法实施例的流程。其中所述的计算机可读存储介质可为存储器、磁碟、光盘等。

应当理解的是，本发明的应用不限于上述的举例，对本领域普通技术人员来说，可以根据上述说明加以改进或变换，所有这些改进和变换都应属于本发明所附权利要求的保护范围。

Claims

1.一种基于语音识别的自动对焦方法，其特征在于，所述基于语音识别的自动对焦方法包括：

2.根据权利要求1所述的基于语音识别的自动对焦方法，其特征在于，所述当检测到移动终端的相机开始拍摄时，控制所述移动终端进入语音对焦模式，所述移动终端开启语音识别功能，具体包括：

所述移动终端实时检测所述相机是否开启拍摄模式；

3.根据权利要求2所述的基于语音识别的自动对焦方法，其特征在于，所述移动终端进入所述语音对焦模式，之后还包括：

4.根据权利要求2所述的基于语音识别的自动对焦方法，其特征在于，所述在所述移动终端拍摄过程中，所述移动终端实时获取用户的语音信息，并识别所述语音信息中的对焦指令，具体包括：

5.根据权利要求4所述的基于语音识别的自动对焦方法，其特征在于，所述移动终端根据所述对焦指令，控制马达推动镜头到所述对焦指令指定的位置完成对焦，具体包括：

6.根据权利要求5所述的基于语音识别的自动对焦方法，其特征在于，所述根据所述对焦指令中的所述对焦距离在所述线性关系中获取所述马达对应的驱动值，具体包括：

无穷远位置的distance值为distance_inf＝1/dis_inf；

超近焦位置的distance值为distance_macro＝1/dis_macro；

7.根据权利要求3所述的基于语音识别的自动对焦方法，其特征在于，所述预设时间为3秒。

8.一种基于语音识别的自动对焦系统，其特征在于，所述基于语音识别的自动对焦系统包括：

9.一种移动终端，其特征在于，所述移动终端包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于语音识别的自动对焦程序，所述基于语音识别的自动对焦程序被所述处理器执行时实现如权利要求1-7任一项所述的基于语音识别的自动对焦方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有基于语音识别的自动对焦程序，所述基于语音识别的自动对焦程序被处理器执行时实现如权利要求1-7任一项所述的基于语音识别的自动对焦方法的步骤。