CN114049878A - 一种基于语音识别的自动对焦方法、系统及移动终端 - Google Patents

一种基于语音识别的自动对焦方法、系统及移动终端 Download PDF

Info

Publication number
CN114049878A
CN114049878A CN202111335109.7A CN202111335109A CN114049878A CN 114049878 A CN114049878 A CN 114049878A CN 202111335109 A CN202111335109 A CN 202111335109A CN 114049878 A CN114049878 A CN 114049878A
Authority
CN
China
Prior art keywords
focusing
mobile terminal
voice
distance
motor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111335109.7A
Other languages
English (en)
Other versions
CN114049878B (zh
Inventor
林泽嘉
孔德尚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huizhou TCL Mobile Communication Co Ltd
Original Assignee
Huizhou TCL Mobile Communication Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huizhou TCL Mobile Communication Co Ltd filed Critical Huizhou TCL Mobile Communication Co Ltd
Priority to CN202111335109.7A priority Critical patent/CN114049878B/zh
Priority claimed from CN202111335109.7A external-priority patent/CN114049878B/zh
Publication of CN114049878A publication Critical patent/CN114049878A/zh
Priority to PCT/CN2022/120277 priority patent/WO2023082846A1/zh
Application granted granted Critical
Publication of CN114049878B publication Critical patent/CN114049878B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/005Language recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/67Focus control based on electronic image sensor signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Studio Devices (AREA)

Abstract

本发明公开了一种基于语音识别的自动对焦方法、系统及移动终端,所述方法包括:当检测到移动终端的相机开始拍摄时,控制所述移动终端进入语音对焦模式,所述移动终端开启语音识别功能;在所述移动终端拍摄过程中,所述移动终端实时获取用户的语音信息,并识别所述语音信息中的对焦指令;所述移动终端根据所述对焦指令,控制马达推动镜头到所述对焦指令指定的位置完成对焦。本发明利用语音识别功能,用户通过语音反馈给移动终端需要对焦的距离,之后马达推动镜头到相应的位置,能弥补了马达自动对焦的不足,同时用户能够自由下发对焦距离,增加相机拍摄的便捷性和趣味性。

Description

一种基于语音识别的自动对焦方法、系统及移动终端
技术领域
本发明涉及相机对焦技术领域,尤其涉及一种基于语音识别的自动对焦方法、系统、移动终端及计算机可读存储介质。
背景技术
移动终端或者叫移动通信终端是指可以在移动中使用的计算机设备,广义的讲包括手机、笔记本、平板电脑、POS机甚至包括车载电脑。但是大部分情况下是指手机或者具有多种应用功能的智能手机以及平板电脑。随着网络和技术朝着越来越宽带化的方向的发展,移动通信产业将走向真正的移动信息时代。另一方面,随着集成电路技术的飞速发展,移动终端的处理能力已经拥有了强大的处理能力,移动终端正在从简单的通话工具变为一个综合信息处理平台。这也给移动终端增加了更加宽广的发展空间。
移动终端作为简单通信设备伴随移动通信发展已有几十年的历史。自2007年开始,智能化引发了移动终端基因突变,从根本上改变了终端作为移动网络末梢的传统定位。移动智能终端几乎在一瞬之间转变为互联网业务的关键入口和主要创新平台,新型媒体、电子商务和信息服务平台,互联网资源、移动网络资源与环境交互资源的最重要枢纽,其操作系统和处理器芯片甚至成为当今整个ICT产业的战略制高点。移动智能终端引发的颠覆性变革揭开了移动互联网产业发展的序幕,开启了一个新的技术产业周期。随着移动智能终端的持续发展,其影响力将比肩收音机、电视和互联网(PC),成为人类历史上第4个渗透广泛、普及迅速、影响巨大、深入至人类社会生活方方面面的终端产品。
移动终端设备上都配备有语音识别功能和马达自动对焦系统。其中马达自动对焦是指使用相机拍照时,相机通过马达实现自动推动调焦镜头(focus lens),改变物距与像距,从而使被拍物成像清晰的过程。目前马达实现自动对焦的方式主要有Contrast AF(Contrast Detection Auto Focus,反差对焦,通过对焦区域进行对比度检测,同时通过对焦马达驱动镜头模组镜片逐步移动,并实时记录对比度数值,当完成一次镜片全部位移之后系统就会得出反差最大的位置,最后再回到对比最大值的地方来完成对焦过程)、PDAF(Phase Detection Auto Focus,相位检测自动对焦,通过感光元件上预留出一些遮蔽像素点来充当自动对焦传感器,专门用来进行相位检测,通过比对左右两侧像素点的距离及其变化等来决定对焦的偏移值从而实现准确对焦)、LDAF(Laser Detection Auto Focus,激光对焦,通过单独的红外激光传感器向被摄物体发射红外激光,经过反射后被传感器接收,在计算出被摄物体之间的距离之后,对焦马达便会将镜片组驱动到相应位置完成对焦)等。但是无论是哪一种对焦方式,都存在缺陷,比如Contrast AF和PDAF在拍摄点光源场景或是平坦无细节场景容易失焦,LDAF只能在较短距离范围内进行准确对焦等,这无疑给用户带来困扰。
因此,现有技术还有待于改进和发展。
发明内容
本发明的主要目的在于提供一种基于语音识别的自动对焦方法、系统、移动终端及计算机可读存储介质,旨在解决现有技术中实现自动对焦时容易失焦以及无法实现长距离范围内准确对焦的问题。
为实现上述目的,本发明提供一种基于语音识别的自动对焦方法,所述基于语音识别的自动对焦方法包括如下步骤:
当检测到移动终端的相机开始拍摄时,控制所述移动终端进入语音对焦模式,所述移动终端开启语音识别功能;
在所述移动终端拍摄过程中,所述移动终端实时获取用户的语音信息,并识别所述语音信息中的对焦指令;
所述移动终端根据所述对焦指令,控制马达推动镜头到所述对焦指令指定的位置完成对焦。
可选地,所述的基于语音识别的自动对焦方法,其中,所述当检测到移动终端的相机开始拍摄时,控制所述移动终端进入语音对焦模式,所述移动终端开启语音识别功能,具体包括:
所述移动终端实时检测所述相机是否开启拍摄模式;
若所述移动终端检测到所述相机开启拍摄模式开始拍摄时,所述移动终端进入所述语音对焦模式,所述语音对焦模式为根据用户语音指令实现自动对焦的对焦模式;
当所述移动终端进入所述语音对焦模式后,所述移动终端开启语音识别功能以实时检测用户发出的语音。
可选地,所述的基于语音识别的自动对焦方法,其中,所述移动终端进入所述语音对焦模式,之后还包括:
所述移动终端通过弹框的方式在所述移动终端拍摄界面上在预设时间内显示所述移动终端已进入所述语音对焦模式。
可选地,所述的基于语音识别的自动对焦方法,其中,所述在所述移动终端拍摄过程中,所述移动终端实时获取用户的语音信息,并识别所述语音信息中的对焦指令,具体包括:
在所述移动终端拍摄过程中,若所述相机当前的对焦距离无法满足用户需求,则所述移动终端提示用户通过语音发出对焦指令;
所述移动终端实时获取用户发出的语音信息,并对用户发出的语音信息进行语音识别,根据预先设置的语音识别规则获取所述语音信息中的对焦指令。
可选地,所述的基于语音识别的自动对焦方法,其中,所述移动终端根据所述对焦指令,控制马达推动镜头到所述对焦指令指定的位置完成对焦,具体包括:
预先设置马达的驱动值和对焦距离的线性关系,所述线性关系用于所述马达根据对焦距离获取对应的驱动值;
所述移动终端获取到所述对焦指令后,根据所述对焦指令中的所述对焦距离在所述线性关系中获取所述马达对应的驱动值;
所述移动终端根据所述马达的驱动值控制所述马达推动镜头到所述驱动值指定的位置完成对焦。
可选地,所述的基于语音识别的自动对焦方法,其中,所述根据所述对焦指令中的所述对焦距离在所述线性关系中获取所述马达对应的驱动值,具体包括:
获取马达无穷远位置dis_inf、无穷远端驱动值dac_inf、超近焦位置dis_macro、以及超近焦位置驱动值dac_macro;
依据无穷远位置dis_inf和超近焦位置dis_macro,计算对应的distance值;
无穷远位置的distance值为distance_inf=1/dis_inf;
超近焦位置的distance值为distance_macro=1/dis_macro;
将通过语音获得的对焦距离dis转化为可用于计算的distance:distance=1/dis;
根据驱动值和distance之间的线性关系,当用户下发对焦距离dis,则马达的驱动值:
dac_code=dac_macro+(distance-distance_macro)/(distance_inf-distance_macro)*(dac_inf-dac_macro)。
可选地,所述的基于语音识别的自动对焦方法,其中,所述预设时间为3秒。
此外,为实现上述目的,本发明还提供一种基于语音识别的自动对焦系统,其中,所述基于语音识别的自动对焦系统包括:
对焦模式控制模块,用于当检测到移动终端的相机开始拍摄时,控制所述移动终端进入语音对焦模式,所述移动终端开启语音识别功能;
语音识别模块,用于在所述移动终端拍摄过程中,所述移动终端实时获取用户的语音信息,并识别所述语音信息中的对焦指令;
对焦控制模块,用于所述移动终端根据所述对焦指令,控制马达推动镜头到所述对焦指令指定的位置完成对焦。
此外,为实现上述目的,本发明还提供一种移动终端,其中,所述移动终端包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于语音识别的自动对焦程序,所述基于语音识别的自动对焦程序被所述处理器执行时实现如上所述的基于语音识别的自动对焦方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,其中,所述计算机可读存储介质存储有基于语音识别的自动对焦程序,所述基于语音识别的自动对焦程序被处理器执行时实现如上所述的基于语音识别的自动对焦方法的步骤。
本发明中,当检测到移动终端的相机开始拍摄时,控制所述移动终端进入语音对焦模式,所述移动终端开启语音识别功能;在所述移动终端拍摄过程中,所述移动终端实时获取用户的语音信息,并识别所述语音信息中的对焦指令;所述移动终端根据所述对焦指令,控制马达推动镜头到所述对焦指令指定的位置完成对焦。本发明利用语音识别功能,用户通过语音反馈给移动终端需要对焦的距离,之后马达推动镜头到相应的位置,能弥补了马达自动对焦的不足,同时用户能够自由下发对焦距离,增加相机拍摄的便捷性和趣味性。
附图说明
图1是本发明基于语音识别的自动对焦方法的较佳实施例的流程图;
图2是本发明基于语音识别的自动对焦方法的较佳实施例中步骤S10的流程图;
图3是本发明基于语音识别的自动对焦方法的较佳实施例中步骤S20的流程图;
图4是本发明基于语音识别的自动对焦方法的较佳实施例中步骤S30的流程图;
图5是本发明基于语音识别的自动对焦系统的较佳实施例的原理示意图;
图6为本发明移动终端的较佳实施例的运行环境示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明较佳实施例所述的基于语音识别的自动对焦方法,如图1所示,所述基于语音识别的自动对焦方法包括以下步骤:
步骤S10、当检测到移动终端的相机开始拍摄时,控制所述移动终端进入语音对焦模式,所述移动终端开启语音识别功能。
具体的过程请参阅图2,其为本发明提供的基于语音识别的自动对焦中步骤S10的流程图。
如图2所示,所述步骤S10包括:
S11、所述移动终端实时检测所述相机是否开启拍摄模式;
S12、若所述移动终端检测到所述相机开启拍摄模式开始拍摄时,所述移动终端进入所述语音对焦模式,所述语音对焦模式为根据用户语音指令实现自动对焦的对焦模式;
S13、当所述移动终端进入所述语音对焦模式后,所述移动终端开启语音识别功能以实时检测用户发出的语音。
具体地,所述移动终端(例如智能手机)实时检测所述相机是否开启拍摄模式,例如用户点击相机后即进入拍摄模式,若所述移动终端检测到所述相机开启拍摄模式开始拍摄时,所述移动终端进入所述语音对焦模式(相当于自动切换到语音对焦模式),所述语音对焦模式为根据用户语音指令实现自动对焦的对焦模式,即用户可以通过语音发出指令控制所述移动终端进行自动对焦,当所述移动终端进入所述语音对焦模式后,所述移动终端开启语音识别功能以实时检测用户发出的语音,即开始实时监测用户发出的语音。
进一步地,所述移动终端通过弹框的方式在所述移动终端拍摄界面上在预设时间内显示所述移动终端已进入所述语音对焦模式,即所述移动终端进入所述语音对焦模式时,在所述移动终端的界面上显示一下所述移动终端已进入所述语音对焦模式的提示,显示的时间可以是3秒,便于用户知道此事已经进入语音对焦模式。
步骤S20、在所述移动终端拍摄过程中,所述移动终端实时获取用户的语音信息,并识别所述语音信息中的对焦指令。
具体的过程请参阅图3,其为本发明提供的基于语音识别的自动对焦中步骤S20的流程图。
如图3所示,所述步骤S20包括:
S21、在所述移动终端拍摄过程中,若所述相机当前的对焦距离无法满足用户需求,则所述移动终端提示用户通过语音发出对焦指令;
S22、所述移动终端实时获取用户发出的语音信息,并对用户发出的语音信息进行语音识别,根据预先设置的语音识别规则获取所述语音信息中的对焦指令。
具体地,在所述移动终端拍摄过程中,例如智能手机开启相机进行拍摄时,若所述相机当前的对焦距离无法满足用户需求,即用户发现当前拍摄的画面不清晰或者角度不对,无法满足对焦距离的要求时,则所述移动终端提示用户通过语音发出对焦指令,那么用户就可以根据提示发出相关的语音,所述移动终端实时获取用户发出的语音信息,并对用户发出的语音信息进行语音识别,根据预先设置的语音识别规则获取所述语音信息中的对焦指令,因为用户发出的语音中可能并不是仅仅包括了对焦指令,很可能还有其他不是对焦指令的语音,所以需要对用户发出的对焦指令进行提取。
步骤S30、所述移动终端根据所述对焦指令,控制马达推动镜头到所述对焦指令指定的位置完成对焦。
具体的过程请参阅图4,其为本发明提供的基于语音识别的自动对焦中步骤S30的流程图。
如图4所示,所述步骤S30包括:
S31、预先设置马达的驱动值和对焦距离的线性关系,所述线性关系用于所述马达根据对焦距离获取对应的驱动值;
S32、所述移动终端获取到所述对焦指令后,根据所述对焦指令中的所述对焦距离在所述线性关系中获取所述马达对应的驱动值;
S33、所述移动终端根据所述马达的驱动值控制所述马达推动镜头到所述驱动值指定的位置完成对焦。
具体地,预先设置马达的驱动值和对焦距离的线性关系,所述线性关系用于所述马达根据对焦距离获取对应的驱动值,因为对对焦距离进行调整是通过马达的驱动值(daccode值)来实现的,所以就需要预先设置好马达的驱动值和对焦距离的线性关系,然后所述移动终端获取到所述对焦指令后,根据所述对焦指令中的所述对焦距离在所述线性关系中获取所述马达对应的驱动值(dac code值),最后所述移动终端根据所述马达的驱动值(daccode值)控制所述马达推动镜头(lens)到所述驱动值指定的位置完成对焦。
进一步地,根据所述对焦指令中的所述对焦距离在所述线性关系中获取所述马达对应的驱动值,具体包括:
(1)通过读取摄像头模组OTP,获取马达无穷远位置dis_inf(单位:m)、无穷远端dac code值dac_inf(单位:dac)及超近焦位置dis_macro(单位:m)、超近焦位置dac code值dac_macro(单位:dac)。
(2)依据无穷远位置dis_inf和超近焦位置dis_macro,计算其对应的distance值;
即是无穷远位置的distance为:distance_inf=1/dis_inf;
超近焦位置的distance为distance_macro=1/dis_macro。
(3)将通过语音获得的对焦距离dis转化为可用于计算的distance,即:distance=1/dis。
(4)利用dac code和distance之间的线性关系,当用户下发对焦距离dis(单位:m),可用以下公式计算出马达dac code值:dac_code=dac_macro+(distance-distance_macro)/(distance_inf-distance_macro)*(dac_inf-dac_macro)。
通过以上计算,用户只需要通过语音下发对焦距离,马达会非常快速准确地将lens推动到相应的位置,从而获取清晰的图像。
本发明中,当用户打开相机开始拍摄时,进入“语音对焦”模式,移动终端会自动开启语音识别功能,持续获取用户语音信息,此时用户就可以通过语音下发对焦命令,比如“对焦到3米”,下发成功后,马达就会自动推动lens到相应的位置完成对焦。
本发明是基于智能语音识别功能对马达对焦方式进行优化开发,具备实时性、便利性和有效性。利用马达的dac code值与distance之间的线性关系,通过语音识别功能向终端设备下发对焦距离,终端设备通过计算获取相应的dac code值,之后马达推动lens到相应的位置完成对焦。
进一步地,如图5所示,基于上述基于语音识别的自动对焦方法,本发明还相应提供了一种基于语音识别的自动对焦系统,其中,所述基于语音识别的自动对焦系统包括:
对焦模式控制模块51,用于当检测到移动终端的相机开始拍摄时,控制所述移动终端进入语音对焦模式,所述移动终端开启语音识别功能;
语音识别模块52,用于在所述移动终端拍摄过程中,所述移动终端实时获取用户的语音信息,并识别所述语音信息中的对焦指令;
对焦控制模块53,用于所述移动终端根据所述对焦指令,控制马达推动镜头到所述对焦指令指定的位置完成对焦。
进一步地,如图6所示,基于上述基于语音识别的自动对焦方法和系统,本发明还相应提供了一种移动终端,所述移动终端包括处理器10、存储器20及显示器30。图6仅示出了移动终端的部分组件,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
所述存储器20在一些实施例中可以是所述移动终端的内部存储单元,例如移动终端的硬盘或内存。所述存储器20在另一些实施例中也可以是所述移动终端的外部存储设备,例如所述移动终端上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器20还可以既包括所述移动终端的内部存储单元也包括外部存储设备。所述存储器20用于存储安装于所述移动终端的应用软件及各类数据,例如所述安装移动终端的程序代码等。所述存储器20还可以用于暂时地存储已经输出或者将要输出的数据。在一实施例中,存储器20上存储有基于语音识别的自动对焦程序40,该基于语音识别的自动对焦程序40可被处理器10所执行,从而实现本申请中基于语音识别的自动对焦方法。
所述处理器10在一些实施例中可以是一中央处理器(Central Processing Unit,CPU),微处理器或其他数据处理芯片,用于运行所述存储器20中存储的程序代码或处理数据,例如执行所述基于语音识别的自动对焦方法等。
所述显示器30在一些实施例中可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。所述显示器30用于显示在所述移动终端的信息以及用于显示可视化的用户界面。所述移动终端的部件10-30通过系统总线相互通信。
在一实施例中,当处理器10执行所述存储器20中基于语音识别的自动对焦程序40时实现以下步骤:
当检测到移动终端的相机开始拍摄时,控制所述移动终端进入语音对焦模式,所述移动终端开启语音识别功能;
在所述移动终端拍摄过程中,所述移动终端实时获取用户的语音信息,并识别所述语音信息中的对焦指令;
所述移动终端根据所述对焦指令,控制马达推动镜头到所述对焦指令指定的位置完成对焦。
其中,所述当检测到移动终端的相机开始拍摄时,控制所述移动终端进入语音对焦模式,所述移动终端开启语音识别功能,具体包括:
所述移动终端实时检测所述相机是否开启拍摄模式;
若所述移动终端检测到所述相机开启拍摄模式开始拍摄时,所述移动终端进入所述语音对焦模式,所述语音对焦模式为根据用户语音指令实现自动对焦的对焦模式;
当所述移动终端进入所述语音对焦模式后,所述移动终端开启语音识别功能以实时检测用户发出的语音。
其中,所述移动终端进入所述语音对焦模式,之后还包括:
所述移动终端通过弹框的方式在所述移动终端拍摄界面上在预设时间内显示所述移动终端已进入所述语音对焦模式。
其中,所述在所述移动终端拍摄过程中,所述移动终端实时获取用户的语音信息,并识别所述语音信息中的对焦指令,具体包括:
在所述移动终端拍摄过程中,若所述相机当前的对焦距离无法满足用户需求,则所述移动终端提示用户通过语音发出对焦指令;
所述移动终端实时获取用户发出的语音信息,并对用户发出的语音信息进行语音识别,根据预先设置的语音识别规则获取所述语音信息中的对焦指令。
其中,所述移动终端根据所述对焦指令,控制马达推动镜头到所述对焦指令指定的位置完成对焦,具体包括:
预先设置马达的驱动值和对焦距离的线性关系,所述线性关系用于所述马达根据对焦距离获取对应的驱动值;
所述移动终端获取到所述对焦指令后,根据所述对焦指令中的所述对焦距离在所述线性关系中获取所述马达对应的驱动值;
所述移动终端根据所述马达的驱动值控制所述马达推动镜头到所述驱动值指定的位置完成对焦。
其中,所述根据所述对焦指令中的所述对焦距离在所述线性关系中获取所述马达对应的驱动值,具体包括:
获取马达无穷远位置dis_inf、无穷远端驱动值dac_inf、超近焦位置dis_macro、以及超近焦位置驱动值dac_macro;
依据无穷远位置dis_inf和超近焦位置dis_macro,计算对应的distance值;
无穷远位置的distance值为distance_inf=1/dis_inf;
超近焦位置的distance值为distance_macro=1/dis_macro;
将通过语音获得的对焦距离dis转化为可用于计算的distance:distance=1/dis;
根据驱动值和distance之间的线性关系,当用户下发对焦距离dis,则马达的驱动值:
dac_code=dac_macro+(distance-distance_macro)/(distance_inf-distance_macro)*(dac_inf-dac_macro)。
其中,所述预设时间为3秒。
本发明还提供一种计算机可读存储介质,其中,所述计算机可读存储介质存储有基于语音识别的自动对焦程序,所述基于语音识别的自动对焦程序被处理器执行时实现如上所述的基于语音识别的自动对焦方法的步骤。
综上所述,本发明提供一种基于语音识别的自动对焦方法、系统及移动终端,所述方法包括:当检测到移动终端的相机开始拍摄时,控制所述移动终端进入语音对焦模式,所述移动终端开启语音识别功能;在所述移动终端拍摄过程中,所述移动终端实时获取用户的语音信息,并识别所述语音信息中的对焦指令;所述移动终端根据所述对焦指令,控制马达推动镜头到所述对焦指令指定的位置完成对焦。本发明利用语音识别功能,用户通过语音反馈给移动终端需要对焦的距离,之后马达推动镜头到相应的位置,能弥补了马达自动对焦的不足,同时用户能够自由下发对焦距离,增加相机拍摄的便捷性和趣味性。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者移动终端不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者移动终端所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者移动终端中还存在另外的相同要素。
当然,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关硬件(如处理器,控制器等)来完成,所述的程序可存储于一计算机可读取的计算机可读存储介质中,所述程序在执行时可包括如上述各方法实施例的流程。其中所述的计算机可读存储介质可为存储器、磁碟、光盘等。
应当理解的是,本发明的应用不限于上述的举例,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保护范围。

Claims (10)

1.一种基于语音识别的自动对焦方法,其特征在于,所述基于语音识别的自动对焦方法包括:
当检测到移动终端的相机开始拍摄时,控制所述移动终端进入语音对焦模式,所述移动终端开启语音识别功能;
在所述移动终端拍摄过程中,所述移动终端实时获取用户的语音信息,并识别所述语音信息中的对焦指令;
所述移动终端根据所述对焦指令,控制马达推动镜头到所述对焦指令指定的位置完成对焦。
2.根据权利要求1所述的基于语音识别的自动对焦方法,其特征在于,所述当检测到移动终端的相机开始拍摄时,控制所述移动终端进入语音对焦模式,所述移动终端开启语音识别功能,具体包括:
所述移动终端实时检测所述相机是否开启拍摄模式;
若所述移动终端检测到所述相机开启拍摄模式开始拍摄时,所述移动终端进入所述语音对焦模式,所述语音对焦模式为根据用户语音指令实现自动对焦的对焦模式;
当所述移动终端进入所述语音对焦模式后,所述移动终端开启语音识别功能以实时检测用户发出的语音。
3.根据权利要求2所述的基于语音识别的自动对焦方法,其特征在于,所述移动终端进入所述语音对焦模式,之后还包括:
所述移动终端通过弹框的方式在所述移动终端拍摄界面上在预设时间内显示所述移动终端已进入所述语音对焦模式。
4.根据权利要求2所述的基于语音识别的自动对焦方法,其特征在于,所述在所述移动终端拍摄过程中,所述移动终端实时获取用户的语音信息,并识别所述语音信息中的对焦指令,具体包括:
在所述移动终端拍摄过程中,若所述相机当前的对焦距离无法满足用户需求,则所述移动终端提示用户通过语音发出对焦指令;
所述移动终端实时获取用户发出的语音信息,并对用户发出的语音信息进行语音识别,根据预先设置的语音识别规则获取所述语音信息中的对焦指令。
5.根据权利要求4所述的基于语音识别的自动对焦方法,其特征在于,所述移动终端根据所述对焦指令,控制马达推动镜头到所述对焦指令指定的位置完成对焦,具体包括:
预先设置马达的驱动值和对焦距离的线性关系,所述线性关系用于所述马达根据对焦距离获取对应的驱动值;
所述移动终端获取到所述对焦指令后,根据所述对焦指令中的所述对焦距离在所述线性关系中获取所述马达对应的驱动值;
所述移动终端根据所述马达的驱动值控制所述马达推动镜头到所述驱动值指定的位置完成对焦。
6.根据权利要求5所述的基于语音识别的自动对焦方法,其特征在于,所述根据所述对焦指令中的所述对焦距离在所述线性关系中获取所述马达对应的驱动值,具体包括:
获取马达无穷远位置dis_inf、无穷远端驱动值dac_inf、超近焦位置dis_macro、以及超近焦位置驱动值dac_macro;
依据无穷远位置dis_inf和超近焦位置dis_macro,计算对应的distance值;
无穷远位置的distance值为distance_inf=1/dis_inf;
超近焦位置的distance值为distance_macro=1/dis_macro;
将通过语音获得的对焦距离dis转化为可用于计算的distance:distance=1/dis;
根据驱动值和distance之间的线性关系,当用户下发对焦距离dis,则马达的驱动值:
dac_code=dac_macro+(distance-distance_macro)/(distance_inf-distance_macro)*(dac_inf-dac_macro)。
7.根据权利要求3所述的基于语音识别的自动对焦方法,其特征在于,所述预设时间为3秒。
8.一种基于语音识别的自动对焦系统,其特征在于,所述基于语音识别的自动对焦系统包括:
对焦模式控制模块,用于当检测到移动终端的相机开始拍摄时,控制所述移动终端进入语音对焦模式,所述移动终端开启语音识别功能;
语音识别模块,用于在所述移动终端拍摄过程中,所述移动终端实时获取用户的语音信息,并识别所述语音信息中的对焦指令;
对焦控制模块,用于所述移动终端根据所述对焦指令,控制马达推动镜头到所述对焦指令指定的位置完成对焦。
9.一种移动终端,其特征在于,所述移动终端包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于语音识别的自动对焦程序,所述基于语音识别的自动对焦程序被所述处理器执行时实现如权利要求1-7任一项所述的基于语音识别的自动对焦方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有基于语音识别的自动对焦程序,所述基于语音识别的自动对焦程序被处理器执行时实现如权利要求1-7任一项所述的基于语音识别的自动对焦方法的步骤。
CN202111335109.7A 2021-11-11 2021-11-11 一种基于语音识别的自动对焦方法、系统及移动终端 Active CN114049878B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202111335109.7A CN114049878B (zh) 2021-11-11 一种基于语音识别的自动对焦方法、系统及移动终端
PCT/CN2022/120277 WO2023082846A1 (zh) 2021-11-11 2022-09-21 一种基于语音识别的自动对焦方法、系统及移动终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111335109.7A CN114049878B (zh) 2021-11-11 一种基于语音识别的自动对焦方法、系统及移动终端

Publications (2)

Publication Number Publication Date
CN114049878A true CN114049878A (zh) 2022-02-15
CN114049878B CN114049878B (zh) 2024-10-29

Family

ID=

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023082846A1 (zh) * 2021-11-11 2023-05-19 惠州Tcl移动通信有限公司 一种基于语音识别的自动对焦方法、系统及移动终端
CN117097985A (zh) * 2023-10-11 2023-11-21 荣耀终端有限公司 对焦方法、电子设备及计算机可读存储介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1800900A (zh) * 2005-01-07 2006-07-12 佳能株式会社 聚焦控制方法和聚焦控制设备
JP2006189641A (ja) * 2005-01-06 2006-07-20 Renesas Technology Corp カメラシステムおよびカメラモジュール
KR20070010673A (ko) * 2005-07-19 2007-01-24 엘지전자 주식회사 자동초점조절 기능을 갖는 휴대용 단말기 및 그 방법
KR20070071129A (ko) * 2005-12-29 2007-07-04 주식회사 팬택 카메라를 구비한 이동통신단말기 및 카메라의자동초점조절방법
WO2008004037A1 (en) * 2006-06-30 2008-01-10 Sony Ericsson Mobile Communications Ab Voice remote control
CN103780843A (zh) * 2014-03-03 2014-05-07 联想(北京)有限公司 一种图像处理方法及电子设备
CN106375668A (zh) * 2016-09-28 2017-02-01 上海斐讯数据通信技术有限公司 一种智能终端相机的自动对焦装置和方法
WO2018233254A1 (zh) * 2017-06-21 2018-12-27 格力电器(武汉)有限公司 基于终端的物体识别方法、装置及电子设备
CN111182204A (zh) * 2019-11-26 2020-05-19 广东小天才科技有限公司 一种基于可穿戴设备的拍摄方法及可穿戴设备
CN111699427A (zh) * 2019-05-15 2020-09-22 深圳市大疆创新科技有限公司 一种镜头的控制方法及系统、镜头以及成像装置
CN112689095A (zh) * 2020-12-29 2021-04-20 上海摩勤智能技术有限公司 一种相机传感器对焦数据校准的方法及相机传感器
CN113542611A (zh) * 2021-07-30 2021-10-22 西安中诺通讯有限公司 一种基于语音控制启动拍照的方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006189641A (ja) * 2005-01-06 2006-07-20 Renesas Technology Corp カメラシステムおよびカメラモジュール
CN1800900A (zh) * 2005-01-07 2006-07-12 佳能株式会社 聚焦控制方法和聚焦控制设备
KR20070010673A (ko) * 2005-07-19 2007-01-24 엘지전자 주식회사 자동초점조절 기능을 갖는 휴대용 단말기 및 그 방법
KR20070071129A (ko) * 2005-12-29 2007-07-04 주식회사 팬택 카메라를 구비한 이동통신단말기 및 카메라의자동초점조절방법
WO2008004037A1 (en) * 2006-06-30 2008-01-10 Sony Ericsson Mobile Communications Ab Voice remote control
CN103780843A (zh) * 2014-03-03 2014-05-07 联想(北京)有限公司 一种图像处理方法及电子设备
CN106375668A (zh) * 2016-09-28 2017-02-01 上海斐讯数据通信技术有限公司 一种智能终端相机的自动对焦装置和方法
WO2018233254A1 (zh) * 2017-06-21 2018-12-27 格力电器(武汉)有限公司 基于终端的物体识别方法、装置及电子设备
CN111699427A (zh) * 2019-05-15 2020-09-22 深圳市大疆创新科技有限公司 一种镜头的控制方法及系统、镜头以及成像装置
CN111182204A (zh) * 2019-11-26 2020-05-19 广东小天才科技有限公司 一种基于可穿戴设备的拍摄方法及可穿戴设备
CN112689095A (zh) * 2020-12-29 2021-04-20 上海摩勤智能技术有限公司 一种相机传感器对焦数据校准的方法及相机传感器
CN113542611A (zh) * 2021-07-30 2021-10-22 西安中诺通讯有限公司 一种基于语音控制启动拍照的方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023082846A1 (zh) * 2021-11-11 2023-05-19 惠州Tcl移动通信有限公司 一种基于语音识别的自动对焦方法、系统及移动终端
CN117097985A (zh) * 2023-10-11 2023-11-21 荣耀终端有限公司 对焦方法、电子设备及计算机可读存储介质
CN117097985B (zh) * 2023-10-11 2024-04-02 荣耀终端有限公司 对焦方法、电子设备及计算机可读存储介质

Also Published As

Publication number Publication date
WO2023082846A1 (zh) 2023-05-19

Similar Documents

Publication Publication Date Title
CN110889469B (zh) 图像处理方法及装置、电子设备和存储介质
US10659675B2 (en) Terminal, shooting method thereof and computer storage medium
RU2669063C2 (ru) Способ и устройство получения изображений
CN112001321B (zh) 网络训练、行人重识别方法及装置、电子设备和存储介质
CN111931844B (zh) 图像处理方法及装置、电子设备和存储介质
EP3200125A1 (en) Fingerprint template input method and device
CN113065591B (zh) 目标检测方法及装置、电子设备和存储介质
CN102272673A (zh) 用于为本人自动拍摄照片的方法、装置和计算机程序产品
CN109255128B (zh) 多层级标签的生成方法、装置和存储介质
CN112291473B (zh) 对焦方法、装置及电子设备
CN113538310A (zh) 图像处理方法及装置、电子设备和存储介质
CN114648796A (zh) 用户识别方法、装置、存储介质及电子设备
EP2793458B1 (en) Apparatus and method for auto-focusing in device having camera
US11792518B2 (en) Method and apparatus for processing image
CN111709394B (zh) 一种屏下指纹识别方法及装置、存储介质
CN110830726B (zh) 一种自动对焦方法、装置、设备和存储介质
CN114049878B (zh) 一种基于语音识别的自动对焦方法、系统及移动终端
CN114049878A (zh) 一种基于语音识别的自动对焦方法、系统及移动终端
CN116310633A (zh) 一种关键点检测模型训练方法及关键点检测方法
CN111610921A (zh) 手势识别方法及装置
CN113537350B (zh) 图像处理方法及装置、电子设备和存储介质
CN114339019B (zh) 对焦方法、对焦装置及存储介质
CN116563830A (zh) 识别码的识别方法、装置及存储介质
CN111382734B (zh) 电话号码的检测及识别方法、装置及存储介质
CN112702514A (zh) 图像获取方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant