CN110602391B - 拍照控制方法、装置、存储介质及电子设备 - Google Patents

拍照控制方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN110602391B
CN110602391B CN201910819084.4A CN201910819084A CN110602391B CN 110602391 B CN110602391 B CN 110602391B CN 201910819084 A CN201910819084 A CN 201910819084A CN 110602391 B CN110602391 B CN 110602391B
Authority
CN
China
Prior art keywords
voice
preset
information
photographing
matching degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910819084.4A
Other languages
English (en)
Other versions
CN110602391A (zh
Inventor
陈刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority to CN201910819084.4A priority Critical patent/CN110602391B/zh
Publication of CN110602391A publication Critical patent/CN110602391A/zh
Application granted granted Critical
Publication of CN110602391B publication Critical patent/CN110602391B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Studio Devices (AREA)

Abstract

本申请实施例公开了一种拍照控制方法、装置、存储介质及电子设备。其中所述方法包括:在电子设备处于拍照模式时,通过所述压电陶瓷单体接收当前时刻用户的语音信息,对所述语音信息进行分析以得到语音特征,将所述语音特征与预设的语音识别模型进行匹配以得到匹配度,判断所述匹配度是否大于预设阈值,若匹配度大于预设阈值,则根据所述语音信息进行拍照。通过对当前用户语音信息的采集,并提取语音信息的语音特征,最终根据语音特征进行拍照,实现了语音控制拍照的便利性。

Description

拍照控制方法、装置、存储介质及电子设备
技术领域
本申请涉及电子技术领域,具体涉及一种拍照控制方法、装置、存储介质及电子设备。
背景技术
随着科学技术的发展,拍照功能不再仅仅局限于相机上,在只能手机上也可以实现拍照功能,拍照功能也成为人们最喜爱的功能之一。
目前,电子设备的拍照过程中,都是通过人手动调整按钮调节拍照参数,或者滑动屏幕调节拍照参数,但是在人手单手握持电子设备时以及对于一些双手不方便的残障人士时,手动控制拍照显得极其不方便。
发明内容
本申请实施例提供一种拍照控制方法、装置、存储介质及电子设备。能够实现通过用户的语音信息控制电子设备拍照,在用户双手不方便时,增加了拍照控制的便利性。
第一方面,本申请实施例提供了一种拍照控制方法,其中所述拍照控制方法包括:
在电子设备处于拍照模式时,通过所述压电陶瓷单体接收当前时刻用户的语音信息;
对所述语音信息进行分析以得到语音特征;
将所述语音特征与预设的语音识别模型进行匹配以得到匹配度;
判断所述匹配度是否大于预设阈值;
若是,则根据所述语音信息进行拍照。
第二方面,本申请实施例提供了一种拍照控制装置,应用于电子设备,其中所述拍照控制装置包括:
获取模块,用于在电子设备处于拍照模式时,通过所述压电陶瓷单体接收当前时刻用户的语音信息;
分析模块,用于对所述语音信息进行分析以得到语音特征;
匹配模块,用于将所述语音特征与预设的语音识别模型进行匹配以得到匹配度;
判断模块,用于判断所述匹配度是否大于预设阈值;
拍照模块,用于在所述匹配度达到预设阈值时,根据所述语音信息进行拍照。
第三方面,本申请实施例一种可读取存储介质,所述存储介质中存储有多条指令,所述指令适于由处理器加载以执行上述任一项拍照控制方法。
第四方面,本申请实施例提供了一种电子设备,其中所述电子设备包括:
壳体,所述壳体包括第一区域和第二区域,所述第一区域和所述第二区域中每一区域至少设置一个压电陶瓷单体,所述压电陶瓷单体用于接收声音信号;
处理器,与所述压电陶瓷单体电性连接,所述处理器用于:
在电子设备处于拍照模式时,通过所述压电陶瓷单体接收当前时刻用户的语音信息;
对所述语音信息进行分析以得到语音特征;
将所述语音特征与预设的语音识别模型进行匹配以得到匹配度;
判断所述匹配度是否大于预设阈值;
若是,则根据所述语音信息进行拍照。
本申请实施例中,在电子设备处于拍照模式时,通过在电子设备上设置的多个压电陶瓷单体接收当前时刻用户的语音信息,对语音信息进行分析以得到语音特征,再将语音特征与预设的语音识别模型进行匹配以得到匹配度,判断匹配度是否大于预设阈值,若匹配度大于预设阈值,则根据语音信息进行拍照。通过对当前用户语音信息的采集,并提取语音信息的语音特征,最终根据语音特征进行拍照,实现了语音控制拍照的便利性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的拍照控制方法的第一流程示意图。
图2是本申请实施例提供的拍照控制方法的第二流程示意图。
图3是本申请实施例提供的拍照控制装置的结构示意图。
图4是本申请实施例提供的电子设备的第一结构示意图。
图5是本申请实施例提供的压电陶瓷单体的第一位置示意图。
图6是本申请实施例提供的压电陶瓷单体的第二位置示意图。
图7是本申请实施例提供的压电陶瓷单体的结构示意图。
图8是本申请实施例提供的电子设备的第二结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在以下的说明中,本申请的具体实施例将参考由一部或多部计算机所执行的步骤及符号来说明,除非另有述明。因此,这些步骤及操作将有数次提到由计算机执行,本文所指的计算机执行包括了由代表了以一结构化型式中的数据的电子信号的计算机处理单元的操作。此操作转换该数据或将其维持在该计算机的内存系统中的位置处,其可重新配置或另外以本领域测试人员所熟知的方式来改变该计算机的运作。该数据所维持的数据结构为该内存的实体位置,其具有由该数据格式所定义的特定特性。但是,本申请原理以上述文字来说明,其并不代表为一种限制,本领域测试人员将可了解到以下所述的多种步骤及操作亦可实施在硬件当中。
本申请中的术语“第一”、“第二”和“第三”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或模块的过程、方法、系统、产品或设备没有限定于已列出的步骤或模块,而是某些实施例还包括没有列出的步骤或模块,或某些实施例还包括对于这些过程、方法、产品或设备固有的其它步骤或模块。
本申请实施例提供一种拍照控制方法、装置、存储介质及电子设备。以下分别进行详细说明。
在传统的拍照方式中,一般是通过手动调节机械按钮、滑轮,或者通过触控屏幕调节拍照参数,但是在用户双手不方便时,拍照比较困难。本实施例提供的拍照方法,能够通过压电陶瓷单体接收声音信号,并根据用户的语音信息控制电子设备调节拍照参数进行拍照。本申请中的拍照控制方法可应用于智能手机、智能手表、平板电脑等电子设备。
请参阅图1,图1是本申请实施例提供的拍照控制方法的第一流程示意图。
在步骤110中,在电子设备处于拍照模式时,通过压电陶瓷单体接收当前时刻用户的语音信息。
现有的电子设备都是通过在电子设备的壳体上开一个麦克风拾音孔来接收外界的声音信号,但是在麦克风拾音孔堵塞的情况下,就不能接收声音信号,另外,人们使用电子设备拍照的场景并不仅仅局限于陆地,也可以在水下进行拍摄,如果在电子设备上开设拾音孔,防水效果会有大大折扣。
本实施例中,在用户打开电子设备的相机时,电子设备处于拍摄模式,此时可以通过电子设备上的压电陶瓷单体接收声音信号,用户说话的语音信息就可以通过压电陶瓷单体传输至电子设备的处理器之中。
在一种实施例中,电子设备可以通过无孔设计实现防水,其中电子设备的壳体或者屏幕的内表面,可以设置多个压电陶瓷单体来接收声音信号,在用户需要使用电子设备进行水下摄影时,可以将电子设备放置在水下,通过压电陶瓷接收用户的语音信息进行拍照。
在步骤120中,对语音信息进行分析以得到语音特征。
可以理解的是,用户的语音信息包括多种信息,例如用户的身份信息、文字信息等等。此时可以对语音信息进行分析,得到用户的语音特征。
其中,语音特征包括语音参数特征,例如语音特征的频域特征、时域特征、空域特征等等,又比如,声音的频率、音色、强度、声纹等信息,语音特征还可以包括用户需要表达的文本信息、感情信息等等。
在一种实施例中,可以对语音信息进行静音切除、预加重、分帧等处理得到目标语音,然后对需要处理的目标语音输入到神经网络进行特征提取,得到语音信息的语音特征。
在一种实施例中,在获取到语音信息之后,可以对语音信息分割为若干个语音单元,然后对每个语音单元的单元语音特征进行提取,最终将这些单元语音特征合成最终的语音特征。
在步骤130中,将语音特征与预设的语音识别模型进行匹配以得到匹配度。
在一种实施例中,可以在对语音特征匹配之前建立语音识别模型,语音识别模型可以识别语音特征中的用户身份特征、文本信息特征等特征,可以通过获取大量的用户的预设语音信息,然后对预设语音信息利用预设机器学习算法进行训练,得到最终的语音识别模型。
在一种实施例中,可以提取预设语音信息中的关键词,然后获取关键词对应的语音,将关键词对应的语音作为训练模板,对其进行机器学习训练,最终得到语音识别模型。
在得到语音识别模型之后,将语音特征与语音识别模型进行匹配,得到匹配度。其中,在匹配的过程中,可以根据语音特征对用户的身份进行匹配,得到第一匹配度,还可以根据语音特征对关键词进行匹配得到第二匹配度,将第一匹配度和第二匹配度相加得到最终的匹配度。
在步骤140中,判断匹配度是否大于预设阈值。
可以理解的是,在匹配度大于预设阈值时,则认为语音特征和语音识别模型的匹配度较高,其中预设阈值的设置方式可以根据接收到的语音信息的多少来设置。
例如,预设阈值随着语音信息的增多而提高,在接收到的语音信息中,语音信息含量较少,则可以对预设阈值设置的较低,在接收到的语音信息较多时,可以对预设阈值设置较高。
预设阈值还可以根据当前环境来设置,例如当前的环境比较嘈杂,在接收到用户的语音信息时,也会接收到周围环境的噪声,此时可以对预设阈值设置较低,避免用户发出语音信息却不能匹配成功拍照。
在匹配度大于预设阈值时,则进入步骤140中。在匹配度不大于预设阈值时,则进入步骤110中。
在步骤150中,根据语音信息进行拍照。
语音信息中包含关键词,例如,关键词“拉近”代表着将焦距调成长焦距,以靠近拍摄主体,关键词“调亮”代表控制曝光值调高,关键词“抓拍”代表将快门速度调快等等。
在匹配成功之后,则可以从语音信息中的关键词确定需要调整拍照参数,通过对拍照参数的调整,实现自动拍照功能,用户无需手动控制,只需要语音控制就可以拍照。
本申请实施例中,在电子设备处于拍照模式时,通过在电子设备上设置的多个压电陶瓷单体接收当前时刻用户的语音信息,对语音信息进行分析以得到语音特征,再将语音特征与预设的语音识别模型进行匹配以得到匹配度,判断匹配度是否大于预设阈值,若匹配度大于预设阈值,则根据语音信息进行拍照。通过对当前用户语音信息的采集,并提取语音信息的语音特征,最终根据语音特征进行拍照,实现了语音控制拍照的便利性。
请参阅图2,图2是本申请实施例提供的拍照控制方法的第二流程示意图。
在步骤201中,获取用户的预设语音信息。
用户的预设语音信息可以是用户录制的语音信息,也可以是用户的语音信息加上从网络获取的语音信息。
需要说明的是,预设的语音信息中包含多种关键词,例如拍照时的“拉近”、“远离”、“调亮”、“调暖色调”等拍照时的关键词。预设语音信息中还包含着用户的身份信息,例如声纹特征信息。
在步骤202中,提取预设语音信息中的关键词。
可以理解的是,用户在设置预设语音信息时,一段话、一个词都有可能讲述,但是一些无用的预设语音信息,比如用户的换气的声音、停止说话时的静止音、无用的语气词对应的声音等等,这些预设语音信息是对语音识别模型的建立没有太大作用的。
此时,可以对语音信息中的关键词进行提取。
在步骤203中,通过预设的特征提取算法对关键词对应的语音进行特征提取以得到预设语音特征。
此时,可以提取预设语音信息中关键词对应的语音。例如可以获取关键词“拉近”这两个字对应的语音,也可以获取“拉近”这个关键词所在的整句话对应的语音。
然后通过预设的特征提取算法提取对关键词对应的语音进行特征提取以得到预设语音特征,其中,预设语音特征包括时域特征、频域特征、空域特征等特征。
在步骤204中,对预设语音特征进行机器学习训练,以得到语音识别模型。
需要说明的是,训练出来的语音识别模型可以识别用户的语音信息中的文本信息、声纹信息等等。
在步骤205中,在电子设备处于拍摄模式下,获取电子设备被握持的握持区域。
在本申请中的电子设备中,设置了多个压电陶瓷单体来接收声音信号,例如,将压电陶瓷单体设置在电子设备中框的内表面,压电陶瓷单体可以设置多个。
又比如,在电子设备的后壳设置多个压电陶瓷单体,在摄像头周边区域设置至少一个压电陶瓷单体,由于用户在拍照时,是不会用手遮挡摄像头所在的区域,此时可以通过摄像头周边区域的压电陶瓷单体接收声音信号。
在用户在用手握持电子设备的时,可能握持多个区域,若这些握持区域存在压电陶瓷单体,则不能正常的接收声音信号,因此,需要获取电子设备上未被用户握持的区域。
在步骤206中,通过未被握持的区域对应的压电陶瓷单体接收当前时刻用户的语音信息。
例如,在摄像头周边区域的压电陶瓷单体可以用来接收声音信号。也可以通过边框上用户未握持的区域对应的压电陶瓷单体接收当前时刻用户的语音信息。
在步骤207中,对语音信息进行分析以得到语音特征。此步骤与步骤120相同,在此不作赘述。
在步骤208中,根据语音特征获取当前用户的身份特征。
可以理解的是,语音特征中包括用户的声纹特征信息,声纹特征是每个人独有的生物特征,可以将声纹特征作为用户的身份特征,每一个声纹特征对应一个用户。
在步骤209中,判断当前用户的身份特这个是否为预设身份特征。
为了避免非电子设备的用户的语音对语音拍照的干扰,可以在电子设备内部注册多个预设身份特征信息,例如,可以将每个可以使用该电子设备的用户录制一段话,从这段话中提取相应的声纹特征,然后将声纹特征进行保存,声纹特征可以作为每一个可使用该电子设备用户的身份特征。
此时,在接收到用户的语音信息之后,还需要判断用户的身份特征是否为预设身份特征,若是预设身份特征,则进入步骤210中,若不是预设身份特征,则进入步骤205中。
在步骤210中,将语音特征与预设的语音识别模型进行匹配,以得到匹配度,此步骤与步骤130相同,在此不作赘述。
在步骤211中,判断匹配度是否大于预设阈值,此步骤与步骤140相同,在此不作赘述。
在步骤212中,根据语音信息中的关键词确定拍照参数。
在得到语音信息后,根据预设特征提取算法对语音信息进行语音特征提取,得到语音特征,其中语音特征中包括用户的语音中的文本信息。
可以通过获取文本信息,得到相应的关键词,例如“拉近”、“调亮”、“抓拍”等。其中关键词对应着不同的拍照参数,例如调节焦距、光圈、曝光值、色调等等。
例如,关键词有“调亮”、“1600”,则可以对拍照参数中的ISO调节至1600。关键词有“拉近”、“50”,则将焦距调整至50。
在步骤213中,根据拍照参数对电子设备进行控制拍照。
在根据拍照参数对电子设备进行控制拍照之前,还可以检测电子设备是否正在处理其他拍照参数。
判断正在处理的其他拍照参数是否和根据语音信息获取的拍照参数相同。若两者相同,则中断对其他拍照参数的处理,处理根据语音信息获取的拍照参数。
从而实现通过用户的语音实现对电子设备相机的控制,实现语音拍照,提高拍照的便利性。
综上所述,在本申请实施例中,通过获取用户的预设语音信息,提取预设语音信息中的关键词,通过预设特征提取算法对关键词对应的语音进行特征提取以得到预设语音特征,对预设语音特征进行机器学习训练,以得到语音识别模型。
在电子设备处于拍摄模式下,获取电子设备被握持的握持区域,通过未被握持的区域对应的压电陶瓷单体接收当前时刻用户的语音信息,对语音信息进行分析以得到语音特征,根据语音特征获取当前用户的身份特征,判断当前用户的身份特征是否为预设身份特征,若是预设身份特征,将语音特征与预设的语音识别模型进行匹配以得到匹配度,在匹配度大于预设阈值时,根据语音信息中的关键词确定拍照参数,根据拍照参数对电子设备进行控制拍照。实现了语音控制拍照的便利性。
请参阅图3,图3是本申请实施例提供的拍照控制装置300的结构示意图。其中拍照控制装置300包括:训练模块310、获取模块320、分析模块330、匹配模块340、判断模块350及拍照模块360。
训练模块310,用于根据用户的预设语音信息训练语音识别模型。
在一种实施例中,训练模块310可以在对语音特征匹配之前建立语音识别模型,语音识别模型可以识别语音特征中的用户身份特征、文本信息特征等特征,可以通过获取大量的用户的预设语音信息,然后对预设语音信息利用预设机器学习算法进行训练,得到最终的语音识别模型。
在一种实施例中,训练模块310可以提取预设语音信息中的关键词,然后获取关键词对应的语音,将关键词对应的语音作为训练模板,对其进行机器学习训练,最终得到语音识别模型。
获取模块320,用于在电子设备处于拍照模式时,通过所述压电陶瓷单体接收当前时刻用户的语音信息。
在本申请中的电子设备中,设置了多个压电陶瓷单体来接收声音信号,例如,将压电陶瓷单体设置在电子设备中框的内表面,压电陶瓷单体可以设置多个。
又比如,在电子设备的后壳设置多个压电陶瓷单体,在摄像头周边区域设置至少一个压电陶瓷单体,由于用户在拍照时,是不会用手遮挡摄像头所在的区域,此时可以通过摄像头周边区域的压电陶瓷单体接收声音信号。
在用户在用手握持电子设备的时,可能握持多个区域,若这些握持区域存在压电陶瓷单体,则不能正常的接收声音信号,因此,需要获取电子设备上未被用户握持的区域。
获取模块320在摄像头周边区域的压电陶瓷单体可以用来接收声音信号。也可以通过边框上用户未握持的区域对应的压电陶瓷单体接收当前时刻用户的语音信息。
分析模块330,用于对所述语音信息进行分析以得到语音特征。
可以理解的是,用户的语音信息包括多种信息,例如用户的身份信息、文字信息等等。此时可以对语音信息进行分析,得到用户的语音特征。
其中,语音特征包括语音参数特征,例如语音特征的频域特征、时域特征、空域特征等等,又比如,声音的频率、音色、强度、声纹等信息,语音特征还可以包括用户需要表达的文本信息、感情信息等等。
在一种实施例中,分析模块330可以对语音信息进行静音切除、预加重、分帧等处理得到目标语音,然后对需要处理的目标语音输入到神经网络进行特征提取,得到语音信息的语音特征。
在一种实施例中,在获取到语音信息之后,分析模块330可以对语音信息分割为若干个语音单元,然后对每个语音单元的单元语音特征进行提取,最终将这些单元语音特征合成最终的语音特征。
匹配模块340,用于将所述语音特征与预设的语音识别模型进行匹配以得到匹配度。
在得到语音识别模型之后,匹配模块340将语音特征与语音识别模型进行匹配,得到匹配度。其中,在匹配的过程中,可以根据语音特征对用户的身份进行匹配,得到第一匹配度,还可以根据语音特征对关键词进行匹配得到第二匹配度,将第一匹配度和第二匹配度相加得到最终的匹配度。
判断模块350,用于判断所述匹配度是否大于预设阈值。
可以理解的是,在匹配度大于预设阈值时,判断模块350则认为语音特征和语音识别模型的匹配度较高,其中预设阈值的设置方式可以根据接收到的语音信息的多少来设置。
例如,预设阈值随着语音信息的增多而提高,在接收到的语音信息中,语音信息含量较少,则可以对预设阈值设置的较低,在接收到的语音信息较多时,可以对预设阈值设置较高。
预设阈值还可以根据当前环境来设置,例如当前的环境比较嘈杂,在接收到用户的语音信息时,也会接收到周围环境的噪声,此时可以对预设阈值设置较低,避免用户发出语音信息却不能匹配成功拍照。
拍照模块360,用于在所述匹配度达到预设阈值时,根据所述语音信息进行拍照。
在得到语音信息后,根据预设特征提取算法对语音信息进行语音特征提取,得到语音特征,其中语音特征中包括用户的语音中的文本信息。
拍照模块360可以通过获取文本信息,得到相应的关键词,例如“拉近”、“调亮”、“抓拍”等。其中关键词对应着不同的拍照参数,例如调节焦距、光圈、曝光值、色调等等。然后对拍摄对象进行拍照。
本申请实施例中,在电子设备处于拍照模式时,通过在电子设备上设置的多个压电陶瓷单体接收当前时刻用户的语音信息,对语音信息进行分析以得到语音特征,再将语音特征与预设的语音识别模型进行匹配以得到匹配度,判断匹配度是否大于预设阈值,若匹配度大于预设阈值,则根据语音信息进行拍照。通过对当前用户语音信息的采集,并提取语音信息的语音特征,最终根据语音特征进行拍照,实现了语音控制拍照的便利性。
本申请实施例还提供一种电子设备400,请参阅图4,图4为本申请实施例提供的电子设备的第一结构示意图。电子设备400包括显示器410、存储器420、处理器430、电源440及压电陶瓷模组450。其中,处理器430与压电陶瓷模组450、电源440、存储器420以及显示屏410电性连接。压电陶瓷模组450包括多个压电陶瓷单体诸如压电陶瓷单体,每一压电陶瓷单体用于接收声音信号。
处理器430是电子设备400的控制中心,利用各种接口和线路连接整个电子设备400的各个部分,通过运行或加载存储在存储器420内的计算机程序,以及调用存储在存储器430内的数据,执行电子设备400的各种功能并处理数据,从而对电子设备400进行整体监控。
存储器420可用于存储软件程序以及模块,处理器430通过运行存储在存储器420的计算机程序以及模块,从而执行各种功能应用以及数据处理。存储器420可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的计算机程序等;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器420可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器420还可以包括存储器控制器,以提供处理器430对存储器420的访问。
显示器410可以用于显示由用户输入的信息或提供给用户的信息以及各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示器410包括显示屏,显示屏用于显示画面,显示屏可以显示上述申请实施例所述的预设物体图像。
此外,图中没有展示的,电子设备400还可以包括控制电路,控制电路可以包括音频控制子电路,音频控制子电路可用于控制压电陶瓷单体是否振动、振动幅度以及振动频率,音频控制子电路可以与处理器430和压电陶瓷单体电性连接,音频控制子电路可以通过控制压电陶瓷单体的振动状态以控制压电陶瓷单体是否接收声音等,其中音频子控制电路可以包括滤波器或者功率放大器。
在本申请实施例中,电子设备400中的处理器430会按照如下的步骤,将一个或一个以上的计算机程序的进程对应的指令加载到存储器420中,并由处理器430运行存储在存储器420中的计算机程序,从而实现各种功能,如下:
在电子设备处于拍照模式时,通过所述压电陶瓷单体接收当前时刻用户的语音信息;
对所述语音信息进行分析以得到语音特征;
将所述语音特征与预设的语音识别模型进行匹配以得到匹配度;
判断所述匹配度是否大于预设阈值;
若是,则根据所述语音信息进行拍照。
为此,本申请实施例提供一种存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本申请实施例所提供的任一种拍照控制方法中的步骤。例如,该指令可以执行如下步骤:
在电子设备处于拍照模式时,通过所述压电陶瓷单体接收当前时刻用户的语音信息;
对所述语音信息进行分析以得到语音特征;
将所述语音特征与预设的语音识别模型进行匹配以得到匹配度;
判断所述匹配度是否大于预设阈值;
若是,则根据所述语音信息进行拍照。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的指令,可以执行本申请实施例所提供的任一种拍照控制方法中的步骤,因此,可以实现本申请实施例所提供的任一种拍照控制方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
在本申请实施例中,压电陶瓷单体在电子设备上设置有多种方式。具体请参阅图5,图5是本申请实施例提供的压电陶瓷单体的第一位置示意图。
其中,压电陶瓷单体550可以设置在电子设备中框520的上,中框520包括两个长边框和两个短边框,长边框的长度均大于短边框的长度,所述两个长边框和两个短边框依次连接形成边框,压电陶瓷单体550可以设置在边框的内表面上,其中压电陶瓷单体550可以为多个。
在一种实施例中,在短边框上各设置一个压电陶瓷单体550,用于接收声音信号,还可以在长边框上分别设置两个压电陶瓷单体550,用于接收声音信号,在人手握持电子设备时,会握持到边框,从而导致部分压电陶瓷单体550接收不到声音信号,此时可以通过人手未握持的边框上设置的压电陶瓷单体550来接收声音信号。
在一种实施例中,在人手握持到压电陶瓷单体550所在的边框时,压电陶瓷单体550可以通过振动提示用户握持到了压电陶瓷单体550所在的区域,从而使用户改变握持位置,以接收声音信号。
在用户拍照时,电子设备可能放在桌面上,其中一个边框就会被外界物体挡住,此时可以通过其他压电陶瓷单体550接收声音信号,通过上述拍照控制的方法来通过语音控制拍照。
请参阅图6,图6是本申请实施例提供的压电陶瓷单体的第二位置示意图。
其中,压电陶瓷单体550可以设置在电子设备的后盖上,电子设备的后盖可以分为上半部分570和下半部分580,具体的,请参考分割线590进行区分。
电子设备上半部分570可以设置多个压电陶瓷单体550,具体地,可以设置在摄像头560附近,由于用户在拍照时,不会遮挡摄像头,所以设置压电陶瓷单体550在摄像头周边区域,能够保障对声音信号的接收。
在电子设备后壳的下半部分580,可以设置多个压电陶瓷单体550,在用户拍照时,下半部分580的压电陶瓷单体550可以协同上半部分570的压电陶瓷单体550共同接收声音信号,保证声音信号的接收稳定性。
需要说明的是,上述压电陶瓷单体550可以有多个,多个压电陶瓷单体550可以形成压电陶瓷模组,用于接收声音信号。
在一种实施例中,电子设备可以是无开孔的电子设备,在电子设备内部可以设置多个压电陶瓷单体550,用于接收声音信号、发出声音信号、或者用于震动提醒。由于电子设备是无孔设计,因此可以防水,在用户在水下拍照时,通过压电陶瓷单体550接收声音信号,通过上述拍照控制方法实现语音控制拍照。
请参阅图7,图7是本申请实施例提供的压电陶瓷单体的结构示意图。
压电陶瓷单体550的形状可以为规则形状,比如第一压电陶瓷单体550可以为矩形结构、圆角矩形结构、圆形结构等。第一压电陶瓷单体550可以为不规则形状。
第一压电陶瓷单体550可以包括层叠设置的第一压电陶瓷片551、膜片552和第二压电陶瓷片553。其中,第一压电陶瓷片551和第二压电陶瓷片553为导体,可以用于传导电流。膜片552为非导体,不可以用于传导电流。
膜片552的尺寸大于第一压电陶瓷片551和第二压电陶瓷片553的尺寸。膜片552可以包括第一区和第二区,第二区设置在第一区的周缘。比如第二区可以围绕在第一区的周缘设置。其中,第一压电陶瓷片551和第二压电陶瓷片553设置在第一区,使得第二区裸露在外。
第一压电陶瓷片551和第二压电陶瓷片553分别与交流电源诸如交流电源200电性连接,以用于将交流电源所输出的电能转换为机械能。交流电用于输出交流电压,交流电源可以包括电位值不同的第一电极和第二电极。
第一压电陶瓷片551具有相对的第一端面和第二端面,其中第一端面为远离膜片552的一面,第二端面为与第一区连接的一面。第一端面与交流电源的第一电极电性连接,第二端面与交流电源的第二电极电性连接。
第二压电陶瓷片553具有相对的第三端面和第四端面,其中第三端面为与第一区连接的一面,第四端面为远离膜片552的一面。第三端面与交流电源的第二电极电性连接,第四端面与交流电源的第一电极电性连接。
在交流电源的电压改变时,可以控制第一压电陶瓷片551、第二压电陶瓷片553发生形变,形变幅度可以与交变电压的电压幅值相关联,从而可以用于接收声音信号或者发出声音信号。需要说明的是,第一压电陶瓷片551、第二压电陶瓷片553的数量可以根据实际情况进行设置,本申请实施例对此并不予以限定。
请参阅图8,图8是本申请实施例提供的电子设备的第二结构示意图。
电子设备500包括显示屏510、中框520、电路板530、电池540、电池盖、压电陶瓷单体550以及处理器。
显示屏510安装在中框520上,以形成电子设备500的显示面,用于显示图像、文本等信息。其中,显示屏510可以包括液晶显示屏(Liquid Crystal Display,LCD)或有机发光二极管显示屏(Organic Light-Emitting Diode,OLED)等类型的显示屏。所述显示屏510还可以为柔性屏,也即所述显示屏510可以产生形变。
可以理解的,显示屏510可以包括显示面以及与所述显示面相对的非显示面。所述显示面为所述显示屏510朝向用户的表面,也即所述显示屏510在电子设备500上用户可见的表面。所述非显示面为所述显示屏510朝向电子设备500内部的表面。其中,所述显示面用于显示信息。
可以理解的,显示屏510上还可以设置盖板,以对显示屏510进行保护,防止显示屏510被刮伤或者被水损坏。其中,所述盖板可以为透明玻璃盖板,从而用户可以透过盖板观察到显示屏510显示的内容。可以理解的,所述盖板可以为蓝宝石材质的玻璃盖板。
所述中框520可以为薄板状或薄片状的结构,也可以为中空的框体结构。中框520用于为电子设备500中的电子器件或功能组件提供支撑作用,以将电子设备500的电子器件、功能组件安装到一起。例如,所述中框520上可以设置凹槽、凸起、通孔等结构,以便于安装电子设备500的电子器件或功能组件。可以理解的,中框520的材质可以包括金属或塑胶等。
电池盖与所述中框520连接。例如,所述电池盖可以通过诸如双面胶等粘接剂贴合到中框520上以实现与中框520的连接。其中,电池盖用于与所述中框520、所述显示屏510共同将电子设备500的电子器件和功能组件密封在电子设备500内部,以对电子设备500的电子器件和功能组件形成保护作用。可以理解的,电池盖可以一体成型。在电池盖的成型过程中,可以在电池盖上形成后置摄像头安装孔等结构。可以理解的,电池盖的材质也可以包括金属或塑胶等。
电路板530安装在中框520上以进行固定,并通过电池盖将电路板530密封在电子设备500内部。其中,电路板530可以为电子设备500的主板。所述电路板530上可以设置有音频处理电路,所述音频处理电路用于对音频数据进行处理,从而产生声音信号,并将产生的声音信号传输到电子设备500外部。此外,所述电路板530上还可以集成有处理器、摄像头、耳机接口、加速度传感器、陀螺仪、马达等功能组件中的一个或多个。同时,显示屏510可以电连接至电路板530,以通过电路板530上的处理器对显示屏510的显示进行控制。
电池540可以安装在壳体20的中框520上以进行固定,并通过电池盖将电池540密封在电子设备500内部。同时,电池540电连接至所述电路板530,以实现电池540为电子设备500供电。其中,电路板530上可以设置有电源管理电路。所述电源管理电路用于将电池540提供的电压分配到电子设备500中的各个电子器件。
在本申请实施例中,电子设备还包括其他元器件,例如传感器、音频电路、射频电路、输入单元等等,图8中并未示出,但是存在于本申请中的电子设备中,本申请实施例中例举的器件不应视为对本申请的限制。
以上对本申请实施例所提供的一种拍照控制方法、装置、存储介质及电子设备进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (9)

1.一种拍照控制方法,应用于电子设备,所述电子设备包括压电陶瓷单体,其特征在于,所述方法包括:
在电子设备处于拍照模式时,通过所述压电陶瓷单体接收当前时刻用户的语音信息;
将所述语音信息分割为多个语音单元,对每个所述语音单元中的语音信息进行提取以得到多个单元语音特征;
将所述多个单元语音特征进行合成,得到所述语音信息对应的语音特征;
提取预设语音信息中的关键词;
通过预设特征提取算法对所述关键词对应的语音进行特征提取以得到预设语音特征,所述预设语音特征包括用户身份特征及文本信息特征;
根据所述预设语音特征对语音识别模型进行机器学习训练,以得到训练好的语音识别模型;
将所述语音特征输入至训练好的语音识别模型中进行身份匹配得到第一匹配度,并进行关键词匹配得到第二匹配度;
将所述第一匹配度和所述第二匹配度相加得到所述语音信息中语音特征对应的匹配度;
根据所述压电陶瓷单体接收到的所述语音信息的信息量设置预设阈值;
判断所述语音信息中语音特征对应的匹配度是否大于预设阈值;
若是,则根据所述语音信息进行拍照。
2.根据权利要求1所述的拍照控制方法,其特征在于,所述在电子设备处于拍照模式时,通过所述压电陶瓷单体接收当前时刻用户的语音信息,包括:
在所述电子设备被握持的情况下,获取所述电子设备被握持的握持区域;
当所述握持区域为所述电子设备的第一区域时,控制所述电子设备的第二区域的压电陶瓷单体接收声音信号;
当所述握持区域为所述电子设备的所述第二区域时,控制所述电子设备的所述第一区域的压电陶瓷单体接收声音信号。
3.根据权利要求1所述的拍照控制方法,其特征在于,在将所述语音特征与预设的语音识别模型进行匹配以得到匹配度之前,所述方法还包括:
根据所述语音特征获取当前用户的身份特征;
判断所述当前用户的身份特征是否为预设身份特征;
若是,则将所述语音特征与预设的语音识别模型进行匹配以得到匹配度。
4.根据权利要求1所述的拍照控制方法,其特征在于,所述根据所述语音信息进行拍照,包括:
根据所述语音信息中的关键词确定拍照参数,所述拍照参数包括调节焦距;
判断所述拍照参数和正在调节的拍照参数是否为同种类型的拍照参数;
若是,则中断对所述正在调节的拍照参数的处理,根据拍照指令调整当前拍照参数以进行拍照。
5.一种拍照控制装置,其特征在于,所述装置包括:
获取模块,用于在电子设备处于拍照模式时,通过压电陶瓷单体接收当前时刻用户的语音信息;
分析模块,用于将所述语音信息分割为多个语音单元,对每个所述语音单元中的语音信息进行提取以得到多个单元语音特征;
将所述多个单元语音特征进行合成,得到所述语音信息对应的语音特征;
训练模块,用于提取预设语音信息中的关键词;
通过预设特征提取算法对所述关键词对应的语音进行特征提取以得到预设语音特征,所述预设语音特征包括用户身份特征及文本信息特征;
根据所述预设语音特征对语音识别模型进行机器学习训练,以得到训练好的语音识别模型;
匹配模块,用于将所述语音特征输入至训练好的语音识别模型中进行身份匹配得到第一匹配度,并进行关键词匹配得到第二匹配度;
将所述第一匹配度和所述第二匹配度相加得到所述语音信息中语音特征对应的匹配度;
阈值设置模块,用于根据所述压电陶瓷单体接收到的所述语音信息的信息量设置预设阈值;
判断模块,用于判断所述语音信息中语音特征对应的匹配度是否大于预设阈值;
拍照模块,用于在所述匹配度达到预设阈值时,根据所述语音信息进行拍照。
6.一种存储介质,其特征在于,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1至4任一项所述的拍照控制方法中的步骤。
7.一种电子设备,其特征在于,包括:
壳体,所述壳体包括第一区域和第二区域,所述第一区域和所述第二区域中每一区域至少设置一个压电陶瓷单体,所述压电陶瓷单体用于接收声音信号;
处理器,与所述压电陶瓷单体电性连接,所述处理器用于:
在电子设备处于拍照模式时,通过所述压电陶瓷单体接收当前时刻用户的语音信息;
将所述语音信息分割为多个语音单元,对每个所述语音单元中的语音信息进行提取以得到多个单元语音特征;
将所述多个单元语音特征进行合成,得到所述语音信息对应的语音特征;
提取预设语音信息中的关键词;
通过预设特征提取算法对所述关键词对应的语音进行特征提取以得到预设语音特征,所述预设语音特征包括用户身份特征及文本信息特征;
根据所述预设语音特征对语音识别模型进行机器学习训练,以得到训练好的语音识别模型;
将所述语音特征输入至训练好的语音识别模型中进行身份匹配得到第一匹配度,并进行关键词匹配得到第二匹配度;
将所述第一匹配度和所述第二匹配度相加得到所述语音信息中语音特征对应的匹配度;
根据所述压电陶瓷单体接收到的所述语音信息的信息量设置预设阈值;
判断所述语音信息中语音特征对应的匹配度是否大于预设阈值;
若是,则根据所述语音信息进行拍照。
8.根据权利要求7所述的电子设备,其特征在于,所述壳体包括:
后盖,所述第一区域和所述第二区域为所述后盖上相对的两个区域。
9.根据权利要求8所述的电子设备,其特征在于,所述电子设备还包括:
中框,所述中框上设置有至少一个压电陶瓷单体,在所述中框上压电陶瓷单体对应的区域未被握持时,所述压电陶瓷单体用于接收声音信号。
CN201910819084.4A 2019-08-30 2019-08-30 拍照控制方法、装置、存储介质及电子设备 Active CN110602391B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910819084.4A CN110602391B (zh) 2019-08-30 2019-08-30 拍照控制方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910819084.4A CN110602391B (zh) 2019-08-30 2019-08-30 拍照控制方法、装置、存储介质及电子设备

Publications (2)

Publication Number Publication Date
CN110602391A CN110602391A (zh) 2019-12-20
CN110602391B true CN110602391B (zh) 2021-08-24

Family

ID=68856639

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910819084.4A Active CN110602391B (zh) 2019-08-30 2019-08-30 拍照控制方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN110602391B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111565281A (zh) * 2020-05-07 2020-08-21 Oppo广东移动通信有限公司 拍照方法、装置、电子设备以及存储介质
CN111757007B (zh) * 2020-07-09 2022-02-08 深圳市欢太科技有限公司 图像拍摄方法、装置、终端及存储介质
CN114374815B (zh) * 2020-10-15 2023-04-11 北京字节跳动网络技术有限公司 图像采集方法、装置、终端和存储介质
CN114173061B (zh) * 2021-12-13 2023-09-29 深圳万兴软件有限公司 一种多模态摄像控制方法、装置、计算机设备及存储介质
CN115188135B (zh) * 2022-09-01 2023-08-25 广州卓腾科技有限公司 一种用于自助办证设备的操作方法、系统和介质
CN117354623A (zh) * 2023-12-04 2024-01-05 深圳市冠旭电子股份有限公司 拍照的控制方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103065631A (zh) * 2013-01-24 2013-04-24 华为终端有限公司 一种语音识别的方法、装置
CN103578468A (zh) * 2012-08-01 2014-02-12 联想(北京)有限公司 一种语音识别中置信度阈值的调整方法及电子设备
CN205486116U (zh) * 2015-12-28 2016-08-17 深圳市亚略特生物识别科技有限公司 基于生物识别的移动终端
CN108922520A (zh) * 2018-07-12 2018-11-30 Oppo广东移动通信有限公司 语音识别方法、装置、存储介质及电子设备
CN109003607A (zh) * 2018-07-12 2018-12-14 Oppo广东移动通信有限公司 语音识别方法、装置、存储介质及电子设备

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050118990A1 (en) * 2003-12-02 2005-06-02 Sony Ericsson Mobile Communications Ab Method for audible control of a camera
CN103778915A (zh) * 2012-10-17 2014-05-07 三星电子(中国)研发中心 语音识别方法和移动终端
CN105592264A (zh) * 2015-12-17 2016-05-18 北京大学深圳研究生院 一种语音控制拍照软件
CN105931637A (zh) * 2016-04-01 2016-09-07 金陵科技学院 一种可自定义指令识别的语音拍照系统
CN106373567A (zh) * 2016-08-28 2017-02-01 广安奥海通讯电子科技有限公司 一种语音控制拍照的拍照方法和装置
CN109302528B (zh) * 2018-08-21 2021-05-25 努比亚技术有限公司 一种拍照方法、移动终端及计算机可读存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103578468A (zh) * 2012-08-01 2014-02-12 联想(北京)有限公司 一种语音识别中置信度阈值的调整方法及电子设备
CN103065631A (zh) * 2013-01-24 2013-04-24 华为终端有限公司 一种语音识别的方法、装置
CN205486116U (zh) * 2015-12-28 2016-08-17 深圳市亚略特生物识别科技有限公司 基于生物识别的移动终端
CN108922520A (zh) * 2018-07-12 2018-11-30 Oppo广东移动通信有限公司 语音识别方法、装置、存储介质及电子设备
CN109003607A (zh) * 2018-07-12 2018-12-14 Oppo广东移动通信有限公司 语音识别方法、装置、存储介质及电子设备

Also Published As

Publication number Publication date
CN110602391A (zh) 2019-12-20

Similar Documents

Publication Publication Date Title
CN110602391B (zh) 拍照控制方法、装置、存储介质及电子设备
CN109547588A (zh) 移动终端
CN110364156A (zh) 语音交互方法、系统、终端及可读存储介质
CN113744750B (zh) 一种音频处理方法及电子设备
CN105635452A (zh) 移动终端及其联系人标识方法
CN109065068B (zh) 音频处理方法、装置及存储介质
CN114299933A (zh) 语音识别模型训练方法、装置、设备、存储介质及产品
CN111613213B (zh) 音频分类的方法、装置、设备以及存储介质
CN110992927A (zh) 音频生成方法、装置、计算机可读存储介质及计算设备
CN106550132A (zh) 一种移动终端及其控制方法
CN110600034B (zh) 歌声生成方法、装置、设备及存储介质
CN110992954A (zh) 语音识别的方法、装置、设备及存储介质
CN111341317A (zh) 唤醒音频数据的评价方法、装置、电子设备及介质
CN104052872B (zh) 具有铃声辨识功能的电子装置及铃声辨识方法
CN109819113A (zh) 拍摄控制方法、终端及计算机可读存储介质
CN113747057B (zh) 一种图像处理方法、电子设备、芯片系统和存储介质
CN110581911B (zh) 电子设备及声音控制方法
CN114360494A (zh) 韵律标注方法、装置、计算机设备及存储介质
CN111028846B (zh) 免唤醒词注册的方法和装置
CN115395827A (zh) 驱动波形的调整方法、装置、设备及可读存储介质
CN202679460U (zh) 具有照相双重防抖功能的移动通讯设备
CN111916105A (zh) 语音信号处理方法、装置、电子设备及存储介质
CN111681654A (zh) 语音控制方法、装置、电子设备及存储介质
CN111091807A (zh) 语音合成方法、装置、计算机设备及存储介质
CN113362841B (zh) 音频信号处理方法、装置和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant