CN106131413B - 一种拍摄设备的控制方法及拍摄设备 - Google Patents

一种拍摄设备的控制方法及拍摄设备 Download PDF

Info

Publication number
CN106131413B
CN106131413B CN201610571187.XA CN201610571187A CN106131413B CN 106131413 B CN106131413 B CN 106131413B CN 201610571187 A CN201610571187 A CN 201610571187A CN 106131413 B CN106131413 B CN 106131413B
Authority
CN
China
Prior art keywords
image
shooting
angle
image acquisition
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610571187.XA
Other languages
English (en)
Other versions
CN106131413A (zh
Inventor
陆见微
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ninebot Beijing Technology Co Ltd
Original Assignee
Ninebot Beijing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ninebot Beijing Technology Co Ltd filed Critical Ninebot Beijing Technology Co Ltd
Priority to CN201610571187.XA priority Critical patent/CN106131413B/zh
Publication of CN106131413A publication Critical patent/CN106131413A/zh
Application granted granted Critical
Publication of CN106131413B publication Critical patent/CN106131413B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Abstract

本发明公开了一种拍摄设备的控制方法及拍摄设备。其中,该控制方法应用于拍摄设备,拍摄设备具有音频采集单元和图像采集单元,包括:获得音频采集单元采集得到的第一音频数据;根据第一音频数据进行语音分析,获得语音分析结果;基于语音分析结果,在确定第一音频数据用于指示进行图像采集时,获得图像采集对象信息;根据图像采集对象信息,控制图像采集单元转动第一角度、或控制拍摄设备的底盘转动第一角度,以对确定的图像采集对象进行图像采集。本发明解决了现有技中的拍摄设备需要手动操作,操作复杂且拍摄效果差的技术问题。

Description

一种拍摄设备的控制方法及拍摄设备
技术领域
本发明涉及拍摄设备控制领域,具体而言,涉及一种拍摄设备的控制方法及拍摄设备。
背景技术
随着互联网的不断发展,越来越多的用户习惯拍摄照片上传到网上,分享给自己的亲戚朋友观看。但是现有的拍摄设备,例如照相机、摄像机、具有拍摄功能的手机等,需要手动调节拍摄选项,操作过程复杂繁琐,而拍摄设备自带的自动拍摄选项又不够智能。并且,在用户需要自拍,或者和他人进行合拍时,如果没有他人帮助,通常会使用自拍杆进行拍摄,或者使用三脚架,并通过定时拍摄功能实现,整个拍摄过程操作复杂,而且受到自拍杆或者三脚架的限制,拍摄效果往往不够理想。
针对现有技中的拍摄设备需要手动操作,操作复杂且拍摄效果差的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种拍摄设备的控制方法及拍摄设备,以至少解决现有技中的拍摄设备需要手动操作,操作复杂且拍摄效果差的技术问题。
根据本发明实施例的一个方面,提供了一种拍摄设备的控制方法,包括:获得音频采集单元采集得到的第一音频数据,第一音频数据是音频采集单元通过采集目标对象发出的语音所获得音频数据;根据第一音频数据进行语音分析,获得语音分析结果;基于语音分析结果,在确定第一音频数据用于指示进行图像采集时,获得图像采集对象信息,图像采集对象信息也是基于语音分析结果获得的;根据图像采集对象信息,控制图像采集单元转动第一角度、或控制拍摄设备的底盘转动第一角度,以对确定的图像采集对象进行图像采集。
根据本发明实施例的另一方面,还提供了一种拍摄设备,包括:图像采集单元,用于采集图像数据;音频采集单元,用于通过采集目标对象发出的语音,得到第一音频数据;音频处理单元,与音频采集单元连接,用于根据第一音频数据进行语音分析,获得语音分析结果,并基于语音分析结果,在确定第一音频数据用于指示进行图像采集时,获得图像采集对象信息,图像采集对象信息也是基于语音分析结果获得的;控制单元,分别与图像采集单元和音频处理单元连接,用于根据图像采集对象信息,控制图像采集单元转动第一角度、或控制拍摄设备的底盘转动第一角度,以使所述图像采集单元对确定的图像采集对象进行图像采集。
在本发明实施例中,可以在获得音频采集单元采集得到的第一音频数据之后,根据第一音频数据进行语音分析,获得语音分析结果,并基于语音分析结果,在确定第一音频数据用于指示进行图像采集时,获得图像采集对象信息,以及根据图像采集对象信息,控制图像采集单元转动第一角度、或控制拍摄设备的底盘转动第一角度,以对确定的图像采集对象进行图像采集,从而实现拍摄设备根据用户发出的语音,自动进行拍摄,整个拍摄过程中无需人工进行操作,解决了现有技中的拍摄设备需要手动操作,操作复杂且拍摄效果差的技术问题。因此,通过本发明上述实施例,可以实现自动拍摄,降低操作复杂度,优化拍摄效果,提升用户体验感和好感度的效果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种拍摄设备的控制方法的流程图;
图2是根据本发明实施例的一种拍摄设备的示意图;以及
图3是根据本发明实施例的一种可选的拍摄设备的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
首先,在对本发明实施例中出现的部分名词或术语进行解释:
MicArray:麦克阵列,是使用两个或更多个麦克风,按照一定的方式排布,接收声音输入。这样做的好处是,可以通过麦克风接收到声波的相位差进行滤波处理,达到过滤噪声、定位声波方向等功能。
语音识别和语义分析:是指通过语音与机器交流,让机器人明白人的意图。
计算机视觉图像处理:是指通过各种摄像头以及红外、超声、激光雷达等感知输入设备。获取图像数据进而进行人脸发现、人脸识别、人体识别、人体跟踪、骨骼识别、手势识别、物体识别等功能。
机器人(Robot):是自动执行工作的机器装置。它既可以接受人类指挥,又可以运行预先编排的程序,也可以根据以人工智能技术制定的原则纲领行动。它的任务是协助或取代人类工作的工作,例如生产业、建筑业,或是危险的工作。
实施例1
根据本发明实施例,提供了一种拍摄设备的控制方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
其中,该拍摄设备的控制方法应用于拍摄设备,拍摄设备可以具有音频采集单元和图像采集单元,可以对拍摄设备周围的声音和图像进行采集,得到音频数据和图像数据。
图1是根据本发明实施例的一种拍摄设备的控制方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,获得音频采集单元采集得到的第一音频数据,第一音频数据是音频采集单元通过采集目标对象发出的语音所获得音频数据。
具体的,上述音频采集单元可以是麦克阵列,上述目标对象可以是使用拍摄设备的用户,用户在使用拍摄设备时,可以通过语音控制拍摄设备,无需进行手动操作。
在一种可选的方案中,拍摄设备可以通过麦克阵列中的两个麦克风或更多的麦克风,接收到用户发出的语音。例如,用户可以发出语音“给我和这个雕像拍一个全身的合影”,拍摄设备可以通过两个麦克风或更多的麦克风采集到用户发出的语音命令。
步骤S104,根据第一音频数据进行语音分析,获得语音分析结果。
在一种可选的方案中,在拍摄设备通过麦克阵列中的两个麦克风或更多的麦克风,接收到用户发出的语音命令之后,可以通过语音处理系统,对采集到的用户发出的语音命令进行语音识别和语义分析,了解用户的拍摄意图,得到用户发出的语音命令中包含的关键词。例如,在拍摄设备通过两个麦克风或更多的麦克风采集到用户发出的语音命令“给我和这个雕像拍一个全身的合影”之后,可以通过语音处理系统对语音命令进行语音识别和语义分析,得到语音命令中包含的关键词“我”、“雕像”、“拍”、“全身”和“合影”。
步骤S106,基于语音分析结果,在确定第一音频数据用于指示进行图像采集时,获得图像采集对象信息,图像采集对象信息也是基于语音分析结果获得的。
具体的,上述图像采集可以是拍照或者录像。
可选的,图像采集对象可以包括:目标对象,和/或,拍摄对象,其中,拍摄对象是基于语音分析结果确定的除目标对象之外的图像采集对象。
在一种可选的方案中,在对用户发出的语音命令进行语音识别和语义分析,得到语音命令中包含的关键词之后,可以根据关键词,确定用户是否需要进行图像采集,如果确定用户需要进行图像采集,则从语音命令中包含的关键词中,得到用于描述图像采集对象的信息。例如,在得到语音命令中包含的关键词“我”、“雕像”、“拍”、“全身”和“合影”之后,根据关键词“拍”和“合影”可以确定用户需要进行图像采集,进一步可以从关键词中得到图像采集对象信息,即“我”和“雕像”,从而确定图像采集对象为用户和雕像。
步骤S108,根据图像采集对象信息,控制图像采集单元转动第一角度、或控制拍摄设备的底盘转动第一角度,以对确定的图像采集对象进行图像采集。
具体的,上述图像采集单元可以是具有拍摄功能的设备,例如摄像头,照相机,录像机。
在一种可选的方案中,拍摄设备的控制单元可以根据关键词中的图像采集对象信息,控制拍摄设备的摄像头或者底盘转动,对准图像采集对象,并通过图像采集单元对图像采集对象进行图像采集。例如,在从关键词中得到图像采集对象信息,即“我”,“雕像”之后,可以确定图像采集对象为用户和雕像,进一步控制摄像头对准用户和雕像进行拍照或者录像,完成图像采集。
采用本发明上述实施例,可以在获得音频采集单元采集得到的第一音频数据之后,根据第一音频数据进行语音分析,获得语音分析结果,并基于语音分析结果,在确定第一音频数据用于指示进行图像采集时,获得图像采集对象信息,以及根据图像采集对象信息,控制图像采集单元转动第一角度、或控制拍摄设备的底盘转动第一角度,以对确定的图像采集对象进行图像采集,从而实现拍摄设备根据用户发出的语音,自动进行图像采集,整个图像过程中无需人工进行操作,解决了现有技中的拍摄设备需要手动操作,操作复杂且拍摄效果差的技术问题。因此,通过本发明上述实施例,可以实现自动拍摄,降低操作复杂度,优化拍摄效果,提升用户体验感和好感度的效果。
可选的,根据本发明上述实施例,在图像采集对象为目标对象的情况下,步骤S108,控制图像采集单元转动第一角度、或控制拍摄设备的底盘转动第一角度,包括:
步骤S112,基于语音分析结果,获得目标对象的方位信息。
在一种可选的方案中,在得到图像采集对象信息之后,如果得到的图像采集对象信息为用户,则可以通过语音处理系统,采用麦克阵列对用户发出的语音进行声源定位处理,确定用户所在方位。例如,用户可以发出语音“给我拍一个自拍照”,在拍摄设备在采集到语音命令,对语音命令进行语音分析,得到语音命令中包含的关键词“我”、“拍”和“自拍照”,确定用户需要进行图像采集,进一步获得图像采集对象信息“我”,即图像采集对象为用户,可以通过麦克阵列进行声源定位,确定用户的方位为正北方。
步骤S114,基于目标对象的方位信息,控制图像采集单元转动第一子角度、或控制拍摄设备的底盘转动第一子角度,在转动第一子角度后,获得图像采集单元采集得到的第一图像数据。
具体的,上述第一子角度可以是根据拍摄设备的对准方位与用户所在方位进行计算,得到的两个方位的夹角。
在一种可选的方案中,在得到用户所在方位之后,拍摄设备的控制单元可以计算用户所在方位与拍摄设备当前对准方位进行控制摄像头或底盘转动的夹角,得到第一子角度,并控制摄像头或者底盘转动第一子角度,将摄像头对准用户所在方位,进行图像采集,得到第一图像数据。例如,在确定用户的方位为正北方,并且拍摄设备的对准方位为正西方之后,可以计算得到第一子角度为90°,拍摄设备控制摄像头或者底盘转动逆时针转动90°,将摄像头对准正北方,并通过摄像头采集图像。
步骤S116,根据第一图像数据进行图像识别,获得目标对象在第一图像数据中所处的位置信息。
在一种可选的方案中,拍摄设备可以通过摄像头采集拍摄范围内的图像数据,通过视觉算法系统对采集到的图像数据进行人脸识别,识别图像数据中用户所在的具体位置。例如,在通过摄像头采集到图像之后,视觉算法系统可以进行人脸识别,确定图像中用户所处的具体位置,如用户在图像中所处的具体位置为右上角。
在另一种可选的方案中,为了保证得到用户的位置准确,在通过摄像头采集图像的同时,可以通过红外传感器、雷达传感器等其他传感器进行辅助,感应用户与拍摄设备之间的距离,使得拍摄设备的参数信息更加准确,提升拍摄设备的准确性。
此处需要说明是,由于用户所在方位可能有很多其他人,如果仅仅通过人脸识别对图像进行识别,误差较高,导致拍摄设备的准确性下降,此时还可以通过对图像进行手势识别,只有特定手势的用户可以确定为目标对象,特定手势可以是容易识别,且实用度不高的手势,例如,特定手势可以是手臂举过头顶,食指、中指、无名指和小指握拳,大拇指向上伸出。
步骤S118,基于目标对象在第一图像数据中所处的位置信息,控制图像采集单元转动第二子角度、或控制拍摄设备的底盘转动第二子角度;其中,第一子角度与第二子角度相加获得第一角度。
在一种可选的方案中,在识别出图像数据中用户的具体位置之后,可以控制摄像头或者底盘进行小幅度转动,调整图像数据中用户的具体位置,提升图像采集效果。例如,在确定图像中用户的具体位置为右上角之后,可以控制摄像头向上小幅转动,控制底盘向右小幅转动,从而使图像中的用户位于图像的正中间。
可选的,根据本发明上述实施例,在图像采集对象为拍摄对象的情况下,步骤S108,控制图像采集单元转动第一角度、或控制拍摄设备的底盘转动第一角度,包括:
步骤S122,控制图像采集单元或拍摄设备的底盘按照预设方向转动,并获得图像采集单元采集得到的第二图像数据。
具体的,上述预设方向可以是提前设定的方向,例如,顺时针方向。
在一种可选的方案中,在得到图像采集对象信息之后,如果得到的图像采集对象信息为拍摄对象,则拍摄设备控制摄像头或者底盘顺时针转动,并在摄像头或者底盘转动的过程中,通过摄像头采集图像数据。例如,用户可以发出语音“给这个雕像拍照”,在拍摄设备在采集到语音命令,对语音命令进行语音分析,得到语音命令中包含的关键词“雕像”和“拍照”,确定用户需要进行图像采集,进一步获得图像采集对象信息“雕像”,即图像采集对象为雕像,可以控制摄像头或者底盘顺时针转动,并实时采集图像。
步骤S124,根据第二图像数据进行图像识别,判断第二图像数据中是否存在拍摄对象。
在一种可选的方案中,拍摄设备可以通过摄像头实时采集拍摄范围内的图像数据,通过视觉算法系统对采集到的图像数据进行图像处理,例如,当拍摄对象是物体时,可以对图像数据进行物体识别;当拍摄对象是人体任意一部分,例如手、脚时,可以对图像数据进行骨骼识别。如果在图像数据中识别出拍摄对象,则说明拍摄范围内存在拍摄对象,如果图像数据中无法识别出拍摄对象,则说明拍摄范围内不存在拍摄对象。例如,在摄像头或者底盘顺时针转动的过程中之后,可以通过摄像头采集拍摄范围内的图像,并对图像进行物体识别,识别该图像中是否存在“雕像”,如果在该图像中识别出“雕像”,则说明拍摄范围内存在“雕像”;如果未在该图像中识别出“雕像”,则说明拍摄范围内不存在“雕像”。
步骤S126,在识别第二图像数据中存在拍摄对象时,基于拍摄对象在第二图像数据中所处的位置信息,控制图像采集单元或拍摄设备的底盘进行转动调整;从图像采集单元或拍摄设备的底盘按照预设方向转动开始,到转动调整结束,图像采集单元或拍摄设备的底盘转动的角度即为第一角度。
在一种可选的方案中,如果在图像数据中识别出拍摄对象,则控制摄像头或者底盘停止转动,进一步确定拍摄对象在图像数据中的具体位置,控制摄像头或者底盘进行小幅度转动,调整拍摄对象在图像数据中的具体位置,提升图像采集效果。例如,在图像中识别出“雕像”之后,控制摄像头或者底盘停止转动,确定“雕像”在图像中的位置为左下角,进一步控制摄像头可以控制摄像头向下小幅转动,控制底盘向左小幅转动,从而使雕像位于图像的正中间。
可选的,根据本发明上述实施例,在图像采集对象包括目标对象和拍摄对象的情况下,步骤S108,控制图像采集单元转动第一角度、或控制拍摄设备的底盘转动第一角度,包括:
步骤S130,基于语音分析结果,获得目标对象的方位信息。
在一种可选的方案中,在得到图像采集对象信息之后,如果得到的图像采集对象信息为用户和拍摄对象,则首先可以通过语音处理系统,采用麦克阵列对用户发出的语音进行声源定位处理,确定用户所在方位。例如,用户可以发出语音“给我和这个雕像拍一个全身的合影”,在拍摄设备在采集到语音命令,对语音命令进行语音分析,得到语音命令中包含的关键词“我”、“雕像”、“拍”、“全身”和“合影”之后,确定用户需要进行图像采集,进一步获得图像采集对象信息“我”和“雕像”,即图像采集对象为用户和拍摄对象,可以通过麦克阵列进行声源定位,确定用户的方位为正北方。
步骤S132,基于目标对象的方位信息,控制图像采集单元转动第三子角度、或控制拍摄设备的底盘转动第三子角度,在转动第三子角度后,获得图像采集单元采集得到的第三图像数据。
在一种可选的方案中,在确定用户所在方位之后,可以拍摄设备的控制单元可以计算用户所在方位与拍摄设备当前对准方位进行控制摄像头或底盘转动的夹角,得到第三子角度,并控制摄像头或者底盘转动第三子角度,将摄像头对准用户所在方位,通过摄像头进行图像采集,得到第三图像数据。例如,在确定用户的方位为正北方,并且拍摄设备的对准方位为正西方之后,可以计算得到第一子角度为90度,拍摄设备控制摄像头或者底盘转动逆时针转动90度,将摄像头对准正北方,并通过摄像头采集图像。
步骤S134,根据第三图像数据进行图像识别,获得目标对象在第三图像数据中所处的位置信息,并判断第三图像数据中是否存在拍摄对象。
此处需要说明的是,由于用户发出语音时,可能离拍摄对象较远,例如,用户在拍摄对象对面,而拍摄设备处于用户和拍摄对象之间,在将拍摄设备转向用户所在方位之后,如果直接进行拍摄,将无法拍摄到拍摄对象。因此,为了避免上述情况的发生,在拍摄设备进行拍摄之前,首先需要判断拍摄范围内是否存在拍摄对象。
在一种可选的方案中,拍摄设备可以通过摄像头采集拍摄范围内的图像数据,通过视觉算法系统对采集到的图像数据进行图像处理,确定用户在图像数据中的具体位置,并在图像数据中识别拍摄对象,如果在图像数据中识别出拍摄对象,则说明拍摄范围内存在拍摄对象,如果图像数据中无法识别出拍摄对象,则说明拍摄范围内不存在拍摄对象。例如,在摄像头或者底盘转动逆时针转动90度之后,可以通过摄像头采集拍摄范围内的图像,并对图像进行人脸识别和物体识别,得到用户在图像中的具体位置为左下角,以及识别该图像中是否存在“雕像”,如果在该图像中识别出“雕像”,则说明拍摄范围内存在“雕像”;如果未在该图像中识别出“雕像”,则说明拍摄范围内不存在“雕像”。
在另一种可选的方案中,为了保证得到用户的位置准确,在通过摄像头采集图像的同时,可以通过红外传感器、雷达传感器等其他传感器进行辅助,感应用户与拍摄设备之间的距离,使得拍摄设备的参数信息更加准确,提升拍摄设备的准确性。
此处需要说明是,由于用户所在方位可能有很多其他人,如果仅仅通过人脸识别对图像进行识别,误差较高,导致拍摄设备的准确性下降,此时还可以通过对图像进行手势识别,只有特定手势的用户可以确定为目标对象,特定手势可以是容易识别,且实用度不高的手势,例如,特定手势可以是手臂举过头顶,食指、中指、无名指和小指握拳,大拇指向上伸出。
步骤S136,在第三图像数据中存在拍摄对象的情况下,获取拍摄对象在第三图像数据中所处的位置信息。
在一种可选的方案中,如果在图像数据中识别出拍摄对象,则确定拍摄对象在图像数据中的具体位置。例如,在图像中识别出“雕像”之后,对图像进行物体识别,确定“雕像”在图像中的位置为右下角。
步骤S138,基于目标对象在第三图像数据中所处的位置信息和拍摄对象在第三图像数据中所处的位置信息,控制图像采集单元转动第四子角度、或控制拍摄设备的底盘转动第四子角度;其中,第三子角度与第四子角度相加获得第一角度。
在一种可选的方案中,在识别出图像数据中用户的具体位置和拍摄对象的具体位置之后,可以控制摄像头或者底盘进行小幅度转动,调整图像数据中用户的具体位置以及拍摄对象的具体位置,提升图像采集效果。例如,在确定图像中用户的具体位置为左下角,确定“雕像”在图像中的位置为右下角之后,可以控制摄像头向下小幅转动,从而使图像中的用户以及雕像位于图像的正中间。
可选的,根据本发明上述实施例,在第三图像数据中不包含拍摄对象的情况下,上述方法还包括:
步骤S142,控制图像采集单元或拍摄设备的底盘按照预设方向转动,并获得转动过程中图像采集单元采集得到的第四图像数据。
具体的,上述预设方向可以是提前设定的方向,例如,顺时针方向。
在一种可选的方案中,如果确定拍摄范围内不存在拍摄对象,则控制摄像头或者底盘顺时针360°旋转,在旋转过程中通过摄像头采集图像数据,得到第四图像数据。例如,拍摄设备在将摄像头或者底盘转向正前方之后,如果拍摄范围内不存在“雕像”,则控制摄像头或者拍摄设备的底盘顺时针旋转,并在旋转过程中通过摄像头采集图像。
步骤S144,在第四图像数据中存在拍摄对象的情况下,获取拍摄对象与目标对象之间的相对位置信息。
在一种可选的方案中,如果识别出第四图像数据中存在拍摄对象,则控制摄像头或者底盘停止转动,并进一步确定拍摄对象在第四图像数据中的具体位置,根据拍摄对象在第四图像数据中的具体位置,以及用户在第三图像数据中的具体位置,得到相对位置信息。例如,在得到用户在图像中的具体位置为左下角之后,可以控制摄像头或者底盘顺时针旋转,当拍摄范围内存在“雕像”时,控制摄像头或者底盘停止旋转,通过视觉算法系统确定“雕像”在图像中的具体位置,根据用户在图像中的具体位置和“雕像”在图像中的具体位置,得到用户与雕像之间的相对位置,即用户在雕像的对面。
步骤S146,基于相对位置信息,生成提示信息,其中,提示信息用于提示目标对象移动至拍摄对象的位置。
步骤S148,输出提示信息。
在一种可选的方案中,可以根据用户和拍摄对象之间的相对位置信息,生成语音提示信息,并通过喇叭输出给用户,提示用户移动到拍摄对象所在位置。当用户移动到拍摄对象所在位置时,即拍摄范围内采集到的图像中可以识别出拍摄对象和用户,则控制摄像头对用户和拍摄对象进行拍摄。例如,在得到用户与雕像之间的相对位置之后,可以通过语音提示用户“请移动到对面的雕像旁边”,然后通过摄像头对用户和“雕像”进行拍照。
可选的,根据本发明上述实施例,步骤S108,控制图像采集单元转动第一角度包括:步骤S1082,控制拍摄设备的用于搭载图像采集单元的云台转动第一角度。
在一种可选的方案中,在获得到第一角度之后,可以通过运动控制器对搭载摄像头的云台进行控制,使云台转动第一角度。
可选的,根据本发明上述实施例,在步骤S108,控制图像采集单元转动第一角度、或控制拍摄设备的底盘转动第一角度之后,上述方法还包括:
步骤S152,基于语音分析结果,获得拍摄需求信息。
具体的,上述拍摄需求信息可以是用户想要的拍摄角度、拍摄尺寸。
步骤S154,根据拍摄需求信息,计算得到图像采集单元的拍摄参数。
具体的,上述拍摄参数可以是焦距,光圈,快门和白平衡等。
在一种可选的方案中,在对用户发出的语音命令进行语音识别和语义分析,得到语音命令中包含的关键词之后,可以根据关键词,确定用户的拍摄需求,并根据拍摄需求计算得到摄像头的参数。例如,在采集到用户发出的语音命令“给我和这个雕像拍一个全身的合影”之后,对语音命令进行语义分析,得到关键词“我”、“雕像”、“拍”、“全身”和“合影”,可以确定用户的拍摄需求是全身合影,并根据全身合影得到摄像头的参数。
步骤S156,控制图像采集单元按照拍摄参数对确定的图像采集对象进行图像采集。
在一种可选的方案中,在计算到摄像头的参数之后,可以通过拍照控制器对摄像头进行控制,调节摄像头的各项参数,使得摄像头的各项参数满足对应的参数,并进一步对图像采集对象进行图像采集。
可选的,根据本发明上述实施例,在步骤S108,控制图像采集单元转动第一角度、或控制拍摄设备的底盘转动第一角度之后,上述方法还包括:
步骤S100,根据图像采集对象信息,控制拍摄设备的底盘进行移动调整。
在一种可选的方案中,例如,当确定需要拍摄用户自己时,拍摄设备可以通过摄像头采集拍摄范围内的图像数据,并进行人脸识别,确定图像数据中用户的比例,并基于图像数据中用户的比例,控制底盘进行小距离移动,调整拍摄对象在图像数据中的比例。例如,在图像中识别到用户之后,确定用户在图像中的比例为10%,用户在整个图像中比例较低,即用户在图像中较小,可以控制底盘向前移动,从而使用户在图像中的比例升高,满足拍摄要求。
在另一种可选的方案中,例如,当确定需要拍摄用户和拍摄对象时,拍摄设备可以通过摄像头采集拍摄范围内的图像数据,并进行人脸识别和物体识别,确定图像数据中用户与拍摄对象的位置关系,并根据用户与拍摄对象的位置关系,控制底盘进行小距离移动,调整用户与拍摄对象在图像数据中的位置关系。例如,在图像中识别到用户和“雕像”之后,可以根据用户在图像中的位置和“雕像”在图像中的位置,确定用户与“雕像”的位置关系为重叠,即在图像中用户遮挡了“雕像”,或者“雕像”遮挡了用户,可以控制底盘向左或者向右移动,从而使用户和“雕像”在图像中分离,满足拍摄要求。
此处需要说明的是,拍摄设备还可以通过摄像头采集图像数据,并对图像数据进行手势识别和骨骼识别,得到用户的姿势,如果用户当前姿势或者当前位置不够理想,例如,用户离拍摄设备较近,用户低头,则可以通过语音给用户提示“请往后退一步,并将头抬起一些,好的,1,2,3,茄子!”。可以通过语音提示调整用户的姿势和位置,从而可以进行最佳拍摄,得到最优拍摄效果。
实施例2
根据本发明实施例,还提供了一种拍摄设备的实施例。
图2是根据本发明实施例的一种拍摄设备的示意图,如图2所示,该拍摄设备包括:
图像采集单元21,用于采集图像数据。
具体的,上述图像采集单元21可以是具有拍摄功能的设备,例如摄像头,照相机,录像机。
在一种可选的方案中,如图3所示,拍摄设备可以是具有拍摄功能的智能设备,例如智能机器人等,拍摄设备可以包括摄像头。拍摄设备可以通过摄像头采集摄像头拍摄范围内的图像数据,从而可以进行图像采集。
音频采集单元23,用于通过采集目标对象发出的语音,得到第一音频数据。
具体的,上述音频采集单元23可以是麦克阵列,上述目标对象可以是使用拍摄设备的用户,用户在使用拍摄设备时,可以通过语音控制拍摄设备,无需进行手动操作。
在一种可选的方案中,如图3所示,拍摄设备还可以包括麦克阵列,麦克阵列使用至少两个麦克风。拍摄设备可以通过麦克阵列中的两个麦克风或更多的麦克风,接收到用户发出的语音。例如,用户可以发出语音“给我和这个雕像拍一个全身的合影”,拍摄设备可以通过两个麦克风或更多的麦克风采集到用户发出的语音命令。
音频处理单元25,与音频采集单元23连接,用于根据第一音频数据进行语音分析,获得语音分析结果,并基于语音分析结果,在确定第一音频数据用于指示进行图像采集时,获得图像采集对象信息,图像采集对象信息也是基于语音分析结果获得的。
具体的,上述图像采集可以是拍照或者录像。
可选的,图像采集对象可以包括:目标对象,和/或,拍摄对象,其中,拍摄对象是基于语音分析结果确定的除目标对象之外的图像采集对象。
在一种可选的方案中,如图3所示,拍摄设备还可以包括与麦克阵列连接的语音处理系统,即上述的语音处理器,语音处理系统可以对采集到的语音命令进行声源定位,语音分析和语义分析。在拍摄设备通过麦克阵列中的两个麦克风或更多的麦克风,接收到用户发出的语音命令之后,可以通过语音处理系统,对采集到的用户发出的语音命令进行语音识别和语义分析,了解用户的拍摄意图,得到用户发出的语音命令中包含的关键词,在对用户发出的语音命令进行语音识别和语义分析,得到语音命令中包含的关键词之后,可以根据关键词,确定用户是否需要进行图像采集,如果确定用户需要进行图像采集,则从语音命令中包含的关键词中,得到用于描述图像采集对象的信息。例如,在拍摄设备通过两个麦克风或更多的麦克风采集到用户发出的语音命令“给我和这个雕像拍一个全身的合影”之后,可以通过语音处理系统对语音命令进行语音识别和语义分析,得到语音命令中包含的关键词“我”、“雕像”、“拍”、“全身”和“合影”,在得到语音命令中包含的关键词“我”、“雕像”、“拍”、“全身”和“合影”之后,根据关键词“拍”和“合影”可以确定用户需要进行图像采集,进一步可以从关键词中得到图像采集对象信息,即“我”和“雕像”,从而确定图像采集对象为用户和雕像。
控制单元27,分别与图像采集单元21和音频处理单元25连接,用于根据图像采集对象信息,控制图像采集单元转动第一角度、或控制拍摄设备的底盘转动第一角度,以使图像采集单元21对确定的图像采集对象进行图像采集。
在一种可选的方案中,如图3所示,拍摄设备还可以包括与语音处理系统连接的拍照控制器和运动控制器,即上述的控制单元,与拍照控制器连接的摄像头,以及与运动控制器连接的运动底盘,即上述的拍摄设备的底盘。拍摄设备的控制单元可以根据关键词中的图像采集对象信息,控制拍摄设备的摄像头或者底盘转动,对准图像采集对象,并通过图像采集单元对图像采集对象进行图像采集。例如,在从关键词中得到图像采集对象信息,即“我”,“雕像”之后,可以确定图像采集对象为用户和雕像,进一步控制摄像头对准用户和雕像进行拍照或者录像,完成图像采集。
采用本发明上述实施例,可以在获得音频采集单元采集得到的第一音频数据之后,根据第一音频数据进行语音分析,获得语音分析结果,并基于语音分析结果,在确定第一音频数据用于指示进行图像采集时,获得图像采集对象信息,以及根据图像采集对象信息,控制图像采集单元转动第一角度、或控制拍摄设备的底盘转动第一角度,以对确定的图像采集对象进行图像采集,从而实现拍摄设备根据用户发出的语音,自动进行图像采集,整个图像过程中无需人工进行操作,解决了现有技中的拍摄设备需要手动操作,操作复杂且拍摄效果差的技术问题。因此,通过本发明上述实施例,可以实现自动拍摄,降低操作复杂度,优化拍摄效果,提升用户体验感和好感度的效果。
可选的,根据本发明上述实施例,在图像采集对象为目标对象的情况下,音频处理单元25还用于基于语音分析结果,获得目标对象的方位信息。
在一种可选的方案中,在得到图像采集对象信息之后,如果得到的图像采集对象信息为用户,则可以通过语音处理系统,采用麦克阵列对用户发出的语音进行声源定位处理,确定用户所在方位。例如,用户可以发出语音“给我拍一个自拍照”,在拍摄设备在采集到语音命令,对语音命令进行语音分析,得到语音命令中包含的关键词“我”、“拍”和“自拍照”,确定用户需要进行图像采集,进一步获得图像采集对象信息“我”,即图像采集对象为用户,可以通过麦克阵列进行声源定位,确定用户的方位为正北方。
控制单元27还用于基于目标对象的方位信息,控制图像采集单元转动第一子角度、或控制拍摄设备的底盘转动第一子角度。
图像采集单元21还用于采集得到第一图像数据。
具体的,上述第一子角度可以是根据拍摄设备的对准方位与用户所在方位进行计算,得到的两个方位的夹角。
在一种可选的方案中,在得到用户所在方位之后,拍摄设备的控制单元可以计算用户所在方位与拍摄设备当前对准方位进行控制摄像头或底盘转动的夹角,得到第一子角度,并控制摄像头或者底盘转动第一子角度,将摄像头对准用户所在方位,进行图像采集,得到第一图像数据。例如,在确定用户的方位为正北方,并且拍摄设备的对准方位为正西方之后,可以计算得到第一子角度为90°,拍摄设备控制摄像头或者底盘转动逆时针转动90°,将摄像头对准正北方,并通过摄像头采集图像。
上述拍摄设备还包括:图像处理单元,与图像采集单元21连接,用于根据第一图像数据进行图像识别,获得目标对象在第一图像数据中所处的位置信息。
在一种可选的方案中,如图3所示,拍摄设备还可以包括和摄像头连接的视觉算法系统,即上述的图像处理单元,视觉算法系统可以对采集到的图像进行人脸识别。拍摄设备可以通过摄像头采集拍摄范围内的图像数据,通过视觉算法系统对采集到的图像数据进行人脸识别,识别图像数据中用户所在的具体位置。例如,在通过摄像头采集到图像之后,视觉算法系统可以进行人脸识别,确定图像中用户所处的具体位置,如用户在图像中所处的具体位置为右上角。
在另一种可选的方案中,如图3所示,拍照设备还可以包括其他传感器。为了保证得到用户的位置准确,在通过摄像头采集图像的同时,可以通过红外传感器、雷达传感器等其他传感器进行辅助,感应用户与拍摄设备之间的距离,使得拍摄设备的参数信息更加准确,提升拍摄设备的准确性。
此处需要说明是,如图3所示,视觉算法系统还可以对采集到的图像进行手势识别。由于用户所在方位可能有很多其他人,如果仅仅通过人脸识别对图像进行识别,误差较高,导致拍摄设备的准确性下降,此时还可以通过对图像进行手势识别,只有特定手势的用户可以确定为目标对象,特定手势可以是容易识别,且实用度不高的手势,例如,特定手势可以是手臂举过头顶,食指、中指、无名指和小指握拳,大拇指向上伸出。
控制单元27,与图像处理单元连接,还用于基于目标对象在第一图像数据中所处的位置信息,控制图像采集单元转动第二子角度、或控制拍摄设备的底盘转动第二子角度;其中,第一子角度与第二子角度相加获得第一角度。
在一种可选的方案中,如图3所示,拍照控制器和运动控制器可以与视觉算法系统连接。在识别出图像数据中用户的具体位置之后,可以控制摄像头或者底盘进行小幅度转动,调整图像数据中用户的具体位置,提升图像采集效果。例如,在确定图像中用户的具体位置为右上角之后,可以控制摄像头向上小幅转动,控制底盘向右小幅转动,从而使图像中的用户位于图像的正中间。
可选的,根据本发明上述实施例,在图像采集对象为拍摄对象的情况下,
控制单元27还用于控制图像采集单元或拍摄设备的底盘按照预设方向转动。
具体的,上述预设方向可以是提前设定的方向,例如,顺时针方向。
图像采集单元21还用于采集得到第二图像数据。
在一种可选的方案中,在得到图像采集对象信息之后,如果得到的图像采集对象信息为拍摄对象,则拍摄设备控制摄像头或者底盘顺时针转动,并在摄像头或者底盘转动的过程中,通过摄像头采集图像数据。例如,用户可以发出语音“给这个雕像拍照”,在拍摄设备在采集到语音命令,对语音命令进行语音分析,得到语音命令中包含的关键词“雕像”和“拍照”,确定用户需要进行图像采集,进一步获得图像采集对象信息“雕像”,即图像采集对象为雕像,可以控制摄像头或者底盘顺时针转动,并实时采集图像。
上述拍摄设备还包括:图像处理单元,与图像采集单元21连接,用于根据第二图像数据进行图像识别,判断第二图像数据中是否存在拍摄对象。
在一种可选的方案中,如图3所示,拍摄设备还可以包括和摄像头连接的视觉算法系统,即上述的图像处理单元,视觉算法系统可以对采集到的图像进行物体识别,骨骼识别。拍摄设备可以通过摄像头实时采集拍摄范围内的图像数据,通过视觉算法系统对采集到的图像数据进行图像处理,例如,当拍摄对象是物体时,可以对图像数据进行物体识别;当拍摄对象是人体任意一部分,例如手、脚时,可以对图像数据进行骨骼识别。如果在图像数据中识别出拍摄对象,则说明拍摄范围内存在拍摄对象,如果图像数据中无法识别出拍摄对象,则说明拍摄范围内不存在拍摄对象。例如,在摄像头或者底盘顺时针转动的过程中之后,可以通过摄像头采集拍摄范围内的图像,并对图像进行物体识别,识别该图像中是否存在“雕像”,如果在该图像中识别出“雕像”,则说明拍摄范围内存在“雕像”;如果未在该图像中识别出“雕像”,则说明拍摄范围内不存在“雕像”。
控制单元27,与图像处理单元连接,用于在识别第二图像数据中存在拍摄对象时,基于拍摄对象在第二图像数据中所处的位置信息,控制图像采集单元或拍摄设备的底盘进行转动调整;从图像采集单元或拍摄设备的底盘按照预设方向转动开始,到转动调整结束,图像采集单元或拍摄设备的底盘转动的角度即为第一角度。
在一种可选的方案中,如图3所示,拍照控制器和运动控制器可以与视觉算法系统连接。如果在图像数据中识别出拍摄对象,则控制摄像头或者底盘停止转动,进一步确定拍摄对象在图像数据中的具体位置,控制摄像头或者底盘进行小幅度转动,调整拍摄对象在图像数据中的具体位置,提升图像采集效果。例如,在图像中识别出“雕像”之后,控制摄像头或者底盘停止转动,确定“雕像”在图像中的位置为左下角,进一步控制摄像头可以控制摄像头向下小幅转动,控制底盘向左小幅转动,从而使雕像位于图像的正中间。
可选的,根据本发明上述实施例,在图像采集对象包括目标对象和拍摄对象的情况下,
音频处理单元25还用于基于语音分析结果,获得目标对象的方位信息。
在一种可选的方案中,在得到图像采集对象信息之后,如果得到的图像采集对象信息为用户和拍摄对象,则首先可以通过语音处理系统,采用麦克阵列对用户发出的语音进行声源定位处理,确定用户所在方位。例如,用户可以发出语音“给我和这个雕像拍一个全身的合影”,在拍摄设备在采集到语音命令,对语音命令进行语音分析,得到语音命令中包含的关键词“我”、“雕像”、“拍”、“全身”和“合影”之后,确定用户需要进行图像采集,进一步获得图像采集对象信息“我”和“雕像”,即图像采集对象为用户和拍摄对象,可以通过麦克阵列进行声源定位,确定用户的方位为正北方。
控制单元27还用于基于目标对象的方位信息,控制图像采集单元转动第三子角度、或控制拍摄设备的底盘转动第三子角度。
图像采集单元21还用于采集得到第三图像数据。
在一种可选的方案中,在确定用户所在方位之后,可以拍摄设备的控制单元可以计算用户所在方位与拍摄设备当前对准方位进行控制摄像头或底盘转动的夹角,得到第三子角度,并控制摄像头或者底盘转动第三子角度,将摄像头对准用户所在方位,通过摄像头进行图像采集,得到第三图像数据。例如,在确定用户的方位为正北方,并且拍摄设备的对准方位为正西方之后,可以计算得到第一子角度为90度,拍摄设备控制摄像头或者底盘转动逆时针转动90度,将摄像头对准正北方,并通过摄像头采集图像。
上述拍摄设备还包括:图像处理单元,与图像采集单元21连接,用于根据第三图像数据进行图像识别,获得目标对象在第三图像数据中所处的位置信息,并判断第三图像数据中是否存在拍摄对象,在第三图像数据中存在拍摄对象的情况下,获取拍摄对象在第三图像数据中所处的位置信息。
此处需要说明的是,由于用户发出语音时,可能离拍摄对象较远,例如,用户在拍摄对象对面,而拍摄设备处于用户和拍摄对象之间,在将拍摄设备转向用户所在方位之后,如果直接进行拍摄,将无法拍摄到拍摄对象。因此,为了避免上述情况的发生,在拍摄设备进行拍摄之前,首先需要判断拍摄范围内是否存在拍摄对象。
在一种可选的方案中,如图3所示,拍摄设备还可以包括和摄像头连接的视觉算法系统,即上述的图像处理单元。拍摄设备可以通过摄像头采集拍摄范围内的图像数据,通过视觉算法系统对采集到的图像数据进行图像处理,确定用户在图像数据中的具体位置,并在图像数据中识别拍摄对象,如果在图像数据中识别出拍摄对象,则说明拍摄范围内存在拍摄对象,如果图像数据中无法识别出拍摄对象,则说明拍摄范围内不存在拍摄对象。如果在图像数据中识别出拍摄对象,则确定拍摄对象在图像数据中的具体位置。例如,在摄像头或者底盘转动逆时针转动90度之后,可以通过摄像头采集拍摄范围内的图像,并对图像进行人脸识别和物体识别,得到用户在图像中的具体位置为左下角,以及识别该图像中是否存在“雕像”,如果在该图像中识别出“雕像”,则说明拍摄范围内存在“雕像”;如果未在该图像中识别出“雕像”,则说明拍摄范围内不存在“雕像”。在图像中识别出“雕像”之后,对图像进行物体识别,确定“雕像”在图像中的位置为右下角。
在另一种可选的方案中,如图3所示,拍照设备还可以包括其他传感器。为了保证得到用户的位置准确,在通过摄像头采集图像的同时,可以通过红外传感器、雷达传感器等其他传感器进行辅助,感应用户与拍摄设备之间的距离,使得拍摄设备的参数信息更加准确,提升拍摄设备的准确性。
此处需要说明是,如图3所示,视觉算法系统还可以对采集到的图像进行手势识别。由于用户所在方位可能有很多其他人,如果仅仅通过人脸识别对图像进行识别,误差较高,导致拍摄设备的准确性下降,此时还可以通过对图像进行手势识别,只有特定手势的用户可以确定为目标对象,特定手势可以是容易识别,且实用度不高的手势,例如,特定手势可以是手臂举过头顶,食指、中指、无名指和小指握拳,大拇指向上伸出。
控制单元27,与图像处理单元连接,用于基于目标对象在第三图像数据中所处的位置信息和拍摄对象在第三图像数据中所处的位置信息,控制图像采集单元转动第四子角度、或控制拍摄设备的底盘转动第四子角度;其中,第三子角度与第四子角度相加获得第一角度。
在一种可选的方案中,如图3所示,拍照控制器和运动控制器可以与视觉算法系统连接。在识别出图像数据中用户的具体位置和拍摄对象的具体位置之后,可以控制摄像头或者底盘进行小幅度转动,调整图像数据中用户的具体位置以及拍摄对象的具体位置,提升图像采集效果。例如,在确定图像中用户的具体位置为左下角,确定“雕像”在图像中的位置为右下角之后,可以控制摄像头向下小幅转动,从而使图像中的用户以及雕像位于图像的正中间。
可选的,根据本发明上述实施例,在第三图像数据中不包含拍摄对象的情况下,控制单元27还用于控制图像采集单元或拍摄设备的底盘按照预设方向转动。
图像采集单元还用于采集得到的第四图像数据。
具体的,上述预设方向可以是提前设定的方向,例如,顺时针方向。
在一种可选的方案中,如果确定拍摄范围内不存在拍摄对象,则控制摄像头或者底盘顺时针360°旋转,在旋转过程中通过摄像头采集图像数据,得到第四图像数据。例如,拍摄设备在将摄像头或者底盘转向正前方之后,如果拍摄范围内不存在“雕像”,则控制摄像头或者拍摄设备的底盘顺时针旋转,并在旋转过程中通过摄像头采集图像。
图像处理单元还用于在第四图像数据中存在拍摄对象的情况下,获取拍摄对象与目标对象之间的相对位置信息。
在一种可选的方案中,如果识别出第四图像数据中存在拍摄对象,则控制摄像头或者底盘停止转动,并进一步确定拍摄对象在第四图像数据中的具体位置,根据拍摄对象在第四图像数据中的具体位置,以及用户在第三图像数据中的具体位置,得到相对位置信息。例如,在得到用户在图像中的具体位置为左下角之后,可以控制摄像头或者底盘顺时针旋转,当拍摄范围内存在“雕像”时,控制摄像头或者底盘停止旋转,通过视觉算法系统确定“雕像”在图像中的具体位置,根据用户在图像中的具体位置和“雕像”在图像中的具体位置,得到用户与雕像之间的相对位置,即用户在雕像的对面。
拍摄设备还包括:提示处理器,用于基于相对位置信息,生成提示信息,其中,提示信息用于提示目标对象移动至拍摄对象的位置。
喇叭,与提示处理器连接,用于输出提示信息。
在一种可选的方案中,如图3所示,拍摄设备还可以包括语音反馈装置,即上述的提示处理器,以及与语音反馈装置连接的喇叭。可以根据用户和拍摄对象之间的相对位置信息,生成语音提示信息,并通过喇叭输出给用户,提示用户移动到拍摄对象所在位置。当用户移动到拍摄对象所在位置时,即拍摄范围内采集到的图像中可以识别出拍摄对象和用户,则控制摄像头对用户和拍摄对象进行拍摄。例如,在得到用户与雕像之间的相对位置之后,可以通过语音提示用户“请移动到对面的雕像旁边”,然后通过摄像头对用户和“雕像”进行拍照。
可选的,根据本发明上述实施例,控制单元27包括:
子控制单元,用于控制拍摄设备的用于搭载图像采集单元的云台转动第一角度。
在一种可选的方案中,如图3所示,拍摄设备还可以包括搭载摄像头的云台。在获得到第一角度之后,可以通过运动控制器对搭载摄像头的云台进行控制,使云台转动第一角度。
可选的,根据本发明上述实施例,音频处理单元25还用于基于语音分析结果,获得拍摄需求信息。
具体的,上述拍摄需求信息可以是用户想要的拍摄角度、拍摄尺寸。
拍摄设备还包括:控制处理单元,与音频处理单元25连接,用于根据拍摄需求信息,计算得到图像采集单元的拍摄参数。
具体的,上述拍摄参数可以是焦距,光圈,快门和白平衡等。
在一种可选的方案中,如图3所示,拍摄设备还可以包括与语音处理系统连接的智能拍照算法单元,即上述的控制处理单元。在对用户发出的语音命令进行语音识别和语义分析,得到语音命令中包含的关键词之后,可以根据关键词,确定用户的拍摄需求,并根据拍摄需求计算得到摄像头的参数。例如,在采集到用户发出的语音命令“给我和这个雕像拍一个全身的合影”之后,对语音命令进行语义分析,得到关键词“我”、“雕像”、“拍”、“全身”和“合影”,可以确定用户的拍摄需求是全身合影,并根据全身合影得到摄像头的参数。
控制单元27,与控制处理单元连接,还用于控制图像采集单元按照拍摄参数对确定的图像采集对象进行图像采集。
在一种可选的方案中,如图3所示,拍照控制器和运动控制器还可以智能拍照算法单元连接。在计算到摄像头的参数之后,可以通过拍照控制器对摄像头进行控制,调节摄像头的各项参数,使得摄像头的各项参数满足对应的参数,并进一步对图像采集对象进行图像采集。
可选的,根据本发明上述实施例,控制单元27还用于根据图像采集对象信息,控制拍摄设备的底盘进行移动调整。
在一种可选的方案中,例如,当确定需要拍摄用户自己时,拍摄设备可以通过摄像头采集拍摄范围内的图像数据,并进行人脸识别,确定图像数据中用户的比例,并基于图像数据中用户的比例,控制底盘进行小距离移动,调整拍摄对象在图像数据中的比例。例如,在图像中识别到用户之后,确定用户在图像中的比例为10%,用户在整个图像中比例较低,即用户在图像中较小,可以控制底盘向前移动,从而使用户在图像中的比例升高,满足拍摄要求。
在另一种可选的方案中,例如,当确定需要拍摄用户和拍摄对象时,拍摄设备可以通过摄像头采集拍摄范围内的图像数据,并进行人脸识别和物体识别,确定图像数据中用户与拍摄对象的位置关系,并根据用户与拍摄对象的位置关系,控制底盘进行小距离移动,调整用户与拍摄对象在图像数据中的位置关系。例如,在图像中识别到用户和“雕像”之后,可以根据用户在图像中的位置和“雕像”在图像中的位置,确定用户与“雕像”的位置关系为重叠,即在图像中用户遮挡了“雕像”,或者“雕像”遮挡了用户,可以控制底盘向左或者向右移动,从而使用户和“雕像”在图像中分离,满足拍摄要求。
此处需要说明的是,拍摄设备还可以通过摄像头采集图像数据,并对图像数据进行手势识别和骨骼识别,得到用户的姿势,如果用户当前姿势或者当前位置不够理想,例如,用户离拍摄设备较近,用户低头,则可以通过语音给用户提示“请往后退一步,并将头抬起一些,好的,1,2,3,茄子!”。可以通过语音提示调整用户的姿势和位置,从而可以进行最佳拍摄,得到最优拍摄效果。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (14)

1.一种拍摄设备的控制方法,应用于拍摄设备,其特征在于,所述拍摄设备具有音频采集单元和图像采集单元,所述方法包括:
获得所述音频采集单元采集得到的第一音频数据,所述第一音频数据是所述音频采集单元通过采集目标对象发出的语音所获得音频数据;
根据所述第一音频数据进行语音分析,获得语音分析结果;
基于所述语音分析结果,在确定所述第一音频数据用于指示进行图像采集时,确定图像采集对象,所述图像采集对象也是基于所述语音分析结果获得的;
基于确定的所述图像采集对象,控制所述图像采集单元转动第一角度、或控制所述拍摄设备的底盘转动第一角度,以对所述图像采集对象进行图像采集;
其中,在控制所述图像采集单元转动第一角度、或控制所述拍摄设备的底盘转动第一角度之后,所述方法还包括:基于确定的所述图像采集对象,控制所述拍摄设备的底盘进行移动调整;所述基于确定的所述图像采集对象,控制所述拍摄设备的底盘进行移动调整包括:基于图像数据中拍摄对象的比例,控制底盘移动,调整拍摄对象在图像数据中的比例。
2.根据权利要求1所述的方法,其特征在于,所述图像采集对象包括:所述目标对象,和/或,拍摄对象,其中,所述拍摄对象是基于所述语音分析结果确定的除所述目标对象之外的图像采集对象。
3.根据权利要求2所述的方法,其特征在于,在所述图像采集对象为所述目标对象的情况下,控制所述图像采集单元转动第一角度、或控制所述拍摄设备的底盘转动第一角度,包括:
基于所述语音分析结果,获得所述目标对象的方位信息;
基于所述目标对象的方位信息,控制所述图像采集单元转动第一子角度、或控制所述拍摄设备的底盘转动第一子角度,在转动所述第一子角度后,获得所述图像采集单元采集得到的第一图像数据;
根据所述第一图像数据进行图像识别,获得所述目标对象在所述第一图像数据中所处的位置信息;
基于所述目标对象在所述第一图像数据中所处的位置信息,控制所述图像采集单元转动第二子角度、或控制所述拍摄设备的底盘转动第二子角度;其中,所述第一子角度与第二子角度相加获得所述第一角度。
4.根据权利要求2所述的方法,其特征在于,在所述图像采集对象为所述拍摄对象的情况下,控制所述图像采集单元转动第一角度、或控制所述拍摄设备的底盘转动第一角度,包括:
控制所述图像采集单元或所述拍摄设备的底盘按照预设方向转动,并获得所述图像采集单元采集得到的第二图像数据;
根据所述第二图像数据进行图像识别,判断所述第二图像数据中是否存在所述拍摄对象;
在识别所述第二图像数据中存在所述拍摄对象时,基于所述拍摄对象在所述第二图像数据中所处的位置信息,控制所述图像采集单元或所述拍摄设备的底盘进行转动调整;
从所述图像采集单元或所述拍摄设备的底盘按照预设方向转动开始,到所述转动调整结束,所述图像采集单元或所述拍摄设备的底盘转动的角度即为所述第一角度。
5.根据权利要求2所述的方法,其特征在于,在所述图像采集对象包括所述目标对象和所述拍摄对象的情况下,控制所述图像采集单元转动第一角度、或控制所述拍摄设备的底盘转动第一角度,包括:
基于所述语音分析结果,获得所述目标对象的方位信息;
基于所述目标对象的方位信息,控制所述图像采集单元转动第三子角度、或控制所述拍摄设备的底盘转动第三子角度,在转动所述第三子角度后,获得所述图像采集单元采集得到的第三图像数据;
根据所述第三图像数据进行图像识别,获得所述目标对象在所述第三图像数据中所处的位置信息,并判断所述第三图像数据中是否存在所述拍摄对象;
在所述第三图像数据中存在所述拍摄对象的情况下,获取所述拍摄对象在所述第三图像数据中所处的位置信息;
基于所述目标对象在所述第三图像数据中所处的位置信息和所述拍摄对象在所述第三图像数据中所处的位置信息,控制所述图像采集单元转动第四子角度、或控制所述拍摄设备的底盘转动第四子角度;其中,所述第三子角度与第四子角度相加获得所述第一角度。
6.根据权利要求5所述的方法,其特征在于,在所述第三图像数据中不包含所述拍摄对象的情况下,所述方法还包括:
控制所述图像采集单元或所述拍摄设备的底盘按照预设方向转动,并获得转动过程中所述图像采集单元采集得到的第四图像数据;
在所述第四图像数据中存在所述拍摄对象的情况下,获取所述拍摄对象与所述目标对象之间的相对位置信息;
基于所述相对位置信息,生成提示信息,其中,所述提示信息用于提示所述目标对象移动至所述拍摄对象的位置;
输出所述提示信息。
7.根据权利要求1至6任一项所述的方法,其特征在于,在控制所述图像采集单元转动第一角度、或控制所述拍摄设备的底盘转动第一角度之后,所述方法还包括:
基于所述语音分析结果,获得拍摄需求信息;
根据所述拍摄需求信息,计算得到所述图像采集单元的拍摄参数;
控制所述图像采集单元按照所述拍摄参数对确定的所述图像采集对象进行图像采集。
8.一种拍摄设备,其特征在于,包括:
图像采集单元,用于采集图像数据;
音频采集单元,用于通过采集目标对象发出的语音,得到第一音频数据;
音频处理单元,与所述音频采集单元连接,用于根据所述第一音频数据进行语音分析,获得语音分析结果,并基于所述语音分析结果,在确定所述第一音频数据用于指示进行图像采集时,确定图像采集对象,所述图像采集对象也是基于所述语音分析结果获得的;
控制单元,分别与所述图像采集单元和所述音频处理单元连接,用于基于确定的所述图像采集对象,控制所述图像采集单元转动第一角度、或控制所述拍摄设备的底盘转动第一角度,以使所述图像采集单元对所述图像采集对象进行图像采集;
其中,所述控制单元还用于基于确定的所述图像采集对象,控制所述拍摄设备的底盘进行移动调整;所述基于确定的所述图像采集对象,控制所述拍摄设备的底盘进行移动调整包括:基于图像数据中拍摄对象的比例,控制底盘移动,调整拍摄对象在图像数据中的比例。
9.根据权利要求8所述的拍摄设备,其特征在于,所述图像采集对象包括:所述目标对象,和/或,拍摄对象,其中,所述拍摄对象是基于所述语音分析结果确定的除所述目标对象之外的图像采集对象。
10.根据权利要求9所述的拍摄设备,其特征在于,在所述图像采集对象为所述目标对象的情况下,
所述音频处理单元还用于基于所述语音分析结果,获得所述目标对象的方位信息;
所述控制单元还用于基于所述目标对象的方位信息,控制所述图像采集单元转动第一子角度、或控制所述拍摄设备的底盘转动第一子角度;
所述图像采集单元还用于采集得到第一图像数据;
所述拍摄设备还包括:图像处理单元,与所述图像采集单元连接,用于根据所述第一图像数据进行图像识别,获得所述目标对象在所述第一图像数据中所处的位置信息;
所述控制单元,与所述图像处理单元连接,还用于基于所述目标对象在所述第一图像数据中所处的位置信息,控制所述图像采集单元转动第二子角度、或控制所述拍摄设备的底盘转动第二子角度;其中,所述第一子角度与第二子角度相加获得所述第一角度。
11.根据权利要求9所述的拍摄设备,其特征在于,在所述图像采集对象为所述拍摄对象的情况下,
所述控制单元还用于控制所述图像采集单元或所述拍摄设备的底盘按照预设方向转动;
所述图像采集单元还用于采集得到第二图像数据;
所述拍摄设备还包括:图像处理单元,与所述图像采集单元连接,用于根据所述第二图像数据进行图像识别,判断所述第二图像数据中是否存在所述拍摄对象;
所述控制单元,与所述图像处理单元连接,用于在识别所述第二图像数据中存在所述拍摄对象时,基于所述拍摄对象在所述第二图像数据中所处的位置信息,控制所述图像采集单元或所述拍摄设备的底盘进行转动调整,从所述图像采集单元或所述拍摄设备的底盘按照预设方向转动开始,到所述转动调整结束,所述图像采集单元或所述拍摄设备的底盘转动的角度即为所述第一角度。
12.根据权利要求9所述的拍摄设备,其特征在于,在所述图像采集对象为所述目标对象和所述拍摄对象的情况下,
所述音频处理单元还用于基于所述语音分析结果,获得所述目标对象的方位信息;
所述控制单元还用于基于所述目标对象的方位信息,控制所述图像采集单元转动第三子角度、或控制所述拍摄设备的底盘转动第三子角度;
所述图像采集单元还用于采集得到第三图像数据;
所述拍摄设备还包括:图像处理单元,与所述图像采集单元连接,用于根据所述第三图像数据进行图像识别,获得所述目标对象在所述第三图像数据中所处的位置信息,并判断所述第三图像数据中是否存在所述拍摄对象,在所述第三图像数据中存在所述拍摄对象的情况下,获取所述拍摄对象在所述第三图像数据中所处的位置信息;
所述控制单元,与所述图像处理单元连接,用于基于所述目标对象在所述第三图像数据中所处的位置信息和所述拍摄对象在所述第三图像数据中所处的位置信息,控制所述图像采集单元转动第四子角度、或控制所述拍摄设备的底盘转动第四子角度;其中,所述第三子角度与第四子角度相加获得所述第一角度。
13.根据权利要求12所述的拍摄设备,其特征在于,在所述第三图像数据中不包含所述拍摄对象的情况下,
所述控制单元还用于控制所述图像采集单元或所述拍摄设备的底盘按照预设方向转动;
所述图像采集单元还用于采集得到第四图像数据;
所述图像处理单元还用于在所述第四图像数据中存在所述拍摄对象的情况下,获取所述拍摄对象与所述目标对象之间的相对位置信息;
所述拍摄设备还包括:提示处理器,用于基于所述相对位置信息,生成提示信息,其中,所述提示信息用于提示所述目标对象移动至所述拍摄对象的位置;
喇叭,与所述提示处理器连接,用于输出所述提示处理器。
14.根据权利要求8至13任一项所述的拍摄设备,其特征在于,
所述音频处理单元还用于基于所述语音分析结果,获得拍摄需求信息;
所述拍摄设备还包括:控制处理单元,与所述音频处理单元连接,用于根据所述拍摄需求信息,计算得到所述图像采集单元的拍摄参数;
所述控制单元,与所述控制处理单元连接,还用于控制所述图像采集单元按照所述拍摄参数对确定的所述图像采集对象进行图像采集。
CN201610571187.XA 2016-07-19 2016-07-19 一种拍摄设备的控制方法及拍摄设备 Active CN106131413B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610571187.XA CN106131413B (zh) 2016-07-19 2016-07-19 一种拍摄设备的控制方法及拍摄设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610571187.XA CN106131413B (zh) 2016-07-19 2016-07-19 一种拍摄设备的控制方法及拍摄设备

Publications (2)

Publication Number Publication Date
CN106131413A CN106131413A (zh) 2016-11-16
CN106131413B true CN106131413B (zh) 2020-04-14

Family

ID=57289918

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610571187.XA Active CN106131413B (zh) 2016-07-19 2016-07-19 一种拍摄设备的控制方法及拍摄设备

Country Status (1)

Country Link
CN (1) CN106131413B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108089694A (zh) * 2016-11-22 2018-05-29 纳恩博(北京)科技有限公司 一种智能控制方法及设备
CN109981964B (zh) * 2017-12-27 2021-07-27 深圳市优必选科技有限公司 基于机器人的拍摄方法、拍摄装置及机器人
CN109981967B (zh) * 2017-12-27 2021-06-29 深圳市优必选科技有限公司 用于智能机器人的拍摄方法、装置、终端设备及介质
CN110401793A (zh) * 2018-04-25 2019-11-01 北京京东尚科信息技术有限公司 用于控制智能终端的方法和装置
CN109218587A (zh) * 2018-10-29 2019-01-15 咪付(广西)网络技术有限公司 一种基于双目摄像头的图像采集方法及系统
CN110413113A (zh) * 2019-07-18 2019-11-05 华勤通讯技术有限公司 一种车载机器人及交互方法
CN110855892B (zh) * 2019-11-27 2021-03-02 华人运通(江苏)技术有限公司 拍照方法、拍照系统及计算机可读存储介质
CN113596367A (zh) * 2020-04-30 2021-11-02 华中科技大学 一种面向实验教学的智能课程录播系统
CN111757007B (zh) * 2020-07-09 2022-02-08 深圳市欢太科技有限公司 图像拍摄方法、装置、终端及存储介质
CN112147596A (zh) * 2020-09-18 2020-12-29 北京小米移动软件有限公司 测量仪、测量仪控制方法、测量仪控制装置及存储介质
CN113228620B (zh) * 2021-03-30 2022-07-22 华为技术有限公司 一种图像的获取方法以及相关设备
CN113592810B (zh) * 2021-07-29 2022-04-19 东莞市亚太未来软件有限公司 一种基于图像数据处理的学生学习数据筛选方法、设备
CN113542611A (zh) * 2021-07-30 2021-10-22 西安中诺通讯有限公司 一种基于语音控制启动拍照的方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103685905A (zh) * 2012-09-17 2014-03-26 联想(北京)有限公司 一种拍照方法及电子设备
CN104935819A (zh) * 2015-06-11 2015-09-23 广东欧珀移动通信有限公司 一种控制摄像头拍摄方法及终端
CN105704389A (zh) * 2016-04-12 2016-06-22 上海斐讯数据通信技术有限公司 一种智能拍照方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7697827B2 (en) * 2005-10-17 2010-04-13 Konicek Jeffrey C User-friendlier interfaces for a camera
JP2011035771A (ja) * 2009-08-04 2011-02-17 Olympus Corp 撮像装置、編集装置および撮像システム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103685905A (zh) * 2012-09-17 2014-03-26 联想(北京)有限公司 一种拍照方法及电子设备
CN104935819A (zh) * 2015-06-11 2015-09-23 广东欧珀移动通信有限公司 一种控制摄像头拍摄方法及终端
CN105704389A (zh) * 2016-04-12 2016-06-22 上海斐讯数据通信技术有限公司 一种智能拍照方法及装置

Also Published As

Publication number Publication date
CN106131413A (zh) 2016-11-16

Similar Documents

Publication Publication Date Title
CN106131413B (zh) 一种拍摄设备的控制方法及拍摄设备
US11729487B2 (en) Image pickup apparatus and control method therefor
KR100729280B1 (ko) 스테레오 카메라를 장착한 이동단말기를 이용한 홍채인식시스템 및 그 방법
EP2993894B1 (en) Image capturing method and electronic apparatus
US11210796B2 (en) Imaging method and imaging control apparatus
CN104243800B (zh) 控制装置和存储介质
WO2019128109A1 (zh) 一种基于人脸追踪的动向投影方法、装置及电子设备
US11812132B2 (en) Imaging device, control method therefor, and recording medium
KR102407190B1 (ko) 영상 촬영 장치 및 그 동작 방법
US10063773B2 (en) Photographing apparatus, photographing method and computer-readable storage medium storing photographing program of photographing apparatus
WO2019104681A1 (zh) 拍摄方法和装置
US20160292886A1 (en) Apparatus and method for photographing people using a movable remote device
CN108063909B (zh) 视频会议系统、图像跟踪采集方法及装置
TW201330609A (zh) 智慧追蹤裝置
CN105282420A (zh) 拍摄的实现方法及装置
CN114466139A (zh) 追踪定位方法、系统、装置、设备、存储介质和产品
US10649460B2 (en) Interactive robots positionable for optimal interactions
CN102650801A (zh) 摄像装置及其自动对焦方法
TWI485505B (zh) 數位相機及數位相機之影像擷取方法
TW201916669A (zh) 一種注視識別及互動方法與裝置
TWI737588B (zh) 拍照系統及方法
JP6845121B2 (ja) ロボットおよびロボット制御方法
JP2012157016A (ja) 撮像装置、顔認識方法及びそのプログラム
WO2021140879A1 (ja) 撮像装置、撮像装置の制御方法、プログラム
JPWO2020129620A1 (ja) 撮像制御装置、撮像装置、撮像制御方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant