CN106131413B

CN106131413B - 一种拍摄设备的控制方法及拍摄设备

Info

Publication number: CN106131413B
Application number: CN201610571187.XA
Authority: CN
Inventors: 陆见微
Original assignee: Ninebot Beijing Technology Co Ltd
Current assignee: Ninebot Beijing Technology Co Ltd
Priority date: 2016-07-19
Filing date: 2016-07-19
Publication date: 2020-04-14
Anticipated expiration: 2036-07-19
Also published as: CN106131413A

Abstract

本发明公开了一种拍摄设备的控制方法及拍摄设备。其中，该控制方法应用于拍摄设备，拍摄设备具有音频采集单元和图像采集单元，包括：获得音频采集单元采集得到的第一音频数据；根据第一音频数据进行语音分析，获得语音分析结果；基于语音分析结果，在确定第一音频数据用于指示进行图像采集时，获得图像采集对象信息；根据图像采集对象信息，控制图像采集单元转动第一角度、或控制拍摄设备的底盘转动第一角度，以对确定的图像采集对象进行图像采集。本发明解决了现有技中的拍摄设备需要手动操作，操作复杂且拍摄效果差的技术问题。

Description

一种拍摄设备的控制方法及拍摄设备

技术领域

本发明涉及拍摄设备控制领域，具体而言，涉及一种拍摄设备的控制方法及拍摄设备。

背景技术

随着互联网的不断发展，越来越多的用户习惯拍摄照片上传到网上，分享给自己的亲戚朋友观看。但是现有的拍摄设备，例如照相机、摄像机、具有拍摄功能的手机等，需要手动调节拍摄选项，操作过程复杂繁琐，而拍摄设备自带的自动拍摄选项又不够智能。并且，在用户需要自拍，或者和他人进行合拍时，如果没有他人帮助，通常会使用自拍杆进行拍摄，或者使用三脚架，并通过定时拍摄功能实现，整个拍摄过程操作复杂，而且受到自拍杆或者三脚架的限制，拍摄效果往往不够理想。

针对现有技中的拍摄设备需要手动操作，操作复杂且拍摄效果差的问题，目前尚未提出有效的解决方案。

发明内容

本发明实施例提供了一种拍摄设备的控制方法及拍摄设备，以至少解决现有技中的拍摄设备需要手动操作，操作复杂且拍摄效果差的技术问题。

根据本发明实施例的一个方面，提供了一种拍摄设备的控制方法，包括：获得音频采集单元采集得到的第一音频数据，第一音频数据是音频采集单元通过采集目标对象发出的语音所获得音频数据；根据第一音频数据进行语音分析，获得语音分析结果；基于语音分析结果，在确定第一音频数据用于指示进行图像采集时，获得图像采集对象信息，图像采集对象信息也是基于语音分析结果获得的；根据图像采集对象信息，控制图像采集单元转动第一角度、或控制拍摄设备的底盘转动第一角度，以对确定的图像采集对象进行图像采集。

根据本发明实施例的另一方面，还提供了一种拍摄设备，包括：图像采集单元，用于采集图像数据；音频采集单元，用于通过采集目标对象发出的语音，得到第一音频数据；音频处理单元，与音频采集单元连接，用于根据第一音频数据进行语音分析，获得语音分析结果，并基于语音分析结果，在确定第一音频数据用于指示进行图像采集时，获得图像采集对象信息，图像采集对象信息也是基于语音分析结果获得的；控制单元，分别与图像采集单元和音频处理单元连接，用于根据图像采集对象信息，控制图像采集单元转动第一角度、或控制拍摄设备的底盘转动第一角度，以使所述图像采集单元对确定的图像采集对象进行图像采集。

在本发明实施例中，可以在获得音频采集单元采集得到的第一音频数据之后，根据第一音频数据进行语音分析，获得语音分析结果，并基于语音分析结果，在确定第一音频数据用于指示进行图像采集时，获得图像采集对象信息，以及根据图像采集对象信息，控制图像采集单元转动第一角度、或控制拍摄设备的底盘转动第一角度，以对确定的图像采集对象进行图像采集，从而实现拍摄设备根据用户发出的语音，自动进行拍摄，整个拍摄过程中无需人工进行操作，解决了现有技中的拍摄设备需要手动操作，操作复杂且拍摄效果差的技术问题。因此，通过本发明上述实施例，可以实现自动拍摄，降低操作复杂度，优化拍摄效果，提升用户体验感和好感度的效果。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是根据本发明实施例的一种拍摄设备的控制方法的流程图；

图2是根据本发明实施例的一种拍摄设备的示意图；以及

图3是根据本发明实施例的一种可选的拍摄设备的示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

首先，在对本发明实施例中出现的部分名词或术语进行解释：

MicArray：麦克阵列，是使用两个或更多个麦克风，按照一定的方式排布，接收声音输入。这样做的好处是，可以通过麦克风接收到声波的相位差进行滤波处理，达到过滤噪声、定位声波方向等功能。

语音识别和语义分析：是指通过语音与机器交流，让机器人明白人的意图。

计算机视觉图像处理：是指通过各种摄像头以及红外、超声、激光雷达等感知输入设备。获取图像数据进而进行人脸发现、人脸识别、人体识别、人体跟踪、骨骼识别、手势识别、物体识别等功能。

机器人(Robot)：是自动执行工作的机器装置。它既可以接受人类指挥，又可以运行预先编排的程序，也可以根据以人工智能技术制定的原则纲领行动。它的任务是协助或取代人类工作的工作，例如生产业、建筑业，或是危险的工作。

实施例1

根据本发明实施例，提供了一种拍摄设备的控制方法的方法实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

其中，该拍摄设备的控制方法应用于拍摄设备，拍摄设备可以具有音频采集单元和图像采集单元，可以对拍摄设备周围的声音和图像进行采集，得到音频数据和图像数据。

图1是根据本发明实施例的一种拍摄设备的控制方法的流程图，如图1所示，该方法包括如下步骤：

步骤S102，获得音频采集单元采集得到的第一音频数据，第一音频数据是音频采集单元通过采集目标对象发出的语音所获得音频数据。

具体的，上述音频采集单元可以是麦克阵列，上述目标对象可以是使用拍摄设备的用户，用户在使用拍摄设备时，可以通过语音控制拍摄设备，无需进行手动操作。

在一种可选的方案中，拍摄设备可以通过麦克阵列中的两个麦克风或更多的麦克风，接收到用户发出的语音。例如，用户可以发出语音“给我和这个雕像拍一个全身的合影”，拍摄设备可以通过两个麦克风或更多的麦克风采集到用户发出的语音命令。

步骤S104，根据第一音频数据进行语音分析，获得语音分析结果。

在一种可选的方案中，在拍摄设备通过麦克阵列中的两个麦克风或更多的麦克风，接收到用户发出的语音命令之后，可以通过语音处理系统，对采集到的用户发出的语音命令进行语音识别和语义分析，了解用户的拍摄意图，得到用户发出的语音命令中包含的关键词。例如，在拍摄设备通过两个麦克风或更多的麦克风采集到用户发出的语音命令“给我和这个雕像拍一个全身的合影”之后，可以通过语音处理系统对语音命令进行语音识别和语义分析，得到语音命令中包含的关键词“我”、“雕像”、“拍”、“全身”和“合影”。

步骤S106，基于语音分析结果，在确定第一音频数据用于指示进行图像采集时，获得图像采集对象信息，图像采集对象信息也是基于语音分析结果获得的。

具体的，上述图像采集可以是拍照或者录像。

可选的，图像采集对象可以包括：目标对象，和/或，拍摄对象，其中，拍摄对象是基于语音分析结果确定的除目标对象之外的图像采集对象。

在一种可选的方案中，在对用户发出的语音命令进行语音识别和语义分析，得到语音命令中包含的关键词之后，可以根据关键词，确定用户是否需要进行图像采集，如果确定用户需要进行图像采集，则从语音命令中包含的关键词中，得到用于描述图像采集对象的信息。例如，在得到语音命令中包含的关键词“我”、“雕像”、“拍”、“全身”和“合影”之后，根据关键词“拍”和“合影”可以确定用户需要进行图像采集，进一步可以从关键词中得到图像采集对象信息，即“我”和“雕像”，从而确定图像采集对象为用户和雕像。

步骤S108，根据图像采集对象信息，控制图像采集单元转动第一角度、或控制拍摄设备的底盘转动第一角度，以对确定的图像采集对象进行图像采集。

具体的，上述图像采集单元可以是具有拍摄功能的设备，例如摄像头，照相机，录像机。

在一种可选的方案中，拍摄设备的控制单元可以根据关键词中的图像采集对象信息，控制拍摄设备的摄像头或者底盘转动，对准图像采集对象，并通过图像采集单元对图像采集对象进行图像采集。例如，在从关键词中得到图像采集对象信息，即“我”，“雕像”之后，可以确定图像采集对象为用户和雕像，进一步控制摄像头对准用户和雕像进行拍照或者录像，完成图像采集。

采用本发明上述实施例，可以在获得音频采集单元采集得到的第一音频数据之后，根据第一音频数据进行语音分析，获得语音分析结果，并基于语音分析结果，在确定第一音频数据用于指示进行图像采集时，获得图像采集对象信息，以及根据图像采集对象信息，控制图像采集单元转动第一角度、或控制拍摄设备的底盘转动第一角度，以对确定的图像采集对象进行图像采集，从而实现拍摄设备根据用户发出的语音，自动进行图像采集，整个图像过程中无需人工进行操作，解决了现有技中的拍摄设备需要手动操作，操作复杂且拍摄效果差的技术问题。因此，通过本发明上述实施例，可以实现自动拍摄，降低操作复杂度，优化拍摄效果，提升用户体验感和好感度的效果。

可选的，根据本发明上述实施例，在图像采集对象为目标对象的情况下，步骤S108，控制图像采集单元转动第一角度、或控制拍摄设备的底盘转动第一角度，包括：

步骤S112，基于语音分析结果，获得目标对象的方位信息。

在一种可选的方案中，在得到图像采集对象信息之后，如果得到的图像采集对象信息为用户，则可以通过语音处理系统，采用麦克阵列对用户发出的语音进行声源定位处理，确定用户所在方位。例如，用户可以发出语音“给我拍一个自拍照”，在拍摄设备在采集到语音命令，对语音命令进行语音分析，得到语音命令中包含的关键词“我”、“拍”和“自拍照”，确定用户需要进行图像采集，进一步获得图像采集对象信息“我”，即图像采集对象为用户，可以通过麦克阵列进行声源定位，确定用户的方位为正北方。

步骤S114，基于目标对象的方位信息，控制图像采集单元转动第一子角度、或控制拍摄设备的底盘转动第一子角度，在转动第一子角度后，获得图像采集单元采集得到的第一图像数据。

具体的，上述第一子角度可以是根据拍摄设备的对准方位与用户所在方位进行计算，得到的两个方位的夹角。

在一种可选的方案中，在得到用户所在方位之后，拍摄设备的控制单元可以计算用户所在方位与拍摄设备当前对准方位进行控制摄像头或底盘转动的夹角，得到第一子角度，并控制摄像头或者底盘转动第一子角度，将摄像头对准用户所在方位，进行图像采集，得到第一图像数据。例如，在确定用户的方位为正北方，并且拍摄设备的对准方位为正西方之后，可以计算得到第一子角度为90°，拍摄设备控制摄像头或者底盘转动逆时针转动90°，将摄像头对准正北方，并通过摄像头采集图像。

步骤S116，根据第一图像数据进行图像识别，获得目标对象在第一图像数据中所处的位置信息。

在一种可选的方案中，拍摄设备可以通过摄像头采集拍摄范围内的图像数据，通过视觉算法系统对采集到的图像数据进行人脸识别，识别图像数据中用户所在的具体位置。例如，在通过摄像头采集到图像之后，视觉算法系统可以进行人脸识别，确定图像中用户所处的具体位置，如用户在图像中所处的具体位置为右上角。

在另一种可选的方案中，为了保证得到用户的位置准确，在通过摄像头采集图像的同时，可以通过红外传感器、雷达传感器等其他传感器进行辅助，感应用户与拍摄设备之间的距离，使得拍摄设备的参数信息更加准确，提升拍摄设备的准确性。

此处需要说明是，由于用户所在方位可能有很多其他人，如果仅仅通过人脸识别对图像进行识别，误差较高，导致拍摄设备的准确性下降，此时还可以通过对图像进行手势识别，只有特定手势的用户可以确定为目标对象，特定手势可以是容易识别，且实用度不高的手势，例如，特定手势可以是手臂举过头顶，食指、中指、无名指和小指握拳，大拇指向上伸出。

步骤S118，基于目标对象在第一图像数据中所处的位置信息，控制图像采集单元转动第二子角度、或控制拍摄设备的底盘转动第二子角度；其中，第一子角度与第二子角度相加获得第一角度。

在一种可选的方案中，在识别出图像数据中用户的具体位置之后，可以控制摄像头或者底盘进行小幅度转动，调整图像数据中用户的具体位置，提升图像采集效果。例如，在确定图像中用户的具体位置为右上角之后，可以控制摄像头向上小幅转动，控制底盘向右小幅转动，从而使图像中的用户位于图像的正中间。

可选的，根据本发明上述实施例，在图像采集对象为拍摄对象的情况下，步骤S108，控制图像采集单元转动第一角度、或控制拍摄设备的底盘转动第一角度，包括：

步骤S122，控制图像采集单元或拍摄设备的底盘按照预设方向转动，并获得图像采集单元采集得到的第二图像数据。

具体的，上述预设方向可以是提前设定的方向，例如，顺时针方向。

在一种可选的方案中，在得到图像采集对象信息之后，如果得到的图像采集对象信息为拍摄对象，则拍摄设备控制摄像头或者底盘顺时针转动，并在摄像头或者底盘转动的过程中，通过摄像头采集图像数据。例如，用户可以发出语音“给这个雕像拍照”，在拍摄设备在采集到语音命令，对语音命令进行语音分析，得到语音命令中包含的关键词“雕像”和“拍照”，确定用户需要进行图像采集，进一步获得图像采集对象信息“雕像”，即图像采集对象为雕像，可以控制摄像头或者底盘顺时针转动，并实时采集图像。

步骤S124，根据第二图像数据进行图像识别，判断第二图像数据中是否存在拍摄对象。

在一种可选的方案中，拍摄设备可以通过摄像头实时采集拍摄范围内的图像数据，通过视觉算法系统对采集到的图像数据进行图像处理，例如，当拍摄对象是物体时，可以对图像数据进行物体识别；当拍摄对象是人体任意一部分，例如手、脚时，可以对图像数据进行骨骼识别。如果在图像数据中识别出拍摄对象，则说明拍摄范围内存在拍摄对象，如果图像数据中无法识别出拍摄对象，则说明拍摄范围内不存在拍摄对象。例如，在摄像头或者底盘顺时针转动的过程中之后，可以通过摄像头采集拍摄范围内的图像，并对图像进行物体识别，识别该图像中是否存在“雕像”，如果在该图像中识别出“雕像”，则说明拍摄范围内存在“雕像”；如果未在该图像中识别出“雕像”，则说明拍摄范围内不存在“雕像”。

步骤S126，在识别第二图像数据中存在拍摄对象时，基于拍摄对象在第二图像数据中所处的位置信息，控制图像采集单元或拍摄设备的底盘进行转动调整；从图像采集单元或拍摄设备的底盘按照预设方向转动开始，到转动调整结束，图像采集单元或拍摄设备的底盘转动的角度即为第一角度。

在一种可选的方案中，如果在图像数据中识别出拍摄对象，则控制摄像头或者底盘停止转动，进一步确定拍摄对象在图像数据中的具体位置，控制摄像头或者底盘进行小幅度转动，调整拍摄对象在图像数据中的具体位置，提升图像采集效果。例如，在图像中识别出“雕像”之后，控制摄像头或者底盘停止转动，确定“雕像”在图像中的位置为左下角，进一步控制摄像头可以控制摄像头向下小幅转动，控制底盘向左小幅转动，从而使雕像位于图像的正中间。

可选的，根据本发明上述实施例，在图像采集对象包括目标对象和拍摄对象的情况下，步骤S108，控制图像采集单元转动第一角度、或控制拍摄设备的底盘转动第一角度，包括：

步骤S130，基于语音分析结果，获得目标对象的方位信息。

在一种可选的方案中，在得到图像采集对象信息之后，如果得到的图像采集对象信息为用户和拍摄对象，则首先可以通过语音处理系统，采用麦克阵列对用户发出的语音进行声源定位处理，确定用户所在方位。例如，用户可以发出语音“给我和这个雕像拍一个全身的合影”，在拍摄设备在采集到语音命令，对语音命令进行语音分析，得到语音命令中包含的关键词“我”、“雕像”、“拍”、“全身”和“合影”之后，确定用户需要进行图像采集，进一步获得图像采集对象信息“我”和“雕像”，即图像采集对象为用户和拍摄对象，可以通过麦克阵列进行声源定位，确定用户的方位为正北方。

步骤S132，基于目标对象的方位信息，控制图像采集单元转动第三子角度、或控制拍摄设备的底盘转动第三子角度，在转动第三子角度后，获得图像采集单元采集得到的第三图像数据。

在一种可选的方案中，在确定用户所在方位之后，可以拍摄设备的控制单元可以计算用户所在方位与拍摄设备当前对准方位进行控制摄像头或底盘转动的夹角，得到第三子角度，并控制摄像头或者底盘转动第三子角度，将摄像头对准用户所在方位，通过摄像头进行图像采集，得到第三图像数据。例如，在确定用户的方位为正北方，并且拍摄设备的对准方位为正西方之后，可以计算得到第一子角度为90度，拍摄设备控制摄像头或者底盘转动逆时针转动90度，将摄像头对准正北方，并通过摄像头采集图像。

步骤S134，根据第三图像数据进行图像识别，获得目标对象在第三图像数据中所处的位置信息，并判断第三图像数据中是否存在拍摄对象。

此处需要说明的是，由于用户发出语音时，可能离拍摄对象较远，例如，用户在拍摄对象对面，而拍摄设备处于用户和拍摄对象之间，在将拍摄设备转向用户所在方位之后，如果直接进行拍摄，将无法拍摄到拍摄对象。因此，为了避免上述情况的发生，在拍摄设备进行拍摄之前，首先需要判断拍摄范围内是否存在拍摄对象。

在一种可选的方案中，拍摄设备可以通过摄像头采集拍摄范围内的图像数据，通过视觉算法系统对采集到的图像数据进行图像处理，确定用户在图像数据中的具体位置，并在图像数据中识别拍摄对象，如果在图像数据中识别出拍摄对象，则说明拍摄范围内存在拍摄对象，如果图像数据中无法识别出拍摄对象，则说明拍摄范围内不存在拍摄对象。例如，在摄像头或者底盘转动逆时针转动90度之后，可以通过摄像头采集拍摄范围内的图像，并对图像进行人脸识别和物体识别，得到用户在图像中的具体位置为左下角，以及识别该图像中是否存在“雕像”，如果在该图像中识别出“雕像”，则说明拍摄范围内存在“雕像”；如果未在该图像中识别出“雕像”，则说明拍摄范围内不存在“雕像”。

步骤S136，在第三图像数据中存在拍摄对象的情况下，获取拍摄对象在第三图像数据中所处的位置信息。

在一种可选的方案中，如果在图像数据中识别出拍摄对象，则确定拍摄对象在图像数据中的具体位置。例如，在图像中识别出“雕像”之后，对图像进行物体识别，确定“雕像”在图像中的位置为右下角。

步骤S138，基于目标对象在第三图像数据中所处的位置信息和拍摄对象在第三图像数据中所处的位置信息，控制图像采集单元转动第四子角度、或控制拍摄设备的底盘转动第四子角度；其中，第三子角度与第四子角度相加获得第一角度。

在一种可选的方案中，在识别出图像数据中用户的具体位置和拍摄对象的具体位置之后，可以控制摄像头或者底盘进行小幅度转动，调整图像数据中用户的具体位置以及拍摄对象的具体位置，提升图像采集效果。例如，在确定图像中用户的具体位置为左下角，确定“雕像”在图像中的位置为右下角之后，可以控制摄像头向下小幅转动，从而使图像中的用户以及雕像位于图像的正中间。

可选的，根据本发明上述实施例，在第三图像数据中不包含拍摄对象的情况下，上述方法还包括：

步骤S142，控制图像采集单元或拍摄设备的底盘按照预设方向转动，并获得转动过程中图像采集单元采集得到的第四图像数据。

在一种可选的方案中，如果确定拍摄范围内不存在拍摄对象，则控制摄像头或者底盘顺时针360°旋转，在旋转过程中通过摄像头采集图像数据，得到第四图像数据。例如，拍摄设备在将摄像头或者底盘转向正前方之后，如果拍摄范围内不存在“雕像”，则控制摄像头或者拍摄设备的底盘顺时针旋转，并在旋转过程中通过摄像头采集图像。

步骤S144，在第四图像数据中存在拍摄对象的情况下，获取拍摄对象与目标对象之间的相对位置信息。

在一种可选的方案中，如果识别出第四图像数据中存在拍摄对象，则控制摄像头或者底盘停止转动，并进一步确定拍摄对象在第四图像数据中的具体位置，根据拍摄对象在第四图像数据中的具体位置，以及用户在第三图像数据中的具体位置，得到相对位置信息。例如，在得到用户在图像中的具体位置为左下角之后，可以控制摄像头或者底盘顺时针旋转，当拍摄范围内存在“雕像”时，控制摄像头或者底盘停止旋转，通过视觉算法系统确定“雕像”在图像中的具体位置，根据用户在图像中的具体位置和“雕像”在图像中的具体位置，得到用户与雕像之间的相对位置，即用户在雕像的对面。

步骤S146，基于相对位置信息，生成提示信息，其中，提示信息用于提示目标对象移动至拍摄对象的位置。

步骤S148，输出提示信息。

在一种可选的方案中，可以根据用户和拍摄对象之间的相对位置信息，生成语音提示信息，并通过喇叭输出给用户，提示用户移动到拍摄对象所在位置。当用户移动到拍摄对象所在位置时，即拍摄范围内采集到的图像中可以识别出拍摄对象和用户，则控制摄像头对用户和拍摄对象进行拍摄。例如，在得到用户与雕像之间的相对位置之后，可以通过语音提示用户“请移动到对面的雕像旁边”，然后通过摄像头对用户和“雕像”进行拍照。

可选的，根据本发明上述实施例，步骤S108，控制图像采集单元转动第一角度包括：步骤S1082，控制拍摄设备的用于搭载图像采集单元的云台转动第一角度。

在一种可选的方案中，在获得到第一角度之后，可以通过运动控制器对搭载摄像头的云台进行控制，使云台转动第一角度。

可选的，根据本发明上述实施例，在步骤S108，控制图像采集单元转动第一角度、或控制拍摄设备的底盘转动第一角度之后，上述方法还包括：

步骤S152，基于语音分析结果，获得拍摄需求信息。

具体的，上述拍摄需求信息可以是用户想要的拍摄角度、拍摄尺寸。

步骤S154，根据拍摄需求信息，计算得到图像采集单元的拍摄参数。

具体的，上述拍摄参数可以是焦距，光圈，快门和白平衡等。

在一种可选的方案中，在对用户发出的语音命令进行语音识别和语义分析，得到语音命令中包含的关键词之后，可以根据关键词，确定用户的拍摄需求，并根据拍摄需求计算得到摄像头的参数。例如，在采集到用户发出的语音命令“给我和这个雕像拍一个全身的合影”之后，对语音命令进行语义分析，得到关键词“我”、“雕像”、“拍”、“全身”和“合影”，可以确定用户的拍摄需求是全身合影，并根据全身合影得到摄像头的参数。

步骤S156，控制图像采集单元按照拍摄参数对确定的图像采集对象进行图像采集。

在一种可选的方案中，在计算到摄像头的参数之后，可以通过拍照控制器对摄像头进行控制，调节摄像头的各项参数，使得摄像头的各项参数满足对应的参数，并进一步对图像采集对象进行图像采集。

步骤S100，根据图像采集对象信息，控制拍摄设备的底盘进行移动调整。

在一种可选的方案中，例如，当确定需要拍摄用户自己时，拍摄设备可以通过摄像头采集拍摄范围内的图像数据，并进行人脸识别，确定图像数据中用户的比例，并基于图像数据中用户的比例，控制底盘进行小距离移动，调整拍摄对象在图像数据中的比例。例如，在图像中识别到用户之后，确定用户在图像中的比例为10％，用户在整个图像中比例较低，即用户在图像中较小，可以控制底盘向前移动，从而使用户在图像中的比例升高，满足拍摄要求。

在另一种可选的方案中，例如，当确定需要拍摄用户和拍摄对象时，拍摄设备可以通过摄像头采集拍摄范围内的图像数据，并进行人脸识别和物体识别，确定图像数据中用户与拍摄对象的位置关系，并根据用户与拍摄对象的位置关系，控制底盘进行小距离移动，调整用户与拍摄对象在图像数据中的位置关系。例如，在图像中识别到用户和“雕像”之后，可以根据用户在图像中的位置和“雕像”在图像中的位置，确定用户与“雕像”的位置关系为重叠，即在图像中用户遮挡了“雕像”，或者“雕像”遮挡了用户，可以控制底盘向左或者向右移动，从而使用户和“雕像”在图像中分离，满足拍摄要求。

此处需要说明的是，拍摄设备还可以通过摄像头采集图像数据，并对图像数据进行手势识别和骨骼识别，得到用户的姿势，如果用户当前姿势或者当前位置不够理想，例如，用户离拍摄设备较近，用户低头，则可以通过语音给用户提示“请往后退一步，并将头抬起一些，好的，1，2，3，茄子！”。可以通过语音提示调整用户的姿势和位置，从而可以进行最佳拍摄，得到最优拍摄效果。

实施例2

根据本发明实施例，还提供了一种拍摄设备的实施例。

图2是根据本发明实施例的一种拍摄设备的示意图，如图2所示，该拍摄设备包括：

图像采集单元21，用于采集图像数据。

具体的，上述图像采集单元21可以是具有拍摄功能的设备，例如摄像头，照相机，录像机。

在一种可选的方案中，如图3所示，拍摄设备可以是具有拍摄功能的智能设备，例如智能机器人等，拍摄设备可以包括摄像头。拍摄设备可以通过摄像头采集摄像头拍摄范围内的图像数据，从而可以进行图像采集。

音频采集单元23，用于通过采集目标对象发出的语音，得到第一音频数据。

具体的，上述音频采集单元23可以是麦克阵列，上述目标对象可以是使用拍摄设备的用户，用户在使用拍摄设备时，可以通过语音控制拍摄设备，无需进行手动操作。

在一种可选的方案中，如图3所示，拍摄设备还可以包括麦克阵列，麦克阵列使用至少两个麦克风。拍摄设备可以通过麦克阵列中的两个麦克风或更多的麦克风，接收到用户发出的语音。例如，用户可以发出语音“给我和这个雕像拍一个全身的合影”，拍摄设备可以通过两个麦克风或更多的麦克风采集到用户发出的语音命令。

音频处理单元25，与音频采集单元23连接，用于根据第一音频数据进行语音分析，获得语音分析结果，并基于语音分析结果，在确定第一音频数据用于指示进行图像采集时，获得图像采集对象信息，图像采集对象信息也是基于语音分析结果获得的。

具体的，上述图像采集可以是拍照或者录像。

在一种可选的方案中，如图3所示，拍摄设备还可以包括与麦克阵列连接的语音处理系统，即上述的语音处理器，语音处理系统可以对采集到的语音命令进行声源定位，语音分析和语义分析。在拍摄设备通过麦克阵列中的两个麦克风或更多的麦克风，接收到用户发出的语音命令之后，可以通过语音处理系统，对采集到的用户发出的语音命令进行语音识别和语义分析，了解用户的拍摄意图，得到用户发出的语音命令中包含的关键词，在对用户发出的语音命令进行语音识别和语义分析，得到语音命令中包含的关键词之后，可以根据关键词，确定用户是否需要进行图像采集，如果确定用户需要进行图像采集，则从语音命令中包含的关键词中，得到用于描述图像采集对象的信息。例如，在拍摄设备通过两个麦克风或更多的麦克风采集到用户发出的语音命令“给我和这个雕像拍一个全身的合影”之后，可以通过语音处理系统对语音命令进行语音识别和语义分析，得到语音命令中包含的关键词“我”、“雕像”、“拍”、“全身”和“合影”，在得到语音命令中包含的关键词“我”、“雕像”、“拍”、“全身”和“合影”之后，根据关键词“拍”和“合影”可以确定用户需要进行图像采集，进一步可以从关键词中得到图像采集对象信息，即“我”和“雕像”，从而确定图像采集对象为用户和雕像。

控制单元27，分别与图像采集单元21和音频处理单元25连接，用于根据图像采集对象信息，控制图像采集单元转动第一角度、或控制拍摄设备的底盘转动第一角度，以使图像采集单元21对确定的图像采集对象进行图像采集。

在一种可选的方案中，如图3所示，拍摄设备还可以包括与语音处理系统连接的拍照控制器和运动控制器，即上述的控制单元，与拍照控制器连接的摄像头，以及与运动控制器连接的运动底盘，即上述的拍摄设备的底盘。拍摄设备的控制单元可以根据关键词中的图像采集对象信息，控制拍摄设备的摄像头或者底盘转动，对准图像采集对象，并通过图像采集单元对图像采集对象进行图像采集。例如，在从关键词中得到图像采集对象信息，即“我”，“雕像”之后，可以确定图像采集对象为用户和雕像，进一步控制摄像头对准用户和雕像进行拍照或者录像，完成图像采集。

可选的，根据本发明上述实施例，在图像采集对象为目标对象的情况下，音频处理单元25还用于基于语音分析结果，获得目标对象的方位信息。

控制单元27还用于基于目标对象的方位信息，控制图像采集单元转动第一子角度、或控制拍摄设备的底盘转动第一子角度。

图像采集单元21还用于采集得到第一图像数据。

上述拍摄设备还包括：图像处理单元，与图像采集单元21连接，用于根据第一图像数据进行图像识别，获得目标对象在第一图像数据中所处的位置信息。

在一种可选的方案中，如图3所示，拍摄设备还可以包括和摄像头连接的视觉算法系统，即上述的图像处理单元，视觉算法系统可以对采集到的图像进行人脸识别。拍摄设备可以通过摄像头采集拍摄范围内的图像数据，通过视觉算法系统对采集到的图像数据进行人脸识别，识别图像数据中用户所在的具体位置。例如，在通过摄像头采集到图像之后，视觉算法系统可以进行人脸识别，确定图像中用户所处的具体位置，如用户在图像中所处的具体位置为右上角。

在另一种可选的方案中，如图3所示，拍照设备还可以包括其他传感器。为了保证得到用户的位置准确，在通过摄像头采集图像的同时，可以通过红外传感器、雷达传感器等其他传感器进行辅助，感应用户与拍摄设备之间的距离，使得拍摄设备的参数信息更加准确，提升拍摄设备的准确性。

此处需要说明是，如图3所示，视觉算法系统还可以对采集到的图像进行手势识别。由于用户所在方位可能有很多其他人，如果仅仅通过人脸识别对图像进行识别，误差较高，导致拍摄设备的准确性下降，此时还可以通过对图像进行手势识别，只有特定手势的用户可以确定为目标对象，特定手势可以是容易识别，且实用度不高的手势，例如，特定手势可以是手臂举过头顶，食指、中指、无名指和小指握拳，大拇指向上伸出。

控制单元27，与图像处理单元连接，还用于基于目标对象在第一图像数据中所处的位置信息，控制图像采集单元转动第二子角度、或控制拍摄设备的底盘转动第二子角度；其中，第一子角度与第二子角度相加获得第一角度。

在一种可选的方案中，如图3所示，拍照控制器和运动控制器可以与视觉算法系统连接。在识别出图像数据中用户的具体位置之后，可以控制摄像头或者底盘进行小幅度转动，调整图像数据中用户的具体位置，提升图像采集效果。例如，在确定图像中用户的具体位置为右上角之后，可以控制摄像头向上小幅转动，控制底盘向右小幅转动，从而使图像中的用户位于图像的正中间。

可选的，根据本发明上述实施例，在图像采集对象为拍摄对象的情况下，

控制单元27还用于控制图像采集单元或拍摄设备的底盘按照预设方向转动。

图像采集单元21还用于采集得到第二图像数据。

上述拍摄设备还包括：图像处理单元，与图像采集单元21连接，用于根据第二图像数据进行图像识别，判断第二图像数据中是否存在拍摄对象。

在一种可选的方案中，如图3所示，拍摄设备还可以包括和摄像头连接的视觉算法系统，即上述的图像处理单元，视觉算法系统可以对采集到的图像进行物体识别，骨骼识别。拍摄设备可以通过摄像头实时采集拍摄范围内的图像数据，通过视觉算法系统对采集到的图像数据进行图像处理，例如，当拍摄对象是物体时，可以对图像数据进行物体识别；当拍摄对象是人体任意一部分，例如手、脚时，可以对图像数据进行骨骼识别。如果在图像数据中识别出拍摄对象，则说明拍摄范围内存在拍摄对象，如果图像数据中无法识别出拍摄对象，则说明拍摄范围内不存在拍摄对象。例如，在摄像头或者底盘顺时针转动的过程中之后，可以通过摄像头采集拍摄范围内的图像，并对图像进行物体识别，识别该图像中是否存在“雕像”，如果在该图像中识别出“雕像”，则说明拍摄范围内存在“雕像”；如果未在该图像中识别出“雕像”，则说明拍摄范围内不存在“雕像”。

控制单元27，与图像处理单元连接，用于在识别第二图像数据中存在拍摄对象时，基于拍摄对象在第二图像数据中所处的位置信息，控制图像采集单元或拍摄设备的底盘进行转动调整；从图像采集单元或拍摄设备的底盘按照预设方向转动开始，到转动调整结束，图像采集单元或拍摄设备的底盘转动的角度即为第一角度。

在一种可选的方案中，如图3所示，拍照控制器和运动控制器可以与视觉算法系统连接。如果在图像数据中识别出拍摄对象，则控制摄像头或者底盘停止转动，进一步确定拍摄对象在图像数据中的具体位置，控制摄像头或者底盘进行小幅度转动，调整拍摄对象在图像数据中的具体位置，提升图像采集效果。例如，在图像中识别出“雕像”之后，控制摄像头或者底盘停止转动，确定“雕像”在图像中的位置为左下角，进一步控制摄像头可以控制摄像头向下小幅转动，控制底盘向左小幅转动，从而使雕像位于图像的正中间。

可选的，根据本发明上述实施例，在图像采集对象包括目标对象和拍摄对象的情况下，

音频处理单元25还用于基于语音分析结果，获得目标对象的方位信息。

控制单元27还用于基于目标对象的方位信息，控制图像采集单元转动第三子角度、或控制拍摄设备的底盘转动第三子角度。

图像采集单元21还用于采集得到第三图像数据。

上述拍摄设备还包括：图像处理单元，与图像采集单元21连接，用于根据第三图像数据进行图像识别，获得目标对象在第三图像数据中所处的位置信息，并判断第三图像数据中是否存在拍摄对象，在第三图像数据中存在拍摄对象的情况下，获取拍摄对象在第三图像数据中所处的位置信息。

在一种可选的方案中，如图3所示，拍摄设备还可以包括和摄像头连接的视觉算法系统，即上述的图像处理单元。拍摄设备可以通过摄像头采集拍摄范围内的图像数据，通过视觉算法系统对采集到的图像数据进行图像处理，确定用户在图像数据中的具体位置，并在图像数据中识别拍摄对象，如果在图像数据中识别出拍摄对象，则说明拍摄范围内存在拍摄对象，如果图像数据中无法识别出拍摄对象，则说明拍摄范围内不存在拍摄对象。如果在图像数据中识别出拍摄对象，则确定拍摄对象在图像数据中的具体位置。例如，在摄像头或者底盘转动逆时针转动90度之后，可以通过摄像头采集拍摄范围内的图像，并对图像进行人脸识别和物体识别，得到用户在图像中的具体位置为左下角，以及识别该图像中是否存在“雕像”，如果在该图像中识别出“雕像”，则说明拍摄范围内存在“雕像”；如果未在该图像中识别出“雕像”，则说明拍摄范围内不存在“雕像”。在图像中识别出“雕像”之后，对图像进行物体识别，确定“雕像”在图像中的位置为右下角。

控制单元27，与图像处理单元连接，用于基于目标对象在第三图像数据中所处的位置信息和拍摄对象在第三图像数据中所处的位置信息，控制图像采集单元转动第四子角度、或控制拍摄设备的底盘转动第四子角度；其中，第三子角度与第四子角度相加获得第一角度。

在一种可选的方案中，如图3所示，拍照控制器和运动控制器可以与视觉算法系统连接。在识别出图像数据中用户的具体位置和拍摄对象的具体位置之后，可以控制摄像头或者底盘进行小幅度转动，调整图像数据中用户的具体位置以及拍摄对象的具体位置，提升图像采集效果。例如，在确定图像中用户的具体位置为左下角，确定“雕像”在图像中的位置为右下角之后，可以控制摄像头向下小幅转动，从而使图像中的用户以及雕像位于图像的正中间。

可选的，根据本发明上述实施例，在第三图像数据中不包含拍摄对象的情况下，控制单元27还用于控制图像采集单元或拍摄设备的底盘按照预设方向转动。

图像采集单元还用于采集得到的第四图像数据。

图像处理单元还用于在第四图像数据中存在拍摄对象的情况下，获取拍摄对象与目标对象之间的相对位置信息。

拍摄设备还包括：提示处理器，用于基于相对位置信息，生成提示信息，其中，提示信息用于提示目标对象移动至拍摄对象的位置。

喇叭，与提示处理器连接，用于输出提示信息。

在一种可选的方案中，如图3所示，拍摄设备还可以包括语音反馈装置，即上述的提示处理器，以及与语音反馈装置连接的喇叭。可以根据用户和拍摄对象之间的相对位置信息，生成语音提示信息，并通过喇叭输出给用户，提示用户移动到拍摄对象所在位置。当用户移动到拍摄对象所在位置时，即拍摄范围内采集到的图像中可以识别出拍摄对象和用户，则控制摄像头对用户和拍摄对象进行拍摄。例如，在得到用户与雕像之间的相对位置之后，可以通过语音提示用户“请移动到对面的雕像旁边”，然后通过摄像头对用户和“雕像”进行拍照。

可选的，根据本发明上述实施例，控制单元27包括：

子控制单元，用于控制拍摄设备的用于搭载图像采集单元的云台转动第一角度。

在一种可选的方案中，如图3所示，拍摄设备还可以包括搭载摄像头的云台。在获得到第一角度之后，可以通过运动控制器对搭载摄像头的云台进行控制，使云台转动第一角度。

可选的，根据本发明上述实施例，音频处理单元25还用于基于语音分析结果，获得拍摄需求信息。

拍摄设备还包括：控制处理单元，与音频处理单元25连接，用于根据拍摄需求信息，计算得到图像采集单元的拍摄参数。

在一种可选的方案中，如图3所示，拍摄设备还可以包括与语音处理系统连接的智能拍照算法单元，即上述的控制处理单元。在对用户发出的语音命令进行语音识别和语义分析，得到语音命令中包含的关键词之后，可以根据关键词，确定用户的拍摄需求，并根据拍摄需求计算得到摄像头的参数。例如，在采集到用户发出的语音命令“给我和这个雕像拍一个全身的合影”之后，对语音命令进行语义分析，得到关键词“我”、“雕像”、“拍”、“全身”和“合影”，可以确定用户的拍摄需求是全身合影，并根据全身合影得到摄像头的参数。

控制单元27，与控制处理单元连接，还用于控制图像采集单元按照拍摄参数对确定的图像采集对象进行图像采集。

在一种可选的方案中，如图3所示，拍照控制器和运动控制器还可以智能拍照算法单元连接。在计算到摄像头的参数之后，可以通过拍照控制器对摄像头进行控制，调节摄像头的各项参数，使得摄像头的各项参数满足对应的参数，并进一步对图像采集对象进行图像采集。

可选的，根据本发明上述实施例，控制单元27还用于根据图像采集对象信息，控制拍摄设备的底盘进行移动调整。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

在本发明的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的技术内容，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，可以为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种拍摄设备的控制方法，应用于拍摄设备，其特征在于，所述拍摄设备具有音频采集单元和图像采集单元，所述方法包括：

获得所述音频采集单元采集得到的第一音频数据，所述第一音频数据是所述音频采集单元通过采集目标对象发出的语音所获得音频数据；

根据所述第一音频数据进行语音分析，获得语音分析结果；

基于所述语音分析结果，在确定所述第一音频数据用于指示进行图像采集时，确定图像采集对象，所述图像采集对象也是基于所述语音分析结果获得的；

基于确定的所述图像采集对象，控制所述图像采集单元转动第一角度、或控制所述拍摄设备的底盘转动第一角度，以对所述图像采集对象进行图像采集；

其中，在控制所述图像采集单元转动第一角度、或控制所述拍摄设备的底盘转动第一角度之后，所述方法还包括：基于确定的所述图像采集对象，控制所述拍摄设备的底盘进行移动调整；所述基于确定的所述图像采集对象，控制所述拍摄设备的底盘进行移动调整包括：基于图像数据中拍摄对象的比例，控制底盘移动，调整拍摄对象在图像数据中的比例。

2.根据权利要求1所述的方法，其特征在于，所述图像采集对象包括：所述目标对象，和/或，拍摄对象，其中，所述拍摄对象是基于所述语音分析结果确定的除所述目标对象之外的图像采集对象。

3.根据权利要求2所述的方法，其特征在于，在所述图像采集对象为所述目标对象的情况下，控制所述图像采集单元转动第一角度、或控制所述拍摄设备的底盘转动第一角度，包括：

基于所述语音分析结果，获得所述目标对象的方位信息；

基于所述目标对象的方位信息，控制所述图像采集单元转动第一子角度、或控制所述拍摄设备的底盘转动第一子角度，在转动所述第一子角度后，获得所述图像采集单元采集得到的第一图像数据；

根据所述第一图像数据进行图像识别，获得所述目标对象在所述第一图像数据中所处的位置信息；

基于所述目标对象在所述第一图像数据中所处的位置信息，控制所述图像采集单元转动第二子角度、或控制所述拍摄设备的底盘转动第二子角度；其中，所述第一子角度与第二子角度相加获得所述第一角度。

4.根据权利要求2所述的方法，其特征在于，在所述图像采集对象为所述拍摄对象的情况下，控制所述图像采集单元转动第一角度、或控制所述拍摄设备的底盘转动第一角度，包括：

控制所述图像采集单元或所述拍摄设备的底盘按照预设方向转动，并获得所述图像采集单元采集得到的第二图像数据；

根据所述第二图像数据进行图像识别，判断所述第二图像数据中是否存在所述拍摄对象；

在识别所述第二图像数据中存在所述拍摄对象时，基于所述拍摄对象在所述第二图像数据中所处的位置信息，控制所述图像采集单元或所述拍摄设备的底盘进行转动调整；

从所述图像采集单元或所述拍摄设备的底盘按照预设方向转动开始，到所述转动调整结束，所述图像采集单元或所述拍摄设备的底盘转动的角度即为所述第一角度。

5.根据权利要求2所述的方法，其特征在于，在所述图像采集对象包括所述目标对象和所述拍摄对象的情况下，控制所述图像采集单元转动第一角度、或控制所述拍摄设备的底盘转动第一角度，包括：

基于所述语音分析结果，获得所述目标对象的方位信息；

基于所述目标对象的方位信息，控制所述图像采集单元转动第三子角度、或控制所述拍摄设备的底盘转动第三子角度，在转动所述第三子角度后，获得所述图像采集单元采集得到的第三图像数据；

根据所述第三图像数据进行图像识别，获得所述目标对象在所述第三图像数据中所处的位置信息，并判断所述第三图像数据中是否存在所述拍摄对象；

在所述第三图像数据中存在所述拍摄对象的情况下，获取所述拍摄对象在所述第三图像数据中所处的位置信息；

基于所述目标对象在所述第三图像数据中所处的位置信息和所述拍摄对象在所述第三图像数据中所处的位置信息，控制所述图像采集单元转动第四子角度、或控制所述拍摄设备的底盘转动第四子角度；其中，所述第三子角度与第四子角度相加获得所述第一角度。

6.根据权利要求5所述的方法，其特征在于，在所述第三图像数据中不包含所述拍摄对象的情况下，所述方法还包括：

控制所述图像采集单元或所述拍摄设备的底盘按照预设方向转动，并获得转动过程中所述图像采集单元采集得到的第四图像数据；

在所述第四图像数据中存在所述拍摄对象的情况下，获取所述拍摄对象与所述目标对象之间的相对位置信息；

基于所述相对位置信息，生成提示信息，其中，所述提示信息用于提示所述目标对象移动至所述拍摄对象的位置；

输出所述提示信息。

7.根据权利要求1至6任一项所述的方法，其特征在于，在控制所述图像采集单元转动第一角度、或控制所述拍摄设备的底盘转动第一角度之后，所述方法还包括：

基于所述语音分析结果，获得拍摄需求信息；

根据所述拍摄需求信息，计算得到所述图像采集单元的拍摄参数；

控制所述图像采集单元按照所述拍摄参数对确定的所述图像采集对象进行图像采集。

8.一种拍摄设备，其特征在于，包括：

图像采集单元，用于采集图像数据；

音频采集单元，用于通过采集目标对象发出的语音，得到第一音频数据；

音频处理单元，与所述音频采集单元连接，用于根据所述第一音频数据进行语音分析，获得语音分析结果，并基于所述语音分析结果，在确定所述第一音频数据用于指示进行图像采集时，确定图像采集对象，所述图像采集对象也是基于所述语音分析结果获得的；

控制单元，分别与所述图像采集单元和所述音频处理单元连接，用于基于确定的所述图像采集对象，控制所述图像采集单元转动第一角度、或控制所述拍摄设备的底盘转动第一角度，以使所述图像采集单元对所述图像采集对象进行图像采集；

其中，所述控制单元还用于基于确定的所述图像采集对象，控制所述拍摄设备的底盘进行移动调整；所述基于确定的所述图像采集对象，控制所述拍摄设备的底盘进行移动调整包括：基于图像数据中拍摄对象的比例，控制底盘移动，调整拍摄对象在图像数据中的比例。

9.根据权利要求8所述的拍摄设备，其特征在于，所述图像采集对象包括：所述目标对象，和/或，拍摄对象，其中，所述拍摄对象是基于所述语音分析结果确定的除所述目标对象之外的图像采集对象。

10.根据权利要求9所述的拍摄设备，其特征在于，在所述图像采集对象为所述目标对象的情况下，

所述音频处理单元还用于基于所述语音分析结果，获得所述目标对象的方位信息；

所述控制单元还用于基于所述目标对象的方位信息，控制所述图像采集单元转动第一子角度、或控制所述拍摄设备的底盘转动第一子角度；

所述图像采集单元还用于采集得到第一图像数据；

所述拍摄设备还包括：图像处理单元，与所述图像采集单元连接，用于根据所述第一图像数据进行图像识别，获得所述目标对象在所述第一图像数据中所处的位置信息；

所述控制单元，与所述图像处理单元连接，还用于基于所述目标对象在所述第一图像数据中所处的位置信息，控制所述图像采集单元转动第二子角度、或控制所述拍摄设备的底盘转动第二子角度；其中，所述第一子角度与第二子角度相加获得所述第一角度。

11.根据权利要求9所述的拍摄设备，其特征在于，在所述图像采集对象为所述拍摄对象的情况下，

所述控制单元还用于控制所述图像采集单元或所述拍摄设备的底盘按照预设方向转动；

所述图像采集单元还用于采集得到第二图像数据；

所述拍摄设备还包括：图像处理单元，与所述图像采集单元连接，用于根据所述第二图像数据进行图像识别，判断所述第二图像数据中是否存在所述拍摄对象；

所述控制单元，与所述图像处理单元连接，用于在识别所述第二图像数据中存在所述拍摄对象时，基于所述拍摄对象在所述第二图像数据中所处的位置信息，控制所述图像采集单元或所述拍摄设备的底盘进行转动调整，从所述图像采集单元或所述拍摄设备的底盘按照预设方向转动开始，到所述转动调整结束，所述图像采集单元或所述拍摄设备的底盘转动的角度即为所述第一角度。

12.根据权利要求9所述的拍摄设备，其特征在于，在所述图像采集对象为所述目标对象和所述拍摄对象的情况下，

所述控制单元还用于基于所述目标对象的方位信息，控制所述图像采集单元转动第三子角度、或控制所述拍摄设备的底盘转动第三子角度；

所述图像采集单元还用于采集得到第三图像数据；

所述拍摄设备还包括：图像处理单元，与所述图像采集单元连接，用于根据所述第三图像数据进行图像识别，获得所述目标对象在所述第三图像数据中所处的位置信息，并判断所述第三图像数据中是否存在所述拍摄对象，在所述第三图像数据中存在所述拍摄对象的情况下，获取所述拍摄对象在所述第三图像数据中所处的位置信息；

所述控制单元，与所述图像处理单元连接，用于基于所述目标对象在所述第三图像数据中所处的位置信息和所述拍摄对象在所述第三图像数据中所处的位置信息，控制所述图像采集单元转动第四子角度、或控制所述拍摄设备的底盘转动第四子角度；其中，所述第三子角度与第四子角度相加获得所述第一角度。

13.根据权利要求12所述的拍摄设备，其特征在于，在所述第三图像数据中不包含所述拍摄对象的情况下，

所述图像采集单元还用于采集得到第四图像数据；

所述图像处理单元还用于在所述第四图像数据中存在所述拍摄对象的情况下，获取所述拍摄对象与所述目标对象之间的相对位置信息；

所述拍摄设备还包括：提示处理器，用于基于所述相对位置信息，生成提示信息，其中，所述提示信息用于提示所述目标对象移动至所述拍摄对象的位置；

喇叭，与所述提示处理器连接，用于输出所述提示处理器。

14.根据权利要求8至13任一项所述的拍摄设备，其特征在于，

所述音频处理单元还用于基于所述语音分析结果，获得拍摄需求信息；

所述拍摄设备还包括：控制处理单元，与所述音频处理单元连接，用于根据所述拍摄需求信息，计算得到所述图像采集单元的拍摄参数；

所述控制单元，与所述控制处理单元连接，还用于控制所述图像采集单元按照所述拍摄参数对确定的所述图像采集对象进行图像采集。