CN113747069A - 一种拍摄控制方法、装置及控制设备、拍摄设备 - Google Patents

一种拍摄控制方法、装置及控制设备、拍摄设备 Download PDF

Info

Publication number
CN113747069A
CN113747069A CN202111055851.2A CN202111055851A CN113747069A CN 113747069 A CN113747069 A CN 113747069A CN 202111055851 A CN202111055851 A CN 202111055851A CN 113747069 A CN113747069 A CN 113747069A
Authority
CN
China
Prior art keywords
information
control
shooting
voice
equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111055851.2A
Other languages
English (en)
Inventor
吴丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SZ DJI Technology Co Ltd
Original Assignee
SZ DJI Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SZ DJI Technology Co Ltd filed Critical SZ DJI Technology Co Ltd
Priority to CN202111055851.2A priority Critical patent/CN113747069A/zh
Publication of CN113747069A publication Critical patent/CN113747069A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/66Remote control of cameras or camera parts, e.g. by remote control devices
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/695Control of camera direction for changing a field of view, e.g. pan, tilt or based on tracking of objects
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B64AIRCRAFT; AVIATION; COSMONAUTICS
    • B64UUNMANNED AERIAL VEHICLES [UAV]; EQUIPMENT THEREFOR
    • B64U2101/00UAVs specially adapted for particular uses or applications
    • B64U2101/30UAVs specially adapted for particular uses or applications for imaging, photography or videography
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Studio Devices (AREA)
  • User Interface Of Digital Computer (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Exposure Control For Cameras (AREA)
  • Telephonic Communication Services (AREA)

Abstract

一种拍摄控制方法、装置及控制设备,方法应用于控制设备,控制设备在与拍摄设备相连后,用于对拍摄设备进行控制,方法包括:获取当前连接的拍摄设备的设备标识(S201);若采集到语音信息,则根据设备标识在语音信息所包含的内容数据中进行信息比对(S202);如果信息比对的结果为内容数据中包括与设备标识匹配的匹配信息,则从语音信息中分析识别出控制信息(S203);根据控制信息生成控制指令,并将控制指令发送给当前连接的拍摄设备(S204),控制指令用于控制拍摄设备拍摄影像。采用本申请,可满足用户拍摄控制的自动化、智能化需求。

Description

一种拍摄控制方法、装置及控制设备、拍摄设备
技术领域
本发明涉及电子技术领域,尤其涉及一种拍摄控制方法、装置及控制设备、拍摄设备。
背景技术
随着科技的进步,电子技术和拍摄技术得到了不断的发展,各种性能的摄像机层出不穷,可以拍摄得到更高质量的影像,同时,围绕着摄像机也开发构建了各种各样的用于辅助拍摄的装置,例如,用来带动摄像机转动,在多个方向上都能进行拍摄的云台,能够搭载摄像机运动,以便于执行一些航拍、监测等任务的无人机等等。而如何更好地方便用户对摄像机等能够用来协助用户拍摄所需影像的拍摄设备进行自动化控制,也是研究的热点问题。
发明内容
本发明实施例提供了一种拍摄控制方法、装置及控制设备以及拍摄设备,可以基于语音来实现对拍摄设备的自动化控制。
一方面,本发明实施例提供了一种拍摄控制方法,所述方法应用于控制设备,所述控制设备在与拍摄设备相连后,用于对所述拍摄设备进行控制,所述拍摄设备包括云台装置和设置在该云台装置上的摄像机,所述方法包括:
获取当前连接的拍摄设备的设备标识;
若采集到语音信息,则根据所述设备标识在所述语音信息所包含的内容数据中进行信息比对;
如果信息比对的结果为所述内容数据中包括与所述设备标识匹配的匹配信息,则从所述语音信息中分析识别出控制信息;
若所述控制信息中包括跟拍指示信息,则生成跟拍控制指令,并将所述跟拍控制指令发送给当前连接的拍摄设备,所述跟拍控制指令用于控制所述云台装置转动,并触发所述摄像机跟踪拍摄发起语音信息的用户。
另一方面,本发明实施例还提供了另一种拍摄控制方法,应用于拍摄设备,所述拍摄设备包括云台装置和设置在该云台装置上的摄像机,所述方法包括:
采集当前环境中的语音信息;
若采集到语音信息,则根据为本拍摄设备设置的设备标识在所述语音信息所包含的内容数据中进行信息比对;
如果信息比对的结果为所述内容数据中包括与所述设备标识匹配的匹配信息,则从所述语音信息中分析识别出控制信息;
若所述控制信息中包括跟拍指示信息,则生成跟拍控制指令,所述跟拍控制指令用于控制所述云台装置转动,并触发所述摄像机跟踪拍摄发起语音信息的用户。
相应地,本发明实施例还提供了一种控制设备,所述控制设备在与拍摄设备相连后,用于对所述拍摄设备进行控制,所述拍摄设备包括云台装置和设置在该云台装置上的摄像机,所述控制设备包括:存储装置、处理器以及通信接口,其中:
所述存储装置,用于存储程序指令;
所述处理器,调用所述存储装置中存储的程序指令,用于获取当前连接的拍摄设备的设备标识;若采集到语音信息,则根据所述设备标识在所述语音信息所包含的内容数据中进行信息比对;如果信息比对的结果为所述内容数据中包括与所述设备标识匹配的匹配信息,则从所述语音信息中分析识别出控制信息;若所述控制信息中包括跟拍指示信息,则生成跟拍控制指令,并将所述跟拍控制指令发送给当前连接的拍摄设备,所述跟拍控制指令用于控制所述云台装置转动,并触发所述摄像机跟踪拍摄发起语音信息的用户。
相应地,本发明实施例还提供了一种拍摄设备,包括:云台装置、设置在该云台装置上的摄像机、存储装置和处理器,其中:
所述存储装置,用于存储程序指令;
所述处理器,调用所述存储装置中存储的程序指令,用于采集当前环境中的语音信息;若采集到语音信息,则根据为本拍摄设备设置的设备标识在所述语音信息所包含的内容数据中进行信息比对;如果信息比对的结果为所述内容数据中包括与所述设备标识匹配的匹配信息,则从所述语音信息中分析识别出控制信息;若所述控制信息中包括跟拍指示信息,则生成跟拍控制指令,所述跟拍控制指令用于控制所述云台装置转动,并触发所述摄像机跟踪拍摄发起语音信息的用户。
本申请可以全自动地分析出用户语音是否用于控制拍摄设备,并在确定出用户语音是用于控制拍摄设备时,进一步再根据用户语音对拍摄设备进行拍摄控制,更好地满足了用户对拍摄控制的自动化、智能化需求。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的一种拍摄控制系统的结构示意图;
图2是本发明实施例的一种拍摄控制方法的流程示意图;
图3是本发明实施例的一种在控制设备中显示的用户界面的示意图;
图4是本发明实施例的一种拍摄控制的场景示意图;
图5是本发明实施例的另一种拍摄控制的场景示意图;
图6是本发明实施例的另一种拍摄控制方法的流程示意图;
图7是本发明实施例的一种拍摄控制装置的结构示意图;
图8是本发明实施例的一种控制设备的结构示意图;
图9是本发明实施例的一种拍摄设备的结构示意图。
具体实施方式
在本发明实施例中所提及的拍摄设备主要是指一些能够协助用户拍摄各种所需影像的设备,这些拍摄设备例如可以是一台摄像机、由摄像机和云台构成的设备、由诸如无人机、智能移动机器人等移动平台和摄像机构成的设备。
如图1所示,是本发明实施例的一种拍摄控制系统的结构示意图,在图1所示的系统,拍摄设备101可以与控制设备102建立有线或者无线的连接,例如可以通过蓝牙模块、WiFi模块、射频模块建立通信连接。控制设备102可以为一个诸如智能手机、平板电脑、智能可穿戴设备等智能终端,用户通过操控控制设备102来对拍摄设备101进行控制。在图1中,拍摄设备101仅为示意,该拍摄设备101可以是组合了摄像机、云台的设备,也可以是组合了无人机、摄像机的设备。
当拍摄设备101与控制设备102通过Wi-Fi、或蓝牙、或硬件接口等建立连接后,拍摄设备101可以被放置于用户需要的任何位置,或飞行至任何用户期望的位置。用户也可以将已连接拍摄设备101的控制设备102放置于任意可以采集用户语音的位置。在一个实施例中,用户可以在控制设备102上进行用户操作,从而通过控制设备102来控制拍摄设备101,例如可以控制摄像机拍摄影像、可以控制拍摄设备101中的云台转动来拍摄不同方向上的影像或者跟踪拍摄某个对象、还可以控制拍摄设备101中的无人机飞行并通过摄像机拍摄不同的环境影像或者跟踪拍摄某个对象。
在一个实施例中,用户还可以发出语音信息来控制拍摄设备101,在控制设备102连接了拍摄设备101后,控制设备102会获取拍摄设备101的设备标识,该设备标识可以是一些该控制设备102能够识别的编号等标识。也可以是该拍摄设备101的通用名称,例如产品名称等等。控制设备102可以自动接收或者主动获取拍摄设备101的设备标识,也可以是在建立连接后,由用户为当前连接的拍摄设备101设置的设备标识。用户在需要时,例如当前在进行绘画、家务、演奏或者运动等活动时,可以不必通过双手来在控制设备102上操作而是基于发出语音信息来完成对拍摄设备101的控制。
在建立了控制设备102与拍摄设备101之间的通信连接后,用户即可发出声音信号,控制设备102在采集到声音信号得到语音信息后,再基于当前连接的拍摄设备101的设备标识,自动地判断该语音信息是否为控制信息,如果该语音信息中不包括设备标识,则可以认为该语音信息为正常的用户交流信息等不是用来控制拍摄设备101的信息,忽略不计即可。而如果该语音信息中包括了当前所连接设备的设备标识,则将该语音信息作为控制语音,从该语音信息再进一步分析出控制信息,以便于对拍摄设备101进行控制。例如,对于某个被命名为“OSMO”的拍摄设备101,用户可以发出“OSMO,拍照”,控制设备102通过对采集到的用户语音信息进行语音分析,确定出语音中包括了设备标识“OSMO”的匹配信息后,此时就需要进一步从语音信息中分析识别出控制信息“拍照”,基于“拍照”生成控制指令控制拍摄设备101开始拍照,又例如,对于某个被命名为“Mavic”的拍摄设备101,用户可以发出“Mavic,起飞,拍我”,控制设备102在分析确定出存在“Mavic”的匹配信息后,控制设备102可以发出控制信息用于控制无人机起飞、跟随发出语音指令的用户并拍摄影像。
具体再请参见图2,是本发明实施例的一种拍摄控制方法的流程示意图,本发明实施例的所述方法可以应用在如图1所示的系统,具体是由控制设备来执行,该控制设备可以是智能手机、平板电脑、智能可穿戴设备等带无线传输功能且可以采集语音信息的智能终端。可以在该控制设备中安装相应的应用APP,进而实现对拍摄设备的手动控制和语音控制。本发明实施例的所述方法包括如下步骤。
用户可以通过自动搜索或者手动连接的方式来建立控制设备和拍摄设备之间的连接,在建立了连接后,控制设备在S201中获取当前连接的拍摄设备的设备标识;该设备标识用于在控制设备中标记当前连接的拍摄设备。当控制设备连接有两个或者多个拍摄设备时,可以分别获取每一个拍摄设备的设备标识,此时,不同的拍摄设备的设备标识不相同,以此,控制设备可以基于设备标识分别对不同的拍摄设备进行控制。这些设备标识可以是在建立连接后,由用户设置的,也可以是建立连接的拍摄设备自动上报的,也可以是在接收到拍摄设备的硬件标识等其他自带的标识后自动基于历史数据对该拍摄设备设置的,例如,某个型号为XYZ的拍摄设备与控制设备建立连接后,控制设备智能地将该拍摄设备的设备标识记录为“XYZ”、或者接收用户为该XYZ型号的拍摄设备的命名“相机”作为设备标识、或者自动地基于历史数据中为XYZ型号的拍摄设备设置的“相机”作为本次连接该XYZ型号的拍摄设备的设备标识。在本发明实施例中,设备标识主要是一个用户能够记住而且可以较为准确地用语言表达出来的标识,一些不好记忆的标识不利于作为拍摄设备的设备标识。用户可以根据自己的需要对各种类型的拍摄设备进行命名,以便于确定这些拍摄设备的设备标识,在一个实施例中,设备标识例如可以是上述提及的一些产品名称“OSMO”或“Mavic”,甚至可以使用“张三”、“李四”之类的命名标识来为拍摄设备设置设备标识。
在获取到设备标识后,控制设备会实时或者周期性地监测可能存在的对拍摄设备的控制操作,该控制操作可以是用户在控制设备提供的界面上发起的手动操作,也可以是语音操作。在一个实施例中,如图3所示,示出了一种在控制设备300中显示的用户界面,包括了第一控制界面301和第二控制界面302,在第一控制界面301上可以包括按钮区3012,在按钮区3012外围设置有个多个方向虚拟按钮,在按钮区3012的中间位置设置有确定拍摄的按钮,通过这些方向虚拟按钮,可以控制拍摄设备中包括的云台的转动方向,从而实现由控制设备300控制的多方位拍摄。在第二控制界面302上则可以包括一个语音按钮3021,当用户单击该语音按钮3021后,控制设备300开始调用麦克风等拾音装置采集语音信息。在其他实施例中,控制设备300显示的用户界面也可以仅仅只包括第一控制界面301,而语音采集功能则一直开启,也就是说,用户在控制设备300打开APP后,会实时监测是否存在语音信息以便执行后续操作,并不需要用户进行特殊按钮的点击操作等用户操作。在一个实施例中,本发明实施例的所述方法还可以包括:根据设备类型获取并显示用户操作界面;其中,所述用户操作界面上包括了接收用于对所述拍摄设备进行控制的用户操作的第一控制界面301,和/或,用于接收语音信息以便于对所述拍摄设备进行语音控制的第二控制界面302,也就是说,控制设备300会针对不同的连接设备,显示具有不同虚拟按钮的第一控制界面301,如图3所示的界面是检测到当前连接的是包括云台和摄像机的拍摄设备时呈现的界面。在其他界面中,如果检测到当前连接的是包括无人机和摄像机的拍摄设备,则可以呈现对无人机的控制按钮,包括起飞控制按钮、降落控制按钮、反向控制按钮或者摇杆按钮,还可以包括一些能够呈现飞行数据的显示区域等等。而如果检测到当前连接仅仅是一个单纯的摄像机,则可以仅包括拍摄图片按钮、拍摄视频按钮等虚拟按钮。
控制设备会检测是否采集到的语音信息,在S202中若采集到语音信息,则根据所述设备标识在所述语音信息所包含的内容数据中进行信息比对;控制设备可以通过设置的麦克风等拾音装置来采集环境中的语音信息,这些语音信息可能是用户发出的用来控制拍摄设备的信息,也可能是用户的诸如正常交谈时产生的不用来控制拍摄设备的信息。因此,控制设备在采集到语音信息后,并不是开始执行生成对应的控制指令的相关处理,而是基于在S201中获取的设备标识来自动识别当前采集到的语音信息是否为用于控制拍摄设备的控制语音。
在S202中,控制设备可以先将采集到的语音信息进行内容识别,确定出其中的内容数据,这些内容数据主要是一些文字,对于文字内容,再通过语音的连续性来确定出其中的各个关键字或者关键词。也可以是在确定了内容数据中的各个文字后,通过拆词的方式确定出其中的关键字或者关键词,以确保获取到更加完整的关键字或者关键词。在确定了关键字或关键词后,可以逐个分别与设备信息中所包括的字或词进行比对,以便于确定出语音信息中的关键字或关键词是否与设备标识中的字或词匹配。
控制设备在S203中,如果信息比对的结果为所述内容数据中包括与所述设备标识匹配的匹配信息,则从所述语音信息中分析识别出控制信息。将S202中确定出的关键字或者关键词与控制设备在S201中获取的设备标识进行比较,确定语音信息中的文字内容中是否存在与设备标识所对应的字或者词语相同或者相近似关键字或关键词。
在一个实施例中,可以通过字符间是否相同和/或相似的判断方式来完成判断。其中,相同的判断可以是指:语音信息对应的文字内容中的某个字或词的发音是否与设备标识中某个字或词的发音相同,若相同,则可以认为信息比对的结果为所述内容数据中包括与所述设备标识匹配的匹配信息;相同的判断也可以是指:语音信息对应的文字内容中的某个关键字或关键词是否与设备标识中某个字或词的字符是相同的,如果相同,例如,设备标识中包括“张三”,而语音信息中的文字内容包括“张三”,则认为信息比对的结果为所述内容数据中包括与所述设备标识匹配的匹配信息。
相似的判断可以是指:语音信息对应的文字内容中的某个字或词是否与设备标识中某个的字或词的发音相似,例如“OSMU”与“OSMO”的发音相似,则可以认为信息比对的结果为所述内容数据中包括与所述设备标识匹配的匹配信息;相似的判断也可以是指:语音信息对应的文字内容中的某个字或词是否与设备标识中某个的字或词的字符是相似的,如果相似,例如,设备标识中包括“OSMO”,而语音信息确定出的文字内容包括“OSMU”的关键词,两者在字符上比较相似,此时也认为信息比对的结果为所述内容数据中包括与所述设备标识匹配的匹配信息。
在一个实施例中,在确定了匹配信息后,控制设备以所述匹配信息在所述语音信息中位置为参考位置,从所述语音信息中分析识别出关键信息;从识别出的关键信息中获取控制信息。可以基于约定的语音信息结构中控制信息与匹配信息之间的位置关系来从语音信息中确定关键信息,例如,约定的位置关系为先匹配信息,紧接着为控制信息,即约定的语音信息结构为{匹配信息,控制信息1,控制信息2},此时,在基于S202的比对结果确定出匹配信息后,即可将内容数据中紧随其后的关键字或关键词作为关键信息,并从关键信息中最终获取得到控制信息。简单来说,可以将匹配信息后面的关键字或关键词作为关键信息,然后从中找到有效的信息作为控制信息,一些无意义的字或词,或者不是用来进行控制的字或词都会被舍弃,例如,“Mavic,起飞,快,拍我”,其中“Mavic”为识别出的匹配信息,后续的“起飞”,“快”,“拍我”为关键信息,而其中的“快”不能用来对拍摄设备进行控制而被舍弃,例如找不到关于“快”的控制指令时,关键信息“快”可以被舍弃,因此,后续的“起飞”,“拍我”分别用来控制拍摄设备包括的无人机起飞,以及控制无人机上搭载的摄像机开始针对目标对象拍摄图片或视频。
在一个实施例中,所述从识别出的关键信息中获取控制信息可以包括:根据当前连接的拍摄设备的设备类型,确定目标信息集合;将识别出的各关键信息与目标信息集合中的各个目标信息进行比对;根据比对结果从关键信息中选择控制信息;其中,选择的控制信息所对应的字符与目标信息集合中的其中一个目标信息所对应的字符相同或满足预设的近似条件。也就是说,可以针对不同的设备类型设置不同的信息集合,这些信息集合中包括多个用来对拍摄设备进行控制的目标信息,例如针对包括无人机和摄像机的拍摄设备,信息集合中至少包括“起飞、向上飞行、向下飞行、降落、拍摄、跟踪狗”等等较大量的目标信息,这些目标信息均会对应一些控制指令。只需要将各个关键信息与信息集合中的目标信息进行比较,相同或者相似时都可以确定出控制信息,并最终确定出控制指令,例如,用户发出的语音信息中匹配信息之后包括了“向上飞”的关键信息,该“向上飞”的关键信息与包括无人机和摄像机的拍摄设备对应的信息集合中的“向上飞行”相似,因此,可以将该“向上飞”的关键信息作为控制信息,并基于为信息集合中的“向上飞行”设置的控制指令,来对应确定“向上飞”的控制指令,以便于基于控制信息最终控制拍摄设备中的无人机飞行。
控制设备在S204中根据所述控制信息生成控制指令,并将所述控制指令发送给当前连接的拍摄设备,所述控制指令用于控制所述拍摄设备拍摄影像。每一个控制信息预先对应一个控制指令,基于控制信息即可得到相应的控制指令。进一步地,可以预先设置上述提及的信息集合中目标信息与控制指令之间的对应关系,当基于目标信息集合中的目标信息识别出控制信息后,根据目标信息对应的控制指令来生成控制信息对应的控制指令,用来控制拍摄设备。控制设备可以通过已建立的通信链路来向拍摄设备发送控制指令。
另外,在信息比对的结果为所述内容数据中包括与所述设备标识匹配的匹配信息之后,控制设备可以从后续采集到的应用信息中分析识别出控制信息。也就是说,在当前的语音信息中确定出包括匹配信息之后,可以直接从后续采集到的语音信息中分析识别出控制信息,以便于执行S204,而不必再执行基于设备标识与语音信息进行比对之类的处理,所述后续采集到的语音信息是指在预设时间范围内采集到的语音信息,至于对预设时间范围外的语音信息,需要重新执行所述S202至S204的步骤。
拍摄设备的类型包括多种,在一个实施例中,如图4所示,拍摄设备400可以包括云台4012和设置在该云台4012上的摄像机4011,仅仅包括云台4012和摄像机4011的拍摄设备400作为一个类型,例如可以命名为第一类型,由于云台4012可转动,因此,可以实现跟拍。在此基础上,所述根据所述控制信息生成控制指令包括:若所述控制信息中包括跟拍指示信息,则生成跟拍控制指令,所述跟拍控制指令用于控制所述云台4012装置转动,并触发所述摄像机4011跟踪拍摄所述跟拍指示信息所包括的目标对象。该跟拍指示信息可以是指关键信息中一些与该类型的拍摄设备400对应的信息集合中某个用于表示跟拍的目标信息相同或相似的信息,例如,“拍我”、“拍狗”、“拍树”等等目标信息,当用户发出的语音信息中包括与这些目标信息相同或相似的跟拍指示信息时,即可认为基于关键信息确定的控制信息为跟拍指示信息,需要从拍摄到的图像中识别出其中的“我(发起语音信息的用户)”、“狗”、“树”,再基于图像识别实现对象跟踪,并持续控制摄像机4011进行跟踪拍摄。在一个实施例中,基于图像的跟踪拍摄可以采用现有技术实现。在一个实施例中,对于目标对象的识别,可以根据控制设备410发送给云台4012的位姿和云台4012的位姿确定出相对方位,从而跟踪拍摄发起语音信息的用户、其他任务或者所说的“狗”、“树”等目标对象,也可以通过不断转动云台4012直至从拍摄的图像中确定出一个人物(人脸特征或者身体特征识别)、或与指定的人物特征(人脸特征或者身体特征)相似的人物、或与指定“狗”、“树”等对象特征相似的对象,进而对识别得到的目标对象(发起语音信息的用户、或者其他用户、对象)实现跟踪拍摄。
在另一个实施例中,如图5所示,所述拍摄设备500包括无人机5001和设置在该无人机5001上的摄像机5002,仅仅包括无人机5001和摄像机5002的拍摄设备500作为一个类型,例如可以命名为第二类型,所述根据所述控制信息生成控制指令包括:若所述控制信息中包括跟拍指示信息,则生成跟拍控制指令,所述跟拍控制指令用于控制所述无人机5001飞行,并在飞行过程中通过所述摄像机5002跟踪拍摄所述跟拍指示信息所包括的目标对象。无人机5001更易于实现跟拍,控制设备510根据语音信息确定出需要对诸如上述提及的“我(发起语音信息的用户)”、“狗”、“树”等目标对象进行跟拍时,只需发送包括目标对象的跟拍指令给无人机5001,无人机5001便可自动执行飞行任务实现跟拍操作。其中,从语音信息中确定跟拍指示信息的方式可参考前述图4所对应实施例的相关内容的描述。
基于图像的跟踪拍摄可以由控制设备实现,也就是说,控制设备基于拍摄设备反馈的拍摄图像,进行图像识别和跟踪,持续发出控制指令控制云台转动或者无人机移动,以便于将上述提及的“发起语音信息的用户”、“狗”、“树”等目标对象始终保持在拍摄图像中的中间位置区域或者其他指定的图像位置区域中,实现对目标对象的跟拍。
本申请可以在监控到用户的语音后,基于预先获取到的设备标识来判断该用户语音是否是用来控制拍摄设备的控制语音,并在确定出用户语音是用于控制拍摄设备时,进一步再根据用户语音对拍摄设备进行拍摄控制,一方面能够明显去处一些不相干的语音,有效避免对拍摄设备的误操作,另一方面也能保证用户通过语音来控制拍摄设备进行拍照。并且,可以基于不同的拍摄设备的结构、类型,确定出不同的拍摄控制逻辑和控制方式,能够实现诸如跟拍等拍摄控制,极大地满足了用户对拍摄控制的自动化、智能化需求。
再请参见图6,是本发明实施例的另一种拍摄控制方法的流程示意图,本发明实施例的所述方法应用于拍摄设备,例如一些能够固定在某些位置上的摄像机等设备,该拍摄设备上设置了如麦克风等拾音装置或者能够外接如麦克风等拾音装置,用来采集摄像设备当前所处环境的语音,以便于根据采集到的环境语音来对拍摄进行控制,例如可以根据语音控制开始拍摄图像、或者拍摄视频、或者所述拍摄设备设置在云台上,这样可以控制拍摄设备跟踪拍摄某个用户在语音中指定的对象。在本发明实施例中,所述方法包括以下步骤。
S601:采集当前环境中的语音信息。可以实时或者周期性地开启语音采集功能,通过内置或者外接的麦克风等拾音装置来采集拍摄设备当前所处环境中的语音信息。
S602:若采集到语音信息,则根据为本拍摄设备设置的设备标识在所述语音信息所包含的内容数据中进行信息比对。具体的比对方式如前所述,本发明实施例不再赘述。
S603:如果信息比对的结果为所述内容数据中包括与所述设备标识匹配的匹配信息,则从所述语音信息中分析识别出控制信息。比对出匹配信息后,进一步识别控制信息的具体实现可参考前述实施例中相关内容的描述,本发明实施例不再赘述。
在一个实施例中,所述从所述语音信息中分析识别出控制信息可以包括:以所述匹配信息在所述语音信息中位置为参考位置,从所述语音信息中分析识别出关键信息;从识别出的关键信息中获取控制信息。进一步地,在一个可选的实施例中,所述从识别出的关键信息中获取控制信息可以包括:根据当前连接的拍摄设备的设备类型,确定目标信息集合;将识别出的各关键信息与目标信息集合中的各个目标信息进行比对;根据比对结果从关键信息中选择控制信息;其中,选择的控制信息所对应的字符与目标信息集合中的其中一个目标信息所对应的字符相同或满足预设的近似条件。
S604:根据所述控制信息生成用于控制所述拍摄设备拍摄影像。生成控制信息后如何控制拍摄设备可以参考前述实施例中相关内容的描述,本发明实施例不再赘述。
在一个实施例中,所述拍摄设备可以设置在一个云台中,例如设置在一个三轴云台或者单轴、或双轴云台上,拍摄设备与云台相连,能够控制该云台转动。所述根据所述控制信息生成控制指令可以包括:若所述控制信息中包括跟拍指示信息,则生成跟拍控制指令,所述跟拍控制指令用于控制所述云台装置转动,并跟踪拍摄所述跟拍指示信息所包括的目标对象。
在一个实施例中,所述拍摄设备还可以设置在一个可移动平台上,该可移动平台例如可以是无人机,拍摄设备与该可移动平台相连,能够对该可移动平台进行移动控制,所述根据所述控制信息生成控制指令可以包括:若所述控制信息中包括跟拍指示信息,则生成跟拍控制指令,所述跟拍控制指令用于控制所述可移动平台移动,并在移动过程中跟踪拍摄所述跟拍指示信息所包括的目标对象。在该实施例中,可移动平台与发出语音的用户之间的距离应该在一个合理的距离内,否则移动平台有可能采集不到环境中关于控制用户的语音。此时,移动平台可以继续执行前一语音的控制指令,例如继续跟拍目标,而用户则可以通过其他方式,例如可移动平台的遥控器来控制可移动平台返回或者不在执行相应的控制指令。
在一个实施例中,所述拍摄设备还可以为一个带有触摸显示屏的智能终端,在该触摸显示屏上能够显示用户操作界面,所述方法还可以包括:获取并显示用户操作界面;其中,所述用户操作界面上包括了接收用于对所述拍摄设备进行控制的用户操作的第一控制界面,和/或,用于接收语音信息以便于对所述拍摄设备进行语音控制的第二控制界面。
可以理解的是,本发明实施例相对于前述各个附图对应的实施例而言,不同之处仅仅在于相应的步骤、功能是直接在一个带有摄像头的拍摄设备上实现的,而这些步骤、功能的具体实现除了执行的主体可能不一致外,其他方式的具体实施方式可以相互利用。比如,对于上述提及的第一控制界面和第二控制界面,在前述实施例中主要控制设备上显示,而本发明实施例是直接在拍摄设备上显示的,在拍摄设备上显示这些用户界面的具体显示形式也可以参考图3所示,并且用户的操作方式也可以参考图3所对应内容的描述。
本申请可以在监控到用户的语音后,基于预先获取到的设备标识来判断该用户语音是否是用来控制拍摄设备的控制语音,并在确定出用户语音是用于控制拍摄设备时,进一步再根据用户语音对拍摄设备进行拍摄控制,一方面能够明显去处一些不相干的语音,有效避免对拍摄设备的误操作,另一方面也能保证用户通过语音来控制拍摄设备进行拍照。并且,可以基于不同的拍摄设备的结构、类型,确定出不同的拍摄控制逻辑和控制方式,能够实现诸如跟拍等拍摄控制,极大地满足了用户对拍摄控制的自动化、智能化需求。
再请参见图7,是本发明实施例的一种拍摄控制装置的结构示意图,本发明实施例的所述装置可以设置在用于对拍摄设备进行控制的控制设备中,所述控制设备例如可以是设置在智能手机、平板电脑、智能可穿戴设备等智能终端中,所述控制设备可以与拍摄设备相连,用于对拍摄设备进行控制。本发明实施例的所述装置也可以直接设置在一个拍摄设备中。本发明实施例的所述装置包括以下模块。
获取模块701,用于获取拍摄设备的设备标识;比对模块702,用于在采集到语音信息时,根据所述设备标识在所述语音信息所包含的内容数据中进行信息比对;处理模块703,用于在信息比对的结果为所述内容数据中包括与所述设备标识匹配的匹配信息时,从所述语音信息中分析识别出控制信息;根据所述控制信息生成控制指令,所述控制指令用于控制所述拍摄设备拍摄影像。
在一个实施例中,所述装置还可以包括:
识别模块704,用于识别拍摄设备的设备类型;
显示模块705,用于根据设备类型获取并显示用户操作界面;其中,所述用户操作界面上包括了接收用于对所述拍摄设备进行控制的用户操作的第一控制界面,和/或,用于接收语音信息以便于对所述拍摄设备进行语音控制的第二控制界面。
在一个实施例中,所述处理模块703,用于以所述匹配信息在所述语音信息中位置为参考位置,从所述语音信息中分析识别出关键信息;从识别出的关键信息中获取控制信息。
在一个实施例中,所述处理模块703,具体用于根据拍摄设备的设备类型,确定目标信息集合;将识别出的各关键信息与目标信息集合中的各个目标信息进行比对;根据比对结果从关键信息中选择控制信息;其中,选择的控制信息所对应的字符与目标信息集合中的其中一个目标信息所对应的字符相同或满足预设的近似条件。
在一个实施例中,所述拍摄设备包括云台装置和设置在该云台装置上的摄像机,所述处理模块703,具体用于若所述控制信息中包括跟拍指示信息,则生成跟拍控制指令,所述跟拍控制指令用于控制所述云台装置转动,以跟踪拍摄所述跟拍指示信息所包括的目标对象。
在一个实施例中,所述拍摄设备包括无人机和设置在该无人机上的摄像机,所述处理模块703,具体用于若所述控制信息中包括跟拍指示信息,则生成跟拍控制指令,所述跟拍控制指令用于控制所述无人机飞行,并在飞行过程中跟踪拍摄所述跟拍指示信息所包括的目标对象。
在一个实施例中,所述处理模块703,还用于在信息比对的结果为所述内容数据中包括与所述设备标识匹配的匹配信息之后,从后续采集到的应用信息中分析识别出控制信息。
本发明实施例中所述装置所包括的各个功能模块的具体实现可以参考前述实施例中相关内容的具体描述,在此不赘述。
本申请可以在监控到用户的语音后,基于预先获取到的设备标识来判断该用户语音是否是用来控制拍摄设备的控制语音,并在确定出用户语音是用于控制拍摄设备时,进一步再根据用户语音对拍摄设备进行拍摄控制,一方面能够明显去处一些不相干的语音,有效避免对拍摄设备的误操作,另一方面也能保证用户通过语音来控制拍摄设备进行拍照。并且,可以基于不同的拍摄设备的结构、类型,确定出不同的拍摄控制逻辑和控制方式,能够实现诸如跟拍等拍摄控制,极大地满足了用户对拍摄控制的自动化、智能化需求。
再请参见图8,是本发明实施例的一种控制设备的结构示意图,本发明实施例的所述控制设备具体可以是例如智能手机、平板电脑、智能可穿戴设备等智能终端。该控制设备包括:存储装置801、处理器802以及通信接口803,进一步地,该控制设备还可以根据需要包括用户接口804等其他结构。
所述存储装置801可以包括易失性存储器(volatile memory),例如随机存取存储器(random-access memory,RAM);存储装置801也可以包括非易失性存储器(non-volatilememory),例如快闪存储器(flash memory),固态硬盘(solid-state drive,SSD)等;存储装置801还可以包括上述种类的存储器的组合。
所述处理器802可以是中央处理器(central processing unit,CPU)。所述处理器802还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(application-specific integrated circuit,ASIC),可编程逻辑器件(programmable logic device,PLD)等。上述的PLD例如可以是现场可编程逻辑门阵列(field-programmable gate array,FPGA),通用阵列逻辑(generic array logic,GAL)等。
所述通信接口803可以是指WiFi接口、蓝牙接口等能与拍摄设备之间建立无线通信连接的接口,该通信接口803也可以是USB等有线接口。所述用户接口804则主要用于实现人机交互,该用户接口804例如是触摸显示屏,一方面能够为用户显示用户界面、相关控制按钮、收集到的数据等信息,另一方面能够接收用户的操作对拍摄设备中的摄像机、或云台、或无人机等手动控制。
在一个实施例中,所述存储装置801还用于存储程序指令。所述处理器802可以调用所述程序指令,实现如本申请前述实施例中所描述的拍摄控制方法。
具体的,所述处理器802,调用所述存储装置801中存储的程序指令,用于获取当前连接的拍摄设备的设备标识;若采集到语音信息,则根据所述设备标识在所述语音信息所包含的内容数据中进行信息比对;如果信息比对的结果为所述内容数据中包括与所述设备标识匹配的匹配信息,则从所述语音信息中分析识别出控制信息;根据所述控制信息生成控制指令,并通过所述通信模块将所述控制指令发送给当前连接的拍摄设备,所述控制指令用于控制所述拍摄设备拍摄影像。
在一个实施例中,所述处理器802,还用于识别当前连接的拍摄设备的设备类型;根据设备类型获取并显示用户操作界面;其中,所述用户操作界面上包括了接收用于对所述拍摄设备进行控制的用户操作的第一控制界面,和/或,用于接收语音信息以便于对所述拍摄设备进行语音控制的第二控制界面。
在一个实施例中,所述处理器802,用于以所述匹配信息在所述语音信息中位置为参考位置,从所述语音信息中分析识别出关键信息;从识别出的关键信息中获取控制信息。
在一个实施例中,所述处理器802,用于根据当前连接的拍摄设备的设备类型,确定目标信息集合;将识别出的各关键信息与目标信息集合中的各个目标信息进行比对;根据比对结果从关键信息中选择控制信息;其中,选择的控制信息所对应的字符与目标信息集合中的其中一个目标信息所对应的字符相同或满足预设的近似条件。
在一个实施例中,所述拍摄设备包括云台装置和设置在该云台装置上的摄像机,所述处理器802,用于若所述控制信息中包括跟拍指示信息,则生成跟拍控制指令,所述跟拍控制指令用于控制所述云台装置转动,并触发所述摄像机跟踪拍摄所述跟拍指示信息所包括的目标对象。
在一个实施例中,所述拍摄设备包括无人机和设置在该无人机上的摄像机,所述处理器802,用于若所述控制信息中包括跟拍指示信息,则生成跟拍控制指令,所述跟拍控制指令用于控制所述无人机飞行,并在飞行过程中通过所述摄像机跟踪拍摄所述跟拍指示信息所包括的目标对象。
在一个实施例中,所述处理器802,还用于在信息比对的结果为所述内容数据中包括与所述设备标识匹配的匹配信息之后,从后续采集到的应用信息中分析识别出控制信息。
本发明实施例中所述处理器802的具体实现可以参考前述实施例中相关内容的具体描述,在此不赘述。
本申请可以在监控到用户的语音后,基于预先获取到的设备标识来判断该用户语音是否是用来控制拍摄设备的控制语音,并在确定出用户语音是用于控制拍摄设备时,进一步再根据用户语音对拍摄设备进行拍摄控制,一方面能够明显去处一些不相干的语音,有效避免对拍摄设备的误操作,另一方面也能保证用户通过语音来控制拍摄设备进行拍照。并且,可以基于不同的拍摄设备的结构、类型,确定出不同的拍摄控制逻辑和控制方式,能够实现诸如跟拍等拍摄控制,极大地满足了用户对拍摄控制的自动化、智能化需求。
再请参见图9,是本发明实施例的一种拍摄设备的结构示意图,本发明实施例的所述拍摄设备包括摄像头901、供电模块等部件,还包括:处理器902和存储装置903。并可以根据需要包括一个用户接口904。该拍摄设备还可以包括一个语音采集模块,该语音采集模块可以是一个麦克风,或者为一个可以接收外部拾音模块输出的语音信息的模块。在本发明实施例中,以所述拍摄设备包括麦克风905为例进行说明。
所述存储装置903可以包括易失性存储器(volatile memory),例如RAM;存储装置903也可以包括非易失性存储器(non-volatile memory),例如快闪存储器(flashmemory),SSD等;存储装置903还可以包括上述种类的存储器的组合。所述处理器902可以是CPU,所述处理器902还可以进一步包括硬件芯片。上述硬件芯片可以是ASIC,PLD等。上述的PLD例如可以是FPGA,GAL等。
所述处理器902调用所述存储装置903中存储的程序指令,用于采集当前环境中的语音信息;若采集到语音信息,则根据为本拍摄设备设置的设备标识在所述语音信息所包含的内容数据中进行信息比对;如果信息比对的结果为所述内容数据中包括与所述设备标识匹配的匹配信息,则从所述语音信息中分析识别出控制信息;根据所述控制信息生成用于控制所述拍摄设备拍摄影像。
在一个实施例中,所述处理器902,还用于根据本拍摄设备的设备类型获取并显示用户操作界面;其中,所述用户操作界面上包括了接收用于对所述拍摄设备进行控制的用户操作的第一控制界面,和/或,用于接收语音信息以便于对所述拍摄设备进行语音控制的第二控制界面。该用户操作界面可以显示在上述的用户接口904中,该用户接口904具体可以是一个触摸显示屏。
在一个实施例中,所述处理器902,用于以所述匹配信息在所述语音信息中位置为参考位置,从所述语音信息中分析识别出关键信息;从识别出的关键信息中获取控制信息。
在一个实施例中,所述处理器902,用于根据本拍摄设备的设备类型,确定目标信息集合;将识别出的各关键信息与目标信息集合中的各个目标信息进行比对;根据比对结果从关键信息中选择控制信息;其中,选择的控制信息所对应的字符与目标信息集合中的其中一个目标信息所对应的字符相同或满足预设的近似条件。
在一个实施例中,所述拍摄设备设置在云台装置上,所述处理器902,用于若所述控制信息中包括跟拍指示信息,则生成跟拍控制指令,所述跟拍控制指令用于控制所述云台装置转动,并控制跟踪拍摄所述跟拍指示信息所包括的目标对象。
在一个实施例中,所述拍摄设备设置在移动平台上,例如设置在无人机上,所述处理器902,用于若所述控制信息中包括跟拍指示信息,则生成跟拍控制指令,所述跟拍控制指令用于控制所述移动平台移动,并在移动过程中控制跟踪拍摄所述跟拍指示信息所包括的目标对象。
在一个实施例中,所述处理器902,还用于在信息比对的结果为所述内容数据中包括与所述设备标识匹配的匹配信息之后,从后续采集到的应用信息中分析识别出控制信息。
本发明实施例中所述处理器的具体实现可参考前述实施例中相关内容的描述,在此不赘述。
本申请可以在监控到用户的语音后,基于预先获取到的设备标识来判断该用户语音是否是用来控制拍摄设备的控制语音,并在确定出用户语音是用于控制拍摄设备时,进一步再根据用户语音对拍摄设备进行拍摄控制,一方面能够明显去处一些不相干的语音,有效避免对拍摄设备的误操作,另一方面也能保证用户通过语音来控制拍摄设备进行拍照。并且,可以基于不同的拍摄设备的结构、类型,确定出不同的拍摄控制逻辑和控制方式,能够实现诸如跟拍等拍摄控制,极大地满足了用户对拍摄控制的自动化、智能化需求。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所揭露的仅为本发明部分实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (16)

1.一种拍摄控制方法,其特征在于,所述方法应用于控制设备,所述控制设备在与拍摄设备相连后,用于对所述拍摄设备进行控制,所述拍摄设备包括云台装置和设置在该云台装置上的摄像机,所述方法包括:
获取当前连接的拍摄设备的设备标识;
若采集到语音信息,则根据所述设备标识在所述语音信息所包含的内容数据中进行信息比对;
如果信息比对的结果为所述内容数据中包括与所述设备标识匹配的匹配信息,则从所述语音信息中分析识别出控制信息;
若所述控制信息中包括跟拍指示信息,则生成跟拍控制指令,并将所述跟拍控制指令发送给当前连接的拍摄设备,所述跟拍控制指令用于控制所述云台装置转动,并触发所述摄像机跟踪拍摄发起语音信息的用户。
2.如权利要求1所述的方法,其特征在于,还包括:
识别当前连接的拍摄设备的设备类型;
根据设备类型获取并显示用户操作界面;其中,所述用户操作界面上包括了接收用于对所述拍摄设备进行控制的用户操作的第一控制界面,和/或,用于接收语音信息以便于对所述拍摄设备进行语音控制的第二控制界面。
3.如权利要求1所述的方法,其特征在于,所述从所述语音信息中分析识别出控制信息,包括:
以所述匹配信息在所述语音信息中位置为参考位置,从所述语音信息中分析识别出关键信息;
从识别出的关键信息中获取控制信息。
4.如权利要求3所述的方法,其特征在于,所述从识别出的关键信息中获取控制信息,包括:
根据当前连接的拍摄设备的设备类型,确定目标信息集合;
将识别出的各关键信息与目标信息集合中的各个目标信息进行比对;
根据比对结果从关键信息中选择控制信息;其中,选择的控制信息所对应的字符与目标信息集合中的其中一个目标信息所对应的字符相同或满足预设的近似条件。
5.如权利要求1-4任一项所述的方法,其特征在于,所述拍摄设备包括无人机,所述跟拍控制指令还用于控制所述无人机跟踪所述发起语音信息的用户。
6.如权利要求1-4任一项所述的方法,其特征在于,还包括:
在信息比对的结果为所述内容数据中包括与所述设备标识匹配的匹配信息之后,从后续采集到的语音信息中分析识别出控制信息。
7.一种拍摄控制方法,其特征在于,应用于拍摄设备,所述拍摄设备包括云台装置和设置在该云台装置上的摄像机,所述方法包括:
采集当前环境中的语音信息;
若采集到语音信息,则根据为本拍摄设备设置的设备标识在所述语音信息所包含的内容数据中进行信息比对;
如果信息比对的结果为所述内容数据中包括与所述设备标识匹配的匹配信息,则从所述语音信息中分析识别出控制信息;
若所述控制信息中包括跟拍指示信息,则生成跟拍控制指令,所述跟拍控制指令用于控制所述云台装置转动,并触发所述摄像机跟踪拍摄发起语音信息的用户。
8.如权利要求7所述的方法,其特征在于,所述拍摄设备包括无人机,所述跟拍控制指令还用于控制所述无人机跟踪所述发起语音信息的用户。
9.一种控制设备,其特征在于,所述控制设备在与拍摄设备相连后,用于对所述拍摄设备进行控制,所述拍摄设备包括云台装置和设置在该云台装置上的摄像机,所述控制设备包括:存储装置、处理器以及通信接口,其中:
所述存储装置,用于存储程序指令;
所述处理器,调用所述存储装置中存储的程序指令,用于获取当前连接的拍摄设备的设备标识;若采集到语音信息,则根据所述设备标识在所述语音信息所包含的内容数据中进行信息比对;如果信息比对的结果为所述内容数据中包括与所述设备标识匹配的匹配信息,则从所述语音信息中分析识别出控制信息;若所述控制信息中包括跟拍指示信息,则生成跟拍控制指令,并将所述跟拍控制指令发送给当前连接的拍摄设备,所述跟拍控制指令用于控制所述云台装置转动,并触发所述摄像机跟踪拍摄发起语音信息的用户。
10.如权利要求9所述的控制设备,其特征在于,所述处理器,还用于识别当前连接的拍摄设备的设备类型;根据设备类型获取并显示用户操作界面;其中,所述用户操作界面上包括了接收用于对所述拍摄设备进行控制的用户操作的第一控制界面,和/或,用于接收语音信息以便于对所述拍摄设备进行语音控制的第二控制界面。
11.如权利要求9所述的控制设备,其特征在于,所述处理器,用于以所述匹配信息在所述语音信息中位置为参考位置,从所述语音信息中分析识别出关键信息;从识别出的关键信息中获取控制信息。
12.如权利要求11所述的控制设备,其特征在于,所述处理器,用于根据当前连接的拍摄设备的设备类型,确定目标信息集合;将识别出的各关键信息与目标信息集合中的各个目标信息进行比对;根据比对结果从关键信息中选择控制信息;其中,选择的控制信息所对应的字符与目标信息集合中的其中一个目标信息所对应的字符相同或满足预设的近似条件。
13.如权利要求9-12任一项所述的控制设备,其特征在于,所述拍摄设备包括无人机,所述跟拍控制指令还用于控制所述无人机跟踪所述发起语音信息的用户。
14.如权利要求9-12任一项所述的控制设备,其特征在于,还包括:
在信息比对的结果为所述内容数据中包括与所述设备标识匹配的匹配信息之后,从后续采集到的语音信息中分析识别出控制信息。
15.一种拍摄设备,其特征在于,包括:云台装置、设置在该云台装置上的摄像机、存储装置和处理器,其中:
所述存储装置,用于存储程序指令;
所述处理器,调用所述存储装置中存储的程序指令,用于采集当前环境中的语音信息;若采集到语音信息,则根据为本拍摄设备设置的设备标识在所述语音信息所包含的内容数据中进行信息比对;如果信息比对的结果为所述内容数据中包括与所述设备标识匹配的匹配信息,则从所述语音信息中分析识别出控制信息;若所述控制信息中包括跟拍指示信息,则生成跟拍控制指令,所述跟拍控制指令用于控制所述云台装置转动,并触发所述摄像机跟踪拍摄发起语音信息的用户。
16.如权利要求15所述的拍摄设备,其特征在于,所述拍摄设备包括无人机,所述跟拍控制指令还用于控制所述无人机跟踪所述发起语音信息的用户。
CN202111055851.2A 2019-05-15 2019-05-15 一种拍摄控制方法、装置及控制设备、拍摄设备 Pending CN113747069A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111055851.2A CN113747069A (zh) 2019-05-15 2019-05-15 一种拍摄控制方法、装置及控制设备、拍摄设备

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
PCT/CN2019/087115 WO2020227996A1 (zh) 2019-05-15 2019-05-15 一种拍摄控制方法、装置及控制设备、拍摄设备
CN202111055851.2A CN113747069A (zh) 2019-05-15 2019-05-15 一种拍摄控制方法、装置及控制设备、拍摄设备
CN201980001041.3A CN110313174B (zh) 2019-05-15 2019-05-15 一种拍摄控制方法、装置及控制设备、拍摄设备

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201980001041.3A Division CN110313174B (zh) 2019-05-15 2019-05-15 一种拍摄控制方法、装置及控制设备、拍摄设备

Publications (1)

Publication Number Publication Date
CN113747069A true CN113747069A (zh) 2021-12-03

Family

ID=68083724

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201980001041.3A Active CN110313174B (zh) 2019-05-15 2019-05-15 一种拍摄控制方法、装置及控制设备、拍摄设备
CN202111055851.2A Pending CN113747069A (zh) 2019-05-15 2019-05-15 一种拍摄控制方法、装置及控制设备、拍摄设备

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201980001041.3A Active CN110313174B (zh) 2019-05-15 2019-05-15 一种拍摄控制方法、装置及控制设备、拍摄设备

Country Status (4)

Country Link
US (2) US10971152B2 (zh)
JP (1) JP6949974B2 (zh)
CN (2) CN110313174B (zh)
WO (1) WO2020227996A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114987779A (zh) * 2019-11-05 2022-09-02 深圳市道通智能航空技术股份有限公司 镜头模组的控制方法、装置、飞行器、飞行系统及介质
CN111083407A (zh) * 2019-11-21 2020-04-28 北京文香信息技术有限公司 一种录播方法、装置及设备
CN112825030B (zh) * 2020-02-28 2023-09-19 腾讯科技(深圳)有限公司 一种应用程序控制方法、装置、设备及存储介质
WO2022204925A1 (zh) * 2021-03-30 2022-10-06 华为技术有限公司 一种图像的获取方法以及相关设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6226422B1 (en) * 1998-02-19 2001-05-01 Hewlett-Packard Company Voice annotation of scanned images for portable scanning applications
CN108375986A (zh) * 2018-03-30 2018-08-07 深圳市道通智能航空技术有限公司 无人机的控制方法、装置及终端
CN108702458A (zh) * 2017-11-30 2018-10-23 深圳市大疆创新科技有限公司 拍摄方法和装置
CN109445460A (zh) * 2018-11-07 2019-03-08 常州信息职业技术学院 一种基于视觉传达的无人机引导系统

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6289140B1 (en) * 1998-02-19 2001-09-11 Hewlett-Packard Company Voice control input for portable capture devices
US7697827B2 (en) * 2005-10-17 2010-04-13 Konicek Jeffrey C User-friendlier interfaces for a camera
CN101465960B (zh) * 2007-12-19 2011-07-27 深圳富泰宏精密工业有限公司 具有语音控制功能的摄像装置及其使用方法
CN104683677B (zh) * 2013-11-26 2019-06-18 深圳富泰宏精密工业有限公司 为照片增加语音描述的系统及方法
WO2015200209A1 (en) * 2014-06-23 2015-12-30 Nixie Labs, Inc. Wearable unmanned aerial vehicles, launch- controlled unmanned aerial vehicles, and associated systems and methods
CN104853101A (zh) * 2015-05-18 2015-08-19 牟肇健 基于语音的智能化即时命名拍照技术
CN205451432U (zh) * 2015-11-30 2016-08-10 无锡觅睿恪科技有限公司 无人机用声控遥控器
CN106373567A (zh) * 2016-08-28 2017-02-01 广安奥海通讯电子科技有限公司 一种语音控制拍照的拍照方法和装置
CN106682091A (zh) * 2016-11-29 2017-05-17 深圳市元征科技股份有限公司 一种无人机控制方法及装置
WO2018214068A1 (zh) * 2017-05-24 2018-11-29 深圳市大疆创新科技有限公司 飞行控制方法、设备、机器可读存储介质以及系统
CN108154878A (zh) * 2017-12-12 2018-06-12 北京小米移动软件有限公司 控制监控设备的方法及装置
TWI648519B (zh) * 2018-01-05 2019-01-21 易圖科技股份有限公司 無人機偵測系統及方法
CN108737719A (zh) * 2018-04-04 2018-11-02 深圳市冠旭电子股份有限公司 摄像头拍摄控制方法、装置、智能设备及存储介质
CN109559743A (zh) * 2018-12-05 2019-04-02 嘉兴行适安车联网信息科技有限公司 基于Android系统的车载即时通讯工具信息分享方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6226422B1 (en) * 1998-02-19 2001-05-01 Hewlett-Packard Company Voice annotation of scanned images for portable scanning applications
CN108702458A (zh) * 2017-11-30 2018-10-23 深圳市大疆创新科技有限公司 拍摄方法和装置
CN108375986A (zh) * 2018-03-30 2018-08-07 深圳市道通智能航空技术有限公司 无人机的控制方法、装置及终端
CN109445460A (zh) * 2018-11-07 2019-03-08 常州信息职业技术学院 一种基于视觉传达的无人机引导系统

Also Published As

Publication number Publication date
US20210233529A1 (en) 2021-07-29
US20200365149A1 (en) 2020-11-19
JP2021526743A (ja) 2021-10-07
CN110313174B (zh) 2021-09-28
US10971152B2 (en) 2021-04-06
CN110313174A (zh) 2019-10-08
WO2020227996A1 (zh) 2020-11-19
JP6949974B2 (ja) 2021-10-13

Similar Documents

Publication Publication Date Title
CN110313174B (zh) 一种拍摄控制方法、装置及控制设备、拍摄设备
US10587790B2 (en) Control method for photographing using unmanned aerial vehicle, photographing method using unmanned aerial vehicle, mobile terminal, and unmanned aerial vehicle
JP6388706B2 (ja) 無人航空機の撮影制御方法及び撮影制御装置、電子デバイス
US20230175864A1 (en) Method, device and system for processing a flight task
US10068130B2 (en) Methods and devices for querying and obtaining user identification
CN107336243B (zh) 基于智能移动终端的机器人控制系统及控制方法
CN111182205B (zh) 拍摄方法、电子设备及介质
CN111416940A (zh) 拍摄参数处理方法及电子设备
US20180063421A1 (en) Wearable camera, wearable camera system, and recording control method
EP3989118A1 (en) Target tracking method and system, readable storage medium and moving platform
WO2020024104A1 (zh) 返航控制方法、装置及设备
JP7027601B2 (ja) ロボット制御装置、ロボット制御方法及びロボット
CN111432195A (zh) 一种图像拍摄方法及电子设备
CN108924413B (zh) 拍摄方法及移动终端
CN111123959A (zh) 基于手势识别的无人机控制方法及采用该方法的无人机
CN112204943B (zh) 拍摄方法、设备、系统及计算机可读存储介质
CN116762354A (zh) 影像拍摄方法、控制装置、可移动平台和计算机存储介质
CN112449116B (zh) 图像处理方法、装置、电子设备和可读存储介质
CN111065982A (zh) 一种控制方法、设备、系统及存储介质
CN116798425A (zh) 语音控制车机方法、装置、电子设备、可读存储介质及车辆
CN110134745A (zh) 一种查询路线信息的方法、装置和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20211203

WD01 Invention patent application deemed withdrawn after publication