CN106331466A - 一种通过语音指令快速定位拍照的方法及拍照系统 - Google Patents

一种通过语音指令快速定位拍照的方法及拍照系统 Download PDF

Info

Publication number
CN106331466A
CN106331466A CN201510385255.9A CN201510385255A CN106331466A CN 106331466 A CN106331466 A CN 106331466A CN 201510385255 A CN201510385255 A CN 201510385255A CN 106331466 A CN106331466 A CN 106331466A
Authority
CN
China
Prior art keywords
information
camera
main body
photo
degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510385255.9A
Other languages
English (en)
Other versions
CN106331466B (zh
Inventor
周勇俊
卢江南
陈明修
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yutou Technology Hangzhou Co Ltd
Original Assignee
Yutou Technology Hangzhou Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yutou Technology Hangzhou Co Ltd filed Critical Yutou Technology Hangzhou Co Ltd
Priority to CN201510385255.9A priority Critical patent/CN106331466B/zh
Priority to PCT/CN2016/086057 priority patent/WO2017000793A1/zh
Priority to TW105120446A priority patent/TWI599225B/zh
Publication of CN106331466A publication Critical patent/CN106331466A/zh
Priority to HK17105094.5A priority patent/HK1231654A1/zh
Application granted granted Critical
Publication of CN106331466B publication Critical patent/CN106331466B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Studio Devices (AREA)
  • Image Analysis (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Manipulator (AREA)

Abstract

本发明提供了一种通过语音指令快速定位拍照的方法及拍照系统,包括步骤:首先,机器人获取语音信息,对所述语音信息进行处理并识别特征信息,提取所述特征信息;然后判断所述特征信息是否为自拍信息,如果是,判定声音发出位置为拍照主体并识别所述拍照主体的位置,否则,根据所述特征信息,通过转动设备转动相机使得所述相机在360度或180度或90度的空间内拍摄一组参考照片;最后对所述拍照主体拍摄照片。通过所述通过语音指令快速定位拍照方法和所述拍照系统,能够通过语音指令快速识别拍照主体,并调整拍照的最佳位置。

Description

一种通过语音指令快速定位拍照的方法及拍照系统
技术领域
本发明涉及拍照系统技术领域,尤其涉及一种通过语音指令快速定位拍照的方法及拍照系统。
背景技术
随机技术的发展,相机或者具有相机功能的电子产品越来越普及,利用相机或者具有相机功能的电子产品来拍摄各种生活照片,也是大多数人都有过的经验。但是目前市面上具有拍照功能的电子产品都需要手动进行调整拍照的最佳位置,这样在调整拍照的最佳位置会花费很多的时间。
发明内容
针对上述技术问题,本申请提供了一种通过语音指令快速定位拍照的方法,包括步骤:
S1:机器人获取语音信息,对所述语音信息进行处理并识别特征信息,提取所述特征信息,执行S2;
S2:判断所述特征信息是否为自拍信息,如果是,执行S3,否则,执行S4;
S3:判定所述语音信息发出位置为拍照主体,识别所述拍照主体的位置,执行S5;
S4:根据所述特征信息,通过转动设备转动相机使得所述相机在360度或180度或90度的空间内拍摄一组参考照片,识别所述拍照主体的位置,执行S5;
S5:拍摄照片。
较佳的,所述特征信息包括自拍信息和/或色彩信息和/或方位信息和/或装饰信息。
较佳的,所述步骤S5包括步骤:
S51:所述转动设备转动所述相机使得所述拍照主体在照片中的水平线和垂直线正确;
S52:将所述拍照主体放在位于画面三分之一处;
S53:定位出所述拍照主体脸部在所述相机画面中的位置,并进行自动对焦;
S54:接收用户发出的确定拍摄指令,进行拍摄。
较佳的,在所述步骤S52中,利用人脸检测技术和所述相机的缩放功能,将所述拍照主体放在位于画面三分之一处。
较佳的,在所述步骤S53中,利用人脸识别技术,定位出所述拍照主体脸部在所述相机画面中的位置。
较佳的,所述步骤S4包括步骤:
S41:判断所述特征信息是否包括所述方位信息,如果没有执行S42,否则执行S43;
S42:所述转动设备转动所述相机,使得所述相机在水平和垂直的360度空间内拍摄一组参考照片,执行S44;
S43:所述转动设备转动所述相机,在180度或者90度空间中拍摄一组参考照片;
S44:提取所述参考照片的图片特征信息,与所述色彩信息和/或所述装饰信息进行匹配,识别所述拍照主体的位置。
较佳的,所述步骤S44包括步骤:
S441:判断所述方位信息是否为第一方位信息,如果是,执行步骤S442,否则,执行步骤S443;
S442:所述转动设备转动所述相机,在与所述方位信息对应的180度空间中拍摄一组参考照片,执行S44;
S443:所述转动设备转动所述相机,在与所述方位信息对应的90度空间中拍摄一组参考照片,执行S44。
较佳的,所述转动设备通过转动功能技术转动所述相机。
较佳的,在所述步骤S3中,利用声音定位技术定位所述拍照主体。
本发明还提供了一种拍照系统,用以实施所述的通过语音指令快速定位拍照方法,所述拍照系统包括所述机器人、所述转动设备和所述相机,还包括:
语音获取模块,获取所述语音信息,并对所述语音信息进行处理,自动识别所述语音信息中的所述特征信息,并提取所述特征信息;
特征判断模块,与所述语音获取模块连接,判断所述特征信息是否为自拍信息;
自拍定位模块,与所述特征判断模块连接,判定声音发出位置为所述拍照主体;
转动模块,与所述特征模块连接,向所述转动设备发出所述相机转动360度或180度或90度的信息;
拍摄模块,与所述自拍定位模块和所述转动模块连接,向所述相机发出拍摄照片信息。
较佳的,所述转动模块包括:
方位处理单元,判断所述特征信息是否包括所述方位信息;
第一转动单元,控制所述转动设备转动所述相机,使得所述相机在水平和垂直的360度空间内拍摄一组参考照片;
第二转动单元,控制所述转动设备转动所述相机,使得所述相机在180度或者90度空间中拍摄一组参考照片;
识别单元,提取所述参考照片的图片特征信息,与所述色彩信息和/或装饰信息进行匹配,识别所述拍照主体的位置。
较佳的,所述第二转动单元包括:
方位判定子单元,判断所述方位信息是否为第一方位信息;
第一拍照子单元,转动相机,在与所述方位信息对应的180度空间中拍摄一组参考照片;
第二拍照子单元,转动相机,在与所述方位信息对应的90度空间中拍摄一组参考照片。
较佳的,所述拍摄模块包括:
主体定位子单元,控制所述转动设备转动所述相机使得所述拍照主体在照片中的水平线和垂直线正确;
人脸检测子单元,利用人脸检测技术和所述相机的缩放功能,将所述拍照主体放在位于画面三分之一处;
人脸识别子单元,利用人脸识别技术,定位出所述人脸在所述相机画面中的位置,对所述人脸所在位置进行自动对焦;
主体拍摄子单元,接收用户发出的确定拍摄指令,控制所述相机拍摄照片。
综上所述,由于采用了上述技术方案,本专利申请记载了一种通过语音指令快速定位拍照的方法及拍照系统,其有益效果有:通过所述通过语音指令快速定位拍照方法和所述拍照系统,能够通过语音指令快速识别拍照主体,并调整拍照的最佳位置;利用具有转动功能技术的转动设备来控制相机,使得相机的转动更加灵活方便,有利于提高识别拍照主体的效率;采用声音定位技术,在自拍时能够快速定位拍摄主体;采用人脸检测和人脸识别技术,有助于提高拍摄质量。
附图说明
图1是本发明一种通过语音指令快速定位拍照的方法的流程图一;
图2是本发明一种通过语音指令快速定位拍照的方法的流程图二;
图3是本发明一种通过语音指令快速定位拍照的方法的流程图三;
图4是本发明一种通过语音指令快速定位拍照的方法的流程图四;
图5是本发明一种拍照系统的结构示意图一;
图6是本发明一种拍照系统的结构示意图二;
图7是本发明一种拍照系统的结构示意图三;
图8是本发明一种拍照系统的结构示意图四;
图9是本发明中实施例二的方法流程图;
图10是本发明中实施例三的方法流程图;
图11是本发明中实施例四的方法流程图。
具体实施方式
下面结合附图对本发明的具体实施方式作进一步的说明。
实施例一
本申请中提供了一种通过语音指令快速定位拍照的方法。具体而言,如图1所示,所述快速定位拍照的方法包括步骤:
S1:机器人1获取语音信息,并对所述语音信息进行处理,自动识别语音信息中的特征信息,并提取所述特征信息,执行S2;
S2:判断所述特征信息是否为自拍信息,如果是,执行S3,否则,执行S4;
S3:机器人1判定声音发出位置为拍照主体,执行S5;
S4:机器人1根据所述特征信息,转动相机3使得相机3在360度和/或180度和/或90度的空间内拍摄一组参考照片,识别拍照主体的位置,执行S5;
S5:拍摄照片。
其中,在步骤S1中机器人1通过自动语音识别技术,对获取的语音信息进行处理并提取所述特征信息,所述特征信息至少包括自拍信息和/或色彩信息和/或方位信息和/或装饰信息。
在步骤S3中,机器人1采用声音定位技术定位发出自拍信息这一特征信息的主体,并判定该主体即为拍摄主体。即当用户像机器人1发出拍照指令为“给我拍一张照片”时,机器人1通过自动语音识别技术识别出特征信息自拍信息,并通过声音定位技术定位发出该特征信息的主体,判断该主体为拍摄主体,并对该主体进行拍照。
如图2所示,在步骤S4中,机器人1根据所述特征信息,转动相机3使得相机3在360度和/或180度和/或90度的空间内拍摄一组参考照片,识别拍照主体的位置,其中,,机器人1通过操控一具有转动功能技术的转动设备2可以将所述相机3在水平和垂直的360度空间内进行转动。在所述步骤S4中,具体包括以下步骤:
S41:判断所述特征信息是否包括方位信息,如果没有执行S42,否则执行S43;
S42:转动相机3,使得相机3在水平和垂直的360度空间内拍摄一组参考照片,执行S44;
S43:转动相机3,在180度或者90度空间中拍摄一组参考照片,执行S44;
S44:提取所述参考照片的图片特征信息,与所述色彩信息和/或装饰信息进行匹配,识别拍摄主体的位置。
在所述步骤S41中,所述方位信息包括第一方位信息和第二方位信息,所述第一方位信息包括:“左”、“右”、“上”、“下”,所述第二方位信息包括:“左上”、“左下”、“右上”以及“右下”。在步骤S44中,如果首先利用物体识别图像技术对所述参考照片进行分类,并提取出参考照片中各个物体的图片特征信息,之后将所述图片特征信息与色彩信息和/或装饰信息一一进行比对,当出现与色彩信息和/或装饰信息相同的图片特征信息时,确定具有该图片特征信息所在的图片为拍照主体所在照片,从而确定出拍照主体所在的位置。其中,所述色彩信息包括“红”、“橙”、“黄”、“绿”、“青”等色彩信息,所述装饰信息包括“眼镜”、“帽子”、“项链”等信息。
如图3所示,在步骤S5中,确定了拍照主体所在位置后,对所述拍照主体进行拍照。
具体包括步骤:
S51:利用转动设备2转动相机3使得拍照主体在照片中的水平线和垂直线正确;
S52:利用人脸检测技术和相机3的缩放功能,将所述拍照主体放在位于画面三分之一处;
S53:利用人脸识别技术,定位出人脸在相机3画面中的位置,对人脸所在位置进行自动对焦;
S54:接收用户发出的确定拍摄指令,进行拍摄。
在步骤S52中,将所述主体放在位于画面三分之一处,也可以为在画面的三分之一左右的位置处,即所述主体的放置位置并不局限与在所述画面的三分之一处,也可以在其它比例的位置。在步骤S54中,相机3接收用户发出的确定拍摄指令,并进行拍照,这里的确定拍摄指令可以为语音指令,也可以为用户通过相机3上的拍摄按键发出的确定拍摄指令。当所述确定拍摄指令为语音指令时,机器人1接收该语音指令并对所述指令进行分析,当断定该指令为正确的确定拍摄指令时,向相机3发出拍摄信息,相机3接收所述拍摄信息并进行拍摄。
如图4所示,在步骤S43中,机器人1转动相机3,在180度或者90度空间中拍摄一组参考照片,这里具体包括步骤:
S431:判断所述方位信息是否为第一方位信息,如果是,执行步骤S442,否则,执行步骤S443;
S432:转动相机3,相应的在特征信息发出位置的左边或右边或上面或下面的180度空间中拍摄一组参考照片,执行S44;
S433:转动相机3,相应的在特征信息发出位置的左上方或左下方或右上方或右下方的90度空间中拍摄一组参考照片,执行S44。
工作时,用户向机器人1发出拍照指令后,该指令为语音信息,所述机器人1接收所述语音信息并进行处理,提取所述语音信息中所包含的特征信息。当所述特征信息为自拍信息时,通过转动设备2转动相机3,使得相机3在360度的空间内拍摄一组参考照片,识别出拍照主体的位置;当所述特征信息为“左”、“右”、“上”、“下”中的一个,相应的在特征信息发出位置的左边或右边或上面或下面的180度空间中拍摄一组参考照片;当所述特征信息为“左上”、“左下”、“右上”、“右下”中的一个,转动设备2转动所述相机3,相应的在特征信息发出位置的左上方或左下方或右上方或右下方的90度空间中拍摄一组参考照片。后两种情况下,提取所述参考照片的图片特征信息,与所述色彩信息和/或装饰信息进行匹配,识别拍照主体的位置。
在识别了拍照主体后,所述转动设备2转动所述相机3使得拍照主体在照片中的水平线和垂直线正确,利用人脸检测技术和相机3的缩放功能,将所述拍照主体放在位于画面三分之一处;
再利用人脸识别技术,定位出人脸在所述相机3画面中的位置,对人脸所在位置进行自动对焦;最好,机器人1接收用户发出的确定拍摄指令,进行拍摄。
图5示出了根据本发明一个实施例的拍照系统的结构示意图一。图5所示的拍照系统,用于执行图1所示的通过语音指令快速定位拍照方法。如图5所示,所述拍照系统包括一机器人1、一转动设备2和一相机3,其中所述机器人1包括语音获取模块11,获取语音信息,并对所述语音信息进行处理,自动识别语音信息中的特征信息,并提取所述特征信息。
所述机器人1还包括一特征判断模块12,用于判断所述特征信息是否为自拍信息。所述特征判断模块12还与自拍定位模块13相连,所述自拍定位模块13用于利用声音定位技术判定声音发出位置为拍照主体。此外所述机器人1还包括转动模块14,所述转动模块14向所述转动设备2发出相机3转动360度和/或180度和/或90度的信息。所述转动模块14与拍摄模块15相连,所述拍摄模块15向所述相机3发出拍摄照片信息。
如图6所示,所述转动模块14包括:
方位处理单元141,判断所述特征信息是否包括方位信息;
第一转动单元142,与所述方位处理单元141相连,控制所述转动设备2转动所述相机3,使得所述相机3在水平和垂直的360度空间内拍摄一组参考照片;
第二转动单元143,与所述方位处理单元141,控制所述转动设备2转动所述相机3,使得所述相机3在180度或者90度空间中拍摄一组参考照片;
识别单元144,分别与第一转动单元142和所述第二转动单元143相连接,提取所述参考照片的图片特征信息,与所述色彩信息和/或装饰信息进行匹配,识别拍摄主体的位置。
如图7所示,所述第二转动单元143包括:
方位判定子单元1431,与所述方位处理单元141相连,判断所述方位信息是否为第一方位信息;
第一拍照子单元1432,与所述方位判定子单元1431和所述识别单元144相连,转动相机3,在相应的在特征信息发出位置的左边或右边或上面或下面的180度空间中拍摄一组参考照片;
第二拍照子单元1433,与所述方位判定子单元1431和所述识别单元144相连,转动相机3,在相应的在特征信息发出位置的左边或右边或上面或下面的90度空间中拍摄一组参考照片。
如图8所示,所述拍摄模块15包括:
主体定位子单元,控制所述转动设备2转动相机3使得所述拍照主体在照片中的水平线和垂直线正确;
人脸检测子单元,利用人脸检测技术和所述相机3的缩放功能,将所述拍照主体放在位于画面三分之一处;
人脸识别子单元,利用人脸识别技术,定位出人脸在所述相机3画面中的位置,对所述人脸所在位置进行自动对焦;
主体拍摄子单元,接收用户发出的确定拍摄指令,控制所述相机3拍摄照片。
通过所述通过语音指令快速定位拍照方法和所述拍照系统,能够通过语音指令快速识别拍照主体,并调整拍照的最佳位置。
实施例二
根据上述实施例提供的通过语音指令快速定位拍照的方法,本实施例对所述方法进行了改进。
如图9所示,在本实施例中,用户发出“给我拍一张照片”拍照指令,所述机器人1接收该指令并进行处理,提取特征后发现特征信息中包括自拍信息,确定拍照主体位置并进行拍摄。具体步骤包括:
S01:机器人1获取语音信息,对所述语音信息进行处理并识别特征信息,提取所述特征信息自拍信息;
S02:判定声音发出位置为拍照主体;
S03:所述转动设备2转动所述相机3使得拍照主体在照片中的水平线和垂直线正确;
S04:将所述拍照主体放在位于画面三分之一处;
S05:定位出人脸在所述相机3画面中的位置,对人脸所在位置进行自动对焦;
S06:接收用户发出的确定拍摄指令,进行拍摄。
由于在步骤S01中确定出特征信息自拍信息,通过声音定位技术,确定声音发出的位置即为拍照主体所在位置。在本实施例中,用户仅需要发出类似于“给我拍一张照片”的拍照指令,机器人1就能够自动提取出特征信息自拍信息,完成自拍功能。这种方式操作简单,利用声音定位技术和转动设备2,解决了自拍过程中需要用户自动对准相机3的问题。
实施例三
根据上述实施例提供的通过语音指令快速定位拍照的方法,本实施例对所述方法进行了近一步的改进。
如图10所示,在本实施例中,用户发出“给穿红色衣服的女孩拍一张照片”,所述机器人1接收该指令并进行处理,提取特征后发现特征信息中包括色彩信息“红色”,机器人1转动所述转动设备2,在水平和垂直的360度空间内拍摄一组参考照片,从所述参考照片中确定拍照主体,并进行拍摄。具体步骤包括:
S11:机器人1获取语音信息,对所述语音信息进行处理并识别特征信息,提取所述色彩信息“红色”;
S12:所述转动设备2转动所述相机3,使得所述相机3在水平和垂直的360度空间内拍摄一组参考照片;
S13:提取所述参考照片的图片特征信息,与所述色彩信息进行匹配,识别拍照主体的位置;
S14:所述转动设备2转动所述相机3使得拍照主体在照片中的水平线和垂直线正确;
S15:将所述拍照主体放在位于画面三分之一处;
S16:定位出人脸在所述相机3画面中的位置,对人脸所在位置进行自动对焦;
S17:接收用户发出的确定拍摄指令,进行拍摄。
由于在步骤S11中,提取出了色彩信息“红色”,但是并未发现出现方位信息,那么就需要在水平和垂直的360度空间内拍摄一组参考照片,对这组照片进行特征提取,并将提取的特征一一的与S11中提取的色彩信息进行比对,如果出现相同的色彩信息,那么就能够判断出拍照主体所在位置。这种操作方式,当用户的命令中仅含有色彩信息时,机器人1也能够快速的确定拍照主体的位置,准确的实现拍照功能。
实施例四
根据上述实施例提供的通过语音指令快速定位拍照的方法,本实施例对所述方法进行了近一步的改进。
如图11所示,在本实施例中,用户发出“给穿左边穿红色衣服的女孩拍一张照片”,所述机器人1接收该指令并进行处理,提取特征后发现特征信息中包括第一方位信息“左”和色彩信息“红色”,机器人1转动所述转动设备2,在左边的180度空间内拍摄一组参考照片,并通过色彩信息“红色”从所述参考照片中确定拍照主体,并进行拍摄。具体步骤包括:
S21:机器人1获取语音信息,对所述语音信息进行处理并识别特征信息,提取所述方位信息“左”和色彩信息“红色”;
S22:所述转动设备2转动所述相机3,使得所述相机3在左边的180度空间内拍摄一组参考照片;
S23:提取所述参考照片的图片特征信息,与所述色彩信息“红色”进行匹配,识别拍照主体的位置;
S24:所述转动设备2转动所述相机3使得拍照主体在照片中的水平线和垂直线正确;
S25:将所述拍照主体放在位于画面三分之一处;
S26:定位出人脸在所述相机3画面中的位置,对人脸所在位置进行自动对焦;
S27:接收用户发出的确定拍摄指令,进行拍摄。
由于在步骤21中,提取出了方位信息“左”和色彩信息“红色”,那么就仅需要在左侧180度空间内拍摄一组参考照片,对这组照片进行特征提取,并将提取的特征一一的与S11中提取的色彩信息进行比对,如果出现相同的色彩信息,那么就能够判断出拍照主体所在位置。这种操作方式,并不需要在360度空间内拍摄参考照片,仅需要与所述方位信息对应的180度空间内拍摄参考照片,降低了确定拍照主体的时间,也提高了准确度。
以上所述仅为本发明较佳的实施例,并非因此限制本发明的实施方式及保护范围,对于本领域技术人员而言,应当能够意识到凡运用本发明说明书及图示内容所做出的等同替换和显而易见的变化所得到的方案,均应当包含在本发明的保护范围内。

Claims (13)

1.一种通过语音指令快速定位拍照的方法,其特征在于,包括步骤:
S1:机器人获取语音信息,对所述语音信息进行处理并识别特征信息,提取所述特征信息,执行S2;
S2:判断所述特征信息是否为自拍信息,如果是,执行S3,否则,执行S4;
S3:判定所述语音信息发出位置为拍照主体,并识别所述拍照主体的位置,执行S5;
S4:根据所述特征信息,通过转动设备转动相机使得所述相机在360度或180度或90度的空间内拍摄一组参考照片,识别所述拍照主体的位置,执行S5;
S5:对所述拍照主体拍摄照片。
2.根据权利要求1所述的通过语音指令快速定位拍照方法,其特征在于,所述特征信息包括自拍信息和/或色彩信息和/或方位信息和/或装饰信息。
3.根据权利要求1所述的通过语音指令快速定位拍照方法,其特征在于,步骤S5包括:
S51:所述转动设备转动所述相机使得所述拍照主体在照片中的水平线和垂直线正确;
S52:将所述拍照主体放在位于画面三分之一处;
S53:定位出所述拍照主体脸部在所述相机画面中的位置,并进行自动对焦;
S54:接收用户发出的确定拍摄指令,进行拍摄。
4.根据权利要求3所述的通过语音指令快速定位拍照方法,其特征在于,在步骤S52中,利用人脸检测技术和所述相机的缩放功能,将所述拍照主体放在位于画面三分之一处。
5.根据权利要求4所述的通过语音指令快速定位拍照方法,其特征在于,在步骤S53中,利用人脸识别技术,定位出所述拍照主体脸部在所述相机画面中的位置。
6.根据权利要求1所述的通过语音指令快速定位拍照方法,其特征在于,步骤S4包括:
S41:判断所述特征信息是否包括所述方位信息,如果没有执行S42,否则执行S43;
S42:所述转动设备转动所述相机,使得所述相机在水平和垂直的360度空间内拍摄一组参考照片,执行S44;
S43:所述转动设备转动所述相机,在180度或者90度空间中拍摄一组参考照片;
S44:提取所述参考照片的图片特征信息,与所述色彩信息和/或所述装饰信息进行匹配,识别所述拍照主体的位置。
7.根据权利要求6所述的通过语音指令快速定位拍照方法,其特征在于,步骤S44包括步骤:
S441:判断所述方位信息是否为第一方位信息,如果是,执行S442,否则,执行步骤S443;
S442:所述转动设备转动所述相机,在与所述方位信息对应的180度空间中拍摄一组参考照片,执行S44;
S443:所述转动设备转动所述相机,在与所述方位信息对应的90度空间中拍摄一组参考照片,执行S44。
8.根据权利要求7所述的通过语音指令快速定位拍照方法,其特征在于,所述转动设备通过转动功能技术转动所述相机。
9.根据权利要求1所述的通过语音指令快速定位拍照方法,其特征在于,在步骤S3中,利用声音定位技术定位所述拍照主体。
10.一种拍照系统,其特征在于,所述拍照系统包括所述机器人、所述转动设备和所述相机,还包括:
语音获取模块,获取所述语音信息,并对所述语音信息进行处理,自动识别所述语音信息中的所述特征信息,并提取所述特征信息;
特征判断模块,与所述语音获取模块连接,判断所述特征信息是否为自拍信息;
自拍定位模块,与所述特征判断模块连接,判定声音发出位置为所述拍照主体;
转动模块,与所述特征模块连接,向所述转动设备发出所述相机转动360度或180度或90度的信息;
拍摄模块,与所述自拍定位模块和所述转动模块连接,向所述相机发出拍摄照片信息。
11.如权利要求10所述的拍照系统,其特征在于,所述转动模块包括:
方位处理单元,判断所述特征信息是否包括所述方位信息;
第一转动单元,控制所述转动设备转动所述相机,使得所述相机在水平和垂直的360度空间内拍摄一组参考照片;
第二转动单元,控制所述转动设备转动所述相机,使得所述相机在180度或者90度空间中拍摄一组参考照片;
识别单元,提取所述参考照片的图片特征信息,与所述色彩信息和/或装饰信息进行匹配,识别所述拍照主体的位置。
12.如权利要求11所述的拍照系统,其特征在于,所述第二转动单元包括:
方位判定子单元,判断所述方位信息是否为第一方位信息;
第一拍照子单元,转动相机,在与所述方位信息对应的180度空间中拍摄一组参考照片;
第二拍照子单元,转动相机,在与所述方位信息对应的90度空间中拍摄一组参考照片。
13.如权利要求10所述的拍照系统,其特征在于,所述拍摄模块包括:
主体定位子单元,控制所述转动设备转动所述相机使得所述拍照主体在照片中的水平线和垂直线正确;
人脸检测子单元,利用人脸检测技术和所述相机的缩放功能,将所述拍照主体放在位于画面三分之一处;
人脸识别子单元,利用人脸识别技术,定位出所述人脸在所述相机画面中的位置,对所述人脸所在位置进行自动对焦;
主体拍摄子单元,接收用户发出的确定拍摄指令,控制所述相机拍摄照片。
CN201510385255.9A 2015-06-30 2015-06-30 一种通过语音指令快速定位拍照的方法及拍照系统 Active CN106331466B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201510385255.9A CN106331466B (zh) 2015-06-30 2015-06-30 一种通过语音指令快速定位拍照的方法及拍照系统
PCT/CN2016/086057 WO2017000793A1 (zh) 2015-06-30 2016-06-16 一种通过语音指令快速定位拍照的方法及拍照系统
TW105120446A TWI599225B (zh) 2015-06-30 2016-06-29 一種通過語音指令快速定位拍照的方法及拍照系統
HK17105094.5A HK1231654A1 (zh) 2015-06-30 2017-05-19 種通過語音指令快速定位拍照的方法及拍照系統

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510385255.9A CN106331466B (zh) 2015-06-30 2015-06-30 一种通过语音指令快速定位拍照的方法及拍照系统

Publications (2)

Publication Number Publication Date
CN106331466A true CN106331466A (zh) 2017-01-11
CN106331466B CN106331466B (zh) 2019-06-07

Family

ID=57607792

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510385255.9A Active CN106331466B (zh) 2015-06-30 2015-06-30 一种通过语音指令快速定位拍照的方法及拍照系统

Country Status (4)

Country Link
CN (1) CN106331466B (zh)
HK (1) HK1231654A1 (zh)
TW (1) TWI599225B (zh)
WO (1) WO2017000793A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108632567A (zh) * 2017-03-16 2018-10-09 杭州海康威视数字技术股份有限公司 云台控制方法、装置及系统
CN108702458A (zh) * 2017-11-30 2018-10-23 深圳市大疆创新科技有限公司 拍摄方法和装置
CN108965714A (zh) * 2018-08-01 2018-12-07 上海小蚁科技有限公司 图像采集方法、装置以及计算机储存介质
WO2019090717A1 (zh) * 2017-11-10 2019-05-16 深圳传音通讯有限公司 自动对焦方法与装置
CN111953894A (zh) * 2016-11-22 2020-11-17 谷歌有限责任公司 用于捕获图像的设备、方法、系统及计算机可读存储介质
CN112637484A (zh) * 2020-12-10 2021-04-09 浙江国视科技有限公司 一种基于语音识别的拍照方法及系统

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109918513B (zh) * 2019-03-12 2023-04-28 北京百度网讯科技有限公司 图像处理方法、装置、服务器及存储介质
CN109947598B (zh) * 2019-03-20 2021-03-23 浪潮商用机器有限公司 一种ssd微码备份方法、系统、设备及计算机存储介质
CN112672057B (zh) * 2020-12-25 2022-07-15 维沃移动通信有限公司 拍摄方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003348425A (ja) * 2002-05-28 2003-12-05 Fuji Photo Film Co Ltd 撮影装置
CN102413276A (zh) * 2010-09-21 2012-04-11 天津三星光电子有限公司 具有声控聚焦功能的数码摄像机
CN103685906A (zh) * 2012-09-20 2014-03-26 中兴通讯股份有限公司 一种控制方法、控制装置及控制设备
TW201419825A (zh) * 2012-11-12 2014-05-16 Nvidia Corp 行動資訊裝置上的語音控制
CN104486543A (zh) * 2014-12-09 2015-04-01 北京时代沃林科技发展有限公司 智能终端触控方式控制云台摄像头的设备和方法
CN104580992A (zh) * 2014-12-31 2015-04-29 广东欧珀移动通信有限公司 一种控制方法及移动终端

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003122394A (ja) * 2001-10-16 2003-04-25 Yamatake Corp 識別対象を認識する方法と装置及び該装置を搭載したロボット
CN1797543A (zh) * 2004-12-23 2006-07-05 上海电气自动化设计研究所有限公司 具有语音指令识别能力的工业机器人的装置及方法
CN201327585Y (zh) * 2008-10-27 2009-10-14 北京晋科光技术有限公司 3g机器人
CN103273982B (zh) * 2013-04-27 2018-01-19 深圳市英倍达科技有限公司 一种多功能全地形仿生机器人

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003348425A (ja) * 2002-05-28 2003-12-05 Fuji Photo Film Co Ltd 撮影装置
CN102413276A (zh) * 2010-09-21 2012-04-11 天津三星光电子有限公司 具有声控聚焦功能的数码摄像机
CN103685906A (zh) * 2012-09-20 2014-03-26 中兴通讯股份有限公司 一种控制方法、控制装置及控制设备
TW201419825A (zh) * 2012-11-12 2014-05-16 Nvidia Corp 行動資訊裝置上的語音控制
CN104486543A (zh) * 2014-12-09 2015-04-01 北京时代沃林科技发展有限公司 智能终端触控方式控制云台摄像头的设备和方法
CN104580992A (zh) * 2014-12-31 2015-04-29 广东欧珀移动通信有限公司 一种控制方法及移动终端

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111953894A (zh) * 2016-11-22 2020-11-17 谷歌有限责任公司 用于捕获图像的设备、方法、系统及计算机可读存储介质
US11317018B2 (en) 2016-11-22 2022-04-26 Google Llc Camera operable using natural language commands
CN108632567A (zh) * 2017-03-16 2018-10-09 杭州海康威视数字技术股份有限公司 云台控制方法、装置及系统
US11172134B2 (en) 2017-03-16 2021-11-09 Hangzhou Hikvision Digital Technology Co., Ltd. Pan-tilt control method, device and system
WO2019090717A1 (zh) * 2017-11-10 2019-05-16 深圳传音通讯有限公司 自动对焦方法与装置
CN108702458A (zh) * 2017-11-30 2018-10-23 深圳市大疆创新科技有限公司 拍摄方法和装置
US11388333B2 (en) 2017-11-30 2022-07-12 SZ DJI Technology Co., Ltd. Audio guided image capture method and device
CN108965714A (zh) * 2018-08-01 2018-12-07 上海小蚁科技有限公司 图像采集方法、装置以及计算机储存介质
CN112637484A (zh) * 2020-12-10 2021-04-09 浙江国视科技有限公司 一种基于语音识别的拍照方法及系统

Also Published As

Publication number Publication date
CN106331466B (zh) 2019-06-07
WO2017000793A1 (zh) 2017-01-05
TWI599225B (zh) 2017-09-11
TW201701644A (zh) 2017-01-01
HK1231654A1 (zh) 2017-12-22

Similar Documents

Publication Publication Date Title
CN106331466A (zh) 一种通过语音指令快速定位拍照的方法及拍照系统
JP5530568B2 (ja) 焦点ずれ状態下での被写体検出及び認識
US10609273B2 (en) Image pickup device and method of tracking subject thereof
CN104243818B (zh) 图像处理方法、装置及设备
US9986155B2 (en) Image capturing method, panorama image generating method and electronic apparatus
US10467498B2 (en) Method and device for capturing images using image templates
CN105704389A (zh) 一种智能拍照方法及装置
WO2019179468A1 (zh) 智能设备的控制方法、装置、设备和存储介质
EP2370857B1 (en) Method, apparatus and computer program product for automatically taking photos of oneself
CN104519261B (zh) 一种信息处理方法及电子设备
TW200815892A (en) Imaging apparatus, imaging apparatus control method, and computer program
TW201243823A (en) Screen image rotation method and system
CN105869113A (zh) 全景图像的生成方法和装置
CN108139561B (zh) 摄像装置及摄像方法
CN108702458A (zh) 拍摄方法和装置
CN105872363A (zh) 人脸对焦清晰度的调整方法及调整装置
CN104935698A (zh) 一种智能终端的拍摄方法、拍摄装置及智能手机
EP3366035B1 (en) Multiple camera autofocus synchronization
WO2018121730A1 (zh) 视频监控和人脸识别方法、装置及系统
CN104427242B (zh) 图像拼接方法、装置及电子设备
CN108718402B (zh) 视频会议管理方法及装置
CN108734082A (zh) 对应关系的建立方法、装置、设备和存储介质
JP2011048295A (ja) 複眼撮影装置及びその姿勢検出方法
TWI610570B (zh) 全景照片自動拍攝系統及方法
JP2008278433A (ja) 情報処理装置、プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1231654

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant