CN102272673B - 用于捕捉图像的设备及方法 - Google Patents

用于捕捉图像的设备及方法 Download PDF

Info

Publication number
CN102272673B
CN102272673B CN200980153499.7A CN200980153499A CN102272673B CN 102272673 B CN102272673 B CN 102272673B CN 200980153499 A CN200980153499 A CN 200980153499A CN 102272673 B CN102272673 B CN 102272673B
Authority
CN
China
Prior art keywords
predetermined condition
image
mobile terminal
earcon
equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200980153499.7A
Other languages
English (en)
Other versions
CN102272673A (zh
Inventor
汤跃忠
汪浩
刘黄玲子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Technologies Oy
Original Assignee
Nokia Oyj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Oyj filed Critical Nokia Oyj
Publication of CN102272673A publication Critical patent/CN102272673A/zh
Application granted granted Critical
Publication of CN102272673B publication Critical patent/CN102272673B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/64Computer-aided capture of images, e.g. transfer from script file into camera, check of taken image quality, advice or proposal for image composition or decision on when to take image
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • H04N23/611Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/63Control of cameras or camera modules by using electronic viewfinders

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Studio Devices (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

一种用于捕捉图像的方法,可以包括:接收开始命令;确定是否满足一个或多个预定条件;以及当满足预定条件时捕捉图像。开始命令和/或预定条件可以依赖于可听信号。预定条件可以包括可听信号的预定接收角度、前景与背景的比率、和/或远程控制信号的接收。该方法还可以要求没有遮挡视觉特征。可以提供个体化反馈,该个体化反馈可以指导图像中的特定人员纠正失败的预定条件。本发明还提供了对应于该方法的装置和计算机程序产品。

Description

用于捕捉图像的设备及方法
技术领域
本发明的实施方式总体上涉及图像捕捉技术,并且更具体地,涉及用于为本人自动拍摄照片的方法、装置和计算机程序产品。
背景技术
用于自动拍摄照片的技术正在涌现以改进照片的质量并且使得拍摄照片更加容易。具有此类技术的移动终端可以支持对人脸、对象的亮度、距离和移动进行检测,以及光学稳像、自动对焦、自动曝光、自动白平衡或其组合。这些技术增加了将捕捉到可接受的摄影图像的可能性。
然而,这些技术仅仅部分地解决了人们拍摄照片的需求。特别地,为本人捕捉高质量的照片仍然是困难的。在这方面,许多移动终端提供了自动定时器,该自动定时器在捕捉图像之前将快门释放延迟预定时间段。这允许拍摄者发起图像捕捉序列,并且继而在拍摄图像之前使其本人位于移动终端的相机的前面。该方法取得的成功通常是有限的,这是因为拍摄者无法向照片中出现的其他人提供指导。此外,拍摄者无法保证将要被捕捉的图像会按照所期望的出现。当拍摄者无法与正被拍摄的人员充分交流并且因此无法向正被拍摄的人员全面提供指令时,会存在相同的情况。特别地,当拍摄者与正被拍摄的人员讲不同语言时,可能出现上述情况。
因此,存在对用于改进照片拍摄成功率的附加技术的需求,尤其是当没有人手持相机而拍摄照片时以及当手持相机的人员无法与正被拍摄的人员充分交流时。
发明内容
因此,提供一种用于自动捕捉图像的方法、装置和计算机程序产品。例如,本发明的实施方式促进了为本人拍摄图片,无论是以无协助形式还是以不需要来自拍摄图片的人员的有意义反馈的自动形式。
在某些示例性实施方式中,提供包括处理器的装置,该处理器配置用于接收开始命令;确定是否满足一个或多个预定条件;以及当满足一个或多个预定条件时捕捉图像。在这些实施方式中,开始命令或者一个或多个预定条件中的至少一个依赖于可听信号。处理器可以进一步配置用于确定当可听信号的接收角度落入预定角度范围时满足可听定向条件。另外,处理器可以配置用于传送指示相对定向移动的定向反馈信号,该相对定向移动将使得随后可听信号的接收角度落入预定的角度范围。处理器还可以配置用于识别文本的一个或多个字符,所述字符可以充当针对图像捕捉的预定条件。此外,处理器可以配置用于识别一个或多个背景特征。该处理器可以附加地配置用于确定关于前景部分与背景部分的比率是否落入前景与背景比率的预定范围。而且,处理器可以配置用于向远程控制器传送图像的表示,该远程控制器进而显示图像的表示。
此外,处理器可以配置用于当不满足一个或多个预定条件时,针对与位于图像中的一个或多个个体的一个或多个脸部相对应的一个或多个摄影图像来搜索数据库。该实施方式的处理器可以确定对应于一个或多个摄影图像的一个或多个名称,并且传送关于一个或多个未被满足的预定条件的可听反馈信号。可听反馈信号可以包括一个或多个名称。此外,处理器可以配置用于确定位于图像中的一个或多个个体中的哪个个体应当做出使尚未被满足的一个或多个预定条件得到满足的改变。该实施方式的处理器可以通过数据库中的一个或多个名称来标识应当做出改变的一个或多个个体,或者通过与具有所述数据库中的一个或多个名称的个体之间的相对位置来标识所述一个或多个个体。最终,处理器可以配置用于确定图像中的一个或多个识别的视觉特征是否被遮挡。
在另一示例性实施方式中,提供一种用于自动捕捉图像的方法。该方法可以包括接收开始命令;确定是否满足一个或多个预定条件;以及当满足一个或多个预定条件时捕捉图像。在这个实施方式中,开始命令或者一个或多个预定条件中的至少一个依赖于可听信号。该方法可以进一步包括确定可听信号的接收角度是否落入预定角度范围。该方法可以附加地包括传送指示相对定向移动的定向反馈信号,该相对定向移动将使得随后可听信号的接收角度落入预定的角度范围。该方法还可以包括确定关于前景部分与背景部分的比率是否落入前景与背景比率的预定范围。最后,该方法可以包括向远程控制器传送图像的表示,该远程控制器进而显示图像的表示。
在又一示例性实施方式中,提供了用于自动捕捉图像的计算机程序产品,该计算机程序产品包括具有其中存储计算机可执行程序指令的至少一个计算机可读存储介质。该计算机可执行程序指令可以包括:配置用于接收开始命令的程序指令;配置用于确定是否满足一个或多个预定条件的程序指令;以及配置用于当满足一个或多个预定条件时捕捉图像的程序指令。在该实施方式中,开始命令或者一个或多个预定条件中的至少一个依赖于可听信号。计算机可执行程序指令可以进一步包括配置用于确定可听信号的接收角度是否落入预定角度范围的程序指令。计算机可执行程序指令可以附加地包括配置用于传送指示相对定向移动的定向反馈信号的程序指令,该相对定向移动将使得随后可听信号的接收角度落入预定的角度范围。计算机可执行程序指令还可以包括配置用于确定关于前景部分与背景部分的比率是否落入前景与背景比率的预定范围的程序指令。最后,计算机可执行程序指令还可以包括配置用于向远程控制器传送图像的表示的程序指令,该远程控制器进而显示图像的表示。
本发明的实施方式可以提供一种用于例如在移动或固定环境中使用的方法、装置和计算机程序产品。因此,举例来说,移动终端用户可以享受图像的自动捕捉。
附图说明
在概括地描述了本发明的某些实施方式之后,现在将对附图进行参考,该附图不一定是按比例绘制,并且其中:
图1图示了根据本发明的示例性实施方式,用于支持自动图像捕捉的装置的示意框图的一个示例;
图2示出了根据本发明的示例性实施方式,用于提供自动图像捕捉的示例性方法的流程图;以及
图3描绘了根据本发明的示例性实施方式的图像的尝试捕捉,其中预定条件被发现是不令人满意的,但随后基于个体化反馈被纠正,从而使得允许捕捉图像。
具体实施方式
现在将在下文中参考附图更加完整地描述本发明的某些实施方式,附图中示出了本发明的某些但不是全部的实施方式。事实上,本发明的各种实施方式可以体现为许多不同形式,并且不应当被解释为限制到在此阐明的实施方式;相反地,提供这些实施方式使得本公开将满足可适用的法律要求。相同的参考标号自始至终指代相同的元件。如在此使用的,术语“数据”、“内容”、“信息”以及类似的术语可以可交换地使用,以指代能够根据本发明的实施方式而传送、接收和/或存储的数据。此外,如在此使用的,术语“示例性”并不是提供用于表达任何定性评估,而是反之仅仅表达说明的示例。因此,对任何上述术语的使用都不应当用作限制本发明的实施方式的精神和范围。
本发明的实施方式提供了装置、方法和计算机程序产品,通过该装置、方法和计算机程序产品,可以在捕捉摄影图像方面,尤其是在捕捉本人的图像时,体验到改进。这些改进可以等同地应用于其他情况,包括其中拍摄照片的人员无法与正被拍摄的人员充分交流的情况。然而,本发明的实施方式有时可以为了简洁起见而用自拍摄来描述。
图1图示了可以受益于本发明实施方式的移动终端10的框图。然而,应当理解,所图示的以及在此后描述的移动终端10仅仅是可以受益于本发明实施方式的一种设备类型的示范,因此,不应用来限制本发明实施方式的范围。尽管出于示例目的而图示并将在此后描述移动终端10的一个实施方式,但是其他类型的移动终端也可以容易地采用本发明的实施方式,只要它们能够捕捉图像,其中这些移动终端诸如便携式数字助理(PDA)、寻呼机、移动计算机、膝上型计算机、相机、录像机、全球定位系统(GPS)设备、移动电话、任何前述的结合和/或其他类型的语音和文本通信系统。此外,非移动的设备也可以容易地采用本发明的实施方式。
另外,尽管移动终端10执行或使用了本发明方法的若干实施方式,但是该方法可以由除移动终端以外的设备所使用。具体地,具有图像捕捉能力的其他设备可以根据本发明的实施方式运行,无论其能力是无线地还是经由有线连接进行通信。而且,本发明实施方式的系统和方法将主要结合移动通信应用进行描述。然而,应当理解,本发明实施方式的系统和方法可以结合各种其他应用来进行使用,包括在移动通信行业内以及在移动通信行业外。
所图示实施方式的移动终端10包括天线12(或者多个天线),其可操作地与发射机14和接收机16通信。移动终端10还可以包括装置,诸如处理器20或者其他处理元件,其可以某种程度上分别提供去往发射机14的信号和接收来自接收机16的信号。该信号可以包括按照可适用蜂窝系统的空中接口标准的信令信息,和/或还可以包括对应于语音的数据、接收的数据和/或用户生成/传送的数据。在此方面,移动终端10可以能够利用一个或多个空中接口标准、通信协议、调制类型和访问类型来进行操作。例如,移动终端10可以能够根据多个第一代、第二代、第三代和/或第四代通信协议等中的任何协议来进行操作。作为备选(或附加地),移动终端10可以能够根据非蜂窝通信机制来进行操作。例如,移动终端10可以能够在无线局域网(WLAN)或其他通信网络中通信。如上文所指出的,本 发明的某些实施方式根本不需要通信能力,更不必说无线通信。
处理器20可以包括实现移动终端10的音频、图像和逻辑功能等功能的电路。例如,处理器20可以体现为各种处理装置,诸如处理元件、协处理器、控制器或各种其他处理器件,该其他处理器件包括集成电路,该集成电路诸如例如ASIC(专用集成电路)、FPGA(现场可编程门阵列)、硬件加速器等。在示例性实施方式中,处理器20可以配置用于执行存储于存储器40、42中的或以其他方式可供处理器20访问的指令。因此,无论由硬件方法或软件方法或者由它们的组合配置,处理器20都可以表示能够根据本发明的实施方式执行操作同时相应配置的实体。
移动终端10还可以包括用户接口,该用户接口可以包括输出设备,该输出设备诸如耳机或者扬声器24、麦克风或麦克风阵列26、显示器28和用户输入接口,这些设备可操作地耦合至处理器20。允许移动终端10接收数据的用户输入接口可以包括允许移动终端10接收数据的多种设备中的任意设备,诸如小键盘30、触摸显示器(未示出)或者其他输入设备。在包括小键盘30的实施方式中,小键盘30可以包括数字键(0-9)和相关键(#、*),以及用于操作移动终端10的其他硬键或软键。备选地,小键盘30可以包括QWERTY小键盘布置。小键盘30还可以包括具有相关联的功能的各种软键。此外或者备选地,移动终端10可以包括诸如操纵杆或者其他用户输入接口(诸如选择拨号)的接口设备。移动终端10还可以包括电池34,诸如振动电池组,以供为用于操作移动终端10的各种电路供电,以及可选地提供机械振动作为可觉察输出。
移动终端10还可以包括用户识别模块(UIM)38,其通常可以被称作智能卡。UIM 38通常是具有内置处理器的存储器设备。UIM38可以包括例如订户身份模块(SIM)、通用集成电路卡(UICC)、通用订户身份模块(USIM)、可移除用户身份模块(R-UIM)或任何其他智能卡。除了UIM 38之外,移动终端10还可以具有如上文所述的存储器40、42。例如,移动终端10可以包括易失性存储器 40,诸如包括用于数据临时存储的高速缓存区域的易失性随机存取存储器(RAM)。移动终端10还可以包括其他非易失性存储器42,其可以是嵌入式的和/或可移除的。非易失性存储器42可以附加地或者备选地包括电可擦除可编程只读存储器(EEPROM)、闪存、其他非易失性RAM(NVRAM)等。非易失性存储器42还可以包括用于数据临时存储的高速缓存区域。存储器可以存储移动终端10用以实现移动终端10的功能所使用的多个信息片段和数据中的任意项。例如,存储器可以包括能够唯一地标识移动终端10的标识符,诸如全球移动设备标识(IMEI)码。此外,存储器可以存储用于确定小区id信息的指令。具体地,存储器可以存储供处理器20执行的应用程序,其确定移动终端10与之通信的当前小区的身份,即,小区id身份或小区id信息。非易失性存储器42还可以存储捕捉的摄影图像。
所示实施方式的移动终端10进一步包括相机50,或者用于捕捉图像的其他设备。相机50可以配置用于捕捉图像以及存储图像或提供图像的存储。图像可以以数字形式存储到例如非易失性存储器42中,或者可以备选地存储在胶片上。可以使用许多类型的相机50,但是具有较高分辨率能力的相机是占有优势的,这是因为这些相机的能够标识正在被捕捉的场景的较小细节的能力。虽然具有较低分辨率的相机也可以采用本发明的实施方式,但是较小细节的识别使得移动终端10能够更好地实现其功能,现在将在操作中描述该功能。
参考图2,其示出了根据本发明的示例性实施方式的系统、方法和程序产品的流程图。如图所示,用户可以控制模式选择,如操作100中所示,该模式选择允许用户选择相机50的操作110的标准模式或者另一模式(在此被称作操作120的优化模式)。如果用户选择操作110的标准模式,则在捕捉图像之前可能仍然存在必须满足的某些要求,如操作130中所示,诸如将图像置于焦点之上或者具有足够的光,但是该模式的复杂性可以明显低于如操作120中所示的优化模式。然而,如果用户选择如操作120中所示的优化模式,则可以向用户呈现选择自动优化模式的选项(如操作140中所示), 或者条件选择模式(如操作150中所示)的选项。在条件选择模式下,如操作150中所示,相机的操作者可以在移动终端10如操作130中所示捕捉图像之前精确地选择期望的所需条件。备选地,在自动模式下,如操作140中所示,条件可以通过设计用于提供正面图像结果的预定方式进行设置。无论用户选择操作110的标准模式还是操作120的优化模式,相机50将关注于图像的至少一部分。
无论选择自动优化模式(如操作140中所示)还是条件选择优化模式(如操作150中所示),一个实施方式的移动终端10配置用于接收开始命令(如操作160中所示),并且确定是否满足预定条件(如操作170中所示)。除了确定是否满足一个或多个预定条件,一个实施方式的移动终端配置用于响应于开始命令而关注于图像的至少一部分。此外,如将在下文所述的,开始命令、预定条件或两者可以依赖于可听信号。该可听信号可以例如由移动终端10上的麦克风26来接收。如果开始命令被接收(如操作160中所示)并且满足预定条件(如操作170中所示)以及在一个实施方式中,可以获得足够的关注,则图像可以由移动终端的相机50捕捉(如操作130中所示)。
对于可听信号,其可以包括各种不同形式。在开始命令依赖于可听信号的实施方式中,开始命令可以采取源自移动终端10的操作者的可听信号的形式。例如,操作者可以说:“现在开始”,这时由麦克风26接收并且由诸如语音识别、移动终端10的处理器来识别,然后可以指示处理器确定是否满足预定条件,如操作170中所示。如下文所述,可以定义各种预定条件。例如当预定条件依赖于可听信号时,移动终端10可以不捕捉图像(如操作130中所示),直到接收到可听信号。例如,可以要求用户说“茄子(cheese)”作为预定条件之一,并具有配置用于捕捉所说词语的麦克风以及配置用于识别所说词语(如满足预定条件的“茄子”)的处理器。此外,可以要求可听信号源自具有配置用于使用例如已知语音识别技术来识别说话者的处理器的某个个体。因此,举例来说,与当前摄影过 程无关的附近的人说:“茄子”时,移动终端10可以防止仓促地捕捉图像,如操作130中所示。
可以采用其他预定条件。一个此类预定条件可以是可听定向条件。在一个实施方式中,只有当可听信号的接收角度落入预定的角度范围时满足该预定条件。例如,移动终端10可以配置有麦克风阵列26,以允许确定(诸如通过三角测量)开始命令所源自的方向。如果开始命令或其他可听信号离移动终端10的中心过远以至于位于预定角度范围之外,则将会不满足该预定条件。该实施方式的处理器可以进一步配置用于确定必须采取的相对移动,采取该相对运动使得可听定向条件被满足并且提供指示移动终端10与说话个体之间相对定向移动的定向反馈信号,这将使得随后可听信号的接收角度落入预定的角度范围。例如,处理器可以通过三角测量来确定可听信号离右边太远,并且因此可以提供指示说话者应当向左移动继而重复该可听信号的可听信号。因此,如果第一可听信号未通过预定的可听定向条件,则随后的可听信号将具有更好的机会来满足该可听定向条件,这是因为定向反馈会指示将移动终端10向哪个方向移动,或者给出可听信号的人员应当向哪个方向移动。
另一预定条件可以是要求移动终端10识别文本的一个或多个字符。例如,当用户希望移动终端10识别他所站位置旁边的标志上的文本时,用户可能选择文本识别预定条件,诸如通过从经由显示器28向用户呈现的多个可选预定条件中选择文本识别预定条件。移动终端继而可以等待捕捉图像(如操作130中所示),直到处理器确认该文本被识别(诸如经由文本识别过程)。该条件可以例如允许移动终端10保证在捕捉图像之前将该文本置于焦点之上。文本的字符的识别可以通过使用各种光学字符识别(OCR)技术进行。
其他预定条件可以是识别一个或多个背景特征。例如,移动终端10可以将来自各种著名地标(诸如,埃菲尔铁塔或华盛顿纪念碑)的图像存储在它的存储器(诸如非易失性存储器42)中。如果移动终端10被设置为该模式,则处理器可以等待直到预定背景特征被识 别并且可选地附加地在捕捉图像之前将该预定背景特征置于焦点之上,如操作130中所示。
附加的预定条件可以是要求图像的前景部分与背景部分的比率落入前景与背景比率的预定范围。例如,当拍摄具有日落背景的人员的图片时,移动终端10(诸如处理器)可以配置用于等待捕捉图像(如操作130中所示),直到占据前景的人员占据了与日落背景相比一定的图像比率为止。这将允许移动终端10根据预定比率有效地“平衡”出现在所捕捉图像中的背景和前景。
另外的附加的预定条件可以是要求图像中识别的视觉特征没有被遮挡。例如,如图3中所示,移动终端10的处理器可能在相机50查看的最初姿势200中发现不满足该条件,其中一个人员的脸被另一人员的手挡住。移动终端10可以简单地拒绝拍摄照片直到该遮挡被移除,或者该移动终端10可以例如提供个体化反馈(如操作194中所示),其将会在稍后针对如何纠正未满足的条件时进行描述。一旦遮挡被移除并且相机50查看到新的姿势220,移动终端10便可以捕捉图像,如操作130中所示。
另一预定条件可以是要求远程控制器提供移动终端10捕捉图像(如操作130中所示)所必要的输入。例如,该要求可以允许出现在图像中的人等待并且只有当他准备好时才捕捉图像(如操作130中所示)。一个实施方式的该远程控制器可以包括与移动终端10基本上相同的装置,因此将不分别示出。远程控制器继而可以与移动终端10进行通信并且如果移动终端在该时刻捕捉了图像(如操作130中所示)则接收并显示出现的图像的表示。这向人们提供了在图片被捕捉甚至在该人员本人出现在移动终端10上的相机50前面之前预览该图片的能力。如果出现的图像满意,则用户可以响应,诸如通过选择“回车”键。继而可以向移动终端传送该响应以触发相机50来捕捉图像。备选地,如果预览的图像不满意,则用户可以尝试在从移动终端接收用以预览的另一图像之前重新配置该场景。
可以由移动终端选择采用的其他潜在预定条件包括要求关注于 每张脸的面部识别、要求每个人微笑的面部表情识别、和/或要求每个人的头部和肩部出现在图像中的姿势识别。
对于所有预定条件,当预定条件不满足时(如图2的操作170中所示)移动终端10可以通过若干不同方式来响应。一个潜在响应可以是简单地不捕捉图像(如操作130中所示)。然而,若干其他选择可能更具有建设性。一个此类选择是重复(如操作190中所示)关于是否满足预定条件的检测步骤(如操作170中所示)。该重复将允许移动终端10的操作者或出现在相机50视野(view)中的人有机会纠正先前导致未通过预定条件的任何问题。
备选地,移动终端10(诸如处理器)可以提供反馈(如操作192中所示),该反馈可以协助操作移动终端10的人员或出现在相机50范围中的人员纠正导致预定条件不被满足(如操作170中所示)的缺陷。第三选择是提供个体化反馈(如操作194中所示),该个体化反馈进一步尝试通过可听地发出该人员名称的声音并且继而提供针对改正之前的失败的建议,来对出现在相机50视野中的特定人员说话。
在该实施方式中,移动终端10(诸如处理器)可以查看当前图像然后搜索存储的图片数据库,该数据库可以驻留在存储器(诸如非易失性存储器42)中,用于使用面部识别技术来将脸部与出现在图像中的脸部进行匹配。例如,联系人数据库可以包括至少某些其成员的图像,并且可以在面部识别搜索期间充当参考点。如果从数据库中的图像识别出当前图像中的个体,则处理器可以确定内部数据库中的对应名称。备选地,移动终端10可以搜索外部数据库,诸如针对社交网络站点的外部数据库,如果发现匹配,则确定外部数据库中的对应名称。移动终端10可以使用无线网络连接器或有线网络连接器与外部数据库进行通信。图3示出了在确定个体的名称之后个体化反馈(如操作194中所示)的示例。在该示例中,Alan的手遮挡了Lisa的脸(识别的视觉特征),因此移动终端10可以可听地发出“Alan的手挡住了Lisa的脸”的声音。移动终端10(诸如处 理器)可以使用已知文本到语音技术来发出数据库中找到的每个名称的声音。个体化反馈194还可以基于已知名称的人员的相对位置,例如应当做出改变以满足预定条件(如操作170中所示)一个人员不具有可以找到的名称时。例如,在图3中,如果Alan的名称没有在数据库中找到,则移动终端10可以备选地发出“Lisa旁边的人的手挡住了Lisa的脸”的声音。移动终端10可以进一步尝试确定针对预定条件失败的最简单的解决方案。例如,在图3中,相对于Lisa移动它的头部而言,Alan将他的手移开将是更容易的。因此,移动终端10可以明确地指示Alan移动他的手。
如上文所述,图2是根据本发明示例性实施方式的系统、方法和程序产品的流程图。将会理解,流程图的每个块或步骤以及流程图中块的组合可以通过各种方式来实现,诸如通过硬件、固件和/或包括一个或多个计算机程序指令的软件来实现。例如,下文描述的一个或多个过程可以通过计算机程序指令来实现。在此方面,实现上文描述的过程的计算机程序指令可以由移动终端10(或其他图像捕捉装置)的存储器设备来存储,并由移动终端(例如,处理器20或其他图像捕捉装置)中的处理器来执行。将会意识到,任何这种计算机程序指令可以被加载至计算机或者其他可编程装置(即,硬件)上以产生机器,从而使得在计算机或其他可编程装置上执行的指令创建出用于实现在流程图块或步骤中指定的功能的装置。这些计算机程序指令还可以被存储在计算机可读存储器中,该计算机可读存储器可以指引计算机或其他可编程装置以特定方式工作,以使得存储在计算机可读存储器中的指令产生包括指令装置的产品,这些指令装置实现在流程图块或步骤中指定的功能。该计算机程序指令还可以被加载至计算机或者其他可编程装置上,以使得在该计算机或其他可编程装置上执行一系列的可操作步骤,以产生计算机实现的过程,从而使得在计算机或其他可编程装置上执行的指令提供用于实现在流程图块或步骤中指定的功能的步骤。
因此,流程图的块或步骤可以支持用于执行指定功能的装置的 组合、用于执行指定功能的步骤的组合和用于执行指定功能的程序指令装置。还将理解,流程图的一个或多个块或步骤以及流程图中块或步骤的组合可以由基于专用硬件的计算机系统(其执行特定的功能或步骤)或者专用硬件和计算机指令的组合来实现。
在示例性实施方式中,用于执行上述图2的方法的装置可以包括处理器(例如,处理器20),其配置用于执行上述操作(100-194)中的某些或每个。该处理器可以例如配置用于通过执行硬件实现的逻辑功能、通过执行所存储的指令或通过执行用于执行每个操作的算法,来执行操作(100-194)。备选地,该装置可以包括用于执行上述每个操作的装置。
在此阐明的本发明的多种修改以及其他实施方式将为本发明所属领域的技术人员所知晓,对他们而言本发明具有在上述描述以及相关联的附图中所呈现的教导的优点。因此,应当理解的是,本发明并非被限制在所公开的特定的实施方式,并且上述修改和其他实施方式意在被包括在所附权利要求的范围中。此外,虽然上述描述以及相关联的附图在元件和/或功能的某些示例性组合的上下文中描述了示例性实施方式,但是应当理解,备选的实施方式可以提供元件和/或功能的不同组合而不会背离所附权利要求的范围。就这一点而言,举例来说,也可以构思与以上详细描述的所不同的元件和/或功能的不同组合,如可以在某些所附权利要求中所阐明的。虽然在此使用了特定的术语,它们仅仅用于一般性的和描述性的意义,并且并非意在限制。

Claims (13)

1.一种用于捕捉图像的设备,包括:
用于接收开始命令的装置;
用于确定是否满足一个或多个预定条件的装置;
用于当满足所述一个或多个预定条件时捕捉图像的装置;以及
用于当不满足所述一个或多个预定条件时进行如下操作的装置:针对与位于所述图像中的一个或多个个体的一个或多个脸部相对应的一个或多个摄影图像来搜索数据库,确定对应于所述一个或多个摄影图像的一个或多个名称,并且提供可听反馈信号,所述可听反馈信号适于协作纠正导致所述一个或多个预定条件不被满足的缺陷,其中所述可听反馈信号包括所述一个或多个名称;
其中所述开始命令或一个或多个所述预定条件中的至少一个依赖于可听信号。
2.根据权利要求1所述的设备,其中所述设备进一步包括用于确定当所述可听信号的接收角度落入预定角度范围时满足可听定向条件的装置,并且其中所述一个或多个预定条件包括所述可听定向条件。
3.根据权利要求2所述的设备,其中所述设备进一步包括用于传送指示相对定向移动的定向反馈信号的装置,所述相对定向移动将使得随后可听信号的接收角度落入所述预定的角度范围。
4.根据权利要求1所述的设备,其中所述设备进一步包括用于识别文本的一个或多个字符的装置,并且其中一个或多个所述预定条件包括识别文本的所述一个或多个字符。
5.根据权利要求1所述的设备,其中所述设备进一步包括用于识别一个或多个背景特征的装置,并且其中一个或多个所述预定条件包括识别所述一个或多个背景特征。
6.根据权利要求1所述的设备,其中所述设备进一步包括用于确定关于前景部分与背景部分的比率是否落入前景与背景比率的预定范围的装置,并且其中一个或多个所述预定条件包括确定关于所述前景部分与所述背景部分的所述比率是否落入前景与背景比率的所述预定范围。
7.根据权利要求1所述的设备,其中所述设备进一步包括用于传送所述图像的表示的装置,并且其中远程控制器显示所述图像的所述表示。
8.根据权利要求1所述的设备,其中所述设备进一步包括:
用于确定位于所述图像中的所述一个或多个个体中的哪个个体应当做出使尚未被满足的所述一个或多个预定条件得到满足的改变的装置;以及
用于通过数据库中的一个或多个名称来标识应当做出改变的一个或多个个体,或者通过与具有所述数据库中的一个或多个名称的个体之间的相对位置来标识所述一个或多个个体的装置。
9.根据权利要求1所述的设备,其中所述设备进一步包括用于确定所述图像中的一个或多个识别的视觉特征是否被遮挡的装置,并且其中所述一个或多个预定条件包括确定所述一个或多个识别的视觉特征中没有一个被遮挡。
10.一种用于捕捉图像的方法,包括:
接收开始命令;
确定是否满足一个或多个预定条件;
当满足所述一个或多个预定条件时,捕捉图像;以及
当不满足所述一个或多个预定条件时,针对与位于所述图像中的一个或多个个体的一个或多个脸部相对应的一个或多个摄影图像来搜索数据库,确定对应于所述一个或多个摄影图像的一个或多个名称,并且提供可听反馈信号,所述可听反馈信号适于协作纠正导致所述一个或多个预定条件不被满足的缺陷,其中所述可听反馈信号包括所述一个或多个名称;
其中所述开始命令或一个或多个所述预定条件中的至少一个依赖于可听信号。
11.根据权利要求10所述的方法,其中确定是否满足所述一个或多个预定条件包括确定所述可听信号的接收角度是否落入预定的角度范围。
12.根据权利要求10所述的方法,其中确定是否满足所述一个或多个预定条件包括确定关于前景部分与背景部分的比率是否落入前景与背景比率的预定范围。
13.根据权利要求10-12中任意一项所述的方法,还包括传送用于由远程控制器显示的所述图像的表示。
CN200980153499.7A 2008-12-31 2009-12-16 用于捕捉图像的设备及方法 Active CN102272673B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/347,460 2008-12-31
US12/347,460 US8432455B2 (en) 2008-12-31 2008-12-31 Method, apparatus and computer program product for automatically taking photos of oneself
PCT/IB2009/007767 WO2010076624A1 (en) 2008-12-31 2009-12-16 Method, apparatus and computer program product for automatically taking photos of oneself

Publications (2)

Publication Number Publication Date
CN102272673A CN102272673A (zh) 2011-12-07
CN102272673B true CN102272673B (zh) 2015-06-03

Family

ID=42284443

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200980153499.7A Active CN102272673B (zh) 2008-12-31 2009-12-16 用于捕捉图像的设备及方法

Country Status (7)

Country Link
US (1) US8432455B2 (zh)
EP (1) EP2370857B1 (zh)
KR (1) KR101359880B1 (zh)
CN (1) CN102272673B (zh)
ES (1) ES2540540T3 (zh)
PT (1) PT2370857E (zh)
WO (1) WO2010076624A1 (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8498451B1 (en) 2007-11-12 2013-07-30 Google Inc. Contact cropping from images
KR20100075167A (ko) * 2008-12-24 2010-07-02 삼성전자주식회사 얼굴인식 기능을 이용한 디지털 영상 촬영 장치 및 방법
US20100225773A1 (en) * 2009-03-09 2010-09-09 Apple Inc. Systems and methods for centering a photograph without viewing a preview of the photograph
KR20110015309A (ko) * 2009-08-07 2011-02-15 삼성전자주식회사 디지털 촬영장치, 그 제어방법 및 이를 실행시키기 위한 프로그램을 저장한 기록매체
KR20110088914A (ko) * 2010-01-29 2011-08-04 삼성전자주식회사 휴대용 단말기에서 카메라 기능을 제공하기 위한 장치 및 방법
FI20115142A0 (fi) 2011-02-15 2011-02-15 P2S Media Group Oy Menetelmä ja järjestelmä multimediadatan siirtoon
EP2763393A4 (en) * 2012-01-06 2015-07-01 Asahi Chemical Ind IMAGE FORMING DEVICE AND INFORMATION PROCESSING DEVICE
CN104349031B (zh) * 2013-07-31 2018-05-18 华为技术有限公司 一种调整摄像装置的取景范围方法及摄像系统、操作装置
CN104883505B (zh) * 2015-06-12 2019-06-25 联想(北京)有限公司 电子设备及其拍照控制方法
KR102101916B1 (ko) 2016-06-09 2020-05-29 구글 엘엘씨 시각적 방해물들을 통과하여 사진 찍기
US20220309110A1 (en) * 2021-03-29 2022-09-29 Tape Ark Rapid box indexing

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5697337A (en) * 1979-12-31 1981-08-06 Minolta Camera Co Ltd Voice control camera
US4951079A (en) * 1988-01-28 1990-08-21 Konica Corp. Voice-recognition camera
EP0376618A3 (en) 1988-12-28 1992-01-15 Konica Corporation Camera
US7015950B1 (en) * 1999-05-11 2006-03-21 Pryor Timothy R Picture taking method and apparatus
EP1380884B1 (en) * 1999-09-14 2010-09-29 Kabushiki Kaisha Toshiba Face image photographing apparatus and face image photographing method
US7148917B2 (en) * 2001-02-01 2006-12-12 Motorola Inc. Method and apparatus for indicating a location of a person with respect to a video capturing volume of a camera
US6903767B2 (en) * 2001-04-05 2005-06-07 Hewlett-Packard Development Company, L.P. Method and apparatus for initiating data capture in a digital camera by text recognition
US6690883B2 (en) * 2001-12-14 2004-02-10 Koninklijke Philips Electronics N.V. Self-annotating camera
JP2004298988A (ja) * 2003-03-31 2004-10-28 Honda Motor Co Ltd 移動ロボットの画像送信装置
US7272246B2 (en) * 2003-05-22 2007-09-18 Motorola, Inc. Personal identification method and apparatus
KR20050055481A (ko) * 2003-12-08 2005-06-13 삼성전자주식회사 착탈식 화상출력유닛을 갖는 캠코더
EP1704710A4 (en) * 2003-12-24 2007-09-19 Walker Digital Llc METHOD AND DEVICE FOR AUTOMATIC COLLECTION AND MANAGEMENT OF IMAGES
US8054336B2 (en) * 2004-10-15 2011-11-08 Lifesize Communications, Inc. High definition pan tilt zoom camera with embedded microphones and thin cable for data and power
US20060104483A1 (en) * 2004-11-12 2006-05-18 Eastman Kodak Company Wireless digital image capture device with biometric readers
JP2006287749A (ja) * 2005-04-01 2006-10-19 Canon Inc 撮像装置、及びその制御方法
CN1933553A (zh) 2005-09-16 2007-03-21 英华达(上海)电子有限公司 数码相机中基于人脸识别与tts结合的位置调整提示的方法
JP2007312204A (ja) * 2006-05-19 2007-11-29 Fujifilm Corp 撮影システムおよび撮影装置
JP4463792B2 (ja) * 2006-09-29 2010-05-19 富士フイルム株式会社 撮影装置
JP2008244804A (ja) * 2007-03-27 2008-10-09 Fujifilm Corp 撮像装置及び撮像方法並びに制御プログラム
JP4804398B2 (ja) * 2007-03-30 2011-11-02 三洋電機株式会社 撮像装置及び撮影方法
JP4853425B2 (ja) 2007-08-14 2012-01-11 ソニー株式会社 撮像装置、撮像方法およびプログラム
JP4896838B2 (ja) * 2007-08-31 2012-03-14 カシオ計算機株式会社 撮像装置、画像検出装置及びプログラム
CN101465960B (zh) * 2007-12-19 2011-07-27 深圳富泰宏精密工业有限公司 具有语音控制功能的摄像装置及其使用方法
US8300117B2 (en) * 2008-03-28 2012-10-30 Fuji Xerox Co., Ltd. System and method for exposing video-taking heuristics at point of capture

Also Published As

Publication number Publication date
KR20110100671A (ko) 2011-09-14
KR101359880B1 (ko) 2014-02-06
ES2540540T3 (es) 2015-07-10
WO2010076624A1 (en) 2010-07-08
EP2370857A4 (en) 2012-05-30
EP2370857A1 (en) 2011-10-05
EP2370857B1 (en) 2015-05-20
PT2370857E (pt) 2015-07-31
US20100165119A1 (en) 2010-07-01
CN102272673A (zh) 2011-12-07
US8432455B2 (en) 2013-04-30

Similar Documents

Publication Publication Date Title
CN102272673B (zh) 用于捕捉图像的设备及方法
US10659675B2 (en) Terminal, shooting method thereof and computer storage medium
US9288386B2 (en) Imaging apparatus and image synthesizing method
CN101682696B (zh) 移动终端、移动终端的控制方法
KR20170023748A (ko) 사진 공유 방법, 장치, 프로그램 및 기록매체
US9584713B2 (en) Image capturing apparatus capable of specifying an object in image data based on object detection, motion detection and/or object recognition, communication apparatus communicating with image capturing apparatus, and control method therefor
CN105472771B (zh) 无线连接方法和装置
KR20110020746A (ko) 오브젝트 정보 제공방법 및 이를 적용한 촬영장치
US20150043886A1 (en) Electronic device and terminal communicating with it
CN112040115B (zh) 图像处理设备及其控制方法和存储介质
US20160323499A1 (en) Method and apparatus for forming images and electronic equipment
CN105468767A (zh) 名片信息获取方法及装置
KR20160069624A (ko) 드론,드론 관리 서버 및 이들에 의한 드론의 비행 제어 방법
CN101751906B (zh) 显示方法以及使用其的照相装置和显示装置
JP6433265B2 (ja) 情報処理装置、電子機器およびそれらの制御方法、プログラム並びに記憶媒体
CN105578017B (zh) 拍照及照片分享系统及方法
US20150189151A1 (en) Information processing apparatus, imaging apparatus, information processing method, information processing program, and imaging system
CN110868542A (zh) 拍照方法、装置及设备
JP6399854B2 (ja) 通信装置、通信装置の制御方法、プログラム
US20150130966A1 (en) Image forming method and apparatus, and electronic device
US9413944B2 (en) Apparatus and method for controlling a camera in an electronic device
CN107948507B (zh) 一种智能拍照方法、拍照终端及服务器
US10972650B2 (en) Communication apparatus and control method thereof
EP2843932B1 (en) Device and method for making quick change to playback mode after photographing subject
KR102367343B1 (ko) 셀프 촬영 관리 서버

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20160215

Address after: Espoo, Finland

Patentee after: Technology Co., Ltd. of Nokia

Address before: Espoo, Finland

Patentee before: Nokia Oyj