CN106576142A - 用于使用闪光照明捕捉具有文字的场景图像的设备和方法 - Google Patents

用于使用闪光照明捕捉具有文字的场景图像的设备和方法 Download PDF

Info

Publication number
CN106576142A
CN106576142A CN201580043668.7A CN201580043668A CN106576142A CN 106576142 A CN106576142 A CN 106576142A CN 201580043668 A CN201580043668 A CN 201580043668A CN 106576142 A CN106576142 A CN 106576142A
Authority
CN
China
Prior art keywords
image
flash lamp
areas
specular reflection
character area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201580043668.7A
Other languages
English (en)
Other versions
CN106576142B (zh
Inventor
柳昇佑
朝玄默
李熙硕
金杜勋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN106576142A publication Critical patent/CN106576142A/zh
Application granted granted Critical
Publication of CN106576142B publication Critical patent/CN106576142B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • G06V10/993Evaluation of the quality of the acquired pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/60Extraction of image or video features relating to illumination properties, e.g. using a reflectance or lighting model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/10Cameras or camera modules comprising electronic image sensors; Control thereof for generating image signals from different wavelengths
    • H04N23/12Cameras or camera modules comprising electronic image sensors; Control thereof for generating image signals from different wavelengths with one sensor only
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/67Focus control based on electronic image sensor signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/70Circuitry for compensating brightness variation in the scene
    • H04N23/71Circuitry for evaluating the brightness variation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/70Circuitry for compensating brightness variation in the scene
    • H04N23/74Circuitry for compensating brightness variation in the scene by influencing the scene brightness using illuminating means

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Studio Devices (AREA)
  • Character Input (AREA)

Abstract

本发明揭示一种自动启动用于电子装置的图像传感器的闪光灯的由所述电子装置执行的方法。所述方法可包含接收包含至少一个文字区域的第一图像,和确定表征第一图像中的所述至少一个文字区域的特征数据。所述方法还可识别所述第一图像中的至少一个候选镜面反射区域。基于所述特征数据和所述至少一个候选镜面反射区域,可启动所述闪光灯。在启动所述闪光灯后,即可捕捉包含所述至少一个文字区域的第二图像。

Description

用于使用闪光照明捕捉具有文字的场景图像的设备和方法
优先权主张
本申请案主张2014年8月22日申请的题为“启动用于捕捉具有文字的图像的闪光灯(ACTIVATING FLASH FOR CAPTURING IMAGES WITH TEXT)”的美国申请案第14/466,659号的优先权,所述申请案的内容被以引用的方式全部并入。
技术领域
本发明大体涉及在电子装置中捕捉图像,且更具体来说,涉及启动电子装置中用于捕捉图像的闪光灯。
背景技术
例如智能电话、平板计算机、智能眼镜和类似者的现代电子装置通常装备有一或多个相机单元或模块。在这些电子装置中,相机单元或模块用以捕捉多种类型的场景和目标的相片。此类电子装置也可具有用于处理捕捉的相片的多种能力或功能,例如,图像处理功能、文字辨识功能等。
一些用户可利用装备有相机模块的电子装置捕捉文字目标(例如,商务名片)或包含文字目标的场景的相片。举例来说,用户可使用其电子装置对包含例如街道标牌的文字目标的街道场景拍照。在此情况下,包含文字目标的场景的一或多个相片可存储于电子装置中,且被处理以供文字辨识。
然而,包含文字的一些相片可遭受使图像质量降级的多种光照条件,例如,镜面反射、漫反射、低光条件等。举例来说,在存在一或多个光源的情况下,常规电子装置可用以捕捉具有相对有光泽或发光表面的文字目标(例如,印刷在有光泽的纸上的商务名片、杂志或类似者)的相片。在此情况下,来自光源的光可从文字目标的表面反射,且导致在相片的一或多个部分中的镜面反射。另外,当镜面反射部分与文字目标中的文字或字符的一部分重合时,常规电子装置可能不能够准确地辨识文字目标中的文字。
发明内容
本发明提供用于基于表征图像中的至少一个文字区域和图像中的至少一个候选镜面反射区域的特征数据来自动启动用于图像传感器的闪光灯的方法和设备。
根据本发明的一个方面,揭示一种自动启动用于电子装置的图像传感器的闪光灯的方法,其由电子装置执行。该方法可包含接收包含至少一个文字区域的第一图像,和确定表征第一图像中的所述至少一个文字区域的特征数据。所述方法还可识别所述第一图像中的至少一个候选镜面反射区域。基于所述特征数据和所述至少一个候选镜面反射区域,可启动所述闪光灯。在启动所述闪光灯后,即可捕捉包含所述至少一个文字区域的第二图像。本发明还描述了涉及此方法的设备、装置、系统、装置的组合和计算机可读媒体。
根据本发明的另一方面,揭示一种用于自动启动用于图像传感器的闪光灯的电子装置。所述电子装置可包含处理器,其被配置以接收包含至少一个文字区域的第一图像。所述处理器可包含:文字区域检测单元,其被配置以确定表征所述第一图像中的所述至少一个文字区域的特征数据;和反射区域识别单元,其被配置以识别所述第一图像中的至少一个候选镜面反射区域。所述处理器还可包含闪光灯控制单元,其被配置以基于所述特征数据和所述至少一个候选镜面反射区域启动所述闪光灯。所述图像传感器被配置以在启动所述闪光灯后即捕捉包含所述至少一个文字区域的第二图像。
附图说明
当结合附图阅读时,参考以下详细描述,将理解本发明的发明性方面的实施例。
图1说明根据本发明的一个实施例的被配置以捕捉包含具有文字的目标的场景的图像的电子装置。
图2描绘根据本发明的一个实施例的用于识别具有多个文字区域的目标的第一图像中的镜面反射区域和通过启动闪光灯以减小或去除镜面反射区域来捕捉第二图像的流程图。
图3为根据本发明的一个实施例的电子装置的框图,所述电子装置被配置以通过自动启动闪光灯以补偿从具有一或多个文字区域的至少一个目标的一或多个图像确定的镜面反射效应来捕捉所述至少一个目标的图像。
图4展示根据本发明的一个实施例的被配置以检测图像中的一或多个文字区域和确定表征所述一或多个文字区域的特征数据的文字区域检测单元的框图。
图5说明根据本发明的一个实施例的被配置以识别在具有文字的目标的图像中的一或多个候选镜面反射区域的反射区域识别单元的框图。
图6为根据本发明的一个实施例的用于基于包含至少一个文字区域的一或多个图像来自动启动闪光灯以用于捕捉包含所述至少一个文字区域的图像的方法的流程图。
图7为根据一个实施例的由闪光灯控制单元执行的方法的流程图,所述闪光灯控制单元被配置以基于表征文字区域的特征数据从在包含文字区域的图像中的一或多个候选镜面反射区域选择一或多个镜面反射区域。
图8描述根据本发明的一个实施例用于识别在具有多个文字区域的目标的图像中的多个候选镜面反射区域和在所述多个候选镜面反射区域当中选择位于多个文字区域外的镜面反射区域的流程图。
图9说明根据本发明的一个实施例的由闪光灯控制单元执行以用于基于多个候选镜面反射区域和字符信息数据库来启动闪光灯的方法的框图。
图10为根据本发明的一个实施例由闪光灯控制单元执行的方法的流程图,所述闪光灯控制单元被配置以基于位于至少一个文字区域外的一或多个镜面反射区域确定是否启动用于图像传感器的闪光灯。
图11说明根据本发明的一个实施例的由闪光灯控制单元执行以用于基于表征图像中的一或多个文字区域的特征数据和文档类型数据库调整待从闪光灯输出的光的强度的方法的框图。
图12为根据本发明的一个实施例的由闪光灯控制单元执行以用于通过基于来自一或多个传感器的传感器数据调整待从闪光灯输出的光的强度和闪光灯的方向中的至少一个来启动用于图像传感器的闪光灯的方法的流程图。
图13为根据本发明的一个实施例的可实施用于自动启动用于电子装置的图像传感器的闪光灯的方法和设备的示范性电子装置的框图。
具体实施方式
现在将详细地对各种实施例进行参考,在附图中说明了所述实施例的实例。在以下详细描述中,阐述众多具体细节以便提供对本发明的透彻理解。然而,对所属领域的一般技术人员将显而易见的是,可在无这些具体细节的情况下实践本标的物。在其它情况下,尚未详细描述众所周知的方法、程序、系统和组件,以便不会不必要地混淆各种实施例的各方面。
图1说明根据本发明的一个实施例的电子装置120,其被配置以捕捉包含具有多个文字区域180和190的目标170的场景100的一或多个图像。在图1中,电子装置120的用户110位于包含在天花板中的光源150和桌子160的房间中。当光源150从天花板照射光时,用户110可操作装备有图像传感器130和闪光灯140的电子装置120以捕捉房间中包含安置于桌子160上的目标170的场景100的图像。如本文所使用,术语“捕捉(capture或capturing)”可指示接收或产生场景的图像,且可包含感测、检测或记录图像的操作。如本文中所说明,电子装置120可为装备有图像捕捉和处理能力的任一合适装置,例如,数码相机(例如,DSLR相机)、智能电话、可佩带计算机(例如,智能眼镜、智能表等)、个人计算机、膝上型计算机、平板计算机、游戏装置等。
目标170可为包含多个文字区域180和190的杂志。虽然将目标170说明为杂志,但其可为具有可包含、显示或展示任一合适文字(例如,一或多个字符)的表面的任一目标。在一些实施例中,目标170的表面可根据目标170的表面特性而展现镜面反射效应。举例来说,当目标170的表面有光泽、发光、经抛光、丝质、光亮、玻璃状或类似者时,此表面可反射光,从而导致目标170中的一或多个镜面反射区域。当捕捉到具有此表面的目标170的图像时,所述图像还可包含可使图像的质量降级的镜面反射区域。
目标170中的多个文字区域180和190可包含类似大小、色彩、图案或类似者的文字或字符。如所展示,文字区域180可包含作为报头或题名的文字字符“Magazine”,且文字区域190可包含作为子标题的文字字符“Headline”。在说明的目标170中,多个文字区域180和190中的字符可在色彩上为白色,而在字符外的目标170的色彩可为灰色。
装备有图像传感器130的电子装置120可被配置以捕捉和显示场景100的一或多个图像。举例来说,用户110可捕捉包含具有多个文字区域180和190的目标170的场景100的图像。电子装置120可存储所述捕捉的图像以供存取,和/或对图像执行文字辨识以辨识文字区域180和190中的文字。在一个实施例中,电子装置120可在预览模式中操作以捕捉包含目标170的场景100的一或多个预览图像。在此模式中,预览图像可临时存储于电子装置120的存储单元中。
在捕捉到场景100的图像后,电子装置120即可执行所捕捉图像的图像分析以确定是否启动闪光灯140以用于捕捉包含目标170的场景100的下一个图像。图2描绘根据本发明的一个实施例的用于识别在具有多个文字区域180和190的目标170的第一图像210中的镜面反射区域250和通过启动闪光灯以减小或去除镜面反射区域250来捕捉第二图像220的流程图。电子装置120可不使用闪光灯140来接收或捕捉包含文字区域180和190的目标170的第一图像210。如所展示,第一图像210包含在文字区域180的一部分上的镜面反射区域250。
在接收或捕捉到第一图像210后,电子装置120可确定表征第一图像210中的文字区域180和190的特征数据。如本文所使用,术语“特征数据”可指描述或涉及图像中的一或多个文字区域的任何数据或信息,且可包含描述或涉及文字区域的色彩、强度、边界、文字置信度、极性等的数据或信息。举例来说,特征数据可包含描述或涉及一或多个文字区域的数据,例如,置信度数据、边界数据、清晰度数据、平均强度数据、极性数据和直方图数据、文档类型数据,如下参看图4更详细地描述。在所说明的实施例中,电子装置120可确定用于文字区域180和190的特征数据,例如,色彩值、强度值、边界、文字置信度值、极性值等。
电子装置120可被配置以识别第一图像210中的一或多个候选镜面反射区域。根据一些实施例,可确定用于第一图像210中的多个像素的多个色彩值以用于识别一或多个候选镜面反射区域。如图2的第一图像210中所展示,电子装置120可确定文字区域180中的文字“Magazine”的色彩值,且文字区域190中的文字“Headline”指示白色。可从来自光源150的光的镜面反射产生的镜面反射区域250可具有白色彩值且可重叠第一图像中的文字区域180的一部分。
在一个实施例中,电子装置120可识别第一图像210中由白色表征为候选镜面反射区域的一或多个区域。举例来说,分别包含文字“MAGAZINE”和“Headline”的文字区域180和190和镜面反射区域250可由指示白色且因此识别为候选镜面反射区域的色彩值表征。在所说明的实施例中,“白色”可指由红(R)、绿(G)和蓝(B)色的任何合适组合产生的色彩。举例来说,如果给定8位色码,那么对于R、G和B值中的每一个,白色可由值“255”表示。然而,白色还可包含大体上类似或靠近此类R、G和B值或其任何组合的任何其他色彩。
基于识别的候选镜面反射区域180、190和250和表征文字区域180和190的特征数据,电子装置120可确定是否启动闪光灯140以用于捕捉第二图像220。如果确定闪光灯140将被启动,那么电子装置120可在启动闪光灯140后即捕捉第二图像220。否则,电子装置120可在不启动闪光灯140的情况下捕捉图像。如本文所使用,术语“在……后,即(upon)”可意味着在事件或动作的发生后或期间立即或不久。举例来说,可与闪光灯140的启动同时或在所述启动后立即捕捉第二图像220。在所说明的实施例中,在启动闪光灯140后即捕捉的第二图像220可消除或减小第一图像210中的镜面反射区域250。
图3为根据本发明的一个实施例的电子装置120的框图,所述电子装置被配置以通过自动启动闪光灯以补偿镜面反射效应来捕捉具有一或多个文字区域的至少一个目标的图像。电子装置120可包含闪光灯140、I/O单元310、存储单元320、通信单元330、传感器单元340和处理器350。传感器单元340可包含图像传感器130、回转仪342、加速度计344和深度传感器346。处理器350可包含图像传感器控制单元352、文字区域检测单元354、反射区域识别单元356和闪光灯控制单元358。
I/O单元310可被配置以接收来自用户110的命令和/或输出用于用户110的信息。在一些实施例中,I/O单元310可接收来自用户110的命令或输入以选择用于图像传感器130的相机模式(例如,自动对焦模式、文字模式、夜间模式、纵向模式等)。在选定相机模式期间,用户110可操作图像传感器130以捕捉场景的图像。举例来说,用户110可在文字模式中操作图像传感器130以捕捉包含具有文字的目标的场景的一或多个预览图像。捕捉的预览图像可临时存储于存储单元320中,且实时地显示于I/O单元310上。电子装置120中的I/O单元310也可被配置以接收来自用户110的用于捕捉场景的一或多个后续图像的命令或输入。如本文中所说明,I/O单元310可为能够接收命令和/或输出信息的任一合适装置,且包含触摸屏、拨号盘、按钮、小键盘、触控板、显示屏或类似者。
存储单元320可被配置以存储一或多个捕捉的图像或预览图像。举例来说,存储单元320可存储用于具有一或多个文字区域的场景的一或多个预览图像的图像数据,当图像传感器130正在预览模式中操作时,可捕捉所述一或多个文字区域。在此情况下,图像数据可包含例如像素的数目的像素信息、用于像素的色彩值等。图像或图像数据可由处理器350存取以响应于经由I/O单元310接受的用户110的输入或命令来确定是否启动闪光灯140以用于捕捉包含文字区域的下一个图像。可使用任何合适的存储或存储器装置来实施存储单元320,例如,RAM(随机存取存储器)、ROM(只读存储器)、EEPROM(电可擦除可编程只读存储器)、快闪存储器或SSD(固态驱动器)。
另外,存储单元320可存储分类器数据库,所述分类器数据库可将文字和/或非文字分类以用于识别场景的图像或预览图像中的一或多个文字区域。在一个实施例中,分类器数据库可包含用于多种语言(例如,英语、法语和类似者)的多个概率模型,其可用以确定给定文字与所述语言中的一个相关联的概率。存储单元320也可存储可用于从一或多个候选镜面反射区域选择一或多个镜面反射区域的字符信息数据库。对于语言中的每一个,字符信息数据库可包含在所述语言中使用的多个字符的图案或几何数据、表示所述语言中的多个字符的标志符号的图像和/或与所述语言中的每一个别标志符号相关联的至少一个特征。此外,存储单元320可存储可用于确定用于来自包含文字区域的图像的一或多个文字区域的文档类型的文档类型数据库。在文档类型数据库中,可将多个预定文档类型(例如,杂志、商务名片、日历等)映射到文档类型中的文字区域的布置或布局(例如,文字区域的位置和大小)和来自闪光灯140的光的预定强度。
在传感器单元340中,图像传感器130可被配置以接收在预览模式中的一或多个预览图像或响应于来自用户110的输入或命令捕捉一或多个图像。电子装置120可将能够捕捉或感测场景或目标的图像的任何合适图像感测装置用于图像传感器130(例如,相机或相机模块)。为了捕捉图像,图像传感器130可与电子装置120中的闪光灯140同步操作。
根据一个实施例,可将闪光灯140启动任何合适的次数以用于捕捉场景的一或多个图像。闪光灯140可为能够发射光或一阵光以用于捕捉场景的图像的任一装置。虽然展示电子装置120具有图像传感器130和闪光灯140,但其可包含任何合适数目个图像传感器和闪光灯。
在传感器单元340中,回转仪342、加速度计344和深度传感器346可用于确定指示图像传感器130到图像中的一或多个文字区域的深度信息的几何信息、安置文字区域的平面与安置图像传感器130的平面之间的角度等。回转仪342可被配置以检测或测量电子装置120的定向,其可用于确定文字区域的平面与图像传感器130或电子装置120的平面之间的角度。加速度计344可被配置以检测或测量电子装置120的加速度,其包含加速度的量值和方向。另外或替代地,加速度计344可基于加速度数据确定电子装置120的定向。在一个实施例中,可假定所捕捉图像中的一或多个文字区域与地球的表面平行或正交地安置。在此情况下,可从在捕捉图像时的电子装置120的定向和文字区域的平面(例如,与地球的表面平行或正交的平面)确定文字区域的平面与电子装置的平面之间的角度。
深度传感器346可被配置以确定用于由图像传感器130接受或捕捉的场景的一或多个图像的深度信息。举例来说,深度传感器346可包含能够产生一束光(例如,红外线、激光等)的光源。深度传感器346可朝向场景中具有文字的目标发射一束光,且接收已从目标反射的光束。然后可从光束行进到目标且返回所花费的时间计算到所述目标的深度或距离。在一个实施例中,深度传感器346可被配置以确定图像传感器130到接受的场景中的一或多个文字区域的多个深度。从用于一或多个文字区域的多个深度,深度传感器346可确定安置文字区域的平面与安置图像传感器130或电子装置120的平面之间的角度。举例来说,如果文字区域不与地球的表面平行或正交,那么可从在捕捉包含文字区域的图像时的文字区域的多个深度确定文字区域的平面与电子装置120的平面之间的角度。然后可将包含深度信息和/或角度的确定的几何信息提供到闪光灯控制单元358以用于调整待从闪光灯140输出的光的强度和/或闪光灯140的方向。另外或替代地,电子装置120可包含能够捕捉场景的立体或3D图像的多个图像传感器,可从所述立体或3D图像确定几何信息。
处理器350可被配置以基于包含至少一个文字区域的一或多个图像确定是否启动闪光灯140以用于捕捉包含至少一个文字区域的场景的图像。如果确定闪光灯140将被启动,那么处理器350可响应于来自用户110的输入或命令同步地控制图像传感器130和闪光灯140以捕捉图像。否则,可响应于来自用户110的输入或命令,在不启动闪光灯140的情况下捕捉图像。
处理器350中的图像传感器控制单元352可被配置以控制用于捕捉图像的图像传感器130。在一个实施例中,图像可为经捕捉和临时存储以用于在预览模式期间显示的预览图像。在另一实施例中,可在可在较长时间周期内存储图像的图像捕捉模式中捕捉图像。
在一些实施例中,图像传感器控制单元352可从存储单元320接收包含一或多个文字区域的一或多个预览图像,且基于预览图像调整用于图像传感器130的至少一个图像捕捉参数。举例来说,图像传感器控制单元352可通过确定用于图像中的每一个的清晰度值来确定预览图像中的每一个的聚焦值。如果预览图像的聚焦值小于阈值聚焦值,那么图像传感器控制单元352可调整用于图像传感器130的至少一个图像捕捉参数当中的焦点参数。在调整图像捕捉参数后,图像传感器控制单元352可控制图像传感器130捕捉包含文字区域的一或多个后续预览图像。由于按调整的焦点参数捕捉后续预览图像,因此捕捉的图像可具有改善的图像质量,且可用于确定是否启动用于图像传感器130的闪光灯140过程中。
处理器350中的文字区域检测单元354可被配置以从存储单元320接收包含至少一个文字区域的一或多个图像,且检测所述图像中的每一个中的至少一个文字区域。给定具有至少一个文字区域的图像,可使用任何合适的文字候选提取方案(例如,斑点聚集方法、基于边缘的方法、基于连接的组分的方法、基于纹理的方法或类似者)在图像中检测一或多个候选文字区域。在检测到候选文字区域后,文字区域检测单元354可从图像中的候选文字区域中的每一个提取一组特征。文字区域检测单元354可接着基于来自存储单元320的分类器数据库产生与候选文字区域中的每一个相关联的用于所述一组特征的分类评分。替代地,可经由通信单元330从外部装置接收分类器数据库。基于与候选文字区域相关联的分类评分,文字区域检测单元354可识别图像中的至少一个文字区域。
在识别一或多个图像中的至少一个文字区域后,文字区域检测单元354即可确定表征所述图像中的至少一个文字区域的特征数据。在一个实施例中,文字区域检测单元354可通过确定至少一个文字区域的色彩值、强度值、边界、文字置信度值、极性值等来产生用于至少一个文字区域的特征数据。可接着将特征数据提供到闪光灯控制单元358以用于确定是否启动用于图像传感器130的闪光灯140。
提供到文字区域检测单元354的包含至少一个文字区域的一或多个图像也可提供到处理器350中的反射区域识别单元356。反射区域识别单元356可被配置以识别所述图像中的每一个中的一或多个候选镜面反射区域。在一个实施例中,反射区域识别单元356可确定用于具有至少一个文字区域的图像中的每一个中的多个像素的多个色彩值,且识别每一图像中具有指示作为候选镜面反射区域的白色的色彩值的一或多个区域。在另一实施例中,可将具有至少一个文字区域的图像转换成具有多个灰阶像素的灰阶图像,且可基于用于灰阶图像中的灰阶像素的强度值识别一或多个候选反射区域。举例来说,如果将用于一或多个区域中的灰阶像素的强度值中的每一个确定为指示白色,那么可将所述一或多个区域识别为候选镜面反射区域。可将识别的候选镜面反射区域提供到闪光灯控制单元358,以供在确定是否启动用于图像传感器130的闪光灯140时使用。
处理器350中的闪光灯控制单元358可被配置以在从文字区域检测单元354接收到表征一或多个识别的文字区域和从反射区域识别单元356接收到表征一或多个候选镜面反射区域的特征数据后即确定是否启动闪光灯140。在一个实施例中,闪光灯控制单元358可基于特征数据从候选镜面反射区域选择位于识别的文字区域外的一或多个镜面反射区域。举例来说,可基于表征识别的文字区域的特征数据(例如,边界数据、强度数据、置信度数据、清晰度数据或类似者)从候选镜面反射区域选择一或多个镜面反射区域。在确定了闪光灯140将被启动后,闪光灯控制单元358即可响应于用户110的输入或命令来启动闪光灯140以捕捉包含文字区域的一或多个后续图像。
根据一个实施例,闪光灯控制单元358可访问存储单元320中的字符信息数据库且从接受的候选镜面反射区域选择一或多个镜面反射区域。举例来说,闪光灯控制单元358可通过比较接受的候选镜面反射区域中的字符的一或多个笔划宽度与来自字符信息数据库的参考字符的笔划宽度来确定接受的候选镜面反射区域的任何部分是否对应于文字区域的任何部分。如果将笔划宽度确定为类似性超出类似性阈值,那么可将位于文字区域的一或多个部分外的候选镜面反射区域的至少一部分选择为一或多个镜面反射区域。替代地,可经由通信单元330从外部装置接收字符信息数据库。基于选定镜面反射区域,闪光灯控制单元358可确定是否启动闪光灯140以用于捕捉包含文字区域的一或多个后续图像。
在一些实施例中,闪光灯控制单元358也可接收包含至少一个文字区域的一或多个捕捉的图像,且确定指示接受的图像中的每一个中的选定镜面反射区域的分散度的分散值。可通过使用选定镜面反射区域的位置、色彩强度、色彩直方图、二进制化形状等来表示选定镜面反射区域的分散值。举例来说,闪光灯控制单元358可确定每一图像中的选定镜面反射区域中的每一个的位置,且计算选定镜面反射区域的分散值。如果用于选定镜面反射区域的分散值小于阈值分散值,那么闪光灯控制单元358可确定将为图像传感器130启动闪光灯140。
另外或替代地,闪光灯控制单元358可基于选定镜面反射区域对接收的图像中的每一个的面积的比率来确定是否启动闪光灯140。在一个实施例中,可通过将图像的选定镜面反射区域中的像素的数目除以图像中的像素的总数来计算比率。如果比率大于或等于阈值比率值,那么闪光灯控制单元358可确定将启动闪光灯140。
在确定将为图像传感器130启动闪光灯140后,闪光灯控制单元358即可调整待从闪光灯140输出的光的强度。在一个实施例中,可基于从传感器单元340接收的特征数据和几何信息中的至少一个调整光的强度。举例来说,如果用于识别的文字区域的特征数据的清晰度值小于阈值清晰度值,那么闪光灯控制单元358可增大待从闪光灯140输出的光的强度。几何信息可包含一或多个文字区域到电子装置120的深度信息(例如,深度或距离),和安置文字区域的平面与安置电子装置120的平面之间的角度。在此情况下,如果角度小于阈值角度,那么闪光灯控制单元358可增大待从闪光灯140输出的光的强度。
另外或替代地,闪光灯140可可移动地安置于电子装置120上,且闪光灯控制单元358可基于从传感器单元340接收的几何信息调整闪光灯140的方向。在一个实施例中,可基于安置文字区域的平面与安置电子装置120的平面之间的角度调整闪光灯140的方向。举例来说,如果用于电子装置120与文字区域的平面相互平行,那么闪光灯控制单元358可调整闪光灯140的方向以防止来自可从闪光灯140输出的光的镜面反射效应。
图4展示根据本发明的一个实施例的被配置以检测图像中的一或多个文字区域和确定表征所述一或多个文字区域的特征数据的文字区域检测单元354的框图。文字区域检测单元354可包含候选文字区域检测单元410、特征提取单元420、分类评分确定单元430、文字区域识别单元440和特征数据确定单元450。为了检测所述文字区域中的多个,文字区域检测单元354可与存储单元320通信。
在文字区域检测单元354中,候选文字区域检测单元410可被配置以接收场景的一或多个图像且检测图像中的一或多个候选文字区域。在一个实施例中,可通过确定在候选文字区域中具有一或多个类似性质(例如,大小、色彩、图案和类似者)的一或多个斑点来检测图像中的候选文字区域。在确定图像中的斑点后,候选文字区域检测单元410可在斑点聚集操作中聚集所述斑点。举例来说,可将具有相同或类似色彩且位置接近的多个斑点聚集到斑点群集内。也可针对偏斜校正斑点群集中的每一个,和将其过滤以去除伪影。此外,可将有色彩的斑点群集转换成呈灰阶的斑点群集。在另一实施例中,可基于任一其它合适的文字候选提取方案(例如,基于边缘的方法、基于连接的组分的方法、基于纹理的方法或类似者)在图像中检测一或多个候选文字区域。从检测的候选文字区域,候选文字区域检测单元410可确定图像中的候选文字区域的一或多个位置和大小。然后可将在图像中检测到的候选文字区域(例如,候选文字区域的位置和大小)提供到文字区域检测单元354中的特征提取单元420。
特征提取单元420可被配置以从候选文字区域检测单元410接收候选文字区域和从候选文字区域中的每一个提取一或多个特征。可通过使用任何合适的特征提取技术(例如,边缘检测技术、尺度不变特征变换技术、模板匹配技术、霍夫变换技术等)从相关联的候选文字区域提取特征。在一个实施例中,可将从候选文字区域提取的一或多个特征表示为特征向量。可接着将从候选文字区域提取的特征提供到文字区域检测单元354中的分类评分确定单元430。
分类评分确定单元430可被配置以从特征提取单元420接收用于候选文字区域中的每一个的一或多个特征,且针对预定语言产生分类评分。从存储单元320,可访问与多种语言(例如,英语、法语、德语和类似者)相关联的分类器数据库460以用于识别候选文字区域是否包含与预定语言相关联的文字(例如,字符)。分类器数据库460可包含与多种语言相关联的多个概率模型。可使用例如SVM(支持向量机)、神经网络、MQDF(修正的二次判别函数)等的任一合适分类方法产生概率模型。举例来说,针对语言的概率模型可由用于对应于所述语言的特征的概率分布函数(例如,多变量高斯分布)表示。
在一个实施例中,分类评分确定单元430可基于用于相关联的候选文字区域的经提取特征和用于预定语言的概率模型产生针对候选文字区域中的每一个的分类评分。举例来说,如果通过用户110的输入或命令将用于识别文字区域的语言预确定为英语,那么可基于英语的概率模型产生针对候选文字区域的分类评分。针对候选文字区域的分类评分可指示候选文字区域的一或多个特征与用于英语的概率模型相关联的概率。在另一实施例中,分类评分确定单元430可基于用于候选文字区域中的每一个的一或多个特征确定针对多个概率模型的多个分类评分以识别候选文字区域是否包含与针对概率模型的语言中的每一个相关联的文字。可接着将针对候选文字区域的分类评分提供到文字区域检测单元354中的文字区域识别单元440。
根据一些实施例,文字区域识别单元440可被配置以基于从分类评分确定单元430接收的分类评分识别来自候选文字区域的一或多个文字区域。在一个实施例中,可通过确定针对候选文字区域的分类评分超过预定阈值评分来将候选文字区域识别为文字区域。在另一实施例中,如果接受到针对候选文字区域中的每一个的与多种语言相关联的分类评分,那么文字区域识别单元440可从分类评分选择最大分类评分且确定最大分类评分高于预定阈值评分。将分类评分和识别的文字区域(例如,位置和大小)提供到特征数据确定单元450。
特征数据确定单元450可被配置以接收一或多个图像、所述图像中的识别的文字区域(例如,识别的文字区域的位置、大小等)和用于识别的文字区域的分类评分,以用于在确定表征识别的文字区域的特征数据时使用。所述特征数据可包含描述或涉及识别的文字区域的数据或信息,例如,文字区域的边界数据、文档类型数据、置信度数据、平均强度数据、直方图数据、极性数据、清晰度数据等。为了产生用于文字区域的特征数据,特征数据确定单元450可计算用于识别的文字区域的边界、文档类型、文字置信度值、强度值、极性值、清晰度值等。虽然将特征数据说明为在识别的文字区域中确定,但特征数据确定单元450可确定表征包含识别的文字区域的部分的特征数据,以用于在启动用于图像传感器130的闪光灯140时使用。
特征数据确定单元450可基于识别的文字区域和用于文字区域的分类评分确定边界数据、文档类型数据和置信度数据。在一个实施例中,可基于文字区域的一或多个位置和大小计算图像中的识别的文字区域的一或多个边界。此外,可通过访问存储单元320中可将多个预定文档类型映射到文字区域的布置或布局(例如,文字区域的预定位置和大小)和来自闪光灯140的光的预定强度的文档类型数据库470来确定文档类型数据。替代地,可经由通信单元330从外部装置接收文档类型数据库470。举例来说,特征数据确定单元450可基于识别的文字区域的位置和大小选择文档类型数据库470中的多个文档类型当中的文档类型(例如,杂志)。在此情况下,选定文档类型可相关联于与识别的文字区域的位置和大小相同或类似的一或多个预定位置和大小。根据一些实施例,可基于用于文字区域的分类评分来确定文字区域的置信度数据。举例来说,可将文字区域的置信度值确定为与文字区域的分类评分成比例。
根据一些实施例,特征数据确定单元450可基于图像中的文字区域的一或多个强度值来确定文字区域的平均强度数据和直方图数据。举例来说,特征数据确定单元450可通过计算文字区域中的每一个的多个像素的强度值和强度值的平均值来确定平均强度数据。此外,可通过对计算的强度值中的每一个的数目计数和基于计数的数目创建直方图来确定直方图数据。
特征数据确定单元450可计算图像中的文字区域的强度值,连同图像中的非文字区域的多个像素的强度值,以确定文字区域的极性数据。举例来说,可基于文字区域的平均强度值对非文字区域的平均强度值的比率确定图像中的文字区域的极性值。在一个实施例中,可通过计算文字区域中的每一个的清晰度值来确定文字区域的清晰度数据。然后可将确定的特征数据提供到闪光灯控制单元358以用于响应于用户的输入或命令确定是否启动闪光灯140,以捕捉包含识别的文字区域的一或多个后续图像。
图5为根据本发明的一个实施例的被配置以识别在具有文字的目标的图像中的一或多个候选镜面反射区域的反射区域识别单元356的框图。反射区域识别单元356可包含文字部分提取单元510、色彩值确定单元520和候选镜面反射区域检测单元530。虽然展示反射区域识别单元356具有文字部分提取单元510,但其可被配置以识别图像中无文字部分提取单元510的候选镜面反射区域。
反射区域识别单元356中的文字部分提取单元510可被配置以接收提供到文字区域检测单元354的一或多个图像,以及在来自文字区域检测单元354的图像中检测到的一或多个文字区域。在一个实施例中,文字部分提取单元510可从图像提取包含一或多个文字区域的部分。文字部分提取单元510可将包含一或多个文字区域的提取的部分提供到反射区域识别单元356中的色彩值确定单元520。
色彩值确定单元520可确定提取的部分中的多个像素的多个色彩值。在一个实施例中,像素中的每一个的色彩值可表示RGB色彩模型或空间中的像素的色彩,且包含红(R)、绿(G)、蓝(B)值的任何组合。举例来说,R、G和B值中的每一个可指示包含范围从0到255的8位色码。在另一实施例中,色彩值确定单元520可将提取的部分分段成多个部分(例如,N×M个像素),且计算所述部分中的每一个中的多个相邻像素的平均色彩值以用于确定提取的部分的多个色彩值。色彩值确定单元520可将提取的部分的色彩值(例如,R、G、B值或其任何组合)提供到反射区域识别单元356中的候选镜面反射区域检测单元530。虽然将色彩值确定单元520描述为使用RGB色彩模型或空间,但其也可使用任何合适的色彩模型或空间,例如,HSV、CMYK、HSL、LAB、HSI、YUV或类似者。
候选镜面反射区域检测单元530可基于用于提取的部分的多个色彩值来检测包含文字区域的提取的部分中的一或多个候选镜面反射区域。在一个实施例中,可将具有指示白色的色彩值的一或多个区域识别为候选镜面反射区域。在此情况下,白色可表示由R、G和B色的任何合适组合产生的色彩。举例来说,白色可由在用于R、G和B值中的每一个的色彩值的预定范围(例如,250到255)中的值表示。可将识别的候选镜面反射区域提供到闪光灯控制单元358,以用于在确定是否启动用于图像传感器130的闪光灯140时使用。另外,候选镜面反射区域检测单元530可确定检测的候选镜面反射区域的二进制化形状。在此情况下,候选镜面反射区域检测单元530也可将二进制化形状提供闪光灯控制单元358,闪光灯控制单元358可基于二进制化形状确定来自候选镜面反射区域的一或多个镜面反射区域。
图6为根据本发明的一个实施例的用于基于包含至少一个文字区域的一或多个图像自动启动电子装置120的闪光灯140以用于捕捉包含至少一个文字区域的图像的方法600的流程图。一开始,在610,电子装置120中的处理器350可接收包含至少一个文字区域的第一图像且将第一图像分别提供到处理器350中的文字区域检测单元354和反射区域识别单元356。在一个实施例中,电子装置120的图像传感器130可捕捉至少一个文字区域的图像,作为第一图像。在620,文字区域检测单元354可接收第一图像且确定表征至少一个文字区域的特征数据,如上参看图4所描述。
在630,反射区域识别单元356可识别第一图像中的至少一个候选镜面反射区域。在一个实施例中,可确定用于第一图像中的多个像素的多个色彩值,以用于识别至少一个候选镜面反射区域,如上参看图5所描述。在另一实施例中,反射区域识别单元356可将第一图像转换成具有多个灰阶像素的灰阶图像,且接着确定多个灰阶像素的强度。在此情况下,如果将用于一或多个区域中的灰阶像素的强度值中的每一个确定为指示白色,那么可将所述一或多个区域识别为至少一个候选镜面反射区域。举例来说,倘若给定8位强度码,那么白色可由值“255”或大体上类似于或靠近值“255”的值(例如,“250”、“251”、“252”、“253”和“254”)表示。
在640,闪光灯控制单元358可基于从文字区域检测单元354接收的特征数据和从反射区域识别单元356接收的至少一个候选镜面反射区域启动用于图像传感器130的闪光灯140。此外,闪光灯控制单元358可调整来自闪光灯140的光的强度和/或闪光灯140的方向以用于在启动闪光灯140时使用。在启动闪光灯140后,在650,图像传感器130可捕捉包含至少一个文字区域的第二图像。
图7为根据本发明的一个实施例的由被配置以基于表征文字区域的特征数据从包含文字区域的图像中的一或多个候选镜面反射区域选择一或多个镜面反射区域的闪光灯控制单元358执行的方法700的流程图。一开始,在710,闪光灯控制单元358可从反射区域识别单元356接收图像中的一或多个镜面反射区域。此外,在720,可从文字区域检测单元354接收表征图像中的文字区域的特征数据。举例来说,特征数据可包含文字区域的平均强度值、文字置信度值、清晰度值、边界等。虽然展示方法700具有表征一个文字区域的特征数据,但闪光灯控制单元358可基于表征多个文字区域的特征数据从一或多个候选反射镜面反射区域选择一或多个镜面反射区域。在此情况下,闪光灯控制单元358可针对文字区域中的每一个执行方法700以从候选镜面反射区域选择镜面反射区域。
方法700可在730确定文字区域的平均强度值是否大于或等于预定阈值强度值。如果确定平均强度值大于或等于预定阈值强度值(即,在730,是),那么方法可继续进行到740且闪光灯控制单元358可确定文字区域的文字置信度值是否大于或等于预定阈值置信度值。否则(即,在730,否),在770,可将候选镜面反射区域识别为一或多个镜面反射区域,用于在确定是否启动闪光灯140时使用。如果确定文字区域的文字置信度值大于或等于预定阈值置信度值(即,在740,是),那么方法可继续进行到750且闪光灯控制单元358可确定文字区域的清晰度值是否大于或等于预定清晰度值。否则(即,在740,否),在770,闪光灯控制单元358可将候选镜面反射区域识别为镜面反射区域。如果确定清晰度值大于或等于预定清晰度值(即,在750,是),那么在760,闪光灯控制单元358可基于文字区域的边界从候选镜面反射区域选择位于文字区域外的一或多个区域,作为镜面反射区域。否则(即,在750,否),在770,可将候选镜面反射区域识别为镜面反射区域。虽然如果在740到760满足三个条件,那么将方法700说明为继续进行到760,但闪光灯控制单元358可被配置以如果满足所述条件中的至少一个,那么从候选镜面反射区域选择在文字区域外的一或多个镜面反射区域。替代地,文字区域检测单元354可包含分类模块,其被配置以通过使用例如SVM(支持向量机)、神经网络等的任一合适分类方法基于文字区域的平均强度、文字置信度、清晰度等来产生一或多个分类器。分类模块可使用分类器识别来自一或多个候选镜面反射区域的一或多个镜面反射区域。
图8描述根据本发明的一个实施例的用于识别具有多个文字区域180和190的目标170的图像810中的多个候选镜面反射区域180、190和820且选择多个候选镜面反射区域180、190、820当中的位于多个文字区域180和190外的镜面反射区域820的流程图。图像传感器130可不使用闪光灯140捕捉包含具有多个文字区域180和190的目标170(例如,杂志)的图像810。如所展示,图像810可包含具有色彩为白色的文字字符“Magazine”的文字区域180和具有色彩为白色的文字字符“Headline”的文字区域190。此外,图像810可包含镜面反射区域820,其可由白色表征且由光从光源的镜面反射造成。
在捕捉到图像810后,处理器350中的文字区域检测单元354可检测图像810中的多个文字区域180和190且确定表征文字区域180和190的特征数据。在一个实施例中,可通过检测图像中的多个候选文字区域和基于存储单元320中的分类器数据库460产生从候选文字区域中的每一个提取的一组特征的分类评分来识别多个文字区域180和190。此外,特征数据确定单元450可确定用于文字区域180和190的边界、文字置信度值、平均强度值、清晰度值等以产生特征数据,如上参看图4所描述。然后可将表征图像810中的文字区域180和190的特征数据提供到处理器350中的闪光灯控制单元358。
处理器350中的反射区域识别单元356可识别来自图像810的多个候选镜面反射区域180、190和820。在此过程中,反射区域识别单元356中的文字部分提取单元510可从图像810提取包含文字区域180和190的部分830。根据一个实施例,反射区域识别单元356中的色彩值确定单元520可确定提取的部分830中的多个像素的多个色彩值,且识别候选镜面反射区域180、190和820,其中的每一个具有指示白色的色彩值。然后可将图像810中的识别的候选镜面反射区域180、190和820提供到处理器350中的闪光灯控制单元358。
闪光灯控制单元358可接收表征文字区域180和190和候选镜面反射区域180、190和820的特征数据(例如,边界、文字置信度值、平均强度值、清晰度值等)。可基于用于文字区域180和190的边界、文字置信度值和清晰度值中的至少一个从候选镜面反射区域180、190和820选择位于识别的文字区域180和190外的镜面反射区域820,如上参看图7所描述。在此情况下,闪光灯控制单元358可基于表示图像810中的文字区域180和190的位置和大小的边界从候选镜面反射区域180、190和820选择镜面反射区域820。基于提取的部分830中的镜面反射区域820,闪光灯控制单元358可确定将启动闪光灯140以用于捕捉包含目标170的一或多个后续图像。
图9为根据本发明的一个实施例的由闪光灯控制单元358执行以用于基于字符信息数据库910和包含至少一个文字区域的图像中的一或多个候选镜面反射区域启动闪光灯140的方法的框图。闪光灯控制单元358可从反射区域识别单元356接收图像中的候选镜面反射区域。此外,闪光灯控制单元358可与包含字符信息数据库910的存储单元320通信。根据一个实施例,闪光灯控制单元358可被配置以存取存储单元320中的字符信息数据库910且从接受的候选镜面反射区域选择一或多个镜面反射区域。字符信息数据库910可包含在多种语言(例如,英语、法语、德语、中文等)中的每一种使用的多个字符的图案或几何数据、表示多个字符的标志符号的图像和/或与每一个别标志符号相关联的至少一个特征。
在一些实施例中,闪光灯控制单元358可基于字符信息数据库910识别重叠接受的候选镜面反射区域的至少一个文字区域,以用于从候选镜面反射区域选择镜面反射区域。举例来说,闪光灯控制单元358可识别候选镜面反射区域中的一或多个图案或符号(例如,字符的一或多个笔划宽度)且将识别的图案或符号与来自字符信息数据库910的多个字符的图案或几何数据比较。在此情况下,如果确定识别的图案或符号与针对某一语言中的指定字符的图案或几何数据之间的类似性超过预定类似性阈值,那么可将接受的候选镜面反射区域中的图案或符号辨识为指定字符。闪光灯控制单元358可接着从接受的候选镜面反射区域选择位于用于指定字符的图案和符号外的一或多个区域,作为镜面反射区域。基于选定镜面反射区域,闪光灯控制单元358可确定是否启动闪光灯140以用于响应于用户110的输入或命令而捕捉包含至少一个文字区域的一或多个后续图像。
图10为根据本发明的一个实施例的由闪光灯控制单元358执行的方法1000的流程图,所述闪光灯控制单元358被配置以基于选自包含至少一个文字区域的第一图像中的一或多个候选镜面反射区域的一或多个镜面反射区域来确定是否启动用于图像传感器130的闪光灯140。在1010,从候选镜面反射区域,闪光灯控制单元358可选择位于至少一个文字区域外的镜面反射区域。在1020,可基于在第一图像中的相关联的镜面反射区域中的多个像素的位置来确定选定镜面反射区域中的每一个的位置。
在1030,闪光灯控制单元358可基于选定镜面反射区域的位置确定用于第一图像中的选定镜面反射区域的分散值。在此情况下,分散值可指示用于第一图像中的选定镜面反射区域的分散度。在1040,方法1000可确定镜面反射区域的分散值是否小于阈值分散值。如果确定分散值小于阈值(即,在1040,是),那么方法1000可继续进行到1050,且闪光灯控制单元358可确定镜面反射区域对第一图像的面积的比率。举例来说,闪光灯控制单元358可将图像中的镜面反射区域中的像素的数目除以图像中的像素的总数以确定比率。否则(即,在1040,否),方法可继续进行到1080,且图像传感器130可在不启动闪光灯140的情况下捕捉包含至少一个文字区域的第二图像。
在确定了镜面反射区域对第一图像的面积的比率后,方法1000可在1060确定所述比率是否大于或等于阈值比率。如果确定所述比率大于或等于阈值比率(即,在1060,是),那么闪光灯控制单元358可继续进行到1070,且图像传感器130可在启动用于图像传感器130的闪光灯140后即捕捉包含至少一个文字区域的第二图像。另一方面,如果确定所述比率小于阈值比率(即,在1060,否),那么在1080,图像传感器130可在不启动闪光灯140的情况下捕捉包含至少一个文字区域的第二图像。虽然将方法1000说明为如果在1040和1060满足两个条件,那么继续进行到1070,但闪光灯控制单元358可允许如果满足所述条件中的至少一个,那么图像传感器130在启动闪光灯140后即捕捉包含至少一个文字区域的第二图像。替代地,文字区域检测单元354可通过使用例如SVM(支持向量机)、神经网络等的任一合适分类方法而基于用于选定镜面反射区域的分散值和阈值比率来产生一或多个分类器。分类器可接着用以确定是否启动闪光灯140以用于捕捉第二图像。
图11说明根据本发明的一个实施例的由闪光灯控制单元358执行以用于基于表征图像中的一或多个文字区域的特征数据和文档类型数据库470调整待从闪光灯140输出的光的强度的方法的框图。闪光灯控制单元358可从文字区域检测单元354接收包含文档类型、一或多个清晰度值、一或多个平均强度值等的特征数据。在一个实施例中,闪光灯控制单元358可被配置以访问存储单元320中的文档类型数据库470以用于基于特征数据中的接收到的文档类型调整待从闪光灯140输出的光的强度。文档类型数据库470可将多个预定文档类型(例如,杂志、商务名片、日历等)映射到来自闪光灯140的光的多个预定强度,和类似者。举例来说,闪光灯控制单元358可从光的多个预定强度选择与接收的文档类型相关联的光的预定强度,作为待从闪光灯140输出的光的强度。
根据一些实施例,闪光灯控制单元358可被配置以基于接受的特征数据中的清晰度值和平均强度值中的至少一个调整来自闪光灯140的光的强度。举例来说,可将来自闪光灯140的光的强度确定为与特征数据的清晰度值和平均强度值中的至少一个成反比。在另一实例中,如果特征数据的清晰度值小于阈值清晰度值,那么闪光灯控制单元358可增大待从闪光灯140输出的光的强度。另外或替代地,如果特征数据的平均强度值小于阈值强度值,那么闪光灯控制单元358可增大待从闪光灯140输出的光的强度。可将光的经调整强度提供到闪光灯140,以用于在启动用于图像传感器130的闪光灯140时使用。
图12为根据本发明的一个实施例的由闪光灯控制单元358执行以用于通过基于来自一或多个传感器的传感器数据调整待从闪光灯140输出的光的强度和闪光灯140的方向中的至少一个来启动用于图像传感器130的闪光灯140的方法1200的流程图。一开始,在1210,闪光灯控制单元358可从电子装置120中的回转仪342、加速度计344和深度传感器346中的至少一个接收传感器数据。在1220,传感器数据可用于确定指示图像传感器130到图像中的一或多个文字区域的深度信息(例如,深度或距离)、安置文字区域的平面与安置图像传感器130的平面之间的角度等的几何信息。
在1230,闪光灯控制单元358可基于几何信息(即,深度信息或文字区域的平面与图像传感器的平面之间的角度)调整待从闪光灯140输出的强度和闪光灯140的方向中的至少一个。根据一个实施例,如果角度小于第一阈值角度,那么闪光灯控制单元358可增大待从闪光灯140输出的光的强度。此外,如果角度高于或等于第二阈值角度,那么闪光灯控制单元358可减小待从闪光灯140输出的光的强度。在此情况下,第二阈值角度可大于第一阈值角度。根据一些实施例,可将闪光灯140可移动地安置于电子装置120上,且可基于文字区域的平面与电子装置120或图像传感器130的平面之间的角度调整闪光灯140的方向。举例来说,如果用于电子装置120的平面平行于用于文字区域的平面,那么闪光灯控制单元358可调整闪光灯140的方向以防止来自可从闪光灯140输出的光的镜面反射效应。在调整来自闪光灯140的光的强度和/或闪光灯140的方向后,在1240,可根据调整的强度和调整的方向中的至少一个启动闪光灯。
图13为根据本发明的一个实施例的可实施用于自动启动用于电子装置的图像传感器的闪光灯的方法和设备的示范性电子装置的框图。可根据参看图1到12描述的以上实施例在电子装置中实施电子装置1300的配置。电子装置1300可为蜂窝式电话、智能电话、平板计算机、膝上型计算机、终端、手持机、个人数字助理(PDA)、无线调制解调器、无绳电话等。无线通信系统可为码分多址(CDMA)系统、用于移动通信的广播系统(GSM)系统、宽带CDMA(WCDMA)系统、长期演进(LTE)系统、高级LTE系统等。另外,电子装置1300可直接与另一移动装置通信,例如,使用Wi-Fi Direct或蓝牙。
电子装置1300能够经由接收路径和发射路径提供双向通信。在接收路径上,基站所发射的信号被天线1312接收且提供到接收器(RCVR)1314。接收器1314调节且数字化接收到的信号且将样本(例如,经调节且经数字化的数字信号)提供到数字区段以用于进一步处理。在发射路径上,发射器(TMTR)1316从数字区段1310接收待发射的数据,处理并调节所述数据,且产生经调制信号,所述经调制信号经由天线1312发射到基站。接收器1314和发射器1316可为可支持CDMA、GSM、LTE、高级LTE等的收发器的部分。
数字区段1310包含各种处理、接口和存储器单元,例如,调制解调器处理器1322、精简指令集计算机/数字信号处理器(RISC/DSP)1324、控制器/处理器1326、内部存储器1328、一般化音频/视频编码器1332、一般化音频解码器1334、图形/显示处理器1336和外部总线接口(EBI)1338。调制解调器处理器1322可执行供数据发射和接收的处理,例如,编码、调制、解调和解码。RISC/DSP 1324可执行针对电子装置1300的通用和专用处理。控制器/处理器1326可执行数字区段1310内的各种处理和接口单元的操作。内部存储器1328可将用于各种单元的数据和/或指令存储在数字区段1310内。
一般化音频/视频编码器1332可执行针对来自音频/视频源1342、麦克风1344和图像传感器1346等的输入信号的编码。一般化音频解码器1334可执行对于经译码音频数据的解码且可将输出信号提供到扬声器/耳机1348。图形/显示处理器1336可执行对于可呈现给显示单元1350的图形、视频、图像和文本的处理。EBI 1338可促进数字区段1310与主存储器1352之间的数据的传送。
数字区段1310可用一或多个处理器、DSP、微处理器、RISC等来实施。数字区段1310还可制造于一或多个专用集成电路(ASIC)和/或某一其它类型的集成电路(IC)上。
一般来说,本文中描述的任一装置可表示各种类型装置,例如,无线电话、蜂窝式电话、膝上型计算机、无线多媒体装置、无线通信个人计算机(PC)、卡、PDA、外部或内置调制解调器、通过无线频道通信的装置等。装置可具有各种名称,例如,接入终端(AT)、存取单元、订户单元、移动台、移动装置、移动单元、移动电话、移动、远程站、远程终端、远程单元、用户装置、用户装备、手持式装置等。本文中描述的任一装置可具有用于存储指令和数据的存储器,以及硬件、软件、固件或其组合。
可通过各种装置实施本文中所描述的技术。举例来说,这些技术可以硬件、固件、软件或其组合来实施。所属领域的技术人员将进一步了解,结合本文中的揭示内容描述的各种说明性逻辑块、模块、电路和算法步骤可实施为电子硬件、计算机软件或两者的组合。为清楚地说明硬件与软件的此可互换性,以上已大体就其功能性来描述了各种说明性组件、块、模块、电路以及步骤。此功能性是实施为硬件还是软件取决于特定应用及强加于整个系统的设计约束。熟练的技术人员可针对每一特定应用以不同方式实施所描述的功能性,但此类实施决策不应被解释为引起对本发明的范围的偏离。
对于硬件实施方案,用以执行所述技术的处理单元可实施在以下各者内:一或多个ASIC、DSP、数字信号处理装置(DSPD)、可编程逻辑装置(PLD)、现场可编程门阵列(FPGA)、处理器、控制器、微控制器、微处理器、电子装置、经设计以执行本文中所描述的功能的其它电子单元、计算机或其组合。
因此,结合本文中的揭示内容描述的各种说明性逻辑块、模块和电路可以用通用处理器、DSP、ASIC、FPGA或经设计以执行本文中描述的功能的其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件或其任何组合来实施或执行。通用处理器可以是微处理器,但在替代方案中,处理器可以是任何常规处理器、控制器、微控制器或状态机。处理器还可实施为计算装置的组合,例如,DSP与微处理器的组合、多个微处理器、一或多个微处理器结合DSP核心或任何其它此类配置。
如果以软件实施,那么可将所述功能作为一或多个指令或代码而存储在计算机可读媒体上或经由计算机可读媒体发射。计算机可读媒体包含计算机存储媒体与通信媒体两者,所述通信媒体包含促进将计算机程序从一处传送到另一处的任何媒体。存储媒体可为可以由计算机存取的任何可用媒体。通过实例且不受限制,此类计算机可读媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置,或可用以携载或存储呈指令或数据结构形式的所要程序代码且可由计算机存取的任何其它媒体。另外,将任何连接恰当地称为计算机可读媒体。举例来说,如果使用同轴电缆、光纤电缆、双绞线、数字订户线(DSL)或例如红外线、无线电和微波的无线技术从网站、服务器或其它远程源发射软件,那么同轴电缆、光纤电缆、双绞线、DSL或例如红外线、无线电和微波的无线技术包含于媒体的定义中。如本文所使用,磁盘和光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软性磁盘和蓝光光盘,其中磁盘通常以磁性方式再现数据,而光盘用激光以光学方式再现数据。以上各者的组合也应包含在计算机可读媒体的范围内。
提供本发明的先前描述以使所属领域的技术人员能够制造或使用本发明。所属领域的技术人员将易于明白对本发明的各种修改,且本文中定义的一般原理在不脱离本发明的精神或范围的情况下被应用于其它变体。因此,本发明并不希望限于本文中所描述的实例,而应符合与本文中所揭示的原理和新颖特征相一致的最广泛范围。
尽管利用在一或多个独立计算机系统的背景下的目前揭示的标的物的方面来提及示例性实施方案,但所述标的物不受如此限制,而是相反地,可结合任何计算环境(例如,网络或分布式计算环境)来实施。此外,目前揭示的标的物的方面可在多个处理芯片或装置中或跨多个处理芯片或装置实施,且可类似地跨多个装置影响存储。此类装置可包含PC、网络服务器和手持式装置。
尽管已经以特定地针对结构特征和/或方法动作的语言来描述标的物,但应理解,所附权利要求书中所定义的标的物未必限于以上描述的具体特征或动作。相反地,揭示以上描述的具体特征和动作,作为实施权利要求的实例形式。

Claims (30)

1.一种自动启动用于电子装置的图像传感器的闪光灯的由所述电子装置执行的方法,所述方法包括:
接收包含至少一个文字区域的第一图像;
确定表征所述第一图像中的所述至少一个文字区域的特征数据;
识别所述第一图像中的至少一个候选镜面反射区域;
基于所述特征数据和所述至少一个候选镜面反射区域,启动所述闪光灯;以及
在启动所述闪光灯后,即捕捉包含所述至少一个文字区域的第二图像。
2.根据权利要求1所述的方法,其中接收所述第一图像包括接收在预览模式中的包含所述至少一个文字区域的所述第一图像。
3.根据权利要求1所述的方法,其中确定所述特征数据包括:
检测所述第一图像中的所述至少一个文字区域;以及
从所述至少一个文字区域确定包含置信度数据、边界数据、清晰度数据、文档类型数据、平均强度数据、极性数据和直方图数据中的至少一个的所述特征数据。
4.根据权利要求1所述的方法,其中识别所述至少一个候选镜面反射区域包括:
从所述第一图像提取包含所述至少一个文字区域的部分;以及
确定用于所述提取的部分中的多个像素的多个色彩值;以及
基于所述多个色彩值,识别所述至少一个候选镜面反射区域。
5.根据权利要求1所述的方法,其中启动所述闪光灯包括:
从所述至少一个候选镜面反射区域选择位于所述至少一个文字区域外的一或多个镜面反射区域;以及
基于所述一或多个镜面反射区域,启动所述闪光灯。
6.根据权利要求5所述的方法,其中启动所述闪光灯包括:
确定所述第一图像中的所述一或多个镜面反射区域的位置信息;
基于所述位置信息,计算指示用于所述第一图像中的所述一或多个镜面反射区域的分散度的分散值;以及
响应于计算所述分散值小于阈值分散值,启动所述闪光灯。
7.根据权利要求5所述的方法,其中启动所述闪光灯包括:
确定所述一或多个镜面反射区域对所述第一图像的面积的比率;以及
响应于确定所述比率大于或等于阈值比率,启动所述闪光灯。
8.根据权利要求1所述的方法,其中启动所述闪光灯包括:
基于用于所述至少一个文字区域中的至少一个字符的字符信息,识别重叠所述至少一个候选镜面反射区域的一或多个文字区域;
从至少一个候选镜面反射区域选择位于所述识别的一或多个文字区域外的一或多个镜面反射区域;以及
基于所述一或多个镜面反射区域,启动所述闪光灯。
9.根据权利要求1所述的方法,其中启动所述闪光灯包括基于表征所述至少一个文字区域的所述特征数据和来自所述电子装置中的一或多个传感器的传感器数据中的至少一个,调整从所述闪光灯输出的光的强度。
10.根据权利要求1所述的方法,其中启动所述闪光灯包括基于安置所述至少一个文字区域的平面与安置所述图像传感器的平面之间的角度,调整所述闪光灯的方向。
11.根据权利要求1所述的方法,其中启动所述闪光灯包括多次启动所述闪光灯以用于捕捉所述第二图像。
12.根据权利要求1所述的方法,其中所述第一图像包括包含所述至少一个文字区域的多个图像。
13.根据权利要求12所述的方法,其中所述电子装置包括包含所述图像传感器的多个图像传感器,且
其中所述多个图像传感器被配置以捕捉包含所述至少一个文字区域的所述多个图像和包含所述至少一个文字区域的所述第二图像。
14.根据权利要求1所述的方法,其中接收所述第一图像包括:
确定所述第一图像的聚焦值;
响应于确定所述聚焦值小于阈值聚焦值,调整用于所述图像传感器的焦点参数;
以及
基于所述调整的焦点参数,接收包含所述至少一个文字区域的另一图像,作为所述第一图像。
15.一种用于自动启动用于图像传感器的闪光灯的电子装置,包括:
处理器,其被配置以接收包含至少一个文字区域的第一图像,所述处理器包括:
文字区域检测单元,其被配置以确定表征所述第一图像中的所述至少一个文字区域的特征数据;
反射区域识别单元,其被配置以识别所述第一图像中的至少一个候选镜面反射区域;以及
闪光灯控制单元,其被配置以基于所述特征数据和所述至少一个候选镜面反射区域启动所述闪光灯,
其中所述图像传感器被配置以在启动所述闪光灯后即捕捉包含所述至少一个文字区域的第二图像。
16.根据权利要求15所述的电子装置,其中所述处理器被配置以接收在预览模式中的包含所述至少一个文字区域的所述第一图像。
17.根据权利要求15所述的电子装置,其中所述文字区域检测单元被配置以检测所述第一图像中的所述至少一个文字区域,和从所述至少一个文字区域确定包含置信度数据、边界数据、清晰度数据、文档类型数据、平均强度数据、极性数据和直方图数据中的至少一个的所述特征数据。
18.根据权利要求15所述的电子装置,其中所述反射区域识别单元被配置以从所述第一图像提取包含所述至少一个文字区域的部分,确定用于所述提取的部分中的多个像素的多个色彩值,和基于所述多个色彩值识别所述至少一个候选镜面反射区域。
19.根据权利要求15所述的电子装置,其中所述闪光灯控制单元被配置以:
从所述至少一个候选镜面反射区域选择位于所述至少一个文字区域外的一或多个镜面反射区域;以及
基于所述一或多个镜面反射区域,启动所述闪光灯。
20.根据权利要求19所述的电子装置,其中所述闪光灯控制单元被配置以:
确定所述第一图像中的所述一或多个镜面反射区域的位置信息;
基于所述位置信息,计算指示用于所述第一图像中的所述一或多个镜面反射区域的分散度的分散值;以及
响应于计算所述分散值小于阈值分散值,启动所述闪光灯。
21.根据权利要求19所述的电子装置,其中所述闪光灯控制单元被配置以:
确定所述一或多个镜面反射区域对所述第一图像的面积的比率;以及
响应于确定所述一或多个镜面反射区域对所述第一图像的所述面积的所述比率大于或等于阈值比率,启动所述闪光灯。
22.根据权利要求15所述的电子装置,其中所述闪光灯控制单元被配置以:
基于用于所述至少一个文字区域中的至少一个字符的字符信息,识别重叠所述至少一个候选镜面反射区域的一或多个文字区域;
从至少一个候选镜面反射区域选择位于所述识别的一或多个文字区域外的一或多个镜面反射区域;以及
基于所述一或多个镜面反射区域,启动所述闪光灯。
23.根据权利要求15所述的电子装置,其中所述闪光灯控制单元被进一步配置以基于表征所述至少一个文字区域的所述特征数据和来自所述电子装置中的一或多个传感器的传感器数据中的至少一个,调整从所述闪光灯输出的光的强度。
24.根据权利要求15所述的电子装置,其中所述闪光灯控制单元被进一步配置以基于安置所述至少一个文字区域的平面与安置所述图像传感器的平面之间的角度,调整所述闪光灯的方向。
25.根据权利要求15所述的电子装置,其中所述闪光灯控制单元被进一步配置以多次启动所述闪光灯以用于捕捉所述第二图像。
26.根据权利要求15所述的电子装置,其中所述第一图像包括包含所述至少一个文字区域的多个图像。
27.根据权利要求26所述的电子装置,其中所述电子装置包括包含所述图像传感器的多个图像传感器,且
其中所述多个图像传感器被配置以捕捉包含所述至少一个文字区域的所述多个图像和包含所述至少一个文字区域的所述第二图像。
28.根据权利要求15所述的电子装置,其中所述处理器进一步包括图像传感器控制单元,其被配置以确定所述第一图像的聚焦值,和响应于确定所述聚焦值小于阈值聚焦值,调整用于所述图像传感器的焦点参数,且
其中所述处理器被配置以基于所述调整的焦点参数,接收包含所述至少一个文字区域的另一图像,作为所述第一图像。
29.一种非暂时性计算机可读存储媒体,其包括用于自动启动用于电子装置中的图像传感器的闪光灯的指令,所述指令使所述电子装置的处理器执行以下操作:
接收包含至少一个文字区域的第一图像;
确定表征所述第一图像中的所述至少一个文字区域的特征数据;
识别所述第一图像中的至少一个候选镜面反射区域;
基于所述特征数据和所述至少一个候选镜面反射区域,启动所述闪光灯;以及
在启动所述闪光灯后,即捕捉包含所述至少一个文字区域的第二图像。
30.一种用于自动启动用于图像传感器的闪光灯的电子装置,包括:
用于接收包含至少一个文字区域的第一图像的装置;
用于确定表征所述第一图像中的所述至少一个文字区域的特征数据的装置;
用于识别所述第一图像中的至少一个候选镜面反射区域的装置;
用于基于所述特征数据和所述至少一个候选镜面反射区域而启动所述闪光灯的装置;以及
用于在启动所述闪光灯后即捕捉包含所述至少一个文字区域的第二图像的装置。
CN201580043668.7A 2014-08-22 2015-08-10 用于使用闪光照明捕捉具有文字的场景图像的设备和方法 Active CN106576142B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/466,659 2014-08-22
US14/466,659 US9667880B2 (en) 2014-08-22 2014-08-22 Activating flash for capturing images with text
PCT/US2015/044453 WO2016028532A1 (en) 2014-08-22 2015-08-10 Apparatus and method for capturing a scene image with text using flash illumination

Publications (2)

Publication Number Publication Date
CN106576142A true CN106576142A (zh) 2017-04-19
CN106576142B CN106576142B (zh) 2018-07-17

Family

ID=53879859

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580043668.7A Active CN106576142B (zh) 2014-08-22 2015-08-10 用于使用闪光照明捕捉具有文字的场景图像的设备和方法

Country Status (4)

Country Link
US (1) US9667880B2 (zh)
EP (1) EP3195583A1 (zh)
CN (1) CN106576142B (zh)
WO (1) WO2016028532A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110149473A (zh) * 2018-02-11 2019-08-20 东斓视觉科技发展(北京)有限公司 智能摄影调控终端、系统及其拍摄调控方法
CN110166681A (zh) * 2018-02-11 2019-08-23 东斓视觉科技发展(北京)有限公司 智能摄影调控终端、系统及其拍摄调控方法

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9667880B2 (en) * 2014-08-22 2017-05-30 Qualcomm Incorporated Activating flash for capturing images with text
US10395356B2 (en) * 2016-05-25 2019-08-27 Kla-Tencor Corp. Generating simulated images from input images for semiconductor applications
US10402673B1 (en) 2018-10-04 2019-09-03 Capital One Services, Llc Systems and methods for digitized document image data spillage recovery
US11074473B1 (en) 2020-01-21 2021-07-27 Capital One Services, Llc Systems and methods for digitized document image text contouring
CN114727220B (zh) * 2020-08-05 2022-12-27 华为技术有限公司 一种设备搜寻方法以及电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020113882A1 (en) * 2001-02-16 2002-08-22 Pollard Stephen B. Digital cameras
US20050231740A1 (en) * 2004-04-20 2005-10-20 Konica Minolta Holdings, Inc. Image input system, conversion matrix calculating method, and computer software product
CN101031930A (zh) * 2004-08-31 2007-09-05 讯宝科技公司 扫描器以及用于消除镜面反射的方法
CN101573988A (zh) * 2007-01-05 2009-11-04 微软公司 使用多个照相机减少镜面反射
CN101595418A (zh) * 2007-01-26 2009-12-02 微软公司 交替光源以减少镜面反射
CN102301694A (zh) * 2009-11-18 2011-12-28 松下电器产业株式会社 图像处理方法及图像处理装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009157129A1 (ja) 2008-06-26 2009-12-30 パナソニック株式会社 画像処理装置、画像分割プログラムおよび画像合成方法
US8610976B1 (en) 2012-06-27 2013-12-17 3M Innovative Properties Company Image enhancement methods
US9635246B2 (en) 2013-06-21 2017-04-25 Qualcomm Incorporated Systems and methods to super resolve a user-selected region of interest
US9602728B2 (en) 2014-06-09 2017-03-21 Qualcomm Incorporated Image capturing parameter adjustment in preview mode
US9667880B2 (en) * 2014-08-22 2017-05-30 Qualcomm Incorporated Activating flash for capturing images with text
US9767358B2 (en) * 2014-10-22 2017-09-19 Veridium Ip Limited Systems and methods for performing iris identification and verification using mobile devices

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020113882A1 (en) * 2001-02-16 2002-08-22 Pollard Stephen B. Digital cameras
US20050231740A1 (en) * 2004-04-20 2005-10-20 Konica Minolta Holdings, Inc. Image input system, conversion matrix calculating method, and computer software product
CN101031930A (zh) * 2004-08-31 2007-09-05 讯宝科技公司 扫描器以及用于消除镜面反射的方法
CN101573988A (zh) * 2007-01-05 2009-11-04 微软公司 使用多个照相机减少镜面反射
CN101595418A (zh) * 2007-01-26 2009-12-02 微软公司 交替光源以减少镜面反射
CN102301694A (zh) * 2009-11-18 2011-12-28 松下电器产业株式会社 图像处理方法及图像处理装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110149473A (zh) * 2018-02-11 2019-08-20 东斓视觉科技发展(北京)有限公司 智能摄影调控终端、系统及其拍摄调控方法
CN110166681A (zh) * 2018-02-11 2019-08-23 东斓视觉科技发展(北京)有限公司 智能摄影调控终端、系统及其拍摄调控方法

Also Published As

Publication number Publication date
CN106576142B (zh) 2018-07-17
WO2016028532A1 (en) 2016-02-25
US20160057331A1 (en) 2016-02-25
US9667880B2 (en) 2017-05-30
EP3195583A1 (en) 2017-07-26

Similar Documents

Publication Publication Date Title
CN106576142B (zh) 用于使用闪光照明捕捉具有文字的场景图像的设备和方法
JP6208383B2 (ja) プレビューモードにおける画像キャプチャリングパラメータ調整
KR101499379B1 (ko) 객체에서 텍스트 정보를 인식하기 위한 시스템 및 방법
JP6401873B2 (ja) 領域認識方法及び装置
RU2642404C2 (ru) Способ и устройство для извлечения области изображения
Chen et al. Robust text detection in natural images with edge-enhanced maximally stable extremal regions
RU2601185C2 (ru) Способ, система и компьютерный носитель данных для детектирования лица
CN107808120B (zh) 眼镜定位方法、装置及存储介质
US20170220886A1 (en) Method and system for reading and validating identity documents
WO2017140233A1 (zh) 文字检测方法及系统、设备、存储介质
KR101292916B1 (ko) 화상 처리 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록 매체, 휴대 단말, 및 화상 처리 방법
EP2306367A1 (en) Dual cameras face recognition device and method
WO2021017610A1 (zh) 证件真伪验证方法、装置、计算机设备及存储介质
Tabassum et al. Text detection using MSER and stroke width transform
KR20220042301A (ko) 이미지 검출 방법 및 관련 장치, 기기, 저장 매체, 컴퓨터 프로그램
KR20130066819A (ko) 촬영 이미지 기반의 문자 인식 장치 및 방법
CN107077832A (zh) 基于文本的缩略图产生
CN103488966A (zh) 一种能够识别实名制车票信息的智能手机
Gunawan et al. Performance Evaluation of Automatic Number Plate Recognition on Android Smartphone Platform.
WO2018185574A1 (en) Apparatus and method for documents and/or personal identities recognition and validation
JP2014229314A (ja) テキスト検出の方法及び装置
CN107622256A (zh) 基于面部识别技术的智能相册系统
US20230051051A1 (en) Method, apparatus, and computer-readable storage medium for recognizing characters in a digital document
Gnanavel et al. Portable camera based text and product label reading from hand-held object for blind persons
Fuchida et al. Character extraction from the region pointed at with a fingertip for the visually handicapped

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant