CN107111865A - 基于文本的图像调整大小 - Google Patents

基于文本的图像调整大小 Download PDF

Info

Publication number
CN107111865A
CN107111865A CN201580071945.5A CN201580071945A CN107111865A CN 107111865 A CN107111865 A CN 107111865A CN 201580071945 A CN201580071945 A CN 201580071945A CN 107111865 A CN107111865 A CN 107111865A
Authority
CN
China
Prior art keywords
image
text
size
text area
seam
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201580071945.5A
Other languages
English (en)
Inventor
柳昇佑
李熙硕
金志勋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN107111865A publication Critical patent/CN107111865A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/04Context-preserving transformations, e.g. by using an importance map
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3872Repositioning or masking
    • H04N1/3873Repositioning or masking defined only by a limited number of coordinate points or parameters, e.g. corners, centre; for trimming
    • H04N1/3875Repositioning or masking defined only by a limited number of coordinate points or parameters, e.g. corners, centre; for trimming combined with enlarging or reducing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2210/00Indexing scheme for image generation or computer graphics
    • G06T2210/22Cropping
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2320/00Control of display operating conditions
    • G09G2320/06Adjustment of display parameters
    • G09G2320/0613The adjustment depending on the type of the information to be displayed
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2340/00Aspects of display data processing
    • G09G2340/04Changes in size, position or resolution of an image
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2340/00Aspects of display data processing
    • G09G2340/04Changes in size, position or resolution of an image
    • G09G2340/045Zooming at least part of an image, i.e. enlarging it or shrinking it
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2340/00Aspects of display data processing
    • G09G2340/14Solving problems related to the presentation of information to be displayed

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Hardware Design (AREA)
  • Signal Processing (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Controls And Circuits For Display Device (AREA)
  • User Interface Of Digital Computer (AREA)
  • Document Processing Apparatus (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明揭示由电子装置执行的用于将具有文本的图像调整大小的方法。所述方法可包含确定所述图像中的至少一个文本区的布局信息。所述布局信息可包含所述图像中的所述至少一个文本区的数目、大小、位置、形状或文本密度中的至少一者。所述方法还可基于所述布局信息、所述图像的大小以及目标图像大小而选择用于所述图像的接缝雕刻操作、裁剪操作或按比例缩放操作。可至少基于所述布局信息、所述图像的所述大小或所述目标图像大小中的一者而执行所述选定操作以将所述图像调整大小为所述目标图像大小。所述经调整大小的图像可包含所述至少一个文本区。

Description

基于文本的图像调整大小
优先权要求
本申请案主张2015年1月15日申请的标题为“基于文本的图像调整大小(TEXT-BASED IMAGE RESIZING)”的第14/597,584号美国申请案的优先权,所述美国申请案的内容以全文引用的方式并入本文中。
技术领域
本发明大体上涉及处理图像,且更具体来说涉及将具有文本的图像调整大小为较小的大小。
背景技术
近来,例如智能电话、平板计算机、可穿戴计算机及类似物等电子装置的使用已经在消费者当中增加。这些装置可提供多种功能性,例如数据处理和通信、话音通信、网络浏览、多媒体处理和显示等。另外,这些电子装置可提供图像捕获和处理能力以捕获和处理例如照片等图像用于显示。
由常规电子装置捕获的图像常常具有各种分辨率(例如,5312×2988像素、3264×2448像素)。电子装置可用与所捕获图像的分辨率不同的分辨率显示这些图像。举例来说,电子装置可捕获3264×2448像素的分辨率的图像,并且然后按比例缩放所述图像以配合显示屏幕的分辨率,所述分辨率可能小于所捕获图像的分辨率。此外,可将多个图像缩减到预览图标的分辨率且在显示屏幕上显示,以促进用户对图像的查看和搜索。
电子装置常常捕获或存储具有文本的图像,例如文档、商务名片、街道标牌等。图像中的这些文本可能是用户的关注对象。当具有这些文本的图像缩减分辨率且在显示屏幕上显示时,所显示图像中的文本由于缩减的分辨率而可能不容易辨识。此外,当此图像缩减时,缩减图像中可能未恰当地保留图像中的文本。举例来说,可通过移除图像的外部部分而将图像缩减分辨率。如果所述外部部分包含文本,那么在过程中可能移除图像中的文本,使得经缩减图像不包含所述文本。
发明内容
本发明提供用于针对包含至少一个文本部分的图像基于所述至少一个文本部分的布局信息而选择图像调整大小操作,且通过执行选定图像调整大小操作而将所述图像调整大小为目标图像大小的方法和设备。
根据本发明的一个方面,揭示一种由电子装置执行的用于将具有文本的图像调整大小的方法。所述方法可包含确定所述图像中的至少一个文本区的布局信息。所述布局信息可包含所述图像中的所述至少一个文本区的数目、大小、位置、形状或文本密度中的至少一者。所述方法还可基于所述布局信息、所述图像的大小以及目标图像大小而选择用于所述图像的接缝雕刻操作、裁剪操作或按比例缩放操作。可至少基于所述布局信息、所述图像的所述大小或所述目标图像大小中的一者而执行所述选定操作以将所述图像调整大小为所述目标图像大小。所述经调整大小的图像可包含所述至少一个文本区。本发明还描述与此方法有关的设备、装置、装置组合和计算机可读媒体。
根据本发明的另一方面,揭示一种用于将可具有文本的图像调整大小的电子装置。所述电子装置可包含经配置以确定图像中的至少一个文本区的布局信息的布局信息确定单元。所述布局信息可包含所述图像中的所述至少一个文本区的数目、大小、位置、形状或文本密度中的至少一者。所述装置还可包含经配置以基于所述布局信息、所述图像的大小以及目标图像大小而选择用于图像的接缝雕刻操作、裁剪操作或按比例缩放操作的调整大小操作选择单元。电子装置中的调整大小单元可经配置以至少基于布局信息、图像的大小或目标图像大小中的一者而执行选定操作以将图像调整大小为目标图像大小。所述经调整大小的图像可包含所述至少一个文本区。
附图说明
当结合附图理解时,通过参考以下详细描述将理解本发明的发明性方面的实施例。
图1说明根据本发明的一个实施例的经配置以捕获显示屏幕上的图像的电子装置。
图2示出了根据本发明的一个实施例的经配置以存取其中每一者包含一或多个文本部分的多个图像且分别产生所述图像的多个缩略图图像(例如,预览图像)的电子装置。
图3示出了根据本发明的一个实施例的电子装置的框图,其经配置以针对包含至少一个文本部分的图像选择图像调整大小操作且基于选定图像调整大小操作将所述图像调整大小。
图4说明根据本发明的一个实施例的布局信息确定单元的框图,其经配置以接收至少一个文本部分且确定包含所述至少一个文本部分的至少一个文本区的布局信息。
图5说明根据本发明的一个实施例选择且执行用于图像的接缝雕刻操作以产生所述图像的缩略图图像。
图6示出了根据本发明的一个实施例执行用于图像的裁剪操作以产生所述图像的缩略图图像。
图7说明根据本发明的一个实施例的用于图像的按比例缩放操作以产生所述图像的缩略图图像。
图8示出了根据本发明的一个实施例对图像执行接缝雕刻操作以产生过渡图像且对过渡图像执行按比例缩放操作以产生具有目标图像大小的缩略图图像。
图9说明根据本发明的一个实施例的用于选择用于图像的图像调整大小操作且基于选定图像调整大小操作对电子装置中的图像调整大小的方法的流程图。
图10说明根据本发明的一个实施例的用于基于布局信息选择图像调整大小操作的详细方法的流程图。
图11说明根据本发明的一个实施例的用于通过对图像执行按比例缩放操作而将图像调整大小为目标图像大小的详细方法的流程图。
图12是根据本发明的一些实施例的示范性电子装置的框图,其中可实施用于响应于输入声音流中的激活关键词和语音命令而执行话音助理单元的功能的方法和设备。
具体实施方式
现在将详细参考各种实施例,在附图中图示所述实施例的实例。在以下详细描述中,陈述众多具体细节以便提供对本发明的透彻理解。然而,对于所属领域的一般技术人员将是显而易见的是可在没有这些具体细节的情况下实践本发明。在其它情况下,未详细描述众所周知的方法、过程、系统和组件,以便不会不必要地混淆各种实施例的各方面。
图1说明根据本发明的一个实施例的经配置以在显示屏幕140上显示图像150的电子装置120。如图所示,图像150可包含商务名片160以及用于笔记本计算机180的广告170的一部分。举例来说,电子装置120的用户110可操作配备有图像传感器130的电子装置120以捕获商务名片160和广告170的一部分的图像150,且存取所捕获图像150用于在显示屏幕140上显示。替代地,电子装置120可通过通信网络从外部装置接收图像150,且在显示屏幕140上显示所述图像。
在所说明的实施例中,图像150可包含多个文本部分162、164、172、174和176,其中的每一者可包含一或多个字符串。如图所示,商务名片160中的文本部分162和164可分别包含字符串“ABC公司”和“约翰·道伊(John Doe)”。另一方面,广告170中的文本部分172、174和176可分别包含字符串“智能”、“有吸引力”和“ABC笔记本计算机”。另外,所捕获图像150还可包含一或多个非文本部分,例如笔记本计算机180。如本文所使用,术语“文本部分”可指代图像中包含文本的任何部分,且可包含一或多个字符、单词或字符串。
在所述电子装置中,显示屏幕140可具有N1×M1像素的显示大小或分辨率。另一方面,图像150可具有N2×M2像素的图像大小或分辨率,其可不同于显示屏幕140的显示分辨率。当显示屏幕的大小或分辨率不同于图像150的大小或分辨率时,电子装置120可将图像150调整大小以配合显示屏幕140的显示大小或分辨率,且在显示屏幕140上显示经调整大小的图像。举例来说,如果显示屏幕140具有1024×768像素的显示大小或分辨率且图像150具有2048×1536像素的图像大小或分辨率,那么可将图像150按比例缩小或调整大小以配合1024×768像素的显示分辨率以用于显示。在此情况下,可通过维持图像150的原始纵横比或不维持原始纵横比而将图像150按比例缩小或调整大小为显示大小。
图2示出了根据本发明的一个实施例的电子装置120,其经配置以存取多个图像150、210和220,其中的每一者包含一或多个文本部分,且分别产生图像150、210和220的多个缩略图图像230、240和250(例如,预览图像)。电子装置120可存储图像150、210和220,所述图像可由电子装置120捕获或经由无线通信网络或有线通信线路从外部装置接收。当经配置以组织和显示例如照片、图片、截屏、视频剪辑或类似物等图像的应用程序执行时,电子装置120可存取图像150、210和220且将其调整大小为缩略图图像的大小。在此过程中,电子装置120可通过分别将图像150、210和220调整大小以包含或保存图像150、210和220中可检测到的一或多个文本部分而产生缩略图图像230、240和250。产生的缩略图图像230、240和250可存储在电子装置120中和/或显示于显示屏幕140上。
在所说明的实施例中,可将缩略图图像230、240和250调整大小为大小分别小于图像150、210和220。如本文所使用,术语“缩略图图像”可指代原始图像的缩减大小的图像或较小版本,且包含指示原始图像或与原始图像相关联的任何图像。图像150、210和220可具有相同大小或分辨率或者不同大小或分辨率。类似地,缩略图图像230、240和250可具有相同大小或分辨率或者不同大小或分辨率。缩略图图像230、240和250可显示于显示屏幕140上以分别提供图像150、210和220的预览,以促进对图像150、210和220的存取和/或搜索。当选择缩略图图像230、240或250时,与选定缩略图图像相关联的图像150、210或220可显示于显示屏幕140上。
电子装置120可经配置以产生缩略图图像230、240和250以分别包含或保存图像150、210和220中可检测到的一或多个文本部分。在一个实施例中,可存取图像150、210和220且在图像150、210和220中的每一者中可检测到一或多个文本部分。在检测到图像150、210和220中的文本部分中的每一者后,电子装置120可即刻基于每一图像中的文本部分的笔划宽度、大小、形状或位置中的至少一者的相似性而将多个文本部分分组或群集到一或多个文本区中。对于图像150、210和220中的每一者,可确定指示图像中的文本区的数目、大小、位置、形状和/或文本密度的布局信息。
如图2中所示,电子装置120可通过检测且分组具有相似笔划宽度、大小、形状和/或位置的多个文本部分而识别图像150、210和220中的多个文本区202、204、216和226。在图像150的情况下,文本部分162和164可分组为文本区202,而文本部分172、174和176可分组到文本区204中。对于图像210,电子装置120可将文本部分212和214分组到文本区216中。在图像220中,电子装置120可将文本部分222和224分组到文本区226中。
电子装置120可通过执行接缝雕刻操作、裁剪操作或按比例缩放操作中的至少一者而将图像150、210和220调整大小以分别产生缩略图图像230、240和250,所述操作中的每一者适于包含或保存图像150、210和220中的每一者中的一或多个文本区。对于图像150、210和220中的每一者,电子装置120可基于图像150、210或220中的文本区的布局信息而选择接缝雕刻操作、裁剪操作和按比例缩放操作中的一者。在一个实施例中,如果图像的布局信息指示两个或更多个单独文本区,那么可选择接缝雕刻操作。如图2中所示,由于图像150包含文本区202和204,因此电子装置120可选择且执行用于图像150的接缝雕刻操作。在执行接缝雕刻操作时,电子装置120可通过在图像150中移除位于除文本区202和204外的区中的多个接缝(例如,像素路径)而将图像150调整大小以配合缩略图图像230的大小。缩略图图像230接着可显示于显示屏幕140上。
另一方面,如果图像的布局信息指示单个文本区,那么电子装置120可选择裁剪操作或按比例缩放操作。在此情况下,电子装置120可将单个文本区的大小与待产生的缩略图图像的大小进行比较。如果单个文本区的大小小于缩略图图像的大小,那么可选择且执行裁剪操作。否则,电子装置120可选择且执行按比例缩放操作。
如图2中所示,由于图像210包含具有小于或等于缩略图图像240的大小的大小的单个文本区216,因此电子装置120可选择且执行裁剪操作。在裁剪操作中,可选择且裁剪图像210中在文本区216外的一或多个部分以将图像210调整大小而匹配缩略图图像240的大小。包含文本区216的经调整大小的图像接着可存储或作为缩略图图像240显示于显示屏幕140上。
另一方面,图像220可包含具有大于缩略图图像250的大小的大小的单个文本区226。因此,电子装置120可选择且执行按比例缩放操作。在执行按比例缩放操作时,电子装置120可确定用于图像220的按比例缩放方向和缩放比,其适于匹配缩略图图像250的大小且相对于图像220中的其它区保存文本区226的大小。举例来说,按比例缩放方向可确定为沿着对角线方向,且缩放比可确定为0.5或50%。电子装置120接着可通过根据按比例缩放方向和缩放比将图像220的大小按比例缩小而将图像220调整大小。包含文本区226的经调整大小的图像接着可存储或作为缩略图图像250显示于显示屏幕140上。
电子装置120可将原始图像调整大小为缩略图图像以使得一或多个文本区的大小或比例与剩余部分(例如,非文本区)的大小或比例的比率在缩略图图像中得以保存或增加。在一个实施例中,对图像执行接缝雕刻操作和裁剪操作可导致具有相对于非文本区具有较大大小或比例的一或多个文本区的缩略图图像。另一方面,按比例缩放操作可至少保存文本区的大小或比例与非文本区的大小的比率。通过保存和/或增加缩略图图像中的文本区的相对大小,其可增强用户对文本区的可读性和/或辨识。
在一些实施例中,电子装置120可对图像选择且执行两个或更多个图像调整大小操作。举例来说,可初始地对具有两个文本区的原始图像执行接缝雕刻操作以产生包含所述两个文本区的过渡图像。如果过渡图像不匹配缩略图图像的目标图像大小,那么电子装置120可对过渡图像执行按比例缩放操作且产生已从过渡图像按比例缩小的缩略图图像。在具有单个文本区的图像的情况下,电子装置120可初始地对图像执行裁剪操作以产生过渡图像。如果过渡图像不匹配缩略图图像的目标图像大小,那么接着可执行按比例缩放操作以将过渡图像调整大小为缩略图图像的目标图像大小。应了解,电子装置120还可以任何合适数目的次数且以任何合适的次序执行接缝雕刻操作、裁剪操作和按比例缩放操作。
图3示出了根据本发明的一个实施例的电子装置120的框图,其经配置以针对包含至少一个文本部分的图像选择图像调整大小操作且基于选定图像调整大小操作将所述图像调整大小。电子装置120可包含图像传感器130、存储单元310、I/O(输入/输出)单元320、通信单元330以及处理器340。如本文中所描述,电子装置120可为配备有图像处理能力的任何合适的装置,例如智能电话、可穿戴计算机(例如,智能眼镜、智能手表等)、数码相机(例如,DSLR相机)、个人计算机、膝上型计算机、平板计算机、游戏装置等。
图像传感器130可捕获包含一或多个文本部分的一或多个图像。另外或替代地,可经由通信单元330通过无线网络或者经由I/O单元320在通信线路上从外部装置接收包含一或多个文本部分的一或多个图像。包含文本部分的图像可存储在存储单元310中且由处理器340存取以用于处理和/或显示。为了捕获图像,图像传感器130可采用任何合适的图像感测或检测装置,例如CCD(电荷耦合装置)、基于CMOS(互补型金属氧化物半导体)或NMOS(N型金属氧化物半导体)技术的有源像素传感器,及类似物。图像传感器130可捕获一或多个图像且将与所述图像相关联的图像数据提供到电子装置120中的处理器340。另外,可使用任何合适的存储或存储器装置实施存储单元310,例如RAM、ROM、EEPROM、快闪存储器、SSD或类似物。
处理器340可包含文本检测单元342、布局信息确定单元344、调整大小操作选择单元346以及调整大小单元348。此外,调整大小单元348可包含接缝雕刻单元350、裁剪单元352或按比例缩放单元354中的至少一者。处理器340可从存储单元310存取具有一或多个文本部分的一或多个图像且将所述图像调整大小为目标图像大小。在一个实施例中,处理器340可通过在图像存储于存储单元310中的时间处或附近存取图像而将所述图像调整大小。替代地,处理器340可通过当例如照片库应用程序等应用程序执行时从存储单元310存取图像而将所述图像调整大小。如本文中所描述,处理器340可为能够处理图像的任何处理器或处理单元,例如应用程序处理器(AP)、中央处理单元(CPU)、图形处理单元(GPU)、微处理器单元(MPU)或类似物。
当处理器340从存储单元310存取具有一或多个文本部分的图像时,文本检测单元342可接收所述图像且检测图像中的至少一个文本部分。为了检测所述至少一个文本部分中的每一者,可通过确定文本部分中的个别字符的一或多个斑点而检测图像中的文本部分。可在斑点群集操作中将具有一或多个例如颜色、强度、接近度及类似物等相似性质的一或多个斑点群集到斑点群集中。举例来说,具有相同颜色且彼此接近定位的多个斑点可群集到斑点群集中。接着可提取且检测包含文本或字符的斑点群集的一部分作为包含文本的文本部分。在一些实施例中,可检测一行文本、单词或字符串作为文本部分。文本检测单元342接着可将图像和图像中检测到的文本部分提供到布局信息确定单元344。为了检测图像中的文本部分,文本检测单元342可采用任何合适的文本检测方案,例如基于边缘的方法、基于连接组件的方法、基于纹理的方法或类似方法。
布局信息确定单元344经配置以接收图像和检测到的文本部分,且通过基于图像中的文本部分的笔划宽度、大小、形状或位置中的至少一者的相似性而分组或群集文本部分来识别一或多个文本区。举例来说,例如邻近文本行(例如,句子、段落等)或邻近字符串(例如,邻近单词)等多个相邻文本部分可分组或群集到一个文本区中。另一方面,可将隔离的文本部分识别为单个文本区。
在识别一或多个文本区后,布局信息确定单元344可即刻确定图像中的文本区的布局信息。在一个实施例中,布局信息确定单元344可分析图像中的文本区以确定文本区的物理布局信息,包含图像中的文本区的数目、大小、位置、形状或文本密度中的至少一者。另外或替代地,布局信息确定单元344可辨识文本区中的文本且确定经辨识文本区的逻辑布局信息。
逻辑布局信息可指示经辨识文本区中的每一者的优先级或权重,且可基于文本区中的每一者中的经辨识文本的信息类型和/或内容而确定。如本文所使用,术语文本区的“信息类型”可为指示文本区中的文本类型的任何信息,且可包含个人的姓名、公司的名称、组织的名称、电话号码、电子邮件地址、文档的标题或类似物。信息类型中的每一者可被指派预定优先级值或权重。如果在文本区中辨识出例如“约翰·道伊”等姓名,那么文本区可被指派与所述姓名相关联的优先级值或权重。类似地,如果文本区确定为例如包含人的姓名、公司名称、电话号码等的商务名片等文本对象,那么文本区可被给定与所述商务名片相关联的优先级值或权重。另一方面,预定文本或字符串可被指派预定优先级值或权重。当在文本区中辨识出预定文本或字符串时,文本区可被指派预定优先级值或权重。举例来说,文本“ABC公司”可由电子装置120的用户预定为具有高优先级。如果文本区确定包含文本“ABC公司”,那么其可被给定高优先级。
调整大小操作选择单元346可经配置以从布局信息确定单元344接收图像和图像的布局信息,且基于图像的大小、图像的布局信息以及目标图像大小(例如,缩略图图像大小)而选择接缝雕刻操作、裁剪操作或按比例缩放操作。调整大小操作选择单元346可基于文本区的物理布局信息选择图像调整大小操作,所述物理布局信息包含图像中的文本区的数目、大小、位置、形状或文本密度中的至少一者。在一个实施例中,当布局信息指示两个或更多个文本区时,可选择接缝雕刻操作。
另一方面,如果布局信息指示单个文本区,那么可选择裁剪操作或按比例缩放操作。在此情况下,调整大小操作选择单元246可基于文本区的大小和形状而确定文本区是否可包含于目标图像大小内。如果文本区的大小和形状指示文本区可包含于目标图像大小内,那么可选择裁剪操作。否则,调整大小操作选择单元346可选择按比例缩放操作。
根据一个实施例,调整大小操作选择单元346可确定一或多个文本区的大小与图像的大小的比率。如果所述比率确定为大于预定比率(例如,0.7或70%),那么可选择按比例缩放操作。举例来说,如果文本区与图像的大小的比率是0.9或90%,那么可选择按比例缩放操作。否则,可选择裁剪或接缝雕刻。在另一实施例中,调整大小操作选择单元346可确定一或多个文本区的文本密度。举例来说,可将文本区中的字符的数目除以文本区的面积以确定所述文本区的文本密度。如果文本密度确定为大于预定文本密度,那么可选择接缝雕刻操作或裁剪操作。
另外或替代地,调整大小操作选择单元346可基于图像中的一或多个文本区的逻辑布局信息选择图像调整大小操作。逻辑布局信息可指示文本区中的每一者的优先级或权重,且可基于文本区中的每一者中的经辨识文本的信息类型和/或内容而确定。在一个实施例中,如果一或多个文本区的逻辑布局信息指示低优先级,那么可选择裁剪操作或接缝雕刻操作以用于裁剪或雕刻具有低优先级的文本区。
在选择调整大小操作中的一者后,调整大小操作选择单元346可即刻选择且激活与选定调整大小操作相关联的接缝雕刻单元350、裁剪单元352或按比例缩放单元354。在激活后,选定调整大小单元350、352或354可即刻接收图像、图像的布局信息以及目标图像大小,且基于图像的大小、布局信息和目标图像大小将所述图像调整大小。在一个实施例中,选定调整大小单元350、352或354可将图像调整大小为目标图像大小或可能大于目标图像大小的过渡图像大小。如果经调整大小的图像大于目标图像大小,那么可将经调整大小的图像提供到布局信息确定单元344以用于如上文所描述确定布局信息。调整大小操作选择单元346接着可选择接缝雕刻操作、裁剪操作和按比例缩放操作当中的另一图像调整大小操作,且选择与选定调整大小操作相关联的接缝雕刻单元350、裁剪单元352和按比例缩放单元354中的一者。选定调整大小单元350、352或354接着可将过渡图像进一步调整大小。此过程可重复任何合适的次数以将图像调整大小直到获得目标图像大小为止。
接缝雕刻单元350经配置以从调整大小操作选择单元346接收图像、图像的布局信息以及目标图像大小,且基于图像的大小、布局信息和目标图像大小对所述图像执行接缝雕刻操作。在接缝雕刻操作期间,接缝雕刻单元350可确定包含一或多个文本区的图像中的多个接缝。如本文所使用,术语“接缝”可指代图像中可垂直地沿着图像的顶部部分与底部部分之间的路径或水平地沿着图像的左侧与右侧之间的路径而连接或穿越的多个像素。此外,术语“接缝雕刻操作”可指代通过确定图像中的多个接缝且从图像移除一或多个接缝而将图像调整大小的一或多个操作或动作。
接缝雕刻单元350可经配置以计算图像中的多个像素的多个能量值。能量值中的每一者可指示相关联像素是文本的概率。举例来说,文本区中的多个像素可具有比非文本区中的多个像素高的能量值。在一个实施例中,接缝雕刻单元328可基于逻辑布局信息调整与一或多个文本区相关联的像素的能量值。举例来说,当逻辑布局信息指示指定文本区的低优先级时,可减小指定文本区中的像素的能量值。接缝雕刻单元350接着可基于图像中的像素的能量值确定图像中的多个接缝。在此过程中,接缝雕刻单元350可将最小能量梯度或最小熵的像素路径的集合确定为图像中的接缝。
在确定接缝后,接缝雕刻单元350可即刻计算接缝中的每一者中的像素的总能量值(例如,能量值的总和)。举例来说,位于非文本区中的接缝可具有比位于文本区中的接缝低的总能量值。接缝雕刻单元350可基于接缝的总能量值移除接缝中的一或多者。在一个实施例中,可基于图像的大小和目标图像大小而确定待移除的接缝的数目。举例来说,如果将具有1024×768像素的大小或分辨率的图像调整大小为600×600像素的目标图像大小或分辨率,那么可从图像移除424个垂直接缝和168个水平接缝。在此情况下,可从1024个垂直接缝移除对应于424个最低总能量值的424个垂直接缝,且可从768个水平接缝移除对应于168个最低总能量值的168个水平接缝。另外或替代地,可基于预定总阈值能量值而移除接缝。在以上实例中,如果424个垂直接缝中的一些具有超出预定总阈值能量值的总阈值能量值,那么接缝雕刻单元350可不从图像移除这些接缝,且将具有过渡图像大小的经接缝雕刻图像提供到布局信息确定单元344以用于确定关于过渡图像的布局信息且提供到调整大小操作选择单元346以用于选择另一图像调整大小操作。在从图像移除接缝后,接缝雕刻单元350可即刻产生具有目标图像大小的经调整大小的图像。经调整大小的图像可存储在存储单元310中和/或显示于例如显示屏幕等I/O单元320上。
裁剪单元352可经配置以从调整大小操作选择单元346接收图像、图像的布局信息以及目标图像大小,且基于图像的大小、布局信息和目标图像大小对图像执行裁剪操作。如本文所使用,术语“裁剪操作”可指代通过裁剪或移除图像的一或多个部分(例如,像素)而将图像调整大小的一或多个操作或动作。裁剪单元352可识别图像中的文本区外的图像的一或多个部分(例如,非文本区)且从图像裁剪或移除所述部分。可基于图像、文本区和目标图像的大小而确定待裁减或移除的部分的大小。举例来说,如果图像、文本区和目标图像的大小分别是1024×768像素、580×320像素和600×600像素,那么裁剪单元352可识别图像中包含文本区且具有与目标图像大小相同的大小(即,600×600像素)的部分,且从图像裁剪经识别部分外的一或多个部分。如果无法识别此部分且识别出大于目标图像大小的部分,那么裁剪单元352裁剪经识别部分外的所述一或多个部分,且将具有过渡图像大小的经裁减图像提供到布局信息确定单元344和调整大小操作选择单元346以用于选择另一调整大小操作。在裁剪或移除所述一或多个部分后,裁剪单元可即刻产生具有目标图像大小的经调整大小的图像。经调整大小的图像可存储在存储单元310中和/或显示于例如显示屏幕等I/O单元320上。
按比例缩放单元354可经配置以从调整大小操作选择单元346接收图像、图像的布局信息以及目标图像大小,且基于图像的大小、布局信息和目标图像大小对图像执行按比例缩放操作。如本文所使用,术语“按比例缩放操作”可指代通过与目标图像的尺寸成比例地改变图像的尺寸(例如,水平和垂直像素的数目)而将图像调整大小的一或多个操作或动作。在一个实施例中,按比例缩放单元354可基于图像的大小和目标图像大小而将图像按比例缩放到目标图像。另外或替代地,按比例缩放单元354可基于图像的大小和目标图像大小确定一或多个按比例缩放方向(例如,水平方向、垂直方向和对角线方向)和缩放比。举例来说,如果图像和目标图像的大小分别是2048×1536像素和1024×768像素,那么按比例缩放单元354可将对角线方向和0.5或50%分别确定为按比例缩放方向和缩放比。在确定按比例缩放方向和缩放比后,按比例缩放单元354可即刻将图像按比例缩放到目标图像大小。
在一个实施例中,按比例缩放单元354可使用任何合适的图像按比例缩放方案来按比例缩放图像,例如双线性内插、双三次内插、最近相邻者内插及类似方案。举例来说,给定具有2048×1536像素的原始图像和具有1024×768像素的目标图像,可对原始图像中的像素进行取样和内插以产生1024×768像素作为目标图像。可通过基于目标图像中的像素与原始图像中的选定像素之间的距离而内插原始图像中的选定像素的集合来产生目标图像中的像素中的每一者。所述像素集合在双线性内插的情况下可为2×2像素或在双三次内插的情况下可为4×4像素。在最近相邻者内插的情况下,按比例缩放单元354可对原始图像中的2048×1536像素进行取样,且通过针对目标图像中的像素位置中的每一者确定原始图像中最靠近像素位置的像素而从2048×1536像素选择1024×768像素作为目标图像。
当将图像调整大小为目标图像大小时,由文本区的区域中的字符数目表征的图像中的文本区的文本密度可由于经调整大小的图像中的文本区的面积减小而增加。在此情况下,按比例缩放单元354可确定文本区的文本密度是否大于预定文本密度。如果文本区的文本密度确定为大于预定文本密度,那么按比例缩放单元354可按比例缩放图像直到文本区的文本密度达到预定文本密度为止,且可将具有过渡图像大小的经按比例缩放图像提供到布局信息确定单元344以用于确定关于过渡图像的布局信息且提供到调整大小操作选择单元346以用于选择另一调整大小操作。以此方式,按比例缩放单元354可按比例缩放图像以产生具有目标图像大小的经调整大小的图像。经调整大小的图像可存储在存储单元310中和/或显示于例如显示屏幕等I/O单元320上。
图4说明根据本发明的一个实施例的布局信息确定单元344的框图,其经配置以接收至少一个文本部分且确定包含所述至少一个文本部分的至少一个文本区的布局信息。可将布局信息提供到调整大小操作选择单元346以用于选择图像调整大小操作。如图所示,布局信息确定单元344可包含文本群集单元410、物理布局处理单元420、文本辨识单元430以及逻辑布局处理单元440。
文本群集单元410可经配置以将具有相同或相似性质的多个文本部分分组或群集到文本区中。在一个实施例中,可将具有相同或相似笔划宽度、大小、形状和/或位置的一或多个文本部分分组或群集到文本区中。在此情况下,文本区可为任何合适的形状(例如,矩形形状、多边形形状或类似形状)以包含文本部分。文本群集单元410接着可将图像中的所述至少一个文本区提供到物理布局处理单元420和文本辨识单元430。
在从文本群集单元410接收所述至少一个文本区后,物理布局处理单元420可即刻确定文本区的物理布局信息。物理布局信息可与图像中的所述至少一个文本区的结构或外观相关联。在一个实施例中,物理布局处理单元420可分析文本区以确定文本区的数目、大小、位置形状和/或文本密度。所述数目、大小、位置、形状或文本密度中的至少一者可在选择和执行接缝雕刻操作、裁剪操作或按比例缩放操作时用作物理布局信息以将图像调整大小。
文本辨识单元430可经配置以从文本群集单元410接收所述至少一个文本区且辨识所述至少一个文本区中的文本。根据一个实施例,可辨识文本区中的每一字符,其可包含字母、数字或符号。另外,可基于所辨识字符而确定一或多个单词、短语或数字序列。在辨识文本时,文本辨识单元430可使用任何合适的文本辨识方法,例如OCR(光学字符辨识)及类似方法。可将所述至少一个文本区中的经辨识文本提供到逻辑布局处理单元440。
逻辑布局处理单元440可经配置以确定文本区的逻辑布局信息。逻辑布局信息可与所述至少一个文本区中的经辨识文本的上下文或用户偏好相关。在一个实施例中,逻辑布局处理单元440可基于从文本辨识单元430接收的所述至少一个文本区中的经辨识文本而确定所述至少一个文本区的优先级或权重。对于所述至少一个文本区中的每一者,逻辑布局处理单元440可基于文本区中的经辨识文本确定信息类型和内容。随后可基于文本区的信息类型和/或内容确定文本区的优先级。
在确定信息类型时,逻辑布局处理单元440可存取可包含在存储单元310中的文本特性数据库450以参考文本特性信息(例如,电话号码、电子邮件地址、地址、人的姓名、商店名称、公司名称、CI(公司身份)、URL(统一资源定位符))。基于文本特性信息,逻辑布局处理单元440可确定与经辨识文本相关联的信息类型。举例来说,关于电话号码的文本特性信息可包含电话号码的典型格式和/或典型描述性单词,例如“电话”、“移动”、“办公室”、“家”、“号码”等。如果文本区中的经辨识文本包含指示电话号码的典型格式和/或例如“电话”和“号码”等字符串中的一者的数字序列,那么文本区的信息类型可确定为电话号码。例如人、实体和对象的名称等信息类型可被指派预定优先级值或权重。在以上实例中,文本区可被指派与电话号码相关联的优先级值或权重。
逻辑布局处理单元440可确定文本区中的经辨识文本是否匹配预定文本或字符串。预定文本或字符串可被指派预定优先级值或权重。当逻辑布局处理单元440确定文本区中辨识的文本匹配预定文本或字符串时,所述文本区可被指派与经辨识文本相关联的预定优先级值或权重。举例来说,文本区经确定为包含文本“约翰·道伊”,其可由电子装置120的用户预定为具有高优先级,所述文本区可被给定高优先级。所述至少一个文本区的优先级或权重可以用于选择和执行接缝雕刻操作、裁剪操作或按比例缩放操作以将图像调整大小。如所描述,由物理布局处理单元420确定的物理布局信息以及由逻辑布局处理单元440确定的逻辑布局信息可在对图像选择且执行图像调整大小操作时用作布局信息。
图5说明根据本发明的一个实施例为图像150选择且执行接缝雕刻操作以产生缩略图图像230。图像150可包含商务名片160中的文本部分162和164以及广告170中的文本部分172、174和176。处理器340中的文本检测单元342可检测图像150中的文本部分162、164、172、174和176。
布局信息确定单元344可将文本部分162、164、172、174和176分组或群集到文本区202和204中。举例来说,布局信息确定单元344可确定文本部分162和164彼此邻近且具有相似的大小和形状,且将文本部分162和164分组或群集到文本区202中。类似地,文本部分172、174和176可经确定为彼此邻近且具有相似的大小,且被分组或群集到文本区204中。
在识别文本区202和204后,布局信息确定单元344可即刻至少基于文本区202和204的数目、大小、位置、形状或文本密度中的一者而产生文本区202和204的物理布局信息。布局信息确定单元344还可产生文本区202和204中的每一者的逻辑布局信息,其包含文本区的信息类型或内容中的至少一者。在此过程中,可辨识文本区202中的文本“ABC公司”和“约翰·道伊”以及文本区204中的文本“智能”、“有吸引力”以及“ABC笔记本计算机”。基于经辨识文本,逻辑布局处理单元440可确定文本区202与公司名称和人的姓名相关联,而文本区204与公司名称相关联。在所说明的实施例中,文本区202和204的逻辑布局信息可指示用于文本区202和204的相同或相似优先级或权重。
调整大小操作选择单元346可基于图像150、目标图像大小(即,缩略图图像230的大小)以及文本区202和204的物理布局信息和/或逻辑布局信息而选择接缝雕刻操作以将图像150调整大小为缩略图图像230。在所说明的实施例中,调整大小操作选择单元346可确定物理布局信息指示两个文本区。另外或替代地,物理布局信息可指示文本区202和204的组合大小与图像150的大小的比率小于预定比率(例如,0.7或70%)。基于物理布局信息,调整大小操作选择单元346可选择接缝雕刻操作且激活接缝雕刻单元350以执行接缝雕刻操作。
接缝雕刻单元350可接收图像150、物理布局信息、逻辑布局信息以及缩略图图像230的大小,且对图像150执行接缝雕刻操作。对于图像150中的多个像素中的每一者,可计算指示相关联像素是文本的概率的能量值。如图所示,文本区202和204中的像素可具有比文本区202和204外的像素高的能量值。接缝雕刻单元350接着可确定图像150的多个接缝,其包含多个垂直接缝502、504、506、508和510以及多个水平接缝512和514。在确定接缝中的每一者时,接缝雕刻单元350可沿着最小能量梯度或最小熵的路径从图像150的一侧上的像素开始朝向图像150的另一侧确定像素的集合。以此方式,可确定从图像中的多个像素开始的所述多个接缝。虽然说明垂直接缝502、504、506、508和510以及水平接缝512和514,但接缝雕刻单元350可确定适合于图像的任何数目的垂直和/或水平接缝。举例来说,如果图像具有N×M分辨率或像素,那么可产生N数目的垂直接缝和M数目的水平接缝。
在图5的所说明实施例中,图像150可具有1024×768像素的大小,其可经调整大小为400×400像素的目标图像大小。在此情况下,针对图像150可确定1024个垂直接缝和768个水平接缝。在产生接缝后,接缝雕刻单元350可即刻通过基于接缝的总能量值选择且移除624个垂直接缝和368个水平接缝而将图像150调整大小为缩略图图像230的目标图像大小。在此情况下,可从图像150选择和移除对应于624个最低总能量值的包含接缝502、504、506和508的624个垂直接缝以及对应于368个最低总能量值的包含接缝512和514的368个水平接缝。
由于像素的能量值指示相关联像素是文本的概率,因此被选择且移除的具有最低总能量值的接缝可能不对应于文本区202和204。因此,在接缝雕刻操作期间可保存文本区202和204。举例来说,接缝510可具有高总能量值且因此可不从图像150移除。在从图像150移除选定接缝后,接缝雕刻单元350可即刻提供具有目标图像大小的经调整大小的图像作为包含文本区202和204的缩略图图像230。
图6示出了根据本发明的一个实施例执行用于图像610的裁剪操作以产生缩略图图像630。如图所示,图像610可包含文本区620,且文本区620可包含多个文本部分622和624。在此实施例中,裁剪单元352可基于图像610、目标图像大小(即,缩略图图像630的大小)以及文本区620的物理布局信息和/或逻辑布局信息对图像610执行裁剪操作。
物理布局信息可包含文本区620的数目、大小、位置、形状和文本密度。在所说明的实施例中,文本区620的物理布局信息可指示一个文本区。另外,文本区620的物理布局信息可指示文本区620的大小小于目标图像大小,且文本区620的大小与图像610的大小的比率小于预定比率(例如,0.7或70%)。另一方面,逻辑布局信息可指示文本区620的优先级或权重,且可包含文本区620的信息类型或内容中的至少一者。
裁剪单元352可执行裁剪操作以将包含文本区620的图像610调整大小为目标图像大小。在一个实施例中,图像610可具有1024×768像素的大小,且缩略图图像630的目标图像大小可为400×400像素。裁剪单元352可识别图像610中包含文本区620且具有与目标图像大小相同的大小(即,400×400像素)的部分626,且从图像610裁剪所述部分626外的一或多个部分。在裁剪或移除所述一或多个部分后,裁剪单元352可即刻产生具有目标图像大小的经调整大小的图像作为包含文本区620的缩略图图像630。
图7说明根据本发明的一个实施例的用于图像710的按比例缩放操作以产生缩略图图像730。如所说明,图像710可包含单个文本区720,且文本区720可包含多个文本部分712、714、716和718。在此实施例中,按比例缩放单元354可基于图像710、目标图像大小(即,缩略图图像730的大小)以及文本区720的物理布局信息和/或逻辑布局信息而对包含文本区720的图像710执行按比例缩放操作。
物理布局信息可包含文本区720的数目、大小、位置、形状和文本密度。在所说明的实施例中,文本区720的物理布局信息可指示文本区720的大小大于目标图像大小。另外,文本区720的物理布局信息可指示文本区720的大小与图像710的大小的比率大于预定比率(例如,0.7或70%)。另一方面,逻辑布局信息可指示文本区720的优先级或权重,且可包含文本区720的信息类型或内容中的至少一者。
按比例缩放单元354可执行按比例缩放操作以将图像710调整大小为目标图像大小。在一个实施例中,图像710可具有1000×600像素的大小,且缩略图图像730的目标图像大小可为400×400像素。为了将图像710按比例缩放为目标图像大小,按比例缩放单元354可确定水平方向和垂直方向两者为按比例缩放方向。针对水平方向可确定0.4或40%的比率作为缩放比,而针对垂直方向可确定0.67或67%的比率作为缩放比。基于按比例缩放方向以及用于按比例缩放方向中的每一者的比率,按比例缩放单元354可通过使用例如双线性内插、双三次内插、最近相邻者内插等任何合适的方案将图像710中的像素内插而将图像710按比例缩放为目标图像大小。在将图像710中的像素内插后,按比例缩放单元354可即刻产生具有目标图像大小的经调整大小的图像作为包含文本区732的缩略图图像730。
图8示出了根据本发明的一个实施例对图像810执行接缝雕刻操作以产生过渡图像850且对过渡图像850执行按比例缩放操作以产生具有目标图像大小的缩略图图像860。如图所示,图像810可包含多个文本区820、830和840。文本区820可包含多个文本部分822和824,而文本区830可包含多个文本部分832和834。
接缝雕刻单元350可基于图像810、目标图像大小(即,缩略图图像860的大小)以及文本区820、830和840的物理布局信息和/或逻辑布局信息而对包含所述多个文本区820、830和840的图像810执行接缝雕刻操作。物理布局信息可包含文本区820、830和840的数目、大小、位置、形状和文本密度,而逻辑布局信息可包含文本区820、830和840中的每一者的信息类型或内容中的至少一者,其指示文本区820、830和840中的每一者的优先级或权重。在所说明的实施例中,文本区840的逻辑布局信息可指示文本区840中的经辨识文本“美味!!”的低优先级或权重。另一方面,高权重或优先级可与包含名称和/或电话号码的文本区820和830相关联。
接缝雕刻单元350可计算图像810中的多个像素的多个能量值。每一能量值可指示相关联像素是文本的概率。基于指示文本区820和830的高优先级以及文本区840的低优先级的逻辑布局信息,接缝雕刻单元328可增加与文本区820和830相关联的像素的能量值,且减小与文本区840相关联的像素的能量值。在计算图像810中的像素的能量值后,可即刻在图像810中确定例如接缝872、874、876和878等多个垂直接缝以及例如接缝880和882等多个水平接缝。为了将具有1024×768像素的大小的图像810调整大小为400×400像素的目标图像大小,可能需要从图像810移除具有小于预定总阈值能量值的最低总能量值的624个垂直接缝和368个水平接缝。
在所说明的实施例中,图像810中的600个垂直接缝可具有大于或等于预定总阈值能量值的总阈值能量值且因此可不被移除。另一方面,图像810中的424个垂直接缝可对应于小于预定总阈值能量值的424个最低总能量值,且因此可从图像810移除。因此,接缝雕刻单元350可从图像810移除424个垂直接缝。另一方面,图像810中的368个水平接缝可具有小于预定总阈值的最低总能量值且可从图像810移除。
如图8中所示,接缝雕刻单元350可从图像810移除包含垂直接缝872、874和876的424个垂直接缝以及包含水平接缝880和882的368个水平接缝。在此情况下,具有大于或等于预定总阈值的总能量值的垂直接缝878可不从图像810移除。在移除选定接缝后,接缝雕刻单元350可即刻产生具有大于目标图像大小(例如,400×400)的大小(例如,600×400)的过渡图像850。接着可将包含对应于文本区820和830的文本区852和854的过渡图像850提供到布局信息确定单元344和调整大小操作选择单元346以用于选择另一调整大小操作。
在接收包含文本区852和854的过渡图像850后,布局信息确定单元344可即刻确定指示过渡图像850中的文本区852和854的数目、大小、位置、形状和文本密度的物理布局信息。调整大小操作选择单元346可接收过渡图像850和物理布局信息,且确定文本区852和854的组合大小大于目标图像大小。因此,调整大小操作选择单元346可在按比例缩放操作与裁剪操作之间选择按比例缩放操作且选择按比例缩放单元354以用于对过渡图像850执行按比例缩放操作。
按比例缩放单元354可接收过渡图像850、物理布局信息和目标图像大小,且执行按比例缩放操作以将过渡图像850调整大小为目标图像大小。在所说明的实施例中,过渡图像850具有600×400像素的大小,而缩略图图像860的目标图像大小是400×400像素。为了将过渡图像850按比例缩放为目标图像大小,按比例缩放单元354可确定水平方向作为按比例缩放方向且确定0.66或66%的比率作为缩放比。基于按比例缩放方向和缩放比,按比例缩放单元354可通过对过渡图像850中的像素进行内插而将过渡图像850按比例缩放为目标图像大小,且产生包含对应于文本区852和854的文本区862和864的具有目标图像大小的缩略图图像860。
图9说明根据本发明的一个实施例的用于选择用于图像的图像调整大小操作且基于选定图像调整大小操作对电子装置120中的图像调整大小的方法900的流程图。电子装置120可在910从存储单元310存取包含多个文本部分的图像以将图像调整大小为目标图像大小。一旦存取图像,文本检测单元342便可在920检测图像中的文本部分。可在930由布局信息确定单元344中的文本群集单元410将检测到的文本部分群集到图像中的至少一个文本区中。在一个实施例中,可将例如邻近文本行(例如,句子、段落等)或邻近字符串(例如,邻近单词)等多个相邻文本部分群集到一个文本区中。
布局信息确定单元344可在940确定图像中的文本区的布局信息。在一个实施例中,布局信息确定单元344可分析图像中的文本区以确定文本区的物理布局信息,其包含图像中的文本区的数目、大小、位置、形状或文本密度中的至少一者。另外或替代地,布局信息确定单元344可辨识文本区中的文本且确定经辨识文本的逻辑布局信息,所述信息可指示经辨识文本的优先级。
一旦确定布局信息,调整大小操作选择单元346便可在950选择图像调整大小操作以用于将图像调整大小。调整大小操作选择单元346可基于图像的布局信息、图像的大小以及目标图像大小(例如,缩略图图像大小)而选择接缝雕刻操作、裁剪操作或按比例缩放操作。在选择图像调整大小操作后,接缝雕刻单元350、裁剪单元352或按比例缩放单元354可即刻在960通过执行选定图像调整大小操作而将图像调整大小为目标图像大小。
如果选择接缝雕刻操作,那么接缝雕刻单元350可被激活且通过对图像执行接缝雕刻操作而将图像调整大小。另一方面,如果选择裁剪操作,那么裁剪单元352可被激活且通过对图像执行裁剪操作而将图像调整大小。否则,如果选择按比例缩放操作,那么按比例缩放单元354可被激活且通过对图像执行按比例缩放操作而将图像调整大小。根据一个实施例,当接缝雕刻单元350、裁剪单元352或按比例缩放单元354产生具有目标图像大小的经调整大小的图像时,经调整大小的图像可存储在存储单元310中和/或显示于例如显示屏幕等I/O单元320上。
图10说明根据本发明的一个实施例的用于基于布局信息选择图像调整大小操作的详细方法950的流程图。一旦在940确定布局信息,调整大小操作选择单元346就可在1010确定图像是否具有单个文本区。如果确定图像具有多个文本区(即,在1010的“否”),那么调整大小操作选择单元346可在1020选择接缝雕刻操作。在此情况下,方法可前进到960以使得接缝雕刻单元350可在960基于图像的大小、布局信息和目标图像大小而对图像执行接缝雕刻操作。在执行接缝雕刻操作时,接缝雕刻单元350可通过移除图像中位于除文本区外的区中的多个接缝(例如,像素的路径)而将图像调整大小为目标图像大小。
另一方面,如果确定图像具有单个文本区(即,在1010的“是”),那么调整大小操作选择单元346可在1030确定文本区的大小与图像的大小的比率是否大于比率阈值(例如,预定比率)。如果文本区的比率大于比率阈值(即,在1030的“是”),那么调整大小操作选择单元346可在1040选择按比例缩放操作。在选择按比例缩放操作后,所述方法可即刻前进到960以使得按比例缩放单元354可通过在960基于图像的大小、布局信息和目标图像大小对图像执行按比例缩放操作而将图像调整大小。在执行按比例缩放操作时,按比例缩放单元354可确定用于图像的按比例缩放方向和缩放比,其适于匹配目标图像大小且相对于图像中的其它区保存文本区的大小。
否则,如果文本区的比率小于或等于比率阈值(即,在1030的“否”),那么调整大小操作选择单元346可在1050选择裁剪操作。当选择裁剪操作时,所述方法可前进到960以使得裁剪单元352可在960通过基于图像的大小、布局信息和目标图像大小对图像执行裁剪操作而将图像调整大小为目标图像大小。在裁剪操作中,可选择图像中在文本区外的一或多个部分且裁减以将图像调整大小以匹配目标图像大小。
图11说明根据本发明的一个实施例的用于通过对图像执行按比例缩放操作而将图像调整大小为目标图像大小的详细方法960的流程图。当调整大小操作选择单元346在950选择按比例缩放操作时,按比例缩放单元354可在1110确定一或多个按比例缩放方向(例如,水平方向、垂直方向和对角线方向)以及缩放比。在一个实施例中,可基于图像的大小和目标图像大小确定所述一或多个按比例缩放方向和缩放比。
在确定按比例缩放方向和缩放比后,按比例缩放单元354可即刻在1120确定文本区的文本密度是否大于文本密度阈值(例如,预定文本密度)。如果文本区的文本密度经确定为小于或等于文本密度阈值(即,在1120的“否”),那么按比例缩放单元354可在1130将图像按比例缩放为目标图像大小。在一个实施例中,按比例缩放单元354可基于按比例缩放方向和缩放比,使用例如双线性内插、双三次内插、最近相邻者内插及类似方案等任何合适的图像按比例缩放方案对图像中的多个像素进行取样和内插。如果文本区的文本密度经确定为大于预定文本密度(即,在1120的“是”),那么按比例缩放单元354可在1140按比例缩放图像直到文本区的文本密度达到预定文本密度为止。在此情况下,所述方法可前进到940以使得按比例缩放单元354可将具有过渡图像大小的经按比例缩放图像提供到布局信息确定单元344以用于确定关于过渡图像的布局信息。
图12是根据本发明的一些实施例的示范性电子装置1200的框图,其中可实施用于为包含至少一个文本部分的图像选择图像调整大小操作且基于选定图像调整大小操作将图像调整大小的方法和设备。可根据参看图1到11所描述的上述实施例而在电子装置中实施电子装置1200的配置。电子装置1200可为蜂窝式电话、智能电话、平板计算机、膝上型计算机、终端、手持机、个人数字助理(PDA)、无线调制解调器、无绳电话等。无线通信系统可为码分多址(CDMA)系统、移动通信(GSM)系统的广播系统、宽带CDMA(WCDMA)系统、长期演进(LTE)系统、高级LTE系统等。此外,电子装置1200可(例如)使用Wi-Fi直连或蓝牙直接与另一移动装置通信。
电子装置1200能够经由接收路径和发射路径提供双向通信。在接收路径上,基站所发射信号被天线1212接收且提供到接收器(RCVR)1214。接收器1214调节且数字化所接收的信号且将样本(例如经调节且经数字化的数字信号)提供到数字区段以用于进一步处理。在发射路径上,发射器(TMTR)1216从数字区段1220接收待发射的数据,处理并调节所述数据,且生成经调制信号,所述经调制信号经由天线1212发射到基站。接收器1214和发射器1216可为可支持CDMA、GSM、LTE、高级LTE等的收发器的部分。
数字区段1220包含各种处理、接口和存储器单元,例如调制解调器处理器1222、精简指令集计算机/数字信号处理器(RISC/DSP)1224、控制器/处理器1226、内部存储器1228、一般化音频/视频编码器1232、一般化音频解码器1234、图形/显示处理器1236,以及外部总线接口(EBI)1238。调制解调器处理器1222可执行用于数据发射和接收的处理,例如编码、调制、解调和解码。RISC/DSP 1224可执行针对电子装置1200的一般和专用处理。控制器/处理器1226可执行数字区段1220内的各种处理和接口单元的操作。内部存储器1228可将用于各种单元的数据和/或指令存储在数字区段1220内。
一般化音频/视频编码器1232可执行对来自音频/视频源1242、麦克风1244、图像传感器1246等的输入信号的编码。一般化音频解码器1234可执行对经译码音频数据的解码且可将输出信号提供到扬声器/头戴式耳机1248。图形/显示处理器1236可执行对可呈现给显示单元1250的图形、视频、图像和文本的处理。EBI 1238可促进数字区段1220与主存储器1252之间的数据传送。
数字区段1220可通过一或多个处理器、DSP、微处理器、RISC等实施。数字区段1220还可制造于一或多个专用集成电路(ASIC)和/或一些其它类型的集成电路(IC)上。
一般来说,本文中所描述的任何装置可表示各种类型的装置,例如无线电话、蜂窝式电话、膝上型计算机、无线多媒体装置、无线通信个人计算机(PC)卡、PDA、外部或内置调制解调器、通过无线通道通信的装置等。装置可具有各种名称,例如接入终端(AT)、接入单元、订户单元、移动台、移动装置、移动单元、移动电话、远程站、远程终端、远程单元、用户装置、用户设备、手持式装置等。本文中所描述的任何装置可具有用于存储指令和数据的存储器以及硬件、软件、固件或其组合。
可通过各种装置实施本文中所描述的技术。举例来说,这些技术可以硬件、固件、软件或其组合来实施。所属领域的技术人员将进一步了解,结合本文中的揭示内容描述的各种说明性逻辑块、模块、电路和算法步骤可以实施为电子硬件、计算机软件或两者的组合。为清楚地说明硬件与软件的此可互换性,上文已大体上关于其功能性描述了各种说明性组件、块、模块、电路和步骤。此功能性是实施为硬件还是软件取决于特定应用及施加于整个系统的设计约束。熟练的技术人员可针对每一特定应用以不同方式实施所描述的功能性,但此类实施决策不应被解释为引起偏离本发明的范围。
对于硬件实施方案,用以执行所述技术的处理单元可实施在以下各者内:一或多个ASIC、DSP、数字信号处理装置(DSPD)、可编程逻辑装置(PLD)、现场可编程门阵列(FPGA)、处理器、控制器、微控制器、微处理器、电子装置、经设计以执行本文中所描述的功能的其它电子单元、计算机,或其组合。
因此,结合本文中的揭示内容描述的各种说明性逻辑块、模块和电路可以用通用处理器、DSP、ASIC、FPGA或经设计以执行本文所述的功能的其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件或其任何组合来实施或执行。通用处理器可以是微处理器,但在替代方案中,处理器可以是任何常规处理器、控制器、微控制器或状态机。处理器还可实施为计算装置的组合,例如,DSP与微处理器的组合、多个微处理器、一或多个微处理器结合DSP核心,或任何其它此类配置。
如果实施于软件中,那么可将功能作为一或多个指令或代码存储在计算机可读媒体上或经由计算机可读媒体传输。计算机可读媒体包含计算机存储媒体与通信媒体两者,所述通信媒体包含促进将计算机程序从一处传送到另一处的任何媒体。存储媒体可以是可由计算机存取的任何可用媒体。举例来说且并不限于此,这些计算机可读媒体可包含RAM、ROM、EEPROM、CD-ROM或其它光盘储存装置、磁盘存储装置或其它磁性存储装置,或可用以运载或存储呈指令或数据结构形式的所需程序代码且可由计算机存取的任何其它媒体。如本文中所使用,磁盘和光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软性磁盘和蓝光光盘,其中磁盘通常以磁性方式再现数据,而光盘利用激光以光学方式再现数据。以上各项的组合也应包含在计算机可读媒体的范围内。
提供本发明的前述描述以使所属领域的技术人员能够制造或使用本发明。所属领域的技术人员将易于明白对本发明的各种修改,且本文中界定的一般原理在不脱离本发明的精神或范围的情况下应用于其它变体。因此,本发明并不既定限于本文中所描述之的实例,而应符合与本文中所揭示的原理及新颖特征相一致的最广泛范围。
尽管称示范性实施方案利用在一或多个独立计算机系统的背景下的当前揭示的标的物的方面,但所述标的物不受如此限制,而是可结合任何计算环境(例如网络或分布式计算环境)来实施。此外,当前揭示的标的物的方面可以在多个处理芯片或装置中或跨越多个处理芯片或装置实施,且可类似地跨越多个装置实现存储。此类装置可包含PC、网络服务器和手持式装置。
尽管已经以特定地针对结构特征和/或方法动作的语言来描述标的物,但应理解,所附权利要求书中所界定的标的物未必限于上文所描述的具体特征或动作。相反地,揭示以上描述的具体特征和动作作为实施权利要求的实例形式。
<本发明的方面>
在下文中,将另外陈述本发明的一些方面。
(实例1)根据本发明的一方面,提供一种在电子装置中执行的用于将具有文本的图像调整大小的方法,其包含:确定所述图像中的至少一个文本区的布局信息,其中所述布局信息包含所述图像中的所述至少一个文本区的数目、大小、位置、形状或文本密度中的至少一者;基于所述布局信息、所述图像的大小以及目标图像大小而选择用于所述图像的接缝雕刻操作、裁剪操作以及按比例缩放操作当中的至少一个操作;以及至少基于所述布局信息、所述图像的所述大小或所述目标图像大小中的一者而执行所述选定操作以将所述图像调整大小为所述目标图像大小,其中所述经调整大小的图像包含所述至少一个文本区。
(实例2)在实例1的方法中,确定所述布局信息包含:检测所述图像中的多个文本部分;以及至少基于所述多个文本部分的笔划宽度、大小、形状或位置中的一者而将所述多个文本部分中的至少一者群集到所述至少一个文本区中。
(实例3)在实例1或2的方法中,确定所述至少一个文本区的所述布局信息包含:辨识所述图像中的所述至少一个文本区中的文本;以及基于所述图像中的所述至少一个文本区中的所述经辨识文本而确定所述至少一个文本区中的每一者的优先级。
(实例4)在实例1到3中的任一者的方法中,确定所述至少一个文本区中的每一者的所述优先级包含基于所述经辨识文本而确定所述文本区的信息类型或内容中的至少一者。
(实例5)在实例1到4中的任一者的方法中,执行所述选定操作以将所述图像调整大小为所述目标图像大小包含:从所述至少一个文本区选择与低优先级相关联的文本区;以及执行所述选定操作以从所述图像移除所述选定文本区。
(实例6)在实例1到5中的任一者的方法中,选择所述接缝雕刻操作、所述裁剪操作或所述按比例缩放操作包含响应于所述布局信息而选择所述接缝雕刻操作,其中所述布局信息指示所述图像中的多个文本区。
(实例7)在实例1到6中的任一者的方法中,选择所述接缝雕刻操作、所述裁剪操作或所述按比例缩放操作包含选择所述接缝雕刻操作,且其中执行所述选定操作包含:计算所述图像中的多个像素的多个能量值,其中所述像素中的每一者的能量值指示所述像素是文本的概率;基于所述图像中的所述像素的所述能量值而确定所述图像中的多个接缝,所述接缝中的每一者包含沿着最小能量梯度的路径的所述多个像素的集合;以及基于所述图像中的所述接缝中的每一者中的所述像素的所述能量值的总和而从所述图像移除所述接缝中的至少一者。
(实例8)在实例1到7中的任一者的方法中,确定所述至少一个文本区的所述布局信息包含:辨识所述图像中的所述至少一个文本区中的文本;以及基于所述图像中的所述至少一个文本区中的所述经辨识文本而确定所述至少一个文本区中的每一者的优先级,且其中计算所述多个能量值包含基于所述至少一个文本区中的每一者的所述优先级而调整与所述至少一个文本区相关联的所述像素的所述能量值。
(实例9)在实例1到8中的任一者的方法中,选择所述接缝雕刻操作、所述裁剪操作或所述按比例缩放操作包含响应于所述布局信息指示所述图像中的单个文本区而选择所述裁剪操作,且其中所述单个文本区的大小小于或等于所述目标图像大小。
(实例10)在实例1到9中的任一者的方法中,选择所述接缝雕刻操作、所述裁剪操作或所述按比例缩放操作包含响应于所述布局信息指示所述图像中的单个文本区而选择所述按比例缩放操作,且其中所述单个文本区的大小大于所述目标图像大小。
(实例11)在实例1到10中的任一者的方法中,执行所述选定操作包含:执行所述选定操作以将所述图像调整大小为具有大于所述目标图像大小的大小的过渡图像;以及通过执行所述接缝雕刻操作、所述裁剪操作以及所述按比例缩放操作当中除所述选定操作外的至少一个操作而将所述过渡图像调整大小为所述目标图像大小。
(实例12)根据本发明的另一方面,提供一种用于将具有文本的图像调整大小的电子装置,其包含:布局信息确定单元,其经配置以确定所述图像中的至少一个文本区的布局信息,其中所述布局信息包含所述图像中的所述至少一个文本区的数目、大小、位置、形状或文本密度中的至少一者;调整大小操作选择单元,其经配置以基于所述布局信息、所述图像的大小以及目标图像大小而选择用于所述图像的接缝雕刻操作、裁剪操作或按比例缩放操作;以及调整大小单元,其经配置以至少基于所述布局信息、所述图像的所述大小或所述目标图像大小中的一者而执行所述选定操作以将所述图像调整大小为所述目标图像大小,其中所述经调整大小的图像包含所述至少一个文本区。
(实例13)在实例12的电子装置中,所述调整大小单元包含接缝雕刻单元、裁剪单元或按比例缩放单元中的至少一者,其中所述接缝雕刻单元经配置以执行所述接缝雕刻操作,其中所述裁剪单元经配置以执行所述裁剪操作,且其中所述按比例缩放单元经配置以执行所述按比例缩放操作。
(实例14)在实例12或13的电子装置中,所述电子装置进一步包含经配置以检测所述图像中的多个文本部分的文本检测单元,其中所述布局信息确定单元经配置以至少基于所述多个文本部分的笔划宽度、大小、形状或位置中的一者而将所述多个文本部分中的至少一者群集到所述至少一个文本区中。
(实例15)在实例12到14中的任一者的电子装置中,所述布局信息确定单元经配置以:辨识所述图像中的所述至少一个文本区中的文本;以及基于所述图像中的所述至少一个文本区中的所述经辨识文本而确定所述至少一个文本区中的每一者的优先级。
(实例16)在实例12到15中的任一者的电子装置中,所述布局信息确定单元经配置以基于所述经辨识文本而确定所述文本区的信息类型或内容中的至少一者。
(实例17)在实例12到16中的任一者的电子装置中,所述调整大小单元经配置以:从所述至少一个文本区选择与低优先级相关联的文本区;以及执行所述选定操作以从所述图像移除所述选定文本区。
(实例18)在实例12到17中的任一者的电子装置中,所述调整大小操作选择单元经配置以响应于所述布局信息而选择所述接缝雕刻操作,其中所述布局信息指示所述图像中的多个文本区。
(实例19)在实例12到18中的任一者的电子装置中,所述调整大小操作选择单元选择所述接缝雕刻操作,且其中所述接缝雕刻单元经配置以:计算所述图像中的多个像素的多个能量值,其中所述像素中的每一者的能量值指示所述像素是文本的概率;基于所述图像中的所述像素的所述能量值而确定所述图像中的多个接缝,所述接缝中的每一者包含沿着最小能量梯度的路径的所述多个像素的集合;以及基于所述图像中的所述接缝中的每一者中的所述像素的所述能量值的总和而从所述图像移除所述接缝中的至少一者。
(实例20)在实例12到19中的任一者的电子装置中,所述布局信息确定单元经配置以:辨识所述图像中的所述至少一个文本区中的文本;以及基于所述图像中的所述至少一个文本区中的所述经辨识文本而确定所述至少一个文本区中的每一者的优先级,且其中所述接缝雕刻单元经配置以基于所述至少一个文本区中的每一者的所述优先级而调整与所述至少一个文本区相关联的所述像素的所述能量值。
(实例21)在实例12到20中的任一者的电子装置中,所述调整大小操作选择单元经配置以响应于所述布局信息指示所述图像中的单个文本区而选择所述裁剪操作,且
其中所述单个文本区的大小小于或等于所述目标图像大小。
(实例22)在实例12到21中的任一者的电子装置中,所述调整大小操作选择单元经配置以响应于所述布局信息指示所述图像中的单个文本区而选择所述按比例缩放操作,且其中所述单个文本区的大小大于所述目标图像大小。
(实例23)根据本发明的再一方面,提供一种用于将具有文本的图像调整大小的电子装置,其包含:用于确定所述图像中的至少一个文本区的布局信息的装置,其中所述布局信息包含所述图像中的所述至少一个文本区的数目、大小、位置、形状或文本密度中的至少一者;用于基于所述布局信息、所述图像的大小以及目标图像大小而选择用于所述图像的接缝雕刻操作、裁剪操作以及按比例缩放操作当中的至少一个操作的装置;以及用于至少基于所述布局信息、所述图像的所述大小或所述目标图像大小中的一者而执行所述选定操作以将所述图像调整大小为所述目标图像大小的装置,其中所述经调整大小的图像包含所述至少一个文本区。
(实例24)在实例23的电子装置中,所述电子装置进一步包含用于检测所述图像中的多个文本部分的装置,其中所述用于确定所述布局信息的装置经配置以至少基于所述多个文本部分的笔划宽度、大小、形状或位置中的一者而将所述多个文本部分中的至少一者群集到所述至少一个文本区中。
(实例25)在实例23或24的电子装置中,所述用于确定所述布局信息的装置经配置以:辨识所述图像中的所述至少一个文本区中的文本;以及基于所述图像中的所述至少一个文本区中的所述经辨识文本而确定所述至少一个文本区中的每一者的优先级。
(实例26)在实例23到25中的任一者的电子装置中,所述用于选择用于所述图像的所述接缝雕刻操作、所述裁剪操作或所述按比例缩放操作的装置选择所述接缝雕刻操作,其中所述用于执行所述选定操作的装置经配置以:计算所述图像中的多个像素的多个能量值,其中所述像素中的每一者的能量值指示所述像素是文本的概率;基于所述图像中的所述像素的所述能量值而确定所述图像中的多个接缝,所述接缝中的每一者包含沿着最小能量梯度的路径的所述多个像素的集合;以及基于所述图像中的所述接缝中的每一者中的所述像素的所述能量值的总和而从所述图像移除所述接缝中的至少一者。
(实例27)根据本发明的又一方面,提供一种非暂时性计算机可读存储媒体,其包含用于在电子装置中将具有文本的图像调整大小的指令,所述指令致使所述电子装置的处理器执行以下操作:确定所述图像中的至少一个文本区的布局信息,其中所述布局信息包含所述图像中的所述至少一个文本区的数目、大小、位置、形状或文本密度中的至少一者;基于所述布局信息、所述图像的大小以及目标图像大小而选择用于所述图像的接缝雕刻操作、裁剪操作以及按比例缩放操作当中的至少一个操作;以及至少基于所述布局信息、所述图像的所述大小或所述目标图像大小中的一者而执行所述选定操作以将所述图像调整大小为所述目标图像大小,其中所述经调整大小的图像包含所述至少一个文本区。
(实例28)在实例27的非暂时性计算机可读存储媒体中,确定所述布局信息包含:检测所述图像中的多个文本部分,以及至少基于所述多个文本部分的笔划宽度、大小、形状或位置中的一者而将所述多个文本部分中的至少一者群集到所述至少一个文本区中。
(实例29)在实例27或28的非暂时性计算机可读存储媒体中,确定所述至少一个文本区的所述布局信息包含:辨识所述图像中的所述至少一个文本区中的文本;以及基于所述图像中的所述至少一个文本区中的所述经辨识文本而确定所述至少一个文本区中的每一者的优先级。
(实例30)在实例27到29中的任一者的非暂时性计算机可读存储媒体中,选择所述接缝雕刻操作、所述裁剪操作或所述按比例缩放操作包含选择所述接缝雕刻操作,且其中执行所述选定操作包含:计算所述图像中的多个像素的多个能量值,其中所述像素中的每一者的能量值指示所述像素是文本的概率;基于所述图像中的所述像素的所述能量值而确定所述图像中的多个接缝,所述接缝中的每一者包含沿着最小能量梯度的路径的所述多个像素的集合;以及基于所述图像中的所述接缝中的每一者中的所述像素的所述能量值的总和而从所述图像移除所述接缝中的至少一者。

Claims (30)

1.一种在电子装置中执行的用于将具有文本的图像调整大小的方法,其包括:
确定所述图像中的至少一个文本区的布局信息,其中所述布局信息包含所述图像中的所述至少一个文本区的数目、大小、位置、形状或文本密度中的至少一者;
基于所述布局信息、所述图像的大小以及目标图像大小而选择用于所述图像的接缝雕刻操作、裁剪操作以及按比例缩放操作当中的至少一个操作;以及
至少基于所述布局信息、所述图像的所述大小或所述目标图像大小中的一者而执行所述选定操作以将所述图像调整大小为所述目标图像大小,其中所述经调整大小的图像包含所述至少一个文本区。
2.根据权利要求1所述的方法,其中确定所述布局信息包括:
检测所述图像中的多个文本部分;以及
至少基于所述多个文本部分的笔划宽度、大小、形状或位置中的一者而将所述多个文本部分中的至少一者群集到所述至少一个文本区中。
3.根据权利要求1所述的方法,其中确定所述至少一个文本区的所述布局信息包括:
辨识所述图像中的所述至少一个文本区中的文本;以及
基于所述图像中的所述至少一个文本区中的所述经辨识文本而确定所述至少一个文本区中的每一者的优先级。
4.根据权利要求3所述的方法,其中确定所述至少一个文本区中的每一者的所述优先级包括基于所述经辨识文本而确定所述文本区的信息类型或内容中的至少一者。
5.根据权利要求3所述的方法,其中执行所述选定操作以将所述图像调整大小为所述目标图像大小包括:
从所述至少一个文本区选择与低优先级相关联的文本区;以及
执行所述选定操作以从所述图像移除所述选定文本区。
6.根据权利要求1所述的方法,其中选择所述接缝雕刻操作、所述裁剪操作或所述按比例缩放操作包括响应于所述布局信息而选择所述接缝雕刻操作,其中所述布局信息指示所述图像中的多个文本区。
7.根据权利要求1所述的方法,其中选择所述接缝雕刻操作、所述裁剪操作或所述按比例缩放操作包括选择所述接缝雕刻操作,且
其中执行所述选定操作包括:
计算所述图像中的多个像素的多个能量值,其中所述像素中的每一者的能量值指示所述像素是文本的概率;
基于所述图像中的所述像素的所述能量值而确定所述图像中的多个接缝,所述接缝中的每一者包含沿着最小能量梯度的路径的所述多个像素的集合;以及
基于所述图像中的所述接缝中的每一者中的所述像素的所述能量值的总和而从所述图像移除所述接缝中的至少一者。
8.根据权利要求7所述的方法,其中确定所述至少一个文本区的所述布局信息包括:
辨识所述图像中的所述至少一个文本区中的文本;以及
基于所述图像中的所述至少一个文本区中的所述经辨识文本而确定所述至少一个文本区中的每一者的优先级,且
其中计算所述多个能量值包括基于所述至少一个文本区中的每一者的所述优先级而调整与所述至少一个文本区相关联的所述像素的所述能量值。
9.根据权利要求1所述的方法,其中选择所述接缝雕刻操作、所述裁剪操作或所述按比例缩放操作包括响应于所述布局信息指示所述图像中的单个文本区而选择所述裁剪操作,且
其中所述单个文本区的大小小于或等于所述目标图像大小。
10.根据权利要求1所述的方法,其中选择所述接缝雕刻操作、所述裁剪操作或所述按比例缩放操作包括响应于所述布局信息指示所述图像中的单个文本区而选择所述按比例缩放操作,且
其中所述单个文本区的大小大于所述目标图像大小。
11.根据权利要求1所述的方法,其中执行所述选定操作包括:
执行所述选定操作以将所述图像调整大小为具有大于所述目标图像大小的大小的过渡图像;以及
通过执行所述接缝雕刻操作、所述裁剪操作以及所述按比例缩放操作当中除所述选定操作外的至少一个操作而将所述过渡图像调整大小为所述目标图像大小。
12.一种用于将具有文本的图像调整大小的电子装置,其包括:
布局信息确定单元,其经配置以确定所述图像中的至少一个文本区的布局信息,其中所述布局信息包含所述图像中的所述至少一个文本区的数目、大小、位置、形状或文本密度中的至少一者;
调整大小操作选择单元,其经配置以基于所述布局信息、所述图像的大小以及目标图像大小而选择用于所述图像的接缝雕刻操作、裁剪操作或按比例缩放操作;以及
调整大小单元,其经配置以至少基于所述布局信息、所述图像的所述大小或所述目标图像大小中的一者而执行所述选定操作以将所述图像调整大小为所述目标图像大小,其中所述经调整大小的图像包含所述至少一个文本区。
13.根据权利要求12所述的电子装置,其中所述调整大小单元包括接缝雕刻单元、裁剪单元或按比例缩放单元中的至少一者,
其中所述接缝雕刻单元经配置以执行所述接缝雕刻操作,
其中所述裁剪单元经配置以执行所述裁剪操作,且
其中所述按比例缩放单元经配置以执行所述按比例缩放操作。
14.根据权利要求12所述的电子装置,其进一步包括经配置以检测所述图像中的多个文本部分的文本检测单元,
其中所述布局信息确定单元经配置以至少基于所述多个文本部分的笔划宽度、大小、形状或位置中的一者而将所述多个文本部分中的至少一者群集到所述至少一个文本区中。
15.根据权利要求12所述的电子装置,其中所述布局信息确定单元经配置以:
辨识所述图像中的所述至少一个文本区中的文本;以及
基于所述图像中的所述至少一个文本区中的所述经辨识文本而确定所述至少一个文本区中的每一者的优先级。
16.根据权利要求15所述的电子装置,其中所述布局信息确定单元经配置以基于所述经辨识文本而确定所述文本区的信息类型或内容中的至少一者。
17.根据权利要求15所述的电子装置,其中所述调整大小单元经配置以:
从所述至少一个文本区选择与低优先级相关联的文本区;以及
执行所述选定操作以从所述图像移除所述选定文本区。
18.根据权利要求12所述的电子装置,其中所述调整大小操作选择单元经配置以响应于所述布局信息而选择所述接缝雕刻操作,其中所述布局信息指示所述图像中的多个文本区。
19.根据权利要求13所述的电子装置,其中所述调整大小操作选择单元选择所述接缝雕刻操作,且
其中所述接缝雕刻单元经配置以:
计算所述图像中的多个像素的多个能量值,其中所述像素中的每一者的能量值指示所述像素是文本的概率;
基于所述图像中的所述像素的所述能量值而确定所述图像中的多个接缝,所述接缝中的每一者包含沿着最小能量梯度的路径的所述多个像素的集合;以及
基于所述图像中的所述接缝中的每一者中的所述像素的所述能量值的总和而从所述图像移除所述接缝中的至少一者。
20.根据权利要求19所述的电子装置,其中所述布局信息确定单元经配置以:
辨识所述图像中的所述至少一个文本区中的文本;以及
基于所述图像中的所述至少一个文本区中的所述经辨识文本而确定所述至少一个文本区中的每一者的优先级,且
其中所述接缝雕刻单元经配置以基于所述至少一个文本区中的每一者的所述优先级而调整与所述至少一个文本区相关联的所述像素的所述能量值。
21.根据权利要求12所述的电子装置,其中所述调整大小操作选择单元经配置以响应于所述布局信息指示所述图像中的单个文本区而选择所述裁剪操作,且
其中所述单个文本区的大小小于或等于所述目标图像大小。
22.根据权利要求12所述的电子装置,其中所述调整大小操作选择单元经配置以响应于所述布局信息指示所述图像中的单个文本区而选择所述按比例缩放操作,且
其中所述单个文本区的大小大于所述目标图像大小。
23.一种用于将具有文本的图像调整大小的电子装置,其包括:
用于确定所述图像中的至少一个文本区的布局信息的装置,其中所述布局信息包含所述图像中的所述至少一个文本区的数目、大小、位置、形状或文本密度中的至少一者;
用于基于所述布局信息、所述图像的大小以及目标图像大小而选择用于所述图像的接缝雕刻操作、裁剪操作以及按比例缩放操作当中的至少一个操作的装置;以及
用于至少基于所述布局信息、所述图像的所述大小或所述目标图像大小中的一者而执行所述选定操作以将所述图像调整大小为所述目标图像大小的装置,其中所述经调整大小的图像包含所述至少一个文本区。
24.根据权利要求23所述的电子装置,其进一步包括用于检测所述图像中的多个文本部分的装置,
其中所述用于确定所述布局信息的装置经配置以至少基于所述多个文本部分的笔划宽度、大小、形状或位置中的一者而将所述多个文本部分中的至少一者群集到所述至少一个文本区中。
25.根据权利要求23所述的电子装置,其中所述用于确定所述布局信息的装置经配置以:
辨识所述图像中的所述至少一个文本区中的文本;以及
基于所述图像中的所述至少一个文本区中的所述经辨识文本而确定所述至少一个文本区中的每一者的优先级。
26.根据权利要求23所述的电子装置,其中所述用于选择用于所述图像的所述接缝雕刻操作、所述裁剪操作或所述按比例缩放操作的装置选择所述接缝雕刻操作,
其中所述用于执行所述选定操作的装置经配置以:
计算所述图像中的多个像素的多个能量值,其中所述像素中的每一者的能量值指示所述像素是文本的概率;
基于所述图像中的所述像素的所述能量值而确定所述图像中的多个接缝,所述接缝中的每一者包含沿着最小能量梯度的路径的所述多个像素的集合;以及
基于所述图像中的所述接缝中的每一者中的所述像素的所述能量值的总和而从所述图像移除所述接缝中的至少一者。
27.一种非暂时性计算机可读存储媒体,其包括用于在电子装置中将具有文本的图像调整大小的指令,所述指令致使所述电子装置的处理器执行以下操作:
确定所述图像中的至少一个文本区的布局信息,其中所述布局信息包含所述图像中的所述至少一个文本区的数目、大小、位置、形状或文本密度中的至少一者;
基于所述布局信息、所述图像的大小以及目标图像大小而选择用于所述图像的接缝雕刻操作、裁剪操作以及按比例缩放操作当中的至少一个操作;以及
至少基于所述布局信息、所述图像的所述大小或所述目标图像大小中的一者而执行所述选定操作以将所述图像调整大小为所述目标图像大小,其中所述经调整大小的图像包含所述至少一个文本区。
28.根据权利要求27所述的非暂时性计算机可读存储媒体,其中确定所述布局信息包括:
检测所述图像中的多个文本部分,以及
至少基于所述多个文本部分的笔划宽度、大小、形状或位置中的一者而将所述多个文本部分中的至少一者群集到所述至少一个文本区中。
29.根据权利要求27所述的非暂时性计算机可读存储媒体,其中确定所述至少一个文本区的所述布局信息包括:
辨识所述图像中的所述至少一个文本区中的文本;以及
基于所述图像中的所述至少一个文本区中的所述经辨识文本而确定所述至少一个文本区中的每一者的优先级。
30.根据权利要求27所述的非暂时性计算机可读存储媒体,其中选择所述接缝雕刻操作、所述裁剪操作或所述按比例缩放操作包括选择所述接缝雕刻操作,且
其中执行所述选定操作包括:
计算所述图像中的多个像素的多个能量值,其中所述像素中的每一者的能量值指示所述像素是文本的概率;
基于所述图像中的所述像素的所述能量值而确定所述图像中的多个接缝,所述接缝中的每一者包含沿着最小能量梯度的路径的所述多个像素的集合;以及
基于所述图像中的所述接缝中的每一者中的所述像素的所述能量值的总和而从所述图像移除所述接缝中的至少一者。
CN201580071945.5A 2015-01-15 2015-12-03 基于文本的图像调整大小 Pending CN107111865A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/597,584 2015-01-15
US14/597,584 US10002451B2 (en) 2015-01-15 2015-01-15 Text-based image resizing
PCT/US2015/063814 WO2016114859A1 (en) 2015-01-15 2015-12-03 Text-based image resizing

Publications (1)

Publication Number Publication Date
CN107111865A true CN107111865A (zh) 2017-08-29

Family

ID=55024275

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580071945.5A Pending CN107111865A (zh) 2015-01-15 2015-12-03 基于文本的图像调整大小

Country Status (5)

Country Link
US (1) US10002451B2 (zh)
EP (1) EP3245646A1 (zh)
JP (1) JP2018509644A (zh)
CN (1) CN107111865A (zh)
WO (1) WO2016114859A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110381353A (zh) * 2019-07-30 2019-10-25 北京达佳互联信息技术有限公司 视频缩放方法、装置、服务端、客户端和存储介质
CN111553356A (zh) * 2020-05-26 2020-08-18 广东小天才科技有限公司 字符识别方法及装置、学习设备、计算机可读存储介质
CN111770381A (zh) * 2020-06-04 2020-10-13 北京达佳互联信息技术有限公司 视频编辑的提示方法、装置以及电子设备
CN112116681A (zh) * 2019-06-19 2020-12-22 腾讯科技(深圳)有限公司 图像生成方法、装置、计算机设备及存储介质
WO2022116070A1 (en) * 2020-12-03 2022-06-09 Qualcomm Incorporated Content-aware bifurcated upscaling

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10332091B2 (en) 2015-05-25 2019-06-25 Ricoh Company, Ltd. Tax-exempt sale document creating system, tax-exempt sale document creating apparatus, and tax exempt sale document creating method
JP6575310B2 (ja) * 2015-11-10 2019-09-18 株式会社リコー 免税販売書類作成システム、免税販売書類作成装置、免税販売書類作成プログラムおよび免税販売書類作成方法
US20180063549A1 (en) * 2016-08-24 2018-03-01 Ati Technologies Ulc System and method for dynamically changing resolution based on content
US20190028605A1 (en) * 2017-07-24 2019-01-24 Motorola Solutions, Inc. Method and apparatus for cropping and displaying an image
JP7233960B2 (ja) * 2019-02-25 2023-03-07 株式会社トプコン 圃場情報管理装置、圃場情報管理システム、圃場情報管理方法及び圃場情報管理プログラム
JP2020177523A (ja) * 2019-04-19 2020-10-29 キヤノン株式会社 スキャン画像のプレビュー表示を行う画像処理装置、その制御方法及びプログラム
CN110356151A (zh) * 2019-05-28 2019-10-22 合肥晌玥科技有限公司 一种玉石雕刻路径的自动生成方法及装置
CN110738598A (zh) * 2019-08-28 2020-01-31 咪咕文化科技有限公司 图像适配方法、电子设备及存储介质
US11113449B2 (en) * 2019-11-10 2021-09-07 ExactNote, Inc. Methods and systems for creating, organizing, and viewing annotations of documents within web browsers
CN111062852B (zh) * 2019-12-16 2023-10-17 阿波罗智联(北京)科技有限公司 一种地图渲染方法、装置、电子设备及存储介质
JP7457903B2 (ja) * 2020-03-24 2024-03-29 京セラドキュメントソリューションズ株式会社 画像処理装置
JP2022061299A (ja) * 2020-10-06 2022-04-18 株式会社リコー 表示装置、表示方法およびプログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1469316A (zh) * 2002-06-27 2004-01-21 精工爱普生株式会社 使用压缩域处理显示任意放大的高清晰度图像的方法和装置
CN101677348A (zh) * 2008-09-16 2010-03-24 富士施乐株式会社 图像处理装置、图像显示系统以及图像处理方法
CN102170515A (zh) * 2010-02-25 2011-08-31 索尼公司 图像处理装置、图像处理方法及程序
US20120063685A1 (en) * 2009-05-05 2012-03-15 Christelle Chamaret Method for image reframing
US20140205206A1 (en) * 2013-01-24 2014-07-24 Mayur Datar Systems and methods for resizing an image

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020120653A1 (en) 2001-02-27 2002-08-29 International Business Machines Corporation Resizing text contained in an image
US7584424B2 (en) * 2005-08-19 2009-09-01 Vista Print Technologies Limited Automated product layout
EP1895466A1 (en) 2006-08-30 2008-03-05 BRITISH TELECOMMUNICATIONS public limited company Providing an image for display
JP5059545B2 (ja) * 2007-10-23 2012-10-24 株式会社リコー 画像処理装置及び画像処理方法
WO2009094140A1 (en) * 2008-01-21 2009-07-30 Wms Gaming Inc. Intelligent image resizing for wagering game machines
US8094973B2 (en) 2008-10-06 2012-01-10 Xerox Corporation Content aware image resizing for text and contone images
US8922582B2 (en) * 2009-11-16 2014-12-30 Martin J. Murrett Text rendering and display using composite bitmap images
US20120096344A1 (en) 2010-10-19 2012-04-19 Google Inc. Rendering or resizing of text and images for display on mobile / small screen devices
US8542926B2 (en) 2010-11-19 2013-09-24 Microsoft Corporation Script-agnostic text reflow for document images
US8855413B2 (en) 2011-05-13 2014-10-07 Abbyy Development Llc Image reflow at word boundaries
KR20140030361A (ko) * 2012-08-27 2014-03-12 삼성전자주식회사 휴대단말기의 문자 인식장치 및 방법
US9152871B2 (en) * 2013-09-02 2015-10-06 Qualcomm Incorporated Multiple hypothesis testing for word detection
US20150127340A1 (en) * 2013-11-07 2015-05-07 Alexander Epshteyn Capture
US20150269135A1 (en) * 2014-03-19 2015-09-24 Qualcomm Incorporated Language identification for text in an object image

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1469316A (zh) * 2002-06-27 2004-01-21 精工爱普生株式会社 使用压缩域处理显示任意放大的高清晰度图像的方法和装置
CN101677348A (zh) * 2008-09-16 2010-03-24 富士施乐株式会社 图像处理装置、图像显示系统以及图像处理方法
US20120063685A1 (en) * 2009-05-05 2012-03-15 Christelle Chamaret Method for image reframing
CN102170515A (zh) * 2010-02-25 2011-08-31 索尼公司 图像处理装置、图像处理方法及程序
US20140205206A1 (en) * 2013-01-24 2014-07-24 Mayur Datar Systems and methods for resizing an image

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112116681A (zh) * 2019-06-19 2020-12-22 腾讯科技(深圳)有限公司 图像生成方法、装置、计算机设备及存储介质
CN110381353A (zh) * 2019-07-30 2019-10-25 北京达佳互联信息技术有限公司 视频缩放方法、装置、服务端、客户端和存储介质
CN110381353B (zh) * 2019-07-30 2022-08-23 北京达佳互联信息技术有限公司 视频缩放方法、装置、服务端、客户端和存储介质
CN111553356A (zh) * 2020-05-26 2020-08-18 广东小天才科技有限公司 字符识别方法及装置、学习设备、计算机可读存储介质
CN111553356B (zh) * 2020-05-26 2023-12-26 广东小天才科技有限公司 字符识别方法及装置、学习设备、计算机可读存储介质
CN111770381A (zh) * 2020-06-04 2020-10-13 北京达佳互联信息技术有限公司 视频编辑的提示方法、装置以及电子设备
CN111770381B (zh) * 2020-06-04 2022-08-05 北京达佳互联信息技术有限公司 视频编辑的提示方法、装置以及电子设备
WO2022116070A1 (en) * 2020-12-03 2022-06-09 Qualcomm Incorporated Content-aware bifurcated upscaling

Also Published As

Publication number Publication date
EP3245646A1 (en) 2017-11-22
US10002451B2 (en) 2018-06-19
JP2018509644A (ja) 2018-04-05
WO2016114859A1 (en) 2016-07-21
US20160210768A1 (en) 2016-07-21

Similar Documents

Publication Publication Date Title
CN107111865A (zh) 基于文本的图像调整大小
US11714523B2 (en) Digital image tagging apparatuses, systems, and methods
JP6208383B2 (ja) プレビューモードにおける画像キャプチャリングパラメータ調整
JP5612310B2 (ja) 顔認識のためのユーザーインターフェース
WO2018028583A1 (zh) 字幕提取方法及装置、存储介质
KR101528017B1 (ko) 다수의 피쳐 검출기들의 적용에 기초한 이미지 피쳐 검출
JP5948842B2 (ja) 情報処理装置、情報処理方法およびプログラム
WO2007081147A1 (en) Portable terminal having camera for recognizing name card and method thererof using the same
US20160104052A1 (en) Text-based thumbnail generation
CN105095860B (zh) 字符分割方法和装置
CN102035930A (zh) 图像的应用操作方法及系统
CN105393244A (zh) 信息处理装置和控制程序
WO2016057238A1 (en) Linking thumbnail of image to web page
CN106485246B (zh) 字符识别方法及装置
CN107851129B (zh) 信息处理装置、信息处理方法和程序
CN104112130B (zh) 光学字符识别方法及装置
CN107949848A (zh) 数字图像中的缺陷检测和校正
EP3461138B1 (en) Processing method and terminal
CN106777083A (zh) 一种标记图片中物体的方法及装置
JP6288476B2 (ja) 映像受信装置、及び、映像受信装置における情報表示制御方法
CN106650727B (zh) 一种信息显示方法以及ar设备
US10242279B2 (en) User terminal device and method for controlling the same
Jayashree et al. Voice based application as medicine spotter for visually impaired
JP2006229874A5 (zh)
JP2017167575A (ja) 電子記録情報表示装置、電子記録情報表示プログラム、及び電子記録情報表示方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170829

WD01 Invention patent application deemed withdrawn after publication