CN104182770A - 用于一个或多个图像处理算法的自动选择的方法和系统 - Google Patents

用于一个或多个图像处理算法的自动选择的方法和系统 Download PDF

Info

Publication number
CN104182770A
CN104182770A CN201410222004.4A CN201410222004A CN104182770A CN 104182770 A CN104182770 A CN 104182770A CN 201410222004 A CN201410222004 A CN 201410222004A CN 104182770 A CN104182770 A CN 104182770A
Authority
CN
China
Prior art keywords
image
image processing
algorithm
segments
algorithms
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410222004.4A
Other languages
English (en)
Other versions
CN104182770B (zh
Inventor
塔努什亚姆·查托帕迪亚雅
拉穆·温帕达·雷迪
尤帕尔·加兰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tata Consultancy Services Ltd
Original Assignee
Tata Consultancy Services Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tata Consultancy Services Ltd filed Critical Tata Consultancy Services Ltd
Publication of CN104182770A publication Critical patent/CN104182770A/zh
Application granted granted Critical
Publication of CN104182770B publication Critical patent/CN104182770B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/18105Extraction of features or characteristics of the image related to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Character Input (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了用于图像处理的自动算法选择的方法和系统。本发明公开用于对处理的图像的变化的要求自动选择正确的算法的方法和系统。算法的选择是完全自动的并且由多个机器学习方法指导。这里的系统被配置为预处理多个图像以用于创建训练数据。接下来,提取、预处理和匹配测试图像,以用于估计处理算法的最可能匹配。

Description

用于一个或多个图像处理算法的自动选择的方法和系统
相关申请的交叉引用
本专利申请要求于2013年05月24日提交的印度专利申请No.1840/MUM/2013的权益。
技术领域
本文描述的本发明主题一般涉及图像处理,并且更具体涉及一个或多个图像处理算法的自动选择。
背景技术
图像处理涉及图像如照片或视频帧的处理以生成已处理图像,或涉及与图像有关的特征或参数的集合作为处理的输出。
图像的处理可以涉及各种任务如二值化、页面分割、斜度校正、符号识别和页面布局分析。通过市场中可用的各种传统已知算法可以完成这些任务。但是,在内部图像变化中出现重大问题,其中单一算法可能不能产生可接受的或期望的结果。而且,没有已知的单一算法可以在所有的情况下很好地处理图像。
而且,在传统方法中,基于用户反馈来选择算法或技术及其相应的参数,以为了获得期望的已处理图像。传统方法的主要限制在于其涉及人工干预,人工干预使得系统变慢并且使得最终结果对于人类感知灵敏。尽管存在用于使用机器学习方法来对图像处理建议合适算法的各种方法,但是这些从未解决内部图像变化所面对的挑战。因此,存在从多个算法中自动识别在处理期间匹配图像要求的一个或多个算法的需要。本发明的实施方式意图满足这些需要和从下文提出的说明和附图中变得显而易见的其它目的。
发明内容
提供本发明内容来介绍涉及用于一个或多个图像处理算法的自动选择的系统和方法的方案并且在以下详细说明中进一步描述方案。本发明内容并不意图确定所要求的本发明主题的基本特征,也不意图用于确定和限定所要求的本发明主题的范围。
在一个实现中,公开了用于一个或多个预存储图像处理算法的自动选择以用于图像处理的图像处理系统。图像处理系统包括处理器以及耦合至处理器的存储器,该处理器用于执行存在在存储器中的多个模块。多个模块包括:接收模块、图像处理模块、比较模块、记录模块和匹配模块。接收模块被配置为接收至少一个图像。图像处理模块被配置为将所接收图像分割为多个图像片段并且进一步在每个图像片段上执行来自多个图像处理算法的一个或多个预存储算法以为了获得多个图像处理算法输出。另一方面,比较模块被配置为将图像处理算法输出中的每个与预定阈值图像处理输出得分进行比较。记录模块被配置为将图像处理算法连同相应的一个或多个图像片段以及关联的特征向量一起记录为训练对。匹配模块被配置为匹配来自每个输入预处理测试图像的训练对中的一个或多个潜在匹配图像处理算法。
在一个实现中,公开了在图像处理环境中用于自动选择一个或多个算法的计算机实现的方法。该方法包括接收至少一个图像。将接收的图像分割为多个图像片段。在接下来的步骤中,在每个图像片段中上执行来自多个图像处理算法的一个或多个预存储算法,以为了获得多个图像处理算法输出。而且,将每个图像处理算法输出与预定阈值图像处理输出得分进行比较。针对每个超过预定阈值图像处理输出得分的图像处理算法,将图像处理算法连同相应的一个或多个图像片段以及关联的特征向量一起记录为训练对。在接下来的步骤中,从每个输入预处理测试图像的训练对中选择一个或多个潜在匹配图像处理算法。
附图说明
参考附图来描述详细说明。在图中,参考标号的最左边的数字指示其中首次出现参考标号的图。相同的标号在所有图中使用以指示相似的特征和组件。
图1示出根据本发明主题的实施方式显示的图像处理系统的网路实现。
图2示出根据本发明主题的实施方式的图像处理系统。
图3示出根据本发明主题的实施方式的图像处理系统的方框图。
图4示出根据本发明主题的实施方式的在图像处理环境中自动选择一个或多个算法的方法。
图5示出根据本发明主题的实施方式用于获得预处理测试图像的方法。
图6示出根据本发明主题的实施方式用于图像处理的流程图。
图7示出根据本发明主题的实施方式的示例性图像处理系统及其工作。
图8示出根据本发明主题的实施方式的图像处理系统的结果。
具体实施方式
公开用于在图像处理环境中自动选择一个或多个算法的系统和方法。
在一个实现中,图像处理系统包括处理器和耦合至处理器的存储器,该处理器用于执行存在在存储器中的多个模块。多个模块包括:接收模块、图像处理模块、比较模块、记录模块和匹配模块。接收模块被配置为接收至少一个图像。图像处理模块被配置为将接收的图像分割为多个图像片段。图像处理模块进一步被配置为在每个图像片段上,使用来自多个图像处理算法中的一个或多个预存储算法执行图像处理以为了获得多个图像处理算法输出。另一方面,比较模块被配置为将每个图像处理算法输出与预定阈值图像处理输出得分进行比较。记录模块被配置为将图像处理算法连同相应的一个或多个图像片段以及关联的特征向量一起记录作为训练对。匹配模块被配置为匹配每个来自输入预处理测试图像的所述训练的一个或多个潜在匹配图像处理算法。
在一个实现中,可以通过图像处理系统接收图像。使用已经分割算法将接收的图像分割为多个片段。多个预存储的算法可以适用在多个片段上。而且,将通过执行算法获得的每个结果与预定阈值图像处理输出得分进行比较。在下一个步骤中,针对每个超过预定阈值图像处理输出得分的图像处理算法,将图像处理算法连同对应的一个或多个图像片段及其关联的特征向量一起记录作为训练对。而且,从输入预处理测试图像的训练对中选择一个或多个匹配图像处理算法。
在一个实现中,通过接收被进一步分割为多个片段的测试图像来获得预处理测试图像。继而从多个片段中提取多个特征。
虽然所描述的在图像处理方案中的自动选择一个或多个算法的系统和方法的方案可以在任意数量的不同计算系统、环境和/或配置中实现,但是在以下示例性系统的环境中描述实施方式。
现参考图1,示出根据本发明主题的实施方式的,用于在图像处理环境中自动选择一个或多个算法的图像处理系统102的网络实现100。在一个实施方式中,图像处理系统102被配置为接收图像。使用已知分割算法将接收的图像分割为多个片段。多个预存储算法应用在多个片段上。而且,将通过执行算法获得的每个结果与预定阈值图像处理输出得分进行比较。在下一个步骤中,针对超过预定阈值图像处理输出得分的图像处理算法中的每个,将图像处理算法连同对应的一个或多个图像片段以及关联的特征向量一起记录作为训练对。而且,从用于每个输入预处理测试图像的训练对中选择一个或多个潜在匹配图像处理算法。
尽管考虑图像处理系统102实现在服务器上来解释本发明主题,但是可以理解的是图像处理系统102可以实现在各种计算系统中,例如笔记本电脑、台式计算机、工作站、大型计算机、服务器和网络服务器等等。要理解的是,可以由多个用户通过在下文中统一称为用户104的一个或多个用户设备104-1、104-2、…、104-N或存在用户设备104上的应用来访问图像处理系统102。用户设备104的实例可以包括但不限于便携计算机、个人数字助理、手持设备和工作站。用户设备通过网络106可通信地与图像处理系统102耦合。
在一个实现中,网络106可以为无线网络、有线网络或其结合。网络106可以实现为不同网络中的一种,例如企业内部网、局域网(LAN)、广域网(WAN)以及互联网等等。网络106可以为专用网络或者共享网络。共享网络代表使用各种协议的不同类型的网络的联合,例如超文本传输协议(HTTP)、传输控制协议/因特网互联协议(TCP/IP)和无线应用协议(WAP)等等来相互通信。而且,网络106可以包括各种网络设备,包括例程、桥接器、服务器、计算设备和存储设备等等。
现参考图2,其示出根据本发明的主题图像处理系统102。在一个实现中,图像处理系统102可以包括至少一个处理器202、输入/输出(I/O)接口204以及存储器206。至少一个处理器202可以实现为一个或多个微处理器,微型计算机、微型控制器、数字信号处理器、中央处理单元、状态机、逻辑电路和/或基于操作指令操纵信号的任何设备。在其它性能中,至少一个处理器202被配置为取得和执行存储在存储器206中的计算机可读指令。
I/O接口204可以包括各种软件和硬件接口,例如网页接口和图形用户接口等。I/O接口204可以允许图形处理系统102与用户直接或通过客户设备104相互作用。而且,I/O接口204可以使得图形处理系统102能够与其它计算设备,例如网页服务器和外部数据服务器(未示出)相互通信。I/O接口204可以有助于在包括有线网络(例如LAN、线缆等)和无线网络(例如WLAN、移动电话或卫星)的各种网络和协议类型中的多重通信。I/O接口203可以包括用于将多个设备进行相互连接或连接至另一个服务器的一个或多个端口。
存储器206可以包括在本领域中已知的任意计算机可读介质,例如易失性存储器,诸如静态随机存取存储器(SRAM)和动态随机存取存储器(DRAM),和/或非易失性存储器,诸如只读存储器(ROM)、可擦除编程ROM、闪存、硬盘、光盘和磁带。存储器206可以包括模块208和数据210。
模块208包括执行具体任务或实现具体抽象数据类型的例程、程序、对象、组件、数据结构等。在一个实现中,模块208可以包括接收模块212、图像处理模块214、比较模块216、记录模块218、匹配模块220和其它模块222。其它模块222可以包括用于补充图像处理系统102的应用和功能的程序和编码指令。
除其它事项外,数据210用作存储由一个或多个模块208处理、接收和生成的数据的库。数据210还可以包括接收数据库224、图像处理数据库226、比较数据库228、记录数据库230、匹配数据库232和其它数据130。其它数据130可以包括由于在其它模块218中的一个或多个模块的执行而导致的数据。
在一个实现中,用户可以使用客户设备104来经由I/O接口204访问图像处理系统102。用户可以使用I/O接口204来注册他们以为了使用图像处理系统102。图像处理系统102的工作可以在以下解释的图3和图4中详细解释。图像处理系统102可以用于在图像处理环境中自动选择一个或多个算法。图像处理系统102的实际工作在以下段落中说明。
参考图3,框图300描述根据本发明的主题的实施方式的图像处理系统102的详细工作。
在一个实现中,模块208包括执行具体任务或实现具体抽象数据类型的例程、程序、对象、组件、数据结构等。在一个实现中,模块208可以包括接收模块212、图像处理模块214、比较模块216、记录模块218、匹配模块220和其它模块222。其它模块222可以包括补充图像处理系统102的应用和功能的程序或编码指令。
接收模块212
在一个实现中,接收模块212被配置为接收用于处理的多个图像。由接收模块212接收的图像从与图像处理系统212相互作用的各种设备104获得。
在一个实例中,接收的图像可以为一种文件格式,该文件格式可以包括但不限于JPEG/JFIF图像、JPEG2000图像、Exif图像、TIFF图像和RAW等。
在一个实现中,接收模块212可以从设备104接收预处理的图像。预处理的图像可以包括但不限于从图像提取的多个特征。
在一个实例中,通过接收测试图像获得预处理。将接收的测试图像分割为多个图像片段。多个图像片段进一步用于从片段中提取多个特征。
在一个实现中,与接收模块212有关的数据存储在接收数据库224中。在一个实例中,接收数据库224可以包括但不限于用于处理的多个接收的图像,预处理图像,从多个图像提取的多个特征。
图像处理模块214
在一个实现中,图像处理模块214被配置为将接收的图像分割为多个图像片段并且在每个图像上执行来自多个图像处理算法的一个或多个预存储算法以为了获得多个图像处理算法输出。
在一个实现中,图像处理模块214使用可能预存储在图像处理系统102中的已知分割方法将接收的图像分割为多个图像片段。在一个实例中,已知分割方法可以包括但不限于阈值方法、聚类方法和基于压缩的方法等。
在一个实现中,多个图像片段可以包括但不限于重叠的片段或非重叠片段或其组合。使用来自多个图像处理算法的一个或多个预存储算法进一步处理图像片段以为了获得多个图像处理算法输出。
在一个实例中,一个或多个预存储算法可以包括但不限于包括二值化算法、降噪算法、分割算法、符号识别算法、页面布局检测、页面布局分割以及通过本领域中已知的任何现有的图像处理算法。
在一个实例中,从处理获得的多个图像处理算法输出可以包括相同图像的不同区域连同对于相应区域预测的算法。在另一个实例中,多个图像处理算法输出可以包括图像或与图像有关的特征或参数的集合。
在一个实现中,与图像处理模块214有关的数据存储在图像处理数据库226中。在一个实例中,图像处理数据库226可以包括但不限于多个已知分割方法、多个图像处理算法和多个图像片段等。
比较模块216
在一个实现中,比较模块216被配置为将图像处理处理算法输出中的每个与预定阈值图像处理输出得分进行比较。从图像处理模块216获得的输出与预定阈值图像处理输出得分进行比较。
在一个实例中,从图像处理模块216获得的输出与地面实况(GT)进行比较。使用可以包括但不限于手动数据或本领域中已知的任何GT技术来计算GT。
在一个实现中,比较模块216可以确定预定阈值图像处理输出得分为作为每个训练对的特征的地面实况。而且,与比较模块216有关的数据存储在比较数据库228中。在一个实例中,比较数据库228可以包括但不限于图像处理算法输出、预定阈值图像处理输出得分和地面实况(GT)等。
记录模块218
在一个实现中,记录模块218被配置为基于比较模块216的输出,记录图像处理算法连同相应一个或多个图像片段以及关联特征向量一起作为训练对。
在一个实现中,图像处理算法与相应的一个或多个图像片段一起可以从比较模块216获得。通过提取每个图像片段的图像瞬时特征来获得与一个或多个图像片段有关的关联特征向量,其中图像瞬时特征包括与图像片段对应的均值、方差及斜度。而且,基于每个图像片段的图像瞬时特征形成特征向量,其中使用HSV量化或通过本领域中已知的任何技术获得特征向量。在一个实例中,从每个接收的图像提取长度265的特征向量。
在一个实现中,训练对可以包括但不限于图像处理算法连同对应的一个或多个图像片段。
在一个实现中,与记录模块218有关的数据存储在记录数据库230中。在一个实例中,记录数据库230可以包括但不限于图像处理算法连同对应的一个或多个图像片段和关联特征向量一起作为训练对和作为每个训练对的特征确定的地面实况等等。
匹配模块220
在一个实现中,匹配模块220被配置为匹配来自用于每个输入预处理测试图像的训练对中的一个或多个潜在匹配图像处理算法。通过接收测试图像获得预处理测试图像。将接收的测试图像分割为多个图像片段。利用多个图像片段从片段提取多个特征。
在一个实现中,来自片段的多个特征可以通过现有技术中熟练技术人员公知的方法来提取。但是,公开的本发明主题应当理解为包括本领域熟练技术人员可能公知的图像分割方法。
在一个实例中,接收的图像可以为这样一种格式,该格式可以包括但不限于JPEG/JFIF图像,JPEG2000图像、Exif图像、TIFF图像和RAW等。
在一个实例中,可以在图像处理系统102或在设备104处执行图像预处理。
在一个实现中,与匹配模块220有关的数据存储在匹配数据库232中。在一个实例中,匹配数据库232可以包括但不限于预处理测试图像和图像处理算法等。
现参考图4,描述根据本发明主题的实施方式的在图像处理环境中用于自动选择一个或多个算法的方法。
方法400可以在计算机可执行指令的一般环境中描述。通常,计算机可执行指令可以包括执行具体功能或实现具体抽象数据类型的例程、程序、对象、组件、数据结构、流程、目录和功能等。方法400还可以在分布式计算环境中实行,其中由通过通信网络链接的远程处理设备执行功能。在分布式计算环境中,计算机可执行指令可以位于本地远程计算机存储介质中,包括存储器存储设备。
用于描述方法400的顺序并不意图理解为限制,并且任意数量的描述的方法框可以以任意顺序结合以实现方法400或替换的方法。另外,单独的框可以从方法400中删除而没有超出本文中的本发明的主题的精神和范围。此外,方法可以以任何合适的硬件、软件、固件或其结合来实现。但是,为了解释容易,在以下描述的实施方式中,方法400可以被视为在上文描述的图像处理系统102中实现。
在框402处,接收至少一个图像。接收的图像从与图像处理系统102相互作用的各种设备104获得。
在框404处,通过在本领域中已知的任何现有的图像分割技术来执行将接收的图像分割为多个图像片段。但是,公开的本发明的主题应当理解为包括可以由本领域中的熟练技术人员已知的其它图像分割方法。
在框406处,在每个图像片段上处理来自多个图像处理算法的一个或多个预存储算法以为了获得多个图像处理算法输出。在一个实例中,图像处理算法可以包括但不限于二值化算法,降噪算法、分割算法、符号识别算法。
在框408处,将图像处理算法输出与预定阈值图像处理输出得分进行比较。在一个实例中,预定阈值图像处理输出得分为作为每个训练对的特征的地面实况(GT)。
在框410处,将图像处理算法连同对应的图像片段和关联特征向量一起记录作为训练对。在一个实现中,通过提取每个图像片段的图像瞬时特征获得与一个或多个图像片段有关的关联特征向量,其中图像瞬时特征包括与图像片段对应的均值、方差和斜度。而且,基于每个图像片段的图像瞬时特征形成特征向量,其中使用HSV量化获得特征向量。
在框412处,针对用于进一步处理的每个输入预处理测试图像,选择来自训练对的匹配图像处理算法。在一个实现中,通过接收测试图像获得预处理测试图像。将接收的测试图像分割为多个图像片段。进一步利用多个图像片段从片段提出多个特征。
现参考图5,描述根据本发明的主题的用于获得预处理的测试图像500的方法。可以在图像处理系统102中或在设备104中执行方法500。
在步骤502处,接收测试。在一个实例中,接收的图像可以为一种格式,该格式包括但不限于JPEG/JFIF图像,JPEG2000图像、Exif图像、TIFF图像和RAW等。
在步骤504处,将接收的测试图像分割为多个图像片段。在一个实例中,通过本领域中任意现有图像分割即使来执行分割。但是,公开的本发明主题应当理解为包括本领域中熟练技术任何已熟知的其它图像分割方法。
在步骤506处,多个图像片段进一步用于从图像片段提取多个特征。在一个实例中,通过本领域中已知的任意现有图像提取技术来执行提取。但是,公开的本发明主题应当理解为包括本领域中熟练技术人员已熟知的其它图像提取方法。
现参考图6,描述根据本发明的主题的实施方式的图像处理流程。
在一个实现中,可以通过图像处理系统来接收图像。使用已知分割算法将接收的图像分割为多个片段。多个预存储算法应用到多个片段上。而且,将每个算法结果与可以为地面实况(GT)的预定阈值图像处理输出得分进行比较。在下一个步骤中,针对超过预定阈值图像处理输出得分的每个图像处理算法,将对应一个或多个图像片段和关联特征向量记录为训练对。
而且,通过图像处理系统接收至少一个测试图像。使用已知分割算法将接收的测试图像分割为多个片段。使用已知提取算法从测试图像提取多个特征。至少,选择来自用于每个输入预处理(提取特征)测试图像的训练对的一个或多个潜在匹配的图像处理算法。
在图7中说明流程图的详细工作。
现参考图7,描述根据本发明主题的实施方式的示例性图像处理系统及其工作。
设想T={t1,t2…,tn}为n个训练图像的集合。对于每个训练图像ti而言,获得光学符号识别(OCR’d)输出gi。设A为预存储在图像处理系统中的m个二值化算法A={a1,a2…,an}。将每个图像划分为k个(重叠或非重叠)片段(s1,s2…,sk),即
t i = ∪ i = 1 k s i
而且,m个算法中的每个在k个片段中的每个上工作。设rij指示来自在片段si上工作的算法aj的二值化结果。完整的图像的二值化通过以下获得:
∪ i = 1 k r · ij
因为j可以从1变化至m,所以训练图像存在km个不同二值化结果。
在一个实例中,如果OCR识别这些km个图像中的每个并且生成许多OCR输出(o1,o2…,ok m)。然后将这些oi中的每个与对应的地面实况(GT)gi进行比较并且如果发现匹配,那么生成oi的算法系列为在k个片段上工作的k个二值化算法(所有k个算法不必要不同)的正确集合。设B={b1,b2…,bk}可以为在片段(s1,s2,…,sk)上工作的这些k个算法的集合。在一个实例中,二值化算法可以包括到不限于Otsu方法、Savoula算法、Niblack算法和Wolf二值化技术等。
应当注意所有bi∈A而且bi可以等于bj,其中i?=j。因此,在bi和si之间有一对一的对应性并且我们声称bi为si的二值化的正确算法。
上述方程用于生成训练对<图像片段,二值化算法>,即<si,bi>。(b1,b2…,bk)中的每个可以视为生成输出的路径并且有mk个这种路径。模型可以生成OCR输出是正确的许多最终图像。因此,从单个训练图像,我们可以有许多路径给出正确OCR结果。所有这些路径视为生成训练示例。这个过程已经在图7中说明。GT代表地面实况,对勾标记对应生成正确ICR输出的路径,并且交叉标记指示生成错误OCR输出的路径。在准备训练数据同时忽略生成错误OCR输出的路径。
在一个实例中,为了训练遵循器学习算法(例如,SVM)的机制,接下来每个si(代表图像片段)导致相应的特征向量fi。所以最终<fi,bi>对用于训练。
在一个实例中,基于每个图像片段的图像瞬时特征获得特征向量。图像瞬时特征包括与图像片段(sxy)对应的均值(Ex),方差(σω)和斜度(zx)。使用以下提到的方程提取特征:
E x = 1 N &Sigma; y = 1 N s xy . . . . . . ( 1 )
&sigma; x = [ 1 N &Sigma; y = 1 N ( I x &infin; y - E x ) 2 ] 1 2 . . . . . . . . ( 2 )
z x = [ 1 N &Sigma; y = 1 N ( I xy - E x ) 3 ] 1 3 . . . . . . . . . . . ( 3 )
在一个实例中,使用HSV量化获得特征向量。
而且,通过创建每个片段的<fi,bi>对来构建训练数据,其中fi为特征向量的。
为了自动选择用于处理的算法,接收测试图像。图像处理系统将测试图像划分为k个片段并且预测k个片段中的每个的对应的二值化算法。从每个图像片段提取特征并且通过在以前准备的训练数据集合上训练的SVM完成预测。然后使用预测算法来二值化每个图像片段。通过片段的二值化图像的简单圆环(Oring)来获得测试图像的最终二进制版本。
在一个实例中,通过使用OCR来完成模型的目标指向评估以读取测试图像的二值化版本。如果OCR结果匹配与测试图像对应的地面实况,之后我们将OCR结果视为对于那个测试图像的正确二值化策略的预测成功。
参考图8,描述根据本发明主题的图像处理系统的结果。
图8在左栏中显示三个图像,其中当应用二值化算法时,没有二值化算法导致正确的OCR,然而右栏为通过提出发明的图像处理系统为了实现正确ICR输出而获得的输出。
上文描述的发明的主要优点为可以从多个预存储的算法中自动识别在处理期间匹配图像的要求的一个或多个算法。
本发明的另一个优点是即使存在内部图像变量也能够有效地工作,其中,在内部图像变量中单个算法可能不产生可接受的结果。
本发明的另一个优点为在能够有效和快速,因为减少了使得系统变慢并且使得最终结果对于人类感知敏感的人工干预时。
本发明的另一个优点为使用机器学习方法对图像处理提供合适算法,该算法还用于内部图像变量。
本发明的另一个优点是由于上文提到的自动处理,传统图像处理系统中的时间损耗大大地减少。
尽管图像处理的自动算法选择的方法和系统的实现以特定于结构特征和/或方法的语言描述,但是应当理解的是所附权利要求并不必须限于所描述的特定特征或方法。相反,特定特征和方法公开为图像处理的自动算法选择的实现的实例。

Claims (11)

1.一种用于在图像处理环境中自动选择一个或多个算法的计算机实现的方法,所述方法包括:
接收至少一个图像;
将所接收图像分割为多个图像片段;
在每个图像片段上执行来自多个图像处理算法的一个或多个预存储算法,以为了获得多个图像处理算法输出;
将每个图像处理算法输出与预定阈值图像处理输出得分比较;
针对每个超过预定阈值图像处理输出得分的图像处理算法,将该图像处理算法连同相应的一个或多个图像片段和关联的特征向量一起记录为训练对;并且
从用于每个输入预处理测试图像的训练对中选择一个或多个潜在匹配图像处理算法。
2.根据权利要求1所述的计算机实现的方法,其中,所述预处理测试图像在以下步骤中获得:
接收所述测试图像;
将所接收测试图像分割为多个图像片段;以及
从所述多个图像片段中提取多个特征。
3.根据权利要求1所述的计算机实现的方法,其中,所述图像片段包括重叠的片段和非重叠的片段或其组合。
4.根据权利要求1所述的计算机实现的方法,其中,所述多个图像处理算法包括:二值化算法、降噪算法、分割算法,符号识别算法、页面布局检测、页面布局分割或其组合。
5.根据权利要求1所述的计算机实现的方法,其中,所述特征向量在以下步骤中获得:
提取每个图像片段的图像矩特征,其中图像矩特征包括与该图像片段对应的均值、方差及斜度;以及
形成特征向量,其中,使用HSV量化等来获得特征向量。
6.根据权利要求1所述的计算机实现的方法,其中,所述预定阈值图像处理输出得分是被确定为每个训练对的特征的地面实况。
7.一种用于在图像处理环境中自动选择一个或多个算法的图像处理系统,所述系统包括:
处理器;
耦合至处理器的存储器,其中,所述处理器能够执行存储在存储器中的多个模块,并且其中,所述多个模块包括:
用于接收至少一个图像的接收模块;
图像处理模块,所述图像处理模块被配置为:
将所接收图像分割为多个图像片段;并且
在每个图像片段上执行来自多个图像处理算法的一个或多个预存储算法,以为了获得多个图像处理算法输出;
比较模块,所述比较模块被配置为将每个图像处理算法输出与预定阈值图像处理输出得分比较;
记录模块,所述记录模块被配置为将该图像处理算法连同相应的一个或多个图像片段以及关联的特征向量一起记录为训练对;和
匹配模块,所述匹配模块被配置为从用于每个输入预处理测试图像的训练对中选择一个或多个潜在匹配图像处理算法。
8.根据权利要求7所述的图像处理系统,其中,所述图像处理模块被配置为通过执行从二值算法、降噪算法、分割算法、符号识别算法、页面布局检测、页面布局分割或其组合中选择的一个或多个图像处理算法来处理所接收图像。
9.根据权利要求7所述的图像处理系统,所述预处理测试图像在以下步骤中得到:
接收所述测试图像;
将所接收测试图像分割为多个图像片段;以及
从所述多个图像片段中提取多个特征。
10.根据权利要求7所述的图像处理系统,其中,所述记录模块还被配置为获得在以下步骤中得到的特征向量:
提取每个图像片段的图像矩特征,其中图像矩特征包括与该图像片段对应的均值、方差及斜度;以及
形成特征向量,其中,使用HSV量化等来获得特征向量。
11.根据权利要求7所述的图像处理系统,其中,所述比较模块将预定阈值图像处理输出得分确定为作为每个训练对的特征的地面实况。
CN201410222004.4A 2013-05-24 2014-05-23 用于一个或多个图像处理算法的自动选择的方法和系统 Active CN104182770B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
IN1840/MUM/2013 2013-05-24
IN1840MU2013 2013-05-24

Publications (2)

Publication Number Publication Date
CN104182770A true CN104182770A (zh) 2014-12-03
CN104182770B CN104182770B (zh) 2018-06-05

Family

ID=50819570

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410222004.4A Active CN104182770B (zh) 2013-05-24 2014-05-23 用于一个或多个图像处理算法的自动选择的方法和系统

Country Status (4)

Country Link
US (1) US9275307B2 (zh)
EP (1) EP2806374B1 (zh)
JP (2) JP2014229317A (zh)
CN (1) CN104182770B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107636698A (zh) * 2015-06-25 2018-01-26 富士通株式会社 程序生成装置、程序生成方法以及生成程序
CN107729948A (zh) * 2017-10-31 2018-02-23 京东方科技集团股份有限公司 图像处理方法及装置、计算机产品和存储介质
CN108009643A (zh) * 2017-12-15 2018-05-08 清华大学 一种机器学习算法自动选择方法和系统
CN108475425A (zh) * 2016-01-20 2018-08-31 富士通株式会社 图像处理装置、图像处理方法及图像处理程序
CN108496200A (zh) * 2016-01-25 2018-09-04 皇家飞利浦有限公司 图像数据预处理
CN109255277A (zh) * 2018-08-31 2019-01-22 阿里巴巴集团控股有限公司 一种二维码解析方法及装置
CN110866872A (zh) * 2019-10-10 2020-03-06 北京邮电大学 一种路面裂缝图片预处理智能选择方法、装置及电子设备
WO2020238042A1 (zh) * 2019-05-24 2020-12-03 平安科技(深圳)有限公司 识别算法更新的检测方法、装置、存储介质及计算机设备
CN112889090A (zh) * 2018-08-17 2021-06-01 道特里斯艾欧公司 使用人工智能对物理动态系统执行建模和控制的系统和方法

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015129020A1 (ja) * 2014-02-28 2015-09-03 株式会社 日立製作所 データ送信方法およびデータ送信装置
WO2016132153A1 (en) 2015-02-19 2016-08-25 Magic Pony Technology Limited Offline training of hierarchical algorithms
GB201604672D0 (en) 2016-03-18 2016-05-04 Magic Pony Technology Ltd Generative methods of super resolution
EP3278559B1 (en) 2015-03-31 2021-05-05 Magic Pony Technology Limited Training end-to-end video processes
CN105354600B (zh) * 2015-09-28 2018-10-23 南京大学 一种砂岩显微薄片的自动分类方法
US10108883B2 (en) * 2016-10-28 2018-10-23 Intuit Inc. Image quality assessment and improvement for performing optical character recognition
JP6923794B2 (ja) 2017-08-04 2021-08-25 富士通株式会社 検査装置、検査プログラム、及び検査方法
JP7215242B2 (ja) * 2019-03-08 2023-01-31 富士フイルムビジネスイノベーション株式会社 画像処理装置及びプログラム
US11055822B2 (en) 2019-05-03 2021-07-06 International Business Machines Corporation Artificially intelligent, machine learning-based, image enhancement, processing, improvement and feedback algorithms
JP2021012098A (ja) * 2019-07-05 2021-02-04 株式会社イシダ 検査装置
US11151710B1 (en) * 2020-05-04 2021-10-19 Applied Materials Israel Ltd. Automatic selection of algorithmic modules for examination of a specimen
WO2023200396A1 (en) * 2022-04-13 2023-10-19 Simpple Pte Ltd System and method for facilitating cleaning area

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010043748A1 (en) * 1997-12-19 2001-11-22 Slawomir B. Wesolkowski Method of selecting one of a plurality of binarization programs
US6393150B1 (en) * 1998-12-04 2002-05-21 Eastman Kodak Company Region-based image binarization system
US20060224539A1 (en) * 1998-05-01 2006-10-05 Hong Zhang Computer-aided image analysis
CN102955950A (zh) * 2011-08-16 2013-03-06 索尼公司 用于在线训练分类器的装置和在线训练分类器的方法

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02188891A (ja) * 1989-01-17 1990-07-24 Daihatsu Motor Co Ltd 車台刻印番号認識装置における分割2値化処理方法
US5291563A (en) * 1990-12-17 1994-03-01 Nippon Telegraph And Telephone Corporation Method and apparatus for detection of target object with improved robustness
JPH08138025A (ja) * 1994-11-04 1996-05-31 Kobe Steel Ltd 画像識別パラメータの決定方法及び画像認識方法
JP3277818B2 (ja) * 1996-08-23 2002-04-22 松下電器産業株式会社 多値画像2値化装置
JP2000333023A (ja) * 1999-05-17 2000-11-30 Canon Inc 画像データ処理方法及び装置
US7062084B2 (en) * 2000-12-01 2006-06-13 Sharp Laboratories Of America, Inc. Method for image description using color and local spatial information
JP2003123023A (ja) * 2001-10-12 2003-04-25 Nippon Telegr & Teleph Corp <Ntt> 文字認識方法及び文字認識装置、文字認識プログラム並びにそのプログラムを記録した記録媒体
FR2851357B1 (fr) * 2003-02-19 2005-04-22 Solystic Procede pour la reconnaissance optique d'envois postaux utilisant plusieurs images
WO2007044504A1 (en) * 2005-10-05 2007-04-19 Siemens Medical Solutions Usa, Inc. Automatic cad algorithm selection
US20070133851A1 (en) * 2005-12-12 2007-06-14 General Electric Company Method and apparatus for selecting computer-assisted algorithms based on protocol and/or parameters of an acquisistion system
US7657089B2 (en) * 2006-02-21 2010-02-02 Microsoft Corporation Automatic classification of photographs and graphics
FR2899359B1 (fr) * 2006-03-28 2008-09-26 Solystic Sas Procede utilisant la multi-resolution des images pour la reconnaissance optique d'envois postaux
JP4637054B2 (ja) * 2006-05-15 2011-02-23 キヤノン株式会社 画像処理装置及びその制御方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体
US7953265B2 (en) 2006-11-22 2011-05-31 General Electric Company Method and system for automatic algorithm selection for segmenting lesions on pet images
US8160347B2 (en) 2008-06-03 2012-04-17 Siemens Medical Solutions Usa, Inc. System and method for intelligent CAD processing
US20100014755A1 (en) * 2008-07-21 2010-01-21 Charles Lee Wilson System and method for grid-based image segmentation and matching
US9123095B2 (en) * 2008-09-29 2015-09-01 Koninklijke Philips N.V. Method for increasing the robustness of computer-aided diagnosis to image processing uncertainties
KR101201620B1 (ko) * 2010-01-26 2012-11-14 삼성전자주식회사 휴대단말기의 영상 개선장치 및 방법
US8903169B1 (en) * 2011-09-02 2014-12-02 Adobe Systems Incorporated Automatic adaptation to image processing pipeline
JP5674615B2 (ja) * 2011-09-28 2015-02-25 株式会社日立情報通信エンジニアリング 文字認識装置及び文字認識方法
US8965104B1 (en) * 2012-02-10 2015-02-24 Google Inc. Machine vision calibration with cloud computing systems

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010043748A1 (en) * 1997-12-19 2001-11-22 Slawomir B. Wesolkowski Method of selecting one of a plurality of binarization programs
US20060224539A1 (en) * 1998-05-01 2006-10-05 Hong Zhang Computer-aided image analysis
US6393150B1 (en) * 1998-12-04 2002-05-21 Eastman Kodak Company Region-based image binarization system
CN102955950A (zh) * 2011-08-16 2013-03-06 索尼公司 用于在线训练分类器的装置和在线训练分类器的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
J. SAUVOLA 等: "Adaptive document image binarization", 《PATTERN RECOGNITION 33 (2000)》 *
RAPEEPORN CHAMCHONG 等: "Optimal Selection of Binarization Techniques for the Processing of Ancient Palm Leaf Manuscripts", 《2010 IEEE》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107636698B (zh) * 2015-06-25 2021-10-19 富士通株式会社 程序生成装置、程序生成方法以及生成程序
CN107636698A (zh) * 2015-06-25 2018-01-26 富士通株式会社 程序生成装置、程序生成方法以及生成程序
CN108475425A (zh) * 2016-01-20 2018-08-31 富士通株式会社 图像处理装置、图像处理方法及图像处理程序
CN108475425B (zh) * 2016-01-20 2022-03-08 富士通株式会社 图像处理装置、图像处理方法及计算机可读取的记录介质
CN108496200A (zh) * 2016-01-25 2018-09-04 皇家飞利浦有限公司 图像数据预处理
CN108496200B (zh) * 2016-01-25 2022-10-14 皇家飞利浦有限公司 图像数据预处理
US11138738B2 (en) 2017-10-31 2021-10-05 Boe Technology Group Co., Ltd. Image processing method and image processing device
CN107729948A (zh) * 2017-10-31 2018-02-23 京东方科技集团股份有限公司 图像处理方法及装置、计算机产品和存储介质
CN108009643A (zh) * 2017-12-15 2018-05-08 清华大学 一种机器学习算法自动选择方法和系统
CN108009643B (zh) * 2017-12-15 2018-10-30 清华大学 一种机器学习算法自动选择方法和系统
CN112889090A (zh) * 2018-08-17 2021-06-01 道特里斯艾欧公司 使用人工智能对物理动态系统执行建模和控制的系统和方法
CN109255277A (zh) * 2018-08-31 2019-01-22 阿里巴巴集团控股有限公司 一种二维码解析方法及装置
WO2020238042A1 (zh) * 2019-05-24 2020-12-03 平安科技(深圳)有限公司 识别算法更新的检测方法、装置、存储介质及计算机设备
CN110866872A (zh) * 2019-10-10 2020-03-06 北京邮电大学 一种路面裂缝图片预处理智能选择方法、装置及电子设备

Also Published As

Publication number Publication date
JP6099793B2 (ja) 2017-03-22
US20140348420A1 (en) 2014-11-27
CN104182770B (zh) 2018-06-05
JP2016184412A (ja) 2016-10-20
EP2806374B1 (en) 2022-07-06
EP2806374A1 (en) 2014-11-26
US9275307B2 (en) 2016-03-01
JP2014229317A (ja) 2014-12-08

Similar Documents

Publication Publication Date Title
CN104182770A (zh) 用于一个或多个图像处理算法的自动选择的方法和系统
US10169718B2 (en) System and method for defining and using different levels of ground truth
CN102663023B (zh) 一种提取网页内容的实现方法
US10990814B2 (en) Converting an image into a structured table
US20190050428A1 (en) System and method for image annotation
CN112818257B (zh) 基于图神经网络的账户检测方法、装置和设备
CN109005145A (zh) 一种基于自动特征抽取的恶意url检测系统及其方法
CN109408058B (zh) 基于机器学习的前端辅助开发方法和装置
CN104615760A (zh) 钓鱼网站识别方法和系统
WO2023015935A1 (zh) 一种体检项目推荐方法、装置、设备及介质
CN107341399A (zh) 评估代码文件安全性的方法及装置
CN110516173B (zh) 一种非法网站识别方法、装置、设备及介质
CN103399885A (zh) 兴趣点代表图片的挖掘方法、装置和服务器
CN109977337A (zh) 一种网页设计对比方法、装置、设备及可读存储介质
CN115580450A (zh) 流量检测的方法、装置、电子设备及计算机可读存储介质
CN102375847A (zh) 形成用于生成文档模板的合并树的方法以及装置
US20200210467A1 (en) Template generation using directed acyclic word graphs
CN112949476A (zh) 基于图卷积神经网络的文本关系检测方法、装置及存储介质
CN103049557A (zh) 一种站点资源管理方法及装置
CN112148956A (zh) 一种基于机器学习的暗网威胁情报挖掘系统和方法
CN110188207B (zh) 知识图谱构建方法及装置、可读存储介质、电子设备
CN109885708A (zh) 证件图片的搜索方法和装置
KR102437560B1 (ko) 건축 장식재 디자인 업무 시스템 및 방법
CN107451194A (zh) 一种图片搜索方法及装置
CN114726876B (zh) 一种数据检测方法、装置、设备和存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant