CN110603541A - 用于图像重定向的系统和方法 - Google Patents

用于图像重定向的系统和方法 Download PDF

Info

Publication number
CN110603541A
CN110603541A CN201780090455.9A CN201780090455A CN110603541A CN 110603541 A CN110603541 A CN 110603541A CN 201780090455 A CN201780090455 A CN 201780090455A CN 110603541 A CN110603541 A CN 110603541A
Authority
CN
China
Prior art keywords
image
predetermined
text
rotated
predetermined range
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201780090455.9A
Other languages
English (en)
Other versions
CN110603541B (zh
Inventor
陈鑫
李敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Didi Infinity Technology and Development Co Ltd
Original Assignee
Beijing Didi Infinity Technology and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Didi Infinity Technology and Development Co Ltd filed Critical Beijing Didi Infinity Technology and Development Co Ltd
Publication of CN110603541A publication Critical patent/CN110603541A/zh
Application granted granted Critical
Publication of CN110603541B publication Critical patent/CN110603541B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/60Rotation of whole images or parts thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/242Aligning, centring, orientation detection or correction of the image by image rotation, e.g. by 90 degrees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/418Document matching, e.g. of document images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)
  • Character Input (AREA)

Abstract

提供一种图像重定向的系统和方法。用于图像重定向的计算系统可包括一个或以上处理器和用于存储指令的存储器,当由处理器执行时,该指令使系统执行:获取包括预定方向范围内的预定类型的文本的正样本和不包括预定方向范围内的预定类型的文本的负样本;用获取的正样本和负样本训练模型;接收初始方向的图像;将训练的模型应用于接收的图像;对于确定接收的图像不包括预定方向范围内任何预定类型的文本的情况,将图像旋转预定角度并将训练后的模型重新应用于旋转图像,以确定旋转图像是否包括预定方向范围内至少一些预定类型的文本。

Description

用于图像重定向的系统和方法
技术领域
本申请涉及一种用于图像重定向的方法和技术。
背景技术
移动设备上的相机通常用于捕获图像。尽管具有便携性和便利性,但在处理捕获的图像时存在许多挑战。
发明内容
本申请的一些实施例可以包括被配置用于执行图像重定向的系统、方法和非暂时性计算机可读介质。用于图像重定向的计算系统可包括一个或以上处理器和存储指令的存储器,当由一个或以上处理器执行时,该指令使系统获取正样本和负样本。正样本可以包括预定方向范围内的预定类型的文本,并且负样本可以不包括预定方向范围内的预定类型的文本。该指令还可以使系统执行:用获取的正样本和负样本训练模型,接收初始方向的图像,将所训练的模型应用于所接收的图像,以确定所接收的图像是否包括与正样本一致的预定方向范围内的至少一些预定类型的文本。对于确定所接收的图像不包括预定方向范围内的任何预定类型的文本的情况,该指令还可以使系统执行:将图像旋转预定角度并将训练的模型重新应用于旋转图像,以确定旋转的图像是否包括预定方向范围内的至少一些预定类型的文本,直到确定旋转的图像包括与正样本一致的预定方向范围内的至少一些预定类型的文本或者将接收的图像旋转预定的角度数。对于确定所接收或旋转的图像包括预定方向范围内的至少一些预定类型的文本的情况,该指令还可以使系统执行:保留图像的当前方向。
在一些实施例中,图像至少可以包括文本信息。该文本可以是驾驶证。
在一些实施例中,预定类型可包括名称、序列号或日期中的至少一个。
在一些实施例中,预定方向范围可包括偏离竖直方向的可配置角度数。例如,预定方向范围可以包括偏离竖直方向的15度角。
在一些实施例中,正样本可包括图像部分,其包括名称、序列号或日期中的至少一个。图像部分可以定向在偏离竖直方向15度角的范围内。
在一些实施例中,负样本可以包括图像部分,该图像部分不包括偏离竖直方向15度角范围内的名称、序列号或日期。负样本可以包括至少一个:没有名称、序列号或日期的图像部分;图像部分包括名称、序列号;或者偏离竖直方向超过15度角的日期,或者包括非证件文本的图像。
在一些实施例中,将接收的图像旋转预定角度并将训练的模型重新应用于旋转的图像,可以包括在相同方向上执行以下一次或以上旋转,直到确定旋转的图像包括:预定方向范围内的至少一些预定类型的文本:将图像从初始方向旋转90度角并重新应用训练的模型,以确定旋转的图像是否包括预定方向范围内的至少一些文本;将图像从初始方向旋转180度角并重新应用训练的模型,以确定旋转的图像是否包括预定方向范围内的至少一些文本;和将图像从初始方向旋转270度角并且重新应用训练的模型,以确定旋转的图像是否包括预定方向范围内的至少一些文本。
在一些实施例中,图像重定向方法可包括获取正样本和负样本。正样本可以包括预定方向范围内的预定类型的文本,并且负样本可以不包括预定方向范围内的预定类型的文本。图像重定向方法可以进一步包括用获取的正样本和负样本训练模型,接收初始方向的图像,并且将训练的模型应用于接收的图像以确定接收的图像是否与正样本或负样本一致。图像重定向方法可以进一步包括,对于确定所接收的图像与负样本一致的情况,将图像旋转预定角度数并将训练的模型重新应用于旋转图像,以确定旋转图像是否与正样本或负样本一致,直到确定旋转的图像与正样本一致或者接收的图像已经旋转了预定角度数。图像重定向方法可以进一步包括,对于确定所接收或旋转的图像与正样本一致的情况,保持图像的当前方向。
通过参考附图来考虑以下描述和所附权利要求,本文披露的系统、方法和非暂时性计算机可读介质的这些和其他特征,以及结构的相关元件的操作和功能以及部件的组合和制造经济的功能将更加显而易见。本发明的所有附图均构成说明书的一部分,其中相同的附图标记表示各个附图中的相应部分。然而,应清楚地理解,附图仅用于说明和描述的目的,并不旨在作为本发明的限制的定义。
附图说明
本技术的一些实施例的某些特征在所附权利要求中具体阐述。通过参考以下具体实施方式及其附图,将更好地理解本技术的特征和优点,其中具体实施方式详尽介绍了利用本发明原理的说明性实施例,所述附图包括:
图1是根据一些实施例所示的图像重定向的示例性环境。
图2是根据一些实施例所示的用于图像重定向的示例性系统。
图3A是根据一些实施例所示的用于模型训练的样本。
图3B是根据一些实施例所示的用于模型训练的另一样本。
图3C是根据一些实施例所示的示例性预定方向范围。
图3D是根据一些实施例所示的图像重定向过程中的示例性旋转。
图4A是根据一些实施例所示的用于图像重定向的示例性方法的流程图。
图4B是根据一些实施例所示的用于图像重定向的另一示例性方法的流程图。
图5示出了示例性计算机系统的框图,在此系统中可以实现在此描述的任何实施例。
具体实施方式
使用移动设备相机来捕获证件(例如,识别卡)图像尽管方便,但存在一些挑战。由于获取的图像方向取决于移动设备(例如,手机、平板电脑等)在图像捕获期间是如何定向(例如,颠倒、侧向等)的,因此捕获的图像可以不是竖直位置。当上载的证件图像被上载用于验证时,不一致和不正确的图像方向可能导致查验困难。因此,希望提供一种图像方向校正机制。
在当前技术中,依靠存储在图像文件头部中的图像方向信息(例如,Exif信息)来校准图像方向。然而,并非所有移动设备都配备有方向传感器来记录这样的图像方向信息,并且一些图像格式(例如,PNG)不存储这样的头部信息。即使可以捕获图像方向信息,它仍然可能在压缩或其他转换过程中丢失或损坏。因此,目前的技术不足以实现图像方向校正。
下面描述的一些实施例可以克服在图像定向领域中出现的这些问题。在各种实施方式中,计算系统可以被配置为获取正样本和负样本并且利用所获取的正样本和负样本训练模型。在接收初始方向的图像同时,已经获取训练的模型的同一计算系统或另一计算系统可以应用训练的模型来执行图像重定向。这样,即使接收图像的初始方向不在期望的方向(例如,竖直),图像也可以自动旋转并由模型确定以完成重定向。
图1是根据一些实施例所示的用于图像重定向的示例性环境100。如图1所示,示例性环境100可以包括至少一个计算系统102,其包括一个或以上处理器104和内存106。内存106可以是非暂时性的并且是计算机可读的。内存106可以存储指令,当指令被一个或以上处理器104执行时,使得一个或以上处理器104执行本文描述的各种操作。环境100还可以包括耦合到系统102的计算设备110(例如,手机、平板电脑、计算机等)。计算设备110可以具有图像存储和/或图像捕获功能。环境100还可以包括系统102可访问的一个或以上数据存储(例如,数据存储108)和一个或以上成像设备(例如,成像设备109)。例如,数据存储108可以存储下面参考图3A-B描述的一个或以上的正样本和/或负样本,并且成像设备109可以捕获一个或以上的正样本和/或负样本。
在一些实施例中,系统102和计算设备110可以集成在单个设备或系统中。或者,系统102和计算设备110可以作为单独的设备操作。例如,计算设备110可以是移动设备,系统102可以是服务器。数据存储可以位于可访问系统102的任何位置,例如,在内存106中,在计算设备110中、在耦合到系统102的另一设备(例如,网络存储设备)中,或其他存储位置(例如,基于云的存储系统、网络文件系统等)等。通常,系统102、计算设备110、数据存储108和/或成像设备109可以能够通过可以进行数据通信的一个或以上有线或无线网络(例如,因特网)彼此通信。下面参考图2至图4B描述系统102的各个方面。
图2是根据一些实施例所示的用于图像重定向的示例性系统200。图2中所示并在下文呈现的操作旨在用于说明。在一些实施例中,系统102可以从数据存储108和/或成像设备109获取一个或以上的正样本和/或负样本202。正样本和负样本可以包括证件信息,该证件包括公民身份证、护照页、驾驶证、名片、收据、发票、人或场景的照片等。在一些实施例中,一个或以上图像或图像部分可用作正样本和/或负样本。正样本和负样本可以位于相同图像或不同图像上。在一些实施例中,正样本可包括预定类型的图像部分,并且图像部分可定向在偏离竖直方向的预定方向范围内(例如,偏离15度角)。预定类型可以是一种可用于识别证件的类型,包括名称、序列号、数据等。预定方向范围也可以由用户预先设定,例如,偏离竖直方向的正负角度。预定类型和预定方向范围可以是可配置的。在一些实施例中,负样本可以包括不是正样本的所有样本。负样本不包括在预定方向范围内的任何预定类型(例如,名称、序列号、日期等)(例如,15度角)的文本。例如,负样本可以包括:不包括名称、序列号或日期的图像部分;不包括偏离预定方向范围内(例如,15度角)的任何名称、序列号或日期的图像部分;和/或仅包括非证件文本的图像(例如,捕获报纸的一部分的图像、人或场景的照片等)。在一些实施例中,如果旋转超出预定方向范围,则正样本可以用作负样本。预定方向范围可适用于人、计算机程序和/或机器的文本识别。下面参考图3A-B描述正样本和负样本,并且下面参考图3C描述预定方向范围。
系统102可以训练具有正样本和负样本的模型。在一些实施例中,模型可以包括各种计算机视觉功能(例如,OpenCV的级联分类器或另一软件模块的另一功能)。基于上面讨论的正样本和负样本的特征,训练的模型可以检测给定图像是否包括与正样本或负样本一致(例如,更接近)的图像部分(例如,名称、序列号、日期等)。可以基于给定图像(或给定图像的一个或以上部分)与正样本或负样本的接近程度来确定一致性的角度数。可以使用额外的正样本和/或负样本来验证训练的模型的准确性。在一些实施方案中,模型可以如下构建:1)从人工标注的正样本和负样本(例如,由人工确定样本为正或者负)中提取LBP(局部二元模式)特征(例如,名称、序列号、日期等),2)基于提取的LBP特征训练级联分类器。
在一些实施例中,用户可以操作计算设备110以将一个或以上图像204提交给系统102。在一些实施例中,在设备(例如,计算设备110、系统102等)之间发送和接收的信息可以通过一个或以上计算机网络(例如,局部区域网络、因特网等)发送。在一些实施例中,一个或以上图像204可以至少包括证件信息,例如关于公民身份、护照页面、驾驶证、名片、收据、发票等的信息。在一些实施例中,可以将一个或以上图像204上载到系统102以进行身份验证、档案建立等。
可以使用训练的模型处理(或执行)一个或以上图像204。在一些实施例中,为了执行图像重定向,系统102或已经获取训练的模型的另一系统可以:接收初始方向的图像并将训练的模型应用于接收的图像,以确定接收的图像是否包括与正样本一致的预定方向范围内的一些文本。为此,可以使用上述训练的分类器来扫描接收的图像,以搜索接收图像的一个或以上子区域,将包括至少类似文本的子区域作为正样本。在一些实施例中,为了将训练的模型应用于接收的图像,以确定接收的图像是否包括与正样本一致的预定方向范围内的至少一些文本,系统可以将训练的模型应用于接收的图像,以检测接收图像是否包括与正样本一致的预定方向范围内(例如,在偏离竖直方向15度角内)的至少一些预定类型的文本(例如,名称、序列号、日期等)。对于确定所接收的图像不包括预定方向范围内的任何预定类型的文本的情况,系统可以将图像旋转预定角度(例如,15、30、45、60或90度角)并且将训练的模型应用于旋转的图像以确定旋转的图像是否包括预定方向范围内的至少一些文本。
在一些实施例中,系统可以执行一次或以上的旋转和确定,直到系统确定旋转的图像包括预定方向范围内的至少一些预定类型的文本,或者接收图像已经旋转了预定角度数。预定角度数可以由用户预设。例如,预定角度数可以是360度角。在一些实施例中,预定角度数可以是某一角度,在图像旋转360度角之前最后一次旋转将位于该角度。例如,如果图像每次旋转90度角,则预定角度数可以是270度角。又例如,如果图像每次旋转30度角,则预定角度数可以是330度角。此时,系统可以确定图像是否包括在预定方向范围内的预定类型文本。对于确定所接收或旋转的图像包括预定方向范围内的至少一些预定类型的文本的情况,系统可以保留图像的当前方向。如果在预定方向范围内没有一个旋转图像被确定为包括至少一些预定类型的文本,则系统可以将图像确定为非证件图像。
在一些实施例中,将接收的图像旋转预定角度并将训练的模型重新应用于旋转图像,在相同方向(顺时针或逆时针)执行以下一次或以上旋转,直到确定旋转图像至少包括预定方向范围内的一些预定类型的文本:将图像从初始方向旋转90度角并重新应用训练的模型,以确定旋转的图像是否包括预定方向范围内的至少一些文本;将图像从初始方向旋转180度角并重新应用训练的模型,以确定旋转的图像是否包括预定方向范围内的至少一些文本;将图像从初始方向旋转270度角并重新应用训练的模型,以确定旋转的图像是否包括预定方向范围内的至少一些文本。下面参考图3D描述旋转示例。
图3A是根据一些实施例所示的用于模型训练的图像样本300。图3A的描述旨在是说明性的,并且可以根据实现方式以各种方式进行修改。样本300可以由数据存储(例如,数据存储108)和/或成像设备(例如,成像设备109)提供,并由计算系统或设备(例如,系统102)访问。在一些实施例中,可以通过系统102的显示屏呈现正样本。在一些实施例中,可以将正样本提供给在系统102上运行的软件应用程序以训练模型。
样本300(例如,证件图像)可以包括正样本和/或负样本。正样本可包括捕获预定方向范围内(例如,偏离竖直方向15度角内)的至少一些文本的图像或图像部分。该文本可以包括名称、序列号和/或日期。负样本可以包括在预定方向范围内不包括名称、序列号和日期的图像或图像部分。如图3A所示,作为图像样本的证件可以是驾驶证,包括证件名称302、车牌号、姓名、车辆类型、地址、车辆目的描述、车辆型号、车辆登记号304(例如,表示为序列号)、发动机代码、登记日期306、发行日期和照片或印章。由于在该示例中驾驶证是竖直方向的,因此证件名称302、车辆登记号304和登记日期306都在预定方向范围内并且可以用作正样本。其他信息(例如,包括车牌号的图像部分308、车辆类型、姓名、地址、车辆目的描述和车辆模型)可以用作负样本。在该示例中,名称302是“驾驶证”,车辆登记号是字母和固定长度的数字的组合,并且日期是固定范围内的数字的组合。因此,用这些正样本和负样本训练模型可以允许训练的模型从给定图像中检测预定的文本类型(例如,名称、车辆登记号和日期)。然而,正样本不限于所有权,车辆登记和登记日期。其他信息(例如,具有可预测格式和内容的其他文本)可以根据应用用作预定类型的正样本或负样本的文本。
图3B是根据一些实施例所示的用于模型训练的负样本310。图3B的描述旨在是说明性的,并且可以根据实现方式以各种方式进行修改。负样本310可以由数据存储(例如,数据存储108)和/或成像设备(例如,成像设备109)提供,并且由计算系统或设备(例如,系统102)访问。在一些实施例中,可以通过系统102的显示屏呈现负样本。在一些实施例中,可以将负样本提供给在系统102上运行的软件应用程序以训练模型。
负样本可以包括在预定方向范围之外(例如,偏离竖直方向顺时针或逆时针方向大于15度角)定向的图像或图像部分。在图3B所示的示例中,名称312、车辆登记号314和登记日期316几乎是颠倒的并且可以用作负样本。
图3C是根据一些实施例所示的示例性预定方向范围320。图3C的描述旨在是说明性的,并且可以根据实现方式以各种方式进行修改。如图所示,示例方向范围320可包括偏离竖直方向的顺时针/逆时针偏离。偏离的角度数可以是预定的和可配置的(例如,8、10、15、20或30度角)。预先确定偏离的角度数的基础可以是用于识别图像中的文本的可接受的方向范围。因此,图像321沿竖直方向,图像322偏离竖直方向+15度角,而图像323偏离竖直方向-15度角,均落在预定方向范围内。
图3D是根据一些实施例所示的图像重定向过程330中的示例性旋转。图3D的描述旨在是说明性的,并且可以根据实现方式以各种方式进行修改。例如,下面描述的旋转角度数可以是除90度角之外的其它角度(例如,15、30、45或60度角)。在一些实施例中,图像重定向过程330可以通过系统102的显示屏呈现。在一些实施例中,图像重定向过程330可以由系统102实现(例如,通过在系统102上运行的软件应用程序,该软件包括上述经过训练的模型)。
在一些实施例中,计算设备110可以将具有其初始方向的图像(例如,图像331)上载到系统102。在将训练的模型应用于图像331时,系统102可以确定图像331不包括预定方向范围内(例如,偏离竖直方向15度角范围)的任何文本或任何预定类型的文本。因此,系统102可以将图像331旋转90度角以获取图像332。将训练的模型重新应用于图像332,系统102可以确定图像332不包括预定方向范围内的任何文本或任何预定类型的文本。因此,系统102可以将图像332旋转另一个90度角以获取图像333。将训练的模型重新应用于图像333,系统102可以确定图像333包括预定方向范围内的某些预定类型的文本(例如,名称)并保留图像333的当前方向。因此,上载的图像331被重新定向到可读性更好的图像333。
在一些实施例中,假设图像包括预定类型的可识别文本,则可以通过上面讨论的旋转方法将图像重新定向在某个方向范围内(例如,依次旋转90度角达到的方向范围341、342、343或344)。其他方向(例如,依次旋转90度角达到的方向范围345、346、347或348)的图像即使通过旋转方法也不能重新定向。在保持可读性的基础上,任意增加预定方向范围(例如,方向范围341)可以允许更多图像被重定向。不能通过本文描述的方法重新定向的图像可以过滤掉并且被手动处理。
图4A是根据本申请的一些实施例所示的示例性方法400的流程图。方法400可以在各种环境中实现,包括例如图1的环境100。下文呈现的方法400的操作旨在用于说明。取决于实施方式,示例方法400可以包括以各种顺序或并行方式执行的额外的、更少的或替代的步骤。示例方法400可以在包括一个或以上服务器的一个或以上处理器的各种计算系统或设备中实现。
在块402处,获取正样本和负样本。正样本包括预定方向范围内的预定类型的文本,并且负样本不包括预定方向范围内的预定类型的文本。在块404处,用获取的正样本和负样本训练模型。在块406处,接收初始方向的图像。在块408处,训练的模型应用于所接收的图像,以确定所接收的图像是否包括与正样本一致的预定方向范围内的至少一些预定类型的文本。在块410处,对于确定所接收的图像不包括预定方向范围内的任何预定类型的文本的情况,将图像旋转预定角度并且重新应用训练的模型于旋转图像,以确定旋转图像是否包括预定方向范围内的至少一些预定类型的文本。块410可以被执行一次或以上,直到确定旋转图像包括与正样本一致的预定方向范围内的至少一些预定类型的文本或者接收的图像已经被旋转预定角度数。在块412处,对于确定所接收或旋转的图像包括预定方向范围内的至少一些预定类型的文本的情况,保留图像的当前方向。可以在块408之后和/或块410之后执行块412。
图4B是根据本申请的一些实施例所示的示例性方法420的流程图。方法420可以在各种环境中实现,包括例如图1的环境100。下文呈现的方法420的操作旨在用于说明。取决于实施方式,示例方法420可以包括以各种顺序或并行方式执行的额外的、更少的或替代的步骤。示例方法420可以在包括一个或以上服务器的一个或以上处理器的各种计算系统或设备中实现。
在块422处,获取正样本和负样本。正样本包括预定方向范围内的预定类型的文本,并且负样本不包括预定方向范围内的预定类型的文本。在块424处,用获取的正样本和负样本训练模型。在块426处,接收初始方向的图像。在块428处,将训练的模型应用于所接收的图像,以确定所接收的图像是否与正样本或负样本一致。在块430处,对于确定所接收的图像与负样本一致的情况,将图像旋转预定角度并且将训练的模型重新应用于旋转的图像,以确定旋转的图像是否与正样本或负样本一致,直到确定旋转的图像与正样本一致,或者图像已经被旋转预定角度数为止。块430可以被执行一次或以上,直到确定旋转图像包括与正样本一致的预定方向范围内的至少一些预定类型的文本或者接收的图像已经被旋转预定角度数。块430可以包括在相同方向上执行以下一次或以上旋转:将图像从初始方向旋转90度角并重新应用训练模型,以确定旋转图像是否与正样本或负样本一致;将图像从初始方向旋转180度角并重新应用训练的模型,以确定旋转的图像是否与正样本或负样本一致;和将图像从初始方向旋转270度角,并重新应用训练的模型,以确定旋转的图像是否与正样本或负样本一致。虽然这里将每个旋转描述为90度角,但应该理解的是,旋转的角度数不限于某些角度,并且可以如上所述进行配置或预设。例如,旋转角度数可以是除90度角之外的其它角度(例如,15、30、45或60度角)。应用大的旋转角度(例如,90度角)提供了更高的效率和更短的处理时间,应用更小的旋转角度(例如,30度角)提供了与竖直方向更精确的对准。因此,可以根据处理时间的要求和竖直对准的公差来配置旋转角度数。在块432处,对于确定所接收或旋转的图像与正样本一致的情况,保留图像的当前方向。块432可以在块428之后和/或块430之后执行。
本文所描述的技术是由一个或以上专用计算设备实现的。专用计算设备可以是硬连线的以执行这些技术,或者可以包括电路或数字电子设备,诸如一个或以上专用集成电路(ASIC)或现场可编程门阵列(FPGA),其被持久地编程为执行这些技术,或者可以包括一个或以上硬件处理器,其被编程为根据固件、存储器、其他存储器或组合中的程序指令执行技术。这种专用计算设备还可以将定制的硬连线逻辑,ASIC或FPGA与定制编程相结合以实现这些技术。专用计算设备可以是台式计算机系统、服务器计算机系统、便携式计算机系统、手持设备、网络设备或包含硬连线和/或程序逻辑以实现该技术的任何其他设备或设备的组合。计算设备通常由操作系统软件控制和协调。传统的操作系统控制和调度用于执行的计算机进程、执行存储器管理、提供文件系统、网络、输入/输出服务,以及提供用户界面功能,例如图形用户界面(“GUI”)等。
图5是示例性的可以实现本文描述的任何实施例的计算机系统500的框图。系统500可以对应于上述系统102。计算机系统500包括总线502或用于交流信息的其他通信机制、一个或以上与总线502耦合的用于处理信息的硬件处理器504。硬件处理器504可以是,例如,一个或以上通用微处理器。处理器504可以对应于上述处理器104。
计算机系统500还包括主存储器506,诸如随机存取存储器(RAM)、高速缓存和/或其他动态存储设备,所述主存储器耦合到总线502以用于存储由处理器504执行的信息和指令。主存储器506还可以用于在处理器504执行待执行指令期间存储临时变量或其他中间信息。当上述指令存储在处理器504可访问的存储介质中时,可使计算机系统500成为专用机器,该专用机器被定制为执行指令中指定的操作。计算机系统500还包括只读存储器(ROM)508或耦合到总线502的其他静态存储设备,用于存储处理器504的静态信息和指令。提供存储设备510,例如磁盘、光盘或USB拇指驱动器(闪存驱动器)等,并将其耦合到总线502,用于存储信息和指令。主存储器506、ROM508和/或存储器510可以对应于上述内存106。
计算机系统500可以使用定制的硬连线逻辑、一个或以上的专用集成电路(ASIC)或现场可编程门阵列(FPGA)、固件和/或程序逻辑来实现本文描述的技术,其与计算机系统组合使计算机系统500成为或被编程为特殊用途机器。根据一个实施例,响应于处理器504执行主存储器506中包含的一个或以上指令中的一个或以上序列,计算机系统500会执行本申请书中的技术。这些指令可以从另一存储介质(例如存储设备510)读入主存储器506。执行主存储器506中包含的指令的序列使得处理器504执行本文描述的处理步骤。在备选实施例中,可以使用硬连线电路代替软件指令或与软件指令组合。
主存储器506、ROM508和/或存储器510可以包括非暂时性存储介质。这里使用的术语“非暂时性介质”和类似术语是指存储使机器以特定方式操作的数据和/或指令的任何介质。这种非暂时性介质可以包括非易失性介质和/或易失性介质。非易失性介质包括,例如光盘或磁盘,如存储设备510。易失性介质包括动态存储器,例如主存储器506。非暂时性介质的常见形式包括,例如,软盘、软性磁盘、硬盘、固态驱动器、磁带、或任何其他磁性数据存储介质、只读光盘驱动器(CD-ROM)、任何其他光学数据存储介质、具有孔图案的任何物理介质、RAM、可编程序只读存储器(PROM)和可擦除可编程只读存储器(EPROM)、快擦编程只读存储器(FLASH-EPROM)、非易失性随机访问存储器(NVRAM)、任何其他存储器芯片或盒式磁带、以及它们的网络版本。
计算机系统500还包括耦合到总线502的通信接口518。通信接口518提供连接到一个或以上本地网络的一个或以上网络链路的双向数据通信。例如,通信接口518可以是综合业务数字网(ISDN)卡、线缆调制解调器、卫星调制解调器、或用于提供与相应类型的电话线路进行数据通信连接的调制解调器。又例如,通信接口518可以是局部区域网络(LAN)卡以提供与兼容的LAN之间的数据通信连接(或WAN组件以与WAN通信)。还可以实现无线链路。在任何这样的实施方式中,通信接口518发送和接收携带代表各类信息的数字数据流的电信号、电磁信号或光信号。
计算机系统500可以通过网络、网络链路和通信接口518发送消息并接收包括程序代码的数据。以因特网为例,服务器可以通过因特网、互联网服务提供商(ISP)、本地网络和通信接口518为应用程序发送请求代码。
所接收的代码可以收到后由处理器504执行,和/或存储在存储设备510或其他非易失性存储器中以供稍后执行。
在前面部分中描述的每个过程、方法和算法可以由代码模块实现,并且通过该代码模块实现完全自动化或半自动化。所述代码模块通过一个或以上包括计算机硬件的计算机系统或计算机处理器执行。上述过程和算法可由应用特定电路部分地或完全地实现。
上述各种特征和过程可以彼此独立地使用,或者可以以各种方式组合。所有可能的组合和子组合旨在落入本申请的范围内。另外,在某些实施方式中可以省略某些方法或流程框。本文描述的方法和过程也不限于任何特定顺序,与其相关的框或状态可以以其他合适顺序执行。例如,所描述的框图或状态可以以不同于具体公开的顺序执行,或者多个块或状态可以在单个框图或状态中组合。示例性块或状态可以串行、并行或以其他方式执行。可以向所公开的示例实施例添加块或状态或从其中移除块或状态。这里描述的示例系统和组件可以与所描述的不同地配置。例如,相比于与所披露的示例性实施例,可以添加、移除或重新布置元件。
本文描述的示例方法的各种操作可以至少部分地由一个或以上处理器执行,所述一个或以上处理器可以临时配置(例如,通过软件)为或永久配置为执行相关操作。无论是临时配置还是永久配置,所述处理器都可以构成由处理器实现的引擎,其运行以执行本文描述的一个或以上操作或功能。
类似地,本文描述的方法可以至少部分地由一个特定处理器或一组处理器(作为硬件示例)实现。例如,方法的至少一部分操作可以由一个或以上处理器或处理器实现的引擎来执行。此外,一个或以上处理器还可以操作以支持“云计算”环境中的相关操作的执行或“软件即服务”(SaaS)。例如,至少一些操作可以由一组计算机(作为包括处理器的机器的示例)执行,这些操作可以经由网络(例如,因特网)和通过一个或以上适当的接口(例如,应用程序接口(API))。
某些操作的性能可以在处理器之间分配,不仅驻留在单个机器中,而且部署在多个机器上。在一些示例实施例中,处理器或处理器实现的引擎可以位于单个地理位置(例如,在家庭环境、办公室环境或服务器群内)。在其他示例实施例中,处理器或处理器实现的引擎可以分布在多个地理位置。
在整个说明书中,多个实例可以实现被描述为单个实例的组件、操作或结构。尽管一个或以上方法的各个操作被示出并描述为单独的操作,但是可以同时执行各个操作的一个或以上,并且不需要以所示的顺序执行操作。在示例配置中作为单独组件呈现的结构和功能可以实现为组合结构或组件。类似地,作为单个组件呈现的结构和功能可以实现为单独的组件。这些和其他变化、修改、添加和改进都落入本文主题的范围内。
尽管已经参考特定示例性实施例概述了本文主题,但是可以在不脱离本申请的实施例的较宽范围的情况下对这些实施例进行各种修改和改变。本文主题的这些实施例可单独地或共同地由术语“发明”指代,此举仅为描述方便,而不旨在当实际有多余一个披露或概念被披露时主动将本申请的范围限制于任何单个的披露或概念。
本文所示的实施例已被描述的足够详尽,使得本领域技术人员能够实践所披露的教导。其他实施例也可以从所披露的教导中推出并使用,使得可以在不脱离本申请的范围的情况下,对本文实施例作出结构和逻辑上的替换和改变。因此,具体实施方式不应被视为具有限制意义,并且一些实施例的范围仅由所附权利要求以及这些权利要求所赋予的等价物的全部范围来限定。
本文所述和/或附图中描绘的流程图中的任何过程描述、元素或块应理解为潜在地表示模块、部件、或部分代码,这些模块、部件、或部分代码包括用于实现特定逻辑功能或过程步骤的一个或以上可执行指令。本领域技术人员可以理解的是,本文描述的实施例的范围内还包括备选实施方式。在这些备选实施方式中,元件或功能可以被删除,或取决于所涉及的功能而不由所示出的或论述的顺序来执行,包括实质上同时执行或以相反的顺序执行。
如本文所用,术语“或”可以解释为包含性或排他性含义。此外,可以为在此描述为单个实例的资源、操作或结构提供多个实例。另外,各种资源、操作、引擎和数据存储之间的边界在某种程度上是任意的,并且在特定说明性配置的上下文中示出了特定操作。设想的其他功能的分配可以落入本申请的一些实施例的范围内。通常,在示例配置中作为单独资源呈现的结构和功能可以以组合结构或组合资源实现。类似地,作为单独资源呈现的结构和功能可以以多个分离的资源实现。这些以及其他变化、修改、添加和改进均落入由所附权利要求表示的本申请的实施例的范围内。相应地,说明书和附图应被视为说明性的而非限制性的。
条件语言,例如,除其他之外,“可以”、“可以”、“可能”或“可以”,除非另有明确说明,或者在所使用的上下文中以其他方式理解,通常旨在表达某些实施例包括,而其他实施例不包括某些特征、元素和/或步骤。因此,这种条件语言通常不旨在暗示一个或以上实施例以任何方式需要特征,元素和/或步骤,或者一个或以上实施例必须包括用于在有或没有用户输入或提示的情况下决定的逻辑这些特征,元素和/或步骤包括在或将在任何特定的实施例中执行。

Claims (20)

1.一种图像重定向的计算系统,包括:
一个或以上处理器;以及
存储指令的存储器,当由所述一个或以上处理器执行时,使所述系统执行:
获取正样本和负样本,其中所述正样本包括预定方向范围内的预定类型的文本,并且所述负样本不包括所述预定方向范围内的所述预定类型的文本;
用已获取的所述正样本和所述负样本训练模型;
接收原始方向的图像;
将所述训练的模型应用于所述接收的图像,以确定所述接收的图像是否包括与所述正样本一致的所述预定方向范围内的至少一些所述预定类型的文本;对于确定所述接收的图像不包括所述预定方向范围内的所述预定类型的任何文本的情况,将所述图像旋转预定角度并重新应用所述训练模型于所述旋转图像,以确定所述旋转图像是否包括所述预定方向范围内的至少一些所述预定类型的文本,直到确定所述旋转图像包括与所述正样本一致的所述预定方向范围内所述至少一些所述预定类型的文本,或者已经将所述接收的图像旋转预定角度数;以及
对于确定所述接收或旋转的图像包括所述预定方向范围内的至少一些所述预定类型的文本的情况,保留所述图像的当前方向。
2.根据权利要求1所述的系统,其特征在于,所述图像至少包括证件信息。
3.根据权利要求2所述的系统,其特征在于,所述证件是驾驶证。
4.根据权利要求1所述的系统,其特征在于:
所述预定类型包括名称、序列号或日期中的至少一个。
5.根据权利要求1所述的系统,其特征在于:
所述预定方向范围包括与竖直方向偏离的可配置角度数。
6.根据权利要求5所述的系统,其特征在于:
所述预定方向范围包括偏离竖直方向15度角。
7.根据权利要求1所述的系统,其特征在于:
所述正样本包括图像部分,其包括偏离竖直方向15度角方向范围内的名称、序列号或日期中的至少一个;以及
所述负样本包括图像部分,其不包括偏离所述竖直方向15度角方向范围内的名称、序列号和日期。
8.根据权利要求1所述的系统,其特征在于,按照所述预定角度旋转所述接收图像并重新应用所述训练模型到所述旋转图像,直到确定所述旋转图像包括与所述正样本一致的所述预定方向范围内的至少一些所述预定类型的文本,或者通过在相同方向执行以下一次或以上旋转将所述接收图像旋转预定角度数:
将所述图像从所述初始方向旋转90度角并重新应用所述训练的模型,以确定所述旋转图像是否包括所述预定方向范围内的至少一些文本;
将所述图像从所述初始方向旋转180度角并重新应用所述训练的模型,以确定所述旋转图像是否包括所述预定方向范围内的至少一些文本;以及
将所述图像从所述初始方向旋转270度角并重新应用所述训练的模型,以确定所述旋转图像是否包括所述预定方向范围内的至少一些文本。
9.一种图像重定向方法,包括:
获取正样本和负样本,其中所述正样本包括预定方向范围内的预定类型的文本,并且所述负样本不包括所述预定方向范围内的所述预定类型的文本;
用已获取的所述正样本和所述负样本训练模型;
接收原始方向的图像;
将所述训练的模型应用于所述接收的图像,以确定所述接收的图像是否包括与所述正样本一致的所述预定方向范围内的至少一些所述预定类型的文本;
对于确定所述收到的图像不包括与所述正样本一致的所述预定方向范围内的任何所述预定类型的文本的情况,以预定角度旋转所述图像并将所述训练的模型重新应用于所述旋转图像,以确定所述旋转图像是否包括所述预定方向范围内的至少一些所述预定类型的文本,直到确定所述旋转图像包括与所述正样本一致的所述预定方向范围内的至少一些所述预定类型的文本,或者已经将所述接收的图像旋转预定角度数;以及
对于确定所述接收或旋转的图像包括所述预定方向范围内的至少一些所述预定类型的文本的情况,保留所述图像的当前方向。
10.根据权利要求9所述的方法,其特征在于,所述图像至少包括证件信息。
11.根据权利要求10所述的方法,其特征在于,所述证件是驾驶证。
12.根据权利要求9所述的方法,其特征在于:
所述预定类型包括名称、序列号或日期中的至少一个。
13.根据权利要求9所述的方法,其特征在于:
所述预定方向范围包括与竖直方向偏离的可配置角度数。
14.根据权利要求13所述的方法,其特征在于:
所述预定方向范围包括偏离竖直方向15度角。
15.根据权利要求9所述的方法,其特征在于:
所述正样本包括图像部分,其包括偏离竖直方向15度角方向范围内的名称、序列号或日期中的至少一个;以及
所述负样本包括图像部分,其不包括偏离所述竖直方向15度角方向范围内的名称、序列号或日期。
16.根据权利要求9所述的方法,其特征在于,按照所述预定角度旋转接收图像并将所述训练模型重新应用于所述旋转图像,直到确定所述旋转图像包括与所述正样本一致的所述预定方向范围内的至少一些所述预定类型的文本,或者通过在相同方向执行以下一次或以上旋转将所述接收图像旋转预定角度数:
将所述图像从所述初始方向旋转90度角并重新应用所述训练的模型,以确定所述旋转图像是否包括所述预定方向范围内的至少一些文本;
将所述图像从所述初始方向旋转180度角并重新应用所述训练的模型,以确定所述旋转图像是否包括所述预定方向范围内的至少一些文本;以及
将所述图像从所述初始方向旋转270度角并重新应用所述训练的模型,以确定所述旋转图像是否包括所述预定方向范围内的至少一些文本。
17.一种图像重定向方法,包括:
获取正样本和负样本,其中所述正样本包括预定方向范围内的预定类型的文本,并且所述负样本不包括所述预定方向范围内的所述预定类型的文本;
用已获取的所述正样本和所述负样本训练模型;
接收初始方向的图像;
将所述训练的模型应用于所述接收的图像,以确定所述接收的图像是否与所述正样本或所述负样本一致;
对于确定所述接收的图像与所述负样本一致的情况,将所述图像旋转预定角度并将所述训练的模型重新应用于所述旋转图像,以确定所述旋转图像是否与所述正样本或所述负样本一致,或者已经将所述图像旋转预定角度数;以及
对于确定所述接收或旋转的图像与所述正样本一致的情况,保留所述图像的当前方向。
18.根据权利要求17所述的方法,其特征在于,按照所述预定角度旋转接收图像并将所述训练模型重新应用于所述旋转图像,包括在相同方向执行所述以下一次或以上的旋转:
将所述图像从所述初始方向旋转90度角并重新应用所述训练的模型,以确定所述旋转图像是否与所述正样本或所述负样本一致;
将所述图像从所述初始方向旋转180度角并重新应用所述训练模型,以确定所述旋转图像是否与所述正样本或所述负样本一致;以及
将所述图像从所述初始方向旋转270度角并重新应用所述训练的模型,以确定所述旋转图像是否与所述正样本或所述负样本一致。
19.根据权利要求17所述的方法,其特征在于:
所述正样本包括图像部分,其包括偏离竖直方向15度角内的名称、序列号或日期中的至少一个;以及
所述负样本包括图像部分,其不包括偏离竖直方向15度角内的名称、序列号和日期。
20.根据权利要求19所述的方法,其特征在于:
所述正样本包括驾驶证。
CN201780090455.9A 2017-05-05 2017-05-05 用于图像重定向的系统和方法 Active CN110603541B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2017/083191 WO2018201441A1 (en) 2017-05-05 2017-05-05 System and method for image re-orientation

Publications (2)

Publication Number Publication Date
CN110603541A true CN110603541A (zh) 2019-12-20
CN110603541B CN110603541B (zh) 2023-04-25

Family

ID=64015320

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780090455.9A Active CN110603541B (zh) 2017-05-05 2017-05-05 用于图像重定向的系统和方法

Country Status (4)

Country Link
US (1) US10452942B2 (zh)
EP (1) EP3619680B1 (zh)
CN (1) CN110603541B (zh)
WO (1) WO2018201441A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113126869A (zh) * 2021-03-30 2021-07-16 华东计算技术研究所(中国电子科技集团公司第三十二研究所) 基于国产bmc芯片的kvm图像高速重定向的实现方法及系统

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11003937B2 (en) * 2019-06-26 2021-05-11 Infrrd Inc System for extracting text from images
CN110309874B (zh) * 2019-06-28 2024-02-06 创新先进技术有限公司 负样本筛选模型训练方法、数据筛选方法和数据匹配方法
US11682135B2 (en) 2019-11-29 2023-06-20 GE Precision Healthcare LLC Systems and methods for detecting and correcting orientation of a medical image
US11295437B2 (en) * 2020-07-24 2022-04-05 Alipay Labs (singapore) Pte. Ltd. Authentication method and system

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060071950A1 (en) * 2004-04-02 2006-04-06 Kurzweil Raymond C Tilt adjustment for optical character recognition in portable reading machine
CN1834992A (zh) * 2005-03-17 2006-09-20 株式会社理光 检测文档图像中的字符的方向
US20090324079A1 (en) * 2008-06-25 2009-12-31 Chang Yuan Methods and Systems for Region-Based Up-Scaling
CN102855501A (zh) * 2012-07-26 2013-01-02 北京锐安科技有限公司 一种多方向物体图像识别方法
US20130004076A1 (en) * 2011-06-29 2013-01-03 Qualcomm Incorporated System and method for recognizing text information in object
US20140241635A1 (en) * 2013-02-25 2014-08-28 Google Inc. Screenshot orientation detection
US20150161465A1 (en) * 2009-10-29 2015-06-11 Google Inc. Text recognition for textually sparse images
US9367736B1 (en) * 2015-09-01 2016-06-14 Amazon Technologies, Inc. Text detection using features associated with neighboring glyph pairs
CN105825243A (zh) * 2015-01-07 2016-08-03 阿里巴巴集团控股有限公司 证件图像检测方法及设备
CN106485193A (zh) * 2015-09-02 2017-03-08 富士通株式会社 文档图像的方向检测装置及方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8508643B2 (en) * 2003-01-17 2013-08-13 Hewlett-Packard Development Company, L.P. Method and system for processing an image
US8094892B2 (en) * 2007-11-19 2012-01-10 Arcsoft, Inc. Automatic photo orientation detection
US8744171B1 (en) * 2009-04-29 2014-06-03 Google Inc. Text script and orientation recognition
US9367770B2 (en) * 2011-08-30 2016-06-14 Digimarc Corporation Methods and arrangements for identifying objects
US8896533B2 (en) * 2012-10-29 2014-11-25 Lenova (Singapore) Pte. Ltd. Display directional sensing
US9152860B2 (en) * 2013-05-10 2015-10-06 Tantrum Street LLC Methods and apparatus for capturing, processing, training, and detecting patterns using pattern recognition classifiers
CN105868758B (zh) * 2015-01-21 2019-12-17 阿里巴巴集团控股有限公司 图像中文本区域检测方法、装置及电子设备
CN104992403B (zh) * 2015-07-07 2017-05-03 方玉明 一种基于视觉相似度度量的混合操作算子图像重定向方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060071950A1 (en) * 2004-04-02 2006-04-06 Kurzweil Raymond C Tilt adjustment for optical character recognition in portable reading machine
CN1834992A (zh) * 2005-03-17 2006-09-20 株式会社理光 检测文档图像中的字符的方向
US20060210195A1 (en) * 2005-03-17 2006-09-21 Yoshihisa Ohguro Detecting an orientation of characters in a document image
US20090324079A1 (en) * 2008-06-25 2009-12-31 Chang Yuan Methods and Systems for Region-Based Up-Scaling
US20150161465A1 (en) * 2009-10-29 2015-06-11 Google Inc. Text recognition for textually sparse images
US20130004076A1 (en) * 2011-06-29 2013-01-03 Qualcomm Incorporated System and method for recognizing text information in object
CN102855501A (zh) * 2012-07-26 2013-01-02 北京锐安科技有限公司 一种多方向物体图像识别方法
US20140241635A1 (en) * 2013-02-25 2014-08-28 Google Inc. Screenshot orientation detection
CN105825243A (zh) * 2015-01-07 2016-08-03 阿里巴巴集团控股有限公司 证件图像检测方法及设备
US9367736B1 (en) * 2015-09-01 2016-06-14 Amazon Technologies, Inc. Text detection using features associated with neighboring glyph pairs
CN106485193A (zh) * 2015-09-02 2017-03-08 富士通株式会社 文档图像的方向检测装置及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
张倩: "拍照文档图像的几何校正", 《中国优秀博硕士学位论文全文数据库(电子期刊) 信息科技辑》 *
曾凡锋等: "中文文本图像倒置快速检测算法", 《计算机工程与设计》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113126869A (zh) * 2021-03-30 2021-07-16 华东计算技术研究所(中国电子科技集团公司第三十二研究所) 基于国产bmc芯片的kvm图像高速重定向的实现方法及系统

Also Published As

Publication number Publication date
EP3619680A1 (en) 2020-03-11
US10452942B2 (en) 2019-10-22
EP3619680A4 (en) 2020-05-13
US20180322357A1 (en) 2018-11-08
WO2018201441A1 (en) 2018-11-08
EP3619680B1 (en) 2022-01-05
CN110603541B (zh) 2023-04-25

Similar Documents

Publication Publication Date Title
CN110603541B (zh) 用于图像重定向的系统和方法
US10242283B1 (en) Government ID card validation systems
JP6267224B2 (ja) 最良の写真を検出及び選択する方法及びシステム
JP6255486B2 (ja) 情報認識のための方法及びシステム
CN110059689B (zh) 样本集构建方法、装置、计算机设备和存储介质
US9800754B2 (en) Global registration of filled-out content in an application form
US10929597B2 (en) Techniques and systems for storing and protecting signatures and images in electronic documents
US11481683B1 (en) Machine learning models for direct homography regression for image rectification
CN108009546A (zh) 信息识别方法和装置
CN111932462B (zh) 图像降质模型的训练方法、装置和电子设备、存储介质
CN104767816A (zh) 拍摄信息采集方法、装置和终端
US20150186751A1 (en) Image duplication detection
US10032073B1 (en) Detecting aspect ratios of document pages on smartphone photographs by learning camera view angles
CN110660091A (zh) 一种图像配准处理方法、装置和拍照批改作业系统
CN109672710B (zh) 文件上传方法、系统及设备
CN110751105A (zh) 一种手指图像采集方法、装置及存储介质
JP6217225B2 (ja) 画像照合装置、画像照合方法及びプログラム
US9983569B2 (en) System and method for representing a field of capture as physical media
WO2021098346A1 (zh) 人体朝向检测方法、装置、电子设备和计算机存储介质
KR20130022474A (ko) 촬영 이미지 편집 방법 및 이에 적용되는 장치
CN111859464A (zh) 数据校验方法、装置、设备及计算机可读存储介质
CN113642451B (zh) 确定视频的匹配性的方法、装置、设备及可读记录介质
CN107590155B (zh) 文档图像的字符真值获取装置及方法、电子设备
TWI421615B (zh) A method of automatically synchronizing digital camera time with GPS time
JP6040336B1 (ja) 撮影対象位置特定装置、撮影対象位置特定方法、及びプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant