CN111213156A - 字符识别锐度确定 - Google Patents
字符识别锐度确定 Download PDFInfo
- Publication number
- CN111213156A CN111213156A CN201780095352.1A CN201780095352A CN111213156A CN 111213156 A CN111213156 A CN 111213156A CN 201780095352 A CN201780095352 A CN 201780095352A CN 111213156 A CN111213156 A CN 111213156A
- Authority
- CN
- China
- Prior art keywords
- text
- optical
- character
- image
- electronic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000003287 optical effect Effects 0.000 claims abstract description 85
- 238000003384 imaging method Methods 0.000 claims abstract description 45
- 238000003860 storage Methods 0.000 claims description 19
- 238000012549 training Methods 0.000 claims description 14
- 238000004891 communication Methods 0.000 claims description 5
- 230000015654 memory Effects 0.000 claims description 5
- 238000005286 illumination Methods 0.000 claims description 4
- 230000003213 activating effect Effects 0.000 claims 2
- 230000000977 initiatory effect Effects 0.000 claims 1
- 238000012015 optical character recognition Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 12
- 238000000034 method Methods 0.000 description 10
- 238000013459 approach Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000000875 corresponding effect Effects 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 238000011112 process operation Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000002596 correlated effect Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000002730 additional effect Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000001746 injection moulding Methods 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/12—Detection or correction of errors, e.g. by rescanning the pattern
- G06V30/133—Evaluation of quality of the acquired characters
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/60—Analysis of geometric attributes
- G06T7/62—Analysis of geometric attributes of area, perimeter, diameter or volume
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/60—Extraction of image or video features relating to illumination properties, e.g. using a reflectance or lighting model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/98—Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
- G06V10/993—Evaluation of the quality of the acquired pattern
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30168—Image quality inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Geometry (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Abstract
描述了一种电子系统,其中成像设备包括透镜和图像传感器。所述成像设备与光学目标对准。所述光学目标包括所定义的文本大小的文本字符。图像捕获器激活成像设备以捕获光学目标的电子图像。电子图像包括光学目标的文本字符。光学识别器基于所捕获的电子图像来生成针对字符的光学识别结果。锐度检测器比较所述光学识别结果与在光学目标中所包括的文本字符的真值。基于所述比较,指定选择所定义的文本大小作为所指定的分辨率。所述所指定的分辨率然后可与成像设备、光学目标、电子图像、或其组件关联。
Description
背景技术
许多因素可影响在制造期间成像系统和设备的品质。一个因素可以是各种内部组件、诸如传感器和透镜元件的最终精确对准。影响图像系统和设备的品质的另一因素可以是各种组件中每一个的品质。所述各种组件中的每一个本身经受制造期间的不完美。
附图说明
图1是一种图解,其图示了根据本公开内容的用于基于字符识别来确定图像锐度的示例性系统的组件的布置。
图2是一种图解,其图示了根据本公开内容的用于基于字符识别来确定图像锐度的另一系统的组件的示例性布置。
图3是一图解,其图示了根据本公开内容的来自图像捕获和字符识别的结果的两个示例。
图4是一流程图,其图示了根据本公开内容的用于训练锐度检测系统的示例性过程操作。
图5是一流程图,其图示了根据本公开内容的用于训练锐度检测系统的过程操作。
图6是执行根据本公开内容的操作的示例性电子设备的框图。
图7是施行操作以用于执行根据本公开内容的指令的示例性电子设备的框图。
通过参考附图中所示出的示例,本公开内容可以被本领域技术人员更好地理解,并且使得其众多特征和优点对于本领域技术人员而言显而易见。在不同的附图中使用相同的参考符号指示相似或相同的项。
具体实施方式
图1-7图示了用于测量或确定电子图像锐度的示例性设备和技术。一些图像系统和设备被设计用于光学识别文本的目的。捕获并且处理图像,并且生成识别结果。识别过程可显著受到被提供到识别引擎的图像的品质所影响。
用于评估透镜和成像系统分辨率的一种光学途径是调制转移函数(MTF)或对比度传递函数(CTF)。某些分辨率确定依赖于满足任意MTF/CTF值的交替的黑/白线(线对)的空间频率,所述任意MTF/CTF值通常从0到1被归一化。为1的MTF/CTF是理想化,但是MTF/CTF值越高,在透镜品质和总体成像系统性能方面就越好。一旦对于特定的设备或系统已经在某个空间频率上实现了最小MTF/CTF值,成像光学器件就被认为充分足够好。然而,在向消费者和终端用户传达有意义的度量方面,常规的途径走得不够远。
为了确定MTF,成像系统或设备捕获倾斜边缘目标的图像。对于CTF,线对被使用并且需要光学目标中的高水平印刷精度,因为目标的边缘需要非常锐利并且不应具有空隙。测量达高水平精度等同于高成本地印刷随时间而磨损的光学目标。取决于使用和曝光量,光学目标通常需要频繁的更换。
可以通过首先从倾斜边缘目标、诸如已经被旋转一些度数的矩形的电子图像捕获图像数据来计算MTF曲线。从对图像数据进行采样而产生边缘扩展函数(edge spreadfunction)。在取得数据的导数时,可以计算线扩展函数。线扩展函数的傅里叶变换产生MTF,其在空间频率之上被绘制。空间频率被定义为各自具有某个厚度的交替的黑线和白线。例如,为1线对/mm的空间频率意指一个黑白线各自为0.5mm宽。对于某些成像光学器件,这不难解析,并且导致相对高的MTF。
然而,如果成像设备必须解析10线对/mm,其中每条线宽度(黑线或白线)是0.05mm宽,则输出MTF可能相对低。这样的结果可示出:光学设备在解析越来越细的特征方面不是很好。对于可接受的图像锐度的一般规则如下被确定:通过使用MTF曲线来找到实现MTF50(MTF的50%)的空间频率。然后将该频率与预定义的空间频率上的目标MTF进行比较。一旦已经通过成像系统实现了目标MTF,光学器件就不需要任何细化或改变。
对线对数据进行滤波和操纵是有挑战性的,因为很多取决于图像数据中噪声的量。噪声直接有关于光学器件的品质,并且复杂地有关。噪声可大大影响CTF计算,因为线对差直接有关于CTF。无论MTF或CTF是否用于锐度确定,如果这些值不与同用户更相关的某事物耦合或相互关联,则对于MTF和CTF而言没有现实意义。
本文中所述的技术中的一些通过使用被训练用于读取并且评估电子图像中的文本的机器学习途径而不需要高水平精度。光学目标中文本的印刷空隙和锯齿边缘不阻止如下成像系统:所述成像系统配备有用于评估电子图像中的文本的机器学习途径。事实上,在确保成像系统和设备不过度灵敏中,具有空隙和边缘的文本是有帮助的。使用本文中所述的技术中的一些来用于确定图像锐度提供图像锐度和装备效用的更有意义的度量。如本文中所述的图像锐度的一个度量使用文本大小易辨认性作为用于解析光学目标上以小点大小的某个字体或字体族的文本的能力的度量。除了测量成像设备或系统的光学品质之外,作为成像设备或后期处理软件的部分,本文中所述的技术还可以用于评估并且进一步调谐锐化实现方式。基于与不通过软件控制的后期过程来在成像设备内使能够实现锐化特征的相同图像捕获系统相比,图像是更经常通过还是不通过,所述技术增强字符识别。
在用于评估或测量图像锐度的系统的示例中,图像捕获器从成像设备接收图像。图像解析器隔离电子图像的一部分,所述部分包括字符、诸如特定字体的字符。光学字符识别(OCR)引擎或其部分隔离字符并且标识字符的一方面。例如,字符的一方面可以是其字体、其字体族、其高度、其典型高度、其宽度、其特征尺寸、其特征尺寸之一、以及其在字符集内或字母表内的标识。
锐度检测器将字符的该方面与锐度评级相互关联,其中所述锐度评级可以用于将图像分类为通过或不通过。作为一个示例,从图像中所确定的字符的标识可以对照字符的真值进行比较,并且比较的结果用于选择锐度评级。锐度评级可以被应用于字符、图像、成像设备、系统、或其任何组合。过程中的一些或全部可以被重复。结果、连同成像设备或系统的一个或多个方面一起可以被应用以训练OCR引擎。
图1是一种图解,其图示了根据本公开内容的用于基于字符识别来确定图像锐度的示例性系统的组件的布置。在图1中,锐度确定系统100包括成像设备101。成像设备101包括与图像传感器103对准的透镜102。透镜102包括一个或多个透镜元件。图像传感器103被耦合到一个或多个处理器104。系统100包括图像捕获器105。图像捕获器105包括图像接收器106。系统100还包括光学识别器107,所述光学识别器107包括光学字符识别(OCR)引擎108。当图像中存在多个字符的时候,OCR引擎108可以隔离一个字符、多于一个字符、或每个字符。系统100包括锐度检测器110,所述锐度检测器110被耦合到系统100的其它元件。
系统100经由成像设备101来捕获光学目标115的电子图像112,所述光学目标115包括在光学目标115的第一侧120上的一个或多个字符116。在图1中,每个字符116具有所定义的文本大小。光学目标115位于成像设备101的视场117内。光学目标115可以采取承载字符的任何材料的形式,诸如纸浆上或作为所印刷的页面的部分的印刷字符、被手写在表面上的字符、从透明基底所切割的字符、被压印到诸如金属板材之类的表面中的印章字符、从基底材料的表面中所蚀刻的字符、在浅浮雕(bas relief)中所雕刻的字符、在注入模塑期间在表面上所形成的字符等等。
在图1中,光学目标115在平面中关于一组x-、y-和z-轴119而被对准。光学目标115的定向可以参考该组x-、y-和z-轴119而被描述。字符116在该平面中以相对于参照物的角度121而被定向,所述参照物诸如成像设备101或光学目标115的第一边缘122。每个字符116包括某些性质、诸如特征尺寸118、垂直高度、水平宽度、和倾斜角。每个字符116可属于某个字体或字体族。成像设备101和透镜102沿着光轴124、相对于光学目标115而被对准。
根据一个示例,在电子图像112的捕获期间,光111向光学目标115的第一侧120提供照明。一旦捕获了电子图像112,光学识别器107就生成字符116中一个或多个的识别结果113。锐度检测器110对照相应字符116的真值来比较识别结果113。基于所述比较,以及一个或多个其它考虑,生成锐度评级114。作为一个示例,锐度评级是“通过”、“不通过”,或诸如当数值对照预定义的阈值而进行比较的时候的其它评级。锐度评级114可以被应用到系统100、成像设备101或其组件、电子图像112、光学目标115、字体或字体族、各种组件的定向等等。电子组件可以被收集到电子设备123中,所述电子设备123执行用于确定锐度评级114的操作。
图2是一种图解,其图示了根据本公开内容的用于基于字符识别来确定图像锐度的另一示例性系统的组件的布置。在图2中,系统200包括图像捕获设备201,所述图像捕获设备201包括透镜202。图像捕获设备201可以在针对锐度的测试下。图像捕获设备201被装配在包括字符116的光学目标115上方的支撑物203上。图像捕获设备201经由通信信道204而被耦合到计算设备205。
计算设备205通过诸如键盘207之类的一个或多个输入设备而接收输入。在被耦合到计算设备205的电子显示器206上示出从光学目标115的电子图像中得到的信息。例如,从电子图像被隔离的字符116通过计算设备205而被显示在电子显示器206上。计算设备205在电子显示器206上显示输入请求,并且当识别结果未能匹配字符116的真值的时候,计算设备205提示以用于用户输入。用户(未被图示)在电子显示器上所显示的图像中录入字符的标识。计算设备205通过物理用户输入而接受数字值。
基于所录入的字符标识以及从对光学目标112所捕获的图像中得到的电子信息来训练光学识别器。用户可以监控字符的锐度评级是否是恰当的,其具有通过防止假阳性和假阴性来增大机器学习算法准确性的所意图的目标。该目标经由光学识别器来被实现。计算机设备可以被配置成基于用户输入来为图像捕获设备201提供锐度分辨率值。
光学识别器可以被耦合到训练数据库。光学识别器可以通过周期性地对照训练数据库来重训练它而被改进。训练数据库可以在各种时候通过添加通过测试各种系统和设备所收集的图像而被扩增或增强。图像的添加可以批量地或逐一递增地进行,因为每个附加的图像通过经受锐度评估的系统或设备而被捕获。
指令可以用于选择捕获特定图像的设备的标识符,其中所述标识符有关于设备的物理特性。这是所测试的设备。设备的标识符的示例包括序列号、透镜的物理尺寸、透镜群组的放大率、以及光学系统的焦距。其它标识符是可能的。另外的指令可以用于利用与设备相关联的标识符、字符的识别结果、以及光学目标中字符的真值来训练光学识别器。
图3是一图解,其图示了根据本公开内容的来自图像捕获和字符识别的结果的两个示例。在图3中,示例包括第一电子图像的第一部分301和第二电子图像的第二部分307。第一电子图像(未被示出)已从第一设备被捕获,所述第一设备在相对于光学目标的第一配置中而被定向和布置。第二电子图像(未被示出)已从第二设备被捕获,所述第二设备在相对于光学目标的第二配置中而被定向和布置。
在图3中,第一部分301包括通过相应的第一字符边界303而被隔离的第一字符302。第一字符边界303在超过每个相应的第一字符302的四个外边缘的裕度距离处被提供。在图3中,第一字符302具有一个特定字体、诸如Times New Roman的各种大小。在另一实现方式中,第一字符302在多个字体或字体族中。
在图3中,第二部分307包括通过相应的第二字符边界309而被隔离的第二字符308。相对于第一字符302,第二字符308不太锐利或不太对焦。在图3中,第二部分307可以来自不同的电子图像捕获设备、不同的电子图像捕获系统、不同的光学目标、在不同的光学条件下所捕获的图像、或其组合。
通过将OCR或OCR的组件应用到第一部分301的字符302中的一个或多个而得到第一结果304。第一结果304包括第一所识别的字符或第一所标识的字符305,其形成第一字符集306。在图3中,第一所标识的字符305中的每一个对应于该字符302的相应的真值。通过将OCR或OCR的组件应用到第二部分307的第二字符308而得到第二结果310。第二结果310包括第二所标识的字符311,其形成第二字符集312。在图3中,第二所标识的字符311中的一些被不正确地标识。具体地,第二字符集312的前四个字符应当是“a”、“b”、“c”和“d”,而不是图3中所示出的“N”、“a”、“a”和“a”。OCR系统、诸如图2的系统200可以被视为OCR管(pipe)。根据一个实现方式,OCR管不对图像进行后期处理以通过操纵字符而使得系统正确地确定所捕获的字母。代替地,系统的目标是使用成像设备或系统的如下能力:为系统的组件或为整个成像系统提供与其光学性能相关的信息并且生成光学评级或锐度评级。
可以通过比较一个或多个所标识的字符305、311与针对这些字符的相应真值来生成锐度评级。在图3中,基于第一所标识的字符305中的一个或多个的第一锐度评级应优于基于第二所标识的字符311的第二锐度评级。
如本文中进一步详细解释的,各种方法有可能用于基于所标识的字符305、311来确定相应的锐度评级、针对包括第一字符302的第一图像的一个评级、以及针对包括第二字符308的第二图像的另一评级。作为第一示例,锐度评级可以基于对所标识的字符305、311与其相应的真值的第一恰当成对比较进行标识。对于第一字符集306,将基于被恰当地标识为“a”的第一字符“a”来确定第一锐度评级。对于第二字符集312,将基于被恰当地标识为“e”的第五字符“e”来确定第二锐度评级。
图4是一流程图,其图示了根据本公开内容的用于训练锐度检测系统的示例性过程操作。在图4中,在操作402处,从测试下的设备(DUT)、诸如图1的成像设备101以及图2的图像捕获设备201捕获电子图像。在图4中,在操作404处,电子图像被预处理以标识电子图像中字符的位置。在操作406处,通过图像文本分类器来对一个或多个字符进行分类。在操作408处,所述一个或多个字符被识别,诸如通过OCR引擎或其组件。在操作410处,所识别的字符对照其真实标识或地面实况来被检查。如果字符被正确地识别,则在操作412处为测试下的设备生成“通过”等级。如果字符被不正确地识别,则采取另外的操作。
在操作414处,电子图像被采样,并且待识别的字符的图像被显示以用于手动识别。
在操作416处,经由用户输入设备(例如鼠标按钮事件、键录入事件)来接受手动输入。例如,在操作416处,用户可视地检查在电子屏幕上所显示的字符的图像,并且如果字符易辨认,则用户录入针对该字符的值。也就是说,字符被认为与被认为可接受的易辨认性准则对准。在其它示例中,易辨认的字符也可能是人类可读的。
在操作418处,关于所采样的图像是否易辨认而做出确定。也就是说,所采样的图像与易辨认性准则相对准。如果不是,在操作420处,报告“不通过”等级。在其它示例中,所采样的图像也可能是人类可读的。
在图5中,如果字符是易辨认的(例如人类可读),在操作422处,基于所标识的字符来创建采样数据。基于所述采样数据,在操作424处,创建训练图像,并且在操作426处,为对应训练图像的文本分类创建标签。在操作428处,基于所创建的训练图像及其相应地来自操作424和426的对应标签而对多类分类进行训练。在操作422处所创建的采样数据可以被添加到从通过一个或多个其它成像系统或设备而对相同的或不同的光学目标所拍摄的一个或多个图像中得到的其它采样数据。通过组合从以下操作402直到操作422中所得到的采样数据,OCR引擎可以被细化并且超越仅仅在工厂处或在OCR引擎的初始调谐期间的原始训练而被进一步训练。作为示例,在从工厂处正制造的设备集拍摄图像时,可以为OCR引擎创建采样数据、训练图像和字符标签的大量收集。
图5是一示例性流程图,其图示了用于训练锐度检测系统的过程操作。在图5中,在操作502处,图像接收器接收图像以用于处理。在操作504处,图像的一部分被隔离,其中该部分包括文本字符。在操作506处,标识所隔离的文本字符的一方面。在操作508处,所隔离的文本字符的一方面与锐度评级相互关联。
在操作508处,相互关联可以包括一个或多个操作。例如,在操作510处,基于文本字符的真值来调节锐度评级。在操作512处,基于标识了针对文本字符的字体或字体族而调节锐度评级。在操作514处,基于所隔离的文本字符的字符高度或基于所隔离的文本字符的字体或字体族的平均字符高度来调节锐度评级。在操作516处,基于文本字符的整数点大小或文本字符的半数点大小来调节锐度评级。所述整数点大小和半数点大小可以关于光学目标的度量单位。在操作518处,基于文本字符的每英寸点的所标识的特征数(cPPI)而调节锐度评级。在操作520处,诸如基于从光学目标反射离开并且到成像光学器件中的光的度量、光强度、色温等等来调节锐度评级。入射光的度量可以在操作502处图像接收器接收图像的时间处或接近所述时间处被做出,并且被用作锐度评级的另外的修饰符或描述符。作为操作的另一示例,相互关联可以包括确定来自所接收的电子图像的文本字符的几何方面,将所述几何方面匹配到预定文本大小的集合中的一文本大小,并且基于所匹配的文本大小来选择所定义的文本大小。
在操作522处,基于文本字符的一方面超过预定的阈值来生成“通过”/“不通过”评级。作为示例,可以基于所定义的文本大小超过预定文本大小阈值来生成“通过”/“不通过”评级。作为另一示例,“通过”/“不通过”评级可以包括生成“通过”值。在操作524处,通过使用锐度评级和所隔离的文本字符,锐度检测器、光学识别器或系统的其它组件被进一步训练,从而改善后续识别和锐度任务上的性能。所述方法可涉及传送“通过”/“不通过”评级。例如,系统的组件在针对锐度的训练之后可发起电子通信,所述电子通信包括基于由图像接收器所接收的图像的锐度评级。
图6是示例性电子设备的框图,所述示例性电子设备执行操作以用于通过接受电子图像608而确定所指定的分辨率并且使得所指定的分辨率609可用。电子设备600可以包括任何成像设备、诸如图1的成像设备101。处理器601可以是一个或多个中央处理单元(CPU)、微处理器、和/或适合用于检索和执行被存储在机器可读存储介质602中的指令的其它硬件设备。处理器601可以取出、解码和执行指令603、604、605、606、和607以使能够执行应用,如下所述。作为可替换方案,处理器601可以包括一个或多个电子电路,所述电子电路包括用于执行指令603、604、605、606、和607中一个或多个的功能性的多个电子组件。处理器601可以取在诸如图1中所图示的实施例之类的其它实施例中所述的处理器的形式,其中电子设备123包括处理器104。
机器可读存储介质602可以是存储可执行指令的任何电子、磁性、光学或其它物理存储设备。因而,机器可读存储介质602可以是例如随机存取存储器(RAM)、电可擦除可编程只读存储器(EEPROM)、存储驱动器、光盘等等。如以下详细描述的,机器可读存储介质602可以被编码有用于捕获电子图像并且获得所指定的分辨率的可执行指令。
电子图像捕获指令122可以初始接收电子图像608。例如,图像608可以从图1的图像传感器103、从图2的图像捕获设备201被接收。“光学识别文本字符”指令604然后可以在所接收的电子图像608上执行一个或多个操作。例如,处理器601可以在电子图像的一个或多个部分上执行解析、表征、评估或识别任务。特定的指令可以提供识别的结果。结果可以是针对在电子图像608中出现的一个或多个字符的标识。
在执行了光学识别指令604之后,通过处理器604来执行“比较结果”指令605。字符识别的结果对照其真值来被比较。基于执行“比较”指令605的结果,“选择所定义的文本大小作为所指定的分辨率”指令606由处理器601来执行。
接下来,“存储所指定的分辨率”指令607由处理器601来执行。这些指令607可以向一个或多个处理器、诸如图6中的处理器603提供所指定的分辨率609或以其它方式使得所指定的分辨率609可用于一个或多个处理器、诸如图6中的处理器603。可替换地,这些指令607可以向一个或多个存储器提供所指定的分辨率710或以其它方式使得所指定的分辨率710可用于一个或多个存储器。
图7是示例性系统、诸如电子设备700的框图,所述示例性系统施行操作以用于执行超越图7中所图示的以及与其相关地描述的那些之外的指令。在图7中,电子设备700可以包括任何成像设备、诸如图1的成像设备101。在图1的示例性实施例中,电子设备123包括处理器104。
处理器701可以是一个或多个中央处理单元(CPU)、微处理器、和/或适合用于检索和执行被存储在机器可读存储介质702中的指令的其它硬件设备。处理器701可以取出、解码和执行指令703-711,单个地或以指令的群组,以使能够执行应用和操作,如下进一步所述。作为可替换方案,处理器701可以包括一个或多个电子电路,所述电子电路包括用于执行指令703-711中一个或多个的功能性的多个电子组件。
机器可读存储介质702可以是存储可执行指令的任何电子、磁性、光学或其它物理存储设备。因而,机器可读存储介质702可以是例如随机存取存储器(RAM)、电可擦除可编程只读存储器(EEPROM)、存储驱动器、光盘等等。如以下详细描述的,机器可读存储介质702可以被编码有可执行指令,所述可执行指令用于处理电子图像以及从其中所得到的信息,并且提供各种种类的电子输出。
“确定字符的垂直高度”指令703可以由处理器701来执行,从而确定在电子图像、诸如图7的图像709以及图1的图像112中所表示的字符的示例性方面。
在图7中,“使垂直高度与所定义的文本大小相互关联”指令704可以被执行。针对一个或多个字符的垂直高度可以与所定义的文本大小相互关联。垂直高度可以对应于、匹配、或近似匹配预定的、已知标准文本大小或所定义的文本大小。作为示例,垂直高度可以基于从电子图像、诸如图7的图像709中的一个或多个字符所标识的高度而被相互关联到12点字体大小。
还在图7中,“根据结果与其真值的比较而确定每英寸点的特征数(cPPI)”指令705可以由处理器701来执行。基于潜在字符的一方面,指令705可以根据识别文本字符的结果与其真值的成功比较来确定cPPI。可以执行另外的指令。例如,“将cPPI匹配到一个文本大小”指令706可以被执行以基于cPPI来确定文本大小。
在图7中,可以执行另外的指令。“选择与设备相关联的标识符”指令707可以由处理器701来执行。作为示例,选择序列号或型号。随后,“利用标识符以及真值来训练OCR引擎”指令708可以被执行。OCR引擎或有关的指令当除了字符图像之外还被提供有图像捕获设备的序列号或型号的时候可以从而被训练以展现经改进的识别。其它信息可以被提供或获得,作为指令708中的标识符。
根据另外的实现方式,“在显示设备上显示所捕获的电子图像和真值”指令709可以由处理器701执行以在电子显示器上向用户提供一个或多个字符的图像。字符可已经被识别或可尚未被识别。跟在指令709之后,“提示用户以用于输入”指令710可以由处理器701执行。作为响应,提示用户以提供用户输入。
可以执行又另外的指令。例如,在图7中“经由设备来接受物理用户输入并且提供锐度分辨率值”指令711可以由处理器701通过从机器可读存储介质702访问指令711来被执行。
另外,本文中所述的示例还可以用于基于当与使锐度特征关断的图像相比的时候图像是否更经常通过/不通过来评估并且此外调谐锐度途径,以及它们在增强字符中多好地起作用。此外,本文中所述的示例可以用于取决于基于字符大小和字体所实现的字符识别准确性来验证并且此外调谐锐度途径。
Claims (15)
1.一种电子系统,包括:
电子设备,其具有透镜和图像传感器,所述成像设备与光学目标对准,所述光学目标包括所定义的文本大小的文本字符;
图像捕获器,其用于激活成像设备以捕获光学目标的电子图像,所述电子图像包括光学目标的文本字符;
光学识别器,其用于基于所捕获的电子图像来生成针对字符的光学识别结果;以及
锐度检测器,其用于:
比较所述光学识别结果与在光学目标中所包括的文本字符的真值;
基于所述比较,选择所定义的文本大小作为所指定的分辨率;以及
使所述所指定的分辨率与成像设备相互关联。
2.根据权利要求1所述的电子系统,其中所述光学目标是印刷的页面,其中所定义的文本大小是印刷页面的每度量单位的整数和半数点大小的集合,并且其中选择所定义的文本大小作为所指定的分辨率包括选择印刷页面的每度量单位的整数和半数点大小的该集合中之一。
3.根据权利要求1所述的电子系统,其中所述锐度检测器用于:
确定来自所捕获的电子图像的文本字符的垂直高度;
将所述垂直高度匹配到预定的文本大小的集合中的一个文本大小;以及
基于所匹配的文本大小来选择所定义的文本大小。
4.根据权利要求1所述的电子系统,其中所述光学识别器用于基于所述光学识别结果来确定字体族,并且其中所述锐度检测器用于将所确定的字体族匹配到预定文本大小的集合中的一个文本大小,以及基于所确定的字体族来选择所定义的文本大小。
5.根据权利要求1所述的电子系统,其中所述锐度检测器用于:
根据所述光学识别结果来确定每英寸点的特征数(cPPI);以及
基于所确定的cPPI来选择所定义的文本大小。
6.根据权利要求5所述的电子系统,所述锐度检测器用于:
基于所定义的文本大小超过预定文本大小阈值而生成通过值;以及
基于所述通过值,利用来自电子图像的信息来训练光学识别器。
7.根据权利要求1所述的电子系统,所述图像捕获器用于:
测量从光学目标所反射的光照水平;
比较如通过强度、色温、或强度与颜色的组合所限定的所测量的光照水平与预定光照阈值来获得光照水平结果;
关联所述光照水平结果与所捕获的电子图像;以及
关联所述光照水平与所指定的分辨率。
8.一种电子设备,包括:
具有透镜和图像传感器的成像设备,所述成像设备可与一光学目标对准,所述光学目标具有所定义的字符大小的文本字符;
图像捕获器,其用于激活成像设备以捕获光学目标的电子图像,所述电子图像包括光学目标的文本字符;
光学识别器,其用于基于所捕获的电子图像来生成针对字符的光学识别结果;以及
锐度检测器,其用于:
比较所述光学识别结果与光学目标的文本字符的真值;
基于所述比较,从所定义的文本大小的集合中选择所定义的文本大小作为所指定的分辨率;
关联所述所指定的分辨率与成像设备。
9.根据权利要求8所述的设备,其中所述锐度检测器此外用于:
将所定义的文本大小与锐度评级相互关联;以及
发起电子通信,所述电子通信包括锐度评级。
10.根据权利要求1所述的设备,其中所述光学识别器是OCR引擎,并且所述光学识别器用于:
确定来自所捕获的电子图像的文本字符的几何方面;
将所述几何方面匹配到预定的文本大小的集合中的一个文本大小;以及
基于所匹配的文本大小来选择所定义的文本大小。
11.一种被编码有可由电子设备的控制器执行的指令的非暂时性机器可读存储介质,所述机器可读存储介质包括:
用于利用设备来捕获光学目标的电子图像的指令,所述光学目标包括所定义的文本大小的文本字符;
用于通过基于所捕获的电子图像来生成针对字符的结果来光学地识别所捕获的电子图像的文本字符的指令;
用于比较光学目标中所识别的字符的结果与字符的真值的指令;
用于基于所述比较来选择所定义的文本大小作为所指定的分辨率的指令;以及
用于利用所述设备来将所指定的分辨率存储在电子存储器中的指令。
12.根据权利要求11所述的非暂时性机器可读存储介质,此外包括:
用于确定所捕获的电子图像的文本字符的垂直高度的指令;以及
用于将所述垂直高度与所定义的文本大小相互关联的指令。
13.根据权利要求11所述的非暂时性机器可读存储介质,此外包括:
用于根据光学目标中文本字符的结果与字符的真值的成功比较来确定每英寸点的特征数(cPPI)的指令;以及
用于将cPPI匹配到预定的文本大小的集合中的一个文本大小的指令。
14.根据权利要求11所述的非暂时性机器可读存储介质,此外包括:
用于选择与设备相关联的标识符的指令,所述标识符有关于设备的物理特性;以及
用于利用与设备相关联的标识符、字符的结果、以及光学目标中字符的真值来训练OCR引擎的指令。
15.根据权利要求14所述的非暂时性机器可读存储介质,此外包括:
用于在物理显示设备上显示以下各项的指令:(1)包括文本字符的所捕获的电子图像的一部分;以及(2)与文本字符相对应的真值;
基于所捕获的电子图像的所显示的部分以及与文本字符相对应的真值来提示以用于针对设备的用户输入的指令;以及
用于经由物理用户输入设备来接受针对设备的用户输入;以及基于所述用户输入来为设备提供锐度分辨率值的指令。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/US2017/043812 WO2019022725A1 (en) | 2017-07-25 | 2017-07-25 | DETERMINATIONS OF SHARED CHARACTER RECOGNITION |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111213156A true CN111213156A (zh) | 2020-05-29 |
CN111213156B CN111213156B (zh) | 2024-05-10 |
Family
ID=65039847
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780095352.1A Active CN111213156B (zh) | 2017-07-25 | 2017-07-25 | 字符识别锐度确定 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11562557B2 (zh) |
EP (1) | EP3659066A4 (zh) |
CN (1) | CN111213156B (zh) |
WO (1) | WO2019022725A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112954110A (zh) | 2019-12-10 | 2021-06-11 | 北京小米移动软件有限公司 | 图像处理方法、装置及存储介质 |
TWI809353B (zh) * | 2021-02-09 | 2023-07-21 | 捷思博科技有限公司 | 用於鍵盤圖像比對之影像辨識系統、方法及電腦可讀媒介 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030086615A1 (en) * | 2001-11-02 | 2003-05-08 | Xerox Corporation | Method and apparatus for capturing text images |
CN101441713A (zh) * | 2007-11-19 | 2009-05-27 | 汉王科技股份有限公司 | 一种pdf文件的光学字符识别方法及装置 |
CN101578597A (zh) * | 2007-01-15 | 2009-11-11 | 微软公司 | 转换文本 |
US20110206266A1 (en) * | 2010-02-23 | 2011-08-25 | Bill Faulkner | Comparison of optical and magnetic character data for identification of character defect type |
CN102782707A (zh) * | 2010-03-11 | 2012-11-14 | 微软公司 | 包括经历ocr处理的文本的图像的分辨率调整 |
CN103530625A (zh) * | 2013-10-28 | 2014-01-22 | 北京金和软件股份有限公司 | 一种基于数字图像处理的光学字符识别方法 |
US8755595B1 (en) * | 2011-07-19 | 2014-06-17 | Google Inc. | Automatic extraction of character ground truth data from images |
CN104134057A (zh) * | 2009-01-28 | 2014-11-05 | 谷歌公司 | 来自出版物的经ocr处理的文本和对应图像在客户端设备上的选择性显示 |
US20150049948A1 (en) * | 2013-08-16 | 2015-02-19 | Xerox Corporation | Mobile document capture assist for optimized text recognition |
CN104871180A (zh) * | 2012-12-13 | 2015-08-26 | 高通股份有限公司 | 用于ocr的基于文本图像质量的反馈 |
CN104954605A (zh) * | 2014-03-31 | 2015-09-30 | 京瓷办公信息系统株式会社 | 图像形成装置、图像形成系统以及图像形成方法 |
US20160034773A1 (en) * | 2014-08-04 | 2016-02-04 | Datalogic ADC, Inc. | Robust industrial optical character recognition |
CN105830091A (zh) * | 2013-11-15 | 2016-08-03 | 柯法克斯公司 | 使用移动视频数据生成长文档的合成图像的系统和方法 |
US20160342852A1 (en) * | 2014-01-31 | 2016-11-24 | Longsand Limited | Optical character recognition |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE469245B (sv) | 1991-10-07 | 1993-06-07 | Televerket | Anordning foer maetning av bildkvalitet med optisk moensterigenkaenning |
US5689620A (en) * | 1995-04-28 | 1997-11-18 | Xerox Corporation | Automatic training of character templates using a transcription and a two-dimensional image source model |
US7362354B2 (en) | 2002-02-12 | 2008-04-22 | Hewlett-Packard Development Company, L.P. | Method and system for assessing the photo quality of a captured image in a digital still camera |
US7405816B2 (en) | 2005-10-04 | 2008-07-29 | Nokia Corporation | Scalable test target and method for measurement of camera image quality |
US9087262B2 (en) * | 2011-11-10 | 2015-07-21 | Fuji Xerox Co., Ltd. | Sharpness estimation in document and scene images |
US9542736B2 (en) * | 2013-06-04 | 2017-01-10 | Paypal, Inc. | Evaluating image sharpness |
US9208551B2 (en) | 2013-08-28 | 2015-12-08 | Intuit Inc. | Method and system for providing efficient feedback regarding captured optical image quality |
US9576210B1 (en) * | 2014-09-29 | 2017-02-21 | Amazon Technologies, Inc. | Sharpness-based frame selection for OCR |
US9785850B2 (en) * | 2015-07-08 | 2017-10-10 | Sage Software, Inc. | Real time object measurement |
CN105825500B (zh) | 2016-03-10 | 2018-07-27 | 江苏商贸职业学院 | 一种对相机图像质量的评价方法与装置 |
US9990564B2 (en) * | 2016-03-29 | 2018-06-05 | Wipro Limited | System and method for optical character recognition |
US10037459B2 (en) * | 2016-08-19 | 2018-07-31 | Sage Software, Inc. | Real-time font edge focus measurement for optical character recognition (OCR) |
-
2017
- 2017-07-25 EP EP17919325.5A patent/EP3659066A4/en active Pending
- 2017-07-25 WO PCT/US2017/043812 patent/WO2019022725A1/en unknown
- 2017-07-25 US US16/634,096 patent/US11562557B2/en active Active
- 2017-07-25 CN CN201780095352.1A patent/CN111213156B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030086615A1 (en) * | 2001-11-02 | 2003-05-08 | Xerox Corporation | Method and apparatus for capturing text images |
CN101578597A (zh) * | 2007-01-15 | 2009-11-11 | 微软公司 | 转换文本 |
CN101441713A (zh) * | 2007-11-19 | 2009-05-27 | 汉王科技股份有限公司 | 一种pdf文件的光学字符识别方法及装置 |
CN104134057A (zh) * | 2009-01-28 | 2014-11-05 | 谷歌公司 | 来自出版物的经ocr处理的文本和对应图像在客户端设备上的选择性显示 |
US20110206266A1 (en) * | 2010-02-23 | 2011-08-25 | Bill Faulkner | Comparison of optical and magnetic character data for identification of character defect type |
CN102782707A (zh) * | 2010-03-11 | 2012-11-14 | 微软公司 | 包括经历ocr处理的文本的图像的分辨率调整 |
US8755595B1 (en) * | 2011-07-19 | 2014-06-17 | Google Inc. | Automatic extraction of character ground truth data from images |
CN104871180A (zh) * | 2012-12-13 | 2015-08-26 | 高通股份有限公司 | 用于ocr的基于文本图像质量的反馈 |
US20150049948A1 (en) * | 2013-08-16 | 2015-02-19 | Xerox Corporation | Mobile document capture assist for optimized text recognition |
CN103530625A (zh) * | 2013-10-28 | 2014-01-22 | 北京金和软件股份有限公司 | 一种基于数字图像处理的光学字符识别方法 |
CN105830091A (zh) * | 2013-11-15 | 2016-08-03 | 柯法克斯公司 | 使用移动视频数据生成长文档的合成图像的系统和方法 |
US20160342852A1 (en) * | 2014-01-31 | 2016-11-24 | Longsand Limited | Optical character recognition |
CN104954605A (zh) * | 2014-03-31 | 2015-09-30 | 京瓷办公信息系统株式会社 | 图像形成装置、图像形成系统以及图像形成方法 |
US20160034773A1 (en) * | 2014-08-04 | 2016-02-04 | Datalogic ADC, Inc. | Robust industrial optical character recognition |
Also Published As
Publication number | Publication date |
---|---|
CN111213156B (zh) | 2024-05-10 |
EP3659066A4 (en) | 2021-02-24 |
WO2019022725A1 (en) | 2019-01-31 |
EP3659066A1 (en) | 2020-06-03 |
US11562557B2 (en) | 2023-01-24 |
US20200210739A1 (en) | 2020-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11087125B2 (en) | Document authenticity determination | |
KR102058427B1 (ko) | 검사 장치 및 방법 | |
US10832026B2 (en) | Method and system for determining whether a barcode is genuine using a gray level co-occurrence matrix | |
US11699283B2 (en) | System and method for finding and classifying lines in an image with a vision system | |
EP3111376B1 (en) | Methods and a system for verifying the identity of a printed item | |
US10679094B2 (en) | Automatic ruler detection | |
EP3198526B1 (en) | Methods and a system for verifying the authenticity of a mark | |
CN106874901B (zh) | 一种行驶证识别方法及装置 | |
US10395090B2 (en) | Symbol detection for desired image reconstruction | |
CN111213156B (zh) | 字符识别锐度确定 | |
US11580758B2 (en) | Method for processing image, electronic device, and storage medium | |
CN111178347B (zh) | 证件图像的模糊度检测方法、装置、设备及存储介质 | |
KR20160061528A (ko) | 위변조 여권 검사 방법 및 그 기록매체 | |
US10621466B2 (en) | Method for extracting features of a thermal image | |
CN111008635A (zh) | 一种基于ocr的多票据自动识别方法及识别系统 | |
Mahamad et al. | A Simplified Malaysian Vehicle Plate Number Recognition | |
Ni et al. | The location and recognition of anti-counterfeiting code image with complex background | |
CN118279304A (zh) | 基于图像处理的异型金属件异常识别方法、装置及介质 | |
CN117876345A (zh) | 一种用于led面板的缺陷检测方法、装置、介质及设备 | |
CN114898351A (zh) | 文本识别方法、装置、电子设备及计算机存储介质 | |
Kumar et al. | Location and Detection of a Text in a Video | |
JP2005339398A (ja) | 特徴抽出装置、特徴抽出方法、および、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |