CN1482572A - 票据图象处理装置 - Google Patents

票据图象处理装置 Download PDF

Info

Publication number
CN1482572A
CN1482572A CNA03148249XA CN03148249A CN1482572A CN 1482572 A CN1482572 A CN 1482572A CN A03148249X A CNA03148249X A CN A03148249XA CN 03148249 A CN03148249 A CN 03148249A CN 1482572 A CN1482572 A CN 1482572A
Authority
CN
China
Prior art keywords
image
data
unit
input
layout
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA03148249XA
Other languages
English (en)
Other versions
CN1240021C (zh
Inventor
亮 蔡
蔡亮
施宇伦
陈宇
章国英
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
XINYADA SYSTEM ENGINEERING Co LTD HANGZHOU
Original Assignee
XINYADA SYSTEM ENGINEERING Co LTD HANGZHOU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by XINYADA SYSTEM ENGINEERING Co LTD HANGZHOU filed Critical XINYADA SYSTEM ENGINEERING Co LTD HANGZHOU
Priority to CN 03148249 priority Critical patent/CN1240021C/zh
Publication of CN1482572A publication Critical patent/CN1482572A/zh
Application granted granted Critical
Publication of CN1240021C publication Critical patent/CN1240021C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

本发明公开了一种用于光学字符识别系统的票据图象处理装置,包括内部总线以及通过所述内部总线相互连接的用于存储光学识别字符(OCR)文字模板库、版面模板库和票据图象处理程序的存储单元、核心处理器,还包括用于桥接所述的核心处理器和主计算机总线的外部总线接口扩展单元。所述核心处理器专用于票据图象的处理或识别。采用该装置,能够使OCR系统的图象数据的处理不再依赖OCR系统的主计算机,这样可以使系统具有更多的资源用于处理票据图象,因而可以极大地提高系统图象处理的效率。

Description

票据图象处理装置
技术领域
本发明涉及一种图象处理装置,尤其是一种在光学字符识别(OCR)系统中用于对票据图象进行处理的装置。
背景技术
在逐渐到来的信息化社会中,随着计算机网络技术的发展,信息的传播媒介发生了较大的变化,使得信息的表示、传播也必然进入电子化的发展模式。由于各行各业的业务发展,票据的种类、数量的大量增加,处理和保存这些票据的过程以及从这些票据中提取信息的过程也越来越烦杂和低效,这样,采用计算机和光学图象信息读取设备构建OCR系统,以电子方式处理和保存所述票据以及其中的信息成为必然的趋势。
现有的OCR系统,主要是由计算机和光学图象读取设备以及控制所述计算机和光学图象读取设备按所需模式工作的控制程序构成,更具体地说,由所述控制程序控制计算机的CPU按照指定的模式控制光学图象读取设备读取需要保存和处理的票据图象,再由CPU按照指定的模式对这些图象进行处理,获取相应类别的信息。由于OCR系统计算机的CPU不但要用于处理票据,还要承担整个OCR系统的管理、调度和信息的网络传输等操作,如对操作系统平台的管理,这使得有限的CPU资源仅有一小部分能用于处理票据,极大地降低了票据的处理效率,加大了票据处理成本。实际中,要提高票据的处理能力,必需要增加计算机设备,从而使整个OCR系统的投资成本、维护成本、资源消耗等大幅度增加。
另外,现有的包括计算机设备的OCR系统的安全性、稳定性易受到外界或非法使用以及不当使用的影响。因此,如何提高系统的处理能力,而较少地增加系统的投资成本、维护成本、资源消耗是实践中迫切需要解决的问题。解决上述问题的简单方法就是设置专门用于处理系统票据图象的装置,即系统中专用于处理系统票据图象的协处理卡,然而,长期以来人们的认识已经局限于基于程序控制的计算机系统,使得这种专用的处理OCR系统票据图象的装置没有出现。
发明内容
本发明的目的在于,提供一种用于光学字符识别系统的票据图象处理装置,使用该装置能以较少的成本,极大提高OCR系统的票据处理效率。
为达到上述目的,本发明提供的票据图象处理装置用于光学字符识别系统,所述光学字符识别系统包括光学图象读取设备和包括总线的主计算机,所述票据图象处理装置包括:
内部总线;以及通过所述内部总线相互连接的用于存储光学识别字符(OCR)文字模板库、版面模板库和票据图象处理程序的存储单元;和,
核心处理器,用于接收光学图象读取设备通过所述主计算机总线输入的版面图象数据,对该版面版面图象数据进行版面预存储单元中的版面模板库以及OCR文字模板库中的样板数据进行比较处理,将比较结果或直接将预处理后的版面数据反馈给主计算机。
所述存储单元包括:
模板数据存储单元,用于存储OCR文字模板库和版面模板库的数据;
模板索引单元,用于存储文字模板和图象模板的编号和地址,提供对于模板数据查询的索引信息。
所述核心处理器包括:
图象预处理单元,用于对输入的版面行识别前的修正处理,并提取出版面图象数据的版面特征数据输出,所述版面特征数据包括图象特征数据和文字特征数据;
信息比对识别单元,用于将输入图象的版面特征数据与预先存储的文字模板数据和图象模板数据进行比较,得到输入图象的版面信息输出;
输入输出控制单元,用于对光学图象读取设备通过所述主计算机总线输入的版面图象数据进行输入到所述图象预处理单元或所述信息比对识别单元的缓冲和顺序控制,以及将所述图象预处理单元输出的特征数据或所述信息比对识别单元输出的版面信息数据输出到主计算机的缓冲和顺序控制。
所述图象预处理单元包括:
图象畸变矫正模块,用于对的输入的版面图象数据进行黑边切除处理和倾斜矫正处理;
图象增强及噪声清除模块,用于对输入的版面图象数据进行滤波处理,去除图象中的背景噪声,以及增强图象;
图象二值化处理模块,用于对经过图象增强及噪声清除的彩色或灰度版面图象数据转化为只有黑、白二值的版面图象数据;
文字信息提取修补模块,用于从经过图象二值化处理的版面图象数据中抠取指定位置和大小,并且包含指定文字信息的图象板面,并且清除所抠取图象板面上的噪声,以及修补因噪声清除而造成的文字图象缺陷;
文字、线条信息搜集模块,用于从二值化图象板面中或抠取的二值化图象板面中搜索图象特征数据和文字特征数据。
所述信息识别单元包括:
图象比对单元,用于将版面特征数据中的图象特征数据与版面模板库中的样板数据进行比较,并在输入输出控制单元的控制下输出该比较结果;
文字识别单元,用于将版面特征数据中的文字特征数据与OCR文字模板库中的样板数据进行比较,并在输入输出控制单元的控制下输出该比较结果。
所述输入输出控制单元包括:
输入队列,用于按照输入的顺序存储光学图象读取设备通过所述主计算机总线输入的版面图象数据,并按照存储的顺序输出所述版面图象数据到所述图象预处理单元或所述信息比对识别单元;
输出队列,用于按照输出的顺序存储图象预处理单元或信息比对识别单元输出的图象预处理数据或图象版面信息数据,并按照存储的顺序输出这些数据到主计算机;
输入输出管理单元,用于控制所述输入队列按照先进先出的顺序输入待处理的版面图象数据,控制所述输出队列按照先进先出的顺序输出预处理结果数据或图象的版面信息数据。
所述输入输出管理单元还包括:
第一判断器,用于完成输入队列中的版面图象数据输出给图象预处理单元或信息比对识别单元的判断;
第二判断器,用于完成图象预处理单元输出的图象预处理数据输出给输出队列或信息比对识别单元的判断。
本发明所述的票据图象处理装置还包括:
电源管理单元,用于对存储单元和核心处理器进行过流保护、过压保护、抗干扰和防静电保护,以及提供稳压保护。
加密单元,用于对主计算机输入到所述图象预处理单元或所述信息比对识别单元的版面图象数据进行解密操作,以及对图象预处理单元或信息比对识别单元输出到主计算机的图象预处理数据或图象版面信息数据进行加密操作。
本发明提供的另外一种用于光学字符识别系统的票据图象处理装置为多核心处理器装置,它包括:
内部总线;以及,
通过所述内部总线相互连接的用于存储光学识别字符(OCR)文字模板库、版面模板库和票据图象处理程序的存储单元;和,
至少二个核心处理器,每个核心处理器用于接收光学图象读取设备通过所述主计算机总线输入的版面图象数据,对该版面图象数据进行版面预处理,与所述存储单元中的版面模板库以及OCR文字模板库中的样板数据进行比较,将比较结果或直接将预处理后的版面数据反馈给主计算机;
外部总线接口扩展单元,用于桥接所述的核心处理器和主计算机总线。所述外部总线接口扩展单元类型与主计算机总线的类型相适应。
由于本发明采用包含核心处理器的票据图象处理装置专用于处理光学字符识别系统的票据图象,使系统的图象数据的处理不再依赖系统的主计算机,这样可以使系统具有更多的资源用于处理票据图象,因而极大地提高了系统图象处理的效率;同时,在系统图象处理负载较重时,可以通过外部总线接口扩展单元增加本发明所述装置核心处理器的数量,从而能够以较低的成本提供较高的图象数据的处理能力,进而极大提高整个OCR系统的票据处理效率;另外,本发明采用的电源管理单元和加密处理单元,还有利于提高本发明的稳定性和安全性。
附图说明
图1是包含本发明第一个实施例框图的OCR系统结构图;
图2是图1所述实施例采用的模板存储单元框图;
图3是图1所述实施例采用的核心处理器框图;
图4是图3所述核心处理器采用的图象预处理单元框图;
图5是图3所述核心处理器采用的信息比对识别单元框图;
图6是图3所述核心处理器采用的输入输出控制单元框图;
图7是图6所述输入输出控制单元采用的输入输出管理单元框图;
图8是包含本发明第二个实施例框图的OCR系统结构图;
图9是图1和图8所述实施例采用的电源管理单元框图;
图10是3×3矩阵图;
图11为文字连通块示意图;
图12是找横线流程图。
具体实施方式
光学字符识别系统进行票据处理的过程主要包括以下几个部分:首先是进行票据的识别,然后根据识别出的票据的类别进行信息的提取,最后对识别出的票据和提取的信息进行所需要的管理。在上述过程中,票据识别过程需要处理的数据量是最大的,占用的资源也最多,这就导致了系统主计算机进行票据处理的时间大大延长。要解决这个问题,较好的做法之一就是在系统中采用专用于处理票据图象的协处理装置代替主计算机处理票据识别和票据信息提取等占用资源较多的操作,而将对于票据的管理等占用资源较少的操作由主计算机完成。本发明就提供了一种这样的用于光学字符识别系统的票据图象处理装置。
图1是包含本发明第一个实施例框图的OCR系统结构图。图1所示的是整个光学字符识别系统,系统中包括光学图象读取设备和包括总线2的主计算机3,由于光学图象读取设备可以看作是主计算机3的一部分,所以图中未绘出。图1中的票据图象处理装置1即为本发明所述的装置,它包括内部总线12和通过其相连的存储单元11和核心处理器13;所述存储单元11主要用于存储OCR文字模板库、版面模板库和票据图象处理程序。所述的OCR文字模板库、版面模板库的模板数据是系统在主计算机的控制下预先根据标准的票据所生成的,包含了票据图象中的特征线条、特征点、以及特征文字信息等能够代表票据图象版面的特征。如果系统需要扩展对新增票据的处理功能,可以随时根据新的标准票据生成新的文字模板和版面模板数据相应添加到上述数据库中。所述核心处理器13,用于接收光学图象读取设备通过所述主计算机总线输入的版面图象数据,对该版面图象数据进行版面预处理。根据主计算机在通过其总线输入光学图象读取设备读取的票据版面图象数据时所给出的处理指令,将经过版面预处理后的版面图象数据与所述存储单元中的版面模板库以及OCR文字模板库中的样板数据进行比较,将比较结果或将预处理后的版面图象数据反馈给主计算机,或者直接将版面预处理后的版面图象数据反馈给主计算机。这样通过将输入的版面图象数据与预先定义的版面模板数据进行匹配,即可完成票据版面识别功能。这里所述的版面图象数据采用BMP格式,当然也可以采用其它格式,如TIF格式。
在本发明的其它实施例中,根据所处理票据性质的不同,所述存储单元11中也可以仅保存OCR文字模板库或版面模板库其中之一,这取决于票据识别时是否仅依赖OCR文字模板数据或版面模板数据就可以完成票据的识别。
图1中还提供了两个可选择的单元部件,用于为票据图象处理装置1提供安全保证。一个是电源管理单元15,一个是加密模块14。所述电源管理单元15,用于对存储单元和核心处理器进行过流保护、过压保护、抗干扰和防静电保护,以及提供稳压保护。这样,就可以防止电流过载、电压过载和静电导致装置器件的损坏和电压偏低导致的数据读写失误,增强装置内器件的抗电源干扰的能力。所述电源管理单元参考图9,它包括稳压模块151、滤波模块152、过流保护模块153、过压保护模块154和防静电模块155。上述模块采用目前通用的技术和器件即可实现,例如防静电模块155采用型号为PSR05的集成电路就可以实现,该集成电路由PROTEK DEVICE生产,包含低电容、高速TVS(瞬变电压抑制二极管),具有在非常短的时间内将电压释放的能力。
为了提高数据操作的安全性,通过主计算机3的总线2输入给票据图象处理装置1的待处理版面图象数据,以及由票据图象处理装置1处理后反馈给主计算机的版面图象数据可以用加密的的方式解决,这样就需要有一个加密单元与主计算机配合工作,因此,所述加密单元14,就用于对主计算机输入到所述图象预处理单元或所述信息比对识别单元的版面图象数据进行解密操作,以及对图象预处理单元或信息比对识别单元输出到主计算机的图象预处理数据或图象版面信息数据进行加密操作。这样,就解决了数据操作安全问题。
图1所述实施例采用的模板存储单元11参考图2,它包括模板数据存储单元111、模板索引单元112和控制程序存储单元113。本例中,所述模板数据存储单元111用于存储OCR文字模板库和版面模板库的数据,模板索引单元112则用于存储文字模板和图象模板的编号和地址,这样,在需要获取模板数据时,首先通过模板索引单元112获取该模板数据在模板数据存储单元111中的编号和地址、模块大小等对于模板数据查询的索引信息,再根据上述信息到模板数据存储单元111中提取出相应的模板数据。控制程序存储单元113主要用于存储相应的控制程序。在本实施例具体实现时,所述模板存储单元11采用两种性质的存储器,一种能够永久保存数据又能够随时进行修改其内容,如EPROM、EEPROM、FLASH ROM等,以构建上述控制程序存储单元113;;另一种是随机存储器,如SDRAM,用于构建模板数据存储单元111、模板索引单元112,以及在控制程序的控制下,为核心处理器13提供存储和处理通过所述主计算机总线输入的版面图象数据的空间。
图1所述实施例采用的核心处理器参考图3。图3所述核心处理器13包括图象预处理单元131、信息比对识别单元132、输入输出控制单元133以及核心处理器13的内部用于数据交换的总线134。所述图象预处理单元131,用于对输入的版面图象数据进行识别前的修正处理,以消除待处理版面图象数据中包含的噪声,确保准确识别票据。该单元还用于在修正处理后的版面图象数据中提取出版面特征数据输出,用以提供给系统主计算机或所述信息比对识别单元132进行版面识别。这里所述版面特征数据包括图象特征数据和文字特征数据,当然,在对不同的票据进行识别处理时,根据票据的不同属性,所述特征数据也可以不局限于上述两种,例如在对彩色票据进行识别时,可以采用灰度特征数据等等。
所述信息比对识别单元132,用于获得所需要识别版面的信息数据,即给出所识别版面的识别结果。为此,该单元将所述图象预处理单元131输出的版面特征数据与预先存储的文字模板数据和图象模板数据进行比较,确定与所述版面特征数据最佳匹配的模板,即得到了输入图象的版面信息数据,并将该信息数据输出给系统主计算机进行管理等后续处理。
实际中,为使票据版面的识别具有更高的效率和灵活性,系统主计算机会根据系统资源利用率或待识别的票据图象的质量调整票据版面识别过程中数据处理的分工,例如,在向票据图象处理装置传送待处理版面图象数据时,同时发送处理指令,指示需要得到的版面图象数据的处理结果,即指示仅对需要处理的版面图象数据进行图象预处理单元131的预处理,或指示对需要处理的版面图象数据进行版面识别,这样就涉及在核心处理器13中的不同数据流控制。除此之外,还涉及待处理版面图象数据输入,以及处理结果数据输出时的缓冲问题。为此,在本实施例中,提供的输入输出控制单元133,对光学图象读取设备通过所述主计算机总线输入的版面图象数据进行输入到所述图象预处理单元131或所述信息比对识别单元132的存储缓冲和顺序控制,以及将所述图象预处理单元输出的特征数据或所述信息比对识别单元输出的版面信息数据输出到主计算机的存储缓冲和顺序控制。也就是说,输入输出控制单元133根据系统主计算机的指示对输入的待处理版面图象数据进行判断,以决定这些数据是输入到所述图象预处理单元131进行预处理或直接输入到所述信息比对识别单元132进行比较或者是输入到所述图象预处理单元131进行预处理后,再输入到所述信息比对识别单元132进行比较;同时,在输出结果数据时,判断应当输出所述图象预处理单元输出的特征数据还是所述信息比对识别单元输出的版面信息数据。
当采用图1所示的系统进行票据的识别时,可以采用下述的过程:首先在主计算机3的控制下,光学图象读取设备将扫描的到的待识别票据图象通过其总线2输入到所述输入输出控制单元133,由该单元133根据主计算机的指示判断是否需要进行图象的预处理操作(由主计算机根据待识别票据图象的质量决定),如果不需要,说明待识别票据图象仅需要识别,这时,所述输入输出控制单元133将该待识别的票据图象数据发送给信息比对识别单元132,由其完成图象数据的比对或匹配操作,获得所需要识别版面的信息数据,然后将上述识别后的信息数据作为结果发送到所述输入输出控制单元133,在该单元133的控制下通过总线2发送给根据主计算机3;如果经所述输入输出控制单元133的判断,需要进行图象的预处理操作,这时,所述输入输出控制单元133将该待识别的票据图象数据发送给图象预处理单元131,由其将该待识别的票据图象数据进行进行识别前的图象矫正、噪声清除,特征提取等处理,然后再判断是否对该修正后的图象数据进行比对识别,如果不需要,直接将该修正后的图象发送到所述输入输出控制单元133,在该单元133的控制下通过总线2发送给根据主计算机3,否则,就要在所述输入输出控制单元133的控制下,将该修正后的图象数据,即提取出的特征信息发送给信息比对识别单元132,由其完成图象数据的比对或匹配操作后,将获得的识别后的信息数据作为结果通过所述输入输出控制单元133,经总线2发送给根据主计算机3。需要说明是,实际中采用图1所示的系统进行票据的识别不仅限于上述过程,例如,可以先判断是否需要对待识别的图象信息进行比对识别。
具体说,在本实施例中,所述图象预处理单元131进一步包括:图象畸变矫正模块1311、图象增强及噪声清除模块1312、图象二值化处理模块1313、文字信息提取修补模块1314和文字、线条信息搜集模块1315,参考图4。
所述图象畸变矫正模块1311,用于对的输入的版面图象数据进行黑边切除处理和倾斜矫正处理。本例中,黑边切除是针对图象二值化处理模块1313处理后的二值图象进行的,具体做法是,将版面水平分成上下两个区域,在每个区域内分别从左边、右边开始处理,这样整个区域可分成左上区、左下区、右上区和右下区进行处理,在每个区内采用相同的规则分别进行逐行扫描。通过扫描,对每一个所扫描的行,根据黑行的的判断规则确定该行是否为黑行,即只要该行中的连续的白点个数大于预先给定的白噪声间隙值,则该行不是黑行,否则为黑行。根据每一行的扫描结果,再根据黑边的判断规则,确定应当去除的黑边并去除。所述图象矫正,是对扫描产生的倾斜图象进行矫正。在进行图象倾斜矫正时,可以按照投影法进行,具体方法是:一、计算图象的倾斜角度,二、旋转图象。
计算倾斜角度的方法为:一、粗略搜索,通常可以在-30度至+30度范围内以步长为2度,进行搜索;二、精确搜索,在粗略搜索得到的2度范围内以步长为0.1度进行精确搜索;在角度搜索时主要是利用方向投影统计黑点数,即沿着某一个角度遍历图象,统计整幅图象中,沿该方向的每一行的黑点个数,然后利用统计得到的黑点直方图计算方差,选取方差最大的方向作为倾斜角。
所述图象增强及噪声清除模块1312,用于对输入的版面图象数据进行滤波处理、去除图象中的背景噪声,以及增强图象。这里所述滤波去噪声,是指去除图象中不必要的线条、条纹,以及进行字符的平滑处理、淡化滤镜处理、加浓滤镜处理、清洁平滑处理和补断线处理等。所述去线条,是在图象上,即位图图象,逐行扫描判断,搜索存在的单象素宽线条,再将所有单象素宽线条按相邻规则合并成具有实际象素宽度的粗线条,然后判断该粗线条是否满足去除条件,如果满足,说明是图象识别过程中的多余线条,将其去除,直到消除满足条件的所有线条。如果在去线条过程中,将字符上的部分有效信息去除,为保证字符的完整,这时,还要进行对受损字符的修补。具体的修补过程是,扫描已去除线条的附近字符的分布情况,检测到需要修复字符的具体位置,然后按照缺损部分上下线条长度的平均长度进行修复。
所述去条纹,是将通过对图象的扫描,将一行中长度不大于给定宽度的线条去除。
所述字符的平滑处理,是指对于字符中的点分为去点和补点两个规则,对图象位图逐点进行判断,规则归纳为3×3矩阵,参考图10,该矩阵的中心点为判断点。假设该点的坐标为(I,J),(I,J)点为白点,如果其周围8个点黑点多,比如(I-1,J-1)、(I,J-1)、(I+1,J-1)、(I-1,J)、(I+1,J)都为黑点,则该点应该补为黑点;反之,(I,J)点为黑点,如果其周围8个点白点多,则认为该点为噪音点,应该去掉。
所述淡化滤镜处理,是采用腐蚀的方法消除图象中物体边界点。如果结构元素取3×3的黑点块,腐蚀将使物体的边界沿周边减少一个像素。如果两个物体之间有细小的连通,那么当结构元素足够大时,通过腐蚀运算可以将两个物体分开。腐蚀算法的表达式为:X-S=∩{X[s]|-s∈S},X为目标图象,S为结构元素。首先读入原图象中的一点(称为当前点)的像素值,取以该点为中心的3×3矩阵,如果该点为黑点,并且周围8个点不都是黑点,则该点被赋成白点,即腐蚀掉。
所述加浓滤镜处理,用于增强图象的亮度,提高图象的对比度。具体的方法用公式表达为:X+S=∪{X[s]|s∈S},X为目标图象,S为结构元素。首先读入原图象中的一点(称为当前点)的像素值,取以该点为中心的3×3矩阵,如果该点为白点,并且周围8个点不都是白点,则该点被赋成黑点,即膨胀。实际中也可以采用光线加浓的处理方法,即限定结构元素S的形状。比如向上向左膨胀处理,首先读入原图象中的一点(称为当前点)的像素值,取以该点为中心的3×3矩阵,如果该点为白点,并且左边点、左上点和上边点不都是白点(即只判断3个点),则该点被赋成黑点,即膨胀。
清洁平滑和补断线处理,其规则也归纳为3×3矩阵,该矩阵的中心点为判断点。平滑处理考虑的是去点,即黑点变白点,补断线考虑的是补点,即白点变黑点。补断线处理规则,首先判断矩阵中心点周围8个点当中黑点的个数,其次判断每个黑点位置,根据上述黑点的个数和位置决定是否将该点变成黑点;平滑处理首先考虑周围8个点中白点个数,然后考虑每个白点位置关系,根据上述白点的个数和位置决定是否将该点变成白点。
所述图象二值化处理模块1313,用于对经过图象增强及噪声清除的彩色或灰度版面图象数据转化为只有黑、白二值的版面图象数据。具体可以采用这样的方法实现:首先进行高斯平滑滤波,以去除白点和黑点噪声,防止二值化后产生孤立的白点与黑点;其次确定整幅图象的前景与背景的灰度值,计算二值化阀值,所述阀值可以采用两种,一是全局静态阀值,二是局部动态阀值;最后根据阀值的大小重新设定整幅图象的灰度值,将灰度值大于阀值的象素点设为白点,否则设为黑点。
所述文字信息提取修补模块1314,用于从经过图象二值化处理的版面图象数据中抠取指定位置和大小,并且包含指定文字信息的图象板面,并且清除所抠取图象板面上的线条、黑斑等噪声,以及修补因噪声清除而造成的文字图象缺陷,以及对文字进行倾斜矫正等。文字在二值化后图象中,文字的轨迹肯定是由一系列相邻排列的黑点组成,因此可以把相邻的黑点列为一组,而且每一组相邻排列的黑点都可以用一个矩形将其包围,形成连通块,参考图11。文字信息提取的方法如下:
1、确定所需要文字的大致范围;
2、抠取指定范围的图象;
3、去除线条和底纹;
4、查找所有的连通块;
5、有条件的合并一些排列紧密的连通块;
6、将指定高度和长度的连通块列为一个集合A;
7、在集合A里查找的文字信息。
由于一些文字与线条和底纹是相交的,在上面的操作中,由于存在去除文字中线条和底纹的步骤,所以在去除线条和底纹的时候会将文字的部分抹掉,为了增加图象识别的准确性,还需要进行文字修补,具体的修补方法参考上面所述。
所述文字、线条信息搜集模块1315,用于从二值化图象板面中或抠取的二值化图象板面中搜索图象特征数据和文字特征数据。在本例中,该模块1315用于在二值化后的图象上搜索指定形状、大小的文字,以及搜索指定倾斜角度的线条,例如横线和竖线,用搜索到的文字信息和线条信息作为文字特征数据和图象特征数据。
文字信息的提取可以从所述文字信息提取修补模块1314提供的连通块集合中提取;通过版面的旋转,可以实现横线和竖线的相互转换,因此可以将横线和竖线的查找归结为查找横线或查找竖线。以查找横线为例,参考图12。
开始找线操作前,通常应当设置线条集合变量,和当前线条变量,以对找到的线条进行保存。首先在步骤A11对待测试版面进行逐行逐点扫描,当扫描到黑点b-dot时,转步骤A17进行黑点处理,当扫描到白点w-dot时,转步骤A13进行白点处理。如果扫描到的是黑点b-dot,在步骤A17判断点b-dot是否为一条线段左端点(左端点特征为该点为黑点,前面一点是白点,因此可以通过上述特征判断点b-dot是否为一条线段左端点。),如果是,在步骤A18开始进行找线操作,即开始将该点记入当前线条变量,然后转步骤A11继续扫描后续点的操作;否则,在步骤A19判断点b-dot是否为一条线段中的一点(在进入找线操作时,如果该点是黑点,即可判定其为一条线段中的一点),如果是,直接在步骤A20将该点记入当前线条变量,然后转步骤A11继续扫描下一个点;否则,在步骤A21判断点b-dot是否为一行的末尾,且不是一条线上的点,如果是,说明该点可能是噪声点,与要查找的线条无关,这时则转步骤A11进行下一行扫描;否则,说明点b-dot是否为一行的末尾,且是在一条线上的点,因此转步骤A22做找线完毕处理。
如果扫描到的是白点w-dot,在步骤A13判断点w-dot是否为一条线段中断线部分的白点,如果是,需要进行断线处理,因此在步骤A15进行断线处理,本例中的断线处理是将点w-dot作为黑点b-dot,然后转步骤A12进行黑点处理;否则在步骤A14判断点w-dot之前是否找到线,即该点之前的点是否为一条线的结尾,如果否,说明该点为通常的白点,与线条无关,此时转步骤A11继续扫描后续的点;否则,在步骤A16判断点w-dot是否为一条线段的结束点,即该点前的点为一条线的点,如果是,转步骤A22做找线完毕处理。
在步骤A22对找到的线条进行处理,然后在步骤A23判断待测试版面是否扫描结束,如果未结束,转步骤11继续扫描,否则结束扫描,进行待识别版面的后续处理。
本例中,按照下述步骤判断点w-dot是否为一条线段中断线部分的白点:在断线长度允许的范围内,以当前行为基准线,上下偏移指定行,从该白点的横坐标开始查找黑点,若在这个范围内没有找到黑点,则判定该点是一条线段的结束,否则判定该白点为一条线中的断线部分。
步骤A22的线条处理,是对线段进行合格性的判断,如果找到的是合格的线条,将其保存到线条集合变量中,同时保存的还包括线条的其它特征信息,如线条的长度、坐标等参数,否则放弃该不合格的线条。本例中对线条合格性的判断通过与经验值的比较完成,例如,预先设定短横线条的长度经验值,如9比特,以及长横线条的长度经验值,如120比特。在后续程序的竖线查找中,也要依据预先设定的竖线条的长度经验值,如70比特,进行比较,从而完成竖线合格性的判断。步骤A22的主要作用是去除版面图象中字母或汉字中的噪声线条,便于后续识别。
需要说明的是,图4示出的图象预处理单元131所包括的图象畸变矫正模块1311、图象增强及噪声清除模块1312、图象二值化处理模块1313、文字信息提取修补模块1314和文字、线条信息搜集模块1315,可以根据实际需求不同选择使用。例如,如果需要处理的票据为标准黑白色,可以不采用图象二值化处理模块1313;如果系统所扫描的票面图象能够保证图象形状畸变在预先设置的误差范围内,也可以不采用图象畸变矫正模块1311,等等。
所述信息识别单元132的结构参考图5,它包括:图象比对单元1321和文字识别单元1322。在对图象预处理单元131输出的版面图象数据进行匹配处理时,可以根据其输出的特征数据,选择图象比对单元1321或文字识别单元1322或同时选择二者进行匹配操作,这样能够处理更多种类的票据。具体说,所述图象比对单元1321,用于将版面特征数据中的图象特征数据与版面模板库中的样板数据进行比较,并在输入输出控制单元的控制下输出该比较结果;所述文字识别单元1322,用于将版面特征数据中的文字特征数据与OCR文字模板库中的样板数据进行比较,并在输入输出控制单元的控制下输出该比较结果。本实施例中,上述比较结果首先被传送到所述输入输出控制单元,由该单元按照输出顺序,传送给系统主计算机。
需要指出,在对版面图象中所包含的文字进行处理时,如果所述文字为图象形式,则该文字的识别处理由图象比对单元1321完成;如果所述文字为OCR形式,则该文字的识别处理由文字识别单元1322完成。
当采用所述信息识别单元132进行图形数据的比对识别操作时,首先根据图象预处理单元输入的特征数据判断是否需要进行图象数据的比对识别操作,如果需要,即,特征数据中包含图象特征数据,因此由图象比对单元1321进行图象特征数据与版面模板库中的样板数据的匹配操作,在得到结果后,再根据图象预处理单元输入的特征数据判断是否需要进行文字识别;如果不需要进行图象数据的比对识别操作,则直接根据图象预处理单元输入的特征数据判断是否需要进行文字识别,如果需要文字识别操作,则由所述文字识别单元1322进行文字特征数据与与OCR文字模板库中的样板数据的匹配操作。
所述输入输出控制单元133的结构参考图6,它包括:输入队列1333、输出队列1332和输入输出管理单元1331。设置所述输入、输出队列,目的是实现对于输入、输出的数据实现存储、转发控制,以使本发明的装置具有更强的票据图象处理能力。所述输入队列1333,用于缓存输入的待识别票据图象数据,即按照输入的顺序存储光学图象读取设备通过所述主计算机总线输入的版面图象数据,并按照存储的顺序输出所述版面图象数据到所述图象预处理单元或所述信息比对识别单元;所述输出队列1332,用于缓存输出给系统主计算机的预处理结果或识别结果数据,即按照输出的顺序存储图象预处理单元或信息比对识别单元输出的图象预处理数据或图象版面信息数据,并按照存储的顺序输出这些数据到主计算机;
上述输入、输出队列最好设计成FIFO队列,当然也不排除使用其它队列也能达到同样的效果,如环形队列。
所述输入输出管理单元1331,用于控制所述输入队列按照先进先出的顺序输入待处理的版面图象数据,以及控制所述输出队列按照先进先出的顺序输出预处理结果数据或图象的版面信息数据,其结构图参考图7。为实现这些控制操作,在本实施例中,所述输入输出管理单元1331包括下述几个部分:控制器13311,用于实现上述输入、输出数据在相应队列中的存储、移位和输出操作;由于在核心处理器中,数据的处理和流向是不固定的,因此,在所述输入输出管理单元1331中还提供了第一判断器13312,用于完成输入队列中的版面图象数据在输出时将所述数据输出给图象预处理单元或信息比对识别单元的判断;第二判断器13313,用于完成图象预处理单元输出的图象预处理数据输出给输出队列或信息比对识别单元的判断。
在本发明的其它实施例中,根据核心处理器中的数据处理和流向的不同,所述输入输出管理单元1331不包括所述第一判断器13312和所述第二判断器13313,或只包括其中的一个。
图8是包含本发明第二个实施例框图的OCR系统结构图。图8所示的系统中包括光学图象读取设备和包括总线2的主计算机3,以及本发明所述的票据图象处理装置1。在所述的票据图象处理装置1中,包括内部总线12和通过其相连的存储单元11和4个核心处理器13以及外部总线接口扩展单元4。与图1所示的实施例1相比,本例中增加了外部总线接口扩展单元4,用于桥接所述的核心处理器和主计算机总线,以扩展更多的核心处理器13。当所采用的核心处理器13为2个以上时,就需要采用外部总线接口扩展单元4。因此,在采用外部总线接口扩展单元的本发明其它实施例中,所连接的核心处理器13为2个,也可以为3个、5个、6个等,这取决于对本发明所需的图象数据处理能力。所述存储单元11主要用于存储OCR文字模板库、版面模板库和票据图象处理程序。所述的OCR文字模板库、版面模板库的模板数据是系统在主计算机的控制下预先根据标准的票据所生成的,包含了票据图象中的特征线条、特征点、以及特征文字信息等能够代表票据图象版面的特征。在所述的4个核心处理器13中,每个核心处理器都用于接收光学图象读取设备通过所述主计算机总线输入的版面图象数据,对该版面图象数据进行版面预处理。根据主计算机在通过其总线输入光学图象读取设备读取的票据版面图象数据时所给出的处理指令,将经过版面预处理后的版面图象数据与所述存储单元中的版面模板库以及OCR文字模板库中的样板数据进行比较,将比较结果或直接将预处理后的版面图象数据反馈给主计算机。这样通过将输入的版面图象数据与预先定义的版面模板数据进行匹配,即可完成票据版面识别功能。
所述外部总线接口扩展单元4的类型与主计算机总线的类型相适应或相匹配。例如采用PCI、CPCI、SCSI、USB、1349等通用的外部总线接口。
本例中的4个核心处理器可以实现并行的图象数据处理,从而提高数据处理的能力,所采用的控制方法是,在所述4个核心处理器中运行同一套处理程序,上位的主计算机会根据各个核心处理器的工作负载的大小,将票据图象处理任务下达给相对空闲的核心处理器处理。实际中,并不局限于这种方法,例如,可以使每个核心处理器完成不同的处理功能,流水作业,前一个DSP完成的结果交给下一个DSP处理,由此实现4个核心处理器的并行操作。
另外,在本例中也采用了用于对存储单元和核心处理器进行过流保护、过压保护、抗干扰和防静电保护,以及提供稳压保护的电源管理单元15。和用于对主计算机输入到各核心处理器的图象预处理单元或所述信息比对识别单元的版面图象数据进行解密操作,以及对各核心处理器的图象预处理单元或信息比对识别单元输出到主计算机的图象预处理数据或图象版面信息数据进行加密操作的加密单元14。
需要说明的是,与第一个实施例相比,在第二个实施例中增加了外部总线接口扩展单元4,因此也扩展了核心处理器13的数量,但是,存储单元11、核心处理器13、电源管理单元15以及加密单元14的结构都是相同的,因此不在赘述。
在上述本发明所述的实施例中,最关键的部件为核心处理器,实际中可以采用数字信号处理器DSP实现,例如采用TI公司的TMS320C6415系列DSP。

Claims (13)

1、一种用于光学字符识别系统的票据图象处理装置,所述光学字符识别系统包括光学图象读取设备和包括总线的主计算机,其特征在于,所述票据图象处理装置包括:
内部总线;以及,
通过所述内部总线相互连接的用于存储光学识别字符(OCR)文字模板库、版面模板库和票据图象处理程序的存储单元;和,
核心处理器,用于接收光学图象读取设备通过所述主计算机总线输入的版面图象数据,对该版面版面图象数据进行版面预存储单元中的版面模板库以及OCR文字模板库中的样板数据进行比较处理,将比较结果或直接将预处理后的版面数据反馈给主计算机。
2、根据权利要求1所述的票据图象处理装置,其特征在于,所述存储单元包括:
模板数据存储单元,用于存储OCR文字模板库和版面模板库的数据;
模板索引单元,用于存储文字模板和图象模板的编号和地址,提供对于模板数据查询的索引信息。
3、根据权利要求1所述的票据图象处理装置,其特征在于,所述核心处理器包括:
图象预处理单元,用于对输入的版面行识别前的修正处理,并提取出版面图象数据的版面特征数据输出,所述版面特征数据包括图象特征数据和文字特征数据;
信息比对识别单元,用于将输入图象的版面特征数据与预先存储的文字模板数据和图象模板数据进行比较,得到输入图象的版面信息输出;
输入输出控制单元,用于对光学图象读取设备通过所述主计算机总线输入的版面图象数据进行输入到所述图象预处理单元或所述信息比对识别单元的缓冲和顺序控制,以及将所述图象预处理单元输出的特征数据或所述信息比对识别单元输出的版面信息数据输出到主计算机的缓冲和顺序控制。
4、根据权利要求3所述的票据图象处理装置,其特征在于,所述图象预处理单元包括:
图象畸变矫正模块,用于对的输入的版面图象数据进行黑边切除处理和倾斜矫正处理;
图象增强及噪声清除模块,用于对输入的版面图象数据进行滤波处理,去除图象中的背景噪声,以及增强图象;
图象二值化处理模块,用于对经过图象增强及噪声清除的彩色或灰度版面图象数据转化为只有黑、白二值的版面图象数据;
文字信息提取修补模块,用于从经过图象二值化处理的版面图象数据中抠取指定位置和大小,并且包含指定文字信息的图象板面,并且清除所抠取图象板面上的噪声,以及修补因噪声清除而造成的文字图象缺陷;
文字、线条信息搜集模块,用于从二值化图象板面中或抠取的二值化图象板面中搜索图象特征数据和文字特征数据。
5、根据权利要求3所述的票据图象处理装置,其特征在于,所述信息识别单元包括:
图象比对单元,用于将版面特征数据中的图象特征数据与版面模板库中的样板数据进行比较,并在输入输出控制单元的控制下输出该比较结果;
文字识别单元,用于将版面特征数据中的文字特征数据与OCR文字模板库中的样板数据进行比较,并在输入输出控制单元的控制下输出该比较结果。
6、根据权利要求3所述的票据图象处理装置,其特征在于,所述输入输出控制单元包括:
输入队列,用于按照输入的顺序存储光学图象读取设备通过所述主计算机总线输入的版面图象数据,并按照存储的顺序输出所述版面图象数据到所述图象预处理单元或所述信息比对识别单元;
输出队列,用于按照输出的顺序存储图象预处理单元或信息比对识别单元输出的图象预处理数据或图象版面信息数据,并按照存储的顺序输出这些数据到主计算机;
输入输出管理单元,用于控制所述输入队列按照先进先出的顺序输入待处理的版面图象数据,控制所述输出队列按照先进先出的顺序输出预处理结果数据或图象的版面信息数据。
7、根据权利要求6所述的票据图象处理装置,其特征在于,所述输入输出管理单元还包括:
第一判断器,用于完成输入队列中的版面图象数据输出给图象预处理单元或信息比对识别单元的判断;
第二判断器,用于完成图象预处理单元输出的图象预处理数据输出给输出队列或信息比对识别单元的判断。
8、根据权利要求1、2、3、4、5、6或7所述的票据图象处理装置,其特征在于,所述装置还包括:
电源管理单元,用于对存储单元和核心处理器进行过流保护、过压保护、抗干扰和防静电保护,以及提供稳压保护。
9、根据权利要求8所述的票据图象处理装置,其特征在于,所述装置还包括加密单元,用于对主计算机输入到所述图象预处理单元或所述信息比对识别单元的版面图象数据进行解密操作,以及对图象预处理单元或信息比对识别单元输出到主计算机的图象预处理数据或图象版面信息数据进行加密操作。
10、一种用于光学字符识别系统的票据图象处理装置,所述光学字符识别系统包括光学图象读取设备和包括总线的主计算机,其特征在于,所述票据图象处理装置包括:
内部总线;以及,
通过所述内部总线相互连接的用于存储光学识别字符(OCR)文字模板库、版面模板库和票据图象处理程序的存储单元;和,
至少二个核心处理器,每个核心处理器用于接收光学图象读取设备通过所述主计算机总线输入的版面图象数据,对该版面图象数据进行版面预处理,与所述存储单元中的版面模板库以及OCR文字模板库中的样板数据进行比较,将比较结果或直接将预处理后的版面数据反馈给主计算机;
外部总线接口扩展单元,用于桥接所述的核心处理器和主计算机总线。
11、根据权利要求10所述的票据图象处理装置,其特征在于,所述装置还包括:
电源管理单元,用于对存储单元和核心处理器进行过流保护、过压保护、抗干扰和防静电保护,以及提供稳压保护。
12、根据权利要求11所述的票据图象处理装置,其特征在于,所述装置还包括加密单元,用于对主计算机输入到各核心处理器的图象预处理单元或所述信息比对识别单元的版面图象数据进行解密操作,以及对各核心处理器的图象预处理单元或信息比对识别单元输出到主计算机的图象预处理数据或图象版面信息数据进行加密操作。
13、根据权利要求10所述的票据图象处理装置,其特征在于,所述外部总线接口扩展单元类型与主计算机总线的类型相适应。
CN 03148249 2003-06-27 2003-06-27 票据图象处理装置 Expired - Fee Related CN1240021C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 03148249 CN1240021C (zh) 2003-06-27 2003-06-27 票据图象处理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 03148249 CN1240021C (zh) 2003-06-27 2003-06-27 票据图象处理装置

Publications (2)

Publication Number Publication Date
CN1482572A true CN1482572A (zh) 2004-03-17
CN1240021C CN1240021C (zh) 2006-02-01

Family

ID=34156233

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 03148249 Expired - Fee Related CN1240021C (zh) 2003-06-27 2003-06-27 票据图象处理装置

Country Status (1)

Country Link
CN (1) CN1240021C (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102156866A (zh) * 2011-03-09 2011-08-17 深圳百维达科技有限公司 路牌识别系统及路牌识别方法
CN102236782A (zh) * 2010-04-30 2011-11-09 陈斌 一种证书证件文字识别方法
CN102968638A (zh) * 2011-08-31 2013-03-13 上海夏尔软件有限公司 基于关键字光学字符识别的影像清晰度判断的方法
CN103034848A (zh) * 2012-12-19 2013-04-10 方正国际软件有限公司 一种表单类型的识别方法
CN103093219A (zh) * 2013-01-28 2013-05-08 中国航空结算有限责任公司 基于ocr技术的票证票号识别方法
CN103135894A (zh) * 2011-11-24 2013-06-05 冲电气工业株式会社 票据数据输入装置以及票据数据输入方法
CN103440507A (zh) * 2013-09-03 2013-12-11 北京中电普华信息技术有限公司 一种票据信息验审设备和一种对票据信息进行验审的方法
CN104537339A (zh) * 2014-12-19 2015-04-22 汉王科技股份有限公司 信息识别方法和信息识别系统
CN104966348A (zh) * 2015-06-18 2015-10-07 辰通智能设备(深圳)有限公司 一种票据图像要素完整性检测方法及系统
CN105069898A (zh) * 2015-07-15 2015-11-18 广州敦和信息技术有限公司 一种发票字条自动定位的方法及装置
CN105095842A (zh) * 2014-05-22 2015-11-25 阿里巴巴集团控股有限公司 一种单据的信息识别的方法和装置
CN105956590A (zh) * 2016-04-27 2016-09-21 泰合鼎川物联科技(北京)股份有限公司 字符识别方法和字符识别系统
CN106022364A (zh) * 2016-05-13 2016-10-12 邓昌顺 一种新的票据分类方法
CN107368800A (zh) * 2017-07-13 2017-11-21 上海携程商务有限公司 基于传真识别的订单确认方法、系统、设备及存储介质
CN110188755A (zh) * 2019-05-30 2019-08-30 北京百度网讯科技有限公司 一种图像识别的方法、装置和计算机可读存储介质
CN111091499A (zh) * 2018-10-24 2020-05-01 方正国际软件(北京)有限公司 一种移动终端图像修正的方法及装置
WO2020098078A1 (zh) * 2018-11-12 2020-05-22 平安科技(深圳)有限公司 Ocr训练样本的生成方法、装置、设备及可读存储介质

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102236782A (zh) * 2010-04-30 2011-11-09 陈斌 一种证书证件文字识别方法
CN102156866A (zh) * 2011-03-09 2011-08-17 深圳百维达科技有限公司 路牌识别系统及路牌识别方法
CN102968638B (zh) * 2011-08-31 2016-06-08 上海夏尔软件有限公司 基于关键字光学字符识别的影像清晰度判断的方法
CN102968638A (zh) * 2011-08-31 2013-03-13 上海夏尔软件有限公司 基于关键字光学字符识别的影像清晰度判断的方法
CN103135894A (zh) * 2011-11-24 2013-06-05 冲电气工业株式会社 票据数据输入装置以及票据数据输入方法
CN103135894B (zh) * 2011-11-24 2016-08-03 冲电气工业株式会社 票据数据输入装置以及票据数据输入方法
CN103034848A (zh) * 2012-12-19 2013-04-10 方正国际软件有限公司 一种表单类型的识别方法
CN103034848B (zh) * 2012-12-19 2016-07-06 方正国际软件有限公司 一种表单类型的识别方法
CN103093219A (zh) * 2013-01-28 2013-05-08 中国航空结算有限责任公司 基于ocr技术的票证票号识别方法
CN103440507A (zh) * 2013-09-03 2013-12-11 北京中电普华信息技术有限公司 一种票据信息验审设备和一种对票据信息进行验审的方法
CN105095842A (zh) * 2014-05-22 2015-11-25 阿里巴巴集团控股有限公司 一种单据的信息识别的方法和装置
CN105095842B (zh) * 2014-05-22 2018-12-11 口碑控股有限公司 一种单据的信息识别的方法和装置
CN104537339A (zh) * 2014-12-19 2015-04-22 汉王科技股份有限公司 信息识别方法和信息识别系统
CN104537339B (zh) * 2014-12-19 2018-04-10 汉王科技股份有限公司 信息识别方法和信息识别系统
CN104966348A (zh) * 2015-06-18 2015-10-07 辰通智能设备(深圳)有限公司 一种票据图像要素完整性检测方法及系统
CN104966348B (zh) * 2015-06-18 2017-10-24 深圳辰通智能股份有限公司 一种票据图像要素完整性检测方法及系统
CN105069898B (zh) * 2015-07-15 2018-03-30 广州敦和信息技术有限公司 一种发票字条自动定位的方法及装置
CN105069898A (zh) * 2015-07-15 2015-11-18 广州敦和信息技术有限公司 一种发票字条自动定位的方法及装置
CN105956590A (zh) * 2016-04-27 2016-09-21 泰合鼎川物联科技(北京)股份有限公司 字符识别方法和字符识别系统
CN106022364A (zh) * 2016-05-13 2016-10-12 邓昌顺 一种新的票据分类方法
CN107368800A (zh) * 2017-07-13 2017-11-21 上海携程商务有限公司 基于传真识别的订单确认方法、系统、设备及存储介质
CN107368800B (zh) * 2017-07-13 2020-02-21 上海携程商务有限公司 基于传真识别的订单确认方法、系统、设备及存储介质
CN111091499A (zh) * 2018-10-24 2020-05-01 方正国际软件(北京)有限公司 一种移动终端图像修正的方法及装置
CN111091499B (zh) * 2018-10-24 2023-05-23 方正国际软件(北京)有限公司 一种移动终端图像修正的方法及装置
WO2020098078A1 (zh) * 2018-11-12 2020-05-22 平安科技(深圳)有限公司 Ocr训练样本的生成方法、装置、设备及可读存储介质
CN110188755A (zh) * 2019-05-30 2019-08-30 北京百度网讯科技有限公司 一种图像识别的方法、装置和计算机可读存储介质

Also Published As

Publication number Publication date
CN1240021C (zh) 2006-02-01

Similar Documents

Publication Publication Date Title
CN1240021C (zh) 票据图象处理装置
CN104361312B (zh) 一种对图像进行字符识别的方法和装置
CN107766854B (zh) 一种基于模板匹配实现快速页码识别的方法
CN106960208A (zh) 一种仪表液晶数字自动切分和识别的方法及系统
CN105283884A (zh) 对移动设备捕获的数字图像中的对象进行分类
CN108038484B (zh) 空心验证码快速识别方法
CN107240185B (zh) 一种冠字号识别方法、装置、设备及存储介质
CN110427909B (zh) 一种移动端驾驶证检测方法、系统及电子设备和存储介质
CN113191358B (zh) 金属零件表面文本检测方法和系统
CN108446702B (zh) 一种图像字符分割方法、装置、设备及存储介质
CN105184294A (zh) 一种基于像素追踪的倾斜文字判断识别方法
CN1161688C (zh) 字符处理装置及其方法
CN114998217A (zh) 确定玻璃基板缺陷等级的方法、计算机设备及存储介质
CN113393430B (zh) 用于风机叶片缺陷检测的热成像图像增强训练方法和装置
CN109271882B (zh) 一种区分颜色的手写体汉字提取方法
CN1217292C (zh) 票据图象版面识别方法
CN1489745A (zh) 图像识别方法及实现该方法的设备
CN114550173A (zh) 图像预处理方法、装置、电子设备以及可读存储介质
CN113537184A (zh) Ocr模型训练方法、装置、计算机设备、存储介质
CN110807348A (zh) 基于贪婪算法的文档图像中干扰线的去除方法
Tong et al. Document image binarization based on NFCM
Tong et al. Correction of perspective text image based on gradient method
CN110674779B (zh) 一种基于特征融合的单目远红外行人检测方法
CN114037700A (zh) 面板缺陷检测方法、装置、电子设备及存储介质
CN101930593A (zh) 单一物体影像萃取系统及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee