CN110895696A - 一种图像信息提取方法和装置 - Google Patents
一种图像信息提取方法和装置 Download PDFInfo
- Publication number
- CN110895696A CN110895696A CN201911070071.8A CN201911070071A CN110895696A CN 110895696 A CN110895696 A CN 110895696A CN 201911070071 A CN201911070071 A CN 201911070071A CN 110895696 A CN110895696 A CN 110895696A
- Authority
- CN
- China
- Prior art keywords
- information
- character
- image
- target image
- character information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 45
- 238000001514 detection method Methods 0.000 claims abstract description 59
- 238000000034 method Methods 0.000 claims abstract description 34
- 238000003709 image segmentation Methods 0.000 claims abstract description 27
- 238000004422 calculation algorithm Methods 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 10
- 230000011218 segmentation Effects 0.000 claims description 9
- 210000004907 gland Anatomy 0.000 abstract description 5
- 239000000284 extract Substances 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 17
- 230000008569 process Effects 0.000 description 11
- 238000012545 processing Methods 0.000 description 11
- 238000007639 printing Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000008030 elimination Effects 0.000 description 3
- 238000003379 elimination reaction Methods 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000012015 optical character recognition Methods 0.000 description 3
- 239000003086 colorant Substances 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种图像信息提取方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:对目标图像进行文字检测与识别,得到目标图像的文本行以及文本行的字符信息;将字符信息与设定的预印字符模板进行匹配,以确定预印字符信息在文本行的位置;对预印字符信息所在位置对应的文本行图像进行图像分割,以定位预印字符信息的像素位置,在像素位置提取预印字符颜色信息;使用目标图像的背景颜色信息替换预印字符颜色信息,对替换颜色后的目标图像进行文字检测与识别,得到打印字符信息。该方法提取预印字符颜色信息,用背景颜色替换预印字符颜色信息后,进行文字检测与识别,获得打印字符信息,提高了压盖区域信息识别的完整性和准确度。
Description
技术领域
本发明涉及计算机领域,尤其涉及一种图像信息提取方法和装置。
背景技术
票据识别OCR(Optical Character Recognition,光学字符识别)系统是一款通用的数据批量采集软件,适用于具有表格特征的表单、问卷、单证、保险单等的信息提取。具体地,该系统通过扫描、图像处理、自动分类、OCR技术,可以准确、快速、真实地提取表格图像中的数据信息并保存,而且可以将数据结果导出为标准的数据格式,如Excel表,与ERP(Enterprise Resource Planning,企业资源计划)、CRM(Customer RelationshipManagement,客户关系管理)等系统能够无缝结合。
各种票据票面中存在一个普遍现象,即存在“压盖”问题,包括两个方面,一是印章随意压盖导致其与打印信息重叠,二是票据摆放不标准导致打印信息与预印信息重叠,该现象会极大地降低票据打印信息提取的准确率。现有的票据识别技术,需要先人工设定印章和预印信息的颜色信息,进而对票据图像进行处理,降低印章以及预印信息对打印信息的识别所带来的影响。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
由于打印方式不同、图像采集手段不同,人工设定的颜色信息往往严重偏离真实票据,导致票据干扰信息的消除效果较差,压盖区域的文字检测残缺,文字识别的准确率低。
发明内容
有鉴于此,本发明实施例提供一种图像信息提取方法和装置,利用预印字符模板和图像分割技术提取预印字符颜色信息,并使用目标图像的背景颜色信息替换预印字符颜色信息,之后对替换颜色后的目标图像进行文字检测与识别,即可获得打印字符信息,提高了压盖区域的信息识别的完整性和准确度。
为实现上述目的,根据本发明实施例的一个方面,提供了一种图像信息提取方法。
本发明实施例的一种图像信息提取方法,包括:对目标图像进行文字检测与识别,得到所述目标图像的文本行以及所述文本行的字符信息;将所述字符信息与设定的预印字符模板进行匹配,以确定预印字符信息在所述文本行的位置;对所述预印字符信息所在位置对应的文本行图像进行图像分割,以定位所述预印字符信息的像素位置,在所述像素位置提取预印字符颜色信息;使用所述目标图像的背景颜色信息替换所述预印字符颜色信息,对替换颜色后的目标图像进行文字检测与识别,得到打印字符信息。
可选地,所述将所述字符信息与设定的预印字符模板进行匹配,包括:查找预印字符模板中是否存在所述字符信息;在所述预印字符模板中存在所述字符信息的情况下,确认所述字符信息为所述预印字符信息。
可选地,所述对所述预印字符信息所在位置对应的文本行图像进行图像分割,以定位所述预印字符信息的像素位置,包括:采用图像分割算法,对所述预印字符信息所在位置对应的文本行图像进行二值化分割,以定位所述预印字符信息的像素位置。
可选地,所述对替换颜色后的目标图像进行文字检测与识别的步骤之前,所述方法还包括:定位所述目标图像中印章的位置,以提取印章颜色信息;使用所述目标图像的背景颜色信息替换所述印章颜色信息。
可选地,所述定位所述目标图像中印章的位置,包括:采用椭圆检测算法,确定所述目标图像中印章的外边缘信息和内边缘信息;其中,所述外边缘信息和所述内边缘信息均包括中心坐标、长轴半径、短轴半径以及长轴与水平线的夹角。
可选地,所述方法还包括:获取所述目标图像的颜色通道,以根据所述颜色通道统计所述目标图像的背景颜色信息。
可选地,所述目标图像为票据图像。
为实现上述目的,根据本发明实施例的另一方面,提供了一种图像信息提取装置。
本发明实施例的一种图像信息提取装置,包括:第一检测识别模块,用于对目标图像进行文字检测与识别,得到所述目标图像的文本行以及所述文本行的字符信息;位置确定模块,用于将所述字符信息与设定的预印字符模板进行匹配,以确定所述预印字符信息在所述文本行的位置;颜色提取模块,用于对所述预印字符信息所在位置对应的文本行图像进行图像分割,以定位所述预印字符信息的像素位置,在所述像素位置提取预印字符颜色信息;第二检测识别模块,用于使用所述目标图像的背景颜色信息替换所述预印字符颜色信息,对替换颜色后的目标图像进行文字检测与识别,得到打印字符信息。
可选地,所述位置确定模块,还用于:查找预印字符模板中是否存在所述字符信息;以及在所述预印字符模板中存在所述字符信息的情况下,确认所述字符信息为所述预印字符信息。
可选地,所述颜色提取模块,还用于:采用图像分割算法,对所述预印字符信息所在位置对应的文本行图像进行二值化分割,以定位所述预印字符信息的像素位置。
可选地,所述装置还包括:印章消除模块,用于定位所述目标图像中印章的位置,以提取印章颜色信息;以及使用所述目标图像的背景颜色信息替换所述印章颜色信息。
可选地,所述印章消除模块,还用于:采用椭圆检测算法,确定所述目标图像中印章的外边缘信息和内边缘信息;其中,所述外边缘信息和所述内边缘信息均包括中心坐标、长轴半径、短轴半径以及长轴与水平线的夹角。
可选地,所述装置还包括:背景颜色获取模块,用于获取所述目标图像的颜色通道,以根据所述颜色通道统计所述目标图像的背景颜色信息。
为实现上述目的,根据本发明实施例的再一方面,提供了一种电子设备。
本发明实施例的一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例的一种图像信息提取方法。
为实现上述目的,根据本发明实施例的再一方面,提供了一种计算机可读介质。
本发明实施例的一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明实施例的一种图像信息提取方法。
上述发明中的一个实施例具有如下优点或有益效果:利用预印字符模板和图像分割技术提取预印字符颜色信息,并使用目标图像的背景颜色信息替换预印字符颜色信息,之后对替换颜色后的目标图像进行文字检测与识别,即可获得打印字符信息,提高了压盖区域的信息识别的完整性和准确度;使用预印字符模板定位预印字符信息的文本行位置,使用二值化分割定位预印字符的像素位置,不依赖于人工经验,适用性强,计算复杂度低,且能够实时处理;通过定位目标图像中印章的位置,进而提取印章颜色信息,并使用目标图像的背景颜色信息替换印章颜色信息,消除了目标图像的干扰信息,进一步提高了压盖区域的信息识别的完整性和准确度;利用椭圆检测算法定位目标图像中印章的位置,实现简单,适用性强,计算复杂度低;完整、准确地提取了票据图像压盖区域的信息,适用性强,实时性高。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施例一的图像信息提取方法的主要步骤的示意图;
图2是根据本发明实施例二的图像信息提取方法的主要流程示意图;
图3是根据本发明实施例二的图像信息提取方法的压盖区域的预印字符信息消除结果示意图;
图4是根据本发明实施例三的图像信息提取方法的主要流程示意图;
图5是根据本发明实施例三的图像信息提取方法的压盖区域的印章消除结果示意图;
图6是根据本发明实施例的图像信息提取装置的主要模块的示意图;
图7是本发明实施例可以应用于其中的示例性系统架构图;
图8是适用于来实现本发明实施例的电子设备的计算机装置的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本发明实施例一的图像信息提取方法的主要步骤的示意图。如图1所示,本发明实施例一的图像信息提取方法,主要包括如下步骤:
步骤S101:对目标图像进行文字检测与识别,得到所述目标图像的文本行以及所述文本行的字符信息。其中,目标图像为包括预印字符信息和非预印字符信息(即打印字符信息)的图像,实施例中可以是票据图像。此处的字符可以是文字、数字、字母、符号等。对目标图像进行文字检测,以检测出其中的至少一个文本行;然后对每个文本行进行文字识别,得到每个文本行的字符信息。其中,文本行是由一个或者多个文字字符构成的直线型(包括水平或倾斜两种情况)区域。
步骤S102:将所述字符信息与设定的预印字符模板进行匹配,以确定预印字符信息在所述文本行的位置。根据自身需求构建包含预印字符信息的预印字符模板,并将预印字符模板进行存储。在识别出文本行的当前字符信息后,查找预印字符模板中是否存在该当前字符信息,如果存在,则确认该当前字符信息为预印字符信息,即可定位预印字符信息在文本行的位置;如果不存在,则确认该当前字符信息为打印字符信息,不做处理。
步骤S103:对所述预印字符信息所在位置对应的文本行图像进行图像分割,以定位所述预印字符信息的像素位置,在所述像素位置提取预印字符颜色信息。采用图像分割算法,对预印字符信息所在文本行位置对应的文本行图像进行二值化分割,以获取预印字符信息的像素位置,进而在该像素位置提取对应的预印字符的颜色信息。
步骤S104:使用所述目标图像的背景颜色信息替换所述预印字符颜色信息,对替换颜色后的目标图像进行文字检测与识别,得到打印字符信息。预先获取目标图像的颜色通道,以根据颜色通道统计目标图像的背景颜色信息。使用目标图像的背景颜色信息替换预印字符的颜色信息,以消除压盖区域中的预印字符信息;之后对替换颜色后的目标图像再次进行文字检测与识别,即可得到目标图像的打印字符信息。
实施例二中通过预设预印字符模板的方式,完成票据图像中预印字符颜色以及位置的提取,进而提取预印字符信息与打印字符信息重叠区域的打印字符信息。上述方式代替传统的采用票据图像模板的方法,既节约了系统存储空间,也简化了系统计算复杂度,同时适用性强。具体实现过程如下。
图2是根据本发明实施例二的图像信息提取方法的主要流程示意图。如图2所示,本发明实施例二的图像信息提取方法,主要包括如下步骤:
步骤S201:获取票据图像的颜色通道,以根据颜色通道统计票据图像的背景颜色信息。其中,票据图像可以是门诊收费票据图像、增值税票据图像、定额发票图像等,包含预印字符信息和打印字符信息的图像。以票据图像的颜色通道为红(Red,R)、绿(Green,G)、蓝(Blue,B)三个颜色通道为例,分别计算票据图像的R、G、B三个颜色通道的中值,将这三个中值数作为票据图像的背景颜色信息。
步骤S202:对票据图像进行文字检测与识别,得到票据图像的文本行以及各文本行的字符信息。对票据图像进行文字检测,以检测出其中的至少一个文本行;然后对每个文本行进行文字识别,得到每个文本行的字符信息。
步骤S203:将得到的字符信息与设定的预印字符模板进行匹配,以确定预印字符信息在文本行的位置。实施例中,根据票据类型设置对应的预印字符模板。此处的票据类型比如门诊收费票据、增值税票据、定额发票等。预印字符模板用于存储票据图像的预印字符信息。以门诊收费票据为例,该预印字符模板可以包括:姓名、社保卡号、医保类型、就诊科室、金额合计、机制号等字段。
实施例中,在与票据图像的类型相一致的预印字符模板中查找是否存在当前文本行的当前字符信息,如果存在,则可以确认该文本行存在预印字符信息,进而定位预印字符信息在文本行的位置。
步骤S204:对预印字符信息所在位置对应的文本行图像进行图像分割,以定位预印字符信息的像素位置。采用图像分割算法,对预印字符信息所在文本行位置对应的文本行图像进行二值化分割,从而得到预印字符信息的像素位置。其中,二值化是指将原始图像上的像素点的灰度值设置为0或者255,以使得到的图像呈现出明显的黑白效果。文本行图像是指预印字符信息所在的文本行对应的图像。
实施例中,可以使用OTSU算法进行图像分割。OTSU算法即最大类间方差算法,是由日本学者大津(Nobuyuki Otsu)提出,是一种自适应的阈值确定方法。该算法假设图像像素能够根据阈值被分成背景像素和目标像素两部分,然后计算最佳阈值来区分这两类像素,使得这两类像素区分度最大。
步骤S205:在预印字符信息的像素位置提取预印字符颜色信息,使用票据图像的背景颜色信息替换预印字符颜色信息。确定预印字符信息的像素位置后,根据该像素位置返回到原始的票据图像,即可提取预印字符信息对应的颜色信息,之后使用票据图像的背景颜色信息替换该像素位置的预印字符颜色信息,以消除票据图像中预印字符信息的颜色,降低不同颜色的预印信息对压盖区域打印信息的提取所造成的影响。
步骤S206:对替换颜色后的票据图像进行文字检测与识别,得到打印字符信息。对消除预印字符颜色信息的票据图像再次进行文字检测与识别,即可得到预印字符信息与打印字符信息重叠区域的打印字符信息。
图3是根据本发明实施例二的图像信息提取方法的压盖区域的预印字符信息消除结果示意图。如图3所示,按照实施例二的图像信息提取方法,该票据图像中预打印的姓名、年龄、就诊卡号等信息已经被消除,保留了西药费、总费用、医保费用等后续打印信息。
实施例三采用图像颜色分层的思想,将票据图像分为印章、预印字符信息、打印字符信息以及图像背景四类,通过椭圆检测算法提取票据图像的印章颜色信息,通过预印字符模板及图像分割算法提取预印字符颜色信息,再分别将印章、预印字符信息用图像背景颜色替代,就能够检测并识别出票据图像全部的打印字符信息,提高整张票据数据格式化输出的准确率。具体实现过程如下。
图4是根据本发明实施例三的图像信息提取方法的主要流程示意图。如图4所示,本发明实施例三的图像信息提取方法,主要包括如下步骤:
步骤S401:获取票据图像的颜色通道,以根据颜色通道统计票据图像的背景颜色信息。该步骤的实现过程与步骤S201相同。
步骤S402:定位票据图像中印章的位置,以提取印章颜色信息。票据图像中印章的定位方式有多种,比如可以采用椭圆检测算法,确定票据图像中印章的边缘信息,此边缘信息包括椭圆的中心坐标(x,y)、长轴半径(a)、短轴半径(b)以及长轴与水平线的夹角(θ)。一般情况下,印章包括外边缘和内边缘,相应的此处需确定外边缘信息和内边缘信息。之后根据印章的外边缘信息和内边缘信息,确定印章位置,进而统计印章位置对应票据图像中每个像素的颜色,即可得到印章颜色信息。
实施例中,椭圆检测算法比如可以是基于Arc支撑线分割的椭圆检测算法,即High-quality Ellipse Detection Based on Arc-support Line Segments。该算法的主要流程包括:将检测到的Arc-support Line Segments连接并分组;初始椭圆候选集合生成;椭圆聚类,将可能来自同一个椭圆的候选者合并;候选椭圆验证,剔除质量不高的椭圆。
步骤S403:使用票据图像的背景颜色信息替换印章颜色信息。使用票据图像的背景颜色信息替换印章颜色信息,以消除票据图像中印章的颜色,降低了不同颜色印章对压盖区域打印信息的提取所造成的影响。图5是根据本发明实施例三的图像信息提取方法的压盖区域的印章消除结果示意图。如图5所示,按照实施例三的图像信息提取方法,该票据图像中椭圆印章、圆形印章已经被消除。
步骤S404:对替换颜色后的票据图像进行文字检测与识别,得到票据图像的文本行以及各文本行的字符信息。该步骤的实现过程与步骤S202相同。该步骤的文字检测与识别主要用于从步骤S403得到的票据图像中提取预印字符信息,分析其颜色特征,方便后续对预印字符信息进行消除。
步骤S405:将得到的字符信息与设定的预印字符模板进行匹配,以确定预印字符信息在文本行的位置。该步骤的实现过程与步骤S203相同。
步骤S406:对预印字符信息所在位置对应的文本行图像进行图像分割,以定位预印字符信息的像素位置。该步骤的实现过程与步骤S204相同。
步骤S407:在预印字符信息的像素位置提取预印字符颜色信息,使用票据图像的背景颜色信息替换预印字符颜色信息。该步骤的实现过程与步骤S205相同。
步骤S408:对替换颜色后的票据图像进行文字检测与识别,得到打印字符信息。该步骤的文字检测与识别主要用于提取打印字符信息,辅助后续进行结构化输出。对消除印章颜色和预印字符颜色信息的票据图像再次进行文字检测与识别,即可得到票据图像全部的打印字符信息,包括印章与打印字符信息重叠区域,以及预印字符信息与打印字符信息重叠区域的打印字符信息。
通过本发明实施例的图像信息提取方法可以看出,利用预印字符模板和图像分割技术提取预印字符颜色信息,并使用目标图像的背景颜色信息替换预印字符颜色信息,之后对替换颜色后的目标图像进行文字检测与识别,即可获得打印字符信息,提高了压盖区域的信息识别的完整性和准确度;使用预印字符模板定位预印字符信息的文本行位置,使用二值化分割定位预印字符的像素位置,不依赖于人工经验,适用性强,计算复杂度低,且能够实时处理;通过定位目标图像中印章的位置,进而提取印章颜色信息,并使用目标图像的背景颜色信息替换印章颜色信息,消除了目标图像的干扰信息,进一步提高了压盖区域的信息识别的完整性和准确度;利用椭圆检测算法定位目标图像中印章的位置,实现简单,适用性强,计算复杂度低;完整、准确地提取了票据图像压盖区域的信息,适用性强,实时性高。
图6是根据本发明实施例的图像信息提取装置的主要模块的示意图。如图6所示,本发明实施例的图像信息提取装置600,主要包括:
第一检测识别模块601,用于对目标图像进行文字检测与识别,得到所述目标图像的文本行以及所述文本行的字符信息。其中,目标图像为包括预印字符信息和非预印字符信息(即打印字符信息)的图像,实施例中可以是票据图像。此处的字符可以是文字、数字、字母、符号等。对目标图像进行文字检测,以检测出其中的至少一个文本行;然后对每个文本行进行文字识别,得到每个文本行的字符信息。其中,文本行是由一个或者多个文字字符构成的直线型(包括水平或倾斜两种情况)区域。
位置确定模块602,用于将所述字符信息与设定的预印字符模板进行匹配,以确定预印字符信息在所述文本行的位置。根据自身需求构建包含预印字符信息的预印字符模板,并将预印字符模板进行存储。在识别出文本行的当前字符信息后,查找预印字符模板中是否存在该当前字符信息,如果存在,则确认该当前字符信息为预印字符信息,即可定位预印字符信息在文本行的位置;如果不存在,则确认该当前字符信息为打印字符信息,不做处理。
颜色提取模块603,用于对所述预印字符信息所在位置对应的文本行图像进行图像分割,以定位所述预印字符信息的像素位置,在所述像素位置提取预印字符颜色信息。采用图像分割算法,对预印字符信息所在文本行位置对应的文本行图像进行二值化分割,以获取预印字符信息的像素位置,进而在该像素位置提取对应的预印字符的颜色信息。
第二检测识别模块604,用于使用所述目标图像的背景颜色信息替换所述预印字符颜色信息,对替换颜色后的目标图像进行文字检测与识别,得到打印字符信息。预先获取目标图像的颜色通道,以根据颜色通道统计目标图像的背景颜色信息。使用目标图像的背景颜色信息替换预印字符的颜色信息,以消除压盖区域中的预印字符信息;之后对替换颜色后的目标图像再次进行文字检测与识别,即可得到目标图像的打印字符信息。
另外,本发明实施例的图像信息提取装置600还可以包括:印章消除模块和背景颜色获取模块(图6中未示出)。其中,印章消除模块,用于定位所述目标图像中印章的位置,以提取印章颜色信息;以及使用所述目标图像的背景颜色信息替换所述印章颜色信息。背景颜色获取模块,用于获取所述目标图像的颜色通道,以根据所述颜色通道统计所述目标图像的背景颜色信息。
从以上描述可以看出,利用预印字符模板和图像分割技术提取预印字符颜色信息,并使用目标图像的背景颜色信息替换预印字符颜色信息,之后对替换颜色后的目标图像进行文字检测与识别,即可获得打印字符信息,提高了压盖区域的信息识别的完整性和准确度。
图7示出了可以应用本发明实施例的图像信息提取方法或图像信息提取装置的示例性系统架构700。
如图7所示,系统架构700可以包括终端设备701、702、703,网络704和服务器705。网络704用以在终端设备701、702、703和服务器705之间提供通信链路的介质。网络704可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备701、702、703通过网络704与服务器705交互,以接收或发送消息等。终端设备701、702、703上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备701、702、703可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器705可以是提供各种服务的服务器,例如管理员利用终端设备701、702、703发送目标图像进行处理的后台管理服务器。后台管理服务器可以对目标图像进行文字检测与识别、模板匹配、图像分割等处理,并将处理结果(例如打印字符信息)反馈给终端设备。
需要说明的是,本申请实施例所提供的图像信息提取方法一般由服务器705执行,相应地,图像信息提取装置一般设置于服务器705中。
应该理解,图7中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
根据本发明的实施例,本发明还提供了一种电子设备和一种计算机可读介质。
本发明的电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例的一种图像信息提取方法。
本发明的计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明实施例的一种图像信息提取方法。
下面参考图8,其示出了适用于来实现本发明实施例的电子设备的计算机系统800的结构示意图。图8示出的电子设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图8所示,计算机系统800包括中央处理单元(CPU)801,其可以根据存储在只读存储器(ROM)802中的程序或者从存储部分808加载到随机访问存储器(RAM)803中的程序而执行各种适当的动作和处理。在RAM 803中,还存储有计算机系统800操作所需的各种程序和数据。CPU 801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
以下部件连接至I/O接口805:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分807;包括硬盘等的存储部分808;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需要被安装入存储部分808。
特别地,根据本发明公开的实施例,上文主要步骤图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行主要步骤图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分809从网络上被下载和安装,和/或从可拆卸介质811被安装。在该计算机程序被中央处理单元(CPU)801执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括第一检测识别模块、位置确定模块、颜色提取模块和第二检测识别模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,第一检测识别模块还可以被描述为“对目标图像进行文字检测与识别,得到所述目标图像的文本行以及所述文本行的字符信息的模块”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:对目标图像进行文字检测与识别,得到所述目标图像的文本行以及所述文本行的字符信息;其中,所述字符信息为预印字符信息或者打印字符信息;将所述字符信息与设定的预印字符模板进行匹配,以确定所述预印字符信息在所述文本行的位置;其中,所述预印字符模板包括所述预印字符信息;对所述预印字符信息所在位置对应的文本行图像进行图像分割,以定位所述预印字符信息的像素位置,在所述像素位置提取预印字符颜色信息;使用所述目标图像的背景颜色信息替换所述预印字符颜色信息,对替换颜色后的目标图像进行文字检测与识别,得到所述打印字符信息。
从以上描述可以看出,利用预印字符模板和图像分割技术提取预印字符颜色信息,并使用目标图像的背景颜色信息替换预印字符颜色信息,之后对替换颜色后的目标图像进行文字检测与识别,即可获得打印字符信息,提高了压盖区域的信息识别的完整性和准确度。
上述产品可执行本发明实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明实施例所提供的方法。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (10)
1.一种图像信息提取方法,其特征在于,包括:
对目标图像进行文字检测与识别,得到所述目标图像的文本行以及所述文本行的字符信息;
将所述字符信息与设定的预印字符模板进行匹配,以确定预印字符信息在所述文本行的位置;
对所述预印字符信息所在位置对应的文本行图像进行图像分割,以定位所述预印字符信息的像素位置,在所述像素位置提取预印字符颜色信息;
使用所述目标图像的背景颜色信息替换所述预印字符颜色信息,对替换颜色后的目标图像进行文字检测与识别,得到打印字符信息。
2.根据权利要求1所述的方法,其特征在于,所述将所述字符信息与设定的预印字符模板进行匹配,包括:
查找预印字符模板中是否存在所述字符信息;
在所述预印字符模板中存在所述字符信息的情况下,确认所述字符信息为所述预印字符信息。
3.根据权利要求1所述的方法,其特征在于,所述对所述预印字符信息所在位置对应的文本行图像进行图像分割,以定位所述预印字符信息的像素位置,包括:
采用图像分割算法,对所述预印字符信息所在位置对应的文本行图像进行二值化分割,以定位所述预印字符信息的像素位置。
4.根据权利要求1所述的方法,其特征在于,所述对替换颜色后的目标图像进行文字检测与识别的步骤之前,所述方法还包括:
定位所述目标图像中印章的位置,以提取印章颜色信息;
使用所述目标图像的背景颜色信息替换所述印章颜色信息。
5.根据权利要求4所述的方法,其特征在于,所述定位所述目标图像中印章的位置,包括:
采用椭圆检测算法,确定所述目标图像中印章的外边缘信息和内边缘信息;其中,所述外边缘信息和所述内边缘信息均包括中心坐标、长轴半径、短轴半径以及长轴与水平线的夹角。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述目标图像的颜色通道,以根据所述颜色通道统计所述目标图像的背景颜色信息。
7.根据权利要求1至6的任一项所述的方法,其特征在于,所述目标图像为票据图像。
8.一种图像信息提取装置,其特征在于,包括:
第一检测识别模块,用于对目标图像进行文字检测与识别,得到所述目标图像的文本行以及所述文本行的字符信息;
位置确定模块,用于将所述字符信息与设定的预印字符模板进行匹配,以确定所述预印字符信息在所述文本行的位置;
颜色提取模块,用于对所述预印字符信息所在位置对应的文本行图像进行图像分割,以定位所述预印字符信息的像素位置,在所述像素位置提取预印字符颜色信息;
第二检测识别模块,用于使用所述目标图像的背景颜色信息替换所述预印字符颜色信息,对替换颜色后的目标图像进行文字检测与识别,得到打印字符信息。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911070071.8A CN110895696A (zh) | 2019-11-05 | 2019-11-05 | 一种图像信息提取方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911070071.8A CN110895696A (zh) | 2019-11-05 | 2019-11-05 | 一种图像信息提取方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110895696A true CN110895696A (zh) | 2020-03-20 |
Family
ID=69787557
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911070071.8A Pending CN110895696A (zh) | 2019-11-05 | 2019-11-05 | 一种图像信息提取方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110895696A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112101368A (zh) * | 2020-09-22 | 2020-12-18 | 北京百度网讯科技有限公司 | 一种字符图像处理方法、装置、设备和介质 |
CN112861865A (zh) * | 2021-01-29 | 2021-05-28 | 国网内蒙古东部电力有限公司 | 一种基于ocr技术的辅助审计方法 |
CN113920286A (zh) * | 2020-06-22 | 2022-01-11 | 北京字节跳动网络技术有限公司 | 字符定位方法和装置 |
CN116152842A (zh) * | 2022-11-18 | 2023-05-23 | 北京中卡信安电子设备有限公司 | 一种证件图像处理方法、装置、存储介质及电子设备 |
Citations (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101295359A (zh) * | 2007-04-25 | 2008-10-29 | 日立欧姆龙金融系统有限公司 | 图像处理程序及图像处理装置 |
CN101551861A (zh) * | 2008-03-31 | 2009-10-07 | 富士通先端科技株式会社 | 字符识别装置 |
CN101916327A (zh) * | 2010-07-09 | 2010-12-15 | 北京商纳科技有限公司 | 一种生成错题本的方法及系统 |
KR20120035360A (ko) * | 2010-10-05 | 2012-04-16 | 에스케이플래닛 주식회사 | 문자 인식 장치 및 방법 |
CN105654072A (zh) * | 2016-03-24 | 2016-06-08 | 哈尔滨工业大学 | 一种低分辨率医疗票据图像的文字自动提取和识别系统与方法 |
US20160210507A1 (en) * | 2015-01-16 | 2016-07-21 | Sony Corporation | Image processing system with layout analysis and method of operation thereof |
CN107610138A (zh) * | 2017-10-20 | 2018-01-19 | 四川长虹电器股份有限公司 | 一种票据印章区域序列分割方法 |
CN107657230A (zh) * | 2017-09-27 | 2018-02-02 | 安徽硕威智能科技有限公司 | 一种银行自助机器人文字识别装置 |
CN107944452A (zh) * | 2017-12-12 | 2018-04-20 | 深圳市创业印章实业有限公司 | 一种圆形印章文字识别方法 |
CN108073922A (zh) * | 2017-12-21 | 2018-05-25 | 广东小天才科技有限公司 | 一种基于颜色限定的信息搜索方法及电子设备 |
CN108280389A (zh) * | 2017-01-06 | 2018-07-13 | 南通艾思达智能科技有限公司 | 医疗票据icr识别系统及其医疗票据识别方法 |
CN108345882A (zh) * | 2018-02-11 | 2018-07-31 | 北京百度网讯科技有限公司 | 用于图像识别的方法、装置、设备和计算机可读存储介质 |
CN109284758A (zh) * | 2018-09-29 | 2019-01-29 | 武汉工程大学 | 一种发票印章消除方法、装置和计算机存储介质 |
CN109409377A (zh) * | 2018-12-03 | 2019-03-01 | 龙马智芯(珠海横琴)科技有限公司 | 图像中文字的检测方法及装置 |
CN109766879A (zh) * | 2019-01-11 | 2019-05-17 | 北京字节跳动网络技术有限公司 | 字符检测模型的生成、字符检测方法、装置、设备及介质 |
CN109961008A (zh) * | 2019-02-13 | 2019-07-02 | 平安科技(深圳)有限公司 | 基于文字定位识别的表格解析方法、介质及计算机设备 |
CN110135225A (zh) * | 2018-02-09 | 2019-08-16 | 北京世纪好未来教育科技有限公司 | 样本标注方法及计算机存储介质 |
CN110147774A (zh) * | 2019-05-23 | 2019-08-20 | 阳光保险集团股份有限公司 | 表格式图片版面分析方法和计算机存储介质 |
CN110163786A (zh) * | 2019-04-02 | 2019-08-23 | 阿里巴巴集团控股有限公司 | 一种去除水印的方法、装置及设备 |
CN110188755A (zh) * | 2019-05-30 | 2019-08-30 | 北京百度网讯科技有限公司 | 一种图像识别的方法、装置和计算机可读存储介质 |
CN110378310A (zh) * | 2019-07-25 | 2019-10-25 | 南京红松信息技术有限公司 | 一种基于答案库的手写样本集的自动生成方法 |
-
2019
- 2019-11-05 CN CN201911070071.8A patent/CN110895696A/zh active Pending
Patent Citations (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101295359A (zh) * | 2007-04-25 | 2008-10-29 | 日立欧姆龙金融系统有限公司 | 图像处理程序及图像处理装置 |
CN101551861A (zh) * | 2008-03-31 | 2009-10-07 | 富士通先端科技株式会社 | 字符识别装置 |
CN101916327A (zh) * | 2010-07-09 | 2010-12-15 | 北京商纳科技有限公司 | 一种生成错题本的方法及系统 |
KR20120035360A (ko) * | 2010-10-05 | 2012-04-16 | 에스케이플래닛 주식회사 | 문자 인식 장치 및 방법 |
US20160210507A1 (en) * | 2015-01-16 | 2016-07-21 | Sony Corporation | Image processing system with layout analysis and method of operation thereof |
CN105654072A (zh) * | 2016-03-24 | 2016-06-08 | 哈尔滨工业大学 | 一种低分辨率医疗票据图像的文字自动提取和识别系统与方法 |
CN108280389A (zh) * | 2017-01-06 | 2018-07-13 | 南通艾思达智能科技有限公司 | 医疗票据icr识别系统及其医疗票据识别方法 |
CN107657230A (zh) * | 2017-09-27 | 2018-02-02 | 安徽硕威智能科技有限公司 | 一种银行自助机器人文字识别装置 |
CN107610138A (zh) * | 2017-10-20 | 2018-01-19 | 四川长虹电器股份有限公司 | 一种票据印章区域序列分割方法 |
CN107944452A (zh) * | 2017-12-12 | 2018-04-20 | 深圳市创业印章实业有限公司 | 一种圆形印章文字识别方法 |
CN108073922A (zh) * | 2017-12-21 | 2018-05-25 | 广东小天才科技有限公司 | 一种基于颜色限定的信息搜索方法及电子设备 |
CN110135225A (zh) * | 2018-02-09 | 2019-08-16 | 北京世纪好未来教育科技有限公司 | 样本标注方法及计算机存储介质 |
CN108345882A (zh) * | 2018-02-11 | 2018-07-31 | 北京百度网讯科技有限公司 | 用于图像识别的方法、装置、设备和计算机可读存储介质 |
CN109284758A (zh) * | 2018-09-29 | 2019-01-29 | 武汉工程大学 | 一种发票印章消除方法、装置和计算机存储介质 |
CN109409377A (zh) * | 2018-12-03 | 2019-03-01 | 龙马智芯(珠海横琴)科技有限公司 | 图像中文字的检测方法及装置 |
CN109766879A (zh) * | 2019-01-11 | 2019-05-17 | 北京字节跳动网络技术有限公司 | 字符检测模型的生成、字符检测方法、装置、设备及介质 |
CN109961008A (zh) * | 2019-02-13 | 2019-07-02 | 平安科技(深圳)有限公司 | 基于文字定位识别的表格解析方法、介质及计算机设备 |
CN110163786A (zh) * | 2019-04-02 | 2019-08-23 | 阿里巴巴集团控股有限公司 | 一种去除水印的方法、装置及设备 |
CN110147774A (zh) * | 2019-05-23 | 2019-08-20 | 阳光保险集团股份有限公司 | 表格式图片版面分析方法和计算机存储介质 |
CN110188755A (zh) * | 2019-05-30 | 2019-08-30 | 北京百度网讯科技有限公司 | 一种图像识别的方法、装置和计算机可读存储介质 |
CN110378310A (zh) * | 2019-07-25 | 2019-10-25 | 南京红松信息技术有限公司 | 一种基于答案库的手写样本集的自动生成方法 |
Non-Patent Citations (3)
Title |
---|
BINAY BINOD KUMAR ET AL: "Designing of Licensed Number Plate Recognition system using hybrid technique from neural network & template matching", 《2015 INTERNATIONAL CONFERENCE ON COMPUTING, COMMUNICATION AND SECURITY (ICCCS)》 * |
孔祥倩: "火车票面信息识别算法研究", 《中国优秀硕士学位论文全文数据库 (信息科技辑)》 * |
贺景宇: "复杂版面文档图像中公式与文本的提取及分析", 《中国优秀硕士学位论文全文数据库 (信息科技辑)》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113920286A (zh) * | 2020-06-22 | 2022-01-11 | 北京字节跳动网络技术有限公司 | 字符定位方法和装置 |
CN112101368A (zh) * | 2020-09-22 | 2020-12-18 | 北京百度网讯科技有限公司 | 一种字符图像处理方法、装置、设备和介质 |
CN112101368B (zh) * | 2020-09-22 | 2023-08-18 | 北京百度网讯科技有限公司 | 一种字符图像处理方法、装置、设备和介质 |
CN112861865A (zh) * | 2021-01-29 | 2021-05-28 | 国网内蒙古东部电力有限公司 | 一种基于ocr技术的辅助审计方法 |
CN112861865B (zh) * | 2021-01-29 | 2024-03-29 | 国网内蒙古东部电力有限公司 | 一种基于ocr技术的辅助审计方法 |
CN116152842A (zh) * | 2022-11-18 | 2023-05-23 | 北京中卡信安电子设备有限公司 | 一种证件图像处理方法、装置、存储介质及电子设备 |
CN116152842B (zh) * | 2022-11-18 | 2023-11-03 | 北京中卡信安电子设备有限公司 | 一种证件图像处理方法、装置、存储介质及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110895696A (zh) | 一种图像信息提取方法和装置 | |
US10013643B2 (en) | Performing optical character recognition using spatial information of regions within a structured document | |
US9754164B2 (en) | Systems and methods for classifying objects in digital images captured using mobile devices | |
AU2017302245B2 (en) | Optical character recognition utilizing hashed templates | |
US9679354B2 (en) | Duplicate check image resolution | |
CN109993749B (zh) | 提取目标图像的方法和装置 | |
CN110222694B (zh) | 图像处理方法、装置、电子设备及计算机可读介质 | |
CN105046553A (zh) | 基于手机的云智能发票识别查验系统及方法 | |
CN111028186B (zh) | 一种图像增强方法和装置 | |
CN103488999A (zh) | 一种发票数据记录方法 | |
CN104077557A (zh) | 一种获取卡片信息的方法和装置 | |
CN110895811B (zh) | 一种图像篡改检测方法和装置 | |
CN111881943A (zh) | 图像分类的方法、装置、设备和计算机可读介质 | |
CN111612003B (zh) | 一种提取图片中的文本的方法和装置 | |
CN114782957A (zh) | 确定印章图像中文本信息的方法、装置、电子设备和介质 | |
CN113177542A (zh) | 识别印章文字的方法、装置、设备和计算机可读介质 | |
CN116798061A (zh) | 一种票据审核识别方法、装置、终端和存储介质 | |
US11863995B2 (en) | Method for generating wireless access point information, device, and computer readable medium | |
CN113179494B (zh) | 基于短信的业务办理方法及系统 | |
CN111126151A (zh) | 识别票据图像中的字段的方法、装置、设备和介质 | |
CN115019325A (zh) | 一种基于图像识别的业务处理方法及装置、存储介质 | |
CN111881778A (zh) | 文本检测的方法、装置、设备和计算机可读介质 | |
CN108415930B (zh) | 一种数据解析方法及装置 | |
CN111401137A (zh) | 证件栏位识别的方法和装置 | |
CN111368840A (zh) | 证件图片处理的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200320 |