CN111126151A - 识别票据图像中的字段的方法、装置、设备和介质 - Google Patents

识别票据图像中的字段的方法、装置、设备和介质 Download PDF

Info

Publication number
CN111126151A
CN111126151A CN201911164957.9A CN201911164957A CN111126151A CN 111126151 A CN111126151 A CN 111126151A CN 201911164957 A CN201911164957 A CN 201911164957A CN 111126151 A CN111126151 A CN 111126151A
Authority
CN
China
Prior art keywords
field
image
color
identifying
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911164957.9A
Other languages
English (en)
Inventor
王亚领
刘设伟
刘昊岳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Taikang Insurance Group Co Ltd
Taikang Online Property Insurance Co Ltd
Original Assignee
Taikang Insurance Group Co Ltd
Taikang Online Property Insurance Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Taikang Insurance Group Co Ltd, Taikang Online Property Insurance Co Ltd filed Critical Taikang Insurance Group Co Ltd
Priority to CN201911164957.9A priority Critical patent/CN111126151A/zh
Publication of CN111126151A publication Critical patent/CN111126151A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/28Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Finance (AREA)
  • Artificial Intelligence (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了识别票据图像中的字段的方法、装置、设备和介质,涉及计算机技术领域。该方法的一具体实施方式包括:将票据图像进行二值化处理,得到二值化票据图像;在所述二值化票据图像中未检测到图形标识符的情况下,在所述票据图像中,定位满足预设字段长度的文本区域;识别所述文本区域的字段颜色;当所述文本区域的字段颜色与预设字段颜色一致时,将所述文本区域的字段作为字段识别结果。该实施方式能够快速精准的识别出票据的字段。

Description

识别票据图像中的字段的方法、装置、设备和介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种识别票据图像中的字段的方法、装置、设备和计算机可读介质。
背景技术
在保险的核赔环节中,客户上传多张理赔单据,其中票据的信息尤为重要。在对票据进行光学字符识别(Optical Character Recognition,OCR)识别的过程中,需要从客户上传票据中识别出用于核赔的字段。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
票据没有统一制式、排版格式迥异,可能出现打印错位严重,因此很难找出字段。并且票据上字段周围往往打印有其他数字,造成字段的识别非常困难。
发明内容
有鉴于此,本发明实施例提供一种识别票据图像中的字段方法、装置、设备和计算机可读介质,能够快速精准的识别出票据的字段。
为实现上述目的,根据本发明实施例的一个方面,提供了一种识别票据图像中的字段的方法,包括:
将票据图像进行二值化处理,得到二值化票据图像;
在所述二值化票据图像中未检测到图形标识符的情况下,在所述票据图像中,定位满足预设字段长度的文本区域;
识别所述文本区域的字段颜色;
当所述文本区域的字段颜色与预设字段颜色一致时,将所述文本区域的字段作为字段识别结果。
所述识别所述文本区域的字段颜色,包括:
将所述文本区域的红绿蓝图像,转换为色调饱和度明度的图像;
基于所述色调饱和度明度的图像的数值,获知所述文本区域的每个像素的颜色;
按照相同颜色像素的数量从多到少的顺序,排列颜色;
将排序第二的颜色,作为所述文本区域的字段颜色。
所述将所述文本区域的红绿蓝图像,转换为色调饱和度明度的图像,包括:
按照色调饱和度明度的色彩空间表,将所述文本区域的红绿蓝图像,转换为色调饱和度明度的图像。
所述将票据图像进行二值化处理,得到二值化票据图像之后,还包括:
在所述二值化票据图像中检测到图形标识符的情况下,则识别所述图形标识符,以确定字段识别结果。
所述在所述票据图像中,定位满足预设字段长度的文本区域,包括:
检测所述票据图像,得到多个文本区域;
在所述多个文本区域中,定位与所述预设字段长度一致的文本区域。
所述图形标识符包括条形码或二维码。
所述字段长度包括字符的数量。
根据本发明实施例的第二方面,提供了一种识别票据图像中的字段的装置,包括:
处理模块,用于将票据图像进行二值化处理,得到二值化票据图像;
定位模块,用于在所述二值化票据图像中未检测到图形标识符的情况下,在所述票据图像中,定位满足预设字段长度的文本区域;
识别模块,识别所述文本区域的字段颜色;
结果模块,用于当所述文本区域的字段颜色与预设字段颜色一致时,将所述文本区域的字段作为字段识别结果。
根据本发明实施例的第三方面,提供了一种识别票据图像中的字段的电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述的方法。
根据本发明实施例的第四方面,提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述的方法。
上述发明中的一个实施例具有如下优点或有益效果:将票据图像进行二值化处理,得到二值化票据图像;在二值化票据图像中未检测到图形标识符的情况下,在票据图像中,定位满足预设字段长度的文本区域;识别文本区域的字段颜色;当所述文本区域的字段颜色与预设字段颜色一致时,将文本区域的字段作为字段识别结果。在未检测到图形标识符的情况下,首先按照预设字段长度定位文本区域,再识别文本区域的字段颜色,最终确定字段识别结果。因此能够快速精准的识别出票据的字段。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施例的识别票据图像中的字段的方法的主要流程的示意图;
图2是根据本发明实施例的定位文本区域的流程示意图;
图3是根据本发明实施例的识别文本区域的字段颜色的流程示意图;
图4是根据本发明实施例的识别医疗票据中发票号码的流程示意图;
图5是根据本发明实施例的一张待识别医疗票据的示意图;
图6是根据本发明实施例的另一个待识别医疗票据的示意图;
图7是根据本发明实施例的第一文本区域的识别结果;
图8是根据本发明实施例的第二文本区域的识别结果;
图9是根据本发明实施例的识别票据图像中的字段的装置的主要结构的示意图;
图10是本发明实施例可以应用于其中的示例性系统架构图;
图11是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
现有的票据识别,大多数场景下还是依赖人力用肉眼辨别的方式。这种方法消耗大量的人力且速度不快。
基于人工智能图像识别票据,对于具有固定统一制式、排版格式相同的票据,利用固定模板匹配以确定字段的打印位置,然后截取并识别字段。
然而,现实中人工拍摄的票据没有统一制式、排版格式迥异,造成字段打印错位严重,并且票据上字段周围往往打印有其他数字,造成检测字段非常困难,最终导致字段的识别失败。
为了解决识别票据图像中的字段非常困难的技术问题,可以采用以下本发明实施例中的技术方案。
参见图1,图1是根据本发明实施例的识别票据图像中的字段的方法的主要流程的示意图,在未检测到图形标识符的情况下,可以基于预设字段长度和预设字段颜色,在票据图像中识别出字段。如图1所示,具体包括以下步骤:
S101、将票据图像进行二值化处理,得到二值化票据图像。
在本发明实施例中,票据是由收款方给付款方的一种凭证。作为一个示例,票据可以是出租车发票,医疗发票和购物发票等。在下述实施例中描述过程中,以票据具体为医疗发票为例进行说明。
票据中字段不仅包括消费金额、消费产品信息等涉及消费的内容,还涉及到票据标识。作为一个示例,在保险的核赔环节,对票据进行OCR的识别过程中,需要从医疗票据中识别出字段,字段是发票号。
为了能够迅速识别票据图像中的字段,在部分票据中印刷有图形标识符,图形标识符可以是字段的另一种体现。通过识别图形标识符也可以获知字段。
那么,在识别票据图像中的字段的过程中,需要先确定是否可以检测到图形标识符。
具体来说,客户可以上传票据图像。从客户上传票据中选择一张票据进行识别。
示例性的,读取票据图像的红绿蓝(RGB)像素值,将票据图像进行灰度化。灰度图像的每个像素只需一个字节存放灰度值,灰度范围为0-255。作为一个示例,可以以下任一种方法将票据图像转换为灰度图像,分量法、最大值法、平均值法和加权平均法。
再将灰度图像转换为二值化图像。将大于预设临界灰度值的像素灰度设为灰度极大值,将小于预设临界灰度值的像素灰度设为灰度极小值,从而实现灰度图像的二值化。
在将票据图像进行二值化处理,进而得到二值化票据图像。
S102、在二值化票据图像中未检测到图形标识符的情况下,在票据图像中,定位满足预设字段长度的文本区域。
图形标识符可以是条形码或二维码等图像标识。在本发明实施例中,可以采用已有的图形标识符检测算法,在二值化票据图像中检测是否存在图形标识符。
作为一个示例,图形标识符可以是条形码,可利用条形码检测算法,检测二值化票据图像,以确定二值化票据图像中是否存在条形码。
在本发明的一个实施例中,在二值化票据图像中检测到图形标识符的情况下,由于图形标识符与字段存在对应关系,识别图形标识符,进而可以识别字段,进而将所识别的字段作为字段识别结果。
作为一个示例,票据图像为医疗发票,待识别字段为:发票号码,图形标识符为条形码。在二值化票据图像中检测到条形码,则可以基于条形码获知发票号码,将所识别的发票号码作为字段识别结果。
在本发明的一个实施例中,在二值化票据图像中未检测到图形标识符的情况下,则需要在票据图像中,定位满足预设字段长度的文本区域。
在二值化票据图像中未检测到图形标识符,一种情况是票据图像中并不存在图形标识符;另一种情况是票据图像中存在图形标识符,但由于其他的原因未能检测到图形标识符。
无论是上述哪种情况,都可以采用下述方式识别票据图像中的字段。
票据图像包括多个字段,每个字段对应一个文本区域。票据图像的每个字段所在的文本区域长度是预设字段长度,而且每个字段的颜色也是预设字段颜色。
按照预设字段长度和预设字段颜色,就可以在票据图像中识别字段。
定位文本区域就是在票据图像中找出文字所在位置。具体可以按照区域定位和边缘定位等方式定位文本区域。
参见图2,图2是根据本发明实施例的定位文本区域的流程示意图,具体包括:
S201、检测票据图像,得到多个文本区域。
在票据图像中包括多个文本区域,检测票据图像,可以得到多个文本区域。分别对每个文本区域的内容进行文字识别,计算上述多个文本区域的识别结果的字段长度。
S202、在多个文本区域中,定位与预设字段长度一致的文本区域。
识别字段之前,可以预设字段长度。可以理解的是,按照预设字段长度,可以在多个文本区域中确定待识别字段所在的文本区域。
具体来说,在多个文本区域中,定位与预设字段长度一致的文本区域。
这样就可以基于预设字段长度初步确定待识别字段所在文本区域。在本发明的一个实施例中,字段长度可以以包括字符的数量确定。作为一个示例,预设字段长度为10个字符。文本区域1包括9个字符,文本区域2包括10个字符。由于文本区域2中字符的数量与预设字段长度中字符的数量相同,则可以定位文本区域2。
S103、识别文本区域的字段颜色。
基于预设字段长度初步确定待识别字段所在文本区域之后,还可以根据预设字段颜色最终确定字段。
参见图3,图3是根据本发明实施例的识别文本区域的字段颜色的流程示意图,具体包括:
票据图像的字段颜色是预先设置的,可以依据预设字段颜色是否与文本区域的字段颜色一致,以识别字段。
S301、将文本区域的红绿蓝图像,转换为色调饱和度明度的图像。
与常用的RGB三通道图像相比较而言,色调饱和度明度(HSV)图像的颜色种类多达10种,具体为:黑、灰、白、红、橙、黄、绿、青、蓝和紫。
那么,可以将文本区域RGB图像,转换为HSV的图像,进而可以识别出文本区域的字段颜色。
在本发明的一个实施例中,可以按照HSV的色彩空间表,将文本区域的RGB图像,转换为HSV的图像。
参见表1,表1是HSV的色彩空间表。
表1
绿
Hmin 0 0 0 0;156 11 26 35 78 100 125
Hmax 180 180 180 10;180 25 34 77 99 124 155
Smin 0 0 0 43 43 43 43 43 43 43
Smax 255 43 30 255 255 255 255 255 255 255
Vmin 0 46 221 46 46 46 46 46 46 46
Vmax 46 220 255 220 255 255 255 255 255 255
S302、基于色调饱和度明度的图像的数值,获知文本区域的每个像素的颜色。
按照表1,10种颜色都具有固定的HSV数值,根据HSV的图像的数值,获知文本区域的每个像素的颜色。具体来说,基于每个像素的HSV数值,判断属于10个颜色中的具体哪种颜色。
作为一个示例,一个像素点的HSV数值为(h,s,v),对于黑色的HSV数值如表1所示:如果满足(1)、(2)和(3):
Hmin≤h≤Hmax (1)
Smin≤h≤Smax (2)
Vmin≤h≤Vmax (3)
其中,Hmin=0,Hmax=180;Smin=0,Smax=255;Vmin=0,Vmax=46,则该像素点为黑色。类似的,可以判断出其他像素的颜色。
S303、按照相同颜色像素的数量从多到少的顺序,排列颜色。
统计文本区域相同颜色像素的数量,共计有10个颜色。即,按照相同颜色像素的数量从多到少的顺序,排列颜色。
S304、将排序第二的颜色,作为文本区域的字段颜色。
文本区域的颜色包括:背景颜色、字段颜色和边框颜色等。经大量的统计可以获知,相同颜色像素的数量最大值为背景颜色;相同颜色像素的数量次大值为字段颜色。
那么,按照相同颜色像素的数量从多到少的顺序,排列颜色,将排序第二的颜色,作为文本区域的字段颜色。
在上述实施例中,通过将文本区域的RGB图像转换为HSV的图像,统计像素的颜色,进而获知文本区域的字段颜色。
在本发明的一个实施例中,还可以在二值化票据图像中未检测到图形标识符的情况下,在票据图像中,定位多个文本区域。然后,识别字段颜色与预设字段颜色一致的文本区域。最后,基于预设字段长度从所识别的文本区域中挑选出待识别字段的文本区域。将待识别字段的文本区域中的字段作为字段识别结果。
其中,识别字段颜色的具体方案,可以参见S103。基于预设字段长度从所识别的文本区域,挑选待识别字段的文本区域,可以参见S102。
S104、当所述文本区域的字段颜色与预设字段颜色一致时,将文本区域的字段作为字段识别结果。
在识别文本区域的字段颜色与预设字段颜色一致的情况下,则可以认为该文本区域即待识别字段所在文本区域,因此可以识别该文本区域的字段,并将识别出的字段作为字段识别结果。
在上述实施例中,先将票据图像二值化处理以检测是否存在图形标识符。在未检测到图形标识符的情况下,再基于预设字段长度定位文本区域。文本区域的字段颜色与预设字段颜色一致,则该文本区域的字段即待识别字段,可以将该文本区域的字段作为字段识别结果。进而能够快速精准的识别出票据的字段。精准识别字段能够减少人工录入的数量,从而降低成本投入,节省大量的人力、物力、财力,优化资源配置。
参见图4,图4是根据本发明实施例的识别医疗票据中发票号码的流程示意图。其中,票据具体为医疗票据,待识别字段为发票号码。
S401、将票据图像进行二值化处理,得到二值化票据图像。
参见图5,图5是根据本发明实施例的一张待识别医疗票据的示意图。
参见图6,图6是根据本发明实施例的另一个待识别医疗票据的示意图。
读取图5和图6的医疗票据图像的RGB,将图像灰度化。预设临界灰度值为127,对灰度图像分别进行二值化处理,得到二值化票据图像。
S402、判断二值化票据图像中是否检测到图形标识符。
在图5的二值化票据图像中检测到图形标识符,则执行S403;在图6中的二值化票据图像中未检测到图形标识符,则执行S404。
S403、识别图形标识符,以确定字段识别结果。
图5中的医疗票据中存在条形码,条形码所含有的信息即发票号码。识别条形码,得到发票号码为:57030001679615。
S404、定位满足预设字段长度的文本区域。
图6中的医疗票据中不存在条形码,发票号码个数为10的红色字段。
在图6中所有识别出的文本区域,匹配到识别结果字符长度为10的文本区域。分别为文本区域1和文本区域2。
图7是根据本发明实施例的第一文本区域的识别结果,文本区域1的字段为:0002325238。
图8是根据本发明实施例的第二文本区域的识别结果,文本区域2的字段为:0002261828。
S405、识别文本区域的字段颜色。
将文本区域的RGB图像,转换为HSV的图像,基于两个文本区域每个像素点的(h,s,v),与表1HSV的色彩空间表对比,可以获知每个像素点的颜色。
参见表2,表2是两个文本区域的相同颜色像素的数量统计。
表2
Figure BDA0002287190080000101
Figure BDA0002287190080000111
由表2可知,第一文本区域中数量次多的颜色为红色1253个,则判断第一文本区域的字段颜色为红色。
第二文本区域中数量次多的颜色为灰色1058个,则判断第二文本区域的字段颜色为灰色。
S406、判断文本区域的字段颜色与预设字段颜色是否一致。
第一文本区域的字段颜色与预设字段颜色一致,则第一文本区域的字段为字段识别结果。根据预设字段颜色为红色,因此第一文本区域的字段为发票号码,图6中的发票号码为:0002325238。
第二文本区域的字段颜色与预设字段颜色不一致,则结束。
图9是根据本发明实施例的识别票据图像中的字段的装置的主要结构的示意图,识别票据图像中的字段的装置可以实现识别票据图像中的字段的方法,如图9所示,识别票据图像中的字段的装置具体包括:
处理模块901,用于将票据图像进行二值化处理,得到二值化票据图像。
定位模块902,用于在二值化票据图像中未检测到图形标识符的情况下,在票据图像中,定位满足预设字段长度的文本区域。
识别模块903,识别文本区域的字段颜色。
结果模块904,用于将文本区域的字段作为字段识别结果。
在本发明的一个实施例中,识别模块903,具体用于将文本区域的红绿蓝图像,转换为色调饱和度明度的图像;
基于色调饱和度明度的图像的数值,获知文本区域的每个像素的颜色;
按照相同颜色像素的数量从多到少的顺序,排列颜色;
将排序第二的颜色,作为文本区域的字段颜色。
在本发明的一个实施例中,识别模块903,具体用于按照色调饱和度明度的色彩空间表,将文本区域的红绿蓝图像,转换为色调饱和度明度的图像。
在本发明的一个实施例中,结果模块904,还用于在二值化票据图像中检测到图形标识符的情况下,则识别图形标识符,以确定字段识别结果。
在本发明的一个实施例中,定位模块902,具体用于检测票据图像,得到多个文本区域;
在多个文本区域中,定位与预设字段长度一致的文本区域。
在本发明的一个实施例中,图形标识符包括条形码或二维码。
在本发明的一个实施例中,字段长度包括字符的数量。
图10示出了可以应用本发明实施例的识别票据图像中的字段的方法或识别票据图像中的字段的装置的示例性系统架构1000。
如图10所示,系统架构1000可以包括终端设备1001、1002、1003,网络1004和服务器1005。网络1004用以在终端设备1001、1002、1003和服务器1005之间提供通信链路的介质。网络1004可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备1001、1002、1003通过网络1004与服务器1005交互,以接收或发送消息等。终端设备1001、1002、1003上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备1001、1002、1003可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器1005可以是提供各种服务的服务器,例如对用户利用终端设备1001、1002、1003所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如目标推送信息、产品信息--仅为示例)反馈给终端设备。
需要说明的是,本发明实施例所提供的识别票据图像中的字段的方法一般由服务器1005执行,相应地,识别票据图像中的字段的装置一般设置于服务器1005中。
应该理解,图10中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图11,其示出了适于用来实现本发明实施例的终端设备的计算机系统1100的结构示意图。图11示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图11所示,计算机系统1100包括中央处理单元(CPU)1101,其可以根据存储在只读存储器(ROM)1102中的程序或者从存储部分1108加载到随机访问存储器(RAM)1103中的程序而执行各种适当的动作和处理。在RAM 1103中,还存储有系统1100操作所需的各种程序和数据。CPU 1101、ROM 1102以及RAM 1103通过总线1104彼此相连。输入/输出(I/O)接口1105也连接至总线1104。
以下部件连接至I/O接口1105:包括键盘、鼠标等的输入部分1106;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分1107;包括硬盘等的存储部分1108;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1109。通信部分1109经由诸如因特网的网络执行通信处理。驱动器1110也根据需要连接至I/O接口1105。可拆卸介质1111,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1110上,以便于从其上读出的计算机程序根据需要被安装入存储部分1108。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1109从网络上被下载和安装,和/或从可拆卸介质1111被安装。在该计算机程序被中央处理单元(CPU)1101执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括发送单元、获取单元、确定单元和第一处理单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,发送单元还可以被描述为“向所连接的服务端发送图片获取请求的单元”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:
将票据图像进行二值化处理,得到二值化票据图像;
在所述二值化票据图像中未检测到图形标识符的情况下,在所述票据图像中,定位满足预设字段长度的文本区域;
识别所述文本区域的字段颜色;
当所述文本区域的字段颜色与预设字段颜色一致时,将所述文本区域的字段作为字段识别结果。
根据本发明实施例的技术方案,将票据图像进行二值化处理,得到二值化票据图像;在二值化票据图像中未检测到图形标识符的情况下,在票据图像中,定位满足预设字段长度的文本区域;当文本区域的字段颜色与预设字段颜色一致时,识别文本区域的字段颜色;将文本区域的字段作为字段识别结果。在未检测到图形标识符的情况下,首先按照预设字段长度定位文本区域,再识别文本区域的字段颜色,最终确定字段识别结果。因此能够快速精准的识别出票据的字段。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (10)

1.一种识别票据图像中的字段的方法,其特征在于,包括:
将票据图像进行二值化处理,得到二值化票据图像;
在所述二值化票据图像中未检测到图形标识符的情况下,在所述票据图像中,定位满足预设字段长度的文本区域;
识别所述文本区域的字段颜色;
当所述文本区域的字段颜色与预设字段颜色一致时,将所述文本区域的字段作为字段识别结果。
2.根据权利要求1所述识别票据图像中的字段的方法,其特征在于,所述识别所述文本区域的字段颜色,包括:
将所述文本区域的红绿蓝图像,转换为色调饱和度明度的图像;
基于所述色调饱和度明度的图像的数值,获知所述文本区域的每个像素的颜色;
按照相同颜色像素的数量从多到少的顺序,排列颜色;
将排序第二的颜色,作为所述文本区域的字段颜色。
3.根据权利要求2所述识别票据图像中的字段的方法,其特征在于,所述将所述文本区域的红绿蓝图像,转换为色调饱和度明度的图像,包括:
按照色调饱和度明度的色彩空间表,将所述文本区域的红绿蓝图像,转换为色调饱和度明度的图像。
4.根据权利要求1所述识别票据图像中的字段的方法,其特征在于,所述将票据图像进行二值化处理,得到二值化票据图像之后,还包括:
在所述二值化票据图像中检测到图形标识符的情况下,则识别所述图形标识符,以确定字段识别结果。
5.根据权利要求1所述识别票据图像中的字段的方法,其特征在于,所述在所述票据图像中,定位满足预设字段长度的文本区域,包括:
检测所述票据图像,得到多个文本区域;
在所述多个文本区域中,定位与所述预设字段长度一致的文本区域。
6.根据权利要求1所述识别票据图像中的字段的方法,其特征在于,所述图形标识符包括条形码或二维码。
7.根据权利要求1所述识别票据图像中的字段的方法,其特征在于,所述字段长度包括字符的数量。
8.一种识别票据图像中的字段的装置,其特征在于,包括:
处理模块,用于将票据图像进行二值化处理,得到二值化票据图像;
定位模块,用于在所述二值化票据图像中未检测到图形标识符的情况下,在所述票据图像中,定位满足预设字段长度的文本区域;
识别模块,识别所述文本区域的字段颜色;
结果模块,用于当所述文本区域的字段颜色与预设字段颜色一致时,将所述文本区域的字段作为字段识别结果。
9.一种识别票据图像中的字段的电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。
CN201911164957.9A 2019-11-25 2019-11-25 识别票据图像中的字段的方法、装置、设备和介质 Pending CN111126151A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911164957.9A CN111126151A (zh) 2019-11-25 2019-11-25 识别票据图像中的字段的方法、装置、设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911164957.9A CN111126151A (zh) 2019-11-25 2019-11-25 识别票据图像中的字段的方法、装置、设备和介质

Publications (1)

Publication Number Publication Date
CN111126151A true CN111126151A (zh) 2020-05-08

Family

ID=70496619

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911164957.9A Pending CN111126151A (zh) 2019-11-25 2019-11-25 识别票据图像中的字段的方法、装置、设备和介质

Country Status (1)

Country Link
CN (1) CN111126151A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111931664A (zh) * 2020-08-12 2020-11-13 腾讯科技(深圳)有限公司 混贴票据图像的处理方法、装置、计算机设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105654072A (zh) * 2016-03-24 2016-06-08 哈尔滨工业大学 一种低分辨率医疗票据图像的文字自动提取和识别系统与方法
US20170351913A1 (en) * 2016-06-07 2017-12-07 The Neat Company, Inc. d/b/a Neatreceipts, Inc. Document Field Detection And Parsing
CN108932754A (zh) * 2018-06-20 2018-12-04 北京京东金融科技控股有限公司 基于人工检票界面图像的检票方法、装置、介质及电子设备
CN109741517A (zh) * 2018-12-26 2019-05-10 大象慧云信息技术有限公司 一种发票查验方法、装置和系统
CN109766778A (zh) * 2018-12-19 2019-05-17 平安科技(深圳)有限公司 基于ocr技术的发票信息录入方法、装置、设备及存储介质
CN109961553A (zh) * 2017-12-26 2019-07-02 航天信息股份有限公司 发票号码识别方法、装置及税务自助终端系统
WO2019161615A1 (zh) * 2018-02-23 2019-08-29 平安科技(深圳)有限公司 账单录入方法、系统、光学字符识别服务器和存储介质
CN110458998A (zh) * 2019-07-11 2019-11-15 深圳怡化电脑股份有限公司 票据检测方法、票据检测装置及终端

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105654072A (zh) * 2016-03-24 2016-06-08 哈尔滨工业大学 一种低分辨率医疗票据图像的文字自动提取和识别系统与方法
US20170351913A1 (en) * 2016-06-07 2017-12-07 The Neat Company, Inc. d/b/a Neatreceipts, Inc. Document Field Detection And Parsing
CN109961553A (zh) * 2017-12-26 2019-07-02 航天信息股份有限公司 发票号码识别方法、装置及税务自助终端系统
WO2019161615A1 (zh) * 2018-02-23 2019-08-29 平安科技(深圳)有限公司 账单录入方法、系统、光学字符识别服务器和存储介质
CN108932754A (zh) * 2018-06-20 2018-12-04 北京京东金融科技控股有限公司 基于人工检票界面图像的检票方法、装置、介质及电子设备
CN109766778A (zh) * 2018-12-19 2019-05-17 平安科技(深圳)有限公司 基于ocr技术的发票信息录入方法、装置、设备及存储介质
CN109741517A (zh) * 2018-12-26 2019-05-10 大象慧云信息技术有限公司 一种发票查验方法、装置和系统
CN110458998A (zh) * 2019-07-11 2019-11-15 深圳怡化电脑股份有限公司 票据检测方法、票据检测装置及终端

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111931664A (zh) * 2020-08-12 2020-11-13 腾讯科技(深圳)有限公司 混贴票据图像的处理方法、装置、计算机设备及存储介质
CN111931664B (zh) * 2020-08-12 2024-01-12 腾讯科技(深圳)有限公司 混贴票据图像的处理方法、装置、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
US9754164B2 (en) Systems and methods for classifying objects in digital images captured using mobile devices
CN110222694B (zh) 图像处理方法、装置、电子设备及计算机可读介质
CN108255555B (zh) 一种系统语言切换方法及终端设备
CN111353497A (zh) 一种身份证信息的识别方法和装置
CN105046553A (zh) 基于手机的云智能发票识别查验系统及方法
CN105023340A (zh) 基于扫描仪的云智能发票识别查验系统及方法
CN109903210B (zh) 水印的去除方法、装置和服务器
CN112241714A (zh) 图像中指定区域的识别方法、装置、可读介质和电子设备
CN111028186B (zh) 一种图像增强方法和装置
CN110895696A (zh) 一种图像信息提取方法和装置
CN112508145B (zh) 电子印章生成及验证方法、装置、电子设备及存储介质
CN110895811B (zh) 一种图像篡改检测方法和装置
CN112632952A (zh) 一种对比文件的方法和装置
CN111259891A (zh) 一种自然场景下身份证识别方法、装置、设备和介质
CN110781811B (zh) 异常工单识别方法、装置、可读存储介质和计算机设备
KR20190020963A (ko) 인공지능 기반의 홈페이지 개인정보유출차단시스템
CN111126151A (zh) 识别票据图像中的字段的方法、装置、设备和介质
CN106886593A (zh) 信息处理方法、装置和服务器
CN110889470A (zh) 用于处理图像的方法和装置
CN113011249A (zh) 票据审核方法、装置、设备及存储介质
CN112967191A (zh) 图像处理方法、装置、电子设备和存储介质
CN111178352A (zh) 一种验证码字符识别的方法和装置
Oh et al. Low-complexity and robust comic fingerprint method for comic identification
CN113807343B (zh) 文字识别方法、装置、计算机设备及存储介质
CN112215237B (zh) 图像处理方法及装置、电子设备和计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200508