CN110569850A - 字符识别模板匹配方法、装置和文本识别设备 - Google Patents

字符识别模板匹配方法、装置和文本识别设备 Download PDF

Info

Publication number
CN110569850A
CN110569850A CN201910767586.7A CN201910767586A CN110569850A CN 110569850 A CN110569850 A CN 110569850A CN 201910767586 A CN201910767586 A CN 201910767586A CN 110569850 A CN110569850 A CN 110569850A
Authority
CN
China
Prior art keywords
character recognition
recognition template
text image
template
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910767586.7A
Other languages
English (en)
Other versions
CN110569850B (zh
Inventor
张婕蕾
姚聪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Megvii Technology Co Ltd
Original Assignee
Beijing Megvii Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Megvii Technology Co Ltd filed Critical Beijing Megvii Technology Co Ltd
Priority to CN201910767586.7A priority Critical patent/CN110569850B/zh
Publication of CN110569850A publication Critical patent/CN110569850A/zh
Application granted granted Critical
Publication of CN110569850B publication Critical patent/CN110569850B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

本申请涉及一种字符识别模板匹配方法、装置、计算机设备、文本识别设备和可读存储介质。该方法包括:获取各字符识别模板和待识别文本的文本图像中每个字符的类型和位置;针对每个字符识别模板,确定字符识别模板和文本图像之间的多个匹配位置对;采用特征匹配算法计算字符识别模板和文本图像之间的目标变换矩阵;针对每个字符识别模板,采用字符识别模板对应的目标变换矩阵,对字符识别模板和文本图像进行对齐处理,并计算对齐处理后的字符识别模板和文本图像之间文字行区域的匹配度;从各字符识别模板中选择匹配度最高的字符识别模板作为文本图像的目标字符识别模板。采用本方法能够提高选择字符识别模板的准确性。

Description

字符识别模板匹配方法、装置和文本识别设备
技术领域
本申请涉及字符识别技术领域,特别是涉及一种字符识别模板匹配方法、装置、计算机设备、文本识别设备和可读存储介质。
背景技术
随着OCR(Optical Character Recognition,光学字符识别)算法研究的深入,字符识别技术在现实生活中得到了广泛的应用;例如,身份证识别、行驶证识别等等。
因为每种指定卡/证/票据的识别往往因为印刷格式的不同,所以大部分OCR产品只能进行相应印刷格式的卡/证/票据识别,不同的字符识别模板可以针对不同的具有固定印刷格式的卡/证/票据提取感兴趣区域的文字。为了进一步提高字符识别效率,需要从多个字符识别模板自动选择与待识别文本匹配的字符识别模板。传统的一种字符识别模板的自动选择方式,是通过计算每个字符识别模板与待识别文本的文本图像之间的特征相似度,选取特征相似度最大的字符识别模板对待识别文本的文本图像进行字符识别处理。
然而在实际应用中,因为不同卡/证/票据之间可能仅存在细微的印刷格式差异,例如不同地区的增值税电子普通发票,可能仅在同一发票区域的区域间距上存在差异,传统的字符识别模板的自动选择方式存在准确率差的问题,容易出现选错模板,进而导致字符识别出错的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够准确选择字符识别模板的字符识别模板匹配方法、装置、计算机设备、文本识别设备和可读存储介质。
第一方面,一种字符识别模板匹配方法,包括:
获取各字符识别模板和待识别文本的文本图像中每个字符的类型和位置;
针对每个字符识别模板,根据所述字符识别模板和所述文本图像中各同类型的字符的位置,确定所述字符识别模板和所述文本图像之间的多个匹配位置对;以及根据所述字符识别模板和所述文本图像之间的多个匹配位置对,采用特征匹配算法计算所述字符识别模板和所述文本图像之间的目标变换矩阵;
针对每个字符识别模板,采用所述字符识别模板对应的目标变换矩阵,对所述字符识别模板和所述文本图像进行对齐处理,并计算对齐处理后的字符识别模板和文本图像之间文字行区域的匹配度;
从所述各字符识别模板中选择匹配度最高的字符识别模板作为所述文本图像的目标字符识别模板。
在其中一个实施例中,所述采用所述字符识别模板对应的目标变换矩阵,对所述字符识别模板和所述文本图像进行对齐处理,并计算对齐处理后的字符识别模板和文本图像之间文字行区域的匹配度,包括:
采用所述字符识别模板对应的目标变换矩阵,对所述文本图像进行配准处理,并确定所述字符识别模板中文字行区域的位置和配准后的文本图像中文字行区域的位置;
根据所述字符识别模板中文字行区域的位置和所述配准后的文本图像中文字行区域的位置,计算所述字符识别模板中文字行区域和所述配准后的文本图像中文字行区域的匹配度。
在其中一个实施例中,所述采用所述字符识别模板对应的目标变换矩阵,对所述文本图像进行配准处理,并确定所述字符识别模板中文字行区域的位置和配准后的文本图像中文字行区域的位置,包括:
采用所述字符识别模板对应的目标变换矩阵对所述文本图像进行变换处理,得到变换处理后的文本图像;
从所述字符识别模板和所述变换处理后的文本图像中分别检测得到文字行区域的位置。
在其中一个实施例中,所述采用所述字符识别模板对应的目标变换矩阵,对所述文本图像进行配准处理,并确定所述字符识别模板中文字行区域的位置和配准后的文本图像中文字行区域的位置,包括:
从所述字符识别模板和所述文本图像中分别检测得到文字行区域的位置;
采用所述字符识别模板对应的目标变换矩阵对所述文本图像中文字行区域的位置进行变换处理,得到变换处理后的文本图像中文字行区域的位置。
在其中一个实施例中,所述文字行区域的匹配度为所述对齐处理后的字符识别模板中有效文字行区域和文本图像中有效文字行区域的匹配度;所述有效文字行区域为待识别区域与文字行区域的重叠区域。
在其中一个实施例中,所述文字行区域的匹配度为所述对齐处理后的字符识别模板中有效文字行区域和文本图像中有效文字行区域的重叠面积参数。
在其中一个实施例中,所述根据所述字符识别模板和所述文本图像之间的多个匹配位置对,采用特征匹配算法计算所述字符识别模板和所述文本图像之间的目标变换矩阵,包括:
根据所述字符识别模板和所述文本图像之间的多个匹配位置对,采用随机抽样一致算法,计算得到所述字符识别模板和所述文本图像之间的多个变换矩阵和每个变换矩阵对应的内点数目;
从所述字符识别模板和所述文本图像之间的多个变换矩阵中,选取内点数目最多的变换矩阵作为所述目标变换矩阵。
在其中一个实施例中,所述获取各字符识别模板和待识别文本的文本图像中每个字符的类型和位置,包括:
获取各参考字符识别模板和待识别文本的文本图像中每个字符的类型和位置;不同参考字符识别模板属于不同的模板类;
根据每个参考字符识别模板和所述文本图像中各同类型的字符的位置,确定每个参考字符识别模板和所述文本图像之间的多个匹配位置对;以及根据每个参考字符识别模板和所述文本图像之间的多个匹配位置对,采用特征匹配算法从各参考字符识别模板中选取与所述文本图像匹配度最高的参考字符识别模板,并将所述选取的参考字符识别模板所属的模板类作为目标模板类;
获取属于所述目标模板类的各字符识别模板中每个字符的类型和位置。
在其中一个实施例中,所述根据每个参考字符识别模板和所述文本图像之间的多个匹配位置对,采用特征匹配算法从各参考字符识别模板中选取与所述文本图像匹配度最高的参考字符识别模板,包括:
根据所述参考字符识别模板和所述文本图像之间的多个匹配位置对,采用随机抽样一致算法,计算得到所述参考字符识别模板和所述文本图像之间的多个变换矩阵和每个变换矩阵对应的内点数目;
从所述参考字符识别模板和所述文本图像之间的多个变换矩阵中,选取内点数目最多的变换矩阵作为所述目标变换矩阵;
根据所述目标变换矩阵确定所述参考字符识别模板和所述文本图像之间的匹配度;
根据每个参考字符识别模板和所述文本图像之间的匹配度,从各参考字符识别模板中选取与所述文本图像匹配度最高的参考字符识别模板。
在其中一个实施例中,所述根据所述目标变换矩阵确定所述参考字符识别模板和所述文本图像之间的匹配度,包括:
将所述目标变换矩阵对应的内点数目作为所述参考字符识别模板和所述文本图像之间的匹配度。
在其中一个实施例中,所述方法还包括:
当所述字符识别模板和所述文本图像之间存在同一字符对应的多个匹配位置对时,计算每个所述匹配位置对中两个同类型字符之间的特征相似度;从所述多个匹配位置对中选取特征相似度最高的匹配位置对保留,并丢弃其它匹配位置对;
和/或,确定所述字符识别模板中待识别区域的字符,并将所述待识别区域的字符对应的匹配位置对丢弃。
第二方面,一种字符识别模板匹配装置,包括:
字符获取模块,用于获取各字符识别模板和待识别文本的文本图像中每个字符的类型和位置;
变换矩阵计算模块,用于针对每个字符识别模板,根据所述字符识别模板和所述文本图像中各同类型的字符的位置,确定所述字符识别模板和所述文本图像之间的多个匹配位置对;以及根据所述字符识别模板和所述文本图像之间的多个匹配位置对,采用特征匹配算法计算所述字符识别模板和所述文本图像之间的目标变换矩阵;
匹配度计算模块,用于针对每个字符识别模板,采用所述字符识别模板对应的目标变换矩阵,对所述字符识别模板和所述文本图像进行对齐处理,并计算对齐处理后的字符识别模板和文本图像之间文字行区域的匹配度;
模板选择模块,用于从所述各字符识别模板中选择匹配度最高的字符识别模板作为所述文本图像的目标字符识别模板。
第三方面,一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现第一方面中任一项所述方法的步骤。
第四方面,一种文本识别设备,包括处理器、存储器和拍摄装置,所述拍摄装置用于拍摄待识别文本,获取所述待识别文本的文本图像;所述处理器执行所述计算机程序时实现以下步骤:
获取各字符识别模板和待识别文本的文本图像中每个字符的类型和位置;
针对每个字符识别模板,根据所述字符识别模板和所述文本图像中各同类型的字符的位置,确定所述字符识别模板和所述文本图像之间的多个匹配位置对;以及根据所述字符识别模板和所述文本图像之间的多个匹配位置对,采用特征匹配算法计算所述字符识别模板和所述文本图像之间的目标变换矩阵;
针对每个字符识别模板,采用所述字符识别模板对应的目标变换矩阵,对所述字符识别模板和所述文本图像进行对齐处理,并计算对齐处理后的字符识别模板和文本图像之间文字行区域的匹配度;
从所述各字符识别模板中选择匹配度最高的字符识别模板作为所述文本图像的目标字符识别模板;
采用所述目标字符识别模板对所述文本图像进行字符识别处理,得到所述待识别文本的字符识别处理结果。
第五方面,一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现第一方面中任一项所述的方法的步骤。
上述字符识别模板匹配方法、装置、计算机设备、文本识别设备和可读存储介质,计算机设备可以针对每个字符识别模板,根据字符识别模板和文本图像中各同类型的字符的位置,确定字符识别模板和文本图像之间的多个匹配位置对;以及根据多个匹配位置对,采用特征匹配算法计算字符识别模板和文本图像之间的目标变换矩阵;从而采用字符识别模板对应的目标变换矩阵,对字符识别模板和文本图像进行对齐处理,并计算对齐处理后的字符识别模板和文本图像中文字行区域的匹配度,选择匹配度最高的字符识别模板作为目标字符识别模板;即使各个字符识别模板之间差异较小,例如仅在同一文字行区域的区域间距上存在差异,或者在同一文字行区域的位置上存在微小差异,但是这些差异均可以被每个字符识别模板与文本图像之间的文字行区域的匹配度所表征,从而可以被检测到,因此解决了细微差异模板之间的区分难题,可以提高为待识别文本选择字符识别模板的准确性,同时提高了通用文本识别的效率和准确率。
附图说明
图1为一个实施例中字符识别模板匹配方法的应用环境图;
图2为一个实施例中字符识别模板匹配方法的流程示意图;
图3为一个实施例中文字行区域的匹配度的计算过程的流程示意图;
图4为一个实施例中目标变换矩阵的计算过程的流程示意图;
图5为一个实施例中选择目标模板类的流程示意图;
图6a为一个实施例中字符识别模板匹配方法的示意图之一;
图6b为一个实施例中字符识别模板匹配方法的示意图之二;
图6c为一个实施例中字符识别模板匹配方法的示意图之三;
图6d为一个实施例中字符识别模板匹配方法的示意图之四;
图7为一个实施例中字符识别模板匹配装置的结构框图;
图8为一个实施例中计算机设备的内部结构图;
图9为一个实施例中文本识别设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的字符识别模板匹配方法,可以应用于计算机设备中。其中,计算机设备可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、便携式可穿戴设备等终端,也可以是服务器。示例性地,当计算机设备为终端时,如图1所示,终端中可以预存有各字符识别模板,终端可以拍摄获得待识别文本的文本图像,并从各字符识别模板中选择出与待识别文本匹配的目标字符识别文本,并采用目标字符识别模板对待识别文本的文本图像进行字符识别处理。示例性地,当计算机设备为服务器时,服务器中可以预存有各字符识别模板,可以接收终端发送的待识别文本的文本图像,并从各字符识别模板中选择与待识别文本匹配的目标字符识别文本;然后服务器可以将目标字符识别文本发送给终端,并由终端采用目标字符识别模板对待识别文本的文本图像进行字符识别处理;服务器也可以采用目标字符识别模板对待识别文本的文本图像进行字符识别处理,并将字符识别处理结果发送给终端。
在一个实施例中,如图2所示,提供了一种字符识别模板匹配方法,以该方法应用于计算机设备为例进行说明,包括以下步骤:
S201,获取各字符识别模板和待识别文本的文本图像中每个字符的类型和位置。
其中,待识别文本可以包括但不限于:证件、票据、卡、邮寄标识、商品标识、报刊、书籍、档案等具有相应固定格式的文本。字符的类型可以包括该字符所对应的标准字符,标准字符包括但不限于简体汉字、繁体汉字、英文字母、数字等标准的字符,也可以为自定义的字符,本实施例对此并不限制;字符的位置可以但不限于是属于该字符的各像素点在文本图像中的位置坐标、围绕该字符的标准字符框(形状不限于正方形、长方形、圆形等)在文本图像中的位置等,本实施例对此并不限制。当然,字符的类型还可以包括:字符大小、字符字体、字符颜色等。
需要说明的是,字符识别模板可以是图像格式,也可以是其它可以转换为图像的格式,本实施例对此并不限制;每个字符识别模板可以对应一种固定格式的字符识别产品。
可以理解的是,上述字符识别模板中每个字符的类型和位置可以是预先存储的,计算机设备可以直接获取到,而无需进行字符识别处理。计算机设备也可以先采用字符检测模型对字符识别模板进行字符检测,检测出字符区域,即字符的位置;然后采用字符识别模型对字符区域进行字符识别,得到字符区域中字符的类型。其中,每个字符可以为单个字符,也可以是多个字符的组合;相应地,字符检测可以是中文单字检测、中文词组检测、英文字母检测、英文单词检测等等。另外,在进行字符识别之前,还可以进行如下的预处理:灰度化、二值化、降噪、倾斜矫正、文字切分等。文本图像中每个字符的类型和位置的获取方式可以参照字符识别模板,这里不再赘述。
示例性地,上述字符检测模型和字符识别模型均可以是神经网络模型,可以分别采用标注有字符区域的字符识别模板以及标注有字符类型的字符识别模板训练得到。当然,上述字符识别模型也可以是别的类型的分类模型,例如支持向量机分类模型。
S202,针对每个字符识别模板,根据字符识别模板和文本图像中各同类型的字符的位置,确定字符识别模板和文本图像之间的多个匹配位置对;以及根据字符识别模板和文本图像之间的多个匹配位置对,采用特征匹配算法计算字符识别模板和文本图像之间的目标变换矩阵。
针对每个字符识别模板,上述同类型的字符可以指的是字符识别模板中某一类型的字符与文本图像中同一类型的字符,这两个同类型的字符的位置可以组成一个匹配位置对,即包括上述同类型的字符在字符识别模板中的位置和在文本图像中的位置;对于每个字符识别模板和文本图像而言,二者之间可以存在多个匹配位置对。
可以理解的是,多个匹配位置对为字符识别模板和文本图像之间互相匹配的特征;计算机设备可以采用最小二乘法、归一化互相关算法(NCC,Normalized CrossCorrelation)、ICP算法(Iterative Closest Point,迭代最近点)、随机抽样一致算法(Random sample consensus,RANSAC)等特征匹配算法,计算字符识别模板和文本图像之间的目标变换矩阵。
S203,针对每个字符识别模板,采用字符识别模板对应的目标变换矩阵,对字符识别模板和文本图像进行对齐处理,并计算对齐处理后的字符识别模板和文本图像之间文字行区域的匹配度。
其中,文字行区域的匹配度为对齐处理后的字符识别模板中文字行区域和文本图像中文字行区域之间的匹配度,表征对齐处理后的字符识别模板中文字行区域和文本图像中文字行区域的匹配程度,可以是对齐处理后的字符识别模板中文字行区域和文本图像中文字行区域的重叠面积参数,也可以是对齐处理后的字符识别模板中文字行区域和文本图像中文字行区域的相对距离参数,也可以是其它匹配程度的评价指标。
需要说明的是,字符识别模板中的文字行区域为字符识别模板中字符行所在的区域。另外需要说明的是,不同的字符识别模板对应不同的固定格式,文字行区域的位置属于极为重要的格式,因此不同的字符识别模板的文字行区域的位置存在差异;因此文字行区域的匹配度可以显著表征不同字符识别模板之间的差异。
示例性地,以存在多个文字区域为例,针对对齐处理后的字符识别模板和文本图像,计算机设备可以获取文本图像中多个文字行区域的位置,以及字符识别模板中多个文字行区域的位置;每个文字行区域的位置可以为每个文字行区域的中心坐标;然后针对文本图像中每个文字行区域,计算文本图像中该文字行区域和字符识别模板中每个文字行区域的相对距离,选择字符识别模板中与该文字行区域相对距离最小的文字行区域作为该文字行区域的匹配文字行区域;最后计算文本图像中每个文字行区域与其匹配文字行区域之间的距离的统计值,作为相对距离参数;该统计值可以为和值、平均值等。
需要说明的是,该目标变换矩阵可以是从字符识别模板向文本图像进行变换的矩阵,也可以是从文本图像向字符识别模板进行变换的矩阵;这两个矩阵存在对应关系。在一种实施方式中,该目标变换矩阵为从字符识别模板向文本图像进行变换的矩阵,则计算机设备可以采用字符识别模板对应的目标变换矩阵,对字符识别模板进行配准处理,并确定文本图像中文字行区域的位置和配准后的字符识别模板中文字行区域的位置;根据文本图像中文字行区域的位置和配准后的字符识别模板中文字行区域的位置,计算配准后的字符识别模板和文本图像中文字行区域的匹配度。具体实施可以参照后面的描述,这里不再赘述。
可以理解的是,即使各个字符识别模板之间差异较小,例如仅在同一文字行区域的区域间距上存在差异,或者在同一文字行区域的位置上存在微小差异,但是这些差异均可以被每个字符识别模板与文本图像之间的文字行区域的匹配度所表征,从而可以被检测到,因此高效地解决了细微差异模板之间的区分难题,可以提高为待识别文本选择字符识别模板的准确性。
S204,从各字符识别模板中选择匹配度最高的字符识别模板作为文本图像的目标字符识别模板。
需要说明的是,匹配度最高的字符识别模板可以是匹配度最高的一个字符识别模板,也可以是最大的N个(相当于是匹配度从高到低排在前N位)字符识别模板,其中,N为大于1的整数,可以为2、3等;相应地,目标字符识别模板可以为1个或多个。
在本实施例的字符识别模板匹配方法中,计算机设备可以针对每个字符识别模板,根据字符识别模板和文本图像中各同类型的字符的位置,确定字符识别模板和文本图像之间的多个匹配位置对;以及根据多个匹配位置对,采用特征匹配算法计算字符识别模板和文本图像之间的目标变换矩阵;从而采用字符识别模板对应的目标变换矩阵,对字符识别模板和文本图像进行对齐处理,并计算对齐处理后的字符识别模板和文本图像中文字行区域的匹配度,选择匹配度最高的字符识别模板作为目标字符识别模板;即使各个字符识别模板之间差异较小,例如仅在同一文字行区域的区域间距上存在差异,或者在同一文字行区域的位置上存在微小差异,但是这些差异均可以被每个字符识别模板与文本图像之间的文字行区域的匹配度所表征,从而可以被检测到,因此解决了细微差异模板之间的区分难题,可以提高为待识别文本选择字符识别模板的准确性,同时提高了通用文本识别的效率和准确率。
可选地,上述方法还可以包括对匹配位置对进行筛选的过程,在一种实施方式中,筛选过程可以包括:当字符识别模板和文本图像之间存在同一字符对应的多个匹配位置对时,计算每个匹配位置对中两个同类型字符之间的特征相似度;从多个匹配位置对中选取特征相似度最高的匹配位置对保留,并丢弃其它匹配位置对。可选地,计算机设备可以获取每个匹配位置对中两个同类型字符的特征;计算两个同类型字符的特征之间的相似度,作为每个匹配特征对中两个同类型字符之间的特征相似度;其中,字符的特征包括但不限于颜色、字体、大小等参数。
示例性地,字符识别模板中存在两个“国”字,文本图像中也存在两个“国”字,则对于文本图像中的一个字“国”字而言,符识别模板和文本图像之间存在该“国”字对应的2个匹配位置对,而实际上最多只有1个合理的匹配位置对。因此,计算机设备可以计算该“国”字对应的每个匹配位置对中两个“国”字之间的特征相似度,保留特征相似度较高的匹配位置对,并丢弃特征相似度较低的匹配位置对。示例性地,计算机设备可以获取该“国”字对应的每个匹配位置对中两个“国”字的大小(例如可以是该字符的面积与文本图像的面积的比值),并将每个匹配位置对中两个“国”字的大小的差值作为每个匹配位置对的特征相似度。
此外,在一种实施方式中,筛选过程也可以包括:确定字符识别模板中待识别区域的字符,并将待识别区域的字符对应的匹配位置对丢弃。可以理解的是,每个字符识别模板的待识别区域的位置为每个字符识别模板的特性,是已知的,相应地,与该字符识别模板匹配的文本图像中待识别区域的字符是多变的,因此字符识别模板的待识别区域中的字符对应的匹配位置对并不合理,应该丢弃;如此,可以降低噪声,提高为待识别文本选择字符识别模板的准确性。
在一个实施例中,参照图3所示,本实施例涉及文字行区域的匹配度的计算过程,具体可以包括:
S301,采用字符识别模板对应的目标变换矩阵,对文本图像进行配准处理,并确定字符识别模板中文字行区域的位置和配准后的文本图像中文字行区域的位置。
可以理解的是,字符识别模板中文字行区域的位置可以是预先存储的,计算机设备可以直接获取到,而无需进行文字行检测处理。计算机设备也可以先采用文字行检测模型对字符识别模板进行文字行检测,检测出文字行区域的位置。当然,字符识别模板中的文字行区域可以为一个,也可以为多个;相应地,每个文字行区域的位置可以体现为文字行区域的边界坐标,或者属于文字行区域的像素坐标,或者为文字行区域的中心坐标等等。示例性地,上述文字行检测模型可以是神经网络模型,可以采用标注有文字行区域的字符识别模板训练得到。文本图像中文字行区域的位置的获取方式可以参照字符识别模板,这里不再赘述。
在一种实施方式中,计算机设备可以采用字符识别模板对应的目标变换矩阵对文本图像进行变换处理,得到变换处理后的文本图像;从字符识别模板和变换处理后的文本图像中分别检测得到文字行区域的位置。也就是说,先采用目标变换矩阵对文本图像进行变换处理,然后确定变换处理后的文本图像中文字行区域的位置。
在一种实施方式中,计算机设备可以从字符识别模板和文本图像中分别检测得到文字行区域的位置;采用字符识别模板对应的目标变换矩阵对文本图像中文字行区域的位置进行变换处理,得到配准后的文本图像中文字行区域的位置。也就是说,先确定文本图像中文字行区域的位置,然后采用目标变换矩阵对文本图像中文字行区域的位置进行变换处理,得到变换处理后的文本图像中文字行区域的位置。
示例性地,目标变换矩阵可以为透视变换矩阵或仿射变换矩阵。透视变换矩阵可以为3×3矩阵,具有9个透视变换系数;仿射变换矩阵可以为2×3矩阵,具有6个仿射变换系数。以透视变换为例,透视变换矩阵可以为A,可以如下所示:
其中,[x y z]T为透视变换前的文本图像中某个像素的位置坐标,[X Y Z]T为透视变换后的该像素的位置坐标。一般地,文本图像为二维图像,坐标Z和z的值可以为单位坐标1。
S302,根据字符识别模板中文字行区域的位置和配准后的文本图像中文字行区域的位置,计算字符识别模板中文字行区域和配准后的文本图像中文字行区域的匹配度。
可选地,文字行区域的匹配度为对齐处理后的字符识别模板中有效文字行区域和文本图像中有效文字行区域的匹配度;有效文字行区域为待识别区域与文字行区域的重叠区域。具体地,计算机设备可以获取字符识别模板的待识别区域的位置和文字行区域的位置,从而计算得到字符识别模板的待识别区域和文字行区域的重叠区域的位置;同样地,计算机设备可以获取配准后的文本图像的待识别区域的位置和文字行区域的位置,从而计算得到配准后的文本图像的待识别区域和文字行区域的重叠区域的位置,其中,配准后的文本图像的待识别区域的位置为字符识别模板的待识别区域的位置。其中,待识别区域的位置可以通过神经网络检测得到,该神经网络可以通过标识有待识别区域的字符识别模板训练得到。
示例性地,该匹配度为重叠面积参数,表征对齐处理后的字符识别模板中的有效文字行区域和文本图像中有效文字行区域的重叠程度,可以是对齐处理后的字符识别模板中的有效文字行区域和文本图像中有效文字行区域的重叠面积的大小,也可以是该重叠面积与文本图像大小的比值,或者是该重叠面积与文本图像中有效文字行区域的面积的比值,或者是该重叠面积与文本图像中文字行区域的面积的比值,或者是其它定义。
在本实施例的字符识别模板匹配方法中,计算机设备可以采用字符识别模板对应的目标变换矩阵,对文本图像进行配准处理,并确定字符识别模板中文字行区域的位置和配准后的文本图像中文字行区域的位置,从而可以根据字符识别模板和配准后的文本图像中文字行区域的位置,计算得到字符识别模板中文字行区域和配准后的文本图像中文字行区域的匹配度,以实现对各差异较小的字符识别模板的区分,为待识别文本匹配到合适的字符识别模板。
在一个实施例中,参照图4所示,本实施例涉及目标变换矩阵的计算过程,具体可以包括:
S401,根据字符识别模板和文本图像之间的多个匹配位置对,采用随机抽样一致算法,计算得到字符识别模板和文本图像之间的多个变换矩阵和每个变换矩阵对应的内点数目;
S402,从字符识别模板和文本图像之间的多个变换矩阵中,选取内点数目最多的变换矩阵作为目标变换矩阵。
示例性地,以字符识别模板和文本图像之间存在20个匹配位置对为例,进行随机抽样一致算法的说明:
(1)从20个匹配位置对中选取任意5个匹配位置对作为内点;
(2)以选取的5个匹配位置对计算得到变换矩阵1,并基于变换矩阵1判断其余15个匹配位置对是否属于内点;例如,针对某个匹配位置对,当采用该匹配位置对中某个字符在文本图像中的位置,基于变换矩阵1得到该字符在字符识别模板中的参考位置,当该字符在字符识别模板中的参考位置与该字符在字符识别模板中的位置(实际位置)之间的距离小于预设阈值时,则确定该匹配位置对属于内点,否则不属于内点;从而可以统计得到与变换矩阵1对应的内点数目,例如为8;
(3)选取与之前不同的5个匹配位置对作为内点,执行上述(2)的过程,从而可以得到变换矩阵2与变换矩阵2对应的内点数目,例如为9;
(4)重复执行(3)直至重复执行次数达到预设数目,可以得到多个变换矩阵和每个变换矩阵对应的内点数目;
(5)从多个变换矩阵中,选取内点数目最多的变换矩阵;判断选取的变换矩阵的内点数目是否大于预设内点数目,若是,则将该选取的变换矩阵作为目标变换矩阵。
其中,预设内点数目可以保证内点数目最多的变化矩阵的最低内点数目,以保证目标变换矩阵的合理性。预设内点数目可以为文本图像中字符数目与预设比例的乘积;示例性地,预设比例可以为30%-70%。
可以理解的是,采用随机抽样一致算法相当于是对字符识别模板和文本图像之间的多个匹配位置对进行筛选,筛选得到最优的多个匹配位置对对应的目标变换矩阵,从而提高了计算的目标变换矩阵的准确性。
需要说明的是,本实施例中的随机抽样一致算法还可以替换为随机抽样一致算法的改进算法,例如渐进一致采样法(PROSAC,Progressive sample consensus)、NAPSAC法(N-Adjacent points sample consensus,基于N维超球面)、分组一致采样法(Group SAC,Group sample consensus)等。
可以理解的是,计算机设备可以先从多个模板类中选取与文本图像匹配度最高的目标模板类,再从目标模板类中选取与文本图像匹配度最高的目标字符识别模板。在一个实施例中,参照图5所示,上述S201具体可以包括:
S501,获取各参考字符识别模板和待识别文本的文本图像中每个字符的类型和位置;不同参考字符识别模板属于不同的模板类。
计算机设备中可以存储有不同的模板类,也可以是从其它计算机设备中获取得到;每个模板类可以包括至少一个字符识别模板,即计算机设备存储有字符识别模板与模板类之间的所属关系;每个模板类的参考字符识别模板可以是该模本类中的任意一个或多个字符识别模板,也可以是针对该模板类预先设置的一个或多个字符识别模板。
其中,不同字符识别模板可以预先通过经验分为不同模板类,当然也可以由计算机设备采用预设的分类规则自动将各字符识别模板分类为不同模板类。示例性地,计算机设备可以按照模板类型对各字符识别模板进行分类;以票据为例,模板类型可以但不限于票据类型、票据大小、票据流通地区、票据版本等。示例性地,计算机设备可以采用机器学习算法根据各字符识别模板的特征对各字符识别模板进行分类,机器学习算法包括但不限于聚类、神经网络分类算法、支持向量机分类算法等。其中,字符识别模板的特征可以但不限于是字符识别模板的模板类型、字符识别模板中每个字符的类型和位置等。同样地,计算机设备也可以从每个模板类中选取一个字符识别模板作为上述字符识别模板;示例性地,当采用聚类算法进行分类时,可以将聚类中心对应的字符识别模板作为相应模板类的参考字符识别模板。
参照上述S201中的描述,计算机设备可以采用类似的方式获取各参考字符识别模板和待识别文本的文本图像中每个字符的类型和位置;这里不再赘述。
S502,根据每个参考字符识别模板和文本图像中各同类型的字符的位置,确定每个参考字符识别模板和文本图像之间的多个匹配位置对;以及根据每个参考字符识别模板和文本图像之间的多个匹配位置对,采用特征匹配算法从各参考字符识别模板中选取与文本图像匹配度最高的参考字符识别模板,并将选取的参考字符识别模板所属的模板类作为目标模板类。
可以理解的是,多个匹配位置对为参考字符识别模板和文本图像之间互相匹配的特征。因此可以基于此,计算机设备可以计算得到每个参考字符识别模板和文本图像之间的匹配度,并将匹配度最高的参考字符识别模板所属的模板类作为目标模板类。其中,目标模板类可以为一个,也可以为多个;具体描述可以参照上述目标字符识别模板的描述,这里不再赘述。其中,匹配度计算方法存在多种,在下面进行示例说明。
可选地,针对某个参考字符识别模板,计算机设备可以根据参考字符识别模板和文本图像中多个匹配位置对,采用最小二乘法拟合得到参考字符识别模本中各类型的字符与文本图像中同一类型的字符之间的位置对应关系,并采用位置对应关系和文本图像中每个字符的位置,计算每个字符在该参考字符识别模板中的参考位置,并计算各字符在参考字符识别模板中的位置(实际位置)与参考位置之间的标准差。
可选地,计算机设备可以采用特征匹配算法计算每个参考字符识别模板和文本图像之间的目标变换矩阵,再基于每个参考字符识别模板对应的目标变换矩阵,计算每个参考字符识别模板和文本图像之间的匹配度。示例性地,计算机设备可以针对每个参考字符识别模板,在采用该参考字符识别模板对应的目标变换矩阵对该参考字符识别模板进行对齐处理后,计算对齐处理后的该参考字符识别模板和文本图像之间文字行区域的匹配度,作为该参考字符识别模板和文本图像之间的匹配度;具体过程见相应实施例的描述,这里不再赘述。
示例性地,计算机设备可以根据参考字符识别模板和文本图像之间的多个匹配位置对,采用随机抽样一致算法,计算得到参考字符识别模板和文本图像之间的多个变换矩阵和每个变换矩阵对应的内点数目;从参考字符识别模板和文本图像之间的多个变换矩阵中,选取内点数目最多的变换矩阵作为目标变换矩阵;根据目标变换矩阵确定参考字符识别模板和文本图像之间的匹配度;根据每个参考字符识别模板和文本图像之间的匹配度,从各参考字符识别模板中选取与文本图像匹配度最高的参考字符识别模板。进一步地,计算机设备可以直接将目标变换矩阵对应的内点数目作为参考字符识别模板和文本图像之间的匹配度,降低计算量,更加高效。
S503,获取属于目标模板类的各字符识别模板中每个字符的类型和位置。
计算机设备在确定目标模板类后,可以仅获取属于目标模板类的各字符识别模板中每个字符的类型和位置,以从属于目标模板类的各字符识别模板中选取目标字符识别模板,相比于直接从所有字符识别模板中选取目标字符识别模板而言,极大地降低了计算量。
在本实施例的字符识别模板匹配方法中,计算机设备可以先根据每个参考字符识别模板和文本图像之间的多个匹配位置对,从各参考字符识别模板中选取与文本图像匹配度最高的参考字符识别模板,并将选取的参考字符识别模板所属的模板类作为目标模板类;然后可以在目标模板类的各字符识别模板中选取与文本图像匹配度最高的字符识别模板,作为文本图像的目标字符识别模板。可以理解的是,各参考字符识别模板和文本图像之间的匹配度表征了各模板类与文本图像之间的匹配度,每个模板类内各字符识别模板之间的差异相对较小,但是各模板类的参考字符识别模板之间的差异相对较大,因此计算机设备可以先从各模板类中粗筛到与文本图像匹配度最高的目标模板类,进而再从目标模板类中细筛到与文本图像匹配度最高的目标字符识别模板,相比于直接从所有字符识别模板中选取目标字符识别模板而言,极大地降低了计算量,提高了目标字符识别模板的选取效率。
下面参照图6a-6d,从另一个角度对本实施例的方案进行描述。
1)通过单字识别各字符的位置作为文本图像和各参考字符识别模板的特征点,进行特征匹配;
参照图6a所示,左侧是某个参考字符识别模板,右侧是待识别文本的文本图像;左侧上的实线框表示该参考字符识别模板对应的待识别区域,左侧和右侧之间的连线表征该参考字符识别模板和文本图像之间的多个匹配位置对;
2)参照图6a所示,该参考字符识别模板和文本图像之间存在同一字符对应的多个匹配位置对,即一对多或者多对多的情况;因此可以过滤掉待识别区域的文字对应的匹配位置对,以及从多个匹配位置对中选取特征相似度最高的匹配位置对保留,并丢弃其它匹配位置对;这样,参照图6b所示,同一个字符对应一个匹配位置对;
3)通过RANSAC算法从每个参考字符识别模板的多个匹配位置对中筛选内点,选择内点数目最大的参考字符识别模板所属的模板类作为目标模板类;但是如果其内点个数小于5(仅对应示意图),那么待识别文本得不到匹配的字符识别模板;
4)参照图6c中左侧的虚线框区域,为检测到的参考字符识别模板中文字行区域的位置;参照图6c中右侧的中心线框区域,为检测到的文本图像中文字行区域的位置;
5)参照图6d所示,计算对齐处理后的字符识别模板中有效文字行区域和文本图像中有效文字行区域的重叠面积的大小,然后计算该重叠面积与文本图像中文字行区域的面积的比值,作为待识别区域的重叠面积比率;其中,字符识别模板中有效文字行区域为灰色填充框区域与待识别区域的重叠区域,文本图像中有效文字行区域为斜线填充框区域与待识别区域的重叠区域;
6)选取待识别区域的重叠面积比率最大的字符识别模板,作为待识别文本匹配的目标字符识别模板;
7)采用目标字符识别模板对待识别文本进行字符识别处理,示例性地,采用目标字符识别模板对应的目标变换矩阵对待识别文本的文本图像进行变换处理,然后采用目标字符识别模板的待识别区域的位置,确定变换处理后的文本图像中的待识别区域,最后对变换处理后的文本图像中的待识别区域进行字符识别处理,得到多个待识别区域对应的字符识别处理结果。
应该理解的是,虽然图2-5的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-5中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图7所示,提供了一种字符识别模板匹配装置,可以包括:字符获取模块71、变换矩阵计算模块72、匹配度计算模块73和模板选择模块74,其中:
字符获取模块71,用于获取各字符识别模板和待识别文本的文本图像中每个字符的类型和位置;
变换矩阵计算模块72,用于针对每个字符识别模板,根据字符识别模板和文本图像中各同类型的字符的位置,确定字符识别模板和文本图像之间的多个匹配位置对;以及根据字符识别模板和文本图像之间的多个匹配位置对,采用特征匹配算法计算字符识别模板和文本图像之间的目标变换矩阵;
匹配度计算模块73,用于针对每个字符识别模板,采用字符识别模板对应的目标变换矩阵,对字符识别模板和文本图像进行对齐处理,并计算对齐处理后的字符识别模板和文本图像之间文字行区域的匹配度;
模板选择模块74,用于从各字符识别模板中选择匹配度最高的字符识别模板作为文本图像的目标字符识别模板。
可选地,匹配度计算模块73可以包括:配准单元,用于采用字符识别模板对应的目标变换矩阵,对文本图像进行配准处理,并确定字符识别模板中文字行区域的位置和配准后的文本图像中文字行区域的位置;匹配度计算单元,用于根据字符识别模板中文字行区域的位置和配准后的文本图像中文字行区域的位置,计算字符识别模板中文字行区域和配准后的文本图像中文字行区域的匹配度。
可选地,配准单元具体用于采用字符识别模板对应的目标变换矩阵对文本图像进行变换处理,得到变换处理后的文本图像;从字符识别模板和变换处理后的文本图像中分别检测得到文字行区域的位置。
可选地,配准单元具体用于从字符识别模板和文本图像中分别检测得到文字行区域的位置;采用字符识别模板对应的目标变换矩阵对文本图像中文字行区域的位置进行变换处理,得到变换处理后的文本图像中文字行区域的位置。
可选地,文字行区域的匹配度为对齐处理后的字符识别模板中有效文字行区域和文本图像中有效文字行区域的匹配度;有效文字行区域为待识别区域与文字行区域的重叠区域。
可选地,文字行区域的匹配度为对齐处理后的字符识别模板中有效文字行区域和文本图像中有效文字行区域的重叠面积参数。
可选地,变换矩阵计算模块72可以包括:变换矩阵计算单元,用于根据字符识别模板和文本图像之间的多个匹配位置对,采用随机抽样一致算法,计算得到字符识别模板和文本图像之间的多个变换矩阵和每个变换矩阵对应的内点数目;变换矩阵筛选单元,用于从字符识别模板和文本图像之间的多个变换矩阵中,选取内点数目最多的变换矩阵作为目标变换矩阵。
可选地,字符获取模块71可以包括:模板类字符获取单元,用于获取各参考字符识别模板和待识别文本的文本图像中每个字符的类型和位置;不同参考字符识别模板属于不同的模板类;模板类选择单元,用于根据每个参考字符识别模板和文本图像中各同类型的字符的位置,确定每个参考字符识别模板和文本图像之间的多个匹配位置对;以及根据每个参考字符识别模板和文本图像之间的多个匹配位置对,采用特征匹配算法从各参考字符识别模板中选取与文本图像匹配度最高的参考字符识别模板,并将选取的参考字符识别模板所属的模板类作为目标模板类;目标模板类字符获取单元,用于获取属于目标模板类的各字符识别模板中每个字符的类型和位置。
可选地,模板类选择单元具体用于根据参考字符识别模板和文本图像之间的多个匹配位置对,采用随机抽样一致算法,计算得到参考字符识别模板和文本图像之间的多个变换矩阵和每个变换矩阵对应的内点数目;从参考字符识别模板和文本图像之间的多个变换矩阵中,选取内点数目最多的变换矩阵作为目标变换矩阵;根据目标变换矩阵确定参考字符识别模板和文本图像之间的匹配度;根据每个参考字符识别模板和文本图像之间的匹配度,从各参考字符识别模板中选取与文本图像匹配度最高的参考字符识别模板。
可选地,模板类选择单元还用于将目标变换矩阵对应的内点数目作为参考字符识别模板和文本图像之间的匹配度。
可选地,该装置还可以包括:第一匹配位置对筛选模块,用于当字符识别模板和文本图像之间存在同一字符对应的多个匹配位置对时,计算每个匹配位置对中两个同类型字符之间的特征相似度;从多个匹配位置对中选取特征相似度最高的匹配位置对保留,并丢弃其它匹配位置对;和/或,第二匹配位置对筛选模块,用于确定字符识别模板中待识别区域的字符,并将待识别区域的字符对应的匹配位置对丢弃。
关于字符识别模板匹配装置的具体限定可以参见上文中对于字符识别模板匹配方法的限定,在此不再赘述。上述字符识别模板匹配装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取各字符识别模板和待识别文本的文本图像中每个字符的类型和位置;
针对每个字符识别模板,根据字符识别模板和文本图像中各同类型的字符的位置,确定字符识别模板和文本图像之间的多个匹配位置对;以及根据字符识别模板和文本图像之间的多个匹配位置对,采用特征匹配算法计算字符识别模板和文本图像之间的目标变换矩阵;
针对每个字符识别模板,采用字符识别模板对应的目标变换矩阵,对字符识别模板和文本图像进行对齐处理,并计算对齐处理后的字符识别模板和文本图像之间文字行区域的匹配度;
从各字符识别模板中选择匹配度最高的字符识别模板作为文本图像的目标字符识别模板。
该计算机设备可以是终端,其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种字符识别模板匹配方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
在一个实施例中,参照图9所示,提供了一种文本识别设备,包括处理器、存储器和拍摄装置,拍摄装置用于拍摄待识别文本,获取待识别文本的文本图像;该处理器执行计算机程序时实现以下步骤:
获取各字符识别模板和待识别文本的文本图像中每个字符的类型和位置;
针对每个字符识别模板,根据字符识别模板和文本图像中各同类型的字符的位置,确定字符识别模板和文本图像之间的多个匹配位置对;以及根据字符识别模板和文本图像之间的多个匹配位置对,采用特征匹配算法计算字符识别模板和文本图像之间的目标变换矩阵;
针对每个字符识别模板,采用字符识别模板对应的目标变换矩阵,对字符识别模板和文本图像进行对齐处理,并计算对齐处理后的字符识别模板和文本图像之间文字行区域的匹配度;
从各字符识别模板中选择匹配度最高的字符识别模板作为文本图像的目标字符识别模板;
采用目标字符识别模板对文本图像进行字符识别处理,得到待识别文本的字符识别处理结果。
本领域技术人员可以理解,图8-9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的设备的限定,具体的设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取各字符识别模板和待识别文本的文本图像中每个字符的类型和位置;
针对每个字符识别模板,根据字符识别模板和文本图像中各同类型的字符的位置,确定字符识别模板和文本图像之间的多个匹配位置对;以及根据字符识别模板和文本图像之间的多个匹配位置对,采用特征匹配算法计算字符识别模板和文本图像之间的目标变换矩阵;
针对每个字符识别模板,采用字符识别模板对应的目标变换矩阵,对字符识别模板和文本图像进行对齐处理,并计算对齐处理后的字符识别模板和文本图像之间文字行区域的匹配度;
从各字符识别模板中选择匹配度最高的字符识别模板作为文本图像的目标字符识别模板。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (15)

1.一种字符识别模板匹配方法,其特征在于,包括:
获取各字符识别模板和待识别文本的文本图像中每个字符的类型和位置;
针对每个字符识别模板,根据所述字符识别模板和所述文本图像中各同类型的字符的位置,确定所述字符识别模板和所述文本图像之间的多个匹配位置对;以及根据所述字符识别模板和所述文本图像之间的多个匹配位置对,采用特征匹配算法计算所述字符识别模板和所述文本图像之间的目标变换矩阵;
针对每个字符识别模板,采用所述字符识别模板对应的目标变换矩阵,对所述字符识别模板和所述文本图像进行对齐处理,并计算对齐处理后的字符识别模板和文本图像之间文字行区域的匹配度;
从所述各字符识别模板中选择匹配度最高的字符识别模板作为所述文本图像的目标字符识别模板。
2.根据权利要求1所述的方法,其特征在于,所述采用所述字符识别模板对应的目标变换矩阵,对所述字符识别模板和所述文本图像进行对齐处理,并计算对齐处理后的字符识别模板和文本图像之间文字行区域的匹配度,包括:
采用所述字符识别模板对应的目标变换矩阵,对所述文本图像进行配准处理,并确定所述字符识别模板中文字行区域的位置和配准后的文本图像中文字行区域的位置;
根据所述字符识别模板中文字行区域的位置和所述配准后的文本图像中文字行区域的位置,计算所述字符识别模板中文字行区域和所述配准后的文本图像中文字行区域的匹配度。
3.根据权利要求2所述的方法,其特征在于,所述采用所述字符识别模板对应的目标变换矩阵,对所述文本图像进行配准处理,并确定所述字符识别模板中文字行区域的位置和配准后的文本图像中文字行区域的位置,包括:
采用所述字符识别模板对应的目标变换矩阵对所述文本图像进行变换处理,得到变换处理后的文本图像;
从所述字符识别模板和所述变换处理后的文本图像中分别检测得到文字行区域的位置。
4.根据权利要求2所述的方法,其特征在于,所述采用所述字符识别模板对应的目标变换矩阵,对所述文本图像进行配准处理,并确定所述字符识别模板中文字行区域的位置和配准后的文本图像中文字行区域的位置,包括:
从所述字符识别模板和所述文本图像中分别检测得到文字行区域的位置;
采用所述字符识别模板对应的目标变换矩阵对所述文本图像中文字行区域的位置进行变换处理,得到变换处理后的文本图像中文字行区域的位置。
5.根据权利要求1所述的方法,其特征在于,所述文字行区域的匹配度为所述对齐处理后的字符识别模板中有效文字行区域和文本图像中有效文字行区域的匹配度;所述有效文字行区域为待识别区域与文字行区域的重叠区域。
6.根据权利要求5所述的方法,其特征在于,所述文字行区域的匹配度为所述对齐处理后的字符识别模板中有效文字行区域和文本图像中有效文字行区域的重叠面积参数。
7.根据权利要求1所述的方法,其特征在于,所述根据所述字符识别模板和所述文本图像之间的多个匹配位置对,采用特征匹配算法计算所述字符识别模板和所述文本图像之间的目标变换矩阵,包括:
根据所述字符识别模板和所述文本图像之间的多个匹配位置对,采用随机抽样一致算法,计算得到所述字符识别模板和所述文本图像之间的多个变换矩阵和每个变换矩阵对应的内点数目;
从所述字符识别模板和所述文本图像之间的多个变换矩阵中,选取内点数目最多的变换矩阵作为所述目标变换矩阵。
8.根据权利要求1-7中任一项所述的方法,其特征在于,所述获取各字符识别模板和待识别文本的文本图像中每个字符的类型和位置,包括:
获取各参考字符识别模板和待识别文本的文本图像中每个字符的类型和位置;不同参考字符识别模板属于不同的模板类;
根据每个参考字符识别模板和所述文本图像中各同类型的字符的位置,确定每个参考字符识别模板和所述文本图像之间的多个匹配位置对;以及根据每个参考字符识别模板和所述文本图像之间的多个匹配位置对,采用特征匹配算法从各参考字符识别模板中选取与所述文本图像匹配度最高的参考字符识别模板,并将所述选取的参考字符识别模板所属的模板类作为目标模板类;
获取属于所述目标模板类的各字符识别模板中每个字符的类型和位置。
9.根据权利要求8所述的方法,其特征在于,所述根据每个参考字符识别模板和所述文本图像之间的多个匹配位置对,采用特征匹配算法从各参考字符识别模板中选取与所述文本图像匹配度最高的参考字符识别模板,包括:
根据所述参考字符识别模板和所述文本图像之间的多个匹配位置对,采用随机抽样一致算法,计算得到所述参考字符识别模板和所述文本图像之间的多个变换矩阵和每个变换矩阵对应的内点数目;
从所述参考字符识别模板和所述文本图像之间的多个变换矩阵中,选取内点数目最多的变换矩阵作为所述目标变换矩阵;
根据所述目标变换矩阵确定所述参考字符识别模板和所述文本图像之间的匹配度;
根据每个参考字符识别模板和所述文本图像之间的匹配度,从各参考字符识别模板中选取与所述文本图像匹配度最高的参考字符识别模板。
10.根据权利要求9所述的方法,其特征在于,所述根据所述目标变换矩阵确定所述参考字符识别模板和所述文本图像之间的匹配度,包括:
将所述目标变换矩阵对应的内点数目作为所述参考字符识别模板和所述文本图像之间的匹配度。
11.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当所述字符识别模板和所述文本图像之间存在同一字符对应的多个匹配位置对时,计算每个所述匹配位置对中两个同类型字符之间的特征相似度;从所述多个匹配位置对中选取特征相似度最高的匹配位置对保留,并丢弃其它匹配位置对;
和/或,确定所述字符识别模板中待识别区域的字符,并将所述待识别区域的字符对应的匹配位置对丢弃。
12.一种字符识别模板匹配装置,其特征在于,包括:
字符获取模块,用于获取各字符识别模板和待识别文本的文本图像中每个字符的类型和位置;
变换矩阵计算模块,用于针对每个字符识别模板,根据所述字符识别模板和所述文本图像中各同类型的字符的位置,确定所述字符识别模板和所述文本图像之间的多个匹配位置对;以及根据所述字符识别模板和所述文本图像之间的多个匹配位置对,采用特征匹配算法计算所述字符识别模板和所述文本图像之间的目标变换矩阵;
匹配度计算模块,用于针对每个字符识别模板,采用所述字符识别模板对应的目标变换矩阵,对所述字符识别模板和所述文本图像进行对齐处理,并计算对齐处理后的字符识别模板和文本图像之间文字行区域的匹配度;
模板选择模块,用于从所述各字符识别模板中选择匹配度最高的字符识别模板作为所述文本图像的目标字符识别模板。
13.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至11中任一项所述方法的步骤。
14.一种文本识别设备,其特征在于,包括处理器、存储器和拍摄装置,所述拍摄装置用于拍摄待识别文本,获取所述待识别文本的文本图像;所述处理器执行所述计算机程序时实现以下步骤:
获取各字符识别模板和待识别文本的文本图像中每个字符的类型和位置;
针对每个字符识别模板,根据所述字符识别模板和所述文本图像中各同类型的字符的位置,确定所述字符识别模板和所述文本图像之间的多个匹配位置对;以及根据所述字符识别模板和所述文本图像之间的多个匹配位置对,采用特征匹配算法计算所述字符识别模板和所述文本图像之间的目标变换矩阵;
针对每个字符识别模板,采用所述字符识别模板对应的目标变换矩阵,对所述字符识别模板和所述文本图像进行对齐处理,并计算对齐处理后的字符识别模板和文本图像之间文字行区域的匹配度;
从所述各字符识别模板中选择匹配度最高的字符识别模板作为所述文本图像的目标字符识别模板;
采用所述目标字符识别模板对所述文本图像进行字符识别处理,得到所述待识别文本的字符识别处理结果。
15.一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至11中任一项所述的方法的步骤。
CN201910767586.7A 2019-08-20 2019-08-20 字符识别模板匹配方法、装置和文本识别设备 Active CN110569850B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910767586.7A CN110569850B (zh) 2019-08-20 2019-08-20 字符识别模板匹配方法、装置和文本识别设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910767586.7A CN110569850B (zh) 2019-08-20 2019-08-20 字符识别模板匹配方法、装置和文本识别设备

Publications (2)

Publication Number Publication Date
CN110569850A true CN110569850A (zh) 2019-12-13
CN110569850B CN110569850B (zh) 2022-07-12

Family

ID=68773932

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910767586.7A Active CN110569850B (zh) 2019-08-20 2019-08-20 字符识别模板匹配方法、装置和文本识别设备

Country Status (1)

Country Link
CN (1) CN110569850B (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111291794A (zh) * 2020-01-21 2020-06-16 上海眼控科技股份有限公司 字符识别方法、装置、计算机设备和计算机可读存储介质
CN111353492A (zh) * 2020-03-12 2020-06-30 上海合合信息科技发展有限公司 一种标准化文档的图像识别和信息提取方法及装置
CN111414914A (zh) * 2020-02-21 2020-07-14 深圳追一科技有限公司 图像识别方法、装置、计算机设备和存储介质
CN111444907A (zh) * 2020-03-24 2020-07-24 上海东普信息科技有限公司 文字识别的方法、装置、设备及存储介质
CN111639643A (zh) * 2020-05-22 2020-09-08 深圳市赛为智能股份有限公司 字符识别方法、装置、计算机设备及存储介质
CN111639648A (zh) * 2020-05-26 2020-09-08 浙江大华技术股份有限公司 证件识别方法、装置、计算设备和存储介质
CN111650220A (zh) * 2020-07-15 2020-09-11 博科视(苏州)技术有限公司 一种基于视觉的图文缺陷检测方法
CN111783765A (zh) * 2020-07-10 2020-10-16 上海淇毓信息科技有限公司 一种识别图像字符的方法、装置和电子设备
CN111783770A (zh) * 2020-01-16 2020-10-16 北京沃东天骏信息技术有限公司 图像的矫正方法、装置和计算机可读存储介质
CN111898544A (zh) * 2020-07-31 2020-11-06 腾讯科技(深圳)有限公司 文字图像匹配方法、装置和设备及计算机存储介质
CN112115932A (zh) * 2020-08-19 2020-12-22 泰康保险集团股份有限公司 文本提取方法、装置、电子设备及存储介质
CN112613506A (zh) * 2020-12-23 2021-04-06 金蝶软件(中国)有限公司 图像中的文本识别方法、装置、计算机设备和存储介质
CN112633279A (zh) * 2020-12-31 2021-04-09 北京市商汤科技开发有限公司 文本识别方法、装置和系统
CN113344876A (zh) * 2021-06-08 2021-09-03 安徽大学 一种ct和cbct间可变形配准方法
CN113553883A (zh) * 2020-04-24 2021-10-26 上海高德威智能交通系统有限公司 一种票据图像识别方法、装置及电子设备
CN113723347A (zh) * 2021-09-09 2021-11-30 京东科技控股股份有限公司 信息提取的方法、装置、电子设备及存储介质
CN113837949A (zh) * 2021-08-19 2021-12-24 广州医软智能科技有限公司 一种图像处理方法和装置
WO2022105524A1 (zh) * 2020-11-17 2022-05-27 深圳壹账通智能科技有限公司 票据分类的方法、装置和计算机设备
CN116363668A (zh) * 2023-05-31 2023-06-30 山东一品文化传媒有限公司 一种图书智能校对方法及系统
US11995905B2 (en) * 2020-02-10 2024-05-28 Beijing Baidu Netcom Science Technology Co., Ltd. Object recognition method and apparatus, and electronic device and storage medium

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101930545A (zh) * 2009-06-24 2010-12-29 夏普株式会社 手写识别方法和设备
CN105260733A (zh) * 2015-09-11 2016-01-20 北京百度网讯科技有限公司 用于处理图像信息的方法和装置
CN105913093A (zh) * 2016-05-03 2016-08-31 电子科技大学 一种用于文字识别处理的模板匹配方法
US20180181808A1 (en) * 2016-12-28 2018-06-28 Captricity, Inc. Identifying versions of a form
CN109086738A (zh) * 2018-08-23 2018-12-25 深圳市深晓科技有限公司 一种基于模板匹配的字符识别方法及装置
CN110135427A (zh) * 2019-04-11 2019-08-16 北京百度网讯科技有限公司 用于识别图像中的字符的方法、装置、设备和介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101930545A (zh) * 2009-06-24 2010-12-29 夏普株式会社 手写识别方法和设备
CN105260733A (zh) * 2015-09-11 2016-01-20 北京百度网讯科技有限公司 用于处理图像信息的方法和装置
CN105913093A (zh) * 2016-05-03 2016-08-31 电子科技大学 一种用于文字识别处理的模板匹配方法
US20180181808A1 (en) * 2016-12-28 2018-06-28 Captricity, Inc. Identifying versions of a form
CN109086738A (zh) * 2018-08-23 2018-12-25 深圳市深晓科技有限公司 一种基于模板匹配的字符识别方法及装置
CN110135427A (zh) * 2019-04-11 2019-08-16 北京百度网讯科技有限公司 用于识别图像中的字符的方法、装置、设备和介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李超: "《北京语言大学青年学者文库 留学生书写行为数据库建设及应用研究》", 31 May 2017, 《北京语言大学出版社》 *

Cited By (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111783770A (zh) * 2020-01-16 2020-10-16 北京沃东天骏信息技术有限公司 图像的矫正方法、装置和计算机可读存储介质
CN111783770B (zh) * 2020-01-16 2024-05-24 北京沃东天骏信息技术有限公司 图像的矫正方法、装置和计算机可读存储介质
CN111291794A (zh) * 2020-01-21 2020-06-16 上海眼控科技股份有限公司 字符识别方法、装置、计算机设备和计算机可读存储介质
US11995905B2 (en) * 2020-02-10 2024-05-28 Beijing Baidu Netcom Science Technology Co., Ltd. Object recognition method and apparatus, and electronic device and storage medium
CN111414914A (zh) * 2020-02-21 2020-07-14 深圳追一科技有限公司 图像识别方法、装置、计算机设备和存储介质
CN111353492B (zh) * 2020-03-12 2023-10-13 上海合合信息科技股份有限公司 一种标准化文档的图像识别和信息提取方法及装置
CN111353492A (zh) * 2020-03-12 2020-06-30 上海合合信息科技发展有限公司 一种标准化文档的图像识别和信息提取方法及装置
CN111444907A (zh) * 2020-03-24 2020-07-24 上海东普信息科技有限公司 文字识别的方法、装置、设备及存储介质
CN111444907B (zh) * 2020-03-24 2023-05-16 上海东普信息科技有限公司 文字识别的方法、装置、设备及存储介质
CN113553883B (zh) * 2020-04-24 2023-04-07 上海高德威智能交通系统有限公司 一种票据图像识别方法、装置及电子设备
CN113553883A (zh) * 2020-04-24 2021-10-26 上海高德威智能交通系统有限公司 一种票据图像识别方法、装置及电子设备
CN111639643A (zh) * 2020-05-22 2020-09-08 深圳市赛为智能股份有限公司 字符识别方法、装置、计算机设备及存储介质
CN111639643B (zh) * 2020-05-22 2023-06-27 深圳市赛为智能股份有限公司 字符识别方法、装置、计算机设备及存储介质
CN111639648B (zh) * 2020-05-26 2023-09-19 浙江大华技术股份有限公司 证件识别方法、装置、计算设备和存储介质
CN111639648A (zh) * 2020-05-26 2020-09-08 浙江大华技术股份有限公司 证件识别方法、装置、计算设备和存储介质
CN111783765B (zh) * 2020-07-10 2024-03-22 上海淇毓信息科技有限公司 一种识别图像字符的方法、装置和电子设备
CN111783765A (zh) * 2020-07-10 2020-10-16 上海淇毓信息科技有限公司 一种识别图像字符的方法、装置和电子设备
CN111650220A (zh) * 2020-07-15 2020-09-11 博科视(苏州)技术有限公司 一种基于视觉的图文缺陷检测方法
CN111650220B (zh) * 2020-07-15 2022-08-09 博科视(苏州)技术有限公司 一种基于视觉的图文缺陷检测方法
CN111898544B (zh) * 2020-07-31 2023-08-08 腾讯科技(深圳)有限公司 文字图像匹配方法、装置和设备及计算机存储介质
CN111898544A (zh) * 2020-07-31 2020-11-06 腾讯科技(深圳)有限公司 文字图像匹配方法、装置和设备及计算机存储介质
CN112115932A (zh) * 2020-08-19 2020-12-22 泰康保险集团股份有限公司 文本提取方法、装置、电子设备及存储介质
CN112115932B (zh) * 2020-08-19 2023-11-14 泰康保险集团股份有限公司 文本提取方法、装置、电子设备及存储介质
WO2022105524A1 (zh) * 2020-11-17 2022-05-27 深圳壹账通智能科技有限公司 票据分类的方法、装置和计算机设备
CN112613506A (zh) * 2020-12-23 2021-04-06 金蝶软件(中国)有限公司 图像中的文本识别方法、装置、计算机设备和存储介质
CN112633279A (zh) * 2020-12-31 2021-04-09 北京市商汤科技开发有限公司 文本识别方法、装置和系统
CN113344876A (zh) * 2021-06-08 2021-09-03 安徽大学 一种ct和cbct间可变形配准方法
CN113344876B (zh) * 2021-06-08 2023-05-12 安徽大学 一种ct和cbct间可变形配准方法
CN113837949B (zh) * 2021-08-19 2024-01-19 广州医软智能科技有限公司 一种图像处理方法和装置
CN113837949A (zh) * 2021-08-19 2021-12-24 广州医软智能科技有限公司 一种图像处理方法和装置
CN113723347B (zh) * 2021-09-09 2023-11-07 京东科技控股股份有限公司 信息提取的方法、装置、电子设备及存储介质
CN113723347A (zh) * 2021-09-09 2021-11-30 京东科技控股股份有限公司 信息提取的方法、装置、电子设备及存储介质
CN116363668B (zh) * 2023-05-31 2023-08-29 山东一品文化传媒有限公司 一种图书智能校对方法及系统
CN116363668A (zh) * 2023-05-31 2023-06-30 山东一品文化传媒有限公司 一种图书智能校对方法及系统

Also Published As

Publication number Publication date
CN110569850B (zh) 2022-07-12

Similar Documents

Publication Publication Date Title
CN110569850B (zh) 字符识别模板匹配方法、装置和文本识别设备
WO2021027336A1 (zh) 基于印章和签名的身份验证方法、装置和计算机设备
CN109829453B (zh) 一种卡证中文字的识别方法、装置以及计算设备
CN110659574B (zh) 文档图像勾选框状态识别后输出文本行内容的方法及系统
CN110866495A (zh) 票据图像识别方法及装置和设备、训练方法和存储介质
CN110738236B (zh) 图像匹配方法、装置、计算机设备及存储介质
US11144752B1 (en) Physical document verification in uncontrolled environments
CN111488881A (zh) 文本图像中手写内容去除方法、装置、存储介质
CN108830275B (zh) 点阵字符、点阵数字的识别方法及装置
CN110705233A (zh) 基于文字识别技术的笔记生成方法、装置和计算机设备
CN114092938B (zh) 图像的识别处理方法、装置、电子设备及存储介质
CN112613506A (zh) 图像中的文本识别方法、装置、计算机设备和存储介质
CN112396047B (zh) 训练样本生成方法、装置、计算机设备和存储介质
CN110569818A (zh) 一种智能阅读学习方法
CN113158895A (zh) 票据识别方法、装置、电子设备及存储介质
CN111291741B (zh) 单据识别方法、装置、计算机设备和存储介质
CN111414914A (zh) 图像识别方法、装置、计算机设备和存储介质
CN108090728B (zh) 一种基于智能终端的快递信息录入方法及录入系统
CN114202759A (zh) 基于深度学习的多币种纸币冠字号识别方法和装置
CN116343237A (zh) 基于深度学习和知识图谱的票据识别方法
CN113673528A (zh) 文本处理方法、装置、电子设备和可读存储介质
CN112507914A (zh) 一种基于存折、票据字符ocr识别方法和识别系统
CN112396057A (zh) 一种字符识别方法、装置及电子设备
CN111414917A (zh) 一种低像素密度文本的识别方法
WO2019071476A1 (zh) 一种基于智能终端的快递信息录入方法及录入系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant