CN115311663A - 一种ocr识别方法和设备 - Google Patents

一种ocr识别方法和设备 Download PDF

Info

Publication number
CN115311663A
CN115311663A CN202210950890.7A CN202210950890A CN115311663A CN 115311663 A CN115311663 A CN 115311663A CN 202210950890 A CN202210950890 A CN 202210950890A CN 115311663 A CN115311663 A CN 115311663A
Authority
CN
China
Prior art keywords
image
detected
recognition
text
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210950890.7A
Other languages
English (en)
Inventor
马嘉林
孙瑛
孙钦平
崔方剑
张春雨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingdao Hisense Information Technology Co ltd
Original Assignee
Qingdao Hisense Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qingdao Hisense Information Technology Co ltd filed Critical Qingdao Hisense Information Technology Co ltd
Priority to CN202210950890.7A priority Critical patent/CN115311663A/zh
Publication of CN115311663A publication Critical patent/CN115311663A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/19007Matching; Proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

本发明公开了一种OCR识别方法和设备,获取待检测图像;通过文本检测模型对所述待检测图像进行文本检测;基于通用图像识别模型匹配所述待检测图像对应的模板,基于所述模板对所述待检测图像进行文本识别,并输出识别结果,通过制作识别图像的模板,将识别图像与模板匹配,实现了对于通用类图像的自动化识别,并自动给出了解析结果,提高了OCR识别的通用性。

Description

一种OCR识别方法和设备
技术领域
本申请涉及图像识别技术领域,更具体地,涉及一种OCR识别方法和设备。
背景技术
OCR(Optical Character Recognition,光学字符识别)是指针对电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定字符形状,然后用字符识别方法将形状翻译成计算机文字的过程。相关技术中,OCR算法基本都是采取模型串联的方式完成的系统部署,即将各个算法模块(例如图像检测子模块、文本检测子模块以及识别子模块)级联起来作为引擎工程的一个进程,具体的处理逻辑按照级联顺序大致有如下步骤:输入图像、预处理、证件检测、文本检测、文本识别、后处理结构化等。
现有技术中的OCR识别方法往往依赖于识别的对象的特点,进行个性化的模版定制,例如针对票据、报纸、教材等识别的对象,甚至针对不同字号、字体的光学字符识别,都需要重新定制相应的光学字符识别模板,才能采用特定的光学字符识别模板的进行识别。
现有技术的OCR识别方法中,定制光学字符识别模板的训练数据量很高,训练时间长,定制识别模板的效率低,很难转移到其他识别对象中应用,定制光学字符识别模板容易受字符变化等因素的影响,OCR识别方法应用的定制光学字符识别模板对对象的依赖性强,影响了OCR识别效率
因此,如何提供一种OCR识别方法,以提高OCR识别的通用性,是目前有待解决的技术问题。
发明内容
本发明提供一种OCR识别方法,用以解决现有技术OCR识别方法通用性低,需要进行模板定制,模板训练难度大的问题,所述方法:
获取待检测图像;
通过文本检测模型对所述待检测图像进行文本检测;
基于通用图像识别模型匹配所述待检测图像对应的模板,基于所述模板对所述待检测图像进行文本识别,并输出识别结果。
在本申请一些实施例中,通过文本检测模型对所述待检测图像进行文本检测,具体为:
获取所述待检测图像的位置特征信息,并基于所述位置特征信息确定所述待检测图像的类型;
调用待检测图像的类型对应的文本检测模型识别所述待检测图像的文本信息的位置,截取所述文本信息的对应位置,并在截取后发送到所述通用图像识别模型进行图像识别。
在本申请一些实施例中,所述通用图像识别模型还包括表格识别模型,基于通用图像识别模型匹配所述待检测图像对应的模板,基于所述模板对所述待检测图像进行文本识别,并输出识别结果,具体为:
通过所述通用图像识别模型匹配与所述待检测图像对应的模板;
基于所述模板识别所述待检测图像的文本信息;
基于所述表格识别模型确定所述待检测图像的结构化信息;
基于所述文本信息及所述结构化信息输出识别结果。
在本申请一些实施例中,所述文本检测模型的建立过程具体为:
获取多种类型的样本图像;
提取各样本图像的关键文字的位置特征信息,根据所述位置特征信息构建所述文本检测模型。
在本申请一些实施例中,所述通用图像识别模型的建立过程具体为:
获取多个类型的样本图像,提取所述样本中训练图像所记载文本信息的文字特征信息;
获取文字特征信息对应的训练文本信息,分析文字特征信息与训练文本信息之间的对应关系,得到映射信息;
根据所述映射信息构建通用识别模型。
在本申请一些实施例中,所述通用图像识别模型的建立过程具体为:
通过所述通用图像识别模型匹配与所述待检测图像对应的模板,具体为:
根据模板中的参考字段与所述待检测图像中的字段进行匹配,以获取所述待检测图像对应的模板;
基于所述参考字段与所述待检测图像的字段的框坐标调节待检测图像的大小,以使待检测图像与所述模板大小一致;
基于所述框坐标调节参考字段与所述待检测图像的字段之间的坐标偏差。
在本申请一些实施例中,通过文本检测模型对所述待检测图像进行文本检测之前,还包括:
对所述待检测图像进行预处理,所述预处理包括进行灰度化、二值化、平滑处理。
在本申请一些实施例中,所述方法还包括:
在对所述待检测图像进行识别过程中,对所述待检测图像进行图像模糊增强、倾斜校正处理。
在本申请一些实施例中,所述方法还包括:
获取通过OCR识别后的文字信息,将所述识别后的文字信息与原始文本中的正确文字信息进行逐行匹配,并确定每行匹配失败的文字数量;
根据正确文字信息的每行文字总数量与匹配失败的文字数量计算OCR识别结果中的文字信息中每行文字的OCR识别准确率;
根据每行文字的OCR识别准确率计算所有行文字的OCR识别准确率。
相应的,本发明还提出了一种OCR识别设备,所述设备包括:
获取模块,用于获取待检测图像;
文本检测模块,通过文本检测模型对所述待检测图像进行文本检测;
图像识别模块,用于基于通用图像识别模型匹配所述待检测图像对应的模板,基于所述模板对所述待检测图像进行文本识别,并输出识别结果。
通过应用以上技术方案,获取待检测图像;通过文本检测模型对所述待检测图像进行文本检测;基于通用图像识别模型匹配所述待检测图像对应的模板,基于所述模板对所述待检测图像进行文本识别,并输出识别结果,通过制作识别图像的模板,将识别图像与模板匹配,实现了对于通用类图像的自动化识别,并自动给出了解析结果,提高了OCR识别的通用性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本发明实施例提出的一种OCR识别方法的流程示意图;
图2示出了本发明实施例中模板与待检测图像的原理示意图;
图3示出了本发明另一实施例中模板与待检测图像的原理示意图;
图4示出了本发明实施例提出的一种OCR识别设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
OCR各类图像的识别主要分为文本检测、文本识别、识别结果解析三个步骤,本方案通过基于模板的通用图像识别,将识别图像与模板匹配,实现了对于通用类图像的自动化识别,并自动给出了解析结果,提高了OCR识别的通用性,降低模型训练难度与成本。
如图1所示,该方法包括以下步骤:
步骤S101,获取待检测图像。
本实施例中,待检测图像应被理解为可以应用OCR识别方法的各类图像,如身份证、护照、合同、收据等人们常规理解的图像都应包含在本方案待检测图像的范围内。
步骤S102,通过文本检测模型对所述待检测图像进行文本检测。
本实施例中,针对不同图像类型建立对应的文本检测模型,例如身份证、营业执照、发票等,文本检测模型可以检测出文本信息的位置,并对文本信息的位置进行截取,发送到识别模型中进行文本识别。
为了准确对待检测图像进行文本识别,在本申请一些实施例中,通过文本检测模型对所述待检测图像进行文本检测,具体为:
获取所述待检测图像的位置特征信息,并基于所述位置特征信息确定所述待检测图像的类型;
调用待检测图像的类型对应的文本检测模型识别所述待检测图像的文本信息的位置,截取所述文本信息的对应位置,并在截取后发送到所述通用图像识别模型进行图像识别。
具体的,本方案中对不同类型图像建立了对应的文本检测模型,当获取到待检测图像后,会识别待检测图像的位置特征信息,例如身份证的身份证号、发票的抬头等,根据位置特征信息确定待检测图像的具体类型,调用对应的文本检测模型识别所述待检测图像的文本信息的位置,截取所述文本信息的对应位置,并在截取后发送到所述通用图像识别模型进行图像识别。
步骤S103,基于通用图像识别模型匹配所述待检测图像对应的模板,基于所述模板对所述待检测图像进行文本识别,并输出识别结果。
本实施例中,如图2所示,通用图像识别模型会匹配与待检测图像最相似的模板,并通过所述模板对所述待检测图像进行文本识别,并输出识别结果。
为了对待检测图像进行文本识别,在本申请一些实施例中,所述通用图像识别模型还包括表格识别模型,基于通用图像识别模型匹配所述待检测图像对应的模板,基于所述模板对所述待检测图像进行文本识别,并输出识别结果,具体为:
通过所述通用图像识别模型匹配与所述待检测图像对应的模板;
基于所述模板识别所述待检测图像的文本信息;
基于所述表格识别模型确定所述待检测图像的结构化信息;
基于所述文本信息及所述结构化信息输出识别结果。
具体的,通用图像识别模型在接收到文本检测后的待检测图像后,通用图像识别模型会匹配与待检测图像最相似的模板,通过所述模板识别截取到的所述文本信息,此外,本方案中针对识别后文本的结构化解析,研制了表格识别模块,通过识别图片表格,获取了图片中数据间的关系,并结合识别文字结果,有效解决了识别结果的结构关系的解析,提高了解析准确率。
为了建立文本检测模型,在本申请一些实施例中,所述文本检测模型的建立过程具体为:
获取多种类型的样本图像;
提取各样本图像的关键文字的位置特征信息,根据所述位置特征信息构建所述文本检测模型。
为了建立通用图像识别模型,在本申请一些实施例中,所述通用图像识别模型的建立过程具体为:
获取多个类型的样本图像,提取所述样本中训练图像所记载文本信息的文字特征信息;
获取文字特征信息对应的训练文本信息,分析文字特征信息与训练文本信息之间的对应关系,得到映射信息;
根据所述映射信息构建通用识别模型。
样本的训练图像记载的文本信息提取的文字特征信息。文字特征信息指的是可以反映文本信息的载体——字体本身的特征信息。由于在同一训练图像中可能存在多段文本信息,如果这些文本信息的字体都相同,也就是具有同样的文字特征信息时,可以同时提取。当同一训练图像中存在多段文本信息且字体不相同,此时需要截取或者标注特定的文本信息。根据不同字体的特点,将文本信息的字体的特点除去,仅保留字体本身用于表示外形的特征信息,也就是文字特征信息,根据文字特征信息意义对应的文本信息,根据两者之间的关系,得到文字特征信息与训练文本信息之间的映射关系,根据所述映射信息构建通用识别模型。
为了实现待检测图像与模板的准确匹配,在本申请一些实施例中,通过所述通用图像识别模型匹配与所述待检测图像对应的模板,具体为:
根据模板中的参考字段与所述待检测图像中的字段进行匹配,以获取所述待检测图像对应的模板;
基于所述参考字段与所述待检测图像的字段的框坐标调节待检测图像的大小,以使待检测图像与所述模板大小一致;
基于所述框坐标调节参考字段与所述待检测图像的字段之间的坐标偏差。
如图2及图3所示,首先对数据进行OCR识别,根据模板中标注的参考字段去匹配实际识别的数据,找到实际识别数据中和模板比较匹配的字段。(标注的字段唯一、比较有识别度更有利于模板的匹配)
获取匹配到字段的框坐标,利用坐标数据计算待识别数据与模板数据是否有大小偏差,首先将实际字段与参考字段对应的存到一个列表中,然后每两个参考字段和对应实际字段采用上图中的计算方法,得到L1和L2,通过L2/L1就能得到一个缩小(或放大)系数,每两个处理一次,然后对所有的系数取平均得到一个最终的系数。
如果该系数与1比较接近,说明实际数据与模板大小基本上一致,无需做放大、缩小处理。
此时数据和模板大小一致,需要考虑可能存在偏差(横向或竖向的位移偏差)
计算参考和实际字段的坐标偏差的过程具体为:
假设计算第一个点的偏差,考虑到实际识别的框的长度和参考框可能不一样,所以选用第1、第4个坐标,也就是框的左上和右下的坐标(xi_c表示参考字段第i个点的x坐标,xi_r表示实际对应的字段第i个点的x坐标,y坐标同理)
add_x = ((x1_c - x1_r) + (x4_c - x4_r))/2
add_y = ((y1_c - y1_r) + (y4_c - y4_r))/2
计算出所有的参考字段和实际对应字段的x、y方向的偏差并取平均值,得到最终的add_x、add_y,再对参考识别区域的x坐标减去add_x、y坐标减去add_y即可得到最终的实际识别区域范围。
如果该系数偏离1较多,则根据缩小(或放大)系数计算实际识别区域的坐标。
此处设缩小(或放大)系数为k,参考字段和参考划分区域的坐标0分别为(x1,y1)、(z1,q1),实际字段坐标0为(x2,y2),则可以根据公式:
z2 = x2 + k*(z1 - x1)
q2 = y2 + k*(q1 - y1)
计算得到实际划分区域的坐标0,依次计算可以得到坐标1、坐标2、坐标3,由四个坐标点确定实际划分区域。
为了提高待检测图像的识别效果,在本申请一些实施例中,通过文本检测模型对所述待检测图像进行文本检测之前,还包括:
对所述待检测图像进行预处理,所述预处理包括进行灰度化、二值化、平滑处理。
为了提高待检测图像的识别效果,在本申请一些实施例中,所述方法还包括:
在对所述待检测图像进行识别过程中,对所述待检测图像进行图像模糊增强、倾斜校正处理。
为了提高OCR识别的准确率,在本申请一些实施例中,所述方法还包括:
获取通过OCR识别后的文字信息,将所述识别后的文字信息与原始文本中的正确文字信息进行逐行匹配,并确定每行匹配失败的文字数量;
根据正确文字信息的每行文字总数量与匹配失败的文字数量计算OCR识别结果中的文字信息中每行文字的OCR识别准确率;
根据每行文字的OCR识别准确率计算所有行文字的OCR识别准确率。
获取通过OCR识别后的文字信息,将所述识别后的文字信息与原始文本中的正确文字信息进行逐行匹配,并确定每行匹配失败的文字数量,根据正确文字信息的每行文字总数量与匹配失败的文字数量计算OCR识别结果中的文字信息中每行文字的OCR识别准确率,进而根据每行文字的OCR识别准确率计算所有行文字的OCR识别准确率,如果所有行文字的OCR识别准确率超过一定限值,则对OCR识别方法进行改进,如对识别模型进行重新训练,以提高OCR识别的准确率。
通过应用以上技术方案,取待检测图像;通过文本检测模型对所述待检测图像进行文本检测;基于通用图像识别模型匹配所述待检测图像对应的模板,基于所述模板对所述待检测图像进行文本识别,并输出识别结果,通过制作识别图像的模板,将识别图像与模板匹配,实现了对于通用类图像的自动化识别,并自动给出了解析结果,提高了OCR识别的通用性。
本申请实施例还提出了一种OCR识别设备,如图4所示,所述设备包括:
获取模块10,用于获取待检测图像;
文本检测模块20,通过文本检测模型对所述待检测图像进行文本检测;
图像识别模块30,用于基于通用图像识别模型匹配所述待检测图像对应的模板,基于所述模板对所述待检测图像进行文本识别,并输出识别结果。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不驱使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.一种OCR识别方法,其特征在于,所述方法包括:
获取待检测图像;
通过文本检测模型对所述待检测图像进行文本检测;
基于通用图像识别模型匹配所述待检测图像对应的模板,基于所述模板对所述待检测图像进行文本识别,并输出识别结果。
2.如权利要求1所述的方法,其特征在于,通过文本检测模型对所述待检测图像进行文本检测,具体为:
获取所述待检测图像的位置特征信息,并基于所述位置特征信息确定所述待检测图像的类型;
调用待检测图像的类型对应的文本检测模型识别所述待检测图像的文本信息的位置,截取所述文本信息的对应位置,并在截取后发送到所述通用图像识别模型进行图像识别。
3.如权利要求2所述的方法,其特征在于,所述通用图像识别模型还包括表格识别模型,基于通用图像识别模型匹配所述待检测图像对应的模板,基于所述模板对所述待检测图像进行文本识别,并输出识别结果,具体为:
通过所述通用图像识别模型匹配与所述待检测图像对应的模板;
基于所述模板识别所述待检测图像的文本信息;
基于所述表格识别模型确定所述待检测图像的结构化信息;
基于所述文本信息及所述结构化信息输出识别结果。
4.如权利要求1所述的方法,其特征在于,所述文本检测模型的建立过程具体为:
获取多种类型的样本图像;
提取各样本图像的关键文字的位置特征信息,根据所述位置特征信息构建所述文本检测模型。
5.如权利要求1所述的方法,其特征在于,所述通用图像识别模型的建立过程具体为:
获取多个类型的样本图像,提取所述样本中训练图像所记载文本信息的文字特征信息;
获取文字特征信息对应的训练文本信息,分析文字特征信息与训练文本信息之间的对应关系,得到映射信息;
根据所述映射信息构建通用识别模型。
6.如权利要求3所述的方法,其特征在于,通过所述通用图像识别模型匹配与所述待检测图像对应的模板,具体为:
根据模板中的参考字段与所述待检测图像中的字段进行匹配,以获取所述待检测图像对应的模板;
基于所述参考字段与所述待检测图像的字段的框坐标调节待检测图像的大小,以使待检测图像与所述模板大小一致;
基于所述框坐标调节参考字段与所述待检测图像的字段之间的坐标偏差。
7.如权利要求1所述的方法,其特征在于,通过文本检测模型对所述待检测图像进行文本检测之前,还包括:
对所述待检测图像进行预处理,所述预处理包括进行灰度化、二值化、平滑处理。
8.如权利要求1所述的方法,其特征在于,所述方法还包括:
在对所述待检测图像进行识别过程中,对所述待检测图像进行图像模糊增强、倾斜校正处理。
9.如权利要求1所述的方法,其特征在于,所述方法还包括:
获取通过OCR识别后的文字信息,将所述识别后的文字信息与原始文本中的正确文字信息进行逐行匹配,并确定每行匹配失败的文字数量;
根据正确文字信息的每行文字总数量与匹配失败的文字数量计算OCR识别结果中的文字信息中每行文字的OCR识别准确率;
根据每行文字的OCR识别准确率计算所有行文字的OCR识别准确率。
10.一种OCR识别设备,其特征在于,所述设备包括:
获取模块,用于获取待检测图像;
文本检测模块,通过文本检测模型对所述待检测图像进行文本检测;
图像识别模块,用于基于通用图像识别模型匹配所述待检测图像对应的模板,基于所述模板对所述待检测图像进行文本识别,并输出识别结果。
CN202210950890.7A 2022-08-09 2022-08-09 一种ocr识别方法和设备 Pending CN115311663A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210950890.7A CN115311663A (zh) 2022-08-09 2022-08-09 一种ocr识别方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210950890.7A CN115311663A (zh) 2022-08-09 2022-08-09 一种ocr识别方法和设备

Publications (1)

Publication Number Publication Date
CN115311663A true CN115311663A (zh) 2022-11-08

Family

ID=83861327

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210950890.7A Pending CN115311663A (zh) 2022-08-09 2022-08-09 一种ocr识别方法和设备

Country Status (1)

Country Link
CN (1) CN115311663A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109740547A (zh) * 2019-01-04 2019-05-10 平安科技(深圳)有限公司 一种图像处理方法、设备及计算机可读存储介质
CN109919014A (zh) * 2019-01-28 2019-06-21 平安科技(深圳)有限公司 Ocr识别方法及其电子设备
CN112308035A (zh) * 2020-11-25 2021-02-02 腾讯科技(深圳)有限公司 图像检测方法、装置、计算机设备和存储介质
CN112633118A (zh) * 2020-12-18 2021-04-09 上海眼控科技股份有限公司 一种文本信息提取方法、设备及存储介质
CN112669515A (zh) * 2020-12-28 2021-04-16 上海斑马来拉物流科技有限公司 票据图像识别方法、装置、电子设备和存储介质
CN113920309A (zh) * 2021-12-14 2022-01-11 武汉楚精灵医疗科技有限公司 图像检测方法、装置、医学图像处理设备及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109740547A (zh) * 2019-01-04 2019-05-10 平安科技(深圳)有限公司 一种图像处理方法、设备及计算机可读存储介质
CN109919014A (zh) * 2019-01-28 2019-06-21 平安科技(深圳)有限公司 Ocr识别方法及其电子设备
CN112308035A (zh) * 2020-11-25 2021-02-02 腾讯科技(深圳)有限公司 图像检测方法、装置、计算机设备和存储介质
CN112633118A (zh) * 2020-12-18 2021-04-09 上海眼控科技股份有限公司 一种文本信息提取方法、设备及存储介质
CN112669515A (zh) * 2020-12-28 2021-04-16 上海斑马来拉物流科技有限公司 票据图像识别方法、装置、电子设备和存储介质
CN113920309A (zh) * 2021-12-14 2022-01-11 武汉楚精灵医疗科技有限公司 图像检测方法、装置、医学图像处理设备及存储介质

Similar Documents

Publication Publication Date Title
US11657631B2 (en) Scalable, flexible and robust template-based data extraction pipeline
CN108256591B (zh) 用于输出信息的方法和装置
CN110569850A (zh) 字符识别模板匹配方法、装置和文本识别设备
CA2589947C (en) Machine character recognition verification
CN112669515B (zh) 票据图像识别方法、装置、电子设备和存储介质
CN111160352A (zh) 一种基于图像分割的工件金属表面文字识别方法及系统
CN112508011A (zh) 一种基于神经网络的ocr识别方法及设备
CN108830275B (zh) 点阵字符、点阵数字的识别方法及装置
CN113569863B (zh) 一种单据稽查的方法、系统、电子设备及存储介质
CN112597940B (zh) 证件图像识别方法、装置及存储介质
CN113903024A (zh) 一种手写票据数值信息识别方法、系统、介质及装置
CN111462388A (zh) 一种票据检验方法、装置、终端设备及存储介质
CN108197624A (zh) 证书图像校正识别方法及装置、计算机存储介质
CN113158895A (zh) 票据识别方法、装置、电子设备及存储介质
CN113095187A (zh) 一种基于图像特征匹配对齐的试卷批改方法
CN113221897B (zh) 图像矫正方法、图像文本识别方法、身份验证方法及装置
CN112001200A (zh) 识别码识别方法、装置、设备、存储介质和系统
CN113111880A (zh) 证件图像校正方法、装置、电子设备及存储介质
CN112668580A (zh) 一种文本识别方法、文本识别装置及终端设备
CN112232336A (zh) 一种证件识别方法、装置、设备及存储介质
CN108090728B (zh) 一种基于智能终端的快递信息录入方法及录入系统
WO2024078233A1 (zh) 包含文本的图像处理方法、系统及存储介质
CN113657162A (zh) 一种基于深度学习的票据ocr识别方法
CN112396057B (zh) 一种字符识别方法、装置及电子设备
Shukla et al. An approach for skew detection using hough transform

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20221108

RJ01 Rejection of invention patent application after publication