CN109034050B - 基于深度学习的身份证图像文本识别方法及装置 - Google Patents

基于深度学习的身份证图像文本识别方法及装置 Download PDF

Info

Publication number
CN109034050B
CN109034050B CN201810813704.9A CN201810813704A CN109034050B CN 109034050 B CN109034050 B CN 109034050B CN 201810813704 A CN201810813704 A CN 201810813704A CN 109034050 B CN109034050 B CN 109034050B
Authority
CN
China
Prior art keywords
image
model
target field
identity card
deep learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810813704.9A
Other languages
English (en)
Other versions
CN109034050A (zh
Inventor
冯昊楠
朴安妮
张玉双
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SF Technology Co Ltd
Original Assignee
SF Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SF Technology Co Ltd filed Critical SF Technology Co Ltd
Priority to CN201810813704.9A priority Critical patent/CN109034050B/zh
Publication of CN109034050A publication Critical patent/CN109034050A/zh
Application granted granted Critical
Publication of CN109034050B publication Critical patent/CN109034050B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种基于深度学习的身份证图像文本识别方法及装置,对获取的第一图像进行图像预处理;将经过预处理后的第一图像输入第一模型,第一模型对第一图像进行各目标字段区域检测,获得第一图像中各目标字段区域的位置信息;根据位置信息截取第一图像中各目标字段区域的图像作为第二图像;将第二图像输入第二模型,第二模型对第二图像进行目标字段识别,获得第二图像中目标字段的文本信息,通过第一模型对第一图像进行各目标字段区域检测,获得第一图像中各目标字段区域的位置信息,通过第二模型对第二图像进行目标字段识别。

Description

基于深度学习的身份证图像文本识别方法及装置
技术领域
本公开一般涉及深度学习领域,具体涉及深度学习应用领域,尤其涉及一种基于深度学习的身份证图像文本识别方法及装置。
背景技术
在快递业务场景中,客户信息的录入一直是一个不可避免的环节。大量的客户信息录入,如客户身份证信息记录,占用了客户和工作人员大量宝贵的时间。
传统文本检测识别技术(OCR)一般包括文字区域检测,图片信息提取及矫正,以及基于传统机器学习方法和HMM模型的文字识别分类器。由于不同的需求和图片构造,传统OCR的识别效果受到文字检测和信息提取的严重限制。近年来,以卷积神经网络(CNN)为代表的一系列深度学习方法,为传统计算机视觉领域和OCR领域提供了更高精确度的图片处理和识别方法。
发明内容
鉴于现有技术中的上述缺陷或不足,期望提供一种精确度高的基于深度学习的身份证图像文本识别方法及装置。
第一方面,本发明的基于深度学习的身份证图像文本识别方法,包括:
对获取的第一图像进行图像预处理;
将经过预处理后的第一图像输入第一模型,第一模型对第一图像进行各目标字段区域检测,获得第一图像中各目标字段区域的位置信息;
根据位置信息截取第一图像中各目标字段区域的图像作为第二图像;
将第二图像输入第二模型,第二模型对第二图像进行目标字段识别,获得第二图像中目标字段的文本信息。
第二方面,本发明的基于深度学习的身份证图像文本识别装置,包括:
图像预处理模块:用于对获取的第一图像进行图像预处理;
文本检测模块:用于将经过预处理后的第一图像输入第一模型,第一模型对第一图像进行各目标字段区域检测,获得第一图像中各目标字段区域的位置信息;
图像截取模块:用于根据位置信息截取第一图像中各目标字段区域的图像作为第二图像;
文本识别模块:用于将第二图像输入第二模型,第二模型对第二图像进行目标字段识别,获得第二图像中目标字段的文本信息。
根据本申请实施例提供的技术方案,通过第一模型对第一图像进行各目标字段区域检测,获得第一图像中各目标字段区域的位置信息,通过第二模型对第二图像进行目标字段识别,获得第二图像中目标字段的文本信息,能够解决现有的文本识别技术识别效果差的问题。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1为本发明的实施例的基于深度学习的身份证图像文本识别方法的流程图;
图2为本发明的实施例的基于深度学习的身份证图像文本识别装置的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
本发明的其中一个实施例为,请参考图1,基于深度学习的身份证图像文本识别方法,包括:
对获取的第一图像进行图像预处理。
将经过预处理后的第一图像输入第一模型,第一模型对第一图像进行各目标字段区域检测,获得第一图像中各目标字段区域的位置信息。
在本发明的实施例中,第一模型可以但不仅仅为经典检测算法SSD(Single ShotDetection),通过第一模型对第一图像进行各目标字段区域检测,通常对需要采集身份证上面的姓名、性别、身份证号码、身份证有效期等信息,第一模型检测到各目标字段区域后,可以采用逐行标记或者逐字标记对各目标字段区域进行标记,当然逐字标记的准确性更加高、成本更加昂贵。
根据位置信息截取第一图像中各目标字段区域的图像作为第二图像;
将第二图像输入第二模型,第二模型对第二图像进行目标字段识别,获得第二图像中目标字段的文本信息。
在本发明的实施例中,第二模型可以但不仅仅为卷积神经网络(CNN),深度残差网络(ResNet),长短时记忆神经元(LSTM),损失函数为时间连接分类CTC Loss(Connectionist temporal classification Loss),其中损失函数可以为
L(S)=-ln∏(x,z)∈Sp(z|x)=-∑(x,z)∈Slnp(z|x),
能够降低成本以及数据集的构成难度,通过第二模型对第二图像进行目标字段识别,获得第二图像中目标字段的文本信息。能够提高获得的文本信息的准确性。
进一步的,对获取的第一图像进行图像预处理包括:
对第一图像进行一次边缘检测,若无法检测到第一图像的边缘,则提示重新输入第一图像,否则,对第一图像进行扭转;
将扭转后的第一图像输入第三模型中,第三模型对扭转后的第一图像进行二次边缘检测,若无法检测到第一图像的边缘,则提示重新输入第一图像,否则,
识别第一图像为身份证的正面或者反面,若无法识别第一图像为身份证的正面或者反正,则提示重新输入第一图像。
在本发明的实施例中,对获取的第一图像进行图像预处理,通过工作人员对客户的身份证拍照并上传或者是客户自行上传身份证照片来获取第一图像,在一般情况下,上传的照片有可能存在倾斜、变形以及存在背景的情况,需要对照片进行边缘检测、裁切、扭转等变形。首先使用最简单的边缘检测对第一图像检测,如果没有检测到边缘,则提示客户或者工作人员重新拍照上传,如果检测到边缘,则对第一图像进行扭转。将扭转后的第一图像输入第三模型中,第三模型对扭转后的第一图像的边缘检测,若无法检测到所述第一图像的边缘,则提示客户或者工作人员重新拍照上传,确保第一图像的边缘检测的扭转结果准确,降低了文本检测模块的检测难度,提高了文本检测模块的精确度,第三模型可以但不仅仅为YOLO 618(You Only Look Once)模型,确保第一图像的边缘检测的扭转结果正确。对经过第三模型边缘检测好的第一图像进行识别身份证的正面和反面,若无法识别所述第一图像为身份证的正面或者反正,则提示无法客户或者工作人员重新拍照上传。确保了输入第一模型中的第一图像符合第一模型的输入标准,提高了第一模型的检测成功率。同时,可以通过区别身份证的正面和反面,区别第一图像的特征,针对身份证的正面或者反面不同的特征来进行目标字段区域的位置信息的识别,提高了识别的准确性。
进一步的,包括检验各目标字段区域的位置信息,具体的,根据识别第一图像为身份证的正面或者反正的结果,比较预设的身份证正面或者反面的不同目标字段间的位置关系和位置信息是否对应,若不对应,则提示重新输入第一图像。
在本发明的实施例中,通过比较预设的身份证正面或者反面的不同目标字段间的位置关系,例如比较预设的身份证正面的姓名、身份证号码等目标字段之间的相对位置,具体的“姓名”在“性别”的上面,“公民身份证号码”在最下面等,将各目标字段的位置信息和预设的位置关系比较,检验第一模型检测结果的准确性,便于对第一模型进行调整,提高了第一模型的可用性。
进一步的,包括训练第一模型,具体的,对第一图像进行以下操作之一或者组合获得第三图像:
随机多角度旋转、高斯模糊、均值模糊、翻转、随机噪点和光强变化,
使用第三图像训练第一模型。
在本发明的实施例中,通过训练第一模型,确定第一模型的参数,提高第一模型的可用性以及第一模型对第一图像进行各目标字段区域检测的准确性,通过对第一图像进行随机多角度旋转、高斯模糊、均值模糊、翻转、随机噪点和光强变化中的一种或者多种的组合变化,获得不同的第一图像,使用不同的第一图像对第一模型进行训练,能够利用较小的数据量,对第一模型进行充分的训练,降低了第一模型训练的数据获取成本。
进一步的,包括训练第二模型,具体的,将高频姓名字库仿照身份证背景和字体生成第四图像,使用第四图像训练第二模型。
在本发明的实施例中,通过训练第二模型,确定第二模型的参数,提高第二模型的可用性以及第二模型第二图像进行目标字段识别的准确性,通过将高频姓名字库仿照身份证背景和字体生成第四图像,通过模拟生成含有高频姓名字库中高频姓名字的身份证图像,对第二模型进行训练,提高了第二模型的识别准确性。
进一步的,对第四图像进行以下操作之一或者组合获得第五图像:
随机多角度旋转、高斯模糊、均值模糊、翻转、随机噪点和光强变化,
使用第五图像训练第二模型。
在本发明的实施例中,通过对第四图像进行随机多角度旋转、高斯模糊、均值模糊、翻转、随机噪点和光强变化中的一种或者多种的组合变化,获得第五图像,使用不同的第五图像对第二模型进行训练,能够利用较少的原始数据变化获得较多的训练数据,对第二模型进行充分的训练,降低了第二模型训练的数据获取成本。
进一步的,包括存储文本信息和与文本信息对应的第二图像。
在本发明的实施例中,包括存储文本信息和与文本信息对应的第二图像,对获得的文本信息和第二图像进行存储,用于第二模型的继续训练。
本发明的另一个实施例为,参考图2,基于深度学习的身份证图像文本识别装置,包括:
图像预处理模块:用于对获取的第一图像进行图像预处理。
文本检测模块:用于将经过预处理后的第一图像输入第一模型,第一模型对第一图像进行各目标字段区域检测,获得第一图像中各目标字段区域的位置信息。
在本发明的实施例中,第一模型可以但不仅仅为经典检测算法SSD(Single ShotDetection),通过第一模型对第一图像进行各目标字段区域检测,通常对需要采集身份证上面的姓名、性别、身份证号码、身份证有效期等信息,第一模型检测到各目标字段区域后,可以采用逐行标记或者逐字标记对各目标字段区域进行标记,当然逐字标记的准确性更加高、成本更加昂贵。
图像截取模块:用于根据位置信息截取第一图像中各目标字段区域的图像作为第二图像;
文本识别模块:用于将第二图像输入第二模型,第二模型对第二图像进行目标字段识别,获得第二图像中目标字段的文本信息。
在本发明的实施例中,第二模型可以但不仅仅为卷积神经网络(CNN),深度残差网络(ResNet),长短时记忆神经元(LSTM),损失函数为时间连接分类CTC Loss(Connectionist temporal classification Loss),其中损失函数可以为
L(S)=-ln∏(x,z)∈Sp(z|x)=-∑(x,z)∈Slnp(z|x),
能够降低成本以及数据集的构成难度,通过第二模型对第二图像进行目标字段识别,获得第二图像中目标字段的文本信息。能够提高获得的文本信息的准确性。
进一步的,图像预处理模块:还用于对第一图像进行边一次缘检测,若无法检测到第一图像的边缘,则提示重新输入第一图像,否则,对第一图像进行扭转;
将扭转后的第一图像输入第三模型中,第三模型对扭转后的第一图像进行二次边缘检测,若无法检测到第一图像的边缘,则提示重新输入第一图像,否则,
识别第一图像为身份证的正面或者反面,若无法识别第一图像为身份证的正面或者反正,则提示重新输入第一图像。
在本发明的实施例中,图像预处理模块对获取的第一图像进行图像预处理,通过工作人员对客户的身份证拍照并上传或者是客户自行上传身份证照片来获取第一图像,在一般情况下,上传的照片有可能存在倾斜、变形以及存在背景的情况,需要对照片进行边缘检测、裁切、扭转等变形。首先使用最简单的边缘检测对第一图像检测,如果没有检测到边缘,则提示客户或者工作人员重新拍照上传,如果检测到边缘,则对第一图像进行扭转。将扭转后的第一图像输入第三模型中,第三模型对扭转后的第一图像的边缘检测,若无法检测到所述第一图像的边缘,则提示客户或者工作人员重新拍照上传,确保第一图像的边缘检测的扭转结果准确,降低了文本检测模块的检测难度,提高了文本检测模块的精确度,第三模型可以但不仅仅为YOLO 618(You Only Look Once)模型,确保第一图像的边缘检测的扭转结果正确。对经过第三模型边缘检测好的第一图像进行识别身份证的正面和反面,若无法识别所述第一图像为身份证的正面或者反正,则提示无法客户或者工作人员重新拍照上传。确保了输入第一模型中的第一图像符合第一模型的输入标准,提高了第一模型的检测成功率。同时,可以通过区别身份证的正面和反面,区别第一图像的特征,针对身份证的正面或者反面不同的特征来进行目标字段区域的位置信息的识别,提高了识别的准确性。
进一步的,包括检验模块:用于检验各目标字段区域的位置信息,具体的,根据识别第一图像为身份证的正面或者反正的结果,比较预设的身份证正面或者反面的不同目标字段间的位置关系和位置信息是否对应,若不对应,则提示重新输入第一图像。
在本发明的实施例中,通过检验模块比较预设的身份证正面或者反面的不同目标字段间的位置关系,例如比较预设的身份证正面的姓名、身份证号码等目标字段之间的相对位置,具体的“姓名”在“性别”的上面,“公民身份证号码”在最下面等,将各目标字段的位置信息和预设的位置关系比较,检验第一模型检测结果的准确性,便于对第一模型进行调整,提高了第一模型的可用性。
进一步的,包括第一训练模块:用于训练第一模型,具体的,对第一图像进行以下操作之一或者组合获得第三图像:
随机多角度旋转、高斯模糊、均值模糊、翻转、随机噪点和光强变化,
使用第三图像训练第一模型。
在本发明的实施例中,通过第一训练模块训练第一模型,确定第一模型的参数,提高第一模型的可用性以及第一模型对第一图像进行各目标字段区域检测的准确性,通过对第一图像进行随机多角度旋转、高斯模糊、均值模糊、翻转、随机噪点和光强变化中的一种或者多种的组合变化,获得不同的第一图像,使用不同的第一图像对第一模型进行训练,能够利用较小的数据量,对第一模型进行充分的训练,降低了第一模型训练的数据获取成本。
进一步的,包括第二训练模块:用于训练第二模型,具体的,将高频姓名字库仿照身份证背景和字体生成第四图像,使用第四图像训练第二模型。
在本发明的实施例中,通过第二训练模块训练第二模型,确定第二模型的参数,提高第二模型的可用性以及第二模型第二图像进行目标字段识别的准确性,通过将高频姓名字库仿照身份证背景和字体生成第四图像,通过模拟生成含有高频姓名字库中高频姓名字的身份证图像,对第二模型进行训练,提高了第二模型的识别准确性。
进一步的,第二训练模块:还用于对第四图像进行以下操作之一或者组合获得第五图像:
随机多角度旋转、高斯模糊、均值模糊、翻转、随机噪点和光强变化,
使用第五图像训练第二模型。
在本发明的实施例中,通过对第四图像进行随机多角度旋转、高斯模糊、均值模糊、翻转、随机噪点和光强变化中的一种或者多种的组合变化,获得第五图像,使用不同的第五图像对第二模型进行训练,能够利用较少的原始数据变化获得较多的训练数据,对第二模型进行充分的训练,降低了第二模型训练的数据获取成本。
进一步的,第一模型仅设置有多层低层次特征提取层的卷积神经网络。
在本发明的实施例中,在原有的五层卷积神经网络中,将高层次的特征提取层替换成低层次的特征提取层作为第一模型,对第一图像进行各目标字段区域检测,以满足身份证照片中文本中尺寸单一的特征,避免高层次特征层较大的感受野影响检测效果。
进一步的,第一模型的默认目标边框比例为1、2、3、4、1/2、1/3、1/4。
在本发明的实施例中,针对身份证中的目标字段的细长形状,尤其是公民身份证号码的目标字段,将第一模型的默认目标边框比例设置为1、2、3、4、1/2、1/3、1/4,提高了第一模型的长条文本检测效果。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (14)

1.一种基于深度学习的身份证图像文本识别方法,其特征在于,包括:
对获取的第一图像进行图像预处理;
将经过预处理后的所述第一图像输入第一模型,所述第一模型对所述第一图像进行各目标字段区域检测,获得所述第一图像中各目标字段区域的位置信息;
根据所述位置信息截取所述第一图像中各目标字段区域的图像作为第二图像;
将所述第二图像输入第二模型,所述第二模型对所述第二图像进行目标字段识别,获得所述第二图像中目标字段的文本信息;
所述对获取的第一图像进行图像预处理包括:
对所述第一图像进行一次边缘检测,若无法检测到所述第一图像的边缘,则提示重新输入第一图像,否则,对所述第一图像进行扭转;
将扭转后的所述第一图像输入第三模型中,所述第三模型对所述扭转后的第一图像进行二次边缘检测,若无法检测到所述第一图像的边缘,则提示重新输入第一图像,否则,
识别所述第一图像为身份证的正面或者反面,若无法识别所述第一图像为身份证的正面或者反面 ,则提示重新输入第一图像。
2.根据权利要求1所述的基于深度学习的身份证图像文本识别方法,其特征在于,包括检验所述各目标字段区域的位置信息,具体的,根据所述识别第一图像为身份证的正面或者反面 的结果,比较预设的所述身份证正面或者反面的不同目标字段间的位置关系和所述位置信息是否对应,若不对应,则提示重新输入第一图像。
3.根据权利要求1所述的基于深度学习的身份证图像文本识别方法,其特征在于,包括训练所述第一模型,具体的,对所述第一图像进行以下操作之一或者组合获得第三图像:
随机多角度旋转、高斯模糊、均值模糊、翻转、随机噪点和光强变化,
使用所述第三图像训练所述第一模型。
4.根据权利要求1所述的基于深度学习的身份证图像文本识别方法,其特征在于,包括训练所述第二模型,具体的,将高频姓名字库仿照身份证背景和字体生成第四图像,使用所述第四图像训练所述第二模型。
5.根据权利要求4所述的基于深度学习的身份证图像文本识别方法,其特征在于,对所述第四图像进行以下操作之一或者组合获得第五图像:
随机多角度旋转、高斯模糊、均值模糊、翻转、随机噪点和光强变化,
使用所述第五图像训练所述第二模型。
6.根据权利要求1所述的基于深度学习的身份证图像文本识别方法,其特征在于,包括存储所述文本信息和与所述文本信息对应的第二图像。
7.一种基于深度学习的身份证图像文本识别装置,其特征在于,包括:
图像预处理模块:用于对获取的第一图像进行图像预处理;
文本检测模块:用于将经过预处理后的所述第一图像输入第一模型,所述第一模型对所述第一图像进行各目标字段区域检测,获得所述第一图像中各目标字段区域的位置信息;
图像截取模块:用于根据所述位置信息截取所述第一图像中各目标字段区域的图像作为第二图像;
文本识别模块:用于将所述第二图像输入第二模型,所述第二模型对所述第二图像进行目标字段识别,获得所述第二图像中目标字段的文本信息;
所述图像预处理模块:还用于对所述第一图像进行边一次缘检测,若无法检测到所述第一图像的边缘,则提示重新输入第一图像,否则,对所述第一图像进行扭转;
将扭转后的所述第一图像输入第三模型中,所述第三模型对所述扭转后的第一图像进行二次边缘检测,若无法检测到所述第一图像的边缘,则提示重新输入第一图像,否则,
识别所述第一图像为身份证的正面或者反面,若无法识别所述第一图像为身份证的正面或者反面 ,则提示重新输入第一图像。
8.根据权利要求7所述的基于深度学习的身份证图像文本识别装置,其特征在于,包括检验模块:用于检验所述各目标字段区域的位置信息,具体的,根据所述识别第一图像为身份证的正面或者反面 的结果,比较预设的所述身份证正面或者反面的不同目标字段间的位置关系和所述位置信息是否对应,若不对应,则提示重新输入第一图像。
9.根据权利要求7所述的基于深度学习的身份证图像文本识别装置,其特征在于,包括第一训练模块:用于训练所述第一模型,具体的,对所述第一图像进行以下操作之一或者组合获得第三图像:
随机多角度旋转、高斯模糊、均值模糊、翻转、随机噪点和光强变化,
使用所述第三图像训练所述第一模型。
10.根据权利要求7所述的基于深度学习的身份证图像文本识别装置,其特征在于,包括第二训练模块:用于训练所述第二模型,具体的,将高频姓名字库仿照身份证背景和字体生成第四图像,使用所述第四图像训练所述第二模型。
11.根据权利要求10所述的基于深度学习的身份证图像文本识别装置,其特征在于,所述第二训练模块:还用于对所述第四图像进行以下操作之一或者组合获得第五图像:
随机多角度旋转、高斯模糊、均值模糊、翻转、随机噪点和光强变化,
使用所述第五图像训练所述第二模型。
12.根据权利要求7所述的基于深度学习的身份证图像文本识别装置,其特征在于,包括存储模块:用于存储所述文本信息和与所述文本信息对应的第二图像。
13.根据权利要求7所述的基于深度学习的身份证图像文本识别装置,其特征在于,所述第一模型仅设置有多层低层次特征提取层的卷积神经网络。
14.根据权利要求7所述的基于深度学习的身份证图像文本识别装置,其特征在于,所述第一模型的默认目标边框比例为1、2、3、4、1/2、1/3、1/4。
CN201810813704.9A 2018-07-23 2018-07-23 基于深度学习的身份证图像文本识别方法及装置 Active CN109034050B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810813704.9A CN109034050B (zh) 2018-07-23 2018-07-23 基于深度学习的身份证图像文本识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810813704.9A CN109034050B (zh) 2018-07-23 2018-07-23 基于深度学习的身份证图像文本识别方法及装置

Publications (2)

Publication Number Publication Date
CN109034050A CN109034050A (zh) 2018-12-18
CN109034050B true CN109034050B (zh) 2022-05-03

Family

ID=64645259

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810813704.9A Active CN109034050B (zh) 2018-07-23 2018-07-23 基于深度学习的身份证图像文本识别方法及装置

Country Status (1)

Country Link
CN (1) CN109034050B (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111353497B (zh) * 2018-12-21 2023-11-28 顺丰科技有限公司 一种身份证信息的识别方法和装置
CN110110585B (zh) * 2019-03-15 2023-05-30 西安电子科技大学 基于深度学习的智能阅卷实现方法及系统、计算机程序
CN110163193B (zh) * 2019-03-25 2021-08-06 腾讯科技(深圳)有限公司 图像处理方法、装置、计算机可读存储介质和计算机设备
CN110059684A (zh) * 2019-04-23 2019-07-26 杭州智趣智能信息技术有限公司 一种证件信息识别方法、转置、设备及介质
CN110070130A (zh) * 2019-04-23 2019-07-30 杭州智趣智能信息技术有限公司 一种证件信息识别方法、转置、设备及介质
CN110348326A (zh) * 2019-06-21 2019-10-18 安庆师范大学 基于身份证识别和多设备访问的家庭健康信息处理方法
CN110348449B (zh) * 2019-07-10 2023-04-18 电子科技大学 一种基于神经网络的身份证文字识别方法
CN112258259A (zh) * 2019-08-14 2021-01-22 北京京东尚科信息技术有限公司 数据处理方法、装置和计算机可读存储介质
CN110569801B (zh) * 2019-09-10 2023-06-30 四川星盾科技股份有限公司 一种行驶证关键内容识别方法
CN110766010A (zh) * 2019-11-05 2020-02-07 上海鲸骞金融信息服务有限公司 一种信息识别方法、模型训练方法和相关装置
CN111340022A (zh) * 2020-02-24 2020-06-26 深圳市华云中盛科技股份有限公司 身份证信息识别方法、装置、计算机设备及存储介质
CN113313120A (zh) * 2020-02-27 2021-08-27 顺丰科技有限公司 智能卡图像识别模型的建立方法以及装置
CN112270305A (zh) * 2020-11-17 2021-01-26 北京有竹居网络技术有限公司 卡片图像识别方法、装置和电子设备
CN112686257A (zh) * 2021-03-11 2021-04-20 广州市玄武无线科技股份有限公司 一种基于ocr的店头文字识别方法及系统

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110074638A (ko) * 2009-12-25 2011-07-01 박정국 기계 지능을 이용하여 빛의 영향과 오염물질에 훼손된 차량 번호판 영상의 강건한 문자영역추출시스템 및 방법
CN103679638A (zh) * 2013-12-25 2014-03-26 广州广电运通金融电子股份有限公司 残缺或变形的四边形图像的校正方法
CN106156767A (zh) * 2016-03-02 2016-11-23 平安科技(深圳)有限公司 行驶证有效期自动提取方法、服务器及终端
CN106408004B (zh) * 2016-08-31 2021-02-19 北京城市网邻信息技术有限公司 识别伪造营业执照的方法及装置
CN106846011A (zh) * 2016-12-30 2017-06-13 金蝶软件(中国)有限公司 营业执照识别方法和装置
US20180189955A1 (en) * 2017-01-02 2018-07-05 Eyal Moshe Augumented reality (ar) method and system enhanced through efficient edge detection of image objects
CN107480680A (zh) * 2017-07-28 2017-12-15 顺丰科技有限公司 基于OCR和Bi‑LSTM的识别图像中文字信息的方法、系统及设备
CN107665354B (zh) * 2017-09-19 2021-04-23 北京小米移动软件有限公司 识别身份证的方法及装置
CN107766809B (zh) * 2017-10-09 2020-05-19 平安科技(深圳)有限公司 电子装置、票据信息识别方法和计算机可读存储介质
CN107977665A (zh) * 2017-12-15 2018-05-01 北京科摩仕捷科技有限公司 一种发票中关键信息的识别方法及计算设备

Also Published As

Publication number Publication date
CN109034050A (zh) 2018-12-18

Similar Documents

Publication Publication Date Title
CN109034050B (zh) 基于深度学习的身份证图像文本识别方法及装置
Dutta et al. Improving CNN-RNN hybrid networks for handwriting recognition
US20210124919A1 (en) System and Methods for Authentication of Documents
CN109409204B (zh) 防伪检测方法和装置、电子设备、存储介质
WO2021027336A1 (zh) 基于印章和签名的身份验证方法、装置和计算机设备
CN111325203B (zh) 一种基于图像校正的美式车牌识别方法及系统
US11087125B2 (en) Document authenticity determination
US20210158036A1 (en) Databases, data structures, and data processing systems for counterfeit physical document detection
CN110008909B (zh) 一种基于ai的实名制业务实时稽核系统
CN109919147A (zh) 服装吊牌图像中文本识别的方法
CN109657673B (zh) 图像识别方法和终端
CN104217203B (zh) 复杂背景卡面信息识别方法及系统
US20190362193A1 (en) Eyeglass positioning method, apparatus and storage medium
JP6528147B2 (ja) 会計データ入力支援システム、方法およびプログラム
CN108229499A (zh) 证件识别方法及装置、电子设备和存储介质
US20120134576A1 (en) Automatic recognition of images
US20220050890A1 (en) Remotely verifying an identity of a person
WO2021042505A1 (zh) 基于文字识别技术的笔记生成方法、装置和计算机设备
CN109271915B (zh) 防伪检测方法和装置、电子设备、存储介质
CN109376717A (zh) 人脸对比的身份识别方法、装置、电子设备及存储介质
US10423817B2 (en) Latent fingerprint ridge flow map improvement
CN113111880B (zh) 证件图像校正方法、装置、电子设备及存储介质
CN111340022A (zh) 身份证信息识别方法、装置、计算机设备及存储介质
CN112257709A (zh) 一种招牌照片审核方法、装置、电子设备及可读存储介质
CN108446687A (zh) 一种基于移动端和后台互联的自适应人脸视觉认证方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant