CN107766809B - 电子装置、票据信息识别方法和计算机可读存储介质 - Google Patents

电子装置、票据信息识别方法和计算机可读存储介质 Download PDF

Info

Publication number
CN107766809B
CN107766809B CN201710929629.8A CN201710929629A CN107766809B CN 107766809 B CN107766809 B CN 107766809B CN 201710929629 A CN201710929629 A CN 201710929629A CN 107766809 B CN107766809 B CN 107766809B
Authority
CN
China
Prior art keywords
bill
picture
field
model
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710929629.8A
Other languages
English (en)
Other versions
CN107766809A (zh
Inventor
田野
刘鹏
王健宗
肖京
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201710929629.8A priority Critical patent/CN107766809B/zh
Priority to PCT/CN2017/108767 priority patent/WO2019071662A1/zh
Publication of CN107766809A publication Critical patent/CN107766809A/zh
Application granted granted Critical
Publication of CN107766809B publication Critical patent/CN107766809B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/243Aligning, centring, orientation detection or correction of the image by compensating for image skew or non-uniform image deformations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开一种电子装置、票据信息识别方法和存储介质,该方法包括:在收到待处理的票据图片后,利用预先训练好的票据图片识别模型对票据图片中的票据类别进行识别;利用预先确定的矫正规则对票据图片进行倾斜矫正;确定识别的票据类别对应的待识别字段;确定各个待识别字段对应的第一识别模型,调用对应的第一识别模型对倾斜矫正后的票据图片的行字符区域进行区域识别,以分别识别出包含各个待识别字段的字符信息的目标行字符区域;确定各个待识别字段对应的第二识别模型,调用对应的第二识别模型进行字符识别,以分别识别出各个待识别字段的目标行字符区域包含的字符信息。本发明技术方案准确、高效的实现对票据图片中的文本信息的自动识别。

Description

电子装置、票据信息识别方法和计算机可读存储介质
技术领域
本发明涉及数据识别技术领域,特别涉及一种电子装置、票据信息识别方法和计算机可读存储介质。
背景技术
如今随着经济的发展和人们生活水平的提高,越来越多的人选择购买医疗、商业、金融等保险。为了改善用户的保险理赔体验,提升保险理赔效率,目前,有些保险公司推出了自助理赔业务,比如用户在进行医疗保险理赔过程中,只需要将门诊或住院票据拍照上传到保险公司系统,保险公司业务员会将用户上传的票据图片上的信息录入到理赔系统中,以进行下一步操作,这种自助理赔方式大大方便了用户进行理赔的过程;然而,这种自助理赔方式在带来了便捷的理赔过程的同时,却增加了保险公司业务人员的工作压力,问题主要表现在需要花费大量的人力来处理用户上传的票据图像,效率低下,且数据录入的错误率居高不下。
因此,运用于保险自助理赔业务的票据信息自动识别技术显得越来越重要和迫切,如何提出一种高效、准确地自动识别用户上传的票据图片中的文本信息的方案,成为亟待解决的问题。
发明内容
本发明的主要目的是提供一种电子装置、票据信息识别方法和计算机可读存储介质,旨在准确、高效的实现对用户上传的票据图片中的文本信息的自动识别。
为实现上述目的,本发明提出的电子装置,包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的票据信息识别系统,所述票据信息识别系统被所述处理器执行时实现如下步骤:
在收到待处理的票据图片后,利用预先训练好的票据图片识别模型对收到的票据图片中的票据类别进行识别,并输出票据的类别识别结果;
利用预先确定的矫正规则对收到的票据图片进行倾斜矫正;
根据预先确定的票据类别与待识别字段的映射关系,确定识别的票据类别对应的待识别字段;
根据预先确定的待识别字段与第一识别模型的映射关系,确定各个所述待识别字段对应的第一识别模型,针对各个所述待识别字段,调用对应的第一识别模型对倾斜矫正后的票据图片的行字符区域进行区域识别,以分别识别出包含各个所述待识别字段的字符信息的目标行字符区域;
根据预先确定的待识别字段与第二识别模型的映射关系,确定各个所述待识别字段对应的第二识别模型,针对各个所述待识别字段的目标行字符区域,调用对应的第二识别模型进行字符识别,以分别识别出各个所述待识别字段的目标行字符区域包含的字符信息,并将识别的各个所述待识别字段的字符信息与所述票据图片进行关联映射。
优选地,所述预先确定的矫正规则为:
用霍夫变换的概率算法找出图像中尽可能多的小段直线;
从找出的小段直线中确定出所有偏水平的直线,并将确定出的直线中x坐标值相差小于第一预设差值的直线按对应的y坐标值的大小顺序依次相连,按照x坐标值大小分为若干类,或者,将确定出的直线中y坐标值相差小于第二预设差值的直线按对应的x坐标值的大小顺序依次相连,按照y坐标值大小分为若干类;
将属于一类的所有水平直线作为一个目标类直线,并通过最小二乘法找出最接近各个目标类直线的长直线;
计算出各个长直线的斜率,计算出各个长直线的斜率的中位数和均值,比较计算出的斜率的中位数和均值的大小以确定出较小者,并根据确定出的较小者调整图像倾角。
优选地,所述票据图片识别模型的训练过程如下:
S1、为每一个预设票据图片类别准备预设数量的标注有对应的图片类别的票据图片样本;
S2、将每一个预设票据图片类别对应的票据图片样本分为第一比例的训练子集和第二比例的验证子集,将各个训练子集中的票据图片样本进行混合以得到训练集,并将各个验证子集中的票据图片样本进行混合以得到验证集;
S3、利用所述训练集训练所述票据图片识别模型,并利用所述验证集对经所述训练集训练完成后的所述票据图片识别模型的准确率进行验证;
S4、若准确率大于或者等于预设准确率,则训练结束;
S5、若准确率小于预设准确率,则增加每一个预设票据图片类别对应的票据图片样本的数量,并重新执行步骤S2、S3。
优选地,所述第一识别模型为卷积神经网络模型,针对一个待识别字段对应的第一识别模型的训练过程如下:
C1、针对该待识别字段,获取预设数量的票据图片样本;
C2、将包含该待识别字段的字符信息的票据图片样本归入第一训练集,并将不包含该待识别字段的字符信息的票据图片样本归入第二训练集;
C3、分别从第一训练集和第二训练集中提取出第一预设比例的票据图片样本作为待训练的样本图片,并将第一训练集和第二训练集中剩余的票据图片样本作为待验证的样本图片;
C4、利用提取的各个待训练的样本图片进行模型训练,以生成所述第一识别模型,并利用各个待验证的样本图片对生成的所述第一识别模型进行验证;
C5、若验证通过率大于等于预设阈值,则训练完成;
C6、若验证通过率小于预设阈值,则增加票据图片样本的数量,并重复执行步骤C2、C3、C4。
优选地,所述第二识别模型为时间递归神经网络模型,针对一个待识别字段对应的第二识别模型的训练过程如下:
针对该待识别字段,获取预设数量的票据图片样本,每个票据图片样本中仅包含一行该待识别字段的字符信息,字体为黑色,背景为白色,并将各个票据图片样本的名称命名为其所含的该待识别字段的字符信息;
将所述票据图片样本按照X:Y的比例分成第一数据集和第二数据集,第一数据集中的图片样本数量大于第二数据集中的图片样本数量,第一数据集作为训练集,第二数据集作为测试集;
将第一数据集中的图片样本送入时间递归神经网络模型进行模型训练,每隔预设时间,对模型使用第二数据集进行测试,以评估当前训练的模型效果;测试时,使用训练得到的模型对第二数据集中的图片样本进行字符信息识别,并和测试的图片样本的名称做对比,以计算识别的结果和该图片样本的名称的误差。
若测试时的模型对图片样本识别的误差出现发散,则调整训练参数并重新训练;
若测试时的模型对图片样本识别的误差收敛,则结束模型训练,生成的模型作为最终的该待识别字段对应的第二识别模型。
本发明还提出一种票据信息识别方法,该票据信息识别方法包括步骤:
在收到待处理的票据图片后,利用预先训练好的票据图片识别模型对收到的票据图片中的票据类别进行识别,并输出票据的类别识别结果;
利用预先确定的矫正规则对收到的票据图片进行倾斜矫正;
根据预先确定的票据类别与待识别字段的映射关系,确定识别的票据类别对应的待识别字段;
根据预先确定的待识别字段与第一识别模型的映射关系,确定各个所述待识别字段对应的第一识别模型,针对各个所述待识别字段,调用对应的第一识别模型对倾斜矫正后的票据图片的行字符区域进行区域识别,以分别识别出包含各个所述待识别字段的字符信息的目标行字符区域;
根据预先确定的待识别字段与第二识别模型的映射关系,确定各个所述待识别字段对应的第二识别模型,针对各个所述待识别字段的目标行字符区域,调用对应的第二识别模型进行字符识别,以分别识别出各个所述待识别字段的目标行字符区域包含的字符信息,并将识别的各个所述待识别字段的字符信息与所述票据图片进行关联映射。
优选地,所述票据图片识别模型的训练过程如下:
S1、为每一个预设票据图片类别准备预设数量的标注有对应的图片类别的票据图片样本;
S2、将每一个预设票据图片类别对应的票据图片样本分为第一比例的训练子集和第二比例的验证子集,将各个训练子集中的票据图片样本进行混合以得到训练集,并将各个验证子集中的票据图片样本进行混合以得到验证集;
S3、利用所述训练集训练所述票据图片识别模型,并利用所述验证集对经所述训练集训练完成后的所述票据图片识别模型的准确率进行验证;
S4、若准确率大于或者等于预设准确率,则训练结束;
S5、若准确率小于预设准确率,则增加每一个预设票据图片类别对应的票据图片样本的数量,并重新执行步骤S2、S3。
优选地,所述第一识别模型为卷积神经网络模型,针对一个待识别字段对应的第一识别模型的训练过程如下:
C1、针对该待识别字段,获取预设数量的票据图片样本;
C2、将包含该待识别字段的字符信息的票据图片样本归入第一训练集,并将不包含该待识别字段的字符信息的票据图片样本归入第二训练集;
C3、分别从第一训练集和第二训练集中提取出第一预设比例的票据图片样本作为待训练的样本图片,并将第一训练集和第二训练集中剩余的票据图片样本作为待验证的样本图片;
C4、利用提取的各个待训练的样本图片进行模型训练,以生成所述第一识别模型,并利用各个待验证的样本图片对生成的所述第一识别模型进行验证;
C5、若验证通过率大于等于预设阈值,则训练完成;
C6、若验证通过率小于预设阈值,则增加票据图片样本的数量,并重复执行步骤C2、C3、C4。
优选地,所述第二识别模型为时间递归神经网络模型,针对一个待识别字段对应的第二识别模型的训练过程如下:
针对该待识别字段,获取预设数量的票据图片样本,每个票据图片样本中仅包含一行该待识别字段的字符信息,字体为黑色,背景为白色,并将各个票据图片样本的名称命名为其所含的该待识别字段的字符信息;
将所述票据图片样本按照X:Y的比例分成第一数据集和第二数据集,第一数据集中的图片样本数量大于第二数据集中的图片样本数量,第一数据集作为训练集,第二数据集作为测试集;
将第一数据集中的图片样本送入时间递归神经网络模型进行模型训练,每隔预设时间,对模型使用第二数据集进行测试,以评估当前训练的模型效果;测试时,使用训练得到的模型对第二数据集中的图片样本进行字符信息识别,并和测试的图片样本的名称做对比,以计算识别的结果与该图片样本的名称的误差。
若测试时的模型对图片样本识别的误差出现发散,则调整训练参数并重新训练;
若测试时的模型对图片样本识别的误差收敛,则结束模型训练,生成的模型作为最终的该待识别字段对应的第二识别模型。
本发明还提出一种计算机可读存储介质,所述计算机可读存储介质存储有票据信息识别系统,所述票据信息识别系统可被至少一个处理器执行,以使所述至少一个处理器执行上述任一项所述的票据信息识别方法。
本发明技术方案,首先通过预先训练好的票据图片识别模型识别出收到的票据图片中的票据类别,并通过预先确定的矫正规则对收到的票据图片进行倾斜矫正;然后根据票据类别与待识别字段的映射关系,确定当前接收到的待处理票据图片中的待识别字段;再根据待识别字段与第一识别模型的映射关系,分别确定各个待识别字段各自对应的第一识别模型,以识别出各个待识别字段的目标行字符区域;最后根据待识别字段与第二识别模型的映射关系,确定各个待识别字段各自对应的第二识别模型,根据各个第二识别模型分别识别出各个所述待识别字段的目标行字符区域包含的字符信息,并将识别出的各个字符信息与当前的票据图片进行关联映射,如此准确、高效的实现对用户上传的票据图片中的文本信息的自动识别。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
图1为本发明票据信息识别方法一实施例的流程示意图;
图2为本发明票据信息识别方法一实施例中票据图片识别模型的训练过程流程图;
图3为本发明票据信息识别方法一实施例中第一识别模型的训练过程流程图;
图4为本发明票据信息识别方法一实施例中第二识别模型的训练过程流程图;
图5为本发明票据信息识别系统一实施例的运行环境示意图;
图6为本发明票据信息识别系统一实施例的程序模块图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
如图1所示,图1为本发明票据信息识别方法一实施例的流程示意图。
本实施例中,该票据信息识别方法包括:
步骤S10,在收到待处理的票据图片后,利用预先训练好的票据图片识别模型对收到的票据图片中的票据类别进行识别,并输出票据的类别识别结果;
系统在收到待处理的票据图片后,利用预先训练好的票据图片识别模型对收到的票据图片进行识别,识别出票据的类别并输出类别识别结果;例如,系统收到的待处理的票据图片为医疗票据图片,而医疗票据的类别包括门诊票据、住院票据、手术票据等,那么系统利用票据图片识别模型系统对收到的医疗票据图片识别后,输出该医疗票据的类别识别结果:门诊票据、住院票据、手术票据等。
步骤S20,利用预先确定的矫正规则对收到的票据图片进行倾斜矫正;
系统中具有预先确定的矫正规则;由于用户上传到系统的票据图片(即系统收到的票据图片)通常都有一定的歪斜,因此系统会对收到的票据图片利用预先确定的矫正规则进行倾斜矫正,以确保系统对票据信息的识别成功率。本实施例优选所述预先确定的矫正规则为:首先,用霍夫变换(Hough)的概率算法找出图像中尽可能多的小段直线;然后,从找出的小段直线中确定出所有偏水平的直线,并将确定出的直线中x坐标值相差小于第一预设差值(例如0.2cm)的直线按对应的y坐标值的大小顺序依次相连,按照x坐标值大小分为若干类,或者,将确定出的直线中y坐标值相差小于第二预设差值(例如0.3cm)的直线按对应的x坐标值的大小顺序依次相连,按照y坐标值大小分为若干类;接着,将属于一类的所有水平直线作为一个目标类直线,并通过最小二乘法找出最接近各个目标类直线的长直线;最后,计算出各个长直线的斜率,计算出各个长直线的斜率的中位数和均值,比较计算出的斜率的中位数和均值的大小以确定出较小者,并根据确定出的较小者调整图像倾角。当然,在其它实施例中,还可以采取其它矫正规则。
步骤S30,根据预先确定的票据类别与待识别字段的映射关系,确定识别的票据类别对应的待识别字段;
系统在得到票据图片的票据类别后,根据预先确定的票据类别与待识别字段的映射关系,则可确定出收到的票据图片的票据类别所对应的待识别字段,该票据类别对应的待识别字段的数量可能是一个或多个。
步骤S40,根据预先确定的待识别字段与第一识别模型的映射关系,确定各个所述待识别字段对应的第一识别模型,针对各个所述待识别字段,调用对应的第一识别模型对倾斜矫正后的票据图片的行字符区域进行区域识别,以分别识别出包含各个所述待识别字段的字符信息的目标行字符区域;
系统中具有预先确定的待识别字段与第一识别模型的第一映射关系表;系统在确定出票据图片的各个待识别字段后,通过查找该第一映射关系表,则可找到各个所述待识别字段各自对应的第一识别模型;系统针对每个待识别字段,均调用该待识别字段对应的第一识别模型对倾斜矫正后的票据图片的行字符区域进行区域识别,从而分别识别出票据图片中包含各个待识别字段的字符信息的目标行字符区域。
步骤S50,根据预先确定的待识别字段与第二识别模型的映射关系,确定各个所述待识别字段对应的第二识别模型,针对各个所述待识别字段的目标行字符区域,调用对应的第二识别模型进行字符识别,以分别识别出各个所述待识别字段的目标行字符区域包含的字符信息,并将识别的各个所述待识别字段的字符信息与所述票据图片进行关联映射。
系统中还具有预先确定的待识别字段与第二识别模型的第二映射关系表;系统在识别出所述票据图片中分别包含各个待识别字段的字符信息的目标行字符区域后,通过查找第二映射关系表,先找到各个所述待识别字段各自对应的第二识别模型;然后针对每个所述待识别字段的目标行字符区域,均调用对应的第二识别模型进行字符识别,从而通过各个对应的第二识别模型识别出各个所述待识别字段的目标行字符区域包含的字符信息,再将识别出的各个所述待识别字段的字符信息与所述票据图片进行关联映射,建立关联映射关系。
本实施例技术方案,首先通过预先训练好的票据图片识别模型识别出收到的票据图片中的票据类别,并通过预先确定的矫正规则对收到的票据图片进行倾斜矫正;然后根据票据类别与待识别字段的映射关系,确定当前接收到的待处理票据图片中的待识别字段;再根据待识别字段与第一识别模型的映射关系,分别确定各个待识别字段各自对应的第一识别模型,以识别出各个待识别字段的目标行字符区域;最后根据待识别字段与第二识别模型的映射关系,确定各个待识别字段各自对应的第二识别模型,根据各个第二识别模型分别识别出各个所述待识别字段的目标行字符区域包含的字符信息,并将识别出的各个字符信息与当前的票据图片进行关联映射,如此准确、高效的实现对用户上传的票据图片中的文本信息的自动识别。
如图2所示,本实施例中,所述票据图片识别模型的训练过程如下:
步骤S1,为每一个预设票据图片类别准备预设数量的标注有对应的图片类别的票据图片样本;
针对每一个预设票据图片类别,均准备预设数量(例如,1000张)的标注有对应的图片类别的票据图片样本;例如,预设票据图片类别总共有两种,分别为门诊票据和住院票据,则准备预设数量的标注有门诊票据的票据图片样本和预设数量的标注有住院票据的票据图片样本。
步骤S2,将每一个预设票据图片类别对应的票据图片样本分为第一比例的训练子集和第二比例的验证子集,将各个训练子集中的票据图片样本进行混合以得到训练集,并将各个验证子集中的票据图片样本进行混合以得到验证集;
针对每一个预设票据图片类别对应的票据图片样本,均分为第一比例(例如,80%)的训练子集和第二比例(例如,20%)的验证子集,然后将得到的各个训练子集中的票据图片样本混合,以得到训练集(例如,训练集由门诊票据的票据图片样本的80%与住院票据的票据图片样本的80%混合形成),以及将得到的各个验证子集中的票据图片样本混合,以得到验证集(例如,验证集由门诊票据的票据图片样本的20%与住院票据的票据图片样本的20%混合形成)。
步骤S3,利用所述训练集训练所述票据图片识别模型,并利用所述验证集对经所述训练集训练完成后的所述票据图片识别模型的准确率进行验证;
在得到训练集和验证集后,先用得到的训练集对所述票据图片识别模型进行训练,在用所述训练集对所述票据图片识别模型训练完成后,再用得到的所述验证集对该票据图片识别模型的准确率进行验证;
步骤S4,若准确率大于或者等于预设准确率,则训练结束;
系统中预先设置了准确率的验证阈值(即所述预设准确率,例如98.5%),用于对所述票据图片识别模型的训练效果进行检验;若通过所述验证集对所述票据图片识别模型验证得到的准确率大于所述预设准确率,那么说明该票据图片识别模型的训练达到了预设标准,此时则结束模型训练。
步骤S5,若准确率小于预设准确率,则增加每一个预设票据图片类别对应的票据图片样本的数量,并重新执行步骤S2、S3。
若是通过所述验证集对所述票据图片识别模型验证得到的准确率小于或等于所述预设准确率,那么说明该票据图片识别模型的训练还没有达到了预设标准,可能是训练集数量不够或验证集数量不够,所以,在这种情况时,则增加每一个预设票据图片类别对应的票据图片样本的数量(例如,每次增加固定数量或每次增加随机数量),然后在这基础上,重新执行上述步骤S2和S3,如此循环执行,直至达到了步骤S4的要求,则结束模型训练。
本实施例中,所述票据图片识别模型优选为深度卷积神经网络(例如,该深度卷积神经网络可以为在CaffeNet的环境下选取的基于深度卷积神经网络SSD(Single ShotMultiBox Detector)算法模型),本发明采用的深度卷积神经网络模型由1个输入层,13个卷积层,5个池化层,2个全连接层,1个分类层构成。所述深度卷积神经网络模型的详细结构如下表所示:
Figure BDA0001428394480000101
Figure BDA0001428394480000111
其中:Layer Name列表示每一层的名称,Input表示输入层,Conv表示模型的卷积层,Conv1表示模型的第1个卷积层,MaxPool表示模型的最大值池化层,MaxPool1表示模型的第1个最大值池化层,Fc表示模型中的全连接层,Fc1表示模型中第1个全连接层,Softmax表示Softmax分类器;Batch Size表示当前层的输入图像数目;Kernel Size表示当前层卷积核的尺度(例如,Kernel Size可以等于3,表示卷积核的尺度为3x3);Stride Size表示卷积核的移动步长,即做完一次卷积之后移动到下一个卷积位置的距离;Pad Size表示对当前网络层之中的图像填充的大小。
本实施例中,所述票据图片识别模型的训练过程之前,可对票据图片样本做如下处理:
根据其高宽比信息以及印章的位置判断票据图片的转置情况,并做翻转调整;当高宽比大于1时,说明票据图片高宽颠倒,若印章位置在票据图片左侧,则对票据图像做顺时针旋转九十度处理,若印章位置在票据图片右侧,则对票据图像做逆时针旋转九十度处理;当高宽比小于1时,说明票据图片高宽未颠倒,若印章位置在票据图片下侧,则对票据图像做顺时针旋转一百八十度处理。
找出标注存在严重问题的票据图片样本(比如,关键位置信息缺失或超出整张图片范围,以及印章标注位置位于票据中央等明显错误的票据图片样本),将这些票据图片样本去除,确保票据图片样本的准确无误,从而确保训练效果。
进一步地,如图3所示,本实施例优选所述第一识别模型为卷积神经网络模型,针对一个待识别字段对应的第一识别模型的训练过程如下:
步骤C1,针对该待识别字段,获取预设数量的票据图片样本;
随机获取预设数量(例如,10万个)的票据图片样本,其中,部分票据图片样本包含该待识别字段的字符信息,部分票据图片样本则不包含该待识别字段的字符信息。
步骤C2,将包含该待识别字段的字符信息的票据图片样本归入第一训练集,并将不包含该待识别字段的字符信息的票据图片样本归入第二训练集;
从获取的票据图片样本中,将包含该待识别字段的字符信息的票据图片样本与不包含该待识别字段的字符信息的票据图片样本分开,并将包含该待识别字段的字符信息的票据图片样本归入第一训练集,以及将不包含该待识别字段的字符信息的票据图片样本归入第二训练集。
步骤C3,分别从第一训练集和第二训练集中提取出第一预设比例的票据图片样本作为待训练的样本图片,并将第一训练集和第二训练集中剩余的票据图片样本作为待验证的样本图片;
从所述第一训练集和第二训练集中分别提取出第一预设比例(例如,80%)的票据图片样本作为待训练的样本图片,以及将第一训练集和第二训练集中剩余的票据图片样本作为带验证的样本图片,这样使得待训练的样本图片和待验证的样本图片中均存在包含和不包含该待识别字段的字符信息的票据图片样本,且包含和不包含该待识别字段的字符信息的票据图片样本在待训练的样本图片和待验证的样本图片中的比例一致。
步骤C4,利用提取的各个待训练的样本图片进行模型训练,以生成所述第一识别模型,并利用各个待验证的样本图片对生成的所述第一识别模型进行验证;
用提取的各个待训练的样本图片对预设类型模型进行模型训练,从而得到所述第一识别模型,然后再用各个待验证的样本图片对得到的所述第一识别模型进行验证,得出所述第一识别模型的验证通过率。
步骤C5,若验证通过率大于等于预设阈值,则训练完成;
系统中预先设置了验证通过率的验证阈值(即所述预设阈值,例如98%),用于对所述第一识别模型的训练效果进行检验;若通过各个所述待验证的样本图片对所述第一识别模型验证得到的验证通过率大于所述预设阈值,那么说明该第一识别模型的训练达到了预期标准,此时则结束模型训练。
步骤C6,若验证通过率小于预设阈值,则增加票据图片样本的数量,并重复执行步骤C2、C3、C4。
若是通过各个所述待验证的样本图片对所述第一识别模型验证得到的验证通过率小于或等于所述预设阈值,那么说明该第一识别模型的训练还没有达到了预期标准,可能是待训练的样本图片数量不够或待验证的样本图片数量不够,所以,在这种情况时,则增加所述票据图片样本的数量(例如,每次增加固定数量或每次增加随机数量),然后在这基础上,重新执行上述步骤C2、C3和C4,如此循环执行,直至达到了步骤C5的要求,则结束模型训练。
进一步地,如图4所示,本实施例优选所述第二识别模型为时间递归神经网络模型(Long-Short Term Memory,LSTM),针对一个待识别字段对应的第二识别模型的训练过程如下:
步骤D1,针对该待识别字段,获取预设数量的票据图片样本,每个票据图片样本中仅包含一行该待识别字段的字符信息,字体为黑色,背景为白色,并将各个票据图片样本的名称命名为其所含的该待识别字段的字符信息;
获取预设数量(例如,10万个)的票据图片样本;获取的票据图片样本中,每个票据图片样本中包含且仅包含一行该待识别字段的字符信息,将每个票据图片样本的名称各自命名为其所述包含的该待识别字段的字符信息;该票据图片样本用于模型训练时,模型根据该字符信息的字体颜色和背景颜色即可识别出该字符信息的位置,从而获取该字符信息。
步骤D2,将所述票据图片样本按照X:Y的比例分成第一数据集和第二数据集,第一数据集中的图片样本数量大于第二数据集中的图片样本数量,第一数据集作为训练集,第二数据集作为测试集;
将获取的所有票据图片样本按照预设比例X:Y(X、Y均大于0)的比例分成第一数据集和第二数据集,其中,第一数据集中的图片样本数量比第二数据集中的图片样本数量多,即X大于Y(例如,X为4,Y为1);将第一数据集作为训练集,用于训练模型;第二数据集作为测试集,用于测试模型的训练效果。
步骤D3,将第一数据集中的图片样本送入时间递归神经网络模型进行模型训练,每隔预设时间,对模型使用第二数据集进行测试,以评估当前训练的模型效果;测试时,使用训练得到的模型对第二数据集中的图片样本进行字符信息识别,并和测试的图片样本的名称做对比,以计算识别的结果和该图片样本的名称的误差。
用第一数据集中的图片样本对模型进行训练,在训练过程中每个预设时间(例如每进行1000次迭代)或者以预设的频率,对模型使用第二数据集进行测试,以检测当前训练的模型效果;具体在测试时,使用当前训练得到的模型对第二数据集中的图片样本进行字符信息识别,并将识别出的结果与测试的图片样本的名称做对比,从而计算出识别的结果与该图片样本的名称的误差,本实施例优选误差计算采用编辑距离作为计算标准。
步骤D4,若测试时的模型对图片样本识别的误差出现发散,则调整训练参数并重新训练;
如果模型对图片样本识别的误差出现发散,则模型训练不符合要求,此时则按预设规则或随机调整训练参数后重新对该模型进行训练,使训练时模型对票据图片的识别的误差能够收敛。
步骤D5,若测试时的模型对图片样本识别的误差收敛,则结束模型训练,生成的模型作为最终的该待识别字段对应的第二识别模型。
当模型对图片样本识别的误差收敛时,训练的模型达到要求,则结束模型训练,并将生成的模型(即当前训练后的模型)作为最终的该待识别字段对应的第二识别模型。
此外,本发明还提出一种票据信息识别系统。
请参阅图5,是本发明票据信息识别系统10较佳实施例的运行环境示意图。
在本实施例中,票据信息识别系统10安装并运行于电子装置1中。电子装置1可以是桌上型计算机、笔记本、掌上电脑及服务器等计算设备。该电子装置1可包括,但不仅限于,存储器11、处理器12及显示器13。图5仅示出了具有组件11-13的电子装置1,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
存储器11在一些实施例中可以是电子装置1的内部存储单元,例如该电子装置1的硬盘或内存。存储器11在另一些实施例中也可以是电子装置1的外部存储设备,例如电子装置1上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器11还可以既包括电子装置1的内部存储单元也包括外部存储设备。存储器11用于存储安装于电子装置1的应用软件及各类数据,例如票据信息识别系统10的程序代码等。存储器11还可以用于暂时地存储已经输出或者将要输出的数据。
处理器12在一些实施例中可以是一中央处理器(Central Processing Unit,CPU),微处理器或其他数据处理芯片,用于运行存储器11中存储的程序代码或处理数据,例如执行票据信息识别系统10等。
显示器13在一些实施例中可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。显示器13用于显示在电子装置1中处理的信息以及用于显示可视化的用户界面,例如业务定制界面等。电子装置1的部件11-13通过系统总线相互通信。
请参阅图6,是本发明票据信息识别系统10较佳实施例的程序模块图。在本实施例中,票据信息识别系统10可以被分割成一个或多个模块,一个或者多个模块被存储于存储器11中,并由一个或多个处理器(本实施例为处理器12)所执行,以完成本发明。例如,在图6中,票据信息识别系统10可以被分割成第一识别模块101、矫正模块102、确定模块103、第二识别模块104及第三识别模块105。本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段,比程序更适合于描述票据信息识别系统10在电子装置1中的执行过程,其中:
第一识别模块101,用于在收到待处理的票据图片后,利用预先训练好的票据图片识别模型对收到的票据图片中的票据类别进行识别,并输出票据的类别识别结果;
系统在收到待处理的票据图片后,利用预先训练好的票据图片识别模型对收到的票据图片进行识别,识别出票据的类别并输出类别识别结果;例如,系统收到的待处理的票据图片为医疗票据图片,而医疗票据的类别包括门诊票据、住院票据、手术票据等,那么系统利用票据图片识别模型系统对收到的医疗票据图片识别后,输出该医疗票据的类别识别结果:门诊票据、住院票据、手术票据等。
矫正模块102,用于利用预先确定的矫正规则对收到的票据图片进行倾斜矫正;
系统中具有预先确定的矫正规则;由于用户上传到系统的票据图片(即系统收到的票据图片)通常都有一定的歪斜,因此系统会对收到的票据图片利用预先确定的矫正规则进行倾斜矫正,以确保系统对票据信息的识别成功率。本实施例优选所述预先确定的矫正规则为:首先,用霍夫变换(Hough)的概率算法找出图像中尽可能多的小段直线;然后,从找出的小段直线中确定出所有偏水平的直线,并将确定出的直线中x坐标值相差小于第一预设差值(例如0.2cm)的直线按对应的y坐标值的大小顺序依次相连,按照x坐标值大小分为若干类,或者,将确定出的直线中y坐标值相差小于第二预设差值(例如0.3cm)的直线按对应的x坐标值的大小顺序依次相连,按照y坐标值大小分为若干类;接着,将属于一类的所有水平直线作为一个目标类直线,并通过最小二乘法找出最接近各个目标类直线的长直线;最后,计算出各个长直线的斜率,计算出各个长直线的斜率的中位数和均值,比较计算出的斜率的中位数和均值的大小以确定出较小者,并根据确定出的较小者调整图像倾角。当然,在其它实施例中,还可以采取其它矫正规则。
确定模块103,用于根据预先确定的票据类别与待识别字段的映射关系,确定识别的票据类别对应的待识别字段;
系统在得到票据图片的票据类别后,根据预先确定的票据类别与待识别字段的映射关系,则可确定出收到的票据图片的票据类别所对应的待识别字段,该票据类别对应的待识别字段的数量可能是一个或多个。
第二识别模块104,用于根据预先确定的待识别字段与第一识别模型的映射关系,确定各个所述待识别字段对应的第一识别模型,针对各个所述待识别字段,调用对应的第一识别模型对倾斜矫正后的票据图片的行字符区域进行区域识别,以分别识别出包含各个所述待识别字段的字符信息的目标行字符区域;
系统中具有预先确定的待识别字段与第一识别模型的第一映射关系表;系统在确定出票据图片的各个待识别字段后,通过查找该第一映射关系表,则可找到各个所述待识别字段各自对应的第一识别模型;系统针对每个待识别字段,均调用该待识别字段对应的第一识别模型对倾斜矫正后的票据图片的行字符区域进行区域识别,从而分别识别出票据图片中包含各个待识别字段的字符信息的目标行字符区域。
第三识别模块105,用于根据预先确定的待识别字段与第二识别模型的映射关系,确定各个所述待识别字段对应的第二识别模型,针对各个所述待识别字段的目标行字符区域,调用对应的第二识别模型进行字符识别,以分别识别出各个所述待识别字段的目标行字符区域包含的字符信息,并将识别的各个所述待识别字段的字符信息与所述票据图片进行关联映射。
系统中还具有预先确定的待识别字段与第二识别模型的第二映射关系表;系统在识别出所述票据图片中分别包含各个待识别字段的字符信息的目标行字符区域后,通过查找第二映射关系表,先找到各个所述待识别字段各自对应的第二识别模型;然后针对每个所述待识别字段的目标行字符区域,均调用对应的第二识别模型进行字符识别,从而通过各个对应的第二识别模型识别出各个所述待识别字段的目标行字符区域包含的字符信息,再将识别出的各个所述待识别字段的字符信息与所述票据图片进行关联映射,建立关联映射关系。
本实施例技术方案,首先通过预先训练好的票据图片识别模型识别出收到的票据图片中的票据类别,并通过预先确定的矫正规则对收到的票据图片进行倾斜矫正;然后根据票据类别与待识别字段的映射关系,确定当前接收到的待处理票据图片中的待识别字段;再根据待识别字段与第一识别模型的映射关系,分别确定各个待识别字段各自对应的第一识别模型,以识别出各个待识别字段的目标行字符区域;最后根据待识别字段与第二识别模型的映射关系,确定各个待识别字段各自对应的第二识别模型,根据各个第二识别模型分别识别出各个所述待识别字段的目标行字符区域包含的字符信息,并将识别出的各个字符信息与当前的票据图片进行关联映射,如此准确、高效的实现对用户上传的票据图片中的文本信息的自动识别。
本实施例中,所述票据图片识别模型的训练过程如下:
步骤S1,为每一个预设票据图片类别准备预设数量的标注有对应的图片类别的票据图片样本;
针对每一个预设票据图片类别,均准备预设数量(例如,1000张)的标注有对应的图片类别的票据图片样本;例如,预设票据图片类别总共有两种,分别为门诊票据和住院票据,则准备预设数量的标注有门诊票据的票据图片样本和预设数量的标注有住院票据的票据图片样本。
步骤S2,将每一个预设票据图片类别对应的票据图片样本分为第一比例的训练子集和第二比例的验证子集,将各个训练子集中的票据图片样本进行混合以得到训练集,并将各个验证子集中的票据图片样本进行混合以得到验证集;
针对每一个预设票据图片类别对应的票据图片样本,均分为第一比例(例如,80%)的训练子集和第二比例(例如,20%)的验证子集,然后将得到的各个训练子集中的票据图片样本混合,以得到训练集(例如,训练集由门诊票据的票据图片样本的80%与住院票据的票据图片样本的80%混合形成),以及将得到的各个验证子集中的票据图片样本混合,以得到验证集(例如,验证集由门诊票据的票据图片样本的20%与住院票据的票据图片样本的20%混合形成)。
步骤S3,利用所述训练集训练所述票据图片识别模型,并利用所述验证集对经所述训练集训练完成后的所述票据图片识别模型的准确率进行验证;
在得到训练集和验证集后,先用得到的训练集对所述票据图片识别模型进行训练,在用所述训练集对所述票据图片识别模型训练完成后,再用得到的所述验证集对该票据图片识别模型的准确率进行验证;
步骤S4,若准确率大于或者等于预设准确率,则训练结束;
系统中预先设置了准确率的验证阈值(即所述预设准确率,例如98.5%),用于对所述票据图片识别模型的训练效果进行检验;若通过所述验证集对所述票据图片识别模型验证得到的准确率大于所述预设准确率,那么说明该票据图片识别模型的训练达到了预设标准,此时则结束模型训练。
步骤S5,若准确率小于预设准确率,则增加每一个预设票据图片类别对应的票据图片样本的数量,并重新执行步骤S2、S3。
若是通过所述验证集对所述票据图片识别模型验证得到的准确率小于或等于所述预设准确率,那么说明该票据图片识别模型的训练还没有达到了预设标准,可能是训练集数量不够或验证集数量不够,所以,在这种情况时,则增加每一个预设票据图片类别对应的票据图片样本的数量(例如,每次增加固定数量或每次增加随机数量),然后在这基础上,重新执行上述步骤S2和S3,如此循环执行,直至达到了步骤S4的要求,则结束模型训练。
本实施例中,所述票据图片识别模型优选为深度卷积神经网络(例如,该深度卷积神经网络可以为在CaffeNet的环境下选取的基于深度卷积神经网络SSD(Single ShotMultiBox Detector)算法模型),本发明采用的深度卷积神经网络模型由1个输入层,13个卷积层,5个池化层,2个全连接层,1个分类层构成。所述深度卷积神经网络模型的详细结构如下表所示:
Figure BDA0001428394480000191
Figure BDA0001428394480000201
其中:Layer Name列表示每一层的名称,Input表示输入层,Conv表示模型的卷积层,Conv1表示模型的第1个卷积层,MaxPool表示模型的最大值池化层,MaxPool1表示模型的第1个最大值池化层,Fc表示模型中的全连接层,Fc1表示模型中第1个全连接层,Softmax表示Softmax分类器;Batch Size表示当前层的输入图像数目;Kernel Size表示当前层卷积核的尺度(例如,Kernel Size可以等于3,表示卷积核的尺度为3x3);Stride Size表示卷积核的移动步长,即做完一次卷积之后移动到下一个卷积位置的距离;Pad Size表示对当前网络层之中的图像填充的大小。
本实施例中,所述票据图片识别模型的训练过程之前,可对票据图片样本做如下处理:
根据其高宽比信息以及印章的位置判断票据图片的转置情况,并做翻转调整;当高宽比大于1时,说明票据图片高宽颠倒,若印章位置在票据图片左侧,则对票据图像做顺时针旋转九十度处理,若印章位置在票据图片右侧,则对票据图像做逆时针旋转九十度处理;当高宽比小于1时,说明票据图片高宽未颠倒,若印章位置在票据图片下侧,则对票据图像做顺时针旋转一百八十度处理。
找出标注存在严重问题的票据图片样本(比如,关键位置信息缺失或超出整张图片范围,以及印章标注位置位于票据中央等明显错误的票据图片样本),将这些票据图片样本去除,确保票据图片样本的准确无误,从而确保训练效果。
进一步地,本实施例优选所述第一识别模型为卷积神经网络模型,针对一个待识别字段对应的第一识别模型的训练过程如下:
步骤C1,针对该待识别字段,获取预设数量的票据图片样本;
随机获取预设数量(例如,10万个)的票据图片样本,其中,部分票据图片样本包含该待识别字段的字符信息,部分票据图片样本则不包含该待识别字段的字符信息。
步骤C2,将包含该待识别字段的字符信息的票据图片样本归入第一训练集,并将不包含该待识别字段的字符信息的票据图片样本归入第二训练集;
从获取的票据图片样本中,将包含该待识别字段的字符信息的票据图片样本与不包含该待识别字段的字符信息的票据图片样本分开,并将包含该待识别字段的字符信息的票据图片样本归入第一训练集,以及将不包含该待识别字段的字符信息的票据图片样本归入第二训练集。
步骤C3,分别从第一训练集和第二训练集中提取出第一预设比例的票据图片样本作为待训练的样本图片,并将第一训练集和第二训练集中剩余的票据图片样本作为待验证的样本图片;
从所述第一训练集和第二训练集中分别提取出第一预设比例(例如,80%)的票据图片样本作为待训练的样本图片,以及将第一训练集和第二训练集中剩余的票据图片样本作为带验证的样本图片,这样使得待训练的样本图片和待验证的样本图片中均存在包含和不包含该待识别字段的字符信息的票据图片样本,且包含和不包含该待识别字段的字符信息的票据图片样本在待训练的样本图片和待验证的样本图片中的比例一致。
步骤C4,利用提取的各个待训练的样本图片进行模型训练,以生成所述第一识别模型,并利用各个待验证的样本图片对生成的所述第一识别模型进行验证;
用提取的各个待训练的样本图片对预设类型模型进行模型训练,从而得到所述第一识别模型,然后再用各个待验证的样本图片对得到的所述第一识别模型进行验证,得出所述第一识别模型的验证通过率。
步骤C5,若验证通过率大于等于预设阈值,则训练完成;
系统中预先设置了验证通过率的验证阈值(即所述预设阈值,例如98%),用于对所述第一识别模型的训练效果进行检验;若通过各个所述待验证的样本图片对所述第一识别模型验证得到的验证通过率大于所述预设阈值,那么说明该第一识别模型的训练达到了预期标准,此时则结束模型训练。
步骤C6,若验证通过率小于预设阈值,则增加票据图片样本的数量,并重复执行步骤C2、C3、C4。
若是通过各个所述待验证的样本图片对所述第一识别模型验证得到的验证通过率小于或等于所述预设阈值,那么说明该第一识别模型的训练还没有达到了预期标准,可能是待训练的样本图片数量不够或待验证的样本图片数量不够,所以,在这种情况时,则增加所述票据图片样本的数量(例如,每次增加固定数量或每次增加随机数量),然后在这基础上,重新执行上述步骤C2、C3和C4,如此循环执行,直至达到了步骤C5的要求,则结束模型训练。
进一步地,本实施例优选所述第二识别模型为时间递归神经网络模型(Long-Short Term Memory,LSTM),针对一个待识别字段对应的第二识别模型的训练过程如下:
步骤D1,针对该待识别字段,获取预设数量的票据图片样本,每个票据图片样本中仅包含一行该待识别字段的字符信息,字体为黑色,背景为白色,并将各个票据图片样本的名称命名为其所含的该待识别字段的字符信息;
获取预设数量(例如,10万个)的票据图片样本;获取的票据图片样本中,每个票据图片样本中包含且仅包含一行该待识别字段的字符信息,将每个票据图片样本的名称各自命名为其所述包含的该待识别字段的字符信息;该票据图片样本用于模型训练时,模型根据该字符信息的字体颜色和背景颜色即可识别出该字符信息的位置,从而获取该字符信息。
步骤D2,将所述票据图片样本按照X:Y的比例分成第一数据集和第二数据集,第一数据集中的图片样本数量大于第二数据集中的图片样本数量,第一数据集作为训练集,第二数据集作为测试集;
将获取的所有票据图片样本按照预设比例X:Y(X、Y均大于0)的比例分成第一数据集和第二数据集,其中,第一数据集中的图片样本数量比第二数据集中的图片样本数量多,即X大于Y(例如,X为4,Y为1);将第一数据集作为训练集,用于训练模型;第二数据集作为测试集,用于测试模型的训练效果。
步骤D3,将第一数据集中的图片样本送入时间递归神经网络模型进行模型训练,每隔预设时间,对模型使用第二数据集进行测试,以评估当前训练的模型效果;测试时,使用训练得到的模型对第二数据集中的图片样本进行字符信息识别,并和测试的图片样本的名称做对比,以计算识别的结果和该图片样本的名称的误差。
用第一数据集中的图片样本对模型进行训练,在训练过程中每个预设时间(例如每进行1000次迭代)或者以预设的频率,对模型使用第二数据集进行测试,以检测当前训练的模型效果;具体在测试时,使用当前训练得到的模型对第二数据集中的图片样本进行字符信息识别,并将识别出的结果与测试的图片样本的名称做对比,从而计算出识别的结果与该图片样本的名称的误差,本实施例优选误差计算采用编辑距离作为计算标准。
步骤D4,若测试时的模型对图片样本识别的误差出现发散,则调整训练参数并重新训练;
如果模型对图片样本识别的误差出现发散,则模型训练不符合要求,此时则按预设规则或随机调整训练参数后重新对该模型进行训练,使训练时模型对票据图片的识别的误差能够收敛。
步骤D5,若测试时的模型对图片样本识别的误差收敛,则结束模型训练,生成的模型作为最终的该待识别字段对应的第二识别模型。
当模型对图片样本识别的误差收敛时,训练的模型达到要求,则结束模型训练,并将生成的模型(即当前训练后的模型)作为最终的该待识别字段对应的第二识别模型。
进一步地,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质存储有票据信息识别系统,所述票据信息识别系统可被至少一个处理器执行,以使所述至少一个处理器执行上述任一实施例中的票据信息识别方法。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是在本发明的发明构思下,利用本发明说明书及附图内容所作的等效结构变换,或直接/间接运用在其他相关的技术领域均包括在本发明的专利保护范围内。

Claims (9)

1.一种电子装置,其特征在于,所述电子装置包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的票据信息识别系统,所述票据信息识别系统被所述处理器执行时实现如下步骤:
在收到待处理的票据图片后,利用预先训练好的票据图片识别模型对收到的票据图片中的票据类别进行识别,并输出票据的类别识别结果;
利用预先确定的矫正规则对收到的票据图片进行倾斜矫正;
根据预先确定的票据类别与待识别字段的映射关系,确定识别的票据类别对应的待识别字段;
根据预先确定的待识别字段与第一识别模型的映射关系,确定各个所述待识别字段对应的第一识别模型,针对各个所述待识别字段,调用对应的第一识别模型对倾斜矫正后的票据图片的行字符区域进行区域识别,以分别识别出包含各个所述待识别字段的字符信息的目标行字符区域;
根据预先确定的待识别字段与第二识别模型的映射关系,确定各个所述待识别字段对应的第二识别模型,针对各个所述待识别字段的目标行字符区域,调用对应的第二识别模型进行字符识别,以分别识别出各个所述待识别字段的目标行字符区域包含的字符信息,并将识别的各个所述待识别字段的字符信息与所述票据图片进行关联映射;
所述票据图片识别模型的训练过程如下:
S1、为每一个预设票据图片类别准备预设数量的标注有对应的图片类别的票据图片样本;
S2、将每一个预设票据图片类别对应的票据图片样本分为第一比例的训练子集和第二比例的验证子集,将各个训练子集中的票据图片样本进行混合以得到训练集,并将各个验证子集中的票据图片样本进行混合以得到验证集;
S3、利用所述训练集训练所述票据图片识别模型,并利用所述验证集对经所述训练集训练完成后的所述票据图片识别模型的准确率进行验证;
S4、若准确率大于或者等于预设准确率,则训练结束;
S5、若准确率小于预设准确率,则增加每一个预设票据图片类别对应的票据图片样本的数量,并重新执行步骤S2、S3。
2.如权利要求1所述的电子装置,其特征在于,所述票据图片识别模型的训练过程之前,对票据图片样本做如下处理:
根据其高宽比信息以及印章的位置判断票据图片的转置情况,并做翻转调整;当高宽比大于1时,说明票据图片高宽颠倒,若印章位置在票据图片左侧,则对票据图像做顺时针旋转九十度处理,若印章位置在票据图片右侧,则对票据图像做逆时针旋转九十度处理;当高宽比小于1时,说明票据图片高宽未颠倒,若印章位置在票据图片下侧,则对票据图像做顺时针旋转一百八十度处理。
3.如权利要求1所述的电子装置,其特征在于,所述第一识别模型为卷积神经网络模型,针对一个待识别字段对应的第一识别模型的训练过程如下:
C1、针对该待识别字段,获取预设数量的票据图片样本;
C2、将包含该待识别字段的字符信息的票据图片样本归入第一训练集,并将不包含该待识别字段的字符信息的票据图片样本归入第二训练集;
C3、分别从第一训练集和第二训练集中提取出第一预设比例的票据图片样本作为待训练的样本图片,并将第一训练集和第二训练集中剩余的票据图片样本作为待验证的样本图片;
C4、利用提取的各个待训练的样本图片进行模型训练,以生成所述第一识别模型,并利用各个待验证的样本图片对生成的所述第一识别模型进行验证;
C5、若验证通过率大于等于预设阈值,则训练完成;
C6、若验证通过率小于预设阈值,则增加票据图片样本的数量,并重复执行步骤C2、C3、C4。
4.如权利要求1所述的电子装置,其特征在于,所述第二识别模型为时间递归神经网络模型,针对一个待识别字段对应的第二识别模型的训练过程如下:
针对该待识别字段,获取预设数量的票据图片样本,每个票据图片样本中仅包含一行该待识别字段的字符信息,字体为黑色,背景为白色,并将各个票据图片样本的名称命名为其所含的该待识别字段的字符信息;
将所述票据图片样本按照X:Y的比例分成第一数据集和第二数据集,第一数据集中的图片样本数量大于第二数据集中的图片样本数量,第一数据集作为训练集,第二数据集作为测试集;
将第一数据集中的图片样本送入时间递归神经网络模型进行模型训练,每隔预设时间,对模型使用第二数据集进行测试,以评估当前训练的模型效果;测试时,使用训练得到的模型对第二数据集中的图片样本进行字符信息识别,并和测试的图片样本的名称做对比,以计算识别的结果和该图片样本的名称的误差;
若测试时的模型对图片样本识别的误差出现发散,则调整训练参数并重新训练;
若测试时的模型对图片样本识别的误差收敛,则结束模型训练,生成的模型作为最终的该待识别字段对应的第二识别模型。
5.一种票据信息识别方法,其特征在于,该票据信息识别方法包括步骤:
在收到待处理的票据图片后,利用预先训练好的票据图片识别模型对收到的票据图片中的票据类别进行识别,并输出票据的类别识别结果;
利用预先确定的矫正规则对收到的票据图片进行倾斜矫正;
根据预先确定的票据类别与待识别字段的映射关系,确定识别的票据类别对应的待识别字段;
根据预先确定的待识别字段与第一识别模型的映射关系,确定各个所述待识别字段对应的第一识别模型,针对各个所述待识别字段,调用对应的第一识别模型对倾斜矫正后的票据图片的行字符区域进行区域识别,以分别识别出包含各个所述待识别字段的字符信息的目标行字符区域;
根据预先确定的待识别字段与第二识别模型的映射关系,确定各个所述待识别字段对应的第二识别模型,针对各个所述待识别字段的目标行字符区域,调用对应的第二识别模型进行字符识别,以分别识别出各个所述待识别字段的目标行字符区域包含的字符信息,并将识别的各个所述待识别字段的字符信息与所述票据图片进行关联映射;
所述票据图片识别模型的训练过程如下:
S1、为每一个预设票据图片类别准备预设数量的标注有对应的图片类别的票据图片样本;
S2、将每一个预设票据图片类别对应的票据图片样本分为第一比例的训练子集和第二比例的验证子集,将各个训练子集中的票据图片样本进行混合以得到训练集,并将各个验证子集中的票据图片样本进行混合以得到验证集;
S3、利用所述训练集训练所述票据图片识别模型,并利用所述验证集对经所述训练集训练完成后的所述票据图片识别模型的准确率进行验证;
S4、若准确率大于或者等于预设准确率,则训练结束;
S5、若准确率小于预设准确率,则增加每一个预设票据图片类别对应的票据图片样本的数量,并重新执行步骤S2、S3。
6.如权利要求5所述的票据信息识别方法,其特征在于,所述票据图片识别模型的训练过程之前,对票据图片样本做如下处理:
根据其高宽比信息以及印章的位置判断票据图片的转置情况,并做翻转调整;当高宽比大于1时,说明票据图片高宽颠倒,若印章位置在票据图片左侧,则对票据图像做顺时针旋转九十度处理,若印章位置在票据图片右侧,则对票据图像做逆时针旋转九十度处理;当高宽比小于1时,说明票据图片高宽未颠倒,若印章位置在票据图片下侧,则对票据图像做顺时针旋转一百八十度处理。
7.如权利要求5或6所述的票据信息识别方法,其特征在于,所述第一识别模型为卷积神经网络模型,针对一个待识别字段对应的第一识别模型的训练过程如下:
C1、针对该待识别字段,获取预设数量的票据图片样本;
C2、将包含该待识别字段的字符信息的票据图片样本归入第一训练集,并将不包含该待识别字段的字符信息的票据图片样本归入第二训练集;
C3、分别从第一训练集和第二训练集中提取出第一预设比例的票据图片样本作为待训练的样本图片,并将第一训练集和第二训练集中剩余的票据图片样本作为待验证的样本图片;
C4、利用提取的各个待训练的样本图片进行模型训练,以生成所述第一识别模型,并利用各个待验证的样本图片对生成的所述第一识别模型进行验证;
C5、若验证通过率大于等于预设阈值,则训练完成;
C6、若验证通过率小于预设阈值,则增加票据图片样本的数量,并重复执行步骤C2、C3、C4。
8.如权利要求5或6所述的票据信息识别方法,其特征在于,所述第二识别模型为时间递归神经网络模型,针对一个待识别字段对应的第二识别模型的训练过程如下:
针对该待识别字段,获取预设数量的票据图片样本,每个票据图片样本中仅包含一行该待识别字段的字符信息,字体为黑色,背景为白色,并将各个票据图片样本的名称命名为其所含的该待识别字段的字符信息;
将所述票据图片样本按照X:Y的比例分成第一数据集和第二数据集,第一数据集中的图片样本数量大于第二数据集中的图片样本数量,第一数据集作为训练集,第二数据集作为测试集;
将第一数据集中的图片样本送入时间递归神经网络模型进行模型训练,每隔预设时间,对模型使用第二数据集进行测试,以评估当前训练的模型效果;测试时,使用训练得到的模型对第二数据集中的图片样本进行字符信息识别,并和测试的图片样本的名称做对比,以计算识别的结果与该图片样本的名称的误差;
若测试时的模型对图片样本识别的误差出现发散,则调整训练参数并重新训练;
若测试时的模型对图片样本识别的误差收敛,则结束模型训练,生成的模型作为最终的该待识别字段对应的第二识别模型。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有票据信息识别系统,所述票据信息识别系统可被至少一个处理器执行,以使所述至少一个处理器执行如权利要求5-8中的任一项所述的票据信息识别方法。
CN201710929629.8A 2017-10-09 2017-10-09 电子装置、票据信息识别方法和计算机可读存储介质 Active CN107766809B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201710929629.8A CN107766809B (zh) 2017-10-09 2017-10-09 电子装置、票据信息识别方法和计算机可读存储介质
PCT/CN2017/108767 WO2019071662A1 (zh) 2017-10-09 2017-10-31 电子装置、票据信息识别方法和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710929629.8A CN107766809B (zh) 2017-10-09 2017-10-09 电子装置、票据信息识别方法和计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN107766809A CN107766809A (zh) 2018-03-06
CN107766809B true CN107766809B (zh) 2020-05-19

Family

ID=61267112

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710929629.8A Active CN107766809B (zh) 2017-10-09 2017-10-09 电子装置、票据信息识别方法和计算机可读存储介质

Country Status (2)

Country Link
CN (1) CN107766809B (zh)
WO (1) WO2019071662A1 (zh)

Families Citing this family (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108446621A (zh) * 2018-03-14 2018-08-24 平安科技(深圳)有限公司 票据识别方法、服务器及计算机可读存储介质
CN108595544A (zh) * 2018-04-09 2018-09-28 深源恒际科技有限公司 一种文档图片分类方法
CN108764226B (zh) * 2018-04-13 2022-05-03 顺丰科技有限公司 图像文本识别方法、装置、设备及其存储介质
CN108564035B (zh) 2018-04-13 2020-09-25 杭州睿琪软件有限公司 识别单据上记载的信息的方法及系统
CN108664897A (zh) * 2018-04-18 2018-10-16 平安科技(深圳)有限公司 票据识别方法、装置及存储介质
CN108830138B (zh) * 2018-04-26 2021-05-07 平安科技(深圳)有限公司 牲畜识别方法、装置及存储介质
CN109034159B (zh) * 2018-05-28 2021-05-28 北京捷通华声科技股份有限公司 图像信息提取方法和装置
CN110619252B (zh) * 2018-06-19 2022-11-04 百度在线网络技术(北京)有限公司 识别图片中表单数据的方法、装置、设备及存储介质
CN109034050B (zh) * 2018-07-23 2022-05-03 顺丰科技有限公司 基于深度学习的身份证图像文本识别方法及装置
CN109299782B (zh) * 2018-08-02 2021-11-12 奇安信科技集团股份有限公司 一种基于深度学习模型的数据处理方法及装置
CN109064304A (zh) * 2018-08-03 2018-12-21 四川长虹电器股份有限公司 财务报销票据自动处理系统及方法
CN109271980A (zh) * 2018-08-28 2019-01-25 上海萃舟智能科技有限公司 一种车辆铭牌全信息识别方法、系统、终端及介质
CN109389124B (zh) * 2018-10-29 2019-09-13 苏州派维斯信息科技有限公司 小票信息类目识别方法
CN109784339A (zh) * 2018-12-13 2019-05-21 平安普惠企业管理有限公司 图片识别测试方法、装置、计算机设备及存储介质
CN109815949A (zh) * 2018-12-20 2019-05-28 航天信息股份有限公司 基于神经网络的发票公示方法和系统
CN109886077B (zh) * 2018-12-28 2021-07-09 北京旷视科技有限公司 图像识别方法、装置、计算机设备和存储介质
CN109886257B (zh) * 2019-01-30 2022-10-18 四川长虹电器股份有限公司 一种ocr系统中采用深度学习矫正发票图片分割结果的方法
CN109902737A (zh) * 2019-02-25 2019-06-18 厦门商集网络科技有限责任公司 一种票据分类方法及终端
CN109872444B (zh) * 2019-02-27 2021-03-09 杭州睿琪软件有限公司 一种票据识别方法及装置
CN109934181A (zh) * 2019-03-18 2019-06-25 北京海益同展信息科技有限公司 文本识别方法、装置、设备和计算机可读介质
CN111797838A (zh) * 2019-04-08 2020-10-20 上海怀若智能科技有限公司 一种图片类文档盲去噪系统、方法及装置
CN110288755B (zh) * 2019-05-21 2023-05-23 平安银行股份有限公司 基于文本识别的发票检验方法、服务器及存储介质
CN110334596B (zh) * 2019-05-30 2024-02-02 平安科技(深圳)有限公司 发票图片汇总方法、电子装置及可读存储介质
CN110333813A (zh) * 2019-05-30 2019-10-15 平安科技(深圳)有限公司 发票图片展示的方法、电子装置及计算机可读存储介质
CN110276346B (zh) * 2019-06-06 2023-10-10 北京字节跳动网络技术有限公司 目标区域识别模型训练方法、装置和计算机可读存储介质
CN110245087B (zh) * 2019-06-20 2023-04-18 杭州睿琪软件有限公司 用于样本审核的人工客户端的状态检查方法及装置
CN110288027B (zh) * 2019-06-27 2023-04-07 上海海事大学 一种基于ssd框架的起重机锈蚀识别和归类算法
CN112149701B (zh) * 2019-06-28 2024-05-10 杭州海康威视数字技术股份有限公司 一种图像识别方法、虚拟样本数据生成方法和存储介质
CN110427853B (zh) * 2019-07-24 2022-11-01 北京一诺前景财税科技有限公司 一种智能票据信息提取处理的方法
CN110490193B (zh) * 2019-07-24 2022-11-08 西安网算数据科技有限公司 单个字符区域检测方法及票据内容识别方法
CN110717516B (zh) * 2019-09-06 2023-08-25 中国平安财产保险股份有限公司 票据图像分类方法、装置及计算机可读存储介质
CN110705533A (zh) * 2019-09-09 2020-01-17 武汉联析医疗技术有限公司 一种用于检验报告的ai识别抓取系统
CN110598686B (zh) * 2019-09-17 2023-08-04 携程计算机技术(上海)有限公司 发票的识别方法、系统、电子设备和介质
CN110751143A (zh) * 2019-09-26 2020-02-04 中电万维信息技术有限责任公司 一种电子发票信息的提取方法及电子设备
CN111626279B (zh) * 2019-10-15 2023-06-02 西安网算数据科技有限公司 一种负样本标注训练方法及高度自动化的票据识别方法
CN110991456B (zh) * 2019-12-05 2023-07-07 北京百度网讯科技有限公司 票据识别方法及装置
CN111047261B (zh) * 2019-12-11 2023-06-16 青岛盈智科技有限公司 一种仓储物流委托单识别方法及系统
CN111091551A (zh) * 2019-12-12 2020-05-01 哈尔滨市科佳通用机电股份有限公司 一种铁路货车制动梁支柱开口销丢失故障检测方法
CN111178203B (zh) * 2019-12-20 2021-01-29 江苏常熟农村商业银行股份有限公司 签名审核方法、装置、计算机设备和存储介质
CN111241330B (zh) * 2020-01-13 2022-11-18 苏宁云计算有限公司 一种商品图片的审核方法、装置
CN111325207A (zh) * 2020-03-05 2020-06-23 中国银行股份有限公司 基于预处理的票据识别方法及装置
CN111382791B (zh) * 2020-03-07 2023-12-26 北京迈格威科技有限公司 深度学习任务处理方法、图像识别任务处理方法和装置
CN111401221B (zh) * 2020-03-12 2023-04-25 重庆农村商业银行股份有限公司 一种卡票识别方法、装置、设备及存储介质
CN111476227B (zh) * 2020-03-17 2024-04-05 平安科技(深圳)有限公司 基于ocr的目标字段识别方法、装置及存储介质
CN111539406B (zh) * 2020-04-21 2023-04-18 招商局金融科技有限公司 证件复印件信息识别方法、服务器及存储介质
CN111695558B (zh) * 2020-04-28 2023-08-04 深圳市跨越新科技有限公司 基于YoloV3模型的物流运单图片摆正方法及系统
CN111639635B (zh) * 2020-05-26 2024-02-27 广东小天才科技有限公司 一种拍摄图片的处理方法及装置、电子设备、存储介质
CN111510752B (zh) * 2020-06-18 2021-04-23 平安国际智慧城市科技股份有限公司 数据传输方法、装置、服务器及存储介质
CN111881882A (zh) * 2020-08-10 2020-11-03 晶璞(上海)人工智能科技有限公司 一种基于深度学习的医疗票据旋转矫正方法及系统
CN111931664B (zh) * 2020-08-12 2024-01-12 腾讯科技(深圳)有限公司 混贴票据图像的处理方法、装置、计算机设备及存储介质
CN111967395A (zh) * 2020-08-18 2020-11-20 中国银行股份有限公司 银行票据识别方法及装置
CN112052858B (zh) * 2020-09-02 2023-09-12 中国银行股份有限公司 票据图像中目标字段的提取方法及相关装置
CN112037077A (zh) * 2020-09-03 2020-12-04 平安健康保险股份有限公司 基于人工智能的印章识别方法、装置、设备及存储介质
CN111931771B (zh) * 2020-09-16 2021-01-01 深圳壹账通智能科技有限公司 票据内容识别方法、装置、介质及电子设备
CN112464941B (zh) * 2020-10-23 2024-05-24 北京思特奇信息技术股份有限公司 一种基于神经网络的发票识别方法和系统
CN112241725A (zh) * 2020-10-30 2021-01-19 深圳供电局有限公司 一种票据智能识别检验方法、系统及可读存储介质
CN112232296A (zh) * 2020-11-09 2021-01-15 北京爱笔科技有限公司 一种超参数探索方法及装置
CN112395996A (zh) * 2020-11-19 2021-02-23 深圳供电局有限公司 财务票据ocr识别及影像处理方法、系统及可读存储介质
CN113807158A (zh) * 2020-12-04 2021-12-17 四川医枢科技股份有限公司 一种pdf内容提取方法、装置及设备
CN112633275B (zh) * 2020-12-22 2023-07-18 航天信息股份有限公司 一种基于深度学习的多票据混拍图像校正方法及系统
CN112699871B (zh) * 2020-12-23 2023-11-14 平安银行股份有限公司 字段内容识别方法、系统、设备及计算机可读存储介质
CN112632926B (zh) * 2020-12-29 2023-10-31 平安科技(深圳)有限公司 票据的数据处理方法、装置、电子设备及存储介质
CN112990035B (zh) * 2021-03-23 2023-10-31 北京百度网讯科技有限公司 一种文本识别的方法、装置、设备以及存储介质
CN113205049A (zh) * 2021-05-07 2021-08-03 开放智能机器(上海)有限公司 一种单据识别方法以及识别系统
CN113434491B (zh) * 2021-06-18 2022-09-02 深圳市曙光信息技术有限公司 面向深度学习ocr识别的字模数据清洗方法、系统及介质
CN113326895A (zh) * 2021-06-25 2021-08-31 湖南星汉数智科技有限公司 客票行程单识别方法、装置、计算机设备和存储介质
CN113723508B (zh) * 2021-08-30 2024-04-19 杭州米数科技有限公司 票据图像分类方法、装置、计算设备和存储介质
CN113554009B (zh) * 2021-09-22 2022-03-22 北京奇虎科技有限公司 票据核验方法、装置、设备及存储介质
CN114092948B (zh) * 2021-11-24 2023-09-22 北京百度网讯科技有限公司 一种票据识别方法、装置、设备以及存储介质
CN114693968A (zh) * 2022-03-23 2022-07-01 成都智元汇信息技术股份有限公司 基于智能识图盒子性能的验证方法及系统
CN114708486A (zh) * 2022-04-07 2022-07-05 太原智林信息技术股份有限公司 物理电学实验操作电路连接自动评判方法
CN116468255B (zh) * 2023-06-15 2023-09-08 国网信通亿力科技有限责任公司 一种配置化主数据管理系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5616905A (en) * 1994-02-24 1997-04-01 Kabushiki Kaisha Tec Two-dimensional code recognition method
CN104463126A (zh) * 2014-12-15 2015-03-25 湖南工业大学 一种扫描文档图像的倾斜角自动检测方法
CN106557747A (zh) * 2016-11-15 2017-04-05 平安科技(深圳)有限公司 识别保险单号码的方法及装置
CN107220648A (zh) * 2017-04-11 2017-09-29 平安科技(深圳)有限公司 理赔单据的字符识别方法及服务器

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104112128B (zh) * 2014-06-19 2018-01-26 中国工商银行股份有限公司 应用于票据影像字符识别的数字图像处理系统及方法
CN105654127A (zh) * 2015-12-30 2016-06-08 成都数联铭品科技有限公司 基于端到端的图片文字序列连续识别方法
CN107067020B (zh) * 2016-12-30 2019-11-15 腾讯科技(上海)有限公司 图片识别方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5616905A (en) * 1994-02-24 1997-04-01 Kabushiki Kaisha Tec Two-dimensional code recognition method
CN104463126A (zh) * 2014-12-15 2015-03-25 湖南工业大学 一种扫描文档图像的倾斜角自动检测方法
CN106557747A (zh) * 2016-11-15 2017-04-05 平安科技(深圳)有限公司 识别保险单号码的方法及装置
CN107220648A (zh) * 2017-04-11 2017-09-29 平安科技(深圳)有限公司 理赔单据的字符识别方法及服务器

Also Published As

Publication number Publication date
CN107766809A (zh) 2018-03-06
WO2019071662A1 (zh) 2019-04-18

Similar Documents

Publication Publication Date Title
CN107766809B (zh) 电子装置、票据信息识别方法和计算机可读存储介质
CN107798299B (zh) 票据信息识别方法、电子装置及可读存储介质
WO2019174130A1 (zh) 票据识别方法、服务器及计算机可读存储介质
CN109829453B (zh) 一种卡证中文字的识别方法、装置以及计算设备
WO2019104879A1 (zh) 表格类图像的信息识别方法、电子装置及可读存储介质
CN108491866B (zh) 色情图片鉴定方法、电子装置及可读存储介质
CN112699775A (zh) 基于深度学习的证件识别方法、装置、设备及存储介质
CN111639648B (zh) 证件识别方法、装置、计算设备和存储介质
CN110288755A (zh) 基于文本识别的发票检验方法、服务器及存储介质
CN113887408B (zh) 活化人脸视频的检测方法、装置、设备及存储介质
CN113705462A (zh) 人脸识别方法、装置、电子设备及计算机可读存储介质
CN112308069A (zh) 一种软件界面的点击测试方法、装置、设备及存储介质
US11386499B2 (en) Car damage picture angle correction method, electronic device, and readable storage medium
CN112668575A (zh) 关键信息提取方法、装置、电子设备及存储介质
CN115471775A (zh) 基于录屏视频的信息验证方法、装置、设备及存储介质
CN114049568A (zh) 基于图像比对的标的物形变检测方法、装置、设备及介质
CN112862703B (zh) 基于移动拍照的图像校正方法、装置、电子设备及介质
CN112560855A (zh) 图像信息提取方法、装置、电子设备及存储介质
CN111259888A (zh) 基于图像的信息比对方法、装置及计算机可读存储介质
CN111177387A (zh) 用户名单信息处理方法、电子装置及计算机可读存储介质
CN113705455B (zh) 身份核查方法、装置、电子设备及可读存储介质
CN113128496B (zh) 一种从图像中提取结构化数据的方法、装置和设备
CN114297720A (zh) 一种图像脱敏方法、装置、电子设备及存储介质
CN113869455A (zh) 无监督聚类方法、装置、电子设备及介质
CN114267064A (zh) 一种人脸识别方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant