CN111325092B - 一种动车票识别方法、装置、计算机装置及计算机可读存储介质 - Google Patents
一种动车票识别方法、装置、计算机装置及计算机可读存储介质 Download PDFInfo
- Publication number
- CN111325092B CN111325092B CN201911369515.8A CN201911369515A CN111325092B CN 111325092 B CN111325092 B CN 111325092B CN 201911369515 A CN201911369515 A CN 201911369515A CN 111325092 B CN111325092 B CN 111325092B
- Authority
- CN
- China
- Prior art keywords
- ticket
- image
- detected
- key
- standard
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Character Input (AREA)
- Image Analysis (AREA)
Abstract
本发明适用于互联网技术领域,提供了一种动车票识别方法、装置、计算机装置及计算机可读存储介质,该方法包括:对N张动车票图像进行区域标注,生成标注标签,对标注标签进行格式转换;将N张动车票图像及转换后的标注标签输入YOLO网络模型,得到检测模型;获取标准动车票模板,将所述标准动车票模板上的关键信息进行遮挡,得到遮挡区域;将待检测动车票图像映射至与标准动车票模板的尺寸一致;根据标准动车票模板的遮挡区域对待检测动车票图像进行分割,得到动车票关键词条图像;通过关键信息识别模型识别动车票关键词条图像,得到动车票面信息。本发明提供的动车票识别方法,可提高动车票识别的准确度。
Description
技术领域
本发明属于图像处理领域,尤其涉及一种动车票识别方法、装置、计算机装置及计算机可读存储介质。
背景技术
在传统的财务报销过程中,财务部门将公司每个月产生的增值税专用发票、增值税普通发票、动车票等票据进行分类整理,然后人工将票据信息录入到计算机。现有情况中,由于公司人员出差等原因,公司有许多动车票需要录入,会耗费大量的人工,票据信息录入的效率很低。由此可知,现有技术中动车票的票据信息录入过程中存在人工耗费大、操作效率低的问题。
发明内容
本发明实施例提供一种动车票识别方法,旨在解决现有技术中动车票的票据信息录入过程中存在人工耗费大、操作效率低的问题。
本发明是这样实现的,一种动车票识别方法,包括:
对预先获取的N张动车票图像进行区域标注,生成相应标注标签,按照YOLO网络模型使用的数据格式将每一张动车票图像的标注标签进行转换,得到转换格式后的标注标签,将所述N张动车票图像及所述转换格式后的标注标签输入YOLO网络模型进行训练,得到检测模型;
获取标准动车票模板,获取所述标注动车票模板的关键中心点位置,将所述标准动车票模板上的关键信息进行遮挡,得到遮挡区域;所述关键中心点位置包括起始站的站字中心位置,终点站的站字中心位置,人民币符号中心位置和身份证号中4个星型符号的中心位置;
通过所述检测模型对待检测动车票图像进行关键信息定位,得到所述待检测动车票图像的关键中心点位置,根据所述待检测动车票图像的关键中心点位置与所述标准动车票模板的关键中心点位置的对应关系,将所述待检测动车票图像映射至与所述标准动车票模板的尺寸一致;
根据所述标准动车票模板的遮挡区域对所述待检测动车票图像进行分割,得到动车票关键词条图像;基于CRNN模型训练得到关键信息识别模型,并将所述动车票关键词条图像输入该模型中,得到动车票面信息。
可选的,所述对预先获取的N张动车票图像进行区域标注,生成相应标注标签,按照YOLO网络模型使用的数据格式将每一张动车票图像的标注标签进行转换,得到转换格式后的标注标签,包括以下过程:
通过LabelImg工具对预先获取的N张动车票图像进行区域标注,生成相应标注标签,所述标注标签包括区域类别号、区域中心位置、区域宽度及区域高度;
将所述标注标签的数据格式转换为YOLO网络模型使用的数据格式,转换后的标注标签包括动车票图像文件名、区域起始位置和区域终点位置。
可选的,所述获取标准动车票模板,包括以下过程:
将预先获取的动车票图像进行摆正及裁剪操作,去除所述动车票图像中除动车票以外区域,将处理后的动车票图像记为标准动车票图像。
可选的,通过所述检测模型对待检测动车票图像进行关键信息定位,得到所述待检测动车票图像的关键中心点位置,根据所述待检测动车票图像的关键中心点位置与所述标准动车票模板的关键中心点位置的对应关系,将所述待检测动车票图像映射至与所述标准动车票模板的尺寸一致,包括以下过程:
通过所述检测模型检测所述待检测动车票图像上起始站站字、终点站站字、人民币符号和身份证号4个星型符号区域,分别检测所述起始站站字、终点站站字、人民币符号和身份证号4个星型符号区域的关键中心点位置;
根据所述待检测动车票图像的关键中心点位置与所述标准动车票模板的关键中心点位置,对所述待检测动车票图像进行仿射变换,将所述待检测动车票图像的尺寸调整至与所述动车票模板的尺寸一致。
可选的,所述动车票识别方法还包括:
将预先获取的M张动车票的关键信息词条图像以及对应的文件名输入CRNN模型,训练得到关键信息识别模型。
本发明还提供一种动车票识别装置,包括:
第一训练模块,用于对预先获取的N张动车票图像进行区域标注,生成相应标注标签,按照YOLO网络模型使用的数据格式将每一张动车票图像的标注标签进行转换,得到转换格式后的标注标签,将所述N张动车票图像及所述转换格式后的标注标签输入YOLO网络模型进行训练,得到检测模型;
获取模块,用于获取标准动车票模板,获取所述标注动车票模板的关键中心点位置,将所述标准动车票模板上的关键信息进行遮挡,得到遮挡区域;所述关键中心点位置包括起始站的站字中心位置,终点站的站字中心位置,人民币符号中心位置和身份证号中4个星型符号的中心位置;
处理模块,用于通过所述检测模型对待检测动车票图像进行关键信息定位,得到所述待检测动车票图像的关键中心点位置,根据所述待检测动车票图像的关键中心点位置与所述标准动车票模板的关键中心点位置的对应关系,将所述待检测动车票图像映射至与所述标准动车票模板的尺寸一致;
识别模块,用于根据所述标准动车票模板的遮挡区域对所述待检测动车票图像进行分割,得到动车票关键词条图像;基于CRNN模型训练得到关键信息识别模型,并将所述动车票关键词条图像输入该模型中,得到动车票面信息。
可选的,所述第一训练模块包括:
标注子模块,用于通过LabelImg工具对预先获取的N张动车票图像进行区域标注,生成相应标注标签,所述标注标签包括区域类别号、区域中心位置、区域宽度及区域高度;
转换子模块,用于将所述标注标签的数据格式转换为YOLO网络模型使用的数据格式,转换后的标注标签包括动车票图像文件名、域起始位置和区域终点位置。
可选的,所述获取模块,用于将预先获取的动车票图像进行摆正及裁剪操作,去除所述动车票图像中除动车票以外区域,将处理后的动车票图像记为标准动车票图像。
可选的,所述处理模块包括:
检测子模块,用于通过所述检测模型检测所述待检测动车票图像上起始站站字、终点站站字、人民币符号和身份证号4个星型符号区域,分别检测所述起始站站字、终点站站字、人民币符号和身份证号4个星型符号区域的关键中心点位置;
调整子模块,用于根据所述待检测动车票图像的关键中心点位置与所述标准动车票模板的关键中心点位置,对所述待检测动车票图像进行仿射变换,将所述待检测动车票图像的尺寸调整至与所述动车票模板的尺寸一致。
可选的,所述动车票识别装置还包括:
第二训练模块,用于将预先获取的M张动车票的关键信息词条图像以及对应的文件名输入CRNN模型,训练得到关键信息识别模型。
本发明还提供一种计算机装置,所述计算机装置包括处理器,所述处理器用于执行存储器中计算机程序时实现如上述所述动车票识别方法的步骤。
本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述所述动车票识别方法的步骤。
本发明提供的动车票识别方法,通过YOLO网络模型进行训练所得到的检测模型对待检测动车票进行区域检测,得到动车票关键词条图像,通过基于CRNN模型训练得到的关键信息识别模型识别所述动车票关键词条图像,得到动车票面信息,可以自动对动车票进行识别,减少人工投入,提高动车票识别的准确度,提高动车票录入操作效率。
附图说明
图1是本发明实施例提供的动车票识别方法的实现流程图;
图2本发明实施例提供的步骤S101中对预先获取的N张动车票图像进行区域标注,生成相应标注标签,按照YOLO网络模型使用的数据格式将每一张动车票图像的标注标签进行转换,得到转换格式后的标注标签的流程示意图;
图3本发明实施例提供的标准动车票模板的示意图;
图4本发明实施例提供的步骤S103的流程示意图;
图5本发明实施例提供的待检测动车票图像的示意图;
图6本发明实施例提供的调整后的动车票图像的示意图;
图7是本发明实施提供的动车票信息图像的示意图;
图8本发明实施例提供的动车票识别装置的结构示意图;
图9是本发明实施提供的获取模块的结构示意图;
图10是本发明实施提供的处理模块的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1所示为本发明实施例提供的动车票识别方法的实现流程图。该动车票识别方法包括以下过程:
步骤S101,对预先获取的N张动车票图像进行区域标注,生成相应标注标签,按照YOLO网络模型使用的数据格式将每一张动车票图像的标注标签进行转换,得到转换格式后的标注标签,将所述N张动车票图像及所述转换格式后的标注标签输入YOLO网络模型进行训练,得到检测模型。
在本实施例中,N为正整数,例如N为500。获取多张动车票图像进行区域标注的过程包括以下步骤:在不同的场景下,用手机拍摄新旧不同的动车票,得到真实动车票图像500张。使用LabelImg工具对真实图像进行区域标注。每张真实图像标注5个区域:动车票面、起始站的站字、终点站的站字、人民币符号和身份证中的四颗星,生成对应的标注标签。
需要说明的是,YOLO的英文全称为You only look once,YOLO网络模型是目标检测网络模型,其检测速度快,检测准确率高。
请参阅图2,在该步骤S101中,所述对预先获取的N张动车票图像进行区域标注,生成相应标注标签,按照YOLO网络模型使用的数据格式将每一张动车票图像的标注标签进行转换,得到转换格式后的标注标签,包括以下过程:
步骤S1011,通过LabelImg工具对预先获取的N张动车票图像进行区域标注,生成相应标注标签,所述标注标签包括区域类别号、区域中心位置、区域宽度及区域高度;
步骤S1012,根据所述标注标签转换为YOLO网络模型使用的数据格式,转换后的标注标签包括动车票图像文件名、区域起始位置和区域终点位置。
需要说明的是,LabelImg工具是图像标注工具,用于标注目标区域,具体来说,使用矩形框把目标框出来,并标注目标类别。在本实施例中,LabelImg对一个动车票图像进行标注后,对应产生一个txt的标签信息文件,其中每个txt标签文件中有5行数据,每行数据为标注区域对应的类别号和标注的区域对应的4个数值,该4个数值标注区域的中心点对应坐标(x,y)和标注区域的宽w、高h。
在本实施例中,区域类别包括动车票面、起始站的站字、终点站的站字、人民币符号和身份证中四个星型符号区域共5个类别,分别对前述的5个类别进行编号,动车票面的区域类别号编为1、起始站的站字的区域类别号编为2、终点站的站字的区域类别号编为3、人民币符号的区域类别号编为4、和身份证中四个星型符号区域的区域类别号编为5。区域中心位置可以用坐标进行表示,例如,区域中心位置记为(x,y)。区域宽度及区域高度分别用w、h进行表示。将所有得到的txt标签文件转换成YOLO使用的标签格式,即动车票图像文件名和标注区域的起始位置和终点位置。需要说明的是,动车票图像是指一个图像文件,例如,文件名可以为ticket001.jpg,标注区域的起始位置指在标注区域读取的第一坐标,标注区域的结束位置指在标注区域读取的最后一个坐标。
步骤S102,获取标准动车票模板,将所述标准动车票模板上的关键信息进行遮挡,将遮挡区域作为遮挡区域。
可选的,所述获取标准动车票模板,包括以下过程:
将预先获取的动车票图像进行旋转、裁剪操作,去除所述动车票图像中除动车票以外区域,得到摆正裁剪后的动车票图像,记为标准动车票图像。
举例来说,可以拍摄一张没有折叠和扭曲的动车票图像,将拍摄到的动车票图像摆正,并将动车票图像裁剪至动车票边界,即去除动车票图像中动车票以外区域,得到摆正裁剪好的动车票图像,记为标准动车票图像,将标准动车票图像上的关键信息,比如起始站,终点站,车次号,发车时间等用长行白条封盖,将封盖区域作为所述遮挡区域。请参阅图3,如图3所示的标准动车票模板300的关键信息用长行白条进行遮挡,得到遮挡区域301。标准动车票模板300还有识别码302。
步骤S103,通过所述检测模型对待检测动车票图像进行关键信息定位,得到所述待检测动车票图像的关键中心点位置,根据所述待检测动车票图像的关键中心点位置与所述标准动车票模板的关键中心点位置的对应关系,将所述待检测动车票图像映射至与所述标准动车票模板的尺寸一致。
请参阅图4,该步骤S103包括以下过程:
步骤S1031,通过所述检测模型检测所述待检测动车票图像上起始站站字、终点站站字、人民币符号和身份证号4个星型符号区域,分别检测所述起始站站字、终点站站字、人民币符号和身份证号4个星型符号区域的关键中心点位置;
步骤S1032,根据所述待检测动车票图像的关键中心点位置与所述标准动车票模板的关键中心点位置,对所述待检测动车票图像进行仿射变换,将所述待检测动车票图像的尺寸调整至与所述动车票模板的尺寸一致。
在本实施例中,预先对标准动车票模板的关键中心点位置进行标注,标准动车票模板的关键中心点位置包括起始站的站字中心位置,终点站的站字中心位置,人民币符号中心位置和身份证号中4个星型符号的中心位置。请参阅图5-6,图5所示为待检测动车票图像500,通过所述检测模型对待检测动车票图像500进行检测,得到待检测动车票图像500的动车票区域,起始站的站字区域,终点站的站字区域,人民币符号区域和身份证号中4个星型字符区域,并求该四个区域的中心位置。将待检测动车票图像500的4个区域中心位置与在标准动车票图像上标注的4个中心位置进行仿射变换,并裁剪至标准动车票图像大小,调整后的待检测动车票图像500变成了与标准动车票模板相匹配的动车票图像600,具体的动车票图像600如图6所示。
步骤S104,根据所述标准动车票模板的遮挡区域对所述待检测动车票图像进行分割,得到动车票关键词条图像;基于CRNN模型训练得到关键信息识别模型,并将所述动车票关键词条图像输入该模型中,得到动车票面信息。
在本实施例中,根据标准动车票模板上的遮挡区域将与标准动车票模板模板相匹配的动车票图像600进行分割,可以得到动车票关键词条图像,具体的动车票关键词条图像可以参阅图7。如图7所示,动车票信息图像700包括多条动车票关键词条图像,具体包括出发站:衡水北站、发车时间:2019年01月01日09:17分、票价:¥33元、票号:A037322、车次:D1623、身份证号码姓名:1311221990****3236李四、达到站:德州东站、座位号07车13D号。将动车票信息图像700中的动车票关键词条图像输入基于CRNN模型训练得到的关键信息识别模型,通过所述关键信息识别模型识别动车票信息图像700中的动车票面信息,得到的票面信息包括出发站:衡水北站、发车时间:2019年01月01日09:17分、票价:¥33元、票号:A037322、车次:D1623、身份证号码姓名:1311221990****3236李四、达到站:德州东站、座位号07车13D号等信息。
可选的,所述动车票识别方法还包括以下过程:
将预先获取的M张动车票的关键信息词条图像以及对应生成的文件名输入CRNN模型,训练得到关键信息识别模型。
在本实施例中,利用python的PIL工具包制作一百万张动车票关键词条图像以及生成对应的文件名。随后将动车票关键词条图像和对应的文件名送入CRNN训练得到关键信息识别模型。
需要说明的是,python是一个编程语言,它是一种解释型、面向对象、动态数据类型的高级程序设计语言。PIL是python图像库,PIL的英文全称为Python Imaging Library。
本发明提供的动车票识别方法,通过YOLO网络模型进行训练所得到的检测模型对待检测动车票进行区域检测,得到动车票关键词条图像,通过基于CRNN模型训练得到的关键信息识别模型识别所述动车票关键词条图像,得到动车票面信息,可以自动对动车票进行识别,减少人工投入,提高动车票识别的准确度,提高动车票录入操作效率。
图8示出了本发明实施例提供的一种动车票识别装置800的结构示意图,为了便于说明,仅示出了于本发明实施相关的部分。该动车票识别装置800包括:
第一训练模块801,用于对预先获取的N张动车票图像进行区域标注,生成相应标注标签,按照YOLO网络模型使用的数据格式将每一张动车票图像的标注标签进行转换,得到转换格式后的标注标签,将所述N张动车票图像及所述转换格式后的标注标签输入YOLO网络模型进行训练,得到检测模型。
在本实施例中,N为正整数,例如N为500。获取多张动车票图像进行区域标注的过程包括以下步骤:在不同的场景下,用手机拍摄新旧不同的动车票,得到真实动车票图像500张。使用LabelImg工具对真实图像进行区域标注。每张真实图像标注5个区域:动车票面、起始站的站字、终点站的站字、人民币符号和身份证中的四颗星,生成对应的标注标签。
需要说明的是,YOLO的英文全称为You only look once,YOLO网络模型是目标检测网络模型,其检测速度快,检测准确率高。
请参阅图9,所述第一训练模块801包括:
标注子模块8011,用于通过LabelImg工具对预先获取的N张动车票图像进行区域标注,生成相应标注标签,所述标注标签包括区域类别号、区域中心位置、区域宽度及区域高度;
转换子模块8012,用于根据所述标注标签转换为YOLO网络模型使用的数据格式,转换后的标注标签包括动车票图像文件名、域起始位置和区域终点位置。
需要说明的是,LabelImg工具是图像标注工具,用于标注目标区域,具体来说,使用矩形框把目标框出来,并标注目标类别。在本实施例中,LabelImg对一个动车票图像进行标注后,对应产生一个txt的标签信息文件,其中每个txt标签文件中有5行数据,每行数据为标注区域对应的类别号和标注的区域对应的4个数值,该4个数值标注区域的中心点对应坐标(x,y)和标注区域的宽w、高h。
在本实施例中,区域类别包括动车票面、起始站的站字、终点站的站字、人民币符号和身份证中四个星型符号区域共5个类别,分别对前述的5个类别进行编号,动车票面的区域类别号编为1、起始站的站字的区域类别号编为2、终点站的站字的区域类别号编为3、人民币符号的区域类别号编为4、和身份证中四个星型符号区域的区域类别号编为5。区域中心位置可以用坐标进行表示,例如,区域中心位置记为(x,y)。区域宽度及区域高度分别用w、h进行表示。将所有得到的txt标签文件转换成YOLO使用的标签格式,即动车票图像文件名和标注区域的起始位置和终点位置。需要说明的是,动车票图像是指一个图像文件,例如,文件名可以为ticket001.jpg,标注区域的起始位置指在标注区域读取的第一坐标,标注区域的结束位置指在标注区域读取的最后一个坐标。
获取模块802,用于获取标准动车票模板,将所述标准动车票模板上的关键信息进行遮挡,将遮挡区域作为遮挡区域。
可选的,获取模块802,还用于将预先获取的动车票图像进行旋转、裁剪操作,去除所述动车票图像中除动车票以外区域,得到摆正裁剪后的动车票图像,记为标准动车票图像。
举例来说,可以拍摄一张没有折叠和扭曲的动车票图像,将拍摄到的动车票图像摆正,并将动车票图像裁剪至动车票边界,即去除动车票图像中动车票以外区域,得到摆正裁剪好的动车票图像,记为标准动车票图像,将标准动车票图像上的关键信息,比如起始站,终点站,车次号,发车时间等用长行白条封盖,将封盖区域作为所述遮挡区域。请参阅图3,如图3所示的标准动车票模板300的关键信息用长行白条进行遮挡,得到遮挡区域301。标准动车票模板300还有识别码302。
处理模块803,用于通过所述检测模型对待检测动车票图像进行关键信息定位,得到所述待检测动车票图像的关键中心点位置,根据所述待检测动车票图像的关键中心点位置与所述标准动车票模板的关键中心点位置的对应关系,将所述待检测动车票图像映射至与所述标准动车票模板的尺寸一致。
请参阅图10,处理模块803包括:
检测子模块8031,用于通过所述检测模型检测所述待检测动车票图像上起始站站字、终点站站字、人民币符号和身份证号4个星型符号区域,分别检测所述起始站站字、终点站站字、人民币符号和身份证号4个星型符号区域的关键中心点位置;
调整子模块8032,用于根据所述待检测动车票图像的关键中心点位置与所述标准动车票模板的关键中心点位置,对所述待检测动车票图像进行仿射变换,将所述待检测动车票图像的尺寸调整至与所述动车票模板的尺寸一致。
在本实施例中,预先对标准动车票模板的关键中心点位置进行标注,标准动车票模板的关键中心点位置包括起始站的站字中心位置,终点站的站字中心位置,人民币符号中心位置和身份证号中4个星型符号的中心位置。请参阅图5-6,图5所示为待检测动车票图像500,通过所述检测模型对待检测动车票图像500进行检测,得到待检测动车票图像500的动车票区域,起始站的站字区域,终点站的站字区域,人民币符号区域和身份证号中4个星型字符区域,并求该四个区域的中心位置。将待检测动车票图像500的4个区域中心位置与在标准动车票图像上标注的4个中心位置进行仿射变换,并裁剪至标准动车票图像大小,调整后的待检测动车票图像500变成了与标准动车票模板相匹配的动车票图像600,具体的动车票图像600如图6所示。
识别模块804,用于根据所述标准动车票模板的遮挡区域对所述待检测动车票图像进行分割,得到动车票关键词条图像;基于CRNN模型训练得到关键信息识别模型,并将所述动车票关键词条图像输入该模型中,得到动车票面信息。
在本实施例中,根据标准动车票模板上的遮挡区域将与标准动车票模板模板相匹配的动车票图像600进行分割,可以得到动车票关键词条图像,具体的动车票关键词条图像可以参阅图7。如图7所示,动车票信息图像700包括多条动车票关键词条图像,具体包括出发站:衡水北站、发车时间:2019年01月01日09:17分、票价:¥33元、票号:A037322、车次:D1623、身份证号码姓名:1311221990****3236李四、达到站:德州东站、座位号07车13D号。将动车票信息图像700中的动车票关键词条图像输入基于CRNN模型训练得到的关键信息识别模型,通过所述关键信息识别模型识别动车票信息图像700中的动车票面信息,得到的票面信息包括出发站:衡水北站、发车时间:2019年01月01日09:17分、票价:¥33元、票号:A037322、车次:D1623、身份证号码姓名:1311221990****3236李四、达到站:德州东站、座位号07车13D号等信息。
可选的,所述动车票识别装置800还包括:
第二训练模块,用于将预先获取的M张动车票的关键信息词条图像以及对应生成的文件名输入CRNN模型,训练得到关键信息识别模型。
在本实施例中,利用python的PIL工具包制作一百万张动车票关键词条图像以及生成对应的文件名。随后将动车票关键词条图像和对应的文件名送入CRNN训练得到关键信息识别模型。
需要说明的是,python是一个编程语言,Python是一种解释型、面向对象、动态数据类型的高级程序设计语言。PIL是python图像库,PIL的英文全称为Python ImagingLibrary。
本发明提供的动车票识别装置,通过YOLO网络模型进行训练所得到的检测模型对待检测动车票进行区域检测,得到动车票关键词条图像,通过基于CRNN模型训练得到的关键信息识别模型识别所述动车票关键词条图像,得到动车票面信息,可以自动对动车票进行识别,减少人工投入,提高动车票识别的准确度,提高动车票录入操作效率。
本发明实施例提供一种计算机装置,该计算机装置包括处理器,处理器用于执行存储器中计算机程序时实现上述各个方法实施例提供的动车票识别方法的步骤。
示例性的,计算机程序可以被分割成一个或多个模块,一个或者多个模块被存储在存储器中,并由处理器执行,以完成本发明。一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序在计算机装置中的执行过程。例如,计算机程序可以被分割成上述各个方法实施例提供的动车票识别方法的步骤。
本领域技术人员可以理解,上述计算机装置的描述仅仅是示例,并不构成对计算机装置的限定,可以包括比上述描述更多或更少的部件,或者组合某些部件,或者不同的部件,例如可以包括输入输出设备、网络接入设备、总线等。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述计算机装置的控制中心,利用各种接口和线路连接整个计算机装置的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述计算机装置的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
所述计算机装置集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个动车票识别方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信号以及软件分发介质等。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (12)
1.一种动车票识别方法,其特征在于,所述动车票识别方法包括:
对预先获取的N张动车票图像进行区域标注,生成相应标注标签,按照YOLO网络模型使用的数据格式将每一张动车票图像的标注标签进行转换,得到转换格式后的标注标签,将所述N张动车票图像及所述转换格式后的标注标签输入YOLO网络模型进行训练,得到检测模型;
获取标准动车票模板,获取所述标准动车票模板的关键中心点位置,将所述标准动车票模板上的关键信息进行遮挡,得到遮挡区域;所述关键中心点位置包括起始站的站字中心位置,终点站的站字中心位置,人民币符号中心位置和身份证号中4个星型符号的中心位置;
通过所述检测模型对待检测动车票图像进行关键信息定位,得到所述待检测动车票图像的关键中心点位置,根据所述待检测动车票图像的关键中心点位置与所述标准动车票模板的关键中心点位置的对应关系,将所述待检测动车票图像映射至与所述标准动车票模板的尺寸一致;
根据所述标准动车票模板的遮挡区域对所述待检测动车票图像进行分割,得到动车票关键词条图像;基于CRNN模型训练得到关键信息识别模型,并将所述动车票关键词条图像输入该模型中,得到动车票面信息。
2.根据权利要求1所述的动车票识别方法,其特征在于,所述对预先获取的N张动车票图像进行区域标注,生成相应标注标签,按照YOLO网络模型使用的数据格式将每一张动车票图像的标注标签进行转换,得到转换格式后的标注标签,包括以下过程:
通过LabelImg工具对预先获取的N张动车票图像进行区域标注,生成相应标注标签,所述标注标签包括区域类别号、区域中心位置、区域宽度及区域高度;
将所述标注标签的数据格式转换为YOLO网络模型使用的数据格式,转换后的标注标签包括动车票图像文件名、区域起始位置和区域终点位置。
3.根据权利要求1所述的动车票识别方法,其特征在于,所述获取标准动车票模板,包括以下过程:
将预先获取的动车票图像进行摆正及裁剪操作,去除所述动车票图像中除动车票以外区域,将处理后的动车票图像记为标准动车票图像。
4.根据权利要求1所述的动车票识别方法,其特征在于,所述通过所述检测模型对待检测动车票图像进行关键信息定位,得到所述待检测动车票图像的关键中心点位置,根据所述待检测动车票图像的关键中心点位置与所述标准动车票模板的关键中心点位置的对应关系,将所述待检测动车票图像映射至与所述标准动车票模板的尺寸一致,包括以下过程:
通过所述检测模型检测所述待检测动车票图像上起始站站字、终点站站字、人民币符号和身份证号4个星型符号区域,分别检测所述起始站站字、终点站站字、人民币符号和身份证号4个星型符号区域的关键中心点位置;
根据所述待检测动车票图像的关键中心点位置与所述标准动车票模板的关键中心点位置,对所述待检测动车票图像进行仿射变换,将所述待检测动车票图像的尺寸调整至与所述动车票模板的尺寸一致。
5.根据权利要求1所述的动车票识别方法,其特征在于,所述基于CRNN模型训练得到关键信息识别模型,包括以下过程:
将预先获取的M张动车票的关键信息词条图像以及对应的文件名输入CRNN模型,训练得到关键信息识别模型。
6.一种动车票识别装置,其特征在于,所述动车票识别装置包括:
第一训练模块,用于对预先获取的N张动车票图像进行区域标注,生成相应标注标签,按照YOLO网络模型使用的数据格式将每一张动车票图像的标注标签进行转换,得到转换格式后的标注标签,将所述N张动车票图像及所述转换格式后的标注标签输入YOLO网络模型进行训练,得到检测模型;
获取模块,用于获取标准动车票模板,获取所述标准动车票模板的关键中心点位置,将所述标准动车票模板上的关键信息进行遮挡,得到遮挡区域;所述关键中心点位置包括起始站的站字中心位置,终点站的站字中心位置,人民币符号中心位置和身份证号中4个星型符号的中心位置;
处理模块,用于通过所述检测模型对待检测动车票图像进行关键信息定位,得到所述待检测动车票图像的关键中心点位置,根据所述待检测动车票图像的关键中心点位置与所述标准动车票模板的关键中心点位置的对应关系,将所述待检测动车票图像映射至与所述标准动车票模板的尺寸一致;
识别模块,用于根据所述标准动车票模板的遮挡区域对所述待检测动车票图像进行分割,得到动车票关键词条图像;基于CRNN模型训练得到关键信息识别模型,并将所述动车票关键词条图像输入该模型中,得到动车票面信息。
7.根据权利要求6所述的动车票识别装置,其特征在于,所述第一训练模块包括:
标注子模块,用于通过LabelImg工具对预先获取的N张动车票图像进行区域标注,生成相应标注标签,所述标注标签包括区域类别号、区域中心位置、区域宽度及区域高度;
转换子模块,用于将所述标注标签的数据格式转换为YOLO网络模型使用的数据格式,转换后的标注标签包括动车票图像文件名、域起始位置和区域终点位置。
8.根据权利要求6所述的动车票识别装置,其特征在于,所述获取模块,用于将预先获取的动车票图像进行摆正及裁剪操作,去除所述动车票图像中除动车票以外区域,将处理后的动车票图像记为标准动车票图像。
9.根据权利要求6所述的动车票识别装置,其特征在于,所述处理模块包括:
检测子模块,用于通过所述检测模型检测所述待检测动车票图像上起始站站字、终点站站字、人民币符号和身份证号4个星型符号区域,分别检测所述起始站站字、终点站站字、人民币符号和身份证号4个星型符号区域的关键中心点位置;
调整子模块,用于根据所述待检测动车票图像的关键中心点位置与所述标准动车票模板的关键中心点位置,对所述待检测动车票图像进行仿射变换,将所述待检测动车票图像的尺寸调整至与所述动车票模板的尺寸一致。
10.根据权利要求6所述的动车票识别装置,其特征在于,所述识别模块,还用于将预先获取的M张动车票的关键信息词条图像以及对应的文件名输入CRNN模型,训练得到关键信息识别模型。
11.一种计算机装置,其特征在于,所述计算机装置包括处理器,所述处理器用于执行存储器中计算机程序时实现如权利要求1-5中任意一项所述动车票识别方法的步骤。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现如权利要求1-5中任意一项所述动车票识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911369515.8A CN111325092B (zh) | 2019-12-26 | 2019-12-26 | 一种动车票识别方法、装置、计算机装置及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911369515.8A CN111325092B (zh) | 2019-12-26 | 2019-12-26 | 一种动车票识别方法、装置、计算机装置及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111325092A CN111325092A (zh) | 2020-06-23 |
CN111325092B true CN111325092B (zh) | 2023-09-22 |
Family
ID=71172533
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911369515.8A Active CN111325092B (zh) | 2019-12-26 | 2019-12-26 | 一种动车票识别方法、装置、计算机装置及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111325092B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112232336A (zh) * | 2020-09-02 | 2021-01-15 | 深圳前海微众银行股份有限公司 | 一种证件识别方法、装置、设备及存储介质 |
CN112257712B (zh) * | 2020-10-29 | 2024-02-27 | 湖南星汉数智科技有限公司 | 一种火车票图像摆正方法、装置、计算机装置及计算机可读存储介质 |
CN112381702B (zh) * | 2020-12-02 | 2024-03-15 | 北京皮尔布莱尼软件有限公司 | 一种图像隐私处理方法、计算设备及存储介质 |
CN112580648A (zh) * | 2020-12-14 | 2021-03-30 | 成都中科大旗软件股份有限公司 | 一种基于图像分割技术实现图像信息识别的方法 |
CN113255568B (zh) * | 2021-06-15 | 2021-09-24 | 湖南星汉数智科技有限公司 | 票据图像分类方法、装置、计算机设备和存储介质 |
CN113688834A (zh) * | 2021-07-27 | 2021-11-23 | 深圳中兴网信科技有限公司 | 车票识别方法、车票识别系统及计算机可读存储介质 |
CN116012493B (zh) * | 2022-12-30 | 2024-05-24 | 壹沓科技(上海)有限公司 | 图像标注方法、装置、存储介质、计算机设备 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107977665A (zh) * | 2017-12-15 | 2018-05-01 | 北京科摩仕捷科技有限公司 | 一种发票中关键信息的识别方法及计算设备 |
CN109086751A (zh) * | 2018-09-27 | 2018-12-25 | 珠海格力电器股份有限公司 | 识别方法和装置、表单填写方法和装置、存储介质和终端 |
CN109086756A (zh) * | 2018-06-15 | 2018-12-25 | 众安信息技术服务有限公司 | 一种基于深度神经网络的文本检测分析方法、装置及设备 |
CN109117814A (zh) * | 2018-08-27 | 2019-01-01 | 北京京东金融科技控股有限公司 | 图像处理方法、装置、电子设备及介质 |
CN109214382A (zh) * | 2018-07-16 | 2019-01-15 | 顺丰科技有限公司 | 一种基于crnn的票据信息识别算法、设备及存储介质 |
CN109658584A (zh) * | 2018-12-14 | 2019-04-19 | 泰康保险集团股份有限公司 | 一种票据票据识别方法及装置 |
CN110188714A (zh) * | 2019-06-04 | 2019-08-30 | 言图科技有限公司 | 一种在聊天场景下实现财务管理的方法、系统及存储介质 |
CN110287911A (zh) * | 2019-06-28 | 2019-09-27 | 广东工业大学 | 一种发票的内容识别方法、装置、设备及存储介质 |
CN110348441A (zh) * | 2019-07-10 | 2019-10-18 | 深圳市华云中盛科技有限公司 | 增值税发票识别方法、装置、计算机设备及存储介质 |
CN110503100A (zh) * | 2019-08-16 | 2019-11-26 | 湖南星汉数智科技有限公司 | 一种医疗单据识别方法、装置、计算机装置及计算机可读存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7809172B2 (en) * | 2005-11-07 | 2010-10-05 | International Barcode Corporation | Method and system for generating and linking composite images |
-
2019
- 2019-12-26 CN CN201911369515.8A patent/CN111325092B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107977665A (zh) * | 2017-12-15 | 2018-05-01 | 北京科摩仕捷科技有限公司 | 一种发票中关键信息的识别方法及计算设备 |
CN109086756A (zh) * | 2018-06-15 | 2018-12-25 | 众安信息技术服务有限公司 | 一种基于深度神经网络的文本检测分析方法、装置及设备 |
CN109214382A (zh) * | 2018-07-16 | 2019-01-15 | 顺丰科技有限公司 | 一种基于crnn的票据信息识别算法、设备及存储介质 |
CN109117814A (zh) * | 2018-08-27 | 2019-01-01 | 北京京东金融科技控股有限公司 | 图像处理方法、装置、电子设备及介质 |
CN109086751A (zh) * | 2018-09-27 | 2018-12-25 | 珠海格力电器股份有限公司 | 识别方法和装置、表单填写方法和装置、存储介质和终端 |
CN109658584A (zh) * | 2018-12-14 | 2019-04-19 | 泰康保险集团股份有限公司 | 一种票据票据识别方法及装置 |
CN110188714A (zh) * | 2019-06-04 | 2019-08-30 | 言图科技有限公司 | 一种在聊天场景下实现财务管理的方法、系统及存储介质 |
CN110287911A (zh) * | 2019-06-28 | 2019-09-27 | 广东工业大学 | 一种发票的内容识别方法、装置、设备及存储介质 |
CN110348441A (zh) * | 2019-07-10 | 2019-10-18 | 深圳市华云中盛科技有限公司 | 增值税发票识别方法、装置、计算机设备及存储介质 |
CN110503100A (zh) * | 2019-08-16 | 2019-11-26 | 湖南星汉数智科技有限公司 | 一种医疗单据识别方法、装置、计算机装置及计算机可读存储介质 |
Non-Patent Citations (2)
Title |
---|
基于OpenCV的火车票识别算法;薛圣利 等;广西科技大学学报;全文 * |
用于动车组故障检测的车号识别算法;方凯;;铁路计算机应用(第05期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111325092A (zh) | 2020-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111325092B (zh) | 一种动车票识别方法、装置、计算机装置及计算机可读存储介质 | |
CN112669515B (zh) | 票据图像识别方法、装置、电子设备和存储介质 | |
CN110210400B (zh) | 一种表格文件检测方法及设备 | |
CN111476227A (zh) | 基于ocr的目标字段识别方法、装置及存储介质 | |
CN110503100B (zh) | 一种医疗单据识别方法、装置、计算机装置及计算机可读存储介质 | |
CN111275037B (zh) | 票据识别方法及装置 | |
CN110942061A (zh) | 文字识别方法、装置、设备和计算机可读介质 | |
CN110909123A (zh) | 一种数据提取方法、装置、终端设备及存储介质 | |
CN112308046A (zh) | 图像的文本区域定位方法、装置、服务器及可读存储介质 | |
CN112434555A (zh) | 键值对区域识别方法、装置、存储介质和电子设备 | |
CN113850060A (zh) | 民航文档数据识别录入方法及系统 | |
CN112668580A (zh) | 一种文本识别方法、文本识别装置及终端设备 | |
CN114359533B (zh) | 一种基于页面文本的页码识别方法和计算机设备 | |
CN114913538A (zh) | 一种基于深度学习的多类别发票识别方法及系统 | |
CN111179379A (zh) | 一种通用动车票数据集生成方法、装置、计算机装置及计算机可读存储介质 | |
JP3989733B2 (ja) | フォーム処理でのひずみの訂正 | |
CN112149678A (zh) | 特殊语言的文字识别方法、识别模型训练方法和装置 | |
CN116798061A (zh) | 一种票据审核识别方法、装置、终端和存储介质 | |
CN115909449A (zh) | 文件处理方法、装置、电子设备、存储介质及程序产品 | |
CN113343663A (zh) | 一种票据结构化方法及装置 | |
CN113343968A (zh) | 多模板证书快速审证方法、系统、介质及装置 | |
CN112733518A (zh) | 表格模板生成方法、装置、设备及存储介质 | |
CN111611986A (zh) | 一种基于手指交互的焦点文本提取和识别方法及系统 | |
KR20210083148A (ko) | 영상이미지 인식을 이용한 디지털포렌식 데이터베이스 구축 시스템 및 그 방법 | |
CN110765826A (zh) | 一种可移植文档格式pdf中的乱码识别方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |