CN110399851B - 一种图像处理装置、方法、设备及可读存储介质 - Google Patents

一种图像处理装置、方法、设备及可读存储介质 Download PDF

Info

Publication number
CN110399851B
CN110399851B CN201910695824.8A CN201910695824A CN110399851B CN 110399851 B CN110399851 B CN 110399851B CN 201910695824 A CN201910695824 A CN 201910695824A CN 110399851 B CN110399851 B CN 110399851B
Authority
CN
China
Prior art keywords
image
invoice
character
seal
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910695824.8A
Other languages
English (en)
Other versions
CN110399851A (zh
Inventor
兰上炜
杨志景
邱泽源
曾晖
郑璐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN201910695824.8A priority Critical patent/CN110399851B/zh
Publication of CN110399851A publication Critical patent/CN110399851A/zh
Application granted granted Critical
Publication of CN110399851B publication Critical patent/CN110399851B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/10Image enhancement or restoration using non-spatial domain filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/73Deblurring; Sharpening
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20048Transform domain processing
    • G06T2207/20056Discrete and fast Fourier transform, [DFT, FFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Character Input (AREA)

Abstract

本发明公开了一种图像处理装置,包括:图像检测分割模块,用于获取发票图像,并将发票图像输入到发票分割模型中进行检测分割,得到印章图像和字符图像;目标模板提取模块,用于将印章图像输入到印章识别模型中,得到印章识别结果,并从表格模板数据库中提取印章识别结果对应的目标表格模板;表格制作模块,用于将字符图像输入到OCR识别模型中,得到发票字符,将发票字符填入目标表格模板中,得到电子发票表格,并保存电子发票表格;该装置可以解决发票信息录入工作繁琐的问题;此外,本发明还提供了一种图像处理方法、设备及计算机可读存储介质,也具有上述有益效果。

Description

一种图像处理装置、方法、设备及可读存储介质
技术领域
本发明涉及图像识别技术领域,特别涉及一种图像处理装置、方法、设备及计算机可读存储介质。
背景技术
发票是指一切单位和个人在购销商品、提供或接受服务以及从事其他经营活动中,所开具和收取的业务凭证,是会计核算的原始依据,也是审计机关、税务机关执法检查的重要依据。
在公司进行财务管理和报账时,或者在税务机关进行相关业务时,都需要将纸质发票上的信息录入至电脑中,以便进行统计、分析和查阅。传统的发票录入方法需要人工打字录入发票上的各种信息,包括抬头、金额、收费方和支出项目等。由于发票的种类和数量繁多,录入发票信息时十分繁琐,且需要花费大量的时间,大大增加了工作人员的工作量。
因此,如何解决发票信息录入工作繁琐的问题,是本领域技术人员需要解决的技术问题。
发明内容
有鉴于此,本发明的目的在于提供一种图像处理装置、方法、设备及计算机可读存储介质,解决了发票信息录入工作繁琐的问题。
为解决上述技术问题,本发明提供了一种图像处理装置,包括:
图像检测分割模块,用于获取发票图像,并将所述发票图像输入到发票分割模型中进行检测分割,得到印章图像和字符图像;
目标模板提取模块,用于将所述印章图像输入到印章识别模型中,得到印章识别结果,并从表格模板数据库中提取所述印章识别结果对应的目标表格模板;
表格制作模块,用于将所述字符图像输入到OCR识别模型中,得到发票字符,将所述发票字符填入所述目标表格模板中,得到电子发票表格,并保存所述电子发票表格。
可选的,所述图像检测分割模块,包括:
傅立叶变换单元,用于获取原始发票图像,对所述原始发票图像进行傅立叶变换,得到傅立叶变换图像;
仿射变换单元,用于对所述傅立叶变换图像进行对数尺度检测,并进行仿射变换,得到仿射变换图像;
滤波锐化单元,用于对所述仿射变换图像进行滤波和锐化处理,得到所述发票图像。
可选的,所述图像检测分割模块,包括:
缺损判断单元,用于将所述发票图像输入到所述发票分割模型中,判断所述发票图像是否缺损;
分割单元,用于若所述发票图像没有缺损,则对所述发票图像进行分割,得到所述印章图像和所述字符图像。
可选的,包括:
标记模块,用于利用LabelImg工具对训练图像进行标记,得到标记图像;
第一训练模块,用于将所述标记图像和所述训练图像输入到faster-rcnn神经网络模型中进行训练,直至图像识别精度达到图像处理精度阈值,得到所述发票分割模型。
可选的,包括:
印章图像切割模块,用于对所述标记图像进行切割处理,得到训练印章图像;
印象图像标记模块,用于获取各个所述训练印章图像对应的印章文字,利用所述印章文字对所述训练印章图像进行标记,得到标记印章图像;
第二训练模块,用于将所述标记印章图像输入到VGG16神经网络模型中进行训练,直至印章识别精度达到印章识别精度阈值,得到所述印章识别模型。
可选的,包括:
字符图像切割模块,用于对所述标记图像进行切割处理,得到训练字符图像;
字符图像标记模块,用于利用所述训练字符图像对应的训练字符对所述训练字符图像进行标记,得到标记字符图像;
第三训练模块,用于将所述标记字符图像和MLP颜色分割器输入到rcnn神经网络模型中进行训练,直至字符识别精度达到字符识别精度阈值,得到所述OCR识别模型。
可选的,所述表格制作模块,包括:
背景去除单元,用于利用所述MLP颜色分割器对所述字符图像进行背景颜色去除,得到无背景字符图像;
识别单元,用于利用所述OCR识别模型对所述无背景图像进行识别,得到所述发票字符。
本发明还提供了一种图像处理方法,包括:
获取发票图像,并将所述发票图像输入到发票分割模型中进行检测分割,得到印章图像和字符图像;
将所述印章图像输入到印章识别模型中,得到印章识别结果,并从表格模板数据库中提取所述印章识别结果对应的目标表格模板;
将所述字符图像输入到OCR识别模型中,得到发票字符,将所述发票字符填入所述目标表格模板中,得到电子发票表格,并保存所述电子发票表格。
本发明还提供了一种图像处理设备,包括存储器和处理器,其中:
所述存储器,用于保存计算机程序;
所述处理器,用于执行所述计算机程序,以实现上述的图像处理方法。
本发明还提供了一种计算机可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现上述的图像处理方法。
可见,该装置利用图像检测分割模块对发票图像进行分割,得到印章图像和字符图像。并对印章图像进行识别得到印章识别结果,利用印章识别结果从表格模板数据库中提取与发票图像对应的目标表格模板,利用表格制作模块对字符图像进行识别得到发票字符,并将发票字符填入目标模板以得到电子发票表格。该装置解决了发票信息录入工作繁琐的问题,同时从表格模板数据库中提取与发票图像对应的目标表格模板,可以防止发票信息漏填的情况出现。
此外,本发明还提供了一种图像处理方法、设备及计算机可读存储介质,同样具有上述有益效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种图像处理装置的结构示意图;
图2为本发明实施例提供的一种发票图像;
图3为本发明实施例提供的一种标记图像;
图4为本发明实施例提供的一种印章图像;
图5为本发明实施例提供的一种电子发票表格图;
图6为本发明实施例提供的一种图像处理方法流程图;
图7为本发明实施例提供的一种图像处理设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,图1为本发明实施例提供的一种图像处理装置的结构示意图。该装置包括:
图像检测分割模块100,用于获取发票图像,并将发票图像输入到发票分割模型中进行检测分割,得到印章图像和字符图像;
目标模板提取模块200,用于将印章图像输入到印章识别模型中,得到印章识别结果,并从表格模板数据库中提取印章识别结果对应的目标表格模板;
表格制作模块300,用于将字符图像输入到OCR识别模型中,得到发票字符,将发票字符填入目标表格模板中,得到电子发票表格,并保存电子发票表格。
具体的,利用图像检测分割模块100中的傅立叶变换单元获取发票图像。本实施例中,对于傅立叶变换单元如何获取原始发票图像不做限定。例如可以对发票原件进行扫描,得到原始发票图像;或者可以利用手机、相机等具有拍照功能的终端拍摄发票原件,得到原始发票图像;或者可以对发票复印件进行扫描或拍摄,得到原始发票图像。本实施例并不限定原始发票图像的分辨率,分辨率越高的原始发票图片越清晰,在识别时准确率越高,速度越快。对于原始发票图像的具体规格,即原始发票图像的长度和宽度,本实施例不做限定。因此该方法可以对不同省市、不同行业和不同公司使用的不同规格的发票进行识别。
在获取原始发票图像后,傅立叶变换单元对原始发票图像进行傅立叶变换,具体的傅立叶变换步骤在此不在赘述。得到傅立叶变换图像,以便在后续滤波操作时滤除干扰波。
由于傅里叶变换后得到的波形幅度值范围较大,其高幅度值显示为白点,低幅度值显示为黑点。为了能够更好地分辨出幅度值高低变化的连续性,利用仿射变换单元对傅立叶变换图像进行对数尺度检测,将其幅度值从线性尺度变换为对数尺度,这样既可以保证数据不失真,又可以减小幅度值的范围,更好地分辨其变化的连续性。在对数尺度检测后可以进行仿射变换,将歪斜的图像调整为正面图像。仿射变换(Affine Transformation)是一种从二维坐标到二维坐标之间的线性变换,其可以保持二维图形的平直性(即变换后直线还是直线,圆弧还是圆弧)和平行性(二维图形上线条的相对位置关系不变,即平行线还是平行线,相交直线的交角不变)。将傅立叶变换图像进行仿射变换后,得到仿射变换图像。
利用滤波锐化单元对仿射变换图像进行滤波处理,滤除干扰波。干扰波可以为高频波形,也可以为低频波形。本实施例并不限定采用何种滤波方法,例如可以采用高斯滤波。本实施例并不限定滤波器的种类,例如可以为采用非线性滤波器;或者可以采用双边滤波器;或者可以采用巴特沃兹滤波器。滤波器的具体参数可以根据实际情况进行设置,例如当干扰波的频率较高时,可以将滤波器设置为低通滤波器或带通滤波器。
当滤波处理结束后,对滤波后的仿射变换图像进行傅里叶逆变换,并进行锐化处理。锐化处理可以补偿图像的轮廓,增强图像边缘的跳变幅度,使图像变得清晰。本实施例中,可以采用梯度算子法对图片进行锐化处理;或者可以采用平均差分法对图片进行锐化处理。在经过锐化处理后,得到发票图像。具体请参考图2,图2为本发明实施例提供的一种发票图像,具体为一张广东省医疗收费票据图像。
具体的,在利用图像检测分割模块100将发票图像输入到发票分割模型中进行检测分割前,需要确定分割模型的类别并对其进行训练,以得到发票分割模型。本实施例中并不限定分割模型的具体类型,例如可以为rcnn卷积神经网络模型;或者可以为cnn卷积神经网络模型。本实施例中采用faster-rcnn神经网络模型作为分割模型。faster-rcnn神经网络模型的识别速度更快,可以减少整个识别过程所需的时间。本实施例中设置有训练图像集,其中包含有多个原始训练图像,即包含多个原始训练发票图像。对原始训练发票图像进行标记,得到标记图像,本实施例可以通过标记模块,利用LabelImg工具对训练图像进行标记,得到标记图像。本实施例中,可以利用蓝色方框标记原始训练图像上的印章,还可以标记票据号、收款方、收款金额和款项名称等项目中的一项或几项,例如可以利用灰色方框标记票据号;可以利用黑色方框标记收款方和收款金额;可以利用绿色方框标记款项名称。具体请参考图3,图3为本发明实施例提供的一种标记图像,其具体为对图2进行标记得到的标记图像。
利用第一训练模块将标记图像和和训练图像输入到faster-rcnn神经网络模型中进行训练,直至图像处理精度达到图像处理精度阈值,即可得到训练好的分割模型,即发票分割模型。本实施例并不限定图像处理精度阈值的具体大小,例如可以设置为0.95,即图像识别准确率为95%。
将发票图像输入到发票分割模型中进行检测分割,本实施例中优选的,利用缺损判断单元对发票图像进行完整性检测。本实施例并不限定完整性检测的具体检测方法。例如可以检测发票图像的边缘是否存在黑边,若存在黑边,则认为发票图像不完整,不对其进行分割和后续操作;若不存在黑边,则认为发票图像完整,即可对其进行分割。本实施例中,利用分割单元将标记图像使用的各色标记方框作为边缘,对发票图像进行分割,得到印章图像和字符图像。
在将印章图像输入到印章识别模型中进行分类之前,需要确定印章模型的类型并对其进行训练,以得到印章识别模型。对于印章模型的具体类型,本实施例不做限定,例如可以采用VGG16卷积神经网络模型作为印章模型。利用印章图像切割模块对标记图像进行切割,可以得到训练印章图像。再通过印象图像标记模块,利用训练印章图像对应的印章文字对训练印章图像进行标记,得到标记印章图像。本实施例中,可以利用LabelImg工具对训练图像进行标记。利用第二训练模块将标记印章图像输入到VGG16卷积神经网络模型中,以对印章模型进行训练。当印章模型的印章识别精度达到印章识别精度阈值时,即可得到训练好的印章模型,即印章识别模型。本实施例并不限定印章识别进度阈值的具体大小,例如可以设置为0.9,即印章识别准确率90%。
图像检测分割模块100对发票图像进行分割得到印章图像,具体请参考图4,图4为本发明实施例提供的一种印章图像。目标模板提取模块200将印章图像输入到印章识别模型中,对印章图像进行识别,得到印章识别结果。由于不同种类的发票上包括的项目不同,例如医疗收费发票包括诊治类别和医疗统筹/公医记账等项目;增值税专用发票包括纳税人识别号和货物或应税劳务名称等项目。现有技术很容易在发票自动识别录入时漏填门诊类别等特殊信息,在识别过程中造成发票信息缺失。本实施例中预设有表格模板数据库,其中包括不同发票对应的表格模板,表格模板可以为Excel表格模板。在印章识别结束后,根据印章识别结果,可以从表格模板数据库中提取与印章识别结果对应的目标表格模板,该目标表格模板中的项目种类和发票图像中的发票项目种类完全相同,因此可以避免发票信息缺失的情况出现。
在将字符图像输入到OCR识别模型中进行分类之前,需要确定字符模型的类型并对其进行训练,以得到字符识别模型。对于字符模型的具体类型,本实施例不做限定,例如可以采用rcnn卷积神经网络模型作为字符模型。可以利用字符图像切割模块对标记图像进行切割,可以得到训练字符图像,利用训练字符图像对应的训练字符对训练字符图像进行标记,得到标记字符图像。本实施例中,可以通过字符图像标记模块,利用LabelImg工具对训练图像进行标记。本实施例中,还可以利用MLP颜色分割器将标记字符图像的背景颜色进行分割去除,得到无背景字符图像,以便字符识别模型进行字符识别,本实施例并不限定背景颜色的具体内容,例如可以为红色。利用第三训练模块将标记字符图像和MLP颜色分割器输入到rcnn卷积神经网络模型中进行训练,当字符识别精度达到字符识别精度阈值时,可得到训练好的字符模型,即OCR识别模型。本实施例并不限定字符识别精度阈值的具体大小,例如可以设置为0.9,即识别准确率为90%。
将对发票图像进行分割得到的字符图像输入到OCR识别模型中,利用表格制作模块300中背景去除单元的MLP颜色分割器对字符图像进行背景颜色去除,得到无背景字符图像,并利用识别单元对无背景字符图像进行识别,得到发票字符。将发票字符填入与其对应的目标表格模板中,即可得到电子发票表格。在得到电子发票表格后,将其进行保存以便在需要时调用和查阅。本实施例并不限定电子发票表格保存的具体位置,例如可以保存在数据库中;或者可以保存在存储器中。具体请参考图5,图5为本发明实施例提供的一种电子发票表格图。
应用本发明实施例提供的图像处理装置,利用图像检测分割模块对发票图像进行分割,得到印章图像和字符图像。并对印章图像进行识别得到印章识别结果,利用印章识别结果从表格模板数据库中提取与发票图像对应的目标表格模板,利用表格制作模块对字符图像进行识别得到发票字符,并将发票字符填入目标模板以得到电子发票表格。该装置解决了发票信息录入工作繁琐的问题。从表格模板数据库中提取与发票图像对应的目标表格模板,可以避免因表格模板与发票图像不匹配而造成发票信息漏填。例如当发票图像为医疗收费票据时,发票中的诊治类别和医疗统筹/公医记账两个项目为医疗收费票据特有项目,现有技术所使用的表格模板中没有这两个项目,在进行医疗收费票据识别录入时,会造成该部分信息漏填;若通过工作人员手工录入的装置进行补充,也会增加工作人员的工作量。通过提取目标表格模板,将字符识别后得到的数据填入目标表格模板中,可以解决对发票进行自动识别时部分信息漏填的问题,同时不需要工作人员对漏填的信息进行人工输入,减少了工作人员的工作量。
下面对本发明实施例提供的图像处理方法进行介绍,下文描述的图像处理方法与上文描述的图像处理装置可相互对应参照。
请参考图6,图6为本发明实施例提供的一种图像处理方法流程图,包括:
S101:获取发票图像。
本实施例中,对于获取原始发票图像的方式不做限定。例如可以对发票原件进行扫描,得到原始发票图像;或者可以利用手机、相机等具有拍照功能的终端拍摄发票原件,得到原始发票图像。本实施例并不限定原始发票图像的分辨率,分辨率越高的原始发票图片越清晰,在识别时准确率越高,速度越快。对于原始发票图像的具体规格,即原始发票图像的长度和宽度,本实施例不做限定。因此该方法可以对不同省市、不同行业和不同公司使用的不同规格的发票进行识别。在获取原始发票图像后,对原始发票图像进行傅立叶变换,具体的傅立叶变换步骤在此不在赘述。得到傅立叶变换图像,以便在后续滤波操作时滤除干扰波。
由于傅里叶变换后得到的波形幅度值范围较大,其高幅度值显示为白点,低幅度值显示为黑点。为了能够更好地分辨出幅度值高低变化的连续性,对傅立叶变换图像进行对数尺度检测,将其幅度值从线性尺度变换为对数尺度,这样既可以保证数据不失真,又可以减小幅度值的范围,更好地分辨其变化的连续性。在对数尺度检测后可以进行仿射变换,得到仿射变换图像。对仿射变换图像进行滤波处理,滤除干扰波。当滤波处理结束后,对滤波后的仿射变换图像进行傅里叶逆变换,并进行锐化处理。锐化处理可以补偿图像的轮廓,增强图像边缘的跳变幅度,使图像变得清晰。在经过锐化处理后,得到发票图像。
S102:将发票图像输入到发票分割模型中进行检测分割,得到印章图像和字符图像。
具体的,在将发票图像输入到发票分割模型中进行检测分割前,需要确定分割模型的类别并对其进行训练,以得到发票分割模型。本实施例中采用faster-rcnn神经网络模型作为分割模型。faster-rcnn神经网络模型的识别速度更快,可以减少整个识别过程所需的时间。本实施例中设置有训练图像集,其中包含有多个原始训练图像,即包含多个原始训练发票图像。对原始训练发票图像进行标记,得到标记图像,可以利用LabelImg工具对训练图像进行标记,得到标记图像。
将标记图像和和训练图像输入到faster-rcnn神经网络模型中进行训练,直至图像处理精度达到图像处理精度阈值,即可得到训练好的分割模型,即发票分割模型。本实施例并不限定图像处理精度阈值的具体大小,例如可以设置为0.95,即图像识别准确率为95%。
将发票图像输入到发票分割模型中进行检测分割,本实施例中优选的,对发票图像进行完整性检测。本实施例并不限定完整性检测的具体检测方法。例如可以检测发票图像的边缘是否存在黑边,若存在黑边,则认为发票图像不完整,不对其进行分割和后续操作;若不存在黑边,则认为发票图像完整,即可对其进行分割,得到印章图像和字符图像。
S103:将印章图像输入到印章识别模型中,得到印章识别结果,并从表格模板数据库中提取印章识别结果对应的目标表格模板。
在将印章图像输入到印章识别模型中进行分类之前,需要确定印章模型的类型并对其进行训练,以得到印章识别模型。对于印章模型的具体类型,本实施例不做限定,例如可以采用VGG16卷积神经网络模型作为印章模型。利用印章图像切割模块对标记图像进行切割,可以得到训练印章图像。利用训练印章图像对应的印章文字对训练印章图像进行标记,得到标记印章图像。本实施例中,可以利用LabelImg工具对训练图像进行标记。将标记印章图像输入到VGG16卷积神经网络模型中,以对印章模型进行训练。当印章模型的印章识别精度达到印章识别精度阈值时,即可得到训练好的印章模型,即印章识别模型。本实施例并不限定印章识别进度阈值的具体大小,例如可以设置为0.9,即印章识别准确率90%。
对发票图像进行分割得到印章图像,将印章图像输入到印章识别模型中,对印章图像进行识别,得到印章识别结果。根据印章识别结果,可以从表格模板数据库中提取与印章识别结果对应的目标表格模板,该目标表格模板中的项目种类和发票图像中的发票项目种类完全相同,因此可以避免发票信息缺失的情况出现。
S104:将字符图像输入到OCR识别模型中,得到发票字符,将发票字符填入目标表格模板中,得到电子发票表格,并保存电子发票表格。
在将字符图像输入到OCR识别模型中进行分类之前,需要确定字符模型的类型并对其进行训练,以得到字符识别模型。对于字符模型的具体类型,本实施例不做限定,例如可以采用rcnn卷积神经网络模型作为字符模型。对标记图像进行切割,可以得到训练字符图像,利用训练字符图像对应的训练字符对训练字符图像进行标记,得到标记字符图像。本实施例中,还可以利用MLP颜色分割器将标记字符图像的背景颜色进行分割去除,得到无背景字符图像,以便字符识别模型进行字符识别。将标记字符图像和MLP颜色分割器输入到rcnn卷积神经网络模型中进行训练,当字符识别精度达到字符识别精度阈值时,可得到训练好的字符模型,即OCR识别模型。本实施例并不限定字符识别精度阈值的具体大小,例如可以设置为0.9,即识别准确率为90%。
将对发票图像进行分割得到的字符图像输入到OCR识别模型中,利用MLP颜色分割器对字符图像进行背景颜色去除,得到无背景字符图像,并对无背景字符图像进行识别,得到发票字符。将发票字符填入与其对应的目标表格模板中,即可得到电子发票表格。在得到电子发票表格后,将其进行保存以便在需要时调用和查阅。
应用本发明实施例提供的图像处理方法,对发票图像进行分割,得到印章图像和字符图像。并对印章图像进行识别得到印章识别结果,利用印章识别结果从表格模板数据库中提取与发票图像对应的目标表格模板,对字符图像进行识别得到发票字符,并将发票字符填入目标模板以得到电子发票表格。该方法解决了发票信息录入工作繁琐的问题,同时从表格模板数据库中提取与发票图像对应的目标表格模板,可以防止发票信息漏填的情况出现。
下面对本发明实施例提供的图像处理设备进行介绍,下文描述的图像处理设备与上文描述的图像处理装置可相互对应参照。
请参考图7,图7为本发明实施例所提供的一种图像处理设备的结构示意图,该图像处理设备包括存储器和处理器,其中:
存储器10,用于存储计算机程序;
处理器20,用于执行计算机程序,以实现上述的图像处理方法。
下面对本发明实施例提供的计算机可读存储介质进行介绍,下文描述的计算机可读存储介质与上文描述的图像处理装置可相互对应参照。
本发明还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述的图像处理方法的步骤。
该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应该认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系属于仅仅用来将一个实体或者操作与另一个实体或者操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其他任何变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
以上对本发明所提供的图像处理装置、方法、设备和计算机可读存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (7)

1.一种图像处理装置,其特征在于,包括:
图像检测分割模块,用于获取发票图像,并将所述发票图像输入到发票分割模型中进行检测分割,得到印章图像和字符图像;
目标模板提取模块,用于将所述印章图像输入到印章识别模型中,得到印章识别结果,并从表格模板数据库中提取所述印章识别结果对应的目标表格模板;
表格制作模块,用于将所述字符图像输入到OCR识别模型中,得到发票字符,将所述发票字符填入所述目标表格模板中,得到电子发票表格,并保存所述电子发票表格;
标记模块,用于利用LabelImg工具对训练图像进行标记,得到标记图像;
第一训练模块,用于将所述标记图像和所述训练图像输入到faster-rcnn神经网络模型中进行训练,直至图像识别精度达到图像处理精度阈值,得到所述发票分割模型;
所述图像检测分割模块,包括:
缺损判断单元,用于将所述发票图像输入到所述发票分割模型中,判断所述发票图像是否缺损;
分割单元,用于若所述发票图像没有缺损,则对所述发票图像进行分割,得到所述印章图像和所述字符图像;
傅立叶变换单元,用于获取原始发票图像,对所述原始发票图像进行傅立叶变换,得到傅立叶变换图像;
仿射变换单元,用于对所述傅立叶变换图像进行对数尺度检测,并进行仿射变换,得到仿射变换图像;
滤波锐化单元,用于对所述仿射变换图像进行滤波和锐化处理,得到所述发票图像。
2.根据权利要求1所述的图像处理装置,其特征在于,包括:
印章图像切割模块,用于对所述标记图像进行切割处理,得到训练印章图像;
印象图像标记模块,用于获取各个所述训练印章图像对应的印章文字,利用所述印章文字对所述训练印章图像进行标记,得到标记印章图像;
第二训练模块,用于将所述标记印章图像输入到VGG16神经网络模型中进行训练,直至印章识别精度达到印章识别精度阈值,得到所述印章识别模型。
3.根据权利要求1所述的图像处理装置,其特征在于,包括:
字符图像切割模块,用于对所述标记图像进行切割处理,得到训练字符图像;
字符图像标记模块,用于利用所述训练字符图像对应的训练字符对所述训练字符图像进行标记,得到标记字符图像;
第三训练模块,用于将所述标记字符图像和MLP颜色分割器输入到rcnn神经网络模型中进行训练,直至字符识别精度达到字符识别精度阈值,得到所述OCR识别模型。
4.根据权利要求3所述的图像处理装置,其特征在于,所述表格制作模块,包括:
背景去除单元,用于利用所述MLP颜色分割器对所述字符图像进行背景颜色去除,得到无背景字符图像;
识别单元,用于利用所述OCR识别模型对所述无背景图像进行识别,得到所述发票字符。
5.一种图像处理方法,其特征在于,包括:
获取原始发票图像,对所述原始发票图像进行傅立叶变换,得到傅立叶变换图像;对所述傅立叶变换图像进行对数尺度检测,并进行仿射变换,得到仿射变换图像;对所述仿射变换图像进行滤波和锐化处理,得到所述发票图像;将所述发票图像输入到发票分割模型中进行检测分割,得到印章图像和字符图像,包括:将所述发票图像输入到所述发票分割模型中,判断所述发票图像是否缺损;若所述发票图像没有缺损,则对所述发票图像进行分割,得到所述印章图像和所述字符图像;其中,所述发票分割模型基于利用LabelImg工具对训练图像进行标记,得到标记图像,将所述标记图像和所述训练图像输入到faster-rcnn神经网络模型中进行训练,直至图像识别精度达到图像处理精度阈值得到;
将所述印章图像输入到印章识别模型中,得到印章识别结果,并从表格模板数据库中提取所述印章识别结果对应的目标表格模板;
将所述字符图像输入到OCR识别模型中,得到发票字符,将所述发票字符填入所述目标表格模板中,得到电子发票表格,并保存所述电子发票表格。
6.一种图像处理设备,其特征在于,包括存储器和处理器,其中:
所述存储器,用于保存计算机程序;
所述处理器,用于执行所述计算机程序,以实现如权利要求5所述的图像处理方法。
7.一种计算机可读存储介质,其特征在于,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求5所述的图像处理方法。
CN201910695824.8A 2019-07-30 2019-07-30 一种图像处理装置、方法、设备及可读存储介质 Active CN110399851B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910695824.8A CN110399851B (zh) 2019-07-30 2019-07-30 一种图像处理装置、方法、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910695824.8A CN110399851B (zh) 2019-07-30 2019-07-30 一种图像处理装置、方法、设备及可读存储介质

Publications (2)

Publication Number Publication Date
CN110399851A CN110399851A (zh) 2019-11-01
CN110399851B true CN110399851B (zh) 2022-02-15

Family

ID=68326552

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910695824.8A Active CN110399851B (zh) 2019-07-30 2019-07-30 一种图像处理装置、方法、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN110399851B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111127673A (zh) * 2019-12-27 2020-05-08 航天信息股份有限公司 一种支持高拍仪的发票自助认证方法及系统
CN111209827B (zh) * 2019-12-31 2023-07-14 中国南方电网有限责任公司 一种基于特征检测的ocr识别票据问题的方法及系统
CN111259908A (zh) * 2020-03-24 2020-06-09 中冶赛迪重庆信息技术有限公司 基于机器视觉的钢卷号识别方法、系统、设备及存储介质
CN111582273B (zh) * 2020-05-09 2023-10-10 中国工商银行股份有限公司 图像文本识别方法及装置
CN111784499A (zh) * 2020-06-24 2020-10-16 平安银行股份有限公司 基于云平台的业务集成方法、装置、电子设备及存储介质
CN111797772B (zh) * 2020-07-07 2024-08-02 因凡科技(北京)有限公司 发票图像自动分类方法、系统、装置
CN112069973A (zh) * 2020-09-01 2020-12-11 Pfu上海计算机有限公司 印章处理方法、装置、设备及存储介质
CN112037077B (zh) * 2020-09-03 2024-07-09 平安健康保险股份有限公司 基于人工智能的印章识别方法、装置、设备及存储介质
CN114255471A (zh) * 2020-09-25 2022-03-29 航天信息股份有限公司 一种发票内容的识别方法及装置
CN112540086B (zh) * 2020-11-23 2024-04-05 海南电网有限责任公司东方供电局 一种票面合规性检测系统
CN112541443B (zh) * 2020-12-16 2024-05-10 平安科技(深圳)有限公司 发票信息抽取方法、装置、计算机设备及存储介质
CN113537067A (zh) * 2021-07-16 2021-10-22 用友网络科技股份有限公司 文字识别方法、装置和可读存储介质
CN113610098B (zh) * 2021-08-19 2022-08-09 创优数字科技(广东)有限公司 纳税号识别方法、装置、存储介质及计算机设备
CN115273123B (zh) * 2022-09-26 2023-02-10 山东豸信认证服务有限公司 一种票据识别方法、装置、设备及计算机存储介质
CN115758991A (zh) * 2022-11-07 2023-03-07 北京合思信息技术有限公司 增值税纸质发票电子存档方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101551861A (zh) * 2008-03-31 2009-10-07 富士通先端科技株式会社 字符识别装置
CN107633239A (zh) * 2017-10-18 2018-01-26 江苏鸿信系统集成有限公司 基于深度学习和ocr的票据分类及票据字段提取方法
CN108960223A (zh) * 2018-05-18 2018-12-07 北京大账房网络科技股份有限公司 基于票据智能识别自动生成凭证的方法
CN109460769A (zh) * 2018-11-16 2019-03-12 湖南大学 一种基于表格字符检测与识别的移动端系统与方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103164855B (zh) * 2013-02-26 2016-04-27 清华大学深圳研究生院 一种结合反射光照的贝叶斯决策前景提取方法
CN103914833B (zh) * 2014-03-11 2016-09-28 深圳辰通智能股份有限公司 一种自动检测票据是否残缺的方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101551861A (zh) * 2008-03-31 2009-10-07 富士通先端科技株式会社 字符识别装置
CN107633239A (zh) * 2017-10-18 2018-01-26 江苏鸿信系统集成有限公司 基于深度学习和ocr的票据分类及票据字段提取方法
CN108960223A (zh) * 2018-05-18 2018-12-07 北京大账房网络科技股份有限公司 基于票据智能识别自动生成凭证的方法
CN109460769A (zh) * 2018-11-16 2019-03-12 湖南大学 一种基于表格字符检测与识别的移动端系统与方法

Also Published As

Publication number Publication date
CN110399851A (zh) 2019-11-01

Similar Documents

Publication Publication Date Title
CN110399851B (zh) 一种图像处理装置、方法、设备及可读存储介质
CN111695486B (zh) 一种基于点云的高精度方向标志牌目标提取方法
CN107423732A (zh) 基于Android平台的车辆VIN识别方法
US9384393B2 (en) Check data lift for error detection
CN106709866B (zh) 证件照去除网格水印的方法及装置、人脸验证方法及装置
US20150286860A1 (en) Method and Device for Generating Data from a Printed Document
US20150120563A1 (en) Check data lift for ach transactions
CN112395996A (zh) 财务票据ocr识别及影像处理方法、系统及可读存储介质
US20150287168A1 (en) Duplicate check image resolution
CN110634223A (zh) 票据校验方法及装置
CN111259891B (zh) 一种自然场景下身份证识别方法、装置、设备和介质
CN110378254B (zh) 车损图像修改痕迹的识别方法、系统、电子设备及存储介质
Do et al. Automatic license plate recognition using mobile device
CN111462388A (zh) 一种票据检验方法、装置、终端设备及存储介质
US20150117748A1 (en) Check data lift for check date listing
CN110516664A (zh) 票据识别方法、装置、电子设备及存储介质
CN112883858A (zh) 报销发票审核方法、装置和存储介质
CN111784675A (zh) 物品纹理信息处理的方法、装置、存储介质及电子设备
CN113379526A (zh) 智能发票报销方法、装置、电子设备及计算机存储介质
KR20180092455A (ko) 딥 러닝을 이용한 카드번호 인식방법
CN110781890A (zh) 身份证识别方法、装置、电子设备及可读取存储介质
CN111881923B (zh) 一种基于特征匹配的票据要素提取方法
CN110135288B (zh) 一种电子证照的快速核对方法及装置
CN114511866A (zh) 数据稽核方法、装置、系统、处理器及机器可读存储介质
CN111582115B (zh) 一种财务票据处理方法、装置、设备和可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant