CN108549890A - 基于图像识别的发票倾斜检测及几何校正方法 - Google Patents
基于图像识别的发票倾斜检测及几何校正方法 Download PDFInfo
- Publication number
- CN108549890A CN108549890A CN201810238134.5A CN201810238134A CN108549890A CN 108549890 A CN108549890 A CN 108549890A CN 201810238134 A CN201810238134 A CN 201810238134A CN 108549890 A CN108549890 A CN 108549890A
- Authority
- CN
- China
- Prior art keywords
- image
- invoice
- edge
- obtains
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/243—Aligning, centring, orientation detection or correction of the image by compensating for image skew or non-uniform image deformations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/48—Extraction of image or video features by mapping characteristic values of the pattern into a parameter space, e.g. Hough transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于图像识别的发票倾斜检测及几何校正方法,其以检测发票图像的倾斜角度为目标。首先利用图像采集设备采集发票图像,接着对采集的发票图像进行灰度处理,得到灰度图像。再将灰度图像转化为二值图像,然后利用Sobel算子对发票的二值图像进行边缘检测,得到发票的边缘图像。最后对发票的边缘图像采用Hough变换,检测出发票中最长的直线,计算出发票倾斜角,旋转发票图像得到校正好的发票图像。本发明引入图像处理领域的Sobel算子以及Hough变换,能准确检测出发票图像的倾斜角度,根据该倾斜角度对发票进行几何校正;解决了发票识别中因发票存在倾斜而无法正常识别的问题,能适用于多种不同类别的发票,在智能财务报销中拥有较高的应用价值。
Description
技术领域
本发明涉及一种基于图像识别的发票倾斜检测及几何校正方法,属于图像处理、人工智能领域。
背景技术
随着社会经济的高速发展,我国发票使用量日益上升。目前,我国每年报销使用的发票数以亿计,而且呈现出上升的趋势。但是现在大部分发票报销工作是由人工完成。人工报销发票效率低,报销流程长,消耗时间多,出错率极高。人工报销发票不仅加重了财务人员的工作负担,而且会占用报销者大量额外的精力,更会加重企业的生产成本。
近些年来,随着图像处理以及计算机视觉技术的飞快发展,高精度、高效率、低成本的文字识别技术得以实现。许多国内外的科研机构和科研人员将计算机视觉这一新兴技术引入到发票识别等相关领域中去,并对该技术的可行性进行了严谨深刻的分析。
利用图像处理及计算机视觉技术识别发票实现智能报销,能提高报销效率,减少报销者在报销上浪费的精力和时间,降低财务人员的工作负担,降低中小型企业的人力资源成本,这对社会发展十分重要。
发明内容
针对现有技术的不足,本发明提供一种基于图像识别的发票倾斜检测及几何校正方法,创造性引入先进的计算机视觉这一新兴学科,利用图像处理技术准确地检测出所采集的发票图像的倾斜角度,并根据这一角度对发票图像进行几何校正。
本发明为解决上述技术问题采用以下技术方案:
一方面,本发明提供一种基于图像识别的发票倾斜检测方法,具体包括以下步骤:
步骤1,将发票放置于纯色无条纹的背景上,通过图像采集设备采集发票图像A;
步骤2,对步骤一采集到的图像A进行灰度处理,得到灰度图像B;
步骤3,将步骤二得到的灰度图像B进行二值化处理,得到二值图像BW;
步骤4,采用Sobel边缘检测算子对步骤三得到的二值图像BW进行滤波,检测并提取出二值图像BW的边缘线,并强化发票边缘线、平滑抑制图像中噪声,得到边缘图像C;
步骤5,对步骤四得到的边缘图像C使用Hough变换检测出发票的倾斜角。
作为本发明的进一步技术方案,步骤4中采用Sobel边缘检测算子对步骤三得到的二值图像BW进行滤波,检测并提取出二值图像BW的边缘线,其具体包含如下步骤:
步骤4-1,采用Sobel边缘检测算子对二值图像BW进行滤波,得到二值图像BW的横向灰度值Gx与纵向灰度值Gy,并计算二值图像BW的灰度值
步骤4-2,遍历灰度值G,标记并加强灰度值大于自定义阈值的点,从而提取出二值图像BW的边缘线。
作为本发明的进一步技术方案,步骤5中步骤五对步骤四得到的边缘图像C使用Hough变换检测出发票的倾斜角,其具体包含如下步骤:
步骤5-1,在直角坐标系下将边缘图像C离散化,并计算出边缘图像C的长m和宽n;
步骤5-2,建立离散化的参数空间ρ-θ,并将其初始化,建立二维累加数组K(θ,ρ),其中,θ∈[0,180],
步骤5-3,遍历步骤5-1中离散化的边缘图像C,找出所有像素值不为0的点,对找出的每个点,将其坐标(x,y)带入方程ρ=x cosθ+y sinθ中,并以1为步长遍历θ∈[0,180],求出每个θi所对应的ρi,在相应的二维累加数组K(θi,ρi)上加1,其中,θi为第i次遍历的θ值,ρi为第i次遍历的θ值对应的ρ的值;
步骤5-4,遍历二维累加数组K(θ,ρ),找出其中的最大值,最大值对应的θ值即为发票的倾斜角。
另一方面,本发明还提供一种基于图像识别的发票倾斜几何校正方法,首先,基于如上所述的检测方法对发票的倾斜角进行检测,然后,根据发票倾斜角旋转发票图像,最后得到校正的发票图像。
作为本发明的进一步技术方案,将发票旋转90-θ或者180-θ即得到校正水平或者竖直的发票图像。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:本发明能有效的解决发票识别中因发票图票倾斜而不能识别的问题。创造性地引入Sobel算子以及Hough变换,能检测出发票最长边缘线的倾斜角度,根据这一角度完成发票的几何校正;而且本发明能对多种发票进行几何校正校正,具有较高的稳定性和鲁棒性。
附图说明
图1是本发明的方法流程图;
图2是灰度图像B;
图3是二值图像BW;
图4是边缘图像C;
图5是完成几何校正的图像。
具体实施方式
下面结合附图以及具体实施例对本发明的技术方案做进一步的详细说明:
本发明一种基于图像识别的发票倾斜检测及几何校正方法,如图1所示,包括以下具体步骤:
首先,将发票放置于纯色且无条纹的背景上,通过图像采集设备采集发票的RGB图像A。
然后,对RGB图像A进行灰度处理:采用的是对图像A的R、G、B分量进行加权平均的算法,将RGB图像A转换为灰度图像B,如图2所示。
接着,将灰度图像B进行二值化处理:
设定一个阈值Pthreshold∈(0.2,0.9),并对灰度图像B进行阈值变换。凡是在灰度图像B中像素值大于Pthreshold的点,则将其变为白色(255),否则将其变为黑色(0),由此可将灰度图像B转化为二值图像BW,如图3所示。
之后,采用Sobel边缘检测算子对二值图像BW进行滤波,检测并提取出发票的边缘线,强化发票边缘线,平滑抑制图像中噪声,得到边缘图像C,如图4所示。
具体而言,采用Sobell边缘检测算子对二值图像BW进行边缘检测,包含以下三个步骤:
步骤1,采用Sobell边缘检测算子对二值图像BW进行滤波,计算出二值图像BW的横向灰度值Gx与纵向灰度值Gy,并根据Gx以及Gy计算图像的灰度值G。其中,计算Gx、Gy和G的公式如下:
步骤2,自定义阈值Gthreshold,遍历G,若存在点(x,y),其所对应的G(x,y)>Gthreshold,标记并加强这些点,即可得到边缘图像C。
最后,对边缘图像C进行Hough变换,检测出发票最长边缘线的倾斜角,根据发票倾斜角旋转发票图像,得到校正好的发票图像,如图5所示。
具体而言,对边缘图像C采用Hough变换检测发票最长边缘线的倾斜角,具体包括如下步骤:
步骤1,在直角坐标系下将边缘图像C离散化,计算出边缘图像C的长和宽,分别记为m,n。
步骤2,建立离散化的参数空间ρ-θ,并将其初始化,其中,θ∈[0,180],建立二维累加数组K(θ,ρ)。
步骤3,遍历边缘图像C,寻找出所有像素值不为0的点(x,y)。每找出一个点,将其带入方程ρ=x cosθ+y sinθ中,并以1为步长,遍历θ∈[0,180],求出θi所对应的ρi,在相应的二维累加数组K(θi,ρi)上加1。
步骤4,寻找出二维累加数组K(θ,ρ)中的最大值,将其所对应的(θ,ρ)带入可以得到ρ=x cosθ+y sinθ发票最长边缘线方程。将发票旋转90-θ或者180-θ(若得到正值,则做逆时针旋转;若得到负值,则做顺时针旋转),就可以得到校正水平或者竖直的发票图像。
以上所述,仅为本发明中的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉该技术的人在本发明所揭露的技术范围内,可理解想到的变换或替换,都应涵盖在本发明的包含范围之内,因此,本发明的保护范围应该以权利要求书的保护范围为准。
Claims (5)
1.基于图像识别的发票倾斜检测方法,其特征在于,具体包括以下步骤:
步骤1,将发票放置于纯色无条纹的背景上,通过图像采集设备采集发票图像A;
步骤2,对步骤一采集到的图像A进行灰度处理,得到灰度图像B;
步骤3,将步骤二得到的灰度图像B进行二值化处理,得到二值图像BW;
步骤4,采用Sobel边缘检测算子对步骤三得到的二值图像BW进行滤波,检测并提取出二值图像BW的边缘线,并强化发票边缘线、平滑抑制图像中噪声,得到边缘图像C;
步骤5,对步骤四得到的边缘图像C使用Hough变换检测出发票的倾斜角。
2.根据权利要求1所述的基于图像识别的发票倾斜检测及几何校正方法,其特征在于,步骤4中采用Sobel边缘检测算子对步骤三得到的二值图像BW进行滤波,检测并提取出二值图像BW的边缘线,其具体包含如下步骤:
步骤4-1,采用Sobel边缘检测算子对二值图像BW进行滤波,得到二值图像BW的横向灰度值Gx与纵向灰度值Gy,并计算二值图像BW的灰度值
步骤4-2,遍历灰度值G,标记并加强灰度值大于自定义阈值的点,从而提取出二值图像BW的边缘线。
3.根据权利要求1所述的基于图像识别的发票倾斜检测及几何校正方法,其特征在于,步骤5中步骤五对步骤四得到的边缘图像C使用Hough变换检测出发票的倾斜角,其具体包含如下步骤:
步骤5-1,在直角坐标系下将边缘图像C离散化,并计算出边缘图像C的长m和宽n;
步骤5-2,建立离散化的参数空间ρ-θ,并将其初始化,建立二维累加数组K(θ,ρ),其中,θ∈[0,180],
步骤5-3,遍历步骤5-1中离散化的边缘图像C,找出所有像素值不为0的点,对找出的每个点,将其坐标(x,y)带入方程ρ=xcosθ+ysinθ中,并以1为步长遍历θ∈[0,180],求出每个θi所对应的ρi,在相应的二维累加数组K(θi,ρi)上加1,其中,θi为第i次遍历的θ值,ρi为第i次遍历的θ值对应的ρ的值;
步骤5-4,遍历二维累加数组K(θ,ρ),找出其中的最大值,最大值对应的θ值即为发票的倾斜角。
4.基于图像识别的发票倾斜几何校正方法,其特征在于,首先,基于如权利要求1至3中任一所述的检测方法对发票的倾斜角进行检测,然后,根据发票倾斜角旋转发票图像,最后得到校正的发票图像。
5.根据权利要求4所述的基于图像识别的发票倾斜几何校正方法,其特征在于,将发票旋转90-θ或者180-θ即得到校正水平或者竖直的发票图像。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810238134.5A CN108549890A (zh) | 2018-03-22 | 2018-03-22 | 基于图像识别的发票倾斜检测及几何校正方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810238134.5A CN108549890A (zh) | 2018-03-22 | 2018-03-22 | 基于图像识别的发票倾斜检测及几何校正方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108549890A true CN108549890A (zh) | 2018-09-18 |
Family
ID=63517011
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810238134.5A Pending CN108549890A (zh) | 2018-03-22 | 2018-03-22 | 基于图像识别的发票倾斜检测及几何校正方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108549890A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109447070A (zh) * | 2018-10-31 | 2019-03-08 | 新华三信息安全技术有限公司 | 一种信息确定方法及装置 |
CN110378249A (zh) * | 2019-06-27 | 2019-10-25 | 腾讯科技(深圳)有限公司 | 文本图像倾斜角度识别方法、装置及设备 |
CN112633275A (zh) * | 2020-12-22 | 2021-04-09 | 航天信息股份有限公司 | 一种基于深度学习的多票据混拍图像校正方法及系统 |
CN113158895A (zh) * | 2021-04-20 | 2021-07-23 | 北京中科江南信息技术股份有限公司 | 票据识别方法、装置、电子设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101625760A (zh) * | 2009-07-28 | 2010-01-13 | 谭洪舟 | 一种证件图像倾斜校正的办法 |
CN102509093A (zh) * | 2011-10-18 | 2012-06-20 | 谭洪舟 | 近距离数字化证件信息采集系统 |
CN105528604A (zh) * | 2016-01-31 | 2016-04-27 | 华南理工大学 | 一种基于ocr的票据自动识别与处理系统 |
-
2018
- 2018-03-22 CN CN201810238134.5A patent/CN108549890A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101625760A (zh) * | 2009-07-28 | 2010-01-13 | 谭洪舟 | 一种证件图像倾斜校正的办法 |
CN102509093A (zh) * | 2011-10-18 | 2012-06-20 | 谭洪舟 | 近距离数字化证件信息采集系统 |
CN105528604A (zh) * | 2016-01-31 | 2016-04-27 | 华南理工大学 | 一种基于ocr的票据自动识别与处理系统 |
Non-Patent Citations (3)
Title |
---|
李致毅: "基于概率图模型的发票内容自动识别方法研究", 《万方学位期刊》 * |
潘文明等: "《手把手教你学FPGA设计-基于大道至简的至简设计法》", 30 June 2017 * |
郭斯羽: "《面向检测的图像处理技术》", 31 August 2015 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109447070A (zh) * | 2018-10-31 | 2019-03-08 | 新华三信息安全技术有限公司 | 一种信息确定方法及装置 |
CN109447070B (zh) * | 2018-10-31 | 2020-08-28 | 新华三信息安全技术有限公司 | 一种信息确定方法及装置 |
CN110378249A (zh) * | 2019-06-27 | 2019-10-25 | 腾讯科技(深圳)有限公司 | 文本图像倾斜角度识别方法、装置及设备 |
CN110378249B (zh) * | 2019-06-27 | 2024-01-12 | 腾讯科技(深圳)有限公司 | 文本图像倾斜角度识别方法、装置及设备 |
CN112633275A (zh) * | 2020-12-22 | 2021-04-09 | 航天信息股份有限公司 | 一种基于深度学习的多票据混拍图像校正方法及系统 |
CN112633275B (zh) * | 2020-12-22 | 2023-07-18 | 航天信息股份有限公司 | 一种基于深度学习的多票据混拍图像校正方法及系统 |
CN113158895A (zh) * | 2021-04-20 | 2021-07-23 | 北京中科江南信息技术股份有限公司 | 票据识别方法、装置、电子设备及存储介质 |
CN113158895B (zh) * | 2021-04-20 | 2023-11-14 | 北京中科江南信息技术股份有限公司 | 票据识别方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108549890A (zh) | 基于图像识别的发票倾斜检测及几何校正方法 | |
CN108921865B (zh) | 一种抗干扰的亚像素直线拟合方法 | |
CN108549843A (zh) | 一种基于图像处理的增值税发票识别方法 | |
CN106909941A (zh) | 基于机器视觉的多表字符识别系统及方法 | |
CN111611643B (zh) | 户型矢量化数据获得方法、装置、电子设备及存储介质 | |
CN108647681A (zh) | 一种带有文本方向校正的英文文本检测方法 | |
CN107203990A (zh) | 一种基于模板匹配与图像质量评估的标贴破损检测方法 | |
CN105046252A (zh) | 一种人民币冠字码识别方法 | |
CN105303168A (zh) | 一种多视角的指针式仪表识别方法和装置 | |
CN108734235A (zh) | 一种用于电子处方的身份识别方法及系统 | |
CN112233116B (zh) | 基于邻域决策与灰度共生矩阵描述的凹凸痕视觉检测方法 | |
CN101114340A (zh) | 直方图均衡化图像处理的vlsi实现系统及方法 | |
CN107967471A (zh) | 一种基于机器视觉的表具自动识别方法 | |
CN107977639A (zh) | 一种人脸清晰度判断方法 | |
CN111814919A (zh) | 一种基于深度学习的仪表定位与识别系统 | |
CN106709500A (zh) | 一种图像特征匹配的方法 | |
CN108764234A (zh) | 一种基于巡检机器人的液位仪表读数识别方法 | |
CN106023187A (zh) | 一种基于sift特征和角度相对距离的图像配准方法 | |
CN109993161A (zh) | 一种文本图像旋转矫正方法及系统 | |
CN106599890A (zh) | 变电站巡检机器人数字式仪表识别算法 | |
CN112734729B (zh) | 适用于夜间补光条件的水尺水位线图像检测方法、装置及存储介质 | |
CN111476246A (zh) | 应用于复杂环境下指针仪表鲁棒高效智读方法 | |
CN110335280A (zh) | 一种基于移动端的金融单据图像分割与矫正方法 | |
CN115630662A (zh) | 一种输变电设备健康码核验及校正方法 | |
CN108960236A (zh) | 基于二维码匹配与图像识别的指针式仪表识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180918 |
|
RJ01 | Rejection of invention patent application after publication |