CN109871844A - 一种拍摄小票图像文本矫正和提取方法 - Google Patents

一种拍摄小票图像文本矫正和提取方法 Download PDF

Info

Publication number
CN109871844A
CN109871844A CN201910018095.2A CN201910018095A CN109871844A CN 109871844 A CN109871844 A CN 109871844A CN 201910018095 A CN201910018095 A CN 201910018095A CN 109871844 A CN109871844 A CN 109871844A
Authority
CN
China
Prior art keywords
text
receipt
image
line
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910018095.2A
Other languages
English (en)
Inventor
蒋光峰
叶桦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN201910018095.2A priority Critical patent/CN109871844A/zh
Publication of CN109871844A publication Critical patent/CN109871844A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

本发明公开了一种拍摄小票图像文本矫正和提取方法,方法首先根据纸张颜色去除非小票像素得到掩模图,再由掩模图提取小票边缘像素,拟合边缘像素得到多条小线段;拼接小线段,连接四边边线,形成闭合区域;计算角点,进行角点匹配,通过角点将小票分成多个子图进行矫正;对二值图像进行膨胀,将左右文字连通,检出文本行,对所有倾斜的文本行进行倾斜矫正,按文本行框在原图位置合成新文本图像。本发明应用于小票OCR前预处理,提高文本识别精度。

Description

一种拍摄小票图像文本矫正和提取方法
技术领域
本发明涉及一种拍摄小票图像中文本矫正和提取技术,属于图像处理技术领域。
背景技术
购物小票多数不能作为正式发票使用,其上面一般有在多长时间之内可以开发票的说明。可以开发票的购物小票需要将其信息录入计算机,用发票的模版打印出来,这样就可以作为发票使用,且这种趋势越来越明显。此外,当出现售后纠纷时需要顾客出示购物小票,收银人员现场向系统录入小票信息查验核实,处理纠纷。录入小票后也会方便后续管理。
有许多场合需要向计算机系统录入小票,传统手工录入小票耗时且效率低,需要借助OCR技术进行自动识别和处理。但客户手中的小票往往会出现褶皱、弯折等,手机或其它移动设备拍摄角度多样、拍摄背景复杂,导致拍摄的图像文本比扫描复印的图像文本识别难度大,识别精度低。因此,对拍摄的小票图像进行预处理,矫正和提取其中的文本对提高OCR识别精度至关重要。
发明内容
本发明的目的是为了克服现有技术的缺陷,提供一种拍摄小票图像文本矫正和提取方法,可以有效提高OCR识别率,节省人力成本和时间成本。
为达到上述目的,本发明采用的技术方案是:一种拍摄小票图像文本矫正和提取方法,其包含以下步骤:
步骤一,提取小票边缘像素
本发明对原图像中间40*40像素区域采样,将所得像素聚成两类,取聚类中心得到RGB值较小的印刷文本颜色,RGB值较大的为纸张颜色,由此判断原图像中像素是否属于小票像素,去除非小票像素,得到小票像素的掩模图,再提取掩模图跳变像素,即得到小票的边缘像素。
步骤二,拟合边缘像素
通过概率霍夫变换找到小票轮廓小线段。
步骤三,小线段分类
对步骤二得到的线段分成4类,分别是上线段、下线段、左线段、右线段。
步骤四,小线段拼接
调整线段端点,使小的为起点,大的为终点。将所有线段按照起点排序。排序后去除重复线段,如重规则如下:
(1)一端靠近且斜率相近;
(2)去除靠内侧或较短的线。
对长度有重合的部分线段进行合并、重组。再通过延长、平移将边线补齐,最后连接四边边线,形成闭合区域。
步骤五,计算角点
根据相邻线段的斜率差查找左右边线角点,同时权衡线段的长度对小票弯折情况的影响,对长线段斜率差进行相应惩罚。查找完左右边线角点,进行角点匹配。匹配完后通过角点将小票从弯折处附近将小票图像分成多个子图。
步骤六,子图矫正
通过透视变换依次将畸变的子图拉正。
步骤七,文本行检测
对二值图像进行膨胀,将左右文字连通,使用最小外接矩形框包围单行文本连通区域,去除非文本行,检出文本行;
步骤八,新小票文本图像合成
对所有倾斜的文本行进行倾斜矫正,按文本行框在原图位置依次将文本行图像复制到新的空白图像中,控制上下行距与左右留白。
进一步的,所述步骤四中线段拼接完毕后根据文本距离调整,使其不碰到文字,且不出纸面。
进一步的,所述步骤五中角点匹配,一个左角点需要有一个右角点进行匹配,若当前右角点未匹配到左角点,则去掉此右角点;若当前左角点未匹配到右角点,则去掉此左角点。
进一步的,所述步骤五中角点匹配完成后,微调角点上下位置,使左右角点连线避免切到文本。
进一步的,所述步骤七中图像膨胀方向为水平方向。
进一步的,所述步骤七中去除非文本行:统计平均行高,去除行高大于1.5倍或小于0.5倍平均行高的行,这些矩形框是LOGO图案等非文本行。
有益效果:
本发明提供一种拍摄小票图像文本矫正和提取方法,相比现有技术,具有以下有益效果:
本发明方法在二值图像的基础上,利用纸张的颜色信息,提取了小票的掩模图,有效去除了复杂背景对小票边缘提取的影响。本发明方法能够处理不同光照环境、不同弯折程度的拍摄小票图像,相对于直接对原图进行文本识别,提高了拍摄小票的文本识别准确率。
附图说明
图1是本发明的一种拍摄小票图像文本矫正和提取方法步骤流程示意图;
图2是本发明的实例原始图;
图3是本发明的实例自适应二值图;
图4是本发明的小票像素掩模图;
图5是本发明的线段拼接图;
图6是本发明的角点查找图;
图7是本发明的新小票文本合成图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下将结合附图和具体实施例,对本发明做进一步说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1到图7所示,本发明公开的一种拍摄小票图像文本矫正和提取方法,其包括以下步骤:
步骤一,传统方法是直接对原图进行二值化提取纸张边缘,但由于拍摄的图像背景杂乱,直接二值化效果并不理想。本发明对原图像中间40*40像素区域采样,将所得像素聚成两类,取聚类中心得到RGB值较小的印刷文本颜色,RGB值较大的为纸张颜色。判定原图像中像素是否属于小票像素,去除非小票像素,判定规则如下:
(1-1)使用1标记小票像素、0标记非小票像素,原图每个像素位置标记1;
(1-2)从四周往中间搜索,四周5个像素判定为非小票边缘像素,标记0;
(1-3)从左往右搜索,若原图当前像素右边11个像素中有大于等于5个像素为纸张背景颜色,判定当前像素为小票像素,停止此方向搜索;否则判定当前像素为非小票像素,标记0,继续此方向搜索;
(1-4)从右往左搜索,原图当前像素左边11个像素中有大于等于5个像素为纸张背景颜色,判定当前像素为小票像素,停止此方向搜索;否则判定当前像素为非小票像素,标记0,继续此方向搜索;
(1-5)从上往下搜索,原图当前像素下方11个像素中有大于等于5个像素为纸张背景颜色,判定当前像素为小票像素,停止此方向搜索;否则判定当前像素为非小票像素,标记0,继续此方向搜索;
(1-6)从下往上搜索,原图当前像素11个像素中有大于等于5个像素为纸张背景颜色,判定判定当前像素为小票像素,停止此方向搜索;否则判定当前像素为非小票像素,标记0,继续此方向搜索。
其中规则1和规则2先于规则3到6,规则3到6之间无先后顺序,可并行或串行搜索。通过上述判定规则即可得到是否为小票像素的掩模图,再提取掩模图跳变像素,即得到小票的边缘像素。
步骤二,通过概率霍夫变换找到小票轮廓小线段。
步骤三,将步骤二得到的小线段按位置分成4类,分别是上线段、下线段、左线段、右线段,分类规则如下:
(3-1)根据线段斜率,将线段分成水平线段和竖直线段;
(3-2)在分平线段中,统计所有分平线段中心点竖直方向坐标,计算均值,竖直方向坐标值小于均值的为上线段,否则为下线段
(3-3)在竖直线段中,统计所有竖直线段中心点水平方向坐标,计算均值,水平方向坐标值小于均值的为左线段,否则为右线段;
(3-4)未分类的线段去除。
步骤四,调整线段端点,使小的为起点,大的为终点。将所有线段按照起点排序。排序后去除重复线段,如重规则如下:
(4-1)一端靠近且斜率相近;
(4-2)去除靠内侧或较短的线。
对长度有重合的线段进行合并、重组,通过延长、平移将边线补齐,连接四边边线,形成闭合区域。线段拼接完毕后根据文本距离调整,使其不碰到文字,且不出纸面。
步骤五,计算角点。根据相邻线段的斜率差查找左右边线角点,权衡线段的长度对小票弯折情况的影响,对长线段斜率差进行相应惩罚。查找完左右边线角点,进行角点匹配,一个左角点需要有一个右角点进行匹配,若当前右角点未匹配到左角点,则去掉此右角点;若当前左角点未匹配到右角点,则去掉此左角点。匹配完成后,微调角点上下位置,使左右角点连线避免切到文本。通过角点将小票从弯折处附近分成多个子图。
步骤六,通过透视变换依次将畸变的子图拉正;
步骤七,对小票区域原图使用OTSU法二值化,在水平方向对文本行膨胀,将左右文字连通,使用最小外接矩形框包围单行文本连通区域。统计平均行高,去除行高大于1.5倍或小于0.5倍平均行高的行,这些矩形框是LOGO图案等非文本行。
步骤八,新小票文本图像合成。按每个最小外接矩形框位置分行,对倾斜的行进行旋转,使矩形水平。按文本行框在原图位置依次将文本图像复制到新的空白图像中,控制上下行距与左右留白。
尽管这里参照本发明的解释性实施例对本发明进行了描述,但是,应该理解,本领域技术人员可以设计出很多其他的修改和实施方式,这些修改和实施方式将落在本申请公开的原则范围和精神之内。更具体地说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

Claims (6)

1.一种拍摄小票图像文本矫正和提取方法,其特征在于,包括以下步骤:
提取小票边缘像素,根据纸张颜色去除非小票像素,得到小票像素的掩模图,由此提取小票的边缘像素;
通过概率霍夫变换找到小票轮廓线段;
将线段分成上下左右4类;
对线段进行拼接,调整线段端点,使小的为起点,大的为终点,将所有线段按照起点排序,排序后去除重复线段,对长度有重合的线段进行合并、重组,再通过延长、平移将边线补齐,最后连接四边边线,形成闭合区域;
计算角点,根据相邻线段的斜率差查找左右边线角点,匹配角点,通过角点将小票图像分成多个子图;
子图矫正,通过透视变换依次将畸变的子图拉正;
文本行检测,对二值图像进行膨胀,将左右文字连通,使用最小外接矩形框包围单行文本连通区域,去除非文本行,检出文本行;
合成新文本图像,对所有倾斜的文本行进行倾斜矫正,按文本行框在原图位置按照上下、左右顺序合成新文本图像。
2.根据权利要求1所述的一种拍摄小票图像文本矫正和提取方法,其特征在于:所述步骤(4)中线段拼接后调整边线与文本距离,使其不碰到文字,且不出纸面。
3.根据权利要求1所述的一种拍摄小票图像文本矫正和提取方法,其特征在于,所述步骤(5)中角点匹配,一个左角点需要有一个右角点进行匹配,若当前右角点未匹配到左角点,则去掉此右角点;若当前左角点未匹配到右角点,则去掉此左角点。
4.根据权利要求1所述的一种拍摄小票图像文本矫正和提取方法,其特征在于,所述步骤(5)中角点匹配完成后,微调角点上下位置,使左右角点连线避免切到文本。
5.根据权利要求1所述的一种拍摄小票图像文本矫正和提取方法,其特征在于,所述步骤(7)中图像膨胀方向为水平方向。
6.根据权利要求1所述的一种拍摄小票图像文本矫正和提取方法,其特征在于,所述步骤(7)中去除非文本行的方法如下:统计平均行高,去除行高大于1.5倍或小于0.5倍平均行高的行,这些矩形框是LOGO图案等非文本行。
CN201910018095.2A 2019-01-09 2019-01-09 一种拍摄小票图像文本矫正和提取方法 Pending CN109871844A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910018095.2A CN109871844A (zh) 2019-01-09 2019-01-09 一种拍摄小票图像文本矫正和提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910018095.2A CN109871844A (zh) 2019-01-09 2019-01-09 一种拍摄小票图像文本矫正和提取方法

Publications (1)

Publication Number Publication Date
CN109871844A true CN109871844A (zh) 2019-06-11

Family

ID=66917441

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910018095.2A Pending CN109871844A (zh) 2019-01-09 2019-01-09 一种拍摄小票图像文本矫正和提取方法

Country Status (1)

Country Link
CN (1) CN109871844A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110335280A (zh) * 2019-07-05 2019-10-15 湖南联信科技有限公司 一种基于移动端的金融单据图像分割与矫正方法
CN111209912A (zh) * 2020-01-13 2020-05-29 昆明理工大学 一种中文文字图片长干扰线去除方法
CN112241714A (zh) * 2020-10-22 2021-01-19 北京字跳网络技术有限公司 图像中指定区域的识别方法、装置、可读介质和电子设备
CN112396056A (zh) * 2020-12-09 2021-02-23 杭州米数科技有限公司 对文本图片ocr结果进行高准确率分行的方法
CN112749694A (zh) * 2021-01-20 2021-05-04 中科云谷科技有限公司 用于识别图像方向、识别铭牌文字的方法及装置
CN113850805A (zh) * 2021-11-29 2021-12-28 北京世纪好未来教育科技有限公司 多文档检测方法、装置、电子设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101097601A (zh) * 2006-06-26 2008-01-02 北京航空航天大学 一种基于角点引导的图像快速边缘匹配方法
US20090285482A1 (en) * 2008-05-19 2009-11-19 Microsoft Corporation Detecting text using stroke width based text detection
CN104298982A (zh) * 2013-07-16 2015-01-21 深圳市腾讯计算机系统有限公司 一种文字识别方法及装置
CN105096299A (zh) * 2014-05-08 2015-11-25 北京大学 多边形检测方法和多边形检测装置
US9367736B1 (en) * 2015-09-01 2016-06-14 Amazon Technologies, Inc. Text detection using features associated with neighboring glyph pairs
CN108345881A (zh) * 2018-02-01 2018-07-31 福州大学 一种基于计算机视觉的文档质量检测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101097601A (zh) * 2006-06-26 2008-01-02 北京航空航天大学 一种基于角点引导的图像快速边缘匹配方法
US20090285482A1 (en) * 2008-05-19 2009-11-19 Microsoft Corporation Detecting text using stroke width based text detection
CN104298982A (zh) * 2013-07-16 2015-01-21 深圳市腾讯计算机系统有限公司 一种文字识别方法及装置
CN105096299A (zh) * 2014-05-08 2015-11-25 北京大学 多边形检测方法和多边形检测装置
US9367736B1 (en) * 2015-09-01 2016-06-14 Amazon Technologies, Inc. Text detection using features associated with neighboring glyph pairs
CN108345881A (zh) * 2018-02-01 2018-07-31 福州大学 一种基于计算机视觉的文档质量检测方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110335280A (zh) * 2019-07-05 2019-10-15 湖南联信科技有限公司 一种基于移动端的金融单据图像分割与矫正方法
CN111209912A (zh) * 2020-01-13 2020-05-29 昆明理工大学 一种中文文字图片长干扰线去除方法
CN112241714A (zh) * 2020-10-22 2021-01-19 北京字跳网络技术有限公司 图像中指定区域的识别方法、装置、可读介质和电子设备
CN112241714B (zh) * 2020-10-22 2024-04-26 北京字跳网络技术有限公司 图像中指定区域的识别方法、装置、可读介质和电子设备
CN112396056A (zh) * 2020-12-09 2021-02-23 杭州米数科技有限公司 对文本图片ocr结果进行高准确率分行的方法
CN112396056B (zh) * 2020-12-09 2022-04-19 杭州米数科技有限公司 对文本图片ocr结果进行高准确率分行的方法
CN112749694A (zh) * 2021-01-20 2021-05-04 中科云谷科技有限公司 用于识别图像方向、识别铭牌文字的方法及装置
CN112749694B (zh) * 2021-01-20 2024-05-21 中科云谷科技有限公司 用于识别图像方向、识别铭牌文字的方法及装置
CN113850805A (zh) * 2021-11-29 2021-12-28 北京世纪好未来教育科技有限公司 多文档检测方法、装置、电子设备及存储介质
CN113850805B (zh) * 2021-11-29 2022-02-22 北京世纪好未来教育科技有限公司 多文档检测方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN109871844A (zh) 一种拍摄小票图像文本矫正和提取方法
CN109740548B (zh) 一种报销票据图像分割方法及系统
CN106875546B (zh) 一种增值税发票的识别方法
US6917706B2 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
CN103942797B (zh) 基于直方图和超像素的场景图像文字检测方法及系统
US5828771A (en) Method and article of manufacture for determining whether a scanned image is an original image or fax image
AU696889B2 (en) System and method for automatic page registration and automatic zone detection during forms processing
US8787671B2 (en) Character recognition preprocessing method and apparatus
CN103034848B (zh) 一种表单类型的识别方法
CN108830133B (zh) 合同影像图片的识别方法、电子装置及可读存储介质
US7170647B2 (en) Document processing apparatus and method
CN101807257A (zh) 图像标签信息识别方法
US6014450A (en) Method and apparatus for address block location
CN104361336A (zh) 一种水下视频图像的文字识别方法
CN109409356B (zh) 一种基于swt的多方向中文印刷体文字检测方法
CN102426649A (zh) 一种简单的高准确率的钢印数字自动识别方法
CN107122775A (zh) 一种基于特征匹配的安卓手机身份证字符识别方法
Liu et al. A novel multi-oriented chinese text extraction approach from videos
Brisinello et al. Optical Character Recognition on images with colorful background
CN109741273A (zh) 一种手机拍照低质图像的自动处理与评分方法
CN108427954B (zh) 一种标牌信息采集与识别系统
CN111401364A (zh) 一种基于颜色特征和模板匹配相结合的车牌定位算法
CN112329641B (zh) 一种表格识别方法、装置、设备及可读存储介质
CN113569859A (zh) 一种图像处理方法、装置、电子设备及存储介质
WO2022082431A1 (en) Systems and methods for extracting information from paper media based on depth information

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190611

RJ01 Rejection of invention patent application after publication