CN109871844A - 一种拍摄小票图像文本矫正和提取方法 - Google Patents
一种拍摄小票图像文本矫正和提取方法 Download PDFInfo
- Publication number
- CN109871844A CN109871844A CN201910018095.2A CN201910018095A CN109871844A CN 109871844 A CN109871844 A CN 109871844A CN 201910018095 A CN201910018095 A CN 201910018095A CN 109871844 A CN109871844 A CN 109871844A
- Authority
- CN
- China
- Prior art keywords
- text
- receipt
- image
- line
- point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
Abstract
本发明公开了一种拍摄小票图像文本矫正和提取方法,方法首先根据纸张颜色去除非小票像素得到掩模图,再由掩模图提取小票边缘像素,拟合边缘像素得到多条小线段;拼接小线段,连接四边边线,形成闭合区域;计算角点,进行角点匹配,通过角点将小票分成多个子图进行矫正;对二值图像进行膨胀,将左右文字连通,检出文本行,对所有倾斜的文本行进行倾斜矫正,按文本行框在原图位置合成新文本图像。本发明应用于小票OCR前预处理,提高文本识别精度。
Description
技术领域
本发明涉及一种拍摄小票图像中文本矫正和提取技术,属于图像处理技术领域。
背景技术
购物小票多数不能作为正式发票使用,其上面一般有在多长时间之内可以开发票的说明。可以开发票的购物小票需要将其信息录入计算机,用发票的模版打印出来,这样就可以作为发票使用,且这种趋势越来越明显。此外,当出现售后纠纷时需要顾客出示购物小票,收银人员现场向系统录入小票信息查验核实,处理纠纷。录入小票后也会方便后续管理。
有许多场合需要向计算机系统录入小票,传统手工录入小票耗时且效率低,需要借助OCR技术进行自动识别和处理。但客户手中的小票往往会出现褶皱、弯折等,手机或其它移动设备拍摄角度多样、拍摄背景复杂,导致拍摄的图像文本比扫描复印的图像文本识别难度大,识别精度低。因此,对拍摄的小票图像进行预处理,矫正和提取其中的文本对提高OCR识别精度至关重要。
发明内容
本发明的目的是为了克服现有技术的缺陷,提供一种拍摄小票图像文本矫正和提取方法,可以有效提高OCR识别率,节省人力成本和时间成本。
为达到上述目的,本发明采用的技术方案是:一种拍摄小票图像文本矫正和提取方法,其包含以下步骤:
步骤一,提取小票边缘像素
本发明对原图像中间40*40像素区域采样,将所得像素聚成两类,取聚类中心得到RGB值较小的印刷文本颜色,RGB值较大的为纸张颜色,由此判断原图像中像素是否属于小票像素,去除非小票像素,得到小票像素的掩模图,再提取掩模图跳变像素,即得到小票的边缘像素。
步骤二,拟合边缘像素
通过概率霍夫变换找到小票轮廓小线段。
步骤三,小线段分类
对步骤二得到的线段分成4类,分别是上线段、下线段、左线段、右线段。
步骤四,小线段拼接
调整线段端点,使小的为起点,大的为终点。将所有线段按照起点排序。排序后去除重复线段,如重规则如下:
(1)一端靠近且斜率相近;
(2)去除靠内侧或较短的线。
对长度有重合的部分线段进行合并、重组。再通过延长、平移将边线补齐,最后连接四边边线,形成闭合区域。
步骤五,计算角点
根据相邻线段的斜率差查找左右边线角点,同时权衡线段的长度对小票弯折情况的影响,对长线段斜率差进行相应惩罚。查找完左右边线角点,进行角点匹配。匹配完后通过角点将小票从弯折处附近将小票图像分成多个子图。
步骤六,子图矫正
通过透视变换依次将畸变的子图拉正。
步骤七,文本行检测
对二值图像进行膨胀,将左右文字连通,使用最小外接矩形框包围单行文本连通区域,去除非文本行,检出文本行;
步骤八,新小票文本图像合成
对所有倾斜的文本行进行倾斜矫正,按文本行框在原图位置依次将文本行图像复制到新的空白图像中,控制上下行距与左右留白。
进一步的,所述步骤四中线段拼接完毕后根据文本距离调整,使其不碰到文字,且不出纸面。
进一步的,所述步骤五中角点匹配,一个左角点需要有一个右角点进行匹配,若当前右角点未匹配到左角点,则去掉此右角点;若当前左角点未匹配到右角点,则去掉此左角点。
进一步的,所述步骤五中角点匹配完成后,微调角点上下位置,使左右角点连线避免切到文本。
进一步的,所述步骤七中图像膨胀方向为水平方向。
进一步的,所述步骤七中去除非文本行:统计平均行高,去除行高大于1.5倍或小于0.5倍平均行高的行,这些矩形框是LOGO图案等非文本行。
有益效果:
本发明提供一种拍摄小票图像文本矫正和提取方法,相比现有技术,具有以下有益效果:
本发明方法在二值图像的基础上,利用纸张的颜色信息,提取了小票的掩模图,有效去除了复杂背景对小票边缘提取的影响。本发明方法能够处理不同光照环境、不同弯折程度的拍摄小票图像,相对于直接对原图进行文本识别,提高了拍摄小票的文本识别准确率。
附图说明
图1是本发明的一种拍摄小票图像文本矫正和提取方法步骤流程示意图;
图2是本发明的实例原始图;
图3是本发明的实例自适应二值图;
图4是本发明的小票像素掩模图;
图5是本发明的线段拼接图;
图6是本发明的角点查找图;
图7是本发明的新小票文本合成图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下将结合附图和具体实施例,对本发明做进一步说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1到图7所示,本发明公开的一种拍摄小票图像文本矫正和提取方法,其包括以下步骤:
步骤一,传统方法是直接对原图进行二值化提取纸张边缘,但由于拍摄的图像背景杂乱,直接二值化效果并不理想。本发明对原图像中间40*40像素区域采样,将所得像素聚成两类,取聚类中心得到RGB值较小的印刷文本颜色,RGB值较大的为纸张颜色。判定原图像中像素是否属于小票像素,去除非小票像素,判定规则如下:
(1-1)使用1标记小票像素、0标记非小票像素,原图每个像素位置标记1;
(1-2)从四周往中间搜索,四周5个像素判定为非小票边缘像素,标记0;
(1-3)从左往右搜索,若原图当前像素右边11个像素中有大于等于5个像素为纸张背景颜色,判定当前像素为小票像素,停止此方向搜索;否则判定当前像素为非小票像素,标记0,继续此方向搜索;
(1-4)从右往左搜索,原图当前像素左边11个像素中有大于等于5个像素为纸张背景颜色,判定当前像素为小票像素,停止此方向搜索;否则判定当前像素为非小票像素,标记0,继续此方向搜索;
(1-5)从上往下搜索,原图当前像素下方11个像素中有大于等于5个像素为纸张背景颜色,判定当前像素为小票像素,停止此方向搜索;否则判定当前像素为非小票像素,标记0,继续此方向搜索;
(1-6)从下往上搜索,原图当前像素11个像素中有大于等于5个像素为纸张背景颜色,判定判定当前像素为小票像素,停止此方向搜索;否则判定当前像素为非小票像素,标记0,继续此方向搜索。
其中规则1和规则2先于规则3到6,规则3到6之间无先后顺序,可并行或串行搜索。通过上述判定规则即可得到是否为小票像素的掩模图,再提取掩模图跳变像素,即得到小票的边缘像素。
步骤二,通过概率霍夫变换找到小票轮廓小线段。
步骤三,将步骤二得到的小线段按位置分成4类,分别是上线段、下线段、左线段、右线段,分类规则如下:
(3-1)根据线段斜率,将线段分成水平线段和竖直线段;
(3-2)在分平线段中,统计所有分平线段中心点竖直方向坐标,计算均值,竖直方向坐标值小于均值的为上线段,否则为下线段
(3-3)在竖直线段中,统计所有竖直线段中心点水平方向坐标,计算均值,水平方向坐标值小于均值的为左线段,否则为右线段;
(3-4)未分类的线段去除。
步骤四,调整线段端点,使小的为起点,大的为终点。将所有线段按照起点排序。排序后去除重复线段,如重规则如下:
(4-1)一端靠近且斜率相近;
(4-2)去除靠内侧或较短的线。
对长度有重合的线段进行合并、重组,通过延长、平移将边线补齐,连接四边边线,形成闭合区域。线段拼接完毕后根据文本距离调整,使其不碰到文字,且不出纸面。
步骤五,计算角点。根据相邻线段的斜率差查找左右边线角点,权衡线段的长度对小票弯折情况的影响,对长线段斜率差进行相应惩罚。查找完左右边线角点,进行角点匹配,一个左角点需要有一个右角点进行匹配,若当前右角点未匹配到左角点,则去掉此右角点;若当前左角点未匹配到右角点,则去掉此左角点。匹配完成后,微调角点上下位置,使左右角点连线避免切到文本。通过角点将小票从弯折处附近分成多个子图。
步骤六,通过透视变换依次将畸变的子图拉正;
步骤七,对小票区域原图使用OTSU法二值化,在水平方向对文本行膨胀,将左右文字连通,使用最小外接矩形框包围单行文本连通区域。统计平均行高,去除行高大于1.5倍或小于0.5倍平均行高的行,这些矩形框是LOGO图案等非文本行。
步骤八,新小票文本图像合成。按每个最小外接矩形框位置分行,对倾斜的行进行旋转,使矩形水平。按文本行框在原图位置依次将文本图像复制到新的空白图像中,控制上下行距与左右留白。
尽管这里参照本发明的解释性实施例对本发明进行了描述,但是,应该理解,本领域技术人员可以设计出很多其他的修改和实施方式,这些修改和实施方式将落在本申请公开的原则范围和精神之内。更具体地说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (6)
1.一种拍摄小票图像文本矫正和提取方法,其特征在于,包括以下步骤:
提取小票边缘像素,根据纸张颜色去除非小票像素,得到小票像素的掩模图,由此提取小票的边缘像素;
通过概率霍夫变换找到小票轮廓线段;
将线段分成上下左右4类;
对线段进行拼接,调整线段端点,使小的为起点,大的为终点,将所有线段按照起点排序,排序后去除重复线段,对长度有重合的线段进行合并、重组,再通过延长、平移将边线补齐,最后连接四边边线,形成闭合区域;
计算角点,根据相邻线段的斜率差查找左右边线角点,匹配角点,通过角点将小票图像分成多个子图;
子图矫正,通过透视变换依次将畸变的子图拉正;
文本行检测,对二值图像进行膨胀,将左右文字连通,使用最小外接矩形框包围单行文本连通区域,去除非文本行,检出文本行;
合成新文本图像,对所有倾斜的文本行进行倾斜矫正,按文本行框在原图位置按照上下、左右顺序合成新文本图像。
2.根据权利要求1所述的一种拍摄小票图像文本矫正和提取方法,其特征在于:所述步骤(4)中线段拼接后调整边线与文本距离,使其不碰到文字,且不出纸面。
3.根据权利要求1所述的一种拍摄小票图像文本矫正和提取方法,其特征在于,所述步骤(5)中角点匹配,一个左角点需要有一个右角点进行匹配,若当前右角点未匹配到左角点,则去掉此右角点;若当前左角点未匹配到右角点,则去掉此左角点。
4.根据权利要求1所述的一种拍摄小票图像文本矫正和提取方法,其特征在于,所述步骤(5)中角点匹配完成后,微调角点上下位置,使左右角点连线避免切到文本。
5.根据权利要求1所述的一种拍摄小票图像文本矫正和提取方法,其特征在于,所述步骤(7)中图像膨胀方向为水平方向。
6.根据权利要求1所述的一种拍摄小票图像文本矫正和提取方法,其特征在于,所述步骤(7)中去除非文本行的方法如下:统计平均行高,去除行高大于1.5倍或小于0.5倍平均行高的行,这些矩形框是LOGO图案等非文本行。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910018095.2A CN109871844A (zh) | 2019-01-09 | 2019-01-09 | 一种拍摄小票图像文本矫正和提取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910018095.2A CN109871844A (zh) | 2019-01-09 | 2019-01-09 | 一种拍摄小票图像文本矫正和提取方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109871844A true CN109871844A (zh) | 2019-06-11 |
Family
ID=66917441
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910018095.2A Pending CN109871844A (zh) | 2019-01-09 | 2019-01-09 | 一种拍摄小票图像文本矫正和提取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109871844A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110335280A (zh) * | 2019-07-05 | 2019-10-15 | 湖南联信科技有限公司 | 一种基于移动端的金融单据图像分割与矫正方法 |
CN111209912A (zh) * | 2020-01-13 | 2020-05-29 | 昆明理工大学 | 一种中文文字图片长干扰线去除方法 |
CN112241714A (zh) * | 2020-10-22 | 2021-01-19 | 北京字跳网络技术有限公司 | 图像中指定区域的识别方法、装置、可读介质和电子设备 |
CN112396056A (zh) * | 2020-12-09 | 2021-02-23 | 杭州米数科技有限公司 | 对文本图片ocr结果进行高准确率分行的方法 |
CN112749694A (zh) * | 2021-01-20 | 2021-05-04 | 中科云谷科技有限公司 | 用于识别图像方向、识别铭牌文字的方法及装置 |
CN113850805A (zh) * | 2021-11-29 | 2021-12-28 | 北京世纪好未来教育科技有限公司 | 多文档检测方法、装置、电子设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101097601A (zh) * | 2006-06-26 | 2008-01-02 | 北京航空航天大学 | 一种基于角点引导的图像快速边缘匹配方法 |
US20090285482A1 (en) * | 2008-05-19 | 2009-11-19 | Microsoft Corporation | Detecting text using stroke width based text detection |
CN104298982A (zh) * | 2013-07-16 | 2015-01-21 | 深圳市腾讯计算机系统有限公司 | 一种文字识别方法及装置 |
CN105096299A (zh) * | 2014-05-08 | 2015-11-25 | 北京大学 | 多边形检测方法和多边形检测装置 |
US9367736B1 (en) * | 2015-09-01 | 2016-06-14 | Amazon Technologies, Inc. | Text detection using features associated with neighboring glyph pairs |
CN108345881A (zh) * | 2018-02-01 | 2018-07-31 | 福州大学 | 一种基于计算机视觉的文档质量检测方法 |
-
2019
- 2019-01-09 CN CN201910018095.2A patent/CN109871844A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101097601A (zh) * | 2006-06-26 | 2008-01-02 | 北京航空航天大学 | 一种基于角点引导的图像快速边缘匹配方法 |
US20090285482A1 (en) * | 2008-05-19 | 2009-11-19 | Microsoft Corporation | Detecting text using stroke width based text detection |
CN104298982A (zh) * | 2013-07-16 | 2015-01-21 | 深圳市腾讯计算机系统有限公司 | 一种文字识别方法及装置 |
CN105096299A (zh) * | 2014-05-08 | 2015-11-25 | 北京大学 | 多边形检测方法和多边形检测装置 |
US9367736B1 (en) * | 2015-09-01 | 2016-06-14 | Amazon Technologies, Inc. | Text detection using features associated with neighboring glyph pairs |
CN108345881A (zh) * | 2018-02-01 | 2018-07-31 | 福州大学 | 一种基于计算机视觉的文档质量检测方法 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110335280A (zh) * | 2019-07-05 | 2019-10-15 | 湖南联信科技有限公司 | 一种基于移动端的金融单据图像分割与矫正方法 |
CN111209912A (zh) * | 2020-01-13 | 2020-05-29 | 昆明理工大学 | 一种中文文字图片长干扰线去除方法 |
CN112241714A (zh) * | 2020-10-22 | 2021-01-19 | 北京字跳网络技术有限公司 | 图像中指定区域的识别方法、装置、可读介质和电子设备 |
CN112241714B (zh) * | 2020-10-22 | 2024-04-26 | 北京字跳网络技术有限公司 | 图像中指定区域的识别方法、装置、可读介质和电子设备 |
CN112396056A (zh) * | 2020-12-09 | 2021-02-23 | 杭州米数科技有限公司 | 对文本图片ocr结果进行高准确率分行的方法 |
CN112396056B (zh) * | 2020-12-09 | 2022-04-19 | 杭州米数科技有限公司 | 对文本图片ocr结果进行高准确率分行的方法 |
CN112749694A (zh) * | 2021-01-20 | 2021-05-04 | 中科云谷科技有限公司 | 用于识别图像方向、识别铭牌文字的方法及装置 |
CN112749694B (zh) * | 2021-01-20 | 2024-05-21 | 中科云谷科技有限公司 | 用于识别图像方向、识别铭牌文字的方法及装置 |
CN113850805A (zh) * | 2021-11-29 | 2021-12-28 | 北京世纪好未来教育科技有限公司 | 多文档检测方法、装置、电子设备及存储介质 |
CN113850805B (zh) * | 2021-11-29 | 2022-02-22 | 北京世纪好未来教育科技有限公司 | 多文档检测方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109871844A (zh) | 一种拍摄小票图像文本矫正和提取方法 | |
CN109740548B (zh) | 一种报销票据图像分割方法及系统 | |
CN106875546B (zh) | 一种增值税发票的识别方法 | |
US6917706B2 (en) | Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof | |
CN103942797B (zh) | 基于直方图和超像素的场景图像文字检测方法及系统 | |
US5828771A (en) | Method and article of manufacture for determining whether a scanned image is an original image or fax image | |
AU696889B2 (en) | System and method for automatic page registration and automatic zone detection during forms processing | |
US8787671B2 (en) | Character recognition preprocessing method and apparatus | |
CN103034848B (zh) | 一种表单类型的识别方法 | |
CN108830133B (zh) | 合同影像图片的识别方法、电子装置及可读存储介质 | |
US7170647B2 (en) | Document processing apparatus and method | |
CN101807257A (zh) | 图像标签信息识别方法 | |
US6014450A (en) | Method and apparatus for address block location | |
CN104361336A (zh) | 一种水下视频图像的文字识别方法 | |
CN109409356B (zh) | 一种基于swt的多方向中文印刷体文字检测方法 | |
CN102426649A (zh) | 一种简单的高准确率的钢印数字自动识别方法 | |
CN107122775A (zh) | 一种基于特征匹配的安卓手机身份证字符识别方法 | |
Liu et al. | A novel multi-oriented chinese text extraction approach from videos | |
Brisinello et al. | Optical Character Recognition on images with colorful background | |
CN109741273A (zh) | 一种手机拍照低质图像的自动处理与评分方法 | |
CN108427954B (zh) | 一种标牌信息采集与识别系统 | |
CN111401364A (zh) | 一种基于颜色特征和模板匹配相结合的车牌定位算法 | |
CN112329641B (zh) | 一种表格识别方法、装置、设备及可读存储介质 | |
CN113569859A (zh) | 一种图像处理方法、装置、电子设备及存储介质 | |
WO2022082431A1 (en) | Systems and methods for extracting information from paper media based on depth information |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190611 |
|
RJ01 | Rejection of invention patent application after publication |