CN108146093B - 一种去除票据印章的方法 - Google Patents
一种去除票据印章的方法 Download PDFInfo
- Publication number
- CN108146093B CN108146093B CN201711287401.XA CN201711287401A CN108146093B CN 108146093 B CN108146093 B CN 108146093B CN 201711287401 A CN201711287401 A CN 201711287401A CN 108146093 B CN108146093 B CN 108146093B
- Authority
- CN
- China
- Prior art keywords
- image
- region
- bill
- seal
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B41—PRINTING; LINING MACHINES; TYPEWRITERS; STAMPS
- B41M—PRINTING, DUPLICATING, MARKING, OR COPYING PROCESSES; COLOUR PRINTING
- B41M7/00—After-treatment of prints, e.g. heating, irradiating, setting of the ink, protection of the printed stock
- B41M7/0009—Obliterating the printed matter; Non-destructive removal of the ink pattern, e.g. for repetitive use of the support
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/255—Detecting or recognising potential candidate objects based on visual cues, e.g. shapes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/32—Normalisation of the pattern dimensions
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明涉及一种去除票据印章的方法,包括以下步骤:步骤110,获取票据图像;步骤120,在步骤110后对票据图像进行预处理;步骤130,在步骤120后,通过对RGB各颜色通道的处理以及形态学处理提取出印章的候选区域;步骤140,步骤130后,在印章候选区域内通过颜色比例的方法得到印章的区域;步骤150,输出印章的mask图;获取所需票据图像后一次性去除票据上的印章,为后续票据的扫描扫除了部分障碍。
Description
技术领域
本发明属于图像处理领域,具体涉及一种去除票据印章的方法。
背景技术
票据扫描识别技术,在一定条件下提高了票据的数字化效率,降低业务人员的工作强度,有效地提高数据的准确性或精细化。然而印章因其有维护票据法律有效性,被广泛应用,其形状和颜色的多样性,给票据图像字符识别带来了不小的挑战。票据图像字符识别是票据自动处理中的核心技术,如何得到尽可能干净的字符是图像字符识别的关键步骤,直接关系着后续字符的识别率;因此提供一种去除票据印章的方法成为本领域人员亟需解决的一个问题。
发明内容
为解决上述技术问题,本发明提供一种去除票据印章的方法,包括以下步骤:
步骤110,获取票据图像;
步骤120,对步骤110获取的票据图像进行预处理;
步骤130,在步骤200后,通过对RGB各颜色通道的处理以及形态学处理提取出印章的候选区域;
步骤140,步骤130后,在印章候选区域内通过颜色比例的方法得到印章的区域;
步骤150,输出印章的mask图。
采用上述方案的有益效果是:获取所需票据图像后一次性去除票据上的印章,为后续票据的扫描扫除了部分障碍。
进一步的,所述步骤100具体包括以下步骤:
步骤110,获取票据图像数据;该步骤是通过以下任意一种方法获得图像数据的:
(1)用数码相机拍摄得到的图像数据;
(2)用手机拍摄得到的图像数据;
(3)用扫描仪得到的图像数据;
(4)打开一个预先存在的包含影像图像数据的文件,读取该文件中的数据并按照标准算法解压后得到的图像数据。
进一步的,步骤120具体包括以下步骤:
步骤210,去黑边:求图像RGB三通道的均值,在图像上下边界占图像高度5%的范围和图像左右边界占图像宽度5%的范围内判断像素是否属于黑边,若像素属于黑边就所求均值进行漫水填充,直至所有范围内的所有像素处理完。
步骤220,图像转正:步骤210后,利用LSD进行直线检测,合并水平距离在图像宽度1%以及角度在9度范围内的直线,选取最长的一条直线,计算其角度,并按计算出的角度旋转图像。
步骤230,尺寸归一化:步骤220后,定位票据票据的4个顶点,按照给定票据模板大小,归一化图像尺寸。
步骤240,亮度归一化:步骤230后,求票据方框内所有像素的平均亮度,将图像归一化到设定的平均亮度值。采用上述进一步方案的有益效果是:对图像的黑边进行处理,去除了黑边对于去除印章的影响,调正方向后对票据进行定位并进行尺寸和亮度的归一化,使票据得以在稳定的状态下进行印章的去除。
进一步的,步骤130具体包括如下步骤:
步骤310,求B分量在RGB三分量中是最大值的区域;
步骤320,RGB转为HSV颜色空间,在步骤310得到的区域过滤掉灰色区域,HSV颜色空间部分灰色的H、S、V的范围是H>100、S>43且V>46。
步骤330,过滤掉小于5个像素的区域。
步骤340,步骤330后,对所得到的区域做膨胀腐蚀操作,得到印章的候选区域。采用上述进一步方案的有益效果是:得到预处理印章的候选区域,为后续的除章工作做铺垫。
进一步的,步骤140,具体包括如下步骤:
步骤410,分离RGB颜色通道,对B通道做OTSU操作,得到的区域记为otsu。
步骤420,计算图像的连通域,计算每个连通域的外接矩形,对每个矩形区域做步骤430-步骤460的处理;
步骤430,矩形区域与otsu进行与操作,得到区域1;
步骤440,在区域1的范围求B通道的颜色在RGB颜色通道中的比例大于k值的部分,得到区域2,k在[0.33,1]之间;
步骤450,在区域1的范围求B通道的值大于thresh值的部分,得到区域3,thresh在[100,155]之间;
步骤460,合并区域2和区域3;
步骤470,合并所有得到的区域。
步骤150,输出印章的mask图。
本发明的有益效果是:本发明提供一种去除票据印章的方法,利用图像处理技术准确定位印章所在位置并且提取出印章,输出印章的mask图,为后续的票据识别扫除了部分障碍。
附图说明
图1为本发明去除医疗票据中蓝色印章的流程图;
图2为步骤120医疗票据图像的预处理的具体步骤;
图3为步骤130获取蓝色印章的候选区域的具体步骤;
图4为步骤140获取最后蓝色印章的具体步骤;
图5为扫描到医疗票据示意图;
图6为医疗票据图像预处理后的图像;
图7为蓝色印章印章候选区域示意图;
图8为经本发明处理后得到的蓝色印章区域示意图。
具体实施方式
下面结合附图和实施例对本发明的进行详细的描述。
实施例一
请参阅图1,本发明揭示了一种去除票据印章的方法,所述方法包括如下步骤:
【步骤110】获取医疗票据图像数据。
获取图像数据的方法包括以下两种之一:
方法之一是用扫描仪得到的图像数据;
方法之二是打开一个预先存在的包含有图像数据的文件,读取该文件中的数据并按照标准算法解压缩后得到的图像数据。
【步骤120】医疗票据图像的预处理。
请参阅图2,步骤120具体包含如下步骤:
步骤210,去黑边:求图像RGB三通道的均值,在图像上下边界占图像高度5%的范围和图像左右边界占图像宽度5%的范围内判断像素是否属于黑边,若像素属于黑边就所求均值进行漫水填充,直至所有范围内的所有像素处理完;
步骤220,图像转正:步骤210后,利用LSD进行直线检测,合并水平距离在图像宽度1%以及角度在9度范围内的直线,选取最长的一条直线,计算其角度,并按计算出的角度旋转图像;
步骤230,尺寸归一化:步骤220后,定位票据表格的4个顶点,按照给定表格模板大小,归一化图像尺寸;
步骤240,亮度归一化:步骤230后,求表格方框内所有像素的平均亮度,将图像归一化到设定的平均亮度值。
【步骤130】在步骤120后,通过对RGB各颜色通道的处理以及形态学处理提取出蓝色印章的候选区域。
请参阅图3,步骤130具体包含如下步骤:
步骤310,求B分量在RGB三分量中是最大值的区域;
步骤320,RGB转为HSV颜色空间,在步骤310得到的区域过滤掉灰色区域,HSV颜色空间,部分灰色的H、S、V的范围是H>100且S>43且V>46;
步骤330,过滤掉小于5个像素的区域;
步骤340,步骤330后,对所得到的区域做膨胀腐蚀操作,得到蓝色印章的候选区域。
【步骤140】步骤130后,在蓝色印章候选区域内通过颜色比例的方法得到蓝色印章的区域。
请参阅图4,步骤140的具体步骤包含:
步骤410,分离RGB颜色通道,对B通道做OTSU操作,得到的区域记为otsu。
步骤420,计算图像的连通域,计算每个连通域的外接矩形,对每个矩形区域做步骤430-步骤460的处理;
步骤430,矩形区域与otsu进行与操作,得到区域1;
步骤440,在区域1的范围求B通道的颜色在RGB颜色通道中的比例大于k值的部分,得到区域2,k在[0.33,1]之间;
步骤450,在区域1的范围求B通道的值大于thresh值的部分,得到区域3,thresh在[100,155]之间;
步骤460,合并区域2和区域3;
步骤470,合并所有得到的区域。
【步骤150】结束,输出。
实施例二
在一般的计算机上,对扫描得到的上海市医疗门(急)诊收费票据如图5所示(图中对涉及个人隐私信息做了擦除处理),使用本发明所述的方法,经过步骤110获得影像的图像数据后,经过步骤120图像预处理后的结果如图6所示,步骤130处理后的结果如图7所示,执行完步骤140得到的蓝色印章的mask图,如图8所示。
实施例三
在智能手机上,该手机自带1200万像素的摄像头,使用本发明的方法,对拍摄得到的医疗票据图像,能够自动去除蓝色印章。
本发明提供一种去除票据图像上印章的方法,利用图像处理技术准确定位印章所在位置并且提取出印章,输出印章的mask图,为后续的票据识别扫除了部分障碍。
这里本发明的描述和应用都只是说明性的,并非是想要将本发明的范围限制在上述实施例中。这里所披露的实施例的变形和改变是完全可能的,对于那些本领域的普通技术人员来说,实施例的替换和等效的各种部件均是公知的。本领域技术人员还应该清楚的是,在不脱离本发明的精神或本质特征的情况下,本发明可以以其它形式、结构、布置、比例,以及用其它组件、材料和部件来实现,以及在不脱离本发明范围和精神的情况下,可以对这里所披露的实施例进行其它变形和改变。
Claims (1)
1.一种去除票据印章的方法,其特征在于,包括以下步骤:
步骤110,获取票据图像;
步骤120,对步骤110获取的票据图像进行预处理;
步骤130,在步骤120后,通过对RGB各颜色通道的处理以及形态学处理提取出印章的候选区域;
步骤140,步骤130后,在印章候选区域内通过颜色比例的方法得到印章的区域;
步骤150,输出印章的mask图;
所述步骤110是通过以下任意一种方法获得图像数据的:
(1)用数码相机拍摄得到的图像数据;
(2)用手机拍摄得到的图像数据;
(3)用扫描仪得到的图像数据;
(4)打开一个预先存在的包含影像图像数据的文件,读取该文件中的数据并按照标准算法解压后得到的图像数据;
所述步骤120中所述预处理具体包括如下步骤:
步骤210,去黑边:求图像RGB三通道的均值,在图像上下边界占图像高度5%的范围和图像左右边界占图像宽度5%的范围内判断像素是否属于黑边,若像素属于黑边就所求均值进行漫水填充,直至所有范围内的所有像素处理完;
步骤220,图像转正:步骤210后,利用LSD进行直线检测,合并水平距离在图像宽度1%以及角度在9度范围内的直线,选取最长的一条直线,计算其角度,并按计算出的角度旋转图像;
步骤230,尺寸归一化:步骤220后,定位票据票据的4个顶点,按照给定票据模板大小,归一化图像尺寸;
步骤240,亮度归一化:步骤230后,求票据方框内所有像素的平均亮度,将图像归一化到设定的平均亮度值;
所述步骤130通过所述RGB各颜色通道的处理以及形态学处理提取出印章的候选区域,具体包括如下步骤:
步骤310,求B分量在RGB三分量中是最大值的区域;
步骤320,RGB转为HSV颜色空间,在步骤310得到的区域过滤掉灰色区域,HSV颜色空间部分灰色的H、S、V的范围是H>100、S>43且V>46;
步骤330,过滤掉小于5个像素的区域;
步骤340,步骤330后,对所得到的剩余区域做膨胀腐蚀操作,得到印章的候选区域;
所述步骤140具体包括如下步骤:
步骤410,分离RGB颜色通道,对B通道做OTSU操作,得到的区域记为otsu;
步骤420,计算图像的连通域,计算每个连通域的外接矩形,对每个矩形区域做步骤430-步骤460的处理;
步骤430,矩形区域与otsu进行与操作,得到区域1;
步骤440,在区域1的范围求B通道的颜色在RGB颜色通道中的比例大于k值的部分,得到区域2,k在[0.33,1]之间;
步骤450,在区域1的范围求B通道的值大于thresh值的部分,得到区域3,thresh在[100,155]之间;
步骤460,合并区域2和区域3;
步骤470,合并区域1、区域2及区域3。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711287401.XA CN108146093B (zh) | 2017-12-07 | 2017-12-07 | 一种去除票据印章的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711287401.XA CN108146093B (zh) | 2017-12-07 | 2017-12-07 | 一种去除票据印章的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108146093A CN108146093A (zh) | 2018-06-12 |
CN108146093B true CN108146093B (zh) | 2020-03-13 |
Family
ID=62466653
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711287401.XA Expired - Fee Related CN108146093B (zh) | 2017-12-07 | 2017-12-07 | 一种去除票据印章的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108146093B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11790493B2 (en) | 2018-09-28 | 2023-10-17 | Pfu Limited | Image processing device, control method, and control program |
CN109376658B (zh) * | 2018-10-26 | 2022-03-08 | 信雅达科技股份有限公司 | 一种基于深度学习的ocr方法 |
CN109886974B (zh) * | 2019-01-28 | 2021-06-11 | 北京易道博识科技有限公司 | 一种印章去除方法 |
CN110598686B (zh) * | 2019-09-17 | 2023-08-04 | 携程计算机技术(上海)有限公司 | 发票的识别方法、系统、电子设备和介质 |
CN110826569B (zh) * | 2019-11-05 | 2022-07-19 | 泰康保险集团股份有限公司 | 票据图像的预处理方法、装置、介质及电子设备 |
CN111739013B (zh) * | 2020-06-30 | 2024-04-23 | 北京酷豹科技有限公司 | 基于图像处理的图像优化方法及相关装置 |
CN113128512A (zh) * | 2021-04-14 | 2021-07-16 | 浪潮天元通信信息系统有限公司 | 一种基于颜色通道去红章的方法及工具 |
CN114936965B (zh) * | 2022-06-07 | 2023-06-02 | 上海弘玑信息技术有限公司 | 一种印章去除方法、装置、设备及存储介质 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002109545A (ja) * | 2000-09-29 | 2002-04-12 | Oki Electric Ind Co Ltd | 印鑑照合装置 |
CN100399353C (zh) * | 2006-07-07 | 2008-07-02 | 中山大学 | 一种基于图像特征的电子印章认证方法 |
CN101576958B (zh) * | 2009-06-15 | 2013-08-14 | 西安交通大学 | 一种基于形状特征的带边框矩形印章图形提取方法 |
CN101894268B (zh) * | 2010-07-16 | 2012-05-23 | 西安理工大学 | 一种可消除底单干扰的印鉴真伪识别方法 |
CN102054168B (zh) * | 2010-12-23 | 2012-11-14 | 武汉大学苏州研究院 | 一种有价票据圆形印鉴识别方法 |
CN103440671B (zh) * | 2013-08-23 | 2016-12-28 | 方正国际软件有限公司 | 一种印章检测方法及系统 |
CN104408721B (zh) * | 2014-11-25 | 2017-02-22 | 西安交通大学 | 基于背景密度估计的印章图像提取方法 |
CN104463122A (zh) * | 2014-12-09 | 2015-03-25 | 四川大学 | 一种基于pcnn的印章识别方法 |
CN107358184A (zh) * | 2017-06-30 | 2017-11-17 | 中国科学院自动化研究所 | 文档文字的提取方法及提取装置 |
-
2017
- 2017-12-07 CN CN201711287401.XA patent/CN108146093B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN108146093A (zh) | 2018-06-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108146093B (zh) | 一种去除票据印章的方法 | |
EP2545499B1 (en) | Text enhancement of a textual image undergoing optical character recognition | |
CN109886974B (zh) | 一种印章去除方法 | |
CN104751142B (zh) | 一种基于笔划特征的自然场景文本检测方法 | |
US8200012B2 (en) | Image determination apparatus, image search apparatus and computer readable recording medium storing an image search program | |
CN106960208B (zh) | 一种仪表液晶数字自动切分和识别的方法及系统 | |
JP4646797B2 (ja) | 画像処理装置及びその制御方法、プログラム | |
Shen et al. | Improving OCR performance with background image elimination | |
US20070253040A1 (en) | Color scanning to enhance bitonal image | |
CN109409355B (zh) | 一种新型变压器铭牌识别的方法及装置 | |
CN112183038A (zh) | 一种表格识别套打方法、计算机设备及计算机可读存储介质 | |
CN111353961B (zh) | 一种文档曲面校正方法及装置 | |
CN108830857B (zh) | 一种自适应的汉字碑帖图像二值化分割方法 | |
Kumar et al. | Power-law transformation for enhanced recognition of born-digital word images | |
CN107195069A (zh) | 一种人民币冠字号自动识别方法 | |
CN104361335B (zh) | 一种基于扫描图像自动去除黑边的处理方法 | |
CN103020929A (zh) | 基于文字特征的碎纸机破碎文档恢复方法 | |
CN112364862B (zh) | 一种基于直方图相似度的扰动变形汉字图片匹配的方法 | |
US7668394B2 (en) | Background intensity correction of a scan of a document | |
JP2005346137A (ja) | 関数化処理方法、関数近似処理装置及び画像処理装置 | |
CN110929562A (zh) | 一种基于改进Hough变换的答题卡识别方法 | |
CN116052152A (zh) | 一种基于轮廓检测和深度神经网络的车牌识别系统 | |
Leung et al. | A new approach for image enhancement applied to low-contrast–low-illumination IC and document images | |
CN108205678B (zh) | 一种含有亮斑干扰的铭牌文字识别处理方法 | |
CN111445402B (zh) | 一种图像去噪方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP02 | Change in the address of a patent holder | ||
CP02 | Change in the address of a patent holder |
Address after: Room 110490, building 1, No.2 Haide Road, Nantong Development Zone, Jiangsu Province Patentee after: SHANGHAI ZHUAIAI INTELLIGENT TECHNOLOGY Co.,Ltd. Address before: 225700 276 East Luo village, Xinghua, Taizhou, Jiangsu Patentee before: SHANGHAI ZHUAIAI INTELLIGENT TECHNOLOGY Co.,Ltd. |
|
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20200313 Termination date: 20201207 |