CN104361335A - 一种基于扫描图像自动去除黑边的处理方法 - Google Patents

一种基于扫描图像自动去除黑边的处理方法 Download PDF

Info

Publication number
CN104361335A
CN104361335A CN201410612494.9A CN201410612494A CN104361335A CN 104361335 A CN104361335 A CN 104361335A CN 201410612494 A CN201410612494 A CN 201410612494A CN 104361335 A CN104361335 A CN 104361335A
Authority
CN
China
Prior art keywords
pixel
image
black surround
black
unicom
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410612494.9A
Other languages
English (en)
Other versions
CN104361335B (zh
Inventor
张惠斌
王长征
赵正桥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANXI TONGFANG ZHIWANG DIGITAL PUBLISHING TECHNOLOGY Co Ltd
Original Assignee
SHANXI TONGFANG ZHIWANG DIGITAL PUBLISHING TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANXI TONGFANG ZHIWANG DIGITAL PUBLISHING TECHNOLOGY Co Ltd filed Critical SHANXI TONGFANG ZHIWANG DIGITAL PUBLISHING TECHNOLOGY Co Ltd
Priority to CN201410612494.9A priority Critical patent/CN104361335B/zh
Publication of CN104361335A publication Critical patent/CN104361335A/zh
Application granted granted Critical
Publication of CN104361335B publication Critical patent/CN104361335B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/273Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion removing elements interfering with the pattern to be recognised

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于扫描图像自动去除黑边的处理方法,其包括:将扫描后的图像RGB转灰度,并对灰度二值化处理得到二值化图像;对二值化图像进行黑边粗分割;在图像粗分割的基础上进行图像细分割,即对粗分割后的版面进行分析,找出版面四角的定位块,和定位块粘连的黑像素为黑边像素,并在离边缘一定距离内找到联通域,计算联通域的特征;对所述联通域特征进行分析,并根据分析后的特征判断图像属于黑边或字体;通过所述版面分析和联通域特征查找黑边坐标,滤掉黑边。本发明解决了不同扫描图像的去黑边问题,方便了软件的后续处理,也给用户的阅读带来了便利。

Description

一种基于扫描图像自动去除黑边的处理方法
技术领域
本发明涉及扫描文档的电子化,尤其涉及基于扫描图像自动去除黑边的处理方法。 
背景技术
在纸制文件电子化的过程中,扫描后有很多有黑边的图片,一般的技术方法只是把离边缘固定宽度的像素值为白色,以达到去黑边的目的,但是扫描出来的图像类型多种多样,这样简单的技术达不到去黑边的效果,只能靠人力找黑边,手段去除,这样耗费了极大的人力。因此急需一种去黑边的方法把人们从这种繁琐的工作中解放出来。 
发明内容
为解决上述技术问题,本发明的目的是提供一种基于扫描图像自动去除黑边的处理方法,该方法解决了扫描后的图像自动去黑边的问题。 
本发明的目的通过以下的技术方案来实现: 
一种基于扫描图像自动去除黑边的处理方法,该方法包括以下步骤: 
将扫描后的图像RGB转灰度,并对灰度二值化处理得到二值化图像; 
对二值化图像进行黑边粗分割; 
在图像粗分割的基础上进行图像细分割,即对粗分割后的版面进行分析,找出版面四角的定位块,和定位块粘连的黑像素为黑边像素,并在离边缘一定距离内找到联通域,计算联通域的特征; 
对所述联通域特征进行分析,并根据分析后的特征判断图像属于黑边或字体; 
通过所述版面分析和联通域特征查找黑边坐标,滤掉黑边。 
与现有技术相比,本发明的一个或多个实施例可以具有如下优点: 
本发明基于扫描图像自动去除黑边的处理方法,综合了所有图像类型的特点,可以达到自动去黑边的功能,方便了软件的后续处理,也给用户的阅读带来了便利。 
附图说明
图1是基于扫描图像自动去除黑边的处理方法流程图; 
图2和图3是通过该方法处理黑边前和处理黑边后的示意图。 
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合实施例及附图对本发明作进一步详细的描述。 
如图1所示,为基于扫描图像自动去除黑边的处理方法流程,包括: 
将扫描后的图像RGB(Red Green Blue红绿蓝)转灰度,并对灰度二值化处理得到二值化图像; 
对二值化图像进行黑边粗分割;所述粗分割是将距离页面边缘10像素区域转为白色 
在图像粗分割的基础上进行图像细分割,即在粗分割后的版面上找出四角的定位块,和定位块粘连的黑像素为黑边像素,并在离边缘一定距离内找到联通域,计算联通域的特征; 
对所述联通域特征进行分析,并根据分析后的特征判断图像属于黑边或字体; 
通过所述版面分析和联通域特征查找黑边坐标,把坐标像素值设置为白边像素值即滤掉黑边。 
找到所述四角的定位块后,判断四角定位块的大小,该判断步骤包括:对不同图像进行分析,通过图像的大小确定四个定位块的大小,即将定位块的宽设为图像宽的0.1倍,色块的高设为图像高的0.03倍,可将黑边的边界联通的部位隔断。隔断的目的是防止相邻边界相连的黑边是凹多边形,凹多 边形只能拿坐标来记录黑边,内存占用和计算时间都会比较长。 
上述联通域的查找是通过估计黑边的最大范围,可以在这个范围内找到联通域,这样可以不需要遍历整幅图像,加快速度。 
上述联通域的特征包括:联通域的面积和长宽比例。 
上述联通域的查找步骤包括: 
从左向右,从上到下扫描二值化图像,判断每个像素点四邻域中的左、上有没有点,如果没有则认为是个新区域的开始; 
如果像素点四邻域中的最左有像素点而上没有像素点,则标记此像素点为最左值;如果像素点四邻域的最左没有像素点而上有像素点,则标记为此像素点为最上点的值; 
如果此像素点的四邻域中最左和最上都有像素点,则标记此像素点为最左和最上两个像素点中最小的标记点,并修改大标记为小标记。 
分析每个联通域特征是否满足黑边的形状,这里特征区域所选的面积大于4000,长宽比例大于2倍。 
虽然本发明所揭露的实施方式如上,但所述的内容只是为了便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属技术领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式上及细节上作任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。 

Claims (5)

1.一种基于扫描图像自动去除黑边的处理方法,其特征在于,所述方法包括:
将扫描后的图像RGB转灰度,并对灰度二值化处理得到二值化图像;
对二值化图像进行黑边粗分割;
在图像粗分割的基础上进行图像细分割,即对粗分割后的版面进行分析,找出版面四角的定位块,和定位块粘连的黑像素为黑边像素,并在离边缘一定距离内找到联通域,计算联通域的特征;
对所述联通域特征进行分析,并根据分析后的特征判断图像属于黑边或字体;
通过所述版面分析和联通域特征查找黑边坐标,滤掉黑边。
2.根据权利要求1所述的基于扫描图像自动去除黑边的处理方法,其特征在于,所述粗分割是将距离页面边缘10像素区域转为白色。
3.根据权利要求1所述的基于扫描图像自动去除黑边的处理方法,其特征在于,找到所述四角的定位块后,判断四角定位块的大小,该判断步骤包括:对不同图像进行分析,通过图像的大小确定四个定位块的大小,即将定位块的宽设为图像宽的0.1倍,色块的高设为图像高的0.03倍,可将黑边的边界联通的部位隔断。
4.根据权利要求1所述的基于扫描图像自动去除黑边的处理方法,其特征在于,所述联通域的特征包括:联通域的面积和长宽比例。
5.根据权利要求1所述的基于扫描图像自动去除黑边的处理方法,其特征在于,所述所述联通域的查找步骤包括:
从左向右,从上到下扫描二值化图像,判断每个像素点四邻域中的左、上有没有点,如果没有则认为是个新区域的开始;
如果像素点四邻域中的最左有像素点而上没有像素点,则标记此像素点为最左值;如果像素点四邻域的最左没有像素点而上有像素点,则标记为此像素点为最上点的值;
如果此像素点的四邻域中最左和最上都有像素点,则标记此像素点为最左和最上两个像素点中最小的标记点,并修改大标记为小标记。
CN201410612494.9A 2014-11-03 2014-11-03 一种基于扫描图像自动去除黑边的处理方法 Active CN104361335B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410612494.9A CN104361335B (zh) 2014-11-03 2014-11-03 一种基于扫描图像自动去除黑边的处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410612494.9A CN104361335B (zh) 2014-11-03 2014-11-03 一种基于扫描图像自动去除黑边的处理方法

Publications (2)

Publication Number Publication Date
CN104361335A true CN104361335A (zh) 2015-02-18
CN104361335B CN104361335B (zh) 2017-07-07

Family

ID=52528593

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410612494.9A Active CN104361335B (zh) 2014-11-03 2014-11-03 一种基于扫描图像自动去除黑边的处理方法

Country Status (1)

Country Link
CN (1) CN104361335B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107516085A (zh) * 2017-09-01 2017-12-26 山西同方知网数字出版技术有限公司 一种基于文档图像自动去除黑边的方法
CN109146809A (zh) * 2018-08-02 2019-01-04 电子科技大学 一种对扫描文档图像进行去灰边的方法
CN110991451A (zh) * 2019-11-01 2020-04-10 珠海奔图电子有限公司 扫描图像的卡片区域图像的校正方法及装置
CN111563485A (zh) * 2019-10-24 2020-08-21 中国人民解放军63653部队 一种纸质文档电子扫描图像黑边去除方法
CN111739013A (zh) * 2020-06-30 2020-10-02 北京酷豹科技有限公司 基于图像处理的图像优化方法及相关装置
CN112634229A (zh) * 2020-12-22 2021-04-09 北京华宇信息技术有限公司 图像去除黑边的方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012005062A (ja) * 2010-06-21 2012-01-05 Sharp Corp 画像処理装置、画像読取装置、画像形成装置、画像処理方法、コンピュータプログラム及び記録媒体
CN102497488A (zh) * 2011-11-30 2012-06-13 广东威创视讯科技股份有限公司 一种图像黑边去除方法和装置
CN103369205A (zh) * 2012-03-26 2013-10-23 宇龙计算机通信科技(深圳)有限公司 移动终端和视频图像处理方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012005062A (ja) * 2010-06-21 2012-01-05 Sharp Corp 画像処理装置、画像読取装置、画像形成装置、画像処理方法、コンピュータプログラム及び記録媒体
CN102497488A (zh) * 2011-11-30 2012-06-13 广东威创视讯科技股份有限公司 一种图像黑边去除方法和装置
CN103369205A (zh) * 2012-03-26 2013-10-23 宇龙计算机通信科技(深圳)有限公司 移动终端和视频图像处理方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107516085A (zh) * 2017-09-01 2017-12-26 山西同方知网数字出版技术有限公司 一种基于文档图像自动去除黑边的方法
CN107516085B (zh) * 2017-09-01 2024-01-26 山西同方知网数字出版技术有限公司 一种基于文档图像自动去除黑边的方法
CN109146809A (zh) * 2018-08-02 2019-01-04 电子科技大学 一种对扫描文档图像进行去灰边的方法
CN109146809B (zh) * 2018-08-02 2022-07-26 电子科技大学 一种对扫描文档图像进行去灰边的方法
CN111563485A (zh) * 2019-10-24 2020-08-21 中国人民解放军63653部队 一种纸质文档电子扫描图像黑边去除方法
CN110991451A (zh) * 2019-11-01 2020-04-10 珠海奔图电子有限公司 扫描图像的卡片区域图像的校正方法及装置
CN110991451B (zh) * 2019-11-01 2024-05-07 珠海奔图电子有限公司 扫描图像的卡片区域图像的校正方法及装置
CN111739013A (zh) * 2020-06-30 2020-10-02 北京酷豹科技有限公司 基于图像处理的图像优化方法及相关装置
CN111739013B (zh) * 2020-06-30 2024-04-23 北京酷豹科技有限公司 基于图像处理的图像优化方法及相关装置
CN112634229A (zh) * 2020-12-22 2021-04-09 北京华宇信息技术有限公司 图像去除黑边的方法

Also Published As

Publication number Publication date
CN104361335B (zh) 2017-07-07

Similar Documents

Publication Publication Date Title
CN104361335A (zh) 一种基于扫描图像自动去除黑边的处理方法
CN110008954B (zh) 一种基于多阈值融合的复杂背景文本图像提取方法及系统
CN113822890A (zh) 一种微裂纹检测方法、装置、系统及存储介质
CN103034856B (zh) 定位图像中文字区域的方法及装置
CN109409355B (zh) 一种新型变压器铭牌识别的方法及装置
CN107045634B (zh) 一种基于最大稳定极值区域与笔画宽度的文本定位方法
CN103942797B (zh) 基于直方图和超像素的场景图像文字检测方法及系统
CN108146093B (zh) 一种去除票据印章的方法
CN112614062B (zh) 菌落计数方法、装置及计算机存储介质
CN103258198A (zh) 一种表格文档图像中字符提取方法
CN108133216B (zh) 基于机器视觉的可实现小数点读取的数码管读数识别方法
CN102800094A (zh) 一种快速彩色图像分割方法
CN109544583B (zh) 一种提取皮革图像感兴趣区域的方法、装置及设备
CN104598907B (zh) 一种基于笔画宽度图的图像中文字数据提取方法
CN112861654B (zh) 一种基于机器视觉的名优茶采摘点位置信息获取方法
CN105894487A (zh) 钢材图像编号的提取与分割方法
JP4077094B2 (ja) カラー文書画像認識装置
CN114862889A (zh) 基于遥感图像的道路边缘提取方法和装置
JP2016178553A (ja) 画像処理装置、領域検出方法及びコンピュータプログラム
CN115588208A (zh) 一种基于数字图像处理技术的全线表结构识别方法
CN111145305A (zh) 一种文档图像处理方法
CN101425143B (zh) 一种图像定位的方法及装置
CN111414877B (zh) 去除颜色边框的表格裁切方法、图像处理设备和存储介质
CN110288531B (zh) 一种辅助操作人员制作标准身份证相片的方法及工具
CN110598575B (zh) 表格版面分析与提取方法及相关装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant