CN106384114B - 一种基于支持向量机的自适应图像二值化方法 - Google Patents
一种基于支持向量机的自适应图像二值化方法 Download PDFInfo
- Publication number
- CN106384114B CN106384114B CN201610842687.2A CN201610842687A CN106384114B CN 106384114 B CN106384114 B CN 106384114B CN 201610842687 A CN201610842687 A CN 201610842687A CN 106384114 B CN106384114 B CN 106384114B
- Authority
- CN
- China
- Prior art keywords
- image
- file
- degrades
- picture
- binaryzation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/28—Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Facsimile Image Signal Circuits (AREA)
- Image Processing (AREA)
Abstract
本发明提供了一种基于支持向量机的自适应图像二值化方法,属于图像处理技术领域。所述方法包括:通过预定图像二值化方法对随机选取的降质文档图像进行处理,并对所述降质文档图像按选取的图像二值化方法进行归类;确定通过每种图像二值化方法处理的降质文档图像的灰度直方图,并提取所述灰度直方图的特征属性;将所述特征属性作为特征向量,并将所述特征向量对应的图像二值化方法作为标签建立训练样本;基于支持向量机对所述训练样本进行训练并建立二值化自适应选择模型。本发明针对不同的降质文档图像,在现有的预定图像二值化方法中选择最佳二值化方法,从而达到理想的图像二值化效果。
Description
技术领域
本发明涉及一种基于支持向量机的自适应图像二值化方法,属于图像处理技术领域。
背景技术
文档图像二值化作为光学字符识别(OCR)预处理的关键过程,其二值化效果影响着字符的识别率。虽然目前的技术人员已经对文档图像二值化方法进行大量的研究,但是在实际应用中由于文档图像容易受到多种降质因素,如图像中存在光照不均、阴影、严重透背以及胶粘痕迹等的影响,就会需要通过大量的人为处理来对不同降质文档图像选择合适的二值化方法,因此无法实现自适应选择二值化方法,导致在图像处理领域对降质文档图像快速、自动、准确提取字符依旧是一个难点。
发明内容
本发明提供了一种基于支持向量机的自适应图像二值化方法,以解决现有技术中无法对不同降质文档图像实现自适应选择二值化方法的问题,为此本发明提出如下的技术方案:
一种基于支持向量机的自适应图像二值化方法,包括:
通过预定图像二值化方法对随机选取的降质文档图像进行处理,并对所述降质文档图像按选取的图像二值化方法进行归类;
确定通过每种图像二值化方法处理的降质文档图像的灰度直方图,并提取所述灰度直方图的特征属性;
将所述特征属性作为特征向量,并将所述特征向量对应的图像二值化方法作为标签建立训练样本;
基于支持向量机对所述训练样本进行训练并建立二值化自适应选择模型。
本发明的有益效果是:针对不同的降质文档图像,在现有的预定图像二值化方法中选择最佳二值化方法,从而达到理想的图像二值化效果;应用本实施方式算法处理图像,具有较好的自适应能力,对于不同的降质文档图像,能够自动有效的选择最佳二值化方法,通过调节支持向量机的参数,其自动选择最佳二值化方法的准确率可达到81.81%,不仅能够较好的实现图像二值化方法的自适应,也能够输出较佳效果的二值图像。
附图说明
图1为本发明提出的基于支持向量机的自适应图像二值化方法的流程图;
图2为实施例一提出的基于支持向量机的自适应图像二值化方法的流程图;
图3(a)为随机选取的降质文档图像中Kapur处理效果最佳的降质文档图像之一;
图3(b)为用Kapur二值化图像;
图4(a)为随机选取的降质文档图像中Kittler处理效果最佳的降质文档图像之一;
图4(b)为用Kittler二值化图像;
图5(a)为随机选取的降质文档图像中Kapur处理效果最佳的降质文档图像之一;
图5(b)为用Kapur二值化图像。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
结合图1所示,本具体实施方式提供的基于支持向量机的自适应图像二值化方法包括:
步骤11,通过预定图像二值化方法对随机选取的降质文档图像进行处理,并对所述降质文档图像按选取的图像二值化方法进行归类。
可选的,对随机选取的降质文档图像进行处理,及对降质文档图像按选取的图像二值化方法进行归类的过程包括:
随机选取预定数量的不同类型的降质文档图像以及选取多种预定的降质文档图像二值化方法,并按预定顺序对选取的图像二值化方法标记标签;
通过选取的图像二值化方法分别对每一幅降质图像进行图像二值化处理,计算每种图像二值化方法处理后的F-measure值:
PR和RC分别表示准确率以及召回率,以所述F-measure值作为图像二值化处理效果评价标准对所述降质文档图像进行归类。
其中,按预定顺序对选取的图像二值化方法标记标签包括:按自然数从小到大的顺序对选取的图像二值化方法标记标签;以F-measure值作为图像二值化处理效果评价标准对降质文档图像进行归类包括:按照F-measure值越大则效果越佳的标准对降质文档图像进行归类。
步骤12,确定通过每种图像二值化方法处理的降质文档图像的灰度直方图,并提取所述灰度直方图的特征属性。
可选的,确定灰度直方图并提取特征属性的过程包括:
通过以下计算式通过每种图像二值化方法处理的降质文档图像的灰度直方图:
H(i)表示灰度直方图,i表示灰度级,ni和N分别表示降质文档图像灰度级i的像素点的个数和整幅图像总的像素点数。
其中,通过灰度直方图可提取以下的直方图属性特征值:
均值:方差偏度峰度能量熵
步骤13,将所述特征属性作为特征向量,并将所述特征向量对应的图像二值化方法作为标签建立训练样本。
可选的,将特征属性作为特征向量,并将特征向量对应的图像二值化方法作为标签建立训练样本的过程包括:
通过以下公式对所述特征属性进行归一化处理:
其中,ymax和ymin分别表示特征属性的最大值和最小值;
对经过所述归一化处理后的预定数量的特征属性作为特征向量,对应的最佳二值化处理方法作为标签,建立所述训练样本。
步骤14,基于支持向量机对所述训练样本进行训练并建立二值化自适应选择模型。
在一可选实施例中,所述方法还包括:
提取预定降质文档图像的灰度直方图特征;
将所述灰度直方图特征代入所述二值化自适应选择模型,并从所述预定图像二值化方法中自适应选取适合所述预定降质文档图像的图像二值化方法;
将通过选取的图像二值化方法输出二值化图像。
下面通过具体的实施例对本发明提出的基于支持向量机的自适应图像二值化方法进行详细说明。
实施例一
结合图2所示,所述的光控式声光双控报警器包括:
随机选取一定数量不同类型的降质文档图像,通过多种现有的图像二值化方法对其进行处理;根据图像二值化后F-measure值最佳原则对降质文档图像按所选取的图像二值化方法进行归类;
通过分析每种图像二值化方法下所处理降质文档图像的灰度直方图,提取灰度直方图的特征属性;
根据支持向量机分类原理,以选取的特征属性值作为特征向量,其对应的图像二值化方法为标签,建立训练样本;基于支持向量机对这些训练样本的训练,构建二值化自适应选择模型;
输入降质文档图像,提取图像灰度直方图特征,代入构建的支持向量机分类器,在选取的多种图像二值化方法中自适应选择适合该降质文档图像的最佳图像二值化方法,输出二值化图像。
在对降质文档图像按所选取的图像二值化方法进行归类的过程中,可随机选取一定数量不同类型的降质文档图像以及多种现有的降质文档图像二值化方法,按顺序以1,2,3…,N对所选取的二值化方法标记标签,运用选取的这些二值化方法分别对每一幅降质图像进行图像二值化处理,计算每一种图像二值化方法处理后的F-measure值:
其中,PR和RC分别代表准确率以及召回率,以F-measure值作为图像二值化处理效果评价标准(其值越大代表处理效果越佳),若对于第n种图像二值化方法处理的F-measure值最高,则将该幅降质文档图像按标签n进行归类。
在通过分析每种图像二值化方法下所处理降质文档图像的灰度直方图的过程中,可计算分类后的每一个标签下降质文档图像的灰度直方图H(i),i为灰度级。
其中,ni和N分别是降质文档图像灰度级i的像素点的个数和整幅图像总的像素点数。通过灰度直方图提取以下直方图的属性特征值:
均值:
方差:
偏度:
峰度:
能量:
熵:
在建立训练样本的过程中,根据支持向量机分类原理,构建SVM分类器:通过提取每一种图像二值化方法下降质文档图像灰度直方图的特征属性值,由于特征值之间的数据尺度不统一,需要先对数据进行归一化,归一化公式如下:
其中,ymax和ymin分别表示样本特征属性的最大值和最小值。以归一化后的6个特征属性值作为特征向量,对应的最佳图像二值化处理方法作为标签,构建训练样本,基于支持向量机对构建的训练样本进行训练。
仿真结果分析
仿真选择的是四种全局阈值方法,训练样本为DIBCO图像集50幅降质图像中随机选取的28幅降质图像,剩余的22幅图像作为测试样本。图3(a),图4(a),图5(a)是随机选取的28幅降质图像训练样本中的3幅,图3(b),图4(b),图5(b)为3种图像二值化方法中最佳的图像二值化方法处理的结果。
通过调节支持向量机的参数,对输入测试的22幅降质图像,准确自适应选择最佳的图像二值化方法的有18幅降质图像,其自适应的选择最佳图像二值化方法准确率能达到81.81%,说明本实施方式算法可以很好的实现图像二值化方法的自适应,也同时说明应用本实施方式算法能够输出最佳效果的二值图像。
本具体实施方式是对本发明的技术方案进行清楚、完整地描述,其中的实施例仅仅是本发明的一部分实施例,而并不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有经过创造性劳动的前提下所获得的所有其它实施方式都属于本发明的保护范围。
Claims (8)
1.一种基于支持向量机的自适应图像二值化方法,其特征在于,包括:
通过预定图像二值化方法对随机选取的降质文档图像进行处理,并对所述降质文档图像按选取的图像二值化方法进行归类;
确定通过每种图像二值化方法处理的降质文档图像的灰度直方图,并提取所述灰度直方图的特征属性;
将所述特征属性作为特征向量,并将所述特征向量对应的图像二值化方法作为标签建立训练样本;
基于支持向量机对所述训练样本进行训练并建立二值化自适应选择模型。
2.根据权利要求1所述的基于支持向量机的自适应图像二值化方法,其特征在于,所述方法还包括:
提取预定降质文档图像的灰度直方图特征;
将所述灰度直方图特征代入所述二值化自适应选择模型,并从所述预定图像二值化方法中自适应选取适合所述预定降质文档图像的图像二值化方法;
通过选取的图像二值化方法输出二值化图像。
3.根据权利要求1所述的基于支持向量机的自适应图像二值化方法,其特征在于,通过预定图像二值化方法对随机选取的降质文档图像进行处理,并对所述降质文档图像按选取的图像二值化方法进行归类包括:
随机选取预定数量的不同类型的降质文档图像以及选取多种预定的降质文档图像二值化方法,并按预定顺序对选取的图像二值化方法标记标签;
通过选取的图像二值化方法分别对每一幅降质图像进行图像二值化处理,计算每种图像二值化方法处理后的F-measure值:
其中,PR和RC分别表示准确率以及召回率,以所述F-measure值作为图像二值化处理效果评价标准对所述降质文档图像进行归类。
4.根据权利要求3所述的基于支持向量机的自适应图像二值化方法,其特征在于,按预定顺序对选取的图像二值化方法标记标签包括:
按自然数从小到大的顺序对选取的图像二值化方法标记标签。
5.根据权利要求4所述的基于支持向量机的自适应图像二值化方法,其特征在于,以所述F-measure值作为图像二值化处理效果评价标准对所述降质文档图像进行归类包括:
按照所述F-measure值越大则效果越佳的标准对所述降质文档图像进行归类。
6.根据权利要求1所述的基于支持向量机的自适应图像二值化方法,其特征在于,确定通过每种图像二值化方法处理的降质文档图像的灰度直方图,并提取所述灰度直方图的特征属性包括:
通过以下计算式计算每种图像二值化方法处理的降质文档图像的灰度直方图:
其中,H(i)表示灰度直方图,i表示灰度级,ni和N分别表示降质文档图像灰度级i的像素点的个数和整幅图像总的像素点数。
7.根据权利要求6所述的基于支持向量机的自适应图像二值化方法,其特征在于,通过所述灰度直方图提取以下的直方图属性特征值:
均值:方差偏度峰度能量熵
8.根据权利要求1所述的基于支持向量机的自适应图像二值化方法,其特征在于,将所述特征属性作为特征向量,并将所述特征向量对应的图像二值化方法作为标签建立训练样本包括:
通过以下公式对所述特征属性进行归一化处理:
其中,ymax和ymin分别表示特征属性的最大值和最小值;
对经过所述归一化处理后的预定数量的特征属性作为特征向量,对应的最佳二值化处理方法作为标签,建立所述训练样本。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610842687.2A CN106384114B (zh) | 2016-09-22 | 2016-09-22 | 一种基于支持向量机的自适应图像二值化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610842687.2A CN106384114B (zh) | 2016-09-22 | 2016-09-22 | 一种基于支持向量机的自适应图像二值化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106384114A CN106384114A (zh) | 2017-02-08 |
CN106384114B true CN106384114B (zh) | 2019-09-27 |
Family
ID=57936811
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610842687.2A Expired - Fee Related CN106384114B (zh) | 2016-09-22 | 2016-09-22 | 一种基于支持向量机的自适应图像二值化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106384114B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110313990B (zh) * | 2019-06-26 | 2021-05-14 | 北京工业大学 | 一种在心脏搭桥手术中基于壁面切应力图像特征建立预测桥血管通透性模型的方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101042735A (zh) * | 2006-03-23 | 2007-09-26 | 株式会社理光 | 图像二值化方法和装置 |
CN101727583A (zh) * | 2008-10-22 | 2010-06-09 | 富士通株式会社 | 用于文档图像的自适应二值化方法和设备 |
CN105303190A (zh) * | 2015-11-27 | 2016-02-03 | 哈尔滨理工大学 | 一种基于对比度增强法的降质文档图像二值化方法 |
-
2016
- 2016-09-22 CN CN201610842687.2A patent/CN106384114B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101042735A (zh) * | 2006-03-23 | 2007-09-26 | 株式会社理光 | 图像二值化方法和装置 |
CN101727583A (zh) * | 2008-10-22 | 2010-06-09 | 富士通株式会社 | 用于文档图像的自适应二值化方法和设备 |
CN105303190A (zh) * | 2015-11-27 | 2016-02-03 | 哈尔滨理工大学 | 一种基于对比度增强法的降质文档图像二值化方法 |
Non-Patent Citations (2)
Title |
---|
基于底层图像特征组合的文本图像分类研究;曾东红 等;《江西理工大学学报》;20131031;第34卷(第5期);82-87 * |
基于结构化局部边缘模式的文档图像分类;石蒙蒙 等;《厦门大学学报(自然科学版)》;20130531;第52卷(第3期);349-355 * |
Also Published As
Publication number | Publication date |
---|---|
CN106384114A (zh) | 2017-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105046277B (zh) | 特征显著性在图像质量评价中的鲁棒机理研究方法 | |
CN104050471B (zh) | 一种自然场景文字检测方法及系统 | |
CN105046700B (zh) | 基于亮度校正与颜色分类的水果表面缺陷检测方法及系统 | |
CN105930846B (zh) | 基于邻域信息和svgdl的极化sar图像分类方法 | |
CN105574063A (zh) | 基于视觉显著性的图像检索方法 | |
CN105469111B (zh) | 基于改进的mfa和迁移学习的小样本集的物体分类方法 | |
CN109993164A (zh) | 一种基于rcrnn神经网络的自然场景文字识别方法 | |
CN106096627A (zh) | 顾及特征优化的极化sar图像半监督分类方法 | |
CN107451994A (zh) | 基于生成对抗网络的物体检测方法及装置 | |
CN105095475B (zh) | 基于两级融合的不完整属性标记行人重识别方法与系统 | |
CN105844213B (zh) | 一种绿色果实识别方法 | |
CN106408086A (zh) | 用于图像优化的深度学习神经网络处理方法及系统 | |
CN109117703A (zh) | 一种基于细粒度识别的混杂细胞种类鉴定方法 | |
CN110288013A (zh) | 一种基于block分割和多重输入孪生卷积神经网络的缺陷标签识别方法 | |
CN108509870A (zh) | 一种基于图像匹配的中华绒螯蟹唯一性识别方法 | |
CN112862849A (zh) | 一种基于图像分割和全卷积神经网络的田间稻穗计数方法 | |
CN106203373B (zh) | 一种基于深度视觉词袋模型的人脸活体检测方法 | |
CN107909072A (zh) | 一种植物类型识别方法、电子设备、存储介质及装置 | |
CN109409227A (zh) | 一种基于多通道cnn的手指静脉图质量评估方法及其装置 | |
CN102184404A (zh) | 掌纹图像中手掌区域的获取方法及装置 | |
CN104866794B (zh) | 基于图像特征信息统计的条形码解码方法 | |
CN114120094A (zh) | 一种基于人工智能的水污染识别方法及系统 | |
CN103065126A (zh) | 不同场景对人体图像再识别的方法 | |
CN109033971A (zh) | 一种基于残差网络思想的高效行人重识别方法 | |
CN106384114B (zh) | 一种基于支持向量机的自适应图像二值化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20190927 Termination date: 20200922 |