CN108108753B - 一种基于支持向量机的复选框选择状态的识别方法及装置 - Google Patents

一种基于支持向量机的复选框选择状态的识别方法及装置 Download PDF

Info

Publication number
CN108108753B
CN108108753B CN201711352905.5A CN201711352905A CN108108753B CN 108108753 B CN108108753 B CN 108108753B CN 201711352905 A CN201711352905 A CN 201711352905A CN 108108753 B CN108108753 B CN 108108753B
Authority
CN
China
Prior art keywords
image
recognized
target image
gradient
training sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711352905.5A
Other languages
English (en)
Other versions
CN108108753A (zh
Inventor
杨飞
高昊江
候金利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northking Information Technology Co ltd
Original Assignee
Northking Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northking Information Technology Co ltd filed Critical Northking Information Technology Co ltd
Priority to CN201711352905.5A priority Critical patent/CN108108753B/zh
Publication of CN108108753A publication Critical patent/CN108108753A/zh
Application granted granted Critical
Publication of CN108108753B publication Critical patent/CN108108753B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text

Abstract

本发明实施例公开了一种基于支持向量机的复选框选择状态的识别方法及装置,该方法包括:获取预处理的目标待识别图像;按照不同的预设尺度对所述目标待识别图像执行与所述不同的预设尺度对应的分块操作,获取分块图像,提取所述分块图像的方向梯度直方图特征向量,并获取所述目标待识别图像的方向梯度直方图特征向量;将所述目标待识别图像的方向梯度直方图特征向量输入至训练后的支持向量机分类模型中,获取识别结果。本发明实施例能够消除复杂背景以及噪声对图像识别造成的不良影响,提高了判断复选框是否处于选中状态的识别效率,鲁棒性能好,有效地提升了复选框选择状态的识别准确性,且应用范围广泛。

Description

一种基于支持向量机的复选框选择状态的识别方法及装置
技术领域
本发明实施例涉及图像识别技术领域,尤其涉及一种基于支持向量机的复选框选择状态的识别方法及装置。
背景技术
随着我国信息化的快速发展,各行各业对于图像识别的需求越来越多,在银行票据、税务报表、标准化考试的答题卡、以及人口普查表等数据表单中,通常含有需用户填写的复选框,判断复选框选中与否的结果十分重要。
现有技术中,通常采用以下方法识别复选框的选中状态:
1、通过人工识别复选框的选中状态之后,再输入到计算机系统进行存储。该方法人力成本较高、对于大量需要识别的数据表单,识别效率低。
2、通过分割出复选框并采用模板匹配的方法识别复选框的选中状态,但是,该方法没有考虑到手写符号对于分割复选框的影响,通常情况下,手写符号会超出复选框的范围,在此基础上进行模板匹配会导致识别准确率低,而且如果模板匹配的匹配目标发生旋转或者大小变化,则算法失效。该方法对于符号的填写位置存在一定的限制,应用范围不广。
发明内容
本发明实施例提供一种基于支持向量机的复选框选择状态的识别方法及装置,解决现有技术中识别效率低、应用范围不广的问题。
第一方面,本发明实施例提供了一种基于支持向量机的复选框选择状态的识别方法及装置,包括:
获取预处理的目标待识别图像;
按照不同的预设尺度对所述目标待识别图像执行与所述不同的预设尺度对应的分块操作,获取分块图像,提取所述分块图像的方向梯度直方图特征向量,并获取所述目标待识别图像的方向梯度直方图特征向量;
将所述目标待识别图像的方向梯度直方图特征向量输入至训练后的支持向量机分类模型中,获取识别结果。
第二方面,本发明实施例还提供了一种基于支持向量机的复选框选择状态的识别装置,包括:
预处理模块,用于获取预处理的目标待识别图像;
特征向量获取模块,用于按照不同的预设尺度对所述目标待识别图像执行与所述不同的预设尺度对应的分块操作,获取分块图像,提取所述分块图像的方向梯度直方图特征向量,并获取所述目标待识别图像的方向梯度直方图特征向量;
识别模块,用于将所述目标待识别图像的方向梯度直方图特征向量输入至训练后的支持向量机分类模型中,获取识别结果。
本发明实施例通过对预处理的目标待识别图像按照不同的预设尺度进行分块操作,提取分块图像的方向梯度直方图特征向量,通过对图像局部的处理,能够消除复杂背景以及噪声对图像识别造成的不良影响,并进一步将获取的目标待识别图像的方向梯度直方图特征向量输入至训练后的支持向量机分类模型中,获取识别结果。本发明实施例提高了对复选框选中状态的识别效率,鲁棒性能好,有效地提升了复选框状态的识别准确性,且应用范围广泛。
附图说明
图1是本发明实施例一中的一种基于支持向量机的复选框选择状态的识别方法的流程图;
图2a是本发明实施例二中的一种基于支持向量机的复选框选择状态的识别方法的流程图;
图2b是本发明实施例二中的目标待识别负样本图像的示意图;
图2c是本发明实施例二中的目标待识别负样本图像的方向梯度直方图特征向量的示意图;
图2d是本发明实施例二中的目标待识别正样本图像的示意图;
图2e是本发明实施例二中的目标待识别正样本图像的方向梯度直方图特征向量的示意图;
图3为本发明实施例三中的一种基于支持向量机的复选框选择状态的识别方法的流程图;
图4a为本发明实施例四中的一种基于支持向量机的复选框选择状态的识别方法的流程图;
图4b为本发明实施例四中的一种基于支持向量机的复选框选择状态的识别方法的流程图;
图5为本发明实施例五中的一种基于支持向量机的复选框选择状态的识别方法的流程图;
图6是本发明实施例六中的一种基于支持向量机的复选框选择状态的识别装置的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
实施例一
图1为本发明实施例一提供的一种基于支持向量机的复选框选择状态的识别方法的流程图,本实施例可适用于通过将提取的待识别图像的方向梯度直方图特征向量输入至训练后的支持向量机分类模型来进行识别复选框选中状态或非选中状态的情况,该方法可以由一种基于支持向量机的复选框选择状态的识别装置来执行,该装置可以采用软件和/或硬件的方式实现,一般集成于终端设备中,例如,台式机、一体机以及笔记本电脑等。如图1所示,本实施例的方法具体包括:
S110、获取预处理的目标待识别图像。
具体的,目标待识别图像可以理解为包括待识别复选框的选择状态的图像,选择状态可以包括选中状态或非选中状态,目标待识别图像可以为灰度图像,也可以为彩色图像,在获取目标待识别图像之后,对目标待识别图像进行预处理。
优选的,获取预处理的目标待识别图像包括:
滤除所述目标待识别图像的噪声;
按照预设图像大小,对所述目标待识别图像进行重采样;
对所述重采样的目标待识别图像进行伽马校正,获取所述目标待识别图像的预处理结果。
在本发明实施例一个可选的实施方式中,对目标待识别图像进行预处理可以包括滤除目标待识别图像的噪声,示例性地,可以采用高斯滤波器滤除目标待识别图像的噪声,按照预设图像大小,对滤除噪声后的目标待识别图像进行重采样,示例性地,可以采用三次卷积内插法对滤除噪声后的目标待识别图像进行重采样,也可以采用最邻近内插法或者双线性内插法对滤除噪声后的目标待识别图像进行重采样,本发明实施例对此并不限制。可以根据实际应用情况预设图像大小,例如,预设图像大小可以为32×32像素。对重采样后的目标待识别图像进行伽马校正,获取目标待识别图像的预处理结果。伽马校正可以对输入的目标待识别图像的灰度值进行非线性操作,使输出的目标待识别图像的灰度值与输入的目标待识别图像的灰度值成指数关系,以消除不均匀光照的不良影响,并可以进行图像对比度的调节。示例性地,伽马系数的取值范围可以设置在0.1至0.5之间。需要说明的是,本发明实施例在目标待识别图像进行预处理的过程中对操作步骤的执行顺序不做限制。
S120、按照不同的预设尺度对所述目标待识别图像执行与所述不同的预设尺度对应的分块操作,获取分块图像,提取所述分块图像的方向梯度直方图特征向量,并获取所述目标待识别图像的方向梯度直方图特征向量。
具体的,按照不同的预设尺度对目标待识别图像执行分块操作,在本发明实施例一个可选的实施方式中,预设尺度可以包括第一预设尺度和第二预设尺度,首先按照第一预设尺度对目标待识别图像进行分块操作,获取区域分块图像,示例性地,第一预设尺度可以为16×16像素,然后,在第一次分块操作的基础上,按照第二预设尺度对区域分块图像进行分块操作,获取子区域分块图像,示例性地,第二预设尺度可以为8×8像素。
计算目标待识别图像中各个像素的梯度幅值以及梯度幅值对应的梯度方向,按照预设的梯度方向区间,对子区域分块图像中各个像素的梯度幅值在各个梯度方向区间进行直方图统计,获取子区域分块图像的方向梯度直方图特征向量。示例性地,对于一个8×8像素的子区域分块图像,预设的梯度方向区间可以为将
Figure BDA0001510600960000061
的梯度方向等分为16个区间,对子区域分块图像的各个像素的梯度幅值在预设的梯度方向区间进行直方图统计,获取子区域分块图像的16维的方向梯度直方图特征向量。
按照预设的选取标准,将目标待识别图像中全部子区域分块图像的方向梯度直方图特征向量串接起来,得到目标待识别图像的方向梯度直方图特征向量。预设的选取标准可以根据实际情况具体设定,示例性地,对于目标待识别图像中全部子区域分块图像,预设的选取标准可以设置为从上到下选取每一行的子区域分块图像,对于每一行的全部子区域分块图像,可以按照从左到右的顺序选取。
S130、将所述目标待识别图像的方向梯度直方图特征向量输入至训练后的支持向量机分类模型中,获取识别结果。
具体的,在将目标待识别图像的方向梯度直方图特征向量输入至支持向量机分类模型之前,需要对支持向量机的分类模型进行训练。
获取包括复选框的训练样本图像集合,对训练样本图像集合中的每幅训练样本图像进行预处理,预处理的过程可以包括滤除训练样本图像的噪声,按照预设图像大小,对训练样本图像进行重采样,对重采样之后的训练样本图像进行伽马校正,获取训练样本图像的预处理结果。按照不同的预设尺度对训练样本图像进行分块操作,获取与第一预设尺度匹配的区域分块图像,以及与第二预设尺度匹配的子区域分块图像。计算各个子区域分块图像中像素点的梯度幅值以及梯度方向,按照预设的梯度方向区间,统计各子区域分块图像中各个像素的梯度幅值在各个梯度方向区间的直方图,即获取训练样本图像局部的、多尺度的方向梯度直方图特征向量。按照预设的选取标准,将训练样本图像中全部子区域分块图像的方向梯度直方图特征向量顺序排列起来,以获取训练样本图像的方向梯度直方图特征向量。将训练样本图像的方向梯度直方图特征向量输入至支持向量机分类器中,获取初始支持向量机分类模型,并进一步针对分类错误的训练样本图像进行重新训练,即收集分类错误的训练样本图像输入至初始支持向量机分类模型中,以获取新的支持向量机分类模型,此过程可以重复进行多次,最终获取训练后的支持向量机分类模型。
将目标待识别图像的方向梯度直方图特征向量输入至最终训练后的支持向量机分类模型中,获取复选框状态的识别结果,即识别复选框处于选中状态或者复选框处于非选中状态。可以通过识别基于复选框的打勾符号,识别复选框处于选中状态,对于基于复选框的其它手写符号的识别,本发明实施例并不限制。
本发明实施例一提供的一种基于支持向量机的复选框选择状态的识别方法,能够消除复杂背景以及噪声对图像识别造成的不良影响,提高了对复选框选中状态的识别效率,鲁棒性能好,有效地提升了复选框选择状态的识别准确性,且应用范围广泛。
实施例二
图2a为本发明实施例二提供的一种基于支持向量机的复选框选择状态的识别方法的流程图,本发明实施例二在上述实施例的基础上进行了优化,具体是对按照不同的预设尺度对所述目标待识别图像执行与所述不同的预设尺度对应的分块操作,获取分块图像,提取所述分块图像的方向梯度直方图特征向量,并获取所述目标待识别图像的方向梯度直方图特征向量的操作进一步优化,如图2a所示,本发明实施例二的具体包括:
S210、获取预处理的目标待识别图像。
S220、计算所述目标待识别图像中各像素点的梯度值,所述梯度值包括梯度幅值以及梯度方向。
优选的,计算所述目标待识别图像中各像素点的梯度幅值,以及梯度幅值对应的梯度方向,包括:
如果所述目标待识别图像为灰度图像,则根据计算式
Figure BDA0001510600960000091
计算出所述目标待识别图像中各像素点的梯度幅值,其中,G(x,y)表示像素点的梯度幅值,α(x,y)表示像素点的梯度方向,所述梯度方向为像素点垂直方向梯度幅值与水平方向梯度幅值的一阶倒数,H(X,Y)表示像素点的灰度值;
如果所述目标待识别图像为彩色图像,则计算所述彩色图像中各像素点的各颜色通道的梯度幅值,以及所述各颜色通道的梯度幅值对应的梯度方向。
具体的,目标待识别图像可以为灰度图像,也可以为彩色图像,如果目标待识别图像为灰度图像,则根据上述计算式计算目标待识别图像中各像素点的梯度幅值以及梯度方向。如果目标待识别图像为彩色图像,则根据上述计算式分别计算彩色图像中各个像素点的各个颜色通道的梯度幅值,以及各个颜色通道的梯度幅值对应的梯度方向。
S230、按照第一预设尺度对所述目标待识别图像执行与所述第一预设尺度对应的分块操作,获取区域分块图像。
S240、按照第二预设尺度对所述区域分块图像执行与所述第二预设尺度对应的分块操作,获取子区域分块图像。
示例性地,可以根据第一预设尺度将目标待识别图像划分为4个区域分块图像,并进一步根据第二预设尺度将每个区域分块图像划分为4个子区域分块图像,即对于整个目标待识别图像,包括16个子区域分块图像。
本领域技术人员可知,对于目标待识别图像的分块操作,不仅仅包括第一预设尺度和第二预设尺度,可以根据实际应用情况增加预设尺度,本发明实施例对此并不限制。
S250、按照预设的梯度方向区间,统计所述子区域分块图像中各个所述梯度方向区间对应的梯度幅值,将统计结果作为所述子区域分块图像的方向梯度直方图特征向量。
具体的,对于每一个子区域分块图像,可以按照预设的梯度方向区间,统计各个梯度方向区间对应的像素点的梯度幅值,以获得子区域分块图像的方向梯度直方图特征向量。对于彩色图像,不仅可以按照预设梯度方向区间划分,还可以进一步按照各个颜色通道,统计各个梯度方向区间中像素点各个颜色通道的梯度幅值。
S260、根据计算式
Figure BDA0001510600960000101
对所述子区域分块图像的方向梯度直方图特征向量进行归一化操作,其中,v表示所述子区域分块图像的方向梯度直方图特征向量,||v||表示v的L2范数,e表示偏移量,f表示所述子区域分块图像的方向梯度直方图特征向量的归一化结果。
具体的,可以对子区域分块图像的方向梯度直方图特征向量进行局部归一化操作,以克服光照不均匀以及前景和背景的对比度差异所带来的不良影响。
S270、将所述目标待识别图像中所有归一化后的所述子区域分块图像的方向梯度直方图特征向量按照预设的选取标准顺序排列,构成所述目标待识别图像的方向梯度直方图特征向量。
具体的,通过将各个子区域分块图像的方向梯度直方图特征向量,按照预设的选取标准顺序排列,获取目标待识别图像的多尺度的方向梯度直方图特征向量。选取标准可以根据实际情况具体设定,示例性地,对于目标待识别图像中全部子区域分块图像,预设的选取标准可以设置为从下到上选取每一行的子区域分块图像,对于每一行的全部子区域分块图像,可以按照从右到左的顺序选取。
示例性地,如果将目标待识别图像划分为16个子区域分块图像,每个子区域分块图像的方向梯度直方图特征向量是16维的方向梯度直方图特征向量,则目标待识别图像的方向梯度直方图特征向量是256维的方向梯度直方图特征向量,即多尺度的方向梯度直方图特征向量。
S280、根据计算公式
Figure BDA0001510600960000111
对所述目标待识别图像的方向梯度直方图特征向量进行标准化操作,获取标准化的所述目标待识别图像的方向梯度直方图特征向量,其中,v表示所述目标待识别图像的方向梯度直方图特征向量,μn表示所述目标待识别图像的方向梯度直方图特征向量的均值,σn表示所述目标待识别图像的方向梯度直方图特征向量的方差,v'表示标准化结果。
具体的,目标待识别图像的方向梯度直方图特征向量中异常小或者异常大的数据会影响识别结果,因此需要对目标待识别图像的方向梯度直方图特征向量进行标准化操作。
S290、将所述标准化的所述目标待识别图像的方向梯度直方图特征向量输入至训练后的支持向量机分类模型中,获取识别结果。
本实施例中,图2b为目标待识别负样本图像的示意图,图2d为目标待识别正样本图像的示意图,图2c为目标待识别负样本图像的方向梯度直方图特征向量的示意图,图2e为目标待识别正样本图像的方向梯度直方图特征向量的示意图,负样本图像可以理解为复选框处于非选中状态,正样本图像可以理解为复选框处于选中状态。当目标待识别图像中的复选框处于非选中状态(参见图2b),提取的目标待识别图像的方向梯度直方图特征向量为空(如图2c所示),当目标待识别图像中的复选框处于选中状态,(参见图2d),提取的目标待识别图像的方向梯度直方图特征向量与选中状态相对应(如图2e所示)。
本发明实施例二提供的一种基于支持向量机的复选框选择状态的识别方法,通过获取子区域分块图像的方向梯度直方图特征向量,能够消除光照不均匀和背景噪声对图像识别造成的不良影响,并进一步提升了图像识别的准确性,针对实际情况中人工勾选的复杂情况,鲁棒性能好。
实施例三
图3为本发明实施例三提供的一种基于支持向量机的复选框选择状态的识别方法的流程图,本发明实施例三以上述各实施例为基础进行了优化改进,对按照不同的预设尺度对所述目标待识别图像执行与所述不同的预设尺度对应的分块操作,获取分块图像,提取所述分块图像的方向梯度直方图特征向量,并获取所述目标待识别图像的方向梯度直方图特征向量之后的操作进行了进一步说明,如图3所示,本发明实施例三的方法具体包括:
S310、获取预处理的目标待识别图像。
S320、按照不同的预设尺度对所述目标待识别图像执行与所述不同的预设尺度对应的分块操作,获取分块图像,提取所述分块图像的方向梯度直方图特征向量,并获取所述目标待识别图像的方向梯度直方图特征向量。
S330、提取所述目标待识别图像的方向梯度直方图特征向量的主成分特征向量,将所述目标待识别图像的方向梯度直方图特征向量更新为所述主成分特征向量。
优选的,提取所述目标待识别图像的方向梯度直方图特征向量的主成分特征向量,将所述目标待识别图像的方向梯度直方图特征向量更新为所述主成分特征向量,包括:
将所述目标待识别图像的方向梯度直方图特征向量排列成第一矩阵,计算所述第一矩阵的方向梯度直方图特征向量均值;
根据计算式
Figure BDA0001510600960000131
计算所述第一矩阵的协方差矩阵,其中,xi表示所述第一矩阵的元素,
Figure BDA0001510600960000132
表示所述第一矩阵的方向梯度直方图特征向量均值,N表示所述目标待识别图像的方向梯度直方图特征向量的个数,UT表示为协方差矩阵;
计算所述协方差矩阵中方向梯度直方图特征向量对应的模值,按照预设顺序对所述模值进行排序操作之后,顺序获取排序结果中预设数量的所述模值,将所述模值对应的方向梯度直方图特征向量排列成第二矩阵;
根据计算式
Figure BDA0001510600960000133
计算所述目标待识别图像的方向梯度直方图特征向量的主成分特征向量,将所述目标待识别图像的方向梯度直方图特征向量更新为所述主成分特征向量,其中,xi表示所述第二矩阵的元素,
Figure BDA0001510600960000134
表示所述第二矩阵的方向梯度直方图特征向量均值。
具体的,由于提取的目标待识别图像的方向梯度直方图特征向量的维度高,存在大量的冗余信息,不仅会影响分类的精度,而且会降低识别的速度,因此需要对提取的目标待识别图像的方向梯度直方图特征向量进行降维处理,提取目标待识别图像的方向梯度直方图特征向量的主成分特征向量,将主成分特征向量输入至训练后的支持向量机分类模型中,获取识别结果。
具体过程为:将目标待识别图像的方向梯度直方图特征向量按照预设的行数和列数排列为第一矩阵,计算方向梯度直方图特征向量均值。根据计算式
Figure BDA0001510600960000141
计算第一矩阵的协方差矩阵,计算协方差矩阵中方向梯度直方图特征向量对应的模值,示例性地,可以按照从大到小的顺序对方向梯度直方图特征向量对应的模值进行排序操作,获取排序结果中协方差矩阵前s个最大模值对应的方向梯度直方图特征向量构成第二矩阵,其中,s为预设数量。然后根据计算式
Figure BDA0001510600960000142
对第二矩阵的元素计算主成分特征向量,获得目标待识别图像的方向梯度直方图特征向量的降维结果。
S340、将所述目标待识别图像的方向梯度直方图特征向量输入至训练后的支持向量机分类模型中,获取识别结果。
本发明实施例三提供的一种基于支持向量机的复选框选择状态的识别方法,通过提取目标待识别图像的方向梯度直方图特征向量的主成分特征向量,并将主成分特征向量输入至训练后的支持向量机分类模型中,获取识别结果,能够减少冗余信息对识别的不良影响,有效地提升了识别速度以及识别的准确度。
实施例四
图4a为本发明实施例四提供的一种基于支持向量机的复选框选择状态的识别方法的流程图,本发明实施例四以上述各实施例为基础进行了优化改进,对获取训练后的支持向量机分类模型进行了进一步说明,如图4a所示,本发明实施例四的方法具体包括:
S410、获取预处理的训练样本图像,所述训练样本图像包括正训练样本图像以及负训练样本图像,其中,所述正训练样本图像包括处于选中状态的复选框,所述负训练样本图像包括处于非选中状态的复选框。
具体的,构建训练样本图像集合,将训练样本图像集合划分为正训练样本图像集和负训练样本图像集。正训练样本图像可以理解为复选框处于选中状态的图像,负训练样本图像集可以理解为复选框处于非选中状态或者空选状态的图像。分别对每个正训练样本图像以及每个负训练样本图像进行预处理,预处理的过程可以包括滤除图像噪声、对图像进行重采样以及对图像进行伽马校正的步骤,但不限于上述步骤。正训练样本图像和负训练样本图像可以是灰度图像,也可以是彩色图像。
在构建正训练样本集合的过程中,正训练样本图像与预设的窗口大小相同,示例性地,预设的窗口大小可以为8×8像素。在构建负训练样本集合的过程中,对负训练样本的尺寸不做限制,可以按照预设的窗口大小,从负样本训练图像的任意位置截取与预设的窗口大小相等的图像,作为负训练样本图像。
S420、按照不同的预设尺度对所述训练样本图像执行与所述不同的预设尺度对应的分块操作,获取分块图像,提取所述分块图像的方向梯度直方图特征向量,并获取所述训练样本图像的方向梯度直方图特征向量。
具体的,可以对每个正训练样本图像以及每个负训练样本图像进行如下操作:计算训练样本图像中每个像素的梯度幅值以及梯度方向,对训练样本图像进行分块操作,获取第一预设尺度对应的区域分块训练样本图像,以及第二预设尺度对应的子区域分块训练样本图像。按照预设的梯度区间,统计各个子区域分块训练样本图像中预设的梯度区间对应的梯度幅值,获取子区域分块训练样本图像的方向梯度直方图特征向量,并按照预设的选取标准,对各个子区域分块训练样本图像的方向梯度直方图特征向量进行排列,获取训练样本图像的方向梯度直方图特征向量。对训练样本图像的方向梯度直方图特征向量进行归一化操作之后,由于同一特征在不同训练样本图像中的取值存在差异,一些异常小或者异常大的方向梯度直方图特征向量会误导支持向量机训练模型的正确训练,而且数据分布的分散也会影响支持向量机模型的训练结果,因此,需要对训练样本图像的方向梯度直方图特征向量进行标准化处理。
S430、提取所述训练样本图像的方向梯度直方图特征向量的主成分特征向量,将所述训练样本图像的方向梯度直方图特征向量的主成分特征向量输入至支持向量机分类器中进行训练,获取初始支持向量机分类模型。
具体的,计算所有训练样本图像的方向梯度直方图特征向量的均值,将训练样本图像的方向梯度直方图特征向量按照预设的行数和列数排列为第一矩阵,根据计算式
Figure BDA0001510600960000161
计算第一矩阵的协方差矩阵,计算协方差矩阵中方向梯度直方图特征向量对应的模值,示例性地,可以按照从大到小的顺序对方向梯度直方图特征向量对应的模值进行排序操作,获取排序结果中协方差矩阵前s个最大模值对应的方向梯度直方图特征向量构成第二矩阵,其中,s为预设数量。然后对第二矩阵的元素根据计算式
Figure BDA0001510600960000162
计算主成分特征向量,获得训练样本图像的方向梯度直方图特征向量的降维结果。
S440、建立目标训练样本,将所述目标训练样本输入至所述初始支持向量机分类模型,获取初始支持向量机分类模型的错误分类结果,将所述错误分类结果加入至所述训练样本图像重新进行训练,获取最终的支持向量机分类模型。
优选的,建立目标训练样本,将所述目标训练样本输入至所述初始支持向量机分类模型,获取初始支持向量机分类模型的错误分类结果,将所述错误分类结果加入至所述训练样本图像重新进行训练,获取最终的支持向量机分类模型,包括:
建立与预设窗口大小相等的不同分辨率的目标负样本图像集;
将所述不同分辨率的目标负样本图像集输入至所述初始支持向量机分类模型,获取所述初始支持向量机分类模型的错误分类结果;
将所述错误分类结果输入至所述训练样本图像重新进行训练,获取最终的支持向量机分类模型。
具体的,将所有训练样本图像的方向梯度直方图特征向量的主成分特征向量输入至支持向量机分类器中进行训练,得到初始支持向量机分类模型。核函数的类型对于支持向量机分类器十分重要,本发明实施例可以预设支持向量机的核函数类型为高斯径向基核函数。对负训练样本图像经过多次缩放处理,得到不同层次上的金字塔图像,即不同分辨率的负训练样本图像,在不同分辨率的负训练样本图像中截取预设窗口大小的图像,组成目标负样本图像集,将目标负样本图像集输入至初始支持向量机分类模型中进行训练,获取初始支持向量机分类模型中负样本训练图像的错误分类结果,即包括将非选中状态的复选框识别为选中状态的错误分类结果,将错误分类结果加入至所有训练样本图像进行重新训练,获取新的支持向量机分类模型,可以在多次操作后获得最终的支持向量机分类模型。
本实施例中,图4b为本发明实施例四提供的一种基于支持向量机的复选框选择状态的识别方法的流程图,建立训练样本图像集,训练样本图像集可以包括正训练样本图像集以及负训练样本图像集,提取训练样本图像集中每幅训练样本图像的方向梯度直方图特征向量,将方向梯度直方图特征向量输入至支持向量机分类器,获取初始支持向量机分类模型。根据负训练样本图像集,建立不同分辨率的目标负样本图像集,将目标负样本图像集输入至初始支持向量机分类模型中,获取初始分类结果,如果初始分类结果不存在错误分类,则初始分类模型可以作为最终支持向量机分类模型,如果初始分类结果存在错误,则获取错误分类结果,将错误分类结果加入至训练样本图像集进行重新训练,获取最终的支持向量机分类模型。
本发明实施例四提供的一种基于支持向量机的复选框选择状态的识别方法,通过收集不同分辨率的目标负样本图像输入至初始支持向量机分类模型,获取错误分类结果,形成一个识别难例集,根据难例集重新训练支持向量机模型,减少了识别错误的几率,提升了识别的准确性。
实施例五
图5为本发明实施例五提供的一种基于支持向量机的复选框选择状态的识别方法的流程图,本发明实施例五以上述各实施例为基础进行了优化改进,对复选框选择状态的识别方法进行了进一步说明,参见图5,本发明实施例五的方法具体包括训练过程以及识别过程,其中:
在训练过程中,建立训练样本图像集,对训练样本图像集进行预处理,提取训练样本图像集中每幅训练样本图像的子区域分块图像的方向梯度直方图特征向量,进而获取训练样本图像集中每幅训练样本图像的方向梯度直方图特征向量,提取每幅训练样本图像的方向梯度直方图特征向量的主成分特征向量,将主成分特征向量输入至支持向量机分类器中进行训练,获得训练后的支持向量机分类模型。在识别过程中,对于每幅目标待识别图像,在进行图像预处理操作之后,提取目标待识别图像的子区域分块图像的方向梯度直方图特征向量,进而获取目标待识别图像的方向梯度直方图特征向量,提取目标待识别图像的方向梯度直方图特征向量的主成分特征向量,将目标待识别图像的方向梯度直方图特征向量的主成分特征向量输入至训练后的支持向量机分类模型,获取识别结果。
示例性地,利用训练后的支持向量机分类模型对494070幅目标待识别图像进行复选框选择状态的识别,即,识别复选框处于选中状态或者非选中状态,并进一步将识别结果与真实结果进行对比,识别准确率为99.57%。其中,训练后的支持向量机分类模型能够正确分类的正样本的个数为70487,训练后的支持向量机分类模型能够正确分类的负样本的个数为421483,训练后的支持向量机分类模型对正样本的错误分类结果为32,训练后的支持向量机分类模型对负样本的错误分类结果为2068,正样本可以理解为复选框处于选中状态,负样本可以理解为复选框处于非选中状态。
本发明实施例五提供了一种基于支持向量机的复选框选择状态的识别方法,有效地提升了复选框的识别效率以及识别准确性,鲁棒性强,可应用范围广泛。
实施例六
图6是本发明实施例六中的一种基于支持向量机的复选框选择状态的识别装置的结构示意图,该装置应用于通过将提取的待识别图像的方向梯度直方图特征向量输入至训练后的支持向量机分类模型来进行识别复选框选中状态或非选中状态的情况,该装置可以采用软件和/或硬件的方式实现,一般集成于终端设备中,例如,台式机、一体机以及笔记本电脑等。如图6所示,装置包括:预处理模块610、特征向量获取模块620以及识别模块630,其中:
预处理模块610,用于获取预处理的目标待识别图像;
特征向量获取模块620,用于按照不同的预设尺度对所述目标待识别图像执行与所述不同的预设尺度对应的分块操作,获取分块图像,提取所述分块图像的方向梯度直方图特征向量,并获取所述目标待识别图像的方向梯度直方图特征向量;
识别模块630,用于将所述目标待识别图像的方向梯度直方图特征向量输入至训练后的支持向量机分类模型中,获取识别结果。
本发明实施例能够消除复杂背景以及噪声对图像识别造成的不良影响,提高了对复选框选中状态的识别效率,本发明实施例能够对复选框是否处于勾选状态进行识别,鲁棒性能好,有效地提升了复选框状态的识别准确性,且应用范围广泛。
在上述实施例的基础上,所述预处理模块可以包括:
去噪单元,用于滤除所述目标待识别图像的噪声;
重采样单元,用于按照预设图像大小,对所述目标待识别图像进行重采样;
校正单元,用于对所述重采样的目标待识别图像进行伽马校正,获取所述目标待识别图像的预处理结果。
在上述实施例的基础上,所述特征向量获取模块可以包括:
梯度值计算单元,用于计算所述目标待识别图像中各像素点的梯度值,所述梯度值包括梯度幅值以及梯度方向;
第一分块单元,用于按照第一预设尺度对所述目标待识别图像执行与所述第一预设尺度对应的分块操作,获取区域分块图像;
第二分块单元,用于按照第二预设尺度对所述区域分块图像执行与所述第二预设尺度对应的分块操作,获取子区域分块图像;
统计单元,用于按照预设的梯度方向区间,统计所述子区域分块图像中各个所述梯度方向区间对应的梯度幅值,将统计结果作为所述子区域分块图像的方向梯度直方图特征向量。
在上述实施例的基础上,所述特征向量获取模块还可以包括:
归一化单元,用于根据计算式
Figure BDA0001510600960000211
对所述子区域分块图像的方向梯度直方图特征向量进行归一化操作,其中,v表示所述子区域分块图像的方向梯度直方图特征向量,||v||表示v的L2范数,e表示偏移量,f表示所述子区域分块图像的方向梯度直方图特征向量的归一化结果;
方向梯度直方图特征向量获取单元,用于将所述目标待识别图像中所有归一化后的所述子区域分块图像的方向梯度直方图特征向量按照预设的选取标准顺序排列,构成所述目标待识别图像的方向梯度直方图特征向量;
标准化单元,用于根据计算公式
Figure BDA0001510600960000212
对所述目标待识别图像的方向梯度直方图特征向量进行标准化操作,获取标准化的所述目标待识别图像的方向梯度直方图特征向量,其中,v表示所述目标待识别图像的方向梯度直方图特征向量,μn表示所述目标待识别图像的方向梯度直方图特征向量的均值,σn表示所述目标待识别图像的方向梯度直方图特征向量的方差,v'表示标准化结果。
在上述实施例的基础上,所述梯度值计算单元可以包括:
第一梯度值计算子单元,用于如果所述目标待识别图像为灰度图像,则根据计算式
Figure BDA0001510600960000213
计算出所述目标待识别图像中各像素点的梯度幅值,其中,G(x,y)表示像素点的梯度幅值,α(x,y)表示像素点的梯度方向,所述梯度方向为像素点垂直方向梯度幅值与水平方向梯度幅值的一阶倒数,H(X,Y)表示像素点的灰度值;
第二梯度值计算子单元,用于如果所述目标待识别图像为彩色图像,则计算所述彩色图像中各像素点的各颜色通道的梯度幅值,以及所述各颜色通道的梯度幅值对应的梯度方向。
在上述实施例的基础上,所述装置还可以包括:
主成分提取单元,用于提取所述目标待识别图像的方向梯度直方图特征向量的主成分特征向量,将所述目标待识别图像的方向梯度直方图特征向量更新为所述主成分特征向量。
在上述实施例的基础上,所述主成分提取单元还可以包括:
第一矩阵获取子单元,用于将所述目标待识别图像的方向梯度直方图特征向量排列成第一矩阵,计算所述第一矩阵的方向梯度直方图特征向量均值;
协方差矩阵计算子单元,用于根据计算式
Figure BDA0001510600960000221
计算所述第一矩阵的协方差矩阵,其中,xi表示所述第一矩阵的元素,
Figure BDA0001510600960000222
表示所述第一矩阵的方向梯度直方图特征向量均值,N表示所述目标待识别图像的方向梯度直方图特征向量的个数,UT表示为协方差矩阵;
第二矩阵获取子单元,用于计算所述协方差矩阵中方向梯度直方图特征向量对应的模值,按照预设顺序对所述模值进行排序操作之后,顺序获取排序结果中预设数量的所述模值,将所述模值对应的方向梯度直方图特征向量排列成第二矩阵;
主成分获取子单元,用于根据计算式
Figure BDA0001510600960000231
计算所述目标待识别图像的方向梯度直方图特征向量的主成分特征向量,将所述目标待识别图像的方向梯度直方图特征向量更新为所述主成分特征向量,其中,xi表示所述第二矩阵的元素,
Figure BDA0001510600960000232
表示所述第二矩阵的方向梯度直方图特征向量均值。
在上述实施例的基础上,所述装置还包括:
第一训练单元,用于获取预处理的训练样本图像,所述训练样本图像包括正训练样本图像以及负训练样本图像,其中,所述正训练样本图像包括处于选中状态的复选框,所述负训练样本图像包括处于非选中状态的复选框;
第二训练单元,用于按照不同的预设尺度对所述训练样本图像执行与所述不同的预设尺度对应的分块操作,获取分块图像,提取所述分块图像的方向梯度直方图特征向量,并获取所述训练样本图像的方向梯度直方图特征向量;
第三训练单元,用于提取所述训练样本图像的方向梯度直方图特征向量的主成分特征向量,将所述训练样本图像的方向梯度直方图特征向量的主成分特征向量输入至支持向量机分类器中进行训练,获取初始支持向量机分类模型;
第四训练单元,用于建立目标训练样本,将所述目标训练样本输入至所述初始支持向量机分类模型,获取初始支持向量机分类模型的错误分类结果,将所述错误分类结果加入至所述训练样本图像重新进行训练,获取最终的支持向量机分类模型。
在上述实施例的基础上,所述第四训练单元可以包括:
目标负样本图像集建立子单元,用于建立与预设窗口大小相等的不同分辨率的目标负样本图像集;
错误分类结果获取子单元,用于将所述不同分辨率的目标负样本图像集输入至所述初始支持向量机分类模型,获取所述初始支持向量机分类模型的错误分类结果;
重新训练子单元,用于将所述错误分类结果输入至所述训练样本图像重新进行训练,获取最终的支持向量机分类模型。
本发明实施例提供的基于支持向量机的复选框选择状态的识别装置可执行本发明任意实施例提供的基于支持向量机的复选框选择状态的识别方法,具备执行基于支持向量机的复选框选择状态的识别方法相应的功能模块和有益效果。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (5)

1.一种基于支持向量机的复选框选择状态的识别方法,其特征在于,包括:
获取预处理的目标待识别图像;
按照不同的预设尺度对所述目标待识别图像执行与所述不同的预设尺度对应的分块操作,获取分块图像,提取所述分块图像的方向梯度直方图特征向量,并获取所述目标待识别图像的方向梯度直方图特征向量;
将所述目标待识别图像的方向梯度直方图特征向量输入至训练后的支持向量机分类模型中,获取识别结果;
所述按照不同的预设尺度对所述目标待识别图像执行与所述不同的预设尺度对应的分块操作,获取分块图像,提取所述分块图像的方向梯度直方图特征向量,包括:
计算所述目标待识别图像中各像素点的梯度值,所述梯度值包括梯度幅值以及梯度方向;
按照第一预设尺度对所述目标待识别图像执行与所述第一预设尺度对应的分块操作,获取区域分块图像;
按照第二预设尺度对所述区域分块图像执行与所述第二预设尺度对应的分块操作,获取子区域分块图像;
按照预设的梯度方向区间,统计所述子区域分块图像中各个所述梯度方向区间对应的梯度幅值,将统计结果作为所述子区域分块图像的方向梯度直方图特征向量;
所述获取所述目标待识别图像的方向梯度直方图特征向量,包括:
根据计算式
Figure FDF0000016847110000011
对所述子区域分块图像的方向梯度直方图特征向量进行归一化操作,其中,v表示所述子区域分块图像的方向梯度直方图特征向量,||v||表示v的L2范数,e表示偏移量,f表示所述子区域分块图像的方向梯度直方图特征向量的归一化结果;
将所述目标待识别图像中所有归一化后的所述子区域分块图像的方向梯度直方图特征向量按照预设的选取标准顺序排列,构成所述目标待识别图像的方向梯度直方图特征向量;
根据计算公式
Figure FDF0000016847110000021
对所述目标待识别图像的方向梯度直方图特征向量进行标准化操作,获取标准化的所述目标待识别图像的方向梯度直方图特征向量,其中,v表示所述目标待识别图像的方向梯度直方图特征向量,μn表示所述目标待识别图像的方向梯度直方图特征向量的均值,σn表示所述目标待识别图像的方向梯度直方图特征向量的方差,v'表示标准化结果;
其中,按将所述目标待识别图像的方向梯度直方图特征向量输入至所述训练后的支持向量机分类模型中,获取所述识别结果之前,还包括:
获取预处理的训练样本图像,所述训练样本图像包括正训练样本图像以及负训练样本图像,其中,所述正训练样本图像包括处于选中状态的复选框,所述负训练样本图像包括处于非选中状态的复选框;
按照不同的预设尺度对所述训练样本图像执行与所述不同的预设尺度对应的分块操作,获取所述分块图像,提取所述分块图像的方向梯度直方图特征向量,并获取所述训练样本图像的方向梯度直方图特征向量;
提取所述训练样本图像的方向梯度直方图特征向量的主成分特征向量,将所述训练样本图像的方向梯度直方图特征向量的主成分特征向量输入至支持向量机分类器中进行训练,获取初始支持向量机分类模型;
建立目标训练样本,将所述目标训练样本输入至所述初始支持向量机分类模型,获取所述初始支持向量机分类模型的错误分类结果,将所述错误分类结果加入至所述训练样本图像重新进行训练,获取最终的支持向量机分类模型;
其中,所述建立目标训练样本,将所述目标训练样本输入至所述初始支持向量机分类模型,获取所述初始支持向量机分类模型的错误分类结果,将所述错误分类结果加入至所述训练样本图像重新进行训练,获取最终的支持向量机分类模型,包括:
建立与预设窗口大小相等的不同分辨率的目标负样本图像集;
将所述不同分辨率的目标负样本图像集输入至所述初始支持向量机分类模型,获取所述初始支持向量机分类模型的错误分类结果;
将所述错误分类结果输入至所述训练样本图像重新进行训练,获取最终的支持向量机分类模型;
其中,所述建立与预设窗口大小相等的不同分辨率的目标负样本图像集,包括:
对所述负训练样本图像进行多次缩放处理,得到不同分辨率的负训练样本图像,在不同分辨率的负训练样本图像中截取预设窗口大小的图像,组成所述目标负样本图像集;
其中,获取预处理的目标待识别图像包括:
滤除所述目标待识别图像的噪声;
按照预设图像大小,对所述目标待识别图像进行重采样;
对所述重采样的目标待识别图像进行伽马校正,获取所述目标待识别图像的预处理结果。
2.根据权利要求1所述的方法,其特征在于,计算所述目标待识别图像中各像素点的梯度幅值,以及梯度幅值对应的梯度方向,包括:
如果所述目标待识别图像为灰度图像,则根据计算式
Figure FDF0000016847110000041
计算出所述目标待识别图像中各像素点的梯度幅值,其中,G(x,y)表示像素点的梯度幅值,α(x,y)表示像素点的梯度方向,所述梯度方向为像素点垂直方向梯度幅值与水平方向梯度幅值的一阶倒数,H(X,Y)表示像素点的灰度值;
如果所述目标待识别图像为彩色图像,则计算所述彩色图像中各像素点的各颜色通道的梯度幅值,以及所述各颜色通道的梯度幅值对应的梯度方向。
3.根据权利要求1所述的方法,其特征在于,按照不同的预设尺度对所述目标待识别图像执行与所述不同的预设尺度对应的分块操作,获取分块图像,提取所述分块图像的方向梯度直方图特征向量,并获取所述目标待识别图像的方向梯度直方图特征向量之后,还包括:
提取所述目标待识别图像的方向梯度直方图特征向量的主成分特征向量,将所述目标待识别图像的方向梯度直方图特征向量更新为所述主成分特征向量。
4.根据权利要求3所述的方法,其特征在于,提取所述目标待识别图像的方向梯度直方图特征向量的主成分特征向量,将所述目标待识别图像的方向梯度直方图特征向量更新为所述主成分特征向量,包括:
将所述目标待识别图像的方向梯度直方图特征向量排列成第一矩阵,计算所述第一矩阵的方向梯度直方图特征向量均值;
根据计算式
Figure FDF0000016847110000051
计算所述第一矩阵的协方差矩阵,其中,xi表示所述第一矩阵的元素,
Figure FDF0000016847110000052
表示所述第一矩阵的方向梯度直方图特征向量均值,N表示所述目标待识别图像的方向梯度直方图特征向量的个数,UT表示为协方差矩阵;
计算所述协方差矩阵中方向梯度直方图特征向量对应的模值,按照预设顺序对所述模值进行排序操作之后,顺序获取排序结果中预设数量的所述模值,将所述模值对应的方向梯度直方图特征向量排列成第二矩阵;
根据计算式
Figure FDF0000016847110000053
计算所述目标待识别图像的方向梯度直方图特征向量的主成分特征向量,将所述目标待识别图像的方向梯度直方图特征向量更新为所述主成分特征向量,其中,xi表示所述第二矩阵的元素,
Figure FDF0000016847110000054
表示所述第二矩阵的方向梯度直方图特征向量均值。
5.一种基于支持向量机的复选框选择状态的识别装置,其特征在于,包括:
预处理模块,用于获取预处理的目标待识别图像;
特征向量获取模块,用于按照不同的预设尺度对所述目标待识别图像执行与所述不同的预设尺度对应的分块操作,获取分块图像,提取所述分块图像的方向梯度直方图特征向量,并获取所述目标待识别图像的方向梯度直方图特征向量;
所述特征向量获取模块包括:
梯度值计算单元,用于计算所述目标待识别图像中各像素点的梯度值,所述梯度值包括梯度幅值以及梯度方向;
第一分块单元,用于按照第一预设尺度对所述目标待识别图像执行与所述第一预设尺度对应的分块操作,获取区域分块图像;
第二分块单元,用于按照第二预设尺度对所述区域分块图像执行与所述第二预设尺度对应的分块操作,获取子区域分块图像;
统计单元,用于按照预设的梯度方向区间,统计所述子区域分块图像中各个所述梯度方向区间对应的梯度幅值,将统计结果作为所述子区域分块图像的方向梯度直方图特征向量;
归一化单元,用于根据计算式
Figure FDF0000016847110000061
对所述子区域分块图像的方向梯度直方图特征向量进行归一化操作,其中,v表示所述子区域分块图像的方向梯度直方图特征向量,||v||表示v的L2范数,e表示偏移量,f表示所述子区域分块图像的方向梯度直方图特征向量的归一化结果;
方向梯度直方图特征向量获取单元,用于将所述目标待识别图像中所有归一化后的所述子区域分块图像的方向梯度直方图特征向量按照预设的选取标准顺序排列,构成所述目标待识别图像的方向梯度直方图特征向量;
标准化单元,用于根据计算公式
Figure FDF0000016847110000062
对所述目标待识别图像的方向梯度直方图特征向量进行标准化操作,获取标准化的所述目标待识别图像的方向梯度直方图特征向量,其中,v表示所述目标待识别图像的方向梯度直方图特征向量,μn表示所述目标待识别图像的方向梯度直方图特征向量的均值,σn表示所述目标待识别图像的方向梯度直方图特征向量的方差,v'表示标准化结果;
识别模块,用于将所述目标待识别图像的方向梯度直方图特征向量输入至训练后的支持向量机分类模型中,获取识别结果;
第一训练单元,用于获取预处理的训练样本图像,所述训练样本图像包括正训练样本图像以及负训练样本图像,其中,所述正训练样本图像包括处于选中状态的复选框,所述负训练样本图像包括处于非选中状态的复选框;
第二训练单元,按照不同的预设尺度对所述训练样本图像执行与所述不同的预设尺度对应的分块操作,获取所述分块图像,提取所述分块图像的方向梯度直方图特征向量,并获取所述训练样本图像的方向梯度直方图特征向量;
第三训练单元,提取所述训练样本图像的方向梯度直方图特征向量的主成分特征向量,将所述训练样本图像的方向梯度直方图特征向量的主成分特征向量输入至支持向量机分类器中进行训练,获取初始支持向量机分类模型;
第四训练单元,建立目标训练样本,将所述目标训练样本输入至所述初始支持向量机分类模型,获取所述初始支持向量机分类模型的错误分类结果,将所述错误分类结果加入至所述训练样本图像重新进行训练,获取最终的支持向量机分类模型;
其中,所述第四训练单元包括:
目标负样本图像集建立子单元,用于建立与预设窗口大小相等的不同分辨率的目标负样本图像集;
错误分类结果获取子单元,用于将所述不同分辨率的目标负样本图像集输入至所述初始支持向量机分类模型,获取所述初始支持向量机分类模型的错误分类结果;
重新训练子单元,用于将所述错误分类结果输入至所述训练样本图像重新进行训练,获取最终的支持向量机分类模型;
其中,所述建立与预设窗口大小相等的不同分辨率的目标负样本图像集,包括:
对所述负训练样本图像进行多次缩放处理,得到不同分辨率的负训练样本图像,在不同分辨率的负训练样本图像中截取预设窗口大小的图像,组成所述目标负样本图像集;
其中,所述预处理模块包括:
去噪单元,用于滤除所述目标待识别图像的噪声;
重采样单元,用于按照预设图像大小,对所述目标待识别图像进行重采样;
校正单元,用于对所述重采样的目标待识别图像进行伽马校正,获取所述目标待识别图像的预处理结果。
CN201711352905.5A 2017-12-15 2017-12-15 一种基于支持向量机的复选框选择状态的识别方法及装置 Active CN108108753B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711352905.5A CN108108753B (zh) 2017-12-15 2017-12-15 一种基于支持向量机的复选框选择状态的识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711352905.5A CN108108753B (zh) 2017-12-15 2017-12-15 一种基于支持向量机的复选框选择状态的识别方法及装置

Publications (2)

Publication Number Publication Date
CN108108753A CN108108753A (zh) 2018-06-01
CN108108753B true CN108108753B (zh) 2022-08-19

Family

ID=62217462

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711352905.5A Active CN108108753B (zh) 2017-12-15 2017-12-15 一种基于支持向量机的复选框选择状态的识别方法及装置

Country Status (1)

Country Link
CN (1) CN108108753B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109299734B (zh) * 2018-09-13 2023-12-19 北京字节跳动网络技术有限公司 侵权图片的识别方法、装置和计算机可读存储介质
CN110188624A (zh) * 2019-05-10 2019-08-30 国网福建省电力有限公司龙岩供电公司 一种基于深度学习的变电站风漂物识别方法及系统
CN110569721B (zh) * 2019-08-01 2023-08-29 平安科技(深圳)有限公司 识别模型训练方法、图像识别方法、装置、设备及介质
CN110659574B (zh) * 2019-08-22 2022-02-22 北京易道博识科技有限公司 文档图像勾选框状态识别后输出文本行内容的方法及系统
CN111968126B (zh) * 2020-06-30 2023-10-17 上海艾策通讯科技股份有限公司 页面焦点识别方法、装置、计算机设备和存储介质
CN112560870B (zh) * 2020-12-15 2022-04-29 哈尔滨工程大学 一种用于水下复杂环境中的图像目标识别方法
CN113920329A (zh) * 2021-11-08 2022-01-11 北京九州安华信息安全技术有限公司 一种基于梯度直方图的特征提取方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104881663A (zh) * 2015-05-13 2015-09-02 京北方信息技术股份有限公司 辨别复选框的选定结果的方法及装置
CN105335753A (zh) * 2015-10-29 2016-02-17 小米科技有限责任公司 图像识别方法和装置
CN105426905A (zh) * 2015-11-02 2016-03-23 国网山东省电力公司电力科学研究院 基于梯度直方图和支持向量机的机器人障碍物识别方法
US9460354B2 (en) * 2012-11-09 2016-10-04 Analog Devices Global Object detection

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9639777B1 (en) * 2015-12-17 2017-05-02 Linear Algebra Technologies Limited Systems and methods for providing an image classifier

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9460354B2 (en) * 2012-11-09 2016-10-04 Analog Devices Global Object detection
CN104881663A (zh) * 2015-05-13 2015-09-02 京北方信息技术股份有限公司 辨别复选框的选定结果的方法及装置
CN105335753A (zh) * 2015-10-29 2016-02-17 小米科技有限责任公司 图像识别方法和装置
CN105426905A (zh) * 2015-11-02 2016-03-23 国网山东省电力公司电力科学研究院 基于梯度直方图和支持向量机的机器人障碍物识别方法

Also Published As

Publication number Publication date
CN108108753A (zh) 2018-06-01

Similar Documents

Publication Publication Date Title
CN108108753B (zh) 一种基于支持向量机的复选框选择状态的识别方法及装置
WO2021027336A1 (zh) 基于印章和签名的身份验证方法、装置和计算机设备
CN110060237B (zh) 一种故障检测方法、装置、设备及系统
CN109658584B (zh) 一种票据信息识别方法及装置
WO2017020723A1 (zh) 一种字符分割方法、装置及电子设备
CN110032998B (zh) 自然场景图片的文字检测方法、系统、装置和存储介质
CN110135514B (zh) 一种工件分类方法、装置、设备及介质
US20170091948A1 (en) Method and system for automated analysis of cell images
CN112419299A (zh) 一种螺栓缺失检测方法、装置、设备及存储介质
CN102982305A (zh) 信息处理设备和处理信息的方法、存储介质以及程序
CN108009567B (zh) 一种结合图像颜色及hog和svm的粪便性状的自动辨别方法
CN111539330B (zh) 一种基于双svm多分类器的变电站数显仪表识别方法
CN111680690A (zh) 一种文字识别方法及装置
KR101232683B1 (ko) 베이시안 접근법을 이용한 권종 인식 방법
CN111881923A (zh) 一种基于特征匹配的票据要素提取方法
CN115147418A (zh) 缺陷检测模型的压缩训练方法和装置
CN113421223B (zh) 基于深度学习和高斯混合的工业产品表面缺陷检测方法
CN106709490B (zh) 一种字符识别方法和装置
EP3660731A1 (en) Digitization of industrial inspection sheets by inferring visual relations
Ghugardare et al. Optical character recognition system for seven segment display images of measuring instruments
CN111914706B (zh) 一种文字检测输出结果质量检测和控制的方法与装置
CN111539931A (zh) 一种基于卷积神经网络和边界限定优化的外观异常检测方法
CN108647713B (zh) 胚胎边界识别与激光轨迹拟合方法
CN108197663B (zh) 基于对偶集合多标记学习的书法作品图像分类方法
CN113177602B (zh) 图像分类方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant