CN104463240A - 一种控制列表界面的方法及装置 - Google Patents

一种控制列表界面的方法及装置 Download PDF

Info

Publication number
CN104463240A
CN104463240A CN201310442513.3A CN201310442513A CN104463240A CN 104463240 A CN104463240 A CN 104463240A CN 201310442513 A CN201310442513 A CN 201310442513A CN 104463240 A CN104463240 A CN 104463240A
Authority
CN
China
Prior art keywords
instrument
feature
model
gradient
orientation histogram
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310442513.3A
Other languages
English (en)
Other versions
CN104463240B (zh
Inventor
王全明
罗元泰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Launch Digital Technology Co Ltd
Original Assignee
Shenzhen Launch Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Launch Digital Technology Co Ltd filed Critical Shenzhen Launch Digital Technology Co Ltd
Priority to CN201310442513.3A priority Critical patent/CN104463240B/zh
Publication of CN104463240A publication Critical patent/CN104463240A/zh
Application granted granted Critical
Publication of CN104463240B publication Critical patent/CN104463240B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]

Abstract

本发明适用于仪表定位领域,提供了一种仪表定位方法及装置,所述方法包括下述步骤:收集仪表的梯度方向直方图特征;通过线性支持向量机对收集到的仪表梯度方向直方图特征进行训练,获取识别仪表的模型;基于识别仪表的模型对仪表进行初步定位,再根据特征点匹配对仪表进行精确定位。本发明通过梯度方向直方图特征获取仪表特征点,继而根据仪表的特征获取仪表的识别模型,之后通过梯度方向直方图特征对仪表进行初步定位,再通过对特征点进行匹配精确定位出仪表。

Description

一种控制列表界面的方法及装置
技术领域
本发明属于仪表定位领域,尤其涉及一种仪表定位方法及装置。
背景技术
梯度方向直方图HOG(Histogram of Oriented Gradient)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度方向直方图来构成特征,主要用于提取人体的外形信息和运动信息,形成丰富的特征集。HOG特征描述器最重要的思想是:在一副图像中,局部目标的表象和形状能够被梯度或者边缘的方向密度分布很好地描述。HOG特征可以用于图像中的行人检测、常见动物检测、汽车、公交车、自行车、摩托车等常见车辆检测,HOG用于行人检测时,只要行人大体上能够保持直立的姿势,就容许行人有一些细微的肢体动作,这些细微的动作可以被忽略而不影响检测效果,由于HOG特征描述器的这些特征使得HOG无法直接用于对较小的仪表进行精确的识别。
发明内容
本发明实施例的目的在于提供一种仪表定位方法及装置,旨在提供一种仪表定位方法,通过梯度方向直方图特征获取仪表特征点,继而根据仪表的特征获取仪表的识别模型,之后通过梯度方向直方图特征对仪表进行初步定位,再通过对特征点进行匹配精确定位出仪表。
本发明实施例是这样实现的,一种仪表定位方法,所述方法包括下述步骤:
收集仪表的梯度方向直方图特征;通过线性支持向量机对收集到的仪表梯度方向直方图特征进行训练,获取识别仪表的模型;
基于识别仪表的模型对仪表进行初步定位,再根据特征点匹配对仪表进行精确定位。
进一步的,所述收集仪表的梯度方向直方图特征的步骤包括:
收集仪表正负样本图像;
对图像进行归一化处理,计算图像梯度,获取仪表的梯度方向直方图特征。
进一步的,所述通过线性支持向量机对收集到的仪表梯度方向直方图特征进行训练,获取识别仪表的模型的步骤包括:
通过线性支持向量机对收集到的仪表梯度方向直方图特征进行训练;
根据训练结果获取识别仪表的模型。
进一步的,所述基于识别仪表的模型对仪表进行初步定位,再根据特征点匹配对仪表进行精确定位的步骤包括:
基于识别仪表的模型对仪表进行初步定位;
根据初步定位构建图像的尺度空间,精确定位特征点;
根据特征点对构建的图像尺度空间进行识别匹配,精确定位出仪表。
本发明实施例的另一目的在于提供一种仪表定位装置,所述装置包括:
特征获取定位单元,用于收集仪表的梯度方向直方图特征;
训练单元,用于通过线性支持向量机对收集到的仪表梯度方向直方图特征进行训练,获取识别仪表的模型;
定位单元,用于基识别仪表的模型对仪表进行初步定位,再根据特征点匹配对仪表进行精确定位。
进一步的,所述特征获取单元包括:
样本收集单元,用于收集仪表正负样本图像;
特征获取单元,用于对图像进行归一化处理,计算图像梯度,获取仪表的梯度方向直方图特征。
进一步的,所述训练单元包括:
模型建立单元,用于通过线性支持向量机对收集到的仪表梯度方向直方图特征的正负样本进行训练,
模型获取单元,用于根据训练结果获取识别仪表的模型。
进一步的,所述定位单元包括:
初步定位单元,用于基于识别仪表的模型对仪表进行初步定位;
尺度空间构建单元,用于根据初步定位构建图像的尺度空间,精确定位特征点;
精确定位单元,用于根据特征点对构建的图像尺度空间进行识别匹配,精确定位出仪表。
本发明实施例通过一种仪表定位方法及装置,收集仪表的梯度方向直方图特征;通过线性支持向量机对收集到的仪表梯度方向直方图特征进行训练,获取识别仪表的模型;基于识别仪表的模型对仪表进行初步定位,再根据特征点匹配对仪表进行精确定位,使得可以实现对较小的仪表进行精确的定位,同时通过这种方式对仪表进行精确定位客服了现有复杂场景中的仪表检测技术的不足,并且这种仪表定位方式能够适应复杂场景中不同类型的仪表,同时通过梯度方向直方图特征进行初步定位以及特征点进行精确定位在计算时能够提高计算速度,很好地平衡检测精度与检测速度。
附图说明
图1是本发明第一实施例提供的一种仪表定位方法的实现流程图;
图2是本发明第二实施例提供的一种仪表定位方法的实现流程图;
图3是本发明第二实施例提供的一种仪表定位方法的定位特征点主方向的示意图;
图4是本发明第二实施例提供的一种仪表定位方法的像素梯度幅值与梯度方向示意图;
图5是本发明第三实施例提供的一种仪表定位装置的结构图;以及
图6是本发明第四实施例提供的一种仪表定位装置的结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
以下结合具体实施例对本发明的具体实现进行详细描述:
实施例一:
图1示出了本发明第一实施例提供的一种仪表定位方法的实现流程,详述如下:
S101,收集仪表的梯度方向直方图特征。
根据获取到的正负样本图像,从图像中收集仪表的梯度方向直方图HOG特征,HOG特征是在一副图像中,局部目标的表象和形状能够被梯度或者边缘的方向密度分布很好地描述。与其他特征描述方法相比,HOG描述器有很多优点。首先,由于HOG计算是在图像的局部胞元(cell)上操作,所以它对图像几何和光学的形变都能够保持很好的不变性,几何和光学的形变只会出现在更大的空间领域上;实验证明,在粗的空域抽样、精细的方向抽样以及较强的局部光学归一化等条件下,只要行人大体上能够保持直立的姿势,就容许行人有一些细微的肢体动作,这些细微的动作可以被忽略而不影响检测效果。
S102,通过线性支持向量机对收集到的仪表梯度方向直方图特征进行训练,获取识别仪表的模型。
通过线性支持向量SVM对收集到的仪表梯度方向直方图特征进行训练,根据收集到的仪表梯度方向直方图特征不断进行训练,使得重复训练后的识别仪表的模型能够快速的对样本进行识别,并降低误报的概率,通过不断的重复训练提升识别仪表模型的效率和正确率。
S103,基于识别仪表的模型对仪表进行初步定位,再根据特征点匹配对仪表进行精确定位。
首先通过识别仪表的模型对仪表进行初步定位,再根据特征点匹配对仪表进行精确定位,从图像中找出仪表的特征点并精确定位出仪表的位置,以实现可以清晰的读取仪表的数据。使得可以在监控视频中从复杂的场景中检测出仪表,并通过监控视频的图像读出仪表的数据。
本发明实施例通过上述方式,一种仪表定位方法,通过收集仪表的梯度方向直方图特征;通过线性支持向量机对收集到的仪表梯度方向直方图特征进行训练,获取识别仪表的模型;基于识别仪表的模型对仪表进行初步定位,再根据特征点匹配对仪表进行精确定位,客服了现有复杂场景中的仪表检测技术的不足,能够识别复杂场景中不同类型的仪表,同时通过梯度方向直方图特征在计算时能够提高计算速度,很好地平衡检测精度与检测速度,实现对仪表的快速定位。
实施例二:
图2示出了本发明第二实施例提供的一种控制列表界面的方法的实现流程,详述如下:
S201,收集仪表正负样本图像。
首先收集仪表的正负样本,正样本为含有仪表的图像,负样本为干扰图像,根据具体识别仪表的场景的不同可以在样本中添加不同的正负样本,正负样本的数量和样本图像的复杂度将直接决定所能获取得到的仪表的特征,同时正负样本的数量和背景的复杂程度也对最终识别的模型有较大的影响,好的样本能够在算法不变的情况下,达到较好的泛化效果。根据实际实验结果,正样本的选取中,尽量选择单一背景或者与检测场景无关的简单背景,这样能够准确反应目标的外形。负样本的选取,除了选择和目标无关的样本外,还可以适当添加一些检测场景中可能出现的背景。背景过于复杂的正样本,因为过于复杂的背景,会降低SVM的泛化能力,达到同样的效果,需要更多次数的困难样本重复训练。
S202,对图像进行归一化处理,计算图像梯度,获取仪表的梯度方向直方图特征。
首先为了减少光照因素的影响,首先需要将用于识别仪表的整个图像进行归一化处理。在图像的纹理强度中,局部的表层曝光贡献的比重比较大,所以,这种压缩处理能够有效地降低图像局部阴影和光照的变化;另外因为颜色信息的作用不大,通常在计算HOG特征时,将图像转化成灰度图。
归一化公式如下:
I(x,y)=I(x,y)gamma
其中gamma通常取0.5。
计算图像梯度,计算图像水平方向和垂直方向的梯度,并据此计算每个像素为主的梯度方向值;求导操作不仅能够捕获轮廓、人影和一些纹理信息,还能够进一步弱化光照的影响。
图像中像素点(x,y)的梯度为:
Gx(x,y)=H(x+1,y)-H(x-1,y)
Gy(x,y)=H(x,y+1)-H(x,y-1)
上式中Gx(x,y),Gy(x,y),H(x,y)分别表示图像中点(x,y)处的水平方向和垂直方向的梯度以及像素值,像素点(x,y)处的梯度幅值和梯度方向分别为:
G ( x , y ) = G x ( x , y ) 2 + G y ( x , y ) 2
α ( x , y ) = tan - 1 ( G y ( x , y ) G x ( x , y ) )
最常用的方法是,首先用[-1,0,1]的梯度算子对原图像做卷积运算,得到x方向(即水平方向,向右为正方向)的梯度分量gradscalx;然后用[-1,0,1]T梯度算子对原图像做卷积运算,得到y方向(即垂直方向,以向上为正方向)的梯度分量gradscaly,然后再利用以上公式计算该像素点的梯度大小和方向。
为了每个胞元建立梯度方向直方图,目的是为局部图像区域提供一个编码,同时能够保持对图像中目标对象的姿势和外观的弱敏感性。每个胞元的梯度方向被划分为梯度方向数,每个梯度方向按照该梯度方向的幅值大小进行统计。
其中需要说明的是,HOG特征描述是由一系列的胞元,块、块滑动量窗口、和梯度方向数组成的。
其中胞元是最小组成单元,通常由nxn个像素组成。每一个胞元的梯度按照方向分为梯度方向数组,方向具有有向(360°)和无向(180°)。一般采用的梯度方向数=9的分组方式,每组角度范围为20°。mxm个胞元组成了一个块。如2x2的4个胞元组成一个块。每个块通过滑动块的方式,遍历整个HOG窗口,HOG特征对待检测图像通过多尺度缩放的金字塔方式检测,被检测目标的窗口大小应该大于等于HOG特征的检测窗口。一个HOG特征窗口包含了x个块。为每个胞元建立梯度方向直方图,目的是为局部图像区域提供一个编码,同时能够保持对图像中目标对象的姿势和外观的弱敏感性。每个胞元的梯度方向被划分为梯度方向数个,每个梯度方向数按照该梯度方向的幅值大小进行统计。将所有的胞元在包含其的块上进行L2-Hys归一化。L2-Hys归一化就是先对向量进行L2-Norm归一化,然后对结果进行截断,然后在重新归一化得到。L2-Norm归一化即是计算向量的欧氏距离。L2-Hys的算法如下:
L 2 norm ( v ) = Σ v k 2 k = 1 n
v=L2norm(v)
v(v>threshold)=threshold
v=L2norm(v)
归一化能够进一步对光照、阴影和边缘进行压缩。通常,每个胞元由多个不同的块共享,但他们的归一化是基于不同的块进行的,所以计算的结果也不一样。因此,一个胞元的特征会以不同的结果多次出现在最后的向量中,我们将归一化后的块描述符称为HOG描述符,最终获取仪表的梯度方向直方图特征。
S203,通过线性支持向量机对收集到的仪表梯度方向直方图特征进行训练,根据训练结果获取识别仪表的模型。
利用Libsvm的库函数编写训练程序,其中具体的训练程序train.exe的配置参数如下:
train64.exe-t0-c1-b1train train.model。
-t0是选择SVM核函数类型为LINEAR。
-c1是设置SVM的C参数为1。
train train.model是设置SVM训练模型文件路径。其他都采用默认参数。
进行LibSVM训练后,对测试样本进行检测,测试精度和误报率。其中优选的测试时采用K-折交叉验证。第一次训练后,测试视频,会发现很多误报。初次训练得到的模型除了会检测到仪表以外,还会检测到很多非仪表所在的区域。这是训练所用的负样本不够所导致的,误检窗口太多,导致在最终关联窗口合并时,会形成一个始终在中心抖动的窗口,不论仪表是否移动,窗口始终在图像中心,这就是过拟合。是因为训练的负样本相对不足,使得SVM不能根据现有的负样本把正样本中的背景给弱化掉,减弱了对目标的泛化能力。这些误报窗口所形成的样本,称之为困难样本。为了减少误报,需要根据不同场景做多次困难样本的重复训练,即不断把困难样本添加到负样本中进行训练。将困难样本添加到负样本中重复训练后,误报率明显降低,误报降低的同时,算法的检测速度也相对提升,因为需要合并的窗口大大减少了。通过线性支持向量机对收集到的仪表梯度方向直方图特征的正负样本进行训练,获取识别仪表的模型。
S204,基于识别仪表的模型对仪表进行初步定位。
基于识别仪表的模型对仪表进行初步定位,通过对仪表的初步定位可以判断出仪表的正负样本,同时对仪表的初步定位可以在进行精确定位时减少对图像定位时的计算量。
S205,根据初步定位构建图像的尺度空间,精确定位特征点。
图像的尺度空间是图像在不同解析度下的表示,一幅图像J(X)在不同解析度下的表示可以利用高斯核G(t)的卷积来实现,图像的尺度大小一般用高斯标准差来表示。在计算视觉领域,尺度空间被象征性的表述为一个图像金字塔,其中,输入图像函数反复与高斯函数的核卷积并反复对其进行二次抽样,其中优选的采用SURF算法使原始图像保持不变而只改变滤波器大小。这样就使得构建尺度空间的运算可以并行进行,根据初步定位构建图像的尺度空间就具有更高的执行效率,通过构建的图像尺度空间,精确定位出仪表的特征点。
S206,根据特征点对构建的图像尺度空间进行识别匹配,精确定位出仪表。
通过构建的图像尺度空间,精确定位出仪表的特征点之后,直接在构建的尺度空间上跟一个预设极值进行比较,所有小于预设极值的取值都被丢弃,增加极值使检测到的特征点数量减少,最终只有几个特征最强点会被检测出来。检测过程中使用与该尺度层图像解析度相对应大小的滤波器进行检测,以3×3的滤波器为例,初步检测到的特征点与自身尺度层中其余8个点和在其之上及之下的两个尺度层9个点进行比较,共26个点,若像素点中的特征值大于周围像素则可确定该点为该区域的特征点。为保证旋转不变性,首先以特征点为中心,计算半径为6S(S为特征点所在的尺度值)的邻域内的点在z、y方向的Haar小波(Haar小波边长取4s)响应,并给这些响应值赋高斯权重系数,使得靠近特征点的响应贡献大,而远离特征点的响应贡献小,其次将60度范围内的响应相加以形成新的矢量,遍历整个圆形区域,选择最长矢量的方向为该特征点的主方向。这样,通过特征点逐个进行计算,得到每一个特征点的主方向,如图3所示。
将坐标轴旋转为关键点的方向,以确保旋转不变性。接下来以关键点为中心取8×8的窗口。通过确定关键点的位置,每个关键点的邻域所在尺度空间为一个像素,利用公式求得每个像素的梯度幅值与梯度方向,如图4所示,通过箭头方向代表该像素的梯度方向,箭头长度代表梯度模值,然后用高斯窗口对其进行加权运算,每个像素对应一个向量,长度为该像素点的高斯权值,方向为图中的圈代表高斯加权的范围(越靠近关键点的像素梯度方向信息贡献越大)。然后在每4×4的小块上计算8个方向的梯度方向直方图,绘制每个梯度方向的累加值,即可形成一个种子点,如图右部分示。此图中一个关键点由2×2共4个种子点组成,每个种子点有8个方向向量信息。这种邻域方向性信息联合的思想增强了算法抗噪声的能力,同时对于含有定位误差的特征匹配也提供了较好的容错性。
通过采用Henssian矩阵获取图像局部的最值还是十分稳定的,但是在求主方向阶段太过于依赖局部区域像素的梯度方向,有可能使得找到的主方向不准确,后面的特征向量提取以及匹配都严重依赖于主方向,即使不大偏差角度也可以造成后面特征匹配的放大误差,从而匹配不成功;另外图像金字塔的层取得不足够紧密也会使得尺度有误差,后面的特征向量提取同样依赖相应的尺度,通过采用折中解决方法是取适量的层然后进行插值。分别在模板图像和实际图像中寻找特征点并进行特征点匹配就可以实现仪表的精确定位。根据识别仪表的模型对构建的图像尺度空间进行识别,精确定位出仪表。
本发明实施例通过上述方式,一种控制列表界面的方法,克服了现有复杂场景中的仪表检测技术的不足,能够适应复杂场景中不同类型的仪表,通过收集各种仪表的正负样本并提取HOG特征,同时利用线性SVM进行训练、检测,为了能够准确地识别仪表的读数,采用了特征点匹配的算法实现仪表的精确定位。通过采用的HOG特征可以充分利用了图像边缘的多种属性,如边缘的方向特性、结构特性,能够准确地描述仪表的统计特征,能够准确地实现仪表在视频图像中的初步定位。实现初步定位之后,又采用了特征点匹配的方式来实现仪表的精确定位,由于采用的特征点具有属于图像的局部特征,对平移、旋转、尺度缩放、亮度变化、遮挡和噪声等具有良好的不变性,对视觉变化、仿射变换也保持一定程度的稳定性,所以在实际应用中具有较强的适应性,能够实现各种仪表的精确定位。同时,HOG特征在计算时能够充分利用积分图等技术来提高计算速度,在初步定位以后再进行特征点的精确定位能够很好地平衡检测精度与检测速度。
实施例三:
图5示出了本发明第三实施例提供的一种控制列表界面的装置的结构图,为了便于说明,仅示出了与本发明实施例相关的部分。
特征获取定位单元51,用于收集仪表的梯度方向直方图特征。
特征获取定位单元根据获取到的图像,从图像中收集仪表的梯度方向直方图HOG特征,HOG特征是在一副图像中,局部目标的表象和形状能够被梯度或者边缘的方向密度分布很好地描述。与其他特征描述方法相比,HOG描述器有很多优点。首先,由于HOG计算是在图像的局部胞元(cell)上操作,所以它对图像几何和光学的形变都能够保持很好的不变性,几何和光学的形变只会出现在更大的空间领域上;实验证明,在粗的空域抽样、精细的方向抽样以及较强的局部光学归一化等条件下,只要行人大体上能够保持直立的姿势,就容许行人有一些细微的肢体动作,这些细微的动作可以被忽略而不影响检测效果。
训练单元52,用于通过线性支持向量机对收集到的仪表梯度方向直方图特征进行训练,获取识别仪表的模型。
训练单元通过线性支持向量SVM对收集到的仪表梯度方向直方图特征进行训练,根据收集到的仪表梯度方向直方图特征不断进行训练,使得重复训练后的识别仪表的模型能够快速的对样本进行识别,并降低误报的概率,通过不断的重复训练提升识别仪表模型的效率和正确率。
定位单元53,用于基于识别仪表的模型对仪表进行初步定位,再根据特征点匹配对仪表进行精确定位。
定位单元基于识别仪表的模型对仪表进行初步定位,再根据特征点匹配对仪表进行精确定位,从图像中找出仪表的特征点并精确定位出仪表的位置,以实现可以清晰的读取仪表的数据。使得可以在监控视频中从复杂的场景中检测出仪表,并通过监控视频的图像读出仪表的数据。
本发明实施例通过上述方式,一种仪表定位装置,通过收集仪表的梯度方向直方图特征;通过线性支持向量机对收集到的仪表梯度方向直方图特征进行训练,获取识别仪表的模型;基于识别仪表的模型对仪表进行初步定位,再根据特征点匹配对仪表进行精确定位,客服了现有复杂场景中的仪表检测技术的不足,能够识别复杂场景中不同类型的仪表,同时通过梯度方向直方图特征在计算时能够提高计算速度,很好地平衡检测精度与检测速度,实现对仪表的快速定位。
实施例四:
图6示出了本发明第四实施例提供的一种仪表定位装置的结构图,为了便于说明,仅示出了与本发明实施例相关的部分。
样本收集单元61,用于收集仪表正负样本图像。
样本收集单元首先收集仪表的正负样本,正样本为含有仪表的图像,负样本为干扰图像,根据具体识别仪表的场景的不同可以在样本中添加不同的正负样本,正负样本的数量和样本图像的复杂度将直接决定所能获取得到的仪表的特征,同时正负样本的数量和背景的复杂程度也对最终识别的模型有较大的影响,好的样本能够在算法不变的情况下,达到较好的泛化效果。根据实际实验结果,正样本的选取中,尽量选择单一背景或者与检测场景无关的简单背景,这样能够准确反应目标的外形。负样本的选取,除了选择和目标无关的样本外,还可以适当添加一些检测场景中可能出现的背景。背景过于复杂的正样本,因为过于复杂的背景,会降低SVM的泛化能力,达到同样的效果,需要更多次数的困难样本重复训练。
特征获取单元62,用于对图像进行归一化处理,计算图像梯度,获取仪表的梯度方向直方图特征。
首先为了减少光照因素的影响,特征获取单元首先需要将用于识别仪表的整个图像进行归一化处理。在图像的纹理强度中,局部的表层曝光贡献的比重比较大,所以,这种压缩处理能够有效地降低图像局部阴影和光照的变化;另外因为颜色信息的作用不大,通常在计算HOG特征时,将图像转化成灰度图。归一化能够进一步对光照、阴影和边缘进行压缩。将归一化后的块描述符称为HOG描述符,最终获取仪表的梯度方向直方图特征。
模型建立单元63,用于通过线性支持向量机对收集到的仪表梯度方向直方图特征进行训练,根据训练结果获取识别仪表的模型。
模型建立单元根据不同场景做多次困难样本的重复训练,即不断把困难样本添加到负样本中进行训练。将困难样本添加到负样本中重复训练后,误报率明显降低,误报降低的同时,算法的检测速度也相对提升,因为需要合并的窗口大大减少了。通过线性支持向量机对收集到的仪表梯度方向直方图特征的正负样本进行训练,模型获取单元获取识别仪表的模型。
初步定位单元64,用于基于识别仪表的模型对仪表进行初步定位。
初步定位单元基于识别仪表的模型对仪表进行初步定位,通过对仪表的初步定位可以判断出仪表的正负样本,同时对仪表的初步定位可以在进行精确定位时减少对图像定位时的计算量。
尺度空间构建单元65,用于根据初步定位构建图像的尺度空间,精确定位特征点。
图像的尺度空间是图像在不同解析度下的表示,一幅图像J(X)在不同解析度下的表示可以利用高斯核G(t)的卷积来实现,图像的尺度大小一般用高斯标准差来表示。在计算视觉领域,尺度空间被象征性的表述为一个图像金字塔,其中,输入图像函数反复与高斯函数的核卷积并反复对其进行二次抽样,其中优选的采用SURF算法使原始图像保持不变而只改变滤波器大小。尺度空间构建单元用于构建图像的尺度空间,这样就使得构建尺度空间的运算可以并行进行,根据初步定位构建图像的尺度空间就具有更高的执行效率,通过构建的图像尺度空间,精确定位出仪表的特征点。
精确定位单元66,用于根据特征点对构建的图像尺度空间进行识别匹配,精确定位出仪表。
精确定位单元通过构建的图像尺度空间,精确定位出仪表的特征点之后,直接在构建的尺度空间上跟一个预设极值进行比较,通过特征点逐个进行计算,得到每一个特征点的主方向,将坐标轴旋转为关键点的方向,以确保旋转不变性。通过确定关键点的位置,每个关键点的邻域所在尺度空间为一个像素,利用公式求得每个像素的梯度幅值与梯度方向,通过箭头方向代表该像素的梯度方向,箭头长度代表梯度模值,绘制每个梯度方向的累加值,即可形成一个种子点,在模板图像和实际图像中寻找特征点并进行特征点匹配就可以实现仪表的精确定位。根据识别仪表的模型对构建的图像尺度空间进行识别,精确定位出仪表。
本发明实施例通过上述方式,一种仪表定位装置,克服了现有复杂场景中的仪表检测技术的不足,能够适应复杂场景中不同类型的仪表,通过收集各种仪表的正负样本并提取HOG特征,同时利用线性SVM进行训练、检测,为了能够准确地识别仪表的读数,采用了特征点匹配的算法实现仪表的精确定位。通过采用的HOG特征可以充分利用了图像边缘的多种属性,如边缘的方向特性、结构特性,能够准确地描述仪表的统计特征,能够准确地实现仪表在视频图像中的初步定位。实现初步定位之后,又采用了特征点匹配的方式来实现仪表的精确定位,由于采用的特征点具有属于图像的局部特征,对平移、旋转、尺度缩放、亮度变化、遮挡和噪声等具有良好的不变性,对视觉变化、仿射变换也保持一定程度的稳定性,所以在实际应用中具有较强的适应性,能够实现各种仪表的精确定位。同时,HOG特征在计算时能够充分利用积分图等技术来提高计算速度,在初步定位以后再进行特征点的精确定位能够很好地平衡检测精度与检测速度。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于计算机可读取存储介质中,所述的存储介质,如ROM/RAM、磁盘、光盘等。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种仪表定位方法,其特征在于,所述方法包括下述步骤:
收集仪表的梯度方向直方图特征;
通过线性支持向量机对收集到的仪表梯度方向直方图特征进行训练,获取识别仪表的模型;
基于识别仪表的模型对仪表进行初步定位,再根据特征点匹配对仪表进行精确定位。
2.如权利要求1所述的方法,其特征在于,所述收集仪表的梯度方向直方图特征的步骤包括:
收集仪表正负样本图像;
对图像进行归一化处理,计算图像梯度,获取仪表的梯度方向直方图特征。
3.如权利要求1所述的方法,其特征在于,所述通过线性支持向量机对收集到的仪表梯度方向直方图特征进行训练,获取识别仪表的模型的步骤包括:
通过线性支持向量机对收集到的仪表梯度方向直方图特征进行训练;
根据训练结果获取识别仪表的模型。
4.如权利要求1所述的方法,其特征在于,所述基于识别仪表的模型对仪表进行初步定位,再根据特征点匹配对仪表进行精确定位的步骤包括:
基于识别仪表的模型对仪表进行初步定位;
根据初步定位构建图像的尺度空间,精确定位特征点;
根据特征点对构建的图像尺度空间进行识别匹配,精确定位出仪表。
5.一种仪表定位装置,其特征在于,所述装置包括:
特征获取定位单元,用于收集仪表的梯度方向直方图特征;
训练单元,用于通过线性支持向量机对收集到的仪表梯度方向直方图特征进行训练,获取识别仪表的模型;
定位单元,用于基识别仪表的模型对仪表进行初步定位,再根据特征点匹配对仪表进行精确定位。
6.如权利要求5所述的装置,其特征在于,所述特征获取单元包括:
样本收集单元,用于收集仪表正负样本图像;
特征获取单元,用于对图像进行归一化处理,计算图像梯度,获取仪表的梯度方向直方图特征。
7.如权利要求5所述的装置,其特征在于,所述训练单元包括:
模型建立单元,用于通过线性支持向量机对收集到的仪表梯度方向直方图特征的正负样本进行训练,
模型获取单元,用于根据训练结果获取识别仪表的模型。
8.如权利要求5所述的装置,其特征在于,所述定位单元包括:
初步定位单元,用于基于识别仪表的模型对仪表进行初步定位;
尺度空间构建单元,用于根据初步定位构建图像的尺度空间,精确定位特征点;
精确定位单元,用于根据特征点对构建的图像尺度空间进行识别匹配,精确定位出仪表。
CN201310442513.3A 2013-09-23 2013-09-23 一种仪表定位方法及装置 Active CN104463240B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310442513.3A CN104463240B (zh) 2013-09-23 2013-09-23 一种仪表定位方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310442513.3A CN104463240B (zh) 2013-09-23 2013-09-23 一种仪表定位方法及装置

Publications (2)

Publication Number Publication Date
CN104463240A true CN104463240A (zh) 2015-03-25
CN104463240B CN104463240B (zh) 2017-12-22

Family

ID=52909254

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310442513.3A Active CN104463240B (zh) 2013-09-23 2013-09-23 一种仪表定位方法及装置

Country Status (1)

Country Link
CN (1) CN104463240B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105975979A (zh) * 2016-04-22 2016-09-28 浙江大学 一种基于机器视觉的仪表检测方法
CN106504262A (zh) * 2016-10-21 2017-03-15 泉州装备制造研究所 一种多特征融合的小瓷砖智能定位方法
CN106529542A (zh) * 2016-09-30 2017-03-22 中国石油天然气股份有限公司 示功图识别方法和装置
CN106709452A (zh) * 2016-12-23 2017-05-24 浙江大学 一种基于智能巡检机器人的仪表位置检测方法
CN107729906A (zh) * 2017-10-24 2018-02-23 国网江苏省电力公司南京供电公司 一种基于智能机器人的巡检点电表数值识别方法
CN108694349A (zh) * 2017-04-07 2018-10-23 成都唐源电气股份有限公司 一种基于线阵相机的受电弓图像提取方法及装置
CN108921177A (zh) * 2018-06-22 2018-11-30 重庆邮电大学 变电站巡检机器人的仪表定位方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080063285A1 (en) * 2006-09-08 2008-03-13 Porikli Fatih M Detecting Moving Objects in Video by Classifying on Riemannian Manifolds
CN101498592A (zh) * 2009-02-26 2009-08-05 北京中星微电子有限公司 指针式仪表的读数方法及装置
CN102661708A (zh) * 2012-04-20 2012-09-12 华南理工大学 一种基于surf的高密度封装元器件定位方法
CN103295027A (zh) * 2013-05-17 2013-09-11 北京康拓红外技术股份有限公司 一种基于支持向量机的铁路货车挡键丢失故障识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080063285A1 (en) * 2006-09-08 2008-03-13 Porikli Fatih M Detecting Moving Objects in Video by Classifying on Riemannian Manifolds
CN101498592A (zh) * 2009-02-26 2009-08-05 北京中星微电子有限公司 指针式仪表的读数方法及装置
CN102661708A (zh) * 2012-04-20 2012-09-12 华南理工大学 一种基于surf的高密度封装元器件定位方法
CN103295027A (zh) * 2013-05-17 2013-09-11 北京康拓红外技术股份有限公司 一种基于支持向量机的铁路货车挡键丢失故障识别方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105975979A (zh) * 2016-04-22 2016-09-28 浙江大学 一种基于机器视觉的仪表检测方法
CN105975979B (zh) * 2016-04-22 2019-04-12 浙江大学 一种基于机器视觉的仪表检测方法
CN106529542A (zh) * 2016-09-30 2017-03-22 中国石油天然气股份有限公司 示功图识别方法和装置
CN106504262A (zh) * 2016-10-21 2017-03-15 泉州装备制造研究所 一种多特征融合的小瓷砖智能定位方法
CN106709452A (zh) * 2016-12-23 2017-05-24 浙江大学 一种基于智能巡检机器人的仪表位置检测方法
CN106709452B (zh) * 2016-12-23 2020-07-07 浙江大学 一种基于智能巡检机器人的仪表位置检测方法
CN108694349A (zh) * 2017-04-07 2018-10-23 成都唐源电气股份有限公司 一种基于线阵相机的受电弓图像提取方法及装置
CN108694349B (zh) * 2017-04-07 2020-03-06 成都唐源电气股份有限公司 一种基于线阵相机的受电弓图像提取方法及装置
CN107729906A (zh) * 2017-10-24 2018-02-23 国网江苏省电力公司南京供电公司 一种基于智能机器人的巡检点电表数值识别方法
CN108921177A (zh) * 2018-06-22 2018-11-30 重庆邮电大学 变电站巡检机器人的仪表定位方法

Also Published As

Publication number Publication date
CN104463240B (zh) 2017-12-22

Similar Documents

Publication Publication Date Title
CN111401201B (zh) 一种基于空间金字塔注意力驱动的航拍图像多尺度目标检测方法
CN104463240A (zh) 一种控制列表界面的方法及装置
CN103324937B (zh) 标注目标的方法和装置
US9639758B2 (en) Method and apparatus for processing image
CN104680144B (zh) 基于投影极速学习机的唇语识别方法和装置
CN106960210B (zh) 目标检测的方法和装置
CN107133627A (zh) 红外光斑中心点提取方法及装置
CN104134200B (zh) 一种基于改进加权融合的运动场景图像拼接方法
CN105872477A (zh) 视频监控方法和视频监控系统
CN105654067A (zh) 一种车辆检测方法及装置
CN107784663A (zh) 基于深度信息的相关滤波跟踪方法及装置
CN110297232A (zh) 基于计算机视觉的单目测距方法、装置及电子设备
CN112348082B (zh) 深度学习模型构建方法、影像处理方法及可读存储介质
CN103971087B (zh) 一种实时搜索及识别交通标志的方法及装置
CN109858547A (zh) 一种基于bssd的目标检测方法与装置
CN106780727B (zh) 一种车头检测模型重建方法及装置
CN111008576B (zh) 行人检测及其模型训练、更新方法、设备及可读存储介质
Hsu et al. Deep hierarchical network with line segment learning for quantitative analysis of facial palsy
CN109087337B (zh) 基于分层卷积特征的长时间目标跟踪方法及系统
CN104966300A (zh) 轴承滚子图像检测系统及方法及图像检测装置
CN109948637A (zh) 对象检测装置、对象检测方法及计算机可读介质
CN106920247A (zh) 一种基于比对网络的目标跟踪方法及装置
CN105938513A (zh) 为计算机辅助诊断提供可靠性的装置和方法
CN103426172A (zh) 基于视觉的目标跟踪方法及装置
CN114926747A (zh) 一种基于多特征聚合与交互的遥感图像定向目标检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 518055 Shenzhen, Nanshan District hi tech park, North West New West Road, building No. five galaxy on the third floor

Patentee after: Shenzhen Launch Digital Technology Co., Ltd.

Address before: 518055 Shenzhen, Nanshan District hi tech park, North West New West Road, building No. five galaxy on the third floor

Patentee before: Shenzhen Launch Digital Technology Co., Ltd.