CN116051869A

CN116051869A - 融合ovr-svm和psnr相似度的图像标签匹配方法及系统

Info

Publication number: CN116051869A
Application number: CN202211677437.XA
Authority: CN
Inventors: 张兆东; 王博; 陈波; 范镒; 张凯凯; 何云迪; 李军
Original assignee: Lb Ke Ce Shanghai Intelligent Medical Technology Co ltd
Current assignee: Lb Ke Ce Shanghai Intelligent Medical Technology Co ltd
Priority date: 2022-12-26
Filing date: 2022-12-26
Publication date: 2023-05-02

Abstract

本发明公开了融合OVR‑SVM和PSNR相似度的图像标签匹配方法及系统，属于标签图像匹配的技术领域。本发明在模板匹配时，先对图像进行缩小，匹配完成后在原图上再次进行检测，对标签进行精确定位，提高了匹配过程的实时性。在对二值化后的图像进行匹配前，计算标签矩阵和其外接矩阵的透视矩阵，并对原图进行了透视变换，能够较好的处理旋转标签的匹配问题。将标签统一横向并翻转后，融合支持向量机分类与峰值信噪比相似度结合的方法进行模板匹配，提高了真实场景中标签匹配的准确率和召回率。

Description

融合OVR-SVM和PSNR相似度的图像标签匹配方法及系统

技术领域

本发明属于图像匹配的技术领域，特别是涉及一种融合OVR-SVM和PSNR相似度的图像标签匹配方法及系统。

背景技术

图像模板匹配指的是通过模板图像与测试图像之间的比较，找到测试图像上与模板图像相似的部分，再通过计算模板图像与测试图像中目标的相似度来实现。

现有技术中，通过计算样本的“距离”估算不同样本之间的相似性度量，一般有欧式距离、曼哈顿距离、切比雪夫距离、马氏距离、夹角余弦、汉明距离等。基于灰度值的模板匹配是最经典的模板匹配算法，其通过计算模板图像与检测图像之间的像素灰度差的绝对值总和(SAD)或者平方差总和方法(SSD)；另一种常用的模板匹配方法是使用归一化的互相关信息来衡量匹配的概率，具备较好的光照不变性；另外基于形状的模板匹配也是一种常用的匹配算法，以物体的边缘梯度相关性作为匹配标准，例如aprilTag中检测标签的算法。

基于像素灰度的模板匹配技术受灰度值的影响很大，只适用于光照稳定的情况，只有少数简单图像的匹配才适合；而基于相关性的匹配无法解决旋转和尺度变化，基于形状的模板匹配虽然匹配精确度高，但其对图像的处理复杂导致计算时间较长，无法满足实际情况下对实时性要求较高的场景。

发明内容

本发明为解决上述背景技术中存在的技术问题，提供了一种融合OVR-SVM和PSNR相似度的图像标签匹配方法及系统。

本发明采用以下技术方案来实现：融合OVR-SVM和PSNR相似度的图像标签匹配方法，至少包括以下步骤：

将预定数量的标签按照指定形式生成模板标签，得到标签信息列表；所述标签信息列表至少包括：模板标签的索引号、以及对应的模板标签顶点集；

对输入图像进行实时处理，识别出带有标签的输入图像，并进入图像标签匹配模式：

对所述输入图像进行预处理得到缩小版的二值图像，确定二值图像内的多边形区域，获取多边形区域的每个顶点，生成关于二值图像的顶点列表；

遍历所述顶点列表提取得到外接顶点集，通过所述外接顶点集得到关于多边形区域的外接矩形，基于外接顶点集和外接矩形计算得到透视变换矩阵；利用透视变换矩阵将二值图像进行变换得到变换图像，将二值图像与变换图像之间的重叠部分抠出得到矩形区域；

按照所述指定形式获取矩形区域的标签ID和矩形顶点集，将所述矩形顶点集内的顶点坐标对应放大至输入图像内，得到对应的实际顶点坐标集；基于实际顶点坐标集生成关于输入图像的标签区域，对所述标签区域重新获取测试标签顶点集；

基于所述标签ID和测试标签顶点集于标签信息列表中完成匹配。

在进一步的实施例中，所述模板标签的生成方式如下：

将每个标签进行矩形化得到对应的矩形标签，获取矩形标签的索引号以及模板标签顶点集；

所述模板标签顶点集内的元素包括原点、长边端点、短边端点和对角点。

在进一步的实施例中，还包括：

对所述模板标签使用SVM学习算法进行分类训练，训练得到SVM训练模型；

SVM训练模型时将预定数量的标签作为正样本，非预定数量的标签作为负样本。

在进一步的实施例中，所述输入图像的预处理包括以下流程：

采用轮廓提取和四边形拟合的方法确定标签的矩形区域，基于标签的尺寸大小对应的标签像素面积进行筛选得到感兴趣区域，基于所述感兴趣区域获取标签信息；

还包括：对所述输入图像按照预定比例进行缩小，对缩小后的输入图像采用自适应阈值的处理方法进行二值化处理得到二值图像。

在进一步的实施例中，利用透视变换矩阵将二值图像进行变换得到变换图像的具体流程如下：

定义二值图像中的点坐标为

则经变换之后的对应点在变换图像中的坐标为

预先给定透视变换矩阵为

其中，k为对应图像中点的序号，k为大于等于2的整数；h₁、h₂、h₃、h₄、h₅、h₆、h₇、h₈和h₉均为透视变换矩阵的矩阵参数；

则，

在进一步的实施例中，矩形区域的标签ID和矩形顶点集的获取方式如下：

所述矩形区域具有横向标签或竖向标签，将具有竖向标签的矩形区域进行翻转统一为横向标签，将横向标签对应的矩形区域进行水平翻转，使得每个横向标签对应有两个横向且反向矩形区域；

使用SVM学习算法进行分类于标签信息列表中匹配出两个索引号，以及对应的模板标签；通过计算所述正矩形区域与匹配出的模板标签的峰值信噪比相似度，取相似度高的正矩形区域对应的索引号为矩形区域的标签ID，与对应的索引号相适配的模板标签顶点集为矩形顶点集。

在进一步的实施例中，定义二值图像的大小为输入图像大小的1/n，则实际顶点坐标集内的数值为正矩形顶点集内数值的n倍。

在进一步的实施例中，所述多边形区域、标签区域均是通过轮廓提取和多边拟合得到。

在进一步的实施例中，所述峰值信噪比相似度采用以下计算公式：

其中，

式中，MSE代表图像像素值的平方误差，i，j代表像素位置；I，K代表图像的对应位置像素值；m，n代表图像的宽和高。

融合OVR-SVM和PSNR相似度的图像标签匹配系统，包括：

第一模块，被设置为将预定数量的标签按照指定形式生成模板标签，得到标签信息列表；所述标签信息列表至少包括：对应模板标签的索引号和模板标签顶点集；

第二模块，被设置为对输入图像进行实时处理，识别出带有标签的输入图像，并进入图像标签匹配模式：

第三模块，被设置为对所述输入图像进行预处理得到缩小版的二值图像，确定二值图像内的多边形区域，获取多边形区域的每个顶点，生成关于二值图像的顶点列表；

第四模块，被设置为遍历所述顶点列表提取得到外接顶点集，通过所述外接顶点集得到关于多边形区域的外接矩形，基于外接顶点集和外接矩形计算得到透视变换矩阵；利用透视变换矩阵将二值图像进行变换得到变换图像，将二值图像与变换图像之间的重叠部分抠出得到正矩形区域；

第五模块，被设置为按照所述指定形式获取正矩形区域的标签ID和正矩形顶点集，将所述正矩形顶点集内的顶点坐标对应放大至输入图像内，得到对应的实际顶点坐标集；基于实际顶点坐标集生成关于输入图像的标签区域，对所述标签区域重新获取测试标签顶点集；

第六模块，被设置为基于所述标签ID和测试标签顶点集于标签信息列表中完成匹配。

本发明的有益效果：本发明在模板匹配时，先对图像进行缩小，匹配完成后在原图上再次进行检测，对标签进行精确定位，提高了匹配过程的实时性。

在对二值化后的图像进行匹配前，计算标签矩阵和其外接矩阵的透视矩阵，并对原图进行了透视变换，能够较好的处理旋转标签的匹配问题。

将标签统一横向并翻转后，融合支持向量机分类与峰值信噪比相似度结合的方法进行模板匹配，提高了真实场景中标签匹配的准确率和召回率。

附图说明

图1为实施例1中的指定形式的示意图。

图2为实施例1中的标签模板匹配流程图。

图3为实施例1中训练样本图。

图4为现有技术中的标签模板匹配示意图。

具体实施方式

SVM算法最初是为二值分类问题设计的，当处理多类问题时，就需要构造合适的多类分类器。一般分为OVR-SVM和OVO-SVM。OVR-SVM训练时依次把某个类别的样本归为一类，其他剩余的样本归为另一类，这样k个类别的样本就构造出了k个SVM。分类时将未知样本分类为具有最大分类函数值的那类。OVO-SVM是在任意两类样本之间设计一个SVM，因此k个类别的样本就需要设计k(k-1)/2个SVM。当对一个未知样本进行分类时，最后得票最多的类别即为该未知样本的类别。

实施例1

为此，本实施例提供了融合OVR-SVM和PSNR相似度的图像标签匹配方法，至少包括以下步骤：

步骤一、将预定数量的标签按照指定形式生成模板标签，得到标签信息列表；所述标签信息列表至少包括：模板标签的索引号、以及对应的模板标签顶点集；

步骤二、对输入图像进行实时处理，识别出带有标签的输入图像，并进入图像标签匹配模式：

步骤三、遍历所述顶点列表提取得到外接顶点集，通过所述外接顶点集得到关于多边形区域的外接矩形，基于外接顶点集和外接矩形计算得到透视变换矩阵；利用透视变换矩阵将二值图像进行变换得到变换图像，将二值图像与变换图像之间的重叠部分抠出得到矩形区域；

步骤四、按照所述指定形式获取矩形区域的标签ID和矩形顶点集，将所述矩形顶点集内的顶点坐标对应放大至输入图像内，得到对应的实际顶点坐标集；基于实际顶点坐标集生成关于输入图像的标签区域，对所述标签区域重新获取测试标签顶点集；

步骤五、基于所述标签ID和测试标签顶点集于标签信息列表中完成匹配。

一步的实施例中，步骤一中的模板标签的生成方式如下：将每个标签进行矩形化得到对应的矩形标签，获取矩形标签的索引号以及模板标签顶点集；所述模板标签顶点集内的元素包括原点、长边端点、短边端点和对角点。换言之，指定形式即为被矩形化的标签，且每个标签均存在四个顶点，分别为相对位置固定的原点、长边端点、短边端点和对角点。首先确定四个顶点中的其中一个顶点为原点，则与之位于同一对角线上的顶点为对角点，与之位于短边上的顶点为短边端点，与之位于长边上的顶点为长边端点。

在另一个实施例中，还包括对针对模板标签，使用SVM进行分类训练，其正负样本如图3示，正样本的类别为1-18，而负样本类别为-1，训练完成后保存SVM模型。

在本实施例中，标签的数量为18个，即如图1所示针对模板标签，使用SVM进行分类训练，其正负样本如图3示，正样本的类别为1-18，而负样本类别为-1，训练完成后保存SVM模型。系统启动时先加载训练完成的SVM模型文件以及18张模板图像。

在进一步的实施例中，步骤二中的输入图像的预处理包括以下流程：采用轮廓提取和四边形拟合的方法确定标签的矩形区域，基于标签的尺寸大小对应的标签像素面积进行筛选得到感兴趣区域，基于所述感兴趣区域获取标签信息；

还包括：对所述输入图像按照预定比例进行缩小，对缩小后的输入图像采用自适应阈值的处理方法进行二值化处理得到二值图像。在本实施例中，自适应阈值中图像中每一个像素点的阈值是不同的，该阈值由其领域中图像像素带点加权平均决定。这样亮度较高的图像区域的二值化阈值通常会较高，而亮度较低的图像区域的二值化阈值则会相适应地变小。因此利用标签的性质将图像进行自适应二值化处理。

定义二值图像中的点坐标为

则经变换之后的对应点在变换图像中的坐标为

预先给定透视变换矩阵为

其中，k为对应图像中点的序号，k为大于等于2的整数；w₁＝w₂＝1；h₁、h₂、h₃、h₄、h₅、h₆、h₇、h₈和h₉均为透视变换矩阵的矩阵参数；

则，

基于上述公式，

整理得：h₁u₁+h₂v₁+h₃-h₇u₁u₂-h₈v₁u₂＝u₂；

h₄u₁+h₅v₁+h₆-h₇u₁v₂-h₈v₁v₂＝v₂；

基于一对匹配点构造出两个约束，因此自由度为8的透视变换矩阵通过以下公式求出，进一步举例，当k＝4，即需要变换4个坐标时，在变换过程如下：

对应的，矩形区域的标签ID和矩形顶点集的获取方式如下：

举例说明，矩形区域内部是经过前面处理所得到的矩形标签图像，在经过透视变换处理后的矩形区域可能是竖着(宽大于长)或者横着(宽小于长)的矩形，但是svm分类和psnr相似度计算需要与模板的大小尺寸一致，而使用的模板是横着的(宽小于长)，所以需要将提取的矩形区域先转为横着的，但是横向的矩形存在两个旋转方向，可以理解为竖矩形旋转为横向时，可以向左旋转或者向右旋转，因此需要使用psnr方法进行筛选出正确的匹配。

其中，峰值信噪比相似度采用以下计算公式：

其中，

需要说明的是，在进行标签分类时，支持向量机也可被一般的传统分类器替代，例如KNN、朴素贝叶斯分类、随机森林、Adaboost等，在进行PSNR相似度筛选时也可选用余弦距离、汉明距离、MSE、SSIM等进行度量。

需要说明的是，在本实施例中，外接顶点集、正矩形顶点集、实际顶点坐标集和测试标签顶点集中的元素均为原点、长边端点、短边端点和对角点，但是数值大小不同，通过数值大小的变更逐步更新提高精度。

综上所述，本发明利用标签的性质将图像进行自适应二值化处理，有效减少了光照对像素灰度值的影响；再利用提取的标签轮廓与模板做尺寸放缩和透视变换，减少了旋转和尺度的影响；最后将所有标签统一处理后利用支持向量机和PSNR相似度量进行分类筛选，得到更为鲁棒分类结果。

实施例2

本实施例公开了融合OVR-SVM和PSNR相似度的图像标签匹配系统，用于实现实施例1所述的图像标签匹配方法，包括：

Claims

1.融合OVR-SVM和PSNR相似度的图像标签匹配方法，其特征在于，至少包括以下步骤：

2.根据权利要求1所述的融合OVR-SVM和PSNR相似度的图像标签匹配方法，其特征在于，所述模板标签的生成方式如下：

3.根据权利要求1所述的融合OVR-SVM和PSNR相似度的图像标签匹配方法，其特征在于，还包括：

4.根据权利要求1所述的融合OVR-SVM和PSNR相似度的图像标签匹配方法，其特征在于，所述输入图像的预处理包括以下流程：

5.根据权利要求1所述的融合OVR-SVM和PSNR相似度的图像标签匹配方法，其特征在于，利用透视变换矩阵将二值图像进行变换得到变换图像的具体流程如下：

定义二值图像中的点坐标为则经变换之后的对应点在变换图像中的坐标为预先给定透视变换矩阵为其中，k为对应图像中点的序号，k为大于等于2的整数；h₁、h₂、h₃、h₄、h₅、h₆、h₇、h₈和h₉均为透视变换矩阵的矩阵参数；

则，

6.根据权利要求1所述的融合OVR-SVM和PSNR相似度的图像标签匹配方法，其特征在于，矩形区域的标签ID和矩形顶点集的获取方式如下：

7.根据权利要求1所述的融合OVR-SVM和PSNR相似度的图像标签匹配方法，其特征在于，定义二值图像的大小为输入图像大小的1/n，则实际顶点坐标集内的数值为正矩形顶点集内数值的n倍。

8.根据权利要求1所述的融合OVR-SVM和PSNR相似度的图像标签匹配方法，其特征在于，所述多边形区域、标签区域均是通过轮廓提取和多边拟合得到。

9.根据权利要求6所述的融合OVR-SVM和PSNR相似度的图像标签匹配方法，其特征在于，所述峰值信噪比相似度采用以下计算公式：

其中，

10.融合OVR-SVM和PSNR相似度的图像标签匹配系统，其特征在于，包括：