CN114708420A - 基于局部方差和后验概率分类器的视觉定位方法及装置 - Google Patents

基于局部方差和后验概率分类器的视觉定位方法及装置 Download PDF

Info

Publication number
CN114708420A
CN114708420A CN202210435034.8A CN202210435034A CN114708420A CN 114708420 A CN114708420 A CN 114708420A CN 202210435034 A CN202210435034 A CN 202210435034A CN 114708420 A CN114708420 A CN 114708420A
Authority
CN
China
Prior art keywords
posterior probability
sliding window
classifier
template
probability classifier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210435034.8A
Other languages
English (en)
Inventor
彭凌西
林煜桐
彭绍湖
谢翔
林焕然
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou University
Original Assignee
Guangzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou University filed Critical Guangzhou University
Priority to CN202210435034.8A priority Critical patent/CN114708420A/zh
Publication of CN114708420A publication Critical patent/CN114708420A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本申请提供了一种基于局部方差和后验概率分类器的视觉定位方法及装置,本申请在定义过程和检索过程中使用了两种不同移动步长的滑动窗口,即为了降低检索过程中的计算量,也是为了避免检索过程的滑动窗口在经过后验概率分类器时因为移动步长过大而对窗口判断错误。一方面减少了对系统算里的要求,提高了匹配效率,另一方面在定义部分也考虑到了多尺度的情况来生成多尺度的滑动窗口,而且由于在检索部分的多尺度滑动窗口是在初始尺度滑动窗口遍历后再进行,避免了目标对象没有尺度缩放的情况浪费过多的计算量。这种方法进一步提高了匹配效率,同时也克服了现有技术匹配过程计算量过大、无效计算过大的缺点,提高了模板匹配的准确度。

Description

基于局部方差和后验概率分类器的视觉定位方法及装置
技术领域
本申请属于图像处理技术领域,具体地讲,涉及一种基于局部方差和后验概率分类器的视觉定位方法及装置。
背景技术
模板匹配在计算机视觉和图像处理领域是应用于目标检测和目标定位的经典方法,通过选定模板图像,计算模板图像和目标图像中滑动窗口的相似度,与模板图像相似度达到标准的为匹配的结果,从而实现在目标图像中确定模板图像对应的目标的位置。
在不考虑图像旋转、缩放、光照等因素的影响下,目标图像中的待匹配目标区域各点的像素值,应与模板图像中对应点的像素值相等。因此,过去传统的模板匹配算法都是采用基于灰度值的方法进行匹配,这些方法都是计算目标图像滑动窗口和模板图像对应点的像素值之差的绝对值之和,或是像素值之差的平方之和,这种方法虽然简单,但是当目标图像发生缩放、旋转或受到噪声干扰就会出现错误的匹配结果。
在后续对基于灰度的匹配方法的改进中,最具代表性的是提出了一种归一化互相关的模板匹配方法,这种方法基于灰度变化的概念对原先的判别函数进行了修改,但是大大增加了计算量,这导致了模板匹配的速度下降。再加上考虑多尺度和多角度的干扰后,按照现有的模板匹配方法使用不同的角度和不同尺度的滑动窗口虽然可以得到结果,但是匹配的速度太慢、计算量非常大、效率太低。
发明内容
本发明实施例的一个目的在于提供一种基于局部方差和后验概率分类器的快速视觉定位方法,该方法通过建立模板图像内一定区间的一组特征点和一组随机点,并以两组点的灰度值进行大小对比,将对比的结果表现为二进制数的形式后再转为十进制数,从而以这个十进制数作为模板的特征。在提取过程中不止会对模板图像进行以上的特征提取,该方法会对模板图像周边区域进行多次的旋转操作后提取。从而实现匹配的旋转不变性。
本发明的主要思路依靠局部方差和后验概率分类器来进行目标的快速定位,其中局部方差通过方差分类器来实现,后验概率分类器是通过后验概率分类器来计算后验概率得出结果,后续说明也使用后验概率分类器来进行说明。
本发明的实施例的另一个目的在于提供一种基于局部方差和后验概率分类器的快速视觉定位系统。
为了达到上述技术目的,本发明实施例所采取的技术方案包括:
第一方面,本发明实施例提供了一种基于局部方差和后验概率分类器的快速视觉定位方法,包括以下步骤:
根据滑动窗口的移动步长来获取模板图像周边范围区域的窗口,获取的模板图像区域窗口为后验概率分类器的正样本;在模板图像的最大内接圆区域进行特征点的检测,以此作为后验概率分类器的第一组点对,再以随机点作为第二组点对;
对上述的模板图像区域内的正样本窗口按一定的角度步长进行以模板图像中心点为中心的旋转处理,每个正样本得到上百个旋转后的正样本,进而使用后验概率分类器进行特征的提取;
针对目标图像多尺度的情况,建立以模板图像尺度为基础来缩放多次的移动步长为十分之一窗口最短边的滑动窗口,多尺度的滑动窗口按照尺度进行分类。在后验概率分类器的特征提取过程,对模板图像进行多尺度的缩放后使用对应尺度的后验概率分类器进行相应尺度的特征提取;
在目标图像检测中,先进行初始尺度的大移动步长滑动窗口遍历,如果第一次检测能得到结果的话对结果周边区域进行第二次的小步长滑动窗口遍历,否则使用多尺度的大移动步长滑动窗口进行遍历,对每个尺度通过分类器的窗口进行聚类后以聚类数量最多的窗口作为当前尺度的代表窗口,统计每个尺度代表窗口的聚类数量,以最多数量的聚类窗口作为最后的输出结果。
进一步地,在本发明的一个实施例中,所述根据模板图像大小建立不同移动步长和不同尺度的滑动窗口这一步骤,其具体包括:
获取模板所在图像和目标图像;
针对检索过程,先根据模板所在图像大小、和模板图像尺度来生成初始尺度的以模板图像最短边十分之一为移动步长的滑动窗口。
针对定义过程,根据模板所在图像大小来生成初始尺度的逐个像素移动的滑动窗口。
针对检索过程的多尺度情况,生成以模板大小为基础放大缩小各十次的多尺度滑动窗口,滑动窗口移动步长为缩放后的模板最短边的十分之一。
进一步地,在本发明的一个实施例中,所述的在后验概率分类器的准备中,使用一组特征点和一组随机点进行比对这一步骤,其具体包括:
在定义部分中后验概率分类器的准备中,在以模板图像中心点为圆心、模板图像最短边为直径的区域内检索特征点和随机点;
先在模板图像区间范围内进行SIFT特征点的检索,检索过程中为了使特征点数量达到分类器使用的标准降低了SIFT算法中的两个阈值,并且没有进行特征点的描述子建立过程;
在模板图像区间范围内进行Harris角点特征点的检索,检索过程中为了特征点数量达到分类器使用的标准而使用了定量特征点输出;
在模板图像区间范围内定量生成随机点;
在后验概率分类器的准备中,生成的两组定量的点对,第一组特征点的构成为SIFT特征点检索算法的结果,SIFT特征点数量如果不足再使用Harris角点进行填充;
在模板图像中以模板中心为圆心以最大内接圆为范围来检索特征点和随机点的原因是为了避免后验概率分类器中的样本旋转时坐标点出界的情况;
进一步地,在本发明的一个实施例中,所述根据滑动窗口移动步长构建模板图像及模板图像周围区域的正样本的步骤,其具体包括:
在定义部分,根据滑动窗口和模板的重叠度对模板所在图像进行正负样本划分;
滑动窗口中和模板图像重叠度大于0.82的为正样本;
滑动窗口中和模板图像重叠度小于0.6的为负样本;
划分正负样本的重叠度阈值设置是根据检索时的滑动窗口移动步长来计算得到的;
进一步地,在本发明的一个实施例中,所述根据正负样本及其旋转后的正样本来进行后验概率分类器的训练过程这一步骤,其具体包括:
对生成的所有正样本每个都进行一定角度为步长的多次旋转,每次旋转后进行后验概率分类器的特征提取;
对生成的负样本不做处理直接进行后验概率分类器的特征提取;
对模板图像进行多种尺度的缩放,使用对应尺度的后验概率分类器进行特征的提取;
进一步地,在本发明的一个实施例中,所述根据检索过程中初始尺度大移动步长滑动窗口的检测结果,来决定是否进行多尺度滑动窗口遍历检索这一步骤,其具体包括:
在目标图像的检索过程中,使用定义过程中生成的初始尺度大移动步长滑动窗口进行遍历;
对遍历的滑动窗口计算方差,方差符合条件的通过方差分类器;
对通过方差分类器的滑动窗口使用后验概率分类器提取特征,查询特征对应的后验概率;
后验概率通过后验概率分类器的阈值的为通过后验概率分类器的窗口;
对所有通过方差分类器和后验概率分类器的滑动窗口进行聚类操作,聚类后统计每个聚类框的聚类数量,以最多窗口聚类的窗口为当前步骤的输出结果;
进一步地,在本发明的一个实施例中,所述根据第一次初始尺度大移动步长检索得到的结果,来判断是否进行第二次初始尺度小步长精确检索的这一步骤,其具体包括:
在第一次检索有结果输出的情况下,在目标图像上将第一次结果及结果窗口周边范围区域进行截取,截取的范围根据第一次滑动窗口的移动步长来决定,截取第一次检索输出结果上下左右各延伸移动步长长度的区间;
在截取的图像区间内生成初始尺度的逐个移动的滑动窗口;
使用新生成的滑动窗口在截取的图像区间进行遍历;
对所有遍历的滑动窗口进行后验概率分类器的特征提取,并计算特征对应的后验概率;
对通过后验概率分类器的窗口进行平均值计算,将在截取图像区间的相对坐标转换为基于目标图像的绝对坐标;
进一步地,在本发明的一个实施例中,所述根据第一次初始尺度大移动步长检索得到的结果,来判断是否进行多尺度大移动步长滑动窗口检索的这一步骤,其具体包括:
在第一次检索没有结果输出的情况下,判断目标图像中没有初始尺度的匹配目标,使用多尺度滑动窗口进行遍历;
每个尺度的滑动窗口遍历过程中,对每个窗口计算方差,筛选掉窗口方差不符合方差分类器标准的窗口,对通过方差分类器的窗口进行后验概率分类器的特征提取和后验概率的计算;
对于每个尺度的滑动窗口通过两个分类器的结果,对每个尺度通过两个分类器的窗口单独进行聚类,聚类数量最多的窗口作为对应尺度的代表输出窗口,分别统计所有尺度的代表输出窗口的聚类数量,选择聚类数量最多的窗口作为多尺度检测的结果。
第二方面,本发明实施例提出了一种基于局部方差和后验概率分类器的快速视觉定位系统,包括:
滑动窗口生成模块,生成定义时使用的小步长的初始尺度滑动窗口和检索使用的大步长的初始尺度滑动窗口和大步长的多尺度滑动窗口;
后验概率分类器准备模块,在模板图像区间范围内进行特征点的检索和随机点的生成,并且将坐标点分别存储为初始尺度的相对坐标和多尺度的相对坐标;
正负样本划分模块,使用滑动窗口生成模块生成的定义用滑动窗口,根据滑动窗口和模板图像的重叠度来划分正样本和负样本;
后验概率分类器训练模块,将正负样本划分模块划分的所有正样本都进行一定角度步长的多次旋转,每个样本的每次旋转都进行后验概率分类器的特征提取和训练,将模板图像进行多尺度的缩放后进行后验概率分类器的特征提取和训练,将负样本的一半滑动窗口作为训练集,使用后验概率分类器进行特征提取和训练。最后使用负样本的另一半滑动窗口作为测试集,使用训练后的后验概率分类器进行验证用于更新后验概率分类器的阈值;
初始尺度粗略检测模块,在目标图像上使用滑动窗口生成模块中的检索用初始尺度大移动步长滑动窗口进行遍历,对滑动窗口进行方差计算,只有方差符合方差分类器标准的滑动窗口才能进行后验概率分类器的特征提取,对提取的特征进行后验概率的计算,后验概率大于后验概率分类器阈值的滑动窗口进行窗口聚类,统计聚类后每个聚类窗口的聚类数量,选取聚类数量最多的聚类窗口为该模块的输出结果;
初始尺度精细检测模块,在初始尺度粗略检测模块得到结果的前提下,在目标图像将初始尺度粗略检测模块的结果及结果周边区域进行截取,在截取的目标图像区域生成逐个像素滑动的滑动窗口,使用后验概率分类器提取滑动窗口的特征和计算后验概率,将通过后验概率分类器的滑动窗口进行窗口聚类,聚类后将该结果从截取图像的相对坐标转换为基于目标图像的绝对坐标,即为该模块的输出结果;
多尺度粗略检测模块,在初始尺度粗略检测模块没有得到结果的前提下,单独使用每个尺度的滑动窗口在目标图像进行遍历,对遍历的窗口进行方差计算,对通过方差分类器的窗口进行后验概率分类器的特征提取和后验概率的计算,后验概率符合标准的每个尺度的滑动窗口进行聚类,每个尺度选择对应尺度聚类后聚类数量最多的窗口作为当前尺度的代表窗口,最后统计每个尺度代表窗口的聚类数量,选择聚类数量最多的窗口为多尺度粗略检测模块的输出结果。
第三方面,本发明实施例提供了一种基于局部方差和后验概率分类器的快速视觉定位装置,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行时,使得所述至少一个处理器实现上述的一种基于局部方差和后验概率分类器的快速视觉定位方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其中存储有处理器可执行的程序,所述处理器可执行的程序在由处理器执行时用于执行上述的一种基于局部方差和后验概率分类器的快速视觉定位方法。
本发明的优点和有益效果将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到:
本发明在定义过程和检索过程中使用了两种不同移动步长的滑动窗口,即为了降低检索过程中的计算量,也是为了避免检索过程的滑动窗口在经过后验概率分类器时因为移动步长过大而对窗口判断错误,本发明实例相较现有技术而言,一方面在定义部分考虑到了样本旋转的情况,而无需在检测过程中针对每个滑动窗口都进行旋转的匹配,减少了对系统算里的要求,提高了匹配效率,另一方面在定义部分也考虑到了多尺度的情况来生成多尺度的滑动窗口,而且由于在检索部分的多尺度滑动窗口是在初始尺度滑动窗口遍历后再进行,避免了目标对象没有尺度缩放的情况浪费过多的计算量。较模板匹配的精准度来说,使用的滑动窗口数量越多结果就可能越精确,但是检索耗时也会大大提升,因此使用了在第一次检索有结果的前提下进行第二次高精度的检索。这种方法进一步提高了匹配效率,同时也克服了现有技术匹配过程计算量过大、无效计算过大的缺点,提高了模板匹配的准确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请提供的一种基于局部方差和后验概率分类器的快速视觉定位方法的定义步骤流程图。
图2为本申请实施例中一种基于局部方差和后验概率分类器的快速视觉定位方法的检索步骤流程图。
图3为本申请实施例中一种基于局部方差和后验概率分类器的快速视觉定位系统的结构框图。
图4为本申请实施例中一种基于局部方差和后验概率分类器的快速视觉定位装置的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参照图1、图2,本发明实施例提供了一种基于局部方差和后验概率分类器的快速视觉定位方法,其定义部分具体包括以下步骤:
S101、根据模板图像和模板所在图像大小,构建定义用的初始尺度逐个像素平移的滑动窗口、检索用的初始尺度的移动步长为一定值的滑动窗口、检索用的多尺度的移动步长为一定值的滑动窗口。
具体地,在后续的匹配过程中,先使用大移动步长的初始尺度滑动窗口遍历检索,再根据第一次检测的结果判断是否进行小移动步长的初始尺度滑动窗口遍历检索和多尺度滑动窗口遍历检索。步骤S101包括以下步骤:
S1011、获取模板所在图像和模板图像位置;
S1012、对模板所在图像使用模板图像尺度的滑动窗口进行逐个像素的平移,将生成的滑动窗口存储起来用于生成样本;
S1013、对模板所在图像使用模板图像尺度的滑动窗口进行以模板图像最短边长度为步长的遍历,将生成的滑动窗口存储起来用于检索部分;
S1014、根据模板图像尺度大小,对模板图像尺度进行多次缩放,使用缩放后的模板图像尺度的滑动窗口进行以缩放后尺度最短边长度为步长的遍历,将生成的滑动窗口存储起来用于检索部分。
S102、在以模板图像中心为圆心、模板图像最短边为直径的圆范围内进行低标准的SIFT特征点检索和Harris角点检索作为后验概率分类器用的第一对特征点,同一范围区间生成随机点作为第二对随机点。
具体地,在后续后验概率分类器的训练和测试都需要有固定的两组坐标点对来获取坐标点灰度大小,其中一组是由特征点构成,代表了模板图像的关键信息,另一组由随机点构成,代表了模板图像的随机信息。步骤S102具体包括以下步骤:
S1021、利用SIFT特征点检测算法在模板图像上获取特征点的坐标,检测到的特征点不进行特征点描述子的构建,而且输出的特征点根据特征点所在的金字塔层数进行排序,排序后越前面的特征点表示的是高斯差分金字塔越顶端的也就是越粗糙的特征;
S1022、利用Harris角点检测算法在模板图像上获取角点的坐标,检测过程中对输出的特征点进行定量输出,Harris角点检测算法输出的特征点按照公式结果从大到小进行排序,排序后的特征点会优先输出角点再输出边缘点;
S1023、在模板图像的最大内接圆区间进行随时坐标点的生成;
本发明实施例中,后验概率分类器用于训练、测试和检测需要的坐标点点对数量为130对,即需要在后验概率分类器准备模块中准备130个特征点和130个随机点,且为了应对后续正样本旋转取样的步骤,坐标点的生成只在模板图像的最大内接圆进行。130个特征点优先使用SIFT特征点检测算法的结果,如果特征点数量不够再使用Harris角点检测算法的结果进行填充。
S103、计算模板图像的方差,设置方差分类器的阈值为模板图像方差的一定比例值。步骤S103具体如下:
S1031、计算模板所在图像的积分图和平方积分图;
S1032、通过积分图和平方积分图计算模板图像的方差;
S1033、模板图像的方差乘以一定比例作为方差分类器的阈值;
本发明实施例中,方差分类器在检测过程中起到一个对滑动窗口过滤筛选的作用,在初始尺度和多尺度的滑动窗口遍历都有进行使用。
S104、计算定义用的滑动窗口和模板图像的重叠度,并根据重叠度划分正负样本,对所有正样本进行一定角度步长的多次旋转后使用后验概率分类器取样,对模板图像缩放多次后也进行取样,具体步骤如下:
S1041、分别计算生成的定义用逐个像素平移的滑动窗口和模板图像所在窗口的重叠度;
S1042、重叠度大于0.82为正样本滑动窗口;
S1043、重叠度小于0.6为负样本滑动窗口;
本发明实施例中,划分正负样本滑动窗口的重叠度是经过科学计算得出的结果,是根据检索时使用的滑动窗口的移动步长决定,保证正样本覆盖的区域里中能包括任何起点开始平移的大移动步长的滑动窗口。
S1044、对划分出来的全部正样本滑动窗口进行一定角度步长的多次旋转后,每次旋转都进行后验概率分类器的特征取样;
S1045、对模板图像进行多尺度的缩放后,每次缩放后都采用相应尺度的后验概率分类器进行特征提取;
本发明实施例中,针对正样本的多角度取样处理,对所有正样本都进行120次旋转步长为3°的围绕正样本中心为旋转中心的旋转,每次旋转后都进行特征的提取。
S105、负样本遍历窗口中一半作为训练集不做处理使用后验概率分类器进行训练,另一半作为测试集使用训练后的后验概率分类器进行后验概率计算后修正分类器的阈值,这一步骤具体如下:
S1051、用划分出来的一半负样本滑动窗口作为训练集,不做处理使用后验概率分类器进行特征提取;
S1052、用划分出来的另一半负样本滑动窗口作为测试集,使用训练后的随机森林分类器进行后验概率的计算,用来修正后验概率分类器的后验概率阈值。
基于同一发明构思,本申请实施例还提供了一种基于局部方差和后验概率分类器的视觉定位装置,可以用于实现上述实施例中所描述的方法,如下面实施例所述。由于该基于局部方差和后验概率分类器的视觉定位装置解决问题的原理与基于局部方差和后验概率分类器的视觉定位方法相似,因此基于局部方差和后验概率分类器的视觉定位装置的实施可以参见基于局部方差和后验概率分类器的视觉定位方法的实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的系统较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
如图3所示,本发明实施例提供了一种基于局部方差和后验概率分类器的快速视觉定位系统,包括:
滑动窗口生成模块,用于根据模板所在图像大小和模板图像大小构建定义用的逐个像素平移的初始尺度滑动窗口、检索用的按一定像素数量平移的初始尺度滑动窗口、检索用的按一定像素数量平移的多尺度滑动窗口;
正负样本划分模块,用于计算定义用的滑动窗口和模板图像的重叠度,根据重叠度来划分正负样本,划分的重叠度阈值是基于检索用的滑动窗口移动步长来计算获得;
后验概率分类器准备模块,用于生成后续随机森林分类器的特征提取用的特征点对和随机点对;
后验概率分类器训练模块,用于将所有正样本进行一定角度步长的多次旋转,对旋转后的正样本图像使用后验概率分类器进行特征提取,将模板图像进行多尺度的缩放后使用对应尺度的后验概率分类器进行特征提取。将所有负样本不做处理划分为训练集和测试集,将训练集的负样本使用后验概率分类器进行特征提取,将测试集的负样本使用训练后的后验概率分类器进行后验概率计算后修正后验概率分类器的后验概率阈值。
初始尺度粗略检索模块,用于检测部分的第一次考虑目标图像不进行缩放情况的粗略检索,使用滑动窗口生成模块构建的大移动步长初始尺度滑动窗口来遍历,对遍历的滑动窗口进行方差分类器和后验概率分类器的分类,对分类结果进行窗口聚类;
初始尺度精准检索模块,用于在初始尺度粗略检索模块有结果输出的前提下,对第一次检索的结果进行周边范围区域的图像截取,对截取出来的图像进行逐个像素的滑动窗口遍历,对遍历的滑动窗口进行后验概率分类器的分类后进行聚类,从而获得矫正后的基于目标图像的目标所在坐标;
多尺度粗略检索模块,用于在初始尺度粗略检索模块没有结果输出的前提下,判断目标发生了尺度的缩放,分别使用不同尺度的滑动窗口进行遍历,对遍历的滑动窗口进行方差分类器和后验概率分类器的分类后,按照所在的尺度进行聚类,每个尺度选取聚类数量最多的聚类窗口作为尺度的代表窗口,统计每个尺度的代表窗口的聚类数量,选取聚类数量最多的作为多尺度粗略检索模块的输出结果。
上述方法实施例中的内容仅适用于本系统实施例中,本系统实施例所具体实现的功能于上述功能实施例系统,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
如图4所示,本发明实施例提供了一种基于局部方差和后验概率分类器的快速视觉定位装置,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当上述至少一个程序被上述至少一个处理器执行时,使得上述至少一个处理器实现上述的一种基于局部方差和后验概率分类器的快速视觉定位方法。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
本申请的实施例还提供能够实现上述实施例中的方法中全部步骤的一种电子设备的具体实施方式,所述电子设备具体包括如下内容:
处理器(processor)、存储器(memory)、通信接口(Communications Interface)和总线;
其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;
所述处理器用于调用所述存储器中的计算机程序,所述处理器执行所述计算机程序时实现上述实施例中的方法中的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:
S101、根据模板图像和模板所在图像大小,构建定义用的初始尺度逐个像素平移的滑动窗口、检索用的初始尺度的移动步长为一定值的滑动窗口、检索用的多尺度的移动步长为一定值的滑动窗口。
S102、在以模板图像中心为圆心、模板图像最短边为直径的圆范围内进行低标准的SIFT特征点检索和Harris角点检索作为后验概率分类器用的第一对特征点,同一范围区间生成随机点作为第二对随机点。
S103、计算模板图像的方差,设置方差分类器的阈值为模板图像方差的一定比例值。步骤S103具体如下:
S104、计算定义用的滑动窗口和模板图像的重叠度,并根据重叠度划分正负样本,对所有正样本进行一定角度步长的多次旋转后使用后验概率分类器取样,对模板图像缩放多次后也进行取样。
本申请的实施例还提供能够实现上述实施例中的方法中全部步骤的一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中的方法的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:
S101、根据模板图像和模板所在图像大小,构建定义用的初始尺度逐个像素平移的滑动窗口、检索用的初始尺度的移动步长为一定值的滑动窗口、检索用的多尺度的移动步长为一定值的滑动窗口。
S102、在以模板图像中心为圆心、模板图像最短边为直径的圆范围内进行低标准的SIFT特征点检索和Harris角点检索作为后验概率分类器用的第一对特征点,同一范围区间生成随机点作为第二对随机点。
S103、计算模板图像的方差,设置方差分类器的阈值为模板图像方差的一定比例值。步骤S103具体如下:
S104、计算定义用的滑动窗口和模板图像的重叠度,并根据重叠度划分正负样本,对所有正样本进行一定角度步长的多次旋转后使用后验概率分类器取样,对模板图像缩放多次后也进行取样。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于硬件+程序类实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。虽然本说明书实施例提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或终端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下,并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书实施例时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本说明书实施例的至少一个实施例或示例中。
在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。以上所述仅为本说明书实施例的实施例而已,并不用于限制本说明书实施例。对于本领域技术人员来说,本说明书实施例可以有各种更改和变化。凡在本说明书实施例的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书实施例的权利要求范围之内。

Claims (10)

1.一种基于局部方差和后验概率分类器的视觉定位方法,其特征在于,包括:
根据获取的模板图像和模板所在图像大小,构建多种滑动窗口;
根据所述模板图像的特征来获取多对特征点作为后验概率分类器的组点对;
通过所述模板图像的方差建立局部方差分类器并使用所述局部方差分类器对所述滑动窗口进行筛选;
通过滑动窗口和模板的重叠度对模板所在图像进行正负样本划分,并对正样本进行多种操作后使用后验概率分类器训练;
使用负样本来进行后验概率分类器的训练和阈值修正获得最终的后验概率分类器;
使用最终的后验概率分类器进行视觉定位。
2.根据权利要求1所述的基于局部方差和后验概率分类器的视觉定位方法,其特征在于,所述根据获取的模板图像和模板所在图像大小,构建多种滑动窗口,包括:
根据模板图像和模板所在图像大小,将定义用的初始尺度逐个像素平移构建滑动窗口;
将检索用的初始尺度的移动步长设为固定值构建滑动窗口;
将检索用的多尺度的移动步长设置为固定值构建滑动窗口。
3.根据权利要求1所述的基于局部方差和后验概率分类器的视觉定位方法,其特征在于,所述根据所述模板图像的特征来获取多对特征点作为后验概率分类器的组点对,包括:
在以模板图像的中心为圆心、模板图像最短边为直径的圆范围内进行特征点的检索获得特征点对;
所述特征点对作为后验概率分类器用的第一对特征点;
在同一范围区间生成随机点作为第二对特征点。
4.根据权利要求1所述的基于局部方差和后验概率分类器的视觉定位方法,其特征在于,所述通过所述模板图像的方差建立局部方差分类器,包括:
计算模板图像的方差;
设置方差分类器的阈值为模板图像的方差的一定比例值。
5.根据权利要求1所述的基于局部方差和后验概率分类器的视觉定位方法,其特征在于,所述通过滑动窗口和模板的重叠度对模板所在图像进行正负样本划分,包括:
计算定义用的滑动窗口和模板图像的重叠度,并根据重叠度划分正负样本;
对所有正样本进行一定角度步长的多次旋转后使用后验概率分类器取样;
对模板图像缩放多次后使用后验概率分类器进行取样。
6.根据权利要求1所述的基于局部方差和后验概率分类器的视觉定位方法,其特征在于,所述使用负样本来进行后验概率分类器的训练和阈值修正,包括:
使用负样本遍历一半的滑动窗口作为训练集不作处理使用后验概率分类器进行训练;
将剩余一半滑动窗口作为测试集使用训练后的后验概率分类器进行后验概率计算后修正后验概率分类器的阈值。
7.一种基于局部方差和后验概率分类器的视觉定位装置,其特征在于,包括:
滑动窗口构建单元,用于根据获取的模板图像和模板所在图像大小,构建多种滑动窗口;
组点对获取单元,用于根据所述模板图像的特征来获取多对特征点作为后验概率分类器的组点对;
筛选单元,用于通过所述模板图像的方差建立局部方差分类器并使用所述局部方差分类器对所述滑动窗口进行筛选;
正负样本划分单元,用于通过滑动窗口和模板的重叠度对模板所在图像进行正负样本划分,并对正样本进行多种操作后使用后验概率分类器训练;
训练单元,用于使用负样本来进行后验概率分类器的训练和阈值修正获得最终的后验概率分类器;
视觉定位单元,用于使用最终的后验概率分类器进行视觉定位。
8.根据权利要求7所述的基于局部方差和后验概率分类器的视觉定位装置,其特征在于,所述滑动窗口构建单元包括:
定义用滑动窗口模块,用于根据模板图像和模板所在图像大小,将定义用的初始尺度逐个像素平移构建滑动窗口;
检索用初始尺度滑动窗口模块,用于将检索用的初始尺度的移动步长设为固定值构建滑动窗口;
检索用多尺度滑动窗口模块,用于将检索用的多尺度的移动步长设置为固定值构建滑动窗口。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至6任一项所述基于局部方差和后验概率分类器的视觉定位方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6任一项所述基于局部方差和后验概率分类器的视觉定位方法的步骤。
CN202210435034.8A 2022-04-24 2022-04-24 基于局部方差和后验概率分类器的视觉定位方法及装置 Pending CN114708420A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210435034.8A CN114708420A (zh) 2022-04-24 2022-04-24 基于局部方差和后验概率分类器的视觉定位方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210435034.8A CN114708420A (zh) 2022-04-24 2022-04-24 基于局部方差和后验概率分类器的视觉定位方法及装置

Publications (1)

Publication Number Publication Date
CN114708420A true CN114708420A (zh) 2022-07-05

Family

ID=82174151

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210435034.8A Pending CN114708420A (zh) 2022-04-24 2022-04-24 基于局部方差和后验概率分类器的视觉定位方法及装置

Country Status (1)

Country Link
CN (1) CN114708420A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116150417A (zh) * 2023-04-19 2023-05-23 上海维智卓新信息科技有限公司 一种多尺度多融合的图像检索方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116150417A (zh) * 2023-04-19 2023-05-23 上海维智卓新信息科技有限公司 一种多尺度多融合的图像检索方法及装置
CN116150417B (zh) * 2023-04-19 2023-08-04 上海维智卓新信息科技有限公司 一种多尺度多融合的图像检索方法及装置

Similar Documents

Publication Publication Date Title
US10936911B2 (en) Logo detection
CN112561080B (zh) 样本筛选方法、样本筛选装置及终端设备
CN111881913A (zh) 图像识别方法及装置、存储介质和处理器
RU2668717C1 (ru) Генерация разметки изображений документов для обучающей выборки
KR101303124B1 (ko) 특징점 기술자에 의한 객체 추적장치 및 방법, 그리고 에러 특징점 제거장치 및 방법
CN107622489B (zh) 一种图像篡改检测方法及装置
AU2011212422B2 (en) Efficient scale-space extraction and description of interest points
CN111353491B (zh) 一种文字方向确定方法、装置、设备及存储介质
CN110348511A (zh) 一种图片翻拍检测方法、系统及电子设备
JP6997369B2 (ja) プログラム、測距方法、及び測距装置
CN109947273B (zh) 一种点读定位方法及装置
CN111445459A (zh) 一种基于深度孪生网络的图像缺陷检测方法及系统
CN107272899B (zh) 一种基于动态手势的vr交互方法、装置及电子设备
CN109815823B (zh) 数据处理方法及相关产品
US8989505B2 (en) Distance metric for image comparison
CN110570442A (zh) 一种复杂背景下轮廓检测方法、终端设备及存储介质
Zhou et al. Fast circle detection using spatial decomposition of Hough transform
CN111445386A (zh) 基于文本内容四点检测的图像校正方法
CN114708420A (zh) 基于局部方差和后验概率分类器的视觉定位方法及装置
WO2024051427A1 (zh) 硬币识别方法、系统及存储介质
CN109919214A (zh) 一种神经网络模型的训练方法及训练装置
CN110659631A (zh) 车牌识别方法和终端设备
CN109871779B (zh) 掌纹识别的方法及电子设备
CN111178200A (zh) 一种仪表盘指示灯的识别方法及计算设备
CN108536769B (zh) 图像分析方法、搜索方法及装置、计算机装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination