CN109993175A - 汽车及基于可变指数的目标追踪方法、装置 - Google Patents
汽车及基于可变指数的目标追踪方法、装置 Download PDFInfo
- Publication number
- CN109993175A CN109993175A CN201711475723.7A CN201711475723A CN109993175A CN 109993175 A CN109993175 A CN 109993175A CN 201711475723 A CN201711475723 A CN 201711475723A CN 109993175 A CN109993175 A CN 109993175A
- Authority
- CN
- China
- Prior art keywords
- dictionary
- variable index
- target
- image
- primary data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/513—Sparse representations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/08—Detecting or categorising vehicles
Abstract
本发明提出了一种汽车和基于可变指数的目标追踪方法、装置,其中,目标追踪方法包括以下步骤:对输入图像进行预处理;根据预处理后的图像构建初始数据字典;根据初始数据字典构建初始可变指数模型,并通过初始可变指数模型识别输入图像中的背景图像和目标;根据识别结果对初始数据字典进行更新。该目标追踪方法通过可变指数模型识别输入图像中的背景环境和目标,降低了目标追踪算法的时间复杂度,便于提高模型稀疏表示能力和重建性能。
Description
技术领域
本发明涉及汽车技术领域,尤其涉及一种基于可变指数的目标追踪方法、一种基于可变指数的目标追踪装置和一种汽车。
背景技术
在处理目标追踪问题时,相关技术中公开了一种基于局部稀疏表示的联合目标追踪方法及其系统,其中,联合目标追踪方法包括:初始化目标外观特征模板,追踪目标图像,通过读取视频下一帧图像,构造候选图像稀疏编码直方图,构造候选图像分类器值,并与联合目标追踪模板之间进行相似度比较,最后更新联合目标追踪模板。
另外,还公开了一种图像目标追踪方法和装置,其中,图像目标追踪方法包括:确定图像中目标区域的特征矢量;根据预先配置的物体检测分类器,对每个特征矢量进行分析,确定每个特征矢量的第一似然度值;并且,根据预先配置的物体追踪分类器,对每个特征矢量进行分析,确定每个特征矢量的第二似然度值;对于每个特征矢量,根据该特征矢量的第一似然度值和第二似然度值,确定该特征矢量的第三似然度值;根据目标区域中各个特征矢量的第三似然度值,对与图像相关联的待检测图像进行目标追踪。
然而,上述目标追踪方法均是通过实时更新机制来完成外观的自适应表示,更新过程中往往只针对目标外观学习,而忽略了背景信息,因此当目标和背景外观非常接近时,可能会造成追踪失败,这无疑增加了方案实施的复杂度。
另外,传统的追踪模型把目标追踪视作一个分类问题,使用的一维模型字典数据量大,训练算法的时间复杂度高,通过训练一个从图像背景中识别出所追踪目标的模型难以获得比较好的追踪效果。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种基于可变指数的目标追踪方法,以降低目标追踪算法的时间复杂度,提高目标追踪效率。
本发明的第二个目的在于提出一种非临时性计算机可读存储介质。
本发明的第三个目的在于提出一种基于可变指数的目标追踪装置。
本发明的第四个目的在于提出一种汽车。
为达上述目的,本发明第一方面实施例提出了一种基于可变指数的目标追踪方法,包括以下步骤:对输入图像进行预处理;根据预处理后的图像构建初始数据字典;根据所述初始数据字典构建初始可变指数模型,并通过所述初始可变指数模型识别所述输入图像中的背景图像和目标;根据识别结果对所述初始数据字典进行更新。
根据本发明实施例的基于可变指数的目标追踪方法,通过构建可变指数模型识别输入图像中的背景环境和目标,降低了目标追踪算法的时间复杂度,便于提高模型稀疏表示能力和重建性能。
另外,根据本发明上述实施例的基于可变指数的目标追踪装置还可以具有如下附加的技术特征:
根据本发明的一个实施例,所述对输入图像进行预处理包括:对所述输入图像进行灰度化处理,以通过调整图像的灰度动态范围突显图像灰度对比度的显著性;对灰度化处理后的图像进行形态学顶帽操作,以从局部空间分布和灰度差异体现潜在显著物与周围背景的差异。
根据本发明的一个实施例,所述根据预处理后的图像构建初始数据字典包括:获取所述预处理后的图像所对应的图像信号样本集;利用随机观测矩阵对所述图像信号样本集进行处理以构建第一字典,并根据所述第一字典和所述图像信号样本集构建第二字典;根据所述第一字典和所述第二字典构建所述初始数据字典。
根据本发明的一个实施例,所述根据所述初始数据字典构建初始可变指数模型,并通过所述初始可变指数模型识别所述输入图像中的背景图像和目标,包括:在所述初始数据字典中的图像信号基元中设置第一参考单元和第二参考单元;根据如下公式计算所述可变指数模型的第一参数:
其中,VI为所述第一参数,Xt为第一参考单元或第二参考单元,n为参考单元Xt的个数,为参考单元Xt的算数平均值;
根据如下公式计算所述可变指数模型的第二参数:
其中,MR为所述第二参数,为所述第一参考单元的算数平均值,为所述第二参考单元的算数平均值;
根据所述第一参数、所述第二参数和预设参数KVI判断检测单元在所述输入图像中的所处位置,其中,判断条件如下:
如果满足VI-MR≤KVI,则判断检测单元当前处于背景环境,
如果满足VI-MR>KVI,则判断检测单元当前处于目标环境。
根据本发明的一个实施例,所述根据识别结果对所述初始数据字典进行更新,包括:通过如下公式对所述第一字典和第二字典进行更新:
其中,X为图像信号样本集,D为所述第一字典或所述第二字典,t为稀疏矩阵的稀疏约束度,Γ为稀疏稀疏矩阵,qj为所述基元,k为非零元素的个数,||·||F为Frobenius范数;
根据所述识别结果计算目标示例索引,并根据所述目标示例索引、更新后的第一字典和第二字典对误差信号进行奇异值分解,以对所述初始数据字典中的基元进行更新;使用类内差异性稀疏表达对更新后的基元进行稀疏重建,以得到更新后的数据字典:根据更新后的数据字典更新所述初始可变指数模型。
为达上述目的,本发明第二方面实施例提出了一种,包括:一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现上述实施例的基于可变指数的目标追踪方法。
为达上述目的,本发明第三方面实施例提出了一种基于可变指数的目标追踪装置,包括:预处理模块,用于对输入图像进行预处理;第一构建模块,用于根据预处理后的图像构建初始数据字典;第二构建模块,用于根据所述初始数据字典构建初始可变指数模型;识别模块,用于通过所述初始可变指数模型识别所述输入图像中的背景图像和目标;更新模块,用于根据识别结果对所述初始数据字典进行更新。
根据本发明实施例的基于可变指数的目标追踪装置,通过可变指数模型识别输入图像中的背景环境和目标,降低了目标追踪算法的时间复杂度,便于提高模型稀疏表示能力和重建性能。
另外,根据本发明上述实施例的基于可变指数的目标追踪装置还可以具有如下附加的技术特征:
根据本发明的一个实施例,所述预处理模块具体用于:对所述输入图像进行灰度化处理,以通过调整图像的灰度动态范围突显图像灰度对比度的显著性;对灰度化处理后的图像进行形态学顶帽操作,以从局部空间分布和灰度差异体现潜在显著物与周围背景的差异。
根据本发明的一个实施例,所述第一构建模块具体用于:获取所述预处理后的图像所对应的图像信号样本集;利用随机观测矩阵对所述图像信号样本集进行处理以构建第一字典,并根据所述第一字典和所述图像信号样本集构建第二字典;根据所述第一字典和所述第二字典构建所述初始数据字典。
根据本发明的一个实施例,所述第二构建模块具体用于:在所述初始数据字典中的图像信号基元中设置第一参考单元和第二参考单元;根据如下公式计算所述可变指数模型的第一参数:
其中,VI为所述第一参数,Xt为第一参考单元或第二参考单元,n为参考单元Xt的个数,为参考单元Xt的算数平均值;
根据如下公式计算所述可变指数模型的第二参数:
其中,MR为所述第二参数,为所述第一参考单元的算数平均值,为所述第二参考单元的算数平均值。
根据本发明的一个实施例,所述识别模块具体用于:根据所述第一参数、所述第二参数和预设参数KVI判断检测单元在所述输入图像中的所处位置,判断条件如下:
如果满足VI-MR≤KVI,则判断检测单元当前处于背景环境,
如果满足VI-MR>KVI,则判断检测单元当前处于目标环境。
根据本发明的一个实施例,所述更新模块具体用于:通过如下公式对所述第一字典和第二字典进行更新:
其中,X为图像信号样本集,D为所述第一字典或所述第二字典,t为稀疏矩阵的稀疏约束度,Γ为稀疏稀疏矩阵,qj为所述基元,k为非零元素的个数,||·||F为Frobenius范数;
根据所述识别结果计算目标示例索引,并根据所述目标示例索引、更新后的第一字典和第二字典对误差信号进行奇异值分解,以对所述初始数据字典中的基元进行更新;使用类内差异性稀疏表达对更新后的基元进行稀疏重建,以得到更新后的数据字典。
为实现上述目的,本发明第四方面实施例提出了一种汽车,其包括上述实施例的基于可变指数的目标追踪装置。
本发明实施例的汽车,采用上述基于可变指数的目标追踪装置,通过可变指数模型识别输入图像中的背景环境和目标,降低了目标追踪算法的时间复杂度,便于提高模型稀疏表示能力和重建性能。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本发明实施例的基于可变指数的目标追踪方法的流程图;
图2为根据本发明一个实施例的图像预处理方法的示意图;
图3为根据本发明实施例的基于可变指数的目标追踪装置的结构框图;
图4为根据本发明实施例的汽车的结构框图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的汽车及基于可变指数的目标追踪方法和装置。
图1为本发明实施例的基于可变指数的目标追踪方法的流程图。如图1所示,该基于可变指数的目标追踪方法包括以下步骤:
S101,对输入图像进行预处理。
具体地,对输入图像进行灰度化处理,以通过调整图像的灰度动态范围突显图像灰度对比度的显著性;进而对灰度化处理后的图像进行形态学顶帽操作,以从局部空间分布和灰度差异体现潜在显著物与周围背景的差异。
在该实施例中,当输入图像为RGB图像时,可通过如下公式(1)对输入图像进行灰度化处理:
g(x,y)=0.2989*R(x,y)+0.5870*G(x,y)+0.1140*B(x,y) (1)
其中,g(x,y)为256级的灰度图像,R、G、B分别为彩色图像的红、绿、蓝三个分量。
如图2所示,通过上式(1)将输入的RGB图像中的亮度因素分离,将色度分解为色调和饱和度,并用角向量表示色调,即言,将三维彩色空间映射到一维灰度空间,从而得到灰度图像,以突显图像灰度对比度的显著性。
进一步地,对灰度图像f进行形态学顶帽操作。具体地,先对灰度图像f进行开运算,即先腐蚀后膨胀,以移除结构元素s的显著亮特征;再用灰度图像f与开运算后的图像做减法,以实现在暗背景中得到显著的亮区域,其运算公式如下式(2):
需要说明的是,上述形态学顶帽操作是基于图像局部结构特征的非线性空域滤波,以从局部空间分布和灰度差异两方面体现潜在显著物与周围背景的差异。
S102,根据预处理后的图像构建初始数据字典。
具体地,获取预处理后的图像所对应的图像信号样本集;利用随机观测矩阵对图像信号样本集进行处理以构建第一字典,并根据第一字典和图像信号样本集构建第二字典;根据第一字典和第二字典构建初始数据字典。
其中,图像信号样本集X∈RN为包含输入图像中待追踪目标(如行人、车辆等)的原始图像数据,其中,N为X的维数。
可选地,第一字典为水平字典,第二字典为垂直字典。
具体而言,用一个随机观测矩阵(如高斯观测矩阵)对X中的每个高维图像信号样本分别从第一方向(如水平方向)和第二方向(如垂直方向)进行降维,得到对应的低维信号,并将得到的低维信号作为相应的字典基元,以构建水平字典和垂直字典。
即言,利用数据字典为输入图像f中每个图像块的一维稀疏字典的特性,通过迭代得到第一个维度的字典,即第一字典D1;进而利用第一字典和图像块乘积的转置图像块构造新的样本集,通过迭代得到第二个维度的字典,即第二字典D2。其中,D1和D2均可通过下式(3)表示:
D=[q1,q2,…,qn]∈Rm×n (3)
其中,D为第一字典或第二字典,qi∈Rn(i=1,2,…,n)为图像信号基元,n为字典中图像信号基元的个数,m为图像信号样本的维数。
进一步地,利用水平字典D1和垂直字典D2即可构造出一个更加稀疏的初始数据字典。
由此,通过二维字典构造得到的初始数据字典充分利用了图像的空间特性,提高了训练算法的效率,保留了图像的有效信息,提取信息的质量得到了明显改善,去除噪声的效果有一定的增益。
S103,根据初始数据字典构建初始可变指数模型,并通过初始可变指数模型识别输入图像中的背景图像和目标。
具体地,在初始数据字典中的每个图像信号基元中设置第一参考单元和第二参考单元,根据如下公式(4)计算可变指数模型的第一参数:
其中,VI为第一参数,为图像信号样本的参考单元均值,为图像信号样本的参考单元方差,n为图像信号样本集X中各参考单元的个数,为图像信号样本集X中各参考单元的算数平均值。
进一步地,根据如下公式(5)计算可变指数模型的第二参数:
其中,MR为可变指数模型的第二参数,为第一参考单元的算数平均值,为第二参考单元的算数平均值。
具体而言,在初始数据字典中的图像信号基元中设置前参考单元A(即第一参考单元)和后参考单元B(即第二参考单元),每个参考单元的个数均为n,通过上式(4)计算得到每个参考单元的可变指数VI(即第一参数),并通过上式(5)计算可变指数模型的第二参数MR,由此,构建得到可变指数模型。
在对待追踪目标进行检测时,检测单元与前参考单元A和后参考单元B之间的位置关系如表1所示:
表1
前参考单元A | 检测单元 | 后参考单元B |
结合表1通过可变指数模型对数据字典中的每个索引元素进行重新判定,以对数据字典进行更新。假设数据字典元素的总数为N,则依次对索引为0到(N-1)的元素进行判定,每个被判定的元素即为当前元素。如表1所示,前参考单元中的元素是数据字典中当前元素的前一元素,后参考单元中的元素是数据字典中当前元素的后一元素,检测单元中包含数据字典中的当前元素。其中,索引0的前参考单元是索引(N-1),索引(N-1)的后参考单元是索引0,以此构成一个封闭的循环,保证识别判断的完整性。
更进一步地,根据第一参数、第二参数和预设参数KVI判断检测单元在输入图像中的所处位置,其中,判断条件可以如下:
如果满足VI-MR≤KVI,则判断检测单元当前处于背景环境,
如果满足VI-MR>KVI,则判断检测单元当前处于目标环境。
其中,参数KVI为常数,其取值可根据需要进行设定。
在图像信号基元由上述判断条件判别后,可得出该基元是否为目标环境的结论,进而目标环境的图像基元所组成的矩阵即作为有效数据纳入数据字典的更新中来,而判定为背景环境即干扰目标的图像数据则不纳入数据字典更新中来。
S104,根据识别结果对初始数据字典进行更新。
其中,识别结果即为目标示例索引的位置。可以理解,在步骤S103中识别到目标示例索引所处的位置后,会对识别为目标环境的图像基元进行保存,以作为数据字典的更新依据。
具体地,通过如下公式(6)对第一字典和第二字典进行更新:
其中,X为图像信号样本集,D为第一字典或第二字典,t为稀疏矩阵的稀疏约束度,Γ为稀疏稀疏矩阵,qj为基元,k为非零元素的个数,||·||F为Frobenius范数。
进一步地,根据识别结果计算目标示例索引,并根据目标示例索引、更新后的第一字典和第二字典对误差信号进行奇异值分解,以对初始数据字典中的基元进行更新。使用类内差异性稀疏表达对更新后的基元进行稀疏重建,以得到更新后的数据字典,进而可根据更新后的数据字典更新初始可变指数模型。
具体而言,计算目标示例索引,即图像信号基元在原始输入图像对应的索引值,并建立索引集合wk,wk={i|1≤i≤I,ak(i)≠0},即仅保留ak中的非零值(步骤S103中判断为目标环境的图像基元所组成的矩阵)。进而计算误差矩阵并利用找出误差矩阵中对应wk的列向量,Ωk在(wk(i),i)处设为1,其他处均为0;对进行矩阵的奇异值分解,更新后的基元ak=V(:,1)Δ(1,1)。并通过上式(6)对水平字典(即第一字典)和垂直字典(即第二字典)进行更新,利用最大奇异值重新获取数据字典基元。
进一步地,使用类内差异性稀疏表达对重新获取的数据字典基元进行稀疏重建。具体地,在构建字典时,计算单行字典的均值,然后求得与单行字典一一对应索引位置的平均值差,根据平均值之差依次构建单行字典,直到获得整个字典。
更进一步地,通过实现稀疏重建和字典更新的两阶段迭代。具体地,在迭代过程应持续直到满足既定的迭代终止条件为止,根据迭代次数或者误差阈值来控制字典训练结束条件,训练得到的水平字典和垂直字典,即更新后的数据字典,进而可根据更新后的数据字典构造可变指数模型,即完成对可变指数模型的更新。
根据本发明实施例的基于可变指数的目标追踪方法,能充分应用追踪图像的空间相关性和模型的稀疏表示能力,提高了训练算法的效率,保留了图像的有效信息,提取信息的质量得到了明显改善,去除噪声的效果有一定的增益,通过构建可变指数模型识别图像信号基元是背景环境或是目标环境,降低了追踪算法的时间复杂度,提高了模型稀疏表示能力和重建性能,使用类内差异性稀疏表达,模板子空间重构稀疏性,实现对目标逼近,进而实现目标追踪,可以很好的处理各种干扰,包括障碍物遮挡,光线散射等。
进一步地,本发明一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现上述实施例的基于可变指数的目标追踪方法。
根据本发明实施例的非临时性计算机可读存储介质,通过执行其上存储的与上述基于可变指数的目标追踪方法对应的程序,能充分应用追踪图像的空间相关性和模型的稀疏表示能力,提高了训练算法的效率,保留了图像的有效信息,提取信息的质量得到了明显改善,去除噪声的效果有一定的增益,通过构建可变指数模型识别图像信号基元是背景环境或是目标环境,降低了追踪算法的时间复杂度,提高了模型稀疏表示能力和重建性能,使用类内差异性稀疏表达,模板子空间重构稀疏性,实现对目标逼近,进而实现目标追踪,可以很好的处理各种干扰,包括障碍物遮挡,光线散射等。
图3为根据本发明实施例的基于可变指数的目标追踪装置的结构框图。如图3所示,该基于可变指数的目标追踪装置100包括:预处理模块10、第一构建模块20、第二构建模块30、识别模块40和更新模块50。
其中,预处理模块10用于对输入图像进行预处理。
具体地,预处理模块10用于对输入图像进行灰度化处理,以通过调整图像的灰度动态范围突显图像灰度对比度的显著性,进而对灰度化处理后的图像进行形态学顶帽操作,以从局部空间分布和灰度差异体现潜在显著物与周围背景的差异。
第一构建模块20用于根据预处理后的图像构建初始数据字典。
具体地,第一构建模块20获取预处理后的图像所对应的图像信号样本集;利用随机观测矩阵对图像信号样本集进行处理以构建第一字典,并根据第一字典和图像信号样本集构建第二字典;根据第一字典和第二字典构建初始数据字典。
第二构建模块30用于根据初始数据字典构建初始可变指数模型。
具体地,第二构建模块30在初始数据字典中的图像信号基元中设置第一参考单元和第二参考单元,并根据如下公式(4)计算可变指数模型的第一参数:
其中,VI为第一参数,为图像信号样本的参考单元均值,为图像信号样本的参考单元方差,n为图像信号样本集X中各参考单元的个数,为图像信号样本集X中各参考单元的算数平均值。
进一步地,根据如下公式(5)计算可变指数模型的第二参数:
其中,MR为第二参数,为第一参考单元的算数平均值,为第二参考单元的算数平均值。
识别模块40用于通过初始可变指数模型识别输入图像中的背景图像和目标。
具体地,识别模块40根据第一参数、第二参数和预设参数KVI判断检测单元在输入图像中的所处位置,判断条件如下:
如果满足VI-MR≤KVI,则判断检测单元当前处于背景环境,
如果满足VI-MR>KVI,则判断检测单元当前处于目标环境。
更新模块50用于根据识别结果对初始数据字典进行更新。
具体地,更新模块50通过如下公式(6)对第一字典和第二字典进行更新:
其中,X为图像信号样本集,D为第一字典或第二字典,t为稀疏矩阵的稀疏约束度,Γ为稀疏稀疏矩阵,qj为基元,k为非零元素的个数,||·||F为Frobenius范数。
进一步地,根据识别结果计算目标示例索引,并根据目标示例索引、更新后的第一字典和第二字典对误差信号进行奇异值分解,以对初始数据字典中的基元进行更新。使用类内差异性稀疏表达对更新后的基元进行稀疏重建,以得到更新后的数据字典,根据更新后的数据字典即可更新初始可变指数模型。
需要说明的是,本发明实施例的基于可变指数的目标追踪装置的其它具体实施方式可参见本发明上述实施例的基于可变指数的目标追踪方法的具体实施方式。
根据本发明实施例的基于可变指数的目标追踪装置,能充分应用追踪图像的空间相关性和模型的稀疏表示能力,提高了训练算法的效率,保留了图像的有效信息,提取信息的质量得到了明显改善,去除噪声的效果有一定的增益,通过构建可变指数模型识别图像信号基元是背景环境或是目标环境,降低了追踪算法的时间复杂度,提高了模型稀疏表示能力和重建性能,使用类内差异性稀疏表达,模板子空间重构稀疏性,实现对目标逼近,进而实现目标追踪,可以很好的处理各种干扰,包括障碍物遮挡,光线散射等。
进一步地,本发明提出了一种汽车。
图4为根据本发明实施例的汽车的结构框图。如图4所示,该汽车1000包括上述实施例的基于可变指数的目标追踪装置100。
根据本发明实施例的汽车,采用上述实施例的基于可变指数的目标追踪装置,能充分应用追踪图像的空间相关性和模型的稀疏表示能力,提高了训练算法的效率,保留了图像的有效信息,提取信息的质量得到了明显改善,去除噪声的效果有一定的增益,通过构建可变指数模型识别图像信号基元是背景环境或是目标环境,降低了追踪算法的时间复杂度,提高了模型稀疏表示能力和重建性能,使用类内差异性稀疏表达,模板子空间重构稀疏性,实现对目标逼近,进而实现目标追踪,可以很好的处理各种干扰,包括障碍物遮挡,光线散射等。
另外,本发明实施例的汽车的其它构成及其作用对本领域的技术人员而言是已知的,为减少冗余,此处不做赘述。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (13)
1.一种基于可变指数的目标追踪方法,其特征在于,包括以下步骤:
对输入图像进行预处理;
根据预处理后的图像构建初始数据字典;
根据所述初始数据字典构建初始可变指数模型,并通过所述初始可变指数模型识别所述输入图像中的背景图像和目标;
根据识别结果对所述初始数据字典进行更新。
2.如权利要求1所述的基于可变指数的目标追踪方法,其特征在于,所述对输入图像进行预处理包括:
对所述输入图像进行灰度化处理,以通过调整图像的灰度动态范围突显图像灰度对比度的显著性;
对灰度化处理后的图像进行形态学顶帽操作,以从局部空间分布和灰度差异体现潜在显著物与周围背景的差异。
3.如权利要求1所述的基于可变指数的目标追踪方法,其特征在于,所述根据预处理后的图像构建初始数据字典包括:
获取所述预处理后的图像所对应的图像信号样本集;
利用随机观测矩阵对所述图像信号样本集进行处理以构建第一字典,并根据所述第一字典和所述图像信号样本集构建第二字典;
根据所述第一字典和所述第二字典构建所述初始数据字典。
4.如权利要求3所述的基于可变指数的目标追踪方法,其特征在于,所述根据所述初始数据字典构建初始可变指数模型,并通过所述初始可变指数模型识别所述输入图像中的背景图像和目标,包括:
在所述初始数据字典中的图像信号基元中设置第一参考单元和第二参考单元;
根据如下公式计算所述可变指数模型的第一参数:
其中,VI为所述第一参数,Xt为第一参考单元或第二参考单元,n为参考单元Xt的个数,为参考单元Xt的算数平均值;
根据如下公式计算所述可变指数模型的第二参数:
其中,MR为所述第二参数,为所述第一参考单元的算数平均值,为所述第二参考单元的算数平均值;
根据所述第一参数、所述第二参数和预设参数KVI判断检测单元在所述输入图像中的所处位置,其中,判断条件如下:
如果满足VI-MR≤KVI,则判断检测单元当前处于背景环境,
如果满足VI-MR>KVI,则判断检测单元当前处于目标环境。
5.如权利要求4所述的基于可变指数的目标追踪方法,其特征在于,所述根据识别结果对所述初始数据字典进行更新,包括:
通过如下公式对所述第一字典和所述第二字典进行更新:
其中,X为图像信号样本集,D为所述第一字典或所述第二字典,t为稀疏矩阵的稀疏约束度,Γ为稀疏稀疏矩阵,qj为所述基元,k为非零元素的个数,||·||F为Frobenius范数;
根据所述识别结果计算目标示例索引,并根据所述目标示例索引、更新后的第一字典和第二字典对误差信号进行奇异值分解,以对所述初始数据字典中的基元进行更新;
使用类内差异性稀疏表达对更新后的基元进行稀疏重建,以得到更新后的数据字典。
6.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一项所述的基于可变指数的目标追踪方法。
7.一种基于可变指数的目标追踪装置,其特征在于,包括:
预处理模块,用于对输入图像进行预处理;
第一构建模块,用于根据预处理后的图像构建初始数据字典;
第二构建模块,用于根据所述初始数据字典构建初始可变指数模型;
识别模块,用于通过所述初始可变指数模型识别所述输入图像中的背景图像和目标;
更新模块,用于根据识别结果对所述初始数据字典进行更新。
8.如权利要求7所述的基于可变指数的目标追踪装置,其特征在于,所述预处理模块具体用于:
对所述输入图像进行灰度化处理,以通过调整图像的灰度动态范围突显图像灰度对比度的显著性;
对灰度化处理后的图像进行形态学顶帽操作,以从局部空间分布和灰度差异体现潜在显著物与周围背景的差异。
9.如权利要求7所述的基于可变指数的目标追踪装置,其特征在于,所述第一构建模块具体用于:
获取所述预处理后的图像所对应的图像信号样本集;
利用随机观测矩阵对所述图像信号样本集进行处理以构建第一字典,并根据所述第一字典和所述图像信号样本集构建第二字典;
根据所述第一字典和所述第二字典构建所述初始数据字典。
10.如权利要求8所述的基于可变指数的目标追踪装置,其特征在于,所述第二构建模块具体用于:
在所述初始数据字典中的图像信号基元中设置第一参考单元和第二参考单元;
根据如下公式计算所述可变指数模型的第一参数:
其中,VI为所述第一参数,Xt为第一参考单元或第二参考单元,n为参考单元Xt的个数,为参考单元Xt的算数平均值;
根据如下公式计算所述可变指数模型的第二参数:
其中,MR为所述第二参数,为所述第一参考单元的算数平均值,为所述第二参考单元的算数平均值。
11.如权利要求10所述的基于可变指数的目标追踪装置,其特征在于,所述识别模块具体用于:
根据所述第一参数、所述第二参数和预设参数KVI判断检测单元在所述输入图像中的所处位置,其中,判断条件如下:
如果满足VI-MR≤KVI,则判断检测单元当前处于背景环境,
如果满足VI-MR>KVI,则判断检测单元当前处于目标环境。
12.如权利要求11所述的基于可变指数的目标追踪装置,其特征在于,所述更新模块具体用于:
通过如下公式对所述第一字典和所述第二字典进行更新:
其中,X为图像信号样本集,D为所述第一字典或所述第二字典,t为稀疏矩阵的稀疏约束度,Γ为稀疏稀疏矩阵,qj为所述基元,k为非零元素的个数,||·||F为Frobenius范数;
根据所述识别结果计算目标示例索引,并根据所述目标示例索引、更新后的第一字典和第二字典对误差信号进行奇异值分解,以对所述初始数据字典中的基元进行更新;
使用类内差异性稀疏表达对更新后的基元进行稀疏重建,以得到更新后的数据字典。
13.一种汽车,其特征在于,包括如权利要求7-12中任一项所述的基于可变指数的目标追踪装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711475723.7A CN109993175B (zh) | 2017-12-29 | 2017-12-29 | 汽车及基于可变指数的目标追踪方法、装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711475723.7A CN109993175B (zh) | 2017-12-29 | 2017-12-29 | 汽车及基于可变指数的目标追踪方法、装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109993175A true CN109993175A (zh) | 2019-07-09 |
CN109993175B CN109993175B (zh) | 2021-12-07 |
Family
ID=67109616
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711475723.7A Active CN109993175B (zh) | 2017-12-29 | 2017-12-29 | 汽车及基于可变指数的目标追踪方法、装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109993175B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116091748A (zh) * | 2023-04-10 | 2023-05-09 | 环球数科集团有限公司 | 一种基于aigc的图像识别系统及装置 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004212187A (ja) * | 2002-12-27 | 2004-07-29 | Mitsubishi Electric Corp | 画像レーダ装置 |
US20090304230A1 (en) * | 2008-06-04 | 2009-12-10 | Lockheed Martin Corporation | Detecting and tracking targets in images based on estimated target geometry |
CN103098017A (zh) * | 2010-05-28 | 2013-05-08 | 乔治·马森博格 | 可变指数求平均检测器和动态范围控制器 |
US8538636B2 (en) * | 1995-06-07 | 2013-09-17 | American Vehicular Sciences, LLC | System and method for controlling vehicle headlights |
CN103379266A (zh) * | 2013-07-05 | 2013-10-30 | 武汉烽火众智数字技术有限责任公司 | 一种具有视频语义分析功能的高清网络摄像机 |
CN103471598A (zh) * | 2009-01-07 | 2013-12-25 | 宏达国际电子股份有限公司 | 移动目标的追踪方法及追踪移动目标的移动装置 |
CN103544483A (zh) * | 2013-10-25 | 2014-01-29 | 合肥工业大学 | 一种基于局部稀疏表示的联合目标追踪方法及其系统 |
US20140324864A1 (en) * | 2013-04-12 | 2014-10-30 | Objectvideo, Inc. | Graph matching by sub-graph grouping and indexing |
US9213904B1 (en) * | 2013-03-15 | 2015-12-15 | PureTech Systems Inc. | Autonomous lock-on target tracking with geospatial-aware PTZ cameras |
CN106792505A (zh) * | 2016-11-18 | 2017-05-31 | 清华大学 | 一种目标追踪系统和方法 |
-
2017
- 2017-12-29 CN CN201711475723.7A patent/CN109993175B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8538636B2 (en) * | 1995-06-07 | 2013-09-17 | American Vehicular Sciences, LLC | System and method for controlling vehicle headlights |
JP2004212187A (ja) * | 2002-12-27 | 2004-07-29 | Mitsubishi Electric Corp | 画像レーダ装置 |
US20090304230A1 (en) * | 2008-06-04 | 2009-12-10 | Lockheed Martin Corporation | Detecting and tracking targets in images based on estimated target geometry |
CN103471598A (zh) * | 2009-01-07 | 2013-12-25 | 宏达国际电子股份有限公司 | 移动目标的追踪方法及追踪移动目标的移动装置 |
CN103098017A (zh) * | 2010-05-28 | 2013-05-08 | 乔治·马森博格 | 可变指数求平均检测器和动态范围控制器 |
US9213904B1 (en) * | 2013-03-15 | 2015-12-15 | PureTech Systems Inc. | Autonomous lock-on target tracking with geospatial-aware PTZ cameras |
US20140324864A1 (en) * | 2013-04-12 | 2014-10-30 | Objectvideo, Inc. | Graph matching by sub-graph grouping and indexing |
CN103379266A (zh) * | 2013-07-05 | 2013-10-30 | 武汉烽火众智数字技术有限责任公司 | 一种具有视频语义分析功能的高清网络摄像机 |
CN103544483A (zh) * | 2013-10-25 | 2014-01-29 | 合肥工业大学 | 一种基于局部稀疏表示的联合目标追踪方法及其系统 |
CN106792505A (zh) * | 2016-11-18 | 2017-05-31 | 清华大学 | 一种目标追踪系统和方法 |
Non-Patent Citations (3)
Title |
---|
SHUO TANG等: "An Online LC-KSVD based Dictionary Learningfor Multi-Target Tracking", 《2016 INTERNATIONAL CONFERENCE ON INFORMATION SYSTEM AND ARTIFICIAL INTELLIGENCE》 * |
苏巧平等: "基于稀疏表达的多示例学习目标追踪算法", 《计算机工程》 * |
谢成军: "图像稀疏表示模型在可视化追踪中的应用研究", 《中国博士学位论文全文数据库(信息科技辑)》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116091748A (zh) * | 2023-04-10 | 2023-05-09 | 环球数科集团有限公司 | 一种基于aigc的图像识别系统及装置 |
CN116091748B (zh) * | 2023-04-10 | 2023-06-16 | 环球数科集团有限公司 | 一种基于aigc的图像识别系统及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN109993175B (zh) | 2021-12-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang et al. | A fusion algorithm for infrared and visible images based on saliency analysis and non-subsampled Shearlet transform | |
Huang et al. | Epithelium-stroma classification via convolutional neural networks and unsupervised domain adaptation in histopathological images | |
CN110728330A (zh) | 基于人工智能的对象识别方法、装置、设备及存储介质 | |
Ren et al. | Cue integration for figure/ground labeling | |
Venugopal | Automatic semantic segmentation with DeepLab dilated learning network for change detection in remote sensing images | |
CN108154519A (zh) | 眼底图像中血管的分割方法、装置及存储介质 | |
Wen et al. | Gcsba-net: Gabor-based and cascade squeeze bi-attention network for gland segmentation | |
Chen et al. | SEMEDA: Enhancing segmentation precision with semantic edge aware loss | |
CN105303561A (zh) | 一种图像预处理的灰度空间划分方法 | |
Liu et al. | Coconet: Coupled contrastive learning network with multi-level feature ensemble for multi-modality image fusion | |
Liu et al. | Robust spiking cortical model and total-variational decomposition for multimodal medical image fusion | |
CN105225238A (zh) | 一种基于均值滤波的图像预处理的灰度空间划分方法 | |
CN106056627B (zh) | 一种基于局部鉴别性稀疏表示的鲁棒目标跟踪方法 | |
Dai et al. | Feature transfer method for infrared and visible image fusion via fuzzy lifting scheme | |
Zhan et al. | Salient superpixel visual tracking with graph model and iterative segmentation | |
Shao et al. | Multi-scale generative adversarial inpainting network based on cross-layer attention transfer mechanism | |
Gui et al. | Adaptive single image dehazing method based on support vector machine | |
Frants et al. | QSAM-Net: rain streak removal by quaternion neural network with self-attention module | |
Senyukova et al. | Automated atlas-based segmentation of NISSL-stained mouse brain sections using supervised learning | |
CN109993175A (zh) | 汽车及基于可变指数的目标追踪方法、装置 | |
Liu et al. | Dual UNet low-light image enhancement network based on attention mechanism | |
CN117173075A (zh) | 医学图像检测方法及相关设备 | |
Tang et al. | Research of color image segmentation algorithm based on asymmetric kernel density estimation | |
Liu et al. | Multi-focus image fusion algorithm based on unsupervised deep learning | |
Lu et al. | Lip segmentation using localized active contour model with automatic initial contour |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |